GAM: General Affordance-Based Manipulation for Contact-Rich Object Disentangling Tasks
Neurocomputing, 2024 (vol. 578, 127386)
Yang X., Wu J., Lai Y.-K., Ji Z.
GAM 学习在接触密集型解缠任务中“何处操作、如何操作”,并将可供性预测与目标条件强化学习结合,以处理多样化物体构型。
关键贡献
- 无需任务特定工程即可进行通用可供性预测
- 可泛化到多样且未见过的解缠构型
- 融合可供性学习与目标条件强化学习
- 在仿真与真实接触密集场景中验证有效性
预印本 · 视频演示
Abstract Demonstrations and Adaptive Exploration for Efficient and Stable Multi-Step Sparse Reward Reinforcement Learning
International Conference on Automation and Computing (ICAC), 2022
Yang X., Ji Z., Wu J., Lai Y.-K.
A2E 通过抽象子任务演示与自适应探索机制,提升稀疏奖励长时序机器人学习的样本效率与训练稳定性。
关键贡献
- 将任务分解为有序子任务序列并引入抽象演示
- 针对已掌握与薄弱子任务采用自适应探索策略
- 在网格世界与真实机器人操作基准中验证效果
- 同时提升样本效率与训练稳定性
Efficient Hierarchical Reinforcement Learning for Mapless Navigation with Predictive Neighbouring Space Scoring
IEEE Transactions on Automation Science and Engineering (TASE), 2023
Gao Y., Wu J., Yang X., Ji Z.
该工作提出 Predictive Neighbouring Space Scoring(PNSS),用于在分层强化学习中生成紧凑子目标,实现无地图导航并降低相较端到端原始观测学习的复杂度。
关键贡献
- 提出 PNSS 进行紧凑子目标生成
- 采用高层目标选择与低层控制的分层强化学习结构
- 相较端到端原始传感器输入方法学习复杂度更低
- 在高难度无地图导航任务中完成验证
正式论文 · 视频演示
Recent Advances of Deep Robotic Affordance Learning: A Reinforcement Learning Perspective
IEEE Transactions on Cognitive and Developmental Systems (TCDS), 2023
Yang X., Ji Z., Wu J., Lai Y.-K.
该综述从强化学习视角系统梳理深度机器人可供性学习的发展脉络,包括方法分类、现有限制与未来方向,重点强调行动-结果预测。
关键贡献
- 从强化学习视角建立深度可供性学习方法分类体系
- 连接可供性理论与现代深度强化学习框架
- 指出表示学习与部署层面的关键开放问题
- 提出以行动-结果预测为核心的未来研究方向
预印本 · 正式论文
Hierarchical Reinforcement Learning with Universal Policies for Multi-Step Robotic Manipulation
IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021
Yang X., Ji Z., Wu J., Lai Y.-K., Wei C., Liu G., Setchi R.
Universal Option Framework(UOF)将长时序任务分解为可复用子目标,并通过通用低层策略提升稀疏奖励条件下多步机器人操作学习效率。
关键贡献
- 将长时序任务分解为可复用的层级子目标
- 通用低层策略可泛化到不同子任务实例
- 在稀疏奖励条件下实现高效学习
- 在复杂多步操作任务中完成验证
正式论文 · 视频演示 · GitHub
An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic Manipulation with PyBullet
Towards Autonomous Robotic Systems (TAROS), 2021
Yang X., Ji Z., Wu J., Lai Y.-K.
该工作开源了基于 PyBullet 的机器人多目标基准重实现,补充了额外 API 与长时序任务,并摆脱了对商业仿真器的依赖。
关键贡献
- 提供 MuJoCo 基准环境的开源替代方案
- 新增关节控制、图像观测与相机 API
- 引入长时序稀疏奖励基准任务
- 验证与原始基准行为一致性
预印本 · GitHub