项目展示

精选项目叙述、关键贡献，以及可播放演示（如可用）。

返回个人主页 · 研究页面

跳转到：颗粒与可变形物体操作 · 面向刚体操作的可供性学习与强化学习 · 开源资源

颗粒与可变形物体操作

DDBot: Differentiable Physics-Based Digging Robot for Unknown Granular Materials

IEEE Transactions on Robotics, 2025 (vol. 42, pp. 152-169)

Yang X., Wei M., Ji Z., Lai Y.-K.

DDBot 将 GPU 加速的可微分颗粒仿真与基于梯度的优化结合，在无需先验材料知识的情况下识别未知材料参数并优化挖掘策略，随后可零样本迁移到真实机器人。

关键贡献

提出面向可微颗粒仿真的一阶梯度优化方法
系统辨识与技能优化可在 5-20 分钟内高效收敛
在沙土场景中实现高精度零样本真实部署
支持自动微分与并行仿真

预印本 · 正式论文 · 视频演示

Differentiable Physics-Based System Identification for Robotic Manipulation of Elastoplastic Materials

International Journal of Robotics Research (IJRR), 2025

Yang X., Ji Z., Lai Y.-K.

DPSI 仅通过一次真实机器人交互和不完整点云观测即可估计具备物理可解释性的材料参数，为弹塑性材料的长时序高精度仿真与操作规划提供支撑。

关键贡献

通过单次真实交互完成材料参数估计
适用于不完整和遮挡条件下的 3D 点云观测
输出可解释物理参数（如模量、摩擦系数、屈服应力）
实现高保真模拟到真实对齐，支持长时序规划
完整开源工作流

预印本 · 正式论文 · 视频演示 · 项目页面与代码

AutomaChef: A Physics-Informed Demonstration-Guided Learning Framework for Granular Material Manipulation

IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2025

Wei M., Yang X., Lai Y.-K., Tafrishi S.A., Ji Z.

AutomaChef 使用可微仿真通过优化自动生成专家演示，再以此训练颗粒搬运策略，实现从仿真到真实场景的有效迁移。

关键贡献

基于 Taichi 实现可微颗粒仿真器
通过梯度优化自动生成高质量演示数据
性能优于标准强化学习、模仿学习和既有任务特定方法
在真实机器人颗粒搬运任务中成功部署

预印本 · 正式论文

Celebi's Choice: Causality-Guided Skill Optimisation for Granular Manipulation via Differentiable Simulation

IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2025

Wei M., Yang X., Yan J., Lai Y.-K., Ji Z.

Celebi 将因果推断引入颗粒操作的可微优化过程，通过自适应调整梯度步长，提高优化稳定性与收敛速度。

关键贡献

提出因果增强的梯度优化策略用于颗粒技能学习
构建可微分颗粒交互仿真环境
提出可微技能到动作映射以支持轨迹优化
自适应步长控制显著提升稳定性与收敛效率

正式论文 · 视频演示

面向刚体操作的可供性学习与强化学习

GAM: General Affordance-Based Manipulation for Contact-Rich Object Disentangling Tasks

Neurocomputing, 2024 (vol. 578, 127386)

Yang X., Wu J., Lai Y.-K., Ji Z.

GAM 学习在接触密集型解缠任务中“何处操作、如何操作”，并将可供性预测与目标条件强化学习结合，以处理多样化物体构型。

关键贡献

无需任务特定工程即可进行通用可供性预测
可泛化到多样且未见过的解缠构型
融合可供性学习与目标条件强化学习
在仿真与真实接触密集场景中验证有效性

预印本 · 视频演示

Abstract Demonstrations and Adaptive Exploration for Efficient and Stable Multi-Step Sparse Reward Reinforcement Learning

International Conference on Automation and Computing (ICAC), 2022

Yang X., Ji Z., Wu J., Lai Y.-K.

A2E 通过抽象子任务演示与自适应探索机制，提升稀疏奖励长时序机器人学习的样本效率与训练稳定性。

关键贡献

将任务分解为有序子任务序列并引入抽象演示
针对已掌握与薄弱子任务采用自适应探索策略
在网格世界与真实机器人操作基准中验证效果
同时提升样本效率与训练稳定性

Efficient Hierarchical Reinforcement Learning for Mapless Navigation with Predictive Neighbouring Space Scoring

IEEE Transactions on Automation Science and Engineering (TASE), 2023

Gao Y., Wu J., Yang X., Ji Z.

该工作提出 Predictive Neighbouring Space Scoring（PNSS），用于在分层强化学习中生成紧凑子目标，实现无地图导航并降低相较端到端原始观测学习的复杂度。

关键贡献

提出 PNSS 进行紧凑子目标生成
采用高层目标选择与低层控制的分层强化学习结构
相较端到端原始传感器输入方法学习复杂度更低
在高难度无地图导航任务中完成验证

正式论文 · 视频演示

Recent Advances of Deep Robotic Affordance Learning: A Reinforcement Learning Perspective

IEEE Transactions on Cognitive and Developmental Systems (TCDS), 2023

Yang X., Ji Z., Wu J., Lai Y.-K.

该综述从强化学习视角系统梳理深度机器人可供性学习的发展脉络，包括方法分类、现有限制与未来方向，重点强调行动-结果预测。

关键贡献

从强化学习视角建立深度可供性学习方法分类体系
连接可供性理论与现代深度强化学习框架
指出表示学习与部署层面的关键开放问题
提出以行动-结果预测为核心的未来研究方向

预印本 · 正式论文

Hierarchical Reinforcement Learning with Universal Policies for Multi-Step Robotic Manipulation

IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

Yang X., Ji Z., Wu J., Lai Y.-K., Wei C., Liu G., Setchi R.

Universal Option Framework（UOF）将长时序任务分解为可复用子目标，并通过通用低层策略提升稀疏奖励条件下多步机器人操作学习效率。

关键贡献

将长时序任务分解为可复用的层级子目标
通用低层策略可泛化到不同子任务实例
在稀疏奖励条件下实现高效学习
在复杂多步操作任务中完成验证

正式论文 · 视频演示 · GitHub

An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic Manipulation with PyBullet

Towards Autonomous Robotic Systems (TAROS), 2021

Yang X., Ji Z., Wu J., Lai Y.-K.

该工作开源了基于 PyBullet 的机器人多目标基准重实现，补充了额外 API 与长时序任务，并摆脱了对商业仿真器的依赖。

关键贡献

提供 MuJoCo 基准环境的开源替代方案
新增关节控制、图像观测与相机 API
引入长时序稀疏奖励基准任务
验证与原始基准行为一致性

预印本 · GitHub