跳转至

机器人应用

操作

抓取

  • SAC用于6-DOF抓取学习
  • 基于图像的策略
  • 课程学习

灵巧手操作

  • 灵巧手控制
  • DAPG (Dagger)

Locomotion

行走

  • PPO用于四足机器人控制
  • 奖励塑形
  • 领域随机化

游泳/飞行

  • 仿真到真实挑战
  • 残差策略

最佳实践

  1. 课程学习: 从简单开始,逐步增加难度
  2. 观测归一化: 提高训练稳定性
  3. 动作缩放: 匹配环境限制
  4. 领域随机化: 弥合仿真-真实差距

← 返回目录