跳转至

Robotics Course Docs

规划与学习

经验学习¶

动作中学习¶

通过实践和反馈改进技能。

方法¶

从演示中学习¶

示教编程
模仿学习
从观察中学习

从执行中学习¶

强化学习: 试错
从错误中学习: 分析并纠正失败

技能改进¶

def improve_skill(policy, experience):
    # 根据结果更新策略
    for state, action, reward in experience:
        policy[state][action] += alpha * reward
    return policy

模型学习¶

学习环境动态：

收集状态-动作-状态转换
拟合转换模型 \(P(s'|s,a)\)
用模型进行规划

← 返回概览

机器人课程文档

Robotics Course Docs

一个覆盖 ROS、感知、规划、仿真、操作与部署的双语机器人课程站。

学习路径

环境准备机器人基础 ROS

实践模块

仿真规划部署

社区

GitHub Bilibili 问题反馈

面向学习者、创客与研究者的机器人课程文档。

© 2026 Ling Shaobin. 保留所有权利。

备案图标粤公网安备44010602015719号