Skip to content

Robotics Course Docs

Model-Based RL

robotics-course-fz2h

Model-Based RL¶

Learn the Dynamics¶

\[s_{t+1} = f(s_t, a_t) + \epsilon\]

Model Predictive Control (MPC)¶

def mpc_planner(state, horizon=10):
    best_action = None
    best_reward = -inf
    for _ in range(num_samples):
        actions = sample_actions(horizon)
        predicted_states = rollout(state, actions, model)
        reward = sum(reward_fn(predicted_states))
        if reward > best_reward:
            best_reward = reward
            best_action = actions[0]
    return best_action

Dyna Architecture¶

Learn model from real experience
Use model for planning
Update policy with real and simulated data

PETS (PETS)¶

Probabilistic ensemble trajectory sampling: - Ensemble of neural networks - Uncertainty-aware planning

← Back to Index

Robotics Curriculum

Robotics Course Docs

A bilingual robotics learning site covering ROS, perception, planning, simulation, manipulation, and deployment.

Learn

Environment Setup Robotics Basics ROS

Build

Simulation Planning Deployment

Community

GitHub Bilibili Issues

Robotics course docs for learners, makers, and researchers.

© 2026 Ling Shaobin. All Rights Reserved.

备案图标粤公网安备44010602015719号