哈密顿-雅可比-贝尔曼方程:强化学习和扩散模型

哈密顿-雅可比-贝尔曼方程是控制理论、动态规划和强化学习领域的基石,为解决最优控制问题提供了理论基础,与RL中的决策过程以及扩散模型中高质量样本的生成密切相关。