dynamic-programming

哈密顿-雅可比-贝尔曼方程：强化学习和扩散模型

哈密顿-雅可比-贝尔曼方程是控制理论、动态规划和强化学习领域的基石，为解决最优控制问题提供了理论基础，与RL中的决策过程以及扩散模型中高质量样本的生成密切相关。

2026-03-30 AI & Machine Learning 1 Administrator