🗂️

RL

共 1 篇文章

机器学习中的时间维度与强化学习

强化学习为什么更适合解决动态问题？它不需要预设的标准答案，而是靠智能体在环境里的摸爬滚打，自己找出一套收益最大化的策略。

RL 智能体

2026-05-29 RL 💬 0 👁 69