李飞飞等领衔,来自七所高校的“三代AI人”联合提出强化学习新框架,将用于训练和评估大模型智能体

DeepTech深科技 2025-04-25 19:25
00 后王子涵,是 DeepSeek 的前实习生,曾参与 DeepSeek-V2 的开发。
推荐阅读