每日推荐
早报
搜索
登录
PaperWeekly
订阅
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
关注该公众号
会员可查看最新的全部文章
^__^
•
8 / 26
PPO为何稳赢Policy Gradient?答案藏在这刀“黄金剪裁”
^__^
•
8 / 25
AI岗位全面加码!蚂蚁集团2026届秋招正式启动,11城同步开放
^__^
•
8 / 22
别再分开训!SFT+RL融合范式全解析:统一视角下的六大方法
^__^
•
8 / 21
提分不提参!遥感图像四大SOTA trick:多模态融合、统一框架、轻量化与新范式
^__^
•
8 / 20
类PPO强化学习三部曲:GRPO简化→DAPO修正→GSPO全面进化
^__^
•
8 / 19
FlashCommunication V2登场!突破「任意比特」通信瓶颈,加速大模型分布式训练与部署