RL才会泛化?上海AI Lab系统研究:SFT也能学会跨域推理

PaperWeekly 2026-05-15 21:28
泛化不是RL专属
推荐阅读