RIVAL:面向机器翻译的迭代对抗强化学习

哔哩哔哩技术 2025-10-31 12:00
本文提出 RIVAL 框架,通过对抗式迭代优化解决了RLHF在口语字幕翻译中的分布偏移问题。
推荐阅读