Time-R1 – 基于3B参数模型的时间推理语言模型

Time-R1是什么 Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。第...
1 467 468 469