UNO-Bench – 美团LongCat推出的全模态大模型评测基准

AI工具1个月前发布
11 0

UNO-Bench是什么

UNO-Bench是美团LongCat团队推出的全模态大模型评测基准。UNO-Bench针对现有评测体系的不足,通过高质量、多样化的数据构建,精准衡量模型的单模态与全模态能力。基准首次验证了全模态大模型的“组合定律”,揭示单模态与全模态能力的复杂关系。UNO-Bench创新的多步开放式问题和高效的数据压缩算法,提升了评测的区分度与效率,为推动全模态大模型的发展提供科学的评估工具。

UNO-Bench – 美团LongCat推出的全模态大模型评测基准

UNO-Bench的主要功能

  • 精准评估模型能力:通过高质量、多样化的数据集,同时衡量模型在图像、音频、视频和文本等单模态和全模态任务上的表现。

© 版权声明

相关文章