UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

AI工具1天前发布
2 0

UniWorld V2是什么

UniWorld V2是兔展智能和北京大学UniWorld团队推出的新一代图像编辑模型。采用创新的UniWorld-R1训练框架,首次将强化学习策略优化应用于图像编辑,通过DiffusionNFT技术实现高效训练。模型使用多模态大语言模型作为奖励模型,提供稳定且细粒度的反馈,同时引入低方差组过滤机制,提升训练稳定性。能精准理解和渲染复杂的中文字体,支持精细化空间控制,如通过画框指定编辑区域,可实现全局光影融合,让图像更加自然和谐。在GEdit-Bench和ImgEdit等行业基准测试中取得领先成绩,全面超越现有公开模型。

UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

UniWorld V2的主要功能

  • 中文字体精准渲染:能理解和生成复杂的艺术中文字体,如“月满中秋”等,效果清晰且语义准确,只需简单指令即可实现文字修改。

© 版权声明

相关文章