OmniGen2是什么
OmniGen2 是北京智源人工智能研究院推出的开源多模态生成模型。能根据文本提示生成高质量图像,支持指令引导的图像编辑,比如修改背景或人物特征等。OmniGen2 采用双组件架构,结合视觉语言模型(VLM)和扩散模型,实现对多种生成任务的统一处理。优势在于开源免费、高性能以及强大的上下文生成能力,适用于商业、创意设计和研究开发等场景。

OmniGen2的主要功能
- 文本到图像生成:能根据文本提示生成高保真度和美观的图像。在多个基准测试中表现出色,例如在 GenEval 和 DPG-Bench 上的得分分别为 0.86 和 83.57。
© 版权声明
文章版权归作者所有,未经允许请勿转载。