Wan2.5 – 阿里通义推出的多模态生成模型系列

AI工具3天前发布
1 0

Wan2.5是什么

Wan2.5(通义万相2.5)是阿里推出的最新多模态生成模型,为通义万相 2.5 preview 版(Wan2.5-Preview),涵盖文生视频、图生视频、文生图和图像编辑四大功能,首次实现音画同步的视频生成能力,支持高清1080P、24fps视频创作,能生成匹配画面的人声、音效和音乐。模型能生成中英文文字、复杂图表和艺术海报,支持一键图像编辑。,模型基于原生多模态架构,输入提示词或音频即可驱动创作,大幅降低创作门槛,广泛应用在广告、电商、影视等领域。模型现已上线通义万相、阿里云百炼平台。

Wan2.5 – 阿里通义推出的多模态生成模型系列

Wan2.5的主要功能

  • 视频生成
    • 音画同步 :模型能生成与画面匹配的人声(包括多人)、音效、音乐BGM,支持多种语言,画面与声音严丝合缝。
    • 时长提升 :视频生成时长从5秒提升至10秒,能实现更完整的剧情故事。
    • 高清画质 :支持24帧每秒的1080P高清视频生成,满足电影级场景的创作需求。
    • 复杂指令理解 :在视频生成任务中能理解运镜等复杂连续变化指令控制。
  • 图像生成
    • 文字生成 :支持中英文、小语种、艺术字、长文本、复杂构图的精准渲染,支持生成海报、LOGO等。
    • 图表生成 :支持输出科学图表、流程图、数据图、架构图、文字内容表格等结构化图文。
  • 图像编辑
    • 丰富编辑任务 :支持换背景、改颜色、加元素、调风格等丰富编辑任务。
    • 指令精准理解 :输入一句话即可完成P图,指令理解精准,无需专业PS技能。
    • 一致性保持 :支持单图/多图参考垫图,人脸、商品、风格等视觉元素ID强保持。

如何使用Wan2.5

  • 访问官网:访问通义万相官网,完成账号注册和登录。

© 版权声明

相关文章