StableAvatar – 复旦推出的音频驱动视频生成模型

AI工具10个月前发布

79 0 0

StableAvatar是什么

StableAvatar 是复旦大学、微软亚洲研究院等推出的创新音频驱动虚拟形象视频生成模型。模型通过端到端的视频扩散变换器，结合时间步感知音频适配器、音频原生引导机制和动态加权滑动窗口策略，能生成无限长度的高质量虚拟形象视频。模型解决了现有模型在长视频生成中出现的身份一致性、音频同步和视频平滑性问题，显著提升生成视频的自然度和连贯性，适用虚拟现实、数字人创建等场景。

StableAvatar – 复旦推出的音频驱动视频生成模型

StableAvatar的主要功能

高质量长视频生成：支持生成超过3分钟的高质量虚拟形象视频，保持身份一致性和音频同步。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

群星低语Whispers from the Star – Anuttacon推出的AI互动叙事游戏

97 0

FastDeploy – 百度推出的大模型推理部署工具

157 0

Claude for Chrome – Anthropic推出的浏览器Agent插件

92 0

8 年首次大突破：谷歌祭出 Transformer 杀手，掌门人划出 AGI 死线

52 0

OpenAgents – 构建AI Agent网络的开源框架

72 0

LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态模型

71 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号