LongCat-Video-Avatar – 美团开源的数字人视频生成模型

AI工具8个月前发布

122 0 0

LongCat-Video-Avatar是什么

LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频，保持人物身份一致性和自然动态。LongCat-Video-Avatar支持多种生成模式，包括音频文本生成视频（AT2V）、音频文本图像生成视频（ATI2V）和视频续写。通过解耦音频信号与动作、避免重复内容和减少 VAE 错误累积等技术，实现高质量、长时间的视频生成，可用于演员表演、歌手动态、播客、销售演示及多人互动场景。

LongCat-Video-Avatar的主要功能

多模式视频生成：支持音频文本生成视频（AT2V）、音频文本图像生成视频（ATI2V）和视频续写，满足不同场景的多样化需求。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

昆仑万维发布并开源全新推理大模型 MindLink，基于 Qwen3-32B 和 Qwen2.5-72B 进行后训练

134 0

k2 – 月之暗面 Kimi 最新开源的 MoE 架构基础模型

89 0

AI Fooler – 免费AI音频处理工具，一键分离伴奏和人声

115 0

Fermi – AI教育平台，支持自适应实时辅导

89 0

亚马逊推出 Kindle Translate AI 翻译服务：一键翻译作者书籍，可触及更多读者群体

57 0

StepAudio R1 – 阶跃星辰开源的原生音频推理模型

59 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号