HuMo – 清华联合字节推出的多模态视频生成框架

AI工具11个月前发布

94 0 0

HuMo是什么

HuMo是清华大学和字节跳动智能创作实验室共同提出的多模态视频生成框架，专注于人类中心的视频生成。能从文本、图像和音频等多种模态输入中生成高质量、精细且可控的人类视频。HuMo支持强大的文本提示跟随能力、一致的主体保留以及音频驱动的动作同步。支持从文本-图像、文本-音频以及文本-图像-音频生成视频，为用户提供了更高的定制化和控制能力。HuMo的模型在Hugging Face上开源，提供了详细的安装指南和模型准备步骤，支持480P和720P分辨率的视频生成，720P的生成质量更高。HuMo提供了配置文件来定制生成行为和输出，包括生成长度、视频分辨率以及文本、图像和音频输入的平衡。

HuMo – 清华联合字节推出的多模态视频生成框架

HuMo的主要功能

文本-图像驱动视频生成：结合文本提示和参考图像，定制角色的外貌、服装、妆容、道具和场景，生成个性化视频。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

BBC 等机构研究评估 AI 工具新闻总结水平，谷歌 Gemini 错误比例最高

66 0

NeuralAgent – 开源的桌面AI助手，自然语言执行复杂任务

166 0

NewBie-image-Exp0.1 – NewBieAi Lab开源的图像生成模型

60 0

已故名人遭 Sora 2“复活”引争议，OpenAI 称允许生成历史人物

68 0

智谱港交所敲钟上市，首席科学家唐杰要求公司全面回归基础模型研究

91 0

Meta 首席 AI 官汪滔：如果你现在 13 岁，就该把所有精力都放在氛围编程上

119 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号