FlowAct-R1 – 字节推出的实时交互数字人视频生成框架

AI工具2周前发布
11 0

FlowAct-R1是什么

FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架,仅需单张参考图和音频,支持流式生成无限时长的全身动态视频。框架通过分块扩散强制策略和多模态大语言模型实现低延迟(1.5秒首帧)和25fps的稳定实时响应,能精细控制数字人的面部表情与肢体动作,适用视频会议、虚拟陪伴和直播互动等场景,具有强大的泛化能力,可驱动多种风格角色。

FlowAct-R1 – 字节推出的实时交互数字人视频生成框架

FlowAct-R1的主要功能

  • 实时交互与无限时长生成:框架仅需单张参考图和音频输入,可流式生成无限时长的全身动态视频,支持长时间稳定运行,无崩脸等常见问题。

© 版权声明

相关文章