LongCat-Video – 美团开源的AI视频生成模型

AI工具1周前发布
5 0

LongCat-Video是什么

LongCat-Video是美团LongCat团队开源的136亿参数的AI视频生成模型,在文本到视频(Text-to-Video)、图像到视频(Image-to-Video)和视频续写(Video-Continuation)等任务上表现出色,尤其擅长高效生成高质量的长视频。模型通过多奖励强化学习优化(GRPO),在内部和公共基准测试中展现出与领先开源视频生成模型及最新商业解决方案相当的性能。

LongCat-Video – 美团开源的AI视频生成模型

LongCat-Video的主要功能

  • 长视频生成:在视频续写任务上进行了预训练,能生成几分钟长的视频,不会出现色彩漂移或质量下降。
  • 多任务统一架构:将文本到视频、图像到视频和视频续写任务统一在一个视频生成框架内,仅需一个模型即可完成所有任务。
  • 高效推理:通过粗到细的生成策略以及Block Sparse Attention技术,能够在几分钟内生成720p、30fps的视频。

© 版权声明

相关文章