LTX-2.3 – Lightricks 开源的最新一代视频生成模型

AI工具1周前发布
13 0

LTX-2.3是什么

LTX-2.3 是以色列 AI 公司 Lightricks 开源的最新一代视频生成模型,采用 Diffusion Transformer 架构,拥有 220 亿参数。模型支持文本、图像、音频三种输入方式生成视频,最高可输出 4K 分辨率,并原生支持 9:16 竖屏格式和 24/48FPS 帧率选择。相比前代,LTX-2.3 通过全新训练的 VAE 架构显著提升了画面细节锐度,解决了高分辨率下纹理模糊的问题,同时新增原生音频生成功能,实现音视频同步输出。模型提供 7 个生成端点,单次最长可生成 20 秒视频,并支持 LoRA 微调。

LTX-2.3 – Lightricks 开源的最新一代视频生成模型

LTX-2.3的主要功能

  • 多模态视频生成:支持 text-to-video(文本生视频)、image-to-video(图像生视频)、audio-to-video(音频生视频)三种核心生成方式,满足不同创作需求。

© 版权声明

相关文章