LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型
LLaDA 2.0是什么 LLaDA 2.0 是蚂蚁集团开源的离散扩散大语言模型(dLLM),包含 16B(mini)和 100B(flash)两个版本。打破了扩散模型难以扩展的瓶颈,首次...
LuxReal – 群核科技推出的AI 3D视频创作平台
LuxReal是什么 LuxReal 是群核科技推出的 AI 3D视频创作平台。平台能基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视...
SSVAE – 智谱AI开源的频谱结构化变分自编码器
SSVAE是什么 SSVAE(Spectral-Structured VAE)是智谱AI推出的优化视频生成的新型变分自编码器。SSVAE通过谱分析发现,视频 VAE 的隐空间若具备时空...
RealVideo -智谱AI开源的实时流式视频生成系统
RealVideo是什么 RealVideo 是智谱 AI 开源的实时流式视频生成系统,基于自回归扩散视频生成技术,RealVideo能将文本输入即时转化为连续、高质量的视频响应,...
SCAIL – 智谱AI开源的影视级角色动画生成框架
SCAIL是什么 SCAIL(Studio-grade Character Animation via In-context Learning)是智谱AI推出的面向影视级标准的角色动画生成框架。框架通过创新的3D一致性...
Kaleido – 智谱AI开源的多主体视频生成框架
Kaleido是什么 Kaleido 是智谱AI开源的多主体视频生成框架,能解决多主体视频生成中的主体一致性与背景解耦问题。框架通过创新的数据构建管线和 R-RoPE(Refe...
DeepSearchQA – 谷歌开源的AI研究Agent测试基准
DeepSearchQA是什么 DeepSearchQA是谷歌开源的新基准测试工具,用于评估Agent在网络研究任务中的全面性和多步查询能力。工具包含17个领域共900个手工设计的“...
GWM-1 – Runway推出的首个通用世界模型
GWM-1是什么 GWM-1 是 Runway 推出的首个通用世界模型,基于 Gen-4.5 构建,采用自回归架构逐帧预测视频内容,可实时交互。模型包含三个变体:GWM Worlds 用...
Gemini Deep Research – 谷歌推出的深度研究Agent
Gemini Deep Research是什么 Gemini Deep Research 是谷歌推出的深度研究智能体,基于 Gemini 3 Pro 构建,专为长周期的内容收集与综合任务优化。智能体通过...
GPT-5.2 – OpenAI最新推出的通用AI模型系列
GPT-5.2是什么 GPT-5.2 是 OpenAI 最新发布的先进人工智能模型系列,专为专业工作和复杂任务设计。模型提供三种版本:GPT-5.2 Instant 适用快速处理日常任务...
