SCAIL – 智谱AI开源的影视级角色动画生成框架

SCAIL是什么 SCAIL(Studio-grade Character Animation via In-context Learning)是智谱AI推出的面向影视级标准的角色动画生成框架。框架通过创新的3D一致性...

Kaleido – 智谱AI开源的多主体视频生成框架

Kaleido是什么 Kaleido 是智谱AI开源的多主体视频生成框架,能解决多主体视频生成中的主体一致性与背景解耦问题。框架通过创新的数据构建管线和 R-RoPE(Refe...

DeepSearchQA – 谷歌开源的AI研究Agent测试基准

DeepSearchQA是什么 DeepSearchQA是谷歌开源的新基准测试工具,用于评估Agent在网络研究任务中的全面性和多步查询能力。工具包含17个领域共900个手工设计的“...

GWM-1 – Runway推出的首个通用世界模型

GWM-1是什么 GWM-1 是 Runway 推出的首个通用世界模型,基于 Gen-4.5 构建,采用自回归架构逐帧预测视频内容,可实时交互。模型包含三个变体:GWM Worlds 用...

Gemini Deep Research – 谷歌推出的深度研究Agent

Gemini Deep Research是什么 Gemini Deep Research 是谷歌推出的深度研究智能体,基于 Gemini 3 Pro 构建,专为长周期的内容收集与综合任务优化。智能体通过...

GPT-5.2 – OpenAI最新推出的通用AI模型系列

GPT-5.2是什么 GPT-5.2 是 OpenAI 最新发布的先进人工智能模型系列,专为专业工作和复杂任务设计。模型提供三种版本:GPT-5.2 Instant 适用快速处理日常任务...

Dynal.AI – 专注于LinkedIn内容创作的AI Agent助手

Dynal.AI是什么 Dynal.AI 是专注于LinkedIn内容创作的智能工具,帮助用户高效生成和管理高质量的LinkedIn帖子。通过AI技术,将文字稿、网站链接、视频、PDF文...

PosterCopilot – 南大联合LibLib.ai等推出的海报设计模型

PosterCopilot是什么 PosterCopilot 是南京大学联合 LibLib.ai 和中科院自动化所共同推出的专业级海报设计大模型。模型通过独特的三阶段训练策略,赋予模型强...

Qwen3-Omni-Flash – 阿里通义推出的全模态大模型

Qwen3-Omni-Flash是什么 Qwen3-Omni-Flash(Qwen3-Omni-Flash-2025-12-01) 是阿里 Qwen 团队推出的全模态大模型。模型能无缝处理文本、图像、音频和视频等多...

VoxCPM1.5 – 面壁智能开源的端到端语音合成模型

VoxCPM1.5是什么 VoxCPM 1.5 是面壁智能推出的先进的端到端文本到语音(TTS)模型,专注于上下文感知的语音生成和逼真的声音克隆。模型通过端到端扩散自回归...
1 4 5 6 7 8 516