EchoMimicV3 – 蚂蚁集团推出的多模态数字人视频生成框架

EchoMimicV3是什么 EchoMimicV3是蚂蚁集团推出的高效多模态、多任务数字人视频生成框架。框架拥有13亿参数,基于任务混合和模态混合范式,结合新颖的训练与推...

如何用AI生成短视频创意,FD Studio一站式服务内容创作者

FD Studio是什么 FD Studio 是深圳市浮点数信息技术有限公司推出的 AI 辅助影视和短视频创意管理平台。面向短片、广告、自媒体等多领域创作者,解决创意前期...

VibeVoice – 微软推出的开源文本转语音模型

VibeVoice是什么 VibeVoice 是微软推出的新型文本到语音(TTS)模型,能生成富有表现力、长篇幅、多说话者的对话式音频,如播客。模型通过创新的连续语音标记...

DeepCode – 港大实验室推出的多Agent代码生成平台

DeepCode是什么 DeepCode 是香港大学数据智能实验室推出的基于多智能体系统的代码生成平台。DeepCode 能将研究论文、自然语言描述等转化为高质量的生产就绪代...

XBai o4 – 开源的并行推理模型,高质量的推理轨迹

XBai o4是什么 XBai o4是开源的大语言模型,基于“反射生成形式”训练,结合长CoT强化学习和过程奖励学习,在复杂推理能力上表现出色,中等模式下已超越OpenAI-...

内容特工队ReelsAgent – 首个移动端AI营销视频生成Agent

内容特工队ReelsAgent是什么 内容特工队ReelsAgent是全球首个移动端AI营销视频智能体Agent。实现了从市场调研、创意生成到视频发布全流程自动化,用户只需输...

问小白o4 – 问小白推出的首个并行思考模型

问小白o4是什么 问小白o4是国内首个并行思考模型,能同时启动8条思考路径,自动筛选最优解,提供精准答案。模型融合Long‑CoT强化学习与过程奖励学习,具备深...

FutureX – 字节联合复旦等高校推出的动态实时评估基准

FutureX是什么 FutureX是字节跳动、复旦大学、斯坦福大学和普林斯顿大学的研究团队联合发布的,专为LLM智能体未来预测任务设计的动态实时评估基准。通过半自...

SlowFast-LLaVA-1.5 – 苹果推出的多模态长视频理解模型

SlowFast-LLaVA-1.5什么 SlowFast-LLaVA-1.5(简称SF-LLaVA-1.5)是专为长视频理解设计的高效视频大语言模型。基于双流(SlowFast)机制,平衡处理更多输入帧...

ComoRAG – 华南理工联合微信推出的认知启发式RAG框架

ComoRAG是什么 ComoRAG 是华南理工大学未来技术学院、微信 AI 团队等机构联合推出的认知启发式检索增强生成(RAG)框架,专门用在长篇叙事文本的理解和推理。...
1 15 16 17 18 19 467