混元图生视频 – 腾讯混元开源的图生视频模型

混元图生视频是什么 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型...

BGE-VL – 智源研究院联合多所高校开源的多模态向量模型

BGE-VL是什么 BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型,基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务,如图文检索...

Aya Vision – Cohere 推出多模态、多语言的视觉模型

Aya Vision是什么 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、...

TheoremExplainAgent – AI教学双智能体,数理化定理自动转动画

TheoremExplainAgent是什么 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视频帮助人们更好地理解数学和...

SpatialVLA – 上海 AI Lab 联合上科大等推出的空间具身通用操作模型

SpatialVLA是什么 SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,为...

Light-R1 – 360智脑开源的长思维链推理模型

Light-R1是什么 Light-R1是360智脑开源的AI模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7万条数学数据和两...

QwQ-32B – 阿里通义千问开源的最新推理模型

QwQ-32B是什么 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 6710 ...

Manus – 蝴蝶效应公司推出的全球首款通用型 AI Agent

Manus是什么 Manus 是蝴蝶效应公司推出的全球首款通用型 AI Agent。Manus能独立思考、规划和执行复杂任务,直接交付完整成果。与传统 AI 不同,Manus 拥有强...

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

Chat2SVG是什么 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言模型(LLMs)和图像扩散模型,实现高质量 SVG 图形的自动化创作。通过多...

PodAgent – 港中文、微软、小红书联合推出的播客生成框架

PodAgent是什么 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)...
1 217 218 219 220 221 520