ObjectMover – 港大联合 Adobe 推出的新型图像编辑模型

ObjectMover是什么 ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型,解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物...

Vidu Q1 – 生数科技推出的高可控视频大模型

Vidu Q1是什么 Vidu Q1 是清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队推出的高可控视频大模型。支持生成1080p高清视频,画质细腻...

RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架

RoboOS是什么 RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延...

RoboBrain – 智源研究院开源的具身大脑模型

RoboBrain是什么 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的...

Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准

Math24o是什么 Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的能力...

ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架

ChatAnyone是什么 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。采用高效分层...

PaddleSpeech – 百度飞桨团队开源的语音处理工具

PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeec...

MeshifAI – AI 3D模型生成平台,支持生成简单模型和纹理模型

MeshifAI是什么 MeshifAI 是AI文本转 3D 模型生成平台,能根据用户输入的文本提示快速生成 3D 模型,支持生成简单模型和纹理模型(PBR)两种类型,生成的模型...

DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型

DistilQwen2.5-R1是什么 DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B、14B和32B四个参数量级的模型。DistilQwe...

TripoSF – VAST AI 开源的新一代 3D 基础模型

TripoSF是什么 TripoSF是VAST推出的新一代3D基础模型,突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex表示方法,结合稀疏体素结构,仅在物...
1 143 144 145 146 147 471