AReaL-boba – 蚂蚁联合清华开源的强化学习训练框架
AReaL-boba是什么 AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaL-boba是 AReaL 的升级版本,降低了强化学习训练门槛,用户能...
Elmo Chat – AI浏览器插件,支持对各类网页内容理解和处理
Elmo Chat是什么 Elmo Chat 是 Lepton AI 推出的 Chrome 扩展工具,基于AI技术简化用户对各类内容的理解和处理。Elmo Chat能快速总结网页、YouTube 视频、Goo...
cpmGO – 面壁智能推出的首个纯端侧汽车智能助手
cpmGO是什么 cpmGO (小钢炮超级助手)是面壁智能推出的全球首个纯端侧智能助手,专为汽车智能座舱设计。cpmGO 基于面壁小钢炮MiniCPM 端侧模型开发,具备视...
AutoGLM沉思 – 首个免费、具备深度研究和操作能力的AI Agent
AutoGLM沉思是什么 AutoGLM沉思是智谱推出的首个免费、具备深度研究和操作能力的AI Agent,能模拟人类思维过程,处理复杂的开放式问题。AutoGLM沉思具备强大...
MegaTTS 3 – 字节与浙江大学合作推出的零样本语音合成系统
MegaTTS 3是什么 MegaTTS 3是字节跳动与浙江大学合作推出的零样本文本到语音合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语...
Move AI – AI动作捕捉工具,支持普通2D视频转为3D运动数据
Move AI是什么 Move AI 是AI动作捕捉工具,专注于无标记动作捕捉技术,基于AI技术和计算机视觉技术,将普通摄像头(如手机)拍摄的2D视频转换为高质量的3D运...
OmniSQL – 开源文本到 SQL 模型,自然语言转换为 SQL 查询语句
OmniSQL是什么 OmniSQL 是开源的文本到 SQL 模型,将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了首个百万量级的文本到 SQL 数据集 S...
Vibe Draw – AI 3D建模工具,涂鸦草图一键转为3D模型
Vibe Draw是什么 Vibe Draw是开源的 AI 3D建模工具,支持将用户在2D画布上绘制的涂鸦草图转化为精美的3D模型。用户能用文本提示或继续绘制迭代优化模型,一键...
EmotiVoice – 网易有道开源的AI语音合成系统
EmotiVoice是什么 EmotiVoice是网易有道开源的多语言、多声音和提示控制的文本到语音(TTS)系统。EmotiVoice支持英语和中文,提供超过2000种声音,支持基于...
PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景
PhysGen3D是什么 PhysGen3D 是创新的框架,能将单张图像转换为交互式的 3D 场景,生成具有物理真实感的视频。结合了基于图像的几何和语义理解以及基于物理的...