在哪儿问问 – 滴滴推出的AI图寻应用
在哪儿问问是什么 在哪儿问问是滴滴推出的AI图寻小程序,用户可通过上传照片,让AI识别照片中的地点,获取其大致位置。提供地点查找功能,能推荐相似地点及照...
SciToolAgent – 浙大开源知识图谱驱动的科学领域Agent
SciToolAgent是什么 SciToolAgent是浙江大学创新中心(HICAI-ZJU)开发的开源工具平台,提升科研效率。整合了500多种科学工具,覆盖生物学、化学、材料科学等...
Mano – 明略科技推出的GUI智能操作模型
Mano是什么 Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术...
Dreamer 4 – DeepMind推出的新型世界模型智能体
Dreamer 4是什么 Dreamer 4 是由 DeepMind 开发的新型智能体,通过在快速且准确的世界模型中进行想象训练来解决复杂的控制任务。在《我的世界》(Minecraft)...
LONGLIVE – 英伟达等推出的交互式长视频生成框架
LONGLIVE是什么 LONGLIVE 是英伟达等顶尖机构联合推出的实时交互式长视频生成框架。框架通过帧级自回归(AR)模型,结合 KV-recache 机制、流式长视频微调和...
Tinker API – Thinking Machines Lab推出的模型微调API
Tinker API是什么 Tinker API 是 Thinking Machines Lab 发布的首款产品,专为语言模型微调而设计。简化语言模型的微调流程,让研究人员和开发者能专注于算法...
Logics-Parsing – 阿里开源的端到端文档解析模型
Logics-Parsing是什么 Logics-Parsing 是阿里巴巴开源的端到端文档解析模型,基于 Qwen2.5-VL-7B。通过强化学习优化文档布局分析和阅读顺序推断,能将 PDF 图...
聆音EchoCare – 香港中科院推出的超声大模型
聆音是什么 聆音(EchoCare)是中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)推出的超声大模型。模型依托450万张超声影像数据集EchoAtlas进行训...
Sora 2 – OpenAI 推出的新一代AI音视频生成模型
Sora 2是什么 Sora 2 是 OpenAI 推出的新一代AI音视频生成模型。在多个方面进行了显著的升级和改进,能生成更符合物理规律的视频,例如在模拟复杂动作场景时...
RoboBrain-X0 – 智源研究院开源的跨本体泛化具身模型
RoboBrain-X0是什么 RoboBrain-X0是北京智源人工智能研究院开源的全球首个支持零样本跨本体泛化的具身模型。能在无需微调的情况下,驱动多种不同构造的真实机...

