明岐 – 上海交大推出的医学多模态大模型,精准诊断罕见病

明岐是什么 明岐是上海交通大学计算机学院LoCCS实验室推出的首个精准诊断罕见病的医学多模态大模型。基于“大模型能力矩阵 + 专家路由协同”的双引擎驱动架构,...

幕布 – AI大纲笔记工具,一键生成思维导图

幕布是什么 幕布是AI大纲笔记工具,通过清晰的结构化大纲形式,帮助用户将零散的知识点系统化,一键生成思维导图的功能,能让复杂的信息以直观的图形呈现,帮...

日日新SenseNova V6 – 商汤推出的多模态融合模型系列

日日新SenseNova V6是什么 日日新SenseNova V6是商汤推出的日日新第六代多模态融合大模型系列,基于6000亿参数的多模态MoE架构,实现文本、图像和视频的原生...

BrowseComp – OpenAI 开源的 AI Agent 网络浏览能力基准

BrowseComp是什么 BrowseComp 是 OpenAI 开源的用于评估 AI Agent网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史...

FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架

FantasyTalking是什么 FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练...

Kimi-VL – 月之暗面开源的轻量级多模态视觉语言模型

Kimi-VL是什么 Kimi-VL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码...

九歌 – 清华大学推出的AI诗歌写作工具

九歌是什么 九歌是清华大学自然语言处理与社会人文计算实验室推出的AI诗歌写作系统。九歌基于深度学习技术,用超过80万首人类诗人创作的诗歌进行训练,辅助用...

atypica.AI – AI商业研究智能体,自动明确研究意图、生成研究报告

atypica.AI是什么 atypica.AI 是专注于商业研究的智能体框架,通过语言模型快速生成用户洞察。通过虚拟访谈任务,模拟真实用户行为,快速收集和分析数据,生...

Versatile-OCR-Program – 开源多模态OCR工具,精准提取复杂结构化数据

Versatile-OCR-Program是什么 Versatile-OCR-Program是开源多模态OCR工具,支持从复杂的教育材料中提取结构化数据,生成适合机器学习训练的高质量数据集。Ver...

MoLing – 本地AI办公自动化助手,基于 MCP 服务器

MoLing是什么 MoLing 是无依赖的本地办公自动化助手,是基于计算机和浏览器使用的 MCP 服务器。MoLing 基于操作系统 API 实现系统交互,支持文件系统操作(如...
1 180 181 182 183 184 520