VRAG-RL – 阿里通义推出的多模态RAG推理框架

VRAG-RL是什么 VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,专注于提升视觉语言模型(VLMs)在处理视觉丰富信息时的检索、推理...

Bing Video Creator – 微软推出AI视频生成工具

Bing Video Creator是什么 Bing Video Creator 是微软推出AI视频生成工具。由OpenAI的Sora模型提供支持,能根据用户输入的文本描述快速生成视频内容。用户只...

Google AI Edge Gallery – 谷歌推出的AI应用,支持手机端离线运行AI模型

Google AI Edge Gallery是什么 Google AI Edge Gallery 是谷歌推出的实验性应用,支持让用户在本地设备上体验和使用机器学习(ML)及生成式人工智能(GenAI)...

TEN VAD – AI实时语音活动检测系统,低延迟、轻量级、高精度

TEN VAD是什么 TEN VAD 是高性能的实时语音活动检测系统,专为企业级应用设计。TEN VAD能精确地检测音频流中的语音活动,具有低延迟、轻量级和高精度的特点。...

TrackVLA – 银河通用推出的纯视觉端到端导航大模型

TrackVLA是什么 TrackVLA是银河通用推出的产品级端到端导航大模型。模型具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力,能实现从视觉感知到动...

DeepEyes – 小红书联合西安交大推出的多模态深度思考模型

DeepEyes是什么 DeepEyes 是小红书团队和西安交通大学联合推出的多模态深度思考模型。基于端到端强化学习,实现类似 OpenAI o3 的“用图思考”能力,无需依赖监...

从容大模型 – 云从科技推出的多模态AI模型

从容大模型是什么 从容大模型是云从科技推出的多模态AI模型。模型在国际权威评测平台OpenCompass的多模态榜单中以80.7分登顶,超越谷歌、OpenAI等顶尖团队。...

PPT.cn – AI PPT制作平台,快速生成完整的PPT框架

PPT.cn是什么 PPT.cn 是基于 AI 技术的智能 PPT 制作平台,帮助用户快速、高效地生成高质量的 PPT 演示文稿。用户只需输入主题或上传相关文档,平台通过 AI ...

Circuit Tracer – Anthropic开源的AI模型内部决策追踪工具

Circuit Tracer是什么 Circuit Tracer 是 Anthropic 推出的开源工具,用在研究大型语言模型的内部工作机制。Circuit Tracer 基于生成归因图(attribution gra...

DGM – 自改进AI Agent系统,会迭代修改自身代码提升性能

DGM是什么 DGM(Darwin Gödel Machine)是自改进人工智能系统,通过迭代修改自身代码来提升性能。DGM从其维护的编码代理档案中选择一个代理,基于基础模型生...
1 123 124 125 126 127 519