AI工具
EvoCUA – 美团开源的通用多模态计算机操作模型
EvoCUA是什么 EvoCUA(Evolving Computer Use Agent)是美团开源的多模态模型,专注于计算机使用自动化任务。EvoCUA通过自然语言指令和屏幕截图实现对Chrome...
Youtu-LLM – 腾讯Youtu团队开源的轻量级语言模型
Youtu-LLM是什么 Youtu-LLM 是腾讯 Youtu 团队开源的轻量级语言模型,参数规模为 19.6 亿。专为智能体任务设计,具备强大的“原生智能体能力”,在多项任务中超...
MMSI-Video-Bench – 上海AI Lab推出的空间智能视频基准
MMSI-Video-Bench是什么 MMSI-Video-Bench 是用于评估多模态大语言模型(MLLMs)在视频空间智能方面能力的基准测试工具。由上海人工智能实验室等多所高校联合...
TeleStudio – 中国电信AI推出的全链路AI视频创作平台
TeleStudio是什么 TeleStudio是中国电信人工智能研究院(TeleAI)和中电信人工智能科技有限公司共同研发的全链路AI视频创作平台,平台以“专业能力平民化、创...
Genie Sim 3.0 – 智元机器人推出的开源仿真平台
Genie Sim 3.0是什么 Genie Sim 3.0 是智元机器人推出的首个大语言模型驱动的开源仿真平台。平台基于 NVIDIA Isaac Sim 构建,融合三维重建与视觉生成技术,...
OS-Copilot – 上海AI Lab开源的通用操作系统AI Agent
OS-Copilot是什么 OS-Copilot是开源的操作系统智能助手项目,为构建能与操作系统中各种元素(如网络、代码终端、文件、多媒体和第三方应用)交互的通用计算机...
BrowserAct – AI网页自动抓取工具,自然语言生成工作流
BrowserAct是什么 BrowserAct 是AI驱动的网页抓取与自动化工具,通过自然语言理解用户需求,快速生成自动化工作流,无需编写代码或维护复杂的脚本。工具支持...
UI-TARS Desktop – 字节开源的桌面AI GUI智能体工具
UI-TARS Desktop是什么 UI-TARS Desktop 是字节跳动开源的基于视觉语言模型的桌面自动化工具。支持通过自然语言指令控制电脑操作,如打开文件、浏览网页、操...
10Kh RealOmni-Open – Gen Robot.AI开源的具身智能数据集
10Kh RealOmni-Open是什么 10Kh RealOmni-Open是Gen Robot.AI团队开源的具身智能数据集,是目前行业内规模最大的开源数据集之一。包含超过10000小时的数据、1...
Open Interpreter – 开源AI终端助手,本地环境执行代码
Open Interpreter是什么 Open Interpreter 是开源的AI终端助手项目,为大型语言模型(LLM)提供本地代码运行能力。通过自然语言交互界面,用户可以通过类似 C...