标签:[db:标签]
Agent Kit – OpenAI推出的AI Agent开发工具
Agent Kit是什么 Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder...
Ming-UniAudio – 蚂蚁集团开源的音频多模态模型
Ming-UniAudio是什么 Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Trans...
UntitledPen – AI语音生成平台,自由选择定制声音
UntitledPen是什么 UntitledPen 是AI语音生成平台,能将文字快速转换为自然流畅的语音,支持多种语言和语音风格,提供智能写作、语音定制、音频编辑等功能。...
Auralix – AI学习工具,语音互动讲解笔记内容
Auralix是什么 Auralix 是创新的 AI 语音辅导工具,通过实时语音互动帮助用户高效学习。工具支持将学习材料转化为清晰的笔记,通过 AI 教练进行一对一的语音...
120 亿年收入撬动 1 万亿美元订单:OpenAI 烧钱搞 AI 基建,奥尔特曼称短期内不优先考虑盈利
10 月 8 日消息,科技媒体 The Decoder 昨日(10 月 7 日)发布博文,报道称 OpenAI 近期与英伟达、AMD 和甲骨文等公司签署了总价值约 1 万亿美元(注:现汇...
已故名人遭 Sora 2“复活”引争议,OpenAI 称允许生成历史人物
10 月 8 日消息,上周,OpenAI 推出其 Sora 2 视频生成器时宣称,公司已采取措施默认“禁止生成公众人物的形象”。然而,Sora 2 的创作者和观众发现,这一禁令...
谷歌将 Gemini AI 引入 Chrome 代码审查流程,提升开发效率与安全性
10 月 8 日消息,Gemini 不仅仅作为面向用户的功能出现在 Chrome 浏览器中,谷歌还在幕后积极利用该工具。Chromium 项目的一项最新变更显示,开发人员现在可...
谷歌发布 Gemini 2.5 Computer Use 模型:专攻浏览器交互,支持 13 种操作
10 月 8 日消息,谷歌正在预览一款全新的 Gemini 人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使 AI 智能体能够在原本为人而非机器人设计的用户...
消息称英伟达将投资马斯克的 xAI,成 200 亿美元融资参与方
10 月 8 日消息,据彭博社报道,知情人士透露,由埃隆・马斯克(Elon Musk)支持的人工智能初创公司 xAI 正在筹集比最初计划更多的资金,其中包括来自英伟达...
ReceiptHero – 开源AI记账工具,拍照生成数字化账单
ReceiptHero是什么 ReceiptHero 是开源的 AI 记账工具,能通过拍照将收据快速转化为数字化账单。工具基于先进的 AI 图像识别技术,用高达 95% 的准确率提取收...