标签:[db:标签]

Qwen3-TTS – 阿里通义开源的系列语音生成模型

Qwen3-TTS是什么 Qwen3-TTS是Qwen开源的系列语音生成模型,具备强大的音色克隆、创造和语音控制能力。模型基于创新的Qwen3-TTS-Tokenizer-12Hz多码本语音编码...

萝卜面试 – 快手推出的AI面试辅导平台

萝卜面试是什么 萝卜面试是快手推出的为求职者提供专业AI面试辅导的在线平台。平台依托于一线互联网大厂资深导师的丰富经验,通过模拟真实面试场景,帮助求职...

LightOnOCR-2-1B – LightOnAI推出的OCR模型

LightOnOCR-2-1B是什么 LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型,参数量仅 1B,在复杂文档处理中表现卓越,擅长学术论文、数学公式和复杂表格的识...

Devin Review – AI代码审查工具,自动检查和标记代码问题

Devin Review是什么 Devin Review 是代码审查工具,支持将复杂的 GitHub 拉取请求(PR)转化为直观易懂的代码差异展示和精准的解释。通过智能算法,Devin Rev...

Being-H0.5 – 卢宗青团队开源的通用机器人模型

Being-H0.5是什么 Being-H0.5 是卢宗青团队推出的通用机器人模型,能通过人类先验知识和统一的动作对齐,解决机器人在不同形态硬件间的策略迁移问题。模型通...

VibeVoice-ASR – 微软开源的长音频语音识别模型

VibeVoice-ASR是什么 VibeVoice-ASR 是微软开源的先进语音识别模型,专为处理长达60分钟的长音频设计。模型能一次性处理整段音频,保持全局上下文,避免传统...

AgentCPM-Report – 清华联合面壁智能等开源的写作智能体

AgentCPM-Report是什么 AgentCPM-Report 是清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合推出的本地化深度调研智能体,基于8B...

Chroma 1.0 – FlashLabs开源的实时端到端语音对话模型

Chroma 1.0是什么 Chroma 1.0 是FlashLabs首个开源的实时端到端语音对话模型,兼具低延迟交互、高保真个性化语音克隆和强对话能力。模型通过紧密耦合语音理解...

Model1 – DeepSeek代码库更新的新模型版本

Model1是什么 Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。模型在技术上进行...

文心 App 要做社交了?百度内部人士:没有考虑取代微信

1 月 21 日下午消息,新浪科技获悉,文心 App 近期将启动交互界面改版,新增“多人、多 Agent 群聊”功能,以更加社交化、活人感的方式进行用户交互。目前,文...
1 24 25 26 27 28 371