[db:标签] | 第 26 页

Qwen3-TTS – 阿里通义开源的系列语音生成模型

Qwen3-TTS是什么 Qwen3-TTS是Qwen开源的系列语音生成模型，具备强大的音色克隆、创造和语音控制能力。模型基于创新的Qwen3-TTS-Tokenizer-12Hz多码本语音编码...

AI工具

6个月前

萝卜面试是什么萝卜面试是快手推出的为求职者提供专业AI面试辅导的在线平台。平台依托于一线互联网大厂资深导师的丰富经验，通过模拟真实面试场景，帮助求职...

AI工具

6个月前

LightOnOCR-2-1B是什么 LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型，参数量仅 1B，在复杂文档处理中表现卓越，擅长学术论文、数学公式和复杂表格的识...

AI工具

6个月前

Devin Review是什么 Devin Review 是代码审查工具，支持将复杂的 GitHub 拉取请求（PR）转化为直观易懂的代码差异展示和精准的解释。通过智能算法，Devin Rev...

AI工具

6个月前

Being-H0.5是什么 Being-H0.5 是卢宗青团队推出的通用机器人模型，能通过人类先验知识和统一的动作对齐，解决机器人在不同形态硬件间的策略迁移问题。模型通...

AI工具

6个月前

VibeVoice-ASR是什么 VibeVoice-ASR 是微软开源的先进语音识别模型，专为处理长达60分钟的长音频设计。模型能一次性处理整段音频，保持全局上下文，避免传统...

AI工具

6个月前

AgentCPM-Report是什么 AgentCPM-Report 是清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合推出的本地化深度调研智能体，基于8B...

AI工具

6个月前

Chroma 1.0是什么 Chroma 1.0 是FlashLabs首个开源的实时端到端语音对话模型，兼具低延迟交互、高保真个性化语音克隆和强对话能力。模型通过紧密耦合语音理解...

AI工具

6个月前

Model1是什么 Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型，可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。模型在技术上进行...

AI工具

6个月前

1 月 21 日下午消息，新浪科技获悉，文心 App 近期将启动交互界面改版，新增“多人、多 Agent 群聊”功能，以更加社交化、活人感的方式进行用户交互。目前，文...

AI资讯

7个月前