Covo-Audio – 腾讯开源的端到端语音模型

AI工具5个月前发布

47 0 0

Covo-Audio是什么

Covo-Audio 是腾讯开源的70亿参数端到端语音大模型，可直接处理连续音频输入并生成音频输出。模型核心创新包括分层三模态语音-文本交错架构、智能与说话人解耦技术，以及原生全双工交互能力。模型基于Qwen2.5-7B和Whisper构建，在口语对话、语音理解、音频理解等任务达到SOTA性能。作为统一架构的语音AI，模型避免了传统级联系统的延迟与误差累积，是GPT-4o语音能力的强有力开源替代方案。

Covo-Audio – 腾讯开源的端到端语音模型

Covo-Audio的主要功能

口语对话：支持端到端语音输入与语音输出的自然多轮对话交互。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

美国加州法院：使用版权内容训练 AI 合法

93 0

国家数据局指导：DexonomySim 具身智能灵巧手多样抓取仿真数据集正式开源发布，用于 AI 机器人训练

97 0

美国多所学校部署监控工具，实时监测学生与聊天机器人对话以预防心理问题

54 0

灵芽社区 – 腾讯推出的一站式AI内容创作平台

79 0

谷歌拟未来两年在美国投资250亿美元建设AI数据中心

95 0

Auggie – Augment推出的AI Agent命令行开发工具

174 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号