AgentCLUE-ICabin – 汽车智能座舱的AI Agent评测基准

AgentCLUE-ICabin是什么 AgentCLUE-ICabin 是专注于汽车智能座舱场景的 AI 智能体测评基准,全面评估大语言模型在智能座舱中的工具调用能力。基准基于12大常...

Outset.ai – AI访谈平台,实时生成访谈总结

Outset.ai是什么 Outset.ai 是AI访谈平台,能同时进行数百次用户访谈,支持视频、音频和文本交流,自动总结访谈内容生成报告。相比传统方法,Outset.ai 的调...

IndexTTS2 – B站开源的最新文本转语音模型

IndexTTS2是什么 IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,已经正式开源。模型在情感表达和时长控制方面实现了重大突破,是首个支持精确时长...

Strix – 开源AI安全测试工具,全面漏洞检测

Strix是什么 Strix 是开源的 AI 驱动安全测试工具,能帮助开发人员和安全团队快速发现、验证应用程序中的漏洞。工具通过模拟真实黑客攻击,动态运行代码,减...

ST-Raptor – AI表格问答工具,支持多种半结构化表格

ST-Raptor是什么 ST-Raptor 是用在半结构化表格问答的工具,仅需一个 Excel 格式的表格和一个自然语言问题作为输入,能产生精确的答案。工具能处理多种半结构...

Stand-In – 腾讯微信推出的视频生成框架

Stand-In是什么 Stand-In 是腾讯微信视觉团队推出的轻量级的视频生成框架,专注于生成身份保护视频。框架通过训练1%的基础模型参数,能生成高保真度、身份一...

Song.do – AI音乐创作平台,一键生成完整歌曲

Song.do是什么 Song.do 是强大的 AI 音乐创作平台,通过简单易用的工具,帮助用户将文本转化为完整的歌曲。用户输入歌词、主题或情绪描述,选择音乐风格, AI...

HuMo – 清华联合字节推出的多模态视频生成框架

HuMo是什么 HuMo是清华大学和字节跳动智能创作实验室共同提出的多模态视频生成框架,专注于人类中心的视频生成。能从文本、图像和音频等多种模态输入中生成高...

小美 – 美团推出的首款AI生活Agent

小美是什么 小美是美团正式发布的首款AI生活Agent。定位为“小而美的AI生活小秘书”,通过自然语言交互为用户提供便捷的生活服务。小美能快速响应用户指令,完...

FireRedTTS-2 – 小红书推出的流式文本转语音系统

FireRedTTS-2是什么 FireRedTTS-2 是先进的长格式流式文本转语音(TTS)系统,专注于多说话人对话生成。采用12.5Hz流式语音分词器和双Transformer架构,能实...
1 29 30 31 32 33 494