GPT-4o mini – OpenAI 推出全新 AI 模型替代GPT-3.5

GPT-4o mini是什么 GPT-4o mini 是 OpenAI 最新推出的一款AI大模型,提供更高效、更具成本效益的解决方案。这款新模型替代 GPT-3.5,成为市场上最具成本效益...

FunAudioLLM – 阿里巴巴通义团队推出的开源语音大模型

FunAudioLLM是什么 FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个模型。SenseVoice擅长多语言语音识别和情感辨...

EchoMimic – 阿里推出的开源数字人项目,赋予静态图像以生动语音和表情

EchoMimic是什么 EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目,赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标志点,创造出高度逼真的...

Kimi浏览器插件 – 月之暗面推出的官方Kimi浏览器助手

Kimi浏览器插件是什么 Kimi浏览器插件是月之暗面科技有限公司推出的一款官方工具,集成了即时问答、全文摘要和划线互动等实用功能。用户可以轻松划线提问,获...

Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型

Moshi是什么 Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交...

Fish Speech – 开源的高效文本到语音合成TTS工具

Fish Speech是什么 Fish Speech是一款由Fish Audio开源的文本到语音(TTS)工具,支持中文、英文和日文。通过约15万小时的多语种数据训练,实现了接近人类水...

FreeAskInternet – 免费开源的本地AI搜索引擎

FreeAskInternet是什么 FreeAskInternet是一个免费开源的本地AI搜索引擎,整合了GPT-3.5等先进的大型语言模型(LLM)和SearXNG元搜索引擎,为用户提供搜索和...

MimicMotion – 腾讯推出的AI人像动态视频生成框架

MimicMotion是什么 MimicMotion是腾讯的研究人员推出的一个高质量的人类动作视频生成框架,利用置信度感知的姿态引导技术,确保视频帧的高质量和时间上的平滑...

Gemma 2 – 谷歌DeepMind推出的新一代开源人工智能模型

Gemma 2是什么 Gemma 2是谷歌DeepMind推出的新一代开源人工智能模型,包含90亿和270亿参数版本。该模型以卓越的性能、高效的推理速度和广泛的硬件兼容性为特...

CriticGPT – OpenAI推出的识别GPT输出代码错误的模型

CriticGPT是什么 CriticGPT是OpenAI发布的一个新型人工智能模型,基于GPT-4构建,专门用于审查和识别大型语言模型(如ChatGPT)生成的代码中的错误。CriticGP...
1 448 449 450 451 452 467