标签:AI工具
PixVerse V2 – 爱诗科技最新发布的AI视频大模型
PixVerse V2是什么 PixVerse V2是爱诗科技最新发布的AI视频生成产品,基于Diffusion+Transformer(DiT)架构,提供更长、更一致、更有趣的视频生成体验。引入...
STORM AI – 斯坦福大学推出的开源AI写作工具
STORM AI 是什么 STORM AI 是斯坦福大学推出的开源AI写作工具,可在几秒钟内将一个主题转换为长篇文章/研究论文,完全免费,是 Perplexity Pages 的一种 替代...
盘盘单词 – 百度网盘推出的AI英语学习小程序
盘盘单词是什么 盘盘单词是百度网盘推出的AI英语学习微信小程序。采用生成式AI技术,分析用户百度网盘的照片,提取关键元素,自动生成与用户生活紧密相关的英...
GPT-4o mini – OpenAI 推出全新 AI 模型替代GPT-3.5
GPT-4o mini是什么 GPT-4o mini 是 OpenAI 最新推出的一款AI大模型,提供更高效、更具成本效益的解决方案。这款新模型替代 GPT-3.5,成为市场上最具成本效益...
FunAudioLLM – 阿里巴巴通义团队推出的开源语音大模型
FunAudioLLM是什么 FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个模型。SenseVoice擅长多语言语音识别和情感辨...
EchoMimic – 阿里推出的开源数字人项目,赋予静态图像以生动语音和表情
EchoMimic是什么 EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目,赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标志点,创造出高度逼真的...
Kimi浏览器插件 – 月之暗面推出的官方Kimi浏览器助手
Kimi浏览器插件是什么 Kimi浏览器插件是月之暗面科技有限公司推出的一款官方工具,集成了即时问答、全文摘要和划线互动等实用功能。用户可以轻松划线提问,获...
Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型
Moshi是什么 Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交...
Fish Speech – 开源的高效文本到语音合成TTS工具
Fish Speech是什么 Fish Speech是一款由Fish Audio开源的文本到语音(TTS)工具,支持中文、英文和日文。通过约15万小时的多语种数据训练,实现了接近人类水...
FreeAskInternet – 免费开源的本地AI搜索引擎
FreeAskInternet是什么 FreeAskInternet是一个免费开源的本地AI搜索引擎,整合了GPT-3.5等先进的大型语言模型(LLM)和SearXNG元搜索引擎,为用户提供搜索和...