标签:AI工具
Seed-TTS – 字节跳动推出的高质量文本到语音生成模型
Seed-TTS是什么 Seed-TTS是由字节跳动开发的高级文本到语音(Text to Speech,TTS)模型,能够生成与人类语音极为相似的高质量语音,具备出色的上下文学习能...
ChatTTS – 开源的用于对话的生成式语音合成模型
ChatTTS是什么 ChatTTS是一款专为对话场景设计的支持中英文的文本转语音(TTS)模型,基于约10万小时的中英文数据进行训练,能够生成高质量、自然流畅的对话...
Codestral – Mistral AI推出的代码生成模型,支持80+编程语言
Codestral是什么 Codestral是法国人工智能初创公司Mistral AI推出的一款代码生成AI模型,专为提高软件开发效率而设计,支持超过80种编程语言,包括但不限于Py...
Stable Assistant – Stability AI推出的AI聊天机器人
Stable Assistant是什么 Stable Assistant是由Stability AI开发的一款聊天机器人,集成了最新的文本和图像生成技术(Stable Diffusion 3和Stable LM 2 12B )...
Universal-1 – AssemblyAI推出的多语种语音识别和转换模型
Universal-1是什么 Universal-1是AI语音初创公司AssemblyAI推出的一款多语言语音识别和转录模型,经过超过1250万小时的多语种音频数据训练,支持英语、西班牙...
CogVLM2 – 智谱AI推出的新一代多模态大模型
CogVLM2是什么 CogVLM2是由智谱AI推出的新一代多模态大模型,在视觉和语言理解方面实现了显著的性能提升,支持高达8K的文本长度和1344*1344分辨率的图像输入...
腾讯元器 – 腾讯推出的智能体创作开发平台
腾讯元器是什么 腾讯元器是腾讯公司在腾讯云生成式AI产业应用峰会上推出的一款基于腾讯混元大模型的AI智能体创作与分发平台,可帮助用户轻松创建和部署智能体...
Veo – 谷歌推出的可生成1分钟1080P的视频模型
Veo是什么 Veo是由Google DeepMind开发的一款视频生成模型,用户可以通过文本、图像或视频提示来指导其生成所需的视频内容,能够生成时长超过一分钟1080P分辨...
混元DiT – 腾讯混元开源的文生图扩散模型Hunyuan-DiT
混元DiT是什么 混元DiT(Hunyuan-DiT)是由腾讯混元团队开源的一款高性能的文本到图像的扩散Transformer模型,具备细粒度的中英文理解能力,能够根据文本提示...
GPT-4o – OpenAI最新发布的多模态AI大模型
GPT-4o是什么 GPT-4o是OpenAI最新推出的一款先进的人工智能模型,具备强大的多模态推理能力,能够处理语音、文本和视觉信息。模型能实时响应用户输入,在音频...