标签:AI工具

AISEO Art – AI绘画工具,支持多种场景多种绘画风格和技巧

AISEO Art是什么 AISEO Art是AI驱动的艺术生成平台,基于先进的AI技术,支持用户用文本提示创作出独特的视觉艺术作品。平台提供广告产品制作、图像变化、AI头...

FLOAT – 基于流匹配的音频驱动说话人头像生成模型

FLOAT是什么 FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间实现高效的时间一致性运动...

TEN Agent – 开源的实时多模态 AI 代理框架

TEN Agent是什么 TEN Agent是集成OpenAI Realtime API和RTC技术的开源实时多模态AI代理框架。TEN Agent能实现语音、文本、图像的多模态交互,具备天气查询、...

Patchwork – Midjourney 推出的多人协作 AI 虚拟世界构建工具

Patchwork是什么 Patchwork 是 Midjourney 推出的创新性多人协作世界构建工具,支持用户在一个无限的画布上共同创作和构建虚拟世界。结合了AI图像生成技术和...

Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物

Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展程序实现浏览器自动化,理...

豆包向量化API – 字节跳动推出的语义向量化模型

豆包向量化API是什么 豆包向量化API是由字节跳动研发的语义向量化模型,名为Doubao-embedding,主要面向向量检索的使用场景,支持中、英双语,能处理最长4K的...

Ultravox – 端到端多模态大模型,直接理解文本和人类语音

Ultravox是什么 Ultravox是新型的多模态大型语言模型(LLM),能直接理解文本和人类语音,无需依赖单独的自动语音识别(ASR)阶段。基于多模态投影器技术将音...

Speak APP – AI英语学习应用,与AI实时互动模拟真实口语对话场景

Speak APP是什么 Speak APP是一款AI英语学习应用,主打口语练习功能。Speak APP模拟真实对话场景,让用户与AI进行互动,实时获得发音、语法和词汇的反馈。Spe...

星流AI – LiblibAI 推出的一站式 AI 图像生成平台

星流AI是什么 星流AI是LiblibAI推出的一站式AI图像生成平台,基于自研的Star-3 Alpha通用图像生成模型,结合全球最大的LoRA增强模型库和先进的AI图像控制技术...

MMAudio – 基于多模态联合训练实现高质量 AI 音频合成项目

MMAudio是什么 MMAudio是先进视频到音频合成技术,基于多模态联合训练,让模型能在广泛的视听和音频文本数据集上进行训练。技术的核心是同步模块,确保生成的...
1 210 211 212 213 214 400