Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物

Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展程序实现浏览器自动化,理...

豆包向量化API – 字节跳动推出的语义向量化模型

豆包向量化API是什么 豆包向量化API是由字节跳动研发的语义向量化模型,名为Doubao-embedding,主要面向向量检索的使用场景,支持中、英双语,能处理最长4K的...

Ultravox – 端到端多模态大模型,直接理解文本和人类语音

Ultravox是什么 Ultravox是新型的多模态大型语言模型(LLM),能直接理解文本和人类语音,无需依赖单独的自动语音识别(ASR)阶段。基于多模态投影器技术将音...

Speak APP – AI英语学习应用,与AI实时互动模拟真实口语对话场景

Speak APP是什么 Speak APP是一款AI英语学习应用,主打口语练习功能。Speak APP模拟真实对话场景,让用户与AI进行互动,实时获得发音、语法和词汇的反馈。Spe...

星流AI – LiblibAI 推出的一站式 AI 图像生成平台

星流AI是什么 星流AI是LiblibAI推出的一站式AI图像生成平台,基于自研的Star-3 Alpha通用图像生成模型,结合全球最大的LoRA增强模型库和先进的AI图像控制技术...

MMAudio – 基于多模态联合训练实现高质量 AI 音频合成项目

MMAudio是什么 MMAudio是先进视频到音频合成技术,基于多模态联合训练,让模型能在广泛的视听和音频文本数据集上进行训练。技术的核心是同步模块,确保生成的...

YouTube Dubbing – AI浏览器插件,一键翻译国外视频用熟悉语言播放

YouTube Dubbing是什么 YouTube Dubbing是在线观看国外视频的浏览器插件,基于智能同步配音和AI字幕技术,对字幕进行翻译并直接将翻译后的内容播放出来,免去...

Gendo – AI建筑可视化平台,快速将草图或概念图转化成可视化图像

Gendo是什么 Gendo是AI驱动的建筑可视化平台,基于生成式AI技术,如GANs和Diffusion模型,快速创建高度逼真的建筑概念图。平台能集成到设计工作流程中,支持...

ChatTTSPlus – 开源文本转语音工具,ChatTTS扩展版支持语音克隆

ChatTTSPlus是什么 ChatTTSPlus是ChatTTS的扩展版本,增加了TensorRT加速、语音克隆和移动模型部署等功能,提升语音合成的性能和灵活性。在Windows平台上,实...

书生·万象InternVL 2.5 – 上海 AI Lab 开源的多模态大语言模型系列

书生·万象InternVL 2.5是什么 书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型(MLLM)系列。该系列模型在InternVL 2.0的...
1 282 283 284 285 286 471