FantasyWorld – 高德地图联合北邮推出的3D世界建模框架

FantasyWorld是什么 FantasyWorld是高德地图(AMAP)和北京邮电大学合作开发的创新性3D世界建模框架,专注于通过统一的视频和3D预测生成高质量的3D场景。框架...

Nemotron Speech ASR – 英伟达开源的语音识别模型

Nemotron Speech ASR是什么 Nemotron Speech ASR 是英伟达开源的专注于低延迟、实时流式语音识别的模型。通过缓存感知架构,将已处理的语音特征缓存,仅对新...

DeepTutor – 香港大学开源的AI学习助手

DeepTutor是什么 DeepTutor 是香港大学数据科学实验室开源的 AI 学习助手,通过多智能体架构和知识图谱技术,将复杂的知识体系转化为高效的学习体验。用户上...

Yollo AI – 沉浸式AI角色对话与视频生成平台

Yollo AI是什么 Yollo AI是结合沉浸式AI角色对话和AI视频生成平台。平台拥有超过20万种个性化的AI角色,用户在这里能找到AI伴侣,进行浪漫互动或奇幻角色扮演...

Evai建筑大师 – 专为建筑室内行业的云端AI创作平台

Evai建筑大师是什么 Evai 建筑大师(OpenEvai)是专为建筑师、室内设计师和景观规划师打造的云端 AI 创作平台。通过集成前沿的 AIGC 技术,打破专业设计的算...

Qwen3-VL-Reranker – 阿里通义开源的跨模态理解模型

Qwen3-VL-Reranker是什么 Qwen3-VL-Reranker 是阿里通义基于 Qwen3-VL 构建的跨模态理解模型,专为多模态信息检索设计。模型接收任意模态组合的查询与文档对...

Qwen3-VL-Embedding – 阿里通义开源的多模态信息检索模型

Qwen3-VL-Embedding是什么 Qwen3-VL-Embedding 是阿里通义推出的多模态信息检索模型,专为处理文本、图像、可视化文档和视频等多种模态输入而设计。模型基于...

ChatDev 2.0 – 清华联合面壁智能开源的零代码多智能体工具

ChatDev 2.0是什么 ChatDev 2.0 是清华大学、上海交通大学、OpenBMB、面壁智能联合团队开源的零代码多智能体工具。工具通过可视化交互,让用户通过“拖拽 + 配...

VoiceSculptor – 西工大联合语图智能等开源的音色设计模型

VoiceSculptor是什么 VoiceSculptor 是西北工业大学、语图智能等机构推出的音色设计模型,能通过自然语言指令实现对语音合成的细粒度控制。模型支持对音色的...

怎么用云幕同声AI视频翻译工具,制作优质跨境视频

在当今全球化的时代,信息的跨国交流日益频繁,语言障碍成为人们获取知识、进行商务合作以及文化交流的重要阻碍。随着人工智能技术的飞速发展,AI视频翻译工...
1 29 30 31 32 33 555