AI工具 | 第 147 页

SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型

SpeechGPT 2.0-preview是什么 SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队推出的拟人化实时交互系统，基于百万小时级中文语音数据训练，采用端到端架构...

AI工具

10个月前

CityDreamer4D是什么 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态物体（如车辆）与静态场景（如建筑和道路...

AI工具

10个月前

VARGPT是什么 VARGPT是创新的多模态大语言模型，专注于视觉理解和生成任务。基于自回归框架，将视觉生成与理解统一在一个模型中，避免任务切换的复杂性。VARG...

AI工具

10个月前

YuE是什么 YuE 是香港科技大学和 Multimodal Art Projection 团队联合开发的开源 AI 音乐生成模型。能将歌词转化为完整的歌曲，支持多种音乐风格，包括流行、...

AI工具

10个月前

Refly是什么 Refly是基于“自由画布”理念的 AI 原生创作平台，帮助创作者高效地将创意转化为高质量内容。通过多线程对话、知识库集成、上下文记忆和智能搜索等...

AI工具

10个月前

MobileVD是什么 MobileVD（Mobile Video Diffusion）是首个针对移动设备优化的视频扩散模型，Qualcomm AI Research团队开发。模型基于Stable Video Diffusion...

AI工具

10个月前

DryMerge是什么 DryMerge是创新的无代码自动化工具，通过自然语言处理简化跨应用的工作流程。用户只需用简单英语描述任务，DryMerge 可自动生成自动化流程，...

AI工具

10个月前

Qwen2.5-Max是什么 Qwen2.5-Max是阿里云推出的超大规模MoE（Mixture of Experts）模型，使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越，...

AI工具

10个月前

Raphael是什么 Raphael 是基于 Flux.1-Dev 模型的免费且无限制的AI图像生成工具，用户无需注册或登录，可通过输入英文提示词生成高质量的图像。支持多种艺术...

AI工具

10个月前

QVQ-72B-Preview是什么 QVQ-72B-Preview 是阿里云通义千问团队开源的多模态推理模型，专注于提升视觉推理能力。模型在多个基准测试中表现出色，在多模态理解...

AI工具

10个月前