标签:AI工具
SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型
SpeechGPT 2.0-preview是什么 SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队推出的拟人化实时交互系统,基于百万小时级中文语音数据训练,采用端到端架构...
CityDreamer4D – 南洋理工推出的无边界 4D 城市建模框架
CityDreamer4D是什么 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态物体(如车辆)与静态场景(如建筑和道路...
VARGPT – 北大推出的多模态理解生成统一模型
VARGPT是什么 VARGPT是创新的多模态大语言模型,专注于视觉理解和生成任务。基于自回归框架,将视觉生成与理解统一在一个模型中,避免任务切换的复杂性。VARG...
YuE – 港科大联合 M-A-P 推出的开源AI音乐生成模型
YuE是什么 YuE 是香港科技大学和 Multimodal Art Projection 团队联合开发的开源 AI 音乐生成模型。能将歌词转化为完整的歌曲,支持多种音乐风格,包括流行、...
Refly – AI原生内容创作平台,结合自由画布与多种 AI 功能
Refly是什么 Refly是基于“自由画布”理念的 AI 原生创作平台,帮助创作者高效地将创意转化为高质量内容。通过多线程对话、知识库集成、上下文记忆和智能搜索等...
MobileVD – 首个针对移动设备优化的视频扩散模型
MobileVD是什么 MobileVD(Mobile Video Diffusion)是首个针对移动设备优化的视频扩散模型,Qualcomm AI Research团队开发。模型基于Stable Video Diffusion...
DryMerge – AI驱动的自然语言生成任务自动化 Agent 工具
DryMerge是什么 DryMerge是创新的无代码自动化工具,通过自然语言处理简化跨应用的工作流程。用户只需用简单英语描述任务,DryMerge 可自动生成自动化流程,...
Qwen2.5-Max – 阿里通义千问推出的MoE模型
Qwen2.5-Max是什么 Qwen2.5-Max是阿里云推出的超大规模MoE(Mixture of Experts)模型,使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越,...
Raphael – 免费AI图像生成工具,基于 Flux.1-Dev 模型
Raphael是什么 Raphael 是基于 Flux.1-Dev 模型的免费且无限制的AI图像生成工具,用户无需注册或登录,可通过输入英文提示词生成高质量的图像。支持多种艺术...
QVQ-72B-Preview – 阿里通义开源的多模态推理模型
QVQ-72B-Preview是什么 QVQ-72B-Preview 是阿里云通义千问团队开源的多模态推理模型,专注于提升视觉推理能力。模型在多个基准测试中表现出色,在多模态理解...