谛韵DiffRhythm – 西北工业联合港中文推出的端到端音乐生成工具

DiffRhythm是什么 DiffRhythm(中文名称:谛韵) 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型(Latent Diffusion)...

NotaGen – 中央音乐学院联合北航、清华等推出的音乐生成模型

NotaGen是什么 NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱...

UX Pilot – AI设计助手,文本提示快速生成高保真设计界面

UX Pilot是什么 UX Pilot 是 AI 设计工具,基于智能化手段重塑 UX/UI 设计流程。UX Pilot提供从需求分析到代码交付的全流程解决方案。UX Pilot双轨设计引擎支...

NextGenAI – OpenAI 推出的教育联盟,联合15家顶尖大学和机构

NextGenAI是什么 NextGenAI是OpenAI推出的全球性联盟,基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等在内的15所顶...

ART – 微软联合清华和北大等推出的多层透明图像生成技术

ART是什么 ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直接生成多个独立的透明图层(支持 RGBA ...

Asyncflow v1.0 – Podcastle 推出的 AI 文本转语音模型

Asyncflow v1.0是什么 Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项,能为文本内容生成高质量的语音朗读,适用...

GaussianCity – 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架

GaussianCity是什么 GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3D-GS)技术。引入紧凑的 BEV-Point 表示方法...

SpeciesNet – Google 开源的动物物种识别 AI 模型

SpeciesNet是什么 SpeciesNet 是 Google 开源的人工智能模型,通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成,能识别超过 2000...

SuperGPQA – 豆包大模型联合 M-A-P 开源的知识推理基准测试集

SuperGPQA是什么 SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统...

Image-01 – MiniMax 推出的文本到图像生成模型

Image-01是什么 Image-01 是 MiniMax 推出的先进文本到图像生成模型,具备卓越的图像生成能力。能将用户输入的文本描述精准转化为高质量图像,支持多种纵横比...
1 220 221 222 223 224 520