AI工具

SUPIR – 高保真的AI图像修复和画质增强模型

SUPIR是什么 SUPIR(Scaling-UP Image Restoration)是一个突破性的图像修复和画质增强方法,利用了大规模的生成模型StableDiffusion-XL(SDXL)和模型扩展技...

BrushNet – 腾讯推出的高质量图像照片修复模型

BrushNet是什么 BrushNet是由腾讯PCG部门的ARC实验室与香港大学的研究人员推出的一个基于扩散模型的即插即用的图像照片修复(Inpainting)模型,通过分解的双...

LATTE3D – 英伟达推出的文本快速生成3D对象的模型

LATTE3D是什么 LATTE3D是由英伟达的多伦多AI实验室的研究人员推出的一个文本生成3D对象的模型,能够从文本提示描述快速生成高质量的3D内容(仅需400毫秒)。...

Mora – 微软等推出的可生成12秒视频的多AI智能体框架

Mora是什么 Mora是由来自微软和理海大学的研究人员推出的一个多智能体(AI Agents)框架,专门用于通用视频生成任务,目标是模拟并扩展OpenAI的Sora视频生成...

StreamMultiDiffusion – 实时生成和编辑图像的交互式框架

StreamMultiDiffusion是什么 StreamMultiDiffusion是一个开源的实时交互式的图像生成框架,结合了扩散模型的高质量图像合成能力和区域控制的灵活性,可根据用...

AnimateDiff-Lightning – 字节推出的快速生成高质量视频的模型

AnimateDiff-Lightning是什么 AnimateDiff-Lightning是由字节跳动的研究人员最新推出的一个高质量视频生成模型,利用了渐进式对抗性扩散蒸馏技术来实现快速的...

Stable Video 3D (SV3D) – 多视角合成和3D生成模型,由Stability AI推出

Stable Video 3D是什么 Stable Video 3D(简称SV3D)是由Stability AI公司开发的一个多视角合成和3D生成模型,能够从单张图片生成一致的多视角图像,并进一步...

VLOGGER – 谷歌推出的图像到合成人物动态视频的模型

VLOGGER是什么 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主要功能...

Open-Sora – 开源的类Sora架构的视频生成模型和复现方案

Open-Sora是什么 Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规...

Grok-1 – 马斯克旗下xAI开源的大模型,参数量3140亿

Grok-1是什么 Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最...
1 504 505 506 507 508 517