AI工具

StreamMultiDiffusion – 实时生成和编辑图像的交互式框架

StreamMultiDiffusion是什么 StreamMultiDiffusion是一个开源的实时交互式的图像生成框架,结合了扩散模型的高质量图像合成能力和区域控制的灵活性,可根据用...

AnimateDiff-Lightning – 字节推出的快速生成高质量视频的模型

AnimateDiff-Lightning是什么 AnimateDiff-Lightning是由字节跳动的研究人员最新推出的一个高质量视频生成模型,利用了渐进式对抗性扩散蒸馏技术来实现快速的...

Stable Video 3D (SV3D) – 多视角合成和3D生成模型,由Stability AI推出

Stable Video 3D是什么 Stable Video 3D(简称SV3D)是由Stability AI公司开发的一个多视角合成和3D生成模型,能够从单张图片生成一致的多视角图像,并进一步...

VLOGGER – 谷歌推出的图像到合成人物动态视频的模型

VLOGGER是什么 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主要功能...

Open-Sora – 开源的类Sora架构的视频生成模型和复现方案

Open-Sora是什么 Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规...

Grok-1 – 马斯克旗下xAI开源的大模型,参数量3140亿

Grok-1是什么 Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最...

AutoDev – 微软推出的AI编程和程序开发智能体框架

AutoDev是什么 AutoDev是由微软的研究人员推出的一个AI编程工具,专门设计用于自主规划和执行复杂的软件工程任务,如代码编写、调试、测试和版本控制等。Auto...

Follow-Your-Click – 腾讯等开源的图像到视频模型,可生成局部动画

Follow-Your-Click是什么 Follow-Your-Click是一个由来自腾讯公司(混元团队)联合清华大学和香港科技大学的研究人员共同研发的图像到视频(Image-to-Video,...

Comflowy – 基于 ComfyUI 工作流转化为 AI 工具的平台

Comflowy是什么 Comflowy 是专注于将 ComfyUI 工作流转化为盈利工具的平台,帮助 AI 创作者高效实现从创意到收入的转变。简洁的界面设计,让用户轻松将工作流...

Pix2Gif – 微软推出的静态图像转动态GIF的扩散模型

Pix2Gif是什么 Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型,专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散...
1 523 524 525 526 527 536