Stable Video 3D (SV3D) – 多视角合成和3D生成模型,由Stability AI推出

Stable Video 3D是什么 Stable Video 3D(简称SV3D)是由Stability AI公司开发的一个多视角合成和3D生成模型,能够从单张图片生成一致的多视角图像,并进一步...

VLOGGER – 谷歌推出的图像到合成人物动态视频的模型

VLOGGER是什么 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该模型的主要功能...

Open-Sora – 开源的类Sora架构的视频生成模型和复现方案

Open-Sora是什么 Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规...

Grok-1 – 马斯克旗下xAI开源的大模型,参数量3140亿

Grok-1是什么 Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最...

AutoDev – 微软推出的AI编程和程序开发智能体框架

AutoDev是什么 AutoDev是由微软的研究人员推出的一个AI编程工具,专门设计用于自主规划和执行复杂的软件工程任务,如代码编写、调试、测试和版本控制等。Auto...

Follow-Your-Click – 腾讯等开源的图像到视频模型,可生成局部动画

Follow-Your-Click是什么 Follow-Your-Click是一个由来自腾讯公司(混元团队)联合清华大学和香港科技大学的研究人员共同研发的图像到视频(Image-to-Video,...

Comflowy – 基于 ComfyUI 工作流转化为 AI 工具的平台

Comflowy是什么 Comflowy 是专注于将 ComfyUI 工作流转化为盈利工具的平台,帮助 AI 创作者高效实现从创意到收入的转变。简洁的界面设计,让用户轻松将工作流...

Pix2Gif – 微软推出的静态图像转动态GIF的扩散模型

Pix2Gif是什么 Pix2Gif是由微软研究院的研究人员提出的一个基于运动引导的扩散模型,专门用于将静态图像转换成动态的GIF动画/视频。该模型通过运动引导的扩散...

Transformer Debugger – OpenAI开源的理解和分析大模型内部的工具

Transformer Debugger是什么 Transformer Debugger (TDB) 是由 OpenAI 的对齐团队(Superalignment)开发的一款工具,旨在帮助研究人员和开发者更深入地理解...

ELLA – 腾讯推出的扩散模型适配器,可增强语义对齐

ELLA是什么 ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的研究人员推出的一种新型方法,旨在提升文本到图像生成模型在处理...
1 455 456 457 458 459 467