AnimateDiff – 扩展文生图模型生成动画的框架

AnimateDiff是什么? AnimateDiff是由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员推出的一款将个性化的文本到图像模型扩展为动画生成器的框架,...

MotionCtrl – 腾讯等推出的视频生成模型的运动控制器

MotionCtrl是什么 MotionCtrl是由来自腾讯、香港大学、上海AI实验室、清华大学、广东工业大学等机构的研究人员推出的一个为视频生成模型设计的统一且灵活的运...

Genmo – AI生成视频、图片和动画的平台

Genmo是什么 Genmo是一个专注于人工智能的创意平台,用户可以在 Genmo 上创建视频、动画、图像等。该平台提供了一系列的工具和服务,旨在帮助用户通过AI技术...

Make-A-Character:阿里开源的AI 3D数字人生成框架

Make-A-Character是什么? Make-A-Character(简称Mach)是一个由阿里巴巴集团智能计算研究院开发的一个人工智能3D数字人生成框架,旨在通过文本描述快速创建...

MetaGPT – 多个AI智能体协作分工的框架

MetaGPT是什么? MetaGPT是一个创新的元编程框架,结合了大语言模型和多智能体协作系统,旨在通过模拟人类工作流程来解决复杂问题。该框架的核心在于将标准化...

DiffusionGPT – 开源的大模型驱动的文本到图像生成系统

DiffusionGPT是什么? DiffusionGPT是由来自字节跳动与中山大学的研究人员推出的一个开源的大模型(LLM)驱动的文本到图像生成系统,旨在解决文生图领域无法...

MusicFX – 谷歌推出的免费的AI音乐生成工具

MusicFX是什么? Google MusicFX是谷歌推出的一款免费的人工智能音乐生成工具,基于谷歌的MusicLM模型和DeepMind的水印技术SynthID,可以创作长达70秒的曲子...

OLMo – 艾伦AI研究所开源的完全开放的大语言模型框架

OLMo是什么? OLMo(Open Language Model)是由Allen AI(AI2,艾伦人工智能研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过...

ImageFX – 谷歌推出的人工智能图像生成工具

ImageFX是什么 Google ImageFX是谷歌最新推出的一款人工智能图像生成工具,基于谷歌的 DeepMind 实验室开发的一个先进的文本到图像的生成模型 — Imagen 2。Im...

IP-Adapter – 腾讯开源的文本到图像扩散模型适配器

IP-Adapter是什么 IP-Adapter(Image Prompt Adapter)是一种专门为预训练的文本到图像扩散模型(如Stable Diffusion)设计的适配器,目的是让文生图模型能够...
1 458 459 460 461 462 467