标签:AI工具
AniTalker – 上海交大开源的对口型说话视频生成框架
AniTalker是什么 AniTalker是由来自上海交大X-LANCE实验室和思必驰AISpeech的研究人员推出的AI对口型说话视频生成框架,能够将单张静态人像和输入的音频转换...
IC-Light – ControlNet作者开源的AI图片打光工具
IC-Light是什么 IC-Light是一款由ControlNet作者张吕敏开发的AI图像打光处理工具,可以对图片进行光源操纵和光影重构,实现与不同背景的完美融合。用户只需上...
PuLID – 字节跳动开源的个性化文本到图像生成框架
PuLID是什么 PuLID是由字节跳动的团队开源的一种个性化文本到图像生成技术,通过对比对齐和快速采样方法,实现了无需调整模型的高效ID定制,轻松实现图像换脸...
Stable Artisan – Stability AI推出的Discord机器人服务,可生成图像和视频
Stable Artisan是什么 Stable Artisan是Stability AI推出的一款基于Discord平台的机器人服务,利用其强大的AI技术和模型,如 Stable Diffusion 3 (SD3) 图像...
VideoGigaGAN – Adobe推出的AI视频分辨率提升模型
VideoGigaGAN是什么 VideoGigaGAN是由Adobe和马里兰大学的研究人员提出的一种新型的生成式视频超分辨率(VSR)模型,最高可将视频分辨率提升8倍,将模糊的视...
IDM-VTON – 逼真的开源AI虚拟试穿框架
IDM-VTON是什么 IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过...
ID-Animator – 腾讯等推出的个性化人物视频生成框架
ID-Animator是什么 ID-Animator是由来自腾讯光子工作室、中科大和中科院合肥物质科学研究院的研究人员推出的一种零样本(zero-shot)人类视频生成技术,能够...
OpenELM – 苹果开源的高效语言模型系列
OpenELM是什么 OpenELM是Apple苹果公司最新推出的系列高效开源的语言模型,包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模的版本(...
Arctic – Snowflake开源的企业级AI大模型
Arctic是什么 Arctic是由云计算巨头Snowflake的AI研究团队开发的一款高效、开源的企业级大型语言模型,该大模型是一个拥有480亿(480B)的参数规模,由128个...
Hyper-SD – 字节跳动推出的高效的图像合成框架
Hyper-SD是什么 Hyper-SD是由字节跳动的研究人员推出的一个高效的图像合成框架,旨在解决现有扩散模型在多步推理过程中计算成本高昂的问题。Hyper-SD通过轨迹...