LTX Video – Lightricks推出的开源AI视频生成模型

LTX Video是什么 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基于2亿参数的DiT架构,确保帧间平滑运...

designify – 在线AI设计工具,自动进行设计编辑生成专业级视觉内容

designify是什么 designify是人工智能的在线设计工具,帮助用户快速创建专业级别的视觉内容。用户只需上传照片,designify能自动移除背景、增强颜色、调整阴...

Marco-o1 – 阿里推出的开源AI推理模型

Marco-o1是什么 Marco-o1是阿里巴巴国际数字商业集团MarcoPolo团队开发的开源AI推理模型,旨在解决开放式问题,缺乏明确答案和量化奖励的问题。模型通过链式...

MVPaint – 腾讯PCG联合多所高校共同推出的3D纹理生成框架

MVPaint是什么 MVPaint是腾讯PCG 、上海AI LAB、南洋理工大学S-Lab、清华大学共同推出的3D纹理生成框架,基于同步多视角扩散技术实现高分辨率、无缝且多视图...

DynaMem – 纽约大学和Hello Robot推出的动态空间语义记忆系统

DynaMem是什么 DynaMem是纽约大学和Hello Robot推出的动态空间语义记忆系统,专为开放世界中的移动操作设计。基于维护一个特征点云作为机器人记忆,处理环境...

OmniBooth – 华为诺亚方舟联合港科大推出的图像生成框架

OmniBooth是什么 OmniBooth是华为诺亚方舟实验室和港科大研究团队共同推出的图像生成框架,支持基于文本提示或图像参考进行空间控制和实例级定制。框架用用户...

DreamPolish – 智谱AI、清华、北大联合推出的文本到3D生成模型

DreamPolish是什么 DreamPolish是智谱 AI、清华大学和北京大学推出的文本到3D生成模型,基于两阶段方法改进复杂对象的精细几何结构和高质量纹理的生成。第一...

The Matrix – 阿里联合港大等多所机构推出的AI基础世界模拟器

The Matrix是什么 The Matrix是与电影同名的首个AI基础世界模拟器,是全华人团队推出的(作者分别来自阿里巴巴、香港大学、滑铁卢大学和加拿大AI研究机构Vect...

DINO-X – IDEA 研究院推出的通用视觉大模型

DINO-X是什么 DINO-X是IDEA研究院推出的通用视觉大模型,具备开放世界对象检测与理解能力。支持文本、视觉和定制提示,能识别图像中的任何对象而无需用户提示...

Add-it – 英伟达推出无需训练的图像编辑技术

Add-it是什么 Add-it是NVIDIA推出的无需训练的图像编辑技术,能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制,整合场景图像、文本提...
1 313 314 315 316 317 471