SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架
SANA 1.5是什么 SANA 1.5是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器(Linear Diffusion Transformer),用于文本到图像生成任务。在 ...
LIMO – 上海交大推出的高效推理方法,仅需817条训练样本
LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM)的复杂推理能...
EMAGE – 清华联合东大等机构推出的音频生成全身共语手势框架
EMAGE是什么 EMAGE(Expressive Masked Audio-conditioned GEsture modeling)是清华大学、东京大学、庆应义塾大学等机构推出的生成全身共语手势框架。EMAGE...
Seede.ai – AI设计助手,一句话生成专业级设计作品
Seede.ai是什么 Seede.ai是 AI 图像设计工具,专为简化设计流程,使没有设计经验的用户能在短时间内创建出专业级的设计作品。提供一句话生成设计,用户只需输...
JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架
JoyGen是什么 JoyGen是京东科技和香港大学推出的,音频驱动的3D说话人脸视频生成框架,专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特...
倍客AI – AI内容创作平台,生成多样化的产品图、模特图、创意文案和视频
倍客AI是什么 倍客AI是专注于 AI 内容创作的平台,通过人工智能技术为商业摄影、广告设计、电商展示等领域提供高效、高质量的创意解决方案。平台的核心功能包...
MatAnyone – 南洋理工和商汤科技推出的人像视频抠图框架
MatAnyone是什么 MatAnyone是南洋理工大学S-Lab实验室和商汤科技推出的,针对复杂背景人像视频抠图的先进框架,专注于目标指定的视频抠图任务。MatAnyone基于...
Le Chat APP – Mistral AI推出的AI对话助手应用
Le Chat APP是什么 Le Chat APP是法国人工智能初创公司Mistral AI推出的AI对话助手应用。支持自然语言对话、实时网页搜索、文档分析和图像生成等功能。Le Cha...
Onlook – 开源AI视觉编辑工具,设计修改自动同步代码
Onlook是什么 Onlook是开源的视觉编辑工具,专为 React 应用程序设计,帮助设计师和开发人员更高效地协作。支持用户在浏览器中直接修改 React 应用的 UI,实...
SynCD – Meta和卡内基梅隆大学开源的文生图合成训练数据集
SynCD是什么 SynCD(Synthetic Customization Dataset)是卡内基梅隆大学和Meta推出的高质量合成训练数据集,用在提升文本到图像模型的定制化能力。SynCD包含...