标签:AI工具
NutWorld – 新加坡国立、南洋理工和Skywork AI推出的视频处理框架
NutWorld是什么 NutWorld是新加坡国立大学、南洋理工大学和Skywork AI推出的视频处理框架,能将日常单目视频高效地转换为动态3D高斯表示(Gaussian Splatting...
Eino – 字节跳动开源的大模型应用开发框架
Eino是什么 Eino 是字节跳动开源的大模型应用开发框架,能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础,具备稳定的内核、灵活的扩展性和...
ArcaNotes – AI笔记应用,通过自然语言提问智能生成答案
ArcaNotes是什么 ArcaNotes是AI增强型笔记应用,专为高效记录和知识管理设计。支持快速笔记输入,用户可以像发短信一样轻松记录想法,AI引擎会实时推荐主题,...
MAETok – 港大联合北大等机构推出的自动编码器
MAETok是什么 MAETok(Masked Autoencoders Tokenizer)是卡内基梅隆大学、香港大学、北京大学等机构推出的扩散模型的新型图像标记化方法。MAETok基于掩码建...
ASAP – 卡内基梅隆大学联合英伟达推出的模拟与真实物理对齐框架
ASAP是什么 ASAP(Aligning Simulation and Real Physics)是卡内基梅隆大学和英伟达联合推出的,用在解决仿人机器人模拟与现实动力学不匹配问题的两阶段框架...
SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架
SANA 1.5是什么 SANA 1.5是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器(Linear Diffusion Transformer),用于文本到图像生成任务。在 ...
LIMO – 上海交大推出的高效推理方法,仅需817条训练样本
LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM)的复杂推理能...
EMAGE – 清华联合东大等机构推出的音频生成全身共语手势框架
EMAGE是什么 EMAGE(Expressive Masked Audio-conditioned GEsture modeling)是清华大学、东京大学、庆应义塾大学等机构推出的生成全身共语手势框架。EMAGE...
Seede.ai – AI设计助手,一句话生成专业级设计作品
Seede.ai是什么 Seede.ai是 AI 图像设计工具,专为简化设计流程,使没有设计经验的用户能在短时间内创建出专业级的设计作品。提供一句话生成设计,用户只需输...
JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架
JoyGen是什么 JoyGen是京东科技和香港大学推出的,音频驱动的3D说话人脸视频生成框架,专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特...