MoCha – Meta 联合滑铁卢大学推出的端到端对话角色视频生成模型
MoCha是什么 MoCha AI 是 Meta 和滑铁卢大学联合开发的端到端对话角色视频生成模型。能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。MoCha ...
DocTranslator – AI文档翻译工具,保留原始排版格式
DocTranslator是什么 DocTranslator是在线AI文档翻译工具。支持多种文件格式,如PDF、Word、Excel、PPT等,能保留原文档的排版。翻译覆盖100多种语言,能满足...
Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架
Mini DALL·E 3是什么 Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然语言与用户进行...
DreamActor-M1 – 字节跳动推出的 AI 图像动画框架
DreamActor-M1是什么 DreamActor-M1是字节跳动推出的先进AI图像动画框架,能将静态人物照片转化为生动的动画视频。采用混合引导机制,结合隐式面部表示、3D头...
Augment Agent – Augment Code 推出的 AI 编程助手
Augment Agent是什么 Augment Agent 是Augment推出的AI编程助手,帮助软件工程师高效编写高质量代码。Augment Agent能深度理解大型代码库,随着用户工作自动...
PaperBench – OpenAI 开源的 AI 智能体评测基准
PaperBench是什么 PaperBench是OpenAI开源的AI智能体评测基准,支持评估智能体复现顶级学术论文的能力。PaperBench要求智能体从理解论文内容到编写代码、执行...
WorldScore – 斯坦福大学推出的世界生成模型统一评估基准
WorldScore是什么 WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的...
Genspark – 通用 AI 智能体,提供深度搜索、自动规划和执行任务
Genspark是什么 Genspark 是前百度小度高管推出的通用 AI 智能体,集成 AI 搜索、极速浏览器和强大智能代理功能,支持自动完成复杂任务。Genspark的核心产品G...
Dolphin – 清华联合海天瑞声推出的语音识别大模型
Dolphin是什么 Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵...
EasyControl Ghibli – 免费生成吉卜力风格图像的 AI 模型
EasyControl Ghibli是什么 EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像...
