标签:AI工具
ViDoRAG – 通义联合中科大、上交大推出的视觉文档检索增强生成框架
ViDoRAG是什么 ViDoRAG是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架。基于多智能体协作和动态迭代推理,解决传统...
Spark-TTS – AI文本转语音工具,支持中英零样本语音克隆
Spark-TTS是什么 Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重...
HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型
HumanOmni是什么 HumanOmni 是专注于人类中心场景的多模态大模型,视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入,能全面理解人类行为、情感...
LuminaBrush – AI光源绘制工具,手绘光影线条自动生成光影效果
LuminaBrush是什么 LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目,用两阶段方法:第一阶段将图像转换为“均匀照明”的...
ARTalk – 东京大学等机构推出的3D头部动画生成框架
ARTalk是什么 ARTalk是东京大学和日本理化学研究所推出的新型语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自然的面部表情及头...
Buildin.AI – AI知识管理平台,支持智能写作、内容生成和数据分析
Buildin.AI是什么 Buildin.AI 是集成了 AI 功能的云端知识管理和协作平台,专为高效团队和个人设计。支持多人实时协作,涵盖文档编辑、项目管理、笔记记录等...
AgiBot Digital World – 智元机器人推出的机器人仿真框架
AgiBot Digital World是什么 AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架,为机器人操作技能研究与应用提供高效支持。AgiBot Digital Worl...
Tanka – AI通讯工具,具有长期记忆和上下文理解能力
Tanka是什么 Tanka 是具有长期记忆功能的 AI 智能通讯工具,专为团队协作设计。Tanka基于记忆过去的对话和业务上下文,提供智能回复、总结要点、设置提醒等服...
Videco – AI营销视频生成平台,支持多语言语音克隆和动态变量
Videco是什么 Videco 是专注于销售和市场营销的 AI 个性化视频生成平台。基于AI 技术实现语音克隆和动态变量功能,为每个潜在客户生成高度定制化的视频内容。...
CSM – Sesame团队推出的语音对话模型
CSM是什么 CSM(Conversational Speech Model)是Sesame团队推出的新型语音对话模型,提升语音助手的自然度和情感交互能力。CSM基于多模态学习框架,结合文本...