AiSlides.chat – AI PPT 制作工具,对话式交互自动分析生成演示文稿

AiSlides.chat是什么 AiSlides.chat 是基于AI技术的对话式 PPT 制作工具。用户用自然语言输入需求或粘贴现有内容,AI 自动分析生成 PPT 大纲、逐页设计幻灯片...

ReCamMaster – 浙大联合快手等推出的视频重渲染框架

ReCamMaster是什么 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制,...

UniAct – 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架

UniAct是什么 UniAct 是新型的具身基础模型框架,解决不同机器人之间行为异构性的问题。通过学习通用行为,捕捉不同机器人共享的原子行为特征,消除因物理形...

Multi-Speaker – AudioShake 推出的多说话人声分离模型

Multi-Speaker是什么 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决传统音频工具在...

UniFluid – 谷歌联合麻省理工推出的多模态图像生成与理解框架

UniFluid是什么 UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文...

TokenFD – 上海交大联合美团推出的细粒度图文对齐基础模型

TokenFD是什么 TokenFD是上海交通大学联合美团推出的细粒度图文对齐基础模型,主要用于文档理解任务。通过Token级对齐,实现了图像Token与语言Token在同一特...

SVG Converter – 免费图像矢量化工具,一键秒变高清矢量图

SVG Converter是什么 SVG Converter是在线矢量化工具,支持将多种位图图像(如JPG、PNG、BMP等)快速转换为矢量图形(如SVG、AI、EPS、PDF等)。SVG Converte...

GR00T N1 – 英伟达开源的人形机器人基础模型

GR00T N1是什么 GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T...

SmolDocling – 轻量级的多模态文档处理模型

SmolDocling是什么 SmolDocling(SmolDocling-256M-preview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、...

AI Companion – Zoom 推出的 AI 助手,具有记忆、推理、任务执行和协调能力

AI Companion是什么 AI Companion 是 Zoom 推出AI智能助手,基于记忆、推理、任务执行和协调四大功能,成为整个 Zoom 平台上的代理,帮助用户从重复繁琐的工...
1 203 204 205 206 207 520