VideoJAM – Meta 推出增强视频生成模型运动连贯性的框架

VideoJAM是什么 VideoJAM是Meta推出的,用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示,让模型在训练阶段同时学习预测视频的像素和运动...

Klee – AI 桌面应用,本地创建个人智能知识库

Klee是什么 Klee是本地化的 AI 桌面应用,专注于数据安全和隐私保护。完全在用户设备上运行,不涉及云端数据传输,确保数据的隐私和安全。Klee 提供强大的 AI...

TabTac – AI浏览器,支持滑词搜索、识图生文等功能

TabTac是什么 TabTac是AI驱动的新一代浏览器,专注于提升用户的搜索、网页浏览和办公效率。内置ChatGPT技术,支持滑词搜索、识图生文、AI Summarize和AI Copi...

LipRead Pro – AI视频唇读工具,将视频中的唇部动作转换为文字

LipRead Pro是什么 LipRead Pro 是基于先进 AI 技术的视频唇读工具,能将视频中的唇部动作转换为文字。采用最新的深度学习模型,支持多种语言和口音,应用于...

MimicPhoto – AI照片编辑工具,能快速调整笑容、眼神等面部表情细节

MimicPhoto是什么 MimicPhoto 是 GenAI Works 推出的 AI 驱动的照片编辑工具,专注于通过智能技术提升照片中的人物面部表情和整体效果。能快速调整笑容、眼神...

Diffuse – AI视频编辑工具,提供个性化视频生成和编辑功能

Diffuse是什么 Diffuse是基于 AI 技术的视频编辑器,专注于为用户提供高效、个性化的视频生成和编辑功能。用户可以通过上传一张自拍照,生成与自己高度逼真的...

s1 – 斯坦福和华盛顿大学推出低成本、高性能的AI推理模型

s1是什么 s1是斯坦福大学和华盛顿大学的研究团队开发的低成本、高性能的AI推理模型。模型通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型...

FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型

FluxSR是什么 FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率(Real-ISR)任...

LOOK – AI服装设计工具,手绘草图时AI同步生成视觉效果

LOOK是什么 LOOK是实时AI时尚设计工具,专为时尚设计师开发。LOOK基于先进的AIGC技术,将设计概念即时转化为视觉呈现,简化传统设计流程。设计师在Procreate...

RAG-FiT – 英特尔实验室推出用于开发、增强大模型的开源RAG框架

RAG-FiT是什么 RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言模型(LLMs)在检索增强生成(RAG)任务中...
1 213 214 215 216 217 473