标签:AI工具
FlagevalMM – 智源开源的多模态模型评测框架
FlagevalMM是什么 FlagEvalMM是北京智源人工智能研究院开源的多模态模型评测框架,能全面评估处理文本、图像、视频等多种模态的模型,支持多种任务和指标。框...
GLM-Edge – 智谱开源的端侧大语言和多模态系列模型
GLM-Edge是什么 GLM-Edge是智谱开源的一系列端侧部署优化的大语言对话模型和多模态理解模型,包含GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM...
TryOffDiff – AI虚拟试穿技术,单张穿着者图片生成标准化服装图像
TryOffDiff是什么 TryOffDiff(VTOFF)是基于扩散模型的新型虚拟试穿技术,用高保真服装重建实现虚拟试穿,专注于从单张穿着者照片生成标准化的服装图像。与...
AI智写 – AI标书编写平台,5分钟内完成20万字投标方案
AI智写是什么 AI智写是AI标书编写平台,专注于自动化和优化标书编写流程。用户提供基本的招标要求,AI智写能迅速生成专业且个性化的投标方案。AI智写覆盖全行...
GLM-PC – 智谱推出的电脑智能体,基于CogAgent视觉多模态模型构建
GLM-PC是什么 GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务,如文档处理、网...
Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术
Generative Omnimatte是什么 Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术,能将视频智能分解为多个透明背景的RGBA图层,每个图层对应...
Voice-Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是什么 Voice-Pro是开源的多功能音频处理工具,集成语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种功能。工具...
Attune Health – AI健康管理应用,面部扫描监测血压、血氧饱和度、心率等多项体征
Attune Health是什么 Attune Health是基于人工智能技术的健康管理应用,通过智能手机摄像头实现无接触的生命体征测量。用户只需通过简单的面部扫描,可快速测...
Coral AI – AI文档分析平台,支持多语言跨文档的智能搜索、摘要和翻译
Coral AI是什么 Coral AI是 AI文档分析平台,专注于PDF文档的智能搜索、摘要和翻译。通过AI技术,支持超过90种语言,能快速理解文档内容,提供即时的文档摘要...
OmniMind – 低代码AI平台,简单操作创建和部署定制化AI解决方案
OmniMind是什么 OmniMind是创新的低代码AI平台,支持用户通过简单的操作创建和部署定制化的人工智能解决方案。平台支持个性化知识库的构建,能处理和分析来自...