gpt-4o-mini-transcribe – OpenAI 推出的语音转文本模型

gpt-4o-mini-transcribe是什么 gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe 基于 GPT-4o-m...

Agent TARS – 字节跳动开源的多模态 AI Agent 项目

Agent TARS是什么 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执...

福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型

福棠·百川是什么 福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见病及...

Tesseract – 开源的光学字符识别引擎,支持多种语言文字识别

Tesseract是什么 Tesseract 是开源的光学字符识别(OCR)引擎,Google 赞助开发的高精度免费的应用。支持多种语言,能识别 JPEG、PNG、TIFF 等常见图像格式中...

GPT-4o mini TTS – OpenAI 推出的文本转语音模型

GPT-4o mini TTS是什么 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令控制语音的语调、...

gpt-4o-transcribe – OpenAI 推出的语音转文本模型

gpt-4o-transcribe是什么 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差...

Kimi招聘助手 – 月之暗面推出的飞书字段捷径AI工具

Kimi招聘助手是什么 Kimi 招聘助手是月之暗面推出的飞书字段捷径AI工具,为 HR 提供高效招聘支持。通过强大的文本分析能力,实现“简历信息提取-候选人匹配评...

HuggingSnap – Hugging Face 推出的 AI 助手,能离线识别视觉内容

HuggingSnap是什么 HuggingSnap 是 Hugging Face 推出的 AI 助手应用,基于轻量级多模态模型 SmolVLM2,参数规模从 2.56 亿到 22 亿不等,能离线处理图像、视...

Uthana – AI 3D角色动画生成平台,文字描述角色动作生成逼真动画

Uthana是什么 Uthana 是专注于3D角色动画生成的AI平台。平台基于简单的文字描述、参考视频或动作库搜索,快速为用户生成逼真的动画,支持适配任何骨骼结构的...

OpenJobs AI – AI求职平台,精准推荐匹配的职位

OpenJobs AI是什么 OpenJobs AI是AI求职平台,基于AI技术为用户提供高效便捷的求职服务。用户用自然语言输入职位需求,如岗位类型、地点、薪资要求等,平台精...
1 200 201 202 203 204 520