标签:AI工具

NVILA – 英伟达推出的视觉语言大模型

NVILA是什么 NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段...

MEMO – 音频驱动的生成肖像说话视频框架,保持身份一致性和表现力

MEMO是什么 MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致性...

SNOOPI – AI文本到图像生成框架,提升单步扩散模型的效率和性能

SNOOPI是什么 SNOOPI是创新的文本到图像生成框架,基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB(适当指导 – SwiftBrush)和NASA(负向...

clone-voice – 开源的声音克隆工具,支持16种语言

clone-voice是什么 Clone-voice是开源的声音克隆工具,基于深度学习技术分析和模拟人类声音,实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在...

GLM-4V-Flash – 智谱 AI 推出的首个免费多模态模型API

GLM-4V-Flash是什么 GLM-4V-Flash 是智谱AI推出的首个免费多模态模型API,GLM-4V-Flash 模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像...

办公小浣熊2.0 – 商汤科技推出的AI办公助手,一站式创作空间

办公小浣熊2.0是什么 办公小浣熊2.0是商汤科技推出的AI办公助手,是办公小浣熊的升级版,办公小浣熊2.0采用“浣熊三步法(PAW)”——规划(Plan)、分析(Analyz...

One Shot, One Talk – 中科大联合香港理工推出的动态图像生成技术

One Shot, One Talk是什么 One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的...

Aurora – xAI为Grok AI助手推出的新图像生成模型

Aurora是什么 Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像(如米老鼠...

MiniMax Audio – MiniMax推出的AI语音合成工具

MiniMax Audio是什么 MiniMax Audio是MiniMax推出的AI语音合成工具,能创建逼真的多语言、多声音和多情感的语音。支持文本转语音(TTS),能将文本快速转换为...

面试通 – AI面试辅助工具,支持算法、笔试、简历等多种面试模式

面试通是什么 面试通是基于AI技术的面试辅助工具,专为求职者设计,提高面试成功率。面试通能实时识别面试官的问题,快速生成专业回答,让求职者在面试中表现...
1 215 216 217 218 219 400