Poify – 快手推出的AI电商营销工具,一键AI模特虚拟试衣

Poify是什么 Poify是快手推出的AI电商营销工具,帮助商家和创意工作者快速生成高质量的图片内容。包括 AI 模特试衣、换背景影棚风格、局部重绘等,能满足商家...

Scenethesis – 英伟达推出的交互式3D场景生成框架

Scenethesis是什么 Scenethesis 是 NVIDIA 推出的创新框架,用在从文本生成交互式 3D 场景。框架结合大型语言模型(LLM)和视觉感知技术,基于多阶段流程实现...

Mogao – 字节跳动Seed团队推出的多模态理解与生成统一架构

Mogao是什么 Mogao是字节跳动Seed团队推出的交错多模态生成全基础模型。在架构上采用了双视觉编码器,结合变分自编码器(VAE)和视觉变换器(ViT),能更好地...

FlowGram – 字节跳动开源的可视化工作流搭建引擎

FlowGram是什么 FlowGram是字节跳动开源的基于节点编辑的可视化工作流搭建引擎,帮助开发者快速构建固定布局或自由连线布局的工作流。支持两种布局模式:固定...

SuperEdit – 字节跳动等机构推出的图像编辑方法

SuperEdit是什么 SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精...

OpenEvidence – AI医学知识助手,提供临床问题解答、症状分析

OpenEvidence是什么 OpenEvidence 是 AI 医学知识助手平台。基于小型专业化模型和多模型集成架构,提供精准的临床问题解答、症状分析、治疗建议及医学知识更...

FunGPT – 开源AI情感调节项目,基于InternLM2.5系列模型

FunGPT是什么 FunGPT 是基于 InternLM2.5 系列大模型开发的开源项目,专为情感调节设计。具备两大核心功能:甜言蜜语模式和犀利怼语模式。甜言蜜语模式能用温...

makeAd – AI广告创意平台,自动创建符合品牌调性的视觉内容

makeAd是什么 makeAd 是基于人工智能的广告创意平台,专为品牌和营销人员设计,快速生成高质量的广告素材。核心功能包括智能场景生成、AI 驱动的产品模型图创...

Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型

Parakeet TDT 0.6B是什么 Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别(ASR)模型。采用FastConformer编码器和TDT解码器架构,通过预测文本标记及其持...

VITA-Audio – 开源的端到端多模态语音大模型,低延迟、推理快

VITA-Audio是什么 VITA-Audio 是开源的端到端多模态语音大模型,具有低延迟、推理速度快的特点。通过轻量级的多模态交叉标记预测(MCTP)模块,可在首次前向...
1 101 102 103 104 105 470