标签:AI工具

NoteLLM – 小红书推出的笔记推荐多模态大模型框架

NoteLLM是什么 NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM)的...

D-DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

D-DiT是什么 D-DiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。模型结...

UniTok – 字节联合港大、华中科技推出的统一视觉分词器

UniTok是什么 UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器,能同时支持视觉生成和理解任务。基于多码本量化技术,将视觉特征分割成多...

kimi-thinking-preview – 月之暗面推出的多模态思考模型

kimi-thinking-preview是什么 kimi-thinking-preview 是月之暗面推出的多模态思考模型,具备深度推理能力,擅长解决复杂问题,如代码、数学和工作难题。模型...

Voila – 开源端到端语音大模型,实现低延迟语音对话

Voila是什么 Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户...

ReasonIR-8B – Meta AI 推出专为推理密集型检索任务设计的模型

ReasonIR-8B是什么 ReasonIR-8B 是 Meta AI 推出的专为推理密集型检索任务设计的模型。基于 LLaMA3.1-8B 训练,采用双编码器架构,将查询和文档分别编码为嵌...

ACE-Step – ACE Studio联合阶跃星辰开源的音乐生成基础模型

ACE-Step是什么 ACE-Step 是 ACE Studio 和 StepFun 联合推出的开源音乐生成基础模型,基于创新的架构设计实现高效、连贯且可控的音乐创作。ACE-Step结合扩散...

3DV-TON – 阿里达摩院联合浙大等推出的视频虚拟试穿框架

3DV-TON是什么 3DV-TON(Textured 3D-Guided Consistent Video Try-on via Diffusion Models)是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模...

Text2CAD – AI辅助设计平台,将文本描述设计要求转为高精度CAD模型

Text2CAD是什么 Text2CAD 是创新的在线平台,通过人工智能技术将自然语言描述快速转化为专业 CAD 模型。用户只需用简单的语言描述设计想法,如尺寸、形状和功...

Omni Reference – Midjourney V7推出的图像参考功能

Omni Reference是什么 Omni Reference 是 Midjourney 推出的全能参考功能,支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Referenc...
1 35 36 37 38 39 400