AI工具 | 第 37 页

NoteLLM – 小红书推出的笔记推荐多模态大模型框架

NoteLLM是什么 NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别，用大型语言模型（LLM）的...

AI工具

1年前 (2025)

D-DiT是什么 D-DiT（Dual Diffusion Transformer）是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型，能统一图像生成和理解任务。模型结...

AI工具

1年前 (2025)

UniTok是什么 UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器，能同时支持视觉生成和理解任务。基于多码本量化技术，将视觉特征分割成多...

AI工具

1年前 (2025)

kimi-thinking-preview是什么 kimi-thinking-preview 是月之暗面推出的多模态思考模型，具备深度推理能力，擅长解决复杂问题，如代码、数学和工作难题。模型...

AI工具

1年前 (2025)

Voila是什么 Voila 是开源的端到端语音大模型，专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力，能直接处理语音输入并生成语音输出，为用户...

AI工具

1年前 (2025)

ReasonIR-8B是什么 ReasonIR-8B 是 Meta AI 推出的专为推理密集型检索任务设计的模型。基于 LLaMA3.1-8B 训练，采用双编码器架构，将查询和文档分别编码为嵌...

AI工具

1年前 (2025)

ACE-Step是什么 ACE-Step 是 ACE Studio 和 StepFun 联合推出的开源音乐生成基础模型，基于创新的架构设计实现高效、连贯且可控的音乐创作。ACE-Step结合扩散...

AI工具

1年前 (2025)

3DV-TON是什么 3DV-TON（Textured 3D-Guided Consistent Video Try-on via Diffusion Models）是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模...

AI工具

1年前 (2025)

Text2CAD是什么 Text2CAD 是创新的在线平台，通过人工智能技术将自然语言描述快速转化为专业 CAD 模型。用户只需用简单的语言描述设计想法，如尺寸、形状和功...

AI工具

1年前 (2025)

Omni Reference是什么 Omni Reference 是 Midjourney 推出的全能参考功能，支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Referenc...

AI工具

1年前 (2025)