AI工具 | 第 148 页

Qwen2.5-VL – 阿里通义千问开源的视觉语言模型

Qwen2.5-VL是什么 Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型，具有3B、7B和72B三种不同规模。模型在视觉理解方面表现出色，能识别常见物体，分析...

AI工具

10个月前

Minduck Discovery是什么 Minduck Discovery是创新的AI思维导图搜索工具。通过交互式思维导图，将复杂的知识结构化呈现，帮助用户高效探索和理解信息。用户只...

AI工具

10个月前

Janus-Pro是什么 Janus-Pro是 DeepSeek 推出的开源AI模型，支持图像理解和图像生成，提供 1B 和 7B 两种规模，适配多元应用场景。通过改进的训练策略、扩展的...

AI工具

10个月前

DiffuEraser是什么 DiffuEraser是基于稳定扩散模型的视频修复模型，以更丰富的细节和更连贯的结构填充视频中的遮罩区域。模型通过结合先验信息来提供初始化和...

AI工具

10个月前

魔力设是什么魔力设是高效便捷的在线设计平台，专注于为用户提供一站式的设计解决方案。集成了丰富的版权素材库和强大的在线编辑功能，涵盖海报、展板、邀请...

AI工具

10个月前

Recap是什么 Recap是基于先进大型语言模型（LLMs）开发的智能工具，旨在帮助用户快速理解和总结各类内容。基于强大的AI技术，能处理文本、网页、PDF、视频，...

AI工具

10个月前

Qwen2.5-1M是什么 Qwen2.5-1M是阿里通义千问团队推出的开源模型，支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两...

AI工具

10个月前

TeleAI-t1-preview是什么 TeleAI-t1-preview是中国电信人工智能研究院发布的“复杂推理大模型”，具备强大的逻辑推理与数学推导能力。通过强化学习训练方法，引...

AI工具

10个月前

Baichuan-Omni-1.5是什么 Baichuan-Omni-1.5是百川智能开源的全模态模型。支持文本、图像、音频和视频的全模态理解，具备文本和音频的双模态生成能力。模型在...

AI工具

10个月前

VideoLLaMA3是什么 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型，专注于图像和视频理解。基于 Qwen 2.5 架构，结合了先进的视觉编码器（如 SigLip）和强...

AI工具

10个月前