dots.vlm1 – 小红书hi lab开源的首个多模态大模型

AI工具1年前 (2025)发布

156 0 0

dots.vlm1是什么

dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于一个从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型（LLM），具备强大的视觉感知和文本推理能力。模型在视觉理解和推理任务上表现出色，接近闭源 SOTA 模型水平，在文本任务上也保持了竞争力。dots.vlm1 的视觉编码器 NaViT 完全从零开始训练，原生支持动态分辨率，在文本监督基础上增加了纯视觉监督，提升了感知能力。训练数据引入了多种合成数据思路，覆盖多样的图片类型及其描述，显著提升了数据质量。

dots.vlm1 – 小红书hi lab开源的首个多模态大模型

dots.vlm1的主要功能

强大的视觉理解能力：能准确识别和理解图像中的内容，包括复杂图表、表格、文档、图形等，支持动态分辨率，适用于多种视觉任务。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

HunyuanVideo 1.5 – 腾讯混元开源的轻量级视频生成模型

57 0

OpenAI 更新 ChatGPT 使用政策，禁止提供专业医疗、法律和财务建议

62 0

Qwen3-LiveTranslate – 阿里通义推出的全模态同传大模型

82 0

Runway入局游戏行业：推出能打造视频游戏的AI工具

91 0

智谱启动港A两地IPO进程，A股上市进程推进顺利

142 0

调查显示日本超半数游戏公司已使用 AI 技术，包括卡普空、世嘉等

70 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号