Manzano – 苹果推出的图像理解和生成模型

AI工具10个月前发布

87 0 0

Manzano是什么

Manzano是苹果公司推出的新型多模态大语言模型（LLM），能同时实现图像理解和图像生成的统一。模型通过混合视觉分词器（hybrid vision tokenizer）将图像转化为连续的嵌入向量用于理解任务，及离散的图像标记用在生成任务。Manzano的核心是自回归的LLM解码器，能预测文本和图像标记。Manzano配备一个扩散解码器（diffusion decoder），用在将生成的图像标记转化为像素级别的图像。使Manzano在理解任务和生成任务上都表现出色，同时在模型规模扩大时，性能会相应提升。

Manzano – 苹果推出的图像理解和生成模型

Manzano的主要功能

图像理解：模型能理解图像内容，回答与图像相关的问题。

# AI工具 # [db:标签]

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

AI Agent替代传统软件开发团队 GitLab Duo平台开启公测

97 0

LONGLIVE – 英伟达等推出的交互式长视频生成框架

74 0

OpenJudge – 阿里云和通义开源的AI应用自动化评测框架

85 0

Take-Two CEO 泽尔尼克：AI 无法创造爆款游戏，真正的创造力属于人类

64 0

ProWritingAid – AI英文写作工具，提供语法检查和优化建议

67 0

ABB扩大中国机器人布局，推出三款新品助力中企发展

146 0

AI工具集平台！汇聚超2000+免费AI工具，涵盖AI写作、AI编程、AI绘画、AI论文、AI视频、AI生图、AI办公、AI学习、AI生成、agent等全场景工具。每日更新热门 AI工具，助您快速找到提升办公、创作、学习效率的实用工具！

按下Ctrl+D或⌘+D 感谢收藏 ai-gjj.com

友链申请免责声明广告合作关于我们站点地图提交AI工具

Copyright © 2026 AI工具集桂ICP备2025062026号