Gemini 2.5 Flash Image – 谷歌推出的图像生成和编辑模型

AI工具11个月前发布

119 0 0

Gemini 2.5 Flash Image是什么

Gemini 2.5 Flash Image（代号nano banana）是谷歌 AI Studio推出的先进图像生成与编辑模型。模型能保持角色在不同场景中的一致性，支持通过自然语言进行精准图像编辑，如模糊背景、消除污渍等。模型结合Gemini的世界知识，能理解手绘图表并执行复杂指令。模型能融合多张图像，实现无缝拼接。用户可通过 Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 等平台使用，Gemini API的定价是每百万输出token 30美元，生成一张图片大约消耗成本约为0.039美元。模型生成的图片带有隐形数字水印，便于识别AI创作内容。

Gemini 2.5 Flash Image的主要功能

保持角色一致性：能将同一角色置于不同环境中，或从多角度展示同一产品，保持主体一致。
自然语言图像编辑：通过简单指令实现精准局部修改，如模糊背景、消除污渍、改变姿势等。
现实世界知识应用：借助Gemini的知识库，理解手绘图表，回答现实问题，执行复杂指令。
多图像融合：支持将物体放入新场景或用新风格渲染图像，仅需一条提示指令完成无缝拼接。

Gemini 2.5 Flash Image的项目地址

项目官网：https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/
体验地址：https://ai.studio/banana

如何使用Gemini 2.5 Flash Image

访问Google AI Studio：访问 Google AI Studio官网 https://aistudio.google.com/prompts/new_chat。
选择模板应用：根据需要选择一个模板应用，例如角色一致性展示、基于提示词的图像编辑、互动教育应用、图像融合等。
上传图片或输入提示词：根据模板应用的要求，上传图片或输入自然语言提示词。
生成或编辑图像：点击生成或编辑按钮，模型将根据输入生成或编辑图像。
保存或分享：生成的图像能保存到本地，或者直接从Google AI Studio分享。