7 个真实案例,看懂 Nano Banana 的文字生成和复杂改图
一篇案例驱动的实用指南:通过 Google 公开案例,讲清楚 Nano Banana 在文字生成、包装翻译、多图合成、灯光改造这些任务上到底强在哪,提示词又该怎么写。
7 个真实案例,看懂 Nano Banana 的文字生成和复杂改图
很多 Nano Banana 教程的问题,不是写得不够长,而是写得太空。
尤其是“文字生成”和“复杂场景编辑”这两个主题,最怕泛泛而谈。你真正需要看的,不是功能列表,而是真实案例里到底成功了什么、提示词怎么写、什么写法更稳。
下面这些案例都来自 Google 公开的 Nano Banana 示例。它们反复说明一件事:Nano Banana 不是单纯“会生成图”,而是在你把文字要怎么呈现、哪些结构不能动、场景里到底允许改什么,说清楚之后,才会表现得很强。
这篇文章真正想解决什么
把这些案例放在一起看,会反复出现几条规律:
- 文字越短,结果越稳
- 文字任务里,位置、风格、对比度最好一起写
- 复杂改图里,哪些元素锁死不动,最好先说清楚
- 大场景编辑如果能拆成几条具体动作,稳定性会明显提高
只要抓住这四条,Nano Banana 就会比“凭感觉乱写 prompt”好用很多。
案例 1:把一张照片直接变成故事板

来源:Google《Introducing Nano Banana Pro》
Prompt 核心:
把这个场景做成一页故事板。
为什么这个案例重要:
- 输出不只是图片,而是一个有结构的视觉文档
- 模型需要同时处理分镜、标签文字、统一画风
- 输入图把主体锁住了,不是完全从零乱生成
可复用结论:
如果你想让图里出现可读文字,最好让输出格式本身就很明确,比如故事板、信息图、海报、菜单、包装稿。这比一句“帮我把文字做漂亮”稳得多。
案例 2:让文字长在场景里,而不是后贴上去

来源:Google《Introducing Nano Banana Pro》
Prompt 核心:
生成一条柏林街景,阳光明亮、阴影分明。街边的老房子要巧妙地长成 “BERLIN” 这几个字,颜色用蓝、红、白、黑。但这些房子依然要看起来像房子,字形只是微妙地藏在建筑里。
为什么这个案例成立:
- 文字很短
- 场景逻辑很清楚
- prompt 同时写了两个约束:既要拼出单词,又不能失去“房子”的感觉
可复用结论:
如果你想让文字嵌进建筑、产品、地形、物体里,一定要两头都写:它要拼成什么字,它本体还必须像什么。
案例 3:把文字当成设计对象来做

来源:Google《Introducing Nano Banana Pro》
Prompt 核心:
做一张醒目、有冲击力的 “TYPOGRAPHY” 设计图,背景是带纹理的米白色。字母要粗、窄、块面感强,通过亮蓝和亮粉两层重叠形成 3D 效果,并带有半色调印刷质感。画面比例为 16:9。
为什么这个案例成立:
- 单词短,容易控
- 字体风格、肌理、构图都写清楚了
- 这已经不是“生成文字”,而是“生成一张有明确 art direction 的字海报”
可复用结论:
做海报标题、封面图、横幅字时,不要只写内容本身。字体气质、颜色关系、纹理效果、比例构图,都应该写进去。
案例 4:只翻译包装文字,不乱动品牌结构

来源:Google《Introducing Nano Banana Pro》
Prompt 核心:
把这三个黄蓝色饮料罐上的英文全部翻译成韩文,其他部分保持不变。
为什么这个案例成立:
- 任务边界非常窄
- 保护项很清楚:罐体形状、配色、版式、品牌识别都不能乱
- 模型不需要重做整张图,只要改语言层
可复用结论:
这是 Nano Banana 很强的一类任务:保留版式,只替换语言。如果你要做包装本地化、海报翻译、KV 多语版本,最好不要把“翻译”和“重新设计”混在一轮里做。
案例 5:多张参考图合成一个完整场景

来源:Google《Introducing Nano Banana Pro》
Prompt 核心:
把这些图片合成为一张构图合理、具有电影感的 16:9 画面,并把模特身上的裙子替换成参考图里的裙子。
为什么这个案例成立:
- 所有素材都是离散输入,不是让模型胡乱补
- 关键变更被点得很具体:换裙子
- 最终目标也很明确:电影感构图,16:9 横幅
可复用结论:
场景一复杂,prompt 最好按结构写:
把这些素材合成一个场景。保持 [核心主体] 不变。替换 [具体元素]。最终做成 [目标构图或目标场景]。
这通常比一大段堆满形容词的 prompt 稳得多。
案例 6:只改时间和氛围,不推翻整张图

来源:Google《Introducing Nano Banana Pro》
Prompt 核心:
把这个场景改成夜晚。
为什么这个案例成立:
- 指令非常简单
- 构图已经锁定
- 改的是时间、光线、氛围,不是主体身份
可复用结论:
Nano Banana 很适合这种“只动一层”的任务:改昼夜、改光线、改景深、改材质、改色调。结构不动,结果通常更稳。
案例 7:用局部光线把画面气质彻底拉开

来源:Google《Introducing Nano Banana Pro》
Prompt 核心:
生成一张带强烈明暗对照效果的人像。这个男人原本的五官和表情要保持不变。加入从上方偏左打下来的强方向光,让脸上形成深而硬的阴影,只有眼睛和颧骨被少量光线照亮。
为什么这个案例成立:
- 身份锁得很清楚
- 光源方向写得很清楚
- 所谓“电影感”不是空说,而是落成了具体的光线行为
可复用结论:
做人像气质改造时,保留身份 + 明确光源方向 + 明确哪里亮、哪里暗,是一个非常稳的公式。
这些案例对“文字生成”说明了什么
Nano Banana 在文字任务上通常会在这些情况下更稳:
- 文字本身尽量短
- 重要文字最好加引号
- 说明文字应该出现在哪
- 说明文字应该长什么样
- 如果是在已有设计上改字,要把版式保护住
弱一点的写法:
做一张酷一点、带点字的海报。
更强一点的写法:
做一张 16:9 的赛博朋克雨夜海报。标题写成 “URBAN EXPLORER”,放在画面顶部,用大号白色无衬线字体。底部加一行小字 tagline。文字要清晰、可读、对比强。
两者的差别,不是文采,而是控制力。
这些案例对“复杂改图”说明了什么
多图合成、复杂场景编辑,本质上也遵循同一套逻辑:
- 先锁定什么不能动
- 再点名什么必须改
- 再说最终想要什么构图
- 不要把互相无关的目标一股脑塞进同一轮里
弱一点的写法:
把它改得更有电影感、更高级、更时尚、更真实、更艺术一点。
更强一点的写法:
保持人物身份不变。把背景替换成沙漠时装场景。把参考裙子和道具整合进同一个 editorial 画面里。使用自然光,构图为 16:9。
这样模型才知道,什么要保留,什么要替换,最后要落成什么。
一个能反复复用的 Prompt 公式
做文字任务和复杂改图时,这个结构通常都很好用:
保持 [锁定元素] 不变。修改 [具体可编辑元素]。把文字呈现为 [文案 + 位置 + 风格]。最终做成 [场景或版式]。不要改动 [需要保护的细节]。
例如:
保持罐体形状、品牌配色和版式不变。把可见的英文全部翻译成韩文。文字要清晰、粗体、易读。不要改动 logo 位置和插画风格。
保持这个人的身份特征不变。把光线改成从左上方打下来的高对比度明暗对照。表情保持不变。不要改变脸部比例。
最常见的 5 个错误
1. 一上来就塞太多字
Nano Banana 虽然会做文字,但短文案依然比大段正文稳得多。
2. 只写“有文字”,不写位置
“加点文字”很弱,“标题放顶部,用粗的窄体无衬线”就强很多。
3. 把翻译和重设计混在一起
如果你要做包装翻译,就先只做翻译,不要同一轮再要求换风格、换材质、换构图。
4. 没写清楚哪些不能动
如果人脸、logo、包装外形、版式、身份一致性很重要,就一定直接写出来。
5. 把复杂改图当成滤镜
场景越复杂,越要写清楚画面逻辑:谁保留、谁替换、加什么、最后是什么构图。
快速检查清单
- 文字是不是足够短,能稳定渲染?
- 有没有写清楚文案、位置和风格?
- 有没有写清楚什么必须保持不变?
- 有没有把真正需要修改的那一层单独指出来?
- 有没有明确最终格式,比如海报、故事板、产品图、时尚 editorial?
- 有没有避免把互不相关的要求塞进一条 prompt?