刚过去这个一周 Nano Banana 是彻底火了,到处都是香蕉,甚至谷歌自己都没招了,AI Studio 上面名字直接按 Nano Banana 展示了。
藏师傅周末这两天也一点没闲着,在周三发完教程之后,又探索出来了超多的玩法,流量都非常好,大家都很喜欢,推特、小红书和抖音都疯狂涨粉。
这些地方的比较零散,这里就整理一下,顺便把过程复杂的写的详细点,方便大家收藏和学习。
可能有很多朋友说咋直接就 02 了,我 01 呢?咱们第一篇教程就算 01 了,感兴趣可以这里看
我们话不多说直接开始今天的教程。
首先是大家都喜欢的 AI 书法舞娘这个点子。
起因是我看到一个 B 站 UP 自己用姿势模仿书法汉字去跳舞,然后就想 Nano Banana 也可以参考姿势生成动作那是不是也可以。
然后试了一下没想到真行,于是就让他将用来参考的书法字体也放到图像里,刚好跟舞娘的影子融合,看起来非常有意境。
首先我们需要生成基础的图片,这里我用的即梦图片 3.1 模型,提示词是:
“CG厚涂风格,角色扮演,精致五官,瓷白肌肤,卡姿兰大眼睛,灵动有神,俏皮狡黠。
超真实肤质:湿润透亮肌理,次表面散射光效,营造出梦幻、朦胧的低饱和度氛围,流体质感显著,以柔光效果呈现,运用极致厚涂手法,细节刻画精致,有琉璃质感,画面是一位妖冶少女,她冷白的皮肤,有着黑色的头发,刘海自然垂落,头上满是金银发饰进行装饰。身着由亮片纱、亮片丝绒、欧根纱、花边、流苏、刺绣和印花组成的古装,玄青色绸缎搭配银色古装,古装有着繁复的垂坠褶皱、华丽的饰品和传统衣服暗纹,少女的神态楚楚可怜又透着温婉
自由视角,线性构图,人物全身立体拍摄,羞涩面对镜头,全身照,远景全身像
强对比戏剧光,顶光主光源,着重刻画首饰细节,首饰多用各色宝石,多宝步摇,如懿传风格,玄色墨狐披帛”
有了基础的图片之后我们需要有一些历史知名书法字帖的截图,字型最好简单一些,复杂的估计别说 Nano Banana 真人都够呛。
我这里放几个大家可以用这个参考。
然后就是把书法图片和用于参考的人像一起发给 Nano Banana 了,这里需要注意的是 Nano Banana 会根据你上传图片的比例来生成图片,所以建议生成图片前将两张图片调整为一样的比例,不然后面生成视频会很麻烦。
这里让 Nano Banana 改图的提示词为:
“将图 1 中的人物改为与图 2 字符相似的像舞蹈的全身姿势,生成的图片不要有字符,必要时可以用配饰辅助,图片背后要有类似图 2 字符的投影”
注意,如果你用 Gemini 生成可以用中文提示词,如果用的 AI Studio 建议用英文提示词。
这样按顺序用提示词生成之后我们就得到了多张有字体的舞蹈姿势,然后在生成视频的时候前后都加上一张原来输入的特写图,这样获得了一套无限循环的视频分镜图片了。
接下来我们要做的就是将这些图片按顺序用可灵 2.1 首尾帧生成视频,如果你搞不懂的话可以看我下面这个顺序示意图。
每次首尾帧生成的时候可以用我之前探索的提示词来生成对应的提示词,将这套提示词和首尾帧图片发给任何一个多模态模型就行,我这里建议还是用 Gemini 2.5 PRO AI Studio 依然可以白嫖。
藏师傅的首尾帧提示词生成提示:
你是一位顶尖的创意视频导演和VFX(视觉特效)概念艺术家。你的任务是为AI视频生成模型设计一个从【起始帧】到【结束帧】的转场过程。
你的核心目标是:构思并用一段话清晰、具体地描述这个动态视觉变化。
在构思时,请遵循以下创作框架:
第一步:分析差异 快速判断【起始帧】和【结束帧】的差异程度。
A类 - 关联性强: 主体或场景基本一致,只是状态、风格或环境发生改变(例如,同一个人换了衣服,同一个场景从白天到黑夜)。
B类 - 差异巨大: 主体和场景完全不同(例如,一只猫在客厅 → 一艘飞船在太空)。第二步:选择转场策略
如果属于 A类,优先采用“原地演变”的策略。让变化直接发生在主体和环境上,尽量不使用或只使用微弱的摄像机移动。
如果属于 B类,采用“运镜驱动转场”的策略。必须使用一种明确的摄像机移动(如推、拉、摇、移、旋转)来引导过渡,让镜头运动成为连接两个不相干画面的桥梁。
第三步:构思具体变化(从以下工具箱中选择组合)
主体变化: 主体如何改变?(形态变化、材质替换、服装更替、分解重组、消失或出现)。
环境变化: 背景如何改变?(时间流逝、季节更替、空间切换、从现实变为幻想)。
风格/特效变化: 用什么视觉风格或特效来包装这个过程?(例如,画面逐渐像素化后重组、被火焰/水流吞噬后显现、转变为水彩/油画风格、出现光效粒子)。
输出规则:
将你的最终构思整合为一个连贯的段落。
描述要具体、直接,充满画面感。专注于“我们看到了什么”,而不是“我们感觉到了什么”。
严格遵守你在第二步中选择的摄像机移动策略。
避免使用模糊的比喻和过于文学化的修辞。
现在,请根据我提供的【起始帧】(图片A)和【结束帧】(图片B),生成你的转场描述。
最后我们只需要将生成的所有视频按顺序放在剪映或者其他剪辑软件里面,如果你觉得某些地方过于慢了可以适当加速让它跟音乐卡上点,最后导出就行。
另一个大家想要我出教程的是将建筑平面图变成可以预览的 3D 网页,先来看看效果,支持自由旋转,而且还可以自己添加预览点,点击预览点就会出现对应位置的渲染图。
这个项目需要涉及到的软件比较多,我们一步一步来。
首先需要找一张商品房的平面图,然后在 Nano Banana 输入提示词:“Help me convert this residential floor plan into an isometric photorealistic 3D rendering of the house.”
就将这个平面图变成了 3D 的家装俯视渲染图。
当然Nano Banana 甚至可以基于这个渲染好的俯视图生成指定位置的正常渲染图。
输入3D 俯视渲染图以及提示词:“Help me generate a realistic photo looking from the dining table towards the bathroom, which must comply with the house layout in the design plan, and appropriate decorations can be added.”
可以看到主卧这里的布局是对的,客厅的空间有点问题,不过可以重新抽卡就能对。
另外你可能对他的家具样式不太满意,那就可以找一张你满意的家具图进行替换新的家具图样式也可以保持的很好。
上面我们已经获得了需要用来生成 3D 模型的俯视图,这里建议将生成的 3D 俯视图先用放大模型放大一下,转 3D 的时候生成的模型精细度会高一些。
我这里用的是影眸的 Hyper3d(https://hyper3d.ai/rodin/)来生成模型的,你也可以用其他的类似产品试试,我试了几个在这张图上影眸的效果好点。
使用很简单,上传你的图片然后点生成,之后一直下一步就行,其他的我也不懂,一般没问题。
最后生成完看着没问题的话就可以导出 3D 文件了,我这里导出的是 GLB 格式,下载下来会有两个 GLB 文件 ,shaded 后缀这个不依赖环境光也好看,可以先选这个。
之后就是写前端代码,让 3D 模型可以在网页展示了,这里我用的 Cursor ,先是跟 GPT-5 讨论了一下技术方案和步骤,然后又去 Cursor 去分步输入 GPT-5 给的提示词,最后有错误让他修复一下。
当然我昨天试了一下新出的 Kimi K2 0905 模型在 Claude Code 里面一句话也可以搞定。
只需要先把素材模型文件、图片,放在文件夹里面,然后在这个文件夹启动 Claude Code,直接跟他说“帮我用r3f生成一个展示文件夹下3D模型的网页,同时点击模型的具体位置会弹窗出现文件夹下的图片”
然后他就应该可以一次性帮你搞定,搞不定的话应该也是启动服务之类的问题,让他修复就好。
然后就可以录视频展示 Demo 了,其实最理想的情况是,加上 Nano Banana 的 API,实现点哪里哪里实时生成预览图,实现方式也不难,直接截图并标记点击位置,然后跟提示词一起传给 Nano Banana 就行。
上次教程发出去之后大家都觉得我用 Nano Banana 生成的封面很搞,事实上这个封面的点击率确实比我平时的高很多。
以往这种封面必须上 PS,因为即使最大的广角镜头也没办法有这么夸张的畸变,更别说在想叫上写字了。
说一下封面是怎么做的,首先我们需要自己拍一张照片,要是你有广角镜头的设备拍摄就更好了,比如运动相机之类的,我用的 Insta 350 的 Ace Pro 2.
然后把这张照片发给 Nano banana ,跟他说提示词就行,比如我这里就让他“帮我手上生成一个巨大的香蕉,上面还写着 Nano Banana。”
这里需要注意的是,需要让他把前景生成的物品变得非常夸张的大,我上一篇内容的图片也是这样搞的,生成图片之后找个抠图工具扣完图,加上背景和文字封面就搞定了。
Nano Banana 本身是有世界知识的,所以可以实现一些非常离谱的操作。
比如下面左边的根据照片反推拍照人的位置,以及右边的根据地图截图的位置标记生成对应的照片,在一些非常著名的地标照片甚至可以保证拍摄方向大致一致。
提示词 1:Convert the photo to a top-down view and mark the location of the photographer.
提示词 2:draw what the red arrow sees
Nano Banana 改车也是一把好手,基本指哪打哪,把车辆白模或者你自己车的照片给他,然后给他一个涂装参考图,输入提示词“帮我用 Nano Banana 分别为这辆车改为第二张图的配色,然后将轮毂改为放射状,然后再在侧面增加黄色拉花,然后将车放在一个有非常好光照的车库中,最后将车变成正在赛道行驶。以上的每次改动都生成一张图片,不要一次完成。”就能搞定。
然后我们还能用上面第一个案例的的首尾帧视频生成方式变成一个完整的改车动画。
得益于 Nano Banana 强大的一致性保持能力,你可以让他帮你基于你冰箱里面的剩菜变成菜谱图片,然后还能给出对应的展示图。
提示词1:Turn the ingredients in the picture into a complete step-by-step recipe infographic, using a top-down perspective. Present it in a minimalist style on a white background. Include labeled photos of the ingredients, use dashed lines to connect icons representing the preparation steps, and display a photo of the final plated dish at the bottom of the infographic,At the same time, remove the background from the food items that have a background in the image and place the food on a white background.
提示词 2:Help me place these ingredients and cooking results on a table to create a very beautiful food presentation image,Remove text
Nano Banana 当然也可以把建筑转成等距风格的图标,不同的是他不止可以转地标,你随手拍的任何建筑都可以转换,这个比 4o 要好点。
Convert the photo of this building into a rounded, cute isometric tile 3D rendering style, with a 1:1 ratio,To preserve the prominent features of the photographed building
用 Nano Banana 将你喜欢喝的饮品变成抱枕收藏起来!不管是奶茶还是咖啡,还有其他你喜欢的物品,提示词是通用的 ,感觉都可以做个应用了,我发出去以后还看到有转猫猫狗狗的。
Design the main object in the photo as a soft, rounded, and airy plush balloon or inflatable toy.
Using smooth matte fabric texture, Do not have a plastic feeling. complemented by subtle fabric wrinkles and stitching to emphasize its inflated effect. The shape should be slightly irregular and soft, with gentle shadows and lighting to highlight its volume and realism. Place it on a clean, minimalist background (light gray or light blue) to maintain a playful sculptural aesthetic.
这个是大聪明用在 Lovart 上的提示词我给改了一下,让他可以直接在 Nano Banana 上面出多张,而且还固定和优化了排版,搭配 LLM 可以做知识卡片。
Help me generate multiple doodle-style images to explain the concept of "futures" to middle school students. The images should have a consistent colorful, thick-pencil hand-drawn style, be rich in information, feature English text, use solid color backgrounds, have outlines around the cards, and include uniform titles, similar to a PowerPoint presentation.
当然你要懒得自己弄的话我也做了一个网页帮你玩,还加上了 3:4 图片导出,直接就能发小红书了,可以在这里试试:https://yw.app/hZtZkst
前几天发现桌面手办发展出了 3D 打印机版本,懒得找词了,就自己搞了一套,注意更改里面的汽车名字。
Please transform this car rendering into a collectible figurine.
Behind it, place a figurine box printed with the car's image and the name "Xiaomi YU7." Next to it, add a high-end 3D printer that is currently printing the figurine. In front of the figurine box, add a round plastic base for the figurine to stand on.
The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.
结合了一下现在最火的两个玩法,一次性生成动漫图真人 Cos 拿着手办的样子。其他装备类展示也可以这么玩,比如你展示自己的自行车手办。
Generate a real-life photo of a cosplayer portraying this character, with highly realistic skin texture. The cosplayer's hairstyle, accessories, and clothing must match the character's.
She is sitting at a desk, holding a figurine transformed from this anime character's image. The figurine should be very close to the camera, with extremely detailed features. On the table behind the cosplayer, place a printed box of the character's figurine.
Add a high-end 3D printer next to it, with a figurine being printed inside the printer. Set the entire scene in an indoor environment.
Nano banana 帮你预测随手拍的照片荒废 100 年的样子。
This photo shows what the place looks like 100 years later, abandoned and unmaintained.
变成视频之后表现力更强,更加直观,感觉可以做个小应用随手拍预览环境发展。
Nano Banana 生成图片本身的美学表现相对差点,但是只要垫图之后就可以保证效果,于是就搞了个新活。
你可以随便找几张你喜欢的无关图片,然后让他混合、脑补,他就会给你生成一个连续的故事分镜,比如输入图是下面这几张。
生成的 9 张连贯的分镜,主角选了上面第三张的角色,串联了多个场景,还加入了上面第五章的角色。
而且美学表现、场景、人物的一致性都可以保证。
然后直接可灵 2.1 首尾帧或者即梦的智能多帧就是一个视频了。
好了这就是这几天藏师傅的 Nano banana 玩法合集整理了,希望能对你有些启发,毕竟这些玩法未来可能不止可以用在 Nano Banana 模型上,他们在更强的模型想更有价值,这一天可能不会太远。
感谢各位,如果觉得对你有帮助可以帮我转发给你同样需要上流知识的朋友们,我们评论区见。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
AI辅助海报设计101例
已累计诞生 751 位幸运星
发表评论 为下方 7 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓