网上关于 MIdjourny 的教程很多,但是基本都是正向思维。正向思维导致的结果就是你提供的关键词,并不一定能够输出我想要的效果。
这篇文章主要从逆向思维来剖析,如何以图生图,对目标效果图进行反编译的方法,输出一套属于自己想要的效果图。
更多干货:
「逆向生成」无非就是站在巨人的肩膀上,对原有的目标创作效果进行反向编译,从而学习里面隐藏的技术点,供自己所用。
MIdjourny 提供了一个很好的工具指令就是 describe。上传一张目标效果图,解析一下即可生成 4 段文本分析。
记得上大学的时候学习 Flash,经常使用逆向反编译软件去看 Flash 背后的制作方法和逻辑。
1. 遇到问题
今天在网上看到了一个 MIdjourny 教程,然后我根据教程中提供的关键词,替换了其中的一段描述内容却没有得到我想要的效果。那么我就开始反思,反思给的关键词的通用性是否有问题,到底是哪个环节出现了问题?
我想要的目标效果是这样的:
此目标图选自教程页
但是我根据教程输出的效果是这样的:
我把其中的这段文字进行了修改:
改为了以下这段并得到了下图的效果,但是还不足以达到目标效果图的效果,于是我开始进行逆向操作。
2. 逆向生成并确定想要风格
我想要的效果是这样的:我自己尝试用文本进行了描述。草莓在水里浸泡着,色泽诱人的,水波纹,光影质感,有少许气泡。
为什么我要自己描述一下,因为这关系到我后面对于描述词中进行修改,我需要知道我想要的效果大体包含哪些。
我通过 MIdjourny 中的“/describe”命名,反向输出了四段描述并都输出了对应的效果。如下:
明显,我们能感受到,方案一跟我们的目标效果最为接近,所以我们尝试对方案一的文本描述进行优化。
3. 逆向关键词优化
不知道大家对关键词有没有进行过分类,其实可以分为以下几类:描述、风格、颜色和材质、拍摄和渲染、图像比例、使用版本等。
描述:即对目标效果进行描述,能清晰地说出画面内容。
风格:风格的专业性词汇比较强,大家可以直接引用逆向编译出来的风格词语或者网上整理的一些风格词语;
颜色和材质:主要是描述画面中主要物体的颜色和材质,背景色等;
拍摄和渲染:拍摄一般指人为,渲染一般指机器。拍摄可能包含视图分类、拍摄角度、拍摄机器和镜头等;渲染一般会有三维渲染种类,如 Vray 渲染。
图像比例:关系到输出图像的比例大小。
使用版本:一般默认使用最高版本,V6.0。对于动漫效果一般使用 niji 效果。
因为我平时会对 MIdjourny 关键词进行整理输出,基本上形成了既定的梳理模板固定的分类模版,所以直接按照梳理的分类模版进行分析即可。
我们对方案一的关键词进行重新整理:
the strawberries are inside pink water, in the style of photorealistic fantasies, made of liquid metal, photo-realistic techniques, vray tracing, wavy resin sheets, wimmelbilder, polished metamorphosis --ar 3:4 --v 6.0
整理后:
我们主要对描述部分进行细化:增加一些描述细节。
譬如草莓均匀地泡在水中 symmetrical inside little pink transparent water,有一些水花 a little splash,有一些气泡 Bubbles in the water,如果想要专业的摄影效果,我们可以增加相机镜头(shot with a +相机名称+镜头名称)或者通用词 commercial photography。
关于相机镜头。我们平时可以做好素材库的积累,之前优设也有类似的文章专门说镜头的用法的,都可以收藏到我们的库中,以便直接调用。以下为相机库示意:
4. 逆向关键词输出
我们看一下我们整理后的关键词:
描述词:the strawberries are symmetrical inside little pink transparent water,a little splash,some bubbles in the water,
风格:in the style of photorealistic fantasies, wimmelbilder,
材质:made of liquid metal,wavy resin sheets,
拍摄和渲染:commercial photography(可加可不加,也可以换其他具体的相机),photo-realistic techniques,vray tracing, polished metamorphosis,
输出比例:--ar 3:4
使用版本:--v 6.0
输出效果如下:
5. 逆向关键词的通用性验证
现在我们已经输出了很多轮,然后也得到了很多我们想要的效果。那么我们需要修改描述词为通用描述词,看看是否对其他水果一样适用。
描述词修改前:the strawberries are symmetrical inside little pink transparent water,a little splash,some bubbles in the water,
描述词修改后:the「水果名称」are symmetrical inside little「水体颜色」transparent water,a little splash,some bubbles in the water,a little splash,some bubbles in the water,in the style of photorealistic fantasies, wimmelbilder,made of liquid metal,wavy resin sheets,photo-realistic techniques,vray tracing, polished metamorphosis, --ar 3:4 --v 6.0
我们通过以下几组案例来测试:樱桃+淡红色,柠檬+淡绿色,桃子+浅粉色,蓝莓+淡紫色。
第一组:樱桃+淡红色:
第二组:柠檬+淡绿色:
第三组:桃子+浅粉色
第四组:蓝莓+淡紫色
逆向输出总结
从实验数据来说,该关键词基本可以满足于对这一类图片输出,因此当前的逆向输出是成功的。
我们在项目中,如果想实现某种效果,那就尝试去找一些类似的概念图片,哪怕是拼接而成的也可以,试着让 MIdjourny 逆向输出,然后在输出方案的基础上进行筛选加工,这样就可以得到我们想要的图片了。
MIdjourny 和 Stable Diffusion 不同,MIdjourny 的稳定性没有后者大,所以我们尽量归纳整理适合我们自己的方法。对于 MIdjourny 的稳定性控制,还可以使用 seed 值去控制,如果大家有兴趣可以再研究一下。
以上教程就是本次想给大家说的一个案例,当大家无法根据自己描述的关键词得到想要的效果时,不妨试试逆向生成,然后推导出通用方法,记录在自己的知识库,以便后期调用。希望对大家有用。
我是阿琦 Aqi,感谢大家阅读。用最接地气的语言,传递更多的设计知识。
欢迎关注作者微信公众号:「阿琦设计日记」
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
热评 暮色