DiffusionDraw 新手使用教程

AI绘画的核心在于将输入的文字转化为一幅图像,这个过程理解起来非常简单易懂,但是想要写好这段描述的文字也是有很多技巧的。本文将介绍文本提示语(prompt或者说是咒语)的入门教程,帮助大家更好的输出提示语。

一. 基础概念

文本提示语被分为正向提示词 (Positive Prompt) 和反向提示词 (Negative Prompt)。

正向提示词是指你想要在画面中看到的东西,例如美丽的日落或者是一只可爱的小狗。反向提示词是指你想避免在画面中出现的东西,例如障碍物或者是不必要的元素。

目前的模型主要支持英语提示语,输入中文会翻译为英文,可能会影响提示语的质量,因此建议尽量使用英语。

提示语的内容并不是越多越好,你写得越多,就越难让人工智能理解你想要什么,所以反而可以尝试保持简单。

二. 如何撰写提示语

1. 提示语的写法类型

(1)描述词写法:

用很多个词语来表达画面中的元素,可使用逗号隔开每个词语,并支持使用特定的语法对权重进行调整。这是我们最常用的方式之一,也是本文会重点介绍的写法。

例如, city on Mars, 8k, exploration, cinematic, Science fiction, cyberpunk, realistic

(2)自然语言写法:

自然语言就是我们平常沟通所使用的语言。例如,一个拥有金色头发带着花环,穿着白色纱裙的女孩正坐在一颗月桂树下,她的周围是粉色薰衣草草地。

注意不要使用太过于复杂的语法,语言模型可能无法理解,导致在解析上出现偏差。

由于自然语言会增加语法和各种修饰词,有可能会影响AI模型的解析能力,因此需慎重使用。

2. 万能公式

写提示语时可以套用下面的公式,撰写时不需要把所有的类别都写上,只选择自己认为最需要的写上即可。

公式 = 主体+场景+风格+质量+视角+色彩色调+光线+反向提示词

例如:

提示语:beautiful aesthetic digital illustration of a relaxed panda surrounded by an endless forest of weed wlop and Julia Razumova, realistic, photorealistic, hyperrealistic, unreal engine, deviantArt, trending on artstation, artstation HQ

(一只被无尽的杂草森林包围的放松的熊猫,Julia Razumova风格的数字插图,逼真、真实摄影、超现实、不真实的引擎、偏差艺术,流行的艺术,高清艺术品)

反向提示语:text, error, extra digit, fewer digits, cropped, worst quality, low quality,signature,  watermark

(文本,错误,额外数字,较少数字,裁剪,最差质量,低质量,正常质量,jpeg伪影,签名,水印)

一只被无尽的杂草森林包围的放松的熊
一只被无尽的杂草森林包围的放松的熊猫
(1)主体

主体是画面的灵魂,是锚定画面内容的关键。在生成画面时,必须详细准确地描述主体,以便模型能够理解我们的需求。例如,如果我们想生成一个女孩子,我们不能只写“1girl”,而是需要描述这个女孩子的外貌、穿着、动作等细节,例如她长发还是短发、穿什么衣服、做什么样的动作等。只有这样,模型才能准确地理解我们的需求,并生成出符合我们期望的画面。

(2)场景

在提示语中,场景的描述不可忽视。场景决定了图像的整体氛围、情感表达以及视觉效果,需要在提示语中明确主体所处的环境、周围的物体等,不然模型可能会随机生成一些不符合需求的内容。另外,如果需要做插图或logo等特定图像,也可以在提示语中增加simple background或者 white background来避免生成复杂的场景。

(3)风格

不同的艺术风格具有不同的特点和表现形式。例如,野兽派强调色彩和形状的夸张表现,印象派则注重对光影和色彩的变化捕捉,超现实主义则强调梦境和现实的融合,达达主义则强调对传统的颠覆和破坏。

另外,也可以在提示语中增加关于绘画方式的描述,例如,手绘、油画、水彩、摄影、3D渲染等。手绘作品通常具有独特的纹理和色彩,而摄影则更加注重构图和光线的运用。

艺术家是一个非常强大的风格修饰词,使用它可以让模型直接参考特定艺术家的风格来进行创作。例如,穆夏是一位非常著名的艺术家,他的作品风格非常富有时代感;而毕加索的立体派艺术风格打破了传统的透视法和视觉规则,以多角度、多面性的方式表现物体。使用艺术家作为修饰词后,模型可以直接使用其风格来进行创作,而无需过多地调整。

(4)质量

画面品质是一个非常重要的因素,使用高质量的词汇,如“masterpiece”或“best quality”,可以提高图像的品质和吸引力。这些词汇可以让模型更好地理解你对图像的要求,从而生成更加逼真、高质量的图像。

(5)视角

视角能够赋予图像独特的视觉效果和表现力,通过不同的角度和视点呈现出独特的视觉体验。常用的视角包括前景、中景、远景、脸部特写、全身像等。

(6)色彩色调

使用颜色可以创建不同的视觉风格和氛围,可以在提示语中增加明确的颜色修饰词,例如红色、蓝色、紫罗兰色等。暖色调的颜色可以营造出温馨、热情和亲密的感觉,而冷色调的颜色可以营造出冷静、清爽和疏远的感觉。中性色则可以为其他颜色提供一个稳定的背景,帮助构建视觉平衡。

(7)光线

光线在Prompt中也扮演着非常重要的角色,它可以影响画面的整体效果和氛围。光线可用于创造不同的效果和氛围,例如照亮人物面部的细节、增强物体的纹理和阴影等。常用的光线包括自然光、侧光、逆光、月光等。

(8)反向提示语

反向提示语通常是不希望出现在图像中的元素或属性。这些元素或属性可能包括低质量图像(Low-quality)、丑陋的样式(ugly style)、水印(watermarks)、标志(logos)、少儿不宜(nsfw)等等。

例如有些AI画不好的内容,比如“手”,就可以使用反向提示语去提示AI不要生成,例如可以输入twisted hands(扭曲的手)或者是 fusedfingers (融合的手)。

一些常用的反向提示词包括:低画质、最糟品质、画家签名、模糊、水印。text, error, extra digit, fewer digits, cropped, worst quality, low quality,signature,  watermark

不想看到的东西也可以加进去。例如不想看到裸露、兵器、血、猎奇的元素出现,就可以输入nsfw、weapon、blood、guro等反向提示语。

三. 提示语进阶技巧

1. 提示语长度

提示语的长度需要与你的画面的分辨率以及迭代次数相匹配。如果不匹配,例如你将分辨率和迭代次数设置得非常高(DiffusionDraw后续会支持分辨率及迭代次数),但结果你的描述词很短,比如只有一个女孩,那么模型很可能没有地方发挥,会给你生成多头或多手等不自然的表达方式。因此不建议输入过短的提示语,会影响生成图片的效果。

2. 词序

文本中的单词排序对于画面生成结果具有重要的影响。在默认情况下,每个提示词的权重都是 1,并且从前到后依次减弱。这意味着,如果你将人物描述词放在前面,那么人物将成为核心,场景将变得相对较小;如果你将场景描述词放在前面,那么人物将变得相对较小。

3. 描述词权重

AI模型会根据描述词的权重来选择性生成对应的图像,因此为描述词添加合适的权重可以帮助模型更好的了解绘画的需求。

权重的表达方式是英文括号中前面写描述词,然后写英文冒号,最后写权重数值。例如,输入(rose:1.4),意味着将玫瑰花的权重调整为1.4倍(默认权重为1)。

需注意,权重超1.5,会在画面中产生巨大影响,甚至整个画面都是这个描述词。而如果权重低于0.1,那么该提示词对应的要素就很难对图像产生影响。

4. 描述词技巧

多用形容词 / 名词,少用动词,出图会更准确,中间可用逗号,隔开,如:漂亮的女孩,抱着花;

尽量使用【形容词+名词】或【动词+名词】的组合描述,不要分拆成单独的词使用,如:帅气,男孩,拍打,篮球;建议改成:帅气的男孩,拍打着篮球;

如果是复杂的语句/词汇,可分开描述,出图更准确,如:蓝色的闪闪发光的水晶球;可改成:蓝色的水晶球,闪闪发光。

5. AND语法

使用AND将多个词语连接在一起,可产生混合效果。注意AND是全部大写,小写没有这个作用。

AND语法的原理是直接把多个描述词混合一起丢给AI,而非分步渲染,在混合效果方面表现比较好。

例如:多色头发﹝颜色混合效果﹞

提示语:green hair :1.05 AND white hair:1

先写出想要的颜色的头发,用大写AND分开,实现头发颜色的﹝混合效果﹞;然后在每个描述词后面加上冒号,分别写上权重,就能实现对头发颜色分配的控制。

AND语法, 多色头发﹝颜色混合效果﹞
AND语法, 多色头发﹝颜色混合效果﹞

四. 提示语示例

示例1:两只柯基犬在草地上奔跑。

提示语:2 corgi dogs running on grass field

反向提示语: text, error, extra digit, fewer digits, cropped, worst quality, low quality,signature,  watermark

两只柯基犬在草地上奔跑
两只柯基犬在草地上奔跑

示例2:火星上的城市

提示语:city on Mars, 8k, exploration, cinematic, Science fiction, cyberpunk, realistic, aerial view, hyper detailed, moody cinematic epic concept art, realistic matte painting, hyper photorealistic

反向提示语: text, error, extra digit, fewer digits, cropped, worst quality, low quality,signature,  watermark

火星上的城市
火星上的城市

示例3:动漫美少女

提示语:jeanne d'arc from fate grand order, 1girl, (best quality:1.2), 

(high detail:1.1), (full face:1.2),  (looking at viewer:1.2)

反向提示语: text, error, extra digit, fewer digits, cropped, worst quality, low quality,signature,  watermark

动漫美少女
动漫美少女