前回の「ラーメン食べさせチャレンジ」で、自分のプロンプト能力のなさを痛感しました。そこで、真面目にプロンプトの勉強をしたので、以下にまとめました。
呪文(プロンプト)には、PromptとNegative Promptがあります。Promptは、「AIに描いて欲しい情報を伝えるための文章」、Negative Promptは「AIに描いて欲しくない情報を伝えるための文章」です。
「Leonard.Ai」ならRemix機能だけでも十分遊ぶことが出来ますが、より自分好みのイラストにするためには呪文(プロンプト)の理解は必須です。
ということで、「初心者でも出来る」呪文生成に挑戦してみましょう。
ちなみに、「初心者でも出来る」の定義は、AIイラスト経験が2週間の私の様な初心者でも出来るかどうかです。なんとなく難しいと思っている方、ルールさえ理解すれば簡単なので、安心下さい。
プロンプト作成にあたって、参考にしたのは公式Discordの以下のスレッドです。
呪文(プロンプト)について
呪文(プロンプト)のルールについて
Leonard.Aiでプロンプトに関する基本的なルールは以下です。
- 最初に入力したプロンプトほど優先度が高い
- 括弧などで重み付けをすることが出来る
- 英語の単語ベースで入力する
このプロンプトを作る作業のことをプロンプトエンジニアリングと言います。AIの出力品質や精度を高めるために、プロンプトを調整するための手法のことですが、難しく考えず「そういう作業をしているんだぁ」くらいでOKです。
最初に入力したプロンプトほど優先度が高い
最初に入力された呪文ほど優先して扱われます。したがって、ポーズなどを思い通りとってくれない場合は、思い切って最初に持ってくると、改善が見られる場合もあります。
括弧などで重み付けや弱めることが出来る
プロンプトの順番を並び替える以外に、括弧によりプロンプトの重み付けを行うことが出来ます。
プロンプトを強調したい場合は、(masterpiece)のように強調したいキーワードを()で囲めばOKです。
- (キーワード)で1.1倍、((キーワード))で1.21倍、(((キーワード)))で1.33倍の強さになります。
また、キーワードを弱めたい場合は、弱めたいキーワードを[]で囲めばOKです。
- [キーワード]で0.9倍、[[キーワード]]で0.81倍、[[[キーワード]]]で0.73倍の弱さになります。
英語の単語ベースで入力する
英語が苦手でも、DeepLなどを活用すれば良いでしょう。左側を日本語にして、キーワードを入力していけば、自動的に翻訳してくれますので、コレをプロンプトとして貼り付けるだけです。
プロンプトに含む要素
Prompt
公式Discordの情報は「猫」をサンプルとしてるためか、不足している情報や、細分化したほうが良いと思う要素がありました。そこで、私なりに7つの要素として以下に、まとめてみました。なお、公式Discordの情報との主な差分は以下の2つです。
- 構図(ポーズやフォトアングル)について言及されていないため、要素として追加。
- アーティスト名をプロンプトに入力するのは、著作権的に微妙な気がするので削除。
なお、要素を入力しても求める結果が得られるとは限りません。求める結果になりやすくなりますが、確実ではないことはご理解下さい。
カテゴリー | 要素 | プロンプト例 |
---|---|---|
1.主題 | 被写体 風景 | a pretty girl, a cat, a landscape, |
2.修飾語 | ヘアスタイル 目 服装 | blonde hair, pony tail, pigtails, blue eyes, light brown eyes, knight uniform, fighter uniform, |
3.構図 | ポーズ 被写体の向き アングル | cute pose, whimsical pose, side view, back view, wide-angle photo, close up shot, |
4.雰囲気 | 表情 背景 ムード | tears, smile, otherworldly castles, forest, magical sense, sunset atmosphere, |
5.スタイル | テイスト | anime, watercolor, photograph, 3d render, |
6.品質 | クオリティ | masterpiece, best quality, ultra high res, detailed eyes, detailed face, |
7.照明 | ライティング | Lighting from behind, cinematic lighting, |
どういった要素をプロンプトに含むべきかについては、The-Ai-Artなども参考にしています。
主題
主題は、「シンプル」に最も描いてほしい要素を伝えます。女の子を描いて欲しい時は「a girl」、風景画を描いて欲しい時は「a landscape」といった具合です。
要素 | プロンプト例 | プロンプトの意味 |
---|---|---|
被写体 | a girl, a pretty girl | 女の子, かわいい女の子 |
風景 | a landscape, | 風景画 |
修飾語
主題をより強調し、具体的なものにするための追加となる要素を伝えます。
“a girl”を修飾するものであれば、「ヘアスタイル」、「目の色」、「服装」などを指定します。今回の例では以下を指定しました。
要素 | プロンプト例 | プロンプトの意味 |
---|---|---|
ヘアスタイル | messy blonde hair, fluffy blonde pigtails hair, | ボサボサの金髪 フワフワの金髪ツインテール |
目 | blue eyes, | 青い目 |
服装 | street fashion knight uniform | ストリートファッション 騎士の制服 |
構図
構図を決めるためには、「ポーズ」、「被写体の向き」、「アングル」を要素として伝えます。
このあたりからプロンプト内の矛盾によっては、正しく描写されなくなってきます。例えば、プロンプトに足や靴の入力がない状態で、”full body shot”を指定しても全身ショットにならない場合が多いです。特に、Prompt Majicを使っている場合によく見られる様に思います。
その場合、騎士の例だと、”sweat legs”や”knight boots” を入力した上で、”full body shot”とすればうまくいく場合があります。
構図でお困りの方はこちらの記事も参考にしてみて下さい。
要素 | プロンプト例 | プロンプトの意味 |
---|---|---|
ポーズ | whimsical pose, cute pose, | 気まぐれなポーズ 可愛いポーズ |
被写体の向き | front facing, side facing, | 前向き 横向き |
アングル | portrait photo, wide-angle photo, | ポートレイト ワイドアングル |
雰囲気
雰囲気を伝えるために、被写体の「表情」、「背景」、「ムード」を要素として伝えます。雰囲気も絵の大事な要素ですが、これまでの項目と重複しないため、この位置に置いても正しく描写してくれます。
要素 | プロンプト例 | プロンプトの意味 |
---|---|---|
表情 | tears, smile, | 涙 スマイル |
背景 | forest, otherworldly castles, | 森 異世界の城 |
ムード | morning mood, magical sense, | 朝のムード 魔法の感覚 |
スタイル
画風を決めるために「スタイル」を要素として伝えます。上の画像たちは「以下のプロンプトの最後にスタイルを追加すると絵柄がどうなるのか?」の比較です。
A pretty girl, fluffy blonde pigtails hair, brown eyes, knight uniform,
スタイルは絵の印象を大きく変えるので、AI任せにせず指定したほうが画像が安定します。アニメ絵にしたいのか?実写風にしたいのか?好みに合わせて調整下さい。
要素 | プロンプト例 | プロンプトの意味 |
---|---|---|
テイスト(絵の作風) | watercolor painting, photograph, anime style, 3d render, | 水彩画 リアルな写真 2Dアニメ風 3DCG風 |
ほかにも、”kawaii”, “chibi”, “concept art”などと入力すると、雰囲気が変わります。
品質
「品質」を要素として伝えます。このプロンプトは加えるだけで、画像のクオリティが大きく向上します。
上のサンプルで、左は品質指定なし。右には以下の品質向上のプロンプトを追加しました。なお、違いを明確にするために、シード値は固定しています。
(masterpiece), best quality, ultra high res, approaching perfection, 4k resolution, 8k resolution, highly detailed, fine detail, full of color, intricate detail,
ただ、ラフさが無くなるので左の絵のほうが好みという方は、使わないほうがいい場合もあります。
要素 | プロンプト例 | プロンプトの意味 |
---|---|---|
クオリティ | masterpiece, best quality, ultra high res, detailed eyes, detailed face, | 傑作 最高品質 超高解像度 詳細に描き込まれた目 詳細に描き込まれた顔 |
(masterpiece)だけの追加であれば、元の絵の雰囲気も残しておりますが、
(masterpiece), best quality, ultra high resまで追加すると、ラフさが失われてますね。
まぁ、このあたりはお好みで調整下さい。
照明
「ライティング」を要素として伝えます。これも大きく雰囲気を変えてくれるので、私は好んで使用しています。
要素 | プロンプト例 | プロンプトの意味 |
---|---|---|
ライティング | lighting from behind, cinematic lighting effect, | 後方からのライティング 映画のようなライティング効果 |
ここまでのまとめ
プロンプトを細かく指定すると、以下の様に同じテイストの絵を生み出すことが出来ます。
一旦、気に入った雰囲気の画像が出来たら、後は「3.構図」を変更するだけで似たような画像を生成できます。例えば、ポーズを変更してみるとか、アングルを変更してみるなどです。
Negative Prompt
続けてNegative Promptも見ておきましょう。
ネガティブプロンプトには描いてほしくない要素を入れます。しかし、公式Discordの情報では、区分はされておりませんでしたので、こちらも私の方で5つに分類をしてみました。
項目 | 要素 | プロンプト例 |
---|---|---|
1.全体 | 品質 人数や構図 | low quality, low-res, no person, out of frame, |
2.四肢 | 手 指 足 腕 手足 | mutated hands, poorly drawn hands, mutated digits, poorly drawn digits, fused legs, missing legs, fused arms, missing arms, extra limbs, malformed limbs, |
3.顔 | 顔 目 首 | poorly drawn face, spots on face, poorly drawn eyes, long neck, |
4.外見 | 不美 | mutation, deformed, ugly, blurry, |
5.ロゴ | ロゴ | logo, text, artist name, username, |
- 低品質だったり、人が居なかったりする絵は絶対に採用しないため、最優先にします。
- 手が多かったり、くっついたりするのを防ぎます。ただ、これらを描いたとしても指の成功率は低いので、おまじない程度に。AIが苦手とするジャンルなので、2番目の優先度にします。
- 顔が雑に描かれたり、複数の顔があったりするのを防ぎます。
- 不美の絵が生成されることを防ぎます。
- AIの学習データには文字やロゴ情報などが含まれる場合がありますが、絵を生成する際には、そのような情報を反映させないようにします。
これらの要素は毎回入れた方がいいので、ネガティブプロンプトは定型文になりがちです。
low quality, low-res, no person, out of frame, out of focus, mutated hands, poorly drawn hands, fused hands, abnormal hands, missing hands, mutated digits, poorly drawn digits, fused digits, abnormal digits, missing digits, more than 5 digits per hand, fused legs, missing legs, fused arms, missing arms, extra limbs, malformed limbs, poorly drawn face, spots on face, cloned face, multiple faces, poorly drawn eyes, long neck, multiple body, mutation, deformed, ugly, blurry, bad anatomy, bad proportions, disfigured, logo, text, artist name, username, signature, tattoo, character sheet, watermark, copyright name,
私はこの様なNegative Promptを毎回使用しています。
まとめ
ということで、Leonard.Aiの呪文(プロンプト)の入力方法でした。公式Discordの情報を参考にしましたが、プロンプトを理解してからは、自分の意図するような画像が生成しやすくなりました。
ただし、必ずしもプロンプトのルールに従わなければならないというルールはありません。
まずはプロンプトの位置を変えたりして、生成される画像にどのような影響があるのかを見てみることから始めてみるのはいかがでしょうか?
コメント