【Stable Diffusion】全身のイラストを描いても顔が崩れない2つの方法

AIイラスト

    ※当ブログはアフィリエイト・アドセンスによる収益で運営されています。

こういったお悩みにお答えします。

Stable Diffusionでキャラクターの全身が映るイラストを生成すると、顔が崩れてしまうことが多いですよね。どれだけ背景がきれいでも、どれだけシチュエーションが思いどおりでもボツにすることに…。

この記事では

これらについて解説していくので、最後まで読むと全身・引きの構図でもきれいな顔を描く方法がわかります。

初心者の方・Stable Diffusionに関してわからないことがある方は以下の記事も読んでみてください。Stable Diffusionのダウンロード方法や使い方について詳しく解説しています。

>>【完全初心者用ガイド】Stable Diffusionの使い方を徹底解説!

【Stable Diffusion】全身・引きの構図で顔が崩れてしまう原因


Stable Diffusionで

  • full body:キャラクターの全身が描かれる
  • wide shot:引きの構図になる

これらのプロンプトを入力した状態でイラストを生成すると、キャラクターの全身が描かれる代わりに顔が崩れてしまうことが多いです。

元イラスト
よくこんな感じの、怖い顔のイラストができあがりますよね。

この原因は、AIが顔を描けるスペースが小さいから。

キャラクターの顔はもともと複雑なパーツ。小さな空間ではAIが丁寧に描き込むことができず、結果としていい加減な描き込みになってしまうのです。

元イラスト顔の部分
上のイラスト(512×512ピクセル)だと、顔が占めるピクセル数はせいぜい50×50ピクセルくらい。

『じゃあイラストのサイズを大きくすればいいのか!』と思うかもしれませんが、実はそう簡単ではありません。

Stable Diffusionで使用できるモデルのほとんどは512×512サイズの画像で学習しています。そのため大きなサイズのイラストを描くのがとても苦手。

構図が破綻
はじめから1,000ピクセル・2,000ピクセルのイラストを描かせようとすると、構図が破綻してしまうことが多いです。

では、具体的にどのように解決すればいいのでしょうか。

【方法1】拡張機能ADetailerで顔だけ修正する

1つ目は応急処置的な方法。ADetailerという拡張機能を使うと、顔の部分のみを補正してくれます。

元イラスト
先ほどのイラストのADetailerを適用すると

ADetailer適用後
こんな感じに。

後述する『高解像度化する』方法と異なり、グラボのスペックが低くてもできるのがメリット。VRAM容量に自信がない方は試してみてください。

ADetailerの導入方法や詳しい使い方は以下の記事で解説しています。

>>【Stable Diffusion】もう顔が崩れない!表情差分も作れるADetailerの使い方!

【方法2】高解像度化する

こちらが根本的な解決方法。生成したイラストの解像度を上げることでピクセル数を増やし、顔を丁寧に描いてもらおうという考え方です。

RTX 3060(VRAM:12GB)以上のグラボを使っている方は、基本的にはこちらの方法で解決しましょう。

全身イラスト
先ほどと同じイラスト(512×512ピクセル)を

2倍に高解像度化
2倍(1024×1024ピクセル)にするとこんな感じに。

4倍に高解像度化
さらに2倍(2048×2048ピクセル)にすると描き込み量もアップ。かなりきれいに顔が描き込まれましたね。

顔の崩れ方比較
顔の部分だけ並べてみるとその差は歴然。

イラスト全体を高解像度化するため、服装や背景など顔以外の部分もクオリティが上がるのがメリットです。世の中にあるきれいなAIイラストの多くは、1回もしくは複数回の高解像度化を経て投稿されています。

その一方で、高解像度化には大きな容量のVRAMが必要。低スペックのグラボで高解像度化しようとすると、すぐにVRAM不足でエラーになってしまいます。

多くのStable DiffusionユーザーがVRAMの容量にこだわる理由の一つがこれ。VRAMが少ないと高解像度化するうえで致命的です。

高解像度化する方法はいくつかありますが、筆者としてはTile diffusion + ControlNet Tileがおすすめ。導入がちょっとめんどくさいですが、元イラストの忠実に高解像度化できたりVRAMの使用量を抑えられたりとメリットが大きいです。

Tile diffusion + ControlNet Tileで高解像度化する方法は以下の記事で詳しく解説しています。

>>【Stable Diffusion】ControlNet1.1用モデル『Tile_resample』の使い方を解説!

もっとスムーズにイラストを生成したいなら…


もしあなたがもっと快適にAIイラストを生成したいなら、グラボを見直してみるのがおすすめです。

グラボはAIイラストを生成するうえで最も重要なパーツ。いくらCPUやメモリが高性能でもグラボがしょぼかったら致命的です。

本格的に取り組んでいくのなら、グラボにはケチらず投資しましょう。最低でも12GBのVRAMは確保しておきたいところ。VRAMが2GB・4GBくらいしかない古いグラボだと高解像度化や学習に大きな支障が出てしまいます。

コスパを重視する方・予算が5万円以下の方はRTX 3060一択と言っていいでしょう。

もう少し予算が確保できて、さらにハイスペックなグラボに興味がある方は以下の記事もお読みください。きっとあなたに合ったグラボが見つかりますよ。

>>【コスパ重視】Stable Diffusionにおすすめのグラボ3選!

PCごと買い替えを検討している方は以下の記事をお読みください。快適にStable Diffusionを使えるマシン3選を紹介しています。

>>Stable Diffusionにおすすめのパソコン3選と推奨スペックを解説!

生成した大量のイラストを簡単に管理する方法


Stable Diffusionで生成した大量のイラストを効率的に管理するなら『Eagle』というツールがおすすめ。

Eagle使い方①
イラストを生成するとメタデータが自動でEagleに送られ、タグやメモとして保存されます。このタグを使うことで検索や管理がとても楽ちん。

Eagle使い方②
例えば『a dog』というタグで検索すると、そのプロンプトで生成されたイラストだけを表示することができます。『あのイラストどんなプロンプトで生成したっけ?』『LoRAのトリガーワード忘れた』なんて迷わずに済みますよ。

Eagleは本来『約4,000円・買い切り型』の有料ツールですが、30日間の無料体験ができるので、とりあえず試してみてください。

>>公式サイトでEagleを無料体験してみる

『【Stable Diffusion】全身のイラストを描いても顔が崩れない2つの方法』のまとめ

  • Stable Diffusionでは顔を描くスペースが少ないとすぐ崩れる
  • グラボの性能に自信がないならADetailerで顔だけ補正しよう
  • ある程度のVRAMがあるなら高解像度化がおすすめ

ここまでお読みいただきありがとうございました!

他にもわからないことがあったら以下の記事をお読みください。初心者向けにStable Diffusionの使い方を一から解説しています。

>>【完全初心者用ガイド】Stable Diffusionの使い方を徹底解説!