【Stable Diffusion】おすすめの画像サイズとイラストを高画質化する2つの方法
- ※当ブログはアフィリエイト・アドセンスによる収益で運営されています。
こういったお悩みにお答えします。
Stable Diffusionで生成する画像のサイズはとても大事。サイズ選択をミスるとクオリティが低くなったり構図が破綻したりと、せっかく生成したイラストが使い物になりません。
この記事では
- 【Stable Diffusion】おすすめの画像サイズの考え方
- 【Stable Diffusion】画像サイズとクオリティの関係性
- 【Stable Diffusion】画像を高画質化するのにおすすめな2つの方法
- 【Stable Diffusion】画像のサイズ・アスペクト比を一発で指定する拡張機能
- もっとスムーズにイラストを生成したいなら…
- 生成した大量のイラストを簡単に管理する方法
これらについて解説していくので、最後まで読むとStable Diffusionで生成する画像サイズの扱い方がわかります。
初心者の方・Stable Diffusionに関してわからないことがある方は以下の記事も読んでみてください。Stable Diffusionのダウンロード方法や使い方について詳しく解説しています。
>>【完全初心者用ガイド】Stable Diffusionの使い方を徹底解説!
【Stable Diffusion】おすすめの画像サイズの考え方
Stable Diffusionで画像を生成するとき、おすすめのサイズは512×512ピクセルです。
これは起動時の初期設定にもなっている数字ですね。
512×512がおすすめな理由は、多くのモデルが512×512ピクセルの画像でトレーニングしているから。さんざん習ったサイズなので自分で描くのも得意、というわけです。
一方、サイズが小さすぎ・大きすぎだと、どのように描いていいかわからず構図が破綻してしまうことがあります。
上のイラストは2,000ピクセル近くの高画質で生成したもの。よくわからないイラストになってしまいました。
サイズが大きいと、そのぶん生成に必要な時間も増えます。さんざん待たされたのに変なイラストしか生成されない…なんてことにならないよう、はじめから高画質のイラストを作ろうとするのはやめておきましょう。
『縦長or横長のイラストが欲しい』という場合も600×400や400×600など、なるべく512×512の周辺サイズで生成するのがおすすめ。筆者は『長辺が1,000ピクセル未満』になるようにサイズを設定しています。
【Stable Diffusion】画像サイズとクオリティの関係性
AIイラストにとって、画像サイズは特別な意味を持ちます。手描きのイラストや動画と違って、できあがったイラストのクオリティに直結するためです。
画像サイズが小さいとAIが十分に描き込みをすることができず、クオリティが低いイラストしか生成されません。
特に人間の顔は複雑なパーツのため、512×512程度のサイズで全身を描かせるとすぐ崩れます。
『AIは512×512あたりのサイズが得意なのに、そのサイズだと顔が変になる!』というのは多くの初心者が一度は悩む内容でしょう。
それを解決してくれるのが、イラストの高画質化。
いきなり大きなサイズでイラストを生成するのではなく
- 得意なサイズ(512×512周辺)でイラストを生成
- できあがったイラストの解像度を上げつつ、細かく描き込む
このように作業を分割することで、高クオリティのイラストを生成できるようになります。『とりあえず低画質でざっくり描いて、後から清書する』みたいなイメージですね。
『解像度を上げた分だけ描き込みの量を増やせる』と聞いてもピンとこない方も多いと思うので、実際に比較してみましょう。
顔の部分をピックアップして並べたものですが、解像度による違いが一目瞭然。もちろん服装や背景なども、解像度が上がるにつれてたくさん描き込まれています。
描き込み量を増やすことなどを目的として、数万ピクセルのイラストを生成している方もいるほど。クオリティをアップするためにぜひイラストの高画質化に取り組んでみてください。
【Stable Diffusion】画像を高画質化するのにおすすめな2つの方法
Stable Diffusionで画像を高画質化するには
- Hires.fix
- Tiled Diffusion + ControlNet
これら2つのうちどちらかを使いましょう。
メリット | デメリット | |
Hires.fix | はじめから備わっている | 構図が変わることがある VRAM容量が不足しがち |
Tiled Diffusion + ControlNet | 構図が変化しづらい 少ないVRAM容量で高解像度化が可能 |
導入がめんどくさい |
それぞれの特徴を比べるとこんな感じ。『高画質化なんてしたことがない』『今すぐ試してみたい』という方はお試しでHires.fixを、それ以外の方はTiled Diffusion+ControlNetを使うのがおすすめです。
それぞれの方法について順番に解説します。
Hires.fix
Stable Diffusion web UIに初めから備わっている、初心者向きの高画質化機能。とりあえず試してみたい方におすすめです。
設定方法はとても簡単。画像サイズの上に表示されている『Hires.fix』にチェックを入れるだけです。まずは初期設定のまま生成してみるのもいいでしょう。それだけで
- 元のサイズでイラストを生成(上の画像では512×512)
- 設定したUpscale byの分だけ解像度を上げる(上の画像では2倍)
- きれいに描きなおす
この3STEPで作業を行ってくれます。
Hires.fixについて詳しく知りたい方は以下の記事も合わせてお読みください。
>>【Stable Diffusion】Hires.fixで解像度を上げて高画質化する方法
Tiled Diffusion + ControlNet
Tiled Diffusionを使うには2つの拡張機能を導入する必要があります。そのためHires.fixよりも少しハードルが高いですね。
しかし、Tiled Diffusion + ControlNetにはその価値が十分にあります。筆者が今後Hires.fixを使うことはないでしょう。
イラスト全体を一気に高画質化していたHires.fixと異なり
- イラストを複数の小さなタイルに分割
- それぞれのタイルの解像度を上げる
このように作業することで、VRAMの容量が少ないグラボでも高画質化が可能になります。その結果『Hires.fixだと2,000ピクセルまでが限界だけど、Tiled Diffusion + ControlNetなら4,000まで高画質化できる!』なんてことも。
構図の変化を抑えられるのも、この方法の大きなメリットControlNetを併用するとイラストの構図を制御できるため、高画質化に伴い絵柄が変化することを抑えられるのです。
Tiled Diffusionの詳しい使い方は以下の記事で解説しています。
>>【Stable Diffusion】Tiled diffusionの使い方とインストール方法を解説!
ControlNetのTile_resampleと併用する方法は以下の記事で解説しています。
>>【Stable Diffusion】ControlNet1.1用モデル『Tile_resample』の使い方を解説!
【Stable Diffusion】画像のサイズ・アスペクト比を一発で指定する拡張機能
最後に、Stable Diffusion web UI上で簡単に画像サイズを指定できる『Aspect Ratio selector』という拡張機能を紹介します。
あなたがよく使うサイズやアスペクト比を事前に登録しておけば、ボタン一つでイラストのサイズを変更できます。いちいち細かくバーを操作する必要がなくなるので楽ちんですよ。
Aspect Ratio selectorの導入方法や使い方は以下の記事で詳しく解説しています。
>>【Stable Diffusion】アスペクト比を一発で変更!Aspect Ratio selectorの使い方を解説!
もっとスムーズにイラストを生成したいなら…
もしあなたがもっと快適にAIイラストを生成したいなら、グラボを見直してみるのがおすすめです。
グラボはAIイラストを生成するうえで最も重要なパーツ。いくらCPUやメモリが高性能でもグラボがしょぼかったら致命的です。
本格的に取り組んでいくのなら、グラボにはケチらず投資しましょう。最低でも12GBのVRAMは確保しておきたいところ。VRAMが2GB・4GBくらいしかない古いグラボだと高解像度化や学習に大きな支障が出てしまいます。
コスパを重視する方・予算が5万円以下の方はRTX 3060一択と言っていいでしょう。
もう少し予算が確保できて、さらにハイスペックなグラボに興味がある方は以下の記事もお読みください。きっとあなたに合ったグラボが見つかりますよ。
>>【コスパ重視】Stable Diffusionにおすすめのグラボ3選!
PCごと買い替えを検討している方は以下の記事をお読みください。快適にStable Diffusionを使えるマシン3選を紹介しています。
>>Stable Diffusionにおすすめのパソコン3選と推奨スペックを解説!
生成した大量のイラストを簡単に管理する方法
Stable Diffusionで生成した大量のイラストを効率的に管理したいなら『Eagle』というツールがおすすめ。
イラストを生成するとメタデータが自動でEagleに送られ、タグやメモとして保存されます。このタグを使うことで検索や管理がとても楽ちん。
例えば『a dog』というタグで検索すると、そのプロンプトで生成されたイラストだけを表示することができます。『あのイラストどんなプロンプトで生成したっけ?』『LoRAのトリガーワード忘れた』なんて迷うことがなくなります。
Eagleは本来『約4,000円・買い切り型』の有料ツールですが、30日間の無料体験ができるので、とりあえず試してみてください。
『【Stable Diffusion】おすすめの画像サイズとイラストを高画質化する2つの方法』のまとめ
- Stable Diffusionは512×512ピクセルが得意
- いきなり大きなサイズのイラストを生成すると構図が破綻してしまう
- 生成した後に高画質化しよう!
ここまでお読みいただきありがとうございました!
他にもわからないことがあったら以下の記事をお読みください。初心者向けにStable Diffusionの使い方を一から解説しています。