2023/07/02 (更新日: 2023/09/29)

【Stable Diffusion】おすすめの画像サイズとイラストを高画質化する2つの方法

※当ブログはアフィリエイト・アドセンスによる収益で運営されています。

こういったお悩みにお答えします。

Stable Diffusionで生成する画像のサイズはとても大事。サイズ選択をミスるとクオリティが低くなったり構図が破綻したりと、せっかく生成したイラストが使い物になりません。

この記事では

これらについて解説していくので、最後まで読むとStable Diffusionで生成する画像サイズの扱い方がわかります。

初心者の方・Stable Diffusionに関してわからないことがある方は以下の記事も読んでみてください。Stable Diffusionのダウンロード方法や使い方について詳しく解説しています。

【Stable Diffusion】おすすめの画像サイズの考え方

Stable Diffusionで画像を生成するとき、おすすめのサイズは512×512ピクセルです。

これは起動時の初期設定にもなっている数字ですね。

512×512がおすすめな理由は、多くのモデルが512×512ピクセルの画像でトレーニングしているから。さんざん習ったサイズなので自分で描くのも得意、というわけです。

一方、サイズが小さすぎ・大きすぎだと、どのように描いていいかわからず構図が破綻してしまうことがあります。

上のイラストは2,000ピクセル近くの高画質で生成したもの。よくわからないイラストになってしまいました。

サイズが大きいと、そのぶん生成に必要な時間も増えます。さんざん待たされたのに変なイラストしか生成されない…なんてことにならないよう、はじめから高画質のイラストを作ろうとするのはやめておきましょう。

『縦長or横長のイラストが欲しい』という場合も600×400や400×600など、なるべく512×512の周辺サイズで生成するのがおすすめ。筆者は『長辺が1,000ピクセル未満』になるようにサイズを設定しています。

AIイラストにとって、画像サイズは特別な意味を持ちます。手描きのイラストや動画と違って、できあがったイラストのクオリティに直結するためです。

画像サイズが小さいとAIが十分に描き込みをすることができず、クオリティが低いイラストしか生成されません。

特に人間の顔は複雑なパーツのため、512×512程度のサイズで全身を描かせるとすぐ崩れます。

『AIは512×512あたりのサイズが得意なのに、そのサイズだと顔が変になる！』というのは多くの初心者が一度は悩む内容でしょう。

それを解決してくれるのが、イラストの高画質化。

いきなり大きなサイズでイラストを生成するのではなく

このように作業を分割することで、高クオリティのイラストを生成できるようになります。『とりあえず低画質でざっくり描いて、後から清書する』みたいなイメージですね。

『解像度を上げた分だけ描き込みの量を増やせる』と聞いてもピンとこない方も多いと思うので、実際に比較してみましょう。

顔の部分をピックアップして並べたものですが、解像度による違いが一目瞭然。もちろん服装や背景なども、解像度が上がるにつれてたくさん描き込まれています。

描き込み量を増やすことなどを目的として、数万ピクセルのイラストを生成している方もいるほど。クオリティをアップするためにぜひイラストの高画質化に取り組んでみてください。

Stable Diffusionで画像を高画質化するには

これら2つのうちどちらかを使いましょう。

	メリット	デメリット
Hires.fix	はじめから備わっている	構図が変わることがある VRAM容量が不足しがち
Tiled Diffusion + ControlNet	構図が変化しづらい少ないVRAM容量で高解像度化が可能	導入がめんどくさい