【Stable Diffusion】img2imgで選べるResize mode4つの違いを検証!
- ※当ブログはアフィリエイト・アドセンスによる収益で運営されています。
こういったお悩みにお答えします。
Stable Diffusionのimg2imgでイラストを生成するとき、4つのResize modeから1つを選ぶ必要があります。この選択をミスると『あれ、思いどおりの結果にならない』なんてことに…。
この記事では
- 【Stable Diffusion】img2imgのResize modeについて詳しく解説!
- 4つのResize modeの違いを検証
- 他のUpscalerにしたい場合の設定方法
- もっとスムーズにイラストを生成したいなら…
- 生成した大量のイラストを簡単に管理する方法
これらについて解説していくので、最後まで読むとそれぞれのResize modeの違いがわかり、望みどおりのイラストを手に入れることができます。
img2imgの全般的な使い方を知りたい方は以下の記事も合わせてお読みください。実際に生成したイラスト付きで解説しています。
>>【Stable Diffusion】画像から画像を生成するimg2imgの使い方を解説!
【Stable Diffusion】img2imgで選べるResize modeについて解説!
Stable Diffusionでimg2imgのタブを選択すると
- Just resize
- Crop and resize
- Resize and fill
- Just resize (latent upscale)
これら4つのResize modeを選ぶことができます。
Resize modeとは『元となる画像』と『新しく生成するイラスト』でサイズが異なる場合に、どんなふうにサイズ変更をするかという考え方のことです。
例えば
- 元の画像サイズ:横512×縦512
- 生成したいイラストのサイズ:横1024×縦512
こんな場合だと、Stable Diffusionはなんとかして横方向に2倍したイラストを作らなくてはなりません。
元の画像をびよ~んと横に引っぱってムリヤリ2倍にするのか、それとも左右の空白を何かで埋めるのか…そういったアプローチがそれぞれのResize modeによって変わってくるのです。
img2imgでサイズの変更をする方は、それぞれのResize modeの違いを押さえておきましょう。どのResize modeを選ぶかで生成されるイラストがまったく異なってきますからね。
4つのResize modeの違いを検証
- Just resize
- Crop and resize
- Resize and fill
- Just resize (latent upscale)
これら4つのResize modeを使うとイラストがどのようにサイズ変更されるのか、実際に検証してみましょう。
検証時の条件は以下のとおり。
- 元の画像サイズ:横512×縦512
- 生成したいイラストのサイズ:横1024×縦512
- Denoising strength:0
元の画像の絵柄を維持したままサイズを横に2倍する、という作業をしていきます。
Just resize
名前のとおり、そのままサイズを変更する方法です。先ほどの例で言うと『ムリヤリびよ~んと延ばす』というタイプですね。
実際の生成結果を見てみましょう。
横にびよ~んと延ばす、というイメージがおわかりいただけたのではないでしょうか。
このように元画像の縦横比を無視してサイズを変更するのが『Just Resize』でした。
Crop and resize
縦横比を守ったままで元画像の余計な部分をトリミングしつつサイズを変更する方法です。
縦横比そのままに拡大されたため、上下がはみ出てしまっています。構図が大きく変わってしまうので要注意なmodeですね。
中心にあるものを強調したい場合に選ぶといいでしょう。
Resize and fill
縦横比を維持したままサイズを変更し、空白部分を新たに描画する方法です。
このように、新たに発生した空白部分(左右にあるオレンジ色の四角部分)はStable Diffusionがオリジナルで描画してくれます(今回はDenoising strength:0なので自由に描くことができず、ただ引き延ばしただけになっていますが)。
Denoising strengthを大きくしておけば、Stable Diffusionが融通を利かせて描画してくれるので結構便利です。
Just resize (latent upscale)
こちらは1つ目の『Just resize』と同じ考え方で、縦横比を変えつつサイズ変更をします。ただ、イラストを生成するときのUpscalerだけが違うバージョン。
Upscalerが違うと生成されるイラストの絵柄が異なってくるため、お好みで選びましょう。
なお今回の検証環境では
このようにぼやけてしまって使い物になりませんでした。
Denoising strengthの値によって結果が違ってくるので、あなたが実際にイラストを生成する環境で比較してみてください。
他のUpscalerにしたい場合の設定方法
初期設定では『Just resize』を選んだ場合のUpscalerは『none(なし)』ですが、これを好きなUpscalerに設定しておくこともできます。
latentを使いたい方は『Just resize (latent upscale)』を選べばいいのですが、これ以外のUpscalerをよく使う方は変更しておきましょう。
Upscalerを設定するには
『Setting』→『Upscaling』から『Upscaler for img2img』の項目を変更しましょう。
選択したら画面上部の『Apply settings』『Reload UI』を押すのもお忘れなく。
特に画面上の変化はありませんが、先ほど選んだものが『Just resize』で使われるUpscalerに変更されています。
もっとスムーズにイラストを生成したいなら…
もしあなたがもっと快適にAIイラストを生成したいなら、グラボを見直してみるのがおすすめです。
グラボはAIイラストを生成するうえで最も重要なパーツ。いくらCPUやメモリが高性能でもグラボがしょぼかったら致命的です。
本格的に取り組んでいくのなら、グラボにはケチらず投資しましょう。最低でも12GBのVRAMは確保しておきたいところ。VRAMが2GB・4GBくらいしかない古いグラボだと高解像度化や学習に大きな支障が出てしまいます。
コスパを重視する方・予算が5万円以下の方はRTX 3060一択と言っていいでしょう。
もう少し予算が確保できて、さらにハイスペックなグラボに興味がある方は以下の記事もお読みください。きっとあなたに合ったグラボが見つかりますよ。
>>【コスパ重視】Stable Diffusionにおすすめのグラボ3選!
PCごと買い替えを検討している方は以下の記事をお読みください。快適にStable Diffusionを使えるマシン3選を紹介しています。
>>Stable Diffusionにおすすめのパソコン3選と推奨スペックを解説!
生成した大量のイラストを簡単に管理する方法
Stable Diffusionで生成した大量のイラストを効率的に管理するなら『Eagle』というツールがおすすめ。
イラストを生成するとメタデータが自動でEagleに送られ、タグやメモとして保存されます。このタグを使うことで検索や管理がとても楽ちん。
例えば『a dog』というタグで検索すると、そのプロンプトで生成されたイラストだけを表示することができます。『あのイラストどんなプロンプトで生成したっけ?』『LoRAのトリガーワード忘れた』なんて迷わずに済みますよ。
Eagleは本来『約4,000円・買い切り型』の有料ツールですが、30日間の無料体験ができるので、とりあえず試してみてください。
『【Stable Diffusion】img2imgで選べるResize mode4つの違いを検証!』のまとめ
- 選んだResize modeによって生成結果は大きく変わる
- Denoising strengthと合わせて検討しよう
- Just resizeのUpscalerは好きなものに設定しておこう
ここまでお読みいただきありがとうございました!
他にもわからないことがあったら以下の記事をお読みください。初心者向けにStable Diffusionの使い方を一から解説しています。