【Stable Diffusion】Tiled diffusionの使い方とインストール方法を解説!
- ※当ブログはアフィリエイト・アドセンスによる収益で運営されています。
こういったお悩みにお答えします。
Stable Diffusionでイラストを高画質化(upscale)するためには大容量のVRAMが必要。すぐエラーになってしまう方も多いのではないでしょうか。
この記事では
- 【Stable Diffusion】イラストをupscaleできる『Tiled diffusion』の特徴とは?
- Tiled diffusion(multidiffusion-upscaler-for-automatic1111)のインストール方法
- Tiled diffusionの使い方
- エラーになる場合はTiled VAEを使おう
- Region Prompt Controlでプロンプトの適用範囲を指定できる
- もっとスムーズにイラストを生成したいなら…
- 生成した大量のイラストを簡単に管理する方法
これらについて解説していくので、最後まで読むと少ないVRAM容量でも快適にイラストを高画質化する方法がわかります。
この記事では『Tiled diffusion』という拡張機能について解説していますが、その他のおすすめ拡張機能について知りたい方は以下の記事も合わせてお読みください。
>>Stable Diffusionでおすすめの拡張機能(Extensions)を紹介!
【Stable Diffusion】イラストをupscaleできる『Tiled diffusion』の特徴とは?
Tiled diffusionは、少ないVRAM容量でもイラストを高画質にUpscaleできるようになる拡張機能です。
イラスト全体を一気に拡大するのではなく、タイルのように分割することでVRAMに使用量を減らすことができるのが強み。
VRAM容量が少ないGPUで頑張ってイラストを生成している方にとって、とても役立つ機能と言えるでしょう。普通にhires.fixで高画質化しようとすると、すぐにVRAM不足のエラーが出てしまいますからね。
Tiled diffusion(multidiffusion-upscaler-for-automatic1111)のインストール方法
出典元:Github
Tiled diffusionを使用するには、multidiffusion-upscaler-for-automatic1111という拡張機能をインストールする必要があります。
Stable Diffusion web UIの操作画面で『Extension』→『Install from URL』タブを選択し
- https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111
このURLをコピペしてください。
下にある『Install』ボタンを押すと、自動でインストールが始まります。
インストールが完了したら『installed』のタブに移動し、『Apply and restart UI』のボタンをクリックしましょう。Stable Diffusionが再起動され、Dynamic Promptsが適用されます。
再起動後、操作画面の左下に『Tiled diffusion』と『Tiled VAE』という2つの項目が追加されていればインストールは完了です。
Tiled diffusionの使い方
それでは実際にTiled diffusionを使っていきましょう。Tiled diffusionはtxt2imgでもimg2imgでも利用することができます。
この記事では、多くの方が使うであろうimg2imgでの高画質化について解説していきますね。
800×450ピクセルで生成した、このイラストを高画質化してみましょう。低画質あるあるとして、女の子の顔が崩れかけていますね。
Tiled Diffusionの推奨設定
Tiled Diffusionを使うときは、『Enable Tiled Diffusion』にチェックを入れましょう。見慣れない設定項目がたくさん出てきますが、Tiled diffusionのダウンロードページでは、使用時の推奨設定について
Sampler = Euler a, steps = 20, denoise = 0.35, method = Mixture of Diffusers, Latent tile height & width = 128, overlap = 16, tile batch size = 8
このように記載されています。
まずは推奨どおりの設定にしておきましょう。使い慣れてきたら徐々に変更していくのがおすすめです。
この中で特に重要なのがDenoising strength(上の引用文では『denoise』と省略されています)。初期設定は0.75ですが、このまま試してみると
元イラストから勝手に人数が増えたりと、絵柄が変わってしまうことが多いです。その一方、Denoising strengthの値が大きいほど描き込みは繊細になるので難しいところ。
推奨されている0.35を基準に、生成結果を見ながら調節しましょう。
その他に必要な設定項目としては
- Upscaler
- Scale Factor
これらがあります。
Upscalerに関しては詳しく解説しているとキリがないので割愛。どれを選んでもOKですが、アニメ系イラストなら『R-ESRGAN 4x+Anime6B』あたりがおすすめです。
Scale Factorは拡大率。元の画像を何倍にしたいかを設定しましょう。
Tiled Diffusionでの拡大結果
まずはScale Factor=2に設定して、2倍に拡大されたイラストを生成しました。このブログ上で見るだけだと元イラストとの違いがわかりづらいと思うので、部分的に拡大・比較してみましょう。
拡大前のイラストでは描き込みが少なくぼやけている状態…。高画質化されたことによって、かなりクオリティが上がっていますね。
4倍に拡大すると、その差はより大きくなります。
先ほどはきれいに見えていた2倍拡大後のイラストも、4倍に拡大したイラストと比べるとぼやけて見えます。
このように、生成したイラストを高画質化することでクオリティを大幅にアップさせることができるので、ぜひTiled Diffusionを試してみてください。
エラーになる場合はTiled VAEを使おう
Tiled diffusionを使っていてVRAM不足のエラーが発生する場合は、Tiled VAEを有効化しましょう。
Tiled diffusionの下にある『Tiled VAE』にチェックを入れるだけでOK。
Tiled VAEを使うことでVRAMの使用量を抑えることができます。これがHires.fixとの大きな違いですね。
筆者の環境(グラボ:RTX 3060)で、Tiled VAEを使わずにイラストを3倍に拡大しようとすると
このようにVRAM不足のエラーが。
しかし、Tiled VAEを有効化すると4倍・5倍への拡大でも一発でOK。VRAMが少なめのグラボを使っている方は特に重宝するでしょう。
そのぶんTiled VAEを有効化すると生成時間が少し長くなるので、VRAM容量と相談しながら有効⇔無効を切り替えるのがおすすめです。
さらにVRAM使用量を抑えるなら
Tiled VAEを有効化してもVRAMが不足する場合は、Tile sizeの値を小さく設定してみましょう。
ただし、Tile sizeが小さいほど生成されるタイルの数が増えるため速度は低下してしまいます。エラーにならない範囲で大きめにしておきましょう。
Region Prompt Controlでプロンプトの適用範囲を指定できる
Tiled diffusionを導入すると、Region Prompt Controlという機能も付属してきます。これはイラストを複数の領域に分割し、それぞれに別のプロンプトを適用できるようにするものです。
上のイラストは、このように赤とオレンジで領域を指定し、赤の領域に女性を描くよう指示したもの。
通常のプロンプトによる指示では、イラストのどの部分になにを描くかまではなかなか指示できませんでした。Region Prompt Controlを使って細かく指示を出すことでガチャの成功確率を爆上げすることができるでしょう。
Region Prompt Controlの使い方は以下の記事で詳しく解説しています。
>>【Stable Diffusion】プロンプトの範囲を指定するRegion Prompt Controlの使い方!
もっとスムーズにイラストを生成したいなら…
もしあなたがもっと快適にAIイラストを生成したいなら、グラボを見直してみるのがおすすめです。
グラボはAIイラストを生成するうえで最も重要なパーツ。いくらCPUやメモリが高性能でもグラボがしょぼかったら致命的です。
本格的に取り組んでいくのなら、グラボにはケチらず投資しましょう。最低でも12GBのVRAMは確保しておきたいところ。VRAMが2GB・4GBくらいしかない古いグラボだと高解像度化や学習に大きな支障が出てしまいます。
コスパを重視する方・予算が5万円以下の方はRTX 3060一択と言っていいでしょう。
もう少し予算が確保できて、さらにハイスペックなグラボに興味がある方は以下の記事もお読みください。きっとあなたに合ったグラボが見つかりますよ。
>>【コスパ重視】Stable Diffusionにおすすめのグラボ3選!
PCごと買い替えを検討している方は以下の記事をお読みください。快適にStable Diffusionを使えるマシン3選を紹介しています。
>>Stable Diffusionにおすすめのパソコン3選と推奨スペックを解説!
生成した大量のイラストを簡単に管理する方法
Stable Diffusionで生成した大量のイラストを効率的に管理するなら『Eagle』というツールがおすすめ。
イラストを生成するとメタデータが自動でEagleに送られ、タグやメモとして保存されます。このタグを使うことで検索や管理がとても楽ちん。
例えば『a dog』というタグで検索すると、そのプロンプトで生成されたイラストだけを表示することができます。『あのイラストどんなプロンプトで生成したっけ?』『LoRAのトリガーワード忘れた』なんて迷わずに済みますよ。
Eagleは本来『約4,000円・買い切り型』の有料ツールですが、30日間の無料体験ができるので、とりあえず試してみてください。
『【Stable Diffusion】Tiled diffusionの使い方とインストール方法を解説!』のまとめ
- Tiled diffusionはイラストをタイルのように分割して拡大する手法
- VRAMの使用量を抑えられるのでおすすめ
- VRAM容量と相談しつつ設定を変更しよう
ここまでお読みいただきありがとうございました!
他にもわからないことがあったら以下の記事をお読みください。初心者向けにStable Diffusionの使い方を一から解説しています。