Stable Diffusionをもっと高速にするWeb UI『Forge』の導入方法・使い方!
こういったお悩みにお答えします。
現在、ローカル環境でStable Diffusionを動かすときに主流になっているのが『stable-diffusion-webui(A1111)』。導入のハードルも低くアップデートも頻繁に行われるため、多くのユーザーが利用しています。
そんな中、A1111を改良した『Forge』というWeb UIが開発・リリースされ注目を集めています。既存のA1111よりも高速化・VRAM容量を削減できるのが大きなメリット。
この記事では
- Stable Diffusionをもっと高速にするWeb UI『Forge』の特徴は?
- Forgeのメリット3つ
- Forgeに移行する際の注意点・デメリット
- Forgeの導入方法
- Forgeの使い方・設定
- 【RTX4090環境】Forge・A1111それぞれの生成速度を比較
- もっとスムーズにイラストを生成したいなら…
- 生成した大量のイラストを簡単に管理する方法
これらについて解説していくので、最後まで読むとForgeを使って今までよりも快適にイラスト生成を楽しむことができるようになります。
Stable Diffusionをもっと高速にするWeb UI『Forge』の特徴は?
ForgeはStable Diffusionをパソコン上(ローカル環境)で動かすためのWeb UIの一つ。
Hey all SD-WebUI developers look here!
Stable-Diffusion-WebUI-Forge is a new platform to (1) completely solve the speed and VRAM problem and (2) adding UNet Patcher System to webui so that many new features can be implemented in about 100 lines of codes.https://t.co/lTmEr873I8— style2paints (@lvminzhang) February 6, 2024
ControlNetの開発者としても有名なlllyasviel氏によって開発されました。
Stable Diffusionを用のWeb UIと言えばAUTOMATIC1111が開発した『stable-diffusion-webui(A1111)』有名ですが、ForgeはA1111をベースにしつつより高速化できるように改良されたWeb UI。生成速度に悩んでいる人におすすめです。
Forgeのメリット3つ
Forgeのメリットは
- 1.生成速度がアップする
- 2.VRAMの使用量が削減できる
- 3.A1111からの移行が簡単
これら3つ。順番に解説します。
1.(A1111と比べて)生成速度がアップ
公式Githubによると、Forgeを使うことで
- VRAM:6GB ⇒ 約60~75%アップ
- VRAM:8GB ⇒ 約30~45%アップ
- VRAM:24GB ⇒ 約3~6%アップ
A1111と比べてこのくらいの高速化が期待できるとのこと。
使っているGPUのVRAM容量が小さいほど、Forgeによる高速化の度合が大きいのが特徴です。比較的低いスペックのGPUを使っている人ほど、Forgeへの乗り換えを積極的に検討したほうがよさそうですね。
※この記事の下のほうではRTX4090環境での比較をしているので、ハイスペックなGPUを積んでいる人も参考にしていただければ幸いです。
2.(A1111と比べて)VRAMの使用量が削減できる
Forgeでは生成時に使用するVRAM容量を削減してくれるため、今までよりもバッチサイズ(一度に生成する枚数)を上げることが可能になります。
バッチサイズを増やしすぎてOOM(Out of memory)エラーが出た経験がある人も多いはず。
公式によると、Forgeを使うことで
- VRAM:6GB ⇒ バッチサイズ約4倍までOK
- VRAM:8GB ⇒ バッチサイズ約4~6倍までOK
- VRAM:24GB ⇒ バッチサイズ約2倍までOK
このくらいに増やしてもエラーにならずに済むとのこと。一度にたくさん生成できるようになるのはうれしいですね。
3.A1111からの移行が簡単
この画像のとおり、ForgeのUIはA1111とそっくりです。そのため操作方法を一から覚える必要はありません。A1111を使い慣れている人でも違和感なく移行できるでしょう。
後ほど解説しますが、A1111で使っているモデルやLoRAなども簡単に共有できます。
Forgeに移行する際の注意点・デメリット
生成速度が上がったりVRAM使用量が抑えられたりとメリットの多いForgeですが
- エラーが多い
- 一部の拡張機能が対応していない
こういった注意点もあります。
Forgeはまだリリースされてから日も浅く、A1111よりもエラーが多い印象。頻繁なアップデートにより修正対応されていますが、あなたの環境で不具合が出ないとも限りません。
また、Forgeではまだ対応していない拡張機能もあります。必須の拡張機能がある人は事前にチェックしておきましょう。
しばらくはA1111との併用がおすすめ
予期せぬ不具合などのリスクに備えるため、Forgeのインストール後もA1111環境を残しておくのがおすすめです。
そもそも、どちらか一方のUIに絞る必要もありませんからね。筆者は『普段は生成が速いForgeを使うけど、なにか問題があったらすぐA1111に戻ろう』くらいのスタンスで作業しています。
Forgeの導入方法
実際にForgeを導入する手順について解説していきます。なお、この記事ではすでにA1111を使用している人を想定しているのでご了承ください。
A1111を入れたことがない人は
Githubから、GitやPythonごとインストールできるパッケージをDLしましょう。DLしたらフォルダ内にある『update.bat』を起動するとインストールが開始します。
すでにA1111を導入しており、GitやPythonの環境構築ができている人は
Forgeをインストールしたいフォルダで右クリック(Windows11の場合はShift+右クリック) → Git Bash Hereを選択
『git clone https://github.com/lllyasviel/stable-diffusion-webui-forge.git』と入力。Enterを押すとインストールが始まります。
インストールが完了すると『stable-diffusion-webui-forge』というフォルダが作成されているはず。
フォルダを開くと、どこかで見たようなファイルがずらり。下から2つ目の『webui-user』というバッチファイルをクリックしましょう。
初回は起動まで少し時間がかかりますが、完了するとこのような画面が開きます。A1111と見分けがつきませんね。
相違点としては、ControlNetなどたくさんの拡張機能がデフォルトで備わっていることでしょう。わざわざ個別でインストールする必要がなく便利ですね。
Forgeの使い方・設定
『早速Forgeで生成してみよう!』と思っても、まだモデルやLoRAが空っぽのはず。
Forge上でモデルやLoRAを使うには、A1111のときと同様に
- モデル:models/Stable-diffusion
- LoRA:models/Lora
など、特定のフォルダに放り込む必要があります。
A1111と併用する場合はパスを書き換えよう
特定のモデルやLoRAをForgeだけで使う場合・A1111を削除して完全にForgeに乗り換える場合は上記のフォルダにファイルを移動させれば問題ありません。
しかし、A1111と併用したい人もいるでしょう。その場合、お気に入りのモデルなどA1111でもForgeでも使うファイルはそれぞれのフォルダ内に入れておく必要があります。データが2つ必要になってしまう、ということですね。これではSSDの容量がどんどん圧迫されてしまいます。
そんなときは、A1111とForgeで『同じフォルダ』を参照するように設定しましょう。そうすれば元のファイルは1つだけでOK。管理も楽ちんです。
設定はとても簡単。『stable-diffusion-webui-forge』フォルダ内の『webui-user.bat(起動時にクリックするやつ)』を右クリックし『編集』画面に。
このテキスト上で『どのフォルダを参照するか』を変更することができます。
上から6行目の『set COMMANDLINE_ARGS=』の右側にそれぞれのフォルダパスを記入していきます。
モデルのフォルダを共有したい場合は『--ckpt-dir=”モデルが入っているフォルダのパス”』、LoRAを共有したい場合は『--lora-dir=”LoRAが入っているフォルダのパス”』を記載すればOK。
フォルダパスの確認の仕方は
もともとモデルやLoRAが入っているA1111のフォルダを開き、アドレス欄をコピーしましょう。
記入が終わったら保存 ⇒ 終了したのちForgeを再起動すると、モデルやLoRAが共有されているはずです。
【RTX4090環境】Forge・A1111それぞれの生成速度を比較
筆者の環境で、ForgeとA1111それぞれの生成速度を比べていきます。比較時のプロンプトやsampler・steps数などは同じ条件です。
標準サイズ10枚のイラストを生成
SDXLの標準サイズである1024×1024のイラストを10枚(2×5枚)生成してみると
- Forge:47秒
- A1111:52秒
両者で5秒の差がつきました。言い換えると『Forgeのほうが10%ほど速かった』という結果です。
筆者の環境はRTX4090(VRAM24GB)なので、公式の説明書きによると約3~6%しか速度がアップしないはず。
使用環境によるかもしれませんが、高スペックGPUを使っている人でもそこそこの速度上昇が見込めそうです。
2倍にアップスケール
次に、生成した1024×1024のイラストを2倍のサイズ(2048×2048)にアップスケールしてみましょう。
- Forge:26秒
- A1111:34秒
Hires.fixをほぼ初期設定のまま(DS0.7・Latent)で回しました。こちらでは20%ほどの速度差がありますね。
また、VRAMの使用量もForgeのほうが抑えられていました。
i2iでさらに2倍にアップスケール
img2imgタブに移動し、『Just Resize』モードでさらに2倍(2048×2048 ⇒ 4096×4096)にしてみましょう。
- Forge:2分22秒
- A1111:エラー
A1111でOOM(メモリ不足)エラーが出るのは想定どおり。これを防ぐためにTileとかを使っているわけですし。
その一方、Forgeではエラーにならず生成が完了してしまいました。すごい。
『VRAM使用量を削減でき、エラーを防げる』という公式での説明は大げさではなかったようです。普段からOOMでお悩みの方はForgeに乗り換えると生成の幅が広がりそうですね。
もっとスムーズにイラストを生成したいなら…
もしあなたがもっと快適にAIイラストを生成したいなら、グラボを見直してみるのがおすすめです。
グラボはAIイラストを生成するうえで最も重要なパーツ。いくらCPUやメモリが高性能でもグラボがしょぼかったら致命的です。
本格的に取り組んでいくのなら、グラボにはケチらず投資しましょう。最低でも12GBのVRAMは確保しておきたいところ。VRAMが2GB・4GBくらいしかない古いグラボだと高解像度化や学習に大きな支障が出てしまいます。
コスパを重視する方・予算が5万円以下の方はRTX 3060一択と言っていいでしょう。
もう少し予算が確保できて、さらにハイスペックなグラボに興味がある方は以下の記事もお読みください。きっとあなたに合ったグラボが見つかりますよ。
>>【コスパ重視】Stable Diffusionにおすすめのグラボ3選!
PCごと買い替えを検討している方は以下の記事をお読みください。快適にStable Diffusionを使えるマシン3選を紹介しています。
>>Stable Diffusionにおすすめのパソコン3選と推奨スペックを解説!
生成した大量のイラストを簡単に管理する方法
Stable Diffusionで生成した大量のイラストを効率的に管理するなら『Eagle』というツールがおすすめ。
イラストを生成するとメタデータが自動でEagleに送られ、タグやメモとして保存されます。このタグを使うことで検索や管理がとても楽ちん。
例えば『a dog』というタグで検索すると、そのプロンプトで生成されたイラストだけを表示することができます。『あのイラストどんなプロンプトで生成したっけ?』『LoRAのトリガーワード忘れた』なんて迷わずに済みますよ。
Eagleは本来『約4,000円・買い切り型』の有料ツールですが、30日間の無料体験ができるので、とりあえず試してみてください。
『Stable Diffusionをもっと高速にするWeb UI『Forge』の導入方法・使い方!』のまとめ
- ForgeはA1111を改良したローカル用Web UIの一つ
- A1111よりも高速でVRAM使用量を削減できる
- まずはA1111と併用するのがおすすめ
ここまでお読みいただきありがとうございました!
他にもわからないことがあったら以下の記事をお読みください。初心者向けにStable Diffusionの使い方を一から解説しています。