話題のStable Diffusionのローカル環境を作って試してみました【AI画像生成】【NMKD Stable Diffusion GUI】

スポンサーリンク

AIによる画像生成の話題がHOT

最近はAIによる画像の自動生成の話題が盛り上がってますね。
ここ数ヶ月で「midjourney」や「Stable Diffusion」などのサービスが出てきて誰でも画像生成AIを使える時代がやってきました。
またイラストレーターが自分のイラストを学習させて別のイラストを生成できる日本のサービス「mimic」も大きな話題となりました。

自分はわりかしスルー気味だったのですが、ふたばちゃんねるmayの「AIに絵を書いてもらうスレ」をたまたまのぞいてみたら結構面白そうで俄然興味がでてきました。

自分のWindowsのPCでもStable Diffusionが使えるとのことだったので実際にやってみました。

画像生成AI「Stable Diffusion」をローカルにインストールしてみる

Stable DiffusionはイギリスのStability AIが開発した画像生成AIです。
デモサイトはこちら↓

Stable Diffusion - a Hugging Face Space by stabilityai
Discover amazing ML apps made by the community

Stable DiffusionはPythonの実行環境が必要で導入が少しめんどくさいのですが、今は一発で自動的にインストールできるパッケージがあるとのこと。
そのうちの1つ「NMKD Stable Diffusion GUI」をインストールすることにしました。

NMKD Stable Diffusion GUIのWindowsへのインストールのしかた

インストールの前に動作環境の確認です。

グラフィックボードがNvidia製のものであることが最低条件でVRAMが8GB以上必要とのことですが、自分のPCはRTX3060(12GB)なので一応クリア。

インストールは下記のサイトを参考にしました。

画像生成AIのStable Diffusionをコマンド不要で簡単に使えるソフト NMKD Stable Diffusion GUI
入力したテキストから画像を生成したり、自分が描いた落書きに説明テキストを加えれば思い通りの絵に変えたりできるAI「Stable Diffusion」 ↑a slee
画像生成AI「Stable Diffusion」をWindows環境にボタン1つでインストール可能&GUIで操作できる「NMKD Stable Diffusion GUI」がついに登場
入力した文字列から高精度な画像を生成できるAI・Stable Diffusionは2022年8月に無料で一般公開され、「基本的に出力した画像は商用・非商用を問わず、自由に利用できる」というライセンスで大きな話題となりました。しかし、Stable DiffusionをローカルなWindows環境に導入して使うには、Pyt...

やり方は上記サイトに書いてあるのでここではその経過をメモ程度に。

ファイルは階層が深いとエラーになる可能性があるとのことなのでCドライブ直下にStableDiffusionというフォルダを作りそこに置いて解凍しました。

実行したら最初にウインドウが出ます。
VRAMが8GB必要で、VRAMが12GBない場合は512×512の解像度を強く推奨するなどのWarningメッセージが書かれてあります。

確認しOKを押すとインストーラが出るので「Install」を押します。
何も起こらないように見えますがちゃんと走っていて、15分くらいかかります。

インストールが終わったらインストーラに書いてあるモジュールに全部チェックが入っていたのでこれで完了です。かんたん!

画像生成実行時にエラーが出たので対処

で、何も考えずとりあえず画像を生成してみたのですが、画像が何も表示されず出力フォルダ(outフォルダ)にも何も出力されていません。
条件を変えても同じです。

エラーになっているのかと思いログを確認。
画面のアイコンからログファイルが置いてあるフォルダを開くことができます。

ルグファイルの「sd.txt」をのぞいてみると

File "C:\StableDiffusion\StableDiffusionGui-v1.2.0\Data/repo/scripts/dream.py", line 12, in <module>
import ldm.dream.readline
ModuleNotFoundError: No module named 'ldm'

というエラーを吐いていました。

調べてみると、c++ build tools(ver14.0)が必要とのことでした。
下記サイトからダウンロードして実行し、

Microsoft C++ Build Tools - Visual Studio

「C++ によるデスクトップ開発」を選択してインストールします。

NMKD Stable Diffusion GUIのファイルが置いてあるフォルダは一旦削除し、ファイルの解凍からやり直します
そして再度起動しモジュールをインストールです。

画像生成できました

試しにpromptに「Kyoto」(京都)とだけ入れて画像生成してみました。

ちゃんとAIが京都に関係した画像を生成してくれました!
これでStable Diffusionのローカルでの環境作りは完了です。かんたんでしたね。

NMKD Stable Diffusion GUIのバージョンを1.3.0へ

この記事を書いてたらNMKD Stable Diffusion GUIのバージョンが1.2から1.3へ上がっていたのでバージョンアップ。
参考にしたのは下記記事。

NMKD Stable Diffusion GUI 1.3.0 の新機能・導入/更新方法
画像生成AIの「Stable Diffusion」をコマンド操作不要で使えるソフト「NMKD Stable Diffusion GUI」が 2022/09/06 に

バージョンアップして画像が生成できるのを確認しました。
Face Restoractionの項目は0以外にすると同一の画像が2枚生成されるようです。

Stable Diffusionのプロンプトに入れる呪文の作り方を調べる

環境はできたので次はかわいいイラストの生成です。
Promptに入れる言葉は通称呪文と呼ばれ、特定の単語を組み合わせるときれいな画像が生成される……らしいです。

Promptへ適当に言葉を入れてもなかなかお目当ての画像は出ないのでまずは「呪文」について調べました。

参考にしたサイト

Prompt 呪文詠唱 完全入門 ~ Midjourney , StableDiffusion ~
Stable Diffusion Prompt (呪文)攻略|siba.|note
1週間ほどStable Diffusionで遊びまくった結果、自分の望んでいるような画像を格段に高い確率で生成させられるようになったので攻略法を紹介します。 どれぐらい攻略したかというと、「少女終末旅行のような画像」を生成したいと思ってPromtを用意し、Stable Diffusion Demoの4枚生成で1度生成...
StableDiffusionでのkawaii生成のための指針|chili|note
前置き こんにちはchiliと申します。 852話さんのkawaiiのツイート以来、kawaiiの作成を頑張っています。 深夜に一般公開されたstable Difusionでの画面映えを意識したキャラクターのイラストの出力が、プロンプトの練度を上げたところ中々にえぐい。の画像まとめ。 AIartが今後どうなってい...
Just a moment...

他にはふたばちゃんねるmayの「AIに絵を描いてもらうスレ」を読んで学びました。

呪文を作って画像を生成してみた結果

まずは誰かが作った呪文をコピペしそれを改変して様子を見ていきます。
コピペしてみたものがこちら↓

なかなかにすごい呪文です。

これをベースにいらないところを削除し各サイトで得た呪文を追加して何回も調整していきます。
今回は「女竜騎士」を目指して作っていきました。

で、最終的にできた呪文で150枚生成。良いものをピックアップしてみました。

わりと良い感じではないでしょうか?
呪文の質にもよりますが、150枚のうち顔や体が崩れているものがほとんどですがこういう良いものも何枚かは出てきます。

この画像の呪文は下記になります。

a Portrait image of a Digital Illustration Teenage Anime full body Dragon Knight ultra cute face girl wearing latex green metalic steel bikini armor walking in casino floor, painted in kyoto animation style by artgerm,metart by KANNA HASHIMOTO, mucha, by Granblue Cygames and Violet Evergarden, cell shaded, photorealistic, pixiv, 4k

STEP数は80、Creativenessは7.5、解像度は512×512です。

本当はビキニアーマー装備でカジノを歩いている姿にしたかったのですがうまく生成されませんでした。
最後の方にある「metart by KANNA HASHIMOTO, mucha」は魔法の言葉でイラストの見栄えがかなり上がるとのこと。byグランブルーファンタジーという言葉も魔法の言葉でファンタジー系にはとても効果があるようです。

他にもこういうものが生成できました。

これからも色々試してみます

画像生成AIを体験してみましたが、これめっちゃ楽しいです。
新しい呪文を試す時画像がどのように出来上がるかのワクワク感もありますし、えっちな単語を入れてみたときのドキドキ感もありますし。(NMKD Stable Diffusion GUIはR18フィルタは入っていません)

うまく使えたらブログや動画の素材にもできるかもしれません。
現状は難しいかもしれませんがこれから次第ですかね。

これからもStable Diffusionをちょこちょこ試していって遊んでみたいと思います。
またStableDiffusionで何かあればブログ記事を書いてみたいと思います。

コメント