AIによる画像生成の話題がHOT
最近はAIによる画像の自動生成の話題が盛り上がってますね。
ここ数ヶ月で「midjourney」や「Stable Diffusion」などのサービスが出てきて誰でも画像生成AIを使える時代がやってきました。
またイラストレーターが自分のイラストを学習させて別のイラストを生成できる日本のサービス「mimic」も大きな話題となりました。
自分はわりかしスルー気味だったのですが、ふたばちゃんねるmayの「AIに絵を書いてもらうスレ」をたまたまのぞいてみたら結構面白そうで俄然興味がでてきました。
自分のWindowsのPCでもStable Diffusionが使えるとのことだったので実際にやってみました。
画像生成AI「Stable Diffusion」をローカルにインストールしてみる
Stable DiffusionはイギリスのStability AIが開発した画像生成AIです。
デモサイトはこちら↓
Stable DiffusionはPythonの実行環境が必要で導入が少しめんどくさいのですが、今は一発で自動的にインストールできるパッケージがあるとのこと。
そのうちの1つ「NMKD Stable Diffusion GUI」をインストールすることにしました。
NMKD Stable Diffusion GUIのWindowsへのインストールのしかた
インストールの前に動作環境の確認です。
グラフィックボードがNvidia製のものであることが最低条件でVRAMが8GB以上必要とのことですが、自分のPCはRTX3060(12GB)なので一応クリア。
インストールは下記のサイトを参考にしました。
やり方は上記サイトに書いてあるのでここではその経過をメモ程度に。
ファイルは階層が深いとエラーになる可能性があるとのことなのでCドライブ直下にStableDiffusionというフォルダを作りそこに置いて解凍しました。
実行したら最初にウインドウが出ます。
VRAMが8GB必要で、VRAMが12GBない場合は512×512の解像度を強く推奨するなどのWarningメッセージが書かれてあります。
確認しOKを押すとインストーラが出るので「Install」を押します。
何も起こらないように見えますがちゃんと走っていて、15分くらいかかります。
インストールが終わったらインストーラに書いてあるモジュールに全部チェックが入っていたのでこれで完了です。かんたん!
画像生成実行時にエラーが出たので対処
で、何も考えずとりあえず画像を生成してみたのですが、画像が何も表示されず出力フォルダ(outフォルダ)にも何も出力されていません。
条件を変えても同じです。
エラーになっているのかと思いログを確認。
画面のアイコンからログファイルが置いてあるフォルダを開くことができます。
ルグファイルの「sd.txt」をのぞいてみると
File "C:\StableDiffusion\StableDiffusionGui-v1.2.0\Data/repo/scripts/dream.py", line 12, in <module>
import ldm.dream.readline
ModuleNotFoundError: No module named 'ldm'
というエラーを吐いていました。
調べてみると、c++ build tools(ver14.0)が必要とのことでした。
下記サイトからダウンロードして実行し、
「C++ によるデスクトップ開発」を選択してインストールします。
NMKD Stable Diffusion GUIのファイルが置いてあるフォルダは一旦削除し、ファイルの解凍からやり直します。
そして再度起動しモジュールをインストールです。
画像生成できました
試しにpromptに「Kyoto」(京都)とだけ入れて画像生成してみました。
ちゃんとAIが京都に関係した画像を生成してくれました!
これでStable Diffusionのローカルでの環境作りは完了です。かんたんでしたね。
NMKD Stable Diffusion GUIのバージョンを1.3.0へ
この記事を書いてたらNMKD Stable Diffusion GUIのバージョンが1.2から1.3へ上がっていたのでバージョンアップ。
参考にしたのは下記記事。
バージョンアップして画像が生成できるのを確認しました。
Face Restoractionの項目は0以外にすると同一の画像が2枚生成されるようです。
Stable Diffusionのプロンプトに入れる呪文の作り方を調べる
環境はできたので次はかわいいイラストの生成です。
Promptに入れる言葉は通称「呪文」と呼ばれ、特定の単語を組み合わせるときれいな画像が生成される……らしいです。
Promptへ適当に言葉を入れてもなかなかお目当ての画像は出ないのでまずは「呪文」について調べました。
参考にしたサイト
他にはふたばちゃんねるmayの「AIに絵を描いてもらうスレ」を読んで学びました。
呪文を作って画像を生成してみた結果
まずは誰かが作った呪文をコピペしそれを改変して様子を見ていきます。
コピペしてみたものがこちら↓
なかなかにすごい呪文です。
これをベースにいらないところを削除し各サイトで得た呪文を追加して何回も調整していきます。
今回は「女竜騎士」を目指して作っていきました。
で、最終的にできた呪文で150枚生成。良いものをピックアップしてみました。
わりと良い感じではないでしょうか?
呪文の質にもよりますが、150枚のうち顔や体が崩れているものがほとんどですがこういう良いものも何枚かは出てきます。
この画像の呪文は下記になります。
a Portrait image of a Digital Illustration Teenage Anime full body Dragon Knight ultra cute face girl wearing latex green metalic steel bikini armor walking in casino floor, painted in kyoto animation style by artgerm,metart by KANNA HASHIMOTO, mucha, by Granblue Cygames and Violet Evergarden, cell shaded, photorealistic, pixiv, 4k
STEP数は80、Creativenessは7.5、解像度は512×512です。
本当はビキニアーマー装備でカジノを歩いている姿にしたかったのですがうまく生成されませんでした。
最後の方にある「metart by KANNA HASHIMOTO, mucha」は魔法の言葉でイラストの見栄えがかなり上がるとのこと。byグランブルーファンタジーという言葉も魔法の言葉でファンタジー系にはとても効果があるようです。
他にもこういうものが生成できました。
これからも色々試してみます
画像生成AIを体験してみましたが、これめっちゃ楽しいです。
新しい呪文を試す時画像がどのように出来上がるかのワクワク感もありますし、えっちな単語を入れてみたときのドキドキ感もありますし。(NMKD Stable Diffusion GUIはR18フィルタは入っていません)
うまく使えたらブログや動画の素材にもできるかもしれません。
現状は難しいかもしれませんがこれから次第ですかね。
これからもStable Diffusionをちょこちょこ試していって遊んでみたいと思います。
またStableDiffusionで何かあればブログ記事を書いてみたいと思います。
[追記] Stable Diffusionや作った画像をまとめるwikiを立てました
情報があっちこっちしていけないので自分用にwikiを立てました。
いろいろメモしていきます。
コメント