今回は、本来ならハイスペックなGPUを搭載したコンピューターでないと動作が厳しい画像生成AI「Stable Diffusion web UI」をGoogleコラボ(Google Colaboratory)を利用して動作させてみた感想です。
高度なGPU(外付けグラフィックボード)のないPCで「Stable Diffusion web UI」を動かしてみたい人には、ある程度は参考になるかも知れません。
- 本格的画像生成AI「Stable Diffusion web UI」
これまで自分が書いてきた画像生成AI関連の記事で、ハイスペックな自分のPCの中に画像生成環境を構築して動作させる本格的な画像生成AIと、Web上で動くサービスに二分されると書いてきました。
今回は、本来ハイスペックなGPUが作業する筈の部分をGoogleのサービスであるGoogleコラボ(Google Colaboratory)を利用して動作させた実験です。
- それでもITの知識は必要
結論を先に言うと
- 取りあえず動く
- 無料版の容量制限の縛りは辛い
- ITの知識がないと結局使いこなせない
と言ったトコロですw
- 「Stable Diffusion web UI.」をGoogleコラボで動かす
何を言っているのか分からない人向けに雑に説明すると、本来ならば自分のPCに設置した求められる性能を満たした装置を使って大容量の計算をさせて動かさなければならない部分を、Googleが提供しているGoogleコラボというサービスで、グーグルが用意している設備を借りて動かすという事です。
- 動かし方
自分もIT関連はチンプンカンプンなので、何も分からないまま下の動画の通りに操作しました。
実際には一発で何の問題なくすんなり出来た訳ではなく、多少の試行錯誤はしました。
- 取りあえず動く
一応動くことは動きますw
但し、ITの知識がないと使いこなせませんw
例えるとプロが使う超高性能な一眼レフカメラのようなモノで、取りあえずカメラ本体は手に入りましたが、自分が必要なレンズやフィルター、三脚や照明、ストロボ、レフ板
フィルムの時代だと最適な感度のフィルムの選択等は、風景を撮りたいのか?スタジオで人物を撮りたいのか?に応じて、全部自分で目的に合うモノを選んで自分で入手して自分で装着しないと撮りたい写真は撮れない訳ですが、それにはカメラの知識が必要なのです。
動画の指示通りにセットした仕様は「実写系のアジア人の美女」に特化したセットだったので、アニメ系等別の仕様に変更したければ、アニメ系の仕様を公開している場所へ行ってセットを貰ってきて、それが動作するように自分で「Stable Diffusion web UI」の中に組み込まなければならないのですが、IT関連はチンプンカンプンなのでサッパリ判らず、今のところ「実写系のアジア人の美女」の生成しか出来ませんw
しかもシャッタースピードや露出が物凄く細かく調整出来るカメラでも、ドレをどう調整すればどうなるのかの知識と操作方法を知らなければマトモな写真すら撮れません。
「Stable Diffusion web UI.」はカメラに例えると、それこそ無数のサードパーティーから出ている様々なアタッチメントが装着可能で、
レコーディングスタジオのミキサーに例えると、あの無数のスイッチやレバーのように細かい微調整も可能なのですが、知識のある人が的確にアタッチメントを選んだり、スイッチやレバーを操作しなければ、ロクな画像は生成出来ないという事になります。
- I2I(イメージtoイメージ)で生成したサンプル
実際にI2I(イメージtoイメージ)で読み込ませた画像を元に生成してみます。
尚、読ませた画像は昨年自分が描いたモノです。
他人の描いたイラストや他人が撮影した写真、アニメのキャプチャ等を無断で盗んでI2Iで読み込ませて生成させたモノを公開するのは、著作権的に問題のある犯罪行為にも成りうる上に、倫理的にも下劣な窃盗行為です。
自分で絵を描いたり写真を撮る能力のない人は、盗んだモノを読み込ませないでT2I(テキストtoイメージ)で生成して下さい。
1.赤い水着
読んだ画像とプロンプトのどちらを重視するかのパラメーターを、プロンプト重視側に振り過ぎたら水着の色が変わってしまいました。
プロンプトでは服装や背景は指示していません。
読んだ画像重視側に振ると赤い水着に戻りましたが、更に画像重視側にすると、元がアニメ絵でAIはリアルを目指すので、処理しきれなくなってもれなく顔面が崩壊します。
2.クルマに寄り掛かるまどかです。
プロンプト重視側に振り過ぎて服装が変わってしまいました。
読んだ画像重視側に振ると服装が戻りましたが、顔面や髪は崩壊し始めています。
既に背景の雲や樹木が、写真風から絵っぽくなっています。
服装も背景も指示していないので、プロンプト側に強め過ぎると背景も服装も変わってしまいました。
服を指示していない為に肌の露出度が高まりました。
更にプロンプト側に強めた場合、ポーズも変わって読み込んだ画像から遠ざかって行きます。
ちなみにプロンプト側MAXに設定しても、ポーズと背景が読んだ画像とまるっきり違うモノになるだけで、稀にトップレスになる事はありますが、服を指示していないからと言って全裸になる事はまずありませんw
3.白ビキニのまどかです。
こちらはパラメーターを調整しても、服装も背景もあまり変化しませんでした。
別途絵の精度を加減する指標もあり、そちらを加減しています。
精度の指標を上げたので顔が変わりました。指標を下げると顔面が崩壊しやすくなり、上げ過ぎると負荷が掛かり過ぎてGoogleコラボが停止します。
- 無料版の容量制限の縛りは辛い
Googleコラボには無料版と課金版があります。
自分は無料版を利用していますが、無料版には使用容量の制限があります。
また、容量以上の負荷を掛けてしまうとエラーで動作が止まってしまいます。
なかなか思ったような画像が生成出来なくて、何回も設定を微調整しながら何枚も画像を生成していると突然画像が生成出来なくなり、リロードボタンを押すとエラーと表示されてしまいます。
再度「Stable Diffusion web UI」を読み込ませようとすると「1日の使用量の上限を超えました」と表示されて動きません。
また生成の際に設定を誤って、知らないでうっかり瞬間最大高負荷を掛けてしまってもエラーとなって「Stable Diffusion web UI.」が中断してしまうので、正直扱いづらいです。
Web上で動く画像生成AIサービスのように、1日○○トークンとか○○ポイント付与されて消費量が目に見えて、復活する時間も明確なら良いのですが、Googleコラボの場合は残量がどれくらいなのかも使い切った時点でいつ復活するのかも不明瞭なのも難点です。
何度も微調整しながら生成を繰り返している最中、途中で容量を使い切ってしまい突然中断、続きがいつ再開出来るのかが判らないのはかなりフラストレーションが溜まりますw
- 結論
自分が実際に使ってみた結果、感じた結論は以下の通りです。
Googleコラボを利用すれば、取りあえず低スペックなPCでも「Stable Diffusion web UI」が使えますが、ITの知識がないと使いこなせなくて持て余します。
Googleコラボの無料版は容量制限に翻弄されるので、ITのスキルがあってガッツリ使いたい人は課金したほうが良いです。
但しそこまで本気で「Stable Diffusion web UI」をやるなら、資金を投資してハイスペックなPC環境を構築したほうが良いように思います。
今回紹介する本はキンドル版で、キンドル会員ならば無料のようです。
画像生成AIを解説した本のようです。AIイラストは猛スピードで進化しているので、最新の情報ではないですが、画像生成AIの概要は掴めるかも知れません。
これ一冊でざっくりわかるAI×イラスト解析本
美少女AIイラスト本はかなり多数出ており、キンドル会員なら無料も多いので、試しに好みの絵柄を探してみるのもアリかも知れません。
AI生成イラスト集 美少女大百科 第10巻: AI-generated illustrations, Bishojo Encyclopedia, Vol. 10 (English Edition)
AIで描画された廃墟の画像集のようです。
残響廃墟〜自然と幻想が融合する美しきAI廃墟の世界〜
こちらはリアルな現実の廃墟です
廃墟の歩き方 探索編
Amazonアソシエイト Amazonのアソシエイトとして、当メディアは適格販売により収入を得ています。
【AD】社内や町内会等のちょっとしたチラシに、ちょっと風景的な画像やイラストを挿入したい時など、イラストACやフォトACを探せば出てきます。
この記事のスタジオのミキサー画像もフォトACを利用しています。
会員登録で無料で1日数枚ダウンロード可能です。イラストACもフォトACも1つのIDで利用可能です。自分も数点イラストを投稿しています。ご利用下さい。