賛否が分かれ物議を醸す画像生成AIについて、思った事・感じた事を実際に使ってみた上で書き記してみました。
これまで、画像生成AIの話題をジャンルの違う2つのはてなブログで扱ってきましたが、今回の話題は重複する内容を2回書くのがキツいので、こちらのブログに集約させて頂きます。
能書きを延々と垂れても誰も読まないので、先に使ってみて思った事を書いてみます。
- どうしてもぬぐえないパクり感が後ろめたい
その前に前提条件だけ書かせて下さいw
- 自分は本格的な画像生成AIのユーザーではなく、Web版の無料使用枠の利用者です。
- 画像生成AIに精通している訳でも、自在に何でも生成出来るスキルを持っている訳でもない。
- 美少女AIイラストにもAI絵師にも興味は薄い。
- 趣味程度の絵は描ける、短大ながら東京の美大を卒業しているので、最低限の絵のスキルはあると自負していますが、美大受験を経験しており、お山の大将、井の中の蛙ではなく自分より絵の上手な人は掃いて捨てるほどいる事も体験している。
という訳で、例題がクルマ系でなくて申し訳ありませんw
以前試して満足な結果が得られなかった画像生成AIを、今回新たに試してみた動機は、読み込んだ画像を参照して画像を生成出来るようになったと知ったからです。
呪文と呼ばれるプロンプトだけだと自分の思った画像を生成する事が出来なかったので、画像を参照出来ればイメージに近い画像が得られるのでは?という期待からでした。
画像が参照出来てもプロンプトは必要なので、画像からプロンプトを生成するAIを利用します。
読み込ませた、自分が描いた画像A
読み込ませた、自分が描いた画像B
画像から生成するプロンプトだけで画像生成しても、期待する画像は得られませんでした。
画像Aを読んでAIが考えたプロンプトで生成させた画像その1.
画像Aを読んでAIが考えたプロンプトで生成させた画像その2.
画像Aを読んでAIが考えたプロンプトで生成させた画像その.3で求めていたレベルの画像が得られました。
プロンプト+読み込ませた画像Bで構図も完全に一致し、元の絵Bを清書したような状態になりました。
画像自体の密度は高くなってプロ級のイラストに変わりましたが、求めていたのは「きまぐれオレンジロードの鮎川まどか」の画像だったので「凄い」と感心しましたが願望は叶いませんでした。
最低限の絵は描けると自負していましたが、自分の描いた絵のみすぼらしさが際立ってしまい、自尊心が傷つきましたww
AI絵師は、LoRAという追加学習をさせてキャラクターに寄せた絵を生成していると知り、Web無料版の自分には無理と断念しかけたところ、無料版でも簡易的な追加学習が出来るサービスが在ると知りました。
30枚の画像をフォルダに投入するだけなので、精度的には限界があると思います。
また、無料版だと制約がキツ過ぎて存分に色々試せないのが難点です。
画像のクオリティは極端に落ちましたが、鮎川まどかっぽい画像を生成出来るようになりました。
プロンプト+読み込ませた画像B+学習
学習させたモードを使用すると、絵の質が低い上にバグのほうが多くて生成の成功率は低いですが、目的だった鮎川まどかっぽい画像が出るようになったのは収穫です。
実際にはバグが生成される事のほうが多い
パラメーターで、AIの強度や読み込んだ画像の参照度をある程度調整出来るのですが、読ませた画像への参照度を強め過ぎると、元の画像を下敷きにしてヘタな人が上からなぞったような画像になってしまい、参照度を低めると絵が崩壊してしまいます。
本当はアニメのキャプチャ画像等を例題に使いたいのですが、著作権的にアウトなので自分の描いた絵を例にしますが、参照度を高め過ぎると元の絵そっくりの画像を生成してしまいます。
自分が描いた画像Bへの参照度を強めて生成した画像
この時気付きましたが、参照させる画像に他者が描いた画像を用いると、元画像の特徴的な部分が反映されてしまい、トレパク状態になってしまう事です。
なので他者が描いた画像を参照させて生成した画像は封印しました。
自分は、自分が描いた画像を読ませましたが、AI絵師は自分で絵を描く能力は持っていなかったり、描く手間は省きたい筈ですから他人の絵を盗る事になります。
ココが画像生成AIの大きな問題点と感じました。
苦労して描いた絵をパクられるのは、不愉快極まります。
それを言うなら、そもそも鮎川まどかっぽい画像を生成させる為に学習させた素材自体が盗用だという話になります。
この点も非常に微妙で、日本の法律では学習データとして著作物を利用するのは、情報解析にあたるため、著作権の侵害にはならないとある為に、法律的には問題ないと解釈されるようです。
ただ、その結果生成された画像が著作物に酷似した場合はアウトなようです。
法的にはOKとしても、著作物を無断利用される側の心象としては良くないような気もします。
しかし今では、東北ずん子のように公式が二次創作用にLoRA追加学習用のデータを頒布しているケースも出ているようです。
学習データとして利用するのはOKだとしても、1枚の画像用に参照データとして1枚の絵を読み込ませるのはさすがにどうかと思います。
この、AIが事前に大量の情報を収集しているほうを利用して描画する側を「学習フェーズ」
個別に参照画像を読ませたり、特定のキャラクター等の情報を追加学習させた側を「利用フェーズ」と言うと今知りました。
この言葉を知ると、特に「利用フェーズ」側が問題の火だねとなっている気がします。
自分が鮎川まどかっぽい画像をAIに生成させたくて試した行動から感じた事はその辺りです。
以下、自分が画像生成AIに対して思う能書きになります。
- 絵描きに嫌われる美少女AIイラスト
これまで絵を描いて利益や評価を得てきた人達からしてみれば、画像生成AIはある意味脅威であり厄介な存在で、場合によっては自身の仕事を奪いかねないので危機感を抱いたり、敵対視するのは自然な流れかと思います。
画像生成AIが嫌われる理由をいくつか考えてみました。
- 知的財産の盗用
画像生成AIのベースになる学習データは、Web上で収集した画像や絵で著作者に無断で莫大な量が学習されています。(学習フェーズ)
絵や写真には、描いたり撮ったりした人がこれまで努力や創意工夫を積み重ねたノウハウや技術が詰まっています。
コレを無断で大量に集めて、シレっと自分のモノとして使うのは知的財産の盗用ではないか?という意見。
- 絵描きの存在価値の低下
特に、商売として利益が得られる程のレベルを絵を描けたり、写真を撮れたりするスキルというのは、志せば誰でもなれるというモノではなく、努力に加えて生まれながらに持っているセンス等も関わっている一種の才能で特殊技能でもあります。
絵を描ける能力を持った人は、その技術と才能に誇りを持っています。
画像生成AIは、この一部の人だけに与えられた才能の希少性をガクンと落としてしまいました。
しかも評価を得ていて利益が得られる程のレベルの人達は、その才能にあぐらをかいている訳ではなく、自身のランクを維持する為に常にアンテナを拡げて情報や資料を収集して、自身のスキル向上の為の技術の研鑽に注力しているのです。
この努力や苦労と尊厳を踏みにじるような事をされて、楽しいと思う人は居ない筈です。
画像生成AIと絵を描く人との直接的な軋轢の原因はこの辺です。
- モラルのないユーザーの横行
画像生成AI自体の問題より、むしろこちらの使い手側の使い方の問題のほうが大きく厄介でえげつないと思います。
自分は美少女AIイラストやAI絵師界隈に詳しくないので良く知らないのですが、
- 手描きと偽ってAIイラスト禁止の販売場所で高値で美少女AIイラストを販売したり、
- 絵師のイラストを追加学習で丸パクりしたり、(利用フェーズ)
- 丸パクりの絵柄で二次創作利用ガイドライン違反のR18イラストを乱発したりという行為が横行しているみたいです。(利用フェーズ)
大元は画像生成AIの存在とは言え、問題は使い手の人間側にあると思うので、「画像生成AIはダメ」という理屈では、「刺せるから包丁はダメ」とか「轢けるからクルマはダメ」論になってしまうので、この問題は使う人間側の問題として切り分けて扱ったほうが良いかと思います。
人間の際限ない欲望という強い需要からこのような倫理観に欠ける行為が横行するので、早急に法的整備を進めるしか効果的な対策はない気がします。
- 絵描きが嫌う知的財産の盗用への解釈
絵描き側が主張する、これまで蓄積させてきた知的財産の盗用という説には100%同意出来ない部分があります。
絵でも写真でも、映像でも音楽でも文学でも、クリエーターは「自分たちは無から生み出しているが、AIはそれを盗用しているだけ」と主張しますが、太古の時代ならともかく現代は「無から生み出している」とは言い難い気がします。
ダッジチャージャーとマスタングが、
— カトラス☆アメ車☆旧車&イラスト (@70_cutlass) 2020年9月16日
サンフランシスコの坂道でカーチェイスしている映像🤪
シートベルトも締めるし、緑色のワーゲンも坂を下るww pic.twitter.com/FtkyCDuC0g
例えば音楽では余程の前衛音楽でない限り、音符や楽譜、音程音階のフォーマットに従って、既に既存の楽器を用いて演奏/歌唱をするのが主流なので、既にあるものをどう組み合わせるかになる筈で、「無から」はちょっと言い過ぎかと思います。
ユーミンのひこうき雲
に影響を与えたプロコルハルム
プロコルハルムが参考にしたG線上のアリア
他の物も、自分がこれまで見たり聴いたり感じたりしたモノを自分なりに編集して組み立てたモノが創作物となると解釈出来ます。
「無」ではなく、必ず何かしらの影響は受けている筈です。
そう考えるとAIだけでなくクリエーターも、これまで無断で他人の創作物や知的財産を含む情報を自分の中にストックしてきて、それを編集してアウトプットしているとも言えます。
この考え方だと人もAIも、理屈としては情報収集の点では同じ事をしているとも解釈出来ます。
- 絵描きの存在価値の低下
コレに関してもこれまでの人類の歴史の中では、要所要所で技術革新によってそれまで存在した職種がお役放免となってしまうケースは普通に見られるので、時代の変化と言えると思います。
しかも絵描きが全滅する訳ではないので、逆に画像生成AIを味方につけて省力化/作業効率化すれば、画像生成AIは敵どころかかなり有効なツールになると考えられます。
という事で最終的に残るのは、やはり現状倫理観の低い画像生成AIユーザーの行為が問題なのかと思います。
画像生成AIを何も知らないまま頭ごなしに全否定するのではなく、否定派も画像生成AIがどんな物なのか?最低限学べば、一色田にされている「学習フェーズ」と「利用フェーズ」を切り分けて考えられると思います。
結局画像生成AI自体というより、それを扱う人間の問題ではないでしょうか?
今回紹介する本はキンドル版で、キンドル会員ならば無料のようです。
画像生成AIを解説した本のようです。AIイラストは猛スピードで進化しているので、最新の情報ではないですが、画像生成AIの概要は掴めるかも知れません。
これ一冊でざっくりわかるAI×イラスト解析本
美少女AIイラスト本はかなり多数出ており、キンドル会員なら無料も多いので、試しに好みの絵柄を探してみるのもアリかも知れません。
AI生成イラスト集 美少女大百科 第10巻: AI-generated illustrations, Bishojo Encyclopedia, Vol. 10 (English Edition)
AIで描画された廃墟の画像集のようです。
残響廃墟〜自然と幻想が融合する美しきAI廃墟の世界〜
こちらはリアルな現実の廃墟です
廃墟の歩き方 探索編
Amazonアソシエイト Amazonのアソシエイトとして、当メディアは適格販売により収入を得ています。
【AD】社内や町内会等のちょっとしたチラシに、ちょっと風景的な画像やイラストを挿入したい時など、イラストACやフォトACを探せば出てきます。
会員登録で無料で1日数枚ダウンロード可能です。イラストACもフォトACも1つのIDで利用可能です。自分も数点イラストを投稿しています。ご利用下さい。