orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

Stable Diffusion(ステイブルディフュージョン)のことを世間はもっと知るべき

 

AIがいろいろできるというのは世の中に知られていることですが、1つのオープンソースが世界を変えつつあります。

Stable Diffusion(ステイブルディフュージョン)

です。

 

日本では、このニュースが始まりな気がします。

 

www.4gamer.net

 イギリスのスタートアップ企業Stability AIは本日(2022年8月23日),高性能画像生成AI「Stable Diffusion」と,それを使用したサービス「DreamStudio」のβ版をリリースした。Stable Diffusionは,近頃SNSなどで話題になっている「Midjourney」と同様の,テキストから画像を生成できるAIだ。商用利用も可能なライセンスの下でリリースされており,ゲーム制作への利用も期待できそうだ。

 公開中のデモページでは,テキストを入力して“Generate image”を押すだけで,誰でも無料で簡単に画像を生成できる。

 

何がすごいのかって、テキストを入力するだけでオリジナル(と言っていいかわからないけど)の絵が生成されるということです。

それがWebサービスで、有料で、というならそこまで広まりません。このソフトウェアがオープンソースで公開されたということです。したがってローカルのPCで環境を構築すれば実行は無制限に可能ということになります。

ただ、これまでのAIプログラムは機械学習もローカルで行わなければならず、学習データを集めたり、学習を長時間させることが大変でした。

しかしStable Diffusionは、かなり高品質な学習モデルが誰でも入手可能となっています。

つまり、プログラムも、学習モデルも誰でも手に入るので、あとはPC環境さえ整えれば誰でもできるということです。

そして、やる気があれば自前で画像を拾ってさらに学習させることができるのですが、その際に、絵の作者にお知らせせず勝手に画風を学習し、AIにその画風で絵を描かせるみたいなことが、倫理的にかつ著作権的に最近問題になっています。

・・と、概要だけではピンと来ない人もいるかもしれないので、具体例を紹介しておきます。

 

gigazine.net

2022年8月に一般公開された画像生成AI「Stable Diffusion」を二次元イラスト490万枚以上のデータセットでチューニングした画像生成AIが「Waifu-Diffusion」です。このWaifu-DiffusionをローカルのWindows環境で実行するために、実際にモデルデータをダウンロードして導入してみました。

 

もう、学習規模がわけわからん状態です。そして環境導入も、どんどん簡単になっています。

 

gigazine.net

(2022/09/22 17:52更新)画像生成AI「Stable Diffusion」を簡単に利用するための実行環境の1つである「Stable Diffusion web UI」のコントリビューター(開発貢献者)の1人であるAUTOMATIC1111氏が、フォークではないものの同名で「機能全部盛り」なStable Diffusion web UI(AUTOMATIC1111版)の開発を進めています。

 

結局のところ、PythonやらGithubやら、Cudaやらの構築が手を動かすボトルネックだったのを、有志がどんどん自動化を進めていて、手間をかけず利用開始までたどり着くことが可能になってるということです。

ハードウェアが用意できない人はGoogle Colabでやってちょうだい、みたいなところまで来ていて、しかも、発表から2か月でこの状況です。

 

テキストから絵を描かせるといったってコントロールできないでしょ、という話ももう崩されかけています。

 

gigazine.net

画像生成AI・Stable Diffusionを手軽にWindows環境あるいはGoogle Colabに導入でき、コマンドラインではなくユーザーインターフェース(UI)から簡単に操作可能な「AUTOMATIC1111版Stable Diffusion web UI」は他のUIには搭載されていない機能も盛り込まれた決定版とも言えるツールです。毎日驚くべきスピードでアップデートが行われ改善が進むAUTOMATIC1111版Stable Diffusion web UIで、入力した画像から新しい画像を生成できる「img2img」を実際にAUTOMATIC1111版Stable Diffusion web UIで使う方法をまとめてみました。

 

つまりは、似たような絵を見つけてきて、ちゃちゃっと別の画風に変えられるみたいな話です。

ここまで話が連鎖してくると、知らない方がもはやリスクじゃないですかね。

ちなみに、成果物の使い方はかなり気を付けないと、危ない橋を渡ることになりそうです。人間同士が決まりを作ってないですから、係争の種になるに決まってます。これはインターネット初期に見た景色と全く同じです。

さて、知ってしまった。この世の中、どうなることやら。