去年の夏ごろからAIお絵描きがブームになり、世間の様相が日々日々変わってきたのを見るのが面白いものでした。全く原理が理解できないことを除けば。。。
例えば以下のページを読んだりもしたのですが、肝心のノイズを入れてノイズを除去したら絵ができるというくだりよく分からないなと思ってました。
【しばらく全文公開】画像生成のしくみから応用まるわかり! (zenn.dev)
特にまとまった本が無いのでどうっやって勉強すればいいのか、と思ってたところで満を持して発売されたのが「拡散モデル」の本でした。
◎良かった点
拡散モデルについてまとまっており、とても良かったです。特に数式については普通の本だったら省略されるような細かい導式についてもステップバイステップで書かれているので迷子にならずに最後まで読むことが出来ました。完全に理解したとは言えませんが、少なくとも式の展開については追いかけることが出来るので、分野について詳しくなくても読めるのではないかなと思います。最初はSDEとか出てくるのまじで?と思いながら読み始めましたが感心しながら読めました。
◎想像と違った点
本の中の導式を追うことは出来るんですが、「なぜその式を追いかけてるのか」がわからなかったです。結局その式がStable Diffusionのどこでどう使われて絵が生成できるのか?が理解できなかったです。。。(そもそも副題の データ生成の数理 を踏まえると内容と完全に合致しているので異論はないのですが。。。) この本での理解を踏まえたうえで、別の解説等探しに行く必要があるのかなぁと。 今後時間が出ればそっち方面を追いかけ始めようかなと思います。
◎まとめ
初心者には超おすすめです。逆に同情報を得られる書籍は無いのでは?と思います。多分この本をきっかけに拡散モデル関係のもうちょっと緩い本がいっぱい出版されるんじゃないかな、(特に私のような、Stable Diffusionの中身をもっと知りたい、という人向けの本が出たら売れると思う。)
なお日々状況は変わっているものの、その瞬間はどうだったのか、という歴史を残す本がいくつか出ているかと思います。「AIとコラボして神絵師になる 論文から読み解くStable Diffusion」もおすすめです。本当はこの二冊の間のギャップを埋める本が出ないかなと