直接の知人か、または知人の知人くらいまでの人、程度の準内輪でやっていたPRMLの勉強会が、最後まで終わった。

2016/11/27から始めたようなので、一年弱くらいか。 もっと長くやっていた気がするのだが、一年はやってなかったのね。

月1回とかたまに二ヶ月に一回くらいの頻度でやってて、一回一章。 幾つか飛ばした章もあるが、主要な奴はだいたい全部やった事になる。

幾つかのメモは掲示板に書いていた。

したらば:Pattern Regognition and Machine Learning

勉強会の参加者は、8割くらいが理論物理の研究室つながりで来た人で、プログラマがむしろ少ない、という珍しい場だった。
そんな訳で皆、勉強会という物に慣れている、というか、13時から始まって18時とか19時くらいまでぶっ通しでやるというスタイルで、当番の人は結構しっかり予習もやってきて、数学レベルの高い勉強会だった。
たぶんプログラマを集めてではこのハードさではやれなかった気がする。

自分よりもこういった場に慣れた人達と議論をする、というのは良い刺激になった。やはりプログラマで正社員してた時代はサボりすぎだったよなぁ。

PRMLは機械学習では有名な本で、このブログを読んでいる人なら名前くらいは知っているだろう。

かつてはとりあえず機械学習という物が流行ってるらしい、勉強してみるか、とこの本に手を出して挫折者を量産している、という印象で、ちゃんと読んだ人の感想を聞く機会がいまいちなかった。

ディープラーニングのブームが来る前の本なので、昨今では話題になる事も減った気もする。

読んで見た印象として、挫折者を大量に生み出したのは良く分かる、という内容だった。 一方、自分は割とちゃんと理解出来たと思う。 ここ数年やってきた事といい感じにマッチしていたのと、勉強会で月一章ずつ、というペースで読んだのが良かったと思う。
たぶんただ先頭から読んでいくだけだと、そんなに身につかずにトピックだけなめて終わり、という感じになってしまっていたと思う。
勉強会に合わせて自分で頑張って計算追って行って、さらに半日くらいの説明を聞くというくらいの時間の突っ込み方でちょうど良かった。

ごつい勉強会についてこれるメンツで、ちゃんと当番の人が本に載っている以上の事も調べてきて質問に答えてくれる、というのは、この本を学ぶのには、自分のレベルでは必要な環境だったと思う。

また、自分の当番だった章は関連の本なども読んで結構しっかりうやったので、他の章を理解していく時の知識の島となってくれていて、それも脱落せず最後までついていけた要因になっていたと思う。

本がどうこうより、これだけの量をちゃんと計算していったという事自体の方が価値が高かったと思う。 本であれ論文であれなんでも良いが、こうやって計算をしていく、という訓練が重要な分野だなぁ、と読み終えた今では思う。

内容について

PRMLを読むべきか?というのは一昔前の流行りの話題という気もするので、自分もそんな話をしてみたい。せっかく読んだんだしね!

まず、現在のディープラーニング時代からすると古い。 もっと現代的な話題だけの同種の本があるなら、間違いなくそちらを読むべきに思うし、それはたぶん詳しい人なら作れるんじゃないか。
読むのが大変な割には古く、頑張っても最先端の話題に追いつける、という気はしない。それは費用対効果という点でいまいちに思う。

ただ、自分の知る限り、同種の本は無い。 だから読む価値はあると思う。

この本は、新しい論文を追えるようになる為の、計算の訓練書、という側面がある。

自分のように修士卒で、しかもその後長らくプログラマしていてあまりごつい研究を追っかけたりしてこなかったプログラマにとって、昨今の機械学習の前線についていくのは、そのままでは無理だ。 だからどこかで、ちゃんと時間をとって、それなりの期間計算や記述を追う訓練をする必要がある。

そういう立場の人は、私だけでは無いだろう。 むしろ私は、職業プログラマにしては結構マシな方なんじゃないか、と自分では思っている。 そんな自分でもそのままついていくのは無理なので、まぁ大半の職業プログラマには無理だと言って良いんじゃないか。

そこで時間をとって計算力を訓練する必要がある、と思うと、この本はそのための訓練の場を提供する、私の知る限り唯一の本に思う。
だからこの本は、もっと現代的な同種の本が出るまでは価値はあると思う。

この本が理想的とは思わない所としては、標準的なプログラマには少しついていけないくらいの記述になっている所。 もう少し普通のプログラマでも読めるくらい追加の説明が欲しい。

結局この本を消化出来るくらいの所まで来ていれば、最先端の論文から辿っていって計算追いつつ遡っていく、という感じで食らいついていく事で、必要な計算訓練も出来るのでは無いか?という気はする。

ただ、やはり論文よりは説明は詳しいので、少しでも敷居を下げて訓練したい、という人には、この本は非常に有り難い物となっている。自分もそういう人の一人なので、とてもありがたく読ませてもらった。

また、古い本でありながら、意外と昨今のディープラーニングのアイデアの元になっている物が結構あるので、ぱっと目次を見た印象ほどは古くない。

例えばReverseのKLダイバージェンスとの違いとかは結構最近GANのなんかの論文でも読んだ話題だ。 かつての機械学習のアイデアをDeep Learningに焼き直す、というのが最近の流行りなので、結構最近見た話が出て来る。

今ちらっと見たら、そもそも自分が持っているのは2013年で、元のハードカバーも2010年か。 2007年くらいの本かと思っていたが、もう少し新しいのだね。

そういう訳で、自分くらいのレベルのプログラマには、勉強会と併用して進めていくのにちょうど良いくらいの本だった。
また、最近の話題はそれなりに自分は追えているので、古さの被害もそれほどは受けない立場だったと思う。
論文を追えるようになるための計算の訓練と考えると、むしろこの位の所でやる方が良い、というかやっぱこの辺くらいじゃないと出来ないんじゃないか、という気もする。

もっと最近の話題で、もっと丁寧な説明がついている本があったらそっちの方が素晴らしいと思うが、それが(たぶん)無い以上、この本の価値は十分にあるんじゃないか。

むしろこの変化の激しい分野で良くこれだけの本を書けたもんだ、とBishop先生に敬意を表する。


とにかく、最後まで読みおわって、なかなか達成感を感じている。 いやぁ、良く頑張った。
参加者の皆様は、お世話になりました。

せっかくやったのだから、この内容を活かして次に何かやりたいね。