PRMLの内輪の勉強会が無事終わって、次はせっかく勉強したのだから何かコード書きたい、という話になった。
せっかくなので最近のディープラーニングの何かがいいんじゃないか、という事で、詳解ディープラーニングのRNNのあたりをやろう、という事になった。

初回は環境設定とかなので、自分が担当する事になった。 という事で本の内容は無視してdockerとかGCPとかで作業する時のワークショップみたいな内容にするつもり。

ただそうは言っても何かコードは動かしておきたいので、3章の内容をベースに何か書いてもらおう、と思って、3章を読んでみた。

だが、なんかPRMLを読み終わった人達にはこのゲートうんぬんのコーディングはかえって分かりにくいよなぁ、と思う。コストを定義して、そのパラメータの微分を求めるとあとはoptimizerで汎用に最適化が行える、という基本となる考え方からわざわざ外れた物を最初に持ってくるのは、理論に強い人だとかえって混乱してしまう。

素直に線形回帰したり、分離するような直線求める方が簡単だよなぁ。そうするかなぁ。

あとTensorflowも突然出てきてあまり説明が無いので、もうちょっと解説を足す必要がありそうだなぁ。 CS231nのTensorflow回りを持ってくるかなぁ。

後半しか読む気は無かったのでこの辺の出来が悪いのは別にいいんだけど、これなら無くていいんじゃないか?という気もする。

ま、後半に期待ですな。