「測度論無しで機械学習に必要な確率論の話をする」という動画シリーズを作りました
youtubeのURL
youtube: 測度論無しで機械学習に必要な確率論の話をする、再生リスト
動画の概要
機械学習の論文では、測度論の言葉がかなり出てきています。 一方で、リーマン可積じゃないケースを考える必要はほぼありません。
そこで、以下のような特徴の動画シリーズを作る事にしました。
- リーマン可積な範囲で必要な言葉を説明する
- 機械学習のどういう所でどんな風に使われるか?を明らかにする
- 実際の論文で使われている所を見て、それを理解出来るようにする
題材としては情報理論の教科書と、W-GAN、BiGANの論文です。
気をつけた事として、わざと難しいトピックを持ってきて「ほら、必要でしょ?」というのではなくて、 ちゃんとした実務家が「確かにこの位は必要だね」と思ってもらえる範囲だけで話をする、という所です。
扱うトピック
主に以下の話です。
- 確率空間(ボレル集合族などは雑に説明)
- 関数としての確率変数
- lawとdensityとdistribution
- 測度による積分とRadon Nikodym微分
雑談
まず「機械学習に測度論は必要か?」というのが定期的に流れてきてるのだが、 これが本当にくだらないなぁ、と思っていた。 くだらない、というのは皆思ってる事なのでそれで良いのだが、いつまでたっても流れてきてうんざりだ。
と思っていたら、jmukがこの前日本に帰ってきた時「測度論なんて機械学習には要らないでしょう(笑)」とかいいやがって、 お前もかっ!となって、これは何か言った方がいいんじゃなか?という気分になってきた。 ただ、いまさら「知ってれば出来る事は増えるし知らなくても出来る事はある」とか言っても詮無いしなぁ…
と、そこで思いついたのがこのシリーズ。 あえて本気で測度論無しで、でもちゃんと必要な事の話をする、という事をやると、それがいかにくだらない議論かが逆に分かるのでは?というアイデア。 実際本気で測度論無しで最後までやっているし、このくらいの範囲は実際に必要、とは同意してくれる人が多いんじゃないか。
その辺のモチベーションの話は第一回で話していて、まぁまぁうまく達成出来た気はしている。
なお、自分的にはなかなか良く出来たと思うのだけど、ぜんぜん再生されなくて驚いた。こういうのはダメですかね?これから伸びるのかしら?
実際に機械学習やってる皆さまはどう思いますか?
個人的に聞いてみたいのは、ちゃんと機械学習やってる人で、 この動画の「まぁこの位は必要でしょう」と思っているラインをどう思うか?という所。 もうちょっと難しいのもいる?この辺は知らなくてもやっていける? やっていける場合はこの辺の定番論文はどうしているのでしょう? なんかそういう話を聞いてみたいな、と思っているので、もし見た機械学習屋の人が居たら見解を聞かせて下さい。