ミスリーディングな事が多い平均
プログラマの仕事は多様になってきたと思っている。 生活もだいぶ多様になった気がする。 まずは多様になったというのを所与として、平均について考えたい。
平均というのは、なんとなく代表を表して欲しいと思ってみている。 例えばなぜ在宅勤務は国と人によって違うのか? - himaginary’s diaryを見ていて、日本の大学卒の在宅勤務は週に0.7日だ、と見て、 なんか実態と合わないなぁ、と感じる。 それは、こういう数字を見ると、1日くらいみんな在宅勤務していて、たまに2日な人も0日な人も居る、みたいなものを期待したいからに思う。
でも自分の周りは、全く出勤しない人の方が多数だ。 そうすると、なんか自分の周りは凄く一部の例外だけが集まっていて、普通はみんな出勤している、というような気もしてくる。 でも一部の例外というには結構多いんだよな。 多数派ではないのだが、例外でも無いような気がする。
おそらく平均の周りが一番多いとは思うんだが、それ以外を少数派とみなすのも実態に合わないように感じる。 そういうことが最近は多く感じる。 例えば他に思った事として、twitterで一日どのくらい投稿しているのか、とか。 昨今周りではほとんど投稿している人が居ないが、Geminiに聞いた範囲では投稿は増えていそうに見えるし、 年齢層的な事でも説明出来なさそう。 やはり平均と周りは随分と違うふるまいをしているようだが、twitterでフォローしている人と在宅を考える時の身の回りでは、だいぶ周りの人にも違いがあるはずなので、 これも普通と違うのか、という気がする。
平均と身の回りの感覚が違う時に、身の回りが例外だとしてその理由を説明しようとする気になるのだけれど、 あまりにもそういうことが多いと、それはそれで変なバイアスで良くないよな、という気もする。 平均が身の回りの代表的な何かを説明していて欲しいと思って平均を見ている訳だが、 むしろ平均はそういう目的をうまく達成できていない、と考える方が自然なようにも思う。
感覚的には、全体の2割くらいを占める層、というのを平均がうまく表現出来ていない事が多いように思う。 多数派では無いのだけれど、無視していいくらいの少数の例外でも無くて、それなりには居る、みたいなの。
同世代で結婚していない人はそれなりに居る気がするが、 実際がどのくらい珍しい事なのだろうか?とかを考えて、令和二年の国勢調査を見ると、 45~54でその他を足すと29%。やはり多数派では無いが無視できるほど少なくも無い。 なんかこういうものが多いよな。 いろいろな事をいろいろな角度から調べても、なんかいつも20%~30%くらいの中に居て、 それはいつも同じ人たちという訳じゃなくてぜんぜん別の人たちなのだけれど、やはり多数派では無い。 いつも平均が自分やその周りをとらえていない。 平均のそばに多数派はいるのだが、そこまで極端に大きな勢力でも無く、単に複数あるグループのうち少しだけ多い人たち、でしか無い。 そしてグループ間の違いは大きくて、あまり平均で全体を代表出来ていない。
20%~30%くらいのグループが3~5個ある、みたいなケースで、それらのグループ間が大きく違っている時は、 あまり全体の平均は多くを語ってくれない。 けれどそういうことは結構多いようにも思う。 しかもそういうことは年々増えているように思う。
別段根拠がある訳じゃないけれど、感覚的にはおそらく90年代の後半くらいからそういうのが増えてきて、 けれどしばらくは言うほどなんでもそうでは無かったのが、だんだんと増えてきて、 Covid-19の流行などでいろいろな事が大きく変わった時にさらに進んだ、みたいな感じに思う。 自分が大学生の頃はまだ平均はそれなりに多数派をとらえていることも多かったと思う。 30代の前半くらいではそうでない事もそれなりにあった。 5年前くらいではそういうこともだいぶ増えていて、 それでも現在と比べるとまだ平均が全体を表せている事もそれなりにあった。 ここ5年でさらにそういう平均の代表性が低下している気がする。
みんながバラバラ、という訳でも無いのだよな。20%~30%くらいの集団を形成している。けれどそれらの集団がお互いに結構違う。 そしてそれらの集団は、見ようとする側面ごとに構成員は変わるので、社会階層で分断されているとかそういう話でも無いような気はする。 マイノリティというほど少なくも無いし、多数派と大差ない程度の勢力はある。けれど平均が自分たちをとらえている感じでも無い。
一度や二度、平均と自分が大きく違うのであれば、自分の側を例外として平均を「普通」と考えるのが自然に思う。 けれど何度もそういうことがあり、また自分の側も少数では無く、しかも顔ぶれがいつも同じで無いのであれば、 平均をもって自分たちの普通をとらえる、という試みの方がうまく行って無いと考える方が自然なのでは無いか。 平均で普通が捉えられると考えるのは、 平均の周りに大多数の人が存在していて、その周辺には平均とちょっと違う人が存在して、さらに外側には少数の例外がある、 というような構造を想定しているからだ。 でもそれは、いつも20~30%くらいの少数でない、真ん中とは大きく違う集団が居るという事には反している。
平均がうまく代表をとらえていないと、その国際比較とかはどうしたらいいのかも良く分からない。 上記の在宅勤務の日数なども、あまり身の回りの在宅勤務の度合いを比較は出来ていないようにも思う。 それはUSで働いている日本人の友人はとても特殊な立場であるし、日本で働いている日本人の友人も多数派では無いからに思うし、 それらをそろえるという事も何を意味しているのか良く分からない。
上記の記事でも大卒かどうかで分けると結果が少し変わる、という話がある。 感覚的にはいくつかのクラスタに分けて、クラスタを比較するような感じがいいような気もするが、 一方でそれはしょせんデータを見た後にあとづけで考えていて、単なるこじつけとあまり変わらず、やる意義があるかも微妙に思う。
どう比較するかを考えるよりも、多様であるということを本質としてとらえて、 比較などが難しいという事を受け入れる方が実態を良く表しているようにも思う。 平均というものを中心に考えて、平均が捉えていないものを過度に無視できる少数なものと思い込むのは、 多様なものを理解しようとする時にはあまりうまいやり方では無いのだろう。