統計学探偵(最終報告)

4桁の数字の暗証番号を決めるときに人は何を考えるだろうか。できるだけ簡単にして覚えやすいものを選ぼうとするだろう。でも、あまりに簡単すぎるとそれはほかの人にも容易に推察されてしまう。ランダムな数字にするのが安全なのだろうがそれでは忘れてしまってさらに困ることになる。

これらの心理状態を図示すると次の図のようになるだろう。

 f:id:taamori1229:20201102073247p:plain

4桁の数字には乱雑さの指標を導入してみよう。ある規則kに属する暗証番号のグループをグループk、グループkに属する番号の数をNkとする。

グループkの番号の情報エントロピーSkは、

 f:id:taamori1229:20201102080312p:plain

と表される。

これに基づいて各種番号のエントロピーを計算してみる。

(1) "0000"、"1111"はそれぞれN=1と考えられるので、S=0.001である。
(2) (1)以外の"AAAA"は、N=8なので、S=0.008である。
(3) "000A", "111A"は、N=9なので、S=0.009となる。
(4) "1234"などの連続数は、N=10程度なので、同じくS=0.010のレベル。

ここまでの数は覚えやすいがばれやすい。次に覚えやすいのは、

(5)"ABAB"、"AABB"など。N=100なので、S=0.067。少しはばれにくくなる。
(6)誕生年については、N=100程度なのでやはり、S=0.067。

そしてもっともポピュラーな誕生日。

(7)誕生日はN=365なので、S=0.175。

こうして、誕生日が最もほどよいところになる。

しかし誕生日についても、11月15日生まれなどの"1115"などは、(3)に属することになるのでエントロピーは下がる。こうして、11月11日から19日の人は誕生日を敬遠する心理が働くのである。

また先頭の数字が"0"の番号については、


(8) "0ABC"は、N=1000。S=0.333。

と高いのだが、先頭の"0"については、「せっかく4桁もらえるのに桁数が3桁と同じことになってしまう」という心理が働いて敬遠される。


以上に示したような人間心理の葛藤のドラマの中から次の模様が形成されたのであった。

  f:id:taamori1229:20200927105538p:plain