正規分布の歴史をわかりやすく紹介！【ガウスとラプラスとドモアブル】

以下の記事で平均値と正規分布の話をした際に、正規分布の歴史を調べてみたのでまとめておきます。

統計の基礎！平均値と正規分布の話【平均値の罠と嘘。平均値を安易に信じてはいけないという話】

正規分布を最初に発見したのはド・モアブル
ガウス「全く違う方法で正規分布見つけたったww」
なぜ正規分布はガウス分布と呼ばれるのか？
１９世紀の人々「正規分布は絶対！！」
正規分布の歴史まとめ

正規分布を最初に発見したのはド・モアブル

正規分布はガウス分布とも呼ばれることがありますが、最初に発見したのはガウスではありません。ド・モアブル（１６６７〜１７５４）という人物でした。

ド・モアブルは「偶然論」という論文で二項分布について触れています。

コイントスをイメージしてください。使うコインは、表のでる確率がp％、裏の出る確率が（1-p)％だとします。

例えば、表が３０％なら裏は７０、表が４０％なら裏が６０％という感じ。

このコインをn回投げた時に、表がk回出る確率はどれぐらいだろう？

この問いにズバッと答えるのが二項分布であり、以下の式で表されます。

$${}_n C_kp^k(1-p)^{n-k}$$

難しそうな式ですけど、やってることは難しくありません。

例えば、表の出る確率４０％、裏が６０％のコインで、５回コイントスして、２回表が出る確率を考えます。上の公式でいうとp＝０.４、k＝２の時です。

まずは、最初に２回表が出て、最後の３回が連続で裏の確率を計算してみると・・・

0.4×0.4×0.6×0.6×0.6＝0.03456

となります。しかし、これが答えではありません。というのも、表の出るタイミングは最初の２回だけじゃないからです。表の出るタイミングは、最後の２回かもしれないし、最初の一回と最後の一回かもしれない。

このことを考慮すると、求めたい答えは0.03456に５回中二回表が出るパターン数を掛け算した値となります。

そして、この表が二回出るパターン数を計算するときに登場するのがコンビネーション！

$${}_5 C_2\times0.03456=10\times0.03456=0.3456$$

答えは、0.3456。34.56%の確率ということになります。

以下は、超訳となりますが、わかりやすく説明するとド・モアブルはこんなことを考えました。

「横軸をkの数。縦軸を確率とした時に、コイントスを仮に無限回やって、表が０回出る確率、１回出る確率・・・１０００回出る確率とkも大きくして、その確率をプロットしたらどんな形になるのだろう？」と。

実際は、

$$(a+b)^n$$

をnを無限大にして展開した時、各項の係数がどうなるのか？を考えていたらしいです。途中経過を全部省略しますが、上式の各項の係数は二項分布と同じコンビーネーションになるので、コイントスの話と本質的には同じ話になるのです。

ド・モアブルはこの疑問に対する回答を数式によって導き出すことに成功。これが正規分布の始まりです。

その後少し経って、ラプラス（1749 – 1827）という人物も同じ発見をします。

ド・モアブルとラプラスが発見した数学的手法は「ド・モアブルーラプラスの定理」と呼ばれ、今でもその導出方法を知ることができます。（素人には意味不明だけど）

wikipedia「二項分布」

・・・、二番煎じのラプラスの名前がなぜここで登場するのか、疑問に思う人もいるかもしれません。

ラプラスはド・モアブルの発見を発展させて、統計学において重要な定理である中心極限定理という定理を発見しました。だから、「ド・モアブルーラプラスの定理」って呼ばれるんだと思います。

何れにせよ、２人とも超天才。

ガウス「全く違う方法で正規分布見つけたったww」

正規分布の話をすると必ず登場するのがガウス（1777 – 1855）です。

ガウスは１８０９年、「天体観測で発生する観測誤差をなんとかなくせないものだろうか・・・」と考え、その対策方法を論文にまとめました。

ガウスは経験則から、誤差の振る舞いについて３つの仮定を考えます。

・誤差はマイナス誤差もプラス誤差も等しくおこる

・大きい誤差よりも小さい誤差の方が発生しやすい

・極端に大きい誤差は滅多に起こらない

この３つの仮定を用いて誤差が起こる確率を求め、横軸を誤差の大きさ、縦軸がその誤差が発生する確率としてプロットすると正規分布になることを発見したのです。

二項分布から発想を得たド・モアブルやラプラスとは全く違う独自の方法で、ガウスは正規分布の公式を発見してしまったのです。

しかもガウスの考案した方法の方が「ド・モアブルーラプラスの定理」よりもはるかにシンプル。ラプラスらも天才ですが、ガウスのそれはラプラスすら超えていました。

ラプラスとガウスは年齢は離れていても同世代の人間です。（ラプラスはフランス人。ガウスはドイツ人）自分とは全く違う方法で正規分布を発見したガウスにはラプラスも度肝を抜かれたことでしょう。

なぜ正規分布はガウス分布と呼ばれるのか？

正規分布の歴史を知ると、なぜ正規分布がガウス分布と呼ばれるのか疑問に思います。

「最初に発見したのがド・モアブルなら、ド・モアブル分布なんじゃねーの？」と

実際のところはよくわかりませんが、今現在用いられている正規分布の公式

$$f(x)=\frac{1}{\sqrt{2\pi \sigma^2}}\exp{\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\}}$$

を正確に導き出したのがガウスだったからではないか？という説があるらしいです。

ラプラスも正規分布の式を導き出しましたが、その計算過程には怪しいところがあると言われています。

１９世紀の人々「正規分布は絶対！！」

当初は二項定理の応用や誤差測定から登場した正規分布ですが、世の中の多くの事象が正規分布に従っていることがわかってきました。

１９世紀は正規分布至上主義とも言える時代で、「何か調べるならとりあえず正規分布使えば最強」と考えられていました。

実際に多くの事象は正規分布に従っています。しかし、正規分布を多用しているうちに「あれ？正規分布に従わない事象も意外とあるんじゃね？」ってことがわかってきました。２０世紀になると、「正規分布は絶対じゃない」と言う考え方が広まり、統計学はますます発展していくことになりました。

正規分布の歴史まとめ

以上、正規分布の歴史についてまとめてみました。数学史に初めて挑戦してみたのですが、しなかなか面白いですね。

ちなみに、正規分布は株価の値動きとも密接な関わりがあります。

株価にはランダムウォークと言って、日々の変動率は平均値が０の正規分布に従うんじゃないか？という説が昔からあります。

上で紹介したガウスの３つの仮定を株価に当てはめると

・株価は、マイナスにもプラスにも同じ程度に動く。

・大きい値動きよりも小さい値動きの方が起こりやすい

・大きい値動きは滅多に起こらない。

となります。もっともらしいことを言っています。実際、日々の値動きをヒストグラムにしてみると正規分布っぽい形になります。

もし仮に、株価の変動率が正規分布になるとすれば、ファンダメンタルやテクニカルと言った投資手法は全て否定され、「誰がどんな取引方法を用いようとも、長く投資を続けていれば、その収益率は０に近づいていく」という結論に至ります。バカでも天才でも、極論サルが投資をやってもみんな同じ結果になるというわけです。

ただ、これはあまりにも非現実的です。確かに、株価の変動率は正規分布に似た形になります。しかし、正規分布と比べると大きな値動きの頻度が圧倒的に高いと言われています。ガウスの３仮定で言うと「大きい値動きは滅多に起こらない」が該当しないわけです。

つまり、「株価は正規分布と似た分布をするが、正規分布とは言えない」とも考えられるのです。と言うか、この考え方が現代の主流のようです。（この考えが主流だからこそ、世の中にはいろんなトレード手法が存在している！！）