確率とは？知っておくと人生で得するかもしれない７つの知識

2021 11/04

2021年7月30日 2021年11月4日

確率とは、「未来で良い思いをするために、現在ある選択肢の中で何を選ぶべきなのか」を教えてくれる数学の一分野です。

たとえば、スラム街の裏道を通ったら、強盗に襲われる確率が 90 % あるとしたら、あらかじめ、その道を通らないようにすることで、危険を未然に防ぐことができます。「失敗は成功の母であること（＝失敗をすればするほど成功する確率が上がる）」なども確率論で数学的に証明されており、これを知っている人は、いちいち失敗を気にしたりしないため、人生そのものの成功率が上がります。

要するに、確率に詳しくなれば、サイコロやトランプのようなギャンブルだけではなく、仕事や学業・恋愛など、人生のあらゆる面でより良い判断ができるようになるのです。このページの目的は、まさに、そのような人生の様々な場面で得するために、今すぐ使える確率の知識を得て頂くことにあります。

先に構成について説明しておきます。

1 章から 3 章までは確率の基本を、誰でもわかるように簡単に紹介します。そして 4 章は、確率の基本知識を現実世界の問題に応用するために欠かせない概念について解説します。5 章と 6 章は、当ページのもっとも面白いところで、現実世界で有利に立ち回るための確率の使用方法を、豊富な具体例とともに解説しています。そして最後の 7 章では確率論と統計学の橋渡しであり、世の中のあらゆる現象を確率論的に把握できるようになるための土台となる知識を解説します。

ぜひ楽しみながらお読み頂ければと思います。

1. 確率とは

確率は、単純に言うと「ある事象（出来事）が起こる可能性を数値化したもの」です。より直感的な言い方をするなら「未来に何が起こりそうかを前もって予測することで、より大きな確信を持って現在の選択肢の中から最良の行動を決断するための数学的技術」だと言えます。

未来において、ある事象Ａが確実に起こるのなら、その確率は 1 ( = 100% ) です。反対に絶対に起こらないのなら確率は 0 ( = 0% ) です。起こるか起こらないか分からない事象の確率は 0 から1 の間になります。可能性が半々なら確率は 0.5 です。これよりも起こる可能性が高くなるほど確率は 1 に近づきますし、起こる可能性が低くなるほど 0 に近づきます。

これらを視覚的に表したものが下図です。

確率は未来を考えること

一言で表すなら、確率は未来を考えることです。そのため既に起こってしまった過去の出来事 A に対して、「A が起こる確率は 30 % だった」などと言っても無意味です。起こった後は 0 % か 100 % かしかありません。この点はぜひ注意しておいてください。まだ起こっていない未来を考えるからこそ「確からしさの率」なのです。

2. 確率の計算方法

確率はどのように求められるのでしょうか。教科書では以下のように説明されています。

一般に、起こりうる事象がどれも同様に確からしいとき、ある事象が起こる確率 P は、\[\begin{eqnarray}
\rm{P}=\frac{\text{ある事象の起こる場合の数}}{\text{起こり得るすべての事象の場合の数}}
\end{eqnarray}\]で計算できる。

「同様に確からしい」やら「場合の数」やら、よくわからない言葉が並んでいて難しそうですが心配いりません。確率の計算は、数をかぞえるのと同じぐらい簡単です。

要するに、① 起こると考えられる事象を全て書き出してリストアップする、② 目当ての事象の数を、リストアップした全ての事象の数で割る、ということをするだけなのです。実際に、トランプを例にして求めてみましょう。

2.1. ダイヤのエースを引く確率

よく切った 1 組 52 枚のトランプから 1 枚を引くとして、ダイヤのエースが出る確率はどれぐらいでしょうか。

まずトランプの内訳（起こりうる全事象）をリストアップしてみましょう。トランプには、以下の通り、ダイヤ・ハート・クラブ・スペードの 4 種類の絵柄があり、それぞれにエース(A)からキング(K)までの 13 枚ずつのカード存在します。

{ハート　: A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K}
{ダイヤ　: A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K}
{クラブ　: A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K}
{スペード: A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K}

つまり全部で 52 枚の異なるカードが存在するので、ここから 1 枚のカードを引くとしたら、起こりうる「全ての事象の数」は、〈ハートのエースを引く〉から〈スペードのキングを引く〉までの 52 個ということになります。そして 52 個ある全事象の中で、目当てである〈ダイヤのエースを引く〉という事象の数は 1 個です。

以上のことから、ダイヤのエースを引く確率は次のように計算できます。

\[\begin{eqnarray}
&&
\frac{\text{ダイヤのエースを引くという事象の数}}{\text{全ての事象の数}}
&=&
\frac{1}{52}
& \approx&
1.92 \%
\end{eqnarray}\]

2.2. エースを引く確率

それではエースを引く確率はどれぐらいでしょうか。

この場合、52 個ある全事象の中で、目当てである事象の数は…

〈ハートのエースを引く〉
〈ダイヤのエースを引く〉
〈クラブのエースを引く〉
〈スペードのエースを引く〉

の 4 個になります。

以上のことから、エースを引く確率は次のようになります。

\[\begin{eqnarray}
\frac{\text{エースを引くという事象の数}}{\text{全ての事象の数}}
&=&
\frac{4}{52}
& \approx&
7.69 \%
\end{eqnarray}\]

このように、確率は① 起こりうる全ての事象を地道にリストアップして、② 目当ての事象の数を全ての事象の数で割るという方法で求められるものです。地道に一つずつ書き出せば、小学校低学年でも簡単に確率を導き出すことができます。

「場合の数」と「同様に確からしい」

「場合の数」について改めて説明します。たとえばコインを投げたら、〈表が出る場合〉と〈裏が出る場合〉があります。「場合の数」は、これの〈表が出る場合の数 =〉 1 個、〈裏が出る場合の数〉 = 1 個の〈◯◯が〉の部分を省略しただけの言い回しです。ただの省略後なので、国語的には正しくありません。直感的にわかりにくいのは、このためです。

次に「同様に確からしい」とは、「確率を計算するためにリストアップした全ての事象の一つひとつは起こる可能性が同じである」ということを意味します。おそらく英語の “equally probable” の訳なので何だか変な言葉になっています。なお現実世界のものごとは「同様に確からしくない・・・・・」ことばかりです。それでは確率は無意味なのでしょうか。もちろんそんなことはありません。これについては、後ほど主観的確率と客観的確率の解説のところで触れたいと思います。

3. 確率の重要公式３つ

確率の計算には、知っておくと便利な公式があります。それが以下の3つです。

確率の加法定理：独立事象 A か独立事象 B の一方または両方が起こる確率を求める
確率の乗法定理：独立事象 A の後に独立事象 B が起こる確率を求める
条件付き確率（簡易版）：従属事象 A の後に従属事象 B が起こる確率を求める

これらの公式を知っていれば、様々な確率を求められるようになります。とても便利なので、ぜひ覚えておきましょう。なお独立事象が何か、従属事象が何かは読み進めて頂ければ、すぐにわかります。

さっそく見ていきたいと思います。

3.1. 加法定理

加法定理は、2 つの事象のうち少なくとも 1 つが起こる確率を求めるためのものです。以下の方法で求められます。

加法定理

2 つの事象のうち少なくとも 1 つが起こる確率
= 2 つの事象が起こる確率の合計 – 両方の事象が起こる確率

引き続きトランプを例に解説します。

52 枚のトランプから 1 枚引いて、ダイヤのカードかエースのカードのどちらか（または両方）を引く確率はどれぐらいでしょうか。和集合の法則より、これは〈ダイヤを引く確率〉 + 〈エースを引く確率〉 – 〈ダイヤのエースを引く確率〉で求められます。

具体的には以下のようになります。

\[\begin{eqnarray}
&&
\frac{\text{ダイヤを引くという事象の数}}{\text{全ての事象の数}}
+
\frac{\text{エースを引くという事象の数}}{\text{全ての事象の数}}
–
\frac{\text{ダイヤのエースを引くという事象の数}}{\text{全ての事象の数}}\\
&=&
\frac{13}{52}+\frac{4}{52}-\frac{1}{52}
=
\frac{16}{52}
\approx
30.8 \%
\end{eqnarray}\]

以上が加法定理です。

3.2. 乗法定理

確率の乗法定理は、任意の独立事象 A が起きた後に、任意の独立事象 B が起こる確率を求める方法です。

まず「独立事象」について説明します。

たとえばサイコロを振って、任意の目、たとえば 1 が出る確率は 1 / 6 です。それでは前回に、サイコロを振って 1 の目が出ていたとしましょう。この事実は、次に振ったときに 1 の目が出る可能性に影響を与えるでしょうか。答えはもちろんノーです。たった今、1 の目が出たとしても、次に 1 の目が出る確率は変わらず 1 / 6 です。このように、前回の結果が次回の確率に影響を与えないことを、それぞれの事象は「互いに独立している」と言います。

独立事象は 1 個のサイコロを振り続けるような連続事象だけに当てはまるものではありません。たとえば私が東京の神社のおみくじで大吉を引いたとしても、宝くじに当たる可能性が増すわけでも減るわけでもありません。

そして、このような独立事象が同時に起こる確率を求めるものが「確率の乗法定理」です。以下の通りです。

確率の乗法定理

互いに独立する事象 A と B が同時に起こる確率
= 事象 A が起こる確率 × 事象 B が起こる確率

要するに複数の独立事象が同時に起こる確率は、それぞれの事象の確率の積になるということです。このことから、たとえばサイコロを振って 2 回とも 1 の目が出る確率は以下のように計算できます。

\[\begin{eqnarray}
& &
\text{2回とも1が出る確率}\\
&=&
\text{1 が出る確率}
\times
\text{1 が出る確率}
\\
&=&
\frac{1}{6} \times \frac{1}{6}
=
\frac{1}{36}
\approx
2.78 \%
\end{eqnarray}\]

独立事象の数が増えても計算方法は変わりません。たとえばサイコロを振って 3 回とも 1 の目が出る確率は以下のように計算できます。

\[\begin{eqnarray}
&&
\text{3回とも1が出る確率}\\
&=&
\text{1 が出る確率}
\times
\text{1 が出る確率}
\times
\text{1 が出る確率}
\\
&=&
\frac{1}{6} \times \frac{1}{6} \times \frac{1}{6}
=
\frac{1}{216}
\approx
0.46 \%
\end{eqnarray}\]

以上が確率の乗法定理です。

3.3. 条件付き確率（簡単版）

ここでいう条件付き確率は、従属事象 A の後に従属事象 B が起こる確率、言い換えれば前回の結果が次回の確率に影響を与える場合の確率のことです。これは確率の乗法定理の独立事象を従属事象に変えたものなので、同じように 2 つの事象の確率の掛け算で求めることができます。ただし、多少の操作が必要です。

たとえば箱の中に、赤玉と白玉が 5 個ずつ、合計 10 個入っているとします。ここから無作為に取り出した 2 個の玉が両方とも赤玉である確率はどのように求められるでしょうか。

答えは次の通りです。

\[\begin{eqnarray}
\frac{5}{10} \times \frac{4}{9}
=
\frac{20}{90}
\approx
22.22 \%
\end{eqnarray}\]

合計 10 個の中に赤玉が 5 個なので、最初に取り出した玉が赤である確率は 5 / 10 です。それでは、次に取り出した玉が赤である確率はどうでしょうか。これは 5 / 10 ではありません。すでに赤玉を 1 個取り出した後なので、玉の合計数は 10-1=9 個、赤玉の数は 5-1=4 個になっています。そのため、次に赤玉を取り出す確率は 4/9 になります。従って、これらの確率を掛け合わせたものが、2 回続けて赤玉を取り出す確率になります。

なお、ある 1 つのグループから続けて抽出することを「非復元抽出」と言います。一方で、1 回の抽出ごとに玉を戻すなら（＝状況を復元するなら）「復元抽出」と言います。

3 つの重要公式を使いこなそう

ギャンブルに勝つ方法の研究が確率論の始まりであることは有名な話です。そして、トランプやサイコロ・ルーレット・麻雀などのギャンブルの勝率は、ここまでの内容でほとんど計算することができます。ギャンブル好きな方は、さまざまな状況を想定して確率を求めてみると良い練習になります。

4. 客観的確率と主観的確率

ここまで見てきた確率の計算は、基本的に「リストアップしたすべての事象のそれぞれが起こる可能性は同じである（＝同様に確からしい）」という前提で行っているものです。

しかし、サイコロやトランプの確率の場合は、これで全く構わないのですが、現実の問題では想定され得る事象のすべてが同様に確からしいことなど、ほとんどありません。

それでは確率は現実世界では意味がないのでしょうか。私たちは確率を駆使して運が良い人になることはできないのでしょうか。もちろん、そんなことはありません。確率を現実世界のさまざまな状況でも活用できるようになるために重要なのが、ここで解説する「主観的確率」です。

確率には 2 つあります。客観的なものと主観的なものです。

客観的確率：誰もが明らかに正しいと同意する確率
主観的確率：人によって値にバラつきがある確率

たとえばサイコロを振って、目当ての数字が出る確率が 1 / 6 であることは、誰もが認めることであるため客観的な確率です。一方で、明日Ｚ社の株価が上がる確率は、それを算出する人間によって考えが異なるため主観的な確率です。

現実問題に対しては、客観的確率を適用できるのは、ギャンブル（サイコロ・トランプ・ルーレット・麻雀など）ぐらいなもので、それ以外はほぼ主観的確率を使うことになります。だからこそ、より精度の高い主観的確率を得ることが重要になります。

例として株価について考えてみましょう。

株の素人の私は、過去の一定期間のうち、何日上昇して何日下落したのかを数えて、その比率から翌日に株価が上がる確率は 60 % であるというように見積もるといったことしかできません。しかし、その企業が属する業界の事情に詳しい専門家やアナリストなら、願わくば、私よりも多くの信頼できる情報を持っていて、70 % というより正確な主観的確率を算出することでしょう。

さらに、もしその企業のインサイダーで、明日に急遽、誰もが待ち焦がれている新製品が発表されるという情報や、伝説的な人物が役員として招かれるというような情報を知っているなら、95 % というような主観的確立を導き出すでしょう。

明らかに、私よりも専門家、専門家よりもインサイダーの主観的確率の方が正確です。

このように現実世界で運の良い人になるには、より正確な主観的確率を得ることが重要なのです。証券取引の世界でインサイダー取引が禁じられており、違反者には非常に重い罪が課せられるのは、このためです。それはギャンブルにおいて必ず勝てるイカサマをやっているのと同じであり、彼らに相場参加を許してしまえば、勝ちのほとんどを奪い去られることが明らかだからです。

このことからも、より正確な主観的確率を得ることが、とにかく重要であることがわかります。それでは、より正確な主観的確率を得るにはどうしたら良いのでしょうか。

一番は自分自身が、対象のものごとに精通・習熟することですが、それには時間がかかります。そのため現実的な解決策は「情報を金で買う」ということになります。具体的には、アナリストや統計学者に相談したり、AI の力を借りるといったことです。

なお以降の内容では、さまざまな状況での確率の計算に主観的確率を取り入れて行きます。読み進める中で、主観的確率が異なると計算も大きく変わってしまうこと（＝正確な主観的確率を得ることが重要であること）がわかるでしょう。

お金持ちはなぜ運が良い？

お金持ちの中では「自分は運が良い」という人が多いそうですが、それは理にかなっています。彼らは、より良い主観的確率を得るために情報に投資をすることによって、一般の人たちよりもはるかに高い精度で、重要な場面での確率を算出することがでるのです。お金持ちが、あらゆる場面で勝っているように見えるのはそのためです。見習いたいものです。

5. 余事象 ~和集合の法則~

ここから確率論を現実世界で活用することが、どれだけ有利であるのかがわかるようになっていきます。

そのためにここで触れるのが余事象です。余事象は、現実世界で確率を使いこなせるようになるために、必ず・・マスターしておくべき概念です。その理由は読み進めて頂くとすぐにわかりますので、さっそく見ていきましょう。

余事象とは、簡潔に言うと「ある事象 A に対して、A ではない事象すべて（= A の正反対の事象）」のことです。数学的には以下のように定義されています。

余事象の定義式

\[\begin{eqnarray}
\rm{P(Not A)} &=& 1.00 \ – \rm{P(A)}
\end{eqnarray}\]

引き続き、サイコロを例に考えてみましょう。事象 A を〈 1 の目が出る場合〉とすると、その余事象 Not A は〈 1 以外の目が出る場合〉になります。

そして確率論では、前提として「ある一定の状況で起こる可能性があるとしてリストアップした全て事象の確率の和は 1.00 (= 100%) である」という仮定が置かれています。そのため、ある事象 A が起こる確率 P(A) と、その余事象 NotA が起こる確率 P(NotA) の和は必ず 1.00 (=100%) になります。このことから必然的に \(\rm{P(A)+P(NotA)}=1\) となります。この計算式の左辺を余事象に変換したものが余事象の定義式です。

それでは余事象はなぜ重要なのでしょうか。それを示す代表的なものの 1 つが上でも解説した加法定理です。実は加法定理は、余事象を使って、以下の式で求めることが可能なのです。

和集合の法則

\[\begin{eqnarray}
&& \rm{P(A \ or \ B \ or \cdots \ or \ Z )}
= 1.00 \ – [ \rm{P(Not A)} \times \rm{P(Not B)} \times \cdots \times \rm{P(Not Z)} ]
\end{eqnarray}\]

これを使うと、独立事象の数がどれだけ増えたとしても、それらの独立事象が少なくとも 1 つ以上起こる確率を簡単に計算することができます。

そして、この法則を使うと、現実世界の様々な確率を計算できるようになり、より良い選択を簡単にできるようになるのです。これから、いくつかの興味深い例を一緒に見ていきましょう。

なお、これからは上述した主観的確率を使用します。そのため主観的確率の使用例としても参考にしてください。

それでは始めましょう。

余事象の定義式から和集合の法則を導出する方法

和集合の法則の余事象の定義式からの導出方法は、以下のボックス内で解説しています。気になる方はぜひご覧ください。

余事象の定義式からの和集合の法則の導出

まず 2 つの独立事象 A と B と、その余事象について考えてみましょう。

A か B の少なくとも一方の事象が起こった場合というのは、2 つの余事象 NotA と NotB の両方が起こったケースではない・・ということは明らかです。

たとえばトランプを 1 枚引いて〈エースを引く〉という場合を事象 A 、〈ダイヤを引く〉という場合を事象 B としましょう。このとき NotA は〈エース以外を引く〉で、NotBは〈ダイヤ以外を引く〉という場合のことになります。

そして、この場合、A か B の少なくとも一方が起こるというのは、〈エースを引くか、ダイヤを引くか、もしくは両方を引く〉というが起こるということです。そして、これが起こったときは、当然、NotA と NotB が同時に起こったケースではないということになります。

ということは、これを反対から見ると、〈A か B の少なくとも一方が起こった〉ということは〈NotA と NotB の余事象が同時に起こった〉と等しいということになります。

以上のことから、余事象の定義より次の式を書くことができます。

\[\begin{eqnarray}
\rm{P(A \ or \ B)} = 1.00 \ – \rm{P(Not A \ and \ Not B)}
\end{eqnarray}\]

次に事象 A と B が互いに独立しているということは、その余事象 NotA と NotB も互いに独立しているということを意味します。そして、確率の乗法定理で解説したように、2 つの独立事象が同時に起こる確率は、個々の独立事象が起こる確率の積に等しくなります。

以上のことから、上の式は以下のように書き換えることができます。

\[\begin{eqnarray}
\rm{P(A \ or \ B)} = 1.00 \ – \rm{P(Not A)} \times \rm{P(Not B)}
\end{eqnarray}\]

この法則は、事象の数にかかわらず通用します。そのため、たとえば独立事象 Aか B か C か D が起こる確率（＝ A, B, C, D のいずれか 1 つが起こる可能性 + いずれか 2 つが起こる可能性 + いずれか 3 つが起こる可能性 + 4 つすべてが起こる可能性）は、以下の式で求められることになります。

\[\begin{eqnarray}
&& \rm{P(A \ or \ B \ or \ C \ or \ D)} \\
&=& 1.00 \ – [ \rm{P(Not A)} \times \rm{P(Not B)} \times \rm{P(Not C)} \times \rm{P(Not D)} ]
\end{eqnarray}\]

5.1. 営業で成約に至るまでの確率

ある営業マンが、1 週間に 5 社の顧客と商談をするとします。これらの 5 社はお互いに面識がないので、それぞれの商談のがうまくいって成約に至るという事象は互いに独立しています。そしてこの営業マンは、過去の実績から平均成約確率が 20% を記録していることがわかっています。

さて、この営業マンが 5 社と面談して最低 1 件以上成約する確率はどれぐらいでしょうか。確率論の素人なら、20% を 5 回繰り返すと 20% × 5 = 100% なので、必ず 1 つは成約するだろうと考えてしまいがちです。もちろん、それは間違いです。

このようなときの確率は、和集合の法則を使って求めます。

まず、事象 A が〈A 社が成約〉、事象 B が〈B 社が成約〉、 … 、事象 E が〈E 社が成約〉としたら、これらの余事象 NotA から NotE までが、各社が〈成約しない〉ということになります。

そして既に解説した通り、最低 1 件以上成約する場合というのは、NotA から NotE までのすべての余事象が一つも起こらない場合と同義です。以上のことから、和集合の法則より以下の式が導き出されます。

\[\begin{eqnarray}
&\rm{P}& \rm{(A \ or \ B \ or \ C \ or \ D or \ E)}\\
&=&
1.00 \ – \ [\rm{P(NotA) \times P(NotB) \times P(NotC) \times P(NotD) \times P(NotE)}]
\end{eqnarray}\]

そして事象 A から E が起こる確率は 0.2 なので、余事象の定義式より、余事象 NotA から NotE が起こる確率は 1-0.2=0.8 ということがわかります。以上のことから「確率の乗法定理」より、5 回の商談が全て失敗に終わる確率は以下の計算で求められます。

\[\begin{eqnarray}
1.00-[0.8 \times 0.8 \times 0.8 \times 0.8 \times 0.8]
=
0.67
\end{eqnarray}\]

この営業マンが最低 1 社以上成約する確率は 67% になります。

5.2. 転職活動に成功する確率

次は少し難易度を上げてみましょう。少しでも、条件の良い勤め先を望むのは、今の時代当たり前のことです。

そこで、常にステップアップを狙っているあなたは、現在、7 つの企業にエントリーしているとします。

このうち 2 社からは、最終選考の一歩手前で候補者の 6 人のうちの 1 人まで絞り込まれていることを告げられています。他の 2 社では、まだ採用プロセスがそこまで進んでおらず、まだ 20 人の候補者のうちの 1 人という位置付けです。そして残りの 3 社ではあなたは最終選考段階にあり、今 3 人の最終候補者の 1 人という段階まで来ています。

もちろん、それぞれの企業の採用チームはお互いに独立しており、それぞれの意思決定が何らかの影響を及ぼすことはありません。このとき、あなたが少なくとも 1 つ以上の企業から採用通知をもらえる確率はどれぐらいでしょうか。

これは 7 つのサイコロを振ることと似ています。

7 つのサイコロのうち、A と B の 2 つは 6 面サイコロ、C と D の 2 つは 20 面サイコロ、残った E, F, G の 3 つは 3 面サイコロです。こう考えると、少なくとも 1 社以上に採用される確率は、和集合の法則から次のように求められます。

\[\begin{eqnarray}
\rm{P(A \ or \ B \ or \ C \ or \ D or \ E \ or \ F \ or \ G)}
&=&
1.00 \ – \ [\rm{P(NotA)-P(NotB)-P(NotC)-P(NotD)-P(NotE)-P(NotF)-P(NotG)}]
\\
&=&
1.00-[\frac{5}{6} \times \frac{5}{6} \times \frac{19}{20} \times \frac{19}{20} \times \frac{2}{3} \times \frac{2}{3} \times \frac{2}{3}]\\
&\approx &
0.81
\end{eqnarray}\]

このように 81% の確率で、よりよい職を得られるということがわかります。このように確率計算ができると、就職や転職で不要に不安がる必要はないことが理解できます。

5.3. サイコロ賭博の勝率

サイコロの確率問題に、「シュヴァリエ・ド・メレのパラドックス」という面白い問題があります。それは次のものです。

以下の 2 つのサイコロゲームのうち、より勝率が高いのはどちらでしょう。

1 個のサイコロを 4 回振って 1 回でも 1 の目が出れば勝ち
2 個のサイコロを 24 回振って 1 回でも同時に 1 の目が出れば勝ち

一つ目のゲームの確率は次のように考えられます。1 個のサイコロを 1 回振って、1 の目が出る確率は 1 / 6 で、これを 4 倍した 4/ 6 = 2 / 3の確率で勝てる。一方で二つ目のゲームの確率は次のように考えられます。2 個のサイコロを 1 回振って、両方とも 1 の目が出る確率は 1 / 6 × 1 / 6 = 1 / 36 で、これを 24 回降ることができるので、勝率は 1 / 36 × 24 = 2 / 3 になる。

以上のことから、2 つのゲームの勝率は同じであると考えられます。

しかし実際に記録を取ってみると一つ目のゲームの勝率の方が高くなります。これはなぜでしょうか。シュバリエは、どうしてもこれが分からなかったので、友人であり「フェルマーの最終定理」で有名なフェルマーに相談することにしました。

結果、シュバリエの相談を受けて、フェルマーは友人であり「パスカルの三角形」で有名なパスカルと共に、この問題を解きました。ここで二人が導き出したのが正しく「独立事象の和集合の法則」だったのです。

まず、一つ目のゲームについて改めて見てみましょう。

〈1 個のサイコロを 4 回振って 1 回でも 1 の目が出る場合〉を事象 Aとしたら、それ以外のすべての場合である余事象 NotA は〈1 個のサイコロを 4 回振って 1 回も 1 の目が出ない場合〉ということになります。そのため、この事象 A の確率は、正しくは次のように求める必要があるのです。

\[\begin{eqnarray}
\rm{P(A)}
&=&
1.00 \ – \ \rm{P(NotA)}\\
&=&
1.00 \ – \ \left( \frac{5}{6} \right) ^4 \\
&\approx &
0.52
\end{eqnarray}\]

続いて二つ目のゲームについて見直してみましょう。

これも正しくは、〈2 個のサイコロを 24 回振って 1 回でも同時に 1 の目が出る場合〉を事象 Bとしたら、それ以外のすべての場合である余事象 NotB は〈2 個のサイコロを 24 回振って 1 回も 1 の目が同時に出ない場合〉ということになります。

そのため、1 – P(NotB) で正しい勝率が求められます。実際に計算すると以下の通りです。

\[\begin{eqnarray}
\rm{P(B)}
&=&
1.00 \ – \ [ \rm{P(NotB)} ]\\
&=&
1.00 \ – \ \left( \frac{35}{36} \right) ^{24} \\
&\approx &
0.49
\end{eqnarray}\]

[/su_note]

以上のことから、一つ目のゲームの方が二つ目のゲームよりも約 3 % 勝率が高いことがわかります。

シュバリエは何を間違っていたのでしょうか。

それは、彼の考え方ではコインを 2 回投げて、表が出る確率は 1 \ 2 × 2 = 100% になってしまうという点です。上述の営業の成約件数と同じ勘違いです（商談成約率 20% の営業マンが 5 つの商談を経て、最低 1 件以上成約する確率を多くの人が 0.2 × 5 = 1 と考えてしまうが、実際には 0.67 に過ぎない）。

私の実感では、現代社会において、この間違いをしている人は非常に多いです。こうした間違いを避ける第一の予防法は、確率を計算する際に、その問題が、「独立事象の和集合の法則」で解けるかどうかを検討することです。

この点を、ぜひ忘れないようにしてください。

5.4. 人生で 100% 成功する方法

和集合の法則で説明できるものの中で、個人的に最も好きなのが、この人生の勝率です。あなたの人生の勝率は一体どれぐらいでしょうか。

たとえば、こう言われたら、どう思うでしょうか？「現時点でのあなたの能力では、希望の条件で職を得られる確率が 1% です」。おそらく、就職活動や転職活動に対して絶望的な気分になってしまうことでしょう。

しかし確率論をわかっていると、そんな必要は全くなくなります。なぜなら、たとえ一つ一つの応募の成功率が低かったとしても、結局、「チャレンジを増やせば増やすほど 100% に限りなく近づいていく」からです。

たとえば 100 社に応募するとしましょう。この場合、和集合の法則より成功率は次のようになります。

\[\begin{eqnarray}
\rm{P(成功する)}
&=&
1.00 \ – \ [ \rm{P(成功しない)} ]\\
&=&
1.00 \ – \ \left( \frac{99}{100} \right) ^{100} \\
&\approx &
0.63
\end{eqnarray}\]

いかがでしょうか。最初は絶望的に見えても、100 社にチャレンジするだけで、どこか 1 社にでも受かる確率は約 63% にもなるのです。これは、あなたが想像していたよりも大きな確率だと思います。

しかし 63% ではまだ不安なので、チャレンジ数を 300 社まで増やしてみましょう。

\[\begin{eqnarray}
\rm{P(成功する)}
&=&
1.00 \ – \ [ \rm{P(成功しない)} ]\\
&=&
1.00 \ – \ \left( \frac{99}{100} \right) ^{300} \\
&\approx &
0.95
\end{eqnarray}\]

今度は 95% に跳ね上がりました。

このように、どれだけ勝率が低いとしても、チャレンジ回数を増やせば増やすほど、1 回以上成功する確率は、限りなく 100% に近づいていくのです。それなのに私たちの多くは、途中で精神的に負けてしまって、「このままチャレンジを続けてもうまく行きっこない」という間違った結論を下してしまいます。

数学的・確率論的に正しいアドバイスは、「チャレンジ数を増やしていけば、最終的には必ずうまくいく」です。

それでも「チャレンジし続けるのはしんどいので、必要なチャレンジ数を減らしたい」という場合は、自分の能力を向上させて、一回一回の成功率を上げれば良いのです。たとえば、成功確率が 1 % から 1.5 % に上がるだけでも、100 社チャレンジして 1 社以上に受かる確率は、63 % から 78 % にまで跳ね上がります。

こうして見ると真の成功者の格言、たとえばトーマス・エジソンの『私たちの最大の弱点は、諦めることにある。成功するのに最も確実な方法は、常にもう 1 回だけ試してみることだ』は、数学的にも正しい主張であることがわかります。

6. ベイズの定理

きっと前の章の余事象を読んだら、確率が現実世界での選択をこの上なく有利にしてくれるものであることがわかり、確率がより面白いものに感じたと思います。そして、ここで解説するベイズの定理は、確率論を今までよりもさらに一歩高いレベルへと誘います。

ベイズの定理は、具体的には条件確率の一種であり、簡単に言うと「事後確率（たとえば事象 B が起こった場合という条件下において事象 A が起こる確率）」を求めるためのものです。なお「事後確率」と対照的に、前提条件である事象が起こる確率を「事前確率」と言います。

この事後確率は次の式で求められます。

このページ全体は、確率とは何かを興味深いエピソードを見ていくことで、俯瞰的に理解することを目的としていますので、ここではベイズの定理を正確に理解しようとしなくても大丈夫です。正確な解説は別ページで行いますのでご安心ください。

ベイズの定理は、ご覧の通りのややこしさから、発見後 250 年以上経つにもかかわらず、いまだに物議の的になっています。この定理は数学的には完全に正しいのですが、よほど注意して扱わなければ、ほとんどの場合、その解釈をいとも簡単に間違えてしまうからです。

しかし、正しく扱うことさえできれば、この上なく正確な確率を得ることができて、より有利な選択を行えるようになります。例をもとに具体的に見ていきましょう。

6.1. 精度 95 % のウイルス検査の真の陽性率

ベイズの定理のもっとも典型的な例としては、ウイルス性の病気の陽性検査がよく用いられます。次のような場合について考えてみましょう。

人口の 0.1 % が、このウイルスに感染している
ウイルス検査の精度は 95 %

これらの数値が正しいことが保証されているとして、ある小規模な都市である Z 市が住民の一斉検査をしたとして、検査で陽性となった被験者が実際に感染者である確率は、どれぐらいになるでしょうか。

まず Z 市の住民である被験者が、感染者であるか非感染者であるかの事前確率は以下の通りです。

被験者が感染者である事前確率：0.001
被験者が感染者でない事前確率：0.999

そして、ウイルス検査の精度が 95% ということは、実際は感染者である被験者の 5% は誤って陰性となりますし、実際は非感染者である被験者の 5% が誤って陽性となることを意味します。

感染者がウイルス検査で陽性判定される確率：0.95
非感染者がウイルス検査で陽性判定される確率：0.05

以上のことから、検査で陽性となった被験者が実際に感染者である確率（＝陽性判定された被験者が実際に感染者である確率）は、ベイズの定理を使って、次のように計算することができます。

\[\begin{eqnarray}
\dfrac{
0.95 \times 0.001
}
{(0.95 \times 0.001)
+
(0.05 \times 0.999)
}
&=&
0.0187
\end{eqnarray}\]

このように 95% という精度の高い検査方法だとしても、やみくもに検査を乱発してしまうと、この検査で陽性反応が出たとしても、その被験者が本当に陽性である確率は、たったの 1.87% しかないということになります。

このようなことを初めて聞いた人にとっては、これはかなり意外な結果だと言えるでしょう。

しかし、この数値の扱いには注意が必要です。ベイズの定理は、すでに見てきたように計算がややこしいのに加えて、出てきた数字を解釈するのにも多大な注意が必要です。

この 1.87% という数値を見ると、ウイルスの陽性検査に意味がないと反射的に思ってしまうかもしれませんが、そうではないのです。

この数値は検査の被験者に選ばれた人たちの間でもウイルスの感染率は総人口と同じく 0.1 % であるという仮定を前提にしています。しかし、同じ検査を、たとえば濃厚接触者のグループに対して行うとすると数値は全く変わってくるのです。

このウイルス検査を濃厚接触者に対して行う場合は、これらの濃厚接触者の感染率は、総人口における感染率である 0.1 % よりはるかに高くなることは、容易に想像できます。そこで例えば、その場合の感染率を 30 % として、あらためて真の陽性率を計算してみましょう。すると次のようになります。

\[\begin{eqnarray}
\dfrac{
0.95 \times 0.3
}
{(0.95 \times 0.3)
+
(0.05 \times 0.7)
}
&=&
0.891
\end{eqnarray}\]

今度は真の陽性率は 89.1 % と十分に信頼できる数値になりました。

このようにベイズの定理は、事前確率が妥当なものであるかどうかで、簡単に数字が変わってしまいます。これが、ベイズの定理は数学的に正しく、適切に使うと、より正確な確率を導き出すことができるものであるのにも関わらず、細心の注意を払って扱わなければいけない理由です。

6.2. モンティ・ホール問題（選択を変えるべきか）

確率論でおそらく最も有名な問題の 1 つが、モンティ・ホール問題でしょう。実はこの問題も、ベイズの定理を使えば、数学的に正確に解くことができます。モンティ・ホール問題は次のようなものです。

モンティ・ホール問題

クイズ番組で、回答者は 3 つのドアのうち、1 つ選ぶ権利が与えられています。3 つのドアのうち 1 つのドアの後ろには商品である車が、残りの 2 つのドアの後ろにはヤギが置かれています。回答者は、まず 1 つのドアを選びます。その後、ドアの後ろに何があるのかを知っている司会者が、選ばれなかった 2 つのドアのうち 1 つを開けます。このとき必ずヤギがいるドアが開けられます。そして司会者は回答者にこう聞きます。「開いていないもう 1 つのドアに選択を変えますか？」

果たして、選択を変えることは得なのでしょうか。

この問題を初めて見たという方は、ぜひ考えてみてください。

3 択問題が 2 択問題に変わるだけであって、ドアの選択を変えようが変えまいが、確率は 50% で変わらないように思えます。しかし実は、選択を変える方が、車が当たる確率が 2 倍になって圧倒的に有利であることが結論づけられています。

そして、これはベイズの定理を使って数学的に証明することができます。さっそく見ていきましょう。なおモンティ・ホール問題の証明は様々なものがあります。興味がある方は『モンティ・ホール問題 – Wikipedia』が詳しいので、ぜひ確認してみてください。

モンティ・ホール問題をベイズの定理で証明

まず 3 枚のドアをそれぞれ A、B、C とします。そして回答者は A のドアを選び、司会者は B のドアを開けるとします。この状況で選択肢を変えた方が良いのかどうかは、以下の 2 つの場合の事後確率を比較することで、正確に判断することができます。

選択肢を変えない場合の勝率：司会者が B のドアを開けた場合で、A のドアが当たりである確率
選択肢を変える場合の勝率：司会者が B のドアを開けた場合で、C のドアが当たりである確率

これら 2 つの確率を実際に計算してみましょう。

まず、回答者は最初に 3 つのドアから 1 つを選ぶので、この時点で回答者が当たりのドアを選ぶ確率は 3 つに 1 つです。つまり、どのドアを選んでも、回答者が当たりを引く事前確率は 1 / 3 ということです。

A のドアが当たりである事前確率：1 / 3
B のドアが当たりである事前確率：1 / 3
C のドアが当たりである事前確率：1 / 3

続いて、もし A のドアが当たりである場合、司会者は B と C の両方のドアを開けることができます。一方で、C のドアが当たりである場合、司会者は B のドアしか開けられません。そのため、それぞれの条件下で B のドアが開かれる確率は以下の通りになります。

A のドアが当たりである場合で B のドアが開かれる確率：1 / 2
B のドアが当たりである場合で B のドアが開かれる確率：0
C のドアが当たりである場合で B のドアが開かれる確率：1

さて以上のことから、それぞれの事後確率は次のように計算できます。

選択を変えない場合の勝率の計算

上で見た通り、選択を変えない場合の勝率は、〈司会者が B のドアを開けた場合で、A のドアが当たりである事後確率〉なので、次のように求められます。

\[\begin{eqnarray}
\frac
{
\dfrac{1}{2} \times \dfrac{1}{3}
}
{
\dfrac{1}{2} \times \dfrac{1}{3}
\ + \
0 \times \dfrac{1}{3}
\ + \
1 \times \dfrac{1}{3}
}
=
\dfrac{\dfrac{1}{6}}{\dfrac{3}{6}}
=
\dfrac{1}{3}
\end{eqnarray}\]

このように選択を変えない場合の確率は 1 / 3 になります。

選択を変える場合の勝率の計算

次に、選択を変える場合の勝率は、〈司会者が B のドアを開けた場合で、C のドアが当たりである確率〉なので、次にように求められます。

\[\begin{eqnarray}
\frac
{
1 \times \dfrac{1}{3}
}
{
1 \times \dfrac{1}{3}
\ + \
0 \times \dfrac{1}{3}
\ + \
\dfrac{1}{2} \times \dfrac{1}{3}
}
=
\dfrac{\dfrac{1}{3}}{\dfrac{3}{6}}
=
\dfrac{2}{3}
\end{eqnarray}\]

このように選択を変える場合の確率は 2 / 3 になります。

以上が、選択を変える場合の方が選択を変えない場合よりも確率が 2 倍になることの証明です。

7. 正規分布 ~ 最も重要な確率分布 ~

ここまでで確率について知っておきたいことを一通り解説してきました。ここまでの内容を丁寧に読んで理解したなら、確率の“基本”となる知識としては、その辺の理系の学部生にもヒケをとることはないでしょう。

そして最後にもう一つお伝えしておきたいものがあります。それが確率論と統計学との橋渡しになる知識とも言える「確率分布」です。ここでは確率分布の中で最も有名かつ重要な正規分布というものについて解説します。それによって統計学を学ぶときに扱うことになる様々な確率分布を理解するための良い準備となります。

ただし、ここの内容はこれまでとは少し毛色が異なります。そのため厳密に理解しようとしなくても大丈夫です。「このようなものがあるんだな」という程度に、確率分布（曲線）に触れておくぐらいの意識でちょうど良いでしょう。そうすれば統計学を学ぶときに理解が早くなります。

それでは始めましょう。

7.1. 正規分布とは

正規の確率分布（または正規曲線）とは、以下のように、左右に均等に広がった釣り鐘の形状をしたグラフのことです。

出典：wikipedia

この曲線には「平均値 μ 」と、曲線の広がり方の幅を示す単位である「標準偏差 σ 」というものがあります。これらは様々な値を取ることができて、それによって、様々な現象の確率分布を示すことが可能です。

さて、それでは、なぜこのような釣り鐘型の正規曲線が大事なのでしょうか。その答えは、確率について考えるとき、ありとあらゆる事象がこの曲線と同じ頻度で現れるからです。

たとえば日本人の身長は、この正規分布と全く同じように、真ん中に属する人が最も多く、それよりも高い身長の人の数と、低い身長の人の数をかぞえると、正規分布と同じような広がり方で分布しています。もちろん日本人に限らず、どこの国でも同じような分布を示します。他にも株式の騰落率も、為替相場の騰落率も、正規曲線と同じ形になります。とにかく、現実世界のありとあらゆるものごとが、正規曲線と同じように分布しているのです。

7.2. 正規分布の統計的性質

このように現実世界のありとあらゆるものごとの確率を表す正規分布ですが、これにはいくつかの重要な統計的性質があります。それは以下のものです。なお、これらの性質は、単純な暗記勉強法が大嫌いな私でも、丸暗記しても良いぐらいの価値があると思えるものですので、ぜひ覚えてみてください。

μ ± 1 σ の範囲に含まれる確率は約 68 %
μ ± 2 σ の範囲に含まれる確率は約 95 %
μ ± 3 σ の範囲に含まれる確率は約 99.7 %
μ ± 4 σ の範囲に含まれる確率はほぼ 100 %

また、正規分布は低い方に対しても高い方に対しても全く同じ広がり方をするので、上の性質から、以下の性質も簡単に計算することができます。

μ + 1 σ よりも右側・μ – 1 σ よりも左側に当てはまる確率はそれぞれ約 16 %
μ + 2 σ よりも右側・μ – 2 σ よりも左側に当てはまる確率はそれぞれ約 2.5 %
μ + 3 σ よりも右側・μ – 3 σ よりも左側に当てはまる確率はそれぞれ約 0.15 %
μ + 4 σ よりも右側・μ – 4 σ よりも左側に当てはまる確率はそれぞれほぼ 0 %

確率論から統計学に足を踏み入れる上で、これらの性質の中でも最も重要なのが上から 2 つ目のものです。これは言い換えると…

ある正規分布する現象から得られるデータ（確率量）が平均値（μ）の 2 標準偏差以内（2σ以内）に当てはまる確率は約 95 % である

ということを意味します（ただし厳密には 95 % になるのは、2σ ではなく 1.96σ です）。

7.3. 正規分布と世論調査

それでは正規分布が有用であることがわかる話を一つ紹介したいと思います。

実は正規分布を使いこなせるようになると、大抵の統計的調査について正しく理解できるようになります。ここではその一例として世論調査を扱いましょう。世論調査とは、「母集団全体（たとえば日本人の全有権者）の考えを、無作為標本（母集団の中からランダムに抽出した人たち）から収集した情報をもとに正確に把握しよう」とするものです。

さて、無作為標本から収集した情報を母集団の情報であるとみなすことができるのは、つまり一部分の意見を全体の意見として扱うことが可能であるのは、その背後に確率論的裏付けがあるからです。その裏付けとは、「無作為標本の調査から得られる結果は、母集団と同じように正規分布する」というものです。

詳しく解説します。

なお、この点について理解する上で、「標本百分率」「母百分率」という言葉が必要なので説明しておきます。見たまんまなのですが以下の通りです。

標本百分率：標本における割合
母百分率：母集団における割合

たとえば合計 100 人の無作為標本に、現内閣を支持するかどうかを尋ねて、60 人が支持すると答えたなら、標本百分率は 60 % となります。そして、これを 100 で割って 0.6 と表したものを「標本比率」と言います。母百分率は、母集団全体における割合のことです。

そして無作為標本の正規分布の標準偏差は、標本比率を使って以下のように計算します。

\[\begin{eqnarray}
標準偏差=\sqrt{\frac{(標本比率) \times (1-標本比率)}{標本数}}
\end{eqnarray}\]

無作為標本の数は母集団の数よりもはるかに小さいので、この計算では当然そのことが前提とされています。そして、この計算の分子は標本比率が 0.5 のときに最大になるようになっています（つまり標本比率が 0.5 のときに標準偏差が最大になる）。

さて、次に標本誤差（標本調査の結果と母集団の結果との間に想定されるズレ）は、標準偏差の 2 倍と定義されています。

先ほど、「正規分布する確率量が平均値の 2 標準偏差以内に当てはまる確率は 95 %」ということをお伝えしましたが、これは標準偏差が 2 であれば調査結果は 95 % の確率で正しいということを意味します。

そこで標準偏差がもっとも大きくなる場合を想定して、標本誤差を計算してみましょう。以下の通りになります。

\[\begin{eqnarray}
最大標本誤差
=
2 \times \sqrt{\frac{0.5 \times (1-0.5)}{標本数}}
=
\frac{1}{\sqrt{標本数}}
\end{eqnarray}\]

つまり 95 % の確率で正しい調査結果の標本誤差は ” 1 / √標本数 ” で得られるということです。

さて、ここで「内閣支持率は 60% で ± 5% の標本誤差あり」と発表されたとします。統計調査でよく目にするこうした表記は、具体的には「母集団における内閣支持率は 95% の確率で 55% ~ 65% の間に当てはまる」ということを意味します。そして、これは同時に「内閣支持率が 55% 以下、または 65% 以上である確率もそれぞれ 2.5% ずつ存在する」ということも意味します。

このとき上述の ” 標本誤差 = 1 / √標本数 ” を使うと、上の世論調査の発表が真実かどうかを確かめることもできます。たとえば、この世論調査が 1000 人の無作為標本をもとに行われたと発表しているとします。その場合、標本誤差は次のようになります。

\[\begin{eqnarray}
\frac{1}{\sqrt{標本数}}
=
\frac{1}{\sqrt{1000}}
=
0.0316
\end{eqnarray}\]

つまり実際の標準誤差は約 3 % となり、発表と比べて齟齬があります。こうしたことは現実的にはあり得ないことですが、万が一、このような調査を目にしたときは疑うようにすると良いでしょう。

なお同じ式から、標本誤差が ±5% になるのに必要な標本数は、たったの 400 であることも計算できます。つまり母集団から無作為に抽出した 400 名に対して調査を行うだけで、かなり質の高いデータを得られるということです。