【確率・統計】Poisson分布の期待値・分散/Poisson分布の導出


 Poisson分布(ポアソン分布)は以下のような確率分布をもつ。

    \begin{eqnarray*} P_n = e^{-\lambda}\frac{\lambda^n}{n!} \end{eqnarray*}

\lambda は平均値である。また、Poisson分布の平均値と分散は

    \begin{eqnarray*} \braket{n}&=&\lambda\\ \braket{(n-\braket{n})^2}&=&\braket{n^2}-\braket{n}^2=\lambda \end{eqnarray*}

である。平均も分散も \lambda になる

 このPoisson分布の平均値の意味やら導出やらをまとめておく。


1. Poisson分布

 簡単に概要を書いておく。

Poisson分布について

\lambda は平均値と書いたが、その意味はたくさんの試行を繰り返した場合にある事象が起こる回数の平均のことである。

 よくあるのが不良品の例はわかりやすい。おそらくPoisson分布の基本的な問題には

「1000回に10個の不良品を出す機械」

 のようなフレーズが含まれるだろう。これは平均が10/1000となるように機械が不良品を出すという意味である。 10000回製品を作るならば平均して100個の不良品を出す。


Poisson分布の使い方:基本例題

問題例:

  1. N=1000回に30個の不良品
  2. 100個の製品を調べる
  3. そのうち不良品が5個ある確率を求める

Poisson分布:

    \begin{eqnarray*} P_n = e^{-\lambda}\frac{\lambda^n}{n!} \end{eqnarray*}

である。1より機械がつくる100個の製品のうち3個が不良品となる。したがって、100個のうちの不良品の数の平均もまた \lambda=3 である。3は「 n=5 に対応する P_5 を求めよ」の意味である。上の P_nn=5,\lambda=3 を代入すれば良い。


2. Poisson分布の平均値・分散など導出

 ここでは、平均と分散は\sum で計算していく。母関数は使わない。分布の導出には母関数を使う。


平均値の計算

    \begin{eqnarray*} \braket{n}&=&\sum_{k=0}^\infty kP_k\\\\ &=& \sum_{k=0}^\infty \frac{k\lambda^k}{k!}\,e^{-\lambda}\\\\ &=& e^{-\lambda}\sum_{\textcolor{red}{k=1}}^\infty \frac{k\lambda^k}{k!}\\\\ &=& e^{-\lambda}\sum_{k=1}^\infty \frac{\lambda^k}{(k-1)!}\\\\ &=& \lambda e^{-\lambda}\sum_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!}\\\\ &=& \lambda e^{-\lambda}\sum_{\textcolor{red}{k=0}}^\infty \frac{\lambda^k}{k!}\\\\ &=& \lambda e^{-\lambda}\cdot e^{\lambda}\quad\left(\because e^x = \sum_{k=0}^\infty \frac{x^k}{k!}\right)\\\\ &=& \lambda\quad\blacksquare \end{eqnarray*}

\sum の取り方などに注意する。2行目の \sum の中身は k=0 のとき 0 であるため、実質 k=1 からの和である。したがって、3行目では k=1 からの \sum になる。また、6行目では k=1 から始めると (k-1)! なので、k! にして k=0 から始めている。


 以下で見るように、Poisson分布は平均値を \lambda で一定にしているので、得られた結果 \braket{n}=\lambda は当たり前である。


分散の計算

 分散は、平均値からの差の2乗の平均である。

    \begin{eqnarray*} \braket{(n-\braket{n})^2}=\braket{n^2}-\braket{n}^2 \end{eqnarray*}


\braket{n}=\lambda は上で計算した通りである。したがって、\braket{n^2} を計算すれば良い。


    \begin{eqnarray*} \braket{n^2}&=& \sum_{k=0}^\infty k^2 P_k\\\\ &=& \sum_{k=0}^\infty \frac{k^2\lambda^k}{k!}e^{-\lambda}\\\\ &=& \sum_{k=0}^\infty \frac{k(\textcolor{red}{k-1+1})\lambda^k}{k!}e^{-\lambda}\\\\ &=& \sum_{k=0}^\infty \frac{k(k-1)\lambda^k}{k!}e^{-\lambda} +\sum_{k=0}^\infty \frac{k\lambda^k}{k!}e^{-\lambda}\\\\ &=& e^{-\lambda}\sum_{\textcolor{red}{k=2}}^\infty \frac{k(k-1)\lambda^k}{k!} +\lambda\quad(\lambda=\braket{n})\\\\ &=& e^{-\lambda}\sum_{k=2}^\infty \frac{\lambda^2 \cdot\lambda^{k-2}}{(k-2)!} +\lambda\\\\ &=& \lambda^2 e^{-\lambda}\sum_{\textcolor{red}{k=0}}^\infty \frac{\lambda^{k}}{k!} +\lambda\\\\ &=& \lambda^2 e^{-\lambda}\cdot e^{\lambda} +\lambda\\\\ &=&\lambda^2 +\lambda \end{eqnarray*}


したがって分散は

    \begin{eqnarray*} \braket{n^2} -\braket{n}^2=\lambda^2 + \lambda -\lambda^2 =\lambda\quad\blacksquare \end{eqnarray*}


Poisson分布では分散も \lambda になる。



Poisson分布を導出する前に

 はじめに落とし穴を説明しておく。

 ある確率 p で不良品を出す機械があるとしよう。この機械が N 個の製品を出したときに、不良品の数 n の期待値を \lambda とする。 つまり、

    \begin{eqnarray*} \braket{n}=\lambda \end{eqnarray*}

としておく。Poisson 分布では \lambda、すなわち、不良品の数 n平均値が一定であるとする。

 よって、\lambda=0.1 であれば

  • 100個のうち不良品の数の平均は 1 個
  • 1000個のうち不良品の数の平均は 10 個
  • 100000個のうち不良品の数の平均は 1000 個

である。



 何をあたりまえのことを…と思うだろう。しかし、不思議なのはその機械が毎回 確率 p で不良品を出していることである。

「毎回 p で不良品、q=1-p で不良品でない」という確率は二項分布である

したがって、N 回の試行のうち、不良品の数が n である確率は

    \begin{eqnarray*} P_n^{N}=_NC_n p^n q^{N-n} \end{eqnarray*}

である。二項分布のときの n の期待値は、(試行回数N)×(事象が起こる確率p)であった。つまり、

    \begin{eqnarray*} \textcolor{red}{\braket{n}=Np} \end{eqnarray*}

となる。いまPoisson分布においては、\braket{n}=\lambda定数であった。



 すると上の N=100,1000,100000 とどんどん増やしていった例では、p はどんどん小さくなっていく。 これを N を増やせば p が減る、すなわち、「機械は不良品をどんどん出しにくくなる」と考えるのは無意味である。



 直感的には理解しにくいが、

Poisson分布は n の平均値 \braket{n} を固定した分布である

 したがって、1000回のときの平均値が0.1であれば、100回の時の平均値もまた0.1である。以下のPoisson分布の導出では、N\to \infty を考える。



*二項分布との違い:二項分布はコインを N 回投げた場合、表が n 回出る確率 P_n などの分布を表す。何回投げても「1回の事象でコインが表になる確率 p 」は変わるはずがない。ここで変わるのは、表が出る回数 n の平均値 \braket{n} である。直感的に100回投げたら表が出る回数は50回に近いだろうし、1000回投げたら500回に近い。この場合、\braket{n}=50\braket{n}=500 になる。 したがって、試行回数を増やせば n の平均値は変わる。



Poisson分布の導出

 機械は一回の事象で p の確率で不良品を出すとすると、N 回の試行で不良品が n 回出る確率は

    \begin{eqnarray*} P_n^{N} = _NC_n p^n q^{1-n}\quad(q=1-p) \end{eqnarray*}

これは二項分布であり、n の平均値は

    \begin{eqnarray*} \lambda\equiv \braket{n}=Np \end{eqnarray*}

である。



\lambda を固定して、N\to\infty を考えよう。 母関数

    \begin{eqnarray*} \phi (x)=\sum_{n=0}^\infty P_n x^n \end{eqnarray*}

を用意して導出する。


 母関数を計算しておこう。

    \begin{eqnarray*} \phi (x)&=&\sum_{n=0}^\infty P_n x^n\\\\ &=& \lim_{N\to \infty } \sum_{n=0}\infty _NC_n p^n q^{N-n}x^n\\\\ &=& \lim_{N\to \infty }\infty (px+q)^N\quad\left(\,\because (a+b)^N = _NC_n a^n b^{N-n}\,\right)\\\\ &=& \lim_{N\to \infty } \left\{(1+p(x-1)\right\}^N\quad(\because q=1-p)\\\\ &=& \lim_{N\to \infty (p\to 0)}\left\{(1+p(x-1)\right\}^\frac{\lambda}{p}\quad(\because \lambda=Np)\\\\ &=& \lim_{p\to 0}\left\{(1+\textcolor{red}{p(x-1)}\right\}^{\frac{1}{\textcolor{red}{p(x-1)}}\cdot\left(\lambda (x-1)\right)}\\\\ &=& e^{\lambda(x-1)}\quad(\because\lim_{x\to 0}(1+x)^{\frac{1}{x}}=e)\\\\ &=& e^{-\lambda }\,e^{\lambda \lambda x }\\\\ &=& e^{-\lambda}\,\sum_{n=0}^\infty \frac{(\lambda x)^n}{n!}\quad(\because e^{x}=\sum_{n=0}^\infty \frac{x^n}{n!})\\\\ &=& e^{-\lambda}\sum_{n=0}^\infty \frac{\lambda^n}{n!} x^n\\\\ \end{eqnarray*}

となる。


 最後の結果と1行目を改めて書いておく。

    \begin{eqnarray*} \phi(x)=\sum_{n=0}^\infty \textcolor{red}{P_n} x^n=\textcolor{red}{e^{-\lambda}}\sum_{n=0}^\infty \textcolor{red}{\frac{\lambda^n}{n!}} x^n \end{eqnarray*}

 x^n の係数を比較して

    \begin{eqnarray*} \textcolor{red}{P_n=e^{-\lambda}\frac{\lambda^x}{n!}} \end{eqnarray*}

を得る。

* これは Poissonの極限定理(wikipedia)である。



3. まとめ

 Poisson分布について説明してきた。Poisson分布の平均値と分散は \sum で計算してきた。これには最後のところで得た母関数を用いた計算方法もある。



コメントを残す

メールアドレスが公開されることはありません。