代表的な確率分布〜離散型と連続型〜

Developers's blog

2019.08.19 ayami haga
代表的な確率分布〜離散型と連続型〜

離散型確率分布

確率変数の取りうる値が飛び飛びになっている確率分布。 例えばサイコロの出る目・トランプをランダムに一枚引いたときに出る数字の大きさなど。(両方とも1.5や1.1のような値は取ることができない。) 離散型の確率分布は無限に存在してるが、その中でも使用頻度の高いものには名前がついている。

ベルヌーイ分布

「裏表」「YESorNO」のように結果に取る値が2種類しかない実験を1回試行し(総試行回数n=1)、表が出るときを「1」裏が出るときを「0」で表した確立分布のこと。 また、1(表)が出る確率を「p」、0(裏)が出るときを「1-p」とする。

省略:Alt text

二項分布

ベルヌーイと同様に試行結果が2択であり、同じ条件でかつ独立にn回繰り返す。 表がx回出て、裏がn-x回出る確率

Alt text

省略:Alt text

例1『300回のページ閲覧数のうち、65%の確率で広告がクリックされる。閲覧数が200回の時広告がクリックされる確率は?』

  • 結果は(クリックされるかされないか)2択
  • 試行回数が2回以上

2つの点から例1は二項分布に当てはまる。 二項分布を利用すると Alt text

幾何分布

二項分布を別の視点で考えた時、試行回数をあえて決めないで試行を続ける。 最初の成功を得るまでにk回裏が出る確率(k+1回目で初めて成功を得る)

Alt text

負の二項分布

r回の成功が起こるまでにk回の失敗が起こったとすると、総試行回数はr+k回である。
このとき最後のr+k回目にr回目の成功が起こるわけであるから(r+k回目はもう成功するって決まっているから)r+k回目の試行を除いた、
r+k-1回の試行を考える。
r+k-1回の試行ではr-1回の成功とk回の失敗が起こっているから、 その確率は

Alt text

となる。
 また、r回目の成功が起きる確率はpで起き、各試行は互いに独立である。
以上から、r回の成功が起こるまでにk回の失敗が起こる確率つまり、 負の二項分布は
まず


「r+k-1回の試行中にr-1回の成功とk回の失敗が起きる」...①


かつ


「r+k回目にr回目の成功が起こる」...②


Alt text

各試行が互いに独立であることから①と②の積で確率を表せる。

Alt text

ポアソン分布

ポアソン分布は二項分布から派生したもの。 二項分布において、nの値が大きいのに対してpがとても小さく(イベントが起こること自体が稀な現象)一定の期間内にイベントが発生する回数を確率変数Xとする。その確率変数Xが従う確率分布のこと。

Alt text

Alt text

省略:Alt text

例2『1日に平均3個の不良品が作られる工場で一日5個の不良品が作られる確率は?』

  • 不良品が作られることは稀なこと
  • 期間は1日と決まっている

2つの点から例2はポアソン分布に当てはまる。 ポアソン分布の確率質量関数を利用すると Alt text

連続型確率分布

身長や体重のように確率変数が連続している確率分布。

正規分布

代表的な確率分布の一つ。測定誤差や(身長、体重のように人体測定など)生物測定の分野で頻繁に使われている。正規分布のパラメーターは平均Alt textと分散Alt textの2つ。 また、正規分布が平均Alt textと分散Alt textに従うことを省略して、Alt textに従うと表記することができる。 確率密度関数は

Alt text

正規分布の特徴

  • 平均値は分布の中心・分散は分布の広がりを表している
  • 平均値を中心にして左右対称
  • 平均値=中央値=最頻値

Alt text

お問い合わせはこちらから