紅崎玲央の学習記録 - 趣味の数学ノート別冊

趣味で数学に取り組む学習記録です。

🗒️p.026- いろいろな確率分布の概要②連続型

2023/12/31、日曜日。
数学検定1級の学習と、統計学の学習に取り組んでいます。

Reviews

12月に入ってから、すうがくぶんかさんにお世話になって、統計学の基礎を学んでいます

先週は、遅れを取り戻すべく授業と赤本を見返しました。

ちょっとずつ確率分布で押さえておくべきポイントはつかめてきたような、いないような。

それでいて授業で質問をしたいのですが、その質問が出てこないんですよね。まだ、どこがわかってないかわからない、なんとなく授業を聞いてしまっているなと思いました。

今回も、前回に引き続き赤本の6章の範囲からまとめていきます。

いろいろな確率分布のイメージを掴むために、こちらの動画も参考にさせていただいています

www.youtube.com

赤本 第6章:確率分布 ②いろいろな連続型確率分布の概要

今回は連続型のいろいろな分布の概要について整理していきます。

連続型の確率分布として、赤本では正規分布、指数分布、ガンマ分布、ベータ分布、コーシー分布、対数正規分布、パレート分布、ワイブル分布の7つが紹介されています。

連続型:正規分布ガウス分布

正規分布はどうにも「こういう時に現れる確率分布」と簡単に表現できる言葉が無さそうです。ただ、いくつか書籍を調べていると「標準化した二項分布の極限により表される確率分布」と表現しているものを見つけました。

具体的な事例としては非常に多く、「自然に生じる測定誤差や個体差」はこの正規分布に従うことが多いようです。例えば「人の身長の分布」「雨粒の大きさ」などがあります。

正規分布には次のような特徴があります。

  • 平均値μを軸として左右対称の釣り鐘型になっている
  • 区間[μ±3σ]の範囲で確率がほぼ1となる (事実上のすべて、3シグマ範囲)
  • 平均値・最頻値・中央値が一致する

統計学的に非常にたくさんの意味があるのがこの正規分布です。正規分布を標準化した標準正規分布も重要です。

正規分布N(μ, σ2)で表され、パラメータμは平均値、σ2は分散(σは標準偏差)です。標準正規分布N(0, 1)となります。

特に面白い性質として、離散型確率分布である二項分布で、n→∞の極限を取ると連続型の正規分布に近似していくという重要な性質は「中心極限定理」と呼ばれています。

連続型:指数分布

指数分布は「発生率一定のある事象が、次に発生するまでの時間を表す確率分布」です。

具体的な事例として、たとえば「次に地震(災害)が起こるまでの時間」「故障率一定のシステムが次に故障するまでの時間」「原子核崩壊の時間」はこの指数分布に従うようです。発生する確率が小さい稀少事象だからといって遠い未来にしか起こらないのでは無く、近い未来でも起こりうることを示唆する面白い分布だと感じます。

これは、初めてそれが起こるまで待つ時間の長さの確率分布であるため「連続的な待ち時間分布」の性質があります。離散型の時に学んだ幾何分布もそのような性質を持っていましたね。

指数分布はEx(λ)で表され、パラメータλは単位時間あたりに事象が起こる回数です。

この指数関数を一般化したものが、次のガンマ分布になります。

連続型:ガンマ分布

ガンマ分布は「発生率一定のある事象が、ある事象がk回発生するまでの時間を表す確率分布」です。

具体的な事例として、たとえば「10人の来客があるまでにかかる時間」「故障率一定のシステムがあと5回故障するまでの時間」はガンマ分布に従うようです。また「エイズの潜伏期間」もこれに該当するようです。

ガンマ分布はGa(α, λ)で表されます。α=1の時が指数分布に該当しますね。

連続型:ワイブル分布

ワイブル分布は「発生率が一定でないある事象が、次に発生するまでの時間を表す確率分布」です。

具体的な事例として、たとえば「電化製品が故障するまでの時間」

指数分布と似ていますが、異なるのはその発生率が一定と考えられるかどうか、ということです。電化製品などの故障率は基本的には一定ではなく「バスタブ曲線」で表されます。初めのうち・ずっと使っていると故障率が高く、それ以外は偶発的に起こると考えられるんですね。

電球のようにシンプルなもので1回壊れたら終わりなら故障までの時間は指数分布に従い、パソコンや家電製品のように故障率が使用時期によって異なる場合は故障までの時間はワイブル分布に従う、のような捉え方をしておくと良いのかなと思います。

連続型:その他の分布

このほか、赤本ではベータ分布コーシー分布対数正規分布パレート分布が挙げられていますが、こんなのもあるんだーという程度で留めておきます。

コーシー関数は正規分布と似ているのですが、期待値や分散が存在しないらしいです。期待値が存在しないって、どういうことなんだろう?

赤本 第6章:確率分布 ③重要な確率分布3つ

次に離散型、連続型とざっくりとした確率分布について俯瞰して学んできましたが、もうちょっと数式を交えて抑えておこうと思います。

とくに重要な確率分布について3つ、二項分布・ポアソン分布・正規分布について。とくに正規分布は数式での理解が今後書かせないと思うので,抑えておきたいポイントを超簡単に整理しておくことにしました。

二項分布

二項分布の期待値、分散は二項係数を計算して導出しますが、実際の導出はかなり複雑に感じました。累積分布関数を用いると計算はやりやすそうです。

ポアソン分布

ポアソン分布の確率関数は、二項分布の確率関数から極限を取る形で導出できます。期待値と分散が共にλとなるのは興味深いですね。

正規分布

正規分布は標準化の考えが重要そうです。具体的な問題で練習してみたいと思います。

Plans

いまは年末年始で授業もお休みなので、今週はしっかり授業の復習に当てていこうと思います。

来週の振り返りでは、赤本7章について整理したいですね。

またもし余力があれば、確率分布(特に二項分布、ポアソン分布、正規分布)について具体的な問題を練習してみたいなと思っています。練習に良さそうなのは、noteの方でコメントで教えていただいた、こちらの書籍。

ではでは、また来年も楽しく勉強していきましょう。


別ブログ(note)では「社会人の数学の学び方」をテーマにあれこれ書いていますので、良ければそちらもご覧いただけると嬉しいです。

note.com