2023/12/24、日曜日。
数学検定1級の学習と、統計学の学習に取り組んでいます。
Reviews
12月に入ってから、すうがくぶんかさんにお世話になって、統計学の基礎を学んでいます
先週の授業では、正規分布の話題と多次元の確率分布について学びました。授業では要点をかいつまんで統計学の外観を掴むような構成にしていただいていて、統計書学者にとって集中するべきところがわかるので大変助かっています。
一方で赤本に書いてあるものの触れなかったり、数式の導出過程を省略している部分があったりもするので、そういった部分は自主学習でできるだけキャッチできるように努めてきました。
ですが、どうにも理解への手応えが掴めずにきています。おそらく複数の書籍を参考書として使うことで学習が分散しちゃっていて、なかなか授業に追いつかず焦ってしまっているのが良くないなあと気づきました。今後のやり方については,後ほど整理します。
今回は、赤本の6章の範囲からまとめ。
ちなみに、いろいろな確率分布のイメージを掴むために、こちらの動画も参考にさせていただいています
赤本 第6章:確率分布 ①いろいろな連続型確率分布の概要
赤本の第6章では、いろいろな確率分布が登場します。
頭からすべて学んでいこうとするとなかなかキツいので、次のような方針で学ぶのがよさそうに思いました。
- いろいろな確率分布の概要(具体的な事象の例や関連性)を掴む
- とくに重要な確率分布について、基本的な性質(分布の形状や期待値・分散の式)を理解する
- 上記の確率分布について、数式の導出を学んで数式での理解を深める
- その他の確率分布についても同様に理解を深める
ここではまず、1にあたる分布の概要について整理していきます。今回は離散型のみで力尽きました。
離散型の確率分布として、赤本では超幾何分布、二項分布、ポアソン分布、幾何分布、負の二項分布、一様分布の6つが紹介されています。
この中でとくに重要な確率分布は、二項分布・ポアソン分布あたりでしょうか。
離散型:超幾何分布
いきなり出てくるこの分布、ちょっと馴染みがないですね。赤本では、以下のように書かれています。
2種類A, BからなるN個のものがあり、個数の構成はそれぞれM, N-Mとする。この集団から勝手にn個取り出したときに、Aがx個、Bがn-x個であるとする(中略)
この確率分布を超幾何分布という。
この場合、取り出し方は非復元、つまり1個を取り出したときに元に戻さずに次を取り出すことを考えています。もしこの取り出し方が復元、つまり取り出したものを元に戻す場合であれば、試行ごとに確率が変わらず、超幾何分布ではなく次の二項分布となるようです。
離散型:二項分布
二項分布は「ベルヌーイ試行を一定回数行った際の成功回数の確率分布」です。ベルヌーイ試行とは、コイン投げの裏表のように2種類の結果(成功・失敗)がある試行のことです。
具体的な事例として、たとえば「コインを5回投げて表が出る回数」はこの二項分布に従います。他にも「10人の中のコロナウィルス感染者数」なども相当するようですね。
二項分布はBi(n, p)と書かれ、nが試行回数、pが成功の確率を表します。
この二項分布でnを大きく取ると、連続型の正規分布に近似します。
離散型:ポアソン分布
ポアソン分布は「ある期間内で事象が発生する回数の確率分布」です。
具体的な事例として、たとえば「1時間に電話を受ける件数」「1日の交通事故の件数」はこのポアソン分布に従うようです。
ポアソン分布はPo(λ)と書かれ、λは単位時間あたりの平均回数を表します。
これは二項分布において、試行回数n→∞としたときに現れる確率分布のようですね。また二項分布と同様に、ポアソン分布でλを大きく取ると、連続型の正規分布に近似します。
離散型:幾何分布
幾何分布は「ベルヌーイ試行を繰り返し、初めて成功するまでの試行回数の確率分布」です。この名前は、確率質量関数が幾何級数(=等比級数)の形になることからきているようです。
具体的な事例として、たとえば「コインを投げ続けて初めて表が出るまでの試行回数」「飛び込み営業が成功するまでの回数」などがあります。
また幾何分布は、初めてそれが起こるまで待つ時間の長さの確率分布とも捉えることができて、「離散的な待ち時間分布」と呼ばれるようです。
幾何分布のパラメータは、それが起こる確率pのみです。
二項分布ではベルヌーイ試行の回数をn回としたときの成功回数に着目していましたが、この幾何分布では試行の回数を決めていないのですね。そしてこの幾何分布を一般化したものが、次の負の二項分布となります。
離散型:負の二項分布
負の二項分布は「ベルヌーイ試行を繰り返して、k回目に成功するまでの失敗回数の確率分布」です。この名前は、確率質量関数に負の値に拡張した二項係数が登場することからきているようです。
具体的な事例として、たとえば「コインを投げ続けて5回表が出るまでに出た裏の回数」「消費者のある商品の購買回数」などがあります。
負の二項分布でk=1としたときが先ほどの幾何分布になります。期待値や分散も幾何分布のk倍と、スッキリした値が出てきます。
離散型:一様分布
一様分布は「すべての事象が全く同じ確率で発生する場合の確率分布」です。確率質量関数は定数で、一番シンプルな確率分布ですね。
具体的な事例として「サイコロを1回投げた時に出る目」があります。
一様分布は離散型だけでなく、連続型の場合にも考えられます。
Plans
今後の学習の進め方について、あれこれと手を出そうとしないで、赤本を使った授業の予習復習をベースとして進めるのがよいなーと思っています。
という訳で、今週は授業と赤本でこのあたりの内容を。
まずは「概要を掴む」「整理してまとめる」というところに注力したいですね!
もちろん「数式で説明ができる」「問題を解ける」ということも大事ですが、ここはいったん置いておきたいと思います。今の学習が一段落ついたら取り組みたいと思います。
別ブログ(note)では「社会人の数学の学び方」をテーマにあれこれ書いていますので、良ければそちらもご覧いただけると嬉しいです。