2023/12/17、日曜日。
趣味で数検1級の学習と、統計学の学習に取り組んでいます。
Reviews
12月に入ってから、すうがくぶんかさんの『統計学入門【統計検定2級対応】』を受講して統計学の基礎を学習しています。
先週は、授業でいろいろな確率分布について学びました。教科書で確率変数・確率分布を復習し、また記述統計に関しても『大学の統計学』の第1章で記述統計の概要をつかみました。
- 授業:確率分布について
- 教科書『統計学入門』(赤本)
- 第5章 確率変数
- 第6章 確率分布
- 参考書『大学の統計学』
- 第1章 イントロ(2節 記述統計)
- 第2章 確率分布(2節 離散型確率分布の途中まで)
学習の仕方については、まずは授業を受けて要点を聞き、赤本でその範囲を復習したのちに、もう1冊の教科書『大学の統計学』で理解を深めるようなやり方をとっています。本当は授業の前に一回赤本で予習をしてから臨むのが理想なんでしょうけど…なかなかそこまで追いつきません。
ここでは、赤本の章ごとに概要を掴む形でアウトプットしてみることにしました。今回は第5章の範囲です。
赤本での学び方については、こちらのnoteでも書きました。
赤本 第5章:確率変数
赤本の第5〜6章で、確率変数と確率分布を学びます。5章で総論を学び、6章で個別の各論といった位置付けです。
この第5章は、統計初学者はすぐに理解するのがなかなか難しいように僕は感じました。
これは人にもよると思いますが、総論から学ぶよりも具体的な分布について手を動かして計算しながら見ていったほうが、イメージや感覚が掴めるんですよね。「習うより慣れろ」という感じ。
そこでもう1冊使っている参考書では、離散型の確率変数・期待値・分散についてサクッと整理した後にすぐ具体的な確率分布に入る構成になっているので、だいぶ助かりました。
確率変数と確率分布
まず、重要な用語としてはこの2つがあります。
確率変数X
試行の結果によって値が定まり、その値を取るときの確率が決まっている変数のこと
確率分布
確率変数に対して、それぞれの値の確率を定める表・グラフのこと
確率変数を横軸に、その値を取る確率を縦軸にグラフ化したものが確率分布です。確率分布は確率の「重み」の分布の様子を表していると捉えることができます。
確率分布:離散型と連続型
確率分布には「離散型」と「連続型」があり、それぞれで性質が大きく異なります。
離散型確率分布
・確率変数Xが、可算集合の中の値をとる
・各Xをとる確率は確率質量関数で表される
・確率の総和は1になる
連続型確率分布
・確率変数Xが、連続な値をとる
・確率は確率密度関数で表される
・その定積分が確率の値となり、全範囲で定積分すると1になる
離散型・連続型どちらの場合でも、ある値以下を取る確率を表した「累積分布関数」を定義することもできます。
確率分布を代表する値:期待値・分散・モーメント
確率分布を代表する値として、次のような量を使います。
期待値E(X)
・確率分布を表す確率変数の期待値のこと。確率の重みつき平均。
・Xの値とそれに対応する確率の積の総和をとったものを期待値と呼ぶ。
分散V(X)
・確率分布のばらつきの指標。分散が大きいほどXのばらつきは大きい。
・Xの期待値とのズレを偏差と呼び、偏差の2乗の期待値を分散と呼ぶ。
このあたりは数式で計算に慣れた方が良さそうですね。
確率分布の形状を表す「モーメント(積率)」という概念もあります。モーメントは偏差のr乗の期待値で表されて、「Xの期待値まわりのr次モーメント」のように表現します。分散は「Xの期待値まわりの2次モーメント」です。また、非対称性の指標である歪度、尖りの程度を表す指標である尖度が定義できます。
また、期待値や分散の値を用いた確率変数の「標準化」ものちのち使います。偏差(確率変数から期待値を引いた値)を標準偏差(分散の平方根)で割った値を新たな確率変数とすることで、確率分布の期待値を0・分散を1に調整することができます。
発展
以下は、授業では深く触れなかった項目。今後、参考書の方で手を動かしながら学んでいきたいです。
モーメント母関数
すべての次数のモーメントを生成する関数を定義することができます。
これにより期待値、分散、歪度、尖度といった各次数のモーメントが簡単な微分の計算から求められるようです。
チェビシェフの不等式
全体の分布がわからない時に、平均と分散から確率の見当をつけるときに役立つようです。
例)テストの平均と分散しかわかっていない状態で、50点〜60点である確率について見当をつけたい。
確率変数の変換
確率変数Xに関して、その関数(変換)X2, 1/X, eX, logXなどの確率分布を求めたいケースがよくあります。
例)世帯年収の分布などは下と上でばらつきが大きいため、対数関数logXへ変数変換して考えるほうが適切。
Plans
今週は、引き続きすうがくぶんかさんの「統計学入門」の授業を受けながら、教科書を使って確率分布の理解を深めていきたいです。
この辺、できれば本を読むだけでなく、計算練習で慣れたいなーと思います。手頃な演習書が欲しいところなのですが、何が良いのでしょうかね…?
とりあえず参考書の演習問題と、数学検定1級の統計の問題でもやってみようかなーと思っています。
別ブログ(note)では「社会人の数学の学び方」をテーマにあれこれ書いていますので、良ければそちらもご覧いただけると嬉しいです。