2023/12/10、日曜日。
数学検定1級の学習と、統計学の学習に取り組んでいます。
Reviews
先週から数学検定の学習を少し離れて、統計学の学習に入ることにしました。
すうがくぶんかさんの『統計学入門【統計検定2級対応】』を受けています。
先週はすうがくぶんかさんの授業をアーカイブ動画で追いかけつつ、統計学を学ぶイントロとして教科書『統計学入門』『大学の統計学』のそれぞれ気になる部分を学習してきました。あと、授業で必要になるRの環境構築も行ってみました。
統計学の教科書は、上記の2冊を使って学んでいこうと思っています。メインは『統計学入門』を使っていきたいのですが、それだけでわかりづらい部分や前提知識の補足として『大学の統計学』で部分的に学ぶ、というような活用をします。
統計学の歴史的なことを知る
統計学には大きく分けて「記述統計」「推測統計」の二つがあります。
- 記述統計:収集したデータの統計量を明らかにして、データの傾向や性質を知るもの
- 推測統計:採取したデータ(標本)から全体(母集団)の性質を確率統計的に推測するもの
統計学を学ぶことで、現状を知ることができるというのも重要ですが、それよりも今あるデータから未来を想像できるようになることに価値がありそうです。これは、後者の「推測統計」にあたります。僕らが統計学を学ぶ目的は、この「推測統計」を理解して使いこなせることにあるのかなと思います。
教科書『統計学入門』では統計の歴史的なところにも触れています。この試行錯誤の歴史が結構面白いです。
- 初期の頃は国家や経済が興味の対象。全数調査の考え方、全体を知ることが大事だった
- 科学の発展、大量観察して得たデータから規則性を探る(平均値、相関)
- 確率を前提として、ばらつきの定量化ができる標準偏差の考え方が整備された
- そして、統計的推測の確立。推定と仮説検定の方法により、部分的な情報から、全体を知ることが理論上可能になった
歴史を見ていくと、その時代に先人たちがどんなモチベーションでその分野を発展させたのかがわかるので、これから学ぶ内容にも少し親しみが湧いてきますね。
統計学って、どうにも僕がこれまで学んできた受験数学とも大学数学とも学び方が違うように思っていて、どう学べば良いかわからないんですよね。これは僕が高校数学の延長である「問題を解く」ということに慣れてしまっているせいだと感じます。統計学は実用性のある学問なので、歴史的なことも知りながら現実に活かすような勉強をしていくと楽しそうです。
推測統計を学ぶための事前知識
統計学を学ぶ本番は「推測統計」となりますが、そこまでの大まかなルートを整理しておきます。
まず必要な高校レベルの数学知識(確率、記述統計、微積分)を事前知識としておさえてから、ちょっと抽象度の上がる確率変数・確率分布を学びます。その後にようやく推定や検定といった推測統計に辿り着ける、という感じでしょうかね。
この一番最初に必要な数学の事前知識としては、『大学の統計学』の教科書の第1章イントロで整理されています。高校数学で学ぶこの3つの分野ですが、ちょっと大学らしい内容も入っています。ですが、前提知識として必要な部分はさほど多くなさそうに感じます。
確率
条件付き確率の計算をもとにした乗法公式、ベイズの定理。
記述統計
1変数と2変数でそれぞれポイントがあります。1変数ではデータの特徴を表す「代表値」やばらつき具合を示す「偏差」「分散」「標準偏差」の計算の仕方とそれらの関係性、2変数で相関係数や直線回帰の計算。
微積分
確率分布を学ぶ際に積分が出てきます。確率は確率密度関数の積分として計算(確率=面積)。ベータ関数やガンマ関数、ガウス積分といった項目もいずれ関連してくるのでしょうか。
Rの環境構築
以下サイトを参考にさせていただいて、RとRStudioをインストール。
僕はPythonを使ったことがありAnacondaをインストールしていたのでそれでRstudioも使えるかなーと思ったんですが、どうもインストールがうまくいかずいきませんでした。2年前くらいには遊びで使ったことがあるのでいけると思ったんですが…。
調べたら同じようにAnacondaでRstudioをインストールできないという情報もちらほら見かけたのですが、2023年の情報があまりなく…。今のバージョンでは何か違うのでしょうか?
Plans
今週は、もうちょっと統計の準備部分をがんばって一通り終わらせたいです。
今週で準備をさらえれば、授業と赤本に集中できるかな。。がんばって追いつきます。
別ブログ(note)では「社会人の数学の学び方」をテーマにあれこれ書いていますので、良ければそちらもご覧ください。