【統計学初心者向け】数学ガールの秘密ノート/やさしい統計【おすすめ本】

数学ガールの秘密ノート/やさしい統計【おすすめ本】 おすすめの本

「統計学の勉強はしてみたいけど,なかなか一歩が踏み出せない…」なんて人はいませんか。そんな人におすすめなのが本書です。【中学の数学からはじめる統計検定2級講座】を執筆している私の目線で,本書から何が学べるかを説明していきますので,興味がわいたらぜひ手にとってみてください!

本書の特徴

人気シリーズ「数学ガールの秘密ノート」の一作で,著者の結城浩さんが「cakes」でWeb連載していた記事を再編集したものが本書です。ここでは,本書の特徴として次の4つを紹介します。

①会話形式
全編が3人の女の子と僕の会話で構成されていて読みやすいので,短時間で読み終えることも可能です。また,会話の中では,統計学の初学者が勘違いしやすいポイントで登場人物もつまずくので,落とし穴を確認しながらしっかりと理解していくことができます。

②練習問題つき
各章末には3〜4問くらいの練習問題がついています。巻末に1問ずつ詳細な解説がついていますので,答えを見る前に自分で考えてみたいところです。計算問題というより,重要な概念を理解できているかを確認する問題が多いです。例えば,第3章の練習問題には次のようなものがあります。あなたは即答できますか?
「n個の数値からなるデータがある。このデータの分散が0になるのはどんなときか」

③計算は最小限
本書では,上手に計算するコツなども示されているので,本文中の式変形もしっかりと追ってほしいところですが,どちらかと言うと,考え方に焦点が当てられています。概念を理解していく上で最低限必要な計算にしぼっている様子がうかがえるので,初学者には優しいと言えるでしょう。

④扱う内容の幅広さ
第1章では折れ線グラフや円グラフ,棒グラフという小学校の内容から始まり,第5章では仮説検定の考え方まで説明されています。主に統計検定3級相当の内容ですが,第5章ではチェビシェフの不等式と大数の弱法則という統計検定2級相当の内容まで登場しますので,かなり幅広いです。(付録やエピローグを除いて)230ページくらいで易しく解説されているので,チェビシェフの不等式のレベルまであっという間に到達できてしまうことに驚くのではないでしょうか。

ここからは各章の内容のうち,興味深いところをピックアップしていきます。
第1章「グラフのトリック」は,グラフの見せ方の違いによって,どのように見る人を欺くことができるかがテーマですが,詳細は割愛します。
では,第2章以降の内容を見ていきましょう!

第2章 平らに均す平均

この章で学べることは主に次の4点です。

  • 平均最頻値中央値とは何か
  • 代表値ヒストグラムの対応
  • 分散とは何か
  • 偏差の合計はつねに0であること

皆さんは,これらを自分の言葉で説明できますか?
もしできなければ,この章を読みながら「自分ならどう説明するか」を考えてみるといいでしょう。
平均や最頻値,中央値といった代表値は,データの分布の特徴を明らかにする指標です。でも,それらだけでは区別できない分布もあるのです。そこへ偏差という概念が登場し,「偏差の2乗の平均」として分散が導入されていくという流れになっています。

第3章 偏差値の驚き

偏差値とは何でしょうか。「その定義を述べよ」と言われたら,説明できますか?
「偏差値が上がった!」とか「偏差値をあと10上げたい!」とか言っている中高生はたくさんいますが,「偏差値とは何か」がわかっていないなら,偏差値に関する主張は荒唐無稽なものになってしまいます。みなさんは大丈夫ですか?
こう言われてドキッとした人はこの章をこっそり読んでみてください。偏差,標準偏差,偏差値の違いがわかるように説明されています。
さらに,偏差値の平均偏差値の分散も計算していきます。第2章での学習内容の応用ですね。
この章で学べることをもう1つだけピックアップすると,次の恒等式が挙げられます。

「あ〜,あの式ね」と思えるでしょうか。ヒントは「分散が関係する式」ということです。もしピンとこないようであれば,この章を読んでみると気づきが得られるでしょう。
章の最後に,偏差値との関連で正規分布も登場します。

第4章 コインを10回投げたとき

この章では,コインを10回投げたときの確率,期待値,分散を計算していきます。

例えば,あなたは次の質問に即答できるでしょうか。

コインを10回投げたとき,表の出る回数の期待値と標準偏差はそれぞれいくらか?

即答できないようであれば,この章を読んでみる価値があるでしょう。表の出る回数の期待値と標準偏差の求め方を自分の頭の中で再現できるようになるまでじっくり読んでみてほしいです。

残念なのは,Σ(シグマ)組合せが,本書中には説明のないまま,いきなり使われ始めるところです。組合せについては,脚注で「数学ガールの秘密ノート/場合の数を参照するように」との指示があるので,他の本を参照しないといけないのですね。もしわからない人は,私が執筆している【中学の数学からはじめる統計検定2級講座】の第5回(シグマ)と第10回(組合せ)の記事も参考にしてください。

第5章 投げたコインの正体は

みなさんは,次の事実が成り立つ理由を説明できるでしょうか。

どんな分布でも,75%以上のデータが「平均±2×標準偏差」の範囲に入る。

この章では,この事実の証明も含め,盛りだくさんな内容になっています。主に次のような内容を学ぶことができます。

  • 二項分布の期待値や分散を求める方法
  • 仮説検定とは何か
  • チェビシェフの不等式とは何か
  • 大数の弱法則とは何か

この章では,「コインの表が出る確率」を軸にして,期待値の性質(線型性),二項分布と正規分布の関係,そして仮説検定へと進んでいきます。そして最後がチェビシェフの不等式と大数の弱法則で,最初に挙げた質問の答えがここでわかります。

まとめ

折れ線グラフや円グラフ,棒グラフから始まり,仮説検定,チェビシェフの不等式や大数の弱法則までという統計検定2〜3級相当の内容が解説されていると紹介しましたが,もちろん統計検定2〜3級相当の内容がすべて解説されているわけではありません。共分散や相関係数などは扱われていませんし,区間推定についての言及もありません。したがって,この本だけで統計検定3級の対策が完了するわけではないことに注意してください。それでも,統計検定3級レベルの内容を概観し,本格的な学習へと進む前の準備として読む価値があるものと考えます。「数学は苦手だけど,これから統計学をゼロから勉強してみたい!」という統計学初心者の1冊目にどうぞ。

コメント

タイトルとURLをコピーしました