【おすすめ本】統計学の入門書【統計検定2級相当】

【おすすめ本】統計学の入門書【統計検定2級相当】 おすすめの本

「統計学『入門』って本がたくさんありすぎて,どれを買ったらいいのか,わからない」とか「『入門』だと思って買ったら,難しすぎて読めなかった」なんてことがよくありますよね。確かに統計学「入門」を掲げた本は多すぎて,レベルもバラバラなので,統計学をこれから学ぶ人が適切な本を選ぶのはすごく難しいです。

そこで【中学の数学からはじめる統計検定2級講座】を執筆している私がこれまでに読んだ数十冊の入門書の中から,統計検定2級レベルを目指す人に向けて,選りすぐりの3冊を紹介します。

統計検定2級レベルとは

本題に入る前に,前提を確認しておきましょう。

統計検定2級レベルとは何か

この点について,私は「正規分布をベースにした基本的な推定と検定の仕組みを理解し,その計算ができる」ことだと考えています。「計算ができる」っていうところがポイントで,「マンガでわかる」系の書籍にも良いものはありますが,「計算ができる」レベルまで到達することは難しいんですよね。なので,本稿ではこのタイプの書籍は除き,内容がしっかりしていて,計算の仕方がわかる書籍にしぼりました。

統計検定2級に必要な数学とは何か

計算ができることが大事であるという話をしましたが,2級ではどの程度の数学を使うのかと言うと,実は多くの内容については中学までの数学で用がたります。一方で,高校数学の一部を活用する分野も存在し,場合の数の組み合わせ,和を表す記号のΣ,そして積分を使います。この3つについては,このブログの記事でも説明していますが,書籍で学習したいという人は,例えば,統計学が最強の学問である[数学編]などが読みやすいでしょう。

とは言え,このような最小限の数学だけで2級範囲を広範囲に説明してくれる書籍は少ないです。そこで本稿では,①最小限の数学しか用いない書籍,②高校数学がわかれば読める書籍,③高校数学+αの理解が必要な書籍,という3冊をご紹介します。

おすすめの3冊

おすすめは次の3冊です。

①数式が少なめで読みやすく,広範囲をカバー!
入門統計学 第2版(栗原伸一,オーム社)

②数学的な論理を明快に説明!
入門統計解析 第2版(倉田・星野,新世社)

③2級範囲を完全カバー,演習書に最適!
公式と例題で学ぶ統計学入門(久保川達也,共立出版)

このうち,最もやさしめに書かれているのが①で,最も難しめなのが③です。次のセクションからは,これらの内容を順に紹介していくので,ご自身に合うものを見つけてみてください。

【おすすめ①】入門統計学 第2版

平易な説明と網羅性が特徴の書籍です。第2版は2021年の7月に出版されています。実は,本書の初版本には「不偏分散の正の平方根が母標準偏差の不偏推定量になる」という誤った記述があったのですが,第2版では注釈を入れてこの点を修正しています。

次の目次を見てもらえれば一目瞭然ですが,この記事でおすすめしている他の書籍とは扱う内容の幅が異なります。第8章の二元配置分散分析以降は準1級範囲が多く,その中では第10章のフィッシャーの3原則,第11章のχ2検定,そして第12章だけが2級範囲です。

目次

第1章 データの整理ー記述統計学ー
第2章 確率分布
第3章 推定と誤差ー推測統計学ー
第4章 信頼区間の推定
第5章 χ2分布とF分布
第6章 仮説検定と検出力
第7章 2群の平均の差の検定
第8章 分散分析
第9章 多重比較法
第10章 実験計画法
第11章 ノンパラメトリック検定
第12章 回帰分析ー多変量解析①ー
第13章 ロジスティック回帰分析とクラスター分析ー多変量解析②ー
第14章 主成分分析と因子分析ー多変量解析③ー
第15章 ベイズ統計学

内容の特徴

おすすめポイント

・高校数学の知識はΣと積分だけにおさえ,最小限の数式で平易に解説されている

・日本語の説明が多く,全体的に口語調で読みやすい

・推定や検定に使う確率分布以外では,一様分布,二項分布,ポアソン分布に絞って解説しており,ムダがない

・分散分析は具体例を優先した説明になっていて,初学者に向いている

・他書では省略されがちな内容も扱われており,網羅性が高い

(p値,多重共線性,フィッシャーの3原則など)

・推定や検定のパターンにもれが少ない

(例えば,2群の平均の差の検定で,対応のある場合とない場合が両方とも扱われている)

イマイチなところ

・統計検定の出題に近い演習問題は少ない

・母比率(の差)の検定が載ってない

・「なぜその式になるのか」といった詳細は省略されている箇所がある

(回帰係数の検定統計量の導出など)

・著者独自の言い回しや式の表し方に戸惑う可能性がある

・誤字が少しある

コメント

とけたろう
とけたろう

総合的に見て,統計検定2級の勉強をする上で最もおすすめできる書籍です。演習問題として2級の過去問を使うのならば,本書と過去問で十分に2級の対策が可能です。

なお,今回は2級用としての良い点・悪い点を紹介しましたが,準1級の参考書としても使えます。

【おすすめ②】入門統計解析 第2版

高校数学に苦手意識がなく,「なぜそうなるのか」という点まで理解したい人にオススメの書籍。専門書に比べると言葉による説明が多めなので初学者向けの書籍に分類できますが,数式を使った論理的な説明が魅力です。大学の数学が少し登場しますが,大部分は高校数学がわかれば読めます。

2024年3月に発行された第2版では,分割表とオッズの節が追加されていますが,この加筆によって新たに誤字が生まれてしまった点は残念です。2級までしか受けない場合には,オッズは知らなくても問題ないので,初版本を買っても良いでしょう。

目次

第1章 統計解析とは
第2章 1次元データの整理
第3章 2次元データの整理
第4章 確率モデル
第5章 独立同一分布
第6章 母集団と標本
第7章 統計的推定
第8章 統計的仮説検定
第9章 回帰分析
第10章 分散分析

内容の特徴

おすすめポイント

・論理や計算過程のギャップが少なく,丁寧に説明されている

(例えば,各検定統計量がt分布やカイ2乗分布にしたがう理由など)

・数式による表現は比較的シンプルで難しすぎない

・母比率の差の検定を除き,推定や検定は網羅的に解説されている

・演習問題が多く,難易度が適切である

イマイチなところ

・高校数学をしっかり理解していないとついていけない

(第1章に「数学についての補足」はあるが,十分とは言えない)

・演習問題の解答・解説は版元のHPにあるが,一部の解答・解説が省略されている

・統計検定2級で必要な知識の一部が扱われていない

(コレログラム,フィッシャーの3原則,p値,多重共線性など)

・統計検定2級の内容と準1級の内容が混ざっている

(例えば,確率分布の中の指数分布は準1級内容)

・分散分析は分散分析モデルをベースにした説明になっていて,初学者にはわかりにくい

・第9〜10章は統計検定の試験問題のようなタイプの演習問題がない

コメント

とけたろう
とけたろう

統計学を暗記するのではなく,細部まで証明しながら理解を深めていきたい人には,この本は役に立ちます。

モーメント法,最尤法,ベクトルと行列による回帰分析,2元配置モデルなどは準1級範囲なので,飛ばしましょう。

【おすすめ③】公式と例題で学ぶ統計学入門

本書は2024年8月に発売されており,統計検定2級の範囲を完全にカバーすることで,類書を凌駕することを狙って企画されたものと推察されます。しかし,実際に読んでみると,推測統計部分の数式による表現が「統計学初学者にはムズいよなぁ…」という印象。なので,本書の用途としては,他書では解説が不足する記述統計部分の学習用にするか,演習書として利用するか,または2級に合格した後で準1級の準備として全体を読むか,この3パターンのいずれかをオススメします。

目次

第1章 データの整理と分布の特徴
第2章 2次元データの整理
第3章 確率
第4章 離散確率分布
第5章 連続確率分布
第6章 多変数の確率分布
第7章 統計モデルと推定
第8章 信頼区間
第9章 仮説検定
第10章 2標本の仮説検定
第11章 カイ2乗適合度検定と応用例
第12章 線形回帰モデル
第13章 分散分析とロジスティック回帰モデル
第14章 発展的補足事項

内容の特徴

おすすめポイント

・コレログラムやラスパイレス指数なども含め,2級のすべてを網羅している

・13章までのすべての章に十分な量の演習問題がついている

(演習問題の解答・解説は著者のサイトにある)

・仮説検定と信頼区間の関係など,踏み込んだ内容にも触れている

・内容はとてもしっかりしていて,辞書のようにも使える

イマイチなところ

・重積分など,大学初年級の数学も躊躇なく使っている

・p値の定義の仕方など,数式表現が必要以上に難しい

・分散分析は分散分析モデルをベースにした説明になっていて,初学者にはわかりにくい

・条件付き確率密度関数など,準1級相当の内容も混ざっている

コメント

とけたろう
とけたろう

1級レベルの著者の前著から証明を削って,結果だけを公式として並べたような構成で,専門書の雰囲気が残っています。

でも,これだけの演習問題を用意することは大変なので,それだけでも価値はあると思います。

まとめ

ここまで,統計検定2級の参考書として使える3冊の入門書を紹介してきました。「入門統計学 第2版」→「入門統計解析 第2版」→「公式と例題で学ぶ統計学入門」の順に数学的な表現が難しくなります。「入門統計学 第2版」でも難しいという場合は,焦らずに中学または高校の数学の勉強からはじめてください。

できるだけ多くの人の希望に合うように特徴の異なる3冊を選んでみましたが,どれも一長一短があり,「完璧な入門書」は存在しません。なので,多少の妥協は必要だと思われます。そんな中でも,ビビッと感じた書籍があれば,ぜひ手にとってみてください。

コメント

  1. ぷーーー より:

    統計検定2級の書籍購入検討の参考として閲覧させていただきました。
    1点質問なのですが、
    演習問題の不足として「基本統計学第3版」を紹介していますが、
    基本統計学は第4版(2015年発売)、第5版(2022年発売)があります。

    本記事の作成日が2021年であるため第5版は無いとしても、第4版でなく第3版を紹介するのは何か理由があるのでしょうか?
    基本統計学は、第3版と第4版以降で出版社や著者が変わっているため、その点が気になりました。

    • とけたろう より:

      第4版と第5版は内容的にはほとんど同じですが,
      第3版は全く異なる内容です。

      どれも演習問題は多めですが,
      第4・5版は同じような問題を何度も練習させられる感じです。

      一方で,第3版は工夫された問題が多く,
      こちらのほうが2級の勉強に役立ちそうなので,
      おすすめしています。

  2. ぷーーー より:

    とけたろう様、ご回答頂きありがとうございます。

    3版と4版以降で違うんですね。3版を購入候補にしていきたいと思います。

  3. きゃべ より:

    いつも楽しく拝見させていただいております。
    私には『入門統計解析』が向いており、それ程難解な数式は用いず、すべてが簡潔に説明されている上に問題も役に立つ内容も多く読んでいるだけで楽しい書籍でした。

    もしよろしければこの次に読むべき本としておすすめなものがあれば教えて頂きたいです。

    ちなみに『入門統計学』は文だけでは納得がいかない箇所が多くあり今の段階で私にはあまり合わないと感じました。

    よろしくお願いいたします。

    • とけたろう より:

      「次に読むべき本」ということですが
      入門統計解析が読めるならば
      統計検定2級レベルには十分に到達しているので
      2級向けの書籍に限定せずに考えてみました。

      数理統計学や多変量解析など
      統計学には様々な発展の方向性があり
      「何を学びたいのか」によって
      「次に読むべき本」は変わると思います。

      その前提で,与えられた情報から
      オススメする書籍を1冊選ぶとすれば,
      ガイダンス確率統計(石谷・サイエンス社)です。

      本書は2級内容(それを超えるものも含む)を
      数学的に解き明かしていくような内容です。
      解説がしっかりしている点と演習問題が充実している点が
      入門統計解析に似ています。
      深いところまで踏み込んでいくので
      数学的にやや難しいですが
      必要な数学的知識は巻末の付録に載っています。

      • きゃべ より:

        ご回答くださりありがとうございます!
        早速お教え頂いた書籍を入手しようかと思います。
        楽しみです。。

  4. 通りすがりのFラン大生 より:

    とけたろう様

    いつも大変わかりやすい記事、動画をご提供頂き、大変勉強になっております。

    こちらのおすすめに挙げられている栗原先生の入門統計学(第2版)で勉強をしていましたが、いくつか腑に落ちない点がありました。
    例えばp83の母平均の信頼区間(母分散が未知)の公式ですが、ここのルートの中身は、他の書籍(倉田先生、星野先生の「入門統計解析」、統計検定公式テキストなど)、では「n」になっているものが、この書籍では「n-1」になっているのはなぜでしょうか(私の理解不足で、同じ内容が異なる数式で記載されているのかもしれません)。

    また、第3章の「母誤差分散」、「標本誤差分散」なども他の書籍では見たことのない表現であり、母集団における誤差の分散という考えに戸惑いました(母集団は一つであり、誤差やその分散という概念が混乱を生む)。

    この辺り、とけたろう様のご見解をご教示お願いできたらと思います。

    • とけたろう より:

      【前半について】
      p80にあるように√nでわる場合は不偏分散の平方根,√(n-1)でわる場合は標本分散の平方根が使われており,どちらも偏差平方和をn(n-1)でわったものの平方根になって一致します。つまり,他書と同じ式になります。
      【後半について】
      本書では,母分散をnでわったものを母誤差分散,不偏分散をnでわったものを不偏誤差分散などと呼んでいます。母誤差分散は「母集団における誤差の分散」ではなく,不偏誤差分散や標本誤差分散の真値として位置付けられています。
      前半の√(n-1)を使った式や,後半の誤差分散の呼び分けは著者独特であり,違和感を感じるのはわかります。この本はクセがあり,合う人とそうでない人に分かれます。統計的推測の分野は,入門統計解析が読めるならば,そちらで勉強すればいいのではないでしょうか。

      • 通りすがりのFラン大生 より:

        とけたろう様

        丁寧な解説をありがとうございました。

        前半部分について、とけたろう様の解説を読んで理解ができました(記号の意味を勘違いしておりました)。

        後半についても、母誤差分散は不偏誤差分散の真値として位置づけられている、というご説明で納得がいきました(標本誤差分散については、まだ掴みきれていません)。

        数学的に私には少し難しい部分はありますが、星野先生、倉田先生の入門統計解析の方が数式ですっきり説明されていて誤解が生じにくいように感じるので、そちらも勉強してみようと思います。

タイトルとURLをコピーしました