「統計学『入門』って本がたくさんありすぎて,どれを買ったらいいのか,わからない」とか「『入門』だと思って買ったら,難しすぎて読めなかった」なんてことがよくありますよね。確かに統計学「入門」を掲げた本は多すぎて,レベルもバラバラなので,統計学をこれから学ぶ人が適切な本を選ぶのはすごく難しいです。
そこで【中学の数学からはじめる統計検定2級講座】を執筆している私がこれまでに読んだ数十冊の入門書の中から,統計検定2級レベルを目指す人に向けて,選りすぐりの3冊(+1冊)の入門書を紹介します。
統計検定2級レベルとは
本題に入る前に,前提を確認しておきましょう。
統計検定2級レベルとは何か
この点について,私は「正規分布をベースにした基本的な推定と検定の仕組みを理解し,その計算ができる」ことだと考えています。
「計算ができる」っていうところがポイントで,統計検定3級レベルだと概念が理解できていれば,計算は「お飾り程度」で済んでしまうんです。
だから,今回紹介する書籍として「マンガでわかる」系のものは除きました。こういった書籍の中にも良いものがありますが,統計検定2級の実戦レベルには届かないんですよね。どちらかと言えば統計検定3級向きのものが多いです。
というわけで,今回は「これを読めば統計検定2級に届く」という3冊をご紹介します。
おすすめの3冊
では,おすすめの3冊を紹介していきます。
人によって「中学の数学までならわかる」とか「高校数学ⅡBまでわかる」とか,数学の理解度に違いがありますよね。また,理解度とは別に「数学をできれば避けたい」とか「数学が苦にならない」とか,好みの違いもあります。
あなたはどうでしょうか。
そのタイプ別に3冊を決めてみました。
①高校数学は避けて統計検定2級をとりたいなら
まずはこの一冊から意味がわかる統計学(石井俊全,ベレ出版)
②高校数学ⅡBまではある程度わかるけれど,数式が少ないほうが良いなら
入門統計学第2版(栗原伸一,オーム社)
③数学をガンガン使って,論理的に納得したいなら
入門統計解析(倉田・星野,新世社)
では,次のセクションから,この3冊の内容を紹介していきましょう。
【おすすめ①】まずはこの一冊から意味がわかる統計学
本書の特徴は3つの章の分類の仕方にあり,第1章だけで推定と検定までの話題を一通り完結させています。第1章は,確率に苦手意識を持っている人のために,確率や確率変数を明示的には使わずに3級相当の統計学を説明しています。ただし,第1章だけだと「マンガでわかる」系のものと変わらなくなってしまいますので,統計検定2級を目指すならば第2章以降を読むことが必要です。
目次
第1章① 相対度数分布グラフ
第1章② 平均,分散・標準偏差
第1章③ サンプルXの相対度数分布グラフ
第1章④ 正規分布
第1章⑤ 推定の考え方
第1章⑥ 検定の考え方
第2章① 確率変数
第2章② 二項分布
第2章③ 推定の応用
第2章④ 検定の応用
第2章⑤ χ2分布,t分布,F分布
第3章① 2変量の統計
内容の特徴
コメント
上述の通り,分散分析や回帰分析など,統計検定2級でカバーしきれていない部分がありますが,過去問を使って問題演習を積めば推定と検定の大部分の問題は解けるようになり,それだけでも合格点に達することは可能です。
また,不正確な記述はあるものの,ふつうに読んでいれば気になることはないでしょう。結果的に問題が解けるようになればいいという意味では,本書で勉強する価値はあると言えます。
【おすすめ②】入門統計学(第2版)
総合的に見て,統計検定2級の勉強をする上で最もおすすめできる書籍です。
第2版は2021年の7月に出版されています。実は,本書の第1版には「不偏分散の正の平方根が母標準偏差の不偏推定量になる」という誤った記述があったのですが,第2版では注釈を入れてこの点を修正しています。
次の目次を見てもらえれば一目瞭然ですが,この記事でおすすめしている他の書籍とは扱う内容の幅が異なります。
目次
第1章 データの整理ー記述統計学ー
第2章 確率分布
第3章 推定と誤差ー推測統計学ー
第4章 信頼区間の推定
第5章 χ2分布とF分布
第6章 仮説検定と検出力
第7章 2群の平均の差の検定
第8章 分散分析
第9章 多重比較法
第10章 実験計画法
第11章 ノンパラメトリック検定
第12章 回帰分析ー多変量解析①ー
第13章 ロジスティック回帰分析とクラスター分析ー多変量解析②ー
第14章 主成分分析と因子分析ー多変量解析③ー
第15章 ベイズ統計学
内容の特徴
コメント
網羅性はピカイチです。
準1級の参考書としても使えますが,
今回は2級用としての良い点・悪い点を紹介しました。
第8章の二元配置分散分析以降は準1級範囲が多いです。
(第10章のフィッシャーの3原則,第11章のχ2検定,第12章は2級範囲)
【おすすめ③】入門統計解析
読者が一人で統計学の理論を組み立てられるくらいに,論理的にしっかりした説明になっていて,教科書として優秀な一冊です。
目次
第1章 統計解析とは
第2章 1次元データの整理
第3章 2次元データの整理
第4章 確率モデル
第5章 独立同一分布
第6章 統計量
第7章 統計的推定
第8章 統計的仮説検定
第9章 回帰分析
第10章 分散分析
内容の特徴
コメント
統計学としての内容の信頼性は3冊の中でずば抜けています。
私は細部まで証明しないと納得できない人間なので,
この本にだいぶ助けられました。
モーメント法,最尤法,ベクトルと行列による回帰分析,
2元配置モデルなどは準1級範囲なので,飛ばしましょう。
まとめ
ここまで3冊を紹介してきましたが,どれについてもイマイチなところがあり,「完璧な入門書」はありません。だから,複数の書籍を組み合わせたりして,弱点を補強する必要があります。例えば,演習問題の不足を補うには,次の書籍がおすすめです。
基本統計学[第3版](豊田他,東洋経済新報社)
数学が得意な人は「入門統計解析」で細部までしっかり学ぶのがオススメですが,統計検定2級向けのテキストとしてより多くの人にオススメできるという意味では「入門統計学(第2版)」が1番だと考えています。
この本を読みこなせるかどうかは,Σによる記述を許容できるかどうかにかかっているので,高校数学が苦手な人はその点だけでも事前に勉強して,ぜひこの本にトライしてみてほしいです。
なお,高校数学が苦手な人には「統計学が最強の学問である[数学編]」がオススメですので,こちらもどうぞ。
コメント
統計検定2級の書籍購入検討の参考として閲覧させていただきました。
1点質問なのですが、
演習問題の不足として「基本統計学第3版」を紹介していますが、
基本統計学は第4版(2015年発売)、第5版(2022年発売)があります。
本記事の作成日が2021年であるため第5版は無いとしても、第4版でなく第3版を紹介するのは何か理由があるのでしょうか?
基本統計学は、第3版と第4版以降で出版社や著者が変わっているため、その点が気になりました。
第4版と第5版は内容的にはほとんど同じですが,
第3版は全く異なる内容です。
どれも演習問題は多めですが,
第4・5版は同じような問題を何度も練習させられる感じです。
一方で,第3版は工夫された問題が多く,
こちらのほうが2級の勉強に役立ちそうなので,
おすすめしています。
とけたろう様、ご回答頂きありがとうございます。
3版と4版以降で違うんですね。3版を購入候補にしていきたいと思います。
いつも楽しく拝見させていただいております。
私には『入門統計解析』が向いており、それ程難解な数式は用いず、すべてが簡潔に説明されている上に問題も役に立つ内容も多く読んでいるだけで楽しい書籍でした。
もしよろしければこの次に読むべき本としておすすめなものがあれば教えて頂きたいです。
ちなみに『入門統計学』は文だけでは納得がいかない箇所が多くあり今の段階で私にはあまり合わないと感じました。
よろしくお願いいたします。
「次に読むべき本」ということですが
入門統計解析が読めるならば
統計検定2級レベルには十分に到達しているので
2級向けの書籍に限定せずに考えてみました。
数理統計学や多変量解析など
統計学には様々な発展の方向性があり
「何を学びたいのか」によって
「次に読むべき本」は変わると思います。
その前提で,与えられた情報から
オススメする書籍を1冊選ぶとすれば,
ガイダンス確率統計(石谷・サイエンス社)です。
本書は2級内容(それを超えるものも含む)を
数学的に解き明かしていくような内容です。
解説がしっかりしている点と演習問題が充実している点が
入門統計解析に似ています。
深いところまで踏み込んでいくので
数学的にやや難しいですが
必要な数学的知識は巻末の付録に載っています。
ご回答くださりありがとうございます!
早速お教え頂いた書籍を入手しようかと思います。
楽しみです。。
とけたろう様
いつも大変わかりやすい記事、動画をご提供頂き、大変勉強になっております。
こちらのおすすめに挙げられている栗原先生の入門統計学(第2版)で勉強をしていましたが、いくつか腑に落ちない点がありました。
例えばp83の母平均の信頼区間(母分散が未知)の公式ですが、ここのルートの中身は、他の書籍(倉田先生、星野先生の「入門統計解析」、統計検定公式テキストなど)、では「n」になっているものが、この書籍では「n-1」になっているのはなぜでしょうか(私の理解不足で、同じ内容が異なる数式で記載されているのかもしれません)。
また、第3章の「母誤差分散」、「標本誤差分散」なども他の書籍では見たことのない表現であり、母集団における誤差の分散という考えに戸惑いました(母集団は一つであり、誤差やその分散という概念が混乱を生む)。
この辺り、とけたろう様のご見解をご教示お願いできたらと思います。
【前半について】
p80にあるように√nでわる場合は不偏分散の平方根,√(n-1)でわる場合は標本分散の平方根が使われており,どちらも偏差平方和をn(n-1)でわったものの平方根になって一致します。つまり,他書と同じ式になります。
【後半について】
本書では,母分散をnでわったものを母誤差分散,不偏分散をnでわったものを不偏誤差分散などと呼んでいます。母誤差分散は「母集団における誤差の分散」ではなく,不偏誤差分散や標本誤差分散の真値として位置付けられています。
前半の√(n-1)を使った式や,後半の誤差分散の呼び分けは著者独特であり,違和感を感じるのはわかります。この本はクセがあり,合う人とそうでない人に分かれます。統計的推測の分野は,入門統計解析が読めるならば,そちらで勉強すればいいのではないでしょうか。
とけたろう様
丁寧な解説をありがとうございました。
前半部分について、とけたろう様の解説を読んで理解ができました(記号の意味を勘違いしておりました)。
後半についても、母誤差分散は不偏誤差分散の真値として位置づけられている、というご説明で納得がいきました(標本誤差分散については、まだ掴みきれていません)。
数学的に私には少し難しい部分はありますが、星野先生、倉田先生の入門統計解析の方が数式ですっきり説明されていて誤解が生じにくいように感じるので、そちらも勉強してみようと思います。