幾何分布【統計検定準１級のための数学①】

幾何分布のポイントは，期待値や分散，無記憶性です。統計検定２級では期待値や分散の結果を知っていれば，ほとんどの問題に対応できますが，準１級を受ける人にも役に立つように，本稿では幾何分布の諸性質を証明つきで紹介していきます。

本稿の目的は，幾何分布を解説すること以外にもう１つあり，それは幾何分布を理解するために必要な数学を解説することです。【統計検定準１級のための数学】と題した記事では，統計検定２級からスムーズに準１級に進めるように，２級と準１級のギャップをうめるために必要な数学も解説していきます。本稿では，幾何分布に関連して数列や無限等比級数を解説します。

本稿で前提とする知識は，【中学の数学からはじめる統計検定２級講座】の第１回の確率，第２回の条件付き確率，第４回の期待値と分散，第５回のΣ（シグマ），第６回の極限，第10回のベルヌーイ分布の内容になります。これらの内容に不安がある人は，先にそちらの記事を読んでください。

では，はじめていきましょう！

等差数列と等比数列
幾何分布
幾何分布の期待値と分散
無記憶性
演習１
演習２
参考図書

等差数列と等比数列

このセクションでは，幾何分布と関連の深い等比数列について，ゼロから説明していきます。すでに知っている人は，読み飛ばして次のセクションに進んでください。

数列というのは，数を規則的に並べたものでしたね。多くの人がはじめに思いつく数列は，自然数を１から順に並べた次のような数列でしょう。

これは，１から始まって，１ずつ増える数列ですね。となり合う数の差が一定なので，等差数列と呼ばれます。また，最初の１のことを初項，となり合う数どうしの差の１のことを公差と言います。

別の例を挙げると，次の数列は，初項２，公差３の等差数列です。

一般的に，等差数列は，初項をa，公差をdとして，次のように表すことができます。

そして，等差数列と同じくらい基本的で重要なのが等比数列です。等差数列ではとなり合う２つの項の差が一定でしたが，等比数列ではとなり合う２つの項の比が一定で，前の項にある決まった数（公比と言います）をかけることで次の項が求められます。

次の数列は，初項２，公比２の等比数列で，前の項に２をかけると次の項が得られます。

一般的に，初項a，公比rの等比数列は次のように表せます。

さて，次のセクションの準備として，等比数列の初項から第n項までの和を求める公式を紹介しておきます。その公式は，初項a，公比r（≠１）として次のようになります。

例えば，上に例として挙げた初項２，公比２の等比数列の初項から第n項までの和は，次のように計算できます。

では，このような等比数列の和の公式がどのようにして導かれるのか，確認してみましょう。初項a，公比rの等比数列の初項から第n項までの和を次のようにおきます。

この式の両辺をr倍すると，次のようになります。

各辺について，上の式から下の式をひくと，次のように右辺のほとんどの項が相殺されて，２つの項だけが残ります。

r≠１と仮定したので，両辺を１ーrでわることができて，整理すれば上に挙げた式と一致することがわかります。

さらに，等比数列の和の応用を２つ紹介します。

１つ目は，次のように等比数列の各項を無限に加えた場合の和についてです。

「無限に加えるとは何か？」という疑問がわくかもしれませんね。無限に加えた和というのは，次の式の右辺のように初項から第n項までの和をnの式で表した上で，n→∞の極限をとったものを指します。

このような等比数列を無限に加えた和のことを無限等比級数と呼び，公比rの絶対値が１より小さい（ー１＜r＜１）とき，極限が定まります（収束すると言います）。

実際に等比数列の和の公式において，ー１＜r＜１とすると，rⁿはnが大きくなるにつれてどんどん０に近づいていくことから，初項a，公比rの無限等比級数の和は次のように計算できます。

では，等比数列の和の応用の２つ目です。それは，次のような数列の和に関するものです。

おや，今度は等差数列にも等比数列にもなっていないようです。この数列を次のように書き直すと，その正体がわかります。

各項の左側の数を順に見ていくと「2，5，8，11，…」となっていますので，これは初項２，公差３の等差数列です。また，各項の右側の数を順に見ていくと，初項３，公比３の等比数列ですよね。つまり，等差×等比の形になっているわけです。

では，この数列の初項から第10項までの和を求めてみましょう。まず，求める和を次のようにおきます。

この式の両辺を３倍すると，次のようになります。

各辺について，上の式から下の式をひくと，次のようになります。

右辺のかっこの中は，初項９，公比３，項数９の等比数列なので，等比数列の和の公式から次のように書き直すことができます。

両辺をー２でわって，右辺を整理すると，次のように求められます。

今回は初項から第10項までの和を求めましたが，同じように計算すれば，第n項までの和も計算できます。つまり，等差×等比の形の数列の和は等比数列の和を使って求めることができるわけです。

では，これらの等比数列の知識を踏まえて，次のセクションで幾何分布の説明をしていきます。

幾何分布

【中学の数学からはじめる統計検定２級講座第10回】では，独立にベルヌーイ分布に従う確率変数の和で定まる確率変数が二項分布に従うことを学習しましたね。そして，ベルヌーイ分布に従う確率変数の代表例は，１枚のコインを投げるとき，表が出たら１，裏が出たら０という値をとるものでした。表が出ることを成功，裏が出ることを失敗と便宜上呼ぶことにすると，コイン投げを何回行っても，成功の確率と失敗の確率はどちらも２分の１です。この試行のように，結果が２通りで，各回の成功確率が一定である試行をベルヌーイ試行と言います。

幾何分布は，このベルヌーイ試行を使って定めることができます。例えば，１枚のコインをくり返し投げるとき，はじめて表が出るまでに裏が出た回数をXとすると，Xも確率変数になりますよね。実は，このXが従う確率分布が幾何分布なんです。ベルヌーイ試行によって起こる２通りの事象を「成功」と「失敗」と呼ぶことにすると，最初から失敗が続いた後，はじめて成功するまでに失敗する回数が従う確率分布です。

では，幾何分布の確率関数を求めてみましょう。離散型確率変数Xの確率関数というのは，次の式を満たすようなf(x)のことです。

つまり，どのxでも値が０以上であって，すべて加えると１になるということです。

幾何分布は独立なベルヌーイ試行のくり返しによって定まるので，２つの独立な事象A，Bの確率について，次の式が成り立つことを思い出しましょう。

つまり，AとBがどちらも起こる確率は，それぞれの確率の積で計算できるわけです。

この式を踏まえて，１回あたりの成功確率をp（０＜p＜１）とすると，はじめて成功するまでにx回失敗する確率は次のように計算できます。

よって，幾何分布の確率関数は次のようになります。

幾何分布を英語で”geometric distribution”と言うので，これ以降はこの幾何分布をGeo(p)という記号で表すことにします。例えば，１個のサイコロをくり返し投げるとき，はじめて１の目が出るまでに１以外の目が出る回数をXとすると，成功確率６分の１のベルヌーイ試行のくり返しなので，Xは次の幾何分布に従います。

このとき，X＝２となる確率は次のように求めることができます。

ここまで，幾何分布とは「はじめて成功するまでに失敗する回数が従う確率分布」と説明してきましたが，実は「はじめて成功するまでの試行の回数が従う確率分布」を幾何分布とする場合があります。はじめて成功するまでの試行の回数をYとすると，はじめて成功するまでに失敗する回数Xに最後の１回を加えれば試行の回数になるので，Y＝X＋１という関係があります。よって，Yの確率関数は次の式になります。

さて，P(X＝x)が確率関数になっていることを確認してみましょう。まず，P(X＝x)の右辺に，x＝０，１，２，…のように整数を代入してみると，それぞれの場合の確率は次のように表せます。

これは，初項p，公比１ーpの等比数列になっていますね。実は，等比数列の別名が幾何数列であることから，幾何分布の名前がついていると言われています。０＜p＜１より，上の数列の各項が正の数なのは明らかですが，P(X＝x)が確率関数であるためには，次のような確率の和が１になる必要がありますね。

正の数を無限に加えていくので，等比数列の知識がない人が見たら，和が無限に大きくなるように感じてしまうかもしれません。でも，みなさんは大丈夫ですよね。初項がp，公比が１ーpの無限等比級数であり，０＜１ーp＜１なので，この和は前のセクションで学習した公式を使うと，次のように計算できます。

よって，すべての確率の和が１になり，P(X＝x)が確率関数であることがわかりました。

このセクションの最後として，幾何分布のグラフを確認しておきましょう。次のグラフは，１個のサイコロをくり返し投げるとき，はじめて１の目が出るまでに１以外の目が出る回数をXとして，横軸でXのとる値，縦軸で確率を表したものです。

x＝０，１，２，…と無限に確率が続いていき，確率が０になることはありません。

幾何分布の期待値と分散

結論から言えば，はじめて成功するまでに失敗する回数をXとするとき，Xの期待値と分散は次のようになります。

また，はじめて成功するまでの試行の回数をYとするとき，Yの期待値と分散は次のようになります。

Y＝X＋1という関係があるので，Xの期待値，分散を利用すれば，Yの期待値，分散を導くことができます。まず，期待値は次のようになります。

分散については，定数を加えても分散は変わらないことから，V(Y)＝V(X)です。２級や準１級では，この結果を覚えておいて，すぐに書けるようにしておきましょう。

では，等比数列の知識を使って，Xの期待値，分散を導出してみましょう。Xの期待値は，期待値の定義から次のようになります。

わかりやすいようにシグマを使わずに表すと，次のようになります。

すべての項にかけられている「p」を除くと，それぞれの項は，1，2，3，…と等差数列的に増えていく部分と(1ーp)の1乗，2乗，3乗，…と等比数列的に増えていく部分の積で成り立っていることがわかりますね。つまり，等比数列のセクションで学習した等差×等比の形の数列になっているので，この考え方を使って，和を求めることができそうです。

ここで，式を簡略化するため，q＝１ーpとおいて，求める和をSとします。

等比数列のセクションでやったように公比であるqを，上の式の両辺にかけると，次のようになります。

上の２つの式の各辺をひき算すると，次のようになります。

左辺では，１ーqをpでおきかえました。両辺のすべての項がpの倍数になったので，両辺をpでわると次のようになります。

上の式の右辺は，初項q，公比qの無限等比級数なので，次のように計算できます。

これで，期待値が求まりました。

次に，Xの分散の計算をしていきます。次の分散の公式を利用しましょう。

この式の右辺の第２項には，先ほど計算した期待値を代入すれば良いので，右辺の第１項のX²の期待値を計算すれば良いですね。定義から，次の計算をすることになります。

これをシグマを使わずに表してみると，次のようになります。

今回は，等差×等比の形にはなっていないのですが，期待値と同じ方針でやってみます。式を簡略化するため，q＝１ーpとおいて，求める和をTとします。

公比であるqを，上の式の両辺にかけると，次のようになります。

上の２つの式の各辺をひき算すると，次のようになります。

期待値のときと同じように，左辺では，１ーqをpでおきかえました。さらに，両辺をpでわると次のようになります。

この式の右辺は，等差×等比の形になっていますね。もう一度，両辺にqをかけてひき算をしてもいいのですが，そうしなくてもTの値を求めることができます。まず，次のように右辺をΣで表し，式変形します。

最右辺の第１項のΣの部分は，期待値をpでわったものになっていて，第２項は初項q，公比qの無限等比級数なので，次のように計算できます。

よって，求める分散は次のように計算できます。

無記憶性

幾何分布を特徴づける大事な性質として，無記憶性があります。擬人化して表現すれば，幾何分布はまるで過去のことを覚えていないかのような性質を持っているのです。数式を使うと，どんな０以上の整数m，nに対しても次の式が成り立つこととして表現できます。

この式の左辺は条件付き確率で，「はじめのn回は失敗の連続だったことがわかっている前提で，次のm回も失敗の連続になる確率」を表しています。それが右辺の「はじめのm回は失敗の連続になる確率」に等しいのです。例えば，10回続けて失敗だったことがわかっても，そのことはこれから成功する確率には影響せず，これから試行をはじめる場合と変わらないことを意味しています。

では，幾何分布Geo(p)において，この性質が成り立つことを示してみましょう。上の無記憶性の式の左辺は，条件付き確率の定義から次の式の右辺のように書き直すことができますよね。

右辺の分子は「X≧m＋nであって，しかもX≧nとなる確率」を表していますが，X≧m＋nならばX≧nとなるのはあたり前なので，これはつまりP(X≧m＋n)に他ならないですよね。その確率は次のように計算できます。

分母も同じように計算できるので，もとの条件付き確率は次のように計算できます。

これで「幾何分布は無記憶性を持つ」ということが示せました。また，逆に，X＝０，１，２，…という値をとる離散型確率分布のうち，無記憶性を持つのは幾何分布のみであることも知られています。つまり，離散型確率分布では「無記憶性と言えば幾何分布」なわけです。

幾何分布についての基本的な説明は以上になります。この後は，さらに理解を深めるための演習問題と参考図書の紹介です。

演習１

【問題】袋の中に赤玉，青玉，白玉，黒玉の４個の玉が入っている。この袋の中から１個の玉を取り出して，色を確認した後，玉を袋の中に戻すという試行を繰り返す。このとき，４種類の玉すべてが少なくとも１回取り出されるまでの試行の回数の期待値を求めなさい。

【解答】※この解答では，はじめて成功するまでの試行の回数が従う確率分布を幾何分布とします。

１回目の試行で，４種類の玉のうちの１種類目が必ず取り出されます。

では，２種類目は２回目に取り出されるでしょうか。そうとは限りませんよね。１回目の試行で取り出された玉を２回目の試行でも取り出すかもしれないからです。

２回目以降の試行では，２種類目の玉が取り出される確率は４分の３なので，はじめて２種類目の玉が取り出されるまでの試行の回数は，成功確率４分の３の幾何分布に従います。よって，その期待値は，４分の３の逆数の３分の４になります。

同じように，２種類目の玉が取り出された後の試行では，３種類目の玉が取り出される確率は４分の２なので，はじめて３種類目の玉が取り出されるまでの試行の回数は，成功確率４分の２の幾何分布に従います。よって，その期待値は，４分の２の逆数の２になります。

最後に，３種類目の玉が取り出された後の試行では，４種類目の玉が取り出される確率は４分の１なので，はじめて４種類目の玉が取り出されるまでの試行の回数は，成功確率４分の１の幾何分布に従います。よって，その期待値は，４分の１の逆数の４になります。

よって，４種類の玉すべてが少なくとも１回取り出されるまでの試行の回数をYとすると，Yの期待値は次のように計算できます。

（解答終わり）

演習２

【問題】ある映画を映画館で観ると，入場時に映画の一場面を切り取った12種類のフィルムのうちの１つを等確率でもらうことができる。すでに10種類のフィルムを持っている人が，まだ持っていない２種類のフィルムをどちらとも入手するまで映画を観に行くとき，これからの入場回数の期待値を求めなさい。

【解答】※この解答では，はじめて成功するまでの試行の回数が従う確率分布を幾何分布とします。

10種類のフィルムを持っていて新たに入場するとき，まだ持っていないフィルムを手に入れる確率は12分の２＝６分の１です。はじめて11種類目のフィルムを入手するまでの入場回数をXとすると，Xは次の幾何分布に従います。

よって，Xの期待値は次のようになります。

同じように，11種類のフィルムを持っていて新たに入場するとき，まだ持っていないフィルムを手に入れる確率は12分の１です。はじめて12種類目のフィルムを入手するまでの入場回数をYとすると，Yは次の幾何分布に従います。

よって，Yの期待値は次のようになります。

したがって，求める入場回数の期待値は，６＋12＝18（回）

（解答終わり）

参考図書

本稿を執筆するにあたり，次の書籍を参考にしました。

これからはじめる統計学（蓑谷千凰彦，東京図書）

本書は，無記憶性なども解説されており，本稿では取り上げなかった幾何分布の待ち時間分布としての側面も具体例とともに解説されています。

これからはじめる統計学

本稿は以上となります。最後までお付き合いいただき，ありがとうございました！