目次(まとめ)
◾️ 母集団から標本を抽出するさまざまな方法があります
◾️ 参考文献
こんにちは、みっちゃんです。
一般に、母集団の特性を推定するために、母集団から標本を取り出します。
しかし、標本は何も考えずに取り出せばいいわけではなく、母集団の特性を正しく推定することを念頭に、取り出す必要があります。
今回の記事では、母集団から標本を抽出するための方法について、いくつか紹介します。
母集団から標本を抽出するさまざまな方法があります
母集団から標本を抽出する手法、つまり、「標本抽出方法」には、以下のような方法があります。
単純無作為抽出
母集団から、すべてのデータが等しい確率で選ばれ標本になる手法です。つまり、ランダムに標本を抽出するということです。推測統計に関わる理論は、基本的にこの抽出方法に則って構築されています。
系統抽出(等間隔抽出)
母集団のデータに通し番号をつけて、ある間隔にしたがってデータを取り出して標本にします。例えば、100個ずつということであれば、1番のデータ、101番のデータ、、、、14301番のデータを標本にするといった具合です。間隔については、ランダムに決定します。
多段抽出
大規模な調査を行うときに採用される手法です。例えば、ある県の小学生の算数のテストの点数を調べたい場合には、第一段階として無作為に市町村を選び出し、第二段階として無作為に小学校を選び出し、第三段階として無作為にクラスを選び出し、という風に、無作為抽出を重ねる手法です。もちろん段の数が増えるほどに、推定精度が悪くなるという問題があります。
集落抽出(クラスター抽出)
あらかじめ母集団を切り分けてクラスター(集落)をつくり、集落をランダムに選ぶことで標本を作ります。選ばれた集落に含まれるサンプルについては全て調査することになります。母集団全体を調査するのに比べて費用や時間を削減することができますが、母集団全体からランダムに標本を抽出する場合より、推定精度が悪くなる問題があります。
層化抽出(層別抽出)
あらかじめ母集団をいくつかのグループ(層)にわけておいて、それぞれの層から別々に標本を抽出します。これにより、それぞれの層の中で推定精度を上げることができますが、それぞれの層が母集団の分散(散らばり度合い)を反映している場合には、推定精度が下がってしまう問題があります。