【統計学:母集団と標本】「記述統計」と「推測統計」の元となる概念

統計学-記述統計・推測統計データサイエンス

データサイエンスの位置づけが重要となる中で必要性を増す「統計学」。

統計学を学ぶ上で、最も基礎となる考え方が「母集団」と「標本」の概念です。

これらの概念をどう扱うかによって、「記述統計」と「推測統計」2つの統計学に繋がります。

本記事では、この「母集団」と「標本」、および2つの統計学について説明します。

スポンサーリンク

「母集団」と「標本」

データには「母集団」と「標本」、2つの概念があります。

この概念は、これまでデータ分析の本質を意識せず統計を行ってきた方にとっては聞きなれない概念ですが、とても重要な考え方です。

例えば、テレビ番組で、以下のような報道に違和感を感じた経験はないでしょうか。

○○○○という法案に対し、国民の『賛成』・『反対』を問うアンケートを、1000人に行った結果、70%が反対という結果となりました。
本法案については国民として『反対』の声が大きいようです。
1,000人のアンケートの結果が国民の総意になるの?どういった1,000人が対象だったの?

など、様々な疑問が浮かんでいる方は、データ分析に必要な考え方ができるといえます。

この例では、「母集団」と「標本」は以下の考え方となります。

  • 母集団 …本来対象となるデータ全体(例:全国民)
  • 標本 … 母集団の情報を推測するために抽出した一部のデータ(例:アンケート対象)

データ分析において、「母集団」全てのデータを知ることは稀です。

そのため、「母集団」の一部である「標本」を抽出することで、この標本の統計量を把握するすることで、母集団を推測することができます。

もちろん、標本の採り方(偏りが無いなど)が適切であることが前提です。

この流れを、それぞれ『記述統計』、『推測統計』と表現、統計学は大きくこれらの2つに分類されます。

  • 記述統計 … 「標本」データを元に、データの特徴を記述(例:アンケートで70%が反対)
  • 推測統計 …  「標本」から「母集団」を推測(例:国民の声は「反対」)

統計学-母集団と標本

以下は、統計学の大きな分類であう『記述統計』および『推測統計』について詳しく説明します。

スポンサーリンク

記述統計

記述統計』とは、「標本」データが持つ情報を多面的に明確化することで、データの特性を把握することを目的とした統計です。

つまり、そのままでは理解ができないデータを、1つの数値や範囲で表現することにより、わかりやすくなるよう変換することが記述統計のゴールです。

記述統計は、日常のあらゆる場面で登場します。

学生の試験においては「平均点」や「偏差値」の概念が良く使われますが、これらはまさに記述統計の代表格といえます。

例えば、ご自身の今回のテストの点数が「70点」(前回は「60点」)として、点数だけでは前回から伸びたとは言い切れません。
平均点や偏差値との比較で、初めてご自身の立ち位置を把握することができます(点数は上がったが、偏差値は変わらない、など)。

記述統計を学ぶ上で最重要となる「要約統計量」について、以下に詳しく纏めていますので、ご興味あれば合わせてお読みください。

【統計学:要約統計量】データ特性を表現する「代表値」と「散布度」
データサイエンスの領域において、基本中の基本でありながら、どこまでいっても重要となるのが「要約統計量」です。各指標の特徴を理解することで、データの特性や、複数データ間の違いをおさえることができます。本記事では、この「要約統計量」について説明します。
スポンサーリンク

推測統計

推測統計』は 「標本」データを元に、「母集団」や、母集団が持つ特徴を推測する統計です。

推測統計には、大きく「検定」と「推定」の考え方があります。

検定

『検定』は、ある仮説に対して、正しいか否かを統計学的に検証することにより仮説の確からしさを論証する統計手法です。

『検定』は、正式に『統計的仮説検定』と言われることも多いです。

統計における『検定』のイメージがつかみづらい方も多いようですが、とても重要な概念です。

例えば、アンケートの結果、男女や年齢別で『』が見られた際に、「その『』は、本当に性別や年代によって生じる確かな『』であるとしてよいのか」を判断する手法が『検定』です。

検定(統計的仮説検定)を学ぶ上で最重要となる考え方について、以下に詳しく纏めていますので、ご興味あれば合わせてお読みください。

【統計学:検定(統計的仮説検定)】仮説を判断するためのベース手法
データサイエンスの位置づけが重要となる中で必要性を増す「統計学」。統計学を学ぶ上で、その得手不得手の分かれ目となるのが「検定(統計的仮説検定)」です。検定を理解するためには、統計学ならではの「あいまいさ」を受容することがポイントです。本記事では、この「検定」について事例を交えながら説明します。

推定

『推定』は、標本の特徴から、母集団の特性を推測する統計手法です。

データ分析における最終ゴールは、元となる母集団を、数値や範囲で具現化することです。

母数の推定には、点推定と区間推定があります。

  • 点推定 : 母集団を1つの値で推定(例:母比率は65%)
  • 区間推定 : 母集団を一定の幅で推定(例:母比率は60~70%)
スポンサーリンク

まとめ

統計学の最も基礎の部分となる「母集団」と「標本」の考え方、およびその概念からなる「記述統計」と「推測統計」2つの統計の考え方と説明しました。

統計学をよりしっかりと理解したい方は、下記の書籍がオススメですので興味があったら一読してはいかがでしょうか。

また、さらに統計に興味を深めた方は、「統計検定」の受験をオススメします。

統計検定の記事を下記にまとめていますので、合わせてお読みください。

統計検定2級を独学攻略!勉強法が確立しているため合格しやすい試験
データサイエンスの勉強を進めていく中で、その中核を担うデータサイエンス力を伸ばすためぜひ身に着けたい数学力、特に統計スキル。 この分野を勉強するのであればそのロードマップとして統計学に関する資格を取得したい!そんなあなたに統計検定の徹底攻略を紹介します。

コメント