Ch2-2 Frequency Distribution

Frequency Distributionとはデータがどのように分布しているかを表したものです。
日本語でFrequency は頻度・Distributionは分布と訳されたりします。
例えば以下のようなものがFrequency Distributionです。
以下の例はある街に住んでいる200人を年齢別に分けて整理したものです。

16-22歳のカテゴリでは36人、23-29歳のカテゴリでは49人と言った具合にいくつかのカテゴリに分けて、そこにデータがいくつか入るかを整理したものです。
これを図で表したものをHistogramヒストグラムと呼ばれます。

Histogram ヒストグラム

ヒストグラムで表すどのカテゴリーが多いか少ないなどを視覚的にもわかりやすくなります。

Excel: Pivot Table を使いFrequency Distributionを作る

Excel をつかってFrequency Distributionを作る方法を紹介します。
以下のようなあるA町内の人の年齢のデータがあるとします。

まず年齢のフィールドを選択しPivot Tableクリックします。
そうするとPivotTableのビルダーが立ち上がるので、年齢をRowのところへ、同じく年齢をValuesのところにドラッグアンドドロップします。最初の設定ままでは年齢を合計してしまっているのでSum of 年齢をCount of 年齢にします。

このままでは年齢はカテゴリーになっておらず、すべての年齢に対して列があるのでラベルのとこでグループ分けをします。ここでは、どの年齢からスタートして終わるのか、また年齢の区切りを設定できます。ここでは10歳ごとしました。

Okボタンを押しラベルを変更すればFrequency Distributionができました。
28-37歳の間が6人と一番多いことがわかります。

またExcelのグラフチャート(棒グラフ)を使えばHistogramを作ることもできます。

Relative Frequency Distribution

また年齢のごとのカウント数の表示時をパーセンテージであらわしたものはRelative Frequency Distributionと呼ばれます。データ全体の相対的な分布を把握するのに向いています。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top