Ch1-2データのタイプについて

統計学ではデータをおおまかに4つのタイプに分けて考えます。

Quantitative Variables

Quantitative Variables は数量で表されるデータのことを指します。何個とか・いくつとかです。
Quantitative VariablesにはさらにRatioとIntervalという2つの区分があります。
Ratioの例はお金とか距離などです。多い少ないの区別ができ、数字と数字の間には無限に細かくわることができるものを言います。10メートルと11メートルの間には10.5メートルがあります。10メートルと10.5メートルの間にもさらに10.25メートルがあります。このように間には無限の区切りがあります。
さらに、10メートルと20メートル,20メートルと30メートルの差は同じ距離です。このように差を決まった単位で表せられるものをいいます。
また、0ゼロという数字のとき何もないことを表します。
Intervalの例は温度(セルシウス)や偏差値などもいえます。
距離もあり、距離の間も等間隔ですが、0という数字のときに全くないというわけではありません。
気温ゼロとなっても温度というものが全くないわけではありません。
偏差値ゼロといっても知能が全くないわけではありません。
(正確には偏差値の計算上ゼロがでることはないのですが)

Categorical Variables

Categorical Variables はデータは数字などではなくデータの性質に特徴などを指す分類のことを言います
Categorical Variables にもさらにNominalとOrdinal という2つ区分があります。
Nominalの例は目の色などです。緑・茶色・黒・青などの分類です
お互いに区分できますがどちらが大きいとか小さい、多いとか少ないとう分類はできません。
それとお互いの区分の正確な距離感もありません。
Ordinalの例は順位・レートなどです。1等賞2等賞とか星5星4とかです。
お互いにどちらが上かとか下かはありますが、正確な距離感はありません。
1等賞と2等賞の間の距離と2等賞と3等賞の間の距離はは正確にはわかりません。下記の表をみてもらうとわかりやすいでしょう。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top