統計学には大きく分けて Descriptive Statistics と Inferential Statistics という2種類があります。
Descriptive Statistics は記述統計学とも訳され、データを状態を数量的に表すことを行います。
例えば、平均や最大値などを求めたり。 また Data Visualization (データの視覚化)といって数の羅列のデータを視覚化し直感的な理解を助ける方法が注目されています。例えば、円グラフとか棒グラフは一番基礎的なものですが、最近では Infographic といって図表だけでなく絵柄などを使ってより視覚的に訴えるかけるものもあります。
また視覚化することによりこれまで数字だけ眺めていただけでは見えてこなかったデータの因果関係が簡単に見えてきたりします。こういった Data Visualization は Business Analytics (ビジネス分析)の第一歩として使われます。
世界の国別オイルの消費量 2011(https://www.statsmonkey.comより)
どのようにデータを表すか 以下は種類に応じての一般的なデータの表し方です。後にそれぞれ詳しく説明します。
データの種類 | |||
---|---|---|---|
Categorical カテゴリカル Data:label | Quantitative 数量的 Data:number | ||
Tabular Method | Graphic Method | Tabular Method | Graphic Method |
Frequency Distribution | Column Chart | Frequency Distribution | Dot plot |
Relative/percent Frequency Distribution | Pie Chart | Relavie/Percent Frequency Distribution | Histogram |
Cross-tabulation | clusterd Column | Cumulative Frequency Distribution | Ogive |
Stacked Column | Cmulative Frequency Distribution | Steam&leaf Display | |
100% stacked column | Cross-tablulation | Scatter Diagram | |
Clastered Column | |||
Stacked Column | |||
100% stacked Column |