1.3 データの種類と測定尺度
データの分析において、データの種類とその測定尺度を理解することは極めて重要です。これらの知識により、適切な統計手法を選択し、正確な結論を導き出すことが可能になります。
データの種類
データは大きく分けて以下の2つの種類に分類されます。
定性データ(質的データ)
- 名義尺度(ノミナル)データ: 名前やラベルのように、カテゴリーに分けられるデータです。このデータは順位がなく、計算も意味を持ちません。例としては、性別、血液型、国籍などが挙げられます。
- 順序尺度(オーディナル)データ: カテゴリー間に順序があるデータです。このデータは順序に意味がありますが、その間隔の大きさは不明です。例としては、顧客満足度(非常に満足、満足、普通、不満)、教育レベル(中卒、高卒、大卒)などがあります。
定量データ(量的データ)
- 間隔尺度(インターバル)データ: 順序があり、かつその間隔が等しいデータです。ただし、絶対的なゼロ点はありません。例としては、気温(摂氏や華氏)、日付、時間などがあります。
- 比率尺度(レシオ)データ: 間隔尺度の特性を持ちながら、絶対的なゼロ点が存在するデータです。このデータは、割合や倍数で比較することが可能です。例としては、身長、体重、年齢、売上などがあります。
測定尺度
データの測定尺度は、データがどのように収集され、どのような意味を持つかを決定します。測定尺度には以下の4つがあります。
名義尺度(ノミナルスケール): データがカテゴリーやラベルとして示される場合に用いられます。例としては、国籍、性別、血液型などが挙げられます。
順序尺度(オーディナルスケール): データが順序を持つ場合に用いられます。例としては、アンケートの評価(非常に満足~非常に不満)、学位のレベルなどがあります。
間隔尺度(インターバルスケール): データが順序を持ち、その間隔が等しい場合に用いられます。ただし、ゼロ点は任意であるため、完全な不在を示すものではありません。例としては、気温(摂氏や華氏)、日付、時間などがあります。
比率尺度(レシオスケール): 間隔尺度に加えて、絶対的なゼロ点が存在する場合に用いられます。これにより、比率を計算することができます。例としては、身長、体重、売上、年齢などが挙げられます。
測定尺度の比較
測定尺度 | 特徴 | 例 | 計算可能な操作 |
---|---|---|---|
名義尺度 | カテゴリーに分けられ、順序がない | 性別、国籍、血液型 | カウント、モード |
順序尺度 | 順序があるが、間隔は不明 | 顧客満足度、教育レベル | ランク付け、モード、中央値 |
間隔尺度 | 順序と等間隔があり、ゼロ点は任意 | 気温、日付、時間 | 加算、減算、平均、標準偏差 |
比率尺度 | 絶対的なゼロ点があり、比率が計算可能 | 身長、体重、売上、年齢 | すべての算術操作が可能 |
測定尺度を正しく理解することで、適切な統計手法を選び、正確で意味のある結果を得ることができます。各データタイプに応じた分析手法を用いることで、データの特性を最大限に活用し、信頼性の高い結論を導き出すことが可能です。
下田 昌平
株式会社レシートローラー代表 CTO、事業開発、数学、ソフトウェア開発を毎日コツコツ進めています。