2012/5/5

統計上の「尺度」について

放送大学「身近な統計(第2回)」を視聴しました。

以下は、いつものブログと違い、特に私見を挟まず、学んだ内容をシェアします。統計の「尺度」について、備忘を主目的に書きますので、常識化している方は、スルーしてください^^

■統計には、4つの尺度がある

統計上のデータを測定するには、4つの尺度のパターンがあります。そして、それぞれは、次のような特徴を持っています。尺度に関するWikipediaの解説

【名義尺度】

・定義:質的データを対象とし、単にカテゴリーだけが与えられた尺度 ・例:性別、都道府県 ・特徴:度数分布分析のみ、可

【順序尺度】

・定義:質的データを対象とし、カテゴリーに順序を与えられた尺度 ・例:成績における5段階評価 ・特徴:累積度数分布分析も、可

【間隔尺度】

・定義:量的データを対象とし、ゼロ地点を任意に設定できる尺度 ・例:日付、摂氏・華氏 ・特徴:加算・減算による分析も、可

【比率尺度】

・定義:量的データを対象とし、ゼロ地点が絶対である尺度 ・例:身長、体重、年齢、収入 ・特徴:積算・除算による分析も、可

■「特徴」の解説における気付き

放送大学の講義では、さらっと解説されていました。でも、個人的には、結構、目からウロコでした^^

というのも、これまで私が触れて来た統計学の解説書等では、各尺度の「特徴」の解説となった途端に、いきなり、「この尺度未満にはT検定は利用不可」といった高度な話になっていたからでした。そんな話に飛ばれた時点で、「うーん、いつか勉強してみるか・・・」と理解を諦めてしまうこと、度々でした。

ところが、この講義では、たとえば、間隔尺度は加減算、比率尺度は積除算と非常にシンプルに解説されていました。そこを理解しておけば、「T検定はこの尺度では利用不可なのか?」といったことも本質から分かるようになるのではないかと思います(多分!^^)

■「名義尺度」に融通を持たせるテクニックに関する気付き

もう1つ、実務で役立ちそうだったのが、「名義尺度」に融通を持たせるテクニックです。

「名義尺度」は、単にカテゴリーを与えられているだけの尺度です。ですから、分析出来るのは、各カテゴリー別のデータ数を示す度数分布位しかありません。

しかし、たとえば、「都道府県」という「名義尺度」も、それを人口順に並べ替えて用いれば、それは、「順序尺度」に変わります。そうなれば、累積度数分布による分析も意味を持つことになります。結果、パレートの原則を用いることもできるようになります。

・・・以上、備忘のための記録でした。