(2)度数データの基礎集計(名義尺度データの場合)
 


 名義、順序尺度データは、値の間隔が等しくないため平均や標準偏差は計算できません。それぞれの値をとる度数を集計が基本です。さらに、それぞれの値に属する度数が全体に占める割合(パーセンテージ)などを算出し、グラフ化するなどしてデータの傾向、基本的特徴を把握します。


課題1.以下のデータの基礎集計(度数集計、グラフ化)をしてみよう。

 「職業」と「支持政党」との関係を研究するため、次のような調査が行われた。職業は、「第一次産業」「第二次産業」「第三次産業」の3つの選択肢でチェックし、支持政党は「A党」「B党」「C党」「D党」「支持政党なし」の5カテゴリーで回答を求めた。

      表2.「職業」と「支持政党」に関する調査結果

 

注)質問紙(調査票)では、それぞれのの選択肢にa,b,c…などのコードを付けますが、集計に際してはそのコードを直接入力するのではなく、数字に置き換えます。ここでは、第1次産業を1,第2次産業を2,第3次産業を3とコード化し、同様に、A党支持を1,B党支持を2、C党支持を3、D党支持を4、支持政党なしを5にコード化しています。さらに、無回答を0としています。


データの入力と度数集計の手順

  1. エクセルを起動しデータを入力する。
     エクセルなどの表計算ソフトでは、行が1,2,3,・・・・、列がA,B,C,・・・・と番号が割り振られた行列表(1つのデータ表をシートと呼びます)にデータを入力して集計作業を行う仕組みになっています。今回は、1列一行目(A1)に「職業」、2列1行(B1)に「支持政党」というラベルを入力し、それぞれの列にデータを入力します。


  2. 職業別度数集計をおこなう。
     データを全て入力し終わったら、適当な場所に集計に用いる「階級範囲」(
    今回は、0,1,2,3)を縦に入力します。



  3. 「階級範囲」を入力し終わったら、集計結果を出力する範囲を指定します。入力した0,1,2,3の右隣をドラッグします(左ボタンを押したまま必要な範囲マウス移動する)。そうすると下図のように指定した範囲が青く色づきます。次に、「関数」メニューから「frequency」を選択します。(下図の

 

4.「データ配列」(集計するデータのあるセル全て)と、集計する「区間配列」(0,1,2,3と入力したセル全て)を指定し、CTRL」と「SHIFT」キーを押しながらリターン(エンター)キーを押します。

注)「データ配列」「区間配列」の指定は、それぞれの窓の右端にあるボタンを押すと指定できます。



集計結果のグラフ化

  名義尺度データ集計の主要な部分は度数集計ですが、集計結果から特徴や傾向を読みとるためにはグラフ化が有効です。今回の集計結果をグラフ化してみましょう。

グラフ作成の手順

1.出力された結果をドラッグしてグラフボタンを押します。
 項目ラベル等をグラフに含めるためには、ラベルを付けた表を別途作成し、それでグラフ化します
2.グラフ作成のダイアログに従ってグラフを作成する。
 最初に、グラフのタイプを選択するメニューが出てきます。度数データの基本的分析はそれぞれの値が占める割合ですので、グラフの種類は「円グラフ」か「帯グラフ」が適当です。

 

 

  



 注)レポートを送る際に「ファイル保存」と「ファイル添付」という作業が必要です。コンピュータを使い始めた段階で、よく分からないという人はここを参照して下さい。



課題2.クロス集計

 今回の場合、「職業」「支持政党」を別々に集計するだけでは、両者の関係を分析するには不十分です。各職業ごとに支持政党がどのような比率になっているかを集計する必要があります。これを「クロス集計」といいます。

 

  1. クロス集計用に「頻度」という変数を新しく用意し、全部のセルに1を入力します。 
  2. 適当な空きセルをクリックし、メニューバーの「データ」中にある「ピポットテーブル」をクリックします。
  3. クロス集計用のダイアログが現れますので、必要に応じた指定をすればクロス集計が行われます。
           今回の場合は、行に「職業」を指定し(ドラッグし)、列に「支持政党」を指定します。最後に、「頻度」を集計結果部分に移動すると以下のようなクロス集計が行われます。

     



クロス集計の結果をグラフにしましょう。

 どのようなグラフがよいかは比較目的によって違います。職業毎に比較したい場合には下図のような帯グラフなどが良いかと思います。ただし、何を基準にするかは研究者の判断によります。政党別に職業を比較したい場合は縦を政党にすればよいでしょうし、職業別の関係を見たい場合は縦を職業にします。クロス集計は職業と支持政党との関係を見るために行われます。従って、無答者は関係を見ようがないのでクロス集計から省く必要があります。結果を論文、報告書に書くときには0データを省いて書きましょう。SPSSなど本格的な統計ソフトでは「欠損値」を指定して集計から省くことが出来ます。ということで、グラフには0の部分は省いた分割表からグラフを作って下さい。
  

 
(補足)グラフ化についての工夫

 グラフには、棒グラフ、折れ線グラフ、円グラフなど様々な種類があります。どのようなグラフにするかは分析の視点によって決められます。例えば、変数の値間の量的な差をはっきりさせたいときには棒グラフ、値が全体に占める割合が見たいときは円グラフか帯グラフ、さらにその経時的な変動を見たいときは連続帯グラフか折れ線グラフ、複数の値のバランスを見たいときにはレーダーチャートなどになるでしょう。最適なグラフを選び、見やすく表現をするということは研究にとって重要ですし、今後、プレゼンテーション能力としていろんな場面で重要になるでしょう。