コピーしたデータの中身を確かめる。
% cat siga92.data
このファイルは、滋賀県内にある50の市町村ごとの7つの特性データを50行×7列に並べたものであるが、数値のみのテキストとなっている。各変数の並び、変数名、書式などは使用するデータのページを参照すること。
はじめの1列目のデータ系列が各市町村ごとの「1人1日あたりのごみ排出量(g)」であり、このデータ系列と2列目〜7列目の6つのデータ系列との相関係数をFORTRANプログラミングにより計算し、得られた6つの相関係数の中で、「正の相関が最も高いもの」と「負の相関が最も高いもの」についてgnuplotで散布図を描いて課題表示用のページに貼り付けること。課題表示用のhtmlファイルは新規に作成し、「データ処理演習課題A−1」というリンクボタンで自分のホームページからリンクできるようにしておくこと。選ばれた変数の名前や相関係数の値は電子メールで提出すること。
gnuplotではスペースで区切られた2列のデータ系列のファイルを用いてグラフを描くので、相関係数が高いことにより選ばれた説明変数(データ系列)を1列目、目的変数である「1人1日あたりのごみ排出量(g)」を2列目に書き込んだファイルを新たに作る必要がある。相関係数の計算、正の相関と負の相関のそれぞれ最も高い説明変数の選択、目的変数(1人1日あたりのごみ排出量)と選択された説明変数(データ系列)を2列に並べたファイルの作成(正負それぞれで計2つのファイル)などをひとつのプログラムで実行することが望ましい。
相関係数の計算に必要な公式は相関係数に必要な計算式のページに書かれている。
◆ 結果に対する考察や感想、計算結果、作成したFORTRANプログラムを電子メールで以下の宛先、Subjectで送信すること。
◆ メール本文の1行目には、学生章番号(半角数字)と漢字氏名を必ず書いておくこと。
---------------------------------------
To: amano-report@se.ritsumei.ac.jp
cc: 自分のログイン名
Subject: a-1
---------------------------------------
学生証番号(半角数字)□漢字氏名
◎結果に対する考察や感想など
◎選ばれた説明変数の名前と相関係数の計算結果(正の相関と負の相関の2通り)
◎計算のために作成したFORTRANプログラム
どうしても自力でプログラムを作成できない場合は、以下のサンプルプログラムを参考にすること
サンプルA:ごみ排出量と人口密度のデータだけを新しいファイルに書き出す
サンプルB:ごみ排出量と6つの説明変数との間の相関係数を計算する