統計処理の基本は,標本集団の「平均と分散」である.この場合の「平均」とは,一般的には「算術平均」,すなわち,「各標本データの総和をサンプル数で除した結果」.さて,さっきからいろいろと計算を試し始めているマイデータ(ふるさと都道府県の自治体のデータ)の中で,「面積」データの算術平均を求めるにはどうすればいいだろう.さっきみたいに「セルごと足して足して」をして合計を計算して標本数(自治体数)で割る?,それはちょっとめんどう.
そこで登場するのが「関数」という道具である.早速,算術平均を一瞬で計算してくれる「average」という関数を使ってみよう.さっきと同じように,「面積」の列(D列)の下の方の適当な空白セルをクリックしてアクティブ(入力可能状態)にする.まず半角文字で「=」を入れてから「average」という文字(半角アルファベット)を打ちこみ,さらに「(」,半角カッコ開ける印を打った後で「算術平均を求めるデータの入ったセル」を一括選択する.「面積」データなので,D列2行目のセル(D2)からD列でデータの入ってる最後のセル(D?)までを一気にドラッグすればOK.
![]() |
![]() |
![]() |
ドラッグするにはセル数が多くて大変な場合は,いったんD列2行目のセル(D2)をクリックした後,「shift」キーを押しながらD列でデータの入ってる最後のセル(D?)をクリックすると一括選択完了.この「shift」キーを使った一括選択方法は,マイデータを作るときに複数行を一気に消したときと同じ.最後に「)」,半角カッコ閉じる印を打って「Enter」キーを押すと「算術平均」計算結果が現れる.
同じ手順で,「average」の代わりに「sum」という関すを使えばデータの総和(さっきまで足して足してで苦労して計算してた),「counta」という関数を使えばデータの個数(正確には,空白でないセルの個数)が出てくる.「stdev」はおなじみ標準偏差,「max」は最大値,「min」は最小値.いずれも「関数名」の後の「()」半角カッコの中に対象となるデータの範囲を「セルごとまとめてドラッグして一括選択」することで,どんなに膨大なデータが相手でも一瞬のうちに計算結果が出てくる.じゃあさっきまでの「足して足して・・・」の面倒な作業はいったい何だったんだと言わないように.物事を知るには手順というものが・・・.