標準正規分布の上側確率の数表をEXCELで作成する

 統計解析に必ず出てくる正規分布.これを標準化した標準正規分布の数表は全部で 400 個に及ぶ数値が並んだ表である.教科書に記載されている数表は,端的に言って機械可読性に欠ける.テーブル形式にしたい.

NORM.S.DIST 関数を知る

 この NORM.S.DIST 関数の罠は「下側確率」が仕様となっていることである.マイナス無限大から指定した Z 値まで確率密度関数を積分した面積が確率である,というのが下側確率の意味である.

NORM.S.DIST関数は下側確率がデフォルト
NORM.S.DIST関数は下側確率がデフォルト

 一方,標準正規分布の数表は「上側確率」である.指定した Z 値から無限大まで確率密度関数を積分した面積のことである.これを NORM.S.DIST 関数で直接求めるのは難しい.

求めたいのは上側確率
求めたいのは上側確率

-3.99 から 0.00 まで 0.01 刻みに Z を 400 行作成する

 面倒ではあるが,Z がマイナスいくつから 0 までの下側確率を求め,符号を反転させたほうが早そうだ.ここでは教科書の記載通り 400 個の数値を作成することにする.

 ワークシートの A1 セルに Z とタイプし,B1 セルに P(Z) とタイプする.改行して A2 セルに下式のように入力する.

NORM.S.DIST 関数は下側確率を求める

 B2 セルに下式のように入力する.第一引数に TRUE を指定すると「累積分布関数の値が計算される」と公式にはあるが,これはマイナス無限大から第一引数に指定した値 Z まで,確率密度関数を積分した面積,つまり下側確率のことである.

 A1:B2 セルを選択してテーブルに変換する.A2:B2 セルを選択し,ドラッグして 400 行作成する.小数点以下の桁数は未設定であり,非常に小さい事がわかる.

-3.99から0.00までのNORM.S.DIST関数の結果
-3.99から0.00までのNORM.S.DIST関数の結果

 最終行の結果が 0.5 であることを確認してほしい.Z が 0 の時 P(Z) が 0.5 になっていなければ,それはこれまでの手順がおかしいことを示している.

A 列と B 列の間に 1 列挿入しマイナス1をかける

 表示用の列を作成する.A 列と B 列の間に 1 列挿入する.新しい B2 セルに下式のようにタイプする.その結果,マイナス符号が消える.ここで下側確率が上側確率に変換される.

全体をコピーして値を貼り付け

 数式の参照関係を解消するために全体をコピーして「値の貼り付け」を行う.

Z で昇順ソート

 最初の A 列を削除し,表示用に先刻挿入した列で昇順ソートを行う.下図ではすでに列名を Z と変更しており,A 列 (Z) の小数点以下の桁数を 2, B 列 (P(Z)) の小数点以下の桁数を 3 に変更している.

標準正規分布の上側確率
標準正規分布の上側確率

標準正規分布の上側確率の数表

 結果を示す.覚えておくべき数値は Z = 1.28, 1.645, 1.96 である.それぞれP(Z) = 0.1, 0.05, 0.025 を返す.正確には下記の通りである.

  • P( Z >= 1.96) = 0.025
  • P(|Z|>= 1.96) = 0.05
  • P( Z >= 1.645) = 0.05
  • P(|Z|>= 1.645) = 0.1
  • P( Z >= 1.28) = 0.1

 特に 1.645 と 1.96 は片側検定,両側検定のときに間違えやすい.|Z| >= 1.96 などと絶対値記号がつけば両側検定,Z >= 1.96 などと絶対値記号がつかなければ片側検定と暫定的に覚えておきたい.

まとめ

 統計検定の基本である標準正規分布の上側確率の数表を計算で求め,表示した.

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください