統計分析をする上で避けては通れないp値について、
p値が0.05より小さいから有意であるといった言葉を耳にしたことがあるのではないでしょうか。
学会報告や論文報告など、結果にデータを用いた場合、統計分析をしてp値について記載がなければ、ただデータをまとめただけで、その報告の信頼性は高いとは言えません。
だから、データを用いた場合には必ず結果と一緒に提示する必要があります。
しかし、p値ってそもそも何?、なぜ0.05?と皆さん疑問に思いますよね。
私も勉強する前は、「p値が0.05より小さいため有意だから」と言われれば、その結果は信じていいものなんだくらいにしか思っていませんでした。
データの分析をするようになってからは、「有意」と言われても、どの程度の効果があるのかといったことを気にすることが重要であり、p値よりも結果の値を確認することが大切であることの重要性をとても感じています。
ここでは、私自身の経験から、p値について最低限知っておくべき知識をわかりやすく解説します。
p値とは?
帰無仮説が母集団において正しいときに標本データで観測された事象またはそれよりも更に仮説から外れた事象が起こる確率の実現値(教科書的な言葉なのでよくわかりませんね…)
- まぐれでたまたま起こる確率
- pはprobability(確率)の頭文字
慣習的に5%未満で判断される
統計家のフィッシャーが20回中、たまたま発生した1回は偶然だから許したらいいんじゃないと決めただけ
科学的な裏付けはなく、慣習的に使われているのが現状
昔は手計算であったが、今ではPCが発達しているため計算も早く自動的に行ってくれる
ジャーナルによっては5%は採用しないところも多く、p値はかなり小さくないといけない場合も…
あとは分析した人の判断も大事(0.05で良いのか、それよりも小さくないといけないか)。
心理実験の結果
「交通事故に遭う」「雷に打たれる」など世の中で起こりうる様々な現象を並べ、自分の身にも起こるかもしれないかどうかを答えてもらうアンケートをとった。その結果、多くの人が「起こらないだろう」と答えた現象の実際の発生率は5%ほどだった。つまり人間は「5%の確率で起こる現象」を「ものすごく珍しい現象」として感覚的にとらえているということだ。これが「95%、カバーできればいい」(ものすごい珍しいケースはとりこぼしてもいい)という有意水準の設定につながったともいわれている。
引用:小島寛之, 難しいことはわかりませんが、統計学について教えてください!身近な疑問からはじめる統計入門, SB新書, p80-81
p値だけで判断してはいけない
最も重要なp値の特徴は、
症例数を増やせばp値は小さくなること
ということは、臨床的に意味はなくても症例数を増やせばいつかは有意差を出せる
つまり、有意差がない場合、サンプル数が足らないからか、本当に効果がないからかなのかはわからない
だからこそ、p値をみる前に、実際のグラフや実際の数値を見てまずは判断する癖が大事、その後p値をみることの方が重要
→統計に惑わされないように(これこそが統計マジック?)
- 方法で記載する部分 ⇒ 有意水準5%で設定
- 結果で記載する部分 ⇒ p値=0.035
- p値が分かってから結果で記載する ⇒ p値が0.05未満のため有意な差がある
まとめ
ここでは、p値について最低限知っておくべき知識を解説しました。
- p値が0.05なのは慣習的なもの
- p値はサンプル数が大きくなれば小さくなる
- p値だけではなく、結果の数字を見ること
データ分析の結果、「有意だから」、「有意な差がある」と言われると結果のデータを詳しく確認せずに解釈してしまう人が多いと思います。
私自身の経験から、p値を確認することは必要ですが、実際の結果の数値を確認することも重要であると思います。