p値の用法をめぐり、学術界に議論の火花

p値の用法をめぐり、学術界に議論の火花

p値とは、グループや関係性における違いが偶然によるものなのか、あるいは研究対象の変数によるものなのかを示す尺度で、幅広く使用されています。一般的に、p値が0.05未満の場合、結果は統計的に「有意」であるとみなされます。しかし一部の研究者たちは、偽陽性を防止するために有意水準を0.005に引き下げる必要があると主張しています。この提案は、科学コミュニティに議論を呼び起こしました。別の研究者たちはこの提案に対し、p値の誤用をなくすためのより良い方法は、それぞれのp値の使用方法が正当であることの説明を研究者に義務付けることであると主張しています。


問題となっているのは、現状のp値の有意水準には、誤用や誤解の余地が多く残されているという点です。20177月、72名の著名な研究者が、ある論文PsyArXivのプレプリントサーバーに投稿しました。その論文では、社会科学や生物医科学におけるp値の有意水準は、0.005に引き下げるべきであるとの主張がなされていました。論文の筆頭著者の1人で南カリフォルニア大学(ロサンゼルス)の経済学者、ダニエル・ベンジャミン(Daniel Benjamin)氏は、「p値の基準を0.05にするか0.005にするかというそれぞれの主張は、確立された知識ではなく、単なる“示唆的証拠”として扱うべきです」と述べています。


2017918日、ある研究者グループが、この主張に反論する論文を発表しました。論文の筆頭著者で、アイントホーフェン工科大学実験心理学者のダニエル・ラーケンス(Daniel Lakens)氏は、「p値の有意水準を厳格化することで、偽陰性が増加するなどの新たな問題が発生します。ある問題の解決策は、新たな問題の発生源になり得るのです」と主張しています。ラーケンス氏は、ネガティブな結果はジャーナルに受け入れられにくく、多くの論文が出版されないままお蔵入りになってしまうという問題についても指摘しており、「ある方針を実施する際は、意図しないネガティブな結果を招く可能性がないことを確認しなければなりません」と述べています。同氏は研究者に対し、データ収集の開始前に、選択したp値の有意水準とその選択の正当性を書き留めておくことを提案しており、「この作業によって、p値の責任ある使用につながるだけでなく、用法の分析も容易になります」と主張しています。


結果の再現不可能性の問題は、研究者が直面している最大の課題であり、責任を持ってp値を使用することには重要な意味があります。一部のジャーナルが、再現性がないことを理由にp値の使用を禁止しているように、研究者たちの間には、p値の扱い方に関する明確な分断が生じているようです。研究者たちはこの問題について、全会一致で納得できる解決策を見つけることができるのでしょうか。


あなたは研究でp値を使用していますか?有意水準の引き下げについてどう考えますか? あなたの研究には影響がありそうですか? 影響がありそうな場合、それはどのような影響ですか?下のコメント欄から、ご意見をお寄せください。


関連記事:

正確にp値を報告していますか?

Is my research significant? Why you shouldn't rely on p values


参考資料:

Big names in statistics want to shake up much-maligned P value

'One-size-fits-all’ threshold for values under fire

学術界でキャリアを積み、出版の旅を歩もうとしている皆様をサポートします!

無制限にアクセスしましょう!登録を行なって、すべてのリソースと活気あふれる研究コミュニティに自由に参加しましょう。

ソーシャルアカウントを使ってワンクリックでサインイン

5万4300人の研究者がここから登録しました。

便利さを実感して頂けましたか?

あなたの周りの研究者にもぜひご紹介ください