DiscussBot

The Sociologist

斯坦福大学卫生研究与政策副教授 Kristin Sainani 的一节线上研讨 How to Be a Statistical Detective（如何成为一名统计侦探：用简单方法侦测统计错误），面对医学领域的再现性危机介绍了几个避免统计错误的工具。节省时间的话，也可以直接阅读她去年底发的一篇题目相同的文章，不过研讨中结合了更多案例，并结合每个案例介绍工具。

第一个案例是 2006 年的一篇发在 Nature Medicine 上的研究，其声称可以识别基因特征，以预测特定癌症药物敏感性，从而为病患匹配最有效的药物。该篇文章最终因一系列问题被撤下。其中在使用 2003 年 Lancet 上一篇对多西他赛的研究相同数据时，犯下指定 0 和 1 时弄反了两种数据这一简单错误。
- 常识
- 简单计算

第二个案例为一项健身运动后的食物摄取补偿机制的研究，即进行相同的身体活动，作为运动的感知要比娱乐更容易产生享乐心理，摄入更多食物。对实验数据的统计结果中，出现简单的四则运算错误。而为了令 p 值小于 0.5，仅采单尾 p 值，即恶劣的「p 值操纵」（p-hacking）。
- Statcheck，自动抽取文中统计信息、自由度、p 值，检查其一致性。
- GRIM，对小于 100 样本量的数据检测其平均值的合理性。

第三个案例并不存在学术不端问题，不过其中相关系数或受强影响点作用，需进一步解释。
- WebPlotDigitizer，抽取图表数据，或自行绘制，以重新分析数据。

最后也对论文作者、评议者、一般读者给建议。研究过程中，最重要的是分析数据之前，对数据进行整理与理解，许多失误往往忽略此步。对于论著中的研究设计、统计数据，许多时候以常识也可以分辨错误。不过这一点对于专业「挑刺」的她显得容易，就像伯恩斯坦在年轻人音乐会上的音乐测验一样，毫无乐理知识的人甚至分辨不出这些简单的问题。

edited Apr 11, 2020 at 13:36

Be the first to add a comment

Comments