斯坦福大学卫生研究与政策副教授 Kristin Sainani 的一节线上研讨 How to Be a Statistical Detective(如何成为一名统计侦探:用简单方法侦测统计错误),面对医学领域的 再现性危机 介绍了几个避免统计错误的工具。节省时间的话,也可以直接阅读她去年底发的一篇题目相同的 文章,不过研讨中结合了更多案例,并结合每个案例介绍工具。

第一个案例是 2006 年的一篇发在 Nature Medicine 上的 研究,其声称可以识别基因特征,以预测特定癌症药物敏感性,从而为病患匹配最有效的药物。该篇文章最终因一系列问题被撤下。 其中在使用 2003 年 Lancet 上一篇对多西他赛的 研究 相同数据时,犯下指定 0 和 1 时弄反了两种数据这一简单错误。
- 常识
- 简单计算

第二个案例为一项健身运动后的食物摄取补偿机制的 研究,即进行相同的身体活动,作为运动的感知要比娱乐更容易产生享乐心理,摄入更多食物。对实验数据的统计结果中,出现简单的四则运算错误。而为了令 p 值小于 0.5,仅采单尾 p 值,即恶劣的「p 值操纵」(p-hacking)。
- Statcheck,自动抽取文中统计信息、自由度、p 值,检查其一致性。
- GRIM,对小于 100 样本量的数据检测其平均值的合理性。

第三个 案例 并不存在学术不端问题,不过其中相关系数或受强影响点作用,需进一步解释。
- WebPlotDigitizer,抽取图表数据,或自行绘制,以重新分析数据。

最后也对论文作者、评议者、一般读者给建议。研究过程中,最重要的是分析数据之前,对数据进行整理与理解,许多失误往往忽略此步。对于论著中的研究设计、统计数据,许多时候以常识也可以分辨错误。不过这一点对于专业「挑刺」的她显得容易,就像伯恩斯坦在年轻人音乐会上的 音乐测验 一样,毫无乐理知识的人甚至分辨不出这些简单的问题。

Comments

Be the first to add a comment