源自风暴统计网:一键统计分析与绘图的网站
2026年1月10日,《Child Abuse & Neglect》(心理学二区,IF=3.4)刊登了一篇前沿因果推断研究论文,评估了青春期家庭外照料安置(OOHP)对受虐待青少年健康风险行为的影响。
这篇文章比较了采用逆概率加权法(IPTW)和g估计因果推断方法,在控制众多混杂因素后的分析结果与使用传统协变量调整的回归分析结果,发现结果是相悖的!
一起来解读一下这篇文章!
研究设计
经历过家庭外安置(OOHP)的青少年会表现出较高的健康风险行为(如物质使用、无保护性行为),而在青少年时期安置的青少年风险可能更高。
本研究使用来自美国具有全国代表性的纵向调查“全国儿童与青少年福祉调查(NSCAW-I)”数据,纳入734名在基线时(11–14岁)遭受虐待且至少与一名亲生父母同住的青少年。
追踪时间点包括基线(Wave 1)、18个月(Wave 3)、36个月(Wave 4)和6年后(Wave 5)(下文依次重命名为第一至第四轮)。
至第四轮调查时,138名(21%)在研究期间的青春期经历了至少一次OOHP。
结局变量与协变量
1.物质使用
青少年期物质使用(在第1至第3轮调查中):报告过去30天内使用酒精、香烟、大麻、吸入剂、硬性毒品(可卡因、快克、海洛因)以及处方止痛药的天数。
成年早期物质使用(在第4轮调查中):综合得分,通过取三个指标(使用的物质总数、酒精依赖症状、药物依赖症状)的平均值,创建了第4轮物质使用得分
2.性风险行为
青少年期性风险行为(在第1至第3轮调查中):青少年报告了是否有过性行为以及使用保护措施的频率。保护措施使用情况最初编码为:(0) 从不,(1) 有时,(2) 经常,或 (4) 总是。未发生过性行为的被重新编码为"从不"。我们进行了反向编码,使更高的分数表示更多的无保护性行为。
成年早期性风险行为(在第4轮调查中):参与者报告了过去12个月内发生性行为的次数(或估计一个范围),并报告了过去12个月内"使用避孕措施或性传播疾病防护措施"的次数(或估计一个时间百分比)。回答被重新编码为:
0分:过去12个月内无性行为或100%使用保护,
1分:有性行为且有时使用保护,
2分:有性行为且从不使用保护。
基于先前研究,纳入了对非父母看护和健康风险行为均有影响的协变量,包括时不变和时变混杂变量。
主要研究结果
本研究采用三种统计方法(传统回归、逆概率处理加权、G估计)分析了OOHP对青少年物质使用和无保护性行为的影响。
主要发现概括如下:
关键发现:
在传统回归模型中,OOHP与健康风险行为无显著关联,表明若仅控制协变量,可能掩盖真实关联。
两种因果推断方法均显示,OOHP预示着青春期后期物质使用的增加。
IPTW进一步发现OOHP青少年在青春期有更高的性风险行为,并且在成年期物质使用也更为严重。
这篇文章对研究方法领域提供了重要的启示。IPTW、G计算因果推断方法成功揭示了传统回归技术所掩盖的显著效应,更接近真实效应。证明其在获取更精确、偏差更小的结果方面具有独特潜力。感兴趣的朋友可以再看看原文。
因果推断的方法学体系已经非常成熟了,但是我们的临床、护理、公卫的朋友们,却没有感受到2025年因果推断统计学方法学技术的改变。
用观察数据探讨问题,简单的回归分析怕是已经不够了!
关于郑老师团队及公众号
【因果推断与机器学习】未来医学科研的大势所趋
临床、护理、公卫的朋友们,2026年,将是诸位因果推断方法革新的一年。郑老师团队推出“因果推断与机器学习”寒假训练营,丰富的因果推断方法教学,课程理论结合R语言实操,覆盖从基础到进阶的完整链条,欢迎参加!
模块一:理论
1.流行病任务与因果推断;2.因果推断与偏倚控制
模块二:回归与G方法
3.回归的方法及其应用;4.G方法及实践
模块三:倾向得分
5.倾向得分方法;6.倾向得分加权
模块四:机器学习
7.机器学习理论;8. 机器学习与 G方法;9.机器学习与倾向得分
模块五:双重稳健估计方法
10.双重稳健方法;11.双重机器学习
模块六:TMLE方法
12.TMLE 方法;13.机器学习与 TMLE方法
模块七:缺失数据填补与因果推断
14.缺失数据填补与机器学习;15.缺失数据填补后双重稳健估计
模块八:中介分析与因果中介
16.中介分析与因果中介;17.双重稳健估计下的中介分析
模块九:处理效应异质性分析
18.处理异质性分析方法;19.因果森林方法
报名训练营,请添加郑老师助教微信咨询(微信:aq566665)