第205章 一菲的学术救星(第2页)
乔卫东摇头,“你用‘家庭收入’作为学习动机的工具变量,但家庭收入本身可能直接影响成绩——比如富裕家庭能提供更好的学习资源。
这违反了工具变量的外生性假设。”
他说得很专业,胡一菲听得眼睛都直了:“那……那怎么办?”
“换个思路。”
乔卫东拉过椅子坐下,“不用传统计量方法,用机器学习里的因果推断模型。”
“因果推断?”
胡一菲第一次听到这个词在心理学研究中的应用。
“对,比如doublemachineLearning(双重机器学习)。”
乔卫东在草稿纸上画了个示意图,“先用机器学习模型分别拟合处理变量和结果的预测值,再用残差做因果估计。
这样可以更好地控制混杂变量,缓解内生性问题。”
他边说边写,公式和算法流程在纸上逐渐清晰。
胡一菲看得屏住呼吸——这些方法她完全没听说过,但听乔卫东一讲,又觉得逻辑上完全合理。
“可是……我下周一就要交了,现在学新方法来得及吗?”
她绝望地问。
“我帮你。”
乔卫东打开自己的手机,连接胡一菲的电脑,“把你数据发我一份,我写个示例代码,你照着改就行。”
胡一菲不敢相信:“现……现在?这都半夜了……”
“反正我也睡不着。”
乔卫东已经开始敲键盘了,“你去睡吧,明天早上给你看结果。”
“那怎么行!
我陪你!”
胡一菲打起精神,又去冲了两杯咖啡。
接下来的三个小时,3601的客厅成了临时的工作室。
乔卫东专注地写着代码,胡一菲在旁边看着,时不时问几个问题。
她发现乔卫东写代码的速度快得惊人,而且几乎不用调试,一气呵成。
凌晨两点,模型跑出了第一个结果。
“拟合度0.87。”
乔卫东看着屏幕,“比你的最好结果高了0.15。”
胡一菲捂住嘴,眼睛瞪得老大:“这……这怎么可能……”
“还没完。”
乔卫东继续调整参数,“因果效应估计的结果也出来了。
你看,学习动机对成绩的平均处理效应是0.32,而且在不同群体间有显着差异……”
他又调出几个可视化图表。
原本杂乱无章的数据,在因果推断模型的梳理下,呈现出清晰的模式和规律。
胡一菲看着那些图表,手在发抖。
这是她梦寐以求的结果——不仅验证了核心假设,还发现了更有趣的异质性效应。
这篇论文如果按这个思路写,发国内顶级期刊都够了!
“乔老师……”
本章未完,点击下一页继续阅读