学生年代,大家都经历过“参差不齐就选D”的“心跳时刻”,颇有“梭哈”的快感;在教育经济学中,学生选择蒙题还是跳题,也是很有意思的话题。近年的研究表明:在“不答不扣分,答错倒扣分”的场景中,男女的抉择间有显著差异——相比冒着罚分的风险蒙一个,女生的选择更加保守。实际的考试中,从“答错倒扣”改为“答错不扣”,会显著缩减成绩的性别差异。
Baldiga以实验探究了这一问题:参与者随机分组,回答20道美国高校入学考试(SAT)历史科的选择题(五选一)。其中一组,选对得1分,选错不影响分数;另外一组,选对也得1分,但选错要扣0.25分。不选都不扣分。结果,选错不扣分时,几乎所有人都答完了所有题目;选错倒扣分时,男女的策略出现了显著差异——女生跳过的题目数几乎是男生的2倍!
这一现象的成因是什么呢?在答完题目之后,实验者测量了参与者的风险规避程度与对之前答案的自信程度,同时邀请参与者再次作答(这次不记分),以衡量参与者对题目涉及的历史知识的了解程度[1]。结果,无论是自信还是历史水平,都无法解释前述差异;风险规避确实对答题策略有显著影响,但只能解释男女间40%的差异。深层原因仍需继续探究。
类似现象在实际的考场中亦存在。2015年,智利高考改革,将选择题计分方式由“错1题倒扣0.25分”改为“答错不扣分”(与前述实验一致。此外,智利高考也是五选一)。改革引发的后果大体如上:改革之前,排名越高,男生比女生多答的选择题题目数量就越多。在最高分段的五分之一考生中,女生平均要比男生少作答5道题!改革之后,这一差异几乎消失。
如此变动,对两性考生的表现有什么影响呢?通过比较改革前后的两次考试,Coffman和Kilowski估算了影响的幅度:“答错不扣分”,让男生的成绩优势缩小了约0.03个标准差,占之前差距的9%。为排除时间趋势的干扰,作者选取多次考试成绩做了安慰剂检验(没有改革的考试中,是否有如此波动?),发现影响在分数最高的五分之一考生中最为显著[2]。
除各分数段外,作者还分学科检验了改革的成效,结论如上图所示:在大部分学科,多作答的题数愈多,相应的成绩提升也愈明显。生物和化学两科,男女成绩的差异缩小了约0.1个标准差;数学是唯一的例外。尽管女生多答了近7道题,最终的成绩差异没有因此发生显著变化。看来,在大部分学科中,只要倒扣不是太狠,多蒙几题可能是更加占优的策略。
[1] 测量采取的都是行为经济学中通用的办法:参与者在一系列彩票中的选择,可以揭示他们的风险偏好程度;让参与者在“自己回答”和“回答准确度已知的机器人”中做选择,可以揭示他们对自身答案的信心。除以上因素外,实验设计中还考虑了两性在面对压力时的差异。
[2] 所谓安慰剂检验,指的是将2013或2014年的数据依此回归,观察男女间成绩差异是否会产生如此变化。如果是,则说明之前看到的结论可能纯属随机波动或趋势变化。除此之外,文章还利用会考分数(没有经历改革)做了检验。以上检查,印证了前述的分析结果。
参考文献:Baldiga, K. (2013). Gender differences in willingness to guess. Management Science, 60(2), 434-448.
Coffman, K., Klinowski, D. (2018). The impact of penalties for wrong answers on the gender gap in test scores.
来源:知乎 www.zhihu.com
作者:Manolo
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载