新冠疫情之下,预印本平台们已成谣言与造假的温床?

去年9月中旬,澳大利亚正值白天平均气温20度的春天。不过,被澳大利亚研究委员会(ARC)拒绝基金申请的人显然无心体验这种温暖。

“要么离开澳大利亚,要么告别学界”,被拒者中有人如此描述自己的处境。2021年下半年,他开始进行第二次早期职业生涯研究员奖(DECRA,限申请2次)的申请,没想到仅仅因为资料中使用了预印本就失去了申请资格。在澳大利亚,ARC是政府的主要非医学研究资助机构,也是相关从业者的最主要研究基金来源之一。无法申请ARC的基金,让经费本就捉襟见肘的研究雪上加霜。

据《Nature》报道,这批基金申请中,基于同样原因被ARC拒绝的项目超过了30项,涉及人数则在20位以上。一位匿名研究人员声称自己联络过23位被拒者,他们中至少14位是因为在项目描述或方法中引用了其他作者的预印本材料而遭到拒绝,有些人甚至只是引用了托管在预印本平台上的技术文件。

事实上,数十次的申请被拒源于ARC此前引入的一项新规:申请人被要求不能在“申请的任何部分引用或参考”预印本,即使他们能够证明其引用是与自己的研究深切相关的即时资料。预印本,即在正式发表之前,就通过网站开放给公众查看的已完成论文。一直以来,凭借其宣扬的学术开放、自由与平等,预印本平台备受赞誉。

2018年前,预印本平台已经初具规模。图源PLOS。
2018年前,预印本平台已经初具规模。图源PLOS。

而ARC对预印本的态度无疑明示,它对预印本平台已经不如大众想象中那样全然信任(虽然一周之后,在巨大的抗议声中,ARC撤回了这项“禁令”)。在研究机构中,这样的转变并非孤立。人们推测,这与近两年预印本平台在新冠肺炎领域掀起的波澜不无关系。

新冠肺炎与预印本

众所周知,因为新冠疫情,预印本平台加速走向了公众。

任何疾病的诊断和治疗都是与时间赛跑,对于杀伤力极大的新冠肺炎更是如此。确定 COVID-19 的病原为 SARS-CoV-2 之后,借助揭示其致病机理、研发疫苗及治疗方法,研究人员奋力挽救患者生命,阻止其在人群中的扩散。速度成为关键,包括开展研究的速度和传播研究结果的速度。各种实验结果共享得越快,防治方法就开发得越快。

人们惯用的传统期刊率先在速度上拖了后腿。”在疫情爆发期间,我们在维持同行评审和编辑过程的同时,尽量加快了进度……但我不认为这是一个可持续的模式,《新英格兰医学杂志》(NEJM)主编Eric Rubin说。据统计,NEJM每月会收到约 2000 篇COVID-19 的相关论文,但为了加快评审速度,只会接收其中的 2% 。

在生命科学领域,一篇研究论文从被接受到发表大约需要几十天到几个月的时间。即便奋力直追,这个周期也很难缩减到让人们满意的程度亚特兰大疾控中心(CDC)的生物学家 Michael Johansson 直言:“ 传统的评审方法太慢了 。”

图源环球科学
图源环球科学

而在预印本平台上,论文被免费上传,几天甚至几小时内就能通过审核。相关序列、数据集、观察结果和研究结果因此得以迅速共享,全球研究人员皆可获取、分析和利用。预印本平台成为研究人员的得力助手,并几乎同时进入了大众视线。

Covid-19爆发后的前10个月,全球共发表了约12.5万篇相关论文,其中有3万多篇是预印本。此外,根据Dimensions的估算,2020年有十分之一的预印本论文都与新冠有关,超过将近四分之一的预印本论文发布在medRxiv,而发布在medRxiv上的全部预印本论文,超过三分之二与新冠有关。

图源环球科学
图源环球科学

作为定位于健康科学领域研究成果分享的预印本平台,medRxiv在新冠疫情出现前半年才成立,如今已经是公认的关于新冠肺炎相关研究的主要平台。

medRxiv和biorxiv(老牌预印本平台)的联合创始人——Richard Sever坚信预印本加速了治疗方法的研究:“对这一疾病的了解越多、越快,就越有机会更快地研发出应对方法。”大量重要论文率先通过预印本平台发布。比如一项类固醇地塞米松的研究结果 ,它首次证明这种廉价且可广泛可用的药物可以降低新冠患者死亡的可能性,随后迅速被医生用于患者。而传统期刊的读者,在八个月后,才在印刷品上首次看到这篇论文。

预印本平台也并不拒绝对阴性结果(negative findings)的论文。在预印本平台上,它们被大量上传,供大家随意获取。其它研究者因此了解了哪些方法无效,为什么无效,从而跳过。

一个又一个推动性研究率先经由预印本平台发布,它的影响力也与日俱增。然而,与此同时,有人开始注意到,一个又一个“谣言”同样通过预印本散播。

2020年1月31日,在武汉宣布封城仅1周之后,印度理工学院德里分校的研究人员在bioRxiv上发表了一篇论文,称新型冠状病毒是人为改造的病毒,依据是其刺突蛋白S蛋白上含有四个插入片段,而这些片段与HIV-1的某些片段完全同源或具有相似性。

在研究者眼中,这样的论文错漏百出,但在大众层面,它的研究结论依然被广泛传播。虽然仅仅几天之后,它就被撤稿,甚至半个月后《Emerging Microbes & Infections》还专门刊登了一篇论文,分析COVID-19上这四个插入片段与hiv-1等其他基因的同源性,驳斥了人为改造“生化武器”这一观点,但与已经造成的舆论相比,其影响力范围已经微乎其微。时至今日,依然有人相信“病毒人为制造论”。

另一项被广泛报道的预印本,则试图估计加利福尼亚州圣克拉拉县已经感染新冠肺炎的人口比例。论文中对“一般人群的感染率高于任何之前计算”的论述,被用于支持“COVID-19只会导致极少死亡且不需要封锁”。这样的推论自然遭到了研究者们的严肃反驳。之后,BuzzFeed新闻又透露了该研究的资助者之一是一家航空公司巨头,它曾大力抗议新冠相关的出行限制。和之前的经验类似,舆论依然没有被挽回,甚至持续助推了华盛顿等地“抵制出行限制”的示威活动。

斯坦福大学生物工程与化学和系统生物学系助理教授 Stanley Qi感慨:“ 有时,一条错误的信息……可能会破坏10篇好的论文。”

如今,预印本平台又与造假扯上了关系。当然,在传统期刊中,人们几乎习惯了论文造假,但至少写论文的人还能保证“真实性”,而根据圣路易斯大学公共卫生博士Leslie McIntosh与人合著的文章《A Curious Case within Preprints: Is the Author Real?》,预印本平台的所谓研究者也可能是假的。

他们在调查中发现,在新冠疫情爆发之后的前12个月,有太多研究者成了COVID – 19领域的“专家”。他们在预印本平台上传诸多文章,发表的论文填满了ORCID(研究人员的唯一标识号)出版记录。当然,在2020年只发表关于COVID – 19的文章并不奇怪,但是如果研究者在COVID – 19之前很少或没有出版任何书,也没有在同行评议的期刊上发表过文章,身份又被标注为独立研究人员,就很奇怪了。

而对这些新晋“专家”,我们又很难“核实”。研究者只需要利用成熟的预印本平台发布论文获得DOI,然后注册一个ORCID账号,就能在虚拟世界得到背书,畅行于科研世界。而当他们借助论文发布量暴增的COVID-19研究完成这一流程时,造假成本被进一步降低。

于是,在COVID-19研究领域,预印本平台成功包揽了劣质的论文和劣质(甚至更为劣质)的研究者。

谣言的诞生与终结

有人分析,谣言如此容易借助预印本平台传播,最直接的原因是它提供了评论入口。

medRxiv、bioRxiv 等平台都允许用户将预印本分享至Twitter、 Facebook等社交媒体平台,并在分享之后对此发表评论,而这些评论也会出现在预印本平台上。

与此同时,未经同行评审的预印本既无法保证所提供信息的精准,也无法保证研究成果的可靠。新冠疫情期间,出于各种目的,不少缺乏严谨论证,甚至本就没有论证、只是为了博眼球的预印本批量出现。借助人们对新冠疫情的强烈关注,当它们被导向社交平台,谣言的散播就成了必然,“舆论风暴”触手可及。

当然,平台对此并非没有作为。medRxiv和bioRxiv先后在官网上线了对于大众媒体的转引提醒(“这些报告未经同行评议,不应被视为结论性的用以指导临床实践 / 健康相关行为,也不应作为既定事实在新闻媒体进行报道”),然而,它真正起到的作用,很难说与烟盒上的“吸烟有害健康”有什么不同,媒体对平台预印本内容的摘取或解读依然不绝。

medRxiv、bioRxiv还在2020年4月紧急上线了内容初筛措施,其筛查的范围限于“作者是否认真参与了研究”,不包括预印本的数据、结论等内容。但即便如此,受限于预印本平台的快捷要求,留给审查的时间算得上紧急:通常情况下,bioRxiv 的审查会在 48 小时内完成, medRxiv 则需要 4-5 天。

Richard Sever强调,审查过程主要用于识别论文内容是否包含对健康存在威胁的内容,而非评估质量。比如,一些论文称疫苗会导致自闭症,或是吸烟不会导致癌症,这些内容与现有的主流科学认识相悖,同时也不符合公共健康建议,便无法通过审核。

而因为大部分的推测性结论都是基于计算模型, bioRxiv甚至决定不再发表这类论文。这项规定被执行得十分彻底。美国波士顿东北大学的一位计算科学家在向bioRxiv 提交此类论文时就被拒绝了,还收到了明确回复:bioRxiv 将不再接受仅基于计算的新冠病毒治疗方法的预测文章。

2020年下半年,麻省理工学院出版社开始在线上发行一本名为《Rapid Reviews:COVID-19》 的开放获取期刊。这本新期刊不发表论文,专门用于发表针对新冠疫情预印本论文的评审意见。它的审核标准和Richard Sever用于预印本平台的十分类似,都是集中在可能会影响公共卫生决策、临床治疗和社会舆论的论文上。

虽然进行了种种努力,但我们依然很难说,预印本平台的谣言被杜绝了。因为除了源于劣质论文和劣质作者,很多所谓的“谣言”还出自非常严谨的研究。传统期刊或网站需付费或注册才能获取相关信息,而作为开放的学术成果展示平台,预印本平台没有此类限制,任何人无需注册账号和认证都可下载论文。而当新冠疫情导引着普通人浩浩荡荡涌入预印本平台,他们也就参与了此前仅限研究人员进行的专业内容解读。

钟南山团队曾在medRxiv 发布预印本《2019 年中国新型冠状病毒感染 的临床特征》,这篇论文首次收集了全国范围内新冠患者的数据,旨在为世界范围内的新冠肺炎研究者提供最全面的资料。然而,缺乏统计学常识的某网友却得出了“吸烟者感染率远低于非烟民”的结论,并发布到微信公众号上,最终推文被超过 10 万的人群阅读,并获得3万人点赞。

而根据石正丽教授发布于 bioRxiv 上的预印本,武汉的猫群也有被新冠病毒感染的风险,其中部分猫检测到了新冠病毒的存在。随后,一篇名为 《病毒所石正丽等发现,14.7% 的猫已感染新冠病毒!防控措施应做出改变》的文章在网络上刷屏,众多宠物猫因此被遗弃,有人甚至呼吁捕杀流浪猫。这逼得论文作者很快发表声明:有媒体或个人提到的 “猫群感染” 是误读,没有证据表明猫群大面积感染。

疫情期间,为了快速知晓研究进展,无数媒体将目光从传统期刊转向预印本平台(当然,传统期刊也闹了不少笑话),然后依据并不全面的解读为新闻取一个“标题党类”标题,从而斩获巨量点击。这当然是另一种推波助澜,更多的普通人因此被卷入洪流,成为这波循环的一分子,借助预印本平台,冲击着原本竖立着壁垒的专业知识。

如此的大环境下,机构与平台的努力皆是杯水车薪。想要彻底消灭谣言,杜绝造假,要么让疫情消失(祈祷!),要么让预印本平台回归专业人士的交流平台。事情的决定权就此来到媒体和大众手中,可是,无意中充当了“绑匪”的人们,知道如何“放手”吗?

参考资料

https://www.biorxiv.org/

https://www.medrxiv.org/

https://www.scientificamerican.com/article/arxiv-org-reaches-a-milestone-and-a-reckoning/

https://huanqiukexue.com/a/qianyan/shengwu__yixue/2021/0106/30953.html

https://figshare.com/articles/journal_contribution/A_Curious_Case_within_Preprints_Is_the_Author_Real_/14195387