400篇论文涉嫌抄袭,为什么大部分来自中国?(组图)

今年4月,法国图卢兹大学的计算机科学家Guillaume Cabanac等人发现,一些论文中作者有意回避已有的学术用语,而使用生造的同义词进行替换。对30个计算机短语的非学术同义词进行搜索后,他们发现有860多篇文章存在这样的问题,其中竟然有500多篇文章来自英文期刊《微处理器和微系统》。进一步的研究发现,这些论文如此反常的背后,大部分都可能存在学术不端。

毕竟,把“大数据”改为“庞大的数据”,不太可能是研究者不知情,更大的可能是混淆文本,避免查重。

Guillaume Cabanac等人7月12日将他们的发现和这些文章学术不端的证据,发表在预印本网站arxiv上,希望引起学术界更多的讨论。这一风波发酵到8月,已成为学术界较有影响的舆论事件。近期《自然》新闻(Nature News),作为学术界头部媒体,完整地将Guillaume Cabanac等人的看法和证据进行了转发,进一步将此事推向高潮。

GuillaumeCabanac等人在arxiv上公布了他们的发现和证据

针对这些情况,杂志的出版商爱思唯尔列出了在该期刊发表的400多篇可疑论文,并表示要对这些文章逐一进行“重新独立评估”。国内媒体也进行了跟踪报道,其中问题论文“大部分来自于中国”成了这些媒体标题中最刺眼的部分。中国的学术造假真的有这么严重吗?这次丑闻又会对中国科学家的学术声誉造成什么影响呢?

01

为何多数可疑论文来自中国作者

最初看到“大部分来自于中国”时,笔者是不愿意相信的。因为中国研究者虽然发生过“汉芯造假”、“基因编译婴儿”、“伪造博士证书当博后”等骇人听闻的学术丑闻,但总体还是相当正直的。

2019年同样是爱思唯尔针对强迫引用发起了大规模学术调查,通过对69000名论文审稿人进行追踪,爱思唯尔最终认定其中有0.1%的审稿人高度疑似强迫引用,表现可疑的总占比大约是0.8%。在这样的一个调查中,没有发现任何一个中国审稿人存在类似行为,足以说明中国科研从业者的操守,绝没有某些人想的那么差。

那为何这次多数的可疑论文会来自中国呢?直觉告诉我们,是否这本期刊的投稿者主要来自中国?是否这本期刊根本就是以学术不端为卖点呢?

可惜并不是这样,从种种角度看《微处理器和微系统》都显得十分正常,来自中国大陆的文章占比排名第二,但和后几个地区并没有很悬殊。国内给该期刊投稿的人员所属的机构也比较平均,并没有出现一家独大的情况。另一个尴尬的现实是,该杂志虽然并非什么权威的科研期刊,但确实在中科院评选出的高水平期刊的列表中。

该期刊主要投稿者所属的地区和机构(没有来自中国的机构)

问题出在哪?笔者注意到大部分可疑的文章都发表在该期刊的特刊上,而且时间大部分在今年早些时候。所谓的特刊,就是学术期刊针对某一主题发出邀约,研究者们在截止时间之前将与主题相关的稿件投给期刊,期刊进行评比并按照计划选用若干篇稿件和正刊同时进行刊发。

特刊稿件的审稿主要掌握在客座编辑(一般是与主编同等地位或该特刊主题领域内学有专精者)手中,不一定需要主编认可,很多时候也常常跳过同行评审就直接录用。

过去看特刊稿件的含金量,主要是看特刊的主题是否与学术相关,再就是特刊的客座编辑是否与多数投稿者存在需要回避的关系。一般而言,除了庆祝特刊(例如某大学成立若干周年特刊)或者给钱就能发的宣传特刊(一般是给民科的,尊重他们的“研究自由”),大部分特刊上的文章是和正刊同等看待的。

几十年来的学术发表实践证明,特刊是行之有效的。那些主题新颖或是社会急需的特刊,能够将尚不成熟的优秀研究内容征集出来,对后续研究者有明显的启发作用,从而带动一批高水平的研究。

因此,这次特刊出问题有其特殊的背景。首先是特刊的规模太大了,自2019年末特刊开始,到2021年第二季度结束的六期特刊甚至将整个杂志的发表量都明显拉高了,特刊收录的文章远超正刊。如此之高的收录量,必然导致文章泥沙俱下。

该期刊每一卷收录文章数量变化

另一个显著的变化是,从2019年末开始,《微处理器和微系统》的审稿时间具有统计学意义的缩短了,从审稿到录用的平均时间从202天,缩短到42天。

不同时期《微处理器和微系统》杂志审稿周期

显然这背后存在着一条利益链,学术不端的参与者、论文掮客、客座编辑和负责学术期刊运营的责任编辑都是利益链上的重要环节。负责期刊运营的编辑在利益驱使下,设立大而无当的特刊;客座编辑对存在的问题睁一只眼闭一只眼,甚至出卖自己的学术名誉;论文掮客在其中上下其手,充当了润滑剂的作用;学术不端的参与者自不必说,这样的行为是很难以无心之举掩饰过去的。

02

学术掮客已成为中国学术的重大威胁

学术不端,需要前述所说的四个环节共同配合,但是学术掮客是该事件的绝对核心,也是这次中国学术界灰头土脸的主要原因。没有学术掮客,期刊编辑与客座编辑进行利益勾兑的规模不会这么大。因为期刊编辑与客座编辑多数情况下不认识,建立利益共同体没有那么容易。

此外,学术特刊不可能在邀请公告上明显暗示此次特刊的主要目的是捞钱,甚至也不可能公开说收录量巨大,暗示通过会比较容易。在这样的前提下,苟且之徒想要钻营也很难找到门路。只有通过学术掮客,期刊编辑、客座编辑和学术不端的参与者才能串联起来。

显然这次参与者多数为中国人的原因在于这背后的学术掮客很可能是中国人。值得注意的是,疑似学术不端涉及的400多篇论文和上千位作者,没有向某些机构集中的趋势,也没有明显的地区分布差异。

说明这个由学术掮客组成的反科学共同体,已经足够壮大,摆脱了个人色彩,很可能是公开活动的。不要质疑学术掮客的胆量,因为他们利用了我国现行法律和管理的两个漏洞。

对于学术不端,近来各级管理部门的态度空前严厉,而且重拳频出。而对于破坏力更大学术掮客,没有有效的管理和打击措施。以至于某些掮客,甚至公开活动,严重败坏了学术风气。

8月20日,衡水中学校长的儿子被曝光试图“高考移民”未果,引发了舆论关于教育公平的争论。在整件事情中,“高考移民”“中介”在其中发挥的作用被忽视了,哪怕“西藏高考落户”的广告就打在衡水中学的对面。

衡水中学对面的“西藏高考落户”宣传广告

衡水中学校长是河北教育系统中高级干部,正因如此很难在公务繁忙之外,全面地了解支援西藏的政策和西藏地区的教育政策,从而作出自己援藏儿子改学籍的决策。如果存在“高考移民”掮客,该事件的发生就更加说得通了。

在看重公平的网络大环境下,“高考移民”只能悄悄进行,一旦被曝光,是一件很没面子的事。和“高考移民”的低调相比,“高考移民”掮客的作风简直可以大胆形容,学术不端与学术掮客的关系也是类似的。

中国的学术治理还存在另一个软肋,就是缺乏专业力量的参与,很多时候呈现出“法不责众”的迹象,进一步鼓励了学术掮客大规模造假。

需要指出的是,中国的学术纪律检查机构监督检查的范围在全世界都是比较广的,而且敢于做大规模调查,能够摆脱口水之争和门户之间,促进中国科研事业的进步。例如任何中国的学术期刊,不会存在无法撤稿,或者再大的社会关注都引发不了调查的情况。这也是中国学术圈,虽然有个别极端案例,但总体尤其是头部保持较好的原因。

但这种一事一议的处理方式,应对不了大规模学术造假。2018年哈佛终身教授Piero Anversa的“心肌干细胞修复心脏”被认定是造假,这意味着17年来该领域中无数学者自己骗自己,反复研究一个并不存在的自然现象。中文学术界也有不少跟风,甚至还有论文证明中药成分能有效帮助心肌干细胞再生,受影响的论文有几千篇之多。

并不存在的心肌干细胞修复心脏

这些论文中发表在欧洲学术杂志上的部分,尤其是高水平杂志上的那些,已经有相当部分被撤稿了。甚至连在微博上贩卖“干细胞”假药的链接,十个都消失了九个。但遗憾的是,多数中文的造假论文仍然没有被撤稿。

8月19日,国家卫健委一口气处罚了涉及九省十机构的二十七人,大部分涉及代写代投论文,购买论文数据及图片拼凑、篡改等问题。在笔者的记忆里,这是近20年来,一次性处理跨地域学术不端人数最多的一次。

27人被撤职、降级、取消申报和评价资格,不能说是力度不大。但和已经存在的,仅一个领域内就有的数千篇文献相比,还是显得太少太少。在目前的情况下,跨地域、跨机构、跨监管部门都要协调,甚至要采取一篇文章一个调查组的形式才能厘清。

在这样的情况下,监管成本和造假成本完全不成正比,更大规模学术造假的土壤依然存在。

事实上,论文抄袭和造假已经成为了世界性的问题。2014年《Science》杂志针对arXiv数据库中各国科学家的论文,进行了文本比对(类似于中国知网查重),制作了这样一个地图。

颜色的深浅代表疑似抄袭现象的多寡

研究中论文抄袭率最低的德国,抄袭率为3.23%,美国、日本、澳大利亚分别为4.74%、5.65%和5.89%。研究从另一个侧面说明这个世界的发展极不平衡,上面的地图中存在大量的灰色,表示该地区/国家没有采集到足够规模的出版信息。此外,发展中国家的抄袭率明显高于发达国家,抄袭率最低的巴西也有将近8%。中国的抄袭率在发展中国家中仅高于巴西,为10.8%。

发达国家的抄袭率低,并非是由于他们道德高尚。而是这些国家的科学工作者虽然保持着较高的社会地位,但在经济上并不令人羡慕,因而造假动机小一些。此外,这些国家教授的岗位规模可以用非常稳定来形容,下一任教授的竞争多在师兄弟之间,互相监督学术不端是非常重要的竞争手段,也限制了学术造假。而发展中国家的一个教授退休后,可能增加不止一个教授岗位,因而熟人竞争就小了很多。

发达国家的学术界并没有太大的动力改革这套漏洞百出的学术出版机制,发展中国家的学者却不得不重视这些期刊。学术不端者、跨洋掮客和海外期刊构成了坚固的利益的结,很难被发展中国家斩断。

未来的根本改变,或许就要靠中文学术期刊“支棱起来”,重塑这套不合理的出版机制。在此之前,更加长效和更加常态的学术道德建设依然不可或缺的。

推荐阅读