中国学者举报IBM团队剽窃 相关方回应:启动调查

因为接连爆出抄袭事件,计算机视觉领域的顶会——CVPR 22(2022年国际计算机视觉与模式识别会议)近日出圈了。

6月24日,有爆料者扮演作者,在社交平台发布了一段搞怪视频,“自曝”其论文抄袭十多篇文章,有些抄袭段落甚至一字不差,并逐一“@”原作作者“致谢”。这一通神操作,把这篇CVPR 22优秀论文的操刀者——首尔大学AI研究团队掀了个底朝天。

紧接着,6月25日,中国学者齐宪标在网络社区发帖,指控IBM苏黎世研究院一个研究小组一篇被CVPR 22会议接收的论文抄袭,对方重新包装了他们于2021年参加的一项竞赛的完整idea。讽刺的是,这项竞赛的主办方正是IBM自己。

严肃的学术顶会秒变“吃瓜现场”,投稿量大、审核不严、伦理审查机制不健全等等,或许都是原因。但计算机视觉圈内人士在接受《中国科学报》采访表示,抄袭事件的曝出“只不过是CV圈‘内卷’的一个缩影”,并感叹“一个领域太火,可能并不是好事”。


中国学者举报国外团队“剽窃idea”



现供职于南方一创新型研究机构的齐宪标,经好友提醒发现,自己的论文被抄袭了。这篇抄袭论文已被CVPR 22接收、发表。

他于6月25日在知乎发帖,直指IBM苏黎世研究院一个研究小组,抄袭了他在2021年尚在平安VC Group团队参加ICDAR 2021(文档分析与识别国际会议,系光学文字识别领域的旗舰国际会议)大赛的成果。

齐宪标认为,IBM的研究小组抄袭了他们关于表格识别的包括方法论、网络结构、数据处理方式(包括预处理和后处理)、源代码、可视化方法以及他们在实现中的几个小技巧在内的几乎“整个复杂的系统”,但却并未在文献引用部分作任何标注。


齐宪标在知乎揭发IBM苏黎世研究院的抄袭行为



“这简直是一个笑话,我们参加了由IBM主办的ICDAR2021竞赛,但我们的论文却被另一群IBM员工剽窃了。”齐宪标在接受《中国科学报》独家专访时说,去年他们为了ICDAR 2021比赛,团队成员连续七八个周末都在公司奋战,“我们付出的汗水不应该被这帮抄袭者抹杀”。

齐宪标告诉记者,去年上半年,他带领团队参加了这项赛事的5项竞赛,被抄袭的论文拿到了表格识别赛道的第二名成绩。之后,他们于6月份将此项参赛成果形成论文,并上传至arXiv平台。

不过,齐宪标认为对方抄袭得非常“高明”:“他们并不是在论文文本上照搬,而是剽窃了我们的整个idea,再用他们方式做一遍包装,不是同行很可能都看不出来。”

抄袭团队则是来自IBM苏黎世研究院的Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak和Peter Staar等人。齐宪标说:“他们把最精华的idea吃干抹净,然后把文章改头换面发在了CVPR会议的论文集上。”

盛怒之下,齐宪标分别向CVPR大会程序委员会主席、IBM负责人工智能的副总裁写了举报邮件,并且将该事件的原委发布在Reddit网站和知乎上,并引起了轩然大波。

网络发酵的热度超出了齐宪标的预期。但他直言“并不图名也不争利”,“只是想在学术上讨还一个公道”。

“如果把别人的论文换一个写法就能发在CVPR上,那我们还苦兮兮地搞什么创新?”齐宪标对《中国科学报》说:“当时我们把文章发表在arXiv平台、在GitHub上开放源代码,是用来帮助领域发展、造福社区的,不是让这些抄袭者拿去污染整个学术圈的。”

在发给CVPR大会主席的邮件最后,齐宪标写道:“考虑到如此多的抄袭,我呼吁每个顶级会议都应该成立伦理委员会,以对学术不端行为做伦理审查。”

对于齐宪标的举报,有人认为确系“实锤抄袭”,有人觉得最好还是“让子弹飞一会儿”。

“我是做表格识别这个方向的,第一眼就怀疑是抄的了。”在齐宪标的帖文下,化名为“内卷人”的一位同行表示:齐宪标参赛方案他有深入了解过,代码从头到尾都看过一遍,“个人意见可以说是锤死了属于抄袭”。

在看过齐宪标的举报信和举证后,一位在线教育科技公司的技术专家告诉《中国科学报》,“抄袭的可能性很大,但现在还不好下定论。”他表示,这件事既然已经投诉到了CVPR组委会,那么最好等一下正规程序再确认结果,“仅凭一面之词去评判是不负责任的”。

另一位受访专家则认为,在当前大热的CV小圈子里,抄袭和借鉴的界限也很模糊,如果不是细致到同一个方向上的,可能都难以甄别。



韩国一作自认抄袭,队友纷纷“甩锅”



无独有偶,在本届CVPR 22会议上,另一起论文抄袭事件激起了学术圈轩然大波。

6月24日,名为“E2V-SDE(Parody)”的网友在YouTube发布一段7分16秒的视频,“自爆”其被CVPR 22接收的论文抄袭“缝合”了10多篇文章,并展示了具体抄袭片段。该视频发布后不久,播放量就突破了10万。

被指抄袭的论文还入选了Oral(口头报告论文),即CVPR前4%的优秀论文,论文的6位作者来自首尔大学和韩国科学技术研究院。

值得注意的是,作为论文通讯作者的首尔大学AI研究所教授尹盛老,是韩国AI领域的权威专家,曾担任韩国总统直属第四次工业革命委员会委员长,不久前刚被韩国教育科学技术部选为“首席研究员”;论文另外一位作者,还被网友指认为韩国科学技术信息通讯部(科技部)长官李宗昊的子女。

被指抄袭的片段涉及论文Method、 Introduction、Preliminaries等不同章节,以2019年加拿大多伦多大学的论文为例,首尔大学团队发表的论文有些句子甚至完全照搬。

爆料人随后还在推特上发布了曝光视频,并挨个“@”被抄袭的作者以示“感谢”。



图:爆料者的“感谢信”



视频播出不到一天,CVPR 官方就回应称,首尔大学的这篇论文已提交电气电子工程师学会(IEEE)进行调查,并撤回该论文。

论文第一作者金钟万(Jongwan Kim)也在推特跟帖回应称,论文的错误都是自己造成的,“我同意剽窃是绝对不可原谅的,我将接受任何纪律处分,没有任何借口。”


论文第一作者金钟万回应

事件被曝光后,该论文的其他作者纷纷自保、“甩锅”。

论文共同作者Byunggook Na跟帖回应称:“我为这件荒唐的事道歉。作为论文合作者,我应该检查论文的剽窃。虽然我完全没有想到第一作者的抄袭行为,但我深感自己有责任。”

尹盛老也通过推特进行了回应,他表示此前并不知道论文的抄袭行为,“在任何情况下都不应允许抄袭,我不知道如何为这个案子道歉。”

对于队友的“甩锅”行为,人们并不买账。

“发生这种事情,足见论文的导师没有进行论文的细致修改。”阿里达摩院算法专家王丕超觉得,论文合作者不了解甚至不看论文显然说不过去。

丑闻之下,韩国国内学术圈沸反盈天。不少韩国科研人员纷纷通过各种渠道发声谴责“像垃圾一样的行为,给其他研究人员的努力泼冷水”,要求“相关单位能够严肃处理这件事情”。在韩国舆论场,人们担心这次事件可能会发酵为第二起“黄禹锡事件”。



IEEE回应:已启动调查

不同于韩国AI团队抄袭事件基本已有定论,齐宪标的举报还需要等待结果。

齐宪标告诉《中国科学报》,6月30日上午,CVPR大会的程序委员会主席回信给他们,表示已经关切到他所举报的事由,并已将涉嫌抄袭论文移交给IEEE作进一步调查。

IEEE计算机协会内容质量保障经理Jennifer Carruth也随后致信给他,表示“已对此指控开展调查”。

“我被告知‘一旦有了调查结果,就会告知您’,但这个调查肯定需要一段时间的。”齐宪标对记者说。他还称,截至目前,IBM及IBM苏黎世研究院尚未就其举报作任何回应。

接连出现抄袭事件引得网友调侃,负有盛名的顶会CVPR成了“Ctr+C、Ctr+V、Plagiarism、Replication”(复制、粘贴、抄袭、重复)。有人不禁发问:CVPR难道没有查重吗?

“CVPR知名度太高,现在投稿量太大,什么样的投稿人都有,审稿人水平也参差不齐。”王丕超告诉《中国科学报》:“这种会议我感觉都要靠学术道德。希望通过这些事情能够更加规范化投稿吧,曝光出来也算是好事。”

数字显示,2022年的CVPR会议的投稿量达到8161份,共有2064篇论文被接收,接收率为25.28%;在被接收的论文中,有342份被选为Oral论文。

“CVPR Oral抄袭这个事情只不过是计算机视觉(CV)圈‘内卷’的一个缩影。”自动识别和数据捕获领域技术专家、视拓云执行董事刘昕说,放眼CV圈,idea互相撞车、相似、移花接木的事情不少,只是大部分没有被曝光出来罢了。“由此可见,一个领域太火,可能并不是好事。”



相关论文信息:

https://arxiv.org/abs/2206.07578

https://arxiv.org/pdf/2105.01848.pdf

推荐阅读