美国宾夕法尼亚大学生物工程副教授阿荣·拉杰(Arjun Raj)早在2012年就指出,一篇生命科学领域的研究论文背后的科学成本约为30万-50万美元。2012年全年,美国研究人员共发表该领域论文15.2万篇。如果其中1.7%因图片造假需要被撤回,则仅在2012年,因此造成的损失就接近10亿美元。根据出版机构的统计,全球科学产量每9年就会翻番。过去,图片审核工作往往要靠人力完成,几乎没有自动化的流程。《自然》(Nature)杂志会对收到的稿件随机抽样进行检查,并要求作者提供未编辑的图像作参考;生命科学领域的重要刊物《细胞生物学杂志》(Journal of Cell Biology)和《欧洲分子生物学组织杂志》(The EMBO Journal)会对图片进行手动查重。2018年6月,来自斯坦福大学的微生物学家分析了2009-2016年发表在《分子与细胞生物学》(Molecular and Cellular Biology)上的960篇论文,发现其中59篇含有“不适当的”重复图像,约有2%值得再去进行图像证伪。他们将情况反映给出版机构后,42篇论文更正了图片,5篇被撤稿。图片查重费时费力,以至于多数刊物都没有这项流程。《欧洲分子生物学组织杂志》主编表示,人工筛选非常耗时,早就应该有一个常规的、自动化的工具简化这一过程。美国诚信研究办公室(the United States Office of Research Integrity, 简称ORI)的数据显示,图片造假的情况一直在恶化,标志性的两个时间是1990年和1996年,Photoshop的Mac版和PC版在这两年发布。但即使是ORI,每年也仅报告了10例图片造假的行为。因为成本过高,他们不会主动审查学术不端,仅在有举报的情况下进行。自诞生起,学术论文就承担着描述科研成果、进行学术交流的重任。它还被用来衡量学者的学术水平,是评定职称、获取科研经费等环节中考察的重要的内容。因此,判断一篇学术论文是否由抄袭、造假得来至关重要。在计算机技术不够发达、数据库尚未开放共享的时代,识别学术不端不得不依靠评审编辑慧眼如炬。在中国,论文文字查重体系一直到2005年前后才建立。后来,人们又不断优化这个系统,从能识别“复制粘贴型”抄袭,到能识别改变用词和句法的抄袭,但图片重复一直是论文查重的死角。道高一尺,魔高一丈,心怀不轨的研究人员已经学会了应付能识别文字抄袭的系统。在生命科学等依赖图像实物的研究领域,图片造假的难度和成本会更高。