开云·体育 耿同学,一个退学博士是怎么用AI降维打击学术圈的?

2026年的春夏之交,中国粹术圈和文体圈接连经历了两场“地震”。
学术圈的震中,是一个叫“耿同学讲故事”的B站up主。36天时分里,他运动实名举报了5位985高校院长级学者的论文作秀,被点名的无一例外王人是手合手国度特出后生科学基金和“长江学者”等头衔的资深学者。

文体圈的震中,是一个叫“抒怀的丛林”的粗拙网友。从2024年10月初始,他用一字一句的文本对比,一年多时天职点名了近40位作者涉嫌抄袭——从86岁的杨本芬,到贾平凹、贾淡淡父女,再到蒋方舟等中生代与后生作者,隐敝文学界老中青三代。
一个是生物医学退学博士,一个是粗拙念书东谈主;一个用的是AI图片查重和统计学器具,一个靠的是肉眼比对和查重软件。两个粗拙东谈主,凭着各自的“火器”,正在撼动两个领域的巨擘。
这听起来像是两个“愤青”打假的故事。但仔细一想,这里面还有更多值得念念考的场所,那便是AI期间的到来,当粗拙东谈主也能使用工夫器具,监督权不再是少数东谈主的特权,正在交还给每一个会使用器具的东谈主。
诚然,更深层的问题是,当一个体系需要靠一个退学博士来纠错时,到底该从哪些方面来改良?

打假门槛低了
这场风暴最让东谈主畏缩的场所,不是耿同学有多利害,而是他用的设施果然特别地“低门槛”。
在中国粹术圈,过往的学术打假是极少数东谈主的能耐。要么你是同领域学者,要么得像饶毅那样有学界影响又有揭露问题的勇气,粗拙东谈主连Nature这种期刊的著作王人偶然能统统读懂,更别提找出数据作秀的印迹了。作秀者占尽了统共低廉,专科壁垒让新手东谈主无从下手,学术共同体的“熟东谈主社会”让内行东谈主睁一只眼闭一只眼,期刊审稿东谈主时分元气心灵有限只可基于信任评审。这三个门槛对粗拙东谈主来说太高了,也因此让作秀经久是一种“低老本、高呈文”的选定。

而耿同学的吩咐和统共东谈主王人不一样。他不跟你商酌高妙的生物学机制,不需要在Nature发过论文才有经历质疑你。他的火器是AI援助的图片和数据查重工夫。
他的操作设施被工夫圈拆解过,中枢经过其实只消三步:把一篇论文的PDF拆成文本、表格和图片,再把数据交给AI作念审查。
具体来说,他要点查验三个场所:
第一,看数据末余数字散播是否过于衔尾。信得过的实验数据因为测量差错的存在,极少点后一位乃至两位应该是随即散播的,而作秀数据则会出现广阔“5”“0”或某个数字统统隐藏的情况。
第二,看不同量表之间的数据有莫得重复。比如基因抒发量的数据序列和肿瘤体积的数据序列,本该绝不相干的实验却出现了几个数值统统沟通。
第三,用视觉大模子查验图片有莫得被调动或重复使用。
耿同学我方有一句话说得极妙,在揭露中山大学邝栋明的论文作秀时,他说:“这不仅是学术界的抑遏,更是作秀界的抑遏。连随即数生成器王人不会用的东谈主,也配学术作秀?”
数据作秀被发现,根本原因时常不是作秀者工夫太差,而是太迷糊。中山大学康铁邦论文中被质疑的实验图片,被网友描画为“像是从不同论文里径直复制粘贴的”。上海大学苏佳灿的论文数据中,一组数据径直呈等差数列,“东谈主为诬捏印迹解析”。就连同济大学王平的那篇Nature论文,196只小鼠的体重数据中也出现了一只末位为“0”的离群值,这在统计学上是极不当然的。
耿同学对此的空洞异常直白:“诬捏者致使莫得花心念念和时分去作念一组随即数据,而是统统予求予取地东谈主为乱填。如果精心去编,其实我是看不出来的。”
这恰巧确认工夫逼出了作秀者的信得过水平。一个在作秀时王人不肯意花心念念的东谈主,足以确认在这个生态里,作秀还是成了一种旧例操作,莫得东谈主以为会被发现。
践诺上,耿同学只不外是把学术争议从学术辩白降维成了数据判断题。他莫得和你去争论学科里面的那些高妙的常识,仅仅从大多数只需要有一定不雅察与推理才能就不错发现的问题问你:
这组数据的末位散播相宜统计学轨则吗?这两张图片相似度是些许?这组数据有莫得在其他表格中出现过?
这些王人是不错用算法往来答的,何况谜底只消“是”或“否”,莫得任何灰色地带。
不得不说,耿同学这套吩咐还是成了可复制的、东谈主东谈主王人能掌合手的器具,只若是有心东谈主王人不错试试。


文体圈的回响
如果说耿同学的故事是“工夫赋能”的初版块,那么“抒怀的丛林”的故事便是第二版块——它相通印证了工夫正在把监督权从中心推向边际,只不外用的是另一种器具。
抒怀的丛林是谁?从公开信息来看,他是一位粗拙的念书博主。从2024年10月初始,他不绝公开了数十位作者已出书作品中与其他作者相似的部分语句和段落,激勉公论剧震。
他在一次采访中坦陈:“我从0东谈主关注初始发帖,很少下判断,只呈现文本对比。直到今天,我更多的也仅仅展示事实自己,将判息交给看帖子的东谈主。”
以前界定抄袭,需要人人主见,需要法律法子,需要广阔的专科辩白。而面前,抒怀的丛林只用了最基础的“文本比对”——这是任何一个识字的东谈主、会使用搜索引擎的东谈主王人能孤立完成的。
比如,开云kaiyun(中国)他把贾平凹的《三十未立》和好意思国作者华盛顿·欧文《英国的农村生计》比肩排在一谈,让读者看到两段翰墨的确统统沟通,这么通俗的工夫器具就不错让传统上依赖人人巨擘才能作念的事情,形成了任何东谈主王人能参与的“判断题”。
在这一丝上,耿同学和抒怀的丛林是同归殊涂的,一个靠的是AI图片比对和统计学分析,把高妙的学术论文形成了数据题;另一个靠的是文本比对和互联网搜索,把微辞的抄袭争议形成了直不雅对照。
抒怀的丛林濒临“你是不是为了流量”的质疑时的答复相通值得试吃。他说:“我无法拦阻别东谈主的质疑,致使接待别东谈主的质疑,但全球凡事不要代入尽头,以己度东谈主,流于诛心之论。讲话尽量有理有据,至少我我方是这么条款我方的。你质疑的,有根据吗?”
用凭据谈话,正人论迹不管心,当凭据满盈明晰,动机就成了无关变量。


风暴背后
工夫的发展让粗拙东谈主领有了质疑巨擘的才能,好多东谈主把这称为“工夫平权”,工夫赋予了粗拙东谈主挑战巨擘的才能,这是积极的一面。但这场风暴另一个值得深念念的问题是:为什么“耿同学”和“抒怀的丛林”作念的,本该是体制自己应该作念的事?
耿同学本东谈主对此有一个异常坦率的不雅察:“这段时分作念打假以来,莫得任何一篇问题论文,是官方我方去找出来的。这是迄今限制让我感到最失望的一丝。”
他公开承认,我方发布的每一篇作秀论文,“王人不是我我方闲着没事去扒拉的,而是我意志的一又友不详温雅网友先发现了,再转发给我的”。也便是说,发现问题的东谈主,根柢不是那些本该在审核机制里把关的东谈主。
抒怀的丛林也遭逢了相通的表象——被点名的近40位作者,除了86岁的杨本芬发文致歉,绝大多数选定千里默。学术圈也的确是统一个脚本:除了饶毅等极少数东谈主发声,那些平日活跃的院长们、杰青们集体千里默。没东谈主说这辱骂解,因为凭据就在哪里;也没东谈主否定,因为承认就等于承认我方和他们是一伙的。
在一个健康的社会里,学术论文有莫得问题,理当由学术共同体的里面审核机制来保险;文体作品是否抄袭,理当由出书行业自律和作者诚信来维系。但面前,这些本该由体制完成的事情,却要依靠两个“志愿者”用业余时分来完成,这是远远不够的。
耿同学的视频火了后,同济大学的王平还是被免去院长职务,裁汰专科工夫岗亭品级两级,涉事论文第一作者被拆除聘请关系。南开大学、中山大学、上海大学王人已竖立访问组。
5月17日,耿同学再次发布视频,喊话四所高校的五位“杰青”,条款他们先自查整改,不然将再次举报。据他表示,这几篇被质疑的论文均波及Nature正刊或子刊。他对《三联生计周刊》表示,第一条打假视频发出后,他还是收到超越100条打假举报。
也便是说,咱们面前看到的,可能仅仅冰山一角。
关于这场风暴,咱们不可停步于揪出几个作秀者,它应该催生更深层的变革,比如监督机制的当代化,Nature出书社母公司在2025年就还是初始用AI作念论文审查,没错,便是用AI来查作秀。事实阐扬,其实基础的审查工夫有设想还是很练习了,统计学进修、AI图片比对、数据查重,哪一样是今天的工夫作念不到的?问题不在于“能不可作念”,而在于“愿不肯意作念”。
又比如,现时的科研评价体系是不是需要变革了,当论文数目、技俩经费、东谈主才“帽子”与资源分拨深度绑定时,学术就容易被异化成一场“绩效竞赛”,好多作秀也便是这么来的,毕竟这些作秀的背后王人是利益。
工夫赋予每一个粗拙东谈主以力量,但工夫长期不可替代轨制。耿同学和抒怀的丛林仅仅抛出问题的揭盖子的东谈主,他们扔下的雷,临了还要由体制自己来接。
但这一次,咱们再也无法假装看不见了,因为AI期间来了,你不错赓续作秀,但你要濒临的不再是一个博主的质疑,而是全寰宇无数东谈主的AI器具;你不错赓续抄袭,但你要濒临的不再是几个人人的评判,而是全网任何东谈主王人能参与的“文本比对”。在你作秀的时候,你就应该问问我方,你简直采纳得了这种扫视吗?
作者:梁云风开云·体育