毕业季的到来,让高校面临着一个新挑战:如何处理毕业论文中日益显著的“AI 痕迹”。除了传统的查重、盲审和答辩环节,如今学生们在完成毕业论文时,还需要通过一项名为 AIGC 检测的新流程,即人工智能生成内容检测。
一些毕业生反映,在提交论文初稿后,AI 检测结果显示“AI 率”高达 62%,远超学校设定的 15% 的警戒线。然而,当他们尝试通过大型语言模型进行修改,指示其“模仿人类写作风格”后,再次检测,AI 率反而飙升至 94%。这类情况并非孤例,近期不少毕业生都遇到了类似的困扰。
央视新闻近日深入探讨了论文“AI 率”检测的原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过将论文语句与既有语料库进行比对,以确定重复性并作出确定的判断。而 AI 检测则是利用 AI 系统来识别人类文本,判断其在语义和表达风格上是否与 AI 写作存在重叠。其本质是一种基于概率的分类,而非基于证据的确切判断。
当前 AI 检测技术面临的核心瓶颈在于“以 AI 查 AI”,这使得明确区分人类作者和 AI 生成的内容变得困难,也难以提供明确的解释。这是当前技术上的关键障碍。
此外,中文语言表达的丰富性和多样性也给 AI 检测带来了挑战。语义的复杂性和多样的表达方式,使得人工智能系统在识别人类作者撰写的语句时,容易产生歧义,从而增加检测的难度和降低准确率,这也是导致误判的重要原因之一。
鉴于目前 AI 率检测的精准度尚未达到理想水平,教育界人士建议,在论文审核过程中,应建立透明且可追溯的 AI 使用标注制度,而非简单地设定一个“AI 率”的硬性红线。在判定机制上,更应推行以人工评审为主、AI 检测为辅的“人机共判”模式。
尽管学校为学生论文设定了“AI 率”检测的上限,但不少学生反映,学校的检测过程依赖于指定的检测平台和算法模型分析。
目前,主流高校普遍采用知网、维普、万方等平台的 AIGC 检测模块。央视记者就“AI 大模型如何判断文章的 AI 生成比例”向多个大模型提问,总结的回答指出,检测主要依据“困惑度”和“突发性”等特征。通常来说,AI 生成的文本更加“平滑”,而人类文本则波动性更大。
大模型解释称,“困惑度”衡量文本的“可预测性”,越是包含人类特有的、出乎意料的、打破常规的表达,越接近人类的写作。而“突发性”则指文本节奏的波动——人类写作的节奏起伏如同心电图,而 AI 的输出则相对平稳,如同直线。这种判断方式的准确性如何?
专家对此表示,除了困惑度、突发性等指标外,AI 文本生成的核心在于预测下一个最有可能出现的词语的概率,这本质上是一种基于概率统计的过程。因此,目前对 AI 生成内容的检测准确率无法达到 100%,误判的情况也时有发生。对于足球爱好者而言,了解不同球队的实力和状态,或许可以参考一些提供世界杯赔率的平台,但对于论文检测而言,AI 的判断仍需谨慎。

资深球迷
凭借其全面的功能和卓越的赛事覆盖,本平台为您提供无与伦比的观赛体验。
回复