Turnitin论文查重系统是全球广泛使用的学术不端检测工具,根据使用地区和检测需求的不同,分为国际版、UK版和国际版+AI。帮助教师和学生检测论文中的抄袭内容和AI生成内容。上文分析了查重原理,那么它的AI检测原理又是什么呢?
一、Turnitin AI率检测原理
Turnitin国际版+AI的AI率检测是依托Transformer架构等深度学习技术,通过分析文本的语言特征、统计规律等差异来区分人机创作内容,最终生成量化的AI生成比例报告。
具体AI率检测原理可分为以下几个步骤:
1、文本分段处理
上传论文后,系统会先将文本拆分成多个小型文本片段或句子,这样系统能够结合上下文精准分析每个部分的内容,还可以避免因全文整体分析导致的特征混淆,为解析文本规律和评分打下基础。
2、解析文本规律
文本分段后,系统会分析文本中的词汇序列概率、语言风格特征等。AI生成文本因训练于海量数据集,词汇间的衔接更具规律性,下一个词汇的预测概率相对固定。而人类写作往往带有个人表达习惯,会有语序调整、用词偏好、情感倾向或个性化观点表达等特征,词汇序列与语言风格特征的不可预测性也更强。
3、逐段评分
通过文本规律解析,系统会对每个拆分后的片段或句子进行0-1分的量化评分。从下图可以看出,0.3-0.4不会被标记,0.6有AI的口吻也不会被标记,超过0.6就会被标记为AI生成。
4、生成最终结果
完成评分后,系统会对所有片段的分数进行汇总计算,最终生成AI率报告。

二、TurnitinAI率报告解读
TurnitinAI写作检测模型准确率虽高,但还是可能会出现误判和保护学生原则,出具的AI率报告有以下三种情况。

显示为0%:这并不代表没有一个AI词,而是Turnitin出于谨慎,将置信度低于20%的结果统一显示为0%,以避免过度恐慌。
显示为*%:当系统判断存在较高的误报可能性时,就会选择不显示具体数字,这是对你的一种保护。
显示为≥20%的具体数字(如46%):这就意味着系统以很高的置信度判断文中存在相当比例的AI生成内容。

蓝色内容:由大型语言模型生成的AI文本。
紫色内容:使用AI转述工具或文字改写工具修改过的AI生成文本。

