首先要了解不同的当前高校中常用的查重系统有知网、维普、万方,gocheck。
知网的查重系统在不同的段落中有一个查重的阙值为5%,在根据当前查重的段落以连续13字符相似就会标红。主要知网在正文中所引用的文字,也会算在重复率之中。
而万方(gocheck)的查重是以基于关键词的算法,通过分析待检测文章中的关键词在查重文献库中的出现频率来判断文章是否存在抄袭。GoCheck查重系统会将待检测文章中的关键词与查重文献库中的词汇进行匹配,如果匹配到相同的关键词,则认为文章可能存在抄袭。
维普查重原理:维普查重系统采用多级指纹比对技术,通过对待检测文章进行分句、分段落、分章节等多级处理,提取出文章的特征指纹。然后将提取到的特征指纹与查重文献库中的指纹进行比对,如果存在相同的指纹,则认为文章可能存在抄袭。维普查重系统还会结合语义分析技术,对文章进行深度语义分析,以提高查重的准确性。
目前所了解的是万方能够检测出您个人所进行检测的文章是人工编写还是采用智能的机器进行生成的。常见的鉴别方式如下:
可以查看文章中是否存在大量的语法错误和逻辑错误,以及是否存在大量的重复内容。此外,您还可以查看文章中是否存在大量的图表和图片,以及是否存在大量的数据和数字。如果文章中存在这些问题,那么很可能是机器编写的文章。
gocheck查重原理:按照关键字以及语义,改起来也是很伤脑筋的。
注意:有时候机器处理的时候,会将实现的部分描述,采用相同的方式进行,如,在某个片段中“在这个位置”,进行断句的修改,并且对于重复性质的关键词进行调整。