文章查重率
簡(jiǎn)述:
正文:
文章查重率在知網(wǎng)論文檢測(cè)系統(tǒng)中是什么計(jì)算的呢?對(duì)于知網(wǎng)論文查重的檢測(cè)原理很多人都很是好奇,而我們知網(wǎng)論文查重報(bào)告中的文章查重率是怎么來(lái)的呢?本文今天就來(lái)為大家講講文章查重率的來(lái)源。
眾所周知,論文查重大多都使用知網(wǎng)查重,而實(shí)際上,知網(wǎng)查重的原理概括起來(lái)也并不是特別復(fù)雜,論文檢測(cè)過(guò)程中,首先會(huì)對(duì)檢測(cè)論文進(jìn)行通篇掃描,之后將論文內(nèi)容根據(jù)論文目錄進(jìn)行段落分段,接著對(duì)段落中的句子進(jìn)行拆分,如一句或幾個(gè)詞作為最小檢測(cè)單位,并依次將這些內(nèi)容與數(shù)據(jù)庫(kù)中的文獻(xiàn)進(jìn)行對(duì)比,若檢測(cè)到存在連續(xù)6-7個(gè)漢字相同或極度相似的情況則該最小檢測(cè)單位則被標(biāo)紅并即為重復(fù),而最終統(tǒng)計(jì)出全文中被檢測(cè)到重復(fù)的字?jǐn)?shù)與全文字?jǐn)?shù)的占比,而這個(gè)比值便是文章全文查重率。
通過(guò)上面介紹,我們可以知道,文章查重率=論文抄襲字?jǐn)?shù)/文章總字?jǐn)?shù)。從論文查重報(bào)告中的“單篇最大文字查重比”的參考數(shù)據(jù)中,可以清晰地查看到紅色標(biāo)注的“重復(fù)字?jǐn)?shù)”和“總字?jǐn)?shù)”。而通常文章查重率的在查重報(bào)告中也會(huì)給出。
此外,對(duì)于文章查重率,在論文提交到知網(wǎng)查重系統(tǒng)中的時(shí)候需要格外注意提交文檔的文本格式。知網(wǎng)查重系統(tǒng)可以識(shí)別PDF格式和WORD格式,由于pdf格式相比word的格式,多了一個(gè)文本轉(zhuǎn)換,因此可能導(dǎo)致目錄、參考文獻(xiàn)的格式變成系統(tǒng)不識(shí)別的正確格式,從而使查重比例升高。