集群網(wǎng)站建設—搜索引擎如何區(qū)分原創(chuàng)內(nèi)容?
.jpg)
1、對文章的內(nèi)容進行分析比較
首先從搜索引擎角度去考慮:
用戶在做偽原創(chuàng)的時候,會經(jīng)常用到的方法有:
(1)刪除部分內(nèi)容
(2)添加部分內(nèi)容。在復制過來的文章里添加上兩句,或是把多篇文章合在一起。
(3)調(diào)換內(nèi)容順序。把原文1.A,2.B,3.C,4.D,5.E 改成 1.C,2.B,3.E,4.A,5. D
用分詞技術(shù)后對相關的內(nèi)容進行比較,分析項目有:
(1)字數(shù)大小
(2)幾個關鍵字出現(xiàn)頻率
(3)文中任幾句話
(4)鏈接
程序分析過程:
如果 (字數(shù)大小一樣)并且(幾個關鍵字出現(xiàn)頻率一樣)并且(文中任幾句話一樣)并且(鏈接指向與本文有90%以上的相似度的文章)
或者 文中任5句(長短不一,可能是5-30個字)以上的話是一致的
那么 判定為抄襲或偽原創(chuàng)。
由上面的程序分析過程中,可以看出:簡單的刪除內(nèi)容、添加合并部分內(nèi)容、調(diào)換內(nèi)容順序、段落順序并不能讓搜索引擎當做原創(chuàng)。為什么?因為用如上簡單的的方法就可以看出大概了。字數(shù)大小、幾個關鍵字出現(xiàn)頻率、鏈接這都好辦,文中任幾句話對比這就不好辦了。
2、標題
如果是一樣的,那很有可能是復制,但要是改了一下標題呢,如把《成都租車常識》改成《教您怎樣在成都租車》,意思沒變,文字變了。所以,不能僅靠標題來判斷是不是原創(chuàng)。但可以做以下分析:
因為搜索引擎的數(shù)據(jù)量實在太大,不可能對所有的內(nèi)容進行遂一的結(jié)比,而是同樣是使用“分詞“技術(shù):
(1)如果搜索引擎蛛蛛訪問的頁面是一個新的頁面,那么,它將先把這個頁面內(nèi)容收集起來,放入一個數(shù)據(jù)庫(或是其它),等其它程序如專門對比內(nèi)容是不是原創(chuàng)、是不是有價值的程序進行處理。這時候,這個內(nèi)容將不會被搜索出來。
(2)分析內(nèi)容。也是利用了分詞技術(shù),對標題、內(nèi)容等進行分析。得出了這個頁面的主要內(nèi)容。如《周杰倫2010年專輯》這樣的篇文章時,它將與包括”周杰倫“、”2010“、”專輯“這樣的關鍵詞的文章進行比較,而不用與所有的網(wǎng)頁進行比較。如果結(jié)果是原創(chuàng)、比較有價值,則進行收錄,給比較高的權(quán)重。如果被認為是復制或抄襲,則不進行收錄,或是給的權(quán)重很低。順便要說的是,對于這個頁面的權(quán)重,不僅僅是跟其本身的內(nèi)容、本身的內(nèi)容有關,能不能有好的排名,還要跟整個站點的權(quán)重有關。打個比方,如果這個頁面的權(quán)重是3,網(wǎng)站的權(quán)重是3,那加起來是6。要是別的網(wǎng)站轉(zhuǎn)載了這個文章,文章的權(quán)重是1,但他的網(wǎng)站的權(quán)重是7,那加起來就是8。6<8所以轉(zhuǎn)載的文章還是會排在原創(chuàng)文章的前面。
信息來源尚品中國:集群網(wǎng)站建設
建站流程
-
網(wǎng)站需求
-
網(wǎng)站策劃方案
-
頁面設計風格
-
確認交付使用
-
資料錄入優(yōu)化
-
程序設計開發(fā)
-
后續(xù)跟蹤服務
-
聯(lián)系電話
010-60259772
熱門標簽
- 網(wǎng)站建設
- 食品網(wǎng)站建設
- 微信小程序開發(fā)
- 小程序開發(fā)
- 無錫網(wǎng)站建設
- 研究所網(wǎng)站建設
- 沈陽網(wǎng)站建設
- 廊坊網(wǎng)站建設
- 鄭州網(wǎng)站建設
- 婚紗攝影網(wǎng)站建設
- 手機端網(wǎng)站建設
- 高校網(wǎng)站制作
- 天津網(wǎng)站建設
- 教育網(wǎng)站建設
- 品牌網(wǎng)站建設
- 政府網(wǎng)站建設
- 北京網(wǎng)站建設
- 網(wǎng)站設計
- 網(wǎng)站制作
最新文章
推薦新聞
更多行業(yè)-
免費價格策略
價格是市場的杠桿,定價是否恰當直接關系到顧客對產(chǎn)品的接受程度,影響著北...
2014-06-18 -
SEO網(wǎng)站優(yōu)化之百度快照排名優(yōu)化絕不能做的事情
SEO網(wǎng)站優(yōu)化之百度快照排名優(yōu)化絕不能做的事情大家都知道,要提高百度的...
2011-12-20 -
網(wǎng)站建設的正確理解
如果你是一時興起決定來做網(wǎng)站建設,那么我建議你考慮清楚再來。天下沒有免...
2013-08-27 -
建設自適應網(wǎng)站有哪些優(yōu)缺點?
因為自適應設計需要多個界面的兼容性和功能調(diào)試,所以UI設計師和前端工程...
2020-09-24 -
網(wǎng)站制作內(nèi)容的幾種分類形式
網(wǎng)站制作內(nèi)容的推送、尋找、分類、篩選的方式有以下四種形式分類,或多或少...
2013-02-20 -
網(wǎng)絡信息資源的類型
難以按照一個統(tǒng)一明確的標準對網(wǎng)絡信息資源進行分類。那么上述資源的分類標...
2014-06-19
預約專業(yè)咨詢顧問溝通!
免責聲明
非常感謝您訪問我們的網(wǎng)站。在您使用本網(wǎng)站之前,請您仔細閱讀本聲明的所有條款。
1、本站部分內(nèi)容來源自網(wǎng)絡,涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學習和交流,切勿用于任何商業(yè)活動。
2、本站不承擔用戶因使用這些資源對自己和他人造成任何形式的損失或傷害。
3、本聲明未涉及的問題參見國家有關法律法規(guī),當本聲明與國家法律法規(guī)沖突時,以國家法律法規(guī)為準。
4、如果侵害了您的合法權(quán)益,請您及時與我們,我們會在第一時間刪除相關內(nèi)容!
聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com