計算機信息檢索的原理
.jpg)
計算機信息檢索過程是指用戶對檢索播求加以分析,明確檢索范圍。弄清主題概念,形成檢索標識及檢索策略,愉入到計算機中進行檢索。計算機按照用戶的要求將檢索策略轉換成一系列提問,在專用程序控制下,進行離級邏輯運算。選出符合要求的信息并輸出。計算機檢索的過程實際上是一個比較、匹配的過程,是用計算機代替人工檢索的匹配過程。計算機一方面接受檢索提問(即檢索提問表達式),另一方面從數據庫中接受文獻記錄。然后在兩者之間進行匹配運算,即計算機信息檢索把檢素提問與文獻記錄之間的相關性檢索轉變成了檢索詞與標引詞之間的相似計算。目前.一般計算機信息檢索系統為進行檢索詞與標引詞之間的相似性運算,所采用的方法可以分為以下幾個等級。
(1)單個整詞的比較.例如.檢索詞是psychoan目ysis,而標引詞也是psyeh咖alys畜s,兩者全等,則為命中.全等是相似性的一種特殊形式,對于一些包含數值的詞,如出版年、文摘號等也可以進行大于(>)、小于(<)的運算.
(2)詞的片斷(主要是詞根)比較.例如,檢索詞是用截斷符號(如@)表示的Pscho@,則命中所有開頭與截斷符號之前相同的詞,如Psych。姍!ysis、Psychobiology等.這就是截詞檢索.截詞有右截斷、左截斷、左右同時截斷以及中間掩符等幾種形式。對截斷符之后的允許字符數.可不限制,也可限制在若千字符之間。即可分有限截斷和無限截斷兩種模式。不論叮種,其基本原理都是進行詞的片斷對比。這種對比不要求檢索詞和標引詞全等.而是部分相等或近似.因此,這個級別的比較是一種較典型的相似性運算。
(3)固定詞組的比較.例如,檢索詞是Libra卿and bformation science,而標引詞也是LibraJ,and Info,ation science.這是由多個整詞構成的詞組.但比較仍然是全等的運算.
(4)多個整詞之間位置邏輯的比較。即可以指定兩個整詞,詞與詞之間至多相隔幾個字(即可以擂入其他的字或字毋.忽略不計).兩詞出現的先后次序可以指定為可以對換或不可以對換.例如.檢索Information(2w)Re州eval,可以命中Infonm舊lion stora朗andR。州cval.這種位宜邁輯的運抹可以說是帶有貝活性的詞組比較,而這種比較是允許有一定范幽的相似性運算。它稱為相鄰度檢索。
(5)由若干單獨的檢索詞或詞組構成的定邏輯組合的比較。它的目標不是檢索各個單獨的檢索詞或詞組.而是在愈義上彼此結合、互扣限定的詞(成詞組)的完整組合。例如.“信息”和“網絡.,它們分別是兩個單獨的詞,而“信息網絡”是這兩個詞邏輯組合的一種形式。“信息網絡”不是“信息,和“網絡.這兩個詞的混合,而是兩種愈義的結合,是兩種概念合成了一種新的概念。
推薦新聞
更多行業(yè)-
搜索引擎與訪客喜歡什么樣的網站
作為站長,尚品中國網站建設公司相信大家面對搜索引擎不陌生,因為作為站點...
2014-01-17 -
網絡信息資源的類型
難以按照一個統一明確的標準對網絡信息資源進行分類。那么上述資源的分類標...
2014-06-19 -
學習SEO網站優(yōu)化應掌握方向
學習SEO網站優(yōu)化應掌握方向隨著互聯網的發(fā)展,seo網站優(yōu)化這塊成了熱...
2011-11-26 -
電子商城商務網站建設及營銷建議
隨著網絡的發(fā)展,電子商務行業(yè)在最近一兩年變得越來越蓬勃。對于電子商務網...
2021-02-26 -
品牌網站建設的定義是什么
品牌創(chuàng)意型網站建設定義隨著近年來國內品牌的崛起和互聯網的發(fā)展,許多企業(yè)...
2015-04-07 -
企業(yè)網站建設過程中怎樣確定設計風格
隨著社會和經濟的快速發(fā)展,互聯網時代開始全面爆發(fā)。各大企業(yè)公司都在打造...
2020-10-15
預約專業(yè)咨詢顧問溝通!
免責聲明
非常感謝您訪問我們的網站。在您使用本網站之前,請您仔細閱讀本聲明的所有條款。
1、本站部分內容來源自網絡,涉及到的部分文章和圖片版權屬于原作者,本站轉載僅供大家學習和交流,切勿用于任何商業(yè)活動。
2、本站不承擔用戶因使用這些資源對自己和他人造成任何形式的損失或傷害。
3、本聲明未涉及的問題參見國家有關法律法規(guī),當本聲明與國家法律法規(guī)沖突時,以國家法律法規(guī)為準。
4、如果侵害了您的合法權益,請您及時與我們,我們會在第一時間刪除相關內容!
聯系方式:010-60259772
電子郵件:394588593@qq.com