Web Design
Mobile Internet
Brand Design
Innovative
News
Encyclopedias

計(jì)算機(jī)信息檢索的原理

Date:2014-06-19 Aource:尚品中國(guó) Type:網(wǎng)站百科
Word Size:small  medium  big

根據(jù)計(jì)算機(jī)檢索定義,我們知道存儲(chǔ)與檢索是信息檢索的兩個(gè)核心。因此,計(jì)算機(jī)信息檢索網(wǎng)站建設(shè)的原理可以這樣表述:以信息的充分交流和有效利用為目標(biāo),在對(duì)大量分散的信息進(jìn)行搜集的基礎(chǔ)上,標(biāo)引人員以文獻(xiàn)或信息描述體構(gòu)成文獻(xiàn)或信息庫(kù),提煉或選取用以表達(dá)文獻(xiàn)、信息特征和主題內(nèi)容的標(biāo)識(shí),按一定的方式分別予以有序化組織,建成各種各樣的檢索系統(tǒng),在統(tǒng)一存儲(chǔ)和檢索過程的基礎(chǔ)上,將用戶表達(dá)檢索詞的標(biāo)識(shí)與位索系統(tǒng)中表達(dá)文獻(xiàn)或信息內(nèi)容、形式特征的標(biāo)識(shí)進(jìn)行相符性比較,若是雙方標(biāo)識(shí)一致.就將具有這些標(biāo)識(shí)的文獻(xiàn)或信息技要求從檢索系統(tǒng)中輸出.在用戶的信息檢索過程中,檢索系統(tǒng)輸出的文獻(xiàn)可能是用戶需要的最終信息,也可能是用戶需要的文獻(xiàn)線索,用戶按此信息的標(biāo)引,可進(jìn)一步獲取需要的最終文獻(xiàn)的信息。計(jì)算機(jī)信息檢索包括信息存儲(chǔ)和信息檢索兩個(gè)過程。計(jì)算機(jī)信息存儲(chǔ)過程是指將收集到的原始文獻(xiàn)進(jìn)行主題概念分析,根據(jù)一定的檢索語(yǔ)言抽取主題詞、分類號(hào)及文獻(xiàn)的其他特征進(jìn)行標(biāo)識(shí)或?qū)懗鑫墨I(xiàn)的內(nèi)容摘要,然后再把這些經(jīng)過“前處理.的數(shù)據(jù)按一定格式輸入計(jì)算機(jī)中存儲(chǔ)起來,計(jì)算機(jī)在程序指令的控制下對(duì)數(shù)據(jù)進(jìn)行處理,形成機(jī)讀數(shù)據(jù)庫(kù),存儲(chǔ)在存儲(chǔ)介質(zhì)(如磁帶、磁盤或光盤)上,完成信息的加工存儲(chǔ)過程。
計(jì)算機(jī)信息

計(jì)算機(jī)信息檢索過程是指用戶對(duì)檢索播求加以分析,明確檢索范圍。弄清主題概念,形成檢索標(biāo)識(shí)及檢索策略,愉入到計(jì)算機(jī)中進(jìn)行檢索。計(jì)算機(jī)按照用戶的要求將檢索策略轉(zhuǎn)換成一系列提問,在專用程序控制下,進(jìn)行離級(jí)邏輯運(yùn)算。選出符合要求的信息并輸出。計(jì)算機(jī)檢索的過程實(shí)際上是一個(gè)比較、匹配的過程,是用計(jì)算機(jī)代替人工檢索的匹配過程。計(jì)算機(jī)一方面接受檢索提問(即檢索提問表達(dá)式),另一方面從數(shù)據(jù)庫(kù)中接受文獻(xiàn)記錄。然后在兩者之間進(jìn)行匹配運(yùn)算,即計(jì)算機(jī)信息檢索把檢素提問與文獻(xiàn)記錄之間的相關(guān)性檢索轉(zhuǎn)變成了檢索詞與標(biāo)引詞之間的相似計(jì)算。目前.一般計(jì)算機(jī)信息檢索系統(tǒng)為進(jìn)行檢索詞與標(biāo)引詞之間的相似性運(yùn)算,所采用的方法可以分為以下幾個(gè)等級(jí)。

(1)單個(gè)整詞的比較.例如.檢索詞是psychoan目ysis,而標(biāo)引詞也是psyeh咖alys畜s,兩者全等,則為命中.全等是相似性的一種特殊形式,對(duì)于一些包含數(shù)值的詞,如出版年、文摘號(hào)等也可以進(jìn)行大于(>)、小于(<)的運(yùn)算.

(2)詞的片斷(主要是詞根)比較.例如,檢索詞是用截?cái)喾?hào)(如@)表示的Pscho@,則命中所有開頭與截?cái)喾?hào)之前相同的詞,如Psych。姍!ysis、Psychobiology等.這就是截詞檢索.截詞有右截?cái)?、左截?cái)?、左右同時(shí)截?cái)嘁约爸虚g掩符等幾種形式。對(duì)截?cái)喾蟮脑试S字符數(shù).可不限制,也可限制在若千字符之間。即可分有限截?cái)嗪蜔o限截?cái)鄡煞N模式。不論叮種,其基本原理都是進(jìn)行詞的片斷對(duì)比。這種對(duì)比不要求檢索詞和標(biāo)引詞全等.而是部分相等或近似.因此,這個(gè)級(jí)別的比較是一種較典型的相似性運(yùn)算。

(3)固定詞組的比較.例如,檢索詞是Libra卿and bformation science,而標(biāo)引詞也是LibraJ,and Info,ation science.這是由多個(gè)整詞構(gòu)成的詞組.但比較仍然是全等的運(yùn)算.

(4)多個(gè)整詞之間位置邏輯的比較。即可以指定兩個(gè)整詞,詞與詞之間至多相隔幾個(gè)字(即可以擂入其他的字或字毋.忽略不計(jì)).兩詞出現(xiàn)的先后次序可以指定為可以對(duì)換或不可以對(duì)換.例如.檢索Information(2w)Re州eval,可以命中Infonm舊lion stora朗andR。州cval.這種位宜邁輯的運(yùn)抹可以說是帶有貝活性的詞組比較,而這種比較是允許有一定范幽的相似性運(yùn)算。它稱為相鄰度檢索。

(5)由若干單獨(dú)的檢索詞或詞組構(gòu)成的定邏輯組合的比較。它的目標(biāo)不是檢索各個(gè)單獨(dú)的檢索詞或詞組.而是在愈義上彼此結(jié)合、互扣限定的詞(成詞組)的完整組合。例如.“信息”和“網(wǎng)絡(luò).,它們分別是兩個(gè)單獨(dú)的詞,而“信息網(wǎng)絡(luò)”是這兩個(gè)詞邏輯組合的一種形式。“信息網(wǎng)絡(luò)”不是“信息,和“網(wǎng)絡(luò).這兩個(gè)詞的混合,而是兩種愈義的結(jié)合,是兩種概念合成了一種新的概念。
?

Please contact our consultant

+86 10-60259772

Please provide your contact number. The project manager of shangpin China will contact you as soon as possible.