信息檢索語(yǔ)言主要的分類(lèi)標準是:
1. 以?xún)热萏卣鳛榉诸?lèi)標準,信息檢索語(yǔ)言分為主題語(yǔ)言和分類(lèi)語(yǔ)言。
2. 以外部特征為分類(lèi)標準,信息檢索語(yǔ)言分為名稱(chēng)語(yǔ)言、著(zhù)者語(yǔ)言和序號語(yǔ)言。
主題語(yǔ)言的含義:以自然語(yǔ)言中語(yǔ)詞文字為基礎,以反映特定事物為中心,以主題詞字順為基本結構的一種檢索語(yǔ)言。
主題語(yǔ)言的特點(diǎn):
1. 集中性。
2. 直觀(guān)性。
3. 靈活性。
分類(lèi)語(yǔ)言的含義:分類(lèi)語(yǔ)言亦稱(chēng)體系分類(lèi)語(yǔ)言,是以學(xué)科范疇和學(xué)科體系為基礎來(lái)劃分事物的一種檢索語(yǔ)言。
分類(lèi)語(yǔ)言的特點(diǎn):分類(lèi)語(yǔ)言最明顯的特征是系統性,具有族性檢索功能,有利于人們從科學(xué)專(zhuān)業(yè)的角度進(jìn)行全面性的檢索。
目前,世界上的信息檢索語(yǔ)言有幾千種,依其劃分方法的不同,其類(lèi)型也不一樣。(一)按照標識的性質(zhì)與原理劃分,(二)按照表達文獻的特征劃分。
按照標識的性質(zhì)與原理劃分檢索語(yǔ)言 分類(lèi)語(yǔ)言是指以數字、字母或字母與數字結合作為基本字符,采用字符直接連接并以圓點(diǎn)(或其他符號)作為分隔符的書(shū)寫(xiě)法,以基本類(lèi)目作為基本詞匯,以類(lèi)目的從屬關(guān)系來(lái)表達復雜概念的一類(lèi)檢索語(yǔ)言。
以知識屬性來(lái)描述和表達信息內容的信息處理方法稱(chēng)為分類(lèi)法。著(zhù)名的分類(lèi)法有《國際十進(jìn)分類(lèi)法》、《美國國會(huì )圖書(shū)館圖書(shū)分類(lèi)法》、《國際專(zhuān)利分類(lèi)表》、《中國圖書(shū)館圖書(shū)分類(lèi)法》等。 關(guān)鍵詞是指出現在文獻標題、文摘、正文中,對表征文獻主題內容具有實(shí)質(zhì)意義的語(yǔ)詞,對揭示和描述文獻主題內容是重要的、關(guān)鍵性的語(yǔ)詞。關(guān)鍵詞法主要用于計算機信息加工抽詞編制索引,因而稱(chēng)這種索引為關(guān)鍵詞索引。在檢索中文醫學(xué)文獻中使用頻率較高的《CMCC》數據庫就是采用關(guān)鍵詞索引方法建立的。
3、代碼語(yǔ)言代碼語(yǔ)言是指對事物的某方面特征,用某種代碼系統來(lái)表示和排列事物概念,從而提供檢索的檢索語(yǔ)言。例如,根據化合物的分子式這種代碼語(yǔ)言,可以構成分子式索引系統,允許用戶(hù)從分子式出發(fā),檢索相應的化合物及其相關(guān)的文獻信息。
按照表達文獻的特征劃分檢索語(yǔ)言 表達文獻外部特征的檢索語(yǔ)言主要是指文獻的篇名(題目)、作者姓名、出版者、報告號、專(zhuān)利號等。將不同的文獻按照篇名、作者名稱(chēng)的字序進(jìn)行排列,或者按照報告號、專(zhuān)利號的數序進(jìn)行排列,所形成的以篇名、作者及號碼的檢索途徑來(lái)滿(mǎn)足用戶(hù)需求的檢索語(yǔ)言。
表達文獻內容特征的檢索語(yǔ)言主要是指所論述的主題、觀(guān)點(diǎn)、見(jiàn)解和結論等。
信息檢索語(yǔ)言是為查找信息服務(wù)的,因此,它必須具備以下的功能。
1.信息檢索語(yǔ)言應可表示文獻內容、數據或其他信息形式。為了滿(mǎn)足不同信息用戶(hù)的需要,信息檢索語(yǔ)言應能根據不同的信息需求,表達不同的類(lèi)型。例如,檢索某種器材的性能時(shí),信息檢索語(yǔ)言應能表達某些數據指標;而在檢索某種物質(zhì)結構時(shí),又能表達物質(zhì)名稱(chēng)和物質(zhì)結構方式。
2.有專(zhuān)用概念表示用戶(hù)的信息提問(wèn)。信息檢索不單純是字面上的組合,而是一種概念上的匹配。例如,計算機繪圖,這里有兩個(gè)名詞,既可拆又可合。拆開(kāi)后,依據“計算機”可查出“計算機解題”、“計算機控制”、“計算機維修”、“計算機繪圖”等信息;但“繪圖”卻涉及到美術(shù)繪圖、工程繪圖、計算機繪圖等
信息檢索語(yǔ)言是為查找信息服務(wù)的,因此,它必須具備以下的功能。
1.信息檢索語(yǔ)言應可表示文獻內容、數據或其他信息形式。為了滿(mǎn)足不同信息用戶(hù)的需要,信息檢索語(yǔ)言應能根據不同的信息需求,表達不同的類(lèi)型。
例如,檢索某種器材的性能時(shí),信息檢索語(yǔ)言應能表達某些數據指標;而在檢索某種物質(zhì)結構時(shí),又能表達物質(zhì)名稱(chēng)和物質(zhì)結構方式。 2.有專(zhuān)用概念表示用戶(hù)的信息提問(wèn)。
信息檢索不單純是字面上的組合,而是一種概念上的匹配。例如,計算機繪圖,這里有兩個(gè)名詞,既可拆又可合。
拆開(kāi)后,依據“計算機”可查出“計算機解題”、“計算機控制”、“計算機維修”、“計算機繪圖”等信息;但“繪圖”卻涉及到美術(shù)繪圖、工程繪圖、計算機繪圖等。
檢索語(yǔ)言的種類(lèi)很多。按描述文獻的內容性質(zhì)劃分,可分為分類(lèi)語(yǔ)言和主題語(yǔ)言。
1、分類(lèi)語(yǔ)言。用分類(lèi)號和相應的分類(lèi)款目來(lái)表達各種概念,以學(xué)科體系為基礎將各種概念按學(xué)科性質(zhì)和邏輯層次結構進(jìn)行分類(lèi)和系統排序,能反映事物的從屬派生關(guān)系,便于按學(xué)科門(mén)類(lèi)進(jìn)行族性檢索。按照分類(lèi)方式的不同,分類(lèi)語(yǔ)言又分為體系分類(lèi)語(yǔ)言、組配分類(lèi)語(yǔ)言和混合分類(lèi)語(yǔ)言。
2、主題語(yǔ)言。主題語(yǔ)言就是對表達信息主題內容特征的主題詞匯概念,經(jīng)規范化處理所形成的檢索語(yǔ)言。由于主題詞匯表達概念準確,所以主題途徑是檢索信息的主要途徑。主題語(yǔ)言按照主題性質(zhì)的不同,它又可分為標題詞語(yǔ)言、單元詞語(yǔ)言、敘詞語(yǔ)言、關(guān)鍵詞語(yǔ)言和引文語(yǔ)言。
主題法檢索語(yǔ)言是另一種從內容角度標引和檢索信息資源的方法。它不象分類(lèi)法以學(xué)科體系為中心,而是利用詞語(yǔ)來(lái)表達信息資源中論述的主題概念。用來(lái)表達信息內容的詞語(yǔ)稱(chēng)為主題詞。主題詞不同于自然語(yǔ)言,它是將自然語(yǔ)言中的詞語(yǔ)經(jīng)過(guò)人工規范后的語(yǔ)言,即經(jīng)過(guò)詞匯控制的詞語(yǔ)。所謂主題法,就是以自然語(yǔ)言中的詞語(yǔ)或規范化的詞語(yǔ)作為揭示文獻主題的標識,并以此標識編排組織和查找文獻的排檢方法。主題指文獻所具體論述的對象和研究的問(wèn)題,它以語(yǔ)詞作為檢索標識,按字順排列,直觀(guān)性強,也是一種普遍使用的信息組織方法。該方法提供了一種直接面向具體對象、事實(shí)或概念的信息組織方法和信息檢索途徑。主題的類(lèi)型主要有:
1、標題法
標題法,也稱(chēng)標題詞法,是主題法系統中最早出現的-種,它是以標題詞(規范的事物名稱(chēng)、名詞術(shù)語(yǔ))作為文獻主題內容的標識和檢索標識。標題法的主要特征是事先編表,標題詞以固定的組合方式組織在主題表中,形成標題,檢索按既定組配執行。標題表通常由一個(gè)主表和若干個(gè)輔助表組成。《美國國會(huì )圖書(shū)館標題表》(LCSH)是當今最著(zhù)名的標題表。標題法比較直觀(guān)、容易掌握;查找速度快,但查全一門(mén)學(xué)科或具某一屬性事物的文獻卻較為困難。
2、敘詞法
敘詞法,又稱(chēng)為主題詞法。是將自然語(yǔ)言的語(yǔ)詞概念,經(jīng)過(guò)規范化和優(yōu)選處理,通過(guò)組配來(lái)標識文獻主題的方法。敘詞具有概念性、描述性、組配性的特點(diǎn)。敘詞法綜合了多種信息檢索語(yǔ)言的原理和方法,采用靈活的概念組配,并在詞與詞之間建立參照系統。敘詞法適用于計算機和手工檢索系統,是目前應用較廣的一種主題檢索語(yǔ)言。CA、EI等著(zhù)名檢索工具都采用了敘詞法進(jìn)行編排。我國目前使用最廣的《中國分類(lèi)主題詞表》(前身是《漢語(yǔ)主題詞表》)就是屬于敘詞法,有電子版和印刷版兩種形式。《中國分類(lèi)主題詞表》是分類(lèi)主題一體化的詞表,與《中圖法》相互對應,這對文獻信息的組織和檢索十分方便。
文獻檢索途徑包括以下幾種:
一、著(zhù)者途徑 許多檢索系統備有著(zhù)者索引、機構(機構著(zhù)者或著(zhù)者所在機構)索引,專(zhuān)利文獻檢索系統有專(zhuān)利權人索引,利用這些索引從著(zhù)者、編者、譯者、專(zhuān)利權人的姓名或機關(guān)團體名稱(chēng)字順進(jìn)行檢索的途徑統稱(chēng)為著(zhù)者途徑。
二、題名包括書(shū)名、刊名、篇名等途徑。 一些檢索系統中提供按題名字順檢索的途徑,如書(shū)名目錄和刊名目錄。
三、分類(lèi)途徑 按學(xué)科分類(lèi)體系來(lái)檢索文獻。這一途徑是以知識體系為中心分類(lèi)排檢的,因此,比較能體現學(xué)科系統性,反映學(xué)科與事物的隸屬、派生與平行的關(guān)系,便于我們從學(xué)科所屬范圍來(lái)查找文獻資料,并且可以起到"觸類(lèi)旁通"的作用。從分類(lèi)途經(jīng)檢索文獻資料,主要是利用分類(lèi)目錄和分類(lèi)索引。
四、主題途徑 通過(guò)反映文獻資料內容的主題詞來(lái)檢索文獻。由于主題法能集中反映一個(gè)主題的各方面文獻資料,因而便于讀者對某一問(wèn)題、某一事物和對象作全面系統的專(zhuān)題性研究。我們通過(guò)主題目錄或索引,即可查到同一主題的各方面文獻資料。
五、引文途徑 文獻所附參考文獻或引用文獻,是文獻的外表特征之一。利用這種引文而編制的索引系統,稱(chēng)為引文索引系統,它提供從被引論文去檢索引用論文的一種途徑,稱(chēng)為引文途徑。
六、序號途徑 有些文獻有特定的序號,如專(zhuān)利號、報告號、合同號、標準號、國際標準書(shū)號和刊號等。文獻序號對于識別一定的文獻,具有明確、簡(jiǎn)短、唯一性特點(diǎn)。依此編成的各種序號索引可以提供按序號自身順序檢索文獻信息的途徑。
七、代碼途徑 利用事物的某種代碼編成的索引,如分子式索引、環(huán)系索引等,可以從特定代碼順序進(jìn)行檢索。
八、專(zhuān)門(mén)項目途徑 從文獻信息所包含的或有關(guān)的名詞術(shù)語(yǔ)、地名、人名、機構名、商品名、生物屬名、年代等的特定順序進(jìn)行檢索,可以解決某些特別的問(wèn)題。
(1)按照信息搜集方法分類(lèi)
按照信息搜集方法的不同,搜索引擎系統可以分為三大類(lèi):
·目錄式搜索引擎(Directory Search Engine)
自動(dòng)方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類(lèi)框架中。信息大多面向網(wǎng)站。這類(lèi)搜索引擎代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。
·機器人搜索引擎(Crawler-Based Search Engine):
由一個(gè)稱(chēng)為蜘蛛(Spider)的機器人程序以某種策略自動(dòng)地在Internet中搜集和發(fā)現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶(hù)的查詢(xún)輸入檢索索引庫,并將查詢(xún)結果返回給用戶(hù)。服務(wù)方式是面向網(wǎng)頁(yè)的全文檢索服務(wù)。這類(lèi)搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。
·元搜索引擎(Meta Search Engine):
這類(lèi)搜索引擎沒(méi)有自己的數據,而是將用戶(hù)的查詢(xún)請求同時(shí)向多個(gè)搜索引擎遞交,將返回的結果進(jìn)行重復排除、重新排序等處理后,作為自己的結果返回給用戶(hù)。服務(wù)方式為面向網(wǎng)頁(yè)的全文檢索。這類(lèi)搜索引擎的代表是WebCrawler、InfoMarket。
目前,商業(yè)的搜索引擎站點(diǎn)正在結合各種搜索引擎的優(yōu)點(diǎn),在類(lèi)型上有逐漸融合的趨勢。另外搜索引擎站點(diǎn)?“門(mén)戶(hù)化”的傾向。
(2)按照檢索軟件分類(lèi)
按照服務(wù)提供方式的不同,檢索軟件也可以分為三大類(lèi):全文數據庫檢索軟件、非全文數據庫檢索軟件、主題指南類(lèi)檢索軟件。
全文數據庫檢索軟件正常運作的前提是網(wǎng)站擁有大量的信息,因此必須依靠強大的數據庫作為后盾。它能夠提供完整的文獻和信息檢索,查全率很高。
非全文數據庫檢索軟件具有速度快、使用簡(jiǎn)便、索引量大的特點(diǎn)。
主題指南類(lèi)檢索軟件是目前網(wǎng)絡(luò )檢索中最常用的檢索軟件。這種軟件查準率高,速度快,使用方便。現大部分網(wǎng)站都具備主題指南類(lèi)檢索功能。
(3)按照檢索語(yǔ)言分類(lèi)
成熟完備的信息檢索語(yǔ)言應具有以下幾項功能。
1)對文獻的信息內容(及某些外表特征)加以標引的功能。要求利用檢索語(yǔ)言能夠正確標引文獻信息內容及其外表特征。
2)集中文獻的功能。對內容相同及相關(guān)的文獻信息加以集中或揭示其相關(guān)性,提高信息檢索效率。
3)信息組織的功能。對大量文獻信息加以系統化或組織化,使文獻信息的存儲集中化、系統化,便于信息檢索者按照一定的排列次序進(jìn)行有序化檢索。
4)一致性功能。便于將標引用語(yǔ)和檢索用語(yǔ)進(jìn)行相符性比較,保證不同檢索人員表述相同文獻內容的一致性,以及檢索人員與標引人員對相同文獻內容表述的一致性。
5)獲得最高查全率和查準率的功能。保證檢索者在按不同需要檢索文獻時(shí),都能獲得最高的查全率和查準率。
6)橋梁和紐帶功能。在文獻信息標引者和檢索者之間發(fā)揮橋梁和紐帶作用,使二者在理解和表達文獻信息主題方面達到一致,以提高信息檢索的準確性。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:3.585秒