識組織系統下文獻檢索體系建設與驗證論文
基于知識組織系統的文獻檢索操作,是當前數字圖書(shū)館領(lǐng)域文獻檢索方式的研究熱點(diǎn)方向之一,也是圖書(shū)館文獻信息的需求者與提供者之間對文獻資源進(jìn)行的互操作行為。在文獻檢索過(guò)程中,如何更加合理地通過(guò)對知識組織系統的運用,提高文獻檢索的全面性和準確性,已成為當前文獻信息檢索的關(guān)鍵問(wèn)題。
當前,基于知識組織系統的文獻檢索方式主要是從文獻關(guān)鍵詞的語(yǔ)義角度出發(fā),通過(guò)基于分類(lèi)表和敘詞表及知識本體的文獻檢索、基于文獻關(guān)鍵詞的標引和分詞檢索、基于關(guān)鍵詞的語(yǔ)義檢索以及敘詞表重構式檢索等檢索方式,以自動(dòng)化標引為檢索手段,實(shí)現的文獻檢索服務(wù)。其中,借助敘詞表中的概念語(yǔ)義關(guān)系擴展與精化的用戶(hù)檢索式,是各種網(wǎng)絡(luò )信息檢索工具提高其檢索性能的常用方法。
此類(lèi)文獻檢索服務(wù)以查閱、概念檢索、詞匯歸納等文本內容為核心,主要體現在文獻信息的關(guān)鍵詞語(yǔ)義擴展檢索和文獻信息的大眾分類(lèi)法的檢索兩種模式上;谖墨I信息的關(guān)鍵詞語(yǔ)義擴展檢索模式,主要通過(guò)分析文獻信息的關(guān)鍵詞自身概念與語(yǔ)義概念間的關(guān)聯(lián)性,并對文獻信息關(guān)鍵詞自身的詞性進(jìn)行標注,突出文獻信息關(guān)鍵詞的核心概念與語(yǔ)義,再借助關(guān)鍵詞自身概念與語(yǔ)義概念的關(guān)聯(lián),實(shí)現基于關(guān)鍵詞本體的文獻信息語(yǔ)義檢索。語(yǔ)義檢索能處理信息的語(yǔ)義內容,實(shí)現基于語(yǔ)義的匹配和推理。該檢索方式突出了文獻信息中核心概念與文獻信息關(guān)鍵詞語(yǔ)義的串聯(lián),并將文獻信息的核心價(jià)值通過(guò)文獻的關(guān)鍵詞標引進(jìn)行充分的體現,使得檢索結果與文獻信息需求的關(guān)聯(lián)度大幅增加,減少了用戶(hù)需要篩選的檢索結果數量,提升了檢索的速率,提高了檢索結果的準確度。而基于大眾分類(lèi)法的文獻檢索與傳統分類(lèi)法相比,更加注重檢索者的檢索習慣,通過(guò)依照知識組織分類(lèi)法處理各項文獻和檢索用戶(hù)自定義的自由詞作為數字資源標注整理,實(shí)現檢索與瀏覽的功能,使得檢索過(guò)程更加便捷有效。
現階段,對獨立創(chuàng )建的知識組織系統的映射和服務(wù)協(xié)議是實(shí)現知識組織系統互操作的主要方式。當前,基于知識組織系統的文獻檢索研究主要是通過(guò)將關(guān)鍵詞語(yǔ)義和文獻分類(lèi)法與文獻的關(guān)聯(lián)為基礎,實(shí)現類(lèi)似將分類(lèi)主題詞表和元數據集成在一起構造一個(gè)知識網(wǎng)絡(luò )并在其上實(shí)施知識瀏覽和概念檢索。這種檢索模式在一定程度上提高了文獻檢索的便捷性和全面性。
但在當前文獻涵蓋面廣、涉及領(lǐng)域雜的文獻環(huán)境中,資源組織體系不規范,造成基于文獻關(guān)鍵詞語(yǔ)義和文獻分類(lèi)法關(guān)聯(lián)的檢索模式缺乏科學(xué)的導航體系和完善的管理平臺進(jìn)行關(guān)聯(lián)性檢索操作,使得文獻信息需求者在文獻檢索過(guò)程中無(wú)法對文獻關(guān)鍵詞的擴展和標引進(jìn)行正確的控制;同時(shí),跨語(yǔ)言互換過(guò)程中語(yǔ)料庫的無(wú)法實(shí)時(shí)更新,使得檢索結果的準確性和全面性受到影響;以及搜索引擎績(jì)效評價(jià)較少,使得檢索的過(guò)程效率無(wú)法得以明確的體現。針對當前所面對的問(wèn)題,筆者提出了一種個(gè)性化的基于知識組織系統的文獻檢索體系構造,旨在以概念格、本體、數據挖掘、語(yǔ)義標注等理論與技術(shù)的互補融合為基礎理念,形成滿(mǎn)足檢索用戶(hù)需求為前提的檢索操作,并通過(guò)對體系個(gè)性化、關(guān)聯(lián)性、評定反饋及安全性 4 個(gè)方面的構造,實(shí)現全面性和準確性的個(gè)性化文獻檢索活動(dòng)。
1 基于知識組織系統的文獻檢索體系模塊
基于知識組織系統的文獻檢索的運作目的,在于使信息需求者能夠通過(guò)自身信息需求的提取和檢索,實(shí)現全面準確的目的性檢索。同時(shí),概念格、本體、數據挖掘、語(yǔ)義標注等操作技術(shù)的運用,實(shí)現了基于知識組織系統的文獻檢索體系的構建。
而基于知識組織系統的文獻檢索模塊,主要由信息需求模塊、關(guān)聯(lián)運行模塊、評價(jià)反饋模塊和安全保障模塊 4 個(gè)部分組成。
1。1 信息需求模塊
信息需求模塊在文獻檢索體系中的設立,主要是用來(lái)完善合理的文獻檢索用戶(hù)的檢索需求,使文獻檢索用戶(hù)在檢索過(guò)程中,能夠針對自身的檢索需求進(jìn)行文獻檢索活動(dòng),提高檢索的效率以及檢索結果的利用價(jià)值。圖 1 為信息需求模塊結構圖。
文獻檢索用戶(hù)是個(gè)性化文獻檢索活動(dòng)的主體。要明確文獻檢索用戶(hù)的核心需求,需要先明確用戶(hù)的需求主題和關(guān)鍵詞,并通過(guò)對文獻需求指標的關(guān)聯(lián)和分析,明確用戶(hù)的直接需求和潛在需求,同時(shí)也明確自身需求信息存在的屬性與載體形式。
在個(gè)性化文獻檢索活動(dòng)中,用戶(hù)的需求指標是檢索的核心要素。而如何建立完善合理的個(gè)人信息指標體系,明確用戶(hù)的各項信息需求在檢索指標中的界定標準,體現檢索指標的各個(gè)環(huán)節、體現用戶(hù)自身的信息需求,就成為當前確定用戶(hù)文獻檢索需求的關(guān)鍵點(diǎn)。通過(guò)信息需求模塊的設定可以看出,個(gè)人用戶(hù)在檢索需求指標的選取上具有針對性和全面性。
1。2 關(guān)聯(lián)運行模塊
關(guān)聯(lián)運行模塊體系結構一共有 4 個(gè)組成部分,分別為用戶(hù)的核心需求、需求主題的內在關(guān)聯(lián)、需求關(guān)鍵詞的內在關(guān)聯(lián)以及關(guān)聯(lián)中樞。圖 2 為關(guān)聯(lián)運行模塊結構圖。
檢索關(guān)聯(lián)運行模塊的核心,在于通過(guò)對檢索用戶(hù)核心需求的提取和分析,標注其需求主題和需求關(guān)鍵字,同時(shí)對檢索用戶(hù)需求主題中客戶(hù)的潛在需求和直接需求的判定,以及需求關(guān)鍵詞體現相關(guān)需求的屬性和載體分析,實(shí)現檢索用戶(hù)需求的整體體現,并通過(guò)關(guān)聯(lián)中樞的關(guān)聯(lián)與整合,實(shí)現檢索用戶(hù)相應需求之間的互操作運行。在檢索關(guān)聯(lián)運行過(guò)程中,知識組織系統針對用戶(hù)檢索的相應所需,通過(guò)知識數據整合與互操作技術(shù)實(shí)現文獻數據間的'關(guān)聯(lián),并通過(guò)關(guān)聯(lián)因子得出需求信息的關(guān)聯(lián)數據。
1。3 評定反饋模塊
評價(jià)反饋模塊體系是對文獻檢索結果的綜合評定,具體由檢索結果的全面性、有效性、準確性和利用率 4 部分組成。圖3為評定反饋模塊結構圖。在評定反饋體系運行中,將檢索到的結果分別在用戶(hù)檢索需求和用戶(hù)需求環(huán)境中進(jìn)行全面性、有效性、準確性和利用率的評定,并通過(guò)等級的劃分實(shí)現信息檢索結果價(jià)值的體現。
檢索結果的等級指標體系是檢索結果的核心價(jià)值體現,因此,評價(jià)反饋模塊中各個(gè)具體評定指標的確立和運行,使得檢索結果的針對性得以充分的體現。
1。4 安全保障模塊
安全保障體系是通過(guò)將文獻檢索過(guò)程中各項信息安全環(huán)節融合并組成的安全保障體系,其具體可以體現在信息保護體系和安全保障體系兩個(gè)主要部分。
信息保護體系主要是對用戶(hù)在文獻檢索過(guò)程中的個(gè)人需求進(jìn)行安全保護,具體是通過(guò)對用戶(hù)的信息需求提取操作過(guò)程中用戶(hù)需求關(guān)鍵字的挖掘整理來(lái)實(shí)現;安全保障體系負責對體系的整體運行進(jìn)行操作,主要是通過(guò)對檢索結果進(jìn)行安全策略的分析與實(shí)施,并在體系運行過(guò)程中設定安全效果的反饋,用以保持和完善用戶(hù)安全保障模塊的運行。圖 4 為安全保障模塊圖。
在基于知識組織系統的文獻檢索體系中,安全保障模塊運行的核心在于通過(guò)將用戶(hù)的個(gè)人信息以及檢索到的各類(lèi)需求信息,通過(guò)信息清理、分析以及安全加密管理,實(shí)現信息的安全保障。信息安全保障體系是信息檢索過(guò)程中用于保障用戶(hù)信息安全的重要環(huán)節。信息安全保障體系旨在為用戶(hù)的個(gè)人信息以及從外界通過(guò)信息檢索所搜集到的信息提供安全保障,避免泄密事件的發(fā)生。因此,檢驗信息安全保障體系是否具有可行性的關(guān)鍵,在于該體系能否解決各種客觀(guān)環(huán)境下日益加劇的信息安全漏洞,實(shí)現對用戶(hù)個(gè)人信息的安全保障。
2 基于知識組織系統的文獻檢索體系構建與驗證
2。1 基于知識組織系統的文獻檢索體系構建
基于知識組織系統的文獻檢索運作機制的核心,在于信息需求者是否能夠通過(guò)模塊實(shí)現信息的全面性和準確率。圖 5 為基于知識組織系統的文獻檢索體系圖。
在基于知識組織系統的文獻檢索體系中,信息需求者將自身的信息需求通過(guò)信息需求模塊進(jìn)行提取,并在安全保障模塊中對提取的信息各項需求進(jìn)行集成歸納,通過(guò)將集成的信息在關(guān)聯(lián)運行模塊中進(jìn)行關(guān)聯(lián)和檢索,并將檢索的結果通過(guò)安全保障模塊進(jìn)行呈現的同時(shí),利用評價(jià)反饋模塊在安全保障模塊下實(shí)行結果評價(jià)和反饋,完成信息需求者所需的信息獲取。
2。2 實(shí)驗驗證
。1)信息需求。以歷史為需求的大類(lèi)目,篩選以下 5 條文獻需求信息:需求信息 1———史學(xué)類(lèi)相關(guān)文獻;需求信息 2———文學(xué)類(lèi)文獻;需求信息 3———中國現代研究文獻;需求信息 4———史料記載研究類(lèi)文獻;需求信息 5———魯迅方面相關(guān)研究文獻。
將上述 5 條需求信息進(jìn)行關(guān)鍵詞提取,所提取的關(guān)鍵詞見(jiàn)表 1。
在信息需求模塊中,需求信息的關(guān)鍵詞分別提取為史學(xué)、文學(xué)、中國現代研究、史料記載和魯迅研究;再通過(guò)關(guān)鍵詞合并需求關(guān)鍵詞,集成出需求信息:中國現代文學(xué)史料研究之魯迅方面相關(guān)研究文獻。
。2)關(guān)聯(lián)運行。通過(guò)信息需求的集成操作,可將信息需求者的需求信息歸納為:中國現代文學(xué)史料研究之魯迅方面相關(guān)研究文獻。再通過(guò)關(guān)聯(lián)運行模塊,將需求信息提取為:中國現代文學(xué)史料研究、魯迅研究文獻兩個(gè)方面。在運行過(guò)程中,關(guān)聯(lián)運行模塊將中國現代文學(xué)史料研究導入文獻檢索系統過(guò)程中進(jìn)行檢索。表 2 為中國現代文學(xué)史料研究檢索結果呈現表。
再通過(guò)將“魯迅研究文獻”作為二次檢索條件放入已檢索的關(guān)聯(lián)結果中,可得檢索結果:中國現代文學(xué)史料研究舉隅:魯迅、郭沫若、高長(cháng)虹及相關(guān)研究。
。3)評價(jià)反饋。將關(guān)聯(lián)運行模塊的結果放入反饋評價(jià)模塊中,并將檢索的結果與 5 條文獻需求信息進(jìn)行比對評價(jià)反饋,確定結果的全面性、有效性、準確性和利用率。表 3 為評價(jià)反饋評定表。
3 未來(lái)發(fā)展展望
當前,文獻信息主要以網(wǎng)狀結構分布于知識組織體系中。為了適用文獻信息的動(dòng)態(tài)性調整,注重知識組織中文獻信息的挖掘獲取,基于知識組織系統的檢索已逐步形成一套概念性的個(gè)性化檢索體系,該體系建立在文獻信息多樣化的基礎上,通過(guò)減少信息的重復分析,提高檢索效率和檢索質(zhì)量。在基于知識組織系統的文獻檢索過(guò)程中,檢索需求者需要通過(guò)對信息點(diǎn)的實(shí)時(shí)更新,并根據自身的需求設定檢索方向,實(shí)現用戶(hù)在檢索操作過(guò)程中的完善便捷服務(wù)。
在知識組織系統工具與信息檢索功能結合起來(lái)所形成的基于知識組織系統的文獻檢索模式中,智能化的檢索、分析和處理體系的特點(diǎn)和優(yōu)勢,符合當前檢索的發(fā)展需求,是未來(lái)檢索領(lǐng)域的研究熱點(diǎn)。而如何將基于知識組織系統的文獻檢索與當前文獻檢索服務(wù)相結合,更好地體現其操作的便捷性和檢索結果的有效性,是接下來(lái)我們研究的主要方向。
參考文獻
[1] 薛春香。網(wǎng)絡(luò )環(huán)境中知識組織系統構建與應用研究[M]。南京:東南大學(xué)出版社,2009。
[2] 董慧,唐敏。語(yǔ)義檢索在 Web2。0 環(huán)境下的應用探討[J]。中國圖書(shū)館學(xué)報,2011(3):115—119。
[3] 王軍,張麗。網(wǎng)絡(luò )知識組織系統的研究現狀和發(fā)展趨勢[J]。中國圖書(shū)館學(xué)報,2008(1):65—69。
[4] 王軍;诜诸(lèi)法和主題詞表的數字圖書(shū)館知識組織[J]。中國圖書(shū)館學(xué)報,2004(3):70。
[5] 蔡箐。 學(xué)科信息門(mén)戶(hù)及其優(yōu)化途徑[J]。 中國圖書(shū)館學(xué)報,2008(4):114—118。
[6] 馬志杰。我國搜索引擎評價(jià)研究的現狀、問(wèn)題及對策[J]。圖書(shū)館學(xué)研究,2013(4):11—17。
[7] 滕廣青,畢強。知識組織體系的演進(jìn)路徑及相關(guān)研究的發(fā)展趨勢探析[J]。中國圖書(shū)館學(xué)報,2010(9):49—53。
【識組織系統下文獻檢索體系建設與驗證論文】相關(guān)文章:
公共文化服務(wù)體系下的建設路徑論文10-05
高校德育體系建設論文12-02
課程體系的建設論文05-28
體系建設水利科技論文11-05
組織文化建設論文11-14
淺析體系建設水利科技論文11-05
林業(yè)科技的推廣體系建設論文11-05
農村現代流通體系建設論文11-29
科學(xué)建設城鎮耕地體系的思考論文04-10