識組織系統下文獻檢索體系建設與驗證論文
基于知識組織系統的文獻檢索操作,是當前數字圖書館領域文獻檢索方式的研究熱點方向之一,也是圖書館文獻信息的需求者與提供者之間對文獻資源進行的互操作行為。在文獻檢索過程中,如何更加合理地通過對知識組織系統的運用,提高文獻檢索的全面性和準確性,已成為當前文獻信息檢索的關鍵問題。
當前,基于知識組織系統的文獻檢索方式主要是從文獻關鍵詞的語義角度出發,通過基于分類表和敘詞表及知識本體的文獻檢索、基于文獻關鍵詞的標引和分詞檢索、基于關鍵詞的語義檢索以及敘詞表重構式檢索等檢索方式,以自動化標引為檢索手段,實現的文獻檢索服務。其中,借助敘詞表中的概念語義關系擴展與精化的用戶檢索式,是各種網絡信息檢索工具提高其檢索性能的常用方法。
此類文獻檢索服務以查閱、概念檢索、詞匯歸納等文本內容為核心,主要體現在文獻信息的關鍵詞語義擴展檢索和文獻信息的大眾分類法的檢索兩種模式上。基于文獻信息的關鍵詞語義擴展檢索模式,主要通過分析文獻信息的關鍵詞自身概念與語義概念間的關聯性,并對文獻信息關鍵詞自身的詞性進行標注,突出文獻信息關鍵詞的核心概念與語義,再借助關鍵詞自身概念與語義概念的關聯,實現基于關鍵詞本體的文獻信息語義檢索。語義檢索能處理信息的語義內容,實現基于語義的匹配和推理。該檢索方式突出了文獻信息中核心概念與文獻信息關鍵詞語義的串聯,并將文獻信息的核心價值通過文獻的關鍵詞標引進行充分的體現,使得檢索結果與文獻信息需求的關聯度大幅增加,減少了用戶需要篩選的檢索結果數量,提升了檢索的速率,提高了檢索結果的準確度。而基于大眾分類法的文獻檢索與傳統分類法相比,更加注重檢索者的檢索習慣,通過依照知識組織分類法處理各項文獻和檢索用戶自定義的自由詞作為數字資源標注整理,實現檢索與瀏覽的功能,使得檢索過程更加便捷有效。
現階段,對獨立創建的知識組織系統的映射和服務協議是實現知識組織系統互操作的主要方式。當前,基于知識組織系統的文獻檢索研究主要是通過將關鍵詞語義和文獻分類法與文獻的關聯為基礎,實現類似將分類主題詞表和元數據集成在一起構造一個知識網絡并在其上實施知識瀏覽和概念檢索。這種檢索模式在一定程度上提高了文獻檢索的便捷性和全面性。
但在當前文獻涵蓋面廣、涉及領域雜的文獻環境中,資源組織體系不規范,造成基于文獻關鍵詞語義和文獻分類法關聯的檢索模式缺乏科學的導航體系和完善的管理平臺進行關聯性檢索操作,使得文獻信息需求者在文獻檢索過程中無法對文獻關鍵詞的擴展和標引進行正確的控制;同時,跨語言互換過程中語料庫的無法實時更新,使得檢索結果的準確性和全面性受到影響;以及搜索引擎績效評價較少,使得檢索的過程效率無法得以明確的體現。針對當前所面對的問題,筆者提出了一種個性化的基于知識組織系統的文獻檢索體系構造,旨在以概念格、本體、數據挖掘、語義標注等理論與技術的互補融合為基礎理念,形成滿足檢索用戶需求為前提的檢索操作,并通過對體系個性化、關聯性、評定反饋及安全性 4 個方面的構造,實現全面性和準確性的個性化文獻檢索活動。
1 基于知識組織系統的文獻檢索體系模塊
基于知識組織系統的文獻檢索的運作目的,在于使信息需求者能夠通過自身信息需求的提取和檢索,實現全面準確的目的性檢索。同時,概念格、本體、數據挖掘、語義標注等操作技術的運用,實現了基于知識組織系統的文獻檢索體系的構建。
而基于知識組織系統的文獻檢索模塊,主要由信息需求模塊、關聯運行模塊、評價反饋模塊和安全保障模塊 4 個部分組成。
1。1 信息需求模塊
信息需求模塊在文獻檢索體系中的設立,主要是用來完善合理的文獻檢索用戶的檢索需求,使文獻檢索用戶在檢索過程中,能夠針對自身的檢索需求進行文獻檢索活動,提高檢索的效率以及檢索結果的利用價值。圖 1 為信息需求模塊結構圖。
文獻檢索用戶是個性化文獻檢索活動的主體。要明確文獻檢索用戶的核心需求,需要先明確用戶的需求主題和關鍵詞,并通過對文獻需求指標的關聯和分析,明確用戶的直接需求和潛在需求,同時也明確自身需求信息存在的屬性與載體形式。
在個性化文獻檢索活動中,用戶的需求指標是檢索的核心要素。而如何建立完善合理的個人信息指標體系,明確用戶的各項信息需求在檢索指標中的界定標準,體現檢索指標的各個環節、體現用戶自身的信息需求,就成為當前確定用戶文獻檢索需求的關鍵點。通過信息需求模塊的設定可以看出,個人用戶在檢索需求指標的選取上具有針對性和全面性。
1。2 關聯運行模塊
關聯運行模塊體系結構一共有 4 個組成部分,分別為用戶的核心需求、需求主題的內在關聯、需求關鍵詞的內在關聯以及關聯中樞。圖 2 為關聯運行模塊結構圖。
檢索關聯運行模塊的核心,在于通過對檢索用戶核心需求的提取和分析,標注其需求主題和需求關鍵字,同時對檢索用戶需求主題中客戶的潛在需求和直接需求的判定,以及需求關鍵詞體現相關需求的屬性和載體分析,實現檢索用戶需求的整體體現,并通過關聯中樞的關聯與整合,實現檢索用戶相應需求之間的互操作運行。在檢索關聯運行過程中,知識組織系統針對用戶檢索的相應所需,通過知識數據整合與互操作技術實現文獻數據間的'關聯,并通過關聯因子得出需求信息的關聯數據。
1。3 評定反饋模塊
評價反饋模塊體系是對文獻檢索結果的綜合評定,具體由檢索結果的全面性、有效性、準確性和利用率 4 部分組成。圖3為評定反饋模塊結構圖。在評定反饋體系運行中,將檢索到的結果分別在用戶檢索需求和用戶需求環境中進行全面性、有效性、準確性和利用率的評定,并通過等級的劃分實現信息檢索結果價值的體現。
檢索結果的等級指標體系是檢索結果的核心價值體現,因此,評價反饋模塊中各個具體評定指標的確立和運行,使得檢索結果的針對性得以充分的體現。
1。4 安全保障模塊
安全保障體系是通過將文獻檢索過程中各項信息安全環節融合并組成的安全保障體系,其具體可以體現在信息保護體系和安全保障體系兩個主要部分。
信息保護體系主要是對用戶在文獻檢索過程中的個人需求進行安全保護,具體是通過對用戶的信息需求提取操作過程中用戶需求關鍵字的挖掘整理來實現;安全保障體系負責對體系的整體運行進行操作,主要是通過對檢索結果進行安全策略的分析與實施,并在體系運行過程中設定安全效果的反饋,用以保持和完善用戶安全保障模塊的運行。圖 4 為安全保障模塊圖。
在基于知識組織系統的文獻檢索體系中,安全保障模塊運行的核心在于通過將用戶的個人信息以及檢索到的各類需求信息,通過信息清理、分析以及安全加密管理,實現信息的安全保障。信息安全保障體系是信息檢索過程中用于保障用戶信息安全的重要環節。信息安全保障體系旨在為用戶的個人信息以及從外界通過信息檢索所搜集到的信息提供安全保障,避免泄密事件的發生。因此,檢驗信息安全保障體系是否具有可行性的關鍵,在于該體系能否解決各種客觀環境下日益加劇的信息安全漏洞,實現對用戶個人信息的安全保障。
2 基于知識組織系統的文獻檢索體系構建與驗證
2。1 基于知識組織系統的文獻檢索體系構建
基于知識組織系統的文獻檢索運作機制的核心,在于信息需求者是否能夠通過模塊實現信息的全面性和準確率。圖 5 為基于知識組織系統的文獻檢索體系圖。
在基于知識組織系統的文獻檢索體系中,信息需求者將自身的信息需求通過信息需求模塊進行提取,并在安全保障模塊中對提取的信息各項需求進行集成歸納,通過將集成的信息在關聯運行模塊中進行關聯和檢索,并將檢索的結果通過安全保障模塊進行呈現的同時,利用評價反饋模塊在安全保障模塊下實行結果評價和反饋,完成信息需求者所需的信息獲取。
2。2 實驗驗證
(1)信息需求。以歷史為需求的大類目,篩選以下 5 條文獻需求信息:需求信息 1———史學類相關文獻;需求信息 2———文學類文獻;需求信息 3———中國現代研究文獻;需求信息 4———史料記載研究類文獻;需求信息 5———魯迅方面相關研究文獻。
將上述 5 條需求信息進行關鍵詞提取,所提取的關鍵詞見表 1。
在信息需求模塊中,需求信息的關鍵詞分別提取為史學、文學、中國現代研究、史料記載和魯迅研究;再通過關鍵詞合并需求關鍵詞,集成出需求信息:中國現代文學史料研究之魯迅方面相關研究文獻。
(2)關聯運行。通過信息需求的集成操作,可將信息需求者的需求信息歸納為:中國現代文學史料研究之魯迅方面相關研究文獻。再通過關聯運行模塊,將需求信息提取為:中國現代文學史料研究、魯迅研究文獻兩個方面。在運行過程中,關聯運行模塊將中國現代文學史料研究導入文獻檢索系統過程中進行檢索。表 2 為中國現代文學史料研究檢索結果呈現表。
再通過將“魯迅研究文獻”作為二次檢索條件放入已檢索的關聯結果中,可得檢索結果:中國現代文學史料研究舉隅:魯迅、郭沫若、高長虹及相關研究。
(3)評價反饋。將關聯運行模塊的結果放入反饋評價模塊中,并將檢索的結果與 5 條文獻需求信息進行比對評價反饋,確定結果的全面性、有效性、準確性和利用率。表 3 為評價反饋評定表。
3 未來發展展望
當前,文獻信息主要以網狀結構分布于知識組織體系中。為了適用文獻信息的動態性調整,注重知識組織中文獻信息的挖掘獲取,基于知識組織系統的檢索已逐步形成一套概念性的個性化檢索體系,該體系建立在文獻信息多樣化的基礎上,通過減少信息的重復分析,提高檢索效率和檢索質量。在基于知識組織系統的文獻檢索過程中,檢索需求者需要通過對信息點的實時更新,并根據自身的需求設定檢索方向,實現用戶在檢索操作過程中的完善便捷服務。
在知識組織系統工具與信息檢索功能結合起來所形成的基于知識組織系統的文獻檢索模式中,智能化的檢索、分析和處理體系的特點和優勢,符合當前檢索的發展需求,是未來檢索領域的研究熱點。而如何將基于知識組織系統的文獻檢索與當前文獻檢索服務相結合,更好地體現其操作的便捷性和檢索結果的有效性,是接下來我們研究的主要方向。
參考文獻
[1] 薛春香。網絡環境中知識組織系統構建與應用研究[M]。南京:東南大學出版社,2009。
[2] 董慧,唐敏。語義檢索在 Web2。0 環境下的應用探討[J]。中國圖書館學報,2011(3):115—119。
[3] 王軍,張麗。網絡知識組織系統的研究現狀和發展趨勢[J]。中國圖書館學報,2008(1):65—69。
[4] 王軍。基于分類法和主題詞表的數字圖書館知識組織[J]。中國圖書館學報,2004(3):70。
[5] 蔡箐。 學科信息門戶及其優化途徑[J]。 中國圖書館學報,2008(4):114—118。
[6] 馬志杰。我國搜索引擎評價研究的現狀、問題及對策[J]。圖書館學研究,2013(4):11—17。
[7] 滕廣青,畢強。知識組織體系的演進路徑及相關研究的發展趨勢探析[J]。中國圖書館學報,2010(9):49—53。
【識組織系統下文獻檢索體系建設與驗證論文】相關文章:
公共文化服務體系下的建設路徑論文10-05
高校德育體系建設論文12-02
課程體系的建設論文05-28
體系建設水利科技論文11-05
組織文化建設論文11-14
淺析體系建設水利科技論文11-05
林業科技的推廣體系建設論文11-05
農村現代流通體系建設論文11-29
科學建設城鎮耕地體系的思考論文04-10