受控詞匯表是計算機科學和計算機程序設計中的一個概念,在構建關系數據庫時只使用先前商定或認可的術語,可搜索的元數據或其他系統,其中使用人類可讀的單詞來標記信息以備日后檢索。使用受控詞匯表對信息進行分類的方法與...
受控詞匯表是計算機科學和計算機程序設計中的一個概念,在構建關系數據庫時只使用先前商定或認可的術語,可搜索的元數據或其他系統,其中使用人類可讀的單詞來標記信息以備日后檢索。使用受控詞匯表對信息進行分類的方法與自然語言詞匯的概念形成了直接的對比,其中沒有約定的術語,所有使用的單詞都是通過加權關系連接起來的。除了在受控詞匯表中使用的頂級詞匯外,可以使用支持詞,這樣與頂級詞匯有強烈關聯的同義詞或其他詞匯可以觸發頂級詞匯的使用。自然語言系統和受控詞匯系統之間衡量的主要差異是使用這些詞的查詢結果的相關性,返回的信息量,以及系統的整體可用性。在許多情況下,用一組詞或詞來使任意的、不斷變化的或無序的信息更容易被用戶訪問。因特網搜索引擎中的搜索詞,公司信息數據庫,甚至數字研究圖書館都是應用程序的例子,通過這些應用程序,信息可以用元數據術語進行分類,而不是嚴格的層次結構。在這種情況下,用于描述對象的單詞可以為更大的信息池建立一種可搜索的索引。例如,使用在考慮一個公司的歸檔系統時,可以看到詞匯表。文件必須以一種便于和可預測的方式進行分類。如果一個文件涉及汽車,則可以將其歸入“汽車”類別如果另一個人也有一個關于汽車的檔案,而沒有一個受控詞匯,這個檔案可能會被放在“汽車”的標題下,這使得通過一次搜索很難找到這兩個檔案。當類別被控制時,所有關于汽車的檔案都將被放在一個商定的標題下。這樣做的好處是使用受控詞匯表是指信息是以可預測的方式被嚴格描述的。這意味著任何了解該詞匯表的人都能夠有效、準確地搜索信息。然而,詞匯表的一個復雜之處在于,如果不是不可能的話,搜索詞會更加困難,自動生成,通常需要一些人工干預,這使得將現有數據庫轉換為使用受控詞匯表是一項艱巨的任務。如果詞匯量不夠大,那么一個單一的查詢也有可能帶來如此大的信息量,因此不使用它進行排序就變得不切實際了另一個查詢方法
-
發表于 2020-08-07 07:56
- 閱讀 ( 2580 )
- 分類:電腦網絡