【加權索引法】 WeightedIndexing
【辭書名稱】圖書館學與資訊科學大辭典
加權索引法是索引人員依照索引辭彙在文獻內的重要程度,給予特定加權數值的索引方法。
加權索引法改進了傳統索引法中,對於主題索引辭彙只有要或不要二分法的缺失,使得披索引辭彙還顯現其重要程度。
被加權後的索引辭彙,因其重要程度不同而顯示出特定的順序關係。
加權索引法是由索引人員對文獻資訊分析後,依據其專業判斷給予索引語彙一個加權值,以代表該索引語彙在該分文獻的重要性。
一般而言,該索引語彙越接近文獻的主題或範圍,其加權值越高。
然而由於加權值的給予是由索引人員主觀專業的判斷,因此不同索引人員對同一分文獻索引語彙的加權值會產生明顯的不同。
一般為力求客觀,一分文獻加權值的取定,通常由數位索引人員共同取定。
若發生某索引語彙的加權值差距過大,將以多數決方式議定最後的加權值。
由於加權索引法的製作成本相當高,只有少數的資料庫採用加權索引法製作索引。
加權索引法在1960年代由梅隆(M.E.Maron)與孔恩斯(J.C.Kuhns)提出,他們稱此種索引法為機率式索引法(ProbabilisticIndexing)。
當時的人工索引方式還是使用傳統索引方式,但是在自動化或半自動化電腦索引中,許多早期的自動化索引系統,或多或少已有使用到加權索引的觀念。
加權索引法在文獻檢索方面有兩方面的應用。
第一種是資料檢索人員在從事資訊檢索時,可給予檢索語彙一個加權值,凡文獻的索引語達到此加權值才會被檢索出來。
此種方式可以去除大量與主題相關但不完全切合的文獻。
第二種方式是可以依照文獻與檢索主題相關程度,由高度相關到低度相關逐一列印,即依照檢索語的加權數值由高到低排序列印,使用者看到第一筆資料即為最切合檢索主題的文獻。
較一般資料庫多一種排序列印功能,此功能又稱之謂相關排序(RelevanceRanking)。
目前許多資料庫也應用了加權索引法的概念。
這些資料庫將索引語彙分成主要描述語(Major)與次要描述語(Minor)兩種。
主要描述語使用來製作資料庫紙本式目錄;
而次要描述語只以機讀方式儲存於資料庫內。
供線上檢索時使用。
這類的資料庫包括MEDLINE,NTIS,ERIC等書目資料庫系統。
當檢索人員在檢索此類資料庫時,可以在檢索語彙加上條件,指定某檢索語彙必須是主要或次要描述語,才被檢索出來,此方式大大增加檢索精確度。
除了分成兩層外,在BIOSIS書目資料庫系統中出現三層的加權法。
第一層是主要描述語(Primary),用以列印紙本式目錄;
第二(Secondary)與第三(Tertiary)分別代表描述語中等與微量重要性,但只供線上檢索使用。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|