【自動化分析】 AutomaticAnalysis
【辭書名稱】圖書館學與資訊科學大辭典
自動化分析是利用機器(特別是指利用電腦),從事判讀具有意義型態的資料方法。
這些有意義型態的資料,包括寫碼於孔卡上的統計性、書目性、行政性的各種資訊;
印刷或感光於紙上的光學資料;
記錄於磁帶上的聲音;
以及文字段落中主題的內容分析等。
自動化分析研究的主題範圍相當廣泛,計有紙張印刷字體的自動辨識;
語音的自動辨識;
文獻內容關鍵字的自動截取;
物件、照片、圖畫等屬性的自動表達;
及對文獻內容的自動分析(例如自動索引法、自動摘要法)及文獻之間關係的分析(例如自動化分類,自動化叢聚)等。
自動化分析的技術與圖書資訊學有密切的關係。
在1879年時何樂氏(HermanHollerith)受聘於美國人口調查局(U.S.CensusBureau),從事人口調查統計的工作。
他為使調查結果的統計工作能快速完成,因此開始利用機器著手設計自動化計算的研究。
他發明並設計一架列表系統(TabulatingSystem)。
該系統利用電子觸控方式,感應穿洞的訊號並能從事卡片排序工作。
何樂式為便於機器的自動判讀,設計一張長16.8公分,寬8.25公分的卡片,用以記錄調查資料。
卡片上共有24列,每列有12個可穿孔的位置。
1890年何樂氏將人口調查所得原始資料依照一定的規則,記錄於卡片上,且在卡片上穿洞,代表特定的資訊。
例如凡是男性便於某特定列的孔洞鑿穿。
然後將這些記錄並穿洞完成的孔卡,一張張放置於一個盛滿水銀的器皿上。
這時機器便以一根探測針,逐一刺探卡片上橫向的位置。
探測針自然穿透有孔動的區域,而碰觸到底部的水銀。
由於針上通有電極,一旦針觸擊到水銀,便產生電流通路。
電流流通後又觸動到裝置有電子計數的刻度盤,使刻度盤上的指針自動移動一格。
當所有的孔卡都經過機器穿孔檢測之後,最後孔洞的總數便可由刻度盤上直接顯示出來,完成自動計數統計的目的。
隨著電腦技術的進步,利用電腦從事文獻自動化分析地快速的進展。
在自動化文獻分析的研究上,從早期自動化索引(如關鍵語索引法KWIC與關鍵字索引KWOC)與自動化摘要研究,到近年來藉用統計法或演算法從事文獻的內容分析,以使電腦自動從文獻內,截取出關鍵字或編輯摘要等,都是圖書資訊學一項重要的研究與應用。
在電腦科學方面,利用電腦從事人類語音的辨識與字型的判讀,亦是自動化分析的主要發展。
前者廣泛應用於電腦語音輸入的研究與聲音識別的研究上;
後者則應用於光學字元辨認(OpticalCharacterRecognition,簡稱OCR)的研究。
今日則使電腦能夠從手寫的字形或印刷的字體,將字符自動轉換成機讀的字元。
自動化分析的研究,亦隨著電腦科技的日新月異及研究人員的新發現,在不斷的進步之中。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|