【自然語言】 NaturalLanguage
【辭書名稱】圖書館學與資訊科學大辭典
自然語言是相對於人工語言的一種人類語言,也是最合乎人類交談行為的溝通方式;
自然語言是依循著人類的自然進化而發展,成為人和人之間溝通的最基本工具,如中文、英文、日文等都是自然語言。
應用到資訊檢索系統時,凡是未採用控制詞彙(ControlledVocabulary)索引法的資訊檢索系統稱為自然語言系統,也就是利用人類所熟悉的語言下指令來操作電腦。
自然語言索引法分為3種:(一)人工索引法:由索引者自文獻中摘取能代表主題意義的詞彙,或由索引者自己制定索引用語,以代表文獻主題意義。
(二)電腦索引法:利用電腦程式控制,自文獻中抓取有意義的關鍵字以編制索引(三)完全不編製索引:即資料庫中每一個字都可單獨檢索或與其他字結合檢索。
自然語言索引法又稱為單字索引法(WordIndexing)或導出索引法(DerivationIndexing),因其索引用語直接取自文獻的正文,所以又稱為文獻擇字索引法(Free-TextIndexing)。
一般而言,自然語言系統的優點是有彈性、功能強、不需特別學習,但是自然語言系統必須對所處理的事物有充足的知識,並能理解複雜的句子;
換言之,自然語言的問題在無法解決語言上有關人類判斷的工作,如同義字、近同義字(Near-Synonyms)或半同義字(QuasiSynonyms)等語意以及語法不明確的困擾。
採用自然語言的線上查詢系統大都採用相近運算子(ProximityOperator)及切截法(Truncation)來解決自然語言在檢索上的困難。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|