【五術堪輿學苑】

 找回密碼
 【立即註冊】
查看: 1007|回復: 0
打印 上一主題 下一主題

【中文資訊交換碼】

[複製鏈接]
跳轉到指定樓層
作者
發表於 2012-11-25 14:42:21 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式

中文資訊交換碼

 

ChineseCharacterCodeforInformationInterchange,簡稱CCCII

 

【辭書名稱】圖書館學與資訊科學大辭典

 

中文資訊交換碼係由國字整理小組(後由文建會資助研發工作,易名為資訊應用國字整理小組)自民國69年起所陸續編訂公布的,為我國第一套中文字交換碼,也是目前我國唯一獲得國外(美國)認可為國家標準的交換碼(編號:ANSI/NISOZ39.64EACC-1989)。

 

CCCII並已被OCLC和RLIN採用為中日韓文的書目字碼標準。

 

CCCII的字集現有353個符號、26個控制字符、53,940個中文字,以及日韓漢字等。

 

中文字包括:正體常用字4,808、正體備用字17,032、異體常用備用字11,517和正體罕用字20,583。

 

CCCII採3位元組(分別為B3,B2和B1)編碼,每位元組為7位元,其編碼結構共有94面(以B3指示之),每面94段(以B2指示之),每段94個編碼位置(以B1指示之)。

 

此外還進一步將94面畫分成16層,其中第1到第15層為每層6面,而第16層則僅有4面。

 

CCCII的編碼規則如下:(一)每面的第一段保留為二位元組控制碼(B3不用,B2=33,B1指示控制碼功能),不安排任何圖形字符。

 

因此總編碼空間實際為94x93x94+94=821,842。

 

(二)所有中文字區分為正體字和異體字兩大類。

 

所謂異體字,指的是同音、同義但字形不同的中文字。

 

(三)所有正體字編入第一層,其規則為:先按常用、備用、罕用的順序將正體字分群並依序排列,各字群再按先部首、次筆畫數、最後筆順的次序排列。

 

(四)中共簡體字編入第2層,安放於其正體字的正下方,亦即簡體字的B2、B1與其正體字相同,但其B3比正體字的B3多6。

 

若某個正體字並無對應簡體字,則對應的位置留空。

 

(五)一般異體字編入第3到第12層,其規則為:按異體字的使用頻率高低(由文字學家認定之),自第3層起,垂直安放於其正體字的正下方,亦即異體字的B2、B1與其正體字相同,但其B3比正體字多6的倍數。

 

並非每個正體字都會有對應的異體字,而且即使有異體字,其字數也不固定。

 

若某個正體字的異體字超過11個時,超出部分即無法以正常方式編碼,必須另行設法。

 

(六)日本漢字散開安放於第13層,韓國漢字散開安放於第14層,兩者都以視為異體字的方式處理之。

 

(七)第15層保留。

 

(八)第16層用以安置其他非漢字字符。

 

 

轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary

評分

參與人數 1金幣 +500 收起 理由
天梁 值得鼓勵。

查看全部評分

【自由發言誠可貴、言辭水準需更高、若有污衊髒言顯、術龍五術堪輿學苑、不歡迎的喲!】
回復

使用道具 舉報

QQ|【google翻譯】|【手機版】|【Archiver】|【五術堪輿學苑】 ( 皖ICP備11003170號 )

GMT+8, 2025-4-3 05:52 , Processed in 0.062500 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表