【中文標準交換碼】 ChineseStandardInterchangeCode
【辭書名稱】圖書館學與資訊科學大辭典
為促進中文資訊標準化,經濟部中央標準局於民國75年(1986)9月公布了「通用漢字標準交換碼」(StandardInterchangeCodeforGenerally-UsedChineseCharacters)CNS11643,共收有13,051個常用中文字及684個符號。
後為因應資訊使用者之需求,中央標準局於1991年9月委託資訊工業策進會邀請專家學者、資訊使用單位及標準相關單位,參考教育部所公布之常用、次常用、罕用及異體國字字表進行修編,於1992年7月5日審核通過,並改名為「中文標準交換碼」(ChineseStandardInterchangeCode),共收有48,027字及684個符號,做為中文資訊交換之標準。
為符合國際編碼標準,「中文標準交換碼」參考CNS5205資訊處理交換用7位元碼字元集(組),亦即ISO646:ISO7-BitCodedCharacterSetforInformationInterchange及CNS7654資訊處理--7位元及8位元碼字元集--延碼技術,亦即ISO2022:ISO7-Bitand8-BitCodedCharacterSet-CodedExtensionTechniques等兩個國際通信標準而制訂。
依據此兩個標準,中文標準交換碼以兩個7位元之位元組(Byte)為編碼單位,每個位元組均避開00至20及7F之控制碼,則7-Bit字碼集共有94個編碼位置,兩個位元組可編碼8,836個中文字,訂為一字面。
中文標準交換碼分為16字面(Plane),其中第1至第7字面編有字集,第8至第11字面預留空白,而第12至第16字面為使用者加字區,凡未編於第1至第11字面之中文字及符號,使用者可視需要自行編訂於此區域使用。
為提高電腦使用效率,減少字面轉換次數,此編碼系統依中文字之使用頻率特性,將48,027個中文字分別編於第1至第7字面,如下所述:(一)第1字面之字集:蒐編最常用之中文字集,包含教育部頒布之「常用國字標準字體表」之4,808字,國中、小教科書常用字587字及異體字6字,共5,401字。
(二)第2字面之字集:第2字面共編訂7,650字,包含教育部所頒布之「次常用國字標準字體表」及1,320個使用頻率較高而包含於罕用字集之中文字。
(三)第3字面之字集:第3字面之字集為77年6月由行政院主計處電子處理資料中心所整理出來之教育部罕用字及異體字,原放置於使用者加字區第14面之第1部分6,148字之字集。
(四)第4字面之字集:第4字面之字集共7,298字為從內政部戶政系統用字、ISODIS10646第2版之漢字、各資訊單位所使用之漢字以及原放置第14字面第2部分之171字整理而成。
(五)第5字面之字集:第5字面之字集共8,603字為教育部所頒布之罕用字而不包含於前4個字面之字集。
(六)第6字面之字集:第6字面之字集共6,388字,為從教育部所頒布之異體字表中,其筆畫在14畫(含)以上且不包含於前5個字面之字集。
(七)第7字面之字集:第7字面之字集共6,539字,為在教育部所頒布之異體字表中而不包含於前6個字面之字集。
「中文標準交換碼」除作為中文資訊交換用外,方可做為資訊系統廠商設計內碼系統字集、字序之參考標準。
而使用者亦得根據自己的需求,參考此標準選擇適當的字集,以節省成本並提高電腦之處理效率。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|