湘里妹子学术网

 找回密码
 注册
查看: 2965|回复: 0

GB/T 12345 汉字编码字符集

[复制链接]
发表于 2004-3-7 14:51:45 | 显示全部楼层 |阅读模式
  GB/T 12345 和 GB 2312 一样,是中华人民共和国国家标准汉字信息交换用编码,全称《信息交换用汉字编码字符集 辅助集》,标准号为 GB/T 12345-90,中华人民共和国国家技术监督局 1990 年 6 月 13 日
发布,1990 年 12 月 1 日实施。
  GB/T 12345-90 是一个关于繁体汉字的编码标准。所谓“辅助集”,是与“基本集”(GB 2312-80)相对应而言。即:GB/T 12345“是与 GB 2312 相对应的图形字符集。原则上,本字符集是将 GB 2312 中的简化字用相应的繁体字替换而成。因此,这些替代的繁体字具有与被替代的简化字相同的编码;未曾简化的汉字以及非汉字图形字符,仍是 GB 2312 中的汉字及图形字符,并具有与之相同的编码。”
  关于繁体字替换简化字的原则,GB/T 12345 注明:“本标准原则上按照《简化字总表》中所列繁体字与简化字的对应关系进行替换。”《简化字总表》由中国文字改革委员会 1964 年 5 月发表,后经国家语言文字工作委员会作个别修订,国务院 1986 年 6 月 4 日批准重新发表。

  除了以上的根本差异外,GB/T 12345 与 GB 2312 的区别还有以下几点:
  1. 增补了个别图形字符,共收录 7583 个图形字符:汉字以外的图形字符 716 个,汉字 6866 个(其中一级汉字 3755 个,二级汉字 3008 个,增补汉字 103 个。
  a. “根据排版需要,增补了竖排标点符号 29 个,这些字符增补于 6 区 57 位至 85 位。”
  b. “根据 GB 5007.1(《信息交换用汉字 24×24 点阵字模集》),增加了 6 个汉语拼音用图形字符,这些字符增补于 8 区 27 位至 32 位。”
  c. “GB 2312 中,由于 60 年代汉字简化被精简的字有 103 个,这些被精简的字根据繁体字处理系统的需要增补于 88~89 区。”所谓精简,即废除某个繁体字,而用另一字代替,如废除“雲”字,而以“云”字代替。由此形成一个简化字对应两个或两个以上繁体字的现象。

  2. GB/T 12345 规定的在七位环境中指明图形字符集的转义序列不同,同时规定了在八位环境中的转义序列。

  GB/T 12345 没有指明其字符集的字形依据,但它使用的繁体汉字,与《简化字总表》中所使用的字形一致。其绝大多数汉字,使用了“新字形”。例如,“产”的繁体字,它使用了新字形“産”,而不用旧字形“產”。因此,一些旧字形与新字形的差异,被视为字形的差异(异体字),而不是繁体与简体的差异。如:收录“奂”、“换”、“唤”,而不用“奐”、“換”、“喚”,即因为“奐”是旧字形,而非繁体字。但是,其中极个别字又使用了旧字形,如“为”“伪”的繁体字,使用了旧字形“爲”、“僞”,而不用新字形“為”、“偽”。
  关于新旧字形,可参见中国社会科学院语言研究所编纂的《现代汉语词典》(商务印书馆 1978 年第一版)、《新华字典》(商务印书馆 1979 年修订版)所附的《新旧字形对照表》,以及辞海编辑委员会编纂的《辞海》(上海辞书出版社 1979 年出版)所附的《新旧字形对照举列》。

  关于被精简的汉字:
  1. 88~89 区所列的 103 个汉字,GB/T 12345 称为“60 年代汉字简化(时)被精简的字”。这一表述不完全准确。例如:“丰”与“豐”,汉字简化时精简了“豐”字,以“丰”字替代,而 GB/T 12345 将被精简的“豐”字,作为“丰”的繁体,置于 23-65;而将“丰”字置于 88-19。类似的情况占其 103 字的三分之一左右。
  2. 所谓 103 个“被精简的汉字”,只是被精简的“繁体字”,而未包括被精简(废除)的“异体字”。例如,“昇”和“陞”,作为“升”的异体字,被停止使用,GB/T 12345 亦未收录。相关的法定文件为中华人民共和国文化部、中国文字改革委员会 1955 年 6 月发布的《第一批异体字整理表》,该表列出异体字 810 组,1865 字,并规定废除异体字 1055 个。一些异体字,习惯上也被看作是简化字,所以,《简化字总表》特地从《第一批异体字整理表》中选出 39 个异体字,列为附录。
  3. 按照汉字简化原则,在容易引起歧义时不简化。例如“余”和“馀”,《简化字总表》对“余”字的脚注说:“在余和馀意义可能混淆时,仍用馀,如文言句‘馀年无多’。”同时,有些汉字,只简化其字义的某一个或几个义项,如“徵”,在“象徵”等义项上被简化为“征”,而在音乐调值的义项上(即宫商角徵羽的徵,读作zhǐ [止]),并不简化。因此在 GB 2312 中,保留了个别繁体(或异体)字,也就是说,同时收录了一个字的简体和繁体(或异体),这包括干乾、后後、伙夥、么麽、于於、余馀、折摺、征徵等。作为与 GB 2312 对应的繁体编码,GB/T 12345 在这些字上处理较混乱。例如:GB/T 12345 将“伙”置于 27-79,“夥”置于 66-23,与 GB 2312 编码相同,即,以“伙”对应“伙”,以“夥”对应“夥”。另一种情况是,GB/T 12345 将“後”置于 26-83,对应 GB 2312 的“后”,将“后”置于 65-65,对应 GB 2312 的“後”;将“徵”置于 53-87,对应 GB 2312 的“征”,将“征”置于 65-71,对应 GB 2312 的“徵”,显然不当。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2025-5-4 01:36 , Processed in 0.070474 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表