湘里妹子学术网

 找回密码
 注册
查看: 3414|回复: 2

《规范汉字表》研制的几个问题

[复制链接]
发表于 2004-9-28 23:47:18 | 显示全部楼层 |阅读模式
作者:王铁琨
(教育部语言文字信息管理司,北京  100816)
来源:中国语言文字网

----------------------------------------------------------------------------------------------

    摘 要:研制《规范汉字表》是语言文字规范标准体系建设的一个重要内容。本文围绕《规范汉字表》研制涉及的几个问题,即课题酝酿上马的经过、立项研制的必要性和可行性、对“规范汉字”的基本认识、字表研制的框架构想、以及跟《规范汉字表》研制相关的几项工作等,介绍一些情况,侧重谈个人的思考认识。
    关键词:汉字;规范汉字;字表;标准;研制

    笔者在《试论〈国家通用语言文字法〉颁行的意义及其特色》一文中指出:《国家通用语言文字法》的颁行,不是语言文字规范化工作的终结,而是新的开始、新的起点。“十五”期间,语言文字工作者特别需要在“重在建设”上下功夫,力争在国家通用语言文字的法规体系建设、规范标准体系建设、面向信息处理的语言文字基础工程建设、应用语言学(含语言规划)学科理论建设和语言文字管理机制建设等五个方面取得较大的进展。 其中,语言文字规范标准体系建设是一个非常重要的工作方面,而研制《规范汉字表》则是语言文字规范标准体系建设的一个重中之重的项目。 本文围绕《规范汉字表》研制的酝酿过程,《规范汉字表》研制的必要性、可行性,对“规范汉字”的再认识,《规范汉字表》研制的基本构想,以及跟《规范汉字表》研制相关的几项工作等,谈一下有关情况和个人的思考认识。

    一  《规范汉字表》研制的酝酿和上马经过
    上世纪末,我国语言文字工作的历史上出现了一件引人注目的大事,那就是《中华人民共和国国家通用语言文字法》于2000年10月31日经全国人大常委会审议通过颁布,并从新世纪的第一天起施行。这部法律的颁行,直接促成了《规范汉字表》研制课题立项。
    语言文字工作概而言之包括两个方面:语言文字规范标准的制定和语言文字规范标准的推行。其中“治标”工作是“推行”工作的基础,尤显得重要。新中国成立以来,汉字的整理简化以及汉字规范标准的制定工作取得长足进展,不但方便了社会交际,基本满足了教育教学、新闻出版等方面的需求,而且在推进我国中文信息处理技术和信息产业的发展方面发挥了积极的促进作用。当前我国正处在以信息化带动现代化、实现跨越式发展的重要历史时期,语言文字作为信息的主要载体,其规范化、标准化程度直接关系到国家的信息化水平。信息化、现代化使古老的汉字焕发了青春,同时又对汉字的进一步规范化、标准化提出了更高、更迫切的要求。从这个意义上说,加强汉字规范标准建设是加快信息化、现代化步伐的基础性工作,是直接为国家信息化、现代化服务的。
    《国家通用语言文字法》以“推动国家通用语言文字的规范化、标准化及其健康发展”为立法宗旨,它的颁行为实现国家通用语言文字的规范化、标准化提供了强有力的法律保障,创造了加快语言文字规范标准建设的良好机遇和条件。该法在“总则”中明确规定:“本法所称的国家通用语言文字是普通话和规范汉字”,“国家推广普通话,推行规范汉字”。 法颁行后,社会有识之士纷纷呼吁尽快立项研制《规范汉字表》。 经过慎重调查研究和科学论证,教育部、国家语委于2001年4月批准《规范汉字表》研制课题立项; 2002年10月,《规范汉字表》研制课题被国家语委科研规划领导小组明确为语言文字应用研究“十五”科研规划的“重大项目”,予以重点支持;2003年1月,“抓紧《规范汉字表》的研制”列入《教育部2003年工作要点》,从而把扎实严谨的学术研究与规范有序的行政运作进一步有机地结合在一起。
    其实,酝酿《规范汉字表》研制并非始于今日,早在20 世纪80年代,这项工作就曾提上日程,只不过当时不叫《规范汉字表》,而叫《标准现代汉字表》。1980年3月,国务院发出《关于充实和加强中国文字改革委员会的通知》,同年5月20日,新一届中国文字改革委员会举行第一次全体委员会议。会议经过讨论,原则通过《中国文字改革委员会1980年工作计划要点》,原则通过《关于研究和制订标准现代汉字表的建议》和《制订标准现代汉字表的科研计划》。 当时由于“文革”刚结束不久,拨乱反正的任务很重,调整充实后的文改会忙于研究处理《第二次汉字简化方案(草案)》等更为紧迫的问题,这项工作未能按计划全面落实。
    一晃十几年过去。到了20世纪90年代,研制《规范汉字表》又被重新提起,并曾经两次上马。
    一次是1994年,根据当时汉字社会应用的需要和社会用字管理工作的需求,国家语言文字工作委员会再一次把研制《汉字规范字表》列入“工作计划要点”,责成语言文字应用研究所组织力量完成,同年该课题被列为语用所重点项目。研制工作得到语言文字学界和中文信息处理界的关注、支持,提出字表编制的许多方案和建议,归纳起来,具有代表性的是三种方案:⑴对现有字表不增不减不改,仅把它们合并编制成一个字表;⑵现有字表基本不动,但对其中十分明显的疏漏和矛盾之处作必要的调整;⑶比较彻底地解决现行汉字规范中存在的问题,制定一份全新的、比较理想的规范字表。课题组权衡利弊,认为在当时情况下只有第二种方案比较可行。随后对《第一批异体字整理表》《简化字总表》《现代汉语通用字表》《信息交换用汉字编码字符集·基本集》及其第二、第四辅助集等6个字表(字符集)进行比对、梳理、分析,形成字表编制的初步设想。后来由于时机不够成熟、客观条件不很具备以及认识上的某些原因,字表的实际编制工作没有能够进行下去。
    上世纪90年代末,随着语言文字立法步伐的逐步加快,《规范汉字表》研制再次提上日程。当时由全国人大教科文卫委员会牵头的《中华人民共和国国家通用语言文字法》(初名《中华人民共和国语言文字法》,后改现名,内容随之作了调整)起草工作正在加紧进行,草案征求意见过程中,不少同志提出应该对“规范汉字”这一术语进行界定,同时为了配合该法的颁布实施,也需要给公民提供一份统一的用字规范,作为与该法相配套的辅助文件发布。1999年,经国家语委科研规划领导小组批准,《规范汉字表》研制课题正式立项,傅永和为项目负责人。当时从“稳定”和方便群众使用出发,考虑到过去发布的各种汉字规范需要有一个逐渐消化和巩固的过程,故课题组确定的研制基调是:不做大的改动,将以往发布的各种字表(不含字符集)整合汇编成一个统一的新字表。该字表以7000个现代汉语通用字为标准字头,标准字头下,已简化的字后面标注繁体字,有异体的字在选用字(正体)后面标注相应的异体字,新旧字形有明显差异的在新字形后标出旧印刷字形;对于繁、简体之间不是一一对应关系,正、异之间有读音或意义差别的,另加注释说明。 显然,这次研制的是一个以“汇编”为主的“准规范”。2001年3月,字表(草案)按预先设计编制完成。此时《国家通用语言文字法》已经发布施行,语言文字工作形势发生了一些新变化,研制《规范汉字表》的计划不得不相应作出重大调整,这样,已经编制完成的字表(草案)就没能面向社会征求意见,当然也就无须再进入学术鉴定和审定等程序了。
    从上面的回顾不难看出,《规范汉字表》(包括前述《标准现代汉字表》《汉字规范字表》)的研制正可谓“好事多磨”。20几年中,该课题曾多次被提上日程、三次上马两次夭折。所不同的是第二次的“夭折”,实质上是适应新形势、新需求而自觉地“中止”项目,它反映了主管部门思想观念进一步解放,孕育着新的、更大动作的开始;已编制完成的字表(草案)虽被搁置,但其初步成果和基本做法(如在已简化的字后面标注对应的繁体字、在选用的正体字后面标注对应的异体字等处理方式,以及字表对使用中容易混淆以至出错的汉字尝试适当加注等做法)都被新启动的项目吸收并渗透到研制工作中去。所以笔者认为,2001年4月重新立项研制《规范汉字表》,是适应《国家通用语言文字法》颁行后形势发展需要的新举措,体现了新世纪语言文字规范标准建设要继往开来、与时俱进的主导思想。

    二   《规范汉字表》研制的必要性、可行性
    (一) 研制《规范汉字表》的必要性
    第一,  研制《规范汉字表》是对已有汉字规范标准进行维护更新的需要。新中国成立以来,政府在汉字整理简化以及汉字信息处理方面做了大量工作,国务院及其语言文字工作部门和其他有关部门,陆续发布了《第一批异体字整理表》《汉字简化方案》《简化字总表》《印刷通用汉字字形表》《现代汉语常用字表》《现代汉语通用字表》《信息交换用汉字编码字符集(基本集和第二、第四辅助集)》《信息技术  通用多八位编码字符集(USC)第一部分:体系结构与基本多文种平面》等规范标准,有力地促进了汉字社会应用的规范化、标准化以及中文信息处理技术的发展。经过近50年努力,包括简化字在内的规范汉字已经成为当今社会用字的主流,并对汉字在海外的使用产生巨大影响。这是举世公认的了不起的成绩。
    但是也应该看到,过去由于时代和技术条件等限制,一些同志对汉字历史地位和发展前途的认识有些不够全面,对语言文字自身演进发展的规律和复杂性估计不足,某些字表(包括信息处理用字符集)在研制过程中操作欠规范,致使各字表(字符集)之间存在着一些相互矛盾、收字不尽合理或者字形不够规范的现象;加之字表(字符集)发布后长时间没有及时维护更新(标准一般5年左右需要修订一次,而汉字的个别字表发布后将近50年没有做过正式调整),已经很难满足当今社会用字的实际需要,人们在教学、播音、新闻出版以及进行计算机汉字处理时常常会遇到一些难以解决的问题,从而造成资源上、经济上的浪费;又由于各字表(字符集)制定和发布的时间跨度大,研制人员前后变化频繁、难以照应,而且字表(字符集)各有侧重、 体例不一, 检索起来十分不便,给使用带来一定的困难。这些问题固然是多种因素综合作用形成的,但显现以后没有能够及时维护更新字表(字符集),恐怕是问题积压下来长期得不到解决的一个重要原因。客观说,限于当时认识水平和技术条件,我们的前辈已经尽了最大努力。任何规范标准都需要在应用实践中逐步完善,希求规范标准一出台就十全十美既不可能,也不现实,更何况事物是在发展的,人们对事物的认识总需要有一个过程。不仅规范标准本身需要在实际应用中及时维护更新,其实人们对规范标准的认识也常常是在不断深化和更新的。比如,人们在用现在的认识去衡量以往制定发布的某些规范标准时,常常会感到有一些不尽如人意之处,即使是现在还在使用的某些规范标准,较后发布的也会与较前发布的在规范理念和处理方式上有所不同。这是正常的,符合事物发展的客观规律的。现在重新启动《规范汉字表》研制项目,正是有针对性地对已有规范标准进行维护更新的一种补救措施,迟虽然迟了些,但经历这样一个过程以后,人们思考问题就比较客观、全面一些了。
    第二, 研制《规范汉字表》是解决汉字现实应用中提出的问题的需要。 当前随着教育的普及,公民受教育的程度和民族整体文化水准显著提高,这给一定范围内(如教育基本用字)字量的确定、《规范汉字表》的分级和收字提供了新的参照系。伴随信息网络时代的到来,计算机成了现代社会人们工作、学习和生活中须臾离不开的工具,由于字符集的收字量早已覆盖了现有规范字表,这就使得信息处理用字的规范化问题愈发显得重要和突出。针对各界反映强烈的语言文字规范标准研制工作滞后和计算机汉字库中不断显现出来的问题,《规范汉字表》研制必须紧紧跟上时代,要兼顾一般社会使用和信息处理的需要,使字表和信息处理用字符集在字形规范化方面保持一致,以方便社会应用。这是信息时代对汉字规范标准建设提出的必然要求,语言文字工作部门和语言文字工作者要顺应形势,把工作做在前头。另一方面,科技、社会的飞速发展也带来语文生活的日趋活跃,社会用语、用字面貌急剧变化,新词术语不断涌现,而且随着时代的前进,文字应用在某些领域的重要性愈发突出(比如解决人名、地名和科技术语用字的规范化问题就比以往更加显得重要和迫切),这些都需要我们根据变化了的社会语文生活及时对原有的规范标准作出调整,研制出新的规范字表来,适应新世纪语言文字应用的客观需要。《规范汉字表》作为现代汉语规范字表,要把能够适应当代社会交际需求且通行面较宽、有一定使用频度的现代汉语通用字全部收进来,兼顾有一定使用需求的姓氏、人名、地名、民族、宗教、科技术语等专门用字,以满足现实应用的需要;同时,它所收的字在字形上应该是完全标准的。罕用字、方俗字一般不属于《规范汉字表》的收字范围,这类字的字形规范问题需要通过更大范围的整理工作来完成。
    第三, 研制《规范汉字表》是贯彻落实《国家通用语言文字法》的需要。这方面的意义,我们前面已经谈过,这里再补充几句。《国家通用语言文字法》确立了普通话和规范汉字作为国家通用语言文字的法律地位,对普通话和规范汉字在国家机关、学校、新闻出版、广播影视、公共服务行业以及公共场所、信息技术产品、广告、招牌、企业事业组织名称和在境内销售的商品的包装、说明等方面的使用,作出了规定。该法的颁行,标志着语言文字工作进入依法行政、法制管理的新时期,迫切需要有一份字量合适、收字合理、字形规范、排序科学的《规范汉字表》作为依据,使群众有所遵循。这是该项目得到国家语言文字主管部门重视,并能够尽早立项启动的直接原因。换句话说,《国家通用语言文字法》颁行以后,根据该法“(国家)推行规范汉字”和“国家颁布国家通用语言文字的规范和标准,管理国家通用语言文字的社会应用,支持国家通用语言文字的教学和科学研究,促进国家通用语言文字的规范、丰富和发展”等规定,国务院及其语言文字工作部门有责任有义务组织力量,在对以往发布的字表(字符集)进行全面梳理、研究的基础上,编制出新的字表,给公民提供一份科学、严谨、统一、实用的用字规范。
    第四, 研制《规范汉字表》是贯彻党的十六大精神,为实现“全面建设小康社会”奋斗目标创设良好的语言文字环境的需要,对我国民族地区国家通用语言文字的推广普及以及使用汉字的国家、地区的“书同文”具有重要意义。十六大提出了在本世纪头20年全面建设惠及十几亿人口的更高水平的小康社会的奋斗目标。这是一种全面综合的、更加重视人文环境和人民生活质量的发展目标。这一目标的实现对新世纪语言文字工作提出了新的要求,而研制《规范汉字表》,显然对创设与“全面建设小康社会”相适应的良好语言文字环境具有促进作用。需要从国家经济、政治、文化全面均衡发展的宏观大背景出发,从促进社会主义物质文明、政治文明、精神文明的协调发展和可持续发展的要求出发,来观照字表研制工作。既要考虑东部相对发达地区语言文字应用的需要,也要充分考虑“西部大开发”所涉及的民族地区的双语教学等问题,尽可能通过《规范汉字表》研制为民族地区群众学习、使用国家通用文字提供方便。研制《规范汉字表》还关系到汉语、汉字国际地位的提高。中国是汉字的故乡,使用汉字的国家和地区出于切身需要考虑,都很关注我们汉字规范标准如何定,其中有些国家(如新加坡和泰国、马来西亚的华人社区等)原本就采用我们的规范标准,他们自然期待中国首先解决好现行汉字规范标准中存在的问题。从某种意义上说,字表(字符集)中已发现的问题解决不了或解决不好,都可能会在一定程度上影响我国的国际形象和使用汉字的国家、地区人民的“汉字情结”。
    (二) 研制《规范汉字表》的可行性
    研制《规范汉字表》不但是必要的,也是可行的。当前启动这个项目的有利条件是:(1)近50年来,我们有研制多个字表和字符集(含已发布、未发布和发布后又“废止”的)的实践基础,当年参与过研制工作的老同志有些还健在,第一手资料有些还保留着,底数比较清楚,这是最宝贵的财富;(2)国家语言文字工作部门和学术界针对字表(字符集)中的问题,多年来组织进行的研究工作一直没有间断(包括《规范汉字表》课题头两次上马所做的研究整理工作),获得许多局部的、阶段性的研究成果,这些成果可资借鉴;(3)目前研究队伍比较齐整,一些近年来培养的汉字学博士、硕士年富力强,随着计算机技术的广泛应用,现在研究方法特别是研究手段比过去有了很大改进,我们可以借助计算机和语料库进行字频统计分析和字的跟随率、分布度等的研究,从而使字量、字种的确定更为科学,也更加符合实际;(4)伴随改革开放和经济全球化、国际标准化进程的加快,我国与韩国、日本等国以及香港、澳门、台湾地区汉字学界和信息处理界加强了联系沟通,对这些国家、地区汉字使用和研究的现状有了更多的了解,视野比较开阔;(5)研制《规范汉字表》是近20多年来一直想做而没能做成的事情,现在国家越来越重视社会主义文化建设和人文社会科学研究,加之《国家通用语言文字法》的出台大大提高了公民使用语言文字的法制意识、规范意识,因此乘该法出台的强劲东风,重新启动这一项目是适时和可行的。经过努力,有望水到渠成地解决现行汉字规范标准中存在的问题。

    三  对“规范汉字”的再认识
    研制《规范汉字表》,无法回避“规范汉字”的界定问题。“规范汉字”这一术语出现时间有据可考的也不过十六七年,目前学术界对它的认识还不很一致,出现过大同小异的各式各样的定义。比如1992年7月,新闻出版署和国家语言文字工作委员会发布的《出版物汉字使用管理规定》,就具体说明了什么是规范汉字,什么是不规范汉字。 于根元主编的《推广普通话,促进语言文字规范化》(语文出版社、学习出版社、中国法制出版社,1998)、傅永和《汉字七题》(河南教育出版社,1993)等著作,都对规范汉字作出过界定。 《国家通用语言文字法》起草过程中,对要不要把规范汉字的定义写进法中曾有过争论,几经反复,最终还是删去了“定义”。这是因为:现在流行的几种学术定义本身是否科学、严密还值得研究。法律不规定“规范汉字”的定义,并不会造成人们对规范汉字产生误解;而把定义写进法中,使学术定义法定化,则可能会引起许多不必要的争议。当时这样处理“规范汉字”定义问题,应该说是充分留有余地的明智之举。但是,从长远看,还是需要对规范汉字作出界定的,全国人大教科文卫委员会教育室、教育部语言文字应用管理司编写的《中华人民共和国国家通用语言文字法学习读本》,就已经尝试着对这一术语做了相应的解释。
    笔者自1999年起参与《规范汉字表》研制的一些工作,时常遇到对规范汉字如何认识的问题;事实上,只有界定清楚了“规范汉字”的内涵和外延,字表编制工作才有可能比较顺利地进行。三年前笔者曾为《语言文字学常用辞典》一书撰写过“规范汉字”的词条,为便于讨论,这里将该词条照录如下:

    规范汉字(normative Chinese character、normalized Chinese character)
    符合国家颁布的规范标准的汉字,包括经过整理简化并由国务院或国家有关主管部门以字表等形式正式公布的汉字和未经整理简化的传承字。规范汉字是客观存在的,不同时代有不同的规范。 如秦统一六国后,实行“书同文”,基本消除了战国时期各地文字异形的现象,小篆就是当时的规范汉字。旧中国长期以繁体字为正体,以繁体字为代表的正体字也就成了当时的规范汉字。新中国成立以后,国家投入很大力量进行汉字的整理和简化工作,淘汰了一部分异体字,同时把群众长期以来在社会实践中创造的手头字、俗字加以整理,确定其正体字的地位,形成现行的规范汉字。在规范汉字中,整体简化或利用简化偏旁类推出来的简化字只占少数,多数还是历史上流传下来沿用至今而未整理简化或不需要整理简化的传承字(如人、山、川、水、火等)。

这段文字,头一个句号前面算是定义,后面是对定义的解释说明。对该词条这种表述,笔者现在并不满意,因其恐有“循环定义”之嫌,但该词条所阐发的基本意思,笔者今天并没有改变。
    以笔者现在的思考,对“规范汉字”的认识似应把握住以下几个要点:
    第一, 规范汉字事实上客观存在。尽管这个术语出现时间不很长,但它不是文字学家们主观臆想杜撰出来的。
    第二, 规范汉字有层次之分。我们所说的规范汉字,主要指现代通用于我国大陆一般交际场合的汉字。“现代通用”“我国大陆”“一般交际场合”三个要素非常重要,它以“通用”为标尺给出了国别(地区)、时代、领域、场合等等限制,契合当代汉字通行和应用的客观现实。这里的规范汉字特指是我们中国的,不是外国的;是大陆的,不是港、澳、台地区的;是现代的,不是古代的;是通用于“一般交际场合”的,不是“极特殊领域、场合”使用的。实践证明有所限制是必要的。汉字在长期流传过程中,曾被一些国家“借用”并分别加以改造,因此在使用汉字的不同国家规范汉字的内涵所指并不一样。比如日本现在仍使用一部分汉字(包括只用于该国的日本汉字),正式文体中实行假名中夹用少量汉字的做法,政府规定法令和公文必须以1981年发布的《常用汉字表》为准,另规定人名用字166个,取名以常用汉字1945个和人名用字166个为限,不得超过;这总计2,111个汉字(内有简化字200多个,约占总字数的12%)就是日本的现行规范汉字。汉字有6千多年的历史,我国典籍上出现过的汉字不下五六万之多,排除错讹后仍有3万4千字左右。这些字绝大多数在现代社会一般交际场合早已不用,有些甚至成了“死字”,有的只应用于某些极特殊的领域、场合。这些当今限于极特殊领域、场合使用的汉字虽然也有字种的选择和字形的规范问题,但那是另一个层面(主要是学术层面或者说专业层面)应用的规范问题,该层面的汉字不属于“一般应用场合”的现行规范汉字。
    第三, 规范汉字是经过整理产生的。这种整理工作,既是汉字自身发展的需要,也是社会发展的需要。历代政府都很重视汉字整理工作,这为服务于他们所处时代的规范汉字的形成和相应标准的确立奠定了基础。历史上,周朝太史籀编纂的《史籀篇》就是周朝进行文字正形的范本;秦王朝在用小篆统一全国文字时,首先对秦文字本身作过一番整理,李斯《仓颉篇》、赵高《爰历篇》、胡毋敬《博学篇》就是这次整理的产物;东汉熹平四年在碑石上刻了《诗经》《易经》《春秋》《尚书》《仪礼》《公羊传》《论语》七种经书,以便于传写、校正经书,这是汉隶的范本,在当时起到了整理汉字、规范字形的作用;唐以后开始出现“字样”之书,如《干禄字书》《五经文字》《九经字样》等,也都起到了刊正经书、规范字形的作用。今天的汉字整理工作,同历史上以“正形”为主要内容的汉字整理举措如出一辙,只不过整理范围逐步扩大到字音、涉及到字义,整理工作的成果形式则更多地表现为字表。如《简化字总表》《第一批异体字整理表》《普通话异读词审音表》 《现代汉语常用字表》 《现代汉语通用字表》《部分计量单位名称统一用字表》《信息交换用汉字编码字符集  基本集》等等,这些字表成为现行规范汉字的主要依据。
    第四, 规范汉字是个“历时中包含有共时、共时中包含有历时”的概念。不同时代有不同的汉字规范,同时代的汉字规范又因应用领域、场合的不同而有不同的要求。“共时”和“历时”是相对的。在当代,就“共时”平面而言,收入现行字表中的字(包括《规范汉字表》中拟列为任一字种之字头的字)即为“一般交际场合”的现行规范字,与之相对应的字(如已简化的繁体字、已淘汰的异体字和旧印刷字形)在“一般交际场合”应该被视为不规范字。汉字规范化、标准化是一个渐进的过程。汉字的使用,除“一般交际场合”外,还有许多特殊的需要。就汉字在“特殊领域、场合”的应用而言,法律规定“除外”的情形,即在某些允许保留或使用繁体字、异体字的领域、场合,也有一个用字规范与否的问题。但这里的“规范”主要限于专业学术领域或其他特殊场合,同“一般交际场合”汉字应用的规范化要求不属于同一层面。《国家通用语言文字法》第十七条对允许繁体字、异体字保留或使用的“特殊”情形作出了规定:(一)文物古迹;(二)姓氏中的异体字;(三)书法、篆刻等艺术作品;(四)题词和招牌中的手书字;(五)出版、教学、研究中需要使用的;(六)经国务院有关部门批准的特殊情况。 这样规定,符合实事求是的思想路线,代表了我国现阶段的文字政策,较好地体现了语言文字主体化与多样化的关系。再就“历时”而言,繁体字、异体字是我们祖先留下来的,曾经在历史上的某一时期以规范正字的面貌出现过,为传承中华文化做出过不可磨灭的贡献,有些字至今还在一些领域、场合使用着。因此,按照同时代的汉字规范因领域、场合的不同而有不同要求的理念,我们在做好《规范汉字表》研制工作的同时,还需要分批进行《规范汉字表》之外汉字(包括繁体字、异体字)的全面研究整理工作,编制出相应的“汉字整理表”,以满足古籍整理、出版印刷、信息处理等领域使用汉字字量较大时的特殊需要,满足使用汉字的国家和地区特别是两岸交流的现实需要。这是在当今信息时代传承和弘扬中华文化不可或缺的基础性工作。
    从上述四点认识出发来看待和解释“规范汉字”,某些困惑我们多年的“结”似乎就可以解得开了。当然,这四点认识纯系一家之言,这里斗胆提出来就教于方家,以期能够引起大家对“规范汉字”概念更深入的思考和讨论。

    四  《规范汉字表》研制的基本构想
   《规范汉字表》研制是一项继往开来的重要工作,学术性、政策性强,影响面广,工作量大,要汲取历史经验,务求科学、慎重。《规范汉字表》的研制,历经20多年的多次提出和三次上马,工作目标、研制设想和实施计划前后各有不同。2001年10月前后,在以往工作的基础上,新一届课题组形成新的课题研制设想。 为慎重起见,课题组通过走访和召开座谈会等形式,在北京、上海等地就字表框架和研制设想听取汉字学界、中文信息处理界和主要用字部门的意见,同时按设想体例编写出样条,进一步征求意见。2002年5~8月,针对字表编制中难于处理的异体字整理原则问题、简化字同音代替造成的“一对多”关系问题、类推简化问题以及汉字印刷字形问题等,教育部语言文字信息管理司和教育部语言文字应用研究所联合有关单位,分别召开了三次专题学术研讨会,就上述关键而敏感的问题集思广益,展开了热烈的讨论,从而对其中一些问题的处理初步达成一致意见。 随后,课题组吸收高校几位学者参加字表初稿的编纂工作,又在实践和广泛听取意见的基础上,对研制《规范汉字表》的总体设想进行了局部调整(主要限于字表的收字量及字表分级等方面的调整,研制目标、总体框架、编纂体例和研制原则等方面未做大的变动),形成了较为成熟的意见。这里把字表研制的基本构想简介如下:
    (一) 研制目标和成果预期
    研制《规范汉字表》的目标是:从当代社会语文生活的实际出发,以主要满足“一般交际场合”社会“通用”的需要为主,在现有多个字表(字符集)的基础上,尽可能消除现行规范标准之间的矛盾和不合字理之处,通过定量、定形、定音、定序等工作,集原有若干规范标准为一体,力求做到科学性、历史延续性和可行性的最佳组合,从而研制出能综合反映简繁字、正异字和新旧汉字字形对应关系,兼顾汉字形、音、义组合关系的规范字表。
    该字表符合现代汉字社会应用的实际需求,是对现代汉语通用字进行形、音、义全面整理研究和定量、排序研究成果的集中反映。预期该字表将基本满足汉字在现代社会各一般应用领域(如教育基本用字,新闻出版用字,人名、地名用字,民族、宗教用字,行业专用字,科技术语用字,计算机信息处理基本用字等)的需要,不但适用于现代汉语印刷出版物,也适用于普及性的古汉语出版物。字表发布后,通过一定过渡期的试用,将会在一个较长时期内保持“一般应用场合”汉字的稳定和规范,最终实现现行通用汉字的标准化。
    (二)总体框架及编纂体例
    根据前述对“规范汉字”的认识,《规范汉字表》拟收规范汉字12,000个左右(加上相对应的繁体字、异体字,总收字量可能达到20,000字)。这12,000个规范汉字,按使用频度和跟随率、分布度等划分为三级;一级字,基本上是高频字,3,500字左右;二级字,基本上是次高频字,4,500字左右;三级字,基本上是低频字,预计4,000字左右(均以字表最终的实际收字量为准)。一、二级字相当于现代汉语基本用字,总字量约8,000个,是《规范汉字表》的主体,其中一级字与教育基本用字表大致相当。一、二级字中包含不了的姓氏、人名、地名、民族、宗教和科技术语等专门用字,计划在三级字内基本解决。根据有关部门利用计算机对近一百年来共7,000万汉字均衡语料的统计分析(统计分析结果待另行公布),确定这样的收字量是合适的。《规范汉字表》之外的罕用字、方俗字等,将通过收集和整理工作,形成20,000~30,000字的“汉字整理表”。此项工作也已在进行中,不过它不属于本文探讨的范围,故而从略。
    《规范汉字表》的编纂体例:以12,000个规范汉字为标准字头,同一字种有简化字的在已简化的字后面标注相应的繁体,有异体字的在选用字(正体)后面标注相应的异体,新旧印刷字形有明显差异的则通过另附的“新旧字形对照详表”来解决。对于简、繁体不是一一对应关系,正、异体之间有读音或意义差别的,另加注释说明;但此类注释说明宜少而精,非注释不可时再注,否则就不能有效地发挥字表的独特功能,倒像是字典了。《规范汉字表》还标注有每个汉字在表中的序号、笔画数和主要读音等相关信息,附录中除列有“新旧字形对照详表”外,拟另附“常用外族汉字表”等,将现代出版物和日常交际中不时出现的少数日、韩等国人名、地名专用汉字(如“辻、椥”等)列入,以方便国际交流和社会使用。
    (三)研制《规范汉字表》的原则
    经反复斟酌,课题组确定以下7条作为研制工作必须遵循的原则:
    1.兼顾一般社会使用和信息处理的需要,使字表编制和信息处理用字符集尽可能趋于一致;
    2.坚持科学严谨的作风,全面、历史地看问题,不回避、掩盖矛盾;
    3.力求稳定,尽量不出现或少出现新造的字形;
    4.从整个汉字系统着眼,处理问题时把汉字的形、音、义结合起来考虑;
    5.立足于现实应用,兼及汉字的源流演变和字理;
    6.坚持群众观点,充分尊重教师、语言文字学家、辞书专家、书法家、信息处理界和其他汉字使用者的合理意见;
    7.尽可能兼顾海外华人的用字习惯,努力缩小与使用汉字的国家、地区现行汉字字形的差异,为最终实现汉字文化圈的“书同文”打下基础。
    这7条是贯穿于《规范汉字表》研制工作全过程的总原则。要统筹兼顾地贯彻总原则,不可顾此失彼,单纯、片面地强调其中某一条原则。涉及重要且比较专门问题的处理时,比如异体字的整理、类推简化问题和同音代替造成的”一对多”关系问题的处理、印刷字形的统一问题等,课题组还分别拟订了一些便于操作的具体的处理原则。这些比较微观的处理原则,与上述7条总的编制原则在精神上是完全一致的,是总原则的细化。张书岩执笔的《研制〈规范汉字表〉的设想》对此有比较详细的阐述,读者可参阅发表在《语言文字应用》2002年第2期上的该文,此处不赘述。
    上述研制目标、总体框架、编纂体例和字表研制原则等,在具体研制工作中正在得到认真贯彻。
    《规范汉字表》的研制,分为前期准备、拟订研制计划、具体研制和综合报批四个阶段。按照预定计划,目前已进入第三个阶段,即字表编制的关键阶段,拟于2003年内拿出字表草案。与此同时,进一步的行政运作也在抓紧进行中。《规范汉字表(草案)》编制完成后,将分送社会各有关部门和学术界广泛征求意见,进一步加工、完善字表,同时着手字表报批的准备工作,力争2004年上半年或稍晚一些时候通过高规格审定。为便于《规范汉字表》的推行,字表发布后,我们设想社会应用需要有一个过渡期。在过渡期内,信息处理用的有关字符集、新闻出版用的汉字行业标准、一些大型的字典、词典等,在汉字字形方面要抓紧向《规范汉字表》靠拢。

    五  与字表研制有关的几项工作
    跟《规范汉字表》研制相关的还有几项工作,附带交代一下:
    一是及早进行《规范汉字表》研制的行政运作。研制《规范汉字表》不单纯是学术行为,也是一项明显带有政府行为色彩的工作。这是因为研制《规范汉字表》是对汉字进行的一次总清理,关系到每一个汉字使用者,对整个汉字系统的国家标准化、国际标准化都将产生一定的影响,同时也在一定程度上代表着国家的文明形象和管理水平,所以,几届政府主管部门都把它列入“工作要点”,作为一件大事来抓。在教育部(国家语委)重视、支持下,目前《规范汉字表》的研制工作进展比较顺利。但这项工作涉及的部门很多,包括教育部(国家语委)、国务院法制办公室、信息产业部、新闻出版总署、文化部、广电总局、国家标准化管理委员会、公安部、民政部、国家测绘局、总参测绘局、全国科技名词委等有关部门和中科院、中国社会科学院、人民日报、光明日报、新华社等机构,单靠教育部(国家语委)的力量是远远不够的。为了保证研制工作的权威性和广泛代表性,需要成立一个规格较高、能够有效协调各方面意见的领导小组。该领导小组最好由国务院有关领导同志亲自挂帅,成员有上面提到的相关部门、机构的负责同志,具体研制工作则可继续交由职能部门教育部(国家语委)组织进行。回顾50年代的文字改革,就是在中央直接领导下由当时的文改会组织进行的,当时中共中央成立有胡乔木同志为主任的中央文字问题委员会,负责指导和加强文字改革工作,委员中有董必武、徐特立等同志。《规范汉字表》不是一般意义的标准,作为贯彻《国家通用语言文字法》的举措之一,它应该由国务院审定颁布。《规范汉字表》发布后,将自然取代《简化字总表》《第一批异体字整理表》等5个不同用途、不同使用范围的字表,而《简化字总表》本来就是国务院批准发表的,其前身《汉字简化方案》也是国务院发布的,宣布这5个字表不再使用,自然也必须经过相应的法定程序。所以,建议由国务院有关领导同志牵头抓这项工作是适宜的,不但有利于统一步调,使研制工作更加规范、高效、有序地开展,而且也方便行政运作严格按规定的程序进行。《规范汉字表》由国务院审定颁布后,即由国务院语言文字工作部门和其他有关部门依据《国家通用语言文字法》的相关规定推行。
    二是认真抓好与《规范汉字表》研制有关的配套规范标准的建设工作。研制《规范汉字表》是一个系统工程,涉及到汉字的方方面面,可谓牵一发而动全身,要特别注意相关规范标准研制的照应衔接。比如列入语言文字应用“十五”科研规划的“汉语母语教育基本字表、词表”(含基础教育基本字表、扫盲教育基本字表等子课题)项目,就与《规范汉字表》的一级字几乎重合,“汉语人名规范”(含汉语人名用字规范、汉语外来词语人名汉字音译转写规范、人名排序规范等子课题)和“少数民族人名汉字音译转写规范”(含六个不同民族的子课题)项目,又与《规范汉字表》的三级字密切关联,等等。为了加强相关项目的配合,国家语委科研规划领导小组在课题设计与评审立项时,已尽可能统筹考虑,在人员和科研力量的配置上做了相应安排,以避免出现新的不该发生的矛盾。此外,配合《规范汉字表》研制,教育部(国家语委)还启动了汉字检索、汉字笔画、汉字部首、汉字结构、汉字部件名称和汉字字体等规范标准研制项目(其中有些属于国家标准项目),着手建立汉字属性多功能应用平台,为两三年内形成汉字基本属性规范体系打好基础。上面提及的这些项目,或者本身就是《规范汉字表》的必要组成部分,或者从某一方面可以作为《规范汉字表》研制的基础或补充,因此做好这些配套项目的研制,与重大项目《规范汉字表》的研制相辅相成,不可或缺。
    三是继续积极参与并主导汉字国际标准化工作。当前汉字国际标准化工作中与研制《规范汉字表》密切相关的,主要是ISO/IEC 10646“CJK国际基本子集”制定的有关工作。该子集拟收汉字10,000个左右,是ISO/IEC 10646中CJK统一汉字及其扩充A(目前CJK统一汉字收字已逾70,000个)中那些在当代社会生活中最基本、最常用的汉字的集合,是为满足CJK汉字的实现者和使用者降低成本、在较为经济的基础上实现国际信息交流以及推动有关各国、各地区采用国际标准的需要而提议制定的。中国两岸四地(即大陆、香港、澳门、台湾)是这一提案的共同发起成员。海峡两岸这一举措,体现了炎黄子孙在中文数字化方面的共识和合作意向,有利于汉字的国际标准化和在更为广阔的背景下弘扬中华文化。从“CJK国际基本子集”的制定缘起和编制原则看,与我国大陆《规范汉字表》的研制有许多共通之处。换句话说,《规范汉字表》中的绝大多数汉字(特别是其中的一、二级字),应当是“CJK国际基本子集”制定的基础。所以我们研制好《规范汉字表》,也是间接地支持汉字的国际标准化工作。这是作为汉字故乡的中国人义不容辞的责任。

    半个世纪前,周有光先生曾提议编制《现代汉语用字全表》。 周先生这一设想与现在的《规范汉字表》虽然并不等同,却是有一定关联的,今天我们重温“世纪老人”周先生的论著,仍然受到很多启发和教益。近20多年来,立项研制《规范汉字表》几上几下,可见要做成一件事情并不容易,尤其当这件事情是一个系统工程的时候。现在,字表(草案)的编制工作即将告一段落,虽然取得了一些成绩和突破,但其中一些问题的研究思考远没有结束,而眼下笔者的这篇文章却无论如何是到了该收笔的时候了。一下子写这么长,为笔者所始料不及,这从一个侧面说明《规范汉字表》研制的许多理论和实践问题还需要继续探索。尽管限于篇幅,笔者这篇文章对有些问题的讨论没能展开(尤其是一些微观的、技术上的问题),有些想法可能没有完全谈清楚,或者说谈得根本不对,我还是愿意把它拿出来,以求教于专家、读者。希望借助大家的智慧和力量,帮助我们把问题想清楚、弄明白,以便共同做好《规范汉字表》的研制工作。


附注:

    ⑴拙文详见《语文研究》,2001年第4期。
    ⑵分别引自《国家通用语言文字法》的第二条、第三条,见《中华人民共和国国家通用语言文字法学习读本》,第4页,语文出版社,2001。
    ⑶如苏培成《要有一张〈规范汉字表〉》,载《语文建设》,2001年第3期。
    ⑷费锦昌主编《中国语文现代化百年记事》,366页、368页,语文出版社,1997。
    ⑸详见费锦昌、魏励《有关制订〈汉字规范字表〉的几个问题》,载《语言文字应用》,1994年第3期。
    ⑹参见拙文《略论汉字规范化涉及的几个问题》(署名王铁昆),载《天津师大学报》,1999年第5期。
    ⑺该文件第三条规定:“本规定所称的规范汉字,主要是指1986年10月根据国务院批示由国家语言文字工作委员会重新发表的《简化字总表》所收录的简化字;1988年3月由国家语言文字工作委员会和新闻出版署发布的《现代汉语通用字表》中收录的汉字。本规定所称不规范汉字,是指在《简化字总表》中被简化的繁体字;1986年国家宣布废止的《第二次汉字简化方案(草案)》中的简化字;在1955年淘汰的异体字(其中1986年收入《简化字总表》中的11个类推简化字和1988年收入《现代汉语通用字表》中的15个字不作为淘汰的异体字);1977年淘汰的计量单位旧译名用字;社会上出现的自造简体字及1965年淘汰的旧字形。”载王均主编《当代中国的文字改革》附录二“文字改革工作重要文献选编”,第715页,当代中国出版社,1995。
    ⑻傅永和给出的定义是:“规范汉字包括经过整理简化的字和未整理简化的传承字。”
    ⑼引自蔡富有、郭龙生主编《语言文字学常用辞典》,第99页,北京教育出版社,2001。
    ⑽同2,第7页。
    ⑾详见课题组《研制〈规范汉字表〉的设想》(张书岩执笔),载《语言文字应用》,2002年第2期。
    ⑿这三次会议分别为:2000年5月在江西省井冈山市召开的“异体字问题学术研讨会”,2000年6月在合肥市安徽大学召开的“简化字问题学术研讨会”,2000年8月在山东省烟台师范学院召开的“汉字印刷字形问题学术研讨会”。三次会议上的主要学术观点和论文,分别收在即将由商务印书馆出版的三本论文集中;另有“汉字规范问题访谈录”(暂名),也拟由商务印书馆出版。
    ⒀周先生这一设想后来刊载于《汉字改革概论》,312页,小标题是“现代汉语用字全表的研究”,文字改革出版社,1961。又见于《汉字和文化问题》第三编“现代汉语用字的定量问题”,213页,辽宁教育出版社,2000。
发表于 2004-9-30 12:15:54 | 显示全部楼层
[转自]百家论坛——现代汉字研究

            作者:gutong77
      发布时间:2004-9-26 17:15:00

            标题:对“规范汉字”的建议


                                       
    (一)陈明然先生《汉字定量和人口普查》一文的观点。

——只计活字不计死字。我们对汉字进行规范,作定量、定形、定音、定序的工作,其目的是为了方便社会的文字使用,使汉字更好地为社会生活的经济、政治、科技文化等各方面服务。也就是说,是为了活人,而不是为了死人。
——汉字应定量为7000为宜。
——需要正确认识和处理以下三个关系:一是现实使用和历史存在的关系;二是社会通用和专门需要的关系;三是汉字规范和计算机信息处理技术的关系。
——应以中华人民共和国国家语言文字工作委员会1986 年在中华人民共和国国务院1956年公布的《汉字简化方案》基础上重新整理公布的《简化字总表》为规范。
——《人名用字表》应属于局部规范,未来的《现代通用汉字表》是总规范。局部规范应服从总规范。《人名用字表》所收的字,不应超出《现代通用汉字表》的范围,不能搞多重规范。
——姓氏用字的数量应计入现代通用汉字的总量。
——对于编入语文教材中的古文用字,可以分两种情况分别处理:对古文中的活字即当代还在使用但字形变动了的字,按现代的规范字形排印;古文中的死字即当代已不用的字,按原字排印,再另加注释(由教师在教学中作为难点专门对其音、义进行讲解,说明该字是某某年代使用的字)。对于学校教材以外,涉及古籍的其它现代出版物,也可以按此办法处理。
——制定一个收字与《现代通用汉字表》一致的《信息处理通用标准汉字字符集》。对于我国版图内占总数百分之九十五以上的绝大多数机器来说,只需安装《信息处理通用标准汉字字符集》即可。
——根据一些专业领域的不同需要分别制定几个扩展字符集,比如用于古籍研究出版,侧重于古代用字的字符集、用于同港澳台地区交流的简繁对照字符集等,甚至还可以制作甲骨文字库、金文字库、小篆字库等用于专门研究。相关单位和个人可以根据自己的需要来选用。


     (二)《规范汉字表》课题组的初步考虑
                     ——节选自《研制〈规范汉字表〉的设想》

  《字表》可分为四级(名称待商榷):
    1.一级字    约3500字,略相当于原《现代汉语常用字表》。
    2.二级字   约4500字,略相当于原《现代汉语通用字表》中除常用字以外的通用字。
    3.三级字   约4000字,为除通用字以外的专业用字。包括:地名专用字   姓氏专用字   人名专用字   科技专用字等
    4.四级字   约18000字,罕用的古字、方言字等。
    ————以上四级共计30000字,若加上它们对应的繁体、异体字,总量大约在45000—50000之间。


        (三)我的建议

        十分赞同陈明然先生的观点。结合《规范汉字表》课题组的的设想,我认为,《规范汉字表》可分为五级(名称待商榷)。

       1] 一级字    约1500~2000字,可命名为“最常用字”。

       2] 二级字    约2000~2500字,可命名为“次常用字”。

           ———以上两级字的总和,共约3500~4500字,略相当于原《现代汉语常用字表》。
中小学教材用字一般不要超出此范围,超出此范围的字要加注解。

       3] 三级字    约3500~4500字,可命名为“一般通用字”,其中应包括:地名、 姓氏、人名以及科技等方面的大部分用字。

           ———以上三级字的总和,共约7000~8000字,略相当于原《现代汉语通用字表》。
学生常用的字典只收录这7000~8000字即可(电脑的基本字库或通用字库就与学生用字典相对应)。

       4] 四级字    约4000~5000字,可命名为“专业通用字”,为“一般通用字”以外的专业用字,应基本囊括:地名专用字、 姓氏专用字 、人名专用字 、科技专用字及较通用的文言用字等。

           ———以上四级字的总和,共约11000~13000字。学校、社会上流通的较大型字典就收录以上四级字,电脑的扩展字库就与较大型字典相对应。

       5] 五级字   约17000~19000字,收录罕用的古字、方言字等。专门编纂收录五级字的专用大字典,也可分门别类地编纂各方面的专用字(如:文言字、方言字、中医药用字等)字典,供有关方面人士各取所需(都可做成相应的专门字库)。

          ——-—以上五级字的总量共计30000字左右 。(有必要的话,可加上与它们对应的繁体、异体字,总量大约在45000—50000之间。)

         ————之所以这样建议,其目的大家清楚,其作用和意义也不再赘述。

         ————希望引起关注和共鸣,并能上达天听。
 楼主| 发表于 2004-9-30 12:28:44 | 显示全部楼层
陈明然:汉字定量和人口普查
http://www.xlmz.net/forum/viewthread.php?fpage=1&tid=7327
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-5-14 03:45 , Processed in 0.064780 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表