|
发表于 2005-8-29 18:17:09
|
显示全部楼层
周有光:《现代汉字学发凡》
作者:周有光
来源:http://www.tztvu.edu.cn
2005-8-29
引 子
研究汉字的发展和问题的学问,称为“汉字学”。汉字学分三部分:一、历史汉字学,二、现代汉字学,三、外族汉字学。
一、历史汉字学(旧称“小学”或“文字学”)研究汉字形音义的来源和演变。许慎(约58—约147)以来1,800年间,历史汉字学的历程是光辉的、成果是丰硕的。甲骨文的发现又扩展了新的疆界。不用说,这门学问应当继承不辍、发扬光大。
二、现代汉字学研究现代汉字的特性和问题,目的是为今天和明天的应用服务,也就是为四个现代化服务,养活汉字在现代生活中的不方便。“现代汉字学”是个新名称、新事物。它播种于清末,萌芽于“五四”,含苞于解放,嫩黄新绿渐见于今日。
三、外族汉字学研究汉字流传到汉族以外各民族中去以后的发展。有的民族创造整体新字,例如契丹大字,女真大字。有的民族创造新形声字,例如赵南的喃字,广西壮族的僮字,古代西夏国的西夏字。有的民族创造表音字母补充汉字,例如日本的假名,朝鲜的谚文。这些都是汉字式文字。
这里就现代汉字学的内容和方法分六个方面简单地举例谈一下。不妥之处,敬请读者指正。
一、字量的研究
现代汉字的字量的研究,举例如下:
A、现代汉字表的研究
现在有没有一份“现代汉字表”?这有两个答案:(1)一本今天有代表性的字典(例如《新华字典》1971)里的全部“正字“就是一份现代汉字表。这是权宜的答案。(2)现代汉字表就是”现代汉语用字全表“,尚待研究选定。这是字量研究的首要课题。根据”字性“,不根据出现频度,从各种现代字典中选取书写规范化现代汉语所必需的汉字,跟文言古字划分开来,就可以得到一份现代汉字表。
现代汉字表对现代化的汉字处理设备,包括打字机、电传机、照排机、电子计算机等等,是迫切的需要。
选定现代汉字表,要解决如下的问题:
1)如何划分古今界线?古今界线能否划分?能。只要现代汉语和文言古语是可以区别的,那么,现代汉字和文言古字也就是可以划分的。现代用的和古今通用的归入现代。仅仅用于文言古语的归入古代,这包括古人地名、古器物名,以及白话文中夹用的文言引语、文言成语、文言语词等。
2)如何处理特殊字?
特殊字有多种:a、科技专用字,包括元素名称和其他,是否收入表中?能否请科学家停止创造新汉字?b、少数民族名称专用字,是否收入表中?c、人地名专用字,是否出现较频的收入表中?d、译音专用字,是否出现较频的收入表中?e、行业特造字(例如京戏用字“ ”,一种胡须),是否划出表外?f、方言字,除普通话中已经吸收的,是否划出表外?g、外族字,如日本、朝鲜、越南、广西壮族的特造字,是否划出表外?这些,都要研究。
汉字数量一向无定,任何印刷厂都要临时增补。有了一个现代汉字表,也还有表外字要临时增补。但是,做到表内“字有定数”,表外“字无定数”,就是前进了一大步。这有利于对表外字进行整理,使其逐步养活也有利于各方面的应用。初步探索,“现代汉字表”包含六千多字。
B、技术用字的研究
汉字机械都是笨重异常的。如果能把六千多字“砍去一半”,使它成为三千多字,专门用于传输技术和特种书刊,那么,汉字机械就可以比较轻便些。这样一个便于技术处理的汉字表叫做“技术用字”。“技术用字”以频度为根据,不以字性为根据。这跟日本“当用汉字”(1,850字,现增为1,900字)性质相似。不同的是,日本“当用汉字”于一般书报,而我们的“技术用字暂时只能用于传输技术和特种书刊。
这一拟议有什么根据呢?根据是汉字出现频度的不平衡规律:
三千多“技术用字”占出现总字次99.9%,欠缺千分之一。只要有办法代替这“千分之一”(包括三千多罕用字),“技术用字”就可以出现。
代替办法有如下的拟议:1、用同音汉字代替表外字,类似“胡同”代替“ ”。2、用汉语拼音代替,以词儿为单位。3、用双音节词代替单字,例如“即鱼”代替“鲫”。这些要进行研究,做出三千多罕用字的代用字表。
C、汉字查频
自从1921年陈鹤琴用统计方法研究汉字以后,教育家们接着做过几次有成果的统计。但是解放以来还没有发表过一次全面性的抽样统计。需要把“五四”以来出版的书刊分期分类做一次全面性的用字抽样统计,然后每隔若干年对新出版物用字进行定期统计。需要不断研究小学用字和扫盲用字。利用电子计算机可以把统计工作做得又快又好。
据估计,清末以来铅印书刊所用“字种”大约一共九千多。大体说来,字量可分三级:三千多、六千多、九千多——三·六·九。
二、字序的研究
现代汉字的字序的研究,举例如下:
A、查字法的标准化
1)部首法。查字法就是汉字的序列方法。自从许慎把汉字按部首分类以来,部首法一直是应用最广的查字法。但是,部首法是一种复合查字法:既查部首,又查笔数,而同笔数的汉字没有一定的序列。不同的字典,部首数不同。借助于统计学和心理学,可以得到“最佳”的部首法,做到部有定数,字有定序。
使部首法标准化是当务之急。
2)笔画法。现在流行五笔法:有“札”字法,“丙”字法,“海天日红”,“一笔部首顺序法”(即《新华字典》和《现代汉语词典》的“部首目录”中开头五个部首)等。差别不大,不难统一。笔画法同组汉字太多,但是方法简单,便于在项目不多的索引中应用。人们主张,不要排笔数,要用单一的笔画序列;不必限于五笔,可以分七笔或更多,也可以头尾各取若干笔。
3)四角法。王云五的“四角号码”开辟了字形分解的新途径,放弃传统的手形观念。在图书馆中,四角法已经有一定的基础;但是在一般群众中间不容易推广。据说每六个字中间就有一个字难于确定角码,“第五角”尤其令人迷惑。四角法大有改进余地。
4)音序法。音序法就是汉语拼音字母序列法。可以分为:1、单纯字母序列法(如《汉语拼音词汇》)。2.音节·汉字·字母分层序列法(如《现代汉语词典》)。两者一时难于统一。音序法的好处是不受字形变化影响,缺点是同音字太多,要能读才能查。同音字如何序列,要有规则。
以上四种是现在应用较广的查字法。“五四”以来,为了改进
查字法,许多人长年累月付出了辛勤劳动。这方面积累了很多资料。今后的研究应当是:分类、集中、提高、标准化。
B、汉字编码的研究
“汉字编码”是把汉字变成符号序列的设计,主要用于电子计算机的输入终端。编码经过键盘输入以后,在计算机内转换成二进位码,找到对应的数字化的字模,输出整个汉字。
查字法容许一码(一组)多字,汉字编码要求一码一字。编码没计以第一层规则为评比的标准,对一本《新华字典》重码不宜超过3%,否则难于得到候选资格。
“四码”电报用四个数字代表一个汉字,没有重码,符合一码一主要求。但是“四码”是流水序列,跟字形或字音都无关系,叫做‘无理编码”。四角号码也是四个数字代表一个汉字,什么数字代表什么角形有一定规则,叫做“有理编码”。但是,四角号码一码多字,不合汉字编码要求。
汉字编码,设计众多。这里谈两种例子:
1)音形码。又称音形罗马字母编码法。用两个字母代表声母和韵母,用两个字母代表部首和声旁,其中一个字母兼表声调,四个字母代表一个汉字。受过特殊训练的人见码可以读出字音。音形码的关键在找寻区分字形的特征。每字都用同数字母,叫做“等长码”。字母多少不等,叫做“长短码”。音形码要求输入者能读字音。如果不能读字音就难于应用。限用26个字母,便于在小键盘上应用,便于跟国际情报网络联系,是一大优点。
2)拼字码。又称字形拆拼编码法。一种方法。把全部汉字拆成五六百个部件,分横列纵列等多种组合,既有组合代号,又有部件代号。另一种方法,把汉字部件再拆成一二百个元件有(“字素”),每个“字素”等于一个“一百进位”或“二百进位”的数码。拼合“字素”实际是编列数码。由“字素”编成的长短码可以不问组合方式,做到一码一字代表任何数量的汉字。拼字法要特制键盘(中键盘),比26个字母键盘大而复杂,但是比不用编码的大键盘轻。优点是直观性比字母码好,可以不问字音,只顾字形。
在电子计算机的应用日益扩大的今天,汉字编码研究已经成为一个热门。有人把汉字编码跟拼音文字混为一谈,那是错误的。汉字编码不可能只有一种。不同的汉字编码有不同的应用范围。在没有“字形内存”的小型电子计算机上,可以利用汉语拼音直接输入输出,也可以夹进少数编码,代表姓名中的同音异形字,不作“字形”输出。
三、字形的研究
现代汉字的字形的研究,举例如下:
A、字形分解的研究
字形分解的研究是现代汉字学的关键问题之一。它可以给汉字编码和其他问题提供条件和数据。
字形分解要分层次:初层分成部件(偏旁),二层分成元件(小结构),……末层分成零件(笔画)。例如:
部件、元件、零件,都要归类:一共有多少种部件,多少种元件,多少种零件?归类用什么原则?各层、各种及其所地位(左右、上下、头尾等等)的出现频度如何?作为代码,那些元件可以“异元同码”(异符同键)?
B、字形阅读影象的研究
人跟文字的接触,最大部分时间用于阅读。阅读时汉字是怎样映入视网膜从而产生理解的呢?这是一个基础性的问题。利用眼科摄影技术可以把字形的阅读影像拍成照片,像电影那样。研究其中的规律,算出数据,对寻求最佳的字形区分特征,对测定近形字的混淆程序,对改进自动阅读汉字的技术等,都有参考意义。
四、字音的研究
现代汉字的字音的研究,举例如下:
A、声旁表音功能的研究
现代汉字大部分是所谓“形声字”;笔画简化以后又产生许多“类形声字”,包括假形声字(如:烛、浊)和非形声字(如:阴、明)。各个“声旁”的表音功能如何?如何算出“声旁”在现代汉字体系中的有效表音率?研究这个问题,有理论的和实用的意义,可以增进我们对汉字体系的特性的理解。
B、多音字的研究
一字多音增加认读困难。现代汉字中多音字的比重有多大?如何分类?能否减少?多音字跟汉字体系有什么关系?这一研究对汉字整理可供参考。
C、音节汉字表的研究
《新华字典》(1971)开头有“汉语拼音音节索引”,每个音节(不分调)配上一个汉字,这就是“音节汉字表”。中小字典大都类似的表,可是配字不同。相互比较,取长补短,可以定出一个标准的“音节汉字表”,作为音译用字、直音用字、简化人用字、“技术用字”中同音代替等的依据。
五、字义的研究
现代池字的字义的研究,举例如下:
A、汉字构词功能的研究
从构词功能来看,“字”可以分为两类:“词字”和“词素”字。“词字”等于单音节词。“词素字”只是构造多音节词的成分。分清“词字”和“词素字”是现代汉字学的一项基本功。请比较:
《现代汉语词典》(1979):
悲bēi①悲伤;~喜交集。②怜悯:慈~。
哀āi ①悲伤;悲痛:悲~。②悼念:~悼。默~。③怜悯:~怜。
《汉语拼音词汇》(1963):不收“悲”,也不收“哀”,只收“悲哀”、“哀悼”等多音节词。
两种词书为什么不同?因为,
《现代汉语词典》以“字”为单位,每一个汉字作为一条,不问“词字”还是“词素字”。
《汉语拼音词汇》以“词儿”为单位,只有成为词儿的“词字”才列专条,不成词儿的“词素字”不列。“悲”、“哀”,都是“词素字”,所以不列专条。
哪些是“词字”,一共有多少?初步探索,有二千多。这一研究,对汉语拼音正词法、“技术用字”中的同音代替、汉字简化、汉字教学法等等,可供参考。
B、部首功能的研究
明显可辨的部首叫做“自然部首”。例如“河”属“氵”部,“鲭”属“鱼”部。在部首查字法中勉强规定的部首叫做“非自然部首”例如“半”属“丶”部,“开”属“二”部。
在现代汉字中,部首还能表意吗?怎样表意的?表意功能有多大?
“坷”读“可”。“河”不读“可”而读“合”(hé)。为什么看到“河”就知道它不读“可”而读“合”呢?当然不是声旁在表音。是部首在表音吗?
弄清部首的现代功能可以增进对汉字体系的特征的了解。
六、汉字教学法的研究
汉字和汉语在教学中有矛盾。常用“词”中有罕用“字”。口语往往写不出汉字。儿童学语言以“词儿”为单位,可是读书要把多音节词拆开成一个一个的单音节“字”。汉字教学法的问题是教学法科学应当不断研究的重要问题之一。
以上所谈,只是“蜻蜓点水”,挂一漏万。
结 尾
一种知识在开始发展的时候需要“正名”。名不正则言不顺。现代汉字学也不例外。
例如,人们说“群 ”、“众衆”,是两组“异体字”。这个说法妥当吗?正、草、隶、老宋体、仿宋体……分别写出同一个“群”字,这不也叫“异体字”吗?是否把“群 ” 、“众衆”,说成是两组“异形字”好些呢?
又如,“从群众中来到 衆中去,是一条群众路线的原理。”这个句子里有几个字?
甲答:20字。
乙答:16字。
丙答:18字。
为什么答案不同。
甲讲的是“总字次”,有一个算一个。
乙讲的是“字种数”,同字异形合并计算。
丙讲的是“字形数”,同字异形分别计算。
现代汉字学研究的问题和研究方法跟历史汉字学很不相同。它是以语言学为基础而结合信息论、统计学、心理学等的边缘科学。这决不是抛弃或背叛历史汉字学。在汉字学的领域里应当事今而不薄古、厚古而不薄今。 |
|