柴禾妞 发表于 2005-12-17 15:21:12

论“字”对汉语词汇和语法的影响(1)

作者:班门斧
解放军外国语学院 严辰松
来源:中国语言文字网

0.引言

      “字”在汉语中有两个意义:第一是方块字的意思,这里的“字”是文字学的单位;第二是指汉语中可从语音、语义、语法(至少是构词法)角度来分析的一个单位。在下面的讨论中,如无特殊的说明,“字”都取第二个意义。当然,这一意义上的“字”与汉字是密切相关的。下文我们将谈到,汉字对汉语语素单音节特点的形成和存续有着深刻的影响。
      在现今为学术界普遍接受的、以西方语言为基础而形成的语言学理论体系中,没有“字”这一级单位,也没有“字”的概念。然而对于汉语来说,“字”却是确确实实的存在,是绕不过、躲不开的事实。“字”在汉语中,已超出了文字学的概念。在分析汉语的语义和语法时,以及在做中文的信息处理时,都不能无视“字”这一单位的存在。(赵元任,1968,1975;吕叔湘,1980;孔宪中,1992)
      但是需要说明的是,本文所说的“字”是单音节的“字”,与徐通锵(1998)所说的不是一回事。1

1.音节、语素、“字”

      语言底层最小的单位是单个的音素,即元音或辅音,然后音素构成音节,音节构成语素,语素构成词,词构成短语,短语构成句子,……,如此层层组合,直到最高层次的单位--语篇。在这个从下到上的层次结构中,意义最初从音节这个层次进入,也就是说,音节以下的语言单位不具备语义,开始附着语义的最小单位一般是音节,当人们约定俗成把音节用于指称某个事物时,音节就有了意义。具有意义的音节或音节组合叫做语素。语素是语言中承载意义的最小单位。语素是构词的单位,也称为词素。(Bolinger,
      1981:52)
      现代汉语的语素绝大部分是单音节的,双音节以上的语素数量极少,可用很小的篇幅列举无遗。汉语具有语素单音节的特点,绝大多数汉语研究者对此都不持异议。(赵元任,1968;朱德熙,1985;张永言,1988;杜永道,1992;吕叔湘,1996)
      汉语音节的书写形式是汉字,一个汉字代表一个音节,在绝大多数情况下也代表一个语素。2音节、语素和汉字三位一体,集音、义、形于一身,构成了汉语独有的一种现象。
      “字”可以充任语素,而且用现行的、以西方语言为基础的语言学理论来分析汉语,我们只能把它看作是语素。但是“字”具有语素所没有的特点。语素中的“素”是指“成素”(formative),含有是更大的单位的组成部分的意思,意味着其本身不具有独立性。在多数情况下,语素融化、隐身于词之中。然而汉语中的许多“字”
      却不仅可以成为高一级单位的组成分子,而且可以独立使用。即便是厕身词中,“字”的存在也昭然显豁。

2.语言的基本单位,在英语是词,在汉语是“字”

      美国语言学家鲍林杰认为,英语的词“是语言中不断重新组合、传达信息的常用片段”(common pieces of the language that
      are constantly regrouped to form messages),是“独立编码的最小成分”(the smallest
      elements that are independently coded)(着重号笔者加)。(Bolinger, 1981:52-53)
      鲍林杰的这两句话言简意赅地描述了词这个英语基本单位的性质。“独立编码的最小成分”道出了词作为基本单位的语义属性,这就是说,虽然语素是承载语义的最小单位,但是词是语义依附的主要单位,是英语中记识语义的基本单位。4
      “不断重新组合”说的是词的语法属性,即它组合成更大语段的自由程度。“常用”应是基本单位的本质属性。
      词在英语中的这一地位是无可争议的,其佐证是:(1)词是英语口语和书面语最小的使用单位,说和写一般都不能从中间断开;(2)儿童首先通过语义与词的联系学会使用语言并接受教育;(3)各类辞典以词为基本条目安排内容。
      如果说英语中“独立编码的最小成分”是词的话,汉语中则是比词低一级的“字”。“字”是汉语中“不断重新组合”的“常用片段”,它是“独立编码的最小成分”。鲍林杰用于描述英语词的这两句话,完全适用于描述汉语的“字”。我们说,“字”是讲汉语的人记识语义的基本单位,是汉语中可以不断重新组合的最小单位。“字”与“词”的组合性质虽然不尽相同,但两者作为基本单位的独立性和离散性是一样的,都具有很高的自由度。
      上述有关英语词的三个佐证也同样适用于汉语的“字”。(1)汉语的“字”是口语和书面语的最小单位,中间不能断开,也不能插入任何内容。(2)以汉语为母语的人非常熟悉意义同“字”的联系,因为这些“字”大多数都有独立的意义。讲汉语的儿童上学从识“字”开始,汉字是作为最基本的单位同意义一块儿教给学生的。“字”的概念在汉语社会中已不仅仅指文字,而且也是口语中的一个单位。5(3)如同英语的词可以列举,汉语的“字”可以列举。大多数汉语辞典以“字”为基本条目安排内容,因此它们是“字”的集书。汉语有列举“字”的集书,却没有列举词的集书,而英语有列举词的集书,却没有列举语素的集书。
      汉语的“字”和英语的词在各自的语言中都具有自足的意义,同时具有很高的独立性和自由度,既可独立使用,又可与别的成分结合使用。它们是语义记识的基本单位,然而按照现行的语法理论,它们毕竟属于不同的语法层面。英语的词可独立填充句子中的语法功能槽,而汉语的“字”从整体而言却不能(尽管有些“字”就是词),必须与其他“字”组合成词后才能完成这一功能,因而,从整体而言,“字”还应归于语素这个层次。6

3.“字”对汉语词汇系统的影响

    3.1汉语语义编码的基本符号集小,常用“字”有极高的能产性
      简单地说,编码是一种映射(mapping)行为,即把符号赋予需要编码的事物。任何编码行为都需要一套基本的符号集。如自然数的符号集包括0、1、2、3、4、5、6、7、8、9这10个阿拉伯数字符号。基本符号是符号系统使用者最初记识、最常使用的单位,也是有关符号系统的手册、教材、辞典等必须首先收录和描写的基本的单位。
      语言的编码可分为语音编码和语义编码两大类。语音编码即用符号代表语音,而语义编码则是用符号代表语义。
      拼音文字用于语音编码的基本符号是数十个字母,它们的语音编码经济便捷,用基本的音码—字母(或字母组合)—代表一个个的音,字母及组合发什么样的音需经过学习,但向上的组合(词)可按照拼音规则读出。由于基本的音码数量不多,拼音文字的发音较容易掌握。就英语而言,尽管因其正字法和正音法都不规则,按照字母拼合读音不能全部做到,但总的来说,掌握其发音比较容易。
      英语的语义编码,如上文所述,其基本符号是词,即语义主要是附着在词这个单位上,而汉语语义编码的基本符号是“字”,汉语的语义主要附着在“字”上。基本单位的特点是可以穷尽性地列举。汉语的“字”可以列举,而词不能。形成鲜明对照的是,英语的词可以列举,但比词低一级的语素则不能。汉语的辞典(有的称作字典)一般以“字”为基本条目,先注释单音节的“字”,也就是语素,然后在单字的条目下列出词汇,包括词和词组。汉语辞典因此可称为语素辞典。同印欧语相比,这是一大特色。印欧语辞典的条目都是以词为单位的。
      用于汉语编码的基本符号集(由“字”组成)小,而英语的大(由词组成)。比较汉语辞典收集的“字”数和同规模的英语词典收集的词数,后者的数字远远大于前者,如《康熙字典》收“字”4万多个,著名《牛津大词典》收词41万多个。(马新军,2000)这样的比较也许意义不大,因为大型辞书一般都收录许许多多早已退出流通的旧的字词。但我们可举一例比较英汉基本符号集的多寡。据说《毛泽东选集》一至四卷总字数为660273个,但只用了2951个不同的汉字,(马新军,2000)而根据笔者用语料库索引软件WORDSMITH所做的统计,仅《毛泽东选集》第四卷的英译本就用了7859个不同的词(动、名词、形容词各种变化形式只算一词)。这个数字是汉字的两倍还多。相同的信息,仅就分立、需要分别记忆的符号的数量而言,英文远远超出了中文。
      值得注意的是,汉语辞典的规模远远低于同类型的英语辞典。这是“字”的性质使然。
      辞典列出一种语言中的词语总汇(lexicon)。辞典一般应该或必须反映词汇不可预见的性质(unpredictable
      properties)或者特殊性(idiosyncracies),凡属于普遍性的问题没有必要在辞典中列出。如德语单词发音是有规则的,因此德语词典一般只标重音而不必注音,偶有特殊的发音才注出。再如英语,名词复数加S,这是一条普遍适用的语法规则,词条中没必要每个名词都列出加S的形式,但是那些不规则的名词(men,
      children, sheep, criteria)就必须列出,它们属于特殊情况。具有普遍性的语法规则应在语法书中阐释。
      汉语词的组成和属于句法范畴的短语组成有共同的地方,即按照规则把下层的分子链接起来(concatenation)。就造词法而言,这叫做合成,就造句法而言,这叫做组合,两者的性质其实是大致相同的(其佐证是:对汉语复合词的分析,用的是与分析句法一样的术语)。链接后的语言片段的整体意义要么是其组成分子意义的综合(这种情况英语称为compositional),要么另获得一个与其组成分子意义无干的整体意义。后者具有特殊性,链接后的结果不管是词或短语都应在辞典中列出。整体意义为compositional的情况具有普遍性,辞典不可能也没必要列出语言中所有可能出现的这类语言片段。
      汉语的辞典在所列出的词中,有一部分是不能从组成分子直接推得语义的,如“木耳”、“哑铃”、“打手”、“的士”等。
      然而汉语中有很多赵元任称为“临时词”、冯志伟称为“未登录词”的词汇,(赵元任,1968:90;冯志伟,2001;本文3.2节重点论述)其整体意义可从组成分子推得,绝大多数不在辞典中列出,因此汉语辞典的规模就小。
      当然,汉语辞典中也列出了许多意义透明的词汇,如“述职”、“刷洗”、“评比”、“军旗”、“推翻”、“打倒”等。这些词汇按理可不必列出,之所以列出,是因为它们使用频率极高。
      汉语基本符号集小于英语,还有其他间接的佐证。尤金·奈达曾说过:“一篇汉语文本译成英语后往往要长得多。这倒不一定是由于文化差异的结果,而是由于汉语词的文字符号所占的篇幅相对要少一些。”(Nida,
      1993)此外,据说在联合国的五种正式文本(中文、英文、俄文、法文、西班牙文)中,中文文本的页数最少,文件最薄。
      汉语常用“字”的使用频率和能产性极高。许多“字”可身兼数任,既可单独成词,又可与别的语素不断重新组合,构成词或词组。如“成”字。可用于应答:“成!”(方言),意思是“行!”,又可组成“促成”、“达成”、“玉成”、“坐享其成”、“一事无成”(《现代汉语词典》中有),“化成”、“炼成”、“学成”、“长成”、“写成”、“成素”(《现代汉语词典》中无)等等。类似的例子不胜枚举。所谓“临时词”或“未登录词”,也大都是由常用“字”组成。
      1989年6月国家语言文字工作委员会公布的《现代汉语常用字频度统计》一书表明,在研究者用计算机抽样选取的200万字的语料里,使用频度最高的前2500个汉字覆盖了97.97%;另据1928年以来的6种有关汉字频度的统计进行分析,按照词频降序排列,至第1000字时,其累计频度已达87.39%。另据原北京语言学院语言教学研究所的1985年的研究,“中小学语文课本用作统计材料的全部篇幅,有近五分之四是用1000个高频汉字写成的。”(《汉语词汇的统计与分析》)这些都说明了汉语常用“字”有极高的能产性。

      3.2 “字”的重组灵活,创制新词容易
      “字”可不断重新组合的特点使汉语词汇的内部结构松散,词汇的组成成分容易重组,形成新词。
      汉语中大量实际使用的词汇是临时词,包括专用于某个特定的情景或事件的特设(ad
      hoc)词。在鲁迅的著作中,临时词就很多,如“揭出病苦,以引起疗救的注意”。至于当今媒体中出现的临时词就更是不胜枚举,如“调控”、“界(接)面”、“解构”、“解读”、“欢娱”、“扫黄”、“下海”、“传销”、
      “内存”、“主频”、“海选”、“瓶颈”、“资质”、“斩获”、“动因”、“理据”、“坐台(小姐)”、“(再创)新高”、“(婚姻)存续(期间)”、“舔吸(后现代主义的)余唾”,等等。大量的“述说”(张寿康的说法,有人称“主谓”)、“支配”(“动宾”)、“使成”、“动补”等结构的临时词辞典里未曾收入。这些临时词有的将是过眼云烟,有的将积淀下来,成为较为固定的词汇。(张寿康,1981;《汉语词汇的统计与分析》)
      缩略语也属于临时词。在实际使用的语言中,不仅有大量虽还未进入辞典但人们已耳熟能详的缩略语,还有各种各样特设的缩略语,见于各种场合。如“彩显”、“技改”、“减负”、“人防”、“央行”、“高知”、“影后”、
      “交警”、“村委会”、“足协”、“残奥会”、“三陪”、“待产”、“空姐”、“空哥”。在专业领域使用缩略语,更是常见。如在医院里,“根治”是牙科“根管治疗”的意思,“化腮”是“化脓性腮腺炎”的意思。这些缩略语由有意义的语素组成,与印欧语中由首字母组成的缩略语相比,信息含量大,容易理解和记忆。
      汉语的“字”重组灵活,还带来另一个现象。大陆和港澳乃至新加坡等汉字文化圈,由于政治体制不同,在使用的语言上也造成隔阂,其佐证是媒体使用的汉语在词汇和句法上都有一定差异。就词汇而言,其差异不在构词的基本成分(各种汉语都使用由汉字代表的相同的语素),而在于创制的新词。相同的事物,在各地有不同的名称。如:“航天飞机”(大陆)—“穿梭机”(台湾),“民乐”(大陆)—“中乐”(香港)—“国乐”(台湾)—“华乐”(新加坡),等。据孔宪中说,大陆“礼品店”在香港有多种名称:“礼物店”、“恩物店”、“惠物店”等;“交际舞”在香港被称为“社交舞”、“交谊舞”等。(孔宪中,1992:14)。其他不同的词汇包括:“考察”—“考量”(台湾)、“见面”—“碰面”(新加坡)、“招生”—“收生”(新加坡)。名称虽然各异,其组合规则却是一致的,都用复合的方法。
      “字”的离散性和独立性还表现在有些词汇的组成分子可以前后颠倒而意义大致不变(且不说在戏剧的唱词或诗歌中,有许多为了韵律的缘故所做的倒装),如“演讲”—“讲演”、“合适”—“适合”、“兵士”—“士兵”、“相互”—“互相”。

      3.3 词汇透明,词汇系统具有很强的内部理据
      汉语双音节以上的词汇,词汇组成分子即语素的意义仍然清晰可辨,也就是说,汉语的词汇是透明的,如“大小”、“尺寸”、“解脱”、“放纵”、“沿袭”等等。换句话说,这些词汇的词汇化过程不彻底。按照西方语言学理论,词汇化的特点是,词语的整体意义不等同于其组成成分意义的简单相加,它自有独立的意义。汉语中语义不透明、即整体意义不是其组成成分意义相加的词汇如“木鱼”、“哑铃”、“克隆”、“王八”只占词汇总量很小的比例。从整体看,汉语词汇以透明者居多。大部分词汇的意义可从组成分子的意义推得。
      现代社会的发展日新月异,新的概念、新的事物层出不穷,为了接纳这些新的概念,语言的词汇不断衍生发展。对新概念的编码方式,可有多种方式。如概念来自外域文化,最简单的莫过于将外来语整体借入,用本语的发音体系即音译的方法加以同化。在日语、朝语中,这类外来语比比皆是,汉语中则相对要少。汉语创制新词,不管是本文化中出现的新事物,还是引入外来的新概念,一般都习惯用已有的语素进行组合编码,合成(compounding)几乎是创制新词惟一的方式。这样一种编码方式,以少胜多,以简驭繁,既便捷又经济。
      对于外来语,汉语尽可能地用理据性强的词汇来翻译。音译法往往站不住脚。历史上,“民主”、“科学”、“电话”原先都有音译译名,现在都废弃不用了。近年来,“大哥大”、“BP机”也已逐步被意译的“手机”、“传呼机”所替代。此外,有些外来语,如mini-,Coco
      Cola用上“迷你”、“可口可乐”的字样,既谐了音,又符合汉民族喜欢意译的习惯,属于音译和意译的结合。(详见严辰松,1990; 李树新,1998)
      词汇的高透明度给汉语词汇带来很强的内部理据。理据给人们解读词汇的意义带来很大的方便。当人们知道一个词语组成分子的意义时,一般不难推断出这个词的整体意义。这就如同人们了解了一位自然数的意义以及多位自然数的组合规则以后,就不难理解任何从未见过的数字。
      汉语词汇的内部理据还表现在对事物的命名上。同一类动物或植物的名称,在后面都加上表示类属名称的语素,如“杨树”、“桃树”、“橡树”、“槐树”;“鲢鱼”、“鲫鱼”、“草鱼”、“鲤鱼”。有一些外来事物的译名也是在音译的基础上加上一个汉语固有的属名,如“拖拉机”、“啤酒”。再如医学上的各种炎症都有“炎”字一以贯之,“胃炎”、“肝炎”、“角膜炎”;医院的部门都以“科”字命名。英语中相应的这类术语,相互间较少逻辑联系,不如汉语的术语好懂好记,这是汉语的一大优势。当然,汉语这样的分类不一定符合科学的标准(如“鲸鱼”不是鱼),是一种“俗分类”,然而它毕竟给讲汉语的人带来了解读和记忆的方便。

金铁军
本贴由新字于2003年6月23日22:31:23在乐趣园〖汉语拼音文字论坛〗发表.
页: [1]
查看完整版本: 论“字”对汉语词汇和语法的影响(1)