湘里妹子学术网

 找回密码
 注册
查看: 4056|回复: 0

英德法语的正词法与汉语拼音正词法

[复制链接]
发表于 2003-9-24 14:54:28 | 显示全部楼层 |阅读模式
文章来源:湘里妹子学术论坛-www.xlmz.net-2003
                                  冯志伟

    《中华人民共和国国家通用语言文字法》第一章第十八条规定:“国家通用语言文字以《汉语拼音方案》作为拼写和注音的工具。《汉语拼音方案》是中国人名、地名和中文文献罗马字母拼写法的统一规范,并用于汉字不便使用或不能使用的领域。初等教育应当进行汉语拼音教学。”《汉语拼音方案》不仅是注音的工具,而且也是拼音的工具,要拼音,就必然会涉及到词儿连写的问题,在《汉语拼音方案》中,采用“y,w”和隔音符号“’”来隔音,就是为了解决词儿连写的问题,而词儿连写的问题,就是汉语拼音正词法的问题。我们在这里讨论汉语拼音证词法,是完全符合《中华人民共和国国家通用语言文字法》第一章第十八条的规定的。最近一段时间,似乎特别强调《汉语拼音方案》给汉字注音的功能,而非常忽视甚至试图削弱《汉语拼音方案》给汉语拼音的功能。因此,我们认为,有必要在这里借鉴国外正词法的研究,来进一步加强《汉语拼音正词法》的研究和改进。

1.1 问题的提出

  “正词法”在英语里叫 Orthography, ortho- 是“正确”的意思,-graphy 是拼写法的意思,整个 Orthography  就是“正确的拼写法”的意思。

    1958 年 2 月 11 日,中国由国家正式公布了《汉语拼音方案》,用拉丁字母来拼写汉语,这就出现了汉语拼音的正词法问题。

    汉字一连串写下来,既不分词又不连写,只有“字”的书写单位,没有“词”的书写单位。汉语普通话中的词有单音节的,有多音节的,多数是双音节的。用汉语拼音来拼写普通话时,应该分词连写,也就是以“词”作为书写单位,使得语言中的表义单位能够在书面形式上反映出来。这是拼音书写形式与汉字书写形式的根本区别。

    比如,“中华人民共和国”不是写成 zhong hua ren min gong he guo, 也不是写成 zhonghuarenmingongheguo, 而是写成 Zhonghua Renmin Gongheguo.再如“出租汽车”,不是写成 chu zu qi che, 也不是写成 chuzuqiche, 而是写成 chuzu qiche. 这样的写法反映了词语的实际结构,阅读起来比全分或全连都来得清楚。可见,汉语拼音正词法就是以词为单位来正确地书写汉语普通话的拼写法。

    任何拼音文字都应该有自己的正词法。英语、法语、德语等采用拉丁字母作为拼音文字的语言,在长期的历史过程中,发展出适合于本语言特点的正词法。汉语拼音虽然不是拼音文字,但是,在它的实际使用中,特别是在与语言信息处理有关的应用中,也有正词法的问题。为了深入地研究汉语拼音正词法问题,有必要对英语、法语和德语的正词法发展情况进行研究,以便作为我们的借鉴。

1.2 英语的正词法

    英语分古代英语(公元 700 年 - 1100 年)、中古英语(公元 1100 年 - 1500 年)和近代英语(公元 1500 年至今)。

    公元 9 世纪丹麦入侵英国,至 11 世纪初,丹麦实际上统治了英国,丹麦语和英语同属日耳曼语族,加速了古英语的简化过程。

    1066 年法国入侵,法语成为官方语言,法语属罗曼语族,与英语不是同一个语族,英语吸收了大量的法语词汇,语法上也受到了法语的影响。在法国入侵之后,英国实际上存在着 3 种语言:法语是官方语言,拉丁语是宗教语言,英语是社会下层使用的语言。

    后来由于政治上的历史变动,英语逐渐成为官方语言,学校开始教英语,英语成为了英国的全民共同语。在英语上升为官方语言的过程中,吸收了大量的法语借词,公元 1250 年 - 1400 年的 150 年内,约有 10000 个法语词汇进入了英语,75% 至今还在使用。

    由于基督教会的影响,拉丁语词汇也大量进入英语,使得英语的同义词大量增加。例如,同是表示“火” 的 3 个词,fire 来自英语,flame 来自法语,conflagration 来自拉丁语;同是表示“问”的 3 个词,ask 来自古英语, inquire 来自法语,interrogation 来自拉丁语。

    文艺复兴时期对古希腊、罗马文化的研究,大量的拉丁语、希腊语词汇涌入英语。例如,arithmetic (算术),grammar (语法),logic (逻辑)来自希腊语, arbitrator (仲裁人), executer (执行者), item (条款)来自拉丁语。

    这些情况,使得在现代英语中,借词占了 80% 的比重,这些来自不同语言的大量借词,减少了同形词和同音词产生的机会。大量吸收外来词 -- 这是英语正词法得以形成和巩固的一个重要因素。

    英语正词法中比较严重的问题是如何解决英语的书面拼写形式和读音之间的矛盾问题。

     由于文艺复兴时期印刷术的推广和教育的普及,英语的书面拼写形式逐渐统一,形成了规范的形式,而这些规范的形式又通过印刷的方式进一步固定下来。

  与此同时,英语的语音发生了很大的变化。例如,gnash (咬牙)和 gnat(小昆虫)中,g 不发音,knight (骑士)和 know (知道)中,k 不发音,而在中古英语中,这几个字母全都要发音。又如,辅音字母前的 r (如 arm)和词尾的 r (如 father)不发音,词尾的 e (如 live)不发音,而在中古英语中,它们都是要发音的。

    这种情况,使得规范的书面形式与实际的发音之间出现了很大的矛盾。在英语正词法中,基本上保持历史上原来的词形,从而减少了同形词和同音词产生的可能性。

    18 世纪开始,英国强调语言的规范化,要求语言准确有力。1755 年,约翰逊 (Samuel Johnson) 编写了第一部英语词典,把英语词的拼写形式固定了下来。这样,英语的正词法就能够以词典作为规范的根据。

    尊重历史,保留词形的原有形式,这是英语正词法得以形成的另一个重要因素。

    书面拼写形式与实际的发音不一致,当然也会给英语的学习和使用带来一些困难,为了统一读音,英国从维多利亚时代就开始推行标准语,著名语音学家琼斯 (Daniel Johns) 编写的《英语发音词典》  (English Pronunciation Dictionary) 成了人们必须遵守的发音规范。

    我们可以看到,英语的正词法主要是遵从历史原则,同时也适当考虑语音原则。

1.3 法语的正词法

    法语属罗曼语族,它的祖先是拉丁语。拉丁语的使用早在罗马帝国时代就一分为二了:书面的拉丁语古文有严格的语法规则,专为贵族和僧侣使用,口头拉丁语俗体是人民大众使用的活语言,又称民间拉丁语。民间拉丁语随着罗马帝国版图的扩大,由军队和商人传到了法国南部的高卢人那里,并逐渐取代了高卢语,同时又受了高卢语的影响。公元 7-8 世纪,原来的民间拉丁语变成了一种新的语言 -- 这就是古代法语。  

    12 世纪末,以巴黎为中心的方言逐渐成为了法语的全民语言,17 世纪以来,由于发展商品经济的需要,法国一直十分注意语言文字的标准化和规范化,主张清除法语中的不纯洁成分。

    在长期的历史发展过程中,法语的语音有了很大的变化,而书面的拼音形式却已经基本固定下来,语音的演变并没有反映在书面的形式上,因此,法语与英语一样,也存在着书面的拼写形式与实际读音之间的巨大差异。这一方面固然给学习法语带来了一定的困难,但另一方面却为区分同形词和同音词提供有力的手段。

    为了解决书面拼写法和实际读音的矛盾,法语的正词法提出了许多行之有效的规则。

    例如,法语词末的辅音 -ds, -s, -x 等,大多数是古音在书面形式上的遗迹,在现代的口语中已不发音。利用这些形式不同而实际上已经不发音的词末辅音,就可以区分同形词和同音词。poids (重量),pois (豌豆 ),poix(松香)3 个词,发音都是 [pwa], 是同音词,由于词末辅音 -ds, -s, -x 不发音,利用这些形式各不相同的词末辅音,就可以把这 3 个同音词在书面形式上区别开来。

    可见,法语正词法主要是遵从历史原则,并把这个原则作为区别同音词的重要手段。

1.4 德语的正词法

    德国人在使用拉丁字母之前,是使用鲁纳字母(Rune)的。这种字母的形式很像拉丁字母和希腊字母。德国人在接受了基督教之后,就放弃了鲁纳字母而改用拉丁字母。公元 2 世纪,拉丁字母的地位在德国进一步巩固。到了公元 7 世纪,拉丁字母成了西欧各国大部分民族文字的基础。但是,德国使用的拉丁字母是歌德体的字母,与西欧各国并不完全一样。在使用拉丁字母来拼写德语的过程中,德语的正词法逐渐形成。

    例如,在中古高地德语时期,元音的变音(Umlaut)用 a, o, u 后加 e 来表示[ œ:] 写为 ae, [ø:] 写为 oe, [y:]写为 ue, 后来才采用在a, o, u 的上边加区别符号“ ‥ ” 的办法,写为 ä, ö, ü .

    又如,名词 Mann (人)在中古高地德语时期写为 Man, 只有一个 n, 后来为了与属格的 Mannes 相类比,才写为 Mann, 而保存 man 这个古老的写法来表示不定人称代词。

    再如,形容词 alt (老的)的比较级原写为 elter, 为了保持原形,改写为 ä lter, 由于 a 与其变音 ä 之间在形式上有明显的联系,便于一眼看出它们它们在形态上的联系。

    1596 年,语言学家魏歇勒 (Wecherer) 建议,名词的第一个字母大写,这种办法有利于辨识名词,大大地方便了阅读,但也由此而引起了关于字母的大写和小写的一系列正词法问题的争论。

    1876 年,德国召开了正词法会议,会上建议取消字母组合 th, Thal 写为Tal (山谷),并研究了 和长元音的书写规则。

    1901 年,德国召开了第二次正词法会议,通过了第一次正词法会议所提出的各项建议,并采用了著名语言学家格里木 (Grimm) 的建议,放弃了歌德字体,提倡使用西欧各国普遍使用的拉丁字母。

    著名词典编纂专家杜登 (Konrad Duden, 1829-1911)编写了德语正词法词典,为德语正词法的研究立下了功劳。

    德语正词法主要根据下列原则:

  1. 语音原则:这个原则要求词中字母的发音应与该字母的表音一致。例如,p, t, k, f 等字母在词中的任何位置或与任何字母相结合,均依次读为 [p],[t],[k],[f].

    这个正词法原则还要求单词的发音与其拼写法尽量保持一致。例如,kalt(冷)读为[kalt],oft (经常)读为[oft]等等。

    在德语中,70%-80% 的词和字母是符合语音原则的。

    由于坚持了语音原则,使得德语的字母和单词易学易记,给学习和使用带来了极大的方便。

    2. 形态原则:这个原则要求词根和词干的写法,在由它们派生出来的词中保持不变。也就是说,在合成词中,在名词的变格形式中,在动词的变位形式中,在形容词的比较级和最高级形式中,尽量保持词根和词干的原有形式,必要时采用变音 (Umlaut). 例如,tragen (携带)这个词,其现在时变位形式为 du tr ä gst  (你携带),er tr ä gt (他携带),虽然词根 [a] 的读音已经变为 [e] 了,但为了保持 tragen 的原有形式,采用形态原则,把 a改写为 ä. 又如,kaufen (购买)构成派生词 k ä ufer (买主)时,也采用变音 ä, 以便保持 a 的原形。

    3. 识别原则:这个原则要求把声音相同而意义不同的几个词在写法上加以区别,以便在书面形式上区分同音词。例如, Lid (眼皮)与 Lied (歌曲)都读为 [lid], 根据识别原则,把 Lied 中的 [i] 写为 'ie'; malen(画图)和 mahlen(磨碎)都读为[maln],根据识别原则,把 mahlen 中的 [a] 写为 'ah'.

    4. 历史原则:这个原则要求保持历史上的某些传统写法。例如,ziehen(拉)一词中的字母 'h' 是没有什么作用的,因为词根里 'i' 的长音已经写为 'ie', 完全没有必要在加上一个 'h' 来表示长音,但由于这个 'h' 在历史?上曾经表示过一种特殊的而现在已经不复存在的辅音,根据历史原则,可以把这个 'h' 保留在 ziehen 的词形中。

    在这 4 条原则中,“语音原则”是德语正词法的最基本的原则,这个原则使得德语的书面形式比英语和法语易读,易写,易记。

    然而,德语有 19 个元音,23 个辅音,共 42 个音位 (phoneme), 而拉丁字母只有 26 个,这就不可能处处都遵循语音原则。为了弥补字母之不足,同一个字母可以表示不同的音位,同一个音位可以表示不同的字母,也可以采用字母组合来表示一些单字母不能表示的音位。为了补充语音原则的不足,德语正词法还规定了如下的字母拼写规则:

  1. 同一个音位可以用不同的字母或字母组合来表示。

     例如,音位 [ œ: ]可用 ä, e 表示,音位 [y:] 可用ü, üh, y 表示,音位 [k]可用 k, g, c, ch, ck 表示,音位 [s] 可用 s, ss, β 表示,复合音位 [ao]可用 eu, au 表示。

  2. 同一个字母可以表示两个音位的组合。

      例如,字母 x 可以表示 [ks] 这两个音位的组合.

  3. 用不同的字母组合方式表示长元音,并使之成为区别同音词的手段。

      表示长元音的手段主要有:

      ①在元音后加哑音 h 来表示长元音。

          例如,Bahn (路,铁路,火车)中的 ah 表示 [a:], Fehler (缺点)中的 eh 表示[e:].

     ② 用重叠元音字母的方式来表示长元音。

       例如,Haar (头发)中的 aa 表示 [a:], Moor(沼泽地)中的 oo表示 [o:], Allee (林荫大道)中的 ee 表示 [e:].

   采用不同的方法,一些同音词就可以区别开来了。例如,

         Aale (鳗鱼)     --     Ahle (锥子)

         Moor (沼泽地)   --     Mohr  (黑种人)

    由此可以看到,德语正词法十分注意语音原则,但也考虑到了形态原则,识别原则和历史原则,以区别同音词,减少拼音文字使用中的同形现象。

    英语、法语和德语的正词法都考虑到了历史原则,德语正词法还考虑到了识别原则。这些语言的正词法原则可以给汉语拼音的正词法提供宝贵的经验。

1.5 中国文字的拼音化运动

    在明朝末年,欧洲一些国家的传教士来中国传教,开始用拉丁字母给汉字注音,学习汉语和汉字,并出版了一些汉语译音读物,专供欧洲传教士之用。如 1605 年意大利耶稣会教士利玛窦 (Matteo Ricci, 1552 - 1610) 在北京出版的《西字奇迹》,1626 年法国耶稣会士金尼阁 (Nicolas Trigault) 在杭州出版的《西儒耳目资》。著名语言学家罗常培先生说,《西儒耳目资》是“明末耶稣会在中国音韵学上的第一个贡献。”

    鸦片战争之后,各国传教士蜂涌来华,他们用拉丁字母给圣经注音,拼写中国的方言。1867 年,英国人威妥玛 (T. F. Wade) 出版了《语言自迩集》,用 26 个拉丁字母来拼写北京官话,形成了有名的威妥玛方案。

    这些都是用拉丁字母来拼写汉字读音的最早尝试。这样的尝试激发了知识分子对中国文字拼音化的兴趣,在清朝末年,开始了切音字运动。

    在切音字运动中提出的拼音字母是多种多样、琳琅满目的,可以归纳为三大系:

     ① 假名系:模仿日文假名,采用汉字部首作为拼音符号。

        例如,1892 年卢戆章的《一目了然初阶》一书中提出的“中国切音新字”,1901 年王照的“官话合声字母”等都属于假名系。

    ② 速记系:采用速记符号作为拼音符号。

        例如,1896 年到 1897 年两年间出版的蔡锡勇的《传音快字》、沈学的《盛世元音》、王炳耀的《拼音字谱》等书中提出的方案都属于速记系。

    ③ 拉丁系:采用拉丁字母作为拼音符号。

        例如,1906 年朱文熊的《江苏新字母》、1908 年刘孟扬的《中国音标字母》和江亢虎的《通字》、1909 年黄虚白的《拉丁文臆解》等书中提出的方案都属于拉丁系。

   1911 年辛亥革命成功,1913 年在北京成立了“读音统一会”,通过了注音字母方案,这些字母选自古汉字,具有民族特色,1918 年由教育部公布实行,并在全国推广,由于语文工作者的热心倡导,政府的积极支持,注音字母顺利地普及到各级学校,成为字典、词典的注音工具,在帮助学习汉字,普及拼音知识等方面起了很好的作用。这就是民国初年的注音字母运动。

    在清末的切音字运动中,已经开始考虑到拼音正词法问题。卢戆章在他的《一目了然初阶》一书中,已经用短横连接音节的方法实行了初步的分词连写。蔡锡勇的《传音快字》一书中,提出了“连书”的概念。沈学的《盛世元音》一书中,还把“连书”与词类问题结合起来讨论,主张按词类“缮写连书”。王照的《官话合声字母》、朱文熊的《江苏新字母》、刘孟扬的《中国音标字书》等书中,都用不同的方式表示了以词为单位的书写方法。

    但是,学者们对于以词为书写单位,还停留在初步的感性认识阶段,还没有总结出一套较为系统的分词连写规则,更谈不上建立正词法的理论。而且。基本上没有考虑历史原则。

    在民国初年的注音字母运动中,由于这个运动的倡导者只是仅仅用注音字母来给汉字注音,因而对于分词连写的问题几乎没有涉及。所以,我们可以说,注音字母运动对于拼音正词法是没有什么贡献的。  

    1917 年陈独秀在《新青年》上提出了“文学革命”的口号。1918 年钱玄同在《新青年》上发表了《中国今后的文字问题》一文,促进了人们对拼音化问题关注。1923 年,《国语月刊》出版了特刊《汉字改革号》,发表了钱玄同的《汉字革命》、赵元任的《国语罗马字的研究》、黎锦熙的《汉字革命军前进的一条大路》等论文,开始了国语罗马字运动。1928 年 9 月 26 日,由政府正式公布了国语罗马字方案,作为注音字母的第二式。这个方案用拉丁字母来拼写汉语,用字母来表示声调,考虑的比较周密,已经接近拼音文字。但是,没有很好地得到推广。

    在国语罗马字运动中,黎锦熙明确地提出了“词类连书”的问题,并且拟订了“复音词类构成表”,提出了正词法的初步规则。1928 年黎锦熙的《国语模范课本》和 1929 年赵元任的《最后五分钟》,通过拼音读物,对国语罗马字作了较为系统的试验。肖迪忱于 1934 年,孙先六于 1936 年曾经拟订了国语罗马字的分词连写条例,但都不够完整,不够系统,不够成熟。而且也完全不考虑历史原则,很少考虑识别原则。

    30 年代初期兴起了拉丁化新文字运动。这个运动一开始,就以集体名义制定了《中国汉字拉丁化的原则和规则》,于 1931 年 9 月在苏联海参威召开的中国新文字代表大会上通过。1934 年到 1937 年间,上海、北京、天津等城市成立了新文字研究团体,出版了拉丁化新文字的书籍和杂志。1938 年 10 月成立了陕甘宁边区新文字协会。1941 年吴玉章发表了《中国拉丁化新文字的写法规则》一文,对拉丁化新文字的规则作了系统的总结。

    在拉丁化新文字运动中,正词法问题受到了普遍的重视,许多学者对此作了深入的研究。林汉达发表过不少关于分词连写的文章,出版过第一本拼音文字的词表《国语拼音词汇》,倪海曙的《中国拉丁化新文字的写法》一文,提出了词的拼写法规则 68 条,对拉丁化新文字的正词法作了详尽而系统的总结。可惜,这些总结中,并没有注意到历史原则和识别原则,导致同音词的分化很差,成为而后汉语拼音正词法的一个隐患。

1.6 汉语拼音正词法是否应当考虑历史原则和识别原则?

    1958 年 2 月 1 日,中国第一届全国人民代表大会第五次会议通过了《汉语拼音方案》。

    《汉语拼音方案》的内容包括:

    ①字母表:规定字母的形式、名称和顺序。

    ②声母表和韵母表:规定汉语中声母和韵母用字母来表示的方法。

    ③声调符号:规定调号形式和标调方法。

    ④隔音方法:规定隔音符号和隔音字母 y, w, yu 用法。

    显而易见,① ② ③ 三项是关于拼写音节的规则,而  ④项已经超出了单个音节的范围,为拼写多音节的单词创造了条件。

    这个方案在全国推广,在语文教学,词典编纂,文献检索,信息处理等许多领域中得到了广泛的应用。

    1970 年,联合国的地名标准化委员会在雅典举行的专家组会议上,决定采用《汉语拼音方案》作为拼写中国汉语地名的国际标准。1982 年国际标准化组织 (ISO) 的第 46 技术委员会 (TC 46) 投票通过,决定采用《汉语拼音方案》作为用拉丁字母拼写汉语的国际标准,该国际标准的编号为 ISO-7098. 这样一来, 《汉语拼音方案》不仅是中国的国家标准,而且还是国际标准,是世界各国应该遵守的国际规范。

     陆志韦出版了《汉语的构词法》一书,为汉语拼音正词法的研究提供了相当详尽的资料。周有光的《汉字改革概论》一书,对汉语拼音正词法的理论和方法作了全面的论述。在《汉语拼音方案》公布之后出版的《现代汉语词典》、《汉英词典》、《汉语拼音词汇》以及大量的拼音读物,也都采用了分词连写的办法,这些都为汉语拼音正词法的制定积累了多方面的经验。

    1982 年正式成立了汉语拼音正词法委员会。该委员会提出,汉语拼音正词法应该以现代汉语语法中定义的词作为正词法的拼写单位,同时也要照顾到阅读和理解的方便,并且要照顾到某些国际上拼写的习惯。该委员会同时也开始研制汉语拼音正词法的基本规则,参考过去个人研制的和集体草拟的正词法规则,《汉语拼音方案》公布以来出版的各种拼音读物,各种以《汉语拼音方案》为基础并以词为拼写单位的词书,各种信息处理用的汉语拼音分词连写的实践?经验,广泛听取了个方面人士的意见,并请教育界、出版界、信息处理界和语文界的专家学者进行了讨论,又与有关单位协作,进行了 10 万多词的拼写试验。在这些工作的基础上,于 1984 年 10 月公布了《汉语拼音正词法基本规则(试用稿)》。这个试用稿经过几年的实践,又作了适当的修改,于 1988 年 7 月制定了《汉语拼音正词法基本规则》,由国家教育委员会和国家语言文字工作委员会联合公布施行。

    但是,我国的汉语拼音正词法,仍然基本上没有考虑历史原则和识别原则,只是单纯地考虑语音原则,致使同音词难以区分,同形词或词形易混词相当多,造成阅读上的不便,在汉字的计算机拼音输入法中,同音词的选择增加了用户的麻烦,降低了输入的效率,这成为拼音输入法的一个弊病。我国的拼音正词法中,是不是也应当适当的考虑历史原则和识别原则呢?这个问题希望大家讨论。

  在信息网络时代,中文的信息处理成为一个重要的研究领域。也是语文现代化的一个方面。在中文信息处理中,汉语书面文本的自动切分是一个非常困难的问题。从原则上说,汉语拼音中的词应该与用汉字书写的汉语书面文本中切分出来的词保持一致。因此,汉语拼音正词法的深入研究,对于中文信息处理具有重要的作用。我们应该借鉴国外正词法研究的宝贵经验,推进我们汉语拼音正词法的研究工作。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-28 16:26 , Processed in 0.109743 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表