湘里妹子学术网

 找回密码
 注册
查看: 2453|回复: 1

分群连写比分词连写更可行

  [复制链接]
发表于 2011-4-23 08:43:49 | 显示全部楼层 |阅读模式
作者:盛谏 来源:http://www.yywzw.com/jt/sj/sj-01.html

在上世纪中叶的拼音化热潮中,“分词连写”曾作为汉字拼音化的先决条件讨论过。随着汉字信息处理技术的发展,上世纪八十年代陈力为提出“在词与词之间加上空格”。近年来提倡汉字分词连写的人更多,如陆丙甫1994,彭泽润1997等。2004年6月12-13日在南昌召开了“汉字书写系统改进学术研讨会”。据报导此次“会议认为进一步改进汉语书写系统是时代的需要,是词式书写(分词连写)的第一次集中动员……”(彭 泽润,周 纯梅2004) 在看了各种关于“分词连写”的材料后,作者认为分群连写比分词连写更可行,理由陈述如下:

1.汉语以 分群连写 为自然

记得有一篇文章认为汉语的节奏是由词构成的,并举例说“中华民族是伟大的民族”这句话的节奏是:“中华/民族/是/伟大/的/民族”。可是听许多人说这句话的节奏却是:“中华民族/是/伟大的民族”或“中华民族/是/伟大的/民族”。我们分析,在句子中“中华民族”是一个意思相对完整(即局部完整)的“意思群”(以下简称“意群” ),“伟大的” 也是一个意群,“伟大的民族”是一个较大的意群。如果把词比作建造语句的另件,那么,意群就是另件及由它们组成的构件(或称部件)之总和,通常称之为“意群”。语意流中的一个个意群说出口就成为一个个音群,音群内部语音连续,音群之间则稍作停顿,通常称此为“顿连”。意群和顿连,在有关朗读技巧的书中早已提及(例如刘焕阳2002:147)。很明显,西方语言以主重音为音群的划界标志,汉语则以顿连为音群的划界标志。因此,只有依据这些意群的顿连分开连写才合于汉语的语言规律,人们才会觉得自然(不勉强)。例如,人们在相互谦让时常说“你当/我当/都一样!”、“你拿/我拿/都一样”、“你做/我做/都一样” 之类的话,其中“你当”、“我当”在语意流中都是意思相对完整的“意群”,在语音流中便是语音连续的音群,类似于英语中的I'm、you're、he's等音群连写形式,将它们连写不更自然?若非要分词连写,写成 “我 当 你 当 都 一样!”与口语的顿连不一致,多别扭!

2.分群连写 可以 避免分词的困难

有文章说:“老百姓 对 词 有 ‘词感’,可是 跟 语言学家 的 分 词 规范 60 % 不 一致。例如 ‘杨树’、‘柳树’、‘蓝天’、‘白云’,老百姓 认为 都是 词,专家 却 认为 都是 词组,词典 不 收。老百姓 实际上 是 根据 韵律 和 连读 的 语感 来 确定 词 的 界限 的,而 你 的 “词调” 非常 接近 韵律 单位”(胡明扬2004)。我们分析,这种现象可能不是由于老百姓对词有“词感”,也不是根据韵律和连读的语感来确定词的界限,他们只是对语意流中的意群或语音流中的音群有所感觉而已。我们这些以汉语为母语者的脑中存储了大量的语言构件——意群,说话时按照自己要表达的话意组织有关的“意群”依次一个一个说出来,成为语音流中一个一个的音群,正是这种音群顿连形成的节奏(有别于西方语言中词重音形成的节奏)造成了汉语的“韵律和连读的语感”。

有文章说:“我们 发现 无论 是 大学 研究生 还是 大学 教师,即使 是 专门 研究 语言 的,都 对 ‘词’ 的 概念 有 程度 不同 的 模糊 认识。” 又说:“从 小学 语文 教学 开始,像 英语 或者 对外 汉语 教学 一样, 一个 一个 词 地 进行 ‘生词’ 教学,在 词 的 学习 中 逐步 掌握 汉字,不能 孤立 地 进行 ‘生字’ 教学”(彭泽润、王开扬2005)。 然而据我们的分析,造成分词困难的根本原因在于汉语本身的特点而并不在于文化程度或我们的语文教学方法。我们汉语具有“重意不重形”的特点,西方语言的许多形态标志,我们汉语都没有。上面已提到,西方语言中每个词的语音都是带一个主重音的一个音群。两个单词组成复合词后,两个词的主重音逐渐合成为一个主重音,它的语音连成一个音节群,使合成后的词“固化”成为一个词。虽然英语的词重音位置不固定而且语句中的词还要连读,但主重音的作用依然能使词与词组有明确的分别。然而汉语的合成词与词组在语音流中没有明显的标志与区别,例如合成词“黑板”(写粉笔字的板)与词组“黑狗”、“黑猫”读法没有什么两样。汉语语音流的这种特点导致词与词组等构件的模糊(盛谏2005)。
 
汉语中天然存在着以顿连为界的音群,与其对应的意群可以是词,也可以是词组,还可以是别的,而且可长可短,有相当大的宽容度,因此分群连写与分词连写相比,要容易得多。例如“只见其物,不见其人”或口语中的“只见物,不见人”、“只有钱,没有情”,在语音流中都是连读不断的音群,也是语意流中意思相对完整的意群,连着写就成,不必非按词的界限拆开成“只 见 其 物,不 见 其 人”…。又如“不一致”与“一致”一样都是意群,口语中“不一致” 通常是连续的语音,连着写就行,何必非按词的界限 写成“不 一致”。

3.分群连写 能 提高阅读速度

主张分词连写者认为:“现在 不少 人 都 说,词式 书写 延长 阅读 时间,妨碍 阅读 的 连贯性。为什么 词式 书写 给 人 的 感觉 是 事与愿违 呢?这 是 旧 习惯 和 新 习惯 衔接 中 的 惯性 给 人 造成 的 错觉。”其理由是:“没有 谁 会 说 英语 单词 之间 的 空格 会 影响 阅读 的 连贯性,会 延长 阅读 时间,因为 阅读 英语 没有 旧 习惯 的 经历,也 没有 旧 习惯 的 暂时 优势 的 对比(彭泽润2005)。我们认为习惯虽是一个因素,但不是决定因素。决定因素在于是否与语言的特点相适配。英语单词之间的空格与语音流中的音群分界相合,所以不妨碍阅读的连贯性;汉语的词式书写,许多空格与语音流中的音群分界(即顿连)不相合,所以觉着妨碍连贯性。如若不信,我们可将上面这二段引语改成分群连写形式:“现在 不少人都说,词式书写 延长阅读时间,妨碍 阅读的连贯性。为什么 词式书写 给人的感觉 是事与愿违呢?这是 旧习惯和新习惯 衔接中的惯性 给人造成的错觉。” “没有谁会说 英语单词之间的空格 会影响 阅读的连贯性,会延长 阅读时间,因为 阅读英语 没有 旧习惯的经历,也没有 旧习惯的 暂时优势的 对比。” 试读一下分群连写的同样文字便会感到顺畅多了。

分群连写使人觉得顺畅的原因有三:1.由于分群连写与日常说话或朗读时的音群相吻合,这一点上面已说过。2.由于分群连写比分词连写带来更多的语法信息。语法是从口语中总结出来的,口语中哪里连续、哪里停顿都带有语法信息,因此按语音的音群连写比按词连写更易读、易懂。3.由于分群连写与头脑里 存储的意群相吻合,因而使人一听便知,一目便了然。例如 “中华人民共和国” 在我们脑中是“中国全称” 的意思,一般不再通过其中每个单词的意思去理解整个词组的意思。又如“汗牛充栋” 这个成语,学会后一般记住的就是“书很多”的意思,不再细究其中每个词的意思(书多得让运书的牛出汗并堆满了屋子)。因此,意群连写便于对意群的整体理解,能提高速度。反之,若将它们按词拆开,写成“中华 人民 共和国”及“汗 牛 充 栋” 会使人感到划分过于琐碎。这是由于需要将它们重组为“中华人民共和国”和“汗牛充栋”才能在脑中进行意群的检索(即与脑中储存的意群比较),反而降低了速度。

4.分群连写 才能 有效地避免歧义

由于“意群”是根据意思的相对完整性进行划分的,因而它对表达话意,避免歧义有重要作用。为什么口语中不感觉有歧义的句子,在写成书面文字后有时会产生歧义?就因为字字连写的格式没能把口语中的音群表示出来。因此,釆用分群连写便可以彻底解决书面歧义问题。例如“没有人会说英语难了!”,由于其中“会”这个词有两个相近而又有区别的意思,即“有能力做(can)”与“可能(may)”,因此产生歧义。如果采用分群连写,就可以把两种不同意思表示得清清楚楚:一种是“没有人 会说英语 难了!”(话意为:没有会说英语的人,有困难了),其中意群“会说英语”表示“能说英语”的意思;另一种是“没有人会说 英语难 了!”(话意为:没有人会说“英语难学”了!),其中意群“没有人会说”表示“没有人可能说”的意思。如果分词连写,就只有一种写法:“没有人 会 说 英语 难 了!”,就不可能表达“会”的两种不同的意思。可见由于分词连写不能反映口语中音群顿连的不同,往往不能有效避免歧义。

5.分群连写 能 补充“语态”信息

语言中 意群顿连的长短有相当大的自由度,不同的人,不同的场合,音群的顿连会有不同;同一句子,强调的内容不同,音群的顿连也会有所不同。这些 我们姑且称之为“语态”信息。例如有的人说起话来如发连珠炮,语句中停顿少音群长。又如在重要场合讲话斟字酌句,停顿多音群短。同样一句“不知道!”,有时连在一起说“不知道”,有时间断着说 “不 知 道!”,有时拖长着说“不——知——道!”有时斩钉截铁地说“不!知!道!”。如划分到词这一级,这种信息就全部丧失,难以生动地表示话语的语态。
 
6.分群连写 使 标题更醒目

题标一般不是句子,又没有上下文,本来意思就不很明白,加上受字数和标点的限制,容易造成歧义或难读难解。例如陆丙甫在一篇文章中举过一例 :“2000年 2月 20日的 《北京 晚报》 载有 ‘可敬的哥争分夺秒送病人’” (陆丙甫2005),看上去 可能是文章的标题。如釆用 “分群连写”, 排印成 “可敬 的哥 争分夺秒 送病人” 就既清楚又不显琐碎。学术论文的题目往往很长,如能适当加空格也能便于阅读和理解。但若按词划分,必然出现过多的空格,显得支离破碎,难以醒目。

7.“分群连写” 能 减少机器处理的难度
 
人工智能无非是对人的一种模仿,因此只要人感到容易了,机器处理起来,难度也会随之降低。在说或理解话语的时候,“意群”相当于语言构件,计算机可以进行整体存储整体处理,比按词划分更快捷。例如让计算机把“恕不找零” 翻译成英语,计算机只需查四字成语数据库就可直接找出对应的英语通用短语。如果分词书写,写成“恕 不 找 零” 或“请 愿谅,我们 不 找 零钱”,计算机必须先进行语法分析和理解,然后再按机器所理解的意思组织出对应的英语语句,这样译出来的英语,即使通顺达意,也肯定不会与公共车上的通用英语短语相同,只会让人觉得怪异!
 
参考文献:

陈力为(1987)《在词与词之间加上空格》,计算机世界 第21期, 第34版。
陆丙甫(1994)《中文分词连写的构想》,语文专刊 第10期,第18-24页。
陈力为(1997)《汉语 书面语 分词 连写 是 有关 全社会 信息化 的 大 事》,中文信息 第2期。
彭泽润(1997)《字间 空隙 和 词间 空隙》,中文信息 第2期。
周有光等(彭泽润整理)2001《周 有光、王 均、冯 志伟 先生 关于 汉语 “词式 书写” 改革 的 通信 》,现代语文,2001,(3),语言理论通讯 第15期,语网专栏《语言理论通讯》,语言文字网http://www.yywzw.com
刘焕阳(2002)《通用语言文字教程》,第147页,山东大学出版社。
胡明扬(2004)《胡明扬给彭泽润的信和彭泽润的注释》,语言理论通讯19期,语网专栏《语言理论通讯》,语言文字网http://www.yywzw.com
彭 泽润,周 纯梅(2004)《汉语 需要 从 “字式 书写”到“词式 书写”改进——“汉字 书写 系统 改进 学术 研讨会”综述》,语言理论通讯 第19期,语网专栏《语言理论通讯》,语言文字网http://www.yywzw.com
盛谏(2005)《对汉语与西方语言词特性的差异的思考》,语网专栏《语音象征与语言》,语言文字网www.yywzw.com及个人网站www.friendlywords.org
彭泽润、王开扬(2005),《词意识和汉语现代化问题》,论文专题9,语网专栏《语言理论通讯》,语言文字网http://www.yywzw.com
彭泽润(2005)《汉字文本词式书写改革的心障碍分析》,学术活动之5.“汉字 书写 系统 之 改进” 会议 专题之b. ,语网专栏《语言理论通讯》,语言文字网http://www.yywzw.com
陆丙甫(2005),《增加 汉字 书写 系统 的 语法 信息》, 汉字 书写 系统 之 改进” 会议 专题b.,陆丙甫文集,语言文字网http://www.yywzw.com
陆丙甫(2005)《汉字文本 便读格式 初探》修辞学习2005(5):6-13。

* 本文的征求意见稿于2005年10月8日发苏培成、彭泽润,陆丙甫诸先生,很快收到彭、陆两位的反馈意见和支持,陆丙甫先生还通过附件传来了他刚出版的《汉字文本 便读格式 初探》一文,作者在此一并衷心致谢!

(原载《语文建设通讯(香港)》2006年4月第83期第23-26页)

题后记:稿件寄出后收到了第82期《语文建设通讯》,其中王永成先生的《汉字、辞、语义块与概念》一文从中文信息处理技术的角度讨论了句子的理解过程,与作者从语言学的角度描述的中文语句的读听过程(盛谏2005)十分一致,语义块可能就是指朗读时的意群。王永成先生的实践经验生动而有力的说明:汉语有自己固有的特点,因此不宜简单套用西方语言的分词模式。
发表于 2011-6-14 08:11:57 | 显示全部楼层
有一定道理!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-27 16:02 , Processed in 0.081678 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表