湘里妹子学术网

 找回密码
 注册
查看: 7797|回复: 2

关于统一两岸(包括港澳)汉字字形的几种设想(提要)

[复制链接]
发表于 2004-6-13 15:23:08 | 显示全部楼层 |阅读模式
作者:冯寿忠教授
--------------------------------------------------------------------------------------

      实现两岸乃至更大范围内的汉字书同文,无法绕开而必须解决的问题,是汉字字形的统一问题。可以说,要想实现哪个范围内的汉字书同文,就需要制定哪个层面上的统一的汉字字形表。

      就目前来看,着眼于两岸,先把两岸汉字字形的书同文问题解决好,然后再解决更大范围内的汉字书同文,是比较切实可行的。
仅就两岸(包括港澳)范围内的统一汉字字形表的制定而言,我们目前也还面临着多种选择。

一、关于“取消繁简”的设想

⒈该设想的目标与策略

      所谓“取消繁简”的设想,即打破目前繁简并存的困扰,本着“一步到位”的原则,制定一个为大陆人、港澳台人等各方汉字使用人都能接受的汉字字形统一方案。

       这种方案的策略是,不再在繁体字好或简体字好上面纠缠,而是取消繁简的对立,将所有汉字作通盘考虑,在同一个字的不同写法中,选择一个在共时交往中能为各方面都能认同,而在历时交流(阅读古书与古人交流)时也无多大不便的写法。当然,如何定夺正体字形,还需要制定更详细的标准。

⒉该设想的操作优势

      新西兰有个叫王和的人士,曾经提出过有关设想(注:他没有提到为不同时代确立不同正体字形的理念),并做过些须字形的分析比较工作,尽管他的分析结果我们并不都十分赞同,但他筚路蓝缕的工作经验是值得借鉴的。

⒊该设想的操作困难

     就目前看,这种方案的实现,无论在学术层面还是社会层面,都还面临许多困难。

     从学术层面讲,我们要拿出这种方案,还需要做许多理论性的研究工作。最起码要组织专家对每个汉字的所有异体字形进行比较详尽的调查研究,并厘定出不同时代的正体字形。

      从社会层面讲,我们还需要做许多社会性调查工作和许多说服性舆论工作,要挑战大陆人的简化字习惯和港澳台人的繁体字习惯。

     当然,最大的阻力恐怕还是政治因素,在“台独”思维的影响下,不管我们大陆搞出什么字形表,对岸当局总会想方设法另搞一套与之抗衡。最近出台的《异体字字典》,据说就是为了抗衡大陆的《中华字海》等研制出来的。

⒋该设想的前景预测

     其实,这种抗衡若带有一定程度的竞赛性的话,也是有某些好处的,最好的汉字字形统一方案,也许可以以这种方式不自觉地诞生出来。


二、关于“并存繁简”的设想


⒈该设想的目标与策略

      所谓“并存繁简”的设想,即我曾经提出过的“各安现状,彼此沟通,逐步统一”的设想。这种设想分三步走,现在应重点放在各安现状上,即各自搞好各自的汉字规范化建设。就大陆来说,就是首先搞好简化字的规范化建设,消除简化字体系中的不利于两岸信息交流和继承古代文化遗产的各种因素,使之能够很方便的为人们的信息交流服务。

      台湾的戚桐欣先生也有类似的主张。他认为,简化字完全可以作为一种字体内保留下来,与繁体字(他叫正体字)并存并用,如果使用他发明的技术软件,完全可以保证在繁简并存的情况下,顺利输入和输出各体汉字。
为了检验出个别影响繁简转换的障碍字,我们二人还筹编了《中文》杂志,为两岸汉字的彼此沟通,进行了具体实验。通过实验,我们检验了许多现行字体软件转换效果,掌握了一些初步的数据。

⒉该设想的优势与困难
     
      目前来说,最重要的是消除两岸汉字对应转换的两大障碍:非对称繁简字和非对等异体字。在整个汉字体系中,两岸不同的汉字只占很少部分,简化字只有2000多字,不能一一对应的非对称繁简字则更少,在通用字GNK范围内共有110多组。在异体字的取舍上,两岸也不都是分歧的,同样取舍的也不少,据不完全统计,在通用字GBK范围内,因两岸取舍不同造成的的非等同异体字有380多组。这500组左右的转换障碍字,如果能得到妥善处理,两岸信息文本的自动转换,将变得易如反掌。各种字符处理软件所存在的问题,将不翼而飞。

      但问题是,大家都把注意力投向了软件方面,企图通过软件的不断改进,彻底消灭繁简转换的文本错误。最常见的办法是采用词语转换,但这种做法理论上就存在先天不足,因为,词语是语言系统中最活跃的因素,吐故纳新的频率比较快,任何词典都不能穷尽所有的新生词语,而计算机软件则不能随时改进。而解决了文字的一一对应问题,就可以一劳永逸,因为任何词语都是用文字来书写的。

      现在许多字体转换软件,还闹出了不少笑话。例如,把“信息”转换成“资讯”,把“对象”转换成了“物件”,把“网络”转换成了“网路”,等等。这些意义等同或相近的词语,本该属于“异形词”的范畴,可以通过时间的检验,优胜劣汰。而这样的转换,却无意中助长了两岸汉语的分化,与两岸汉语的统一要求背道而驰。

⒊该设想的前景预测

      目前,大陆正在研制的《规范字表》和台湾已经发布的《异体字字典》,都是两岸“各安现状”的汉字规范化研究成果。大陆方面的《规范字表》,已经充分考虑到了与港澳台用字的对应问题,台湾方面的《异体字字典》也充分借鉴了大陆的各种规范,总之分歧正在缩小,共同点正在扩大,更重要的是已经初步形成了一种“统一”的默契。可以预料,随着“彼此沟通”的不断深化,“逐步统一”的目标正在慢慢逼近。


三、关于“以简统繁”的设想


⒈该设想的目标与策略

      我们认为,最保守的办法就是先解决好这些在许多字处理软件中经常不很听话的字组,以应付目前的急需。至于更大范围内的障碍字的整理,则要看各种社会条件的是否许可。

      在实现“统一”的其他条件未满足之前,先采取更为保守的“以简统繁”的设想。所谓“以简统繁”的设想,即着眼于简体字并适当考虑与繁体字、异体字的对应转换问题而制定的字形标准方案。

⒉该设想的主要任务

      这种方案不必解决所有的障碍字问题,只要解决好目前各种汉字处理软件尚未解决好的一些字的问题就可以了。根据我们的实验,当前,阻碍成为两岸汉字顺利转换的障碍字虽然号称500左右,但由于软件专家们的努力,通过上下文识别等智能化方法,已经解决了很大一部分问题,未能解决好的已经不是太多了。例如:

于——于於、谷——谷穀、吁——吁籲、汇——匯彙、范——范範、云——云雲、后——后後
卜——卜蔔、仆——仆僕、丰——丰豐、采——采採、才——才纔、游——游逰、幸——幸倖
欲——欲慾、只——隻衹、向——嚮曏、象——象像、注——注註、尽——盡儘、蔑——蔑衊
准——准準、征——征徵、余——余餘、岳——岳嶽、占——占佔、着著——著、奸——奸姦
致——致緻、幸——幸倖、钟——鍾鐘、托——托託、渎——瀆凟、梁——梁樑、闲——閑閒
历——歷曆、背——背揹、发——發髮、松——松鬆、尸——尸屍、回——囬迴、仿——倣髣
卷——卷捲、沈——卷瀋、赞——贊讚、划——划劃、斗——斗鬥、志——志誌
毁——毁燬譭、复——复複復、系——系係繫、升——升昇陞、里——里裡裏、么——么幺麽
干——乾幹榦、并——幷竝並倂

      需要说明的是,并不是所有的字处理软件都对上述汉字的对应转换处理得不好,但也没有一个软件能够把上述字的对应转换都处理得十分令人满意。

⒊该设想的前景预测

      这种设想步子最慢,因此最稳妥,但又离最终目标最遥远。为了实现该设想,我们提出了一个建议,请大家发表高见。(见《关于部分繁简字、异体字和新旧字形的规范化整理的几点意见》)


四、结语:


      以上我们讨论了三种统一汉字字形的可行性方案,应当说它们各有特色,各有利弊。第一种目前的社会阻力较大,但长痛不如短痛,下定决心,一步到位,可以节省许多宝贵的时间。第二种比较适中,各种阻力也较小,虽然需要一段较长的过渡时期,但比较切实可行。第三种是一种保守疗法,有头疼医头,脚疼医脚之嫌,虽然没有什么阻力,但也基本没有什么作为。

      目前正在组织制定的《规范字表》,我们希望能够选择第一种方案,起码应选择第二种,若选择第三种的话,那就太保守了。
(2004.5-21草成)
 楼主| 发表于 2004-6-13 15:25:56 | 显示全部楼层

汉字 书写 系统 改进 国际 研讨会

汉字 书写 系统 改进 国际 研讨会
1  敖小平:中文语音合成系统中的自动分词技术
2  曹德和:汉语分词连写的必要性和可行性
3  陈永舜:中文信息处理需要的证词法中的“词”
4  冯寿忠:统一两岸(包括港澳)汉字字形的几种设想
5  冯志伟:汉语书写形式的改革是历史的必然和时代的需要
6  傅思泉:浅谈汉语书面语的分词连写
7  高更生:海峡两岸字形的规范
8  郭致平:漢語書寫系統優化的理論與方案
9  李逊永:从信息语言学、认知语言学和模糊语言学看中文的分词连写问题
10 林仲湘 林华:试论专有名词的表示法
11 陆丙甫:汉字文本 便读格式 初探
12 陆锡兴:“二简”研究
13 孟华:  汉语分词连写的性质
14 彭泽润: 汉字 文本 词式 书写 改革 的 心理 障碍 分析
15 戚桐欣:电脑中文的发展方向
16 盛玉麒:网络生存方式与汉字书写
17 苏培成:现代白话文的演进
18 王开扬:汉语的自动理解与汉语文本的改革
19 吴琦幸:海外华文媒体书系统的分与合
20 吴文超:汉语分词连写的重要性
21 严永欣:为什么中文分词书写难以成功
22 杨锡彭:字母词与汉字音译词
23 余颂辉等:汉字书写系统五论


1 中文语音合成系统中的自动分词技术
敖小平 美国 The Little Cottage Company

本文介绍中文自动分词技术在中文语音合成系统中的应用。
中文自动分词是中文语音合成技术中不可或缺的一环。多音字的正确发音、音节的正确变调和词句的正确韵律均有赖于此。
关于中文词的定义众说纷纭。根据论者的侧重点大致可以分为辞典词、语法词和语音词三类。中文语音合成系统自动分词的目的是语音词,其出发点却是辞典词。
中文自动分词的方法大致有最大匹配和随机组合两大类。其中最大匹配法又分为右向、左向和双向。两类分词法各有千秋。
本文介绍的自动分词技术采用右向最大匹配法,并采用反词技术来抵消其“左倾”副作用。
经过右向最大匹配法分出来的词是辞典词。下一步需要将可以结合为语音词的辞典词拼合成语音词。这里需要考虑的主要有重叠词、数量词以及前、后、中缀的鉴别与组合。
作者可以现场演示中文语音合成系统及其自动分词技术的操作过程。
(LinguaSinica.com, 15933 Indian Creek Road, Cerritos, CA 90703, USA)


2   讨论 中文 分词-连写 不可 忽略的 若干 问题
曹德和    南昌大学 中文系  南昌  330047

1 ,         在 数千年 汉语 书面语 发展 过程中 ,人们 只 感到 有 分句-连写的 必要 而 没有 感到 有 分词-连写的 必要 ,甚至 在 全面 学习 西方的 年代里 ,也 没有 想到 应当 引入 西方 国家 普遍 采用的 分词 连写 格式 ? 这是 为什么 ?
2 ,         上个 世纪 50年代 , 有人 提出 中文 分词-连写的 问题 ,但 社会 对此 置若罔闻 ; 上个 世纪 80年代 , 又 有人 提出 中文 分词-连写的 问题 , 结果 引起 较大 共鸣 ,为什么 ?
        3 ,         实行 中文 分词-连写的 主要 目的 是 什么 ? 是 为了 适应 信息 时代 ? 是 为了 语文 现代化 ? 还是 为了 避免  误 读 ?
        4 ,         理想的 书写 方式 能够 做到 内外 一致 , 不 理想的 书写 方式 是否 一定 要 改革 ?
5 ,         如何 处理 科学 进步 与 人文 关怀 之间的 关系 ? 为了 科学 进步 而 罔顾 人文 关怀 故不可取 , 但 强调 人文 关怀 而 漠视 科学 进步的 需要 可能 要 付出 沉痛 代价, 科学 进步 与 人文 关怀 难道 不能 统筹兼顾 ?
        6 ,         倘若 因为 没有 采取 分词-连写 方式 而 使 中文 信息 处理 始终 陷于 举步维艰的 窘境, 从而 制约 中国的 科技 进步 和 经济 建设 ,是否 有必要 权衡 得失 , 在 坚持 “以人为本”的 前提下 作出 一点 小小的 牺牲 。
        7 ,         实行 中文 分词-连写的 主要 动力 来自 信息 处理的 需要 , 但 中文 分词-连写 方式的 普及 不是 短期内 可以 实现的 事 ,远水不解近渴 。 在此 情况下 能否 找到 以解 燃眉之急的 办法 ? 譬如说 ,让 出版物 率先 采取 分词-连写 格式 ?( 现在 分词 软件 已经 问世 ,能够 达到 90%以上的 正确率 。 用 分词 软件 对 电脑 文本 作 分词 处理 ,上万字的 稿件 几分钟内 就能 完成 ,编辑 只要 对 失当之处 作点 调整 即可 )
        8 ,         对于 中文 来说 , 符合 怎样的 条件 才有 资格 成为 确立 分词-连写 规范的 根据 ? 语法? 语义? 语音?当取 何者 为 根据 ?
        9 ,         采用 何种 文字 符号 以及 书写 格式 仅仅 是个 学术 问题 吗 ? 如果 说 文字 符号 以及 书写 格式的 选择 同时 受到 社会 因素的 影响 , 影响力 有 多 大 ?

3  中文信息处理需要的正词法中的“词”
                  陈永舜  北华大学师范学院中文系132013

   是yīnɡ  bù yīnɡɡāi,还是yīnɡbuyīnɡɡāi;是“kànbukàn”还是“kàn bù kàn”?把“小刘笑掉了牙”分析为“这是带宾的主谓句,‘笑’如果没有结果补语‘掉’,就带不了宾语‘牙’”,行吗?把“梵蒂冈不赞成堕胎受到谴责”按词断成“梵蒂冈 不  赞成 堕胎 受到 谴责”,能看清“梵蒂冈 究竟 赞成不赞成 堕胎”吗?根据汉字本位,有人检索“东汉”的内容,《远东汉英大词典》《山东汉文化遗址考》都前来报到,符合要求吗?  
    信息处理需要的拼音正词法的“词”,要求我们彻底从事实出发,实际是对各种适用于“人”的语法理论的一种检验和挑战。同时,要求汉语语法研究应该面向应用有了新的动力。前例“梵蒂冈不赞成堕胎受到谴责”有两个意思:a、“梵蒂冈赞成堕胎”应断成“梵蒂冈  
不赞成 堕胎受到谴责”;b、“梵蒂冈不赞成堕胎”应断成“梵蒂冈不赞成堕胎 受到谴责”。说的和写的人究竟是哪几个“预制件”,心里非常清楚,只是由于书面上没有反映出来, 读者要下一番寻找的苦功夫。《汉语拼音正词法基本规则》(GB/T16159-`1996)包括《信息处理用现代汉语分词规范》(GB/T13715-92)的拟订,都试图先有一个规则,避免漫长的“约定”过程,用心良苦。由于汉语研究中汉字干扰的惯性作用,人们很难跳出窠臼,我国缺少的又恰恰是连写实践,所以“分写”的“词”多,“连写”的“词”少,动机和效果没有统一起来。当务之急是讨论清楚什么是中文信息处理所需要的正词法的“词”。
                20世纪五十年代讨论拼音文字时有很多关于“连写词”的高见。刘泽先说:“我认为不是‘词儿’规定‘词儿连写’,而是‘词儿连写’规定‘词儿’。‘词儿’的定义似乎应该是:经常连写在一起的一组字母。”彭楚南的文章说:“一般的外国文字有传统的连写制度,连写在一块的东西我们管它叫‘形式词儿’,因为这一概念是从形式出发,不考虑形式以外的东西。”这些极有见地的观点后来逐渐被人们淡忘了。正词法应该是以词汇词、语法词为单位的语言系统到以连写词为单位的文字系统之间的一套转换规则。拼音就是为了把语言的声音表面化,写出来的词在脑子里转换成相应的口语,把口语的信息最大限度地反映到书面上。正词法的“词”是为了把听来能懂的有声语言写成看来能懂的有形拼音,所以在确定连写单位时要充分注意语音原则。连写词所反映的语言现象实际上并不仅仅是词的切分,而是节律。连说的就连写,拼写出来的“词”,应该比汉字读起来方便,使视觉和听觉趋于一致,有语音节律的表象,和表义又不相悖,符合计算机逻辑运算的“形式化”要求。这正是我们要寻求的“正词法”中连写的“语音形式词”。既然把语言的外壳形式化了,同时也就把内容形式化了,便于看又便于听,帮助人们理解和机器运算,是我们拟订汉语拼音正词法的根本出发点和落脚点。把人们口语中一件易如反掌的事情铸成难以攻破的堡垒,是我们现行的汉语书面语不按“语音形式词”书写造成的后果,必须引起我们的深思。五四前后实行的分段,引进标点符号和阿拉伯数字,建国后的左起横书,每次改革都是为了适应客观需要。虽然要费些力气,但由于含糊和歧义减少了,信息含量增加了,不仅为读者带来了好处,社会效益也增强了。  
面对信息化的挑战,汉语书面语的分词技术已经悄悄地形成了一门新兴的富有挑战性的学问。对分词系统的要求越来越高,难度也越来越大。动用现代化手段,从浩瀚的书面语料中寻找收进、未收进词典中的单音节、双音节、多音节基本词、百科词、短语等“理论词”和大量的句中临时组合的“预制件”在内的“语音形式词”,编成词库,是利在当代,惠及子孙,前人栽树后人乘凉的基础工程,应该说是刻不容缓了。


4 关于统一两岸(包括港澳)汉字字形的几种设想
冯寿忠  山东潍坊学院中文系教授

实现两岸乃至更大范围内的汉字书同文,无法绕开而必须解决的问题,是汉字字形的统一问题。可以说,要想实现哪个范围内的汉字书同文,就需要制定哪个层面上的统一的汉字字形表。
就目前来看,着眼于两岸,先把两岸汉字字形的书同文问题解决好,然后再解决更大范围内的汉字书同文,是比较切实可行的。
仅就两岸(包括港澳)范围内的统一汉字字形表的制定而言,我们目前也还面临着多种选择。
一、关于“取消繁简”的设想
⒈该设想的目标与策略
所谓“取消繁简”的设想,即打破目前繁简并存的困扰,本着“一步到位”的原则,制定一个为大陆人、港澳台人等各方汉字使用人都能接受的汉字字形统一方案。
这种方案的策略是,不再在繁体字好或简体字好上面纠缠,而是取消繁简的对立,将所有汉字作通盘考虑,在同一个字的不同写法中,选择一个在共时交往中能为各方面都能认同,而在历时交流(阅读古书与古人交流)时也无多大不便的写法。当然,如何定夺正体字形,还需要制定更详细的标准。
⒉该设想的操作优势
新西兰有个叫王和的人士,曾经提出过有关设想(注:他没有提到为不同时代确立不同正体字形的理念),并做过些须字形的分析比较工作,尽管他的分析结果我们并不都十分赞同,但他筚路蓝缕的工作经验是值得借鉴的。
⒊该设想的操作困难
就目前看,这种方案的实现,无论在学术层面还是社会层面,都还面临许多困难。
从学术层面讲,我们要拿出这种方案,还需要做许多理论性的研究工作。最起码要组织专家对每个汉字的所有异体字形进行比较详尽的调查研究,并厘定出不同时代的正体字形。
从社会层面讲,我们还需要做许多社会性调查工作和许多说服性舆论工作,要挑战大陆人的简化字习惯和港澳台人的繁体字习惯。当然,最大的阻力恐怕还是政治因素,在台独思维的影响下,不管我们大陆搞出什么字形表,对岸总会想方设法另搞一套与之抗衡。
⒋该设想的前景预测
其实,这种抗衡若带有一定程度的竞赛性的话,也是有某些好处的,最好的汉字字形统一方案,也许可以以这种方式不自觉地诞生出来。
二、关于“并存繁简”的设想
⒈该设想的目标与策略
所谓“并存繁简”的设想,即我曾经提出过的“各安现状,彼此沟通,逐步统一”的设想。这种设想分三步走,现在应重点放在各安现状上,即各自搞好各自的汉字规范化建设。就大陆来说,就是首先搞好简化字的规范化建设,消除简化字体系中的不利于两岸信息交流和继承古代文化遗产的各种因素,使之能够很方便的为人们的信息交流服务。
⒉该设想的优势与困难
目前来说,最重要的是消除两岸汉字对应转换的两大障碍:非对称繁简字和非对等异体字。在整个汉字体系中,两岸不同的汉字只占很少部分,简化字只有2000多字,不能一一对应的非对称繁简字则更少,在通用字GNK范围内共有110多组。在异体字的取舍上,两岸也不都是分歧的,同样取舍的也不少,据不完全统计,在通用字GBK范围内,因两岸取舍不同造成的的非等同异体字有380多组。这500组左右的转换障碍字,如果能得到妥善处理,两岸信息文本的自动转换,将变得易如反掌。各种字符处理软件所存在的问题,将不翼而飞。
⒊该设想的前景预测
目前,大陆正在研制的《规范字表》和台湾已经发布的《异体字字典》,都是两岸“各安现状”的汉字规范化研究成果。大陆方面的《规范字表》,已经充分考虑到了与港澳台用字的对应问题,台湾方面的《异体字字典》也充分借鉴了大陆的各种规范,总之分歧正在缩小,共同点正在扩大,更重要的是已经初步形成了一种“统一”的默契。可以预料,随着“彼此沟通”的不断深化,“逐步统一”的目标正在慢慢逼近。
三、关于“以简统繁”的设想
⒈该设想的目标与策略
我们认为,最保守的办法就是先解决好这些在许多字处理软件中经常不很听话的字组,以应付目前的急需。至于更大范围内的障碍字的整理,则要看各种社会条件的是否许可。
在实现“统一”的其他条件未满足之前,先采取更为保守的“以简统繁”的设想。所谓“以简统繁”的设想,即着眼于简体字并适当考虑与繁体字、异体字的对应转换问题而制定的字形标准方案。
⒉该设想的主要任务
这种方案不必解决所有的障碍字问题,只要解决好目前各种汉字处理软件尚未解决好的一些字的问题就可以了。根据我们的实验,当前,阻碍成为两岸汉字顺利转换的障碍字虽然号称500左右,但由于软件专家们的努力,通过上下文识别等智能化方法,已经解决了很大一部分问题,未能解决好的已经不是太多了。例如:
于——于於、谷——谷穀、吁——吁籲、汇——匯彙、范——范範、云——云雲、后——后後。        卜——卜蔔、仆——仆僕、丰——丰豐、采——采採、才——才纔、游——游逰、幸——幸倖。        欲——欲慾、只——隻衹、向——嚮曏、象——象像、注——注註、尽——盡儘、蔑——蔑衊。        准——准準、征——征徵、余——余餘、岳——岳嶽、占——占佔、着著——著、奸——奸姦。        致——致緻、幸——幸倖、钟——鍾鐘、托——托託、渎——瀆凟、梁——梁樑、闲——閑閒。        历——歷曆、背——背揹、发——發髮、松——松鬆、尸——尸屍、回——囬迴、仿——倣髣。        卷——卷捲、沈——卷瀋、赞——贊讚、划——划劃、斗——斗鬥、志——志誌。        毁——毁燬譭、复——复複復、系——系係繫、升——升昇陞、里——里裡裏、么——么幺麽。        干——乾幹榦、并——幷竝並倂
需要说明的是,并不是所有的字处理软件都对上述汉字的对应转换处理得不好,但也没有一个软件能够把上述字的对应转换都处理得十分令人满意。
⒊该设想的前景预测
这种设想步子最慢,因此最稳妥,但又离最终目标最遥远。
四、结语:
以上我们讨论了三种统一汉字字形的可行性方案,应当说它们各有特色,各有利弊。第一种目前的社会阻力较大,但长痛不如短痛,下定决心,一步到位,可以节省许多宝贵的时间。第二种比较适中,各种阻力也较小,虽然需要一段较长的过渡时期,但比较切实可行。第三种是一种保守疗法,有头疼医头,脚疼医脚之嫌,虽然没有什么阻力,但也基本没有什么作为。
目前正在组织制定的《规范字表》,我们希望能够选择第一种方案,起码应选择第二种,若选择第三种的话,那就太保守了。

5 汉语书写形式的改革是历史的必然和时代的需要
冯志伟  KORTERM, 韩国科学技术院计算机系

    自然语言的信息处理都是以词作为基本根据的,而中文书面语中没有词的界限,词界标志问题成为了中文信息处理的拦路虎,为了适应信息时代对中文信息处理的要求,汉语书面语还应该进一步改革,加空格表示词界,实行分词连写。我们认为,这是汉语书面语改革的继续和发展,是时代发展的需要。
      有的人可能会提出这样的疑问:汉语书面语现有的这种形式,我们用得好好的,为什么要多此一举呢?其实,汉语书面语的形式,在很多年以前并不是现在这样的形式。几十年之前,汉语书面语是竖排右起的,没有使用新式标点符号,也没有使用阿拉伯数字,更没有使用表示阴性第三人称的“她”字。汉语书面语是经过了改革之后,才有了今天这样的面貌的。所以,加空格表示词界,只不过是汉语书面语改革的进一步发展,绝不是标新立异、耸人听闻的之说。      
      其实,加空格表示词界,实际上乃是汉语书面语形式改革的继续,是汉语书面语形式改革的进一步深化。
    我国早在在白话文运动中,对汉语的书面形式也进行了改革,主要是:中文横排的确立,新式标点符号的运用,阿拉伯数字的采用,“她”字的创造。
现在我们对于汉语书面语中的左起横排、新式标点符号、阿拉伯数字和表示阴性第三人称的“她”字,都早已习以为常,司空见惯了。但是,这些改革都是在信息时代到来之前进行的,从事改革的先驱者们完全没有考虑到信息时代对语言文字的新要求。今天,面对信息时代的需要,我们还有必要把汉语书面语的改革继续推进一步:给汉语书面文本一个词界的形式标志—“空格”。
在信息技术迅速发展的今天,在汉语书面语的改革中进一步实行分词书写,给汉语的书面语以词界标志,这已经是一件刻不容缓的事情了。每一个关心汉语书面语的改革的志士仁人都应当认真考虑这个问题。我们已经采用了左起横排,我们已经采用了新式标点,我们已经采用了阿拉伯数字,我们已经大胆地创造了“她”字,西方语言的书面语的这些长处我们中国人都一个一个地吸收了。为什么我们就不能更上一层楼,在书面语中实行分词连写,像西方语言的书面语那样,给汉语的书面语以词界标志呢?这将是我国书面语改革的更加重要的一步,勇敢地迈出这更加重要的一步,汉语的书面语必定会在“网络多语言文字时代”大展宏图。(Email: zwfeng@world.kaist.ac.kr)


6  浅谈汉语书面语的分词连写
傅思泉 刘胜利 南昌大学人文学院

[内容提要]由于汉语书面语中词与词相连在一起,没有间隔,因此导致许多歧义句和令人费解语句的产生,较大程度上影响了对文章的阅读,本文主要考察了一下这些歧义句和令人费解语句的类型;同时本文用实验语音学的方法考察了一下阅读未经过分词处理的语句和经过分词处理后语句的时长,从而为汉语书面语分词连写的必要性提供了比较科学的数据。
[关键词]书面语  分词连写  歧义  实验语音学  时长

1.引言
现代汉语引入了标点符号,极大地方便了阅读,但另一个问题并未解决:因为标点符号是从西方引进的,而西方语言(如英语)本身词与词是分开的,因此标点符号主要用来间隔语句和标示特殊词语,而汉语由于词与词之间没有间隔,因此标点符号的引进并未解决词与词之间的无间隔情况。因此对汉语进行分词连写的改革可说是继书写由竖排改为横排、引进标点符号后又一次新的重大革新。

2.词语无间隔导致的歧义句和令人费解语句:
一、拗口、饶舌或是令人费解的语句,如:
1)        公司主导产品[凯时]——前列地尔脂肪微球靶向制剂将前列地尔包封在脂微球载体中。
2)        它采用直列四缸双顶置凸轮轴16气门机体设计。
二、在不同语境下可产生歧义和不同的理解,如:
3)        这水果真凉。(“这水果/真凉”或“这水/果真凉”)
4)        县里的通知说,让赵乡长本月15日前去汇报。(“本月15日前/去汇报”或“本月15日/前去汇报”)
三、由于视线范围的限制而导致的错误判断,如:
5)        其中比较可信的是由北达科他州立大学人类学教授爱德华•米里根提出的。(误认为“北达科他州-立大学”)
6)        她觉得自己的心眼看就要爆炸了。(误认为“心眼-看”)
四、由于上下文语境或读者文化的限制而导致误解,如:
7)        韩勇中医师创建的“9+9总部”历经18年的发展……(“韩勇/中医师”误解为“韩勇中/医师”)
8)        在1983年美国因缅甸军政府“镇压民主运动”而对缅甸实施制裁以后……(“缅甸军/政府”误解为“缅甸/军政府”)

3、汉语书面语的无间隔降低了阅读效率
在阅读的时候,尽管汉语没有间隔,但实际上人脑是边读边切分的,因此如果汉语书面语已经分词过了,也就是说不再需要人脑来进行切分工作,相信阅读 效率会提高,也更轻松,阅读的时间也会缩短,当然人脑切分词语也是瞬间完成 的,对书面语进行分词能提高多少效率,凭感觉也难说清楚。因此,为了较科学的得出对书面语进行分词处理后提高的效率,作者从例句中抽取 11例,并增添 三句没有任何问题、可以顺利阅读的普通语句,进行实验测试,看看它们所需花费的时间。
        实验设计如下,共33位发音人,其中16人阅读未经过分词处理的例句,另17人阅读经过分词处理后的语句,事先不告诉阅读者实验目的。也不让其预先看到待阅读的语句。录音软件为专业语音处理软件praat,对以上例句录音后用软件分析每句话的时长,去掉最长和最短的时长,然后取平均值,再进行比较。

4、实验结果分析
通过实验我们至少可得出结论:(1)分词处理可以解决歧义、拗口等问题,使阅读过程更加 轻松;(2)分词处理并不影响阅读的速度,反而有助于提高阅读效率;(3)切分拉长了语句长度,特别是将虚词独立出来,也会降低阅读的效率,因此在书面语的分词连写中是否可以将虚词与粘连一起的词语连写?
但是,我们也应看到实验数据的可比性不高,因为每个人的文化背景不同,同时,有的人说话习惯干脆利落,有的习惯慢条斯理,还有心情因素等的影响,因此要想得出准确的数据,需要更多人的参与。但是,这并不能否认本次实验的结果。通过以上人的发音,我们可以得出大致的趋势,即分比不分要好。

7  海峡两岸字形的规范
高更生  山东师范大学教授

    这里的字形是一般讲的印刷体楷书的新旧字形,例如“争”可否有另外的写法等。不包括国家发布的简化字表、异体字表等引起的字形差异。中国大陆和台湾各自的字形规范的依据是什么,二者规范的共同点和差异是什么,应当按照什么原则消除这些差异,这是值得研究的问题。
        中国大陆和台湾都对字形进行了认真的整理。中国大陆1965年发布了《印刷通用汉字字形表》,1988年又在此基础上发布了《现代汉语通用字表》,这是字形规范的根本依据。台湾1982年发布了《常用国字标准字体表》和《次常用国字标准字体表》,对字形作了具体的规定。
        两岸字形的共同点是主要的。例如笔画省略的“丈、文”等,笔画连接的“卑、牙”等,笔画缩短的“丑、冉”等,笔画变形的“屯、直”等,其他的情况的“羽、教”等。
        两岸字形的差异也不少。例如“奂、黄”等台湾增加了笔画,“及、以”等台湾笔画不连接,“角、帚”等台湾笔画缩短或延伸,“耒、吴”等笔形发生变化;台湾还规定一些两可的情况,例如“俞、叙”等又有不同的写法。
        字形整理的原则应当是尽量向手写楷体靠拢、简捷化和适当注意字理。大陆字形区分宋体和楷体,造成了不应有的混乱;台湾只整理楷体的字形,宋体的写法没有明确的规定,二者也不一致。从简捷化和注意字理的角度来考虑,大陆和台湾的字形也都需要加以改进。
(邮编:250014 地址:济南  山东师范大学教工宿舍2-8-807 电话:0531-6188611 E-mail:gaosude@jn-public.sd.cninfo.net)


8  漢語書寫系統優化的理論與方向
郭致平 台湾《汉字优化学会筹委会》
前言.
一.  語言文字的本質和演化
二.  書寫符號的角色
壹.  書寫系統優化的理論基礎
  一.  語言文字進化的本質
    1-1  文字的進化趨勢
    1-2  漢字未竟的進化
  二.  語言文字優化的本質
    2-1  語文優化第一定律
    2-2  文字的優化趨勢
    2-3  漢字的超詞性
    2-4  漢字的第三次演化
貳.  漢語書寫系統的優化方案
  一.  記形字
  二.  拼音字
  三.  形聲字
  四.  漢字輸入與信息處理
    4-1  漢字輸入方式
    4-2  信息處理方法
參.  科學術語對書寫系統的要求
  一.  科學術語的四種模式
    1-1  連續模式
    1-2  對立模式
    1-3  綜合模式
    1-4  分析模式
  二.  書寫系統的表格化趨勢
肆.  專有名詞對系統優化的推動
  一.  系統優化的基本策略
  二.  系統優化的五個步驟
伍.  檢討與展望
  一.  12個重大優點
  二.  結語

9  从信息语言学、认知语言学和模糊语言学看中文的分词连写问题
李逊永 新疆教育学院语言系 教授

1,从信息语言学看中文分词连写的迫切性
1.0 国际互联网的建立和发展要求建立中外文信息交换平台
1.1 中外文信息交换平台迫切要求中文分词连写
1.2 从《YJX-86型语言学文献微机检索系统》的研制和试用过程中看到的中文的分词连写的必要性
1,3 分词连写有助于推动汉语的智能化拼音文字的开发、研制、建立和试用,逐步实现我国一语双文的理想
1.4 分词连写有助于推广普通话并推动汉语书面语的进一步的规范化
2,从认知语言学、模糊语言学看中文分词连写问题
2.0 分词连写问题处在语言层面和文字层面的交接界面上
2.1 分词连写是在语言层面上对汉语词的界限的直觉的显化描写
2.2 人们对汉语中语言单位的语言直觉的认知的精确性和模糊性
2.3 解决分词连写问题要从两个层面上着手
2.4 字本位说在理论上的不可能性
2.5 解决中文分词连写问题的瓶颈-汉语中语素、词、词组的界限相对比较模糊和语素相对比较自由
2.6 结构主义语言学在解决此问题时的局限性
2.7 认知语言学中“典型”(prototype)和“类别”(category)的概念以及从这一角度看中文分词连写问题
2.8 从模糊语言学看语言单位的层次间的模糊度
2.9 解决问题的途径和原则-分词连写的刚性和柔性相结合:传统的规定性原则和结构描写性原则相结合
3.结论

10  试论专有名词的表示法
林仲湘 林华  广西大学

一、        专有名词在书写系统中宜有专门的表示法
专有名词有别于一般名词,宜有专门的标志,避免产生混淆或歧义。
拉丁文字采用分词连写,词与词的界限很清楚。为了把专有名词跟一般名词区别开来,对专有名词作了特殊处理,如改用大写字母、改用斜体字体等。
而汉字没有采取分词连写的方式,词与词的界限不清楚。如果对专有名词再不加标志,不仅难以辨识专有名词,还会造成歧义。(例子暂略)
二、        现代汉语标点符号中曾有专名号,但是改为横行文稿后被闲置,应于考虑恢复使用
1907年王照主办的《拼音官话报》就对地名、人名加了专门的符号。1920年北洋政府根据“国语统一筹备会”议决公布的《新式标点符号》和1933年国民政府拟订的《公文标点举例及行文款式》中都列有专名号。
1951年和1990年先后公布的《标点符号用法》,也同样列有专名号。不过从直行文稿改为横行文稿之后,可能出于印刷的困难,专名号实际上被闲置了。只在直行文稿中才使用到。如今多用电脑排版,在电脑中文排版系统中,在专有名词下面加横线并不困难。
三、        为了更准确地表示和区分专有名词,专名号还有待改进
其实,专有名词包含好几种:人名、地名、商标名、招牌名、书名、篇名,等等。为了准确地加以区分,宜分门别类用不同的符号来表示。
例如,书名和篇名已经有书名号表示。人名可以下加双横线,地名可以下加单横线,商标名和招牌名用什么符号表示待考。

11  汉字文本 便读格式 初探
陆丙甫  南昌大学中文系

一  汉字d 视觉优势
        由于有了电脑输入,文字是否容易写d 重要性降低了。例如2002年德国出版d  Relation of Writing to Spoken Language 《书写和口语d 关系》 一书指出,当代文字研究者在容易学习、书写和容易阅读之间,越来越看重后者。毕竟,一个人一生中,学习和书写文字d 时间远远少于阅读。而阅读至今仍然是人们获取知识d 最重要形式。
        汉字是一种难学、难写d 文字,但一旦学会,读起来并不难,他具有因为形体丰富而视觉信息丰富d 特点。在今天d 技术条件下,从前d 缺点不那么重要了,而其视觉上d 优点相对而言比较突出了。我们要力量利用这份资源。
        如果在原来汉字形体丰富d 特点上,再作一些改进,我相信汉字能成为最便于阅读d 文字。本文提出汉字文本一些可以改进d 地方。

二  文字形式d 视觉效应
        为了说明文字形式对阅读效率d 影响,可以先看一个例子。比较一下同一个数目d 不同写法:

1:        322123456789
2:        三千二百二十一亿二千三百四十五万六千七百八十九
2:        322,1 23,456,789

4:        三千二百二十一(亿)二千三百四十五(万)六千七百八十九
5:        三千二百二十一亿,二千三百四十五万,六千七百八十九
6:        三千二百二十一亿  二千三百四十五万  六千七百八十九

7:        3221亿 2345万 6789
8:        3221,2345,6789
9:        3221 2345 6789

        (1)显然比(2)看起来舒服,尤其是放在汉字上下文中,因为作为数目d 特征比较鲜明;其次因为本身形式简短。但是(1)读起来并不方便,因为超出了人类瞬时注意力d 广度(所以人们记忆电话号码要分段,目的是使每一小段都在人的短时记忆和瞬时注意力d 限度之内)。现在通行d 写法是(3),虽然每一段内部看起来比较一目了然,但是仍然不便一气读出,因为违背了汉语数目结构d 内在结构,脑子里需要转换一下。(4-6)反映了更多d 结构信息,但每一分段形式仍然太长。(7-9)既保证每一小段一目了然,又正确反映了汉语数目d 内在结构划分,是最好d 形式,可惜为了跟国际表面接轨,我们没有采用。(若要实质接轨,最好d 方法是将“万”进制改为“千”进制,跟新加坡华语一样)。
        这个比较启示我们,阅读效率受至少下面三个因素d 影响:形体特征,长度,正确d 结构划分。

三  汉字文本 需要改进d 地方
        根据上面d 例子分析,也根据一些其他d 研究,我们建议。
1.为了增加汉字文本中d 形体区别性,虚词和外来语专有名词用拼音写,利用字母在汉字文本中特征突出d 边际效应。
2.可以采用空格作为一个标点,表示句内较大d 停顿,增加句子d 内部结构信息,或区分歧义等。

四 空格作为意群切分d 符号
        在汉字文本中,词切分(分词连写、词式书写)并不重要(对外汉语教学除外),因为汉字d 语义信息极为丰富,可以弥补词切分这一语法信息d 不足。如按词切分,双音节占绝大多数,每个连写单位内d 单位也太少。因为没有充分利用 瞬时注意力d 广度,会使文本显得太松散,除非空格极小,在似有似无之间(可以设立大、小两种空格)。
        但是可以用空格作为“意群”切分d 符号。在国外流行“速读训练”,主要内容就是训练读者能很快掌握意群d 分割(例如古人训练“句逗”去对付没有标点d 文言文)。如果汉字文本能标示出意群界限,可以使一般读者 不经速读训练 也能读得比较快。由于一个汉字代表一个音节,形式上比较短,因此可以做到 每个意群不超过 七个左右d 汉字,在一目了然d 范围之内。这是汉字d 一个优势。

五 利用当代d 技术资源
        上述改进,不比超文本中d 某些表达手段,没有多媒体也一样可以实现,因此可以说是一个迟到d 改革。但是多媒体技术d 普及,的确使这些改进 变得容易了,这一点在网络语言中 表现d 比较明显。网络语言d 文本形式很灵活自由,充满创造性。我们主张在传统d 正式媒体上,如报刊、书籍上,应该有较大d 规范化,但是群众d 私人语言生活,在某些小范围内,如语言学论文中等,应该有较大d 自由度,以提供发展d 动力h 资源。(lubingfu@yahoo.com)

              
12  “二简”研究
陆锡兴  南昌大学人文学院中文系教授

“二简”发表已经二十多年了,自废止以来,社会不再关心,也始终没有进入学术界的视野。这么一个波及整个大陆的改变汉字的措施,留下的深远影响不会随着废止而消失,无论作为文字应用、文字学理论、文字史,都是一个重要问题。
“二简(草案)”共收简化字853个,其中一表248个,二表605个,另有简化偏旁61个,共精简了263个字。1980年文改会改组,下设“二简方案”修订委员会,1981年8月制订出《第二次汉字简化方案修订草案》制定111字。1986年国务院发出通知,《第二次汉字简化方案(草案)》即日起停止使用。此后,“二简”就推出社会,销声匿迹了。
“二简”废止的原因是多方面的,既有形势变化带来的不利因素,也有它本身措施不当的原因。它运用各种办法简化汉字形体,甚至对“一简”的简化字再进行简化,实质上汉字形体不可能无限制地简化下去。它除了采用同音兼并、改造形声字、省去部件笔画、草体楷化等种种办法,使多数字集中在五笔到十笔,造成很多字形相近,辨认费劲,影响使用功能。“二简”倾向使汉字表音化,要去除、削弱标义功能,但是又创造新会意字,引起使用者思想混乱。群众自发简化字,属于俗字范围。俗字在汉字中一直存在,它是通行字的组成部分,可以作为规范字(正字)的补充,但是不能去取代规范字,所以这样的简化字就有先天的不足,许多字的处理往往不能类推,有许多禁忌,使汉字仅有的一些理性成分遭到破坏。在总体上,“二简”注意到汉字的工具性,没有认识到它的社会性,作为民族文化的标志、文化的的传承的重要性。“二简”的废止,没有进一步扩大两岸的汉字的差异,避免了汉字新的分裂。其积极意义是多方面的,学术界开始打破禁区,对汉字的发展规律作了新的研究,对文字的性质类型有了新的认识,迎来了文字学的复兴和回归,开拓了当代的应用性研究、本体理论研究、历史研究等文字研究的新领域。


13  汉字 文本 词式 书写 改革 的 心理 障碍 分析
彭泽润  湖南 师范 大学 文学院 教授410081

1        拼音 文本 需要,汉字 文本 不  需要
2        浪费 纸张
     一般 来说 表音 文字 比 表意 文字 浪费 纸张,词式 书写 比 字式 书写 浪费 纸张。但是  词式 书写 的 表音 文字 成为 现代 语言 生活 的 主流。这 说明 这种 浪费 是 获得 收益 的 代价,是  一种 必要 的 投资,不是 浪费。   
   即使 我们 想 获得 词式 书写 效益 又 不 愿意 比 过去 多 付出 成本,也 可以 在 技术 上 做到。我们 的 《语言 理论》 全部 采用 词式 书写。表面 增加 了 页码,其实 是 因为 增加 了 “语言学 评论” 等 内容 导致 的。相同 内容 没有 增加 任何 篇幅,因为 我们 把 词 内部 的 字 和 字 的 距离 缩小 了,这样 节约 出来 的 空间 用来 支付 词 和  词 之间 需要 的 空间。因此 我们 的 成本 计算 过程 和 结果 是:1=1-1+1=1。北大 方正 专业 电子 出版 系统 用 [JP5] (紧排 5 级)可以 实现 这个 目标。WORD 编辑 系统 也 可以 做到。我 指导 的 中文 专业 国家 文科 基地班 的 学年 论文 都 这样 由 作者 用 WORD排版 发表。如果 排版 软件 将来 能够 设计 适应 词式 书写 需要 的 自动化 紧排 格式  就 更加 方便 了。  
3        延长 阅读 时间,妨碍 阅读 的 连贯性
词式 书写 的 本意 是 节约 阅读 时间,促进 阅读 的 连贯性。现在 不少 人 都 说,词式 书写 延长 阅读 时间,妨碍 阅读 的 连贯性。为什么 词式 书写 给 人 的 感觉 是 事与愿违 呢?这 是 旧 习惯 和 新 习惯 衔接 中 的 惯性 给 人 造成 的 错觉。
您 和 大家 一样 肯定 词式 书写 可以 消除 歧义 的 好处。消除 歧义 的 能力 强 了,应该 是 节约 时间 了。但是,不 习惯 词式 书写 的 人,开始 遇到 这种 词 的 空格,就 会 感到 奇怪 和  不 适应,就 会 在 空格 中 停留 相对 长 的  时间。时间 的  延长  又 会 破坏 快速 阅读 的  连贯性。
这 就 好像 习惯 了 平时 走路 没有 节奏 约束 的 人,突然 要 他 跟 着 音乐 节奏 走,反而 不会  走 了。我 在 黑暗 中 走 楼梯  最 快,因为 距离 相等,绝对 放心,跟 走  平 路  一样。可是  有人 在 黑暗 中 走 楼梯 非常 艰难,因为 他  不  习惯,不  放心。  
我 现在 只有 使用 汉字,无论 写 文章,还是 写信,还是 上课 写 板书,无论 使用  汉字 还是 使用 拼音 写 汉语,都 坚持 词式  书写。我 感到 无论 是  书写 还是 阅读,都 很 方便,不  影响 原来 的 速度。例如,我  现在 就 像  写 英语  一样,遇到 一个 词 结束 了,不 需要 动 脑筋,顺手 敲 一个 空格键 就 实现 了。阅读 更加 感到 方便。尤其 是  找 关键  词语,很  快。
这 就是 新 旧 习惯 的 矛盾 和 对立 统一。没有 谁 会 说 英语 单词 之间 的 空格 会 影响 阅读 的  连贯性,会  延长 阅读 时间,因为 阅读 英语 没有  旧 习惯 的 经历,也 没有 旧 习惯 的 暂时 优势 的 对比。任何 改革 和 创新 都 会 面临 旧 习惯 的  暂时 优势 的 诱惑。刚刚 开始 打破 大锅饭 经济 体制 的  时候,许多 人  不是 很 不  适应,很 痛苦 吗?
4        不  讨论 汉语 拼音 正词法
有人 主张,讨论 汉字 词式 书写 的  时候,不 讨论 “汉语 拼音化”。
这 是 务实 和 重视 现实 的 需要,也是 避免 汉语 拼音 文字 反对派 阻力,减少 不  必要 的  麻烦 的 需要。但是 不  讨论 汉语 拼音 正词法,就是 说  可以 讨论 汉字 书写 的  汉语 文本 的 词式 书写,不 允许 讨论 拼音 书写 的  汉语 文本 的 词式 书写。这样 把 实质 一样 的 事物 的 两个 方面 分开 能够 做到 吗?有 必要 吗?
无论 拼音 文本 还是  汉字 文本 的 词式 书写,都 是 根据 汉语 的 词 进行,因此 它们 的 正词法 规则 应该 是 一致 的。这 就 好像 无论 你 用 什么 材料 或者 式样 做 衣服,都 要 适合 你  的 身体 尺寸,这个 尺寸 应该 一样,没有 必要 分别 丈量 尺寸。我们 应该 在  拼音 正词法 的 基础 上,完善 汉语 书写 中  的 正词法,同时 从 拼音 文本 扩大 应用 到  汉语 文本,虽然 中国 小学 语文 教材  在  拼音 汉语  文本 中 到  现在  也  拒绝 采用  作为 国家 标准  的  《汉语 拼音 正词法 基本 规则》。
5  汉语 的 “词” 是 模糊 的
有人 赞成 改进 汉字 书写 方式,但是 提倡  搞 一 套 什么 语言 也 没有 使用 过 的 “间隔 书写” 方式。
他们 认为 既然 汉语 书面语 使用 习惯 中 还 没有 形成 系统 的  词 意识,词 的 分辨 有 不少  困惑,那么 我们  不如 不管  是不是 词,只要 一个 单位 经常 在 一起 使用 就  当做 一个  “词” 来 书写,甚至 有人 把 一个 句子 的  “主语” 和 “谓语” 当作 书写 中  的  两个 “词”。
这种 按照 音节 节奏 段落 确定 词式 书写 中 的 “词” 的 做法 在  我们 的 电脑 汉字 编码 中 非常 通用。汉字 编码 的  目标 是 为了 输出 字式  书写 的 汉字 文本,当然 可以 那样 做。但是,如果 要  输出 词式 书写 的 汉字 文本,那 就是 帮倒忙 了。
以上 针对 程度 不同 地 反对 汉字 文本 词式 书写 的 观点 进行 的 心理 障碍 分析, 是  事实 呢 还是  我  的  偏见 呢?我 想 提出 自己 这些 想法,请  大家 来 思考 和  实验。因为 其实 这些 反对 的 人 一般 是 拥护 汉语 拼音 正词法 的,所以 我们 更加 需要 他们 的 理解 和支持。我们 争取 他们,因为 我们 的 目标 是 一直 的,都是 在 汉语 书写 从 “字式 书写” 向 “词式 书写” 的 道路 上 促进 中国 语文 现代化。(zerun@public.cs.hn.cn)


14  汉 语 分 词 连 写 的 性 质
孟 华 中国海洋大学文学院  青岛 266071

世界上的主要语言不分词连写的恐怕只有汉语。这是一个值得深思的独特文化现象。关于它的性质、以及维系它或改造它的意义,学术界的研究还是远远不够的。而在全球日益数字化的今天,对这些问题的回答又是如此的紧迫。
本文主要讨论有关分词连写的性质的几个问题。
一 它是一个语文建设问题而非纯语言理论探索
“分词连写”是相对于汉语“不分词连写”而言的一种语言行为改革的设计方案。这是一个社会语言学命题,一个语文建设的规划,一个巨大的社会文化工程。学术界有关汉语分词连写的一切讨论,只不过是这个文化工程施工前的专家可性行论证和蓝图设计。
中国汉语界目前的策略是,悬置或回避分词连写问题,甚至干脆取消关于这个工程上马的讨论,而集中精力探讨一套分析性的语法理论方案,如制定一套指导如何给汉语切词的分析技术理论,给不分词连写的汉语穿上一身西方语言形态的理论外套。将一个语文建设问题转化为一个纯语言理论问题。
这是一种“中体西用”式的实用主义策略。所谓“中体”即保持汉语不分词的现状,“西用”即用西方形式化的语言理论和研究方法来克服汉语结构形态上的不确定性。这种研究思路使得汉语走向两极分化:一方面保持了汉语不分词连写的结构形态,另一方面又在理论层面上不停地为它另创制一些切词的分析方案。例如一般认为汉语语法研究大致经历了句子成分分析、层次分析、变换分析、语义特征分析等几个阶段。这些研究的最终目的之一,就是为不分词连写的汉语找到一套形式化的替代性切词方案。这是一种二次代码转换:不分词连写的汉语是第一级代码,将这第一级代码再转化为可切分性的汉语语法分析规则是第二级代码转换。
中国汉语界回避了汉语的语文建设问题而走向了一条纯理论研究、一条二级代码转换路子。

二  它不单纯是一个汉字书写问题
汉语不分词连写,与汉语的结构性质有关。
徐通锵认为西方语言最小的语音感知单位是音素,而最小的编码单位是词;汉语则不同,它的最小语音感知单位和编码单位都是音节,书写形式是一个字(32)。这样汉语的编码单位就实现了“形音义”三位一体。英语的音节不是一个独立的编码单位,但汉语的音节一般都具有意义,李葆嘉叫它附义性。所以,汉语的基础单位是“1”即一个音节、一个意义,在书写上是“一个形体、一个音节、一个意义”。汉语基础单位“1”的性质,使它总是倾向于一种意指关系,总是关联某个意义。汉语基础单位不侧重于结构性差别,它更是一个功能性意指单位。“蚂蚁”的“蚁”是一个形式差别单位(纯音节),自身没有附义性,但在“蚁王”中“蚁”变成了附义性的意指单位。汉语不携带意义的音节数量极少,且经常被语素化。
汉语基础单位“1”或单体的性质减轻了它对线性结构关系的依赖,它的功能主要靠形音义意指链条来实现,而不是横结构轴上词与词之间的差异。这样导致了汉语结构单位的简化和区别性降低,在书写上表现为不分词连写。但在“字”这一级上却有区别性特征。所以,在徐通锵的“字本位”语法理论那里,不存在汉语分词连写的困惑。
当然,不分词连写更与汉字的性质有关。汉语的词双音节化为主以后,使得古代汉语的字词一致性发生了分裂:字的单体性与词的复体性的不一致是汉语书写单位与口语单位的基本结构矛盾。这个结构矛盾又要求汉语的书写形式突破“1”的结构框架。
另外,汉语一旦实行分词连写,实际上是改变了目前汉语结构“1”的格局,它可能会从根本上改变汉语基础单位的性质。根据符号学的观点,一个系统基础单位的性质决定了整个系统的性质。因此,实行分词连写后,汉语的基础单位可能由“字”这一级向“词”这一级组织靠拢,这将极大地影响汉语语法组织结构原则。所以,分词的改革是伤筋动骨的语言文化运动,是五四精神的继续。
我们应该站在汉字和汉语的互动的关系(言文关系)中来考虑汉语的分词连写问题,宁可将问题复杂化、困难化。

三  它不仅仅是一种信息处理方案或技术
分词连写,它更重要的是一种民族思维的数字化工程,它要从词这一级语言思维层面上将中国人的整体性思维改造为分析性思维。
根据符号能指和所指在结构形态上的同构性程度,我们可以概括为两种基本类型:有标记方式和无标记方式。“标记”本来是语言学的一个术语,意为两个对立项中的一个带有区别性特征,这种区别性特征可以把它与另一成分区别开来,该成分即为“有标记成分”。从符号学的观点看,所谓有标记,就是强调符号能指和所指的一一对应,强调所指的差异一定要在能指上表现出来——能指的区别特征与所指的区别性是同构的。如国际音标符号的制定原则是“一个音素一个符号,一个符号一个音素”,即强调记音符号的有标记性。反之能指与所指之间不具有这种同构性,就是“无标记成分”。例如汉语词缺少形态变化,词性(所指)变了,而词形(能指)仍保持原貌。“文件锁在抽屉里”中的“锁”是动词,它与 “门上的锁坏了”的名词的“锁”在词形上并无区别。英语词“锁”(lock)也有名词和动词两种词性。但当它分别用作名词(to open the lock开锁)和动词(the document is locked in the drawer 文件锁在抽屉里)时,其词形(能指)也相应发生变化。由此可见,汉语词“锁”的能指和所指之间不一一对应,是无标记单位;英语词“ lock”则是一个形式(能指)只标记一种功能(所指),因此是有标记单位。有标记单位通过符号的外部形式(能指)的差异来确定符号所指的意义,这种能指和所指间的同构性使得符号的信息确定性程度较高。无标记单位缺少外部形式的规定性,需要依靠语境的解释和接受者的主观判断才能确定符号所指的意义,因此其信息确定性程度较低。一般而言,汉语是一种缺少形态变化的语言,因而是无标记性强的语言,与之相比,英语则是有标记的语言。
分词和不分词连写,就是书写形式上的有标记和无标记的二元对立。
汉语句子“我是一个工人”在书面上词与词之间不加区分,不像英语“I am a worker ”那样,词与词之间是分开写的。汉语的这种无标记性,非常不利于计算机信息处理,当然这仅仅是从信息传播的角度说的;如果从表达的角度,这种无标记性赋予语言一种灵活的、不拘形式约束的简便性。
互联网本质上是数字化的。“数字化”的基本含义就是信息的确定性和有标记性。
世界上大多数的语言都是分词连写的,从这个角度说这些语言的数字化程度都高于汉语。这样,数字化的语言和数字化的互联网之间,就具有一种编码规则的同构性,不同民族的数字化语言略加调整,就可适应互联网上通行的基本编码规则。也就是说,这些分词连写的语言在进入互联网时省略了再分词这一道编码程序,直接可进入互联网。这就是一级代码信息处理方式:由于数字化语言和数字化互联网的同构性,使得这种语言在信息处理时不必进行二次分词的信息编码便可直接进入互联网。
    而汉语可能是世界上最不数字化的语言之一,它要进入互联网时代,最大的瓶颈是要进行二次代码转换。所谓的二次代码转换,指非数字化的符号在进入数字化符号系统时,必须按照数字化有标记、唯一性编码原则进行重新编码才获得准入。就像进入WTO世界贸易体系一样,你必须遵守国际通行的市场经济规则才行。例如文字,世界上重要的文字可能只有汉字是表意文字,其余则是表音文字。表音文字用有限的字母记录有限的语音系统,体现了一一对应的有标记、唯一性的编码精神;表意文字记录的是意义单位,文字的数量大,语言意义单位的数量更几乎是无限的,这样文字和语言之间就有极大的不对应性,同时,汉字这种无标记、可能性的编码规则与其他数字化的表音文字又有一种不同构性。因此汉字要进入数字化的计算机信息世界,就必须进行二次代码转换,于是出现了像“五笔字型”“自然码”“智能ABC”“微软拼音”“全拼”“郑码”等等无数的汉字二次编码方案,它们是适应数字化规则的要求而编制的,这些方案的编制在中国成为一种产业,人称“万码奔腾”。人们不是在用一种代码创造信息,而是在用一种代码替代另一种代码,这样的工作甚至成为产业,这种现象在表音文字国家恐怕不多见。
    不分词连写的汉语也是如此。汉语要进入计算机信息世界,必须要分词连写,否则有关的操作根本无法进行。于是就要投入大量的人力、时间和资金去搞分词的数字化规则设计和研究。比如现在搞中文自动分词的软件很多,这种“智能”分词软件,说到底,就是二次代码转换规则系统的设计。不仅在信息产业界,在汉语研究领域,二次代码的转换问题也成为重中之重。其最终目的就是为非数字化的汉语找到一套数字化的二次代码转换规则,以求取得互联网时代的准入证。
    我们现在不能搞汉字拼音化,因为它涉及到中华文明的存亡。但汉语的分词连写却是古老的中华文明进入数字化时代非常重要的接口,它将进一步使汉语数字化以与时代发展同步。尽管数字化有种种弊端,但数字化的历史进程却是不可抗拒的。就像今天的人们都不用毛笔而改用硬笔一样。当然,以汉语、汉字、周易为代表的非数字文化相对于数字化文化而言,是一种宝贵的稀缺资源,因此说“越是民族的越是世界的”。如果说高度数字化文化的稀缺资源是非数字化的思维的话,那么高度非数字化的文化最稀缺的资源就是数字化。从这个意义上讲,汉语实行分词连写,将极大地提高汉民族集体智能的数字化程度,从而大大加快中国的现代化历史进程。同时,语言的数字化,可能引入一种异质的思维方式,但不是取代我们的思想,不是取代我们的语言,要取代也是不可能的,而是使我们的文化朝多元化方向更有活力地发展。
(青岛香港东路23号,中国海洋大学文学院。邮编266071Email:menghua54@sina.com  Tel:0532-5901765)


15  电脑中文的发展方向
戚桐欣 台湾《中文》总主编

     盘古氏「一画开天」是「一爻两卦」,用于洪荒时代,伏羲氏「三爻八卦」,用于农牧时代,周文王「六爻64卦」,用于封建时代,这些简单的卦爻符号都是当时的中文,后来,人类发明了结绳、契刻,中文的样式就多了,秦,始皇帝把古代的中文统一为篆,篆书、隶书、楷书、行书、草书……都是中文。
中文从上往下写,英文从左往右写,阿拉伯文从右往左写,都是「草书」的型式。宋,发明了印刷术,字模不使用「便于写,不便于看」的草书,采用「便于看,不便于写」的楷书,刻成字模,这种字叫「宋体」,从此,中文变成「方块文字」。
日本人发明中文打字机,掌握了中文铅字字模的市场,并订定「当用汉字」,大陆不服,订「简化汉字」,台湾不服,订「标准字体」,统一的中文就被撕裂了。
日本人先用英文电脑处理中文,给6704个中文订JIS,大陆仿效日本,给6763个中文订GB,台湾给13053个中文订Big5,美国人发现英文电脑可以处理中文,中文市场的潜力很大,就另订Unicode,收编JIS╱GB╱Big5,包容阿拉伯文、希伯来文……,随着Windows流行,全世界都在使用Unicode,所以,中文已经不是中国人的中文,中文是美国人的中文,这种颓势一定要挽回来。


16  网络生存方式与汉字书写
盛玉麒  山东大学中文信息研究所
  
一、 工具与载体对汉字发展演变的作用
1、 载体与信息革命:造纸、印刷术、磁记录、电磁、电光记录
2、 工具与信息革命:刀笔──毛笔──硬笔──机笔
3、 汉字形体的发展演变:字形字体的演变规律
二、 网络载体的汉字生成方式
1、 键盘输入技术
2、 印刷体汉字识别
3、 手写体汉字识别
4、 语音汉字识别
三、 汉字技术优化的相关因素
1、 “人本主义”和“技术至上”
2、 规范化、标准化与个性化
3、 动态系统调适过程
4、 人际系统与人机系统
四、 “手工作业”功能的分化
1、 教育领域习得阶段:学习、
2、 传统领域:民族文化心理的寄托
3、 个性化领域:签名、留言、便签
4、 书法艺术等特殊领域
5、 手写体汉字识别普及应用
五、 汉字书写水平与能力培养
1、 从小学抓起,但是要注意方法
2、 综合能力培养的组成部分(德智体美)
3、 学生和社会交际的基本功
4、 文化传承的标志性符号
(Tel 0531-8568577   Email:yqs@sdu.edu.cn)

17 现代白话文的演进
苏培成  中国语文现代化学会会长
  
    近一百多年来,汉语书面语有了重大的发展。这表现在两个方面:一是现代白话文取代了文言文,二是现代白话文逐渐走向成熟。在21世纪随着中国的和平崛起,现代白话文要再经历一次蜕变,就是由民族性的书面语扩展到国际性的书面语,由人际界面扩展到人机界面。
    现代白话文的发展一直受外国语文和翻译作品的影响,也一直受到文言文的影响。这种影响包括积极的和消极的两个方面。
    一、白话文运动的胜利
    19世纪末,随着民族民主革命的发展,一直受到排斥的、被认为是不登大雅之堂的白话文得到了发展的机遇。因为文言文无法与民众沟通,改良派为宣传维新变法、开发民智,必然要利用白话文。裘廷梁(1857-1943)认为“白话为维新之本”,提出“崇白话而废文言”。梁启超(1873-1929)向桐城派古文挑战,创制了平易畅达的“新文体”,用的虽还是文言,但是杂以俚语、韵语及外国语法,已经向白话文迈出了第一步。在这样的背景下,白话文书刊的发行量猛增,在民众中的影响迅速扩大。蔡元培后来回顾那个时期的白话文的发展说:“民元前十年左右,白话文也颇流行,那时候最著名的白话报,在杭州是林獬、陈敬第等所编,在芜湖是独秀与刘光汉等所编,在北京是杭辛斋、彭翼仲等所编,即余与王季同、汪允宗等所编的《俄事警闻》与《警钟》,每日有白话文与文言文论说各一篇,但那时候作白话文的缘故,是专为通俗易解,可以普及常识,并非取文言而代之。主张以白话代文言,而高揭文学革命的旗帜,这是从《新青年》时代开始的。”(蔡元培《中国新文学大系总序》)清末到民初是古代白话文发展为现代白话文的转型期,有三件事促进白话文的发展:一是科举制度的废除(1905),二是辛亥革命推翻了皇帝,三是《新青年》提倡科学和民主,打倒孔家店。白话文运动与五四新文学运动结合在一起,现代白话文首先在文学创作领域取代了文言文,随后又进入了中小学语文教学的课堂,影响逐步扩展到全社会。    可是在国统区的报纸从通讯到社论都用文言文。一直到新中国成立,文言文才基本废止,白话文才完全取得合法地位。
    “经过三十多年的斗争,白话文终于胜利了,取得了统治的地位。可是白话文原来只是用来写写小说什么的,一旦要它主持大局,照顾全面,免不了缺这少那,只好四面八方取经。无论是词汇,是语法,都得实行‘拿来主义’,从外国语拿,从文言拿。文言有二千多年的历史,词汇丰富,成语、典故多,白话文在这方面取精用宏,确实得益不少。”(吕叔湘《剪不断,理还乱》)为了促进现代白话文的健康,20世纪30年代在上海开展了大众语运动。什么是“大众语”?陈望道说:是“大众说得出,听得懂,写得顺手,看得明白”的文章。胡愈之说:是“代表大众意识得语言”。
    1949年新中国建立后,党和政府重视语文改革,公文语言和新闻语言改用现代白话文,废除了文言文。1950年公布《标点符号用法》,1951年发表《语法修辞讲话》,1955年推行报刊横排。1956年公布并推行《汉字简化方案》:这些措施的实行使现代白话文焕然一新。王力先生说:“如果拿桐城派的古文和现代的好文章相比较,我们会觉得汉语有了惊人的发展。即使拿五四时代的文章和现代的文章相比较,也会觉得无论在词汇上,语法上和整个语言结构的逻辑性上,也都大大地跨进了一步。”(《论汉族标准语》,《王力文集》第20卷65页)我们要坚持文体改革地成果,努力发展现代白话文。
    二、21世纪的现代白话文
    陈方正先生说:“二十世纪初出现的白话文成功得太快了,它并未有机会经历充分的磨练、发展,因此也还远未臻于成熟、完美。因此,在二十一世纪即将来临的今日,我们发现,要它充分承担起主要国际语言的功能,恐怕是有相当内在困难的。那也就是说,中国希望在下一世纪全面现代化,在各个领域都与先进国家并驾齐驱,那么在最基本的文化层面承担这发展重任的白话文也必须经历再一次蜕变:即是从民族语言到国际语言的蜕变。”这个意见值得重视。为了实现现代白话文的新发展,需要解决如下一些问题:
    1.坚持发展现代白话文,反对文言复古思潮。世界上事情的发展都是曲折的,语文思潮是有起有伏,近年来在语文领域刮起了一股文言复古风。有人说:“上个世纪如蔡元培、胡适先后猛砍文言课程,以及众多文坛元老提倡白话文与新文化运动,固然开风气之先,功不可没。但同时从根本上铲除了中国经典文字,导致今天国人语言粗俗、素质低下。”(《中华读书报》2000-08-16)1999年6月5日在长江源矗立起环保纪念碑,碑文用的是文言:“摩天滴露,润土发祥。姜古迪如冰川,乃陆仟叁佰公里之源,海拔伍仟四佰米,壮乎高哉!”高考作文,有个学生用浅近文言写了篇《白马之死》,得了一百分。我们要坚持发展现代白话文。王力先生说:“白话文运动,实际上就是语言现代化运动。”吕叔湘先生在一所学校得纪念册上题过两句话:“做人要做现代人,作文要作现代文”。
    2.正确对待现代白话文里的外来成分。现代白话文里有三种非汉字符号,就是阿拉伯数字、标点符号和拉丁字母。如何看待这种变化,人们有不同的看法。有人认为它们的出现适应了白话文发展的潮流,丰富了现代白话文的表达手段。有人认为它们破坏了汉语书面语的纯洁:“讲究译文,还应该呼吁保护我们的汉语,汉语的污染现在太厉害。一个民族的标志是语言,语言里面主要是文字。我讲上海话,你讲北京话,他讲山东话,但是共同有一份汉字的认同感。汉字是中华民族的唯一标志。所以汉字应该纯粹化,像WTO等等其实都应该翻译过来。这不是排外,而是保持汉字的纯洁。英文中夹着汉字吗?汉字中为什么要夹着OK、KTV、WTO、IT?而且大有蔓延之势。中央电视台是否可以将CCTV改为中央电视台?我看可以带个头嘛。”(《中华读书报》2001-08-22)我们认为,完全排斥这三种成分是不对的,也是做不到的,但是又不能盲目放任。为了身体的健康要吸收营养成分,不过要适度;适度不是不吸收,而是为了更好的吸收。
    3.现代白话文要走向世界、走进网络,就必须提高规范化程度。而当前不规范问题比较突出。例如有的滥用文言:“12日晚6时许,一老妪痛哭流涕地从南京港4号码头货栈桥跳江。”“加上后来交一切事务于经理人公司、对事情的估计过于理想化,都导致了他自己和他的听众长达三年的等待。”“商家疑客为贼,顾客不恐于诽”。有歧义的表达方式:“会议,分别听取市规划局长夏丽卿和浦江两岸开发办主任余力所作的关于黄浦江两岸规划情况及两岸开发工作情况的汇报。”“二是将军乐团门前信号灯西侧的中心护栏拆除6米。”       “辽宁‘吕宗大案’牵出徇私大案”。要按照《语言文字法》地要求,从实际出发推进语言文字规范化。
    4.要促进现代白话文的精密化。信息化时代要求语文表达精密化。现代白话文在这方面还要做出改进。例如:“34年前寄求职信,34年后通知面谈。”“《说文》无‘硬’字,硬的意义说‘坚’‘刚’。‘硬’产生在隋唐以后。”(是不是包括隋唐?)“土地的‘地’左边是土”。精密和修辞的夸张不矛盾,不是一个平面的要求。
    5.现代白话文的多样化。“语文现代化的首要工作是‘文体口语化’。文章不但要写出来眼睛看得懂,还要年出来用耳朵听得懂,否则不是现代得号文章。”(《新语文的建设》366页)“要求整齐和谐和是汉语书面语表达的一种自然趋势。”(《简明汉语史》495页)不同体裁的文章要有不同的要求:文艺作品要优美、高雅,应用性的文章要简明、精密,论说性的文章要符合逻辑。


18  汉语的自动理解与汉语文本的改革
王开扬  济南250014  山东师范大学 文学院

[内容摘要]目前的汉语文本以一个个汉字为书写单位,书面上“字”的单位与汉语的“词”的单位不一致,给人脑和电脑的理解都带来困难。困难主要集中在两种情形:某一个汉字左向、右向都能组合成“词”;相邻的两个汉字分开是两个“词”,组合是一个“词”。人脑通过来回扫视排除歧义切分的障碍,对于电脑却成了20年没能攻破的难题。中文信息处理要想突破这个“瓶颈”,可以从汉语文本的改革入手。汉语另外有三种可能的文本:第一种是“汉字词式书写”文本,第二种是“纯拼音词式书写”文本,第三种是“词式拼音+汉字”文本。第三种文本可以达到利的最大值和弊的最小值,最有可能成为走出汉语自动理解困境的最佳路径。
   
0.  导言   
0.1计算机与网络技术的巨大社会作用
0.2计算机和不同语言文字的结合
0.3汉语文本的四种形式
1.0 中文信息处理的层次性和焦点问题
1.1 初级层次:字处理
1.2 中级层次:词处理
1.3 高级层次:句处理、篇处理
1.4中文信息处理的焦点问题
2.0  汉字文本分词问题的由来
2.1 文言文字与词的天然匹配
2.2 复合造词带来的字词辨析
2.3 音译外来词带来的字词辨析
2.4 理解的基本单位是词
2.4.1 人脑的理解
2.4.2 电脑的理解
2.4.3汉字“词”和字母文字“词”书写形式的对比
2.5 汉字书面语的理解与书写形式的矛盾
2.6 汉字文本自动分词的研究状况
3.0 汉字词式书写文本的不可行
3.1 汉字词式书写文本的内涵
3.2汉字词式书写文本的缺陷
3.2.1汉字词式书写文本不美观,不连贯
3.2.2 汉字词式书写文本的“词”难以做到定型化
3.2.3汉字词式书写文本干扰写作思路
3.2.4汉字词式书写文本增加涂改
4.0汉语拼音文本的优越性和缺陷
4.1汉语拼音文本在词语切分上的优越性
4.1.1 词语单位定型化
4.1.2 能区分同形异音词、轻声和儿化
4.1.3能消除专有名词歧义
4.1.4能消除部分语法歧义
4.2汉语拼音文本的法理依据
4.3汉语拼音文本的缺陷
4.3.1方言的干扰
4.3.2聚合关系上的混淆
5.0“汉语拼音词式书写+汉字”文本  简称“拼音+汉字”文本。
5.1“汉语拼音词式书写+汉字”与“基础华文
5.2“汉语拼音词式书写+汉字”文本的优越性
5.2.1“汉语拼音词式书写+汉字”文本可以消除组合关系的歧义
5.2.2“汉语拼音词式书写+汉字”文本可以区分聚合关系的歧义
5.3“汉语拼音词式书写+汉字”文本与计算机的关系
5.4“汉语拼音词式书写+汉字”文本的缺陷
5.4.1方言的干扰
5.4.2不美观
5.5“汉语拼音词式书写+汉字”文本的可行性
5.5.1借鉴外文  
5.5.2借鉴历史
    6.0结语
6.1评价与选择
      6.2形势与任务
(T:0531-6186039(h)  E:①wky918@yahoo.com.cn ②wky918@163.com)


19 海外华文媒体书系统的分与合
吴琦幸  亚洲周刊驻美记者

海外华文媒体是中国语言和文化在海外推广的重要工具,同时也是吸收了所在国文化和传统之后的一种中西媒体综合体。中文的不同书写系统在海外华文媒体实践中得到了充分的应用,同时显示出独特的分合现象。

1,        海外华文媒体的书写系统成为政治的风向。2,简体横排在海外的首次出现,3,中国大陆背景的报纸担当了将简体横排作为平面媒体推向社会的一个尖兵。4,简体横排成为平面媒体的一个最简单的方法。5,新的横排方式正在成为趋势。6,海外华文媒体书写系统的现状。

美国的中文媒体诞生于1849年之后的淘金潮。来自中国南方的农民,在晚清腐败政治条件以及落后的经济条件之下,走出国门,搭乘海船,经过了两三个月的海上航行,来到美国谋生。这种集体行动的依赖是同乡会。到了异国他乡之后,同乡会的形式需要一种更加牢固的联系方式加强团体的共性。,在当时美国主流报纸的作为一种信息交流的方式的影响下,同乡会也就有了这种类似通讯的沟通方式。所采用的形式全部是繁体直排的方式,今天可以看到的最早的海外华文媒体是1938年的世界日报,共有两大张,完全是中国当时民国报纸的翻版。
1949年之后,来自中国大陆赴美的移民基本停止。美国基本华裔人口都是早期淘金潮之后留下的。新中国实行简体字以及拼音之后,怀有敌意的海峡两岸在文字的处理上有着截然不同的方式。在中国大陆一方,实行简体字和横排的方式。由于从繁体字过渡到简体字系统,许多文字载体实行双轨的简繁体共用的方式,对于繁体字并没有十分的反感,而只是要用大量的力量推广简体字。但是台湾自封为正统,将繁体字作为其正统的标志继承下来,视中国大陆的简体字为异端邪说,并且由于海峡两岸的隔离,信息难通,对于简体字感情上无法接受,当局便将简繁之争逐渐转化为政治问题,凡是用简体字书写就是同情共产党。这种政治上的敌意化为对于整个书写系统的僵硬化。根本无法想象在台湾的媒体中使用简体字或者横排的方式。
1970年代之后,台湾开放报禁,一批大报例如《中国时报》、《联合时报》、《自由时报》等开始进入美国办报。他们所用的书写系统方式一律是台湾报纸的延伸,也就是繁体直排,不越雷池半步。
1980年代,美国的左派华文报纸或者标榜中立的报纸《中报》《国际日报》在美国的东西两岸诞生,虽然他们的政治观点努力中立,甚至有的还倾向于中国大陆,例如《中报》,但是在书写系统方面还是使用传统的繁体直排的方式。因为美国华文媒体的受众仍旧是多年以来习惯这种系统的海外华人。来自中国大陆的的留学生和移民自80年代中叶开始明显增加,到了1989年之后,大批中国留学生在美国居留,华文媒体的受众结构开始发生变化。1990年,有本地侨胞所办的亲左派报纸《华侨日报》改为《侨报》,在美国华文媒体中首次使用横排的方式。这一形式的出现,有着划时代的标志,加上这家报纸具有中国大陆资金的背景,于是横排报纸成为亲中国大陆的象征。从技术上来说这些横排报纸是使用了中国北大方正的排版系统,而从客观上来说,直排的方式不符合一般受众阅读习惯,举凡世界各国的语言文字都应用了横排的方式。所有的美国华文报纸在直排方式中遇到一些不能克服的困难,例如美国的华文媒体常常有着双语同时出现的问题,最多的就是美国人的英文姓名和地名,直排方式的报纸就只能用直排的方式来排印英文字母,滑稽可笑。横排之后解决了英文姓名的夹排问题。横排的好处还符合人们的阅读习惯。在排版中遇到一些广告的问题,尤其是来自其他语种的广告,非常方便。此外,华文媒体还有一种黄页电话簿,也是无法想象用直排的方式可以达到广告效果。直排遇到了很多不能解决的问题,在横排中都一一迎刃而解。但是因为简体横排是一种政治的象征,除了亲中国媒体使用横排的方式之外,没有一家海外媒体在当时采用。。
1995年左右,《侨报》又开始了一个新的举措,那就是在海外正式挑战繁体字,在洛杉矶开印的美国西部版中,首次用简体字印刷。被当时的人们视为石破天惊之举,打破了海外中文媒体繁体字一统天下的局面。       
一开始有些小报跟进,例如《文汇周报》〉《美南时报》等等。接着新民晚报在洛杉矶设立记者站并且出版美国版,用横排的方式。一些有台湾背景的报纸也开始试用横排的方式,最后来自台湾的美国最大报业《世界日报》于1997年推出《世界周刊》用横排的方式,由于每周一次,并没有引起大反响。2002年开始试用全部用横排的方式,开创了这家台湾背景的报纸在海外的一个新的发展。一开始招致读者的一片骂声,所有的反对意见都是来自台湾的人士,他们的最大理由是看不惯这种横排的方式,还有的公开说这种报纸向共产党报纸看齐,不足取。但是横排带来的三大益处毕竟压过了直排的呼声。于是该报在使用三个月之后,就进入了全面的横排方式。这一举措受到了美国主流报纸的报道和赞扬,认为是中文报纸与主流社会报纸融合的重要一步。《世界日报》由此而并评为2003年度美国少数族裔报纸最佳奖。
不过到现在为止还没有一家台湾报纸挑战繁体字系统,在未来的市场中是否为成为一个新的战略转折,笔者认为是与台湾与大陆的关系所决定。如果台湾继续走向陈水扁的台独路线,要求该繁体为简体字的可能几乎没有,而如果两岸的统一成为现实的话,海外实行简体字排版的可能性大增,这也是简繁体字与政治密切相连的一例。
        现状:美国的少数族裔报纸有六百多种,语种几乎包括所有的目前现存的各国语种。其中华文媒体是位居第三大的少数族裔报纸。华文平面媒体中的报纸,以《世界日报》为最大影响,发行量超过三十万份,读者对象为来自各个地区的华人。《星岛日报》为次,全美发行量大约在十五万份左右,读者对象为来自香港的移民。《侨报》第三。是美国现在唯一使用简体字的大包,但是发行量较少,全美国约万份而已,读者对象为来自大陆的新移民。
纵观海外的华文媒体书面系统的改变,横排的方式将成为主流,原因有三:横排是世界书面系统的主流。符合人类的阅读习惯;2,所有的广告设计、版面设计以及电脑排版系统都是一横排的方式,与其他语种的磨合也需要横排来作为基础。3,新媒体的迅速崛起,电脑因特网在人们生活中的重要性,使人们无法摆脱电脑阅读习惯,而这也是促使平面媒体走向横排的原因。但是简体字的问题比较复杂,在目前的情况下,无法一步到位。

20  汉语分词连写的重要性
吴文超  香港高威软件有公司主席兼总裁

连写反映汉语的现实
汉语是成熟的多音节语言。 这个语言现实却被不连写的方块汉字掩盖了。由於可以发出的声音有限, 汉语习惯把两个音节连接成词。 语言学家指出, 连声调在内的单音词早就无法满足汉语表达意思的需要, 古代汉语已经有大量多音节词。 词的界定通常取决於语法、语音流和约定俗成等因素。要证明汉语为多音节语言的办法很简单: 把双音节汉语拆分为两个单音节, 如因此而失去原来的意义, 那么该双音汉语肯定是个双音节词。 例如, 由於"田七"拆分後所得单字"田"和"七" 尽失原意, 所以"田七"是双音节词。 就约定俗成而言, "高兴"是汉语词, 但"低兴"却不是, 尽管大家都可以猜出後者的意思。 同样,"快乐"是汉语词而"慢乐"却不是。 经验告诉我们, 一些多音节词的意思不容易望文生义地猜中, 例如: 天花、东西、月经和仙人掌。
汉语语法必须以词为单位
对"学生们高兴地唱歌跳舞"一句进行语法分析时有必要把汉字集合成为多音节词。 需要给"学生们" "高兴地" "唱歌" "跳舞" 等词进行诸如名词, 副词和动词等语法分类。 分词连写的汉语拼音反映出汉语的现实及其语法特征: xueshengmen gaoxingde changge tiaowu, 而加上调号的拼音能够更准确地记录汉语。
连写拼音便利普通话教学
一直以来,中国采用分词连写的汉语拼音来帮助教普通话。连写拼音能够更准确地记录汉语。变调和轻声是双音节汉语的特点而非汉字的特点。"东西"这两个汉字是没有轻声的, 例如
"东西矛盾"。 只有连写的"东西"双音节词才有轻声: dongxi。 变调也是如此, 不变调的老(的)虎 -- 老龄虎和变调的"老虎"意思不一样。 总之, 汉语语音流的连或分往往表达不同的意思。因此, 不分词的汉字会产生歧义, 情况有点像没有标点符号的中文。 例如: "环院长跑" 可以被理解为 "环 院 长跑" 或 "环 院长 跑"。 就普通话教学而言, 拼音分词连写具有关键的重要性。
语言心理学的启示
语言心理学家发现, 汉语使用者往往不对单音汉语进行解码。 他们要在听到第二音节后才判断词义。 例如: 听到"hu"后要待听到诸如die, shuo, tu, jiao, bo, luobo 等第二音节时才把词义确定为: 蝴蝶、胡说、糊涂、胡椒、湖泊、胡萝卜。 由於拼音只有几百个音节, 分写的拼音比汉字模糊得多。 既然大脑要等到第二音节才进行解码, 用连写拼音一次过拼写汉语词可以得到快而准的效果。
非词化汉字检索困难
电脑缺乏对汉字进行准确自动分词的功能。对大量不分词的汉字资料进行信息检索的难度很大, 而且经常找到不需要的词或词组。例如, 找寻关於"中国" 的资料时却找到大量 "发展中国家" 条目。 找寻"月台" 一词时却找到"十月台商…" 的信息。 由於汉字从来就不便利资料检索和处理(如排序等), 以至研究者不得不用西文。 这也是大量留学生出国留学的原因之一。从英文"research"一词没有贴切原意译词的事实可以体验出每一代中国人由於找不到前人的文献而被迫反复从事低水平的研究和创作, 以致难以钻研理论, 开发高新科技和孕育出灿烂的文化和艺术。 从这点看来, 有效的分词办法也应该对汉字适用(如朝鲜的谚文) 。 作家们为主动分词作出的劳动不但令中文更明确和便于阅读, 而且还便利其检索。

中文句子短与不分词的关系
从事英中翻译的人都知道,英文的长句往往需要切分为两句或更多的中文短句。 欧化中文长句因需要人们在反复阅读和语词重组后才勉强读懂, 因而减低阅读效率。 这是汉字不连写的缺陷之一。 人类大脑不适宜同时处理超过七个信息单元,不管这些单元是多音节还是单音节。 中国古代只有七言诗而没有八言诗, 古人似乎已掌握这个规律。 七个英语多音节词组成的句子比十几个汉字组成的对应句子容易读得多。 这种情况当然对中文不利, 在表达精确思想的时候尤其如此。 中文分词连写足以消除中英语文在这方面的差距。 下面取自1999年 <联合国秘书长关於联合国工作的报告> 第28 段的例子很能说明这一点。

原文:  Greater efforts are also being put into contingency planning and other preparedness measures for disaster-prone countries, while major improvements in risk-assessment and loss-estimation methodologies have been identified through the International Decade for Natural Disaster Reduction.

中译:  目前更致力於替容易发生灾害的国家拟订应急计划和其他备灾措施,同时通过“国际减少自然灾害十年” 确定在风险评估和损失估计方法上的重大改进。

中译分词连写: 目前 更 致力於 替 容易 发生 灾害 的 国家 拟订 应急 计划 和 其他 备灾措施, 同时 通过 “国际 减少 自然 灾害 十年” 确定 在 风险 评估 和 损失 估计 方法上 的重大 改进。

分词拼音:  muqian geng zhiliyu ti rongyi fasheng zaihai de guojia niding yingjijihua he qita bei zai cuoshi, tongshi tongguo guoji jianshao ziran zaihai shinian queding zai fengxian pinggu he sunshi guji fangfa shang de zhongda gaijin.

连写的文化基因
笔者刚从日本旅游回来。印象深刻的是, 日本语已经成功移植罗马字分词连写的文化基因。 地名和事物名称都以连写罗马字拼写。 "东京"拼写成"Tokyo"而非"To Kyo"; "横滨"为"Yokohama"而非"Yoko Hama"。 同样"樱花"写成"sakura"; "非常感谢"写成"domo arigato gozaimasu" 。 看来我们不但在进行汉语拼音辅助普通话教学时有必要建立分词连写习惯, 而且连中文本身也应该实现分词连写,并使之成为牢固的文化基因。
(Tel: 2730-7121  Fax: 2730-7127  Email: apollowu@gowell.com)


21 为什么中文分词书写难以成功
严永欣 上海邦瑞信息技术有限公司研究员
提要
100年来,中文主流书写方式经历了多项重大改革。引进西式标点符号,采用白话文,改竖写为横写,改繁体为简体。近年来,引进空格实行中文分词书写的方案受到了学界一些同仁的推崇。本文分析推广中文分词书写方案的难点,需要研究的问题,以及可能的切入点。

我的经历
笔者九十年代初就开始阅读“分词书写”的文章了。那时为了调试自己的自动分词程序,在电脑屏幕上读了大量机器产生的分词书写文章。10年后,读到了的彭泽润、李葆嘉主编的《语言理论》。初读时感到强烈的不适应,但两个小时下来,不适应似乎淡了不少,注意力也渐渐能够集中到内容上去了。不错,人是能够习惯中文分词书写的。三个月后,当我再一次阅读到的中文分词书写的文章时,我又感到了同样的不适应,又同样需要两个小时的适应时间。

发展临界
一个新事物要能够发展壮大,往往需要越过一个门槛。高于这个“发展临界”才新事物可以自己发展。我们来分析“中文分词书写”的发展临界。
两个小时的适应时间超过了大多数人一次性连续阅读的时间,也超过了阅读大多数文章的时间,因而足以使很多人放弃。对于他阅读的第一篇分词书写的文章而言,分词所带来的好处(相对于不分词而言)远不足以抵消增加的成本。
        作者、出版商为了使销量最大化,就不愿意出分词书写的出版物,从而导致此类出版物十分稀少。由于读物的稀少,读者的阅读量和阅读频率不能够达到“适应性积累”,他每一次阅读又得重新适应,每一次阅读都是高成本过程。恶性循环。
        由此可见,在阅读物主要是出版物的今天,要有适应性读者,需要有大量的分词读物;而要有分词读物,又要有大量适应性读者,鸡和蛋必须同时有。这样,“分词书写”的发展临界就不是个人临界,而是很高的社会整体临界。除非政府强力推动,否则难有成功的可能。50年代的文字改革之所以能够成功,是依靠了强有力的政府,更因为当时大部分民众是文盲。
        这就是我认为“中文分词书写难以成功”的主要理由。

文字的辨析长度
        为什么中文没有自发形成分词书写?或者等同的,为什么很多字母文字形成了分词书写?而有些字母文字没有?其实,为什么古中文不用标点而近代标点很快被接受了,以及为什么标点符号的正确使用对许多人来说总是个难题,都属于同一类问题。
        分词书写的主要理由,是消除歧义。陆丙甫在其“增加汉字书写系统的语法信息”一文中,就举了一些可以通过分词书写来消除歧义的例子。但在现实书面语境中,人们依据“上下文”,绝大多数情况下都可以解决这样的歧义。我们可以把这个“上下文”的长度称为文字的“辨析长度”,本文中,我们将不对其作精确定义,只停留在定性的概念上。
        如果将英语的空格去掉,需要分析的可能组合将会极大地增加。这是由于,第一,表达同样的意义的一句话,去掉空格的英文比起没有分词的中文有多好几倍的可能切分点,第二,英文单词的长度差异分布(从1个字母到10几个字母)要比中文单词的长度分布(1到4个字)宽得多。这就是英文必须要分词,而中文可以连写的主要原因。笔者观察,对于连写的中文,要将分词确定到95%置信度,平均来讲只要前瞻不到两个字。这个“前瞻距离”是辨析长度的重要组成部分。
        陆丙甫文中所举的例子,就是一些辨析长度超常的中文短语。对于这种情况,在采用“分词书写”前,人们采用加引号、选择不同字体、添加词语等局域性方法来减轻症状。

为什么分词需要适应?
        “现在 不少 人 都 说,词式 书写 延长 阅读 时间,妨碍 阅读 的 连贯性。”(彭 泽润 老师 专栏) 为什么这样?笔者认为这是因为中文的读者已经将空格派了大用场。它已经被用作标点的辨认特征。中文读者在阅读中,并不是在辨明了每一个标点具体是什么标点才接着读下去的,而是在自信实现了辨析就继续,而做到这一点,大多数情况下,感知到标点的存在和位置就够了。
        于是,当我们开始阅读中文分词句子时,这些新生的空格不断地触发我们头脑中的标点处理程序,而原来我们赖以分解语句的真正的标点却被淹没了。这当然就会“延长 阅读 时间,妨碍 阅读 的 连贯性”了。
        标点分析程序是我们头脑里长期形成的根深蒂固的分析程序。要改变它需要头脑里相当大的调整,这就是适应中文分词需要较长时间的一个重要原因。
一旦脱离了中文分词书写的语文环境,我们永远不停的无意识的优化过程又将重新恢复中文联写状态下空格与标点的简单关联。从这个意义上说,中文连写对于中文分词来说是直接相克的,在中文连写的大环境下,保持对分词书写的适应需要较高的使用频率。
        中文分词书写的另一个问题是 —— 别人已经提到 ——“浪费纸张”。当然我说的是它对阅读产生的效应。我认为,人们在阅读的时候,注意到的并不仅是阅读前沿的那一个字,而是有一个“关注椭圆”。普通阅读横排文字时,这个椭圆的高为一行字高,宽度有几个字宽,也就是说绝对宽度在一定范围内大致正比于字高。这个宽度要能够足够宽以能够对多个字同时分析,使得“一眼”达到足够的置信度;又要足够窄,避免太高的复杂性。每个人在长期的阅读中都形成了较为稳定的“关注椭圆”,并优化了信息分析算法。面对分词书写的中文,这个关注椭圆里的信息量和出现形式一下子变了,人脑里的分析程序就不适应。实际上,只要明显地改变文字的长宽比,就会降低阅读速度。
        从上面分析,我们可以得出,中文分词书写所带来的分词简化同时也带来了语句识别其他方面的复杂化。得失相抵是赚了还是赔了肯定不那么简单。在我们目前认识还是很肤浅的情况下,政府出面大力推动是不合适的。

空格作为标点
打开几年来写的笔记,居然发现自己也经常采取“中文分词书写”。当然,不是广泛使用,而是在需要避免歧义,突出某个部分,或要匹配并列句子中的各个成分等等情况下,使用分词。受此启发,笔者认为,中文分词书写的最佳切入点,不是“分词书写”,而是悄悄地将空格作为新的标点,在“大辨析长度歧义点”使用。这样,没有两个小时的适应期,“发展临界”接近零。得益者也会学着用。如果它确实利大于弊,则它能够被更多的人接受,用到更多的地方,直到得失平衡点。或许,这个平衡点就是中文整体的分词书写。
        如果真是整体分词书写,分词空隙应该尽量小,能够方便地辨认出不是“紧挨着”就够。标点所在空隙的宽度,应该明显的大于分词空隙的宽度。这样,对“关注椭圆”的破坏可以尽量的小,分词空隙产生的错误标点触发也尽量的小。英文为了在分词书写状态下显示标点,采用在标点处多加一个空格和句首字母大写双重保证。
       
22  字母词与汉字音译词
              杨锡彭 南京大学中文系10093

诸如“WTO、VCD”之类的字母词根本就是外语词。“克格勃”的英文字母书写形式KGB与俄文字母书写形式КГБ,性质是一样的。КГБ不可能被看作汉语词,既然如此,又有什么理由认为KGB是汉语词呢?英文字母词与汉字音译词本质上是不同的:一是外语词,一是汉语词(从来源上讲是外来词)。英文字母词虽然既出现在汉语书面交际中,也出现在口头交际中,但并不能因此说明这些字母词就是汉语成分。我们在说话和写作中可以使用非语言符号,使用外语成分就更不值得奇怪了。英文字母词在汉语交际中大量出现,实际上是语码的混用。
外来字母词是否能够成为汉语词,取决于两个条件:一是读音,二是书写。文字书写表面上看起来只是个文字问题,其实不然。文字书写直接跟语言有关,用汉字书写,读起来必然是汉语的语音结构。外来语言成分只有具备汉语的语音结构,才能确定其是汉语成分。AIDS是英文缩略语,“艾滋(病)”是汉语词。“沙斯”、“沙士”或“萨斯”都是汉语词,但SARS只是英文缩略语。任何一种语言中的音译借词,都用本民族语言的语音系统对外语词加以了语音改造。改造的结果,在口头上采用本民族语言的语音形式读,在书面上采用本民族文字书写。韩语Kimchi(韩国泡菜名)到了日语中变成了kimuchi。韩语中的Kimchi包含两个音节,即kim、chi ;日语中没有kim这样的音节结构,于是kim在日语中变成kimu,加了一个元音,一个音节的kim就变成了两个音节的kimu。Kimuchi在日语中是三个音节,用日文假名写,是三个假名,即キムチ。Kimchi如果在日语中出现,只是外语词;写作/读作kimuchi或キムチ,才是日语词。马来语bas sekolah是借自英语的外来词,bas来自英语的bus语音转写,sekolah来自英语的school的语音转写。读作/写作bas,是马来语;读作/写作bus,则是英语。读作/写作sekolah,是马来语;读作/写作school,则是英语。
基于汉人语言文字的认知图式(cognitive schema),除了少数字母词可以与汉字形式并行使用以外,我们倾向于采用汉字音译或意译的方式借用外语词。某些简单、常用却既不便音译也不便意译的字母词,其所指称的事物很常见,如CD、VCD之类,可以保留,听其自然。选择汉字音译固然有“谐音别解”、译音分歧、异形分歧等等问题,但权衡利弊,汉字音译总比字母形式更适合汉人的读写和理解。
应该看到,汉语交际中出现一些字母词并非就是坏事;这类字母词,包括汉语拼音首字母缩略语,有独特的作用。但倘若这类字母词用得过滥,不注意语域(Register),则只能添乱。
当代社会接受外来影响之急速,人们希望把外来新事物、新概念赶紧“拿来”为我所用,一向被认为最简便、最快捷的“音译”似乎也已跟不上速度,于是干脆把外文词“照搬”到汉语交际中来,这就使得字母词近年来在汉语交际中大量出现。对于字母词,仅仅出于看不顺眼而轻易否定,不符合科学精神;而放任自流,听凭滥用字母词,也不是一种负责的态度。这就需要深入分析字母词的性质、作用、长处和短处,提出相应对策,以促进语言交际效率的提高。本文正是基于这一考虑,通过字母词和汉字音译词的比较、分析,企望为跟字母词有关的汉语词汇系统和书写系统的语文政策的制订提供有益的参考。(ndxpyang@sohu.com)


23  汉字书写系统五论
余颂辉  龙小军  赵晓伟 南昌大学中文系

汉字作为国际通行的汉语书写系统,历经几千年的发展改良,已逐步形成一套较为稳定实用的书写系统。它在传播文化、提高人们交流准确度等方面都起到了不小的作用。然而,考察整个现行汉字书写系统,似仍有不尽如人意之处,本文拟就汉字书写系统的改进提出如下五点建议。

§1 恢复专名号
1.1  专名号过去也叫“私名号“,从新文化运动到上个世纪五十年代末都曾被广泛运用,但不知何故被取消了。
加专名号的好处是醒目,避免读者误会,如:
          福建省 话剧团 长乐 演出 归来。
不会被误会成:福建省 话剧 团长 乐演出 归来。

1.2 专名号何分词连写并不矛盾,它们之间是互相补充的。西方拼音文字既实行分词连写,同时又在遇上专名号时大写该单词首字母,其原因可想而知,是为了避免和拼写相同的单词(同形词)相混淆。如
          Rose  Bush      v      rose   bush
          罗斯。布什               玫瑰花丛

         lovely  Lily        v       lovely  lily   
         可爱的莉莉                可爱的百合花
汉字书写方面,这种情况也会存在:
我小时侯是在塔下念的书。 (塔下是江西上高县一地名)
他一口气能游到河北。    (到底是河的北岸,还是河北省)

                   §2 译名第一次出现时应加外文原文以示区别
2.        1 现行译名的不便

2.1.1 汉语翻译外国人名地名时往往以有实义的汉字为之,用于句中后,报刊杂志往往不注明是外名,引起误会。如:张伯伦、白求恩、方戴尔。人们以为是中国人。

2.        1.2外名存在许多异名同实现象。如:
   Jokeob Grimm  在《格林童话》中叫“格林“,在语言学书上叫格里姆(Grimm’s law)。语言学著作内部,
G.K.Zipf,既翻译成“齐夫”,又翻译为“齐普夫”(陈原)。
J.H.Greenberg,既译为“格林博格”,又译为“格林堡”。
N.Chomky,我们译成“乔姆斯基”,台湾人叫“杭士基”,更是差了十万八千里。
2.2 过去曾有过的努力

2.2.1 古代曾在译名字旁加“口“以士区别,如:
哪吒   喃(口无)  (口英)(口吉)(口利)
但正好解放前在少数民族名字旁加“犬”一样,不容易招来反感。
2.2.2 我们曾规定,国内出版物都以新华社参编部的译名为标准,参照采用,但其实很难执行下去:
一、        名手册从着手编辑到出版发行需要一个周期,但现在国际交往太过频繁,时间上拖不起,若等到商务印书馆 把署名“辛华”的编译手册出版完毕再在文中使用该专名,不现实。
一、        汉字使用范围太广,涉外及港、澳、台恐怕不会认同新华社的译名,这也不现实。
比较可行的方法是:中文译名首次出现时,加外文原文注明。(案,如果完全该用外文行文,阻力会很大,故建议不采用。)

§3专名的边界问题
我们在采用了分词连写,专名加专名号之后,依然会有一些难题不好解决,这是无法回避的。其中有一条是,文本中一个专名出现在两行 首尾处(或曰某一专名“折断”在两行),这时若不加一种特殊符号以示连接,肯定会使读者认为是两个专名(即使加了专名号也不能避免)如:
……………………诗人在宋真宗大中
祥符年间曾被贬南方。
此处的“大中祥符”实为宋真宗的一个年号(1008-1017),但读者若不明历史,必定会以为这是两个年号。西方拼音文字是在“折断”处加一短横“一”以示区别,但问题是这个短横如果打长了,会和“一”字相混淆,打短了又会和陆丙甫先生主张的分词连写符号相混。我们认为还是依照胡适的主张,加双斜线“//”以示区别好。即
………………………………………………诗人在宋真宗大中//
祥符年间曾被贬南方

§4 一些容易读错的字应加拼音以标明
问题不在于难字。难字不认识,还会有人去查字典。可是如果字很普通,大家平常都认识,或者字形极易相混的字,不注音就无以起到正确传播文化的作用,而是适得其反。
中学历史课本中,大宛、月氏、龟兹、吐蕃均不注音,我们会认为是念(da-wan   yue-shi   gui-zi   tu-fan),而不会念成(da-yuan   rou-zhi   qiu-ci   tu-bo),这是不识专名而误读。把瓦剌(wa-la)念成瓦刺(wa-ci)。祆教(xian-jiao)念成袄教(ao-jiao),这是字形讹误而误读,还有上海人管阿拉伯叫阿刺伯(a ci bo),外地人看铅山县(yan-shan)叫qian-shan县等等。

                            §5处理歧义的一种方法
汉语的歧义问题一直困扰广大研究人员,但歧义一般只会出现在字面上,日常生活中由于有语境和语流停顿的作用,人们一般是不会感觉到有歧义的,如果把能用停顿解决的歧义句用某种书面符号解决,则善莫大焉。
笔者的想法是在停顿处加上小圆点表示,这样既不会占很大空间,又可以和其它符号相区别。(汉语拼音系统中表示轻声的小圆点只用在汉语拼音系统中,而我们这个小圆点用在汉字书写系统中不会混淆。)如:
  一次性·服务                 一次·性服务
全国·性科学会议              全国性·科学会议
这个地方如果采用分词连写也能解决,但下面这句不行:
我 和 你 的 老师
以上是彭泽润先生的分词连写法造的句子,加上停顿号,就可以分别:
我和·你的老师        我和你·的老师

§6 余论
改进汉字输入系统的目的,是为了更加准确地表情达意,初始使用时一般由于积习难改,总会造成感觉上的不便和招致不满,但我们的目的是为了尽可能方便读者,再加上电脑的普及化,作者编辑对原始文本稍事加工并不会花很大的工作量,但却能收到极佳的效果,实在是一件有利于民族文化的大好事。
发表于 2004-6-14 00:35:22 | 显示全部楼层
非常感谢秋原老师提供这么多文字改革的最新资料。我只提出以下看法:
1、为了解决繁简转换碰到的问题,对明显不合理的简化字恢复原来的旧貌。例如,所列转换困难的字表:
于——于於、谷——谷穀、吁——吁籲、汇——匯彙、范——范範、云——云雲、后——后後。        卜——卜蔔、仆——仆僕、丰——丰豐、采——采採、才——才纔、游——游逰、幸——幸倖。        欲——欲慾、只——隻衹、向——嚮曏、象——象像、注——注註、尽——盡儘、蔑——蔑衊。        准——准準、征——征徵、余——余餘、岳——岳嶽、占——占佔、着著——著、奸——奸姦。        致——致緻、幸——幸倖、钟——鍾鐘、托——托託、渎——瀆凟、梁——梁樑、闲——閑閒。        历——歷曆、背——背揹、发——發髮、松——松鬆、尸——尸屍、回——囬迴、仿——倣髣。        卷——卷捲、沈——卷瀋、赞——贊讚、划——划劃、斗——斗鬥、志——志誌。        毁——毁燬譭、复——复複復、系——系係繫、升——升昇陞、里——里裡裏、么——么幺麽。      干——乾幹榦、并——幷竝並倂
其中很多容易产生歧义,应当恢复原来的旧貌。尤其是
云——云雲、干——乾幹榦、等根本是错误简化。
2、一步到位想法很好。却不一定行得通。
3、分词-连写很值得研究,对阅读和中文处理都有莫大好处。只是权威汉语学家们彼此对哪些属词,哪些属词组都意见不一致,要搞出一套大家都满意的正词法恐怕不易。大家都是权威,谁服谁呀?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-19 13:48 , Processed in 0.090337 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表