汉字楷体不升级，中文信息不独立

孙振坡 · 发表于 2008-11-1 06:44:55

汉字楷体不升级，中文信息不独立

最近微软公司，为了保护office的知识产权，采取了黑屏提示。对此，我们是无理由反对的，目前也是无力反对的。但是，从另一方面看，如果我们有自己的独立自主地中文信息系统，还要花昂贵的价钱去买人家的吗？同时，也说明了，挂接在英文信息系统上的中文信息系统，是随时都受人家控制的，是建立在“沙滩上的大桥”。
为什么中文信息系统必须挂接在英文信息系统上呢？为什么中国不能建立起独立自主的中文信息系统呢？并不是电脑芯片制造上的困难，也不是软件编程上的困难。而是汉字楷体造成的。仅仅一个汉字在电脑上的输入问题，全世界的电脑专家用了30年的时间，绞尽了脑汁，出现了“万码奔腾”的局面，但是，楷体汉字却是个“陷码坑”，在它面前，什么“码”也是“腾”不起来的。仅就一个重码字问题，就一直解决不了。从100多年前出现了机械打字机时起，汉字楷体就是机器处理的不可逾越的鸿沟，今天的电脑，仍然如此。为什么？
因为，机器是按固定的规律运行的，并具有特定的性能。只有符合它的运行规律和性能的东西，才适合它加工。火车只能拐漫弯，你铺设的铁轨拐弯处弄成直角，火车就必定翻车。凡是用机器构建的文字，在结构上必须具有规律性，在组字元件上必须具有规范性、标准性。而汉字楷体是没有这“三性”的，它的构字元件是“点、横、竖、撇、捺、趯、啄、拐等”，这些元件，在不同的字上，其长短、粗细和位置关联都是不同的，5万个字，就有5万样，毫无规律可循。所以，电脑是不能用几十个有限的汉字楷体元件构建无限的楷体汉字的。
目前电脑是怎样处理楷体汉字的呢？它是利用了Windows的图形处理功能，将各一个汉字整体作为各个小图形来存储和调用的。先给每个汉字拟定一个英文键盘代码（汉语拼音法键盘代码或五笔输入法键盘代码）名，然后将各个汉字按此名存入汉字库里。在使用某个字时，就在英文键盘上打出某个字的键盘代码名，电脑就把该字从汉字库中复制到屏幕上来了。这与原先的铅字打字机的方式是一样的。也没有别的更好的处理办法了。
这样一来，重码字就是不可避免的，人们在每一个打字时，就不得不停下来从众多的同码字中选择出需要的那一个字来，这样，打字速度是不会很高的了。同时，字库中没有的字，是打不出来的。所以，汉字不停地增加，字库就的不停地扩充。字库内的字越多，重码字就越多，打字速度就会越慢。这一问题，还不是最大问题。最大的问题，是不能建立独立自主的中文信息系统。为什么？解答这个问题，就涉及到电脑工作原理和电脑构造的问题了。为了节约篇幅，在此只能最简略地谈一下。
电脑工作的基本原理就是进行二进制编码运算和逻辑运算。用来表示二进数元0、1的物理器件，种类是很多的：如果让电容器存电表示0，那么放电就表示1；晶体二极管通电表示0，断电就表示1；三极管高电位（例如0.1v）为0，低电位（例如0.05）就为1；光盘面上的凹点为0，平点就为1；磁盘上的铁粉带，有磁点为0，无磁点就为1；等等，凡是具有二态性并可控的东西，都可以表示二进制数元0、1。
电脑的芯片，是由几千万个微型晶体二极管、三极管、电容等元件构成的。这些元件构成了二进制运算电路和“与门、非门、或门”基本逻辑运算和复合逻辑运算电路。它们怎样运行呢？他们是受电信号控制的。人们首先设定二极管通电表示0，断电表示1。然后用0、1 的不同排列来表示不同的意思。例如：人们用四位编码制来表示0---9的数字，具体做法如下：第一，把四个二极管按从右至左的顺序排列起来，表示四位。第二，当四个管全通电时，即0000，代表数字0；当右边第一个管断电，第2、3、4个管通电时，即0001，代表数字1；依此类推，0010代表数字2；0011代表数字3；0100代表数字4；0101代表数字5 。。。。。。
这样，用十组这样的二极管，就可以表示数字0123456789了。
0101虽然可以表示5，但是并不就是人们通常认识的数字符号5，一般人并不晓得0101代表的是数字5。怎样把数字符号5与编码符号0101联系起来呢？这还需要一套关联逻辑电路和一个相应的关联程序，将二者联系起来，并把数字5显示在屏幕上和编辑文件里。为了便于操作，让人通过点击按钮的一个动作，能将这个关联程序启动起来。为了便于人机“对话”，就在按钮上标上“5”字。这样一来，只要人们想要电脑屏幕上显示5，就直接按一下按钮5 就可以了。所以，人们就称按钮上所标的“5”字，为0101的键盘代码，而称0101为“5”的源码。现在英文键盘上的a、b、c、d、----f1、 f2、
1、2、3、 \、 /、；、。等键盘符号，就是按这个方式设计出来的。
自从出现了键盘代码以后，电脑的编程出现了一个重大的转变：由直接的源码编程变为间接的代码编程。例如，源码“1011011000000000”是一种电脑上的一条加法指令，用键盘代码代表这个指令后，就是“ADD（英文加法一词的缩写）”。这样就使人、机出现了直接的“对话”关系，即人们可以通过键盘上的文字符号与电脑直接交流信息。
为了实现人、机“对话”，在编制电脑的各种控制程序时，都必须把键盘代码所对应的源码作为关联任何程序源码的桥梁。否则，就无法实现人、机“对话”。:
由于任何英文单词，都可以用键盘上的所标出的26个英文字母按钮调动其源码表示出来，也可以说是“组建”出来。这样，电脑的所有的程序，都能以键盘代码为桥梁间接地用源码编制出来了。为了适应这种间接编程的需要，在电脑的芯片制作上，也必须增加很多相应的逻辑门电路，以支持这些关联程序。所以，现在的电脑芯片，在构造上是不能离开特定的软件而独立制作的，它必须以特定的软件为前提，来设计制造它的微晶管和逻辑电路，否则，它就不能运行这种软件。所以，随着软件功能的扩展，电脑的中央控制芯片的微晶管的数量也随之增多，由10年前的几百万个扩大到现在的上亿个，其逻辑控制电路也越来也复杂了。
通过以上分析可以看到，不能用电脑键盘直接构建的文字，是无法实行直接的人、机“对话”的，因此也是不能编制程序和使用程序的。
前面说过，汉字楷体的构字元件是“点、横、竖、撇、捺、趯、啄、拐等”，这些元件，在不同的字上，其长短、粗细和位置关联都是不同的，5万个字，就有5 万样，毫无规律可循。所以，它无法用“点、横、竖、撇、捺、趯、啄、拐等”这些组字元件建立起汉字组字键盘；又由于汉字存在着大量的同音异义字，也不能用汉语拼音字母建立起汉字组字键盘。这样一来，电脑是不能直接构建汉字楷体的。所以，用汉字组字元件作为代码进行间接编程就不可实现。那么，汉字楷体的电脑信息系统，就只能挂接在英文信息系统上了。这样一来，就等于上了“贼船”。
要改变这种挂接状况，唯一的途径就是改进汉字楷体，把它升级为由几十个组字元件组成的具有规律性、规范性、标准性的，可以用电脑键盘构建任何新体汉字，从而实现人、机对话的新体汉字系统。
如果将汉字楷体升级为“意、音双表新体汉字”，不但可以解决中文信息的挂接问题，而且使目前汉字楷体的其他一切难题都得到永远彻底地解决。因为“意、音双表新体汉字”在实质上说，就是保留楷体表意的偏旁不变，只把间接表音的部首，改为直接表音的汉语拼音字母和调符。汉语拼音字母的声母有30个，韵母有37个，调符有5个，再加上意符区别符19个，总共有91个组字基元（参见“中文键盘图”）。这样，只要建立起这91个元件的源码和对应的键盘，就能用中文键盘直接构建任何新体汉字，就可以实现人、机“对话”了。从而可以用键盘代码为桥梁，编制和使用任何中文程序了。从而建立起独立自主的中文信息系统了。
当然，为了表示中文键盘代码的源码，在电脑中央控制芯片上，也必须有相应的晶体元件和电路来支持。因此，挪用以英文键盘代码为基础，制造的电脑中央控制芯片是不行的。所以，目前我们使用的Linux和Wps软件，貌似独立的电脑软件，只能说是独立于微软的软件，从硬件上看，还是离不开英文信息的，还是不能独立的。所以，如果中国自己生产的电脑芯片，仍然以英文键盘代码和源码为基础，那就等于是美国的一个电脑芯片生产分厂，“鸡菢鸭蛋”-----替别人养孩子，对建立独立自主的中文信息系统不起作用。
这样看来，要建立独立自主的中文信息系统，就必须具有两个前提：一是把汉字楷体升级为“意音双表新体汉字”，二是建立自己的电脑芯片设计和生产基地。前者是解决软件问题，后者是解决硬件问题。目前看来，硬件的生产不会有较大的困难，困难较大的却是汉字楷体的升级问题。
把楷体升级为“意音双表新体汉字”，在技术指标和社会指标上都能达到理想的要求：
就技术指标来说，“意音双表汉字”具有规律性、规范性和标准性，适合电脑处理。也具有无限的吸纳性和扩张性，可以用425个字元组建出35642100（30*37*5*338*19=35642100）个意、音双表汉字来。今后，随着汉语和汉字的发展，组字基元必然不断增添，但不会造成新汉字系统出现混乱。而且这种双表汉字的笔画数最多的不会超过29画，不会出现因为字数的增加导致笔画数增多的现象；也不会出现因为字数的增加而造成新汉字系统混乱的现象，具有极其长久的稳定性。“意、音双表汉字”的意符（是楷字的独体字）和音符（是拼音字母和调符），都可以做成标准件，每个字可以由“意符”和“音符”合并而成。如果做一个“意、音双表新汉字”的中文键盘，再以这425个基元为对象编一个组字程序，电脑里只要存储了425个基元字模，用键盘从425个字模库中调出组字元件，按构字规则排布到屏幕上，就组成一个完整的新体汉字了。这就可以打出任何新体汉字来，不存在字库限制的问题，不会有重码字；字怎么写，键盘就怎么打。任何程序都可以用中文键盘代码为桥梁编制出来，很方便的实现人、机“对话”。
就社会指标来说，人们只要学会了425个(本应是429个，因为调符阴平为空，“衣、乌、鱼”声母、韵母相同)组字基元，（其中有67个拼音字母-----实际声母是30个，韵母是37个；5个调符，19个意符区别符，其余338个就是意符（楷体汉字的部首或独体字。）和构字规则，就会读、写所有的新汉字，真正成了“学少知多”的文字。目前只要具有初中以上文化水平的人们，用半天的时间就能学会读写所有的常用新体汉字。又因为新体汉字可以与楷体汉字互当异体字是用，所以可以实现两者的无缝转换，由此不会出现新、旧体文字的文盲和转换的经济成本及时间断层。又因为新体汉字直接表意表音，具有双提示功能，是世界上最易学会的文字，就十分便于普及汉语，这样，将使汉语很快地普及于世界各国的普通民众，这就为中文信息网络向世界的扩展提供了前提。
既然两大指标都能达到，困难在那里呢？困难就是人们的思想阻力。思想阻力的产生来源有三个：
一是那些顽固地坚持错误的语言文字理论的人们，既不谦虚又不认真研究实际问题，还很固执自大。汉字楷体在今天所凸现的诸多缺点和带来的问题，使中国每年浪费千万亿元的财富，他们视而不见，听而不闻；汉语汉字出现了危机，他们拿不出正确的解决危机的办法来。他们以自己的“理论”而不是以实践为标准来判断是非，只要不符合他们的错误理论的，就一概反对。
二是那些靠保持汉字楷体不变，得到好处的人们。中国每年浪费的千万亿元的财富中，除一半流入“洋人”的口袋里以外。另有一半，就流到这类人的口袋里了。他们为了保持既得利益，他们可以不顾事实地编造任何假话和“理由”来迷惑人们，来阻止对汉字楷体作任何改变。
三是大多数的民众，由于不懂得电脑的工作原理和构造，以为目前汉字在电脑上表现出来的问题是理所当然的现象，是不必解决的；对汉字难学，也以为是自古就延续下来的事实，习以为常了；对于因电脑普及于普通民众，导致中国不得不实行全民普及英语教育，以为是为了赶上现代化新潮流应当做的；对于因汉字楷体不适应现代社会发展的要求使国家和私人每年浪费千万亿元的财富，更是认为是必要的支出。所以，大多数的民众对改进汉字楷体的必要性是没有认识的。再加上中国长期的封建守旧教育和愚民政策，使大多数中国人养成了安于现状，不求进取的传统习惯和“祖法不可碰，碰了就要命”、“守旧无过，革新惹祸”的观念。这种习惯和观念，在今天仍然是一股很强的阻力：对于不习惯的新生事物，不是先进行分析研究，实践检验，然后再下结论，而是一听就先持鄙视、反感的态度；多数人都没有努力探索客观规律、开拓创新的意识。所以，以上两种阻力，在这样的社会环境里，就被放大成十级逆风了。
这种强大的逆风，大大地帮了微软公司的忙。所以，他们就可以采取任何“合法”的手段，使中国人成为他们“船”上的小伙计，让中国人听他们随便使唤。“黑屏”仅仅是使唤的第一个做法，仅仅是使唤的开始。而现在看来，中国人能不能下“船”，关键不在于有没有办法可下，而在于自己愿不愿意下。
开始是自愿上“船”的，然后会从这个“船”上自觉地走下来吗？一些人在平常是没有这个自觉性的。近代中国的历史证明，跟着洋人后边跑的路子都是走不通的，只有被洋人在后边赶着，自己开辟的路子才能走通。没有英语的进逼，没有汉语的危机，没有微软的“黑屏”，一些中国人是没有下“船”的自觉性和决心的。这就是“危难兴邦”吧？

山东临沂孙振坡
2008.10.28

注：关于新体汉字的理论依据，请看下面的附件：“中国汉语汉字发展规律研究提纲rar ”一文。
如果此处不能上传压缩文件（rar），可以到中国语言文字网 http://www.china-language.gov.cn 的“百家论坛”版块里找到。

		自动登录	找回密码
密码			注册

汉字楷体不升级，中文信息不独立

相关帖子