湘里妹子学术网

 找回密码
 注册
查看: 7036|回复: 4

班氏当用汉字及在北大中文论坛上的讨论

[复制链接]
发表于 2005-7-18 01:33:20 | 显示全部楼层 |阅读模式
---------------------------------------------------------------

班氏提议的“当用汉字和限用汉字”------------
      班氏提出一个主张:应当制定“当用汉字和限用汉字”的规定。

      意义何在呢?当前已经有多种按使用常见频度划分的汉字分级标准,如一二级、国标、大五码、常用字次常用字等等,有国家认可的,也有非正规的。种类虽多,但这些都是一些指示性数据,而不是一种指导性甚至强制性标准,没有对操作的强力规范作用。分级有了,但依然不减好事之徒贪图虚荣、逐奇斗难,以玩弄艰涩文字为能事,阻碍语言文字的大众化、工具化、简便化。此害之一。

字量过大,用字艰深,吓退了千万华裔子弟和异族朋友,使中华文化的影响不被弘扬反而收缩。此害之二。

     当今之世,众语逐鹿,壮者为王,弱者为寇。“中华文化到了最危险的时候”,简装轻骑才是唯一生路,这不是文人游戏,关乎国家民族存亡啊。安于现状,字量如海,等于自我绞杀。此害之三。

     班氏痛感:“汉字多如恒河沙数,不可修习”已经是流行于敌我双方的一个国际性思维定式,必须打破这个恶咒,还汉字青春生气,救中华文化于衰亡。我们必须制定切实可行的措施,并积极宣传,用理论和事实告诉世人,汉字虽然号称十万,但一般人通常要使用的只有两三千。

      若规定一个相对较小的字库,其他的一刀切废弃,也不行。有些生僻字在有些时候、有些行业还是要用到。班氏提议的“当用汉字和限用汉字”规定就是用于解决这一矛盾的。要规定在能用“当用汉字”解决问题的地方,就不准使用“限用汉字”(所谓文采花样只准在“当用汉字”范围内玩),尤其是教师、作家、公务员、报纸杂志公共出版物要严格执行。不能或不便用“当用汉字”描述的,才可以选用“限用汉字”。这样,既不是不管,又不是管死。刚柔并济、法外有情,原则之外又有灵活机动。

     “当用汉字”多少为宜呢?已有的2500+1000常用和次常用字是一个较低的标准,会有较多不便。一二级汉字6763个又嫌太多,社会人群中谁会用到这么多字啊,文史专业的人只占百分之几,要90%以上的人去迁就极少数人是全社会人才资源的极大浪费。班氏建议“当用汉字”为4500个,其余的字不是不要,而是归入“限用汉字”,不得随便使用,可以在必要时使用,这样严松适度为好,以免目前的有级而无制。

本贴由值班版主班门斧于2005年7月03日 07:33:39修改过
----------------------------------------------------------

“限用汉字”使用及可操作性问题

-------------
规定了“限用汉字”,并不是说它没价值,它同样是中华文化的瑰宝。当用与限用的规定,目的只是使文字在人与人的信息传递中更高效更简易。即是最高效是使用当用汉字,而内容深广丰富的资料会较多使用到限用汉字。

关于可操作性问题。当一个限用汉字被使用而引起投诉、质疑、纷争时,判决的依据是这个语义能否用当用汉字的字、词及常见词组去表述。若能,则这个限用汉字的使用是不当的、不道德的、非法的,其使用者必须受到批评、处分甚至处罚(这不是危言耸听,故意玩弄艰涩含糊的文字而制造合同诈局的案例多的是)。作为一项法规,必须具备判别是非的可操作性标准。

长久以往,基础字集就会明确、有限、简易,社会文风也会一改艰涩难懂的腐朽味,变得通俗清新,高效便捷。


避免“汉字僵化”“汉字局限”的论调抬头
-------------
关于“当用汉字和限用汉字”的两个帖子必须附上以下这篇文章作支撑,以免“汉字僵化”“汉字局限”的论调又抬头。说起来也是,人家给你26个字母组词你就得意忘形,我们给你4500个字组词你就感觉贫乏。双字词可组两千多万,三字词可组九百亿,何来贫乏?可见,不是汉字不好用,而是你没用好。详细论说如下:

端正文风,开展大众语运动;改革量词,实行两个腿走路对汉字有善意又有担忧的人,常有两个疑问,汉字是否僵化而不能适应社会的发展?汉字数量是否足够而能够避免语言文字之贫乏?

      1、关于僵化。
      先看一个汉字与时俱进的实例:“腕们去看克隆秀,嫌打的不够酷,面的更无菲士,要叹坦克。”大文豪李白也看不懂这段浅显的文字。汉字的义项是可以随着时代的需要、社会的发展而消失或添加的,腕、秀、打、的、面、酷、叹,还有直接引词的“坦克克隆”(尚未词素化、字化),充分显示了汉字的轻灵空活。铁的事实证明,汉字并不僵化,汉字可以表达任何时代要求它表达的任何语义。在理论角度,“班氏汉字图标论”揭示了汉字的最根本的性质就是:汉字无音、 无义,汉字是一种二维图标。简证之:汉字时代不同,读音不同;地域不同,读音不同;语系(京粤闽客)不同,读音不同。可见汉字无音,其音可约(约定俗成)。从本段开始的实例,可证汉字无义,其义可赋。汉字作为一种二维图标(特别提示,字母文字虽然可以借用二维平面的纸张写出来,但本质上它不是二维图标,而是一维线性密码,它其中的任何一个字母可以用0至9或其他任何符号替换而不影响其构型及音义)。Windows窗口采用图标代替字母词,就是为了便于被人的眼、脑识记。图标性汉字就是一套音义非常灵活、绝不僵化的语义符号。担心或攻击汉字僵化的观点是完全站不住脚的。

       2、关于数量。
       还是先来看一些例子吧。电与话、与视、与发,本来是完全不相关的字,却可以组成电话、电视、电发,表达一些新生事物。激与光、雷与达、的和士、拷和贝,也是风牛马不相及的字,却可以组成激光、雷达、的士、拷贝。前几个词利用了原字的一些义项及延伸,而后三个词不但与其字无关,还反向促使这些字产生了新的义项(如的、拷)。星移斗转沧海桑田,日后任何两个汉字几乎都有组合成词的可能。回到正题,我们需要多少汉字才够用呢?可以大胆地说,四五千就够,6763更是足够(不反对超过的部分也收入生僻字库,作为经典研习之查用)。算一下码位,6763字有4574万双字码位,只要用上十分之一二,就比现在的英语总词汇量多了(三字词还没算进去),担忧数量之不够纯粹是杞人忧天。除了以上理论数字的计算,让我们再来看看社会现实的用字量。例子一,“ 词频研究显示,2400个高频单音节词的现代汉语覆盖率达99%。 日本规定2000个常用汉字的做法也反映出这个语言现实。 作者曾对自己在联合国差不多6年的译文进行统计, 发现总共使用约2100个汉字。”(作者: 吴文超,前联合国资深翻译员,香港中国语文学会会员, 高威软件有限公司主席兼总裁)。例子二,孙中山先生写《三民主义》,总字数约16万,仅用了2134 个不同的字。例子三,《毛泽东选集》一至四卷,总字数超过66万,也只用了 2891个不同的字。例子四,小说《骆驼祥子》,总字数达10万多,用到的汉字 数为2413(后三个例子
数据引自http://www.qmxx.com.cn/orft.htm《汉字库简介》)。可见,山不在
高,有仙则灵;字不在多,有机则丰。我国在1988年公布的<现代汉语常用字表>只选收了2500个常用字、1000个次常用字,总共3500。班氏一直主张,1500、2500、3500以上,分别是脱盲级(读报)、知识分子级(包括数学、化学、工程力学教授)、文史学者级的识字要求。 这是符合社会现实的,是科学合理的。

       3、提倡大众汉语运动
     班氏呼吁国人开展一场“大众汉语”运动,继“五四”白话文运动之后,再来一次文风革命。摈弃生僻字,铲除逐奇斗难的腐朽文风。让国人、让青少年一代把精力时间从十年习字中解放出来,把精力时间用到学习政治经济、科学技术、文学艺术中去。同时,也可以摘掉所谓汉语难学的帽子,让汉语汉字走到数千万华侨子弟中去,走到更多的外邦外族朋友中去,抗衡霸权英语对汉语及其他语言文化的毁灭性压迫。因此,大众汉语运动不仅仅是一种文字游戏,更是具有伟大政治经济文化意义的历史性壮举。

         4、关于唐诗宋词。开展大众汉语运动是否会割裂史料丰富的中华文明?丝毫不会。一直以来,大家都习惯于人云亦云,空口白牙地说历史文化、经典文学很重要、非常重要。这个“很”是多少?“非常”是多少?缺乏计算甚至最粗略的量估。这是文科领域不少人的一个弱点。以唐诗宋词为例,是很重要非常重要,但这没法操作。班氏说,一般人能学好三五百首就有足够的诗词修养了,文史专业的人学好六七百首也足够了。人生一辈子没有多少日子多少小时。只有文史专业里面又专攻唐诗宋词或唐宋文学的人,才需要深入广泛地去钻研。欢迎有人建立更科学的数学模型,算出更精密的结果。而2000、3000字,大概能分别覆盖唐诗宋词的百分之五十、七十。尤其是,班氏有一个特别的发现,手头有一本《古代诗词曲名句选》,收历代诗、词、曲、杂剧、传奇名句名段两千多条(首),班氏发现2500常用字就能覆盖其中90%以上的条目。“海内存知己,天涯若比邻”,“山重水复疑无路,柳暗花明又一村”,“白日依山尽,黄河入海流,欲穷千里目,更上一层楼”,“朝辞白帝彩云间,千里江陵一日还,两岸猿声啼不住,轻舟已过万重山”。隽永不朽的诗句多是用字平易浅白的,这是一个极其关键的性质。班氏认为这不是一个巧合,而是文字的一个本质。生僻字不但不利于流传,而且它本身就没有多大的生命力。

       5、关于改革量词。
      汉语的量词真是种类繁多,不胜其烦。优点是用好了使人觉得生动活泼、丰富多彩。缺点是对新学习者是一个很头痛的麻烦。班氏建议实行两条腿走路,允许单数确数通用“个”、复数概数通用“些”,而阳春白雪高级写作也可以采用原有量词系统。班氏在汉语母语者中有意试用,“你家有两个车吗?”“这个歌你唱得很好”,发现感觉效果还是很不错的。改革量词,实行两个腿走路!


为什么“当用汉字”的数量定为4500
-------------
为什么“当用汉字”的数量定为4500,而不是更少或更多?

国家已经颁布常用字为2500个,次常用字为1000个。大概上说,就是一般人最好要掌握2500字,中高级知识分子最好要掌握3500字的意思。作为面对全社会总体的“当用汉字”,当然应该适当考虑不同领域不同行业用字的不交集,当然应该比3500多一个码数,所以大概就多收1000字吧。 但可不可以多至5000或5500,甚至更多一些呢?在此,我们先引用一个汉字频度表参考一下:

汉字频度表-------------

今对 ChenShuyuan先生转载清华大学统计资料进行加工,公布如下,仅供参考。
使用字数6763字(国标字符集),范文合计总字数86405823个。
说明如下:
假若认识 500字,则覆盖面为 78.53 %。其余类推,列表如下:
字数 覆盖面( %)
500 78.53202
1000 91.91527
1500 96.47563
2000 98.38765
2500 99.24388
3000 99.63322
3500 99.82015
4000 99.91645
4500 99.96471
5000 99.98633
5500 99.99553
6000 99.99901
6479 100.00000
6500 100.00000
6763 100.00000
(略)
资料引自http://sh.netsh.com/bbs/1951/messages/39572.html

从以上资料可以看到,若由4500字增加到5000字,数量增加11.11%,而覆盖率只增加0.02162%;若由5000字增加到5500字,数量增加10%,而覆盖率只增加0.0092%;若由5500字增加到6000字,数量增加9.09%,而覆盖率只增加0.00348%,即每读十万字用到3.48个这些字,等效于读一本中等长篇小说遇到三五个这些字。我们发现:
      
      1、从数量上说,由4500字逐次增加到6000字,对大众阅读的覆盖率的增加帮助不大。

      2、从质量上说,汉字有一个特点,就是两三千常用字之外的生僻字90%以上是形声字,木字旁的一般是指某种植物树木,鱼字旁的就是某种鱼了,鸟字旁的大概就是一种飞禽了,反犬旁就是一种走兽。读书遇到一个不认识的带鱼字旁的字,也知道是在提到一种鱼类生物,一般不影响大众阅读理解(专业研究另有要求)。

      3、每一个领域、每一个专业资料的写者及兴趣读者,可以在“当用汉字”之外、在“限用汉字”中再熟识二三十个与自己领域相关的专用字,不必把这个负担推向大众。所以,“当用汉字”不必包括某一类人常用而不是普罗大众常用的字(否则,“当用汉字”再加一千个也觉得不够)。
4、上述汉字频度表统计的对象虽然是一二级6763个汉字,但有分析资料说,字频在6600以后的所有字,不管是三五万,还是八九万,其总和覆盖率不足十万分之一。可见,不管汉字总数怎么“多”,事实上是基本不影响对一般现代读物的读写的(史料书籍除外)。
5、综上所述,“当用汉字”的合理数量一定是在4500至6000范围内。班氏主张定在4500左右,宁可让每一个特定的人到“限用汉字”中再掌握几十个字,也不要叫大众全体增加一两千字的负担。

本贴由值班版主班门斧于2005年7月04日 14:29:00修改过
 楼主| 发表于 2005-7-18 01:35:55 | 显示全部楼层

在北大中文论坛上的讨论

在北大中文论坛上的讨论
--------------------------------------------------------------------------------
有女同车:

实在看不下去,先给楼主叫个倒好再来细读。
既然说“中华文化到了最危险的时候”,你把”当用“强制限定在4500的范围内又是何居心,仅靠4500字继承下来的”中华“文化还能叫”文化“么?
汉字的总数接近10万这只不过是个浮皮潦草的统计数字,这个数字实际上包含了大量的古今字、初文、孳乳文、伪字、讹字、俗字、异体重文、繁密体、简化体还有各体字形上的细微差异。若从音义统一的标准入手,真正意义上的异体字群大概也只有2万左右。而且不同的汉字在功用层次功用方向上也有显著的差别,比如武后造的瞾、圀等字在与特定历史阶段相关的文献中是不能被照、國等字取代的,又如哋、甴等文方言字也不能用们、蟑等通用字代替。
6763个还嫌多,我实在是无法理解,具有高中以上学力的普通人(事实是我国公民的平均受教育水平正在逐年提高),在课本中所接触到字就要超过GB2312的范围,连小学生的识字水平也要超出3000,我想问这4500字的范围楼主究竟是根据什么划定的。6000多个字用来读报纸看通俗杂志问题不大,但识字不光是为了干这些的,国家搞普及教育教国民识字的正经的目的就是希望公民们能读懂书,多读书,读各种各样的书。光靠这6000字,古书是肯定没法读了,读科学技术类的专业书籍还能勉强敷衍,读社科图书又是一头雾水,连读通俗文学也是绊绊磕磕。我真希望更多有责任感和危机感的人能站出来呼吁教育部门让我们的孩子多认些字,楼主居然高唱反调不劝学反而劝逸。
[ Last edited by 有女同车 on 2005-7-5 at 00:24 ]

仰慕中蕐文明,歬來求學取經//《詩·鄭風》有女同車,顏如舜華。將翱將翔,佩玉…(澄清贱名的出处)
2005-7-5 00:20 #2

张时钊:

班氏的当用汉字主张有可取之处
我认为班氏的当用汉字主张有可取之处,平常写文章应尽量不用冷僻字。但不能禁用,更容许造生字,否则是会使汉字僵化的。虽然几千个汉字就可组成无穷的词汇,足以应付需要。但不要忘记汉字一字一音的特点。一些双音词如“不用”都要合为“甭”,化学元素大部是新造字,物理的“焓”就比“热含”好得多,自然省不了。这是百年内的事,以后一定也有需要造新字的时候,如在特殊群体或地域内,其可能性更大。再看看近来兴起的网络词汇,大多使用字母和阿拉伯数字,说明只用限量汉字组词或谐音代替是不行的。我相信,如果不是目前使用字库的限制,一定会造出新字,不会是现在的四不像新词汇。不过使用生僻字和新造字时,量必须很少,估计有读者可能看不懂时,应在文内加以解说,除非是不想傍人看的密文。

2005-7-5 09:50 #3

班门斧:

(致)有女网友:
1、首先谢谢你的关注。
2、我对中华文化的热爱比你强烈(很可能噢)。
3、但红军企图保存所有坛坛罐罐,就会招致全军覆没。在当今之世,语言文字竞争、文化竞争、国家民族生死存亡的竞争,谁凝重迟滞谁就灭亡,再不是慢慢品茶细细研究第五个回字的古韵古法的时代了。
4、限用生僻字,并不影响现代词汇的丰富,并不影响现代语文的发展,反而使现代语文能够轻装前进。放眼文山书海,七八千字以外的部分,对现代语汇没有多少意义(一些罕见的动植物名称还有一点点用),不要拿它与中华文化画等号。
5、一个文史院的老学究钻研故纸堆是值得钦佩的,但一万个农民、工人、工程师、服务员、商人忙碌在育种棚、机器旁,穿梭在顾客中,挥汗在空调室的谈判桌旁,这才是社会的主流、社会的主体。作为一个社会的总体调控,不可能两头一般重,应该是照顾后者而忽略前者。
6、请恕我直言,我历看你洋洋十六行大贴,好像看不到阶级斗争、生产斗争、科学实验这三大社会运动的影子耶。
7、你写出一篇《论班氏限用汉字的意义及用途》的命题作业,我们才好展开讨论的。

[ Last edited by 班门斧 on 2005-7-5 at 11:18 ]

2005-7-5 10:04 #4

SANGJUN:
這個跟階級鬥爭, 生產鬥爭的有什麼關係啊?
~!

2005-7-5 10:30 #5

yima:
我同意班氏意见。
应该分级。
分4级比较好。第一级,是标准级。国家的标准人才必须掌握的。不能多,就定在初中毕业应掌握的水平上。
第二级,扩展级。这种字,可以用,但是,在任何出版务中,必须注音。标准人才都可能不认识的字,当然应该注音。
第三级,批准级,用前须经有关部门批准。
第四级,禁用级。
汉语拼音写字板
2005-7-5 16:01 #6

有女同车:
用事实说话吧。我自己做了个统计字数的小程序,虽然有许多BUG也懒得去改进,也就是精确度不够高,但统计的数据是能够反映问题的。
下面是对〈笑傲江湖〉(金庸,简体版)和〈四世同堂〉(老舍,简体版)做的统计,前面两行是〈笑〉的用字,随后的是〈笑〉、〈四〉合并的用字情况——由程序BUG所误选的全角符号也一并列出,以示客观。

QUOTE:
K:\小閬闤\Ritter\Kim Yong\笑傲江湖\笑傲江湖(上).txt 425145
K:\小閬闤\Ritter\Kim Yong\笑傲江湖\笑傲江湖(下).txt 416396

Total: 841541glyphs and 3792 kinds of glyph

K:\小閬闤\Ritter\Kim Yong\笑傲江湖\笑傲江湖(上).txt 425145
K:\小閬闤\Ritter\Kim Yong\笑傲江湖\笑傲江湖(下).txt 416396
K:\小閬闤\Moderne chinesische Literatur\LaoShaa\4generations\四世同堂.txt 637428

Total: 1478969glyphs and 4224 kinds of glyph

第一回灭门和风熏柳花香醉人正是南国春光漫烂季节福建省州府西大街青石板路笔直的伸展出去通座构宏伟宅之前左右两坛中各竖根丈来高旗杆顶飘扬首上黄色丝线绣着头张牙舞爪神态威猛雄狮子随招显得更奕若生有对黑蝙蝠翅飞翔镖局四个字银钩铁划刚劲非凡朱漆茶杯小铜钉闪发匾额写金下面横书总号进处排长凳分坐八名装结束汉腰挺股英悍气突然间后院马蹄声响那齐站起抢只见侧冲五骑沿道到当先匹全身雪白勒脚镫都打就鞍锦衣少年约莫十九岁纪肩停猎鹰悬宝剑背负弓泼喇纵疾驰跟者布短行口三叫了又啦哈笑鞭在空拍虚击胯昂嘶史今儿再抬野猪伙好饱餐顿条尾巴不你可别灌汤众早远城林平双腿轻挟翻腾片刻便将抛离他山坡放从赶兔取旁箭袋支雕翎弯搭刷应而倒待要射时另却钻入草丛郑听趟手二快这里鸡过雉竟没急提向半抽力波羽毛散说兀也追逐鸟兽陈七凑兴物自己良机多辰獐类犹未足咱们边找心想凭性天决肯罢夫埋怨晚尖伤明知论甚么话难劝动位任但爱异常能让它稍损宛驹外婆洛阳重价觅日送给果怕我龙聪紧会踏吧摔破屁兜转原北阵才尽缓挑酒喝怎样新鲜肉炒假经事请够懒洋跃步走肆往店主老蔡已接缰味啊真法如世奉承番此静悄地炉女鬟插荆钗料理水脸呢牵拉开用袖拂灰尘相陪席内堂咳嗽客官方音还斤竹叶哪换瞒姓萨本氏幼做意媳妇死树千落归带孙故乡家亲戚朋友干卖唉算受惭愧低托木盘等筷壶桌始终敢瞧眼形婀娜肤黝粗糙似痘瘢容貌丑她初勾举止硬拿交洗剥净盆爷些牛蚕豆吩咐端公侠仗义挥土菜倘合胃钱月赚谢斟仰脖舌舐嘴唇变忽乘奔倏碗川穿袍系榕晃即刺缠斯文扮赤无耳麻鞋所乃诸葛亮逝为戴孝武侯遗深以仍免希奇模透古怪格把累坏问虽清脆怔颏惜吃惊忙退余兄弟姑娘材蛋嘛泥榴皮东狗崽撒贾骂猜谁像母眉目秀俊美消男挤弄势必忍耐住锡避溅台唱旦引架成胆太拳脉拖立定肘撞颈喀垮连脓包被颇尊驾既同冷专掌术使底祖传云乾坤抓微沉化扫雾看怒踢扶夹帮贼强胜愿助顺拾断叉指艺庸喊惯嗓洪句懂父式师拆解套确蠢实功碰因临场历富搏斗遭际曾痞恶猫何绝鼻肿逃夭次骄渐挫觉朗越准乔改红孔愈斜血流襟满蓦识歹龟般逗玩狂骤雨宫记卸诀挡膂砰胸领臂掀坎磕叔欲撇救施戳几脑反震数环滚爬乌王妈杂种奶珠加压触及腹差寸骨痛折星乱冒嗡作肚件情思索拔松现恐怖极匕至柄朝夕照吓颗腔跳愕登喷尺观呼爹报掷扑搐抄兵刃江湖阅丰闹命拚瞪视晌割绳尸汩罪活烦该杀颤办寻代殴且密劫盗告状迩郊关督巡按易皱挪邻近其并怀碎掏调戏迫于奈由脱慢遮掩绿稀耗鬼采案保安赏图漏点否则迟巧园迹锄覆息棺嚼哼刀百添具妥略宽忐忑厅椅闭愉烟考校辟邪六堕佛悉责衫凝遇敌钝膀含滴溜绕掸笛精紫俩乳酸很每教喜讯火替纸媒摇信派收礼副担移孩闯靠糊屈翘拇占车厮较量许言亡单属抚恤剩饭须熟比枪奋谈休吊桶份营广浙苏基业河创秘冤殊欢忡陇复望蜀鄂溯庶陕贵卧虎藏峨嵋秋备厚程寺素斋封厉害俱严嘱恭敬闷居拜隆彩宾称普赌学范闲商舅諠哗促规矩败恼管李厕躺痕冰病围团裳祝仔细查毒账房董丧吗嗯界潮迢弱尚济嵩泰衡华恒岳驱遍聚惹输财矮截逞哟仇缩迎留讨胡娃凶霸峻哀恳厩浮荡毙与争象灯笼裤察周骼捏暴蹊跷瘟疫浑斑途除厢侮语揪慌靴筒泄究坍完吟或特毕俞凛答肃惶楚乎颜侄赞错计扯敲弹钢搠觔姿拙劣技影幻候呀久闻踱崔稳持遣闩扇吱屋油盏褥箱均搬体倚墙掘认祟软瘫痪亏扒露服失蜡烛熄镇鼓勇灶镬咦循块帕贫淡幽滑甸缎缘角枝珊瑚工致掉床匆俯质整洁污秽脏辱险圈付醒呆晦隔懦养耀集催妻欺段利砍嗤搓偷摸滥臭铺剜洞涵梨仙祸哥岂邀评霹雳爆脾闺元减怦惧寒暗探卫忾携抗舒睡榻护嘿悟贝傲依附庇忿战危湿顾侵抵枕袜盖薄警兆窗夜黎迭禀朦胧设买骏泪祥厌斥嘈昨访共军吴摆饶浪陡景禁剧烈抖膝喉枯忠坊拱核褚热亦表牌叹抱贤誓激愤井鼠窃握削器衰叱群魔竭毫踪雷览桂砖粒委畏求患固杭昌闽粤赣啐呸帖疑拣胖忧忖仆市妄淋漓画拥径迈跨擦宁班超度魂寿适狄扭痉挛最莽值贪唤傅惨厨烹饪冬瓜盅糟鱼馄饨誉达轿骡概狠辣趁防唯愁策守讪筹怯慰午默傍驮悲万剐善匪忘羔袒膛畜恨炸觑佩鸦雀偏室伏哭迷挖困徒念骰博置壁僵推列裸剖霍摧验裹阴爽捉裂绰颓暂君丢烧饰舍玉卷豹劳优纨猝逢仓皇怜灵旱睁哄蓝皙运投刘怠纷涌锁壮沓拦咽屿肴吸温暖独孤筑眺某谷袅窥择惴睛捣乍屑蓄铮阁配赴缺豪杰造诣迓脊误挽项歉赔圜沧海谨犬赖率攻喂区智勃训感恩肺颠嘻颊晕迅捷锋距鞘呛啷兼钟馗抉援速劈疯踉跄绊跌穴制骇燕霎茫措志跪宜唾沫吐梁品猥琐涎煮筋琵琶串螃蟹粪屎塞效昏魄聆挣扎废窜凹凸诧臀挂撑隙幪绞顷鸿冥缚赫幸枉跛拐咒挨叮层掳蚊蚋燃穷耽咬齿涧蛙隐凄凉弧池塘呕岭押苦囊饿咕株充饥产庭积返陷汗振乞村嗫嚅食胀农怄帚米胚揍遂踹堆羞懑狼狈棒艰耻摘民粮涂雅境焦瓦砾搁沙畔蹲踌躇褴褛湘撕电巷煤柴屏罚吉毁申霉借献簌缝妙克珍菲罗偿搜刮撬屉乐瞎驴玎珰辞呵欠蒋获涔谋虑咎獠享骗肖宗潜旨令德健妨豁烘尿籁寂鼾映惕秃茅练诛辨丘畅钞锭帐阔盒羊脂存觊觎贺僻药膏贴垂镜憎罩驼裨益淅沥笠馆士泡碟聊浩雁逊娶嫁彭趋炎盼鼎盛辜苍孽迁嫌辈寝宰杞罐钦绸衷测瘦吹户翁逼增伊琴杨秉宋槁披泛拓滩滔帅部残旧瓷倾拢议皆潇曲俗词盹焉伯仲互娇嫩妹嗔轰瞌猴耍批躲罕诉淳朴讷晨陋偶葫芦瘾攀酿甜喏搔腮稽搞哩跑唷题垢虱涕浓痰馋允嘟授丹田游凌霄撼奥憾嚷楼饮丐栈扰庙祠歇铲诡捶腊陆恰熊奸猾棍悔阻澜梯诫牢谆萃悸违刁顽瞟愠悻祁洱尤诺务勿予介栗讥嘲讽纳课荒疏忌瞥况籍修篇习选寡卒窝岔续潭殿磨碍堪继维殭筵呈谦夤试演旺栽瓶绽研侍郁狭耿欣蒙痴彦源茂捞绪述治擒哇揖噗哧檐笃锅揭掇俟惮箧偌谱哉睹窍彼旋尼狐逸庵躬参掠启谎犯姊谣拨仪琳粉尴尬眶伍犊贻哑邂逅醺腕箍忒伞敝恕执慕简标甘泊赊羹讹诈混丁巾囚弃骚喧廊魁梧酱茧叩煞耸淫据辩染喘级嘘赐嫉昭彰伦贯补切卑鄙盟巽柏噩喃帘丽袭缁窈窕娉婷盈媚纤穗剎撩屹森证衅霜朵腑醋勉巨详涉资躁啰唆澈呜唬诳菩鉴诚判纯瑕泞苔溪慈戒嫡蛮恃针渡夺扳卡卜嵌黯拭哽趣贞椎啸哦吁腥胶敷幅柔斩坚绵睬询谅乒乓括恍瘪遁导注伶俐莞尔期鸭永乖倔荤律诬虾洒泫腐嗜屡眩讳讲傻砒蛇编权峰渗谊伺骛胳谬驷锤炼蝇擅订靥鲁氓监噢帝擂奖嗒刎卓玄递晶莹夷揽酷龄夸驳私印幕瞬孟胁描谩逾匠锐肌忆噫窘衍搪迄倍抑肠贸慨慑髓圆肥庐臃敏吞坠预浅炽宇荣炫霆童渊峙沟船哎翠捋詈绘灿眈诌联扁磊沛诋努咄辛苗晰浸诱荷艳倪梦锥悦寞纠佝偻央仃剃窟窿吠窄姐鸳鸯栩梳妆绯腼腆瞇妖娆抿妓贱宣棉圣吝炭恻丸屠佳疗痊赢狱呻匀亵渎咯俏嗲著劭骐暇嗖旷鸨俬瑟氅蜂嫖宿娼操窒搂缕婚帽蚀章甫沸疼豫狰狞蔼限遵睽笈霞韧升昔叙契冠驻末慧郎征录恪诲阿陶钧蹙蹑乏抹费吵啼拒垫圃坳捧疲肢痒忸怩恢亩巅蝉鸣岗踟蹰燥祷蒂轮晴嗅宵谜剔汁渴虹瀑猿歪履泻伴苟悠禅释倦虫惑泣瞅艾诵喻读竺僧伽犁耕医婴御奏陛亭搽裁玲珑凤銮芳晏眠辉煌亿漂莲杖械枷检蟒螟蝎掣降雹澍厄虔灾祈挚逆阶胎暄巳鳌夏婿峡砂潘吼卢藉役铳锣崭员绅衙轴廷族巢卵党臣诏曰县桑梓娴职朕培捻泽袱哂晋爵芝零贿禄典楣碌仕宦缀逍遥什柬函惩贷播延桓杠蝴蝶菁眷矜飒恫彬仅晒蜮伎肮龌龊塔鹤荫裕戕谓臻歧弦箫霁伪萧帛蜜侃捐棋泉弥叛轩恂肝尝陀鹘娱綦佻示戈禽拟控铩哲芹遏佑迂萤纱烁眨冻彻拈曳臊韵亢岩谐瑶锵伐婉繁贲愚殉讶溺嵇康刑陵瘁淌岸崖殆戮俘痨睦俺魅诗册瞑寄庄司矣坟墓邕敛迸糕噤蹋揣砌儒蕴杳堵晓熬恙朽窖柱拘炮召煎憔悴桩殓雇艘厝葬旬咭序例嘤淙琢羡缭织梭赳杜撰癫恁懈缡呶穆□赦妒仁蹬沽谴磋赵郝篮赛茹津膳铅鹅暮芒颐钵羁岫蜚恋咙剂呓粽箬馅菇菌瓣滋笨粘吾淑驭涛颚唐碧铸惟歌砸骷髅骸斧虞篑凿毅蜷甬棱弩诅组矛寥甩稔胫棵唠叨涩沮徘徊窦侥箸倜傥譬烫湛蓬仄漠倩裙峭怿勤殷袂赎估捡仿网鬓撄稻嚓键盯纲轾淆疤扣钮喟奠载巍惋箩谪篦醇沾汾绍矫溢涨坦捕摊忤睨肋诞枚蔓阱驯融亟俾钓慎畸耆凋嘉扼膻抒眸甲丙庚癸兑孺析怡萎靡揉廿鳞翼狡谲炯阐蹈辙疚攸懊寐戟橛蛾槌链渔滞掺宠篡纹钳踝叽噜剪稚橘蚂蚁桃励戾澄疮轶婊蔑噪绌悚颁兹谒腋耙丬俄烤蒸炙液厥络肾症搅懵胱奄鳍壳喋撤页挠丫纭统卤皂忄粥蘸缴炕锯汝浆拄懿峦绑逮蒲鸠阙脘咚狯洽跋勘坑辆韦供娓魇竞浴缨滂沱虐镔昧牺牲秦寨塌狸赠赃箕胛脐酣扩舟斫攒框悯拷践潸怼悭莆偕阑酩酊乜袄矍铄崇抡辔款宴奢甥惺忪逛票掂帷臼篆墨楷孰憧卦姻篾蜗慷卉簇湮庆惠陌障铭润梢砚桐吕蕤凰遑贩冶俚淹舱码簪篙缆驶捺巩阎寓癖鹏浊喁躯瞻铠邦唔拗萝磁嚏诊灸嗄需锚阂兰棚匣鸽鹿茸糖饯贡萍逖皿旅琥珀冽犀葡萄虏匈奴粱禹藤翡绫柿琉璃螺樊哙盾镂斓檀咀咂咸篷球巫苓麝湍航啮愫侦冈菏幡扛崎岖枣睫愆篓瘤赋倨拼曙货罴趾帆腻焕瘴蛊拊聘蜈蚣蜘蛛哨踞蠕蛭吮绷蟾蜍胭艄舵咋瞄芥钹眇鳅垓岛佯嘀辚恚莠科髯蛟鲸沼剿鄱妞遄戛臆昆仑谭帜妾絮迪﹒涯侏塑蟠搀衲汹渠吆惫咛偎爸嘎莺吻仞邑盲嫂域酬棘庞皓赘届啜惘鸩澎湃摩楞谛晤梵辅佐靖钤阕谕育泯鸾铃憩酌睥锏撅革乙墟椽麦桥蹚芙蓉蝗撮缛藓蜿蜒笙堤梅署镶植孜琅咪奘焰暑京柯骊弈薪姥麓媪沁档企旭阖韩佚敞僭符遽裴卿恣磔枰簸姗悼伫弛聋奚柜姬暧遐钥匙轧碑锈枢隘铐镣焚纶褪煨潦怅渺缜贮捱澡惆鲍薛贰辖擞萌佞撵荐彀队麾葵噬虬尉馁縻唧泓绎嗦淬炷蹒跚喳绢浇诨昼晖萼啧蔬咤佣邓诿撺彷徨踽兢喽姨嚎槐瓮鳖杓荏暾霭馒涣璧昵磬忏镯蟋蟀袈裟剌鲤怫债蒿枭癞挞牧审簧剁冕窑倡冀销匿孱噎鸷儇扈咿坪襄购吶偃佬堡垒弭填膺簿盐朔缸氛笋挢歼蛰埒矢谑辄颖嚣驽魏雌馨疽俦溃忝畴炬缔曼缪膜漾桀骜嫣谀釜毋饵飕闵渝荼协攘吏蝼叟踩皑崆峒您婢衽瞠缥缈郭崛疆胞诽谤蹇粟栏轨冉赂厘硫磺硝娈稼毡姜愣廉猩闸彪颂呯颟顸壤玫瑰孕牡潞殒瞳皎睪玷侈憋蓓蕾屣畿壑怂恿宥徇咫掬祭翳皋圭玑搧髻猬瞩螫妩鹄喙俨讧戎谄锻岱廪伥樱惚缅煦隽弊汇芜妮烩鹗杏猱嗥叵溶匡呷悖辕摄寇垆璋沦券歃恸芬茁芽羚拧捆揩侣鲠痣崩啕皈售谶阉醮妁咧驿奁哒磷螳螂舀暨秩厦擎隶殚亨霖疙瘩缒梗樵镗唢铙谏译帔秾怏政漩涡社舆黜○版阀皖眯塾疸掰蹦瑞邮垃圾墁棠租殡茵汽敦疹楠翰杵玻拌淘惦缄础苑税僚伧厂鲇髦侩俭欧拴轱辘徐矿叼兮嗝艇蜻蜓梆诟拯宙汪鞠倭赁甭辗叭洼憨库鬈嗨址桄幌扔嬉褂荸荠晾蚤跺鼬勋蛆腴辽沈粹筝茴饺啤髈肪啬囔橱槟咖啡橙垛攥嘬藕饼妯娌渣撂滓豢酝傀儡萦鹊捂茉莉廓颧殃雏蘑宪饷耶稣痢痧榫嘁苹蹭唰葱苞菊葩薯秧蒜涝锹哏荞摹烙漱阮犄碴炖?幺曹舔型茄镰沤储淤柩募褫捎跤楔裱稠鹞衬稿秒豌褒刹菱鹭烽哆沏抠掐膆滤噔猖鹦鹉颅盔饽啃褊垄趴榜洲恬衔垣墩笺榭蝈邸黛竦奎噹辫哔亚姚踵筛稷诮涸蕊绩雍涮蹿卯蹂躏苕褡裢蟆墅刨掖囤妃莱坞坯隍讣浒驸磅刊莎逻辑秫秸搡签绒毯腌噱谿婶嘣垅糠喒涤币黩咏煽榨舰咨乩蓇葖葚糯啵笸渍溉悌凯徽栋椿勺蛤蜊筐酥瓤隅茗竿菠矾椒湾衩芍淖邋遢藻褶碾刽遛蔻蚨瞭幛叠盂裔膊痈橡袁婪冯栅舂谥盥贬飓嘹壕璞鳝唪瘸饲膨呱镀錾獭瓢貂玛韬漪嗑诓镑删缉纺苇禧蔽瑙赈渌靛泳蜇皌戗骆炊篱笆鞑烬啾尧舜秆苛啭娥姘蛔冢赒唁焙脯纽痫疟谍饬呐椭罣颔桨麸擀轳畦韭痱灼孵综榆蚯蚓茔挎暹港搌裆惰疵绺璺锃茬耷笤忱黏拽吭蔗坷仨孀孬龛捅噌齉茨浃濒潍
 楼主| 发表于 2005-7-18 01:38:33 | 显示全部楼层

在北大中文论坛上的讨论2

有女同车:

这是小可杜撰的一篇小说(繁体版),总字数(不包括标点符号)还不到10万,但用字量也超过了3000,可以想像一部100万字左右的长篇小说怎么可能用2000左右个字就搞得掂!!
J:\Studio\著述\朱、陈等.txt 98517

QUOTE:
Total: 98517glyphs and 3075 kinds of glyph
楔子
一二第章自暴弃派三成見和新發現雨四初戀節五雪霽天晴朗节徐州古豐縣有村曰朱陳去百餘里桑麻青氛氲機梭聲札牛驢走紜女汲澗中水男采山上薪遠官事少深人俗淳財不行商丁入軍家守業頭白出門生為之民死塵田老與幼相何欣唯兩姓世婚姻親疏居族長游群黄鷄酒歡會隔旬者彆嫁娶先近鄰葬墳墓多繞既安苦形神所以夀考往玄孫我禮義鄉小孤且貧徒學辨是非只取辛勤法貴名教士重冠此桎梏信大謬十嵗解讀書能屬文舉秀才諫臣下妻累君恩承國望肖身憶昨旅迨今春舟適楚羸馬經秦晝饑色夜寢無魂東西暫住來若浮雲離亂失故骨肉散分江南北各平終日逝年聞朝憂卧至暮夕哭坐達晨悲火焼心曲愁霜侵鬢根如羡易這首寫的本詩對那清恬淡其樂融桃源般景象向己顛沛勞充滿患前半感傷種超然觀怡得活態度曾很令可特地翻閲量關史志獻遺憾并没找到任隻字記載于油而述産了懷疑排遣鬱結情杜撰麽個在呢因掌握資料限僉同問知甚淺陋存否敢冒昧斷言尚乞海内方啓件實就篇説講跟絶點乾連想用證明吧話校組織看場電影後還早夥姑娘們稀拉倒樹猢猻漫遍野逃竄喧囂擾攘好熱粥灶台慢消停過院廣幾賴着摟肩挎背嘀咕研究些什鬼道楣他晃悠站欄杆傻腦張要伴談窮唬通覺裏滋味雖做處完鐘都快賣呆兒也忘登午陽光暖洋照剛洗蓬松又癢膩怪舒坦打算朋友戲廳幣汗癮却改變主意踱邊靠公共厠角落車反騎開條挺寬綽正當晚交低榖時候輛蹬留左右朵零彩閑湖難永花翎鴨順微風仿佛隨波漂流夾原垂柳楊絮飛舞惹討厭閙葉喬木傳染病借引給伐栽矮趴灌株叫常圖館喜絲拂頂剩眼秃路媚秋刺間隙温煩躁口假思索拐幸旁槐總躲劫嘴念叨胡京街送理迹漢唐座灰突圈密宗塔園玩次様進跑瞻仰回模拿加印已越糊塗耳竟起膾炙讓蕩雙槳旋律船推浪面映美麗周環緑紅墻禁哼唱句器咋恁倫類位叔河廊吹嗩呐瞥驚奇熟悉凘孩班她畢另高認糟糕透指恐怕更識刻但從扭錛涌怎招呼害恰辭便偏巧轉眉笑喊唤嚇激靈忙陪哈你窘該把圓啊放溜碰呵課嗎嗯霸王啥咱星期露狡黠容拍臉八穩漾漣漪似紋體委符冰峰手叉腰藏凝聚翹眯瞎呀師傅喇叭聽像每毛沁硬憋裝忽哪嘿勁攏羞答比衝雍瞅噢仍帶受即再應乎焉塊植物搭嫌太羅嗦氣稍耐悻步攥銀塑紙包底細粗扎粉兮舍净核計芝爛接觸滴真副持膽例外况桌團支燁痴迷偷頰准胳膊膀釋欺聖誕卡片撕碎托妄仔幻赫奪目除工作收臨按慣集挽救鼻梁買帳扯最逼急伊斯蘭腮咬牙切齒嘻悔皮膚歐巴始揮凶括漸題空污濁室莫妙選皙被泄它吃飯功夫欠掏肆宣揚血搶嘩啦扔踩脚啼寒帖草繼續睛式倆辮愛穿衣裳緣摽科或習糗添醋告訴陌睬仗摸質琢磨果系韵搜腸刮肚普擲駭耗筋攢動擠烏七款貨占奈津司射撃拼含畫碩醉價泡苞米語差燈拔蠟基敵怔隱约掃興致怏冽吸穢醒月輪值代詞未必較騰拾擺具黑板愣術溘履蟲螅菌藻軟等數品瓜菠蘿香蕉級蘑菇整够筆彎綫弧脱蝌蚪咧端幅龜癩蛤蟆禽獸瞬恍悟咳忍瞪磕伸繽紛敏捷臂抖優軌斜棚速降陣朔飄摇則直棱噔撞輕響緊架强盗巢齊摞嚴性誰幫窗户操黴抽搗笤帚撣土抬概擦全獨保管抓撮垃圾瞧擱錯由驀澌側异層眸霧薄石鋪預制咚陰霾鼠尾須誇爪紫蛇吐議盤纏布挨碼蜘蛛蟑螂蚯蚓蚊蜈蚣顆痘潔柔嫩顔痣輝茶唇呈廓晰投移拇食捏號狀探戰嗑千瘡孔插破舊房屋遭軋殘骸川息販揣腹注蟊賊瞄銬框鏡頗惜途坑凹凸陷積歸宿表嫣脆撇抿翼遞咽勢運足坪撒腿烟蹽定嘔毒冷壓鄙夷毯趕錐玻璃魚缸典窪敲堆劃宇丹鳳橙藍服精稱馮翔客徑藤椅餠駱駝怹您诶瘋屁祟躉逮懶哦媽爸姥政治卷案喝哇店俺拎瓶鍋菜市鹹礦造哥犢奶壺蓋猫梆九李閨材彪悍尤胸脯雄壯良諢湍迭蝎虎宫混毁狠攮刀癟朽顯音猪鴉横挑竪諧爺欲求茬録供恨報仇鐵局刑犯領導挂疾萬錢醫藥費私檔輩爐煮遲弟咩抱捱熊攻隊列育訓駡哄薅脖吵付圍踹扁饒威福宜估勸創袋疼願曠拃默怨嗆立攝辦監視遥控濫壁衛兿員抄統試緩末沙兵武屯糧備濃劍弩驗省及銜謀績評職夏幃搏亮裉庭力洪滚衿堂鼓争鳴殺陸乖詭休踢球技鋒爆缺防命奔追沿趟箭揀毫斥糾股猛佳兀黏矻嗤摔狗啃泥猝煞咯嘣慘額涔芭蕾演姿務舌詢扶脾責示弱譏摘笨勵振刹閘痛嗓呻吟鎮輸養阿肇蹲察慰匝怒危哧噴珠綳齦枚洞使耽復罪擔許賽抑頓挫俱厲鍛煉慈誠懇肅升折鈴溢練杠餛飩置嘁嚓論霈霖參化吴諒凑補助孝敬利段慮合提免配噪止短延營沸聾啞秩序僵締决償嗷喪茄緘英頑陡增維極賈琨駕迎綿羊壞聊韓界杯盡换勾趁挪靖頦苶沫奮嗡减涓匯汪甘昂將皇酣暢淋漓套沉俾倪揭謎蔣沈某孜埋茅榜席均智單滑逐肌克撩簾瞳勉佩嘰捂吭莊穆腔屏傾窣喘芒焊槍焰灼針巨調嘲衆炸暈略寜肯妒嫉屎樓森喉嚨凛憐憫替跳泰顫編穴覷嗒鞋嘶竭砰悶邪涉縮拆弄規矩閡遇犀霎噤顧賞俊彦哩熄雀唼喋幕逗拳捶疲斂溝壑縱童奏效静撑嘛熬珍番啪尖縷洇濕粘禍姐咣闖汹闥跌訝退倚茫悚嘮嬉辯擰凄嘆咒確劉炫耀窺格蔓縫拽鬥潑碳素歷慕熾踏碑裂紀狼狽奸曹斌暗聰曉盯誤批劣搞侯慌戳粲栖鳥驟獵晌頽蛋褲兜枝掉窟窿柴束庫雕俠侣閉萎咀嚼殊寂寥竇泛澀甜蜜寡虚魄寶戈玲裹乃秘蔔猜臭丫粑肥咂嗨烈陵串謊附拄訕涎趣賀竹襟撲兄蛾促嶠嗔拱互嫗礎奚挖賭爬展恃凌忌憚頁梅墨叙希寓届襲謅傘炭待程構嘟噥抨漏閃訛檢冤努鑽籍弘懈訐吩咐厚拈甩署猾部迂腐捺妹懂查固析父母吞翅鱗蝴蝶昆警咪謡鮮伍惡妖懼翩愚梯曖依鑰匙勇屈逞睦枉蒙耻蒜皺標倘率逛册螞蟻擋櫃爹筒糞忐忑竊睡誓違諱尷尬艶納瑣愧凡賢淑矜訥厢咫尺涯份肘渦鷹惋杲刷幌駐階隷肴六猶豫狹窄腼腆羹舀湯潤措際兼炒吾據測棋絆純娃蒼綹痕瞼凳征歪筷簍豆芽兔劁胃謝掩護閹辣椒蒯勺扣掰唏嚕攪汁濺迸碗賠哎瘦啷撂飽撸劈箸搦燜拌餐巾抹哽堵籠偶衫凉愉捧伏爾棵瞟梢寞匪蔫嘍楞龍躺邦篩糠覆妃困城挣軀殻霄境棟荒蹭爿寄予聆皤夌蓮睫扇翕胎搬礙呱撓革彈簧銹糙擹摩挲盒拙鋼蹂躪械廠箋咦隼爍咄詡罕戛歇罩峻轄尋鄭脊拜揍腫霰粒惚遂歉彰雌嶙峋胖哨籌抗渾唧慨旱冬贏彌懊惱揉袖呸堅丢封牢騷址郵票惦描獄嘗笆籬爽祝惶ㄙ謂廢蠻仙搧喲滅嚷齁轟隆雷擂銅逸霓阻携雜飾金浩久魅夢魘挾諾曼德培摧杈咔皆叠嘘盆瀑忠睹踮鎖銷潮貼避漿檐淘亦亡敗網挷蜉蚍撼稽酸眨秤彟唉鈾鏈漉妞虧羽鴿絨瘸崽窩悄乳奬劑噌襯孕婦臓綉凰糖央濤枯乘季炮拒淫斑斕脹婉蹈酷霹靂瓣霞瑞靄肺吼裊娜薰陶臆歌躍粱飴黯敞祥嘉浸猴搔噷吱紐懌膝瓦砸聯汽險怯啄罷喂塞善訊兢簇撥擬區鍵捅諸損臼篷狂鉚遜膠綴牽謳盔甲匹蟈邁揪靴披蹚瓏帽朧寸駑泅建舫畔踉蹌攙鰍倏脉耍獅葫蘆井渠澤叮嚀囑齡滂沱遮惑嗽贜臊撤瓢軲轆修箍俯凍磚惴堪拖桶汰敷棉黵鈎賤捻帕拭璺幠睁樞赤裸籲抵誘顱頸床跪溴箱囊鵝愈縴膨沾磁撫滲烘嗅憑浴池澡烤慶享扮橱型闊樸貌腥灘踪骼液請倦淌艱塘蛙雁漆朦幽熠呃碦崴岔餓颼枕玉髓專盼瞞弓繁蹙涕瑟闌珊昏驅緒繪雯裘掐泪澇灾巷傍震泗擤藉恭覓濘曬疤喀睏遛穹煳慚捉胞砍姨呲氓蹦訶涮唄介嗬宋厨設傲華嫂惺忪曦戧唾旮旯尿搓敨澆梗截帆鋁坤腕轂扳撈淹扛瓊卑崗嵌苗焕勃慪元鈔襖催黛恢莓褪贈紡檩蔭逢馨蘇繩彼岸泓鰻墜衰趺僧負豈烙涣緋槁戴紗滯坼韁蝸跋葡萄抛恣吻貪嬰吮杵牌哀軒嘎赦狻猊剪魔颚繹筝墮駁煦柱鏤鑄舅亭碌禪賺戚晶渴宙冥召燙稚燥瀕獲燼暑潭煌燦籙賜恒紹騙偎詳赑屭迫銘甭鶴焚琴贔哺蹄騾懸躊躇蜷呶範著踐簡窒膛返駿馳眩吉嗚匣柄跨昵蹊蹺倉蜂陀螺柏碴琳琅島橋障忖釘劇漠屑耙蹅剃唁紓眺孑踽噩抻邀宵炊嘈坎坷擁慷扒鑣誆褶鴛鴦遁憤餿婆郭牚墊症粹怵摺捋啤竅芬漱診鹽垢嵐社攬婪臀綻舔撿佔蛐蝗秫秆垛焦氈撅搋摑鍬攔悦欽蠢茂畎畝躑躅施盛倡棍旨榴裙掬貝疙瘩憎競慧榮譽衡殷權禦懲戒醜貫盈忭莉諄耿伺旦寵辱偉勝埃乩鋸掂掄倀跩沮踝煽域項趨燃砝掘瘴匆墩熔岩肢趔趄槽蹾藴涵諷碓腎腺泌兑壘腑蕭沏麥茉弛趿茸瑩剔淇凙脂犁掊壤腴沃藕泳距襪掀奉膜蠶蜕溶臍肝墾籃侍癱痪謹慎崩潰峬丈卵跤尸熙秒幀噙綁捆秸楂輦殖版農熘臃詫絞煎餜屉鈞艙矛盾僞怠頜縹緲宰梳渣霆眈牤齋禾飲茹葷褥窸峙嘯兹鉛栗琥珀鰐摻翳尊甦稼穡泉埂叢蘢葱蒿博妍碧妝裁魁巍皂帝蚩伯魃蟄龐瀾藹彤旗遼林判割斃誦賓毋申簌毅贖蘸噎搐罸痙攣紊蛔稻鹿蹁躚捕橡乜僭殲淪鋭琵琶翁聳摁綺罐贊塌擎哆瀉俄頃拘檑仁播淵盎猿澄轍闃坊閭

2005-7-6 03:01 #8

有女同车:

因我手头没有采用gb18320向上兼容的大字符集的电子版古籍,所以统计范围只能局限于现代通俗文学类。即便是在这么窄的范围内4500字的标准也行不通:

QUOTE:
D:\Informations\Oriental Phiology\平凡的世界用字.txt 3687
D:\Informations\Oriental Phiology\笑、四用字.txt 4230(
K:\小閬闤\Moderne chinesische Literatur\Wang Siaopo\王小波_黄金时代.txt 31799
K:\小閬闤\Moderne chinesische Literatur\Wang Siaopo\王小波_白银时代.txt 36788
K:\小閬闤\Moderne chinesische Literatur\Wang Scoak\Tiere sind brutal\王朔_动物凶猛.txt 47837
K:\小閬闤\Moderne chinesische Literatur\Wang Scoak\Mal nach herzenslust\王朔_过把瘾就死.txt 54155
K:\小閬闤\Moderne chinesische Literatur\Mak Ngien\檀香刑.txt 256416
K:\小閬闤\Laws\中华人民共和国刑法.txt 56087
K:\小閬闤\Religionen &Pilosophie\Bible(Hoho)\hgb.txt 992468(基督教圣经)
K:\小閬闤\Religionen &Pilosophie\全球人文审思.txt 107277(姚国华著)

Total: 1590744glyphs and 4935 kinds of glyph
通共 11部书 记 3061796字,所用汉字 4935个

QUOTE:
"班氏一直主张,1500、2500、3500以上,分别是脱盲级(读报)、知识分子级(包括数学、化学、工程力学教授)、文史学者级的识字要求。 这是符合社会现实的,是科学合理的。

------真不明白楼主2500+ 适用于知识分子级(包括学、化学、工程力学教授)3500+适用于文史学者级的论断是根据什么得出的。

2005-7-6 04:00 #9

八亿农民:
支持班门斧先生的平民主义、实用主义主张.
中国人从来没有平民主义思想,致无力启民智、释民力,久之民、国均弱西方人则反之用句与时俱进的话,班先生的想法确实是代表了最广大人民的根本利益和先进的生产力,至于先进文化,我向来不认为中国有什么先进的文化,只是在具体字数上,我觉得可能稍少了些。统计字数不能只考虑人文小说之类,报章、科技文章、古文、学术论文、大中小学课程等均要予以考虑,这样可能要稍稍比班先生主张的多一些,但不会多很多 汉字改革有利于传播科技知识,提高全民文化水平。最理想的汉字是方块意音汉字。
2005-7-6 09:36 #10

班门斧:
非常感谢有女同车。我正在组稿答你。
请告知我,你所统计的那11部书中,哪些是繁体版的?再谢!
2005-7-6 09:36 #11

b]皮扎诺:
我也先给楼主叫个倒好再来细读。
实在看不下去,先给楼主叫个倒好再来细读。

甭说2500+,就算5000+一走进医院的药房就成了文盲了,还谈什么读医学?更甭谈什么中国人要拿什么诺贝尔医学奖了,如果真的要中国人都2500+,那中国人永远也别想什么诺贝尔了,其它的文学,自然科学学科如果也都2500+那么中国的学术界早已崩溃.我个人甚至认为<康熙字典>的10000+是汉语的一大倒退,汉语的博大精深从此就丢了.微软公司的汉语字库达到十几万就说明微软对汉语的观点立场比咱们中国人自己还有端正.

QUOTE:
输入法比不上手中的笔——造字!

前些日子,本人靠特殊的个人关系得以一睹了一部乡里一个“旺族”的家符,是明代王氏父子进士的家志。家符中记载了王氏家族的子孙分支流向,还记载了家族相关的很多地方大事,是地方人文史的重要材料。但奇怪的是家符里的很多字本人不认识,用五笔在电脑中输入也没法找到这些字。后来经王氏的后人解释才明白文中的意思。

原来,这些陌生字大都是以口字为偏旁,右边则以方言中的读音相似的字而构成,有时似白读音,有时似文读音,有时象普通话读音。借助对方言(本人的母语是闽南方言的一支)的熟悉,终于能勉强阅读。当时本人的感觉是:原来父子进士的后人文字使用能力这么差!

近日由于一位网友叫我帮他写方言原创歌词,大感为难!忽然想到王氏家符中的文字,于是模仿着写。纸上写得好好的,可是要发送给网友却又大感为难——键盘根本没办法输入!望着手中的笔和手下的键盘,我不由大为兴叹——现代高科技的产物键盘竟然比不上几千年前的笔!

后来跟北大的网友讨论语言文字时才感触到,原来汉语的文字是活的。不单是王氏的后人,全中国的其它地方几千年来都广泛存在着相似的汉语文字使用情况,如粤语中的“咗”、“嘢”之类。这大概是由于汉语的俚语十分丰富和灵活,远远超出汉语万多个基本汉字所能表达的范围,万多个基本汉字作为官方语言文字代表了汉语的基础和精华。然而汉语不单单是官方语言和上流社会的语言,汉语同时还是生活语言,各地方的各种俚语、俗话、土话等大大地丰富了中华民族对语言的使用,它们同样也对伟大的华夏文明做出了它自己的贡献!而这些俚语、俗话、土话等并不是没有文字的语言成分,并不是只有靠嘴巴才能交流的低级语言成分,它们同样是汉语的文字中的成员之一。虽然不是整个中国的广泛地通用,但是,对语音相通的人来说,稍微思索一下就能轻易地阅读,这正是汉语伟大的地方之一。

但是,现在汉语的输入法没有体现汉语汉字的这个思想,因而输入法比不上手中的笔——输入法是死的,笔是活的,汉字是活的!

在网上经常会看到一些如同楼主的主张,但这些主张十分危险,如果这些主张得到贯彻,则汉语成为纯粹的低级语言矣!

楼主的主张实际上涉及一个核心问题:语言的基本功能
语言的基本功能有两个,就是思维和交流.其中思维才是第一位的,而交流不过是第二位的,交流的前提首先是意思要清楚才能交流的清楚,2500+连个意思都表达不清楚还谈什么交流?网上(包括北大的一些学者)经常强调语言的交流功能而完全忽视了思维的功能,这是对语言的基本功能的严重歪曲!

<思维和语言的关系>:
http://www.pkucn.com/viewthread. ... 1&highlight=100

[ Last edited by 皮扎诺 on 2005-7-6 at 11:28 ]

陪儿子散步比上网有意义多了!
http://www.pkucn.com/viewthread.php?tid=134401&extra=page%3D1
2005-7-6 11:03 #12

有女同车:
QUOTE:
Originally posted by 班门斧 at 2005-7-6 09:36
非常感谢有女同车。我正在组稿答你。
请告知我,你所统计的那11部书中,哪些是繁体版的?再谢!

启禀楼主,都是简体版的。众所周知的,受输入法和OCR软件功能的限制,网上的电子书大多数用字范围都局限在GB2312的6000余字内,好多“超标”的字都以类似“囗+峦=圞”的拼合偏旁的方法録入,我所统计的书册中亦不排除有这样的字,因软件没有相应的功能故对这样的字只能视而不见。

其中除了BIBLE、刑法我基本都通读过,明显的错字大致都经过我的刊改,不过没有做过跟原书的逐字校对,可靠程度大体如此。
2005-7-6 15:25 #13

班门斧:
谢谢有女同车的解释,你提供的数据很重要。
圣经是译本、古籍、史诗,面对特殊群体,其性质不符合我们所讨论的问题。你可以提供其余十部书的统计数据吗?(语料总字数,使用字数)谢谢!

顺便答复皮扎诺先生:
1、原想不答复你的,因为你我立场差距太大了。
2、你看不下去,是因为你还没看明白。
3、我们不是在研究药房,而是探讨“大众汉语”,你先弄清楚这点。
4、就算是一不小心逛进了药房,你也吓唬不了我,大不了在“班氏限用汉字”里拿出三五百个生僻字就撑死了。这个反例动摇不了“当用汉字”的意义和地位。
5、胸怀祖国,放眼世界,你知道现在英语与汉语、英文化与汉文化是什么战略形势吗?谁持彩练当空舞?“艰涩难懂”的定论会导致什么后果?
6、“班氏限用汉字”是做什么用的?
2005-7-6 17:02 #14

有女同车:
QUOTE:
Originally posted by 班门斧 at 2005-7-6 17:02
谢谢有女同车的解释,你提供的数据很重要。
圣经是译本、古籍、史诗,面对特殊群体,其性质不符合我们所讨论的问题。你可以提供其余十部书的统计数据吗?(语料总字数,使用字数)谢谢!

顺便答复皮扎诺先生 ...

D:\Informations\Oriental Phiology\平凡的世界用字.txt 3687
D:\Informations\Oriental Phiology\笑、四用字.txt 4230
K:\小閬闤\Moderne chinesische Literatur\Wang Siaopo\王小波_黄金时代.txt 31799
K:\小閬闤\Moderne chinesische Literatur\Wang Siaopo\王小波_白银时代.txt 36788
K:\小閬闤\Moderne chinesische Literatur\Wang Scoak\Tiere sind brutal\王朔_动物凶猛.txt 47837
K:\小閬闤\Moderne chinesische Literatur\Wang Scoak\Mal nach herzenslust\王朔_过把瘾就死.txt 54155
K:\小閬闤\Moderne chinesische Literatur\Mak Ngien\檀香刑.txt 256416
K:\小閬闤\Laws\中华人民共和国刑法.txt 56087
K:\小閬闤\Religionen &Pilosophie\全球人文审思.txt 107277

Total: 598276glyphs and 4798 kinds of glyph
共2069382字,用字4798个左右.
附件: 字数统计.rar (27.26 K)
该附件被下载次数 2

2005-7-6 17:32 #15
 楼主| 发表于 2005-7-18 01:40:20 | 显示全部楼层

在北大中文论坛上的讨论3

班门斧:
1、
笑傲江湖(上)累计字数 425145
笑傲江湖(下)累计字数 416396
上下册两本书累计字数84万,用字3792个。
Total: 841541glyphs and 3792 kinds of glyph

2、
笑傲江湖(上)累计字数 425145
笑傲江湖(下)累计字数 416396
四世同堂 累计字数 637428

三本书累计字数148万,用字4224个。
Total: 1478969glyphs and 4224 kinds of glyph

3、
王小波_黄金时代 累计字数 31799
王小波_白银时代 累计字数 36788
王朔_动物凶猛 累计字数 47837
王朔_过把瘾就死 累计字数 54155
(作者:莫言)檀香刑 累计字数 256416
中华人民共和国刑法 累计字数 56087
(姚国华著)全球人文审思 累计字数 107277

七部书累计字数60万,用字4798个
Total: 598276glyphs and 4798 kinds of glyph

4、平凡的世界(用字 3687)

5、王小波_黄金时代 累计字数 31799
王小波_白银时代 累计字数 36788
王朔_动物凶猛 累计字数 47837
王朔_过把瘾就死 累计字数 54155
檀香刑 累计字数 256416
中华人民共和国刑法 累计字数 56087
基督教圣经Bible 累计字数992468
(姚国华著)全球人文审思 累计字数 107277

八部书累计字数 160万,用字 4935个
Total: 1590744glyphs and 4935 kinds of glyph

以上数据根据有女同车提供的资料整理(如有错漏请指正)。
从这些数据我们可以得出结论,当用汉字的数量应该规定在4200至4800范围内。不同行业、不同专业、不同爱好的人可以在限用汉字中另外掌握几十个特需字。

4500个汉字作为当用汉字是对社会总体而言的。对于特定的个体,例如数学教授需要2500+字,这是指低标准要求,是有一定依据的(当然你多识一些字更好)。我本人就是工程师、大学教师,有一定感性体会。另外,整整一套高等数学书的用字也就一千多,2500+字对于一个数学教授(如陈景润之类)看看报纸了解社会信息,搞数学科研、教课、写数学论文,谁能说不行?(“行不行”和“更好”是两个不同的标准)。单从用字量来说,化学教授比数学教授只要求多几十个字。现实中的数学教授一般都认识很多字,但这不等于搞数学研究和教数学课一定要用很多字。

2005-7-7 16:46 #16

采采卷耳:
給[八億農民]:
您不認爲中國有先進文化是您的自由,但是您有沒有想過,美國政府從來沒給美國人下“當用生詞表”。

當然,如果您覺得保留天皇的日本、獨裁羸弱的朝鮮、大病初愈的越南三個國家都比美國民主、自由、講權利思想,這也是您的自由嘛。

還有,“常用”和“當用”是兩個概念。請不要從日本政府的角度考慮漢字。

“使用漢字,則我日本國永遠無法追隨現代文明”。這是日本郵政之父前島密說過的,不幸得很,日本沒有廢除漢字,也沒有亡國。除了娼妓比較多之外,似乎沒見日本如何追不上現代文明。

[ Last edited by 采采卷耳 on 2005-7-7 at 17:15 ]
2005-7-7 17:14 #17

不咸山:

QUOTE:
Originally posted by 班门斧 at 2005-7-7 16:46
1、
笑傲江湖(上)累计字数 425145
笑傲江湖(下)累计字数 416396

上下册两本书累计字数84万,用字3792个。
Total: 841541glyphs and 3792 kinds of glyph

2、
笑傲江湖(上)累计字数 425145
笑傲 ...


1、上下册两本书累计字数84万,用字3792个。
2、三本书累计字数148万,用字4224个。
3、七部书累计字数60万,用字4798个
4、平凡的世界(用字 3687)
5、八部书累计字数 160万,用字 4935个
不只这些字的交集是多少,并集是多少?
看来把常用字字数设定为5000较为合适。超出这5000的汉字应该标注拼音。
2005-7-8 08:57 #18

皮扎诺:
QUOTE:
Originally posted by 不咸山 at 2005-7-8 08:57

1、上下册两本书累计字数84万,用字3792个。
2、三本书累计字数148万,用字4224个。
3、七部书累计字数60万,用字4798个
4、平凡的世界(用字 3687)
5、八部书累计字数 160万,用字 4935个
不只这些字的交集是多少,并集是多少?
看来把常用字字数设定为5000较为合适。超出这5000的汉字应该标注拼音。 ...

由于每个人的知识结构不同并且每个人驾御自己的知识能力不同,只统计一个作者则存在作者个人常用字与大众常用字有差别的问题,必须统计各个领域的多个作者的常用字字数并且还要比较这些作者的个人常用字是否都相同,然后才能确定有科学可信性的大众常用字字数。

[ Last edited by 皮扎诺 on 2005-7-8 at 12:50 ]
2005-7-8 12:45 #19

班门斧:
八部书,四个作者加上其中非个人的刑法和圣经,累计字数 160万,合共用字 4935个,已经不存在多少所谓个人常用字因素的偏差了。一个人的常用字偏好,只影响常用字在他自己的作品里出现的次数的多寡,对用字统计没有影响。八部书、四个作者、六个来源,任何字只要出现一次就会被统计在用字量里面,因此,可以说其结果基本反映了社会实际用字量。剔除其中约135个生僻字(认为它包含了百多个生僻字不算过分吧)。因此,我认定“当用汉字”应在4800以下,其余的归入“限用汉字”范围。特别提示,“限用汉字”有其本身的使用价值,我们无需担忧它们会被浪费了。

BTW:皮先生提出的:“只统计一个作者则存在作者个人常用字与大众常用字有差别的问题“。这里存在着一个误会,这个问题只对“字频”的分布状态有较大影响,而对用字量影响甚微。再合计六个作者(来源)八部大书之后,其偏差是微乎其微的。有兴趣者当然可以扫描多几个作者多几本书试试,但我认为在确定宏观数量而不是具体选字的阶段,没有那个必要了。我说,对社会大众,囊括这八部书的所有字还嫌不够吗?

[ Last edited by 班门斧 on 2005-7-8 at 16:07 ]
2005-7-8 14:30 #20

有女同车:
来自 富拉尔基昂昂溪来的臊鞑子
随便写几个字,楼主看看有没有可能把它们从现代汉语中抹除

蹀躞(本壇某网友的网名即用此2字),螟蛉(有子)蜾蠃(负之),唼喋,娉婷,樗蒲,餶飿,饽饽,胪(列),(毁家)纾難,跏趺(盘腿打坐),徜徨,筚(路蓝缕),(箕)畚,鲲(之大不知幾千里也)……摶(扶摇直上),(其乐也)洩洩,(王)嚞(或喆),貔貅,饕餮,(暴)殄(天物),畛(域),閾(值电压),熵,沆瀣(一气),颉颃,沔(阳),褒(姒),殳书,波磔……
2005-7-9 01:22 #21

有女同车:
QUOTE:
Originally posted by 不咸山 at 2005-7-8 08:57

不只这些字的交集是多少,并集是多少?
看来把常用字字数设定为5000较为合适。超出这5000的汉字应该标注拼音。

差不多吧。黄、廖《现代汉语》中所附的“常用同韵字表”就收录了5060(折合成繁体字可能要多出数十字)个常用字,我从头至尾翻检过几次,以为具有大专以上学力者无论文理都应该完全掌握这些字——即做到会念、会用、会写。该表所收的方言字基本上都是为普通话所吸纳的字,在普通书刊上会经常出现的。这已经是最低的限度了,稍微拓宽一点阅读范围,这些字就不够用了。想获得较强健的阅读能力,应该在此基础上再认知1000左右个字——知道读音并熟悉最常用的義项——这样,宋明以来的白话文著作才能够从容应对,用不着千回百转地胡蒙和番番複複地查字典了。不过靠这点本钱来读古书还是显得蹇促了些,好在古代的经典文献多有剀切详明的注疏甚至集传,有点文言的根基再了解一些音韵的常识(以识切语)也能勉强周旋。

楼主的“当用”二字,偶是坚决反对的。对汉字应该进行整理和规范化(比如规定在出版物中用惭不用慙,用剃不用薙),而不应该限制,正如皮君所说,”汉字是活的“,同样汉语作为文字的根本更应该是活力充沛的,删减汉字已然不对,更不用说对语言进行人为的压缩了。

楼主的提议可以用作研制BASIC CHINESE /SIMPLE CHINESE(类似 BASIC ENGLISH/ VOA SIMPLE ENGLISH)的方针, 但那毕竟是辅助语言(AUXILIARY LANGUAGE),只能作为局部领域的一种工具,而不能取代自然语言本身。
2005-7-9 01:57 #22

不咸山:
QUOTE:
Originally posted by 有女同车 at 2005-7-9 01:22
随便写几个字,楼主看看有没有可能把它们从现代汉语中抹除

蹀躞(本壇某网友的网名即用此2字),螟蛉(有子)蜾蠃(负之),唼喋,娉婷,樗蒲,餶飿,饽饽,胪(列),(毁家)纾難,跏趺(盘腿打坐),徜徨, ...

这些字的构词能力都非常差,单纯从节省资源的角度考虑,是应该停止使用的。
日本有过这样的经验。推理小说一词来自日本,在日本原来也叫侦探小说,由于“侦”字的构词能力太差非废除,因而改“侦探小说”为“推理小说”。
但是这样也会带来许多问题,人们的习惯势力很强。

[ Last edited by 不咸山 on 2005-7-9 at 16:58 ]

2005-7-9 10:43 #23

不咸山:
QUOTE:
Originally posted by 有女同车 at 2005-7-9 01:57

差不多吧。黄、廖《现代汉语》中所附的“常用同韵字表”就收录了5060(折合成繁体字可能要多出数十字)个常用字,我从头至尾翻检过几次,以为具有大专以上学力者无论文理都应该完全掌握这些字——即做到会念、会 ...

有些字虽然构词能力不强,但使用频率非常高,比如“饽”字。在书面语中可以避免使用,但在口语中是没有约束力的,除非降口语为非法定语言,但是这又造成口语与书面语的脱节,重新造出文言文来。
“蹇促”这个词多数人不知道读音,用得也比较少。但如果你带头使用这个词,而很多人愿意附和也跟着频繁使用,那这个字又变成了常用字。
本人认为应该编制一个常用字表,建议而不是只许使用表内的字。这需要媒体首先要起带头作用,前一段,娈童案就是个例子。当然,如果把常用字表设定在5000字,”娈“字就 可能在常用字之内了。本人认为5000个汉字对人脑的记忆力来说还是能够承担的。
现在的有争议的还是个设定字数的问题,是3000还是5000为好。

2005-7-9 11:02 #24

采采卷耳:
漁撈——漁勞(新體字:漁労)
屍體——死體(新體字:死体)
預告——予告
埖(ごみ)——塵

這就是日語規定“當用漢字”的後果…………………………
2005-7-9 12:40 #25

皮扎诺:
QUOTE:
Originally posted by 不咸山 at 2005-7-9 10:43

这些词的构词能力都非常差,单从节省资源的角度考虑,是应该停止使用的。
日本有过这样的经验。推理小说一词来自日本,在日本原来也叫侦探小说,由于“侦”字的构词能力太差非废除,因而改“侦探小说”为“推理小说”。
但是这样也会带来许多问题,人们的习惯势力很强。

这恐怕不单单是“人们的习惯势力”问题,这恐怕还有语言的准确表达思想这个语言的最基本的要求问题,“侦探小说”和“推理小说”二者的内涵和外延本身就不一致,美国现在的就有灾难推理小说,如果硬把二者混而为一,则概念的歧义问题将无法解决,人们的思维将陷入混乱,意思都表达不清,交流如何能表达清楚?然则“节省文字资源”是为了牺牲中国人的思维能力么?

2005-7-9 17:08 #26

不咸山:
“侦探小说”也可以说成“探案小说”,但是会感觉像个初中生造的词。
英文也是这样,也经常出一些很生僻的词,一些太通俗易懂的词也不大被人们接受。

2005-7-9 18:30 #27

不咸山:
再说人们也需要词语有一些文采,过于通俗易懂会让人感觉太乏味。
2005-7-9 18:33 #28

皮扎诺:
QUOTE:
Originally posted by 不咸山 at 2005-7-9 18:33
再说人们也需要词语有一些文采,过于通俗易懂会让人感觉太乏味。

这也是需要占用常用字资源的一个方面.

2005-7-9 19:54 #29

班门斧:
冠冕堂皇的左派(做派)言论可以休矣。科学的学科研究要有一个量化的观念(我早前已展开了一个“量化语文”的系列研究)。
唐诗宋词不是越多越好,对不同的社会阶层要有不同的量值。普通人三五百首足够(一个非文人熟习超过五百首不是一个值得表扬的事,我称其为慢性自虐或不务正业。他们应该把更多的时间精力用到有利于老婆孩子或祖国民族的事情上去)。文史专业的人有六七百首足够。只有唐宋文学或唐宋史专业的人,才有可能要无穷深究下去。
同理,高中文史专业教师以上的文史人才,只占总人口的百分之一左右,而且他们不是社会的主流(请原谅,得罪了。我的意思是这个阶层的是非得失不及其他一些阶层的是非得失对社会、对历史发展的影响大。我不否认他们作为个人应该拥有的平等的政治经济权利)。他们自己可以对文史(包括奇难杂字)作深入研究,但我们(全社会)不能为难99%人口而去迁就他们这个1%。

笑傲江湖(上)
笑傲江湖(下)
四世同堂
平凡的世界
王小波_黄金时代
王小波_白银时代
王朔_动物凶猛
王朔_过把瘾就死
檀香刑
中华人民共和国刑法
基督教圣经Bible
(姚国华著)全球人文审思
对社会大众,谁敢说这十二本(部)书的文字还不够?谁敢说这批书文彩还不够?
这批书剔除一两百生僻字(不认识也没影响),总用字数也没超过五千!(大概4800吧)
历时千年的、逐奇斗难的腐朽文风应该铲除了。

[ Last edited by 班门斧 on 2005-7-10 at 01:15 ]

2005-7-10 00:29 #30

不咸山:
按你的意思是达到5000就够文彩了。
那3000够不够?

2005-7-10 01:11 #31

班门斧:
有4800字就可以够文彩了(具体够不够当然要看写者的功力,这里只谈可能性),而3000字就差些,这就是我的意思!!!
这是我多年的经验、主张,这也是有前面十几部书的统计数据作支持的。

[ Last edited by 班门斧 on 2005-7-10 at 01:25 ]
2005-7-10 01:23 #32

班门斧:
随着汉字大字库、大大字库、特大字库、超大字库的不断出现,汉语的敌人有了攻击、毁谤、排斥汉语汉字的把柄。我们自己阵营及友军也一直面对海量字库感觉理亏彷徨。

通过对“当用汉字”的论证,通过对金庸、老舍、路遥、王小波、王朔、莫言、姚国华(以及刑法和圣经)等一批作者的十几本书的统计,我们可以明确地宣告,现代汉语就是由不到5000字构成的。妄自尊大者和妄自鄙薄者都应该承认这个事实。

当用汉字不多,学习汉语不难。把真相告诉世界,为华裔树立信心,制定当用汉字规范,非常重要,非常紧迫。
[ Last edited by 班门斧 on 2005-7-10 at 02:14 ]
2005-7-10 02:11 #33

南蠻人:
規範字數, 不如規範字根數有意義

從學習的角度來看, 減少生冷字根(部件)和提高形聲字比例,
會比粗暴地限制總字數有意義得多.

[ Last edited by 南蠻人 on 2005-7-10 at 10:59 ]

口語文規範:
1.文讀鉛體,輕讀下標"。"
2.懶音借注音符號(不用→不ㄥ),連讀視作詞尾輕讀.
2005-7-10 10:58 #34

不咸山:
我觉得应该规范偏旁
2005-7-10 13:45 #35

有女同车
QUOTE:
Originally posted by 班门斧 at 2005-7-10 00:29
冠冕堂皇的左派(做派)言论可以休矣。科学的学科研究要有一个量化的观念(我早前已展开了一个“量化语文”的系列研究)。
唐诗宋词不是越多越好,对不同的社会阶层要有不同的量值。普通人三五百首足够(一个非文人熟习超过五百首不是一个值得表扬的事,我称其为慢性自虐或不务正业。他们应该把更多的时间精力用到有利于老婆孩子或祖国民族的事情上去)。文史专业的人有六七百首足够。只有唐宋文学或唐宋史专业的人,才有可能要无穷深究下去。


没想到楼主居然拿我的反证为自个儿张本,果然是个非同小可的辩才。
左派的头衔实在担当不起,若非得给自个儿划个成分的话,小弟应属右顷保守主义分子。量化偶不反对,问题量化不该等同于量体裁衣。针对不同的对象去量身定做本来是极高明的手法,可我们面对的不是个别人个别群体而是整个民族乃至全世界的现在和未来,谁能做出一件给全民族、全人类穿上还能无处不伏贴的“天衣”来呢?

“慢性自虐或不务正业”也不知是打哪儿说起的,什么叫“正业”?哪儿又是“邪业”了?人家燕赤霞说得好:“我自求我道”,人活着就图个称心适意,什么有利于老婆孩儿啦,国家民族啦,说那些冠冕堂皇的大道理指望着感动谁不成?世道沧桑、人寰棼乱,对人的个体而言“我”才是本位的。“我”的生命属于“我”自己,“我”的生活也理所应当地由“我”来安排。若“老婆孩儿“和“民族国家”跟”我“的心性和生命能够和谐共生则“我”为她们做事能获得快慰和平安,道德本乎天性并不是口号空喊出来的,若“我”无力“在红尘中找到合和的归宿,则”我“当然有理由为了自个儿抛弃红尘,或隐居山林(现在是不大可能了)或者道不行乘槎浮于海,或在万般无奈的情况下终结自己的生命,当然,若这个世界遗弃了”我“,”我“也可以与世界为敌。”我“就是”我“,谁拿”我“不当”我“看,或者想让”我“做不了”我“,摆明了就是跟”我“为难。呵呵,记住别把人不当人使,那样想的、说的、做的才能大体不错。

[ Last edited by 有女同车 on 2005-7-10 at 20:20 ]
2005-7-10 20:17 #36
 楼主| 发表于 2005-7-18 01:41:50 | 显示全部楼层

在北大中文论坛上的讨论4

yima:
统计资料在那摆着,可要说够或不够,永远也说不清楚。
但是,我们考虑到教育资源是有限的,那么,就不能说越多越好。
我国现法律定的义务教育是9年,那么,在这个教育阶段究竟应该掌握多少汉字,应该是有字表的,应该用法律来加以确定。
完成九年义务教育就是国家的标准人才。我们的法律条文当然应当让我们的标准人才无障碍的知晓,新闻当然应该让我们的标准人才能够认读……因此,超出标准字表的应该注音,必要的还应该加注释。

2005-7-11 00:04 #37

班门斧:
南蠻人网友说:“從學習的角度來看, 減少生冷字根(部件)和提高形聲字比例,
會比粗暴地限制總字數有意義得多.”班氏答:强形声化优化汉字是我正在进行的另外一项工程,当然我也认为是很有意义的,是与此同步进行的。但“班氏当用汉字和限用汉字规划”不是粗暴地限制总字数,而是有机地调控总字数,并且这个调控是遵从现代汉语的大量书籍语料的统计数据的,不是个人的主观臆断。就算社会历史上没有一个班门斧站出来,现代汉语也是在这4800汉字中运行的(辅之以特殊需要的限用汉字)。之所以要这4800当用汉字显式地规范出来,就是要击破敌方对汉字的嘲笑和否定,要己方及友邦树立汉字能学、汉字好学的信心,要杜绝半瓶子醋的人写纸条、写信、写文章、起名字故弄玄虚的胡作非为。人家众多大作家,大量的书籍、报刊、文件、法规都是运行在这4800字内,对那些半瓶子水的乱搞,我们并不能美其名为自由民主、百花齐放,那只能是烦人烦己、自欺欺人而已。

不咸山网友说:我觉得应该规范偏旁。班氏答:这也是一项有益的工作,我们及史美方案作者等等都在进行这个方面的探索。

特别感谢有女同车网友的大量帮助。班氏有时言辞略嫌张狂,并无恶意,请多包涵,专注文改,不及其余。有人慷慨赴义,有人归隐参禅;有人的生命仅仅属于自己,有人的热血奔腾于江河大海。这类话题不宜在这里多论。

2005-7-11 02:37 #38

皮扎诺:
QUOTE:
Originally posted by 班门斧 at 2005-7-11 02:37
...班氏有时言辞略嫌张狂,并无恶意,请多包涵,专注文改,不及其余。 ...

这不是“张狂”“不张狂”的问题,作为一个主张,特别是象楼主这样的涉及全体国民的而且似乎带有强制性要求(‘当用?<>‘常用’’)的主张,必须从多个方面去思考和阐述而不是简单的统计和理念,必须有令人信服的可行性分析,必须对相反的结果作出评估,楼主的主张甚至是还具有政治层面的东西,鉴于此,即使学术上完全有理也必须参考不同的呼声。
语言是一个复杂的东西,复杂到涉及人类活动的任何一个方面,它不是简单的三段式或统计所能概括,对手的观点也应该是自己思考的一部分,而不是简单的“左”和“右”的选择。

2005-7-13 02:19 #39

班门斧:
接受皮先生的这个意见,必须从多个方面去思考,包括对手的观点。

我已尽量参考、回应各种反对意见,还大量吸收对方的观点和统计资料,也按反对意见作了适当调整。但回看我自己的帖子,言辞是有些生硬,这方面要检讨改进。

理念得到统计数据的支持就接近了真理。请不要对统计数据表示出不尊重,除非你提供更准确、更全面的统计数据去影响、修改它。

不要试图将语言文字问题非政治化,语言文字问题从来就是一个国家民族的重大政治问题。英语的扩张和霸权本身就是一个严肃的国际政治问题。在经济角度,欧美的英语产业的收益比中国的任何行业(石油?钢铁?航运?)大得多。每一个家长都“正确地”认识到只有英语是升学、应聘、升职、出国的唯一有用语言之时,就是汉语灭亡之日(绝对不是危言耸听,这个逻辑关系简单得很),不会因为我们的胆小回避就可以漠视语言文字的政治色彩。

通过与各种不同意见者的讨论,我更加坚定、明确地认识到4800当用汉字是符合现代汉语现状的、是对现代汉语用字的科学合理的规划。值得再次重申的是,当用汉字以外的限用汉字并不是不存在、并不是没价值,它适合于特定领域或特定个人的少量的、局限性的需要或习惯,但不是对普罗大众的要求。Do you understand?
2005-7-14 00:32 #40

不咸山:
既然已达到4800,不如干脆再加上200个,对大局没有影响。
2005-7-14 09:15 #41

班门斧
班氏当用汉字量化准则

班氏多年以来在自己的经验和研究分析中,一直认为现代汉语书报中使用的汉字数量为四千多(不包括个别特别生僻的字),后来又进一步认定在四千五百左右。

近期,经过与一批赞同及反对的网友的反复讨论,尤其是有女同车网友站在异见立场上的质疑及统计数据的科学性修正,至目前为止,班氏确定当用汉字为4800个。

附上其中两组参考数据:
2、
笑傲江湖(上)累计字数 425145
笑傲江湖(下)累计字数 416396
四世同堂 累计字数 637428

三本书累计字数148万,用字4224个。
Total: 1478969glyphs and 4224 kinds of glyph

5、
王小波_黄金时代 累计字数 31799
王小波_白银时代 累计字数 36788
王朔_动物凶猛 累计字数 47837
王朔_过把瘾就死 累计字数 54155
檀香刑 累计字数 256416
中华人民共和国刑法 累计字数 56087
基督教圣经Bible 累计字数992468
(姚国华著)全球人文审思 累计字数 107277

八部书累计字数 160万,用字 4935个
Total: 1590744glyphs and 4935 kinds of glyph

我目前手头没有资料作合并统计,但根据统计学常识作合理推论,即使两组合并十一本书八个作者外加刑法和圣经累计308万字,所用字数也只是约5000,剔除200生僻字,还是4800。(欢迎有女同车或其他有兴趣者精确统计一次,甚至找更多作者的更多书作统计。条件是必须统计大众化的书,不包括《本草纲目》之类的专业著作。)

更直接地答复不咸山网友,认定4800字,除了出自一定的科学依据之外,对大众而言它实际上比5000字就是少200字的压力,况且5000之数还有一个心理压力,故没有必要特意去取5000整数,除非以后得到更精确更全面的统计数据支持。

为了使这个问题理论化,在此提出“班氏当用汉字量化准则”:
1、班氏当用汉字是指现代大众刊物及人民日常信息交流所使用的汉字。其中包括综合性的报纸和杂志、小说及各种文学作品、法律公告及各种公文文书。
2、班氏当用汉字包含,符合上条涉及的任何具体的一本书中,剔除一百个生僻字之后的所有字。但不包括文史类专著和动植物学专著以及相类似的专业性著作。
3、班氏当用汉字包含,除文史类研究和动植物学研究之外,任何一个具体专业领域或任何一项事业爱好所用到的一切字(在各各添加不超过200限用汉字的条件下)。
4、班氏当用汉字之规范,使任何一个具体的人,一生最多只需涉及到这4800字另加20至200限用汉字(以适应自己的特定专业和特定爱好。但特多专业特多爱好的罕见奇才可能需要超越)。
5、有保存价值的限用汉字约有五六万,但每一个专业、每一个具体的个人只需要涉及其中很小的一部分。限用汉字不是普罗大众的压力和负担。
以上是具有可操作性的“班氏当用汉字量化准则”

2005-7-17 02:54 #42
本贴由班门斧于2005年7月18日01:15:10在〖汉语拼音与输入法论坛 - 汉语拼音第一网站〗发表.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-5-6 19:57 , Processed in 0.071171 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表