湘里妹子学术网

 找回密码
 注册
查看: 3918|回复: 2

“基本语义单元”理论

[复制链接]
发表于 2006-5-19 04:23:04 | 显示全部楼层 |阅读模式
转贴者:班门斧来源:北大中文论坛《 www.pkucn.com » 语言文字漫谈 » “基本语义单元”理论
       
(这是一组通信中的一封,他人读来可能有个别地方线索不太清楚)
Date:   Mon, 15 May 2006 15:50:17 -0400 (EDT)
From:        banmenfu<...>
Subject:        “基本语义单元”理论
To:        "致平 郭" <.net>
郭先生你好!
往复的通讯,我们谈了不少总体,再来讨论一下具体的事情吧。

我在想,你的方案中的196对“偷换字”是否个个都一定必要呢?如果实在避免不了,能否减少到十对以下?能否正面回答一下这个问题?[插注:(这里提到的是郭先生的《文字优化论》中的优化字方案)我重新认真地核算了一下,前信提到的你的优体字范例诗共计124字,其中14字与传统汉字同形同义(即继承原汉字),12字与传统汉字同形异义(变成了一个与原字无关的新字)。因此,该方案除了继承原汉字的比例过低使人难以接受外,更令我震惊的是如此高比例的同形异义字,使该方案与原汉字实行平行式渐进过渡的路子也被彻底堵死了。究其原因,这是由于初始设计声韵符时,人为式的规划与传统汉字的已然结构发生大面积冲突造成的。----本段写好后,为了进一步理据严谨,我认真点算了你所规划的所谓470记形字,发现与传统汉字一致(同形同义,包括以简化字代繁体字)的只有178字,另有三对极近似同形同义的(国字少一点,善字少一横),总计也只有181字承传原有汉字。但极为严重的是,居然有大量的字是与传统汉字同形不同义的,看到“大”字,没有“大小”的意思,而是生活的“生”字;看到“今”字,不是“今时”的意思,而是断裂的“断”字,而这种狸猫换太子的“偷换字”竟然有196对!继承是如此之少,“偷换字”是如此之多,你所设想的45年分步渐进式“改朝换代”也是不可能的。至此,我绝对否定了《文字优化论》一书作为一套完整的
文字改革方案的可行性(保留对其关于文字进化优化理论以及创立声韵调拼音字的肯定)。根本而言,你虽然也推崇汉语,但实质上你是想全盘重新设计一套新文字,而我认为现代以“4800字”为核心的汉语汉字体系已经非常科学高效,只需部分优化改良,这是我们的根本分歧。
应该如何看待你所规划的拼音字方案呢?我认为,在汉字体系中引入拼音字是一个伟大的创举,将开创汉字发展的一个新的历史。汉字六书,象形、指事、会意、形声、转注、假借,我们再给它创立第七书:拼音字,用于解决现有汉字中义符不清音部不明的生僻疑难杂字,并开拓一条今后创造新字的道路,这是汉字发展史上的一个伟大转折,其意义无比重大。拼音字中,又可以再细分为“郭式声韵拼”和“陈式切音拼”。我认为,切音拼没有什么不好,它使用的音素是继续保留使用的部分记形字,并不增加学习、记忆的负担。]

我也纳闷,你的方案只采用了178个原义汉字(或者算是181个)。一个提出或承认“记形字+形声字+拼音字”理论的人,真的找不出400个可以使用而且值得采用的记形字吗?请回答“能找得出”或“实在找不出”(我会尊重你的意见的)。

我想知道,以上两个问题是技术措施的必然,或是你个人的爱好偏向。也就是说,《文字优化论》客观上能不能再改进,主观上有没有意愿再改进。

我感觉,你对文字(尤其是汉字)确实有“深刻的研究”(我很敬佩),但在“全面的理解”方面是否有某些不足。我建议你认真读一下组贴《班氏提议的“当用汉字和限用汉字”》http://www.pkucn.com/viewthread. ... B%B0%E0%C3%C5%B8%AB
或许对你的观念会有一些影响。带着批评的眼光去读或提出尖锐的批判也是欢迎的。

多年以来,在对语言文字的研究折腾中,我发现经常有人把英语的字母比汉语的字,或拿汉字比英语的单词等等,稀里糊涂,不得要领。根据对语言文字的研究、改革、创制(输入法、拼音字及大同语等等),隐隐中我感觉到语言文字中应该有一些共性的、本质的、初源性的东西,顺着这个思路的探究,终于,我发现(发明)了“基本语义单元”这个概念。“基本语义单元”才是最基础的、可以依靠的、可以比较的东西。基本语义单元是带有语意的、不可再切分的最小的单体,如草字头 “艹”,是有义的,再分就没有意义了;“马”字,特指某种四脚动物,是有音有义的,也可用作其他字的义部或音旁,再切之就没有意义了。以上两个是“绝对基本语义单元”,即绝对不可切分的。还有一种,如“驾”,它自己是一个基本事物(行为)的语义,但在构形上借用了“马”义“加”音,所以称之为“相对基本语义单元”。为什么还要把这个“驾”划入“基本语义单元”范畴呢?因为“马”和“加”并不能覆盖“驾”的语义,即使你不采用“马、加”,你也必须创造一个字形去描述“驾”的行为,所以这样的字还是属于“基本语义单元”,即“相对基本语义单元”。当然,“相对基本语义单元”的划分是有一定
的弹性的、相对性的。“绝对和相对基本语义单元”统称为“广义基本语义单元”,也可简称为“基本语义单元”。

“驾驶证”、“驾照”就不是“基本语义单元”了,它们是“基本语义单元”的组合。但英语中的“license”却是英语的“基本语义单元”(不可切分),当然你也可以说“driver's
license”。但英汉两种语言体系在各自建立自己的“基本语义单元”集合时还是有区别的,更典型的是“猪pig”的“肉meat”居然不是“猪肉pork”。用“基本语义单元”的这个统一标准去衡量不同的语言文字体系,则高下分明、巧拙立见。

我从纯理论角度去研究了“基本语义单元集”的规模问题。如果这个集太小,则很多常见、常用的事、物都必须反复地去拼凑、去组合才能够描述,这不是高效简洁,反而是麻烦了。但如果这个基本集太大,则光是要掌握这个集就足够辛苦麻烦了,也远离了科学高效。根据经验和直觉,我认为“基本语义单元集”以4500 左右为最佳值。(曾经有人提出用2500字可以反映大千世界,我认为这个数量不够、不好)

后来,再次从现实角度去研究语言文字,通过输入法实例、词典用字、大量的书籍的统计数字,我发现由于双字词的主导地位的确立(其实质就是基本语义单元的科学高效的应用),现代汉语用字已经从六万向六千、五千收敛,现代汉语已经基本汇聚在4800字范围内。现代汉语的发展轨迹高度吻合了我上面对“基本语义单元集”的规模的研究结论。当然其汇聚收敛必须是自然的、科学的,在字义的自然分化、整合、抽象、衍生中慢慢完成,而不能靠武断地一下子砍掉千几百字来实现(如大同语等新创文字则可以直接采纳)。

反观英语,在其六十万单词中(有说近年即将发展到100万),至少有20万是不可切分的“基本语义单元”,这样的语言文字有可能是科学高效的吗?不说也罢。

“上帝”主宰的这个世界有其客观的自然规律,不以人的意志为转移。“基本语义单元”的多少有一定的最佳值,不能超自然力地去减少,如果承认“基本语义单元”的最佳值大概在四五千左右,则一两千的死记量是必要的,四至八百记形字也是合适的。反之,企图减少记形字,却用大量的、复杂的技巧、手段、措施、规则(例如什么定型符、异拼等等)去分化、定型同音字,还是弄巧成拙,记忆负担也并不见小。

“基本语义单元”理论应该是语言文字的比较、改良、规划、创新中的一个共同标准,是一种通用的工具。

班门斧敬上
2006-5-16 04:31               
       
再解释一下,“基本语义单元”这个概念是经过多年有意和无意的摸索折腾,才认识总结出来的。最早是班门斧于2003年5月22日09:09:57在乐趣园〖汉语拼音文字论坛〗发表的《英汉之优劣与基本语义单元》。

一般地说,汉语的一个“字”和英语的一个“单词”就是一个“基本语义单元”,但又不能简单地将它等同于这样的一个“字”和“单词”。它是从性质上定义、而不是按形式来划分的,可用于构建词汇语段的、不可再切分的一个最小的语义单体。

一般地,汉语的一个字是一个基本语义单元。部首也具有基本语义单元的属性,也是一组特殊的基本语义单元。少数地,“头寸”也是一个基本语义单元。

一般地,英语的一个单词就是一个基本语义单元,词根词缀也是一组特殊的基本语义单元。但bedroom、armchair等“组义词”不算是基本语义单元。而postpone仍然是一个基本语义单元,因为它不能被切分为有相关语义的单体。

按语义的性质,而不是外型形状来划分基本语义单元,这样才能使我们对语言文字的研究、鉴别、比较有一个共同的基础,有一个公共的平台、统一的标准。而不是公说单词,婆说笔画;你论部首,我谈字母。

假如有400种事物需要我们去命名定义它们。如果各个赋予一个基本语义单元,则有400个基本语义单元。但如果我们先定义20个类,再使用20个单名,极端地,最少40个基本语义单元就可以定义这400个事物。

分门别类,划归种属,这是汉文明在两三千年前就基本完善了的。而西方在一两百年前隆隆重重地“发明”了事物分类法,才艰难地踏入这片新大陆。山羊 goat、绵羊sheep、岩羊、黄羊都是羊类,猪肉pork、羊肉mutton、牛肉beef、鸡肉chichen都是肉类,火车train、汽车 car-automobile、马车carriage、牛车oxcart、单车bike都是车类,可见,用基本语义单元的标准去考察语言文字,其优劣高下、简繁巧拙,立即本性毕现。
2006-5-17 01:53       

吕观雄
注册 2002-9-22
来自 中国广西
       
用 基本语义单元理论  来评价中英文的优缺点,比只以  文字是否准确表音是否音素化  这个单一要素来评价语文的优劣要更全面些。班先生这一研究工作意义重大。
2006-5-17 12:07               

郭致平
注册 2002-9-13
来自 台灣
       
關於基本語義單元及通用字數量的問題, 容後再議。讓我先談談優化方案相關的問題。
1. 在優化方案的記形字中, 原字有181個, 替換字(暱稱偷换字)有188個, 而新創字則有89個。由此可知, 記形字共有458個字。雖說188個替換字不是〝一個也不能少〞, 但是〝大約〞188個替換字最接近最佳狀態。
2. 你所說的〝同形異義字〞又稱為〝破音字〞, 傳統字中的破音字(例如的、了、著、說、上、有、個、地、大、和、要、會、樂、長……)又有多少呢? 根據「國語一字多音審訂表」的資料, 若僅以日常用語為準就有4253個破音字。這種大面積衝突可曾令你震驚? 何以188個就使比例太高? 更何況它只是優化方案在四階段漸進模式下的短暫過渡現象。   
3. 文字優化是指〝所有文字均朝著高頻字記形化、常用字拼音化及低頻字形聲化的方向優化〞。由此可知, 絕不應在低頻字中〝不合理地〞採用拼音字。事實上, 低頻字的拼音化屬於文字劣化。
4. 在我的優化方案中, 記形字共有458個。為何說我〝找不出400个可以使用而且值得采用的记形字〞呢? (我会尊重你的答覆的)
5. 優化方案是漢語條件下的必然, 但是絕非〝一點也不能再改進〞。每個人對〝均衡點〞的掌握都會有所不同, 灰色地帶在所難免, 但是差異絕對不顯著。
2006-5-18 21:53       

谢振斌
注册 2005-8-20
       
我研究的全息部编码涉及到的部件,正是这种最小语义单位,在我的拆分规则里贯彻了这个精神。
我说过 部件组字 和 单字组词 ,具有可类比性。
我把部件分为26大类,约200多小类。
2006-5-18 23:05       
       
班门斧
注册 2002-12-5
       
先答谢先生:
部件排序(编码)的优点是快捷,但其缺点是明确度低,反映在具体使用者身上就是犹豫不决、无从下手的时候多。我是在这个方面落难而退的,希望你能较好地解决这个瓶颈问题。
相较而言,笔画排序法可让小学一年级任何学生(只要其第一学期能够考到60分),都可以势如破竹地查到任何字。
2006-5-18 23:58               

班门斧
注册 2002-12-5
答郭先生:
可喜的是,你我等几位同仁都是统一于“记形字+形声字+拼音字”这个大方向上的。

现在可以更清楚地看出来了,这五六百记形字的问题,是我们这一派内部争论的制高点,解决好这个制高点了,后面的形声字、拼音字的摆龙尾的事情就容易理顺了。

在记形字中,我们涉及到三类:原义字、替换字、新创字。新创字先按下不表,这是后制之制,在其他办法都来不了事的时候就只好新捏一个呗。我们先来讨论一下原义字和替换字,对原义字的采纳,我与你有绝然相反的态度,我认为人家已经使用两三千年了,无论是承认其构造的科学性或尊重积习的势力,应该尽量地能用则用;你是能不用则不用,以标新立异,全盘更新为倾向。对于替换字,我是主张一对也不要,“大”字非大小,而是“生”意,“今”字非今时,而是“断”掉。一字伤俩。你说是188个,我计是196对!(精确数字可以再审计)对这样的偷换字,我的原则是一对也不要,实在不能避免的话,最多只能容忍十对左右,超过二十对则一票否决。

傳統字中的破音字是一个毛病,但改革方案不要去主动继承其缺陷。

我认同高頻字記形化这一点,但对“常用字拼音化及低頻字形聲化的方向”不表认同。我认为,决定拼音化或形声化的标准不应该是“常用”或i“低频”。我认为,在记形字的基础上,有明确的音部和明确的义符的,就应该采用形声字,反之,分类不清、音部不便的字,就以“拼”音解决之。

我不认同“低頻字的拼音化屬於文字劣化”这个观点。所谓低频字,是两三千常用字之外的字,也就是在动态阅读量中每一万字没有遇到一个的字,已懂者则读之,未懂者则拼之,何来劣化之谓。

答你的第4点:你的方案是采用了458个记形字,但我的意思是希望你在传统的汉字中找出400个可以使用而且值得采用的记形字,偷换字和新创字不算在这个“找到”里面。
2006-5-19 01:04
发表于 2006-5-19 09:13:18 | 显示全部楼层

您好!欢迎您!

您发的帖子不符合本论坛格式要求,请整理好排好版后再发。

另外,在本论坛发帖三个以上并超过一定字数者,须付给相应的版面费,以让论坛自己养活自己。

多谢合作!
 楼主| 发表于 2006-5-19 16:30:56 | 显示全部楼层
谢谢指点,好几个月没来了,不了解新规矩,抱歉。

关于格式,这是转过来的一些讨论帖子,很难有什么格式。不过既然有规定,我试图适当整理一下,尽量接近一点吧。

收费营运论坛,合理。我人在海外,一时不便,可删减之以副一定之规,再次表示歉意。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-29 06:54 , Processed in 0.122982 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表