|
从词汇看汉语与越南语的接触与联盟
十九世纪欧洲历史比较语言学成功地论证了印欧语系诸语言的亲属关系,并以此为模式推动了其他语系的假设与论证。世界的主要语系如汉藏语系、尼日尔刚果语系,马来亚玻利尼西亚语系等概念都是在类比印欧语系谱系树模式的基础上提出来的,但亚洲地区特别是东南亚地区众多语言具有极强的接触史,和印欧语发展有着根本的区别,谱系树模式所没有遇到的或者说避而不论的接触问题在东南亚地区的语言研究中成为一个最大的难题。比如,到现在越南语这种与汉语密切相关的语言至今没有明确的定位。
本文拟从汉语与越南语的词汇层面的接触入手,探讨语言演化的二元对立关系(分化与联合)和模式(谱系树和联盟树),并以此考察汉语与越南语的接触关系。
历史语言学的理论基础模型主要是施莱哈尔于1862年提出的谱系树说和十年后由他的学生施密特提出的波浪说,但这都是在印欧语言的研究基础上总结出来的理论,无法解释汉语和越南语之间的关系。
一、从同源关系的标准到两种演化模式
十九世纪的历史语言学提出了确定语源关系的两大标准:
1、同构标准。三十年代,李方桂先生分析“汉藏语系”的假说时,是基于语言结构类型,即单音节和有声调。后来我国学者又在语言结构类型的标准的类型中增加了“量词、虚词和形态变化”。对于上述标准,越语基本上都符合,这么看来汉语和越语有发生学上的同源关系。但是,法国语言学家欧德利古尔认为,在公元初,越南并没有声调,而是到了十二世纪在韵尾消失、浊音声母清化、松紧对立消失的情况才产生声调系统。欧德利古尔的观点得到了多数中国和越南学者的赞同。由此看来,上述同构标准存在因果关系并且高度相关,可用普遍特征和概率原则加以排除。在单音节语言中,韵尾的丢失和声母的浊音清化会使同音语素增加,为了避免同音语素过多而影响交际,原来的羡余特征(音高)就会被放大而产生音调,这类似生物机能中的代偿效应。因此声调的出现是单音节语言的普遍特征,不能作为同源的标准。这就说明“同构必同源”并非放之四海而皆准。
2、对应标准。由于“同构必同源”既不得不到证实又得不到证伪,我们把目光放在对应词的查考上。这下我们找到了大量的证据,因为越南中存在一个今汉越语系统,借此越语可与汉语一一对应。在今汉越语形成前后,还有大量古汉越语和二次越化汉越语,这三种汉越语已成为越语的有机组成部分,占越语词汇量的70%以上,这在一般的语言接触中是罕见的,这似乎足以说明二者同源。在印欧语言中,可通过语音对应规律将同源词和借词区分开。但我们发现,在语言接触到一定深度后,同源词和借词是难以区别的。这样,东南亚地区语言中同源词和借词的区分成了历史语言学界的一大难题。而这些汉越语到底是同源词还是借词将在很大程度上决定汉语和越语是否是同源关系。因此,这一标准也仍然存在证实与证伪的问题。
同构和对应是讨论印欧语言发生的两个基本标准,现有的其他标准最终都可转化成这两个标准之一。这里的同构和对应包括语音系统和语法系统。十九世纪的历史比较语言学家就是凭借同构和对应在确定同源关系上取得了重大进展。但这两个标准本身并没有得到严格证明,而被当成是不言自明的。这是因为印欧语言是在相对独立的环境中从原始印欧母语发生发展起来的,并没有受到其它大语系的强烈影响。而印欧语系内部诸语言结构十分相似,相互接触后一般不影响同构性,词汇借用又主要集中在文化层面上,并不影响基本词汇的对应规律。因此,同构和对应两个标准足以界定印欧语系的范畴,暂时把语言接触这个因素给抛开了。
东南亚地区山川阻隔,处在各大语系的交汇处,人们发现,这里的语言谱系远不象印欧语言那么清晰,各种语言发展不一,盘根错节,仅仅采用同构和对应两个标准远不足以说明各种复杂的语言现象。汉语和越语的形态变化少,相互十分容易借用,确定它们的亲属关系是用上述两个标准所难以胜任的。
于是人们开始追究同构和对应标准对于同源的不言自明性,结果发这种不言自明性实际上在理论中无法证实,谱系树模式的局限开始显露。我们认为,东方语言的演化模式与印欧语言谱系树模式不同,是多种不同语言的聚敛而不是一种母语的分化,其基本图式不是一棵分叉日益增多的树,而表现为二棵或多棵树在末端的交叉与联合,暂称其为联盟树。
二、两种语言演化模式形成的原因
东西方生产方式和地理环境的不同导致语言发展模式的不同:
一般认为,欧洲大陆的自然条件相对比较恶劣,西方原始印欧人多为游牧民族,他们生活在公元前三千年的东欧,原始印欧语就在这里诞生。由于游牧生产方式的不稳定,约在公元二千五百年前原始印欧文明分裂了,他们分为向四处迁移,南下到达希腊、意大利,北上到了俄国,向西到达不列颠岛,向东到了印度,他们把原始印欧语带到亚欧大陆的大部分地区。他们所到之处,只有文明极不发达的土著居民,在文明极端不对称的情况下,土著居民的语言受到毁灭性打击,只在印欧语的词汇中留下了一些残迹。因此,原始印欧语在扩张过程中没有受到其他大语系的强烈影响,主要表现为语言的分化和变异,因而产生了清晰的谱系树,在广大的地区形成了单一的语系。这种由一种母语分化而产生的语系,呈现出高度融合和统一的内在结构,可暂称为单元语言发生体系,在演化模式上表现为谱系树模式。
而东方素以物产丰富著称,这就决定了东方民族多以农耕为基本生产方式。由于农耕生产方式相对比较稳定,地理上山川阻隔,以各大河流域为中心形成了多个文明的中心。这些分散文明产生了各自不同的原始语言,但这些不同的原始语言互相之间几乎没有交流,只是各自独立地发展。由于农耕生产的高度稳定性,这些原始语言的扩张速度比较慢,在扩张的边缘地带各种语言长期纠缠、交织在一起,形成了与印欧语大不相同的语言接触现象。西方文明的冲突可以说是水火不容,较弱的文明在被武力征服后往往遭到灭顶之灾,他们的语言也随之灭亡,欧洲的土著居民就是明证,由此而形成了印欧语大一统的局面。而东方文明讲究海纳百川、兼收并蓄,东亚尤其是东南亚地区处于几大文明(古中华文明、古印度文明)和几大语系(汉藏语系、印欧语系、南亚语系、南岛语系、侗台语系)的边缘交汇处,更易受到不同文明和语系的影响。由于远离文明的中心,并没有哪种语系和它所代表的文明能占有绝对的统治地位,所以语言接触现象尤为突出。这样,在一个相对狭小的地区中存在多个非同源语言,这些语言相互接触并且产生强烈影响,主要表现为语言间的联合,这样的语言体系可暂称为多元语言发生体系,在演化模式上表现为联盟树模式。在这种区域语言的交互作用下,一些语言同时或先后接受了几个不同来源的语言因素的影响,形成了变异的复合语言形态。
语言演化如果存在联盟树模式,那么谱系树模式理论就无法区分同源关系和接触关系,它赖以论证语源关系的同构和对应两大标准对于确定联盟树模式不再具有充分性,我们必须探寻新的方法和标准。
三、语言接触的“阶”
我们看到,语言的相互接触是一个渐变的过程。两种或多种语言如果接触,它们之间就必然存在一个中间地带。从汉语到越语,就存在越南人说的汉语、汉人说的越语等多种中间形态。中间形态的语言从严格意义上来既不能算是汉语也不能算是越语,这是语言连续性的客观反映。但是,语言的核心部分还是明确的,比如说汉人说的汉语,无论他说的是北京话还是广东话,我们都可以明确地说它是汉语。在语言的接触过程中,我们可以看到越是核心的部分受到的影响量越小,时间越晚,从而呈现出不同的“阶”。现在的问题就是如何定义和划分“阶”。
语言词汇的接触,按不同的标准可分为不同的“阶”。就汉语和越语接触的情况,从时间的角度来看可把汉语词汇进入越语的过程分为三个时期:①口语零星渗入时期(唐朝以前)②书面途径输入时期(唐朝)③巩固发展和继续输入时期(宋朝至今)。与之相应,从语音角度可把汉越语分为三类:①古汉越词②今汉越词③二次越化汉越词。根据汉越词与越语固有词之间的关系也可把汉越词分为三类:①有对应同义越语固有词的汉越词②无对应越语固有词的汉越词③用汉越语素构成的生成汉越词。
以上是我国和越南学界从汉越词的特点出发作的几种传统划分,非常适合于描写汉越词的特殊性,但正是这种特殊性使他们不适合于确定语源关系。因为对于接触性语言现在还没有权威的方法进行语源确认,在搞清楚语言接触机制之前所有的标准都只是假设,更有说服力的办法是将其放到一个广阔的语言环境体系中去考察,因此传统的划分方法过早过多地强调了汉越词的个性而不利而与其它语言接触现象进行对照研究。
既然上述传统的划分不适于用来确定语源关系,就让我们先看看词汇借贷的一般特征:
词汇的借贷分为文化词汇借贷、一般词汇借贷和基本词汇借贷三种。文化词汇借贷,是指由于越族与汉族文化上的不对称,所以两个语言独有的文化词汇首先开始相互补充。越语输入汉语的有:bầu->圃榴,dừa->椰,cây báng->桄榔等(这些词汇均在早期由越语输入汉语,现在不易考察)。汉语输入越语的则难以计数,如科学->khoa học,革命->cách mạng,经济->king tế等。文化词汇的互补性很强,互相输入十分容易。更深入的词汇借贷是一般词汇乃至基本词汇的借贷。而一般词汇和基本词汇借贷的特点是单向性,本来越语中有对等的词汇,但后来或者被汉语词汇取代了,或者处在与汉语词汇不同的功能分布上。
为什么无论越语中有的词会发生借用现象,而其它一些却不会呢?我们认为词汇借贷的基本原因有两种,第一,两种语言的词汇配对。每种语言的词汇在分割和指称经验时都有自己独特的方式,在相互接触中总有许多词汇不能相配,在这些词中就容易发生借贷现象,可以看作有和无两个“阶”。第二,对于已有的词汇配对,一个语素的组合指数越强,越不容易被借贷所替换。汉语已和越语配对的词较难进入越语,这由于双方缺乏互补性。可以设想,相对文化词汇而言,一般词汇(课堂、人生)较难借用,而基本词汇(如天、米、心、走、你、爸爸等)更难,但我们不容易确定一般词汇和基本词汇的界限,更何况在一般词汇和基本词汇内部还存在区分。我们还发现,在替换过程中,一个语素的成词数量越大,它的生命力也就越强,就越难以被替代。语素成词的数量即是该语素的组合指数,一个语素成词数量越高,组合指数也越高。组合指数的高低能用来精确区分每个语素的稳定性和被取代的难度。不仅如此,组合指数还能用来解释词汇配对(即第一个原因),如果在越语中不存在配对词,那它的组合指数就是0,所以就最容易被替代。在组合指数这里,二个原因合二为一,因此它就是“阶”在词汇层面的最好表现。
因为有了组合指数这一指标,“阶”得以精确的定义和划分。下面我们就以“阶”为工具来探讨语源关系。
四、用分阶核心词的比例变化确定语源关系
上面我们看到,词汇接触是有阶的。这就促使我们思考通过词汇的有阶性来判定同源关系和接触关系。但由于历史上的东南亚地区语言的接触和分化关系异常复杂,语言之间既有分化又有联合,大样本的基本词汇在接触中波动的可能性较大,对于观察阶的变化而言不够准确。而核心词汇是语言中生命力强、使用率极高的部分,总是最后受到语言接触的冲击。核心词的变化是语言的变化的高度概括,规模小而便于统计分析,因此我们有必要把词汇样本缩小到核心词部分。
本来通过语素的组合指数来确定词汇的阶可以使结果高度量化和精确,但用现代的实例难以确定古代汉语和越语各语素的组合指数。为简单起见,我们采用的是斯瓦迪士提出的人类200个核心词。1952年,斯瓦迪士(Morris Swadesh)提出了200个核心词来统计确定语言分化的年代,后来他又从这200个核心词中筛选出100个人类语言最稳定的核心词(一阶核心词),剩余100个词的归入二阶核心词。斯瓦迪士的语言年代学200词是当前国际语言学界公认的作历史语言比较研究的最佳优选词汇,具有较强的操作性和国际通用性。一阶核心词并不是绝对稳定的,但总体而言比二阶核心词稳定,这种相对稳定性在能够一定程度上反应语言的有阶性。
前面说到,同构和对应两个标准对于确定语源关系尤其是东南亚地区的语源关系不再具有充分性,同源词和借词的区分又十分困难,而且与语源确认有循环论证的嫌疑。即然区分两者如此困难,我们不妨将借词和同源词的区分暂时搁置,而把有音义对应的的词称为关系词。我们要考察的就是关系词在词汇样本中的分布和变化关系。
先考察我们熟悉的谱系树模式下有同源关系的印欧语系中的关系词:
英语与印欧语系关系词比例对比
单位:%
其他印欧语英语 古英语 德语 古弗里西亚语 荷兰语 古冰岛语 哥特语
一阶核心词 87 64 72 71 76 58
二阶核心词 71 46 51 54 57 39
该表摘自陈保亚(1996)188页
我们可以看出,同源语言的关系词比例较大,而且关系词随着阶的扩大而减少。谱系树是单中心的发散模式,与阶的扩散存在结构上有内在的契合。离中心越近,形态越相似;离中心愈远,周边的各部分之间的差异越大。
我们再考察联盟树模式下无同源关系但有深刻接触关系的汉语与侗台语族中诸语中的关系词:
汉语与侗台语族诸语的关系词比例对比
单位:%
侗台语汉语 武鸣壮语 龙州壮语 布依语 西双版纳语 德宏傣语 侗语 仫佬语 水语 毛语
一阶核心词 13 13 5 4 5 12 11 8 9
二阶核心词 22 19 18 14 15 15 22 16 15
该表摘自陈保亚(1996)243页
我们看出,接触语言关系词比例较小,这在情理之中。而另一特点是关系词随着阶的扩大而增多,这是因为语言之间无同源关系而在接触中不断相互同化而造成的。
这样,我们得到两个确定语源关系的假设:一是关系词的多少,关系词多为同源关系,关系词少为接触关系;二是关系词与阶的对应关系,关系词随阶的扩大而减少为同源关系,关系词随阶的扩大而增多为接触关系。这是我们从部分语言样本中得出的标准,但这两个标准是否具有相同的判定效果呢?实证检验需要收集大量材料作统计学上的推导,我们现在还难以做到,目前只有用逻辑方法作简单的推导。有同源关系的语言分化时间越长关系词越少,而无同源关系的语言接触时间越长关系词越多,有没有可能两者数量趋向一致甚至非同源语言的关系超过同源语言的关系词?在现有的资料我们还没有发现,但在理论(语言无界论)上是完全可能的,这意味着不能以关系词的数量为标准。而关系词与阶的对应关系则不然,由于同源语言结构十分相似性,词汇的借用主要集中在文化层面上,关系词必然随着阶的扩大而减少,反之亦成立,在两者中间不存在中间形态。
因此,我们认为确认语源关系应以关系词与阶的对应关系为准则,而关系词的多少只和接触的深浅或分化的远近有关系。我们可用下面的交叉列表概括上面的讨论:
语言关系分类
关系词多 关系词少
关系词随阶上升而上升 联盟(深刻接触) 接触
关系词随阶上升而下降 同源(分化年代不久) 同源(分化年代久远)
五、汉语和越南语的语源关系
我们对汉语和越语的关系词作了详细的比较研究,结果如下:
表格说明:
1、第一栏的英语来自美国语言学家斯瓦迪士(Morris Swadesh)提出的人类200个核心词。1952年,斯瓦迪士提出了200个核心词来统计确定语言分化的年代,后来他又从这200个核心词中筛选出100个人类语言最稳定的核心词。我们把他后来筛选出的100个词称为一阶核心词,剩余100个词的归入二阶核心词。
2、第二栏的汉语来自陈保亚对200核心词的译文(陈保亚1996)。
3、第三栏的越语是对应英语和汉语的译文,采用的是最常见的越语词。
4、第四栏是根据第三栏的越语词判定是否为关系词,只要最常见的越语词中有一项为汉越词,即断定该词与某汉语词(不一定是第三栏中的汉语词,因有些古汉越词难以查考)为关系词,英语和汉语只起参考作用。
一阶核心词
I 我 tôi,ta,tao,tớ 1
you 你 0
we 我们 chúng tôi,chúng ta 1
this 这 này 0
that 那 ấy,đó,kia 0
who 谁 ai 0
what 什么 gì 0
not 不 không 0
all 全部 tất cả, mọi 0
many 多 nhiều,lắm 0
one 一 một 0
two 二 hai,đôi 1
big 大 to,lớn 0
long 长 dài 0
small 小 nhỏ,bé 0
woman 女人 đàn bà,phụ nữ 1
man 男人 đàn ông 1
person 人 con người,người 0
fish 鱼 cá 0
bird 鸟 chim 0
dog 狗 chó 0
louse 虱子 rận,chấy 0
tree 树 cây 0
seed 种子 hạt,hạt giống 1
leaf 叶子 lá cấy 0
root 根 rễ 0
bark 树皮 vỏ cây 0
skin 皮肤 da 0
flesh 肉 thịt 0
blood 血 máu,huyết 1
bone 骨头 xương 0
grease 脂肪 mỡ 0
egg 鸡蛋 trứng 0
horn 角 sừng 0
tail 尾巴 đuôi 0
feather 羽毛 lông 0
hair 头发 tóc 0
head 头 đầu 1
ear 耳朵 tai 0
eye 眼睛 mắt 0
nose 鼻子 mũi 0
mouth 嘴 mồm,miệng,mõm 0
tooth 牙齿 răng 0
tongue 舌头 lưỡi 0
claw 爪子 vuốt 0
foot 脚 chân 0
knee 膝 đầu gối 0
hand 手 tay 0
belly 肚子 bụng 0
neck 脖子 cổ 0
breasts 乳房 vú 0
heart 心脏 tim 1
liver 肝 gan 1
drink 喝 uống 0
eat 吃 ăn 0
bite 咬 cắn,ngoạm 0
see 看见 thấy,xem 0
hear 听见 nghe 0
know 知道 biết 0
sleep 睡 ngủ 0
die 死 chết 0
kill 杀 giết 0
swim 游水 bơi 0
fly 飞 bay 0
walk 走 đi 0
come 来 đến,tới 0
lie 躺 nằm 0
sit 坐 ngồi 0
stand 站 đứng 0
give 给 cho,biếu,tặng 0
say 说 nói 0
sun 太阳 mặt trời 0
moon 月亮 mặt trăng 0
star 星星 sao 0
water 水 nước 0
rain 雨 mưa 0
stone 石头 đá 0
sand 沙子 cát 0
earth 土地 đất 0
cloud 云 mây 1
smoke 烟 khói 0
fire 火 lửa 0
ash 灰 tro 0
burn 烧 đốt 0
path 路 đường 0
mountain 山 núi 0
red 红 đỏ 0
green 绿 xanh 0
yellow 黄 vàng 0
white 白 trắng,bạch,bạc 1
black 黑 đen 0
night 晚上 đêm,tối 0
hot 热 nóng 0
cold 冷 lạnh 0
full 满 đầy 0
new 新 mới 0
good 好 tốt 0
round 圆 tròn 0
dry 干 khô,cạn 1
name 名字 tên 0
二阶核心词
and 和 và,cùng,với 0
animal 动物 động vật,thú vật 1
back 背 lưng 0
bad 坏 xấu,tồi,dở 0
because 因为 vì 1
blow 吹 thổi 0
breathe 呼吸 thở 0
child 孩子 đứa bé,đứa trẻ 0
count 数 đếm,tính 0
cut 砍 cắt,chặt,chém 0
day 天 ngày 0
dig 挖 đào 0
dirty 脏 bẩn 0
dull 呆 ngu 1
dust 尘土 bụi 0
fall 掉 rơi 0
far 远 xa 0
father 父亲 bố 0
fear 怕 sợ 0
few 少 ít 0
fight 打架 đánh nhau 0
five 五 năm 0
float 漂浮 nổi,trôi 0
flow 流 chảy 0
flower 花 hoa 1
fog 雾 mù 1
four 四 bốn 0
freeze 结冰 đóng băng 1
fruit 水果 quả,trái cây 1
grass 草 cỏ 0
guts 肠子 ruột 0
he 他 nó 0
here 这里 đây 0
hit 打 đánh 0
take 拿 cầm,nắm,giữ 1
how 怎么 thế nào,ra sao 0
hunt 打猎 săn bắn 0
husband 丈夫 chồng 0
ice 冰 băng,đá 1
if 如果 nếu 0
in 在 ở,tại,trong 1
lake 湖 hồ 1
laugh 笑 cười 0
leftside 左边 trái 0
leg 腿 đùi 1
alive 活的 sống 0
mother 母亲 mẹ 0
narrow 窄 hẹp 0
near 近 gần,cận 1
old 老 già 0
play 玩 chơi 0
pull 拉 lôi,kéo 0
push 推 xô,đẩy 0
rightside 右边 phải 0
correct 对 đúng 0
river 河 sông 1
rope 绳子 dây 0
rotten 腐烂 mục 0
rub 擦 cọ xát,chà xát,xoa 1
salt 盐 muối 0
scratch 抓 cào 0
sea 海 biển 0
sew 缝 may,khâu 0
sharp 尖 sắc,nhọn,bén 0
short 短 ngắn,cụt 0
sing 唱 hát 0
sky 天空 trời 0
smell 闻 ngửi 0
smooth 平 phẳng 0
snake 蛇 rắn 0
snow 雪 tuyết 1
spit 吐 nhổ,nhả 0
split 撕裂 xé 0
squeeze 压 đè,ép 1
stab 刺 đâm 0
stick 棍子 gậy,que 0
straight 直 thẳng 0
suck 吮 mút,bú,hút 0
swell 肿 sưng,phù 0
there 那儿 đấy 0
they 他们 chúng,họ 0
thick 厚 dày 0
thin 薄 mỏng,mảnh 0
think 想 nghĩ,tưởng 0
three 三 ba 0
throw 扔 ném,vứt 0
tie 捆 buộc,trói 0
turn 转 quay 0
vomit 呕吐 nôn,mửa 0
wash 洗 rửa,giặt 0
wet 湿 ẩm,ướt 0
where 哪里 đâu 0
wide 宽 rộng 0
wife 妻子 vợ 0
wind 风 gió 1
wing 翅膀 cánh 0
heavy 重 nặng 0
woods 森林 rừng 0
worm 虫 trùng 1
year 年 năm 0
统计结果
单位:%
越南语汉语 越南语
一阶核心词 12
二阶核心词 19
从统计结果看来,汉语与越语的关系词多而且随着阶的扩大而增多,这和汉语与侗台语的关系词分布相近,表明汉语与越语不是同源关系而是接触关系,不是一般接触关系而是深刻接触关系,即联盟关系。(由于非同源外来语言进入核心词汇非常困难,因此在200核心词中超过20个即可认为是联盟关系,而汉语与越语的关系词多达12+19=31个)
六、结论
汉语与越语之间有极强的同构关系和对应关系。在基本词汇的层面上,汉语和越语之间存在一个切韵音系层上的严格对应的关系词系统(即今汉越语系统),即使是在200核心词中还能找到30个关系词。但是,通过关系词的绝对数量来判定语源关系从现在来看至少是片面的,这反映了汉藏语系概念的建立和研究受到印欧语谱系树模式的深刻影响,但印欧语谱系树的模式和方法并不具有普适性。通过对关系词和阶的走向趋势研究,我们认为汉语和越语是接触关系。
联盟树模式的发现加深了我们对语言的认识。我们发现,分化和联合的二元对立是语言辩证法的一对基本范畴,只要语言存在就有分化和联合,有些地区分化是其主流,而另一些地区联合是其主流。语言的分化使语言的差异扩大,而语言的联合使语言的差异缩小,正是这一矛盾对立促使语言不断向前发展。同时,我们看到,阶作为反映语言内部差异这一客观实在的尺度,无论是对谱系树模式还是联盟树模式都是适用的。
本文对汉语和越语的语源分析是在极为有限的材料上进行的,许多观点的论证还停留在理论的推导上面,缺乏广泛材料的支撑,显得十分单薄。另外,本文应用的主要尺度——阶有待细化和量化,以便于进一步从数理统计学的角度进行实证研究,如可对南亚语系诸语(目前国内外多数学者认为越语应归入南亚语系)和越语的关系词进行大规模的调查、统计并进行聚类分析最终确定越语的归属。 |
|