湘里妹子学术网

 找回密码
 注册
查看: 2199|回复: 1

关于如何从词汇系统中截取一个“小词汇系统”的问题

[复制链接]
发表于 2003-12-13 16:07:47 | 显示全部楼层 |阅读模式
http://chinese.pku.edu.cn/bbs/thread.php?tid=30607
這是北大中文的討論↑
雖是隔行如隔山;但在我的思考,他們談的是不是要作個類似:
在大語群裡作出Regular的Sub-groups呢?
那這Sub-groups必須要有語意的邏輯性質嗎?

比如說,我們目前可以在程式中把所有的中文人名如“家寶”(共32000
筆=A),前置的姓都留空,另有6700筆姓=B;然後每當A排列到B時,就
自動組成一個完整的中文姓名。

這樣算不算是他們所討論的“截取一个“小词汇系统””呢?
請語文學者幫忙解說一下。
发表于 2004-1-10 13:00:44 | 显示全部楼层

关于小词汇系统

我一直在瞎忙,又不务正业,今天才看到水电君的这个帖子。下面我就用自己的观点探讨这个问题,可能有跟主流观点不一致的地方,因为我是根据集合逻辑理论(set-logical  theory)研究词汇的,目的是为了计算机处理方便。
水电君说:
“雖是隔行如隔山;但在我的思考,他們談的是不是要作個類似:
在大語群裡作出Regular的Sub-groups呢?
那這Sub-groups必須要有語意的邏輯性質嗎?”
是的。词汇系统可以用词汇语义系统,即词汇域(lexical  field)来描述。词汇域属于语义域(semantic  firld)的子系统,主流学者们认为包括分类型、构件型、有序型、对立型和同义型等域型,实际上不能这么简单分类。拿分类型词汇域来说,一般按科学分类来描述。例如,印刷术包括印版印刷和计算机印刷两大类,印版印刷又分为凸版、平板、凹版、丝版、油印印刷等,计算机印刷又分为打印、激光照排、喷墨、影印、电传等等。还可以一层一层再分下去。事物分类属于典型范畴(prototypical   category,或译原型范畴),分类的模糊和交叉现象是常有的。由于分类者观点不同,也不会完全一致。例如,上面提到的我做的印刷术分类就比书上列的多一倍以上内容。影印也可以另列一类,或归入平板印刷(早先影印书籍是照相制版),但同属影印技术的复印机也可以跟计算机连接,不用印版。我不用场(例如,通常叫词汇场,而不叫词汇域),而用域,因为我把它看作集合。词汇域是立体重叠、交叉的集合系统。我还没听说过小型词汇系统,可能是指小范围的词汇的语义分类。现在很多搞研究的为了出名常常剑走偏锋,钻牛角尖,只要人家看不懂就算是创造。词汇研究是一个宝库,老老实实做是很能出成果的。例如动词分类描写就几乎没人做,因为要包括形态、语义和逻辑三大分类方式,一个小类的描写就需要几千字。我花了几年时间,才大致理出一个系统,还不敢拿出手,可见难度之大。越难就越没人愿意做。从外文资料抄抄剪剪就是一篇论文或一本专著,大概是最方便的了,谁知道哪些是抄的哪些是创见?
呵呵,打住!可能又会有人要骂街了。
水电君说:
“比如說,我們目前可以在程式中把所有的中文人名如“家寶”(共32000
筆=A),前置的姓都留空,另有6700筆姓=B;然後每當A排列到B時,就
自動組成一個完整的中文姓名。”
可以的。只是未必有什么作用,除非用于起名。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-5-23 14:56 , Processed in 0.066595 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表