湘里妹子学术网

 找回密码
 注册
查看: 3066|回复: 1

面向自然语言处理的现代汉语词组本位语法体系(詹卫东)

[复制链接]
发表于 2004-4-28 14:21:45 | 显示全部楼层 |阅读模式
发表于 2004-4-28 22:58:03 | 显示全部楼层

对詹卫东〈面向自然语言处理的现代汉语词组本位语法体系〉一文的评论

对詹卫东〈面向自然语言处理的现代汉语词组本位语法体系〉一文的评论
      本文可取之处是注意到词组之间的功能组合关系的描述,特别是对词组的功能分类。譬如:“红”跟“红色”两个词,按功能分类的标准,前者可划入形容词类,后者则属名词类。在句法形式上表现为“红”可以在“不、很”的后面出现形成合法的结构。而“红色”不能;“红”可以后附“着、了、过”等助词,而“红色”不能。等等。
    但是仍过分拘泥于传统语法。传统语法不承认汉语有独特的形态体系,我们的汉语学家几乎从来没有人研究这样的问题。例如:               
      “这个人的确心眼儿很好”中,“这个”是名词性词组的指示标记,“的确”是述语指示标记,“心眼儿”的“儿”是名词标记,“很好”和“很”(词组后边不带“的”时)也是述语标记“很好”还是属性标记。根据这些标记计算机很容易把它分析为:
      <这个>人||<的确>|心眼儿||很好
      根据这个表达式,计算机可以构成树状链表,也可以在“这个”指示的人名下,记录其属性。
      黄昌宁指出了短语结构语法不能解决结构歧义问题:
      
      “有时当机器观察到相邻出现的“N+V”词类序列时,甚至不能判断它们是不是在同一个短语中。也就是说,“N+V”词类序列可能组成名词短语NP或小句S,也有可能根本就不在同一个短语里。后面这种歧义称为“短语边界歧义”。下面是两个相关的例句:

    (1)中国的[铁路N建设V]NP发展很快。
    (2)[中国的铁路N]NP建设V得很快。
      前一个例句中,“铁路 建设”组成一个NP;而在后一个例句中,这两个相邻的词却分属于两个不同的短语。 这足以说明,基于单一标记的PSG不能充分地描述自然语言中的句法歧义现象。下面再看一些这样的例子。

    (3)NP→V N1 de N2
      (4)VP→V N1 de N2
      其中de代表结构助词“的”。例如,“[削 苹果]VP的刀”是NP;而“削[苹果 的 皮]NP”则是VP。这里既有短语类型歧义,又有短语边界歧义。比如,“削V苹果N”这两个相邻的词,可能构成一个VP,也可能分处于两个相邻的短语中。

    (5)NP→P N1 de N2
      (6)PP→P N1 de N2
      规则中P和PP分别表示介词和介词短语。例如,“[对 上海]PP 的印象”是NP;而“对[上海的 学生]NP”则是PP。相邻词“对P上海N”可能组成一个PP,也可能分处于两个短语中。

    (7)NP→NumP N1 de N2其中NumP表示数量短语。 规则(7)虽然表示的是一个NP, 但可分别代表两种结构意义:

    (7a)NumP[N1 de N2]NP 如:五个[公司的职员]NP
      (7b)[NumP N1]NP de N2 如:[五个公司]NP的职员”。
      这个现代汉语词组本位语法体系也没有考虑词组与词组之间的语义匹配关系,我们叫做匹配域。我们不知道这个体系解决歧义问题的高招,但是利用匹配域不仅可以解决分词问题,还可以解决歧义问题。
      例如,句(1)“中国的[铁路N建设V]NP发展很快”里的“铁路N建设V”属于动词“发展”施事的匹配域。
    句(2)“[中国的铁路N]NP建设V得很快”中的“得”是动词“建设”的述语标记,“铁路”属于其受事匹配域。
      可见词组本位语法体系也没有解决什么大问题。
      只要跳出传统语法的牢笼,开阔视野,没有解决不了的问题。

[ 本贴由 xychy 于 2004-4-28  23:03 最后编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-5-14 22:50 , Processed in 0.082420 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表