|
这篇论文写得很好,英文流畅,基本上没有语病。论文作者提出,利用由经过标注的语料库抽取的格框架网络(FrameNet)和词描述网络(可能还还算不上知识库,因为从引用的例子看,只有语义特征)(WordNet)对开放文本进行语义分析。分析过程是比较严密的。可能受测试句子本身标注完善度限制,有74.5%得到正确的语义角色标注。由于论文没有提供更详细的评估数据,我们也无法作出准确判断,但是所取得的结果应该说比统计法更准确。
由于没有涉及语境逻辑分析,就无法解决歧义问题,在结论里说可以用于消歧(sense disambiguation),未免言过其实。因为句子分析时并没有考虑介词短语的格分析和语境分析,像下面的歧义句,作者的方法就没法分辨:
(1)I saw a girl with a telescope 可分析为:
▁▁▁▁▁▁S▁▁▁▁▁▁▁▁
NP1 ▁▁▁▁▁VP▁▁▁▁▁▁
Vt ▁▁▁NP2+PrNP3▁▁▁
NP2 PrNP3
I saw a girl with a telescope
句(1)实际上是有歧义的,上面用层次分析法只得出了一个结构,意思是“我看见了一个带着望远镜的女孩子”。另一个意思“我用望远镜看见了一个女孩子”。介词结构with a telescope可以是修饰语,也可以是工具格(语义角色为工具)(与动词saw存在语义关系)。分析结果可能就是第一种意思。
作者的方法用于分析英语可能行得通,分析汉语就肯定行不通。我还没有看到有标注语义角色的语料库,而且有标注的语料库错误百出,根本就不能用。就是最权威的北大计算语言学研究所的语义词典也是没法用于汉语处理的。我说这话似乎狂妄,却是大实话。我想应该有公司使用了这种语义词典,却没有见到像样的翻译软件问世,这就说明我这话不假。
我们的方法是建立一个自然语言智能处理平台,不超过3000个的基本动词语义网络(这是需要语言学家带领学生完成的),每个动词都用不同的句法语义关系表达式描述不同义项,其中包括相关成分的语义格和相应的匹配域(可以搭配的词语集合),义项的语义和逻辑描述(包含推理规则)。表达式和匹配域可以用来自动对关键词进行语义分类,利用语料库生成关键词知识库(概念知识库)和生成未知动词语义网络和联想网络。当然,平台必须有句法语义关系分析器,句法语义关系表达式向集合逻辑表达式转换的程序、希奇语言解释程序等等。采用这个最新方法,我想计算机具有具有语音翻译、专家决策、自动编程等等智能也许不需要太长的时间。详情参阅我们贴在本栏目的论文《关于自然语言处理》和《关于理解的讨论》。 |
|