湘里妹子学术网

 找回密码
 注册
查看: 2824|回复: 4

见到了曙光(原创)

[复制链接]
发表于 2004-3-24 15:02:21 | 显示全部楼层 |阅读模式
rgzn2010君的《分析派和反扑归真派》(见楼下)写得很好。所列举的分析例句雄辩地证明了试图用简单的程序教计算机学会理解自然语言是多么不切实际。不过,他说:

      “一派注重语法和逻辑分析(简称“分析派”)。强调“计算机是依靠规则工作的”。这种观点的合理性是显而易见的。问题在于可能需要数量庞大的规则。如何去提炼这些规则? 简化这些规则? “集合逻辑”的概念在这方面提供了一个有益的思路。但是, 还有很多困难问题尚未解决。如汉语的分词问题, 语法问题。由于汉语基础理论尚未完善, 对提炼规则造成很大影响。另外如何合理构造知识库也是一个大的问题。”

      对于rgzn2010君提出的难题,也是计算机理解自然语言的难题,更是主张只有采用统计法才是解决大规模资料处理(例如,信息检索)问题的唯一选择的黄昌宁等学者质疑所在。               
      分词已经不是问题,已经面世的分词软件中,北大计算语言学研究所等开发的成绩不俗。我曾经提出字偶切字法,因未经实证,不敢夸耀其好处。关于汉语语法我提出建立汉语形态体系(形态标志、标志词和逻辑词等),采用句法语义关系分析法分析得出动词句法语义关系表达式,并按照形态和句法语义关系表达式进行动词句法、语义和逻辑分类,对大约3000动词进行了初步分类。正在建立语义推导逻辑体系和量词逻辑体系和行为逻辑、隐含逻辑、因果逻辑、数量逻辑、时空逻辑等等语义逻辑推理规则系统。利用这些规则系统,加上语义域理论,可以实现知识库的自动生成,实现计算机解各种决策问题。
      语义域理论也是合理构造知识库的核心理论,我希望在第二届人工智能基础理论会议上发表这一理论。我并非科班出身的什么知名人物,能否被接受还很难说。任何理论都必须有实证支持,无人喝彩也是很正常的。甚至能不能进入这样的学术会议的大门都是未知之数。
虽然所有这些都是理论,都必须经过实验验证,但是我们已经看到了解决计算机理解自然语言的曙光。所以我们正在组织几位朋友开发小型人机对话系统,用实践证明上述理论是正确的。
      我之所以说这些,并不是为着夸夸其谈,炫耀本事,而是希望得到各方面的支持,也希望对此感兴趣的朋友们参与合作。

[ 本贴由 xychy 于 2004-3-24  15:07 最后编辑 ]
 楼主| 发表于 2004-3-24 15:05:53 | 显示全部楼层

分析派和反扑归真派

分析派和反扑归真派                     
       转贴自《人工智能研究者俱乐部》
                     ——标题系转贴者所加
      重读了一遍各位的高见。看来关于自然语言理解的观点可大致上分为两大派。一派注重语法和逻辑分析(简称“分析派”)。强调“计算机是依靠规则工作的”。这种观点的合理性是显而易见的。问题在于可能需要数量庞大的规则。如何去提炼这些规则? 简化这些规则? “集合逻辑”的概念在这方面提供了一个有益的思路。但是, 还有很多困难问题尚未解决。如汉语的分词问题, 语法问题。由于汉语基础理论尚未完善, 对提炼规则造成很大影响。另外如何合理构造知识库也是一个大的问题。
      另一派主张不需要把语法,语义(不尽然) 和逻辑编入计算机程序。他们希望计算机能模拟人类的自然思维, 并认为人们在自然思维过程中不必考虑语法和逻辑。他们希望计算机能像一个小孩子最初的学习那样, 学会提问, 记住有关结果。再提新问题, 记住更多的结果。循环往复, 最终成为有智能的机器。换句话说, 只要教会计算机怎样学习。给于计算机第一推动力, 剩下的事, 就是各行各业的专家去教它的问题了。这一派可被称为“反朴归真派”。
      “反朴归真派”的愿望是良好的, 但ruiaijun 君的方法能否真的让其程序做到理解自然语言呢? 他“想让计算机掌握词汇的分类,然后按词类组成句子表达出去”。这种句子合乎常理吗? 让我们考查下面一个例句:
张三正在津津有味地啃着一条鸡腿。
      程序运行…., “谁是张三? ” 答: “张三是一个人”, ……, “一个人怎样”, 答: “一个人正在津津有味地啃着一条鸡腿”, ……
程序运行完毕。词汇分类成功!
测试输入: “张三怎样” ? 程序运行: “张三正在津津有味地啃着一条鸡腿。”
有点意思! 请将 “张三” 与 “鸡腿” 掉换位置, 再输入运行。
程序运行…., 没有新词, …. 没有问题, ….. 程序运行完毕。理解成功!
测试输入: “鸡腿怎样” ?
程序运行结果: “鸡腿正在津津有味地啃着一条张三。”
      不知“反朴归真派” 是用什么办法解决这样的问题的。当然这不只是个语法问题。我想光靠语法分析还不够, 但没有语法分析, 笑话肯定会更多。要计算机理解自然语言, 语法分析,语义分析,逻辑分析和知识库都是不可或缺的。但靠问答方式来建立这个体系肯定是低效的。
       “反朴归真派”另一个有代表性想法是: 人们不想语法(甚至根本没听说过语法这会事), 照样很好地交流; 人们不想逻辑(甚至根本没听说过逻辑这会事), 照样思维。
什么是语法? 语法其实就是人们通用的语言表达格式。是人们在长期交流中逐渐形成的最容易被理解的表达格式。它是随语言共同进化的产物。在语言进化的过程中, 可能曾有过多种多样的表达格式, 但由于容易产生误解而被逐渐淘汰, 剩下来的是相对而言最准确和最方便者, 并成为约定俗成的习惯表达方式。语言学家们将这种习惯表达方式总结出来, 称之为语法。人们平时交流中不想语法, 并非不遵循语法, 而是因为已经非常熟练地掌握了这种通用的习惯表达方式, 从而是在无意之间遵循着语法。一旦你听到不正确的语法时, 就会敏锐地感觉出来。比如你若听到有人说: “我的通通语法的不会, 明白大大交流的好” 。你一听便知说这话的不像是中国人。这是因为你察觉到了这种语法不是正确的中文语法, 你实际上做了语法分析。当人们学习一门外语时, 将很容易觉察到自己对自然语言的语法分析过程。
      所以“反朴归真派”以为自己理解自然语言时不用语法, 其实是一种误解。逻辑思维也是同样的道理。但在分析复杂问题时, 比如证明几何题, 破案或法庭调查时,人们就需要有意识地考虑逻辑了。小孩子学习讲话和做文章时, 经长会出现语法错误或逻辑错误, 老师需要不断纠正, 并示范正确的语法和逻辑, 直到小孩子能够正确和熟练的运用为止。因此,“反朴归真派” 即使希望计算机能像一个小孩子最初的学习那样也离不开语法和逻辑。也有人想“不能把逻辑灌输给计算机,而是让它自己去学,让它把逻辑变成自己灵魂的一部分”。“自己去学” 是一种很慢的办法, 人们目前还无法把知识快速地输入大脑, 学十几年, 几十年, 那是没有办法的办法。计算机学习自然应扬长避短。
      综上所述, 要计算机理解自然语言, 又要逃避语法分析,语义分析,逻辑分析和知识库的想法是毫无根据的。机器若要拥有智能, 必须运用智慧的原理。就像机器若能飞行,必定采用了空气动力学一样。
       前文虽然反对“反朴归真派”逃避分析的思想, 但其避繁就简,反朴归真的思路却是深得自然之大道的。我们所处的物理世界极为复杂多变, 但一组为数不多的原理却将其基本囊括。我们所处的生物世界更是多姿多彩, 但一条“物竟天择, 优胜劣汰, 适者生存”的法则,却将其提纲挈领。我们这个地球上高山平原, 江河湖海, 火山地震, 沧海桑田, 但一个地慢对流, 板块运动机制便将其尽收眼底。由此类比人类变换莫测的思维之道呢? 想来也不应当千头万绪才是。也许这就是ruiaijun 君 “反朴归真”信念的来源吧。
Edited by - rgzn2010 重新编辑於 2004/03/23 02:52:05
发表于 2004-3-30 13:05:51 | 显示全部楼层
我当时的答复您怎么不贴呀?
发表于 2004-4-3 09:36:25 | 显示全部楼层
因近日论坛数据库出了点小问题所以 xychy 昨日发一回帖不成功,现将 xychy 兄给我的短消息附在下面:
我准备在《见到了曙光》回帖,但连发两次都出错。不知何故?我也不能直接从《论坛向导》进入。
我的回帖如下:

我才看到这个帖子。迟复为歉。
这个坛子很自由的。你自己可以贴,我不会删掉。但是我作为版主之一,在转贴帖子时我得考虑网友是不是愿意看,是不是有参考价值。如果是我的文章具体提及的帖子,我会附贴在后边供参考,如前边就转贴了好几篇,都是对手的帖子。
就像杂志编辑选择稿子是编辑的权利和自由,不选贴你的帖子是我的权利和自由。我不会无缘无故选贴别人的帖子。。
你在这个坛子可以自由贴你的观点,只要不涉及人身攻击,我们都不会删。如果涉及人身攻击,因为可能触犯法律,我就有责任删除。
 楼主| 发表于 2004-4-4 00:23:10 | 显示全部楼层
谢谢风兄。昨晚一个长帖子就没发成,浪费了很多时间。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-5-20 13:16 , Processed in 0.068042 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表