湘里妹子学术网

 找回密码
 注册
查看: 4465|回复: 10

武漢光衡公司Openqna Robot Demo

[复制链接]
发表于 2004-4-21 14:06:44 | 显示全部楼层 |阅读模式
http://duanduan.implight.com:8080/
很高興終於看到大陸的Online Demo!

另一個放在波蘭的Alice Robot
http://biblionetz.ethz.ch:2001

[ 本贴由 水電工 于 2004-4-21  14:15 最后编辑 ]
发表于 2004-4-25 12:41:09 | 显示全部楼层
我访问了所列的两个网站。因为没有指定范围,我以为什么问题都能回答。我随便提了两个最常见的问题,结果都没有任何回答。武汉Robot的回答就是经文。
我估计所有robot  demo也就是这个状况。
很遗憾,我不会编程。所以没有什么Demo可以炫耀的。
我正在请人给我编程,搞一个实验性Robot。以饭店吃饭方面的内容为限。只要用规定范围内的词组成问句,都会有问必答。能分辨跟吃有关的骂人话,并用相当的骂人话回敬。
我还不知道能不能搞成。这不取决于我。
我认为只有列出Robot能够理解的词语范围才有可能正常答问。否则都是摆样子Demo给自己看。
 楼主| 发表于 2004-4-25 16:46:29 | 显示全部楼层

..

最近如果上海的Server能租定,打算把自己的Robot放上去。
武漢光衡已詢價,尚無回音。
发表于 2004-4-25 18:57:17 | 显示全部楼层
希望早日看到你的Robot。
      我有一位网上朋友搞出了汉语单音节识别,本来想跟他合作给我的Robot配上语音识别。我要求他进行不同口音说同样语句的测试,把语音库扩大,再用我的匹配域技术解决同音词问题,就可以实现连续语音识别了。他因忙结婚的事,计划搁浅。
      这位朋友是神经网络天才,只是跟我一样时运不济,在一家银行打工,家境不很宽裕。也许是报酬问题吧,搞语音库花钱花时间是免不了的。没钱谁愿意干?
      我的Robot准备设计学习功能和自动补充知识库功能。学习功能以语法框架作为基础,按照框架提问和回答。系统在进行语境记录时把数据整理为知识库内容。
      语法框架按照不同类别基本动词描写框架组织,可以修改和补充。
      这种Robot的用处就是作为商店或展览宣传用,还可用于智能应答,儿童教学。
 楼主| 发表于 2004-4-25 19:54:23 | 显示全部楼层

..

目前Bell實驗室與微軟有免費的音詞聲檔可運用與測試。
xychy君如有更多想法,請賜教!
 楼主| 发表于 2004-4-25 19:56:51 | 显示全部楼层

..

這語料庫若能擴充,約在200Mb內
发表于 2004-4-26 01:51:29 | 显示全部楼层
直接利用语料库?
我本来有个想法就是先描写3000常用动词,作为知识库和语法框架的基础。利用这些动词的句法语义关系表达式把语料库里所有与这些动词有关的句子所使用的词语变成表达式相应的role的匹配域,匹配域里语义类别相同的词用语义类别表示,形成基本知识库。就有办法自动建立其余的未知动词的知识库。用这样的办法可以用较小的人力物力使计算机具有理解自然语言的能力。这样的系统干什么都行。
匹配域是指句子相关成分之间可以互相搭配的词的集合。匹配域比统计法的好处是绝对准确。可以用于解决分词、语音识别和自然语言理解的很多问题。例如,你用任何检索软件检索“和服”你会得到万条以上跟“和服”不相干的结果。这个问题就可以用匹配域解决。不信你检索试一试。
 楼主| 发表于 2004-4-26 07:40:12 | 显示全部楼层

思考

如果是用目前的AIML文法格式(類似XML的格式),加上語音檔(Wav..)大概基本要50Mb,我算的200Mb是指AIML以中文語意擴充後的規模;
一、讓ALICE能學習:
(A)有Log不斷紀錄(類似Memory),當每天有1000人跟ALICE聊天,她就要紀錄與反應各約50%/50%的檔案量。
(B)能不能將先驗的試算表放進ALICE,比如說四則運算、方程式求解?那就可以解決在人工智能實驗室有人提出的5+4 or 4+5的問題呢。
(C)讓ALICE學習的檔案用中文詞類組合,可能會較精確。(這個計算下節討論)
→這也是目前我僅能作到理解的部份。

二、有關反向檢索與詞組合的問題
反向檢索是一項必要的程式功能,但我以前提過,它不能排置趨近完美的中文詞組合。如果你問ALICE幾歲了,如果她說她187歲了,可以再問她,為什麼她會說自己187歲?前者是程式設計者設定,後者就是ALICE從資料庫反向檢索出所有可能的答案(很多迴路)。那如何讓ALICE選出最合適的答案呢?就要靠詞組標示的功能了(請別忘了,以前中文詞組切分的測試,也是前置作業吧)

三、對武漢光衡公司的興趣在於其中文詞組的擴充能力。看來他們的進度還是頗慢的,這似乎是大陸公司的通病。目前想作的是多國語的ALICE(目前老美作不出來);也就是說,您跟ALICE說鬼話,她就跟您說鬼話。

四、看了大陸許多程式高手的意見,我不禁要提出一項建議:儘量Demo,並提供所測試的環境(如Server/System/..........);畢竟我們的對手是全世界。另,如果我要讓ALICE說中國方言,是否有音效檔可用?
发表于 2004-4-26 17:30:35 | 显示全部楼层
几年前我搞过计算机解四则应用题的研究和设计,可以解“鸡兔同笼,共有多少只头,多少条腿,问有多少只鸡,多少只兔?”。我用的是语义逻辑推理的方法。对设计进行书面演算是成功的,但我不会编程,只能束之高阁。
      用语义逻辑推理的方法完全可以实现自动解题,但是用机器人训练(机器习得)的方法就不可能实现。
      我猜想,你说的机器人聊天是一种机器习得程序。
      我觉得搞这种东西没多大意思,我在《关于自然语言理解的讨论》里说过很多。
      你的搜索软件那么好,有没有进入市场?
      为什么不在国内搞一个研究和生产企业?国内劳动力很便宜的。3000以上人民币就可以聘到程序员。
      很抱歉,提这样私人问题。就像问人家挣多少钱一样不礼貌。
 楼主| 发表于 2004-4-26 18:08:26 | 显示全部楼层

..

目前只是初部的推想,預計ALICE上Server幾天就可中文化(大陸叫漢化)。
首先,我還是很想溝通的,電腦的程式寫作是很有趣的,請先不要心存距離;我自己也是被逼出來的,事後想想,事情沒那麼難的。在北大中文BBS或如人工智能BBS,常看到許多有趣的討論,只是很少看到討論者,提出自己的Demo或是測試報告,這是我在如美國PerlMonk BBS討論時很不同的風格;通常我們在討論時,會寫出自己的試算法,並會以程式當場測試。這也許是大陸方面讓我不解的地方。在國外,這些都是人類腦力的分享,是免費的,拜托大家都來測試的。在這裏介紹一個免費Server軟體,每個人都可以把它放在自己的PC(Win...),成為不必連線的Server,然後用它測試自己的程式(只是我看到許多大陸的學子,似乎很依賴現成的裝備→學校、實驗室...或某些程式寫法,如我曾提過的太依賴JAVA...),為什麼不讓每個電腦的人,都可以寫寫自己的程式,並且去RUN它(當自己的程式動起來時的喜悅,是難以形容的)↓
Sambar Server
http://www.sambar.com/
(所有程式語言都可測,包括DOS)

回首來時路,無心插柳已成蔭。開始寫程式大概是四年多吧,似乎是我個人業餘小小的腦力遊戲;有時也是想從中間找一些些的成就感、更有一層想法,是去找一些人忽略的,難以解決的問題,然後證明它是可以解決的(這或許是在國外時留下的餘毒吧)。其實程式思考之路,也有它的深層哲學,只可惜我的文筆不好,很難細緻的說與別人分明)

三年前曾到北大清大南開與大陸一些公司討論,想發掘大陸程式方面一等一的人材(單機現場操作考試),只可惜當時是失望的,沒能找到自己心目中的天才。(這麼說可能會得罪人,不過想這兩年應有改進了)
目前北京橘子的老板是我的小朋友。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-19 08:08 , Processed in 0.067601 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表