mengqing 发表于 2005-6-21 00:08:29

to 虾兄

有人曾经拿梯子和火箭做过比喻,我现在就是在想尽一切办法造火箭。以后我有不明白的、或想不通的问题,会继续请教您的。

再此先表示感谢!:yes:

小虾 发表于 2005-6-21 01:17:44

回复 mengqinghao

(1)"编码解码,就需要有两种码,和一种对应关系。码一:含义,码二:文字。"-----------------编码和解码是来自通信领域中的词汇,所涉及的实体有两个,码和被编码的对象,其中由被编码的对象到码字的过程叫做编码,而由码字到被编码对象的过程叫做解码。对应此处的情况就是:我们要表达的信息,即语义是要编码的对象,而具体的语言就是码字。所以,编码解码涉及两个实体,两种对应关系。当然,你要认为含义也是一种编码的话也无不可,但是并没有也不可能改变含义被编码的事实。
(2)“我说的“语法”,是指词利用语法进行排序后的句子。”----------------对你的语法观的正确与否暂且不论,就逻辑形式来讲有两处错误:其一是用语法来定义语法,是循环论证;其二,在你的表述中,语法到底就是句子呢还将词排列为句子的语法?
(3)“比如那个詹卫东的“语义词典”,客气的说:效果很差。”------------效果很差?请说明在什么条件下效果差。
(4)“一般?什么叫一般?就是经常使用的范围。这个范围就是认为制造的一个圈子,很多人都跳不出来。我想用就用,我管他什么一般不一般的,能解决问题就行。
”---------------诚如你所说,一般就是经常使用的范围,此处我指的是除了将语言的生成和理解类比为编码和解码外,还有其他的一些场合也采用这个类比,例如语音到文字关系也经常用编码解码来描述。坦率的说,我看到了你想跳出来的强烈心态,但是我并没有看到“能够解决问题”的任何结果,用你的话说,就是还在考虑中。
(5)“语言,传递信息的工具。工具,请问,哪个工具不是人发明的?
”--------------我倒是想问这个工具是那个人发明的?语言当然是传递信息的工具,更是一种特殊的思维工具。任何的哲学书,语言学书中,绝对不会有“人发明语言”这样的表述,根本原因在于语言的产生和发展也是客观的。
(6)“词本身是有含义的”-------------“离句无品”并不否定词本身有含义啊。
(7)“什么叫做困难?”---------------不含蓄的说,困难就是个人认为这不是一个好的突破方向,是一条不归路。其实,从语义入手来处理语言,并不是只有你才想到,业界也有很多的相关研究,国内的有知网,HNC,北大的义类词典等等,具体的分析你可以参考有关文献。
(8)关于你期望对语境进行建模的问题,并且还在研究ing,我倒是建议你研究其他的一些问题。如果你一定要不怕困难,迎头赶上,我再建议在你研究之前,不妨想想你准备用什么样的方法,用什么样的数学工具,用什么样的理念来处理这个问题。如果你没有高明的建模工具,不妨再反思一下,既然语境是如此的有前景,那么现实的研究为什么涉及得又这么少?
(9)“您就想说,我说的问题,现在的人还解决不了”-------------
我想说得是你已经踏上了“语境”的不归路了,明智的做法是回头是岸。

[ 本贴由 小虾 于 2005-6-2101:25 最后编辑 ]

mengqing 发表于 2005-6-21 10:40:18

to 虾兄

在此,先向你表示感谢。

我只回答您一个问题。因为其他的问题我们观点一致,只是由于我没有表达清楚或您理解上有误而导致了分歧。

(3)“比如那个詹卫东的“语义词典”,客气的说:效果很差。”------------效果很差?请说明在什么条件下效果差。


“语义”可以分为两方面:
1.句子层面的
2.词层面的
而词又是句子的基础,所以要先准确的确定词义。

同义词、近义词,就是说词义相同或相近的不同词汇。
利用同义词、近义词的这个特点,我把他们作为检测一个语义词典的语义学理论是否成功的一个工具。

举例说明:
您可以去那里试一下,找一下“奔跑”的同义词,结果如下:
词语:奔跑
拼音:ben1pao3
义项编码:1
释义:
语义类:位移
配价数:1
主体:人|动物|交通工具
客体
与事
例句:奔跑速度/孩子们奔跑着/推销员奔跑在乡间小道上
同类词:同类词

(我想,结果是不是有点少啊?“奔跑”的同义词不应该只有这一项吧?
接着,还可以再点击后面的那个“同类词”,点击后,结果有90多页,好象又太多了吧?)

其中一项是:
词语:藏身
例句:这里藏不了身

还有一项是:
词语:不远千里
例句:不远千里(地)来到中国/门徒来学不远千里

如果该词典所依附的语义学理论是正确的,那找到的结果就应该是正确的。
不知道你怎么看,我觉得这样的词典,没什么实用价值。

再有,查找之前,上面有条注释:
(模糊匹配,结果为包含检索字串的所有记录)

我是在查同义词,又不是在找包含某些字串的词。至少应该把模糊匹配作为可选项吧?包含该字串的词,就一定是同义词吗?难道我找到的结果中有准确的东西,就说明他好用吗?只要火箭飞行过程中所用到的数据有一点偏差,那么就会导致极其严重的后果。语义学在翻译中的应用也是这样。词义有一点不正确,那翻译后的结果就可能会千差万别!


最后您说:
既然语境是如此的有前景,那么现实的研究为什么涉及得又这么少?我想说得是你已经踏上了“语境”的不归路了,明智的做法是回头是岸。

我前面的帖子中有提到过,有些语境“目前”计算机是绝对不可能知道的。这主要指的是单句的使用环境。解决方法只有一个,最后由人来选答案。但计算机最后留给人的工作一定要做到最少,而且易行。其他有关语境的运用请您研究一下语用语法(要结合实际,因为什么都有可能是错的)。

我研究的前提是,别已经知道这么做是对的。只要没证明这么做不行,我就会去做。再明确的说一遍:我有自己的方案。我不说,是因为暂时还不想在这里讨论我的方案(也许有一天我会公布的)。我现在的工作就是围绕着我的方案进行的。

我的工作正在进行中,感觉挺好。虽然总有困难,但目前还没有遇到解决不了的问题。除非我的研究进程忽然被某个问题卡死了,而这个问题又被明确的证明过是无法解决的,而我还在继续研究,那才能说我这是不归路。


我现在研究到的是词语分类的问题,请您参与一下讨论。如果您对研究语言没兴趣,那您研究的其他有关语言的东西,可能也不会有太好的结果(个人观点)。

我明白,您对我的提醒是好意,再次表示感谢。我遇到困难时会向您请教的。

mengqing 发表于 2005-6-21 12:12:04

补充

我有明确的方法和工具。我说研究ing,实际就是不想说(这也应该算是个商业秘密吧)。

你也明白它的价值!!

你劝我的理由,就是别人做不到。
对我来说,这不是理由。要我不做这件事情,条件只有一个:有明确的、被别人证明过的,说明“这么做不行”的理由。

没被证明过的事,我就要去进行证明。

我发现,现在的语言学的研究本身就有很大的问题。想在这个基础上去研究机器翻译,跟本就不行。如果等语言学家去把问题解决掉,还不如自己去做一个语言学家、自己来解决,来得实际。:not:

我做事的原则是:一切靠自己!
可以去寻求帮助,但不能依赖于帮助。你想要的东西别人没有,即使人家想给你也给不了!这时,你只有自己去想办法。:yes:

我在研究翻译系统的同时,也要去研究语言学。首先要去修正一些语言学研究上本来就错了的东西。同时,我会把自己语言学的研究结果直接应用到翻译系统上进行验证。

我做事,一向有根据。我不做没根据的事。

小虾 发表于 2005-6-21 17:31:16

回复 mengqinghao

"我有明确的方法和工具。我说研究ing,实际就是不想说(这也应该算是个商业秘密吧)。你也明白它的价值!!"----------------------------------对不起,虽然妹子一再要求鼓励为主,但是实在忍不住了,此刻的我想起了国内经常有人宣称解决了歌德巴赫猜想的场景,实话实说而已。你可以保留意见,不必反驳我。这也仅仅是我个人管见。

“你劝我的理由,就是别人做不到。”-------------我劝你的理由有三
(1)我是坛子的斑竹,协助妹子把论坛办好,积极参加讨论是我的义务
(2)妹子认为你是个难得的上进青年。
(3)机器翻译是我的本行,所以我自信还是比较了解的,所以我能够为我的观点负责任,至少不会特别误导你。
我决不会因为别人作不到,就认为你也作不到。现在我倒是认为即使现在的机器翻译水平你也达不到,不是要有意贬低你。我说这话的依据是你认识事物的方式和方法。

“我做事的原则是:一切靠自己!”--------------能够感觉到你想跳出旧思路旧方法的强烈愿望,但是从你前面涉及的问题和方向,我可以负责任的说,没有任何新颖之处。

“现在的语言学的研究本身就有很大的问题。想在这个基础上去研究机器翻译,跟本就不行”---------------这点可以很好的反映了你对于现代机器翻译方法不了解。个人觉得现在机器翻译的问题正是语言学的介入程度太低了,更大的是依靠数学模型的进步。

“我会把自己语言学的研究结果直接应用到翻译系统上进行验证。”---------要提醒你的是任何语言学成果一定要在计算机中形式化后才能应用。

[ 本贴由 小虾 于 2005-6-2117:33 最后编辑 ]

mengqing 发表于 2005-6-21 20:08:39

再次表示感谢

我正在做的就是形式化的问题。

mengqing 发表于 2005-6-21 20:31:47

补充

个人觉得现在机器翻译的问题正是语言学的介入程度太低了,更大的是依靠数学模型的进步。

你觉得那个詹卫东的语义词典的制作依据是什么?效果不好,是因为语言学介入的程度低吗?

说心里话,我开始研究语言学以前,也是你这种想法。

而且我现在做的,就是要把语言学应用到机器翻译当中去。在这点上,我们的观点是相同的。

虽然妹子一再要求鼓励为主

关于这点,你不说,我也能猜得到。呵呵,大人教小孩,一定会是这个态度。她不希望我受到刺激,但她小看我了。

此刻的我想起了国内经常有人宣称解决了歌德巴赫猜想的场景

我现在看到的现象正好和你说的相反。现在有很多人都说自己的机器翻译软件的水平有多么高,而且把成果拿出来给大家看。可实验结果都一样……

最后说一遍,翻译软件研究出来以后,我是自己用的。我用它来做服务,做服务比卖东西更赚钱,不知道你是否了解?所以,是真是假,没必要讨论。我做不出来,是我笨,我应该穷一辈子。我做得出来,说明我聪明,我应该变得富有。我对后果看得很清楚,我没说自己一定是对的。我会自己进行验证的。

你说忍不住了,这说明你的情绪开始占上风,你的情绪开始替代你的思维能力来指挥你。提醒你,控制自己情绪的能力,是人的智力高低的一个重要指标!这是我对智力研究的一个结果。但这只是我众多结论中的一个罢了。

mengqing 发表于 2005-6-21 21:44:11

既然您是来教导我的,那您就不应该说这个我不懂,那个我不了解。我想,您的翻译手段没什么可保密的吧?

(现在机器翻译的手段都差不多。如果我没理解错,其中“基于规则的”好象就是指以语法规则为翻译基础的吧?还有什么语料库,什么基于统计的,还有主张各种方法都一起用的、基于混合的等等。方法到还真是多啊!但好象就是没有一个是能“用”的?我的“用”指的是效果差,您别再误解了)

你不用详细告诉我,你只需要大概讲一下理论就行了。除了数据库,就是高级语言。你说用数学模型,无非就是把数学公式编成了程序。我也是学计算机的,我想,我能看得懂。

如果我说的话让您觉得我这个人很“浅薄”,请您别生气。别忘了,您是来教我的。我是学生,我浅薄是应该的。你把我教会了,我就不浅薄了,您说呢?

mengqing 发表于 2005-6-21 22:20:00

虾兄, 你别着急

我也忍不住了,我要开始向你解释我的理论了。

给我点时间,我要准备一下。

小虾 发表于 2005-6-21 23:22:06

“你觉得那个詹卫东的语义词典的制作依据是什么?”-------------我不是詹卫东,我不知道他的依据是什么。我个人对义类词典不敢兴趣。
“效果不好,是因为语言学介入的程度低吗?”---------------准确的讲,我不知道是什么原因,只是目前我认为这种可能性比较大。
“我现在看到的现象正好和你说的相反。现在有很多人都说自己的机器翻译软件的水平有多么高,而且把成果拿出来给大家看。可实验结果都一样……”----------每个“解决”歌德巴赫猜想的人都认为自己是正确的!

“最后说一遍,翻译软件研究出来以后,我是自己用的。我用它来做服务,做服务比卖东西更赚钱,不知道你是否了解?所以,是真是假,没必要讨论。我做不出来,是我笨,我应该穷一辈子。我做得出来,说明我聪明,我应该变得富有。我对后果看得很清楚,我没说自己一定是对的。我会自己进行验证的。----------你某一天你说你做出来了,我坚信就等同于有人宣布证明了歌德巴赫;你没有做出了,我觉不会认为你笨。至于你做出来之后要如何如何,我不感兴趣,也建议你在以后的讨论中尽可能的集中在学术问题上,以维护妹子论坛的学术特色。
“你说忍不住了,这说明你的情绪开始占上风,你的情绪开始替代你的思维能力来指挥你。提醒你,控制自己情绪的能力,是人的智力高低的一个重要指标!这是我对智力研究的一个结果。但这只是我众多结论中的一个罢了。”-----------------------你也可以看到我即使是在忍不住的情况下还在条理清楚地逐字逐句地反驳着你的观点,这是我情绪代替思维的反应吗?这难道不正好体现了我强大的自我控制能力吗?
“既然您是来教导我的,那您就不应该说这个我不懂,那个我不了解”------------我不知道为什么你会有这样的想法,我为什么要来教导你?我也没有能力教导你。我认为真理面前人人平等,坛子里的辩论也是对等的。我说你“这不懂,那不懂”是我通过我和你的交流,根据我的知识,做出的判断,你可以反驳我,证明我错了!

既然你认为规则,统计,或者两者结合的方法都不好,那么你就要提出你的新方法,并展示该方法的优点。如果你提不出你的方法,那么就不要为了反对而反对。

“你不用详细告诉我,你只需要大概讲一下理论就行了”-----------参考资料很多啊,比如北大的计算语言所就有很多资料。


“如果我说的话让您觉得我这个人很“浅薄”,请您别生气。别忘了,您是来教我的。我是学生,我浅薄是应该的。你把我教会了,我就不浅薄了,您说呢? ”--------从来没有觉得你浅薄,只是觉得你目前的认识有问题。我从来就不是来教你的,你也从来就不是学生。我和你是平等的,都是妹子论坛的成员。我自己对于机器翻译都还认识得不深刻,我如何能将你教会呢?实在是言重了。


另外,再强调一遍,请你在展开时注意集中在学术问题上。比如精神控制能力和智力的关系,再比如你要将你地机器翻译如何如何,这些与学术无关地东西,最好能不涉及
页: 1 2 [3] 4 5
查看完整版本: [原创] 语义、语法和语境之间的关系