湘里妹子学术网

 找回密码
 注册
查看: 5570|回复: 3

[程序发布专帖]英汉互译系统-理论验证版(基于语义转换)【更新:2008.02.

 关闭 [复制链接]
发表于 2007-7-15 17:44:29 | 显示全部楼层 |阅读模式
软件介绍(机器翻译):

1.目前本软件仅作为理论验证使用,翻译识别范围有所限制。
2.软件翻译机制为:“源语言文字→含义模型→目标语言文字”(根据词语含义及人对语言的实际使用状况,采用人工智能方式进行转换)。
3.软件翻译目标:尽可能的使各语言间实现100%的精确翻译。

软件特点:

采用文字含义进行翻译,可大大提高翻译的准确率,远非一般机器翻译所能比拟。现有机器翻译均为使用统计学公式计算出翻译结果。该方法先天缺陷明显。由于是出于统计学,那翻译错误就变成了必然现象,且计算机并不能真正理解语句的含义。

具体方法:

1.根据语言文字建立含义模型,再根据已建立的含义模型转换出另一种语言文字。
2.转换过程采用智能判断方式,如:对词语歧义、一词多义、未登录词的分析。

请参考以下在线翻译系统进行翻译效果对比:

1.华建翻译中心:
http://www.hjtrans.com/

2.在线翻译-免费在线翻译网站-网络中国
http://tran.httpcn.com/


软件讨论专用帖(欢迎参与讨论):
(现处于研发初期,如有合作研发意向,请联系本人。要求具有研发、营销经验的大型企业。)
http://www.xlmz.net/forum/viewthread.php?tid=22107&extra=page%3D1


本翻译软件在所有可识别范围内的翻译错误均为不正常现象,发现后请及时通知,谢谢。

测试程序见“附件”
(只提供最新版的下载)

[ 本帖最后由 mengqinghao 于 2008-2-23 14:51 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
 楼主| 发表于 2007-7-15 17:45:34 | 显示全部楼层

开发环境:

OS:Microsoft Windows XP Professional SP2 简体中文版/繁体中文版
VB:Visual Basic 6.0 Service Pack 6
ADO:Microsoft ActiveX Data Objects 2.6 Library

[ 本帖最后由 mengqinghao 于 2007-11-13 00:38 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
 楼主| 发表于 2007-7-15 18:00:08 | 显示全部楼层

版本更新说明:

本程序的最初编写起始于2006年1月。

1.英汉互译系统-理论验证版(基于语义转换)0.0.0.1
(1)软件功能:翻译任意大小“基数词”。
(2)文字识别范围:
汉字:零-九,十、百、千,万、亿。
英文:zero-nine,ten-nineteen,twenty-ninety,hundred,thousand、million,and,“-”(连字符)。
(3)基本切词功能:1.切字(汉语)。2.切单词(英语)。3.由字(单词)组词(文字含义连接)。
(4)数词模型的建立。
(5)基本的歧义判断功能。

测试文本举例:

汉语文本:
一百万兆零五百四十三亿零七百零五万零三十三。
一百万兆零五百四十三亿七百零五万零三十三。
一百万兆五百四十三亿七百零五万三十三。

英语文本:
one million trillion and fifty-four billion three hundred and seven million and fifty thousand and thirty-three.
one million trillion and fifty-four billion three hundred seven million and fifty thousand and thirty-three.
one million trillion fifty-four billion three hundred seven million fifty thousand thirty-three.

注:以上六个数词,含义相同,翻译结果相同。

更新日期:2007.07.15。

2.英汉互译系统-理论验证版(基于语义转换)0.0.0.1更新(版本号未变)
(1)增加文字识别范围:
汉字:兆。
英文:billion,trillion
(2)修改两处bug。

3.英汉互译系统-理论验证版(基于语义转换)0.0.0.2
(1)修改一处可能导致翻译错误的代码。
(2)精简部分代码。
更新日期:2007.07.26。

4.英汉互译系统-理论验证版(基于语义转换)0.0.0.3
(1)添加遗漏的代码。
(2)精简部分代码。
(3)程序界面做小幅度修改。
(4)修改部分代码,以支持程序在中文繁体Windows XP系统下运行。由于vb6.0的限制,繁体系统下暂时只支持“英译汉”。
更新日期:2007.08.07。

5.英汉互译系统-理论验证版(基于语义转换)0.0.0.4
(1)修复翻译内容中含有英语的“单引号”时所产生的错误。
(2)修改翻译过程中读取数据库的过程。
(3)程序界面做小幅度修改。
更新日期:2007.08.16。

6.英汉互译系统-理论验证版(基于语义转换)0.0.0.5
(1)修复几处可能导致翻译错误的流程。
(2)修改部分内容,为下一步支持量词翻译做准备。
更新日期:2007.09.18。

7.英汉互译系统-理论验证版(基于语义转换)0.0.1.0
(1)增加了单位量词的识别(单位量词模型、数量词模型的建立)。
        包括:长度,面积,体积,容积,质量。(其中只包括“公制”,其他非标准制度的数据没有添加)
(2)切词:增加了直接切词功能,用于补充原有的切字组词功能。
(3)语法:英语输出时对“单词复数”的判断。
更新日期:2007.10.31

8.英汉互译系统-理论验证版(基于语义转换)0.0.1.1
(1)修改部分可能导致翻译错误的流程。
翻译例句:一百零一千克(公斤)/one hundred and one kilograms。
更新日期:2007.11.03

9.英汉互译系统-理论验证版(基于语义转换)0.0.1.2
(1)修改数据库中单位量词的存储结构。
翻译例句:一百零一平方米/one hundred and one square meters。
更新日期:2007.12.12

10.英汉互译系统-理论验证版(基于语义转换)0.0.2.0
(1)添加最基本的“普通名词”转换功能。暂不识别英语中的复数名词。
翻译例句:苹果/apple。
更新日期:2008.01.22

11.英汉互译系统-理论验证版(基于语义转换)0.0.2.1
(1)修正几处导致翻译错误的BUG。
(2)添加了用于版本说明的文本文件。
(3)(3)为第一个智能判断模块进行升级,由暂时功能转为正式功能。
切词模块总数:3个。可切出所有词汇。
词语间的含义连接模块总数:1个。目前负责将“数词”与“量词”两个含义连接成“数量词”。
智能判断模块总数:2个。用于切词及含义连接。
翻译例句:“米”有两个含义:分别为名词、量词。“米”默认翻译为“rice”。“一米”默认翻译为“one meter”。“一平方米”翻译为“one square meter”。
更新日期:2008.02.23

[ 本帖最后由 mengqinghao 于 2008-2-23 14:59 编辑 ]
 楼主| 发表于 2007-7-15 18:06:49 | 显示全部楼层

即将添加的翻译功能:

汉语中个体量词和名词的搭配

[ 本帖最后由 mengqinghao 于 2008-1-23 17:23 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-28 02:13 , Processed in 0.107784 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表