湘里妹子学术网

 找回密码
 注册
查看: 3123|回复: 0

跨语言文档对齐

[复制链接]
发表于 2005-3-14 14:10:21 | 显示全部楼层 |阅读模式
http://www.icl.pku.edu.cn/icl_in ... 跨语言文档对齐.pdf_
王洪俊,施水才,俞士汶  
内容:

本文提出了一种新的双语文档对齐算法,该算法用TfIDf方法进行文本特征提取和权重计算,使用统计翻译模型进行双语词汇对齐,用Dice方法的改进算法计算双语文档的相似度。实验表明,该算法可以准确地发现一种语言书写的文档在另一种语言中的译稿,可应用于双语重稿检测、跨语言相似文本检索等领域。

[ 本贴由 Artvine 于 2005-3-14  14:18 最后编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-29 19:21 , Processed in 0.097436 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表