一個有用的鏈接
北京语言大学对外汉语研究中心http://www.dwhyyjzx.com/宋柔教授《线性文法及其在智能信息处理中的应用》项目顺利结项
來源:http://www.dwhyyjzx.com/template/news_cn/?id=3453日前,据国家自然科学基金委通知,北京語言大學宋柔教授《线性文法及其在智能信息处理中的应用》项目顺利结项。
中文信息处理要使用到汉语的语法。但长期以来,中文信息处理界所使用的汉语语法体系基本上是面向英语的,面向人的和面向结构分析的。本课题为了提高汉语处理应用软件的性能,打破这一传统,彻底反思汉语处理的语言学基础,研究适合于汉语的、适合于计算机处理的、适合于词语线形关系的文法,创新性地提出了线形文法的思路,并有多方面的原创性成果,包括:
1)提出了简单短语概念并拟订了界定规范,设计了相应的识别方法;
2)提出了基于线性邻接分布特征的词语相似性计算方法,有效的缓解了统计的数据稀疏问题;
3)提出了基于可信度的人名识别方法和多特征集成的新词语识别方法,理论成果应用到了计算机辅助校对系统、字音转换系统中;
4)研究过程中开发和完善了一批高性能汉语处理软件,包括通用汉语分词系统GPWS和面向语言教学研究的汉语语料库检索系统CCRL,为10亿字的汉语文本建立了索引可进行词语属性检索;
5)建立了数百万纪录带有上下文的简单短语语料库。软件系统和相关技术为新浪网、哈佛、北大、清华等海内外多家单位和个人使用。
本课题发表论文20余篇,申报国家发明专利1项,并获2005年教育部科技进步奖。 北京语言大学对外汉语研究中心是我们论坛的“友情链接“呢!
哦,近视眼 才看到
;-) ;-) ,刚看完亚运会乒乓球男双的决赛,陈屺/马琳输了,:-( :-( ,近视眼真不好啊 研究过程中开发和完善了一批高性能汉语处理软件,包括通用汉语分词系统GPWS和面向语言教学研究的汉语语料库检索系统CCRL,为10亿字的汉语文本建立了索引可进行词语属性检索;已TEST。似乎喜歡用win32(exe)寫程式。
页:
[1]