湘里妹子学术网

 找回密码
 注册
查看: 4923|回复: 0

国家语委现代汉语语料库检索系统(网络媒体分中心)

  [复制链接]
发表于 2009-5-4 13:24:17 | 显示全部楼层 |阅读模式
国家语委现代汉语语料库检索系统(网络媒体分中心)
“国家现代汉语语料库”是由中华人民共和国国家语言文字应用委员会主持建立的一个现代汉语书面语通用平衡样本语料库,它于1993年开始建设。该语料库的第一批语料数据是1919年至1992年的语料,共7000万字,以后每年递增1000万字,是目前最大的现代汉语平衡语料库。
本系统处理的是国家语委语料库中的2000万字精加工语料,拥有强大的查询功能,能为汉语言的调查、统计与分析提供便捷的服务。在整个查询系统中,用户可自由选择语料的领域(政治、经济、体育等),并且可以自由限定返回结果的词语数量,同时还能对查询条件进行词性的限定。该系统具有三种查询功能:

1.普通查询:用户输入字或词进行全文检索,用户可以自由选择检索方式(精确、模糊等)。
2.模式查询:用户提交所需要的语言模式,例如“高高兴兴”,“迷迷糊糊”等重叠词可表示为“aabb”的模式(其中字母可任意指定), 系统将返回语料库中所有满足这些模式的结果。
3.高级查询:该功能提供更加灵活的查询方式。我们首先制定了一套简明的语法规则(可参看说明),用户根据该语法来自由表达查询意愿,从而得到更加灵活的查询结果。

此外,该检索系统还提供进阶处理功能,能在首次查询出的结果中再次查询,从而进一步返回更加符合用户需求的结果。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-5-3 10:06 , Processed in 0.083108 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表