霜叶红 发表于 2006-12-20 16:06:28

网络流行词追踪

来源:http://pop.clr.org.cn/achieve.jsp#hotEvent

      流行语就是在某一时期,某一地域或某一人群中迅速传播、盛行的词语。网络流行语就是在网络中的某一时期或某一网络社区中迅速传播、盛行的词语。网络流行语具有如下特点:扩散性,时效性,地域性,密集性。

    我们认为网络流行语应该具备3个最基本的特性:

      1、研究的时间范围内被关注程度有明显的上升过程,且上升过程较迅速;

      2、上升过程具有一定的“绝对高度”,即出现的次数较多;

      3、上升过程到一定高度后保持一段被关注时间。

    为了使网络流行语的监测与发布具有科学、动态和权威性,我们基于国家语言资源监测与研究中心(网络媒体)的监控语料库进行网络流行语候选词语表的筛选工作。

    动态语言知识更新量化的统计结果不是一个数据形成的“点”,而是由无数量化的点构成的一条“线”,一条可以观察到历时的变化的曲线。因此对流行语的研究要基于一条变化的曲线。首先,我们依据非平稳时间序列分析和预测理论,对网络流行语的原始数据进行非线性趋势分析,得到每个流行语的流行性曲线。

http://pop.clr.org.cn/images/word-sudanhong.jpg
图:“苏丹红”的流行性曲线(蓝色)

http://pop.clr.org.cn/images/word-supergirl.jpg
图:“超级女声”的流行性曲线(蓝色)

http://pop.clr.org.cn/images/word-furongjiejie.jpg
图:“芙蓉姐姐”的流行性曲线(蓝色)

http://pop.clr.org.cn/images/word-fangzhipin.jpg
图:“纺织品谈判”的流行性曲线(蓝色)

http://pop.clr.org.cn/images/word-oil.jpg
图:“油价”的流行性曲线(蓝色)

    然后我们依据可靠性理论并根据我们对网络流行语概括的特征建立流行特征模型。

http://pop.clr.org.cn/images/module.gif
图:流行特征模型曲线

    对每个流行语的流行特征曲线,我们进行流行特征模型拟合,符合条件的词语作为网络流行语的候选词语,最后由人工来对候选词语进行筛选 。
页: [1]
查看完整版本: 网络流行词追踪