中文信息处理(Chinese Information Processing)指的是利用电子计算机来存储,加工和传播以汉字形式承载的信息。中文信息处理大致上可以区分为两个层次:(1)在符号层进行的中文信息处理;(2)在内容层进行的中文信息处理。
符号层的处理要研究的是汉字在计算机中如何输入、输出;内容层的处理则要研究如何让计算机能像人一样“看懂”中文的意思。举个简单的例子,对于“聪明”这两个汉字,就像人们可以自如地写在黑板上或者纸上一样,现在人们也可以通过键盘输入到计算机中,显示在计算机的屏幕上,这就是计算机在符号层次上进行中文信息处理。在这个层次上,计算机处理的是“信号”,也就是“符号”的“形式”,而不是“内容”。如果可以编写出一个计算机程序,当人们向计算机输入“张三很聪明”时,这个计算机程序可以响应(输出):“张三脑子蛮灵光的”或者 “Zhang is very smart”,人们就会觉得计算机看懂了“张三很聪明”这句话的意思。这时候,计算机就是在内容层次上进行中文信息处理了。在这个层次上,计算机处理的是真正意义上的“信息”,也就是“符号”的“内容”。