不過“歸右原則”還有需要修正的地方,既對於“連續型交
叉歧義”會發生錯誤,需要補充一條“左部結合”原則:若
ABCDE為連續型交叉歧義字段,“歸右原則”產生切分A B
C DE;再由“左結合原則”(合併最左邊的A、B)而得到A
B C DE。例如“結合成分子”─>“結 合 成 分子”─>“結
合 成 分子”。
à
黃昌寧,中文信息處理中的分詞問題,語言文字應用,1997
年第1期。
à
宋柔,分詞 : 漢語信息處理的基礎工程,計算機世界報,
技術專題版,1997年第48期。
à
穗志方,博士生綜合考試及開題報告,北大計算語言所,1997。
à
劉源 等,信息處理用現代漢語分詞規範及自動分詞方法,清
華大學出版社,1994。
à
何克抗,徐輝,孫波,書面漢語自動分詞專家系統設計原理
,中文信息學報,1991(2);書面漢語自動分詞專家系統的
實現,中文信息學報,1991(3);
à
白栓虎,漢語詞切分及詞性標注的一體化方法,中文信息處
理應用平臺工程,電子工業出版社,1995。
à
周強,俞士汶,一種切詞和詞類標注相融合的漢語語料庫多
級加工方法,教學參考資料,北京大學計算語言所,1993。
à
周強,段慧明,現代漢語語料庫加工中的切詞與詞性標注,
中國計算機報,第21期,1994。
à
沈達陽,孫茂松,黃昌寧,漢語分詞系統中的信息集成和最
佳路徑搜索方法,中文信息學報,11卷2期,1997。
à
劉挺,吳岩,王開鑄,串頻統計和詞形匹配相結合的漢語自
動分詞系統,中文信息學報,12卷1期, 1998。
à
陳力為,袁琦 主編,語言工程,清華大學出版社,1997。
à
陳力為,袁琦 主編,計算語言學進展與應用,清華大學出版社,1995。
à
陳力為 主編,計算語言學研究與應用,北京語言學院出版社
,1993。
à
揭春雨 等,論漢語自動分詞方法,中文信息學報,1989(1)。
à
黃祥喜,書面漢語自動分詞的“生成─測試”方法,中文信
息學報,1989(4)。
à
王永成 等,中文詞的自動處理,中文信息學報,1990(4)。
à
Andi Wu, Zixin Jiang, Word Segmentation in Sentence Analysis
,1998年中文信息處理國際會議論文集,清華大學出版社,
1998。
à
吳立德 等,大規模漢語文本處理,復旦大學出版社,1997。
à
馮志偉,自然語言機器翻譯新論,語文出版社;
à
馮志偉,自然語言的計算機處理,上海外語教學出版社,1995;
à
俞士汶 等,現代漢語語法信息詞典詳解,清華大學出版社,1998。