湘里妹子学术网

 找回密码
 注册
查看: 1531|回复: 0

简易四码汉字输入法

  [复制链接]
发表于 2012-6-12 07:48:41 | 显示全部楼层 |阅读模式
简易四码汉字输入(查字)法
作者:李雪峰
一、使用方法

1.本输入法把汉字的笔画归纳为横、竖、撇、折四种,其中横含提(如“氵”的第三笔),竖含竖勾(如“寸”的第二笔),撇含点、捺。输入时,需要分别数出要查字的这四种笔画的笔画数,并按横、竖、撇、折的顺序组合成四位数码(若无某种笔画,则该数码为“0”),这种数码组合称字码。如“涤”字,它有两横、一竖、六撇、一折,它的字码即是“2161”。 2.每个方形(四角都是直角的四边形)算作三个竖笔,每个两笔及两笔以上笔画端点相接笔形(如“厂、⺁、 尸、弓、己、巳、凹、凸、了、冖、几、冂、匚、凵、卩、阝”等)算作三个折笔。如“亮”字,它有一横、三竖(一个方形为三竖)、一撇、六折(两个端点相接笔形为六折),它的字码为“1316”。3.某种笔画数超过“6”的,仍记作“6”。如“罐”的横笔画数、竖笔画数都大于“6”,撇笔画数为“3”,折笔画数为“3”, 则“罐”的字码为“6633”。4.字码尾部是“0”的,其“0”省略。如“三、中、国、文、火”省略后的字码为“3、04、341、103、004”(原字码为“3000、0400、3410、1030、0040)。这样,该输入法字的码长就为少则一码,多则四码。5.确定字码后,按字码输入或查字。

二、字码举例

凹(0003)、凸(0003)、臼(2003)、费(0136)、母(1023)、陈(1124)、学(1036)、属(1426)、默(346)、器(163)、嬴(4336)、蠼(6641)、爨(6566)、齉(6654)                                

卓(35)越(3244)与(2001)平(212)庸(3116)往(323)往(323)只(032)差(513)一(1)小(012)步(232)。不(112)要(2511)花(1321)太(103)多(0042)时(241)间(1411)来(214)改(1033)善(444)自(231)己(0003)的(1331)缺(3134)点(144),重(441)点(144)应(1043)该(1052)放(2051)在(321)强(1613)化(0121)优(1131)点(144)上(21)。



“简易四码汉字查字表”说明



1.本查字表收录了第十版《新华字典》中的全部单字,共8700多个(不含繁体字、异体字)。同码最多的有22个字(如字码“2131”——我志进弃戒忐坌迕杧杌杙坎扮拟抡?忾怃牣评歼冻)。

2.排列顺序:先排字码“0”至“9 ”,再排字码“00”至“99”,以此类推。

3.为缩小检索范围,字表中字的排列方式与常见的字词典查字表相比有所创新。同码的字,其中非左右结构的字排在前面,左右结构的字排在后面。而左右结构的字又分为两部分。左偏旁为“钅(石)、木、氵、火、土(扌)”的字排列靠前,并在字的下方加横线(同码少于6个字的不加横线);其余的排列靠后,并在字的下方加虚线(同码少于6个字的不加虚线)。“钅(石)、木、氵、火、土(扌)”是人们熟知的五行——金、木、水、火、土,并添加“石、扌”而成。把“石”归入“钅”,可联想“点石成金”帮助记忆;把“扌”归入“土”,是因二者笔形相近。上述排列使检索范围缩小至最多只有10个字。如字码“1323”——命宕匼昃矿矾沿泂刺剁络骆鸣哟咦呣哏郃。区别一个字是不是左右结构的方法很简单,一般来说可明显分为左右两部分或左中右三部分的为左右结构的字。只有“八、儿、川、州”不是左右结构的字,而是独体字。应该注意到这四个字分开的几部分均为单笔画。



简易四码汉字查字表(节选)

1一2二3三03口04中06回品吕串11十丁13日曰14可由申田占古甲旧叶叮15曲16茴莒固罟呻咕呷21于上干土工士亍22止23目旦刊24早吉扣吐吁25町26苗苦苛苫哥昌唱副咭喵31王丰32正打33芋芏亘34芷里呈旱盯旰35昔卓苜坷坫坤押抻抽拈咑36草菖晶罩筊噩覃罡堌唶哩42耳圭圩扛玎43芈址扯44坦担刲旺盱45拮玷珂珅哇46蕈描瞄趾晅52玕53耵54茸垣55埋埕捍捏56葺量堙堽措掉畦踔踖62韭非63垚排挂琲珥64菲耻剕65理啡眭66罪揖跬002人八入乂003义004火父爻从006众炎焱燚011卜012个小丫彳013少介014仪015伙016炒倓021川022仆刈024州价026剡032只史囚叭033囟034谷036炽啖041卟043吵045俗051仲052忡061侣062徊102大丈103文太六犬夭104头灭丛105兴交灰106爽淡炆111下才千寸112木不斗升卞113术乎禾仗114齐米伞尖杀亦乔朳灯伏115杉沙116杰采籴燊枞秋佼彩……2126屑廋栅栀假鸬?馊脲陶猇2131(此字码同码字最多,共有22个字。而“四角号码’’号码为44227的有29个字,它们是:节、艿、芳、芾、苈、芮、芬、芴、苘、茼、荫、莆、莴、莠、萹、箐、带、萧、蒂、棼、葡、蒡、嵩、蓠、幕、蓇、蓨、蔺、薷)我志进弃戒忐坌迕杧杌杙坎扮拟抡?忾怃牣评歼冻2132势枇沲拨侥轮软戕诜2133空定季宗隶垒秉屏杭泞顶帙佾施邾矧……6561醭醮6562瀚攥曦6563鐾6564霾赣6565戆6566爨6601聘辑6602缰6603蕾擂鞋疆6606鞲蹦6611蕞镡撮鲑鲱6613礌6614薹醽6616鞴嚅6621?鳇醒6622镥蹑鲰6623檑雕嚯臞6624露6626蠕酆齇6631藓矍瞽镖??攫鲯?躏氍醛6633藕礵罐躔骥6634攮6641壤攘瓖蠖6642?6643譬癯鹳6651鼙鳝6652镶6653蘼礴颧劘6654齉6661蘸籰黮6662鼟6663耱6665躜

关于“简易四码汉字查字(输入)法”的说明

一、现行汉字查字法的不足

汉字的笔画结构呈多方向展开,规律性很差,不像拼音文字那样字母是按线性的方向从左至右排列,因此汉字的查检非常困难。能否找到一种方法使得汉字的查检容易一些呢?很多学者在坚持不懈地探索,但至今仍无一种较好的查字法,这对人民群众学习、研究、使用工具书有不利的影响,更与发展社会主义文化事业不相适应。

目前通用的汉字查字法主要有笔画法,部首法,四角号码法和音序法。笔画法手续繁琐,查字很慢。四角号码法查字速度较快,但学起来困难,而且有些字不易准确编码。音序法只适合依音查字,不能解决依形查字问题。目前,我们使用的各种字词典,大多采用部首查字法作为主要的查字方法。然而部首查字法却有不少缺欠:(1)方法繁琐,速度太慢。它需要确定部首,数两次笔画,查两个字表。一般查一个字需要两、三分钟,遇到难以确定部首的字,就需要更长的时间,甚至有可能费了很大劲也查不到要查的字;(2)有些字部首判断困难。如“为、也、世、冉、长”等字;(3)含有两笔及两笔以上笔画端点(一笔的头或尾)相接笔形的字,容易数错笔画。如“凸、凹、臼、官、费”等字;含有方形的字也容易数错笔画。如“曹、鄙、嚣、蠼、齉”等字。(4)有些字笔画太多,查字费时费力。如“霸、罐、黯、瓤、齉”等字;(5)同部首同笔画的字有的还较多。如部首“艹”中六笔画的字就有58个;(6)如果部首无从采取或其所在部位不合规定,不得不补充规定这些字按起笔取单笔画部首,这就要求查字者还要搞清楚字的笔顺,由于笔顺记不准,很多人往往为此而查不到要查的字。

二、“简易四码汉字查字法”( 专利申请号:201110213520.7)的优点

“简易四码汉字查字法” 按字码查字,简便快捷。它取码容易,码长短(四角号码每个字均为五码),同码字少(以第十版《新华字典》所收8700多字为例,本查字法同码最多的有22个字,而“四角号码”同码最多的有29 个字),是一种易学(一般十分钟即可学会)易用(平均五六秒钟查一个字)的查字法。“简易四码汉字查字法”经过一些中小学教师、学生试用,一致认为,该查字法简单好学,查字速度快,应该尽快推广使用。

“简易四码汉字查字法”查字也需要数汉字的“笔画”,但它并不像部首查字法那样,任何字都要一笔不少的把笔画全部数出来,那样数笔画非常麻烦,而且有些字还容易数错笔画。“简易四码汉字查字法”数“笔画”具有独有的“简易”(“简易四码汉字查字法”的“简易”二字就源于此)方法:(1)由于“简易四码汉字查字法”是将汉字的“笔画”分为四种,每种“笔画”的笔画数最大值限制为“六”,因此每个汉字的笔画数最多也只需数到二十四画。(2)字中含有一个方形的,就可以少数两次笔画。如“曲”字,数竖笔时,从三数起(一个方形代表三个竖笔),数到五,加上一横笔,该字只用数四次,“曲”的字码为“15”,而“曲”字实际笔画为六笔;对字中含有方形且个数够两个的,可直接确定第二码(字码从左至右,依次称第一码、第二码、第三码、第四码)为“6”,如“福、嘈、器”的字码为“2621、36、163”。(3)字中含有一个相接笔形的,也能少数一至四次笔画。如“弘”字,数折笔时,从三数起(一个相接笔形代表三个折笔),数到四,加上一点笔,该字只用数三次,其字码为“0014”,而“弘”字实际笔画为五笔;又如“凸”字,数折笔时,从三数起,只用数一次,“凸”的字码为“0003”,而“凸”的实际笔画为五笔;对字中含有相接笔形且个数够两个的,可直接确定第四码为“6”。如“费、鹂、髋”的字码为“0136、2046、3226”。(4)有些字的某种笔画数可一眼看出大于“六”的,如“靠”字,可直接确定其第一码为“6”;又如“谈”字,可直接确定其第三码为“6”。 对于笔画较多或结构比较复杂的字,本查字法的优点更能显现出来。如“爨”字,不难看出,“爨”字的横笔画数、撇(含点、捺)笔画数、折笔画数都大于“六”,因此可直接确定“爨”字的第一码,第三码,第四码都为“6”,继而可快速确定其字码为“6566”。从上述可以看出本查字法数“笔画”,比部首查字法数笔画要少得多,平均每个字需要数的“笔画”大约是其实际笔画数的一半,而且还较好地解决了有些字容易数错笔画的难题。需要说明的是,本查字法所说的汉字“笔画”只在本查字法中运用,与严格意义上所称的汉字笔画并不完全一致。

为避免将“方形算三个竖笔”与“笔画端点相接笔形算三个折笔”相互弄混,可这样记:因为方形的起笔是竖笔,所以方形算三个竖笔,而不是算三个折笔。

为避免遗忘已经数过的字的某种笔画(用于笔画较多的字),可采用连带记忆法,以“新”字为例:先数横笔画数为“4”,再数竖笔时,这样数,41、42,数得前两位码为“42”,接下来数撇(含点、捺)时,这样数,421、422、423……                                                                                                                           

也正因为本发明富有特色的简易数“笔画”方法,使得用数“笔画”的方法也可输入汉字。一般来说人们在电脑或手机上输入汉字通常为常用汉字,常用汉字大多可一眼看出其字码或很快就能确定其字码(如“电1301脑3036是342我2131们0221日13常0526学1036习1011与2001工21作322中04的1331好2014帮3116手211”)。经模拟输入测试,“简易四码汉字输入法”的输入速度接近手写速度。      

“简易四码汉字输入法”是一种易学易用的汉字输入方法,它也可用于手机汉字输入。目前我国90%以上的手机嵌入的汉字输入技术,使用的是国外技术和专利,并且每年需为此支付7.8亿元人民币的专利费。

“汉字三边号码输入(查字)法”(参看附件)



“汉字三边号码查字表”说明

1.本查字表收录了第十版《新华字典》中的全部单字,共8700多个(不含繁体字、异体字)。同码最多的有15个字(如字码“4134”——衷褒裹襄亵饔衣哀衰衮豪袤裒涿诼)。

2.排列顺序:先排字码“0”至“9 ”,再排字码“00”至“99”,以此类推。

3.为缩小检索范围,字表中字的排列方式与常见的字词典查字表相比有所创新。同码的字,其中含有竖笔与它笔交叉的字(如“开、扫、艺、偶)排在前面,并在字的下面加横线(同码少于6个字的不加横线);其余的字排在后面。上述排列使检索范围缩小至最多有12个字,且只有一个字码。如字码“7”——也卅女世丈母册丹丸甘屯毋尹廿,其余的检索范围都在10个字以内。

汉字三边号码查字表(节选)

0中事由电申串曲甲〇口史吏曳1一2车丰井韦聿冉弗5乙6十巾又力子七九叉孑孓乜乂7也卅女世丈母册丹丸甘屯毋尹廿8人入八厂9了几己弓凹凸巴臼尸巳00曹啯呻呷昌回吕黾咽01里日旦曰02围05罗06早男田吊叶另囝旯叹叱叻07囤囡吨盹呣08果束柬只囚叭09邮邑吧叽叩10石西酉11二12再丁15歹16干于耳17开19画20扣抻押轴抽掴捆拽旧22拂24书甫卜25扎轧26轨27妻执拇扽28本未末耒扒29击把扫30自白囱囟32手牛35夕儿36千币身37升毛46斗48广49户50召司51丑习刁53刀乃匕刃54厶56孕60古帼右旮加旭61士土62建帏63才及64寸大内义弋臾65孔66支布皮叟友爻双劝孖67卉孝68木乐办肉69出冇邓70革苗茵茴菌苜妯君如姻72苇芾苒茀74夫央专夷戈戋戊夬75艺76艾艽好奴77芄苷她毑姍姆78东79芭芑芎苢邦妃妇邯80单82半年厍丫个小85乞86午父历87每88火仄从89仓厄90周届匣同眉冒叵冏阳91凰月且皿92用军阵阱山引94尺凡95已匹夙罔96匝匦劻民反凶区风氏凤冈尻殳97异匜舁弛甩屉98贝队99巨函冗印郾000嘈唱品晶001哩跩005啰006曼009咒010晒哽哂011目012町叮盯015号016旱吁盱旰……4130湎4132挛4133彦4134(此字码重码字最多,共15 个字)衷褒裹襄亵饔衣哀衰衮豪袤裒涿诼4136亳4137毫4138亥4139濡襦斋鸾鸿褙洏4140畜4142卞4144运逐添4145充兖4146率4147弃4148紊4149育裔4150盲谮4151冱4153方4154远忘迈玄沄4155沔瓿4157妄4159肓4160啻吝4161主壅汗汪洱湮禋4162齐夜齑4163讶……9910骺9911朋弱9912匠所9918巽飓9921膗9934限脲9936孵9939鹥鹏鹦9941璺9942爬9943卵9944熙弧胍赆9948繄9950飗9960腒腯9961服股毁9964邸胝骶9965翳殷9968殿贩9969臀罂骰9987婴9988爨9991骨9994卿

关于“汉字三边号码输入(查字)法”的说明

一、现行汉字输入(查字)法的不足

打字和查字是我们日常工作和学习中不可或缺的重要环节。目前有很多种汉字输入法,但是不管是五笔还是拼音,使用者大多慨叹居然没有一种合适的、让人满意的输入法。查字也如此,常用的部首查字、拼音查字、笔画笔顺查字、四角号码查字均存在缺陷,让使用者不能称心如意。

汉字的笔画结构呈多方向展开,规律性很差,不像拼音文字那样字母是按线性的方向从左至右排列,因此汉字的输入和查检都非常困难。能否找到一种方法使得汉字输入和查检容易一些呢?很多学者在坚持不懈地探索。笔者以为,一种能为大多数人认可的优秀输入法应该具有以下优点:

第一,规则简单、易懂,需要记忆的东西既少又比较有规律,很容易学会。现在有不少输入法就没有做到这一点,它们有的需要记大量的字根,有的需要记字的部首,有的需要记字的笔顺,有的需要记字的结构,有的既不但要记字的笔形代码,还需要输入字的拼音。需要记的东西越多,学起来越不容易,输入时也越容易出错。

第二,字的码长短。码长越短,击键的次数越少,输入越快。有的输入法字的码长多达五六个,甚至更多,输入起来既麻烦又费时。

第三,重码率低。重码率的高低是衡量一种输入法优劣的一项重要指标。有不少的输入法根本不提重码率;还有些输入法称其“重码率低”,但却不做具体说明。目前人们使用最多的拼音输入法因其同音字(相当于同码字)太多,选字很麻烦,不认识 的字或拼不准字音的字还无法输入,而且有些字需要输入六个拼音字母(相当于六个码),因此,拼音输入法并不是理想的汉字输入法。另外长期使用拼音输入,平时又很少拿笔写字的人,很容易出现提笔忘字的现象。2011年9月15日《参考消息》报道,美国汉学家梅尔教授调查了近两百位使用中文的人,他们中98%的人使用拼音输入法。梅尔发现,如今人们出现了书写困难的趋势,许多人不会用笔写汉字,只会用键盘打字。这种状况或许还没到岌岌可危的地步,但也不可等闲视之。国家有关部门应加大投入对汉字笔形输入法的研究,尽快向人们推广一种易学易用,而且人们也乐于使用的汉字笔形输入法方案。

目前通用的汉字查字法主要有笔画法,部首法,四角号码法和音序法。笔画法手续繁琐,查字很慢。四角号码法查字速度快,但学起来困难,而且有些字不易准确编码。音序法只适合依音查字,不能解决依形查字问题。目前,我们使用的各种字词典,大多采用部首查字法作为主要的查字方法。然而部首查字法却有不少缺欠。(1)方法繁琐,速度太慢。它需要确定部首,数两次笔画,查两个字表;(2)有些字部首判断困难。如“为、也、世、冉、长”等字;(3)含有两笔及两笔以上笔画端点(一笔的头或尾)相接笔形的字,容易数错笔画。如“凸、凹、臼、官、费”等字;含有方形的字也容易数错笔画。如“曹、鄙、嚣、蠼、齉”等字。(4)有些字笔画太多,查时费时费力。如“霸、罐、黯、瓤、齉”等字;(5)同部首同笔画的字有的还较多。如部首“艹”中六笔画的字就有58个;(6)如果部首无从采取或其所在部位不合规定,不得不补充规定这些字按起笔取单笔画部首,这就要求查字者还要搞清楚字的笔顺,由于笔顺记不准,很多人往往为此而查不到要查的字。

二、“汉字三边号码输入(查字)法”的优点

本人经过九年潜心研究,发明出一种新的汉字输入方法——“汉字三边号码输入(查字)法”,本发明完全具备优秀输入法的三个优点,它是一种十分高效的汉字形码输入法,其主要优点有:

1.不用知道字的部首,不用知道字的结构,不用知道字的读音,不用知道字的笔顺。现在几乎所有的笔形输入法都要求掌握字的笔顺,而掌握笔顺并不是一件容易的事。如“为、也、女、世、山、、及、北、长”等字就容易搞错笔顺而不能正确输入。现在的手机用户发短信很少用笔画笔顺输入法,就有这方面的原因。

2.用数码输入,方便快捷,且代码与其对应的笔形比较有规律,容易记住 。(1)它用号码“0”代表方形(四角整齐的四边形),方形与“0” 相近,非常好记;(2)它用号码“1、2、3、4、5”分别代表“横笔(含提)、竖笔(含竖勾)、撇笔、点笔(含捺)、折笔”。用“札”字帮住记这五个号码是一个不错的方法,“札”字笔顺正好是横、竖、撇、点、折。这种单笔笔形的划分也符合国家语言文字规范;(3)接下来的两个号码“6”和“7”都代表交叉笔形:“6”代表有一个交叉点的交叉笔形,“7”代表有两个及两个以上交叉点的交叉笔形(4)号码“8”也容易记住,“八”与代表的笔形相近;(5)号码“9”代表两笔及两笔以上笔画端点(端点即一笔的头或尾)相接笔形。如“厂、弓、了、冖、匚、阝”等。

3.取码规则简单好懂,易学易用。它的取码规则仅有四条,而四角号码取码规则有十几条。

4.重码率低。在其检字表中收录了第十版《新华字典》中的全部单字,共8700多个字,最多的同码字仅有15个,而四角号码同码字最多的有29个(以第十版《新华字典》考量),前者比后者少了近一半,而且四角号码实际上每个字需五个码。用拼音输入,则同码字更多。如读yi音的字就有100多个。

5.字码码长短,少则一码,多则四码。而四角号码每个字均为五码。

6.在笔形的设计上有所创新:它规定两笔及两笔以上笔画端点相接笔形视作连贯的一笔,不能拆开,且代码为“9”(代表号码“8”的“厂”形除外)。如“凹、凸、弓、己、了、冖、几、冂、匚、凵、卩、阝”等,它们的号码均为“9”。这种设计使得取码非常方便。在两笔及两笔以上笔画以交叉的形式连接在一起的交叉笔形中,它首创以交叉点的数量定笔形代码,非常醒目直观,取码非常容易。如“乂、又、九、巾、子”等,很容易看出它们的号码均为“6”;又如“艹、也、女、世、册”等,也很容易看出它们的号码均为“7”。由于含有两个及两个以上交叉点的字较多,为减少重码,把一部分含有两个及两个以上交叉点的笔形归入号码“0”和“2”。在交叉笔形中含有方形的规定号码为“0”,如“事、串、史、曲、曳”等号码均为“0”;在不含有方形的交叉笔形中,如含有一竖笔与它笔构成两个及两个以上交叉点的交叉笔形,规定号码为“2”,如“扌、车、井、冉、弗”等号码均为“2”。

7.针对四角号码有的字角的号码不易确定的弊端,它另辟蹊径,不在字的四个角取码,而在字的上边、右边和下边三个边上取码。这种取码的方法使得本查字法每个字取码都很容易。           

8.它也可以用做汉字的查检,其查字速度比四角号码至少快一倍(从码长、重码率、确定字码的难易程度等方面比较),而且学起来也比后者容易的多。

9.“汉字三边号码输入法”也可以按词语输入。用词语输入既可减少编码的长度,又能减少选字次数,从而可大大提高输入速度。词语输入的方法:不管是几个字的词语,均按五个码输入。两字词语,取首字的第一码,尾字的前四码;三字词语,取前两字的第一码,尾字的前三码;四字词语,取前三字的第一码,尾字的前两码;五字词语以上,取前四字的第一码,尾字的第一码。如果尾字不足码的,有几码取几码。如“词语”码为“44161”,“科学家”码为“34491”,“咬文嚼字”码为“04049”,“百里挑一”(“一”不足两码)码为“1021”,“现代汉语词典”码为“13442”,“风物长宜放眼量”码为“93640”。

“汉字三边号码输入法”已获得国家专利证书(专利号ZL200910227219.4),相信日后若加以利用,开发制作成软件,或者用于汉字的查检,必将为人们的学习与工作发挥出积极的作用。     

        

李雪峰  男  1959年出生  汉  大专  机电工程师  中国平煤神马集团七矿  电话13949487609  邮箱:psj19740928@sina.com   QQ:1724697824   地址:河南平顶山市新华区北团小区12号楼027号  邮编:467000

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|湘里妹子学术网 ( 粤ICP备2022147245号 )

GMT++8, 2024-4-29 14:09 , Processed in 0.067406 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表