CN100489747C - 一种数字键盘汉字输入法 - Google Patents
一种数字键盘汉字输入法 Download PDFInfo
- Publication number
- CN100489747C CN100489747C CNB2007100353925A CN200710035392A CN100489747C CN 100489747 C CN100489747 C CN 100489747C CN B2007100353925 A CNB2007100353925 A CN B2007100353925A CN 200710035392 A CN200710035392 A CN 200710035392A CN 100489747 C CN100489747 C CN 100489747C
- Authority
- CN
- China
- Prior art keywords
- radical
- stroke
- word
- code
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种数字键盘汉字输入法,选定字根数为60-80个,配置在10个数字键上;编码规则:将分拆超过两个字根的在首偏旁的字首先从在首偏旁中按笔顺以第一笔实行字的首码字根最大化,接着在偏旁中用未取笔画按笔顺实行字的第二码字根最大化,多出的笔画不参加字的编码;部首取码时,先用部首按倒数顺序以末笔实行字的末码字根最大化;接着用部首未取笔画按笔顺依次实行字的第三、四、五码字根最大化,以上这种在首偏旁就称之为舍笔画取码偏旁;对于非偏旁舍笔画编码字取码时,首先按照笔顺以字的在首笔画实行首码字根最大化;并用字的未取笔画按倒数顺序以末笔实行末码字根最大化;接着用字的未取笔画按笔顺依次实行第二、三、四、五码字根最大化。
Description
技术领域
本发明涉及一种汉字输入方法,尤其是涉及一种主要用于手机、掌上电脑等电子设备的数字键盘汉字输入法。
背景技术
汉字的输入方法有很多种,其中应用较为广泛的主要有形码、音形码、拼音码等输入法。形码、音形码、主要用于利用通用键盘输入汉字,形码、音形码输入法速度较快,但较难掌握。拼音码输入法易学,但重码率较高,输入速度慢,发音不准,也会影响输入的速度。中国专利01104480.2号公开的《汉字的数字键盘输入法》存在着以下缺陷:(1)数字与其对应的字根记忆量大,且容易混淆,难以掌握、记住;(2)重码率高,且易错码,影响汉字的输入速度。中国专利200410023295.0号公开的《数字键盘汉字输入法》不仅存在着上述缺陷,而且因为其输入方法既要根据输入的汉字拼音首字母所对应的数字键取码,又要根据输入的汉字快捷部首所对应的数字键取码,同时还要根据输入的汉字去掉部首后的第一笔笔画所对应的数字键取码,其取码步骤相当繁锁,影响输入的速度。中国专利200410027499.1号公开的《字根首笔划汉字数码输入法》是一种数码类的汉字输入法,虽然其拆字无需记大量的字根,汉字拆分原则比较简单,但仍存在以下一些缺陷:(1)三个字以上的词组输入编码仍太长、输入繁琐、效率低,且重码率高;(2)对于标点符号的输入及空格、空行等,数字键区并没有一定的输入方法,不便操作。
发明内容
本发明的目的在于提供一种容易记忆,重码少,取码直观,输入效率较高的数字键盘汉字输入法。
本发明的目的是通过以下技术方案实现的:
(一)字根选定规则:(1)以五个基本笔画“一”、“丨”、“丿”、“丶”、“乙”作为字根;(2)以组字能力≥300字的在首偏旁“艹”、“氵”、“亻”、“扌”、“口”、“木”等,以及出现在字中或字末≥100字的部首或笔画构件如“十”、“二”、“三”、“人”、“八”、“丷”、“冂”、“亠”、“日”、等,以及组字能力≥100字的在末部首“大”、“小”、“又”、“乂”、“儿”等,作为字根;(3)组字能力≥100字,在首偏旁分拆字根有超过二个的,设定字根,如针对偏旁“”设计字根针对偏旁“虫”设计字根等,目的是使其分拆只占两码;(4)以便于实现编码字根最大化,汉字分拆难度较大的偏旁、部首、笔画型,作为字根,如“矛”、“巫”、“爪”、“求”、“尸”、“卩”、等;(5)将有两种或多种“变形”的偏旁、部首或笔画型,归入同一个字根,如:西(覀)、四(罒)雨月大几,如“微”字中)、又(ㄡ)、纟(纟,如“辔”字中)、小亅(,如“豹”字中)、冂()、人八火 (“如偏旁“衤”中、如“飞”字中、如“鄹”字中)、(如“站”字中)、(如“”字中)、木(、如“新”字中)、车()、足()、禾()、土()、竹()、牛(牜)、卩(如“卫”字中)、儿(如“羌”字中;如“辉”字中;如“尬”字中)、尸(如“君”字中*)、求(如“裘”字中)、水(氺,如“录”字中;,如“暴”字中;如“犀”字中)匕(,如“化”字中)、(如“贯”字中)、王( 如“全”字中,上“横”比第二“横”短);
但在编码当中,不能将“刀”类推为字根“”,将类推为字根“卩”;除以上情况外,还有一些在取码笔画最大化当中,结构形态相近的笔画型,归入结构形态相近的字根:如“殳”字中的归入字根“几”,“凹”字中的归入字根“冂”,“身”字中的归入字根“月”,“即”字中的归入字根“厶”,“敝”字中的归入字根“脸”字中的归入字根“业”字中的归入字根(“业”字中的笔画型“点”、“撇”和“横”之间有间隙),“良”字中的归入字根以上列出的字根,不能作类推,如不能以“尹”字中看作“尸”的“笔画结构变形”,“卫”字中看作“卩”的“笔画结构变形”而类推“乌”字中笔画型可看作不能以“贯”字中看作的“笔画结构变形”,而类推“缘”字中也为字根
按照以上规则选定字根,数量宜为60-80个,优选65-75个。
(二)字根键位布置规则:(1)将五个基本笔画字根“一”、“丨”、“丿”、“丶”、“乙”安排在五个不同键位里;(2)将“氵”、“艹”、“口”、“扌”、“亻”五个组字能力极强的在首偏旁字根安排在不同键位里,但可与五个基本笔画同键位,因两者不会发生因同部首而重码;(3)将较多出现在字中或字末的部首或笔画构件字根如“十”、“人”、“冂”、“亠”、“日”、、“大”、“小”、“儿”等,安排在不同键位里,并兼顾重码最少以及笔画形态相近。
优选方案:由于《现代汉语词典》(商务印书馆2002年版)的部首检字表按“一”、“丨”、“丿”、“丶”、“乙”的顺序编排,且“一”的读音与“1”相同,为便于记忆,本发明将字根“一”及含有“一”的部分字根安排在“1”键;将字根“丨”及含“”等的部分字根安排在“2”键;将字根“丿”及含“丿”的部分字根安排在“3”键;将字根“丶”及含“丶”的部分字根安排在“4”键;将字根“乙”及含“乙”的部分字根安排在“5”键;另外,将字根“十”及“二”、“三”安排在"6"键,是因为它们有“一”的笔画;将字根“日”及含笔画的字根安排在“7”键,是因为笔画有点像“7”;将字根“八”及与“八”形状相似的字根安排在“8”键,是因为“八”读音与“8”相同;将字根“亠”及含“丶”的部分字根安排在“9”键;将字根"口"及形状与“冂”相近的字根安排在“0”键,因为"口"形状像“0”;以上所述可见,从“6”键到“0”键的字根键位安排,也基本符合“一”、“丨”、“丿”、“丶”、“乙”的顺序安排。
(三)取码编码规则:将分拆超过两个字根的在首偏旁的字,用两个码位表示,也就是说,这种在首偏旁将有102+101=110个编码容量来区别它们;取码时,首先从在首偏旁中按照笔顺以第一笔实行字的首码字根最大化,接着在偏旁中用未取笔画按笔顺实行字的第二码字根最大化,这之后,偏旁中多出的笔画不参加字的编码;然后用四个码位表示它们的部首,也就是说,其部首将有104+103+102+101=11110个编码容量来进行区别;部首取码时,先用部首按倒数顺序以末笔实行字的末码字根最大化;接着用部首未取笔画按笔顺实行字的第三码字根最大化;再接着用部首未取笔画按笔顺实行字的第四码字根最大化;然后用部首未取笔画按笔顺实行字的第五码字根最大化。以上这种在首偏旁就称之为舍笔画取码偏旁,并且只准许它们占有两个码位,如在首偏旁“钅”、“鱼”等。
对于非偏旁舍笔画编码字取码时,首先按照笔顺以字的在首笔画实行首码字根最大化;并用字的未取笔画按倒数顺序以末笔实行末码字根最大化;接着用字的未取笔画按笔顺实行第二码字根最大化;再接着用字的未取笔画按笔顺实行第三码字根最大化;如此类推第四码字根最大化,第五码字根最大化。
在编码过程中,编码按顺数码位排列,而在实现字根最大化时,则按首码、末码、第二码、第三码、第四码、第五码的次序进行,在发生被取码笔画相矛盾时,后者依次让前者(偏旁舍笔画取码字字根取码最大化次序应分在首偏旁、在后部首两部分对待,偏旁舍笔画不参加部首编码中字根最大化)。
偏旁作为整体字或在字末时,不舍笔画取码,如“齿”、“啮”等。
如偏旁“”在字首时,取码为“”、“丶”,编码为“84”,多出的笔画就不参加编码;但如果不在字首,如“滗”字,部首“”就不能舍笔画,“滗”字分拆为“氵”、“”、“丶”、“”、“丶”、“乙”,编码为“484845”。
只有一个或两个字根的字,其编码为字根所在键位加声母编号组成编码(字母编号:G11F12D13S14A15H21J22K23L24T31R32E33W34Q35Y41U42I43O44P45B51V52C53X54Z55N61M62。字母右肩上的数字为该字母编号)。
词组编码:
双字组编码取各字的首码、第二码和末码按词组组字顺序构成;三字词组编码取各字的首码、末码按词组顺序构成;四字以上词组编码取第一字的首码、末码和第二字的首码、末码以及第三字、最后一字的首码按词组组字顺序构成。
本发明优选方案还设置有第一重码键、第二重码键、第三重码键。
本发明字根较少,取码唯一、直观、易记,实用性强。重码方面,也主要表现为两个字或词重码,三个字或词重码相对较少,重码达四、五个或以上的字或词更少。通过设计重码键可使重码字或词直接快速输入。可主要以词为单位进行输入来提高输入速度,平均每字三码位输入,输入快速、准确、直观。
附图说明
图1为本发明一实施例键名字根和重码键在手机数字键盘上的键位布置图。
图2为图1所示实施例键名字根和重码键在通用键盘上的键位布置图。
具体实施方式
以下结合实施例对本发明作进一步说明。
根据前述字根选定规则及字根键位布置规则,本实施例共设置68个字根;其键名字根和重码键在手机数字键盘上的键位布置见图1,在计算机通用键盘上的键位布置见图2。全部68个字根在数字键盘上的键位设置如下表所示:
取码编码方法:
将组字能力较强的在首偏旁“王”、“忄”、“石”、“犭”、“钅”、“鱼”、“”,以及将字的在首偏旁分拆字根在四个以上的“革”、“齿”、“骨”、“酉”、“雨”、“舟”用两个码位表示,(如偏旁“”在字首时,取码为“”、“丶”,编码为“84”),对于以上在首偏旁组字,因为它们分拆超过两个字根,编码时,首先从在首偏旁中按照笔顺以第一笔实行字的首码字根最大化,接着在偏旁中用未取笔画按笔顺实行字的第二码字根最大化,这之后,偏旁中多出的笔画不参加字的编码;然后用四个码位表示它们的部首;部首取码时,先用部首按倒数顺序以末笔实行字的末码字根最大化;接着用部首未取笔画按笔顺实行字的第三码字根最大化;再接着用部首未取笔画按笔顺实行字的第四码字根最大化;然后用部首未取笔画按笔顺实行字的第五码字根最大化。以上这种在首偏旁就称之为舍笔画取码偏旁,并且只准许它们占有两个码位.如“鲜”字分拆为字根“”、“日”、 编码为“3781”依次击打“3”、“7”、“8”、“1”键即可;“勤”字分拆字根为“艹”、“一”、“二”、“力”,编码为“1 1 6 3”。
对于非偏旁舍笔画编码字取码时,首先按照笔顺以字的在首笔画实行首码字根最大化;并用字的未取笔画按倒数顺序以末笔实行末码字根最大化;接着用字的未取笔画按笔顺实行第二码字根最大化;再接着用字的未取笔画按笔顺实行第三码字根最大化;如此类推第四码字根最大化;第五码字根最大化。如“根”字分拆为字根“十”、“八”、“一”、“乙”编码为“6 8 7 1 5 8”。
在编码过程中,编码按顺数码位排列,而在实现字根最大化时,则按首码、末码、第二码、第三码、第四码、第五码的次序进行,在发生被取码笔画相矛盾时,后者依次让前者(偏旁舍笔画取码字字根取码最大化次序应分在首偏旁、在后部首两部分对待,偏旁舍笔画不参加部首编码中字根最大化)。
偏旁作为整体字或在字末时,不舍笔画取码,如“齿”、“啮”等。
只有一个或两个字根的字,其编码为字根所在键位加声母编号组成编码(字母编号:G11F12D13S14A15H21J22K23L24T31R32E33W34Q35Y41U42I43O44P45B51V52C53X54Z55N61M62。字母右肩上的数字为该字母编号)。编码举例:如“一”字只有一个字根“一”,“—”字的声母为“Y”,“Y”的编号为“41”,因此“一”字的编码为“141”;“六”字分拆为“亠”、“八”,“六”字的声母为“L”,“L”的编号为“24”,因此“六”字的编码为“9824”。
下面主要分析在首偏旁笔画的情况:
如果组字能力较强的在首偏旁在设计中本身就能以一个字根存在,就不存在偏旁舍笔画取码,如“艹”“氵”“口”“亻”等。
有一定的组字能力(在100个以下,主要看重码情况),在首偏旁只有三个字根,不须偏旁舍笔画取码,如“车”“马”“禾”等。
有一定的组字能力(约30个上下,主要看重码情况),在首偏旁在四个字根以上,须偏旁舍笔画取码,如“酉”“革”“雨”“舟”等。
组字能力在10个以上(主要看重码情况),在首偏旁在五个字根以上的,须偏旁舍笔画取码,如“骨”“齿”等。
组字能力在10个以下,视重码情况而定,可不作考虑偏旁舍笔画取码,换句话说,也就是可以让它们的部首只有一个码位区别,如“鼻”“食”等。
词组编码:
三字词组编码取各字的首码、末码按词组顺序构成,如“湖南省”,取“湖”字首码字根“氵”、末码字根“二”、取“南”字首码字根“十”、末码字根“十”、取“省”字首码字根“小”、末码字根“日”,组成编码为“466627”。
四字以上词组编码取第一字的首码、末码和第二字的首码、末码以及第三字、最后一字的首码按词组组字顺序构成,如“马到成功”,取“马”字首码字根“乙”、末码字根“一”,“到”字首码字根“一”、末码字根“亅”,“成”字首码字根“一”、“功”字首码字根“一”,编码为“511211”。
在双字词组编码中,非偏旁舍笔画字(包括偏旁整体字)只有两码时,按字的编码方法取该字的字根和该字的声母编号第一个数字,如“土地”的编码为“613 6 1 5”,(其中“3”为取“土”字读音的声母“T”的编号第一个数字);在三字词及四字词前三字中,只有一个字根的字按字的编码方法取该字的字根和该字的声母编号第一个数字,如“人尽其才”的编码为“8 3 7 41 1”,(其中“3”为“人”字读音的声母“R”的编号第一个数字)。
参照图1,本实施例设有空格键,并在该键位上标记草体“空”字样;还设有三种重码键,分别称为“重甲”键、“重乙”键以及“重丙”键,并在该键上标记“重甲”、“重乙”以及“重丙”草体字样;重码,多数为两个字(词)重码,少数重码为三个字(词)或三个字以上,采用以下方法处理:
(1)重码为六个码位,且只有两个字(词)重码,以最常见字(词)为本码字(词),在输入编码时,屏幕内容同时显示该字(词)完成输入;而需要输入重码字(词)时,补击“重甲”键,屏幕内容显示的本码字(词)切换成重码字(词),重码字(词)编号为“2”;
(2)重码为五个码位以内,只有两个字重码,在输入编码后补击空格键输入本码字,再补击“重甲”键,本码字切换成重码字,也可在输入编码后只补击“重甲”键便可输入该字,重码编号为“2”。
(3)有三个字(词)以上重码,这时,不管编码有多少码位,该编码所有的字(词)用阿拉伯数字“1”、“2”等给以编号,最常见编号为“1”,次常见编号为“2”,依次类推,在输入该编码中的字(词)时,输入编码后补击空格键完成对应的编号为“1”的字(词)输入;输入编码后补“重甲”键即完成对应的编号为“2”的字(词)的输入;输入编码后补“重乙”键即完成对应的编号为“3”的字(词)输入;而要输入编号为“4”以后的字(词)时,先在输入编码后按住“重丙”键不放,然后同时选择点击编号为“4”以后的对应的字(词)编号完成输入。
“重甲”键可设计为专门进行重码字(词)切换输入的键,但不能作为本码字(词)的切换输入键(这些字、词可利用空格键输入)。
在给汉字编码当中,还存在笔顺这一大问题需要解决。当前“汉字规范笔顺”不能较好地满足汉字信息处理要求。通过大量的试编码实践,为了实现取码字根最大化、唯一性,必须做到取码时汉字笔画顺序唯一性、统一性;同时又能让这种唯一性、统一性的笔画顺序大多数符合现行的《汉字笔顺规范》,但当给出一种规定时,就要求不能有例外,如给出“从左到中,至右”的规定,“非”字就不能以“丨”为先,而是以“三”为先,鉴此,本实施例对笔顺作如下特别规定:
(一)、从左到中,至右。如“非”字按如下顺序依次拆分为“三”、“丨”、“丨”、“三”,编码为“6226”;“步”字依次拆分为“丨”、“丨”、“二”、“丶”、“丨”、“丿”,编码为“226423”;“臧”字依次拆分为”、“一”、“丿”、“一”、“丿”、“丶”,编码为“513134”;“将”字依次拆分为“丶”、“一”、“丨”、“”、“丶”、“丶”,编码为“412344”;在以“撇”、“捺”或“点”对称排列在两边时,按两种情况处理:
(1)中间笔画定位两偏旁笔画型,先中间,后两边。字和笔画型如“水”、“”、“承”、(“鳏”字中)、(“巫”字中)、(“幽”字中)、(“率”字中)、(“藥”字中)、(“燮”字中)、(“亦”字中)、(“业”字中)“办”、“刅”(“梁”字中)等,按“先中间,后两边”顺序,“水“字依次拆分为“”、编码为“2414”;“率”字依次拆分为“亠”、“丶”“十”,编码为“95446”;“幽”字依次拆分为“丨”、“丶”“丶”、“凵”编码为“254545”;“业“字拆分为“丨”、“丨”、编码为“228”;“办”字依次拆分为“力”、“丶”、“丶”,编码为“344”等。
(2)两边在上夹中交或跨笔画型,先两边和“横”(包括“横折”、“竖折横”等),后中间。字和笔画型如“半”、“米”、(“夹”字中)、“坐”、(“敝”字中)、“兆”、(“脊”字中)、(“谷”字中)、(“塽”字中)等,“米”字依次拆分为“小”,编码为“8262”;“兆”字依次拆分为“儿”,编码为“4355”;“坐”字依次拆分为“人”、“人”、“丨”、“二”,编码为“8826”;“敝”字依次拆分为“冂”、“八”、“”、“乂”,编码为“20889”等。
(三)、两笔画相交,先“横”(包括“横折”、“横折竖”、“竖折横”),后“竖”(包括“竖折”、“竖撇”)或“撇”。笔画型如“十”、“”(“降”字中)、(“也”字中)、(“五”字中)、“巾”、“子”、“韦”“聿”、(“庸”字中)、(“勤”字中)、(“泽”字中)、(“隹”字中)、(“青”字中)、“”(“垂”字中)、“七”、(“逆”字中)、(“屯”字中)、“屮”(“蚩”字中)、(“虐”字中)、“九”、“力”等,即如“五”字依次拆分为“一”、“丨”、“一”,编码为“1521”;“子”字依次拆分为“乛”、“一”、“”,编码为“512”;“青”字依次拆分为“三”、“丨”、“冂”、“二”,编码为“6206”;“逆”字依次拆分为“”、“”、“丿”、“丶”“乙”、“丶”,编码为“853454”;“虐”字依次拆分为“丨”、“一”、“一”、 编码为“215155”;“九”字依次拆分为“乙”、“丿”,编码为“5322”等;但在“冂”框、框、“囗”框、“口”字、框与“横”相交时有特例,以“冂”、“囗“、“口”、等结构看成在上,为先,“横”看成在下,为后,规定为从上到下。如“册”字依次拆分为“冂”、“冂”、“一”,编码为“001”;“尹”字依次拆分为“尸”、“一”,编码为“7141”;“衰”字依次拆分为“亠”、“口”、“一”、“丿”、 编码为“901358”;“母”字依次拆分为“亠”、“丶”,编码为“794”等。
(四)、两笔画相接,若有出头时,出头者为先,若无出头成左上角时,看成先角上,后角下。如“卩”、 等,其左上角无笔画出头,因此象“氏”字依次拆分为“丿”、“”、“一”、“”,编码为“3515”等,而象“及”、“乃”等字左上角有笔画出头,因此以出头的笔画为先。
(五)、全包围,左上右包围、上左包围、上右包围字型,先外后里。如“国”、“母”、“同”、“问”、“厅”、“司”等。
(六)、左下右包围,左下包围,上左下包围字型,先里后外。如“画”、“运”、(“甚”字中)、(“曷”字中)、“也”、“区”等,如“画”字依次拆分为“一”“日”“丨”“凵”编码为“1725”;“运”字依次拆分为“二”、“”、“丶”、“丶”、“丶”,编码为“654454”;“甚”字依次拆分为“艹”、“三”、“八”、编码为“1685”;“也”字依次拆分为“丨”、编码为“525”;“区”字依次拆分为“一”、“乂”、编码为“195”等;而对于一些特殊的近于左下包围的但却难以认定为左下包围结构的笔画型如:
(1)汉字组字中,把笔画右上的笔画看作被笔画左下包围笔画型,以笔画右上的笔画为先。如“与”、“丐”、“鸟”等字,以“鸟”字为例,依次拆分为“丿”、“丶”、“一”,编码为“35451”,这样可排除把“鸟”字的“丶”作为末笔(参见第“七”条);
(3)对于“鬼”“尬”、“毡”、“旭”、“飞”等字中有笔画“”或“乚”否定为左下包围笔画型,把这些笔画看作在左部分笔画,以左部笔画为先。如“尬”字依次拆分为“一”、“儿”、“人”、“丿”、“丨”,编码为“13832”;
(七)“点”在上部或左上,笔顺为先。如“衣”、“为”、“门”等;“点”在右上或字里,笔顺为后。如“发”“瓦”等,以“为”字为例,依次拆分为“丶”、“力”、“丶”,编码为“434”、;“发”字依次拆分为“人”、“丶”,编码为“5854”;“门”字依次拆分为“丶”、“丨”编码为“425”等。
为便于实现取码字根最大化,对于汉字的笔画结构的认定,本实施例还有下列规定:
(三)、“亦”在字整体上部或部首上部时,笔画型均为两“竖”。如“迹”字依次拆分取字根为“亠”、“丨”、“丨”、“八”、“丶”、“丶”,编码为“922844”;“奕”字依次拆分取字根为“亠”、“丨”、“丨”、“大”,编码为“9229”等。
(五)部首“西”在字整体上部或部首上部时,“囗”框内笔画均为两“竖”,如“迺”、“要”字中,但不包括部首“酉”、“酋”,即汉字构字结构“酉”、“酋”中有笔画型“西”不看作部首“西”,把“酉”、“酋”看作整体构字部件,而不是由“西“构成。
(六)“二“、“三”、“”等字根中的笔画位置处在最底下的“横”为不短于上面的“横”长,并且对于字根“三”,上面第一“横”长还须不短于处在中间位置的“横”长,否则都不认定为该字根。如“芈”字首笔画型为不为字根“三”,因其第一“横”短于中间的“横”长;“作”字末笔画型“”不为字根“三”,因其最底下的“横”短于第一“横”长;而“宜”字末笔画型“”却为字根“三”,是因其最底下的“横”为不短于上面的“横”长。
又,笔画型(刁如“妻”字中)、(如“捷”字中)以在笔画型中间位置的“横”为最长;笔画型“聿”以底下位置的“横”为最长,即“妻”字第一码确定取字根为等;“垂”字以笔画型“艹”中的“横”为最长,“垂”字第二码确定取字根也为等。
(八)、“竖钩”(“”)变“竖”(“丨”)则依“竖”,“竖”变“竖钩”则依“竖钩”(不包括“亦”在上时)。如“犀”字中依“丨”看作字根而不是把“丨”看作“”,并以此否定为字根“裘”字中的“十”依“丨”看作字根“十”,而不是把“丨”看作“”,并以此否定为字根“十”;又如在“新”字中并不因可看作“木”的笔画结构变形而把笔画型看作字根“十”。
(九)、汉字中有许多以“横撇”和“竖”笔画相接,如“千”、“垂”、“币”、“禾”等字中的笔画型这种笔画型在实现取码字根最大化中如果认定为字根“亻”(单人旁),就会有许多汉字被拆散;而象“裁”字中,若以第四码取笔画型理解为字根“人”,以及“夜”字末码取笔画型理解为字根“人”都存在反拆汉字,很难理解;又如若“庹”字来取末笔画型为字根“八”,“风”字首码若取笔画型为字根“八”,“诤”字首码若取笔画型“丷”为字根“丷”,同样反拆汉字,很难理解;还有象“后”、“差”等字中若取其中的笔画型“”为字根“”,都是不能支持的。因此特别规定:只以笔画结构即偏旁“亻”、“人”、“八”、“丷”、“”(如“矢”字首)、能够理解为同一种笔画型的(如“家”字末笔画型)、以及能够理解为同一种笔画型的[(如“聚”字末、边旁“衤”(“捺”变“点”)中笔画型],认定为字根。
所述字根,一般为笔画相连,或为笔画相交,或为笔顺相连,或为笔画位置相连续,不存在被中插笔画隔分;如字根被中插笔画隔分,应是“撇”、“捺”或“点”对称排列在中插笔画两边,笔顺相连,如 “八”、“丷”等。举例如下:“宣”字末取字根“三”,笔顺相连,不存在隔分;“辰”字首取字根“三”,笔画不连,笔顺不连,但位置相连续,不存在隔分,认定为字根;“水”字末取字根虽被中插隔分,但笔顺相连且对称在两边,认定为字根;“于”字首取字根为“二”不为隔分;“工”字首取字根不为“二”,因“二”被“丨”中插隔分,笔画不连不交,笔顺不连,笔画位置不连续;“兼”字末笔画型“忄”,笔顺虽相连,但被左边“丨”隔分,且不是以字根“”(“小”的变形)中的“丨”对称排列,而是以笔画型“”对称排列,因此,“兼”字末取字根不为“小”,而为“八”。
汉字中,象“武”字中的笔画位置处在上面的“一”偏向笔画位置处在下面的“一”的一边,这种“偏位移”现象有很多,如“我”字中的其笔画型就在与笔画“一”相交就有“偏位移”;当然,或许“尬”等字中的笔画型也要讨论是否可看作有“偏位移”现象,这些偏旁或部首在汉字组字结构中应仍为原偏旁或部首,在编码时仍须看作原字根。
笔画结构“亠”在汉字组字结构中没有出现“偏位移”,但当它作为字根在实现取码最大化时,就有“点”在笔画“横”上“偏位移”现象,如“伏”、“国”、“浦”、“试”等字末最大化笔画型是否可以认定为字根“亠”呢?如果认定,这将拆散许多的类似汉字。
综合以上考虑,特规定:除字根“亠”外,承认所有的“偏位移”,把字根“亠”称作“不可偏位移性”。
在实际编码中还会看到,还有某些“偏位移”并不能理解为汉字笔画结构,如“臼”字末最大化笔画型“韭”字末笔画型“凸”字末笔画型,“亟”字末笔画型等,但也可看作最大化字根“二”;又如“友”字在首最大化笔画型也可看作最大化字根“大”。
还有一个问题,象字中首笔画型(“点”和“撇”没有间隙)是否要看作字根“爫”呢?为此,特规定:由某偏旁、部首或说构字部件确定为某字根的笔画构成,其笔画原为与整体中某些笔画相连或相隔的,而出现在汉字取码字根最大化当中,笔画型有极似其形却为该笔画间相隔或相连的,不为该字根。
本实施例中,字母(小写)编码即为以下的字母编号,字母(小写)为本码字,补空格键,需要输入多个字母组成的拼音时,在完成输入每个拼音后再补一次空格键即可进行了下一个拼音输入。字母(大写)编码为重码,补“重甲”键。字母编号如下:G11F12D13S14A15H21J22K23L24T31R32E33W34Q35Y41U42I43O44P45B51V52C53X54Z55N61M62
本实施例中出现的重码主要表现为两个字或词重码,六水分码设计了“重甲”键、“重乙”键以及“重丙”键。“重甲”键和“重乙”键都可看成是对重码字或词的进一步区别,并能做到直接快速输入。设计“重甲”键可对重码字或词进行切换输入,而“重丙”键不能。重码键也是六水分码解决重码问题的重要特点。
本实施例中专门设计“,”(逗号)键和“。”(句号)键,本实施例中由于采用的数字键位有限,为了解决其它标点符号的输入问题,特设计“标点符号”键,并在键位上标记草体“标”字。设计把标点符号用一个码位进行编号,在需要输入标点符号时,先点击“标”键,屏幕出现标点符号编号,每完成输入一个标点符号,屏幕显示自动消除,由于标点符号超过10个,因此也需要用到重码,具体编号如下:
左右双引号“”(1)、左右单引号‘’(2)、问号?(3)、冒号:(4)、顿号、(5)、左小括号((6)、右小括号)(7)、感叹号!(8)、双分隔线//(9)、@(0),点击“标”键后,再点击括号内对应的数字键即完成输入,不必补空格键。
单分隔线/(1)、破折号——-(2)、省略号……(3)、左中括号[(4)、右中括号](5)、左书名号《(6)、右书名号》(7)、实心点.(8)、加号+(9)、减号-(0),以上为点击“标”键后,再点击括号内对应数字键并补“重甲”键。
乘号×(1)、除号÷(2)、#(3)、¥(4)、%(5)、=(6)、?(7)、*(8)、左小括号((9)、右小括号)(0),以上为点击“标”键后,再点击括号内对应数字键补“重乙”键。
本实施例只有68个字根,取码唯一、直观、易记,实用性强。以《现代汉语词典》为依据,能对所有规范汉字进行编码,字的重码仅有578个,词的重码率约为10%,可经过对6个或8个词以上重码淘汰较偏僻的词,以提高实用性。通过设计重码键使重码字或词直接快速输入。可主要以词为单位进行输入来提高输入速度,平均每字三码位输入,输入快速、准确、直观。
以上结合具体的实施方式对本发明作了较详细的说明,不能认为本发明的保护范围只局限于上述的实施方式。对于发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,如果与本发明权力要求的技术方案没有产生本质上的区别,这些推演或替换仍然将被视为在本发明的保护范围之内。
Claims (3)
1、一种数字键盘汉字输入法,其特征在于,包括:
(一)字根选定规则:(1)以五个基本笔画“一”、“丨”、“丿”、“丶”、“乙”作为字根;(2)以组字能力≥300字的在首偏旁,以及出现在字中或字末的部首或笔画构件作为字根;(3)组字能力≥100字,分拆字根超过二个的在首偏旁,分拆设置字根,目的是使其分拆只占两码;(4)以便于实现编码字根最大化,汉字分拆难度较大的偏旁、部首、笔画型,“”、“矛”、“巫”、“”、“爪”、“求”、“”、“尸”、“卩”、“”作为字根;(5)将有两种或多种“变形”的偏旁、部首或笔画型,归入同一个字根;
(二)字根键位布置:(1)将五个基本笔画字根“一”、“丨”、“丿”、“丶”、“乙”安排在五个不同键位里;(2)将“氵”、“艹”、“口”、“扌”、“亻”五个组字能力极强的在首偏旁字根安排在不同键位里,但可与五个基本笔画同键位;(3)将较多出现在字中或字末的部首或笔画构件字根安排在不同键位里,并兼顾重码最少以及笔画形态相近;
根据所述字根选定规则选定的字根为68个,所述字根在数字键盘上的位置如下表所示,字根对应的键位数字即为该字根的编码:
(三)对汉字取码编码及输入方法:将分拆超过两个字根的在首偏旁的字用两个码位表示,取码时,首先从在首偏旁中按照笔顺以第一笔实行字的首码字根最大化,接着在偏旁中用未取笔画按笔顺实行字的第二码字根最大化,这之后,偏旁中多出的笔画不参加字的编码;然后用四个码位表示它们的部首;部首取码时,先用部首按倒数顺序以末笔实行字的末码字根最大化;接着用部首未取笔画按笔顺实行字的第三码字根最大化;再接着用部首未取笔画按笔顺实行字的第四码字根最大化;然后用部首未取笔画按笔顺实行字的第五码字根最大化,以上这种在首偏旁就称之为舍笔画取码偏旁,并且只准许它们占有两个码位;
对于非偏旁舍笔画编码字取码时,首先按照笔顺以字的在首笔画实行首码字根最大化;并用字的未取笔画按倒数顺序以末笔实行末码字根最大化;接着用字的未取笔画按笔顺实行第二码字根最大化;再接着用字的未取笔画按笔顺实行第三码字根最大化;如此类推第四码字根最大化,第五码字根最大化;
在编码过程中,编码按顺数码位排列,而在实现字根最大化时,则按首码、末码、第二码、第三码、第四码、第五码的次序进行,在发生被取码笔画相矛盾时,后者依次让前者;
偏旁作为整体字或在字末时,不舍笔画取码;
只有一个或两个字根的字,其编码为字根所在键位加声母编号组成编码;
根据汉字的编码依次击打相应数字键盘的数字键,该汉字即输入计算机;
对编码中汉字的笔顺作如下规定:
1)从左到中,至右;在以“撇”、“捺”或“点”对称排列在两边时,按两种情况处理:
(1)中间笔画定位两偏旁笔画型,先中间,后两边;
(2)两边在上夹中交或跨笔画型,先两边和“横”,后中间;
2)从上到下;
4)两笔画相接,若有出头时,出头者为先,若无出头成左上角时,看成先角上,后角下;
5)全包围,左上右包围、上左包围、上右包围字型,先外后里;
6)左下右包围,左下包围,上左下包围字型,先里后外;而对于一些特殊的近于左下包围的但却难以认定为左下包围结构的笔画型如:
(1)把笔画“”右上的笔画看作被笔画“”左下包围笔画型,以笔画“”右上的笔画为先;
(4)由多笔画组成的偏旁“辶”、“廴”看作左下包围,除此以外,其它由多笔画组合的类似笔画型不视为左下包围笔画型;
7)“点”在上部或左上,笔顺为先;
对汉字的笔画结构的认定还有如下规定:
2)“提笔”为“横”,但“横”不为“提笔”;
4)方框内包有一笔画者即认定为“囗”框,不为“口”字;
7)“竖钩”变“竖”则依“竖”,“竖”变“竖钩”则依“竖钩”,但不包括“亦”在上时;
8)部首“西”在字整体上部或部首上部时,“囗”框内笔画均为两“竖”,但不包括部首“酉”、“酋”,即“酉”、“酋”中虽有笔画型“西”,但不看作部首“西”,而把“酉”、“酋”看作整体构字部件;
所述字根,为笔画相连,或为笔画相交,或为笔顺相连,或为笔画位置相连续,不存在被中插笔画隔分;如字根被中插笔画隔分,应是“撇”、“捺”或“点”对称排列在中插笔画两边,笔顺相连。
2、如权利要求1所述的数字键盘汉字输入法,其特征在于:数字键盘还设置有第一重码键、第二重码键、第三重码键和标点符号键。
3、如权利要求1或2所述的数字键盘汉字输入法,其特征在于:双字词组编码取各字的首码、第二码和末码按词组组字顺序构成;三字词组编码取各字的首码、末码按词组顺序构成;四字以上词组编码取第一字的首码、末码和第二字的首码、末码以及第三字、最后一字的首码按词组组字顺序构成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100353925A CN100489747C (zh) | 2007-07-19 | 2007-07-19 | 一种数字键盘汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100353925A CN100489747C (zh) | 2007-07-19 | 2007-07-19 | 一种数字键盘汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101086686A CN101086686A (zh) | 2007-12-12 |
CN100489747C true CN100489747C (zh) | 2009-05-20 |
Family
ID=38937669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007100353925A Expired - Fee Related CN100489747C (zh) | 2007-07-19 | 2007-07-19 | 一种数字键盘汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100489747C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169374A (zh) * | 2010-02-26 | 2011-08-31 | 陈志文 | 易识中文输入法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101216740B (zh) * | 2008-01-03 | 2010-06-02 | 魏贻通 | 统一数字码部首汉字输入法 |
CN102915121A (zh) * | 2011-03-13 | 2013-02-06 | 周大新 | 纯数字编码(汉字)打字法 |
-
2007
- 2007-07-19 CN CNB2007100353925A patent/CN100489747C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169374A (zh) * | 2010-02-26 | 2011-08-31 | 陈志文 | 易识中文输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN101086686A (zh) | 2007-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100489747C (zh) | 一种数字键盘汉字输入法 | |
CN101930292B (zh) | 汉字的形音数的综合编码输入方法和应用 | |
CN101706682A (zh) | 利用字根笔画码输入汉字的方法 | |
CN102253726B (zh) | 一种计算机汉字数字笔画的输入方法及键盘技术 | |
CN100465862C (zh) | 一种首末码汉字输入方法 | |
CN100403240C (zh) | 计算机汉字编码输入方法 | |
CA2726923A1 (en) | Chinese character input method adapting for chinese teaching | |
CN1908870B (zh) | 单击与多键并击混合输入中英文的方法和键盘 | |
CN101093421A (zh) | 汉字的四笔层次形码及形音的数字编码输入方法 | |
CN101587381B (zh) | 音形汉字无重码输入法 | |
CN102043469A (zh) | 两笔型三维数码输入法及其键盘 | |
CN101833378B (zh) | 一种改进的五笔输入法及其键盘 | |
CN101901061B (zh) | 汉字序码输入方法 | |
CN1204487C (zh) | 根声码汉字输入法 | |
CN101359253B (zh) | 计算机汉字结构笔顺数字和部首偏旁混合编码输入法 | |
CN109144288B (zh) | 汉字输入方法、输入装置、字库系统及存储介质 | |
CN1609765B (zh) | 活字码中文字根输入法及其键盘 | |
CN100353299C (zh) | 一种使用数字键盘的汉字输入方法 | |
CN101281433B (zh) | 在计算机大键盘注音输入繁体汉字的方法 | |
CN102053714B (zh) | 双击输入中英文的方法和键盘 | |
CN101216740B (zh) | 统一数字码部首汉字输入法 | |
CN105320291B (zh) | 组合式音义类主副码汉字、词语编码输入法及其键盘 | |
CN100373307C (zh) | 汉字数码的国际交流软件 | |
CN101093422A (zh) | 拼音尾巴码一体化汉字键盘输入系统 | |
CN102221902A (zh) | 天然数码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090520 Termination date: 20110719 |