CN102096477A - 汉字正反序双部件归部检索法及拼音盲打智能输入法 - Google Patents

汉字正反序双部件归部检索法及拼音盲打智能输入法 Download PDF

Info

Publication number
CN102096477A
CN102096477A CN2011100249241A CN201110024924A CN102096477A CN 102096477 A CN102096477 A CN 102096477A CN 2011100249241 A CN2011100249241 A CN 2011100249241A CN 201110024924 A CN201110024924 A CN 201110024924A CN 102096477 A CN102096477 A CN 102096477A
Authority
CN
China
Prior art keywords
word
sign indicating
indicating number
chinese character
positive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100249241A
Other languages
English (en)
Inventor
龚学胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2011100249241A priority Critical patent/CN102096477A/zh
Publication of CN102096477A publication Critical patent/CN102096477A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种汉字正反序双部件快速定字、归部、检索法,一种建立在此基础上,输入多种字符集的几万个汉字时,对部分汉字按一定规则转码,在通用大键盘上全码输入无重码、在12键小键盘上全码输入最多显示6个字无须翻页的大小键盘通用的拼音智能输入法,及一种利用汉字正反序形码和笔画反查编码的方法。每个汉字按照本发明的正反序部件表分别从左上角和右下角取正序、反序两个部件,可同时用于汉字的归部、检索和输入法中的正序码和反序码。本发明可用于多种字符集的输入,优于多种输入法,使能查字典的每一个人不管使用双拼、简拼或全拼的方式都能快速盲打,让汉字的归部、检索与计算机、手机等的输入以科学、快捷的方式融为一体。

Description

汉字正反序双部件归部检索法及拼音盲打智能输入法
技术领域
本发明涉及一种汉字按正反序部件快速定字、归部、检索的方式,一种能用于输入多种字符集的几万个汉字的拼音智能输入法,及使用汉字的正反序部件和笔画查字、使用汉字的正反序形码和笔画反查编码的方法。
背景技术
传统上延续使用的多种“部首检字法”,一般取字的上下、左右或内外的某一部分作部首。如“夏”字从下边取“夊”部,上边不取部;“斃”字从右上取“攵”部;“歸”字从左下取“止”部;“思”字有的从上取“田”部,有的从下取“心”部;“鸿”字有的从左取“氵”部,有的从右取“鸟”部;遇上“甚、芈、臧、囊、赜、纛、鬱、爨”之类的字,普通查字的人常感到难以确定部首。无固定规律地从字的多个不同部位取部,使其不确定性过大,检索效率低,严重落后于时代要求,不符合国际上通用的“按固定顺序检索”的习惯,不利于以计算机等现代化方式检索。由于原有的部首划分方式较为宽泛,只用一个部首也无法准确定义一个汉字的字形特征,导致了各种借助形码的输入法取部难、取部慢、取部方式不统一,也导致了过高的重码率。从某种意义上说,汉字的检索和输入是否科学、规范、快捷,也关乎到汉字的国际地位。
目前使用的汉字,一般不超出GBK编码字符集或GB18030-2000的范围,前者21003字,后者27533字。汉字从大的方面可分为简化字、繁体字和异体字,简化字、繁体字中也存在一些分支,如现今繁体字中较大的分支有台湾繁体字、香港繁体字和大陆繁体字。“简”与“繁”是相对的,简化字的国标码与繁体字的大五码中有四千多字是相同的。各种用字之间存在复杂的对应关系,不能全面、完整地转换。国标码有二百多个字不能转为大五码的字;大五码约有四千多字不能转为国标码的字。以“魚”作部首并与“魚”有关联的字,国标码有七十多字,大五码有一百六十多字,其中国标码有十几个、大五码则有一百零几个魚部的字不能转为另一内码的字。仅化学用字一项,国标码的二百零几个字就有四十多个字不能转为大五码。因而能让大众使用的无重码输入GBK或GB18030全部汉字的汉字输入法是时代所需。
当今使用的输入法种类很多,从大的方面划分,有纯形码输入法、纯音码输入法和音形码输入法等。纯形码输入法的编码规律通常不能涵盖全部汉字,某些字只能用变形字根等不规范的处理办法,某些简码字无规律,需要特殊记忆,总体说记忆量非常大,一般只有专业打字员使用。纯音码和音形码的输入法重码太多,形码的划分无统一标准,学起来不算难,用起来较难。有的输入法为了减少重码,把编码扩展到字母以外的符号,用起来并不方便。因而目前还没有一种输入法被公众广泛认可、接受。汉字的字音分布极不均衡,如果不考虑声调,在GBK的21003个汉字中,仅发yi(衣)音的字就有大约400个。在涉及到字音的输入法研究中,消除重码多年来一直是一个没有突破的重大课题。虽然对于输入法的看法各有不同,但社会各界大致上还是有共识,一种能被公众广为接受、使用的汉字输入法应当符合以下几个条件:1.按照汉字本身的特征和规律,为了减小记忆量,输入法应与汉字的字音相关。2.当用大键盘输入时,所用编码不超出通用键盘26个字母的范围。3.能无重码输入GBK或GB18030的2万多个汉字。4.如果输入法中有音码以外的形码等辅助码,使用者应当很容易熟记。5.不需要切换码表或词库,就能输入简化字的语词和繁体字的语词,并且二者不会混淆。
随着手机等产品的普及,小键盘输入与人们的生活越来越紧密,但现行小键盘输入法(如使用较多的T9、iTAP、eZi等)的输入速度适应不了快速的现代生活节奏。现行小键盘输入法分作笔画和拼音两大类,笔画输入法难记,拼音输入法重码过多,都需要按一大串的按键和繁琐的选择过程才能输入一个字,输入速度太慢。小键盘输入法也存在其他许多争相研究而没有解决的问题。
发明内容
本发明提供一种汉字按正序和反序两个部件快速定字、归部、检索的方式,和建立在双部件归部基础上,编码只使用英语通用键盘的26个字母,通过按既定规则对部分汉字转码、优化形码等,全码输入GBK、GB18030-2000等内码的二万多个汉字时,在26个字母的通用键盘上输入无重码、在12键的小键盘上输入最多显示6个字无须翻页的拼音智能输入法,简繁体字、简繁体语词在不用切换码表或词库的状况下即可任意输入,使能查字典的每一个人不管使用双拼、简拼或全拼的方式都能快速盲打,及一种利用汉字的正反序部件和笔画查询汉字、利用汉字的正反序形码和笔画反查编码的方法,使汉字的归部、检索与汉字输入,使汉语教材、工具书等与汉字输入以科学、快捷的方式融为一体。
附表与附图说明
表1为汉字部分正反序部件形码、名称表。
表2为汉语拼音、龚码全拼与龚码双拼部分音节对照表。
图1为汉语拼音标示的龚码转码示意及双拼键位。图中附有形码与所在键位字母相关的高频部件,如“土、田”的形码为t,附在T的键位内。
图2为华语拼音标示的龚码转码示意及双拼键位。图中附有形码与所在键位字母相关的高频部件。
具体实施方式
一、汉字正反序双部件快速定字、归部、检索法
1.每一个汉字都按正序、反序两个部件归部。
2.正序部件一般取自汉字的左上角,反序部件一般取自汉字的右下角。如“龚”字取“龙”为正序部件,取“共”为反序部件。“学”字取“
Figure BSA00000425072800031
子”,“胜”字取“月、生”为正反序部件。“湖、陛、幕、犟”的正反序部件分别为“氵月、阝土、艹巾、弓牛”。
3.全包围或半包围结构的字,正序部件取包围部分的左上角。如“虚、赶、句、凤、凼、噩、因”中的正序部件分别为“虍、走、勹、几、凵、王、口”。
反序部件取被包围部分的右下角。如“巫、威、闯、周、式、向、采”中的反序部件分别为“人、女、马、吉、工、口、丷”。
4.包容性较大的部件优先。如“敛”的正序部件是“佥”不是“人”,“臺”的正序部件是“吉”不是“士”,“搂”的反序部件是“娄”不是“女”,“光”的反序部件是“兀”不是“儿”。
5.形结构的反序部件取左下部分。如“颍、颓、颣、颢、濲、徵”的反序部件分别为“水、几、糸、小、禾、王”。
Figure BSA00000425072800033
形结构的反序部件取下中部分。如“赢、瀛”的反序部件分别为“贝、女”。
Figure BSA00000425072800034
形结构的反序部件取中间部分。如“哀、衡”的反序部件分别为“口、大”。
6.左中右或上中下结构的汉字,当两端部件相同时,反序部件取中间部分。如“楙、辩、坴、呂”的反序部件分别为“矛、讠、八、丿”。
7.某些近似部件合在一起使用。如“本、未、朿、束”作为部件使用时归入“木”,作为单字时仍按本身的字形拆分。
8.大部分部件正反序通用,如“副”的正序部件和“咸”的反序部件都是
Figure BSA00000425072800035
“甬”的正序部件和“伶”的反序部件都是“マ”,“前”的正序部件和“壴”的反序部件都是
Figure BSA00000425072800036
“阜”的正序部件和“追”的反序部件都是
Figure BSA00000425072800037
“冰”的正序部件和“韵”的反序部件都是“冫”,“欧”的正序部件和“杧”的反序部件都是“匚”,“冬”的正序部件和“复”的反序部件都是“夂”。少数部件通常只用于正序,如“扌、艹、宀、犭、耂、
Figure BSA00000425072800042
Figure BSA00000425072800043
”;少数部件通常只用于反序,如“攵、廾、乚、刂、皿、、
Figure BSA00000425072800045
”。
9.一笔写成的字,若笔形无变化,正反序部件视为相同。如一、丨、丿、丶、的正反序部件都是本身。
一笔写成的字,若笔形中间有变化,正反序部件依笔形变化而定。如“乚、乙”的正反序部件分别为“丨折、一折”。
为了以汉字正反序双部件方式快速、准确地定字、归部、检索,在原有的汉字部件之外增加“(向字框)、
Figure BSA00000425072800048
(畐字头)、
Figure BSA00000425072800049
(卬字旁)、
Figure BSA000004250728000410
(长字底)、(丧字底)、(农字底)、
Figure BSA000004250728000413
(黄字底)、
Figure BSA000004250728000414
(争字底)”等汉字部件。“定字”的意思是判定一个汉字的字形特征。
以下是按主形部件(括号内为附形部件)笔画排序的汉字正反序部件表,部件后的字母是各种输入法都可以使用的正反序形码,其中ㄑ( )为“折”,
Figure BSA000004250728000417
为“捺”,“門”一般用于非简化字。部件的名称、例字请参看本申请附录中的“汉字部分正反序部件形码、名称表”。
汉字正反序部件表(笔画序)
一画:一(
Figure BSA000004250728000419
)h  丨(亅)g  丿p  丶d   ㄑ(
Figure BSA000004250728000420
Figure BSA000004250728000421
)v
Figure BSA000004250728000422
n 乙t  乚l  乁f
二画:亻l  讠(訁)i  又(叉)s  阝f十(ナ)w  人g  刂n  匕k  力c  乂(ㄨ)a  厶(
Figure BSA000004250728000423
Figure BSA000004250728000424
)s  亠f  冫(
Figure BSA000004250728000425
Figure BSA000004250728000426
)b  几(
Figure BSA000004250728000427
)k  儿e  卜(
Figure BSA000004250728000428
上下不丕)v  八a  匚(
Figure BSA000004250728000429
)p刀(
Figure BSA000004250728000430
刃)d  
Figure BSA000004250728000431
(リ)w  厂(ㄏ
Figure BSA000004250728000432
)s  j  勹(刁)w  二e  丁(
Figure BSA000004250728000433
)d 丂(ㄅ)h  七(
Figure BSA000004250728000436
)q  ()v  卩(
Figure BSA000004250728000437
)e  (ク
Figure BSA000004250728000438
)o  冂(
Figure BSA000004250728000439
)t  九j  冖(乛)m  丷h乃(
Figure BSA000004250728000440
)n  入r
Figure BSA000004250728000441
i  廴t  凵x
三画:口k  氵e   艹(卅)c  土t  扌p  女n  纟(糹)s  大(夫夭天夬)o  山d  忄x  寸c马(馬)g  巾d  之(辶乏)m  干(千于平
Figure BSA000004250728000443
)m  小f  犭y  三(彡)s  夂(夊
Figure BSA000004250728000444
)d门(門)m  广z  宀b  工g  子z  饣(
Figure BSA000004250728000445
)t  兀u  士w  弓(
Figure BSA000004250728000446
)g  尸(
Figure BSA000004250728000448
)w廾g  彳k  尢(
Figure BSA000004250728000450
)i  夕(
Figure BSA000004250728000451
)x  彐(
Figure BSA000004250728000452
丑)d  巳(已己)s  川(巛州)o  幺(乡)i  口g
Figure BSA000004250728000454
s
Figure BSA000004250728000455
q
Figure BSA000004250728000456
g  也i  屮(
Figure BSA000004250728000457
Figure BSA000004250728000458
)q  (
Figure BSA000004250728000460
)x
Figure BSA000004250728000461
x  丬(
Figure BSA000004250728000462
)j
四画:木(本夲未朿束)a  日(曰
Figure BSA000004250728000463
)r  月(
Figure BSA000004250728000464
)y  贝(貝)b  王(玉主)u  火h  心(必)x  车(車)m  戈(戊
Figure BSA000004250728000465
戋)c  攵p  灬h  禸(内肉匃)r  止(正
Figure BSA000004250728000466
)v
Figure BSA000004250728000467
f  欠e丰()f  见(見)l  方(万)h  斤(斥丘)v  犬(犮)q  礻x  勿u
Figure BSA000004250728000468
n  水e  殳w手(
Figure BSA000004250728000469
乎)q  毛m  巴r  文u  爿(片
Figure BSA000004250728000470
)o  歹d  
Figure BSA000004250728000471
(五)n  韦(韋)u  少w牜r  瓦u  氏(氐)a  牛n  今j  户h   中(
Figure BSA000004250728000473
)z  爪(爫)z  
Figure BSA000004250728000474
(母)g  斗d屯t  
Figure BSA000004250728000475
v  廿(
Figure BSA000004250728000476
)n  牙i
Figure BSA000004250728000477
g
Figure BSA000004250728000478
l  x
五画:钅(釒)j  鸟(
Figure BSA000004250728000479
乌鳥
Figure BSA000004250728000480
鳥)z  田(申甲由)t  石w  目q  禾(采)u  皿m  疒r  衤z  冋(冏)j
Figure BSA000004250728000481
(求
Figure BSA000004250728000482
)u  白(百
Figure BSA000004250728000483
)l  マ(フ)m  示k  立(
Figure BSA000004250728000484
)p  册(冊曲
Figure BSA000004250728000485
)t  矢(失)w  且(
Figure BSA000004250728000486
)u旦(亘)d  可o  穴(
Figure BSA00000425072800051
)x  用(甫)y  古e  龙(尨龍)l  四(罒)r  半(
Figure BSA00000425072800052
)b  生w  占v业(亚)i  皮p  瓜g  电(
Figure BSA00000425072800053
)d  疋p  冉r  弗f  甘g
六画:虫(
Figure BSA00000425072800054
)o  v  米(来)h  页(頁)i  耳u  羽q  早()z  舟(丹)b  臼(
Figure BSA00000425072800056
)j糸s  吉j  艮(
Figure BSA00000425072800057
Figure BSA00000425072800058
)g  臣(
Figure BSA00000425072800059
亞)o  而e  各g  缶f  共n  聿(
Figure BSA000004250728000510
)y  羊()i舌w  虍h  
Figure BSA000004250728000511
(
Figure BSA000004250728000512
)f  西(覀)x  衣i  耒n  自(
Figure BSA000004250728000513
)z  q
Figure BSA000004250728000514
七画:
Figure BSA000004250728000515
b  走(
Figure BSA000004250728000516
)l  豕y  酉(酋)f  辛(幸)y  里l  豆d  言i  角j
Figure BSA000004250728000517
h  辰o佥(僉)q  豸v  身w  足b  麦(
Figure BSA000004250728000518
)m
八画:鱼(魚)q  隹v  雨z  其(甚)q  金j  非f  齿(齒)o  具(真
Figure BSA000004250728000519
)j或h  黾(黽)m
Figure BSA000004250728000520
o
九画:革g  骨n  娄(婁)l  鬼g  柬j  怱(悤)c  韭j  面(囬)m  食e
十画及以上:髟f  兼j
Figure BSA000004250728000521
l  門d  鹿b  黑h  鼠(巤)w  鼻b
汉字正反序部件、笔画查字法:
当正反序双部件用于汉字检索时,按照正序部件、反序部件、笔画的方式查询,如“龚”字,按照正序部件“龙”、反序部件“共”、11画的顺序即可查询到。
可分别制定正序检字表和反序检字表。如“湖”字,在正序检字表中归“氵部”,在反序检字表中归“月部”。
以上的汉字正反序双部件归部、检索法可用于工具书、教科书等图书和网络、软件、光盘等的汉字归部、排序、检索等用途,以及各种大小键盘输入法中制定形码。
二.26字母通用键盘龚码智能输入法
汉语拼音、龚码全拼与龚码双拼编码的部分对应请参看附录的对照表。
以下是以汉语拼音标示的转码示意与龚码双拼键位:
Figure BSA000004250728000522
以下是以华语拼音标示的转码示意与龚码双拼键位:
Figure BSA00000425072800061
以下是按正反序部件形码排序的汉字正反序部件表,部件的名称、例字请参看本申请附录中的“汉字部分正反序部件形码、名称表”。按笔画排序的汉字正反序部件表请参看本申请前面的第一部分“汉字正反序双部件归部、检索法”。
汉字正反序部件表(形码序)
a木(本夲未
Figure BSA00000425072800062
束)乂(ㄨ)八氏(氐)
b贝(貝)
Figure BSA00000425072800063
足冫(
Figure BSA00000425072800064
)宀舟(丹)鹿半(
Figure BSA00000425072800066
)鼻
c艹(卅)寸力戈(戊
Figure BSA00000425072800067
戋)怱(悤)
d山巾夂(夊
Figure BSA00000425072800068
)刀(刄刃)彐(
Figure BSA00000425072800069
丑)丁(
Figure BSA000004250728000610
)旦(亘)豆歹丶电()斗門
e氵水儿欠二(
Figure BSA000004250728000612
)古卩(
Figure BSA000004250728000613
)而食
f阝亠小
Figure BSA000004250728000614
酉(酋)丰()缶髟非(
Figure BSA000004250728000616
)弗乁
g人马(馬)工弓(
Figure BSA000004250728000617
)廾丨(亅)革艮(
Figure BSA000004250728000618
Figure BSA000004250728000619
)口各
Figure BSA000004250728000620
鬼瓜
Figure BSA000004250728000621
(母)甘
Figure BSA000004250728000622
h火米(来)灬一(
Figure BSA000004250728000623
)方(万)丂(ㄅ)黑
Figure BSA000004250728000624
户虍丷或
i讠(訁)言页(頁)尢(
Figure BSA000004250728000625
)幺(乡)羊()业(亚)也衣牙
Figure BSA000004250728000626
j钅(釒)金冋(冏)臼(
Figure BSA000004250728000627
)吉九角今兼柬具(真
Figure BSA000004250728000628
)韭丬(
Figure BSA000004250728000629
)
k口匕几(
Figure BSA000004250728000630
)示彳
l亻走()见(見)白(百
Figure BSA000004250728000632
)里龙(尨龍)乚娄(婁)
Figure BSA000004250728000633
Figure BSA000004250728000634
m车(車)皿之(辶乏)干(千
Figure BSA000004250728000635
于平ㄒ)门(門)マ(フ)毛冖(乛)黾(黽)面(囬)麦(
Figure BSA000004250728000636
)
n女刂
Figure BSA000004250728000637
Figure BSA000004250728000638
(五)共骨牛耒乃(
Figure BSA000004250728000640
)廿(
Figure BSA000004250728000641
Figure BSA000004250728000642
)
Figure BSA000004250728000643
o虫(
Figure BSA00000425072800071
)大(夫夭天夬)可川(巛州
Figure BSA00000425072800072
)臣(
Figure BSA00000425072800073
亞)爿(片)(ク
Figure BSA00000425072800075
)齿(齒)辰
Figure BSA00000425072800076
p扌攵匚(
Figure BSA00000425072800077
Figure BSA00000425072800078
)立
Figure BSA00000425072800079
丿皮疋
q鱼(魚)目羽犬(犮)七(
Figure BSA000004250728000710
)手(
Figure BSA000004250728000711
乎)其(甚)
Figure BSA000004250728000712
佥(僉)屮(
Figure BSA000004250728000713
Figure BSA000004250728000714
)
Figure BSA000004250728000715
r日(曰
Figure BSA000004250728000716
)疒禸(内肉匃)巴牜四(罒)入冉
s纟(糹)又(叉)厶(
Figure BSA000004250728000717
)三(彡)厂(ㄏ
Figure BSA000004250728000718
)糸巳(已己)
Figure BSA000004250728000719
t土田(申甲由)饣(飠)册(冊曲
Figure BSA000004250728000720
)乙冂(
Figure BSA000004250728000721
)屯廴
u王(玉主)禾(采)耳兀
Figure BSA000004250728000722
(求
Figure BSA000004250728000723
)勿且()文韦(韋)瓦
v隹卜(上下不丕)止(正
Figure BSA000004250728000726
)斤(斥丘)(
Figure BSA000004250728000728
Figure BSA000004250728000729
)(冖)占豸
Figure BSA000004250728000730
w石十(
Figure BSA000004250728000731
)士尸(
Figure BSA000004250728000732
Figure BSA000004250728000733
)
Figure BSA000004250728000734
(リ)勹(刁)矢(失)殳少生舌鼠(巤)身
x心(必)忄礻夕(
Figure BSA000004250728000735
)穴(
Figure BSA000004250728000736
)西(覀)(
Figure BSA000004250728000738
)
Figure BSA000004250728000739
凵
y月(冃冄
Figure BSA000004250728000740
)犭豕辛(幸)用(甫)聿
Figure BSA000004250728000741
z鸟(
Figure BSA000004250728000742
乌鳥
Figure BSA000004250728000743
烏)衤广子早(
Figure BSA000004250728000744
)雨中(
Figure BSA000004250728000745
)爪(爫)自(
Figure BSA000004250728000746
)
为了便于使用者记忆,形码一般是部件的首音码,如“钅(釒)、金、冋、(卷字底)、臼、吉、九、角、今、兼、柬、具、韭、丬(将字旁)”等部件的首音码本来就是“j”,“石、十、士、尸、リ(帅字旁)、勹(勺字旁)、矢、殳、少、生、舌、鼠、身”等部件的首音码本来就是“w”(汉语拼音的sh在本输入法方案中用作w)。
以下是部分部件的读音与双拼音码。
Figure BSA000004250728000747
Figure BSA00000425072800081
以上形码与关联字的读音完全一致,不用记忆。
部件音码的第一码就是该部件的形码。如“匚”的形码是p,“乂”的形码是a。
某些汉字本身有读音,作为部件使用时,若本身的首音码与形码不符,可用关联字很快记熟。如“木”的音码为mu,作为形码时为a,“桉”为木旁,音码为an,记住了“桉”,就记住了“木”作为部件时形码时为a。
以下按形码字母顺序排列的56个字可帮助快速记住较为特殊的形码。
桉八般麃力戈巅;
帄欧小酚髴个
Figure BSA00000425072800082
Figure BSA00000425072800083
昆凯衎赲览;
軞哶耨喫牀音;
鳅瞧翑拳桑厮委;
闻亹斩缘圉座。
以下为了方便,“双拼与简拼”略作“双简”,“简拼与全拼”略作“简全”,“双拼、简拼与全拼”略作“双简全”。音节中的最后一个音码为“末音码”,在单字的完整编码中指形码前的最后一个音码,双字母音节中指次音码,三字母音节中指三音码,四字母音节中指四音码。“全码输入”指输入时把该字的包括正序码、反序码的编码全部用上,如单字盲打时一般就是全码输入。
龚码拼音输入法中,每个汉字的音码双拼全部2码,简拼2-3码,全拼2-4码。简拼与全拼的区别仅仅是,全拼中4个字母的音节在简拼中简化为2个字母(按双拼的规则),iau→c,iag、uag→d,ian、uai→m,uan、yan→r。加上正反序形码后,每个汉字的全部编码双拼4码,简拼4-5码,全拼4-6码,依序为首音码、次音码、三音码(第三个音码,全拼与简拼中)、四音码(第四个音码,全拼中)、正序码(也是首形码)、反序码(也是次形码)。按以上键位表所示,双拼、简拼的部分次音码以汉字的读音按规则省略而成;正序码和反序码则按本申请第一部分中的汉字正反序双部件划分法确定。
如“区”的读音是qū,音码是qy,正序部件是“匚”,反序部件是“乂”,那么“区”的双简全编码依次为首音码q、次音码y、正序码p、反序码a。再如“龚、学、胜”三字的正反序部件分别为“龙共、
Figure BSA00000425072800091
子、月生”,双拼编码是gsln、xtxz、wgyw,简全编码是gugln、xyexz、wegyw。
与输入法版本相符的字、词分别称作“主用字、主用词”(这里的“词”也包括习惯用语),其他的字词称作“次用字、次用词”。语词中只要含有一个次用字就视为“次用词”。如在简化字版本中,“乘风破浪”为主用词,“乘風破浪”为次用词。由于简化字与繁体字中有许多字是相同的,“大小、多少、上下、裸婚、刷刷族、三不女、交警超市、一日千里、幼吾幼以及人之幼、以小人之心度君子之腹、人不可貌相,海水不可斗量”之类的语词,如果纯就输入编码而言,在简化字版本中属于主用词,在繁体字版本中也属于主用词。
为了达到只使用通用键盘上的26个字母,无重码输入GBK或GB18030的几万个汉字的目的,设计龚码输入法的总体理念是,把所有的汉字按一定规则分成两部分或多部分,对其中一部分或几部分汉字按一定规则转换编码。
在输入法的简化字版本中,以GB码(国标码)为基础确定“简化字”(主用字)的范围,其余的汉字定为“非简化字”(次用字);在输入法的繁体字版本中,以BIG5码(大五码)为基础确定“繁体字”(主用字)的范围,其余的汉字定为“非繁体字”(次用字)。
以简化字版本为例,“简化字”的范围以GB2312(国标码)的6763个汉字为基础,参照《现代汉语通用词表》和《通用规范汉字表》予以增补。对于GB2312以外的汉字,若符合简化字特征部件,也纳入简化字范围。其余的汉字则归入“非简化字”的范围。
有相当一部分汉字,可以根据特征部件区分类别。如以下的部件分别为“简化字|繁体字|异体字”:
亚|亞|亜;单|單|単;吴|吳|吳;带|帶|
Figure BSA00000425072800092
含有以下“|”前特征部件的汉字,一般视为简化字;含有以下“|”后特征部件的汉字,一般视为繁体字。
讠|訁;纟|糹;饣|飠;钅|釒;
Figure BSA00000425072800093
Figure BSA00000425072800094
Figure BSA00000425072800095
Figure BSA00000425072800096
Figure BSA00000425072800097
|睪;
Figure BSA00000425072800098
昜;昷|
Figure BSA00000425072800099
呙|咼;奂|奐;仑|侖;仓|倉;戋|
Figure BSA000004250728000910
;尔|爾;佥|僉;
Figure BSA000004250728000911
毚;兑|兌;卤|鹵;
Figure BSA000004250728000912
臤;几|幾;万|萬;么|麼;义|義;习|習;乡|郷;广|廣;门|門;飞|飛;马|馬;与|與;专|專;丰|豐;为|為;为|爲;乌|烏;云|雲;从|從;冈|岡;区|區;历|歷;双|雙;无|無;艺|兿;贝|貝;车|車;长|長;韦|韋;风|風;业|業;东|東;乐|樂;册|冊;刍|芻;卢|盧;厉|厲;发|發;只|隻;台|薹;圣|聖;宁|甯;宁|寧;对|對;汉|漢;礼|豊;节|節;让|讓;鸟|鳥;龙|龍;乔|喬;争|爭;亘|亙;亚|亞;产|産;众|眾;会|會;伤|傷;农|農;刘|劉;华|華;厌|厭;吕|呂;夹|夾;孙|孫;寻|尋;尧|堯;尽|盡;岁|嵗;岂|豈;师|師;当|當;戏|戲;执|執;朵|朶;杀|殺;毕|畢;达|達;齐|齊;两|兩;严|嚴;丽|麗;乱|亂;吴|吳;寿|壽;忧|憂;时|時;来|來;没|沒;灵|靈;麦|麥;龟|龜;单|單;卖|賣;参|參;国|國;备|備;审|審;录|彔;画|畫;罗|羅;肃|肅;虏|虜;郁|鬱;鱼|魚;黾|黽;齿|齒;养|養;娄|婁;宪|意;尝|嘗;带|帶;怱|悤;牵|牽;党|黨;宾|賓;晋|晉;爱|愛;皋|皐;真|眞;离|離;罢|罷;聂|聶;虑|慮;衮|袞;隽|雋;隽|巂;难|難;啬|嗇;婴|婴;梦|夢;渊|淵;猪|豬;盖|蓋;厨|廚;属|屬;御|禦;湿|濕;鲁|鲁;献|獻;禀|稟;鉴|鋻;稳|穩。
如以下国标码之外的汉字含有简化字特征部件,在输入法中归入简化字:
贠、豮、癝、瑸、椮、毶、粣、伡、傤、龁、
Figure BSA00000425072800101
亸、椫、啴、珰、珰、狝、珎、沨、飖、飏、飐、唝、阓、腘、啯、鲙、刾、篯、觍、伣、侭、浕、裈、翚、梿、厐、眬、溇、
Figure BSA00000425072800103
澛、芲、鹮、鹯、硙、闿、崄、硚、梼、诪、杤、韨、辒、缊、唀、肞、鲖、鲗、涢、筼、臜、酂、荝、萚、
Figure BSA00000425072800104
、蓘、蕏、玙、滪、庼、峣、彟、桪、犱、秇、辝、鹔、骕、纴、麹、麺、硵、硁、钑、钘。
对于多音字的多个字音,常用或较常用的字音同时保留,如全拼中“调”字用tiau和diau、“行”字用xig和hag、“弹”字用tan和dan都可以输入,双拼中“调”字用te和dc、“行”字用xv和hh、“弹”字用tj和dj都可以输入。
在输入法的简化字版本中,输入“简化字”(主用字)时按上述键位表不转码;在输入“非简化字”(次用字)时,按上述键位表所示,对编码的次音码(第二码)进行转码。如键位表中“S→C”,意思是当“非简化字”的次音码(第二码)为s时,转为以c输入。如“龚”为简化字,双拼编码为gsln;输入非简化字“龔”时,次音码s转为e,即非简化字“龔”字以双拼gcln的编码输入(“龙”与“龍”的形码都是l)。非简化字的形码按本身的字形,如简化字“学、胜”的正反序形码是“
Figure BSA00000425072800105
子、月生”,双拼编码为xtxz、wgyw;非简化字“學、勝”的正反序形码是“臼子、月力”,双拼编码为xsjz、wnyc。“龚、学、胜”的简全编码为gugln、xyexz、wegyw,“龔、學、勝”为gtgln、xzejz、wmnyc。
输入1-3键,每一个字后都有形码提示。如输入da,显示为:
1大h  2打p  3达m  4答v  5搭p
有时简化字和非简化字需要混合输入。由于龚码双拼输入单字时三键一般无须翻页,因而对于选字的使用者,每个单字1-3键即可,许多单字只需要1-2键。
如以单字选字方式双拼输入“當代漢語詞典國際華語版”,“代、典、版”按简化字,其他的字按非简化字:
dx  dl  hq  yz  cw  dm  gp  jw  hi  yz  bj
每个字只需要两键。
以单字选字方式全拼输入“當代漢語詞典國際華語版”:
drg  dai  hrn  yz  cw  dia  gto  jw  hta  yz  brn
每个字只需要2-3键,无须形码即可。
以单字盲打方式双拼输入“當代漢語詞典國際華語版”:
dxgt  dl  lc  hqeo  yzik  cwif  dmta  gpgh  jwfk  hicf  yzik  bjos
以单字盲打方式全拼输入“當代漢語詞典國際華語版”:
drggt  dailc  hrneo  yzik  cwif  dianta  gtogh  jwfk  htacf  yzik brnos
龚码拼音输入法中,双字词以音码组成,如“给力”的编码是双拼gzli、简全geili,“双打”的编码是双简wdda、全拼wuagda。对于末字为儿化音的双字词,以“首字音码+r’”组成,如“画儿”的编码是双拼hwr’、简全huar’,“幼儿”的双全简则是iuer。末字为字母的双字词,以“首字音码+字母+’”组成,如“升A”的编码是双拼wga’、简全wega’。
三字词以“三字首音码+末音码”组成,如“龚学胜”的编码是双简全gxwg。对于末字为儿化音的三字词,以“前两字首音码+r’”组成,如“一会儿”的编码是双简全ihr’,“干女儿”的编码则是双简全gner。儿化音在中间时用作“r”,“刺儿菜”的编码双拼为crcl、简全为crci,“小儿科”的编码双简全则为xeke。末字为字母的三字词,以“前两字首音码+字母+’”组成,如“甩老K”的编码是双简全wlk’。
四字及以上词以“前三字+末字”的首音码组成,双简全相同,如“龚码双拼”的编码是gmwp,“当代汉语词典(国际华语版)”的编码是ddhb。四字词中的儿化音为“r”,如“上场门儿”的编码为womr;五字及以上词中的儿化音在编码中忽略,如“玩儿的就是心跳”的编码为udjt,“人的名儿,树的影儿”的编码为rdmi。
忽略正序码、以“音码+?+反序码”输入:
有时遇上难以确定正序码,很容易确定反序码的字,也能以“音码+?+反序码”的方式输入。如“劉、賷、
Figure BSA00000425072800121
”,忽略正序部件,仅按反序部件“刂、貝、木”,双拼分别以“lk?n、jw?b、gd?a”的编码也可以输入以后选字。
一码固顶字:每一个字母都有一个固顶字。根据汉字单音节义项频,特别把“把”安排到“a”,把“说”安排到“o”,把“有”安排到“p”。
字母 a b c d e f g h i j k l m
  固顶字   把   不   次   的   二   非   个   和   一   及   可   了   没
字母 n o p q r s t u v w x y z
  固顶字   你   说   有   请   人   三   他   我   着   是   想   与   在
输入一码后,一码固顶字在前,其后的字按字频由高到低排列。如输入h后,显示为:1和 2会 3行 4后 5好 6还 7回 8话 9很
两码固顶字:每一个双拼的音码组合都有一个固顶字。如vs对应的固顶字是“中”,gk对应的固顶字是“高”。
输入两码后,两码固顶字在前,其后的字按字频由高到低排列。
一码固顶字与两码固顶字一般不重复。如一码固顶字中d对应“的”,两码固顶字中的de对应“得”,即一码固顶字的“的”在两码固顶字中不再出现。
两码固顶词:每一个双拼的“首音码组合+’”都有一个固顶双字词,如md’对应的固顶词是“目的”,bk’对应的固顶词是“包括”。
充分利用固顶字和固顶词,可以节省许多时间。
次用词的输入:
根据需要,在输入过程中简化字版本可以输入非简化字语词,繁体字版本可以也可以输入非繁体字语词,输入时次用词的编码加前导符或后置符,每个字的编码与所属版本中的单字相符。以下以加前导符“`”举例,“`”位于通用键盘左上角。
如在简化字版本中输入非简化字语词,双字词“雜誌”的编码双简全为“`zrvw”,“旅遊”的编码双简全为“`lyit”,“分辯”的编码为双拼“`ffbe”、简拼“`fenbe”、全拼“`fenbwan”,三字词“參觀圑”的编码为双简“`cgtg”、全拼“`cgtn”。三字词中第三字的末音码为非次音码时不转码。四字及以上词的编码由于不涉及次音码,切换前后编码相同,如“龔碼雙拼”的编码是“`gmwp”,“當代漢語詞典(國際華語版)”的编码是“`ddhb”。
编码优化法:
对于极少数重码字(一般与异体字相关),字频较高的字保留原编码,字频较低的字优化反序码。为了便于记忆,被优化的反序码优先取用最接近该字右下方的部件形码,包围结构中被包围部分优先。若没有其他部件,把本身的部件分拆开,从字的右下方开始取码。已被正序码取码的部件,不再用于反序取码。
如“菴、蓭”的原双简全编码都是alcd,“菴”的字频较高,保持原编码;“蓭”的反序码改取“大o”,编码重定为alco。
再如“
Figure BSA00000425072800131
、騏”的原双简全编码都是qwgq,“騏”的字频较高,保持原编码;“”的反序码把“其”拆分为“且、八”,从右下方改取“八a”,编码重定为qwga。
汉字正反序形码、笔画反查编码法:
对于不知道读音或编码的汉字,龚码双拼以“正序码+反序码+笔画”的方式查询,并能直接输入。
如在键盘上分别输入“\ln11、\xz8、\yw9、\ln22、\jz16、\yc12”,就能查询到双拼“龚gsln、学xtxz、胜wgyw、龔gcln、學xsjz、勝wnyc”、简全“龚gugln、学xyexz、胜wegyw、龔gtgln、學xzejz、勝wmgyc”的信息,这些被查询到的单字可直接上屏,编码不上屏。“\”是键盘上的反斜杠(也可用其他前导符),笔画数字从位于通用键盘右方的小键盘输入。
对于优化过反序码的字,查询时仍按优化前的反序码,查询显示的结果则为优化后的编码。如上面举例的“蓭、
Figure BSA00000425072800133
”二字,双简全分别以“\cd14、\gq17”查询编码,结果分别显示为“蓭alco、
Figure BSA00000425072800134
qwga”。
能查字典的人就能使用龚码拼音输入法快速盲打。龚码拼音输入法可用于国标码、大五码、GBK、Unicode码、GB18030等各种字符集的输入。
三.小键盘龚码智能输入法
小键盘龚码拼音输入法与龚码大键盘拼音输入法的键盘布局和转码方式完全相同,只是小键盘的键位较少,把大键盘所设的声、韵母按所属的字母归入小键盘。设有26个字母键的小键盘视为大键盘。龚码大、小键盘拼音輸入法的键盘对应方式请参看下面两表。其中“阿拉伯数字”和“其他标点”在键位能增加时可安排专用键,一键按出后选择,以减少按键次数。常用标点符号在相关位置双击,完毕自动切换回;其他标点符号双击Space键,完毕自动切换回;阿拉伯数字双击#键后选取,完毕自动切换回。
以下是小键盘龚码智能输入法键位表:
Figure BSA00000425072800141
以上字母与数字的对应可以根据需要作出各种改变,左上方的“\”也可以换成“/”、“’”、“=”或其他形式,功能不变。比如按以上设定,大键盘上的“’”换成小键盘上的“\”。
通用大键盘上有26个键,一码就是一键,一码按一次;通用小键盘上只有12个键,某些输入法一码要按1-4次,比如上面的P,要按666才能生效。在小键盘的龚码输入法中,一码仍然只按一次键,比如上面的Y只按一次5、P只按一次6即可。按照大键盘龚码拼音输入法的编码,按照以上小键盘的键位全码输入GBK的2万多个单字,双拼最多只显示6个单字,简全最多只显示5个单字,无须翻页,许多单字只需要1-3键;。
只输入一键2(b或i),显示为:
1一 2不 3有 4也 5把 6要
选择6后“要”字上屏并出现按词频顺序排列的联想字:1求 2闻 3是 4素 5紧 6么。选择所需的数字后相应的联想字会上屏。
双拼输入三键#74(tmk),“田”显示在第一个字,选择上屏后出现按词频顺序排列的联想字:1径 2野 3间 4地 5园 6头。
小键盘龚码拼音输入法与大键盘龚码拼音输入法的转码方式相同。如在简化字版本中想输入“非简化字”的正序为弓部的mi音字,双简全输入707(mwg)后,显示为:1彌 2冪 3冞 3瓕。“龔、學、勝”三字在小键盘上的编码分别为7336、8099、0653。
如以单字选字方式双拼输入“當代漢語詞典國際華語版”,“代、典、版”按简化字,其他的字按非简化字:
487 43 815 592 302 47# 767 906 823 59 229*
每个字只需要输入3键,“代”字只需要两键。
以单字选字方式全拼输入“當代漢語詞典國際華語版”:
4577 412 8565 5924 3026 4216 7#*7 9064 8#13 5924 256*
每个字只需要输入4键,“代”字只需要3键。
双字词、四字词及四字以上词的编码安排同大键盘。如固顶双字词:目的→74\,包括→24\。再如以上大键盘输入法中的举例在小键盘中的双拼编码:画儿→805\,幼儿→2*55,龚学胜→7807,一会儿→285\,干女儿→7655,甩老K→034\,龚码双拼→7706,当代汉语词典(国际华语版)→4482。
次用词的输入加前导符“\”或其他符号。如在简化字版本中输入非简化字语词,双字词“雜誌”的编码双简全为“\95#0”,“旅遊”的编码双简全为“\352#”,“分辯”的编码为双拼“\6625”、简拼“\65625”、全拼“\6562016”,三字词“參觀圑”的编码为双简“\37#7”、全拼“\37#6”。三字词中第三字的末音码为非次音码时不转码。四字及以上词的编码由于不涉及次音码,切换前后编码相同,如“龔碼雙拼”的编码是“\7706”,“當代漢語詞典(國際華語版)”的编码是“\4482”。
对于不知道读音或编码的汉字,小键盘龚码中也能以“正序码+反序码+笔画”的方式查询,并能直接输入。前导符可用“\\”或其他符号。
如在键盘上分别输入″\\3611、\\898、\\509、\\3622、\\9916、\\5312″,就能查询到双拼″龚7036、学8#89、胜0750、龔7336、學8099、勝0653″、简全″龚7*736、学85589、胜05750、龔7#736、學89599、勝07753″的信息,这些被查询到的单字可直接上屏,编码不上屏。
安排可供选择的多级词库和各类冗余单字屏蔽功能:机内词库按小键盘用语词频排列,用户可根据需要选择和修改。如用户在总词库中选取5000词,即表明用户在输入信息时选择按小键盘用语词频排列的前5000词作基准,用户可将选取的词库转入台式或手提电脑等根据个人需要增删或调整频度,然后转回小键盘所用词库。这个词库处理方法也适用于大键盘输入,用户可通过选取和调节词库使自己的生活变得简捷。接收信息并不受此影响。
以上概略地对本发明的汉字正反序双部件归部检索法、大小键盘拼音智能输入法、汉字正反序部件笔画查字法、汉字正反序形码笔画反查编码法作了描述。本发明相关领域的人员,可以不经创造性劳动就能对本发明作出各种各样的修改和改进。发明人认为,这种修改和改进都属于本发明的权利要求书所定义的范围之内。
本发明可有效应用于汉字的信息数字化输入、传输、识别、计算机处理、机器翻译、排序、检索、速记、文字智能处理、语音识别系统、同声传译系统等所涉及到的音标和平面、电子工具书,可用于涉及到汉字的各种计算机软件(如操作系统、浏览器、文字处理、排版、光学OCR识别、翻译、校对等软件),国际互联网,平面(工具书、教材、图书报刊等)、多媒体(CD、DVD光碟等)、电子(国际互联网页等)出版物、普通手机、智能手机、电子字典及各类信息电器等,可支持所有平台,可用于主机Server端或客户Client端,可用于文件、电子邮件、页面。
汉字部分正反序部件形码、名称表表1
注:部件后的字母是形码。
汉语拼音、龚码全拼与龚码双拼部分音节对照表表2
Figure BSA00000425072800181

Claims (4)

1.一种汉字按正反序部件归部、检索的方法,其特征在于:
1)每一个汉字按正序、反序两个部件归部;
2)正序部件一般取自汉字的左上角,反序部件一般取自汉字的右下角;
3)全包围或半包围结构的字,正序部件取包围部分的左上角,反序部件取被包围部分的右下角;
4)包容性较大的部件优先;
5)
Figure FSA00000425072700011
形结构的反序部件取左下部分,
Figure FSA00000425072700012
形结构的反序部件取下中部分,
Figure FSA00000425072700013
形结构的反序部件取中间部分;
6)左中右或上中下结构的汉字,当两端部件相同时,反序部件取中间部分;
7)某些近似部件合在一起使用,作为单字时仍按本身的字形拆分;
8)一笔写成的字,若笔形无变化,正反序部件视为相同;一笔写成的字,若笔形中间有变化,正反序部件依笔形变化而定;
9)在原有的汉字部件之外增加“
Figure FSA00000425072700014
(向字框)、(畐字头)、
Figure FSA00000425072700016
(卬字旁)、
Figure FSA00000425072700017
(长字底)、(丧字底)、
Figure FSA00000425072700019
(农字底)、
Figure FSA000004250727000110
(黄字底)、
Figure FSA000004250727000111
(争字底)”等汉字部件;
10)当正反序双部件用于汉字检索时,按照正序部件、反序部件、笔画的方式查询。
以下是按主形部件(括号内为附形部件)笔画排序的汉字正反序部件表,部件后的字母是可用于多种输入法的正反序形码:
一画:一(
Figure FSA000004250727000112
)h  丨(亅)g  丿p  丶d  ㄑ(
Figure FSA000004250727000113
Figure FSA000004250727000114
)vn  乙t  乚l  乁f
二画:亻l  讠(訁)i  又(叉)s  阝f  十(ナ)w  人g  刂n  匕k  力c  乂(ㄨ)a厶(
Figure FSA000004250727000116
)s  亠f   冫(
Figure FSA000004250727000117
Figure FSA000004250727000118
)b  几(
Figure FSA000004250727000119
)k  儿e  卜(
Figure FSA000004250727000120
上下不丕)v  八a匚(
Figure FSA000004250727000121
)p  刀(
Figure FSA000004250727000122
刃)d  
Figure FSA000004250727000123
(リ)w  厂(ㄏ
Figure FSA000004250727000124
)s  j  勹(刁)w  二e  丁(
Figure FSA000004250727000125
)d  丂(ㄅ)h  七(
Figure FSA000004250727000126
Figure FSA000004250727000127
Figure FSA000004250727000128
)q  (冖)v  卩(
Figure FSA000004250727000129
)e  (ク
Figure FSA000004250727000130
)o  冂(
Figure FSA000004250727000131
Figure FSA000004250727000132
)t  九j  冖(乛)m  丷h  乃(
Figure FSA000004250727000133
)n  入r
Figure FSA000004250727000134
i  廴t  凵x
三画:口k  氵e 艹(卅)c  土t  扌p  女n  纟(糹)s  大(夫夭天夬)o  山d  忄x  寸c  马(馬)g  巾d  之(辶乏)m  干(千
Figure FSA000004250727000135
于平
Figure FSA000004250727000136
)m  小f  犭y  三(彡)s  夂(夊
Figure FSA000004250727000137
)d  门(門)m  广z  宀b  工g  子z  饣(飠)t  兀u  士w弓(
Figure FSA000004250727000138
)g  尸(
Figure FSA000004250727000139
Figure FSA000004250727000140
Figure FSA000004250727000141
)w  廾g  彳k  尢(
Figure FSA000004250727000142
)i  夕(
Figure FSA000004250727000143
)x  彐(
Figure FSA000004250727000144
丑)d  巳(已己)s  川(巛州
Figure FSA000004250727000145
)o  幺(乡)i  口gsq
Figure FSA000004250727000148
g  也i  屮(  丩
Figure FSA000004250727000150
)q  
Figure FSA000004250727000151
(
Figure FSA000004250727000152
)x
Figure FSA000004250727000153
x  丬()j
四画:木(本夲未朿束)a  日(曰
Figure FSA000004250727000155
)r  月(
Figure FSA000004250727000156
)y  贝(貝)b  王(玉主)u  火h心(必)x  车(車)m  戈(戊戋)c  攵p  灬h  禸(内肉匃)r  止(正
Figure FSA000004250727000158
)v
Figure FSA000004250727000159
f  欠e  丰()f  见(見)l  方(万)h  斤(斥丘)v  犬(犮)q  礻x  勿u
Figure FSA00000425072700021
n  水e  殳w  手(乎)q  毛m 巴r  文u  爿(片)o  歹d  韦(韋)u  少w  牜r  瓦u  氏(氐)a  牛n  今j  户h  中(
Figure FSA00000425072700024
)z  爪(爫)z  
Figure FSA00000425072700025
(母)g  斗d  屯t  
Figure FSA00000425072700026
v  廿(
Figure FSA00000425072700027
)n  牙i
Figure FSA00000425072700028
g  耂
Figure FSA00000425072700029
l  x
五画:钅(釒)j  鸟(
Figure FSA000004250727000210
乌鳥
Figure FSA000004250727000211
烏)z  田(申甲由)t  石w  目q  禾(采)u  皿m  疒r衤z  冋(冏)j(求
Figure FSA000004250727000213
)u  白(百
Figure FSA000004250727000214
)l  マ(フ)m  示k  立()p  册(冊曲
Figure FSA000004250727000216
)t  矢(失)w  且(
Figure FSA000004250727000217
)u  旦(亘)d  可o  穴(
Figure FSA000004250727000218
)x  用(甫)y  古e龙(尨龍)l  四(罒)r  半(
Figure FSA000004250727000219
)b  生w  占v  业(亚)i  皮p  瓜g  电(
Figure FSA000004250727000220
)d疋p  冉r  弗f  甘g
六画:虫()o  v  米(来)h  页(頁)i  耳u  羽q  早(
Figure FSA000004250727000222
)z  舟(丹)b  臼(
Figure FSA000004250727000223
Figure FSA000004250727000224
)j  糸s  吉j  艮(
Figure FSA000004250727000225
)g  臣(
Figure FSA000004250727000227
亞)o  而e  各g  缶f
Figure FSA000004250727000228
(
Figure FSA000004250727000229
五)n  共n  聿(
Figure FSA000004250727000230
)y  羊()i  舌w  虍h  ()f  西(覀)x  衣i  耒n  自(
Figure FSA000004250727000233
)z  
Figure FSA000004250727000234
q
七画:
Figure FSA000004250727000235
b  走(
Figure FSA000004250727000236
)l  豕y  酉(酋)f  辛(幸)y  里l  豆d  言i  角j
Figure FSA000004250727000237
h辰o  佥(僉)q  豸v  身w  足b  麦(
Figure FSA000004250727000238
)m
八画:鱼(魚)q  隹v  雨z  其(甚)q  金j  非f  齿(齒)o  具(真
Figure FSA000004250727000239
)j或h  黾(黽)m  
Figure FSA000004250727000240
o
九画:革g  骨n  娄(婁)l  鬼g  柬j  怱(悤)c  韭j  面(囬)m  食e
十画及以上:髟f  兼j
Figure FSA000004250727000241
l  門d  鹿b  黑h  鼠(巤)w  鼻b
2.一种可无重码输入GBK或GB18030的2万多个汉字的大键盘拼音输入法,其特征在于:
1)这种拼音输入法分为双拼、简拼和全拼,每个汉字的音码双拼全部2码,简拼2-3码,全拼2-4码;加上正反序形码后,每个汉字的全部编码双拼4码,简拼4-5码,全拼4-6码,依序为首音码、次音码、三音码(第三个音码,全拼与简拼中)、四音码(第四个音码,全拼中)、正序码(也是首形码)、反序码(也是次形码);双拼、简拼的部分次音码以汉字的读音按规则省略而成,正序码和反序码按权利要求1中的汉字正反序双部件划分法确定;
2)把所有的汉字按一定规则分成两部分或多部分,对其中一部分或几部分汉字按一定规则转换编码;
3)在输入法的简化字版本中,以GB码(国标码)为基础确定“简化字”(主用字)的范围,其余的汉字定为“非简化字”(次用字);在输入法的繁体字版本中,以BIG5码(大五码)为基础确定“繁体字”(主用字)的范围,其余的汉字定为“非繁体字”(次用字);
4)在输入法的简化字版本中,按键位表所示对“非简化字”(次用字)的次音码进行转码;在输入法的繁体字版本中,按键位表所示对“非繁体字”(次用字)的次音码进行转码;
5)对于较难确定正序码,很容易确定反序码的字,可以忽略正序码,以“音码+?+反序码”的方式输入;
6)在一码即可输入的一码固项字中,根据单音节词义项频,特别把“把”安排到“a”,把“说”安排到“o”,这项安排对于小键盘通用;
7)双字词以音码组成,末字为儿化音的双字词以“首字音码+r’”组成,末字为字母的双字词以“首字音码+字母+’”组成;三字词以“三个字的首音码+末音码”组成,末字为儿化音的三字词以“前两字首音码+r’”组成,儿化音在中间时用作“r”,末字为字母的三字词以“前两字首音码+字母+’”组成;四字及以上词以“前三字首音码+末字首音码”组成,四字词中的儿化音为“r”,五字及以上词中的儿化音在编码中忽略;
8)不需要切换码表或词库,在输入过程中简化字版本可以输入非简化字语词(次用词),繁体字版本可以也可以输入非繁体字语词(次用词),并且二者不会混淆;输入时次用词的编码加前导符或后置符,每个字的编码与所属版本中的单字相符,三字词中第三字的末音码为非次音码时不转码,四字及以上词中编码不变;
9)对于重码字,字频较高的字保留原编码,字频较低的字优化反序码,被优化的反序码优先取用最接近该字右下方的部件形码,包围结构中被包围部分优先,若没有其他部件,把本身的部件分拆开,从字的右下方开始取码,已被正序码取码的部件,不再用于反序取码。
以下是以汉语拼音标示的转码示意与双拼键位:
Figure FSA00000425072700031
以下是以华语拼音标示的转码示意与双拼键位:
3.一种利用汉字正反序形码和笔画反查编码的方法,其特征在于:
1)对于不知道读音或编码的汉字,按权利要求1中所述的正反序部件和权利要求2中所述的形码,以“正序码+反序码+笔画”的方式查询,被查询到的单字可直接上屏,编码可不上屏;
2)对于优化过反序码的字,查询时仍按优化前的反序码,查询显示的结果则为优化后的编码。
4.一种可输入GBK或GB18030的2万多个汉字的小键盘拼音输入法,其特征在于:
1)这种拼音输入法分为双拼、简拼和全拼,具有与权利要求2中所述的大键盘拼音输入法相同的键位对应;
2)具有与权利要求2中所述的大键盘拼音输入法相同的转码方式;
3)不需要切换码表或词库,在输入过程中简化字版本可以输入非简化字语词,繁体字版本可以也可以输入非繁体字语词,并且二者不会混淆;能以权利要求2中“输入时加前导符或后置符”的方式,每个字的编码与所属版本中的单字相符,三字词中第三字的末音码为非次音码时不转码,四字及以上词中编码不变;
4)对于不知道读音或编码的汉字,能以权利要求2中“正序码+反序码+笔画”的方式查询,被查询到的单字可直接上屏,编码可不上屏。
以下是小键盘拼音键位表,字母与数字的对应可以根据需要作出各种改变:
Figure FSA00000425072700051
CN2011100249241A 2011-01-16 2011-01-16 汉字正反序双部件归部检索法及拼音盲打智能输入法 Pending CN102096477A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100249241A CN102096477A (zh) 2011-01-16 2011-01-16 汉字正反序双部件归部检索法及拼音盲打智能输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100249241A CN102096477A (zh) 2011-01-16 2011-01-16 汉字正反序双部件归部检索法及拼音盲打智能输入法

Publications (1)

Publication Number Publication Date
CN102096477A true CN102096477A (zh) 2011-06-15

Family

ID=44129597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100249241A Pending CN102096477A (zh) 2011-01-16 2011-01-16 汉字正反序双部件归部检索法及拼音盲打智能输入法

Country Status (1)

Country Link
CN (1) CN102096477A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314227A (zh) * 2011-08-15 2012-01-11 皖南医学院弋矶山医院 汉字输入法
CN103472927A (zh) * 2013-03-19 2013-12-25 龚学胜 汉字正反序双部件归部检索法及拼音盲打智能输入法
CN104102641A (zh) * 2013-04-03 2014-10-15 叶健欣 结合汉字部件与数字的检字方法及其相关系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314227A (zh) * 2011-08-15 2012-01-11 皖南医学院弋矶山医院 汉字输入法
CN103472927A (zh) * 2013-03-19 2013-12-25 龚学胜 汉字正反序双部件归部检索法及拼音盲打智能输入法
CN104102641A (zh) * 2013-04-03 2014-10-15 叶健欣 结合汉字部件与数字的检字方法及其相关系统

Similar Documents

Publication Publication Date Title
CN103902058B (zh) 一种中英文混合速录的方法与键盘
CN107491439B (zh) 一种基于贝叶斯统计学习的医学古汉语句子切分方法
CN102096477A (zh) 汉字正反序双部件归部检索法及拼音盲打智能输入法
CN1047447C (zh) 实虚笔形编码计算输入法
CN100478853C (zh) 和码汉字形义信息码输入法
Gregorin et al. Two new range records of bats (Chiroptera: Phyllostomidae) for the Atlantic Forest, eastern Brazil
CN101135938A (zh) 一种汉字元拼双音输入方法
CN102306058B (zh) 音义及声义码汉字输入法
CN1147777C (zh) 计算机汉字输入方法
Vlachos Forming taxon names from Greek words
CN101344821B (zh) 用汉字部首词组化双声编码在数字键盘输入汉字的方法
CN101158884B (zh) 汉字形码计算机手机一体化输入技术
CN105938400A (zh) 一种输入法的系统和键盘的设计方法
CN1068947C (zh) 一种形声及形形结合的计算机汉字输入方法
CN1058340C (zh) 计算机汉字、符号的编码输入方法
CN1588289A (zh) 汉字笔顺输入法及其键盘
CN103472927A (zh) 汉字正反序双部件归部检索法及拼音盲打智能输入法
CN1054694C (zh) 计算机汉字三码输入法
CN1293451C (zh) 三击形音汉字输入法
CN100375947C (zh) 30键认知码汉字输入方法
CN101344820A (zh) 一种计算机汉字输入方法及其键盘
CN1825255A (zh) 和码汉字形码输入法及其单手键盘
Chou et al. Emotional Text Classification of Color Imagery Using Pretrained Model.
CN1588284A (zh) 一种见字即识形码也可使用音码的汉字键盘输入方法
Lei A Journey to Sakhalin and Chekhov's Impression of the Far East

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110615