CN1155875C - 通用汉字笔序数字输入法 - Google Patents

通用汉字笔序数字输入法 Download PDF

Info

Publication number
CN1155875C
CN1155875C CNB021154856A CN02115485A CN1155875C CN 1155875 C CN1155875 C CN 1155875C CN B021154856 A CNB021154856 A CN B021154856A CN 02115485 A CN02115485 A CN 02115485A CN 1155875 C CN1155875 C CN 1155875C
Authority
CN
China
Prior art keywords
code
stroke
word
yard
yards
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB021154856A
Other languages
English (en)
Other versions
CN1368671A (zh
Inventor
汪印西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB021154856A priority Critical patent/CN1155875C/zh
Publication of CN1368671A publication Critical patent/CN1368671A/zh
Application granted granted Critical
Publication of CN1155875C publication Critical patent/CN1155875C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明是一种通用汉字笔序数字输入法,即:将汉字的全部笔画分为单笔画和复合笔画,按笔顺编码,其代码是数字;取码规则是前码优先、兼顾直观;单笔画代码,即“一、丨、丿、、 、乙”依次是数字1、2、3、4、5、6,“/、丶、亅”依次是1、4、5;复合笔画的代码,使用数字0、1、2、3、4、5、6、7、8、9,其代码由两个单笔画代码之和构成,最大之和为12,其中,10、11、12为复数代码,分别取其个位数0、1、2作代码。本发明具有编码科学规范、操作简单、易学难忘、通用性强和可扩充性等优点,可在移动电话、电话信息终端、掌上电脑、电脑等信息设备的数字键上实现字词、标点符号、阿拉伯数字和字母的快速输入。

Description

通用汉字笔序数字输入法
技术领域
本发明涉及汉字信息处理领域,特别是一种通用汉字笔序数字输入法。
背景技术
纵观汉字数字编码的发展(请见附三),是一个学习过程由难到简、使用功能由单一到完善的发展过程。电报码是一种机械而笨拙的编码方法,最大的优点是无重码,缺点是把最繁重的学习负担交给人。目前手机内置的单一笔画汉字输入方法,尽管把人从沉重的学习负担中解放出来,但在得到易学易用好处的同时,却丧失了快速性、扩充性、通用性、多用性功能;在输入汉字、数字、常用标点符号和英文字母时,要进行输入状态转换,很麻烦;总之,欠缺科学性,这是一个致命的弱点。另外,从附三中可知,诺基亚手机仅用5种笔画,其易学性无疑最优,但它浪费了5个宝贵的数字码元,重码高。严格地说,诺基亚、摩托罗拉、索尼三种手机的输入方法本质相同,输入速度慢,区别在于笔画、笔形数量和键位安排。
还有的汉字数字编码方法,在笔画思路之外,选择若干高频部件安排于某个键位上,以牺牲规范性、规律性求得低重码,从而丧失科学性。
发明内容
本发明所要解决的技术问题是:提供一种适合各文化层次、年龄层次的人使用的通用汉字笔序数字输入法,该输入法符合汉字认知规律和书写习惯,把学习、记忆和操作难度都降到了最低限度,易学难忘,可在各种汉字信息处理设备的数字键上输入,特别是在同一种输入状态下,可使手机和电话机等微型信息设备实现字词、阿拉伯数字、常用标点符号及字母的自然编码语言输入。
本发明解决其技术问题所采用的技术方案是:在数字键盘上输入。将汉字的全部笔画分为单笔画和复合笔画,按笔顺编码,其代码是数字。取码规则是前码优先、兼顾直观。
单笔画代码:包括“一、丨、丿、、
Figure C0211548500031
乙”即“横、竖、撇、捺、左折、右折”六种约定俗成的单笔画,其代码依次是数字1、2、3、4、5、6;还包括“
Figure C0211548500032
丶、亅”即“提、点、竖钩”单笔画,其代码同“横、捺、左折”的单笔画代码,依次是数字1、4、5。
复合笔画的代码:使用数字0、1、2、3、4、5、6、7、8、9,并且由两个单笔画代码之和构成,最大之和为12,10、11、12为复数代码,分别取其个位数0、1、2作代码;其中,复合笔画“二、十、厂、亻、丁、人、力、九、讠、 的代码依次是数字2、3、4、5、6、7、8、9、0、1、2,“口”和围字框“囗”的代码是数字0。
取码及输入规则包括以下步骤:
(1)将汉字分为独体字与合体字,其码长是1~6码。
(2)独体字:不足6码的按实际码数取,6码以上的取前五末一码。
(3)合体字:划分为前、后两部分。前部分是指字结构的左部、上部及半包围和全包围结构的上部或外部。后部分是指字结构的右部、下部及半包围和全包围结构的下部或内部。
前、后部分都在3码及3码以上的分别取前二末一码,不足3码的按实际码数取。前部分不足3码而后部分大于3码的,则后部分补足码长,即后部分取前四末一码,或者取前三末一码。
前部分大于3码而后部分不足3码的,则前部分取前二末一码,后部分按实际码数取。
出现重码或者不足6码时,通过识别码解决,即当同一组编码出现几个不同汉字时,补充其首笔与末笔代码加以区别的补充编码。
汉字左右结构:不足6码补末笔,仍不足6码再加首笔。
其它结构中上下、半包围、全包围、独体结构的识别码与左右结构相反:不足6码的汉字补首笔,仍不足6码再加末笔。
(4)取码:
前码优先:根据复合码与复合码或复合码与单笔画之间的次序,优先取前码。
兼顾直观:按汉字书写规律取码。
(5)输入:利用手机、电话机或掌上机的数字键盘的相应键位,按照前码优先、兼顾直观规则来取码,并输入字词及常用标点符号、阿拉伯数字、字母。
词组输入:只取本位码,不取识别码,一码字只取一码。
          二字词:每字取第1、2、末码。
          三字词:每字各取第1、2码。
          四字词:前两字各取第1、2码,后两字各取第1码。
          五字词:首字取第1、2码,其余各取第1码。
          六字词:每字各取第1码。
          七字以上词语:第1、2、3、4、5、末字各取第1码。
常用标点符号输入:先输入标点符号名称,只取名称前三字的编码,第一字取前二码,其它字取第一码,再加后断码99。
阿拉伯数字:先输入一个任意数,再加后断码998。
字母输入:先输入目标字母所在的数字键号和键符中字母的序号,再加后断码998。
本发明具有如下主要优点:
一是科学性:做到了有序编码,有序学习,有序记忆,有序输入,规律性强,排列规范,没有二义性,从而体现了本编码科学严谨、规范简单的设计思想。
二是扩充性与全功能输入:可扩充到21000字至更多汉字及1至5万条词组,只用0-9个数字,同一编码方法,即可实现字词、常用标点符号及阿拉伯数字、字母的编码输入。
三是易学难忘:本发明扬各法之长,避众码之短,无论构成汉字的基础部件有多少个,化繁为简,只要掌握几种笔画及其代码的排列方法,就可掌握汉字所有单笔画及复合笔画的排列序数,完全摒弃了部件数量的不确定因素及部件与键符映射关系的记忆负担。从最少1画到最多50余画的汉字,从简体字到繁体字,其编码方法始终如一,让人掌握一法,受益终身。
四是通用性强:同一编码方法,中、日、韩通用,各文化层次、年龄层次的人均可适用,甚至可成为聋哑人、盲人适合的语言文字工具。
五是多用性好:可在电脑键盘、掌上电脑、移动电话、电话信息终端等信息设备的数字键上使用,  可用于信息传递、汉字检索、字典编纂排序及汉字教学等方面。
六是重码少,汉字输入速度快:在多数情况下,采用两笔一码,更适合人的操作心理和书写习惯。本发明采用6位数字编码,意味着一个字最多可取12笔,与其它每字只取5、6笔或1-20多笔的单笔画数字输入方法相比,不会感到繁琐、累赘,只会感觉简便、轻快。重码少,动态码长短,单字平均码长在3码以下。
附图说明
图1是本发明在电脑单排数字键盘上的码元及笔画排列示意图。
图2是本发明在电脑小数字键盘上的码元及笔画排列示意图。
具体实施方式
下面结合实例对本发明作进一步说明。
本编码方法是用六种约定俗成的单笔画的习惯排列顺序的数字代码及由此构成的复合笔画代码作汉字编码,它涵盖了所有汉字,可对GB2312-80《汉字编码字符集—基本集》中6763个汉字、ISO/IEC-10646《CJK统一汉字编码字符集》(中、日、韩大汉字符集)中21003个汉字、全汉字符集中九万余字以及一至五万条词组,进行统一编码。
本编码可用手机、电话机、电脑、掌上机以及其它信息设备的数字键盘输入。其中,可利用手机、电话机或掌上机的数字键盘,在同一种输入状态下实现字词、阿拉伯数字、常用标点符号及字母的全能自然编码语言输入。本编码还是一种可直接翻页检索汉字的字典排序方法。
本编码的方法是:将汉字的全部笔画分为单笔画和复合笔画,按笔顺编码,其代码是数字,编码原则是前码优先、兼顾直观;单笔画代码,使用数字1、2、3、4、5、6,依次将“一、丨、丿、、
Figure C0211548500051
乙”即“横、竖、撇、捺、左折、右折”六种单笔画定码,“ 丶、亅”即“提、点、竖钩”代码分别同“横、捺、左折”的笔画代码;复合笔画的代码,使用数字0、1、2、3、4、5、6、7、8、9,其代码由两个单笔画代码之和构成,最大之和为12,其中,10、11、12为复数代码,省略10位数上的1,分别取其个位数0、1、2作代码。
上述的编码原则中,按笔顺取码是基本规则,码长是1~6码。但少数汉字如果完全按笔顺规则编码,就与汉字认知规律(即汉字基础教育中的偏旁部首概念)相悖,因此,在容错范围内,对这些汉字可进行双重拆分处理。如:
区,  笔顺:一ㄨ乙       容错:匚ㄨ      可,  笔顺:一口亅      容错:丁口
兆,  笔顺:丿
Figure C0211548500054
  容错:儿
Figure C0211548500056
  丑,  笔顺:
Figure C0211548500057
丨二    容错: 十一
那,  笔顺: 二丿阝   容错:刀二阝    官,  笔顺:宀丨
Figure C02115485000511
  容错:宀
兆,  笔顺:丿
Figure C02115485000514
Figure C02115485000515
  容错:儿   肃,  笔顺:肀
Figure C02115485000518
八     容错:肀八
“取前优先,兼顾直观”,是一对矛盾体,两者往往相互抵触,但分清界限后,便迎刃而解。前码优先是指复合码与复合码或复合码与单笔画之间的取码次序。如:
干,应取“二丨”,不应取“一十”。
矢,应取“一人”,不应取“丿二人”。
气,应取“一
Figure C02115485000520
”,不应取“丿二 ”。
缶,应取“十凵”,不应取“丿二丨凵”。
辛,应取:“亠丷二丨”,不应取“亠丷一十”。
叔,应取:“丁八又”,不应取“一…八又”。
亲,应取:“亠丷二亅八”,不应取“亠丷一、
Figure C02115485000522
八”。
兼顾直观是按汉字书写规律,以对应笔画优先加以拆分取码。如:
失,应取“丿二人”,不应取“一人”
艹,拆成“一 ”比拆成“十丨”直观
,拆成“ 丷”比拆成“ ”直观
夊拆成“丿又”比拆成“丶”直观
大,拆成“一人”比拆成“ナ丶”直观
广,拆成“丶厂”比拆成“亠丿”直观
白,拆成“丿 二”比拆成“亻
Figure C0211548500062
二”直观
正,拆成“一丄”比拆成“ 一丄”直观
龙,拆成“ナ 丶”比拆成“一儿丿丶”直观
以下是结合电脑单排数字键盘(图1)、小数字键盘(图2)以及手机、电话键盘(其码元及笔画排列同图2),对单笔画、复合笔画及代码与汉字取码方法的进一步说明。
一.单笔画
汉字笔画    一   丨  丿         乙
笔画名称    横   竖  撇   捺  左折  右折
数字代码    1    2    3   4    5     6
提(
Figure C0211548500066
)归入横,点(丶)同捺,竖钩(亅)归入左折。顺时针转折笔画为左折,逆时针转折笔画为右折,左折右折均以笔画末端方向为准。
二.复合笔画
复合笔画“二、十、厂、亻、丁、人、力、九”的代码依次是2、3、4、5、6、7、8、9。“口”和围字框“囗”的代码是0。其代码由两个单笔画代码之和构成,两代码之和最大为12,其中,10、11、12为复数代码,省略10位数上的1,分别取其个位数0、1、2作代码。其编码方法如下:
二,一一  1+1=2横横的复合笔画代码为2。
十,一丨  1+2=3所有横竖、竖横的复合笔画代码为3。
厂,一丿  1+3=4所有横撇、撇横、竖竖的复合笔画代码为4。
亻,丿丨  3+2=5所有撇竖、竖撇、点横的复合笔画代码为5。
卜,丨丶  2+4=6所有竖点、点竖、横左折、左折横以及撇撇的复合笔画代码为6。
人,丿  3+4=7所有撇捺、撇点、点撇、横右折、竖左折、左折竖的复合笔画代码为7。
凵,
Figure C0211548500067
丨 6+2=8所有右折竖、竖右折、撇左折、左折撇、点点、点捺的复合笔画代码为8。
九,丿乙  3+6=9所有撇右折、右折撇、点左折、左折点、左折捺的复合笔画代码为9。
讠,、 4+6=10所有点右折、右折点、左折左折的复合笔画代码为0
Figure C0211548500069
Figure C02115485000610
 5+6=11所有左折右折、右折左折的复合笔画代码为1。
Figure C02115485000612
Figure C02115485000613
6+6=12所有右折右折的复合笔画代码为2。
因外形之故,定义“口”及全包围结构的“囗”(围字框)代码为0,不再拆分为“冂、一”,但“日、目、罒、田、由、甲、西等仍要按规则分解。“口”是汉字组字频率最高的部件。
0、1、2、4、5、6、7、8、9分别代表2-6种复合笔画。如7包含“八、人、丷、乂、七、匚、阝、卩、刂、冂”及其变形复合笔画如 入、
Figure C02115485000620
Figure C02115485000623
Figure C02115485000624
Figure C02115485000626
Figure C02115485000627
Figure C02115485000628
等。复合笔画中单笔画不分正反、先后书写顺序,如“十、
Figure C02115485000630
、
Figure C02115485000632
丄”横竖、竖横都是3;同样“勹ク
Figure C02115485000635
Figure C02115485000636
Figure C02115485000637
Figure C02115485000642
Figure C02115485000643
力乃”都是8。
按复数代码取码规则,“讠、厶、
Figure C02115485000644
Figure C02115485000646
了、
Figure C02115485000647
Figure C02115485000648
的代码是0;“乜、
Figure C02115485000650
Figure C02115485000651
的代码是1;“ 巜”的代码是2。
复合笔画的主要特征是两个单笔画的对应形式,如:“二、
Figure C0211548500071
巜、
Figure C0211548500072
丄、、、
Figure C0211548500074
厂、人、丷、八、亻、、 勹、刀、匕、
Figure C0211548500078
儿、几、乃、冫、冖、匚、
Figure C0211548500079
Figure C02115485000710
冂、凵、阝、卩、 讠、厶、十、七、乂、ナ、九、力、又、廴”等。
此外,取一个复合笔画不能跨两个不相连的部件。“叔”可取“丁八又”,“独”犬旁取
Figure C02115485000712
后,不能将剩下的 和虫字第1笔“丨”组合为“亻”。
三.单字
汉字分为合体字、独体字,左右、上下、全包围、半包围结构统称为合体字。为减少汉字重码,提高输入速度,可加识别码。
字例:左右结构    汉路敖频激游诫吼嚆飙
      上下结构    节呆哭品擎萝霭暑叠孽
      半包围结构  冈同风凰威臧凶函幽区臣过递越题魁原
Figure C02115485000714
床度魔麝
                  展房虱式或栽畿
      全包围结构  回因国固圃圜
      独体字      人卫重乘日内瓦必生川巫
1.独体字:不足6码的按实际码数取,6码以上的取前五末一码。如:
      一,一            1           乙,乙                6
      二,二            2           九,九                9
      大,一人          17          干,二丨              22
      臼,
Figure C02115485000715
--一    3721        正,一丄           133
      册,
Figure C02115485000717
Figure C02115485000718
一      881         里,
Figure C02115485000719
二十一        7231
      隶,
Figure C02115485000720
二亅冫  52557       甚,一 二一八
Figure C02115485000723
   142176
      垂,
Figure C02115485000724
十一     32431       重, 二十一  317231
2.合体字:将合体字划分为前、后两部分,前部分是指字结构的左部、上部及半包围和全包围结构的上部或外部,后部分是指字结构的右部、下部及半包围和全包围结构的下部或内部。前、后部分都在3码及3码以上的分别取前二末一码,不足3码的按实际码数取;前部分不足3码而后部分大于3码的,则后部分补足码长。这是由汉字的复杂性所决定的,如“酉、雨、鱼、骨、黑、鬼、髟、鼠、鼻”以及繁体部件“釒、 馬、鬥、魚、
Figure C02115485000729
等,如果完全按笔顺取码,仅偏旁部首就要占5码,剩下第6码给几十甚至几百个字编码,造成很多重码,如加上词组编码,势必重码成灾,严重影响输入速度。
以下是合体字的拆分、取码字例(“…”表示按编码规则被省略的部分,以下同):
除,阝人二亅八            77257     藕,一
Figure C02115485000730
二十八…丶     142374
嚏,口  十冖 十…人    039737    音,亠丷一
Figure C02115485000732
二         57172
炒,丷人  丨八         77273     过,              6449
创,人 刂              717      
Figure C02115485000737
巜ナ…丶
Figure C02115485000738
      26649
粘,丷十八  口          73730     雯,一冖… 亠乂       19857
利, 十八  刂          3377      露,一冖… 囗…口   198030
跎,口
Figure C02115485000743
丶冖匕        033499    圃,囗  一冂二卜        01726
骰,
Figure C0211548500082
…二  几又    75299     舆,亻二…一八           5217
勤,一…
Figure C0211548500083
Figure C0211548500084
力        1438      麂,丶厂…匕 几          4499
鳄  … 口口…
Figure C0211548500087
871005    魅,
Figure C0211548500088
…厶 二丨八   370227
3.识别码:是当同一组编码出现几个不同汉字时,补充其首笔与末笔代码加以区别的补充编码。什么时候该加首笔或者末笔,不能有二义性。识别码之末笔,是指末码的末笔,并非字末笔。两者概念有别。如“区”,末笔是“乙”,而末码的末笔是“丶”。在不增加学习负担前提下,顺着输入惯性,加入1-2位识别码,比停下来看屏幕选择重码字速度要快得多。
由于汉字左右结构约占65%,因此单独分为一类,以便与其它结构的识别码相区别,方法是:不足6码补末笔,仍不足6码再加首笔(以下打波浪线的为识别笔画及代码)。
如:什,亻十     
Figure C02115485000810
  53
Figure C02115485000811
        勤,一…
Figure C02115485000813
力     1438
Figure C02115485000815
计,讠十         
Figure C02115485000816
  03
Figure C02115485000817
        利,
Figure C02115485000818
十八  刂     3377
Figure C02115485000820
听,口
Figure C02115485000822
       063        欲,八人口 人    
Figure C02115485000825
    77087
吨,口  一凵 乚  
Figure C02115485000827
  0186
Figure C02115485000828
      所,   
Figure C02115485000833
  6663
Figure C02115485000834
其它结构中上下、半包围、全包围、独体结构的识别码与左右结构相反:不足6码的汉字补首笔,仍不足6码再加末笔。如:
于,二       
Figure C02115485000835
 25          分,八刀        
Figure C02115485000837
78
Figure C02115485000838
开,二
Figure C02115485000839
       25
Figure C02115485000841
         凶,乂凵        
Figure C02115485000842
78
Figure C02115485000843
字,丶冖了一    4901
Figure C02115485000845
       首,丷二一
Figure C02115485000846
    74721
Figure C02115485000848
团,囗丿
Figure C02115485000849
  
Figure C02115485000850
 063         达,一人丶
Figure C02115485000852
    1749
囵,囗人匕    
Figure C02115485000855
 079         赶,十一…人二丨 
Figure C02115485000857
   31722
Figure C02115485000858
单,丷 二十 
Figure C02115485000860
7723
Figure C02115485000861
       直,十二二      3722
Figure C02115485000864
四.词组
只取本位码,不取识别码,一码字只取一码。
二字词:每字取第1、2、末码。如:
中国  口丨  囗二…、         02024
汉字
Figure C02115485000866
又、冖…一         819491
巨人  匚 人               767
跟踪  口… 口…八      037037
三字词:每字各取第1、2码。如:
现代化    二亻亻
Figure C02115485000870
Figure C02115485000871
     235759
计算机  讠十丶  十八       034437
主人翁  亠十人  八厶         53770
北京市
Figure C02115485000873
亠口  亠冂       315057
四字词:前两字各取第1、2码,后两字各取第1码。如:
宏伟蓝图  丶冖亻二一口       495210
大刀阔斧  一人刀 丶八        17847
一心一意  一
Figure C02115485000875
一亠       10815
民富国强
Figure C02115485000877
、冖  囗     664906
五字词:首字取第1、2码,其余各取第1码。如:
人民解放军   人
Figure C0211548500091
亠冖         76859
汉字输入法  
Figure C0211548500092
Figure C0211548500093
Figure C0211548500094
Figure C0211548500095
     814778
计算机技术   讠十十 十       034363
中国科学院   口丨  囗
Figure C0211548500097
Figure C0211548500098
阝     020387
六字词:每字各取第1码。如:
经济体制改革   亻
Figure C02115485000911
一     285461
坚持改革开放  
Figure C02115485000912
一二亠     466125
国家重点项目   囗丶
Figure C02115485000917
   043337
华中科技大学   亻  口
Figure C02115485000918
Figure C02115485000919
Figure C02115485000920
    503618
七字以上词语:第1、2、3、4、5、末字各取第1码。如:
中华人民共和国            口亻人 一…囗    057610
新疆维吾尔自治区          亠
Figure C02115485000922
Figure C02115485000923
…匚   562387
天将降大任于是人也        二
Figure C02115485000925
阝一亻…        257157
中国人民政治协商会议      口囗人
Figure C02115485000927
一…讠    007610
国家语言文字工作委员会    囗丶讠亠亠…人      040557
四.其它
输入常用标点符号、阿拉伯数字、字母可加后断码。后断码可以分别是99、998、998,或者采用其它组合数字。
1.常用标点符号输入:先输入标点符号名称,只取名称前三字的编码,第一字取前二码,其它字取第一码,再加后断码。
,  逗号       一口  口       10099      ……省略号    丨八 口        277099
kg千克         丿十十         33399     《正书名号      一 ク      130899
”  反引号    
Figure C02115485000930
口       696099     m2平方米     一丷亠丷        175799
‰千分号       丿十八口       337099     ,半角逗号     丷二   一     728199
¥人民币      人
Figure C02115485000933
        76399      .半角小数点   丷二    亅    728599
≠不等于       丆卜    二   464299     ’ 反单引号      又  丷    697699
2.阿拉伯数字:先输入一个任意数,再加后断码。
3.字母输入:先输入目标字母的数字键号和键符中字母的序号,再加后断码。如在手机数字键上输入英文字母A、B、Y:找其所在的数字键
Figure C02115485000936
Figure C02115485000937
先输入字母A的数字键号2及键符中字母A的序号1再加后断码998,即21998。同理,输入B、Y分别敲22998、93998即可。
4.附件:
附一.单笔画代码及字例
代码  单笔画   字              例    代码  单笔画    字    例
1     一      丕丙丛世且豆鬲画丽正    6    乙   乞乾几讠认飞虱
            打巧歧禹虫禺或邳纤驯                 七电巴甩扎乱己巷
2   丨       忄丫巾山尖尚丰臣聿庸     
Figure C0211548500101
    山函屯收戕蚩葛贯母缘互
3  
Figure C0211548500102
      乏囱延血夭少长秉重氕     
Figure C0211548500103
     饣长丧氏衣艮民
4   丶      义之辶丸 丽寸弋我龙    
Figure C0211548500105
Figure C0211548500106
  戈我成臧畿羲纟幺
Figure C0211548500108
       又夜癶祭良之廴辶      
Figure C02115485001012
     巜 巛女巡巠巡巢巤粼
5    亅     刂丁了小水于牙求隶
    
Figure C02115485001013
    卩刀习卫乜司书
    
Figure C02115485001015
Figure C02115485001016
   买丞疋卖犭豸豕毅象豪
    
Figure C02115485001017
     马巴雪妻肃捷丑骨
Figure C02115485001018
        乌丐与鸟弟夷馬鳥凸鼎
        阝 廴乃及又癶今水礻
附二:复合笔画代码及字例
代码 复合笔画           字     例           代码  复合笔画        字    例
2    二                 天非些未戋日目里武录  8  
Figure C02115485001026
Figure C02115485001027
    汪冬
Figure C02115485001028
杰照忄忙心志夜
                     王尹末耒表隶寿韦寒篝      凵
Figure C02115485001031
        凶函离收戕淵凹兕
    
Figure C02115485001032
                臼叟吊插毁臾鼠鼬          勹
Figure C02115485001033
          勾包的月及丹舟册
3   十                  土千木禾米耒里卖古博                乌鸟枭岛丹
   
Figure C02115485001037
Figure C02115485001038
Figure C02115485001039
            五工巫凸髟肆套長         刀力乃          刃刄分加另盈仍
    丄
Figure C02115485001040
Figure C02115485001041
           王片隹先虫歧遇惠牡转     
Figure C02115485001042
         狈狼豸毅象万敖别
                 上止非卢叔占北
Figure C02115485001047
芈鼎    
Figure C02115485001049
        亦弈赤赫皮虎虚牙
4   厂                  厢厌原广麻鹿          9   儿几九          兆见沈羌凡咒风丸执
    ナ               灰左龙钅缶告矢失气舞      
Figure C02115485001051
Figure C02115485001053
Figure C02115485001054
   氏派印乐比它化龙衣农
                     艹业皿面鹿血罚黹兼        又
Figure C02115485001057
        圣双劲经令通
5   亻               伯作
Figure C02115485001060
追舆段聚衆鳥  
Figure C02115485001062
Figure C02115485001063
Figure C02115485001065
      亥乡发拨女安成我
   
Figure C02115485001066
              齐肃弗井价弟递                     农鹤冤登歹延建及
    亠                 文主隹方变衷襄           
Figure C02115485001072
          今念贪含礼社补初永
    冫
Figure C02115485001073
             次冰凋兆录求函蔡          
Figure C02115485001074
Figure C02115485001076
        专之达过
6  丁
Figure C02115485001077
Figure C02115485001078
Figure C02115485001079
Figure C02115485001081
   可求扌打与嫣乌邬巧号   0   讠
Figure C02115485001084
    诉储以武贰私台即既
   
Figure C02115485001085
             弓已夷户层所敢候           了
Figure C02115485001087
Figure C02115485001089
     子孙马驯书為爲
   
Figure C02115485001092
             爪瓜所派彳勿珍廖步     1   乜
Figure C02115485001093
Figure C02115485001094
   乜互缘贯母毋仓创顾
   卜
Figure C02115485001097
             卧处不礻社爪甫州洲     2   巜
Figure C02115485001099
           纟乡幺丝雍粼巡巢
7  人               伞令大倹从火炉炊僉
   乂入                义凶驳爽鬯鹵攀籴倆
   八丷
Figure C021154850010102
            分公木兴誉关半为州
  
Figure C021154850010103
              水隶求艮丧农裘兆函补
   阝卩
Figure C021154850010105
Figure C021154850010106
         队邓卫报卵也韦
   冂
Figure C021154850010108
            巾冈同冉有鬲冓身凹鼎
  
Figure C021154850010109
Figure C021154850010110
刂            日目皿冒央由凸则划刘
匚七    区医臣熙柒皂切比
    
Figure C0211548500113
Figure C0211548500114
Figure C0211548500116
戈氏民牙既东车长畏丧
附三    几种数字编码性能比较
Figure C0211548500117

Claims (1)

1.一种通用汉字笔序数字输入法,在数字键盘上输入,其特征是:将汉字的全部笔画分为单笔画和复合笔画,按笔顺编码,其代码是数字;取码规则是前码优先、兼顾直观,
单笔画代码:包括“一、丨、丿、、
Figure C0211548500021
乙”即“横、竖、撇、捺、左折、右折”六种约定俗成的单笔画,其代码依次是数字1、2、3、4、5、6;还包括“
Figure C0211548500022
丶、亅”即“提、点、竖钩”单笔画,其代码同“横、捺、左折”的单笔画代码,依次是数字1、4、5,
复合笔画的代码:使用数字0、1、2、3、4、5、6、7、8、9,并且由两个单笔画代码之和构成,最大之和为12,10、11、12为复数代码,分别取其个位数0、1、2作代码;其中,复合笔画“二、十、厂、亻、丁、人、力、九、讠、
Figure C0211548500023
的代码依次是数字2、3、4、5、6、7、8、9、0、1、2,“口”和围字框“囗”的代码是数字0,
取码及输入规则包括以下步骤:
(1)将汉字分为独体字与合体字,其码长是1~6码,
(2)独体字:不足6码的按实际码数取,6码以上的取前五末一码,
(3)合体字:划分为前、后两部分,前部分是指字结构的左部、上部及半包围和全包围结构的上部或外部,后部分是指字结构的右部、下部及半包围和全包围结构的下部或内部,
前、后部分都在3码及3码以上的分别取前二末一码,不足3码的按实际码数取,
前部分不足3码而后部分大于3码的,则后部分补足码长,即后部分取前四末一码,或者取前三末一码;前部分大于3码而后部分不足3码的,则前部分取前二末一码,后部分按实际码数取,
出现重码或者不足6码时,通过识别码解决,即当同一组编码出现几个不同汉字时,补充其首笔与末笔代码加以区别的补充编码,
汉字左右结构:不足6码补末笔,仍不足6码再加首笔,
其它结构中上下、半包围、全包围、独体结构的识别码与左右结构相反:不足6码的汉字补首笔,仍不足6码再加末笔,
(4)取码:
前码优先:根据复合码与复合码或复合码与单笔画之间的次序,优先取前码,
兼顾直观:按汉字书写规律取码,
(5)输入:利用手机、电话机或掌上机的数字键盘的相应键位,按照前码优先、兼顾直观规则来取码,并输入字词及常用标点符号、阿拉伯数字、字母,
词组输入:只取本位码,不取识别码,一码字只取一码,
二字词:每字取第1、2、末码,
三字词:每字各取第1、2码,
四字词:前两字各取第1、2码,后两字各取第1码,
五字词:首字取第1、2码,其余各取第1码,
六字词:每字各取第1码,
七字以上词语:第1、2、3、4、5、末字各取第1码,
常用标点符号输入:先输入标点符号名称,只取名称前三字的编码,第一字取前二码,其它字取第一码,再加后断码99,
阿拉伯数字:先输入一个任意数,再加后断码998,
字母输入:先输入目标字母所在的数字键号和键符中字母的序号,再加后断码998。
CNB021154856A 2002-01-29 2002-01-29 通用汉字笔序数字输入法 Expired - Fee Related CN1155875C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB021154856A CN1155875C (zh) 2002-01-29 2002-01-29 通用汉字笔序数字输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB021154856A CN1155875C (zh) 2002-01-29 2002-01-29 通用汉字笔序数字输入法

Publications (2)

Publication Number Publication Date
CN1368671A CN1368671A (zh) 2002-09-11
CN1155875C true CN1155875C (zh) 2004-06-30

Family

ID=4743684

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021154856A Expired - Fee Related CN1155875C (zh) 2002-01-29 2002-01-29 通用汉字笔序数字输入法

Country Status (1)

Country Link
CN (1) CN1155875C (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214014A (zh) * 2011-07-25 2011-10-12 张仁平 零记忆双笔画十键位汉字编码输入法
CN103076890A (zh) * 2012-07-01 2013-05-01 潘昌仁 一种文字数字化编码及数字国际公读法

Also Published As

Publication number Publication date
CN1368671A (zh) 2002-09-11

Similar Documents

Publication Publication Date Title
CN1155875C (zh) 通用汉字笔序数字输入法
CN1019424B (zh) 音形笔画综合编码汉字高速输入法及所用键盘
CN1687879A (zh) 一种用数字键盘输入汉字的方法
CN1166997C (zh) 汉字免拆分快速输入法
CN1591293A (zh) 汉字拼形输入法
CN1182458C (zh) 纯金码汉字输入法
CN1054447C (zh) 计算机汉字输入坐标码编码方法
CN1109185A (zh) 交根优先连根截分二键断码汉字输入法
CN1045021C (zh) 中文数码电脑汉字输入法及其键盘
CN1169040C (zh) 一种电脑汉字输入法
CN1150444C (zh) 计算机字母化中文输入法
CN1259615C (zh) 字母键盘和数字键盘通用汉字输入法及其左半字形识别法
CN1228705C (zh) 按汉字构件定位取码的计算机汉字输入法
CN1317630C (zh) 笔画汉字输入法
CN1269008C (zh) 十二键汉字数字键盘及六维三段笔画部件码汉字输入法
CN2210424Y (zh) 指顺键盘
CN1397895A (zh) 文字检索装置,文字检索方法及其程序
CN1493962A (zh) 数码汉字输入法及其键盘
CN1269541A (zh) 世纪码汉字输入法(包括世纪形码和世纪形音码)
CN100339807C (zh) 汉语通信码简易输入法
CN1081354C (zh) 一笔字形字词无重码输入法
CN1204482C (zh) 三笔象形码输入法
CN1335555A (zh) 三位一体汉字输入方法
CN1026197C (zh) 一种英文字母编码的计算机汉字输入方法
CN1303504C (zh) 计算机汉字字母文字化输入法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee