CN1141634C - 单笔画编码汉字输入法 - Google Patents
单笔画编码汉字输入法 Download PDFInfo
- Publication number
- CN1141634C CN1141634C CNB001021591A CN00102159A CN1141634C CN 1141634 C CN1141634 C CN 1141634C CN B001021591 A CNB001021591 A CN B001021591A CN 00102159 A CN00102159 A CN 00102159A CN 1141634 C CN1141634 C CN 1141634C
- Authority
- CN
- China
- Prior art keywords
- stroke
- fork
- horizontal
- chinese character
- pen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
单笔画编码汉字输入法涉及一种计算机汉字输入法,特别是涉及一种只以单笔画为编码码元的计算机汉字输入技术。所要解决的技术问题是,既保持单笔画编码方法简单的优点,又能使之达到较之单笔画与复合笔画混合编码更好的低重码输入效果。其技术要点是,以规范的横、竖、撇、点、折五个基本笔画为基础,将各笔画一分为二,以有无叉笔为最基本的区别特征,辅以点的上下左右有横或竖的直点规则和撇的中部有横、叉横、竖、叉竖的直撇规则,使汉字笔画分成横、叉横、竖、叉竖、撇、叉撇(直撇)、点、叉点(直点)、折、叉折共10个两两相对的笔画码元,取0-9共10个数字作为编码代码,取汉字四个角的笔画编码进行汉字的计算机输入。
Description
技术领域
本发明涉及一种计算机汉字输入法,特别是涉及一种只以单笔画为编码码元的汉字输入技术。
背景技术
与本发明最接近的现有技术是指以笔画为编码码元或涉及以笔画为编码码元的汉字输入技术,现列举如下几种:
五笔画输入法。该输入法只取用五个基本笔画为编码码元,编码方法简单、容易;缺点是由于码元太少,以致组合编码的总量太少。四位数编码只有625个(54=625),尚不及GB2313-1980字符集常用字3755个字的数量,更不及常用字和次常用字之和6763个字的数量;且离散重码的能力太弱,技术效果不好,致使其缺少实用性。(见王码电脑产品技术说明书之一《电脑通用汉字输入法五笔字型<培训教材>》的第九章第76-80页:五键五笔画输入法。1986年版成套资料第一册)。
索尼手机中文输入法。该输入法也是单笔画输入,共有横、竖、撇、捺、点、左折、右折、左钩、右钩等9个笔画编码码元,其特征是:除了将基本笔画的“点”一分为二为“点”和“捺”外,主要是将“折”笔拆分得更细。设计者为了保持单笔画编码输入方法简单这个优势,又想解决只用五个基本笔画编码输入难以解决重码率过高的问题,对基本笔画进行分解,并部分地解决了“点”、“折”两个笔画的拆分细化。但对于“横、竖、撇”由于没有找到明显的外部区分特征而未加拆分。因而并未从根本上解决各笔画在组字数量上的不均衡分布的问题,并进而使重码率下降到一个更低的程度。(见索尼CMD-J26手机使用说明书P21-22《笔画输入法》)。
四角号码。四角号码采用单笔画与复合笔画部件混合编码的方法,由于有了复合笔画部件的介入,重码率得以大幅度下降。但在编码方法上,相对于前两个纯笔画编码的输入法,方法趋于复杂;由于是复合编码,取笔的歧义性增大(该取笔画还是复合部件?);复合笔画部件设置的合理性不强(如“木”的下半部视作“小”,“攵”的上半部视作“八”等);汉字笔画被人为截断有太大的随意性(如“马”的上部作“横”,“冂”的右部作“竖”等)使汉字笔画的规范化受到损害。这些是与四角号码混合编码获取重码率大幅降低较好效果并存的缺陷。(见《现代汉语词典》1981年“四角号码检字表”部分)
发明内容
现有技术中,有的技术方法简单,只用单笔画编码,容易学习,但缺陷是汉字输入的重码率太高,技术效果不好;有的技术方法采用单笔画和复合笔画部件混合编码,使重码率大幅下降,但缺陷是方法趋于复杂,编码合理性不强,多义性增加,且多有不符合汉字规范化之处。
本发明要解决的技术问题是,既保持单笔画编码简单容易的技术特征,又能克服重码率过高的缺陷,使之达到同单笔画与复合笔画部件混合编码一样好,甚至更好的技术效果。
技术方案:以规范的“横、竖、撇、点、折”五个基本笔画为基础,将各笔画一分为二,以有无叉笔为最基本的区别特征,加上“直撇”、“直点”两个特征,使汉字笔画分成“横、叉横;竖、叉竖;撇、叉撇(直撇);点(捺)、叉点(叉捺、直点);折、叉折”共10个两两相对的笔画码元,取0-9共10个数字作为编码代码(笔画编码方法参见附图),取汉字四个角的笔画编码进行汉字的计算机输入。
具体方案如下:
1、笔画和编码:
(1)、一般规定。当“横、竖、撇、点(捺)、折”五个基本笔画没有叉笔叉过时,其编码顺次是:横1、竖2、撇3、点(捺)4、折5;当“横、竖、撇、点(捺)、折”五个基本笔画有叉笔叉过时,其编码顺次是:叉横9、叉竖8、叉撇7、叉点(叉捺)6、叉折0。
(2)、特别规定。“点”的上、下有横,左、右有竖时,为“直点”,归入“叉点”,编号为6;“撇”的中部与“横”、“叉横”、“竖”、“叉竖”相连时,为“直撇”,归入“叉撇”,编号为7。
30字编码口诀:笔画横、竖、撇、点、折,
编号1、2、3、4、5,
叉笔9、8、7、6、0,
直点6,直撇7,须注意。
2、取角方法:
(1)、取角顺序:每字按①左上角、②右上角、③左下角、④右下角的次序取四个角笔画的号码;
(2)、取角原则:①、一个笔画只取用一次,前角笔画用过,后角作为0;②、下角笔画偏在一角的,按实际位置取号,缺角作为0;③、外围是“口、门”的字,两下角改取里面的笔画
(以上“2、取角方法”与四角号码方法相同,属现有技术。)
3、取笔方法:一角有多笔可取时,按如下规则取笔:
(1)、一般原则(笔顺原则):依笔顺一、二、三角取先笔笔画,第四角取末笔笔画;
(2)、特别原则:①、长胜短原则。两笔交叉有通长笔的,取通长笔的笔画;②、多胜少原则。多笔交叉,多笔是相同笔画的,取多笔的笔画;③、小笔优先原则。“点、撇、提”等小笔画优先取号,一笔占两角的,后角补作0。
4、输入方法:
(1)、大键盘输入方法:将0、1、2、3、4、5、6、7、8、9共10个数字分别对应于计算机大键盘上10个英文字母键B、G、H、T、Y、N、U、R、J、F,根据汉字的数字编码进行汉字输入;将周围的E、I、D、K、V、M设定为功能键,设定重码选择、翻页等功能。
(2)、小键盘输入方法:根据汉字的数字编码进行汉字输入;在大键盘或小键盘周围设置功能键,切换输入和重码选择。
本发明与现有技术相比,由于采用的是以基本笔画为基础,各个笔画对应两分的方法,不但使10个编码码元依然保持着单笔画编码简单的特征,而且,其两两对应的特点,既不增加记忆难度,又使各笔画的拆分均衡展开,进而达到大幅度降低汉字输入重码率的技术效果。以现有技术中重码率最低的四角号码为对比对象,根据《现代汉语词典》所收汉字两个编码的统计,本发明的技术效果要优于四角号码。重码30-39字的编码,四角号码13个,本发明10个;重码40字以上的编码,四角号码9个,本发明4个。
附图说明
附图是笔画编码方法示意图。两两对应的十个笔画“横、叉横、竖、叉竖、撇、叉撇(直撇)、点(捺)、叉点(叉捺)、折、叉折”分别用0-9共十个号码代表。笔形和例字为空心字,代码笔画用实心笔画表示。
具体实施方式
具体实施方式可以分为两步,下面参照附图并结合实例做进一步说明。
一、第一步对汉字进行笔画编码(参见附图),方法如下:
1、笔画编码:
(1)、一般规定:当“横、竖、撇、点(捺)、折”五个基本笔画没有叉笔叉过时,其编码顺次为“1、2、3、4、5”,即“横1、竖2、撇3、点(捺)4、折5”;当有叉笔叉过时,“叉横、叉竖、叉撇、叉点(叉捺)、叉折”的编码顺次为“9、8、7、6、0”,即“叉横9、叉竖8、叉撇7、叉点(叉捺)6、叉折0”。“横”与“叉横”1、9相对应;“竖”与“叉竖”2、8相对应;“撇”与“叉撇”3、7相对应;“点(捺)”与“叉点(叉捺)4、6相对应;“折”与“叉折”5、0相对应。如:“木”的四个笔画和编号分别是,“叉横9”、“叉竖8”、“撇3”、“捺4”。“士”的三个笔画和编码分别是,“叉横9”、“叉竖8”、“横1”。“又”的两个笔画和编码分别是,“叉折0”、“叉捺6”。
(2)、特别规定:具有上下是“横”或左右是“竖”形式特征的“点”为“直点”,归入“叉点”,编号为“6”;具有中部与“横”、“叉横”、“竖”、“叉竖”相连形式特征的“撇”为“直撇”,归入“叉撇”,编号为“7”。如:“惊”,“忄”中的“点”即为“直点”编码为“6”;“京”上部的“点”下有“横”,下部的“点”旁有“竖”,均为“直点6”。“亻”的两个笔画编码为,“直撇7”、“竖2”。“干”的三个笔画和编码为,“直撇7”、“叉横9”、“叉竖8”。“矢”与“失”的第一笔均为“直撇7”
2、取角方法:
(1)、取角顺序
(2)、取角原则:
②、下角笔画偏在一角的,按实际位置取号,缺角作0。例:
3、取笔方法:一角有多笔可取时,按如下规则取笔:
(1)、一般原则(笔顺原则):依笔顺一、二、三角取先笔笔画,第四角取后笔笔画。例:
(2)、特别原则:
①、长胜短原则:两笔交叉有通长笔的,取通长笔笔画。例:
③、小笔优先原则:“点、撇、提”等小笔画优先取笔,一笔占两角的,后角补0。例:
二、第二步进行汉字的计算机输入,可有两种输入方式。
方式一:用计算机英文键盘输入,可设计为,G、H、T、Y、N代表横、竖、撇、点、折,编号为G1、H2、T3、Y4、N5;F、J、R、U、B代表叉横、叉竖、叉撇(直撇)、叉点(叉捺、直点)、叉折,编号为F9、J8、R7、U6、B0。将周围的E、I、D、K、V、M设定为功能键,设置重码选择等功能。如:顺次输入H、B、G、G四键,然后通过功能键,或翻页,或选择、或确定,以完成汉字输入。
Claims (1)
1、一种单笔画编码汉字输入法,其特征是:以规范的“横、竖、撇、点、折”五个基本笔画为基础,以有无叉笔为最基本的区分标志,辅以“直点”、“直撇”等形式特点,使汉字的五个基本笔画规律地拆分成“横”和“叉横”;“竖”和“叉竖”;“点、捺”和“叉点、叉捺、直点”;“撇”和“叉撇、直撇”;“折”和“叉折”共10个两两相对的笔画码元,取0-9共10个数字作为编码代码,遵循笔顺规范,并辅以“长胜短”、“多胜少”的取笔规则,取汉字四个角的笔画,依照左上角、右上角、左下角、右下角的顺序,对应计算机大键盘的字母键或小键盘的数字键,进行汉字的计算机输入;
笔画拆分规则和笔画码元与10个数字的对应关系是:当“横、竖、撇、点、折”五个基本笔画没有叉笔叉过时,其编码顺次为“1、2、3、4、5”;当有叉笔叉过时,其编码顺次为“9、8、7、6、0”,“横”与“叉横”1、9相对应;“竖”与“叉竖”2、8相对应;“撇”与“叉撇”3、7相对应;“点、捺”与“叉点、叉捺”4、6相对应;“折”与“叉折”5、0相对应;另外,具有“直点”形式特点的“点”归为“叉点”,编号为6;具有“直撇”形式特点的“撇”归为“叉撇”,编号为7;
当一角有多笔可取时,取笔方法依照如下原则:
(1)、笔顺原则,即一般原则:依笔顺一、二、三角取先笔的笔画,第四角取末笔的笔画;
(2)、长胜短原则:两笔交叉,有通长笔的,取通长笔的笔画;
(3)、多胜少原则:多笔交叉,多笔是相同笔画的,取多笔的笔画;
(4)、小笔优先原则:“点、撇、提”等小笔画优先取笔;
键盘输入:将所取用的0-9共10个数字0、1、2、3、4、5、6、7、8、9分别对应于计算机大键盘上10个英文字母键B、G、H、T、Y、N、U、R、J、F或直接应用于小键盘上的数字键进行汉字的计算机输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB001021591A CN1141634C (zh) | 2000-03-02 | 2000-03-02 | 单笔画编码汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB001021591A CN1141634C (zh) | 2000-03-02 | 2000-03-02 | 单笔画编码汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1263296A CN1263296A (zh) | 2000-08-16 |
CN1141634C true CN1141634C (zh) | 2004-03-10 |
Family
ID=4576312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB001021591A Expired - Fee Related CN1141634C (zh) | 2000-03-02 | 2000-03-02 | 单笔画编码汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1141634C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740459A (zh) * | 2016-02-18 | 2016-07-06 | 安徽省烟草公司滁州市公司 | 一种创新人事档案检索方法 |
-
2000
- 2000-03-02 CN CNB001021591A patent/CN1141634C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1263296A (zh) | 2000-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1141634C (zh) | 单笔画编码汉字输入法 | |
CN1118742C (zh) | 笔形部首混合汉字数码输入法及键盘 | |
CN1029046C (zh) | 汉字部首笔画输入法 | |
CN1167993C (zh) | 计算机及电信中三键汉字字形输入法及其相应键盘 | |
CN1293448C (zh) | 十笔数码输入法 | |
CN1114853C (zh) | 一种使用计算机数字键盘的数字编码双笔划汉字输入法 | |
CN1425975A (zh) | 笔形数码汉字输入法 | |
CN1017662B (zh) | 无理序号数字编码法及其键盘 | |
CN1079562A (zh) | 多种文字数字编码法及其键盘 | |
CN1534444A (zh) | 《汉字结构》输入法 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1545015A (zh) | “之乎者也”一一对应数象东巴文哥巴文输入法及两式键盘 | |
CN1178121C (zh) | 汉字笔顺部首双重输入方法及系统 | |
CN1141632C (zh) | 一种汉字二位数码输入法 | |
CN1189810C (zh) | 五角形四角号码汉字输入法 | |
CN100342314C (zh) | 汉字数字特征码输入法及键盘 | |
CN1540487A (zh) | “之乎者也”一一对应数象彝文输入法及其两式键盘 | |
CN1066928A (zh) | 汉字分解定位编码 | |
CN1039512C (zh) | 计算机中文单笔划输入系统 | |
CN1306370C (zh) | 计算机汉字六元三笔数码输入法及其键盘 | |
CN1139024C (zh) | 汉字l码输入方法 | |
CN1319794A (zh) | 数字键声韵形码 | |
CN1417668A (zh) | 简易数字符号汉字输入法及其键盘 | |
CN1306238A (zh) | 汉字笔画输入法 | |
CN1477487A (zh) | 文字输入法的优化方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |