CN101038517A - 一种汉字形声编码输入法 - Google Patents

一种汉字形声编码输入法 Download PDF

Info

Publication number
CN101038517A
CN101038517A CNA2007100658196A CN200710065819A CN101038517A CN 101038517 A CN101038517 A CN 101038517A CN A2007100658196 A CNA2007100658196 A CN A2007100658196A CN 200710065819 A CN200710065819 A CN 200710065819A CN 101038517 A CN101038517 A CN 101038517A
Authority
CN
China
Prior art keywords
stroke
chinese
word
letter
yard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100658196A
Other languages
English (en)
Other versions
CN100501649C (zh
Inventor
施冰
段利华
李锟华
陈本辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dali University
Original Assignee
Dali University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dali University filed Critical Dali University
Priority to CNB2007100658196A priority Critical patent/CN100501649C/zh
Publication of CN101038517A publication Critical patent/CN101038517A/zh
Application granted granted Critical
Publication of CN100501649C publication Critical patent/CN100501649C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明涉及一种汉字形声编码输入法,属计算机文字信息处理领域。它把汉字按自然结构划分为独体字和两体字二类,汉字体的首笔画划分为斜、横、竖3类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画的关系分为交叉、方框二类,分别与英文字母键盘的第一、二列对应,从而形成3×8的二维坐标编码键位,取每字体首、次笔画组合得到两体字的第一码和第二码,第3码为组成该字第1体最大成字的汉语拼音首字母,第4码为该汉字的汉语拼音首字母;独体字按汉字书写顺序依次取笔对组合,后续码为汉字拼音的首字母;汉字最大编码码长为四码。本发明具有拆分汉字简单、直观、规范,编码键位安排唯一,不涉及字根、记忆量小、学习周期短,只要熟悉汉字首、次笔画所在键盘的行、列和汉字体及汉字读音声母的首字母,就可输入汉字,适应期短,掌握后不会遗忘。

Description

一种汉字形声编码输入法
技术领域
本发明涉及一种汉字编码输入法,是一种基于汉字简单分类的形声编码输入法,属计算机中文信息处理领域。
背景技术
近几年来,虽然计算机技术得到不断的发展,其应用范围也在不断地扩大,但计算机汉字输入中仍然大量地依赖汉字编码方式进行操作,计算机中文信息处理过程中汉字输入方案的规范、易学和输入速度、正确率等仍然是制约用户工作效率的主要瓶颈之一。汉字键盘输入的现状是:虽然汉字编码出现了“万码奔腾”的情况,但符合规范、易学、高效、适合常规用户学习的编码方案却屈指可数,尤其在学校的汉字键盘输入教学中除了拼音输入法外,没有更好的汉字输入方案,直接影响了学生键盘输入汉字水平的提高。目前,大多汉字编码存在的问题是:
1、形码方案大多采用字根编码方法,字根的数量多,要熟记字根,还要记住字根的分布,要掌握字根的拆分原则和编码规则,使字根编码方案难学难记。因此,字根编码方案容易产生编码不规范、编码过程复杂、记忆量大、输入法难学、一段时间不使用就会忘记等一系列问题。
2、单纯的音码方案对不认识的汉字或读不准确的汉字难以录入,且因为汉字只有400多个音节,重码率高(如全拼、双拼方案)。因此,输入效率低、无法输入不会读的汉字、不能适应各种层次人员使用是拼音编码方案的缺陷,这些问题在拼音编码方案中不可能从根本上得到解决。
事实上,汉字是由“声、形、义”三要素构成的图形符号,汉字键盘输入编码方案都是利用汉字的“形”和“声”两种要素来进行编码的。在汉字编码方案设计中,提取汉字拼音的首字母、部份笔画和笔顺信息,既能体现汉字特征,又精简了汉字“形”和“声”的信息,既有利于编码元素的选取,又易于用户的掌握。充分利用汉字“形”和“声”的信息,可以自然降低了编码的重码率,又能使方案易学易用。
随着计算机应用领域的逐步扩大和应用程度的不断深入,计算机汉字输入方法的复杂性和易学性已成为制约汉字处理技术发展的主要因素之一,因此,有必要探索简单、易学、规范、快速的汉字编码输入方法。
发明内容
本发明的目的在于提供一种汉字形声编码输入法,只要熟悉汉字首笔画所在键盘的行,次笔画所在键盘的列,以及汉字体和汉字拼音首字母,就可以输入汉字,适合任何层次的人员学习和使用,掌握后不会遗忘。
本发明通过下列技术方案实现:把汉字按自然结构划分为独体字和两体字二种,再把汉字各体的首笔画划分为斜、横、竖三类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画之间分为交叉和方框二类,分别与英文字母键盘的第一、第二列对应,形成3×8的二维坐标编码键位,其中斜包含撇、捺、点、提四种笔画,竖包含竖和折二种笔画,具体对应关系见图1。
两体字和独体字按下列规则编码,且汉字最大码长为四码:
1、两体字:
两体字包含上下、左右、内外三种结构,按笔顺分为第1体字和第2体字,其编码规则是:
第一码:第1体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第2体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第三码:第1体是成字的,取其成字体的汉语拼音首字母;
第1体不是成字的,取该体中头几笔画组成的最大成字体的汉语拼音首字母;
第1体中无最大成字体的,取该体偏旁部首的汉语拼音首字母(见表1);
不符合以上所列情况的,取第一体首笔画的汉语拼音首字母(见表2);
第四码:所编汉字的汉语拼音首字母;
2、独体字:
按汉字笔画书写顺序将独体字分为:一、二笔画字,三、四笔画字,五笔及其以上字,各类型字按下列规则编码:
(1)一、二笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码;汉字的汉语拼音首字母;
第三码:英文字母O键;
(2)三、四笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三笔画、末笔画对应英文字母键盘行、列相交的字母键;
第三码:汉字的汉语拼音首字母;
第四码:英文字母O键;
(3)五笔画、五笔画以上字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三、第四笔画对应英文字母键盘行、列相交的字母键;
第三码:第五、末笔画对应英文字母键盘行、列相交的字母键;
第四码:汉字的汉语拼音首字母;
3、在以上按笔画对进行取码的过程中,如果笔画对的第一笔画和第二笔画构成交叉或方框时优先取码。
具体编码方法:
(一)两体字:
两体字的编码顺序为(第1体字的首、次笔画对应英文字母键盘行、列相交的字母键)(第2体字的首、次笔画对应英文字母键盘行、列相交的字母键)(第1体成字的汉语拼音首字母)(所编汉字的汉语拼音首字母),即:
1、第一码和第二码分别为第1体和第2体首、次笔画对应英文字母键盘行、列相交的字母键,其中构成交叉和方框时优先取码,如:
“码”拆分为“石、马”两体字,第1体为“石”,其首笔画是“一”、次笔画是“丿”,对应英文字母键盘行、列相交的字母键为“g”(见图1中的第2行第5列),第2体为“马”,其首笔画是“乛”(单折)、次笔画是“ㄅ”(复折),对应英文字母键盘行、列相交的字母键为“l”(见图1中的第3行第8列),第三码是第1体“石”的汉语拼音首字母“s”,第四码是该汉字的汉语拼音首字母“m”,因此编码分别为“glsm”。
“盘”拆分为“舟、皿”,第1码和第2码分别为“t、x”(第二体为方框)。
“体”拆分为“亻、本”,第1码和第2码分别为“r、a”(第二体为交叉)。
2、第三码按以下顺序确定编码:
(1)当组成该字的第1体是成字的,取第1体成字的汉语拼音首字母,如:
“码”的第1体“石”的汉语拼音首字母是“s”;
“地”的第1体为“土”,汉语拼音首字母为“t”;
“突”的第1体为“穴”,汉语拼音首字母为“x”。
(2)当第1体不是成字的,取该体中按书写顺序(头几笔画)的最大成字体的拼音首字母,如:
“能”中第1体最大成字体为“厶”,编码为“s”;
“断”中第1体最大成字体为“米”,编码为“m”;
“毅”中第1体最大成字体为“立”,编码为“l”;
(3)无最大成字体的,取第1体偏旁部首的汉语拼音首字母(见表1),如:
“代”中第1体为“亻”,编码为“r”;
“虎”中第1体为“虍”,编码为“h”。
“沟”中第1体为“氵”,编码为“s”。
(4)不符合以上所列情况时,取第1体首笔画的汉语拼音首字母(见表2),如:
“石”的第1体为“_”,首笔画的汉语拼音首字母为“h”;
“制”中第一体的首笔画是“丿”,其汉语拼音首字母为“p”;
“党”的第一体为“_”,首笔画是“丨”,其汉语拼音首字母为“s”。
3、第4码为该汉字的汉语拼音首字母。
(二)独体字:
独体字按汉字笔画书写顺序分为:一、二笔画字,三、四笔画字,五笔及其以上字三种类型,按以下规则编码:
1、一、二笔画字的编码顺序是:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:汉字的汉语拼音首字母;
第三码:英文字母O键。
2、三、四笔画字的编码顺序是:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三笔画、末笔画对应英文字母键盘行、列相交的字母键;
第三码:汉字的汉语拼音首字母;
第四码:英文字母O键。
3、五笔画、五笔画以上字的编码顺序是:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三、第四笔画对应英文字母键盘行、列相交的字母键;
第三码:第五、末笔画对应英文字母键盘行、列相交的字母键;
第四码:汉字的汉语拼音首字母。
即:独体字按汉字笔画书写顺序最多取3组笔画对组合进行编码,后续编码为汉字的汉语拼音首字母,当组成汉字的笔画数小于5时,在汉字拼音首字母编码后加字母“O”表示结束编码。如:
“一”的编码为“dyo”;“十”的编码为“aso”;
“土”的编码为“adto”;“王”的编码为“dcwo”;
“玉”的编码为“dcyy”;“生”的编码为“eads”;
“甲”的编码为“xdvj”;“本”的编码为“aydb”;
“串”的编码为“xszc”;“重”的编码为“exdz”或“exdc”。
附图说明
图1为本发明汉字各体的首笔画(斜、横、竖三类)、次笔画(横、竖、撇、捺(点)、单折、复折六类)、首、次笔画之间的关系(交叉和方框二类)分别与英文字母键盘的三行、第三至第八列、第一和第二列对应,并形成3×8二维坐标的编码键位图。即笔对中首、次笔画的编码键位对应关系图。
注:图1中第三行和第八列因为符号“,”键,编码时实际对应字母“L”键。
具体实施方式
本发明编码实施例见表3:
表3不同类型汉字编码实例
   汉字     分类   编码 汉字     分类   编码
  一   独体字(一笔画字)     dyo   舌 两体字(上下结构)   exqs
  十   独体字(二笔画字)     aso   高 两体字(上下结构)   exdg
  土   独体字(三笔画字)     adto   织 两体字(左右结构)   mxrz
  五   独体字(四笔画字)     fcwo   汇 两体字(左右结构)   yjsh
  本   独体字(五笔画字)     aydb   且 两体字(内外结构)   xdsq
  果 独体字(五笔画以上字)     xdhg   居 两体字(内外结构)   casj
表2笔画拼音首字母编码表
笔画  拼音首字母编码 笔画  拼音首字母编码 笔画  拼音首字母编码
  一     h     丨     s     丿     p
  、     d 乛(乚亅__)     z
表1偏旁、部首拼音首字母编码表
偏旁或部首 拼音首字母编码 偏旁或部首   拼音首字母编码 偏旁或部首 拼音首字母编码
c s    雨(头) y
 刂     d   虍     h    罒     s
  _     z   _     z    攵     w
  饣     s   钅     j    犭     q
  亻     r   牜     n    衤     y
d b y
  忄     x   氵     s    礻     d
  辶     z   阝     e    纟    r
注:1、本表共使用24个偏旁部首进行编码,均为相应偏旁部首读音声母的首字母,无需特别记忆。2、不在本表中所列的其它偏旁部首按成字或其首笔画取码。

Claims (3)

1、一种汉字编码输入法,其特征在于把汉字按自然结构划分为独体字和两体字二种,把各字体的首笔画划分为斜、横、竖三类,分别与英文字母键盘的三行对应,次笔画划分为横、竖、撇、捺(点)、单折、复折六类,分别与英文字母键盘的第三至第八列对应,首、次笔画之间分为交叉和方框二类,分别与英文字母键盘的第一、第二列对应,形成3×8的二维坐标编码键位,其中斜包含撇、捺、点、提四种笔画,竖包含竖和折二种笔画,具体对应关系如下(其中:第三行第八列实际对应字母L键):
交叉    方框    横      竖      撇      捺(点) 单折     复折   Q   W   E   R   T   Y   U   I   O   P   A   S   D   F   G   H   J   K   L   Z   X   C   V   B   N   M   (L)
斜(撇、捺、点、提)
竖和折
2、两体字和独体字按下列规则编码,汉字最大码长为四码:
(1)两体字:
两体字包含上下、左右、内外三种结构,按笔顺分为第1体字和第2体字,其编码规则是:
第一码:第1体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第2体字的首、次笔画对应英文字母键盘行、列相交的字母键;
第三码:第1体是成字的,取其成字体的汉语拼音首字母;
        第1体不是成字的,取该体中头几笔画组成的最大成字体的汉
        语拼音首字母;
        第1体中无最大成字体的,取该体偏旁部首的汉语拼音首字母;
        不符合以上所列情况的,取第一体首笔画的汉语拼音首字母;
第四码:所编汉字的汉语拼音首字母;
(2)独体字:
按汉字笔画书写顺序将独体字分为:一、二笔画字,三、四笔画字,五笔画及其以上字,各类型字按下列规则编码:
一、二笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:汉字的汉语拼音首字母;
第三码:英文字母O键;
三、四笔画字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三笔画、末笔画对应英文字母键盘行、列相交的字母键;
第三码:汉字的汉语拼音首字母;
第四码:英文字母O键;
五笔画、五笔画以上字:
第一码:首、次笔画对应英文字母键盘行、列相交的字母键;
第二码:第三、第四笔画对应英文字母键盘行、列相交的字母键;
第三码:第五、末笔画对应英文字母键盘行、列相交的字母键;
第四码:汉字的汉语拼音首字母;
3、在以上按笔画对进行取码的过程中,如果笔画对的第一笔画和第二笔画构成交叉或方框时优先取码。
CNB2007100658196A 2007-04-18 2007-04-18 一种汉字形声编码输入法 Expired - Fee Related CN100501649C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2007100658196A CN100501649C (zh) 2007-04-18 2007-04-18 一种汉字形声编码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007100658196A CN100501649C (zh) 2007-04-18 2007-04-18 一种汉字形声编码输入法

Publications (2)

Publication Number Publication Date
CN101038517A true CN101038517A (zh) 2007-09-19
CN100501649C CN100501649C (zh) 2009-06-17

Family

ID=38889453

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007100658196A Expired - Fee Related CN100501649C (zh) 2007-04-18 2007-04-18 一种汉字形声编码输入法

Country Status (1)

Country Link
CN (1) CN100501649C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106708286A (zh) * 2017-01-10 2017-05-24 厦门雅迅网络股份有限公司 一种智能手表输入法
CN107728805A (zh) * 2016-08-11 2018-02-23 吴敬祖 笔画与拼音输入法
CN107885338A (zh) * 2017-10-17 2018-04-06 惠州Tcl移动通信有限公司 笔画输入处理方法、计算机可读存储介质及终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1234061C (zh) * 2001-03-12 2005-12-28 肖湘茂 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘
CN1538276A (zh) * 2003-04-17 2004-10-20 吴宗继 汉字一笔音形结合码输入法
CN1211726C (zh) * 2003-04-22 2005-07-20 李建学 一种使用位形音汉字编码的输入法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107728805A (zh) * 2016-08-11 2018-02-23 吴敬祖 笔画与拼音输入法
CN106708286A (zh) * 2017-01-10 2017-05-24 厦门雅迅网络股份有限公司 一种智能手表输入法
CN106708286B (zh) * 2017-01-10 2022-10-18 厦门雅迅网络股份有限公司 一种智能手表输入法
CN107885338A (zh) * 2017-10-17 2018-04-06 惠州Tcl移动通信有限公司 笔画输入处理方法、计算机可读存储介质及终端

Also Published As

Publication number Publication date
CN100501649C (zh) 2009-06-17

Similar Documents

Publication Publication Date Title
CN101038517A (zh) 一种汉字形声编码输入法
CN1960724A (zh) 罗替戈汀用于治疗和预防帕金森叠加综合症的用途
CN108531439B (zh) 一种大肠杆菌基因工程菌及其构建方法与应用
CN111378679A (zh) 一种基因表达组件及其构建的克隆载体和应用
CN106222189B (zh) 一种基于类弹性蛋白标签制备重组n-端脑钠肽前体的方法
Scannell et al. Thioguanine in deoxyribonucleic acid from tumors of 6-mercaptopurine-treated mice
CN1146780A (zh) 2-酮-l-古洛糖酸的生产方法
KR20180056929A (ko) 증가된 셀룰로스 생산능을 갖는 코마가타이박터 속 미생물, 그를 이용하여 셀룰로스를 생산하는 방법 및 상기 미생물을 생산하는 방법
CN109679989A (zh) 一种提高碱基编辑系统编辑效率的方法
CN102230007B (zh) 一种分子信标荧光定量pcr检测邻苯二甲酸酯的方法
CN112852860B (zh) 质粒载体及其在构建多拷贝表达系统中的应用
CN106893733A (zh) 一种基于大肠杆菌表达系统的重组pBpp蛋白制备方法
CN108085371B (zh) 判断pcr结果是否为假阳性的方法
CN114015723A (zh) 一种鸭坦布苏病毒质粒载体、弱毒株及其制备方法和应用
CN101597622A (zh) 肿瘤特异性启动子调控的串联miRNA或shRNA表达载体
CN112553098B (zh) 一种咖啡酸的生物制备方法
CN107151670B (zh) 大豆蛋白及其编码基因的应用及引物、表达载体和制备方法
KR101960382B1 (ko) 호기조건에서 부탄올을 생성하는 변이 미생물 및 이를 이용한 부탄올의 제조방법
CN109402155A (zh) 一种双控延迟裂解性质粒及其构建方法与应用
CN110964742A (zh) 一种抗除草剂水稻的制备方法
CN111961126B (zh) TaVQ25基因在调控小麦对白粉病和纹枯病抗性中的应用
Keshtkar et al. Simulation of 36S stable isotope enrichment by square single withdrawal cascade
CN106967156A (zh) 一种针对pBpp蛋白的纯化方法
CN108715888A (zh) 一种基于fret的pcr均相检测系统及其应用
CN112538477A (zh) xCas9基因编辑系统在基因组编辑中的应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090617

Termination date: 20100418