CN1267807C - 一种用汉字及部首读音编码的汉字输入方法 - Google Patents
一种用汉字及部首读音编码的汉字输入方法 Download PDFInfo
- Publication number
- CN1267807C CN1267807C CN 02106359 CN02106359A CN1267807C CN 1267807 C CN1267807 C CN 1267807C CN 02106359 CN02106359 CN 02106359 CN 02106359 A CN02106359 A CN 02106359A CN 1267807 C CN1267807 C CN 1267807C
- Authority
- CN
- China
- Prior art keywords
- chinese character
- pronunciation
- word
- chinese
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明一种形音结合以汉字及部首读音编码的汉字信息处理方法,将单个汉字拆分成第一构件、第二构件和末构件三个部分,构件取新华字典中规定的偏旁部首,取整字、第一构件、第二构件和末构件的读音首字母对汉字编码,并将该编码对应的汉字图形信息存储在计算机中,在标有英文字母的键盘上按编码顺序输入相对应的字母,通过计算机处理显示相应的汉字。本发明应用在手机等数字设备上,取整字、第一构件、第二构件和末构件的读音首字母所对应的数字和整字末两笔画所对应的数字对汉字编码,从而实现在这些设备上的汉字输入。用汉字及偏旁部首读音取码,兼顾汉字的结构和读音,避免了Z、C、S和ZH、CH、SH等发音不准带来的麻烦,拆分取码方便,易学易用易记,入门方便,可盲打。
Description
技术领域
本发明涉及一种汉字输入方法,特别是用汉字及其拆分的部首等字根读音编码的汉字输入方法。
背景技术
现有的汉字输入技术很多,主要采用字形、字音及音形结合等方式编码。字形码以五笔字形为代表,优点是速度较快、重码少,缺点是字根拆分复杂,缺少规律性,难于记忆,难以学习掌握,给初学者带来很大困难。字音码以全拼音码为代表,优点是易学易记,缺点是重码率高,效率低。音形码以自然码为代表,既兼有上述两种码的优点,又兼有它们的缺点。公开号为CN1262475A的专利文献公开了一种汉字字音码编码方法,将汉字拆分为笔画、成字元、常字元和异字元四种不同性质的结构成分,并以它们读音的首字母归入所对应的英文字母键盘上。这种方法的优点是利用了汉字字形结构特征又兼顾其读音,将汉字拆分单元和笔画的读音的音序作编码,与键盘上的英文字母一一对应,易学易用;其缺点是字形单元拆分不科学,缺乏规律性,不便记忆。
发明内容
本发明的目的是提供一种形音结合以汉字及部首读音编码的汉字输入方法。本发明的方案是:将单个汉字拆分成第一构件、第二构件和末构件三个部分,构件取新华字典中规定的全体偏旁部首,取整字、第一构件、第二构件和末构件的读音首字母对汉字编码,并将该编码对应的汉字图形信息存储在计算机中,在标有英文字母的键盘上按编码顺序输入相对应的字母,通过计算机处理显示相应的汉字。
为了减少重码合理安排键位,部分偏旁部首安排在读音字母以外的其它键上。偏旁部首与键盘键位对应如下:
A鱼(魚)
B 比白贝(貝)鼻卜髟(鬓字头)八(丷)勹(包字头)疒豸(豹字旁)宀冖
C 厂车(車)虫赤齿(齒)辰臣寸艹屮(出字头)疋()(楚字底)
D 、(点)冫氵灬大斗(鬥)刀()刂豆歹
E 二儿耳阝卩()
F 方父缶风(風)采(番字头)攵(反文旁)夂
(三笔反文)犭(反犬旁)
G 工广革鬼骨瓜谷弓戈艮
(GEN)巛(三拐)
H 一(横)户火禾黑虍(虎字头)
I水(氺)
J 几见(見)己(巳已)斤巾角臼金钅(釒)丬(爿)(将字旁)纟(糹糸)(绞丝)
廴(建之旁)豕(家字底)隹(集字头)
K 口囗匚冂凵
L 力立龙(龍)里老鹿卤(鹵)耒(LEI)亠(六字头)彐(彑)(录字头)聿(肀)(律字旁)
M 木门(門)马(馬)毛母(毋WU)米矛麻麦(麥)皿(MIN)黾(黽)(MIAN)目殳(没字旁)
N 女牛()鸟(鳥)廾(弄字底)
O 月
P 丿(撇)彡(三撇)片皮
Q 其欠青气犬攴(敲字旁)
R 人入亻(单站人)彳(双站人)日(曰)
S 丨(竖)亅(竖钩)罒(扁四头)礻石示尸矢舌身食饣鼠
T 十士土田扌(提手旁)厶(台字头)
U 手()
V 山
W 王文瓦韦(韋)
X 心西(覀)血夕辛穴小()忄()
Y 又用衣雨业页(頁)言羊音羽幺(YAO)酉弋(YI)讠(訁)衤尢(尤字旁)
Z 乙(折)止自走足()子(孑)竹()舟爪(爫)辶。
括号中的字母是括号前部首的汉语拼音读音,汉字为注释。此外,八(丷)表示“八”和“丷”为一个部首,己(已巳)表示“己、已、巳”为一个部首,都依据《新华字典》。其中,特殊安排的如下:
月(O) 月圆圆(表形)
山(V) 山尖尖(表形)
水(I) I代表SHUI(表音)
手(U) U代表SHOU(表音)
鱼(A) 鱼扁扁(表形)
十(T) T像十(表形)
士(T) 士像土(表形)
这七个部首可概括为一句话,即“月山水手鱼十士”,可理解为“月山水手愚弄了十个武士”。
实际应用时,代码表可能会略有变动,以产品的说明书或帮助文件为准。如将“冫、氵、灬”看成“水”,列入“I”代码中,把“扌”看成“手”,列入“U”代码中;所有字根全部用读音首字母表示;等等。
由于采用了以上方案,用汉字及偏旁部首读音的首字母来取码,既利用了汉字的结构特点,又兼顾其读音,还避免了Z、C、S和ZH、CH、SH等发音不准带来的麻烦,凡是认识汉字会用字典的人可以很方便地拆分取码,具有易学易用易忆的特点,入门非常方便,兼有五笔字型低重码率的优点,可实现盲打。
具体实施方式
本发明取整字、第一构件、第二构件和末构件的读音首字母编码,末构件不存在时取末笔画作识别码,构件取新华字典中规定的189个偏旁部首,偏旁部首与键盘键位对应如下:
A 鱼(魚)
B 比白贝(貝)鼻卜髟(鬓字头)八(丷)勹(包字头)疒豸(豹字旁)宀冖
C 厂车(車)虫赤齿(齒)辰臣寸艹屮(出字头)疋()(楚字底)
D 丶(点)冫氵灬大斗(鬥)刀()刂豆歹
E 二儿耳阝卩()
G 工广革鬼骨瓜谷弓戈艮
(GEN)巛(三拐)
H 一(横)户火禾黑虍(虎字头)
I 水(氺)
J 几见(見)己(巳已)斤巾角臼金钅(釒)丬(爿)(将字旁)纟(糹糸)(绞丝)
L (建之旁)豕(家字底)隹(集字头)
K 口囗匚冂凵
L 力立龙(龍)里老鹿卤(鹵)耒(LEI)亠(六字头)彐(彑)(录字头)聿(肀)(律字旁)
M 木门(門)马(馬)毛母(毋WU)米矛麻麦(麥)皿(MIN)黾(黽)(MIAN)目殳(没字旁)
N 女牛()鸟(鳥)廾(弄字底)
0 月
P 丿(撇)彡(三撇)片皮
Q 其欠青气犬攴(敲字旁)
R 人入亻(单站人)彳(双站人)日(曰)
S 丨(竖)亅(竖钩)罒(扁四头)礻石示尸矢舌身食饣鼠
T 十士土田扌(提手旁)厶(台字头)
U 手()
V 山
W 王文瓦韦(韋)
X 心西(覀)血夕辛穴小()忄()
Y又用衣雨业页(頁)言羊音羽幺(YAO)酉弋(YI)讠(訁)衤尢(尤字旁)
Z乙(折)止自走足()子(孑)竹()舟爪(爫)辶。
构件取码按大优先原则,即在同一位置有多个构件时,取大的为构件,如“衷”有“亠”和“衣”两个构件,取“衣”为构件。
笔画分为“一(横)、丨(竖)、丿(撇)、丶(点)、乙(折)”五种,分别对应的识别码为“H”、“S”、“P”、“D”、“Z”。
汉字编码举例如下:
字 拆分 编码 字 拆分 编码
百 百+一+白+一 BHBH 刘 刘+文+刂+亅 LWDS
盘 盘+舟+皿一 PZMH 束 束+木+口+丶 SMKD
麓 麓+木+木+鹿 LMML 长 长+/+一+丶 CPHD
芜 芜+艹+一+尢 WCHY 剩 剩+禾+亅+刂 SHJD
愿 愿+厂+白+心 YCBX 辣 辣+辛+木+口 LXMK
部首字的编码:在189个标准偏旁部首中有不少本身也是汉字,如“石”,也按一般字拆分,如:石=石(整字石)+一+ノ+口,编码为:SHPK。
生字难字等不知道读音的汉字其读音首字母用“`”键作为生字替代码由计算机进行查找。如“檐”编码为`MDY,“詹”编码为`DCY。GBK字符集中的组合字其读音用“;”键作为组合字读音替代码,其它同正常字。如:瓩(读“千瓦”)、囍(读“双喜”),它们的编码分别为;WPT、;TKK。
词组的编码:双字词取每个字的前两码,如:“现代”编码为XWDR,“革新”编码为GHXL,“用户”为YKHD。三字词取三个字的第一个码+标志符“;”,如:“说明书”编码为SMS;。四字或多字词取前三字和末字的第一个码。如“振兴中华”编码为ZXZH,“不到长城非好汉”编码为BDCH。
重码解决方案:一是尽量将全码重码的字安排进一级简码、二级简码和三级简码字;二是尽量合理地安排好字根代码。
本发明的编码,一级简码字23个、二级简码字约550个、三级简码字约4300个。
本发明的编码顺序也可采用以下两种形式:①第一构件、第二构件、末构件和整字的读音首字母编码;②第一构件、第二构件、整字和末构件的读音首字母编码。
本发明当末构件不存在时,也可取字型作识别码,将字型分为“上下、左右、内外、杂合”四种类型,分别取“I、U、N、V”作为识别码。
本发明在手机或数字键盘上用数字进行汉字输入时,即为数码。在手机上使用,其对应关系同手机,即:2-ABC 3-DEF 4-GHI 5-JKL 6-MNO 7-PQRS 8-TUV 9-WXYZ;在微机和没有标记英文字母键的其它设备的数字键盘上,其数字键与字母键的对应关系也可以为:1-ABC 2-DEF 3-GHI 4-JKL 5-MNO 6-PQR 7-STU 8-VWX 9-YZ。单字取码方法为:整字、第一构件、第二构件、末构件的读音首字母对应的数字再加上汉字末两笔笔画对应的数字。在手机中,“一(横)、丨(竖)、丿(撇)、丶(点)、乙(折)”依次对应着“2、3、4、5、6”五个数字键;在微机和其它无标记的数字键盘上,也可以依次对应数字键“1、2、3、4、5”。
下面以NOKIA3310手机为例,单字编码举例如下:
单字 拆分 编码 数码 简码
壁 壁+尸+口+土+丨+一 B+S+K+T+3+2 275832 2758
好 好+女+子+一+亅+一 H+N+Z+2+3+2 469232 46
情 情+忄+青+一+一+一 Q+X+Q+2+2+2 797222 797
午 午+ノ+一+十+一+丨 W+4+2+T+2+3 942823 94
词组编码:
a.两字词取两字前两码+7,如:
希冀=希+ノ+冀+丨+7
X 4 J 3 7
其数码为:94537
b.三字词取三字第一码+88,如:
革命家=革+命+家+88
G M J 88
其数码为46588。
c.多字词取一、二、三、末第一码+9,如:
其实不然=其+实+不+然+9
Q S B R 9
其数码为77279。
人才交流中收=人+才+交+心+9
R C J X 9
其编码为72599。
d.外来词按码直接输入,不足5码部分全以1补足。
有一部分词语我们习惯以英文表示,如:电子邮件、亚太经合组织、世贸组织、中央电视台等,分别以EMAI、APEC、WTO、CCTV等表示。在数码中直接映射,不足部分补1。它们的编码分别是:36241、27321、98611、22881等。
由以上规定可知,字的编码第5位、第6位只能是“2、3、4、5、6”,而词的编码的第5位则只能是“1、7、8、9”,所以字词互不交叉。
标点符号系统用1表示,它们是:,。:;“”‘’、!《》<>()……——
该数码一级简码字8个,二级简码字64个,三级简码字约600个,四级简码字约2500个,五级字约3000个。
该数码以“0”为翻页键,以选择相同编码的词组。以“*”为查询键。
由于手机上的数字键直接刻上了英文26个字母,所以使用此数码时,不用思考,见字知码。这样手机就拥有了完全意义上的快速通信功能。手机持有者就会找到一种在电脑上输入汉字的那种感觉。
Claims (7)
1、一种用汉字及偏旁部首读音编码的汉字输入方法,其特征在于将单个汉字拆分成第一构件、第二构件和末构件三个部分,构件取新华字典中规定的全体偏旁部首,依次取整字、第一构件、第二构件和末构件的读音首字母或取第一构件、第二构件、末构件和整字的读音首字母对汉字编码,并将该编码对应的汉字图形信息存储在计算机中,在标有英文字母的键盘上按编码顺序输入相对应的字母,通过计算机处理显示相应的汉字;所述偏旁部首和键盘键位的对应关系如下:
A 鱼魚
B 比白贝貝鼻卜髟八丷勹疒豸宀冖
C 厂车車虫赤齿齒辰臣寸艹屮疋
D 丶冫氵灬大斗門刀刂豆歹
E 二儿耳阝卩
F 方父缶风風采攵夂犭
G 工广革鬼骨瓜谷弓戈艮
巛
H 一户火禾黑虍
I 水氺
J 几见見己巳斤巾角臼金钅釒丬爿纟糹糸
廴豕隹
K 口囗匚冂凵
L 力立龙里老鹿卤鹵
耒亠彐互聿肀
M 木门門马馬毛母毋米矛麻麦麥皿黾黽
目殳
N 女牛鸟鳥廾
O 月
P 丿彡片皮
Q 其欠青气犬支
R 人入亻彳日曰
S 丨亅罒礻石示尸矢舌身食饣鼠
T 十士土田扌厶
U 手
V 山
W 王文瓦韦韋
X 心西覀血夕辛穴小忄
Y 又用衣雨业页頁言羊音羽幺酉弋讠言衤尢
Z 乙止自走足子孑竹舟爪爫辶。
2、根据权利要求1所述的汉字输入方法,其特征在于所述末构件不存在时用汉字的末笔画,将汉字笔画分为“一、丨、/、丶、乙”五种,并在键盘上取相应的五个键作为识别码。
3、根据权利要求1所述的汉字输入方法,其特征在于所述构件按大优先原则,即同一位置有多个构件以笔画多的优先。
4、根据权利要求2所述的汉字输入方法,其特征在于五种笔画对应的识别码分别为“H”、“S”、“P”、“D”、“Z”;“`”
为生字替代码;“;”为组合字读音替代码。
5、一种按权利要求1或2或3或4所述方法用于手机或数字键盘的汉字信息处理方法,其特征在于依次取整字、第一构件、第二构件、末构件的读音首字母所对应的数字和次末笔画、末笔画所对应的数字,或依次取第一构件、第二构件、末构件、整字的读音首字母所对应的数字和次末笔画、末笔画所对应的的数字对汉字编码;其笔画分为“一、丨、/、丶、乙”五种,并在手机或数字键盘上取对应的数字键;所述字母在手机上与数字键对应如下:2-ABC、3-DEF、4-GHI、5-JKL、6-MNO、7-PQRS、8-TUV、9-WXYZ;在数字键盘上与数字键的对应如下:1-ABC、2-DEF、3-GHI、4-JKL、5-MNO、6-PQR、7-STU、8-VWX、9-YZ;汉字的偏旁部首和键盘键位的对应关系如下:
A 鱼魚
B 比白贝貝鼻卜髟八丷勹疒豸宀冖
C 厂车車虫赤齿齒辰臣寸艹屮疋
D 丶冫氵灬大斗門刀刂豆歹
E 二儿耳阝卩
F 方父缶风風采攵夂犭
H 一户火禾黑虍
I 水氺
J 几见見己巳斤巾角臼金钅釒丬爿纟糹糸
廴豕隹
K 口囗匚冂凵
L 力立龙里老鹿卤鹵
耒亠彐互聿肀
M 木门門马馬毛母毋米矛麻麦麥皿黾黽
目殳
N 女牛鸟鳥廾
O 月
P 丿彡片皮
Q 其欠青气犬支
R 人入亻彳日曰
S 丨亅罒礻石示尸矢舌身食饣鼠
T 十士土田扌厶
U 手
V 山
W 王文瓦韦韋
X 心西覀血夕辛穴小忄
Y 又用衣雨业页頁言羊音羽幺酉弋讠言衤尢
Z 乙止自走足子孑竹舟爪爫辶。
6、根据权利要求5所述的汉字信息处理方法,其特征在于五种笔画按上述顺序对应的数字键在手机上为2、3、4、5、6;在数字键盘上为1、2、3、4、5。
7、根据权利要求6所述的汉字信息处理方法,其特征在于两字词组按每字的前两码加上7取码;三字词组按每字的第一码加上88取码;多字词组按前三字及末位字的首码加上9取码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02106359 CN1267807C (zh) | 2002-03-01 | 2002-03-01 | 一种用汉字及部首读音编码的汉字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02106359 CN1267807C (zh) | 2002-03-01 | 2002-03-01 | 一种用汉字及部首读音编码的汉字输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1420424A CN1420424A (zh) | 2003-05-28 |
CN1267807C true CN1267807C (zh) | 2006-08-02 |
Family
ID=4740210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 02106359 Expired - Fee Related CN1267807C (zh) | 2002-03-01 | 2002-03-01 | 一种用汉字及部首读音编码的汉字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1267807C (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1808355A (zh) * | 2006-02-06 | 2006-07-26 | 于翔 | 中文谐音输入法 |
CN101957658A (zh) * | 2009-07-16 | 2011-01-26 | 李永庚 | 一种电脑汉字音位码快速输入法及其键盘 |
CN104346375B (zh) | 2013-07-31 | 2017-10-13 | 北大方正集团有限公司 | 一种制作中间字库的方法以及装置 |
CN105528090B (zh) * | 2015-10-21 | 2018-03-23 | 冷志海 | 一种形音联想汉字输入法 |
-
2002
- 2002-03-01 CN CN 02106359 patent/CN1267807C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1420424A (zh) | 2003-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1267807C (zh) | 一种用汉字及部首读音编码的汉字输入方法 | |
CN100337181C (zh) | 一种汉字编码数字小键盘输入法 | |
CN100339806C (zh) | 汉字三码输入法 | |
CN1105963C (zh) | 一种计算机汉字输入法 | |
CN1282917C (zh) | 汉字位码手写输入法 | |
CN1249566C (zh) | 新华码汉字输入法 | |
CN1029432C (zh) | 汉字二部数码计算机汉字输入方法 | |
CN1279427C (zh) | 多维汉字编码输入法 | |
CN1109289C (zh) | 汉字形声偏旁泛字根结构的码元编码输入方法 | |
CN1056006C (zh) | 汉字编码输入方法 | |
CN1042018A (zh) | 拼音文字型汉字编码及键盘 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN1162766C (zh) | 一种汉字音形编码输入方法 | |
CN1052314C (zh) | 一种汉字二维数码的计算机键盘输入方法 | |
CN1082216A (zh) | 快三码无重码兼容拼音输入的汉字字词编码方法及键盘 | |
CN1170213C (zh) | 音形码汉字输入方法 | |
CN1114145C (zh) | 汉字属性分类码输入法 | |
CN1023669C (zh) | 一种字元拼形计算机中文输入法 | |
CN1269010C (zh) | 汉字位码键盘输入法 | |
CN1120190A (zh) | 粤音代形汉字计算机输入方法 | |
CN1456964A (zh) | 形声字计算机汉字输入方法 | |
CN1151426C (zh) | 数码汉字电脑输入法 | |
CN1224280A (zh) | 汉字表形快码计算机输入方法及其键盘 | |
CN1347024A (zh) | 拼音简化字繁体字通用的自然读成码输入法 | |
CN1151046A (zh) | 一种服从用户拆分的笔序形码汉字信息处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20060802 Termination date: 20100301 |