CN101290547A

CN101290547A - 计算机汉字输入法

Info

Publication number: CN101290547A
Application number: CNA2008100287966A
Authority: CN
Inventors: 刘烈裕
Original assignee: Individual
Current assignee: Individual
Priority date: 2008-06-16
Filing date: 2008-06-16
Publication date: 2008-10-22

Abstract

本发明涉及计算机汉字输入法，它公开了该计算机汉字输入法以汉字的音、义、调相结合用28个拉丁字母作为汉字代码，将汉语拼音方案中的每个汉字含1－6个拼音字母缩减为每个汉字只含1－4个拉丁字母代码，使包括汉语大字典中5万6千个单字及汉语大词典中的37万个词组实现每个汉字的编码长度不超过四个字母，而且无重码，同时能输入简体、繁体、异体三种不同的字体。

Description

计算机汉字输入法

技术领域

本发明涉及一种计算机汉字输入方法，特别是计算机汉字全息编码输入法。

背景技术

现有的汉字输入法主要分为两类：一类是以汉字读音特征为主要编码依据的音码输入法，另一类是以汉字的字形特征为主要编码依据的形码输入。音码输入与形码输入法的共同不足之处是重码多，造成输入速度慢，而且不能输入简体，繁体，异体三种不同的字体。

发明内容

本发明的目的是提供一种计算机汉字输入法以解决现有汉字输入法重码多，不能输入简体、繁体、异体三种不同的字形的问题。

本发明的技术解决方案是：将汉字看成是由代码组成，输入汉字时，先将汉字的读音、类别、声调通过规定的方法转换成读音代码、类别代码、声调代码，将得出的代码按照先后顺序排列组成汉字编码，最后通过输入汉字编码的方式将汉字输入计算机；

一、用26个小写拉丁字母i、w、u、b、p、m、f、d、t、n、l、j、q、x、g、k、h、a、o、e、r、z、c、s、v、y和两个大写拉丁字母D、N共28个拉丁字母作为汉字代码。

二、28个拉丁字母在不同位置的作用

(1)、排在第一位和第二位时作为读音代码，其中排在第一位时i、w、u对应汉语拼音的韵母，其他拉丁字母对应汉语拼音的声母；排在第二位时y仅作隔音字母用，m除组成hm、nm、mm外，仅作隔音字母用，其他拉丁字母对应汉语拼音的韵母。

①、汉语拼音的声母与28个拉丁字母汉字代码的对应关系：

汉语拼音：b、 p、 m、 f、 d、 t、 n、 l、 g、 k、 h、 j、 q

玻、坡、模、佛、得、特、讷、勒、哥、科、喝、基、欺

| | | | | | | | | | | | |

拉丁字母：b、 p、 m、 f、 d、 t、 n、 l、 g、 k、 h、 j、 q

汉语拼音：x、 zh、ch、sh、r、 z、 c、 s、 d、 t、 n、 l

希、知、蚩、诗、日、资、雌、思、得、特、讷、勒

| | | | | | | | | | | |

拉丁字母：x、 a、 o、 e、 r、 z、 c、 s、 D、 v、 N、 y

②、汉语拼音的韵母与28个拉丁字母汉字代码的对应关系：

汉语拼音：a、 o、 e、 ê、ai、ei、ao、ou、an、en、ang

阿、喔、鹅、诶、哀、欸、熬、欧、安、恩、昂

| | | | | | | | | | |

拉丁字母：a、 o、 e、 m、 l、 t、 q、 b、 j、 n、 h

汉语拼音：eng、i、 ia、ie、iao、iou、ian、in、iang、ing

亨、衣、呀、耶、腰、忧、烟、因、央、英

| | | | | | | | | |

拉丁字母：x、 I c、 k、 s、 p、 f、 d、 z、 r

汉语拼音：u、 ua、uo、uai、ui、uan、un、uang、ueng、ong

uei uen

乌、蛙、窝、歪、威、弯温、汪、翁、轰

| | | | | | | | | |

拉丁字母：w、 c、 k、 s、 p、 f、 d、 z、 r、 g

汉语拼音：ü、iong、üe、üan、ün

迂、雍、约、冤、晕

| | | | |

拉丁字母：u、 g、 D、 v、 n、

③、汉语拼音的6个独立音节与拉丁字母汉字代码的对应关系：

汉语拼音：hm、hng、m、 n、 ng、er

噷、哼、母、唔、嗯二

| | | | | |

拉丁字母：hm、hg、 mm、nm、ng、er

(2)、排在第三位时作为类别代码，表示汉字的类别，以区分同音字。

将《说文解字》中所记载的540个部首和○、一、亍、弋、亡、勾、爿、丐、天、父、卅、母、坤、艮、圭、光、更、免、其、果、南、殸、第、無、频、學26个部首共566个部首分成24类，每类都用两种字来代表，拉丁字母表示代码，汉字表示类别；只有一个拉丁字母、两个拉丁字母代码的汉字不设类别代码。

代码类别部首

I 衣衫巾，市，冃，网，糹，衣，系，

帛，素，黹，丝，裘，履

w 禽鸟

隹，烏，鳥，奞，萑，雔，燕，瞿，雥

u 风雨ㄑ，巜，冫

川(巛)，水，气，永，

雨，

泉，風，雲，瀕，灥

b 珍宝玉，貝，金，圭，珏

p 毛皮

卂，毛，皮，羽，

飛，革，髟，習，須，毳

m 昆虫巴，它，虫，卵，

蟲

f 人事

勹，卜，

冖，

丂，厶，

工，干，云，比，攴，欠，不，予，丐，毋，丮

壬，包，示，夰，立，襾，冎，厽，

采，

更，克，免，放，隶，叕，非，臥，亯(享)，耑，苟，舁，畗，桀，竝，殺，奢，教，率，菐

辟，嗇，稽，學，

d 地理冂，山，土，止，丹，井，田，

石，丘，氐，北，

(堆)，西，屾，艮，坤邑，谷，東，京，阜，垚，南，畕，堇，嵬，

t 走兽彑(彐)，犬，牛，羊，虍，豕，豸，兔，

虎，

馬，能，莧，豚，鹿，

象，廌，鼠，熊，

嘼，

羴，麤

n 人物人，儿

子，女，士，父，王，夫，从，氏，

丐，兄，民，母，后，众，

臣，男，弟，我，巫，酋，孨，辡

l 花木丩，

才，屮

乇，木，

丰，禾，术，

艸，竹，叒，束，束，林，果，

秝，丵，

麻，

桼，第，

舜，華，黍，

蓐

j 交通廴，夂，

彳，亍，爻，去，夲，舟，至，行，

交，車，走，

步，

來，

q 身体力，尸，心，亢，

血，肉，劦，有，囟，身，

(颐)，呂，克，

思，首，

骨，

(脊)，惢，筋，频

x 房屋厂，广，宀，户，穴，囱(窗)，

宫，

巢，

g 兵器刀，刃，弓，戈，殳，矢，予，戊，

弦，盾

k 五官口

牙，只，号，可，司，

目，耳，吅，舌，自，見，

谷，告，品，眉，苜，

哭，員，

喜，鼻，

齒

h 器物厶，匕，匚，几，弋，丌，勺，爿，片，瓦，皿，卮，宁，缶，耒，臼，豆，

甾，

鬲，壶，鼎，

箕，

a 饮食旡瓜，甘，米，尗，旨，酉，

皂，食，香，韭，

瓠，

鹽

o 多用

(上)，凵，入，小，大，

(下)，幺，口，寸，

丸，支，尺，斤，方，冄，勾，币，犬(夭)，斗，正，出，用，半，疋，卉，

多，共，

曲，

里，

亞，長，

面，重，高，異，壹，

無(劣)，會，

○，一，二，三，四，五，六，七，八，九，十，卅

e 手足

又，艹

手，爪，

癶，左，

尾，角，足，

r 天文甲，乙，丙，丁，戊，己，庚，辛，壬，癸，丑，寅，卯，辰，巳，午，未，申，戌，亥，夕，

，日，月，火，天，旦，光，先，易，炎，明

是，

冥，晶，焱，爨

z 鱼龙魚，黽，龍，

c 文史一，

丶，

亅

匕，卩，了，乃，亏，之，彡，文，日，兮，勿，白，

古，史，且，句，印，玄，

聿，亦，而，此，色，赤，言，彣，彔，其，青，壴，音，豈，黄，殸，琴，畫，黑，鼓，龠

s 祸福亡，歹

凶，生，老，疒，死，危，舛，韋，

鬼

D 地理冂，山，土，止，丹，井，田，

石，丘，氐，北，

(堆)，西，屾，艮，坤

邑，谷，東，京，阜，垚，南，畕，堇，嵬，

v 走兽彑(彐)，犬，牛，

羊，虍，豕，豸，兔，

虎，

馬，能，莧，豚，鹿，

象，廌，鼠，熊，

嘼，

，羴，麤

N 人物人，儿

子，女，士，父，王，夫，从，氏，

丐，兄，民，母，后，众，

臣，男，弟，我，巫，酋，孨，辡

y 花木丩，

才，屮乇，木，

丰，禾，术，

，艸，竹，叒，束，束，林，

果，

秝，丵，

麻，

桼，第，

舜，華，黍，

蓐。

(3)、排在第四位时表示声调代码，以区分同音字，其中：

g、j、N、q、s、w表示阴平(一)，

a、h、m、n、p、v、y、z表示阳平(/)，

D、e、k、L、o、u表示上声(v)，

b、c、d、f、i、r、t、x表示去声(丶)，

黑点“·”表示轻音。

只有一个拉丁字母、两个拉丁字母、三个拉丁字母代码的汉字不设声调代码。

三、汉字的编码方法：当给一个汉字编码时，先查出该汉字的汉语拼音，再查出该汉语拼音的声母对应的读音代码、韵母对应的读音代码；其次查出该汉字的部首在分类表中的分类代码；再次在声调表中查出该汉字的汉语拼音的声调代码；最后按声母代码、韵母代码、分类代码、声调代码的顺序组成该汉字的编码并输入计算机。

四、词组编码规则

词组编码取第一个字和最后一个字的第一、第二代码，遇到重码再取最后一个字的第三、第四代码，没有第二、第三、第四代码的字，就向前取码到没有重码时止，如果还有重码就在编码后面加一个“·”符号来区别。

五、词组编码缩写

多个汉字组成的词组先取其每两个字的第一、第二代码组成该词组的一次编码，再从一次编码中取每四个字的第一、第二代码组成该词组的二次编码，以此类推直至只有四个代码的编码，并在该编码的后面加一个缩写次数的数字。

本发明的优点是以汉字的音、形、义、调相结合用28个拉丁字母组成汉字代码，将汉语拼音方案中的每个汉字含1-6个拼音字母的拼音方法缩减为每个汉字只含1-2个拼音字母，使包括汉语大字典中5万6千个单字及汉语大词典中的37万个词组实现每个汉字的编码长度不超过四个字母，而且无重码，同时能输入简体、繁体、异体三种不同的字体。

具体实施方式

例一：从键盘上输入“汗”字

第一步查出该字的汉语拼音方案中的读音“hàn”，根据该读音在声母对应表中查出“h”的声母代码为“h”；在韵母对应表中查出“an”的韵母代码为“j”；第二步在分类表中根据“汗”字的部首属于风雨类，查出风雨类的代码为“u”；第三步在声调表中，查出去声的代码是“i”；将“h、j、u、i”按先后顺序键入计算机，就可输入“汗”字。

例二：从键盘上输入“得”字

按例一的方法，其编码是dej·。

例三：从键盘上输入简体、繁体、异体三种字体的汉字：

按例一的方法，输入某一汉字的主体字，计算机上就显示出三种字体，在字体的右方显示1、2、3的数字，其中1为简体字，2为繁体字，3为异体字，选择什么数字键就能输入什么字体字。

如输入汉字“处”字，其繁体字为“處”，异体字为“処”，输入主体字的编码后，处1、處2、処3同时出现，需要那个字体字就按那个数字键。按“2”键就可输入“處”字。

例四：输入数字“玖”字：

该字的汉语拼音的读音为“jiou”(j iu)，“j”的声母代码为“j”，“iou”的韵母代码为“p”；将“j、p”按先后顺序键入计算机，就可输入“玖、九、9”字，并在字体的右方显示1、2、3的数字，选择数字键就能输入该数字对应的汉字。省掉分类代码和声调代码。

例五：输入词组

(1)日出：其中“日”字的编码是ri，“出”字的编码是ow，“日出”的编码是riow。

(2)中华民族：其中“中”字的编码是ag，“华”字的编码是hc，“民”字的编码是md，“族”字的编码是zwc，“中华民族”的编码是agzw。

例六：输入多汉字词组

输入词组“意志坚定发展科学”，其一次编码为iu aiq jfo dr fa ajfo kexe，缩写后的二次编码为iuai jfdr faaj kexe；缩写后的三次编码为iujf fake；缩写后的四次编码为iufa4。

例七：输入邮政地址

将邮政地址中的省、市、县、镇等汉字省去，按地址中汉字的顺序输入每个汉字的第一代码，每个地址取5个代码：

(1)从键盘上输入“广东省南海市黄岐镇”：“广”字取第一码g，“东”字取第一码d，“南”字取第一码n，“海”字取第一码h，“黄”字取第一码h，其邮政地址编码为gdnhh。

(2)广州市光孝路：其邮政地址编码为gagxy。

例八：“不能”的编码为：bwnx “不能不”的编码为bwnx/。

“不可”的编码为：bwke “不可不”的编码为bwke/。

Claims

1、计算机汉字输入法，其特征是将汉字看成是由代码组成，输入汉字时，先将汉字的读音、类别、声调通过规定的方法转换成读音代码、类别代码、声调代码，将得出的代码按照先后顺序排列组成汉字编码，最后通过输入汉字编码的方式将汉字输入计算机；

一、用26个小写拉丁字母i、w、u、b、p、m、f、d、t、n、l、j、q、x、g、k、h、a、o、e、r、z、c、s、v、y和两个大写拉丁字母D、N共28个拉丁字母作为汉字代码；

二、28个拉丁字母在不同位置的作用：

(1)、排在第一位和第二位时作为读音代码，其中排在第一位时i、w、u对应汉语拼音的韵母，其他拉丁字母对应汉语拼音的声母；排在第二位时y仅作隔音字母用，m除组成hm、nm、mm外，仅作隔音字母用，其他拉丁字母对应汉语拼音的韵母；

①、汉语拼音的声母与28个拉丁字母汉字代码的对应关系：

汉语拼音：b、p、m、f、d、t、n、l、g、k、h、j、q

玻、坡、模、佛、得、特、讷、勒、哥、科、喝、基、欺

| | | | | | | | | | | | |

拉丁字母：b、p、m、f、d、t、n、l、g、k、h、j、q

汉语拼音：x、zh、ch、sh、r、z、c、s、d、t、n、l

希、知、蚩、诗、日、资、雌、思、得、特、讷、勒

| | | | | | | | | | | |

拉丁字母：x、a、o、e、r、z、c、s、D、v、N、y

②、汉语拼音的韵母与28个拉丁字母汉字代码的对应关系：

汉语拼音：a、o、e、

ai、ei、ao、ou、an、en、ang

阿、喔、鹅、诶、哀、欸、熬、欧、安、恩、昂

| | | | | | | | | | |

拉丁字母：a、o、e、m、l、t、q、b、j、n、h

汉语拼音：eng、i、ia、ie、iao、iou、ian、in、iang、ing

亨、衣、呀、耶、腰、忧、烟、因、央、英

| | | | | | | | | |

拉丁字母：x、I c、k、s、p、f、d、z、r

汉语拼音：u、ua、uo、uai、ui、uan、un、uang、ueng、ong

uei uen

乌、蛙、窝、歪、威、弯温、汪、翁、轰韵母

| | | | | | | | | |

拉丁字母：w、c、k、s、p、f、d、z、r、g

汉语拼音：ü、iong、üe、üan、ün

迂、雍、约、冤、晕

| | | | |

拉丁字母：u、g、D、v、N

汉语拼音：hm、hng、m、n、ng、er

噷、哼、呣、唔、噁二

| | | | | |

拉丁字母：hm、hg、mm、nm、ng、er

(2)、排在第三位时作为类别代码，表示汉字的类别，以区分同音字：

将《说文解字》中所记载的540个部首和○、一、亍、弋、亡、勾、爿、丐、天、父、卅、母、坤、艮、圭、光、更、免、其、果、南、殸、第、無、频、學26个部首共566个部首分成24类，每类都用两种字来代表，拉丁字母表示代码，汉字表示类别；只有一个拉丁字母、两个拉丁字母代码的汉字不设类别代码：

代码类别部首

I 衣衫巾，巿，冃，网，糹，衣，系，

，帛，素，黹，丝，裘，履

w 禽鸟

，隹，烏，鳥，奞，雈，雔，燕，瞿，雥

u 风雨ㄑ，ㄍ，冫，川，水，气，永，

雨，

泉，風，雲，濒，灥

b 珍宝玉，貝，金，圭，

p 毛皮

，卂，毛，皮，羽，秃，飛，革，髟，習，須，毳

m 昆虫巴，它，虫，卵，

蟲

f 人事乀，勹，卜，，冖，匸，丂，厶，

工，干，云，比，攴，欠，不，毌，予，丐，毋，丮，壬，包，示，夰，立，襾，冎，厽，

采，

，更，克，免，放，隶，叕，非，臥，畗，耑，苟，舁，鬥，畗，桀，竝，殺，奢，教，率，菐，

辟，

，嗇，稽，學，

d 地理冂，山，土，止，丹，井，田，屵，石，丘，氐，北，

，西，屾，艮，坤，邑，谷，東，京，阜，垚，南，畕，堇，嵬，

t 走兽彑，犬，牛，

羊，虍，豕，豸，兔，虎，

馬，能，莧，豚，鹿，象，廌，鼠，熊，

嘼，虤，羴，麤

n 人物人，儿，子，女，士，父，王，夫，从，氏，

，丐，兄，民，母，后，众，

，臣，男，弟，我，巫，酋，孨，辡

l 花木丩，ㄢ，才，屮，乇，木，

，丰，禾，术，聿，艸，竹，叒，

，束，林，

，果，秝，丵，

麻，麥，桼，第，茻，舜，華，黍，，蓐

j 交通廴，夂，攵，彳，亍，爻，去，夲，舟，至，行，，交，車，走，辵，步，

來，冓

q 身体力，尸，心，亢，血，肉，劦，有，囟，身，

呂，克，

思，首，

，骨，惢，筋，频

x 房屋厂，广，宀，户，穴，囱，門，

宫，倉，巢，

g 兵器刀，刃，弓，戈，殳，矢，予，戉，弜，

弦，盾

k 五官口，牙，只，号，可，司，

目，耳，

舌，自，見，

谷，告，品，眉，苜，

哭，員，

喜，鼻，覞，齒

h 器物厶，匕，匚，几，弋，丌，勺，爿，片，兂，瓦，皿，卮，宁，缶，耒，臼，豆，

甾，叀，鬲，壶，鼎，豊，

箕，，豐，

a 饮食旡，瓜，甘，米，尗，旨，酉，

，皂，食，香，韭，鬯，鹵，瓠，

o 多用丄，凵，入，小，大，

幺，口，寸，亼，丸，支，尺，斤，方，冄，勾，币，犬，斗，正，出，用，半，疋，多，共，幵，曲，里，皃，亞，長，臤，面，重，高，異，壹，皕，無，會，齊，○，一，二，三，四，五，六，七，八，九，十，卅

e 手足

，又，卄，手，爪，尣，

癶，左，

尾，角，足，臼

，日，月，火，天，旦，光，先，冏，易，炎，明，是，

冥，晶，焱，

z 鱼龙魚，黽，龍，

c 文史一，丨，丶，丿，，乚，亅，匕，卩，了，乃，亏，之，彡，文，曰，兮，勿，白，

古，史，且，句，印，玄，

聿，亦，而，此，色，赤，言，彣，彔，其，青，壴，音，豈，黄，殸，琴，畫，黑，鼓，誩，龠

s 祸福亡，歹，凶，生，老，疒，死，危，舛，韋，

，鬼

v 走兽彑，犬，牛，

羊，虍，豕，豸，兔，

，虎，

馬，能，莧，豚，鹿，

象，廌，鼠，熊，

嘼，虤，羴，麤

N 人物人，儿，子，女，士，父，王，夫，从，氏，

，丐，兄，民，母，后，众，

臣，男，弟，我，巫，酋，孨，辡

y 花木丩，ㄢ，才，屮，乇，木，

，丰，禾，术，

艸，竹，叒，

，束，林，

，果，秝，丵，

麻，

桼，第，

舜，華，黍，

(3)、排在第四位时表示声调代码，以区分同音字，其中：

g、j、N、q、s、w表示阴平一，

a、h、m、n、p、v、y、z表示阳平/，

D、e、k、L、o、u表示上声v，

b、c、d、f、i、r、t、x表示去声丶，

黑点“·”表示轻音；

只有一个拉丁字母、两个拉丁字母、三个拉丁字母代码的汉字不设声调代码；

三、汉字的编码方法：当给一个汉字编码时，先查出该汉字的汉语拼音，再查出该汉语拼音的声母对应的读音代码、韵母对应的读音代码；其次查出该汉字的部首在分类中的分类代码；再次在声调中查出该汉字的汉语拼音的声调代码；最后将声母代码、韵母代码、分类代码、声调代码按顺序组成该汉字的编码并输入计算机；

四、词组编码规则

词组编码取第一个字和最后一个字的第一、第二代码，遇到重码再取最后一个字的第三、第四代码，没有第二、第三、第四代码的字，就向前取码到没有重码时止，如果还有重码就在编码后面加一个“·”符号来区别；

五、词组编码缩写

多个汉字组成的词组先取其每两个字的第一、第二代码组成该词组的一次编码，再从一次编码中取每四个字的第一、第二代码组成该词组的二次编码，以此类推直至只有四个代码的编码，并在该编码的后面加一缩写次数的数字。