CN1101440A

CN1101440A - 方圆码电脑汉字输入方法

Info

Publication number: CN1101440A
Application number: CN 94109223
Authority: CN
Inventors: 赵维加
Original assignee: Individual
Current assignee: Individual
Priority date: 1994-08-17
Filing date: 1994-08-17
Publication date: 1995-04-12
Anticipated expiration: 2014-08-17
Also published as: CN1047676C

Abstract

本发明涉及一种方圆码电脑汉字输入法，其目的在于提供一种利用汉字内在规律确定编码部件，根据汉字和编码部件的拼音及汉字书写顺序进行编码的汉字输入方法：其特征在于它是以独体字、部首字、非字部首为基本编码部件，用汉语拼音字母做部件代码、部件代码与电脑标准键盘相对应；本发明容易记忆、重码率低，重码字不超过3.5％。

Description

本发明涉及一种计算机汉字输入方法。

计算机汉字输入方法是计算机处理中文信息的关键，对于办公自动化、文字处理系统、企事业单位事务管理、印刷排版系统、计算机网络通讯都是必不可少的，迄今为止，各种汉字输入法已达数百种，这些汉字输入法大致可分为三类：

1、字形编码：以《五笔字型》为代表，这种编码在优选部件的基础上，将部件按笔型归类，排列在计算机键盘上，但由于部件与键盘无直接映射关系，加之规则复杂、记忆量大，只适用于专职打字员。

2、拼音编码：有《人大码》、《双拼双音字词编码》等，这种编码基本上不涉及部件，掌握容易，但缺点是重码率高。

3、音形编码：有《见字识码》、《自然码》等，这类编码多取部件自身的声母为代码，为了减少重码，又调整了一些代码，形成了许多音形分离的特殊码，给学习和使用带来了困难。

本发明的目的在于克服现有汉字输入法的不足，提供了一种以国标GB2312-80的6763个汉字的编码字集、字词输入均为等长四码，利用汉字内在规律确定编码部件，根据汉字和编码部件的拼音及汉字书写顺序进行编码的汉字输入方法。

本发明的目的可以通过以下技术方案来实现：

一种方圆码电脑汉字输入法，其特征在于它是以独体字、部首字、非字部首为基本编码部件，用汉语拼音字母做部件代码，部件代码与电脑标准键盘相对应，其编码部件见表1;

本发明所规范的独体字是指笔画相连相交的独立的笔画群（不含有外框结构的三面或四面包围的字，也拆分不出丷、ク、勹等部首），其拆分下限是：在笔画起落笔的连接处一次拆分出笔画或复笔结构后不会再是新字（不包括一），它包括所有三画以内的字。

本发明提取编码部件的代码原则为：

独体字和成字编码部件除月、虫、口、木、女、雨、尸、日、石、土、王、火只取读音声母或韵母的第一个字母作为代码（单码）外，其余取其读音声母和韵母的第一个字母作为代码（双码），但在非部首位置时，只用其首音码;单韵母字重复取前一韵母作为代码;韵母er取原形作为代码;ü行韵母前面没有声母时，取原形（不加Y）作为代码;非字部首编码部件，取其称谓读音声母或韵母的第一个字母作为代码;拆分出的（或独立的）非编码部件取“Z”作为代码;汉语拼音声母zh、ch、sh分别取V、I、U作为代码，韵母i、o、ü、u分别取Y、E、A、W作为代码。

本发明汉字拆分规则如下：

a.编码部件一律不拆分;b.相交的笔画和部件不拆分，拆分只能在笔画起落笔的连接处;c.一次拆分至少拆出一个复笔编码部件，或者是两个相连的复笔编码部件，否则不拆分;d.一个部件四面包围或三面包围的外框，如果是编码部件，框内部件只要没有与外框相交的笔画就要拆分，否则不拆分;e.拆分遵循从大、从整取码的原则。

本发明编码规则如下：

a.汉字为独体字和部首字：

汉字双码+首笔画代码+末笔画代码，

或

汉字单码+首笔画代码+次笔画代码+末笔画代码;

不足四码时，重复加末笔画代码。

b.非字部首：

非字部首代码+首笔画代码+次笔画代码+末笔画代码;

不足四码时，重复加末笔画代码。

c.汉字为合体字：

汉字首音代码+首部件双码+末部件代码;

或

汉字首音代码+首部件单码+次部件代码+末部件代码;

不足四码时，再加取末部件末笔画代码。

本发明规定遇到不知读音的汉字时，按如下规则编码：

首部件单码+次部件代码+第三个部件代码+末部件代码，

或

首部件双码+次部件代码+末部件代码;

本发明其代码与计算机键盘完全对应。

本发明具有以下优点：

1、将编码部件分为人们熟悉的独体字，成字部首和非成字部首，使整个编码部件的提取和定义有理化，更容易记忆。

2、拆分规则简单，代码提取容易，缩短了编码过程。

3、编码规则简单，代码与部件的音、形、义相连，与计算机键盘直接映射，方便了操作。

4、重码率低，重码字不超过3.5%。

下面进一步详述本发明的技术方案：

本发明以独体字、成字部首和非成字部首作为编码部件，独体字是指笔画相连相交的独立笔画群（不含有外框结构的三面或四面包围的字，也拆分不出丷、ク、勹等部首），其拆分下限是：在笔画起落笔的连接处一次拆分出笔画或复笔结构后，不会再是新字（不包括一），它包括所有三画以内的字;部首字虽不是独体形态，但在经常使用过程中，已经固化不易拆分;非字部首如草字头（艹）、三点水（氵）等。

本发明以汉语拼音字母作为代码，取码规则为：

独体字和成字编码部件除月、虫、口、木、女、雨、尸、日、石、土、王、火只取读音声母或韵母的第一个字母作为代码（单码），如：女-N、火-H;其它独体字和成字编码部件在部首时，取其读音声母和韵母的第一个字母作为代码（双码），如才-CA、大-DA，但在非部首位置时只取首音单码;单韵母字重复取前一韵母作为代码，韵母er取原形作为代码，如：耳-er;行韵母前面没有声母时取原形（不加Y）作为代码;非字部首编码部件，取其称谓读音声母或韵母的第一个字母作为代码，如：氵-S、艹-C;拆分出的（或独立的）非编码部件取“Z”作为代码，如：那，拆分出的“ ”取“Z”作为代码;汉语拼音声母zh、ch、sh分别取V、I、U作为代码，韵母i、o、ü、u分别取Y、E、A、W作为代码（见表2、表3）。

汉字的拆分规则如下：

a.编码部件一律不拆分;

b.相交的笔画和部件不拆分，拆分只能在笔画起落笔的连接处，如：“朱”只能拆分成“丿”+“未”，不能拆分成“

”+“木”;

c.一次拆分至少拆出一个复笔编码部件，或者是两个相连的复笔编码部件，否则不拆分，如：“矢”拆分成“

”+“大”，“至”拆分成“一”+“厶”+“土”;

d.一个部件四面包围或三面包围的外框，如果是编码部件，框内部件只要没有与外框相交的笔画就要拆分，否则不拆分，如：“

”（髟的左上部），外框不是编码部件，不拆分。“函”可以拆分成“フ”+“水”+“凵”;

e.拆分遵循从大、从整取码的原则，能拆分成两个复笔编码部件的结构，不拆分成三个复笔编码部件，如：“辛”，拆分成“立”+“十”，不能拆分成“亠”+“丷”+“干”;能取笔画多的部件，不取笔画少的部件，如：“容”，可以拆分成“穴”+“人”+“口”，不能拆成“宀”+“八”+“人”+“口”;能拆分出独体字的，就要以拆分出最大的独体字为正确，如：“方”，可以拆成“丶”+“万”，不能拆成“亠”+“勹”，“午”，可拆成“丿”+“干”，不可拆成“

”+“十”。

汉字编码规则如下：

a.汉字为独体字和部首字时

汉字双码+首笔画代码+末笔画代码，

如：“上”，UA+U+H，“工”，GE+H+H;

或

汉字单码+首笔画代码+次笔画代码+末笔画代码，

如：“土”，T+H+U+H

不足四码时，重复加末笔画代码。

b.非字部首：

非字部首代码+首笔画代码+次笔画代码+末笔画代码;

如：“疒”，B+D+H+H，

不足四码时，重复加末笔画代码。

c.汉字为合体字时

汉字首音代码+首部件双码+末部件代码，

如：“界”，J+TY+U，

或

汉字首音代码+首部件单码+次部件代码+末部件代码;

如：“的”，D+P+R+U;

不足四码时，再加取末部件末笔画代码，

如：“一”，YY+H+H。

本发明中代码与计算机键盘完全对应，拼音字母与计算机键盘的对应关系见附图1。

当遇到不知读音的汉字时，按如下规则编码：

首部件单码+次部件代码+第三个部件代码+末部件代码，

如：“缟”，P+W+K+K，

或

首部件双码+次部件代码+末部件代码，

如：“竦”，LY+U+N;

输入时用计算机字母“O”键进行转换。

本发明可以用简码输入汉字字词：

a.一级简码字：

字的首音代码+空格键，

如：“一”，Y+空格，“的”，D+空格

b.二极简码字：

字的首音代码+首部件单码+空格，

如：“样”，Y+M+空格，“职”，V+E+空格

c.双音节词输入：

首字前两码+次字前两码，

如：“汉字”，HS+ZB，“工作”，GE+ZD;

d.三音节词输入：

首字首音代码+次字首音代码+末字首音代码+空格

如：“联合国”，L+H+G+空格

e.多音节词输入：

首字首音代码+次字首音代码+第三字首音代码+尾字首音代码，如：“扩大再生产”，K+D+Z+I。

Claims

1、一种方圆码电脑汉字输入法，其特征在于它是以独体字、部首字、非字部首为基本编码部件，用汉语拼音字母做部件代码，部件代码与电脑标准键盘相对应，其编码部件为下表中的三种：

2、根据权利要求1所述的方圆码电脑汉字输入法，其特征在于所规范的独体字是指笔画相连相交的独立的笔画群（不含有外框结构的三面或四面包围的字，也拆分不出丷、タ、勹等部首），其拆分下限是：在笔画起落笔的连接处一次拆分出笔画或复笔结构后不会再是新字（不包括一），它包括所有三画以内的字。

3、根据权利要求1所述的方圆码电脑汉字输入法，其特征在于提取编码部件的代码规则为：

独体字和成字编码部件除月、虫、口、木、女、雨、尸、日、石、土、王、火只取读音声母或韵母的第一个字母作为代码（单码）外，其余取其读音声母和韵母的第一个字母作为代码（双码），但在非部首位置时，只用其首音码;单韵母字重复取前一韵母作为代码;韵母er取原形作为代码;ü行韵母前面没有声母时取原形（不加Y）作为代码;非字部首编码部件，取其称谓读音声母或韵母的第一个字母作为代码;拆分出的（或独立的）非编码部件取“Z”作为代码;汉语拼音声母zh、ch、sh分别取V、I、U作为代码，韵母i、o、ü、u分别取Y、E、A、W作为代码。

4、根据权利要求1、3所述的方圆码电脑汉字输入法，其特征在于将汉字的拆分规则规定如下：

5、根据权利要求1、3、4所述的方圆码电脑汉字输入法，其特征在于它的编码规则如下：

a.汉字为独体字和部首字：

汉字双码+首笔画代码+末笔画代码，

或

汉字单码+首笔画代码+次笔画代码+末笔画代码;

不足四码时，重复加末笔画代码。

b.非字部首：

非字部首代码+首笔画代码+次笔画代码+末笔画代码;

不足四码时，重复加末笔画代码。

c.汉字为合体字：

汉字首音代码+首部件双码+末部件代码;

或

汉字首音代码+首部件单码+次部件代码+末部件代码;

不足四码时，再加取末部件末笔画代码。

6、根据权利要求1、3、4、5所述的方圆码电脑汉字输入法，其特征在于遇到不知读音的汉字时，按如下规则编码：

首部件单码+次部件代码+第三个部件代码+末部件代码，

或

首部件双码+次部件代码+末部件代码;

7、根据权利要求1、3、4、5、6所述的方圆码电脑汉字输入法，其特征在于其代码与计算机键盘完全对应。