CN1101440A - 方圆码电脑汉字输入方法 - Google Patents
方圆码电脑汉字输入方法 Download PDFInfo
- Publication number
- CN1101440A CN1101440A CN 94109223 CN94109223A CN1101440A CN 1101440 A CN1101440 A CN 1101440A CN 94109223 CN94109223 CN 94109223 CN 94109223 A CN94109223 A CN 94109223A CN 1101440 A CN1101440 A CN 1101440A
- Authority
- CN
- China
- Prior art keywords
- code
- chinese
- word
- stroke
- split
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种方圆码电脑汉字输入法,其目的
在于提供一种利用汉字内在规律确定编码部件,根据
汉字和编码部件的拼音及汉字书写顺序进行编码的
汉字输入方法:其特征在于它是以独体字、部首字、非
字部首为基本编码部件,用汉语拼音字母做部件代
码、部件代码与电脑标准键盘相对应;本发明容易记
忆、重码率低,重码字不超过3.5%。
Description
本发明涉及一种计算机汉字输入方法。
计算机汉字输入方法是计算机处理中文信息的关键,对于办公自动化、文字处理系统、企事业单位事务管理、印刷排版系统、计算机网络通讯都是必不可少的,迄今为止,各种汉字输入法已达数百种,这些汉字输入法大致可分为三类:
1、字形编码:以《五笔字型》为代表,这种编码在优选部件的基础上,将部件按笔型归类,排列在计算机键盘上,但由于部件与键盘无直接映射关系,加之规则复杂、记忆量大,只适用于专职打字员。
2、拼音编码:有《人大码》、《双拼双音字词编码》等,这种编码基本上不涉及部件,掌握容易,但缺点是重码率高。
3、音形编码:有《见字识码》、《自然码》等,这类编码多取部件自身的声母为代码,为了减少重码,又调整了一些代码,形成了许多音形分离的特殊码,给学习和使用带来了困难。
本发明的目的在于克服现有汉字输入法的不足,提供了一种以国标GB2312-80的6763个汉字的编码字集、字词输入均为等长四码,利用汉字内在规律确定编码部件,根据汉字和编码部件的拼音及汉字书写顺序进行编码的汉字输入方法。
本发明的目的可以通过以下技术方案来实现:
一种方圆码电脑汉字输入法,其特征在于它是以独体字、部首字、非字部首为基本编码部件,用汉语拼音字母做部件代码,部件代码与电脑标准键盘相对应,其编码部件见表1;
本发明所规范的独体字是指笔画相连相交的独立的笔画群(不含有外框结构的三面或四面包围的字,也拆分不出丷、ク、勹等部首),其拆分下限是:在笔画起落笔的连接处一次拆分出笔画或复笔结构后不会再是新字(不包括一),它包括所有三画以内的字。
本发明提取编码部件的代码原则为:
独体字和成字编码部件除月、虫、口、木、女、雨、尸、日、石、土、王、火只取读音声母或韵母的第一个字母作为代码(单码)外,其余取其读音声母和韵母的第一个字母作为代码(双码),但在非部首位置时,只用其首音码;单韵母字重复取前一韵母作为代码;韵母er取原形作为代码;ü行韵母前面没有声母时,取原形(不加Y)作为代码;非字部首编码部件,取其称谓读音声母或韵母的第一个字母作为代码;拆分出的(或独立的)非编码部件取“Z”作为代码;汉语拼音声母zh、ch、sh分别取V、I、U作为代码,韵母i、o、ü、u分别取Y、E、A、W作为代码。
本发明汉字拆分规则如下:
a.编码部件一律不拆分;b.相交的笔画和部件不拆分,拆分只能在笔画起落笔的连接处;c.一次拆分至少拆出一个复笔编码部件,或者是两个相连的复笔编码部件,否则不拆分;d.一个部件四面包围或三面包围的外框,如果是编码部件,框内部件只要没有与外框相交的笔画就要拆分,否则不拆分;e.拆分遵循从大、从整取码的原则。
本发明编码规则如下:
a.汉字为独体字和部首字:
汉字双码+首笔画代码+末笔画代码,
或
汉字单码+首笔画代码+次笔画代码+末笔画代码;
不足四码时,重复加末笔画代码。
b.非字部首:
非字部首代码+首笔画代码+次笔画代码+末笔画代码;
不足四码时,重复加末笔画代码。
c.汉字为合体字:
汉字首音代码+首部件双码+末部件代码;
或
汉字首音代码+首部件单码+次部件代码+末部件代码;
不足四码时,再加取末部件末笔画代码。
本发明规定遇到不知读音的汉字时,按如下规则编码:
首部件单码+次部件代码+第三个部件代码+末部件代码,
或
首部件双码+次部件代码+末部件代码;
本发明其代码与计算机键盘完全对应。
本发明具有以下优点:
1、将编码部件分为人们熟悉的独体字,成字部首和非成字部首,使整个编码部件的提取和定义有理化,更容易记忆。
2、拆分规则简单,代码提取容易,缩短了编码过程。
3、编码规则简单,代码与部件的音、形、义相连,与计算机键盘直接映射,方便了操作。
4、重码率低,重码字不超过3.5%。
下面进一步详述本发明的技术方案:
本发明以独体字、成字部首和非成字部首作为编码部件,独体字是指笔画相连相交的独立笔画群(不含有外框结构的三面或四面包围的字,也拆分不出丷、ク、勹等部首),其拆分下限是:在笔画起落笔的连接处一次拆分出笔画或复笔结构后,不会再是新字(不包括一),它包括所有三画以内的字;部首字虽不是独体形态,但在经常使用过程中,已经固化不易拆分;非字部首如草字头(艹)、三点水(氵)等。
本发明以汉语拼音字母作为代码,取码规则为:
独体字和成字编码部件除月、虫、口、木、女、雨、尸、日、石、土、王、火只取读音声母或韵母的第一个字母作为代码(单码),如:女-N、火-H;其它独体字和成字编码部件在部首时,取其读音声母和韵母的第一个字母作为代码(双码),如才-CA、大-DA,但在非部首位置时只取首音单码;单韵母字重复取前一韵母作为代码,韵母er取原形作为代码,如:耳-er;行韵母前面没有声母时取原形(不加Y)作为代码;非字部首编码部件,取其称谓读音声母或韵母的第一个字母作为代码,如:氵-S、艹-C;拆分出的(或独立的)非编码部件取“Z”作为代码,如:那,拆分出的“
”取“Z”作为代码;汉语拼音声母zh、ch、sh分别取V、I、U作为代码,韵母i、o、ü、u分别取Y、E、A、W作为代码(见表2、表3)。
汉字的拆分规则如下:
a.编码部件一律不拆分;
d.一个部件四面包围或三面包围的外框,如果是编码部件,框内部件只要没有与外框相交的笔画就要拆分,否则不拆分,如:“
”(髟的左上部),外框不是编码部件,不拆分。“函”可以拆分成“フ”+“水”+“凵”;
e.拆分遵循从大、从整取码的原则,能拆分成两个复笔编码部件的结构,不拆分成三个复笔编码部件,如:“辛”,拆分成“立”+“十”,不能拆分成“亠”+“丷”+“干”;能取笔画多的部件,不取笔画少的部件,如:“容”,可以拆分成“穴”+“人”+“口”,不能拆成“宀”+“八”+“人”+“口”;能拆分出独体字的,就要以拆分出最大的独体字为正确,如:“方”,可以拆成“丶”+“万”,不能拆成“亠”+“勹”,“午”,可拆成“丿”+“干”,不可拆成“
”+“十”。
汉字编码规则如下:
a.汉字为独体字和部首字时
汉字双码+首笔画代码+末笔画代码,
如:“上”,UA+U+H,“工”,GE+H+H;
或
汉字单码+首笔画代码+次笔画代码+末笔画代码,
如:“土”,T+H+U+H
不足四码时,重复加末笔画代码。
b.非字部首:
非字部首代码+首笔画代码+次笔画代码+末笔画代码;
如:“疒”,B+D+H+H,
不足四码时,重复加末笔画代码。
c.汉字为合体字时
汉字首音代码+首部件双码+末部件代码,
如:“界”,J+TY+U,
或
汉字首音代码+首部件单码+次部件代码+末部件代码;
如:“的”,D+P+R+U;
不足四码时,再加取末部件末笔画代码,
如:“一”,YY+H+H。
本发明中代码与计算机键盘完全对应,拼音字母与计算机键盘的对应关系见附图1。
当遇到不知读音的汉字时,按如下规则编码:
首部件单码+次部件代码+第三个部件代码+末部件代码,
如:“缟”,P+W+K+K,
或
首部件双码+次部件代码+末部件代码,
如:“竦”,LY+U+N;
输入时用计算机字母“O”键进行转换。
本发明可以用简码输入汉字字词:
a.一级简码字:
字的首音代码+空格键,
如:“一”,Y+空格,“的”,D+空格
b.二极简码字:
字的首音代码+首部件单码+空格,
如:“样”,Y+M+空格,“职”,V+E+空格
c.双音节词输入:
首字前两码+次字前两码,
如:“汉字”,HS+ZB,“工作”,GE+ZD;
d.三音节词输入:
首字首音代码+次字首音代码+末字首音代码+空格
如:“联合国”,L+H+G+空格
e.多音节词输入:
首字首音代码+次字首音代码+第三字首音代码+尾字首音代码,如:“扩大再生产”,K+D+Z+I。
Claims (7)
2、根据权利要求1所述的方圆码电脑汉字输入法,其特征在于所规范的独体字是指笔画相连相交的独立的笔画群(不含有外框结构的三面或四面包围的字,也拆分不出丷、タ、勹等部首),其拆分下限是:在笔画起落笔的连接处一次拆分出笔画或复笔结构后不会再是新字(不包括一),它包括所有三画以内的字。
3、根据权利要求1所述的方圆码电脑汉字输入法,其特征在于提取编码部件的代码规则为:
独体字和成字编码部件除月、虫、口、木、女、雨、尸、日、石、土、王、火只取读音声母或韵母的第一个字母作为代码(单码)外,其余取其读音声母和韵母的第一个字母作为代码(双码),但在非部首位置时,只用其首音码;单韵母字重复取前一韵母作为代码;韵母er取原形作为代码;ü行韵母前面没有声母时取原形(不加Y)作为代码;非字部首编码部件,取其称谓读音声母或韵母的第一个字母作为代码;拆分出的(或独立的)非编码部件取“Z”作为代码;汉语拼音声母zh、ch、sh分别取V、I、U作为代码,韵母i、o、ü、u分别取Y、E、A、W作为代码。
4、根据权利要求1、3所述的方圆码电脑汉字输入法,其特征在于将汉字的拆分规则规定如下:
a.编码部件一律不拆分;b.相交的笔画和部件不拆分,拆分只能在笔画起落笔的连接处;c.一次拆分至少拆出一个复笔编码部件,或者是两个相连的复笔编码部件,否则不拆分;d.一个部件四面包围或三面包围的外框,如果是编码部件,框内部件只要没有与外框相交的笔画就要拆分,否则不拆分;e.拆分遵循从大、从整取码的原则。
5、根据权利要求1、3、4所述的方圆码电脑汉字输入法,其特征在于它的编码规则如下:
a.汉字为独体字和部首字:
汉字双码+首笔画代码+末笔画代码,
或
汉字单码+首笔画代码+次笔画代码+末笔画代码;
不足四码时,重复加末笔画代码。
b.非字部首:
非字部首代码+首笔画代码+次笔画代码+末笔画代码;
不足四码时,重复加末笔画代码。
c.汉字为合体字:
汉字首音代码+首部件双码+末部件代码;
或
汉字首音代码+首部件单码+次部件代码+末部件代码;
不足四码时,再加取末部件末笔画代码。
6、根据权利要求1、3、4、5所述的方圆码电脑汉字输入法,其特征在于遇到不知读音的汉字时,按如下规则编码:
首部件单码+次部件代码+第三个部件代码+末部件代码,
或
首部件双码+次部件代码+末部件代码;
7、根据权利要求1、3、4、5、6所述的方圆码电脑汉字输入法,其特征在于其代码与计算机键盘完全对应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN94109223A CN1047676C (zh) | 1994-08-17 | 1994-08-17 | 电脑汉字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN94109223A CN1047676C (zh) | 1994-08-17 | 1994-08-17 | 电脑汉字输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1101440A true CN1101440A (zh) | 1995-04-12 |
CN1047676C CN1047676C (zh) | 1999-12-22 |
Family
ID=5033812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN94109223A Expired - Fee Related CN1047676C (zh) | 1994-08-17 | 1994-08-17 | 电脑汉字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1047676C (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1009226B (zh) * | 1985-12-28 | 1990-08-15 | 四川省科技咨询服务中心 | 调声韵类式拼音输入键盘及输入法 |
CN87105289A (zh) * | 1987-07-31 | 1988-05-18 | 奚宇 | 汉字形音编码法 |
CN1049417A (zh) * | 1990-05-31 | 1991-02-20 | 李建平 | 新型汉字编码方法及键盘 |
-
1994
- 1994-08-17 CN CN94109223A patent/CN1047676C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1047676C (zh) | 1999-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1101440A (zh) | 方圆码电脑汉字输入方法 | |
CN1243277A (zh) | 一种可用数字键盘输入的汉字输入方法及键盘 | |
CN1054219C (zh) | 一种汉语拼音输入法及其键盘 | |
CN1059281C (zh) | 汉字声韵调三拼音形编码输入方法 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN1220931C (zh) | 音形数码汉字输入法 | |
CN1293448C (zh) | 十笔数码输入法 | |
CN1107899C (zh) | 计算机四角汉字输入法 | |
CN1140867C (zh) | 中文汉字三码输入法 | |
CN1244855C (zh) | 中文信息处理汉字数字化规范编码输入技术 | |
CN1142474C (zh) | 字典码汉字输入法 | |
CN1059969C (zh) | “音调形”汉字编码输入方法 | |
CN1008837B (zh) | 在小键盘上用声韵声声输入汉字的方法 | |
CN1215859A (zh) | 部音码 | |
CN1118013C (zh) | 11笔字型数字码汉字输入方法 | |
CN1207648C (zh) | 五三码及其键盘 | |
CN1073723C (zh) | 一种基于构形的汉字键盘输入法 | |
CN1244671A (zh) | 数符汉字编码输入法及键盘 | |
CN1100288C (zh) | 四笔序音计算机汉字键盘输入方法 | |
CN1153339A (zh) | 汉字“中华之声”码计算机键盘输入法 | |
CN1704878A (zh) | 新方码 | |
CN1120406C (zh) | 计算机汉字部首输入方法 | |
CN1088210C (zh) | 六区五位汉语音节和汉字键盘输入方法 | |
CN1173661A (zh) | 元码汉字计算机输入方法 | |
CN1347024A (zh) | 拼音简化字繁体字通用的自然读成码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |