CN1077546A - 汉字自然分割编码法 - Google Patents

汉字自然分割编码法 Download PDF

Info

Publication number
CN1077546A
CN1077546A CN 92111125 CN92111125A CN1077546A CN 1077546 A CN1077546 A CN 1077546A CN 92111125 CN92111125 CN 92111125 CN 92111125 A CN92111125 A CN 92111125A CN 1077546 A CN1077546 A CN 1077546A
Authority
CN
China
Prior art keywords
chinese
chinese character
word
natural
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 92111125
Other languages
English (en)
Other versions
CN1030357C (zh
Inventor
钟载传
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 92111125 priority Critical patent/CN1030357C/zh
Publication of CN1077546A publication Critical patent/CN1077546A/zh
Application granted granted Critical
Publication of CN1030357C publication Critical patent/CN1030357C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

汉字自然分割编码法把汉字按其自然单元进行 分割,并用26个拼音字母对被分割的部分标音,以组 成汉字的自然分割编码系统,用于中文信息处理技术 中。本编码系统将国标6763个汉字按其出现的频 度分设为一键字、二键字、三键字、四键字,以三键字 为主,平均码长2.7,字词并用码长可降至2左右。 本发明具有简洁、明快、科学、准确的优点。具有小学 汉语水平的人,经过短期的操练均可成为熟练的计算 机录入员。

Description

在中文信息处理技术中,汉字编码方案中主要有三类,即音码、形码、音形码,其优秀者均已获得成功,并得到比较广泛的应用。但是这些方案中各自也还存在某些不足,防碍其广泛应用。如:音码由于汉字的同音字多,需要用数字键进行选择,使录入速度受到限期,对专业操作人员来说自不可取。形码由于设定的部件多,需专门训练才能掌握,使广大非专业操作人员望而生畏,只好求其次而用音码录入。音形码由于汉字读音千变万化,即使汉语水平较高的人也难免常有差错,拆字也需要一定的熟悉过程。
汉字自然分割编码法,,在分析上述方案的优缺点之后,设计出一种基于传统汉字书写。发音规则,符合现行汉语拼音原则并可在普通西文字母键盘上运作的新型汉字编码方案。本发明具有简洁、明快、科学、准确的优点。具有小学汉语水平的人,经过短期的操练,均可成为熟练的计算机录入员。
本发明将汉字分解为专用偏旁、借用偏旁、常用汉字、生僻汉字几部分。
1.专用偏旁(部首)与一般字典用的偏旁(部首)相同,共189个并注以相应的声码,如表1,另增加4个专用偏旁:L=
Figure 921111258_IMG1
J=亅 N=
Figure 921111258_IMG2
Z=
2.借用偏旁,从整体汉字中取出某些常用部件作为借用偏旁(部首),并以其汉字标音。如Q=(青字头)Q= (齐字底),如表2。
3.常用汉字。
4.生僻汉字,依每人的水平不等而不同,如表3供参考。
汉字自然分割编码法的规则
1.分割汉字时,从左到右,从上到下,先中间后两边,笔画不间断,依次进行,然后对被分割出来的偏旁(部首)和汉字进行标音,韵母字只标第一韵母,声韵母字只标声母不标韵母,以键盘字母I.U.V分别代替汉字拼音声母ZH.CH.SH。
2.A为增码,用于区分重码,如人、八、入,己、已、巳,力、刀、均为两键重码,通过一键码和二键码区别以后仍然存在重码,可借增码A于以区别:人P    八PN    入PNA;己Q
Figure 921111258_IMG4
Figure 921111258_IMG5
已QL    巳QLA;力ZP    刀ZPA。
3.多音字以其声母在拼音字母表上的先后顺序,取其前者,如长为CH或ZH,重为CH或ZH,均取CH(U),曾为C或Z,取C。
4.分割汉字时,取大优先,先取整字,不成整字取偏旁(部首),不是偏旁(部首)取笔画。
5.专用偏旁用在部首时,一律不分割,如矢,辛、音、舌、均不能分割。
6.两部件字首部件可以分割时,只能分出二画以上的部件,取大优先,不能分出单画,如别的首部件另可分出力,剥的首部件录可分出水,但矜的首部件矛不可分割。
7.两部件字后部件可分割时,取大优先。如肤的后部件夫可分出大,不能分出人。
8.三部件字,前二部件不分割,末部件一般也不分,遇重码时则需要分割,如磊为VVVK。
9.多部件字各部件均不分割。
10.二字词组由两个字的前二码组成。
11.三字词组由三个字的首码再加增码A组成。
12.四字词组由每个字的首码组成。
13.多字词由前三个字和最末一个字的首码组成。
汉字自然分割编码法的应用举例
一.单笔画构成字
1.一笔画字用一个字母编码:一H    乙Z
2.两笔画字用两个字母编码:八PN    卜ID    七HL    九PZ    十HI    儿PL    刀ZP    又ZN    了ZJ
3.三笔画字用三个字母编码:工HIH    口IZH    弓ZHZ    马ZZH    女LPH
二.两部件构成字
1.前为偏旁(部首)后为整字,整字不再分:王HT    月OE    风JY    文WY    方DW    斗LV    户DV
2.前为偏旁(部首)后为整字,整字可再分:再(一冉土)HRT    丙(一内人)HNR    抬(扌台口)VTK    持(扌寺寸)VSC    拾(扌合口)VHK    药(艹约勺)CYV    菇(艹姑古)CGG
3.前为整字后为偏旁(部首)整字不可再分:忘(亡心)WX    划(戈刂)GD    顿(屯页贝)TYB
4.前为整字后为偏旁,整字可再分:都(者日阝)IRE    别(另力刂)LLD    剥(录水刂)LVD    恩(因大心)YDX
5.前后为汉字均可分:斜(余禾斗十)YHDV    煲(保呆火人)BDHR    哿(加口可口)JKKK
三.三部件构成字
前两部件不分,末部件可分:碍(石旦寸)VDC    品(口口口)KKK    辫(辛纟辛)XSX    陛(阝比土)EBT    瘪(疒自仑匕)BZLB    殿(尸共殳又)VGVY
四.多部件构成字
各部件均不分割:鄙(口十回阝)KVHE    德(彳十四一心)RVSH    兜(匚白匚儿)QBQE
五.词组
1.两字词组:国家(OYBV)思想(TXXM)角度(DYGN)
2.三字词组:体育场(RYTA)红楼梦(SMLA)计算机(YIMA)
3.四字词组:克服困难(VYOY)责无旁贷(QHPD环境保护(WTRV)
4.多字词组:宁夏回族自治区(BHOQ)汉字自然分割编码系统(SBPS)
汉字自然分割系统的功能
汉字自然分割系统具有检字、识字、正音、正字、录入五种功能。
1.检字。汉字经过自然分割编码处理后,可按其编码排列顺序,为汉字部首检字提供了一种科学而简便的手段,可用于字典和文献资料的编排。
2.识字。汉字自然分割编码法的特征在于自然分割,对编码的汉字不需要整体认识,只需要认识被分割的部件即可,而且汉字具有连续可分性,当分割的汉字仍然不认识时,可进行再分割,因此无论多么复杂的汉字,只要用自然分割的原则处理下去,总是可以认识的。
如“揪”可分为扌、秋,而秋可再分为禾、火,禾可分丿、木,火可分八、人等等。
3.正音。汉字有大量的形声字,但是也有许多不规则的汉字发音,如将唾读垂、茸读耳、绽读定、臀读殿、芮读内就是大错。使用汉字自然分割编码系统通过屏幕显示能纠正错误的读音。
4.正字。汉字是世界上最难书写的文字之一,正确书写就更加困难。汉字自然分割法是将复杂的汉字分割为多个简单的汉字部件,无疑这对掌握汉字的整体结构是大有裨益的。
如派、旅二字很多人写不好,就是对构成它的部件缺少分析,如果将两个字的末部件氏分出来,并借用氏字的读音,这两个字的书写就正确无误了。
5.录入。汉字自然分割编码法是最符合中国的语言传统的,作为录入手段,它使用的笔顺,偏旁(部首)和读音都是顺其自然的,其推广使用,必将对提高人们的汉语,汉字水平产生积极的影响。

Claims (7)

1、汉字自然分割编码法,系根据汉字的特点,除一笔字外,任何汉字均可分割为偏傍、整体汉字,并具有发声或意义的几个部分,利用汉字26个拼音字母对被分割的部分(一笔字作为一个部分)进行标音,以组成汉字的自然分割编码系统。
2、汉字自然分割编码法,遵循汉字书写的自然规律,即从左到右,从上到下,先中间后两边,笔画不间断等原则,对汉字进行分割。对已分割的汉字还可进行再分割以满足汉字编码的需要。
3、汉字自然分割编码法,遵循汉字拼音的规定,对被分割出来的偏旁和汉字进行标音,韵母字只标第一韵母,声韵母字只标声母不标韵母。以键盘字母I.U.V分别代替汉字拼音声母ZH.CH.SH。
4、汉字自然分割编码法,以国标GB-2312(80)为依据,将其6763个汉字分设为一键字、二键字、三键字、四键字。根据汉字出现的频度,一级字在先二级字在后。
5、根据上述权力要求1-4,汉字自然分割编码系统对汉语词组:二字词、三字词、四字词、多字词采用自然分割编码方式,实现词汇和汉字的编码共容。
6、鉴于简体汉字和繁体汉字结构上的差异,汉字自然分割编码法分别建立简体字编码系统和繁体字编码系统。
7、汉字自然分割编码系统使用国际通用键盘,适用于大、中、小、微型中文信息处理计算机、汉字电传机、汉字电脑打字机、汉字终端机。
CN 92111125 1992-10-05 1992-10-05 汉字自然分割计算机键盘输入法 Expired - Fee Related CN1030357C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 92111125 CN1030357C (zh) 1992-10-05 1992-10-05 汉字自然分割计算机键盘输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 92111125 CN1030357C (zh) 1992-10-05 1992-10-05 汉字自然分割计算机键盘输入法

Publications (2)

Publication Number Publication Date
CN1077546A true CN1077546A (zh) 1993-10-20
CN1030357C CN1030357C (zh) 1995-11-22

Family

ID=4945158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 92111125 Expired - Fee Related CN1030357C (zh) 1992-10-05 1992-10-05 汉字自然分割计算机键盘输入法

Country Status (1)

Country Link
CN (1) CN1030357C (zh)

Also Published As

Publication number Publication date
CN1030357C (zh) 1995-11-22

Similar Documents

Publication Publication Date Title
CN1169041C (zh) 音形拼音汉字输入法
CN1185567C (zh) 汉字拼音添尾编码输入法
CN1077546A (zh) 汉字自然分割编码法
CN1147777C (zh) 计算机汉字输入方法
CN1257444C (zh) 计算机汉语全音输入法
CN1053049C (zh) 音数码计算机汉字输入方法
CN1125393C (zh) 利用计算机键盘汉字编码输入方法
CN1142477C (zh) 易码汉字电脑编码输入法
CN85101055A (zh) 汉字拼音编码输入法(艺峰输入法)
CN1187678C (zh) 一种以上海话发音规则输入中文汉字的方法
CN1025135C (zh) 汉字元音码计算机输入方法及键盘
CN1041465C (zh) 一种联想式简拼汉字输入方法
CN1146572A (zh) 正字法汉字编码
CN1098213A (zh) 笔数码和声形笔数码汉字输入法
CN1048341C (zh) 模糊汉字变换装置
CN1077806A (zh) 汉字阴阳双极编码及其英文键盘和单手键盘输入
Pederson Systematic phonetics
CN1360246A (zh) 汉字编码数字化及其使用方法
CN104298364A (zh) 中文字词前音编码及输入法
CN1151540A (zh) 四合一码计算机汉字编码输入法
CN1200507A (zh) 双向识别的汉字形声码
CN1153944A (zh) 汉语双拼方法
CN1096603A (zh) 新部首检字法
YANG An Introduction to the pronunciation of Chinese
CN1074296A (zh) 一种汉语声韵音位汉字编码方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee