CN1077546A - 汉字自然分割编码法 - Google Patents
汉字自然分割编码法 Download PDFInfo
- Publication number
- CN1077546A CN1077546A CN 92111125 CN92111125A CN1077546A CN 1077546 A CN1077546 A CN 1077546A CN 92111125 CN92111125 CN 92111125 CN 92111125 A CN92111125 A CN 92111125A CN 1077546 A CN1077546 A CN 1077546A
- Authority
- CN
- China
- Prior art keywords
- chinese
- chinese character
- word
- natural
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
汉字自然分割编码法把汉字按其自然单元进行
分割,并用26个拼音字母对被分割的部分标音,以组
成汉字的自然分割编码系统,用于中文信息处理技术
中。本编码系统将国标6763个汉字按其出现的频
度分设为一键字、二键字、三键字、四键字,以三键字
为主,平均码长2.7,字词并用码长可降至2左右。
本发明具有简洁、明快、科学、准确的优点。具有小学
汉语水平的人,经过短期的操练均可成为熟练的计算
机录入员。
Description
在中文信息处理技术中,汉字编码方案中主要有三类,即音码、形码、音形码,其优秀者均已获得成功,并得到比较广泛的应用。但是这些方案中各自也还存在某些不足,防碍其广泛应用。如:音码由于汉字的同音字多,需要用数字键进行选择,使录入速度受到限期,对专业操作人员来说自不可取。形码由于设定的部件多,需专门训练才能掌握,使广大非专业操作人员望而生畏,只好求其次而用音码录入。音形码由于汉字读音千变万化,即使汉语水平较高的人也难免常有差错,拆字也需要一定的熟悉过程。
汉字自然分割编码法,,在分析上述方案的优缺点之后,设计出一种基于传统汉字书写。发音规则,符合现行汉语拼音原则并可在普通西文字母键盘上运作的新型汉字编码方案。本发明具有简洁、明快、科学、准确的优点。具有小学汉语水平的人,经过短期的操练,均可成为熟练的计算机录入员。
本发明将汉字分解为专用偏旁、借用偏旁、常用汉字、生僻汉字几部分。
2.借用偏旁,从整体汉字中取出某些常用部件作为借用偏旁(部首),并以其汉字标音。如Q=(青字头)Q=
(齐字底),如表2。
3.常用汉字。
4.生僻汉字,依每人的水平不等而不同,如表3供参考。
汉字自然分割编码法的规则
1.分割汉字时,从左到右,从上到下,先中间后两边,笔画不间断,依次进行,然后对被分割出来的偏旁(部首)和汉字进行标音,韵母字只标第一韵母,声韵母字只标声母不标韵母,以键盘字母I.U.V分别代替汉字拼音声母ZH.CH.SH。
2.A为增码,用于区分重码,如人、八、入,己、已、巳,力、刀、均为两键重码,通过一键码和二键码区别以后仍然存在重码,可借增码A于以区别:人P 八PN 入PNA;己Q
已QL 巳QLA;力ZP 刀ZPA。
3.多音字以其声母在拼音字母表上的先后顺序,取其前者,如长为CH或ZH,重为CH或ZH,均取CH(U),曾为C或Z,取C。
4.分割汉字时,取大优先,先取整字,不成整字取偏旁(部首),不是偏旁(部首)取笔画。
5.专用偏旁用在部首时,一律不分割,如矢,辛、音、舌、均不能分割。
6.两部件字首部件可以分割时,只能分出二画以上的部件,取大优先,不能分出单画,如别的首部件另可分出力,剥的首部件录可分出水,但矜的首部件矛不可分割。
7.两部件字后部件可分割时,取大优先。如肤的后部件夫可分出大,不能分出人。
8.三部件字,前二部件不分割,末部件一般也不分,遇重码时则需要分割,如磊为VVVK。
9.多部件字各部件均不分割。
10.二字词组由两个字的前二码组成。
11.三字词组由三个字的首码再加增码A组成。
12.四字词组由每个字的首码组成。
13.多字词由前三个字和最末一个字的首码组成。
汉字自然分割编码法的应用举例
一.单笔画构成字
1.一笔画字用一个字母编码:一H 乙Z
2.两笔画字用两个字母编码:八PN 卜ID 七HL 九PZ 十HI 儿PL 刀ZP 又ZN 了ZJ
3.三笔画字用三个字母编码:工HIH 口IZH 弓ZHZ 马ZZH 女LPH
二.两部件构成字
1.前为偏旁(部首)后为整字,整字不再分:王HT 月OE 风JY 文WY 方DW 斗LV 户DV
2.前为偏旁(部首)后为整字,整字可再分:再(一冉土)HRT 丙(一内人)HNR 抬(扌台口)VTK 持(扌寺寸)VSC 拾(扌合口)VHK 药(艹约勺)CYV 菇(艹姑古)CGG
3.前为整字后为偏旁(部首)整字不可再分:忘(亡心)WX 划(戈刂)GD 顿(屯页贝)TYB
4.前为整字后为偏旁,整字可再分:都(者日阝)IRE 别(另力刂)LLD 剥(录水刂)LVD 恩(因大心)YDX
5.前后为汉字均可分:斜(余禾斗十)YHDV 煲(保呆火人)BDHR 哿(加口可口)JKKK
三.三部件构成字
前两部件不分,末部件可分:碍(石旦寸)VDC 品(口口口)KKK 辫(辛纟辛)XSX 陛(阝比土)EBT 瘪(疒自仑匕)BZLB 殿(尸共殳又)VGVY
四.多部件构成字
各部件均不分割:鄙(口十回阝)KVHE 德(彳十四一心)RVSH 兜(匚白匚儿)QBQE
五.词组
1.两字词组:国家(OYBV)思想(TXXM)角度(DYGN)
2.三字词组:体育场(RYTA)红楼梦(SMLA)计算机(YIMA)
3.四字词组:克服困难(VYOY)责无旁贷(QHPD环境保护(WTRV)
4.多字词组:宁夏回族自治区(BHOQ)汉字自然分割编码系统(SBPS)
汉字自然分割系统的功能
汉字自然分割系统具有检字、识字、正音、正字、录入五种功能。
1.检字。汉字经过自然分割编码处理后,可按其编码排列顺序,为汉字部首检字提供了一种科学而简便的手段,可用于字典和文献资料的编排。
2.识字。汉字自然分割编码法的特征在于自然分割,对编码的汉字不需要整体认识,只需要认识被分割的部件即可,而且汉字具有连续可分性,当分割的汉字仍然不认识时,可进行再分割,因此无论多么复杂的汉字,只要用自然分割的原则处理下去,总是可以认识的。
如“揪”可分为扌、秋,而秋可再分为禾、火,禾可分丿、木,火可分八、人等等。
3.正音。汉字有大量的形声字,但是也有许多不规则的汉字发音,如将唾读垂、茸读耳、绽读定、臀读殿、芮读内就是大错。使用汉字自然分割编码系统通过屏幕显示能纠正错误的读音。
4.正字。汉字是世界上最难书写的文字之一,正确书写就更加困难。汉字自然分割法是将复杂的汉字分割为多个简单的汉字部件,无疑这对掌握汉字的整体结构是大有裨益的。
如派、旅二字很多人写不好,就是对构成它的部件缺少分析,如果将两个字的末部件氏分出来,并借用氏字的读音,这两个字的书写就正确无误了。
5.录入。汉字自然分割编码法是最符合中国的语言传统的,作为录入手段,它使用的笔顺,偏旁(部首)和读音都是顺其自然的,其推广使用,必将对提高人们的汉语,汉字水平产生积极的影响。
Claims (7)
1、汉字自然分割编码法,系根据汉字的特点,除一笔字外,任何汉字均可分割为偏傍、整体汉字,并具有发声或意义的几个部分,利用汉字26个拼音字母对被分割的部分(一笔字作为一个部分)进行标音,以组成汉字的自然分割编码系统。
2、汉字自然分割编码法,遵循汉字书写的自然规律,即从左到右,从上到下,先中间后两边,笔画不间断等原则,对汉字进行分割。对已分割的汉字还可进行再分割以满足汉字编码的需要。
3、汉字自然分割编码法,遵循汉字拼音的规定,对被分割出来的偏旁和汉字进行标音,韵母字只标第一韵母,声韵母字只标声母不标韵母。以键盘字母I.U.V分别代替汉字拼音声母ZH.CH.SH。
4、汉字自然分割编码法,以国标GB-2312(80)为依据,将其6763个汉字分设为一键字、二键字、三键字、四键字。根据汉字出现的频度,一级字在先二级字在后。
5、根据上述权力要求1-4,汉字自然分割编码系统对汉语词组:二字词、三字词、四字词、多字词采用自然分割编码方式,实现词汇和汉字的编码共容。
6、鉴于简体汉字和繁体汉字结构上的差异,汉字自然分割编码法分别建立简体字编码系统和繁体字编码系统。
7、汉字自然分割编码系统使用国际通用键盘,适用于大、中、小、微型中文信息处理计算机、汉字电传机、汉字电脑打字机、汉字终端机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92111125 CN1030357C (zh) | 1992-10-05 | 1992-10-05 | 汉字自然分割计算机键盘输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92111125 CN1030357C (zh) | 1992-10-05 | 1992-10-05 | 汉字自然分割计算机键盘输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1077546A true CN1077546A (zh) | 1993-10-20 |
CN1030357C CN1030357C (zh) | 1995-11-22 |
Family
ID=4945158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 92111125 Expired - Fee Related CN1030357C (zh) | 1992-10-05 | 1992-10-05 | 汉字自然分割计算机键盘输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1030357C (zh) |
-
1992
- 1992-10-05 CN CN 92111125 patent/CN1030357C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1030357C (zh) | 1995-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1169041C (zh) | 音形拼音汉字输入法 | |
CN1185567C (zh) | 汉字拼音添尾编码输入法 | |
CN1077546A (zh) | 汉字自然分割编码法 | |
CN1147777C (zh) | 计算机汉字输入方法 | |
CN1257444C (zh) | 计算机汉语全音输入法 | |
CN1053049C (zh) | 音数码计算机汉字输入方法 | |
CN1125393C (zh) | 利用计算机键盘汉字编码输入方法 | |
CN1142477C (zh) | 易码汉字电脑编码输入法 | |
CN85101055A (zh) | 汉字拼音编码输入法(艺峰输入法) | |
CN1187678C (zh) | 一种以上海话发音规则输入中文汉字的方法 | |
CN1025135C (zh) | 汉字元音码计算机输入方法及键盘 | |
CN1041465C (zh) | 一种联想式简拼汉字输入方法 | |
CN1146572A (zh) | 正字法汉字编码 | |
CN1098213A (zh) | 笔数码和声形笔数码汉字输入法 | |
CN1048341C (zh) | 模糊汉字变换装置 | |
CN1077806A (zh) | 汉字阴阳双极编码及其英文键盘和单手键盘输入 | |
Pederson | Systematic phonetics | |
CN1360246A (zh) | 汉字编码数字化及其使用方法 | |
CN104298364A (zh) | 中文字词前音编码及输入法 | |
CN1151540A (zh) | 四合一码计算机汉字编码输入法 | |
CN1200507A (zh) | 双向识别的汉字形声码 | |
CN1153944A (zh) | 汉语双拼方法 | |
CN1096603A (zh) | 新部首检字法 | |
YANG | An Introduction to the pronunciation of Chinese | |
CN1074296A (zh) | 一种汉语声韵音位汉字编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |