CN1030357C - 汉字自然分割计算机键盘输入法 - Google Patents
汉字自然分割计算机键盘输入法 Download PDFInfo
- Publication number
- CN1030357C CN1030357C CN 92111125 CN92111125A CN1030357C CN 1030357 C CN1030357 C CN 1030357C CN 92111125 CN92111125 CN 92111125 CN 92111125 A CN92111125 A CN 92111125A CN 1030357 C CN1030357 C CN 1030357C
- Authority
- CN
- China
- Prior art keywords
- word
- parts
- female
- radical
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
汉字自然分割编码法把汉字按其自然单元进行分割,并用26个拼音字母对被分割的部分标音,以组成汉字的自然分割编码系统,用于中文信息处理技术中。本编码系统将国标6763个汉字按其出现的频度分设为一键字,二键字,三键字,四键字,以三键字为主,平均码长2.7,字词并用码长可降至2左右。本发明具有简洁、明快、科学、准确的优点。具有小学汉语水平的人,经过短期的操练均可成为熟练的计算机录入员。
Description
在中文信息处理技术中,汉字编码方案中主要有三类,即音码、形码、音形码,其优秀者均已获得成功,并得到比较广泛的应用。但是这些方案中各自也还存在某些不足,防碍其广泛应用。如:音码由于汉字的同音字多,需要用数字键进行选择,使录入速度受到限期,对专业操作人员来说自不可取。形码由于设定的部件多,需专门训练才能掌握,使广大非专业操作人员望而生畏,只好求其次而用音码录入。音形码由于汉字读音千变万化,即使汉语水平较高的人也难免常有差错,拆字也需要一定的熟悉过程。
汉字自然分割编码法,在分析上述方案的优缺点之后,设计出一种基于传统汉字书写。发音规则,符合现行汉语拼音原则并可在普通西文字母键盘上运作的新型汉字编码方案。本发明具有简洁、明快、科学、准确的优点。具有小学汉语水平的人,经过短期的操练,均可成为熟练的计算机录入员。
本发明将汉字分解为专用偏旁、借用偏旁、常用汉字、生僻汉字几部分。
3.常用汉字。
4.生僻汉字,依每人的水平不等而不同,如表3供参考。
汉字自然分割计算机键盘输入法的规则
1.分割汉字时,从左到右,从上到下,先中间后两边,笔画不间断,依次进行,然后对被分割出来的偏旁(部首)和汉字进行标音,韵母字只标第一韵母,声韵母字只标声母不标韵母,以键盘字母I.U.V分别代替汉字拼音声母ZH.CH.SH。
2.A为增码,用于区分重码,如人、八、入,己、已、巳,力、刀、均为两键重码,通过一键码和二键码区别以后仍然存在重码,可借增码A于
以区别:人P八PN入PNA;已Q(表1,表2,表3见文后)
已QL巳QLA;力ZP刀ZPA。
3.多音字以其声母在拼音字母表上的先后顺序,取其前者,如长为CH或ZH,重为CH或ZH,均取CH(U),曾为C或Z,取C。
4.分割汉字时,取大优先,先取整字,不成整字取偏旁(部首),不是偏旁(部首)取笔画。
5.专用偏旁用在部首时,一律不分割,知矢、辛、音、舌、均不能分割。
6.两部件字首部件可以分割时,只能分出二画以上的部件,取大优先,不能分出单画,如别的首部件另可分出力,剥的首部件录可分出水,但矜的首部件矛不可分割。
7.两部件字后部件可分割时,取大优先。如肤的后部件夫可分出大,不能分出人。
8.三部件字,前二部件不分割,末部件一般也不分,遇重码时则需要分割,如磊为VVVK。
9.多部件字各部件均不分割。
10.二字词组由两个字的前二码组成。
11.三字词组由三个字的首码再加增码A组成。
12.四字词组由每个字的首码组成。
13.多字词由前三个字和最末一个字的首码组成。
汉字自然分割计算机键盘输入法的应用例
一.单笔画构成字
1.一笔画字用一个字母编码:一H乙Z
2.两笔画字用两个字母编码:八PN卜ID七HL九PZ十HI儿PL刀ZP又ZN了ZJ
3.三笔画字用三个字母编码:工HIH 口IZH 弓ZHZ 马ZZH 女LPH
二.两部件构成字
1.前为偏旁(部首)后为整字,整字不再分:王HT 月OE 风JY 文WY 方DW 斗LV 户DV
2.前为偏旁(部首)后为整字,整字可再分:再(一冉土)HRT 丙(一内人)HNR 抬(扌台口)VTK 持(扌寺寸)VSC 拾(扌合口)VHK 药(艹约勺)CYV 菇(艹姑古)CGG
3.前为整字后为偏旁(部首)整字不可再分:忘(亡心)WX 划(戈刂)GD 顿(屯页贝)TYB
4.前为整字后为偏旁,整字可再分:都(者日阝)IRE 别(另力刂)LLD 剥(录水刂)LVD 恩(因大心)YDX
5.前后为汉字均可分:斜(余禾斗十)YHDV 煲(保呆火人)BDHR 哿(加口可口)JKKK
三.三部件构成字
前两部件不分,末部件可分:碍(石旦寸)VDC 品(口口口)KKK 辫(辛纟辛)XSX 陛(阝比土)EBT 瘪(疒自化匕)BZLB 殿(尸共殳又)VGVY
四.多部件构成字
各部件均不分割:鄙(口十回阝)KVHE 德(彳十四一心)RVSH 兜(匚白匚儿)QBQE
五.词组
1.两字词组:国家(OYBV)思想(TXXM)角度(DYGN)
2.三字词组:体育场(RYTA)红楼梦(SMLA)计算机(YIMA)
3.四字词组:克服困难(VYOY)责无旁贷(QHPD)环境保护(WTRV)
4.多字词组:宁夏回族自治区(BHOQ)汉字自然分割编码系统(SBPS)
汉字自然分割系统的功能
汉字自然分割系统具有检字、识字、正音、正字、录入五种功能。
1.检字。汉字经过自然分割编码处理后,可按其编码排列顺序,为汉字部首检字提供了一种科学而简便的手段,可用于字典和文献资料的编排。
2.识字。汉字自然分割编码法的特征在于自然分割,对编码的汉字不需要整体认识,只需要认识被分割的部件即可,而且汉字具有连续可分性,当分割的汉字仍然不认识时,可进行再分割,因此无论多么复杂的汉字,只要用自然分割的原则处理下去,总是可以认识的。
如“揪”可分为扌、秋,而秋可再分为禾、火,禾可分丿、木,火可分八、人等等。
3.正音。汉字有大量的形声字,但是也有许多不规则的汉字发音,如将唾液垂、茸读耳、绽读定、臀读殿、芮读内就是大错。使用汉字自然分割编码系统通过屏幕显示能纠正错误的读音。
4.正字。汉字是世界上最难书写的文字之一,正确书写就更加困难。汉字自然分割法是将复杂的
汉字分割为多个简单的汉字部件,无疑这对掌握汉字的整体结构是大有裨益的。
如派、旅二字很多人写不好,就是对构成它的部件缺少分析,如果将两个字的末部件氏分出来,并借用氏字的读音,这两个字的书写就正确无误了。
5.录入。汉字自然分割编码法是最符合中国的语言传统的,作为录入手段,它使用的笔顺,偏旁(部首)和读音都是顺其自然的,其推广使用,必将对提高人们的汉语,汉字水平产生积极的影响。
表1
A 无偏旁(部首)作增码用 N
廿女牛鸟
B 卜八勹冖宀比贝白疒鼻 O 冂口凵
C 艹寸采 P 丿彡丬爿歺疋皮
E 二儿彐卩阝屮耳 R 亻人彳日曰入
F 父夫丰风缶 S 厶巳氵纟幺灬四
G 工广巛弓戈古瓜谷艮革鬼骨 T 土田
H 一火户禾虍黑 U 厂车臣虫赤辰齿
I 丨巾支舟豸隹 V 十土扌山饣尸手殳礻石矢舌豕身鼠
J 几廴已见斤钅臼角 W 亠攵文攵王韦瓦
K 口 X 小夕忄心穴西血辛
L 冫力龙立耒老卤里鹿 Y 讠又尢弋月业衤页羽酉音羊雨肀聿
M 门马木毛毋母目皿矛米麦黾麻 Z 乙孑子辶足自走
表2
部件 所指部位 联想名称 代码 部件 所指部位 联想名称 代码
青 月字以上 青字头 Q 齐 文字以下 齐字底 Q
前 月刂以上 前字头 Q 春 日字以上 春字头 U
哀 口字以下 哀字底 A 畏 一字以下 哀字底 A
块 土字右边 块字旁 K 载 车字以上 载字头 Z
刺 刺字左边 刺字旁 C 眉 目字以上 眉字头 M
党 口字以上 党字头 D 祭 示字以上 祭字头 J
老 匕字以上 老字头 L 左 工字以上 左字头 Z
滴 滴字右边 滴字旁 D 择 择字右边 择字旁 Z
监 皿字以上 监字头 J 坚 土字以上 坚字头 J
副 副字左边 副字旁 F 骏 马字右边 骏字旁 J
表3
汉字 同音汉字 汉字拼音 代码 汉字 同音汉字 汉字拼音 代码
衮 滚 gun G 呙 锅 guo G
曷 和 he H 奂 换 huan H
敫 缴 jiao J 戋 间 jian J
冗 - rong R 黍 暑 shu V
乇 托 tuo T 彖 - tuan T
佥 签 qian Q 舛 喘 chuan U
厶 私 si S 堇 紧 jin J
殳 书 shu V 爻 义 yi Y
甾 灾 zai Z 囟 信 Xin X
贲 奔 ben B 隹 zhui I
Claims (2)
1、一种计算机使用的汉字输入方法,利用标准西文键盘,其特征在于以重新定义的26个汉语拼音字母为码元,字的输入编码是根据汉字具有的连续可分性特点,对汉字进行多层次的‘自然分割’,再将分出的偏旁和成字(国标范围内的成字)的拼音首母按顺序排列组合而成,其中:
1).一笔画字不分割;
2).两部件字分为A,B两部分;
3).三部件字分为A,B,C三部分;
4).四部件字分为A,B,C,D四部分;
5).首部件A为成字,字的末尾可以分出两画以上的偏旁或成字时,按取大优先的原则,分出A1,排在A之后,编码为A,A1,B;
6).末部件为B或C时,按取大优先的原则,逐次分出偏旁或成字:B1,B2或C1,排在B或C之后,编码为A,B,B1,B2或A,B,C.C1。
所述输入方法包括:
1).一笔画字:将该字读音的首母输入键盘;
2).两部件字:a.输入首部件的首母A;b.输入第二部件的首母B;c.输入从第二部件中分出的偏旁或成字的首母B1;d.输入从c步分出的偏旁或成字的首母B2。
或当第一部件为成字,可以分出两画以上的偏旁或成字时:a.输入第一部件的首母A,b.输入从第一部件中分出的两画以上的偏旁或成字的首母A1,c.输入第二部件的首母B,d.输入从第二部件中分出的偏旁或成字的首母B1;
3).三部件字:a.输入第一部件的首母A,b.输入第二部件的首母B,c.输入第三部件的首母C,d.输入从第三部件中分出的偏旁或成字的首母Cl;
4).四部件字:a.输入第一部件的首母A;b.输入第二部件的首母;c.输入第三部件的首母C,d.输入第四部件的首母D。
调的输入编码:二字词取词中字的前两码,三字词取词中字的首码再加增码A,四字词取词中字的首码组成。
2、根据权利要求1,所述汉字输入法,其特征在于以1代表拼音声母ZH,以U代表拼音声母CH,以V代表拼音声母SH。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92111125 CN1030357C (zh) | 1992-10-05 | 1992-10-05 | 汉字自然分割计算机键盘输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92111125 CN1030357C (zh) | 1992-10-05 | 1992-10-05 | 汉字自然分割计算机键盘输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1077546A CN1077546A (zh) | 1993-10-20 |
CN1030357C true CN1030357C (zh) | 1995-11-22 |
Family
ID=4945158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 92111125 Expired - Fee Related CN1030357C (zh) | 1992-10-05 | 1992-10-05 | 汉字自然分割计算机键盘输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1030357C (zh) |
-
1992
- 1992-10-05 CN CN 92111125 patent/CN1030357C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1077546A (zh) | 1993-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105938402B (zh) | 一种声形码汉字输入法及键盘 | |
CN1030357C (zh) | 汉字自然分割计算机键盘输入法 | |
CN1169041C (zh) | 音形拼音汉字输入法 | |
CN1147777C (zh) | 计算机汉字输入方法 | |
CN1117309C (zh) | 一种拼音汉字编码的输入法 | |
CN1028680C (zh) | 汉字全息码 | |
CN1020386C (zh) | 结构笔画四位数编码法及键盘 | |
CN1048342C (zh) | 首母码汉字输入法 | |
CN1242314C (zh) | 现代汉语音文输入法 | |
CN1028806C (zh) | 一种汉字计算机输入方法及其键盘 | |
CN1103181A (zh) | 多键并击式高速汉字输入方法及键盘装置 | |
CN1514336A (zh) | 华语拉丁字信息码汉字输入方法 | |
CN1142477C (zh) | 易码汉字电脑编码输入法 | |
CN1055554C (zh) | 字根拼形规范码汉字输入方法 | |
CN1056007C (zh) | 一种以汉字音角特征为信息元的计算机汉字输入方法 | |
CN1155873C (zh) | 一种用基础部件的拼音进行编码的数字键汉字输入法 | |
CN1125393C (zh) | 利用计算机键盘汉字编码输入方法 | |
CN1036620C (zh) | 一种综合码计算机汉字输入方法 | |
CN1208709C (zh) | 一种使用拼音编码在计算机大键盘输入汉字的方法 | |
CN1026829C (zh) | 中文头尾码输入法及其键盘装置 | |
CN1139867C (zh) | 新音形简易速录码汉字输入法 | |
CN1162144A (zh) | 神韵码中文输入法及其键盘 | |
CN1023669C (zh) | 一种字元拼形计算机中文输入法 | |
CN1269007C (zh) | 笔删式触控键盘中文音象全功能输入装置 | |
CN1146572A (zh) | 正字法汉字编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |