CN1445644A - 一种汉字数字化表达方法及其键盘 - Google Patents
一种汉字数字化表达方法及其键盘 Download PDFInfo
- Publication number
- CN1445644A CN1445644A CN 03130659 CN03130659A CN1445644A CN 1445644 A CN1445644 A CN 1445644A CN 03130659 CN03130659 CN 03130659 CN 03130659 A CN03130659 A CN 03130659A CN 1445644 A CN1445644 A CN 1445644A
- Authority
- CN
- China
- Prior art keywords
- code
- stroke
- parts
- character
- sign indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种汉字数字化表达方法及其键盘,属于汉字信息处理技术领域,采用0-9十个数字分别表示横、竖、撇、点、折五类单笔,和方框形、含横或竖的相交形、“八”字形、“小”字形和撇捺交叉形五类复笔,进而实现对汉字的数字化描述;对于独体字,按汉字书写顺序取其前四笔代码,不足四笔者,末位用“0”补齐四位;对于合体字,依次取汉字首部件的首码和尾码,次部件的首码和末部件的尾码;用确定首部件原则、复笔优先原则、笔画不复取原则及补“0”原则作为合体字的取码原则。本发明具有规则简单、定义明确、容易记忆、易于掌握和普及的优点。为汉字数字化和汉字信息处理开辟了新路,并为其推广普及打下基础。
Description
技术领域
本发明属于汉字信息处理技术领域,具体是一种利用0-9十个阿拉伯数字来表述汉字的方法。此方法可应用于汉字检索和汉字输入系统。
背景技术
目前用于汉字信息处理的编码方法有1000余种,但利用数字对汉字进行编码的却寥寥无几。王永民先生发明的“五笔数码”分别采用了6键6码和9键6码两种编码方法对汉字进行表述。其6键6码编码方法较为简单,但重码较多,应用价值不高;9键6码没有对单笔和复笔进行明确分类,将几种特定的汉字部件规定在几个数字上,且对汉字编码采用了不定码长的编码方案,增加了记忆量,加大了使用难度、不利于学习和普及。广西肖水清先生发明的“无理序号”采用“声韵调序”的程式输入,拼音输入本来重码就很多,其编码又用10个数字代替了21个声母和5个零声统一母,再用10个数字代替35个韵母,其重码就可想而知了,其编码的另一缺点是只有记住每一屏显示的那些序号,才能掌握这种输入法。栗兴民先生发明的“四笔号码”看似简单,但其汉字拆分方法比较复杂,也难于掌握和记忆,而且有些规则定义不严格,易产生歧义,难于推广和应用。
发明内容
本发明的目的是提供一种汉字数字化表达方法及其键盘,该方法将汉字数字化,具有规则简单、定义明确、容易记忆、易于掌握和普及的优点。
本发明的技术要点是:
一种汉字数字化表达方法及其键盘,其五类基本单笔笔形:横、竖、撇、点、折依序采用阿拉伯数字1、2、3、4、5作代码,其特征在于复笔的笔形代码及其描述为:代码“6”表示呈方框形的部件;代码“7”表示包含有横或竖的相交部件;代码“8”表示由两笔撇开构成“八”字形或“八”字变形的部件;代码“9”表示“小”字形或“小”字变形的部件;代码“0”表示由撇和捺构成的交叉部件;
将汉字划分为独体字和合体字两类,对于独体字,按汉字书写顺序取其前四笔代码,不足四笔者,末位用“0”补齐四位;对于合体字,依次取汉字首部件的首码和尾码,次部件的首码和末部件的尾码;部件的首笔形或首笔形与其他笔形的结合为首码;部件的末笔形或末笔形与其他笔形的结合为尾码;
独体字定义为:
当一汉字符合下述三种情况时,则该汉字为独体字:
1、该汉字无法按左右、左中右、上下、上中下以及全包围、半包围等六种汉字结构划分;
2、该汉字按部件拆分后,任何一个部件均非独立汉字。
3、若一汉字由一独体字加上一单笔组成,且符合上述第一种情况,则也将其视为独体字;
合体字的取码原则:
1、确定首部件原则:
本编码方案将汉字归纳为左右、左中右、上下、上中下及全
包围、半包围等六种结构,依据这六种结构对汉字进行拆分,将
含有首笔画的部分确定为首部件;
2、复笔优先原则:
在取码时,应尽可能的将部件的首末单笔结合成复笔取码;
3、笔画不复取原则:
在取码时,同一笔画不得重复被首尾码使用;
4、补“0”原则:
①当要从一个不足两码或只有一种复笔的部件取首尾码
时,首码不变,尾码用“0”补齐;
②当部件的末笔画已在首码中使用时,则尾码用“0”补
齐;
键盘上的数字键作数字代码,操作时,启动程序进入应用状态,用数字键盘检索录入。
本发明的技术效果是:规则简单、定义明确、容易记忆、易于掌握和普及。符合当今飞速发展的信息技术和“数字化地球“这一概念。汉字正在逐步走向世界,如何采用一个简单明了的表达方法实现对汉字的数字化描述,来实现VCD、DVD、移动电话、电话机、传真机及其它带有数字按键的信息家电上的汉字输入,是目前的发展方向和应解决的技术关键。
具体实施方式
将汉字笔形概括为5类单笔和5类复笔,分别用1-5和6-0十个数字作代码;将汉字划分为独体字及合体字两类,分别采用不同的规则编码。
五类单笔的笔形代码及其描述为:
代码“1”表示由左向右运笔的横;代码“2”表示由上向下运笔的竖及竖钩;代码“3”表示由右上向左下运笔的撇;代码“4”表示由左上向右下运笔的点及捺;代码“5”表示所有的折笔。
五类复笔的笔形代码及其描述为:
代码“6”表示呈方框形的部件;代码“7”表示包含有横或竖的相交部件;代码“8”表示由两笔撇开构成“八”字形或“八”字变形的部件;代码“9”表示“小”字形或“小”字变形的部件;代码“0”表示由撇和捺构成的交叉部件。
对于独体字,按汉字书写顺序取其前四笔代码,不足四笔者,末位用“0”补齐四位;
例如:
1、一画字:一=1000 乙=5000
2、二画字:二=1100 十=1200 卜=2400
3、三画字:三=1110 干=1120 才=1230
4、四画字:丰=1112 中=2512 夫=1134
5、多画字:史=2513 乖=3122 我=3121
对于合体字,依次取汉字首部件的首码和尾码,次部件的首码和末部件的尾码,当一个汉字只有两个部件时,则次部件也取首码和尾码。
例如:
教=7730 冰=8028 壁=6771 崔=2631
弼=5515 湖=4171 赢=4564 暴=6178
固=6076 囫=6033 边=5344 句=3560
合体字的取码原则是:
1、确定首部件原则:
本编码方案将汉字归纳为左右、左中右、上下、上中下及全包围、半包围等六种结构,依据这六种结构对汉字进行拆分,将含有首笔画的部分确定为首部件。例如:“治”(左右结构)的代码为4156;“做”(左中右结构)的代码为3270;“志”(上下结构)的代码为7144;“高”(上中下结构)的代码为4166;“国”(全包围结构)的代码为6014;“逐”(半包围结构)的代码为1844。
2、复笔优先原则:
在取码时,应尽可能的将部件的首末单笔结合成复笔取码。例如:“将”的代码为8234,“党”的代码为9565,“冰”的代码为8028。
3、笔画不复取原则:
在取码时,同一笔画不得重复被首尾码使用;例如:“因”的代码为6078,“肤”的代码为6174。
4、补“0”原则:
①当要从一个不足两码或只有一种复笔的部件取首尾码时,
首码不变,尾码用“0”补齐;例如:“博”的代码为7074,
“怀”的代码为9014,“艾”的代码为7200,“凶”的代码为
0060。
②当部件的末笔画已在首码中使用时,则尾码用“0”补齐;
例如:“伟”的代码为3270,“伟”的代码为3270,“纯”的
代码为5170。
本方法无需掌握词组编码规则和多级简码输入技术,同时由于编码科学合理,因此在短时间内容易学习和掌握,易于推广普及应用,而且检索录入速度快。
以本编码方案作为检字法拟被中华书局收入最新编辑出版的中华字典电子版中,并作为中华字典纸本版的补辑出版发行,为汉字数字化和汉字信息处理开辟了新路,并为其推广普及打下基础。
Claims (1)
1、一种汉字数字化表达方法及其键盘,其五类基本单笔笔形:横、竖、撇、点、折依序采用阿拉伯数字1、2、3、4、5作代码,其特征在于复笔的笔形代码及其描述为:代码“6”表示呈方框形的部件;代码“7”表示包含有横或竖的相交部件;代码“8”表示由两笔撇开构成“八”字形或“八”字变形的部件;代码“9”表示“小”字形或“小”字变形的部件;代码“0”表示由撇和捺构成的交叉部件;
将汉字划分为独体字和合体字两类,对于独体字,按汉字书写顺序取其前四笔代码,不足四笔者,末位用“0”补齐四位;对于合体字,依次取汉字首部件的首码和尾码,次部件的首码和末部件的尾码;部件的首笔形或首笔形与其他笔形的结合为首码;部件的末笔形或末笔形与其他笔形的结合为尾码;
独体字定义为:
当一汉字符合下述三种情况时,则该汉字为独体字:
(1)该汉字无法按左右、左中右、上下、上中下以及全包围、半包围等六种汉字结构划分;
(2)该汉字按部件拆分后,任何一个部件均非独立汉字。
(3)若一汉字由一独体字加上一单笔组成,且符合上述第一种情况,则也将其视为独体字;
合体字的取码原则:
(1)确定首部件原则:
本编码方案将汉字归纳为左右、左中右、上下、上中下及全包围、半包围等六种结构,依据这六种结构对汉字进行拆分,将含有首笔画的部分确定为首部件;
(2)复笔优先原则:
在取码时,应尽可能的将部件的首末单笔结合成复笔取码;
(3)笔画不复取原则:
在取码时,同一笔画不得重复被首尾码使用;
(4)补“0”原则:
①当要从一个不足两码或只有一种复笔的部件取首尾码
时,首码不变,尾码用“0”补齐;
②当部件的末笔画已在首码中使用时,则尾码用“0”补
齐;
键盘上的数字键作数字代码,操作时,启动程序进入应用状态,用数字键盘检索录入。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03130659 CN1445644A (zh) | 2003-05-03 | 2003-05-03 | 一种汉字数字化表达方法及其键盘 |
CNA2004100061961A CN1521611A (zh) | 2003-05-03 | 2004-03-08 | 一种汉字数字化编码表达方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03130659 CN1445644A (zh) | 2003-05-03 | 2003-05-03 | 一种汉字数字化表达方法及其键盘 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1445644A true CN1445644A (zh) | 2003-10-01 |
Family
ID=27815048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 03130659 Pending CN1445644A (zh) | 2003-05-03 | 2003-05-03 | 一种汉字数字化表达方法及其键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1445644A (zh) |
-
2003
- 2003-05-03 CN CN 03130659 patent/CN1445644A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1841281A (zh) | 一种手机数字编码的汉字拼音输入法 | |
CN1445644A (zh) | 一种汉字数字化表达方法及其键盘 | |
CN1869892A (zh) | 一种中文短语、短句快速输入的方法和系统 | |
CN1177271C (zh) | 四笔号码字词不重输入法及其键盘 | |
CN1349157A (zh) | 数字笔形码汉字输入法 | |
CN1534444A (zh) | 《汉字结构》输入法 | |
CN1521611A (zh) | 一种汉字数字化编码表达方法 | |
CN1425975A (zh) | 笔形数码汉字输入法 | |
CN1050273A (zh) | 无理序号数字编码法及其键盘 | |
CN1419179A (zh) | 按笔顺输入的汉字输入法及其键盘 | |
CN1142474C (zh) | 字典码汉字输入法 | |
CN1873589A (zh) | 基于音码的汉字输入方法 | |
CN86103506A (zh) | “一键双值”键盘及中外文字高速输入方法 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1141634C (zh) | 单笔画编码汉字输入法 | |
CN1208711C (zh) | 英文数码输入法 | |
CN1100288C (zh) | 四笔序音计算机汉字键盘输入方法 | |
CN1173254C (zh) | 纵横简易码输入法及其键盘 | |
CN1245678C (zh) | 拼音加补码汉字输入法 | |
CN1122911C (zh) | 汉字两次读音的简码输入方法 | |
CN1039512C (zh) | 计算机中文单笔划输入系统 | |
CN1164987C (zh) | 一种数字键汉字输入法 | |
CN1841282A (zh) | 一种手机英文数字编码输入法 | |
CN1307269A (zh) | 汉字笔顺部首双重输入系统 | |
CN1049418A (zh) | 统一码计算机汉字键盘输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |