CN1105765A - 一种汉字信息处理系统 - Google Patents
一种汉字信息处理系统 Download PDFInfo
- Publication number
- CN1105765A CN1105765A CN 94111739 CN94111739A CN1105765A CN 1105765 A CN1105765 A CN 1105765A CN 94111739 CN94111739 CN 94111739 CN 94111739 A CN94111739 A CN 94111739A CN 1105765 A CN1105765 A CN 1105765A
- Authority
- CN
- China
- Prior art keywords
- key
- chinese character
- chinese
- word
- keyboard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明《一种汉字信息处理系统》涉及汉字编码
及其所用的键盘,是一种采用数字编码、适合单手操
作、便于学习掌握、能够高速输入及降低硬件造价的
能使中国人普遍使用的键盘输入汉字信息处理技
术。它由优选的176个字根和对应的码值;严格遵
照“书写笔序”、“大根优先”、依次取汉字首1—4码等
编码规则;12个数字输入码和键盘有机组合构成。
能对GB2312-80的全部汉字、字符及词语进行编
码,根据编码敲击本发明键盘的12个数字键,就能把
汉字、字符及词语传输到计算机、电话及类似器件。
Description
本发明《一种汉字信息处理系统》涉及汉字编码及其所用的键盘,是一种采用数字编码、适合单手操作、便于学习掌握、能够高速输入及降低硬件造价的为电脑、电话及类似器件的开发应用、推动电脑进入家庭,适合汉文化国情的键盘输入的汉字信息处理技术。
目前,键盘输入汉字编码方案已达数百种之多,这个现象说明了汉字编码的重要性和复杂性。尤其是国内,键盘输入汉字编码技术的输入速度已超过了西文的键盘输入速度,特别是中国专利CN85104343汉字编码技术的推广应用成绩卓著,这是近十多年来汉字编码技术创造发明的可喜成果。
但是,绝大多数汉字编码方案都以(英文)字母为键(码),且在标准键盘上字母键的位置是以方便外国人操作而排列的,不适合汉文化的国情。这就给普及使用带来了困难,也是电脑进入家庭的一个障碍,如已在国内外广为流传的汉字编码,仍然只是在那些文化程度较高的年轻人之中使用,对于中老年人或文化程度较低(特别是不懂英文)的人使用就很困难。目前与汉语拼音有关的编码方案也很多,它们的推广使用不仅存在着使用英文字母的阻碍,而且还增加了拼音的困难,因为国人的发音是极不统一的,在普通话未普及之前,不便于在全国范围内普遍使用。
由于汉字编码的难度很大,使众多发明者不得不用较多的字母键(码)去实现编码,这是造成一般都采用26个左右的英文字母键来编码的根本原因。尽管普遍采用较多的字母键,利用达45万多个可编码空间来进行编码,仍然在性能上不尽完善,如总要取汉字末笔编码;或不依顺序取码;或词汇编码提供量较少;或GB2312-80中的682个字符没有编码,等等。
以数字键来编码,码是由数字组成的,中国人接受阿拉伯数字比接受英文字母容易,数字键在键盘上的位置也是按人们的习惯排列的,可用右手单手击键,这种取数字码、击数字键输入中文的编码技术最适合中国人使用。但是,用数字码来实现输入中文,在码长为4码的条件下,只有2万余个可以编码的空间,要对GB2312-80的7445个图形字符(其中汉字6763个)和4万个词语编出一个“单手操作”“便于学习”“普遍使用”“高速输入”的码来,其编码的难度就特别大。
例如:
用字母26键编码,约有空间:26×26×26×26=456976
用数字12键编码,约有空间:12×12×12×12=20736
456976÷20736=22
从理论上计算,则12键数字编码的难度至少要比26键字母编码的难度要大22倍。这是目前以数字键编码获得成功的方案不多见的主要原因。在可编码空间很少的难度下,使数字键编码方案性能达到完善的程度,就更加困难了。
虽然专利GK87104148.0,已采用数字键进行编码,其功能已达到实用的水平,已是不易的了,但在其某些性能上还不完善,如:汉字取1至6个码,码较长;6个码中要求取末2码,增加了视力及脑力的消耗;词码取码较长,这些问题的存在一定程度上制约了输入速度。
本发明的目的是为了适应汉文化的国情,为中国人能普遍使用,提供一种用数字键进行编码,且编码性能完善的,能将任一汉字、字符、词语准确高速的输入计算机、电话及类似器件的汉字信息处理技术。
为实现上述目的,本发明对汉字根进行了分析研究,初选了300多个根,并用这300多个根对GB2312-80的汉字及字符进行全面拆分,根据每个汉字拆分数据的结果编制了计算机程序,在计算机上进行优选,依据汉字根出现的频率,挑选出了本发明的176个字根。又根据176个字根编制了确定每个字根的码值的计算机程序,在对汉字依笔序、字根取首1-4码的条件下,经计算,打印出给定各种不同字根码值的“重码清单”。再根据“重码清单”,以重码较少和重要汉字不能重码为原则,选定其最简的编码规则,最后比较合理的确定了本发明的176个字根的码值。
本发明所指的176个字根,是由笔划根52个、主根36个、次根88个组成,其字根与对应键(码)请参见说明书附图1。
本发明的取码规则总的来说是严格依照书写笔序、大根优先的规则对汉字及词语进行取码,其具体取码规则为:
(1)字码规则:
①依书写笔序、字根,大根优先,取首1-4码。
例:龙=一丿乚丿=14-4
②首3旁3。
大于3码的‘字’或‘笔划不可分割的构件’在字首或为旁,只取3码;第4码取紧接着该‘字’或‘构件’的字根的码。
例:犁=禾刂 牛=0.30
(‘利’字在首,只取3码;牛=01,只取1码。)
飘=西示丿×=2124(票为旁,取3码,接着取丿)
③点为5,角点为0。
不论多少点连续写码为5,汉字或部件右角上的点码为0。
犬=一人、=190 厌=厂一人、=0190
④在一个汉字中,取完一个构件;紧接着又是一个全同的构件,该构件只取一码。
例:昌=日 日=616 晶=日 日 日=6166
⑤汉字字符中的数字,码为数字本码。
例:语=讠五口=-56
⑥高频字作字根使用。
例:提=扌 是=166 匙=是乚丿=66-4(“是”为高频字)
高频字与键的对应关系为:
失53 的55 是66 在12 为65 民76
得-3 到18 不11 都56 很-4 长64
这-- 还41 更30 应05 地45 和00 或16
(2)词码规则:
两字词每字取首2码,四字词取前三字首码及末字首2码,三,五,六字词每字取首1码,七字以上词取前五字及末字的首码。
例:计算=-044
计算机=-47
科学技术=04170
第一生产力=410-4
中国人民银行=6597.4
中华人民共和国=6997.5
科学技术是第一生产力=041764
(3)分《一、二级取码》:
一级取码:记忆本发明的全部字根(共176个)对汉字、字符及词语取码。
二级取码:只用本发明的笔划根52个、主根36个(共88个)对汉字、字符及词语取码。
一、二级取码的规则是完全相同的,仅是记忆字根的多少不同。一级取码可供各行各业普遍使用;二级取码以方便非专业录入员学习和使用。学过二级取码的人,可轻松的进入一级取码。
本发明的键盘为16个键,其键位分布排列,请参见说明书附图2。
图中有12个输入键:123456789-0.和1个字结束键、1个词结束键、1个删除键、1个控制键,各键的位置、排列为:12个数字输入键从上往下横排列为123 456 789 -0.;纵排列为147- 2580 369.,1个字结束键在12个输入键的右上侧,1个词结束键在12个输入键的左下侧,1个删除键在12个输入键的左上侧,1个控制键在12个输入键的右下侧。
图中各键的主要功能为:
①123456789-0.为输入键。
②删除键:为删除输入时的错误。
③控制键:为汉字信息处理的转换、控制开关。
本发明是一个完整的方案,具有明显的技术效果:
由于本发明通过分析、计算,优选了字根和字根对应的码值,提高了字根的质量,使其在编码性能完善的条件下,把码长缩短为1-4码,终于突破了“采用数字键编码制约输入速度”的难关,达到能高速输入的目的,这是本发明的创造性贡献。
例1:(与GK87104148.0比较)
输=车人一“月”刂
05 9 2 74
=059274(GK87104148.0取为6码,要取末笔)
输=车人一“月刂”
20 9 1
=2091(本发明取为4码,不取末笔)
(注:“”中的根为不取部分)
汉字=氵 又 宀 了=375145
3 75 14 5
(GK87104148.0双字词取为6码)
汉字=氵又宀子=3245(本发明双字词取为4码)
3 2 4 5
计算机=讠十木丿=004474
0 0 44 7 4(GK87104148.0三字词取为6码)
计算机=讠木=-47(本发明三字词取为3码)
- 4 7
此例说明,本发明比现有技术GK87104148.0的码长短,减少了“手”击键的次数,则击键速度得以提高。
例2:(与字母键编码方案比较)
本发明输入汉字最大取4个数字码,每击一个键是从12个中找1个,击键为:
12+12+12+12=48个“思维点”
而26个字母键编码输入汉字同样取4个码,每击一个键是从26个中找1个,击键为:
26+26+26+26=104个“思维点”
此例用“思维点”来计算击键时大脑思维走过的长度,在同样击4键的条件下,则本发明的思维量比字母键编码的思维量要小1倍以上。经以上计算,从“脑力劳动”的角度证明本发明具有高速击键的优点。
除击键速度以外,取码的快慢也决定着输入的速度,本发明的取码规则,严格遵照“书写笔序”、“大根优先”、尤其是“依次取首”、“不取末笔码”的规则有别于现有数字编码技术,减轻了视力及脑力的消耗,比现有技术更为简化,则取码更为快速;为了使取码的脑力劳动尽可能减小,达到加快取码速度的目的,还采取了以下特殊的技术:①在确定88个次根的码值上,采取了次根的首码或首2码的码值可以用基根、主根来描写,例如,王=15=一土(“一”是基根码为1;“土”是主根码为5),这类型的次根约20个。②采用了字形类似的根,码值相同的技术,以便记忆和取码,尤其是对于手写体汉字取码中的辨认极为有利,例如,礻=衤=22、戈=弋=戋=
=04等,这类型的根约60个。③汉字和该字的旁同码,例如,牛=
、食=饣等。④高频字作字根用。例如,提=扌是=166、匙=是乚丿=66-4等(“是”为高频字,码=66)。这些技术的采用,使本发明要求的“记忆”能充分发挥其使用的效果,使任何汉字构件的码值没有二意性,使编码性能更为完善,使本发明更具有特色。
另外,在实现编码的软件上,本发明是采用12个数字键,可用2字节内码编写软件,可节省集成块字节的用量,将使固化本发明的硬件成本降低,为电脑进入家庭及类似器件的开发应用提供一种低造价、能普遍推广使用的技术。
本发明的键盘,最适合中国人使用。这种键盘输入键的排列符合人们的习惯,从上往下横排列为123;456;789;-0.,纵排列为147-;2580;369.,这种输入键排列分布便于人们记忆,便于眼睛脱离键盘击键,减少了学习的时间。
这种键盘无需“指法”说明,只要把右手往键盘上一放,大指就对准了‘词结束键’;食指就对准了147-;中指就对准了2580;四指就对准了369.;小指就对准了字结束键,十分方便右手击键,而且人们的右手很灵活,在使用本发明时则可很快的获得击键的高速度。
本发明键盘的12个输入键“123456789-0.”与现有计算机标准键盘的“右手小键盘”相似,本发明通过C语言编制的专用软件,把本发明与计算机结合起来,其构成的技术效果比现有技术更具有单手操作、便于学习、普遍使用、高速输入及降低硬件造价等优点。
本发明键盘与现有的有线电话、无线电话的按键一致,通过C语言编制的专用软件固化制成的芯片,把本发明与现有电话设备联系起来,构成一种完整的汉字信息处理和传输的技术方案,实现有线电话、无线电话的汉字信息处理及传输。比现有电话更具有特殊的效果,增加了一种便于中国人使用的汉字通讯功能,在通话的准确性、大大节省对话线路的时间等,具有其优越性。
Claims (3)
1、一种汉字信息处理系统,它利用汉字编码通过键盘向计算机输入汉字信息,其特征在于:
1).选择笔划根52个、主根36个、次根88,共176个字根;
2).将上述176个字根分别指令到键盘-.0123456789的数字键上,对应关系如下:
笔划根与键的对应关系:
键:-.0 1 2 3 4 5 6 7 8 9
主根与键的对应关系:
键:- . 0 1 2 3 4 5 6 7 8 9
根:讠 止 十 心 又 氵 火 了 口 木 月 人
女
厂 扌 × 水 土 予 入
钅 广 甲 氺 士
癶
次根与键的对应关系:
1- 10 2- 2. 20 21 22 24 3- 31 33 34 37 38 39 4.0 44 46
5- 5. 59 6- 65 69 7- 7. 70 73 74 77 78 79
口 走 气 比
由 音 已 彐 皮 身 羽 天 马
8- 8. 80 81 85 87 89 9- 9.90 91 99 99
3).利用上述键盘的相应键位依次输入汉字汉字信息的代码。
2、根据权利要求1所述的一种汉字信息处理系统,其特征在于汉字信息的取码规则有汉字取码规则和词语取码规则:
汉字取码规则:
①依笔序、字根,大根优先,取首1-4码;
②首3旁3;
③点为5,角点为0;
④在一个汉字中,取完一个构件;紧接着又是一个全同的构件,该构件只取1码;
⑤汉字字符中的数字,码与该数字相同;
⑥高频字作为字根使用;
高频字与键的对应关系为:
失53 的55 是66 在12 为65 民76
得-3 到18 不11 都56 很-4 长64
这-- 还41 更30 应05 地45 和00 或16
3、根据权利要求1所述的一种汉字信息处理系统,其特征在于键盘由16个键组成,其中12个输入键:123456789-0.和1个字结束键、1个词结束键、1个删除键、1个控制键,其键位分布排列的方式是:12个数字输入键从上往下横排列为123456789-0.;纵排列为147-2580369.,1个字结束键在12个输入键的右上侧,1个词结束键在12个输入键的左下侧,1个删除键在12个输入键的左上侧,1个控制键在12个输入键的右下侧。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 94111739 CN1105765A (zh) | 1994-04-29 | 1994-04-29 | 一种汉字信息处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 94111739 CN1105765A (zh) | 1994-04-29 | 1994-04-29 | 一种汉字信息处理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1105765A true CN1105765A (zh) | 1995-07-26 |
Family
ID=5035576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 94111739 Pending CN1105765A (zh) | 1994-04-29 | 1994-04-29 | 一种汉字信息处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1105765A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1052549C (zh) * | 1996-05-04 | 2000-05-17 | 张正国 | 基于字元的小键盘汉字输入方法 |
-
1994
- 1994-04-29 CN CN 94111739 patent/CN1105765A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1052549C (zh) * | 1996-05-04 | 2000-05-17 | 张正国 | 基于字元的小键盘汉字输入方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1047447C (zh) | 实虚笔形编码计算输入法 | |
CN1105765A (zh) | 一种汉字信息处理系统 | |
CN1020386C (zh) | 结构笔画四位数编码法及键盘 | |
CN1435749A (zh) | 汉字笔音码输入法及键盘 | |
CN1315026C (zh) | 一种数码汉字输入法 | |
CN102043469A (zh) | 两笔型三维数码输入法及其键盘 | |
CN1139867C (zh) | 新音形简易速录码汉字输入法 | |
CN1553305A (zh) | 声形四码汉字计算机输入方法 | |
CN1150441C (zh) | 字形笔顺码汉字输入法及其键盘 | |
CN1055167C (zh) | 汉字部首笔顺码的输入方法 | |
CN1119740C (zh) | 首尾特征码汉字计算机键盘输入法 | |
CN1170213C (zh) | 音形码汉字输入方法 | |
CN1082216A (zh) | 快三码无重码兼容拼音输入的汉字字词编码方法及键盘 | |
CN1155873C (zh) | 一种用基础部件的拼音进行编码的数字键汉字输入法 | |
CN1162766C (zh) | 一种汉字音形编码输入方法 | |
CN1054448C (zh) | 一种汉字形母码输入方法 | |
CN1293451C (zh) | 三击形音汉字输入法 | |
CN1123817C (zh) | 一种汉字输入法 | |
CN1067476C (zh) | 九三码汉字输入方法及键盘 | |
CN1558310A (zh) | 汉字辅元音形码输入法 | |
CN1120406C (zh) | 计算机汉字部首输入方法 | |
CN1773432A (zh) | U码汉字输入法 | |
CN1097515A (zh) | 傻瓜型普及码汉字输入法及其键盘 | |
CN1068947C (zh) | 一种形声及形形结合的计算机汉字输入方法 | |
CN1159639C (zh) | 基于四角号码和字根的汉字输入法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |