CN1105765A - 一种汉字信息处理系统 - Google Patents

一种汉字信息处理系统 Download PDF

Info

Publication number
CN1105765A
CN1105765A CN 94111739 CN94111739A CN1105765A CN 1105765 A CN1105765 A CN 1105765A CN 94111739 CN94111739 CN 94111739 CN 94111739 A CN94111739 A CN 94111739A CN 1105765 A CN1105765 A CN 1105765A
Authority
CN
China
Prior art keywords
key
chinese character
chinese
word
keyboard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 94111739
Other languages
English (en)
Inventor
王勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 94111739 priority Critical patent/CN1105765A/zh
Publication of CN1105765A publication Critical patent/CN1105765A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明《一种汉字信息处理系统》涉及汉字编码 及其所用的键盘,是一种采用数字编码、适合单手操 作、便于学习掌握、能够高速输入及降低硬件造价的 能使中国人普遍使用的键盘输入汉字信息处理技 术。它由优选的176个字根和对应的码值;严格遵 照“书写笔序”、“大根优先”、依次取汉字首1—4码等 编码规则;12个数字输入码和键盘有机组合构成。 能对GB2312-80的全部汉字、字符及词语进行编 码,根据编码敲击本发明键盘的12个数字键,就能把 汉字、字符及词语传输到计算机、电话及类似器件。

Description

本发明《一种汉字信息处理系统》涉及汉字编码及其所用的键盘,是一种采用数字编码、适合单手操作、便于学习掌握、能够高速输入及降低硬件造价的为电脑、电话及类似器件的开发应用、推动电脑进入家庭,适合汉文化国情的键盘输入的汉字信息处理技术。
目前,键盘输入汉字编码方案已达数百种之多,这个现象说明了汉字编码的重要性和复杂性。尤其是国内,键盘输入汉字编码技术的输入速度已超过了西文的键盘输入速度,特别是中国专利CN85104343汉字编码技术的推广应用成绩卓著,这是近十多年来汉字编码技术创造发明的可喜成果。
但是,绝大多数汉字编码方案都以(英文)字母为键(码),且在标准键盘上字母键的位置是以方便外国人操作而排列的,不适合汉文化的国情。这就给普及使用带来了困难,也是电脑进入家庭的一个障碍,如已在国内外广为流传的汉字编码,仍然只是在那些文化程度较高的年轻人之中使用,对于中老年人或文化程度较低(特别是不懂英文)的人使用就很困难。目前与汉语拼音有关的编码方案也很多,它们的推广使用不仅存在着使用英文字母的阻碍,而且还增加了拼音的困难,因为国人的发音是极不统一的,在普通话未普及之前,不便于在全国范围内普遍使用。
由于汉字编码的难度很大,使众多发明者不得不用较多的字母键(码)去实现编码,这是造成一般都采用26个左右的英文字母键来编码的根本原因。尽管普遍采用较多的字母键,利用达45万多个可编码空间来进行编码,仍然在性能上不尽完善,如总要取汉字末笔编码;或不依顺序取码;或词汇编码提供量较少;或GB2312-80中的682个字符没有编码,等等。
以数字键来编码,码是由数字组成的,中国人接受阿拉伯数字比接受英文字母容易,数字键在键盘上的位置也是按人们的习惯排列的,可用右手单手击键,这种取数字码、击数字键输入中文的编码技术最适合中国人使用。但是,用数字码来实现输入中文,在码长为4码的条件下,只有2万余个可以编码的空间,要对GB2312-80的7445个图形字符(其中汉字6763个)和4万个词语编出一个“单手操作”“便于学习”“普遍使用”“高速输入”的码来,其编码的难度就特别大。
例如:
用字母26键编码,约有空间:26×26×26×26=456976
用数字12键编码,约有空间:12×12×12×12=20736
456976÷20736=22
从理论上计算,则12键数字编码的难度至少要比26键字母编码的难度要大22倍。这是目前以数字键编码获得成功的方案不多见的主要原因。在可编码空间很少的难度下,使数字键编码方案性能达到完善的程度,就更加困难了。
虽然专利GK87104148.0,已采用数字键进行编码,其功能已达到实用的水平,已是不易的了,但在其某些性能上还不完善,如:汉字取1至6个码,码较长;6个码中要求取末2码,增加了视力及脑力的消耗;词码取码较长,这些问题的存在一定程度上制约了输入速度。
本发明的目的是为了适应汉文化的国情,为中国人能普遍使用,提供一种用数字键进行编码,且编码性能完善的,能将任一汉字、字符、词语准确高速的输入计算机、电话及类似器件的汉字信息处理技术。
为实现上述目的,本发明对汉字根进行了分析研究,初选了300多个根,并用这300多个根对GB2312-80的汉字及字符进行全面拆分,根据每个汉字拆分数据的结果编制了计算机程序,在计算机上进行优选,依据汉字根出现的频率,挑选出了本发明的176个字根。又根据176个字根编制了确定每个字根的码值的计算机程序,在对汉字依笔序、字根取首1-4码的条件下,经计算,打印出给定各种不同字根码值的“重码清单”。再根据“重码清单”,以重码较少和重要汉字不能重码为原则,选定其最简的编码规则,最后比较合理的确定了本发明的176个字根的码值。
本发明所指的176个字根,是由笔划根52个、主根36个、次根88个组成,其字根与对应键(码)请参见说明书附图1。
本发明的取码规则总的来说是严格依照书写笔序、大根优先的规则对汉字及词语进行取码,其具体取码规则为:
(1)字码规则:
①依书写笔序、字根,大根优先,取首1-4码。
例:龙=一丿乚丿=14-4
例:产=亠 丿=-.4 而≠亠丷厂=-50(
Figure 941117391_IMG22
与丷相比,
Figure 941117391_IMG23
为大根,故第2码取
Figure 941117391_IMG24
=.)
②首3旁3。
大于3码的‘字’或‘笔划不可分割的构件’在字首或为旁,只取3码;第4码取紧接着该‘字’或‘构件’的字根的码。
例:犁=禾刂 牛=0.30
(‘利’字在首,只取3码;牛=01,只取1码。)
飘=西示丿×=2124(票为旁,取3码,接着取丿)
③点为5,角点为0。
不论多少点连续写码为5,汉字或部件右角上的点码为0。
例:太=一人、=195 冬=攵
Figure 941117391_IMG27
=35 煮=土白灬=58.5
犬=一人、=190  厌=厂一人、=0190
④在一个汉字中,取完一个构件;紧接着又是一个全同的构件,该构件只取一码。
例:昌=日  日=616  晶=日  日  日=6166
Figure 941117391_IMG28
⑤汉字字符中的数字,码为数字本码。
例:语=讠五口=-56
⑥高频字作字根使用。
例:提=扌 是=166  匙=是乚丿=66-4(“是”为高频字)
高频字与键的对应关系为:
失53  的55  是66  在12  为65  民76
得-3  到18  不11  都56  很-4  长64
这--  还41  更30  应05  地45  和00  或16
(2)词码规则:
两字词每字取首2码,四字词取前三字首码及末字首2码,三,五,六字词每字取首1码,七字以上词取前五字及末字的首码。
例:计算=-044
计算机=-47
科学技术=04170
第一生产力=410-4
中国人民银行=6597.4
中华人民共和国=6997.5
科学技术是第一生产力=041764
(3)分《一、二级取码》:
一级取码:记忆本发明的全部字根(共176个)对汉字、字符及词语取码。
二级取码:只用本发明的笔划根52个、主根36个(共88个)对汉字、字符及词语取码。
一、二级取码的规则是完全相同的,仅是记忆字根的多少不同。一级取码可供各行各业普遍使用;二级取码以方便非专业录入员学习和使用。学过二级取码的人,可轻松的进入一级取码。
本发明的键盘为16个键,其键位分布排列,请参见说明书附图2。
图中有12个输入键:123456789-0.和1个字结束键、1个词结束键、1个删除键、1个控制键,各键的位置、排列为:12个数字输入键从上往下横排列为123  456  789  -0.;纵排列为147- 2580  369.,1个字结束键在12个输入键的右上侧,1个词结束键在12个输入键的左下侧,1个删除键在12个输入键的左上侧,1个控制键在12个输入键的右下侧。
图中各键的主要功能为:
①123456789-0.为输入键。
②删除键:为删除输入时的错误。
③控制键:为汉字信息处理的转换、控制开关。
本发明是一个完整的方案,具有明显的技术效果:
由于本发明通过分析、计算,优选了字根和字根对应的码值,提高了字根的质量,使其在编码性能完善的条件下,把码长缩短为1-4码,终于突破了“采用数字键编码制约输入速度”的难关,达到能高速输入的目的,这是本发明的创造性贡献。
例1:(与GK87104148.0比较)
输=车人一“月”刂
05  9  2    74
=059274(GK87104148.0取为6码,要取末笔)
输=车人一“月刂”
20  9  1
=2091(本发明取为4码,不取末笔)
(注:“”中的根为不取部分)
汉字=氵 又 宀 了=375145
3 75 14 5
(GK87104148.0双字词取为6码)
汉字=氵又宀子=3245(本发明双字词取为4码)
3 2 4 5
计算机=讠十木丿=004474
0 0 44 7 4(GK87104148.0三字词取为6码)
计算机=讠木=-47(本发明三字词取为3码)
- 4 7
此例说明,本发明比现有技术GK87104148.0的码长短,减少了“手”击键的次数,则击键速度得以提高。
例2:(与字母键编码方案比较)
本发明输入汉字最大取4个数字码,每击一个键是从12个中找1个,击键为:
12+12+12+12=48个“思维点”
而26个字母键编码输入汉字同样取4个码,每击一个键是从26个中找1个,击键为:
26+26+26+26=104个“思维点”
此例用“思维点”来计算击键时大脑思维走过的长度,在同样击4键的条件下,则本发明的思维量比字母键编码的思维量要小1倍以上。经以上计算,从“脑力劳动”的角度证明本发明具有高速击键的优点。
除击键速度以外,取码的快慢也决定着输入的速度,本发明的取码规则,严格遵照“书写笔序”、“大根优先”、尤其是“依次取首”、“不取末笔码”的规则有别于现有数字编码技术,减轻了视力及脑力的消耗,比现有技术更为简化,则取码更为快速;为了使取码的脑力劳动尽可能减小,达到加快取码速度的目的,还采取了以下特殊的技术:①在确定88个次根的码值上,采取了次根的首码或首2码的码值可以用基根、主根来描写,例如,王=15=一土(“一”是基根码为1;“土”是主根码为5),这类型的次根约20个。②采用了字形类似的根,码值相同的技术,以便记忆和取码,尤其是对于手写体汉字取码中的辨认极为有利,例如,礻=衤=22、戈=弋=戋=
Figure 941117391_IMG30
=04等,这类型的根约60个。③汉字和该字的旁同码,例如,牛= 、食=饣等。④高频字作字根用。例如,提=扌是=166、匙=是乚丿=66-4等(“是”为高频字,码=66)。这些技术的采用,使本发明要求的“记忆”能充分发挥其使用的效果,使任何汉字构件的码值没有二意性,使编码性能更为完善,使本发明更具有特色。
另外,在实现编码的软件上,本发明是采用12个数字键,可用2字节内码编写软件,可节省集成块字节的用量,将使固化本发明的硬件成本降低,为电脑进入家庭及类似器件的开发应用提供一种低造价、能普遍推广使用的技术。
本发明的键盘,最适合中国人使用。这种键盘输入键的排列符合人们的习惯,从上往下横排列为123;456;789;-0.,纵排列为147-;2580;369.,这种输入键排列分布便于人们记忆,便于眼睛脱离键盘击键,减少了学习的时间。
这种键盘无需“指法”说明,只要把右手往键盘上一放,大指就对准了‘词结束键’;食指就对准了147-;中指就对准了2580;四指就对准了369.;小指就对准了字结束键,十分方便右手击键,而且人们的右手很灵活,在使用本发明时则可很快的获得击键的高速度。
本发明键盘的12个输入键“123456789-0.”与现有计算机标准键盘的“右手小键盘”相似,本发明通过C语言编制的专用软件,把本发明与计算机结合起来,其构成的技术效果比现有技术更具有单手操作、便于学习、普遍使用、高速输入及降低硬件造价等优点。
本发明键盘与现有的有线电话、无线电话的按键一致,通过C语言编制的专用软件固化制成的芯片,把本发明与现有电话设备联系起来,构成一种完整的汉字信息处理和传输的技术方案,实现有线电话、无线电话的汉字信息处理及传输。比现有电话更具有特殊的效果,增加了一种便于中国人使用的汉字通讯功能,在通话的准确性、大大节省对话线路的时间等,具有其优越性。

Claims (3)

1、一种汉字信息处理系统,它利用汉字编码通过键盘向计算机输入汉字信息,其特征在于:
1).选择笔划根52个、主根36个、次根88,共176个字根;
2).将上述176个字根分别指令到键盘-.0123456789的数字键上,对应关系如下:
笔划根与键的对应关系:
键:-.0  1  2  3  4  5  6  7  8  9
Figure 941117391_IMG1
主根与键的对应关系:
键:-  . 0  1   2    3  4  5   6   7  8  9
根:讠 止 十 心 又    氵 火 了  口  木 月  人
厂 扌 × 水 土 予 入
        钅 广 甲      氺     士
艹 疒
Figure 941117391_IMG3
廾 纟
Figure 941117391_IMG4
Figure 941117391_IMG5
                      癶
次根与键的对应关系:
-- -. -0 -1 -5 -7 .- .. 1. 4. 5. 6. 7 0- 0. 00 01 04 辶
Figure 941117391_IMG6
辟 执 尸 关
Figure 941117391_IMG8
革 头 午 非其 莫 禾 殳
Figure 941117391_IMG9
 卝 缶 弋
Figure 941117391_IMG12
Figure 941117391_IMG13
Figure 941117391_IMG14
1-  10  2- 2. 20 21 22 24 3- 31 33   34 37 38 39 4.0 44 46
丁 雨 工 右 车 西 礻 开 北
Figure 941117391_IMG15
寸 少 臼  耳 斤
Figure 941117391_IMG16
甫 衤 兆 羊
Figure 941117391_IMG17
夫 刂
5-  5.  59  6-  65  69  7-  7.  70  73  74  77  78  79
口 走 气 比 由 音 已 彐 皮 身 羽 天 马
8-  8. 80            81 85  87  89 9- 9.90 91 99   99
自 白 犭豸
Figure 941117391_IMG19
豕 鱼 将 母 虫 隹 佥 贝 鸟乌
Figure 941117391_IMG20
3).利用上述键盘的相应键位依次输入汉字汉字信息的代码。
2、根据权利要求1所述的一种汉字信息处理系统,其特征在于汉字信息的取码规则有汉字取码规则和词语取码规则:
汉字取码规则:
①依笔序、字根,大根优先,取首1-4码;
②首3旁3;
③点为5,角点为0;
④在一个汉字中,取完一个构件;紧接着又是一个全同的构件,该构件只取1码;
⑤汉字字符中的数字,码与该数字相同;
⑥高频字作为字根使用;
高频字与键的对应关系为:
失53  的55  是66  在12  为65  民76
得-3  到18  不11  都56  很-4  长64
这--  还41  更30  应05  地45  和00  或16
3、根据权利要求1所述的一种汉字信息处理系统,其特征在于键盘由16个键组成,其中12个输入键:123456789-0.和1个字结束键、1个词结束键、1个删除键、1个控制键,其键位分布排列的方式是:12个数字输入键从上往下横排列为123456789-0.;纵排列为147-2580369.,1个字结束键在12个输入键的右上侧,1个词结束键在12个输入键的左下侧,1个删除键在12个输入键的左上侧,1个控制键在12个输入键的右下侧。
CN 94111739 1994-04-29 1994-04-29 一种汉字信息处理系统 Pending CN1105765A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 94111739 CN1105765A (zh) 1994-04-29 1994-04-29 一种汉字信息处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 94111739 CN1105765A (zh) 1994-04-29 1994-04-29 一种汉字信息处理系统

Publications (1)

Publication Number Publication Date
CN1105765A true CN1105765A (zh) 1995-07-26

Family

ID=5035576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 94111739 Pending CN1105765A (zh) 1994-04-29 1994-04-29 一种汉字信息处理系统

Country Status (1)

Country Link
CN (1) CN1105765A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052549C (zh) * 1996-05-04 2000-05-17 张正国 基于字元的小键盘汉字输入方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052549C (zh) * 1996-05-04 2000-05-17 张正国 基于字元的小键盘汉字输入方法

Similar Documents

Publication Publication Date Title
CN1047447C (zh) 实虚笔形编码计算输入法
CN1105765A (zh) 一种汉字信息处理系统
CN1020386C (zh) 结构笔画四位数编码法及键盘
CN1435749A (zh) 汉字笔音码输入法及键盘
CN1315026C (zh) 一种数码汉字输入法
CN102043469A (zh) 两笔型三维数码输入法及其键盘
CN1139867C (zh) 新音形简易速录码汉字输入法
CN1553305A (zh) 声形四码汉字计算机输入方法
CN1150441C (zh) 字形笔顺码汉字输入法及其键盘
CN1055167C (zh) 汉字部首笔顺码的输入方法
CN1119740C (zh) 首尾特征码汉字计算机键盘输入法
CN1170213C (zh) 音形码汉字输入方法
CN1082216A (zh) 快三码无重码兼容拼音输入的汉字字词编码方法及键盘
CN1155873C (zh) 一种用基础部件的拼音进行编码的数字键汉字输入法
CN1162766C (zh) 一种汉字音形编码输入方法
CN1054448C (zh) 一种汉字形母码输入方法
CN1293451C (zh) 三击形音汉字输入法
CN1123817C (zh) 一种汉字输入法
CN1067476C (zh) 九三码汉字输入方法及键盘
CN1558310A (zh) 汉字辅元音形码输入法
CN1120406C (zh) 计算机汉字部首输入方法
CN1773432A (zh) U码汉字输入法
CN1097515A (zh) 傻瓜型普及码汉字输入法及其键盘
CN1068947C (zh) 一种形声及形形结合的计算机汉字输入方法
CN1159639C (zh) 基于四角号码和字根的汉字输入法及其键盘

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication