CN1258881A - 计算机汉字信息处理的规范编码输入方法 - Google Patents

计算机汉字信息处理的规范编码输入方法 Download PDF

Info

Publication number
CN1258881A
CN1258881A CN 98126811 CN98126811A CN1258881A CN 1258881 A CN1258881 A CN 1258881A CN 98126811 CN98126811 CN 98126811 CN 98126811 A CN98126811 A CN 98126811A CN 1258881 A CN1258881 A CN 1258881A
Authority
CN
China
Prior art keywords
sign indicating
indicating number
coding
sound sign
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 98126811
Other languages
English (en)
Other versions
CN1122913C (zh
Inventor
刘君度
陈昌英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 98126811 priority Critical patent/CN1122913C/zh
Publication of CN1258881A publication Critical patent/CN1258881A/zh
Application granted granted Critical
Publication of CN1122913C publication Critical patent/CN1122913C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明是一种用于计算机汉字信息处理的汉字规范编码输入技术。该方法提供了一种改进的汉字编码技术,它基于人们已有的知识储备,在降低重码率,达到汉字编码技术指标的同时,实现计算机汉字编码的规范化,从而使所需的记忆量降到最低限度。通过科学选取基本码元的数量和键位,有效地解决计算机汉字输入难学易忘的问题,给人们提供一种既规范、又简易便捷、能即学即用的计算机汉字快速输入方法。

Description

计算机汉字信息处理的规范编码输入方法
本发明涉及一种用于汉字信息处理的汉字编码技术,特别是使用键盘往微型计算机输入汉字的规范编码方法。
计算机信息处理的汉字输入方式,一般有光电扫描、手写输入、语音录入以及键盘编码输入等几种。前三种方式由于对计算机硬件配置的要求较高以及适应性问题而不易推广普及,目前成本低,应用广泛的仍是键盘编码输入方式,其中具有代表性且使用较多的有拼音、自然码、钱码、五笔字型等多种汉字输入方法。这些输入方法尚存在着这样的问题,即易学易用与重码率高的矛盾,重码率的高低又直接关系到汉字录入的速度。如拼音易学,但重码字多,须翻页寻找再选字输入,录入很慢。为了减少重码以达到快速往计算机输入汉字的目的,就必须把汉字按一定的规则拆分为多个部首和字根,由于汉字数量多,且结构复杂,拆分出的部首和字根多达数百个才能满足汉字编码的要求,而且这种拆分为了适合编码的需要,往往因字而异,规则繁琐,给汉字输入人员增加了很大的记忆负担。这种字根多、又不规范的拆分方法破坏了汉字内在结构的整体性,成为计算机汉字输入难以掌握的主要原因。
为了解决这个问题,通常的办法是将拆分后的部首和字根按形、音、义分类整理,然后按一定的规则有序地进行组合排列,使人们便于记忆。如申请国家专利的钱码以及王林快码,即采用了按形、音、义分类安排键位,高频字预示等便于记忆的方法,但其拆分的编码字根高达200-300个,所需的记忆量并未减少,仍是人们学习汉字输入技术的沉重负担和障碍,难以为一般人在短时间内掌握。
本发明的目的是要提供一种改进的声形结合的汉字编码技术。它基于一般人均已具有的知识储备,在减少重码率,达到汉字编码技术指标的同时,实现计算机汉字编码的规范化,从而使所需的记忆量降到最低限度,进而有效地解决计算机信息处理过程中汉字录入难学易忘的问题,给人们提供一种既规范、又简易便捷、能即学即用的计算机汉字快速输入方法。
本发明的汉字规范编码方法是这样实现的:借助计算机的26个字母键,一个汉字取四键作为编码。其编码思想是:汉字的编码由声码和形码两部分组成,声码部分取汉字的声母编码,形码部分取汉字的首、尾、补编码。汉字的声母编码与键盘的英文字母相对应(无声母的汉字取韵母的首字母为编码)。汉字规范编码对首、尾、补编码的约定意义是:以汉字左上角的起笔为首形码,右下角末笔为尾形码,补码则取汉字右上角最高的笔形,一个汉字的全码为四码,最多四键输入一个汉字。
形码部分的字形编码元素分为十种,分别用十个英文字母键表示:
E-横    (含横上钩和斜右钩)
I-竖、撇(含竖左钩)
U-点、捺
X-叉    (两笔交叉)
W-插    (一笔纵穿两笔或两笔以上)
O-口    (四角整齐的方形)
L-角    (一笔向下转折或两笔笔头相接所形成的角形)
B-八    (八字形和八字形的变形)
V-小    (小字形和小字形的变形)
A-点下有一横    (点和横相结合)
以上编码元素按国家现行出版的《新华字典》、《辞海》对汉字四角笔形的分类进行了取舍,但基本码元相同。
由于同声母的一些汉字具有相似的首尾结构,出现多个汉字编码相同的重码问题,为了在仅有十个基本码元的情况下降低重码率,分散较为集中的重码字,达到易学好用的目的,规范编码采用了一种“路径”的编码方法,将全码相同的多个不同汉字,按其使用的频度分散到全码所路经的上级简码,即任何一个全码汉字,均可根据编码需要占用其路径上的一级、二级、三级简码资源。例如有五个汉字的编码均为ABLV,则按使用频度以AB为一个高频字简码,ABL为两个常用字简码,ABLV为两个非常用字的编码。因此只要知道一个字的全码,就可以在打入全码的路径上找到该汉字,从而使重码率大为降低,实现了同一编码最多不超过三个汉字,为计算机的汉字快速输入创造了条件。
词汇编码采用四键编码,根据词汇的字数不同有以下三种编码方法。(一)双字词编码:
首字声码+末字声码+首字首形码+末字尾形码(二)三字词编码:
依序输入每个字的声码和末字的尾形码。
即:声码1+声码2+声码3+末字尾形码(三)多字词编码:
依序输入前三个字的声码和末字的声码。
即:声码1+声码2+声码3+末字声码
基于快速输入的思想,词组的编码与汉字的编码一样,采用了“路径”的编码方法,全码词可以占用“路径”上的二级简码、三级简码资源。如北京的简码为BJ;计算机的简码为JSJ;满园春色的全码为MYCS,均无需输入形码。
由于声码和形码分别采用了不同的英文字母键,使得汉字的编码与词的编码虽合而不混,减少了发生重码的几率,提高了规范编码的素质。
汉字规范编码与现有计算机汉字编码方法相比,其特点是编码的规范性和确定性。本发明是基于国家确定了的拼音和对汉字四角笔形分类的确定性条件下构建的规范编码,其中任何一个汉字也都具有规范确定的编码,因而最大限度地减少了汉字编码的模糊性和二义性。
编码规则特别简单,充分利用了人们已有的知识储备,没有特殊要求记忆的附加内容。由于用声母作首码,形码的基本码元只占十个键位,扩展的变形码元也只25个,学习掌握特别容易。一个具有小学文化程度的人,已经学习了拼音和查字典的基础知识,只要了解一下编码的基本规则就可以进行计算机的汉字输入,容易做到即学即用。
简易便捷容易掌握。即使不会查字典的人,学习形码的编码方法也是容易的。规范编码运用了古代汉字象形、会意、形声的造字方法选取十个键位,以I表示竖笔;E表示横笔;O表示方框;L表示折角;B表示八字形;X表示两笔交叉;V表示小字形,如同上大下小的利刃;W很容易联想到交错穿插;点下有横的顶盖,用英文的首字母A表示,这都是极为形象易记的,无需解释就能明白其代表的含意,从而使所需的记忆量降到最低的限度。
词组的编码以声母编码为主,先声后形,形码则先首码而后尾码,符合人们书写的思维过程。声码与形码分别使用不同的英文字母键,词的简码只需连续输入两个或两个以上的声码,简码省去形码后,提高了词的输入速度,如三字以上的词组,根据声码就可迅速输入,无需考虑词组是怎么写的。汉字规范编码收集了国标GB2312-80的一、二级汉字库和近两万条常用词组,此外,囊括了商务印书馆1996年版《汉语成语小词典》中的全部成语,仅凭声码就可进行成语录入而不会与汉字发生重码。
声母的zh、ch、sh和Z、C、S不分,适应南方方言不分卷舌音的特点。
下面分步详细说明依据本发明提出的汉字规范编码方法的实施过程。
(1)首先依据《新华字典》、《辞海》对汉字四角笔形的分类选取适合的基本码元和扩展异形码元,根据基本码元和编码规则对国标GB2312-80的6763个汉字逐一进行编码后排序。
(2)通过对汉字编码排序,然后采用上述“路径”的编码方法,把重码较为集中的汉字按使用频度分散安排到全码路径的各级简码中去,修改后形成汉字码表文本文件。
(3)依据词的编码规则对二字词和多字词进行词的编码,形成词的码表文本文件。
(4)将字和词的码表文件合一进行排序形成字词合一的码表源文件。
(5)通过WINDOWS95或UCDOS的应用程序将码表源文件编译生成输入法编码字典,然后按操作系统规定步骤进行安装。
(6)根据WINDOWS 95或UCDOS工作平台的要求运行加载汉字规范输入法程序,即可调用规范码输入汉字和词组。
本发明作为计算机汉字信息处理的规范编码输入方法,采用了悬挂方式,可在中文WINDOWS3.X、中文WINDOWS95、以及UCDOS等汉字操作系统下调用汉字规范输入法以输入汉字。

Claims (3)

1、计算机汉字信息处理的编码技术,一种使用键盘往微型计算机输入汉字的规范编码方法。该方法的汉字编码由声码和形码两部分组成。其特征在于:
(1)声码为汉语拼音的声母,形码的基本编码元素取自《新华字典》以及《辞海》对汉字四角笔形的十种分类。
(2)根据权利要求(1)所述的汉字四角笔形的十种分类与计算机键盘所对应的英文键位如下:
E-横    (含横上钩和斜右钩)
I-竖、撇(含竖左钩)
U-点、捺
X-叉    (两笔交叉)
W-插    (一笔纵穿两笔或两笔以上)
O-口    (四角整齐的方形)
L-角    (一笔向下转折或两笔笔头相接所形成的角形)
B-八    (八字形和八字形的变形)
V-小    (小字形和小字形的变形)
A-点下有一横    (点和横相结合)
2、汉字规范编码以“路径”的编码方法分散较为集中的重码字到沿路径的二、三级简码上,录入汉字时须根据全码查找沿路径的一、二、三级简码直至全码。
3、词组的编码采用声码优先的原则,其编码的规则及特征如下:
双字词编码:
首字声码+末字声码+首字首形码+末字尾形码
三字词编码:
依序输入每个字的声码和末字的尾形码。
即:声码1+声码2+声码3+末字尾形码
多字词编码:
依序输入前三个字的声码和末字的声码。
即:声码1+声码2+声码3+末字声码
CN 98126811 1998-12-30 1998-12-30 计算机汉字信息处理的规范编码输入方法 Expired - Fee Related CN1122913C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 98126811 CN1122913C (zh) 1998-12-30 1998-12-30 计算机汉字信息处理的规范编码输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 98126811 CN1122913C (zh) 1998-12-30 1998-12-30 计算机汉字信息处理的规范编码输入方法

Publications (2)

Publication Number Publication Date
CN1258881A true CN1258881A (zh) 2000-07-05
CN1122913C CN1122913C (zh) 2003-10-01

Family

ID=5229785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 98126811 Expired - Fee Related CN1122913C (zh) 1998-12-30 1998-12-30 计算机汉字信息处理的规范编码输入方法

Country Status (1)

Country Link
CN (1) CN1122913C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405264C (zh) * 2003-09-29 2008-07-23 刘君度 基于一键一字的汉字特征定位编码复合输入方法
CN1317906B (zh) * 2001-05-19 2010-05-26 刘君度 移动通信与计算机信息处理中英文数字化输入集成系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1317906B (zh) * 2001-05-19 2010-05-26 刘君度 移动通信与计算机信息处理中英文数字化输入集成系统
CN100405264C (zh) * 2003-09-29 2008-07-23 刘君度 基于一键一字的汉字特征定位编码复合输入方法

Also Published As

Publication number Publication date
CN1122913C (zh) 2003-10-01

Similar Documents

Publication Publication Date Title
CN1122913C (zh) 计算机汉字信息处理的规范编码输入方法
CN1645356A (zh) 多维汉语学习系统
CN1194285C (zh) 多输入方式的计算机汉字编码输入技术
CN1106146A (zh) 电脑汉字声韵调编码输入法及其键盘
CN1127012C (zh) 汉字首尾码输入方法
CN1290879A (zh) 中文信息处理汉字数字化规范编码输入技术
CN1096112A (zh) 一种汉字声母编码输入法及其所用键盘
CN1036359C (zh) 计算机汉字反切编码输入法
CN1116336A (zh) 替调式汉语拼音汉字、词输入编码法及键盘
CN1109951C (zh) 计算机汉字笔序码键盘输入方法
CN1164695A (zh) 汉字笔形数值编码法
CN1139024C (zh) 汉字l码输入方法
CN1047676C (zh) 电脑汉字输入方法
CN1215859A (zh) 部音码
CN1063369A (zh) 一种双向拼音笔形汉字输入系统
CN1344987A (zh) 汉字输入方法及键盘
CN1393756A (zh) 计算机四键无重码汉字拼音编码输入法
Segert et al. A Computer Program for Analysis of Words According to Their Meaning (Conceptual analysis of Latin equivalents for the comparative dictionary of Semitic languages)
CN1239240A (zh) 鼠标滚屏汉字输入法
CN1107237A (zh) 意音汉字输入法
CN1115887A (zh) 计算机汉字输入系统通用的语句输入方法
CN1199888A (zh) 字典码汉字输入方法
Machida Levels of Character-Glyph Transduction in Indic Scripts: The Case of Devanagari
CN86103490A (zh) 中文字词语从形编码法及其所用键盘
CN1226694A (zh) 多部首汉字输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20031001

Termination date: 20100201