CN1045307A - 对汉字进行编码和译码的方法和装置 - Google Patents

对汉字进行编码和译码的方法和装置 Download PDF

Info

Publication number
CN1045307A
CN1045307A CN90101470A CN90101470A CN1045307A CN 1045307 A CN1045307 A CN 1045307A CN 90101470 A CN90101470 A CN 90101470A CN 90101470 A CN90101470 A CN 90101470A CN 1045307 A CN1045307 A CN 1045307A
Authority
CN
China
Prior art keywords
stroke
character
code
basic strokes
strokes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN90101470A
Other languages
English (en)
Other versions
CN1024050C (zh
Inventor
吉姆·庞格
Original Assignee
Pontech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pontech Inc filed Critical Pontech Inc
Publication of CN1045307A publication Critical patent/CN1045307A/zh
Application granted granted Critical
Publication of CN1024050C publication Critical patent/CN1024050C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

一种对汉字进行编码和译码的装置和方法,包括将一个汉字的笔划按至少在初始时与汉字手写规则相符的次序转换为一连串预先规定的三种形式的基本笔划,并确定字符中每种不同形式的基本笔划出现的初始次序以及出现的总次数,由此即可导出一个表示字符中每种基本笔划形式出现的初始次序和总次数的多元字符笔划代码,并将所存贮字符集中与此字符笔划代码相符合的每一个字符显示出来,如果字符笔划代码对应字符集中的多个字符,这时还要同时显示与每个被显示字符相关的一个附加代码元素。

Description

本发明涉及对汉字进行编码和译码的方法和装置。特别是,本发明涉及这样一种对汉字进行编码和译码的方法和装置,其中,对每个汉字进行分析以确定在依照汉字手字规则的笔划顺序将汉字笔划转换为三种预先规定的基本笔划时每个笔划出现的起始顺序以及每种笔划出现的次数,从而对某个汉字得到表示其每种笔划出现的起始顺序和次数的多元码。在大多数情况下,以上述方式得到的代码可能对应多个汉字,此时可在原有码的基本上增补一个附加码,从而得到能唯一定义这一汉字的一个扩展码。当将本发明的装置和方法与一个可适当编程的计算机系统一起使用时,可以对汉字进行快速而有效的编码和译码,从而使用户在诸如字处理、电子词典或字符校对、打印、电子出版之类的诸多应用中能对汉字进行输入、存贮、显示、处理、修正、打印或者输出。
由香港商务出版社出版的《现代汉语字典》(第26版)包括七千多个字,每个字由一个或多个符号来定义。显然,包容如此大量字符的一种语言使人们、特别是那些没有高水平熟练掌握中文书写能力的人,在书写交流方面遇到了困难。
此外,一个单一的汉字可能包括(1)到(30)笔划,手写汉字时书写的笔划次序由汉字手写规则决定,熟悉书写汉语的人对此非常了解。再者,为了在打印或书写字符时看起来匀称、协调,不管其笔划多少,每个汉字的字宽和字高都应基本一致。例如表示英文“Sun”意思的汉字“日”有4划,表示英文“chicken”意思的汉字“鸡”有20划。然而,当打印或书写这两个字时,其字宽和字高必须大体相同。因此,学许多字符在同一文本中出现时,笔划多的字符其笔划必须要比笔划少的字符的笔划小一些。换名话说,在同一文本中,不同的汉字可能要求不同的笔划尺寸。这一要求对设计汉字编码和译码系统提出了新的问题。
以往已经提出过许多对汉字进行编码和译码的系统。例如,在美国专利4559615中,Goo等人揭示了一种对汉字进行编码、存贮和选取的方法及装置,其中根据所谓的“四角编码方法”对汉字在某种程度上进行了分析,从而对应每个字符取得了一个七位编码数。然而,四角编码法很复杂,因此,如果被分析的字符不具有确定的字根或如果字符的角笔划没有明确定义的话,Goo等人所揭示的方法就很难推扩应用。因此,需要有一种不存在四角编码法的复杂性及问题的对汉字进行编码和译码的技术。
因而,本发明的目的之一就是在不采用四角编码法的前提下提供对汉字的编码和译码。本发明的一个特征就是将一个汉字的笔划转换为三种预先确定形式的基本笔划,这种转换按至少在某种程度上由汉字手写规则确定的次序进行。汉字可由一种多元码代表。这种多元码表示被编码的汉字中每种不同形式的基本笔划出现的初始次序以及每种形式的基本笔划出现的总次数,在某些情况下,要在这种码中加上一个附加码元,从而获得一种与被编码的字符有单一对应关系的扩展码。
Shojima等人的美国专利4,718,102、Crane等人的美国专利4,718,102以及Odaka的美国专利4,284,975分别指示了应用图形识别技术对汉字进行编码和译码。然而,采用Shojima、Crane、或Odaka等人的技术,用户需要输入字符图形或字符的笔划元素,然后,将其与一组预先存贮的关于汉字或笔划元素的模型或参考图形进行比较。此外,通常通过笔划记录设备来输入图形常常是很难实现的,这是因为不同用户书写汉语的技巧和书写笔划形式可能是各不相同的。
同样,Monroe等人的美国专利4,829,583和Kimura等人的美国专利4,755,955揭示了采用与正被进行编码和译码的字符的笔划相关的座标值对表意字符编码和译码的技术。然而,所揭示的技术使用起来很困难,并且在很大程度上依赖于用户在标准书写时对汉字笔划座标的确定技能,这是因为对一个字符所输入的笔划座标必须与所存贮的参照字符的笔划座标非常一致。因此,需要有这样一种对汉字进行编码和译码的技术,它不需要用户具有高水平的汉字书写技能,并且避免了对一个要编码的汉字将其笔划图形或笔划座标与存贮的参照字符的笔划图形或笔划座标进行比较的工作。
因此,本发明的另一个目的是提供一种对汉字进行编码和译码的装置和方法,它不需要用户具有高水平的汉字书写技能,并且不是基于将被编码的字符的笔划图形或笔划座标与参照字符的笔划图形或笔划座标的对比。
Lee的美国专利4,462,703和Leung等人的美国专利4,397,288两者都指示了一种采用传统键盘代表汉字组成笔划和字根的技术,这些技术要求用户在对字符编码时严格地依照由汉字手写规则所规定的字符笔划顺序。同样,Chiu的美国专利4,689,743揭示了一种对表意文字、如汉字,进行编码和确认的技术。为了对一个字符编码,Chiu要求将字符的每一组成笔划根据对这类汉字所建立的手写规则按正确的顺序输入到Chiu装置。然而,对于不具备高水平书写表意文字能力的用户来说这是很难完成的。因此,需要提供一种对表意文字、如汉字、进行编码和译码的技术,它不需要用户去了解要编码的字符的每一笔划的正确次序。
本发明的另一个目的是要提供一种对汉字进行编码和译码的装置和方法。对要编码的字符,除其最初的几个笔划以外,其余都不必严格依照汉字手写规则的笔划顺序。本发明的一个特征是在获得两种不同形式的基本笔划以前,将要编码的字符笔划转换为预先规定的三种形式的基本笔划时需要依照由汉字手写规则确定的笔划顺序,此后剩下的任何笔划都可以以任意次序转换为基本笔划。以此方式,那些汉字书写技能水平较低的用户也可以将汉字输入给数据库并将其从数据库中检索出来。
Feng的美国专利4,669,901和王永民的美国专利4,684,926也揭示了采用键盘方式对汉字编码和输入的技术。王永民的技术中采用了五种基本笔划,并且根据字根出现率分布来选择字根。Feng系统中包括一个键盘,其中含有代表所选择笔划、笔划组合、词根和其它字符元素的键。然而无论是Feng还是王永民,他们都没有揭示这样一种对汉字进行编码或译码的技术,即将字符首先全部或部分地转换为一连串预先规定的基本笔划形式,然后在此转换基础上对字符编码或输入。
本发明另一个目的就是要提供一种对汉字进行编码和译码的装置和方法,它不需要确定字符的笔划出现率或笔划组合。本发明通过将每个汉字的笔划转变为三种形式的基本笔划,并对每个作了这种转换的汉字确定三种基本笔划形式的初始出现次序和出现次数,从而有利地实现编码和译码。
本发明的再一个目的是提供一种对汉字进行编码和译码的装置和方法,它能快速、有效地实施字符输入、存贮以及从一个数据库系统中将字符检索出来。
本发明的其它目的、特征和优点可由下面结合附图对实施例的详细描述中反映出来。
根据本发明,将一个汉字的各笔划逐次转换成一个基本的横笔划一,一个基本的竖笔划丨,一个基本的斜笔划/或一连串的这种基本笔划,这种转换次序至少在某种程度上与已确定的汉字手写规则相符合,由此导出一种能代表字符中每种形式的基本笔划初始出现的次序和出现次数的字符笔划码,这种代码具有多种代码元素。由此,与字符笔划代码相应的每个字符即可以从一个预先存贮的字符集中检索出来并加以显示。当与一个字符笔划代码相应的多个字符被显示时,还要显示与每个被显示字符相关的相应附加代码元素,此时,用户从被显示的字符中挑选正在被编码或输入的字符,并将与被挑选字符相关的附加代码元素加到字符笔划代码上,得到一个扩展代码,此扩展码唯一地定义了要被编码或输入的字符。
本发明的一个实施例包括一个可适当编程的计算机,其中含有一个大容量存贮器,一个键盘、一个可任意选择的写入填充盘、一个阴极射线管(CRT)或相应的显示设备以及一个图象打印机或相当的硬拷贝输出设备。除其它功能之外,通过编程使计算机能通过键盘或写入填充盘对汉字进行编码或输入,并能对输入或存贮在计算机内的汉字或代码进行存贮,显示、处理以及译码或检索。键盘用于输入与每种形式的基本笔划的初始出现次序和总的出现次数有关的数据,并用于输入与被显示的字符相关的附加代码元素以及控制计算机及其程序。写入填充盘可以用来通过至少在最初按照汉字手写规则确定的次序在写入填充盘的表面划出字符的实际笔划的方式来直接输入字符的笔划。通过将字符的每一笔划转换为一个相关的基本笔划或一连串相关的基本笔划,可以导出表示字符中每种形式的基本笔划出现的初始次序和出现的总次数的字符笔划码,计算机中的程序即与按上述方式划在写入填充盘表面上的汉字的笔划相对应。与字符笔划码相对应的每一字符从存贮在计算机存贮器中的字符集中检出并显示在CRT上。如果字符笔划码对应所存贮的字符集中的不止一个字符,那么此时CRT屏幕上还同时显示与所显示的字符相关的附加代码元素。当不止一个字符被显示出来时,用户可通过键盘输入与要选择的字符相关的附加代码元素从而可以从被显示的字符中选择出要编码的字符。输入计算机中的编码字符可以被存贮起来并随后进行检索和译码显示、处理或由打印机打印。
本发明的装置和方法可以使得对书写汉字只有相对较低技能水平的用户实现对汉字的快速和有效地编码和译码。根据本发明,为了对一个字符进行编码和译码,当字符笔划依照汉字手写规则所规定的次序转换为基本笔划时,用户只需了解两种不同形式的基本笔划的最初出现次序,随后的笔划可以不考虑手写规则进行编码。
下面对附图进行简要说明:
图1表示根据已知的汉字手写规则书写汉字时的笔划次序实例;
图1A是根据本发明一个实施例的一个系统硬件构成示意图;
图1B是根据本实施例,由图1A系统中的计算机程序所确定的信号流程图;
图1C是根据本实施例,与图1A系统计算机中的一部分程序相关的流程图;
图2是图1A系统中的写入填充盘的感应元件的配置平面视图;
图3是使用图1A系统中的写入填充盘的示意图;
图4表示了图1A系统中写入填充盘感应元件的联接关系;
图5a-5c表示采用图1A系统的写入填充盘输入一个汉字的三种例子;
图6是图1A系统的键盘及各个键的标识平面图;
图7是采用图1A系统的键盘通过输入字符的笔划座标输入汉字的示意图;
图8是一个表格,它表示一些通用的简单笔划,这些笔划用于一个字符中的例子以及根据本发明每一简单笔划与基本笔划的对应关系;
图9的表格描述了另外一些常用的简单笔划,各上述笔划用于一个字符的例子以及它们与基本笔划之间的对应关系;
图10的表格描述了用于汉字中的一些复杂笔划、每一个这种复杂笔划是如何应用于汉字以及依据本发明将每一个这种复杂笔划转换成一串基本笔划的例子;
图11的表格描述了用于汉字中的复合笔划、这些复合笔划在汉字中的应用以及将这些复合笔划根据本发明转换为一连串基本笔划的例子;
图12的表格表示了用于图1A系统中标准字母数字键盘各个键上的笔划、字根和笔划组、以及它们相应笔划代码的分配情况;
图13A表示根据图1A、1B和1C的实施例,与所存贮字符集中字符笔划代码2-1丨0/相应的所有字符以及和每一被显示字符相关的附加代码元素的显示情况;
图13B示出根据图1A、1B和1C的实施例,与要被编码或输入的字符相应的扩展码。
下面将详细地描述本发明的装置和方法。
说明书和权利要求书中所用的“笔划”一词(除表达“复合笔划”中的“笔划”以外)表示这样一种汉字成分,即不必将书写工具从正在书写汉字的表面提起来就能完整地划出或写出的汉字成分,例如,如图1所示,汉字“凡”有三个笔划,汉字“鸟”有10个笔划。
说明书和权利要求书中所提及的汉字手写规则是指在中国小学校中所教的确定的手写规则,这些手写规则在Wong的美国专利4,505,602中作了描述,这里将其作为参考文献。在不考虑任何特例的情况下,简单地说,人们在根据汉字手写规则书写汉字时通常是从左至右、从上至下。如果一个字符左右侧笔划相同时,那么就先写中间笔划。但熟悉书写汉字的人知道上面的一般规则确有某些例外存在。
在本发明中,对一个汉字至少在其最初的笔划次序中依照汉字手写规则将汉字的笔划转换为基本笔划,并确定不同形式的基本笔划初始出现的次序以及每一种形式的基本笔划出现的总次数。在说明书及权利要求书中所用到的“基本笔划”一词代表下述三种笔划:横笔划一、竖笔划丨和斜笔划/。一个字符的所有笔划都必须首先转换为三种基本笔划之一或一连串的基本笔划,对此,下面将作进一步的解释。对字符进行分析,从而确定基本笔划的数目、形式和次序,而不必考虑字符的复杂程度。因此,在实施本发明时,一个给定字符所包含的基本笔划数是不受限制的。
根据本发明,如果一个字符中的某一特定笔划一般说来既不是一横线也不是一竖线的话,那可将其认为是一种基本斜笔划/。因此,如图9所示,诸如“\”、“,”、“、”及弯曲笔划都被认为是基本斜笔划/。字符中每一种能转换为三种基本笔划之一的笔划称作为一种“简单笔划”。
许多汉字中都包括不能转换为相应单一基本笔划的笔划,这种笔划称之为“复杂笔划”,当对一个具有一个或多个复杂笔划的汉字进行编码或译码时,根据本发明,这些复杂笔划将按图10所示的方式被转换为一连串相应的基本笔划。此外,许多汉字中都包含有复合笔划,这种复合笔划是不止一个笔划的笔划组,它们形成一个字符的一部分,但并不是一个完整的字符或字根,根据本发明,在对具有一个或多个复合笔划的汉字进行编码或译码之前,这些复合笔划将按图11所示的方式被转换为一连串相应的基本笔划。在说明书和权利要求书中提到的将非横和非竖简单笔划转换为基本斜笔划、将复杂笔划转换为一连串基本笔划以及将复合笔划转换为一连串基本笔划分别是指图9、图10和图11例子中所示的转换。
通过至少在最初是按照汉字手写规则所确定的次序对汉字的笔划进行转换来确定字符的不同基本笔划形式(如一、丨和/)出现的初始次序或顺序。从而,根据本发明,一个汉字其三种形式的基本笔划出现的初始次序可以是下述6种可能形式中的一种,即:一丨/、/一丨,一/丨,/丨一、丨一/或丨/一。例如,依照汉字手写规则,汉字“日”的笔划为丨]一,当按上述方式将其转换为基本笔划后,可得到基本笔划次序为丨一丨一一,其不同的基本笔划形式出现的初始次序为丨一/。请注意,在汉字“日”中虽然没有可以转换为基本斜笔划的笔划存在,但在汉字“日”的基本笔划形式出现的初始次序中基本斜笔划是其中的一部分。汉字“±”依照汉字手写规则的笔划次序为一丨一,当这些笔划转换为基本笔划时,可得到基本笔划次序为一丨一,基本笔划形式出现的初始次序为一丨/,由于编码格式的原因,在基本笔划形式出现的初始次序中再次出现了汉字基本笔划次序中不存在的基本斜笔划/,对此下面将会作进一步的解释。
“日”和“土”是两个简单字符,它们既有自身的意义,同时又各自可能是另一字符的一部分,大量的汉字可由两个或多个简单字符组合而成。作为另一个字符的一部分的简单字符通常称之为“字根”。如果一个字根位于一个字符的开头部分,通常称其为一个“偏旁”符号(这里“偏旁”并不是指位置,而是指根据汉字手写规则,此符号是字符最先写出的部分)。为简单起见,作为一个字符最先写出部分的一个字根,如偏旁符号,在说明书和权利要求中称之为“首字根”(RooT);如果一个汉字的一个简单字符组成单元不是这个汉字最先写出的部分时,在说明书和权利要求书中就称之为“余字根”(root)。
本发明的编码和译码技术采用了三种预先确定的基本笔划、首字根(RooT)、余字根以及汉字书写规则。根据本发明的一个汉字编码例子是对汉字“地”的编码,这个汉字包括首字根“土”和余字根“也”,由汉字手写规则,首字根“土”的笔划以一丨一划出,而余字根“也”的笔划顺序为丨L。当这些笔划次序转换为基本笔划次序时,考虑到要首先写首字根“土”,“地”的基本笔划次序为一丨一一丨/丨丨一/,因此,其基本笔划形式出现的初始次序为一丨/,这里基本斜笔划/在字符的基本笔划次序中确实存在,但不包括在基本笔划形式的最初出现次序中。
在另一个例子中涉及一个较复杂的汉字“智”,它由首字根“矢”和余字根“口”与“日”构成。根据汉字手写规则,首字根“矢”的笔划顺序为/一一/\,其次所写的字根“口”的笔划次序为丨一,最后所写的字根“日”的笔划次序为丨一一。因此,根据汉字手写规则,汉字“智”的笔划次序为/一一/\丨一丨一一,当将其转换为基本笔划时,可得到下面的基本笔划次序:/一一//\一丨一丨一丨一一,其中各种形式的基本笔划初始出现的次序为/一丨。由上述例子可以看出,要得到字符中所有三种形式的基本字符出现的初始次序,只需要确定一个字符中最初两个不同形式的基本笔划的出现次序。
要导出与被编码或译码的字符相关的字符笔划码还需要用到每种不同的基本码出现的总次数。在前面所举的例子中,汉字“智”包含三个斜笔划/、七个横笔划一和四个竖笔划丨,从而其相应的字符笔划码为3/7-4丨。可以看到,该代码表示了汉字“智”中各种不同形式的基本笔划出现的次序(根据汉字手字规则)和每种形式的基本笔划出现的次数。
在上述例子中所导出的字符笔划代码可能与存贮在计算机内的字符集中的多个字符对应,因此,当得到一个字符笔划码后,需要检查字符集中与字符笔划码相应的每个字符,在出现字符笔划码对应字符集中多个字符情况下,用户必须从字符集内相关的字符中选择要被编码的字符,并将与被选择字符相关的另一代码元素加到字符笔划代码上,从而得到一个与要被编码的字符一一对应的扩展码。通常,如果字符笔划码对应所存贮字符集中的多个字符,那么与要被编码的字符相对应的扩展字符笔划代码可能具有如下某种形式:X丨Y-Z/、X丨Z/Y-、Y-X丨Z/、Y-Z/X丨、Z/X丨Y-、Z/Y-X丨,其中,X是竖笔划丨出现的总次数,Y是横笔划一出现的总次数,Z是斜笔划/出现的总次数,而是与要被编码的字符相关的附加代码元素。此要被编码的字符是从所存贮字符集中与字符笔划码对应的字符中选择出来的。上述字符笔划码是通过对笔划进行研究分析而导出的。
可以看到,在许多情况下,通过笔划分析所导出的字符笔划码将确定所存贮字符集中的唯一一个字符,这是只有一个字符被显示出来,不需要任何附加代码元素,字符笔划代码即可唯一地定义要被编码的字符。根据本发明,对与字符笔划代码相应的字符进行检查来选择要被编码的字符和增加与要选择的字符相关的另一代码元素将在下面作进一步的描述。
采用上面所描述的汉字编码技术,对要编码的汉字,用户只需了解一个字符按汉字手写规则的最前面七个笔划,就能对“现代汉语字典”中90%以上的字符进行编码;用户只需了解一个字符按汉字手写规则的最前面三个笔划,就能对“现代汉语字典”中80%以上的字符进行编码。根据本发明,对要编码的字符一旦其几种不同形式的基本笔划的初始出现次序确定后,不必考虑任何笔划次序就可以确定每种形式的基本笔划出现的总次数。因此,除了极其简单的字符之外,根据本发明的编码和译码技术,用户不必知道要被编码和译码的字符按照汉字手写规则的全部笔划次序。
在一个实施例中,本发明的方法和装置被用于一个与带中文版输入、处理、存贮、检索、显示和输出设备的计算机系统中,如图1A、1B和1C所示。参照图1A,系统中包括:带有一个磁盘驱动器的计算机1、传统的键盘2、备用写入填充盘3、CRT显示器4和图象打印机5。计算机1被编程用于控制汉字的编码和译码以及汉字的存贮、处理、检索和打印。键盘2用于输入与基本笔划有关的数据并对由计算机程序所提供的功能进行控制。写入填充盘3(如果采用的话)可以通过直接在其上划出汉字的笔划来输入汉字,CRT显示器对与交互作用的汉字编码、译码、存贮、检索、处理和输出以及对与系统功能交互作用控制有关的字符和代码提供适当的显示。图象打印机5在程序控制下对存贮在计算机中的字符或代码提供硬拷贝输出。
根据本发明,对于包括有诸如与前述“现代汉语字典”中所有字符相关的图形数据和与每个字符相关的字符笔划码的适当的汉字集中的字符数据被存贮在计算机1的存贮器内,为简单起见,这些字符数据称之为“存贮的字符集”。熟悉计算机编程技术的人会知道,这种字符数据可以各种不同的方式,如以表格形式或作为程序的一部分,输入到计算机存贮器中。图1B详细地给出了本发明实施例的流程图。要被编码字符的基本首字根或余字根笔划由写入填充盘3或键盘2输入,笔划感应器8检测输入的笔划并将其传送到一个笔划比较器9,比较器9将输入的笔划与存贮在笔划和字根存贮器10中的笔划或字根进行比较。下面我们将会解释到,一个字符在键盘2中的输入是通过输入字符的一个或多个基本笔划、复杂笔划、复合笔划和/或字根来完成的。前面已经提过,一个字符中其它笔划或字根之前首先输入的字根称为“首字根”。为简单起见,对基本笔划、复杂笔划、复合笔划或字根的输入都通称为输入笔划。如果输入的笔划在存贮器10中没有找到,就会产生一个报警信号(如嘟嘟声)指示错误输入。如果输入的笔划在存贮器10中找到了,笔划比较器9就将其提供给笔划累集器11,累集器累集要被编码字符的所有输入笔划。当累集器11中有两个或多个不同的基本笔划形式时,一个“两不相同笔划感应器”12就在CRT显示器4上输出一条信息:“以任何方式输入”,当此信息出现在CRT屏幕上时,用户即可不必考虑任何笔划次序将字符中的其余笔划输入。
当字符所有输入笔划都输完后,按下键盘上的“′”键(“结束键”),从而使输入结束信号传送给信号控制器13。后者又起动字符代码转换器14工作。代码转换器14将输入的笔划转换为与要被编码的字符相应的一个字符代码,字符代码识别器15将此字符代码与字符代码存贮器16中存贮的代码进行比较,如果在字符代码存贮器16中没发现被转换的字符代码,那么就由代码不明处理器17在CRT屏幕上显示“是否重作(redo)?”信息;如果在存贮器16中找到了转换过来的字符代码,字符代码识别器15就启动字符数据处理机18开始工作。字符数据处理机18从字符数据存贮器19中检索出以前所存贮的、具有由字符代码转换器14所提供字符代码的一个或多个字符图形数据,并将检索出的每个字符显示在CRT屏幕4上。如果CRT屏幕4上显示出了不止一个字符,那么还要同时显示与每个字符相关的附加字母代码,此时,用户从被显示的字符中选择要被编码的那个字符,并输入与被选择出的字符相关的字母代码元素。由此即可得到一个能唯一对应要被编码字符的一个扩展字符代码。如果由字符代码转换器14所提供的字符码能唯一对应存贮器16中一个字符,那么对要编码的字符此时就不要加上附加字母代码元素了。
以前面方式输入的所有字符都被存贮在由程序限定的一个缓冲器中(未示出),缓冲器中的字符可被处理,传送到磁盘驱动器的磁盘中或被检索出来显示在CRT屏幕4上,在打印机5上处理或打印。显示在CRT屏幕4上的字符可通过按压键盘2(在图6中未示出)上的“打印键”由打印机5打印出来。
图1C是一个流程图(占两页纸),表示根据本发明的实施例用于控制汉字编码的计算机的一部分程序。对一个特定的计算机要将由流程图1C中确定的程序部分进行实施,对计算机编程领域内的普通技术人员来说是公知的。在本发明的实施例中,程序在Sanyo    Model    17    PLUS个人计算机上用BASIC编程语言实施。
图6是本发明实施例中键盘2的各个键的标识平面示意图。为了描述时简单起见,键盘2的某些特定作用和功能键没有示出。可以看到键盘2与用作个人计算机的传统字母键盘具有同样的键格式,而基本笔划、复杂笔划、复合笔划、字根和基本笔划组都由程序分派给了各个不同的键。图12以表格形式列出了图6的键盘2中基本笔划、复杂笔划、复合笔划和字根在各个键中的分派(不包括在笔划组模式时将笔划组分派给最上面一排键的情况)以及通过按压各个键可产生的相应笔划码。
在“现代汉语字典”的索引页中列出了214个字根。如果每个字根对应键盘上一个键,那么键盘就会大得不可思议,用户要对一个字符进行编码就得花费大量的时间去搜寻字根。在本发明的实施例中,只有一些经常用到的字根、复杂笔划、复合笔划、每种基本笔划和基本笔划的各种组合被分派到键盘2中的不同键上,没有由键代表的其它字根和笔划可用代表各种基本笔划的键、代表与这些其它字根和笔划“笔划等同”的字根和笔划的键以及代表基本笔划组的键来输入。这在下面还要进一步加以叙述。
参照图6,除笔划组模式情况之外,指派给第四行(r4)从键“1”到键“=”各个键的字根和笔划都具有初始基本笔划次序/一丨;指派给第三行(r3)从键“9”到键“]”各个键的字根和笔划都具有初始基本笔划次序丨一/;指派给第二行(r2)从键“a”到键“,”各个键的字根和笔划都具有初始基本笔划次序一丨/;指派给第一行(r1)从键“Z”到键“/”各个键的字根和笔划具有不同的初始基本笔划次序,它们可用作等同笔划,对此下面将作进一步解释。虽然图6的键盘2中有些键代表不止一个字根,但当按下此键时,由该键所代表的字根产生相同的代码。因此,每个这样的键可用于输入其所代表的任何一个字根,然而此键按下时所产生的代码并不与此键所代表的任何一个字根唯一对应。由上面的讨论以及下面将作的进一步解释可知,当笔划输入完成后,在CRT屏幕上将显示出与由程序根据输入笔划所导出的字符笔划代码相应的一个或多个字符。在显示多个字符的情况下,每个显示出来的字符将有一个相关的字母(即一个附加代码元素)同时显示。当不止一个字符在屏幕上显示时,用户从所显示的字符中选择要被编码的那个字符,输入与被选择字符相关的字母,从而获得能与被编码字符唯一对应的一个扩展字符笔划码。
在说明书和权利要求书中所用到的“笔划等同”(Stroke    equivalents)表示那些没有由键盘2上的键所表示出的基本笔划的组合或字根,但它们与键盘2上的一个键所代表的字根具有相同的每种基本笔划形式出现次数(不一定具有相同的每种基本笔划形式的初始出现次序)。因此,由图6键盘2的键所代表的基本笔划、复杂笔划、复合笔划和字根、包括系统处于笔划组模式下由r4的键所代表的基本笔划组,加上由同样的键输入等同笔划,至少在“现代汉语字典”中的所有汉字可以由图6所示键盘配置来进行编码和译码。
例如,汉字“日”的基本笔划次序为丨一丨一一,相应的字符笔划代码为2丨3-0/,这在前面已作过解释。汉字“正”的基本笔划次序为一丨一丨一,相应的字符笔划代码为3-2丨0/。以上两个字笔划等同,但它们的字符笔划代码并不相同,这是因为虽然这两个字符的每种基本笔划形式出现的总次数是一样的,但它们的基本笔划形式出现的初始次序是不相同的。
在利用等同笔划的另一个例子中,汉字“歪”具有一个首字根“不”和一个余字根“正”,首字根“不”在键盘2中没有任何键表示,但它可以通过使用“b”键(根据图12,它代表一个一笔划和一个/笔划)和“n”键(根据图12,它代表一个丨笔划和一个/笔划)来输入,因此,“不”的总笔划对应于字符笔划代码1-2/1丨,字根“正”可用代表字根“日”的“t”键输入,因为“日”和“正”是笔划等同字。可以看到,因为基本笔划形式出现的正确初始次序(即一/丨)是由输入首字根“不”时建立的,所以在输入“正”的笔划时不必考虑它的基本笔划次序。因此,字根“正”可由输入其它字符等同字“日”来完成。
根据附图12,由“t”键所代表的字符笔划代码是2丨3-0/,因此,由首字根“不”的基本笔划初始出现次序和由首字根“不”和余字根“正”的基本笔划出现次数之和就可以确定字符“歪”的字符笔划代码,即4-2/3丨。单对字符“正”的编码可通过使用笔划等同来实现,因为在键盘2上没有代表字符“正”的基本笔划形式出现的初始次序和每种不同形式的基本笔划出现次数的键。然而,因为字符“正”有三个一笔划和两个丨笔划,根据汉字书写规则,其上述两个初始笔划出现的初始次序为一丨,因此通过按压提供笔划代码3-0丨0/的“a”键和提供笔划代码2丨0-0/的“X”键就可对字符“正”编码。
当最初出现的两种不同形式的基本笔划被输入后,笔划等同的使用就更为便利了。例如,在前面描述对汉字“正”的编码时,先按“a”键,产生笔划代码3-0丨0/,与汉字“正”的基本笔划形式的初始出现次序相符合,其后按“X”键,产生笔划代码2丨0-0/,当此代码与第一个代码组合在一起时,就得到了汉字“正”的正确字符笔划代码3-2丨0/。按压键盘2上代表具有多种基本笔划形式的一个字根或笔划的任何键时,会导致计算机1中的程序在CRT屏幕上输出“以任何方式输入”的信息,以告之用户字符的剩余笔划可以任何次序输入而不必考虑汉字手写规则。
请注意,在图6所示的键盘上,除了“Z”、“X”、“C”、“V”、“a”“q”“1”和“2”键之外,在r1-r4各行的其它键所代表的字根每一个都具有多种形式的基本笔划。因此,如输入字符过程中按下这些键中的其中一个时,字符中任何剩下的笔划都可以不必考虑笔划次序来输入。
在本发明的实施例中,要输入一个具有一个首字根和一个或多个余字根的字符,在模式选择时,用户首先通过按压“T”键将计算机置于“T模式”(打印模式)。一旦处于“T模式”,用户就按压代表字符首字根的键,如果由所按压的键所代表的首字根包括两种或多种基本笔划形式,那么用户即可不必考虑笔划次序将字符其余的任何笔划输入,包括按压代表字符任何余下字根的适当键。
然而,如果首字根由相同形式的基本笔划构成时,程序将产生一个相应的笔划码,它不仅指示基本笔划出现的次数,而且还指示出其它基本笔划形式出现的预先规定的错误次序,如图12中所示的“a”“c”“q”“v”“x”和“z”键。这时,如果接着要输入的笔划或字根与只有一种基本笔划形式的首字根相比具有不同的基本笔划形式初始出现次序时,那么就不能通过按压与之相应的键来输入。这时,要将紧接着首字根再输入的余字根分解为基本笔划,用图6键盘上的基本笔划键(即“;”“l”“=”键)来输入,直至将一个与先编码的首字根中所包括基本笔划形式不相同的基本笔划形式输入为止。在此之后,余下的其它笔划就可以按任何次序或方式输入,包括使用代表字符任何剩余字根的键。
例如,在对具有一个首字根“日”和余字根“月”的汉字“明”进行编码或输入时,首字根包括两种不同形式的基本笔划,即一和丨,这时,一旦通过按压键盘上的“t”键对首字根编码或输入后,那么“明”字剩下的笔划就可以任何方式或次序输入。这时最好是通过按压代表余字根“月”的键来完成。但是要对汉字“油”编码或输入则要采用不同的步骤输入,这个字符有一个复合笔划“氵”和一个余字根“由”,复合笔划“氵”中只包含一种形式的基本笔划,即三个斜笔划/,通过按压对应于复合笔划“氵”的“V”键启动程序产生一个笔划代码3/0-0丨,并显示在CRT屏幕上。这个笔划代码建立了一个错误的基本笔划形式初始出现次序/一丨。然而,根据汉字手写规则,其后的字根“由”并没有同样的基本笔划形式初始出现次序,因此余字根“由”不能通过按压“P”键来输入,而是必须将其分解为基本笔划次序丨一丨一丨一,并通过按压“l”键或“q”键输入一个或三个笔划,其形式不同于复合笔划“三”中的斜“/”笔划(其中,“l”键和“q”键分别代表“丨”和“丨丨丨”),此后,余字根中剩余的其它基本笔划可以任何次序输入。
图6所示键盘2中的键可用于在系统处于笔划组模式下通过利用键盘2中r4行的笔划组键来编码或输入汉字。如图6所示,r4行中的笔划组键代表三种基本笔划形式中每一种的1、2、3或4次出现。要采用笔划组键,用户在输入模式选择时可通过按压“S”键来选择“S”(笔划组)模式,从而导致被编码的模块与各笔划组键相对应。
写入填充盘3可用来代替键盘2或与键盘2联合使用来编码或输入汉字。如图2所示,写入填充盘由规则配置的多个感应元件6构成,每一感应元件都可由用户单独触发来提供相应的输出信号。感应元件可以是光敏感应设备、电容感应设备、磁感应设备或其它诸如机械开关之类可由用户各个触动的设备。
如图2和图3所示,感应元件按多行和多列布置,它们之间的连接关系示于图4。在本实施例中,写入填充盘的各个感应元件都是机械开关,标有A、B、C、D、E和F的感应元件的开关分别与键盘2上“a”“b”“c”“d”“e”和“f”键的开关并联。
参见图3,当横跨写入填充盘前三列对元件A、B和C进行触发时,计算机1的程序检测由这些感应元件的触发所产生的输入信号并将这些信号译为基本横笔划一;当顺着写入填充盘的第二列对元件B、E和B进行触发时,计算机1的程序检测由这些感应元件的触发所产生的输入信号并将这些信号译为基本的竖笔划丨;当从写入填充盘的第一例第一行到第三行第三例对感应元件A、E和C进行触发时,计算机1的程序检测由这些感应元件的触发所产生的输入信号并将这些信号译为基本的斜笔划/。此外,从写入填充盘的第一行第三列到第三行第一列对感应元件C、E和A进行触发、或对不到三个相邻感应元件-无论是沿垂直、水平还是沿对角线方向-进行触发时,也由程序翻译为一个基本斜笔划/。
为操作简便起见,写入填充盘可以是具有多于3×3个元件的相对较大的配置。这样,用户对字符基本笔划的输入过程与用户在写入面划出这个字符的过程相类似。在写入填充盘的一个实施例中,感应元件的配置是9×9,这样在输入大多数汉字时,配置中的任何行、列或对角都不必用于一个以上的汉字笔划。具有较大配置的感应元件的联接与图4所示的方式相同。
要利用写入填充盘编码或输入一个字符,用户可以在写入填充盘的表面上划写字符,正如使用书写工具在一书写面写汉字一样,图5C中示出了书写汉字“日”的例子。然而利用写入填充盘输入一个字符时,并不需要在感应元件的配置上实际划示这个字符,用户只需在写入填充盘表面任何地方划出这个字符的所有基本笔划,如图5a和5b所示。基本笔划可以任何次序划出,只要保证不同基本笔划形式划出的初始次序与字符按汉字手写规则所确定的笔划次序中基本笔划次序相同。根据上面的讨论,一个基本横笔划一可通过在写入填充盘表面对三个或三个以上水平连续的感应元件进行触发来输入,一个基本的竖笔划丨可通过对三个或三个以上垂直相邻的感应元件进行触发来输入,一个基本斜笔划/可通过对三个或三个以上对角相邻的感应元件进行触发或对两个以下相邻感应元件进行触发来输入。如图5b所示,同一感应元件组可多次使用来输入多次出现的同一基本笔划形式。
在汉字“日”这一字符例子中,根据汉字手写规则其笔划和笔划次序为丨一一,根据前面所作的解释,复杂笔划可转换为基本笔划次序一丨,因此,“日”的基本笔划次序为丨一丨一一,而且竖笔划丨出现了两次,横笔划一出现了三次,斜笔划/则没有出现。因此,在利用写入填充盘输入字符“日”时,用户按次序先划竖笔划丨,接着划基本横笔划一,然后可以任何次序划这个字符其余的基本笔划。每种基本笔划可在写入填充盘的任何地方划出,而具有同样形式的基本笔划可通过触发同一感应元件组将其叠和在一起,如图5b所示。
图5a、5b和5c示出了利用写入填充盘3将汉字“日”输入到图1A系统的三个例子,当字符的基本笔划划出时,计算机1及其程序对来自写入填充盘3的感应元件中的输出信号作出反映,产生一个与所划出的基本笔划相应的字符笔划代码2丨3-0/,这一代码被显示在CRT屏幕上,同时显示的还有存贮在计算机1的字符集中与此代码对应的每一字符。此字符代码表示字符具有一个初始基本笔划次序为丨一/,有两个竖笔划丨,三个横笔划一,没有斜笔划/。对于那些作中文文章而不是从一份文件中抄录文章的用户来讲,写入填充盘的使用更具优势,因为这样的用户只需将他(她)们所需的每个字符划出来输入到图1A、1B和1C的系统中。要输入的字符在划字符的工作结束后从显示在CRT屏幕4上的字符中选出。
本发明可通过下面的例子作更进一步的描述,这些例子并不以任何方式对本发明进行限定。
例1示出了利用键盘2中的键对汉字“土”进行输入和译码的五种技术,字根、笔划和笔划组的分派示于图6并详细地表示于图12中(在S模式下对r4行键的分派除外)。当开始工作时,计算机1中的程序将其所提供的各种输入模式选择单显示在CRT屏幕4上,用户可通过按压键盘上的适当键来选择一种输入模式。在图1A,1B和1C的实施例中对一个字符进行输入的各种不同技术如下:
A:字符被完全转换为基本笔划,然后按汉字手写规则所确定的次序对基本笔划进行输入。要采用这一技术,用户可通过按压键盘上的“T”键来选择“打印”模式,在这种模式下,r1-r4各行的所有键都可用来输入笔划和字根。
B:字符被分解成一个首字根和一个或多个余字根、笔划和/或笔划等同,然后根据汉字手写规则进行输入。这一技术也需要在“打印”模式下采用。
C:字符被完全转换为基本笔划,然后根据汉字手写规则的次序按笔划组进行输入。采用这一技术时,用户可通过按压键盘2上的“S”键输入“笔划组”模式,在这种模式下,只有r4行中的数字键被用来输入各种形式基本笔划的适当笔划组。
D:对要输入的字符用户用眼睛作番研究,确定各种形式的基本笔划出现的初始次序,数出每种基本笔划形式出现的次数,从而导出字符的字符笔划代码,以此方式导出的字符笔形代码通过键盘2被直接输入给计算机1。采用这种技术时,用户在各种输入模式选择单被显示出来时通过按压“M”键来选择“记忆”模式。在这种模式下,键盘2中的键只能用来输入相应的字母、数字和特殊符号。
E:用户记住与他(她)所要输入字符唯一对应的完整代码,并将字符的完整字符笔划代码直接输入给计算机1,采用这一技术用户仍需选择“记忆”模式。
下面是使用上述技术输入汉字“土”、“也”和汉字“森”的多个例子。
*利用技术A输入字符“土”:
当在CRT屏幕4上显示出输入模式选择单时,用户选择“打印”模式。按照汉字手写规则,字符“土”的笔划次序为一丨一,因为这些都是简单笔划,因而可直接转换为相应的基本笔划次序为一丨一,而不需作复杂笔划或复合笔划的转换。要输入字符“土”,用户先按“;”键,再按“l”键,最后再按“;”键,将基本笔划次序一丨一输入。当对基本笔划次序的输入结束后,用户按下“,”键,启动程序产生一个字符笔划代码2-1丨0/,此代码表示字符的基本笔划形式初始出现次序为一丨/,其一笔划出现两次,丨笔划出现一次,而/笔划没有出现。程序还使输入笔划所导出的字符笔划代码在CRT屏幕4上显示出来。
如果用户对显示在CRT屏幕4上的字符笔划代码满意的话,他(她)就按下“输入(ENTER)”键(图6中未示出)。启动程序将一个字符笔划代码以及存贮器内的字符集中与此字符笔划代码相应的每一个字符都显示出来,如图13A所示。
因为字符笔划代码2-1丨0/对应存贮的字符集中的四个字符,这四个字符都被显示在CRT屏幕4上,和每一个字符同时显示的是一个相关的字母(附加代码元素)。用户从所显示的字符中选择要被输入的那个字符,并输入与所选字符相关的字母,这些相关字母被加到字符笔划代码上,提供一个扩展字符笔划代码2-丨丨0/C,该代码与要输入的字符唯一对应。
在本例子中,与字符“土”一起显示的相关字母为C,因此,用户按压键盘上的“C”键启动程序产生一个能唯一对应字符“土”的完整字符笔划代码2-1丨0/C,然后按压“输入”(ENTER)键(图6中未示出)将这个完整代码存贮在缓冲器中。CRT屏幕4上的显示从图13A所示的显示变为图13B所示的显示,即只显示一个字符“土”。这时程序返回输入状态,准备对另一字符进行输入。
当笔划输入完成后,如果用户对字符笔划代码或与之相应的字符不满意的话,他(她)可按压“\”键(图6中未示出)将所有原先输入的笔划删掉并允许用户重新输入与他(她)想要输入的字符相关的笔划数据。按此方式,用户可在对一个字符的笔划输入过程结束以前用眼睛检查每一个字符笔划码。
*利用技术B输入字符“土”:
当表示各种输入模式的选择单在CRT4屏幕上显示出来时,用户按下“T”键来选择“打印”模式。因为字根“土”是由键盘2上的“S”键所代表的,如图6和图12所示,用户按压“S”键并接着按压“,”键,启动计算机1中的程序产生并显示字符笔划代码2-1丨0/,随后获得并存贮能唯一对应字符“土”的完整的字符笔划代码2-1丨0/C的过程与前面在利用技术A输入字符“土”时所描述的过程相同。
*利用技术C输入字符“土”:
当表示各种输入模式的选择单在CRT4屏幕上显示出来时,用户按压“S”键选择“笔划组”模式。字符“土”有两个一笔划和一个竖笔划丨,由笔划转换所得到的基本笔划次序一丨一符合汉字手写规则,按此规则所确定的字符“土”的笔划次序为一丨一。在笔划组模式下,用户按压“2”键和“5”键,前者代表由两个横笔划一所构成的一个笔划组,后者代表一个竖笔划丨,再按压“,”键,从而启动计算机1中的程序产生并在CRT4上显示字符笔划代码2-1丨0/。随后获得并存贮能唯一对应字符“土”的完整字符笔划代码2-1丨0/C的过程与前面利用技术A输入字符时所描述的过程相同。
*利用技术D输入字符“土”:
当表示各种输入模式的选择单在CRT4屏幕上显示时,用户按压“M”键选择“记忆”模式。通过用眼睛对字符“土”进行检查,用户可确定其基本笔划的各种不同形式的初始出现次序以及各种基本笔划形式出现的次数,从而可通过心算推导出其字符笔划代码2-1丨0/,要注意到,虽然字符“土”中没有斜笔划/,代码元“0/”必须加到字符笔划代码上使其与程序所要求的字符笔划代码格式一致。字符笔划代码2-1丨0/可在键盘上通过依次按压“2”“-”“1”“1”“0”“/”和“,”键直接输入,在上述输入完成以后,字符笔划代码便显示在CRT4屏幕上了,随后获得并存贮能唯一对应字符“土”的完整笔划代码2-1丨0/C的过程与前面在利用技术A输入字符时所描述的过程相同。
*利用技术E输入字符“土”:
当按前面所述的方式选择了“记忆”模式后,用户根据其记忆在键盘上输入字符的完整代码。
请注意,对一个字符来说,即使可能有一种或两种基本笔划形式的出现次数为零,但由于程序的要求,字符笔划代码中都必须同时存在三种基本笔划形式。然后,当字符笔划代码唯一对应一个字符时,以附加字母形式出现的附加代码元在完整字符笔划代码中就不存在了。
*利用技术A输入字符“也”:
用户首先按前面所描述的方式选择“打印”模式。由汉字手写规则所确定的“也”的笔划和笔划次序为]丨L,第一个笔划]是一个复杂笔划,根据图10所示的表,它可被分解为基本笔划次序一丨/,第三个笔划L也是一个复杂笔划,它可被分解为基本笔划次序丨一丨。因此,字符“也”的基本笔划次序为一丨/丨丨一丨,这个次序可通过依次按压“;”“L”“=”“l”“;”和“L”键在键盘上将其输入。
然后,按压“,”键启动计算机1中的程序产生字符笔划代码2-4丨1/,并将这一代码显示在CRT4的屏幕上。如果用户对所显示的代码满意的话,他(她)可按压“输入”(ENTER)键(图6中未示出),启动程序产生字符笔划代码2-4丨1/并将这个代码以及在所存贮字符集中与这个字符笔划代码对应的每一个字符在CRT4屏幕上显示出来。如果有不止一个字符被显示出来则与每一个被显示字符相关的一个相应字母也出现在CRT4屏幕上。此时,用户从被显示的字符中选择字符“也”并在键盘2上输入与被选择字符相应的字母从而启动程序产生并存贮一个能唯一对应此字符的扩展字符笔划代码。
*利用技术B输入字符“也”:
字符“也”的三种笔划]丨L在键盘2上分别由“d”“l”和“W”键代表。因为笔划]在转换为一连串基本笔划时包括了所有三种基本笔划形式,因此,一旦这一笔划被输入后,其它的笔划就可以任何次序输入。当输入笔划后,用户按压“,”键启动程序产生一个字符笔划代码2-4丨1/,并将此代码显示在CRT4屏幕上,获得并存贮唯一对应字符“也”的扩展字符笔划代码的其余步骤与前面结合技术B所作的描述一样。
*利用技术A输入字符“森”:
字符“森”包括三个相同的字根“木”,由于这三个字根是一样的,因此它们之间的输入次序是无法区分的。每个字根可由操作者按次序按压“;”“L”“=”和“=”键来输入。要输入其余的两个字根,可将前面的按键过程重复两遍。当所有笔划都被输入以后,用户按压“,”键,启动计算机1中的程序产生字符笔划代码3-3丨6/并在CRT4屏幕上显示这一字符笔划代码。获得并存贮字符“森”的完整代码的其余步骤与前面结合技术B所作的描述一样。
*利用技术B输入字符“森”:
前面提到,字符“森”有三个相同的字根“木”,根据图6和图12的表格可知,字根“木”由“g”键代表,因为这个字根在分解为基本笔划时包括了所有三种基本笔划形式,因此,字符“森”可通过三次按压“g”键来输入。随后用户可按压“,”键启动计算机1中的程序产生字符笔划代码3-3丨6/并将这一代码显示在CRT4的屏幕上。获得并存贮唯一对应字符“森”的完整字符笔划代码的其余过程与前面结合技术B所作的描述一致。
*利用技术C输入字符“森”:
根据汉字手写规则,汉字“森”的三个相同字根中每一个都具有笔划次序一丨/\,因为这些都是简单笔划,它们可转换为基本笔划次序一丨//。因此,利用笔划组方式输入字符“森”时,操作者按次序按压代表三个横笔划一一一的“3”键、代表三个竖笔划丨丨丨的“]”键;代表四个斜笔划////的“=”键和代表两个斜笔划//的“0”键。后面两步按键动作可由两次相继按压代表三个斜笔划///的“一”键来替代。上述笔划输入过程之后,用户按压“,”键启动计算机1的程序产生字符笔划代码3-3丨6/并将其在CRT4的屏幕上显示出来。获得并存贮与字符“森”唯一对应的完整字符笔划代码的其余步骤与前面结合技术B所作的描述相同。
对于笔划数少于10的汉字来说,技术D可能更具优势。对笔划数少于15且基本笔划转换能很容易实现的汉字来说,技术C可能更具优势。而对笔划数多于15且其基本笔划转换不易实现的汉字来讲,技术B可能要更有效。
根据本发明,对存贮在字符集中每一个汉字的笔划都按其形状和尺寸进行了编码。对一给定的笔划形式来说,其尺寸与其在汉字中所处的位置以及汉字的笔划数有关。一个笔划可首先被近似地看作是一条直线,其长度由其端点确定。这些端点可由具有某一适当原点的两维迪卡尔座标X1、Y1和X2、Y2来确定。座标值可由键盘2进行编码或输入。计算机1存贮汉字的每一笔划的座标值并根据其数量和笔划形式导出一个代码,然后将座标值和代码存贮在计算机1的存贮器中。
下面以汉字“土”为例,对如何导出其座标值以及如何将其座标值插入其字根作一简要描述:
1、确定所需汉字的尺寸;
2、在座标纸上写出这个汉字,如图7所示;
3、由键盘2对每一笔划的座标值编码或输入。在本例中,横笔划1的端点作标值为(4,5),(8,5);竖笔划2的端点座标值为(6,3)、(6,7);横笔划3的端点座标值为(3,7),(9,7)。
4、当所有这些输入结束后,字符笔划代码2-1丨0/被显示在CRT4屏幕上,通过按压“,”键,将每一笔划的端点座标值和字符笔划代码存贮在存贮器中。
5、输入该代码的最后代码元从而唯一确定这一字符。在本例中,完整的字符笔划代码是2-1丨0/C。
可以理解,上面所描述的每一要素或两种或两种以上要素的组合,也可以得到不同于上述形式的极有用的其它结构形式。
本发明通过详细的实施例示出并描述了对汉字进行编码和译码的一种装置和方法。但本发明并不局限在所示出或描述过的细节上,因为对本领域技术熟悉的人可知,对所示出的实施例在形式和细节方面可作任何删节、修改、替代和变化而不会脱离由本发明权利要求书所确定的本发明的精神和范围。

Claims (15)

1、一种对汉字进行编码和译码的装置,包括:
(a)输入装置,用于输入与要被输入的一个汉字有关的一个或多个字根、复杂笔划、复合笔划和/或一连串的基本笔划,基本笔划包括横笔划一、竖笔划丨和斜笔划/;
(b)处理装置,用于响应输入装置对与字符相关的一个或多个字根、复杂笔划、复合笔划和/或基本笔划的输入,以至少在初始时符合汉字手写规则的次序将由输入装置输入的任何字根、复杂笔划或复合笔划转换为一连串的基本笔划,并导出一个能表示要被输入的字符中不同形式基本笔划出现的初始次序和每种基本笔划出现的总次数的多元字符笔划代码,处理装置中包含有存贮装置,用于存贮一个字符集的笔划结构数据,该字符集会有大量汉字,每个汉字对应一个相应的字符笔划代码;
(c)显示装置,用于响应处理装置,对字符集中与由处理装置所导出的字符代码对应的每个字符进行显示,如果由处理装置所导出的字符笔划代码对应字符集中的多个字符,显示装置还要显示与每个显示出来的字符相关的相应附加码元,这时,处理装置进一步响应由输入装置输入的与要被输入的一个字符有关的附加代码元,从而导出一个与被显示出来的字符中的一个字符唯一对应的扩展字符笔划代码。
2、根据权利要求1所述的对汉字进行编码和译码的装置,其特征在于处理装置包括一个可编程计算机。
3、根据权利要求1所述的对汉字进行编码和译码的装置,其特征在于输入装置包括输入一个字符笔划代码的装置,所述字符笔划代码反映了按汉字手写规则确定的基本笔划的不同形式出现的初始次序以及要被编码输入的字符中每种基本笔划出现的总次数,并且其中处理装置响应由输入装置输入的字符笔划代码并使显示装置显示字符集中与由输入装置输入的字符笔划代码相关的每一个字符,如果由输入装置所输入的字符笔划代码对应字符集中的多个字符,显示装置还要显示与每个显示出来的字符相关的相应附加代码元,这时处理装置进一步响应与被显示字符中的一个相关的附加代码元的输入,从而导出一个与被显示字符中的一个字符唯一对应的扩展字符笔划代码。
4、根据权利要求1所述的对汉字进行编码和译码的装置,其特征在于输入装置包括一个键盘,键盘上有许多键,每个键代表一个或多个被选择出来的字根、复杂笔划或复合笔划或一种基本笔划,通过敲击各个键,键盘可提供一相应的多元笔划代码,该代码反映了由被敲击的键所代表的一个或多个字根、复杂笔划或复合笔划或一种基本笔划的不同基本笔划形式出现的初始次序和每一种基本笔划出现的总次数。
5、根据权利要求4所述的对汉字进行编码和译码装置,其特征在于键盘包括代表由每一种基本笔划所构成的不同笔划组的键。
6、根据权利要求4所述的对汉字进行编码和译码的装置,其特征在于即使由被敲击的键所代表的一个或多个字根、复杂笔划或复合笔划或一种基本笔划中,一种或多种基本笔划出现的总次数为零,由键盘所提供的每一笔划代码都包括有与每一种基本笔划代码相关的相应码元。
7、根据权利要求1所述的对汉字进行编码和译码的装置,其特征在于每一字符代码或扩展字符代码都包括与每种基本笔划对应的相应代码元,即使在要被输入装置输入的字符中有一种或多种基本笔划出现的总次数为零。
8、根据权利要求1所述的对汉字进行编码和译码的装置,其特征在于处理装置中包括有这样的装置,它响应输入装置对具有两种或多种不同基本笔划的字根、复杂笔划或复合笔划的输入,并响应输入装置对具有两种不同基本笔划的一连串基本笔划的输入,从而启动显示装置显示一条信息,指示在要被输入字符中的任何余下的字根、复杂笔划、复合笔划或基本笔划都可以任意的次序输入。
9、根据权利要求8所述的对汉字进行编码和译码的装置,其特征在于输入装置包括一个具有多个键的键盘,每个键代表一个或多个被选择出来的字根、复杂笔划或复合笔划或一个基本字根,由这些键中的某一个键所代表的字根、复杂笔划、复合笔划或基本字根是通过驱动键盘上的某个键来输入的,当处理装置驱动显示装置在显示一条信息以指示正被输入装置输入的字符的任何剩余字根、复杂笔划、复合笔划或基本笔划可以任意次序输入以后,不由键盘上任一键所代表的剩余字根、复杂笔划或复合笔划可通过驱动表示与剩余字根、复杂笔划或复合笔划等同的字根、复杂笔划或复合笔划的键进行输入。
10、根据权利要求1所述的对汉字进行编码和译码的装置,其特征在于处理装置包括这样的装置,它响应由处理装置导出的、与字符集中任何字符都不相关的一个字符笔划代码,从而启动显示装置显示一条需要重新输入的信息。
11、根据权利要求1所述的对汉字进行编码和译码的装置,其特征在于输入装置包括一个写入填充盘,写入填充盘具有大量的感应元件,并被安排成具有大量行和列的规则配置,每一感应元件都可被各自触发,处理装置还包括响应对三个或三个以上水平相邻感应元件的触发从而提供一个与基本横笔划一的输入相应的一个笔划代码的装置、响应对三个或三个以上垂直相邻感应元件的触发从而提供一个与基本竖笔划丨的输入相应的一个笔划代码的装置以及响应对三个或三个以上对角相邻感应元件的触发或对不到两个相邻感应元件的触发从而提供一个与基本斜笔划/的输入相应的一个笔划代码的装置。
12、根据权利要求4所述的对汉字进行编码和译码的装置,其特征在于处理装置中包括这样的装置,它响应由键盘所提供的笔划代码从而导出一个累加笔划代码,此累加笔划代码代表了在一个字符的输入过程中由被敲击的键所代表的字根、复杂笔划、复合笔划和/或基本笔划中的不同基本笔划形式出现的初始次序和每种基本笔划出现的总次数,显示装置响应处理装置对累加笔划代码进行显示。
13、一种对汉字进行编码和译码的方法,包括如下步骤:
(a)将构成要被编码汉字的一连串笔划转换为一连串的基本笔划,基本笔划包括基本横笔划一、基本竖笔划丨和基本斜笔划/,转换按至少在初始时符合汉字手写规则的次序进行;
(b)确定在要被编码的字符中不同基本笔划形式出现的初始次序和每一种基本笔划出现的总次数;
(c)导出一个多元字符笔划代码,它代表了要被编码的字符中不同基本笔划出现的初始次序以及每一种基本笔划出现的总次数;
(d)显示在所存贮字符集中与字符笔划代码相符合的字符,如果字符集中有多个与字符笔划代码相符合的字符,这时还要显示与每个被显示出来的字符相关联的附加代码元;
(e)如果字符集中有多个与字符笔划代码相符合的字符,则修正字符笔划代码,使其中包括与被显示出来的字符中的一个字符相关联的附加代码元,从而得到一个唯一对应那个字符的扩展字符代码。
14、根据权利要求13所述的对汉字进行编码或译码的方法,其特征在于在将构成要被编码的那个汉字的笔划次序转换为一连串的基本笔划时,至少在基本笔划次序中包括有两种不同的基本笔划形式之前,转换要符合汉字手写规则。
15、根据权利要求13所述的对汉字进行编码或译码的方法,其特征在于要被编码的汉字的每一简单笔划被转换为相应的一个基本笔划,而任何复杂笔划或复合笔划则各自被转换成相应的一连串基本笔划。
CN90101470A 1989-02-23 1990-02-23 对汉字进行编码和译码的方法和装置 Expired - Fee Related CN1024050C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US31388889A 1989-02-23 1989-02-23
US313,888 1989-02-23
US07/477,327 US5212769A (en) 1989-02-23 1990-02-08 Method and apparatus for encoding and decoding chinese characters
US477,327 1990-02-08

Publications (2)

Publication Number Publication Date
CN1045307A true CN1045307A (zh) 1990-09-12
CN1024050C CN1024050C (zh) 1994-03-16

Family

ID=26979103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN90101470A Expired - Fee Related CN1024050C (zh) 1989-02-23 1990-02-23 对汉字进行编码和译码的方法和装置

Country Status (5)

Country Link
US (1) US5212769A (zh)
JP (1) JP3292372B2 (zh)
KR (1) KR0163178B1 (zh)
CN (1) CN1024050C (zh)
GB (1) GB2228604B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1524234B (zh) * 2000-12-27 2010-05-26 英特尔公司 用于转换字符代码的设备
CN106133654A (zh) * 2014-03-25 2016-11-16 朴仁基 汉字输入设备和方法以及使用该汉字输入设备的汉字搜索方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03225395A (ja) * 1990-01-31 1991-10-04 Canon Inc 出力装置
US5325477A (en) * 1991-12-02 1994-06-28 Xerox Corporation Method and apparatus for generating and displaying freeform strokes
US6215506B1 (en) * 1993-06-01 2001-04-10 Brother Kogyo Kabushiki Kaisha Portrait drawing apparatus
US5572656A (en) * 1993-06-01 1996-11-05 Brother Kogyo Kabushiki Kaisha Portrait drawing apparatus having image data input function
US5517610A (en) * 1993-06-01 1996-05-14 Brother Kogyo Kabushiki Kaisha Portrait drawing apparatus having facial expression designating function
JPH0732649A (ja) * 1993-07-16 1995-02-03 Fujitsu Ltd 文字の合成方法及びその装置
JPH07248755A (ja) * 1994-02-25 1995-09-26 Internatl Business Mach Corp <Ibm> 文字表示方法
US6978421B1 (en) * 1994-06-19 2005-12-20 Mitsuhiro Aida Handwriting text input system
US5710880A (en) * 1994-11-03 1998-01-20 Microsoft Corporation Method and system for creating a graphic image with geometric descriptors
SE9601944L (sv) * 1996-05-22 1997-11-23 Ericsson Telefon Ab L M Förfarande att välja ut objekt
US5923778A (en) * 1996-06-12 1999-07-13 Industrial Technology Research Institute Hierarchical representation of reference database for an on-line Chinese character recognition system
US5796867A (en) * 1996-06-12 1998-08-18 Industrial Technology Research Institute Stroke-number-free and stroke-order-free on-line Chinese character recognition method
US6157390A (en) * 1996-09-20 2000-12-05 Dynalab (S) Ltd. Stroke-based font generation
US6151032A (en) * 1996-09-20 2000-11-21 Dynalab, Inc. Stroke-based glyph-outline font generation in low/high resolution space
US5831636A (en) * 1996-11-26 1998-11-03 Motorola Method for compressing ideographic characters for storage decompression and display and a communication device therefor
US7257528B1 (en) 1998-02-13 2007-08-14 Zi Corporation Of Canada, Inc. Method and apparatus for Chinese character text input
CN1156741C (zh) 1998-04-16 2004-07-07 国际商业机器公司 手写汉字识别方法及装置
US6229551B1 (en) * 1998-08-13 2001-05-08 Arphic Technology Co., Ltd. Structural graph display system
US6275237B1 (en) * 1998-09-30 2001-08-14 Arphic Technology Co., Ltd. Structural graph display system
AUPP665398A0 (en) * 1998-10-22 1998-11-12 Charactech Pty. Limited Chinese keyboard, input devices, methods and systems
US6801659B1 (en) * 1999-01-04 2004-10-05 Zi Technology Corporation Ltd. Text input system for ideographic and nonideographic languages
US6219448B1 (en) * 1999-06-25 2001-04-17 Gim Yee Pong Three-stroke chinese dictionary
US6501475B1 (en) 1999-10-22 2002-12-31 Dynalab Inc. Glyph-based outline font generation independent of resolution
KR20000006943A (ko) * 1999-11-13 2000-02-07 이규갑 한자 고속입력법
AU1952901A (en) * 1999-12-17 2001-06-25 Motorola, Inc. Ideographic character input using legitimate characters as components
US6349147B1 (en) * 2000-01-31 2002-02-19 Gim Yee Pong Chinese electronic dictionary
US6661417B1 (en) 2000-08-28 2003-12-09 Dynalab Inc. System and method for converting an outline font into a glyph-based font
US20030020738A1 (en) * 2001-07-30 2003-01-30 Milburn Ross William Vinters Method and device for character input retrieval and indexing
JP2005508031A (ja) * 2001-08-30 2005-03-24 アメリカ オンライン インコーポレーティッド 部首に基づいた、適合化可能な画の書き順システム
US7032175B2 (en) * 2003-01-30 2006-04-18 Ching-Shyan Wu Collision-free ideographic character coding method and apparatus for oriental languages
CN1826573B (zh) * 2003-06-18 2010-06-16 字源加拿大公司 文本输入系统和方法
US20050065775A1 (en) * 2003-09-23 2005-03-24 Poon Paul Chi-Sing Method and system for inputting chinese characters
US7359850B2 (en) * 2003-09-26 2008-04-15 Chai David T Spelling and encoding method for ideographic symbols
EP1735733A1 (en) * 2004-04-02 2006-12-27 Nokia Corporation Apparatus and method for handwriting recognition
US7609890B2 (en) * 2004-09-30 2009-10-27 Pitney Bowes Inc. Packing list verification system
US20090299822A1 (en) 2006-11-08 2009-12-03 P C Grocery Ltd. System and method for optimized shopping transactions
US7974472B2 (en) * 2007-06-29 2011-07-05 Microsoft Corporation Feature design for HMM based Eastern Asian character recognition
US20090060339A1 (en) * 2007-09-04 2009-03-05 Sutoyo Lim Method of organizing chinese characters
US20090060338A1 (en) * 2007-09-04 2009-03-05 Por-Sen Jaw Method of indexing Chinese characters
CN101930474A (zh) * 2010-09-14 2010-12-29 闫卫 汉字简易笔划检索方法
US9418569B2 (en) * 2010-12-22 2016-08-16 Creative Technology Ltd Methods and system for visually representing a rate of writing a plurality of identical chinese characters for at least one user on a display
KR101812380B1 (ko) 2012-01-23 2017-12-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 공식 검출 엔진
KR101898202B1 (ko) * 2012-02-09 2018-09-12 삼성전자주식회사 필기 인식을 위한 필기 입력 가이드 장치 및 방법
US9330070B2 (en) 2013-03-11 2016-05-03 Microsoft Technology Licensing, Llc Detection and reconstruction of east asian layout features in a fixed format document
CN106250035B (zh) * 2015-10-19 2019-07-26 威锋数位开发股份有限公司 动态生成个人化手写字型的系统和方法
CN117648681B (zh) * 2024-01-30 2024-04-05 北京点聚信息技术有限公司 一种ofd版式电子文档隐藏信息提取嵌入方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5580183A (en) * 1978-12-12 1980-06-17 Nippon Telegr & Teleph Corp <Ntt> On-line recognition processing system of hand-written character
JPS5675872A (en) * 1979-11-19 1981-06-23 Shiyuu Rii Shin Method and device for controlling and arranging character
US4462703A (en) * 1979-11-19 1984-07-31 Lee Hsing C Apparatus and method for controlling and ordering Chinese characters
CA1172335A (en) * 1980-03-06 1984-08-07 Daniel L. Leung Means for encoding ideographic characters
US4379288A (en) * 1980-03-11 1983-04-05 Leung Daniel L Means for encoding ideographic characters
US4365235A (en) * 1980-12-31 1982-12-21 International Business Machines Corporation Chinese/Kanji on-line recognition system
JPS581227A (ja) * 1981-06-26 1983-01-06 Tatsuya Matsuda 漢字を1〜0までの数列でおきかえ、コンピュ−タ−にインプットする操作方法
US4559615A (en) * 1982-09-15 1985-12-17 Goo Atkin Y Method and apparatus for encoding, storing and accessing characters of a Chinese character-based language
US4505602A (en) * 1982-09-30 1985-03-19 Wong Wyman S Method for encoding ideographic characters
US4718102A (en) * 1983-01-19 1988-01-05 Communication Intelligence Corporation Process and apparatus involving pattern recognition
JPS6014292A (ja) * 1983-07-06 1985-01-24 株式会社東芝 文書作成装置
JPS6027925A (ja) * 1983-07-27 1985-02-13 葉 亮星 漢字の検索方法
US4684926A (en) * 1984-05-14 1987-08-04 Yong Min Wang Universal system of encoding chinese characters and its keyboard
JPS60263258A (ja) * 1984-06-08 1985-12-26 チヤイナ パテント エ−ジエント(ホンコン)リミテツド 漢字符号化の一般的システム及びそのキ−ボ−ド
US4829583A (en) * 1985-06-03 1989-05-09 Sino Business Machines, Inc. Method and apparatus for processing ideographic characters
US4669901A (en) * 1985-09-03 1987-06-02 Feng I Ming Keyboard device for inputting oriental characters by touch
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
US4689743A (en) * 1986-02-11 1987-08-25 Andrew Chiu Method and an apparatus for validating the electronic encoding of an ideographic character
US5109352A (en) * 1988-08-09 1992-04-28 Dell Robert B O System for encoding a collection of ideographic characters

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1524234B (zh) * 2000-12-27 2010-05-26 英特尔公司 用于转换字符代码的设备
CN106133654A (zh) * 2014-03-25 2016-11-16 朴仁基 汉字输入设备和方法以及使用该汉字输入设备的汉字搜索方法

Also Published As

Publication number Publication date
KR910015914A (ko) 1991-09-30
GB2228604B (en) 1993-04-21
KR0163178B1 (ko) 1999-01-15
JP3292372B2 (ja) 2002-06-17
GB2228604A (en) 1990-08-29
US5212769A (en) 1993-05-18
GB9003896D0 (en) 1990-04-18
CN1024050C (zh) 1994-03-16
JPH02289100A (ja) 1990-11-29

Similar Documents

Publication Publication Date Title
CN1024050C (zh) 对汉字进行编码和译码的方法和装置
US5187480A (en) Symbol definition apparatus
CN1156741C (zh) 手写汉字识别方法及装置
CN1607491A (zh) 使用操纵杆输入中文的系统和方法
CN87107540A (zh) 选取,存储和显示汉字的方法和设备
CN101067766A (zh) 输入法中取消字符串的方法及文字输入系统
CN1140868C (zh) 表意语言及非表意语言的文字输入系统
CN1591297A (zh) 汉字输入方法及装置
CN86101871A (zh) 选择和再生语言字符的方法
CN1316689A (zh) 汉字输入装置和方法
CN1862472A (zh) 借由提交不全字和/或任意给定字的不全笔画的表意语言短语的缩写手写输入
CN1237435C (zh) 中文字形输入法
CN1342276A (zh) 键盘输入设备、方法和系统
CN1180858A (zh) 字符输入装置
CN1136496C (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN1109311C (zh) 在字间插入特定字符码的装置和方法
Stallings The morphology of Chinese characters: a survey of models and applications
CN1177285C (zh) 超大型汉字信息处理装置及方法
CN1257445C (zh) 音义码汉字输入方法
CN1334503A (zh) 计算机汉字活码输入法及其键盘
CN1521660A (zh) 一种手写体文本的生成方法及保存方法
CN1395195A (zh) 东巴象形文字计算机处理技术
CN1246758C (zh) 计算机四角码汉字输入法及其键盘
CN1598743A (zh) 按规范笔顺输入汉字的输入法及其键盘
CN1028457C (zh) 一种笔画数码加声码的汉字计算机输入系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C53 Correction of patent for invention or patent application
COR Change of bibliographic data

Free format text: CORRECT: PATENTEE; FROM: JIMULONGGE; PONTECH INC TO: PENG JIN

CP01 Change in the name or title of a patent holder

Patentee after: Peng Jin

Patentee before: Gim Pong

Patentee before: Pontech INC

C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee