CN87107540A - 选取,存储和显示汉字的方法和设备 - Google Patents

选取,存储和显示汉字的方法和设备 Download PDF

Info

Publication number
CN87107540A
CN87107540A CN198787107540A CN87107540A CN87107540A CN 87107540 A CN87107540 A CN 87107540A CN 198787107540 A CN198787107540 A CN 198787107540A CN 87107540 A CN87107540 A CN 87107540A CN 87107540 A CN87107540 A CN 87107540A
Authority
CN
China
Prior art keywords
chinese character
font
display monitor
chinese
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN198787107540A
Other languages
English (en)
Inventor
阿米兰·卡门
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
United Development Inc (hk) St John's Building 33 Garded Road Central Hong K
Original Assignee
United Development Inc (hk) St John's Building 33 Garded Road Central Hong K
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Development Inc (hk) St John's Building 33 Garded Road Central Hong K filed Critical United Development Inc (hk) St John's Building 33 Garded Road Central Hong K
Publication of CN87107540A publication Critical patent/CN87107540A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

在设有一存储着笔画字,特别是汉字的数据库的存储器的计算机化系统中选取和存储该笔画字的一种方法和设备。使用者可将数据库扩充,并根据其中笔画字的语音和图形属性进行检索,设备包括一高分辨率的显示监视器和具有特定用途的光笔。显示监视器用以显示笔画字,光笔设有至少两个选择开关,用以选取所希望的字。

Description

本发明涉及选取、存储和显示中文书写字符即汉字的方法和设备。这里所说的汉字,不仅是指汉语所用的汉字,也是指广泛应用于诸如日语、朝鲜语中的那些汉字。以下所说的汉语应视为包括使用汉字的其它语言。
本发明特别是涉及一种汉字文字处理系统,在该系统中,各汉字是遵循预定的、对熟悉的汉语语音和字形结构的人来说极其自然的规则从一大批汉字中选择出来的。此外,汉字是以实质上有效利用计算机存储器的方式进行存储的。
目前有一些方法是适宜选取输入到文字处理系统的汉字的。为了解这些方法,特别是了解它们的缺点,首先需要了解汉语的特点和它与西方音素语言的不同点,正是这些不同点通常限制了说汉语的人们使用打字机、计算机和文字处理系统。
键钮少于100个的普通键盘,是为音素语言设计的,这类语言,构成字所需的字形字符(即字母)少。如果用这种键盘以相应的方式直接输入汉字,就需要数千个键钮,因为汉语和西方的音素语言不同,具有数千个汉字。因此,普通键盘对汉字输入是不实用的。
为了解现有技术选取汉字的方法,必须了解汉语的结构。汉语的语音结构受一定的限制。在汉语口语中,只有412个基本语音单位,各语音单位的发音都是单音节的。各语音单位有可能加以四个声调,因此总共约有比一千稍微多一点的不同语音。相比之下,象英语这样的音素语音可能有数千个不同的语音。
汉语口语中每一个不同的语音是一个词素,就象英语中的GO、SIT、MOON那样具有一定语义的词。通常,除一些后缀和词缀外,汉语口语中没有象英语中的SEN、MIN、GA等那样没有意义的音节。
汉语各种不同的语音除本身是具有一定意义的语义单元外,事实上大多数语音单位通常具有几个,有时甚至是几十个,不同的语义。汉语口语中因几乎所有的语音都是具有许多语义所引起的潜在混乱,有一个独特的解决方法。大部分汉语词是用两个语音组合表示的,两语音个个都有自己的意义,双语音的语义可能与其组成部分的语义有关,也可能无关。虽然大多数汉语词素会有许多不同的意义,但组合如此两个词素时,得出的双词素词,其意义一般总是明确的。
此外,汉语词的双音节结构也影响了更复杂词语的结构。汉语口语和书写语在其发展历史进程中积累了大量的成语和习语,这些成语和习语在许多情况下是由四个字组成,说出来是四个音。在许多情况下,这些复合词是由两个双音节词组合成,而且往往表达一个复杂的词义概念。
尽管汉语各语音单位和声调组合一般具有许多语义,但汉字却大部分是单义的或具有一个基本意义。这与西方的音素语言具有显著的区别,在西方音素语言中,思想的交流通常是借助于清晰的语音表达方式进行的,这些思想写成书面时实质上是以字母为代码表示的。在汉语及其相关语言中,书写出来的东西直接表达了思想本身,因此读者无论操什么方言都能理解它。
尽管汉语是以独特的方式发音,但数千个汉字中有几百个是可以一种以上的方式发音的。此外,有些语义单元在口语中的发音与书面表达的不同。这种变化虽然有一些是涉及到语音单位本身,但多数是涉及到声调方面。
汉字是由描绘实物开始而形成的。在汉字进化演变的过程中,新的汉字是全部或部分借助现有汉字和改变现有汉字的形状形成的。因此,有一些字元和字的组成部分出现在一个以上的字中,尽管它们在各不同的字中并不总是以完全相同的形式或在相同的位置上出现。此外,由于汉字在历史发展过程中是不断变化着的,因而汉字按字元的表示方式并没有系统性的规则可循。
出现在好几个字中的字元通常有两种:
(1)标音符号,这大部分是从原先已知的汉字中借用过来的,具有特定的读音,用以表示新字的发音;和
(2)语义符号,或字根,这大部分是从原先已知的汉字中借用过来的,具有某种意义,为表示新字的思想根源而设计的。
然而,汉字的确切字义并不总是可从其字根推测出来的,汉字的发音也不能从音素得到一个明确的启示。汉字必须作为一个完整的单元逐字学习和记忆,包括汉字的组合字形、字音和字义。
从以上的介绍可知,汉字并不是象西方音素语言那样,念字时是作为字形的组合进行的,而是作为其整体形式具有具体意义的独特形象的字型进行的。有些字型可能会与其它字型共享一些图形字元,但这些组成部分的组合完全不象音素语言那种将字母组合成字的过程。另外,尽管大部分字型与其它字型在字音上具有一定的联系,但各字型却只与特定的意义具有独特的联系。
相反,书写音素文字时,字母结合成音素串以形成字。各个字通常具有独一无二的发音。在汉语中,汉字是用具有相关的发音的独特完整的形象表示的,尽管该发音会与其它汉字的发音是共同的。
在多数语言中,包括汉语在内,不同的字使用的频度变化很大。有些字经常使用,有些字极少遇到。一般说来,将近90%的口语和书面词汇是由不到一千的词组成的,有些词只占所使用总词数的5%。在汉语中,对分别由一个或两个汉字组成的单词素单词和双词素单词来说,确是如此。
鉴于汉字是用以直接表意的文字,不同类别的人会以使用音素语言中的不同词汇颇为相同的方式使用不同的汉字。因此,由于工程师使用不同于律师或医生所使用的词汇,因而他还熟悉普通基本汉字组以外的汉字。音素文字就不会遇到这种情况。在音素文字中,全部单词都共用数目有限的一套字母,而且起码通过音标注音就可读出任何单词。
现有技术在文字处理系统中选取汉字的各种方法都是根据书写汉字结构的一种或多种属性进行的。因此,举例说,在认字选配法中,汉字是从庞大的静态显示屏上选取的,这时全部汉字是同时被展示出来的。汉字被直接加以选用,与在音素文字中直接选用字母的方式一样。这种方法的缺点在于,要从如此庞大的汉字显示屏中认出所需用的汉字有困难;装置的结构庞大;甚至对高度熟练的操作人员来说,这种方法也是极其厌烦的,而且速度较慢。
在另一种可供选择的系统中,各汉字系赋予一个印在普通键盘上的数字或拉丁字母的代码。然后译出代码以选用相应的汉字。这种方法要求熟记各汉字的代码,因而其用途局限于那些高度熟练的操作人员。
在造字法中,汉字是由其各字元组合造出的,而这些字元,如前面谈过的那样,由于汉字的演变和发展的结果,会是一个以上的汉字所共有的部分。这种方法的缺点是,造出全部汉字需用大量字元(214个字根和858个音素)此外,字元在不同的汉字中的形状和位置都不同,甚至需要增加表示汉字所需用的字形单元。在这类系统的一个实际实施方案中,键盘上的键钮达数百个,各个对应于每一个可能存在的字元。汉字是通过依次按压几个键钮打出来的。
个人计算机中使用的仓颉法就是采用了这种方法。在这种方法中,数十个主要字元被分派到普通计算机键盘的各键钮上。汉字是通过输入这些字元的相应组合和顺序选取的。这种方法需要经过大量训练,因为各制造厂家在联系各字元与小量可使用的键钮方面是采取不同的对策的。
这种方法在台湾研究出来的另一个方案有三角法,其中,对各字元赋予的不是字母代码而是数字代码。各汉字用三个二数字代码表示。
在仓颉法的基础上,三角法和所有其它的造字法的目的是采用普通的字母数字键盘以一连串预定字元的形式造字。这和音素文字中的构词法相似,在音素文字中,构词成分是拼写单词用的字母。但这种方法不适用于汉字,汉字中含数百个字元,各汉字是由小量的这些字元构成,而不是按规定的某一套规则构成的。因此,要根据汉字字元设计出一套具有逻辑一致性因而也易于学习的方法,实质上是不可能的,而这个缺点都反映在所有的造字法上。
汉字的另一种造字法是对汉字的各笔画加以规定。汉字具有数目有限的基本笔画,汉字可根据引入笔画的严格规则由1和33个之间的这类笔画构成。因此有可能通过规定小量的基本笔画来显示数目较少、笔画按规定顺序出现的汉字组,再从该显示中选取所需用的汉字。在这种方法的一个实际应用中,只输入所需用汉字的头一笔和最后一笔笔画,所有始末笔画组合相同的汉字都被显示出来供最后选择用。通过指定其始末笔画选用汉字不仅是牵强的而且需要集中注意力,特别是选用笔画多于一般笔画的字时更是如此。因此这种造字的方法尽管由于是建立在意义明确的规则上而在理论上具有一定的吸引力,但迄今这种方法还是不能令人满意。
在另一种选取汉字的方法中,是将汉语发音的412个语音单位用发音单位用发音符号表示。在中华人民共和国通用的拼音字母系统是用拉丁字母表示汉字的发音。通过以拉丁代码的形式输入语音,就会有一系列语音结构相同的汉字显示出来供最后选择用。这种方法的缺点是,在最后进行选择之前需要将汉字译成辅助性的文字,因而必须熟悉译码和翻译步骤。鉴于汉语的发音有许多方言上和文化上的变化,因而总不能轻易地物色正确表示汉字所需用发音符号的正确次序。这个问题对汉语口语中的许多难以以明确的拉丁代码表示的半音更为突出。
尽管这种指定组成汉语语音的音素来选取汉字的方法迄今未能令人满意,但许多人都认为是最具有吸引力的选择方法。
迄今所提出的选取汉字的方法大多数都需要以数字、字元、笔画或音标代码间接表示汉字,而需要加以指定正是这些表示汉字的代码而不是汉字本身。这就需要确切记住大量间接表示汉字的这些代码,而且由于对借助数目固定的一套键钮的键盘进行输入的代码严加限制,因此这些方法实际做起来灵活性不大。键钮的数目通常是限制在普通字母数字(QWERTY)键盘键钮的数目。为了将此数目不多的一套键钮映射到数量很大的汉字,打字时应按压若干个键钮以产生对应于单个汉字的代码。举例说,在三角法中,各汉字要使用六个数字键,在仓颉法和拼音法中则每个汉字大约需要按压四次或五次键钮。
此外,无论经常遇到的常用字,或是很少遇到的汉字都采用同一套键钮和代码。这使键钮的利用率不高,尤其是汉字因使用者的职业和工作范围的不同而具有不同的分布时,这个问题就更严重。
迄今提出的汉字处理系统有关的主要缺点不仅涉及到汉字的选取方法,而且还涉及到汉字在系统本身的存储方法。要理解这个问题的实质最好参照普通音素文字的存储方法,这在英语中是限制在为数26左右的字母。前面已经说过,在实用文字处理系统中需加以存储的汉字的数目在数千个的数量级,这就需要有存储容量比存储普通语音字母大几百倍的存储器。
之所以需用大型存储器不仅仅是由于汉字的量大,而且也是由于汉字本身显示格式的原因。汉字既细致了复杂,因而需要比字母字符更大的显示格式。因此,如果说字母字符可在5×7或5×10个象素的网格上显示,汉字就需要在起码24×24象素的网格上才能清晰地加以识别。只有在48×48象素的网络上才能获得高分辨率的显示。计算机存储器普通存储字符的方法是采用位图,各象素用一个二进制位表示。因此形成位图时存储一个汉字所需的位数约比存储一个字母字符所需位数大16倍(即576对35)。
按惯例,许多计算机化汉字处理机的存储器的存储量在10000字符以上。然而,即使在形成24×24位图过程中只存储5000个通用汉字也需要存储器具有2,800,000位,而整个拉丁字母则可用不到1,000个二进制位存储起来。如果为提高分辨率而将网格增加到48×48,则总共需用12兆位(或接近1.5兆字节)。
可显示出汉字所需要的分辨率不仅影响存储器的要求,而且实质上还限制了可同时加以显示的字符的数目。这是采用根据存储器中预定字符子集的直观显示选取汉字的那些文字处理系统应考虑的重要问题,例如,在认定选配法和那些按笔画或字元选取汉字的方法中,就是这样。
因此以较紧凑的格式高分辨率存储汉字的方法不仅在存储器要求方面有好处,而且更重要的一点是,直接影响选择方法本身的效率。此效率与高分辨率显示监视器的使用有关。
迄今所提出的汉字处理系统有关的缺点还涉及复制文件打字的难易问题。在理想的系统中,文件复制打字员通常是把注意力集中到待复制的文件上,只是定期地浏览一下输入了的行文。在现有技术的汉字处理系统中,这种作法只适用于那些使用有限数量键钮的机械式键盘输入一系列代码来选取汉字的系统。对那些将信息显示在显示监视器上供操作员选取的系统,操作员是不可能同时把注意力集中到输入的文件上又集中到显示监视器上的。
本发明的一个目的是提供一种选取、存储和显示汉字的方法和设备,该设备既能以较紧凑的格式存储汉字,又能克服与迄今所提出的选取方法和系统有关的一些缺点。
根据本发明,本发明提供一种包括一个存储器的电子计算机化系统,一种选取和存储特定汉字的方法,该方法包括:
显示对应于表示所选取的汉语语音单位的第一系列汉字;
从所述第一系列汉字中选取与特定汉字同音的代表性汉字;
识别所有与所述代表性汉字同音的汉字;
显示第二系列所述经识别过的汉字;
从所述第二系列汉字选取所述特定汉字;和
将所述特定汉字存入所述存储器中。
第一系列汉字包括所有那些具有与它们有关的、发音明确的汉字。此步骤是符合汉语要求的,因为许多词典中在其拼音表中都注有代表性的汉字。
选用常用汉字作为代表性汉字对选择过程有利。在一个最佳实施例中,第一系列含412个汉字,鉴于该400个最常用的汉字代表70%以上的使用频度,因此最好在第一系列中只显示这些极常用的汉字。然而,这样做并不完全合适,因为有些字音极少用,有些极常用的汉字不能用以明确代表某一特定字音。将这些罕用字音的代表性汉字包括进去并从第一系列中除去“含糊”的通用汉字,使用系数也仍然在50%以上。
在一般含7000汉字的字典里,同音字数最多约为140个。但每个音标组字数的中间值约为20个。因此,在大多数情况下,第二系列中与第一系列中的代表性汉字同音的汉字数是小得足以有效地选取所希望的汉字。
本发明的另一个实施例考虑了在第二系列中有大量汉字的场合汉字的使用频度。在这种情况下,只在开始时显示第二系列中的通用汉字,其余汉字则只有当在那些通用汉字中找不到所要求的汉字时才显示出来。虽然对非通用汉字来说这一下增加了显示和选取阶段,但在所要求的字是通用字时,在大部分情况下显示和选择速率的提高大大弥补了这个明显的缺点。
按频度分布显示汉字可以极其快速地选择最常用的汉字,因为由于汉字的频度分布不对称,这些汉字通常是会即刻显示出来。借助于一个软件设施,我们提高了此实施例的实用性。该软件设施在系统使用过程中积累频度数据并调节所存储的随系统供应的频度分布,以便与个别使用者的非标准词汇联系起来。
在本方法的另一个实施例中,汉字的选取可通过按正确顺序输入字元笔画,和提供显示少量最常用汉字和含有规定笔画顺序的字形元素(可以是语音元素或字根)的重复程序来进行。若所希望的汉字没有显示出来,但屏幕上出现其第一字形元素,则可选用字形元素,于是会显示出少量含此字形元素的最常用汉字。不然也可以输入另外一些笔画。屏幕上出现所希望的汉字时就选用它,这时重复程序加快了选择过程。
笔画可按两种方法输入到系统中。一种方法是不断显示基本笔画表,从表中选取想用的笔画。另一种方法是配备一种在与系统有关的显示监视器上真的画笔的设施,因为与其用上述方法反复选择所希望的笔画,往往不如画笔画更为方便。
为能将各种系列清晰显示出来,必须采用高分辨率的屏幕,且各汉字应在高分辨率下存储。存储汉字的一个值得推荐的方法是存储能组成系统中全部汉字的具有代表性的笔画群。这样只需要存储少量笔画,因而可以在高分辨率下存储而无需使用过量的存储器。这时字符本身以能区别所有笔画组成和它们在汉字中的位置的压缩形式编码。
实现本发明的任何方法一个值得推荐的设备包括一台电子计算机,经一个高速图形处理机耦合到一个分辨率极高的显示监视器。显示在监视器上的特定信息可借助于设有两个微动开关的光笔进行识别,从而可以通过合上其中一个微动开关直接存储经识别的汉字,并通过合上另一个微动开关显示有关汉字。
现在参照附图就文字处理系统选取和存储汉字的方法和设备介绍本发明的内容。附图中:
图1是本发明选取汉字的若干方法的流程图;
图2是图1中所说的语音表;
图3是图2中语音表的有关细节;
图4是按汉字的字形属性选取汉字的详细示意图;
图5是本发明设备的功能方框图;
图6是图5所示设备的一部分的方框图细节;
图7是图5所示设备的一部分的方框图细节;
图1是本发明各种选取汉字的方法的示意图。从图中可以看出,选取汉字基本上有三种不同的方式,图中以“直接选取”、“语音”选取和“字形”选取表示。在直接选取方式中,在显示监视器2的第一区1(图3和图4)内显示有一些最常用汉字(包括数字和标点符号)和词组的选集。用光笔可以识别这些字或词组的其中一个(下面即将详细谈到),并通过合上与光笔有联系的第一微动开关把它直接存储起来。然后将所选出的字或词组显示在显示监视器2的第二区3(图3和图4)内,并存储在与一随机存取存储器有联系的文本缓冲器中,下面即将详细介绍。在第二区3上方可以看到一个文件窗口4,文件经手持式描述器扫描过后即可每次一行地显示在该窗口中,下面即将参照图5详细介绍这个过程。
在语音或字形选择的情况下,各汉字是通过基本属性之一(其特定发音、其主要字形组件或其笔画配置)查找和显示的。图2是对应于具有代表性的汉语语音的语音表5(构成第一系列汉字),此表是在语音选择方式的头一个阶段时显示在显示监视器2上的。把光笔放在与待输入的特定字同音的代表性汉字上,并按压与光笔有联系的第二微动开关,在显示监视器2上就会显示出与代表性汉字同音的第二系列汉字。这时将光笔放到特定汉字上并按压第一微动开关就可以从第二系列汉字中选取待输入的特定汉字。代表性汉字本身也可通过按压第一微动开关用光笔加以识别之后直接从语音表5中选择出来。在此情况下,选择过程加快,因为无需显示第二系列汉字。
语言表5是按汉语语音规则作为二维矩阵编制的。汉字通常是以辅音-元音(CV)或辅音-元音-辅音(CVC)或辅音-元音-元音(CVV)的形式发音的,因而大部分语音表达式以辅音开头。汉语语音表和字典中共有21个辅音,它们列入矩阵的一列6中。矩阵的行7中列有37个元音(V)、元音-辅音(VC)和元音(VV)音节。
这种配置没有表示出全套语音,因为有少数汉字并不是以辅音开头的,而是从上面所列的37个V、VC或VV中引出的。因此需要给矩阵另加对应于“零辅音”的行8。
图2所示第一系列汉字的这种配置方式方便了汉字的选择过程,因为使用者查找所希望的音节时只要核对适当的行矢量与列矢量的交点即可。鉴于各行矢量与某一已知元音、元音-辅音或元音-元音音素有关,因而具有足够汉语语音表知识的有经验的使用者就会知道应在第一系列汉字的哪一部分查找代表他想选择的汉字的字音。
图3是摘自图2的语音表5的一个部分9的示意图。每次只显示一个部分,不仅可以留出屏面10供显示与所选择的代表性汉字同音的汉字和词组之用,而且具有足够的屏面供正文用。显示在显示监视器2上的部分9包括一个几何键钮11,几何键钮11具有成列配置的四个方块,各方块对应于语音表5的各水平部分。所选取的部分以在几何键钮11的适当方块中呈星形形式的光标12表示。语音表5的任何部分可通过用光笔在几何键钮11内相应方块做标记并按压第一微动开关加以选取,以便显示出来。
上面介绍了显示在显示监视器2的屏幕上的方式键钮的配备。在一个最佳实施例中,用相应的方式键钮鉴别不同的行业。例如,图3中显示了与银行业有关的方式键钮13,此键钮可通过按压微动开关用光笔进行选择。于是所有存储在数据库中对应于银行业的词和词组都被显示出来,从而可借助于光笔及其有关的第一微动开关直接选用所想用的词。
图4显示了进一步缩小第一系列汉字的显示尺寸的方法。图中显示了压缩的语音表14,该表有三行,分别对应于与汉字有关的21个辅音、37个元音-辅音组合和“零辅音”。要从压缩的语音表14选取代表性汉字时,可以从行17直接选取“零辅音”汉字,或分别从行15和16选取适当的辅音和元音-辅音组合。
由于汉字发音在地区和方言上有差别,因而有时从第一系列(图2)或其中一部分(图3,4)识别出来的代表性汉字不会在第二系列中显示出所希望的汉字组。当若干代表性汉字具有汉语不同方言所易于混淆的类似发音时就会发生这种情况。为弥补这一点,在第一系列中的代表性汉字可这样分组,使得在一组中识别代表性汉字时会使与该组中代表性汉字有关的全部汉字都显示在第二系列中。
图2和图3显示如何对第一系列中的代表性汉字进行分组,围住各汉字的框框表示各组的范围。这也可从图4中看出,其中第4行18含有其发音相应于第一系列中的第21个辅音的代表性汉字。从第四行18选择任何代表性汉字,促使所有待显示的与所选组中的各汉字发音类似的汉字都被显示出来。但图2、3和4中所示的分组配置方式仅仅是代表性而已,因为使用者不难根据地区性、语言上、方言上和各人的需要在软件控制下指定不同的组。
再参看图1。可以看出,语音表5不仅可用以选取各个汉字,而且还可用以选取用两个以上汉字组成的多音词和词组。这个方便条件是按两个方法中之一提供的。
前面已经谈过,大部分汉语的词是由两个汉语词素构成,且用两个汉字写成。要选用双词素词时,分别从具有与待选择的双词素词的两词素同音的汉字的第一系列中选取第一和第二代表性汉字。在这种情况下,两次选取都是从第一系列汉字中进行的,结果显示出的第三系列是语音结构对应于第一和第二代表性汉字的代表性双词素词。显示在第三系列中的词数非常少,因为双词素同音异义词是相当罕见的。
同样,可按选用双词素词完全相同的方式选用由多于两汉字表示的多音节词和词组。鉴于对应于所选用的语音的多音节词和词组一般非常少,因而它们可在第三系列中与双词素词一起显示。
当如上所述按语音结构选用单个汉字,或如下面参照图1将谈到的按图形结构选用单个汉字时,可采用另一种方法选用多音节词和词组。若用两种方法中的任何一种方法采用第二微动开关而不用第一微动开关选用汉字,就将识别出的汉字输入到文本缓冲器中,同时显示出表示以所选用的汉字开头的多音节词的第四系列。这时就可用光笔并按压第一微动开关直接选取所希望的多音节词或词组。在这种情况下,第一个字以后的所有汉字都加到文本缓冲器中。
图1还显示了按汉字的字形属性选择所希望的汉字的另一种方式。可以看出,第一个笔画可按在所希望的汉字中画笔画的顺序输入系统中。这促使以特定笔画开头的十个最常用的汉字和字形元素都显示出来。若所希望的汉字出现在该显示中,就可借助于光笔和第一微动开关直接选取。若所显示的是所希望的汉字的字元字形元素而不是所希望的汉字本身,则可按压第二微动开关用光笔选取字元字形元素。这一下就取代了新的一套十个含经识别的字形元素的汉字组。
若这时显示出所希望的汉字,则可马上按压第一微动开关用光笔选取。在屏幕上不出现所希望的汉字也不出现字元字形元素时,可以另外输入笔画,按重复方式重复整个步骤,直到所希望的汉字显示出来以供选择为止。通过显示那些出现频度最高的汉字和字形元素,通常可以发现,在极小的重复次数内即可显示出所希望的汉字。
图4是按照上述方法输入笔画的一个系统的示意图。在显示监视器2上显示有笔画表19,表中列出了组成所有汉字的十五个基本笔画。按正常方式按压第一微动开关,用光笔即可选用这些笔画的任何一个笔画。笔画表19始终显示在屏幕上,以便按需要输入其它笔画。
输入笔画的另一种方法是藉手动操作的方式用光笔在显示监视器2的屏幕上画笔画。这种输入笔画的方法往往深受欢迎,因为汉字的书写是基于存储电动机程序的自动过程,该过程使逐个笔画书写汉字比起按其各个笔画重复地构字更为方便。
为了在显示监视器2上画笔画,对显示监视器2的一个区进行了光栅扫描,使该区看起来亮度均匀。然后令光笔在屏幕的该区上移动,则每次其在屏幕上的位置与某一照亮的象素吻合时,光笔中的光电二极管就发出信号。这样,光笔在屏幕上的移动实际上就产生一系列坐标,从而可通过分析存储在数据库中的笔画图在软件的控制下在位图格式中翻译所输入的笔画。
笔画按这种方式输入的分辨率取决于光笔在屏幕上移动与屏幕本身的刷新速率比较时的相对速率。当用60赫刷新周期扫描显示监视器2时,由于屏幕上的同一个象素每16毫秒会被照量几个毫微秒的时间,因而输入的笔画不可能会有良好的分辨率。在各16毫秒的时间间隔内,光笔在显示监视器2屏幕上移动时所旁路的象素太多,以致使自身不能以令人满意的空间分辨率进行检测。因此需要提高扫描屏幕的速率并将刷新率提高几倍。在一个最佳实施例中,将再生周期的频率提高到180赫,且对屏幕(含三分之一扫描线数)的相应较小的部位进行扫描。
从图4中还可以看到一套可在软件的控制下执行普通文字处理功能的键钮20。
从图1中可以看出,按汉语语音和字形结构选择汉字的各种方法是相互关连的。因此有可能通过指定汉字的语音结构再指定汉字的头一个笔画或字形元素进一步限制汉字的语音结构来选取所希望的汉字。或者也可以指定汉字的头一个笔画或字形元素,再通过指定汉字的语音结构进一步限制已识别汉字的数目。两个汉字主要选择方法的这种相互配合形成了一个具有高度灵活性的系统,这种系统实际上可由操作员加以改编,使得实际上可以在一瞬间选取常用汉字,同时可以极小的重复次数选取较少用的汉字。
本发明的方法都是利用了这样一个事实,即数据库构成这样的结构,使得所有汉字和词组都可按它们的音素和字形元素进行识别。因此从数据库提取所有与构成数据库索引的任何元素相配的汉字和词组非常简单。例如,若要检索字根本身,则选取某一特定字根时会牵连所有含此字根的汉字和词组。多音节词组可通过选取分别与该词组的头两个字有关的两个字根任加选取。同样,选取分别对应于头两个字的头一个笔画的笔画会识别出所有与特定笔画组合相配的单词和词组。选取第一个字的发音和第二个字的字形元素同样会牵连数量有限的一组单词和词组,如此类推。
参看图5。从图中可以看到中央处理机21,地址和控制总线22和数据总线23与中央处理机21相连。数据总线23分别连接到随机存取存储器(RAM)24、大容量存储器25、只读存储器(ROM)26和第一和第二图形处理机27和28(例如,如INTEL    82786的商标名制造和出售的图形处理机)相应的输入端。这些器件各个都由中央处理机21通过地址和控制总线22分别借助于双向缓冲器29a、29b、29c、29d和29e进行控制,地址和控制总线22则连接到三个存储器24、25和26以及两个图形处理机27和28。
中央处理机21借助于存储在ROM    26中的指令系统进行控制,大容量存储器25则最好是一个磁盘驱动器。中央处理机的定时信号获自以25兆赫第一时钟频率运行的时钟(图中未示出)。
第一图形处理机27分别通过第一水平同步线路31和垂直同步线路32耦合到光栅扫描监视器2。视频数据沿第一视频数据线路33传输,显示监视器2即借助于视频数据线路33通过加速器电路34耦合到第一字形处理机27上。第一图形处理机27也连接到第一位图存储器35,字形数据即借助于第一位图存储器35沿数据总线36传输到第一图形处理机27,并从第一图形处理机27传输出去。
第二图形处理机28以类似方式处理存储在第二位图存储器37中的数据,第二位图存储器37则通过数据总线38耦合到第二图形处理机上。第二图形处理机28分别通过第二水平和垂直同步线路40和41以及第二视频数据线路42耦合到激光打印机39上。激光打印机39由激光打印机接口43控制,这种打印机是打印本发明所选取和存储的印刷汉字文本值得推荐的装置。
显示监视器2上所显示的数据可借助于光笔44加以识别,数据即由光笔44通过缓冲器电路45传输到数据总线23上,缓冲器电路45则借助于地址和控制总线22和数据总线23耦合到中央处理机21上。此两总线也可连接到调制解调器46上,借助于调制解调器46就可与其它系统进行通信。
在本发明的一个实施例中,采取了这样一个措施:将手持式扫描器47(象日本Canon公司和Epson公司出品的那一种)通过地址和控制总线22和数据总线23连接到中央处理机21上。扫描器47适宜对文件进行扫描并将文件上的正文数字化成位图的格式。然后将位图存储在第一位图存储器35的一个区域中,再由第一字形处理机27进行处理,以便将一行正文显示在显示监视器2上方的文件窗口4(图3和4)中。用光笔在文件窗口上做出标志并按压第一微动开关77或第二微动开关78就可以分别在文件窗口中将文件下卷或上卷。
图6是图5中所示的加速器电路34更详细的示意图。出现在第一视频数据线路33上的视频数据是以TTL(晶体管逻辑)逻辑信号的形式存储在第一位图存储器35中的,这对所要求的高数据传输速率来说是太慢了。因此将第一图形处理机27所产生的视频数据馈到TTL-ECL(发射极耦合逻辑)转换器50上,转换器50的输出则每次8位地馈到移位寄存器51中。视频时钟52控制着移位寄存器51,提供200兆赫的第二时钟频率,即为中央处理机21时钟频率的八倍。
移位寄存器51将视频数据从并行转换成串行格式,并将得出的串行数据通过缓冲器53馈到控制着显示监视器2的CRT(阴极射线管)控制电路54。馈到CRT控制电路54上的还有水平同步线路31和垂直同步线路32。
由视频时钟52控制的移位控制电路55耦合到移位寄存器51上,用以控制移位寄存器51的串行和并行操作。从移位寄存器控制电路55获得的ECL逻辑时钟数据借助于ECL-TTL转换器56转换成TTL逻辑,然后馈到第一图形处理机27,从而使第一图形处理机27可使并行输入与移位寄存器51及其串行输出同步。
参看图7。这是与光笔44有关的线路更详细的示意图。光笔44适宜检测显示监视器2中的一个象素所发出的光60,该光由光学组件61加以放大。光电二极管62检测出经放大了的光输出,其输出则由放大器63放大然后借助于高通滤波器65耦合到触发器64上。
触发器64的输出馈到位置检测电路70,该电路识别显示监视器2上光笔44所识别到的象素位置。位置检测电路70具有分别通过第一水平和垂直同步线路31和32耦合到第一图形处理机27的扫描行计数器71。这样,扫描行计数器71就显示监视器34的扫描行同步,因而能够确定哪一扫描行含有在任何时刻使光笔发亮的象素。列计数器72接收来自第一水平同步线路31和来自视频时钟52的信号,因而能检测出在所识别的扫描行中阴极射线的位置,从而精确确定所识别象素在显示监视器2上的位置。行和列数据分别馈到行和列缓冲器73和74上,该缓冲器的输出则通过地址和控制总线22所控制的坐标缓冲器76馈到数据总线23上。
光笔44配备有第一微动开关77和第二微动开关78,微动开关的状态(即打开或闭合)则由并-串行编码器79加以编码。当两微动开关中的任一个闭合,编码器79就发出信号并馈到地址和控制总线22所控制的状态缓冲器80上。状态缓冲器80的输出馈到坐标缓冲器76上,可由中央处理机21通过数据总线23从坐标缓冲器76中读出。
系统的工作情况如下。ROM    26存储着所有文字处理系统工作所需要的字符数据。此字符数据有一些是编入含有全部可使用的可能汉字的数据库中,同时RAM    24的一部分则用作存储用文字处理系统制备的文本数据的文本缓冲器。存储在RAM    26中的汉语数据库是不断变化的,而且能造出新字的使用者不难对其加以扩充并加到数据库中。
数据是在显示监视器2的屏幕上显示出来,用光笔44加以识别。显示监视器2如此识别过的区域借助第一图形处理机27控制下显示出来的光标使其变得突出起来,从而给使用者提供光笔44的位置的直观反馈。显示监视器2屏幕上的一个被照亮的象素促使光笔44中的光电二极管62发出信号,经放大器63放大后促使触发器64改变状态,从而确认收到了光笔信号。不难理解,虽然显示监视器2上的许多象素看来是同时被照亮的,但实际上是每次只有一个象素被照亮。位置检测电路70实际上根据水平和垂直扫描同步信号确定哪一个象素在光笔因第一微动开关77或第二微动开关78关闭而被触发时照亮。
第一图形处理机27是一个将第一位图存储器35的内容写到显示监视器2屏幕上用的高速率电路。第一位图存储器35是这样组织的,使其一位存储器对应于显示监视器2的各象素。第一位图存储器35不断地根据视频时钟52所产生的定时信号接受扫描。因此要改变显示监视器2屏幕上的显示图形时只需改变第一位图存储器35的内容即可。
进行了这样的安排:由第一图形处理机27在少于一个扫描周期的时间对第一位图存储器35进行更新,使得显示监视器2上所显示的信息,其变化效果看起来是瞬时发生的。第一图形处理机27的书写能力为200兆位/秒,或每60赫扫描周期超过3兆位。这大大超过了甚至在象素超过一百万分辨率极高的显示器上显示所需的总位数,就象本发明为同时显示全部所需要的信息所需用的位数那样。
加速器电路34使如此高分辨率的显示监视器中的大量象素可以所要求的极高速率进行写入。例如,为在非交错系统中以60赫的刷新速率写入一百万个象素时,需要有一个大约90兆赫的视频。
加速器电路34中的移位寄存器51从第一位图存储器35以并行格式每次八位地读取数据,并将此数据以串行格式输出到显示监视器2上。为确保移位寄存器51的串行输出保持与并行输入数据同步,需要使给移位寄存器51的时钟频率为第一图形处理机27的八倍。第一图形处理机27从时钟频率为25兆赫的中央处理机21获取其定时信号,因此驱动移位寄存器51的视频时钟52在200兆赫频率下运行。
第一位图存储器35中数据的编排是由中央处理机21从由磁盘驱动器25或由ROM    26存入RAM    24的数据加以控制的。图形处理机27必须快速存取的数据保留在RAM    24中,同时必要时,其它数据可在程序控制下转移到RAM    24中。数据是分编为下列四部分的综合数据库形式在RAM    24中加以编排的。
(1)基本笔画及其变型的数据库;
(2)字笔画图,其中为各汉字都在笔画库中存储有其各组成笔画及其在字显示网格的座标;
(3)汉字属性表,其中为各汉字都存储有其发音、声调、笔画顺序表、字根和语音元素类型;和
(4)多音节词和词组的词典。
数据库这样编排,使得选取某一特定笔画或字根时可以识别含有所选用的笔画或字根的数据库中的所有汉字。同样,选取某一特定语音单位时可以识别共享此语音单位的数据库中的所有汉字。此外,选取某一特定汉字时可以识别所有共享所选汉字的所有多音节词和词组。在所有有情况下,识别是通过参照数据库中的属性表进行的。
由于各汉字是只参照较小笔画库存储在数据库中,因而只需存储笔画库的内容,从而可以较紧凑地存储汉字和单词本身。诸汉字通过参照数据库中的笔画图重构以便显示和打印。通过这种方式存储和重构汉字而节省计算机存储器的作法,使若干笔画库可只需增加极少量的存储器加以存储,各笔画库可存储对应于,例如,24×24或48×48等位图分辨率的不同放大率的笔画。当需要以放大了的格式显示或打印汉字时,位图数据系从对应的笔画库读取。这种方法使汉字可以高放大率加以显示,同时分辨率比普通位图汉字存储器的有所提高,在普通的位图汉字存储器中,字形清晰度上的缺陷都连同字形本身一起被放大了。
需要在显示监视器2上显示汉字时,第一图形处理机27在中央处理机21的控制下工作,从存储在RAM    24中的数据库造字;这个过程在使用者看来是瞬时发生的,因为第一图形处理机27的速度高。
RAM    24中的数据最好在激光打印机上打印,在此情况下,由与第二位图存储器37联合动作的第二图形处理机28编排格式。第二图形处理机28产生分别出现在线路40和41上的水平和垂直同步信号,用以以类似于显示监视器2的扫描系统的方式控制激光印刷机39的扫描过程。
显示监视器2上所显示的数据不仅包括从RAM    24中的数据库获取的汉字信息,而且也包括一系列使使用者可根据上面参照图1至图4所介绍的诸方法中的任何一种方法选取汉字的方式键钮。用光笔44进行识别时,通过合上第二微动开关78启动方式键钮。
光笔44连同和其一起的微动开关77和78特别适宜用本发明的方法高效率地选取汉字。同时,众所周知,在光笔中可装设开关装置,供必要时触发光笔之用。这与随本发明的光笔一起提供的两个微动开关不同,本发明光笔的两个微动开关是真正把光笔与控制中央处理机21的指令结合起来,以便不仅视乎(象迄今用所建议的光笔)所识别的屏幕区,而且也视乎操动的是哪一个微动开关进行不同的选择。
虽然上面是就文字处理系统介绍本发明的一个实施例,不言而喻,本发明选取汉字的方法也适用于任何输入汉字以供存储和进一步处理的计算机化系统。同样,用扫描器将原始文件数字化成位图格式显示在显示监视器上的方法和系统也可用于一般用途。
此外,本发明使汉字往计算机系统的输入无需用普通键盘而是通过在高分辨率的屏幕上显示供选择的输入数据来进行。这个原理可推广到任何从屏幕直接输入以数字、汉字或词组的方式输入的数据的应用程序(例如,数据库、财务棋盘式帐目分析表等)。因此,举例说,采用分辨率为1600×1200象素的超高分辨率的显示监视器时只需用其三分之一的显示区来显示输入数据,剩下的三分之二显示区就可用以同时执行应用程序。
参照,例如,执行财务棋盘式帐目分析表程序的计算机系统就更容易理解这一点。适当的棋盘式帐目分析表系在存储于计算机存储器中的主程序的控制下显示在显示屏幕的主要部分的。假设在计算机的控制下需要将标准数据输入棋盘式帐目分析表中。数据通常是对应于字母数字文本数据,这种字母数字文本数据在迄今提出过的系统中系借助于耦合到计算机的键盘输入的。
根据本发明所提出的方法就不需用这类键盘,因为文本数据不是显示在显示屏幕的主要部分上而是显示在辅助部分上。文本数据是在存储于计算机存储器中的辅助程序的控制下显示出来的。在一个最佳实施例中,文本数据系编排得使得在第一阶段的显示中只显示较常用的选择对象,较不常用的选择对象则依次在程序控制下显示出来,直至所希望的数据出现在屏幕上为止。
具体的数据项是从显示屏幕的辅助部分直接指着该数据项选取的。这可用上述光笔来进行,也可利用本技术领域中周知的其它用具。要识别特定数据项群(这些数据项群接着是要显示出来供选择的)时,可显示方式键。
数据本身可作为结构数据库存储在计算机的存储器中,因而采用一般数据库选择技术就可通过选取针对所需要的数据项的较高位数据以较少的重复次数显示当时所需要的特定数据。在这种布局下,可采用设有两个选择开关的光笔,这样,用一个开关识别数据项时就可选出数据项并将其输入到应用程序中,用另一个开关进行识别时就使较低位数据显示出来。
此外,这种布局可适用于这样的情况,即光笔不仅用以从显示屏的辅助部分选择数据,而且用以将数据的插入点定位入显示在显示屏主要部分上的应用程序中。这可通过用光笔识别数据的插入点然后,例如,按压第一选择开关进行。由于这时光笔的位置对应于显示屏的主要部分,因而,不言而喻,上一次所选择的数据项应插到该特定位置上。或者也可以先识别显示屏辅助部分的插入点,再从显示屏的主要部分选取数据项。

Claims (38)

1、在具有存储器的计算机化系统中选择和存储汉字的一种方法,其特征在于,该方法包括下列步骤:
显示对应于汉语语音单位代表性选择的第一系列汉字;
从所述第一系列汉字中选取与特定汉字同音的代表性汉字;
识别所有与所述代表性汉字同音的汉字;
显示第二系列所述经识别的汉字;
从所述第二系列选取所述特定汉字;和
将所述特定汉字存入所述存储器中。
2、根据权利要求1的方法,其特征在于,所述第一系列中的语音单位是分组配置,因而选取其中一个所述组中的任何代表性汉字时可以显示含有与所述组中所有代表性汉字同音的汉字的第二系列汉字。
3、根据权利要求2的方法,其特征在于,使用者可根据具体地区、语言、方言和个人的需要修改所述语音单位组。
4、根据权利要求1的方法,其特征在于,所述特定汉字由所述代表性汉字组成。
5、根据以上任一权利要求的方法,其特征在于,所述第一系列是按矩阵配置,矩阵的第一边对应于汉语辅音,第二边对应于汉语元音-辅音组合,使得可以通过行和列矢量的交叉点识别语音单位。
6、根据权利要求5的方法,其特征在于,所述第一系列是以第一压缩格式显示出来,使所述第一系列各不同部分可用各自的预定几何键加以识别,各所述键是这样显示,使得通过选择一个所述键来显示所述第一系列的相应所述部分。
7、根据权利要求5的方法,其特征在于,所述第一系列是以第二压缩格式显示,从而显示与所述第一和第二边有关的音素,所述语音单位则通过先后识别各音素选取。
8、在具有存储器的计算机化系中选择和存储含有多个成预定序列的字形元素(对应于音素和字根)的特定汉字的一种方法,其特征在于,该方法包括下列步骤:
往所述系统中输入对应于所述特定汉字笔画顺序的笔画;
识别所有其笔画顺序对应于所述输入了的笔画的汉字和字形元素;
显示预定数目的最常用的所述经识别的汉字和字形元素;
当所述显示出的汉字中包括所述特定汉字时:
当所述显示出的汉字中选取所述特定汉字;然后
将所述特定汉字存储在所述存储器中;
当所述显示出的汉字中没有包括所述特定汉字时:
当所述显示出的字形元素包括所述特定汉字的字形元素成分时:
选取所述字形元素成分;
识别所有含有所述字形元素成分的汉字;并
显示预定数量的最常用的所述经识别的汉字;然后
按需要重复输入、识别和显示的操作循环。
9、根据权利要求8的方法,其特征在于,往所述系统输入笔画的方法包括:
显示代表性的笔画组,和
从所述笔画组中选取所述笔画。
10、根据权利要求8的方法,其特征在于,往所述系统中输入笔画的方法包括:
画出所述笔画,供所述系统读取。
11、根据权利要求10的方法,其特征在于,所述笔画是在所述系统有关的光栅显示监视器的预定区内画出的,且
提高与所述预定区有关的光栅扫描速率,从而使所述笔画可以更高的分辨率画出。
12、在具有一存储器的计算机化系统中选取和存储包括多个预定顺序的字形元素(对应于语音单位和字根)的特定汉字的一种方法,其特征在于,该方法包括:
显示一组代表性字形元素;
选取对应于所述特定汉字的字形元素序列的字形元素;
识别所有其字形元素顺序与选中的字形元素对应的汉字;
显示第一预定数量的最常用的所述经织别的汉字;
当所述显示出的汉字没有包括所述特定汉字时,按需要重复选取、识别和显示的操作循环;
从所述显示出的汉字选取所述特定汉字,并将所述特定汉字存储在所述存储器中。
13、根据权利要求1所述的选取某一特定多音节词或词组的方法,其特征在于,该方法包括:
显示所述第一系列;
从所述第一系列中选取第一和第二分别与所述词或词组的头两个词素同音的代表性汉字;
显示语音结构对应于所述第一和第二汉字的代表性多音节词或词组的第三序列;和
从所述第三系列选取所述多音节词或词组。
14、选取含有按1至12任一权利要求选取的头一个汉字的特定多音节词或词组的一种方法,其特征在于,该方法还包括:
显示以所述第一汉字开头的代表性多音节词和词组的第四系列;
从所述代表性多音节词和词组群中选取所述特定词或词组。
15、根据1至7和13及14任一权利要求的方法,其特征在于,通过显示分别对应于全显示和第一和第二压缩格式的方式键选择所述第一系列的显示方式,从而选择一个所述方式键即可显示相应的所述显示方式。
16、根据权利要求12所述的选取某一特定多音节词或词组的方法,其特征在于,该方法包括:
显示所述代表性字形元素群;
选取分别对应于所述特定词或词组的第一和第二个汉字的字形元素成分的第一和第二字形元素;
显示其头一个和第二个汉字分别对应于所述第一和第二字形元素的代表性多音节词和词组群;
从所述多音节词和词组群选取所述特定词或词组。
17、根据13至16任一权利要求的方法,其特征在于:
所述代表性多音节词或词组是分组配置,使所述代表性词和词组群只含某一特定组,和
显示出识别相应所述各组的方式键,从而可以选取所述特定组。
18、根据1至3、5至12和14任一权利要求的方法,其特征在于,所述识别过的汉字在下列各阶段的显示中显示:
第一阶段显示包含按预定频率分布的较常用汉字;和
按需要,至少一个第二阶段显示包含较少用的汉字。
19、根据以上任一权利要求选取直接按预定频率分布的较常用汉字的方法,其特征在于,显示有另一组所述代表性的汉字和词组。
20、根据权利要求18或19的方法,其特征在于,所述预定频率分布经常不断加以更新,以反映原先在所述系统中所选取的所有汉字的频率分布。
21、根据以上任一权利要求的方法,其特征在于,特定汉字的选取是通过指定所述特定汉字的语音属性和至少一字形属性进行的。
22、按以上任一权利要求选取汉字或字形元素成分时存储该汉字或字形元素成分的一种方法,其特征在于,该方法包括:
存储至少一组代表性笔画,和
存储所述汉字或图形元素各笔画组成的识别码和坐标码,所述识别码用以识别在各所述代表性组中的笔画组成,所述坐标码则用以识别所述笔画组成在所述汉字或图形元素中的位置。
23、根据权利要求22的方法,其特征在于,各所述代表性笔画组适宜存储不同放大率的笔画。
24、与以上任一权利要求配用的供选取和存储汉字或其字形元素成分用的设备,其特征在于,该设备包括:
一中央处理机,由一指令组控制;
至少一存储装置,耦合到所述中央处理机上,用以存储所述汉字和图形元素;
一显示监视器,耦合到所述中央处理机上,用以根据所述指令组显示至少一方式键和所述汉字或字形元素;
识别装置,耦合到所述显示监视器,用以根据该显示监视器识别一所述方式键或一所述汉字或一所述字形元素,和
至少一输入装置,耦合到所述识别装置和所述中央处理机上,用以将所述经识别的方式键或汉字或字形元素输入到所述中央处理机中。
25、根据权利要求24的设备,其特征在于,该设备还包括:
至少一图形处理机,在第一时钟频率下工作,耦合到所述显示监视器上,用以根据所述中央处理机将对应于待显示在所述显示监视器上的汉字或字形元素从预定的格式转换成位图格式。
26、根据权利要求25的设备,其特征在于,该设备还包括一激光打印机,耦合到所述至少一图形处理机上,用以以位图格式接受汉字或字形元素。
27、根据权利要求26的设备,其特征在于,所述显示监视器耦合到第一所述图形处理机上,所述激光打印机耦合到第二所述图形处理机上。
28、根据24至27任一权利要求的设备,其特征在于,所述识别装置由至少一个光笔组成。
29、根据权利要求28的设备,其特征在于,所述输入装置由至少两个安置在各所述光笔上的开关组成,因而各所述光笔起这样一个作用,即根据受按压的是哪一个开关来识别和选取所述显示监视器上的数据。
30、根据24至29任一权利要求的设备,其特征在于,所述显示监视器是一个高分辨率的光栅扫描器。
31、根据25至30任一权利要求的设备,其特征在于,所述存储装置包括:
-只读存储器,用以存储所述指令组;
-大容量存储器,用以存储随系统产生的正文;
-随机存取存储器,用以临时存储数据;
至少一位图存储器,耦合到各所述图形处理机上,用以存储位图格式的字形数据。
32、根据权利要求31的设备,其特征在于,该设备还包括:
-加速器电路,将所述显示监视器耦合到所述各图形处理机上,用以提高所述显示监视器的光栅扫描速率。
33、根据权利要求32的设备,其特征在于,所述加速器电路包括:
-移位寄存器,用以将显示数据从并行格式转换到串行格式,和
-视频时钟,耦合到所述移位寄存器上,用以在大于所述第一时钟频率的第二时钟频率下控制所述移位寄存器。
34、根据24至33任一权利要求的设备,其特征在于,该设备还包括:
-扫描器,耦合到所述中央处理机上,用以将文件数字化并将其数字化形式以位图格式存储到所述存储装置中;
采取这样的配置方式,使得可以将所述文件的一部分显示在所述显示监视器的一个窗口中,所述输入装置可有选择地加以操纵,用以将所述文件在所述窗口中卷动。
35、一种在显示监视器上显示文件的设备,其特征在于,该设备包括:
-中央处理机,由一指令组控制;
-位图存储器,耦合到所述中央处理机上;
-显示监视器,耦合到所述中央处理机上,用以根据所述指令组显示至少所述位图存储器的一个部分;
-扫描器,用以将所述文件数字化,从而产生表示该文件的数字形式;和
存储装置,用以将所述数字形式存储到所述位图存储器中;
36、一种图形数据数字化设备,其特征在于,该设备包括:
-具有多个象素的光栅扫描显示监视器;
-同步化电路,用以对所述显示监视器的扫描进行同步化;和
-光笔,耦合到所述同步化电路上,用以在所述显示监视器的屏幕上画所述字形数据,且用以根据所述显示监视器上的照亮象素产生一数据位;
采取了这样的配置方式,使得当所述光笔在所述显示监视器屏面上移动时,产生多个表示所述图形数据的数据位。
37、在一由一程序控制并具有一其上显示有多个数据的显示监视器的计算机图形系统中;其特征在于包括:
一具有至少两个开关装置的光笔,用以识别其中一个所述数据,并根据相应一个所述开关装置执行所述程序的一预定环节。
38、一种用于设有一存储器和一高分辨率显示监视器的计算机化系统中用以选取显示在所述监视器上的数据以便直接输入到保留在所述存储器中的应用程序中的方法,其特征在于,该方法包括:
在所述显示监视器的第一部分上显示代表所述应用程序的第一文本,就该应用程序而论需要特定的数据输入;
在所述显示监视器的第二部分上显示代表任意数据输入的第二文本的连续部分,直至出现所述特定的数据输入为止;
直接指着所述显示监视器,以便选取所述特定数据输入;和
将所述特定的数据输入输入到所述应用程序中。
CN198787107540A 1986-12-15 1987-12-15 选取,存储和显示汉字的方法和设备 Pending CN87107540A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB868629908A GB8629908D0 (en) 1986-12-15 1986-12-15 Words & characters computer input device
GB86/29908 1986-12-15

Publications (1)

Publication Number Publication Date
CN87107540A true CN87107540A (zh) 1988-06-29

Family

ID=10609020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN198787107540A Pending CN87107540A (zh) 1986-12-15 1987-12-15 选取,存储和显示汉字的方法和设备

Country Status (7)

Country Link
US (1) US4937745A (zh)
JP (2) JPH0619779B2 (zh)
KR (1) KR940005434B1 (zh)
CN (1) CN87107540A (zh)
GB (2) GB8629908D0 (zh)
HK (1) HK46093A (zh)
SG (1) SG125292G (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5092695A (en) * 1988-07-11 1992-03-03 Printronix, Inc. Printer having ribbon wear indicator
CN1015218B (zh) * 1989-11-27 1991-12-25 郑易里 字根编码输入法及其设备
CN1028680C (zh) * 1989-12-30 1995-05-31 杜冰蟾 汉字全息码
GB2259386A (en) * 1991-09-03 1993-03-10 Robert Hugh Longworth Text processing
CN1026525C (zh) * 1992-01-15 1994-11-09 汤建民 智能五笔双拼码计算机汉字输入方法
US5255189A (en) * 1992-06-09 1993-10-19 Woo Edward P H Method and system for retrieving ideographic characters and the associated dictionary entries
US5448474A (en) * 1993-03-03 1995-09-05 International Business Machines Corporation Method for isolation of Chinese words from connected Chinese text
US5586198A (en) * 1993-08-24 1996-12-17 Lakritz; David Method and apparatus for identifying characters in ideographic alphabet
GB2292824A (en) * 1994-08-30 1996-03-06 Teck Yong Chia Input of Chinese characters into computer by stroke(s) selection
JP2655527B2 (ja) * 1994-09-13 1997-09-24 日本電気株式会社 データ入力装置
US5802482A (en) * 1996-04-26 1998-09-01 Silicon Graphics, Inc. System and method for processing graphic language characters
GB2313688B (en) * 1996-05-29 2000-05-10 Well Being Electronics Character input apparatus and method
US6007339A (en) * 1996-12-09 1999-12-28 Eten Information System Co., Ltd. Apparatus and method for inputting mandarin phonetic symbols by using sixteen keys
US5933800A (en) * 1996-12-09 1999-08-03 Eten Information System Co., Ltd. Apparatus for recording user behavior in an inputting scheme
US6161116A (en) * 1997-09-23 2000-12-12 Saltzman; Lawrence A. Ideogrammatic character editor method and apparatus
US6377966B1 (en) * 1997-10-22 2002-04-23 Flashpoint Technology, Inc. Graphical interface to select characters representing phonetic articulation and no articulation groups
US6324500B1 (en) * 1997-11-14 2001-11-27 International Business Machines Corporation Method and system for the international support of internet web pages
US7257528B1 (en) 1998-02-13 2007-08-14 Zi Corporation Of Canada, Inc. Method and apparatus for Chinese character text input
US6249284B1 (en) 1998-04-01 2001-06-19 Microsoft Corporation Directional navigation system in layout managers
US6169984B1 (en) * 1998-04-01 2001-01-02 Microsoft Corporation Global incremental type search navigation directly from printable keyboard character input
US6094666A (en) * 1998-06-18 2000-07-25 Li; Peng T. Chinese character input scheme having ten symbol groupings of chinese characters in a recumbent or upright configuration
US6687879B1 (en) * 1998-07-09 2004-02-03 Fuji Photo Film Co., Ltd. Font retrieval apparatus and method using a font link table
JP2000066656A (ja) * 1998-08-25 2000-03-03 Fujitsu Ltd 動的文書の特殊文字処理システムおよび特殊文字処理プログラムを記録した記録媒体
US6300934B1 (en) * 1998-11-16 2001-10-09 Sony Corporation Method and apparatus for entering Hangul (Korean) characters
US6430314B1 (en) * 1999-01-20 2002-08-06 Sony Corporation Method and apparatus for entering data strings including hangul (Korean) and ASCII characters
JP2001043221A (ja) * 1999-07-29 2001-02-16 Matsushita Electric Ind Co Ltd 中国語単語分割装置
FI112978B (fi) * 1999-09-17 2004-02-13 Nokia Corp Symbolien syöttö
US6760031B1 (en) * 1999-12-31 2004-07-06 Intel Corporation Upgrading an integrated graphics subsystem
US6624817B1 (en) 1999-12-31 2003-09-23 Intel Corporation Symmetrical accelerated graphics port (AGP)
CN100380998C (zh) * 2000-03-24 2008-04-09 索尼公司 字符输入方法及字符输入装置
FR2807560B1 (fr) * 2000-04-10 2002-07-05 Georges Emile Rieu Procede et appareil d'edition d'images representatives d'idees
US20020140722A1 (en) * 2001-04-02 2002-10-03 Pelco Video system character list generator and method
AUPR687701A0 (en) * 2001-08-08 2001-08-30 Litster, Gregory John Method of and apparatus for selecting symbols in ideographic languages
CN100442275C (zh) * 2002-01-17 2008-12-10 戴尔产品有限公司 用于鉴别中文地址数据的方法和系统
US20040021641A1 (en) * 2002-07-30 2004-02-05 Men-Jaw Ho Method for inputting a chinese character with phonetic symbols
US7315982B2 (en) 2003-02-26 2008-01-01 Xerox Corporation User-tailorable romanized Chinese text input systems and methods
JP4648898B2 (ja) * 2003-06-18 2011-03-09 ザイ コーポレイション オブ カナダ インコーポレイテッド テキスト入力システム及び方法
WO2005043370A1 (en) * 2003-10-17 2005-05-12 King Abdulaziz & His Companion Foundation For The Gifted Method for operating an output device
US7546233B2 (en) * 2005-08-24 2009-06-09 Yu-Chih Cheng Succession Chinese character input method
US20080154576A1 (en) * 2006-12-21 2008-06-26 Jianchao Wu Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities
US8316295B2 (en) * 2007-03-01 2012-11-20 Microsoft Corporation Shared language model
US8601392B2 (en) * 2007-08-22 2013-12-03 9224-5489 Quebec Inc. Timeline for presenting information
US7669122B2 (en) * 2007-11-19 2010-02-23 O'dell Robert Barry Using input of rhyming characters for computer text entry of Chinese characters
US9734132B1 (en) * 2011-12-20 2017-08-15 Amazon Technologies, Inc. Alignment and reflow of displayed character images
US10289664B2 (en) * 2015-11-12 2019-05-14 Lenovo (Singapore) Pte. Ltd. Text input method for completing a phrase by inputting a first stroke of each logogram in a plurality of logograms
US11481547B2 (en) * 2021-01-06 2022-10-25 Tencent America LLC Framework for chinese text error identification and correction

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5566017A (en) * 1978-11-08 1980-05-19 Jikei Shiyuu Chinese character input method in chinese character input system of sinoocomputer
FR2494465B1 (fr) * 1980-11-14 1987-02-13 Epd Engineering Projectdevelop Ordinateur de poche
DE3142138C2 (de) * 1981-10-23 1985-06-27 Siemens AG, 1000 Berlin und 8000 München Verfahren zur Eingabe chinesischer Zeichen sowie Vorrichtung zur Durchführung des Verfahrens
US4484305A (en) * 1981-12-14 1984-11-20 Paul Ho Phonetic multilingual word processor
US4454417A (en) * 1982-02-05 1984-06-12 George A. May High resolution light pen for use with graphic displays
US4490607A (en) * 1982-07-22 1984-12-25 Igt Pinhole objective fibre optic light pen
JPS5947629A (ja) * 1982-09-10 1984-03-17 Alps Electric Co Ltd 漢字入力装置
JPS59180625A (ja) * 1983-03-31 1984-10-13 Fujitsu Ltd 中国漢字入力システム
JPS60142461A (ja) * 1983-12-28 1985-07-27 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 熟語入力モ−ド付き構成要素入力型文字入力装置
US4698758A (en) * 1985-03-25 1987-10-06 Intech-Systems, Inc. Method of selecting and reproducing language characters
US4839634A (en) * 1986-12-01 1989-06-13 More Edward S Electro-optic slate for input/output of hand-entered textual and graphic information

Also Published As

Publication number Publication date
GB8728071D0 (en) 1988-01-06
JPH0619779B2 (ja) 1994-03-16
US4937745A (en) 1990-06-26
GB8629908D0 (en) 1987-01-28
JPH05233630A (ja) 1993-09-10
KR940005434B1 (ko) 1994-06-18
KR880008124A (ko) 1988-08-30
HK46093A (en) 1993-05-21
GB2199434B (en) 1991-06-19
SG125292G (en) 1993-02-19
GB2199434A (en) 1988-07-06
JPS63314673A (ja) 1988-12-22

Similar Documents

Publication Publication Date Title
CN87107540A (zh) 选取,存储和显示汉字的方法和设备
US5187480A (en) Symbol definition apparatus
US5119296A (en) Method and apparatus for inputting radical-encoded chinese characters
US5360343A (en) Chinese character coding method using five stroke codes and double phonetic alphabets
CN1045307A (zh) 对汉字进行编码和译码的方法和装置
CN1018092B (zh) 表意文字的处理方法及装置
CN1922594A (zh) 用于基于触发序列进行文本输入的高效方法和装置
CN86101871A (zh) 选择和再生语言字符的方法
CN1606750A (zh) 用于选择在表意语言中的符号的方法和设备
Huang The input and output of Chinese and Japanese characters
Brocklehurst The NPL electronic paper project
CN101071337B (zh) 一种拼音字母、数字的汉字输入法及键盘和屏幕的显示方法
KR100702483B1 (ko) 한자 입력 시스템 및 그 방법
Stallings The morphology of Chinese characters: a survey of models and applications
CN102681669B (zh) 一种双区键盘及其输入方法
CN1177285C (zh) 超大型汉字信息处理装置及方法
CN1053976C (zh) 全拼双拼混用型中文输入方法
CN100409153C (zh) 分区汉字输入法
CN1127012C (zh) 汉字首尾码输入方法
CN1027839C (zh) 中华双拼汉字编入的计算机键盘
Sinha Computer Processing of Indian Languages and Scripts—Potentialities & Problems
EP1221082B1 (en) Use of english phonetics to write non-roman characters
CN1050206C (zh) 正规拼音汉字输入法
JP2002535768A (ja) 漢字入力のための方法および装置
Ng et al. Learning to write Chinese from first principles

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication