CN87104535A - 中文输入方法 - Google Patents

中文输入方法 Download PDF

Info

Publication number
CN87104535A
CN87104535A CN87104535.4A CN87104535A CN87104535A CN 87104535 A CN87104535 A CN 87104535A CN 87104535 A CN87104535 A CN 87104535A CN 87104535 A CN87104535 A CN 87104535A
Authority
CN
China
Prior art keywords
word
category
chinese
usage frequency
phonetically similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN87104535.4A
Other languages
English (en)
Other versions
CN1006333B (zh
Inventor
伊藤英俊
楠井健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN87104535A publication Critical patent/CN87104535A/zh
Publication of CN1006333B publication Critical patent/CN1006333B/zh
Expired legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明披露了一种把键入的中文拼音字母序列变换成中文汉字序列时对同音字的处理方法。该方法具有一个同音字表,对几个中文同音字,把使用频度最高的一个字作为A类,把使用频度适中的m个字作为B类,把使用频度较低的1个字作为C类。当从n个同音字中选择一个字时,首先显示A类的一个字,当这个字不是所需字时,再根据特定的方法检索B类的m个字,当A类和B类的字都不是所需字时,再根据原已确定的顺序检索C类的1个字,由此实现高速的中文输入。

Description

本发明涉及中国语言文字的输入方法(以下称为中文输入方法),特别是涉及应用标音字母输入中文情况下的同音字处理方法。
在处理中文的信息处理系统中,中文键盘是必须的,作为这种键盘输入方法,一般是采用把中文汉字的形状、读法、或使二者组合的代码化方法。
表示中文读法的标音字母,有中国政府制订了的拼音和在此制订之前就已经使用的注音。现在中国以拼音为主,标音主要是老年人和在一部分地区使用。
中文的读法除了一部分文字外,具有原则上是一个中文字对应一个音节,而没有其它读法的优点。但是具有相同读法、即具有相同音节的同音字很多,特别是在一部分相当日语假名书写的使用频度很高的文字中,存在很多由一个文字构成的单字词,并且大都有许多同音字,还有两个文字以上的词也有同音词,但其数量很少。
因此,根据键入标音字母(例如拼音)输入上述同音字时,一般在操作上是从顺序表示的多个同音字中选择所需的一个字。
然而,用这种方法存在着每当反复输入相同的字时,必须重复进行上述选择操作的缺点。因此,一般在进行同音字的学习处理时,若把使用频度有很大差别的同音字之间用同一方法处理,这反倒成为使输入变成复杂的一个原因。
关于中文字的使用频度根据最近的调查,在一般的图书和报纸等方面,大约使用6,000个汉字,但是使用频度程度很高的60个字出现次数为30%以上,使用最多的“的”字出现次数为4%以上。过去的中文输入方法没有采用考虑到这些使用频度的同音字学习方法。
本发明的目的在于提供一种把各个同音字根据使用频度和实际状况加以分类,而改善了上述缺点的中文输入方法。
本发明的中文输入方法,在把键入的标音字母序列变换成中文文字序列的中文输入方法中,具有一个同音字表,它对于中文的n个同音字,把使用频度最高的一个字作为A类,把使用频度适中的m个字(m≤n-1)作为B类,把使用频度低的l个字(l≤n-m-1)作为C类。具有把从前述B类的m个字中选择一个字时,以刚刚选择过的字开始顺序地进行显示的第一手段,和从上述C类的l个字当中选择一个字时根据前面已经确定的顺序、顺次地进行显示的第二手段。从上述n个同音字中选择一个字时,最初显示上述A类的一个字,而后,当A类的这个字不相符时,根据上述第一手段检索B类的m个字。当上述A类和上述B类的各个字都不相符时,根据上述第二手段检索上述C类的l个字来实现。
根据本发明的中文输入方法,最初显示使用频度最高的一个字,当其不是所需字时,再从使用频度适中的字中,从刚刚选择过的字开始顺序显示,因为做了这种操作判断,故不必要象过去那样,每当输入同一个字时,要重复进行同一选择操作。就是说,即使最初显示的字不是所需字时,那么两次以后显示的字成为所需字的程度一定很高,由于这种学习功能的作用,所以能够期待极大节省复杂操作的高速中文输入。
图1为根据本发明的中文输入方法的一个实施例的框图;图2为动作步骤的流程图;图3为同音字表例的说明图;图4为把同音字加以分类例的说明图。
实现本发明的最佳方案
以下对于本发明的中文输入方法参照设计图予以说明。
图1为本发明的一个实施例的框图,在该图中的中文输入方法,由扔有拼音键1a,并能输入中文标音字母序列(拼音字母序列)的输入部1、暂存含有各种控制信号的输入信号100的输入缓冲区部2、把拼音字母序列变换成中文汉字序列的变换部3、拥有拼音字母序列与中文汉字序列对应表的字典部4、控制拼音字母序列和中文汉字序列显示的显示控制部5、和显示它们的显示部6构成。
输入部1含有拼音键1a,输出包含与拼音字母共存的各种控制信号的输入信号100。
缓冲区部2接收输入信号100,并输出将其识别后要显示成为拼音的输入数据101和指示从拼音到中文汉字变换的变换控制信号106。
变换部3包括字典存取手段3a、读出数据缓冲区3b和变换控制手段3C。字典存取手段3a接收输入数据101,并根据控制信号106输出检索信号102。另外,变换控制手段3C根据变换控制信号106输出变换指示信号107和显示指示信号108。读出数据缓冲区3b接收读出数据103并暂时保存,根据变换信号107从中选择一个字作为变换数据104输出(关于选择方法在后边叙述)。
字典部4包含同音字表4a,该表含有拼音字母和中文汉字的对应表,把对应检索信号102的中文汉字作为读出数据103输出。
显示控制部5包含输入数据显示缓冲区5a、变换数据显示缓冲区5b和显示缓冲区5C。并且,输入数据显示缓冲区5a及变换数据显示缓冲区5b分别接收输入数据101和变换数据104并暂存它们。显示缓冲区5C把如上所述保存的输入数据101及变换数据104根据显示指示信号108进行输入,并把其作为显示信号105输出。
显示部6接收上述的显示信号105,在显示器显示它们,并能识别操作过程。
图2为表示上述中文输入方法动作步骤的流程图。在该图中处理21是键入标音字母序列的操作,接下去处理22,是判断是否把在处理21键入了的标音字母序列变换成为中文汉字,当不作变换时返回到处理21,继续键入标音字母序列,当进行变换时转移到处理23。
处理23显示A类的字,处理24判断被显示的A类的字是否是所需字。当是所需字时,转移到处理25,当不是所需字时转移到处理27。
处理25把显示的所需字写入文件,根据这个处理标音字母被置换成中文汉字。
处理27把B类的字按照上述顺序进行显示,处理28判断被显示的B类字是否是所需字,当是所需字时转移到处理29,当不是所需字时,转移到处理30。
处理29改写上述的参照标记,即把在处理28已确定的所需字,在下面的检索时改写成最初显示的参照标记,然后转移到前述的处理25。
处理30判断B类的字是否已全部显示过了,若还有没有显示的字时,转移到上述处理27,当全都显示过时,转移到处理31。
处理31把C类的词按照原来已经规定的顺序进行显示,处理32判断被显示的C类的字是否是所需字,当其是所需字时,转移到处理25,当不是所需字时,转移到处理33。
处理33判断是否C类的字已全部显示过了,当还有没显示的字时,转移到上述处理31,当已全部显示过时,转移到处理34。
处理34指示所需字不存在于同音字表4a中(例如表示〔?〕同时写入文件)。
处理26为判断是否继续进行中文输入,当继续时返回到处理21并重复进行上述操作。
上述的中文输入方法,把有序的同音字作为候补所需字顺次地显示,一边判断其是否是所需字,一边进行中文输入。
根据字典存取手段3a输出的检索信号102,所读出的读出数据103包含同音字。而对于读出数据缓冲区3b,则暂存了所需的同音字表4a。
图3为上述同音字表4a的一部分说明图。在该图中,同音字表4a由检索时    存放索引的标音字母域10,存放A类中文汉字的域11、存放B类中文汉字的域12和存放C类中文汉字的域13组成,并且域12中的每个同音字都包含了其在B类检索中所处显示顺序的参考标记域12a(学习域)。
A类存放的字,是在同音字中使用频度最高的一个字。当键入域10中的索引时,将首先显示该字。存放在B类的字是在同音字中具有中等使用频度的一些字,检索B类的字时,根据域12a的参考标记所指示的顺序进行显示。即从刚刚选择了的字开始顺序地显示。每当操作选中所需字时需改写参考标记。存放在C类的字是在同音字中具有使用频度较低的一些字,检索这些字时和通常的字典一样,根据原来确定的顺序来显示。
下面,读出数据缓冲区3b,把暂存的如上述同音字表的内容,根据变换控制手段3C输出的变换指示信号107,作为变换数据104顺序输出。另外变换控制手段3C输出显示指示信号108,通过显示控制部5,把上述变换数据104顺次在显示部6显示,即参照图2的处理模块41把A类的同音字、处理模块42把B类的同音字、处理模块43把C类的同音字分别顺序表示,并根据操作的判断进行动作。
图4是把中文的同音字(特别是单字词)加以分类的例子,在该图中,A类中表示的字为部分相当于日文的假名书写的字,它们都是使用频度很高的字。
在本实例中,就部分相当于日文假名书写的中文单字词为主予以说明,关于两个字以上的词也能够采用上述同样的方法实现中文输入。

Claims (1)

  1. 在将键入的中文标音字母序列变换成中文汉字序列的中文输入方法中,具有如下特征:
    对于中文的n个同音字,具有把使用频度最高的一个字作为A类,把使用频度适中的m个字(m≤n-1)作为B类,把使用频度低的l个字(l≤n-m-1)作为C类的同音字表。
    具有从上述B类的m个字中选择一个字时,以刚刚选择过的字为开始,顺序进行显示的第一手段和从上述C类的l个字中选择一个字时,根据原来已经确定的顺序,顺次地进行显示的第二手段。
    从上述n个同音字中选择一个字时,最初显示上述A类的一个字,当与上述A类的这个字不相符时,根据前述第一手段检索前述B类的m个字,当前述A类和B类的各个字都不相符时,根据前述第二手段检索前述C类的l个字。
CN 87104535 1986-06-12 1987-06-12 中文输入方法 Expired CN1006333B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP137406/86 1986-06-12
JP13740686 1986-06-12

Publications (2)

Publication Number Publication Date
CN87104535A true CN87104535A (zh) 1988-04-27
CN1006333B CN1006333B (zh) 1990-01-03

Family

ID=15197895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 87104535 Expired CN1006333B (zh) 1986-06-12 1987-06-12 中文输入方法

Country Status (2)

Country Link
JP (1) JPH0640330B2 (zh)
CN (1) CN1006333B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892712A (zh) * 2015-02-18 2016-08-24 联想(新加坡)私人有限公司 确定设备、确定方法和确定装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0766377B2 (ja) * 1988-10-20 1995-07-19 長春郵電学院 中国語入力装置
JPH0775020B2 (ja) * 1988-11-30 1995-08-09 松下電器産業株式会社 中国語逐次漢字変換装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892712A (zh) * 2015-02-18 2016-08-24 联想(新加坡)私人有限公司 确定设备、确定方法和确定装置

Also Published As

Publication number Publication date
CN1006333B (zh) 1990-01-03
JPH0640330B2 (ja) 1994-05-25
JPS63106070A (ja) 1988-05-11

Similar Documents

Publication Publication Date Title
CN101388012A (zh) 带有易混淆音识别的拼音检查系统和方法
US4679139A (en) Method and system for determination of data record order based on keyfield values
US7734571B2 (en) Method for processing sensor data within a particle stream by a KStore
CN87104535A (zh) 中文输入方法
JPH10105036A (ja) 教材データベース装置
CN1018773B (zh) 汉字信息计算机处理方法
JPS6211385B2 (zh)
JPS61265633A (ja) 発音記号による辞書検索処理方式
JP2634926B2 (ja) かな漢字変換装置
CN1007378B (zh) 根据声音认识的汉语检索装置
CN1307273A (zh) 智能注音输入系统及方法
WO1999056222A1 (en) Generating machine-readable association files
Bozzi Towards a philological workstation
JPS6370372A (ja) 文書処理装置
CN1147655A (zh) 一种汉字信息检索方法和使用该方法的电子记事簿
Probst et al. Machine Methods of Investigation of the Proto-Indian Texts
JP2000194389A (ja) 情報処理装置
JPH0773279A (ja) 文字変換装置
EP2002328A2 (en) Method for processing an input particle stream for creating upper levels of kstore
CN1039491A (zh) 中文文书作成装置
CN1036648A (zh) 中文文书作成装置
GB2208732A (en) Keyboards
CN87103092A (zh) 中文键盘
Cartier et al. A blind chemist's approach to automated scientific information
CN1622664A (zh) 用于在移动终端检索汉字的装置和方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C13 Decision
C14 Grant of patent or utility model
C19 Lapse of patent right due to non-payment of the annual fee