CN1218932A - 汉语输入变换处理装置及汉语输入变换处理方法 - Google Patents

汉语输入变换处理装置及汉语输入变换处理方法 Download PDF

Info

Publication number
CN1218932A
CN1218932A CN98122819A CN98122819A CN1218932A CN 1218932 A CN1218932 A CN 1218932A CN 98122819 A CN98122819 A CN 98122819A CN 98122819 A CN98122819 A CN 98122819A CN 1218932 A CN1218932 A CN 1218932A
Authority
CN
China
Prior art keywords
input
word
mentioned
phonetic
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98122819A
Other languages
English (en)
Other versions
CN1144141C (zh
Inventor
林哲洋
中里茂美
石冢靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN1218932A publication Critical patent/CN1218932A/zh
Application granted granted Critical
Publication of CN1144141C publication Critical patent/CN1144141C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

通过输入部用拼音输入至少具有2个文字程度的读音,控制部通过辞典检索处理部及最前面读音抽出处理部进行辞典检索。辞典检索处理部从单词辞典中把与输入拼音相符的单词作为变换候补检索并抽出。另外,最前面读音抽出处理部从最前面读音位置·全读音对应辞典把具有作为其读音的一部分的同一输入拼音的单词作为变换候补检索抽出。控制部利用文字个数等确定该抽出的各变换候补的输出顺序,并按照其输出顺序将上述各变换候补输出到输出部。

Description

汉语输入变换处理装置及汉语输入 变换处理方法
本发明涉及作成汉语文件时所使用的汉语字处理等汉语输入变换处理装置及汉语输入变换处理方法,特别是涉及在用拼音输入文字个数较多的单词的读音时使用的、便利的汉语字处理等汉语输入变换处理装置及汉语输入变换处理方法。
过去的汉语字处理等汉语输入变换处理装置使用汉语汉字和表示其读音的表音符号(以下称为拼音)一一对应的汉语辞典,具有用拼音输入汉语的读音,并将之变换成汉字输出的功能。这种功能称为拼音汉字变换功能(相当于日语字处理的假名汉字变换功能)。
作为涉及这样的拼音汉字变换功能的现有技术,如日本特许出愿59-25892号公报、或日本特许出愿62-192086号公报等所记载的技术已众所周知。
日本特许出愿59-25892号公报披露了对3个文字以上的单词情况,即只输入拼音文字列的最前面子音部(声母)并将其变换成所期望的单词的技术。
日本特许出愿62-192086号公报披露了对3个文字以上的单词情况,即第1个文字全部输入拼音文字列,第2个文字以后只输入拼音文字列的最前面子音部(声母)并将其变换成所期望的单词的技术。
这些现有技术均是通过只输入汉语单词读音的一部分(最前面子音部等)来检索出相符的单词的技术。此外,为防止变换候补单词过于增加,还对3个文字以上的单词进行了限定。
通过使用这些技术,通常认为其可达到削减因长的拼音文字列而产生的敲击键盘次数,能具有更快速地进行输入的效果。
但是,1个音节由子音和母音构成,在人类的思考中,是在完全发出该“子音+母音”后,再开始判断发出的是哪一个音节。这是自然语言共同的特征,汉语也决不例外。另外,因为汉语是1个汉字=1个音节,所以,完全的音节对语言的理解的作用是极为重要的。因此,象上述各公报所记载的输入方法那样,用单纯地省略拼音的一部分输入的方法反而有成为输入的妨碍之嫌。
在汉语中,一个汉字的发音必须为1个音节,1个音节进一步又由被称为“声母”的最前面子音(音节最前面的子音)和被称为“韵母”的除去“声母”以外的部分(有母音、双重母音、鼻音化母音等)构成。此外,还有表示音节的抑扬顿挫的被称为“四声”的声调(类似于日语的音调之类的东西)。
声母例:b,p,m,f,d,t,n,l,zh,ch,sh,…
韵母例:a,o,e,i,u,ai,en,ang,iong,…
在表示上,与日语的罗马字的子音母音不同,罗马字母长度不是固定的是其特征之一。
另外,在汉语的单词中,大多是1个文字到4个文字的单词,具有超过这些文字个数的单词是合成词或名称等,在常用单词中是极少数(根据北京师范大学现代化教育技术研究所的统计结果)。还有,在2个文字以上的单词的情况中,几乎没有同音词(特别是包含有四声时)的语汇,很多情况是由单一含意来确定,这一点与日语的同音词的性质不同。
从这种作为读音文字列的拼音字母个数多的情况,或者2个文字以上单词的单一含意性高的情况来看,可以象上述的现有技术那样,考虑较少地输入拼音(如只输入各文字的最前面子音)来变换所期望的单词。
但是,全部都采用单纯地舍去其读音的一部分的方法没有充分考虑到用户的已有知识或语言获得等方面的情况。因此,用户可能会反而感到不便,觉得在拼音输入时尽是些相当于音节(=汉字)的最前面子音的字母。
这样,单纯地省略作为汉语读音的拼音的一部分进行输入的方法输入效率不好是很明显的,沿着自然语言的观点,要使其更易于使用,这种方法不仅存在不能尽可能地施行灵活对应、而且还存在难于高效地变换所期望的单词的问题。
本发明鉴于上述现状而产生,目的在于提供能够减轻对文字个数多的单词的拼音输入的负担,并高效地变换所期望的单词的、具有更高性能的输入变换功能的汉语输入变换处理装置及汉语输入变换处理方法。
按照本发明观点之一,可提供输入表示汉语汉字读音的拼音,并把所输入的拼音变换成汉字的汉语输入变换处理装置,该装置的特征在于其具有:用于用拼音输入至少2个文字读音的输入装置;对于每个单词都保存拼音和与其对应的汉字的单词辞典;从上述单词辞典中将具有作为其读音的一部分的由上述输入装置输入的拼音的单词作为变换候补来检索的辞典检索装置;输出上述辞典检索装置所检索出来的变换候补的输出装置。
按照这样的构成,通过用拼音输入至少2个汉字程度的读音,可从辞典中抽出具有作为其读音的一部分而输入的拼音的单词,并作为变换候补输出。因此,即使是文字个数多(拼音读音长)的单词,也能减少其输入次数而高效地进行变换。
另外,在上述汉语输入变换处理装置中,上述辞典检索装置也可以从上述单词辞典中把最前面部分具有上述输入拼音的单词作为变换候补来检索。
按照这样的构成,如把“卧薪尝胆”说成“卧薪”那样,通过用拼音输入单词读音的最前面部分(最前面2个文字),可以作为变换候补得到所期望的单词。
还有,在上述汉语输入变换处理装置中,上述辞典检索装置还可以从上述单词辞典中把预先指定的位置处具有上述输入的拼音的单词作为变换候补进行检索。
按照这样的构成,可以进一步扩大单词读音的适应范围,如把“北京大学”说成“北大”、把“文化大革命”说成“文革”那样,通过用拼音输入单词读音的指定部分(长单词的简称或通称的读音),可以作为变换候补得到所期望的单词。
根据本发明另外的观点,可以提供输入表示汉语汉字读音的拼音,并把其所输入的拼音变换成汉字的汉语输入变换处理装置,该装置的特征在于其具有:用于用拼音输入至少2个文字程度的读音的输入装置;对于每个单词都保存拼音和与其对应的汉字的单词辞典;从上述单词辞典中将符合上述输入装置输入的拼音的单词作为变换候补进行检索的第1辞典检索装置;从上述单词辞典中将具有作为其读音的一部分由上述输入装置输入的拼音的单词作为变换候补进行检索的第2辞典检索装置;确定由上述第1及第2辞典检索装置检索出来的各变换候补的输出顺序的输出顺序确定装置;按照由上述输出顺序确定装置确定的输出顺序输出上述各变换候补的输出装置。
按照这样的构成,通过用拼音输入至少2个汉字程度的读音,可以从辞典中分别抽出作为对应所输入的拼音的单词及具有作为其一部分的同一输入拼音的单词,并作为变换候补输出。因此,即使是文字个数多(拼音读音长)的单词,也能减少其输入次数而高效地进行变换。
另外,在上述汉语输入变换处理装置中,上述第2辞典检索装置也可以从上述单词辞典中把最前面部分具有上述输入拼音的单词作为变换候补进行检索。
按照这样的构成,如把“卧薪尝胆”说成“卧薪”那样,通过用拼音输入单词读音的最前面部分(最前面2个文字),不仅可以把与该输入拼音相符的单词作为变换候补获得,而且还可以作为变换候补得到最前面部分具有同一输入拼音(最前面2个文字)的单词。
还有,在上述汉语输入变换处理装置中,上述第2辞典检索装置还可以从上述单词辞典中把预先指定的位置具有上述输入拼音的单词作为变换候补来进行检索。
按照这样的构成,可以进一步扩大单词读音的适应范围,如把“北京大学”说成“北大”、把“文化大革命”说成“文革”那样,通过用拼音输入单词读音的指定部分(长单词的简称或通称的读音),不仅可以把与该输入拼音相符的单词作为变换候补,而且还可以作为变换候补得到指定位置上具有同一输入拼音的单词。
另外,在上述汉语输入变换处理装置中,上述输出顺序确定装置还可以根据预先设定在作为各变换候补所得到的单词中的频度信息,确定其输出顺序。
按照这样的构成,在作为变换候补获得与输入拼音相符的单词和作为一部分读音的同一输入拼音所具有的单词时,可以根据预先设置在这些单词中的频度信息确定输出顺序,如可以优先获得使用频度高的单词。
此外,在上述汉语输入变换处理装置中,上述输出顺序确定装置也可以根据作为各变换候补得到的单词的文字个数来确定其输出顺序。
按照这样的构成,在作为变换候补获得与输入拼音相符的单词和具有作为其一部分读音的同一输入拼音的单词时,可以根据这些单词中的文字个数来确定输出顺序,如可以优先获得文字个数多的单词。
本发明的更进一步的目的及效果将在以下的描述中进行说明,有些可以从该描述中搞清楚,或通过实行本发明来加以理解。而且,该目的及效果可以特别地利用如下所示的装置或其组合而明确地获得。
附加的图面构成本说明书的一部分,它们图示出本发明的理想的实施形态,此外,也图示出上述的一般的记述及后述的理想的实施形态的详细的记述,是用于说明本发明的原理的图面。
图1是涉及本发明的表示汉语输入变换处理装置的系统构成的方框图。
图2是表示利用图1的系统构成实现的汉语输入变换处理装置的功能构成的方框图。
图3是表示图2的汉语输入变换处理装置上设置的最前面读音位置·全读音对应辞典的构成的方框图。
图4是表示设置在图2的汉语输入变换处理装置上的句中读音位置·全读音对应辞典的构成的方框图。
图5是表示本发明的第1实施形态的变换处理动作的流程图。
图6A及图6B是用于说明上述本发明的第1实施形态的变换处理动作图。
图7是表示本发明的第2实施形态的变换处理动作的流程图。
图8A~图8C是用于说明上述本发明的第2实施形态的变换处理动作图。
下面参照图面说明本发明的实施形态。
图1是涉及本发明的表示汉语输入变换处理装置的系统构成的方框图。本实施形态的汉语输入变换处理装置通过使用读入如保存在磁盘等记录介质上的程序,及利用该程序控制动作的计算机来实现。
如图1所示,本实施形态的汉语输入变换处理装置由CPU11、存储器12、输入装置13、显示装置14、外部存储装置15、打印装置16、通信装置17构成。
CPU11是控制主装置全部动作的设备,通过起动保存在存储器12中的程序来动作。另外,作为基于保存在存储器12中的程序来实现的功能,有利用应用程序进行的字处理等。
存储器12由如ROM或RAM构成,保存主装置中使用的各种程序或字体(包括汉语字体)等数据。在该存储器12上,除了设置有用于保存实现字处理的应用程序等程序数据的程序区12a外,还设置有输入缓冲区12b、候补缓冲区12c、文件缓冲区12d等。
输入缓冲区12b保存为作成文件而输入的汉语汉字读音的拼音文字列。候补缓冲区12c保存通过拼音汉字变换而得到的变换候补。文件缓冲区12d保存由利用拼音汉字变换而得到的由汉语汉字构成的文件数据。
输入装置13由键盘构成,是对主装置进行指示或数据的输入的设备,是为进行拼音文字列的输入、或与该输入的拼音文字列对应的拼音汉字变换指示(利用“变换”键的操作的指示)等的设备。
显示装置14由如CRT(阴极射线管)或LCD(液晶显示屏)构成,显示利用输入装置13输入的拼音文字列或拼音汉字变换结果等。
外部存储装置15由如HDD(硬盘驱动器)或CD-ROM(只读光盘)构成,保存各种程序或文件等数据。在该外部存储装置15中,除了包含用于实现字处理的应用程序外,还包含在拼音汉字变换处理中使用的辞典等数据。
打印装置16用于进行文件的打印等。作为打印装置16,即可以是内藏于主装置中的形式,也可以是通过外部进行连接的形式。
通信装置17通过如内部LAN(局域网)或通信网络等同外部装置进行数据的发送接收控制。
下面,对利用图1所示的系统构成实现的汉语输入变换处理装置的功能结构进行说明。
图2是表示利用图1的系统构成实现的汉语输入变换处理装置的功能结构的方框图。如图2所示,本实施形态的汉语输入变换处理装置具有输入部21、控制部22、辞典检索处理部23、单词辞典24、最前面读音抽出处理部25、句中读音位置抽出处理部26、最前面读音位置·全读音对应辞典27、句中读音位置·全读音对应辞典28、输出部29。
输入部21进行对从输入装置13输入的拼音文字列或变换指示等的输入处理。
控制部22进行系统整体的控制。在该控制部22中包含有用于进行从输入的拼音到汉字的变换的变换引擎。
辞典检索处理部23根据输入的拼音检索单词辞典24,并从同一辞典24中抽出对应输入拼音的单词。被该辞典检索处理部23抽出的单词作为输入拼音的变换候补保存在存储器12的候补缓冲区12c中。
单词辞典24是作为标准辞典在拼音汉字变换中使用的辞典,对于每个单词都保存有拼音和与拼音对应的汉字、品词等拼音汉字变换处理所需要的信息。另外,在该单词辞典24内的各个单词中,附加有预先设定的频度信息。
最前面读音抽出处理部25根据输入的拼音检索最前面读音位置·全读音对应辞典27,并从同一辞典中抽出最前面部分的输入拼音所具有的单词。
句中读音位置抽出处理部26根据输入的拼音检索句中读音位置·全读音对应辞典28,并抽出预先指定位置的输入拼音所具有的单词。由上述最前面读音抽出处理部25或句中读音位置抽出处理部26抽出的单词作为输入拼音的变换候补被保存在存储器12的候补缓冲区12c中。
最前面读音位置·全读音对应辞典27是作为扩展辞典而用于拼音汉字变换的辞典,以对应关系的形式记录着关于特定单词的全部汉字的读音/索引和其最前面部分的读音/索引(参照图3)。另外,该最前面读音位置·全读音对应辞典27内的各个单词上附加有预先设定的频度信息。
句中读音位置·全读音对应辞典28与上述最前面读音位置·全读音对应辞典27同样,是作为扩展辞典而用于拼音汉字变换的辞典,以对应关系的形式记录着关于特定单词的全部汉字的读音/索引和其中的指定位置的部分的读音/索引(图4)。另外,该句中读音位置·全读音对应辞典28内的各个单词上附加有预先设定的频度信息。
输出部29在显示装置14上进行显示输入的拼音的文字列或与其输入的拼音对应的变换结果等输出处理。
图3是最前面读音位置·全读音对应辞典27的构成图。
最前面读音位置·全读音对应辞典27是以3个文字以上的单词为对象,以对应关系的形式汇集其最前面的2个文字的读音/索引和全读音/索引而成的辞典。
例如,“万紫千红”这个单词的读音用“wan/zi/qian/hong”这样的拼音文字列来表示。此处,文字列中的/表示1个汉字(音节)的区隔,并不是实际中所表示的内容。以这样的“万紫千红”这一单词的3个文字以上的单词为对象,对应其最前面2个文字的读音“wan/zi”、索引“万紫”和全读音“wan/zi/qian/hong”、索引“万紫千红”。
同样地,“hao/shi”(好事)和“hao/shi/duo/mo”(好事多磨)、“la/ding”(拉丁)和“la/ding/mei/zhou”(拉丁美洲)分别对应。
还有,如相对于“zhong/yang”(中央),对应“zhong/yang/wei/yuan/hui”(中央委员会)和“zhong/yang/gan/bu/hui”(中央干部会)这样,与在最前面位置中包含“中央”的3个文字以上的单词相对应。
图4是句中读音位置·全读音对应辞典28的构成图。
句中读音位置·全读音对应辞典28是以3个文字以上的单词为对象,以对应关系的形式汇集预先指定位置的2个文字的读音/索引和全读音/索引而成的辞典。
与上述图3的最前面读音位置·全读音对应辞典27的不同在于位置信息。该位置信息是表示读音的位置的信息。例如“人民大学”这个单词的读音用“ren/min/da/xue”这样的拼音文字列来表示。文字列中的/表示1个汉字(音节)的区隔,并不是实际中所表示的内容。对于这样的’“人民大学”之类的3个文字以上的单词,第1文字和第3文字的读音“ren/da”、索引“人大”和全读音“ren/min/da/xue”、索引“人民大学”相对应。进而,在部分读音方面,作为位置信息附加“1,3”。
另外,“ren/da”(人大)在位置信息“1,5”时,对应“ren/min/dai/biao/da/hui”(人民代表大会)这个单词。
同样地,“bei/zhan”(北展)在位置信息“1,3”时,对应“bei/jing/zhan/lan/zhong/xin”(北京展览中心)这个单词,同时,“bei/zhan”(北展)在位置信息“1,4”时,对应“bei/jing/shi/zhan/lan/guan”(北京展览馆)这个单词。
还有,作为该句中读音位置·全读音对应辞典28中所使用的部分的读音,如把“东京大学”省略为“东大”、“北海道大学”省略为“北大”这样,作为一般的略语使用通用单词的读音。
下面,说明主装置的动作。
图5是作为本发明的第1实施形态的变换处理动作的流程图。第1实施形态的特征在于:使用图3所示的最前面读音位置·全读音对应辞典27,用最前面2个文字的拼音输入变换成所期望的单词。
首先,通过输入部21用拼音(字母的文字列)输入汉语的汉字读音。该输入的拼音文字列保存在图1所示的输入缓冲区12b中(步骤A11)。
在此,如果通过按下变换键输出变换指示,控制部22便把输入的拼音输送到辞典检索处理部23。在辞典检索处理部23从作为标准辞典的单词辞典24中检索对应输入拼音(读音)的单词(索引)(步骤A12)。检索单词辞典24的结果,如果有相符的单词(步骤A13的YES),则辞典检索处理部23把该单词作为变换候补抽出(步骤A14)。此时抽出的变换候补保存在图1所示的候补缓冲区12c中。
然后,控制部22把同一输入拼音输送到最前面读音抽出处理部25。在最前面读音抽出处理部25,参照作为扩展辞典的最前面读音位置·全读音对应辞典27检索对应输入拼音的单词(步骤A15)。
此时,最前面读音位置·全读音对应辞典27如图3所示那样,是以3个文字以上的单词为对象,以对应关系的形式汇集其最前面的2个文字的读音/索引和全部的读音/索引而成的辞典。最前面读音抽出处理部25检索该最前面读音位置·全读音对应辞典27中是否有符合最前面的读音。如果有(步骤A16的YES),则最前面读音抽出处理部25同时分别抽出作为变换候补的对应其最前面读音的单词(索引)和对应其全部的读音的单词(索引)(步骤A17)。此时抽出的变换候补保存在图1所示的候补缓冲区12c中。
进行完这样的辞典检索后,控制部22把保存在候补缓冲区12c中的各个变换候补作为对应该输入拼音的变换候补来取得,并进行确定这些的变换候补输出顺序等变换处理(步骤A18)。
该情况下,变换候补的输出顺序由单词的频度信息或者文字个数来决定。频度信息预先设定在登录在辞典(标准辞典及扩展辞典)中的各个单词上,在抽出作为变换候补的单词时被一并读出。在根据该频度信息时,进行如把使用频度高的候补作为第1位等的输出顺序的确定处理。在根据文字个数时,检查构成作为变换候补而得到的单词的汉字的文字个数,进行如把文字个数多的候补作为第1位等的输出顺序的确定处理。
这样,如果确定了各变换候补的输出顺序,则控制部22按照其输出顺序把各变换候补作为变换结果输送到输出部29(步骤A19)。由此,在输出部29,或把输入拼音变换成第1位的变换候补并显示,或在候补区域进行其他的变换候补的显示等的处理。
图6A及图6B中示出具体例。
如图6A所示,例如,假定作为读音信息输入由“wanzi”这样的文字列构成的拼音。通过按下变换键,根据该输入拼音检索单词辞典24及最前面读音位置·全读音对应辞典27,输出图6B所示的变换结果。
该情况下,在单词辞典24没有相符的单词,而作为变换候补可由最前面读音位置·全读音对应辞典27获得“万紫千红”、“万紫”这样2个单词。“万紫千红”是该输入拼音“wanzi”最前面2个文字“wan”和“zi”所具有的单词。“万紫”则是以“wanzi”为读音的单词。
优先输出哪一个与否由预先设定在各个单词上的频度信息或文字个数来确定。对文字个数的情况,是文字个数多的优先还是文字少的优先可由用户任意选择。在该例中,“万紫千红”作为第1候补输出。
这样,通过输入作为“万紫”的读音的“wanzi”,可以使其最前面的读音所具有的“万紫千红”也作为变换候补输出。因此,即便是文字个数多(=拼音读音长)的单词也可以减少其输入次数而高效地进行变换。
另外,在过去的输入方法中,如果是“万紫千红”,需要象“w”、“z”、“q”、“h”这样只输入各个文字的最前面子音部,或象“wan”、“z”、“q”、“h”这样,与第2个文字以后相关并只输入最前面子音部,这与1个汉字=1个音节的规则相反,反而使用户感觉不便。与此相反,因本实施形态的方法用拼音输入单词最前面2个文字的读音就行,所以,不会给用户带来过去的那种不便感,可以用较少的输入就能简单地得到所期望的单词。
在上述的说明中虽然实现了把所谓的单词的最前面部分作为对象的拼音输入的效率化,但进一步发展此点,可以不仅把最前面,而且还能够把单词中的任意部分作为对象,通过输入其任意的部分(单词之一部),也能够变换相符的单词。
这是通过使用图4所示的句中读音位置·全读音对应辞典28来实现的。该句中读音位置·全读音对应辞典28将单词的一部分(句中位置的部分)限定在2个文字程度,是用对应关系的形式把其2个文字作为一部分来包含的单词而构成的辞典。
与最前面读音位置·全读音对应辞典27相比,其不同之处是位置信息的追加。该位置信息可以考虑用于各种各样的用途。例如,一般地,根据4个文字以上的单词的比例极低这一点,可以判定位置信息的第2位的数字比4大的单词为4个文字以上的单词,可以降低变换候补的优先顺序。当然,根据用户的指定,也可以是文字个数多的单词优先。
下面,作为第2实施形态,说明使用该句中读音位置·全读音对应辞典28的变换处理。
图7是表示作为本发明的第2实施形态的变换处理动作的流程图。第2实施形态的特征在于:使用图4所示的句中读音位置·全读音对应辞典28,用指定位置有2个文字程度的拼音输入变换所期望的单词。
首先,通过输入部21用拼音(字母的文字列)输入汉语的汉字读音。该输入的拼音文字列保存在图1所示的输入缓冲区12b中(步骤B11)。
在此,如果通过按下变换键输出变换指示,控制部22便把输入的拼音输送到辞典检索处理部23。在辞典检索处理部23从作为标准辞典的单词辞典24中检索对应输入拼音(读音)的单词(索引)(步骤B12)。检索单词辞典24的结果,如果有相符的单词(步骤B13的YES),则辞典检索处理部23把该单词作为变换候补抽出(步骤B14)。此时抽出的变换候补保存在图1所示的候补缓冲区12c中。
然后,控制部22把同一输入拼音输送到句中读音位置抽出处理部26。在句中读音位置抽出处理部26,参照作为扩展辞典的句中读音位置·全读音对应辞典28检索对应输入拼音的单词(步骤B15)。
此时,句中读音位置·全读音对应辞典28如图4所示那样,是以3个文字以上的单词为对象,以对应关系的形式汇集其指定位置的2个文字的读音/索引和全读音/索引而成的辞典。句中读音位置抽出处理部26检索该句中读音位置·全读音对应辞典28中是否有相符的句中读音。如果有(步骤B16的YES),则由句中读音位置抽出处理部26同时分别抽出作为变换候补的对应其句中读音的单词(索引)和对应其全读音的单词(索引)(步骤B17)。此时抽出的变换候补保存在图1所示的候补缓冲区12c中。
进行完这样的辞典检索后,控制部22把保存在候补缓冲区12c中的各个变换候补作为对应该输入拼音的变换候补来取得,并进行确定这些的变换候补的输出顺序等的变换处理(步骤B18)。
该情况下,变换候补的输出顺序根据单词的频度信息或者文字个数来决定。频度信息预先设定在登录在辞典(标准辞典及扩展辞典)中的各个单词上,在抽出作为变换候补的单词时一并读出。在根据该频度信息时,进行如把使用频度高的候补作为第1位等的输出顺序的确定处理。在根据文字个数时,检查构成作为变换候补而得到的单词的汉字的文字个数,进行如把文字个数多的候补作为第1位等的输出顺序的确定处理。
这样,如果确定了各变换候补的输出顺序,则控制部22按照其输出顺序把各变换候补作为变换结果输送到输出部29(步骤B19)。由此,在输出部29,或把输入拼音变换成第1位的变换候补并显示,或在候补区域进行其他的变换候补的显示等的处理。
图8A~图8C中示出具体例。
如图8A所示,假定作为读音信息输入如由“renda”这样的文字列构成的拼音。通过按下变换键,可基于该输入的拼音检索单词辞典24及句中读音位置·全读音对应辞典28,并输出如图8B所示的结果。
该情况下,在单词辞典24中没有相符的单词,利用句中读音位置·全读音对应辞典28,作为变换候补可以获得“人民大学”、“人民代表大会”、“人大”这样3个单词。“人民大学”是在第1个文字具有该输入拼音“renda”的“ren”、第3个文字具有“da”的单词。“人民代表大会”是在第1个文字具有该输入拼音“renda”的“ren”、第5个文字具有“da”的单词。“人大”是以该输入拼音“renda”为读音的单词。
优先输出哪一个单词与否由预先设定在各个单词上的频度信息或各单词的文字个数来确定。对文字个数的情况,是文字个数多的优先还是文字少的优先可由用户任意选择。
具体地如图8B所示,按下设置在作为优先候补的单词文字个数的操作画面31上的“变更”按钮发出变更指示。根据该变更指示,将显示如图8C所示的文字个数输入画面35,用户可通过输入具体的数字,变更优先顺序。
另外,33是“现状”按钮,在作为缺省指示预先设定的文字个数时使用。在缺省状态下,规定4个文字以下的单词优先。34是“取消”按钮,在取消错误的指示时使用。
在图8B的例中,作为缺省通过指定优先4个文字以下的单词,最优先输出“人民大学”。另外,在图8C的例中,指定6个文字以下的单词优先,最优先输出“人民代表大会”。
此外,虽然在此固定符合“人大”这个输入拼音的单词(略语)为最下位,但也可以包含该单词来确定各变换候补的输出顺序。
这样,通过输入作为“人大”的读音的“renda”,也可以把指定位置处的其读音所具有的“人民大学”及“人民代表大会”作为变换候补输出。因此,即使是文字个数多(=拼音读音长)的单词,也能够减少其输入个数而进行高效的变换。
还有,在过去的输入方法中,如果是“人民大学”,需要象“r”、“m”、“d”、“x”这样只输入各个文字的最前面子音部,或象“ren”、“m”、“d”、“x”这样只输入与第2个文字以后相关的最前面子音部,这与1个汉字=1个音节的规则相反,反而使用户感觉不便。与此相反,因本实施形态的方法用拼音输入作为一般常用的略语的读音即可,所以,不会给用户带来过去的那种不便感,可以实现用较少的输入就能简单地得到所期望的单词。
上述第1及第2实施形态的构成是使用单词辞典24和另外准备的最前面读音位置·全读音对应辞典27或句中读音位置·全读音对应辞典28,根据读音的部分输入进行变换,但也可以把这些辞典汇集成1个实现。
另外,也可以合并在上述第1实施形态说明的变换处理和在上述第2实施形态说明的变换处理,作为一系列的变换处理来执行。此时,可根据输入的拼音分别检索单词辞典24、最前面读音位置·全读音对应辞典27、句中读音位置·全读音对应辞典28,进行抽出相符的单词的处理。
还有,上述各实施形态中记载的手法作为可以使之在计算机中运行的程序,也可写入如磁盘(软盘、硬盘等)、光盘(CD-ROM、DVD等)、半导体存储器等记录介质中来适用于各种装置,或利用通信媒体传送来适用于各种装置。实现主装置的计算机读入记录在记录介质中的程序,通过利用该程序控制动作来执行上述的处理。
如以上所述,按照本发明,在输入文字个数多(=拼音读音长)的单词时,无需用拼音输入其全部读音,只输入其最前面部分的读音就能高效且准确地进行变换。
另外,不只部分地限定在单词的最前面,通过用拼音输入单词中指定部分的读音,也可以实现有效且高自由度的拼音汉字变换。
此外,本发明并非只限定于上述的实施形态,可以在其主旨范围内实施种种变形。
例如,在上述实施形态是以输入拼音后按下变换键开始显示变换候补为代表进行的说明,代替这种方式,也可以采用在拼音输入的同时在规定位置显示变换候补的构成。这样,当时就可以选择期望的单词,能够实现更高效率的汉语输入变换处理。
还有,在上述第1实施形态,是组合普通的辞典检索和通过采用最前面读音抽出的辞典检索情况进行的说明,其实也可以根据需要对采用最前面读音抽出的辞典检索功能进行使用/不使用的变换。同样地,在上述第2实施形态,是组合普通的辞典检索和通过采用句中读音位置抽出的辞典检索情况进行的说明,在此也可以根据需要对采用句中读音位置抽出的辞典检索功能进行使用/不使用的变换。
最后,还可以通过组合上述第1实施形态和上述第2实施形态,采用包含全部普通的辞典检索、利用最前面读音抽出的辞典检索、利用句中读音位置抽出的辞典检索来进行处理的构成。

Claims (10)

1.一种汉语输入变换处理装置,该汉语输入变换处理装置输入表示汉语的汉字读音的拼音,并把其输入的拼音变换成汉字,其特征在于具有:
用于用拼音输入至少具有2个文字程度的读音的输入装置(21);
对于每个单词保存拼音和对应拼音的汉字的单词辞典(27或28);
从上述单词辞典(27或28)中把具有作为其读音的一部分的利用上述输入装置输入的拼音的单词作为变换候补进行检索的辞典检索装置(25或26);
输出利用上述辞典检索装置(25或26)检索的变换候补的输出装置(29)。
2.权利要求1所记载的汉语输入变换处理装置,其特征在于:
上述辞典检索装置(25)从上述单词辞典中把最前面部分具有上述输入拼音的单词作为变换候补来进行检索。
3.权利要求1所记载的汉语输入变换处理装置,其特征在于:
上述辞典检索装置(26)从上述单词辞典中把预先指定位置具有上述输入拼音的单词作为变换候补来进行检索。
4.一种汉语输入变换处理装置,该汉语输入变换处理装置输入表示汉语的汉字读音的拼音,并把其输入的拼音变换成汉字,其特征在于具有:
用于用拼音输入至少具有2个文字程度的读音的输入装置(21);
对于每个单词保存拼音和对应拼音的汉字的单词辞典(24及27或28);
从上述单词辞典(24)中把符合利用上述输入装置(21)输入的拼音的单词作为变换候补进行检索的第1辞典检索装置(23);
从上述单词辞典(27或28)中把具有作为其读音的一部分的利用上述输入装置(21)输入的拼音的单词作为变换候补进行检索的第2辞典检索装置(25或26);
确定利用上述第1及第2辞典检索装置(23及25或26)检索的各变换候补的输出顺序的输出顺序确定装置(22);
按照上述输出顺序确定装置(22)所确定的输出顺序输出上述各变换候补的输出装置(29)。
5.权利要求4所记载的汉语输入变换处理装置,其特征在于:
上述第2辞典检索装置(25)从上述单词辞典中把最前面部分具有上述输入拼音的单词作为变换候补来进行检索。
6.权利要求4所记载的汉语输入变换处理装置,其特征在于:
上述第2辞典检索装置(26)从上述单词辞典中把预先指定位置具有上述输入拼音的单词作为变换候补来进行检索。
7.权利要求4所记载的汉语输入变换处理装置,其特征在于:
上述输出顺序确定装置(22)根据预先设定在作为各变换候补所得到的单词上的频度信息来确定其输出顺序。
8.权利要求4所记载的汉语输入变换处理装置,其特征在于:
上述输出顺序确定装置(22)根据作为各变换候补所得到的单词的文字个数来确定其输出顺序。
9.一种汉语输入变换处理方法,该汉语输入变换处理方法输入表示汉语汉字读音的拼音,并将其输入的拼音变换成汉字,其特征在于:
用拼音至少输入2个文字程度的读音(A11、B11);
根据上述输入的拼音检索对于每个单词都保存其拼音和对应拼音的汉字的单词辞典(A15、B15);
从上述单词辞典中把具有作为其读音的一部分的上述输入拼音的单词作为变换候补抽出(A17、B17);
输出上述抽出的变换候补(A19、B19)。
10.一种汉语输入变换处理方法,该汉语输入变换处理方法输入表示汉语汉字读音的拼音,并将其输入的拼音变换成汉字,其特征在于:
用拼音至少输入具有2个文字程度的读音(A11、B11);
根据上述输入的拼音检索对于每个单词都保存其拼音和对应拼音的汉字的单词辞典(A12、B12);
作为变换候补从上述单词辞典中分别抽出与上述输入拼音相符的单词及具有作为其读音的一部分的同一输入拼音的单词(A14、B14);
确定上述抽出的各变换候补的输出顺序(A18、B18);
按照上述确定的输出顺序输出上述各变换候补(A19、B19)。
CNB981228194A 1997-11-27 1998-11-27 汉语输入变换处理装置及汉语输入变换处理方法 Expired - Fee Related CN1144141C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP325947/1997 1997-11-27
JP325947/97 1997-11-27
JP9325947A JPH11161640A (ja) 1997-11-27 1997-11-27 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
CN1218932A true CN1218932A (zh) 1999-06-09
CN1144141C CN1144141C (zh) 2004-03-31

Family

ID=18182390

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB981228194A Expired - Fee Related CN1144141C (zh) 1997-11-27 1998-11-27 汉语输入变换处理装置及汉语输入变换处理方法

Country Status (2)

Country Link
JP (1) JPH11161640A (zh)
CN (1) CN1144141C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100342373C (zh) * 2002-12-27 2007-10-10 欧姆龙株式会社 语言输入方法及系统
CN112243524A (zh) * 2019-03-20 2021-01-19 海信视像科技股份有限公司 节目名检索辅助装置以及节目名检索辅助方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8413049B2 (en) * 2007-08-31 2013-04-02 Research In Motion Limited Handheld electronic device and associated method enabling the generation of a proposed character interpretation of a phonetic text input in a text disambiguation environment
JP2011175441A (ja) * 2010-02-24 2011-09-08 Kyocera Corp 文字入力装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100342373C (zh) * 2002-12-27 2007-10-10 欧姆龙株式会社 语言输入方法及系统
CN112243524A (zh) * 2019-03-20 2021-01-19 海信视像科技股份有限公司 节目名检索辅助装置以及节目名检索辅助方法
CN112243524B (zh) * 2019-03-20 2023-08-04 海信视像科技股份有限公司 节目名检索辅助装置以及节目名检索辅助方法

Also Published As

Publication number Publication date
CN1144141C (zh) 2004-03-31
JPH11161640A (ja) 1999-06-18

Similar Documents

Publication Publication Date Title
US7831911B2 (en) Spell checking system including a phonetic speller
CN1113305C (zh) 语言处理装置和方法
CN1330333A (zh) 汉语输入变换处理装置及输入变换处理方法和记录介质
JP5172682B2 (ja) 音素のnグラムを使用した単語および名前の生成
CN101079301A (zh) 文本映射到音频并动画文本的设备及方法
CN86105610A (zh) 使用汉语拼音的汉字数据处理和字处理的方法和装置
CN1232226A (zh) 句子处理装置及其方法
CN1471029A (zh) 自动检测文件中搭配错误的系统和方法
CN1910573A (zh) 用来识别并分类命名实体的系统
CN1194703A (zh) 电子文件显示装置、其方法和记录媒体
CN103838876B (zh) 使用拼音检索文件的文件检索方法及系统
CN1707550A (zh) 语音发音与发音口型动画数据库的建立及其访问方法
CN1316689A (zh) 汉字输入装置和方法
CN101038508A (zh) Gb拼音输入法
CN1108572C (zh) 汉语和日语的双向机械翻译机
CN1144141C (zh) 汉语输入变换处理装置及汉语输入变换处理方法
CN1102779C (zh) 中文简繁体字文件转换装置
CN1106619C (zh) 汉语输入变换处理装置和汉语输入变换处理方法
CN1529264A (zh) 通过文字块位置编码查找相关联多媒体内容的方法
CN1679023A (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
CN1731389A (zh) 盲汉对照编辑排版系统及编辑排版方法
CN1732460A (zh) 带有例句的电子词典
CN1379342A (zh) 汉语输入变换处理装置以及汉语输入变换处理方法
CN1287321A (zh) 文本制作装置、转换处理方法和记录转换处理程序的记录媒体
CN1187677C (zh) 计算机整句汉字局部笔划输入方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040331

Termination date: 20091228