CN1147809C - 可以省略声调符号的汉字变换装置 - Google Patents

可以省略声调符号的汉字变换装置

Info

Publication number
CN1147809C
CN1147809C CNB961123486A CN96112348A CN1147809C CN 1147809 C CN1147809 C CN 1147809C CN B961123486 A CNB961123486 A CN B961123486A CN 96112348 A CN96112348 A CN 96112348A CN 1147809 C CN1147809 C CN 1147809C
Authority
CN
China
Prior art keywords
word
syllable
conversion
chinese
tone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB961123486A
Other languages
English (en)
Other versions
CN1155123A (zh
Inventor
林启轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1155123A publication Critical patent/CN1155123A/zh
Application granted granted Critical
Publication of CN1147809C publication Critical patent/CN1147809C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明的目的是提供一种可省略声调符号的汉字变换装置。它由无声调字典,辞典,音节分离装置,变换控制装置,单汉字变换装置,单词变换装置,人手选择装置组成。无声调字典中登录有无视声调符号的汉字,辞典中登录有含有声调符号的单词,音节分离装置根据声调符号和无声调符号,将输入的表音符号划分为音节,变换控制装置用于决定变换对象的音节数及位置,若音节数为1,则由单汉字变换装置检索有声调字典或无声调字典,检出对应的同音异义字,若音节数大于1,则由单词变换装置检索辞典,检出对应的同音异义词,人手选择装置用于由使用者选择出正确的结果。因此,没有必要输入完全正确的声调符号。

Description

可以省略声调符号的汉字变换装置
技术领域
本发明是有关中文的汉字变换装置,特别是关于将表音符号变换为汉字时,可以不必输入声调符号的汉字变换装置。
背景技术
在对本发明详细说明之前,首先就助数词、数词及数加以说明。
原则上汉语及日语都不区别单、复数。因此在本说明书中表述为“输入的拼音符号”、“字符”、“音节”等时,“输入的拼音符号”等实际上几乎都是指复数而言,若不特别加以指定,它们可以是单数,也可以是复数。
其次,就汉语而言,例如出版过由相浦杲所著版的“中国语入门”,日本放送出版协会会刊等许多参考书,此外,关于“声母”,“头母(隔音,声母和主韵母之间的半韵母)”、“声调”、“第一声”、“声调记号”等,也在出版物中已有详细说明。因此,关于这些内容原则上加以省略。
第三,作为变换对象的文字原则上指汉字,原则上所谓“单词”系指由多个汉字构成的单词,但由于还存在有阿拉伯数字,“。”等标准符号,专有名词、成语、日语助词等语言成分,因此也有例外。
此外,在与本发明申请直接有关的范围内,也对汉语及中文字处理机加以概略说明。
原则上,汉语中一个汉字就对应一个音节。并且,音节的种类共计一千三百余种。但是,音节由后面所述的声母、头母、韵母及声调构成。在中文文字处理机等汉字变换装置中,恰如日语字处理机的假名输入那样,按声母、头母、韵母,声调进行输入,而且是按上述顺序进行的。这时,由辅音形成的声母,以元音为中心的韵母,以及其它的头母,用罗马字(中国大陆)或拼音符号,同第二式(台湾地区)等进行输入。此外,声调的输入用类似于“-”、“/”、“v”、“\”的符号或“1”~“4”,其它的轻声则用“5”等阿拉伯数字等进行输入。此外,本说明书中,声母、韵母用罗马字、声调用阿拉伯数字来进行表示。
图8是分别用罗马字和拼音符号来分别表示声母、头母、韵母、声调的表示声音的符号的示意图。除了用罗马字的拼音符号表示的汉语的读音外,通过利用第一声、第二声、第三声、第四声以及轻声的声调符号表示汉语的各个汉字的音节的音调的高低变化来确定音节。因此,声调符号是汉语的各汉字的音节的最后的表音符号,所以,只要输入了声调符号,一个汉字的读音的输入就算完成了。
作为输入先有的表音符号的汉语输入法,例如,有倚天中文系统中“注音输入法”。图9是表示由该表音符号输入汉字的注音输入法的构成及其处理的主要内容的示意图。
本图中,110是输入表音符号的输入装置。112判别输入的表音符号到底是声母、头母、韵母或是声调中的哪一种并根据差别结果,排列成适当的音韵位置的表音符号排列装置。113是判断输入的表音符号是否为声调符号的声调符号判断装置。115是预先存储汉字的读音以及与之对就的所有的同音异议字的字典。114是根据输入的各表音符号所组合的读音对字典115进行检索并将检索出对应的同音异议字作为变换候选字进行显示的字典检索显示装置。116是具有该装置的使用者(文书作成者)从所显示的同音异议字中选择出所希望的字的功能的人手选择装置。117是由显示器等构成的显示变换结果并显示在当前正在作成中的中文文书的指定位置磁盘等(图中未示出)进行存储和可以进行打印输出的输出装置。
在该“注音输入法”中,当使用者根据所希望的汉字的读音,顺序地输入该文字的表音符号和声调符号时,对应于该读音的所有的或者是优先度较高的同音异议字便作为候选字显示在屏幕上,然后使用者从中选择想要输入和变换的汉字。因此,其基本原理与日文文字处理机中的按假名或字母输入而获得汉字与假名混合的文字变换没有什么不同。
作为其它先有的输入表音符号的汉字变换装置,例如,日本国特开昭63-140365号(台湾地区专利公开编号089476)所示的装置。图10是输入这种表音符号的汉字变换装置的结构图。本图中,210是输入任意长度的拼音、注音、罗马字等的表音符号的输入装置。212、213是在把各个表音符号变换为单词时所使用的I寄存器和NP寄存器,I寄存器212是存储从输入的表音符号中,作为检索对象而切出的部分的最开始的音节位置(i)作为检索对象的寄存器。NP寄存器213是存储将输入的表音符号变换为单词时作为词典内的检索对象的单词长度,即构成单词的汉字数(np)的寄存器。214是存储输入的表音符号的音节数(nchar)的NCHAR寄存器。211是将NCHAR寄存器214、NP寄存器213,I寄存器212进行初始化处理的寄存器初始化装置。215是判断(np+i)>(nchar+1)是否总是成立的比较装置。218是辞典,它登录有1384个汉语读音以及大约13,000个台湾地区使用的单汉字、24000个双字词、3270个三字词、3100个四字词等的读音及其所对应的单词。216是变换控制装置,它从所输入的表音符号串的第i个符号起分离出连续np个音节,并检查所分离出的音节中是否有已变换过的音节,当完全没有变换过时,以分离出的第i个符号起的连续np个音节作为检索关键字,利用辞典检索装置217检索辞典218,检索出对应的单一汉字或单词,同时,使i递增np,若不存在对应的单汉字或单词时,就只使i递增1而不作任何变换。217是辞典检索装置,它以上述变换控制装置216发送来的音节作为检索关键字来检索辞典218。219是输出装置,它由显示器等构成,它输出由上述变换控制装置216变换的结果。根据上述先有的汉字变换装置,例如当把“Zeng jial ji4 I4 li4 Zh1 mi4 jyuez”的这一串表音符号正确地一个不漏地输入时,可得到正确的变换结果“增加记忆力之秘诀”。换言之,本汉字装置重视最先输入的音节,其次重视较长的音节,也就是采用最长一致法,可以说是以改良上述注音输入法为目的的变换装置。
图11描述了最长一致法的基本步骤。本图中,(1)表示作为汉字变换对象的音节的变换,(2)是其流程。本图中将8个音节作为汉字变换的对象而输入,在辞典中所登录的单词中,具有最大音节数,也就是一下子就可作为变换对象的最大音节数是4。此外,本图中的(1)内填入了“济”字的方框表示变换完的音节,标有数字的方框表示未变换的音节。
但是,由于最长一致法本身,作为形态元分析技术的一种,已是周知的技术,因此,不作更多的说明。
然而,上述这类注了音输入法及其变换装置,存在下述问题。
(1)使用者必须一点不差地输入声调符号。也就是说,如果声调符号输入有误,就不能检索到使用者想要的汉字。由于这一点与本发明的主旨和目的直接相关,因此以日语为例,进行稍为详细但也是概念性的说明。对于“靴”这个单词,汉字称为“靴屋”时发音为“KUTSUYA”。另一方面,在“ぢこそぅの靴をとへてくれ。”这个句子中,“靴”的发音为“KTSU”,元音“U”被省略,这是很普遍的说法。但是,在历经千年以上的历史和传统的基础上,对应于“靴”的假名是“くつ”,并且,如果与之一致地用黑本式的罗马字加以表示的话,就成为“KUTSU”,这一拼法已深入了日本人的头中。此外,又如“云”或“蜘蛛”,都按“くも”或“KUMO”输入,而对它的重音则加以忽略不计。假如要求“完全地按正确的发音进行输入,并且连重音也要正确地输入”的话,能够对这一要求正确地响应的日本人是很少的。也就是说,不要说方言的不同,就连在被问到“云”和“蜘蛛”“柿”和“牡蛎”等的重音有什么不同时,能正确进行回答的日本人为数不多。但是,在汉语会话中,由于相当于重音(然而,严格说来它们还是不同)的声调占有重要的位置,在这种汉字变换时,有时提出相似的要求。为此,在作成文书时,将所有的表音符号,特别是将相当于日语重音的的声调符号正确地输入,即使对中国人来说,也是说来容易作时难。
(2)说“汉语”是会引起误解的,正确地说是与欧洲语系或印度语系(或印欧语系)同格的汉语系,称为六大方言的北京话、上海话、四川话等。盯当于各种意大利语、英语、俄语等。为此,恰如在欧语系的语言中,即使是同样的字母,在挪威等北欧的语言中,“G”表示与英语的“Y”相信的发音,德语的“S”、“SS”、“W”、“V”分别与英语的“E”、“S”、“V”、“F”的发音相类似,同样地,即使相同的汉字,根据不同的地域,其声调、发音也不一样。并且,上述这种情况,对于忽略重音的发音,即使在日本,也会把“经”字有时读成“けへ”有时又读成“きまぅ”等,汉字的读音随汉音、吴音、宋音等而不同是众所周知的事实。因此,即使是中国人,在输入一篇长文时,也难地正确地连续输入发音,很不规则的声调符号。以英语为例,在美国和英国也存在大量的重音不同的单词,而且美国人不知道英国的重音,甚至正好读反的事例也为数不少,考虑到这一事实也就会明白了。但是,组织部作为标准语的北京话,有其折衷了各种方言的人工语言的一面。此外,严格地要求进行标准而正确的声调符号的输入,并不符合使用其它方式的大量人群和广阔地域的需要。例如,台湾(台湾地区)所使用的注音输入法,在大陆就不能使用。
(3)在采用对每个单词进行变换的算法分析的输入方法中,根据必须输入正确的声调符号的要求,对输入接口有各种限制。
因此,不但要使想要的汉字能容易得到,还期望出现一种与使用者(中文文书作成者)的方言无关的可供使用的汉字变换装置。
发明内容
本发明就是以满足上述愿望为目的而进行的发明。
为达到上述目的,根据本发明的第一方面,提供一种可省略声调符号的汉字变换装置,其特征在于包括:
表音符号输入装置、音节分离装置、变换控制装置、有声调字典、无声调字典、辞典、单汉字变换装置、单词变换装置、前向修改装置、临时输出装置、人手选择装置和输出装置;
所述表音符号输入装置对于音节用于输入含有由声调符号和指定键定义的无声调符号的拼音、注音或罗马字这种表音符号;
所述音节分离装置将输入的表音符号,根据其中的声调符号或无声调符号,划分为一个个音节;
所述变换控制装置用于根据已输入的音节数、已经或临时变换过的音节数,来决定下次汉字变换的对象的音节数及变换位置,并判断是单汉字变换还是单词变换;
所述有声调字典中按给定的优先顺序,排列和登录有包含声调符号的音节以及和该音节对应的同音异义字;
所述无声调字典中按给定的优先顺序排列和登录有包含无声调符号的音节及对应于该音节的同音异义字;
所述辞典中按给定的优先顺序排列和登录有含有声调符号或无声调符号的多个音节以及对应于这些音节的同音异义词;
所述单汉字变换装置按照包含将先输入的音节优先作为变换对象的给定算法,在至少变换一个音节时,如果当前变换对象的音节数为一,判断是否带有声调符号或无声调符号,根据判断结果,判断是检索所述有声调字典还是检索无声调字典,对于对应的同音异义字,考虑上述优先顺序,作为候选字检出;
所述单词变换装置按照包含将先输入的音节优先作为变换对象的给定变换算法,在至少变换一个音节时,若当前变换对象的音节数有多个,就检索所述辞典,并根据对应的同音异义词的优先顺序,检出候选单词;
前向修改装置将所述检出的候选词和前接该候选词的已检出的汉字或者与该候选词至少有一个共同的音节的前面已经检出的候选词作为对象,并按照音节数和反映上述优先顺序的给定的修改算法进行修改;
所述临时输出装置根据单汉字变换装置的检出结果和前向修改装置的修改结果,向使用者临时输出未经人手介入的变换的最终结果;
所述人手选择装置用于监视使用者对临时输出装置的临时输出结果的操作,对作为上述候选的输出的同音异义字或同音异义词进行确认操作,或从临时输出的多个候选字或单词中选择出本来想变换的字或单词,从而确定正确的变换结果;
所述输出装置用于最终输出所述正确的变换结果。
根据本发明的第二方面,所述有声调字典、无声调字典和辞典中的排列优先顺序,是根据预先的调查所得的使用频度,所述单汉字变换装置还具有单汉字使用频度反映变换部件,实现一种变换算法,利用学习功能对同音异义字的使用频度进行修正;所述单词变换装置,具有单词使用频度反映变换部件,实现一种变换算法,利用学习功能对同音异义词的使用频度加以修正。
根据本发明的第三方面,所述前向修改装置具有最大音节数存储部件,用于存储作为变换对象的单词之最大音节数;还具有变换音节数判断部件,如果所述的单词变换装置检出了候选单词,就判断该候选单词的音节数是否未达到所述最大音节数;还具有前接变换类型判断部件,如果变换音节数判断部件判断出未达到最大音节数时,就判断存在于所述候选单词之前的已检出的文字或候选词的音节是单一的文字还是单词;具有第一追加前向修正部件,若所述前接变换类型判断部件判断为单一文字时,将该单一文字的音节和所述候选单词的音节合并起来当作对象,由所述单词变换装置对之作用,如果检出了对应的单词,就将该检出的单词作为变换的优先选择的对象;具有第二追加前向修正部件,如果根据所述前接变换类型判断部件判断为单词时,判断从该单词结尾开始指定个数以内连续的若干个音节和所述候选单词的音节合并起来的音节数是否小于所述最大音节数,如果小于,就以该合并音节为对象,由所述单词变换装置对之作用,若这时检出对应的单词,就将这些检出的单词之中的音节数较多的单词,作为单词变换的优先选择的对象。
根据上记构成,在根据本发明的第一方面的汉字交换装置中,对无声调音节,使用者可利用数字化仪或键盘来输入包含有由声调符号和某些关键字所定义的无声调符号的拼音、注音、罗马字等表音符号。音节划分装置根据声调符号或无声调符号,将输入的表音符号按音节进行划分。变换控制装置,根据输入的音节数、已经或者整体地变换的音节数,根据最长一致法等及给定的程度和算法决定作为下次变换对象的音节数和变换位置,据此来判断随后的变换是单汉字变换抑或是多汉字单词变换。有声调字典中,按给定的优先顺序排列登录有含有声调符号的音节以及与该音节对应的同音异义字。无声调字典中,按规定的优先顺序排列和登录着包含无声调符号的音节以及与该音节对应的同音异义字。在辞典中,按规定的优先顺序排列和登录着包含有声调符号或无声调符号的多个音节以及这些音节所对应的同音异义词。单汉字变换装置把前面输入的音节作为变换对象,根据含有优先数的给定的变换算法,在至少变换一个音节的情况下,若当前变换对象的音节数为1,判断到底是声调符号或者是无声调符号,根据判断结果检索有声调字典或者无声调字典,把对应的全部同音异义字作为候选字检索出来,然后例如将指定数在CRT上临时显示之,或者为今后的修正处理临时进行存储。单词变换装置根据相同的程序等决定的当前变换对象的音节数大于1时,检索上述辞典,将对应的所有同音异义词作为候选词检索出来,然后例如将指定个数在CRT上进行临时显示,或者根据该候选词进了入下一处理流程,将它们临时存储在后备缓冲区中。前向修改装置以上述检出的候选词及与该候选词前接的已经检出的候选汉字为对象,或者是将该候选词以及与它至少有一个共有音节的存在于它前面的已经检出的候选语二者合并起来,作为修改对象,并以反映了音节数和上述优先顺序的规定的修改算法,对修改对象进行修改。临时输出装置根据单汉字变换装置的检出结果和前向修改装置的修改结果,将未经人手介入的变换的最终结果向使用者临时输出。人手选择装置使正在观察着临时在例如CRT上显示的上述检出的同音异义字或同音异义词的使用者,在第一候选不正确时,可以通过某种操作来从中选择出本来想变换的汉字或单词,从而可能得到正确的变换结果。此外,若第一候选正确,就保持原状而继续进行下一音节的输入,据此可使确定操作能自动完成。另外,在第一候补在当前作成文书的所定位置上显示出来,这是十分方便的。输出装置输出上述正确的变换结果。
在根据本发明第二方面的汉字变换装置中,前述有声调字典、无声调字典以及辞典内,作为排列规定的优先度,采用根据学者或制造者等预先进行调查的在中文文书中的汉字单词的使用频度。前述单汉字变换装置内的单汉字使用频度反映装置,作为上述给定的变换算法之一,利用短期学习功能,为使本装置的使用者的输入(使用)频度较高的同音异义字比上述两字典中的排列更为优先地进行变换而把它们合并起来进行必要修正,前述单词变换装置内的单词使用频度反映变换部,作为相同的上述给定的变换算法之一,在同音异义字中,进行必要的修正。以便由使用者输入(使用)的频度较高的单词比辞典的优先顺序更优先地进行处理。例如,如果在2~3日内或者20~30页这样的短期间被输入了2次,则原有的优先度就作废。
在根据本发明第三方面的汉字交换装置中,前述的前向修改装置内的各部分完成下述作用。最大音节数存储部存储有作为变换对象的单词的最大音节数。变换音节数判断部在前述单词变换装置检出了候选单词时,就判断该候选单词的音节数是否未达到上述最大音节数。前接变换类型判断部如果在变换音节数判断部判断未达到最大音节数时,就判断由紧靠上述候选单词的前接的已经检出的候选文字或候选单词的音节(但是,对由使用者正确地加以确定了的音节当然要除外)到底是单一的文字呢还是单词。第一追加前向修正部,在前述前接变换类型判断部判断为单一文字时,就将该单一文字的音节和上述候选单词合并起来的音节作为对象,仅前述单词变换装置在辞典内进行检索,如果检索出相应的单词,则将所检出的单词优先与汉字进而和单词变换相对应。为此,被检出的单词作为候选单词优先在CRT上进行显示等。第二追加前向修正部,在前述前接变换类型判断部判断为单词时,就判断从该单词的最后起,在指定数的音节和上述候选单词合并起来的音节数是否小于上述最大音节数,如果小于的话,就把这个合并的音节作为对象,使前述单词变换装置对之作用,若相应的单词被检出,就使这个检出的单词优先与单词变换相对应。并且若检出了音节数不同的多个单词的话,就使音节数多的单词更优先。
附图说明
图1是关于本发明的可省略声调符号的汉字变换装置的一个实施例的构成图。
图2是上述实施例中的有声调字典的数据结构概念图。
图3是上述实施例的无声调字典的数据结构概念图。
图4是上述实施例的辞典的数据结构概念图。
图5是上述实施例的汉字变换处理流程图的前半部分。
图6是上述实施例的汉字变换处理流程图的后半部分。
图7是上述实施例的前向修正的内容的示例说明图。
图8是汉语的声母、介母、韵母、声调等用罗马字、注音来表示的表音符号的说明图。
图9是先有的倚天汉字系统的结构示例图。
图10是先有的汉字变换装置的结构之一的示例图。
图11的(1)是最长一致法的变换对象的音节内容示例图,(2)是最长一致法的流程图。
具体实施方式
以下,就本发明的实施例加以说明。
(主要以结构为中心进行说明)
图1是本发明的可省略声调符号的汉字变换装置的一个实施例的结构图。本图中10是输入装置,15是表音符号寄存器,20是音节分离装置,30是变换控制装置,40是单词变换装置,45是辞典,50是单汉字变换装置,55是有声调字典,56是无声调字典,60是前向修正装置,70是人手选择装置,80是输出装置。
以下就上述各部的作用和功能加以说明。
首先,本装置的使用者,利用具有键盘等的输入装置,输入拼音、注音、罗马字等组成的表音符号。表音符号寄存器15,将输入的表音符号按声母、头母、韵母、声调进行分类,并存储到如下面2行中所示的对应位置。
存储位置    A       B       C       D
表音符号    声母    头母    韵母    声调
另外,此处的表音符号寄存器15的声母、头母、韵母、声调的各存储位置,只保存一个表音符号。但是,汉语的各音节中并不全都包含有声母、头母和韵母。例如,存在着没有声母的音节“uo3”,没有头母的音节“ba2”这样的音节,声母和头母都没有的音节“u4”。但是声调一定包含在内。本实施例的汉字变换装置中,由于对每一个发音,输入了声调符号或无声调符号,因此在声调符号的存储位置D,就放入了声调符号或无声调符号。
此外,为了上述目的,音节分离装置20检查表音符号寄存器中是否存储着声调符号或无声调符号,根据其有无可以分离出各个音节。
本说明书内,对图8中所示的一般的声调符号以及与本发明有关的无声调符号,如下方式表示。
声调符号:第一声用“1”来表示。
          第二声用“2”来表示。
          第三声用“3”来表示。
          第四声用“4”来表示。
          轻声用“5”来表示。
          无声调符号:用“~”来表示。
如果在表音符号寄存器15的声调存储位置保存有无声调符号的话,就判断该音节为无声调音节,存储有声调符号的音节当然就认为是有声调音节。
本实施例的汉字变换装置具有下述三种变换用辞典。
第1是有声调字典,它将对应于包含有声调符号的音节的同音异义字,按使用频度的顺序进行排列和登录。
第2是无声调字典,它将对应于含有无声调音节的音节的同音异义字,按使用频度的顺序进行排列和登录。
第3是辞典,它将含有声调符号的多个音节所对应的同音异义词,按使用频度的顺序进行排列和登录。
在有声调字典55中,登录有1384个读音和大约13,000个汉字(参考是反映Big5码的13051个的内容。)该有声调字典55的数据结构示于图2中。如本图所示,某一个读音,例如“maol”中没有同音异义字,只对应了一个汉字,而某个读音,如“ba2”却对应了8个等,因此同音异义字的个数存在着很大的偏差。
在无声调字典56中,登录着500个的读音和约13000个汉字。该无声调字典的数据结构示于图3中。如本图所示,例如“ba~”这一无声调符号构成的表音符号,其对应的同音异义字则由所有的无视声调变化而成为同样音节的“ba1”、“ba2”、“ba3”、“ba4”、“ba5”所对应的同音异义字组成。此外,这些同音异义字的排列,是以大量的文章作为对象进行调查、分析之后所得的使用频度来作为排列的顺序。
辞典45中登录着24000个的二字词的读音,3,270个的三字词的读音,3100个四字词的读音以及与它们所对应的单词。该辞典的数据结构示于图4中。如该图所示,在该辞典中,存储有单词的读音符号以及对应于该读音的单词(或同音异义词等),对每一个不考虑声调变化的同样音节,设定一个对应的音节区,并在该区内登录单词,这样一来,就可以只基于表音符号本身而与声调符号或无声调符号无关地进行单词变换。例如,以下的例1中所示的“bei3jieng”(北京)和“bei4jieng3”(背景)便存储于同一个单词区中。
例1:
    读音(音节)                对应单词
    bei3jieng1                  北京
    bei4jieng4                  背景
为此,对下面左边所示的表音符号的输入,就可以得到右边所示的变换结果。
    表音符号                  变换结果
    bei3jieng1                  北京
    bei4jieng3                  背景
    bei~jieng1                 北京
    bei~jieng3                 背景
    beijieng~                  北京
    bei4jieng~                 背景
    bei~jieng~             北京、背景
但是,上述变换结果,由于未考虑正确的音调,当然对应登录的单词数目就会增加。
下面的例2具体地列举了可能的变换结果最多的情形。
例2:
读音(音节串)                 对应单词
    sh1li3                     失礼
    sh1li4                     失利
    sh2li4                  实力、实例
    sh4li3                     事理
      sh4li4               势力、事例、视力、
                              市立、势利
为此,若输入下列左边所示的表音符号,就会产生右边所示的变换结果。
    表音符号                  变换结果
    sh1li3                      失礼
    sh1li4                      失利
    sh2li4                   实力、实例
    sh4li3                      事理
    sh4li4                势力、事例、视力、
                             市立、势利
    sh~li3                  事理、失礼
    sh~li4             失利、实力、实例、事例、
                          视力、市立、势利
    sh1li~                  失礼、失利
    sh2li~                  实力、实例
    sh4li~             事理、势力、事例、视力、
                             市立、势利
    sh~li~            失礼、失利、实力、实例、
                        事理、势力、事例、视力、
                             市立、势利
变换控制装置30根据输入的音节数和已变换过的音节数,来决定后续变换对象的音节数及变换位置,进而判断作为该音节的声调符号,到底是带有本来的声调符号还是带有无声调符号,并据此来检索有声调字典55,还是检索无声调字典56,或者检索辞典45。具体来说,若变换对象的音节数为1的话,就进入单汉字变换装置50的处理,若变换对象的音节数有多个,则进入单词变换装置40的处理,根据这些处理来进行汉字变换。若变换对象的音节数只有一个,而且该音节中包含有声调符号,这时就检索有声调字典55。若变换对象的音节数为1,而且该音节由无声调符号构成,这时就检索无声调字典56。当变换对象的音节数多于一个时,就由单词变换装置40检索辞典45进行变换。前向修正装置60在显示候选文字时,使单词比单一的汉字优先,在多个单词时,字数较多的单词优先,当字数相同时,使用频度较高的单词优先,采用这一优先算法,就可以把初步进行的单汉字变换或单词变换的结果向前方进行修正。人手选择装置70,在初步的变换结果不是使用者想要的文字时,可以让使用者从其它的同音异义字或同音异义词中选择所想要的文字。此外,为达到此目的,就必须具备根据使用频度所确定的优先顺序来显示若干个候选文字等的功能,以及由使用者在其中指定想要的文字,最终进行确定的功能,为此,作为硬件,构成输入装置的键盘及CRT等与整个硬件连成一体。输出装置80在屏幕中当前所作成文书的相应位置处,以显示出正确的变换结果的形式来输出变换结果。为此,就要使写入软盘的部件、打印部件等与整个硬件连为一体。
(以变换的基本频骤为中心加以说明)
以下,对本实施例的动作流程进行说明。
图5和图6是本实施例的汉字变换装置的处理流程图。
在S1步,使用者从键盘等输入表音符号等。
在S2步,判断由使用者输入的符号是否是表音符号。若不是表音符号,就返回S1,等待下一次的表音符号的输入。如果是表音符号,就进入S3处理。
在S3步,对输入的表音符号进行分类,并存储到表音符号寄存器15的相应位置。
在S4步,判断所输入的表音符号中的声调符号,到底是本来的声调符号还是无声调符号。在既不是本来的声调符号,也不是无声调符号的情形,返回S1的处理,等待后续的表音符号的输入。另一方面,如果是本来的声调符号或者是无声调符号,就判断一个音节的输入已经完成,进入S5步。
在S5步,把经过刚才的处理,被输入和保存在表音符号寄存器15中的表音符号,看作是一个完整的读音(音节),并把这个音节保存到音节寄存器中(图1中未表示出来)。
在S6步,判断作为变换对象的一连串的音节的输入是否已经结束。如果没有结束,返回S1的处理。如果已结束,进入S7。
在S7,对至今为止所输入的一连串的音节,检索字典或辞典,并考虑应进行汉字变换的所输入的音节数及已初步变换过的音节数,对能够进行检索的最大音节数和变换位置等进行设定。此外,这时,由于汉语原则上是一个汉字对应一个音节,因此能进行检索的最大音节数当然不会超过辞典中所存储的单词的最大字数。因此,本实施例中,作为音节数,最初设定为“4”。
在S8步,根据S7步所设定的变换对象的音节数以及变换对象的音节所占的位置,从音节寄存器的对应位置起,取出作为整体变换对象的音节。
在S9,根据音节数和声调符号的情况,判断到底是检索有声调字典55还是无声调字典56,或者是检索辞典45。具体地说,如果判断出作为现在的变换对象的、已被分离出来的音节的音节数大于1的话,就转入S10步,去检索辞典45。如果音节数是1,并且如果判定它们带有声调符号,则转S11步,检索有声调字典55。如果音节数为1,并且判定它们带有无声调符号的话,则转S12,检索无声调辞典56。
在S10步,将除去了声调符号或无声调符号之后的音节所对应的全部同音异义词检索出来,保存在同音异义词缓冲区内(图1中未予表示),并按使用频度由高到低对同音异义词排序,作为候选词。此外,还要计算已经变换过的音节数(即文字数)。
S13步,检索有无上述检索出的单词,在没有对应单词的情形,就把最前面的那个音节变换为单一汉字,并将变换对象的音节数减1,把表示变换位置的数值加1之后,也就是说作为变换对象的音节,是把上次检索对象的音节中的为首的那个音节除去之后的音节,返回S8进行处理,再一次检索字典或辞典并进行变换。在存在对应的单词时,进入S14,判断有无必要进行前向修正。
在S14,将本次变换后的单词的使用频度与上一次检索的变换结果的单词等进行比较,假如本次变换后的单词的使用频度比上一次变换结果的更高,就判断有必要进行前向修正,进入S15的前向修正的处理。假如本次变换过的单词的使用频度不高于上次时,就进入后述的S21的处理。假如上次的变换结果不是单词而是单一的汉字,由于单词比单一汉字优先,就判定有必要进行前向修正,根据S15步,将上次的单一汉字改书为本次变换后的单词。
S15步,作为前向修正,将上次变换后的单一汉字或单词,改写为本次变换结果的使用频度更高的单词。
S11步,检索有声调辞典55,在检出了对应于该分离出的音节的全部同音异义字之后,将它们保存到同音异义词缓冲区,同时,还把使用频度较高的候选单汉字作为变换结果进行显示。并计算出已经变换过的音节数(亦即文字数)。
在S12步,检索无声调字典56,在检出对应于该分离出的音节所对应的全部同音异义字之后,将它们保存到同音异义词缓冲区,同时,还把使用频度较高的候选单汉字作为变换结果进行显示。此外,还计算已经变换过的音节数(亦即文字数)。
S16步显示由上述S10,S11,S12所检出的初步变换结果。
S17步,判断是否要通过手工来选择其它的同音异义字或同音异义词。当使用者判断初步的变换结果不是想要的东西时,就压下选择其它同音异义字或同音异义词的命令键,进入S18的处理。在不必进行人工选择时,则转到S20。
在S18步,使用者借助于按下变换键等,就会显示出较低优先顺序的同音异义字或同音异义词等,并利用它们来选择出所希望的单一汉字或单词。但是,由于这与日语文字处理机的内容相同,不作更多的说明。
S19步,将前面的变换结果,同S18所选择的单一汉字或者单词去更新它们。
S20步,判断有无继续的输入。如果还有使用者的后续输入,就转S1的处理。如果已没有后续的输入,处理便结束。
(以下以前向修正为中心进行说明)
图7中示出了整体变换的对象的最大音节数为5时的前向修正的内容。图中“暂定文字”,“暂定单词”所在的方框内或者相同的多个连续方框内,指出了各个初频变换了的或者是作为候选而列举出来,并且可由后面的前向修正而进行变换的某些文字或单词。只有数字的方框中指出来变换音节。此外,本图中,由某作为变换对象,把4个音节来作为对象考虑时非常繁杂,因而加以省略,但基本的想法与图示的3个音节的情形相同。进而,在音节数为5时,作为包含先输入的音节变换对象更优先的算法,假如对最长一致法或无声调符号追加了修正,使用了类似这样的算法的话,在进入前向修正之前,作为一个先行步骤,使用最长一致法等,在此情形由于进行了检索等处理,就可不进行前向修正。
(以下用具体例来加以说明)
下面,对如上结构的本实施例的可省略声调符号的汉字变换装置,以下以4个音节构成的“北京城市”作为具体例,对其动作进行说明。并且,本发明中,因为可以输入声调符号和无声调符号,对由4个字组成的“北京城市”这一单词及汉字的声调,可能的表音符号共计16类(24)。(注:有轻声“5”的汉字及单词很少。)但是,对它们全部加以说明十分冗长,以下只对其中3种类型加以说明。
(一):分别对四个文字正确地输入声调符号“bei3jieng1 ch2 sh4”
(二):作为该四文字的声调符号,全部输入无声调符号“bei~jieng~ch~sh~”
(三):这四个文字中,对某几个文字的声调符号采用无声调符号输入。
“bei3jieng~ch~sh4”
首先,说明(一)的处理状况。当一开始输入了构成最初的发音“b”、“e”、“i”、“3”的表音符号之后,在S1,S2,S3这三个步骤,这些符号按顺序存储到表音符号寄存器15中。接着在S4步对输入的“3”判定其为声调符号。在S5步,把表音符号寄存器15中的表音符号作为构成一个音节的表音符号取出来,被取出的“bei3”被保存到音节寄存器中。进而,根据S7的处理,将音节数设定为1,在S8步,从音节寄存器取出一个音节。在S9步,由于判定这个音节带有声调符号,并且音节数为1,由S11来检索有声调字典55。并且,对应于这个音节的汉字只有“北”,将“北”保存到同音异义词缓冲区,同时,作为变换结果,由S16步在监视器上显示出来。继而,与“北”的变换相同,对第二个文字的表音符号,当检出其声调符号“1”之后,就将已经输入的“j”、“i”、“e”、“n”、“g”和“1”组成起来的表音符号“jieng1”保存到音节寄存器中(S1~S5)。进而在S7步,由于音节数设定为2,在S7步从音节寄存器取出二个音节“bei3jieng1”。由于在S8步判定该音节的音节数为2,就由S10来检索辞典。并且,由于对应这个音节的单词只有“北京”,将“北京”保存到同音异义词缓冲区,同时,在S13步判定具有对应的单词。根据S14的处理,判断出前次变换的结果是单一的汉字而不是单词,因此根据S15步作前向修正,将“北”修改为“北京”,作为更加正确的结果,在S16步从屏幕上进行显示。第三个文字的表音符号,根据从S1到S5的处理,将“ch2”保存到音节寄存器中。进而在S6步,由于将音节数设定为3,在S7步从音节寄存器中取出三个音节“bei3jieng1ch2”。在S9,判断出该音节的音节数为3,因此,在S9步对辞典45进行检索,在S13步,判断出没有和这些音节对应的单词,因此,进入S21的处理,将音节数减1之后,由S8从音节寄存器中取出二个音节“jieng1ch2”。在S9,由于判定该音节数为2,就由S9检索辞典45,在S134判断出与这些音节对应的单词有“京城”。其结果可由S14与前次变换的结果“北京”的使用频度进行比较,由于前次变换结果的单词使用频度更高,“京城”作不正确处理。其结果,由S21将变换对象的音节数减1之后,再次进入S8。在S7,从音节寄存器中取出一个音节“ch2”。在S8,由于判断出这个音节带有声调符号,而且音节数为1,因此由S11对有声调字典55进行检索,将这个音节所对应的单汉字“成、城、乘、呈、程、承、诚、、......”保存到同音异义词缓冲区中,同时,将使用频度最高的“成”作为变换结果由S16在屏幕上显示出来。作为第四个文字的表音符号,经过S1到S5的处理,将“sh4”保存到音节寄存器中。进而,在S7,由于音节数设定为4,因此在S8,从音节寄存器中取出4个音节“bei3 jieng1 ch2 sh4”。经过S9、S10、S13,由于判断出对应于这些音节的四字(汉字)词不存在,因而进入S21,最前面的音节应不在变换对象之中,将音节数减1之后,经S8从音节寄存器中取出三个音节“bei3 jieng1 ch2”。并且,从这时起,作为前向修正对象的音节数,一定是小于作为整体变换对象的最大音节数,此外,可知作为先行算法的整体变换对象的音节数,一定小于或达不到最大音节数。
这样一来,在这情形与上次一样,因为是三字词,便将音节数减1,检索2字词。经过S8、S9、S10、S13检索出对应这些音节的单词“城市”、“程式”、“乘势”、“成事”。经S14,根据单词比单汉字优先的原则,经过S15的前向修正,将前次变换所得的“成”替换为使用频度更高的单词“城市”。由于后面已没有新的输入,将“北京城市”作为最终变换结果,经S16在屏幕上显示出来。
(二)的情形的处理流程与(一)时的情况大体相同。但有下述两步不一样。
(1)若音节数为1,并且带有无声调符号,因此由S12检索无声调字典56。
(2)若音节数大于2,就检索辞典45,这个辞典检索过程中,由于音节内带有无声调符号,因此和声调符号没有关系,检索出对应于相同音节的所有单词。例如,对表音符号“bei~jieng~”的检索,可检出“bei3jing1”(北京)和“bei4jieng3”(背景)。
(三)的情形的处理流程也与(一)的流程大致相同,但有下述两点不一样。
(1)若音节数为1,并且带有无声调符号时,经S12检索无声调字典56。假如音节数大于1并且带有声调符号时,由S11来检索有声调字典55。
(2)若音节数大于2,就检索辞典45,由于该辞典中某个音节上带有声调符号,可以以该声调符号为基础,检出相应的单词。例如,对表音符号“bei3jieng~”,就只检出了“bei3jieng1”(北京)。由于“bei4jieng3”(背景)的“bei4”与“bei3”并不匹配,因此不被检出。
(对学习功能的说明)
本汉字变换装置的两个字典内的汉字的排列和辞典中的单词的排列,与日文文字处理机中的假名输入汉字变换的情形相同,是预先进行调查过使用频度,并按此来进行排列的。但是由于作成对象的中文文书的内容、方言、文字输入者的不同,实际输入的汉字及单词的频度也大相径庭。同样地,无声调符号怎样输入,随文字输入者的不同也有很大差异。因此,本汉字变换装置中,附加了能适应上述差别的短期学习功能。并且,在一定的时间和作成文书量内,若同一的变换多次进行,以后对同一输入;则与辞典、字典内的优先度无关,直接输出变换结果。(因此,作为其前提条件,当然已由文书的输入者作过了多次订正操作。)
但是,为达成学习功能或附加上学习功能,其结构也用于日文文字处理机内,由于这已是周知的技术,因而省略了对它的说明。此外,此处不是长期,学习而短期,学习这样便可在文字输入者不知道正确声调的情况下迅速地进行对应。因此,与业务用的汉字变换装置不同,并且如果所有(使用)者不善文书等,那么从时间的方面考虑,当然也可以采用长期学习功能。以上,根据几个实施例,对本发明进行了说明。但本发明绝不限于上述实施例,在不改变它的主旨的范围内,当然也可以进行适当变形并加以实施。例如
(1)表音符号不是罗马字或拼音符号,而是注音符号、同第二式等。此外,对应于它们,图3~图5的辞典的排列也要变更。
(2)无声调符号不是用“~”,而是用便于键盘输入的其它符号,如用“*”、“@”等。
(3)为了便于制造和制作,本发明的不可或缺的结构要素(要件、装置)在机械上、物理上可由多个部件来构成,相反也可将多个部件组装为一体,或者是将它们进行适当的组合。
(4)现有的汉字变换装置中,附加上必要的硬件和软件,可以发挥本发明的功能。
(5)同音异义字等的使用频度,按领域、方言等加以区分,根据所要作的文书的内容,可通过开关操作或更换磁盘来进行切换。
(6)检出的候选文字或候选词,按优先数的高低顺序,对指定个数,例如5个进行放大显示,假如所显示的没有使用者想要的,就通过其它途径的操作,显示出其它的候选者。据此,可达到防止眼睛疲劳和避免太过杂乱。或者在同音异义字很多时,对于优选度较低的文字,不作为限定特别操作的候补文字进行显示。
(7)与其它算法并用。
在实施例中或多或少进行了说明,例如,与最长一致法并用(但是,考虑到无声调符号的存在,多少进行了一些修正)。此外,这时,作为前向修正的对象的音节数,将它与最长一致法中的整体变换的对象的音节数进行比较时,为了避免重复检索单词,当然就要使它少一个音节。
因此,若最长一致法的整体变换的最大音节数如图11中所示那样为4的话,则前向修正的对象的音节数最大为3。
(8)若整体变换对象的音节数很多的话,在作前向修正时,也可以分为2段、3段来进行。
例如,在图7的最下段的右边,将3和4的音节变换为单词,进而将2和3和4的音节变换为单词,更进一步将1和2和3和4的音节变换为单词等。
(9)在实施例中,将中间变换结果逐一进行显示,而对装置内的未经人手介入所进行的修改,直到决定出最终的候选文字或单词之前,不进行显示。这样,文书作成者可以专心致致地进行表音符号的输入和变换结果的确认。
(10)同样地,辞典的数据结构是对包含声调符号的单词进行排列,此外,还设有由无视音调变化的相同音节的单词排列起来的单词区,只登录有包含声调符号的单词,当输入了存在有无声调的多个音节时在单词变换时进行读出的时候,只忽略已输入的无声调符号,以便读出由相同音节对应的单词。这样,在无声调符号的输入频度较低时,可以使单词检索及前向修正时,减少必要的处理。因此,可以维持本发明的效果,可以高速化变换。
(11)关于按照带有无声调符号的单词的使用频度进行排序等,只对“北京”、“台湾”、“香港”这样的被判定为使用频度特别高的单词才予考虑。
正如以上说明那样,根据本发明的声调符号可省略的汉字变换装置,由于不必要求正确输入声调符号,对使用者来说输入变得容易了,另一方面,使单词优先于单一汉字,进而考虑了汉字、单词的使用频度,因此可以提高变换的效率和正确性。此外,由于进行了从前方起的变换和从后方起的前向修正,更加提高了正确性。因此,具有很大的实用价值。

Claims (3)

1、一种可省略声调符号的汉字变换装置,其特征在于包括:
表音符号输入装置、音节分离装置、变换控制装置、有声调字典、无声调字典、辞典、单汉字变换装置、单词变换装置、前向修改装置、临时输出装置、人手选择装置和输出装置;
所述表音符号输入装置对于音节用于输入含有由声调符号和指定键定义的无声调符号的拼音、注音或罗马字这种表音符号;
所述音节分离装置将输入的表音符号,根据其中的声调符号或无声调符号,划分为一个个音节;
所述变换控制装置用于根据已输入的音节数、已经或临时变换过的音节数,来决定下次汉字变换的对象的音节数及变换位置,并判断是单汉字变换还是单词变换;
所述有声调字典中按给定的优先顺序,排列和登录有包含声调符号的音节以及和该音节对应的同音异义字;
所述无声调字典中按给定的优先顺序排列和登录有包含无声调符号的音节及对应于该音节的同音异义字;
所述辞典中按给定的优先顺序排列和登录有含有声调符号或无声调符号的多个音节以及对应于这些音节的同音异义词;
所述单汉字变换装置按照包含将先输入的音节优先作为变换对象的给定算法,在至少变换一个音节时,如果当前变换对象的音节数为一,判断是否带有声调符号或无声调符号,根据判断结果,判断是检索所述有声调字典还是检索无声调字典,对于对应的同音异义字,考虑上述优先顺序,作为候选字检出;
所述单词变换装置按照包含将先输入的音节优先作为变换对象的给定变换算法,在至少变换一个音节时,若当前变换对象的音节数有多个,就检索所述辞典,并根据对应的同音异义词的优先顺序,检出候选单词;
前向修改装置将所述检出的候选词和前接该候选词的已检出的汉字或者与该候选词至少有一个共同的音节的前面已经检出的候选词作为对象,并按照音节数和反映上述优先顺序的给定的修改算法进行修改;
所述临时输出装置根据单汉字变换装置的检出结果和前向修改装置的修改结果,向使用者临时输出未经人手介入的变换的最终结果;
所述人手选择装置用于监视使用者对临时输出装置的临时输出结果的操作,对作为上述候选的输出的同音异义字或同音异义词进行确认操作,或从临时输出的多个候选字或单词中选择出本来想变换的字或单词,从而确定正确的变换结果;
所述输出装置用于最终输出所述正确的变换结果。
2、权利要求1所述的可省略声调符号的汉字变换装置,其特征在于:所述有声调字典、无声调字典和辞典中的排列优先顺序,是根据预先的调查所得的使用频度,所述单汉字变换装置还具有单汉字使用频度反映变换部件,实现一种变换算法,利用学习功能对同音异义字的使用频度进行修正;所述单词变换装置,具有单词使用频度反映变换部件,实现一种变换算法,利用学习功能对同音异义词的使用频度加以修正。
3、权利要求1或权利要求2所述的可省略声调符号的汉字变换装置,其特征在于:所述前向修改装置具有最大音节数存储部件,用于存储作为变换对象的单词之最大音节数;还具有变换音节数判断部件,如果所述的单词变换装置检出了候选单词,就判断该候选单词的音节数是否未达到所述最大音节数;还具有前接变换类型判断部件,如果变换音节数判断部件判断出未达到最大音节数时,就判断存在于所述候选单词之前的已检出的文字或候选词的音节是单一的文字还是单词;具有第一追加前向修正部件,若所述前接变换类型判断部件判断为单一文字时,将该单一文字的音节和所述候选单词的音节合并起来当作对象,由所述单词变换装置对之作用,如果检出了对应的单词,就将该检出的单词作为变换的优先选择的对象;具有第二追加前向修正部件,如果根据所述前接变换类型判断部件判断为单词时,判断从该单词结尾开始指定个数以内连续的若干个音节和所述候选单词的音节合并起来的音节数是否小于所述最大音节数,如果小于,就以该合并音节为对象,由所述单词变换装置对之作用,若这时检出对应的单词,就将这些检出的单词之中的音节数较多的单词,作为单词变换的优先选择的对象。
CNB961123486A 1995-09-25 1996-09-20 可以省略声调符号的汉字变换装置 Expired - Fee Related CN1147809C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP245843/1995 1995-09-25
JP245843/95 1995-09-25
JP7245843A JPH0991274A (ja) 1995-09-25 1995-09-25 声調記号省略可能な漢字変換装置

Publications (2)

Publication Number Publication Date
CN1155123A CN1155123A (zh) 1997-07-23
CN1147809C true CN1147809C (zh) 2004-04-28

Family

ID=17139684

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB961123486A Expired - Fee Related CN1147809C (zh) 1995-09-25 1996-09-20 可以省略声调符号的汉字变换装置

Country Status (2)

Country Link
JP (1) JPH0991274A (zh)
CN (1) CN1147809C (zh)

Also Published As

Publication number Publication date
CN1155123A (zh) 1997-07-23
JPH0991274A (ja) 1997-04-04

Similar Documents

Publication Publication Date Title
CN1113305C (zh) 语言处理装置和方法
CN1205572C (zh) 对拼写、打字和转换错误具有容错能力的将一种文本形式转换为另一种文本形式的语言输入体系结构
CN1259632C (zh) 纠正文本文档的文本输入的方法和系统
CN86105610A (zh) 使用汉语拼音的汉字数据处理和字处理的方法和装置
CN1387639A (zh) 语言输入用户界面
CN1648828A (zh) 去多义性语音输入系统和方法
CN1993692A (zh) 字符显示系统
CN1232226A (zh) 句子处理装置及其方法
CN1384940A (zh) 以无模式输入将一种文本形式转换成另一种文本形式的语言输入体系结构
CN1040276A (zh) 简繁字根汉字输入技术及其键盘
CN86108582A (zh) 速记翻译系统
CN1120439C (zh) 机器翻译用中文生成装置
CN1147809C (zh) 可以省略声调符号的汉字变换装置
CN1186711C (zh) 蒙古文输入方法
CN1084500C (zh) 汉字变换装置
CN1227369A (zh) 汉语输入变换处理装置和汉语输入变换处理方法
CN1732460A (zh) 带有例句的电子词典
CN1241101C (zh) 一种基于汉语音节双读方案的信息输入方法
CN1053976C (zh) 全拼双拼混用型中文输入方法
CN1679023A (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
CN1123818C (zh) 电拼汉字计算机输入法、所用键盘及其中文内码
CN1129058C (zh) 仿真拼音汉字输入法
CN1133126C (zh) 中文文字处理装置
CN1275732A (zh) 汉语键盘输入系统及其应用技术
CN1287321A (zh) 文本制作装置、转换处理方法和记录转换处理程序的记录媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee