CN101377773B - 信息处理设备和信息处理方法 - Google Patents

信息处理设备和信息处理方法 Download PDF

Info

Publication number
CN101377773B
CN101377773B CN2008102126808A CN200810212680A CN101377773B CN 101377773 B CN101377773 B CN 101377773B CN 2008102126808 A CN2008102126808 A CN 2008102126808A CN 200810212680 A CN200810212680 A CN 200810212680A CN 101377773 B CN101377773 B CN 101377773B
Authority
CN
China
Prior art keywords
vocabulary
souvenir
character
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008102126808A
Other languages
English (en)
Other versions
CN101377773A (zh
Inventor
开田有纪子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of CN101377773A publication Critical patent/CN101377773A/zh
Application granted granted Critical
Publication of CN101377773B publication Critical patent/CN101377773B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

本发明提供一种信息处理设备,包括:外国语辞典单元、通过其输入字符或字符串的输入单元、判断单元、存储关于字符的表记信息的存储单元、搜索单元、转换器、及输出单元。外国语辞典单元存储大写、小写、或大写和小写字符的组合的形式的各个外国语词汇。判断单元判断通过输入单元输入的字符是大写还是小写。搜索单元在外国语辞典单元搜索与按照输入字符的顺序的从起首开始的所输入字符串相对应的词汇。转换器按照表记信息,来转换在由搜索单元所提取的词汇中包含的每个字符的表记。输出单元把由转换器转换表记的词汇作为候补词汇来输出。

Description

信息处理设备和信息处理方法
技术领域
本发明总体上涉及一种信息处理设备和信息处理方法,其中该信息处理设备包括计算机、传真机、复印机、打印机、及具有这些功能中的至少两种功能的多功能机。 
背景技术
广泛使用的信息处理设备包含存储多个词汇的辞典,在辞典中搜索与用户向信息处理设备输入的字符串相对应的词汇,以及显示所搜索的词汇。 
然而,因为每个外国语词汇能够以多种方式(以下称为“表记(notation)”)书写,已知的信息处理设备针对每个词汇存储多种表记。例如,词汇“economic”可以书写为小写的“economic”、大写(caps)的“ECONOMIC”、及仅仅其第一个字符大写化的“Ecomonic”,其存储要求大存储器。 
然而,如果即使当每个外国语词汇以小写、大写、及至少一个小写字符和至少一个大写字符的组合之中的任意一种来注册时,以上述方式中的任意一种输入的给定词汇均能够被搜索并以该方式显示,则能够节省辞典存储器而不降低输入效率。 
发明内容
鉴于上述,在本发明的一个示例性实施例中,信息处理设备包括外国语辞典单元、输入单元、判断单元、存储单元、搜索单元、转换器、及输出单元。外国语辞典单元存储大写、小写、及至少一个大写字符和至少一个小写字符的组合之一的形式的各个外国语词汇。用户然后可以通过输入单元把字符输入到信息处理设备。判断单元配置为判断通过输入单元输入的字符是大 写还是小写。存储单元存储表示该字符是大写还是小写的表记信息。每次通过输入单元输入字符时,搜索单元在外国语辞典单元搜索与按照输入字符的顺序的从起首开始的所输入字符串相对应的词汇。转换器按照在存储单元中存储的表记信息,来转换在由搜索单元所提取的词汇中包含的每个字符的表记。输出单元然后把由转换器转换表记的词汇作为候补词汇来输出。 
在本发明的另一示例性实施例中,信息处理方法包括:输入字符;判断该字符为大写还是小写;存储表示该字符为大写还是小写的表记信息;在多个外国语词汇按照大写、小写、及至少一个大写字符和至少一个小写字符的组合中的一种来注册的外国语辞典单元,每次输入字符时,搜索与按照输入字符的顺序的从起首开始的所输入字符串相对应的词汇;按照所存储的表记信息,来转换在由搜索单元所提取的词汇中包含的每个字符的表记;以及把表记被转换的词汇作为候补词汇来输出。 
在本发明的又一示例性实施例中,计算机可读记录介质存储程序。所述程序配置为使计算机执行上述处理。 
附图说明
对本公开及其许多伴生的优点的更完整的领会,在当与附图相关联地考虑时参照随后的具体描述将变得更好理解的情况下,将容易地获得,其中: 
图1是示出按照本发明示例性实施例的信息处理设备的主要部分的功能配置的例子的框图; 
图2示出图1所示的辞典的格式的例子; 
图3示出图1所示的历史存储单元的格式的例子; 
图4示出由图1所示的信息处理设备执行的外国语词汇应对处理的序列; 
图5示出由图1所示的表记转换器执行的输入字符应对处理的序列; 
图6示出由图1所示的搜索单元执行的搜索处理的序列; 
图7示出由图1所示的表记转换器执行的候补词汇输出处理的序列; 
图8示出由图1所示的表记转换器执行的候补词汇输出处理的另一序列; 
图9示出当用户输入大写“E”时在图1所示的软件键盘上显示的候补词汇的例子; 
图10示出当用户输入小写“e”时在图1所示的软件键盘上显示的候补词汇的例子; 
图11示出由图1所示的表记转换器执行的候补词汇输出处理的另一序列; 
图12示出当用户输入多个小写字符并且诸如固有名词、缩写、等等的包含大写字符的词汇被排除作为候补词汇时在图1所示的软件键盘上的显示的例子; 
图13示出当用户输入多个小写字符并且候补词汇显示为小写时在图1所示的软件键盘上的显示的例子; 
图14示出当用户输入第一个字符大写而第二个字符小写的“Ec”时在图1所示的软件键盘上显示的候补词汇的例子; 
图15示出当用户输入大写的“EC”时在图1所示的软件键盘上显示的候补词汇的例子; 
图16示出应对带有读音符号标记的字符的处理序列; 
图17示出当用户指定候补词汇的类型时由图1所示的表记转换器执行的处理序列; 
图18示出当用户指定候补词汇的类型时在图1所示的软件键盘上的显示的例子; 
图19示出由图1所示的表记转换器执行的处理序列,该处理序列用来仅仅输出其表记与用户指定的表记相同的词汇,作为候补词汇;以及 
图20示出当用户指定候补词汇的表记时在图1所示的软件键盘上的显示的例子。 
具体实施方式
在描述图中图示的优选实施例的过程中,出于清楚说明的缘故而采用特定的术语。然而,本专利说明书的公开不意图限制于如此选择的特定术语,应当理解,每个具体元件包括以类似方式操作的所有技术上的等同物。 
现在参照附图,其中,贯穿多个视图,相似的参考标号表示相同或相应的部分,具体参照图1,描述按照本发明的示例性实施例的信息处理设备1。
图1是示出信息处理设备1的主要部分的功能配置的框图。 
信息处理设备1可以是计算机、传真机、复印机、打印机、及包含这些功能中的至少两种的多功能机之一,具有在辞典搜索与用户输入的字符串相对应的词汇的功能,并显示该对应的词汇。 
如图1所示,信息处理设备1包含软件键盘2和语言输入支持引擎3。软件键盘2用作输入单元,包含显示部分,在该显示部分上显示各种关键字及显示区域。用户触摸关键字以输入字符,包含用户输入的那些字符的各种信息输出到语言输入支持引擎3。 
语言输入支持引擎3包括:输入接收器10,用作输出单元;表记转换器11;搜索单元12;辞典13,包含一个或多个外国语辞典单元;学习单元14;及历史存储单元15。表记转换器11包含判断单元11A、存储单元11B、及转换器11C。 
语言输入支持引擎3按照包含用户输入的字符的信息,在辞典13搜索词汇,把该词汇输出至软件键盘2,然后软件键盘2把该词汇作为选项来显示。 
应当注意,下面的描述涉及外国语的输入,其中所述外国语使用作为诸如字母的多种字符的组合的按照语音构成的词汇,从而排除诸如汉语的表意语言。另外,虽然在下文的描述中英语被选择作为示例语言,但是,本发明的示例性实施例能够适用于德语、法语、等等。 
而且,应当注意,通过已知的方法,日语能够输入到按照本发明示例性实施例的信息处理设备,省略其描述。 
输入接收器10能够由包含中央处理单元(CPU)、只读存储器(ROM)、及随机存取存储器(RAM)的计算机来实施。ROM是存储程序的计算机可读记录介质,该程序包含用来执行与本实施例有关的各种功能的过程。当CPU读取程序并按照程序操作时,按照本实施例的信息处理方法能够实施,以执行那些功能。 
应当注意,通过分发存储程序的计算机可读记录介质,上文描述的程序能够容易地导入至计算机。 
图2示出辞典13的格式的例子。 
辞典13是存储器,该存储器存储日语词汇、各种信号、及多个外国语词汇。每个外国语词汇以多种表记之一注册,在本实施例中,所述多种表记为小写、大写、及其组合。 
如图2所示,例如,字符串“economic”以小写存储在辞典13中,与搜索关键字“economic”及词汇类型标志“0”相关联。如上所述,每个词汇以小写、大写、或其组合来存储。 
搜索关键字是小写的字符串,用来搜索与用户通过软件键盘2输入的字符串相对应的词汇。在本实施例中,词汇类型标志表示词汇类型,其中,数值0、1、2、3、及4分别表示通常词汇、人物或公司的名称、地点名称、人物、公司、及地点名称之外的固有名词、以及缩写。 
图3示出历史存储单元15的格式的例子。 
历史存储单元15是另一存储器,保持从显示在软件键盘2上的候补中选择的词汇、及通过软件键盘2输入并确认的词汇的历史。 
如图3所示,在历史存储单元15中,各个词汇与搜索关键字及在该词汇被选择或确认之前刚刚确认的在先词汇相关联地存储。例如,词汇“juice”能够与搜索关键字“juice”及在先词汇“apple”相关联地存储在历史存储单元15中。 
应当注意,在此情况下,“juice”是“apple”的随后词汇。 
参照图4在下文描述由图1中所示的信息处理设备1所执行的外国语词汇应对处理的序列。 
当用户通过软件键盘2输入外国语字符时,在S1,语言输入支持引擎3的输入接收器10接收输入字符,并把该字符输出至表记转换器11。 
在S2,表记转换器11的判断单元11A判断输入字符是小写还是大写,在S3,存储单元11B把判断结果存储为表记信息。 
当字符为大写时,在S4,表记转换器11的转换器11C把小写的该字符输出至搜索单元12。与之相比,当字符为小写时,表记转换器11在不对其转换的情况下把该字符输出至搜索单元12。 
在S5,搜索单元12参照在辞典13中存储的各个搜索关键字,搜索其第一个字符与输入字符相对应的搜索关键字,并进而在历史存储单元15中搜索其第一个字符与输入字符相对应的搜索关键字。更具体地说,关于字符串的第一个字符,搜索单元12参照各个搜索关键字的第一个字符。当用户然后输入 第二个字符时,搜索单元12参照其第一个字符与第一个输入字符相对应的各个搜索关键字的第二个字符。 
在S6,搜索单元12从辞典13提取与搜索关键字相关联的词汇和词汇类型标志,在S7,搜索单元12从历史存储单元15提取与搜索关键字相关联的词汇。 
如此,每次当用户输入字符时,搜索单元12在辞典13及历史存储单元15搜索与按照输入字符的顺序的从起首开始的所输入字符或字符串相对应的词汇。 
应对注意,与从起首开始的所输入字符串相对应的词汇意味着,不论表记如何,该词汇的起始字符或起始的一些字符与按照输入字符的顺序的从起首开始的所输入字符或字符串相同。例如,当用户起始输入“e”时,从图2所示的词汇中提取“economic”、“end”、“EC”、“even”、及“European”。 
然后,搜索单元12把分别从辞典13及历史存储单元15中提取的词汇输出至表记转换器11。 
在S8,表记转换器11基于从搜索单元12输入的词汇及词汇类型标志来确定候补词汇,在S9,表记转换器11根据需要按照其中存储的表记信息来转换该词汇。 
更具体地说,涉及与输入字符的第一个字符有关的表记信息,表记转换器11按照表记信息来转换候补词汇的第一个字符。例如,当表记信息表示大写时,表记转换器11把候补词汇的第一个字符大写化。与之相比,当表记信息表示该字符为小写时,表记转换器11不转换候补词汇的第一个字符。 
在S10,表记转换器11把候补词汇或与该候补词汇相对应的在先词汇输出至软件键盘2。 
然后,当搜索单元12找到一个或多个候补词汇时,软件键盘2显示从语言输入支持引擎3的输入接收器10输入的该一个或多个候补词汇。当用户选择那些候补词汇之一时,软件键盘2把所选择的词汇输出至语言输入支持引擎3。 
在S11,输入接收器10接收所选择的词汇,然后把所选择的词汇输出至学习单元14。在S12,学习单元14在历史存储单元15中存储从输入接收器10输入的词汇(当前选择的词汇),而不改变其表记。在历史存储单元15中, 词汇与搜索关键字相关联地注册。 
在S13,在历史存储单元15搜索注册为当前所选择的词汇的随后词汇的词汇。换句话说,当当前所选择的词汇在历史存储单元15中先前被注册为给定词汇的在先词汇时,提取该给定词汇。然后,所提取的词汇显示在软件键盘2上,作为候补词汇来跟随所选择的词汇。 
例如,用户选择“apple”,并且假定历史存储单元15存储有先前记录“apple juice”,其中,“apple”是在先词汇,并且“juice”是“apple”的随后词汇。在此情况下,学习单元14在S12把“apple”记录为当前选择的词汇,在S13,在历史存储单元15搜索,参照被注册为在先词汇的先前记录“apple”。相应地,参照先前记录“apple juice”,“juice”被提取,然后显示在软件键盘2上,作为“apple”的随后词汇的候补词汇。 
在S14,当用户选择候补词汇(juice)时,候补词汇用作历史存储单元15中当前选择词汇(apple)的随后词汇。然后,当前选择的词汇(apple)注册为候补词汇(juice)的在先词汇。 
与之相比,当用户不选择随后词汇的候补词汇中的一个时,重复执行从S1至S20的处理。 
而且,当用户在不选择候补词汇之一的情况下确认输入的字符串时,在S21,语言输入支持引擎3的输入接收器10接收所确认的字符串并且把该字符串输出至学习单元14。 
在S22,学习单元14把从输入接收器10输入的字符串(词汇)注册为当前确认的词汇而不改变其表记,搜索关键字与其相关联。 
在S23,学习单元14在历史存储单元15搜索随后词汇。更具体地说,当历史存储单元15存储被注册为给定词汇的在先词汇的当前确认的词汇的记录时,该给定词汇显示为随后词汇的候补词汇。在S24,当用户选择候补词汇时,候补词汇用作当前确认的词汇的随后词汇。然后,当前选择的词汇被注册为该候补词汇的在先词汇。 
图5示出由图1所示的表记转换器11执行的输入字符应对处理的序列。 
在S31,表记转换器11的判断单元11A判断用户输入的字符串的第n个字符是否为小写,其中n是给定的正整数。当第n个字符为小写时(在S31为是 (YES)),表记转换器11的存储单元11B在S32存储表示第n个字符为小写的表记信息,第n个字符输出至搜索单元12,而不转换其表记。 
与之相比,当判断单元11A判断字符串的第n个字符为大写时(在S31为否(NO)),在S36,存储单元11B存储表示第n个字符为大写的表记信息。在S37,转换器11C转换该第n个字符,并且表记转换器11把小写的第n个字符输出至搜索单元12。 
然后,在S34,表记转换器11把n增大1。在S35,表记转换器11判断用户是否已经选择了候补词汇之一或者确认了输入的字符串。当用户既没有选择候补词汇之一,也没有确认所输入的字符串时(在S35为否(NO)),表记转换器11返回至S31。与之相比,当候补词汇之一被选择或者输入字符串被确认时(在S35为是(YES)),处理完成。 
图6示出图1所示的搜索单元12所执行的处理序列。 
在S41,搜索单元12在辞典13及历史存储单元15搜索从表记转换器11输入的字符或字符串。在S42,搜索单元12判断输入的字符或字符串是否与其中存储的任何搜索关键字的第一个字符或最先的几个字符相同。当输入的字符或字符串与任何搜索关键字的第一个字符或最先的几个字符不相同时,搜索单元12结束处理。 
与之相比,当存在第一个字符或最先的几个字符与输入的字符或字符串相同的搜索关键字时,在S43,搜索单元12从辞典13和历史存储单元15提取与该搜索关键字相关联的词汇及词汇类型标志。如此提取的词汇及词汇类型标志输出至表记转换器11,然后搜索单元12结束处理。 
这样,在辞典13及历史存储单元15中,各个词汇与搜索关键字相关联地存储,其中所述搜索关键字是本身以小写显示的词汇。表记转换器11根据需要把从输入接收器10输入的字符串转换为小写,搜索单元12在辞典13和历史存储单元15搜索与和转换为小写的所输入字符或字符串相对应的搜索关键字相关联的词汇。 
图7示出由表记转换器11执行以输出候补词汇的处理序列。 
在S51,表记转换器11设定用户输入的字符编号Nn,n初始设定为1。在S52,表记转换器11参照与用户输入的字符串的第n个字符有关的表记信息。
在S53,表记转换器11按照在S52参照的表记信息,转换由搜索单元12提取的词汇的第n个字符的表记。 
应当注意,在S53,当词汇的第n个字符的表记与表记信息所表示的表记相同时,表记转换器11不转换词汇的第n个字符。 
在S54,表记转换器11把n增大1(n=n+1),在S55,判断n是否不小于Nn。当n小于Nn时(在S55为否(NO)),表记转换器11重复从S52至S55的处理。 
与之相比,当n不小于Nn时(在S55为是(YES)),在S56,表记转换器11检查词汇是否包含表记信息未存储的字符。 
当词汇的所有字符的表记信息被存储时(在S56为否(NO)),在S58,表记转换器11把按照表记信息表记的词汇作为候补词汇输出至输入接收器10。 
与之相比,当词汇包含不带有表记信息的字符时(在S56为是(YES)),在S57,关于该输入字符串,表记转换器11按照最后存储的表记信息,来转换该表记信息未存储的字符。 
例如,当用户输入“Ja”时,存储与表示大写的第一个字符有关的表记信息及表示其第二个字符为小写的表记信息。因此,当搜索单元12在辞典13搜索并且找到词汇“JAPAN”时,转换器11C把第一个字符“J”如其原样设定,并且把第二个字符转换为小写的“a”。 
在此情况下,不存在与第三个及随后字符相对应的表记信息,关于用户输入的字符串,最后存储的表记信息关于第二个字符“a”。因此,转换器11C把第三个及随后的字符“PAN”转换为小写字符,这样,“Japan”被设定为候补词汇。 
在S58,表记已经被转换的候补词汇输出至输入接收器10,此时,处理完成。由输入接收器10如此接收的候补词汇输出至软件键盘2,然后列在软件键盘2的显示区域上。 
如上所述,表记转换器11存储表记信息,该表记信息表示用户输入的字符是大写还是小写,从辞典13提取的候补词汇的每个字符按照表记信息来设定为大写或者小写。当用户输入的字符的表记与候补词汇的表记相同时,候补词汇在不被转换的情况下显示。这样,候补词汇能够以与输入字符的表记 相同的表记来显示,而不需要增大辞典13的存储容量。 
而且,在辞典13中,搜索关键字与各个词汇相关联,其中存储的所有词汇的搜索关键字的表记相同。当将被搜索的字符串能够基于用户输入的字符串以与所输入的字符串的表记相对应的表记来生成时,辞典13能够被搜索,而不论输入字符串的表记如何。 
而且,当从辞典13提取的候补词汇之一被选择时,该词汇及其表记作为历史存储在历史存储单元15中,在随后的搜索中,该词汇以在历史存储单元15中存储的表记来显示。因此,候补词汇能够优先以先前使用的表记来显示。 
而且,当用户完成输入字符而未选择任何候补词汇时,辞典13按照用户使用的表记来存储该字符串。下一次,与该字符串相对应的词汇被作为候补词汇提取,通过使用如此存储的表记,优选该词汇能够以先前输入的表记来显示。 
而且,当用户选择候补词汇之一时,在所选择的候补词汇之前确认的词汇的表记能够存储为在先词汇,在随后的搜索中,词汇能够以先前使用的表记来显示。应当注意,所选择的词汇也存储在历史存储单元15中。 
例如,当用户确认以表记A1显示的给定词汇A然后从候补词汇中选择以表记B1显示的给定词汇B时,历史存储单元15把以表记A1显示的词汇A和以表记B1显示的词汇B作为集合来存储,其中,词汇A注册为词汇B的在先词汇。 
因此,下一次当以表记A1显示的词汇A被确认时,词汇B从历史存储单元15提取,并且以表记B1来显示,作为词汇A之后跟随的词汇的候补词汇。 
下面参照图8来描述图1所示的表记转换器11所执行的另一候补词汇处理。 
在此处理中,当表记转换器11判断用户输入的第一个字符为小写时,表记转换器11把由搜索单元12从辞典13及历史存储单元15提取的词汇作为候补词汇输出,而不改变其表记。 
如上所述,当用户通过软件键盘2输入第一个字符时,该字符由输入接收器10接受并输出至表记转换器11。而且,搜索单元12提取与来自辞典13及历史存储单元15的输入字符相对应的词汇,然后把该词汇输出至表记转换器11。
参照图8,当表记转换器11接受由搜索单元12提取的词汇时,在S61,表记转换器11检查第一个输入的字符是否是小写。当第一个输入的字符是小写时(在S61为是(YES)),在S62,表记转换器11把搜索单元12提取的词汇作为候补词汇输出至输入接收器10,而不改变其表记。 
与之相比,当表记转换器11判断第一个输入的字符不是小写时,即,第一个输入的字符为大写(在S61为否(NO)),在S63,表记转换器11按照表记信息来转换各个所提取的词汇的第一个字符的表记。在此情况下,表记转换器11把所提取的词汇词首大写化。在S64,表记转换器11把如此词首大写化的词汇作为候补词汇输出至输入接收器10。 
因此,当用户仅仅输入单个字符且该字符为小写时,通过把表记转换器11配置为不转换搜索单元12所提取的词汇,各个候补词汇以通常用于辞典的表记来显示,或者以曾经一次确认的表记来显示。 
图9示出当用户大写输入第一个字符时在软件键盘2上显示的候补词汇的例子。在此情况下,候补词汇的第一个字符被大写化。 
如图9所示,软件键盘2包括字符输入域20和候补词汇域21。例如,当用户在字符输入域20中输入第一个字符“E”时,“Economic”、“EC”、“End”、“European”等等作为候补词汇显示在候补词汇域21中。 
应当注意,诸如EC的第一个字符为大写的候补词汇按照辞典13中所注册的形式显示在候补词汇域21中。 
与之相比,图10示出当用户小写输入第一个字符时在软件键盘2上显示的候补词汇的例子。在此情况下,候补词汇按照辞典13中所注册的形式显示在候补词汇域21中。 
如此,如图10所示,例如,当用户在字符输入域20中输入第一个字符“e”时,“economic”、“EC”、“end”、“European”等等作为候补词汇显示在候补词汇域21中。 
下面参照图11来描述由图1所示的表记转换器11执行的另一候补词汇处理。 
在此候补词汇处理中,当表记转换器11判断在从输入接收器10输入的字符串(词汇)中包含的所有字符均为小写时,表记转换器11在从辞典13和历 史存储单元15提取的词汇中排除包含大写字符的词汇,并且仅仅输出以小写注册的词汇。 
如图11所示,当接收到从搜索单元12提取的词汇时,在S71,表记转换器11判断用户输入的多个字符是否全部为小写。当所有字符为小写时(在S71为是),在S72,表记转换器11在从辞典13和历史存储单元15提取的词汇中排除包含大写字符的词汇,然后仅仅把以小写注册的词汇作为候补词汇输出至输入接收器10。 
与之相比,当表记转换器11判断输入字符串至少包含一个大写字符时(在S71为否),在S73,表记转换器11按照表记信息来转换由搜索单元12提取的词汇的第n个字符的表记,然后把该词汇作为候补词汇输出至输入接收器10。然后,处理完成。 
这样,当用户输入的多个字符全部为小写时,包含诸如固有名词及缩写的大写字符的词汇未显示。换句话说,与用户使用的表记相对应的候补词汇能够被选择。 
图12示出当用户以小写输入全部多个字符时在软件键盘2上的显示的例子。在此情况下,至少包含一个大写字符的词汇被从候补词汇中排除。 
如图12所示,例如,当用户在字符输入域20中输入小写的“ec”时,“economic”、“economy”、“econ”、“economics”、“economist”、“economists”等等作为候补词汇显示在候补词汇域21中。在那些候补词汇中,诸如“EC”的至少包含一个大写字符的词汇被排除。 
或者,当用户输入的多个字符全部为小写时,搜索单元12提取的所有词汇可以如图13所示以小写来显示。 
在此情况下,例如,当用户在字符输入域20中输入小写的“ec”时,“economic”、“ec”、“economy”、“econ”、“economics”、“economist”、“economists”等等作为候补词汇显示在图13所示的候补词汇域21中。当诸如“EC”的至少包含一个大写字符的词汇被搜索单元12提取时,该词汇的表记改变,由此,小写的“ec”显示在候补词汇域21中。 
图14示出当用户以至少一个大写字符及至少一个小写字符的组合来输入多个字符时在软件键盘2上显示的候补词汇的例子。在此情况下,如上所 述,候补词汇以用户使用的表记来显示在候补词汇域21中。 
如图14所示,例如,当用户在字符输入域20中输入“Ec”,即大写的第一个字符及小写的第二个字符时,第一个字符为大写而第二个及随后的字符为小写的候补词汇,“Economic”、“Ec”、“Economy”、“Econ”、“Economics”、“Economist”、“Economists”等等显示在候补词汇域21中。 
图15示出当用户以大写输入全部多个字符时在软件键盘2上显示的候补词汇的例子。在此情况下,如上所述以大写显示候补词汇。 
如图15所示,例如,当用户在字符输入域20中输入大写的“EC”时,“ECONOMIC”、“EC”、“ECONOMY”、“ECON”、“ECONOMICS”、“ECONOMIST”、“ECONOMISTS”等等作为候补词汇显示在候补词汇域21中。 
下面描述带有读音符号标记(读音符号)的字符的处理。 
例如,在拉丁文字中,读音符号添加到以多种方式发音的字符。读音符号的例子包括元音变音(umlaut)、颤音(trema)、重音(accent)、软音(cedilla)、及颚化(tilde)。 
表记转换器11首先判断从输入接收器10输入的字符是否包含读音符号。在表记转换器11判断字符包含读音符号之后,表记转换器11判断字符为大写还是小写。 
而且,当在从辞典13或历史存储单元15提取的词汇中包含的字符的表记将被转换时,表记转换器11判断该字符是否包含读音符号,然后转换其表记。 
图16示出当带有读音符号的字符被参照时执行的处理序列。 
这样的带有读音符号的字符是两个字节的数据,第一个字节存储读音符号而第二个字节存储字符本身。 
参照图16,在S81,表记转换器11判断字符的数据的第一个字节是否表示读音符号。当数据的第一个字节不表示读音符号时(在S81为否),表记转换器11判断该词汇不带有读音符号,然后,处理完成。 
与之相比,当表记转换器11判断数据的第一个字节表示读音符号时(在S81为是),在S82,表记转换器11参照字符的数据的第二个字节,然后判断该字符是小写还是大写。然后,在表记转换器11根据需要转换字符的表记之 后,处理完成。 
因此,当字符的表记将被确认或转换时,通过首先判断字符类型,带有读音符号的字符能够以与典型字母字符被处理的方式相类似的方式来处理。 
下面参照图17和图18来描述本发明的另一示例性实施例。在此实施例中,软件键盘包含输入词汇类型的功能,用户能够指定将被显示的候补词汇的词汇类型。 
应当注意,除软件键盘之外,本实施例类似于上文参照图1至图15描述的实施例,因此省略其描述。 
如上所述,在图1所示的辞典13中注册的各个词汇与表示该词汇的类型的词汇类型标志相关联,词汇类型标志0、1、2、3、和4分别表示通常词汇、人物或公司的名称、地点名称、人物、公司、及地点名称之外的固有名词、以及缩写。 
参照图1,当用户指定将被显示的候补词汇的词汇类型时,词汇类型信息经由输入接收器10传输至语言输入支持引擎3的表记转换器11。表记转换器11仅仅把搜索单元12从辞典13提取的词汇中词汇类型标志表示由用户指定的词汇类型的词汇作为候补词汇输出。 
图17示出由表记转换器11执行的处理序列,该处理序列用以仅仅输出被分类为指定词汇类型的词汇来作为候补词汇。 
如图17所示,在S91,表记转换器11参照由搜索单元12提取的词汇的词汇类型标志,在S92,判断该词汇是否被分类为用户通过输入接收器10输入的词汇类型。 
当所提取的词汇的词汇类型标志表示所指定的词汇类型时(在S92为是),在S93,表记转换器11把所提取的词汇作为候补词汇输出至输入接收器10,然后完成处理。 
与之相比,当所提取的词汇的词汇类型不是所指定的词汇类型时(在S92为否),在S94,表记转换器11从候补词汇中排除该词汇,然后,完成处理。 
如此,软件键盘仅仅显示被分类为用户指定的词汇类型的候补词汇。 
应当注意,作为替代,表记转换器11可以把用户指定的词汇类型传输至搜索单元12,搜索单元12可以配置为不从辞典13和历史存储单元15提取未被 分类为所指定的词汇类型的词汇。 
如上所述,通过在辞典13和历史存储单元15中把各个词汇与词汇类型标志相关联,并且预先指定候补词汇的词汇类型,能够仅仅显示词汇类型与所指定的词汇类型相同的候补词汇。由此,用户能够容易地找到目标词汇。 
图18示出在除了字符输入域20及候补词汇域21之外还包含词汇类型选择菜单22的软件键盘2A上的显示的例子。 
参照图18,用户能够从词汇类型选择菜单22中选择“通常词汇”、“公司名称/人物姓名”、“地点名称”、“其它固有名词”、以及“缩写”之一。例如,当在字符输入域20中输入字符或字符串之前或之后用户选择“通常词汇”时,仅仅与该字符或字符串相对应的普通词汇显示为候补词汇域21中的候补词汇。 
应当注意,上述词汇类型仅仅是例子,因此,能够根据需要设定其它词汇类型。 
下面参照图19和图20描述本发明的另一示例性实施例。 
图19示出当仅仅与用户选择的表记相对应的词汇被作为候补词汇输出时由表记转换器11执行的处理的序列。图20示出包含表记选择菜单23的软件键盘2B的显示的例子。 
在此实施例中,除了字符输入域20和候补词汇域21之外,图20所示的软件键盘2B还包含表记选择菜单23,作为用来输入将被显示的候补词汇的表记的功能。除了软件键盘2B之外,本实施例类似于参照图1至图15在上文描述的实施例,因此省略其描述。 
参照图20,例如,用户能够从表记选择菜单23中选择表示所有字符为小写的“小写”、表示所有字符为大写的“大写”、及表示仅仅第一个字符为大写的“词首大写化”中的一个,作为候补词汇的表记。 
参照图1,当用户指定该表记时,表记转换器11仅仅把在由搜索单元12从辞典13和历史存储单元15提取的词汇中其表记与用户选择的表记相同的词汇作为候补词汇输出。 
参照图19和图20,当用户在输入字符或字符串之前或之后输入候补词汇的表记时,表记信息经由输入接收器10传输至表记转换器11。在S101,表记 转换器11判断用户是否已经从表记选择菜单23中选择表示所有字符均为小写的“小写”。 
当表记转换器11判断“小写”被选择时(在S101为是),在S104,表记转换器11仅仅把搜索单元12提取的词汇中词汇类型标志表示“0”的词汇输出至输入接收器10,然后完成处理。由此,仅仅以小写注册的通常词汇显示在候补词汇域21中。 
与之相比,当表记转换器11判断“小写”未被选择时(在S101为否),在S102,表记转换器11还判断用户是否已经选择“大写”。 
当表记转换器11判断“大写”从表记选择菜单23选择时(在S102为是),在S105,表记转换器11仅仅把搜索单元12提取的词汇中其词汇类型标志指示“4”的词汇输出至输入接收器10,然后完成处理。 
与之相比,当表记转换器11判断“大写”未被选择时(在S102为否),在S103,表记转换器11仅仅把搜索单元12提取的词汇中其词汇类型标志指示“1”、“2”、及“3”之一的词汇输出至输入接收器10,然后完成处理。 
应当注意,作为替代,表记转换器11可以把用户指定的表记传输至搜索单元12,搜索单元12可以被配置为不从辞典13和历史存储单元15提取其表记与所指定的表记不同的词汇。 
如上所述,通过向软件键盘2B添加表记选择菜单23,用户能够选择将被显示的候补词汇的表记,从而当用户知道要输入的词汇的表记时,能够节省时间。 
作为替代,表记转换器11可以配置为把搜索单元12从辞典13和历史存储单元15提取的词汇转换为用户选择的表记,并把所转换的词汇作为候补词汇输出。 
例如,当用户在字符输入域20中输入字符或字符串,并且从表记选择菜单23中选择“小写”时,搜索单元12从辞典13和历史存储单元15中提取与该字符或字符串相对应的词汇。然后,如果所提取的词汇中包含大写字符,则表记转换器11把所提取的词汇中包含的大写字符转换为小写字符,并且把那些词汇作为候补词汇输出。由此,搜索单元12提取的所有词汇以小写显示在候补词汇域21中。
应当注意,上文描述的表记仅仅是例子,因此,根据需要,也能够设定其它的表记。 
而且,虽然上文的描述涉及英语,然而,本发明的实施例也能够适用于其中各个词汇由等同于字母的多种字符的组合构成的其它外国语,诸如法语、德语、等等。 
上述实施例能够由程序实施,该程序使计算机执行上述的各种功能,并且该程序能够存储在计算机可读记录介质上。 
可以根据上述教导来进行多种另外的修改和变化。因而应当理解,在所附的权利要求的范围之内,本专利说明书的公开可以以此处具体描述之外的方式来实施。 
相关申请的交叉引用 
本专利申请要求2007年8月31日在日本专利局提交的日本专利申请No.2007-225751号的优先权,其整体内容通过引用包含于此。

Claims (12)

1.一种信息处理设备,包括:
外国语辞典单元,配置为存储大写、小写、及至少一个大写字符和至少一个小写字符的组合之一的形式的各个外国语词汇;
输入单元,字符或字符串通过其按顺序输入;
判断单元,配置为判断通过所述输入单元输入的给定字符是大写还是小写;
存储单元,配置为存储表示所述字符是大写还是小写的表记信息;
搜索单元,配置为每次通过所述输入单元输入字符时,在所述外国语辞典单元搜索与按照输入所述字符的顺序的从起首开始的所输入字符串相对应的词汇,当找到与所述字符串相对应的一个或多个词汇时,从所述外国语辞典单元提取与所述字符串相对应的所述一个或多个词汇;
转换器,配置为按照在所述存储单元中存储的所述表记信息,来转换在提取的所述词汇中包含的每个字符的表记;以及
输出单元,配置为把由所述转换器转换表记的所述词汇的每个作为候补词汇来输出。
2.根据权利要求1所述的信息处理设备,其中,
当转换由所述搜索单元提取的所述词汇的所述表记时,所述转换器按照在所述存储单元中最后存储的表记信息,来设定其表记信息未存储的字符的表记。
3.根据权利要求1所述的信息处理设备,其中,
当通过所述输入单元而输入的第一个字符为小写时,所述转换器不转换由所述搜索单元提取的所述词汇的所述表记,以及
所述输出单元按照在所述外国语辞典单元中所存储的表记把所述词汇作为候补词汇来输出。
4.根据权利要求1所述的信息处理设备,其中,
当通过所述输入单元而输入的所述字符串的所有字符为小写时,所述输出单元在由所述搜索单元从所述外国语辞典单元提取的所述词汇中排除包含大写字符的词汇。
5.根据权利要求1所述的信息处理设备,其中,
所述外国语辞典单元中,各个词汇与搜索关键字相关联,所述搜索关键字与小写的所述词汇相同,
通过所述输入单元而输入的所述字符串被转换为小写字符,以及
所述搜索单元搜索与搜索关键字相关联的词汇,该搜索关键字的第一个字符与通过所述输入单元而输入的所述字符串的第一个字符相同。
6.根据权利要求1所述的信息处理设备,其中,
所述判断单元在判断读音符号是否添加到所述字符之后,判断通过所述输入单元输入的所述字符是大写还是小写,以及
当转换在从所述外国语辞典单元提取的所述词汇中包含的各个字符的所述表记时,所述转换器在判断读音符号是否添加到所述字符之后,转换所述字符的所述表记。
7.根据权利要求1所述的信息处理设备,还包括词汇类型输入单元,词汇类型通过所述词汇类型输入单元来输入,
其中,所述外国语辞典单元存储与表示词汇类型的词汇类型标志相关联的多个外国语词汇的每个,以及
所述输出单元在从所述外国语辞典单元提取的所述词汇中仅仅把与表示通过所述词汇类型输入单元而输入的所述词汇类型的所述词汇类型标志相关联的词汇作为候补词汇来输出。
8.根据权利要求1所述的信息处理设备,还包括表记选择单元,表记通过所述表记选择单元来选择,
其中,所述输出单元在从所述外国语辞典单元提取的所述词汇中仅仅把按照通过所述表记选择单元而选择的所述表记来注册的词汇作为候补词汇输出。
9.根据权利要求1所述的信息处理设备,还包括历史存储单元,所述历史存储单元配置为存储从所述候补词汇选择的所述词汇的历史及所选择的词汇的表记, 
其中,所述搜索单元在所述历史存储单元搜索与通过所述输入单元而输入的所述字符串相对应的所述词汇,以及
当所述词汇从所述历史存储单元提取时,所述输出单元按照在所述历史存储单元中存储的所述表记来输出所述词汇。
10.根据权利要求1所述的信息处理设备,
其中,当没有候补词汇被选择,并且通过所述输入单元而输入的词汇被确认时,所述外国语辞典单元存储所确认的词汇及所确认的词汇的表记,以及
当所述词汇从所述外国语辞典单元提取时,所述输出单元按照在所述外国语辞典单元中存储的所述表记来输出所述词汇。
11.根据权利要求1所述的信息处理设备,还包括历史存储单元,所述历史存储单元配置为存储从由所述输出单元输出的所述候补词汇中选择的所述词汇的历史及所选择的词汇的表记,
其中,所述历史存储单元与在所选择的词汇之前确认的在先词汇和所述在先词汇的表记相关联地存储所选择的词汇和所选择的词汇的所述表记,以及
下次当按照在所述历史存储单元中存储的所述表记而显示的所述在先词汇被确认时,所选择的词汇按照在所述历史存储单元中存储的所述表记,作为候补词汇跟随在所述在先词汇之后输出。
12.一种信息处理方法,包括:
按顺序输入字符或字符串;
判断给定字符为大写还是小写;
存储表示所述字符为大写还是小写的表记信息;
每次输入字符时,在多个外国语词汇按照大写、小写、及至少一个大写字符和至少一个小写字符的组合之一来注册的外国语辞典单元中,搜索与按照输入所述字符的顺序的从起首开始的所输入字符串相对应的词汇,当找到与所述字符串相对应的一个或多个词汇时,从所述外国语辞典单元提取与所述字符串相对应的所述一个或多个词汇;
按照所存储的表记信息,来转换在提取的所述词汇中包含的每个字符的 表记;以及
把表记被转换的所述词汇作为候补词汇来输出。 
CN2008102126808A 2007-08-31 2008-08-29 信息处理设备和信息处理方法 Expired - Fee Related CN101377773B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007225751A JP4787803B2 (ja) 2007-08-31 2007-08-31 情報処理装置と情報処理方法とプログラム
JP2007-225751 2007-08-31
JP2007225751 2007-08-31

Publications (2)

Publication Number Publication Date
CN101377773A CN101377773A (zh) 2009-03-04
CN101377773B true CN101377773B (zh) 2012-12-05

Family

ID=40408833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102126808A Expired - Fee Related CN101377773B (zh) 2007-08-31 2008-08-29 信息处理设备和信息处理方法

Country Status (3)

Country Link
US (1) US8510102B2 (zh)
JP (1) JP4787803B2 (zh)
CN (1) CN101377773B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8433708B2 (en) * 2008-09-16 2013-04-30 Kendyl A. Román Methods and data structures for improved searchable formatted documents including citation and corpus generation
US8499000B2 (en) * 2009-07-30 2013-07-30 Novell, Inc. System and method for floating index navigation
CN103488648B (zh) 2012-06-13 2018-03-20 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
US10515151B2 (en) * 2014-08-18 2019-12-24 Nuance Communications, Inc. Concept identification and capture
CN104391588B (zh) * 2014-11-07 2016-06-29 腾讯科技(深圳)有限公司 一种输入提示的方法及装置
JP6950461B2 (ja) 2017-10-31 2021-10-13 株式会社リコー 情報処理装置、情報処理システム及び情報処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1452083A (zh) * 2002-04-16 2003-10-29 富士通株式会社 字符信息的转换处理系统
CN1581103A (zh) * 2003-08-11 2005-02-16 摩托罗拉公司 用于文本输入预测的存储器和用户词典

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5769364A (en) * 1980-10-13 1982-04-28 Canon Inc Electronic device
JPH0740263B2 (ja) * 1986-04-30 1995-05-01 カシオ計算機株式会社 日本語ワ−ドプロセツサ
EP0639814B1 (en) * 1993-08-20 2000-06-14 Canon Kabushiki Kaisha Adaptive non-literal textual search apparatus and method
JP3889466B2 (ja) 1996-11-25 2007-03-07 ソニー株式会社 文章入力装置及び方法
JP2806452B2 (ja) * 1996-12-19 1998-09-30 オムロン株式会社 かな漢字変換装置および方法、並びに記録媒体
US5832478A (en) * 1997-03-13 1998-11-03 The United States Of America As Represented By The National Security Agency Method of searching an on-line dictionary using syllables and syllable count
JP3028104B2 (ja) * 1997-06-09 2000-04-04 日本電気株式会社 文章処理装置
US7712053B2 (en) * 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
JP3794882B2 (ja) * 1999-10-28 2006-07-12 富士通株式会社 情報処理装置
JP2003067377A (ja) 2001-08-23 2003-03-07 Ricoh Co Ltd 文字列入力支援装置
JP3933952B2 (ja) 2002-02-07 2007-06-20 三菱電機株式会社 文字列入力装置及び文字列入力方法
US7231610B2 (en) * 2002-11-29 2007-06-12 Matsushita Electric Industrial Co., Ltd. Text editing assistor
JP2006072827A (ja) * 2004-09-03 2006-03-16 Nec Corp 文字入力支援システムおよび文字入力支援方法
US7957955B2 (en) * 2007-01-05 2011-06-07 Apple Inc. Method and system for providing word recommendations for text input

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1452083A (zh) * 2002-04-16 2003-10-29 富士通株式会社 字符信息的转换处理系统
CN1581103A (zh) * 2003-08-11 2005-02-16 摩托罗拉公司 用于文本输入预测的存储器和用户词典

Also Published As

Publication number Publication date
JP4787803B2 (ja) 2011-10-05
US20090063136A1 (en) 2009-03-05
CN101377773A (zh) 2009-03-04
JP2009059159A (ja) 2009-03-19
US8510102B2 (en) 2013-08-13

Similar Documents

Publication Publication Date Title
KR101203352B1 (ko) 언어 모델을 이용한 와일드카드 확장
CN101377773B (zh) 信息处理设备和信息处理方法
KR100724141B1 (ko) 한글 표출 장치 및 그 방법
CN1008016B (zh) 输入处理系统
US20030023426A1 (en) Japanese language entry mechanism for small keypads
JP2009181584A (ja) 中国語データおよびユーザ修正データの作成し、かつ、使用する方法およびシステム
JP5141560B2 (ja) 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法
CN1141452A (zh) 文字输入装置和文字输入方法
US20070038456A1 (en) Text inputting device and method employing combination of associated character input method and automatic speech recognition method
JP5323652B2 (ja) 類似語決定方法およびシステム
JP2007042146A (ja) 中国語データおよびユーザ修正データの作成し、かつ、使用する方法およびシステム
JP4251000B2 (ja) かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
US8232901B2 (en) Determining an alternative character string
JP4769559B2 (ja) Ai予測システム
KR20020081912A (ko) 웹상에서의 음성 서비스 방법
CN101539428A (zh) 导航系统中拼音加声调检索的方法及装置
Abebe et al. Ethiopic Keyboard Mapping and Predictive Text Inputting Algorithm in a Wireless Environment
CN101097489B (zh) 能够在手持电子设备上进行输入的方法和设备
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
US20080189327A1 (en) Handheld Electronic Device and Associated Method for Obtaining New Language Objects for Use by a Disambiguation Routine on the Device
KR100565290B1 (ko) 이동 통신 단말기의 한문 전송 방법
TW490623B (en) Chinese simple message generating device using number keys
US20040143568A1 (en) Search method implemented with a search system
CA2619423C (en) Handheld electronic device and associated method for obtaining new language objects for use by a disambiguation routine on the device
JP2021085996A (ja) 音声認識システム、音声認識方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121205

CF01 Termination of patent right due to non-payment of annual fee