具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中,当用户采用中文输入法输入汉字时,可以根据用户输入的候选词,从预置的相关词词库中搜索该候选词的相关词,并显示该候选词的相关词,用户从显示的候选词的相关词中选择一个,即可实现输入法中候选词的相关词的输入。
图1示出了本发明实施例提供的输入法中候选词的相关词输入方法的实现流程,详述如下:
在步骤S101中,接收用户输入的候选词。其中候选词可以是根据用户输入的汉字的拼音或者笔画确定的候选词。
在步骤S102中,根据用户输入的候选词,搜索预置的相关词词库中该候选词的相关词。
在本发明一实施例中,相关词词库包括核心相关词词库和用户相关词词库。其中核心相关词词库包括核心相关词词典,核心相关词词典中存储有候选词的相关词,该候选词的相关词是预先配置好的候选词的相关词。用户相关词词库包括用户相关词词典,用户相关词词典中存储有候选词的相关词,该候选词的相关词是用户输入候选词时,选择过的候选词的相关词。根据用户选择的候选词搜索候选词的相关词词典。候选词的相关词可以是候选词的同义词,候选词的反义词,或者与候选词相关的其他词中的一种或者多种。
在步骤S103中,对搜索到的候选词的相关词进行排序。
在对候选词的相关词进行排序时,可以按照候选词的相关词的使用频率(以下均称为词频)来排序。在按照词频对候选词的相关词进行排序时,可以采用现有技术提供的“最近记忆”排序法, “最远记忆”排序法, “高词频”排序法,“低词频”排序法中的一种或者多种组合来排序。由于实现候选词的相关词输入的目的在于,使计算机用户可以使用与常用词汇意思相近的不常用词汇进行沟通交流,达到扩大计算机用户的词汇量,提高计算机用户的语言才华的目的。因此,如果按照“最近记忆”排序法和“高词频”排序法对候选词的相关词进行排序,则由于候选词的相关词不经常使用,而被排列至末尾,不便于用户选择,难以起到引导用户的作用。如果按照“最远记忆”排序法和“低词频”排序法对候选词的相关词进行排序,则由于候选词的有些相关词,是用户不想选择的,但却偏偏因为输入得少,或者没有输入过,而总是被排在最前面,也不便于用户选择。
在本发明实施例中采用的较优的排序方法是采用“非最近记忆”和“非高词频”排序法对候选词的相关词进行排序,其排列顺序如图2所示,其具体过程如下:
将从核心相关词词库中搜索到的,且未包含在用户相关词词库中的候选词的相关词按照词频由高到低排序。在候选词的相关词的词频对搜索到的候选词进行排序时,如果用户在输入候选词后,选择过该候选词的相关词,即如果核心相关词词库中候选词的相关词也包含在用户相关词词库中,则该候选词的相关词不参与该次排序。
将从用户相关词词库中搜索到的候选词的相关词按照词频由低到高插入到上述排序后的候选词的相关词序列的末尾。其中用户相关词词库中候选词的相关词的词频是按照在输入候选词时,选择该候选词的相关词的次数计算的。
将最后一次选择过的候选词的相关词(也称为最后记忆的候选词的相关词)插入至上述排列后的候选词的相关词序列的中间位置。其中中间位置是指在分页显示该候选词的相关词时,插入的最后记忆的候选词的相关词位于第一页,保证在不翻页的情况下,即可选择该最后记忆的候选词的相关词,其具体位于第一页的第几项可以预先进行设置。如预先设置最后记忆的候选词的相关词位于第一页的第四项,则将最后记忆的候选词的相关词插入至上述排序后的候选词的相关词序列的第四个位置;如预先设置最后记忆的候选词的相关词位于第一页的第二项,则将最后记忆的候选词的相关词插入至上述排序后的候选词的相关词序列的第二个位置。为了更好的说明该排序方法,下面结合一个具体示例对该排序方法进行说明。
假设用户选择的候选词为A,根据候选词A,从核心相关词词库中查找到的A的相关词包括B、C、D、E、F、G、H、I,且按照词频由高到低的顺序也是B、C、D、E、F、G、H、I;如果用户曾经输入A时,选择过其相关词B、C、D,即用户相关词词库中包括A的相关词B、C、D;且按照用户相关词词库中B、C、D的词频由高到低的顺序也是B、C、D;用户在输入A时,最后记忆的A的相关词为B,且分页显示A的相关词时,每页显示四个词汇,预先设置的最后记忆的候选词的相关词显示在第一页的第四项。则对搜索到的候选词的相关词进行排序时,先将从核心相关词词库中搜索到的A的相关词按照词频由高到低排序,由于用户在输入A后,选择了A的相关词B、C、D,则已经选择了的B、C、D不参与该次排序,因此,排序后的序列为E、F、G、H、I。再将从用户相关词词库中搜索到的A的相关词按照词频由低到高插入到上述排序后的A的相关词序列的末尾,排序后的序列为E、F、G、H、I、D、C、B。将最后记忆的A的相关词B插入至上述排列后的中间位置。由于在显示A的相关词时,每页显示四个A的相关词,因此,将最后记忆的A的相关词B插入至上述排列后的中间位置后,排序后的序列为E、F、G、B、H、I、D、C。
在步骤S104中,显示该候选词的相关词或者排序后的候选词的相关词。在显示该候选词的相关词时可以根据预先的显示设置进行分页显示,也可以一次显示所有候选词的相关词。
在步骤S105中,接收用户的候选词的相关词选择指令,输出与该候选词的相关词选择指令对应的候选词的相关词。
用户可以通过鼠标、键盘上的数字键或者方向键等发送候选词的相关词选择指令,以选择需要输出的候选词的相关词。
在步骤S106中,将用户选择过的候选词的相关词存储至用户相关词词库。
在将用户选择过的候选词的相关词存储至用户相关词词库中时,同时对用户最后记忆的候选词的相关词进行标记,并且重新计算用户相关词词库中候选词的相关词的词频。在本发明实施例中,为了便于用户选择候选词的相关词,将用户选择过的候选词的相关词存储,形成属于用户个人的用户相关词词库,即将上述选择过的候选词的相关词添加至用户相关词词库中的相关词词典中。如假设用户在输入候选词A后,选择了A的相关词B,则先查询用户相关词词库的相关词词典中是否存在A的相关词,如果不存在,则在用户相关词词库的相关词词典中创建A的相关词,如果存在,则将B作为A的相关词,添加至用户相关词词库的相关词词典中。
在本发明实施例中,通过根据用户输入的候选词,输出该候选词的相关词,从而用户在需要输入汉字时,如聊天或者编写文章等,不再感觉语言苍白无力,没有新意。
图3示出了本发明另一实施例提供的输入法中候选词的相关词输入方法的实现流程,详述如下:
在步骤S301中,接收用户输入的候选词。其中候选词是根据用户输入的汉字的拼音或者笔画确定的候选词。
在步骤S302中,接收用户选择的场景。其中场景包括但不限于口语场景、流行语场景、学术场景,古典场景,专业场景等。其中专业场景中还可以根据专业的不同,细分为文学场景,医学场景,计算机场景,物理场景等。具体的场景分类如图4所示。用户可以同时选择一个或者多个场景。
在步骤S303中,根据用户输入的候选词,搜索预置的与用户选择的场景匹配的相关词词库中该候选词的相关词。
在本发明实施例中,不同的场景匹配有对应的相关词词库。如对于口语场景匹配有相关口语词汇库;对于流行语场景匹配有相关流行语词汇库;依次类推。根据用户选择的候选词,搜索预置的与用户选择的场景匹配的相关词词典。其中与场景匹配的相关词词库包括与场景匹配的核心相关词词库和与场景匹配用户相关词词库。其中与场景匹配的核心相关词词库包括与场景匹配的核心相关词词典,与场景匹配的核心相关词词典中存储有与场景匹配的候选词的相关词,该候选词的相关词是预先配置好的候选词的相关词。与场景匹配的用户相关词词库包括与场景匹配的用户相关词词典,与场景匹配的用户相关词词典中存储有候选词的相关词,该候选词的相关词是用户输入候选词时,选择过的与场景匹配的候选词的相关词。候选词的相关词可以是候选词的同义词,候选词的反义词,或者与候选词相关的其他词中的一种或者多种。
步骤S304、步骤S305、步骤S306以及步骤S307分别与图1所示的步骤S103、步骤S104、步骤S105以及步骤S106相同,在此不再赘述。
在本发明实施例中,可以根据用户输入的候选词,搜索预置的与用户选择的场景匹配的相关词词库中该候选词的相关词,从而可以满足用户在不同场景下对候选词的相关词的需要。如闲聊时,可以采用口语化的词汇,在办公时,可以采用学术化的词汇,在做专业文档时,可以采用专业词汇。
图5示出了本发明实施例提供的用户输入候选词的实现流程,详述如下:
在步骤S501中,接收用户输入的字符。其中用户输入的字符可以是拼音串,也可以是笔画串。
在步骤S502中,根据用户输入的字符,搜索预置的字符数据库中与该字符匹配的所有候选词。其中预置的字符数据库包括拼音词典,或者笔画词典。
当用户输入的字符为拼音串时,在根据用户输入的拼音串,搜索预置的字符数据库中与该拼音串匹配的所有候选词之前,按预设的音节划分规则对用户输入的拼音串进行音节划分。其中预设的音节划分规则属于现有技术,在此不再赘述。再根据音节划分结果,搜索预置的字符数据库的拼音词典中,与该拼音串匹配的所有候选词。
当用户输入的字符为笔画串时,搜索预置的字符数据库的笔画词典中,与该笔画串匹配的所有候选词。
在步骤S503中,显示搜索到的所有候选词。在显示生成的候选词时,可以按照汉字的显示设置分页显示,也可以一次显示所有的候选词。
在步骤S504中,接收用户的候选词选择指令,将与该指令对应的候选词作为用户输入的候选词。用户可以通过鼠标、键盘上的数字键或者方向键等发送候选词选择指令,以选择需要输入的候选词。在根据用户输入的候选词,按照图1或者图3所示的候选词的相关词输入方法输入该候选词的相关词。
图6示出了本发明实施例提供的输入法中候选词的相关词输入系统60的结构,为了更好的说明本发明实施例,仅示出了与本发明实施例相关的部分。
候选词输入模块61接收用户输入的候选词,该候选词是根据用户输入的汉字的拼音或者笔画确定的候选词。
相关词搜索模块62根据候选词输入模块61接收到的候选词,搜索预置的相关词词库63中该候选词的相关词。候选词的相关词可以是候选词的同义词,候选词的反义词,或者与候选词相关的其他词中的一种或者多种。
相关词词库63存储有候选词的相关词,在相关词搜索模块62搜索到该候选词的相关词时,向相关词搜索模块62输出该候选词的相关词。在本发明实施例中,为了便于用户选择输出的候选词的相关词,相关词词库63包括核心相关词词库和用户相关词词库。其中核心相关词词库包括相关词词典,相关词词典中存储有候选词的相关词,该候选词的相关词是预先配置好的候选词的相关词。用户相关词词库包括相关词词典,相关词词典中存储有候选词的相关词,该候选词的相关词是用户输入候选词时,选择过的候选词的相关词。
相关词窗口交互模块64将相关词搜索模块62搜索到的所有候选词显示给用户并接收用户的操作指令。当用户通过鼠标、键盘上的方向键或数字键发送候选词的相关词选择指令,以选择显示的候选词的相关词时,相关词窗口交互模块64将选中的候选词的相关词作为与用户需要输入的候选词的相关词输出。
在本发明另一实施例中,为了使用户在不同的场景输入与场景匹配的词汇,以提高用户的语言才华。本发明实施例提供的系统还包括场景选择模块(图未示出)。场景选择模块接收用户选择的场景。其中场景包括但不限于口语场景、流行语场景、学术场景,古典场景,专业场景等。专业场景中还可以根据专业的不同,细分为文学场景,医学场景,计算机场景,物理场景等。具体的场景分类如图4所示。用户可以同时选择一个或者多个场景。相应的,不同的场景匹配有对应的相关词词库。此时,相关词搜索模块62根据候选词输入模块61接收的候选词,搜索预置的与场景选择模块接收的场景匹配的相关词词库中该候选词的相关词。
在本发明另一实施例中,为了引导用户选择候选词的相关词,本发明实施例提供的系统还包括相关词排序模块(图未示出),其对相关词搜索模块搜索到的候选词的相关词进行排序。此时,相关词搜索模块62同时搜索相关词词库63中的核心相关词词库中该候选词的相关词和用户相关词词库中的候选词。其中具体的排序过程如上所述,在此不再赘述。
在本发明另一实施例中,为了便于用户选择候选词的相关词,本发明实施例提供的系统还包括相关词存储模块(图未示出),其将相关词窗口交互模块66输出的候选词的相关词存储至相关词词库63中的用户相关词词库中。具体存储过程如上所述,在此不再赘述。
图7示出了本发明实施例提供的候选词输入模块61的结构。
候选词输入模块61包括字符输入模块611,候选词搜索模块612,字符数据库613和候选词窗口交互模块614。字符输入模块611接收用户输入的字符,候选词搜索模块612根据字符输入模块611接收的字符,搜索预置的字符数据库613中与该字符匹配的所有候选词,字符数据库613向候选词搜索模块612输出与该字符匹配的所有候选词,候选词窗口交互模块614显示候选词搜索模块612提交的所有候选词并接收用户输入的操作指令。
其中字符输入模块611接收的字符可以是确定候选词的拼音串,也可以是确定候选词的笔画串。当该字符为笔画串时,字符数据库613包括一笔画词典。此时,候选词搜索模块612根据字符输入模块611接收的笔画串,搜索预置的字符数据库613的笔画词典中与该笔画串匹配的所有候选词,字符数据库613向候选词搜索模块612输出与该笔画串匹配的所有候选词。当字符输入模块611接收的字符为拼音串(该拼音串可以是简拼拼音串,也可以是全拼拼音串)。时,字符数据库613包括一拼音词典,候选词输入模块61还包括音节划分模块615,其按预设的音节划分原则对候选词输入模块61接收的拼音串进行音节划分,此时,候选词搜索模块612根据音节划分模块615的音节划分结果,搜索字符数据库613的拼音词典中与该拼音串的音节划分结果对应的所有候选词。
为了更好的说明本发明,下面结合一个具体示例对本发明进行说明。假设用户需要输入的候选词的相关词为候选词的同义词时,则该相关词词库为同义词词库,该同义词词库中包括核心同义词词库和用户同义词词库。其中核心同义词词库和用户同义词词库中均包括同义词词典,假设候选词的同义词词典的数据结构如图8所示,且假设该候选词的同义词词典是与口语场景匹配的。当用户需要根据场景输入候选词的相关词时,则在相关词词库中对应存储有与每个场景匹配的相关词词库。
当用户在键盘上输入拼音串“zzh”时,音节划分模块615对上述拼音串进行音节划分,得到音节划分后的拼音串“z’zh”,候选词搜索模块612搜索预先存储的拼音词典中与该拼音串的音节划分结果对应的所有候选词(如组织、最终、在职、自治、尊重等),通过候选词窗口交互模块613显示上述候选词,用户通过数字键选择其中一个候选词,如尊重,作为用户输入的候选词。
当用户通过场景选择模块选择当前的场景为口语场景时,相关词搜索模块62根据用户输入的候选词“尊重”,搜索与口语场景匹配的如图8所示的同义词词典中“尊重”的同义词,则搜索到的“尊重”的同义词包括“敬重”、 “尊贵”、“尊敬”、“佩服”、“敬爱”等。
相关词排序模块采用“非最近记忆”和“非高词频”排序法对搜索到的“尊重”的同义词进行排序。假设预设的汉字显示为分页显示,且每页显示四个词汇,且搜索到的“尊重”的同义词中,按词频高低的顺序为“敬重”、“尊贵”、“ 尊敬”、“敬爱”、“佩服”;其中 “佩服”、“敬重”是用户曾经在输入“尊重”时,选择过的相关词,且其按词频由低到高的顺序为“佩服”、 “敬重”;“敬重”是用户最后记忆的相关词。则采用“非最近记忆”和“非高词频”排序法对搜索到的“尊重”的同义词进行排序后,其排列顺序为、“尊贵”、“尊敬”、“敬爱”、“敬重”、“佩服”。相关词窗口交互模块64在分页显示“尊重”的同义词时,按照上述顺序进行显示。当用户通过键盘上数字键发送候选词的相关词选择指令,选择的候选词的相关词“佩服”时,相关词窗口交互模块64输出“佩服”。同时相关词存储模块将此次输出的“尊重”的相关词“佩服”添加至相关词词库的用户相关词词库中,作为“尊重”的最近记忆的同义词。
在本发明实施例中,根据用户输入的候选词,搜索相关词词库中该候选词的所有相关词,并根据用户的候选词的相关词选择指令,输出与该候选词的相关词选择指令对应的候选词的相关词,从而扩展了用户的词汇量,提高了用户的语音才华和语言表达能力,使用户的语言更丰富,更有个性。通过根据用户选择的场景,输出与该场景匹配的候选词的相关词,从而满足用户对专业词汇的需求。在向用户显示搜索到的候选词的相关词之前,采用一定的排序方式对搜索到的候选词的相关词进行排序,从而极大的提高了用户的文字输入速度、效率和正确率。并且存储用户选择过的候选词的相关词,经过长期的汉字输入,可以形成属于用户自己的最近记忆的相关词词库,便于用户在众多候选词的相关词中选择符合要求的候选词的相关词。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。