CN110007779B - 输入法预测首选项的确定方法、装置、设备及存储介质 - Google Patents

输入法预测首选项的确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110007779B
CN110007779B CN201910250664.6A CN201910250664A CN110007779B CN 110007779 B CN110007779 B CN 110007779B CN 201910250664 A CN201910250664 A CN 201910250664A CN 110007779 B CN110007779 B CN 110007779B
Authority
CN
China
Prior art keywords
candidate
compared
word
determining
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910250664.6A
Other languages
English (en)
Other versions
CN110007779A (zh
Inventor
许晏铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN201910250664.6A priority Critical patent/CN110007779B/zh
Publication of CN110007779A publication Critical patent/CN110007779A/zh
Application granted granted Critical
Publication of CN110007779B publication Critical patent/CN110007779B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种输入法预测首选项的确定方法、装置、设备及存储介质,其中,该方法包括:接收用户输入的输入信息;从输入法词库中确定出与输入信息匹配的候选项;根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项。通过本发明实施例提供的输入法预测首选项的确定方法、装置、设备及存储介质,能够提高首选项确定的准确度。

Description

输入法预测首选项的确定方法、装置、设备及存储介质
技术领域
本发明涉及输入法技术领域,特别是涉及输入法预测首选项的确定方法、装置、设备及存储介质。
背景技术
输入法对终端产品乃至移动应用的重要性不言而喻,且输入法对通讯录的支持在用户体验方面有着举足轻重的地位。
现有技术中将用户的通讯录导入输入法词库,并分别为通讯录中的各个词确定对应的得分,将通讯录中的词与输入法词库中除通讯录中的词之外的其他词,根据得分进行比较,选择得分最高的词作为首选项,其中,首选项可以理解为输入法界面中位于首位的词。
现有技术中,在确定首选项的过程中,将导入通讯录中的词后,将通讯录中的词与输入法系统词库中的词统一进行比较,使得确定的首选项的准确性较低。
发明内容
本发明实施例的目的在于提供一种输入法预测首选项的确定方法、装置、设备及存储介质,以提高首选项确定的准确度。具体技术方案如下:
第一方面,本发明实施例提供了一种输入法预测首选项的确定方法,包括:
接收用户输入的输入信息;
从输入法词库中确定出与所述输入信息匹配的候选项,所述输入法词库为导入通讯录词库后的词库;
根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词属性信息用于指示该候选项是系统词或历史词,以及当该候选项是所述系统词时,指示该候选项是通讯录系统词或其他系统词,当该候选项是所述历史词时,指示该候选项是通讯录历史词或其他历史词,所述其他系统词为所述系统词中除所述通讯录系统词之外的词,所述其他历史词为所述历史词中除所述通讯录历史词之外的词。
可选的,在所述从输入法词库中确定出与所述输入信息匹配的候选项之前,所述方法还包括:
获取所述用户的通讯录中的各个通讯录词;
将所述各个通讯录词导入所述输入法词库,并将所述各个通讯录词标记为通讯录系统词。
可选的,在所述将所述各个通讯录词导入所述输入法词库,并将所述各个通讯录词标记为通讯录系统词之后,所述方法还包括:
针对各个通讯录系统词,在输入法展示该通讯录系统词、且该通讯录系统词被点击后,将该通讯录系统词标记为通讯录历史词。
可选的,所述根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词特征属性信息用于反映该候选项与所述输入信息的编辑距离以及匹配程度。
可选的,针对各个候选项,通过语言模型和空间模型,确定反映该候选项的词频和词特征属性信息的得分,其中,所述词频是基于语料库统计的词频,所述词特征属性信息包括该候选项的简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息;
所述根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
依次遍历各个候选项,从各个候选项中确定第一待比较候选项和第二待比较候选项,第二待比较候选项为各个候选项中除第一待比较候选项之外的候选项;
若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定第一待比较候选项为所述首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
可选的,所述根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
若第一待比较候选项和第二待比较候选项中一个是通讯录历史词,另一个是其他历史词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
可选的,所述根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他历史词或通讯录历史词,或者一个是通讯录历史词,另一个是其他系统词或通讯录系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定其他历史词或通讯录历史词为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若是其他系统词或通讯录系统词的待比较候选项对应不可组成完整拼音信息,而是其他历史词或通讯录历史词的待比较候选项对应可组成完整拼音信息,则确定是其他系统词或通讯录系统词的待比较候选项为首选项,否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
第二方面,本发明实施例提供了一种输入法预测首选项的确定装置,包括:
接收模块,用于接收用户输入的输入信息;
确定模块,用于从输入法词库中确定出与所述输入信息匹配的候选项,所述输入法词库为导入通讯录词库后的词库;根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词属性信息用于指示该候选项是系统词或历史词,以及当该候选项是所述系统词时,指示该候选项是通讯录系统词或其他系统词,当该候选项是所述历史词时,指示该候选项是通讯录历史词或其他历史词,所述其他系统词为所述系统词中除所述通讯录系统词之外的词,所述其他历史词为所述历史词中除所述通讯录历史词之外的词。
可选的,所述装置还包括:
获取模块,用于获取所述用户的通讯录中的各个通讯录词;
导入模块,用于将所述各个通讯录词导入所述输入法词库;
标记模块,用于将所述各个通讯录词标记为通讯录系统词。
可选的,所述标记模块,还用于针对各个通讯录系统词,在输入法展示该通讯录系统词、且到该通讯录系统词被点击后,将该通讯录系统词标记为通讯录历史词。
可选的,所述确定模块,具体用于根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词特征属性信息用于反映该候选项与所述输入信息的编辑距离以及匹配程度。
可选的,所述确定模块,具体用于针对各个候选项,通过语言模型和空间模型,确定反映该候选项的词频和词特征属性信息的得分,其中,所述词频是基于语料库统计的词频,所述词特征属性信息包括该候选项的简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息;
依次遍历各个候选项,从各个候选项中确定第一待比较候选项和第二待比较候选项,第二待比较候选项为各个候选项中除第一待比较候选项之外的候选项;
若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定第一待比较候选项为所述首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
可选的,所述确定模块,具体用于若第一待比较候选项和第二待比较候选项中一个是通讯录历史词,另一个是其他历史词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
可选的,所述确定模块,具体用于若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他历史词或通讯录历史词,或者一个是通讯录历史词,另一个是其他系统词或通讯录系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定其他历史词或通讯录历史词为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若是其他系统词或通讯录系统词的待比较候选项对应不可组成完整拼音信息,而是其他历史词或通讯录历史词的待比较候选项对应可组成完整拼音信息,则确定是其他系统词或通讯录系统词的待比较候选项为首选项,否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现第一方面所述的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。
本发明实施例提供的输入法预测首选项的确定方法、装置、设备及存储介质,可以接收用户输入的输入信息;从输入法词库中确定出与输入信息匹配的候选项;根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项。本发明实施例中,在确定首选项的过程中,针对候选项是系统词还是历史词,进一步地根据候选项是通讯录系统词、其他系统词、通讯录历史词以及其他历史词的不同,从各个候选项中确定出首选项。如此,能够提高首选项确定的准确度。当然,实施本发明的任一产品或方法必不一定需要同时达到以上的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的输入法预测首选项的确定方法的流程图;
图2(a)为本发明实施例提供的一种效果示意图;
图2(b)为本发明实施例提供的另一种效果示意图;
图3为本发明实施例提供的输入法预测首选项的确定装置的结构示意图;
图4为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的输入法界面中首选项的确定方法可以应用于电子设备,其中,该电子设备可以为处理器、服务器、智能移动设备等。
本发明实施例提供了一种输入法预测首选项的确定方法,如图1所示,可以包括:
S101,接收用户输入的输入信息。
输入信息可以包括用户在输入法界面中输入的拼音等。
S102,从输入法词库中确定出与输入信息匹配的候选项。
输入法词库为导入通讯录词库后的词库。输入法词库可以包括通讯录词库中的词以及输入法系统词库中的词。
从包括通讯录词库中的词以及输入法系统词库中的词的多个词中确定出与输入信息匹配的候选项。
与输入信息匹配的候选项可以包括与输入信息完全匹配的候选项、不完全匹配的候选项等。其中,完全匹配指的是用户输入的拼音与候选项的汉字音节完全匹配,不含纠错和补全等的结果,如用户输入“women”,候选项为“我们”则为完全匹配。不完全匹配指的是用户输入的拼音等和候选项的汉字音节不完全匹配,如用户输入”wom”,候选项为“我们”,则为不完全匹配,另外,用户输入”wom”,候选项为“我们”,这种情况,也可以称为末字简拼。
S103,根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项。
其中,针对各个候选项,词属性信息用于指示该候选项是系统词或历史词,以及当该候选项是系统词时,指示该候选项是通讯录系统词或其他系统词,当该候选项是历史词时,指示该候选项是通讯录历史词或其他历史词,其他系统词为系统词中除通讯录系统词之外的词,其他历史词为历史词中除通讯录历史词之外的词。
一种可实现方式中,词属性信息可以包括词属性标志位上的标识信息,如该标识信息可以包括2位,第1位用于指示该候选项是系统词或历史词,第2位用于指示当该候选项是系统词时,该候选项是通讯录系统词或其他系统词,当该候选项是历史词时,该候选项是通讯录历史词或其他历史词。如第1位为1时,表示该候选项是系统词,进一步地若第2位为1时,表示该候选项是通讯录系统词,第2位为0时,表示该候选项是其他系统词。第1位为0时,表示该候选项是历史词,进一步地若第2位为1时,表示该候选项是通讯录历史词,第2位为0时,表示该候选项是其他历史词。
首选项可以理解为输入法界面中位于首位的词。也可以理解为用户输入拼音对应的最优解。
可以根据各个候选项的词属性信息的不同,通过不同的比较规则,确定出首选项。如可以确定候选项中的通讯录历史词为首选项。或者,可以根据候选项是通讯录系统词或通讯录历史词等的不同,确定首选项。
其中,比较规则是为了找出更符合用户需求的首选项,本发明实施例中,可以根据各个候选项的词属性信息的不同,在不同情况下,根据不同的比较规则,以确定出更符合用户需求的候选项。
具体地根据各个候选项的词属性信息,通过比较规则,确定出首选项的过程在下述实施例中会详细介绍,这里先不赘述。
本发明实施例中,在确定首选项的过程中,针对候选项是系统词还是历史词,进一步地根据候选项是通讯录系统词、其他系统词、通讯录历史词以及其他历史词的不同,从各个候选项中确定出首选项。如此,能够提高首选项确定的准确度。
在从输入法词库中确定出与输入信息匹配的候选项之前,还可以包括:
A1,获取用户的通讯录中的各个通讯录词。
A2,将各个通讯录词导入输入法词库,并将各个通讯录词标记为通讯录系统词。
本发明实施例中,还可以包括导入通讯录词库的过程。具体地,当用户点击“同步通讯录词库”时,电子设备检测到该“同步通讯录词库”被点击时,可将通讯录中的通讯录词导入到输入法词库中。如此,当接收到用户输入的拼音等时,可以将输入的拼音等与输入法词库中的词进行匹配,确定与用户输入的拼音匹配的候选项。
通讯录中可以包括联系人的姓名、电话号码、住址、电子邮件等等,一种可实现方式中,可以运用正则表达式对导入的通讯录词进行非法字符过滤,只保留中文姓名和电话号码,中文姓名的拼音可以通过部署在服务器等上的注音模型得到。
另外,本发明实施例中还可以在执行首选项的确定方法的电子设备中内置一个高频的姓氏表,进行昵称的提取,比如用户的通讯录中有一个联系人的姓名是“王小明”,则对其进行昵称提取后的结果是“小明”,如此,导入的通讯录就包含“王小明”和“小明”这两个名字,且两者的词频相同。另外,还可以进行通讯录词的去重,避免导入重复的名字。
本发明实施例中,在初次导入通讯录词时,将各个通讯录词标记为通讯录系统词。同时,可以确定各个通讯录词的初始词频,可以根据该初始词频将通讯录词与系统词进行排序比较。本发明实施例中不对确定初始词频的方式做限制,任何确定词频的方式均在本发明实施例的保护范围内,一种可实现方式中,初始词频可以为介于0~255固定的数值。
一种可选的实施例中,在将各个通讯录词导入输入法词库,并将各个通讯录词标记为通讯录系统词之后,还可以包括:
针对各个通讯录系统词,在输入法展示该通讯录系统词、且该通讯录系统词被点击后,将该通讯录系统词标记为通讯录历史词。
一种可选的实现方式中,输入法展示包括该通讯库词的预设个候选项,用户可以点击该通讯库词,该通讯录系统词被点击后,该将该通讯录系统词标记为通讯录历史词。
另外,若检测到该通讯录系统词被点击时,记录该通讯录系统词被点击的点击时间以及点击次数,可以结合点击时间以及点击次数计算通讯录历史词对应的得分,具体地,当该通讯录系统词被点击时,该通讯录系统词对应的点击次数累加,根据累加后的点击次数计算词频,然后通过词频结合点击时间,计算该词对应的得分,如该词对应的点击时间越接近计算得分的当前时间,则在当前时间计算的该词的得分越高,如此,可以基于该得分,从多个候选项中确定首选项。
本发明实施例中,考虑用户对通讯录词的使用,即初次导入的通讯录词标记为通讯录系统词,而在用户使用该通讯录词后,则将该通讯录系统词标记为通讯录历史词,即在该通讯录词被用户使用后,该通讯录系统词则变为通讯录历史词。
本发明实施例中,可以根据各个候选项的词属性信息的不同,通过不同的比较规则,确定出首选项。一种可选的实施例中,步骤S103:根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,可以包括:
根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项。
其中,针对各个候选项,词特征属性信息用于反映该候选项与输入信息的编辑距离以及匹配程度。
编辑距离可以理解为两个字符串之间,由一个转成另一个所需的最少编辑操作次数。该候选项与输入信息的编辑距离可以包括输入信息转成候选项对应的拼音的操作次数等。
词特征属性信息可以包括该候选项的简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息。其中,简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息等都可以通过对应的标识信息表示,在需要确定词特征属性信息时,可以直接根据词特征属性信息中简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息分别对应的标识信息确定。
其中,简拼个数可以表示该候选项针对用户当前输入的拼音的匹配情况,简拼个数等于0可以理解为完全匹配,一种情况case1,用户输入“women”,当前候选项为“我们”,则简拼个数=0。不等于0可以理解为部分匹配,部分匹配情况中一种情况case2,用户输入“wom”,当前候选项为“我们”,则简拼个数=1;一种情况case3,用户输入“wm”,当前候选项为“我们”,则简拼个数=2;词补全也理解为不匹配的一种情况,case4,用户输入“don”,当前候选项为“懂”,则简拼个数=1;词纠错也可理解为不匹配的一种情况,case5,用户输入“chifsn”,当前候选项为“吃饭”,则简拼个数=1。
可组成完整拼音信息,也可以表示为Full_id,可理解为可组成完整拼音的id((identification,标识)),比如”wo”。不可组成完整拼音信息,也可以表示为Half_id,可理解为不可组成完整拼音的id,比如”w”。
本发明实施例中,针对各个候选项,通过语言模型和空间模型,确定反映该候选项的词频和词特征属性信息的得分。
其中,词频是基于语料库统计的词频。
本发明实施例中可以通过语言模型和空间模型分别确定对应的得分,将语言模型和空间模型分别对应的语言模型得分和空间模型得分相加,得到该候选项对应的得分。
语言模型是一种对语言打分的方式,一种可选的实施例中,采用ngram语言模型,ngram指的是采用几元的语言模型,一种可实现方式中,比如”我们”一词,基于语料库中统计出的词频为30W,则跟其他词一起归一化,可以得到最终的语言模型得分为210。
空间模型得分,体现的是一种编辑距离和拼音匹配程度,比如临近键位纠错、简拼、末字简拼等规则,用户输入拼音后确定的各个候选项都会有一个词属性信息,通过词属性按照预先训练出来的参数权重进行空间模型得分的计算。
根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
依次遍历各个候选项,从各个候选项中确定第一待比较候选项和第二待比较候选项,第二待比较候选项为各个候选项中除第一待比较候选项之外的候选项。如可以通过word_1表示第一待比较候选项、word_2表示第二待比较候选项。
针对候选项的词属性信息的不同,分别进行比较,具体比较规则如下:
第一种情况,若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他系统词时,可以包括以下4种情况:(1)、(2)、(3)和(4):
(1)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项。
word_1.简拼个数==word_2.简拼个数==0时,表示word_1和word_2都是完全匹配,无纠错、补全和简拼。比较word_1和word_2分别对应的得分,将得分较高的待比较候选项确定为首选项,而若得分相同时,则确定word_1为首选项。
(2)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,包括以下2种情况(2a)和(2b):
(2a)简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项。
如word_1.简拼个数等于0,word_2.简拼个数不等于0,若word_2满足末字简拼规则,则计算word_1和word_2分别对应的得分,将得分较高的待比较候选项确定为首选项,而若得分相同时,确定简拼个数等于0的word_1为首选项。
其中,假设用户输入”wom”,word_2为“我们”,可以认为word_2满足末字简拼规则。
(2b)简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项。
word_2.简拼个数不等于0,若word_2不满足末字简拼规则,则确定简拼个数等于0的word_1为首选项。其中,假设用户输入”wmen”,word_2为“我们”,可以认为word_2不满足末字简拼规则。
(3)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,包括以下3种情况(3a)、(3b)和(3c):
(3a)若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项。
可以通过word_1.is_repair表示word_1是否有纠错,即是否是纠错结果,word_2.is_repair表示word_2是否有纠错,即是否是纠错结果。word_1.is_repair与word_2.is_repair不相同,可以表示word_1和word_2中有一个是纠错结果。若word_1.is_repair为1表示word_1是纠错结果,word_1.is_repair为0表示word_1非纠错结果,word_2.is_repair1为1表示word_2是纠错结果,word_2.is_repair为0表示word_2非纠错结果。若word_1.is_repair为1,word_2.is_repair为0,则确定word_2为首选项,word_1.is_repair为0,word_2.is_repair为1,则确定word_1为首选项。
(3b)若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项。
其中,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,可以包括:
当其他系统词是half_id,通讯录系统词不是half_id,这种情况,其他系统词大概率是末字简拼,通讯录系统词大概率是前置简拼,则可以确定其他系统词优先,即可以确定是其他系统词的候选项为首选项;当其他系统词不是half_id,通讯录系统词是half_id,其他系统词大概率是前字简拼,通讯录系统词大概率是后置简拼,则可以确定通讯录系统词优先,即可以确定是通讯录系统词的首选项为首选项。
如word_1为通讯录系统词,word_2为其他系统词,若word_1和word_2均是纠错结果或均不是纠错结果,且当word_1和word_2的简拼个数均为1时,若word_1对应可组成完整拼音信息,word_2对应不可组成完整拼音信息,则确定word_2为首选项;若word_1对应不可组成完整拼音信息,word_2对应可组成完整拼音信息,则确定word_1为首选项。
若word_1和word_2均对应可组成完整拼音信息,或word_1和word_2均对应不可组成完整拼音信息,则比较word_1和word_2分别对应的得分,若word_1得分较高,则将word_1确定为首选项,若word_2得分较高,则将word_2确定为首选项。若得分相同时,则将是通讯录系统词的word_1确定为首选项。
(3c)否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项。
在第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等的情况下,若不满足(3a)和(3b)的条件时,则比较第一待比较候选项和第二待比较候选项的得分,将得分较高的待比较候选项确定为首选项,而若得分相同时,将通讯录系统词的待比较候选项确定为首选项。如word_1是通讯录系统词,word_2是其他系统词,比较word_1和word_2分别对应的得分,若word_1得分较高,则将word_1确定为首选项,若word_2得分较高,则将word_2确定为首选项。若得分相同时,则将是通讯录系统词的word_1确定为首选项。
(4)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时:
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
如word_1.简拼个数为1,word_2.简拼个数的简拼个数为2,即word_1和word_1的简拼个数不为零且不相等时,若word_1.is_repair为1表示word_1是纠错结果,word_1.is_repair为0表示word_1非纠错结果,word_2.is_repair1为1表示word_2是纠错结果,word_2.is_repair为0表示word_2非纠错结果。
若word_1和word_2中仅有一个是纠错结果,如若word_1.is_repair为1,word_2.is_repair为0,则确定word_2为首选项;word_1.is_repair为0,word_2.is_repair为1,则确定word_1为首选项。若word_1.is_repair和word_2.is_repair均为1,或者word_1.is_repair和word_2.is_repair均为0,则确定简拼个数较小的word_1为首选项。
第二种情况,若第一待比较候选项和第二待比较候选项中一个是通讯录历史词,另一个是其他历史词时,可以包括以下4种情况:(1)、(2)、(3)和(4):
(1)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项。
word_1.简拼个数==word_2.简拼个数==0时,表示word_1和word_2都是完全匹配,无纠错、补全和简拼。计算word_1和word_2分别对应的得分,将得分较低的待比较候选项确定为首选项,而若得分相同时,则确定word_1为首选项。
(2)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,包括以下2种情况(2a)和(2b):
(2a)简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项。
如word_1.简拼个数等于0,word_2.简拼个数不等于0,如为1,若word_2满足末字简拼规则,则计算word_1和word_2分别对应的得分,将得分较低的待比较候选项确定为首选项,而若得分相同时,确定简拼个数等于0的word_1为首选项。
(2b)简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项。
word_2.简拼个数不等于0,若word_2不满足末字简拼规则,则确定简拼个数等于0的word_1为首选项。
(3)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,包括以下3种情况(3a)、(3b)和(3c):
(3a)若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项。
可以通过word_1.is_repair表示word_1是否有纠错,即是否是纠错结果,word_2.is_repair表示word_2是否有纠错,即是否是纠错结果。word_1.is_repair与word_2.is_repair不相同,可以表示word_1和word_2中有一个是纠错结果。若word_1.is_repair为1表示word_1是纠错结果,word_1.is_repair为0表示word_1非纠错结果,word_2.is_repair1为1表示word_2是纠错结果,word_2.is_repair为0表示word_2非纠错结果。若word_1.is_repair为1,word_2.is_repair为0,则确定word_2为首选项,word_1.is_repair为0,word_2.is_repair为1,则确定word_1为首选项。
(3b)若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项。
其中,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,包括:
当其他历史词是half_id,通讯录历史词不是half_id,这种情况,其他历史词大概率是末字简拼,通讯录历史词大概率是前置简拼,则可以确定其他历史词优先,即确定是其他历史词的候选项为首选项;当其他历史词不是half_id,通讯录历史词是half_id,这种情况,其他历史词大概率是前置简拼,通讯录历史词大概率是后置简拼,则可以确定通讯录历史词优先,即确定是通讯录历史词的候选项是首选项。
如word_1为通讯录历史词,word_2为其他历史词,若word_1和word_2均是纠错结果或均不是纠错结果,且当word_1和word_2的简拼个数均为1时,若word_1对应可组成完整拼音信息,word_2对应不可组成完整拼音信息,则确定word_2为首选项;若word_1对应不可组成完整拼音信息,word_2对应可组成完整拼音信息,则确定word_1为首选项。
若word_1和word_2均对应可组成完整拼音信息,或word_1和word_2均对应不可组成完整拼音信息,则比较word_1和word_2分别对应的得分,若word_1得分较低,则将word_1确定为首选项,若word_2得分较低,则将word_2确定为首选项。若得分相同时,则将是通讯录历史词的word_1确定为首选项。
(3c)否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项。
在第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等的情况下,若不满足(3a)和(3b)的条件时,则比较第一待比较候选项和第二待比较候选项的得分,将得分较低的待比较候选项确定为首选项,而若得分相同时,将通讯录历史词的待比较候选项确定为首选项。如word_1是通讯录历史词,word_2是其他历史词,比较word_1和word_2分别对应的得分,若word_1得分较低,则将word_1确定为首选项,若word_2得分较低,则将word_2确定为首选项。若得分相同时,则将是通讯录历史词的word_1确定为首选项。
(4)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时:
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
如word_1.简拼个数为1,word_2.简拼个数的简拼个数为2,即word_1和word_1的简拼个数不为零且不相等时,若word_1.is_repair为1表示word_1是纠错结果,word_1.is_repair为0表示word_1非纠错结果,word_2.is_repair1为1表示word_2是纠错结果,word_2.is_repair为0表示word_2非纠错结果。
若word_1和word_2中仅有一个是纠错结果,如若word_1.is_repair为1,word_2.is_repair为0,则确定word_2为首选项;word_1.is_repair为0,word_2.is_repair为1,则确定word_1为首选项。若word_1.is_repair和word_2.is_repair均为1,或者word_1.is_repair和word_2.is_repair均为0,则确定简拼个数较小的word_1为首选项。
第三种情况,若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他历史词或通讯录历史词,或者一个是通讯录历史词,另一个是其他系统词或通讯录系统词时,可以包括以下4种情况:(1)、(2)、(3)和(4):
(1)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定其他历史词或通讯录历史词为首选项。
若word_1是通讯录系统词,word_2是其他历史词或通讯录历史词,即历史词时,且word_1.简拼个数==word_2.简拼个数==0时,则确定word_2为首选项。
若word_1是通讯录历史词,word_2是其他系统词或通讯录系统词,且word_1.简拼个数==word_2.简拼个数==0时,则确定word_1为首选项。
(2)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项。
如word_1.简拼个数等于0,word_2.简拼个数不等于0,如为1,则确定word_1为首选项。
(3)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时:
(3a)若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项。
可以通过word_1.is_repair表示word_1是否有纠错,即是否是纠错结果,word_2.is_repair表示word_2是否有纠错,即是否是纠错结果。word_1.is_repair与word_2.is_repair不相同,可以表示word_1和word_2中有一个是纠错结果。若word_1.is_repair为1表示word_1是纠错结果,word_1.is_repair为0表示word_1非纠错结果,word_2.is_repair1为1表示word_2是纠错结果,word_2.is_repair为0表示word_2非纠错结果。若word_1.is_repair为1,word_2.is_repair为0,则确定word_2为首选项,word_1.is_repair为0,word_2.is_repair为1,则确定word_1为首选项。
(3b)若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若是其他系统词或通讯录系统词的待比较候选项对应不可组成完整拼音信息,而是其他历史词或通讯录历史词的待比较候选项对应可组成完整拼音信息,则确定是其他系统词或通讯录系统词的待比较候选项为首选项,否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项。
在第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1的情况下,若word_1是通讯录系统词,word_2是其他历史词或通讯录历史词,或word_1是通讯录历史词,word_2是其他系统词或通讯录系统词,word_1.is_repair与word_1.is_repair相同,且word_1.简拼个数==word_2.简拼个数==1,若word_1对应不可组成完整拼音信息,word_2对应可组成完整拼音信息,则确定word_1为首选项;若word_1对应可组成完整拼音信息,word_2对应不可组成完整拼音信息,则确定word_2为首选项。
若word_1和word_2均对应可组成完整拼音信息,或word_1和word_2均对应不可组成完整拼音信息,确定是其他历史词或通讯录历史词的待比较候选项为首选项,如若word_1是通讯录系统词,word_2是其他历史词或通讯录历史词,则确定word_2为首选项,若word_1是通讯录历史词,word_2是其他系统词或通讯录系统词,则确定word_1为首选项。
(3c)否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项。
在第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等的情况下,若不满足(3a)和(3b)的条件,则确定是其他历史词或通讯录历史词的待比较候选项为首选项,即确定历史词为首选项。如若word_1是通讯录系统词,word_2是其他历史词或通讯录历史词,则确定word_2为首选项。若word_1是通讯录历史词,word_2是其他系统词或通讯录系统词,则确定word_1为首选项。
(4)当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时:
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
如word_1.简拼个数为1,word_2.简拼个数的简拼个数为2,即word_1和word_1的简拼个数不为零且不相等时,若word_1.is_repair为1表示word_1是纠错结果,word_1.is_repair为0表示word_1非纠错结果,word_2.is_repair1为1表示word_2是纠错结果,word_2.is_repair为0表示word_2非纠错结果。
若word_1和word_2中仅有一个是纠错结果,如word_1.is_repair为1,word_2.is_repair为0,则确定word_2为首选项;word_1.is_repair为0,word_2.is_repair为1,则确定word_1为首选项。若word_1.is_repair和word_2.is_repair均为1,或者word_1.is_repair和word_2.is_repair均为0,则确定简拼个数较小的word_1为首选项。
本发明提供了改进的通讯录词比较逻辑,将通讯录词分为通讯录系统词和通讯录历史词,并分别设计了对应的比较逻辑,能够缓解输入法的输入不准确的问题。通过跟通讯录词相关的排序逻辑,使排序更加准确,即确定的首选项更加准确,满足用户需求,提高搜索的准确性,进而提高用户的输入效率。且可以将通讯录词分为通讯录系统词和通讯录历史词,并通过对应的标识信息进行存储。
为了可以直观地展示本发明实施例确定的首选项,本发明实施例中一个具体的实施例中,若用户通讯录中有“张小铭”。
用户输入拼音”xiaoming”或“zhangxiaoming”,在输入法界面中展示对应的候选项,如图2(a),此时,“小铭”还没有被点击过,即理解“小铭”为通讯录系统词,可以和其他系统词进行得分的比较,确定得到的首选项是“小明”。而当用户点击该词即“小铭”后,该词会变为通讯录历史词,参与历史词的比较逻辑,这种情况对应的输入法界面如图2(b)所示,确定得到的首选项是“小铭”。
本发明实施例提供了一种输入法预测首选项的确定装置,如图3所示,可以包括:
接收模块301,用于接收用户输入的输入信息;
确定模块302,用于从输入法词库中确定出与输入信息匹配的候选项,输入法词库为导入通讯录词库后的词库;根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,词属性信息用于指示该候选项是系统词或历史词,以及当该候选项是系统词时,指示该候选项是通讯录系统词或其他系统词,当该候选项是历史词时,指示该候选项是通讯录历史词或其他历史词,其他系统词为系统词中除通讯录系统词之外的词,其他历史词为历史词中除通讯录历史词之外的词。
本发明实施例中,在确定首选项的过程中,针对候选项是系统词还是历史词,进一步地根据候选项是通讯录系统词、其他系统词、通讯录历史词以及其他历史词的不同,从各个候选项中确定出首选项。如此,能够提高首选项确定的准确度。
可选的,该装置还包括:
获取模块,用于获取用户的通讯录中的各个通讯录词;
导入模块,用于将各个通讯录词导入输入法词库;
标记模块,用于将各个通讯录词标记为通讯录系统词。
可选的,标记模块,还用于针对各个通讯录系统词,在输入法展示该通讯录系统词、且该通讯录系统词被点击后,将该通讯录系统词标记为通讯录历史词。
可选的,确定模块302,具体用于根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,词特征属性信息用于反映该候选项与输入信息的编辑距离以及匹配程度。
可选的,确定模块302,具体用于针对各个候选项,通过语言模型和空间模型,确定反映该候选项的词频和词特征属性信息的得分,其中,词频是基于语料库统计的词频,词特征属性信息包括该候选项的简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息;
依次遍历各个候选项,从各个候选项中确定第一待比较候选项和第二待比较候选项,第二待比较候选项为各个候选项中除第一待比较候选项之外的候选项;
若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
可选的,确定模块302,具体用于若第一待比较候选项和第二待比较候选项中一个是通讯录历史词,另一个是其他历史词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
可选的,确定模块302,具体用于若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他历史词或通讯录历史词,或者一个是通讯录历史词,另一个是其他系统词或通讯录系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定其他历史词或通讯录历史词为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若是其他系统词或通讯录系统词的待比较候选项对应不可组成完整拼音信息,而是其他历史词或通讯录历史词的待比较候选项对应可组成完整拼音信息,则确定是其他系统词或通讯录系统词的待比较候选项为首选项,否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
需要说明的是,本发明实施例提供的输入法界面中首选项的确定装置是应用上述输入法界面中首选项的确定方法的装置,则上述输入法界面中首选项的确定方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信。
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现上述输入法界面中首选项的确定方法的方法步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例中,在确定首选项的过程中,针对候选项是系统词还是历史词,进一步地根据候选项是通讯录系统词、其他系统词、通讯录历史词以及其他历史词的不同,从各个候选项中确定出首选项。如此,能够提高首选项确定的准确度。
本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述输入法界面中首选项的确定方法的方法步骤。
本发明实施例中,在确定首选项的过程中,针对候选项是系统词还是历史词,进一步地根据候选项是通讯录系统词、其他系统词、通讯录历史词以及其他历史词的不同,从各个候选项中确定出首选项。如此,能够提高首选项确定的准确度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种输入法预测首选项的确定方法,其特征在于,包括:
接收用户输入的输入信息;
从输入法词库中确定出与所述输入信息匹配的候选项,所述输入法词库为导入通讯录词库后的词库;
根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词属性信息用于指示该候选项是系统词或历史词,以及当该候选项是所述系统词时,指示该候选项是通讯录系统词或其他系统词,当该候选项是所述历史词时,指示该候选项是通讯录历史词或其他历史词,所述其他系统词为所述系统词中除所述通讯录系统词之外的词,所述其他历史词为所述历史词中除所述通讯录历史词之外的词;
所述根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词特征属性信息用于反映该候选项与所述输入信息的编辑距离以及匹配程度。
2.根据权利要求1所述的方法,其特征在于,在所述从输入法词库中确定出与所述输入信息匹配的候选项之前,所述方法还包括:
获取所述用户的通讯录中的各个通讯录词;
将所述各个通讯录词导入所述输入法词库,并将所述各个通讯录词标记为通讯录系统词。
3.根据权利要求2所述的方法,其特征在于,在所述将所述各个通讯录词导入所述输入法词库,并将所述各个通讯录词标记为通讯录系统词之后,所述方法还包括:
针对各个通讯录系统词,在输入法展示该通讯录系统词、且该通讯录系统词被点击后,将该通讯录系统词标记为通讯录历史词。
4.根据权利要求1所述的方法,其特征在于,针对各个候选项,通过语言模型和空间模型,确定反映该候选项的词频和词特征属性信息的得分,其中,所述词频是基于语料库统计的词频,所述词特征属性信息包括该候选项的简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息;
所述根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
依次遍历各个候选项,从各个候选项中确定第一待比较候选项和第二待比较候选项,第二待比较候选项为各个候选项中除第一待比较候选项之外的候选项;
若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定第一待比较候选项为所述首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
5.根据权利要求4所述的方法,其特征在于,所述根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
若第一待比较候选项和第二待比较候选项中一个是通讯录历史词,另一个是其他历史词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
6.根据权利要求5所述的方法,其特征在于,所述根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,包括:
若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他历史词或通讯录历史词,或者一个是通讯录历史词,另一个是其他系统词或通讯录系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定其他历史词或通讯录历史词为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若是其他系统词或通讯录系统词的待比较候选项对应不可组成完整拼音信息,而是其他历史词或通讯录历史词的待比较候选项对应可组成完整拼音信息,则确定是其他系统词或通讯录系统词的待比较候选项为首选项,否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
7.一种输入法预测首选项的确定装置,其特征在于,包括:
接收模块,用于接收用户输入的输入信息;
确定模块,用于从输入法词库中确定出与所述输入信息匹配的候选项,所述输入法词库为导入通讯录词库后的词库;根据各个候选项的词属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词属性信息用于指示该候选项是系统词或历史词,以及当该候选项是所述系统词时,指示该候选项是通讯录系统词或其他系统词,当该候选项是所述历史词时,指示该候选项是通讯录历史词或其他历史词,所述其他系统词为所述系统词中除所述通讯录系统词之外的词,所述其他历史词为所述历史词中除所述通讯录历史词之外的词;
所述确定模块,具体用于根据各个候选项的词属性信息以及各个候选项的词特征属性信息,通过预设比较规则,从各个候选项中确定出首选项,其中,针对各个候选项,所述词特征属性信息用于反映该候选项与所述输入信息的编辑距离以及匹配程度。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取所述用户的通讯录中的各个通讯录词;
导入模块,用于将所述各个通讯录词导入所述输入法词库;
标记模块,用于将所述各个通讯录词标记为通讯录系统词。
9.根据权利要求8所述的装置,其特征在于,所述标记模块,还用于针对各个通讯录系统词,在输入法展示该通讯录系统词、且该通讯录系统词被点击后,将该通讯录系统词标记为通讯录历史词。
10.根据权利要求7所述的装置,其特征在于,所述确定模块,具体用于针对各个候选项,通过语言模型和空间模型,确定反映该候选项的词频和词特征属性信息的得分,其中,所述词频是基于语料库统计的词频,所述词特征属性信息包括该候选项的简拼个数、是否满足末字简拼规则、纠错结果的个数、是否对应不可组成完整拼音信息;
依次遍历各个候选项,从各个候选项中确定第一待比较候选项和第二待比较候选项,第二待比较候选项为各个候选项中除第一待比较候选项之外的候选项;
若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定第一待比较候选项为所述首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较高的待比较候选项为所述首选项,若得分相同时,确定是通讯录系统词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
11.根据权利要求10所述的装置,其特征在于,所述确定模块,具体用于若第一待比较候选项和第二待比较候选项中一个是通讯录历史词,另一个是其他历史词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为首选项,若得分相同时,确定第一待比较候选项为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,
且简拼个数不为零的待比较候选项满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,得分相同,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
或者简拼个数不为零的待比较候选项不满足末字简拼规则时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若第一待比较候选项和第二待比较候选项中有一个待比较候选项对应不可组成完整拼音信息,另一个待比较候选项对应可组成完整拼音信息,则确定对应不可组成完整拼音信息的待比较候选项为首选项,否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
否则,确定第一待比较候选项和第二待比较候选项中得分较低的待比较候选项为所述首选项,若得分相同时,确定是通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
12.根据权利要求11所述的装置,其特征在于,所述确定模块,具体用于若第一待比较候选项和第二待比较候选项中一个是通讯录系统词,另一个是其他历史词或通讯录历史词,或者一个是通讯录历史词,另一个是其他系统词或通讯录系统词时,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为零时,确定其他历史词或通讯录历史词为首选项;或,
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数中有一个为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,确定第一待比较候选项和第二待比较候选项中简拼个数为零的待比较候选项为所述首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项;
若第一待比较候选项和第二待比较候选项均是纠错结果或均不是纠错结果,且当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均为1时,若是其他系统词或通讯录系统词的待比较候选项对应不可组成完整拼音信息,而是其他历史词或通讯录历史词的待比较候选项对应可组成完整拼音信息,则确定是其他系统词或通讯录系统词的待比较候选项为首选项,否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
否则,确定是其他历史词或通讯录历史词的待比较候选项为首选项;
当第一待比较候选项的简拼个数和第二待比较候选项的简拼个数均不为零,且第一待比较候选项的简拼个数和第二待比较候选项的简拼个数不相等时,
若第一待比较候选项和第二待比较候选项中仅有一个是纠错结果,则确定第一待比较候选项和第二待比较候选项中为非纠错结果的待比较候选项为首选项,否则,确定第一待比较候选项的简拼个数和第二待比较候选项中简拼个数较小的待比较候选项为首选项。
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤。
CN201910250664.6A 2019-03-29 2019-03-29 输入法预测首选项的确定方法、装置、设备及存储介质 Active CN110007779B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910250664.6A CN110007779B (zh) 2019-03-29 2019-03-29 输入法预测首选项的确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910250664.6A CN110007779B (zh) 2019-03-29 2019-03-29 输入法预测首选项的确定方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110007779A CN110007779A (zh) 2019-07-12
CN110007779B true CN110007779B (zh) 2023-04-21

Family

ID=67169013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910250664.6A Active CN110007779B (zh) 2019-03-29 2019-03-29 输入法预测首选项的确定方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110007779B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备
CN103513778A (zh) * 2012-06-20 2014-01-15 北京搜狗科技发展有限公司 一种针对人名的输入方法及装置
CN105045412A (zh) * 2015-08-28 2015-11-11 百度在线网络技术(北京)有限公司 一种生成输入法候选项的方法及系统
WO2016202101A1 (zh) * 2015-06-16 2016-12-22 北京奇虎科技有限公司 一种基于输入法的展示候选项的方法和装置
CN106855748A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 一种信息输入方法、装置和智能终端
CN108541310A (zh) * 2016-06-22 2018-09-14 华为技术有限公司 一种显示候选词的方法、装置及图形用户界面

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008293403A (ja) * 2007-05-28 2008-12-04 Sony Ericsson Mobilecommunications Japan Inc 文字入力装置、携帯端末および文字入力プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备
CN103513778A (zh) * 2012-06-20 2014-01-15 北京搜狗科技发展有限公司 一种针对人名的输入方法及装置
WO2016202101A1 (zh) * 2015-06-16 2016-12-22 北京奇虎科技有限公司 一种基于输入法的展示候选项的方法和装置
CN105045412A (zh) * 2015-08-28 2015-11-11 百度在线网络技术(北京)有限公司 一种生成输入法候选项的方法及系统
CN106855748A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 一种信息输入方法、装置和智能终端
CN108541310A (zh) * 2016-06-22 2018-09-14 华为技术有限公司 一种显示候选词的方法、装置及图形用户界面

Also Published As

Publication number Publication date
CN110007779A (zh) 2019-07-12

Similar Documents

Publication Publication Date Title
US10460029B2 (en) Reply information recommendation method and apparatus
US20080244390A1 (en) Spell Check Function That Applies a Preference to a Spell Check Algorithm Based Upon Extensive User Selection of Spell Check Results Generated by the Algorithm, and Associated Handheld Electronic Device
CN109948122B (zh) 输入文本的纠错方法、装置及电子设备
US9898464B2 (en) Information extraction supporting apparatus and method
CN108573707B (zh) 一种语音识别结果的处理方法、装置、设备及介质
CN103733193A (zh) 统计拼写检查器
CN110321560B (zh) 一种从文本信息中确定位置信息的方法、装置及电子设备
US10255270B2 (en) Automated document analysis comprising company name recognition
KR101446468B1 (ko) 자동완성 질의어 제공 시스템 및 방법
CN112417848A (zh) 语料生成方法、装置及计算机设备
US9092418B2 (en) Use of a suffix-changing spell check algorithm for a spell check function, and associated handheld electronic device
CN111046627B (zh) 一种中文文字显示方法及系统
US8881004B2 (en) Use of multiple data sources for spell check function, and associated handheld electronic device
CN112527967A (zh) 文本匹配方法、装置、终端和存储介质
CN110007779B (zh) 输入法预测首选项的确定方法、装置、设备及存储介质
US20080244387A1 (en) Use of a Suffix-Removing Spell Check Algorithm for a Spell Check Function, and Associated Handheld Electronic Device
US20080244388A1 (en) Spell Check Function Having a Character Replacement Spell Check Algorithm That Applies a Preference Based Upon Proximity of the Characters Replacing One Another, and Associated Handheld Electronic Device
CN111797614A (zh) 文本处理方法及装置
CN104123293B (zh) 别名查询系统及其方法
CN110728113A (zh) 一种电子表格的信息筛选方法、装置及终端设备
CN115292478A (zh) 一种推荐搜索内容的方法、装置、设备和存储介质
CN114528824A (zh) 文本纠错方法、装置、电子设备及存储介质
CN107203512B (zh) 用于从用户的自然语言输入中提取关键元素的方法
CN107247708B (zh) 一种姓名识别方法及系统
CN111985208A (zh) 一种实现标点符号填充的方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant