CN111399666B - 一种候选词显示方法、装置以及电子设备 - Google Patents

一种候选词显示方法、装置以及电子设备 Download PDF

Info

Publication number
CN111399666B
CN111399666B CN202010148929.4A CN202010148929A CN111399666B CN 111399666 B CN111399666 B CN 111399666B CN 202010148929 A CN202010148929 A CN 202010148929A CN 111399666 B CN111399666 B CN 111399666B
Authority
CN
China
Prior art keywords
words
hot
input
character string
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010148929.4A
Other languages
English (en)
Other versions
CN111399666A (zh
Inventor
赵涛涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd, Shanghai Xiaodu Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010148929.4A priority Critical patent/CN111399666B/zh
Publication of CN111399666A publication Critical patent/CN111399666A/zh
Application granted granted Critical
Publication of CN111399666B publication Critical patent/CN111399666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种候选词显示方法、装置以及电子设备,涉及输入法技术领域。具体实现方案为:获取用户在输入法中输入的字符串;确定所述字符串匹配的多个词汇;在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,其中,所述候选词包括所述热点词汇,以及还包括所述多个词汇中的至少一个词汇,且在所述候选词中所述热点词汇排列于所述至少一个词汇的前面,所述第一时间段包括所述字符串的输入时间,提高输入法的效率。

Description

一种候选词显示方法、装置以及电子设备
技术领域
本申请涉及计算机技术中的输入法技术领域,尤其涉及一种候选词显示方法、装置以及电子设备。
背景技术
在日常生活中,用户常使用输入法进行内容输入,例如,现在市面上有大量不同的输入法产品,目前的输入法一般根据用户的使用习惯,把用户经常选择的词语排在前面显示,且经常需要用户自己多次选择来调整候选词,可见,目前输入法的效率比较差。
发明内容
本申请提供一种候选词显示方法、装置和电子设备,以解决输入法的效率较差的问题。
第一方面,本申请一个实施例提供一种候选词显示方法,包括:
获取用户在输入法中输入的字符串;
确定所述字符串匹配的多个词汇;
在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,其中,所述候选词包括所述热点词汇,以及还包括所述多个词汇中的至少一个词汇,且在所述候选词中所述热点词汇排列于所述至少一个词汇的前面,所述第一时间段包括所述字符串的输入时间。
本申请实施例的候选词显示方法中,在确定字符串匹配的多个词汇之后,还需对多个词汇进行热点词汇的查找,在多个词汇中存在第一时间段的热点词汇的情况下,表示多个词汇中存在热点词汇,则显示的候选词中热点词汇排列在多个词汇中至少一个词汇的前面,即显示的候选词中第一时间段的热点词汇排在前,用户无需进行多次选择来调整候选词,只需要根据字符串的输入时间,在多个词汇中存在输入时间所属的第一时间段的热点词汇的情况下,将该热点词汇排在候选词中至少一个词汇的前面即可,便于用户选择输入,提高输入法的效率。
可选的,所述获取用户在输入法中输入的字符串之前,还包括:
获取在预设历史时间范围内,分别在M个时间段内的历史输入词汇以及对应的输入频次,M为正整数;
将每个时间段内的历史输入词汇中输入频次排在前的P个输入词汇记录至所述时间段的热点词集中,P为正整数,所述M个时间段包括所述第一时间段,所述第一时间段的热点词集中包括所述候选词中所述热点词汇。
在本实施例中,预先收集M个时间段的热门词集,为后续多个词汇进行热门词汇的查找提供保障。
可选的,所述第一时间段的热点词集包括所述第一时间段的第一位置区域的第一热点词集和所述第一时间段的第二位置区域的第二热点词集;
所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中存在所述第一热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词;
或者,所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中不存在所述第一热点词集的热点词汇的情况下,根据所述多个词汇在所述第二热点词集中进行查找;在所述多个词汇中存在所述第二热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词。
即在本实施例中,首先在第一时间段的第一热点词集中查找与多个词汇相同的热门词汇,即多个词汇中若存在第一热点词集的热点词汇,则显示字符串在输入法的候选词,此时,候选词包括多个词汇中存在于第一热点词集的热点词汇以及至少一个词汇。多个词汇中若不存在第一热点词集的热点词汇,即在第一热点词集中没有与多个词汇中任意一个词汇相同的热点词汇,则需要根据多个词汇在第二热点词集中进行查找,多个词汇中若存在第二热点词集的热点词汇,则显示字符串在输入法的候选词,此时,候选词包括多个词汇中存在于第二热点词集的热点词汇以及至少一个词汇。候选词中热点词汇显示在前,可便于便于用户选择,提高输入法的效率。
可选的,所述热点词汇的数量为I,I为大于1的整数;
所述候选词中I个热点词汇排列于所述至少一个词汇的前面,且所述I个热点词汇的排列顺序与所述I个热点词汇的输入频次正相关。
如此,不但可确保候选词中第一时间段的多个热点词汇排在前,且多个热点词汇与输入频次正相关,即显示顺序考虑了第一时间段的热点词汇,又考虑了输入频次,如此,有利于用户进行选择,提高输入法的效率。
可选的,所述确定所述字符串匹配的多个词汇之前,还包括:
在所述字符串存在错误的情况下,对所述字符串进行纠错,得到更新后的字符串;
所述确定所述字符串匹配的多个词汇,包括:
根据所述更新后的字符串确定匹配的所述多个词汇。
然后根据纠错后得到的更新后的字符串确定匹配的多个词汇,提高多个词汇的准确性,从而提高后续候选词的准确性。
第二方面,本申请一个实施例提供一种候选词显示装置,所述装置包括:
字符串获取模块,用于获取用户在输入法中输入的字符串;
确定模块,用于确定所述字符串匹配的多个词汇;
显示模块,用于在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,其中,所述候选词包括所述热点词汇,以及还包括所述多个词汇中的至少一个词汇,且在所述候选词中所述热点词汇排列于所述至少一个词汇的前面,所述第一时间段包括所述字符串的输入时间。
可选的,装置还包括:
词汇获取模块,用于获取在预设历史时间范围内,分别在M个时间段内的历史输入词汇以及对应的输入频次,M为正整数;
记录模块,用于将每个时间段内的历史输入词汇中输入频次排在前的P个输入词汇记录至所述时间段的热点词集中,P为正整数,所述M个时间段包括所述第一时间段,所述第一时间段的热点词集中包括所述候选词中所述热点词汇。
可选的,所述第一时间段的热点词集包括所述第一时间段的第一位置区域的第一热点词集和所述第一时间段的第二位置区域的第二热点词集;
所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中存在所述第一热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词;
或者,所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中不存在所述第一热点词集的热点词汇的情况下,根据所述多个词汇在所述第二热点词集中进行查找;在所述多个词汇中存在所述第二热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词。
可选的,所述热点词汇的数量为I,I为大于1的整数;
所述候选词中I个热点词汇排列于所述至少一个词汇的前面,且所述I个热点词汇的排列顺序与所述I个热点词汇的输入频次正相关。
可选的,装置还包括:
纠错模块,用于在所述字符串存在错误的情况下,对所述字符串进行纠错,得到更新后的字符串;
所述确定所述字符串匹配的多个词汇,包括:根据所述更新后的字符串确定匹配的所述多个词汇。
第三方面,本申请一个实施例还提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请各实施例提供的方法。
第四方面,本申请一个实施例还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请各实施例提供的方法。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请提供的一个实施例的候选词显示方法的流程示意图;
图2是本申请提供的一个实施例的候选词显示装置的结构图;
图3是用来实现本申请实施例的候选词显示方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
如图1所示,根据本申请的实施例,本申请提供一种候选词显示方法,可应用于电子设备,包括:
步骤S101:获取用户在输入法中输入的字符串。
在通过输入法进行输入的过程中,会弹出输入法的输入界面,在输入界面中可显示输入的字符串,即用户可在输入法的输入界面中输入字符串,获取用户在输入法的输入界面输入的字符串。输入法不同,则对应的字符串不同,例如,若用户采用拼音输入法,则输入的字符串为拼音字符串,若用户采用五笔输入法,则输入的字符串为五笔字型字符串。
步骤S102:确定字符串匹配的多个词汇。
在获取输入的字符串之后,即可在词汇集中进行匹配,从而可确定字符串匹配的多个词汇。根据字符串确定其匹配的多个词汇的方式有多种,在此不作限定。
步骤S103:在多个词汇中存在第一时间段的热点词汇的情况下,显示字符串在输入法的候选词。
其中,候选词包括热点词汇,以及还包括多个词汇中的至少一个词汇,且在候选词中热点词汇排列于至少一个词汇的前面,第一时间段包括字符串的输入时间。
热点词汇可以理解为输入频次较高的词汇,也可称为热词或热门词汇。第一时间段的热点词汇即可以理解为在第一时间段内输入频次较高的词汇,多个词汇中存在第一时间段的热点词汇,表示多个词汇中有输入频次较高的词汇,多个词汇中存在的第一时间段的热点词汇也可以理解为在多个词汇中存在第一时间段的目标热点词汇,该目标热点词汇属于多个词汇。在本实施例中,确定字符串匹配的多个词汇之后,需要检查多个词汇中是否存在字符串的输入时间所属的第一时间段的热点词汇,也就是检测多个词汇中是否有第一时间段的热点词汇,若有,则显示的候选词中的多个词汇中存在的第一时间段的热点词汇排列于至少一个词汇的前面,也就是说把多个词汇中的热点词汇排在前,便于用户选择。需要说明的是,上述至少一个词汇为多个词汇中除该热点词汇外的至少一个词汇。
本申请实施例的候选词显示方法中,在确定字符串匹配的多个词汇之后,还需对多个词汇进行热点词汇的查找,在多个词汇中存在第一时间段的热点词汇的情况下,表示多个词汇中存在热点词汇,则显示的候选词中热点词汇排列在多个词汇中至少一个词汇的前面,即显示的候选词中第一时间段的热点词汇排在前,用户无需进行多次选择来调整候选词,只需要根据字符串的输入时间,在多个词汇中存在输入时间所属的第一时间段的热点词汇的情况下,将该热点词汇排在候选词中至少一个词汇的前面即可,便于用户选择输入,提高输入法的效率。
在一个实施例中,获取用户在输入法中输入的字符串之前,还包括:获取在预设历史时间范围内,分别在M个时间段内的历史输入词汇以及对应的输入频次,M为正整数;将每个时间段内的历史输入词汇中输入频次排在前的P个输入词汇记录至时间段的热点词集中,P为正整数,M个时间段包括第一时间段,第一时间段的热点词集中包括候选词中热点词汇。
即可预先预设历史时间范围内,收集各个时间段的热词,得到各个时间段的热点词集。例如,M个时间段可以包括早高峰时间段(比如,早上8:00到10:00)、中午时间段(比如,11:00到13:00)以及晚高峰时间段(比如,17:00到19:00)等,可预先收集这M个时间段的热词,得到M个时间段的热点词集。每个时间段的热点词集中包括在该时间段内的多个热点词汇,即为在该时间段内输入频次较高的词汇。预设历史时间范围可以是字符串的输入时间之前的预设时长范围,例如,输入时间之前的一个月内等,即使统计之前的一个月内,每天在M个时间段内的历史输入词汇以及输入频次,即可根据输入频次,将输入频次排在前的P个输入词汇记录至时间段的热点词集中,时间段内的历史输入词汇中输入频次排在前的P个输入词汇即可以理解为该时间段内的P个热门词汇。在本实施例中,在多个词汇中存在第一时间段的热点词汇的情况下,显示字符串在输入法的候选词,可以为在多个词汇中存在第一时间段的热点词集的热点词汇的情况下,显示字符串在输入法的候选词,即是在第一时间段的热点词集进行多个词汇中进行热点词汇的查找,在多个词汇中存在第一时间段的热点词集的热点词汇可以理解为在多个词汇中存在第一时间段的热点词集的目标热点词汇,即多个词汇包括目标热点词汇,且目标热点词汇属于第一时间段的热点词集,第一时间段的热点词集中包括候选词中目标热点词汇。
在一个示例中,时间段的热点词集与位置区域对应,即时间段的热点词集中包括了该时间段内的历史输入词汇中在对应的位置区域内的输入频次排在前的多个输入词汇。例如,时间段的热点词集可以包括该时间段的第一位置区域的第一热点词集和该时间段的第二位置区域的第二热点词集,则该时间段的第一位置区域的第一热点词集包括了该时间段内的历史输入词汇中在第一位置区域内的输入频次排在前的多个输入词汇,该时间段的第二位置区域的第二热点词集包括了该时间段内的历史输入词汇中在第二位置区域内的输入频次排在前的多个输入词汇。
在本实施例中,预先收集M个时间段的热门词集,为后续多个词汇进行热门词汇的查找提供保障。
在一个实施例中,第一时间段的热点词集包括第一时间段的第一位置区域的第一热点词集和第一时间段的第二位置区域的第二热点词集,所述第一位置区域包括用户输入所述字符串时所在的位置;
在多个词汇中存在第一时间段的热点词汇的情况下,显示字符串在输入法的候选词,包括:
在多个词汇中存在第一热点词集的热点词汇的情况下,显示字符串在输入法的候选词;
或者,在多个词汇中存在第一时间段的热点词汇的情况下,显示字符串在输入法的候选词,包括:在多个词汇中不存在第一热点词集的热点词汇的情况下,根据多个词汇在第二热点词集中进行查找;在多个词汇中存在第二热点词集的热点词汇的情况下,显示字符串在输入法的候选词。
即在本实施例中,首先在第一时间段的第一热点词集中查找与多个词汇相同的热门词汇,即多个词汇中若存在第一热点词集的热点词汇,则显示字符串在输入法的候选词,此时,候选词包括多个词汇中存在于第一热点词集的热点词汇以及至少一个词汇。多个词汇中若不存在第一热点词集的热点词汇,即在第一热点词集中没有与多个词汇中任意一个词汇相同的热点词汇,则需要根据多个词汇在第二热点词集中进行查找,多个词汇中若存在第二热点词集的热点词汇,则显示字符串在输入法的候选词,此时,候选词包括多个词汇中存在于第二热点词集的热点词汇以及至少一个词汇。候选词中热点词汇显示在前,可便于用户选择,提高输入法的效率。
在一个示例中,第二位置区域的级别高于第一位置区域的级别,即第二位置区域覆盖的区域面积大于第一位置区域覆盖的区域面积,且第一位置区域属于第二位置区域。例如,第一位置区域为用户输入字符串所在位置所述的县级地区、市级地区或省级地区等,第二位置区域可以为全国地区。
即在本实施例中,首先在第一位置区域的第一热点词集中进行查找,多个词汇中若存在第一位置区域的第一热点词集的热点词汇,表示在用户输入所述字符串时所在的位置的第一位置区域的第一热点词集中,存在与多个词汇中词汇相同的热点词汇,显示字符串在输入法的候选词即可。多个词汇中若不存在第一位置区域的第一热点词集的热点词汇,则在第二位置区域的第二热点词集中再查找,多个词汇中若存在第二热点词集的热点词汇,表示在用户输入所述字符串时所在的位置的第二位置区域的第二热点词集中,存在与多个词汇中词汇相同的热点词汇,则显示字符串在输入法的候选词。通过不同区域位置的热点词集进行逐级查找多个词汇中的热门词汇,提高多个词汇中热门词汇的准确性。
在一个实施例中,所述热点词汇的数量为I,I为大于1的整数;
所述候选词中I个热点词汇排列于所述至少一个词汇的前面,且所述I个热点词汇的排列顺序与所述I个热点词汇的输入频次正相关。
即多个词汇中存在第一时间段的多个热点词汇,可以理解为多个词汇中包括多个目标热点词汇,多个热点词汇全部排在至少一个词汇的前面,多个热点词汇中的热点词汇的顺序是和其输入频次正相关,输入频次越大,其对应的热点词汇排在越前,如此,不但可确保候选词中第一时间段的多个热点词汇排在前,且多个热点词汇与输入频次正相关,即显示顺序考虑了第一时间段的热点词汇,又考虑了输入频次,如此,有利于用户进行选择,提高输入法的效率。
在一个实施例中,确定字符串匹配的多个词汇之前,还包括:在字符串存在错误的情况下,对字符串进行纠错,得到更新后的字符串;
确定字符串匹配的多个词汇,包括:根据更新后的字符串确定匹配的多个词汇。
用户在输入字符串过程中,可能会存在错误,例如,需要输入“zheng”的字符串,但是由于用户失误,错误输入“zhneg”,不符合拼音语法,则可对字符串进行纠错,得到更新后的字符串。通过输入法可对字符串进行查错,查错方式有多种,不作限定,在检测输入的字符串存在错误的情况下,可对其进行纠错,对字符串进行纠错的方式有多种,在此不作限定。然后根据更新后的字符串确定匹配的多个词汇,提高多个词汇的准确性,从而提高后续候选词的准确性。
下面以一个具体实施例对上述方法的过程加以具体说明。
首先,进行预设时间范围(例如一个月等)内每天的各时间段的热词收集,可以区分成全国级的热词(第二位置区域的热点词集)和地区级的热词(第一位置区域的热点词集)。
全国级的热词:在一天的某一时间段内,在全国都会被多次使用的词汇,比如在每天的早晚高峰,关于拥堵的词汇都应该是高频词,应当把“有点堵”,“非常堵”,“堵车了”等词汇存入全国级的热词。这样,当用户用拼音输入“youdiand”,此时在该时间段,应该给出“有点堵”的候选词,且排序在前。
地区级的热词:在一天的某个时间段,比如在某些地区,早餐大家都爱吃面条,则应当把“吃面条”,“喝面条”等词汇放在地区级的热词,在此时间段,此地区的用户输入“laidianm”,些时应该给出“来点面”的候选词,且排序在前。
然后,热点词汇查找。用户在电子设备的输入法中打开时间热词开关,即表示开启热词查找功能,在获取用户在输入法中输入的字符串之后,可现在词汇集(包括预先记录的多个词语)进行匹配,确定字符串匹配的多个词汇。确定字符串匹配的多个词汇的方法有多种,在此不作限定。然后根据地区级的热词,查找多个词汇中是否存在与地区级的热词相同的热门词汇,若存在,则将该热门词汇作为候选词,且候选词还包括多个词汇中的至少一个词汇。
其次,对候选词进行显示,其中,候选词的热门词汇显示在至少一个词汇的前面,以便于用户选择,提高对词汇选择的效率,从而提高输入法的效率。
通过上述过程,用户只需要打开时间热词开关,输入法即会在输入时间的时间段内,提高该时间段热词的优先级,保证热词排在候选词中至少一个词汇的前面。现有的输入法更像是工具,只能通过用户多次选择,才会把一些候选词提前。本实施例的方法可以让输入法也提前了解这些默认知识,在特定时间段,更理解用户的需求。
请参考图2,本申请提供一种实施例的候选词显示装置200,装置包括:
字符串获取模块201,用于获取用户在输入法中输入的字符串;
确定模块202,用于确定字符串匹配的多个词汇;
显示模块203,用于在多个词汇中存在第一时间段的热点词汇的情况下,显示字符串在输入法的候选词,其中,候选词包括热点词汇,以及还包括多个词汇中的至少一个词汇,且在候选词中热点词汇排列于至少一个词汇的前面,第一时间段包括字符串的输入时间。
在一个实施例中,该装置200,还包括:
词汇获取模块,用于获取在预设历史时间范围内,分别在M个时间段内的历史输入词汇以及对应的输入频次,M为正整数;
记录模块,用于将每个时间段内的历史输入词汇中输入频次排在前的P个输入词汇记录至时间段的热点词集中,P为正整数,M个时间段包括第一时间段,第一时间段的热点词集中包括候选词中热点词汇。
在一个实施例中,所述第一时间段的热点词集包括第一时间段的第一位置区域的第一热点词集和第一时间段的第二位置区域的第二热点词集;
在多个词汇中存在第一时间段的热点词汇的情况下,显示字符串在输入法的候选词,包括:在多个词汇中存在第一热点词集的热点词汇的情况下,显示字符串在输入法的候选词;
或者,在多个词汇中存在第一时间段的热点词汇的情况下,显示字符串在输入法的候选词,包括:在多个词汇中不存在第一热点词集的热点词汇的情况下,根据多个词汇在第二热点词集中进行查找;在多个词汇中存在第二热点词集的热点词汇的情况下,显示字符串在输入法的候选词。
在一个实施例中,热点词汇的数量为I,I为大于1的整数;
候选词中I个热点词汇排列于至少一个词汇的前面,且I个热点词汇的排列顺序与I个热点词汇的输入频次正相关。
在一个实施例中,装置200,还包括:
纠错模块,用于在字符串存在错误的情况下,对字符串进行纠错,得到更新后的字符串;
确定字符串匹配的多个词汇,包括:根据更新后的字符串确定匹配的多个词汇。
上述各实施例的候选词显示装置为实现上述各实施例的候选词显示方法的装置,技术特征对应,技术效果对应,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图3所示,是根据本申请实施例的候选词显示方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图3所示,该电子设备包括:一个或多个处理器301、存储器302,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUM的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图3中以一个处理器301为例。
存储器302即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的候选词显示方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的候选词显示方法。
存储器302作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的候选词显示方法对应的程序指令/模块(例如,附图2所示的字符串获取模块201、确定模块202、显示模块203)。处理器301通过运行存储在存储器302中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的候选词显示方法。
存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据键盘显示的电子设备的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至键盘显示的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
候选词显示方法的电子设备还可以包括:候选词显示装置303和输出装置304。处理器301、存储器302、候选词显示装置303和输出装置304可以通过总线或者其他方式连接,图3中以通过总线连接为例。
候选词显示装置303可接收输入的数字或字符信息,以及产生与键盘显示的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等候选词显示装置。输出装置304可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASMC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个候选词显示装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个候选词显示装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,能够确定字符串匹配的多个词汇,在在多个词汇中存在第一时间段的热点词汇的情况下,显示的候选词中热点词汇排列在多个词汇中至少一个词汇的前面,即显示的候选词中第一时间段的热点词汇排在前,用户无需进行多次选择来调整候选词,只需要根据字符串的输入时间,在多个词汇中存在输入时间所属的第一时间段的热点词汇的情况下,将该热点词汇排在候选词中至少一个词汇的前面即可,便于用户选择输入,提高输入法的效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (10)

1.一种候选词显示方法,其特征在于,所述方法包括:
获取用户在输入法中输入的字符串;
确定所述字符串匹配的多个词汇;
在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,其中,所述候选词包括所述热点词汇,以及还包括所述多个词汇中的至少一个词汇,且在所述候选词中所述热点词汇排列于所述至少一个词汇的前面,所述第一时间段包括所述字符串的输入时间;
其中,所述第一时间段的热点词集包括所述第一时间段的第一位置区域的第一热点词集和所述第一时间段的第二位置区域的第二热点词集;
所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中存在所述第一热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词;
或者,所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中不存在所述第一热点词集的热点词汇的情况下,根据所述多个词汇在所述第二热点词集中进行查找;在所述多个词汇中存在所述第二热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词。
2.根据权利要求1所述的方法,其特征在于,所述获取用户在输入法中输入的字符串之前,还包括:
获取在预设历史时间范围内,分别在M个时间段内的历史输入词汇以及对应的输入频次,M为正整数;
将每个时间段内的历史输入词汇中输入频次排在前的P个输入词汇记录至所述时间段的热点词集中,P为正整数,所述M个时间段包括所述第一时间段,所述第一时间段的热点词集中包括所述候选词中所述热点词汇。
3.根据权利要求1所述的方法,其特征在于,所述热点词汇的数量为I,I为大于1的整数;
所述候选词中I个热点词汇排列于所述至少一个词汇的前面,且所述I个热点词汇的排列顺序与所述I个热点词汇的输入频次正相关。
4.根据权利要求1所述的方法,其特征在于,所述确定所述字符串匹配的多个词汇之前,还包括:
在所述字符串存在错误的情况下,对所述字符串进行纠错,得到更新后的字符串;
所述确定所述字符串匹配的多个词汇,包括:
根据所述更新后的字符串确定匹配的所述多个词汇。
5.一种候选词显示装置,其特征在于,所述装置包括:
字符串获取模块,用于获取用户在输入法中输入的字符串;
确定模块,用于确定所述字符串匹配的多个词汇;
显示模块,用于在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,其中,所述候选词包括所述热点词汇,以及还包括所述多个词汇中的至少一个词汇,且在所述候选词中所述热点词汇排列于所述至少一个词汇的前面,所述第一时间段包括所述字符串的输入时间;
其中,所述第一时间段的热点词集包括所述第一时间段的第一位置区域的第一热点词集和所述第一时间段的第二位置区域的第二热点词集;
所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中存在所述第一热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词;
或者,所述在所述多个词汇中存在第一时间段的热点词汇的情况下,显示所述字符串在所述输入法的候选词,包括:在所述多个词汇中不存在所述第一热点词集的热点词汇的情况下,根据所述多个词汇在所述第二热点词集中进行查找;在所述多个词汇中存在所述第二热点词集的热点词汇的情况下,显示所述字符串在所述输入法的候选词。
6.根据权利要求5所述的装置,其特征在于,还包括:
词汇获取模块,用于获取在预设历史时间范围内,分别在M个时间段内的历史输入词汇以及对应的输入频次,M为正整数;
记录模块,用于将每个时间段内的历史输入词汇中输入频次排在前的P个输入词汇记录至所述时间段的热点词集中,P为正整数,所述M个时间段包括所述第一时间段,所述第一时间段的热点词集中包括所述候选词中所述热点词汇。
7.根据权利要求5所述的装置,其特征在于,所述热点词汇的数量为I,I为大于1的整数;
所述候选词中I个热点词汇排列于所述至少一个词汇的前面,且所述I个热点词汇的排列顺序与所述I个热点词汇的输入频次正相关。
8.根据权利要求5所述的装置,其特征在于,还包括:
纠错模块,用于在所述字符串存在错误的情况下,对所述字符串进行纠错,得到更新后的字符串;
所述确定所述字符串匹配的多个词汇,包括:根据所述更新后的字符串确定匹配的所述多个词汇。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-4任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行如权利要求1-4任一项所述的方法。
CN202010148929.4A 2020-03-05 2020-03-05 一种候选词显示方法、装置以及电子设备 Active CN111399666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010148929.4A CN111399666B (zh) 2020-03-05 2020-03-05 一种候选词显示方法、装置以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010148929.4A CN111399666B (zh) 2020-03-05 2020-03-05 一种候选词显示方法、装置以及电子设备

Publications (2)

Publication Number Publication Date
CN111399666A CN111399666A (zh) 2020-07-10
CN111399666B true CN111399666B (zh) 2023-07-21

Family

ID=71436286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010148929.4A Active CN111399666B (zh) 2020-03-05 2020-03-05 一种候选词显示方法、装置以及电子设备

Country Status (1)

Country Link
CN (1) CN111399666B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761141A (zh) * 2020-09-03 2021-12-07 北京沃东天骏信息技术有限公司 一种词条显示方法、装置、电子设备以及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005055782A (ja) * 2003-08-07 2005-03-03 Sharp Corp データ入力装置、ハンディターミナル、データ入力方法、プログラム及び記録媒体
JP2008059389A (ja) * 2006-08-31 2008-03-13 Mizuho Information & Research Institute Inc 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
CN107450742A (zh) * 2016-06-01 2017-12-08 中国移动通信有限公司研究院 一种信息处理方法、装置及终端

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3799839B2 (ja) * 1998-10-06 2006-07-19 セイコーエプソン株式会社 データ入力装置、データの入力方法、および記録媒体
JP4694579B2 (ja) * 2007-04-11 2011-06-08 株式会社フェイビー 文字入力システム
CN103870001B (zh) * 2012-12-11 2018-07-10 百度国际科技(深圳)有限公司 一种生成输入法候选项的方法及电子装置
CN103869998B (zh) * 2012-12-11 2018-05-01 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
CN103226393B (zh) * 2013-04-12 2016-05-18 百度在线网络技术(北京)有限公司 一种输入方法和设备
CN104699265A (zh) * 2015-03-20 2015-06-10 上海触乐信息科技有限公司 文本输入方法和装置
CN104932786A (zh) * 2015-06-02 2015-09-23 百度在线网络技术(北京)有限公司 一种用于呈现候选词序列的方法和装置
CN106406565A (zh) * 2016-09-29 2017-02-15 维沃移动通信有限公司 一种移动终端词汇输入方法及移动终端
CN107918496B (zh) * 2016-10-10 2021-10-22 北京搜狗科技发展有限公司 一种输入纠错方法和装置、一种用于输入纠错的装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005055782A (ja) * 2003-08-07 2005-03-03 Sharp Corp データ入力装置、ハンディターミナル、データ入力方法、プログラム及び記録媒体
JP2008059389A (ja) * 2006-08-31 2008-03-13 Mizuho Information & Research Institute Inc 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
CN107450742A (zh) * 2016-06-01 2017-12-08 中国移动通信有限公司研究院 一种信息处理方法、装置及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
哈萨克文网络热点关键词提取方法研究;胡冰瑶;《计算机应用与 软件》;全文 *

Also Published As

Publication number Publication date
CN111399666A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
JP7369740B2 (ja) 検索語の推薦方法と装置、目的モデルの訓練方法と装置、電子デバイス、記憶媒体、及びプログラム
JP2021131528A (ja) ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111091006B (zh) 一种实体意图体系的建立方法、装置、设备和介质
JP7300475B2 (ja) エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN112015468B (zh) 一种接口文档处理方法、装置、电子设备以及存储介质
CN110888926A (zh) 医疗文本结构化的方法以及装置
CN111435406A (zh) 一种纠正数据库语句拼写错误的方法和装置
JP2024507902A (ja) 情報検索方法、装置、電子機器および記憶媒体
CN111399666B (zh) 一种候选词显示方法、装置以及电子设备
JP7241122B2 (ja) スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
CN111666417B (zh) 生成同义词的方法、装置、电子设备以及可读存储介质
EP3933619A1 (en) Data update method and device, search server, terminal, and storage medium
US20210216710A1 (en) Method and apparatus for performing word segmentation on text, device, and medium
US11462013B2 (en) Method and apparatus for recognizing target object, electronic device and storage medium
CN111522863B (zh) 一种主题概念挖掘方法、装置、设备以及存储介质
CN111259058B (zh) 数据挖掘方法、数据挖掘装置和电子设备
CN111881339B (zh) 资源信息的推送、通知方法、装置、电子设备及存储介质
EP3842961A2 (en) Method and apparatus for mining tag, device, storage medium and computer program product
CN111665956B (zh) 候选字符串的处理方法、装置、电子设备及存储介质
CN111782633B (zh) 数据处理方法、装置及电子设备
CN112446728B (zh) 广告召回方法、装置、设备及存储介质
CN114595391A (zh) 基于信息搜索的数据处理方法、装置和电子设备
CN112632212A (zh) 一种待翻译词条的更新方法、装置、设备和介质
CN111966432A (zh) 验证码处理方法、装置、电子设备以及存储介质
CN111367424A (zh) 信息候选项智能化调整方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210511

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant