CN109669549B - 候选内容生成方法和装置、用于候选内容生成的装置 - Google Patents

候选内容生成方法和装置、用于候选内容生成的装置 Download PDF

Info

Publication number
CN109669549B
CN109669549B CN201710962246.0A CN201710962246A CN109669549B CN 109669549 B CN109669549 B CN 109669549B CN 201710962246 A CN201710962246 A CN 201710962246A CN 109669549 B CN109669549 B CN 109669549B
Authority
CN
China
Prior art keywords
candidate
word
content
fuzzy
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710962246.0A
Other languages
English (en)
Other versions
CN109669549A (zh
Inventor
涂畅
张扬
王砚峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201710962246.0A priority Critical patent/CN109669549B/zh
Publication of CN109669549A publication Critical patent/CN109669549A/zh
Application granted granted Critical
Publication of CN109669549B publication Critical patent/CN109669549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例提供了一种候选内容生成方法及装置,其中所述方法包括识别初始候选内容中的模糊候选词,获取与所述模糊候选词匹配的至少一个目标候选词,根据所述至少一个目标候选词生成至少一个目标候选内容,使得可以根据输入的初始候选内容,查获到目标候选词,并修改候选内容,解决了由于用户输入不完整,用户无法直接完整的输入想要表达的词语、句子等内容的问题。

Description

候选内容生成方法和装置、用于候选内容生成的装置
技术领域
本申请涉及输入法技术领域,特别是涉及一种候选内容生成方法、一种候选内容生成装置和一种用于候选内容生成的装置。
背景技术
目前的输入法中,根据用户提交的字符串可以从系统词库、用户词库、细胞词库等本地词库中,查找匹配的候选词并展示。
用户在输入过程中,经常会由于记忆模糊、无法想起一些成语、俗语、流行语的完整表达。例如,成语“庖丁解牛”,有的用户只能想起是“庖丁什么牛”,成语“指鹿为马”,有的用户只能想起是“什么鹿为马”,成语“吃一堑长一智”,有的用户只能想起是“吃一啥长一智”等等。
鉴于上述原因,输入过程中,用户无法直接完整的输入想要表达的词语、句子等。
发明内容
鉴于上述问题,本申请实施例提出了一种克服上述问题或者至少部分地解决上述问题的候选内容生成方法、候选内容生成装置和用于候选内容生成的装置,本申请实施例能够解决了由于用户输入不完整,用户无法直接完整的输入想要表达的词语、句子等内容的问题。
为了解决上述问题,本申请公开了一种候选内容生成方法,包括:
识别初始候选内容中的模糊候选词;
查找与所述模糊候选词匹配的至少一个目标候选词;
根据所述至少一个目标候选词生成至少一个目标候选内容。
可选地,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
可选地,所述将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词包括:
在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
可选地,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;
若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
可选地,在所述查找与所述模糊候选词匹配的至少一个目标候选词之前,所述方法还包括:
识别所述初始候选内容的语义是否明确。
可选地,在所述识别初始候选内容中的模糊候选词之前,所述方法还包括:
根据历史输入记录确定至少一个所述预设替补词语。
可选地,所述查找与所述模糊候选词匹配的至少一个目标候选词包括:
在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
可选地,所述根据所述至少一个目标候选词生成至少一个目标候选内容包括:
将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
可选地,在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,所述方法还包括:
根据所述目标候选内容,修正所述初始候选内容。
可选地,在所述根据所述目标候选内容,修正所述初始候选内容之前,所述方法还包括:
提示用户所述初始候选内容中的模糊候选词可以被替换。
本申请实施例还公开了一种候选内容生成装置,其特征在于,包括:
候选词识别模块,用于识别初始候选内容中的模糊候选词;
候选词获取模块,用于获取与所述模糊候选词匹配的至少一个目标候选词;
内容生成模块,用于根据所述至少一个目标候选词生成至少一个目标候选内容。
可选地,所述模糊候选词包含预设替补词语,所述候选词识别模块包括:
第一词语判断子模块,用于判断所述初始候选内容是否包含至少一个所述预设替补词语;
第一模糊词确定子模块,用于若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
可选地,第一模糊词确定子模块包括:
词语查找单元,用于在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
候选词组合单元,用于将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
可选地,所述模糊候选词包含预设替补词语,所述候选词识别模块包括:
第二词语判断子模块,用于判断所述初始候选内容是否包含至少一个所述预设替补词语;
候选词确定子模块,用于若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
可选地,所述装置还包括:
语义识别模块,用于在所述查找与所述模糊候选词匹配的至少一个目标候选词之前,识别所述初始候选内容的语义是否明确。
可选地,所述装置还包括:
词语确定模块,用于在所述识别初始候选内容中的模糊候选词之前,根据历史输入记录确定至少一个所述预设替补词语。
可选地,所述候选词查找模块,具体用于在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
可选地,所述内容生成模块,具体用于将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
可选地,所述装置还包括:
内容修正模块,用于在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,根据所述目标候选内容,修正所述初始候选内容。
可选地,所述装置还包括:
提示模块,用于在所述根据所述目标候选内容,修正所述初始候选内容之前,提示用户所述初始候选内容中的模糊候选词可以被替换。
本申请实施例还公开了一种用于候选内容生成的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
识别初始候选内容中的模糊候选词;
获取与所述模糊候选词匹配的至少一个目标候选词;
根据所述至少一个目标候选词生成至少一个目标候选内容。
可选地,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
可选地,所述将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词包括:
在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
可选地,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;
若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
可选地,在所述查找与所述模糊候选词匹配的至少一个目标候选词之前,所述方法还包括:
识别所述初始候选内容的语义是否明确。
可选地,在所述识别初始候选内容中的模糊候选词之前,所述方法还包括:
根据历史输入记录确定至少一个所述预设替补词语。
可选地,所述查找与所述模糊候选词匹配的至少一个目标候选词包括:
在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
可选地,所述根据所述至少一个目标候选词生成至少一个目标候选内容包括:
将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
可选地,在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,所述方法还包括:
根据所述目标候选内容,修正所述初始候选内容。
可选地,在所述根据所述目标候选内容,修正所述初始候选内容之前,所述方法还包括:
提示用户所述初始候选内容中的模糊候选词可以被替换。
本申请实施例包括以下优点:
本申请实施例可以通过识别初始候选内容中的模糊候选词,获取与所述模糊候选词匹配的至少一个目标候选词,根据所述至少一个目标候选词生成至少一个目标候选内容,使得可以根据输入的初始候选内容,查获到目标候选词,并修改候选内容,解决了由于用户输入不完整,用户无法直接完整的输入想要表达的词语、句子等内容的问题。
附图说明
图1示出了本申请的一种候选内容生成方法实施例一的步骤流程图;
图2示出了本申请的一种候选内容生成法实施例二的步骤流程图;
图3示出了本申请的一种候选内容生成装置实施例的结构框图;
图4是根据一示例性实施例示出的一种用于候选内容生成的装置的框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例提供了一种候选内容生成方法,该方法可以根据用户输入字符串对应的初始候选内容,按照预定规则识别出初始候选内容中有由预设替补词语组成的模糊候选词,根据模糊候选词匹配为归属词库中的目标候选词,以目标候选词替换模糊候选词,生成目标候选内容,解决了由于用户输入不完整,用户无法直接完整的输入想要表达的词语、句子等内容的问题。
参照图1,示出了本申请的一种候选内容生成方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101,识别初始候选内容中的模糊候选词。
初始候选内容包括根据输入的字符串、输入法从词库中查找与字符串匹配的,作为输入候选的词语、短语、句子等。输入方式可以包括手动输入、语音输入等,或者其他任意适用的方式。例如,用户提交拼音串“qiaorupaodingshenmeniu”,则初始候选内容可以包括:“巧如庖丁什么牛”。初始候选内容可能存在多个,本申请实施例对此不做限制。
模糊候选词是指语义不明确、没有得到完整表达的内容,或者可能语义不明确、没有得到完整表达的内容,例如,“庖丁什么牛”、“庖丁啥牛”、“庖丁什么牛”中的“什么”、“庖丁啥牛”中的“啥”等,或者其他任意适用的内容,本申请实施例对此不做限制。
在本申请实施例中,初始候选内容为根据输入的字符串确定的,其中可以包括准确并完整匹配的部分,也可以包括没有准确并完整匹配的部分,例如,句子“巧如庖丁什么牛”中,“巧如”是完整表达的,但“庖丁什么牛”是没有完整表达的,“庖丁什么牛”就是模糊候选词。
在本申请实施例中,识别模糊候选词的方式可以有多种,例如,基于自然语言处理技术,针对初始候选内容中各个部分,分别判断是否符合语言表达习惯,选取出自然语言的语法和语义规则的置信度最低的部分作为模糊候选词。具体可以包括任意适用的识别方式,本申请实施例对此不做限制。
在本申请的一种可选实施例中,预设替补词语是指预先设置的可以用于替补表达中不清楚的词的词语,例如,“什么”、“啥”等,或者其他任意适用的词语,本申请实施例对此不做限制。在初始候选内容中检测到预设替补词语,检测到预设替补词语后,可以将初始候选内容的全部作为模糊候选词,也可以将初始候选内容的部分作为模糊候选词。
识别初始候选内容中的模糊候选词的一种实现方式包括:判断初始候选内容是否包含至少一个预设替补词语,若初始候选内容包含至少一个预设替补词语,将初始候选内容作为模糊候选词。例如,初始候选内容为“巧如庖丁什么牛”,判断其中是否包含预设替补词语“什么”,如果包含,则将“巧如庖丁什么牛”作为模糊候选词。
步骤102,查找与所述模糊候选词匹配的至少一个目标候选词。
在本申请实施例中,目标候选词包括完整表达的内容,例如,“庖丁解牛”,或者其他任意适用的候选词,本申请实施例对此不做限制。根据模糊候选词进行匹配,可能匹配到一个目标候选词,也可能匹配到多个目标候选词,本申请实施例对此不做限制。
具体地,根据模糊候选词中除预设替补词语之外的部分,与本地词库或网络词库中的词语、词组、短语、句子等进行匹配,如果可以部分匹配,则将匹配到的词语、词组、短语、句子等,确定为目标候选词。例如,成语词库中的成语、专业用语词库中的专业用语、常用语词库中的常用短语、流行网络用语库中流行语等,或者其他任意适用的候选词,本申请实施例对此不做限制。
例如,根据模糊候选词,在成语词库中查找可以部分匹配的成语,获取匹配到的完整的成语,确定为目标候选词。
步骤103,根据所述至少一个目标候选词生成至少一个目标候选内容。
在本申请实施例中,针对初始候选内容,可以根据至少一个目标候选词,对应生成至少一个目标候选内容,具体可以将针对其中每一个目标候选词,生成对应的目标候选内容,也可以根据初始候选内容,针对其中部分目标候选词,生成对应的目标候选内容,本申请实施例对此不做限制。
一种实现方式中,模糊候选词为初始候选内容的一部分时,以目标候选词替换初始候选内容中的模糊候选词,保留除模糊候选词以外的部分,生成目标候选内容,例如,初始候选内容为“巧如庖丁什么牛”,模糊候选词为“庖丁什么牛”,匹配到的目标候选词为“庖丁解牛”,以目标候选词替换模糊候选词,生成的目标候选内容为“巧如庖丁解牛”。
另一种实现方式中,模糊候选词为初始候选内容的全部时,将初始候选内容中可以匹配到目标候选词的部分,以及预设替换词语,替换为目标候选词,保留不能匹配到目标候选词的部分,生成目标候选内容,例如,初始候选内容为“巧如庖丁什么牛”,模糊候选词也为“巧如庖丁什么牛”,模糊候选词可以匹配的目标候选词“庖丁解牛”,因为模糊候选词中“巧如”不属于匹配的部分,保留“巧如”,生成的目标候选内容为“巧如庖丁解牛”。
综上所述,依据本申请实施例,通过识别初始候选内容中的模糊候选词,获取与所述模糊候选词匹配的至少一个目标候选词,根据所述至少一个目标候选词生成至少一个目标候选内容,使得可以根据输入的初始候选内容,查获到目标候选词,并修改候选内容,解决了由于用户输入不完整,用户无法直接完整的输入想要表达的词语、句子等内容的问题。
在本申请的一种可选实施例中,在所述识别初始候选内容中的模糊候选词之前,还可以包括:根据历史输入记录确定至少一个所述预设替补词语。历史输入记录包括至少一个用户的历史输入的内容。具体可以针对多个用户,根据多个用户的历史输入记录,统计多个用户没有完整输入的内容中,用于换缺失部分的替补词语,根据统计结果,将高于预设频次的替补词语确定为预设替补词语。或者可以针对单个用户,根据用户自身的历史输入记录,统计用户没有完整输入的内容中,用于替换缺失部分的替补词语,为用户自身确定为预设替补词语。
在本申请的一种可选实施例中,预设替补词语还可以是用户自定义设置的,或者输入法预先设置的,或者其他任意适用的方式,本申请实施例对此不做限制。
在本申请的一种可选实施例中,在所述查找与所述模糊候选词匹配的至少一个目标候选词之前,还可以包括:识别所述初始候选内容的语义是否明确。初始候选内容中有模糊候选词,对初始候选内容的语义进行分析,得知语义是不明确的,则需要执行步骤102和步骤103来生成目标候选内容,否则不需要生成目标候选内容。例如,用户输入“今天吃什么东西”,识别到初始候选内容中包含预设替补词语“什么”,将初始候选内容“今天吃什么东西”作为模糊候选词,但是对初始候选内容进行语义分析,得到初始候选内容的语义是明确的,则不再查找目标候选词。
在本申请的另一种可选实施例中,识别初始候选内容的语义是明确的,也可以执行步骤102和步骤103来生成目标候选内容,并在候选框中显示出目标候选内容,作为备选项供用户选择。
参照图2,示出了本申请的一种候选内容生成方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201,判断所述初始候选内容是否包含至少一个所述预设替补词语。
在本申请实施例中,初始候选内容可以包括一个或多个,针对各个初始候选内容进行判断,检测其包含的内容,判断其中是否包含至少一个预设替补词语,初始候选内容中可以包含一个或多个预设替补词语,本申请实施例对此不做限制。
步骤202,若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
在本申请实施例中,如果初始候选内容包含至少一个所述预设替补词语,则需要对初始候选内容中,预设替补词语前后的内容进行分析,确定包含至少一个预设替补词语的模糊内容,并将模糊内容确定为模糊候选词,具体可能是一个预设替补词语对应一个模糊内容,或者可能是多个预设替补词语对应一个模糊内容,本申请实施例对此不做限制。确定模糊内容的方式可以有多种,例如,对预设替补词语前后的语义进行分析,判断预设替补词语的前后是否有语义模糊的表达,将预设替补词语及其前后有语义模糊的表达一起作为模糊内容,或者仅将预设替补词语作为模糊内容,将模糊内容确定为模糊候选词。具体可以包括其他任意适用的方式,本申请实施例对此不做限制。
在本申请的一种可选实施例中,预设候选集合用于根据用户输入提供候选词,例如,用户词库、系统词库、成语词库、网络词库等,或者其他任意适用的集合,本申请实施例对此不做限制。不完整候选词语包括对应于预设候选集合中预设候选词语的不完整的词语,是完整词语的一部分,例如,“庖丁”和“牛”。将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词的一种实现方式包括:在所述初始候选内容中,查找归属于预设候选集合的不完整候选词语,将所述预设替补词语和不完整候选词语组合在一起识别为模糊候选词。例如,“庖丁什么牛”或者“庖丁牛什么”,或者其他任意适用的组合方式,本申请实施例对此不做限制。
步骤203,在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
在本申请实施例中,在预设候选集合中,根据字符匹配,查找与模糊候选词部分相同的目标候选词,查找到的目标候选词可以有一个或多个。
步骤204,将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
在本申请实施例中,模糊候选词为初始候选内容的一部分,将模糊候选词替换为目标候选词,保留除模糊候选词的其他部分,生成目标候选内容。
步骤205,提示用户所述初始候选内容中的模糊候选词可以被替换。
在本申请实施例中,为用户提供初始候选内容和目标候选内容时,其中一种方式可以在候选框中展示初始候选内容时,标记出模糊候选词,例如,高亮显示模糊候选词,提示用户可以替换。
在本申请的一种可选实施例中,还可以将初始候选内容和目标候选内容都作为候选项,同时展示给用户,或者其他任意适用的展示方式,本申请实施例对此不做限制。
在本申请的一种可选实施例中,还可以为用户提供一个功能选项,用以开启或关闭目标候选内容的生成与展示,在用户开启该功能后,则在用户输入内容时,根据初始候选内容,生成目标候选内容,并都展示给用户,以供用户选择。
步骤206,根据所述目标候选内容,修正所述初始候选内容。
在本申请实施例中,在用户根据提示选择了替换后,将原来的初始候选内容,修正为目标候选内容。
综上所述,依据本申请实施例,通过判断所述初始候选内容是否包含至少一个所述预设替补词语,若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的语义不完整内容确定为模糊候选词,在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词,将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容,提示用户所述初始候选内容中的模糊候选词可以被替换,根据所述目标候选内容,修正所述初始候选内容,使得可以根据输入的包含预设替补词语的不完整的候选词,查获到完整的候选词,并修改候选内容,解决了由于用户输入不完整,用户无法直接完整的输入想要表达的词语、句子等内容的问题。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的运动动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的运动动作并不一定是本申请实施例所必须的。
参照图3,示出了本申请的一种候选内容生成装置实施例的结构框图,具体可以包括:
候选词识别模块301,用于识别初始候选内容中的模糊候选词;
候选词查找模块302,用于查找与所述模糊候选词匹配的至少一个目标候选词;
内容生成模块303,用于根据所述至少一个目标候选词生成至少一个目标候选内容。
可选地,所述模糊候选词包含预设替补词语,所述候选词识别模块包括:
第一词语判断子模块,用于判断所述初始候选内容是否包含至少一个所述预设替补词语;
第一模糊词确定子模块,用于若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
可选地,第一模糊词确定子模块包括:
词语查找单元,用于在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
候选词组合单元,用于将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
可选地,所述模糊候选词包含预设替补词语,所述候选词识别模块包括:
第二词语判断子模块,用于判断所述初始候选内容是否包含至少一个所述预设替补词语;
候选词确定子模块,用于若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
可选地,所述装置还包括:
语义识别模块,用于在所述查找与所述模糊候选词匹配的至少一个目标候选词之前,识别所述初始候选内容的语义是否明确。
可选地,所述装置还包括:
词语确定模块,用于在所述识别初始候选内容中的模糊候选词之前,根据历史输入记录确定至少一个所述预设替补词语。
可选地,所述候选词查找模块,具体用于在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
可选地,所述内容生成模块,具体用于将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
可选地,所述装置还包括:
内容修正模块,用于在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,根据所述目标候选内容,修正所述初始候选内容。
可选地,所述装置还包括:
提示模块,用于在所述根据所述目标候选内容,修正所述初始候选内容之前,提示用户所述初始候选内容中的模糊候选词可以被替换。
综上所述,依据本申请实施例,通过识别初始候选内容中的模糊候选词,获取与所述模糊候选词匹配的至少一个目标候选词,根据所述至少一个目标候选词生成至少一个目标候选内容,使得可以根据输入的初始候选内容,查获到目标候选词,并修改候选内容,解决了由于用户输入不完整,用户无法直接完整的输入想要表达的词语、句子等内容的问题。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图4是根据一示例性实施例示出的一种用于候选内容生成的装置400的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理部件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑行操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(智能终端或者服务器)的处理器执行时,使得装置能够执行一种候选内容生成方法,所述方法包括:
识别初始候选内容中的模糊候选词;
查找与所述模糊候选词匹配的至少一个目标候选词;
根据所述至少一个目标候选词生成至少一个目标候选内容。
可选地,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;
若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
可选地,所述将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词包括:
在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
可选地,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;
若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
可选地,在所述查找与所述模糊候选词匹配的至少一个目标候选词之前,所述方法还包括:
识别所述初始候选内容的语义是否明确。
可选地,在所述识别初始候选内容中的模糊候选词之前,所述方法还包括:
根据历史输入记录确定至少一个所述预设替补词语。
可选地,所述查找与所述模糊候选词匹配的至少一个目标候选词包括:
在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
可选地,所述根据所述至少一个目标候选词生成至少一个目标候选内容包括:
将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
可选地,在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,所述方法还包括:
根据所述目标候选内容,修正所述初始候选内容。
可选地,在所述根据所述目标候选内容,修正所述初始候选内容之前,所述方法还包括:
提示用户所述初始候选内容中的模糊候选词可以被替换。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本申请所提供的一种候选内容生成方法、一种候选内容生成装置和一种用于候选内容生成的装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (28)

1.一种候选内容生成方法,其特征在于,包括:
识别初始候选内容中的模糊候选词,所述模糊候选词包括预设替补词语;
当识别出所述初始候选内容的语义是不明确的时,查找与所述模糊候选词匹配的至少一个目标候选词;
根据所述至少一个目标候选词生成至少一个目标候选内容;
当识别出所述初始候选内容的语义是明确的时,则不查找目标候选词。
2.根据权利要求1所述的方法,其特征在于,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
3.根据权利要求2所述的方法,其特征在于,所述将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词包括:
在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
4.根据权利要求1所述的方法,其特征在于,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;
若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
5.根据权利要求2-4任一项所述的方法,其特征在于,在所述识别初始候选内容中的模糊候选词之前,所述方法还包括:
根据历史输入记录确定至少一个所述预设替补词语。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述查找与所述模糊候选词匹配的至少一个目标候选词包括:
在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
7.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个目标候选词生成至少一个目标候选内容包括:
将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
8.根据权利要求1所述的方法,其特征在于,在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,所述方法还包括:
根据所述目标候选内容,修正所述初始候选内容。
9.根据权利要求8所述的方法,其特征在于,在所述根据所述目标候选内容,修正所述初始候选内容之前,所述方法还包括:
提示用户所述初始候选内容中的模糊候选词可以被替换。
10.一种候选内容生成装置,其特征在于,包括:
候选词识别模块,用于识别初始候选内容中的模糊候选词,所述模糊候选词包括预设替补词语;
语义识别模块,用于在查找与所述模糊候选词匹配的至少一个目标候选词之前,识别所述初始候选内容的语义是否明确;
候选词查找模块,用于查找与所述模糊候选词匹配的至少一个目标候选词;
内容生成模块,用于根据所述至少一个目标候选词生成至少一个目标候选内容。
11.根据权利要求10所述的装置,其特征在于,所述模糊候选词包含预设替补词语,所述候选词识别模块包括:
第一词语判断子模块,用于判断所述初始候选内容是否包含至少一个所述预设替补词语;
第一模糊词确定子模块,用于若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
12.根据权利要求11所述的装置,其特征在于,第一模糊词确定子模块包括:
词语查找单元,用于在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
候选词组合单元,用于将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
13.根据权利要求10所述的装置,其特征在于,所述模糊候选词包含预设替补词语,所述候选词识别模块包括:
第二词语判断子模块,用于判断所述初始候选内容是否包含至少一个所述预设替补词语;
候选词确定子模块,用于若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
14.根据权利要求11-13任一项所述的装置,其特征在于,所述装置还包括:
词语确定模块,用于在所述识别初始候选内容中的模糊候选词之前,根据历史输入记录确定至少一个所述预设替补词语。
15.根据权利要求10-13任一项所述的装置,其特征在于,所述候选词查找模块,具体用于在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
16.根据权利要求10所述的装置,其特征在于,所述内容生成模块,具体用于将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
17.根据权利要求10所述的装置,其特征在于,所述装置还包括:
内容修正模块,用于在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,根据所述目标候选内容,修正所述初始候选内容。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括:
提示模块,用于在所述根据所述目标候选内容,修正所述初始候选内容之前,提示用户所述初始候选内容中的模糊候选词可以被替换。
19.一种用于候选内容生成的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
识别初始候选内容中的模糊候选词,所述模糊候选词包括预设替补词语;
当识别出所述初始候选内容的语义是不明确的时,获取与所述模糊候选词匹配的至少一个目标候选词;
根据所述至少一个目标候选词生成至少一个目标候选内容;
当识别出所述初始候选内容的语义是明确的时,则不查找目标候选词。
20.根据权利要求19所述的装置,其特征在于,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;若所述初始候选内容包含至少一个所述预设替补词语,将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词。
21.根据权利要求20所述的装置,其特征在于,所述将包含所述至少一个预设替补词语的模糊内容确定为模糊候选词包括:
在所述初始候选内容中查找归属于预设候选集合的不完整候选词语;
将所述预设替补词语和所述不完整候选词语组合为模糊候选词。
22.根据权利要求19所述的装置,其特征在于,所述模糊候选词包含预设替补词语,所述识别初始候选内容中的模糊候选词包括:
判断所述初始候选内容是否包含至少一个所述预设替补词语;
若所述初始候选内容包含至少一个所述预设替补词语,将所述初始候选内容作为模糊候选词。
23.根据权利要求20-22任一项所述的装置,其特征在于,在所述识别初始候选内容中的模糊候选词之前,所述装置还包括:
根据历史输入记录确定至少一个所述预设替补词语。
24.根据权利要求19-22任一项所述的装置,其特征在于,所述查找与所述模糊候选词匹配的至少一个目标候选词包括:
在预设候选集合中查找与所述模糊候选词匹配的至少一个目标候选词。
25.根据权利要求19所述的装置,其特征在于,所述根据所述至少一个目标候选词生成至少一个目标候选内容包括:
将所述初始候选内容中的模糊候选词替换为目标候选词,生成目标候选内容。
26.根据权利要求19所述的装置,其特征在于,在所述根据所述至少一个目标候选词生成至少一个目标候选内容之后,所述装置还包括:
根据所述目标候选内容,修正所述初始候选内容。
27.根据权利要求26所述的装置,其特征在于,在所述根据所述目标候选内容,修正所述初始候选内容之前,所述装置还包括:
提示用户所述初始候选内容中的模糊候选词可以被替换。
28.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至9中一个或多个所述的候选内容生成方法。
CN201710962246.0A 2017-10-16 2017-10-16 候选内容生成方法和装置、用于候选内容生成的装置 Active CN109669549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710962246.0A CN109669549B (zh) 2017-10-16 2017-10-16 候选内容生成方法和装置、用于候选内容生成的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710962246.0A CN109669549B (zh) 2017-10-16 2017-10-16 候选内容生成方法和装置、用于候选内容生成的装置

Publications (2)

Publication Number Publication Date
CN109669549A CN109669549A (zh) 2019-04-23
CN109669549B true CN109669549B (zh) 2023-04-28

Family

ID=66139397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710962246.0A Active CN109669549B (zh) 2017-10-16 2017-10-16 候选内容生成方法和装置、用于候选内容生成的装置

Country Status (1)

Country Link
CN (1) CN109669549B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117549A1 (en) * 2013-01-29 2014-08-07 Tencent Technology (Shenzhen) Company Limited Method and device for error correction model training and text error correction
CN104951099A (zh) * 2015-06-16 2015-09-30 北京奇虎科技有限公司 一种基于输入法的展示候选项的方法和装置
CN106648134A (zh) * 2016-10-14 2017-05-10 北京搜狗科技发展有限公司 一种输入方法及装置
CN106774969A (zh) * 2015-11-20 2017-05-31 北京搜狗科技发展有限公司 一种输入方法和装置
CN106896932A (zh) * 2016-06-07 2017-06-27 阿里巴巴集团控股有限公司 一种候选词推荐方法及装置
CN106896936A (zh) * 2017-02-24 2017-06-27 百度在线网络技术(北京)有限公司 词汇推送方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140214401A1 (en) * 2013-01-29 2014-07-31 Tencent Technology (Shenzhen) Company Limited Method and device for error correction model training and text error correction
CN104317851A (zh) * 2014-10-14 2015-01-28 小米科技有限责任公司 词汇提示方法和装置
CN107102746B (zh) * 2016-02-19 2023-03-24 北京搜狗科技发展有限公司 候选词生成方法、装置以及用于候选词生成的装置
CN106339105A (zh) * 2016-08-25 2017-01-18 百度在线网络技术(北京)有限公司 用于识别拼音信息的方法及装置
CN107247519B (zh) * 2017-08-16 2020-09-29 北京搜狗科技发展有限公司 一种输入方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117549A1 (en) * 2013-01-29 2014-08-07 Tencent Technology (Shenzhen) Company Limited Method and device for error correction model training and text error correction
CN104951099A (zh) * 2015-06-16 2015-09-30 北京奇虎科技有限公司 一种基于输入法的展示候选项的方法和装置
CN106774969A (zh) * 2015-11-20 2017-05-31 北京搜狗科技发展有限公司 一种输入方法和装置
CN106896932A (zh) * 2016-06-07 2017-06-27 阿里巴巴集团控股有限公司 一种候选词推荐方法及装置
CN106648134A (zh) * 2016-10-14 2017-05-10 北京搜狗科技发展有限公司 一种输入方法及装置
CN106896936A (zh) * 2017-02-24 2017-06-27 百度在线网络技术(北京)有限公司 词汇推送方法和装置

Also Published As

Publication number Publication date
CN109669549A (zh) 2019-04-23

Similar Documents

Publication Publication Date Title
CN106098060B (zh) 语音的纠错处理方法和装置、用于语音的纠错处理的装置
CN110580290A (zh) 用于文本分类的训练集的优化方法及装置
CN111832316B (zh) 语义识别的方法、装置、电子设备和存储介质
CN107564526B (zh) 处理方法、装置和机器可读介质
US11983500B2 (en) Method and device for semantic analysis and storage medium
CN111832315B (zh) 语义识别的方法、装置、电子设备和存储介质
CN111831806A (zh) 语义完整性确定方法、装置、电子设备和存储介质
CN110069143B (zh) 一种信息防误纠方法、装置和电子设备
CN112133295B (zh) 语音识别方法、装置及存储介质
CN111813932B (zh) 文本数据的处理方法、分类方法、装置及可读存储介质
CN111629270A (zh) 一种候选项确定方法、装置及机器可读介质
CN111832297A (zh) 词性标注方法、装置及计算机可读存储介质
CN110633017A (zh) 一种输入方法、装置和用于输入的装置
CN111414766B (zh) 一种翻译方法及装置
CN111324214B (zh) 一种语句纠错方法和装置
CN112036195A (zh) 机器翻译方法、装置及存储介质
CN113936697A (zh) 语音处理方法、装置以及用于语音处理的装置
CN111079421A (zh) 一种文本信息分词处理的方法、装置、终端及存储介质
CN108108356B (zh) 一种文字翻译方法、装置及设备
CN109669549B (zh) 候选内容生成方法和装置、用于候选内容生成的装置
CN113923517B (zh) 一种背景音乐生成方法、装置及电子设备
RU2636673C2 (ru) Способ и устройство для сохранения строки
CN112836026B (zh) 基于对话的问诊方法及装置
CN110837741B (zh) 一种机器翻译方法、装置及系统
CN112083811B (zh) 一种候选项展示方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant