CN106571139A - 基于人工智能的语音搜索结果处理方法及装置 - Google Patents
基于人工智能的语音搜索结果处理方法及装置 Download PDFInfo
- Publication number
- CN106571139A CN106571139A CN201610987508.4A CN201610987508A CN106571139A CN 106571139 A CN106571139 A CN 106571139A CN 201610987508 A CN201610987508 A CN 201610987508A CN 106571139 A CN106571139 A CN 106571139A
- Authority
- CN
- China
- Prior art keywords
- search
- search word
- word
- similarity
- phonetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 58
- 238000003672 processing method Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000005457 optimization Methods 0.000 claims abstract description 30
- 230000008569 process Effects 0.000 claims abstract description 25
- 238000013386 optimize process Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 235000013399 edible fruits Nutrition 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000011524 similarity measure Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 230000005226 mechanical processes and functions Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000003733 optic disk Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种基于人工智能的语音搜索结果处理方法及装置,其中,方法包括:通过对用户的语音进行语音识别得到口语化搜索词,根据与口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词,实现对语音搜索过程中的搜索词进行优化,使之符合书面语的表述方式,进而根据目标搜索词,对语音搜索的搜索结果进行优化处理,以提高搜索结果与搜索词之间的匹配度,解决现有技术中直接采用口语化搜索词进行搜索时,搜索效果较差的技术问题。
Description
技术领域
本发明涉及信息检索技术领域,尤其涉及一种基于人工智能的语音搜索结果处理方法及装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,人工智能一个重要的应用就是语音识别。
随着语音识别技术的不断发展,语音识别技术的应用范围也越来越广泛。随着语音识别准确度的提升,越来越多的用户习惯于采用语音搜索方式,从而跳过键盘输入,简化搜索过程。
在进行语音搜索的过程中,通过语音识别技术,将用户所输入的语音转化为文本,继而将所转化的文本作为搜索词进行搜索。
但在实际应用过程中,用户所输入的语音存在很多口语化表述方式,因此,搜索词往往比较长尾且包含很多口语噪音词,与规范的书面语搜索词存在较大的表述差异,导致搜索结果很难满足用户需求。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的语音搜索结果处理方法,以实现对语音搜索过程中的搜索词进行优化,使之符合书面语的表述方式,解决现有技术中直接采用口语化搜索词进行搜索时,搜索效果较差的技术问题。
本发明的第二个目的在于提出一种基于人工智能的语音搜索结果处理装置。
本发明的第三个目的在于提出另一种基于人工智能的语音搜索结果处理装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于人工智能的语音搜索结果处理方法,包括:
对用户的语音进行语音识别得到口语化搜索词;
根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;
根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
本发明实施例的基于人工智能的语音搜索结果处理方法,通过对用户的语音进行语音识别得到口语化搜索词,根据与口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词,实现对语音搜索过程中的搜索词进行优化,使之符合书面语的表述方式,进而根据目标搜索词,对语音搜索的搜索结果进行优化处理,以提高搜索结果与搜索词之间的匹配度,解决现有技术中直接采用口语化搜索词进行搜索时,搜索效果较差的技术问题。
为达上述目的,本发明第二方面实施例提出了一种基于人工智能的语音搜索结果处理装置,包括:
语音识别模块,用于对用户的语音进行语音识别得到口语化搜索词;
选择模块,用于根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;
优化模块,用于根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
本发明实施例的基于人工智能的语音搜索结果处理装置,通过语音识别模块对用户的语音进行语音识别得到口语化搜索词,选择模块根据与口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词,实现对语音搜索过程中的搜索词进行优化,使之符合书面语的表述方式,进而优化模块根据目标搜索词,对语音搜索的搜索结果进行优化处理,以提高搜索结果与搜索词之间的匹配度,解决现有技术中直接采用口语化搜索词进行搜索时,搜索效果较差的技术问题。
为达上述目的,本发明第三方面实施例提出了另一种基于人工智能的语音搜索结果处理装置,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:对用户的语音进行语音识别得到口语化搜索词;根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器执行时,使得服务器端能够执行一种基于人工智能的语音搜索结果处理方法,所述方法包括:对用户的语音进行语音识别得到口语化搜索词;根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的语音搜索结果处理方法,所述方法包括:对用户的语音进行语音识别得到口语化搜索词;根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于人工智能的语音搜索结果处理方法的流程示意图;
图2为本发明实施例所提供的另一种基于人工智能的语音搜索结果处理方法的流程示意图;
图3为相似度计算的维度示意图;
图4为搜索示例图之一;
图5为搜索示例图之二;
图6为本发明实施例提供的一种基于人工智能的语音搜索结果处理装置的结构示意图;
图7为选择模块42的结构示意图;
图8为优化模块43的结构示意图;
图9为本发明实施例提供的又一种基于人工智能的语音搜索结果处理装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人工智能的语音搜索结果处理方法和装置。
图1为本发明实施例所提供的一种基于人工智能的语音搜索结果处理方法的流程示意图。
对于用户语音输入口语化表述的搜索词时,现有技术中搜索引擎直接使用口语化搜索词进行检索排序作为语音搜索的搜索结果。也就是说,现有技术中并没有针对语音搜索场景下,针对用户的口语化表述习惯进行有针对性的搜索结果优化。但实际上,因为口语化的搜索词与网页资源中规范的书面化语言表达方式有明显差异,同时,口语化搜索词往往比较长尾,导致搜索引擎所搜索到的搜索结果不能很好地满足用户的需求。
针对这一问题,本发明实施例提供了基于人工智能的语音搜索结果处理方法,以实现对搜索结果的优化,如图1所示,该基于人工智能的语音搜索结果处理方法包括以下步骤:
步骤101,对用户的语音进行语音识别得到口语化搜索词。
具体地,采用语音识别技术,对用户所输入的语音进行识别,从而将语音这一音频信号转化为文本格式。但由于用户语音输入通常采用口语化表述,因此,所识别到的文本也相应为口语化搜索词。
步骤102,根据与口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词。
具体地,预先采集历史搜索中所采用的书面化的搜索词,选择搜索频次较高的搜索词,建立高频搜索词词库。在用户进行语音搜索时,根据用户的口语化搜索词从高频搜索词词库中,选择出与口语化搜索词相似度较高的目标搜索词。这里所说的相似度,优选是指语义上的相似度,从而将口语化搜索词映射为语义相似的书面化的目标搜索词,使得目标搜索词与用户需求匹配,完成了对搜索词的优化。
进一步,由于高频搜索词词库中的词汇量较大,逐个计算相似度会由于运算量较大搜索时间加长。因此,对高频搜索词词库建立倒排索引,在计算相似度之前,根据倒排检索从高频搜索词词库中选择有限数量的与口语化搜索词匹配的词作为相似度计算的候选搜索词。具体来说,候选搜索词可以是与口语化搜索词字面匹配的,还可以是与口语化搜索词语义匹配的。
步骤103,根据目标搜索词,对语音搜索的搜索结果进行优化处理。
具体地,由于目标搜索词与页面资源的语言习惯更加吻合,同时又体现了用户的需求,因此,可以通过目标搜索词,对语音搜索的搜索结果进行优化处理,以提高搜索结果与用户需求之间的匹配程度。
作为一种可能的实现方式,可以直接用目标搜索词完全替换用户语音输入的口语化搜索词进行搜索,并将搜索结果返回给用户;作为另一种可能的实现方式,可以利用目标搜索词对采用口语化搜索词搜索得到的检索结果进行局部优化调整,包括但不限于在口语化搜索词搜索得到的检索结果中,插入由目标搜索词搜索得到的检索结果;以及根据口语化搜索词搜索得到检索结果与目标搜索词之间的相关性调整检索结果的排序,以及删除与目标搜索词相关性较差的检索结果等。具体采用上述哪种实现方式主要依赖于口语化搜索词与目标搜索词的相似度,也会依据搜索的领域不同进行差异化选择。
本实施例中,通过对用户的语音进行语音识别得到口语化搜索词,根据与口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词,实现对语音搜索过程中的搜索词进行优化,使之符合书面语的表述方式,进而根据目标搜索词,对语音搜索的搜索结果进行优化处理,以提高搜索结果与搜索词之间的匹配度,解决现有技术中直接采用口语化搜索词进行搜索时,搜索效果较差的技术问题。
为了清楚说明上一实施例,本实施例提供了另一种基于人工智能的语音搜索结果处理方法,图2为本发明实施例所提供的另一种基于人工智能的语音搜索结果处理方法的流程示意图。
如图2所示,该基于人工智能的语音搜索结果处理方法可以包括以下步骤:
步骤201,当对用户的语音进行识别得到用户的口语化搜索词时,根据该口语化搜索词,从预先建立的高频候选词库中确定出与口语化搜索词匹配的候选搜索词。
具体地,预先对历史搜索所采用的书面化的搜索词进行统计,从中选择出搜索频次高于频次阈值的搜索词生成高频搜索词词库。同时,为了便于后续进行查询,基于分词结果建立该高频搜索词词库的倒排索引。针对用户语音进行识别得到用户的口语化搜索词时,从高频检索词词库中检索得到有限数量的高频词作为候选搜索词,这些候选搜索词之间可以具有相互顺序,搜索频次越高排序越靠前。
步骤202,计算口语化搜索词与候选搜索词之间的相似度,并基于候选搜索词的历史搜索频次和/或满意度对相似度进行修正。
具体地,针对每一个候选搜索词进行相似度计算时,首先计算口语化搜索词与候选搜索词的各相似特征,这里的相似特征至少包括字面相似度、搜索结果匹配度、发音相似度和语义词向量相似度,当然,在实际操作时,相似特征可以多于前面所列举的,也可以少于前面所列举的。为了更能够体现各搜索词之间的搜索效果差异性,除了前述相似特征之外,还可以从历史搜索频次和/或满意度,对候选搜索词与口语化搜索词之间的相似度进行修正。
从而,作为一种可能的实现方式,图3为相似度计算的维度示意图,如图3所示,可以从字面相似度、搜索结果匹配度、发音相似度和语义相似度,以及搜索频次和满意度,一共五个维度上计算相似度。
下面分别就这五个维度进行说明:
搜索频次和满意度,具体是指候选搜索词最近一年的搜索频次和搜索满意度;
字面相似度,具体是指口语化搜索词与候选搜索词之间的字面匹配度,如编辑距离、核心条目命中比例、命中条目的权重比例、未命中条目数目等等;
搜索结果匹配度,具体是指计算口语化搜索词与候选搜索词之间的搜索结果的主题匹配度;
发音相似度,具体是指计算口语化搜索词与候选搜索词的拼音编辑距离;
语义词向量相似度,具体是指计算口语化搜索词与候选搜索词的语义词向量相似度。
针对各个维度进行计算之后,将计算结果进行加权求和,获得最终的得分,将计算得到的得分作为候选搜索词与口语化搜索词之间的相似度。
步骤203,根据候选搜索词与口语化搜索词之间的相似度,从候选搜索词中选择相似度大于第一阈值的,且相似度排序在最前面的一个候选搜索词作为目标搜索词。
步骤204,根据目标搜索词与口语化搜索词之间的相似度,选择相应的优化方法,对语音搜索的搜索结果进行优化处理。
具体地,若目标搜索词与口语化搜索词之间的相似度高于第二阈值,采用目标搜索词进行搜索,将目标搜索词的搜索结果作为语音搜索的搜索结果。
反之,若目标搜索词与口语化搜索词之间的相似度不高于第二阈值,采用口语化搜索词进行搜索,将目标搜索词作为搜索排序的一个特征,对语音搜索的搜索结果进行优化。
由于口语化表述通常为长尾词,常见的方法是采用纠错、改写、替换等传统的自然语言处理的方式将其归一化、规范化,整体流程较复杂。本实施例中,将口语化搜索词这类长尾词映射到一个与其语义相似度较高的书面化的高频搜索词,即前述提及的目标搜索词,并利用得到的书面化的高频搜索词优化搜索结果,从而提升语音搜索的用户体验。
为了清楚说明本实施例的效果,图4和图5分别为搜索示例图,在图4和图5中用户均在语音搜索中采用口语化表述的长尾词进行语音搜索,具体语音为“明天想去北京告诉我天气”。
不同的是,图4采用了现有技术中的语音搜索方法,而图5采用了本实施例的方法对语音搜索结果进行了优化处理,也就是图4所示的结果为优化前,而图5为优化后。
如图4所示,搜索结果时效性较低,在结果中没有出现用户所需要的天气预报,显然不能满足用户的需求。而图5中将口语化搜索词“明天想去北京告诉我天气”经过前述所提及的步骤,映射为更规范的书面化的高频搜索词“北京明天天气”,采用“北京明天天气”进行搜索,在显要位置显示了用户所需的天气预报,从而优化了语音搜索的搜索结果,提升了语音搜索的用户满意度。
本实施例中,通过对用户的语音进行语音识别得到口语化搜索词,根据与口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词,实现对语音搜索过程中的搜索词进行优化,使之符合书面语的表述方式,进而根据目标搜索词,对语音搜索的搜索结果进行优化处理,以提高搜索结果与搜索词之间的匹配度,解决现有技术中直接采用口语化搜索词进行搜索时,搜索效果较差的技术问题。
为了实现上述实施例,本发明还提出一种基于人工智能的语音搜索结果处理装置。
图6为本发明实施例提供的一种基于人工智能的语音搜索结果处理装置的结构示意图。
如图6所示,该基于人工智能的语音搜索结果处理装置包括:语音识别模块41、选择模块42和优化模块43。
语音识别模块41,用于对用户的语音进行语音识别得到口语化搜索词。
选择模块42,用于根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词。
优化模块43,用于根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
进一步地,在本发明实施例的一种可能的实现方式中,图7为选择模块42的结构示意图,如图7所示,选择模块42包括:计算单元421、修正单元422和确定单元423。
计算单元421,用于针对每一个书面化的候选搜索词,计算与所述口语化搜索词之间的相似度。
具体地,计算单元421,具体用于相对于所述口语化搜索词,提取所述候选搜索词的各相似特征;其中,所述相似特征包括:字面相似度、搜索结果匹配度、发音相似度和/或语义词向量相似度中的一个或多个;对所提取到的各相似特征进行加权求和,得到所述候选搜索词与所述口语化搜索词之间的相似度。
修正单元422,用于根据所述候选搜索词的历史搜索频次和/或满意度,对所述候选搜索词与所述口语化搜索词之间的相似度进行修正。
确定单元423,用于将相似度大于第一阈值的候选搜索词,作为所述目标搜索词。
进一步地,在本发明实施例的一种可能的实现方式中,图8为优化模块43的结构示意图,如图8所示,优化模块43包括:第一优化单元431,以及第二优化单元432。
第一优化单元431,用于将利用所述目标搜索词进行搜索所得到的搜索结果,作为所述语音搜索的搜索结果。
具体地,第一优化单元431,具体用于将所述目标搜索词与所述口语化搜索词之间的相似度,和第二阈值进行比较,确定所述目标搜索词与所述口语化搜索词之间的相似度大于所述第二阈值时,将利用所述目标搜索词进行搜索所得到的搜索结果,作为所述语音搜索的搜索结果。
第二优化单元432,用于在用口语化搜索词搜索得到的结果基础上,用目标搜索词对搜索结果进行再次优化调整。
具体来说,第二优化单元432利用目标搜索词对采用口语化搜索词得到的搜索结果进行优化调整,包括但不限于插入、删除某条或者某些搜索结果以及搜索结果的顺序调整。
作为一种可能的实现方式,第二优化单元432根据搜索结果与所述目标搜索词之间的匹配性,对所述搜索结果进行排序,在实际操作过程中,可以将所述目标搜索词与所述口语化搜索词之间的相似度,和所述第二阈值进行比较,确定所述目标搜索词与所述口语化搜索词之间的相似度不大于所述第二阈值时,根据搜索结果与所述目标搜索词之间的匹配性,对所述搜索结果进行排序。
需要说明的是,前述对基于人工智能的语音搜索结果处理方法实施例的解释说明也适用于该实施例的基于人工智能的语音搜索结果处理装置,此处不再赘述。
基于上述实施例,本发明实施例还提供了一种基于人工智能的语音搜索结果处理装置的可能的实现方式,图9为本发明实施例提供的又一种基于人工智能的语音搜索结果处理装置的结构示意图,如图9所示,在上一实施例的基础上,基于人工智能的语音搜索结果处理装置还包括:筛选模块44。
筛选模块44,用于从历史搜索所采用的搜索频次高于频次阈值的书面化搜索词中,筛选出与所述口语化搜索词匹配的所述候选搜索词。
本发明实施例中,通过对用户的语音进行语音识别得到口语化搜索词,根据与口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词,实现对语音搜索过程中的搜索词进行优化,使之符合书面语的表述方式,进而根据目标搜索词,对语音搜索的搜索结果进行优化处理,以提高搜索结果与搜索词之间的匹配度,解决现有技术中直接采用口语化搜索词进行搜索时,搜索效果较差的技术问题。
为了实现上述实施例,本发明还提出另一种基于人工智能的语音搜索结果处理装置,包括:处理器,以及用于存储所述处理器可执行指令的存储器。
其中,处理器被配置为:对用户的语音进行语音识别得到口语化搜索词;根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器被执行时,使得服务器端能够执行一种基于人工智能的语音搜索结果处理方法,所述方法包括:对用户的语音进行语音识别得到口语化搜索词;根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的语音搜索结果处理方法,所述方法包括:对用户的语音进行语音识别得到口语化搜索词;根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。比如用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (18)
1.一种基于人工智能的语音搜索结果处理方法,其特征在于,包括以下步骤:
对用户的语音进行语音识别得到口语化搜索词;
根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;
根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
2.根据权利要求1所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词,包括:
针对每一个书面化的候选搜索词,计算与所述口语化搜索词之间的相似度;
将相似度大于第一阈值的候选搜索词,作为所述目标搜索词。
3.根据权利要求2所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述针对每一个书面化的候选搜索词,计算与所述口语化搜索词之间的相似度,包括:
相对于所述口语化搜索词,提取所述候选搜索词的各相似特征;其中,所述相似特征包括:字面相似度、搜索结果匹配度、发音相似度和语义词向量相似度中的一个或多个;
对所提取到的各相似特征进行加权求和,得到所述候选搜索词与所述口语化搜索词之间的相似度。
4.根据权利要求2或3所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述针对每一个书面化的候选搜索词,计算与所述口语化搜索词之间的相似度之后,还包括:
根据所述候选搜索词的历史搜索频次和/或满意度,对所述候选搜索词与所述口语化搜索词之间的相似度进行修正。
5.根据权利要求1所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述根据所述目标搜索词,对语音搜索的搜索结果进行优化处理,包括:
将利用所述目标搜索词进行搜索所得到的搜索结果,作为所述语音搜索的搜索结果。
6.根据权利要求5所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述将利用所述目标搜索词进行搜索所得到的搜索结果,作为所述语音搜索的搜索结果之前,还包括:
将所述目标搜索词与所述口语化搜索词之间的相似度,和第二阈值进行比较,以确定所述目标搜索词与所述口语化搜索词之间的相似度大于所述第二阈值。
7.根据权利要求1所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述根据所述目标搜索词,对语音搜索的搜索结果进行优化处理,包括:
根据搜索结果与所述目标搜索词之间的匹配性,对所述搜索结果进行排序。
8.根据权利要求7所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述根据搜索结果与所述目标搜索词之间的匹配性,对所述搜索结果进行排序之前,还包括:
将所述目标搜索词与所述口语化搜索词之间的相似度,和所述第二阈值进行比较,以确定所述目标搜索词与所述口语化搜索词之间的相似度不大于所述第二阈值。
9.根据权利要求1所述的基于人工智能的语音搜索结果处理方法,其特征在于,所述根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词之前,还包括:
从历史搜索所采用的搜索频次高于频次阈值的书面化搜索词中,筛选出与所述口语化搜索词匹配的所述候选搜索词。
10.一种基于人工智能的语音搜索结果处理装置,其特征在于,包括:
语音识别模块,用于对用户的语音进行语音识别得到口语化搜索词;
选择模块,用于根据与所述口语化搜索词之间的相似度,从历史搜索所采用的书面化的候选搜索词中,选择出与用户需求匹配的目标搜索词;
优化模块,用于根据所述目标搜索词,对语音搜索的搜索结果进行优化处理。
11.根据权利要求10所述的基于人工智能的语音搜索结果处理装置,其特征在于,所述选择模块,包括:
计算单元,用于针对每一个书面化的候选搜索词,计算与所述口语化搜索词之间的相似度;
确定单元,用于将相似度大于第一阈值的候选搜索词,作为所述目标搜索词。
12.根据权利要求11所述的基于人工智能的语音搜索结果处理装置,其特征在于,
所述计算单元,具体用于相对于所述口语化搜索词,提取所述候选搜索词的各相似特征;其中,所述相似特征包括:字面相似度、搜索结果匹配度、发音相似度和语义词向量相似度中的一个或多个;对所提取到的各相似特征进行加权求和,得到所述候选搜索词与所述口语化搜索词之间的相似度。
13.根据权利要求11或12所述的基于人工智能的语音搜索结果处理装置,其特征在于,所述选择模块,还包括:
修正单元,用于根据所述候选搜索词的历史搜索频次和/或满意度,对所述候选搜索词与所述口语化搜索词之间的相似度进行修正。
14.根据权利要求10所述的基于人工智能的语音搜索结果处理装置,其特征在于,所述优化模块,包括:
第一优化单元,用于将利用所述目标搜索词进行搜索所得到的搜索结果,作为所述语音搜索的搜索结果。
15.根据权利要求14所述的基于人工智能的语音搜索结果处理装置,其特征在于,
所述第一优化单元,具体用于将所述目标搜索词与所述口语化搜索词之间的相似度,和第二阈值进行比较,确定所述目标搜索词与所述口语化搜索词之间的相似度大于所述第二阈值时,将利用所述目标搜索词进行搜索所得到的搜索结果,作为所述语音搜索的搜索结果。
16.根据权利要求10所述的基于人工智能的语音搜索结果处理装置,其特征在于,所述优化模块,包括:
第二优化单元,用于根据搜索结果与所述目标搜索词之间的匹配性,对所述搜索结果进行排序。
17.根据权利要求16所述的基于人工智能的语音搜索结果处理装置,其特征在于,
所述第二优化单元,具体用于将所述目标搜索词与所述口语化搜索词之间的相似度,和所述第二阈值进行比较,确定所述目标搜索词与所述口语化搜索词之间的相似度不大于所述第二阈值时,根据搜索结果与所述目标搜索词之间的匹配性,对所述搜索结果进行排序。
18.根据权利要求10所述的基于人工智能的语音搜索结果处理装置,其特征在于,所述装置,还包括:
筛选模块,用于从历史搜索所采用的搜索频次高于频次阈值的书面化搜索词中,筛选出与所述口语化搜索词匹配的所述候选搜索词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610987508.4A CN106571139B (zh) | 2016-11-09 | 2016-11-09 | 基于人工智能的语音搜索结果处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610987508.4A CN106571139B (zh) | 2016-11-09 | 2016-11-09 | 基于人工智能的语音搜索结果处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106571139A true CN106571139A (zh) | 2017-04-19 |
CN106571139B CN106571139B (zh) | 2019-10-15 |
Family
ID=58540822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610987508.4A Active CN106571139B (zh) | 2016-11-09 | 2016-11-09 | 基于人工智能的语音搜索结果处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106571139B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133012A (zh) * | 2017-12-22 | 2018-06-08 | 新奥(中国)燃气投资有限公司 | 一种标签设置方法及装置 |
CN108549728A (zh) * | 2018-05-03 | 2018-09-18 | 新奥(中国)燃气投资有限公司 | 一种页面展示方法、装置及系统 |
CN109166594A (zh) * | 2018-07-24 | 2019-01-08 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN109800338A (zh) * | 2018-12-11 | 2019-05-24 | 平安科技(深圳)有限公司 | 口语化时间标准化控制方法、装置、计算机设备及存储介质 |
CN110377831A (zh) * | 2019-07-25 | 2019-10-25 | 拉扎斯网络科技(上海)有限公司 | 检索方法、装置、可读存储介质和电子设备 |
CN110956958A (zh) * | 2019-12-04 | 2020-04-03 | 深圳追一科技有限公司 | 搜索方法、装置、终端设备及存储介质 |
CN110990685A (zh) * | 2019-10-12 | 2020-04-10 | 中国平安财产保险股份有限公司 | 基于声纹的语音搜索方法、设备、存储介质及装置 |
CN111427459A (zh) * | 2019-01-08 | 2020-07-17 | 北京搜狗科技发展有限公司 | 一种在用户通信时输入优化的方法及相关装置 |
CN112231440A (zh) * | 2020-10-09 | 2021-01-15 | 安徽讯呼信息科技有限公司 | 一种基于人工智能的语音搜索方法 |
CN112632395A (zh) * | 2020-12-31 | 2021-04-09 | 深圳追一科技有限公司 | 搜索推荐方法和装置、服务器、计算机可读存储介质 |
CN113205805A (zh) * | 2021-03-18 | 2021-08-03 | 福建马恒达信息科技有限公司 | 一种语音插件辅助的表格便捷操作方法 |
CN113486071A (zh) * | 2021-07-27 | 2021-10-08 | 掌阅科技股份有限公司 | 基于电子书的搜索方法、服务端、客户端及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020230A (zh) * | 2012-12-14 | 2013-04-03 | 中国科学院声学研究所 | 一种语义模糊匹配方法 |
CN103106189A (zh) * | 2011-11-11 | 2013-05-15 | 北京百度网讯科技有限公司 | 一种挖掘同义属性词的方法和装置 |
CN103294814A (zh) * | 2013-06-07 | 2013-09-11 | 百度在线网络技术(北京)有限公司 | 搜索结果推荐方法、系统和搜索引擎 |
CN104699676A (zh) * | 2013-12-04 | 2015-06-10 | 中国电信股份有限公司 | 基于语音识别的信息搜索方法和系统 |
CN104778161A (zh) * | 2015-04-30 | 2015-07-15 | 车智互联(北京)科技有限公司 | 基于Word2Vec和Query log抽取关键词方法 |
CN105119961A (zh) * | 2015-07-14 | 2015-12-02 | 中国传媒大学 | 基于本体的语义Web服务自动组合方法 |
-
2016
- 2016-11-09 CN CN201610987508.4A patent/CN106571139B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106189A (zh) * | 2011-11-11 | 2013-05-15 | 北京百度网讯科技有限公司 | 一种挖掘同义属性词的方法和装置 |
CN103020230A (zh) * | 2012-12-14 | 2013-04-03 | 中国科学院声学研究所 | 一种语义模糊匹配方法 |
CN103294814A (zh) * | 2013-06-07 | 2013-09-11 | 百度在线网络技术(北京)有限公司 | 搜索结果推荐方法、系统和搜索引擎 |
CN104699676A (zh) * | 2013-12-04 | 2015-06-10 | 中国电信股份有限公司 | 基于语音识别的信息搜索方法和系统 |
CN104778161A (zh) * | 2015-04-30 | 2015-07-15 | 车智互联(北京)科技有限公司 | 基于Word2Vec和Query log抽取关键词方法 |
CN105119961A (zh) * | 2015-07-14 | 2015-12-02 | 中国传媒大学 | 基于本体的语义Web服务自动组合方法 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133012A (zh) * | 2017-12-22 | 2018-06-08 | 新奥(中国)燃气投资有限公司 | 一种标签设置方法及装置 |
CN108133012B (zh) * | 2017-12-22 | 2022-01-18 | 新奥(中国)燃气投资有限公司 | 一种标签设置方法及装置 |
CN108549728B (zh) * | 2018-05-03 | 2021-10-15 | 新奥(中国)燃气投资有限公司 | 一种页面展示方法及系统及大数据平台 |
CN108549728A (zh) * | 2018-05-03 | 2018-09-18 | 新奥(中国)燃气投资有限公司 | 一种页面展示方法、装置及系统 |
CN109166594A (zh) * | 2018-07-24 | 2019-01-08 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN109800338A (zh) * | 2018-12-11 | 2019-05-24 | 平安科技(深圳)有限公司 | 口语化时间标准化控制方法、装置、计算机设备及存储介质 |
CN111427459B (zh) * | 2019-01-08 | 2024-04-02 | 北京搜狗科技发展有限公司 | 一种在用户通信时输入优化的方法及相关装置 |
CN111427459A (zh) * | 2019-01-08 | 2020-07-17 | 北京搜狗科技发展有限公司 | 一种在用户通信时输入优化的方法及相关装置 |
CN110377831A (zh) * | 2019-07-25 | 2019-10-25 | 拉扎斯网络科技(上海)有限公司 | 检索方法、装置、可读存储介质和电子设备 |
CN110377831B (zh) * | 2019-07-25 | 2022-05-17 | 拉扎斯网络科技(上海)有限公司 | 检索方法、装置、可读存储介质和电子设备 |
CN110990685A (zh) * | 2019-10-12 | 2020-04-10 | 中国平安财产保险股份有限公司 | 基于声纹的语音搜索方法、设备、存储介质及装置 |
CN110990685B (zh) * | 2019-10-12 | 2023-05-26 | 中国平安财产保险股份有限公司 | 基于声纹的语音搜索方法、设备、存储介质及装置 |
CN110956958A (zh) * | 2019-12-04 | 2020-04-03 | 深圳追一科技有限公司 | 搜索方法、装置、终端设备及存储介质 |
CN112231440A (zh) * | 2020-10-09 | 2021-01-15 | 安徽讯呼信息科技有限公司 | 一种基于人工智能的语音搜索方法 |
CN112632395A (zh) * | 2020-12-31 | 2021-04-09 | 深圳追一科技有限公司 | 搜索推荐方法和装置、服务器、计算机可读存储介质 |
CN113205805A (zh) * | 2021-03-18 | 2021-08-03 | 福建马恒达信息科技有限公司 | 一种语音插件辅助的表格便捷操作方法 |
CN113205805B (zh) * | 2021-03-18 | 2024-02-20 | 福建马恒达信息科技有限公司 | 一种语音插件辅助的表格便捷操作方法 |
CN113486071A (zh) * | 2021-07-27 | 2021-10-08 | 掌阅科技股份有限公司 | 基于电子书的搜索方法、服务端、客户端及系统 |
CN113486071B (zh) * | 2021-07-27 | 2022-04-26 | 掌阅科技股份有限公司 | 基于电子书的搜索方法、服务端、客户端及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106571139B (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106571139A (zh) | 基于人工智能的语音搜索结果处理方法及装置 | |
CN106528845B (zh) | 基于人工智能的检索纠错方法及装置 | |
CN105336322B (zh) | 多音字模型训练方法、语音合成方法及装置 | |
CN107315772B (zh) | 基于深度学习的问题匹配方法以及装置 | |
CN112464656B (zh) | 关键词抽取方法、装置、电子设备和存储介质 | |
CN112836514B (zh) | 嵌套实体识别方法、装置、电子设备和存储介质 | |
CN107391614A (zh) | 一种基于wmd的中文问答匹配方法 | |
CN106548773A (zh) | 基于人工智能的儿童用户搜索方法及装置 | |
CN112256845B (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN110750977B (zh) | 一种文本相似度计算方法及系统 | |
US10942973B2 (en) | Automatically generating and evaluating candidate terms for trademark clearance | |
CN106844341A (zh) | 基于人工智能的新闻摘要提取方法及装置 | |
KR101842361B1 (ko) | 리뷰 데이터의 감성을 분류하기 위한 방법 및 장치 | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
CN110197279A (zh) | 变换模型训练方法、装置、设备和存储介质 | |
CN107122492A (zh) | 基于图片内容的歌词生成方法和装置 | |
CN109710087A (zh) | 输入法模型生成方法及装置 | |
CN105279227A (zh) | 同音词的语音搜索处理方法及装置 | |
CN106909628A (zh) | 一种基于区间的文本相似搜索方法 | |
WO2015170963A1 (en) | System and method for automatically generating a knowledge base | |
CN109726404B (zh) | 端到端模型的训练数据增强方法、装置及介质 | |
CN107193941A (zh) | 基于图片内容的故事生成方法和装置 | |
CN113609264B (zh) | 电力系统节点的数据查询方法、装置 | |
CN109033066A (zh) | 一种摘要形成方法及装置 | |
CN106843523A (zh) | 基于人工智能的文字输入方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |