CN113722447B

CN113722447B - 一种基于多策略匹配的语音搜索方法

Info

Publication number: CN113722447B
Application number: CN202111293241.6A
Authority: CN
Inventors: 杜振东
Original assignee: Nanjing Yunwen Network Technology Co ltd
Current assignee: Nanjing Yunwen Network Technology Co ltd
Priority date: 2021-11-03
Filing date: 2021-11-03
Publication date: 2022-02-08
Anticipated expiration: 2041-11-03
Also published as: CN113722447A

Abstract

本发明公开了一种基于多策略匹配的语音搜索方法。该方法包括获取用户输入的语音，并生成可能的所有文本，对所有文本分别进行通顺度评价打分，筛选K个得分最高的文本作为查询候选文本；对K个查询候选文本分别进行检索，每一查询候选文本取检索后的N个文档，利用文本匹配模型对每一查询候选文本与其对应的N个文档进行相关性打分，共得到K*N个文档及其对应的相关性得分；对K*N个文档的文本得分分别进行计算，选择文本得分最高的文档作为第一推荐文档推荐给用户。本发明扩大了搜索范围，提高搜索准确率，减少搜索空间，提高搜索速度，加强对用户问题的理解，提升用户体验。

Description

一种基于多策略匹配的语音搜索方法

技术领域

本发明涉及语音搜索技术领域，具体涉及一种基于多策略匹配的语音搜索方法。

背景技术

在人机交互环节中，语音交互一直占有重要地位。目前随着语音识别技术的发展，越来越多的移动应用都在其内部植入了语音搜索功能，极大地方便了用户的搜索与查询，显著改善用户的产品体验。

现有的语音搜索技术，往往先通过语音识别能力将语音声纹转为文本格式，再经过传统的文本匹配或检索找出与查询问题相关的文档，经过一定的策略排序后最终返回给用户。其中，语音转文本的过程主要是通过拼音匹配的方式进行的，由于存在以下原因：1）语音识别准确率受限；2）用户发音不标准；3）汉语中存在大量同音字词等，会导致转成的文本中存在识别错误的字或词，或者不符合上下文情景的词或短语，最终导致搜索结果准确性降低；同时，缺少用户历史查询信息的支持，难以准确识别用户意图，导致搜索结果即便是准确的，仍然不能满足用户需求，最终降低了用户体验。

发明内容

本发明的目的是针对现有技术存在的不足，提供一种基于多策略匹配的语音搜索方法。

为实现上述目的，本发明提供了一种基于多策略匹配的语音搜索方法，包括：

获取用户输入的语音，所述语音经过语音识别生成文本，如所述用户输入的语音中存在同音字，则在语音识别后生成与同音字对应的所有文本，利用语言通顺度模型对所有文本分别进行通顺度评价打分，以获得每一文本的通顺度得分，根据所述通顺度得分对所有文本由高到低进行排序，筛选前K个文本作为查询候选文本；

对K个查询候选文本分别进行检索，并对每一查询候选文本检索后的所有文档分别根据分词命中得分累加计算检索分数，且根据所述检索分数对每一查询候选文本检索出文档由高到低进行排序，分别取前N个文档作为每一查询候选文本的检索结果，利用文本匹配模型对每一查询候选文本对应的N个文档进行相关性打分，共得到K*N个文档及其对应的相关性得分，其中，K和N均为大于零的自然数；

结合所述查询候选文本的通顺度得分，对K*N个文档的文本得分分别进行计算，其中，文本得分=文档的相关性得分*对应的查询候选文本的通顺度得分，并根据所述文本得分对K*N个文档进行排序；

选择文本得分最高的文档作为第一推荐文档推荐给用户。

进一步的，还包括：

判断是否存在历史用户查询信息，若存在历史用户查询信息，则根据历史用户查询信息对K*N个文档再进行一次用户行为打分，再结合每个文档的文本得分，计算K*N个文档的总得分，其中，总得分=α*用户行为打分+β*文本得分，其中，α为预设第一权重，β为预设第二权重；

根据总得分对K*N个文档进行排序，选择总得分最高的作为第一推荐文档推荐给用户。

进一步的，所述利用语言通顺度模型对所有文本进行通顺度评价打分具体包括：

先在大规模语料下统计2-gram、3-gram的概率，然后根据预先统计的2-gram、3-gram概率计算每一文本的概率，所有概率经过归一化后作为文本的通顺度得分。

进一步的，通过BM25算法检索出与查询候选文本相关的N个文档。

进一步的，所述用户行为打分的方式如下：

先通过BM25计算用户历史问题与每一查询候选文本的相关性得分，选取查询候选文本与用户问题相关性得分最高的作为用户问题得分；然后取出每个查询候选文本对应最高得分用户问题的点击文档，利用BM25计算该查询候选文本下的N个文档与该点击文档的相关性得分，作为用户文档得分，用户行为得分=用户问题得分+用户文档得分。

有益效果：1、本发明通过对语音识别的结果进行多候选、多策略匹配搜索，扩大了搜索范围，提高搜索准确率；

2、本发明通过语言通顺度模型过滤候选查询文本，减少搜索空间，提高搜索速度；

3、本发明引入用户历史信息，加强对用户问题的理解，提升用户体验。

附图说明

图1是本发明实施例的基于多策略匹配的语音搜索方法的流程示意图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，本实施例在以本发明技术方案为前提下进行实施，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。

如图1所示，本发明实施例提供了一种基于多策略匹配的语音搜索方法，包括：

获取用户输入的语音，该语音经过语音识别生成文本，如用户输入的语音中存在同音字，则在语音识别后生成与同音字对应的所有文本，比如“yinhang”，可能是“银行”，也可能是“引航”，在语音识别后生成与“银行”和“引航”对应的所有文本。利用语言通顺度模型对所有文本分别进行通顺度评价打分，以获得每一文本的通顺度得分，通顺度得分可以设置在0至1之间。根据通顺度得分对所有文本由高到低进行排序，筛选前K个（通顺度得分最高的K个）文本作为查询候选文本。比如“woquyinhang”识别后的文本是“我去银行”的通顺度得分就要比“我去引航”的通顺度得分高。

对K个查询候选文本分别进行检索，并对每一查询候选文本检索后的所有文档分别根据分词命中得分累加计算检索分数，且根据检索分数对每一查询候选文本检索出文档由高到低进行排序，分别取前N个文档作为每一查询候选文本的检索结果，利用文本匹配模型对每一查询候选文本对应的N个文档进行相关性打分，共得到K*N个文档及其对应的相关性得分，其中，K和N均为大于零的自然数。相关性得分也设置在0至1之间。K和N均为大于零的自然数，其取值可根据业务场景需求进行设定，如K可以取值为5或10等，N可以取值为30、50或100等。上述分词命中得分是搜索引擎作出的打分，一个分词命中，即得到一个tf-idf(term frequency–inverse document frequency)对应分数。

结合查询候选文本的通顺度得分，对K*N个文档的文本得分分别进行计算，其中，文本得分=文档的相关性得分*对应的查询候选文本的通顺度得分，并根据文本得分对K*N个文档进行排序。

选择文本得分最高的文档作为第一推荐文档推荐给用户。

还包括：判断是否存在历史用户查询信息，若存在历史用户查询信息，则根据历史用户查询信息对K*N个文档再进行一次用户行为打分，再结合每个文档的文本得分，计算K*N的总得分，其中，总得分=α*用户行为打分+β*文本得分，其中，α为预设第一权重，β为预设第二权重。

本发明实施例的利用语言通顺度模型对所有文本进行通顺度评价打分具体包括：

本发明实施例通过BM25算法检索出与查询候选文本相关的N个文档。然后用文本匹配模型对N个文档进行相关性打分。具体来说，文本匹配模型以bert模型为框架，输入查询候选文本与检索出的文档，该模型会输出该文档的相关性得分。

本发明实施例的用户行为打分的方式如下：

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，其它未具体描述的部分，属于现有技术或公知常识。在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于多策略匹配的语音搜索方法，其特征在于，包括：

选择文本得分最高的文档作为第一推荐文档推荐给用户。

2.根据权利要求1所述的基于多策略匹配的语音搜索方法，其特征在于，还包括：

3.根据权利要求1所述的基于多策略匹配的语音搜索方法，其特征在于，所述利用语言通顺度模型对所有文本进行通顺度评价打分具体包括：

4.根据权利要求1所述的基于多策略匹配的语音搜索方法，其特征在于，通过BM25算法检索出与查询候选文本相关的N个文档。

5.根据权利要求2所述的基于多策略匹配的语音搜索方法，其特征在于，所述用户行为打分的方式如下：