CN111198936B

CN111198936B - 一种语音搜索方法、装置、电子设备及存储介质

Info

Publication number: CN111198936B
Application number: CN201811386065.9A
Authority: CN
Inventors: 薄琳
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2018-11-20
Filing date: 2018-11-20
Publication date: 2023-09-15
Anticipated expiration: 2038-11-20
Also published as: CN111198936A

Abstract

本申请涉及语音搜索技术领域，尤其涉及一种语音搜索方法，包括：响应于获取到的目标语音，确定所述目标语音对应的语音识别文本；基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理；基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果。采用上述方案，基于语音种类进行语音识别文本的处理提高了目标语音识别的包容度，基于匹配度确定搜索结果又进一步提升了目标语音搜索的准确度，从而提升了用户的使用体验。本申请还提供了一种语音搜索装置、电子设备及存储介质。

Description

一种语音搜索方法、装置、电子设备及存储介质

技术领域

本申请涉及语音搜索技术领域，具体而言，涉及一种语音搜索方法、装置、电子设备及存储介质。

背景技术

随着移动终端技术的飞速发展，移动终端所具备的功能也越来越丰富，如在手机等移动终端上应用十分广泛的语音搜索功能。用户通过语音搜索功能可以搜索包括天气、地图、音乐、联系人等各种类型的数据。

现有的语音搜索方法，通常是基于对用户的语音内容的识别结果来进行的，也即，在识别出用户的语音内容后，搜索引擎可以为用户提供与上述语音内容相匹配的搜索内容。以音乐搜索为例，当用户对着移动终端说出：“我想听XX歌曲”时，希望该歌曲能够很快被识别并播放。

然而，利用现有语音识别技术识别语音内容时，往往无法避免各种语音环境所可能带来的噪声影响，导致语音识别的准确度较差，这将进一步导致返回的搜索内容不准确，甚至是无法返回相应的搜索内容，用户的使用体验度较差。

可见，需要一种能够准确推送用户所要搜索的内容的技术方案。

发明内容

有鉴于此，本申请实施例的目的在于提供一种语音搜索方法、装置、电子设备及存储介质，能够提高语音搜索的准确度，提升用户的使用体验。

主要包括以下几个方面：

第一方面，本申请实施例提供了一种语音搜索方法，所述方法包括：

响应于获取到的目标语音，确定所述目标语音对应的语音识别文本；

基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理；

基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果。

在一种实施方式中，所述语音识别文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，可以包括：

依次从所述语音识别文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

将每个所述汉字、以及所述汉字组分别作为处理后的一个语音识别文本。

在另一种实施方式中，所述语音识别文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，可以包括：

依次从所述语音识别文本中提取出各个拼音，并确定每个拼音对应的声母部和韵母部；

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

针对任意两个拼音，确定一个拼音的声母部与另一个拼音的声母部组合后的声母组，以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组；

将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个语音识别文本。

在又一种实施方式中，所述语音识别文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，可以包括：

依次从所述语音识别文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个语音识别文本。

在再一种实施方式中，在所述对所述语音识别文本进行处理之后，所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果之前，还可以包括：

确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度；

所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果，包括：

按照匹配度由高到低的顺序对所有候选搜索结果进行排名；

将符合预设名次的候选搜索结果作为与该目标语音对应的搜索结果。

在一些实施例中，所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，可以包括：

针对处理后的每个语音识别文本，确定该语音识别文本是否与数据库中任一候选搜索结果关联的搜索文本相一致；

若一致，则确定该语音识别文本与该候选搜索结果匹配；

针对任一候选搜索结果，统计与该候选搜索结果相匹配的语音识别文本的个数；

将统计的个数作为确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度。

在一些实施例中，在所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度之前，还可以包括：

针对处理后的每个语音识别文本，为该语音识别文本赋予对应的重要度信息；

所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，包括：

确定赋予重要度信息后的语音识别文本与数据库中的候选搜索结果之间的匹配度。

在再一种实施方式中，在所述确定所述目标语音对应的语音识别文本之后，所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果之前，还可以包括：

确定所述语音识别文本的热度值；

基于确定的热度值、以及处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果。

在再一种实施方式中，在所述确定所述目标语音对应的语音识别文本之后，所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理之前，还可以包括：

判断所述语音识别文本是否存在扩展语音识别文本；

所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

在判断所述语音识别文本存在所述扩展语音识别文本时，基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，以及基于所述扩展语音识别文本对应的语言种类，对所述扩展语音识别文本进行处理。

对所述语音识别文本进行文本转换，得到转换后的语音识别文本。

第二方面，本申请实施例还提供了一种语音搜索装置，所述装置包括：

文本确定模块，用于响应于获取到的目标语音，确定所述目标语音对应的语音识别文本；

文本处理模块，用于基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理；

语音搜索模块，用于基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果。

在一种实施方式中，所述语音识别文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述文本处理模块，具体用于：

依次从所述语音识别文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

在另一种实施方式中，所述语音识别文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述文本处理模块，具体用于：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

在又一种实施方式中，所述语音识别文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述文本处理模块，具体用于：

依次从所述语音识别文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个语音识别文本。

在再一种实施方式中，所述装置还包括：

匹配度确定模块，用于确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度；

所述语音搜索模块，具体用于：

按照匹配度由高到低的顺序对所有候选搜索结果进行排名；

在一些实施例中，所述匹配度确定模块，可以具体用于：

若一致，则确定该语音识别文本与该候选搜索结果匹配；

在一些实施例中，所述装置还包括：

重要度确定模块，用于针对处理后的每个语音识别文本，为该语音识别文本赋予对应的重要度信息；

所述匹配度确定模块，具体用于：

在再一种实施方式中，所述装置还包括：

热度值确定模块，用于确定所述语音识别文本的热度值；

所述语音搜索模块，具体用于：

在再一种实施方式中，所述装置还包括：

扩展判断模块，用于判断所述语音识别文本是否存在扩展语音识别文本；

所述文本处理模块，具体用于：

在再一种实施方式中，所述装置还包括：

文本转换模块，用于对所述语音识别文本进行文本转换，得到转换后的语音识别文本。

第三方面，本申请实施例还提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行时执行如第一方面所述的语音搜索方法的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如第一方面所述的语音搜索方法的步骤。

采用上述方案，在响应于获取到的目标语音后，首先确定所述目标语音对应的语音识别文本，然后基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，最后基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果。这样，基于语音种类进行语音识别文本的处理提高了目标语音识别的包容度，基于匹配度确定搜索结果又进一步提升了目标语音搜索的准确度，从而提升了用户的使用体验。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例一所提供的一种语音搜索方法的流程图；

图2示出了本申请实施例二所提供的一种语音搜索方法的流程图；

图3示出了本申请实施例二所提供的另一种语音搜索方法的流程图；

图4示出了本申请实施例三所提供的一种语音搜索方法的流程图；

图5示出了本申请实施例四所提供的一种语音搜索方法的流程图；

图6示出了本申请实施例六所提供的一种语音搜索装置的结构示意图；

图7示出了本申请实施例七所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

考虑到现有语音识别技术识别语音内容时，语音识别的准确度较差，这将导致返回的搜索内容不准确，甚至是无法返回相应的搜索内容，用户的使用体验度较差。有鉴于此，本申请实施例提供了一种语音搜索方法，该语音搜索方法可以应用于音乐搜索技术领域，还可以应用于天气搜索技术领域，还可以应用于其他技术领域。接下来通过几个实施例进行具体的说明。

实施例一

如图1所示，为本申请实施例一提供的一种语音搜索方法的流程示意图，该语音搜索方法的执行主体可以是电子设备，如私有设备、运营商网络设备(例如，基站设备)，也可以是一定行业组织、团体和个人部署的站点(Station)等，具体而言，可以包括但不限于移动台、移动终端、移动电话、用户设备、手机及便携设备(portable equipment)、车辆(vehicle)等，例如，终端设备可以是移动电话(或称为“蜂窝”电话)、具有无线通信功能的计算机等，终端设备还可以是便携式、袖珍式、手持式、计算机内置或者车载移动装置，本申请实施例对此不予限制。上述方法具体包括如下步骤：

S101、响应于获取到的目标语音，确定所述目标语音对应的语音识别文本。

这里，本申请实施例提供的语音搜索方法在获取到目标语音后，可以先进行语音识别，以得到对应的语音识别文本。本申请实施例中，可以采用语音识别系统对目标语音进行语音识别，也即，可以通过特征参数提取单元对目标语音进行分析处理，把丰富的语音信息中的冗余信息去除，获取对语音识别有用的信息，再根据模式匹配及模型训练单元对上述获取的信息进行识别以得到语音识别文本。

考虑到现有的语音识别系统对环境比较敏感，针对一个场景通常需要进行针对性的语音训练，而且识别得到的语音识别文本通常夹杂有各种噪音，如缺字漏字、同音不同字、相似声母、相似韵母、英文音译与英文原文混杂等。在识别得到的语音识别文本夹杂有噪音时，现有利用按字创建倒排索引进行语音搜索的方案导致返回的搜索内容不准确，甚至是无法返回相应的搜索内容，用户的使用体验度较差。本申请正是在为了解决上述语音搜索方案所存在的问题，才综合考虑语音识别文本对应的语言种类进行文本处理，以便根据处理后的语音识别文本进行搜索结果的匹配。

S102、基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理。

这里，本申请实施例中的语音识别文本可以是汉字，还可以是拼音，还可以是字母，还可以是其他文本。在确定语音识别文本对应的语言种类后，可以根据对应的语言种类对语音识别文本进行相应的处理。这主要是考虑到在语音识别的实际应用中，不同的语言种类受到环境的影响程度也不相同，本申请实施例可以针对汉语类别的文本（汉字、拼音等）进行处理，还可以针对英语类别的文本（字母）进行处理，还可以针对其他语言种类的文本进行处理，在此不再赘述。

S103、基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果。

这里，针对不同语言种类进行处理得到的语音识别文本可以有一个，也可以有多个。这样，通过统计处理后的语音识别文本与数据库中的候选搜索结果关联的搜索文本的一致性来确定匹配度，以基于该匹配度确定目标语音对应的搜索结果。

其中，上述数据库预先存储有与各候选搜索结果相对应的搜索文本，该候选搜索结果是预先收集的正确文本，通过对该候选搜索结果进行多种语言种类（至少包括汉语种类以及英语种类）下的分析处理，得到对应的多个搜索文本。本申请实施例可以预先建立多个搜索文本与候选搜索结果之间的索引关系，也即，在确定语音识别文本与搜索文本之间的匹配个数时，可以基于上述建立的索引关系确定对应的候选搜索结果。

为了便于进一步理解上述语音搜索方法，接下来通过一个具体的应用实例进行说明。

本申请实施例可以应用于基于音乐知识图谱的语音搜索服务，其中，可以基于歌曲、歌手、专辑这三个实体之间的关系建立音乐知识图谱。除此之外，还可以从百科页面获取歌手的别名、艺名、本名、国籍、性别等信息，并将获取的信息添加至对应的歌手实体中，还可以统计歌曲和专辑的播放、收藏、转发等热度信息，并将统计的热度信息添加至对应的歌曲实体或专辑实体中。基于上述建立的音乐知识图谱便可以进行语音搜索，如在确定用户语音输入“请播放陈XY的浮A”时，便可以基于知识图谱中存在的陈XY与浮A之间的关系进行精确的语音搜索。

值得说明的是，本申请实施例在对语音识别文本进行处理时，可以使用常见的用户语句模板或实体识别模型来提取部分带有关键信息的语音识别文本，针对该部分语音识别文本进行处理，还以“请播放陈XY的浮A”为例，本申请实施例中通过使用“请播放xx的xx”语句模板提取关键信息（歌手：陈XY、歌曲：浮A），并对其进行处理。这样，在确定目标语音对应的搜索结果时，其可以是结合了歌手（陈XY）和歌曲（浮A）这两部分的搜索子结果，从而进一步确保语音搜索的准确度。

本申请实施例可以针对不同的语言种类进行相应的文本处理，接下来通过如下实施例二和实施例三着重对汉语类型和英语类型的语音识别文本进行处理的过程进行说明。

实施例二

在语音识别文本包括至少一个汉字时，其对应的语言种类为汉语类别，这样，基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，如图2所示，具体包括如下步骤：

S201、依次从所述语音识别文本中提取出各个汉字；

S202、将提取的任意多个汉字进行顺序组合，得到各个汉字组；

S203、将每个所述汉字、以及所述汉字组分别作为处理后的一个语音识别文本。

这里，首先依次从所述语音识别文本中提取出各个汉字，然后将任意多个汉字进行顺序组合，得到各个汉字组，最后将每个汉字组、每个汉字均作为处理后的一个语音识别文本。以陈XY这一语音识别文本为例，可以提取出陈、X、Y这三个汉字，经过顺序组合后，可以得到陈X、XY等汉字组，这样，陈、X、Y、陈X、XY均可以作为处理后的一个语音识别文本。

值得说明的是，本申请实施例不仅可以将每个汉字组、每个汉字均作为处理后的一个语音识别文本，还可以对汉字组、汉字进行筛选后，将筛选后的汉字、汉字组作为处理后的语音识别文本，以在确保语音搜索准确度的前提下，提高搜索效率。

对于包括至少一个汉字的语音识别文本而言，本申请实施例可以基于该语音识别文本包括的汉字生成对应的拼音，这样，每一个汉字对应一个拼音，一个语音识别文本也可以对应于至少一个拼音，这样，便可以对拼音及拼音包括的声母和韵母进行识别以提高语音识别的包容性。在拼音作为语音识别文本时，基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，如图3所示，具体包括如下步骤：

S301、依次从所述语音识别文本中提取出各个拼音，并确定每个拼音对应的声母部和韵母部；

S302、将提取的任意多个拼音进行顺序组合，得到各个拼音组；

S303、针对任意两个拼音，确定一个拼音的声母部与另一个拼音的声母部组合后的声母组，以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组；

S304、将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个语音识别文本。

这里，首先依次从所述语音识别文本中提取出各个拼音，可以对任意多个拼音进行顺序组合，得到各个拼音组，还可以针对每个拼音，确定该拼音对应的声母部和韵母部，并可以针对任意两个拼音，确定一个拼音的声母部与另一个拼音的声母部组合后的声母组，以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组，最后将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个语音识别文本。

以cheyy*x#y这一语音识别文本为例，可以提取出chey、y*、x#y这三个拼音以及每个拼音的声母部和韵母部（如chey的声母部为ch，韵母部为ey，y*的声母部为y，韵母部为*，x#y的声母部为x，韵母部为#y），这样，将多个拼音进行顺序组合后，可以得到cheyy*、y*x#y等拼音组。另外，针对任意两个拼音而言，可以将对应的声母部组合起来，得到声母组，如chy、yx等，还可以将对应的韵母部组合起来得到韵母组，如ey*、*#y等，这样，chey、y*、x#y、cheyy*、y*x#y、chy、yx、ey*、*#y等均可以作为处理后的一个语音识别文本。

同样的，这里，不仅可以将每个拼音、每个拼音组、每个声母组、每个韵母组均作为处理后的一个语音识别文本，还可以在对拼音、拼音组、声母组、韵母组进行筛选后，将筛选后的拼音、拼音组、声母组、韵母组作为处理后的语音识别文本，以在确保语音搜索准确度的前提下，提高搜索效率。

实施例三

在语音识别文本包括至少一个字母时，其对应的语言种类为英语类别，这样，基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，如图4所示，具体包括如下步骤：

S401、依次从所述语音识别文本中提取出各个字母；

S402、将提取的任意多个字母进行顺序组合，得到各个字母组；

S403、将每个所述字母组作为处理后的一个语音识别文本。

这里，首先依次从所述语音识别文本中提取出各个字母，然后将任意多个字母进行顺序组合，得到各个字母组，最后将每个字母均作为处理后的一个语音识别文本。以easxy（即陈XY的英文名）这一语音识别文本为例，可以提取出各个字母，经过顺序组合后，可以得到eas、asx、sxy等，均可以作为处理后的一个语音识别文本。

值得说明的是，本申请实施例不仅可以将每个字母均作为处理后的一个语音识别文本，还可以对字母组进行筛选后，将筛选后的字母组作为处理后的语音识别文本，以在确保语音搜索准确度的前提下，提高搜索效率。

本申请实施例提供的语音搜索方法在根据处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果时，可以首先按照匹配度由高到低的顺序对所有候选搜索结果进行排名；然后再将符合预设名次的候选搜索结果作为与该目标语音对应的搜索结果。

这里，预设名次可以根据不同的应用场景进行适应性调节，如对于一些对搜索结果的精准度要求不高的语音搜索场景，如可以模糊搜索的应用场景（如地图导航），可以将预设名次（如前5名）的候选搜索结果作为与该目标语音对应的搜索结果推荐给用户，但对于一些对搜索结果的精准度要求较高的语音搜索场景，如需要精确搜索的应用场景（如利用语音机器人实现音乐推荐），可以将最高排名的候选搜索结果作为与该目标语音对应的搜索结果推荐给用户，以进一步提升用户的使用体验。

值得提出的是，本申请实施例中的语音识别文本可以包括汉字、拼音、字母中的任意组合。如对于“安WWbaby”，“爱的ATM”等语音识别文本，本申请实施例可以按照语言种类分开进行搜索，即，将汉语和英文分开搜索，也即，将汉字对应的匹配度与字母对应的匹配度相加以得到语音识别文本的最终匹配度，解决了语言混杂所带来的搜索错误率较高的问题，确保了搜索准确度。

上述匹配度确定过程作为本申请实施例的一个关键步骤，通过如下实施例四进行展开说明。

实施例四

如图5所示，上述匹配度的确定过程具体通过如下步骤实现：

S501、针对处理后的每个语音识别文本，确定该语音识别文本是否与数据库中任一候选搜索结果关联的搜索文本相一致；

S502、若一致，则确定该语音识别文本与该候选搜索结果匹配；

S503、针对任一候选搜索结果，统计与该候选搜索结果相匹配的语音识别文本的个数；

S504、将统计的个数作为确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度。

这里，可以首先针对处理后的每个语音识别文本，确定该语音识别文本是否与数据库中任一候选搜索结果关联的搜索文本相一致，如果一致，则说明该语音识别文本与该候选搜索结果匹配，然后针对任一候选搜索结果，统计与该候选搜索结果相匹配的语音识别文本的个数，将该统计的个数作为匹配度，匹配度随着统计个数的增加而增大。

特举一个具体的实例说明上述匹配度的确定过程。如在进行语音识别时，将陈XY的浮A识别成了陈X军的浮A，此时，针对陈X军这三个汉字而言，陈、X、军、陈X、X军均可以作为处理后的一个语音识别文本，而对于数据库中的候选搜索结果陈XY而言，陈、X、Y、陈X、XY均可以作为候选搜索结果关联的搜索文本，在确定处理后的语音识别文本与搜索文本有四个相同，两个不同的前提下，可以确定该候选搜索结果与目标语音之间的匹配度，这时，基于该匹配度便可以从各候选搜索结果中确定与目标语音对应的搜索结果，也即，即使在语音识别阶段存在噪声干扰，本申请实施例提供的语音搜索方法仍然可以基于匹配度进行准确的语音搜索。

另外，考虑到不同种类的语音识别文本对匹配度的影响并不相同，如对于“y*x#y”这一拼音类的语音识别文本而言，其对匹配度的影响往往会小于“XY”这一文字类的语音识别文本对匹配度的影响，因此，本申请实施例中，对于上述处理后的每一语音识别文本而言，可以为其赋予对应的重要度信息，基于该重要度信息以及语音识别文本便可以确定对应的匹配度。

这里，重要度信息可以预先设置，还可以适应性调节以适应不同应用场景的需求。

在实际的应用中，除了要考虑匹配度对搜索结果的影响，还可以考虑语音识别文本的热度值对搜索结果的影响。这里，仍以基于音乐知识图谱的语音搜索服务这一应用场景为例，如在确定用户语音输入“请播放浮A”，这里考虑到歌手陈XY、歌手林XX均对应有浮A歌曲，此时，可以通过各音乐平台对浮A的排行热度值，将陈XY的浮A优先推送给用户，以进一步提升用户的使用体验。

这里，为了进一步确保搜索结果的准确度，本申请实施例可以优先在目标语音对应的整个语音识别文本中进行匹配，如通过添加常用歌手名、歌曲名列表实现匹配，这样，可以将部分精确匹配的语音识别文本（如歌手或歌曲）直接作为必须条件过滤搜索结果，则搜索查询时间大幅度缩短，提高了搜索效率。

另外，当依据当前匹配条件（如歌手和歌曲同时匹配）得到的搜索结果不满足要求时，可以动态放宽搜索匹配条件（如歌曲和歌手信息不同时存在时歌曲信息优先匹配等），以确保语音搜索服务的正常进行。

实施例五

为了便于更好的对语音识别文本进行处理，本申请实施例在确定语音识别文本后，可以对该语音识别文本进行预处理。该预处理可以包括文本转换处理、文本扩展处理、文本过滤处理等。

针对文本扩展处理而言，在确定语音识别文本存在扩展语音识别文本时，在基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理的同时还可以基于所述扩展语音识别文本对应的语言种类，对所述扩展语音识别文本进行处理。

本申请实施例中，如可以在建立数据库时，将歌手的别名作为同义词扩展，如将周XX的别名周Y作为扩展语音识别文字，这样，当用户语音搜索别名时也能匹配到正确的歌手。如还可以为英文歌手名增加中文名作为扩展语音识别文字，用来支持中文搜索，如将J#st*y这一英文歌手名的中文名贾某X作为扩展语音识别文字，这样，当用户语音搜索中文名贾某X时也能匹配到正确的英文歌手。

针对文本转换处理而言，本申请实施例考虑到数字在语言识别中的多样性，可以将语义识别文本中的阿拉伯数字均处理为中文，如将歌曲名XX36计转换为XX三十六计，以实现当前语音搜索环境与数据库之间的统一，进一步提高搜索效果。

基于上述实施例，本申请还提供了一种语音搜索装置，下述各种装置的实施可以参见上述方法的实施，重复之处不再赘述。

实施例六

如图6所示，为本申请实施例六提供的语音搜索装置，所述装置包括：

文本确定模块601，用于响应于获取到的目标语音，确定所述目标语音对应的语音识别文本；

文本处理模块602，用于基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理；

语音搜索模块603，用于基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果。

在一种实施方式中，所述语音识别文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述文本处理模块602，具体用于：

依次从所述语音识别文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

在另一种实施方式中，所述语音识别文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述文本处理模块602，具体用于：

依次从所述语音识别文本中提取出各个拼音；

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

针对每个拼音，确定该拼音对应的声母部和韵母部；

在又一种实施方式中，所述语音识别文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述文本处理模块602，具体用于：

依次从所述语音识别文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个语音识别文本。

在再一种实施方式中，所述装置还包括：

匹配度确定模块604，用于确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度；

所述语音搜索模块603，具体用于：

按照匹配度由高到低的顺序对所有候选搜索结果进行排名；

在一些实施例中，所述匹配度确定模块604，可以具体用于：

若一致，则确定该语音识别文本与该候选搜索结果匹配；

在一些实施例中，所述装置还包括：

重要度确定模块605，用于针对处理后的每个语音识别文本，为该语音识别文本赋予对应的重要度信息；

所述匹配度确定模块604，具体用于：

在再一种实施方式中，所述装置还包括：

热度值确定模块606，用于确定所述语音识别文本的热度值；

所述语音搜索模块603，具体用于：

在再一种实施方式中，所述装置还包括：

扩展判断模块607，用于判断所述语音识别文本是否存在扩展语音识别文本；

所述文本处理模块602，具体用于：

在再一种实施方式中，所述装置还包括：

文本转换模块608，用于对所述语音识别文本进行文本转换，得到转换后的语音识别文本。

实施例七

如图7所示，为本申请实施例七所提供的一种进行电子设备的结构示意图，包括：处理器701、存储器702和总线703，所述存储器702存储有所述处理器701可执行的机器可读指令，当电子设备运行时，所述处理器701与所述存储器702之间通过总线703通信，所述机器可读指令被所述处理器701执行时执行如下处理：

在一种实施方式中，所述语音识别文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；上述处理器701执行的处理中，所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

依次从所述语音识别文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

在另一种实施方式中，所述语音识别文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；上述处理器701执行的处理中，所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

在又一种实施方式中，所述语音识别文本包括至少一个字母，上述处理器701执行的处理中，所述至少一个字母对应的语言种类为英语类别；所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

依次从所述语音识别文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个语音识别文本。

在再一种实施方式中，在所述对所述语音识别文本进行处理之后，所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果之前，上述处理器701执行的处理还包括：

按照匹配度由高到低的顺序对所有候选搜索结果进行排名；

在再一种实施方式中，上述处理器701执行的处理中，所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，包括：

若一致，则确定该语音识别文本与该候选搜索结果匹配；

在具体实施中，在所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度之前，上述处理器701执行的处理还包括：

上述处理器701执行的处理中，所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，包括：

在再一种实施方式中，在所述确定所述目标语音对应的语音识别文本之后，所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果之前，上述处理器701执行的处理还包括：

确定所述语音识别文本的热度值；

上述处理器701执行的处理中，所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果，包括：

在具体实施中，在所述确定所述目标语音对应的语音识别文本之后，所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理之前，上述处理器701执行的处理还包括：

判断所述语音识别文本是否存在扩展语音识别文本；

上述处理器701执行的处理中，所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

在判断所述语音识别文本存在所述扩展语音识别文本时，基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，以及根据所述扩展语音识别文本对应的语言种类，对所述扩展语音识别文本进行处理。

实施例八

本申请实施例八还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器701运行时执行上述实施例所对应的语音搜索方法的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述语音搜索方法，从而解决目前语音搜索准确度较低的问题，达到提高语音搜索的准确度，提升用户的使用体验的效果。

基于相同的技术构思，本申请实施例还提供了一种计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行上述语音搜索方法的步骤，具体实现可参见上述方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考方法实施例中的对应过程，本申请中不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种语音搜索方法，其特征在于，所述方法包括：

基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果；其中，所述数据库预先存储有与各候选搜索结果相对应的搜索文本，通过对该候选搜索结果在多种语言种类下进行分析处理，得到该候选搜索结果相对应的搜索文本，以匹配确定目标语音对应的搜索结果；所述处理后的语音识别文本至少包括从所述语音识别文本中提取出的各个汉字以及任意多个汉字组合得到的汉字组。

2.根据权利要求1所述的方法，其特征在于，所述语音识别文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

依次从所述语音识别文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

3.根据权利要求1所述的方法，其特征在于，所述语音识别文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

4.根据权利要求1所述的方法，其特征在于，所述语音识别文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理，包括：

依次从所述语音识别文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个语音识别文本。

5.根据权利要求2~4任一所述的方法，其特征在于，在所述对所述语音识别文本进行处理之后，所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果之前，还包括：

按照匹配度由高到低的顺序对所有候选搜索结果进行排名；

6.根据权利要求5所述的方法，其特征在于，所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，包括：

若一致，则确定该语音识别文本与该候选搜索结果匹配；

7.根据权利要求5所述的方法，其特征在于，在所述确定处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度之前，还包括：

8.根据权利要求1所述的方法，其特征在于，在所述确定所述目标语音对应的语音识别文本之后，所述基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果之前，还包括：

确定所述语音识别文本的热度值；

9.根据权利要求1所述的方法，其特征在于，在所述确定所述目标语音对应的语音识别文本之后，所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理之前，还包括：

判断所述语音识别文本是否存在扩展语音识别文本；

10.根据权利要求1所述的方法，其特征在于，在所述确定所述目标语音对应的语音识别文本之后，所述基于所述语音识别文本对应的语言种类，对所述语音识别文本进行处理之前，还包括：

11.一种语音搜索装置，其特征在于，所述装置包括：

语音搜索模块，用于基于处理后的语音识别文本与数据库中的候选搜索结果之间的匹配度，确定所述目标语音对应的搜索结果；其中，所述数据库预先存储有与各候选搜索结果相对应的搜索文本，通过对该候选搜索结果在多种语言种类下进行分析处理，得到该候选搜索结果相对应的搜索文本，以匹配确定目标语音对应的搜索结果；所述处理后的语音识别文本至少包括从所述语音识别文本中提取出的各个汉字以及任意多个汉字组合得到的汉字组。

12.根据权利要求11所述的装置，其特征在于，所述语音识别文本包括至少一个汉字，所述至少一个汉字对应的语言种类为汉语类别；所述文本处理模块，具体用于：

依次从所述语音识别文本中提取出各个汉字；

将提取的任意多个汉字进行顺序组合，得到各个汉字组；

13.根据权利要求11所述的装置，其特征在于，所述语音识别文本包括至少一个拼音，所述至少一个拼音对应的语言种类为汉语类别；所述文本处理模块，具体用于：

将提取的任意多个拼音进行顺序组合，得到各个拼音组；

14.根据权利要求11所述的装置，其特征在于，所述语音识别文本包括至少一个字母，所述至少一个字母对应的语言种类为英语类别；所述文本处理模块，具体用于：

依次从所述语音识别文本中提取出各个字母；

将提取的任意多个字母进行顺序组合，得到各个字母组；

将每个所述字母组作为处理后的一个语音识别文本。

15.根据权利要求12~14任一所述的装置，其特征在于，还包括：

所述语音搜索模块，具体用于：

按照匹配度由高到低的顺序对所有候选搜索结果进行排名；

16.根据权利要求15所述的装置，其特征在于，所述匹配度确定模块，具体用于：

若一致，则确定该语音识别文本与该候选搜索结果匹配；

17.根据权利要求15所述的装置，其特征在于，还包括：

所述匹配度确定模块，具体用于：

18.根据权利要求11所述的装置，其特征在于，还包括：

热度值确定模块，用于确定所述语音识别文本的热度值；

所述语音搜索模块，具体用于：

19.根据权利要求11所述的装置，其特征在于，还包括：

所述文本处理模块，具体用于：

20.根据权利要求11所述的装置，其特征在于，还包括：

21.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行时执行如权利要求1至10任一所述的语音搜索方法的步骤。

22.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至10任一所述的语音搜索方法的步骤。