CN111291214A

CN111291214A - 一种检索文本的识别方法、装置及存储介质

Info

Publication number: CN111291214A
Application number: CN202010040062.0A
Authority: CN
Inventors: 林江; 周蓝珺; 潘树燊
Original assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Current assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date: 2020-01-15
Filing date: 2020-01-15
Publication date: 2020-06-16
Anticipated expiration: 2040-01-15
Also published as: CN111291214B

Abstract

本申请实施例公开了一种检索文本的识别方法、装置及存储介质，本申请实施例根据历史检索文本样本生成音频相应的核心文本语句；接收输入的待检索文本，并确定待检索文本与核心文本语句的相似度；当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将核心文本语句确定为目标核心文本语句；根据目标核心文本语句生成相应的识别结果。以此，用户输入待检索文本时，优先与音频最热门的核心文本语句进行匹配，当检测到待检索文本与核心文本语句匹配时，可以直接以该匹配的目标核心文本语句生成识别结果，避免了检索出现音频名或者音频歌手名等无效检索信息，提升了检索文本的识别准确率。

Description

一种检索文本的识别方法、装置及存储介质

技术领域

本申请涉及音频检索处理技术领域，具体涉及一种检索文本的识别方法、装置及存储介质。

背景技术

数字音频，顾名思义就是以数字信号的方式存储于网络服务器中的音频，在网络空间中流动传输，具有速度快的优点，可以根据人们的需求即时进行下载音频，数字音频不依赖传统的音乐载体，如磁带或CD等，可以避免磨损，能保证音频品质。

现有技术中，用户可以通过互联网检索各种需要的音频信息，比如，用户可以访问音频服务器提供的检索界面，并在该检索界面中输入需要相应的检索文本，音频服务器会根据该输入的检索文本返回相关音频信息的多个检索结果。

在对现有技术的研究和实践过程中，本申请的发明人发现，现有技术中，检索文本中可以包含音频名称、音频歌手名或者音频歌词等不同规则的信息，如果对检索文本的意图不进行识别，会返回很多不是用户需要的检索结果，造成服务器资源的浪费和检索速度的下降，检索文本的识别准确率较低。

发明内容

本申请实施例提供一种检索文本的识别方法、装置及存储介质，旨在提升检索文本的识别准确率。

为解决上述技术问题，本申请实施例提供以下技术方案：

一种检索文本的识别方法，包括：

根据历史检索文本样本生成音频相应的核心文本语句；

接收输入的待检索文本，并确定所述待检索文本与核心文本语句的相似度；

当检测到所述待检索文本与核心文本语句的相似度大于预设阈值时，将所述核心文本语句确定为目标核心文本语句；

根据所述目标核心文本语句生成相应的识别结果。

一种检索文本的识别装置，包括：

第一生成单元，用于根据历史检索文本样本生成音频相应的核心文本语句；

第一确定单元，用于接收输入的待检索文本，并确定所述待检索文本与核心文本语句的相似度；

第二确定单元，用于当检测到所述待检索文本与核心文本语句的相似度大于预设阈值时，将所述核心文本语句确定为目标核心文本语句；

第二生成单元，用于根据所述目标核心文本语句生成相应的识别结果。

在一些实施例中，所述确定子单元，具体用于：

计算所述检索文本与所述音频中每一文本语句的公共子序列和相应的杰卡德系数；

根据所述公共子序列和相应的杰卡德系数确定所述音频中的每一文本语句的相似度。

在一些实施例中，所述确定子单元，具体还用于：

计算所述公共子序列与相应的文本语句的第一文本比值；

将所述文本比值乘以第一权重，得到第一相似值；

将所述杰卡德系数乘以第二权重，得到第二相似值；

将所述第一相似值和第二相似值进行相加，以得到每一文本语句的相似度。

在一些实施例中，所述选取子单元，具体用于：

获取所述音频相应的点击位置顺序，并根据所述点击位置顺序确定相应的加权系数；

根据所述目标文本语句的相似度和所述加权系数确定出所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加，得到音频每一文本语句相应的总得分，并根据所述总得分由高至低的顺序选取预设数量的核心文本语句。

在一些实施例中，所述获取子单元，具体用于：

获取历史输入的检索文本和相应点击的音频；

当检测到检索文本中包含预设关键词时，将包含预设关键词的检索文本和相应点击的音频删除。

在一些实施例中，所述第一确定单元，具体用于：

用于接收输入的待检索文本，并获取所述待检索文本与核心文本语句的公共子序列；

计算所述公共子序列与核心文本语句的第二文本比值，并将所述第二文本比值确定为待检索文本与核心文本语句的相似度。

第三方面，本申请实施例提供的存储介质，其上存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行如本申请任一实施例提供的检索文本的识别方法。

本申请实施例通过根据历史检索文本样本生成音频相应的核心文本语句；接收输入的待检索文本，并确定待检索文本与核心文本语句的相似度；当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将核心文本语句确定为目标核心文本语句；根据目标核心文本语句生成相应的识别结果。以此，用户输入待检索文本时，优先与音频最热门的核心文本语句进行匹配，当检测到待检索文本与核心文本语句匹配时，可以直接以该匹配的目标核心文本语句生成识别结果，避免了检索出现音频名或者音频歌手名等无效检索信息，提升了检索文本的识别准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的检索文本的识别系统的场景示意图；

图2是本申请实施例提供的检索文本的识别方法的流程示意图；

图3是本申请实施例提供的检索文本的识别方法的另一流程示意图；

图4是本申请实施例提供的检索文本的识别方法的场景示意图；

图5a是本申请实施例提供的检索文本的识别装置的结构示意图；

图5b是本申请实施例提供的检索文本的识别装置的另一结构示意图；

图6是本申请实施例提供的服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种检索文本的识别方法、装置、及存储介质。

请参阅图1，图1为本申请实施例所提供的检索文本的识别系统的场景示意图，包括：终端A、和服务器(该评估系统还可以包括除终端A之外的其他终端，终端具体个数在此处不作限定)，终端A与服务器之间可以通过通信网络连接，该通信网络，可以包括无线网络以及有线网络，其中无线网络包括无线广域网、无线局域网、无线城域网、以及无线个人网中的一种或多种的组合。网络中包括路由器、网关等等网络实体，图中并未示意出。终端A可以通过通信网络与服务器进行信息交互，比如终端A在使用某个检索文本点击了相应的音频时，如检索“窗外的麻雀”，相应的点击了“八里香”音频时，会生成相应的历史检索文本样本，并将该历史检索文本样本上传至服务器中进行存储，服务器可以根据历史检索样本生成音频相应的核心文本语句，又比如终端A在使用某个待检索文本想进行检索时，如“窗外的”，可以将该待检索文本发送至服务器中，服务器可以根据该待检索文本和核心文本语句进行整体识别。

该检索文本的识别系统可以包括检索文本的识别装置，该检索文本的识别装置具体可以集成在服务器中，需要说明的是，在本申请的实施例中，以检索文本的识别装置集成在服务器中进行说明，在另一种实施方式中，该检索文本的识别装置还可以集成在终端中。在图1中，该服务器主要用于根据终端A发送的历史检索文本样本生成音频相应的核心文本语句，实时接收终端A输入的待检索文本，并确定该待检索文本与核心文本语句的相似度，当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将该核心文本语句确定为目标核心文本语句，确定终端A的搜索意图为歌词搜索意图，根据目标核心文本语句生成相应的识别结果，该识别结果为以核心文本语句为首的歌词排序，并将该识别结果发送到终端A上，终端A在收到识别结果后，可以快速获取自己需要的检索意图相应的歌词搜索结果，避免了音频名或者音频歌手名等无效检索信息，提升了检索文本的识别准确率。

该检索文本的识别系统还可以包括终端A，该终端A可以安装各种用户需要的应用，比如听歌应用、浏览器应用以及即时通讯应用等，在用户通过听歌应用输入检索文本并点击相应的音频时，会生成相应的历史检索文本样本并上传至服务器。或者用户在通过听歌应用输入待检索文本进行检索时，会将该待检索文本上传至服务器进行搜索。

需要说明的是，图1所示的检索文本的识别系统的场景示意图仅仅是一个示例，本申请实施例描述的检索文本的识别系统以及场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着检索文本的识别系统的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

以下分别进行详细说明。需说明的是，以下实施例的序号不作为对实施例优选顺序的限定。

实施例一、

在本实施例中，将从检索文本的识别装置的角度进行描述，该检索文本的识别装置具体可以集成在具备储存单元并安装有微处理器而具有运算能力的服务器中。

一种检索文本的识别方法，包括：根据历史检索文本样本生成音频相应的核心文本语句；接收输入的待检索文本，并确定待检索文本与核心文本语句的相似度；当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将核心文本语句确定为目标核心文本语句；根据目标核心文本语句生成相应的识别结果。

请参阅图2，图2是本申请实施例提供的检索文本的识别方法的流程示意图。该检索文本的识别方法包括：

在步骤101中，根据历史检索文本样本生成音频相应的核心文本语句。

其中，该历史检索文本样本为多个终端用户在输入检索文本下点击的音频的历史记录，该音频可以为歌曲，具体格式可以相同，也可以不同，如动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III，MP3)、无损音频压缩编码(FreeLossless Audio Codec，FLAC)或者OGG(OGGVobis)格式等等。

进一步的，可以收集多个终端用户的历史检索文本样本，该历史检索文本样本可以反映出主流用户的检索习惯，根据该历史检索文本样本确定每一音频的核心文本语句，需要说明的时，每一音频会有多个文本语句，比如每一首歌由很多歌词组成，该核心文本语句为多个文本语句中最受用户喜爱的核心文本语句，一首音频可以具有3个核心文本语句，也可以有5个核心文本语句，具体数量在此不作限定。

在一些实施方式中，根据历史检索文本样本生成音频相应的核心文本语句的步骤，包括：

(1)获取历史输入的检索文本和相应点击的音频；

(2)确定该检索文本与该音频中的每一文本语句的相似度；

(3)比较该相似度，将相似度最大的文本语句确定为目标文本语句；

(4)计算所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加，得到音频每一文本语句的总得分，并根据所述总得分由高至低的顺序选取预设数量的核心文本语句。

其中，获取多个终端用户在输入检索文本下相应点击的音频的历史记录，由于该音频中包括多个文本语句，如一首歌曲中会包括多个歌词，所以需要确定该检索文本与相应点击的音频中每一文本语句的相似度，该相似度可以通过公共子序列或杰卡德系数确定，该相似度越高，说明检索文本与文本语句的贴合度越高，该相似度越低，说明检索文本与文本语句的贴合度越低。

进一步的，比较每一相似度，将相似度最大的文本语句确定为目标文本语句，该目标文本语句为整个音频中与检索文本的贴合度最高的文本语句，即为用户需要的语句，因此，可以综合该目标文本语句的点击位置等因素进行打分，确定该目标文本语句的得分，并获取该目标文本语句的历史得分，该历史得分为目标文本语句历史记录的总得分，数值可以从零开始，在对该目标文本语句进行打分后，会将该目标文本语句的历史得分与得分进行累加，更新目标文本语句历史记录的总得分，以此类推，可以得到音频每一文本语句相应的总得分，该总得分越高的文本语句，说明受大众喜爱的程度越高，该总得分越低的文本语句，说明受大众喜爱的程度越低，所以可以根据该总得分由高到低的顺序选取预设数量的核心文本语句。

(1.1)获取历史输入的检索文本和相应点击的音频；

(1.2)当检测到检索文本中包含预设关键词时，将包含预设关键词的检索文本和相应点击的音频删除。

其中，获取多个终端用户在输入检索文本下相应点击的音频的历史记录，为了保证该检索文本下相应点击的音频的有效性和准确性，需要将一些明确的检索文本，如包含音频歌手名和音频名的检索文本和相应的点击的记录过滤，该预设关键词即为音频歌手名或者音频名，或者音频歌手名和音频名的组合。

进一步的，当检测到检索文本中包含预设关键词时，说明该条检索文本和相应点击的音频的记录为不符合条件的记录，需要将该包含预设关键词的检索文本和相应点击的音频删除。

在一些实施方式中，确定该检索文本与该音频中的每一文本语句的相似度的步骤，包括：

(2.1)计算该检索文本与该音频中每一文本语句的公共子序列和相应的杰卡德系数；

(2.2)根据该公共子序列和相应的杰卡德系数确定该音频中的每一文本语句的相似度。

其中，可以计算该检索文本与该音频中每一文本语句的公共子序列和相应的杰卡德系数，该公共子序列为在两个字符串中，有些字符会一样，可以形成的子序列也有可能相等，因此，长度最长的相等子序列便是两者间的最长公共字序列，如字符串1：BDCABA，字符串2：ABCBDAB，则这两个字符串的最长公共子序列长度为4，最长公共子序列是：BCBA。该杰卡德系数为比较有限样本集之间的相似性与差异性。杰卡德系数值越大，样本相似度越高。

进一步的，可以根据该公共子序列和相应的杰卡德系数共同确定出音频中的每一文本语句的相似度，该公共子序列和杰卡德系数越高，相应的相似度越高，该公共子序列和杰卡德系数越低，相应的相似度越低。

在一些实施方式中，该根据该公共子序列和相应的杰卡德系数确定该音频中的每一文本语句的相似度的步骤，包括：

(3.1)计算该公共子序列与相应的文本语句的第一文本比值；

(3.2)将该文本比值乘以第一权重，得到第一相似值；

(3.3)将该杰卡德系数乘以第二权重，得到第二相似值；

(3.4)将该第一相似值和第二相似值进行相加，以得到每一文本语句的相似度。

该相似度得分可以如下公式所示：

Similarity＝a*最长公共子序列/文本语句长度+b*jaccard(检索文本长度，文本语句长度)

其中，该Similarity即为相似度，该a为第一权重，该b为第二权重，该a与b的和为1，计算该公共子序列与相应的文本语句的第一文本比值，将该文本比值乘以第一权重，得到第一相似值，将该杰卡德系数乘以第二权重，得到第二相似值，将该第一相似值和第二相似度相加，以得到每一文本语句的相似度。

在一些实施方式中，计算该目标文本语句相应的得分并进行累加的步骤，包括：

(4.1)获取该音频相应的点击位置顺序，并根据该点击位置顺序确定相应的加权系数；

(4.2)根据所述目标文本语句的相似度和所述加权系数确定出所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加。

其中，可以获取该音频在被点击时的点击位置顺序，该点击位置顺序表示这个音频在检索文本的检索结果下的排序位置，该点击位置顺序越高，相应的加权系数越高，该点击位置顺序越低，相应的加权系数越低。

进一步的，可以根据该加权系数对该目标文本语句的相似度进行加权，得到该目标文本语句的得分，并获取该目标文本语句的历史得分，将该得分与历史得分进行累加，可以得到该目标文本语句的总得分。

在步骤102中，接收输入的待检索文本，并确定待检索文本与核心文本语句的相似度。

可以理解的是，现有的音频文本搜索是直接将音频的文本语句进行分词，构建索引，然后在搜索阶段按照用户检索文本分词，在索引中进行匹配召回。这种形式的主要问题是，检索文本中的信息是不确定的，检索文本可能会包含不同音频名或者歌手名字等等，如很多音频名和文本语句有重复的词，如果对检索文本的意图不加以区分，会召回很多不是用户想要的结果。

因此，本申请实施例可以接收用户输入的待检索文本，优先将该待检索文本与最受用户喜欢的核心文本语句进行匹配，确定出待检索文本与核心文本语句的相似度，该相似度越高，说明该待检索文本与核心文本语句的相似度越高，该相似度越低，说明该待检索文本与核心文本语句的相似度越低。

在一些实施方式中，确定该待检索文本与核心文本语句的相似度的步骤，包括：

(1)获取该待检索文本与核心文本语句的公共子序列；

(2)计算该公共子序列与核心文本语句的第二文本比值，并将该第二文本比值确定为待检索文本与核心文本语句的相似度。

其中，可以计算该待检索文本与核心文本语句的公共子序列，并计算该公共子序列与核心文本语句的第二文本比值，该第二文本比值的值越高，说明该第二文本比值与核心文本语句的相似度越高，该第二文本比值的值越低，说明该第二文本比值与核心文本语句的相似度越低。

在步骤103中，当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将核心文本语句确定为目标核心文本语句。

其中，该预设阈值为界定该待检索文本与核心文本语句是否匹配的临界值，当检测到待检索文本与核心文本语句的相似度大于预设阈值时，说明用户的检索意图即为文本语句的检索意图，将该相似度大于预设阈值的核心文本语句确定为目标核心文本语句。

在步骤104中，根据目标核心文本语句生成相应的识别结果。

其中，由于该目标核心文本语句与待检索文本的相似度大于一定预设阈值，即说明用户的检索意图即为文本语句的检索意图，可以直接进行文本语句召回，将该目标核心文本语句优先排序，显示将该目标核心文本语句优先排序的识别结果，可以减少其他无关检索召回数据量，提升检索速度和准确率。

由上述可知，本申请实施例通过根据历史检索文本样本生成音频相应的核心文本语句；接收输入的待检索文本，并确定待检索文本与核心文本语句的相似度；当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将核心文本语句确定为目标核心文本语句；根据目标核心文本语句生成相应的识别结果。以此，用户输入待检索文本时，优先与音频最热门的核心文本语句进行匹配，当检测到待检索文本与核心文本语句匹配时，可以直接以该匹配的目标核心文本语句生成识别结果，避免了检索出现音频名或者音频歌手名等无效检索信息，提升了检索文本的识别准确率。

实施例二、

根据实施例一所描述的方法，以下将举例作进一步详细说明。

在本实施例中，将以该检索文本的识别装置具体集成在服务器中，该音频为歌曲为例进行说明。

请参阅图3，图3为本申请实施例提供的检索文本的识别方法的另一流程示意图。该方法流程可以包括：

在步骤201中，服务器获取历史输入的检索文本和相应点击的音频。

其中，服务器获取多个终端用户在输入检索文本下相应点击的歌曲的历史记录，该历史记录可以为多个，如10000条历史记录，具体数量以实际应用为准。

在步骤202中，当服务器检测到检索文本中包含预设关键词时，将包含预设关键词的检索文本和相应点击的音频删除。

其中，该预设关键词可以为歌曲名加歌手名，如周伦加八里香的预设关键词，当服务器检测到检索文本中包含该歌曲名加歌手名时，判定为该检测文本和相应的点击的音频为明确检索，对于用户习惯没有任何帮助，可以将该包含预设关键词的检索文本和相应点击的音频的记录删除。

在步骤203中，服务器计算检索文本与音频中每一文本语句的公共子序列和相应的杰卡德系数。

其中，服务器可以计算检索文本与歌曲中每一句歌词的公共子序列和相应的杰卡德系数，如检索文本为“雨整”与歌曲中的一句歌词“雨下整夜”的公共子序列为雨整，杰卡德系数为交集“雨整”与并集“雨整雨下整夜”的比值0.3。

在步骤204中，服务器计算公共子序列与相应的文本语句的第一文本比值，将文本比值乘以第一权重，得到第一相似值，将杰卡德系数乘以第二权重，得到第二相似值，将第一相似值和第二相似值进行相加，以得到每一文本语句的相似度。

其中，服务器计算公共子序列“雨整”与相应的文本语句“雨下整夜”的比值，为0.5，假设第一权重为0.5，第二权重也为0.5，那么将第一文本比值乘以0.5，得到第一相似值0.25，将杰卡德系数0.3乘以0.5，得到第二相似值0.15，将第一相似值和第二相似值进行相加，得到文本语句的相似度为0.4，以此类推，可以得到每一文本语句的相似度。

在步骤205中，服务器比较相似度，将相似度最大的文本语句确定为目标文本语句。

其中，服务器比较每一文本语句的相似度，将相似度最大的文本语句确定为目标文本语句，该目标文本语句为整个歌曲中与检索文本最相似的歌词。

在步骤206中，服务器获取音频相应的点击位置顺序，并根据点击位置顺序确定相应的加权系数，根据所述目标文本语句的相似度和所述加权系数确定出所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加，得到音频每一文本语句相应的总得分，并根据总得分由高至低的顺序选取预设数量的核心文本语句。

其中，服务器获取歌曲相应的点击位置顺序，该点击位置顺序表示这首歌曲在检索文本的检索结果下的排序位置，该点击位置顺序越高，相应的加权系数越高，该点击位置顺序越低，相应的加权系数越低。

进一步的，可以计算该目标文本语句的相似度和加权系数的乘积确定出相应的得分，并将该得分与之前的历史得分进行累加，以得到歌曲中每一文本语句相应的总得分，并根据总得分由高至低的顺序选取预设数量的核心文本语句，如根据总得分由高至低的顺序选取5个核心歌词，该核心歌词为受大众喜欢程度最高的歌词。

在步骤207中，服务器接收输入的待检索文本，并获取待检索文本与核心文本语句的公共子序列，计算公共子序列与核心文本语句的第二文本比值，并将第二文本比值确定为待检索文本与核心文本语句的相似度。

其中，服务器可以接收输入的待检索文本，该待检索文本为用户在终端上输入的待检索文本，如图4所示，用户在终端10上的音乐应用中输入文本“窗外的”，终端10会根据该“窗外的”生成待检索文本，并将该待检索文本发送至服务器中，该服务器接收该输入的待检索文本“窗外的”，并获取待检索文本“窗外的”与核心歌词的公共子序列，如核心歌词为“窗外的风”，那么该公共子序列为“窗外的”。

进一步的，计算该公共子序列与核心歌词的第二文本比值为0.75，并将该第二比值0.75确定为该检索文本与核心文本语句的相似度。

在步骤208中，服务器检测待检索文本与核心文本语句的相似度是否大于预设阈值。

其中，该预设阈值为界定该待检索文本与核心歌词是否匹配的临界值，如0.4，相应的，当服务器检测到待检索文本与核心文本语句的相似度大于预设阈值时，执行步骤209，当服务器检测到待检索文本与核心文本语句的相似度不大于预设阈值时，继续执行检测待检索文本与核心文本语句的相似度是否大于预设阈值的步骤。

在步骤209中，服务器将核心文本语句确定为目标核心文本语句，根据目标核心文本语句生成相应的识别结果。

其中，当服务器检测到待检索文本与核心文本语句的相似度0.75大于预设阈值0.4时，将该核心文本语句确定为目标核心文本语句，且判定为用户的检索意图即为歌词的检索意图，可以直接进行歌词的检索结果召回，将该目标核心歌词优先排序，并生成相应的识别结果。

如图4所示，服务器直接根据该目标核心歌词“窗户的风”生成检索结果，将该检索结果返回至终端11进行显示，可以看出，在该待检索文本“窗外的”的待检索文本下，该目标核心歌词“窗外的风”处于最优排序顺序，针对用户的检索意图进行排序，减少了其他关于歌曲名和歌手名的无效检索，提升了检索速度和准确率。

由上述可知，本申请实施例通过服务器获取历史输入的检索文本和相应点击的音频，并对包含预设关键词的检索文本和相应点击的音频进行过滤，服务器计算过滤后的检索文本和每一语句的公共子序列和相应的杰卡德系数，根据该公共子序列和杰卡德系数的运算确定出每一文本语句的相似度，确定出相似度最大目标文本语句，根据目标文本语句的相似度和相应的音频的点击位置顺序的加权系数进行计算，算出该目标文本语句的得分并计算累加，以得到音频每一文本语句相应的总得分，并根据总得分由高至低的顺序选取预设数量的核心文本语句，之后，服务器接收输入的待检索文本，根据待检索文本与核心文本语句的公共子序列，并计算公共子序列与核心文本语句的第二文本比值确定出对应的相似度，当服务器检测到检索文本与核心文本语句的相似度大于预设阈值时，确定用户的检索意图为核心文本语句，直接将相似度大于预设阈值的核心文本语句确定为目标核心文本语句，并根据目标核心文本语句生成相应的识别结果。以此，用户输入待检索文本时，优先与用户在使用音频最热门的核心文本语句进行匹配，当检测到待检索文本与核心文本语句匹配时，可以直接以该匹配的目标核心文本语句生成识别结果，避免了检索出现音频名或者音频歌手名等无效检索信息，提升了检索文本的识别准确率。

实施例三、

为便于更好的实施本申请实施例提供的检索文本的识别方法，本申请实施例还提供一种基于上述检索文本的识别方法的装置。其中名词的含义与上述检索文本的识别方法中相同，具体实现细节可以参考方法实施例中的说明。

请参阅图5a，图5a为本申请实施例提供的检索文本的识别装置的结构示意图，其中该检索文本的识别装置可以包括第一生成单元301、第一确定单元302、第二确定单元303及第二生成单元304。

第一生成单元301，用于根据历史检索文本样本生成音频相应的核心文本语句。

其中，该历史检索文本样本为多个终端用户在输入检索文本下点击的音频的历史记录，该音频可以为歌曲，具体格式可以相同，也可以不同，如MP3、FLAC或者OGG格式等等。

进一步的，可第一生成单元301以收集多个终端用户的历史检索文本样本，该历史检索文本样本可以反映出主流用户的检索习惯，根据该历史检索文本样本确定每一音频的核心文本语句，需要说明的时，每一音频会有多个文本语句，比如每一首歌由很多歌词组成，该核心文本语句为多个文本语句中最受用户喜爱的核心文本语句，一首音频可以具有3个核心文本语句，也可以有5个核心文本语句，具体数量在此不作限定。

在一些实施方式中，如图5b所示，第一生成单元301可以包括获取子单元3011、确定子单元3012、比较子单元3013以及选取子单元3014，如下：

获取子单元3011，用于获取历史输入的检索文本和相应点击的音频。

确定子单元3012，用于确定该检索文本与该音频中的每一文本语句的相似度。

比较子单元3013，用于比较该相似度，将相似度最大的文本语句确定为目标文本语句。

选取子单元3014，用于计算所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加，得到音频每一文本语句的总得分，并根据所述总得分由高至低的顺序选取预设数量的核心文本语句。

在一些实施方式中，该确定子单元3012，具体用于：计算该检索文本与该音频中每一文本语句的公共子序列和相应的杰卡德系数；根据该公共子序列和相应的杰卡德系数确定该音频中的每一文本语句的相似度。

在一些实施方式中，该确定子单元3012，具体还用于：计算该检索文本与该音频中每一文本语句的公共子序列和相应的杰卡德系数；计算该公共子序列与相应的文本语句的第一文本比值；将该文本比值乘以第一权重，得到第一相似值；将该杰卡德系数乘以第二权重，得到第二相似值；将该第一相似值和第二相似值进行相加，以得到每一文本语句的相似度。

在一些实施方式中，该选取子单元3014，具体用于：获取该音频相应的点击位置顺序，并根据该点击位置顺序确定相应的加权系数；根据所述目标文本语句的相似度和所述加权系数确定出所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加，得到音频每一文本语句相应的总得分，并根据该总得分由高至低的顺序选取预设数量的核心文本语句。

在一些实施方式中，该获取子单元3011，具体用于：获取历史输入的检索文本和相应点击的音频；当检测到检索文本中包含预设关键词时，将包含预设关键词的检索文本和相应点击的音频删除。

第一确定单元302，用于接收输入的待检索文本，并确定该待检索文本与核心文本语句的相似度。

因此，第一确定单元302可以接收用户输入的待检索文本，优先将该待检索文本与最受用户喜欢的核心文本语句进行匹配，确定出待检索文本与核心文本语句的相似度，该相似度越高，说明该待检索文本与核心文本语句的相似度越高，该相似度越低，说明该待检索文本与核心文本语句的相似度越低。

第二确定单元303，用于当检测到该待检索文本与核心文本语句的相似度大于预设阈值时，将该核心文本语句确定为目标核心文本语句。

其中，该预设阈值为界定该待检索文本与核心文本语句是否匹配的临界值，当第二确定单元303检测到待检索文本与核心文本语句的相似度大于预设阈值时，说明用户的检索意图即为文本语句的检索意图，将该相似度大于预设阈值的核心文本语句确定为目标核心文本语句。

第二生成单元304，用于根据该目标核心文本语句生成相应的识别结果。

其中，由于该目标核心文本语句与待检索文本的相似度大于一定预设阈值，即说明用户的检索意图即为文本语句的检索意图，第二生成单元304可以直接进行文本语句召回，将该目标核心文本语句优先排序，显示将该目标核心文本语句优先排序的识别结果，可以减少其他无关检索召回数据量，提升检索速度和准确率。

以上各个单元的具体实施可参见前面的实施例，在此不再赘述。

由上述可知，本申请实施例通过第一生成单元301根据历史检索文本样本生成音频相应的核心文本语句；第一确定单元302接收输入的待检索文本，并确定待检索文本与核心文本语句的相似度；第二确定单元303当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将核心文本语句确定为目标核心文本语句；第二生成单元304根据目标核心文本语句生成相应的识别结果。以此，用户输入待检索文本时，优先与音频最热门的核心文本语句进行匹配，当检测到待检索文本与核心文本语句匹配时，可以直接以该匹配的目标核心文本语句生成识别结果，避免了音频名或者音频歌手名等无效检索信息，提升了检索文本的识别准确率。

实施例四、

本申请实施例还提供一种服务器，如图6所示，其示出了本申请实施例所涉及的服务器的结构示意图，具体来讲：

该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图6中示出的服务器结构并不构成对服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

其中：

处理器401是该服务器的控制中心，利用各种接口和线路连接整个服务器的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行服务器的各种功能和处理数据，从而对服务器进行整体监控。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据服务器的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

服务器还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该服务器还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，服务器还可以包括显示单元等，在此不再赘述。具体在本实施例中，服务器中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：

根据历史检索文本样本生成音频相应的核心文本语句；

接收输入的待检索文本，并确定该待检索文本与核心文本语句的相似度；

当检测到该待检索文本与核心文本语句的相似度大于预设阈值时，将该核心文本语句确定为目标核心文本语句；

根据该目标核心文本语句生成相应的识别结果。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文针对检索文本的识别方法的详细描述，此处不再赘述。

由上述可知，本申请实施例的服务器可以通过根据历史检索文本样本生成音频相应的核心文本语句；接收输入的待检索文本，并确定待检索文本与核心文本语句的相似度；当检测到待检索文本与核心文本语句的相似度大于预设阈值时，将核心文本语句确定为目标核心文本语句；根据目标核心文本语句生成相应的识别结果。以此，用户输入待检索文本时，优先与音频最热门的核心文本语句进行匹配，当检测到待检索文本与核心文本语句匹配时，可以直接以该匹配的目标核心文本语句生成识别结果，避免了音频名或者音频歌手名等无效检索信息，提升了检索文本的识别准确率。

实施例五、

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种检索文本的识别方法中的步骤。例如，该指令可以执行如下步骤：

根据历史检索文本样本生成音频相应的核心文本语句；

根据该目标核心文本语句生成相应的识别结果。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种检索文本的识别方法中的步骤，因此，可以实现本申请实施例所提供的任一种检索文本的识别方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种检索文本的识别方法、装置、存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种检索文本的识别方法，其特征在于，包括：

根据历史检索文本样本生成音频相应的核心文本语句；

根据所述目标核心文本语句生成相应的识别结果。

2.根据权利要求1所述的识别方法，其特征在于，所述根据历史检索文本样本生成音频相应的核心文本语句的步骤，包括：

获取历史输入的检索文本和相应点击的音频；

确定所述检索文本与所述音频中的每一文本语句的相似度；

比较所述相似度，将相似度最大的文本语句确定为目标文本语句；

计算所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加，得到音频每一文本语句的总得分，并根据所述总得分由高至低的顺序选取预设数量的核心文本语句。

3.根据权利要求2所述的识别方法，其特征在于，所述确定所述检索文本与所述音频中的每一文本语句的相似度的步骤，包括：

4.根据权利要求3所述的识别方法，其特征在于，所述根据所述公共子序列和相应的杰卡德系数确定所述音频中的每一文本语句的相似度的步骤，包括：

计算所述公共子序列与相应的文本语句的第一文本比值；

将所述文本比值乘以第一权重，得到第一相似值；

将所述杰卡德系数乘以第二权重，得到第二相似值；

5.根据权利要求2至4任一项所述的识别方法，其特征在于，所述计算所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加的步骤，包括：

根据所述目标文本语句的相似度和所述加权系数确定出所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加。

6.根据权利要求2至4任一项所述的识别方法，其特征在于，所述获取历史输入的检索文本和相应点击的音频的步骤，包括：

获取历史输入的检索文本和相应点击的音频；

7.根据权利要求1至4任一项所述的识别方法，其特征在于，所述确定所述待检索文本与核心文本语句的相似度的步骤，包括：

获取所述待检索文本与核心文本语句的公共子序列；

8.一种检索文本的识别装置，其特征在于，包括：

9.根据权利要求8所述的识别装置，其特征在于，所述第一生成单元，包括：

获取子单元，用于获取历史输入的检索文本和相应点击的音频；

确定子单元，用于确定所述检索文本与所述音频中的每一文本语句的相似度；

比较子单元，用于比较所述相似度，将相似度最大的文本语句确定为目标文本语句；

选取子单元，用于计算所述目标文本语句的得分，基于所述目标文本语句的历史得分与所述得分进行累加，得到音频每一文本语句的总得分，并根据所述总得分由高至低的顺序选取预设数量的核心文本语句。

10.一种存储介质，其上存储有计算机程序，其特征在于，当所述计算机程序在计算机上运行时，使得所述计算机执行如权利要求1至7任一项所述的检索文本的识别方法。