CN111161730B

CN111161730B - 语音指令匹配方法、装置、设备及存储介质

Info

Publication number: CN111161730B
Application number: CN201911378449.0A
Authority: CN
Inventors: 谢云龙; 彭庆凯; 周志国
Original assignee: China United Network Communications Group Co Ltd; Unicom Big Data Co Ltd
Current assignee: China United Network Communications Group Co Ltd; Unicom Big Data Co Ltd
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2022-10-04
Anticipated expiration: 2039-12-27
Also published as: CN111161730A

Abstract

本发明提供一种语音指令匹配方法、装置、设备及存储介质，通过获取用户的语音指令并进行语音识别；对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语；获取所述匹配词语在所述系统内置指令中的预设权重之和；判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。通过将语音指令与系统内置指令进行词语匹配，并基于匹配权重和词性分析，可提高语音指令与系统内置指令匹配的准确率，提高用户体验。

Description

语音指令匹配方法、装置、设备及存储介质

技术领域

本发明涉及语音处理技术领域，尤其涉及一种语音指令匹配方法、装置、设备及存储介质。

背景技术

随着科技和经济的飞速发展，信息流通速度越来越快，人们之间的交流越来越密切，互联网行业的正在改变人们的生活，大数据时代正在到来。大数据技术是指掌握庞大的数据信息，并对这些含有意义的数据进行专业化处理。在大数据技术中的数据展示成为人们关注的重点。

目前，通常采用可视化大屏呈现数据，也就是以超大屏幕的方式布置于展厅、指挥中心等场所，通过键盘鼠标、语音控制、手势控制等方式进行人机交互，数据的可视化可以增强数据的呈现效果，方便用户以更加直观的方式观察数据，进而发现数据中隐藏的信息。在可视化大屏通过语音控制进行人机交互时，只有在用户说出的指令和内置指令完全一致时，才能匹配成功，控制可视化大屏才能根据语音指令进行相关操作，因此上述可视化大屏的语音控制存在指令匹配率低、语音控制不便、影响用户体验的问题。

发明内容

本发明提供一种语音指令匹配方法、装置、设备及存储介质，以提高语音指令与系统内置指令匹配的准确率。

本发明的第一方面是提供一种语音指令匹配方法，包括：

获取用户的语音指令并进行语音识别；

对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语；

获取所述匹配词语在所述系统内置指令中的预设权重之和；

判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。

本发明的第二方面是提供一种语音指令匹配装置，包括：

获取模块，用于获取用户的语音指令并进行语音识别；

匹配模块，用于对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语；

处理模块，用于获取所述匹配词语在所述系统内置指令中的预设权重之和；判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。

本发明的第三方面是提供一种语音指令匹配设备，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如第一方面所述的方法。

本发明的第四方面是提供一种计算机可读存储介质，其上存储有计算机程序；

所述计算机程序被处理器执行时实现如第一方面所述的方法。

本发明提供的语音指令匹配方法、装置、设备及存储介质，通过获取用户的语音指令并进行语音识别；对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语；获取所述匹配词语在所述系统内置指令中的预设权重之和；判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。通过将语音指令与系统内置指令进行词语匹配，并基于匹配权重和词性分析，可提高语音指令与系统内置指令匹配的准确率，提高用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的语音指令匹配方法流程图；

图2为本发明另一实施例提供的语音指令匹配装置的结构图；

图3为本发明另一实施例提供的语音指令匹配设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的语音指令匹配方法，针对可视化大屏等电子设备(可不限于可视化大屏)的语音控制存在指令匹配率低、语音控制不便、影响用户体验的问题，通过将语音指令与系统内置指令进行词语匹配，并基于匹配权重和词性分析，可提高语音指令与系统内置指令匹配的准确率，提高用户体验。

下面结合具体的实施例对语音指令匹配过程进行详细的描述。

图1为本发明实施例提供的语音指令匹配方法流程图。本实施例提供了一种语音指令匹配方法，该方法具体步骤如下：

S101、获取用户的语音指令并进行语音识别。

在本实施例中，通过麦克风等设备采集用户的语音指令，或者通过其他途径获取用户的语音指令，例如接收其他设备采集到的用户的语音指令。进一步的可对获取到的用户的语音指令进行语音识别，得到语音指令对应的文本指令，下述步骤中所指的语音指令均为语音指令对应的文本指令。

S102、对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语。

在本实施例中，对语音指令进行分词，具体可依据第三方开源分词库和/或用户自定义词库对所述语音指令进行分词，其中分词方法可以采用现有的分词方法，此处不再赘述。

在得到语音指令的分词结果后，可将分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，其中预设指令库中包括至少一条系统内置指令，可预先对预设指令库中的各系统内置指令进行分词和标注词性，并设置每一系统内置指令中的各词语在该系统内置指令中的预设权重。

因此本实施例中可将分词结果与预设指令库中任意一条系统内置指令进行匹配，也即将分词结果中每个词与任意一条系统内置指令中的每个词进行一一匹配，获取分词结果与系统内置指令之间的匹配词语。

S103、获取所述匹配词语在所述系统内置指令中的预设权重之和。

在本实施例中，由于预先设置预设指令库中的每一系统内置指令中的各词语在该系统内置指令中的预设权重，因此可获取各匹配词语在该系统内置指令中的预设权重，然后进行加和，得到所述预设权重之和。

S104、判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。

在本实施例中，当预设权重之和大于预设阈值，说明语音指令与该系统内置指令的相似度满足要求，而分词结果中包含动词和名词，则说明该语音指令中包括需要执行的动作和对象，满足指令的基本格式，因此确定该语音指令与该系统内置指令相匹配，进而则可根据系统内置指令执行相应的动作。否则，匹配失败，结束操作和/或发出匹配失败提示。

其中，可选的，在判断所述分词结果中是否包含动词和名词时，可具体包括：

对所述分词结果进行词性标注，根据词性标注结果判断所述分词结果中是否包含名词和动词；或者

获取所述匹配词语的预先标注的词性，根据匹配词语的词性判断所述分词结果是否包含名词和动词。

在本实施例中，可对语音指令的分词结果进行词性标注，然后根据词性标注结果判断分词结果中是否包含名词和动词；或者也可预先对预设指令库中的各系统内置指令进行分词和标注词性，此时可根据匹配词语预先标注的词性，判断分词结果是否包含名词和动词。

本实施例提供的语音指令匹配方法，通过获取用户的语音指令并进行语音识别；对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语；获取所述匹配词语在所述系统内置指令中的预设权重之和；判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。通过将语音指令与系统内置指令进行词语匹配，并基于匹配权重和词性分析，可提高语音指令与系统内置指令匹配的准确率，提高用户体验。

在上述实施例的基础上，所述将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配之前，还可包括：

对所述预设指令库中的各系统内置指令进行分词和标注词性，并设置每一系统内置指令中的各词语在该系统内置指令中的预设权重。

在本实施例中，可使用第三方开源分词库和/或用户自定义词库对预设指令库中的各系统内置指令进行分词和标注词性，其中词性可分为两大类：实词和虚词，其中实词包含名词、动词、形容词、状态词、区别词、数词、量词、代词，虚词包含副词、介词、连词、助词、拟声词、叹词。本实施例中分词和标注词性可采用现有技术中的任意分词方法和标注词性方法，此处不再赘述。

进一步，还需要设置各系统内置指令中每一个词语在该系统内置指令中的预设权重。具体的，可通过如下过程实现：

对于任一系统内置指令，设置各名词的预设权重之和为第一权重值、且每一名词的预设权重相等；

设置各动词的预设权重之和为第二权重值、且每一动词的预设权重相等；

设置各量词的预设权重之和为第三权重值、且每一量词的预设权重相等；

设置其他实词的预设权重之和为第四权重值、且每一其他实词的预设权重相等；

设置各虚词的预设权重为0；

所述第一权重值、所述第二权重值、所述第三权重值以及所述第四权重值之和为100％。

例如，对于任一系统内置指令，设置各虚词的预设权重为0；实词中的名词的预设权重之和为35％，动词的预设权重之和也为35％，量词的预设权重之和为20％，其他词语权重为10％，如果出现多个词性相同的词语，则平分该词性所占据的权重，例如系统内置指令中包括两个量词，则每一量词的预设权重为10％。在此基础上，若后续判断匹配词语在所述系统内置指令中的预设权重之和大于预设阈值(70％)、且分词结果中包含动词和名词，则确定所述语音指令与所述系统内置指令相匹配。

在上述任一实施例的基础上，所述将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配前，还可包括：

根据汉语语言模型N-Gram对所述语音指令进行预处理，以对所述语音指令进行纠错。

在本实施例中，由于用户的语音指令可能存在一定的错误，例如语法错误、语句不通顺等，可根据汉语语言模型N-Gram对语音指令进行纠错，其中N-Gram模型为一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为N的滑动窗口操作，形成了长度是N的字节片段序列，每一个字节片段称为Gram，对所有Gram的出现频度进行统计，并且按照事先设定好的阈值进行过滤，形成关键Gram列表，也就是这个文本的向量特征空间，列表中的每一种Gram就是一个特征向量维度。该模型基于这样一种假设，第N个词的出现只与前面N-1个词相关，而与其它任何词都不相关，整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。常用的是二元的Bi-Gram和三元的Tri-Gram。

本实施例中，通过N-Gram模型对所述语音指令进行纠错处理，具体如下：

预料库可以包括预设指令库中系统内置指令，计算语音指令字符串和系统内置指令字符串之间的距离，其中N-Gram模型定义字符串距离，采用非重复的N-Gram分词为基础来定义N-Gram距离这一概念，可以用公式来表述：|G_N(s)|+|G_N(t)|-2×|G_N(s)∩G_N(t)|其中，|G_N(s)|是字符串s的N-Gram集合，|G_N(t)|是字符串t的N-Gram集合，N-Gram表示按长度N切分原词得到的词段，N值一般取2或者3。当N取不同的值的时候根据公式计算字符串之间的距离，字符串之间的距离越小，它们就越接近。当两个字符串之间的距离为0时则两个字符串相等。

通过计算语音指令字符串和预料率中系统内置指令字符串的距离，可实现对语音指令的纠正。

当n＝1，一元模型(unigram model)即为：

当n＝2，二元模型(bigram model)即为:

对于unigram model而言，其中C(w₁,…,w_n)表示N-Gram w₁,…w_n在训练语料中出现的次数，M是语料库中的总字数

对于bigram model而言

考虑到语料库总容量有限，因此引入数据平滑算法，避免某些概率为0的句子出现。

通过计算我们可以得出每个词语的概率，概率越高则认为语音指令句子的合理性越高。最终通过纠错处理后，我们得到概率最高的句子作为语音指令纠错后的结果，进而以语音指令纠错后的结果为对象进行后续的匹配过程。

上述各实施例提供的语音指令匹配方法，通过将语音指令与系统内置指令进行词语匹配，并基于匹配权重和词性分析，以及且在匹配前对语音指令进行纠错处理，可极大的提高语音指令与系统内置指令匹配的准确率。

图2为本发明实施例提供的语音指令匹配装置的结构图本实施例提供的语音指令匹配装置可以执行语音指令匹配方法实施例提供的处理流程，如图2所示，所述语音指令匹配装置包括获取模块201、匹配模块202及处理模块203。

获取模块201，用于获取用户的语音指令并进行语音识别；

匹配模块202，用于对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语；

处理模块203，用于获取所述匹配词语在所述系统内置指令中的预设权重之和；判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。

在上述任一实施例的基础上，所述处理模块203在判断所述分词结果中是否包含动词和名词时，用于：

在上述任一实施例的基础上，所述装置还包括：

系统内置指令处理模块203，用于对所述预设指令库中的各系统内置指令进行分词和标注词性，并设置每一系统内置指令中的各词语在该系统内置指令中的预设权重。

在上述任一实施例的基础上，所述系统内置指令处理模块203在设置每一系统内置指令中的各词语在该系统内置指令中的预设权重时，用于：

设置各虚词的预设权重为0；

在上述任一实施例的基础上，所述装置还包括：

预处理模块203，用于在将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配前，根据汉语语言模型N-Gram对所述语音指令进行预处理，以对所述语音指令进行纠错。

本发明实施例提供的语音指令匹配装置可以具体用于执行上述图1所提供的语音指令匹配方法实施例，具体功能此处不再赘述。

本发明实施例提供的语音指令匹配装置，通过获取用户的语音指令并进行语音识别；对所述语音指令进行分词，将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配，获取所述分词结果与所述系统内置指令之间的匹配词语；获取所述匹配词语在所述系统内置指令中的预设权重之和；判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配。通过将语音指令与系统内置指令进行词语匹配，并基于匹配权重和词性分析，可提高语音指令与系统内置指令匹配的准确率，提高用户体验。

图3为本发明实施例提供的语音指令匹配设备的结构示意图。本发明实施例提供的语音指令匹配设备可以执行语音指令匹配方法实施例提供的处理流程，如图3所示，语音指令匹配设备30包括存储器31、处理器32、计算机程序和通讯接口33；其中，计算机程序存储在存储器31中，并被配置为由处理器32执行以上实施例所述的语音指令匹配方法。

图3所示实施例的语音指令匹配设备可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

另外，本实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行以实现上述实施例所述的语音指令匹配方法。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种语音指令匹配方法，其特征在于，包括：

获取用户的语音指令并进行语音识别；

获取所述匹配词语在所述系统内置指令中的预设权重之和；

判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配；

所述将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配之前，还包括：

对所述预设指令库中的各系统内置指令进行分词和标注词性，并根据所述标注词性设置每一系统内置指令中的各词语在该系统内置指令中的预设权重。

2.根据权利要求1所述的方法，其特征在于，判断所述分词结果中是否包含动词和名词，包括：

3.根据权利要求1所述的方法，其特征在于，所述设置每一系统内置指令中的各词语在该系统内置指令中的预设权重，包括：

设置各虚词的预设权重为0；

所述第一权重值、所述第二权重值、所述第三权重值以及所述第四权重值之和为100%。

4.根据权利要求1所述的方法，其特征在于，所述将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配前，还包括：

5.一种语音指令匹配装置，其特征在于，包括：

获取模块，用于获取用户的语音指令并进行语音识别；

处理模块，用于获取所述匹配词语在所述系统内置指令中的预设权重之和；判断所述预设权重之和是否大于预设阈值、且所述分词结果中是否包含动词和名词，若是，则确定所述语音指令与所述系统内置指令相匹配；

系统内置指令处理模块，用于对所述预设指令库中的各系统内置指令进行分词和标注词性，并根据所述标注词性设置每一系统内置指令中的各词语在该系统内置指令中的预设权重。

6.根据权利要求5所述的装置，其特征在于，所述处理模块在判断所述分词结果中是否包含动词和名词时，用于：

7.根据权利要求5所述的装置，其特征在于，所述系统内置指令处理模块在设置每一系统内置指令中的各词语在该系统内置指令中的预设权重时，用于：

设置各虚词的预设权重为0；

8.根据权利要求5所述的装置，其特征在于，所述装置还包括：

预处理模块，用于在将所述语音指令的分词结果与预设指令库中任意一条已经过分词处理的系统内置指令进行匹配前，根据汉语语言模型N-Gram对所述语音指令进行预处理，以对所述语音指令进行纠错。

9.一种语音指令匹配设备，其特征在于，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如权利要求1-4中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序；

所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的方法。