CN113674743A

CN113674743A - 用于自然语言处理中asr结果替换处理设备及处理方法

Info

Publication number: CN113674743A
Application number: CN202110960275.XA
Authority: CN
Inventors: 张泽宇
Original assignee: Unisound Shanghai Intelligent Technology Co Ltd
Current assignee: Unisound Shanghai Intelligent Technology Co Ltd
Priority date: 2021-08-20
Filing date: 2021-08-20
Publication date: 2021-11-19

Abstract

本发明公开了一种用于自然语言处理中ASR结果替换处理设备及处理方法，通过构建多个邻域词库，在面对用户语音阐述不清或带有口音时的指令输入时，通过用户所处的生活场景匹配领域词库在将指令中涉及的待控制设备的文本替换成待控制设备的规范名称文本以对用户的真实意图进行智能化的分析。本发明解决了智能家居系统在接收用户语音指令时，不能根据上下文或者用户所处的生活场景对用户的真实意图进行智能化分析的问题。

Description

用于自然语言处理中ASR结果替换处理设备及处理方法

技术领域

本发明涉及智能家居设备技术领域，具体涉及一种用于自然语言处理中ASR结果替换处理设备及处理方法。

背景技术

在用户向智能家居系统通过语音下达指令时，面对用户语音阐述不清晰，甚至带有口音时的语音指令输入，智能家居系统的自然语言处理尚不能根据上下文或者用户所处的生活场景对用户的真实意图进行智能化的分析。比如，智能家居场景中，用户的原始意图是“打开微波炉”，但由于某些原因(智能家居系统的硬件拾音条件不佳或自然语音理解技术不成熟)，导致用户的语音指令被识别为“打开微博”，进而影响客户满意度。

发明内容

为克服现有技术所存在的缺陷，现提供一种用于自然语言处理中ASR结果替换处理设备及处理方法，以解决智能家居系统在接收用户语音指令时，不能根据上下文或者用户所处的生活场景对用户的真实意图进行智能化分析的问题。

为实现上述目的，提供一种用于自然语言处理中ASR结果替换处理方法，包括以下步骤：

构建不同类型的多个领域词库，所述领域词库包括多个设备的规范名称以及与所述规范名称一一对应的标准音节；

采集用户语音指令；

对所述语音指令进行语音识别获得意图指令文本，所述意图指令文本包括待控制的设备的领域类型文本和待控制的所述设备的名称文本；

将待控制的所述设备的名称文本转换为随意音节；

基于所述领域类型文本，将所述意图指令文本匹配到与所述领域类型文本相对应的所述领域词库、并将所述随意音节与匹配到的所述领域词库中的所述标准音节相匹配；

在所述随意音节匹配到一所述标准音节后，将匹配到的所述标准音节对应的规范名称替换所述意图指令文本中的所述名称文本以获得纠偏指令文本并输出所述纠偏指令文本、在所述随意音节未能匹配到一所述标准音节后，直接输出所述意图指令文本。

进一步的，所述邻域词库为家用电器领域词库。

本发明提供一种用于自然语言处理中ASR结果替换处理方法的处理设备，包括：

客户端装置，包括用于采集用户语音指令的拾音模块、输出模块和第一控制模块，所述拾音模块和所述输出模块分别连接于所述第一控制模块；以及

服务器，包括第二控制模块、用于存储有构建的不同类型的多个领域词库的存储模块，所述领域词库包括多个待控制设备的规范名称和所述规范名称一一对应的标准音节、用于对所述语音指令进行语音识别以获得意图指令文本的语音识别模块，所述意图指令文本包括领域类型文本和所述待控制设备的名称文本、用于将所述待控制设备的名称文本转换为随意音节的转换模块、用于基于所述领域类型文本将所述意图指令文本匹配到与所述领域类型文本相对应的所述领域词库、并将所述随意音节与匹配到的所述领域词库中的所述标准音节相匹配的匹配模块和用于在所述随意音节匹配到的所述标准音节后，将匹配到的标准音节对应的规范名称替换所述意图指令文本中的所述名称文本以获得所述纠偏指令文本的替换模块，所述第二控制模块连接于所述第一控制模块，所述存储模块、所述语音识别模块、所述替换模块分别连接于所述第二控制模块，所述转换模块和所述替换模块分别连接于所述语音识别模块，所述匹配模块连接于所述存储模块。

进一步的，所述第一控制模块无线信号连接于所述第二控制模块。

进一步的，所述服务器为云端服务器。

进一步的，所述拾音模块为麦克风。

进一步的，所述输出模块为触摸屏。

本发明的有益效果在于，本发明的用于自然语言处理中ASR结果替换处理设备，通过构建多个邻域词库，在面对用户语音阐述不清或带有口音时的指令输入时，通过用户所处的生活场景匹配领域词库在将指令中涉及的待控制设备的文本替换成待控制设备的规范名称文本以对用户的真实意图进行智能化的分析。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1为本发明实施例的用于自然语言处理中ASR结果替换处理设备的模块示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

参照图1所示，本发明提供了一种用于自然语言处理中ASR(Automatic SpeechRecognition)结果替换处理设备，包括：客户端装置1和服务器2。ASR是一种将人的语音转换为文本的技术。

其中，客户端装置1包括拾音模块11、输出模块13和第一控制模块12。具体的，拾音模块11用于采集用户语音指令的、输出模块13用于输出指令文本。

拾音模块11和输出模块13分别连接于第一控制模块12。

在用户有需求时，通过拾音模块采集用户发出的语音指令。第一控制模块获取语音指令并对外发送。

服务器2包括存储模块21、语音识别模块22、转换模块23、匹配模块24、替换模块25和第二控制模块26。

其中，存储模块21用于存储预先构建的不同类型的多个领域词库。领域词库包括多个待控制设备的规范名称和规范名称一一对应的标准音节。

第二控制模块接收语音指令并发送至语音识别模块。

语音识别模块22用于对语音指令进行语音识别以获得意图指令文本。意图指令文本包括领域类型文本和待控制设备的名称文本。

转换模块23用于将待控制设备的名称文本转换为随意音节。

匹配模块24用于基于领域类型文本将意图指令文本匹配到与领域类型文本相对应的一个领域词库、并将随意音节与匹配到的领域词库中的标准音节相匹配。匹配模块24在将随意音节与匹配到的领域词库中的标准音节相匹配时，产生两种结果，一为匹配到邻域词库中的标准音节，另外一种为未匹配到邻域词库中的标准音节。

替换模块25用于在随意音节匹配到的所述标准音节后，将匹配到的标准音节对应的规范名称替换意图指令文本中的名称文本以获得纠偏指令文本。

第二控制模块26连接于第一控制模块12。存储模块21、语音识别模块22、替换模块25分别连接于第二控制模块26。转换模块23和替换模块25分别连接于语音识别模块22。匹配模块24连接于存储模块21。

在随意音节匹配到的所述标准音节后，第二控制获取纠偏指令文本并对外发送，第一控制模块接收纠偏指令文本并通过输出模块输出显示纠偏指令文本给用户查看。

在随意音节未匹配到的所述标准音节后，第二控制获取意图指令文本并对外发送，第一控制模块接收意图指令文本并通过输出模块输出显示意图指令文本给用户查看。

本发明的用于自然语言处理中ASR结果替换处理设备，通过构建多个邻域词库，在面对用户语音阐述不清或带有口音时的指令输入时，通过用户所处的生活场景匹配领域词库在将指令中涉及的待控制设备的文本替换成待控制设备的规范名称文本以对用户的真实意图进行智能化的分析。比如，智能家居场景中，用户原始意图是“打开微波炉”，但由于某些原因(硬件拾音条件不佳或NLU技术不成熟)，语音指令很可能被识别为“家居控制邻域、打开微博”，通过替换“家居控制”领域词库的规范名称“微波炉”，将“打开微波炉”纠偏指令文本通过输出模块呈现给用户以准确达到用户真是操作意图。在用户确认后再进行后置动作。

作为一种较佳的实施方式，第一控制模块12无线信号连接于第二控制模块26。具体的，第一控制模块连接有无线通信模块。第二控制模块连接有无线通信模块。第一控制模块的无线通信模块无线信号连接于第二控制模块的无线通信模块。

第一控制模块、拾音模块、输出模块和无线通信模块集成安装于客户端装置中。

在本实施例中，拾音模块11为麦克风。输出模块13为触摸屏。

作为一种较佳的实施方式，服务器为云端服务器。

本发明提供一种用于自然语言处理中ASR结果替换处理方法，包括以下步骤：

S1：构建不同类型的多个领域词库，领域词库包括多个设备的规范名称以及与规范名称一一对应的标准音节。邻域词库为家用电器领域词库。

S2：采集用户语音指令。

S3：对语音指令进行语音识别获得意图指令文本，意图指令文本包括待控制设备的领域类型文本和待控制的设备的名称文本。

S4：将待控制的设备的名称文本转换为随意音节。

S5：基于领域类型文本，将意图指令文本匹配到与领域类型文本相对应的领域词库、并将随意音节与匹配到的领域词库中的标准音节相匹配。

S6：在随意音节匹配到一所述标准音节后，将匹配到的标准音节对应的规范名称替换意图指令文本中的名称文本以获得纠偏指令文本并输出纠偏指令文本、在随意音节未能匹配到一标准音节后，直接输出意图指令文本。

在本实施例中，本发明提供的用于自然语言处理中ASR结果替换处理方法与用于自然语言处理中ASR结果替换处理设备结合，并以一用户语音指令为例，说明本发明的用于自然语言处理中ASR结果替换处理设备的工作原理：

a、在智能家电控制环境下，用户发出“打开微博”的语音指令，而用户的本意为“打开微波炉”。

b、构建智能家电控制领域词库，并存储于服务器的存储模块。智能家电控制领域词库中包括待控制设备微波炉，并对应配置标准音节“weibolu”。

c、拾音模块采集用户的语音指令“打开微博”。

d、第一控制模块将语音指令发送至第二控制模块。

e、第二控制模块接收语音指令并发送至语音识别模块。

f、语音识别模块获取并识别语音指令获得“打开微博”的意图指令文本。

g、转换模块获取意图指令并将意图指令文本中的“微博”转换为随意音节“weibo”。

h、匹配模块获取随意音节并匹配至家电控制领域词库，在家电控制领域词库中继续匹配标准音节。匹配的结果有两个：

结果一，匹配到在家电控制领域词库中标准音节“weibolu”；

结果二，未匹配到在家电控制领域词库中标准音节。

i、在步骤h中产生结果一时，替换模块将匹配到的标准音节“weibolu”所对应的规范名称“微波炉”替换意图指令文本中的名称文本“微博”以获得纠偏指令文本“打开微波炉”并发送至第二控制模块，第二控制模块将纠偏指令文本通过无线通信模块无线传输至第一控制模块；

在步骤h中产生结果二时，第二控制模块获取步骤f中获得的意图指令文本并通过无线通信模块无线传输至第一控制模块。

在匹配标准音节时，用户可以自行设定模糊匹配或精确匹配。模糊匹配可以进一步细分多种匹配度(匹配度＝匹配音节数/标准音节数×100％)，如90％的匹配度。

j、在第一控制模块获得纠偏指令文本“打开微波炉”或获得意图指令文本“打开微博”后，将纠偏指令文本或意图指令文本通过输出模块显示给用户看，以供用户进行后置动作，如重新输入语音指令，或进入下一步以基于纠偏指令文本开启相应的待控制设备。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种用于自然语言处理中ASR结果替换处理方法，其特征在于，包括：

采集用户语音指令；

将待控制的所述设备的名称文本转换为随意音节；

2.根据权利要求1所述的用于自然语言处理中ASR结果替换处理方法，其特征在于，所述邻域词库为家用电器领域词库。

3.一种如权利要求1～2中任意一项所述的用于自然语言处理中ASR结果替换处理方法的处理设备，其特征在于，包括：

4.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备，其特征在于，所述第一控制模块无线信号连接于所述第二控制模块。

5.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备，其特征在于，所述服务器为云端服务器。

6.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备，其特征在于，所述拾音模块为麦克风。

7.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备，其特征在于，所述输出模块为触摸屏。