CN110503975A

CN110503975A - 基于多麦克风降噪的智能电视语音增强控制方法及系统

Info

Publication number: CN110503975A
Application number: CN201910716308.9A
Authority: CN
Inventors: 庄宏东; 聂云辉; 张锐焜; 方正兵; 纪惜琴; 欧汉标; 盛军
Original assignee: Guangzhou Changjia Electronic Co ltd
Current assignee: Guangzhou Changjia Electronic Co ltd
Priority date: 2019-08-02
Filing date: 2019-08-02
Publication date: 2019-11-26
Anticipated expiration: 2039-08-02
Also published as: CN110503975B

Abstract

本发明公开了一种基于多麦克风降噪的智能电视语音增强控制方法及系统，其中，所述方法包括：主麦克风以及各辅麦克风实时采集智能电视周围环境的主音频信息和辅音频信息；利用采集到的主音频信息和辅音频信息分别与智能电视输出的输出音频信息进行相似度匹配，获取相似度匹配结果；基于相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息；对主音频信息和辅音频信息分别进行滤波分频处理，提取主分频信息和辅分频信息；将主分频信息和辅分频信息进行增强融合处理；将增强融合音频信息输入智能电视音频控制模块。在本发明实施例中，可以实现电视在节目播出过程中的语音输入控制，且提升语音控制准确度，增加用户体验。

Description

基于多麦克风降噪的智能电视语音增强控制方法及系统

技术领域

本发明涉及智能控制技术领域，尤其涉及一种基于多麦克风降噪的智能电视语音增强控制方法及系统。

背景技术

智能电视，是基于Internet应用技术，具备开放式操作系统与芯片，拥有开放式应用平台，可实现双向人机交互功能，集影音、娱乐、数据等多种功能于一体，以满足用户多样化和个性化需求的电视产品；其目的是带给用户更便捷的体验，目前已经成为电视的潮流趋势。

并且现有的智能电视在进行人机交互的时候，一般都是有触摸方式进行或者基于遥控的的方式进行，并且在交互的时候，电视需要先退出当前节目播放页面，给用户带来不好的交互体验。

发明内容

本发明的目的在于克服现有技术的不足，本发明提供了一种基于多麦克风降噪的智能电视语音增强控制方法及系统，可以实现电视在节目播出过程中的语音输入控制，且提升语音控制准确度，增加用户体验。

为了解决上述技术问题，本发明实施例提供了一种基于多麦克风降噪的智能电视语音增强控制方法，在所述智能电视一侧设置主麦克风，在另一侧设置一个或多个辅麦克风；所述方法包括：

所述主麦克风以及各辅麦克风实时采集所述智能电视周围环境的主音频信息和辅音频信息；

利用采集到的所述主音频信息和辅音频信息分别与所述智能电视输出的输出音频信息进行相似度匹配，获取相似度匹配结果；

基于所述相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息；

若存在，则对所述主音频信息和辅音频信息分别进行滤波分频处理，提取非所述智能电视输出的输出音频信息部分的主分频信息和辅分频信息；

将所述主分频信息和辅分频信息进行增强融合处理，获取增强融合音频信息；

将所述增强融合音频信息输入所述智能电视音频控制模块。

可选的，所述利用采集到的所述主音频信息和辅音频信息分别与所述智能电视输出的输出音频信息进行相似度匹配，包括：

分别将所述主音频信息、辅音频信息以及输出音频信息进行频谱转化处理，分别获取主音频频谱、辅音频频谱和输出音频频谱；

将获取到的主音频频谱、辅音频频谱分别与输出音频频谱进行相似度匹配。

可选的，所述基于所述相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息，包括：

基于所述相似度匹配结果与预设相似度值进行对比，获取对比结果；

基于对比结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息。

可选的，所述将所述主分频信息和辅分频信息进行增强融合处理，包括：

计算所述主分频信息和辅分频信息的幅度差和相位差；

基于所述幅度差和所述相位差对所述主分频信息进行频谱分类，获取分类频谱；

对所述分类频谱进行滤波处理，获取滤波信号；

根据所述滤波信号和所述主分频信息进行增强融合处理。

可选的，所述计算所述主分频信息和辅分频信息的幅度差和相位差，包括：

基于增益函数对所述辅分频信息进行信号均衡处理，获取均衡辅分频信息；

根据所述均衡辅分频信息计算所述主分频信息和辅分频信息的幅度差和相位差。

可选的，所述对所述分类频谱进行滤波处理，获取滤波信号，包括：

对所述分类频谱进行数据平滑处理，获取平滑分类频谱；

将所述平滑分类频谱进行滤波处理，获取滤波信号。

可选的，所述根据所述滤波信号和所述主分频信息进行增强融合处理，包括：

对所述滤波信号和所述主分频信息进行卷积增强融合运算处理。

可选的，所述方法还包括：

所述智能电视音频控制模块将所述增强融合音频信息转为控制执行指令，并将所述控制执行指令发送至所述智能电视控制模块；

所述智能电视控制模块解析所述控制执行指令，根据所述控制执行指令控制所述智能电视。

可选的，所述智能电视音频控制模块将所述增强融合音频信息转为控制执行指令，包括：

所述智能电视音频控制模块将所述增强融合音频信息转为文字信息；

将所述文字信息与所述智能电视音频控制模块存储的控制文字进行匹配处理；

若相互匹配，则基于所述相互匹配的控制文字生成控制执行命令。

另外，本发明实施例还提供了一种基于多麦克风降噪的智能电视语音增强控制系统，在所述智能电视一侧设置主麦克风，在另一侧设置一个或多个辅麦克风；所述系统包括：

音频采集模块：用于所述主麦克风以及各辅麦克风实时采集所述智能电视周围环境的主音频信息和辅音频信息；

相似度匹配模块：用于利用采集到的所述主音频信息和辅音频信息分别与所述智能电视输出的输出音频信息进行相似度匹配，获取相似度匹配结果；

判断模块：用于基于所述相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息；

滤波分频模块：用于若存在，则对所述主音频信息和辅音频信息分别进行滤波分频处理，提取非所述智能电视输出的输出音频信息部分的主分频信息和辅分频信息；

增强融合模块：用于将所述主分频信息和辅分频信息进行增强融合处理，获取增强融合音频信息；

输入控制模块：用于将所述增强融合音频信息输入所述智能电视音频控制模块。

本发明实施例中，通过在智能电视一侧设置主麦克风，另一侧设置至少一个辅麦克风，实现实时采集智能电视周围的音频信息，并利用音频信息与智能电视输出音频信息比较，判断是否存在输入控制音频，并进行处理融合输入智能电视音频控制模块，可以实现电视在节目播出过程中的语音输入控制，且提升语音控制准确度，增加用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见的，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例中的基于多麦克风降噪的智能电视语音增强控制方法的流程示意图；

图2是本发明实施例中的基于多麦克风降噪的智能电视语音增强控制系统的结构组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例

请参阅图1，图1是本发明实施例中的基于多麦克风降噪的智能电视语音增强控制方法的流程示意图。

如图1所示，一种基于多麦克风降噪的智能电视语音增强控制方法，在所述智能电视一侧设置主麦克风，在另一侧设置一个或多个辅麦克风；

具体的，智能电视上设置有音频采集设备，该音频采集设备为麦克风，并且麦克风设备至少有两个，分别包括主麦克风设备和至少一个辅麦克风设备；其中，主麦克风设置在智能电视的一侧辅麦克风设置在另一侧，具体的设置方式不做限定，当主麦克风与辅麦克风设置间隔距离应大于40cm。

所述方法包括：

S11：所述主麦克风以及各辅麦克风实时采集所述智能电视周围环境的主音频信息和辅音频信息；

在本发明具体实施过程中，在智能电视上电开机之后，主麦克风和辅麦克风同时进入实施采集该智能电视周围环境的音频信息，分别到的主音频信息和辅音频信息。

S12：利用采集到的所述主音频信息和辅音频信息分别与所述智能电视输出的输出音频信息进行相似度匹配，获取相似度匹配结果；

在本发明具体实施过程中，所述利用采集到的所述主音频信息和辅音频信息分别与所述智能电视输出的输出音频信息进行相似度匹配，包括：分别将所述主音频信息、辅音频信息以及输出音频信息进行频谱转化处理，分别获取主音频频谱、辅音频频谱和输出音频频谱；将获取到的主音频频谱、辅音频频谱分别与输出音频频谱进行相似度匹配。

具体的，首先需要对采集到的主音频信息、辅音频信息和智能电视输出的输出音频信息进行频谱转化处理，及将这些音频信息频谱信号，从而得到主音频频谱、辅音频频谱和输出音频频谱；然后利用得到的主音频频谱、辅音频频谱分别与输出音频频谱进行相似度计算，具体的是特征相似度计算，获得特征相似度作为相似度匹配结果。

S13：基于所述相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息；

在本发明具体实施过程中，所述基于所述相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息，包括：基于所述相似度匹配结果与预设相似度值进行对比，获取对比结果；基于对比结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息。

具体的，相似度匹配结果即为特征相似度，为一个具体的数字，预设相似度值可以根据用户的需求设置，在本发明实施例中可设置为90％，当相似度匹配结果与预设相似度值进行对比获取对比结果，相似度匹配结果小于预设相似度值时，则认为判断采集到的主音频信息和辅音频信息存在输入控制音频信息；并且主音频频谱、辅音频频谱的相似度结果相差的误差在预设误差范围内，一般的预测误差为5％。

S14：若存在，则对所述主音频信息和辅音频信息分别进行滤波分频处理，提取非所述智能电视输出的输出音频信息部分的主分频信息和辅分频信息；

在本方具体实施过程中，在判断采集到的主音频信息和辅音频信息中存在输入控制音频信息时，需要分别提取主音频信息和辅音频信息的输入控制音频信息；但主音频信息和辅音频信息中混杂有智能电视输出的输出音频信息；因此需要进行滤波分频，具体首先根据将主音频信息和辅音频信息分别通过高通滤波器进行滤波，然后通过分频器按照去除电视输出的输出音频信息的频率进行预设分频，从而分别主分频信息和辅分频信息。

S15：将所述主分频信息和辅分频信息进行增强融合处理，获取增强融合音频信息；

在本发明具体实施过程中，所述将所述主分频信息和辅分频信息进行增强融合处理，包括：计算所述主分频信息和辅分频信息的幅度差和相位差；基于所述幅度差和所述相位差对所述主分频信息进行频谱分类，获取分类频谱；对所述分类频谱进行滤波处理，获取滤波信号；根据所述滤波信号和所述主分频信息进行增强融合处理。

进一步的，所述计算所述主分频信息和辅分频信息的幅度差和相位差，包括：基于增益函数对所述辅分频信息进行信号均衡处理，获取均衡辅分频信息；根据所述均衡辅分频信息计算所述主分频信息和辅分频信息的幅度差和相位差。

进一步的，所述对所述分类频谱进行滤波处理，获取滤波信号，包括：对所述分类频谱进行数据平滑处理，获取平滑分类频谱；将所述平滑分类频谱进行滤波处理，获取滤波信号。

进一步的，所述根据所述滤波信号和所述主分频信息进行增强融合处理，包括：对所述滤波信号和所述主分频信息进行卷积增强融合运算处理。

具体的，首先需要计算主分频信息和辅分频信息的幅度差和相位差，然后根据幅度差和相位差对主分频信息进行频谱分类来获得分类频谱；对分类频谱进行平滑滤波获得滤波信号，然后再利用滤波信号和主分频信息进行增强融合处理来获得增强融合音频信息。

在计算获得幅度差和相位差时，需要利用增益函数，其中增益函数需要利用该麦克风设备进行信号校正之后得到的，具体是在消音室等地方通过麦克风接收校准信号，将校准信号进行傅里叶变换得到相应的一个个频点，根据这一个个频点构建增益函数；然后通过该增益函数对辅分频信息进行信号均衡处理，因为辅分频信息在实际信道上传输时，由于信道传输特性不联系以及信道噪声影响，接收端接收到的信号不可避免存在误差，通过增益函数可以有效的校正误差；然后根据均衡辅分频信息计算主分频信息和辅分频信息每一帧的幅度差和相位差。

对分类频谱进行数据平滑处理可以采用汉明窗H_ham(K)对分类频谱进行平滑，对数据进行降噪具体的公式如下：X_1，n ^han(K)＝H_ham(K)X_1，n(K)；其中，H_ham(K)表示汉明窗，X_1，n(K)表示分类频谱；可以利用维纳滤波的方式对平滑分类频谱进行滤波处理获取滤波信号。

将滤波信号和主分频信息进行卷积增强融合运算处理计算从而获得增强融合音频信息。

S16：将所述增强融合音频信息输入所述智能电视音频控制模块。

在本发明具体实施过程中，智能电视上拥有音频控制模块，在获得增强融合音频信息后，将该增强融合音频信息通过系统总线传输到智能电视音频控制模块。

在本发明具体实施过程中，所述方法还包括：所述智能电视音频控制模块将所述增强融合音频信息转为控制执行指令，并将所述控制执行指令发送至所述智能电视控制模块；所述智能电视控制模块解析所述控制执行指令，根据所述控制执行指令控制所述智能电视。

所述智能电视音频控制模块将所述增强融合音频信息转为控制执行指令，包括：所述智能电视音频控制模块将所述增强融合音频信息转为文字信息；将所述文字信息与所述智能电视音频控制模块存储的控制文字进行匹配处理；若相互匹配，则基于所述相互匹配的控制文字生成控制执行命令。

具体的，该智能电视音频控制模块将接收到的增强融合音频信息转为控制执行指令并将该控制执行指令发送至智能电视控制模块，该智能电视控制模块解析所述控制执行指令，根据控制执行指令控制所述智能电视。

其中，首先需要将增强融合音频信息转为文字信息，然后利用该文字信息与智能电视音频控制模块存储的控制文字进行匹配处理，若相互匹配，则证明该文字信息中包括有控制信息，则需要将相互匹配的控制文字生成控制执行命令。

实施例

请参阅图2，图2是本发明实施例中的基于多麦克风降噪的智能电视语音增强控制系统的结构组成示意图。

一种基于多麦克风降噪的智能电视语音增强控制系统，在所述智能电视一侧设置主麦克风，在另一侧设置一个或多个辅麦克风；

所述系统包括：

音频采集模块21：用于所述主麦克风以及各辅麦克风实时采集所述智能电视周围环境的主音频信息和辅音频信息；

相似度匹配模块22：用于利用采集到的所述主音频信息和辅音频信息分别与所述智能电视输出的输出音频信息进行相似度匹配，获取相似度匹配结果；

判断模块23：用于基于所述相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息；

滤波分频模块24：用于若存在，则对所述主音频信息和辅音频信息分别进行滤波分频处理，提取非所述智能电视输出的输出音频信息部分的主分频信息和辅分频信息；

增强融合模块25：用于将所述主分频信息和辅分频信息进行增强融合处理，获取增强融合音频信息；

输入控制模块26：用于将所述增强融合音频信息输入所述智能电视音频控制模块。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，ReadOnly Memory)、随机存取存储器(RAM，Random AccessMemory)、磁盘或光盘等。

另外，以上对本发明实施例所提供的一种基于多麦克风降噪的智能电视语音增强控制方法及系统进行了详细介绍，本文中应采用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于多麦克风降噪的智能电视语音增强控制方法，其特征在于，在所述智能电视一侧设置主麦克风，在另一侧设置一个或多个辅麦克风；所述方法包括：

若存在，则对所述主音频信息和辅音频信息分别进行滤波分频处理，提取非所述智能电视输出的输出音频信息部分的主分频信息和辅分频信息；；

将所述增强融合音频信息输入所述智能电视音频控制模块。

2.根据权利要求1所述的智能电视语音增强控制方法，其特征在于，所述利用采集到的所述主音频信息和辅音频信息分别与所述智能电视输出的输出音频信息进行相似度匹配，包括：

3.根据权利要求1所述的智能电视语音增强控制方法，其特征在于，所述基于所述相似度匹配结果判断采集到的主音频信息和辅音频信息是否存在输入控制音频信息，包括：

4.根据权利要求1所述的智能电视语音增强控制方法，其特征在于，所述将所述主分频信息和辅分频信息进行增强融合处理，包括：

计算所述主分频信息和辅分频信息的幅度差和相位差；

对所述分类频谱进行滤波处理，获取滤波信号；

根据所述滤波信号和所述主分频信息进行增强融合处理。

5.根据权利要求4所述的智能电视语音增强控制方法，其特征在于，所述计算所述主分频信息和辅分频信息的幅度差和相位差，包括：

6.根据权利要求4所述的智能电视语音增强控制方法，其特征在于，所述对所述分类频谱进行滤波处理，获取滤波信号，包括：

对所述分类频谱进行数据平滑处理，获取平滑分类频谱；

将所述平滑分类频谱进行滤波处理，获取滤波信号。

7.根据权利要求4所述的智能电视语音增强控制方法，其特征在于，所述根据所述滤波信号和所述主分频信息进行增强融合处理，包括：

8.根据权利要求1所述的智能电视语音增强控制方法，其特征在于，所述方法还包括：

9.根据权利要求8所述的智能电视语音增强控制方法，其特征在于，所述智能电视音频控制模块将所述增强融合音频信息转为控制执行指令，包括：

10.一种基于多麦克风降噪的智能电视语音增强控制系统，其特征在于，在所述智能电视一侧设置主麦克风，在另一侧设置一个或多个辅麦克风；所述系统包括：