CN107396158A

CN107396158A - 一种声控交互装置、声控交互方法和电视机

Info

Publication number: CN107396158A
Application number: CN201710717606.0A
Authority: CN
Inventors: 付星; 赵新科
Original assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Current assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Priority date: 2017-08-21
Filing date: 2017-08-21
Publication date: 2017-11-24

Abstract

本发明公开了一种声控交互装置、声控交互方法和电视机，其中，所述声控交互装置包括麦克风阵列模块、干扰信号接收模块和信号处理模块；由干扰信号接收模块接收待控终端通过预设频段发出的干扰信号并输出至信号处理模块，由麦克风阵列模块在接收到用户输入的唤醒信号时输出唤醒状态信号至待控终端，并采集当前的混合声音信号输出至信号处理模块，由信号处理模块对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至待控终端，对待控终端进行语音操控。采用麦克风阵列能降低声控距离要求，同时还对采集到的混合声音信号进行回音消除后再发送至待控终端，有效提高了声音操控的识别率。

Description

一种声控交互装置、声控交互方法和电视机

技术领域

本发明涉及电子信息技术领域，特别涉及一种声控交互装置、声控交互方法和电视机。

背景技术

目前市场上主流电视产品的各种操作仍是基于遥控器完成，操作起来不便捷、不智能。而现在的一些产品虽然具备语音控制功能，但需要靠近声音采集设备，不能实现远场声音识别，在识别时无法消除背景回声，导致识别率较低，严重影响用户使用。

因而现有技术还有待改进和提高。

发明内容

鉴于上述现有技术的不足之处，本发明的目的在于提供一种声控交互装置、声控交互方法和电视机，采用麦克风阵列能实现远场拾音，降低声控距离要求，同时还对采集到的混合声音信号进行回音消除后再发送至待控终端，有效提高了声音操控的识别率。

为了达到上述目的，本发明采取了以下技术方案：

一种声控交互装置，其与待控终端连接，包括外壳，所述外壳上设置有若干个用于输入声音信号的输入孔，所述外壳内设置有PCB板，其中，所述PCB板上设置有麦克风阵列模块、干扰信号接收模块和信号处理模块；由干扰信号接收模块接收待控终端通过预设频段发出的干扰信号并输出至信号处理模块，由麦克风阵列模块在接收到用户输入的唤醒信号时输出唤醒状态信号至待控终端，并采集当前的混合声音信号输出至信号处理模块，由信号处理模块对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至待控终端，对待控终端进行语音操控。

所述的声控交互装置中，所述干扰信号接收模块包括接收单元和放大单元，由所述接收单元接收待控终端通过预设频段发出的干扰信号并输出至放大单元，通过放大单元对所述干扰信号进行放大处理后输出模拟干扰信号至信号处理模块。

所述的声控交互装置中，所述信号处理模块包括模数转换单元、第一计算单元、自适应滤波单元和第二计算单元；由模数转换单元对所述模拟干扰信号进行模数转换后输出数字干扰信号，由第一计算单元计算所述数字干扰信号的平均值，通过自适应滤波单元根据所述数字干扰信号的平均值以及预设回音路径函数对所述数字干扰信号进行自适应滤波处理，得出回音信号；由第二计算单元将所述混合声音信号减去所述回音信号，输出有效声音信号至待控终端。

所述的声控交互装置中，所述信号处理模块还包括：

定向增强单元，用于根据所述混合声音信号判断控制音源角度，并定向增强所述控制音源角度上的声音信号。

所述的声控交互装置中，所述麦克风阵列模块包括若干个麦克风，所述若干个麦克风呈环形设置于外壳内。

所述的声控交互装置中，所述外壳上还设置有显示模块，用于显示操作信息和交互提示信息。

一种声控交互方法，其包括如下步骤：

由干扰信号接收模块接收待控终端通过预设频段发出的干扰信号并输出至信号处理模块；

通过麦克风阵列模块采集当前的混合声音信号并输出至信号处理模块；

由信号处理模块对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至待控终端，对待控终端进行语音操控。

一种电视机，其包括电视端和如上所述的声控交互装置，通过所述声控交互装置对电视端进行语音操控。

所述的电视机中，所述电视端包括干扰信号发射模块和语音识别处理模块，由干扰信号发射模块将电视端输出的干扰信号加载至预设频段后发送至所述声控交互装置，由语音识别处理模块接收所述声控交互装置输出有效声音信号并进行语音识别，得出相应的控制指令，对电视端进行语音操控。

所述的电视机中，所述电视端还包括音量控制模块和休眠控制模块，由音量控制模块在接收到声控交互装置输出的唤醒状态信号后控制电视端静音；由休眠控制模块在检测到完成语音操控后输出休眠指令至声控交互装置，控制其进入休眠状态。

相较于现有技术，本发明提供的声控交互装置、声控交互方法和电视机中，所述声控交互装置包括外壳，所述外壳上设置有若干个用于输入声音信号的输入孔，所述外壳内设置有PCB板，其中，所述PCB板上设置有麦克风阵列模块、干扰信号接收模块和信号处理模块；由干扰信号接收模块接收待控终端通过预设频段发出的干扰信号并输出至信号处理模块，由麦克风阵列模块在接收到用户输入的唤醒信号时输出唤醒状态信号至待控终端，并采集当前的混合声音信号输出至信号处理模块，由信号处理模块对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至待控终端，对待控终端进行语音操控。采用麦克风阵列能实现远场拾音，降低声控距离要求，同时还对采集到的混合声音信号进行回音消除后再发送至待控终端，有效提高了声音操控的识别率。

附图说明

图1 为本发明提供的电视机的结构框图；

图2 为本发明提供的声控交互装置的结构示意图；

图3 为本发明提供的声控交互装置优选实施例中麦克风阵列模块的第一输入单元的电路图；

图4为本发明提供的声控交互装置优选实施例中麦克风阵列模块的第二输入单元的电路图；

图5为本发明提供的声控交互装置优选实施例中麦克风阵列模块的第三输入单元的电路图；

图6为本发明提供的声控交互装置优选实施例中麦克风阵列模块的第四输入单元的电路图；

图7为本发明提供的声控交互装置中干扰信号接收模块的结构框图；

图8为本发明提供的声控交互装置优选实施例中接收单元的电路图；

图9为本发明提供的声控交互装置优选实施例中放大单元的电路图；

图10为本发明提供的声控交互装置中信号处理模块的结构框图；

图11为本发明提供的声控交互装置优选实施例中自适应滤波单元的信号流图；

图12为本发明提供的声控交互装置应用实施例中回音消除的流程图；

图13为本发明提供的电视机应用实施例中的系统工作流程图；

图14为本发明提供的声控交互方法的流程图。

具体实施方式

本发明提供一种声控交互装置、声控交互方法和电视机，采用麦克风阵列能实现远场拾音，降低声控距离要求，同时还对采集到的混合声音信号进行回音消除后再发送至待控终端，有效提高了声音操控的识别率。

为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

请参阅图1，本发明提供的电视机包括电视端10和声控交互装置20，所述电视端10和声控交互装置20无线连接，通过所述声控交互装置20对电视端10进行语音操控，其中所述电视端10包括第一无线连接模块、干扰信号发射模块11、语音识别处理模块12、音量控制模块13和休眠控制模块14，所述语音识别处理模块12连接干扰信号发射模块11和第一无线连接模块，所述第一无线连接模块还连接音量控制模块13和休眠控制模块14。

请一并参阅图2，所述声控交互装置20包括外壳21，所述外壳21上设置有若干个用于输入声音信号的输入孔22，所述外壳21内设置有PCB板，所述PCB板上设置有第二无线连接模块、麦克风阵列模块201、干扰信号接收模块202和信号处理模块203，所述信号处理模块203连接干扰信号接收模块202、麦克风阵列模块201和第二无线连接模块，通过所述第一无线连接模块和第二无线连接模块实现电视端10与声控交互装置20的无线连接，具体可采用蓝牙、红外、wifi等等无线连接方式，本发明对此不作限定。

在进行声控交互时，由所述干扰信号发射模块11将电视端10输出的干扰信号加载至预设频段后发送至所述声控交互装置20，由干扰信号接收模块202接收待控终端（本实施例中为电视端10）通过预设频段发出的干扰信号并输出至信号处理模块203，由麦克风阵列模块201在接收到用户输入的唤醒信号时输出唤醒状态信号至电视端10，并采集当前的混合声音信号输出至信号处理模块203，其中所述唤醒信号可为预设唤醒词，或者音量阈值大于设定值的任意语音信号等等，本发明对此不作限定；所述混合声音信号中包括有用户发出的有效声音信号，以及电视端10发出的声音（即干扰信号）经过发射后到达麦克风阵列模块201的回音信号，音量控制模块13在接收到所述唤醒状态信号后控制电视端10静音，以减少后续声控交互过程中的干扰。

之后由信号处理模块203对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至电视端10，由电视端10中的语音识别处理模块12接收所述有效声音信号并进行语音识别，得出相应的控制指令，对电视端10进行语音操控，实现声控交互过程，并且，为了节约能耗，休眠控制模块14在检测到完成语音操控后输出休眠指令至声控交互装置20，控制其进入休眠状态，例如间隔预设时间没有接收到有效声音信号则判断为当前轮次语音操控结束，此时输出休眠指令控制声控交互装置20进入休眠状态，在接收到下一次唤醒信号时再输出唤醒状态信号至电视端10，尽可能地节约声控交互装置20的能耗，提高续航时间。

本发明提供的电视机采用声控交互装置20进行语音操控，更加智能便捷，且所述声控交互装置20采用麦克风阵列能实现远场拾音，降低声控距离要求，同时还对采集到的混合声音信号进行回音消除后再发送至待控终端，有效提高了声音操控的识别率。

进一步地，所述声控交互装置20中，所述外壳21上还设置有显示模块23，用于显示操作信息和交互提示信息，例如图2所示，在外壳21的顶部设置该显示模块23，实时显示当前的操作信息和提示信息，或者在其他实施例中也可设置在外壳21的其他部位，例如侧面等等，所述显示模块23可采用OLED屏或LED屏，具体可根据实际需求选择，本发明对此不做限定。

具体实施时，所述麦克风阵列模块201包括若干个麦克风，所述若干个麦克风呈环形设置于外壳21内，如图2所示，本实施例中所述声控交互装置20的外壳21呈圆柱状，可将若干个麦克风均匀设置在外壳21内的各个位置，例如当采用四个麦克风时，可设置相邻两个麦克风之间的角度为90°，使得声控交互装置20能实现360°的声音采集，当然在其他实施例中，所述外壳21可采用其他形状，所述麦克风的数量也可随之相应调整，本发明对此不作限定。

优选地，本发明优选实施例中，所述麦克风阵列模块201采用4路麦克风输入，即包括第一输入单元、第二输入单元、第三输入单元和第四输入单元，如图3至图6所示，每个输入单元均采用硅麦输入，具体来说，所述第一输入单元包括第一芯片U1、第一磁珠FB1、第一电容C1、第二电容C2、第一电阻R1、第二电阻R2和第三电阻R3；所述第二输入单元包括第二芯片U2、第二磁珠FB2、第三电容C3、第四电容C4、第四电阻R4、第五电阻R5和第六电阻R6；所述第三输入单元包括第三芯片U3、第三磁珠FB3、第五电容C5、第六电容C6、第七电阻R7、第八电阻R8和第九电阻R9；所述第四输入单元包括第四芯片U4、第四磁珠FB4、第七电容C7、第八电容C8、第十阻、第十一电阻R11和第十二电阻R12，所述信号处理模块203采用君正X1000芯片。

所述第一芯片U1的VDD端连接第一电容C1的一端、第二电容C2的一端和第一磁珠FB1的一端，所述第一电容C1的另一端和第二电容C2的另一端均接地，所述第一磁珠FB1的另一端连接3V3供电端；所述第一芯片U1的LR端通过第一电阻R1接地，所述第一芯片U1的CLK端通过第二电阻R2连接信号处理模块203的DMIN_CLK端，所述第一芯片U1的DOUT端通过第三电阻R3连接信号处理模块203的DMIC_IN0端。

所述第二芯片U2的VDD端连接第三电容C3的一端、第四电容C4的一端和第二磁珠FB2的一端，所述第三电容C3的另一端和第四电容C4的另一端均接地，所述第二磁珠FB2的另一端连接3V3供电端；所述第二芯片U2的LR端通过第四电阻R4连接第二芯片U2的VDD端，所述第二芯片U2的CLK端通过第五电阻R5连接信号处理模块203的DMIN_CLK端，所述第二芯片U2的DOUT端通过第六电阻R6连接信号处理模块203的DMIC_IN0端。

所述第三芯片U3的VDD端连接第五电容C5的一端、第六电容C6的一端和第三磁珠FB3的一端，所述第五电容C5的另一端和第六电容C6的另一端均接地，所述第三磁珠FB3的另一端连接3V3供电端；所述第三芯片U3的LR端通过第七电阻R7接地，所述第三芯片U3的CLK端通过第八电阻R8连接信号处理模块203的DMIN_CLK端，所述第三芯片U3的DOUT端通过第九电阻R9连接信号处理模块203的DMIC_IN1端。

所述第四芯片U4的VDD端连接第七电容C7的一端、第八电容C8的一端和第四磁珠FB4的一端，所述第七电容C7的另一端和第八电容C8的另一端均接地，所述第四磁珠FB4的另一端连接3V3供电端；所述第四芯片U4的LR端通过第十电阻R10连接第四芯片U4的VDD端，所述第四芯片U4的CLK端通过第十一电阻R11连接信号处理模块203的DMIN_CLK端，所述第四芯片U4的DOUT端通过第十二电阻R12连接信号处理模块203的DMIC_IN1端。

其中，采用第一磁珠FB1、第二磁珠FB2、第三磁珠FB3和第四磁珠FB4能有效抑制电源线上的高频噪声和尖峰干扰，降低麦克风采集时的线路噪声，并且所述第一芯片U1、第二芯片U2、第三芯片U3和第四芯片U4均采用硅麦芯片，型号为EBM4030DT，本实施例中采用硅麦输入，与传统的模拟麦克风相比具有可以SMT贴片、语音清晰，自然，易于辨识、稳定性强、适合各种降噪算法、内置RFI抑制电路，抗RF干扰、体积小等等优点，进一步提高远场拾音的效果。

进一步地，请参阅图7，所述干扰信号接收模块202包括接收单元2021和放大单元2022，所述接收单元2021连接所述放大单元2022，由所述接收单元2021接收待控终端通过预设频段发出的干扰信号并输出至放大单元2022，通过放大单元2022对所述干扰信号进行放大处理后输出模拟干扰信号至信号处理模块203。本发明中，所述电视端10通过干扰信号发生模块将电视端10输出的干扰信号加载至预设频段后发出，干扰信号一般为电视端10当前正在播放的节目背景声，优选地，将所述干扰信号加载至UHF频段后再无线发送给所述接收单元2021，所述UHF频段指的是特高频Ultra High Frequency(UHF)，其为频率为300~3000MHz，波长在1m~1dm的无线电波，通过UHF频段发送干扰信号至声控交互装置20，使得声控交互装置20既能通过UHF频段单独接收该干扰信号，也能通过麦克风阵列采集包括有效声音信号和回音信号的混合声音信号，其中该回音信号为干扰信号经过多重反射后被麦克风采集的信号，即回音信号与干扰信号高度相关，通过UHF频段发送干扰信号有利于后续滤波处理中能准确的滤除混合声音信号中的回音信号，得到真实的有效声音信号，实现回声消除，以提高声控的识别率。

优选地，如图8所示，本发明优选实施例中，所述接收单元2021包括天线ANT、接收芯片U5、电感L1、第九电容C9、第十电容C10、第十一电容C11、第十二电容C12、第十三电容C13、第十四电容C14、第十五电容C15、第十六电容C16、第十七电容C17、第十八电容C18、第十九电容C19、第二十电容C20、第十三电阻R13、第十四电阻R14、第十五电阻R15、第十六电阻R16和第六磁珠FB6。

所述天线ANT的第1端通过电感L1连接第九电容C9的一端，所述天线ANT的第2端接地；所述第九电容C9的另一端连接接收芯片U5的ANT2端；所述第十电容C10的一端连接接收芯片U5的VDDVCO端，所述第十一电容C11的一端连接接收芯片U5的VCCVCO端、VCCRF端和第十二电容C12的一端，所述第十三电容C13的一端连接接收芯片U5的AUDREF端，所述第十四电容C14的一端连接接收芯片U5的VCCAUD端；所述第十电容C10的另一端、第十一电容C11的另一端、第十二电容C12的另一端、第十三电容C13的另一端和第十四电容C14的另一端均接地；所述第十五电容C15的一端连接接收芯片U5的VCCIF端，所述第十六电容C16的一端通过第十三电阻R13连接接收芯片U5的VDDDIG端，所述第十七电容C17的一端连接VDDRF端和第五磁珠FB5的一端，所述第五磁珠FB5的另一端连接接收芯片U5的VCCCIG端，所述第十五电容C15的另一端、第十六电容C16的另一端和第十七电容C17的另一端均接地；所述第十八电容C18的一端连接接收芯片U5的VCCPLL端，所述第十九电容C19的一端连接接收芯片U5的VCCXTAL端和VCCDVCO端，所述第二十电容C20的一端连接接收芯片U5的VCCM端，所述第十八电容C18的另一端、第是十九电容的另一端和第二十电容C20的另一端接地；所述第十四电阻R14的一端连接接收芯片U5的KC OUT端，所述第十四电阻R14的另一端连接放大单元2022；所述第十五电阻R15的一端连接接收芯片U5的GPIO4端，所述第十五电阻R15的另一端为接收单元2021的GPIO端口；所述第十六电阻R16的一端连接接收芯片U5的GPIO0端，所述第十六电阻R16的另一端接地。

本优选实施例中，所述接收芯片U5采用型号为BK9524的声音接收芯片U5，配合天线ANT接收UHF频段的干扰信号，其中电感L1和第九电容C9组成天线ANT匹配电路，能对天线ANT进行更好的匹配，使得天线ANT能更好的接收所述干扰信号，并且采用第五磁珠FB5能有效抑制电源线上的高频噪声和尖峰干扰，降低接收芯片U5接收干扰信号时的线路噪声，并配合外围电路的其他电容电阻达到滤波限流的效果，滤除杂波，进一步提高信号接收的稳定性。

进一步地，如图9所示，本发明优选实施例中，所述放大单元2022包括放大芯片U6、第二十一电容C21、第二十二电容C22、第二十三电容C23、第二十四电容C24、第二十五电容C25、第二十六电容C26、第二十七电容C27、第二十八电容C28、第二十九电容C29、第三十电容C30、第三十一电容C31、第十七电阻R17、第十八电阻R18、第十九电阻R19、第二十电阻R20、第二十一电阻R21、第二十二电阻R22、第二十三电阻R23、第二十四电阻R24、第二十五电阻R25、第二十六电阻R26和第六磁珠FB6。

所述第二十一电容C21的一端连接接收芯片U5的AOP端，所述第二十一电容C21的另一端通过第十七电阻R17连接第二十一电阻R21的一端、第二十二电阻R22的一端和第二十三电容C23的一端；所述第二十二电容C22的一端连接接收芯片U5的AON端，所述第二十二电容C22的另一端通过第十八电阻R18连接第二十三电容C23的另一端、第二十三电阻R23的一端和第二十四电阻R24的一端；所述第十九电阻R19的一端连接接收芯片U5的KC OUT端，所述第十九电阻R19的另一端连接第二十电阻R20的一端、第二十六电容C26的一端和放大芯片U6的PWEN端；所述第二十电阻R20的另一端接地；所述第二十一电阻R21的另一端接地；所述第二十二电阻R22的另一端连接放大芯片U6的+INR端、还通过第二十四电容C24接地；所述第二十三电阻R23的另一端连接第二十五电容C25的一端和放大芯片U6的-INR端；所述第二十四电阻R24的另一端连接第二十五电容C25的另一端、放大芯片U6的OUTR端和第二十九电容C29的一端；所述第二十六电容C26的另一端接地；所述第二十七电容C27的一端连接放大芯片U6的PVSS端，所述第二十七电容C27的了另一端接地；所述第二十八电容C28的一端连接放大芯片U6的CN端，所述第二十八电容C28的另一端连接放大芯片U6的CP端；所述第二十九电容C29的另一端为放大单元2022的输出端，连接信号处理模块203；所述第三十电容C30的一端连接放大芯片U6的PVDD端、第三十一电容C31的一端、第二十六电阻R26的一端和第六磁珠FB6的一端；所述第三十电容C30的另一端和第三十一电容C31的另一端均接地；所述第六磁珠FB6的另一端连接PVDD功率电源端；所述第二十六电阻R26的另一端连接放大芯片U6的UVP端、还通过第二十五电阻R25接地。

本优选实施例中，所述放大芯片U6采用型号为AD22650的运算放大器，采用第五磁珠FB5能有效抑制电源线上的高频噪声和尖峰干扰，降低放大芯片U6放大处理时的线路噪声，并配合外围电路的其他电容电阻达到滤波限流的效果，滤除杂波，进一步提高信号放大输出的稳定性。经接收芯片U5接收电视端10发送的UHF频段干扰信号，将其输出至放大芯片U6，经过放大处理后在传输至信号处理模块203进行后续的滤波处理。

进一步地，请参阅图10，所述信号处理模块203包括模数转换单元2031、第一计算单元2032、自适应滤波单元2033和第二计算单元2034，所述模数转换单元2031、第一计算单元2032、自适应滤波单元2033和第二计算单元2034依次连接，在进行信号处理时，由模数转换单元2031对所述模拟干扰信号进行模数转换后输出数字干扰信号，由第一计算单元2032计算所述数字干扰信号的平均值，通过自适应滤波单元2033根据所述数字干扰信号的平均值以及预设回音路径函数对所述数字干扰信号进行自适应滤波处理，得出回音信号；由第二计算单元2034将所述混合声音信号减去所述回音信号，输出有效声音信号至待控终端。

具体实施时，由于信号处理模块203将得到两个信号，一个是混合声音信号，也就是实际需要发送的有效声音信号和不需要的回音信号混合而成的语音流，可称为近端信号；另一个是干扰信号，也就是原始的引起回音信号的语音，可称为远端信号，由于干扰信号和混合声音信号中的回应信号是有差异的，因此不能直接将混合声音信号减去干扰信号以得到有效声音信号，因此需要对干扰信号进行信号处理，以得出回音信号，进而将混合声音信号减去所述回应信号，输出有效声音信号至电视端10。

虽然干扰信号（以下用fe表示）和回音信号（以下用echo表示）不完全一样，存在差异，但是二者是高度相关的，回音信号是由干扰信号引起的，可把回音信号表示为干扰信号的数学函数，echo=F（fe），函数F为预设回音路径函数，表示声音在墙壁，天花板等表面多次反射的物理过程，因此通过该预设回音路径函数即可通过fe计算得到echo。本发明优选实施例中即通过自适应滤波处理计算得出echo。

请一并参阅图11，其为自适应滤波单元2033的信号原理图，自适应滤波器是以输入和输出信号的统计特性的估计为依据，采取特定算法自动地调整滤波器系数，使其达到最佳滤波特性的一种算法或装置。自适应滤波器可以是连续域的或是离散域的。离散域自适应滤波器由一组抽头延迟线、可变加权系数和自动调整系数的机构组成。附图表示一个离散域自适应滤波器用于模拟未知离散系统的信号流图。自适应滤波器对输入信号序列x(n)的每一个样值，按特定的算法，更新、调整加权系数，使输出信号序列y(n)与期望输出信号序列d(n)相比较的均方误差为最小，即输出信号序列y(n)逼近期望信号序列d(n)。

以最小均方误差为准则设计的自适应滤波器的系数可以由维纳-霍甫夫方程解得，而维德罗提出的一种方法，能实时求解自适应滤波器系数，其结果接近维纳－霍甫夫方程近似解。这种算法称为最小均方算法或简称 LMS法。这一算法利用最陡下降法，由均方误差的梯度估计从现时刻滤波器系数向量迭代计算下一个时刻的系数向量：

式中k_s为一负数，它的取值决定算法的收敛性，为均方误差梯度估计，具体为：

根据上述算法可知，本发明优选实施例中所述预设回音路径函数F就是自适应滤波器W(n)收敛的过程。所加输入信号x(n)是fe，期望信号是echo，自适应滤波器收敛后的W(n)就是回音路径函数F。收敛之后，当实际回音发生，将fe通过函数W(n)，就可以得到一个很准确的echo，把混合声音信号直接减去echo，即可得到实际需要发送的有效声音信号，完成回声消除过程，提高声控信号的灵敏度。

较佳地，所述信号处理模块203还包括定向增强单元2035，所述定向增强单元2035与麦克风阵列模块201连接，用于根据所述混合声音信号判断控制音源角度，并定向增强所述控制音源角度上的声音信号，即本发明在接收到混合声音信号后，根据麦克风所接收到的信号强度判断当前控制音源的角度，并定向增强该控制音源角度上的声音信号，即有针对性地放大有效声音信号，进一步地提高声控识别的准确性和灵敏度。

以下结合图12和图13，具应用实施例对本发明提供的电视机的系统工作流程以及回应消除过程进行介绍：

进行回应消除时，同步串口为0，调用中断程序后开始进行回音消除，判断远端检测器是否输入信号，其中远端检测器即为干扰信号接收模块，用于接收远端信号，即加载至UHF频段的干扰信号，若是则计算远端平均输入，并在远端平均输入中寻找最大值，以时间轴为基准，通过数组方式进行存储以备后续计算；之后计算近端平均输入，近端信号为通过麦克风阵列输入的混合声音信号；之后判断近端语音检测器是否输入信号，即判断麦克风阵列是否还在继续采集信号，若是则继续跟进远端信号计算其平均输入和最大值，若否则跟进当前的远端平均输入和最大值以及近端平均输入进行自适应滤波处理；并且在自适应滤波处理后根据当前输入值更新自适应滤波器的收敛系数，之后经过残余回声抑制器进一步滤除其他杂波信号；之后在标识位不为零的情况下结束回音消除过程，从而实现回音消除。

电视机在进行声控操控时，电视端可能处于两种初始状态，等待唤醒状态或正常工作状态，麦克风阵列也可能处于两种状态，等待唤醒状态或唤醒状态。当麦克风阵列处于等待唤醒状态时，通过消回声功能，不管电视端处于休眠状态，还是播放节目的状态，用户通过唤醒词，在3到5米距离，都可以有效唤醒麦克风阵列，即干扰信号接收模块能在麦克风阵列处于等待唤醒状态时保持工作，检测到唤醒信号并进行消回声处理后唤醒麦克风阵列，之后麦克风阵列通过GPIO上报唤醒状态信号给电视端，电视端接收到唤醒状态信号后，若处于正常工作状态则关闭节目的背景声，若处于等待唤醒状态则唤醒电视端并关闭节目的背景声；之后麦克风阵列通过声源定向，定向增强，端点检测有效声音，得到有效声音信号后通过模拟接口输出16k16bit的音频流到电视端，用户和电视端开始一轮语音对话。

用户和电视端的一轮语音对话结束后，电视端通过GPIO管脚下发休眠指令给麦克风阵列，麦克风阵列进入等待唤醒状态，等待用户再次说出唤醒词，开启下一轮对话。

本发明还相应提供一种声控交互装置，与待控终端连接，用于对待控终端进行语音操控，由于上文已对所述声控交互装置进行了详细介绍，此处不作详述。

本发明还相应提供一种声控交互方法，如图14所示，所述声控交互方法包括如下步骤：

S100、由干扰信号接收模块接收待控终端通过预设频段发出的干扰信号并输出至信号处理模块；

S200、通过麦克风阵列模块采集当前的混合声音信号并输出至信号处理模块；

S300、由信号处理模块对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至待控终端，对待控终端进行语音操控。

综上所述，本发明提供的声控交互装置、声控交互方法和电视机中，所述声控交互装置包括外壳，所述外壳上设置有若干个用于输入声音信号的输入孔，所述外壳内设置有PCB板，其中，所述PCB板上设置有麦克风阵列模块、干扰信号接收模块和信号处理模块；由干扰信号接收模块接收待控终端通过预设频段发出的干扰信号并输出至信号处理模块，由麦克风阵列模块在接收到用户输入的唤醒信号时输出唤醒状态信号至待控终端，并采集当前的混合声音信号输出至信号处理模块，由信号处理模块对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至待控终端，对待控终端进行语音操控。采用麦克风阵列能实现远场拾音，降低声控距离要求，同时还对采集到的混合声音信号进行回音消除后再发送至待控终端，有效提高了声音操控的识别率。

可以理解的是，对本领域普通技术人员来说，可以根据本发明的技术方案及其发明构思加以等同替换或改变，而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims

1.一种声控交互装置，其与待控终端连接，包括外壳，所述外壳上设置有若干个用于输入声音信号的输入孔，所述外壳内设置有PCB板，其特征在于，所述PCB板上设置有麦克风阵列模块、干扰信号接收模块和信号处理模块；由干扰信号接收模块接收待控终端通过预设频段发出的干扰信号并输出至信号处理模块，由麦克风阵列模块在接收到用户输入的唤醒信号时输出唤醒状态信号至待控终端，并采集当前的混合声音信号输出至信号处理模块，由信号处理模块对所述干扰信号进行自适应滤波处理，得出混合声音信号中的回音信号并消除，输出混合声音信号中的有效声音信号至待控终端，对待控终端进行语音操控。

2.根据权利要求1所述的声控交互装置，其特征在于，所述干扰信号接收模块包括接收单元和放大单元，由所述接收单元接收待控终端通过预设频段发出的干扰信号并输出至放大单元，通过放大单元对所述干扰信号进行放大处理后输出模拟干扰信号至信号处理模块。

3.根据权利要求2所述的声控交互装置，其特征在于，所述信号处理模块包括模数转换单元、第一计算单元、自适应滤波单元和第二计算单元；由模数转换单元对所述模拟干扰信号进行模数转换后输出数字干扰信号，由第一计算单元计算所述数字干扰信号的平均值，通过自适应滤波单元根据所述数字干扰信号的平均值以及预设回音路径函数对所述数字干扰信号进行自适应滤波处理，得出回音信号；由第二计算单元将所述混合声音信号减去所述回音信号，输出有效声音信号至待控终端。

4.根据权利要求1所述的声控交互装置，其特征在于，所述信号处理模块还包括：

5.根据权利要求1所述的声控交互装置，其特征在于，所述麦克风阵列模块包括若干个麦克风，所述若干个麦克风呈环形设置于外壳内。

6.根据权利要求1所述的声控交互装置，其特征在于，所述外壳上还设置有显示模块，用于显示操作信息和交互提示信息。

7.一种声控交互方法，其特征在于，包括如下步骤：

8.一种电视机，其特征在于，包括电视端和如权利要求1-6任意一项所述的声控交互装置，通过所述声控交互装置对电视端进行语音操控。

9.根据权利要求8所述的电视机，其特征在于，所述电视端包括干扰信号发射模块和语音识别处理模块，由干扰信号发射模块将电视端输出的干扰信号加载至预设频段后发送至所述声控交互装置，由语音识别处理模块接收所述声控交互装置输出有效声音信号并进行语音识别，得出相应的控制指令，对电视端进行语音操控。

10.根据权利要求8所述的电视机，其特征在于，所述电视端还包括音量控制模块和休眠控制模块，由音量控制模块在接收到声控交互装置输出的唤醒状态信号后控制电视端静音；由休眠控制模块在检测到完成语音操控后输出休眠指令至声控交互装置，控制其进入休眠状态。