WO2019037732A1

WO2019037732A1 - 麦克风阵列的电视机及电视系统

Info

Publication number: WO2019037732A1
Application number: PCT/CN2018/101657
Authority: WO
Inventors: 李新; 卢铁军
Original assignee: 深圳创维－Rgb电子有限公司
Priority date: 2017-08-23
Filing date: 2018-08-22
Publication date: 2019-02-28
Also published as: CN107454508A; CN107454508B

Abstract

本发明公开了一种麦克风阵列的电视机及电视系统，本发明通过麦克风阵列采集第一声音音频信号，并将所述第一声音音频信号发送至所述处理器，处理器对所述第一声音音频信号进行回音消除和干扰声过滤处理，以获得原声音频信号，将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器，智能语音服务器获取与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述音响，音响将所述应答语音数据输出，使整个语音交互过程更加灵活简单，能够更加有效的提高语音识别灵敏度，显著提升了语音交互回馈内容的准确性和用户体验。

Description

麦克风阵列的电视机及电视系统

技术领域

本发明涉及电视机领域，尤其涉及一种麦克风阵列的电视机及电视系统。

背景技术

随着科技的发展及智能数码设备的普及，人机交互功能及系统越来越受到人们的青睐，通常情况下人们通过遥控器或按键来控制电视机，而语音遥控则越过遥控器和按键，直接用声音控制电视机功能，并可以与电视机互动，达到人机交互的目的，在电视机上体现人工智能，为用户带来很多方便。

传统智能电视机本身负责语音接收的麦克风容易受环境噪声干扰，其干扰源来自于电视机本身的声音输出和外界环境声音。当电视机正常工作时，电视机本身会通过喇叭发出声音，此时如果启动麦克风功能，那么喇叭输出的声音被麦克风接收后对麦克风产生干扰，其干扰回传给主控芯片并通过功放输出给喇叭，此时电视机本身输出的声音与麦克风产生的干扰混在一起输出，在正常的声音里会混有很大的底噪声，尤其在周围安静的环境下，此底噪声会特别明显。当外界环境相对很吵杂时，此时开启麦克风功能，麦克风识别人声指令时容易受到外界环境声音干扰，从而体现识别灵敏度低，回馈内容有误等，降低用户体验感。用户在使用电视机麦克风功能时，其与电视机之间的距离不可控，位置不可控，这样就会导致麦克风在不同距离和不同角度上捕捉的信号有差别，从而导致识别效果不好，因此现有的技术还有待提高。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明主要目的在于提供一种麦克风阵列的电视机及电视系统，旨在解决现有技术中语音交互识别灵敏度低，回馈内容有误造成的用户体验感差的技术问题。

为实现上述目的，本发明提供一种麦克风阵列的电视系统，所述电视系统包括：麦克风阵列、处理器、智能语音服务器和音响；

所述麦克风阵列，用于采集第一声音音频信号，并将所述第一声音音频信号发送至所述处理器；

所述处理器，用于对所述第一声音音频信号进行回音消除和干扰声过滤处理，以获得原声音频信号，将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器；

所述智能语音服务器，用于获取与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述音响；

所述音响，用于将所述应答语音数据输出。

进一步地，所述处理器，还用于分析所述数字信号中是否包含有与预设关键词对应的目标数据，若所述数字信号中包含所述目标数据，则将所述智能语音服务器设置为开启状态，若所述数字信号中未包含所述目标数据，则将所述智能语音服务器设置为关闭状态。

进一步地，所述智能语音服务器，还用于在处于所述开启状态时，判断在所述智能语音服务器的本地数据库中是否存在与所述数字信号匹配的本地数据，当所述本地数据库中存在与所述数字信号匹配的所述本地数据时，将所述本地数据作为所述应答语音数据。

进一步地，所述智能语音服务器，还用于当所述本地数据库不存在与所述数字信号匹配的本地数据时，通过互联网搜索与所述数字信号匹配的相关资源数据，将所述相关资源数据作为所述应答语音数据。

进一步地，所述处理器，还用于接收所述第一声音音频信号和音响声音对应的音响回传音频信号，将所述音响回传音频信号与所述声音音频信号进行对比，消除所述第一声音音频信号中所述音响声音对应的音响音频信号，将消除所述音响音频信号的第一声音音频信号作为第二声音音频信号，对所述第二声音音频信号进行识别，获取所述原声音频信号和干扰声音频信号，消除所述干扰声音音频信号，以获得所述原声音频信号。

进一步地，所述电视系统还包括：输入输出缓冲器；

所述输入输出缓冲器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，将所述第一声音音频信号和所述音响回传音频信号暂时存储，使所述音响回传音频信号和所述第一声音音频信号同步后，再将经过同步后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。

进一步地，所述电视系统还包括：自动增益控制器；

所述自动增益控制器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，以保证所述第一声音音频信号和所述音响回传音频信号的输出强度，将经过自动增益控制后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。

进一步地，所述智能语音服务器，还用于与外部智能家用电器建立无线连接，根据所述数字信号生成控制信号，将所述控制信号发送至所述外部智能家用电器以实现语音控制。

进一步地，所述处理器，还用于按照预设频率范围对所述第一声音音频信号和所述音响回传音频信号进行过滤。

此外，为实现上述目的，本发明还提出一种电视机，所述电视机包括上述麦克风阵列的电视系统。

本发明通过麦克风阵列采集第一声音音频信号，并将所述第一声音音频信号发送至所述处理器，处理器对所述第一声音音频信号进行回音消除和干扰声过滤处理，以获得原声音频信号，将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器，智能语音服务器获取与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述音响，音响将所述应答语音数据输出，使整个语音交互过程更加灵活简单，能够更加有效的提高语音识别灵敏度，显著提升了语音交互回馈内容的准确性和用户体验。

附图说明

图1为本发明麦克风阵列的电视及电视系统第一实施例的结构框图；

图2为本发明麦克风阵列的电视及电视系统中麦克风阵列排列方式示意图；

图3为本发明麦克风阵列的电视及电视系统第二实施例的结构框图；

图4为本发明麦克风阵列的电视及电视系统中回音消除和干扰声过滤处理流程图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明麦克风阵列的电视及电视系统第一实施例的结构框图。

所述电视系统包括：麦克风阵列10、处理器20、智能语音服务器30和音响40；

所述麦克风阵列10，用于采集第一声音音频信号，并将所述第一声音音频信号发送至所述处理器；

需要说明的是，所述麦克风阵列10还用于确定外界声源的采集位置，在所述采集位置上采集第一声音音频信号，并将所述第一声音音频信号发送至所述处理器；所述麦克风阵列10具有远场识别和声源定位功能，所述麦克风阵列10由一定数目的声学传感器(一般是麦克风)组成，根据声源定位功能确定外界声源的位置，将该位置作为采集位置，在所述采集位置上采集的声音信号作为所述第一声音音频信号，并将所述第一声音音频信号发送至所述处理器10；

可以理解的是，所述麦克风阵列10是指多个麦克风以一定规则排列，比如麦克风之间的间距、麦克风数量和方向等进行排列，例如，图2为本发明麦克风阵列的电视及电视系统中麦克风阵列排列方式示意图。如图2所示的麦克风阵列排列方式是众多排列方式中的一种，当然还可以采用其他的排列规则进行排列，本实施例对此不加以限制。参照图2，其中X轴麦克风m的数量大于等于1，Y轴麦克风m的数量大于等于1，麦克风m的总数量大于等于2。

在具体实现中，通常状况下讲话者与智能电视机语音交互的时候都有一定的距离，在一定空间内有很多环境噪声也会干扰麦克风阵列对讲话者声音的识别，麦克风阵列10会用其多个（至少三个）麦克风的优势和远场语音识别功能过滤出在讲话者方向除了讲话者声音以外的声音，在一定距离内达到精准识别效果。多个麦克风根据接收到讲话者声音的时间不同，定位讲话者所在的方向，通过软件算法过滤掉其它方向的噪声，辅助远场识别达到更加精准的识别效果。

所述处理器20，用于接收所述第一声音音频信号，对所述第一声音音频信号进行回音消除和干扰声过滤处理，以获得原声音频信号，将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器30；

需要说明的是，所述处理器20具有对音频处理的功能，能够对所述第一声音音频信号进行回音消除和干扰声过滤处理，以获得原声音频信号，所述原声音频信号是指通过所述麦克风阵列10采集的所述第一声音音频信号去除干扰信号和回音信号后剩余的音频信号，获得所述原声音频信号后将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器30；

所述处理器20，还用于接收所述第一声音音频信号和音响声音对应的音响回传音频信号，将所述音响回传音频信号与所述声音音频信号进行对比，消除所述第一声音音频信号中所述音响声音对应的音响音频信号，将消除所述音响音频信号的第一声音音频信号作为第二声音音频信号，对所述第二声音音频信号进行识别，获取所述原声音频信号和干扰声音频信号，消除所述干扰声音音频信号，以获得所述原声音频信号。

需要说明的是，通过将所述音响回传音频信号与所述声音音频信号进行对比，消除所述第一声音音频信号中所述音响声音对应的音响音频信号，将所述第二声音音频信号进行识别，获取所述原声音频信号和所述干扰声音频信号的频谱，识别的方式可以通过软件算法对这两种信号进行实时对比，让讲话者的所述原声音频信号通过，并把所述干扰声音频信号的频谱过滤掉，当然还可以是通过其他识别方式以达到消除干扰声和音响回音的效果，本实施例对此不加以限制。

所述处理器20，还用于按照预设频率范围对所述第一声音音频信号和所述音响回传音频信号进行过滤。

需要说明的是，所述处理器20对所述第一声音音频信号和所述音响回传音频信号进行过滤，可以将所述第一声音音频信号和所述音响回传音频信号中超出预设频率范围的部分音频信号过滤出来，过滤的过程相当于对所述第一声音音频信号和所述音响回传音频信号做了初步的筛选，提升了语音识别的灵敏度，避免了干扰音频信号和所述音响音频信号对所述数字信号造成的误差，提高了语音识别的准确性和效率。

在具体实现中，所述处理器20可以利用软件算法对通过麦克风阵列获取的不同方向的声音进行辨别，辨别出是谁在说话，还可以辨别出方向，对不同方向不同的声音频谱进行标记和辨别，从而针对不同的人或多人进行一一回答。

进一步地，所述处理器20还用于分析所述数字信号中是否包含有与预设关键词对应的目标数据，若所述数字信号中包含所述目标数据，则将所述智能语音服务器30设置为开启状态，若所述数字信号中未包含所述目标数据，则将所述智能语音服务器30设置为关闭状态。

可以理解的是，所述处理器20能够通过识别所述数字信号中的关键词快速控制所述智能语音服务器30的启停，提高语音交互的效率；所述预设关键词可以是电视系统默认的关键词，也可以是用户自行设定的关键词，本实施例对此不加以限制。

在具体实现中，当电视机正在工作、音响正常输出声音时，所述处理器20将麦克风阵列10采集的所述第一声音音频信号进行回音消除和干扰声过滤处理后获得所述原声音频信号，将所述原声音频信号转换成数字信号，分析所述数字信号中是否包含有预设关键词中的关键词，若存在所述关键词，则所述关键词会“唤醒”所述智能语音服务器30，所述处理器20生成相应控制指令减小系统声音的输出，以减小电视机本身声音大小对语音反馈的干扰，所述智能语音服务器30及时处理所述数字信号并反馈语音信息，以正常的声音通过音箱输出。

所述智能语音服务器30，用于接收所述数字信号，获取与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述音响40；

所述音响40，用于接收所述应答语音数据，将所述应答语音数据输出。

需要说明的是，所述音响40可以是电视机的本机音响，也可以是与电视机连接的外设音响，本实施例对此不加以限制。

可以理解的是，所述智能语音服务器30还用于将所述应答语音数据发送至所述处理器20，所述处理器20，根据所述应答语音数据生成对应的控制指令以进行相应操作；相应操作可以是对相应的外接设备例如外接音箱进行关闭、开启和调节音量等控制，还可以是对电视机本身进行相应控制例如调出相应显示页面，按照控制指令进行换台、搜索、重放、返回和暂停等相应操作，当然还可以是根据控制指令进行其他的操作，本实施例对此不加以限制。

在具体实现中，所述处理器20与所述智能语音服务器30通过软件功能接口和硬件功能接口进行对接，以使所述智能语音服务器30将与所述数字信号匹配的应答语音数据发送至所述处理器20，所述处理器20根据所述应答语音数据生成对应的控制指令以进行相应操作；例如：用户说：“现在正在播放的综艺节目有哪些？”所述麦克风阵列10采集到该音频信号后，经过处理器20回音消除和干扰声过滤处理，获得原声音频信号，将该原声音音频信号转换成数字信号后，经过所述智能语音服务器30查找到与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述处理器20和所述音响40，所述处理器20根据所述应答语音数据生成对应的控制指令，查找现在正在播放的综艺节目，并将查找到的结果在电视机显示屏幕显示出来，生成相应反馈语音数据发送至所述音响40，所述音响40将所述反馈语音数据和所述应答语音数据输出，即“好的，正在帮您搜寻”“已经帮您搜寻到七档正在播放的综艺节目，您可以在搜寻结果显示界面进行选择观看”，当然还可以是其他情景的处理方式，本实施例对此不加以限制。

需要说明的是，所述智能语音服务器30接收所述数字信号后，对所述数字信号进行大数据分析和处理，获得与所述数字信号匹配的应答语音数据，并将所述应答语音数据发送至所述音响40；

进一步地，所述智能语音服务器30，还用于在处于所述开启状态时，判断在所述智能语音服务器30的本地数据库中是否存在与所述数字信号匹配的本地数据，当所述本地数据库中存在与所述数字信号匹配的所述本地数据时，将所述本地数据作为所述应答语音数据；

需要说明的是，当所述智能语音服务器30处于所述开启状态时，可以在所述本地数据库中查找与所述数字信号匹配的数据，若找到与所述数字信号匹配的数据，则将该数据作为所述应答语音数据；

可以理解的是，所述智能语音服务器30，可以利用深度学习算法对所述本地数据库中的数据进行识别并生成识别结果，根据所述识别结果建立所述本地数据库中的数据之间的应答映射关系，根据所述应答映射关系可以在所述数字信号与所述本地数据库中的数据匹配时，首先查找到本地数据库中与所述数字信号相同意思的数据，然后通过所述应答映射关系在本地数据库中找到与所述数字信号相同意思的数据有应答关系的数据，将该数据作为所述应答语音数据，当然还可以通过其他方式从所述本地数据库中找到与所述数字信号匹配的数据，本实施例对此不加以限制。

应当理解的是，所述智能语音服务器30的所述本地数据库会不断积累和更新语音数据，通过深度学习算法进行语音识别，语义识别和声纹识别等，不断日积月累，在不断完善的大数据下更准确的提供语音数据，从而提升识别语音数据和回馈所述应答语音数据的准确性；所述本地数据库通过不断积累，存储有根据所述识别结果建立所述本地数据库中的数据之间的应答映射关系，在电视机未联网的情况下就能够达到智能的表现，提供精准的语音应答，通过精准的语音应答能够取代遥控器解放双手，实现人机直接交互，提高了用户体验。

进一步地，所述智能语音服务器30，还用于当所述本地数据库不存在与所述数字信号匹配的本地数据时，通过互联网搜索与所述数字信号匹配的相关资源数据，将所述相关资源数据作为所述应答语音数据。

应当理解的是，当所述本地数据库不存在与所述数字信号匹配的本地数据时，通过互联网搜索与所述数字信号匹配的相关资源数据，所述相关资源数据分为内部资源数据与外部资源数据，所述内部资源数据为与当前电视机匹配的云端后台数据库的资源数据，所述外部资源数据为在互联网上抓取的与所述数字信号匹配的资源数据；在实际应用中，受制于电视机的内存大小，所述本地数据库无法存放太多的数据，当所述本地数据库中不存在与所述数字信号匹配的本地数据时，优先选择通过互联网搜索所述内部资源数据中是否存在与所述数字信号匹配的相关资源数据，若在所述内部资源数据中还不存在与所述数字信号匹配的相关资源数据，则搜索所述外部资源数据中是否存在与所述数字信号匹配的相关资源数据，所述内部资源数据比所述外部资源数据更加开放自由，选择针更强，且搜索内部资源数据的时间比搜索所述外部资源数据的时间更快，搜索内部资源数据耗费的计算资源和成本比搜索所述外部资源数据更低。

需要说明的是，利用互联网搜索与所述数字信号匹配的相关资源数据，将所述相关资源数据作为所述应答语音数据，若搜索到的与所述数字信号匹配的相关资源数据很多，则可以是按照与所述数字信号的匹配程度对搜索到的所述相关资源数据从高到低进行排序，选取与所述数字信号的匹配程度最高的相关资源数据作为所述应答语音数据，还可以是根据调查用户的说话习惯选择与用户说话习惯相匹配的数据作为所述应答语音数据，当然还可通过其他方式从众多相关资源数据中选取出最优的数据作为所述应答语音数据，本实施例对此不加以限制。

可以理解的是，所述智能语音服务器30接收所述数字信号后，对所述数字信号进行大数据分析和处理，通过所述本地数据库的数据与所述数字信号比对，如果所述本地数据库的数据无法与所述数字信号匹配，即所述本地数据库的资源有限，那么可以利用互联网搜索与所述数字信号匹配的相关资源数据，可以优先从所述内部资源数据中查找与所述数字信号匹配的相关资源数据，若未找到则可以从所述外部资源数据例如在一些开放平台或在网页上搜索与所述数字信号匹配的相关资源数据，找到与所述数字信号的匹配程度最高的数据作为所述应答语音数据，通过将与所述数字信号的匹配程度最高的相关资源数据保存在所述本地数据库中，可以实时更新所述本地数据库，可以扩大本地资源容量，并且能够优化和提升语音识别和应答效率，使语音交互更加智能化、人性化。

在具体实现中，可以通过与多个语音资源方案商合作，与多个网络搜索引擎资源合作，打通各个平台兼容性，在用户使用过程中，所述智能语音服务器30优先选择回馈速度最快、最准确的方案，为用户提供最优质、最想要的内容。

进一步地，所述智能语音服务器30还用于与外部智能家用电器建立无线连接，根据所述数字信号生成控制信号，将所述控制信号发送至所述外部智能家用电器以实现语音控制。

需要说明的是，通过所述智能语音服务器30可以通过与智慧家庭类似的功能联合使用，与外部智能家用电器建立无线连接，当然也可以是通过其他方式与外部智能家用电器进行连接，本实施例对此不加以限制；电视机将接收到的声音数据转换成控制数据，通过无线通信技术把控制数据发送给与电视机互联的其它智能家用电器，达到语音控制智能家用电器的目的，从而可实现互通互联。

可以理解的是，所述无线连接可以是通过WiFi进行连接，也可以是通过蓝牙进行连接，本实施例对此不加以限制。例如，电视机通过蓝牙连接蓝牙智能音箱并且在音箱正常工作时，当用户对电视机说“关闭蓝牙音箱声音”，电视系统给音箱发送关闭声音的数据，蓝牙音箱接收到数据后进行处理，关闭自身音量，从而达到控制目的。

本实施例通过麦克风阵列采集第一声音音频信号，并将所述第一声音音频信号发送至所述处理器，处理器对所述第一声音音频信号进行回音消除和干扰声过滤处理，以获得原声音频信号，将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器，智能语音服务器获取与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述音响，音响将所述应答语音数据输出，使整个语音交互过程更加灵活简单，能够更加有效的提高语音识别灵敏度，显著提升了语音交互回馈内容的准确性和用户体验。

基于上述第二实施例，提出本发明麦克风阵列的电视及电视系统第二实施例，图3为本发明麦克风阵列的电视及电视系统第二实施例的结构框图，参照图3，所述电视系统还包括：输入输出缓冲器50和所述自动增益控制器60；

所述输入输出缓冲器50，用于在所述处理器20接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，将所述第一声音音频信号和所述音响回传音频信号暂时存储，使所述音响回传音频信号和所述第一声音音频信号同步后，再将经过同步后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器20。

所述自动增益控制器60，用于在所述处理器20接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，以保证所述第一声音音频信号和所述音响回传音频信号的输出强度，将经过自动增益控制后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器20。

可以理解的是，所述输入输出缓冲器50起到的作用是协调和缓冲，将所述第一声音音频信号和所述音响回传音频信号暂时存储，使所述音响回传音频信号和所述第一声音音频信号同步后，再将经过同步后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器20，以使高速工作的处理器（例如CPU）与慢速工作的外设能够实现数据传送的同步；所述自动增益控制器60能够对输出信号即所述第一声音音频信号和所述音响回传音频信号进行调整，保证输出信号强度。

在具体实现中，本发明麦克风阵列的电视及电视系统还包括数字化采样器和数字化滤波器，如图4本发明麦克风阵列的电视及电视系统中回音消除和干扰声过滤处理流程图所示，参见图4，回音消除和干扰声过滤处理流程如下：麦克风阵列接收所述第一声音音频信号，所述第一声音音频信号包含外界环境中不同方向的原声，干扰声和电视机本身的声音；麦克风阵列将接收的所述第一声音音频信号发送至数字化采样器，同时数字化采样器通过线路回音将音响输出的模拟电信号进行采样；数字化采样器将采集的声音信号通过脉冲编码调制(Pulse Code Modulation，PCM)处理转换成PCM信号格式，并通过数字化滤波器移除信号中不需要的部分，比如随机噪声，取出信号中有用的部分，比如人耳可听频率范围内的成分。将输出的有用信号传递给输入输出缓冲器，输入输出缓冲器将经过所述数字化滤波器的信号进行电平转换处理，使高速工作的CPU与慢速工作的外设起协调和缓冲作用，实现数据传送的同步。从音响采样过来的信号需，为后续消除回音做准备，并将此处理后的数据与麦克风阵列采集处理后的数据同时给到自动增益控制器，所述自动增益控制器对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，对输出信号进行调整，保证输出信号强度。处理器将自动增益控制器输出的信号进行锁相同步处理，对两种信号进行编制、转换，使其可被存储和比较，通过比较逻辑、系统级芯片（System on Chip，SOC）端逻辑运算和软件算法将两种信号进行加法处理，去掉麦克阵列传来的信号即所述第一声音音频信号中所述音响声音对应的音响音频信号，即理解为去掉麦克风中接收到的音响回声。将得到的第二声音音频信号进行解码，再通过残余回声和噪声抑制，抑制或过滤掉除讲话者频谱以外的干扰，再将信号传递给音频处理器形成所述原声音频信号，将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器，通过智能语音服务器通过音频处理器获取到有用信息进行解析，获取与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述音响，所述音响将所述应答语音数据输出，所述智能语音服务器将所述应答语音数据发送至所述处理器，所述处理器根据所述应答语音数据生成对应的控制指令以进行相应操作，从而达到交互和控制目的。

本实施例通过输入输出缓冲器对所述第一声音音频信号和所述音响回传音频信号进行电平转换处理，以使所述音响回传音频信号和所述第一声音音频信号的电压一致，自动增益控制器所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，以保证所述第一声音音频信号和所述音响回传音频信号的输出强度，提高了第一声音音频信号和所述音响回传音频信号的输出强度，实现所述音响回传音频信号和所述第一声音音频信号同步传输，进一步提高了语音识别的准确性和效率，提升了用户体验。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

一种麦克风阵列的电视系统，其特征在于，所述电视系统包括：麦克风阵列、处理器、智能语音服务器和音响；

所述麦克风阵列，用于采集第一声音音频信号，并将所述第一声音音频信号发送至所述处理器；

所述处理器，用于对所述第一声音音频信号进行回音消除和干扰声过滤处理，以获得原声音频信号，将所述原声音频信号转换成数字信号，将所述数字信号发送至所述智能语音服务器；

所述智能语音服务器，用于获取与所述数字信号匹配的应答语音数据，将所述应答语音数据发送至所述音响；

所述音响，用于将所述应答语音数据输出。
如权利要求1所述的电视系统，其特征在于，所述处理器，还用于分析所述数字信号中是否包含有与预设关键词对应的目标数据，若所述数字信号中包含所述目标数据，则将所述智能语音服务器设置为开启状态，若所述数字信号中未包含所述目标数据，则将所述智能语音服务器设置为关闭状态。
如权利要求2所述的电视系统，其特征在于，所述智能语音服务器，还用于在处于所述开启状态时，判断在所述智能语音服务器的本地数据库中是否存在与所述数字信号匹配的本地数据，当所述本地数据库中存在与所述数字信号匹配的所述本地数据时，将所述本地数据作为所述应答语音数据。
如权利要求3所述的电视系统，其特征在于，所述智能语音服务器，还用于当所述本地数据库不存在与所述数字信号匹配的本地数据时，通过互联网搜索与所述数字信号匹配的相关资源数据，将所述相关资源数据作为所述应答语音数据。
如权利要求1所述的电视系统，其特征在于，所述处理器，还用于接收所述第一声音音频信号和音响声音对应的音响回传音频信号，将所述音响回传音频信号与所述声音音频信号进行对比，消除所述第一声音音频信号中所述音响声音对应的音响音频信号，将消除所述音响音频信号的第一声音音频信号作为第二声音音频信号，对所述第二声音音频信号进行识别，获取所述原声音频信号和干扰声音频信号，消除所述干扰声音音频信号，以获得所述原声音频信号。
如权利要求2所述的电视系统，其特征在于，所述处理器，还用于接收所述第一声音音频信号和音响声音对应的音响回传音频信号，将所述音响回传音频信号与所述声音音频信号进行对比，消除所述第一声音音频信号中所述音响声音对应的音响音频信号，将消除所述音响音频信号的第一声音音频信号作为第二声音音频信号，对所述第二声音音频信号进行识别，获取所述原声音频信号和干扰声音频信号，消除所述干扰声音音频信号，以获得所述原声音频信号。
如权利要求3所述的电视系统，其特征在于，所述处理器，还用于接收所述第一声音音频信号和音响声音对应的音响回传音频信号，将所述音响回传音频信号与所述声音音频信号进行对比，消除所述第一声音音频信号中所述音响声音对应的音响音频信号，将消除所述音响音频信号的第一声音音频信号作为第二声音音频信号，对所述第二声音音频信号进行识别，获取所述原声音频信号和干扰声音频信号，消除所述干扰声音音频信号，以获得所述原声音频信号。
如权利要求4所述的电视系统，其特征在于，所述处理器，还用于接收所述第一声音音频信号和音响声音对应的音响回传音频信号，将所述音响回传音频信号与所述声音音频信号进行对比，消除所述第一声音音频信号中所述音响声音对应的音响音频信号，将消除所述音响音频信号的第一声音音频信号作为第二声音音频信号，对所述第二声音音频信号进行识别，获取所述原声音频信号和干扰声音频信号，消除所述干扰声音音频信号，以获得所述原声音频信号。
如权利要求5所述的电视系统，其特征在于，所述电视系统还包括：输入输出缓冲器；

所述输入输出缓冲器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，将所述第一声音音频信号和所述音响回传音频信号暂时存储，使所述音响回传音频信号和所述第一声音音频信号同步后，再将经过同步后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求5 所述的电视系统，其特征在于，所述电视系统还包括：自动增益控制器；

所述自动增益控制器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，以保证所述第一声音音频信号和所述音响回传音频信号的输出强度，将经过自动增益控制后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求5所述的电视系统，其特征在于，所述智能语音服务器，还用于与外部智能家用电器建立无线连接，根据所述数字信号生成控制信号，将所述控制信号发送至所述外部智能家用电器以实现语音控制。
如权利要求5所述的电视系统，其特征在于，所述处理器，还用于按照预设频率范围对所述第一声音音频信号和所述音响回传音频信号进行过滤。
如权利要求6所述的电视系统，其特征在于，所述电视系统还包括：输入输出缓冲器；

所述输入输出缓冲器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，将所述第一声音音频信号和所述音响回传音频信号暂时存储，使所述音响回传音频信号和所述第一声音音频信号同步后，再将经过同步后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求6 所述的电视系统，其特征在于，所述电视系统还包括：自动增益控制器；

所述自动增益控制器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，以保证所述第一声音音频信号和所述音响回传音频信号的输出强度，将经过自动增益控制后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求7所述的电视系统，其特征在于，所述电视系统还包括：输入输出缓冲器；

所述输入输出缓冲器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，将所述第一声音音频信号和所述音响回传音频信号暂时存储，使所述音响回传音频信号和所述第一声音音频信号同步后，再将经过同步后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求7所述的电视系统，其特征在于，所述电视系统还包括：自动增益控制器；

所述自动增益控制器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，以保证所述第一声音音频信号和所述音响回传音频信号的输出强度，将经过自动增益控制后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求8所述的电视系统，其特征在于，所述电视系统还包括：输入输出缓冲器；

所述输入输出缓冲器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，将所述第一声音音频信号和所述音响回传音频信号暂时存储，使所述音响回传音频信号和所述第一声音音频信号同步后，再将经过同步后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求8 所述的电视系统，其特征在于，所述电视系统还包括：自动增益控制器；

所述自动增益控制器，用于在所述处理器接收所述第一声音音频信号和音响声音对应的音响回传音频信号之后，对所述第一声音音频信号和所述音响回传音频信号进行自动增益控制，以保证所述第一声音音频信号和所述音响回传音频信号的输出强度，将经过自动增益控制后的所述第一声音音频信号和所述音响回传音频信号发送至所述处理器。
如权利要求8所述的电视系统，其特征在于，所述智能语音服务器，还用于与外部智能家用电器建立无线连接，根据所述数字信号生成控制信号，将所述控制信号发送至所述外部智能家用电器以实现语音控制。
一种电视机，其特征在于，所述电视机包含权利要求1至19任一项所述的电视系统。