CN106452987B

CN106452987B - 一种语音控制方法及装置、设备

Info

Publication number: CN106452987B
Application number: CN201610517972.7A
Authority: CN
Inventors: 蔡効谦
Original assignee: Guangdong Midea Refrigeration Equipment Co Ltd
Current assignee: GD Midea Air Conditioning Equipment Co Ltd
Priority date: 2016-07-01
Filing date: 2016-07-01
Publication date: 2019-07-30
Anticipated expiration: 2036-07-01
Also published as: CN106452987A

Abstract

本发明公开了一种语音控制方法及装置、设备，其中所述方法包括：确定设备集合针对一条语音的音量向量V，所述设备集合包括N台具有语音识别功能的设备；确定所述设备集合中第i设备对应的设备特征向量Fi，其中，所述第i台设备为所述设备集合中的设备，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；根据所述音量向量V和所述第i设备对应的设备特征向量Fi，确定所述第i设备对应的音量距离di；按照预设的规则和所述第i设备对应的音量距离di确定受控设备的标识信息，所述受控设备为所述设备集合中的设备；根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令。

Description

一种语音控制方法及装置、设备

技术领域

本发明涉及电子技术，尤其涉及一种语音控制方法及装置、电子设备。

背景技术

智能家居是信息技术向传统家电产业发展的必然结果。近年来信息化的高度发展和人类对居住环境的节能性、安全性、舒适性、效率性要求的提高，促使智能家居快速发展。普通家电(普通的家用电器)只能被动地接受用户的手动控制，而智能家电(智能的家用电器)与普通家电相比，智能家电不仅具有传统家电的功能，还能根据人们的语音命令主动地识别语音并执行相应动作，从智能家电让家居生活更加舒适、安全和高效。

随着越来越多的智能家电进入人们的家庭，如何对它们进行简单、有效的控制是目前需要解决的问题。目前一个家庭中可能拥有多台智能家电，如果用户发出语音指令想控制其中的一台智能家电，那么必须要指定该语音指令是面向哪一台智能家电的，否则要么所有的智能家电都不执行该语音指令，要么所有的智能家电都执行该语音指令。例如客厅里面包括两台智能家电：一台空调和一台音箱，如果用户想让其中的一台智能家电开机，那么必须要说出该智能家电能够识别的标识信息(如家电名称)和对应的开机语音指令，例如空调的标识信息为A1空调，音响的标识信息为A2音箱，那么如果用户想让空调开机，那么发出的语音需要包括空调的标识信息和对应的开机语音指令，例如：“A1空调，开机”，这样客厅的空调才会开机；如果用户想让音箱开机，那么发出的语音需要包括音箱的标识信息和对应的开机语音指令，例如：“A2音箱，开机”，这样客厅的音箱才会开机。如果用户的语音中不包括智能家电的标识信息，例如用户发出语音“开机”，那么客厅的空调和音箱将都不开机或者都开机。

由此可见，如果用户发出语音指令想控制其中的一台智能家电，那么必须要指定该语音指令是面向哪一台智能家电的，否则要么所有的智能家电都不执行该语音指令，要么所有的智能家电都执行该语音指令。现有技术中用户如果想要控制一台智能家电，就需要说出家电的标识信息，从而在语音控制家电的过程中，浪费了大部分的时间在呼喊家电的标识信息，用户的语音操作比较没效率。

发明内容

有鉴于此，本发明实施例为解决现有技术中存在的至少一个问题而提供一种语音控制方法及装置、设备，能够无需说出设备的标识信息即可准确识别受控设备。

本发明实施例的技术方案是这样实现的：

第一方面，本发明实施例提供一种语音控制方法，所述方法包括：

确定设备集合针对一条语音的音量向量V，所述设备集合包括N台具有语音识别功能的设备，N为大于等于2的整数；

确定所述设备集合中第i设备对应的设备特征向量Fi，其中，所述第i台设备为所述设备集合中的设备，所述i为大于等于1且小于等于N的整数，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；

根据所述音量向量V和所述第i设备对应的设备特征向量Fi，确定所述第i设备对应的音量距离di；

按照预设的规则和所述第i设备对应的音量距离di确定受控设备的标识信息，所述受控设备为所述设备集合中的设备；

根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令。

第二方面，本发明实施例提供一种语音控制装置，所述装置包括第一确定单元、第二确定单元、第三确定单元、第四确定单元和控制单元，其中：

所述第一确定单元，用于确定设备集合针对一条语音的音量向量V，所述设备集合包括N台具有语音识别功能的设备，N为大于等于2的整数；

所述第二确定单元，用于确定所述设备集合中第i设备对应的设备特征向量Fi，其中，所述第i台设备为所述设备集合中的设备，所述i为大于等于1且小于等于N的整数，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；

所述第三确定单元，用于根据所述音量向量V和所述第i设备对应的设备特征向量Fi，确定所述第i设备对应的音量距离di；

所述第四确定单元，用于按照预设的规则和所述第i设备对应的音量距离di确定受控设备的标识信息，所述受控设备为所述设备集合中的设备；

所述控制单元，用于根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令。

第三方面，本发明实施例一种语音控制设备，所述设备包括通信接口和处理器，其中：

所述处理器，用于确定设备集合针对一条语音的音量向量，所述设备集合包括N台具有语音识别功能的设备，N为大于等于2的整数；

确定所述设备集合中第i设备对应的设备特征向量，其中，所述第i台设备为所述设备集合中的设备，所述i为大于等于1且小于等于N的整数，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；

根据所述受控设备的标识信息通过所述通信接口控制所述受控设备响应所述语音对应的语音指令。

本发明实施例提供一种语音控制方法及装置、设备，其中，确定设备集合针对一条语音的音量向量V，所述设备集合包括N台具有语音识别功能的设备；确定所述设备集合中第i设备对应的设备特征向量Fi，其中，所述第i台设备为所述设备集合中的设备，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；根据所述音量向量V和所述第i设备对应的设备特征向量Fi，确定所述第i设备对应的音量距离di；按照预设的规则和所述第i设备对应的音量距离di确定受控设备的标识信息，所述受控设备为所述设备集合中的设备；根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令；如此，能够无需说出设备的标识信息即可准确识别受控设备。

附图说明

图1-1为现有技术中语音识别系统架构的场景示意图；

图1-2为本发明实施例语音识别系统架构的场景示意图；

图1-3为本发明实施例一语音控制方法的实现流程示意图；

图2为本发明实施例二语音控制方法的实现流程示意图；

图3为本发明实施例语音识别系统架构的示意图；

图4为本发明实施例七语音控制装置的组成结构示意图；

图5为本发明实施例八语音控制设备的组成结构示意图。

具体实施方式

现有技术中，当在一个空间下有多台语音识别设备时，各台语音识别设备之间并无联系，而是各自独立地对用户发出的语音进行识别，然后对能够识别的语音指令进行执行，对不能识别的语音指令向用户反馈无法执行。图1-1为现有技术中语音识别系统架构的场景示意图，如图1-1所示，以客厅为例，在客厅中包括4台语音识别设备，例如一台电冰箱11、一台音箱12、一台电视机13和一台电扇14。当用户发出一条语音时，电冰箱11、音箱12、电视机13和电扇14分别对该语音进行识别，客厅中的4台语音识别设备它们之间并无任何联系。因此，现有技术的上述语音识别系统架构存在很多问题，例如：

现有技术的场景一中，一个家庭中拥有多台智能家电，如果用户发出语音指令想控制其中的一台智能家电，那么必须要指定该语音指令是面向哪一台智能家电的，否则要么所有的智能家电都不执行该语音指令，要么所有的智能家电都执行该语音指令。现有技术中用户如果想要控制一台智能家电，就需要说出家电的标识信息，从而在语音控制家电的过程中，浪费了大部分的时间在呼喊家电的标识信息，用户的语音操作比较没效率。

现有技术的场景二中，当一个空间有多台相同的设备的时候，即使用户指定该语音指令是面向哪台智能家电的，那么也可能造成混淆，例如客厅包括两台A3空调时，当用户说出语音“A3空调请开机”，那么客厅的两台A3空调都会响应该语音“A3空调请开机”，从而两台A3空调都会开机，实际上用户很有可能只是想让其中的一台A3空调开机，那么现有技术中由于两台A3空调无法识别该语音到底是自己还是别人开机，因此会造成误操作。

现有技术的场景三中，当一个空间下有多个语音识别设备，如果用户发出的语音是针对一台设备的，即使该设备能够准确识别且响应；但是由于该语音对于其他设备是无法识别的，因此，其他设备会回应语音“无法识别”，从而造成空间噪音；例如，在客厅包括一台音箱、一台空调和一台电视机，如果用户发出语音“20度”，即使空调会准确响应该语音并且制冷，但是该客厅内的音箱和电视机都会回应语音“无法识别”，从而造成空间噪音。

现有技术的场景四中，当一个空间下有多个语音识别设备，如果用户发出的语音可以有多台设备完成，那么多台设备就会同时操作，从而浪费能源。例如，在客厅包括一台音箱、一台空调和一台电视机，假设这三台设备都会查询天气，如果用户发出语音“查询天气”，客厅中的音箱、空调和电视机就会都进行天气查询，从而播报天气，不但造成空间噪音，而且还比较浪费电。

为了解决上述的场景中存在的各种技术问题，本发明实施例先提出一种新的语音识别系统架构，本发明实施例提出的语音识别系统架构与现有技术相比，增加一台与各语音识别设备进行信息交互的语音控制设备，语音控制设备使用设备特征向量判断用户说出的这条语音是要操作哪台语音识别设备。由于语音控制设备是全局把控，因此用户在通过语音控制语音识别设备的时候，无需说出设备的标识信息，即使在相关技术的场景一、二、三和四下，本发明实施例提供的技术方案也能够准确识别用户的语音是面向哪一台语音识别设备的。图1-2为本发明实施例语音识别系统架构的场景示意图，如图1-2所示，继续以客厅为例，在客厅中包括4台语音识别设备，例如一台电冰箱11、一台音箱12、一台电视机13和一台电扇14，除此之外，客厅还包括一台语音控制设备10。当用户发出一条语音时，电冰箱11、音箱12、电视机13和电扇14分别对该语音进行识别，客厅中的4台语音识别设备分别将识别后的音量发送给语音控制设备10，语音控制设备10使用设备特征向量和语音识别设备发送的音量判断用户说出的这条语音是要操作哪台语音识别设备(受控设备)，从而语音控制设备控制受控设备响应用户的语音。需要说明的是，每一个家电设备(语音识别设备)都唯一对应有一个属于自身的设备特征向量，从而语音控制设备10可以根据当前用户说出的语音对应的音量向量和设备特征向量来确定受控设备。

下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。

实施例一

为了解决前述背景技术中的技术问题，本发明实施例提供一种语音控制方法，该方法应用于语音控制设备，该方法所实现的功能可以通过语音控制设备中的处理器调用程序代码来实现，当然程序代码可以保存在计算机存储介质中，可见，该语音控制设备至少包括处理器和存储介质。

在本发明实施例提供的方法除了涉及语音控制设备外，还包括具有语音识别功能的设备(语音识别设备)，其中语音识别设备需要包括两台以上，所述语音识别设备可以是任何具有语音识别功能的电子设备，当然该语音识别设备还可以具有执行语音指令的功能，例如需要执行识别出的语音指令和执行来自于外部设备如语音控制设备发送的语音指令。在实施的过程中，例如语音识别设备可以包括智能家电和非家电，其中智能家电的含义为具有语音识别功能且具有执行语音指令的功能，例如智能冰箱、智能空调、智能风扇、智能电视、智能窗帘、智能电饭煲、智能洗衣机、智能油烟机、智能扫地机器人等，非家电包括智能路由器、智能手机、智能导航仪、智能车载设备、智能机器人、聊天机器人、服务机器人、工厂流水线的机器等。

语音控制设备在实施的过程中可以采用语音识别设备来实现，即语音控制设备与所述语音识别设备是一个整体，当然语音控制设备也可以独立于语音识别设备。举例来说，客厅里面包括两台智能家电：一台空调和一台音箱，空调和音箱通过路由设备如路由器进行通信，语音识别设备即包括空调和音箱，而语音控制设备可以是空调和音箱中的任意一个，语音识别设备还可以是路由器。

图1-3为本发明实施例一语音控制方法的实现流程示意图，如图1-3所示，该方法包括：

步骤S101，语音控制设备确定设备集合针对一条语音的音量向量V，所述设备集合包括N台具有语音识别功能的设备，N为大于等于2的整数；

这里，所述设备集合为由能够接收所述语音的语音识别设备所组成的集合，例如，用户在客厅说出一条语音P1，能够识别并响应该条语音P1的语音识别设备一共有5台，那么针对这条语音P1而言，设备集合即包括5台语音识别设备；再如用户在卧室说出一条语音P2，能够识别并响应该条语音P2的语音识别设备一共有2台，那么针对这条语音P1而言，设备集合即包括2台语音识别设备。

这里，所述音量向量V是指，当用户发出一条语音后，由语音控制设备Di接收该条语音的音量vi(音量强度)所组成的向量，V＝[v1,..,vi,..,vN]，其中v1为语音控制设备D1接收到语音S1的音量，vi为语音控制设备Di接收到语音Si的音量，vN为语音控制设备DN接收到语音SN的音量；音量向量一般由音量控制设备根据音量识别设备反馈的音量计算得出。

步骤S102，语音控制设备确定所述设备集合中第i设备对应的设备特征向量Fi，其中，所述第i台设备为所述设备集合中的设备，所述i为大于等于1且小于等于N的整数，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；

这里，所述Fi＝[vi1,..,vii,..,viN]，其中vi1表示语音识别设备D1接收到属于语音识别设备Di的语音的音量，vii表示语音识别设备Di接收到属于语音识别设备Di的语音的音量，viN表示语音识别设备DN接收到属于语音识别设备Di的语音的音量。所述设备集合中的每一设备都对应有一个设备特征向量，用于识别用户发出的语音是否是面向该设备的。需要说明的是，本发明实施例中Fi为设备Di的设备特征向量，用于标识设备Di，但是设备Di的音量vii不一定是Fi中各分量中最大的音量，vii可能是最大的，可能是最小的，也可以既不是最大的也不是最小的，因为本发明实施例利用的是两个向量之间的距离来确定受控设备，并不是说，语音离哪个设备最近，那么最近的设备就是受控设备。

步骤S103，语音控制设备根据所述音量向量V和所述第i设备对应的设备特征向量Fi，确定所述第i设备对应的音量距离di；

这里，所述音量距离di可以理解为本次语音与之前存储的针对该设备Di的语音之间的差异的大小，差异越大，那么越不可能是针对该设备Di的，差异越小，则越有可能是针对该设备Di；本发明实施例的原理在于，用户与设备之间的沟通互动，是与空间位置具有一定的关联性的，用户在同一个空间下的不同位置会操作不同的家电；因此，本发明实施例中的设备特征向量，反应了用户操作家电的习惯。从而，音量差异或者音量距离在一定程度上反映了用户重现习惯的程度，音量差异越小，则用户操作该设备Di的习惯再现地越完整，否则，用户极有可能不是操作该设备Di的。

进一步地，不同人的习惯可能不同，例如用户Q1喜欢在电视机前开电视机，而用户Q2喜欢在电视机前开空调，针对不同的用户，本发明实施例还可以针具不同用户的不同声音参数(例如音色、声音的频率范围)来识别不同的用户，然后如果该开机语音是用户Q1发出的，则开电视，如果该开机语音是用户Q2发出的，则开空调。

这里，所述音量距离di为音量向量V与设备特征向量Fi之间的距离，距离有多种计算方法，例如di＝Distance(V,Fi)，其中Distance为向量的距离函数，距离函数可以采用欧氏距离(Euclidean Distance)、曼哈顿距离(Manhattan Distance)、标准化欧氏距离(Standardized Euclidean Distance)和余弦(Cosine Distance)等函数来计算。

步骤S104，语音控制设备按照预设的规则和所述第i设备对应的音量距离di确定受控设备的标识信息，所述受控设备为所述设备集合中的设备；

这里，在步骤S103中，将会计算出设备集合中每一设备对应的距离，然后根据这些距离确定受控设备，其中所述预设的规则例如可以是距离最小，当选择距离最小时，那么受控设备可能为设备集合中的一台；当然本领域的技术人员应该理解，还可以有其他的规则，例如设置一个距离阈值，将计算出的距离小于等于距离阈值的设备都确定为受控设备，例如工厂的机器人是有群组的，那么用户发出的开机语音可能是针对一个或者几个群组的，那么当计算出的距离满足预设的距离阈值的时候，那么该群组的机器人都被认为是受控设备。在智能家居场景下，一般来说受控设备是一台家电，那么可以将音量距离最小的设备确定为受控设备。

这里，所述标识信息(identity，ID)可以是设备的名称、编码等属性信息。

步骤S105，语音控制设备根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令。

这里，受控设备所响应的语音指令可以是受控设备自身识别的，也可以是由语音控制设备发出给受控设备的；如果受控设备所响应的语音指令是由语音控制设备发送的，则步骤S105中的所述根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令，包括，语音控制设备将所述语音对应的语音指令携带于控制消息中，其中所述控制消息用于控制所述受控设备响应所述语音对应的语音指令，然后根据受控设备的标识信息将所述控制消息发送给受控设备(设备集合中的一台语音识别设备)，受控设备接收到控制消息后，解析所述控制消息，执行所述语音对应的语音指令。

这里，如果受控设备所响应的语音指令是受控设备自身识别的，那么语音识别设备还可以利用其它语音识别设备识别的结果对受控设备识别的结果进行校正，该方式的有益效果在于，如果受控设备的语音指令识别的不准确的话，能够保证执行的准确率。此时，步骤S105，所述根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令，包括：

步骤S1051，语音控制设备根据所述受控设备的标识信息确定所述受控设备识别的语音指令ss；

步骤S1052，语音控制设备利用所述第i设备识别的所述语音对应的语音指令si对所述受控设备识别的语音指令ss进行校正，得到校正后的语音指令sc；

步骤S1053，语音控制设备根据所述受控设备的标识信息控制所述受控设备响应所述语音指令sc。

这里，语音控制设备将语音指令sc携带与语音控制响应(或控制消息)中，然后语音控制设备根据所述受控设备的标识信息将语音控制响应发送给受控设备；受控设备接收到语音控制响应后，解析所述语音控制响应，得到语音指令sc；执行所述语音指令sc。

本发明实施例中，所述方法还包括：

步骤S106，判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果；如果所述第一判断结果表明所述语音中不包括设备的标识信息，则进入步骤S101；如果所述第一判断结果表明所述语音中包括设备的标识信息，则进入步骤S107；

步骤S107，如果所述第一判断结果表明所述语音中包括设备的标识信息，将所述语音中包括的设备的标识信息确定为受控设备的标识信息；

这里，步骤S106可以有多种实现方式，方式一，如果语音控制设备不具有语音识别功能，那么语音控制设备可以根据语音识别设备反馈的识别的所述语音对应的语音指令si中是否包括设备的标识信息；方式二，如果语音控制设备具有语音识别功能，则步骤S106，所述判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果包括：

步骤S1061，调用语音采集部件采集用户发出的语音；

步骤S1062，对所述语音进行识别，得到识别后的语音指令，所述识别后的语音指令中包括语音关键词；

步骤S1063，根据所述语音关键词判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果。

从以上实施例可以看出，当用户发出一条语音后，语音控制设备首先针对这条语音会计算得到一个音量向量，然后语音控制设备获取预先存储的作为标准的每一语音控制设备的设备特征向量；其次，语音控制设备针对每一语音控制设备，确定音量向量与设备特征向量之间的距离；接着，将满足条件的距离的语音控制设备作为受控设备，最后语音控制设备控制受控设备响应所述语音对应的语音指令。

同一空间存在多台语音识别设备(家电)，将每一语音识别设备与对应的设备特征向量进行关联。当有一条语音时，语音识别设备无需自身去识别是否要去执行该语音对应的语音指令，而是有作为中央处理器的语音控制设备来确定哪一台语音识别设备才是受控设备。换句话说，当用户说出语音，由语音控制设备自动地识别出用户的语音是面向哪一台语音识别设备的，而无需用户说出设备的标识信息，即可控制其中一台语音识别设备。

在本发明的各实施例中，语音控制设备使用特征向量判断用户是要操作哪台语音识别设备，由于语音控制设备是全局把控，因此用户在通过语音控制语音识别设备的时候，无需说出设备的标识信息，即使在相关技术的场景二、三和四下，本发明实施例提供的技术方案也能够准确识别用户的语音是面向那一台语音识别设备的。

实施例二

基于前述的实施例一，本发明实施例提供一种语音控制方法，图2为本发明实施例二语音控制方法的实现流程示意图，如图2所示，该方法包括以下步骤：

步骤S201，当用户发出所述语音s后，语音控制设备判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果；

步骤S202，如果所述第一判断结果表明所述语音中包括设备的标识信息，语音控制设备将所述语音中包括的设备的标识信息确定为受控设备的标识信息。

步骤S203，如果所述第一判断结果表明所述语音中不包括设备的标识信息，则语音控制设备确定第i台设备接收到的第i语音控制信息；

这里，所述第i语音控制信息包括所述第i设备的标识信息和所述第i设备接收到音量值vi；设备集合包括N台具有语音识别功能的设备，N为大于等于2的整数；所述第i台设备为所述设备集合中的设备，所述i为大于等于1且小于等于N的整数；

步骤S204，根据所述第i设备的标识信息、所述第i设备识别的所述语音对应的语音指令si和所述第i设备的音量值vi，语音控制设备确定所述设备集合针对一条语音的音量向量V。

这里，上述的步骤S203和步骤S204实际上提供一种实现实施例一中步骤S101的方法。

这里，当用户发出一条语音s后，各语音识别设备会识别接收到的si语音，si表示语音s到达语音识别设备Di后所述语音识别设备识别语音s后的结果，所述si可能与语音S相同，也可能不同；同时假设设备Di收到si的音量(Volume)为vi，然后语音识别设备Di将自身的标识信息、si和vi发送给语音控制设备，语音控制设备根据Di发送的自身的标识信息、si和vi，形成针对语音S的音量向量V＝[v1,vi,vN]。

步骤S205，确定所述设备集合中第i设备对应的设备特征向量Fi，其中，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；

步骤S206，根据所述音量向量V和所述第i设备对应的设备特征向量Fi，确定所述第i设备对应的音量距离di；

步骤S207，按照预设的规则和所述第i设备对应的音量距离di确定受控设备的标识信息，所述受控设备为所述设备集合中的设备；

步骤S208，根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令。

这里，上述的步骤S205至步骤S208分别对应于实施例一中的步骤S102至步骤S105，因此，本领域的技术人员可以参阅实施例一而理解上述的步骤S205至步骤S208。

本发明实施例的步骤S201中，语音控制设备可以是设备集合中的一台设备，此时，步骤S201中，语音控制设备确定第i台设备接收到的第i语音控制信息，包括：当用户发出所述语音s后，该语音控制设备接收设备集合中的其他设备发送的语音控制信息，并从自身获取语音控制信息。

这里，语音控制设备可以是独立于家电设备的一个独立设备，如局域网中的路由设备，或者云端服务器，此时，步骤S201中，语音控制设备确定第i台设备接收到的第i语音控制信息，包括：当用户发出所述语音s后，接收第i台设备发送的语音控制请求，所述语音控制请求中携带有所述第i语音控制信息。对应地，步骤S208，所述根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令，包括：根据所述受控设备的标识信息向所述受控设备发送语音控制响应，所述语音控制响应用于控制所述受控设备响应所述语音对应的语音指令。

实施例三

在本发明实施例中，由于利用的音量差异来确定用户的语音是面向哪一台设备的，因此，设备反馈回来的音量必须要是针对同一条语音的才可以，假设用户先后发出两条语音，第一条语音是“天气太热了，开下机”，第二条语音是“温度20度”，如果有的设备能够接收并识别两条语音，如果不加以区别，用户控制设备在确定音量差异的时候，可能会把两条语音的音量弄混淆，那么如何有效区别两条相近的语音，成为需要解决的问题之一。本发明实施例下面提供两种实现步骤S204的方式，其中，方式一是利用接收到语音指令之间的相似度来确定的，该方式的优点在于语音控制设备无需具有语音识别功能；方式二是语音控制设备自身去识别用户先后发出的两条语音，然后接收的来自于语音识别设备的语音指令进行分类划分，属于第一条语音的语音指令用于确定第一条语音的音量向量，属于第二语音的语音指令用于确定第二条语音的音量向量；方式一和方式二各自包括的步骤如下：

方式一，根据所述第i设备的标识信息、所述第i设备识别的所述语音对应的语音指令si和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V，包括：

步骤S2021，语音控制设备判断所述语音指令si是否包括等同的关键词，得到第三判断结果，i为大于等于1且小于等于N的整数；

这里，所述等同的关键词是指含义相同、意义相同，在实施的过程中，可以根据预设的关联信息确定语音指令中包括的语音关键词是否是等同的，其中，关联信息可以采用映射关系表来实现，所述关联信息用于表明一个关键词可以等同(替换或等价)的其他关键词，例如用户发出的语音为“天气太热了，开下机”，假设有三台语音识别设备B1、B2和B3，设备B1、B2和B3识别的结果分别为C1“开机”、C2“开下机”和C3“天气太热了，开下机”；假设关联信息中表明三个识别结果C1、C2和C3是等同的关键词，那么第三判断结果表明语音指令si中包括等同的关键词。再假设其中语音识别设备B2识别的结果为C4“20度”，而且关联信息中表明三个识别结果C1和C3是等同的关键词，而C4与C1和C3均不是等同的关键，那么第三判断结果表明语音指令si中不包括等同的关键词。

步骤S2022，如果所述第三判断结果表明所述语音指令si包括等同的关键词，根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

这里，如果所述第三判断结果表明所述语音指令si中不包括的等同的关键词时候，语音控制设备开启计时器开始计时，如果未在计时时间内接收到新的语音控制信息，则语音控制设备将对应的设备的音量设置为一固定值，该固定值小于等于0；然后，语音控制设备根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

例如，继续假设有三台语音识别设备B1、B2和B3，针对一条语音的音量向量V的形式为V＝[v1,v2,v3]，其中v1为设备B1反馈的该条语音所接收到的音量，v2为设备B2反馈的该条语音所接收到的音量，v3为设备B3反馈的该条语音所接收到的音量。如果识别结果C1、C2和C3包括等同的关键词，那么V＝[v1,v2,v3]；如果识别结果C1和C3包括等同的关键词，而C4与C1和C3均不是等同的关键，那么V＝[v1,0,v3]。

方式二，根据所述第i设备的标识信息、所述第i设备识别的所述语音对应的语音指令si和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V，包括：

步骤S2023，调用语音采集部件采集用户发出的语音；

步骤S2024，对所述语音进行识别，得到识别后的语音指令，所述识别后的语音指令中包括关键词；

步骤S2025，判断所述语音指令si是否包括识别后的语音指令中包括的关键词，得到第四判断结果；

步骤S2026，如果所述第四判断结果表明所述语音指令si包括识别后的语音指令中包括的关键词，则根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

这里，语音指令si包括识别后的语音指令中包括的关键词可以是包括等同的关键词，参见步骤S2021所述。

这里，如果所述第四判断结果表明所述语音指令si中不包括识别后的语音指令中包括关键词时候，语音控制设备开启计时器开始计时，如果未在计时时间内接收到新的语音控制信息，则语音控制设备将对应的设备的音量设置为一固定值，该固定值小于等于0；然后，语音控制设备根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

实施例四

本发明的实施例中都需要用户设备特征向量，那么如何确定设备特征向量或更新设备特征向量是需要解决的问题之一，下面提供两种实现方式：

方式一，所述更新或确定设备特征向量包括以下步骤：

步骤S11，如果所述第一判断结果表明所述语音中包括受控设备的标识信息，确定第i台设备接收到的第i语音控制信息，其中，所述第i语音控制信息包括所述第i设备的标识信息和所述第i设备接收到音量值vi；

步骤S12，根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V；

步骤S13，根据所述音量向量V更新所述受控设备的设备特征向量。

这里，步骤S13，根据所述音量向量V更新所述受控设备的设备特征向量，包括：将所述音量向量V确定为所述受控设备的设备特征向量。

方式二，所述更新或确定设备特征向量包括以下步骤：

步骤S21，如果所述第一判断结果表明所述语音中包括受控设备的标识信息，确定第i台设备接收到的第i语音控制信息，其中，所述第i语音控制信息包括所述第i设备的标识信息和所述第i设备接收到音量值vi；

步骤S22，根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V；

步骤S23，判断所述受控设备是否已经有设备特征向量，得到第二判断结果；

步骤S24，如果所述第二判断结果表明所述受控设备已经有设备特征向量，根据所述音量向量V和所述受控设备已经有的设备特征向量更新所述受控设备的设备特征向量；

这里，如果所述受控设备之前已经有设备特征向量，则可以直接用新的设备特征向量替换掉之前已有的设备特征向量，也可以采用加权方式来确定受控设备的设备特征向量，例如之前的设备特征向量的权重为第一权重值如0.4，新的设备特征向量(步骤S22中确定出的音量向量V)的权重为第二权重值如0.6，其中第一权重值和第二权重值的和为1，且分别为大于等于0的数值，则根据所述音量向量V(步骤S22中)和所述受控设备已经有的设备特征向量以及各自的权重值确定或更新所述受控设备的设备特征向量。当然，还可以采用平均的方式，来确定或更新所述受控设备的设备特征向量。

步骤S25，如果所述第二判断结果表明所述受控设备没有设备特征向量，根据所述音量向量V更新所述受控设备的设备特征向量。

实施例五

为了解决前述背景技术中的问题，本发明实施例提供一种语音识别系统架构，参见图3所示，该架构包括两台以及两台以上的语音识别设备31和设备识别模块32，其中：

所述语音识别设备31，可以实施为任何具有语音识别功能的电子设备，例如智能家电、或其他的电子设备。

所述设备识别模块32，是一个可与多个语音识别设备进行资料交换的模块。设备识别模块，可放置于任意设备内，例如可以设置在语音识别设备、路由器、云端服务器内。

设备识别模块，用来识别出现在用户发出的语音是多台语音识别设备中的哪一台该执行，即确定出现在用户发出的语音的受控设备是哪一台设备。

基于前述的语音识别系统结构，本发明实施例提供一种语音控制方法，该方法以家电场景为例进行说明，该方法包括如下的流程：

步骤S501，用户使用语音控制家电设备；

这里，用户从一个开放空间，说出语音s，n台语音识别设备收到s语音。其中家电设备(Device)Di收到的语音信号为si，家电设备Di收到si的音量(Volume)为vi。然后，家电设备Di，将Di、Si、Vi送至设备识别模块。其中，家电设备Di，可以将语音信号si转换成文字、拼音、或二进制数组(Byte)等形式的语音指令。

步骤S502，设备识别模块学习设备特征向量；

步骤S5021，当设备识别模块收到指令si后，启动一个计时器(Timer)，搜集语音样本。

步骤S5022，在时限内的语音样本，转换成统一的文字、拼音、或数组。

步骤S5023，比对是否存在身份识别指令(即设备的标识信息)，若用户的语音包含身份识别指令，则根据语音产生设备Di的设备特征向量Fi；若用户的语音不包含身份识别指令，则进入步骤S503；

这里，所述身份识别指令，为可识别出特定家电唯一性(Unique)功能，形式也可为文字、拼音、二进制语音数组，例如表1所示：

表1

若用户的语音包含身份识别指令，则根据语音产生设备Di的设备特征向量Fi，其中设备特征向量Fi记录了控制特定设备时，其他设备接收到的音量差异。例如表2：

表2

设备识别码	设备特征向量
		D1	F1＝[40,30,20]
D2	F2＝[50,40,25]
		D3	F3＝[30,25,40]

当用户发出第一条语音控制D1设备时，该第一条语音对应的音量向量V1即为D1的设备特征向量F1，设备特征向量F1＝[40,30,20]的含义如下：D1接收到的音量是40音量单位，D2接收到的音量比D1接收到的音量少了10个音量单位，D2接收到的音量为30音量单位，D3接收到的音量为20音量单位。

当用户发出第二条语音控制D2设备时，该第二条语音对应的音量向量V2即为D2的设备特征向量F2，设备特征向量F2＝[50,40,25]的含义如下：当用户控制D2设备时，D1接收到的音量是50音量单位，D2接收到的音量比D1接收到的音量少了10个音量单位，D2接收到的音量为40音量单位，D3接收到的音量为25音量单位。

当用户发出第三条语音控制D3设备时，该第三条语音对应的音量向量V3即为D3的设备特征向量F3，设备特征向量F3＝[30,25,40]的含义如下：当用户控制D3设备时，D1接收到的音量是30音量单位，D2接收到的音量比D1接收到的音量少了5个音量单位，D2接收到的音量为25音量单位，D3接收到的音量为40音量单位。

在本发明实施例中，音量向量是人的习惯产生的结果，人与家电的沟通互动与空间位置是具有一定的特征关联，人在同一个空间下的不同位置会选择操作不同的家电，因此设备特征向量，反应了用户操作家电的习惯。

更进一步地，当设备控制向量已存在，可用加权或平均的方式，更新对应的家电设备的设备特征向量，使设备特征向量可逐渐学习到更精确的数值。

需要说明的是，在D1的设备特征向量F1＝[40,30,20]中，D1接收到的音量比其他设备D2或D3接收到的音量大；在D3的设备特征向量F3＝[30,25,40]中，D3接收到的音量比其他设备D1和D2接收到的音量大；但是在D2的设备特征向量F2＝[50,40,25]中，D2接收到的音量却没有设备D1接收到的音量大。换句话说，本发明实施例中的设备特征向量并不是直接对应于音量最大的那个设备，因为本发明实施例利用的两个向量之间的音量差异，并非音量的绝对数值。

步骤S503，识别出受控设备D；

步骤S5031，计算搜集到的音量向量V＝[v1,v2,…,vn]，与各家电设备的设备特征向量Fi之间的距离di，产生距离离量Df＝[d1,d2,…,dN]。

音量向量V与设备特征向量Fi之间的距离可以采用距离函数来计算，其中距离函数di＝Distance(V,Fi)，其中Distance为向量的距离函数。距离函数的实施例可以包括：欧氏距离(Euclidean Distance)、曼哈顿距离(Manhattan Distance)、标准化欧氏距离(Standardized Euclidean Distance)和余弦(Cosine Distance)。

步骤S5032，选择距离最小的设备特征向量所对应的设备识别码作为受控设备D。

在步骤S503中，当用户不使用带有身份识别的指令时，即可使用之前所学习的设备特征向量，反推回目前用户期望控制的设备，从而达成不指定设备，亦可控制绑定设备的功效。

步骤S504，设备识别模块回应所有家电设备是否执行控制指令。其中向受控设备回应执行该条语音对应的语音指令，向其他的家电设备回复不执行条语音对应的语音指令。

需要说明的是，上述的方法以家电场景为例进行说明，本领域的技术人员应该理解的是，下面的方法流程同样适用于其他的语音控制场景，

实施例六

基于前述的实施例，本发明实施例提供一种适用的场景，例如用户的厨房有一台电风扇，用户的客厅有一台空调，下面用户发出语音控制这台电风扇和空调，控制过程如下：

步骤S601，用户使用语音控制家电；

用户于客厅使用语音控制空调：第一条语音“小美空调，27度”；，其中小美是空调的标识信息或身份识别指令，参见表3。

表3

步骤S602，设备识别模块学习设备特征向量；

由于，“小美空调”为身份识别指令，则基于该条语音产生设备设备特征向量，如表4：

表4

设备识别码	设备特征向量
		D1(小美空调)	F1＝[30,10]

D1的设备特征向量F1＝[30,10]表示：此时空调接收到的音量为30单位，风扇接收到的音量为10单位。由于用户的语音中已经指定受控设备，因此不需进行识别受控设备，设备识别模块直接回应操作设备为D1。

用户走到厨房，使用语音开启电风扇：第二条语音“小静，开风扇”。由于语音包含身份识别指令“小静”，因此产生新的设备特征向量：

设备识别码	设备特征向量
		D1(小美空调)	F1＝[30,10]
D2(小静风扇)	F2＝[10,25]

由于用户已经指定受控设备，因此不需进行识别受控设备，设备识别模块直接回应操作设备为D2。

步骤S603，动态识别出受控设备D

用户走回客厅，使用语音控制家电：第三条语音“增加风量”，此指令不带任何身份识别指令。

设备识别模块，收到空调D1传送来的指令s1＝增加风量，v1＝25。启动计时器500ms，搜集500ms内的相同语音控制指令。500ms内，搜集到了电风扇D2传来到控制指令：s2＝增加风量，v2＝8。因此，设备识别模块对于第三条语音“增加风量”所搜集到的音量向量为V＝[25,8]。由于，用户并未指定设备，因此计算受控设备D，公式(1)和(2)如下：

Dist_1＝Sqrt((25-30)²+(8-10)²)＝5.39 (1)；

Dist_2＝Sqrt((25-10)²+(8-25)²)＝22.67 (2)；

其中，取距离最小的设备识别码作为受控设备，因此设备识别模块，通知设备D1增加风量。用户不需指定设备，即可控制空调增加风量。

用户靠近厨房，使用语音控制家电：第四条语音“关机”，由于风扇接收到的音量大于空调。因此，透过了音量向量与特征向量比对后，可发现风扇的向量距离较近，因此关闭厨房风扇的电源。因此用户不需指定设备，即可达成语音指定控制家电的行为。

若用户需重新设定绑定关联，想在客厅控制较远的厨房家电，仅需使用「身份识别指令」，例如：在客厅喊：“小静风扇，开机”即可更新绑定关系，从客厅即可预设控制较远的厨房家电。完全不受音量与距离的限制。由此可见，在本发明实施例中，受控设备接收到的音量与大小无关，与之间的绑定关系(即设备特征向量)有关。

实施例七

基于前述的实施例，本发明实施例提供一种语音控制装置，该装置所包括的各单元，各单元所包括的各模块以及各模块所包括的各子模块，都可以通过语音控制设备中的处理器来实现，当然也可通过具体的逻辑电路实现；在具体实施例的过程中，处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。

图4为本发明实施例七语音控制装置的组成结构示意图，如图4所示，该装置700包括第一确定单元701、第二确定单元702、第三确定单元703、第四确定单元704和控制单元705，其中：

所述第一确定单元701，用于确定设备集合针对一条语音的音量向量V，所述设备集合包括N台具有语音识别功能的设备，N为大于等于2的整数；

所述第二确定单元702，用于确定所述设备集合中第i设备对应的设备特征向量Fi，其中，所述第i台设备为所述设备集合中的设备，所述i为大于等于1且小于等于N的整数，所述设备特征向量Fi是预设的采用音量来标识所述设备集合中的每一设备的向量；

所述第三确定单元703，用于根据所述音量向量V和所述第i设备对应的设备特征向量Fi，确定所述第i设备对应的音量距离di；

所述第四确定单元704，用于按照预设的规则和所述第i设备对应的音量距离di确定受控设备的标识信息，所述受控设备为所述设备集合中的设备；

所述控制单元705，用于根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令。

在本发明的其他实施例中，所述第一确定单元包括第一确定模块和第二确定模块，其中：

所述第一确定模块，用于当用户发出所述语音s后，确定第i台设备接收到的第i语音控制信息，其中，所述第i语音控制信息包括所述第i设备的标识信息和所述第i设备接收到音量值vi；

所述第二确定模块，用于根据所述第i设备的标识信息、所述第i设备识别的所述语音对应的语音指令si和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

在本发明的其他实施例中，所述控制单元包括第三确定模块、校正模块和控制模块，其中：

所述第三确定模块，用于根据所述受控设备的标识信息确定所述受控设备识别的语音指令ss；

所述校正模块，用于利用所述第i设备识别的所述语音对应的语音指令si对所述受控设备识别的语音指令ss进行校正，得到校正后的语音指令sc；

所述控制模块，用于根据所述受控设备的标识信息控制所述受控设备响应所述语音指令sc。

在本发明的其他实施例中，所述第二确定模块包括第一判断子模块和第一确定子模块，其中：

所述第一判断子模块，用于判断所述语音指令si是否包括等同的关键词，得到第三判断结果，i为大于等于1且小于等于N的整数；

所述第一确定子模块，用于如果所述第三判断结果表明所述语音指令si包括等同的关键词，根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合的音量向量V。

在本发明的其他实施例中，所述第二确定模块包括调用子模块、识别子模块、第二判断子模块和第二确定子模块，其中：

所述调用子模块，用于调用语音采集部件采集用户发出的语音；

所述识别子模块，用于对所述语音进行识别，得到识别后的语音指令，所述识别后的语音指令中包括关键词；

所述第二判断子模块，用于判断所述语音指令si是否包括识别后的语音指令中包括的关键词，得到第四判断结果；

所述第二确定子模块，用于如果所述第四判断结果表明所述语音指令si包括识别后的语音指令中包括的关键词，则根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

在本发明的其他实施例中，所述第一确定模块，用于：当用户发出所述语音s后，接收第i台设备发送的语音控制请求，所述语音控制请求中携带有所述第i语音控制信息；

对应地，所述控制单元，用于根据所述受控设备的标识信息向所述受控设备发送语音控制响应，所述语音控制响应用于控制所述受控设备响应所述语音对应的语音指令。

在本发明的其他实施例中，所述装置还包括第一判断单元，用于判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果；

如果所述第一判断结果表明所述语音中不包括设备的标识信息，则确定设备集合针对所述语音的音量向量；

如果所述第一判断结果表明所述语音中包括设备的标识信息，将所述语音中包括的设备的标识信息确定为受控设备的标识信息。

在本发明的其他实施例中，所述第一判断单元包括调用模块、识别模块和判断模块，其中：

所述调用模块，用于调用语音采集部件采集用户发出的语音；

所述识别模块，用于对所述语音进行识别，得到识别后的语音指令，所述识别后的语音指令中包括语音关键词；

所述判断模块，用于根据所述语音关键词判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果。

在本发明的其他实施例中，所述装置还包括第五确定单元、第六确定单元和第一更新单元，其中：

所述第五确定单元，用于如果所述第一判断结果表明所述语音中包括受控设备的标识信息，确定第i台设备接收到的第i语音控制信息，其中，所述第i语音控制信息包括所述第i设备的标识信息和所述第i设备接收到音量值vi；

所述第六确定单元，用于根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V；

所述第一更新单元，用于根据所述音量向量V更新所述受控设备的设备特征向量。

在本发明的其他实施例中，所述方法还包括第二判断单元和第二更新单元，其中：

所述第二判断单元，用于判断所述受控设备是否已经有设备特征向量，得到第二判断结果；

所述第二更新单元，用于如果所述第二判断结果表明所述受控设备已经有设备特征向量，根据所述音量向量V和所述受控设备已经有的设备特征向量更新所述受控设备的设备特征向量；

如果所述第二判断结果表明所述受控设备没有设备特征向量，触发所述第一更新单元。

在本发明的其他实施例中，所述语音中不包括所述设备集合中设备的标识信息。

这里需要指出的是：以上装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果，因此不做赘述。对于本发明装置实施例中未披露的技术细节，请参照本发明方法实施例的描述而理解，为节约篇幅，因此不再赘述。

实施例八

基于前述的实施例，本发明实施例再提供一种语音控制设备，图5为本发明实施例八语音控制设备的组成结构示意图，如图5所示，该设备800包括通信接口801和处理器802，其中：

所述处理器802，用于确定设备集合针对一条语音的音量向量，所述设备集合包括N台具有语音识别功能的设备，N为大于等于2的整数；

根据所述受控设备的标识信息通过所述通信接口801控制所述受控设备响应所述语音对应的语音指令。

这里需要指出的是：以上设备实施例项的描述，与上述方法描述是类似的，具有同方法实施例相同的有益效果，因此不做赘述。对于本发明设备实施例中未披露的技术细节，本领域的技术人员请参照本发明方法实施例的描述而理解，为节约篇幅，这里不再赘述。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种语音控制方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定设备集合针对一条语音的音量向量V，包括：

当用户发出所述语音s后，确定第i台设备接收到的第i语音控制信息，其中，所述第i语音控制信息包括所述第i设备的标识信息和所述第i设备接收到音量值vi；

根据所述第i设备的标识信息、所述第i设备识别的所述语音对应的语音指令si和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

3.根据权利要求2所述的方法，其特征在于，所述根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令，包括：

根据所述受控设备的标识信息确定所述受控设备识别的语音指令ss；

利用所述第i设备识别的所述语音对应的语音指令si对所述受控设备识别的语音指令ss进行校正，得到校正后的语音指令sc；

根据所述受控设备的标识信息控制所述受控设备响应所述语音指令sc。

4.根据权利要求2所述的方法，其特征在于，根据所述第i设备的标识信息、所述第i设备识别的所述语音对应的语音指令si和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V，包括：

判断所述语音指令si是否包括等同的关键词，得到第三判断结果，i为大于等于1且小于等于N的整数；

如果所述第三判断结果表明所述语音指令si包括等同的关键词，根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

5.根据权利要求2所述的方法，其特征在于，所述根据所述第i设备的标识信息、所述第i设备识别的所述语音对应的语音指令si和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V，包括：

调用语音采集部件采集用户发出的语音；

对所述语音进行识别，得到识别后的语音指令，所述识别后的语音指令中包括关键词；

判断所述语音指令si是否包括识别后的语音指令中包括的关键词，得到第四判断结果；

如果所述第四判断结果表明所述语音指令si包括识别后的语音指令中包括的关键词，则根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V。

6.根据权利要求2所述的方法，其特征在于，所述确定第i台设备接收到的第i语音控制信息，包括：当用户发出所述语音s后，接收第i台设备发送的语音控制请求，所述语音控制请求中携带有所述第i语音控制信息；

对应地，所述根据所述受控设备的标识信息控制所述受控设备响应所述语音对应的语音指令，包括：根据所述受控设备的标识信息向所述受控设备发送语音控制响应，所述语音控制响应用于控制所述受控设备响应所述语音对应的语音指令。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：

判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果；

8.根据权利要求7所述的方法，其特征在于，所述判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果包括：

调用语音采集部件采集用户发出的语音；

对所述语音进行识别，得到识别后的语音指令，所述识别后的语音指令中包括语音关键词；

根据所述语音关键词判断用户发出的语音中是否包括设备的标识信息，得到第一判断结果。

9.根据权利要求7任一项所述的方法，其特征在于，所述方法还包括：

如果所述第一判断结果表明所述语音中包括受控设备的标识信息，确定第i台设备接收到的第i语音控制信息，其中，所述第i语音控制信息包括所述第i设备的标识信息和所述第i设备接收到音量值vi；

根据所述第i设备的标识信息和所述第i设备的音量值vi，确定所述设备集合针对一条语音的音量向量V；

根据所述音量向量V更新所述受控设备的设备特征向量。

10.根据权利要求8所述的方法，其特征在于，所述方法还包括：

判断所述受控设备是否已经有设备特征向量，得到第二判断结果；

如果所述第二判断结果表明所述受控设备已经有设备特征向量，根据所述音量向量V和所述受控设备已经有的设备特征向量更新所述受控设备的设备特征向量；

如果所述第二判断结果表明所述受控设备没有设备特征向量，根据所述音量向量V更新所述受控设备的设备特征向量。

11.根据权利要求1至6任一项所述的方法，其特征在于，所述语音中不包括所述设备集合中设备的标识信息。

12.一种语音控制装置，其特征在于，所述装置包括第一确定单元、第二确定单元、第三确定单元、第四确定单元和控制单元，其中：

13.根据权利要求12所述的装置，其特征在于，所述第一确定单元包括第一确定模块和第二确定模块，其中：

14.一种语音控制设备，其特征在于，所述设备包括通信接口和处理器，其中：