CN107135443B

CN107135443B - 一种信号处理方法及电子设备

Info

Publication number: CN107135443B
Application number: CN201710198201.0A
Authority: CN
Inventors: 李洪伟; 张德魁
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2017-03-29
Filing date: 2017-03-29
Publication date: 2020-06-23
Anticipated expiration: 2037-03-29
Also published as: US20180286394A1; CN107135443A; US10755705B2

Abstract

本发明公开了一种信号处理方法及电子设备，所述方法包括：获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化；获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的；响应所述识别结果，执行相应的指令。

Description

一种信号处理方法及电子设备

技术领域

本发明涉及信息处理技术，尤其涉及一种信号处理方法及电子设备。

背景技术

在智能家庭环境中，语音交互具有允许用户彻底解放双手，对智能设备随意交互的特点。为了进一步允许用户在家庭空间内的多个位置都可以实施语音交互，一些系统提出利用多个声音采集装置采集用户的声音，用户到达某个声音采集装置附近时，可以利用该声音采集装置获得用户的声音输入，从而实现分布式语音输入。

然而，上述系统只考虑用户在静止状态时与声音采集装置的交互，当用户在家庭空间进行移动时，如何与多个声音采集装置进行交互是有待解决的问题。

发明内容

为解决上述技术问题，本发明实施例提供了一种信号处理方法及电子设备。

本发明实施例提供的信号处理方法，包括：

获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化；

获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的；

响应所述识别结果，执行相应的指令。

本发明实施例中，所述方法还包括：

所述至少两个采集装置采集到的声源的声音数据具有相同的声音内容时，确定距离所述声源最近的采集装置，作为目标采集装置；

将来自所述目标采集装置的声音数据，作为待识别的声音数据。

本发明实施例中，所述方法还包括：

所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，作为待识别的声音数据。

本发明实施例中，所述对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，作为待识别的声音数据，包括：

对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接；

如果拼接后的声音数据中具有第一内容和第二内容相同，且所述第一内容与第二内容在采集时间上重叠，则从所述第一内容和所述第二内容中选择出满足预设条件的目标内容，将所述第一内容和所述第二内容替换为所述目标内容，得到待识别的声音数据。

本发明实施例中，所述对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，包括：

按照所述声源的声纹属性，确定待拼接的采集装置；

对于所述待拼接的采集装置，按照采集到声音数据的时间先后顺序对各个采集装置采集到的声音数据进行拼接。

本发明实施例中，所述方法还包括：

所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，按照所述声源的声纹属性，确定待拼接的采集装置；

对于所述待拼接的采集装置，第一设备按照采集到声音数据的时间先后顺序对各个采集装置采集到的声音数据进行标识；

将标识后的各个声音数据发送给第二设备，以使得所述第二设备能对所述声音数据进行拼接。

本发明实施例中，所述响应所述识别结果，执行相应的指令，包括：

确定出匹配所述声源的执行装置，作为目标执行装置；

向所述目标执行装置发送与所述识别结果相应的指令；

或者，

根据设置操作确定出目标执行装置；

向所述目标执行装置发送与所述识别结果相应的指令。

本发明实施例中，所述采集装置具有关键词采集状态和指令采集状态；所述方法还包括：

获得唤醒关键词，所述唤醒关键词为至少一个采集装置在所述关键词采集状态下对采集到的声音数据进行解析得到；

确定待唤醒的至少两个采集装置，向所述至少两个采集装置发送唤醒指令，以控制所述至少两个采集装置从所述关键词采集状态切换为所述指令采集状态；

相应地，所述获得声音数据，包括：

接收所述至少两个采集装置在所述指令采集状态下采集得到的声音数据。

本发明实施例提供的电子设备与至少两个采集装置连接，所述电子设备包括：

通信接口，用于获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化；

处理器，用于获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的；响应所述识别结果，执行相应的指令。

本发明实施例中，所述处理器，具体用于：所述至少两个采集装置采集到的声源的声音数据具有相同的声音内容时，确定距离所述声源最近的采集装置，作为目标采集装置；将来自所述目标采集装置的声音数据，作为待识别的声音数据。

本发明实施例中，所述处理器，具体用于：所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，作为待识别的声音数据。

本发明实施例中，所述处理器，还用于：如果拼接后的声音数据中具有第一内容和第二内容相同，且所述第一内容与第二内容在采集时间上重叠，则从所述第一内容和所述第二内容中选择出满足预设条件的目标内容，将所述第一内容和所述第二内容替换为所述目标内容。

本发明实施例中，所述处理器，具体用于：按照所述声源的声纹属性，确定待拼接的采集装置；对于所述待拼接的采集装置，按照采集到声音数据的时间先后顺序对各个采集装置采集到的声音数据进行拼接。

本发明实施例中，所述处理器，具体用于：所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，按照所述声源的声纹属性，确定待拼接的采集装置；对于所述待拼接的采集装置，第一设备按照采集到声音数据的时间先后顺序对各个采集装置采集到的声音数据进行标识；

所述通信接口，还用于将标识后的各个声音数据发送给第二设备，以使得所述第二设备能对所述声音数据进行拼接；接收所述第二设备发送的识别结果，并将所述识别结果发送给所述处理器。

本发明实施例中，所述处理器，还用于确定出匹配所述声源的执行装置，作为目标执行装置；或者，根据设置操作确定出目标执行装置；

所述通信接口，还用于向所述目标执行装置发送与所述识别结果相应的指令。

本发明实施例中，所述采集装置具有关键词采集状态和指令采集状态；

所述通信接口，还用于获得唤醒关键词，所述唤醒关键词为至少一个采集装置在所述关键词采集状态下对采集到的声音数据进行解析得到；

所述处理器，还用于确定待唤醒的至少两个采集装置；

所述通信接口，还用于向所述至少两个采集装置发送唤醒指令，以控制所述至少两个采集装置从所述关键词采集状态切换为所述指令采集状态；

所述通信接口，还用于接收所述至少两个采集装置在所述指令采集状态下采集得到的声音数据。

本发明实施例的技术方案中，获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化；获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的；响应所述识别结果，执行相应的指令。采用本发明实施例的技术方案，当用户在家庭空间进行移动时，作用声源的用户能够实现与至少两个采集装置所形成的分布式语音系统进行有效地交互，即：当用户相对于至少两个采集装置移动时，也能够实现对用户语音的识别，从而使得用户在分布式语音系统中的交互更加随意，更符合用户需求。

附图说明

图1为本发明实施例的信号处理方法的流程示意图一；

图2为本发明实施例的通信架构图；

图3为本发明实施例的信号处理方法的流程示意图二；

图4为本发明实施例的场景示意图；

图5为本发明实施例的信号处理方法的流程示意图三；

图6为本发明实施例的信号处理方法的流程示意图四；

图7为本发明实施例的信号处理方法的流程示意图五；

图8为本发明实施例的电子设备的结构组成示意图。

具体实施方式

为了能够更加详尽地了解本发明实施例的特点与技术内容，下面结合附图对本发明实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本发明实施例。

图1为本发明实施例的信号处理方法的流程示意图一，如图1所示，所述信号处理方法包括以下步骤：

步骤101：获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化。

本发明实施例的技术方案应用于第一设备，所述第一设备可以是计算机、服务器等。第一设备与至少两个采集装置相连接，这里，连接可以是无线连接或者有线连接，一般，通过局域网方式可以实现第一设备与多个采集装置之间的无线连接。如图2所示，图2示意出了三个采集装置，第一设备分别与采集装置1、采集装置2、采集装置3连接。应当理解，采集装置的个数可以灵活设置，实际应用时，用户可以根据需求在家庭场景或其他场景下，设置任意数目的采集装置。通常，为了给用户提供反馈，采集装置会和声音输出装置(如喇叭)一体设置，声音输出装置用于输出语音反馈，当然，也可以不设置声音输出装置。

本发明实施例中，采集装置也称为声音输入设备，声音输入设备可以由一个到多个麦克风阵列组成。

本发明实施例中，声源是指但不局限于用户，本发明以下实施例以声源为用户为例进行解释说明，用户可以在多个采集装置所处的环境中移动，当用户移动时，用户相对于各个采集装置的位置均发生变化，在这个变化的过程中，有的采集装置采集到的声音信号变强，有的采集装置采集到的声音信号变弱。各个采集装置将自身采集到的声音数据都发送给第一设备进行处理。

可见，第一设备获得到的声音数据是来自至少两个采集装置采集到的声源的声音数据。

步骤102：获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的。

本发明实施例中，对声音数据进行识别可以是第一设备在本地进行识别，这种情况下，第一设备具有更高的处理性能。在一实施方式中，可以将第一设备设置在家庭网关中。

本发明实施例中，对声音数据进行识别还可以通过第二设备进行识别，这里，第二设备可以是后台，这种情况下，第一设备需要将声音数据发送给后台进行识别，然后，再接收后台发送的识别结果。

本发明实施例中，识别结果是对应所述声源产生的声音的，即：识别结果是对用户发出的声音进行识别得到的结果，识别结果能够反映出用户通过语音交互的意图。

步骤103：响应所述识别结果，执行相应的指令。

本发明实施例中，基于识别结果生成对应的指令，然后，将指令发送给执行装置进行执行。

在一实施方式中，确定出匹配所述声源的执行装置，作为目标执行装置；向所述目标执行装置发送与所述识别结果相应的指令，从而实现对目标执行装置的控制。这里，匹配所述声源的执行装置可以是：在某个区域范围内，距离声源最近的执行装置，这样，方便用户从感官(如听觉、视觉)上体验到执行结果。

在另一实施方式中，根据设置操作确定出目标执行装置；向所述目标执行装置发送与所述识别结果相应的指令。这里，用户可以自由选择需要响应的设备，也即目标执行装置。例如：用户可以通过手势操作向第一设备指示需要作出响应的目标执行装置，第一设备采集到用户的手势操作后，便向目标执行装置发送指令。这种场景能够实现用户远程控制异地的或者距离自己较远的执行装置。

图3为本发明实施例的信号处理方法的流程示意图二，如图3所示，所述信号处理方法包括以下步骤：

步骤301：获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化。

步骤302：所述至少两个采集装置采集到的声源的声音数据具有相同的声音内容时，确定距离所述声源最近的采集装置，作为目标采集装置；将来自所述目标采集装置的声音数据，作为待识别的声音数据。

本发明实施例中，声音内容是否相同可以通过声音数据的频率波形的相似度来确定，例如：采集装置1采集的声音数据为声波1，采集装置2采集到的声音数据为声波2，如果声波1和声波2的频率波形的相似度超过预设门限值，则认为采集装置1和采集装置2采集到了相同的声音内容，否则就是采集到了不同的声音内容。这里，具有不同的声音内容是指：具有完全不同的内容或者具有部分不同的内容。

如图4所示，在某个时段，用户由位置1移动到了位置2，此时，如果用户的声音足够大，采集装置1、采集装置2、采集装置3分别采集到了用户相同的声音内容，然而，由于用户距离三个采集装置的距离不同，因此，三个采集装置采集到的声音数据的强度也不同，距离用户最近的采集装置所采集到的声音数据的强度最大，需要获取强度最大的声音数据作为待识别的声音数据。

本发明实施例中，首先，至少两个采集装置向第一设备进行注册，第一设备将各个采集装置依次标识为V1，V2，…，Vn。其次，第一设备确定用户与每个采集装置的距离分别为：γ₁，γ₂，…，γ_n，选择距离最小的采集装置的声音数据。

其中，通过但不局限于以下方式确定距离用户最近的采集装置：

方式一：采集装置自主确定与用户的距离，并上传γ₁，γ₂，…，γ_n给第一设备。这里，采集装置的麦克风阵列通常会进行本地的信号处理，以便实现噪声抑制、回声消除等功能。通过合理安排麦克风阵列，测量语音到达不同的麦克风的时间差，然后计算出用户与麦克风阵列的距离。

方式二：第一设备进行集中判断。如果采集装置的麦克风阵列比较简单，则不能够进行本地确定距离。不同采集装置将本地接收到的语音上传给第一设备，由第一设备根据声音的采集时刻来计算距离。为了避免网络延迟带来的差异，多个采集装置可以将采集的语音进行集中打包，然后将打包后的语音统一发给第一设备。

本发明实施例中，当用户移动时，由于第一设备动态评估用户与各个采集装置的距离，所以第一设备会很快根据用户位置的变化，选择距离用户最近的采集设备作为最佳效果的语音输入设备。

步骤303：获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的。

步骤304：响应所述识别结果，执行相应的指令。

图5为本发明实施例的信号处理方法的流程示意图三，如图5所示，所述信号处理方法包括以下步骤：

步骤501：获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化。

步骤502：所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，作为待识别的声音数据。

如图4所示，在某个时段，用户由位置1移动到了位置2，此时，如果用户的声音较小或者采集装置的滤波性能非常好，采集装置1、采集装置2、采集装置3就有可能采集到了用户不同的声音内容，例如：采集装置1采集到的内容为AB、采集装置2采集到的内容为CD、采集装置3采集到的内容为EFG。这时，就需要按照采集到声音数据的时间先后顺序对各个内容进行拼接，最终得到待识别的声音数据。这满足了用户自由移动时，第一设备能够够拼接出用户说出的完整语音。

由于第一设备与多个采集装置连接，这就有可能出现部分采集装置采集到的是用户1的语音，另外一部分采集装置采集到的是用户2的语音，为了区别出哪些采集装置是采集的是同一用户的语音，需要按照所述声源的声纹属性，确定待拼接的采集装置；对于所述待拼接的采集装置，然后，按照采集到声音数据的时间先后顺序对各个采集装置采集到的声音数据进行拼接。这里，声纹属性能够区分出不同用户的声音。

本发明实施例中，对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接时，具有以下两种情况：

第一种情况：如果拼接后的声音数据中具有第一内容和第二内容相同，且所述第一内容与第二内容在采集时间上重叠，则从所述第一内容和所述第二内容中选择出满足预设条件的目标内容，将所述第一内容和所述第二内容替换为所述目标内容，得到待识别的声音数据。

例如：采集装置1采集的是ABc，采集装置2采集的是bCD。其中，B和b代表相同的内容，但声音强度不同；c和C同理。拼接时，首先按顺序拼接出ABcBCD，然后，找到相同的内容为Bc和bC，选择声音强度大的B和C作为目标内容，通过BC替换BcBC，最终得到ABCD。这样得到声音数据强度上得到保障，为后续识别做了更好的准备。

第二种情况：如果拼接后的声音数据中不具有相同且相邻的内容，则直接按时间先后顺序进行拼接。

例如：采集装置1采集的是AB，采集装置2采集的是CD，直接按顺序拼接得到ABCD。

步骤503：获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的。

本发明实施例中，对声音数据进行识别还可以通过第二设备进行识别，这里，第二设备可以是后台，这种情况下，第一设备需要将拼接后的声音数据发送给后台进行识别，然后，再接收后台发送的识别结果。

步骤504：响应所述识别结果，执行相应的指令。

图6为本发明实施例的信号处理方法的流程示意图四，如图6所示，所述信号处理方法包括以下步骤：

步骤601：获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化。

步骤602：所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，按照所述声源的声纹属性，确定待拼接的采集装置；对于所述待拼接的采集装置，第一设备按照采集到声音数据的时间先后顺序对各个采集装置采集到的声音数据进行标识。

本发明实施例通过第二设备，也即后台对声音数据进行拼接，后台对声音数据进行拼接时，并不知道按照何种顺序对声音数据进行拼接，为此，需要第一设备按照声源的声纹属性，确定待拼接的采集装置；对于待拼接的采集装置，按照采集到声音数据的时间先后顺序对各个采集装置采集到的声音数据进行标识，后台基于这个标识即可确定出拼接顺序。

步骤603：将标识后的各个声音数据发送给第二设备，以使得所述第二设备能对所述声音数据进行拼接。

本发明实施例中，第二设备对各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接时，具有以下两种情况：

步骤604：获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的。

本发明实施例中，对声音数据进行识别可以是第一设备在本地进行识别，这种情况下，第一设备具有更高的处理性能。在一实施方式中，可以将第一设备设置在家庭网关中。具体地，第一设备接收后台发送的拼接后的声音数据，对所述拼接后的声音数据进行识别，得到识别结果。

本发明实施例中，对声音数据进行识别还可以通过第二设备进行识别，这里，第二设备可以是后台，这种情况下，第二设备对声音数据进行拼接并识别，第一设备接收第二设备发送的识别结果。

步骤605：响应所述识别结果，执行相应的指令。

图7为本发明实施例的信号处理方法的流程示意图五，如图7所示，所述信号处理方法包括以下步骤：

步骤701：获得唤醒关键词，所述唤醒关键词为至少一个采集装置在关键词采集状态下对采集到的声音数据进行解析得到。

本发明实施例中，采集装置具有两种采集状态，分别为关键词采集状态和指令采集状态。

一般，采集装置开机初始化之后，默认处于关键词采集状态，这时，采集装置能够采集声音数据，并对该声音数据进行关键词解析，如果解析得到唤醒关键词，则将该唤醒关键词发给第一设备。例如：唤醒关键词为“hello，XXX”，如果采集装置解析得到“hello，XXX”这个唤醒关键词，则会向第一设备发送“hello，XXX”。如果采集装置没有解析出来“hello，XXX”，则不会将当前采集到的声音数据以及后续采集到的声音数据发送给第一设备。

本发明实施例中，第一设备可以获得一个采集装置发送的唤醒关键词，也可以同时获得两个或更多个采集装置发送的唤醒关键词。

步骤702：确定待唤醒的至少两个采集装置，向所述至少两个采集装置发送唤醒指令，以控制所述至少两个采集装置从所述关键词采集状态切换为所述指令采集状态。

在一实施方式中，所述确定待唤醒的至少两个采集装置，包括：将被控制的所有采集装置都作为待唤醒的采集装置。然后，向所有的采集装置发送唤醒指令。当采集装置接收到唤醒指令时，采集装置由原来的关键词采集状态切换为指令采集状态，这里，在采集装置处于指令采集状态下，采集装置将采集到的声音数据发送给第一设备进行后续的识别和相应的指令控制。

在另一实施方式中，所述确定待唤醒的至少两个采集装置，包括：将解析得到所述唤醒关键词的采集装置作为主采集装置，将未解析得到所述唤醒关键词的采集装置作为从采集装置，将与所述主采集装置满足预设空间条件的从采集装置以及所述主采集装置作为待唤醒的采集装置。然后，向待唤醒的采集装置发送唤醒指令。当采集装置接收到唤醒指令时，采集装置由原来的关键词采集状态切换为指令采集状态，这里，在采集装置处于指令采集状态下，采集装置将后续采集到的声音数据发送给第一设备进行后续的识别和相应的指令控制。

这里，所述将与所述主采集装置满足预设空间条件的从采集装置以及所述主采集装置作为待唤醒的采集装置，包括：将与所述主采集装置的距离小于等于预设值的从采集装置以及所述主采集装置作为待唤醒的采集装置；或者，将与所述主采集装置位于同一空间区域范围内(例如同一个房间内)的从采集装置以及所述主采集装置作为待唤醒的采集装置。

例如：用户在D1位置(属于M1区域)发出唤醒声音，位于M1区域的一个或多个采集装置采集到该唤醒声音，将M1区域以及距离M1区域较近的M2区域、M3区域内的所有采集装置作为待唤醒的采集装置。

例如：用户在D1位置(属于M1区域)发出唤醒声音，位于M1区域的C1采集装置采集到该唤醒声音，将M1区域内的所有采集装置作为待唤醒的采集装置。

考虑到用户相对于采集装置会发生移动的情况，在不同的时刻主采集装置会发生迁移，相应地，基于主采集装置而确定的从采集装置也会发生迁移，这时，被唤醒的采集装置需要根据用户的移动进行实时更新。具体地，在T1时刻，获得第一采集装置发送的唤醒关键词，确定当前待唤醒的采集装置为第一区域范围内的采集装置；在T2时刻，获得第二采集装置发送的唤醒关键词，确定当前待唤醒的采集装置为第二区域范围内的采集装置，T2晚于T1，第二区域范围与第一区域范围具有未重叠的区域，这里，具有未重叠的区域是指：部分未重叠或者全部未重叠。向所述第二区域范围内的第一子区域内的采集装置发送唤醒指令，向所述第一区域范围内的第二子区域内的采集装置发送休眠指令。其中，所述第一子区域是指：第二区域范围内与所述第一区域范围未重叠的部分区域。所述第二子区域是指：第一区域范围内与所述第二区域范围未重叠的部分区域。这样，即可实现以主采集装置为“中心”保持辐射状的从采集装置处于指令采集状态。

上述方案中，当然，第二区域范围与第一区域范围也可以全部重叠，这时，无需向采集装置发送唤醒指令或者休眠指令，这里，休眠指令用于控制采集装置由指令采集状态切换为关键词采集装置。

本发明实施例中，通过来自一个采集装置的唤醒关键词能够唤醒关联的多个采集装置。

步骤703：接收所述至少两个采集装置在所述指令采集状态下采集得到的声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化。

步骤704：获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的。

步骤705：响应所述识别结果，执行相应的指令。

图8为本发明实施例的电子设备的结构组成示意图，所述电子设备与至少两个采集装置80连接，如图8所示，所述电子设备包括：

通信接口81，用于获得声音数据，所述声音数据为至少两个采集装置80采集来自声源的声音数据，所述至少两个采集装置80在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置80的相对位置发生变化；

处理器82，用于获得所述声音数据的识别结果，所述识别结果是对应所述声源产生的声音的；响应所述识别结果，执行相应的指令。

本发明实施例中，所述处理器82，具体用于：所述至少两个采集装置80采集到的声源的声音数据具有相同的声音内容时，确定距离所述声源最近的采集装置80，作为目标采集装置80；将来自所述目标采集装置80的声音数据，作为待识别的声音数据。

本发明实施例中，所述处理器82，具体用于：所述至少两个采集装置80采集到的声源的声音数据具有不同的声音内容时，对所述各个采集装置80采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，作为待识别的声音数据。

本发明实施例中，所述处理器82，还用于：如果拼接后的声音数据中具有第一内容和第二内容相同，且所述第一内容与第二内容在采集时间上重叠，则从所述第一内容和所述第二内容中选择出满足预设条件的目标内容，将所述第一内容和所述第二内容替换为所述目标内容。

本发明实施例中，所述处理器82，具体用于：按照所述声源的声纹属性，确定待拼接的采集装置80；对于所述待拼接的采集装置80，按照采集到声音数据的时间先后顺序对各个采集装置80采集到的声音数据进行拼接。

本发明实施例中，所述处理器82，具体用于：所述至少两个采集装置80采集到的声源的声音数据具有不同的声音内容时，按照所述声源的声纹属性，确定待拼接的采集装置80；对于所述待拼接的采集装置80，第一设备按照采集到声音数据的时间先后顺序对各个采集装置80采集到的声音数据进行标识；

所述通信接口81，还用于将标识后的各个声音数据发送给第二设备，以使得所述第二设备能对所述声音数据进行拼接；接收所述第二设备发送的识别结果，并将所述识别结果发送给所述处理器82。

本发明实施例中，所述处理器82，还用于确定出匹配所述声源的执行装置，作为目标执行装置；或者，根据设置操作确定出目标执行装置；

所述通信接口81，还用于向所述目标执行装置发送与所述识别结果相应的指令。

所述通信接口81，还用于获得唤醒关键词，所述唤醒关键词为至少一个采集装置在所述关键词采集状态下对采集到的声音数据进行解析得到；

所述处理器82，还用于确定待唤醒的至少两个采集装置；

所述通信接口81，还用于向所述至少两个采集装置发送唤醒指令，以控制所述至少两个采集装置从所述关键词采集状态切换为所述指令采集状态；

所述通信接口81，还用于接收所述至少两个采集装置在所述指令采集状态下采集得到的声音数据。

本领域技术人员应当理解，图8所示的电子设备中的各单元的实现功能可参照前述信号处理方法的相关描述而理解。图8所示的电子设备中的各单元的功能可通过运行于处理器上的程序而实现，也可通过具体的逻辑电路而实现。

本发明实施例所记载的技术方案之间，在不冲突的情况下，可以任意组合。

在本发明所提供的几个实施例中，应该理解到，所揭露的方法和智能设备，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个第二处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种信号处理方法，其特征在于，所述方法包括：

获得声音数据，所述声音数据为至少两个采集装置采集来自声源的声音数据，所述至少两个采集装置在采集所述声源的声音数据过程中，所述声源相对于所述至少两个采集装置的相对位置发生变化；其中，所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，基于所述不同的声音内容按照所述声音数据的时间先后顺序拼接而确定待识别的声音数据；

获得所述待识别的声音数据的识别结果，所述识别结果是对应所述声源产生的声音的；

响应所述识别结果，执行相应的指令。

2.根据权利要求1所述的信号处理方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的信号处理方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的信号处理方法，其特征在于，所述对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，作为待识别的声音数据，包括：

5.根据权利要求3所述的信号处理方法，其特征在于，所述对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，包括：

按照所述声源的声纹属性，确定待拼接的采集装置；

6.根据权利要求1所述的信号处理方法，其特征在于，所述方法还包括：

7.根据权利要求1至6任一项所述的信号处理方法，其特征在于，所述响应所述识别结果，执行相应的指令，包括：

确定出匹配所述声源的执行装置，作为目标执行装置；

向所述目标执行装置发送与所述识别结果相应的指令；

或者，

根据设置操作确定出目标执行装置；

向所述目标执行装置发送与所述识别结果相应的指令。

8.根据权利要求1所述的信号处理方法，其特征在于，所述采集装置具有关键词采集状态和指令采集状态；所述方法还包括：

相应地，所述获得声音数据，包括：

9.一种电子设备，其特征在于，所述电子设备与至少两个采集装置连接，所述电子设备包括：

处理器，用于所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，基于所述不同的声音内容按照所述声音数据的时间先后顺序拼接而确定待识别的声音数据；获得所述待识别的声音数据的识别结果，所述识别结果是对应所述声源产生的声音的；响应所述识别结果，执行相应的指令。

10.根据权利要求9所述的电子设备，其特征在于，所述处理器，具体用于：所述至少两个采集装置采集到的声源的声音数据具有不同的声音内容时，对所述各个采集装置采集到声音数据，按照采集到声音数据的时间先后顺序进行拼接，作为待识别的声音数据。