WO2023061145A1

WO2023061145A1 - 立体声音箱系统的组建方法及相关装置

Info

Publication number: WO2023061145A1
Application number: PCT/CN2022/119134
Authority: WO
Inventors: 崔立伟; 蔡双林; 张静静; 欧碧桃; 孙瑞; 许剑峰; 杨军
Original assignee: 华为技术有限公司
Priority date: 2021-10-12
Filing date: 2022-09-15
Publication date: 2023-04-20
Also published as: CN115967897A; EP4398602A1

Abstract

本申请提供一种立体声音箱系统的组建方法及相关装置。该方法涉及智能终端、人机交互等领域。该方法中可支持用户移动音箱产生第一运动状态，当音箱的第一运行状态和预设的动作匹配时，可触发组建立体声音箱系统。例如用户可手持音箱绘制移动的图案，当绘制的图案为指定图案时，可和其他音箱组件立体声音箱系统。这种组建方式对于用户而言，操作简便。此外，本申请中为了避免误触发组建音箱系统设置了相应的条件，也为避免误组建音箱系统设置了相应的条件，由此提高触发组建音箱系统和组建音箱系统的准确性。进一步的，本申请在用户操作之前，还可提示用户执行何种操作以便于引导用户创建音箱系统。

Description

立体声音箱系统的组建方法及相关装置

相关申请的交叉引用

本申请要求在2021年10月12日提交中国专利局、申请号为202111186340.4、申请名称为“立体声音箱系统的组建方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及终端技术领域，尤其涉及一种立体声音箱系统的组建方法及相关装置。

背景技术

音箱已成为人们生活中普遍存在的电子产品。为了能够随时随地享受较高品质的音频，便携式音箱也成为电子发烧友酷爱的产品。

当有多个音箱时，可通过组建立体声音箱系统来创造立体声效果。例如两个音箱可分别作为左声道和右声道，可提供相对一个音箱而言更为立体的音效效果。

一种组建立体声音箱系统的常规方式是，首先采用相应的应用程序(application，APP)扫描附近的音箱，若扫描到多个同类音箱则可以组建立体声音箱系统。如图1所示以扫描到两个音箱为例，用户可以在界面中手动选择将哪个音箱设置为左声道，将哪个音箱设置为右声道，进而完成立体声音箱系统的组建。

另一种实现方式是同时按压音箱上的按键来触发组建立体声音箱系统。

然而，组建立体声音箱系统的操作方式单一，需要一种新的组建立体声音箱系统的方法。

发明内容

本申请的目的在于提供了一种立体声音箱系统的组建方法及相关装置，用于解决相关技术中组建立体声音箱系统的操作方式单一的问题。

上述目标和其他目标将通过独立权利要求中的特征来达成。进一步的实现方式在从属权利要求、说明书和附图中体现。

第一方面，提供了一种立体声音箱系统的组建方法，应用于第一音箱，所述方法包括：

获取所述第一音箱的第一运动状态；

若所述第一运动状态与预设动作的特征匹配，则搜索第二音箱；

若搜索到第二音箱，则与所述第二音箱组建立体声音箱系统。

由此，本申请中用户使音箱产生一定的运动状态，当该运动状态与预设动作的特征匹配时，即可组建立体声音箱系统，由此对于用户而言，持有音箱做相应的动作即可组建立体声音箱系统，操作方便。

在一种可能的设计中，所述获取所述第一音箱的第一运动状态之前，所述方法还包括：

将用于组建立体声音箱系统所需执行的所述预设动作提示给用户。

由此，通过动作提示，能够方便用户了解采取何种动作来组建音箱系统，帮助用户了解和实施组建音箱系统的操作。

在一种可能的设计中，所述获取所述第一音箱的第一运动状态，包括：

基于所述第一音箱的加速度信息，生成所述第一音箱的第一加速度序列，所述第一音箱的第一加速度序列中存储有依时序排列的第一指示信息，所述第一指示信息用于表达加速度和所述加速度的持续时长之间的对应关系；

所述预设动作的特征包括第一序列模板，所述方法还包括：

将所述第一序列模板与所述第一音箱的第一加速度序列进行匹配操作；

若在所述第一音箱的第一加速度序列中匹配到所述第一序列模板的次数大于或等于第一指定次数，则确定所述第一运动状态与所述预设动作的特征匹配；

若在所述第一音箱的第一加速度序列中匹配到所述第一序列模板的次数小于所述第一指定次数，则确定所述第一运动状态与所述预设动作的特征不匹配。

由此，本申请中采用模板匹配的方式来确定采集的第一运行状态是否和预设动作的特征匹配，模板匹配的方式实施起来简便易实施，且预设动作的特征的模板采用时域信息来表达能够适用不同的动作，适用范围不受限制。

基于所述第一音箱的加速度信息，生成所述第一音箱的第二加速度序列，所述第一音箱的第二加速度序列中存储有第二指示信息，所述第二指示信息用于表达加速度和采集到所述加速度的频域信息；

所述预设动作的特征包括第二序列模板，所述方法还包括：

将所述第二序列模板与所述第一音箱的第二加速度序列进行匹配操作；

若在所述第一音箱的第二加速度序列中匹配到所述第二序列模板的次数大于或等于第二指定次数，则确定所述第一运动状态与所述预设动作的特征匹配；

若在所述第一音箱的第二加速度序列中匹配到所述第二序列模板的次数小于所述第二指定次数，则确定所述第一运动状态与所述预设动作的特征不匹配。

由此，本申请中采用模板匹配的方式来确定采集的第一运行状态是否和预设动作的特征匹配，模板匹配的方式实施起来简便易实施，且预设动作的特征的模板采用频域信息来表达能够适用不同的动作，适用范围不受限制。

在一种可能的设计中，所述方法还包括：

基于所述第一音箱的所述第一运动状态确定所述第一音箱的移动距离；

所述搜索第二音箱之前，所述方法还包括：

确定所述第一音箱的移动距离大于指定距离。

由此，本申请中当第一音箱的移动距离足够大时，才会触发组建立体声音箱系统，能够提高触发组建立体声音箱系统的准确性，尽可能避免误触发。

在一种可能的设计中，所述与所述第二音箱组建立体声音箱系统，包括：

基于主音箱筛选规则，确定所述第一音箱是否作为所述立体声音箱系统中的主音箱；并，

为所述第一音箱配置声道。

由此，本申请中能够基于设定的规则，自主筛选出主音箱，并为各音箱自主配置声道。

在一种可能的设计中，所述主音箱筛选规则包括以下规则中的至少一种：

选择已经联网的音箱作为主音箱；

选择已经配网但未联网的音箱作为主音箱；

选择连接智能终端设备的音箱作为主音箱；

选择最早匹配到所述预设动作的特征的音箱作为主音箱；

选择媒体存取控制位址(media access control address，MAC)地址最大的音箱作为主音箱。

该筛选规则简单易实施，能够尽可能无歧义的筛选出主音箱。

在一种可能的设计中，所述为所述第一音箱配置声道，包括：

提示用户为所述第一音箱配置声道；

获取所述第一音箱的第二运动状态；

将所述第二运动状态对应的声道配置为所述第一音箱的声道。

由此，本申请中用户可以采用一定的动作配置各音箱的声道，例如摇一摇即可配置为一个声道，摇动两次即可配置为另一个声道，增加了声道配置的灵活性和操作便利性。

在一种可能的设计中，所述提示用户为所述第一音箱配置声道，包括：

采用声效、光效和屏幕显示中的至少一种方式提示用户为所述第一音箱配置声道。

由此，本申请中，可以通过生效、光效、屏显等这种易实施的方式来提示用户，以便于引导用户完成组建立体声音箱系统的操作。

在一种可能的设计中，所述第二运动状态包括以下参数中的至少一种：

所述第一音箱被摇动的次数、被摇动的速度、被摇动的加速度、被摇动的方向、移动的距离、所述第一音箱产生碰撞的次数、所述第一音箱的移动轨迹。

由此，本申请中，可支持用户采用易于操作的方式来手动控制音箱，完成声道的配置。

在一种可能的设计中，所述方法还包括：

确定与所述第二音箱的位置关系；

并若确定与所述第二音箱的位置关系为指定位置关系，则执行所述与所述第二音箱组建立体声音箱系统的操作。

由此，本申请中基于位置关系能够保证组建音箱系统的准确性，尽可能避免误组建音箱系统。

在一种可能的设计中，所述指定位置关系包括：所述第一音箱与所述第二音箱的距离小于距离阈值。

由此，本申请中采用距离较近的音箱来组建音箱系统，简单易实施且能够保证一定距离范围内的音箱组建音箱系统，保证立体声效果。

第二方面，本申请实施例还提供了一种第一音箱，所述音箱包括：

获取模块，用于获取所述第一音箱的第一运动状态；

搜索模块，用于若所述第一运动状态与预设动作的特征匹配，则搜索第二音箱；

系统组建模块，用于若搜索到第二音箱，则与所述第二音箱组建立体声音箱系统。

在一种可能的设计中，所述音箱还包括：

提示模块，用于在所述获取所述第一音箱的第一运动状态之前，将用于组建立体声音箱系统所需执行的所述预设动作提示给用户。

在一种可能的设计中，所述获取模块，具体用于：

所述预设动作的特征包括第一序列模板，所述音箱还包括：

第一匹配模块，用于将所述第一序列模板与所述第一音箱的第一加速度序列进行匹配操作；

在一种可能的设计中，所述获取模块，具体用于：

所述预设动作的特征包括第二序列模板，所述音箱还包括：

第二匹配模块，用于将所述第二序列模板与所述第一音箱的第二加速度序列进行匹配操作；

在一种可能的设计中，所述音箱还包括：

距离确定模块，用于基于所述第一音箱的所述第一运动状态确定所述第一音箱的移动距离；

所述音箱还包括：

距离确定模块，用于在所述搜索第二音箱之前，确定所述第一音箱的移动距离大于指定距离。

在一种可能的设计中，系统组建模块，具体用于：

为所述第一音箱配置声道。

选择已经联网的音箱作为主音箱；

选择已经配网但未联网的音箱作为主音箱；

选择连接智能终端设备的音箱作为主音箱；

选择最早匹配到所述预设动作的特征的音箱作为主音箱；

选择媒体存取控制位址MAC地址最大的音箱作为主音箱。

在一种可能的设计中，所述系统组建模块，具体用于：

提示用户为所述第一音箱配置声道；

获取所述第一音箱的第二运动状态；

在一种可能的设计中，所述系统组建模块，具体用于：

在一种可能的设计中，所述系统组建模块还用于：

确定与所述第二音箱的位置关系；

第三方面，本申请实施例还提供了一种音箱，该音箱包括：一个或多个处理器，一个或多个存储器，一个或多个扬声器，一个或多个麦克风，通信模块；其中，一个或多个麦克风，用于采集声音信号；通信模块，用于与其它音箱进行通信；一个或多个扬声器，用于发出声音信号；一个或多个处理器与所述一个或多个存储器耦合；其中，一个或多个存储器用于存储计算机可执行程序代码；其中，所述程序代码包括指令，当所述一个或多个处理器执行所述指令时，使所述音箱执行上述第一方面及其第一方面任一可能设计的技术方案。

第四方面，本申请实施例提供一种芯片，述芯片包括处理器和接口；所述接口，用于接收代码指令，并将接收的所述代码指令传输至所述处理器；所述芯片与音箱中的存储器耦合，使处理器执行本申请实施例第一方面及其第一方面任一可能设计的技术方案；本申请实施例中“耦合”是指两个部件彼此直接或间接地结合。

第五方面，本申请实施例提供的一种音箱系统，所述音箱系统包括一个或多个音箱，其中至少一个音箱是如上述第二方面、第三方面所述的音箱，该音箱可以执行上述第一方面中的第一音箱的全部或部分步骤。

第六方面，本申请实施例提供的一种音箱系统，所述音箱系统包括第一音箱和至少一个第二音箱，所述第一音箱和所述第二音箱被设置在不同的位置；所述第一音箱和所述第二音箱之间能够通信；所述第一音箱为如上述第二方面、第三方面所述的音箱(该音箱可以是上述第一方面及其第一方面任一可能设计的技术方案中的所述第一音箱)。

第七方面，本申请实施例的一种计算机可读存储介质，所述计算机可读存储介质包括计算机程序，当计算机程序在计算机上运行时，使得所述计算机执行本申请实施例第一方面及其第一方面任一可能设计的技术方案。

第八方面，本申请实施例的中一种程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行本申请实施例第一方面及其第一方面任一可能设计的技术方案。

另外，第二方面至第八方面中任一种可能设计方式所带来的技术效果可参见方法部分相关中不同设计方式所带来的技术效果，此处不再赘述。

附图说明

图1为本申请一实施例提供的一种应用场景的示意图；

图2为本申请一实施例提供的音箱的结构的示意图之一；

图3为本申请一实施例提供的音箱的结构的示意图之二；

图4A为本申请一实施例提供的音箱的结构的示意图之三；

图4B为本申请一实施例提供的音箱确定用户方位的示意图；

图5为本申请一实施例提供的用户可手持音箱执行的操作的示意图；

图6为本申请一实施例提供的自定义预设动作的示意图；

图7为本申请一实施例提供的立体声音箱系统的组建方法的流程示意图；

图8为本申请一实施例提供的第一序列子模板的示意图；

图9为本申请一实施例提供的和预设动作的特征进行匹配的过程示意图；

图10为本申请一实施例提供的具有两个音箱时的声道配置的示意图；

图11为本申请一实施例提供的具有三个音箱时的声道配置的示意图；

图12为本申请一实施例提供的具有六个音箱时的声道配置的示意图；

图13为本申请一实施例提供的具有十二个音箱时的声道配置的示意图；

图14为本申请一实施例提供的立体声音箱系统的组建方法的另一流程示意图；

图15为本申请一实施例提供的立体声音箱系统的组建方法的又一流程示意图；

图16为本申请一实施例提供的立体声音箱系统的获取网络资源的一种应用场景示意图；

图17为本申请一实施例提供的立体声音箱系统的获取网络资源的另一种应用场景示意图；

图18为本申请一实施例提供的音箱的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

本申请实施例涉及的多个，是指大于或等于两个。需要说明的是，在本申请实施例的描述中，“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。

以下实施例中所使用的术语只是为了描述特定实施例的目的，而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样，单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括例如“一个或多个”这种表达形式，除非其上下文中明确地有相反指示。还应当理解，在本申请实施例中，“一个或多个”是指一个、两个或两个以上；“和/或”，描述关联对象的关联关系，表示可以存在三种关系；例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。

在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

图1示出了本申请一实施例提供的一种应用场景的示意图。如图1所示，为活动聚会时，多个人采用各自的音箱来组建立体声音箱系统的示意图。如图1所示，假设具有两个音箱(包括音箱1和音箱2)。用户A持有音箱1、用户B持有音箱2，用户A和用户B可同时摇动各自的音箱，即可实现音箱1和音箱2来组建立体声音箱系统。由此，摇一摇即可组建立体声音箱系统，增加了组建的趣味性和便利性。

图2示出了本申请一实施例提供的音箱的功能框图。在一些实施例中，音箱100可以包括一个或多个输入设备(input device)101，一个或多个输出设备(output device)102和一个或多个处理器(processor)103。其中，输入设备101可以检测各种类型的输入信号(可以简称：输入)，输出设备102可以提供各种类型的输出信息(可以简称：输出)。处理器103可以从一个或多个输入设备101处接收输入信号，响应于该输入信号，产生输出信息，通过一个或多个输出设备102输出。

在一些实施例中，一个或多个输入设备101可以检测各种类型的输入，并提供与检测到的输入相对应的信号(比如，输入信号)，然后一个或多个输入设备101可以将输入信号提供给一个或多个处理器103。在一些示例中，一个或多个输入设备101可以是包括任何能够检测输入信号的部件或组件。比如，输入设备101可以包括音频传感器(比如，一个或多个麦克风)，加速度传感器、距离传感器、光学或视觉传感器(比如，摄像头，可见光传感器或不可见光传感器)，接近光传感器，触摸传感器，压力传感器，机械设备(比如，表冠，开关，按钮或按键等)，温度传感器，通信设备(比如，有线或无线通信装置)等，或者，输入设备101也可以是上述各种部件的一些组合。在本申请实施例中，可采用加速度传感器的数据来确定用户是否摇动或碰一碰音箱，以便于组建立体声音箱。

在一些实施例中，一个或多个输出设备102可以提供各种类型的输出。比如，一个或多个输出设备102可以接收一个或多个信号(比如，由一个或多个处理器103提供的输出信号)，并提供与该信号对应的输出。在一些示例中，输出设备102可以包括用于提供输出的任何合适的部件或组件。比如，输出设备102可以包括音频输出设备(比如，一个或多个扬声器)，视觉输出设备(比如，一个或多个灯或显示器)，触觉输出设备，通信设备(比如，有线或无线通信设备)等等，或者，输出设备102还可以是上述各种部件的一些组合。

在一些实施例中，一个或多个处理器103可以耦合到输入设备101和输出设备102。处理器103可以与输入设备101和输出设备102之间通信。比如，一个或多个处理器103可以从输入设备101接收输入信号(比如，与输入设备101检测到的输入相对应的输入信号)。一个或多个处理器103可以解析接收到的输入信号以确定是否响应于该输入信号提供一个或多个对应的输出。若是，一个或多个处理器103可以向输出设备102发送输出信号，以提供输出。

图3示出了本申请另一实施例提供的音箱300的功能框图。音箱300可以为图2所描述的音箱100的一种示例。如图3所示，音箱300包括麦克风301、扬声器302、处理器303、存储器304、通信模块305、传感器模块306、灯307。可以理解的是，图3所示的部件并不构成对音箱300的具体限定，音箱300还可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。

处理器303可以包括一个或多个处理单元，例如：处理器303可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processing unit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，存储器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。其中，控制器可以是音箱300的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。在另一些实施例中，处理器303中还可以设置存储器，用于存储指令和数据。在一些实施例中，处理器303中的存储器为高速缓冲存储器。该存储器可以保存处理器303刚用过或循环使用的指令或数据。如果处理器303需要再次使用该指令或数据，可从所述存储器中直接调用，避免了重复存取，减少了处理器303的等待时间，因而提高了系统的效率。处理器303可以运行本申请一些实施例提供的立体声音箱系统的组建方法的软件代码/模块，实现控制音箱的功能。

麦克风301，也称“话筒”，“传声器”，用于采集声音信号(比如采集用户发出的声音)，将声音信号转换为电信号。在一些实施例中，音箱300上可以设置一个或多个麦克风301，比如麦克风阵列。在另一些实施例中，麦克风301除了采集声音信号，还可以实现对声音信号降噪功能，或者还可以识别声音信号的来源、实现定向录音功能等。

扬声器302，也称“喇叭”，用于将音频电信号转换为声音信号。音箱300可以通过扬声器302播放音乐等声音信号。

在一些实施例中，麦克风301和扬声器302与处理器303耦合。比如，麦克风301接收到声音信号后，将声音信号或者由声音信号转换而成的音频电信号发送给处理器303。处理器303判断是否响应该声音信号或者音频电信号，若是，则输出相应的输出信号，比如通过扬声器302播放音乐。

存储器304，可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。处理器303通过运行存储在存储器的指令，从而执行音箱300的各种功能应用以及数据处理。存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件，闪存器件，通用闪存存储器(universal flash storage，UFS)等，本申请实施例不作限定。在一些实施例中，存储器304中可以存储“唤醒词”等信息。在另一些实施例中，存储器304中还可以存储音频信息(比如，歌曲、相声、评书等)。

通信模块305，可以是无线通信模块(比如蓝牙、无线)。音箱300通过通信模块305与其他设备，比如另一个音箱，手机，电视机等连接。

传感器模块306可以包括气压传感器306A、温度传感器306B、加速度传感器306C等。应理解，图3仅是列举了几种传感器的示例，在实际应用中，音箱300还可以包括更多或很少的传感器，或者使用其他具有相同或类似功能的传感器替换上述列举的传感器等等，本申请实施例不作限定。

气压传感器306A，用于测量气压。在一些实施例中，处理器303可以与气压传感器306A耦合，通过气压传感器306A测得的气压值辅助计算，比如计算声音的衰减系数等。

温度传感器306B，用于检测温度。在一些实施例中，处理器303可以与温度传感器306B耦合，通过温度传感器306B测得的温度值辅助计算，比如计算声音的衰减系数等。

加速度传感器306C，用于在用户摇动音箱时，采集音箱的加速度信息，以便于根据该加速度信息来组建立体声音箱系统。

在一些实施例中，音箱300可以包含显示器(或显示屏)，也可以不包含显示器。显示器，可以用于显示应用的显示界面，比如当前播放的歌曲等。显示器包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display，LCD)，有机发光二极管(organic light-emitting diode，OLED)，有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diodes，AMOLED)，柔性发光二极管(flex light-emitting diode，FLED)，Miniled，MicroLed，Micro-oLed，量子点发光二极管(quantum dot light emitting diodes，QLED)等。在一些实施例中，显示器中可以设置触摸传感器，形成触摸屏，本申请实施例不作限定。触摸传感器用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给处理器303，以确定触摸事件类型。处理器303可以通过显示器提供与触摸操作相关的视觉输出。

在一些实施例中，图3还可以包含更多的器件，比如电池、USB接口等等，本申请实施例不多赘述。

图4A示出了本申请一实施例提供的音箱的结构示意图。音箱400可以为图2或图3所描述的音箱的一种示例。如图4A所示，音箱400可以包括底座401和壳体402。

在一些实施例中，底座401可以起到支撑的作用。比如，底座401可以支撑壳体402以及壳体402内所包围的部件(比如、处理器、麦克风、扬声器等)。在一些示例中，底座401可以由金属，塑料，陶瓷等其它的任何能够起到支撑作用的材料，或者这些材料的组合而构成。

在一些实施例中，底座401上可以支撑一个或多个扬声器406。比如，底座401可以支撑一个固定件404，该固定件404上可以设置一个或多个扬声器406。在一些示例中，底座401可以通过支撑柱405或其他方式支撑固定件404。固定件404可以是任何形状，比如圆形，方形等。在一些实施例中，一个或多个扬声器406可以在固定件404上按照一定的排布方式。比如，一个或多个扬声器406可以均匀分布在固定件404上的边缘，比如每个扬声器之间的距离间隔相同。在一些实施例中，一个或多个扬声器406可以与处理器403耦合。处理器403可以通过一个或多个扬声器406输出音频信号。

在一些实施例中，壳体402可以是圆柱体、立方体、正方体等任何立体形状。壳体402可以包裹处理器403、固定件404、一个或多个扬声器406等部件。壳体402可以是单个壳体构件，或多于两个的壳体构件组成。比如，壳体402可以包括上壳体402a和侧壳体402b。一个或多个壳体构件可以是金属，塑料，陶瓷，晶体、或者这些材料的组合，或其它的任何适合设置在音箱上的壳体构件等等。在一些实施例中，侧壳体402b可以是具有网眼结构的壳体，比如，网眼可以是圆孔，方孔，六角孔等形状。网眼结构的壳体可以起到装饰、防尘、保护壳体内部的器件(比如扬声器、麦克风等)等作用，且网眼结构的壳体可以减少对扬声器输出的声音的阻挡。

在一些实施例中，上壳体402a可以是网眼结构，或者不是网眼结构的壳体。上壳体402a可以设置输入设备，比如开关，按钮或按键等。比如，开关用于开启或关闭音箱。按钮或按键可以用于调节音量等功能。在另一些实施例中，上壳体402a上可以设置显示屏409(比如触摸显示屏)，可以用于接收输入、提供视觉输出等。比如，显示屏409上可以显示当前播放的歌曲的名称、歌手的名字等。当然，音箱上也可以不设置显示屏，本申请实施例不作限定。

在一些实施例中，上壳体402a可以与固定件407连接。固定件407上可以设置一个或多个麦克风408。固定件407可以是任何形状，比如圆形，方形等。在一些实施例中，一个或多个麦克风408可以在固定件407上按照一定的排布方式。比如，一个或多个麦克风408可以均匀分布在固定件407上的边缘，比如每个麦克风之间的距离间隔相同。再比如，每相邻两个麦克风对应的中心角a(比如，两个麦克风分别与固定件407的中心点连接的直线所形成的夹角)可以是固定的，比如，30、60度等。

在一些实施例中，一个或多个麦克风408可以与处理器403耦合。处理器403可以通过一个或多个麦克风408获得输入信号(比如用户发出的声音信号)。

本申请以下的实施例中，以图1的应用场景为例，且以图1中的音箱1和/或音箱2是上述图4A所示的音箱400为例。为了方便描述，下文将音箱1和音箱2中的一个称为主音箱，另一个称为从音箱。在一些实施例中，主音箱和从音箱可以是配套使用的。比如，主音箱用于播放左声道，从音箱用于播放右声道，或者主音箱用于播放右声道，从音箱用于播放左声道。也就是说，主音箱和从音箱的配合可以实现音频的立体声音效果。在一些实施例中，一个音箱是主音箱还是从音箱，可以是该音箱出厂之前设置好，也可以是用户自定义的(比如，音箱通过触摸显示屏接入输入操作，该输入操作用于选择该音箱是主音箱还是从音箱)，在本申请实施例中还可以是根据一定规则筛选出来的。

在一些实施例中，主音箱和从音箱的结构可以相同，比如，主音箱和从音箱都是图4A所示的结构。在另一些实施例中，主音箱和从音箱的结构也可以不完全相同，比如，主音箱可以设置有显示屏，而从音箱不设置显示屏等。在其他实施例中，主音箱和从音箱中部分部件的功能可以不完全相同。比如，主音箱中的处理器可以用于计算时延差(比如，第一时长和第二时长之间的时间差，第一时长可以是声音从主音箱到用户所需的时长，第二时长可以是声音从音箱到用户所需的时长)，响度增益等，而从音箱中的处理器不具有该功能。

在一些实施例中，主音箱和/或从音箱中的存储器中可以存储音频文件(比如，歌曲、相声、评书等)，主音箱和从音箱可以播放存储的音频文件。比如，主音箱可以接收输入(比如，通过触摸显示屏接收输入操作，或者通过麦克风接收语言输入)，该输入可以用于启动主音箱和/或从音箱，或用于控制主音箱和从音箱播放、切换歌曲等。在一些实施例中，主音箱中的一个或多个麦克风采集到声音信号(比如，用户发出的声音信号)，处理器识别出该声音信号中包含“唤醒词+播放歌曲”，处理器确定存储器中不存在该歌曲时，可以从网络侧下载该歌曲，或者输出提示信息(比如语言信息)提示用户不存在该歌曲。

在另一些实施例中，主音箱和/或从音箱可以与其它电子设备(比如手机、电视机)连接，可以通过有线或无线的方式连接。以主音箱与手机连接(比如，蓝牙连接)为例。手机可以将音频信号发送给主音箱，使得主音箱和从音箱播放该音频信号(比如，主音箱接收到音频信号之后，可以将音频信号发送给从音箱)。比如，手机正在运行音乐播放应用(比如，酷狗音乐)，且正在播放歌曲“一路向北”，手机可以将该歌曲的音频信号发送给主音箱，使得主音箱和从音箱播放该音频信号。在另一些实施例中，主音箱和手机连接之后，用户可以通过主音箱控制手机执行相应的操作。继续以前面的例子为例，用户在房间内发出“小白播放歌曲听妈妈的话”的声音信号，主音箱采集到该声音信号，可以暂停播放一路向北，而是输出提示信息“正在为您寻找听妈妈的话”。比如，主音箱可以从本地存储器中寻找是否存在歌曲听妈妈的话，若不存在，主音箱可以从网络侧下载，或者主音箱可以向手机发送指令，该指令用于指示手机播放听妈妈的话，手机接收到该指令后，下载或者在线播放该歌曲，将该歌曲的音频信号发送给主音箱，使得主音箱和从音箱播放该歌曲(即听妈妈的话)的音频信号。

在一些实施例中，主音箱和从音箱均可以启动自动识别“唤醒词”的功能。以主音箱为例，主音箱启动自动识别“唤醒词”的功能之后，主音箱中的全部或部分部件(比如，一个或多个麦克风、处理器等)处于使能状态。用户在房间内发出的声音信号被主音箱中的一个或多个麦克风接收。一个或多个麦克风将接收到的声音信号发送给处理器，处理器判断声音信号中包含“唤醒词”时，启动其它部件(比如，一个或多个扬声器)。在一些实施例中“唤醒词”可以是音箱出厂时默认设置好的，也可以是用户自定义的，比如“唤醒词”可以是“小白”、“小音”、“小艺”等。

在另一些实施例中，主音箱和从音箱均可以启动自动识别“唤醒词+播放歌曲”的功能。以主音箱为例，主音箱启动自动设备“唤醒词+播放歌曲”的功能之后，主音箱中的全部或部分部件(比如，一个或多个麦克风、处理器等)处于使能状态。用户在房间内发出的声音信号被主音箱中的一个或多个麦克风接收。一个或多个麦克风将接收到的声音信号发送给处理器，当处理器判断声音信号中包含“唤醒词+播放歌曲”时，启动其它部件(比如，一个或多个扬声器)。举例来说，用户在房间内发出“小白播放一路向北”。主音箱中的麦克风采集的该声音信号，然后发送给处理器，处理器识别出声音信号中包括唤醒词：小白，还包括：播放歌曲，处理器启动其它部件(比如，一个或多个扬声器)。

在一些实施例中，主音箱可以通过输入设备(比如主音箱上的触摸屏)接收输入操作或者通过与主音箱连接的其它设备比如手机接收输入操作，响应于该输入操作，启动自动识别“唤醒词”或“唤醒词+播放歌曲”的功能时，主音箱可以向从音箱发送一指令，该指令用于指示从音箱启动自动识别“唤醒词”或“唤醒词+播放歌曲”的功能。

在一些实施例中，用户可能处于房间内的任何位置，主音箱和从音箱与用户之间的距离可能不同。主音箱和从音箱启动自动识别“唤醒词”或“唤醒词+播放歌曲”的功能。主音箱和从音箱中的麦克风采集到声音信号。当主音箱和从音箱确定该声音信号中包含“唤醒词”或“唤醒词+播放歌曲”时，可以判断用户的位置，然后根据用户的位置控制主音箱和从音箱的声音参数。比如，声音参数可以包括主音箱和从音箱的时延差、响度增益等。因此，在该实施例中，当主音箱和从音箱识别出采集到的声音信号中包含“唤醒词”或“唤醒词+播放歌曲”时，才根据用户的位置调整主音箱和从音箱的声音参数。

以图4A所示的结构为例，主音箱和从音箱判断用户的位置的过程可以包括：主音箱采集到声音信号1。从音箱采集到声音信号2。主音箱确定声音信号1中包括“唤醒词”，从音箱确定声音信号2中包括“唤醒词”。当然，为了提升准确性，从音箱还可以将声音信号2或声音信号2中所包括的“唤醒词”发送给主音箱，由主音箱确定声音信号1和声音信号2中的“唤醒词”是同一个唤醒词。主音箱可以根据声音信号1确定用户相对于主音箱的第一方向/方位，例如，该第一方向/方位可以表示为用户在主音箱所构建的坐标系中与x轴之间的第一角度。从音箱可以根据声音信号2确定用户相对于从音箱的第二方向/方位，例如，该第二方向/方位可以表示为用户在从音箱所构建的坐标系中的与x轴之间的第二角度。从音箱可以将第二角度发送给主音箱，主音箱根据第一角度和第二角度，以及主音箱和从音箱之间的距离D确定用户的位置。具体的，主音箱和从音箱构建坐标系，以及主音箱和从音箱确定用户位置的过程将在后文详细介绍。

继续以图4A所示的结构为例，主音箱根据声音信号1确定用户相对于主音箱的第一方向/方位的方式可以有多种。例如，麦克风阵列定位技术(比如，根据主音箱上的麦克风阵列中的至少两个麦克风接收的声音信号的时间差来估计声源的方位)、波束指向(steered-beamformer)定位方法，基于高分辩率谱分析(high-resolution spectral analysis) 定位方法，和基于声音时间差(time-delay estimation，TDE)声源定位技术等等，本申请实施例不作限定。以麦克风阵列定位技术为例，主音箱根据声音信号1确定用户相对于主音箱的第一方向/方位的过程可以包括；主音箱中的麦克风阵列408采集到声音信号，假设麦克风408-1和麦克风408-2采集到声音信号的强度较大，主音箱可以根据麦克风408-1采集到声音信号的第一时刻t1，和麦克风408-2采集到的声音信号的第二时刻t2，以及麦克风408-1和麦克风408-2之间的距离L1(该距离可以出厂之后存储在主音箱中)，计算声源即用户相对于主音箱的第一方位。参见图4B所示，主音箱可以根据(t1-t2)*c和L1，以及三角函数关系，确定出用户相对于麦克风408-1的夹角A，该夹角A可以作为用户相对于主音箱的第一方位，或者，由于该夹角A是用户相对于麦克风408-1的夹角，主音箱可以将夹角A进行坐标转换进而转换到主音箱构建的坐标系中，得到夹角B，该夹角B也可以作为用户相对于主音箱的第一方位。从音箱与主音箱的结构可以相同，所以从音箱确定用户相对于从音箱的第二方位的过程，可以与上述过程类似。

在另一些实施例中，用户不断发出声音信号的过程中，主音箱和从音箱可以实时的、不断的采集声音信号(该声音信号可能不包含“唤醒词”或“唤醒词+播放歌曲”)，然后判断用户的位置，根据用户的位置调整主音箱和从音箱的声音参数，直到检测到包含“唤醒词”或“唤醒词+播放歌曲”的声音信号时，以调整后的声音参数(比如，主音箱和从音箱的时延差、响度增益等)控制主音箱和从音箱播放音频信号。

在一些实施例中，主音箱可以检测与从音箱之间的距离D，以便于确定是否组建立体声音箱系统，该距离可以是主音箱和从音箱之间的直线距离。主音箱检测到距离D之后，可以将该距离D发送给从音箱，从音箱无需检测距离D；或者，从音箱也自己可以检测与主音箱之间的距离D，以备使用。当然，从音箱可以检测与主音箱之间的距离D，然后发送给主音箱，即主音箱无需检测距离D等等。

以主音箱为例，作为一种示例，主音箱可以通过距离传感器检测与从音箱之间的距离。距离传感器可以是激光距离传感器、红外距离传感器等。例如，主音箱上的距离传感器发出特定频率的红外光，被从音箱反射，主音箱接收到从音箱发射的光。主音箱可以根据发射红外光的第一时间和接收到反射光的第二时间计算主音箱和从音箱之间的距离。作为另一种示例，主音箱还可以通过与从音箱通信实现测量主音箱和从音箱之间的距离的目的。例如，主音箱向从音箱发射一探测信号，从音箱接收到该探测信号后向主音箱发送反馈信号，主音箱接收到反馈信号。主音箱可以根据接收反馈信号的第二时间，和发送探测信号的第一时间，确定主音箱和从音箱之间的距离。作为又一种示例，主音箱还可以通过输入设备(比如主音箱上的触摸屏)接收输入操作，该输入操作用于输入主音箱和从音箱之间的距离。

类似的，主音箱和从音箱也可以通过麦克风阵列定位技术(比如，根据主音箱上的麦克风阵列中的至少两个麦克风接收的声音信号的时间差来估计声源的方位)、波束指向(steered-beamformer)定位方法，基于高分辩率谱分析(high-resolution spectral analysis)定位方法，和基于声音时间差(time-delay estimation，TDE)声源定位技术等等确定主从音箱之间的距离。例如主音箱可以发出声音，从音箱基于麦克风阵列确定自身和主音箱的距离。当未确定主音箱和从音箱时，可以两个音箱中的至少一个音箱发出声音，来实现距离的测定。

以下实施例介绍组建立体声音箱系统的可能的实现方式。

首先，为便于理解对本申请实施例涉及的一些关键名词进行解释：

1)、运动状态：即音箱的运动情况。例如下面实施例提及的第一运动状态，第二运动状态，均为描述音箱的移动情况的参数。运动状态可以为加速度传感器采集的数据，也可以是对加速度传感器采集的数据做进一步加工处理得到的信息。

2)、第一指示信息：用于描述加速度和其持续时长之间的对应关系。例如，定义同一加速度是指加速度变化小于预设变化时为同一加速度，需要说明的是如果加速度方向不同表示不同加速度。例如加速度范围[1,2]认为以1.5为基准加速度变化在0.5范围内的同一加速度。然后，统计每个加速度的持续时长，每个加速度和其对应的持续时长均可以采用对应的第一指示信息来表达。例如，一种可能的实施方式中，第一指示信息为(A，T)，其中，A表示加速度，T表示加速度A对应的持续时长。这个例子中采用显式表达的方式说明了加速度A的持续时长T，在另一种实施例中也可以采用隐式表达的方式来说明加速度A的持续时长T。例如，加速度传感器等时间间隔采集数据，则可定义每个加速度的持续时长都采用这个时间间隔(如5ms)来表达，由此第一指示信息也可表达为(A)，即默认持续时长为5ms。

需要说明的是，加速度传感器可同时采集三个方向(即X、Y、Z方向)的加速度信息。则(A，T)可表示为(X1，Xt1，Y1，Yt1，Z1，Zt1)或(X1，Y1，Z1，Xt1，Yt1，Zt1)。其中，X1，Y1，Z1表示采集到的各个方向的加速度，Xt1表示加速度X1的持续时长、Yt1表示加速度Y1的持续时长，Zt1表示加速度Z1的持续时长。

3)、第一加速度序列(时序信息)：用于描述第一指示信息的组织方式，即运动状态的时域信号。当具有多个加速度时，可以按时序排序第一指示信息，得到音箱的第一加速度序列。如第一加速度序列S＝{(X1，Xt1，Y1，Yt1，Z1，Zt1)，(X2，Xt2，Y2，Yt2，Z2，Zt2)…(Xn，Xtn，Yn，Ytn，Zn，Ztn)}，n为正整数。当然，也可以分不同加速度方向排序，例如S＝{(X1，Xt1，X2，Xt2…Xn，Xtn，)，(Y1，Yt1，Y2，Yt2…Yn,Ytn)…(Z1，Zt1，Z2，Zt2…Zn，Ztn)}。

由此，基于第一加速度序列能够表达加速度及其对应的持续时长随时间的变化情况，由此得到在时序上表达的音箱的运动状态。

4)、第二指示信息：音箱运动状态中每个点的频域信息。

本申请实施例中除了前文叙述的可采用第一加速度序列表达运动状态，还可以采用加速度传感器采集的加速度的频域信息来表达。本申请实施例中每个加速度的频域信息可称之为第二指示信息。频域信息的一种表达方式如统计加速度A的频域信息表达为P，则其第二指示信息表示为(A，P)。举个例子，假设9s为一次采样时长，获得的X方向的加速度的采样结果为(1,2,3,4,1,2,3,5,1,2,3,4,1,2,3,5，……)，将该采样结果转换为频域，得到X方向的频域信息。Y方向和Z方向参考X方向的处理方式，本申请不再赘述。

5)、第二加速度序列(频域信息)：用于描述第二指示信息的组织方式，用于在频域上表达音箱的运动状态(即运动状态的频域信号)。当具有多个第二指示信息时，可以得到第二加速度序列为S＝{Xp,Yp,Zp}，其中，Xp,Yp,Zp为XYZ三个方向上各自的第二指示信息。继续前面的例子，X方向的加速度包括(1,2,3,4,1,2,3,5,1,2,3,4,1,2,3,5，……)，则关于X方向的第二加速度序列Xp＝{(1,4),(2,4)(3,4),(4,8),(5,8)}，以此类推可得到Y方向和Z方向的第二加速度序列。

6)、预设动作以及预设动作的特征：为了提高触发组建立体声音箱系统的准确性，避免音箱的任何运动都会触发执行组建立体声音箱的操作，本申请实施例中可预先定义预设动作。当音箱的运动状态与该预设动作的特征匹配时，才认为需要组建立体声音箱系统由此可避免误组建。例如图5所示，该预设动作可以是手持音箱画一定的图形(例如8字形、波浪线、五角星形)。例如是左右摇动音箱，上下摇动音箱，还可以是让音箱产生碰撞。产生碰撞的方式可以是碰撞另一音箱也可以是碰撞另外的物体，只要是音箱产生碰撞即可。

当然，需要说明的是，实施时可以根据实际需求配置预设动作，甚至用户也可以自定义预设动作均适用于本申请实施例。

为了便于确定用户对音箱执行的操作是否为预设动作，本申请实施例中采用预设动作的特征来描述预设动作。

预设动作的特征的获取方式可实施为，在预先定义好预设动作之后，然后按照该预设动作操作音箱(例如手持音箱绘制8字图案)，并采集音箱的运动状态(如采集前文的第一加速度序列或第二加速度序列)，由此得到预设动作的特征，并存储在音箱的存储器中。

为了便于不同用户群能够方便的控制音箱组建立体声音箱系统，本申请实施例中，可以针对同一预设动作构建适用于不同用户群的预设动作的特征。例如预设动作为绘制8字，可以采集老年人绘制8字的数据，得到适用于老年人的绘制8字的特征；采集儿童绘制8字的数据，得到适用于儿童的绘制8字的特征。

此外，本申请实施例中还支持用户自定义预设动作。例如，如图6所示，用户通过音箱上的按键触发自定义预设动作的业务逻辑。然后音箱可提示用户对音箱自定义预设动作。以自定义预设动作为绘制五角星形字为例，用户一边手持音箱绘制五角星形，音箱一边采集自身的运动状态作为自定义预设动作的样本，并对执行的自定义预设动作进行计数。假设用户手持音箱绘制了3次五角星形，则音箱采集到3个样本，此时达到预置的计数要求，停止采集样本。然后对这3个样本进行分析(例如求均值)，进而得到自定义预设动作的特征保存在存储器中。之后，用户手持音箱绘制五角星形，则会和存储器中存储的预设动作的特征进行匹配，匹配上则会触发组建立体声音箱系统。

7)、第一序列模板、第二序列模板：这两个模板均为预设动作的特征，用于和采集到的音箱的运动状态进行匹配。由于前文在3)中和5)中分别介绍了对加速度信息整理分析得到的时序信息即第一加速度序列，和频域信息即第二加速度序列。故此，本申请实施例中提供和第一加速度序列对应的第一序列模板，并提供第二加速度序列对应的第二序列模板。当音箱的运动状态采用第一加速度序列表达时，采用第一序列模板和第一加速度序列进行匹配。当音箱的运动状态采用第二加速度序列表达时，采用第二序列模板和第二加速度序列进行匹配。然后基于匹配结果确定是否触发组建立体声音箱系统的操作。

如图7所示，示出了本申请一实施例提供的立体声音箱系统的组建方法的流程示意图以两个音箱为例，包括以下步骤：

为了便于用户组建立体声音箱系统，可以在用户移动音箱后，音箱向用户提示用于组建立体声音箱系统所需执行的预设动作，例如语音提醒：“请手持音箱绘制数字8来组建立体声音箱系统”，若音箱带有显示屏也可以通过显示屏输出文字“请手持音箱绘制8字来组建立体声音箱系统”来进行提示，具体的提示方式本申请对此不作限定。

步骤701，用户移动第一音箱，第一音箱会获取到第一音箱的第一运动状态，同理，用户移动第二音箱，第二音箱也会获取到第二音箱的第一运动状态。

需要说明的是，用户移动第一音箱和第二音箱的时机不受限，即可以先移动第一音箱再移动第二音箱，也可以先移动第二音箱再移动第一音箱，也可以同时移动第二音箱和第一音箱。此外，移动第一音箱和第二音箱的用户可以是同一用户也可以是不同用户。

提取到的运动状态，例如是前文所述的第一加速度序列S＝{(X1，Xt1，Y1，Yt1，Z1，Zt1)，(X2，Xt2，Y2，Yt2，Z2，Zt2)…(Xn，Xtn，Yn，Ytn，Zn，Ztn)}。

提取到的运动状态，例如是前文提及的对加速度信息进行频域分析之后得到的第二加速度序列，如X方向的第二加速度序列Xp＝{(1,4),(2,4),(3,4),(4,8),(5,8)}。

步骤702，第一音箱确定第一音箱的第一运动状态是否和预设动作的特征匹配，同理，第二音箱确定第二音箱的第一运动状态是否和预设动作的特征匹配。

需要说明的是，第一音箱的预设动作和第二音箱的预设动作可以相同也可以不同。例如第一音箱和第二音箱的预设动作可以均是绘制8字，也可以第一音箱的预设动作是绘制8字，第二音箱的预设动作是绘制五角星。

便于理解，这里以第一音箱为例，对第一运动状态是否和预设动作的特征匹配进行说明。定义的预设动作的特征由第一序列模板来表示。第一序列模板中包括X、Y、Z三个方向各自的第一序列子模板。如图8所示给出了X方向的第一序列子模板示意图。X方向的第一序列子模板中展示出了X方向加速度随时间变化的趋势图(默认每个加速度的持续时长为采样的时间间隔)。当加速度传感器输出加速度值时，会得到第一加速度序列，第一加速度序列中包括X、Y、Z三个方向各自的第一加速度子序列。如图8所示，给出了X方向的第一加速度子序列的示意图，图8中示出了X方向的加速度随时间变化的趋势(默认每个加速度的持续时长为采样的时间间隔)。

当采集到加速度值时，开始采用X方向的第一序列子模板和X方向采集到的第一加速度子序列进行模板匹配，如图8所示可知匹配到3个第一序列子模板(如图8中的A1、A2和A3)。类似的，Y方向可以采用Y方向的第一序列子模板和Y方向的第一加速度子序列进行模板匹配，Z方向可以采用Z方向的第一序列子模板和Z方向的第一加速度子序列进行匹配，在此不再赘述。

为提高触发组建立体声音箱系统的精度，当X方向匹配到X方向的第一序列子模板的次数大于指定次数时，确定X方向的第一加速度子序列和X方向的预设动作的特征匹配。

同理，当Y方向匹配到Y方向的第一序列子模板的次数大于指定次数时，确定Y方向的第一加速度子序列和Y方向的预设动作的特征匹配。当Z方向匹配到Z方向的第一序列子模板的次数大于指定次数时，确定Z方向的第一加速度子序列和Z方向的预设动作的特征匹配。

当X、Y、Z三个方向均和各自方向的预设动作的特征匹配时，确定第一音箱的第一运动状态和预设动作的特征匹配，否则，第一音箱的第一运动状态和预设动作的特征不匹配。

在另一些实施例中，可能一段时间内加速度传感器未采集到加速度。则实施时为了准确的确定是否和预设动作的特征匹配可以设定时长阈值t’。以X方向为例，例如在时长阈值t’范围内X方向匹配到X方向的第一序列子模板的次数大于指定次数时，确定X方向的第一加速度子序列和X方向的预设动作的特征匹配，否则不匹配。如图9所示，首先在A1时间段内匹配到X方向的第一序列子模板，匹配次数计数为1，然后在时间t(t>t’)内未采集到或未匹配到X方向的第一序列子模板，则之前匹配到X方向的第一序列子模板作废，匹配次数重新记为0。然后开始重新对匹配次数进行计数，直至匹配到的次数大于指定次数，确定X方向的预设动作的特征匹配。

此外，还可以限定相邻两次匹配到X方向的第一序列子模板的时间差阈值，则定义若相邻两次匹配到X方向的第一序列子模板的时间差小于时间差阈值，则对匹配到X方向的第一序列子模板的次数进行累计计数，否则重新计数。Y方向和Z方向也做相同的处理，在此不再赘述。

需要说明的是，本申请实施例中不仅可以对X、Y、Z三个方向分别进行匹配，也可以直接和第一序列模板进行匹配。例如，第一序列模板表示为P＝{(Xp1，Xpt1，Yp1，Ypt1，Zp1，Zpt1)，(Xp2，Xpt2，Yp2，Ypt2，Zp2，Zpt2)…(Xpm，Xptm，Ypm，Yptm，Zpm，Zptm)}，其中m为正整数。假设第一加速度序列为S＝{(X1，Xt1，Y1，Yt1，Z1，Zt1)，(X2，Xt2，Y2，Yt2，Z2，Zt2)…(Xn，Xtn，Yn，Ytn，Zn，Ztn)}，则匹配的方式为(X1，Xt1，Y1，Yt1，Z1，Zt1)与(Xp1，Xpt1，Yp1，Ypt1，Zp1，Zpt1)进行匹配，(Xp2，Xpt2，Yp2，Ypt2，Zp2，Zpt2)与(X2，Xt2，Y2，Yt2，Z2，Zt2)进行匹配，以此类推，若匹配上第一序列模板P，其中P＝{(Xp1，Xpt1，Yp1，Ypt1，Zp1，Zpt1)，(Xp2，Xpt2，Yp2，Ypt2，Zp2，Zpt2)…(Xpm，Xptm，Ypm，Yptm，Zpm，Zptm)}，则记为匹配到一次第一序列模板。具体匹配的方式本申请不作限定，可以参考时域信号的匹配方式即可，也可以逐点匹配差值，其中差值若在预设差值范围内则确定为匹配上。例如(X1，Xt1，Y1，Yt1，Z1，Zt1)与(Xp1，Xpt1，Yp1，Ypt1，Zp1，Zpt1)匹配时，如表1所示，分别计算X1与Xp1、Xt1与Xpt1、Y1与Yp1、Yt1与Ypt1、Z1与Zp1、Zt1与Zpt1的差值，取最大差值(假设为α6)，若最大差值α6的绝对值小于或等于预设差值，则确定(X1，Xt1，Y1，Yt1，Z1，Zt1)与(Xp1，Xpt1，Yp1，Ypt1，Zp1，Zpt1)匹配上，否则不匹配。

表1

X1	Xt1	Y1	Yt1	Z1	Zt1
Xp1	Xpt1	Yp1	Ypt1	Zp1	Zpt1
α1	α2	α3	α4	α5	α6

以上介绍了采用第一加速度序列表达音箱的第一运动状态时，如何确定第一运动是否和预设动作的特征匹配的实施方式，下面介绍以频域信号，即第二加速度序列表达音箱的第一运动状态时的匹配方式。与第一加速度序列类似，本申请实施例中第二加速度序列有对应的第二序列模板，可实施为若在第二加速度序列中匹配到第二序列模板的次数大于或等于第二指定次数，则确定第一运动状态与预设动作的特征匹配；若在第二加速度序列中匹配到第二序列模板的次数小于第二指定次数，则确定第一运动状态与预设动作的特征不匹配。

例如，第二序列模板可包括X、Y、Z各方向的第二序列子模板，以X方向为例，其对应的第二序列子模板，X方向的频域信息和X方向的第二序列子模板匹配，若匹配上该第二序列子模板的次数大于第二指定次数，则确定X方向匹配，否则X方向的频域信息和X方向的第二序列子模板不匹配。在X方向匹配的同时，同理若Y方向和Z方向也匹配，则确定第一运动状态与预设动作的特征匹配，否则只要存在一个方向不匹配，则确定第一运动状态与预设动作的特征不匹配。

类似的，当加速度传感器一段时长(该段时长大于时长阈值t’)内未采集到数据，或未匹配到第二序列模板时，则本次匹配失败，音箱的运动状态与预设动作的特征不匹配。

同理，定义若相邻两次匹配到第二序列模板的时间差小于时间差阈值，则对匹配到第二序列模板的次数进行累计计数，否则若相邻两次匹配到第二序列模板的时间差不小于时间差阈值，则本次匹配失败，重新计数。

在一些实施例中，当第一音箱的第一运动状态和预设动作的特征匹配时，可以触发组建立体声音箱系统的操作。为了进一步避免误触发，本申请实施例中还可以将音箱的移动距离是否足够长作为另一条触发条件，可实施为如图7所示的步骤703。

步骤703，确定第一音箱在第一音箱的第一运动状态下的移动距离，并确定第二音箱在第二音箱的第一运动状态下的移动距离。

其中，需要说明的是，步骤702和步骤703的执行时机不受限。

步骤704，若第一音箱的第一运动状态和预设动作的特征匹配，且第一音箱的移动距离大于指定距离，则触发组建立体声音箱系统的操作，即第一音箱搜索周围的音箱，同理，若第二音箱的第一运动状态和预设动作的特征匹配，且第二音箱的移动距离大于指定距离，则触发组建立体声音箱系统的操作，即第二音箱搜索周围的音箱。

具体的搜索方式，可以是第一音箱和第二音箱均扫描对端设备信息，如系统版本、信号强度等信息。实施时，如第一音箱和第二音箱各自广播自己的设备信息，然后第一音箱可以搜索到第二音箱的设备信息，第二音箱可以搜索到第一音箱的设备信息。

当两音箱距离较远或中间有障碍物时，其实不适合组建立体声音箱系统，故此，为了便于准确的组建立体声音箱系统，本申请实施例中可以增加组建立体声音箱系统的条件。

可在步骤705中，第一音箱搜索到第二音箱之后可以确定第一音箱和第二音箱之间的位置关系，同理，第二音箱搜索到第一音箱之后可以确定第二音箱和第一音箱的位置关系。

在步骤706中，若第一音箱和第二音箱的位置关系为指定位置关系时，则第一音箱和第二音箱组建立体声音箱系统。此外，第一音箱和第二音箱还可以提示用户哪些音箱可构建立体声音箱系统。例如，第一音箱和第二音箱可以亮灯，或者控制产生一定的灯光效果来提示用户第一音箱和第二音箱可组建立体声音箱系统，除了光效提示还可以采用声效提示方式也适用于本申请实施例，例如输出音频“我参与构建立体声音箱系统”，此外还可以采用显示屏提示，当然在其他实施例中还可以组合提示，例如光效+音效提示，音效+显示屏提示等均适用于本申请实施例。

实施时，位置关系可以采用距离来表述。第一音箱可以广播自身的设备信息以便于周围的音箱感知到自己，同理第二音箱广播自身的设备信息以便于被周围的音箱感知到。第一音箱获得第二音箱的设备信息后确定和第二音箱的距离，同理，第二音箱搜索到第一音箱之后可以确定第二音箱和第一音箱的距离。当两音箱的距离小于距离阈值D时，确定两音箱满足组队条件。然后两音箱开始组建立体声音箱系统。

组建立体声音箱系统包括以下几方面的内容：一是筛选出主音箱和从音箱(可实施为步骤707)，二是确定好各个音箱的角色，即确定好各个音箱的声道配置(可实施为步骤708)。

步骤707，基于主音箱筛选规则，从中筛选出主音箱。

主音箱筛选规则包括以下规则中的至少一种，一种可能的实施方式中当主音箱筛选规则多个规则时，以下规则的顺序时按优先级先后进行顺序的(当然也可以根据实际需求排序优先级也适用于本申请实施例)：

第1优先级，选择已经联网的音箱作为主音箱；

第2优先级，选择已经配网但未联网的音箱作为主音箱；

第3优先级，选择连接智能终端设备的音箱作为主音箱；

第4优先级，选择最早匹配到所述预设动作的特征的音箱作为主音箱；

第5优先级，选择MAC地址最大的音箱作为主音箱。

也即，首先筛选已经联网的音箱作为主音箱，以便于可以通过网络获取需要音箱播放资源。若各个音箱均未联网，则选择已经配网的音箱作为主音箱，如果各音箱也均未配网，则选择能够和终端设备如手机通信的音箱作为主音箱，由此筛选出的主音箱都能够和网络通信获取播放资源。

如果以上条件都不满足，则进而可以选择最早匹配到预设动作的特征的音箱作为主音箱。例如，通过摇一摇来组建立体声音箱系统时，最早摇动的音箱作为主音箱。

除此之外，还可以筛选最早匹配到所述预设动作的特征的音箱作为主音箱。当然，需要说明的是，筛选的规则是优先筛选能跟进行网络通信的音箱作为主音箱，若没有该类音箱则可以保证各音箱统一的筛选出一个主音箱即可，本申请对此不作限定。

在筛选出主音箱之后，可以通过声效或光效方式提示用户哪个音箱为主音箱。

需要说明的是，如果未搜索到周围的其他音箱，可以重复搜索多次，若多次均未搜索到，则可以结束组建立体声音箱系统的操作，并且还可以提示用户组建失败，以及失败的原因，例如该原因是未搜索到周围音箱。

步骤708，各音箱可以基于自身的位置信息，确定自己的声道，并提示给用户。

实施时，各音箱可以获取自身在立体声音箱系统中的相对位置关系，相对位置关系的示意可包括如图10-13几种情况进行说明。

如图10所示，第一音箱左侧、第二音箱在右侧时，第一音箱作为左声道，第二音箱作为右声道。然后第一音箱通过音频和/或光效，提示用于第一音箱为左声道，第二音箱为右声道。

如图11所示，若包含三个音箱时，则第一音箱确定自己为左声道、第二音箱确定自己为右声道，第三音箱确定自己为重低音。

如图12所示，若包含六个音箱时，则第一音箱确定自己为左声道、第二音箱为右声道、第三音箱为重低音、第四音箱为中置，第五音箱为左后声道、第六音箱为右后声道。

如图13所示，若包含十二个音箱时，则第一音箱确定自己为左声道、第二音箱为右声道、第三音箱为重低音、第四音箱为中置，第五音箱为左后声道、第六音箱为右后声道、第七音箱为中左声道，第八音箱为中右声道，第九音箱至第十二音箱按图13示出位置均为环绕声。

当然，在另一些实施例中，各音箱也可以不确定自己的声道，而是提示用户去配置各音箱的声道。此外，即使各音箱的声道配置好之后，也可以提示给用户以便于用户确认声道配置或修改各音箱配置的声道。

步骤709，用户可通过移动音箱来为各音箱配置声道。例如，第一音箱获取第一音箱的第二运动状态，然后将第二运动状态对应的声道配置为自己的声道。同理，如图7所示，第二音箱自己的第二运动状态，然后将第二运动状态对应的声道配置为自己的声道。

需要说明的是，第一音箱和第二音箱的第二运动状态不同。不同的第二运动状态可对应不同的声道配置。例如实施时，第二运动状态可采用如下的参数中的至少一种来描述：

1)、被摇动的次数：例如摇动一次作为左声道，摇动两次作为右声道，以此类推，被摇动的次数不同声道配置不同。

2)、被摇动的速度：例如，可以设定速度范围，第一速度范围对应左声道、第二速度范围对应右声道，以此类推，不同的速度范围的声道配置不同。

3)、被摇动的加速度：类似的，除了用速度确定声道配置，也可以采用加速度来确定。例如轻微摇动对应第一加速度范围，其声道为左声道、猛烈摇动采用第二加速度范围表示，对应右声道，以此类推。实施时，音箱中可存储多个加速度范围，将用户摇动的加速度和加速度范围进行比较，查看摇动的加速度属于哪个加速度范围，进而确定出音箱属于哪个声道。

4)、被摇动的方向：例如，向左移动音箱为左声道，向右移动音箱为右声道，想前移动音箱为重低音，以此类推，不同移动方向对应不同声道配置即可。

5)、移动的距离：例如移动第一距离范围为左声道，移动第二距离范围为右声道。

6)、产生碰撞的次数：例如，碰撞1次为左声道、碰撞2次为右声道，以此类推。

7)、移动轨迹等。其中，例如轨迹为数字1为左声道，轨迹为数字2为右声道，轨迹为圆圈则为环绕声。

当然实施时，以上其中参数不仅可以单独使用，也可以组合使用，例如，被摇动的次数和被摇动的加速度组合时，轻微摇动1次为左声道，轻微摇动2次为右声道、猛烈摇动1次为左后声道，猛烈摇动2次为右后声道。任何能够组合的方式也适用于本申请实施例。

再例如，还可以通过判断用户是摇一摇音箱还是碰一碰音箱来确定音箱的声道配置。实施时，可根据加速度的变化频率或者大小，并进一步结合移动距离判断对音箱的操作是摇一摇还是碰一碰。一种可能的实施方式为，将加速度大于g/2且触发时两个设备距离小于距离门限(如5cm)认为是碰一碰，否则确认为摇一摇。

在另一些实施例中，用户也可以自定义不同声道配置对应的第二运动状态。

在一些实施例中，各音箱在配置自己的声道时可以同时提示用户自己配置为何种声道以便于用户确认。

步骤710，提示用户组建好立体声音箱系统，并提示各音箱的声道配置以便于用户了解组建情况。

综上所述，详细介绍了两音箱组建音箱系统的情况。当更多音箱组建时，以三音箱为例，对组建方式进行说明。

实施例一：

假设，该实施例中第一音箱和第二音箱按照图7所示的流程组建立体声音箱系统之后，第三音箱加入。假设第一音箱为主音箱，如图14所示：

步骤1401，用户摇一摇第三音箱，第三音箱获取自己的第一运动状态。

步骤1402，第三音箱确定第一运动状态和预设动作的特征匹配，且在第一运动状态下的移动距离大于指定距离之后，搜索附近的音箱。

用户可以同时移动，或在一定时间范围内先后移动第一音箱和第三音箱以便于第一音箱和第三音箱能够搜索到对方。

步骤1403，搜索到第一音箱，所以第一音箱和第三音箱交互，确认第一音箱和第三音箱之间的距离。

在一种可能的实施方式中，第一音箱可通知第三音箱第一音箱已成立立体声音箱系统，由此可实施为步骤1404。

步骤1404，若第一音箱和第三音箱之间的距离小于距离阈值，则第三音箱提示用户配置自己的声道。即第三音箱可以在得知自己加入已有的立体声音箱系统时，可以提示用户为自己配置声道。

步骤1405，配置好声道之后，第三音箱向用户提示声道的配置结果，即提示为何种声道。

在另一些可能的实施方式中，第一音箱可以确定各音箱的相对位置关系，基于该位置关系自动确定第三音箱的声道配置并通知给第三音箱，然后第三音箱提示用户是否确认该声道配置。若用户确认同意该声道配置，则第三音箱基于该声道配置播放内容，否则若用户不同意，可以由用户自定义第三音箱的声道配置，至此第三音箱的声道配置完成。

当然，在一些实施例中，由于第三音箱的加入，各音箱的声道配置可能发生变化，此时，也支持用户重新自定义各音箱的声道配置，或者第一音箱根据各个音箱的相对位置关系重新确定各个音箱的声道配置。

此外，由于第三音箱的加入，主音箱可以重新筛选也可以保持主音箱不变。一种可能的实施方式是按照前文所述的优先级筛选出音箱时，若第一音箱的优先级较高则可以保持第一音箱仍然作为主音箱，如果第一音箱优先级较低则考虑是否更换第三音箱为主音箱。例如，第一音箱已是连接网络的音箱，则第三音箱的加入可不执行筛选主音箱的操作，若第一音箱不能连接网络，则第三音箱加入之后，可以重新筛选主音箱。

还需要说明的是，该实施例中，第三音箱是请求加入已组建的立体声音箱系统(即由第一音箱和第二音箱组建的音箱系统)，在实施时，对于一个已组建的音箱系统可以要求在组建完成时的第一时长阈值内允许其他音箱(如第三音箱)加入，也可以不设置该第一时长阈值。当不设置该第一时长阈值时，新的音箱可以随时加入已组建的音箱系统。该第一时长阈值可以支持用户设置。

实施例二

假设该实施例中，第一音箱、第二音箱和第三音箱几乎同时(例如在第二时长阈值范围内)被用户移动组建立体声音箱系统。如图15所示，可实施为：

步骤1501，第一音箱、第二音箱和第三音箱被用户移动，各音箱获取自己的第一运动状态。

步骤1502，各音箱确定各自第一运动状态和各自的预设动作的特征匹配，且确定各自的移动距离大于指定距离之后，搜索附近的音箱。

步骤1503，各音箱之间进行交互，确认各音箱之间的距离。

步骤1504，若各音箱之间的距离小于距离阈值，则各音箱提示用户配置自己的声道并筛选出主音箱。

步骤1505，用户配置好声道之后，各音箱向用户提示为自己配置的声道，组建完毕。

组建完毕之后如图16所示，若主音箱联网，则主音箱可响应用户语音，通过网络获取用户指示的音频资源。获取音频资源之后，分别给各个从音箱进行播放。

此外，如图17所示，若主音箱未联网但连接了用户的手机，则可以由手机获取网络中的音频资源之后由主音箱分发给各个从音箱进行播放。

基于相同的发明构思，本申请实施例还提供了一种第一音箱，如图18所示，所述音箱包括：

获取模块1801，用于获取所述第一音箱的第一运动状态；

搜索模块1802，用于若所述第一运动状态与预设动作的特征匹配，则搜索第二音箱；

系统组建模块1803，用于若搜索到第二音箱，则与所述第二音箱组建立体声音箱系统。

在一种可能的设计中，所述音箱还包括：

在一种可能的设计中，所述获取模块，具体用于：

所述预设动作的特征包括第一序列模板，所述音箱还包括：

在一种可能的设计中，所述获取模块，具体用于：

所述预设动作的特征包括第二序列模板，所述音箱还包括：

在一种可能的设计中，所述音箱还包括：

所述音箱还包括：

在一种可能的设计中，系统组建模块，具体用于：

为所述第一音箱配置声道。

选择已经联网的音箱作为主音箱；

选择已经配网但未联网的音箱作为主音箱；

选择连接智能终端设备的音箱作为主音箱；

选择最早匹配到所述预设动作的特征的音箱作为主音箱；

选择媒体存取控制位址MAC地址最大的音箱作为主音箱。

在一种可能的设计中，所述系统组建模块，具体用于：

提示用户为所述第一音箱配置声道；

获取所述第一音箱的第二运动状态；

在一种可能的设计中，所述系统组建模块，具体用于：

在一种可能的设计中，所述系统组建模块还用于：

确定与所述第二音箱的位置关系；

本申请的各个实施方式可以任意进行组合，以实现不同的技术效果。

上述本申请提供的实施例中，从音箱(主音箱和/或从音箱)作为执行主体的角度对本申请实施例提供的方法进行了介绍。为了实现上述本申请实施例提供的方法中的各功能，终端设备可以包括硬件结构和/或软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行，取决于技术方案的特定应用和设计约束条件。

以上实施例中所用，根据上下文，术语“当…时”或“当…后”可以被解释为意思是“如果…”或“在…后”或“响应于确定…”或“响应于检测到…”。类似地，根据上下文，短语“在确定…时”或“如果检测到(所陈述的条件或事件)”可以被解释为意思是“如果确定…”或“响应于确定…”或“在检测到(所陈述的条件或事件)时”或“响应于检测到(所陈述的条件或事件)”。另外，在上述实施例中，使用诸如第一、第二之类的关系术语来区份一个实体和另一个实体，而并不限制这些实体之间的任何实际的关系和顺序。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

需要指出的是，本专利申请文件的一部分包含受著作权保护的内容。除了对专利局的专利文件或记录的专利文档内容制作副本以外，著作权人保留著作权。

Claims

一种立体声音箱系统的组建方法，其特征在于，应用于第一音箱，所述方法包括：

获取所述第一音箱的第一运动状态；

若所述第一运动状态与预设动作的特征匹配，则搜索第二音箱；

若搜索到第二音箱，则与所述第二音箱组建立体声音箱系统。
根据权利要求1所述的方法，其特征在于，所述获取所述第一音箱的第一运动状态之前，所述方法还包括：

将用于组建立体声音箱系统所需执行的所述预设动作提示给用户。
根据权利要求1或2所述的方法，其特征在于，所述获取所述第一音箱的第一运动状态，包括：

基于所述第一音箱的加速度信息，生成所述第一音箱的第一加速度序列，所述第一音箱的第一加速度序列中存储有依时序排列的第一指示信息，所述第一指示信息用于表达加速度和所述加速度的持续时长之间的对应关系；

所述预设动作的特征包括第一序列模板，所述方法还包括：

将所述第一序列模板与所述第一音箱的第一加速度序列进行匹配操作；

若在所述第一音箱的第一加速度序列中匹配到所述第一序列模板的次数大于或等于第一指定次数，则确定所述第一运动状态与所述预设动作的特征匹配；

若在所述第一音箱的第一加速度序列中匹配到所述第一序列模板的次数小于所述第一指定次数，则确定所述第一运动状态与所述预设动作的特征不匹配。
根据权利要求1或2所述的方法，其特征在于，所述获取所述第一音箱的第一运动状态，包括：

基于所述第一音箱的加速度信息，生成所述第一音箱的第二加速度序列，所述第一音箱的第二加速度序列中存储有第二指示信息，所述第二指示信息用于表达加速度和采集到所述加速度的频域信息；

所述预设动作的特征包括第二序列模板，所述方法还包括：

将所述第二序列模板与所述第一音箱的第二加速度序列进行匹配操作；

若在所述第一音箱的第二加速度序列中匹配到所述第二序列模板的次数大于或等于第二指定次数，则确定所述第一运动状态与所述预设动作的特征匹配；

若在所述第一音箱的第二加速度序列中匹配到所述第二序列模板的次数小于所述第二指定次数，则确定所述第一运动状态与所述预设动作的特征不匹配。
根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

基于所述第一音箱的所述第一运动状态确定所述第一音箱的移动距离；

所述搜索第二音箱之前，所述方法还包括：

确定所述第一音箱的移动距离大于指定距离。
根据权利要求1-5中任一所述的方法，其特征在于，所述与所述第二音箱组建立体声音箱系统，包括：

基于主音箱筛选规则，确定所述第一音箱是否作为所述立体声音箱系统中的主音箱；并，

为所述第一音箱配置声道。
根据权利要求6所述的方法，其特征在于，所述主音箱筛选规则包括以下规则中的至少一种：

选择已经联网的音箱作为主音箱；

选择已经配网但未联网的音箱作为主音箱；

选择连接智能终端设备的音箱作为主音箱；

选择最早匹配到所述预设动作的特征的音箱作为主音箱；

选择媒体存取控制位址MAC地址最大的音箱作为主音箱。
根据权利要求6所述的方法，其特征在于，所述为所述第一音箱配置声道，包括：

提示用户为所述第一音箱配置声道；

获取所述第一音箱的第二运动状态；

将所述第二运动状态对应的声道配置为所述第一音箱的声道。
根据权利要求8所述的方法，其特征在于，所述提示用户为所述第一音箱配置声道，包括：

采用声效、光效和屏幕显示中的至少一种方式提示用户为所述第一音箱配置声道。
根据权利要求8所述的方法，其特征在于，所述第二运动状态包括以下参数中的至少一种：

所述第一音箱被摇动的次数、被摇动的速度、被摇动的加速度、被摇动的方向、移动的距离、所述第一音箱产生碰撞的次数、所述第一音箱的移动轨迹。
根据权利要求1-10中任一所述的方法，其特征在于，所述方法还包括：

确定与所述第二音箱的位置关系；

并若确定与所述第二音箱的位置关系为指定位置关系，则执行所述与所述第二音箱组建立体声音箱系统的操作。
根据权利要求11所述的方法，其特征在于，所述指定位置关系包括：所述第一音箱与所述第二音箱的距离小于距离阈值。
一种第一音箱，其特征在于，所述音箱包括：

获取模块，用于获取所述第一音箱的第一运动状态；

搜索模块，用于若所述第一运动状态与预设动作的特征匹配，则搜索第二音箱；

系统组建模块，用于若搜索到第二音箱，则与所述第二音箱组建立体声音箱系统。
根据权利要求13所述的音箱，其特征在于，所述音箱还包括：

提示模块，用于在所述获取所述第一音箱的第一运动状态之前，将用于组建立体声音箱系统所需执行的所述预设动作提示给用户。
根据权利要求13或14所述的音箱，其特征在于，所述获取模块，具体用于：

基于所述第一音箱的加速度信息，生成所述第一音箱的第一加速度序列，所述第一音箱的第一加速度序列中存储有依时序排列的第一指示信息，所述第一指示信息用于表达加速度和所述加速度的持续时长之间的对应关系；

所述预设动作的特征包括第一序列模板，所述音箱还包括：

第一匹配模块，用于将所述第一序列模板与所述第一音箱的第一加速度序列进行匹配操作；

若在所述第一音箱的第一加速度序列中匹配到所述第一序列模板的次数大于或等于第一指定次数，则确定所述第一运动状态与所述预设动作的特征匹配；

若在所述第一音箱的第一加速度序列中匹配到所述第一序列模板的次数小于所述第一指定次数，则确定所述第一运动状态与所述预设动作的特征不匹配。
根据权利要求13或14所述的音箱，其特征在于，所述获取模块，具体用于：

基于所述第一音箱的加速度信息，生成所述第一音箱的第二加速度序列，所述第一音箱的第二加速度序列中存储有第二指示信息，所述第二指示信息用于表达加速度和采集到所述加速度的频域信息；

所述预设动作的特征包括第二序列模板，所述音箱还包括：

第二匹配模块，用于将所述第二序列模板与所述第一音箱的第二加速度序列进行匹配操作；

若在所述第一音箱的第二加速度序列中匹配到所述第二序列模板的次数大于或等于第二指定次数，则确定所述第一运动状态与所述预设动作的特征匹配；

若在所述第一音箱的第二加速度序列中匹配到所述第二序列模板的次数小于所述第二指定次数，则确定所述第一运动状态与所述预设动作的特征不匹配。
根据权利要求15或16所述的音箱，其特征在于，所述音箱还包括：

距离确定模块，用于基于所述第一音箱的所述第一运动状态确定所述第一音箱的移动距离；

所述音箱还包括：

距离确定模块，用于在所述搜索第二音箱之前，确定所述第一音箱的移动距离大于指定距离。
根据权利要求13-17中任一所述的音箱，其特征在于，系统组建模块，具体用于：

基于主音箱筛选规则，确定所述第一音箱是否作为所述立体声音箱系统中的主音箱；并，

为所述第一音箱配置声道。
根据权利要求18所述的音箱，其特征在于，所述主音箱筛选规则包括以下规则中的至少一种：

选择已经联网的音箱作为主音箱；

选择已经配网但未联网的音箱作为主音箱；

选择连接智能终端设备的音箱作为主音箱；

选择最早匹配到所述预设动作的特征的音箱作为主音箱；

选择媒体存取控制位址MAC地址最大的音箱作为主音箱。
根据权利要求18所述的音箱，其特征在于，所述系统组建模块，具体用于：

提示用户为所述第一音箱配置声道；

获取所述第一音箱的第二运动状态；

将所述第二运动状态对应的声道配置为所述第一音箱的声道。
根据权利要求20所述的音箱，其特征在于，所述系统组建模块，具体用于：

采用声效、光效和屏幕显示中的至少一种方式提示用户为所述第一音箱配置声道。
根据权利要求20所述的音箱，其特征在于，所述第二运动状态包括以下参数中的至少一种：

所述第一音箱被摇动的次数、被摇动的速度、被摇动的加速度、被摇动的方向、移动的距离、所述第一音箱产生碰撞的次数、所述第一音箱的移动轨迹。
根据权利要求13-22中任一所述的音箱，其特征在于，所述系统组建模块还用于：

确定与所述第二音箱的位置关系；

并若确定与所述第二音箱的位置关系为指定位置关系，则执行所述与所述第二音箱组建立体声音箱系统的操作。
根据权利要求23所述的音箱，其特征在于，所述指定位置关系包括：所述第一音箱与所述第二音箱的距离小于距离阈值。
一种第一音箱，其特征在于，包括：一个或多个处理器、一个或多个存储器、一个或多个麦克风、一个或多个扬声器、以及通信模块；

所述一个或多个麦克风，用于采集声音信号；

所述通信模块，用于与其它音箱进行通信；

所述一个或多个扬声器，用于发出声音信号；

所述一个或多个存储器，用于存储程序指令，所述程序指令被所述一个或多个处理器执行，使得所述音箱执行如权利要求1-12任一所述的方法。
一种芯片，其特征在于，所述芯片包括处理器和接口；

所述接口，用于接收代码指令，并将接收的所述代码指令传输至所述处理器；

所述处理器，用于运行接收到的所述接口发送的所述代码指令，执行如权利要求1-12任一所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时，使所述计算机执行如权利要求1-12中任意一项所述的方法。