CN104936125B

CN104936125B - 环绕立体声实现方法及装置

Info

Publication number: CN104936125B
Application number: CN201510340066.XA
Authority: CN
Inventors: 张志飞; 常江龙; 朱春波; 刘洋
Original assignee: Samsung Electronics China R&D Center; Samsung Electronics Co Ltd
Current assignee: Samsung Electronics China R&D Center; Samsung Electronics Co Ltd
Priority date: 2015-06-18
Filing date: 2015-06-18
Publication date: 2017-07-21
Anticipated expiration: 2035-06-18
Also published as: CN104936125A

Abstract

本申请提出环绕立体声实现方法及装置。方法包括：从摄像头实时采集的听音者的图像数据中检测出听音者的头部；根据摄像头的摆放位置及图像采集参数，计算听音者头部的位置信息；根据听音者头部的位置信息，判断听音者的位置是否发生了变化，若是，根据听音者头部的位置信息，重新计算扬声器阵列的滤波器系数；否则，保持扬声器阵列的滤波器系数不变；根据扬声器阵列的滤波器系数对输入的音频信号进行滤波，将滤波后的音频信号输出到扬声器阵列连接的播放器。本申请能够根据听音者位置的变化，实时调整扬声器阵列的滤波器系数，无需预先指定聚焦区域，优化了环绕立体声的音效。

Description

环绕立体声实现方法及装置

技术领域

本申请涉及环绕立体声技术领域，尤其涉及环绕立体声实现方法及装置。

背景技术

环绕立体声是目前最为成功的商用重放系统，其典型应用案例包括5.1声道环绕系统、7.1声道环绕系统和最新的Atmos系统等。环绕立体声所使用的声源可扩展到整个水平面乃至垂直面，可以较好地营造听音的临场感。环绕立体声技术需要较少的扬声器，可操作性高，并且其有丰富的节目源，因此得到了广泛的应用。然而，受成本、空间大小等限制有些场景不能够使用环绕立体声设备，于是产生了虚拟三维音效技术。虚拟三维音效最早应用于耳机，现在逐渐推广到扬声器阵列，目的是用任意分布的扬声器阵列在听音者双耳处获得立体声回放效果。由于立体声信号使用扬声器播放后，会产生所谓的串扰影响，因此有大量文献讨论串扰消除的问题。多数虚拟三维音效技术利用人头相关函数(HRTF，Head-Related Transfer Function)或者心理声学技术进行环绕声重建。

现有的声聚焦技术主要有如下两种：1)波束成形(Beamforming)；2)声能量对比(Acoustic energy contrast)。Beamforming也叫空域滤波器，它通过调整扬声器各信号之间的幅度和相位的关系，来改变阵列的指向性。而声能量对比则可以通过合理设计阵列各声道的滤波器，在期望的位置形成声学能量的“亮区”或者“暗区”，从而达到声聚焦的目的。本质上，以上两种算法都属于声场控制范畴。

现有技术存在如下缺陷：

1、多数虚拟环绕立体声回放方法一旦设置完毕，其有效听音区域也随之固定，使用者必须固定在该区域接收声音，一旦离开该区域，音效将恶化直至没有效果。

2、多数声聚焦技术需要预先指定聚焦区域，在运行过程中无法改变聚焦区域。

发明内容

本申请实施例提供环绕立体声实现方法及装置。

本申请的技术方案是这样实现的：

一种环绕立体声实现方法，包括：

从摄像头实时采集的听音者的图像数据中检测出听音者的头部；

根据摄像头的摆放位置及图像采集参数，计算听音者头部的位置信息；

根据听音者头部的位置信息，判断听音者的位置是否发生了变化，若是，根据听音者头部的位置信息，重新计算扬声器阵列的滤波器系数；否则，保持扬声器阵列的滤波器系数不变；

根据扬声器阵列的滤波器系数对输入的音频信号进行滤波，将滤波后的音频信号输出到扬声器阵列连接的播放器。

一种环绕立体声实现装置，包括：

位置跟踪模块：从摄像头实时采集的听音者的图像数据中检测出听音者的头部；根据摄像头的摆放位置及图像采集参数，计算听音者头部的位置信息；

滤波器系数计算模块：根据听音者头部的位置信息，判断听音者的位置是否发生了变化，若是，根据听音者头部的位置信息，重新计算扬声器阵列的滤波器系数；否则，保持扬声器阵列的滤波器系数不变；

滤波模块：根据扬声器阵列的滤波器系数对输入的音频信号进行滤波，将滤波后的音频信号输出到扬声器阵列连接的播放器。

可见，本申请实施例能够根据听音者位置的变化，实时调整扬声器阵列的滤波器系数，无需预先指定聚焦区域，优化了环绕立体声的音效。

附图说明

图1为本申请一实施例提供的环绕立体声实现方法流程图；

图2为本申请实施例提供的扬声器阵列系统的示意图；

图3为本申请实施例提供的环绕立体声实现装置的示意图；

图4为本申请另一实施例提供的在图3所示装置中实现环绕立体声的方法流程图；

图5为本申请实施例提供的确定α的坐标系示意图；

图6为本申请又一实施例提供的在图3所示装置中实现环绕立体声的方法流程图；

图7为本申请又一实施例提供的在图3所示装置中实现环绕立体声的方法流程图；

图8为本申请实施例提供的亮区、暗区的划分示意图；

图9为本申请实施例提供的多播放器同步方法流程图；

图10为本申请实施例提供的摄像头的摆放位置示意图。

具体实施方式

图1为本申请一实施例提供的环绕立体声实现方法流程图，其具体步骤如下：

步骤101：从摄像头实时采集的听音者的图像数据中检测出听音者的头部。

步骤102：根据摄像头的摆放位置及图像采集参数，计算听音者头部的位置信息。

步骤103：根据听音者头部的位置信息，判断听音者的位置是否发生了变化，若是，根据听音者头部的位置信息，重新计算扬声器阵列的滤波器系数；否则，保持扬声器阵列的滤波器系数不变。

步骤104：根据扬声器阵列的滤波器系数对输入的音频信号进行滤波，将滤波后的音频信号输出到扬声器阵列。

输入的音频信号可以为麦克风直接采集的音频信号经过A/D(模拟/数字)转换到的，也可以是从存储设备上读取编码的音频信号后经过解码器解码而来的，或者从存储设备上读取的未经编码的音频信号。

图2为本申请实施例提供的扬声器阵列系统的示意图，如图2所示，扬声器阵列中共包括N＝2M(M为整数，且M>0)个扬声器，其中，扬声器1～M为左声道，扬声器M+1～2M为右声道，则扬声器n(1≤n≤N)与扬声器N-n+1构成一扬声器对，即共存在M个扬声器对，分别为扬声器1、N，扬声器2、N-1，扬声器3、N-2，...，扬声器M、M+1，每对扬声器连接了一个播放器。

图3为本申请实施例提供的环绕立体声实现装置的示意图，该装置主要包括：位置跟踪模块、滤波器系数计算模块和滤波模块。

以图2所示的扬声器阵列为例，给出本申请另一实施例提供的在图3所示装置中实现环绕立体声的方法流程，具体见图4，其具体步骤如下：

步骤401：双目/多目摄像头实时采集听音者的双/多视角图像数据，将采集的听音者的双/多视角图像数据实时传输给位置跟踪模块。

步骤402：位置跟踪模块从听音者的双/多视角图像数据中实时检测出听音者的头部。

步骤403：对于实时检测出的听音者的头部，针对每一扬声器对：扬声器n(1≤n≤N)与扬声器N-n+1，位置跟踪模块计算出该扬声器对的中心点到听音者的头部中心的距离l、该扬声器对的中心点与听音者的头部中心之间的连线与水平轴正向的夹角α，将计算出的l和α实时发送给滤波器计算模块。

扬声器对的中心点，即扬声器对中的两扬声器的连线的中心点。

在计算α时，是以扬声器对的中心点为坐标原点，以两扬声器的连线为水平轴，以水平右边轴为水平轴正向，以垂直下边轴为垂直轴正向，如图5所示。

步骤404：滤波器系数计算模块接收并保存位置跟踪模块发来的l和α，判断是否满足：该l与位置跟踪模块上一次发来的l的差值的绝对值小于第一预设值，和/或，该α与位置跟踪模块上一次发来的α的差值的绝对值小于第二预设值，若是，返回步骤404；否则，执行步骤405。

步骤405：滤波系数计算模块根据预先保存的该扬声器对中的两扬声器的间距d、听音者的头部半径a，以及位置跟踪模块最新发来的l和α，计算出扬声器n到听音者的左耳的距离l₁、扬声器n到听音者的右耳的距离l₂、扬声器N-n+1到听音者的左耳的距离l₃、扬声器N-n+1到听音者的右耳的距离l₄，然后计算出该扬声器对的传递函数矩阵C。

其中，

其中，ρ₀为空气密度，k＝2πf/c，c为声速，f为声音的频率，j表示实数的虚部。

步骤406：滤波器系数计算模块根据该扬声器对的传递函数矩阵C，计算出该扬声器对的串扰消除滤波器系数矩阵H，将H实时发送给滤波模块。

其中，H＝C^-1，(·)^-1是取逆操作；

或者，H＝[C^HC+βI]^-1C，其中，I是单位矩阵，(·)^H是共轭转置操作，β(β≥0)是规整参数，β值越大，鲁棒性越强但精度越低，具体取值可根据实际需要确定。

步骤407：滤波模块采用该扬声器对的最新串扰消除滤波器系数矩阵H，对输入的音频信号进行过滤，将滤波后的音频信号输出到该扬声器对连接的播放器。

输入的音频信号为由输入的左、右声道音频信号组成的1*2的矩阵，则滤波后的音频信号也为由左、右声道音频信号组成的1*2的矩阵。将滤波后的左声道音频信号输出给扬声器n，将滤波后的右声道音频信号输出给扬声器N-n+1。

以图2所示的扬声器阵列为例，给出本申请又一实施例提供的在图3所示装置中实现环绕立体声的方法流程，具体见图6，其具体步骤如下：

步骤601：双目/多目摄像头实时采集听音者的双/多视角图像数据，将采集的听音者的双/多视角图像数据实时传输给位置跟踪模块。

步骤602：位置跟踪模块从听音者的双/多视角图像数据中实时检测出听音者的头部。

步骤603：对于实时检测出的听音者的头部，针对每一扬声器对：扬声器n(1≤n≤N)与扬声器N-n+1，位置跟踪模块计算出该扬声器对的中心点到听音者的头部中心的距离l、该扬声器对的中心点与听音者的头部中心之间的连线与水平轴正向的夹角α、以及该扬声器对中的扬声器n、N-n+1与听音者的左/右耳之间的连线与水平轴正向的夹角γ_q(q＝1，2，3，4)，将计算出的l、α和γ_q实时发送给滤波器计算模块。

其中，在计算α、γ_q时，是以扬声器对的中心点为坐标原点，以两扬声器的连线为水平轴，以水平右边轴为水平轴正向，以垂直下边轴为垂直轴正向。

γ₁为扬声器n与听音者的左耳之间的连线与水平轴正向的夹角，γ₂为扬声器n与听音者的右耳之间的连线与水平轴正向的夹角，γ₃为扬声器N-n+1与听音者的左耳之间的连线与水平轴正向的夹角，γ₄为扬声器N-n+1与听音者的右耳之间的连线与水平轴正向的夹角。

步骤604：滤波器系数计算模块接收并保存位置跟踪模块发来的l、α和γ_q，判断是否满足：该l与位置跟踪模块上一次发来的l的差值的绝对值小于第一预设值，和/或，该α与位置跟踪模块上一次发来的α的差值的绝对值小于第二预设值，若是，返回步骤604；否则，执行步骤605。

步骤605：滤波系数计算模块根据预先保存的该扬声器对中的两扬声器的间距d、听音者的头部半径a，以及位置跟踪模块最近发来的l、α和γ_q，计算出扬声器n到听音者的左耳的距离l₁、扬声器n到听音者的右耳的距离l₂、扬声器N-n+1到听音者的左耳的距离l₃、扬声器N-n+1到听音者的右耳的距离l₄，然后计算出该扬声器对的传递函数矩阵C。

其中，

其中，q＝1，2，3，4，该公式是以刚性球模型来模拟人头的散射。

即，c_q(q＝1，2，3，4)分别代表c₁，c₂，c₃，c₄；

l_q(q＝1，2，3，4)分别代表l₁，l₂，l₃，l₄；

c为声速，ρ₀为空气密度，u₀为扬声器体积速度，a为听音者的头部半径，L_m为拉格朗日多项式函数，H_m为球汉克尔函数，H_m’为H_m的导数。

步骤606：滤波器系数计算模块根据该扬声器对的传递函数矩阵C，计算出该扬声器对的串扰消除滤波器系数矩阵H。

其中，H＝C^-1，(·)^-1是取逆操作；

步骤607：滤波模块采用该扬声器对的最新串扰消除滤波器系数矩阵H，对输入的音频信号进行过滤，将滤波后的音频信号输出到该扬声器对连接的播放器。

以图2所示的扬声器阵列为例，给出本申请又一实施例提供的在图3所示装置中实现环绕立体声的方法流程，具体见图7，其具体步骤如下：

步骤700：预先设定亮区、暗区的划分方法，并设定亮区和暗区的离散化方法。

图8为亮区、暗区的划分示意图，亮区、暗区的位置和大小可根据扬声器阵列的摆放位置与人头的位置来确定，亮区为人头附近(包含人头)的部分区域，暗区为亮区左、右附近的部分区域。

亮区和暗区的离散化方法指的是，设定亮区和暗区中的单个点的大小，按照单个点的大小，可以对亮区和暗区进行离散化处理。

步骤701：：双目/多目摄像头实时采集听音者的双/多视角图像数据，将采集的听音者的双/多视角图像数据实时传输给位置跟踪模块。

步骤702：位置跟踪模块从听音者的双/多视角图像数据中实时检测出听音者的头部。

步骤703：对于实时检测出的听音者的头部，针对每一扬声器对：扬声器n(1≤n≤N)与扬声器N-n+1，位置跟踪模块计算出该扬声器对的中心点到听音者的头部中心的距离l、该扬声器对的中心点与听音者的头部中心之间的连线与水平轴正向的夹角α，将计算出的l和α实时发送给滤波器计算模块。

其中，在计算α时，是以扬声器对的中心点为坐标原点，以两扬声器的连线为水平轴，以水平右边轴为水平轴正向，以垂直下边轴为垂直轴正向。

步骤704：滤波器系数计算模块接收并保存位置跟踪模块发来的l和α，判断是否满足：该l与位置跟踪模块上一次发来的l的差值的绝对值小于第一预设值，和/或，该α与位置跟踪模块上一次发来的α的差值的绝对值小于第二预设值，若是，返回步骤704；否则，执行步骤705。

步骤705：滤波器系数计算模块根据预设的亮区、暗区划分方法，并根据位置跟踪模块发来的l和α以及预先保存的该扬声器对中的两扬声器的间距d、听音者的头部半径a，在听音者头部附近划定亮区和暗区，并按照预设的亮区和暗区的离散化方法，对亮区和暗区进行离散化处理。

步骤706：滤波器系数计算模块计算亮区和暗区的平均声能量比值η：

其中，N_b为亮区中的点的数目，N_t为暗区中的点的数目，H为扬声器阵列的滤波器系数矩阵，C_b为扬声器阵列到亮区中的所有点的传递函数矩阵，C_t为扬声器阵列到暗区中的所有点的传递函数矩阵，能量，表示暗区的平均能量；

当η最大时，其值为的最大特征值，相应的H为最大特征值对应的特征向量。

亮区或暗区中的任一点(设为点k)的空间响应为：

p_k＝c_kH＝[c_k1,c_k2,c_k3,…,c_kN][h₁,h₂,h₃,…,h_N]^H

其中，c_kn(1≤n≤N)为第n个扬声器到该点k的传递函数，h_n为第n个扬声器的滤波器系数，N为扬声器阵列中的扬声器数目，

ρ₀为空气密度，k＝2πf/c，c为声速，f为声音的频率，j表示实数的虚部，l_kn为扬声器n到该点k的距离，由于扬声器n和点k的位置已经得知，因此，l_kn可直接计算得到；

或者，

c为声速，ρ₀为空气密度，u₀为扬声器体积速度，a为听音者的头部半径，L_m为拉格朗日多项式函数，γ_kn为扬声器n与点k的连线与水平轴正向的夹角，l_kn为扬声器n到该点k的距离，H_m为球汉克尔函数，H_m’为H_m的导数，

γ_kn是以扬声器对：扬声器n与扬声器N-n+1的中心点为坐标原点，以两扬声器的连线为水平轴，以水平右边轴为水平轴正向，以垂直下边轴为垂直轴正向。

该点k的声能量为：

则，亮区的总能量为：其中，C_b为扬声器阵列到亮区中的所有点的传递函数矩阵；

暗区的总能量为：其中，C_t为扬声器阵列到暗区中的所有点的传递函数矩阵。

步骤707：滤波模块采用该扬声器阵列的滤波器系数矩阵H，对输入的音频信号进行过滤，将滤波后的音频信号输出到该扬声器阵列连接的播放器。

以图2所示的扬声器阵列为例，给出本申请实施例提供的多播放器同步方法流程，见图9，其具体步骤如下：

步骤901：N/2个播放器通过LAN(Local Area Network，局域网)或者WLAN(Wireless Local Area Network，无线局域网)方式进行互联，设置其中一台播放器为主控播放器；在每个播放器上配置同步回放参数：1、主控播放器的IP地址和端口；2、同步回放的播放器个数N/2。

步骤902：当各播放器选择了相同的播放音频源时，主控播放器首先启动同步回放控制模块。

步骤903：各播放器与主控播放器的同步回放控制模块建立TCP(TransmissionControl Protocol，传输控制协议)连接。

步骤904：主控播放器的同步回放控制模块发现已与所有播放器建立TCP连接，则通过UDP(User Datagram Protocol，用户数据报协议)多播方式向所有播放器提供统一的起始播放时钟T1，然后，每隔1ms更新一次系统时钟T2并发送给所有播放器。

步骤905：各播放器利用当前系统时钟T2与起始播放时钟T1的差值(T2–T1)以及音频帧的时间戳PTS对当前音频帧对应的激励信号进行同步回放。

其中，如果T2–T1>PTS+1ms，则播放器等待1ms后，再输出当前音频帧对应的激励信号；如果PTS>T2–T1+1ms，则播放器向同步回放控制模块发送系统调整值：PTS–(T2–T1)，同步回放控制模块会将当前系统时钟从T2减小到T2–(PTS–(T2–T1))，使得当前系统时钟同步到当前播放的音频帧的时间戳上，这样各播放器同步回放之间的延迟始终控制在1ms以内。

另外，需要说明的是，本申请实施例中，为了更方便地确定听音者的位置，可以将摄像头放在扬声器阵列的正上方，如图10所示。

本申请实施例的有益技术效果如下：

通过实时跟踪听音者的位置，来调整扬声器阵列的滤波器系数，使得回放的最佳听音点或者声聚焦区域跟随听音者移动，从而不需要将听音者限制在固定的地点，具有更大的灵活性和实用性，增强了听音者区域内的音效体验、提高临场感，且可以通过聚焦方法减少对周围其他人的干扰以及在远程通话中减少信息的外泄。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

1.一种环绕立体声实现方法，其特征在于，该方法包括：

根据扬声器阵列的滤波器系数对输入的音频信号进行滤波，将滤波后的音频信号输出到扬声器阵列连接的播放器；

所述方法进一步包括：根据预设的亮区、暗区划分方法，在听音者的头部附近划定亮区和暗区，并按照预设的离散方法，对亮区和暗区进行离散化处理；

所述重新计算扬声器阵列的滤波器系数包括：

计算亮区和暗区的平均声能量比值η：

η = \frac{N_{t} H^{H} C_{b}^{H} C_{b} H}{N_{b} H^{H} C_{t}^{H} C_{t} H}

其中，N_b为亮区中的点的数目，N_t为暗区中的点的数目，H为扬声器阵列的滤波器系数矩阵，H^H为H的共轭转置矩阵，C_b为扬声器阵列到亮区中的所有点的传递函数矩阵，为C_b的共轭转置矩阵，C_t为扬声器阵列到暗区中的所有点的传递函数矩阵，为C_t的共轭转置矩阵，表示亮区的平均能量，表示暗区的平均能量；

2.根据权利要求1所述的方法，其特征在于，所述扬声器阵列中共包括N个扬声器，其中，扬声器n与扬声器N-n+1构成一扬声器对，N为正整数，1≤n≤N，

所述计算听音者头部的位置信息包括：

针对任一扬声器对：扬声器n与扬声器N-n+1，计算该扬声器对的中心点到听音者的头部中心的距离l、该扬声器对的中心点与听音者的头部中心之间的连线与水平轴正向的夹角α，其中，以扬声器对的中心点为坐标原点，以两扬声器的连线为水平轴，以水平右边轴为水平轴正向，以垂直下边轴为垂直轴正向；

所述判断听音者的位置是否发生了变化包括：

判断是否满足：当前计算出的l与最近一次计算出的l的差值的绝对值小于第一预设值，和/或，当前计算出的α与最近一次计算出的α的差值的绝对值小于第二预设值，若是，确认听音者的位置未发生变化；否则，确认听音者的位置发生了变化。

3.根据权利要求2所述的方法，其特征在于，所述重新计算扬声器阵列的滤波器系数包括：

根据该扬声器对中的两扬声器的间距d、听音者的头部半径a，以及计算出的l和α，计算出扬声器n到听音者的左耳的距离l₁、扬声器n到听音者的右耳的距离l₂、扬声器N-n+1到听音者的左耳的距离l₃、扬声器N-n+1到听音者的右耳的距离l₄，然后计算出该扬声器对的传递函数矩阵C：

C = \frac{ρ_{0}}{4 π} [\begin{matrix} e^{- {jkl}_{1}} / l_{1} & e^{- {jkl}_{3}} / l_{3} \\ e^{- {jkl}_{2}} / l_{2} & e^{- {jkl}_{4}} / l_{4} \end{matrix}]

其中，ρ₀为空气密度，k＝2πf/c，c为声速，f为声音的频率，j表示实数的虚部；

根据该扬声器对的传递函数矩阵C，计算出该扬声器对的串扰消除滤波器系数矩阵H：H＝C^-1或者H＝[C^HC+βI]^-1C，

其中，(·)^-1是取逆操作，I是单位矩阵，(·)^H是共轭转置操作，β是预设的规整参数。

4.根据权利要求2所述的方法，其特征在于，所述计算听音者头部的位置信息进一步包括：

计算扬声器n与听音者的左耳之间的连线与水平轴正向的夹角γ₁，以及扬声器n与听音者的右耳之间的连线与水平轴正向的夹角γ₂，以及扬声器N-n+1与听音者的左耳之间的连线与水平轴正向的夹角γ₃，以及为扬声器N-n+1与听音者的右耳之间的连线与水平轴正向的夹角γ₄；

所述重新计算扬声器阵列的滤波器系数包括：

根据该扬声器对中的两扬声器的间距d、听音者的头部半径a，以及计算出的l、α和γ_q，计算出扬声器n到听音者的左耳的距离l₁、扬声器n到听音者的右耳的距离l₂、扬声器N-n+1到听音者的左耳的距离l₃、扬声器N-n+1到听音者的右耳的距离l₄，然后计算出该扬声器对的传递函数矩阵C：

C = [\begin{matrix} c_{1} & c_{3} \\ c_{2} & c_{4} \end{matrix}]

c_{q} = \frac{{cρ}_{0} u_{0}}{2 {πa}^{2}} Σ_{m = 0}^{\infty} (m + \frac{1}{2}) L_{m} ({cosγ}_{q}) \frac{H_{m} (2 {πfl}_{q} / c)}{H_{m}^{'} (2 {πfl}_{q} / c)} e^{- j π / 2}, q = 1, 2, 3, 4,

其中，c为声速，ρ₀为空气密度，u₀为扬声器体积速度，L_m为拉格朗日多项式函数，H_m为球汉克尔函数，H_m’为H_m的导数；

根据该扬声器对的传递函数矩阵C，计算出该扬声器对的串扰消除滤波器系数矩阵H：H＝C^-1或者，H＝[C^HC+βI]^-1C，

5.根据权利要求1所述的方法，其特征在于，所述扬声器阵列中共包括N个扬声器，所述N个扬声器所在的播放器通过局域网LAN或者无线局域网WLAN方式进行互联，并设置其中一台播放器为主控播放器；

各播放器选择相同的播放音频源，每个非主控播放器分别与主控播放器建立连接，主控播放器发现已与所有播放器建立连接，则向所有播放器提供统一的起始播放时钟T1，然后，每隔1ms更新一次系统时钟T2并发送给所有播放器；

每个播放器接收T1，且当每次接收到T2后，若T2–T1>当前音频帧的PTS+1ms，则等待1ms后，再向本播放器连接的扬声器输出当前音频帧对应的激励信号；若当前音频帧的PTS>T2–T1+1ms，则向主控播放器发送系统时钟调整值：当前音频帧的PTS–(T2–T1)，以便主控播放器将当前系统时钟从T2减小到T2–(当前音频帧的PTS–(T2–T1))。

6.一种环绕立体声实现装置，其特征在于，包括：

滤波模块：根据扬声器阵列的滤波器系数对输入的音频信号进行滤波，将滤波后的音频信号输出到扬声器阵列连接的播放器；

所述滤波器系数计算模块进一步包括：根据预设的亮区、暗区划分方法，根据听音者头部的位置信息，在听音者头部附近划定亮区和暗区，并按照预设的离散方法，对亮区和暗区进行离散化处理；

所述滤波器系数计算模块重新计算扬声器阵列的滤波器系数包括：

计算亮区和暗区的平均声能量比值η：

η = \frac{N_{t} H^{H} C_{b}^{H} C_{b} H}{N_{b} H^{H} C_{t}^{H} C_{t} H}

7.根据权利要求6所述的装置，其特征在于，所述扬声器阵列中共包括N个扬声器，其中，扬声器n与扬声器N-n+1构成一扬声器对，N为正整数，1≤n≤N，

所述位置跟踪模块计算听音者头部的位置信息包括：

所述滤波器系数计算模块判断听音者的位置是否发生了变化包括：

8.根据权利要求7所述的装置，其特征在于，所述滤波器系数计算模块重新计算扬声器阵列的滤波器系数包括：

C = \frac{ρ_{0}}{4 π} [\begin{matrix} e^{- {jkl}_{1}} / l_{1} & e^{- {jkl}_{3}} / l_{3} \\ e^{- {jkl}_{2}} / l_{2} & e^{- {jkl}_{4}} / l_{4} \end{matrix}]

9.根据权利要求7所述的装置，其特征在于，所述位置跟踪模块计算听音者头部的位置信息进一步包括：

C = [\begin{matrix} c_{1} & c_{3} \\ c_{2} & c_{4} \end{matrix}]

c_{q} = \frac{{cρ}_{0} u_{0}}{2 {πa}^{2}} Σ_{m = 0}^{\infty} (m + \frac{1}{2}) L_{m} ({cosγ}_{q}) \frac{H_{m} (2 {πfl}_{q} / c)}{H_{m}^{'} (2 {πfl}_{q} / c)} e^{- j π / 2}, q = 1, 2, 3, 4,

10.根据权利要求6所述的装置，其特征在于，所述扬声器阵列中共包括N个扬声器，

所述装置进一步包括：与N个扬声器连接的播放器，且，所有播放器通过局域网LAN或者无线局域网WLAN方式进行互联，且，其中一台播放器为主控播放器，

且当所述播放器为主控播放器时，分别与每个非主控播放器建立连接，发现已与所有播放器建立连接，则向所有播放器提供统一的起始播放时钟T1，然后，每隔1ms更新一次系统时钟T2并发送给所有播放器；

当所述播放器为非主控播放器时，接收T1，且当每次接收到T2后，若T2–T1>当前音频帧的PTS+1ms，则等待1ms后，再向本播放器连接的扬声器输出当前音频帧对应的激励信号；若当前音频帧的PTS>T2–T1+1ms，则向主控播放器发送系统时钟调整值：当前音频帧的PTS–(T2–T1)，以便主控播放器将当前系统时钟从T2减小到T2–(当前音频帧的PTS–(T2–T1))。