CN117939390A

CN117939390A - 一种头枕扬声器及其音频处理方法和系统、存储介质

Info

Publication number: CN117939390A
Application number: CN202410114874.3A
Authority: CN
Inventors: 孙学京; 李旭阳; 陈联武
Original assignee: Ruisheng Kaitai Acoustic Technology Shanghai Co ltd
Current assignee: Ruisheng Kaitai Acoustic Technology Shanghai Co ltd
Priority date: 2024-01-26
Filing date: 2024-01-26
Publication date: 2024-04-26

Abstract

本公开的实施例提供一种头枕扬声器及其音频处理方法和系统、存储介质。方法包括：获取听众头部与头枕扬声器的相对位置数据；根据相对位置数据，分别确定双耳渲染算法和串扰消除算法对应的第一HRTF数据和第二HRTF数据；将第一HRTF数据和第二HRTF数据进行融合处理，得到初始融合HRTF数据；对初始融合HRTF数据基于相对位置数据进行动态调整得到目标融合HRTF数据，并利用目标融合HRTF数据对初始音频进行处理，得到目标音频；通过头枕扬声器播放目标音频。本公开的实施例通过融合双耳渲染算法和串扰消除算法对音频进行处理，并设计动态调整策略，可以确保无论听众靠近还是远离头枕扬声器，都能获得良好的听感体验。

Description

一种头枕扬声器及其音频处理方法和系统、存储介质

技术领域

本公开的实施例属于音频处理技术领域，具体涉及一种头枕扬声器及其音频处理方法和系统、存储介质。

背景技术

“头枕扬声器”是一种安装于头枕中的音频设备，可用于汽车座椅、按摩椅等场景，为听众提供个性化的音频体验。目前的一些常见播放策略包括：各座椅头枕独立播放、座椅头枕同步播放、座椅头枕分区播放以及交互式播放等。

上述播放策略都是直接播放立体声，听众需要将头部或双耳维持在适当位置才能获得理想的收听体验，当听众在座椅中的姿态发生改变，例如将头部远离或靠近扬声器时，将造成听感体验不佳。

发明内容

本公开的实施例旨在至少解决现有技术中存在的技术问题之一，提供一种头枕扬声器及其音频处理方法和系统、存储介质。

本公开的一个方面提供一种头枕扬声器音频处理方法，包括：

获取听众头部与头枕扬声器的相对位置数据；

根据所述相对位置数据，分别确定双耳渲染算法和串扰消除算法对应的第一头相关传输函数HRTF数据和第二头相关传输函数HRTF数据；

将所述第一HRTF数据和所述第二HRTF数据进行融合处理，得到初始融合HRTF数据；

对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，并利用所述目标融合HRTF数据对初始音频进行处理，得到目标音频；

通过所述头枕扬声器播放所述目标音频。

进一步地，所述串扰消除算法采用延迟和倒置信号；所述将所述第一HRTF数据和所述第二HRTF数据进行融合处理，得到初始融合HRTF数据，包括：

将所述延迟和倒置信号进行增益控制后与双耳渲染信号进行混合，得到所述初始融合HRTF数据。

进一步地，在得到所述初始融合HRTF数据之前，所述方法还包括：

对所述延迟和倒置信号进行分频段处理。

可选的，所述对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，包括：

若所述听众头部与所述头枕扬声器的距离小于预定阈值，则以所述第一HRTF数据为主得到目标融合HRTF数据；

若所述听众头部与所述头枕扬声器的距离大于所述预定阈值，则以所述第二HRTF数据为主得到目标融合HRTF数据。

进一步地，所述对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，包括：

根据所述听众头部与所述头枕扬声器的距离，分别对所述第一HRTF数据和所述第二HRTF数据的增益进行平滑动态调节。

可选的，在通过所述头枕扬声器播放所述目标音频之后，所述方法还包括：

获取反馈音频数据；

根据所述反馈音频数据校准所述第一HRTF数据、所述第二HRTF数据和所述阈值中的一项或多项。

可选的，所述获取听众头部与所述头枕扬声器的相对位置数据，包括：

获取听众头部与所述头枕扬声器的距离；

获取听众头部的高度和角度，基于所述距离以及所述听众头部的高度和角度确定所述听众的双耳与所述头枕扬声器的相对角度。

进一步地，所述获取听众头部与所述头枕扬声器的距离，包括：

通过距离传感器或压力传感器，获取听众头部与所述头枕扬声器的距离；和/或，

所述获取听众头部的高度和角度，包括：

通过视觉传感器，获取听众头部的高度和角度。

可选的，所述获取听众头部的高度和角度，包括：

根据预先建立的听众头部模型，获取听众头部的高度和角度。

本公开的另一方面提供一种头枕扬声器音频处理系统，包括：

获取模块，用于获取听众头部与头枕扬声器的相对位置数据；

HRTF数据模块，用于根据所述相对位置数据，分别确定双耳渲染算法和串扰消除算法对应的第一头相关传输函数HRTF数据和第二头相关传输函数HRTF数据；

融合模块，用于将所述第一HRTF数据和所述第二HRTF数据进行融合处理，得到初始融合HRTF数据；

音频生成模块，用于对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，并利用所述目标融合HRTF数据对初始音频进行处理，得到目标音频；

播放模块，用于通过所述头枕扬声器播放所述目标音频。

本公开的又一方面提供一种头枕扬声器，所述头枕扬声器采用上文所述的头枕扬声器音频处理方法；和/或，包括上文所述的头枕扬声器音频处理系统。

本公开的再一方面提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时能实现上文所述的头枕扬声器音频处理方法。

本公开实施例的一种头枕扬声器及其音频处理方法和系统、存储介质，通过融合双耳渲染算法和串扰消除算法对音频进行处理，并设计动态调整策略，可以确保在头枕扬声器上播放立体声双耳内容时，无论听众靠近还是远离头枕，都能获得良好的听感体验。

附图说明

图1为本公开一实施例的一种头枕扬声器音频处理方法的流程示意图；

图2为本公开另一实施例的反馈校准方法的流程示意图；

图3为本公开另一实施例的一种头枕扬声器音频处理系统的结构示意图。

具体实施方式

针对驾驶场景，“车载头枕扬声器”是指安装在汽车头枕中的音频设备，用于提供个性化的音频体验。具体的播放策略会根据车载娱乐系统的功能和设计而变化，以下是一些常见播放策略：

1.独立播放：每个头枕扬声器可以独立播放音频，这样乘客可以各自选择想听的音乐、有声书或者播客。这通常通过乘客的移动设备(如智能手机或平板电脑)通过蓝牙或Wi-Fi连接实现。

2.全车同步播放：所有头枕扬声器同时播放相同的音频，例如播放驾驶员或者某个乘客选择的音乐或者电台。

3.分区播放：车内分为几个“音频区”，每个区的扬声器播放不同的音频。例如，驾驶员和前排乘客可能听相同的音频，而后排乘客则可以选择另一种音频。

4.交互式播放：这是一种更为复杂的策略，可以根据乘客的偏好、乘车情况(如正在开车还是停车)、甚至乘客的情绪(通过面部识别或生物特征传感器等手段进行检测)来动态调整音频播放。

这些播放策略都是通过头枕扬声器直接播放立体声，当听众的头部或双耳不处于理想位置时，在听感体验上将会不佳。

串扰消除算法(CTC，Cross Talk Cancellation)可以用来提高立体声体验，让音乐听起来更丰富、更生动。结合双耳化(binaural)技术，可以创建一个更加沉浸的音频环境。为解决上述问题，通过结合CTC技术的双耳渲染算法录制音频，可以为乘客提供一种仿佛音源就在他们周围的感觉，并且根据头枕和听众的相对位置动态调整算法，可使听众在变换头部位置时依然可获得良好的收听体验，以实现在头枕扬声器上播放立体声双耳内容的最佳播放策略。

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开的一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应理解，虽然本公开中可能使用术语第一、第二、第三等来描述各种组件，但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此，下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本公开中所使用，术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

本领域技术人员可以理解，附图只是示例实施例的示意图，附图中的模块或流程并不一定是实施本公开所必须的，因此不能用于限制本公开的保护范围。

如图1所示，本公开的一个实施例提供一种头枕扬声器音频处理方法，包括：

步骤S1、获取听众头部与头枕扬声器的相对位置数据。

具体地，听众头部与头枕扬声器的相对位置数据包括听众头部与所述头枕扬声器的距离以及的听众的双耳与所述头枕扬声器的相对角度。通过距离传感器，如红外传感器、超声波传感器或激光传感器，来检测水平方向上听众头部与头枕扬声器的距离。以一种典型左右双喇叭的头枕扬声器为例，距离传感器可设置在两个喇叭中间，并向外探测。考虑到不同听众的身高差异，以及听众头部可能发生的偏移，距离传感器的探测范围可以由一点向外发散，或者设置多个距离传感器组成探测阵列，形成距离传感面，保证听众头部与头枕扬声器距离的可靠获取。

通过视觉传感器，如车内摄像头，获取听众头部的高度，进而得到垂直方向上听众头部与所述头枕扬声器的相对高度；针对车内听众随时可能变化的头部姿态，车内摄像头同时还需获取听众头部的角度，从而结合听众头部与所述头枕扬声器的距离和相对高度计算出听众的双耳各自与头枕扬声器的相对位置，进一步精确听众左右耳与头枕扬声器的相对角度。

在一些实施例中，听众头部与所述头枕扬声器的距离还可通过压力传感器获取。例如，将压力传感器(例如压电传感器)集成到头枕中，当听众的头部靠近或接触到头枕时，压力传感器会检测到压力变化，根据检测到的压力变化，可以判断听众是否靠近头枕；类似地，可以将压力传感器安装在座椅的坐垫或靠背上，以检测听众的体重分布变化，当听众靠近或远离头枕时，座椅上的压力分布会发生变化，根据这些变化可以推断出听众头部与头枕扬声器之间的距离。以上两种方式作为检测听众头部与头枕扬声器距离的补充方法，结合多种传感器技术，可提供更准确和稳定的距离测算。

另外，还可以根据预先建立的听众头部模型，获取听众头部的高度和角度。为单个听众进行个性化定制，提前收集其两耳间距或相对位置，甚至两耳内鼓膜的具体相对位置，以及其头部通常状态下的高度和角度，建立该听众的头部模型，用以替代预置的普适化头部模型进行接下来的音频处理过程，使听众获得更好的收听体验。

步骤S2、根据所述相对位置数据，分别确定双耳渲染算法和串扰消除算法对应的第一头相关传输函数HRTF数据和第二头相关传输函数HRTF数据。

具体地，双耳渲染算法和串扰消除算法都会根据听众头部与头枕扬声器的相对位置选用不同的HRTF(Head Related Transfer Functions，头相关传输函数)数据。

HRTF是用于模拟头部对声音的影响的一种函数。它是通过测量或计算头部和耳朵之间的声学特性得到的。通常，HRTF的测量是通过使用一个人工耳模或者真实人类的头部来进行的，在目前的一些研究中也使用数学模型和计算机模拟来预测头部和耳朵对声音的影响。这些方法可以基于头部几何形状和耳朵的解剖结构，以及声学特性的知识来计算预测HRTF。在测量过程中，使用一个多声道扬声器系统向耳朵发送不同的声音信号，然后通过耳朵处的微型麦克风阵列记录并分析接收到的声音，或是在模拟计算中完成，以获取头部对声音的影响信息。测量完成后，得到的数据通常以一组频率响应函数的形式呈现，这些频率响应函数表示特定方向上声音的变化，该种频率响应函数便被称为HRTF。对于不同的方向，HRTF可以提供该方向上声音的声音源定位和空间特性。无论是通过测量还是计算，HRTF均可以根据特定的方向来获取音频数据，并用于模拟头部影响，以增强3D音频体验或音源定位。

双耳渲染算法是一种通过模拟人耳接收和处理声音的方式来实现三维音效的算法。它使用音源的位置和HRTF等信息，通过计算两只耳朵接收到的音频信号差异来模拟声音在空间中的定位和分辨。实现双耳渲染算法所需的HRTF数据需要考虑声音传播的物理特性、人耳的解析能力以及人类对声音定位的感知机制等因素。

串扰消除算法是一种用于消除信号传输过程中的串扰(crosstalk)的技术。串扰是指在传输过程中，信号之间相互干扰导致接收到的信号出现失真或混叠的现象。在音频信号传输中，例如在音频设备或者扬声器系统中，由于音频信号传播的特性，可能会导致来自不同信号源的声音相互干扰，从而造成串扰。串扰消除算法的目标就是通过特定的信号处理方法，将串扰信号从接收到的信号中减弱或去除，以恢复原始信号的准确性和清晰度。串扰消除算法通常需要通过对信号进行分析和模型建立，来估计和提取出串扰信号的特征，然后将其与原始信号进行相位和功率补偿，以实现串扰的补偿和消除。常用的串扰消除算法包括自适应滤波器、空间混音矩阵等。在双喇叭的头枕扬声器中，其通过从另一个扬声器发送延迟和倒置的信号来消除来自扬声器到对侧耳朵的不需要的声音。

在步骤S1中通过各种传感器获取到精确的数据后，可以实时计算头枕扬声器和人耳的距离和相对角度，从而分别确定双耳渲染算法和串扰消除算法的HRTF数据。

步骤S3、将所述第一HRTF数据和所述第二HRTF数据进行融合处理，得到初始融合HRTF数据。

具体地，串扰消除算法采用延迟和倒置信号，根据串扰消除算法的原理可以将其作为双耳渲染算法的子模块，在双耳渲染中增加延迟和倒置功能，将延迟和倒置信号即第二HRTF数据，也即串扰消除算法对应的HRTF数据进行增益控制后，与双耳渲染的信号即第一HRTF数据，也即双耳渲染算法对应的HRTF数据进行混合。

同时延时和倒置信号需要进行分频段处理，分频操作可使用滤波器如linkwitz-riley滤波器、快速傅里叶变换(Fast Fourier Transform，FFT)等。将处理分为四个不同的频段：低频(<500Hz)，中低频(500Hz<f<1.5kHz)，中高频(1.5kHz<f<5kHz)和高频(>5kHz)。由于声音在低频部分是无方向的，所以对超低频和低频部分不做处理，高频部分则根据高频的特性做适当的处理，以保留更多高频细节并保持处理后的音质。通过对音频信号的声音增益、平衡、压缩、混响等，对中频部分(500Hz<f<5kHz)进行主要处理。分频段处理可以更精细地调整扬声器最后播放的音频，以实现更好的声音效果。

最后再结合听众双耳与头枕扬声器的距离和相对角度，确定一个增益值对串扰消除算法的HRTF数据进行增益并与双耳渲染的HRTF数据进行融合混音，保证串扰消除效果能够达到。具体融合步骤为：

1.对两个HRTF数据进行数据对齐。首先，需要确保两个HRTF数据集具有相同的采样率和数据点数。如果两个数据集的采样率和数据点数不匹配，可以使用插值或抽样等方法进行对齐；

2.对于每个频率点，对两个HRTF数据集的频率响应函数进行平均化处理。这可以通过将两个HRTF数据集的频率响应函数的振幅、相位等数据进行平均来实现；

3.对平均化后的HRTF数据进行标准化，以确保其频率响应函数在适当的范围内。常见的标准化方法包括将HRTF数据的最大值设置为1或将其总振幅归一化为1。

4.进行混合处理，将两个HRTF数据集通过简单的线性加权平均按照比例混合起来。混合的比例可以根据实际需求进行增益的调整，例如根据音源的位置距离等因素，以控制每个HRTF数据集在最终混合中的贡献程度。

步骤S4、对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，并利用所述目标融合HRTF数据对初始音频进行处理，得到目标音频。

具体地，经过上述步骤，听众头部与头枕扬声器初始的距离和相对角度已经反映于初始融合HRTF数据中，该听众的通常坐姿所决定的初始融合HRTF数据已确定。在一些使用场景如车辆行驶过程中，听众头部与头枕扬声器的相对位置变化主要为距离变化，即身体发生前倾或后仰的情况。实时测量听众头部与所述头枕扬声器的距离，并基于该距离对初始融合HRTF数据进行动态调整，得到用于处理音频的目标融合HRTF数据，具体可为：首先设置一个合适的距离阈值，若所述听众头部与所述头枕扬声器的距离小于该预定的阈值，则使第一HRTF数据的增益大于第二HRTF数据的增益，以所述第一HRTF数据为主得到目标融合HRTF数据，此时双耳渲染算法为主要算法；若所述听众头部与所述头枕扬声器的距离大于所述预定阈值，则使第二HRTF数据的增益大于第一HRTF数据的增益，以所述第二HRTF数据为主得到目标融合HRTF数据，此时串扰消除算法为主要算法。

为了避免在算法之间切换时产生突然的音频变化，可根据所述听众头部与所述头枕扬声器的距离，分别对所述第一HRTF数据和所述第二HRTF数据的增益进行平滑动态调节。在听众头部与头枕扬声器的距离发生改变时，对第一HRTF数据和第二HRTF数据的增益进行相对的增加和减少，具体为：当听众头部与头枕扬声器的距离逐渐增加时，第一HRTF数据的增益逐渐减小，第二HRTF数据的增益逐渐增大；反之，当听众头部与头枕扬声器的距离减小时，第一HRTF数据的增益增大，而第二HRTF数据的增益减小。该过程中，当听众头部与头枕扬声器的距离等于预定阈值时，第一HRTF数据和第二HRTF数据的增益相等。通过上述方法可实现两种算法之间的平滑过渡，使听众获得更加舒适的音频收听体验。

在经过上述过程得到实时的目标融合HRTF数据后，便可根据目标融合HRTF数据实时处理初始音频，即用户选择播放的音乐或电台的音频等，最终得到经过上述算法产生的目标音频。首先将头枕扬声器的位置作为音频源位置，上述听众的双耳与头枕扬声器的相对角度包括了方位角和俯仰角，音频源的位置便通过方位角和俯仰角表示；随后将音频源的位置与目标融合HRTF相对应的方向进行匹配，以确定声音的最终位置；最后将初始音频数据与HRTF数据进行卷积，得到用于扬声器播放的目标音频数据。应用了HRTF得到的音频将具有头部影响的特性，使听者能够感受到音源的空间位置、方向和深度，提升了音频的沉浸感和真实感。

步骤S5、通过所述头枕扬声器播放所述目标音频。

具体地，上述步骤中的初始音频以及得到的目标音频均为电信号，通过头枕扬声器将目标音频的电信号转换为声音信号进行播放。扬声器主要由电磁驱动单元和振膜组成，电信号首先可通过一个放大器，将低电压的音频信号放大成足够大的电流，放大后的电流再通过连接在扬声器的电磁驱动单元上的线圈，产生磁场，该磁场与电磁驱动单元内的永磁体相互作用。根据安培定律，当电磁体内的线圈受到电流时，它会受到一个反向的磁场力，驱动振膜振动，振膜的振动产生了空气中的压力波，也就是声音波，完成目标音频的播放。

本公开实施例的一种头枕扬声器音频处理方法，通过融合双耳渲染算法和串扰消除算法对音频进行处理，并设计动态调整策略，可以确保在头枕扬声器上播放立体声双耳内容时，无论听众靠近还是远离头枕，都能获得良好的听感体验。

示例性地，如图2所示，在通过所述头枕扬声器播放所述目标音频之后，所述方法还包括：

步骤S21、获取反馈音频数据；

步骤S22、根据所述反馈音频数据校准所述第一HRTF数据、所述第二HRTF数据和所述阈值中的一项或多项。

具体地，为了确保动态调整在实际应用中有效，可以使用反馈和校准机制来优化其性能。首先使用收音设备收集车内的音频响应，例如由测试人员在双耳处佩戴微型麦克风人工进行数据采集，或者使用车内其它位置的麦克风设备，获取头枕扬声器所播放声音的反馈音频数据。随后对获取的反馈音频数据进行分析，将其与预期达到的目标声音效果进行比较，对第一HRTF数据、第二HRTF数据或用于动态调整的距离阈值进行校准，以及调整平滑过渡的策略。

如图3所示，本公开的另一实施例提供一种头枕扬声器音频处理系统，包括：

获取模块301，用于获取听众头部与头枕扬声器的相对位置数据；

HRTF数据模块302，用于根据所述相对位置数据，分别确定双耳渲染算法和串扰消除算法对应的第一头相关传输函数HRTF数据和第二头相关传输函数HRTF数据；

融合模块303，用于将所述第一HRTF数据和所述第二HRTF数据进行融合处理，得到初始融合HRTF数据；

音频生成模块304，用于对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，并利用所述目标融合HRTF数据对初始音频进行处理，得到目标音频；

播放模块305，用于通过所述头枕扬声器播放所述目标音频。

本实施例的头枕扬声器音频处理系统用于实现上一实施例所述的头枕扬声器音频处理方法，具体实现过程已在上一实施例中说明，本文在此不作赘述。

本公开实施例的一种头枕扬声器音频处理系统，通过融合双耳渲染算法和串扰消除算法对音频进行处理，并设计动态调整策略，可以确保在头枕扬声器上播放立体声双耳内容时，无论听众靠近还是远离头枕，都能获得良好的听感体验。

本公开的又一实施例提供一种头枕扬声器，所述头枕扬声器采用上文所述的头枕扬声器音频处理方法；和/或，上文所述的头枕扬声器音频处理系统。

本公开实施例的一种头枕扬声器，通过内置上文实施例的一种头枕扬声器音频处理系统，或者采用上文实施例的一种头枕扬声器音频处理方法进行音频处理，可以确保在头枕扬声器上播放立体声双耳内容时，无论听众靠近还是远离头枕，都能获得良好的听感体验。

本公开的再一实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时能实现上文所述的头枕扬声器音频处理方法。

其中，计算机可读存储介质可以是本公开的系统、电子设备中所包含的，也可以单独存在。

计算机可读存储介质可是任何包含或存储程序的有形介质，其可以是电、磁、光、电磁、红外线、半导体的系统、装置、设备，更具体的例子包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、光纤、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件，或它们任意合适的组合。

计算机可读存储介质也可包括在基带中或作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码，其具体的例子包括但不限于电磁信号、光信号，或它们任意合适的组合。

可以理解的是，以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式，然而本公开并不局限于此。对于本领域内的普通技术人员而言，在不脱离本公开的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本公开的保护范围。

Claims

1.一种头枕扬声器音频处理方法，其特征在于，所述方法包括：

获取听众头部与头枕扬声器的相对位置数据；

通过所述头枕扬声器播放所述目标音频。

2.根据权利要求1所述的方法，其特征在于，所述串扰消除算法采用延迟和倒置信号；所述将所述第一HRTF数据和所述第二HRTF数据进行融合处理，得到初始融合HRTF数据，包括：

3.根据权利要求2所述的方法，其特征在于，在得到所述初始融合HRTF数据之前，所述方法还包括：

对所述延迟和倒置信号进行分频段处理。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，包括：

5.根据权利要求4所述的方法，其特征在于，所述对所述初始融合HRTF数据基于所述相对位置数据进行动态调整得到目标融合HRTF数据，包括：

6.根据权利要求4所述的方法，其特征在于，在通过所述头枕扬声器播放所述目标音频之后，所述方法还包括：

获取反馈音频数据；

7.根据权利要求1至3任一项所述的方法，其特征在于，所述获取听众头部与所述头枕扬声器的相对位置数据，包括：

获取听众头部与所述头枕扬声器的距离；

8.根据权利要求7所述的方法，其特征在于，所述获取听众头部与所述头枕扬声器的距离，包括：

所述获取听众头部的高度和角度，包括：

通过视觉传感器，获取听众头部的高度和角度。

9.根据权利要求7所述的方法，其特征在于，所述获取听众头部的高度和角度，包括：

10.一种头枕扬声器音频处理系统，其特征在于，包括：

播放模块，用于通过所述头枕扬声器播放所述目标音频。

11.一种头枕扬声器，其特征在于，所述头枕扬声器采用权利要求1至9任一项所述的头枕扬声器音频处理方法；和/或，包括权利要求10所述的头枕扬声器音频处理系统。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时能实现权利要求1至9任一项所述的头枕扬声器音频处理方法。