CN116634348A - 头戴式可穿戴装置、音频信息的处理方法及存储介质 - Google Patents

头戴式可穿戴装置、音频信息的处理方法及存储介质 Download PDF

Info

Publication number
CN116634348A
CN116634348A CN202310580078.4A CN202310580078A CN116634348A CN 116634348 A CN116634348 A CN 116634348A CN 202310580078 A CN202310580078 A CN 202310580078A CN 116634348 A CN116634348 A CN 116634348A
Authority
CN
China
Prior art keywords
pose
channel
filter
audio information
fir filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310580078.4A
Other languages
English (en)
Inventor
童伟峰
黎骅
张大庆
张亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heng Xuan Technology Beijing Co ltd
Original Assignee
Heng Xuan Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heng Xuan Technology Beijing Co ltd filed Critical Heng Xuan Technology Beijing Co ltd
Priority to CN202310580078.4A priority Critical patent/CN116634348A/zh
Publication of CN116634348A publication Critical patent/CN116634348A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

本申请提供了头戴式可穿戴装置、音频信息的处理方法及存储介质。头戴式可穿戴装置包括位姿测量单元、WIFI通信单元、处理单元和左右耳扬声器。位姿测量单元被配置为测得头戴式可穿戴装置在参考时刻的第一位姿以及当前时刻的第二位姿。WIFI通信单元被配置为获取来自智能设备的多声道PCM音频信息。处理单元被配置为基于多声道PCM音频信息的多声道的设置、第一位姿和第二位姿,适配多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器;基于多声道PCM音频信息,利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,转换为两声道PCM音频信息。如此,在用户位姿发生变化时,可降低音频调整的时延,提高用户体验。

Description

头戴式可穿戴装置、音频信息的处理方法及存储介质
技术领域
本申请涉及音频处理技术领域,具体涉及头戴式可穿戴装置、音频信息的处理方法及存储介质。
背景技术
随着AR/VR市场的渐渐兴起,用户对于处于虚拟世界的体验具有更高的要求。例如,用户佩戴着AR眼镜以及耳机,可以畅游于虚拟世界中。获取用户的头部姿势并利用头部相关传递函数(HRTF)为虚拟世界的用户模拟3D环境中声音的声学交互(例如,自然声波传播、衰减和/或交互)。
以头戴式耳机为例,检测头戴式耳机的位姿,并把位姿信息传送给手机等智能设备,由手机等智能设备基于头戴式耳机位姿的变化,调整3D音频,并把调整后的音频发送给头戴式耳机并进行播放。然而,当用户的位姿有变化时,比如用户进行较大幅度的移动、转动,手机等智能设备先获取用户位姿信息,再据此将调整后的音频发送给头戴式耳机需要较大的时延,并且,其中耳机将位姿信息传送给手机等智能设备也将增加耗时,这都将导致3D音频的调整出现较大时延,实时性较差,引起用户听觉不适,用户体验较差。
发明内容
针对现有技术中存在的上述技术问题,提出了本申请。本申请旨在提供头戴式可穿戴装置、音频信息的处理方法及存储介质,其能够直接将多声道音频信息转换为两声道音频信息,减少调整音频信息的时延,提高音频信息转换的实时性,从而提高用户佩戴头戴式可穿戴装置的音频体验。
根据本申请的第一方案,提供一种头戴式可穿戴装置,包括位姿测量单元、WIFI通信单元、处理单元和左右耳扬声器。所述位姿测量单元,其配置为:测得所述头戴式可穿戴装置在参考时刻的第一位姿以及当前时刻的第二位姿;WIFI通信单元,其配置为:获取来自智能设备的多声道PCM音频信息;处理单元,其配置为:基于所述多声道PCM音频信息的多声道的设置、所述第一位姿和所述第二位姿,适配所调用的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器,其中,所述左耳FIR滤波器表征从各个声道的音频源到左耳的当前声音空间感知属性,所述右耳FIR滤波器表征从各个声道的音频源到右耳的当前声音空间感知属性;基于所述多声道PCM音频信息,利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,转换为两声道PCM音频信息;以及左右耳扬声器,其配置为分别播放所述两声道PCM音频信息。
根据本申请的第二方案,提供一种音频信息的处理方法,包括获取头戴式可穿戴装置在参考时刻的第一位姿以及当前时刻的第二位姿;获取来自智能设备的多声道PCM音频信息;基于所述多声道PCM音频信息的多声道的设置、所述第一位姿和所述第二位姿,适配所调用的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器,其中,所述左耳FIR滤波器表征从各个声道的音频源到左耳的当前声音空间感知属性,所述右耳FIR滤波器表征从各个声道的音频源到右耳的当前声音空间感知属性;基于所述多声道PCM音频信息,利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,转换为两声道PCM音频信息。
根据本申请的第三方案,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序指令在被处理器运行时使得所述处理器执行本申请各个实施例所述的音频信息的处理方法。
与现有技术相比,本申请实施例的有益效果在于:
本申请实施例提供的头戴式可穿戴装置基于WIFI通信单元获取来自智能设备的多声道PCM音频信息,WIFI无线通信具有更高的无线传输能力,传输吞吐量较高,适用于头戴式可穿戴装置和智能设备之间的PCM音频信息的传送,具有较低的传输时延。从智能设备接收的PCM音频信息,无需经过音频解码,可以直接被转换为两声道PCM音频信息,减少了音频调整的时延。该头戴式可穿戴装置能够基于多声道PCM音频信息的多声道的设置、第一位姿和第二位姿,适配多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器,并利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,将多声道PCM音频信息直接转换为两声道PCM音频信息,从整体上大大减少了音频信息转换的时延。如此,该头戴式可穿戴装置能够在用户移动或者头部转动时,及时地对3D音频信息进行调整,以保证音频信息地空间特性和方向性,从而提高用户佩戴该头戴式可穿戴装置进行游戏或者畅游于虚拟世界时的音频体验。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述说明和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的类似附图标记可以表示相似组件的不同示例。附图通过举例而不是以限制的方式大体上示出各种实施例,并且与说明书以及权利要求书一起用于对所公开的实施例进行说明。这样的实施例是说明性和示例性的,而并非旨在作为本方法、装置、系统或具有用于实现该方法的指令的非暂时性计算机可读介质的穷尽或排他的实施例。
图1示出根据本申请实施例所述的头戴式可穿戴装置的结构示意图。
图2示出根据本申请实施例所述的适配多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器的示意图。
图3示出根据本申请实施例所述的适配多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器的又一示意图。
图4示出根据本申请实施例所述的不同滤波器组之间进行切换的流程图。
图5示出根据本申请实施例所述的音频信息的处理方法的流程图。
具体实施方式
为使本领域技术人员更好的理解本申请的技术方案,下面结合附图和具体实施方式对本申请作详细说明。下面结合附图和具体实施例对本申请的实施例作进一步详细描述,但不作为对本申请的限定。
本申请中使用的“第一”、“第二”、“第三”、“第四”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分。本申请中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其他要素的可能。在本申请中,各个步骤在图中所示的箭头仅仅作为执行顺序的示例,而不是限制,本申请的技术方案并不限于实施例中描述的执行顺序,执行顺序中的各个步骤可以合并执行,可以分解执行,可以调换顺序,只要不影响执行内容的逻辑关系即可。
本申请使用的所有术语(包括技术术语或者科学术语)与本申请所属领域的普通技术人员理解的含义相同,除非另外特别定义。还应当理解,在诸如通用字典中定义的术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
根据本申请实施例提供一种头戴式可穿戴装置,该头戴式可穿戴装置例如可以包括处理单元。其中,处理单元用于执行根据本申请各个实施例的音频信息的处理方法中对应的步骤。
图1示出根据本申请实施例所述的头戴式可穿戴装置的结构示意图。其中,所述头戴式可穿戴装置100至少包括位姿测量单元101、WIFI通信单元102、处理单元103和左右耳扬声器104。具体地,所述头戴式可穿戴装置100可以是虚拟现实(VirtualReality,VR)头戴式设备、增强现实(AugmentedReality,AR)头戴式设备、混合现实(MixReality,MR)、头戴式无线耳机、骨传导无线耳机以及分体式无线耳机等,在此不做限定。所述头戴式可穿戴装置100还可以是耳机或者智能眼镜与耳机的组合装置,所述组合装置可以是智能眼镜和耳机各自独立且配合使用,也可以是将智能眼镜与耳机集成而成的装置,对此不做具体限定。
具体地,所述位姿测量单元101被配置为测得所述头戴式可穿戴装置100在参考时刻的第一位姿以及当前时刻的第二位姿。在一些实施例中,所述位姿测量单元101包括但不限于惯性测量单元(Inertial Measurement Unit,IMU)和/或同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)。
例如,可以由IMU确定所述头戴式可穿戴装置100的位姿,位姿包括方位和仰角。IMU可以是陀螺仪和/或加速度计等传感器元件,可以用以检测加速度、速度、角速度,从而确定位姿、位置等。
以头戴式可穿戴装置100为智能眼镜与耳机的组合装置为例,该组合装置中的图像传感器、显示器设置在智能眼镜部件中,扬声器设置在耳机部件中,智能眼镜部件和耳机部件通过有线或无线方式连接。基于所述图像传感器可以采集在不同时刻的图像,然后利用SLAM技术确定出所述组合装置的位姿。当然,也可以利用IMU辅助SLAM,从而更好地对所述头戴式可穿戴装置100的位姿进行确定。仅以此为示例,不够成对具体方案的限定。
所述WIFI通信单元102被配置为获取来自智能设备的多声道PCM(Pulse CodeModulation,脉冲编码调制)音频信息。其中,所述智能设备可以包括手机、pad、电脑、wifi接入点、可穿戴智能设备等终端,对此不做限定。在该实施例中,利用WIFI通信单元102,头戴式可穿戴装置100从智能设备接收音频信息,相对于蓝牙等其他无线通信单元,WIFI传输能力很强,传输吞吐率较高。如此,WIFI通信单元102能够适应头戴式可穿戴装置100与智能设备之间多个通道PCM音频信息的传送,而且具有较低的传输时延。
在该实施例中,从智能设备接收的是PCM音频信息,因此不需要经过音频解码,可以直接被转换为左右声道音频。因此,减少了处理音频信息的时间,降低了时延,提高了用户体验。尤其在用户玩游戏时,响应于用户指令或动作的音频,由于传送的是PCM音频信息,无需消耗时间用于压缩、解压等过程,降低了处理音频信息的时间,提高了音频信息响应于用户指令或动作的实时性,提升了用户的游戏体验。
所述处理单元103被配置为基于所述多声道PCM音频信息的多声道的设置、所述第一位姿和所述第二位姿,适配所调用的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器。其中,所述头戴式可穿戴装置100不同的位姿信息适配于不同的FIR滤波器。例如,在该实施例中,可以根据当前时刻的第二位姿相对于参考时刻的第一位姿的变化来确定头戴式可穿戴装置100在当前时刻的方位和/或仰角,根据当前时刻的方位和/或仰角,适配所调用的左耳FIR滤波器和右耳FIR滤波器。
具体地,可以通过硬件或者软件的方式实现FIR滤波器的功能。例如,可以在头戴式可穿戴装置100中设置硬件模块(比如包括乘法器和累加器)和存储器。可以为各个声道(例如各个空间方位)的音频源,预先测试确定各种第二位姿、或者第二位置相对于第一位姿的各种变化情况下合适的左耳FIR滤波器系数和右耳FIR滤波器系数,并预先存储到存储器中。然后,根据多声道的设置以及当前时刻的头戴式可穿戴装置100的位姿,调用相应的硬件模块与FIR滤波器系数,以实现滤波处理,从而实现对各个声道的音频源的FIR滤波器的适配。
或者,利用处理器来根据多声道的设置以及当前时刻的头戴式可穿戴装置100的位姿调整FIR滤波器系数,并基于当前时刻的FIR滤波器系数执行FIR滤波器处理。
所述处理单元103可以基于处理器来实现,处理器可以是包括诸如微处理器、中央处理单元(CPU)、图形处理单元(GPU)等一个或更多个通用处理设备的处理设备。更具体地,处理器可以是复杂指令集运算(CISC)微处理器、精简指令集运算(RISC)微处理器、超长指令字(VLIW)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。处理器还可以是诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、片上系统(SoC)等一个或更多个专用处理设备。
其中,所述左耳FIR滤波器表征从各个声道的音频源到左耳的当前声音空间感知属性,所述右耳FIR滤波器表征从各个声道的音频源到右耳的当前声音空间感知属性。所述当前声音空间感知属性可以理解为各个声道的音频源通过FIR滤波器在用户双耳道耳机上播放可以还原来自各个声道的音频所对应空间的各个方位的声音,基于空间各个方位到双耳的FIR滤波器,可以还原来自各个空间方位的声音。所述多声道PCM音频信息可以根据HRTF(Head Related Transfer Function,头相关变换函数)模型由多声道PCM音频信息转换为两声道PCM音频信息。或者,可以在存储器中预先存储与各个方位的声源对应的FIR滤波器系数,然后将多声道PCM音频信息转换为两声道PCM音频信息的过程中,直接由处理单元103调用对应的FIR滤波器系数即可,对此不做具体限定。
所述处理单元103进一步被配置为基于所述多声道PCM音频信息,利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,转换为两声道PCM音频信息。例如,常见的5.1声道音频包括2个前置声道、1个中置声道、2个环绕声道、1个低音声道。相对于头戴式可穿戴装置100的参考时刻的第一位姿,2个前置声道可以一个左前侧,另一个在右前侧;1个中置声道可以在正前方,2个环绕声道可以在左右侧稍靠后方位,而低音声道的位置可以灵活一些,比如可以放在后方。再比如常见的7.1声道,相对于5.1声道,又增加了两个环绕声道,分别在左后、右后方位。因此,根据多声道PCM音频信息,其各个通道相对于头戴式可穿戴装置100的参考时刻的第一位姿的方位或位置,以及当前时刻的第二位姿,可以确定出各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器的组。在一些实施例中,各个声道的音频信息各自经过左耳FIR滤波器的组、右耳FIR滤波器的组进行滤波处理,将滤波处理后的音频信息进行混音处理后输出到DAC模块,最后输出到左右耳扬声器104,以实现多声道PCM音频信息到两声道音频信息的转换。所述左右耳扬声器104被配置为分别播放所述两声道PCM音频信息。
如此,可以降低从多声道音频转换为两声道音频的时延,使得头戴式可穿戴装置100能够针对用户位姿的变化及时进行3D音频信息的调整,从而有利于提高基于位姿变化处理音频信息的实时性,以提高用户的使用体验,避免出现在使用过程中出现声音卡顿或者声音的空间感变差等问题。同时,对于通过指令或者动作来进行3D游戏的用户而言,时延的减少,也减少了响应用户指令或动作的音频信息的产生到播放于双耳的时间间隔,从而减少了这段时间内用户左右耳的位姿变化,从而提高了音频的空间特性和方向性,提高了用户音频体验。
为便于理解,本申请的各个实施例均以头戴式可穿戴装置100为耳机为例进行说明,但不限于此。
在本申请的一些实施例中,所述处理单元103进一步配置为对所述第一位姿和第二位姿进行分析,在所述第二位姿相较于所述第一位姿发生变化的情况下,适配在所述当前时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数,并基于所述左耳FIR滤波系数和右耳FIR滤波来执行所述左耳FIR滤波器和右耳FIR滤波器的滤波处理。具体地,在第二位姿相较于第一位姿发生变化的情况下,就对音频信息进行调整。例如,多个声道中的某个声道,其第一位姿的方位角和仰角都是0度,在第二位姿相对于第一位姿的方位角变化+1度,仰角变化+2度的情况下,则处理单元103适配当前时刻的该声道在方位角为+1度、仰角为+2度时的左耳FIR滤波系数和右耳FIR滤波系数,来执行左耳FIR滤波器和右耳FIR滤波器的滤波处理。也就是说,可以根据各个声道的各自的方位信息,以及第一位姿、第二位姿来确定各个声道的FIR滤波器。处理单元103实时分析第二位姿相较于第一位姿的变化情况,只要第二位姿不同于第一位姿即对音频信息进行调整。
如图2所示,左耳FIR滤波器用FIR1表示,左耳FIR滤波器的组包括FIR11、FIR12……FIR1N,右耳FIR滤波器用FIR2表示,右耳FIR滤波器的组包括FIR21、FIR22……FIR2N,其中,省略号表示部分未示出。以用户佩戴耳机为例,用户转动头部等动作会使得耳机在当前时刻的第二位姿相较于在参考时刻的第一位姿发生变化,此时,处理单元103适配音频通道1的左耳FIR滤波系数来执行FIR11的滤波处理,适配音频通道2的左耳FIR滤波系数来执行FIR12的滤波处理,适配音频通道N的左耳FIR滤波系数来执行FIR1N的滤波处理。来自不同音频通道的声源,按照其各自的方位,根据位姿的变化来适配相应的FIR滤波器系数。各个音频通道的音频信息经过左耳FIR滤波器的组的滤波处理输入到第一混音器201进行混音,再将混音后的音频信息输出到第一DAC 203,转换为左耳PCM音频信息。同理,处理单元103适配音频通道1的右耳FIR滤波系数来执行FIR21的滤波处理,适配音频通道2的右耳FIR滤波系数来执行FIR22的滤波处理,适配音频通道N的右耳FIR滤波系数来执行FIR1N的滤波处理,各个音频通道的音频信息经过右耳FIR滤波器的组的滤波处理输入到第二混音器202进行混音,再将混音后的音频信息输出到第二DAC 204,转换为右耳PCM音频信息。仅以此作为示例性说明,不构成对本申请请求保护的技术方案的具体限定。
在本申请的一些实施例中,所述左耳FIR滤波器的组包括第一滤波器组和第三滤波器组,所述右耳FIR滤波器的组包括第二滤波器组和第四滤波器组。如图3所示,第一滤波器组A包括FIR11、FIR12……FIR1N,第三滤波器组B包括FIR31、FIR32……FIR3N,第二滤波器组C包括FIR21、FIR22……FIR2N,第四滤波器组D包括FIR41、FIR42……FIR4N。
所述位姿测量单元101进一步配置为测得所述头戴式可穿戴装置100在相对于当前时刻的下一时刻的第三位姿。注意,“下一时刻”可以根据需要来设置,例如如果需要更高的空间感知灵敏度,则可以将下一时刻与当前时刻的时间间隔设得低一些,反之亦然。
如图4,所述处理单元103进一步配置为执行步骤S401-S403。在步骤S401,基于所述第一位姿和所述第三位姿,获取在所述下一时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数。例如,在下一时刻的第三位姿相较于当前时刻的第二位姿发生变化时,基于所述第一位姿和所述第三位姿,适配与各个声道的音频源对应的左耳FIR滤波系数和右耳FIR滤波系数。
在步骤S402,在所述下一时刻的各个声道的左耳FIR滤波系数相较于在当前时刻的各个声道的左耳FIR滤波系数发生变化的情况下,实现所述第一滤波器组和第三滤波器组之间的切换。在步骤S403,在所述下一时刻的各个声道的右耳FIR滤波系数相较于在当前时刻的各个声道的右耳FIR滤波系数发生变化的情况下,实现所述第二滤波器组和第四滤波器组之间的切换。具体地,通过分析各个声道的左耳FIR滤波器系数和右耳FIR滤波系数,如果在下一时刻的左耳FIR滤波系数、右耳FIR滤波系数相较于在当前时刻的左耳FIR滤波系数、右耳FIR滤波系数发生变化,则需要将在当前时刻的左耳FIR滤波器系数、右耳FIR滤波系数更新为下一时刻的左耳FIR滤波器系数、右耳FIR滤波系数,即处理单元103执行第一滤波器组和第三滤波器组之间、第二滤波器组和第四滤波器组之间的切换。
在本申请的一些实施例中,所述处理单元103进一步配置为在所述第一滤波器组和第三滤波器组之间以及第二滤波器组和第四滤波器组之间进行切换的预设时间段内,对分别经由所述第一滤波器组和第三滤波器组输出的音频信息,按照各自对应的权重进行加权求和,以得到左耳音频信息。如图3,假设耳机在当前时刻的音频通道1、音频通道2……音频通道N的适配的是第一滤波器组A,经过预设时间段,更新为第三滤波器组B。此时,音频通道1、音频通道2……音频通道N的各个音频源经过第一滤波器组A进行滤波处理后进入到第一混音器301进行混音,并输出第一音频信息;同时,各个音频源经过第三滤波器组B进行滤波处理后进入到第三混音器303进行混音,并输出第二音频信息。第一音频信息与当前时刻的第一滤波器组A的权重Alpha的乘积与第二音频信息与下一时刻的第三滤波器组B的权重(1-Alpha)的乘积相加后进入到第五混音器305进行混音处理,并将混音处理的结果经过第一DAC 307进行处理后得到左耳音频信息。
进一步地,对分别经由所述第二滤波器组C和第四滤波器组D输出的音频信息,按照各自对应的权重进行加权求和,以得到右耳音频信息。
在一些实施例中,当前时刻的滤波器组的权重在所述预设时间段内由1减少为0,并且为单调减少。其中,当前时刻的滤波器组指的是切换之前使用的FIR滤波器组,经过预定时间段后,切换为另一FIR滤波器组。具体地,如图3,以左耳为例,当前时刻的滤波器组可以是第一滤波器组A(或第三滤波器组B),切换为下一时刻的第三滤波器组B(或第一滤波器组A)。
与左耳音频信息的获取方式相似,假设右耳在当前时刻的音频通道1、音频通道2……音频通道N的适配的是第二滤波器组C,经过预设时间段,更新为第四滤波器组D。此时,音频通道1、音频通道2……音频通道N的各个音频源经过第二滤波器组C进行滤波处理后进入到第二混音器302进行混音,并输出第三音频信息;同时,各个音频源经过第四滤波器组D进行滤波处理后进入到第四混音器304进行混音,并输出第四音频信息。第三音频信息与当前时刻的第二滤波器组C的权重Alpha的乘积与第四音频信息与下一时刻的第四滤波器组D的权重(1-Alpha)的乘积相加后进行到第六混音器306进行混音处理,并将混音处理的结果经过第二DAC 308进行处理后得到右耳音频信息。
当用户以及头戴式可穿戴装置100转动或走动,为了保持音频原有的3D空间效果,需要进行第一滤波器组A和第三滤波器组B之间以及第二滤波器组C和第四滤波器组D之间的切换。在切换的过程中,伴随着当前时刻的滤波器组的权重在所述预设时间段内由1减少为0,从而实现不同滤波器组之间缓慢的切换,如此,可以使切换过程音频输出的变化平缓,不产生“啪啪”声干扰,也使音频的3D空间效果变化更平缓和自然。
在本申请的一些实施例中,所述处理单元103进一步配置为对所述第二位姿和第三位姿进行分析,以得到所述第三位姿相较于所述第二位姿的偏差,在所述偏差大于阈值的情况下,执行第一滤波器组和第三滤波器组、第二滤波器组和第四滤波器组之间的切换。其中,所述偏差可以理解为第三位姿与第二位姿的差值,比如耳机在下一时刻的方位角与在当前时刻的方位角或仰角的差值。如果该偏差较小,说明用户的头部仅仅进行了微小的移动或转动,这种轻微的位姿的变化不会影响整体的音频效果。在所述偏差大于阈值的情况,说明用户的头部产生了明显的动作,需要对滤波器进行调整,如此,能够减少频繁的音频信息的调整带来的功耗的增加。
在本申请的一些实施例中,所述参考时刻为所述头戴式可穿戴装置100进行音频播放的初始时刻或用户设置的预定时刻。在所述参考时刻为用户设置的预定时刻的情况下,所述处理单元103被进一步配置为接收用户对所述预定时刻的设置,例如,用户可以通过按键,手势、语音等方式对参考时刻进行人工设置。此外,用户在开始欣赏音乐或音频时,或者是打开音频播放时,可以把该时刻确定为参考时刻,可以记录下此时头戴式可穿戴装置100的位姿。用户也可以通过按键,手势、语音等交互,在任意时刻指定预定时刻,头戴式可穿戴装置100可以记录下此预定时刻头戴式可穿戴装置100的位姿。
在本申请的一些实施例中,所述位姿测量单元101进一步配置为将所述第一位姿和所述第二位姿发送至所述智能设备,所述处理单元103进一步配置为获取所述智能设备基于所述多声道的设置、所述第一位姿和所述第二位姿,所适配的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器的配置参数。具体地,由头戴式可穿戴装置100把位姿信息传送给智能设备,由智能设备得到左耳FIR滤波器和右耳FIR滤波器的配置参数,并通过无线方式传送给头戴式可穿戴装置100。如此,大大减少了需要存储在头戴式可穿戴装置100中的滤波器系数或滤波器组。同时,对于一组左耳FIR滤波器和右耳FIR滤波器的配置参数而言,数据量较小,由智能设备传送给头戴式可穿戴装置100的时延也较小,因此对用户3D音频体验影响较小。
图5示出了一种音频信息的处理方法,在步骤S501,获取头戴式可穿戴装置在参考时刻的第一位姿以及当前时刻的第二位姿。在步骤S502,获取来自智能设备的多声道PCM音频信息。在步骤S503,基于所述多声道PCM音频信息的多声道的设置、所述第一位姿和所述第二位姿,适配所调用的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器,其中,所述左耳FIR滤波器表征从各个声道的音频源到左耳的当前声音空间感知属性,所述右耳FIR滤波器表征从各个声道的音频源到右耳的当前声音空间感知属性。在步骤S504,基于所述多声道PCM音频信息,利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,转换为两声道PCM音频信息。如此,该头戴式可穿戴装置能够在用户移动或者头部转动时,及时地对3D音频信息进行调整,以保证音频信息地空间特性和方向性,从而提高用户佩戴该头戴式可穿戴装置进行游戏或者畅游于虚拟世界时的音频体验。
在本申请的一些实施例中,对所述第一位姿和第二位姿进行分析,在所述第二位姿相较于所述第一位姿发生变化的情况下,适配所调用的在所述当前时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数,并基于所述左耳FIR滤波系数和右耳FIR滤波系数,来执行所述左耳FIR滤波器和右耳FIR滤波器的滤波处理。
在本申请的一些实施例中,所述左耳FIR滤波器的组包括第一滤波器组和第三滤波器组,所述右耳FIR滤波器的组包括第二滤波器组和第四滤波器组。所述处理方法进一步包括获取所述头戴式可穿戴装置在相对于当前时刻的下一时刻的第三位姿;基于所述第一位姿和所述第三位姿,适配在所述下一时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数;在所述下一时刻的各个声道的左耳FIR滤波系数相较于在当前时刻的各个声道的左耳FIR滤波系数发生变化的情况下,实现所述第一滤波器组和第三滤波器组之间的切换;在所述下一时刻的各个声道的右耳FIR滤波系数相较于在当前时刻的各个声道的右耳FIR滤波系数发生变化的情况下,实现所述第二滤波器组和第四滤波器组之间的切换。
在所述第一滤波器组和第三滤波器组之间以及第二滤波器组和第四滤波器组之间进行切换的预设时间段内,对分别经由所述第一滤波器组和第三滤波器组输出的音频信息,按照各自对应的权重进行加权求和,以得到左耳音频信息;对分别经由所述第二滤波器组和第四滤波器组输出的音频信息,按照各自对应的权重进行加权求和,以得到右耳音频信息;其中,当前时刻的滤波器组的权重在所述预设时间段内由1减少为0。在切换的过程中,伴随着当前时刻的滤波器组的权重在所述预设时间段内由1减少为0,从而实现不同滤波器组之间缓慢的切换,如此,可以使切换过程音频输出的变化平缓,不产生“啪啪”声干扰,也使音频的3D空间效果变化更平缓和自然。
本申请中涉及的第一、第二、第三、第四以及各种数字编号仅为描述方便进行的区分,并不用来限制本申请的范围。
应理解,本申请术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block,简称ILB)和步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (14)

1.一种头戴式可穿戴装置,其特征在于,包括:
位姿测量单元,其配置为:测得所述头戴式可穿戴装置在参考时刻的第一位姿以及当前时刻的第二位姿;
WIFI通信单元,其配置为:获取来自智能设备的多声道PCM音频信息;
处理单元,其配置为:
基于所述多声道PCM音频信息的多声道的设置、所述第一位姿和所述第二位姿,适配所调用的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器,其中,所述左耳FIR滤波器表征从各个声道的音频源到左耳的当前声音空间感知属性,所述右耳FIR滤波器表征从各个声道的音频源到右耳的当前声音空间感知属性;
基于所述多声道PCM音频信息,利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,转换为两声道PCM音频信息;以及
左右耳扬声器,其配置为分别播放所述两声道PCM音频信息。
2.根据权利要求1所述的头戴式可穿戴装置,其特征在于,所述处理单元进一步配置为:
对所述第一位姿和第二位姿进行分析,在所述第二位姿相较于所述第一位姿发生变化的情况下,适配在所述当前时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数,并基于所述左耳FIR滤波系数和右耳FIR滤波来执行所述左耳FIR滤波器和右耳FIR滤波器的滤波处理。
3.根据权利要求1所述的头戴式可穿戴装置,其特征在于,所述左耳FIR滤波器的组包括第一滤波器组和第三滤波器组,所述右耳FIR滤波器的组包括第二滤波器组和第四滤波器组;
所述位姿测量单元进一步配置为:测得所述头戴式可穿戴装置在相对于当前时刻的下一时刻的第三位姿;
所述处理单元进一步配置为:
基于所述第一位姿和所述第三位姿,适配在所述下一时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数;
在所述下一时刻的各个声道的左耳FIR滤波系数相较于在当前时刻的各个声道的左耳FIR滤波系数发生变化的情况下,实现所述第一滤波器组和第三滤波器组之间的切换;
在所述下一时刻的各个声道的右耳FIR滤波系数相较于在当前时刻的各个声道的右耳FIR滤波系数发生变化的情况下,实现所述第二滤波器组和第四滤波器组之间的切换。
4.根据权利要求3所述的头戴式可穿戴装置,其特征在于,所述处理单元进一步配置为:
在所述第一滤波器组和第三滤波器组之间以及第二滤波器组和第四滤波器组之间进行切换的预设时间段内,
对分别经由所述第一滤波器组和第三滤波器组输出的音频信息,按照各自对应的权重进行加权求和,以得到左耳音频信息;
对分别经由所述第二滤波器组和第四滤波器组输出的音频信息,按照各自对应的权重进行加权求和,以得到右耳音频信息;
其中,当前时刻的滤波器组的权重在所述预设时间段内由1减少为0。
5.根据权利要求3所述的头戴式可穿戴装置,其特征在于,所述处理单元进一步配置为:对所述第二位姿和第三位姿进行分析,以得到所述第三位姿相较于所述第二位姿的偏差,在所述偏差大于阈值的情况下,执行第一滤波器组和第三滤波器组、第二滤波器组和第四滤波器组之间的切换。
6.根据权利要求1所述的头戴式可穿戴装置,其特征在于,所述参考时刻为所述头戴式可穿戴装置进行音频播放的初始时刻或用户设置的预定时刻;在所述参考时刻为用户设置的预定时刻的情况下,所述处理单元被进一步配置为:接收用户对所述预定时刻的设置。
7.根据权利要求1所述的头戴式可穿戴装置,其特征在于,所述位姿测量单元为惯性测量单元和/或同步定位与地图构建。
8.根据权利要求1所述的头戴式可穿戴装置,其特征在于,所述位姿测量单元进一步配置为:将所述第一位姿和所述第二位姿发送至所述智能设备;
所述处理单元进一步配置为:
获取所述智能设备基于所述多声道的设置、所述第一位姿和所述第二位姿,所适配的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器的配置参数。
9.根据权利要求1所述的头戴式可穿戴装置,其特征在于,所述头戴式可穿戴装置为智能眼镜、耳机或智能眼镜与耳机的组合装置。
10.一种音频信息的处理方法,其特征在于,包括:
获取头戴式可穿戴装置在参考时刻的第一位姿以及当前时刻的第二位姿;
获取来自智能设备的多声道PCM音频信息;
基于所述多声道PCM音频信息的多声道的设置、所述第一位姿和所述第二位姿,适配所调用的所述多声道中各个声道的音频源的左耳FIR滤波器和右耳FIR滤波器,其中,所述左耳FIR滤波器表征从各个声道的音频源到左耳的当前声音空间感知属性,所述右耳FIR滤波器表征从各个声道的音频源到右耳的当前声音空间感知属性;
基于所述多声道PCM音频信息,利用各个声道的左耳FIR滤波器和右耳FIR滤波器的组,转换为两声道PCM音频信息。
11.根据权利要求10所述的处理方法,其特征在于,对所述第一位姿和第二位姿进行分析,在所述第二位姿相较于所述第一位姿发生变化的情况下,适配所调用的在所述当前时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数,并基于所述左耳FIR滤波系数和右耳FIR滤波系数,来执行所述左耳FIR滤波器和右耳FIR滤波器的滤波处理。
12.根据权利要求10所述的处理方法,其特征在于,所述左耳FIR滤波器的组包括第一滤波器组和第三滤波器组,所述右耳FIR滤波器的组包括第二滤波器组和第四滤波器组;
所述处理方法进一步包括:
获取所述头戴式可穿戴装置在相对于当前时刻的下一时刻的第三位姿;
基于所述第一位姿和所述第三位姿,获取在所述下一时刻的各个声道的左耳FIR滤波系数和右耳FIR滤波系数;
在所述下一时刻的各个声道的左耳FIR滤波系数相较于在当前时刻的各个声道的左耳FIR滤波系数发生变化的情况下,实现所述第一滤波器组和第三滤波器组之间的切换;
在所述下一时刻的各个声道的右耳FIR滤波系数相较于在当前时刻的各个声道的右耳FIR滤波系数发生变化的情况下,实现所述第二滤波器组和第四滤波器组之间的切换。
13.根据权利要求12所述的处理方法,其特征在于,在所述第一滤波器组和第三滤波器组之间以及第二滤波器组和第四滤波器组之间进行切换的预设时间段内,
对分别经由所述第一滤波器组和第三滤波器组输出的音频信息,按照各自对应的权重进行加权求和,以得到左耳音频信息;
对分别经由所述第二滤波器组和第四滤波器组输出的音频信息,按照各自对应的权重进行加权求和,以得到右耳音频信息;
其中,当前时刻的滤波器组的权重在所述预设时间段内由1减少为0。
14.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求10-13任一项所述的音频信息的处理方法。
CN202310580078.4A 2023-05-22 2023-05-22 头戴式可穿戴装置、音频信息的处理方法及存储介质 Pending CN116634348A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310580078.4A CN116634348A (zh) 2023-05-22 2023-05-22 头戴式可穿戴装置、音频信息的处理方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310580078.4A CN116634348A (zh) 2023-05-22 2023-05-22 头戴式可穿戴装置、音频信息的处理方法及存储介质

Publications (1)

Publication Number Publication Date
CN116634348A true CN116634348A (zh) 2023-08-22

Family

ID=87596735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310580078.4A Pending CN116634348A (zh) 2023-05-22 2023-05-22 头戴式可穿戴装置、音频信息的处理方法及存储介质

Country Status (1)

Country Link
CN (1) CN116634348A (zh)

Similar Documents

Publication Publication Date Title
JP5882964B2 (ja) カメラによるオーディオ空間化
US11429340B2 (en) Audio capture and rendering for extended reality experiences
US20230156403A1 (en) Audio processing method, apparatus, system, and storage medium
EP4175320A1 (en) Audio processing method and apparatus, wireless earphone, and storage medium
CN108346432B (zh) 虚拟现实vr音频的处理方法及相应设备
KR20230075532A (ko) 오디오 신호 처리 방법 및 장치
CN112599144B (zh) 音频数据处理方法、音频数据处理装置、介质与电子设备
CN114727212A (zh) 音频的处理方法及电子设备
US11678111B1 (en) Deep-learning based beam forming synthesis for spatial audio
CN107249166A (zh) 一种完全沉浸式的耳机立体声实现方法及系统
CN116709159B (zh) 音频处理方法及终端设备
CN116634348A (zh) 头戴式可穿戴装置、音频信息的处理方法及存储介质
WO2022227921A1 (zh) 音频处理方法、装置、无线耳机及计算机可读介质
CN113115175A (zh) 3d音效处理方法及相关产品
CN115696172A (zh) 声像校准方法和装置
CN111107481B (zh) 一种音频渲染方法及装置
US10764684B1 (en) Binaural audio using an arbitrarily shaped microphone array
CN112770228A (zh) 音频播放方法、装置、音频播放设备、电子设备及介质
CN111930339A (zh) 设备控制方法、装置、存储介质及电子设备
WO2024011937A1 (zh) 音频处理方法、系统及电子设备
WO2024040527A1 (en) Spatial audio using a single audio device
WO2023197646A1 (zh) 一种音频信号处理方法及电子设备
WO2022151336A1 (en) Techniques for around-the-ear transducers
US20230089225A1 (en) Audio rendering method and apparatus
CN117676002A (zh) 音频处理方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination