CN114374907A - 声音播放方法、装置、音频播放设备及介质 - Google Patents

声音播放方法、装置、音频播放设备及介质 Download PDF

Info

Publication number
CN114374907A
CN114374907A CN202111643387.9A CN202111643387A CN114374907A CN 114374907 A CN114374907 A CN 114374907A CN 202111643387 A CN202111643387 A CN 202111643387A CN 114374907 A CN114374907 A CN 114374907A
Authority
CN
China
Prior art keywords
frequency response
response curve
sound
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111643387.9A
Other languages
English (en)
Inventor
周岭松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd, Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN202111643387.9A priority Critical patent/CN114374907A/zh
Publication of CN114374907A publication Critical patent/CN114374907A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本公开是关于一种声音播放方法、装置、音频播放设备及介质。声音播放方法包括:获取环境音和耳道内声音;根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,其中,所述第一频响曲线为所述环境音对应的频响曲线,所述第二频响曲线为所述耳道内声音对应的频响曲线;控制所述通透滤波器按照所述目标通透系数对所述环境音进行滤波,得到目标声音;播放所述目标声音。通过本公开公开的方案,能够使用户听到的声音与外界实际声音相符。

Description

声音播放方法、装置、音频播放设备及介质
技术领域
本公开涉及音频处理技术领域,尤其涉及一种声音播放方法、装置、音频播放设备及介质。
背景技术
耳机等音频播放设备作为一种音讯播放器,接收来自媒体播放器或接收器所发出的电讯号,利用贴近耳朵的扬声器将其转化成可以被人听到的音波。
在某些情况下,当用户佩戴耳机时,用户可能关注外界的声音,例如,和其他人的对话声、交通工具的报站声、过马路时的汽车鸣笛声等等。此时,需要将耳机切换到通透模式以听到外界环境音。在通透模式下,用户无需摘下耳机,也可以像没有佩戴耳机一样感知外界环境音。
相关技术中,在通透模式下,会利用通透滤波器对外界环境音进行滤波,然后,利用耳机的扬声器播放经过滤波的声音。然而,目前的通透模式下播放的声音有时会出现和真实环境音不符合的情况。
发明内容
为克服相关技术中存在的问题,本公开提供一种声音播放方法、装置、音频播放设备及介质。
根据本公开实施例的第一方面,提供一种声音播放方法,应用于音频播放设备,所述方法包括:
获取环境音和耳道内声音;根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,其中,所述第一频响曲线为所述环境音对应的频响曲线,所述第二频响曲线为所述耳道内声音对应的频响曲线;控制所述通透滤波器按照所述目标通透系数对所述环境音进行滤波,得到目标声音;播放所述目标声音。
在一些实施例中,所述根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,包括:
确定所述第一频响曲线中的在预设频段范围内的幅值的第一平均幅值;确定所述第二频响曲线中的在所述预设频段范围内的幅值的第二平均幅值;根据所述第一平均幅值和所述第二平均幅值,从所述通透滤波器对应的至少两个通透系数中,确定所述目标通透系数。
在一些实施例中,所述根据所述第一平均幅值和所述第二平均幅值,从所述通透滤波器对应的至少两个通透系数中,确定所述目标通透系数,包括:
确定所述第二平均幅值与所述第一平均幅值之间的幅值差值;将所述至少两个通透系数中匹配第三平均幅值对应的通透系数,确定为所述目标通透系数,其中,所述第三平均幅值与所述幅值差值之间的差值小于预设阈值。
在一些实施例中,所述通透滤波器对应的所述至少两个通透系数采用如下方式确定:
根据第三频响曲线和第四频响曲线,确定待补偿的频响曲线,所述第三频响曲线为在消声室环境下人工头未佩戴所述音频播放设备时采集的环境音对应的频响曲线,所述第四频响曲线为在所述消声室环境下所述人工头佩戴所述音频播放设备时采集的环境音被动降噪后的频响曲线;根据所述待补偿的频响曲线,确定目标频响曲线;根据所述目标频响曲线,确定所述通透滤波器对应的所述至少两个通透系数。
在一些实施例中,根据所述目标频响曲线,确定所述通透滤波器对应的所述至少两个通透系数,包括:
确定所述目标频响曲线的在预设频段范围内的第四平均幅值;以设定的采样间隔,在大于所述第四平均幅值的范围内,以及小于所述第四平均幅值的范围内分别进行幅值的等数量采样,得到预设数量的幅值;按照所述预设数量,以所述目标频响曲线的通透系数为基准,分别调整所述通透滤波器的通透系数,使所述通透滤波器滤波输出声音的频响曲线的平均幅值,为所述预设数量幅值中的幅值。
在一些实施例中,根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,包括:
获取所述音频播放设备播放的原始声音;根据所述原始声音,确定所述原始声音在耳道内产生的回声;在所述耳道内声音中消除所述回声,并得到消除回声后的第二频响曲线;根据第一频响曲线以及回声消除后的第二频响曲线,确定通透滤波器对应的目标通透系数。
根据本公开实施例第二方面,提供一种声音播放装置,所述装置包括:
获取模块,用于获取环境音和耳道内声音;控制模块,用于根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,其中,所述第一频响曲线为所述环境音对应的频响曲线,所述第二频响曲线为所述耳道内声音对应的频响曲线,并控制所述通透滤波器按照所述目标通透系数对所述环境音进行滤波,得到目标声音;播放模块,用于播放所述目标声音。
在一些实施例中,所述控制模块用于采用如下方式根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数:
确定所述第一频响曲线中的在预设频段范围内的幅值的第一平均幅值;确定所述第二频响曲线中的在所述预设频段范围内的幅值的第二平均幅值;根据所述第一平均幅值和所述第二平均幅值,从所述通透滤波器对应的至少两个通透系数中,确定所述目标通透系数。
在一些实施例中,所述控制模块用于采用如下方式根据所述第一平均幅值和所述第二平均幅值,从所述通透滤波器对应的至少两个通透系数中,确定所述目标通透系数,包括:
确定所述第二平均幅值与所述第一平均幅值之间的幅值差值;将所述至少两个通透系数中匹配第三平均幅值对应的通透系数,确定为所述目标通透系数,其中,所述第三平均幅值与所述幅值差值之间的差值小于预设阈值。
在一些实施例中,所述控制模块用于采用如下方式确定通透滤波器对应的所述至少两个通透系数:
根据第三频响曲线和第四频响曲线,确定待补偿的频响曲线,所述第三频响曲线为在消声室环境下人工头未佩戴所述音频播放设备时采集的环境音对应的频响曲线,所述第四频响曲线为在所述消声室环境下所述人工头佩戴所述音频播放设备时采集的环境音被动降噪后的频响曲线;根据所述待补偿的频响曲线,确定目标频响曲线;根据所述目标频响曲线,确定所述通透滤波器对应的所述至少两个通透系数。
在一些实施例中,所述控制模块用于采用如下方式根据所述目标频响曲线,确定所述通透滤波器对应的所述至少两个通透系数:
确定所述目标频响曲线的在预设频段范围内的第四平均幅值;以设定的采样间隔,在大于所述第四平均幅值的范围内,以及小于所述第四平均幅值的范围内分别进行幅值的等数量采样,得到预设数量的幅值;按照所述预设数量,以所述目标频响曲线的通透系数为基准,分别调整所述通透滤波器的通透系数,使所述通透滤波器滤波输出声音的频响曲线的平均幅值,为所述预设数量幅值中的幅值。
在一些实施例中,所述控制模块用于采用如下方式根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数:
获取所述音频播放设备播放的原始声音;根据所述原始声音,确定所述原始声音在耳道内产生的回声;在所述耳道内声音中消除所述回声,并得到消除回声后的第二频响曲线;根据第一频响曲线以及回声消除后的第二频响曲线,确定通透滤波器对应的目标通透系数。
根据本公开实施例第三方面,提供一种音频播放设备,所述音频播放设备包括通透滤波器和控制器,所述控制器包括:处理器和用于存储处理器可执行指令的存储器,其中,所述处理器被配置为:执行前述任意一些实施例所述的声音播放方法。
根据本公开实施例第四方面,提供一种存储介质,所述存储介质中存储有指令,当所述存储介质中的指令由音频播放设备的处理器执行时,使得音频播放设备能够执行前述任意一些实施例所述的声音播放方法。
本公开的实施例提供的技术方案可以包括以下有益效果:通过获取环境音和耳道内声音,根据环境音对应的第一频响曲线和耳道内声音对应的第二频响曲线,确定通透滤波器对应的目标通透系数,并根据目标通透系数对环境音进行滤波,得到目标声音,播放目标声音,使得用户听到的声音能够与环境音相符。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据本公开一示例性实施例中示出的一种声音播放方法的流程示意图。
图2是根据本公开一示例性实施例中示出的一种确定耳机中回声的过程示意图。
图3是根据本公开一示例性实施例中示出的一种频响曲线A与频响曲线B的曲线示意图。
图4是根据本公开一示例性实施例中示出的一种频响曲线C与频响曲线D的曲线示意图。
图5是根据本公开一示例性实施例中示出的一种声音播放装置的框图。
图6是根据本公开一示例性实施例中示出的一种用于声音播放的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开提供的声音播放方法可以应用于音频播放设备,该音频播放设备例如可以是头戴式音频播放设备,例如可以是耳机。本公开中以下有时以音频播放设备为耳机为例进行说明。本领域技术人员应理解,也可以是其他具有相同功能的音频播放设备,并不局限于耳机。
本公开中的声音播放方法可以应用于真无线(true wireless stereo,TWS)耳机的音频处理场景。其中,TWS耳机可以在通透模式下,实现环境音的通透传输。其中,通透模式可以理解为是一种环境声处理技术,当用户佩戴耳机时,可以像没有戴耳机一样的感知外界环境音。一种场景中,当用户戴着耳机,要与其他人进行对话,可以不用摘下耳机,切换到通透模式,则等同于摘下耳机的效果,实现与对方的清晰对话。TWS耳机的迅速普及,使得用户的使用频次和使用时长都在上升。环境音的通透传输也在朝着越来越准确和自然的听感方向研究。
然而,目前通透模式是通过耳机上的前馈麦克风采集环境音,并经通透滤波器滤波后,用耳机上的喇叭播放出来,叠加泄露进来的环境音实现的。然而,目前用户在不同的佩戴方式下,会出现用户听到的通透声音与外界实际环境音不符。例如,用户佩戴耳机较松,外界环境音通过耳机边缘大量泄漏到耳道内,此时,通过耳机边缘大量泄漏到耳道内的外界环境音与通过耳机的扬声器播放经过通透滤波器对外界环境音进行滤波的声音进行叠加后的声音(即用户听到的声音)会高于外界实际声音。在例如,用户佩戴耳机较紧,外界环境音通过耳机边缘泄漏到耳道内的声音会较少,此时,通过泄漏到耳道内的外界环境音与通过耳机的扬声器播放经过通透滤波器对外界环境音进行滤波的声音进行叠加后的声音(即用户听到的声音)会低于外界实际声音。
本公开实施例提供一种声音播放方法,在该方法中音频播放设备采集外界环境音以及耳道内声音,并基于环境音和耳道内声音,确定通透滤波器的滤波器系数,使得通透滤波器可以基于该确定的滤波器系数进行匹配环境音和耳道内声音的滤波,并播放滤波后的目标声音,使得用户听到的声音能够与环境音相符。
图1是根据本公开一示例性实施例提供的声音播放方法的流程示意图。如图1所示,该声音播放方法应用于音频播放设备,例如可以是耳机,声音播放方法可以包括如下步骤。
在步骤S11中,获取环境音和耳道内声音。
在步骤S12中,根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数。
其中,第一频响曲线为环境音对应的频响曲线,第二频响曲线为耳道内声音对应的频响曲线。
在步骤S13中,控制通透滤波器按照目标通透系数对环境音进行滤波,得到目标声音。
在步骤S14中,播放目标声音。
可以理解的是,用户听到的声音为播放的目标声音和从耳机边缘泄露到耳道内的环境音的叠加。
在本公开实施例的一些实施例中,音频播放设备,例如可以是耳机,可以利用耳机的前馈麦克风采集环境音。
在本公开实施例的一些实施例中,音频播放设备,例如可以是耳机,可以利用耳机的反馈麦克风采集耳道内声音。
在本公开实施例的一些实施例中,根据采集到的环境音以及耳道内声音可以确定用户实际听到的声音与外界实际环境音之间的差量,进而可以对该差量进行补偿,以使用户实际听到的声音与外界实际环境音相符。
在本公开实施例的一些实施例中,当获取到环境音后,可以计算环境音对应的频响曲线(即本公开实施例中的第一频响曲线)。当获取到耳道内声音后,可以计算耳道内声音对应的频响曲线(即本公开实施例中的第二频响曲线)。根据第一频响曲线和第二频响曲线,确定待补偿的声音差量,进而确定能够补偿该声音差量的通透滤波器系数(即本公开实施例中的通透系数)。
在本公开实施例中,通过获取环境音和耳道内声音,根据环境音对应的第一频响曲线和耳道内声音对应的第二频响曲线,确定通透滤波器对应的目标通透系数。根据目标通透系数对环境音进行滤波,得到目标声音,播放目标声音,使得用户听到的声音能够与环境音相符。
通常用户佩戴耳机时,会通过耳机播放声音,例如,播放电影声音,播放音乐声音,播放通话声音等。本公开中将耳机播放的声音称为耳机播放的原始声音。在耳机播放原始声音的情况下,耳道内的声音包含3部分:1)泄露进来的声音;2)通透滤波器输出的声音;3)用户播放的原始声音。故,为了更精准的确定用户实际听到的声音与外界实际环境音之间的差量,可以在采集到的耳道内声音中消除耳机播放的原始声音。
基于此,在本公开实施例的一些实施例中,在S12之前,本公开实施例提供的声音播放方法还可以包括:获取音频播放设备播放的原始声音;根据原始声音,确定原始声音在耳道内对应的回声,在耳道内声音中消除该原始声音的回声。根据采集到的环境音以及消除原始声音回声后的耳道内声音,可以确定用户实际听到的声音与外界实际环境音之间的差量,进而可以对该差量进行补偿,以使用户实际听到的声音与外界实际环境音相符。
在本公开实施例的一些实施例中,根据原始声音,确定原始声音在耳道内对应的回声,可以包括:根据原始声音和自适应回声抵消滤波器,确定原始声音在耳道内对应的回声。
在本公开实施例的一些实施例中,自适应回声抵消滤波器可以为基于最小均方(Least Mean Square,LSM)算法的自适应回声抵消滤波器、基于归一化最小均方(Normalized Least Mean Square,NLSM)算法的自适应回声抵消滤波器、基于频域的自适应滤波器(Frequency Domain Adaptive Filter,FDAF)、基于回声回波损耗增强的自适应滤波器(Echo Return Loss Enhancement,ERLE)。
在本公开实施例中,采用基于LSM算法的自适应回声抵消滤波器。
其中,根据原始声音和自适应回声抵消滤波器确定原始声音在耳道内对应的回声实际上是估计一个近似的回声路径来逼近真实回声路径(在本公开实施例中为耳道),进而得到回声。
根据原始声音和自适应回声抵消滤波器,确定原始声音在耳道内对应的回声的过程如图2所示。
图2是本公开实施例提供的确定回声的过程示意图。
在图2中,将原始声音x(n)分别输入自适应回声抵消滤波器和回声路径,得到估计的回身信号y(n)和期望信号y(n)’,将回身信号y(n)与期望信号y(n)’相减得到误差信号e(n)=y(n)-y(n)’。误差信号e(n)越小,自适应回声抵消滤波器估计的回声路径就越接近实际的回声路径(耳道)。将误差信号e(n)小于预设值时,自适应回声抵消滤波器估计的回身信号y(n)作为原始声音在耳道内对应的回声。
一种实施方式中,本公开中可以计算原始声音的回声对应的频响曲线,并根据耳道内声音对应的初始频响曲线(第二频响曲线),得到消除回声后的第二频响曲线。根据第一频响曲线以及回声消除后的第二频响曲线,确定通透滤波器对应的目标通透系数。
在本公开实施例的一些实施例中,在根据第二频响曲线和回声对应的频响曲线,生成消除回声后的第二频响曲线时,可以针对任一频率,耳道内声音对应该频率的响度与回声对应该频率的响度进行相减,得到一个响度,然后,将对应各个频率得到的响度进行相连,得到消除回声后的第二频响曲线。
可以理解的是,本公开实施例并不对计算声音对应的频响曲线所采用的方式进行限定,任何可用的计算声音对应的频响曲线的方式均可以应用于本公开实施例中。
在本公开实施例的一些实施例中,根据第一频响曲线和第二频响曲线,确定待补偿的声音差量时,可以根据频响曲线预设频段范围内的平均幅值来确定。
本公开实施例中,相对传统技术,音频播放设备中预先存储有通透滤波器的多个通透系数(至少两个通透系数)。其中,通透滤波器基于不同的通透系数对环境音进行滤波后输出不同的目标声音。
在本公开实施例的一些实施例中,根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数时可以采用如下方式:确定第一频响曲线中的在预设频段范围内的幅值的第一平均幅值;确定第二频响曲线中的在预设频段范围内的幅值的第二平均幅值;根据第一平均幅值和第二平均幅值,从通透滤波器对应的至少两个通透系数中,确定目标通透系数。
本公开实施例并不对预设频段范围进行限定。在实际应用中,预设频段范围可以根据实际需求进行设置。例如,预设频段范围为1千赫兹(KHz)到5KHz。
在本公开实施例的一些实施例中,在确定频响曲线中的在预设频段范围内的幅值的平均幅值时,可以将频响曲线中的在预设频段范围内的各个幅值进行相加,然后求取平均数,得到频响曲线中的在预设频段范围内的幅值的平均幅值。
本公开实施例中涉及的目标通透系数为能够补偿根据第一频响曲线和第二频响曲线确定的待补偿声音差量的通透滤波器的滤波器系数。
在本公开实施例的一些实施例中,根据第一平均幅值和第二平均幅值,从通透滤波器对应的至少两个通透系数中,确定目标通透系数,可以包括:确定第二平均幅值与第一平均幅值之间的幅值差值;将至少两个通透系数中匹配第三平均幅值对应的通透系数,确定为目标通透系数。其中,第三平均幅值与幅值差值之间的差值小于预设阈值。换言之,本公开中将至少两个通透系数中第三平均幅值对应的通透系数,确定为目标通透系数,其中,第三平均幅值为比通透滤波器当前的通透系数对应的平均幅值小幅值差值的幅值。
示例性地,通透滤波器的通透系数与平均幅值的对应关系如表1所示。
表1
通透系数 平均幅值(单位:dB)
X0 25
X1 30
X2 35
假设通透滤波器当前的通透系数为X1,通透滤波器当前的通透系数对应的平均幅值为30dB。第二平均幅值与第一平均幅值的差值为5dB。则将比30dB小5dB的25dB对应的通透系数X0,确定为目标通透系数。
再假设通透滤波器当前的通透系数为X1,通透滤波器当前的通透系数对应的平均幅值为30dB。第二平均幅值与第一平均幅值的差值为-5dB。则将比30dB小-5dB(即比30dB大5dB)的35dB对应的通透系数X2,确定为目标通透系数。
在本公开实施例的一些实施例中,音频播放设备中预先存储的通透滤波器的多个通透系数可以是在音频播放设备投入使用之前在消音室进行测试得到的,即通透滤波器的多个通透系数可以理解为是出厂设置值。
本公开中,可以在消声室环境下,基于人工头佩戴以及未佩戴音频播放设备时,分别确定相应的频响曲线,并基于该频响曲线确定待补偿的频响曲线,并基于频响曲线确定目标曲线,基于该目标曲线确定通透滤波器对应的至少两个通透系数。
本公开中将消声室环境下人工头未佩戴所述音频播放设备时采集的环境音对应的频响曲线,称为第三曲线。将在消声室环境下所述人工头佩戴所述音频播放设备时采集的环境音被动降噪后的频响曲线,称为第四曲线。
在本公开实施例的一些实施例中,根据第三频响曲线和第四频响曲线,确定待补偿的频响曲线;根据所述待补偿的频响曲线,确定目标频响曲线;根据目标频响曲线,确定通透滤波器对应的所述至少两个通透系数。
具体地,可以在消音室环境下,在用户未佩戴耳机时,利用耳机的前馈麦克风采集环境音,计算消音室环境下环境音对应的频响曲线A(第三频响曲线);然后,在用户佩戴耳机时,利用耳机的反馈麦克风采集耳道内声音,计算消音室环境下耳道内声音对应的频响曲线B(第四频响曲线)。图3示出了本公开一示例性实施例中示出的频响曲线A和频响曲线B的曲线示意图。本公开中,通过对比频响曲线A和频响曲线B,得到被动降噪曲线,也即本公开中待补偿的频响曲线,以下称为频响曲线C。
在本公开实施例的一些实施例中,可以调整耳机中组成通透滤波器的多个无限脉冲响应(Infinite Impulse Response,IIR)滤波器的频率、增益、品质因数(Q值)等,通透滤波器输出一个曲线,将该曲线与待补偿的频响曲线(频响曲线C)进行比较,如果该曲线与待补偿的频响曲线(频响曲线C)的差异比上一次差异小,则以当前的频率、增益、Q值等为基准,继续调整频率、增益、Q值等。依次类推,多次迭代,直至通透滤波器输出的曲线与待补偿的频响曲线(频响曲线C)的差异稳定。将此时通透滤波器输出的曲线作为目标频响曲线,以下可以用频响曲线D表示。图4示出了本公开一示例性实施例中示出的频响曲线C和频响曲线D的曲线示意图。本公开中,可以将滤波输出的声音对应频响曲线为频响曲线D时多个IIR滤波器的频率、增益、Q值等作为通透滤波器的一个通透系数,且该通透系数与目标频响曲线对应,也可以理解为是该通透系数与目标频响曲线的平均幅值对应。
本公开中根据目标频响曲线,确定通透滤波器对应的至少两个通透系数时,可以采用如下方式确定:
确定目标频响曲线的在预设频段范围内的第四平均幅值;以设定的采样间隔,在大于第四平均幅值的范围内,以及小于第四平均幅值的范围内分别进行幅值的等数量采样,得到预设数量的幅值;按照预设数量,以目标频响曲线的通透系数为基准,分别调整通透滤波器的通透系数,使通透滤波器滤波输出声音的频响曲线的平均幅值,为预设数量幅值中的幅值。
一示例中,针对比目标频响曲线的平均幅值大XdB的频响曲线对应的通透系数,可以调整多个IIR滤波器的频率、增益、Q值等,直至通透滤波器输出的曲线的平均幅值比目标频响曲线的平均幅值大XdB,将此时多个IIR滤波器的频率、增益、Q值等作为通透滤波器的一个通透系数,且该通透系数与比目标频响曲线的平均幅值大XdB的频响曲线对应,即该通透系数与比目标频响曲线的平均幅值大XdB的平均幅值对应。
其中,X为正值,也可以为负值,例如,X取值分别为1、2、3、4、5、-1、-2、-3、-4和-5。再例如,X取值为0.5、1、1.5、2、2.5、-0.5、-1、-1.5、-2和-2.5。
本公开实施例并不对X的取值进行限定,在实际应用中,X取值可以根据实际需求进行设置。例如,本公开中可以依据频响曲线D,设计10组通透滤波器系数,其中D1、D2、D3、D4和D5的平均幅度小于D的幅度1dB、2dB、3dB、4dB和5dB,D6、D7、D8、D9和D10的平均幅度大于D的幅度1dB、2dB、3dB、4dB和5dB。
当确定出通透滤波器对应的至少两个通透系数后,可以将至少两个通透系数与频响曲线的平均幅值的对应关系存储在音频播放设备的闪存中。当确定通透滤波器对应的目标通透系数时,可以根据存储在音频播放设备的闪存中的至少两个通透系数与频响曲线的平均幅值的对应关系,确定目标通透系数,进而根据该目标通透系数,对多个IIR滤波器的频率、增益、Q值等进行调整,使得音频播放设备的扬声器播放的经过通透滤波器滤波的声音与通过耳机边缘泄漏到耳道内的外部环境音叠加后的声音与外部环境音相符。
需要说明的是,在消音室环境下,进行通透滤波器的通透系数确定时,音频播放设备的扬声器未播放除通透滤波器对环境音进行滤波得到的声音之外的其他任何声音。
进一步需要说明的是,基于声音计算相关频响曲线的过程,可参考相关技术中确定频响曲线的过程,本公开实施例在此不对其进行赘述。
下面结合具体的实例对本公开实施例提供的声音播放方法进行说明。
对于某一品牌某一型号的耳机,首先,在消音室环境下,在人工头未佩戴该耳机对应的样机时,利用该样机的前馈麦克风采集环境音,计算消音室环境下环境音对应的频响曲线;然后,在人工头佩戴该样机时,利用该样机的反馈麦克风采集耳道内声音,计算消音室环境下耳道内声音对应的频响曲线。对比两个频响曲线,得到待补偿的频响曲线。
然后,调整该样机中组成通透滤波器的多个IIR滤波器的频率、增益、Q值等,通透滤波器输出一个曲线,将该曲线与待补偿的频响曲线进行比较,如果该曲线与待补偿的频响曲线的差异比上一次差异小,则以当前的频率、增益、Q值等为基准,继续调整频率、增益、Q值等。依次类推,多次迭代,直至通透滤波器输出的曲线与待补偿的频响曲线的差异稳定。将此时通透滤波器输出的曲线作为目标频响曲线,将此时多个IIR滤波器的频率、增益、Q值等作为通透滤波器的一个通透系数,且该通透系数与目标频响曲线对应,即该通透系数与目标频响曲线的平均幅值对应。
针对比目标频响曲线的平均幅值大XdB的频响曲线对应的通透系数,可以调整多个IIR滤波器的频率、增益、Q值等,直至通透滤波器输出的曲线的平均幅值比目标频响曲线的平均幅值大XdB,将此时多个IIR滤波器的频率、增益、Q值等作为通透滤波器的一个通透系数,且该通透系数与比目标频响曲线的平均幅值大XdB的频响曲线对应,即该通透系数与比目标频响曲线的平均幅值大XdB的平均幅值对应。
将上述至少两个通透系数与频响曲线的平均幅值的对应关系存储在需要售卖的与该样机对应的耳机的闪存中。
当用户购买与该样机对应的耳机后,将该耳机切换到通透模式时,该耳机的前馈麦克风采集环境音,该耳机的反馈麦克风采集耳道内声音。然后计算环境音对应的第一频响曲线以及耳道内声音对应的第二频响曲线。其中,若用户在听音乐时将该耳机切换到通透模式,则利用基于LSM算法的自适应回声抵消滤波器确定上述音乐在耳道内的回声,然后,将第二频响曲线与上述音乐在耳道内的回声对应的频响曲线做差,得到去除回声的耳道内声音对应的第二频响曲线。
计算在预设频段范围内的第二频响曲线与第一频响曲线的幅值的平均值的幅值差值,从该耳机的闪存中获取上述至少两个通透系数与频响曲线的平均幅值的对应关系,然后,将至少两个通透系数中比通透滤波器当前的通透系数对应的平均幅值小计算所得到的幅值差值的平均幅值对应的通透系数,确定为目标通透系数。
根据该目标通透系数,对多个IIR滤波器的频率、增益、Q值等进行调整,使得耳机的扬声器播放的经过通透滤波器滤波的声音与通过耳机边缘泄漏到耳道内的外部环境音叠加后的声音与外部环境音相符。
基于相同的构思,本公开实施例还提供一种声音播放装置。
可以理解的是,本公开实施例提供的声音播放装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤,本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本公开实施例的技术方案的范围。
图5是根据一示例性实施例示出的一种声音播放装置的框图。参照图5,该装置100包括获取模块101、控制模块102以及播放模块103。
获取模块101,用于获取环境音和耳道内声音。控制模块102,用于根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,其中,第一频响曲线为环境音对应的频响曲线,第二频响曲线为耳道内声音对应的频响曲线,并控制通透滤波器按照目标通透系数对环境音进行滤波,得到目标声音。播放模块103,用于播放目标声音。
在一些实施例中,控制模块102用于采用如下方式根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数:
确定第一频响曲线中的在预设频段范围内的幅值的第一平均幅值。确定第二频响曲线中的在预设频段范围内的幅值的第二平均幅值。根据第一平均幅值和第二平均幅值,从通透滤波器对应的至少两个通透系数中,确定目标通透系数。
在一些实施例中,控制模块102用于采用如下方式根据第一平均幅值和第二平均幅值,从通透滤波器对应的至少两个通透系数中,确定目标通透系数,包括:
确定第二平均幅值与第一平均幅值之间的幅值差值。将至少两个通透系数中匹配第三平均幅值对应的通透系数,确定为目标通透系数,其中,第三平均幅值与幅值差值之间的差值小于预设阈值。
在一些实施例中,控制模块102用于采用如下方式确定通透滤波器对应的至少两个通透系数:
根据第三频响曲线和第四频响曲线,确定待补偿的频响曲线,第三频响曲线为在消声室环境下人工头未佩戴音频播放设备时采集的环境音对应的频响曲线,第四频响曲线为在消声室环境下人工头佩戴音频播放设备时采集的环境音被动降噪后的频响曲线。根据待补偿的频响曲线,确定目标频响曲线。根据目标频响曲线,确定通透滤波器对应的至少两个通透系数。
在一些实施例中,控制模块102用于采用如下方式根据目标频响曲线,确定通透滤波器对应的至少两个通透系数:
确定目标频响曲线的在预设频段范围内的第四平均幅值。以设定的采样间隔,在大于第四平均幅值的范围内,以及小于第四平均幅值的范围内分别进行幅值的等数量采样,得到预设数量的幅值。按照预设数量,以目标频响曲线的通透系数为基准,分别调整通透滤波器的通透系数,使通透滤波器滤波输出声音的频响曲线的平均幅值,为预设数量幅值中的幅值。
在一些实施例中,控制模块102用于采用如下方式根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数:
获取音频播放设备播放的原始声音。根据原始声音,确定原始声音在耳道内产生的回声。在耳道内声音中消除回声,并得到消除回声后的第二频响曲线。根据第一频响曲线以及回声消除后的第二频响曲线,确定通透滤波器对应的目标通透系数。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于声音播放的装置200的框图。装置200可以被提供为音频播放设备,例如,可以被提供为耳机,也可以被提供为智能终端。例如,装置200可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置200可以包括以下一个或多个组件:处理组件202,存储器204,电力组件206,多媒体组件208,音频组件210,输入/输出(I/O)的接口212,传感器组件214,以及通信组件216。
处理组件202通常控制装置200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件202可以包括一个或多个处理器220来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件202可以包括一个或多个模块,便于处理组件202和其他组件之间的交互。例如,处理组件202可以包括多媒体模块,以方便多媒体组件208和处理组件202之间的交互。
存储器204被配置为存储各种类型的数据以支持在装置200的操作。这些数据的示例包括用于在装置200上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件206为装置200的各种组件提供电力。电力组件206可以包括电源管理系统,一个或多个电源,及其他与为装置200生成、管理和分配电力相关联的组件。
多媒体组件208包括在所述装置200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件208包括一个前置摄像头和/或后置摄像头。当装置200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件210被配置为输出和/或输入音频信号。例如,音频组件210包括一个麦克风(MIC),当装置200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器204或经由通信组件216发送。在一些实施例中,音频组件210还包括一个扬声器,用于输出音频信号。
I/O接口212为处理组件202和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件214包括一个或多个传感器,用于为装置200提供各个方面的状态评估。例如,传感器组件214可以检测到装置200的打开/关闭状态,组件的相对定位,例如所述组件为装置200的显示器和小键盘,传感器组件214还可以检测装置200或装置200一个组件的位置改变,用户与装置200接触的存在或不存在,装置200方位或加速/减速和装置200的温度变化。传感器组件214可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件214还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件214还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件216被配置为便于装置200和其他设备之间有线或无线方式的通信。装置200可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件216还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置200可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器204,上述指令可由装置200的处理器220执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
进一步可以理解的是,本公开中“多个”是指两个或两个以上,其它量词与之类似。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
进一步可以理解的是,术语“第一”、“第二”等用于描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开,并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
进一步可以理解的是,本公开实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种声音播放方法,其特征在于,应用于音频播放设备,所述方法包括:
获取环境音和耳道内声音;
根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,其中,所述第一频响曲线为所述环境音对应的频响曲线,所述第二频响曲线为所述耳道内声音对应的频响曲线;
控制所述通透滤波器按照所述目标通透系数对所述环境音进行滤波,得到目标声音;
播放所述目标声音。
2.根据权利要求1所述的方法,其特征在于,所述根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,包括:
确定所述第一频响曲线中的在预设频段范围内的幅值的第一平均幅值;
确定所述第二频响曲线中的在所述预设频段范围内的幅值的第二平均幅值;
根据所述第一平均幅值和所述第二平均幅值,从所述通透滤波器对应的至少两个通透系数中,确定所述目标通透系数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一平均幅值和所述第二平均幅值,从所述通透滤波器对应的至少两个通透系数中,确定所述目标通透系数,包括:
确定所述第二平均幅值与所述第一平均幅值之间的幅值差值;
将所述至少两个通透系数中匹配第三平均幅值对应的通透系数,确定为所述目标通透系数,其中,所述第三平均幅值与所述幅值差值之间的差值小于预设阈值。
4.根据权利要求2所述的方法,其特征在于,所述通透滤波器对应的所述至少两个通透系数采用如下方式确定:
根据第三频响曲线和第四频响曲线,确定待补偿的频响曲线,所述第三频响曲线为在消声室环境下人工头未佩戴所述音频播放设备时采集的环境音对应的频响曲线,所述第四频响曲线为在所述消声室环境下所述人工头佩戴所述音频播放设备时采集的环境音被动降噪后的频响曲线;
根据所述待补偿的频响曲线,确定目标频响曲线;
根据所述目标频响曲线,确定所述通透滤波器对应的所述至少两个通透系数。
5.根据权利要求4所述的方法,其特征在于,根据所述目标频响曲线,确定所述通透滤波器对应的所述至少两个通透系数,包括:
确定所述目标频响曲线的在预设频段范围内的第四平均幅值;
以设定的采样间隔,在大于所述第四平均幅值的范围内,以及小于所述第四平均幅值的范围内分别进行幅值的等数量采样,得到预设数量的幅值;
按照所述预设数量,以所述目标频响曲线的通透系数为基准,分别调整所述通透滤波器的通透系数,使所述通透滤波器滤波输出声音的频响曲线的平均幅值,为所述预设数量幅值中的幅值。
6.根据权利要求1所述的方法,其特征在于,根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,包括:
获取所述音频播放设备播放的原始声音;
根据所述原始声音,确定所述原始声音在耳道内产生的回声;
在所述耳道内声音中消除所述回声,并得到消除回声后的第二频响曲线;
根据第一频响曲线以及回声消除后的第二频响曲线,确定通透滤波器对应的目标通透系数。
7.一种声音播放装置,其特征在于,所述装置包括:
获取模块,用于获取环境音和耳道内声音;
控制模块,用于根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数,其中,所述第一频响曲线为所述环境音对应的频响曲线,所述第二频响曲线为所述耳道内声音对应的频响曲线,并控制所述通透滤波器按照所述目标通透系数对所述环境音进行滤波,得到目标声音;
播放模块,用于播放所述目标声音。
8.根据权利要求7所述的装置,其特征在于,所述控制模块用于采用如下方式根据第一频响曲线和第二频响曲线,确定通透滤波器对应的目标通透系数:
获取音频播放设备播放的原始声音;
根据所述原始声音,确定所述原始声音在耳道内产生的回声;
在所述耳道内声音中消除所述回声,并得到消除回声后的第二频响曲线;
根据第一频响曲线以及回声消除后的第二频响曲线,确定通透滤波器对应的目标通透系数。
9.一种音频播放设备,其特征在于,所述音频播放设备包括通透滤波器和控制器,所述控制器包括:处理器和用于存储处理器可执行指令的存储器,其中,所述处理器被配置为:执行权利要求1至6中任意一项所述的声音播放方法。
10.一种存储介质,其特征在于,所述存储介质中存储有指令,当所述存储介质中的指令由音频播放设备的处理器执行时,使得音频播放设备能够执行权利要求1至6中任意一项所述的声音播放方法。
CN202111643387.9A 2021-12-29 2021-12-29 声音播放方法、装置、音频播放设备及介质 Pending CN114374907A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111643387.9A CN114374907A (zh) 2021-12-29 2021-12-29 声音播放方法、装置、音频播放设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111643387.9A CN114374907A (zh) 2021-12-29 2021-12-29 声音播放方法、装置、音频播放设备及介质

Publications (1)

Publication Number Publication Date
CN114374907A true CN114374907A (zh) 2022-04-19

Family

ID=81142689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111643387.9A Pending CN114374907A (zh) 2021-12-29 2021-12-29 声音播放方法、装置、音频播放设备及介质

Country Status (1)

Country Link
CN (1) CN114374907A (zh)

Similar Documents

Publication Publication Date Title
CN113676803B (zh) 一种主动降噪方法及装置
EP3163748B1 (en) Method, device and terminal for adjusting volume
US9491542B2 (en) Automatic sound pass-through method and system for earphones
CN107493500B (zh) 多媒体资源播放方法及装置
CN106454644B (zh) 音频播放方法及装置
CN114363770B (zh) 通透模式下的滤波方法、装置、耳机以及可读存储介质
CN114630239A (zh) 降低耳机闭塞效应方法、装置及存储介质
JP2023525138A (ja) アクティブノイズキャンセリング方法および装置
CN114501224A (zh) 声音播放方法、装置、可穿戴设备及存储介质
CN113596665A (zh) 啸叫声的抑制方法、装置、耳机及存储介质
CN113038337B (zh) 一种音频播放方法、无线耳机和计算机可读存储介质
CN116208879A (zh) 具有主动降噪功能的耳机及主动降噪方法
CN114040285A (zh) 耳机的前馈滤波器参数生成方法、设备、耳机及存储介质
CN111988704B (zh) 声音信号处理方法、装置以及存储介质
CN111770404A (zh) 录音方法、装置、电子设备及可读存储介质
CN113596662B (zh) 啸叫声的抑制方法、啸叫声的抑制装置、耳机及存储介质
CN113810828A (zh) 音频信号处理方法、装置、可读存储介质及耳机
CN115714944A (zh) 音频的处理方法、装置、耳机及存储介质
CN114374907A (zh) 声音播放方法、装置、音频播放设备及介质
CN114598970A (zh) 音频处理方法、装置、电子设备及存储介质
CN113473304B (zh) 啸叫声抑制方法、装置、耳机及存储介质
CN115714948A (zh) 一种音频信号处理方法、装置及存储介质
CN115278441A (zh) 语音检测方法、装置、耳机及存储介质
CN114513723A (zh) 啸叫声抑制方法、装置、耳机及存储介质
CN114554353B (zh) 音频处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination