CN113473304A - 啸叫声抑制方法、装置、耳机及存储介质 - Google Patents
啸叫声抑制方法、装置、耳机及存储介质 Download PDFInfo
- Publication number
- CN113473304A CN113473304A CN202110943975.8A CN202110943975A CN113473304A CN 113473304 A CN113473304 A CN 113473304A CN 202110943975 A CN202110943975 A CN 202110943975A CN 113473304 A CN113473304 A CN 113473304A
- Authority
- CN
- China
- Prior art keywords
- audio
- howling
- filter bank
- characteristic information
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000001629 suppression Effects 0.000 title claims abstract description 25
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 230000004044 response Effects 0.000 claims abstract description 49
- 230000007613 environmental effect Effects 0.000 claims abstract description 21
- 238000001514 detection method Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 25
- 238000001914 filtration Methods 0.000 claims description 16
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 238000003062 neural network model Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/22—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/02—Transmitters
- H04B1/04—Circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/02—Transmitters
- H04B1/04—Circuits
- H04B1/0475—Circuits with means for limiting noise, interference or distortion
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本公开是关于一种啸叫声抑制方法、装置、耳机及存储介质,其中,啸叫声抑制方法包括:在耳机处于通透模式下,采集环境音频;控制第一滤波器组对环境音频进行滤波处理,得到第一音频;控制第二滤波器组对环境音频进行滤波处理,得到第二音频,其中,在任意频率上,第二滤波器组的系数对应的第二频响曲线的幅值均小于第一滤波器组的系数对应的第一频响曲线的幅值;根据第一音频,判断是否存在啸叫事件;根据判断结果,播放第一音频或第二音频。该方法中,可以根据耳机将要播放的音频进行啸叫事件的检测,不需要其他辅助设备,即可以实现对啸叫的规避,实现无啸叫的通透模式,提升使用体验。
Description
技术领域
本公开涉及耳机技术领域,尤其涉及一种啸叫声抑制方法、装置、耳机及存储介质。
背景技术
在音频领域,对声音信号进行采集和输出的耳机多种多样。其中也包括应用在通透模式的耳机。通透模式指耳机采集环境音,对环境音滤波后输出,叠加泄露进人耳的声音,使人耳接收完整环境音。
当用户戴着耳机与其他人进行对话时,可以切换到通透模式,等同于摘下耳机的效果,实现与对方的清晰对话。随着具有通透模式的耳机的迅速普及,使得用户使用耳机的频次和使用时长都在上升。环境音的通透传输也在朝着越来越准确和自然的听感方向研究。
发明内容
为克服相关技术中存在的问题,本公开提供一种啸叫声抑制方法、装置、耳机及存储介质。
根据本公开实施例的第一方面,提供一种啸叫声抑制方法,应用于耳机,所述方法包括:
在所述耳机处于通透模式下,采集环境音频;
控制第一滤波器组对所述环境音频进行滤波处理,得到第一音频;
控制第二滤波器组对所述环境音频进行滤波处理,得到第二音频,其中,在任意频率上,所述第二滤波器组的系数对应的第二频响曲线的幅值均小于所述第一滤波器组的系数对应的第一频响曲线的幅值;
根据所述第一音频,判断是否存在啸叫事件;
根据判断结果,播放所述第一音频或所述第二音频。
可选地,所述根据判断结果,播放所述第一音频信号或所述第二音频,包括:
若确定存在所述啸叫事件,则播放所述第二音频。
可选地,所述根据判断结果,播放所述第一音频或所述第二音频,包括:
若确定不存在所述啸叫事件,则播放所述第一音频。
可选地,所述根据所述第一音频,判断是否存在啸叫事件,包括:
获取所述第一音频的音频特征信息;
将所述音频特征信息输入啸叫检测模型,确定是否存在所述啸叫事件。
可选地,所述音频特征信息包括设定帧数的梅尔倒谱系数;和/或,
所述啸叫检测模型包括卷积神经网络。
可选地,所述啸叫检测模型通过以下生成:
获取多个音频特征信息样本,所述音频特征信息样本指,存在啸叫的多个音频的音频特征信息;
根据所述多个音频特征信息样本对原始神经网络模型进行训练,得到所述啸叫检测模型。
根据本公开实施例的第二方面,提供一种啸叫声抑制装置,应用于耳机,所述装置包括:
采集模块,用于在所述耳机处于通透模式下,采集环境音频;
确定模块,用于控制第一滤波器组对所述环境音频进行滤波处理,得到第一音频;
还用于控制第二滤波器组对所述环境音频进行滤波处理,得到第二音频,其中,在任意频率上,所述第二滤波器组的系数对应的第二频响曲线的幅值均小于所述第一滤波器组的系数对应的第一频响曲线的幅值;
还用于根据所述第一音频,判断是否存在啸叫事件;
播放模块,用于根据判断结果,播放所述第一音频或所述第二音频。
可选地,所述播放模块,具体用于:
若确定存在所述啸叫事件,则播放所述第二音频。
可选地,所述播放模块,具体还用于:
若确定不存在所述啸叫事件,则播放所述第一音频。
可选地,所述确定模块,具体用于:
获取所述第一音频的音频特征信息;
将所述音频特征信息输入啸叫检测模型,确定是否存在所述啸叫事件。
可选地,所述音频特征信息包括设定帧数的梅尔倒谱系数;和/或,
所述啸叫检测模型包括卷积神经网络。
可选地,所述啸叫检测模型通过以下生成:
获取多个音频特征信息样本,所述音频特征信息样本指,存在啸叫的多个音频的音频特征信息;
根据所述多个音频特征信息样本对原始神经网络模型进行训练,得到所述啸叫检测模型。
根据本公开实施例的第三方面,提供一种耳机,所述耳机包括第一滤波器组和第二滤波器组,所述耳机还包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如第一方面所述的方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由耳机的处理器执行时,使得耳机能够执行如第一方面所述的方法。
本公开的实施例提供的技术方案可以包括以下有益效果:该方法中,设置了系数不同的两组滤波器组,在通透模式下,使用两组滤波器组分别对环境音频进行滤波处理,然后根据第一滤波器组处理后的第一音频,来判断是否存在啸叫事件,并根据判断结果来播放第一音频或第二音频,从而更好地避免啸叫。该方法中,在使用耳机的通透模式时,可以根据耳机将要播放的音频进行啸叫事件的检测,不需要其他辅助设备,即可以实现对啸叫的规避,实现无啸叫的通透模式,提升使用体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的啸叫声抑制方法的流程图。
图1a是根据一示例性实施例示出的原始频响曲线和原始处理频响曲线的示意图。
图1b是根据一示例性实施例示出的差异频响曲线的示意图。
图1c是根据一示例性实施例示出的差异频响曲线和第一频响曲线的示意图。
图1d是根据一示例性实施例示出的差异频响曲线、第一频响曲线和第二频响曲线的示意图。
图2是根据一示例性实施例示出的啸叫声抑制装置的框图。
图3是根据一示例性实施例示出的耳机的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
对于具有通透模式的耳机的设计,一般在实验室中对耳机进行测量,设计出通透模式下的滤波器系数。
但在实际生产中,因为MIC误差及结构腔体的组装差异,同样的滤波器参数,通透模式效果往往会具有一定的差异,会导致滤波器系数不适配,从而通透模式开启后产生啸叫。其中,MIC是Microphone缩写而来的词语,指麦克风。麦克风学名为传声器,是一件简单的用来拾取和传送声音的装置,可以将声音信号转换为电信号,俗称话筒。
相关技术中,一般通过产线校准,来保证出货耳机在通透模式开启后不会产生啸叫。准备一台无啸叫的好耳机和一台有啸叫的坏耳机,通过对比两台耳机播放出来声音的频谱曲线,判断啸叫频点,再进行校准。
但是,该方案需要另一台好的耳机作为对比来进行校准,而用户实际使用时一般只有一副耳机。并且,且用户使用过程中,当按压耳机或者其他操作引起腔体结构发生话时,会导致声学传递路径变化,从而引起啸叫。
本公开提供了一种啸叫声抑制方法,应用于耳机。该方法中,设置了系数不同的两组滤波器组,在通透模式下,使用两组滤波器组分别对环境音频进行滤波处理,然后根据第一滤波器组处理后的第一音频,来判断是否存在啸叫事件,并根据判断结果来播放第一音频或第二音频,从而更好地避免啸叫。该方法中,在使用耳机的通透模式时,可以根据耳机将要播放的音频进行啸叫事件的检测,不需要其他辅助设备,即可以实现对啸叫的规避,实现无啸叫的通透模式,提升使用体验。
在一个示例性实施例中,提供了一种啸叫声抑制方法,应用于耳机。参考图1所示,该方法包括:
S110、在耳机处于通透模式下,采集环境音频;
S120、控制第一滤波器组对环境音频进行滤波处理,得到第一音频;
S130、控制第二滤波器组对环境音频进行滤波处理,得到第二音频,其中,在任意频率上,第二滤波器组的系数对应的第二频响曲线的幅值均小于第一滤波器组的系数对应的第一频响曲线的幅值;
S140、根据第一音频,判断是否存在啸叫事件;
S150、根据判断结果,播放第一音频或第二音频。
在步骤S110中,用户可通过相应的功能按键来开启耳机的通透模式,也可以通过语音控制的方式开启通透模式,在此不做限制。
在耳机处于通透模式下,可通过耳机的前馈麦克风采集环境中的声音,以实现环境音频的采集。
在步骤S120和130中,该耳机可包括两组滤波器组,分别记为第一滤波器组和第二滤波器组。第一滤波器组与第二滤波器组的系数(即滤波器组系数)不同,从而实现不同的滤波处理。第一滤波器组和第二滤波器组中的滤波器的数量均可以是6个。第一滤波器组和第二滤波器组均包括6个级联的滤波器。第一滤波器和第二滤波器均包含增益值。每个第二滤波器的增益值均小于对应的第一滤波器的增益值,可使得第二滤波器组在对环境音频进行滤波时,不仅可滤除环境音频中与绕过耳机泄露进人耳的环境音对应的音频外,还可滤波第一音频信号中引起耳机啸叫的干扰信号,从而抑制耳机产生啸叫。
其中,第一滤波器组的系数可记为第一滤波系数,第二滤波器组的系数可记为第二滤波系数。
第一滤波系数对应的频响曲线可记为第一频响曲线,环境音频的频响曲线可记为原始频响曲线。环境音频经第一滤波器组的滤波处理后,得到第一音频,第一音频的频响曲线可记为第一处理频响曲线。原始频响曲线与第一处理频响曲线的差异即为第一频响曲线。
第二滤波系数对应的频响曲线可记为第二频响曲线。环境音频经第二滤波器组的滤波处理后,得到第二音频,第二音频的频响曲线可记为第二处理频响曲线。原始频响曲线与第二处理频响曲线的差异即为第二频响曲线。
其中,在任意频率上,第二频响曲线的幅值均小于第一频响曲线的幅值。该耳机中,第一滤波器组仅仅可对环境音频进行通透滤波处理,以实现通透模式的功能。第二滤波器组可对环境音频进行通透滤波处理和啸叫滤波处理,不仅仅能够实现通透模式的功能,还可有效抑制啸叫的发生,进一步提升用户的使用体验。
示例地,第一频响曲线和第二频响曲线可通过以下方式确定。
参考图1a至图1d所示,每款耳机在开卖前,需要先拿样机在消音室进行声学特性测量。通过人工头可以采集空耳时的原始音频,从而得到原始频响曲线(参考图1a所示的曲线A)。为人工头佩戴耳机,从而采集戴上耳机被动降噪后的处理音频,该处理音频的频响曲线记为原始处理频响曲线(参考图1a所示的曲线B)。通过对比曲线A和曲线B,得到差异频响曲线(参考图1b和1c所示的曲线C)。曲线C表征曲线A与曲线B的差异。
该示例中,可使用6个级联的二阶IIR滤波器来逼近曲线C(通常关注的频率范围时1kHz~6kHz)。示例步骤为:首先每个IIR滤波器都有一个随机初始化值(初始滤波器系数),然后随机更新频率、增益值、Q值,从而更新滤波器系数,再计算更新后的滤波器系数对应的曲线D(例如参考图1c和1d所示),比较曲线D与曲线C的差异,如果曲线D与曲线C的差异比上一次的差异小,则以当前滤波器系数为基准,继续更新频率、增益值、Q值。按此类推,进行多次迭代,直至曲线D与曲线C的差异稳定下来,从而确定稳定后的曲线D为第一频响曲线,该6个级联的二阶IIR滤波器构成第一滤波器组。
依据曲线D,设计出平均幅值递减的滤波器组,记为第二滤波器组。其中,第二滤波器组的第二滤波系数与第一滤波系数不同,使得在任意频率上,第二滤波系数对应的第二频响曲线(参考图1d所示的曲线E)的幅值均小于第一频响曲线的幅值。需要注意的是,一般情况下,第二滤波器组的增益值小于第一滤波器组的增益值。
在一个实施例中,每个第二滤波器的增益值均为对应的第一滤波器的增益值的1/3。1/3是本申请经过多次实验后的经验值。
在本申请中,第一滤波器组和第二滤波器组中的滤波器的数量变动时,各滤波器对应的增益值、频率值以及Q值可进行灵活调整。
在一些实施例中,每个所述第二滤波器的频率值均等于对应的所述第一滤波器的频率值,且每个所述第二滤波器的Q值均等于对应的所述第一滤波器的Q值。
需要说明的是,Q值表示品质因数。Q值=中心频率÷滤波器带宽。Q值越大,滤波器带宽越窄,越小则滤波器带宽越宽。
该实施例中,第一滤波器组中各滤波器的滤波带宽与第二滤波器组中分别对应的滤波器的滤波带宽基本相同。例如,第一滤波器组中第六滤波器的带宽与第二滤波器组中第六滤波器的带宽相同,第一滤波器组中第五滤波器的带宽与第二滤波器组中第五滤波器的带宽相同等等,从而使得第一滤波器组和第二滤波器组对相同中心频率的音频具有相同的滤波带宽,从而有利于对同一带宽的环境音频的处理。
其中,在耳机出场前,将第一滤波系数和第二滤波系数烧录进耳机存储部件中,也可以通过后续升级将滤波系数更新至耳机。其中,存储部件可以是只读存储器(Read-OnlyMemory,ROM)或者快闪存储器(英语:flash memory)。当耳机的处理器需要使用第一滤波系数或第二滤波系数时,可直接从存储部件中提取。
需要说明的是,步骤S120和步骤S130可同时进行,也可顺序进行或倒序进行。
在步骤S140中,由于第一滤波器组仅仅可对环境音频进行通透滤波处理,因此,经过第一滤波器组滤波处理得到的第一音频可能存在啸叫。该步骤中,便可根据第一音频,来判断是否存在啸叫。
啸叫,本质上是一种回授音,其主要是由于声源与扩音设备之间因距离过近等问题导致能量发生自激而产生,例如,话筒与音箱同时使用、音响装置重放的声音能够通过空间传到话筒以及音箱发出的声音能量足够大,话筒的拾音灵敏度足够高,等等。啸叫的危害较大,不仅使得使用者的体验变差,更为严重的是容易损坏耳机,损伤使用者的听力。
该步骤中,可利用声学事件检测的方法来判断是否存在啸叫,即,将啸叫当作一种声学事件,记为啸叫事件,然后使用声学事件检测的方法来判断是否存在啸叫事件,如果判断为存在啸叫事件,则说明播放第一音频时会发生啸叫;如果判断为不存在啸叫事件,则说明播放第一音频时不会发生啸叫。
在步骤S150中,第一音频由环境音频经过通透滤波处理得到的,第二音频是由环境音频经过通透滤波处理和啸叫滤波处理得到的。
该步骤中,若判断结果为否,即不存在啸叫事件,则说明播放第一音频时不会发生啸叫,该情况下可直接播放第一音频,从而实现通透模式的功能,使得可以像没有配合耳机一样的感知外界的声音。
若判断结果为是,即存在啸叫事件,则说明播放第一音频时会发生啸叫,该情况下便可播放第二音频,从而实现通透模式的功能,且不会发生啸叫,即使得可以像没有配合耳机一样的感知外界的声音,且不会听到啸叫。
该方法中,设置了系数不同的两组滤波器组,在通透模式下,使用两组滤波器组分别对环境音频进行滤波处理,然后根据第一滤波器组处理后的第一音频,来判断是否存在啸叫事件,并根据判断结果来播放第一音频或第二音频,不需要其他辅助设备,即可以实现对啸叫的规避,实现无啸叫的通透模式,提升使用体验。
在一个示例性实施例中,提供了一种啸叫声抑制方法,应用于耳机。该方法中,根据所述第一音频,判断是否存在啸叫事件,可包括:
S210、获取第一音频的音频特征信息;
S210、将音频特征信息输入啸叫检测模型,确定是否存在啸叫事件。
在步骤S210中,音频特征信息可包括设定帧数的梅尔频率倒谱系数(MFCC系数,Mel-Frequency Cepstral Coefficients)。
需要说明的是,根据人耳听觉机理的研究发现,人耳对不同频率的声波有不同的听觉敏感度。梅尔频率倒谱系数是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率的非线性特性。其中,Mel标度又叫梅尔刻度(mel-scale),它是基于彼此等距的听众对音高(pitch)的感性判断的刻度。
该步骤中,设定帧数可以是耳机出厂前设置的,也可以是出厂后设置的,并且,在出厂后,还可以对耳机的设定帧数进行修改。
例如,设定帧数例如可以是40帧,针对第一音频,可按帧提取MFCC系数,其中,由40帧MFCC系数组成一个二维数组,根据该二维数组进行是否存在啸叫事件的判断。
在步骤S220中,可通过啸叫检测模型来确定是否存在啸叫事件。啸叫检测模型可以包括卷积神经网络,利用卷积神经网络进行啸叫事件的判断,可以提高判断结果的可靠性。
示例地,将音频特征信息输入啸叫检测模型,啸叫检测模型便可输出判断结果的标识,根据该标识便可确定是否存在啸叫事件。
该方法中,利用啸叫检测模型进行啸叫事件的检测,可以更加准确地根据第一音频,确定是否存在啸叫事件,从而更加准确地规避啸叫的发生,更好地提升用户的使用体验。
在一个示例性实施例中,提供了一种啸叫声抑制方法,应用于耳机。该方法中,啸叫检测模型可通过以下方式生成:
S310、获取多个音频特征信息样本,
S320、根据多个音频特征信息样本对原始神经网络模型进行训练,得到啸叫检测模型。
在步骤S310中,音频特征信息样本与步骤S210中的音频特征信息的类型相同。即,如果音频特征信息包括设定帧数的MFCC系数,则音频特征信息样本也包括设定帧数的MFCC系数。也就是,该步骤中的音频特征信息样本指,已知存在啸叫的多个音频的音频特征信息。其中,每个音频可确定至少一个音频特征信息样本,即每个音频可提取至少一个音频特征信息。
示例地,可采集耳机发生啸叫声时播放的音频,然后将上述音频作为音频样本,根据音频样本,提取音频特征信息,作为音频特征信息样本。
需要注意的是,该步骤中,可通过实验的方式采集发生啸叫的音频,也可从网络上下载可发生啸叫的音频。然后根据获取到的音频,确定音频特征信息样本。
当然,也可通过其他方式获取音频特征信息样本,例如,如果网络有训练啸叫检测模型所需的音频特征信息,也可直接从网络上下载上述音频特征信息,作为音频特征信息样本,在此不做赘述。
在步骤S320中,原始神经网络模型可包括卷积神经网络。例如,原始神经网络模型包括三层卷积神经网络。
该步骤中,可将多个音频特征信息样本作为输入样本,并将表征存在啸叫事件的标识(可记为啸叫标识)作为输出样本,对原始神经网络模型进行训练,以得到啸叫检测模型。在进行训练时,可提前设置预设正确率(例如90%或99%等等),当训练后的模型的正确率大于或等于预设正确率,便可将此时的模型确定为啸叫检测模型。
该方法可以得到优秀的啸叫检测模型,通过该啸叫检测模型,可以更加准确地根据第一音频判断是否存在啸叫事件,从而更好地规避啸叫,提升用户的使用体验。
在一个示例性实施例中,提供了一种啸叫声抑制装置,应用于耳机。该装置用于实施上述的啸叫声抑制方法。参考图2所示,该装置可包括采集模块101、确定模块102和播放模块103,其中,
采集模块101,用于在耳机处于通透模式下,采集环境音频;
确定模块102,用于控制第一滤波器组对环境音频进行滤波处理,得到第一音频;
还用于控制第二滤波器组对环境音频进行滤波处理,得到第二音频,其中,在任意频率上,第二滤波器组的系数对应的第二频响曲线的幅值均小于第一滤波器组的系数对应的第一频响曲线的幅值;
还用于根据第一音频,判断是否存在啸叫事件;
播放模块103,用于根据判断结果,播放第一音频或第二音频。
在一个示例性实施例中,提供了一种啸叫声抑制装置,应用于耳机。该装置中参考图2所示,,播放模块103,具体用于:
若确定存在啸叫事件,则播放第二音频。
在一个示例性实施例中,提供了一种啸叫声抑制装置,应用于耳机。参考图2所示,该装置中,播放模块103,具体还用于:
若确定不存在啸叫事件,则播放第一音频。
在一个示例性实施例中,提供了一种啸叫声抑制装置,应用于耳机。参考图2所示,该装置中,确定模块102,具体用于:
获取第一音频的音频特征信息;
将音频特征信息输入啸叫检测模型,确定是否存在啸叫事件。
在一个示例性实施例中,提供了一种啸叫声抑制装置,应用于耳机。该装置中,音频特征信息包括设定帧数的梅尔倒谱系数;和/或,啸叫检测模型包括卷积神经网络。
在一个示例性实施例中,提供了一种啸叫声抑制装置,应用于耳机。该装置中,啸叫检测模型通过以下生成:
获取多个音频特征信息样本;
根据多个音频特征信息样本对原始神经网络模型进行训练,得到啸叫检测模型。
在一个示例性实施例中,提供了一种耳机,其一般包括第一滤波器组和第二滤波器组。参考图3所示,耳机400还可以包括以下一个或多个组件:处理组件402,存储器404,电力组件406,多媒体组件408,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制耳机400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在耳机400的操作。这些数据的示例包括用于在耳机400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储耳机或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件406为耳机400的各种组件提供电力。电力组件406可以包括电源管理系统,一个或多个电源,及其他与为耳机400生成、管理和分配电力相关联的组件。
多媒体组件408包括在耳机400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置相机模组和/或后置相机模组。当耳机400处于操作模式,如拍摄模式或视频模式时,前置相机模组和/或后置相机模组可以接收外部的多媒体数据。每个前置相机模组和后置相机模组可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当耳机400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为耳机400提供各个方面的状态评估。例如,传感器组件414可以检测到耳机400的打开/关闭状态,组件的相对定位,例如组件为耳机400的显示器和小键盘,传感器组件414还可以检测耳机400或耳机400一个组件的位置改变,用户与耳机400接触的存在或不存在,耳机400方位或加速/减速和耳机400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于耳机400和其他耳机之间有线或无线方式的通信。耳机700可以接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,耳机400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理耳机(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的方法。
在一个示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由耳机400的处理器420执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储耳机等。当存储介质中的指令由耳机的处理器执行时,使得耳机能够执行上述实施例中示出的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (14)
1.一种啸叫声抑制方法,应用于耳机,其特征在于,所述方法包括:
在所述耳机处于通透模式下,采集环境音频;
控制第一滤波器组对所述环境音频进行滤波处理,得到第一音频;
控制第二滤波器组对所述环境音频进行滤波处理,得到第二音频,其中,在任意频率上,所述第二滤波器组的系数对应的第二频响曲线的幅值均小于所述第一滤波器组的系数对应的第一频响曲线的幅值;
根据所述第一音频,判断是否存在啸叫事件;
根据判断结果,播放所述第一音频或所述第二音频。
2.根据权利要求1所述的方法,其特征在于,所述根据判断结果,播放所述第一音频信号或所述第二音频,包括:
若确定存在所述啸叫事件,则播放所述第二音频。
3.根据权利要求1所述的方法,其特征在于,所述根据判断结果,播放所述第一音频或所述第二音频,包括:
若确定不存在所述啸叫事件,则播放所述第一音频。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一音频,判断是否存在啸叫事件,包括:
获取所述第一音频的音频特征信息;
将所述音频特征信息输入啸叫检测模型,确定是否存在所述啸叫事件。
5.根据权利要求4所述的方法,其特征在于,
所述音频特征信息包括设定帧数的梅尔倒谱系数;和/或,
所述啸叫检测模型包括卷积神经网络。
6.根据权利要求4所述的方法,其特征在于,所述啸叫检测模型通过以下生成:
获取多个音频特征信息样本,所述音频特征信息样本指,存在啸叫声的多个音频的音频特征信息;
根据所述多个音频特征信息样本对原始神经网络模型进行训练,得到所述啸叫检测模型。
7.一种啸叫声抑制装置,应用于耳机,其特征在于,所述装置包括:
采集模块,用于在所述耳机处于通透模式下,采集环境音频;
确定模块,用于控制第一滤波器组对所述环境音频进行滤波处理,得到第一音频;
还用于控制第二滤波器组对所述环境音频进行滤波处理,得到第二音频,其中,在任意频率上,所述第二滤波器组的系数对应的第二频响曲线的幅值均小于所述第一滤波器组的系数对应的第一频响曲线的幅值;
还用于根据所述第一音频,判断是否存在啸叫事件;
播放模块,用于根据判断结果,播放所述第一音频或所述第二音频。
8.根据权利要求7所述的装置,其特征在于,所述播放模块,具体用于:
若确定存在所述啸叫事件,则播放所述第二音频。
9.根据权利要求7所述的装置,其特征在于,所述播放模块,具体还用于:
若确定不存在所述啸叫事件,则播放所述第一音频。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述确定模块,具体用于:
获取所述第一音频的音频特征信息;
将所述音频特征信息输入啸叫检测模型,确定是否存在所述啸叫事件。
11.根据权利要求10所述的装置,其特征在于,
所述音频特征信息包括设定帧数的梅尔倒谱系数;和/或,
所述啸叫检测模型包括卷积神经网络。
12.根据权利要求4所述的装置,其特征在于,所述啸叫检测模型通过以下生成:
获取多个音频特征信息样本,所述音频特征信息样本指,存在啸叫声的多个音频的音频特征信息;
根据所述多个音频特征信息样本对原始神经网络模型进行训练,得到所述啸叫检测模型。
13.一种耳机,其特征在于,所述耳机包括第一滤波器组和第二滤波器组,所述耳机还包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1至6任一项所述的方法。
14.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由耳机的处理器执行时,使得耳机能够执行如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110943975.8A CN113473304B (zh) | 2021-08-17 | 2021-08-17 | 啸叫声抑制方法、装置、耳机及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110943975.8A CN113473304B (zh) | 2021-08-17 | 2021-08-17 | 啸叫声抑制方法、装置、耳机及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113473304A true CN113473304A (zh) | 2021-10-01 |
CN113473304B CN113473304B (zh) | 2024-01-23 |
Family
ID=77866715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110943975.8A Active CN113473304B (zh) | 2021-08-17 | 2021-08-17 | 啸叫声抑制方法、装置、耳机及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113473304B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114095835A (zh) * | 2021-11-18 | 2022-02-25 | 歌尔科技有限公司 | 耳机通透模式的控制方法、装置、耳机设备及存储介质 |
CN114598970A (zh) * | 2022-03-10 | 2022-06-07 | 北京小米移动软件有限公司 | 音频处理方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007043512A (ja) * | 2005-08-03 | 2007-02-15 | National Institute Of Advanced Industrial & Technology | ハウリング抑制装置 |
KR20110007394A (ko) * | 2009-07-16 | 2011-01-24 | (주)시그젠 | 실시간 하울링 신호 제거 시스템 및 그 방법 |
CN108172237A (zh) * | 2018-03-12 | 2018-06-15 | 广东欧珀移动通信有限公司 | 语音通话数据处理方法、装置、存储介质及移动终端 |
CN108449503A (zh) * | 2018-03-12 | 2018-08-24 | 广东欧珀移动通信有限公司 | 语音通话数据处理方法、装置、存储介质及移动终端 |
WO2019174492A1 (zh) * | 2018-03-12 | 2019-09-19 | Oppo广东移动通信有限公司 | 语音通话数据检测方法、装置、存储介质及移动终端 |
CN110677796A (zh) * | 2019-03-14 | 2020-01-10 | 深圳市攀高电子有限公司 | 一种音频信号处理方法及助听器 |
CN113015078A (zh) * | 2021-04-02 | 2021-06-22 | 广东思派康电子科技有限公司 | 一种通透模式下防啸叫的耳机调试方法和装置 |
CN113194386A (zh) * | 2021-04-16 | 2021-07-30 | 成都天奥信息科技有限公司 | 一种民航地空通信的啸叫抑制装置及方法 |
-
2021
- 2021-08-17 CN CN202110943975.8A patent/CN113473304B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007043512A (ja) * | 2005-08-03 | 2007-02-15 | National Institute Of Advanced Industrial & Technology | ハウリング抑制装置 |
KR20110007394A (ko) * | 2009-07-16 | 2011-01-24 | (주)시그젠 | 실시간 하울링 신호 제거 시스템 및 그 방법 |
CN108172237A (zh) * | 2018-03-12 | 2018-06-15 | 广东欧珀移动通信有限公司 | 语音通话数据处理方法、装置、存储介质及移动终端 |
CN108449503A (zh) * | 2018-03-12 | 2018-08-24 | 广东欧珀移动通信有限公司 | 语音通话数据处理方法、装置、存储介质及移动终端 |
WO2019174492A1 (zh) * | 2018-03-12 | 2019-09-19 | Oppo广东移动通信有限公司 | 语音通话数据检测方法、装置、存储介质及移动终端 |
CN110677796A (zh) * | 2019-03-14 | 2020-01-10 | 深圳市攀高电子有限公司 | 一种音频信号处理方法及助听器 |
CN113015078A (zh) * | 2021-04-02 | 2021-06-22 | 广东思派康电子科技有限公司 | 一种通透模式下防啸叫的耳机调试方法和装置 |
CN113194386A (zh) * | 2021-04-16 | 2021-07-30 | 成都天奥信息科技有限公司 | 一种民航地空通信的啸叫抑制装置及方法 |
Non-Patent Citations (2)
Title |
---|
张荣庆;杨奕;: "一种带啸叫抑制的音频功率放大器设计", 测控技术, no. 07, pages 145 - 148 * |
谢建东;郑晗峰;李瑶;刘伟;李进;梁鑫磊;孙耀武;: "带啸叫抑制的音频功率放大器系统设计", 工业控制计算机, no. 02, pages 146 - 147 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114095835A (zh) * | 2021-11-18 | 2022-02-25 | 歌尔科技有限公司 | 耳机通透模式的控制方法、装置、耳机设备及存储介质 |
WO2023087468A1 (zh) * | 2021-11-18 | 2023-05-25 | 歌尔科技有限公司 | 耳机通透模式的控制方法、装置、耳机设备及存储介质 |
CN114598970A (zh) * | 2022-03-10 | 2022-06-07 | 北京小米移动软件有限公司 | 音频处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113473304B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11294619B2 (en) | Earphone software and hardware | |
CN105451111A (zh) | 耳机播放控制方法、装置及终端 | |
CN113473304B (zh) | 啸叫声抑制方法、装置、耳机及存储介质 | |
CN106888327B (zh) | 语音播放方法及装置 | |
CN107493500A (zh) | 多媒体资源播放方法及装置 | |
CN104991754A (zh) | 录音方法及装置 | |
CN114363770B (zh) | 通透模式下的滤波方法、装置、耳机以及可读存储介质 | |
CN114630239B (zh) | 降低耳机闭塞效应方法、装置及存储介质 | |
WO2008128173A1 (en) | Method and device for voice operated control | |
US20220122605A1 (en) | Method and device for voice operated control | |
CN111988704B (zh) | 声音信号处理方法、装置以及存储介质 | |
CN113596665A (zh) | 啸叫声的抑制方法、装置、耳机及存储介质 | |
CN114501224A (zh) | 声音播放方法、装置、可穿戴设备及存储介质 | |
CN114598970A (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN113810828A (zh) | 音频信号处理方法、装置、可读存储介质及耳机 | |
CN114513723A (zh) | 啸叫声抑制方法、装置、耳机及存储介质 | |
CN115065921A (zh) | 一种防止助听器啸叫的方法及装置 | |
CN115714944A (zh) | 音频的处理方法、装置、耳机及存储介质 | |
CN108140400A (zh) | 控制音量的方法及装置 | |
CN113596662B (zh) | 啸叫声的抑制方法、啸叫声的抑制装置、耳机及存储介质 | |
CN115278441A (zh) | 语音检测方法、装置、耳机及存储介质 | |
CN111694539B (zh) | 在听筒和扬声器之间切换的方法、装置及介质 | |
CN115396776A (zh) | 耳机的控制方法、装置、耳机及计算机可读存储介质 | |
JP2009171189A (ja) | 音声補正装置及び音声補正機能を備えた通信端末装置 | |
CN115410547B (zh) | 音频处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |