CN114390391B - 一种音频处理方法以及设备 - Google Patents
一种音频处理方法以及设备 Download PDFInfo
- Publication number
- CN114390391B CN114390391B CN202111640454.1A CN202111640454A CN114390391B CN 114390391 B CN114390391 B CN 114390391B CN 202111640454 A CN202111640454 A CN 202111640454A CN 114390391 B CN114390391 B CN 114390391B
- Authority
- CN
- China
- Prior art keywords
- audio data
- frequency
- audio
- environmental
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 44
- 230000007613 environmental effect Effects 0.000 claims abstract description 284
- 238000000034 method Methods 0.000 claims abstract description 76
- 230000008569 process Effects 0.000 claims description 48
- 230000015654 memory Effects 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 description 30
- 230000009467 reduction Effects 0.000 description 27
- 230000004044 response Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 14
- 238000001914 filtration Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000005291 magnetic effect Effects 0.000 description 3
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 2
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/10—Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
本申请公开了一种音频处理方法以及设备,所述方法包括:获取音频处理设备的音频采集装置采集的环境音频数据;所述环境音频数据的频率范围至少包括第一频率以及第二频率;所述第一频率域所述第二频率无交集;基于所述第一频率,对所述音频处理设备的音频输出装置输出的初始音频数据进行处理,得到第一目标音频数据;其中,所述初始音频数据,至少包括所述环境音频数据;所述第一目标音频数据中所述第一频率的音频分量的比例,小于所述环境音频数据中所述第一频率的音频分量的比例;所述音频处理设备能基于第一频率和所述第二频率,对所述音频输出装置输出的所述初始音频数据进行处理。
Description
技术领域
本申请涉及音频数据处理技术领域,尤其涉及一种音频处理方法以及设备。
背景技术
在实际应用中,在佩戴耳机时,用户通常希望还能够听到周围环境中的声音,然而,在有些情况下,周围环境的声音会影响用户的耳机使用感受。
发明内容
基于以上问题,本申请实施例提供了一种音频处理方法以及设备。
本申请实施例提供的技术方案是这样的:
本申请实施例提供了一种音频处理方法,包括:
获取音频处理设备的音频采集装置采集的环境音频数据;其中,所述环境音频数据的频率范围至少包括第一频率以及第二频率;所述第一频率与所述第二频率无交集;
基于所述第一频率,对所述音频处理设备的音频输出装置输出的初始音频数据进行处理,得到第一目标音频数据;其中,所述初始音频数据,至少包括所述环境音频数据;所述第一目标音频数据中所述第一频率的音频分量的比例,小于所述环境音频数据中所述第一频率的音频分量的比例;所述音频处理设备能基于所述第一频率和所述第二频率,对所述音频处理装置输出的所述初始音频数据进行处理。
在一些实施方式中,所述基于所述第一频率,对所述音频处理设备的音频输出装置输出的初始音频数据进行处理,包括:
在基于所述环境音频数据的频率范围,对所述初始音频数据进行处理得到第二目标音频数据的过程中,响应于第一指令,基于所述第一频率对所述初始音频数据进行处理;
所述对所述初始音频数据进行处理得到第二目标音频数据,包括
基于所述第一频率和所述第二频率对所述初始音频数据进行处理,得到所述第二目标音频数据;其中,所述第二目标音频数据中所述第一频率的音频分量的比例,小于所述环境音频数据中所述第一频率的音频分量的比例;且所述第二目标音频数据中所述第二频率的音频分量的比例,小于所述环境音频数据中所述第二频率的音频分量的比例。
在一些实施方式中,所述方法还包括:
对所述环境音频数据进行分析,得到第一特征信息;其中,所述第一特征信息,包括所述环境音频数据中所述第一频率的音频分量的响度信息、以及所述环境音频数据中所述第一频率的音频分量的出现次数信息中的至少一种;
基于所述第一特征信息生成所述第一指令。
在一些实施方式中,所述基于所述第一频率,对所述音频处理设备的音频输出装置输出的初始音频数据进行处理,包括:
在所述音频输出装置输出所述初始音频数据的过程中,响应于第二指令,基于所述第一频率,对所述初始音频数据进行处理。
在一些实施方式中,所述获取音频采集装置采集的环境音频数据之前,还包括:
在所述音频输出装置输出多媒体音频数据的过程中,响应于第三指令,启动所述音频采集装置采集所述环境音频数据。
在一些实施方式中,所述初始音频数据,还包括多媒体音频数据;所述基于所述第一频率,对所述音频处理设备的音频输出装置输出的初始音频数据进行处理,包括:
对所述多媒体音频数据以及所述环境音频数据进行分析,得到第二特征信息;其中,所述第二特征信息,包括所述多媒体音频数据和/或所述环境音频数据中至少一种频率的音频分量的信息;
基于所述第二特征信息以及所述第一频率,对所述初始音频数据进行处理。
在一些实施方式中,所述基于所述第二特征信息以及所述第一频率,对所述初始音频数据进行处理,包括:
若所述第二特征信息满足第一条件,基于所述第一频率,对所述多媒体音频数据进行处理;其中,所述第一条件,包括所述多媒体音频数据中所述第一频率的音频分量的音量,大于所述环境音频数据中所述第一频率的音频分量的音量;
若所述第二特征信息满足第二条件,基于所述第一频率,对所述环境音频数据进行处理;其中,所述第二条件,包括所述环境音频数据中所述第一频率的音频分量的音量,大于所述多媒体音频数据中所述第一频率的音频分量的音量。
在一些实施方式中,所述基于所述第二特征信息以及所述第一频率,对所述初始音频数据进行处理,包括:
若所述第二特征信息满足第三条件,基于所述第二特征信息,从所述初始音频数据中确定第三目标音频数据;其中,所述第三目标音频数据,为所述多媒体音频数据和/或所述环境音频数据;所述第三条件,包括所述多媒体音频数据和/或环境音频数据中所述第一频率的音频分量的音量大于预设阈值;
基于所述第一频率,对所述第三目标音频数据进行处理。
本申请实施例还提供了一种音频处理设备,包括:
获取模块,用于获取所述音频处理设备的采集环境音频装置采集的环境音频数据;其中,所述环境音频数据的频率范围至少包括第一频率以及第二频率;所述第一频率与所述第二频率无交集;
处理模块,用于基于所述第一频率,对所述音频处理设备的音频输出装置输出的初始音频数据进行处理,得到第一目标音频数据;其中,所述初始音频数据,至少包括所述环境音频数据;所述第一目标音频数据中所述第一频率的音频分量的比例,小于所述环境音频数据中所述第一频率的音频分量的比例;所述音频处理设备能基于所述第一频率和所述第二频率,对所述音频输出装置输出的所述初始音频数据进行处理。
本申请实施例还提供了另一种音频处理设备,包括处理器和存储器;其中,所述存储器中存储有计算机程序;所述处理器执行所述计算机程序时,能够实现如前任一所述的音频处理方法。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被电子设备的处理器执行时,能实现如前任一所述的音频处理方法。
附图说明
图1为本申请实施例提供的音频处理方法的第一流程示意图;
图2为本申请实施例提供的音频处理方法的第二流程示意图;
图3为本申请实施例提供的音频处理方法的音频处理效果示意图;
图4为本申请实施例提供的音频处理设备的第一结构示意图;
图5为本申请实施例提供的音频处理设备的第二结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
用户在佩戴耳机时通常希望还能够听到周围环境中的声音,但是在有些场景下比如周围环境噪声音量过高的环境如公共交通环境中,若用户佩戴耳机时听到的环境音量的音量过高,会影响用户的耳机佩戴体验,甚至会威胁到用户的人身安全。
基于以上问题,本申请实施例提供了一种音频处理方法以及设备。
本申请实施例首先提供了一种音频处理方法,该方法可以通过音频处理设备的处理器实现。
需要说明的是,上述处理器可以为特定用途集成电路(Application SpecificIntegrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(ProgrammableLogic Device,PLD)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。
图1为本申请实施例提供的音频处理方法的第一流程示意图。如图1所示,该方法可以包括步骤101至步骤102:
步骤101、获取音频处理设备的音频采集装置采集的环境音频数据。
其中,环境音频数据的频率范围至少包括第一频率以及第二频率;所述第一频率与所述第二频率无交集。
在一种实施方式中,音频处理设备,可以为耳机;示例性的,耳机可以包括有线耳机或无线耳机;示例性的,耳机可以包括入耳式耳机或罩耳式耳机。
在一种实施方式中,音频采集装置,可以是以集成的方式设置在音频处理设备中,还可以是独立于音频处理设备之外的、且与音频处理设备建立有通信连接的装置;示例性的,音频采集装置可以为麦克风(Microphone)或音频采样卡等;示例性的,在音频采集装置以集成的方式设置在音频处理设备中的情况下,音频采集装置的体积可以较小。
在一种实施方式中,环境音频数据,可以是音频采集装置持续性的或间歇性的采集得到的。
在一种实施方式中,环境音频数据,可以包括通过音频采集装置实时采集到的、音频处理设备当前所处环境的音频数据,即当前环境音频数据;示例性的,环境音频数据,还可以是音频采集装置采集到的历史音频数据,此时可以将环境音频数据记录为历史环境音频数据;音频处理设备的音频采集装置还可以通过网络,从其它存储装置、设备或网络获取环境音频数据,即历史环境音频数据和/或当前环境音频数据。
在一种实施方式中,第一频率,可以是根据音频处理设备对环境音频数据进行分析而确定的;示例性的,在环境音频数据为当前环境音频数据时,音频处理设备可以根据当前环境音频数据实时的确定第一频率;在音频处理设备切换至运行模式,但音频采集装置尚未采集到环境音频数据或音频采集装置在指定时间长度内未采集到环境音频数据时,音频处理设备可以基于历史环境音频数据确定第一频率,从而预先开启基于第一频率对初始音频数据处理的过程。
在一种实施方式中,音频处理设备中可以设置有多个音频采集装置,其中多个音频采集装置可以设置在音频处理设备的不同位置或不同区域、或者多个音频采集装置在音频处理设备中的朝向不同,以采集不同方向的环境音频数据。
在一种实施方式中,环境音频数据,可以是音频处理设备对多个音频采集装置采集到多种音频数据处理得到的结果。
在一种实施方式中,环境音频数据的频率范围可以由第一频率以及第二频率组成;示例性的,第一频率可以表示第一个频率区间,第二频率可以表示第二个频率区间。
在一种实施方式中,环境音频数据的频率范围可以包括第一频率、第二频率,还可以包括至少一个频率或频率区间;示例性的,上述至少一个频率或频率区间,可以与第一频率以及第二频率均无交集。
步骤102、基于第一频率,对音频处理设备的音频输出装置输出的初始音频数据进行处理,得到第一目标音频数据。
其中,初始音频数据,至少包括环境音频数据;第一目标音频数据中第一频率的音频分量的比例,小于环境音频数据中第一频率的音频分量的比例;音频处理设备能基于第一频率以及第二频率,对音频输出装置输出的初始音频数据进行处理。
在一种实施方式中,音频处理设备的音频输出装置,可以是以集成的方式一体化的设置在音频处理设备中的;示例性的,音频输出装置可以与音频处理设备相互独立、但与音频处理设备之间建立有通信连接。示例性的,音频输出装置,可以包括音箱或扬声器等;示例性的,在音频输出装置以集成的形式一体化的设置在音频处理设备中时,音频输出装置的体积可以是较小的。
在一种实施方式中,在音频处理设备获取环境音频数据之后,可以将环境音频数据发送至音频输出装置,音频输出装置可以输出环境音频数据;示例性的,音频采集装置与音频输出装置之间可以建立有音频传输通道,如此,音频采集装置采集到环境音频数据之后,可以通过音频传输通道传输至音频输出装置。
在一种实施方式中,第一频率以及第二频率,可以为音频处理设备的频率响应范围的真子集,也就是说,音频处理设备能够对包括第一频率以及第二频率的频率响应范围内的任意音频数据进行音频处理;其中,音频处理可以包括音频输出操作;示例性的,音频处理可以包括对第一频率以及第二频率的音频分量的抑制或祛除操作。
在一种实施方式中,第一频率以及第二频率可以组成音频处理设备的频率响应范围,即音频处理设备能够对频率范围为第一频率以及第二频率的任意音频数据进行音频处理。
在一种实施方式中,音频处理设备的频率响应范围可以是固定的;示例性的,音频处理设备可以根据环境音频数据的频率区间,调整音频处理设备的频率响应参数,实现对频率响应范围的调整,以使音频处理设备的频率响应范围至少包括环境音频数据的频率范围的至少部分频率。
在一种实施方式中,音频处理设备的频率响应范围,可以至少包括环境音频数据的频率范围,即音频处理设备的频率响应范围可以至少包括环境音频数据的频率范围中的所有频率分量;示例性的,音频处理设备的频率响应范围,可以与环境音频数据的频率范围相同;示例性的,环境音频数据的频率范围,可以为音频处理设备的频率响应范围的真子集;示例性的,音频处理设备的频率响应范围,除了包括环境音频数据的频率范围之外,还可以包括与环境音频数据的频率范围无交集的第三频率;示例性的,第三频率可以对应于一个频率范围。
在一种实施方式中,第一频率,可以是音频处理设备中预先设定的,也可以是由音频处理设备的处理器对环境音频数据进行分析而确定的,还可以是基于音频处理设备的用户从多个频率或频段的选择而确定的;示例性的,上述多个频率或频段,可以是音频处理设备对初始音频数据或环境音频数据进行分析而得到的。
在一种实施方式中,第一频率,可以是音频处理设备对当前环境音频数据、和/或历史环境音频数据分析而确定的。示例性的,音频处理设备可以对当前环境音频数据和/或历史环境音频数据中各个频率的音频分量进行特征分析,将当前环境音频数据和/或历史环境音频数据中的音量大于或等于音量阈值的音频分量的频率确定为第一频率、或者将当前环境音频数据和/或历史环境音频数据中的持续出现时间大于或等于时间阈值的音频分量的频率确定为第一频率、或者将当前环境音频数据和/或历史环境音频数据中的出现次数大于或等于次数阈值的音频分量的频率确定为第一频率。
在一种实施方式中,在环境音频数据的频率范围发生改变的情况下,第一频率的频率范围也可以相应调整,从而实现对初始音频数据中第一频率的自适应处理;并且,由于第一目标音频数据中第一频率的音频分量的比例小于环境音频数据中第一频率的音频分量的比例,从而实现了对环境音频数据中部分频率范围的音频分量的透传。
在一种实施方式中,第一频率以及第二频率,可以均为单一的频率,示例性的,第一频率可以为80Hz,第二频率为100Hz;第一频率以及第二频率,还可以分别为包括多个连续频率的频段范围,比如第一频率可以为80Hz-200Hz之间的频率范围,第二频率为210Hz-300Hz;第一频率以及第二频率,还可以分别包括多个分散的单一频率,示例性的,第一频率可以包括AHz、BHz以及CHz,比如,第一频率可以包括80Hz、200Hz以及1500Hz,第二频率,可以包括100Hz、120Hz以及180Hz;第一频率以及第二频率,还分别可以包括多个频段范围,示例性的,第一频率包括50Hz-70Hz、120Hz-180Hz以及1000Hz-1500Hz;第二频率可以包括20Hz-30Hz、80Hz-90Hz以及200Hz-220Hz。
在一种实施方式中,基于第一频率,对音频处理设备的音频输出装置输出的初始音频数据进行处理,得到第一目标音频数据,可以是通过以下任一方式实现的:
基于第一频率,调整音频滤波器的滤波参数,然后通过滤波参数调整后的音频滤波器对初始音频数据中的第一频率进行过滤,得到第一目标音频数据。
基于第一频率,控制音频处理设备的处理器产生第一频率的、且相位与初始音频数据中第一频率的音频分量相反的指定音频数据,并通过音频输出装置输出指定音频数据,从而通过指定音频数据抵消初始音频数据中第一频率的音频分量。示例性的,上述过程可以为主动降噪(Active Noise Cancellation,ANC)过程。
在一种实施方式中,音频处理设备能基于第一频率以及第二频率,对音频输出装置输出的初始音频数据进行处理,可以通过以下任一方式实现:
首先基于第二频率对音频输出装置输出的初始音频数据进行处理,得到第一数据;然后再基于第一频率对第一数据进行处理。
首先基于第一频率对初始音频数据进行处理,得到第二数据,然后基于第二频率对第二数据进行处理。
同时基于第一频率以及第二频率对初始音频数据进行处理。
示例性的,基于第二频率对初始音频数据进行处理、基于第二频率对第二数据进行处理、基于第一频率以及第二频率对初始音频数据进行处理的方法,可以与基于第一频率对初始音频数据处理的方法相同。
在一种实施方式中,第一目标音频数据中第一频率的音频分量的比例,可以为0,如此可以实现对初始音频数据中第一频率的音频分量的完全祛除;示例性的,第一目标音频数据中第一频率的音频分量的比例,可以不为0,即音频处理设备可以实现对初始音频数据中部分第一频率的音频分量的祛除。
示例性的,在音频处理设备为耳机、音频处理设备当前所处环境为公共交通环境、环境音频数据包括公共交通环境中的交通噪音、第一频率包括交通噪音中低频噪音频段的条件下,通过本申请实施例提供的音频处理方法,耳机对包括交通噪音的初始音频数据处理后得到的第一目标音频数据中,低频噪音的比例,小于环境音频数据中低频噪音的比例,从而实现了对交通噪音中低频噪音的抑制;示例性的,在第一目标音频数据中低频噪音的比例为0的情况下,能够实现对交通噪音中低频噪音的完全祛除。
示例性的,在交通噪音包括中交通工具的鸣笛声以及人声等中高频音频数据的情况下,本申请实施例提供的音频处理方法,还能够实现对公共交通环境中包括交通工具的鸣笛声以及人声等中高频音频数据的透传,从而使得耳机能够实时透传公共交通环境中的中高频音频数据,提醒耳机用户关注公共交通环境信息,注意人身安全。
由以上可知,在本申请实施例提供的音频处理方法中,音频处理设备获取音频采集装置采集的频率范围至少包括第一频率以及第二频率的环境音频数据之后,能够基于第一频率对音频输出装置输出的包括环境音频数据的初始音频数据进行处理,得到第一目标音频数据。因此,本申请实施例提供的音频处理方法中,由于音频处理设备的音频输出装置输出的初始音频数据中包含环境音频数据,从而实现了对环境音频数据的透传处理;与此同时,由于音频处理设备的频率响应范围至少包括第一频率以及第二频率,而音频处理设备能够基于第一频率对初始音频数据进行处理得到的第一目标音频数据中,第一频率的音频分量的比例小于环境音频数据中第一频率的音频分量的比例,从而实现了音频处理设备对环境音频数据中部分频率范围的音频分量的降噪处理;并且,由于音频处理设备本身具备了基于第一频率以及第二频率对初始音频数据进行处理的能力,但音频处理设备能够从其所能处理的频率范围中自动的选择环境音频数据中的部分频率范围的音频分量进行处理,从而提高了音频处理设备的自动化水平。也就是说,本申请实施例提供的音频处理方法中,音频处理设备在透传环境音频数据的同时,还能灵活的处理环境音频数据中第一频段的音频分量,从而实现了其自动化的、智能化的透传环境音频数据以及对环境音频数据中部分频率分量主动降噪的双重处理。
示例性的,在音频处理设备为耳机的情况下,通过本申请实施例提供的音频处理方法,能够实现耳机对环境音频数据的透传以及主动降噪的同时处理,从而增强了耳机的自动化的智能化的音频数据处理能力,改善了用户的耳机使用感受。
基于前述实施例,基于第一频率,对音频处理设备的音频输出装置输出的初始音频数据进行处理,可以通过以下方式实现:
在基于环境音频数据的频率范围,对初始音频数据进行处理得到第二目标音频数据的过程中,响应于第一指令,基于第一频率对初始音频数据进行处理。
其中,对初始音频数据进行处理得到第二目标音频数据,可以通过以下方式实现:
基于第一频率对第二频率对初始音频数据进行处理,得到第二目标音频数据。
其中,第二目标音频数据中第一频率的音频分量的分量,小于环境音频数据中第一频率的音频分量的比例;并且,第二目标音频数据中第二频率的音频分量的比例,小于环境音频数据中第二频率的音频分量的比例。
示例性的,在环境音频数据的频率范围由第一频率以及第二频率组成的情况下,基于第一频率以及第二频率对初始音频数据进行处理,可以是基于环境音频数据的频率范围对初始音频数据进行处理。
示例性的,在第一频率以及第二频率为环境音频数据的频率范围的部分频率范围的情况下,音频处理设备可以从环境音频数据的频率范围中选择第一频率以及第二频率,并基于第一频率以及第二频率对初始音频数据进行处理。比如环境音频数据的频率范围可以包括20~20000Hz,第一频率可以包括20Hz-100Hz,第二频率可以包括300Hz-350Hz,此时音频处理设备能够基于20Hz-100Hz以及300Hz-350Hz对初始音频数据中与上述频率区间对应的频率分量进行过滤或抑制处理,从而降低20Hz-100Hz以及300Hz-350Hz的频率分量在第二目标音频数据中的比例,使得第二目标音频数据中上述两个频率区间的音频分量的比例,小于环境音频数据中上述两个频率区间的音频分量的比例。
示例性的,环境音频数据可以为公共交通环境中的交通噪音,第二频率可以包括交通噪音中低频段的音频分量比如引擎声等白噪声,第一频率可以包括较高频段的音频分量比如鸣笛声以及人声等。
在一种实施方式中,基于第一频率和第二频率,对初始音频数据进行处理得到第二目标音频数据,可以是采用与前述实施例中基于第一频率对初始音频数据进行处理得到第一目标音频数据相似的方式进行,本申请实施例对此不作限定。
在一种实施方式中,基于第一频率和第二频率,对初始音频数据进行处理得到第二目标音频数据之前,还可以包括以下操作:获取音频采集装置采集的环境音频数据,音频输出装置输出包括环境音频数据的初始音频数据。
在一种实施方式中,基于第一频率和第二频率,对初始音频数据进行处理,可以包括祛除初始音频数据中的环境音频数据的所有频率的音频分量。
在一种实施方式中,第一指令,可以是音频处理设备自动生成的,也可以是音频处理设备在检测到外部请求后生成的,示例性的,外部请求,可以包括音频处理设备的用户、或与音频处理设备建立有通信连接的其它设备、或者网络发送的。
在一种实施方式中,第一指令,可以是通过以下任一方式生成的:
音频处理设备对环境音频数据进行分析,确定环境音频数据中第一频率的音频分量的比例大于或等于第一阈值的情况下,生成第一指令;相应的,在音频处理设备确定环境音频数据中第一频率的音频分量的比例小于第一阈值的情况下,可以不生成第一指令。
音频处理设备对环境音频数据进行分析,确定环境音频数据中频率分量的数量大于或等于第二阈值的情况下,生成第一指令;相应的,在音频处理设备确定环境音频数据中频率分量的数量小于第二阈值的情况下,可以不生成第一质量。
示例性的,在环境音频数据为交通噪音、第一频率为公共交通环境中的交通噪音的中低频段、第一阈值为50%的情况下,音频处理设备确定在交通噪音中中低频段的音频分量的比例大于或等于50%的情况下,可以生成第一指令,以触发音频处理设备基于第一频率对包括交通噪音的初始音频数据进行处理,得到仅包含人声或鸣笛声的第一目标音频数据。
由以上可知,本申请实施例提供的音频处理方法中,在基于第一频率对初始音频数据进行处理之前,音频处理设备可以处于基于第一频率以及第二频率,对初始音频数据进行处理得到第二目标音频数据的状态,由于第二目标音频数据中第一频率以及第二频率的音频分量的比例,小于环境音频数据的频率范围的音频分量的比例,因此,音频处理设备处于对环境音频数据的全频段/较宽频段/多个频点的降噪处理模式;而响应第一指令之后,在第一目标音频数据中第一频率的音频分量的比例为0的情况下,音频处理设备对包含环境音频数据的初始音频数据处理、得到的第一目标音频数据中依然包含除去第一频率之外的其它频分量,也就是说,此时音频处理设备能够对环境音频数据中第一频率的音频分量进行降噪处理,同时还能透传环境音频数据中除去第一频率之外的其它音频分量,即音频处理设备处于对环境音频数据的降噪加透传处理模式。
通过上述操作,音频处理设备实现了其从对环境音频数据全频段/较宽频段/多个频点的降噪处理模式、至对环境音频数据的部分频段/较窄频段/少数频点的降噪且对除去部分频段/较窄频段/少数频点的音频分量的透传处理模式的切换。
基于前述实施例,本申请实施例提供的音频处理方法,还可以包括步骤A1至步骤A2:
步骤A1、对环境音频数据进行分析,得到第一特征信息。
其中,第一特征信息,包括环境音频数据中第一频率的音频分量的响度信息、以及环境音频数据中第一频率的音频分量的出现次数信息中的至少一种。
在一种实施方式中,环境音频数据中第一频率的音频分量的响度信息,可以是对环境音频数据中各个频率或第一频率的音频分量进行统计而得到的;示例性的,第一频率的音频分量的响度信息,可以是对指定时段内的环境音频数据进行统计平均而得到的,也可以是根据环境音频数据的持续时段,对环境音频数据进行统计得到的;示例性的,环境音频数据中第一频率的音频分量的响度信息,可以包括第一频率的音频分量的每一响度级别的响度信息,也可以仅包含响度大于或等于响度阈值的第一频率的音频分量的响度信息。
在一种实施方式中,环境音频数据中第一频率的音频分量的出现次数,可以包括指定时段内的环境音频数据中第一频率的音频分量的出现次数、或者环境音频数据的持续时段内第一频率的音频分量的出现次数;示例性的,环境音频数据中第一频率的音频分量的出现次数,可以包括响度超过响度阈值的第一频率的音频分量的出现次数。
步骤A2、基于第一特征信息生成第一指令。
在一种实施方式中,基于第一特征信息生成第一指令,可以是通过以下任一方式实现的:
若第一特征信息表明环境音频数据中包含第一频率的音频分量,则生成第一指令。
若第一特征信息表明环境音频数据中包含第一频率的音频分量、且第一频率的音频分量出现次数大于或等于次数阈值,则生成第一指令。
若第一特征信息表明环境音频数据包含响度信息大于或等于响度阈值的第一频率的音频分量,且大于或等于响度阈值的第一频率的音频分量的出现次数大于或等于次数阈值,则生成第一指令。
若第一特征信息表明环境音频数据包含响度信息大于或等于响度阈值的第一频率的音频分量,或者,大于或等于响度阈值的第一频率的音频分量的出现次数大于或等于次数阈值,则生成第一指令。
示例性的,音频处理设备对第一特征信息进行分析,确定第一特征信息表明环境音频数据中第一频率的音频分量的音量大于或等于响度阈值的情况下,生成第一指令,以触发音频处理设备基于第一频率对包括环境音频数据的初始音频数据进行处理,得到第一目标音频数据。
示例性的,在环境音频数据为交通噪音、第一频率为交通噪音中的中低频段、响度阈值为50dB的条件下,音频处理设备确定第一特征信息表明在交通噪音中中低频段的音频分量的音量大于或等于50dB的情况下,可以触发第一指令,以使音频处理设备响应第一指令,从而实现音频处理设备从对交通噪音的全频段/多个频段/多个频点抑制的降噪音频处理模式、切换至对交通噪音中的中低频等较窄频段/少数频段/少数频点的音频分量降噪、且对除去中低音频分量的其它分量比如人声以及鸣笛声的部分透传的降噪加透传的音频处理模式。
由以上可知,本申请实施例提供的音频处理方法中,音频处理设备对环境音频数据进行分析得到第一特征信息之后,能够基于第一特征信息自动生成第一指令,并基于第一指令控制音频处理设备从对初始音频数据进行处理的全部频段/较宽频段范围/多个频点的降噪模式、切换至对初始音频数据进行部分频段/较窄频段范围/少数频点降噪、且对除去部分频段/较窄频段范围/少数频点降噪的透传模式的切换,从而实现了对音频处理设备的音频处理模式的自动化、智能化控制,进而提高了音频处理设备的自动化以及智能化水平。
基于前述实施例,本申请实施例提供的音频处理方法中,基于第一频率,对音频处理设备的音频输出装置输出的初始音频数据进行处理,还可以通过以下方式实现:
在音频输出装置输出初始音频数据的过程中,响应于第二指令,基于第一频率,对初始音频数据进行处理。
在一种实施方式中,音频输出装置输出初始音频数据,可以是在音频采集装置采集到环境音频数据,且音频输出装置获取到环境音频数据的情况下执行的。
在一种实施方式中,音频输出装置输出包括环境音频信息的初始音频数据,可以表示音频处理设备处于对环境音频数据的透传模式。
在一种实施方式中,第二指令,可以是与前述实施例提供的第一指令的确定方式相似的方式确定的,本申请实施例对此不作限定。
在一种实施方式中,音频处理设备可以对环境音频数据进行分析得到分析结果,且分析结果表明音频处理设备所处环境为指定环境的情况下,音频处理设备可以生成第二指令。示例性的,指定环境,可以包括比如公共交通环境、以及会议环境中的至少一种。
在一种实施方式中,第二指令中可以包含第一频率、基于第一频率对初始音频数据进行处理的持续时间、以及基于第一频率对初始音频数据进行处理的条件中的至少一种指示信息。
在一种实施方式中,在音频处理设备基于第一频率对初始音频数据进行处理得到第一目标音频数据之前,音频处理设备可以处于输出初始音频数据的状态。示例性的,音频处理设备输出初始音频数据的模式,可以为透传环境音频数据的透传模式;示例性的,音频处理设备基于第一频率对初始音频数据进行处理得到第一目标音频数据的模式,可以为前述实施例所述的透传环境音频数据中除去第一频率之外的其它音频分量的模式,即降噪加透传的音频处理模式。也就是说,音频处理设备能够从对环境音频数据的透传模式,切换至对环境音频数据中部分音频分量透传的降噪模式,即从透传模式至降噪且透传的音频处理模式的切换。
示例性的,音频处理设备在透传环境音频数据的过程中,可以对环境音频数据进行实时分析,在确定环境音频数据第一频率的音频分量的音量大于或等于音量阈值、或环境音频数据中第一频率的音频分量的比例大于或等于比例阈值的情况下,可以基于环境音频数据生成第二指令,从而触发音频处理设备从透传模式切换至降噪且透传的音频处理模式。比如,在音频处理设备为耳机的情况下,用户佩戴耳机时,用户所处环境的噪音音量从第一音量切换至第二音量、或用户从噪音音量为第一音量的第一环境切换至噪音音量为第二音量的第二环境、且第二音量远大于第一音量时,耳机可以基于噪音音量生成第二指令,从而触发耳机从透传模式切换至降噪且透传的音频处理模式,如此,一方面能够改善用户的耳机使用感受,保护用户的听力,另一方面,还能透传用户所处环境中的部分音频数据比如人的声音,从而降低用户错过有效信息的概率。
由以上可知,本申请实施例提供的音频处理方法中,在音频处理设备输出包括环境音频数据的初始音频数据的过程中,响应于第二指令,就能够切换至基于第一频率对初始音频数据进行处理的工作模式,从而实现了音频处理设备从对环境音频数据的透传模式、至环境音频数据的透传且第一频率的频率分量的降噪模式的切换,进而使得音频处理设备的工作模式切换更灵活,切换控制更智能。
基于前述实施例,本申请实施例提供的音频处理方法,在获取音频采集装置采集的音频数据之前,还可以包括以下操作:
在音频输出装置输出多媒体数据的过程中,响应于第三指令,启动音频采集装置采集环境音频数据。
在一种实施方式中,音频输出装置输出多媒体数据时,可以表示音频处理设备处于默认工作模式;示例性的,默认工作模式,可以包括音频处理设备的处理器以及任一装置均不对环境音频数据进行处理的工作模式。
在一种实施方式中,音频处理设备启动音频采集装置采集环境音频数据之后,音频处理设备能够基于第一频率,对音频输出装置输出的包括环境音频数据的初始音频数据进行处理,从而实现了音频处理设备从默认工作模式、至透传环境音频数据且对环境音频数据中第一频率的音频分量进行降噪处理切换,即从默认工作模式至透传且降噪工作模式的切换。
在一种实施方式中,第三指令,可以是音频处理设备基于其接收到的外部请求而生成的;示例性的,外部请求,可以包括音频处理设备的用户输入至音频处理设备的请求、或者与音频处理设备建立有数据连接的其它设备向音频处理设备发送的请求;示例性的,其它设备可以包括智能移动终端设备,比如智能手表、智能手机等;示例性的,其它设备可以采集并分析环境音频数据,在确定环境音频数据的分析结果表明音频处理设备所处环境为指定坏境的情况下,可以向音频处理设备发送第三指令。
示例性的,音频处理设备可以对音频采集装置采集的环境音频数据进行分析,在确定环境音频数据的音量小于音量阈值、或者环境音频数据所包含的频率分量的数量小于第三阈值的情况下,可以生成第三指令,从而启动音频采集装置采集环境音频数据。
示例性的,音频处理设备可以对音频采集装置采集的环境音频数据以及多媒体音频数据进行分析,在确定环境音频数据的音量对多媒体音频数据的影响程度低于程度阈值的情况下,音频处理设备可以启动音频采集装置采集环境音频数据。比如用户在收听音乐的过程中,音频处理设备确定用户当前所处环境的环境音频数据的音量较小,此时可以采集并透传环境音频数据,在用户驾驶机动车辆或在公共交通场合行走的过程中,通过上述方式,还能提高用户对环境变化的关注度,从而降低交通安全隐患。
由以上可知,本申请实施例提供的音频处理方法中,音频处理设备在输出多媒体数据的过程中,响应于第三指令后,能够自动启动音频采集装置采集环境音频数据,从而实现了自动的从默认工作模式、至对环境音频数据的透传且对环境音频数据中第一频率的音频分量进行降噪处理的工作模式之间的切换。
基于前述实施例,本申请实施例提供的音频处理方法中,初始音频数据,还包括多媒体音频数据。
相应的,基于第一频率,对音频输出装置输出的初始音频数据进行处理,可以通过步骤B1至步骤B2实现:
步骤B1、对多媒体音频数据以及环境音频数据进行分析,得到第二特征信息。
其中,第二特征信息,包括多媒体音频数据和/或环境音频数据中至少一种频率的音频分量的信息。
在一种实施方式中,多媒体音频数据,可以存储在音频处理设备的存储单元中,还可以是音频处理设备从其它设备或网络获取的,本申请实施例对此不作限定。
在一种实施方式中,多媒体音频数据,可以包括从视频文件中解析得到的音频数据;示例性的,多媒体音频数据,还可以包括在语音通话或视频通话过程中、音频处理设备接收到的音频数据。
在一种实施方式中,第二特征信息,可以包括多媒体音频数据和/或环境音频数据所包含的至少一种频率的音频分量的响度信息、持续时间信息、以及出现次数信息中的至少一种特征信息。
在一种实施方式中,多媒体音频数据与环境音频数据所包含的频率范围可以不同,示例性的,多媒体音频数据的频率范围为3000Hz-20000Hz,而环境音频数据的频率范围为比如50Hz-200Hz,上述两个频率范围之间没有交集。
在一种实施方式中,多媒体音频数据与环境音频数据所包含的频率范围可以至少部分重叠。比如,多媒体音频数据的频率范围为30Hz-18000Hz,而环境音频数据的频率范围为30Hz-15000Hz,上述两个频率范围之间存在交集;示例性的,多媒体音频数据与环境音频数据所包含的频率范围可以相同;示例性的,多媒体音频数据的频率范围可以为环境音频数据的频率范围的真子集,比如多媒体音频数据频率范围可以为30Hz-15000Hz,而环境音频数据频率范围可以为30Hz-18000Hz;示例性的,环境音频数据的频率范围可以为多媒体音频数据的频率范围的真子集,比如比如环境音频数据的频率范围可以为30Hz-15000Hz,而多媒体音频数据的频率范围可以为30Hz-18000Hz。
步骤B2、基于第二特征信息以及第一频率,对初始音频数据进行处理。
在一种实施方式中,基于第二特征信息以及第一频率,对初始音频数据进行处理,可以通过以下任一方式实现:
若第二特征信息表明多媒体音频数据和/或环境音频数据中包含第一频率的音频分量,则基于第一频率对初始音频数据进行处理;相应的,若第二特征信息表明多媒体音频数据和/或环境音频数据中并未包含第一频率的音频分量,则不需要基于第一频率对初始音频数据进行处理。也就是说,若第二特征信息表明多媒体音频数据和环境音频数据中均包含第一频率的音频分量,且第一频率的音频分量不为人声等目标频率,则可以基于第一频率对初始音频数据进行处理,以降低多媒体音频数据以及环境音频数据中第一频率的音频分量叠加对用户听力的影响,比如,在音频处理设备为耳机的情况下,用户在散步过程中佩戴耳机收听多媒体音频数据,若多媒体音频数据以及散步环境中均出现了第一频率的音频数据,且二者叠加的音量超过了预设的音量阈值,则可以对初始音频数据进行处理,以祛除初始音频数据中第一频率的音频分量,保护用户的听力。
若第二特征信息表明多媒体音频数据和/或环境音频数据中第一频率的音频分量的比例超过比例阈值,则基于第一频率对初始音频数据进行处理。示例性的,在第一频率的音频分量不为用户所关注的目标音频分量的情况下,若多媒体音频数据和/或环境音频数据中多次出现第一频率的音频数据,则可以基于第一频率对初始音频数据进行处理,以降低对用户的干扰。
由以上可知,本申请实施例提供的音频处理方法中,音频处理设备的音频输出装置输出的初始音频数据还包括多媒体音频数据,并且,在得到多媒体音频数据以及环境音频数据中至少一种频率的音频分量的信息即第二特征信息之后,能够基于第二特征信息以及第一频率,对初始音频数据进行处理。如此,本申请实施例提供的音频处理方法,不仅能够实现对环境音频数据中第一频率的音频分量的处理,还能实现对多媒体数据中第一频率的音频分量的处理,并且,在第一频率可调可变的情况下,能够实现对环境音频数据和/或多媒体音频数据中多个频率范围/多个频点的处理,从而使得音频处理设备的音频数据处理更灵活更全面。
基于前述实施例,本申请实施例提供的音频处理方法中,基于第二特征信息以及第一频率,对初始音频数据进行处理,可以通过以下方式实现:
若第二特征信息满足第一条件,基于第一频率,对多媒体音频数据进行处理。
其中,第一条件,包括多媒体音频数据中第一频率的音频分量的音量,大于环境音频数据中第一频率的音频分量的音量。
相应的,若第二特征信息不满足第一条件,则可以判断第二特征信息是否满足其它条件,若第二特征信息不满足任何预先设定的条件,则可以不对多媒体音频数据和/或环境音频数据进行处理。
在一种实施方式中,第一条件,可以包括多媒体音频数据中任一时段内出现的第一频率的音频分量的音量,大于环境音频数据中任一时段内出现的第一频率的音频分量的音量。
在一种实施方式中,第一条件,可以包括在指定时间长度内,多媒体音频数据中出现的第一频率的音频分量的平均音量,大于该指定时间长度内环境音频数据中出现的第一频率的音频分量的平均音量。
在一种实施方式中,第一条件,可以包括第k时刻多媒体音频数据中出现的第一频率的音频分量的音量,大于第k时刻环境音频数据中出现的第一频率的音频分量的音量;其中,k为大于或等于1的整数,且k的取值范围可以从1至多媒体音频数据以及环境音频数据的持续时长。
在一种实施方式中,若第二特征信息满足第一条件,基于第一频率,对多媒体音频数据进行处理,可以是通过以下任一方式实现的:
基于第一频率,对多媒体音频数据中第一频率的音频分量进行过滤或主动降噪处理,以降低第一频率的音频分量在多媒体音频数据中的比例。
基于第一频率,对多媒体音频数据中第一频率的音频分量高于音量阈值的音频分量进行过滤或主动降噪处理。
示例性的,在音频处理设备为耳机的条件下,在用户佩戴耳机过马路的情况下,若多媒体音频数据中第一频率的音频分量的音量,大于环境音频数据中第一频率的音频分量的音量,此时可以对多媒体音频数据中的第一频率的音频分量进行祛除处理,从而降低多媒体音频数据中第一频率的音频分量对环境音频数据输出的影响,以提高用户对马路交通状况的关注度。
基于前述实施例,本申请实施例提供的音频处理方法中,基于第二特征信息以及第一频率,对初始音频数据进行处理,还可以通过以下方式实现:
若第二特征信息满足第二条件,基于第一频率,对环境音频数据进行处理。
其中,第二条件,包括环境音频数据中第一频率的音频分量的音量,大于多媒体音频数据中第一频率的音频分量的音量。
相应的,若第二特征信息不满足第二条件,则可以判断第二特征信息是否满足其它条件,若第二特征信息不满足任何预先设定的条件,则可以不对多媒体音频数据和/或环境音频数据进行处理。
在一种实施方式中,第二条件,可以包括环境音频数据中任一时段内出现的环境音频数据的频率范围的音频分量的音量,大于多媒体音频数据中任一时段内出现的环境音频数据的频率范围的音频分量的音量。
在一种实施方式中,第二条件,可以包括在指定时间长度内,环境音频数据中出现的环境音频数据的频率范围的音频分量的平均音量,大于该指定时间长度内多媒体音频数据中出现的环境音频数据的频率范围的音频分量的平均音量。
在一种实施方式中,第二条件,可以包括第k时刻环境音频数据中出现的第一频率的音频分量的音量,大于第k时刻多媒体音频数据中出现的第一频率的音频分量的音量。
在一种实施方式中,若第二特征信息满足第二条件,基于第一频率,对环境音频数据进行处理,可以是通过以下任一方式实现的:
基于第一频率,对环境音频数据中第一频率的音频分量进行过滤或主动降噪处理,以降低第一频率的音频分量在环境音频数据中的比例。
基于第一频率,对环境音频数据中第一频率的音频分量高于音量阈值的音频分量进行过滤或主动降噪处理。
示例性的,在音频处理设备为耳机的条件下,在用户佩戴耳机进行网络会议的情况下,若环境音频数据中第一频率的音频分量的音量中第一频率的音频分量的音量,大于多媒体音频数据比如网络会议中的会议音频,此时可以对环境音频数据中的第一频率的音频分量进行祛除处理,从而降低环境音频数据中第一频率的音频分量对网络会议中的会议音频数据输出的影响,进而提高网络会议的效率。
由以上可知,本申请实施例提供的音频处理方法中,若第二特征信息满足第一条件,则音频处理设备基于第一频率,对多媒体音频数据进行处理,若第二特征信息满足第二条件,则音频处理设备基于第一频率,对环境音频数据进行处理。由于第二特征信息包括多媒体音频数据和/或环境音频数据中至少一种频率的音频分量的信息,也就是说第二特征信息为多媒体音频数据和/或环境音频数据本身的频率特征信息,从而实现了基于多媒体音频数据和/或环境音频数据本身的频率特征,对音频处理设备的音频数据处理流程的自动化控制。
并且,在有些需要透传外界环境声音的场景中,第二特征信息满足第一条件则基于第一频率对多媒体音频数据进行处理,从而能够降低多媒体音频数据中第一频率的音频分量,对环境音频数据中第一频率的音频分量的干扰;在有些需要对外界环境声音的降噪处理增强的场景中,即第二特征信息满足第二条件,则可以基于第一频率对环境音频数据进行处理,从而能够降低环境音频数据中第一频率的音频分量对多媒体音频数据中第一频率的音频分量的干扰,进而提高多媒体音频数据的音质。
基于前述实施例,本申请实施例提供的音频处理方法中,基于第二特征信息以及第一频率,对初始音频数据进行处理,还可以通过以下方式实现:
若第二特征信息满足第三条件,基于第二特征信息,从初始音频数据中确定第三目标音频数据;基于第一频率,对第三目标音频数据进行处理。
其中,第三目标音频数据,为多媒体音频数据和/或环境音频数据;第三条件,包括多媒体音频数据和/或环境音频数据中第一频率的音频分量的音量大于预设阈值。
在一种实施方式中,在多媒体音频数据中第一频率的音频分量的音量大于预设阈值的情况下,第三目标音频数据可以为多媒体音频数据,此时可以基于第一频率对多媒体音频数据进行处理,以降低多媒体音频数据中第一频率的音频分量的比例,从而削弱多媒体音频数据中第一频率的音频分量,对环境音频数据中第一频率的音频分量的影响。
在一种实施方式中,在环境音频数据中第一频率的音频分量的音量大于预设阈值的情况下,第三目标音频数据可以为环境音频数据,此时可以基于第一频率对环境音频数据进行处理,以减少环境音频数据中第一频率的音频分量的比例,从而削弱环境音频数据中第一频率的音频分量对多媒体音频数据中第一频率的音频分量的影响。
在一种实施方式中,在多媒体音频数据以及环境音频数据中第一频率的音频分量的音量均大于预设阈值的情况下,第三目标音频数据可以包括多媒体音频数据以及环境音频数据,此时可以基于第一频率,同时对多媒体音频数据以及环境音频数据进行处理,从而降低初始音频数据中第一频率的音频分量的比例。
在一种实施方式中,预设阈值,可以是预先设定的,也可以是用户输入至音频处理设备、或其它设备发送置音频处理设备的。示例性的,用音频处理设备可以接收至少一种预设阈值,并将预设阈值与初始音频数据的特征信息、或音频处理设备的工作时间关联起来,从而实现根据初始音频数据、或音频处理设备的工作时间对预设阈值的动态调整。
示例性的,在音频处理设备为耳机的条件下,在用户佩戴进行网络会议的情况下,若第一频率的音频分量为与会者不关注的目标音频分量,则若环境音频数据和/或表示网络会议音频数据的多媒体音频数据中第一频率的音频分量的音量大于预设阈值,此时可以对环境音频数据和/或网络会议音频数据中的第一频率的音频分量进行祛除处理,从而降低第一频率的音频分量对网络会议中有效的会议音频数据输出的影响,进而提高网络会议的效率。
由以上可知,本申请实施例提供的音频处理方法中,若第二特征信息满足第三条件,则可以基于第二特征信息从初始音频数据中确定第三目标音频数据,并基于第一频率对第三目标音频数据进行处理,从而实现了对音频处理设备的音频数据处理的自动化、智能化调整;并且,通过调整第三条件中的预设阈值,还能改善音频处理设备的音频数据处理流程的灵活度。
图2为本申请实施例提供的音频处理方法的第二流程示意图。如图2所示,该方法可以包括步骤201至步骤204:
步骤201、启动透传及降噪模式。
示例性的,音频处理设备可以基于第一指令、第二指令或第三指令,从其它音频处理模式切换至透传以及降噪模式。示例性的,第一指令、第二指令以及第三指令,可以是用户输入的,可以是其它设备发送至音频处理设备的,还可以是音频处理设备自动生成的,本申请实施例对此不作限定。
步骤202、通过音频采集装置采集环境音频数据,通过音频输出装置输出初始音频数据。
示例性的,初始音频数据可以包括音频采集装置采集的环境音频数据;示例性的,音频采集装置可以为麦克风,音频输出装置可以为扬声器。
步骤203、基于第一频率对初始音频数据进行处理。
示例性的,音频处理设备可以通过前述实施例提供的方法,基于第一频率对初始音频数据进行处理。
步骤204、得到第一目标音频数据。
示例性的,第一目标音频数据中第一频率的音频分量的比例,小于初始音频数据中第一频率的音频分量的比例,从而实现了对初始音频数据中第一频率的音频分量的祛除处理。
图3为本申请实施例提供的音频处理方法的音频处理效果示意图。
需要说明的是,在图3中,音频处理设备为耳机,第一竞品设备以及第二竞品设备也是耳机。
图3所示的坐标系中,横轴为频率,单位为赫兹(Hz);纵轴为音量,单位为分贝(dB)。在图3中,第一曲线301为环境音频数据的频率响应曲线,第二曲线302为采用本申请实施例提供的音频处理方法,对环境音频数据进行处理后得到的第一目标音频数据的频率响应曲线;第三曲线303为第一竞品设备对环境音频数据进行处理得到的第四目标音频数据的频率响应曲线;第四曲线304为第二竞品设备对环境音频数据进行处理得到的第五目标音频数据的频率响应曲线。
从图3可以看出,在50Hz至20KHz的整体环境音频数据的频率范围内,第三曲线303以及第四曲线304基本与第一曲线301的变化规律相同,也就是说,在环境音频数据的整体频率范围内,第一竞品设备与第二竞品设备均实现了对环境音频数据的透传处理。
从图3可以看出,在100Hz附近的频率区间内,第一曲线301的幅度为67dB,第三曲线303以及第四曲线304中与第一曲线301基本持平,且第三曲线303的幅度以及第四曲线304的幅度分别为63dB以及65dB,即第一竞品设备以及第二竞品设备依然实现了对环境音频数据的透传处理,而同样在100Hz附近的频率区间内,第二曲线302的幅度为42dB,相对于第三曲线303以及第四曲线304的幅度,第二曲线302的幅度降低了21dB左右,相对于环境音频数据,第二曲线302的幅度降低了大约25dB,而在环境音频数据的除去100Hz附近频率范围的其它频率范围内,第二曲线302与第一曲线301的变化规律基本保持一致。也就是说,本申请实施例提供的音频处理方法,音频处理设备能够实现对环境音频数据的低频段的降噪处理,并且,还能实现对环境音频数据除去低频段之外的其它频段的透传处理,即实现了降噪且透传的音频处理模式。
由以上可知,相对于相关技术中的耳机的音频处理方法,本申请实施例提供的音频处理方法应用于耳机时,能够同时实现耳机对环境音频数据的降噪、以及对环境音频数据中部分频率的音频分量的透传处理。
基于前述实施例,本申请实施例还提供了一种音频处理设备,图4为本申请实施例提供的音频处理设备的第一结构示意图。如图4所示,该音频处理设备4可以包括:
获取模块401,用于获取音频处理设备的采集环境音频装置采集的环境音频数据;其中,环境音频数据的频率范围至少包括第一频率以及第二频率;第一频率与第二频率无交集;
处理模块402,用于基于第一频率,对音频处理设备的音频输出装置输出的初始音频数据进行处理,得到第一目标音频数据;其中,初始音频数据,至少包括环境音频数据;第一目标音频数据中第一频率的音频分量的比例,小于环境音频数据中第一频率的音频分量的比例;音频处理设备能基于第一频率以及第二频率为,对音频输出装置输出的初始音频数据进行处理。
在一种实施方式中,处理模块402,用于在基于环境音频数据的频率范围,对初始音频数据进行处理得到第二目标音频数据的过程中,响应于第一指令,基于第一频率对初始音频数据进行处理;
处理模块402,具体用于基于第一频率以及第二频率对初试音频数据进行处理,得到第二目标音频数据;其中,第二目标音频数据中第一频率的音频分量的比例,小于环境音频数据中第一频率的音频分量的比例;且第二目标音频数据中第二频率的音频分量的比例,小于环境音频数据中第二频率的音频分量的比例。
在一种实施方式中,处理模块402,用于对环境音频数据进行分析,得到第一特征信息;基于第一特征信息生成第一指令;其中,第一特征信息,包括环境音频数据中第一频率的音频分量的响度信息、以及环境音频数据中第一频率的音频分量的出现次数信息中的至少一种。
在一种实施方式中,处理模块402,用于在音频输出装置输出初始音频数据的过程中,响应于第二指令,基于第一频率,对初始音频数据进行处理。
在一种实施方式中,处理模块402,用于在音频输出装置输出多媒体音频数据的过程中,响应于第三指令,启动音频采集装置采集环境音频数据。
在一种实施方式中,初始音频数据,还包括多媒体音频数据;
处理模块402,用于对多媒体音频数据以及环境音频数据进行分析,得到第二特征信息;其中,第二特征信息,包括多媒体音频数据和/或环境音频数据中至少一种频率的音频分量的信息;
处理模块402,还用于基于第二特征信息以及第一频率,对初始音频数据进行处理。
在一种实施方式中,处理模块402,用于若第二特征信息满足第一条件,基于第一频率,对多媒体音频数据进行处理;其中,第一条件,包括多媒体音频数据中第一频率的音频分量的音量,大于环境音频数据中第一频率的音频分量的音量;
处理模块402,还用于若第二特征信息满足第二条件,基于第一频率,对环境音频数据进行处理;其中,第二条件,包括环境音频数据中第一频率的音频分量的音量,大于多媒体音频数据中第一频率的音频分量的音量。
在一种实施方式中,处理模块402,用于若第二特征信息满足第三条件,基于第二特征信息,从初始音频数据中确定第三目标音频数据;其中,第三目标音频数据,为多媒体音频数据和/或环境音频数据;第三条件,包括多媒体音频数据和/或环境音频数据中第一频率的音频分量的音量大于预设阈值;
处理模块402,还用于基于第一频率,对第三目标音频数据进行处理。
基于前述实施例,本申请实施例还提供了另一种音频处理设备4,图5为本申请实施例提供的音频处理设备4的第二结构示意图,如图5所示,音频处理设备4可以包括处理器501以及存储器502;其中,存储器502中存储有计算机程序,处理器501执行该计算机程序时,能够实现如前任一实施例所述的音频处理方法。
需要说明的是,上述处理器501可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。
上述存储器502,可以是易失性存储器(volatile memory),例如随机存取存储器(Random Access Memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,ROM),flash memory,硬盘驱动器(Hard Disk Drive,HDD)或固态硬盘(Solid State Disk,SSD);或者上述种类的存储器的组合,并向处理器501提供指令和数据。
上述获取模块401以及处理模块402可以通过处理器501实现。
基于前述实施例,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序被电子设备的处理器执行时,能实现如前任一实施例所述的音频处理方法。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本申请所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的各产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的各方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
需要说明的是,上述计算机可读存储介质可以是ROM、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件节点的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所描述的方法。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的发热模块以产生一个机器,使得通过计算机或其他可编程数据处理设备的发热模块执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (9)
1.一种音频处理方法,包括:
获取音频处理设备的音频采集装置采集的环境音频数据;其中,所述环境音频数据的频率范围至少包括第一频率以及第二频率;所述第一频率与所述第二频率无交集;所述音频处理设备的音频输出装置输出有初始音频数据;所述初始音频数据包括所述环境音频数据以及多媒体音频数据;
对所述多媒体音频数据以及所述环境音频数据进行分析,得到第二特征信息;所述第二特征信息,包括所述多媒体音频数据和所述环境音频数据中至少一种频率的音频分量的信息;
基于所述第二特征信息以及所述第一频率,对所述初始音频数据进行处理,得到第一目标音频数据;所述第一目标音频数据中所述第一频率的音频分量的比例,小于所述环境音频数据中所述第一频率的音频分量的比例;所述音频处理设备能基于所述第一频率和所述第二频率,对所述音频输出装置输出的所述初始音频数据进行处理。
2.根据权利要求1所述的方法,其中,还包括:
在基于所述环境音频数据的频率范围,对所述初始音频数据进行处理得到第二目标音频数据的过程中,响应于第一指令,基于所述第一频率对所述初始音频数据进行处理;
所述对所述初始音频数据进行处理得到第二目标音频数据,包括:
基于所述第一频率和所述第二频率对所述初始音频数据进行处理,得到所述第二目标音频数据;
其中,所述第二目标音频数据中所述第一频率的音频分量的比例,小于所述环境音频数据中所述第一频率的音频分量的比例;且
所述第二目标音频数据中所述第二频率的音频分量的比例,小于所述环境音频数据中所述第二频率的音频分量的比例。
3.根据权利要求2所述的方法,其中,所述方法还包括:
对所述环境音频数据进行分析,得到第一特征信息;其中,所述第一特征信息,包括所述环境音频数据中所述第一频率的音频分量的响度信息、以及所述环境音频数据中所述第一频率的音频分量的出现次数信息中的至少一种;
基于所述第一特征信息生成所述第一指令。
4.根据权利要求1所述的方法,其中,所述基于所述第一频率,对所述音频处理设备的音频输出装置输出的初始音频数据进行处理,包括:
在所述音频输出装置输出所述初始音频数据的过程中,响应于第二指令,基于所述第一频率,对所述初始音频数据进行处理。
5.根据权利要求1所述的方法,其中,所述获取音频采集装置采集的环境音频数据之前,还包括:
在所述音频输出装置输出多媒体音频数据的过程中,响应于第三指令,启动所述音频采集装置采集所述环境音频数据。
6.根据权利要求5所述的方法,其中,所述基于所述第二特征信息以及所述第一频率,对所述初始音频数据进行处理,包括:
若所述第二特征信息满足第一条件,基于所述第一频率,对所述多媒体音频数据进行处理;其中,所述第一条件,包括所述多媒体音频数据中所述第一频率的音频分量的音量,大于所述环境音频数据中所述第一频率的音频分量的音量;
若所述第二特征信息满足第二条件,基于所述第一频率,对所述环境音频数据进行处理;其中,所述第二条件,包括所述环境音频数据中所述第一频率的音频分量的音量,大于所述多媒体音频数据中所述第一频率的音频分量的音量。
7.根据权利要求5所述的方法,其中,所述基于所述第二特征信息以及所述第一频率,对所述初始音频数据进行处理,包括:
若所述第二特征信息满足第三条件,基于所述第二特征信息,从所述初始音频数据中确定第三目标音频数据;其中,所述第三目标音频数据,为所述多媒体音频数据和/或所述环境音频数据;所述第三条件,包括所述多媒体音频数据和/或环境音频数据中所述第一频率的音频分量的音量大于预设阈值;
基于所述第一频率,对所述第三目标音频数据进行处理。
8.一种音频处理设备,包括:
获取模块,用于获取所述音频处理设备的采集环境音频装置采集的环境音频数据;所述环境音频数据的频率范围至少包括第一频率以及第二频率;所述第一频率与所述第二频率无交集;所述音频处理设备的音频输出装置输出有初始音频数据;所述初始音频数据包括所述环境音频数据以及多媒体音频数据;
处理模块,用于对所述多媒体音频数据以及所述环境音频数据进行分析,得到第二特征信息;所述第二特征信息,包括所述多媒体音频数据和所述环境音频数据中至少一种频率的音频分量的信息;基于所述第二特征信息以及所述第一频率,对所述初始音频数据进行处理,得到第一目标音频数据;其中,所述初始音频数据,至少包括所述环境音频数据;所述第一目标音频数据中所述第一频率的音频分量的比例,小于所述环境音频数据中所述第一频率的音频分量的比例;所述音频处理设备能基于所述第一频率和所述第二频率,对所述音频输出装置输出的所述初始音频数据进行处理。
9.一种音频处理设备,包括处理器和存储器;其中,所述存储器中存储有计算机程序;所述处理器执行所述计算机程序时,能够实现如权利要求1至7任一所述的音频处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111640454.1A CN114390391B (zh) | 2021-12-29 | 2021-12-29 | 一种音频处理方法以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111640454.1A CN114390391B (zh) | 2021-12-29 | 2021-12-29 | 一种音频处理方法以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114390391A CN114390391A (zh) | 2022-04-22 |
CN114390391B true CN114390391B (zh) | 2023-10-27 |
Family
ID=81199596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111640454.1A Active CN114390391B (zh) | 2021-12-29 | 2021-12-29 | 一种音频处理方法以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114390391B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117998251A (zh) * | 2022-11-03 | 2024-05-07 | Oppo广东移动通信有限公司 | 音频信号处理方法及装置、音频播放设备、存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108235818A (zh) * | 2018-01-05 | 2018-06-29 | 万魔声学科技有限公司 | 主动降噪方法、设备及耳机 |
CN108600893A (zh) * | 2018-07-10 | 2018-09-28 | 武汉轻工大学 | 军事环境音频分类系统、方法及军用降噪耳机 |
CN111836147A (zh) * | 2019-04-16 | 2020-10-27 | 华为技术有限公司 | 一种降噪的装置和方法 |
CN107533839B (zh) * | 2015-12-17 | 2021-02-23 | 华为技术有限公司 | 一种对周围环境音的处理方法及设备 |
CN112468918A (zh) * | 2020-11-13 | 2021-03-09 | 北京安声浩朗科技有限公司 | 主动降噪方法、装置、电子设备以及主动降噪耳机 |
CN112785998A (zh) * | 2020-12-29 | 2021-05-11 | 展讯通信(上海)有限公司 | 信号处理方法、设备及装置 |
CN113490089A (zh) * | 2021-06-02 | 2021-10-08 | 安克创新科技股份有限公司 | 降噪控制方法、电子设备及计算机可读存储装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9191744B2 (en) * | 2012-08-09 | 2015-11-17 | Logitech Europe, S.A. | Intelligent ambient sound monitoring system |
US10902866B2 (en) * | 2016-09-08 | 2021-01-26 | Huawei Technologies Co., Ltd. | Sound signal processing method, terminal, and headset |
-
2021
- 2021-12-29 CN CN202111640454.1A patent/CN114390391B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107533839B (zh) * | 2015-12-17 | 2021-02-23 | 华为技术有限公司 | 一种对周围环境音的处理方法及设备 |
CN108235818A (zh) * | 2018-01-05 | 2018-06-29 | 万魔声学科技有限公司 | 主动降噪方法、设备及耳机 |
CN108600893A (zh) * | 2018-07-10 | 2018-09-28 | 武汉轻工大学 | 军事环境音频分类系统、方法及军用降噪耳机 |
CN111836147A (zh) * | 2019-04-16 | 2020-10-27 | 华为技术有限公司 | 一种降噪的装置和方法 |
CN112468918A (zh) * | 2020-11-13 | 2021-03-09 | 北京安声浩朗科技有限公司 | 主动降噪方法、装置、电子设备以及主动降噪耳机 |
CN112785998A (zh) * | 2020-12-29 | 2021-05-11 | 展讯通信(上海)有限公司 | 信号处理方法、设备及装置 |
CN113490089A (zh) * | 2021-06-02 | 2021-10-08 | 安克创新科技股份有限公司 | 降噪控制方法、电子设备及计算机可读存储装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114390391A (zh) | 2022-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10880647B2 (en) | Active acoustic filter with location-based filter characteristics | |
US10466957B2 (en) | Active acoustic filter with automatic selection of filter parameters based on ambient sound | |
CN106464998B (zh) | 用来掩蔽干扰性噪声在耳机与源之间协作处理音频 | |
US8855343B2 (en) | Method and device to maintain audio content level reproduction | |
CN108551604B (zh) | 一种降噪方法、降噪装置及降噪耳机 | |
CN106463107A (zh) | 在耳机与源之间协作处理音频 | |
CN110896509A (zh) | 耳机佩戴状态确定方法、电子设备控制方法及电子设备 | |
WO2014138349A1 (en) | Situational hearing enhancement and protection | |
KR20180021368A (ko) | 상황 인식력을 갖는 스포츠 헤드폰 | |
WO2017045453A1 (zh) | 基于耳机的监听方法及装置 | |
CN114390391B (zh) | 一种音频处理方法以及设备 | |
CN113949955B (zh) | 降噪处理方法、装置、电子设备、耳机及存储介质 | |
CA3147920A1 (en) | Mobile phone based hearing loss correction system | |
JP6151613B2 (ja) | 音声信号振幅抑圧装置 | |
CN112509594A (zh) | 一种终端、发声方法、存储介质及电子装置 | |
CN114466278B (zh) | 一种耳机模式对应的参数确定方法、耳机、终端和系统 | |
CN109068213B (zh) | 一种耳机响度控制方法和装置 | |
CN114095835B (zh) | 耳机通透模式的控制方法、装置、耳机设备及存储介质 | |
CN106856537B (zh) | 一种音量调整方法及装置 | |
CN111800712B (zh) | 一种音频处理方法及电子设备 | |
CN113507668B (zh) | 变频宽的智能控制方法、音频设备及可读存储介质 | |
WO2022230275A1 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
CN112673648B (zh) | 处理装置、处理方法、再现方法以及存储介质 | |
CN115515041A (zh) | 音频播放方法、装置、耳机和存储介质 | |
CN115914911A (zh) | 音频信号处理方法及装置、耳机、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |