CN116055951A - 信号处理方法和电子设备 - Google Patents
信号处理方法和电子设备 Download PDFInfo
- Publication number
- CN116055951A CN116055951A CN202210857030.9A CN202210857030A CN116055951A CN 116055951 A CN116055951 A CN 116055951A CN 202210857030 A CN202210857030 A CN 202210857030A CN 116055951 A CN116055951 A CN 116055951A
- Authority
- CN
- China
- Prior art keywords
- signal
- model
- masking
- acoustic
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 230000000873 masking effect Effects 0.000 claims abstract description 309
- 238000012545 processing Methods 0.000 claims abstract description 174
- 238000001914 filtration Methods 0.000 claims abstract description 122
- 238000000034 method Methods 0.000 claims abstract description 74
- 230000003321 amplification Effects 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 31
- 238000007781 pre-processing Methods 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 26
- 238000009432 framing Methods 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 5
- 230000002829 reductive effect Effects 0.000 abstract description 32
- 238000013461 design Methods 0.000 description 34
- 230000006870 function Effects 0.000 description 24
- 238000004891 communication Methods 0.000 description 21
- 230000004044 response Effects 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000000694 effects Effects 0.000 description 15
- 238000007726 management method Methods 0.000 description 15
- 230000005236 sound signal Effects 0.000 description 14
- 238000005070 sampling Methods 0.000 description 8
- 210000005069 ears Anatomy 0.000 description 7
- 230000035807 sensation Effects 0.000 description 7
- 230000003068 static effect Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 238000013017 mechanical damping Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 230000003416 augmentation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 229910052704 radon Inorganic materials 0.000 description 1
- SYUHGPGVQRZVTB-UHFFFAOYSA-N radon atom Chemical compound [Rn] SYUHGPGVQRZVTB-UHFFFAOYSA-N 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请实施例公开了一种信号处理方法和电子设备,涉及终端领域,应用于包括扬声器的电子设备中,包括:实时获取扬声器的工作电流和工作电压,根据工作电流和工作电压获取声学反馈模型,将音频数字信号输入声学反馈模型,输出音频数字信号等效的声学信号,对等效的声学信号进行掩蔽滤波处理,扬声器播放掩蔽滤波处理之后的声学信号对应的音频。本方案中,基于实时获取的扬声器的工作电流和工作电压获取的声学反馈模型所输出的声学信号可以准确表征扬声器播放音频时人耳的听感,对该声学信号进行掩蔽滤波处理,将声学信号中人耳感知较弱的信号的声压级降低,可以保证扬声器播放该声学信号对应的音频时人耳的听感的同时,降低扬声器的功耗。
Description
技术领域
本申请涉及终端领域,尤其涉及一种信号处理方法和电子设备。
背景技术
随着用户日益增长的对便携式终端的扬声器外放性能的需求,终端扬声器在满足外放性能的同时功耗呈现成倍增加。
现有技术通过抑制扬声器的输入信号中的低频分量,来实现扬声器功耗的降低。但是,这种方法对输入信号的损伤较大,导致扬声器输出的声信号部分缺失,从而影响用户的听感。
发明内容
本申请实施例提供一种信号处理方法和电子设备,实现了在保持终端扬声器外放效果的同时,降低了扬声器功耗的效果。为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供了一种信号处理方法,该方法应用于电子设备中,电子设备包括扬声器,包括:
处理器实时获取扬声器的工作电流和工作电压,根据工作电流和工作电压获取声学反馈模型。将音频数字信号输入声学反馈模型,输出音频数字信号等效的声学信号,对等效的声学信号进行掩蔽滤波处理。扬声器播放掩蔽滤波处理之后的声学信号对应的音频。
其中,音频数字信号可以为编解码器对MP3/MP4/AVI等格式的音频文件进行解码处理而输出的数字信号。
在本实施例中,由于时域掩蔽现象和频域掩蔽现象均是针对心理声学概念上的声学信号的,本实施例中,处理器可以通过实时工作电流和实时工作电压来构建用于输出声学信号的声学反馈模型。处理器将音频数字信号输入至声学反馈模型中,得到音频数字信号的等效的声学信号,该声学信号可以表征人耳听感上的特征,基于该等效的声学信号进行掩蔽滤波处理,将声学信号中人耳感知不到或者人耳听感弱的信号进行滤波剔除,保留人耳可感知的信号的声压级强度。也即,扬声器所播放的音频是经过处理器对人耳感知弱或感知不到的信号经进行滤波处理得到的,其具有较低的能量和强度,扬声器播放该音频时降低了其工作功耗。
结合第一方面,在一种可能的设计方式中,根据工作电流和工作电压获取声学反馈模型,包括:
根据工作电流和工作电压,构建扬声器的阻抗模型;基于阻抗模型确定扬声器的关键力学参数;基于关键力学参数的线性变化与关键力学参数的非线性变化,获取声学反馈模型。
其中,阻抗模型用于表征扬声器的电学参数与关键力学参数之间的关系;电学参数包括工作电流和工作电压;关键力学参数包括扬声器的磁力因子、力阻和劲度系数。
可选地,关键力学参数还可以包括扬声器的直流电阻、机械质量、机械顺性等。这些关键力学参数指的是与扬声器的功耗耦合性较高的力学参数。
在本实施例中,处理器若想得到音频数字信号与其等效的声学信号之间的转换关系,需要构建可实现信号转换的模型。可选地,处理器基于工作电流、工作电压构建扬声器的阻抗模型,阻抗模型中包括了扬声器的电学参数与关键力学参数之间的关系,在确定关键力学参数之后可以基于关键力学参数的线性变换和非线性变化,来构建声学反馈模型。由于扬声器的实际工作状态受到多个因素的影响,扬声器的工作状态影响因素构成比较复杂,这里,基于关键力学参数的非线性变化与线性变化结合分析的方式构建声学反馈模型,该声学反馈模型输出的声学信号更准确,更贴近实际输出至扬声器的音频对应的数字信号。
结合第一方面,在一种可能的设计方式中,基于关键力学参数的线性变化与关键力学参数的非线性变化,获取声学反馈模型,包括:
基于关键力学参数的线性变化,确定扬声器的线性模型;基于关键力学参数进行非线性变化和线性模型,确定扬声器的非线性模型;结合线性模型和非线性模型,获取声学反馈模型。
可选地,扬声器的线性模型表征扬声器结构在工作环境下的线性动态行为,示例性地,扬声器的线性模型可以为线性声学频率响应模型。扬声器的非线性模型表征扬声器结构在工作环境下非线性现象。可选地,处理器可以基于线性模型与非线性模型的卷积,得到声学反馈模型。该声学反馈模型可以比较准确地表征扬声器的实际工作动态。
结合第一方面,在一种可能的设计方式中,基于关键力学参数进行非线性变化和线性模型,确定扬声器的非线性模型,包括:
通过对阻抗模型进行变换处理,得到关键力学参数的非线性变化,基于关键力学参数的非线性变化和线性模型,确定扬声器的非线性模型。
本实施例中,阻抗模型包括关键力学参数与电学参数之间的关系,通过对阻抗模型进行变换可以得到关键力学参数的非线性变化状态。示例性地,处理器可以基于包括磁力因子、力阻、劲度系数之间关系的阻抗模型的变换过程,得到磁场非线性、劲度系数非线性和力阻的非线性的状态方程。基于这些关键力学参数的非线性变化和扬声器的线性模型,可选地,处理器还可以基于这些关键力学参数的非线性变化、扬声器的线性模型以及预设的综合函数经过拉氏变换,得到扬声器的非线性模型。由于关键力学参数的非线性变化可以表示扬声器结构的非线性现象,基于关键力学参数的非线性变化构建的非线性模型比较准确。
结合第一方面,在一种可能的设计方式中,对等效的声学信号进行掩蔽滤波处理,包括:
对等效的声学信号进行频域掩蔽滤波处理,得到频域掩蔽滤波处理之后的等效的声学信号。
在本实施例中,处理器基于频域掩蔽的原理,可以计算得到声学信号的频域掩蔽模型。基于频域掩蔽模型确定各频点的掩蔽音的临近频带的被掩蔽音。其中,被掩蔽音指的是人耳听感较弱或无法感知的信号。处理器在确定被掩蔽音之后,对被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号,也即,得到基于频域掩蔽现象进行滤波处理后的声学信号。经过掩蔽滤波处理后的声学信号具有降低的声压级强度,可以有效降低扬声器播放其对应的音频时的功耗。
结合第一方面,在一种可能的设计方式中,对等效的声学信号进行掩蔽滤波处理,包括:
对等效的声学信号进行时域掩蔽滤波处理,得到时域掩蔽滤波处理之后的等效的声学信号。
在本实施例中,处理器基于时域掩蔽的原理,可以计算得到声学信号的时域掩蔽模型。基于时域掩蔽模型确定各时刻的掩蔽音的前向掩蔽范围内的被掩蔽音和后向掩蔽范围内的被掩蔽音。其中,被掩蔽音指的是人耳听感较弱或无法感知的信号。处理器在确定被掩蔽音之后,对被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号,也即,得到基于时域掩蔽现象进行滤波处理后的声学信号。经过掩蔽滤波处理后的声学信号具有降低的声压级强度,可以有效降低扬声器播放其对应的音频时的功耗。
结合第一方面,在一种可能的设计方式中,对等效的声学信号进行掩蔽滤波处理,包括:
计算等效的声学信号的综合滤波模型,基于综合滤波模型对等效的声学信号进行掩蔽滤波处理,得到掩蔽滤波处理之后的等效的声学信号。
在本实施例中,处理器基于结合频域掩蔽和时域掩蔽的原理,可以计算得到声学信号的综合掩蔽模型。示例性地,综合掩蔽模型可以表现为综合掩蔽曲线,处理器基于综合掩蔽曲线确定声学信号中各掩蔽音所对应的被掩蔽音。处理器对这些被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号。
可选地,处理器还可以对声学信号分别进行频域掩蔽滤波处理和时域掩蔽滤波处理,从而得到经过两次滤波处理的声学信号,也即,得到进行综合性的掩蔽滤波处理的声学信号。
结合第一方面,在一种可能的设计方式中,计算等效的声学信号的综合滤波模型,包括:
计算等效的声学信号的频域掩蔽模型,计算等效的声学信号的时域掩蔽模型,根据频域掩蔽模型和时域掩蔽模型,得到综合滤波模型。
可选地,处理器可以基于频域掩蔽模型的计算方式,计算等效的声学信号的频域掩蔽模型;基于时域掩蔽模型的计算方式,计算等效的声学信号的时域掩蔽模型。示例性地,处理器可以将时域掩蔽模型与频域掩蔽模型的卷积确定为综合滤波模型。
本实施例所得到的综合滤波模型具有时域维度与频域维度的滤波功能,可以更全面地对等效的声学信号中的被掩蔽音进行滤波剔除处理,经过掩蔽滤波处理之后的等效的声学信号具有更低的声压级强度。
结合第一方面,在一种可能的设计方式中,在根据工作电流和工作电压获取声学反馈模型之前,还包括:工作电流和工作电压确定扬声器的实时功耗大于预设功耗阈值。
在本实施例中,需要说明的是,处理器基于工作电流和工作电压计算得到扬声器的实时功耗,在处理器确定实时功耗大于预设功耗阈值的情况下,处理器才执行根据工作电流和工作电压获取声学反馈模型的步骤,从而来基于声学反馈模型处理接收到的音频数字信号,以降低音频数字信号的等效的声学信号的声压级强度。
若处理器确定扬声器的实时功耗小于或等于预设功耗阈值,则处理器直接将接收到的音频数字信号输出至数模转换模块进行数模转换处理,经过数模转换后的音频模拟信号输出至功率放大模块进行功率放大处理,从而扬声器播放功率放大后的音频。
在本实施例中,处理器在确定实时功耗大于预设功耗阈值的情况下才执行基于声学反馈模型的信号处理方法,减少了没必要的信号处理所带来的功耗。
结合第一方面,在一种可能的设计方式中,该方法还包括:
对等效的声学信号进行数模转换,得到等效的声学信号的音频模拟信号,对音频模拟信号进行功率放大处理,得到功率放大之后的音频模拟信号,扬声器播放功率放大之后的音频模拟信号。
在本实施例中,处理器在对等效的声学信号进行掩蔽滤波处理,得到掩蔽滤波处理后的等效声学信号之后,需要将等效的声学信号转换成扬声器可播放的音频。示例性地,可以对等效的声学信号进行数模转换和功率放大处理,从而扬声器播放功率放大之后的音频模拟信号。
在本实施例中,扬声器播放的是经过掩蔽滤波处理的声学信号对应的音频,该声学信号具有比原始信号更低的声压级强度,扬声器播放该声学信号对应的音频时降低了其工作功耗。
结合第一方面,在一种可能的设计方式中,在将音频数字信号输入声学反馈模型之前,方法还包括:
对音频数字信号进行信号预处理,得到信号预处理之后的音频数字信号;信号预处理包括信号分帧处理、信号噪声滤波处理中至少一种。
可选地,经过编解码器进行解码处理之后得到的数字信号会占用比较大的内存,例如,一个时长为3分钟的48kHz音频文件,在进行解码处理后得到的音频数字信号具有3*60*4800个采样点,这里,48kHz表示1s内包括4800个采样点,对处理器的内存与算力均造成一定的压力。
在本实施例中,处理器在得到编解码器输出的音频数字信号,可以按照一定的分帧步进,对音频数字信号进行分帧处理,得到分帧信号。比如,按照10ms的分帧步进,将3*60*4800个采样点按照时序进行划分,得到每10ms为一帧的音频数字信号,其中每10ms中包括864个采样点,便于处理器进行计算。可选地,分帧步进还可以为5ms、20ms,处理器可根据获取到的实际音频文件进行调整。
可选地,处理器还可以对音频数字信号进行信号预处理,比如,音频数字信号中存在背景噪声或者其他干扰噪声,则处理器可以对音频数字信号进行噪声滤波处理,可选地,处理器可以采用常规滤波算法对音频数字信号进行信号预处理,比如,常规滤波算法包括波束算法、噪声抑制等。
本实施例中,处理器对音频数字信号进行分帧处理可以降低处理器的算力,提高处理器对音频数字信号的处理速度;对音频数字信号进行预处理可以初步过滤音频数字信号中的噪声信号,减少噪声信号的干扰。
第二方面,提供一种电子设备,该电子设备包括扬声器和处理器;其中:
处理器,用于实时获取扬声器的工作电流和工作电压;根据工作电流和工作电压获取声学反馈模型;将音频数字信号输入声学反馈模型,输出音频数字信号等效的声学信号;对等效的声学信号进行掩蔽滤波处理;
扬声器,用于播放掩蔽滤波处理之后的声学信号对应的音频。
其中,音频数字信号可以为编解码器对MP3/MP4/AVI等格式的音频文件进行解码处理而输出的数字信号。
在本实施例中,由于时域掩蔽现象和频域掩蔽现象均是针对心理声学概念上的声学信号的,本实施例中,处理器可以通过实时工作电流和实时工作电压来构建用于输出声学信号的声学反馈模型。处理器将音频数字信号输入至声学反馈模型中,得到音频数字信号的等效的声学信号,该声学信号可以表征人耳听感上的特征,基于该等效的声学信号进行掩蔽滤波处理,将声学信号中人耳感知不到或者人耳听感弱的信号进行滤波剔除,保留人耳可感知的信号的声压级强度。也即,扬声器所播放的音频是经过处理器对人耳感知弱或感知不到的信号经进行滤波处理得到的,其具有较低的能量和强度,扬声器播放该音频时降低了其工作功耗。
结合第二方面,在一种可能的设计方式中,处理器,用于根据工作电流和工作电压,构建扬声器的阻抗模型;阻抗模型用于表征扬声器的电学参数与关键力学参数之间的关系;电学参数包括工作电流和工作电压;关键力学参数包括扬声器的磁力因子、力阻和劲度系数;基于阻抗模型确定扬声器的关键力学参数;基于关键力学参数的线性变化与关键力学参数的非线性变化,获取声学反馈模型。
其中,阻抗模型用于表征扬声器的电学参数与关键力学参数之间的关系;电学参数包括工作电流和工作电压;关键力学参数包括扬声器的磁力因子、力阻和劲度系数。
可选地,关键力学参数还可以包括扬声器的直流电阻、机械质量、机械顺性等。这些关键力学参数指的是与扬声器的功耗耦合性较高的力学参数。
在本实施例中,处理器若想得到音频数字信号与其等效的声学信号之间的转换关系,需要构建可实现信号转换的模型。可选地,处理器基于工作电流、工作电压构建扬声器的阻抗模型,阻抗模型中包括了扬声器的电学参数与关键力学参数之间的关系,在确定关键力学参数之后可以基于关键力学参数的线性变换和非线性变化,来构建声学反馈模型。由于扬声器的实际工作状态受到多个因素的影响,扬声器的工作状态影响因素构成比较复杂,这里,基于关键力学参数的非线性变化与线性变化结合分析的方式构建声学反馈模型,该声学反馈模型输出的声学信号更准确,更贴近实际输出至扬声器的音频对应的数字信号。
结合第二方面,在一种可能的设计方式中,处理器,用于基于关键力学参数的线性变化,确定扬声器的线性模型;基于关键力学参数进行非线性变化和线性模型,确定扬声器的非线性模型;结合线性模型和非线性模型,获取声学反馈模型。
可选地,扬声器的线性模型表征扬声器结构在工作环境下的线性动态行为,示例性地,扬声器的线性模型可以为线性声学频率响应模型。扬声器的非线性模型表征扬声器结构在工作环境下非线性现象。可选地,处理器可以基于线性模型与非线性模型的卷积,得到声学反馈模型。该声学反馈模型可以比较准确地表征扬声器的实际工作动态。
结合第二方面,在一种可能的设计方式中,处理器,用于通过对阻抗模型进行变换处理,得到关键力学参数的非线性变化;基于关键力学参数的非线性变化和线性模型,确定扬声器的非线性模型。
本实施例中,阻抗模型包括关键力学参数与电学参数之间的关系,通过对阻抗模型进行变换可以得到关键力学参数的非线性变化状态。示例性地,处理器可以基于包括磁力因子、力阻、劲度系数之间关系的阻抗模型的变换过程,得到磁场非线性、劲度系数非线性和力阻的非线性的状态方程。基于这些关键力学参数的非线性变化和扬声器的线性模型,可选地,处理器还可以基于这些关键力学参数的非线性变化、扬声器的线性模型以及预设的综合函数经过拉氏变换,得到扬声器的非线性模型。由于关键力学参数的非线性变化可以表示扬声器结构的非线性现象,基于关键力学参数的非线性变化构建的非线性模型比较准确。
结合第二方面,在一种可能的设计方式中,处理器,用于对等效的声学信号进行频域掩蔽滤波处理,得到频域掩蔽滤波处理之后的等效的声学信号。
在本实施例中,处理器基于频域掩蔽的原理,可以计算得到声学信号的频域掩蔽模型。基于频域掩蔽模型确定各频点的掩蔽音的临近频带的被掩蔽音。其中,被掩蔽音指的是人耳听感较弱或无法感知的信号。处理器在确定被掩蔽音之后,对被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号,也即,得到基于频域掩蔽现象进行滤波处理后的声学信号。经过掩蔽滤波处理后的声学信号具有降低的声压级强度,可以有效降低扬声器播放其对应的音频时的功耗。
结合第二方面,在一种可能的设计方式中,处理器,用于对等效的声学信号进行时域掩蔽滤波处理,得到时域掩蔽滤波处理之后的等效的声学信号。
在本实施例中,处理器基于时域掩蔽的原理,可以计算得到声学信号的时域掩蔽模型。基于时域掩蔽模型确定各时刻的掩蔽音的前向掩蔽范围内的被掩蔽音和后向掩蔽范围内的被掩蔽音。其中,被掩蔽音指的是人耳听感较弱或无法感知的信号。处理器在确定被掩蔽音之后,对被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号,也即,得到基于时域掩蔽现象进行滤波处理后的声学信号。经过掩蔽滤波处理后的声学信号具有降低的声压级强度,可以有效降低扬声器播放其对应的音频时的功耗。
结合第二方面,在一种可能的设计方式中,处理器,用于计算等效的声学信号的综合滤波模型;基于综合滤波模型对等效的声学信号进行掩蔽滤波处理,得到掩蔽滤波处理之后的等效的声学信号。
在本实施例中,处理器基于结合频域掩蔽和时域掩蔽的原理,可以计算得到声学信号的综合掩蔽模型。示例性地,综合掩蔽模型可以表现为综合掩蔽曲线,处理器基于综合掩蔽曲线确定声学信号中各掩蔽音所对应的被掩蔽音。处理器对这些被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号。
可选地,处理器还可以对声学信号分别进行频域掩蔽滤波处理和时域掩蔽滤波处理,从而得到经过两次滤波处理的声学信号,也即,得到进行综合性的掩蔽滤波处理的声学信号。
结合第一方面,在一种可能的设计方式中,处理器,用于计算等效的声学信号的频域掩蔽模型;计算等效的声学信号的时域掩蔽模型;根据频域掩蔽模型和时域掩蔽模型,得到综合滤波模型。
可选地,处理器可以基于频域掩蔽模型的计算方式,计算等效的声学信号的频域掩蔽模型;基于时域掩蔽模型的计算方式,计算等效的声学信号的时域掩蔽模型。示例性地,处理器可以将时域掩蔽模型与频域掩蔽模型的卷积确定为综合滤波模型。
本实施例所得到的综合滤波模型具有时域维度与频域维度的滤波功能,可以更全面地对等效的声学信号中的被掩蔽音进行滤波剔除处理,经过掩蔽滤波处理之后的等效的声学信号具有更低的声压级强度。
结合第二方面,在一种可能的设计方式中,处理器,还用于工作电流和工作电压确定扬声器的实时功耗大于预设功耗阈值。
在本实施例中,处理器在确定实时功耗大于预设功耗阈值的情况下才执行基于声学反馈模型的信号处理方法,减少了没必要的信号处理所带来的功耗。
结合第二方面,在一种可能的设计方式中,上述电子设备还包括数模转换模块和反馈模块。
数模转换模块,用于对等效的声学信号进行数模转换,得到等效的声学信号的音频模拟信号。
反馈模块,用于对音频模拟信号进行功率放大处理,得到功率放大之后的音频模拟信号。
扬声器,用于播放功率放大之后的音频模拟信号。
在本实施例中,处理器在对等效的声学信号进行掩蔽滤波处理,得到掩蔽滤波处理后的等效声学信号之后,需要将等效的声学信号转换成扬声器可播放的音频。示例性地,可以对等效的声学信号进行数模转换和功率放大处理,从而扬声器播放功率放大之后的音频模拟信号。
在本实施例中,扬声器播放的是经过掩蔽滤波处理的声学信号对应的音频,该声学信号具有比原始信号更低的声压级强度,扬声器播放该声学信号对应的音频时降低了其工作功耗。
结合第二方面,在一种可能的设计方式中,处理器,还用于对音频数字信号进行信号预处理,得到信号预处理之后的音频数字信号;信号预处理包括信号分帧处理、信号噪声滤波处理中至少一种。
本实施例中,处理器对音频数字信号进行分帧处理可以降低处理器的算力,提高处理器对音频数字信号的处理速度;对音频数字信号进行预处理可以初步过滤音频数字信号中的噪声信号,减少噪声信号的干扰。
第三方面,提供了一种电子设备,该电子设备包括存储器、扬声器和一个或多个处理器;存储器、扬声器与处理器耦合;存储器中存储有计算机程序代码,计算机程序代码包括计算机指令,当计算机指令被所述处理器执行时,使得电子设备执行如上述第一方面中任一项所述的方法。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在电子设备上运行时,使得电子设备可以执行上述第一方面中任一项所述的方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备可以执行上述第一方面中任一项所述的方法。
可以理解地,上述提供的第二方面、第三方面及其任一种可能的设计方式所述的电子设备,第四方面所述的计算机可读存储介质,第五方面所述的计算机程序产品所能达到的有益效果,可参考第一方面及其任一种可能的设计方式中的有益效果,此处不再赘述。
附图说明
图1为本申请实施例提供的一种电子设备的结构示意图;
图2为本申请实施例提供的一种频域掩蔽的原理示意图;
图3为本申请实施例提供的一种频域掩蔽处理后原信号、频域掩蔽模型以及绝对听阈曲线的示意图;
图4为本申请实施例提供的一种时域掩蔽的原理示意图;
图5为一种信号处理方法的信号处理流程示意图;
图6为另一种信号处理方法的信号处理流程示意图;
图7为又一种信号处理方法的信号处理流程示意图;
图8为本申请实施例提供的一种信号处理方法的信号处理流程示意图;
图9为本申请实施例提供的一种信号处理方法的过程示意图;
图10为本申请实施例提供的一种构建反馈声学模型的过程示意图;
图11为本申请实施例提供的一种电子设备的结构示意图;
图12为本申请实施例提供的另一种电子设备的结构示意图。
具体实施方式
在本申请实施例的描述中,以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一种”、“所述”、“上述”、“该”和“这一”旨在也包括例如“一个或多个”这种表达形式,除非其上下文中明确地有相反指示。还应当理解,在本申请以下各实施例中,“至少一个”、“一个或多个”是指一个或两个以上(包含两个)。术语“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系;例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。
在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。术语“连接”包括直接连接和间接连接,除非另外说明。“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
本实施例所提供的信号处理方法可应用于包含扬声器的电子设备中。本申请实施例中的电子设备可以为便携式计算机(如手机)、平板电脑、笔记本电脑、个人计算机(personal computer,PC)、可穿戴电子设备(如智能手表)、增强现实(augmented reality,AR)\虚拟现实(virtual reality,VR)设备、车载电脑、电视、带有扬声器的显示屏等,以下实施例对该电子设备的具体形式不做特殊限制。
请参考图1,其示出本申请实施例提供一种电子设备(如电子设备100)的结构框图。其中,电子设备100可以包括处理器310,外部存储器接口320,内部存储器321,通用串行总线(universal serial bus,USB)接口330,充电管理模块340,电源管理模块341,电池342,天线1,天线2,射频模块350,通信模块360,音频模块370,扬声器370A,受话器370B,麦克风370C,耳机接口370D,显示屏380以及功率放大器390。
本发明实施例示意的结构并不构成对电子设备100的限定。可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器310可以包括一个或多个处理单元。例如,处理器310可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,数字信号处理器DSP用于处理数字信号,例如,处理数字声音信号、数字图像信号等,数字信号处理器还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器DSP用于对频点能量进行傅里叶变换等。数字信号处理器DSP用于对编解码器传输的音频数字信号进行信号处理,并将信号处理之后的信号经过音频模块370、功率放大器390输出至扬声器370A中。
编解码器用于对数字视频文件、数字音频文件进行压缩或解压缩操作。电子设备100可以支持一种或多种编解码器。比如,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。比如,电子设备100可以播放或录制多种编码格式的音频,例如,MP3/MP4/AVI等格式。
功率放大器390用于对信号进行信号功率放大处理。可选地,功率放大器390可以为智能功率放大器(smart power amplifier,SMPA)等。
处理器310中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器310中的存储器为高速缓冲存储器,可以保存处理器310刚用过或循环使用的指令或数据。如果处理器310需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器310的等待时间,因而提高了系统的效率。
在一些实施例中,处理器310可以包括接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuit sound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,SIM接口,和/或USB接口等。
本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。电子设备100可以采用本发明实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块340用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块340可以通过USB接口330接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块340可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块340为电池342充电的同时,还可以通过电源管理模块341为电子设备100供电。
电源管理模块341用于连接电池342,充电管理模块340与处理器310。电源管理模块341接收所述电池342和/或充电管理模块340的输入,为处理器310,内部存储器321,外部存储器接口320,显示屏380,摄像头393,和通信模块360等供电。电源管理模块341还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在一些实施例中,电源管理模块341也可以设置于处理器310中。在一些实施例中,电源管理模块341和充电管理模块340也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,射频模块350,通信模块360,调制解调器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将蜂窝网天线复用为无线局域网分集天线。在一些实施例中,天线可以和调谐开关结合使用。
射频模块350可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案的通信处理模块。射频模块350可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。射频模块350由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调器进行解调。射频模块350还可以对经调制解调器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,射频模块350的至少部分功能模块可以被设置于处理器310中。在一些实施例中,射频模块350的至少部分功能模块可以与处理器310的至少部分模块被设置在同一个器件中。
调制解调器可以包括调制器和解调器。调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器370A,受话器370B等)输出声音信号,或通过显示屏394显示图像或视频。在一些实施例中,调制解调器可以是独立的器件。在一些实施例中,调制解调器可以独立于处理器310,与射频模块350或其他功能模块设置在同一个器件中。
通信模块360可以提供应用在电子设备100上的包括无线局域网(wireless localarea networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(blue tooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequencymodulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案的通信处理模块。通信模块360可以是集成至少一个通信处理模块的一个或多个器件。通信模块360经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器310。通信模块360还可以从处理器310接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和射频模块350耦合,天线2和通信模块360耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(code divisionmultiple access,CDMA),宽带码分多址(wideband codedivisionmultiple access,WCDMA),时分码分多址(time-division codedivisionmultiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(satellite based augmentation systems,SBAS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(BeiDounavigation satellite system,BDS),准天顶卫星系统(Quasi-Zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏380,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏380和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器310可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏380用于显示图像,视频等。例如,显示屏380可以显示来电提醒界面和语音通话界面。本申请实施例中,如果电子设备100接收到对端在第一应用中发起的应用内呼叫请求,电子设备100的显示屏380可以显示包括第一应用的业务信息的语音通话界面。显示屏380包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emitting diode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode,AMOLED),柔性发光二极管(flex light-emitting diode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot light emitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏394,N为大于1的正整数。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口320可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口320与处理器310通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器321可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器310通过运行存储在内部存储器321的指令,从而执行电子设备100的各种功能应用以及数据处理。存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,其他易失性固态存储器件,通用闪存存储器(universal flashstorage,UFS)等。
电子设备100可以通过音频模块370,扬声器370A,受话器370B,麦克风370C,耳机接口370D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块370用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。在本实施例中,示例性地,音频模块370可以为数模转换单元。可选地,该音频模块370可以设置于处理器310中,或将音频模块370的部分功能模块设置于处理器310中。
扬声器370A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器370A播放音乐。本实施例中所提供的信号处理方法,就是对待输出至扬声器370A的信号进行信号处理,从而降低扬声器370A的功耗。
受话器370B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器370B靠近人耳接听语音。
麦克风370C,也称“话筒”,“传声器”,用于将声音信号转换为音频电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风370C发声,将声音信号输入到麦克风370C。电子设备100可以设置至少一个麦克风370C。在一些实施例中,电子设备100可以设置两个麦克风370C,除了采集声音信号,还可以实现降噪功能。在一些实施例中,电子设备100还可以设置三个,四个或更多麦克风370C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口370D用于连接有线耳机。耳机接口370D可以是USB接口330,也可以是3.5mm的开放移动终端平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
在电子设备播放音频时,处理器中的编解码器会将音频文件进行解码处理,得到音频数字信号,处理器中的DSP会对音频数字信号进行噪声滤波处理,经过噪声滤波处理的音频数字信号由音频模块370进行数模转换处理,经过数模转换处理的音频模拟信号由功率放大器390进行功率放大处理,得到功率放大处理之后音频,通过扬声器370A播放该音频。在扬声器370A播放音频的场景下,人耳对播放的音频中的某些音频模拟信号的听感较弱,这些听感较弱的音频模拟信号实际上被听感较强的音频模拟信号所影响,在心理声学概念上,这种影响叫做掩蔽现象。掩蔽现象包括频域掩蔽(simultaneous masking,SM)现象和时域掩蔽(temporal masking,TM)现象。
为了下述各实施例的描述清楚简洁,首先给出相关概念或技术的简要介绍:
频域掩蔽(simultaneous masking,SM):指的是在同一个音频系统中,声压级较高的信号(掩蔽音)的听感会影响其相邻频域内的声压级较低的信号(被掩蔽音)的听感,使得人耳无法感知该相邻频域的声压级较低的信号。
其中,频域掩蔽的类型包括音调掩蔽噪声(tone masking noise,TMN)、噪声掩蔽音调(noise masking tone,NMT)、噪声掩蔽噪声(noise masking noise,NMN)等。图2给出了一种频域掩蔽现象的示意图,在临界频带的相邻频带内声压级较高的信号会影响声压级较低的信号,使得人耳对声压级较低的信号感知不到。其中,图2所示的阴影部分为临界频带,临界频带表征人类最主要的听觉特性,在加宽噪声带宽时,最初是掩蔽量增大,但带宽超过某一定值后,掩蔽量就不再增加,这一带宽就称为临界频带。图2示例中,还给出了掩蔽门限曲线与SMR、SNR、MNR之间的关系。SMR(signal-to-maskratio)指在一个临界频带内,从掩蔽音到最小掩蔽门限的距离,其中,在掩蔽现象下,提高被掩蔽音的强度,使人耳能够听见时的最小闻阈称为最小掩蔽门限;SNR(signal-to-noiseratio)指原信号经过m位元量化后的信噪比,等于量化前信号方差和量化噪声的方差之比;MNR(mask-to-noise)用于表示人耳可以感知的参数。MNR数值等于SNR与SMR的差值。
信号的频域掩蔽模型的计算,就是计算出信号在各个频点的上斜率(upper斜率)以及下斜率(lower斜率)。图3给出了一种原信号、频域掩蔽模型以及绝对听阈曲线的示意图。其中,绝对听阈指的是在安静环境里无任何其它声音干扰的情况下,人耳能听到声音所具有的最小声压级,基于不同的频点和在不同频点人耳可以听到的声音的最小声压级绘制绝对听阈曲线。如图3所示,图中点线为原信号频谱,实线为计算出的频域掩蔽模型,下方的虚线曲线为绝对听阈曲线,横轴为频域Bark,纵轴为声压级(sound pressure level,SPL)。其中,频域掩蔽模型是基于原信号频谱计算各个频点的upper斜率以及lower斜率得到的。upper斜率Su与lower斜率Sl的计算方式如下:
其中,L[k,n]=10·log10(Pp[k,n]),Pp[k,n]为传统的音高模型;k为频点;n为帧数。
通过上述计算方法对信号进行处理可以得到信号对应的频域掩蔽模型。
时域掩蔽TM:指的是在声压级较高的信号(掩蔽音)对其之前一段时间内的声压级较低的信号(被掩蔽音)、或与其同时出现的声压级较低的信号(被掩蔽音)、或再其之后一段时间内的声压级较低的信号(被掩蔽音)的听感产生影响,使得人耳对声压级较低的信号感知不到的现象。
其中,根据掩蔽音与被掩蔽音在时域上时序的不同,时域掩蔽包括前向掩蔽(forward masking,FM)、同时掩蔽(可理解为频域掩蔽)、后向掩蔽(backward masking,BM)。前向掩蔽指的是掩蔽音出现在被掩蔽音时序之后的现象,大约5~20ms;后向掩蔽指的是掩蔽音出现在被掩蔽音时序之前的现象,持续时间大约50~200ms;同时掩蔽指的是掩蔽音与被掩蔽音在时序上同时出现的现象。图4给出了一种在时域掩蔽的示意图,其中包括掩蔽音造成的前向掩蔽的信号范围以及后向掩蔽的信号范围,图中阴影部分为掩蔽音,横轴为信号时序,纵轴为声压级SPL。
信号的时域掩蔽模型的计算,可以通过先构建激励模型目[k,n],再基于激励模型得到时域掩蔽模型,如下所示:
Ef[k,n]=α·Ef[k,n-1]+(1-α)·E2[k,n]
E[k,n]=max(Ef[k,n],E2[k,n])
其中,E2[k,n]为频带间的扩展函数;k为频点;n为帧数。
α、τ的计算表示如下:
根据上述激励模型E[k,n]得到时域掩蔽模型M[k,n],表示为:
其中:
res为音高模型缩放因子的分辨率,res为常数。
基于上述计算方法对信号进行处理可以得到信号对应的时域掩蔽模型。
结合上述可知,从频域维度来说,扬声器播放的音频存在由于频域掩蔽而导致人耳可能感知不到的信号;从时域维度来说,扬声器播放的音频存在由于时域掩蔽而导致人耳可能感知不到的信号。
在用户对便携式电子设备的扬声器外放性能的需求增长导致电子设备的扬声器功耗呈现成倍增加的场景下,可通过对人耳感知不到的信号进行滤波处理,以此降低输出信号的信号声压级,从而降低电子设备的扬声器在播放音频时产生的功耗。
在一种现有方法中,对音频数字信号中的低频分量进行抑制处理,以降低电子设备播放音频的功耗。示例性的,信号处理过程可参考图5所示。图5中,输入信号可以为编解码器输出的音频数字信号,在处理器接收到音频数字信号之后,对音频数字信号中的低频分量进行抑制处理,将抑制处理之后的音频数字信号进行数模转换处理,得到音频模拟信号(音频),音频模拟信号经过功率放大器进行功率放大,最终由扬声器播放进过功率放大的音频。由于低频分量并不能表示就是人耳感知不到的信号,因此,这种方法中笼统地对音频数字信号的低频分量进行抑制处理,对音频数字信号的损伤较大,影响最终人耳的听感。
在另一种现有方法中,基于频域掩蔽现象对音频数字信号进行滤波处理,以降低电子设备播放音频的功耗。示例性地,其信号处理过程可参考图6所示。图6中,输入信号可以为编解码器输出的音频数字信号,在处理器接收到音频数字信号之后,基于频域掩蔽现象对音频数字信号进行滤波处理,将滤波处理之后的音频数字信号进行数模转换处理,得到音频模拟信号(音频),音频模拟信号经过功率放大器进行功率放大,最终由扬声器播放进过功率放大的音频。这种方法可以在频域维度将音频数字信号中声压级较低的信号进行滤波处理,降低了整个音频数字信号的声压级强度,对应地一定程度上降低了扬声器播放该音频的功耗,但是这种方法忽略了声学结构的影响,扬声器功耗优化程度不佳。
在又一种现有方法中,可以基于扬声器的出厂参数对扬声器进行线性建模,得到静态扬声器传递函数,基于该静态扬声器传递函数和频域掩蔽现象对接收到的音频数字信号滤波处理,以降低电子设备播放音频的功耗。示例性地,其信号处理过程可参考图7所示。图7中,输入信号可以为编解码器输出的音频数字信号,在处理器接收到音频数字信号之后,基于静态扬声器传递函数和频域掩蔽现象对接收到的音频数字信号滤波处理,将滤波处理之后的音频数字信号进行数模转换处理,得到音频模拟信号(音频),音频模拟信号经过功率放大器进行功率放大,最终由扬声器播放进过功率放大的音频。这种方法中,静态扬声器传递函数是基于扬声器的出厂参数构建的,出厂参数无法表征扬声器在实际工作中的动态变化,因此基于该静态扬声器传递函数无法准确表示扬声器的实际工作状态,基于该静态扬声器传递函数对音频数字信号进行频域掩蔽现象的滤波处理,所得到的滤波处理的效果不准确,导致扬声器功耗优化效果不佳。
本实施例提供一种信号处理方法,应用于上述图1所示的电子设备,在一种示例中,电子设备100包括反馈模块,用于采集扬声器实时工作电流、电压信号,并将该实时工作电流、电压信号传输至处理器。例如,反馈模块可以为功率放大器,比如功率放大器可以为SMPA。示例性地,参考图8所示,图8给出了一种基于各模块的信号处理流程示意图,以处理器为DSP、反馈模块为SMPA为例来说明。在本实施例中,SMPA可实时获取扬声器的工作电流电压信号,并将获取到的实时工作电流电压信号反馈至DSP中。DSP基于该实时工作电流电压信号构建并更新扬声器的声学反馈模型。在DSP接收到编解码器传输的音频数字信号之后,将音频数字信号输入至声学反馈模型中,得到与音频数字信号的等效的声学信号,基于时域掩蔽现象与频域掩蔽现象对声学信号进行掩蔽滤波处理,经过掩蔽滤波处理之后的音频数字信号经过数模转换模块进行数模转换,得到对应的音频模拟信号(音频),音频模拟信号经过SMPA的功率放大处理,最终输出至扬声器中,扬声器播放该音频。
其中,由于SMPA获取到的扬声器的实时工作电流电压信号可以准确地表示扬声器在播放音频时所处于的工作状态,因此,DSP基于实时工作电流电压信号构建并更新的声学反馈模型可以准确表征扬声器播放音频时的人耳的听感的情况。对应地,声学反馈模型输出的声学信号更准确。进一步地,基于时域掩蔽现象与频域掩蔽现象对声学信号进行掩蔽滤波处理,从两个维度进行滤波,滤波效果更好。基于此,本实施例提出的信号处理方法可以在最大程度保证扬声器播放音频时的人耳听感的同时,大大降低扬声器的功耗。
基于图1所示的电子设备的硬件结构与图8所示的本实施例提供的信号处理的流程示意图,介绍本公开实施例提供了一种信号处理方法,以下实施例中,均以处理器为DSP,反馈模块为SMPA为例来说明,参见图9,图9给出了本实施例提供的信号处理方法的整个方案的步骤流程图,包括编解码器执行的步骤、DSP执行的步骤、数模转换模块执行的步骤、SMPA执行的步骤以及扬声器执行的步骤。具体包括:
S201、编解码器对音频文件进行解码得到音频数字信号,向DSP输出该音频数字信号。
示例性地,音频数字信号可以为编解码器对MP3/MP4/AVI等格式的音频文件进行解码处理而输出的数字信号。
S202、DSP对音频数字信号进行分帧处理与信号预处理,得到经过分帧处理与信号预处理之后的音频数字信号。
可选地,在一些实施例中,编解码器进行解码处理之后得到的数字信号会占用比较大的内存,例如,一个时长为3分钟的48kHz音频文件,在进行解码处理后得到的音频数字信号具有3*60*4800个采样点,这里,48kHz表示1s内包括4800个采样点。DSP无法一次性对3*60*4800个采样点进行处理,这对内存与算力均造成一定的压力。因此,在本实施例中,DSP在得到编解码器输出的音频数字信号,可以按照一定的分帧步进,对音频数字信号进行分帧处理,得到分帧信号。比如,按照10ms的分帧步进,将3*60*4800个采样点按照时序进行划分,得到每10ms为一帧的音频数字信号,其中每10ms中包括864个采样点,便于DSP进行计算。可选地,分帧步进还可以为5ms、20ms,DSP可根据获取到的实际音频文件进行调整。
可选地,DSP还可以对音频数字信号进行信号预处理,比如,音频数字信号中存在背景噪声或者其他干扰噪声,则DSP可以对音频数字信号进行噪声滤波处理,可选地,DSP可以采用常规滤波算法对音频数字信号进行信号预处理,比如,常规滤波算法包括波束算法、噪声抑制等。本实施例不做赘述。
本实施例中,DSP对音频数字信号进行分帧处理可以降低DSP的算力,提高DSP对音频数字信号的处理速度;对音频数字信号进行预处理可以初步过滤音频数字信号中的噪声信号,减少噪声信号的干扰。需要说明的是,本实施例对音频数字信号进行分帧处理和信号预处理的处理顺序不做限定。
S203、DSP基于SMPA反馈的扬声器的实时工作电流和实时工作电压计算扬声器的实时功耗。
在本实施例中,SMPA可以获取扬声器的实时工作电流和实时工作电压,并将实时工作电流和实时工作电压反馈至DSP中。以此,DSP可以根据实时工作电流和实时工作电压计算扬声器的实时功耗。
示例性地,DSP基于获取到的第t时刻的工作电压为V(t)、第t时刻的工作电流为I(t),计算第t时刻的实时功耗的方式如下:
P(t)=V(t)×I(t)
其中:
其中,Q为定标,与音频信号的格式有关。例如,输入信号为16bit的音频信号,则Q为15;输入信号为32bit的音频信号,则Q为31。vmax为电压最大值;imax为电流最大值。
S204、DSP判断扬声器的实时功耗是否大于预设功耗阈值,若实时功耗大于预设功耗阈值,则执行步骤S205;若实时功耗不大于预设功耗阈值,则执行步骤207。
其中,预设功耗阈值根据扬声器的实际工作状态确定,不同扬声器的预设功耗阈值可以不同。比如,针对于智能音箱,由于智能音箱的扬声器使用频繁,且一般的智能音箱通过扬声器播放音频的音量较大,其产生的工作电流会处于较大的状态,对应地,预设功耗阈值可以设置的偏高一点;针对于使用不那么频繁,且一般播放音量较小音频的设备,比如,智能手表、手机等,通常情况下会通过扬声器播放音量较小的音频,其产生的工作电流没那么大,对应地,预设的功耗阈值可以设置的偏低一点。
由于DSP实施本实施例提供的信号处理方法也会产生一定的功耗,DSP可以根据扬声器的实时功耗与预设功耗阈值的大小关系来确定对音频数字信号的处理方式。
在一种情况下,DSP在确定扬声器的实时功耗小于或等于预设功耗阈值的情况下,则确定不需要对扬声器进行功耗优化处理,也即,不需要对输入信号进行基于声学反馈模型的信号处理。在这种情况下,DSP对输入信号进行常规信号处理。示例性地,DSP将分帧处理以及信号预处理之后的音频数字信号传输至数模转换模块,数模转换模块对接收到的音频数字信号进行数模转换,得到与该音频数字信号对应的音频模拟信号,从而将该音频模拟信号输出至功率放大器(SMPA)中,经过功率放大器对该音频模拟信号进行功率放大处理,最终将功率放大处理后的音频模拟信号(音频)输出至扬声器中。也即,在确定扬声器的实时功耗小于或等于预设功耗阈值的情况下,执行S207以及之后的步骤。
在另外一种情况下,在扬声器的功耗大于预设功耗阈值的情况下,说明当前扬声器的功耗需要进行降低优化,在这种情况下,DSP需要基于扬声器的实时工作电流和实时工作电压获取声学反馈模型,基于声学反馈模型对经过分帧处理与信号预处理的音频数字信号进行信号滤波处理,也即,执行S205的步骤。
S205、DSP根据实时工作电流和实时工作电压获取声学反馈模型,并将音频数字信号输入至声学反馈模型中,得到音频数字信号的等效的声学信号。
由于时域掩蔽现象和频域掩蔽现象均是针对心理声学概念上的声学信号的,本实施例中,DSP可以通过实时工作电流和实时工作电压构建声学反馈模型,进一步地,DSP还可以根据实时工作电流和实时工作电压获取声学反馈模型来更新声学反馈模型。在得到声学反馈模型之后,DSP将经过分帧处理与信号预处理的音频数字信号输入至声学反馈模型中,来得到音频数字信号的等效的声学信号。该声学信号可以表征人耳听感上的特征,基于该等效的声学信号进行后续掩蔽滤波处理,可以更准确地将人耳感知不到的信号声压级强度降低,保留人耳可感知的信号的声压级强度。
本实施例中可以基于扬声器的实时工作电流、实时工作电压以及扬声器的力学参数来构建声学反馈模型。示例性地,扬声器的力学参数可以包括机械阻尼因子、机械质量、机械顺性、磁力因子、直流电阻等,这些力学参数的线性变化与非线性变化可以表示扬声器不同的工作状态,从而基于这些力学参数的线性变化与非线性变化来构建声学反馈模型,得到的声学反馈模型输出的结果可以更准确。
可选地,在一种实施例中,DSP可以基于实时工作电流、实时工作电压以及扬声器的力学参数的线性变化,构建扬声器的线性模型;基于实时工作电流、实时工作电压以及扬声器的力学参数的非线性变化,构建扬声器的非线性模型。从而基于线性模型和非线性模型,来构建声学反馈模型。以此而构建的声学反馈模型可以表征扬声器力学参数的线性变化和非线性变化,使得其输出的声学信号更准确。
在一些实施例中,提供了一种基于实时工作电流、实时工作电压以及扬声器的其他的力学参数构建声学反馈模型的方法,可参考图10,包括:
S2051、DSP根据扬声器的工作电流和工作电压构建扬声器的阻抗模型,并基于阻抗模型确定扬声器的关键力学参数。
示例性地,DSP可以在接收到SMPA反馈的工作电流和工作电压之后,基于工作电流和工作电压构建扬声器的阻抗模型。可选地,阻抗模型还可以为其他机械模型。基于阻抗模型,DSP可以确定与扬声器工作状态耦合性较高的关键力学参数。示例性地,关键力学参数可以包括机械阻尼因子、机械质量、机械顺性、磁力因子、直流电阻等。
在一种可选地的实施方式中,DSP基于扬声器的工作电流和工作电压构建阻抗模型,该阻抗模型Z(s)的构建过程可以包括:
由工作电流i、工作电压Ue以及扬声器的力学参数直流电阻Re、机械阻尼因子Rms、机械质量Mms、机械顺性Cms、磁力因子Bl之间的关系,可以得到:
经过拉普拉斯变化,可以得到:
Ue=Re.I+Bl.sX
消除位移X,可以得到阻抗模型Z(s)为:
根据上述阻抗模型Z(s)确定关键力学参数,示例性地,关键力学参数包括扬声器的直流电阻Re、机械阻尼因子Rms、机械质量Mms、机械顺性Cms、磁力因子Bl等。
S2052、DSP根据关键力学参数构建扬声器的线性声学频率响应模型。
在确定关键力学参数之后,DSP可以根据这些关键力学参数构建线性声学频率响应模型,该线性声学频率响应模型用于表征扬声器的关键力学参数的线性变化。示例性地,关键力学参数包括扬声器的直流电阻Re、力阻Rms、机械质量Mms、机械顺性Cms、磁力因子Bl,线性声学频率响应模型G(s)可以表示为:
其中Qts可由Qms和Qes计算得到:
其中,Km为劲度系数。
由此,DSP可以基于关键力学参数得到扬声器的线性声学频率响应模型G(s)。
S2053、DSP通过对阻抗模型的变换,得到关键力学参数的非线性变化。
在本实施例中,DSP通过对阻抗模型进行变换,得到关键力学参数的非线性变化,进一步地,可选地,DSP还可以基于关键力学参数的非线性变化,得到其对应的非线性状态方程。示例性地,DSP对阻抗模型进行变换可以是对阻抗模型进行傅里叶变换。通过对阻抗模型进行变换得到关于磁力因子Bl、力阻Rms、劲度系数Kms等关键力学参数的非线性变化可以表示为:
nx=[Bl(x),Kms(x),Rms(v)]T
结合机械质量Mms,关键力学参数的非线性变化对应地非线性状态方程可以表示为:
f(nx)=f(Bl(x),Kms(x),Rms(v),Mms)
S2054、DSP基于关键力学参数的非线性变化和线性声学频率响应模型,构建非线性声学频率响应模型。
在本实施例中,线性声学频率响应模型表示扬声器的关键力学参数的线性变化,DSP根据非线性状态和线性声学频率响应模型,得到非线性声学频率响应模型NL(s)。本实施例中,DSP基于关键力学参数的非线性变化,构建非线性声学频率响应模型,示例性地,关键力学参数的非线性变化包括磁场非线性Bl(x)、劲度系数非线性Kms(x)和力阻Rms(v)的非线性,非线性声学频率响应模型NL(s)可以表示为:
其中,F(s)=L{f(nx)},L{·}表示拉氏变换,SYN(.)是预设的综合函数。
S2055、DSP基于非线性声学频率响应模型和线性声学频率响应模型,确定声学反馈模型。
在DSP得到非线性声学频率响应模型和线性声学频率响应模型之后,可以对其进行卷积,得到声学反馈模型FA(s),声学反馈模型FA(s)的计算方式可如下表示:
FA(s)=G(s)*NL(s)
在根据扬声器的工作电流、工作电压以及关键力学参数构建声学反馈模型之后,DSP可以基于声学反馈模型对接收到的音频数字信号进行信号处理,得到音频数字信号的等效的声学信号,该声学信号可以表征人耳听感上的特征。在本实施例中,DSP可以根据SMPA实时反馈的扬声器的实时工作电流和实时工作电压更新声学反馈模型,使得声学反馈模型可以通过不断更新使其输出的声学信号对应的音频达到最贴合扬声器工作输出的音频状态,从而基于声学反馈模型输出的的声学信号具有较高的精确性。
S206、DSP对等效的声学信号进行掩蔽滤波处理,得到掩蔽滤波处理之后的声学信号。
在DSP基于声学反馈模型得到音频数字信号的等效的声学信号之后,DSP可以基于时域掩蔽和频域掩蔽对该声学信号进行掩蔽滤波处理。
可选地,在一种可行的方式中,DSP可以基于频域掩蔽现象对该声学信号中掩蔽音的临近频带中的被掩蔽音进行掩蔽滤波处理,从而得到基于频域掩蔽现象进行滤波处理后的声学信号。
在本实施例中,DSP基于上述频域掩蔽的原理,可以计算得到声学信号的频域掩蔽模型。示例性地,频域掩蔽模型可以表现为频域掩蔽曲线,可参考图3,图3中与原信号(声学信号)的实线曲线形状相似、存在交叠的虚线曲线即为计算得到的原信号(声学信号)的频域掩蔽曲线。基于该频域掩蔽曲线,DSP可以获取声学信号的各个频点的掩蔽音的临近频带中的被掩蔽音,被掩蔽音指的是人耳听感较弱或无法感知的信号。DSP在获取到这些被掩蔽音之后,对这些被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号,也即,得到基于频域掩蔽现象进行滤波处理后的声学信号。
可选地,在另一种可行的方式中,DSP还可以基于时域掩蔽现象对该声学信号中掩蔽音的前后时序范围内的被掩蔽音进行掩蔽滤波处理,从而得到基于时域掩蔽现象进行滤波处理后的声学信号。
在本实施例中,DSP基于上述时域掩蔽的原理,可以计算得到声学信号的时域掩蔽模型。示例性地,时域掩蔽模型可以表现为时域掩蔽曲线,可参考图4,时域掩蔽曲线中包括各时刻的掩蔽音的前向掩蔽范围内的被掩蔽音和后向掩蔽范围内的被掩蔽音。被掩蔽音指的是人耳听感较弱或无法感知的信号。DSP在获取到前向掩蔽范围内的被掩蔽音和后向掩蔽范围内的被掩蔽音之后,对这些被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号,也即,得到基于时域掩蔽现象进行滤波处理后的声学信号。
可选地,在又一种可行的方式中,DSP还可基于时域掩蔽现象与频域掩蔽现象,对该声学信号中的被掩蔽音进行综合性地掩蔽滤波处理,从时域维度与频域维度进行被掩蔽音的滤波处理,滤波范围更全面,滤波效果更好。
在本实施例中,DSP基于结合频域掩蔽和时域掩蔽的原理,可以计算得到声学信号的综合掩蔽模型。示例性地,综合掩蔽模型可以表现为综合掩蔽曲线,DSP基于综合掩蔽曲线确定声学信号中各掩蔽音所对应的被掩蔽音。DSP对这些被掩蔽音进行剔除处理,达到对被掩蔽音的滤波效果,从而得到剔除被掩蔽音之后的声学信号。可选地,DSP还可以对声学信号分别进行频域掩蔽滤波处理和时域掩蔽滤波处理,从而得到经过两次滤波处理的声学信号,也即,得到进行综合掩蔽滤波处理的声学信号。需要说明的是,在分别进行频域掩蔽滤波处理和时域掩蔽滤波处理的场景中,DSP对于进行频域掩蔽滤波处理和时域掩蔽滤波处理的顺序不做限定。
以下本实施例主要介绍上述基于时域掩蔽现象与频域掩蔽现象计算得到综合掩蔽模型,基于综合掩蔽模型对声学信号进行综合性地掩蔽滤波处理的过程,包括:
步骤一、DSP基于频域掩蔽现象确定声学信号的频域掩蔽模型。
在本实施例中,DSP可以基于频域掩蔽现象确定声学信号的频域掩蔽模型FM(k),具体计算方式可参考前面实施例中频域掩蔽模型的计算方式。例如,计算声学信号中各个采样点的upper斜率Su与lower斜率Sl,根据计算得到的upper斜率Su与lower斜率Sl来计算声学信号的频域掩蔽模型FM(k)。
步骤二、DSP基于时域掩蔽现象确定声学信号的时域掩蔽模型。
在本实施例中,DSP可以基于时域掩蔽现象确定声学信号的时域掩蔽模型TM(k),具体计算方式可参考前面实施例中时域掩蔽模型的计算方式。例如,根据声学信号的n帧、k频点构建对应的激励模型Ef[k,n],基于激励模型Ef[k,n]确定声学信号的时域掩蔽模型TM(k)。
步骤三、DSP根据频域掩蔽模型和时域掩蔽模型确定综合掩蔽模型,基于综合掩蔽模型对声学信号进行掩蔽滤波处理,得到掩蔽滤波处理之后的声学信号。
在本实施例中,处理器在得到频域掩蔽模型FM(k)与时域掩蔽模型TM(k)之后,可以通过对频域掩蔽模型FM(k)与时域掩蔽模型TM(k)进行卷积计算,得到综合掩蔽模型。从而,处理器基于综合掩蔽模型对声学信号进行掩蔽滤波处理,得到对人耳感知不到或不易感知的信号的声压级进行降低处理之后的输出信号。
在本实施例中,DSP基于综合掩蔽模型可以在频域维度对声学信号中掩蔽音的临近频带中的被掩蔽音进行滤波处理,降低被掩蔽音的声压级强度;基于综合掩蔽模型可以在时域维度对声学信号中掩蔽音的前后时序范围内的被掩蔽音进行滤波处理,降低被掩蔽音的声压级强度;从两个维度对声学信号中的被掩蔽音进行滤波处理,降低了声学信号的整体声压级强度,降低了扬声器播放该声学信号对应的音频的功耗。由于掩蔽滤波处理对人耳可感知的掩蔽音没有影响,一定程度保证了扬声器输出音频时人耳的听感。
在本实施例中,处理器结合时域掩蔽与频域掩蔽对等效的声学信号进行掩蔽滤波处理,其对信号的处理更准确,且可以更全面地将人耳不易感知的信号进行滤波,进一步地降低了扬声器的功耗。
S207、数模转换模块对接收到的信号数模转换,得到对应的音频模拟信号,并将该音频模拟信号输出至SMPA中。
在本实施例中,数模转换模块接收到的信号可以为S206输出的经过掩蔽滤波之后的声学信号;也可以在S204中DSP进行实时功耗与预设功率阈值的大小判断之后,在确定实时功耗小于或等于预设功率阈值的情况下,所接收到的DSP发送的经过分帧处理与信号预处理后的音频数字信号。
在本实施例中,数模转换模块对接收到的信号进行数模转换,也即,得到经过掩蔽滤波之后的声学信号的音频模拟信号;或者,得到经过分帧处理与信号预处理后的音频数字信号的音频模拟信号。将音频模拟信号输出至SMPA中。
S208、SMPA对音频模拟信号进行功率放大处理,将功率方放大处理后的音频模拟信号输出至扬声器中。
在本实施例中,SMPA对接收到的音频模拟信号进行功率放大处理,并将经过功率放大处理后的音频模拟信号输出至扬声器中。
可选地,在本实施例中,SMPA所执行的操作还可以包括SMPA获取扬声器的实时工作电压和实时工作电流,并将实时工作电压和实时工作电流反馈至DSP中。
在本实施例中,SMPA不仅具备功率放大的功能,SMPA还可以获取扬声器的实时工作电流和实时工作电压,并将实时工作电流和实时工作电压反馈至DSP中。示例性地,SMPA还可以按照一定周期来获取扬声器的工作电流和工作电压,并按照一定的周期向DSP反馈该工作电流和工作电压。
S209、扬声器播放该音频。
在本实施例中,扬声器播放接收到的音频。由于该音频之前经历了掩蔽滤波处理,其中人耳感知弱的信号的声压级被进一步降低,因此,扬声器在播放该音频时功耗会降低,优化了扬声器的工作功耗,还保证了扬声器播放音频时人耳的听感。
图11示出了上述实施例中所涉及的电子设备100的一种可能的结构示意图。如图11所示,电子设备100包括处理器210、反馈模块220和扬声器230。其中:
反馈模块220,用于获取扬声器的工作电流和工作电压,并将工作电流和工作电压反馈至处理器中。
处理器210,用于实时获取扬声器的工作电流和工作电压;根据工作电流和工作电压获取声学反馈模型;将音频数字信号输入声学反馈模型,输出音频数字信号等效的声学信号;对等效的声学信号进行掩蔽滤波处理。
扬声器230,用于播放掩蔽滤波处理之后的声学信号对应的音频。
在一种可能的设计方式中,处理器210,用于根据工作电流和工作电压,构建扬声器的阻抗模型;阻抗模型用于表征扬声器的电学参数与关键力学参数之间的关系;电学参数包括工作电流和工作电压;关键力学参数包括扬声器的磁力因子、力阻和劲度系数;基于阻抗模型确定扬声器的关键力学参数;基于关键力学参数的线性变化与关键力学参数的非线性变化,获取声学反馈模型。
在一种可能的设计方式中,处理器210,用于基于关键力学参数的线性变化,确定扬声器的线性模型;基于关键力学参数进行非线性变化和线性模型,确定扬声器的非线性模型;结合线性模型和非线性模型,获取声学反馈模型。
在一种可能的设计方式中,处理器210,用于通过对阻抗模型进行变换处理,得到关键力学参数的非线性变化;基于关键力学参数的非线性变化和线性模型,确定扬声器的非线性模型。
在一种可能的设计方式中,处理器210,用于对等效的声学信号进行频域掩蔽滤波处理,得到频域掩蔽滤波处理之后的等效的声学信号。
在一种可能的设计方式中,处理器210,用于对等效的声学信号进行时域掩蔽滤波处理,得到时域掩蔽滤波处理之后的等效的声学信号。
在一种可能的设计方式中,处理器210,用于计算等效的声学信号的综合滤波模型;基于综合滤波模型对等效的声学信号进行掩蔽滤波处理,得到掩蔽滤波处理之后的等效的声学信号。
在一种可能的设计方式中,处理器210,用于计算等效的声学信号的频域掩蔽模型;计算等效的声学信号的时域掩蔽模型;根据频域掩蔽模型和时域掩蔽模型,得到综合滤波模型。
在一种可能的设计方式中,处理器210,还用于工作电流和工作电压确定扬声器的实时功耗大于预设功耗阈值。
在一种可能的设计方式中,如图12所示,上述电子设备100还包括数模转换模块240。
数模转换模块240,用于对等效的声学信号进行数模转换,得到等效的声学信号的音频模拟信号。
反馈模块220,还用于对音频模拟信号进行功率放大处理,得到功率放大之后的音频模拟信号。
扬声器230,用于播放功率放大之后的音频模拟信号。
在一种可能的设计方式中,处理器210,还用于对音频数字信号进行信号预处理,得到信号预处理之后的音频数字信号;信号预处理包括信号分帧处理、信号噪声滤波处理中至少一种。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令,当所述计算机指令在上述电子设备上运行时,使得该电子设备执行上述方法实施例中电子设备100执行的各个功能或者步骤。
本申请实施例还提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述方法实施例中电子设备100执行的各个功能或者步骤。例如,该计算机可以是上述电子设备100。
通过以上实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (13)
1.一种信号处理方法,其特征在于,应用于电子设备中,所述电子设备包括扬声器,所述方法包括:
实时获取所述扬声器的工作电流和工作电压;
根据所述工作电流和所述工作电压获取声学反馈模型;
将音频数字信号输入所述声学反馈模型,输出所述音频数字信号等效的声学信号;
对所述等效的声学信号进行掩蔽滤波处理;
所述扬声器播放掩蔽滤波处理之后的声学信号对应的音频。
2.根据权利要求1所述的方法,其特征在于,所述根据所述工作电流和所述工作电压获取声学反馈模型,包括:
根据所述工作电流和所述工作电压,构建所述扬声器的阻抗模型;所述阻抗模型用于表征所述扬声器的电学参数与关键力学参数之间的关系;所述电学参数包括所述工作电流和所述工作电压;所述关键力学参数包括所述扬声器的磁力因子、力阻和劲度系数;
基于所述阻抗模型确定所述扬声器的关键力学参数;
基于所述关键力学参数的线性变化与所述关键力学参数的非线性变化,获取所述声学反馈模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述关键力学参数的线性变化与所述关键力学参数的非线性变化,获取所述声学反馈模型,包括:
基于所述关键力学参数的线性变化,确定所述扬声器的线性模型;
基于所述关键力学参数进行非线性变化和所述线性模型,确定所述扬声器的非线性模型;
结合所述线性模型和所述非线性模型,获取所述声学反馈模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述关键力学参数进行非线性变化和所述线性模型,确定所述扬声器的非线性模型,包括:
通过对所述阻抗模型进行变换处理,得到所述关键力学参数的非线性变化;
基于所述关键力学参数的非线性变化和所述线性模型,确定所述扬声器的非线性模型。
5.根据权利要求1所述的方法,其特征在于,所述对所述等效的声学信号进行掩蔽滤波处理,包括:
对所述等效的声学信号进行频域掩蔽滤波处理,得到频域掩蔽滤波处理之后的所述等效的声学信号。
6.根据权利要求1所述的方法,其特征在于,所述对所述等效的声学信号进行掩蔽滤波处理,包括:
对所述等效的声学信号进行时域掩蔽滤波处理,得到时域掩蔽滤波处理之后的所述等效的声学信号。
7.根据权利要求1所述的方法,其特征在于,所述对所述等效的声学信号进行掩蔽滤波处理,包括:
计算所述等效的声学信号的综合滤波模型;
基于所述综合滤波模型对所述等效的声学信号进行掩蔽滤波处理,得到掩蔽滤波处理之后的所述等效的声学信号。
8.根据权利要求7所述的方法,其特征在于,所述计算所述等效的声学信号的综合滤波模型,包括:
计算所述等效的声学信号的频域掩蔽模型;
计算所述等效的声学信号的时域掩蔽模型;
根据所述频域掩蔽模型和所述时域掩蔽模型,得到所述综合滤波模型。
9.根据权利要求1-8中任一项所述的方法,其特征在于,在所述根据所述工作电流和所述工作电压获取声学反馈模型之前,还包括:
所述工作电流和所述工作电压确定所述扬声器的实时功耗大于预设功耗阈值。
10.根据权利要求1-8中任一项所述的方法,其特征在于,所述方法还包括:
对所述等效的声学信号进行数模转换,得到所述等效的声学信号的音频模拟信号;
对所述音频模拟信号进行功率放大处理,得到功率放大之后的音频模拟信号;
所述扬声器播放掩蔽滤波处理之后的声学信号对应的音频,包括:
所述扬声器播放所述功率放大之后的音频模拟信号。
11.根据权利要求1-8中任一项所述的方法,其特征在于,在所述将音频数字信号输入所述声学反馈模型之前,所述方法还包括:
对所述音频数字信号进行信号预处理,得到信号预处理之后的音频数字信号;所述信号预处理包括信号分帧处理、信号噪声滤波处理中至少一种。
12.一种电子设备,其特征在于,所述电子设备包括存储器、扬声器和一个或多个处理器;所述存储器、所述扬声器与所述处理器耦合;所述存储器中存储有计算机程序代码,所述计算机程序代码包括计算机指令,当所述计算机指令被所述处理器执行时,使得所述电子设备执行如权利要求1-11中任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210857030.9A CN116055951B (zh) | 2022-07-20 | 2022-07-20 | 信号处理方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210857030.9A CN116055951B (zh) | 2022-07-20 | 2022-07-20 | 信号处理方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116055951A true CN116055951A (zh) | 2023-05-02 |
CN116055951B CN116055951B (zh) | 2023-10-20 |
Family
ID=86127900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210857030.9A Active CN116055951B (zh) | 2022-07-20 | 2022-07-20 | 信号处理方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116055951B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116546126A (zh) * | 2023-07-07 | 2023-08-04 | 荣耀终端有限公司 | 一种杂音抑制方法及电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110228945A1 (en) * | 2010-03-17 | 2011-09-22 | Harman International Industries, Incorporated | Audio power management system |
US20140064502A1 (en) * | 2012-08-30 | 2014-03-06 | Parrot | Method for processing an audio signal with modeling of the overall response of the electrodynamic loudspeaker |
EP2899883A1 (en) * | 2014-01-28 | 2015-07-29 | HTC Corporation | Sound producing system and audio amplifying method thereof |
US9362878B1 (en) * | 2013-02-01 | 2016-06-07 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
CN109905812A (zh) * | 2019-01-31 | 2019-06-18 | 维沃移动通信有限公司 | 一种输入功率控制方法及装置、终端设备 |
CN110326308A (zh) * | 2016-10-21 | 2019-10-11 | Dts公司 | 失真感测、防失真、以及失真察觉低音增强 |
US20200313654A1 (en) * | 2019-03-29 | 2020-10-01 | Cirrus Logic International Semiconductor Ltd. | Identifying mechanical impedance of an electromagnetic load using least-mean-squares filter |
CN111971976A (zh) * | 2018-01-25 | 2020-11-20 | 思睿逻辑国际半导体有限公司 | 用于改进的音频再现、功率降低和扬声器保护的心理声学 |
CN112492497A (zh) * | 2020-12-29 | 2021-03-12 | 西安讯飞超脑信息科技有限公司 | 扬声器的t/s参数测量方法、测量装置和电子设备 |
CN112533115A (zh) * | 2019-09-18 | 2021-03-19 | 华为技术有限公司 | 一种提升扬声器的音质的方法及装置 |
US20210265966A1 (en) * | 2018-06-22 | 2021-08-26 | Dolby Laboratories Licensing Corporation | Multichannel audio enhancement, decoding, and rendering in response to feedback |
CN113630690A (zh) * | 2021-09-06 | 2021-11-09 | 国光电器股份有限公司 | 一种扬声器系统的非线性特性的确定方法及装置 |
CN114245271A (zh) * | 2022-02-27 | 2022-03-25 | 荣耀终端有限公司 | 音频信号处理方法及电子设备 |
-
2022
- 2022-07-20 CN CN202210857030.9A patent/CN116055951B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110228945A1 (en) * | 2010-03-17 | 2011-09-22 | Harman International Industries, Incorporated | Audio power management system |
US20140064502A1 (en) * | 2012-08-30 | 2014-03-06 | Parrot | Method for processing an audio signal with modeling of the overall response of the electrodynamic loudspeaker |
US9362878B1 (en) * | 2013-02-01 | 2016-06-07 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
EP2899883A1 (en) * | 2014-01-28 | 2015-07-29 | HTC Corporation | Sound producing system and audio amplifying method thereof |
CN110326308A (zh) * | 2016-10-21 | 2019-10-11 | Dts公司 | 失真感测、防失真、以及失真察觉低音增强 |
CN111971976A (zh) * | 2018-01-25 | 2020-11-20 | 思睿逻辑国际半导体有限公司 | 用于改进的音频再现、功率降低和扬声器保护的心理声学 |
US20210265966A1 (en) * | 2018-06-22 | 2021-08-26 | Dolby Laboratories Licensing Corporation | Multichannel audio enhancement, decoding, and rendering in response to feedback |
CN109905812A (zh) * | 2019-01-31 | 2019-06-18 | 维沃移动通信有限公司 | 一种输入功率控制方法及装置、终端设备 |
US20200313654A1 (en) * | 2019-03-29 | 2020-10-01 | Cirrus Logic International Semiconductor Ltd. | Identifying mechanical impedance of an electromagnetic load using least-mean-squares filter |
CN112533115A (zh) * | 2019-09-18 | 2021-03-19 | 华为技术有限公司 | 一种提升扬声器的音质的方法及装置 |
CN112492497A (zh) * | 2020-12-29 | 2021-03-12 | 西安讯飞超脑信息科技有限公司 | 扬声器的t/s参数测量方法、测量装置和电子设备 |
CN113630690A (zh) * | 2021-09-06 | 2021-11-09 | 国光电器股份有限公司 | 一种扬声器系统的非线性特性的确定方法及装置 |
CN114245271A (zh) * | 2022-02-27 | 2022-03-25 | 荣耀终端有限公司 | 音频信号处理方法及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116546126A (zh) * | 2023-07-07 | 2023-08-04 | 荣耀终端有限公司 | 一种杂音抑制方法及电子设备 |
CN116546126B (zh) * | 2023-07-07 | 2023-10-24 | 荣耀终端有限公司 | 一种杂音抑制方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116055951B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113676804A (zh) | 一种主动降噪方法及装置 | |
US10277750B2 (en) | Method and system for improving echo in hands-free call of mobile terminal | |
CN115442709B (zh) | 音频处理方法、虚拟低音增强系统、设备和存储介质 | |
WO2021227696A1 (zh) | 一种主动降噪方法及装置 | |
US20230091607A1 (en) | Psychoacoustics-based audio encoding method and apparatus | |
CN112954563B (zh) | 信号处理方法、电子设备、装置及存储介质 | |
CN116055951B (zh) | 信号处理方法和电子设备 | |
WO2022262410A1 (zh) | 录音方法和装置 | |
WO2022148319A1 (zh) | 视频切换方法、装置、存储介质及设备 | |
CN110827808A (zh) | 语音识别方法、装置、电子设备和计算机可读存储介质 | |
CN117153181B (zh) | 语音降噪方法、设备及存储介质 | |
CN113473013A (zh) | 图像美化效果的显示方法、装置和终端设备 | |
KR20050037431A (ko) | 신호 처리 시스템, 신호 처리 장치 및 방법, 기록 매체와프로그램 | |
CN116665692B (zh) | 语音降噪方法和终端设备 | |
CN104348436B (zh) | 一种参数调整方法及电子设备 | |
CN113808566B (zh) | 振动噪音处理方法、装置、电子设备及存储介质 | |
CN117135511A (zh) | 一种基于智能听损补偿技术的助听蓝牙耳机 | |
CN108919277B (zh) | 基于亚超声波的室内外环境识别方法、系统及存储介质 | |
CN116546126B (zh) | 一种杂音抑制方法及电子设备 | |
CN112820317A (zh) | 语音处理方法和电子设备 | |
CN117093182B (zh) | 一种音频播放方法、电子设备和计算机可读存储介质 | |
CN117059062B (zh) | 一种降低噪声的方法、存储介质及电子设备 | |
CN210694287U (zh) | 一种基于社交网络的交互式智能型tws耳机 | |
CN218301629U (zh) | 辅听装置和辅听设备 | |
CN115334349B (zh) | 音频处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |