WO2022237252A1 - 音频信号处理方法、装置及存储介质 - Google Patents

音频信号处理方法、装置及存储介质 Download PDF

Info

Publication number
WO2022237252A1
WO2022237252A1 PCT/CN2022/075838 CN2022075838W WO2022237252A1 WO 2022237252 A1 WO2022237252 A1 WO 2022237252A1 CN 2022075838 W CN2022075838 W CN 2022075838W WO 2022237252 A1 WO2022237252 A1 WO 2022237252A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio signal
signal
band
sub
virtual bass
Prior art date
Application number
PCT/CN2022/075838
Other languages
English (en)
French (fr)
Inventor
江建亮
Original Assignee
广州视源电子科技股份有限公司
广州视琨电子科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 广州视源电子科技股份有限公司, 广州视琨电子科技有限公司 filed Critical 广州视源电子科技股份有限公司
Priority to JP2022573367A priority Critical patent/JP2023529818A/ja
Priority to EP22806229.5A priority patent/EP4148730A4/en
Priority to AU2022275169A priority patent/AU2022275169B2/en
Priority to KR1020227041933A priority patent/KR20230035232A/ko
Publication of WO2022237252A1 publication Critical patent/WO2022237252A1/zh
Priority to US17/990,047 priority patent/US20230090810A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/155Musical effects
    • G10H2210/321Missing fundamental, i.e. creating the psychoacoustic impression of a missing fundamental tone through synthesis of higher harmonics, e.g. to play bass notes pitched below the frequency range of reproducing speakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

一种音频信号处理方法、装置、电子设备及存储介质,属于信号处理技术领域。该方法包括:对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号包括子带带通信号(S101);根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号(S102)。通过子带信号限制互调失真,从而减小可感知的音色畸变,提升虚拟低音的重放效果。

Description

音频信号处理方法、装置及存储介质
说明书本申请要求于2021年05月14日提交中国专利局、申请号为202110528118.1、发明名称为“一种音频信号处理方法、装置及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及信号处理技术领域,尤其涉及一种音频信号处理方法、装置及存储介质。
背景技术
随着多媒体设备的小型化和便捷化,扬声器的选型也越来越小。小型扬声器由于其物理结构的限制,不能有效地重放音频信号中的低频成分,而音频信号的低音重放直接影响了声音的丰满度和厚重感等听感。因此,对小型扬声器的低音重放效果的改善一直是个热门的研究课题。
对于小型扬声器的低音重放效果的改善,可以利用心理声学上“基音缺失”原理对音频信号进行虚拟低音增强,例如采用非线性器件(NLD)算法,对音频信号中的低频成分进行非线性处理产生谐波。但非线性器件算法会对谐波成分丰富的音频信号引入互调失真,从而导致感知的音色畸变。
发明内容
本申请实施例提供了一种音频信号处理方法、装置及存储介质,以减小非线性器件算法导致的感知的音色畸变,提升虚拟低音的重放效果。所述技术方案如下:
第一方面,本申请实施例提供了一种音频信号处理方法,包括:对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,子带信号包括子带带通信号;根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。
可选地,虚拟低音增强信号处理算法包括非线性器件算法。根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号,包括:根据各子带带通信号和非线性器件算法,获得虚拟低音增强信号;对子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号;根据虚拟低音增强信号 和高频音频信号,获得目标音频信号。
可选地,根据各子带带通信号和非线性器件算法,获得虚拟低音增强信号,包括:基于非线性器件算法,对各子带带通信号进行非线性处理,得到对应的非线性信号;对各非线性信号进行求和处理;对求和得到的信号进行带通滤波处理,得到低频音频信号的谐波成分;将谐波成分与上一帧待处理音频信号的谐波成分进行音频合成,获得虚拟低音增强信号。
可选地,对各非线性信号进行求和处理,包括:基于各非线性信号对应的权重,对各非线性信号进行求和处理,权重用于调整对应非线性信号所占比例。
可选地,对子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号,包括:对子带信号中的子带高通信号进行高通滤波或延时处理;对高通滤波或延时处理得到的信号进行重叠相加,获得高频音频信号。
可选地,根据虚拟低音增强信号和高频音频信号,获得目标音频信号,包括:获取预设虚拟低音增益;根据高频音频信号和虚拟低音增强信号,确定虚拟低音增强信号的最大虚拟低音增益;根据预设虚拟低音增益和最大虚拟低音增益,确定虚拟低音增强信号的目标虚拟低音增益;基于目标虚拟低音增益,对虚拟低音增强信号进行增益处理,得到低音谐波信号;将低音谐波信号和高频音频信号进行叠加,获得目标音频信号。
可选地,对待处理音频信号进行子带滤波处理,得到多个子带信号之前,还包括:对输入的源音频信号进行连续取帧处理或重叠取帧处理,获得待处理音频信号,待处理音频信号的帧长是根据采样率、处理资源和系统延时中的至少一项确定的。
可选地,根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号之后,还包括:对目标音频信号进行音频动态范围控制,得到待输出音频信号。
第二方面,本申请实施例提供了一种音频信号处理装置,包括:
子带滤波模块,用于对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,子带信号包括子带带通信号;
处理模块,用于根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。
可选地,虚拟低音增强信号处理算法包括非线性器件算法。处理模块可以 包括:
虚拟低音增强单元,用于根据各子带带通信号和非线性器件算法,获得虚拟低音增强信号;
高通滤波单元,用于对子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号;
合成单元,用于根据虚拟低音增强信号和高频音频信号,获得目标音频信号。
可选地,虚拟低音增强单元具体用于:基于非线性器件算法,对各子带带通信号进行非线性处理,得到对应的非线性信号;对各非线性信号进行求和处理;对求和得到的信号进行带通滤波处理,得到低频音频信号的谐波成分;将谐波成分与上一帧待处理音频信号的谐波成分进行音频合成,获得虚拟低音增强信号。
可选地,虚拟低音增强单元用于对各非线性信号进行求和处理时,具体用于:基于各非线性信号对应的权重,对各非线性信号进行求和处理,权重用于调整对应非线性信号所占比例。
可选地,高通滤波单元具体用于:对子带信号中的子带高通信号进行高通滤波或延时处理;对高通滤波或延时处理得到的信号进行重叠相加,获得高频音频信号。
可选地,合成单元具体用于:获取预设虚拟低音增益;根据高频音频信号和虚拟低音增强信号,确定虚拟低音增强信号的最大虚拟低音增益;根据预设虚拟低音增益和最大虚拟低音增益,确定虚拟低音增强信号的目标虚拟低音增益;基于目标虚拟低音增益,对虚拟低音增强信号进行增益处理,得到低音谐波信号;将低音谐波信号和高频音频信号进行叠加,获得目标音频信号。
可选地,音频信号处理装置还包括:取帧处理模块,用于对输入的源音频信号进行连续取帧处理或重叠取帧处理,获得待处理音频信号,待处理音频信号的帧长是根据采样率、处理资源和系统延时中的至少一项确定的。
可选地,音频信号处理装置还包括:控制模块,用于对目标音频信号进行音频动态范围控制,得到待输出音频信号。
第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种电子设备,包括:处理器和存储器;其 中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序适于由处理器加载并执行上述的方法步骤。
在本申请实施例中,对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,子带信号包括子带带通信号;根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。通过对待处理音频信号进行子带滤波处理,再采用虚拟低音增强信号处理算法针对各子带带通信号进行虚拟低音增强信号处理,通过子带带通信号限制互调失真,从而减小可感知的音色畸变,提升虚拟低音的重放效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的音频信号处理方法的流程示意图;
图2是本申请另一实施例提供的音频信号处理方法的流程示意图;
图3是本申请又一实施例提供的音频信号处理方法的流程示意图;
图4是本申请一实施例提供的应用场景示意图;
图5是本申请一实施例提供的音频信号处理装置的结构示意图;
图6是本申请另一实施例提供的音频信号处理装置的结构示意图;
图7是本申请一实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式做进一步地详细描述。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
目前,对于扬声器低音重放效果的改善,主要有两类方向:其一是采用均衡器(调整EQ)的形式直接增大低频的增益,这类方法可以在一定程度上改善低音的重放效果,但是增益幅度很难控制,容易对喇叭造成不可逆的损伤,并且会降低喇叭的使用寿命;其二即利用心理声学上“基音缺失”原理对音频信号进行虚拟低音增强处理,这类方法通过重放合成的低音基频的谐波成分,在保证小型扬声器正常工作的同时,能够有效的提高倾听者的低音感知。
其中,虚拟低音增强方法可分为两类,第一类是利用时-频转换技术,将时域信号转换到频域,在频域内生成对应基频的谐波,再转换为时域;第二类是采用非线性器件(NLD)算法,对低频信号进行非线性处理产生谐波。这两类方法各有优缺点,第一类方法可以精确控制谐波的成分以及幅度,但是其瞬态效果差,对于实时性要求高的音频处理场合,往往不能满足要求;而NLD结构简单、实时性好,但也会对谐波成分丰富的音频信号引入互调失真,容易引起感知的音色变化。
基于上述问题,本申请实施例提供一种音频信号处理方法、装置及存储介质,通过将待处理音频信号分割为多个子带信号,采用非线性器件算法对各子带信号进行非线性处理,通过子带信号限制互调失真,以减小由非线性器件算法导致的互调失真,从而降低可感知的音色畸变,提升虚拟低音的重放效果。
需要注意的是,由于篇幅所限,本申请说明书没有穷举所有可选的实施方式,本领域技术人员在阅读本申请说明书后,应该能够想到,只要技术特征不 互相矛盾,那么技术特征的任意组合均可以构成可选的实施方式。
例如,在实施例1的一个实施方式中,记载了一个技术特征a,在实施例1的另一个实施方式中,记载了另一个技术特征b。由于以上两个技术特征不互相矛盾,本领域技术人员在阅读本申请说明书后,应该能够想到,同时具有这两个特征的实施方式也是一种可选的实施方式,即a且b。
记载在不同实施例中的不互相矛盾的技术特征也可以任意组合,构成可选的实施方式。
例如,实施例1中记载了技术特征c。为了控制本申请说明书的篇幅,在实施例2、实施例3中,并没有记载这个技术特征。但是本领域技术人员在阅读本申请说明书后,应该能够想到,实施例2、实施例3所提供的音频信号处理方法也可以包括该技术特征。
下面对实施例1、实施例2、实施例3进行详细说明。
实施例1
本申请实施例公开了一种音频信号处理方法,该方法应用于小型扬声器等具有音频外放功能的电子设备,或者电子设备包含小型扬声器。下面将结合图1,对本申请实施例提供的音频信号处理方法进行详细介绍。
请参见图1,为本申请实施例公开的一种音频信号处理方法的流程图。该方法包括以下步骤:
S101,对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号包括子带带通信号。
其中,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的。子带信号的个数越多,由于虚拟低音增强信号处理(例如非线性处理)导致的互调失真越小。
示例地,电子设备中设置有子带滤波器组,该子带滤波器组由高通滤波器和一系列带通滤波器组成。其中,高通滤波器的截止频率可以直接设定为电子设备中音频设备(例如扬声器)的截止频率f0;带通滤波器的截止频率也根据f0设定。子带信号的个数可以根据N=ceil(f0/flow)-1设定,其中,ceil()表示对数值向上取整;flow为设定的带通滤波器的最低频率,例如可以设置为人耳可听频率下限20Hz。
可选地,按照带通滤波器的截止频率由高到低的顺序,第一个子带信号Xb1(n)对应的带通滤波器的上限截止频率和下限截止频率分别是fh1=f0和 fl1=f0/2,第二个子带信号Xb2(n)对应的带通滤波器的上限截止频率和下限截止频率分别是fh2=f0/2和fl2=f0/3,……,第i个子带信号Xbi(n)对应的带通滤波器的上限截止频率和下限截止频率分别是fhn=f0/n和fln=f0/(n+1),……,第N个子带信号XbN(n)对应的带通滤波器的上限截止频率和下限截止频率分别是fhN=f0/N和flN=f0/(N+1)。若f0/(N+1)<flow,则取flN=flow。这里不对带通滤波器的实现方式做限制。
电子设备通过该子带滤波器组对待处理音频信号Xin(n)进行子带滤波处理,得到一系列的子带信号,其中包括子带带通信号Xbi(n)和子带高通信号xH1(n),i为小于或等于N的正整数。
S102,根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。
该步骤采用虚拟低音增强信号处理算法对各子带带通信号进行虚拟低音增强信号处理,降低子带带通信号之间的互调影响,即通过子带带通信号限制互调失真。
在本申请实施例中,对待处理音频信号进行子带滤波处理,得到包含多个子带带通信号的子带信号,并根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。通过对待处理音频信号进行子带滤波处理,再采用虚拟低音增强信号处理算法针对各子带带通信号进行虚拟低音增强信号处理,通过子带信号限制互调失真,从而减小可感知的音色畸变,提升虚拟低音的重放效果。
实施例2
本申请实施例中,虚拟低音增强信号处理算法可具体为非线性器件(NLD)算法,或称为非线性函数或非线性操作。该情况下,如图2所示,S102步骤可以进一步包括:
S1021,根据各子带带通信号和非线性器件算法,获得虚拟低音增强信号。
一种示例性实施例中,参考图3,该步骤可以包括:
S301,基于非线性器件算法,对各子带带通信号进行非线性处理,得到对应的非线性信号。
示例地,对子带带通信号Xbi(n)进行非线性处理,以产生非线性信号Xnldi(n)。例如,通过以下公式对子带带通信号Xbi(n)进行非线性处理:
[援引加入(细则20.6) 14.06.2022] 
Xnldi(n)=(e-e1-Xbi(n))/(e-1)。
S302,对各非线性信号进行求和处理。
进一步地,对各非线性信号进行求和处理,可以包括:基于各非线性信号对应的权重,对各非线性信号进行求和处理。其中,该权重用于调整对应非线性信号所占比例。
[援引加入(细则20.6) 14.06.2022] 
示例地,将S301得到的Xnldi(n)按照对应的权重进行求和得到和信号Xnld(n),即
Figure WO-DOC-FIGURE-8-2
,式中为第i个非线性信号对应的权重。
S303,对求和得到的信号进行带通滤波处理,得到低频音频信号的谐波成分。
示例地,对S302得到的和信号Xnld(n)进行带通滤波处理,得到低频音频信号的谐波成分Hnld(n)。其中,该步骤使用的带通滤波器(Band-Pass Filter,简称BPF)的截止频率由电子设备中音频设备(例如扬声器)的截止频率f0决定,一般取[f0,6f0]。可选的,该带通滤波器为非递归型滤波器,又称为有限长单位冲激响应(Finite Impulse Response,简称FIR)滤波器,但本申请不以此为限制。
通过该步骤的带通滤波处理,可以去除求和得到低频信号生成虚拟低音信号所需要的高次谐波成分。
S304,将谐波成分与上一帧待处理音频信号的谐波成分进行音频合成(帧拼接),获得虚拟低音增强信号。
示例地,将通过S303得到的Hnld(n)与上一帧待处理音频信号的谐波成分H’nld(n)采用重叠相加法进行音频合成,得到合成的虚拟低音增强信号H(n)。
S1022,对子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号。
可选地,电子设备可并行执行S1021和S1022。
一种示例性实施例中,如图3所示,该步骤可以包括:
S305,对待处理音频信号进行子带高通滤波,获得子带高通信号。
示例地,电子设备可以通过高通滤波筛选出其中的高频信号xH1(n)。可选地,该高通滤波器的阶数和S101步骤中子带带通滤波器的阶数一致。
S306,对子带高通信号进行高通滤波或延时处理。
示例地,该步骤对通过S305筛选出的子带高通信号xH1(n)进行第二次高通滤波或延时处理,得到高通滤波信号xH2(n)。
可选地,若采用高通滤波器(High-Pass Filter,简称HPF)实现高通滤波时, 高通滤波器的阶数和S303步骤中带通滤波器的阶数一致;或者,若采用延时处理,则延时的点数与S303步骤中信号处理带来的时延一致。
S307,对高通滤波或延时处理得到的信号进行重叠相加(帧拼接),获得高频音频信号。
例如,对通过S306步骤得到的信号采用重叠相加法进行重叠相加,得到高频音频信号xH(n)。
需说明的是,本申请实施例不限定S305至S307,与S301至S304的执行顺序。可以理解,电子设备可以先依次执行S301至S307;或者,电子设备可以先执行S305至S307,再执行S301至S304;或者,电子设备并行执行S301至S304,与S305至S307,具体可根据电子设备的算力进行相应设置。
S1023,根据虚拟低音增强信号和高频音频信号,获得目标音频信号。
一种示例性实施例中,根据虚拟低音增强信号H(n)、高频音频信号xH(n)以及预设虚拟低音增益Gu,采用自适应增益方法生成增益后的低音谐波信号Xvir(n)。因此,还可以包括:获取目标虚拟低音增益。
示例地,获取目标虚拟低音增益,可以进一步包括:
1、获取预设虚拟低音增益。
即获取预设虚拟低音增益Gu。
2、根据高频音频信号和虚拟低音增强信号,确定虚拟低音增强信号的最大虚拟低音增益。
设定目标音频信号的最大归一化增益为Glimit,Glimit最大可以设置为0dBFS。
[援引加入(细则20.6) 14.06.2022] 
示例地,根据高频音频信号xH(n)和虚拟低音增强信号H(n),确定虚拟低音增强信号H(n)的最大虚拟低音增益Gm(n):
Figure WO-DOC-FIGURE-9-1
[援引加入(细则20.6) 14.06.2022] 
式子中
Figure WO-DOC-FIGURE-9-2
,eps为处理器的相对误差限。
3、根据预设虚拟低音增益和最大虚拟低音增益,确定虚拟低音增强信号的目标虚拟低音增益。
[援引加入(细则20.6) 14.06.2022] 
示例地,根据预设虚拟低音增益Gu和实时计算得到的最大虚拟低音增益Gm(n)得到目标虚拟低音增益Gp(n),实现算法为:
Figure WO-DOC-FIGURE-9-3

其中
Figure WO-DOC-FIGURE-9-4
S308,基于目标虚拟低音增益,对虚拟低音增强信号进行增益处理(即自 适应增益),得到低音谐波信号。
例如,通过以下公式得到低音谐波信号Xvir(n):
Xvir(n)=H(n)*10^(Gp(n)/20)。
S309,将低音谐波信号和高频音频信号进行叠加,获得目标音频信号。
示例地,将通过S308得到的Xvir(n)与通过S307得到的xH(n)进行叠加,得到目标音频信号y1(n)。
实施例3
本申请实施例中,如图3所示,在对待处理音频信号进行子带滤波处理,得到多个子带信号之前,音频信号处理方法还可以包括:
S310,对输入的源音频信号进行连续取帧处理,获得待处理音频信号。
可替换地,对输入的源音频信号进行重叠取帧处理,获得待处理音频信号。可选地,为了输出平滑的待处理音频信号,可以使用汉宁(hanning)窗对源音频信号进行加窗处理。
其中,待处理音频信号的帧长是根据采样率、(计算)处理资源和系统延时中的至少一项确定的。需理解,对于同一时长,采样率越大待处理音频信号的帧长越长;对于同一时长,(计算)处理资源越多,电子设备能够处理的待处理音频信号的帧长越长;系统延时越小,电子设备能够处理的待处理音频信号的帧长越长。
本申请实施例通过对输入的源音频信号进行连续取帧处理或重叠取帧处理获得待处理音频信号,以实现对源音频信号的实时处理。通过实时的虚拟低音增强处理,减小非线性处理带来的感知的音色畸变,提升了虚拟低音重放的效果。
实施例4
本申请实施例在上述实施例的基础上,如图3所示,在获得目标音频信号之后,还可以包括:
S311,对目标音频信号进行音频动态范围控制(Dynamic Range Control,简称DRC),得到待输出音频信号。
示例地,对通过上述任一实施例得到的目标音频信号y1(n)进行音频动态范围控制,得到待输出音频信号,即最终的虚拟低音增强信号帧yout(n),返还音频流。
综上,本申请实施例至少具有以下优势:
一、减少了虚拟低音增强的复杂度,能够实时的对输入的源音频信号进行虚拟低音增强处理。
二、能够有效的控制虚拟低音成分的增益,减小了音频信号的互调失真,特别是对于多通道声重放场景,传统的虚拟低音增强算法容易造成声像的模糊,而本申请解决了这一问题。
需要注意的是,由于篇幅所限,本申请中并没有穷举所有的实施方式,只要是不互相矛盾的特征,均可以自由随意组合,成为本申请可选的实施方式。
实施例5
参考图4,智能交互平板41具备音频外放功能,用户通过遥控器42对智能交互平板41进行控制,智能交互平板41与服务器43连接。可选地,智能交互平板41通过局域网(LAN)、无线局域网(WLAN)和其他网络,与服务器43进行通信连接。服务器43可以向智能交互平板41提供各种内容和互动。服务器43可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。
该示例以电子设备为智能交互平板,控制设备为遥控器为例进行说明,但本申请不以此为限制;且,本申请不限制智能交互平板和遥控器的个数,例如,通过一个遥控器控制两个智能交互平板,或者,通过两个遥控器控制一个智能交互平板,等等。
用户在遥控器42上输入音视频播放操作,通过遥控器42控制智能交互平板41播放音视频。之后,响应于来自遥控器42的控制指令,智能交互平板41与服务器43交互,获取待播放的音视频信号(包含音频信号和/或视频信号),并通过显示器显示视频信号,通过音频设备播放音频信号。其中,音频设备对获取的音频信号进行如上述音频信号处理方法所述的处理,以达到对该音频信号的虚拟低音增强的效果,并播放得到的目标音频信号。
实施例6
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参见图5,其示出了本申请一个示例性实施例提供的音频信号处理装置的结构示意图。该音频信号处理装置可以通过软件、硬件或者两者的结合实现成为智能交互平板等电子设备的全部或一部分。该音频信号处理装置50包括子带滤波模块51和处理模块52。其中,两个模块之间相互连接。
子带滤波模块51,用于对待处理音频信号进行子带滤波处理,得到多个子 带信号,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,子带信号包括子带带通信号;
处理模块52,用于根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。
可选地,虚拟低音增强信号处理算法包括非线性器件算法。如图6所示,在音频信号处理装置60中,处理模块52可以包括:
虚拟低音增强单元521,用于根据各子带带通信号和非线性器件算法,获得虚拟低音增强信号;
高通滤波单元522,用于对子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号;
合成单元523,用于根据虚拟低音增强信号和高频音频信号,获得目标音频信号。
可选地,虚拟低音增强单元521具体用于:基于非线性器件算法,对各子带带通信号进行非线性处理,得到对应的非线性信号;对各非线性信号进行求和处理;对求和得到的信号进行带通滤波处理,得到低频音频信号的谐波成分;将谐波成分与上一帧待处理音频信号的谐波成分进行音频合成,获得虚拟低音增强信号。
可选地,虚拟低音增强单元521用于对各非线性信号进行求和处理时,具体用于:基于各非线性信号对应的权重,对各非线性信号进行求和处理,权重用于调整对应非线性信号所占比例。
可选地,高通滤波单元522具体用于:对子带信号中的子带高通信号进行高通滤波或延时处理;对高通滤波或延时处理得到的信号进行重叠相加,获得高频音频信号。
可选地,合成单元523具体用于:获取预设虚拟低音增益;根据高频音频信号和虚拟低音增强信号,确定虚拟低音增强信号的最大虚拟低音增益;根据预设虚拟低音增益和最大虚拟低音增益,确定虚拟低音增强信号的目标虚拟低音增益;基于目标虚拟低音增益,对虚拟低音增强信号进行增益处理,得到低音谐波信号;将低音谐波信号和高频音频信号进行叠加,获得目标音频信号。
一些实施例中,音频信号处理装置60还可以包括:取帧处理模块61,用于对输入的源音频信号进行连续取帧处理或重叠取帧处理,获得待处理音频信号,待处理音频信号的帧长是根据采样率、处理资源和系统延时中的至少一项 确定的。
进一步地,音频信号处理装置60还可以包括:控制模块62,用于对目标音频信号进行音频动态范围控制,得到待输出音频信号。
需要说明的是,上述实施例提供的音频信号处理装置在执行音频信号处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频信号处理装置与音频信号处理方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请实施例中,对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的;根据各子带信号和虚拟低音增强信号处理算法,获得目标音频信号。通过对待处理音频信号进行子带滤波处理,再采用虚拟低音增强信号处理算法针对各子带信号进行虚拟低音增强信号处理,通过子带信号限制互调失真,从而减小可感知的音色畸变,提升虚拟低音的重放效果。
实施例7
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述方法实施例的方法步骤,具体执行过程可以参见方法实施例的具体说明,在此不进行赘述。
存储介质所在设备可以是智能交互平板等具有音频外放功能的电子设备。
实施例8
本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序适于由处理器加载并执行上述方法实施例的方法步骤,具体执行过程可以参见方法实施例的具体说明,在此不进行赘述。
实施例9
请参见图7,为本申请实施例提供了一种电子设备的结构示意图。如图7所示,电子设备70可以包括:至少一个处理器71,至少一个网络接口74,用户接口73,存储器75,至少一个通信总线72。
其中,通信总线72用于实现这些组件之间的连接通信。
其中,用户接口73可以包括显示屏(Display)、摄像头(Camera)、音 频设备。可选地,用户接口73还可以包括标准的有线接口、无线接口。
其中,网络接口74可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器71可以包括一个或者多个处理核心。处理器71利用各种接口和线路连接整个电子设备70内的各个部分,通过运行或执行存储在存储器75内的指令、程序、代码集或指令集,以及调用存储在存储器75内的数据,执行电子设备70的各种功能和处理数据。可选的,处理器71可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器71可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器71中,单独通过一块芯片进行实现。
其中,存储器75可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器75包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器75可用于存储指令、程序、代码、代码集或指令集。存储器75可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器75可选的还可以是至少一个位于远离前述处理器71的存储装置。如图7所示,作为一种计算机存储介质的存储器75中可以包括操作系统、网络通信模块、用户接口模块以及电子设备70的操作应用程序。可选地,电子设备70的操作系统为安卓系统,但本申请不以此为限制。
在图7所示的电子设备70中,用户接口73主要用于为用户提供输入的接口,获取用户输入的数据;而处理器71可以用于调用存储器75中存储的电子设备70的操作应用程序,并具体执行以下操作:
对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,子带信号包括 子带带通信号;根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。
在一些实施例中,虚拟低音增强信号处理算法包括非线性器件算法。处理器71执行根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号的步骤,具体为:根据各子带带通信号和非线性器件算法,获得虚拟低音增强信号;对子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号;根据虚拟低音增强信号和高频音频信号,获得目标音频信号。
在一些实施例中,处理器71执行根据各子带带通信号和非线性器件算法,获得虚拟低音增强信号的步骤,具体为:基于非线性器件算法,对各子带带通信号进行非线性处理,得到对应的非线性信号;对各非线性信号进行求和处理;对求和得到的信号进行带通滤波处理,得到低频音频信号的谐波成分;将谐波成分与上一帧待处理音频信号的谐波成分进行音频合成,获得虚拟低音增强信号。
在一些实施例中,处理器71执行对各非线性信号进行求和处理的步骤,具体为:基于各非线性信号对应的权重,对各非线性信号进行求和处理,权重用于调整对应非线性信号所占比例。
在一些实施例中,处理器71执行对子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号的步骤,具体为:对子带信号中的子带高通信号进行高通滤波或延时处理;对高通滤波或延时处理得到的信号进行重叠相加,获得高频音频信号。
在一些实施例中,处理器71执行根据虚拟低音增强信号和高频音频信号,获得目标音频信号的步骤,可以具体为:获取预设虚拟低音增益;根据高频音频信号和虚拟低音增强信号,确定虚拟低音增强信号的最大虚拟低音增益;根据预设虚拟低音增益和最大虚拟低音增益,确定虚拟低音增强信号的目标虚拟低音增益;基于目标虚拟低音增益,对虚拟低音增强信号进行增益处理,得到低音谐波信号;将低音谐波信号和高频音频信号进行叠加,获得目标音频信号。
在一些实施例中,处理器71还执行以下步骤:在对待处理音频信号进行子带滤波处理,得到多个子带信号之前,对输入的源音频信号进行连续取帧处理或重叠取帧处理,获得待处理音频信号,待处理音频信号的帧长是根据采样率、处理资源和系统延时中的至少一项确定的。
在一些实施例中,处理器71还执行以下步骤:在获得目标音频信号之后, 对目标音频信号进行音频动态范围控制,得到待输出音频信号。
在本申请实施例中,对待处理音频信号进行子带滤波处理,得到多个子带信号,子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,子带信号包括子带带通信号;根据各子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。通过对待处理音频信号进行子带滤波处理,再采用虚拟低音增强信号处理算法针对各子带带通信号进行虚拟低音增强信号处理,通过子带信号限制互调失真,从而减小可感知的音色畸变,提升虚拟低音的重放效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (12)

  1. 一种音频信号处理方法,其特征在于,包括:
    对待处理音频信号进行子带滤波处理,得到多个子带信号,所述子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,所述子带信号包括子带带通信号;
    根据各所述子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。
  2. 根据权利要求1所述的音频信号处理方法,其特征在于,所述虚拟低音增强信号处理算法包括非线性器件算法,所述根据各所述子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号,包括:
    根据各所述子带带通信号和所述非线性器件算法,获得虚拟低音增强信号;
    对所述子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号;
    根据所述虚拟低音增强信号和所述高频音频信号,获得所述目标音频信号。
  3. 根据权利要求2所述的音频信号处理方法,其特征在于,所述根据各所述子带带通信号和所述非线性器件算法,获得虚拟低音增强信号,包括:
    基于所述非线性器件算法,对各所述子带带通信号进行非线性处理,得到对应的非线性信号;
    对各所述非线性信号进行求和处理;
    对求和得到的信号进行带通滤波处理,得到低频音频信号的谐波成分;
    将所述谐波成分与上一帧待处理音频信号的谐波成分进行音频合成,获得所述虚拟低音增强信号。
  4. 根据权利要求3所述的音频信号处理方法,其特征在于,所述对各所述非线性信号进行求和处理,包括:
    基于各所述非线性信号对应的权重,对各所述非线性信号进行求和处理,所述权重用于调整对应非线性信号所占比例。
  5. 根据权利要求2所述的音频信号处理方法,其特征在于,所述对所述子带信号中的子带高通信号进行高通滤波或延时处理,获得高频音频信号,包括:
    对所述子带信号中的子带高通信号进行高通滤波或延时处理;
    对高通滤波或延时处理得到的信号进行重叠相加,获得所述高频音频信号。
  6. 根据权利要求2所述的音频信号处理方法,其特征在于,所述根据所述虚拟低音增强信号和所述高频音频信号,获得目标音频信号,包括:
    获取预设虚拟低音增益;
    根据所述高频音频信号和所述虚拟低音增强信号,确定所述虚拟低音增强信号的最大虚拟低音增益;
    根据所述预设虚拟低音增益和所述最大虚拟低音增益,确定所述虚拟低音增强信号的目标虚拟低音增益;
    基于所述目标虚拟低音增益,对所述虚拟低音增强信号进行增益处理,得到低音谐波信号;
    将所述低音谐波信号和所述高频音频信号进行叠加,获得所述目标音频信号。
  7. 根据权利要求1至6中任一项所述的音频信号处理方法,其特征在于,所述对待处理音频信号进行子带滤波处理,得到多个子带信号之前,还包括:
    对输入的源音频信号进行连续取帧处理或重叠取帧处理,获得所述待处理音频信号,所述待处理音频信号的帧长是根据采样率、处理资源和系统延时中的至少一项确定的。
  8. 根据权利要求1至6中任一项所述的音频信号处理方法,其特征在于,所述根据各所述子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号之后,还包括:
    对所述目标音频信号进行音频动态范围控制,得到待输出音频信号。
  9. 一种音频信号处理装置,其特征在于,包括:
    子带滤波模块,用于对待处理音频信号进行子带滤波处理,得到多个子带信号,所述子带信号的个数是根据带通滤波器的最低频率和音频设备的截止频率确定的,所述子带信号包括子带带通信号;
    虚拟低音增强模块,根据各所述子带带通信号和虚拟低音增强信号处理算法,获得目标音频信号。
  10. 一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1至8中任一项的所述的音频信号处理方法。
  11. 一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1至8中任一项所述的音频信号处理方法。
  12. 一种计算机程序产品,其特征在于,包括:计算机程序,所述计算机 程序适于由处理器加载并执行如权利要求1至8中任一项所述的音频信号处理方法。
PCT/CN2022/075838 2021-05-14 2022-02-10 音频信号处理方法、装置及存储介质 WO2022237252A1 (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2022573367A JP2023529818A (ja) 2021-05-14 2022-02-10 オーディオ信号処理方法、装置及び記憶媒体
EP22806229.5A EP4148730A4 (en) 2021-05-14 2022-02-10 AUDIO SIGNAL PROCESSING METHOD AND APPARATUS, AND STORAGE MEDIUM
AU2022275169A AU2022275169B2 (en) 2021-05-14 2022-02-10 Audio signal processing method and apparatus, and storage medium
KR1020227041933A KR20230035232A (ko) 2021-05-14 2022-02-10 오디오 신호 처리 방법, 디바이스 및 저장 매체
US17/990,047 US20230090810A1 (en) 2021-05-14 2022-11-18 Audio signal processing method, device and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110528118.1 2021-05-14
CN202110528118.1A CN115346542A (zh) 2021-05-14 2021-05-14 音频信号处理方法、装置及存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/990,047 Continuation US20230090810A1 (en) 2021-05-14 2022-11-18 Audio signal processing method, device and storage medium

Publications (1)

Publication Number Publication Date
WO2022237252A1 true WO2022237252A1 (zh) 2022-11-17

Family

ID=83946530

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/075838 WO2022237252A1 (zh) 2021-05-14 2022-02-10 音频信号处理方法、装置及存储介质

Country Status (7)

Country Link
US (1) US20230090810A1 (zh)
EP (1) EP4148730A4 (zh)
JP (1) JP2023529818A (zh)
KR (1) KR20230035232A (zh)
CN (1) CN115346542A (zh)
AU (1) AU2022275169B2 (zh)
WO (1) WO2022237252A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116437268A (zh) * 2023-06-14 2023-07-14 武汉海微科技有限公司 自适应分频的环绕声上混方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070129036A1 (en) * 2005-11-28 2007-06-07 Samsung Electronics Co., Ltd. Method and apparatus to reconstruct a high frequency component
CN102354500A (zh) * 2011-08-03 2012-02-15 华南理工大学 一种基于谐波控制的虚拟低音增强处理方法
CN103517183A (zh) * 2012-10-09 2014-01-15 Tcl集团股份有限公司 一种低音信号增强的方法及装置
CN104936088A (zh) * 2015-04-21 2015-09-23 上海大学 一种混合虚拟低音增强处理方法
CN111970624A (zh) * 2020-08-06 2020-11-20 海信视像科技股份有限公司 显示设备喇叭状态检测方法及显示设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9319789B1 (en) * 2008-02-26 2016-04-19 Tc Group A/S Bass enhancement
CN111970627B (zh) * 2020-08-31 2021-12-03 广州视源电子科技股份有限公司 音频信号的增强方法、装置、存储介质和处理器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070129036A1 (en) * 2005-11-28 2007-06-07 Samsung Electronics Co., Ltd. Method and apparatus to reconstruct a high frequency component
CN102354500A (zh) * 2011-08-03 2012-02-15 华南理工大学 一种基于谐波控制的虚拟低音增强处理方法
CN103517183A (zh) * 2012-10-09 2014-01-15 Tcl集团股份有限公司 一种低音信号增强的方法及装置
CN104936088A (zh) * 2015-04-21 2015-09-23 上海大学 一种混合虚拟低音增强处理方法
CN111970624A (zh) * 2020-08-06 2020-11-20 海信视像科技股份有限公司 显示设备喇叭状态检测方法及显示设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4148730A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116437268A (zh) * 2023-06-14 2023-07-14 武汉海微科技有限公司 自适应分频的环绕声上混方法、装置、设备及存储介质
CN116437268B (zh) * 2023-06-14 2023-08-25 武汉海微科技有限公司 自适应分频的环绕声上混方法、装置、设备及存储介质

Also Published As

Publication number Publication date
EP4148730A4 (en) 2023-11-29
AU2022275169B2 (en) 2024-05-02
AU2022275169A1 (en) 2023-02-02
US20230090810A1 (en) 2023-03-23
CN115346542A (zh) 2022-11-15
EP4148730A1 (en) 2023-03-15
JP2023529818A (ja) 2023-07-12
KR20230035232A (ko) 2023-03-13

Similar Documents

Publication Publication Date Title
US9361898B2 (en) Three-dimensional sound compression and over-the-air-transmission during a call
JP4262597B2 (ja) サウンドシステム
CN106535039B (zh) 基于响度的音频信号补偿
JP5882552B2 (ja) 協調的サウンドシステム
US20140105411A1 (en) Methods and systems for karaoke on a mobile device
CN104967960A (zh) 语音数据处理方法、游戏直播中的语音数据处理方法和系统
CN111970627B (zh) 音频信号的增强方法、装置、存储介质和处理器
JP5816072B2 (ja) バーチャルサラウンドレンダリングのためのスピーカアレイ
CN106797526A (zh) 音频处理装置、方法和程序
KR20120063380A (ko) 음질 향상 효과를 가지는 오디오 신호를 생성하는 오디오 장치 및 방법
WO2022237252A1 (zh) 音频信号处理方法、装置及存储介质
CN108966114A (zh) 声场重建方法、音频设备、存储介质及装置
JP2022538017A (ja) オーディオシステムにおける低音管理
WO2020097824A1 (zh) 音频处理方法、装置、存储介质及电子设备
US20200037057A1 (en) Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices
CN110267163B (zh) 一种定向声音虚拟低频增强方法、系统、介质和设备
CN114299976A (zh) 音频数据处理方法及电子设备
CN108495235B (zh) 一种重低音的分离方法、装置、计算机设备及存储介质
WO2020107201A1 (zh) 立体声播放方法、装置、存储介质及电子设备
US20120020483A1 (en) System and method for robust audio spatialization using frequency separation
CN116156413A (zh) 音频播放方法、装置、电子设备和存储介质
US20200037056A1 (en) Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices
US9706324B2 (en) Spatial object oriented audio apparatus
CN115346544A (zh) 音频信号处理方法、装置、存储介质和程序产品
CN114175685A (zh) 音频内容的与呈现独立的母带处理

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2022573367

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2022806229

Country of ref document: EP

Effective date: 20221206

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22806229

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022275169

Country of ref document: AU

Date of ref document: 20220210

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE