具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的数字辅助隔音处理的方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤101中,获取声源相位参数和心理声学参数。
步骤101具体为:获取用户输入的声源相位参数和心理声学参数。
其中,声源相位参数包括房间声源的相对相位差异参数表和35ms内的早期声波及反射波相位相对干消关系表。心理声学参数包括谐波参数和空间反射时延参数。
在步骤102中,根据心理声学参数对与多个通道一一对应的多个原始音频信号进行心理声学处理以获取多个第一目标音频信号。通道指数字声源信号通道。
具体实施中,步骤102包括步骤102-1至步骤102-6。
在步骤102-1中,通过多个滤波器将原始音频信号转换成多个原始子频域信号。
步骤102-1可以具体为:经模数转换芯片将模拟的原始音频信号实时采样以生成高精度数字音频信号,通过多个FIR(Finite Impulse Response,有限长单位冲激响应)滤波器将高精度数字音频信号转换成多个原始子频域信号。
FIR滤波器为线性相位滤波器或滤波器的组合,包括低通滤波器、带通滤波器、高通滤波器、低阻滤波器、带阻滤波器和高阻滤波器。
各频率检测带宽包括并不限于倍频程及基于倍频的更精密分割,如1/3倍频程、1/6倍频程等,还可以基于音乐的半音音高即12平均律的频谱划分,当检测到对应的原始子频域信号超出噪声测试点的目标噪声(子频域听闻噪声阈值)时,启动步骤102-2至步骤102-6。
在步骤102-2中,根据多个原始子频域信号和多个子频域听闻噪声阈值确定多个第一子频域信号。
具体实施中步骤102-2包括步骤A1至步骤C1。
在步骤A1中,判断原始子频域信号是否大于子频域听闻噪声阈值。
在步骤B1中,若原始子频域信号大于子频域听闻噪声阈值,则将子频域听闻噪声阈值设为第一子频域信号。
在步骤C1中,若原始子频域信号不大于子频域听闻噪声阈值,则将原始子频域信号设为第一子频域信号。
其中,步骤A1至步骤C1可以通过动态处理实现,动态处理包括信号强度检测、压缩器、扩展器、门限控制器、信号包络、信号输出等功能或以上的组合。
因为超出子频域听闻噪声阈值的声能是现有建筑结构无法隔声的,故需要进行滤除,通过步骤A1至步骤C1确定了滤除超出子频域听闻噪声阈值的声能后的原始子频域信号,即第一子频域信号。
在步骤102-3中,根据多个原始子频域信号和多个第一子频域信号获取多个子频域差值信号。
步骤102-3具体为:对多个第一子频域信号进行反相处理以获取多个第一子频域反相信号,再对多个原始子频域信号和多个第一子频域反相信号进行加法处理以获取多个子频域差值信号。
反相指产生振幅相等但相位差异180度的信号或指定差异角的信号后输出。
通过步骤102-3获取到滤除的超出子频域听闻噪声阈值的声能,即子频域差值信号。
在步骤102-4中,根据心理声学参数、多个子频域差值信号和心理声学模型获取多个子频域补偿信号。
滤除的超出子频域听闻噪声阈值的声能经心理声学模型处理以获取在不可闻的中高频区或者动态压缩的子频域补偿信号。
具体实施中步骤102-4包括步骤A2至步骤B2。
在步骤A2中,对多个子频域差值信号进行包络检测以生成多个包络信号。
在步骤B2中,根据心理声学模型、多个包络信号、心理声学参数和多个子频域差值信号确定多个子频域补偿信号。
首先根据多个包络信号判断是否获取多个子频域补偿信号;当判定获取多个子频域补偿信号时,根据心理声学参数和多个子频域差值信号获取多个子频域补偿信号;
对超出噪声可闻的低频声能(子频域差值信号)进行动态压缩,根据谐波参数重新安全的在中高频区生成其基频的谐波,谐波成份由人耳等响曲线、噪声评价曲线、噪声掩蔽谱曲线等心理声学关系来确定,动态压缩后的低频信号与心理声学处理产生的信号混合产生增强信号,增强信号通过空间反射时延、相位等参数进行调整以生成模拟目标环境声学效果的原始子频域补偿信号。
在步骤102-5中,根据多个子频域补偿信号和多个第一子频域信号获取多个子频域混合信号。
步骤102-5具体为:根据预设增益对多个子频域补偿信号和多个第一子频域信号进行混合以获取多个子频域混合信号。
由于对原始子频域信号的超出子频域听闻噪声阈值的声能部分进行了滤除,并将滤除的超出子频域听闻噪声阈值的声能经心理声学模型处理,获取在中高频区或者动态压缩的子频域补偿信号,最后将滤除超出子频域听闻噪声阈值的声能后的原始子频域信号(第一子频域信号)与子频域补偿信号进行混合,从而获取到与原始子频域信号听感完全相同,但是又不超出子频域听闻噪声阈值的子频域混合信号。
在步骤102-6中,对多个子频域混合信号进行卷积合成以获取第一目标音频信号。
步骤102-6具体为:根据环境声学参数对多个子频域混合信号进行卷积合成以获取第一目标音频信号。
环境声学参数包括房间响应曲线、动态范围、噪声功率谱密度、扬声器响应数据、扬声器目标输出响应数据、人耳响应曲线对照表、NR噪声评价对照表、音频延迟缓存、频带信号限值、信号增益对比查找表、滤波器频率及其组合阶数。
在步骤103中,根据声源相位参数对多个第一目标音频信号进行相位调整以确定多个第二目标音频信号。
步骤103具体为:对多个第一目标音频信号的频率幅度谱对应的相位谱依照声源相位参数要求进行变换调整,保持每个频率分量上的幅度不变,只对相位进行修改,然后重新合成输出。
步骤103包括步骤103-1至步骤103-2。
在步骤103-1中,通过全指向声源检测空间声学特征;所述空间声学特征为空间坐标、空间混响时间、空间频率响应特征、与声场的分布、声能的频率之间的关系。
在步骤103-2中,根据所述空间声学特征调整音源的相位以获取多个第二目标音频信号,以使目标听音区域的声能的分布在预设范围。
具体实施中,如图2所示,步骤103之后还包括步骤104。
在步骤104中,通过多个通道输出多个第二目标音频信号。
具体实施中,可以将多个第二目标音频信号根据需要做分配或切换及其切换分配的组合;再经常规音频处理,如均衡、陷波处理、移频、音调变换、自动增益控制和效果调整等。最后将常规音频处理后的多个第二目标音频信号进行高精度数模转换,通过各个通道输出。
为了实现上述数字辅助隔音处理的方法,本发明实施例还提供了一种数字辅助隔音处理的装置,如图3所示,该数字辅助隔音处理的装置30包括声源相位参数获取模块310、第一目标音频信号获取模块320和第二目标音频信号确定模块330。
声源相位参数获取模块310,用于获取声源相位参数和心理声学参数。
第一目标音频信号获取模块320,用于根据心理声学参数对与多个通道一一对应的多个原始音频信号进行心理声学处理以获取多个第一目标音频信号。
第二目标音频信号确定模块330,用于根据声源相位参数对多个第一目标音频信号进行相位调整以确定多个第二目标音频信号。
其中,如图4所示,数字辅助隔音处理的装置30还包括输出模块340.
输出模块340,用于通过多个通道输出多个第二目标音频信号。
其中,如图5所示,第一目标音频信号获取模块320包括原始子频域信号转换模块321、第一子频域信号确定模块322、子频域差值信号获取模块323、子频域补偿信号获取模块324、子频域混合信号获取模块325和卷积模块326。
原始子频域信号转换模块321,用于通过多个滤波器将原始音频信号转换成多个原始子频域信号。
第一子频域信号确定模块322,用于根据多个原始子频域信号和多个子频域听闻噪声阈值确定多个第一子频域信号。
子频域差值信号获取模块323,用于根据多个原始子频域信号和多个第一子频域信号获取多个子频域差值信号。
子频域补偿信号获取模块324,用于根据心理声学参数、听闻噪声阈值、多个子频域差值信号和心理声学模型获取多个子频域补偿信号。
子频域混合信号获取模块325,用于根据多个子频域补偿信号和多个第一子频域信号获取多个子频域混合信号。
卷积模块326,用于对多个子频域混合信号进行卷积合成以获取第一目标音频信号。
如图6所示,子频域补偿信号获取模块324包括包络检测模块3241和子频域补偿信号确定模块3242。
包络检测模块3241,用于对多个子频域差值信号进行包络检测以生成多个包络信号;
子频域补偿信号确定模块3242,用于根据心理声学模型、多个包络信号、心理声学参数和多个子频域差值信号确定多个子频域补偿信号。
如图7所示,第一子频域信号确定模块322包括判断模块3221、第一设定模块3222和第二设定模块3223。
判断模块3221,用于判断原始子频域信号是否大于子频域听闻噪声阈值。
第一设定模块3222,用于若判断模块判定原始子频域信号大于子频域听闻噪声阈值,则将子频域听闻噪声阈值设为第一子频域信号。
第二设定模块3223,用于若判断模块判定原始子频域信号不大于子频域听闻噪声阈值,则将原始子频域信号设为第一子频域信号。
如图8所示,第二目标音频信号确定模块330包括空间声学特征检测模块331和相位调整模块332。
空间声学特征检测模块331,用于通过全指向声源检测空间声学特征;所述空间声学特征为空间坐标、空间混响时间、空间频率响应特征、与声场能的分布、声能的频率之间的关系;
相位调整模块332,用于根据所述空间声学特征调整音源的相位以获取多个第二目标音频信号,以使目标听音区域的声能的分布在预设范围。
综上所述,本发明实施例首先获取声源相位参数、心理声学参数;然后根据心理声学参数对与多个通道一一对应的多个原始音频信号进行心理声学处理以获取多个第一目标音频信号;最后根据声源相位参数对多个第一目标音频信号进行相位调整以确定多个第二目标音频信号;故通过使用数字音频处理技术和人类空间听觉心理相配合,集成到现有的扩声系统中,利用现有扩声系统生成声源信号,达到空间听觉的人类心理听觉感受的降噪目的,弥补了空间降噪只能采取物理隔音、消噪的短板。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图9是本发明一实施例提供的一种数字辅助隔音处理的装置的示意图。如图9所示,该实施例的一种数字辅助隔音处理的装置9包括:处理器90、存储器91以及存储在存储器91中并可在处理器90上运行的计算机程序92,例如数字辅助隔音处理的程序。处理器90执行计算机程序92时实现上述各个数字辅助隔音处理的方法实施例中的步骤,例如图1所示的步骤101至103。或者,处理器90执行计算机程序92时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块310至330的功能。
示例性的,计算机程序92可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器991中,并由处理器90执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序92在数字辅助隔音处理的装置9中的执行过程。例如,计算机程序92可以被分割成声源相位参数获取模块310、第一目标音频信号获取模块320和第二目标音频信号确定模块330(虚拟装置中的模块),各模块具体功能如下:
声源相位参数获取模块310,用于获取声源相位参数和心理声学参数。
第一目标音频信号获取模块320,用于根据心理声学参数对与多个通道一一对应的多个原始音频信号进行心理声学处理以获取多个第一目标音频信号。
第二目标音频信号确定模块330,用于根据声源相位参数对多个第一目标音频信号进行相位调整以确定多个第二目标音频信号。
所述数字辅助隔音处理的装置9可以是扩声系统或音箱系统。所述数字辅助隔音处理的装置可包括,但不仅限于,处理器90、存储器91。本领域技术人员可以理解,图7仅仅是数字辅助隔音处理的装置9的示例,并不构成对数字辅助隔音处理的装置9的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述数字辅助隔音处理的装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器90可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器91可以是所述数字辅助隔音处理的装置9的内部存储单元,例如数字辅助隔音处理的装置9的硬盘或内存。所述存储器91也可以是所述数字辅助隔音处理的装置9的外部存储设备,例如所述数字辅助隔音处理的装置9上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器91还可以既包括所述数字辅助隔音处理的装置9的内部存储单元也包括外部存储设备。所述存储器91用于存储所述计算机程序以及所述数字辅助隔音处理的装置所需的其他程序和数据。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。