CN116437268A - 自适应分频的环绕声上混方法、装置、设备及存储介质 - Google Patents

自适应分频的环绕声上混方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116437268A
CN116437268A CN202310702253.2A CN202310702253A CN116437268A CN 116437268 A CN116437268 A CN 116437268A CN 202310702253 A CN202310702253 A CN 202310702253A CN 116437268 A CN116437268 A CN 116437268A
Authority
CN
China
Prior art keywords
frequency
low
pass filter
signal component
frequency signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310702253.2A
Other languages
English (en)
Other versions
CN116437268B (zh
Inventor
李林峰
汪杨刚
万成
周云波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Haiwei Technology Co ltd
Original Assignee
Wuhan Haiwei Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Haiwei Technology Co ltd filed Critical Wuhan Haiwei Technology Co ltd
Priority to CN202310702253.2A priority Critical patent/CN116437268B/zh
Publication of CN116437268A publication Critical patent/CN116437268A/zh
Application granted granted Critical
Publication of CN116437268B publication Critical patent/CN116437268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)

Abstract

本发明属于音频处理技术领域,公开了一种自适应分频的环绕声上混方法、装置、设备及存储介质。本发明通过根据初始分频点构造低通滤波器与高通滤波器;通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放,通过对不同音频的每一帧信号的能量分析,自适应地给出能量分频点进行滤波和信道分配,相对于单纯地将环绕声去相关的处理操作,本发明能最终营造出更好的3D氛围感。

Description

自适应分频的环绕声上混方法、装置、设备及存储介质
技术领域
本发明涉及音频处理技术领域,尤其涉及一种自适应分频的环绕声上混方法、装置、设备及存储介质。
背景技术
目前,诸如5.1.4、7.1.4等全景声扬声器配置已经逐步被大众了解与接受,并被广泛应用在音乐厅、电影院、家庭影院和汽车座舱等环境中。由于生活中绝大部分的音频都是双通道立体声,而全景声则需要多达10个、12个甚至更多的音频通道,需要使用算法将双通道立体声上混为更多通道的音频。
为了取得更好的听音效果,许多常规解码方法,如PSD、ADP估计法,再到目前主流的基于相干声与环境声的提取(PAE),基于心理声学的全新的panning规则的上混方法被依次提出。这些方法在细节处理上越来越精细,声像处理越来越准确,全景声效果也越来越好。但是,渐渐也有人发现,单纯地将环绕声信号去相关后,再由天空扬声器播放无法营造出舒适的3D氛围感。这就在一定程度上造成了天空扬声器的浪费,导致7.1.4配置的全景声和7.1配置的全景声在最终的3D氛围感上相差不大。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种自适应分频的环绕声上混方法、装置、设备及存储介质,旨在解决现有技术中天空扬声器营造的3D氛围感不佳的技术问题。
为实现上述目的,本发明提供了一种自适应分频的环绕声上混方法,所述方法包括以下步骤:
根据初始分频点构造低通滤波器与高通滤波器;
通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;
将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放。
可选地,所述通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量,包括:
对所述环绕声信号按照预设采样频率采样,得到对应数量的采样点;
将连续的所述预设采样频率对应个数的采样点得到音频帧;
通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
可选地,所述通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量,包括:
根据当前分频点得到下一音频帧的分频点;
根据所述下一音频帧的分频点构造所述下一音频帧的分频点的低通滤波器与高通滤波器,并根据所述下一音频帧的分频点的低通滤波器与高通滤波器对所述环绕声信号帧滤波,得到所述环绕声信号帧的低频信号分量与高频信号分量。
可选地,所述根据当前分频点得到下一音频帧的分频点,包括:
根据所述低频信号分量与高频信号分量得到所述音频帧的低频分量能量与高频分量能量;
根据所述低频分量能量与高频分量能量得到高频与低频的能量比值;
根据所述能量比值,当前分频点,初始分频点及平滑系数得到下一音频帧的分频点。
可选地,所述通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量,还包括:
根据所述下一音频帧的分频点匹配预设低通滤波器及高通滤波器;
在匹配失败时,根据所述预设低通滤波器及高通滤波器的频率与所述下一音频帧的分频点的频率得到频率差;
通过所述频率差最小的预设低通滤波器及高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
可选地,所述根据初始分频点构造低通滤波器与高通滤波器之前,还包括:
对当前播放音乐进行成分分析,得到频谱成分,其中,所述成分分析包括功率谱密度、自适应滤波算法、自适应动态规划、无监督算法或基于主环境提取方式中的任意一种;
根据所述频谱成分查询分频点对应关系,得到所述频谱成分对应的初始分频点。
可选地,所述环绕声扬声器包括左环绕扬声器、右环绕扬声器、左后方环绕扬声器及右后方环绕扬声器,所述天空扬声器包括左上前天空扬声器、右上前天空扬声器、左上后天空扬声器、右上后天空扬声器,所述将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放,包括:
获取所述环绕扬声器与天空扬声器的信号传输延迟时间;
将所述低频信号分量延时传输延迟时间后,分别传输至所述左环绕扬声器、右环绕扬声器、左后方环绕扬声器及右后方环绕扬声器进行播放;
将所述高频信号分量延时传输延迟时间后,分别传输至所述左上前天空扬声器、右上前天空扬声器、左上后天空扬声器、右上后天空扬声器进行播放。
此外,为实现上述目的,本发明还提出一种自适应分频的环绕声上混装置,所述自适应分频的环绕声上混装置包括:
滤波器构造模块,用于根据初始分频点构造低通滤波器与高通滤波器;
音频滤波模块,用于通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;
音频输出模块,用于将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放。
此外,为实现上述目的,本发明还提出一种自适应分频的环绕声上混设备,所述自适应分频的环绕声上混设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自适应分频的环绕声上混程序,所述自适应分频的环绕声上混程序配置为实现如上文所述的自适应分频的环绕声上混方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有自适应分频的环绕声上混程序,所述自适应分频的环绕声上混程序被处理器执行时实现如上文所述的自适应分频的环绕声上混方法的步骤。
本发明通过根据初始分频点构造低通滤波器与高通滤波器;通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放,通过对不同音频的每一帧信号的能量分析,自适应地给出能量分频点进行滤波和信道分配,相对于单纯地将环绕声去相关的处理操作,本发明能最终营造出更好的3D氛围感。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的自适应分频的环绕声上混设备的结构示意图;
图2为本发明自适应分频的环绕声上混方法第一实施例的流程示意图;
图3为本发明自适应分频的环绕声上混方法第二实施例的流程示意图;
图4为本发明自适应分频的环绕声上混装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的自适应分频的环绕声上混设备结构示意图。
如图1所示,该自适应分频的环绕声上混设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对自适应分频的环绕声上混设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及自适应分频的环绕声上混程序。
在图1所示的自适应分频的环绕声上混设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明自适应分频的环绕声上混设备中的处理器1001、存储器1005可以设置在自适应分频的环绕声上混设备中,所述自适应分频的环绕声上混设备通过处理器1001调用存储器1005中存储的自适应分频的环绕声上混程序,并执行本发明实施例提供的自适应分频的环绕声上混方法。
本发明实施例提供了一种自适应分频的环绕声上混方法,参照图2,图2为本发明一种自适应分频的环绕声上混方法第一实施例的流程示意图。
本实施例中,所述自适应分频的环绕声上混方法包括以下步骤:
步骤S10:根据初始分频点构造低通滤波器与高通滤波器。
需要说明的是,本实施例的执行主体是自适应分频的环绕声上混设备,其中,该自适应分频的环绕声上混设备具有数据处理,数据通信及程序运行等功能,所述自适应分频的环绕声上混设备可以为集成控制器,控制计算机等设备,当然还可以为其他具备相似功能的设备,本实施例对此不做限制。
应当理解的是,在7.1.4的扬声器配置和各个扬声器的目标配置上,低音炮一般布置在地面上,四个天空扬声器布置在人头的上方,其余的扬声器则一般与人头平齐,分别布置在各个方位上。对于大多数双通道立体声上混算法而言,位于人头前方的三个扬声器用来制造人声和乐器声的声像,低音炮用来不成低音,其余所有的扬声器则用来播放环绕声,营造氛围感。
可以理解的是,所述初始分频点指的是在进行音频滤波时,用于开始执行滤波的初始频率基准,用于区分高频环绕声和低频环绕声,其中,分频点会根据音频的类型有关,不同的音频类型对应着不同的分频点,另外随着不断进行滤波,所述分频点可以发生改变,其改变幅度根据实际音频确定,本实施例对此不做限制。
在具体实现中,所述自适应分频的环绕声上混设备在创建低频滤波器和高频滤波器时,需要首先获取到预先设置的初始分频点,例如初始分频点为3000Hz,那么在实际处理时,频率低于3000Hz的音频会被归纳为低频环绕声,类似的,频率高于3000Hz的音频会被归纳为高频环绕声。当初始分频点确定好之后,能够根据所述初始分频点构造低通滤波器与高通滤波器,所述低通滤波器能够容许低于分频点频率的信号通过,限制高于分频点频率的信号通过,所述高通滤波器能够容许高于分频点频率的信号通过,限制低于分频点频率的信号通过,通过所述低通滤波器与所述高通滤波器能够将一个音频信号处理为一个低通信号和一个高通信号,便于对所述音频信号进行分析处理。
进一步地,在根据初始分频点构造低通滤波器与高通滤波器之前,还包括:
对当前播放音乐进行成分分析,得到频谱成分,其中,所述成分分析包括功率谱密度、自适应滤波算法、自适应动态规划、无监督算法或基于主环境提取方式中的任意一种;
根据所述频谱成分查询分频点对应关系,得到所述频谱成分对应的初始分频点。
需要说明的是,对于音乐音频,可以对其进行成分分析,将所述音乐音频划分为主要成分与环绕声成分,其中主要成分经过panning等处理手段交由前方三个扬声器播放,环绕声成分经过相关的处理交由余下的扬声器进行播放。
可以理解的是,对音乐音频进行成分分析时,能够根据所述音频的频率确定出音乐的音乐类型,同时,针对不同的音乐类型,能够预先设置音乐类型与分频点的对应关系,在所述音乐类型与分频点对应关系中,对于低音较重的音乐,分频点的频率相对较低,例如可以设置为500Hz-2000Hz之间,而对于高频较为丰富的音乐,分频点应在3000 Hz-6000 Hz之间。
在具体实现中,所述自适应分频的环绕声上混设备能够对当前播放的音频频率进行识别,一般的,将频率在500Hz-2000Hz的音频作为低频音频,频率在3000Hz-6000Hz的音频作为高频音频,为了能够对音频中的低频音频和高频音频进行分离,可以设置一个分频点,用来区分所述低频音频和高频音频。在扬声器播放音乐时,能够获取到当前扬声器的音频频谱,并对所述当前播放的音乐进行成分分析,进而得到当前播放音乐的频谱成分,在进行成分分析时,可以根据功率谱密度、自适应滤波算法、自适应动态规划、无监督算法或基于主环境提取方式中的任意一种来进行成分分析,得到频谱成分,并根据所述频谱成分创建分频点对应关系,每一种频谱成分可对应一个分频点,具体设置根据实际情况设定,本实施例对此不做限制,当在对当前播放音乐检测得到频谱成分后,能够查询所述分频点对应关系,进而确定出初始分频点。
步骤S20:通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量。
需要理解的是,所述低频信号分量与所述高频信号分量是根据已经创建好的两个滤波器对环绕声进行滤波得到的频率范围不同的环绕声音频分量。
在具体实现中,在根据初始分频点构造出低频滤波器与高频滤波器之后,能够根据所述低频滤波器与高频滤波器得到对应的低频信号分量与所述高频信号分量,若根据分频点为3000Hz构造出滤波器后,将所述环绕声中低于3000Hz的环绕声滤波为低频信号分量,将大于3000Hz的环绕声滤波为高频信号分量。
步骤S30:将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放。
应当理解的是,所述环绕声扬声器包括左环绕扬声器、右环绕扬声器、左后方环绕扬声器及右后方环绕扬声器,所述天空扬声器包括左上前天空扬声器、右上前天空扬声器、左上后天空扬声器、右上后天空扬声器。
在具体实现中,在得到低频信号分量与所述高频信号分量之后,能够从存储介质中读取到每个环绕扬声器对应的延迟时间,其中每个环绕扬声器由于安装的位置不同,因此所对应的延迟时间也有不同,因此本实施例对延时时间不做具体限制,根据实际情况进行合理设置。例如,可以将低频信号分量分别延时0、1.5、3、5 ms后,依次传输至左环绕扬声器、右环绕扬声器、左后方环绕扬声器及右后方环绕扬声器播放,将高频部分延时6、7、8、9ms后,依次给到左上前天空扬声器、右上前天空扬声器、左上后天空扬声器、右上后天空扬声器进行播放。
本实施例通过根据初始分频点构造低通滤波器与高通滤波器;通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放,通过对不同音频的每一帧信号的能量分析,自适应地给出能量分频点进行滤波和信道分配,相对于单纯地将环绕声去相关的处理操作,本发明能最终营造出更好的3D氛围感。
参考图3,图3为本发明一种自适应分频的环绕声上混方法第二实施例的流程示意图。
基于上述第一实施例,本实施例自适应分频的环绕声上混方法在所述步骤S20,包括:
步骤S201:对所述环绕声信号按照预设采样频率采样,得到对应数量的采样点;
步骤S202:将连续的所述预设采样频率对应个数的采样点得到音频帧;
步骤S203:通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
需要说明的是,所述自适应分频的环绕声上混设备得到的音频信号
Figure SMS_1
是连续的,而对于数字信号而言,是无法使用时间域上的联系信号/>
Figure SMS_2
表示,因此需要将连续的音频信号/>
Figure SMS_3
离散化为/>
Figure SMS_4
,其中n表示采样点。
应当理解的是,对音频信号进行处理时,需要进行分帧处理,一般在一帧中设置采样点的个数为1024的整数倍,所述帧长的采样点为预设采样频率由所述采样点个数决定。
在具体实现中,所述自适应分配环绕声上混设备在获取到所述预设采样频率时,能够根据所述预设采样频率确定每一帧数据中的采样点的个数,并根据所述采样点对所述音频进行采样,得到音频帧,并将音频帧通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。以帧长为2048个采样点进行说明。当将一帧数据设置2048个采样点之后,每一帧数据可表示为
Figure SMS_5
,其中,n=1、2049、4097...。为了方便描述,可以使用/>
Figure SMS_6
表示每一帧信号,其中,k表示帧数索引,k=1、2、3...。在心理声学中,若纯音的频率越高,那么器声像会越高,因此,对所述音频帧滤波,得到低频信号分量与高频信号分量。
进一步地,所述通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量,包括:
根据当前分频点得到下一音频帧的分频点;
根据所述下一音频帧的分频点构造所述下一音频帧的分频点的低通滤波器与高通滤波器,并根据所述下一音频帧的分频点的低通滤波器与高通滤波器对所述环绕声信号帧滤波,得到所述环绕声信号帧的低频信号分量与高频信号分量。
所述根据当前分频点得到下一音频帧的分频点,包括:
根据所述低频信号分量与高频信号分量得到所述音频帧的低频分量能量与高频分量能量;
根据所述低频分量能量与高频分量能量得到高频与低频的能量比值;
根据所述能量比值,当前分频点,初始分频点及平滑系数得到下一音频帧的分频点。
在具体实现中,所述自适应分配的环绕声上混设备首先会对初始分频点进行初始化,可以将初始化分频点理解为第0帧的分频点,在进行初始化时,可以将分频点初始化为3000Hz,即
Figure SMS_8
,并以所述初始分频点/>
Figure SMS_13
为分频点构造低通滤波器与高通滤波器,根据所述低通滤波器与高通滤波器对环绕声信号/>
Figure SMS_15
进行滤波,得到低频信号分量/>
Figure SMS_9
和高频信号分量/>
Figure SMS_11
,获得到低频信号分量/>
Figure SMS_14
和高频信号分量/>
Figure SMS_16
之后,对所述低频信号分量与所述高频信号分别计算其对应的平方和,得到低频分量能量
Figure SMS_7
与高频分量能量/>
Figure SMS_10
,并计算所述高频分量能量与所述低频分量能量的能量比值/>
Figure SMS_12
,根据所述能量比值、平滑系数、初始分频点可以得到第K+1帧的分频点,计算公式为:
Figure SMS_17
其中,所述
Figure SMS_19
为第k+1帧的分频点,/>
Figure SMS_24
为第k帧的分频点,/>
Figure SMS_27
为平滑系数,取值范围为/>
Figure SMS_20
,一般取值/>
Figure SMS_22
,平滑系数/>
Figure SMS_25
的取值根据实际情况确定,本实施例对此不作限制,/>
Figure SMS_28
为初始分频点,/>
Figure SMS_18
表示第k帧的能量比值。得到新的分频点
Figure SMS_23
后,以该分频点再次构造低通与高通滤波器,并对环绕声信号/>
Figure SMS_26
滤波,得到输出信号的低频与高频分量/>
Figure SMS_29
和/>
Figure SMS_21
进一步地,所述通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量,还包括:
根据所述下一音频帧的分频点匹配预设低通滤波器及高通滤波器;
在匹配失败时,根据所述预设低通滤波器及高通滤波器的频率与所述下一音频帧的分频点的频率得到频率差;
通过所述频率差最小的预设低通滤波器及高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
在具体实现中,所述自适应分频的环绕声上混设备能够预设若干个低通滤波器与高通滤波器,所述若干个低通滤波器与高通滤波器均由不同的分频点,在求得第k+1帧的分频点
Figure SMS_30
时,能够根据所述第k+1帧的分频点与所述低通滤波器与高通滤波器分频点对比,得到比对结果,在所述比对结果一致时,则选取该频率对应的滤波器,在所述比对结果不一致时,确定所述第k+1帧的分频点/>
Figure SMS_31
位于低通滤波器与高通滤波器分频点的所在区间,并根据所述第k+1帧的分频点/>
Figure SMS_32
与低通滤波器与高通滤波器分频点的频率差,选择所述频率差更小的低通滤波器与高通滤波器对音频信号进行音频处理,得到低频信号分量与高频信号分量。
本实施例通过对音频帧采取多个采样点将音频信号离散化,并逐帧估计当前帧的分频点,通过当前帧的分频点确定低通滤波器与高通滤波器,通过所述低通滤波器与高通滤波器得到当前帧的低频信号分量与高频信号分量,能够将音频信号中高频信号分量传输至天空扬声器,低频信号分量传输至环绕扬声器,从而使的纯音的频率提高,增强3D氛围感。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有自适应分频的环绕声上混程序,所述自适应分频的环绕声上混程序被处理器执行时实现如上文所述的自适应分频的环绕声上混方法的步骤。
参照图4,图4为本发明自适应分频的环绕声上混装置第一实施例的结构框图。
如图4所示,本发明实施例提出的自适应分频的环绕声上混装置包括:
滤波器构造模块10,用于根据初始分频点构造低通滤波器与高通滤波器;
音频滤波模块20,用于通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;
音频输出模块30,用于将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放。
本实施例通过根据初始分频点构造低通滤波器与高通滤波器;通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放,通过对不同音频的每一帧信号的能量分析,自适应地给出能量分频点进行滤波和信道分配,相对于单纯地将环绕声去相关的处理操作,本发明能最终营造出更好的3D氛围感。
在一实施例中,所述音频滤波模块20,还用于对所述环绕声信号按照预设采样频率采样,得到对应数量的采样点;将连续的所述预设采样频率对应个数的采样点得到音频帧;通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
在一实施例中,所述音频滤波模块20,还用于根据当前分频点得到下一音频帧的分频点;根据所述下一音频帧的分频点构造所述下一音频帧的分频点的低通滤波器与高通滤波器,并根据所述下一音频帧的分频点的低通滤波器与高通滤波器对所述环绕声信号帧滤波,得到所述环绕声信号帧的低频信号分量与高频信号分量。
在一实施例中,所述音频滤波模块20,还用于根据所述低频信号分量与高频信号分量得到所述音频帧的低频分量能量与高频分量能量;根据所述低频分量能量与高频分量能量得到高频与低频的能量比值;根据所述能量比值,当前分频点,初始分频点及平滑系数得到下一音频帧的分频点。
在一实施例中,所述音频滤波模块20,还用于根据所述下一音频帧的分频点匹配预设低通滤波器及高通滤波器;在匹配失败时,根据所述预设低通滤波器及高通滤波器的频率与所述下一音频帧的分频点的频率得到频率差;通过所述频率差最小的预设低通滤波器及高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
在一实施例中,所述滤波器构造模块10,还用于对当前播放音乐进行成分分析,得到频谱成分,其中,所述成分分析包括功率谱密度、自适应滤波算法、自适应动态规划、无监督算法或基于主环境提取方式中的任意一种;根据所述频谱成分查询分频点对应关系,得到所述频谱成分对应的初始分频点。
在一实施例中,所述音频输出模块30,还用于获取所述环绕扬声器与天空扬声器的信号传输延迟时间;将所述低频信号分量延时传输延迟时间后,分别传输至所述左环绕扬声器、右环绕扬声器、左后方环绕扬声器及右后方环绕扬声器进行播放;将所述高频信号分量延时传输延迟时间后,分别传输至所述左上前天空扬声器、右上前天空扬声器、左上后天空扬声器、右上后天空扬声器进行播放。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光 盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种自适应分频的环绕声上混方法,其特征在于,所述自适应分频的环绕声上混方法包括:
根据初始分频点构造低通滤波器与高通滤波器;
通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;
将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放。
2.如权利要求1所述的方法,其特征在于,所述通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量,包括:
对所述环绕声信号按照预设采样频率采样,得到对应数量的采样点;
将连续的所述预设采样频率对应个数的采样点得到音频帧;
通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
3.如权利要求2所述的方法,其特征在于,所述通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量,包括:
根据当前分频点得到下一音频帧的分频点;
根据所述下一音频帧的分频点构造所述下一音频帧的分频点的低通滤波器与高通滤波器,并根据所述下一音频帧的分频点的低通滤波器与高通滤波器对所述环绕声信号帧滤波,得到所述环绕声信号帧的低频信号分量与高频信号分量。
4.如权利要求3所述的方法,其特征在于,所述根据当前分频点得到下一音频帧的分频点,包括:
根据所述低频信号分量与高频信号分量得到所述音频帧的低频分量能量与高频分量能量;
根据所述低频分量能量与高频分量能量得到高频与低频的能量比值;
根据所述能量比值,当前分频点,初始分频点及平滑系数得到下一音频帧的分频点。
5.如权利要求3所述的方法,其特征在于,所述通过所述低通滤波器与高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量,还包括:
根据所述下一音频帧的分频点匹配预设低通滤波器及高通滤波器;
在匹配失败时,根据所述预设低通滤波器及高通滤波器的频率与所述下一音频帧的分频点的频率得到频率差;
通过所述频率差最小的预设低通滤波器及高通滤波器对所述音频帧滤波,得到低频信号分量与高频信号分量。
6.如权利要求1所述的方法,其特征在于,所述根据初始分频点构造低通滤波器与高通滤波器之前,还包括:
对当前播放音乐进行成分分析,得到频谱成分,其中,所述成分分析包括功率谱密度、自适应滤波算法、自适应动态规划、无监督算法或基于主环境提取方式中的任意一种;
根据所述频谱成分查询分频点对应关系,得到所述频谱成分对应的初始分频点。
7.如权利要求1至6中任一项所述的方法,其特征在于,所述环绕声扬声器包括左环绕扬声器、右环绕扬声器、左后方环绕扬声器及右后方环绕扬声器,所述天空扬声器包括左上前天空扬声器、右上前天空扬声器、左上后天空扬声器、右上后天空扬声器,所述将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放,包括:
获取所述环绕扬声器与天空扬声器的信号传输延迟时间;
将所述低频信号分量延时传输延迟时间后,分别传输至所述左环绕扬声器、右环绕扬声器、左后方环绕扬声器及右后方环绕扬声器进行播放;
将所述高频信号分量延时传输延迟时间后,分别传输至所述左上前天空扬声器、右上前天空扬声器、左上后天空扬声器、右上后天空扬声器进行播放。
8.一种自适应分频的环绕声上混装置,其特征在于,所述自适应分频的环绕声上混装置包括:
滤波器构造模块,用于根据初始分频点构造低通滤波器与高通滤波器;
音频滤波模块,用于通过所述低通滤波器与高通滤波器将环绕声信号滤波,得到低频信号分量与高频信号分量;
音频输出模块,用于将所述低频信号分量传输至环绕声扬声器播放,将所述高频信号分量传输至天空扬声器播放。
9.一种自适应分频的环绕声上混设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自适应分频的环绕声上混程序,所述自适应分频的环绕声上混程序配置为实现如权利要求1至7中任一项所述的自适应分频的环绕声上混方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有自适应分频的环绕声上混程序,所述自适应分频的环绕声上混程序被处理器执行时实现如权利要求1至7任一项所述的自适应分频的环绕声上混方法的步骤。
CN202310702253.2A 2023-06-14 2023-06-14 自适应分频的环绕声上混方法、装置、设备及存储介质 Active CN116437268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310702253.2A CN116437268B (zh) 2023-06-14 2023-06-14 自适应分频的环绕声上混方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310702253.2A CN116437268B (zh) 2023-06-14 2023-06-14 自适应分频的环绕声上混方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN116437268A true CN116437268A (zh) 2023-07-14
CN116437268B CN116437268B (zh) 2023-08-25

Family

ID=87091168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310702253.2A Active CN116437268B (zh) 2023-06-14 2023-06-14 自适应分频的环绕声上混方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116437268B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117241170A (zh) * 2023-11-16 2023-12-15 武汉海微科技有限公司 基于二分频音箱的音频播放方法、装置、设备及存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050259841A1 (en) * 2003-03-31 2005-11-24 Caron Gerald F Narrow opening electroacoustical transducing
US20080137887A1 (en) * 2006-08-22 2008-06-12 John Usher Methods and devices for audio upmixing
CN102523542A (zh) * 2011-12-14 2012-06-27 南京琅声声学科技有限公司 一种准自适应声学均衡方法与装置
WO2012154124A1 (en) * 2011-05-11 2012-11-15 Creative Technology Ltd A speaker for reproducing surround sound
CN203675303U (zh) * 2013-11-25 2014-06-25 中山市悦辰电子实业有限公司 一种用于音响产品的分频段自适应增益控制系统
US20150172817A1 (en) * 2013-12-13 2015-06-18 Vasileios Tsakiris Accoustic speaker system
CN106034274A (zh) * 2015-03-13 2016-10-19 深圳市艾思脉电子股份有限公司 基于声场波合成的3d音响装置及其合成方法
US20180007468A1 (en) * 2016-06-30 2018-01-04 Samsung Electronics Co., Ltd. Acoustic output device and control method thereof
CN207897145U (zh) * 2018-03-12 2018-09-21 上海慧声科技有限公司 一种自适应全音域定向扬声系统
US20210029449A1 (en) * 2019-07-24 2021-01-28 Barefoot Sound, Llc Method and apparatus for improving effective signal-to-noise ratio of analog to digital conversion for multi-band digital signal processing devices
CN112511966A (zh) * 2020-11-06 2021-03-16 华南理工大学 一种车载立体声重放的自适应主动分频方法
CN114245273A (zh) * 2021-11-12 2022-03-25 华南理工大学 一种基于高低分频多扬声器阵列的波束投射方法
WO2022132197A1 (en) * 2020-12-15 2022-06-23 Syng, Inc. Systems and methods for audio upmixing
WO2022237252A1 (zh) * 2021-05-14 2022-11-17 广州视源电子科技股份有限公司 音频信号处理方法、装置及存储介质
CN115442709A (zh) * 2022-07-29 2022-12-06 荣耀终端有限公司 音频处理方法、虚拟低音增强系统、设备和存储介质
CN116055982A (zh) * 2022-08-12 2023-05-02 荣耀终端有限公司 音频输出方法、设备及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050259841A1 (en) * 2003-03-31 2005-11-24 Caron Gerald F Narrow opening electroacoustical transducing
US20080137887A1 (en) * 2006-08-22 2008-06-12 John Usher Methods and devices for audio upmixing
WO2012154124A1 (en) * 2011-05-11 2012-11-15 Creative Technology Ltd A speaker for reproducing surround sound
CN102523542A (zh) * 2011-12-14 2012-06-27 南京琅声声学科技有限公司 一种准自适应声学均衡方法与装置
CN203675303U (zh) * 2013-11-25 2014-06-25 中山市悦辰电子实业有限公司 一种用于音响产品的分频段自适应增益控制系统
US20150172817A1 (en) * 2013-12-13 2015-06-18 Vasileios Tsakiris Accoustic speaker system
CN106034274A (zh) * 2015-03-13 2016-10-19 深圳市艾思脉电子股份有限公司 基于声场波合成的3d音响装置及其合成方法
US20180007468A1 (en) * 2016-06-30 2018-01-04 Samsung Electronics Co., Ltd. Acoustic output device and control method thereof
CN207897145U (zh) * 2018-03-12 2018-09-21 上海慧声科技有限公司 一种自适应全音域定向扬声系统
US20210029449A1 (en) * 2019-07-24 2021-01-28 Barefoot Sound, Llc Method and apparatus for improving effective signal-to-noise ratio of analog to digital conversion for multi-band digital signal processing devices
CN112511966A (zh) * 2020-11-06 2021-03-16 华南理工大学 一种车载立体声重放的自适应主动分频方法
WO2022132197A1 (en) * 2020-12-15 2022-06-23 Syng, Inc. Systems and methods for audio upmixing
WO2022237252A1 (zh) * 2021-05-14 2022-11-17 广州视源电子科技股份有限公司 音频信号处理方法、装置及存储介质
CN114245273A (zh) * 2021-11-12 2022-03-25 华南理工大学 一种基于高低分频多扬声器阵列的波束投射方法
CN115442709A (zh) * 2022-07-29 2022-12-06 荣耀终端有限公司 音频处理方法、虚拟低音增强系统、设备和存储介质
CN116055982A (zh) * 2022-08-12 2023-05-02 荣耀终端有限公司 音频输出方法、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王健;张莹;: "HDTV中立体声转化为5.1声道环绕声的实现", 《电声技术》, vol. 35, no. 02, pages 50 - 53 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117241170A (zh) * 2023-11-16 2023-12-15 武汉海微科技有限公司 基于二分频音箱的音频播放方法、装置、设备及存储介质
CN117241170B (zh) * 2023-11-16 2024-01-19 武汉海微科技有限公司 基于二分频音箱的音频播放方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN116437268B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
US10685638B2 (en) Audio scene apparatus
US9264834B2 (en) System for modifying an acoustic space with audio source content
EP3286929B1 (en) Processing audio data to compensate for partial hearing loss or an adverse hearing environment
JP4921470B2 (ja) 頭部伝達関数を表すパラメータを生成及び処理する方法及び装置
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
JP6377249B2 (ja) オーディオ信号の強化のための装置と方法及び音響強化システム
US9820072B2 (en) Producing a multichannel sound from stereo audio signals
KR20070065401A (ko) 오디오 데이터를 처리하는 시스템 및 방법, 프로그램구성요소, 및 컴퓨터-판독가능 매체
KR20170136004A (ko) 사운드 스테이지 강화를 위한 장치 및 방법
EP3776544A1 (en) Spatial audio parameters and associated spatial audio playback
KR20160001712A (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
CN116437268B (zh) 自适应分频的环绕声上混方法、装置、设备及存储介质
CN114067827A (zh) 一种音频处理方法、装置及存储介质
WO2022014326A1 (ja) 信号処理装置および方法、並びにプログラム
CN110740404B (zh) 一种音频相关性的处理方法及音频处理装置
US11133017B2 (en) Enhancing artificial reverberation in a noisy environment via noise-dependent compression
JP2023500631A (ja) 方向メタデータを使用するマルチチャネルオーディオ符号化及び復号化
JP2020537470A (ja) オーディオ信号の個人適用のためのパラメータを設定するための方法
JP2010118977A (ja) 音像定位制御装置および音像定位制御方法
KR101745019B1 (ko) 오디오 시스템 및 그 제어방법
CN109121067B (zh) 多声道响度均衡方法和设备
CN117896666A (zh) 用于回放音频数据的方法、电子设备和存储介质
KR100494288B1 (ko) 다채널 입체 음향 재생 장치 및 그 방법
CN117278931A (zh) 立体声上混方法、装置、设备及存储介质
KR20230113853A (ko) 오디오 소스 지향성에 기초한 심리음향 강화

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 572, 18th Floor, Building B4, Phase I, Longshan Innovation Park, Wuhan Future Science and Technology City, No. 999 Gaoxin Avenue, Donghu New Technology Development Zone, Wuhan City, Hubei Province, 430000

Patentee after: Wuhan Haiwei Technology Co.,Ltd.

Country or region after: China

Address before: 430000 room 1588-2, 15 / F, B3 building, zone II, National Geospatial Information Industry base, No. 3, wudayuan 4th Road, East Lake New Technology Development Zone, Wuhan, Hubei

Patentee before: WUHAN HAIWEI TECHNOLOGY Co.,Ltd.

Country or region before: China