CN107426651A - 多通道的混音方法及装置 - Google Patents
多通道的混音方法及装置 Download PDFInfo
- Publication number
- CN107426651A CN107426651A CN201710682936.0A CN201710682936A CN107426651A CN 107426651 A CN107426651 A CN 107426651A CN 201710682936 A CN201710682936 A CN 201710682936A CN 107426651 A CN107426651 A CN 107426651A
- Authority
- CN
- China
- Prior art keywords
- amplitude
- point
- sampled
- signal
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
本发明提供了一种多通道的混音方法及装置,该方法包括:获取用于传输当前帧的多路通道信号;对多路通道信号进行扩容求和,得到当前帧的和信号;获取待分析的帧数据;采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值;将限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。本发明多通道的混音方法中,采用扩容求和和限幅的结合方式进行混音,使得得到的目标音频信号的音质更好,更加真实,缓解了传统的混音方法存在的混音严重失真的技术问题。
Description
技术领域
本发明涉及计算机数据处理的技术领域,尤其是涉及一种多通道的混音方法及装置。
背景技术
多通道混音算法典型应用于会议系统和广播系统中。会议系统中,多人说话时,需要将所有说话人的音频信号混音发送给会议参与者;而广播系统中播放背景音乐,有时需播报语音消息和通知,这时需将背景音乐信号和语音信号进行混音。
一个好的混音算法需要满足两个基本条件:基本维持原有各信号的响度大小,不造成明显的响度波动;混音后的信号不能溢出,也不能因为信号处理而产生明显的失真。
混音算法有很多种,主要使用的为以下三种:一种是平均权重法,当存在N路信号时,将各路信号乘以权值1/N后相加,不存在溢出的问题,但是各路信号的响度会明显降低;另一种是箝位法,当量化精度为16bit时,混音后,幅值超过32767的信号,置为32767,小于-32768的信号,置为-32768。这种方法比较简单,但是会造成最为明显的削顶失真;再一种是自适应加权法,一般分为强对齐权重法,弱对齐权重法和自对齐权重法。强对齐权重法和弱对齐权重法存在溢出的问题,自对齐权重法会造成信号忽高忽低。综上,现有的混音算法都存在严重的失真问题。
发明内容
有鉴于此,本发明的目的在于提供一种多通道的混音方法及装置,以缓解现有的混音算法存在严重失真的技术问题。
第一方面,本发明实施例提供了一种多通道的混音方法,所述方法包括:
获取用于传输当前帧的多路通道信号;
对所述多路通道信号进行扩容求和,得到当前帧的和信号;
获取待分析的帧数据,其中,所述待分析的帧数据为前一帧的和信号和所述当前帧的和信号拼接得到的;
采用限幅方式对所述待分析的帧数据进行限幅,得到限幅后的采样值;
将所述限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,获取待分析的帧数据包括:
获取所述当前帧的和信号的N个采样点;
获取所述前一帧的和信号的后M个采样点;
将所述后M个采样点与所述N个采样点进行拼接,得到所述待分析的帧数据;
其中,M为N除以K取整得到的,K为小于N的正整数。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,在将所述限幅后的采样值的前N个采样点的数据输出,得到目标音频信号之后,所述方法还包括:
保留所述限幅后的采样值中后H个采样点的数据;
将所述后H个采样点的数据作为下一个待获取的前一帧的和信号的后M个采样点,其中,H与M的值相等。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,对所述多路通道信号进行扩容求和,得到当前帧的和信号包括:
对所述多路通道信号中的每一路通道信号进行扩容处理,得到多路扩容信号;
对所述多路扩容信号进行求和,得到所述当前帧的和信号。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,采用限幅方式对所述待分析的帧数据进行限幅,得到限幅后的采样值包括:
计算当前采样点的幅值,其中,所述当前采样点为所述待分析的帧数据中的后N个采样点中的任意一个采样点;
如果所述幅值小于预设阈值,将所述幅值更新为所述预设阈值,得到更新后的幅值;
如果所述当前采样点处的计数器的计数值等于M或所述更新后的幅值大于第一峰值,则将所述第一峰值更新为第二峰值,并使所述计数器重新开始计数,其中,所述第二峰值为所述更新后的幅值;
根据前一个点的幅度和所述第二峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述方法还包括:
如果所述幅值不小于所述预设阈值,保留所述幅值;
如果所述当前采样点处的所述计数器的计数值等于M或所述幅值大于所述第一峰值,则将所述第一峰值更新为第二峰值,并使所述计数器重新开始计数,其中,所述第二峰值为所述幅值;
根据前一个点的幅度和所述第二峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述方法还包括:
如果所述当前采样点处的所述计数器的计数值小于M且所述更新后的幅值不大于所述第一峰值,则不更新所述第一峰值;
根据前一个点的幅度和所述第一峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述方法还包括:
如果所述当前采样点处的所述计数器的计数值小于M且所述幅值不大于所述第一峰值,则不更新所述第一峰值;
根据前一个点的幅度和所述第一峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
第二方面,本发明实施例还提供了一种多通道的混音装置,所述装置包括:
第一获取模块,用于获取用于传输当前帧的多路通道信号;
扩容求和模块,用于对所述多路通道信号进行扩容求和,得到当前帧的和信号;
第二获取模块,用于获取待分析的帧数据,其中,所述待分析的帧数据为前一帧的和信号和所述当前帧的和信号拼接得到的;
限幅模块,用于采用限幅方式对所述待分析的帧数据进行限幅,得到限幅后的采样值;
输出模块,用于将所述限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述第二获取模块包括:
第一获取单元,用于获取所述当前帧的和信号的N个采样点;
第二获取单元,用于获取所述前一帧的和信号的后M个采样点;
拼接单元,用于将所述后M个采样点与所述N个采样点进行拼接,得到所述待分析的帧数据;
其中,M为N除以K取整得到的,K为小于N的正整数。
本发明实施例带来了以下有益效果:本发明实施例提供了一种多通道的混音方法及装置,该方法包括:获取用于传输当前帧的多路通道信号;对多路通道信号进行扩容求和,得到当前帧的和信号;获取待分析的帧数据,其中,待分析的帧数据为前一帧的和信号和当前帧的和信号拼接得到的;采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值;将限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。
在传统的混音方法中,常常会出现各路信号的响度降低或者溢出的现象,导致混音得到的音频信息严重失真。与传统的混音方法相比,在本发明的多通道的混音方法中,先获取用于传输当前帧的多路通道信号,然后直接对多路通道信号进行扩容求和,不进行衰减,这样不会造成信号响度的降低,因为经过了扩容处理,存储空间变大,信号不会溢出,进而获取由前一帧的和信号和当前帧的和信号拼接得到的待分析的帧数据,采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值,使得混音相加后的和信号的幅值完全限制在预定幅值范围内,最终输出预设个限幅后的采样值,得到目标音频信号。本发明多通道的混音方法中,采用扩容求和和限幅的结合方式进行混音,使得得到的目标音频信号的音质更好,更加真实,缓解了传统的混音方法存在严重失真的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种多通道的混音方法的流程图;
图2为本发明实施例提供的获取待分析的帧数据的流程图;
图3为本发明实施例提供的采用限幅方式对待分析的帧数据进行限幅的流程图;
图4为本发明实施例提供的另一种采用限幅方式对待分析的帧数据进行限幅的流程图;
图5为本发明实施例提供的一种多通道的混音装置的结构示意图。
图标:
11-第一获取模块;12-扩容求和模块;13-第二获取模块;14-限幅模块;15-输出模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种多通道的混音方法进行详细介绍。
实施例一:
一种多通道的混音方法,参考图1,该方法包括:
S101、获取用于传输当前帧的多路通道信号;
在本发明实施例中,每一帧音频信号是由多路通道信号所传输的音频信息组成的。
S102、对多路通道信号进行扩容求和,得到当前帧的和信号;
在得到多路通道信号后,不进行信号的衰减,而是直接对多路通道信号进行扩容求和,这样不会造成信号响度的降低,另外,扩容处理能够增大信号的存储空间,信号不会发生溢出,这样得到的当前帧的和信号的响度接近于真实值,同时,不会因为溢出而产生失真。
S103、获取待分析的帧数据,其中,待分析的帧数据为前一帧的和信号和当前帧的和信号拼接得到的;
在得到当前帧的和信号后,再获取由前一帧的和信号和当前帧的和信号拼接得到的待分析的帧数据。
具体的,待分析的帧数据包括了前一帧的和信号的一部分和当前帧的和信号的全部,具体内容将在下文中进行描述。
S104、采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值;
在得到待分析的帧数据后,采用带有延时的限幅方式对待分析的帧数据进行限幅,使得限幅后的采样值完全限制在了预定的幅值范围内。
S105、将限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。
对待分析的帧数据限幅完成后,将限幅后的采样值的前N个采样点的数据输出,即可得到目标音频信号。
在传统的混音方法中,常常会出现各路信号的响度降低或者溢出的现象,混音得到的音频信息严重失真。与传统的混音方法相比,在本发明的多通道的混音方法中,先获取用于传输当前帧的多路通道信号,然后直接对多路通道信号进行扩容求和,不进行衰减,这样不会造成信号响度的降低,因为经过了扩容处理,存储空间变大,信号不会溢出,进而获取由前一帧的和信号和当前帧的和信号拼接得到的待分析的帧数据,采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值,使得混音相加后的和信号的幅值完全限制在预定幅值范围内,最终输出预设个限幅后的采样值,得到目标音频信号。本发明多通道的混音方法中,采用扩容求和和限幅的结合方式进行混音,使得得到的目标音频信号的音质更好,更加真实,缓解了传统的混音方法存在严重失真的技术问题。
在本发明实施例中,在获取到多路通道信号之后,就可以对通道信号进行扩容求和,得到当前帧的和信号,对通道信号进行扩容求和的方式有很多种,在一个可选的实施方式中,对多路通道信号进行扩容求和,得到当前帧的和信号包括如下步骤:
(1)对多路通道信号中的每一路通道信号进行扩容处理,得到多路扩容信号;
比如,某一路通道信号的带宽为16bit,扩容时,将其带宽转换为32bit或者更高,但是,其中的数据保持不变,这样,可以使得求和时信号不会溢出。
(2)对多路扩容信号进行求和,得到当前帧的和信号。
在得到当前帧的和信号之后,就获取待分析的帧数据,在一个可选的实施方式中,参考图2,获取待分析的帧数据的具体过程描述如下:
S201、获取当前帧的和信号的N个采样点;
具体的,当前帧的和信号是由N个采样点构成的,也就是获取当前帧的和信号的全部采样点。
S202、获取前一帧的和信号的后M个采样点;
然后,获取前一帧的和信号的后M个采样点,其中,M实际为一个经验值,能够根据具体的情况而进行人为限定。
S203、将后M个采样点与N个采样点进行拼接,得到待分析的帧数据;
其中,M为N除以K取整得到的,K为小于N的正整数。
具体的,在进行拼接时,将前一帧的和信号的后M个采样点设置在前,当前帧的和信号的N个采样点设置在后,以此来得到待分析的帧数据。
其中,M为N除以K取整得到的,K为小于N的正整数,K越大,延时越低。
在获取待分析的帧数据之后,就可以采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值,并将限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。实际上,在限幅后的采样值中,也就是得到的M+N个数据中,只有前N个数据进行了限幅,后面的M个数据未发生变化。
在另一个可选的实施方式中,在将限幅后的采样值的前N个采样点的数据输出,得到目标音频信号之后,该方法还包括:
保留限幅后的采样值中后H个采样点的数据;
将后H个采样点的数据作为下一个待获取的前一帧的和信号的后M个采样点,其中,H与M的值相等。
也就是,限幅后的采样值为限幅后的M+N个采样点,其中,只对前N个采样点数据进行了限幅,后面的M个采样点数据未发生变化,后M个采样点保留,应用到下一个待获取的前一帧的和信号的后M个采样点中使用。
可选地,参考图3,采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值包括:
S301、计算当前采样点的幅值,其中,当前采样点为待分析的帧数据中的后N个采样点中的任意一个采样点;
由上面的描述可知,待分析的帧数据中,后N个采样点才为当前帧的和信号,所以,在进行分析时,实际是对后N个采样点进行的。
S302、如果幅值小于预设阈值,将幅值更新为预设阈值,得到更新后的幅值;
该方法中,事先存在预设阈值,如果幅值小于预设阈值时,将幅值更新为预设阈值,也就是更新后的幅值为预设阈值。
S303、如果当前采样点处的计数器的计数值等于M或更新后的幅值大于第一峰值,则将第一峰值更新为第二峰值,并使计数器重新开始计数,其中,第二峰值为更新后的幅值;
具体的,计数器是从上一个更新峰值的采样点位置处开始计数的,如果到达当前采样点处计数器的计数值等于M或更新后的幅值大于第一峰值,那么将第一峰值更新为第二峰值,并使计数器从当前采样点处重新开始计数,其中,第二峰值为更新后的幅值,方法中事先设置有第一峰值。
S304、根据前一个点的幅度和第二峰值计算当前点的幅度;
该种情况中,当前点的幅度是根据前一个点的幅度和第二峰值计算得到的。具体的,在进行计算时,为前一个点的幅度和第二峰值分别分配一个权重,而当前点的幅度是前一个点的幅度和第二峰值的加权和。
例如:前一个点的幅度为2,权重为0.5,第二峰值为3,权重也为0.5,那么当前点的幅度=2*0.5+3*0.5。
S305、根据当前点的幅度和预设阈值计算增益因子;
在得到当前点的幅度后,就能够根据当前点的幅度和预设阈值计算增益因子。具体的,增益因子=预设阈值/当前点的幅度。
S306、将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
在得到增益因子后,将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子就能够得到限幅后的采样值。
进一步地,该方法还包括:
(1)如果当前采样点处的计数器的计数值小于M且更新后的幅值不大于第一峰值,则不更新第一峰值;
也就是在上述步骤S302之后,得到当前采样点处的计数器的计数值小于M且更新后的幅值不大于第一峰值,则不更新第一峰值。
(2)根据前一个点的幅度和第一峰值计算当前点的幅度;
该过程和上述步骤S304相似,不同的是这里的第一峰值没有进行更新,还是第一峰值,而S304中是更新后的第一峰值,即第二峰值。
具体内容可以参考上述步骤S304。
(3)根据当前点的幅度和预设阈值计算增益因子;
这里的计算过程和上述步骤S305中的计算过程相同,在此不再进行赘述。
(4)将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
这里的过程和上述步骤S306中的内容相同,在此不再进行赘述。
可选地,参考图4,该方法还包括:
S401、如果幅值不小于预设阈值,保留幅值;
在上述步骤S301之后,得到幅值不小于预设阈值,那么就保留当前采样点的幅值。
S402、如果当前采样点处的计数器的计数值等于M或幅值大于第一峰值,则将第一峰值更新为第二峰值,并使计数器重新开始计数,其中,第二峰值为幅值;
该过程和上述步骤S303相似,不同的是这里的幅值没有进行更新,还是当前采样点原来的幅值,而S303中的幅值是更新后的峰值。
具体内容可以参考上述步骤S303。
S403、根据前一个点的幅度和第二峰值计算当前点的幅度;
这里的计算过程和上述步骤S304中的计算过程相同,在此不再进行赘述。
S404、根据当前点的幅度和预设阈值计算增益因子;
这里的计算过程和上述步骤S305中的计算过程相同,在此不再进行赘述。
S405、将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
这里的过程和上述步骤S306中的内容相同,在此不再进行赘述。
进一步地,该方法还包括:
(1)如果当前采样点处的计数器的计数值小于M且幅值不大于第一峰值,则不更新第一峰值;
也就是在上述步骤S401之后,得到当前采样点处的计数器的计数值小于M且幅值不大于第一峰值,则不更新第一峰值。
(2)根据前一个点的幅度和第一峰值计算当前点的幅度;
该过程和上述步骤S403相似,不同的是这里的第一峰值没有进行更新,还是第一峰值,而S403中是更新后的第一峰值,即第二峰值。
具体内容可以参考上述步骤S403。
(3)根据当前点的幅度和预设阈值计算增益因子;
这里的计算过程和上述步骤S305中的计算过程相同,在此不再进行赘述。
(4)将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
这里的过程和上述步骤S306中的内容相同,在此不再进行赘述。
实施例二:
本发明实施例提供了一种多通道的混音装置,参考图5,该装置包括:
第一获取模块11,用于获取用于传输当前帧的多路通道信号;
扩容求和模块12,用于对多路通道信号进行扩容求和,得到当前帧的和信号;
第二获取模块13,用于获取待分析的帧数据,其中,待分析的帧数据为前一帧的和信号和当前帧的和信号拼接得到的;
限幅模块14,用于采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值;
输出模块15,用于将限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。
在本发明实施例中,先获取用于传输当前帧的多路通道信号,然后直接对多路通道信号进行扩容求和,不进行衰减,这样不会造成信号响度的降低,因为经过了扩容处理,存储空间变大,信号不会溢出,进而获取由前一帧的和信号和当前帧的和信号拼接得到的待分析的帧数据,采用限幅方式对待分析的帧数据进行限幅,得到限幅后的采样值,使得混音相加后的和信号的幅值完全限制在预定幅值范围内,最终输出预设个限幅后的采样值,得到目标音频信号。本发明多通道的混音方法中,采用扩容求和和限幅的结合方式进行混音,使得得到的目标音频信号的音质更好,更加真实,缓解了传统的混音方法存在严重失真的技术问题。
可选地,第二获取模块包括:
第一获取单元,用于获取当前帧的和信号的N个采样点;
第二获取单元,用于获取前一帧的和信号的后M个采样点;
拼接单元,用于将后M个采样点与N个采样点进行拼接,得到待分析的帧数据;
其中,M为N除以K取整得到的,K为小于N的正整数。
可选地,装置还包括:
保留模块,用于保留限幅后的采样值中后H个采样点的数据;
设定模块,用于将后H个采样点的数据作为下一个待获取的前一帧的和信号的后M个采样点,其中,H与M的值相等。
可选地,扩容求和模块包括:
扩容处理单元,用于对多路通道信号中的每一路通道信号进行扩容处理,得到多路扩容信号;
求和单元,用于对多路扩容信号进行求和,得到当前帧的和信号。
可选地,限幅模块包括:
第一计算单元,用于计算当前采样点的幅值,其中,当前采样点为待分析的帧数据中的后N个采样点中的任意一个采样点;
第一更新单元,用于如果幅值小于预设阈值,将幅值更新为预设阈值,得到更新后的幅值;
第二更新单元,如果当前采样点处的计数器的计数值等于M或更新后的幅值大于第一峰值,则将第一峰值更新为第二峰值,并使计数器重新开始计数,其中,第二峰值为更新后的幅值;
第二计算单元,用于根据前一个点的幅度和第二峰值计算当前点的幅度;
第三计算单元,用于根据当前点的幅度和预设阈值计算增益因子;
第一相乘单元,用于将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
可选地,限幅模块还包括:
保留单元,如果幅值不小于预设阈值,保留幅值;
第三更新单元,如果当前采样点处的计数器的计数值等于M或幅值大于第一峰值,则将第一峰值更新为第二峰值,并使计数器重新开始计数,其中,第二峰值为幅值;
第四计算单元,用于根据前一个点的幅度和第二峰值计算当前点的幅度;
第五计算单元,用于根据当前点的幅度和预设阈值计算增益因子;
第二相乘单元,用于将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
可选地,限幅模块还包括:
第一不更新单元,如果当前采样点处的计数器的计数值小于M且更新后的幅值不大于第一峰值,则不更新第一峰值;
第六计算单元,用于根据前一个点的幅度和第一峰值计算当前点的幅度;
第七计算单元,用于根据当前点的幅度和预设阈值计算增益因子;
第三相乘单元,用于将所当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
可选地,限幅模块还包括:
第二不更新单元,如果当前采样点处的计数器的计数值小于M且幅值不大于第一峰值,则不更新第一峰值;
第八计算单元,用于根据前一个点的幅度和第一峰值计算当前点的幅度;
第九计算单元,用于根据当前点的幅度和预设阈值计算增益因子;
第四相乘单元,用于将当前采样点位置前的第M个位置对应的采样点的采样值乘以增益因子,得到限幅后的采样值。
该实施例二中的内容可以参考上述实施例一中的内容,在此不再进行赘述。
本发明实施例所提供的多通道的混音方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种多通道的混音方法,其特征在于,所述方法包括:
获取用于传输当前帧的多路通道信号;
对所述多路通道信号进行扩容求和,得到当前帧的和信号;
获取待分析的帧数据,其中,所述待分析的帧数据为前一帧的和信号和所述当前帧的和信号拼接得到的;
采用限幅方式对所述待分析的帧数据进行限幅,得到限幅后的采样值;
将所述限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。
2.根据权利要求1所述的方法,其特征在于,获取待分析的帧数据包括:
获取所述当前帧的和信号的N个采样点;
获取所述前一帧的和信号的后M个采样点;
将所述后M个采样点与所述N个采样点进行拼接,得到所述待分析的帧数据;
其中,M为N除以K取整得到的,K为小于N的正整数。
3.根据权利要求2所述的方法,其特征在于,在将所述限幅后的采样值的前N个采样点的数据输出,得到目标音频信号之后,所述方法还包括:
保留所述限幅后的采样值中后H个采样点的数据;
将所述后H个采样点的数据作为下一个待获取的前一帧的和信号的后M个采样点,其中,H与M的值相等。
4.根据权利要求1所述的方法,其特征在于,对所述多路通道信号进行扩容求和,得到当前帧的和信号包括:
对所述多路通道信号中的每一路通道信号进行扩容处理,得到多路扩容信号;
对所述多路扩容信号进行求和,得到所述当前帧的和信号。
5.根据权利要求1所述的方法,其特征在于,采用限幅方式对所述待分析的帧数据进行限幅,得到限幅后的采样值包括:
计算当前采样点的幅值,其中,所述当前采样点为所述待分析的帧数据中的后N个采样点中的任意一个采样点;
如果所述幅值小于预设阈值,将所述幅值更新为所述预设阈值,得到更新后的幅值;
如果所述当前采样点处的计数器的计数值等于M或所述更新后的幅值大于第一峰值,则将所述第一峰值更新为第二峰值,并使所述计数器重新开始计数,其中,所述第二峰值为所述更新后的幅值;
根据前一个点的幅度和所述第二峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
如果所述幅值不小于所述预设阈值,保留所述幅值;
如果所述当前采样点处的所述计数器的计数值等于M或所述幅值大于所述第一峰值,则将所述第一峰值更新为第二峰值,并使所述计数器重新开始计数,其中,所述第二峰值为所述幅值;
根据前一个点的幅度和所述第二峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
如果所述当前采样点处的所述计数器的计数值小于M且所述更新后的幅值不大于所述第一峰值,则不更新所述第一峰值;
根据前一个点的幅度和所述第一峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
如果所述当前采样点处的所述计数器的计数值小于M且所述幅值不大于所述第一峰值,则不更新所述第一峰值;
根据前一个点的幅度和所述第一峰值计算当前点的幅度;
根据所述当前点的幅度和所述预设阈值计算增益因子;
将所述当前采样点位置前的第M个位置对应的采样点的采样值乘以所述增益因子,得到所述限幅后的采样值。
9.一种多通道的混音装置,其特征在于,所述装置包括:
第一获取模块,用于获取用于传输当前帧的多路通道信号;
扩容求和模块,用于对所述多路通道信号进行扩容求和,得到当前帧的和信号;
第二获取模块,用于获取待分析的帧数据,其中,所述待分析的帧数据为前一帧的和信号和所述当前帧的和信号拼接得到的;
限幅模块,用于采用限幅方式对所述待分析的帧数据进行限幅,得到限幅后的采样值;
输出模块,用于将所述限幅后的采样值的前N个采样点的数据输出,得到目标音频信号。
10.根据权利要求9所述的装置,其特征在于,所述第二获取模块包括:
第一获取单元,用于获取所述当前帧的和信号的N个采样点;
第二获取单元,用于获取所述前一帧的和信号的后M个采样点;
拼接单元,用于将所述后M个采样点与所述N个采样点进行拼接,得到所述待分析的帧数据;
其中,M为N除以K取整得到的,K为小于N的正整数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710682936.0A CN107426651B (zh) | 2017-08-10 | 2017-08-10 | 多通道的混音方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710682936.0A CN107426651B (zh) | 2017-08-10 | 2017-08-10 | 多通道的混音方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107426651A true CN107426651A (zh) | 2017-12-01 |
CN107426651B CN107426651B (zh) | 2018-07-06 |
Family
ID=60437746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710682936.0A Active CN107426651B (zh) | 2017-08-10 | 2017-08-10 | 多通道的混音方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107426651B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110675885A (zh) * | 2019-10-17 | 2020-01-10 | 浙江大华技术股份有限公司 | 混音方法、装置及存储介质 |
CN111179947A (zh) * | 2020-01-06 | 2020-05-19 | 广州欢聊网络科技有限公司 | 一种音频信号处理的方法及装置 |
CN111770413A (zh) * | 2020-06-30 | 2020-10-13 | 浙江大华技术股份有限公司 | 一种多音源混音方法、装置及存储介质 |
CN112995425A (zh) * | 2021-05-13 | 2021-06-18 | 北京百瑞互联技术有限公司 | 一种等响度混音方法及装置 |
CN113812170A (zh) * | 2019-04-01 | 2021-12-17 | 伯斯有限公司 | 动态余量管理 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102005206A (zh) * | 2010-11-16 | 2011-04-06 | 上海华平信息技术股份有限公司 | 多路音频的混音方法 |
CN103188595A (zh) * | 2011-12-31 | 2013-07-03 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
CN105023577A (zh) * | 2014-04-17 | 2015-11-04 | 腾讯科技(深圳)有限公司 | 混音处理方法、装置和系统 |
CN106504765A (zh) * | 2016-10-20 | 2017-03-15 | 广州视源电子科技股份有限公司 | 一种音频信号的自动增益控制方法和装置 |
CN106816152A (zh) * | 2016-12-05 | 2017-06-09 | 乐视控股(北京)有限公司 | 一种音频混音方法、装置和电子设备 |
-
2017
- 2017-08-10 CN CN201710682936.0A patent/CN107426651B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102005206A (zh) * | 2010-11-16 | 2011-04-06 | 上海华平信息技术股份有限公司 | 多路音频的混音方法 |
CN103188595A (zh) * | 2011-12-31 | 2013-07-03 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
CN105023577A (zh) * | 2014-04-17 | 2015-11-04 | 腾讯科技(深圳)有限公司 | 混音处理方法、装置和系统 |
CN106504765A (zh) * | 2016-10-20 | 2017-03-15 | 广州视源电子科技股份有限公司 | 一种音频信号的自动增益控制方法和装置 |
CN106816152A (zh) * | 2016-12-05 | 2017-06-09 | 乐视控股(北京)有限公司 | 一种音频混音方法、装置和电子设备 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113812170A (zh) * | 2019-04-01 | 2021-12-17 | 伯斯有限公司 | 动态余量管理 |
CN110675885A (zh) * | 2019-10-17 | 2020-01-10 | 浙江大华技术股份有限公司 | 混音方法、装置及存储介质 |
CN111179947A (zh) * | 2020-01-06 | 2020-05-19 | 广州欢聊网络科技有限公司 | 一种音频信号处理的方法及装置 |
CN111770413A (zh) * | 2020-06-30 | 2020-10-13 | 浙江大华技术股份有限公司 | 一种多音源混音方法、装置及存储介质 |
CN111770413B (zh) * | 2020-06-30 | 2021-08-27 | 浙江大华技术股份有限公司 | 一种多音源混音方法、装置及存储介质 |
CN112995425A (zh) * | 2021-05-13 | 2021-06-18 | 北京百瑞互联技术有限公司 | 一种等响度混音方法及装置 |
CN112995425B (zh) * | 2021-05-13 | 2021-09-07 | 北京百瑞互联技术有限公司 | 一种等响度混音方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107426651B (zh) | 2018-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107426651B (zh) | 多通道的混音方法及装置 | |
CN102652337B (zh) | 用于声通信的设备和方法 | |
ES2900516T3 (es) | Aparato, método y programa informático para proporcionar parámetros ajustados | |
JP7258083B2 (ja) | 車両ベースの音声処理方法、音声プロセッサ、車載プロセッサ | |
CN108833722A (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
US9584944B2 (en) | Stereo decoding method and apparatus using group delay and group phase parameters | |
CN104539816A (zh) | 一种多方语音通话的智能混音方法及装置 | |
CN110060696B (zh) | 混音方法及装置、终端及可读存储介质 | |
CN111078930A (zh) | 音频文件数据处理方法及装置 | |
KR20070085532A (ko) | 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 | |
CN107301028A (zh) | 一种基于多人远程通话的音频数据处理方法及装置 | |
CN106878850A (zh) | 利用无线耳机实现语音交互的方法、系统及无线耳机 | |
CN116721670A (zh) | 分段音频信号的滤波方法、装置、设备及存储介质 | |
CN110444227A (zh) | 一种语音自动化测试方法 | |
CN111210850B (zh) | 歌词对齐方法及相关产品 | |
KR20230165855A (ko) | 공간 오디오 객체 분리 | |
CN104599679A (zh) | 一种基于语音信号构造聚焦协方差矩阵的方法及装置 | |
CN109545203A (zh) | 语音识别方法、装置、设备和存储介质 | |
CN106033671A (zh) | 确定声道间时间差参数的方法和装置 | |
CN111081238B (zh) | 一种蓝牙音箱语音交互控制方法、装置及系统 | |
CN103794216B (zh) | 一种语音混音处理方法及装置 | |
CN101499279B (zh) | 空间参数逐级精细的比特分配方法及其装置 | |
CN102395097A (zh) | 一种多声道音频信号缩混方法及系统 | |
US20120284021A1 (en) | Concealing audio interruptions | |
CN109215668A (zh) | 一种声道间相位差参数的编码方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 410205 Hunan province Changsha City Lugu high tech Development Zone Street South Road No. 70 Patentee after: Shibang Communication Co., Ltd Address before: 410205 Hunan province Changsha City Lugu high tech Development Zone Street South Road No. 70 Patentee before: CHANGSHA SPON COMMUNICATION TECHNOLOGY Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder |