CN101989430A - 一种混音处理系统及混音处理方法 - Google Patents

一种混音处理系统及混音处理方法 Download PDF

Info

Publication number
CN101989430A
CN101989430A CN2009101092033A CN200910109203A CN101989430A CN 101989430 A CN101989430 A CN 101989430A CN 2009101092033 A CN2009101092033 A CN 2009101092033A CN 200910109203 A CN200910109203 A CN 200910109203A CN 101989430 A CN101989430 A CN 101989430A
Authority
CN
China
Prior art keywords
pcm stream
audio mixing
mix
sampled point
quantification gradation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009101092033A
Other languages
English (en)
Other versions
CN101989430B (zh
Inventor
周君亮
叶磊
袁华隆
张恒新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BYD Semiconductor Co Ltd
Original Assignee
BYD Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BYD Co Ltd filed Critical BYD Co Ltd
Priority to CN2009101092033A priority Critical patent/CN101989430B/zh
Publication of CN101989430A publication Critical patent/CN101989430A/zh
Application granted granted Critical
Publication of CN101989430B publication Critical patent/CN101989430B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种混音处理系统和方法。本发明以时间T为单位依次分段调整自适应因子,当前时间T的自适应因子在前一自适应因子的基础增加或减少a;所述a≥1/32且a≤1/16;利用经过调整的自适应因子对该路与采混音PCM码流采样点相对应的音频PCM码流量化等级进行加权处理,然后将加权处理后的量化等级相加得到该采样点的第一混合量化等级mix;如果mix没有超出PCM码流表示的范围,则输出mix;反之,则输出MIX或者MAX。本发明分段依次进行混音处理,根据当前单位时间内的采样点的量化等级得出当前单位时间内的各路音频的自适应因子的大小,使混音处理之后效果较现有技术有所改进,本发明的技术方案还不会产生暴音。

Description

一种混音处理系统及混音处理方法
技术领域
本发明涉及音频信号混合处理领域,尤其涉及对PCM(Pulse Code Modulation脉冲编码调制)音频码流的混合处理方法及系统。
背景技术
在有些会议系统里,成员虽然可以同时发言,但效果模糊。在混音系统中,现有技术是将采集回来的每路PCM码流直接叠加,然后将叠加总数除以n。根据该方法混音后,使每路声音音量都降低为原来的1/n,就会导致上述音量变小,音质变得不清晰的效果。如果叠加总数不除以n,叠加总数可容易就超出采样点的表示范围,而出现暴音,或者其他失真现象。
现有技术中还提供的一种两路音频混合的处理方法是,首先预先设定两路音频的各路加权值,然后将该加权值与其对应的音频信号相乘,之后将相乘之后的结果相加得到混合后的音频信号。这种音频信号混合处理的方法的缺点在于,不能随时根据各路音频信号调整好加权值,虽然效果比上述混合处理方案要好,但还是没有解决上述混合后效果模糊的缺点。
发明内容
本发明主要解决的技术问题是针对现有技术中的混音处理之后容易产生音质变的不清晰或者产生暴音,提供一种自适应的混音处理系统和混音处理方法。
本发明所提出的技术方案是:一种混音处理方法,包括:
A、从需要混音的n路音频PCM码流中提取各采样点的量化等级值并初始化各路音频PCM码流的自适应因子为1/n,所述n为大于等于2的整数;
B、以单位时间T为周期分段依次进行混音处理,直到处理完最后一个单位时间,得到混音PCM码流;在当前单位时间内,具体步骤如下:
分别对每路音频PCM码流进行处理,分别对大于0和小于0的量化等级进行累加,大于0的量化等级的累加值为第一累加值ValuePositive,小于0的量化等级的累加值为第二累加值ValueNegative;判断累加后的结果是否超出PCM码流的量化等级n分之一所能表示的范围,
当ValuePositive>MAX*QT/n,或者ValueNegative<MIN*QT/n时,Q为采样频率,MIN为PCM码流表示的最小值,MAX为PCM码流表示的最大值,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子-a;所述a大于等于1/32且小于等于1/16;
当ValuePositive≤MAX*QT/n,且ValueNegative≥MIN*QT/n时,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子+a;所述a大于等于1/32且小于等于1/16;
将与混音PCM码流采样点相对应的每路音频PCM码流采样点的量化等级与该路的自适应因子g[i]进行乘积;
然后把各路的乘积相加,即得该混音PCM码流采样点的第一混合量化等级mix;
根据预定的量化等级的最大值和最小值对第一混合量化等级mix进行限制裁减输出。
本发明的另一目的在于提供一种混音处理系统。一种混音处理系统,包括用于接收多路音频PCM码流的接收模块、与接收模块连接用于对音频PCM码流进行采集的采样模块和对采样模块采集的音频PCM码流进行混音的混音处理模块,其中,所述混音处理模块包括:
与采样模块连接的自适应因子调整模块,所述自适应因子调整模块对各路音频PCM码流,以时间T为单位依次分段调整;当前单位时间T内,提取该路采样点的音频PCM码流的量化等级,分别对大于0和小于0的量化等级进行累加,大于0的量化等级的累加值为第一累加值ValuePositive,小于0的量化等级的累加值为第二累加值ValueNegative;判断累加后的结果是否超出PCM码流的量化等级n分之一所能表示的范围,
当ValuePositive>MAX*QT/n,或者ValueNegative<MIN*QT/n时,Q为采样频率,MIN为PCM码流表示的最小值,MAX为PCM码流表示的最大值,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子-a;所述a大于等于1/32且小于等于1/16;
当ValuePositive≤MAX*QT/n,且ValueNegative≥MIN*QT/n时,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子+a;所述a大于等于1/32且小于等于1/16;
与采样模块连接的加权混音处理模块,利用经过自适应因子调整模块调整的各路音频PCM码流的自适应因子对各路与混音PCM码流采样点相对应的音频PCM码流采样点的量化等级进行加权处理,然后将加权处理后的量化等级相加得到该混音PCM码流采样点的第一混合量化等级mix;
与加权混音处理模块连接的输出模块,用于根据预定的量化等级的最大值和最小值对第一混合量化等级mix进行限制裁减输出。
本发明技术的有益效果是,本发明的混音处理系统和方法,以单位时间T为周期分段依次进行混音处理,根据当前单位时间内的采样点的量化等级在前一单位时间内的自适应因子的基础上得出当前单位时间内的各路音频的自适应因子的大小,提供了一个根据各路音频PCM码流进行自适应调整的自适应因子,使混音处理之后效果较现有技术有所改进,并且本发明的技术方案还不会产生暴音。
附图说明
图1本发明的具体实施例的混音处理方法流程图;
图2本发明的具体实施例的混音处理系统的结构框图。
具体实施例方式
为了进一步说明本发明的内容,下面结合附图、列举实施例对本发明做详细描述。
本发明的主要目的在于提供一种自适应多路混音的处理方法及系统,以保证混音后的音频质量,解决现有技术的混音处理之后容易产生音质变的不清晰或者产生暴音的问题。本发明的主要技术方案为:一种混音处理方法,包括:
A、从需要混音的n路音频PCM码流中提取各采样点的量化等级值并初始化各路音频PCM码流的自适应因子为1/n,所述n为大于等于2的整数;
B、以单位时间T为周期分段依次进行混音处理,直到处理完最后一个单位时间,得到混音PCM码流;在当前单位时间内,具体步骤如下:
分别对每路音频PCM码流进行处理,分别对大于0和小于0的量化等级进行累加,大于0的量化等级的累加值为第一累加值ValuePositive,小于0的量化等级的累加值为第二累加值ValueNegative;判断累加后的结果是否超出PCM码流的量化等级n分之一所能表示的范围,
当ValuePositive>MAX*QT/n,或者ValueNegative<MIN*QT/n时,Q为采样频率,MIN为PCM码流表示的最小值,MAX为PCM码流表示的最大值,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子-a;所述a大于等于1/32且小于等于1/16;
当ValuePositive≤MAX*QT/n,且ValueNegative≥MIN*QT/n时,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子+a;所述a大于等于1/32且小于等于1/16;
将与混音PCM码流采样点相对应的每路音频PCM码流采样点的量化等级与该路的自适应因子g[i]进行乘积;
然后把各路的乘积相加,即得该混音PCM码流采样点的第一混合量化等级mix;
根据预定的量化等级的最大值和最小值对第一混合量化等级mix进行限制裁减输出。
进一步,所述限制裁减输出,是为了防止出现混音暴音而设置,具体的输出方法为:如果第一混合量化等级mix小于PCM码流表示的最小值MIN,以MIN作为该混音PCM码流采样点的最终混合量化等级输出;如果第一混合量化等级mix大于PCM码流表示的最大值MAX,以MAX作为该混音PCM码流采样点的最终混合量化等级输出;如果第一混合量化等级mix小于等于MAX且第一混合量化等级mix大于等于MIN,以第一混合量化等级mix作为该混音PCM码流采样点的最终混合量化等级输出。
进一步,所述步骤A还包括初始化衰减因子f0=1;
所述步骤B还包括,在当前单位时间内,依次处理每个混音PCM码流采样点,直到当前单位时间内的最后一混音PCM码流采样点,具体步骤如下:将当前混音PCM码流采样点的第一混合量化等级mix乘于当前衰减因子f得到该混音PCM码流采样点的第二混合量化等级数MIX;如果第二混合量化等级数MIX大于MAX,则输出MAX作为该混音PCM码流采样点的混音处理后最终混合量化等级,同时求出f′,所述f′=MAX/(MIX+1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级数MIX小于MIN,则输出MIN作为该混音PCM码流采样点的混音处理后的最终混合量化等级,同时求出f′,f′=MIN/(MIX-1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级数MIX大于等于MIN且小于等于MAX时,则输出第二混合量化等级数MIX作为该混音PCM码流采样点的混音处理后最终混合量化等级,同时判断当前混音PCM码流采样点的衰减因子f是否小于1,若小于1,则下一混音PCM码流采样点的衰减因子=当前混音PCM码流采样点的衰减因子f+STP;若不小于1,则下一混音PCM码流采样点的衰减因子=当前混音PCM码流采样点的衰减因子f。所述STP大于等于(1-f)/32且小于等于(1-f)/16。
进一步,本发明优选所述a=1/16。
进一步,本发明优选所述STP为(1-f)/16。
进一步,所述单位时间T大于0s小于等于1s。优选T为1s。
进一步,本发明优选在步骤A之前还包括:判断各路PCM码流的采样参数是否相同,如果不同,则对该PCM码流进行转换,转换成采样参数相同的PCM码流。
本发明还提供了一种混音处理系统。所述混音处理系统,包括用于接收多路音频PCM码流的接收模块、与接收模块连接用于对音频PCM码流进行采集的采样模块和对采样模块采集的音频PCM码流进行混音的混音处理模块,其中,所述混音处理模块包括:
与采样模块连接的自适应因子调整模块,所述自适应因子调整模块对各路音频PCM码流,以单位时间T为单位依次分段调整,当前单位时间T的自适应因子在前一自适应因子的基础增加或者减少a;所述a大于等于1/32且小于等于1/16;
与采样模块连接的加权混音处理模块,利用经过自适应因子调整模块调整的各路音频PCM码流的自适应因子对各路与采样点相对应的音频PCM码流量化等级进行加权处理,然后将加权处理后的量化等级相加得到该采样点的第一混合量化等级mix;
与加权混音处理模块连接的输出模块,用于,根据预定的量化等级的最大值和最小值对第一混合量化等级mix进行限制裁减输出。所述限制裁减输出的具体方法为:如果第一混合量化等级mix小于PCM码流表示的最小值MIN,以MIN作为该采样点的最终混合量化等级输出;如果第一混合量化等级mix大于PCM码流表示的最大值MAX,以MAX作为该采样点的最终混合量化等级输出;如果第一混合量化等级mix小于等于MAX且第一混合量化等级mix大于等于MIN,以第一混合量化等级mix作为该采样点的最终混合量化等级输出。
进一步,优选所述混音处理模块还包括:
与加权混音处理模块连接的衰减处理模块,将该采样点的第一混合量化等级mix与衰减因子f相乘得到该采样点第二混合量化等级MIX;
与衰减处理模块连接的衰减因子调整模块;如果第二混合量化等级MIX大于MAX,则衰减因子调整模块求出f′,所述f′=MAX/(MIX+1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级MIX小于MIN,则求出f′,f′=MIN/(MIX-1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级MIX大于等于MIN且小于等于MAX时,则判断当前混音PCM码流采样点的衰减因子f是否小于1,若小于1,则下一混音PCM码流采样点的衰减因子等于当前采样点的衰减因子f+STP;若不小于1,则下一混音PCM码流采样点的衰减因子等于当前混音PCM码流采样点的衰减因子f。所述STP大于等于(1-f)/32且小于等于(1-f)/16;
所述输出模块与衰减处理模块连接,用于,如果第二混合量化等级MIX小于MIN,以MIN作为该采样点的最终混合量化等级输出;如果第二混合量化等级MIX大于MAX,以MAX作为该采样点的最终混合量化等级输出;如果第二混合量化等级MIX小于等于MAX且大于等于MIN,以第二混合量化等级MIX作为该混音PCM码流采样点的最终混合量化等级输出。
进一步,优选所述混音处理模块还包括归一化处理模块,所述归一化处理模块连接于采样模块和加权混音处理模块之间,用于判断各路PCM码流的采样参数是否相同,如果不同,则对该PCM码流进行转换,转换成采样参数相同的PCM码流。
进一步,优选所述a=1/16,STP为(1-f)/16。
本发明所述的混音处理系统及方法可以是对至少两路的原始语音的PCM码流进行混音处理,本实施例中以对两路的原始语音的音频PCM码流进行混音为例对本发明的技术方案进行说明。
本发明所采用的方法可以由计算机或者具有计算处理能力的智能设备执行。图1是本发明的具体实施例的混音处理方法流程图。图2是本发明的具体实施例的混音处理系统的结构框图。参照图1,本发明的混音处理流程如下:
步骤1:获取音频PCM码流并统计音频PCM码流通路数n,本实施例的通路数n为2。
步骤2:将各路中的音频PCM码流进行相互比较,判断各路中的音频PCM码流是否一致,如果一致,执行步骤4;否则,执行步骤3。
步骤3,对各路音频PCM码流进行归一化处理。所述归一化处理的步骤如下:
通常不同的音频PCM码流的采样频率都成整数倍关系,因此对于采用频率的转化,通过复制采样点操作,将小采样率的音频PCM码流转换成为大采样频率的音频PCM码流。例如,采样率为8000的音频PCM码流,通过把每个采样点的振幅值都复制一份,作为相邻两个采样点的振幅之,就实现将音频PCM码流转化为16000的采样率了。相反,通过对采样点的整合操作,可以将大采样率的音频PCM码流转换成小采样率的音频PCM码流。例如,采样率为16000的音频PCM码流,通过把每两个采样点的振幅值整合成一个采样点的方法,就将音频PCM码流的采样率转化成8000,整合操作可以采用简单的求平均值的方法完成。
对不同音频PCM码流的采样频率不成整数倍关系得极少数情况,假设转化前的采样频率为RA,转化后的采样频率为RB,则按照公式(1)得到X:
R A R B = Y X - - - ( 1 )
公式(1)中的Y为预先设定的值。接着对X取整得到X`,利用插值算法将音频PCM码流中的每Y个采样点的振幅值平均转换为X`个采样点振幅值,从而完成采样频率的转化。例如,8000采样率的音频PCM码流转换成10000采样率的音频PCM码流且Y设为10,则X=12.2,对X取整得12,则表示需要将10个采样点的振幅值平均转换为12个采样点的振幅之。很显然,上述的公式(1)中的Y的取值和插值算法的选取豆回对精度有影响。
对于量化等级的转化问题,假设有A、B两种量化等级,他们所能表达的最大值振幅范围分别为:MAXA和MAXB,例如,8位带符号量化等级表示的最大振幅值为127;16位带符号量化等级表示的最大值振幅为32767。假设音频PCM码流的量化等级为A时,在某个采样点的振幅值为VA,将量化等级由A转化为B时,则在该采样点的振幅值VB可根据下面公式(2)确定:
V A MAX A = V B MAX B - - - ( 2 )
在此假设转化后的两路音频PCM码流的采样率都为8000HZ,单声道;量化等级为16位,带符号,因此每个采样点的最大振幅值为32767,最小振幅值为-32768。同样地,本发明的方案也适用于任何采样频率、量化等级的音频PCM码流。
以上步骤为进行混音处理的准备流程,以下步骤为进行混音处理的核心流程。
步骤4:初始化衰减因子f0及各路音频PCM码流的自适应因子g0[i],i为大于零小于等于n的整数。在本发明实施例中设置有针对音频PCM码流混合之后的音频PCM码流进行调节的衰减因子,还设置有分别针对每路音频PCM码流进行调节的自适应因子。
n为音频PCM码流的通路数目,在本实施例中n取2。初始化时,f0=1、各路音频PCM码流的自适应因子相等且都等于1/n;即针对于本实施例,第一音频PCM码流的自适应因子g0[1]=1/2、第二音频PCM码流的自适应因子g0[2]=1/2。
以下进入循环步骤,每次循环以单位时间T为周期。本发明所述单位时间T为大于0s小于等于1s,可以0.5s、0.25s、1s等。所述单位时间T选择越小,本发明的混音处理的效果就越好,最小值为每个单位时间内只有一个采样点,最大值可以为该混音处理的PCM码流的时间。本实施例取所述单位时间为1s。
音频PCM码流的采样参数为采样频率和PCM的量化等级。所述采样频率为QHz,在当前单位时间内,所有采样点的个数为QT。所述振幅数据用PCM的量化等级进行表征。所述PCM的量化等级可以由多位二进制数进行表示,本发明实施例中PCM的量化等级的最大值为MAX,最小值为MIN。本实施例取16位二进制数进行表征PCM的量化等级,所以MAX=32767,MIN=-32768。
步骤5:在当前单位时间内,分别对各路音频PCM码流的振幅数据即PCM码流的量化等级进行采样,然后分别对大于0和小于0的振幅数据采样值进行累加。大于0的振幅数据采样值的累加值为第一累加值ValuePositive,小于0的振幅数据采样值的累加值为第二累加值ValueNegative。
步骤6:判断累加后的结果是否超出PCM的量化等级n分之一所能表示的范围,当ValuePositive>MAX*QT/n,或者ValueNegative<MIN*QT/n时,累加值超过PCM的量化等级n分之一所能表示的范围,执行步骤7。
步骤7:当前单位时间T内的自适应因子g[i]=前一单位时间内的自适应因子-a。本发明中a大于等于1/32且小于等于1/16,本实施例优选a=1/16。
当ValuePositive≤MAX*QT/n,且ValueNegative≥MIN*QT/n时,累加值没有超过PCM的量化等级n分之一所能表示的范围,执行步骤8。
步骤8:当前单位时间T内的自适应因子g[i]=前一单位时间内的自适应因子+a。本发明中a大于等于1/32且小于等于1/16,本实施例优选a=1/16。
如果当前单位时间为第一次处理的单位时间,则前一单位时间内的自适应因子为初始化自适应因子。
步骤9:在当前单位时间内,依次处理得到所有混音PCM码流采样点。处理方法如下:将每路音频PCM码流采样点量化等级samplei与该路的自适应因子g[i]进行乘积,然后把各路的乘积相加,即得该混音PCM码流采样点的第一混合量化等级mix。mix满足公式(3)。
mix = Σ i = 1 n sqmple i × g [ i ] - - - ( 3 )
步骤10至12:在当前单位时间内,依次处理所有混音PCM码流采样点,处理完当前单位时间内的最后一个混音PCM码流采样点,判断当前单位时间是否为最后一单位时间,如果是,则结束;反之,进入下一单位时间,返回步骤5。判断当前单位时间是否为最后一单位时间的方法:判断下一单位时间内是否有采样数据,如果有则表示该单位时间不是最后单位时间,反之,该单位时间为最后单位时间。每个混音PCM码流采样点的处理方法如下:将当前混音PCM码流采样点的第一混合量化等级mix乘于当前衰减因子f得到该混音PCM码流采样点的第二混合量化等级数MIX;如果第二混合量化等级数MIX大于MAX,则输出MAX作为该混音PCM码流采样点的混音处理后的PCM的量化等级,同时求出f′,所述f′=MAX/(MIX+1),则下一混音PCM码流采样点的衰减因子为f′+STP。如果第二混合量化等级数MIX小于MIN,则输出MIN作为该混音PCM码流采样点的混音处理后的PCM的量化等级,同时求出f′,f′=MIN/(MIX+1),则下一混音PCM码流采样点的衰减因子为f′+STP。如果第二混合量化等级数MIX大于MIN且小于MAX时,则输出第二混合量化等级数MIX作为该混音PCM码流采样点的混音处理后的PCM的量化等级,同时判断当前混音PCM码流采样点的衰减因子f是否小于1,若小于1,则下一混音PCM码流采样点的衰减因子等于当前混音PCM码流采样点的衰减因子f+STP;若不小于1,则下一混音PCM码流采样点的衰减因子等于当前混音PCM码流采样点的衰减因子f。所述STP大于等于(1-f)/32且小于等于(1-f)/16。本发明优选STP为(1-f)/16。
参照图2,本发明实施例的混音处理系统如下:
一种混音处理系统,包括用于接收多路音频PCM码流的接收模块100、与接收模块100连接用于对音频PCM码流进行采集的采样模块200和对采样模块采200集的音频PCM码流进行混音的混音处理模块,其中,所述混音处理模块包括:
与采样模块200连接的归一化处理模块300,用于判断各路PCM码流的采样参数是否相同,如果不同,则对该PCM码流进行转换,转换成采样参数相同的PCM码流。所述归一化处理模块300进行如下转换:以一个PCM码流为基准,其它的向其转换。
I、将不同采样频率的PCM码流转化为相同采样频率的PCM码流的方法是:按照公式
Figure B2009101092033D0000141
得到X,其中转化前的采样频率为RA,转化后的采样频率为RB,Y为预先设定的值。接着对X取整得到X`,利用插值算法将音频PCM码流中的每Y个采样点的振幅值平均转换为X`个采样点振幅值。
II、将不同量化等级的PCM码流转化为相同量化等级的PCM码流的方法:通过公式
Figure B2009101092033D0000142
确定转化量化等级数后的PCM码流的各振幅值,其中MAXA为转化前的量化等级所能表达的最大振幅值,VA为转化前PCM码流的某振幅值,MAXB为转化后的量化等级所能表达的最大振幅值,VB为转化后PCM码流与VA相对应的振幅值。
与归一化处理模块300连接的自适应因子调整模块800,所述自适应因子调整模块800对各路音频PCM码流,以单位时间T为单位依次分段调整,当前单位时间T的自适应因子在前一自适应因子的基础增加或者减少a;所述a大于等于1/32且小于等于1/16;所述自适应因子调整模块800具体进行如下调整:
在当前单位时间内,分别对每路音频PCM码流进行处理,分别对大于0和小于0的量化等级进行累加,大于0的量化等级的累加值为第一累加值ValuePositive,小于0的量化等级的累加值为第二累加值ValueNegative;判断累加后的结果是否超出PCM码流的量化等级n分之一所能表示的范围,
当ValuePositive>MAX*QT/n,或者ValueNegative<MIN*QT/n时,Q为采样频率,MIN为PCM码流表示的最小值,MAX为PCM码流表示的最大值,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子-a;所述a大于等于1/32且小于等于1/16;
当ValuePositive≤MAX*QT/n,且ValueNegative≥MIN*QT/n时,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子+a;所述a大于等于1/32且小于等于1/16;
与归一化处理模块300连接的加权混音处理模块400,利用经过自适应因子调整模块800调整的各路音频PCM码流的自适应因子对各路与混音PCM码流采样点相对应的音频PCM码流采样点量化等级进行加权处理,然后将加权处理后的量化等级相加得到该混音PCM码流采样点的第一混合量化等级mix;
与加权混音处理模块400连接的衰减处理模块500,将该混音PCM码流采样点的第一混合量化等级mix与衰减因子f相乘得到该混音PCM码流采样点第二混合量化等级MIX;
与衰减处理模块500连接的衰减因子调整模块600;用于,如果第二混合量化等级MIX大于MAX,则衰减因子调整模块求出f′,所述f′=MAX/(MIX+1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级MIX小于MIN,则求出f′,f′=MIN/(MIX-1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级MIX大于等于MIN且小于等于MAX时,则判断当前混音PCM码流采样点的衰减因子f是否小于1,若小于1,则下一混音PCM码流采样点的衰减因子=当前混音PCM码流采样点的衰减因子f+STP;若不小于1,则下一混音PCM码流采样点的衰减因子=当前混音PCM码流采样点的衰减因子f。所述STP大于等于(1-f)/32且小于等于(1-f)/16;
与衰减处理模块500连接的输出模块700,用于,如果第二混合量化等级数MIX小于MIN,以MIN作为该混音PCM码流采样点的最终混合量化等级输出;如果第二混合量化等级数MIX大于MAX,以MAX作为该混音PCM码流采样点的最终混合量化等级输出;如果第二混合量化等级数MIX小于等于MAX且大于等于MIN,以第二混合量化等级数MIX作为该混音PCM码流采样点的最终混合量化等级输出。
进一步,优选所述a=1/16,STP为(1-f)/16,可以使混音处理后的声音更加细腻和柔和。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种混音处理方法,其特征在于,包括:
A、从需要混音的n路音频PCM码流中提取各采样点的量化等级值并初始化各路音频PCM码流的自适应因子为1/n,所述n为大于等于2的整数;
B、以单位时间T为周期分段依次进行混音处理,直到处理完最后一个单位时间,得到混音PCM码流;在当前单位时间内,具体步骤如下:
分别对每路音频PCM码流进行处理,分别对大于0和小于0的量化等级进行累加,大于0的量化等级的累加值为第一累加值ValuePositive,小于0的量化等级的累加值为第二累加值ValueNegative;判断累加后的结果是否超出PCM码流的量化等级n分之一所能表示的范围,
当ValuePositive>MAX*QT/n,或者ValueNegative<MIN*QT/n时,Q为采样频率,MIN为PCM码流表示的最小值,MAX为PCM码流表示的最大值,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子-a;所述a大于等于1/32且小于等于1/16;
当ValuePositive≤MAX*QT/n,且ValueNegative≥MIN*QT/n时,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子+a;所述a大于等于1/32且小于等于1/16;
将与混音PCM码流采样点相对应的每路音频PCM码流采样点的量化等级与该路的自适应因子g[i]进行乘积;
然后把各路的乘积相加,即得该混音PCM码流采样点的第一混合量化等级mix;
根据预定的量化等级的最大值和最小值对第一混合量化等级mix进行限制裁减输出。
2.如权利要求1所述混音处理方法,其特征在于,所述限制裁减输出的方法为:
如果第一混合量化等级mix小于PCM码流表示的最小值MIN,以MIN作为该混音PCM码流采样点的最终混合量化等级输出;如果第一混合量化等级mix大于PCM码流表示的最大值MAX,以MAX作为该混音PCM码流采样点的最终混合量化等级输出;如果第一混合量化等级mix小于等于MAX且第一混合量化等级mix大于等于MIN,以第一混合量化等级mix作为该混音PCM码流采样点的最终混合量化等级输出。
3.如权利要求1所述混音处理方法,其特征在于,
所述步骤A还包括初始化衰减因子f0=1;
所述步骤B还包括,在当前单位时间内,依次处理每个混音PCM码流采样点,直到当前单位时间内的最后一混音PCM码流采样点,具体步骤如下:
将当前混音PCM码流采样点的第一混合量化等级mix乘于当前衰减因子f得到该混音PCM码流采样点的第二混合量化等级数MIX;如果第二混合量化等级数MIX大于MAX,则输出MAX作为该混音PCM码流采样点的最终混合量化等级,同时求出f′,所述f′=MAX/(MIX+1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级数MIX小于MIN,则输出MIN作为该混音PCM码流采样点的最终混合量化等级,同时求出f′,f′=MIN/(MIX-1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级数MIX大于等于MIN且小于等于MAX时,则输出第二混合量化等级数MIX作为该混音PCM码流采样点的最终混合量化等级,同时判断当前混音PCM码流采样点的衰减因子f是否小于1,若小于1,则下一混音PCM码流采样点的衰减因子等于当前混音PCM码流采样点的衰减因子f+STP;若不小于1,则下一混音PCM码流采样点的衰减因子等于当前混音PCM码流采样点的衰减因子f。所述STP大于等于(1-f)/32且小于等于(1-f)/16。
4.如权利要求3所述混音处理方法,其特征在于,所述a=1/16,所述STP为(1-f)/16。
5.如权利要求1至4任意项所述混音处理方法,其特征在于,在步骤A之前还包括:
判断各路PCM码流的采样参数是否相同,如果不同,则对该PCM码流进行转换,转换成采样参数相同的PCM码流。
6.如权利要求1至4任意项所述混音处理方法,其特征在于,所述单位时间T大于0秒且小于等于1秒。
7.一种混音处理系统,包括用于接收多路音频PCM码流的接收模块、与接收模块连接用于对音频PCM码流进行采集的采样模块和对采样模块采集的音频PCM码流进行混音的混音处理模块,其特征在于,所述混音处理模块包括:
与采样模块连接的自适应因子调整模块,所述自适应因子调整模块对各路音频PCM码流,以时间T为单位依次分段调整;当前单位时间T内,提取该路采样点的音频PCM码流的量化等级,分别对大于0和小于0的量化等级进行累加,大于0的量化等级的累加值为第一累加值ValuePositive,小于0的量化等级的累加值为第二累加值ValueNegative;判断累加后的结果是否超出PCM码流的量化等级n分之一所能表示的范围,
当ValuePositive>MAX*QT/n,或者ValueNegative<MIN*QT/n时,Q为采样频率,MIN为PCM码流表示的最小值,MAX为PCM码流表示的最大值,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子-a;所述a大于等于1/32且小于等于1/16;
当ValuePositive≤MAX*QT/n,且ValueNegative≥MIN*QT/n时,自适应因子做如下处理:
当前单位时间内的自适应因子g[i]=前一单位时间内的自适应因子+a;所述a大于等于1/32且小于等于1/16;
与采样模块连接的加权混音处理模块,利用经过自适应因子调整模块调整的各路音频PCM码流的自适应因子对各路与混音PCM码流采样点相对应的音频PCM码流采样点的量化等级进行加权处理,然后将加权处理后的量化等级相加得到该混音PCM码流采样点的第一混合量化等级mix;
与加权混音处理模块连接的输出模块,用于根据预定的量化等级的最大值和最小值对第一混合量化等级mix进行限制裁减输出。
8.如权利要求7所述混音处理系统,其特征在于,混音处理模块还包括:
与加权混音处理模块连接的衰减处理模块,将该混音PCM码流采样点的第一混合量化等级mix与衰减因子f相乘得到该混音PCM码流采样点第二混合量化等级MIX;
与衰减处理模块连接的衰减因子调整模块;如果第二混合量化等级MIX大于MAX,则衰减因子调整模块求出f′,所述f′=MAX/(MIX+1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级MIX小于MIN,则求出f′,f′=MIN/(MIX-1),则下一混音PCM码流采样点的衰减因子为f′+STP;如果第二混合量化等级MIX大于等于MIN且小于等于MAX时,则判断当前混音PCM码流采样点的衰减因子f是否小于1,若小于1,则下一混音PCM码流采样点的衰减因子等于当前混音PCM码流采样点的衰减因子f+STP;若不小于1,则下一混音PCM码流采样点的衰减因子等于当前混音PCM码流采样点的衰减因子f。所述STP大于等于(1-f)/32且小于等于(1-f)/16;
所述输出模块与衰减处理模块连接,用于,如果第二混合量化等级MIX小于MIN,以MIN作为该采样点的最终混合量化等级输出;如果第二混合量化等级MIX大于MAX,以MAX作为该采样点的最终混合量化等级输出;如果第二混合量化等级MIX小于等于MAX且大于等于MIN,以第二混合量化等级MIX作为该混音PCM码流采样点的最终混合量化等级输出。
9.如权利要求8所述混音处理系统,其特征在于,所述混音处理模块还包括归一化处理模块,所述归一化处理模块上接采样模块、下连自适应因子调整模块与加权混音处理模块,用于判断各路PCM码流的采样参数是否相同,如果不同,则对该PCM码流进行转换,转换成采样参数相同的PCM码流。
10.如权利要求9所述混音处理系统,其特征在于,所述a=1/16,STP为(1-f)/16。
CN2009101092033A 2009-07-30 2009-07-30 一种混音处理系统及混音处理方法 Active CN101989430B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101092033A CN101989430B (zh) 2009-07-30 2009-07-30 一种混音处理系统及混音处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101092033A CN101989430B (zh) 2009-07-30 2009-07-30 一种混音处理系统及混音处理方法

Publications (2)

Publication Number Publication Date
CN101989430A true CN101989430A (zh) 2011-03-23
CN101989430B CN101989430B (zh) 2012-07-04

Family

ID=43745942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101092033A Active CN101989430B (zh) 2009-07-30 2009-07-30 一种混音处理系统及混音处理方法

Country Status (1)

Country Link
CN (1) CN101989430B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610235A (zh) * 2011-12-22 2012-07-25 深圳市万兴软件有限公司 混音处理方法、装置及智能设备
CN103021419A (zh) * 2012-12-26 2013-04-03 大唐移动通信设备有限公司 一种混合音频的处理方法及装置
CN106161814A (zh) * 2015-03-24 2016-11-23 北京视联动力国际信息技术有限公司 一种多方会议的混音方法和装置
CN106558314A (zh) * 2015-09-29 2017-04-05 广州酷狗计算机科技有限公司 一种混音处理方法和装置及设备
CN107818790A (zh) * 2017-11-16 2018-03-20 苏州麦迪斯顿医疗科技股份有限公司 一种多路音频混音方法及装置
CN108833825A (zh) * 2018-06-26 2018-11-16 广州视源电子科技股份有限公司 视频会议发言人终端的确定方法、装置、设备和存储介质
CN109003620A (zh) * 2018-05-24 2018-12-14 北京潘达互娱科技有限公司 一种回音消除方法、装置、电子设备及存储介质
CN110430330A (zh) * 2019-08-08 2019-11-08 北京云中融信网络科技有限公司 一种基于通话的音频数据处理方法及装置
CN111145792A (zh) * 2018-11-02 2020-05-12 北京微播视界科技有限公司 音频处理方法和装置
CN111833892A (zh) * 2019-04-22 2020-10-27 浙江宇视科技有限公司 音视频数据处理方法及装置
CN113810650A (zh) * 2021-08-03 2021-12-17 武汉长江通信智联技术有限公司 车载音视频监控系统实现多方通话的一种音频混音方法
CN114827656A (zh) * 2022-04-22 2022-07-29 深圳市皓丽软件有限公司 麦克风数据中混合多路音频的处理方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2059203B (en) * 1979-09-18 1984-02-29 Victor Company Of Japan Digital gain control
CN1953048B (zh) * 2005-10-18 2010-12-15 腾讯科技(深圳)有限公司 一种混音的处理方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610235B (zh) * 2011-12-22 2016-02-24 深圳万兴信息科技股份有限公司 混音处理方法、装置及智能设备
CN102610235A (zh) * 2011-12-22 2012-07-25 深圳市万兴软件有限公司 混音处理方法、装置及智能设备
CN103021419A (zh) * 2012-12-26 2013-04-03 大唐移动通信设备有限公司 一种混合音频的处理方法及装置
CN106161814A (zh) * 2015-03-24 2016-11-23 北京视联动力国际信息技术有限公司 一种多方会议的混音方法和装置
US10283134B2 (en) 2015-09-29 2019-05-07 Guangzhou Kugou Computer Technology Co., Ltd. Sound-mixing processing method, apparatus and device, and storage medium
CN106558314A (zh) * 2015-09-29 2017-04-05 广州酷狗计算机科技有限公司 一种混音处理方法和装置及设备
WO2017054494A1 (zh) * 2015-09-29 2017-04-06 广州酷狗计算机科技有限公司 一种混音处理方法、装置、设备及存储介质
CN106558314B (zh) * 2015-09-29 2021-05-07 广州酷狗计算机科技有限公司 一种混音处理方法和装置及设备
CN107818790A (zh) * 2017-11-16 2018-03-20 苏州麦迪斯顿医疗科技股份有限公司 一种多路音频混音方法及装置
CN109003620A (zh) * 2018-05-24 2018-12-14 北京潘达互娱科技有限公司 一种回音消除方法、装置、电子设备及存储介质
CN108833825A (zh) * 2018-06-26 2018-11-16 广州视源电子科技股份有限公司 视频会议发言人终端的确定方法、装置、设备和存储介质
CN111145792A (zh) * 2018-11-02 2020-05-12 北京微播视界科技有限公司 音频处理方法和装置
CN111833892A (zh) * 2019-04-22 2020-10-27 浙江宇视科技有限公司 音视频数据处理方法及装置
CN110430330A (zh) * 2019-08-08 2019-11-08 北京云中融信网络科技有限公司 一种基于通话的音频数据处理方法及装置
CN113810650A (zh) * 2021-08-03 2021-12-17 武汉长江通信智联技术有限公司 车载音视频监控系统实现多方通话的一种音频混音方法
CN113810650B (zh) * 2021-08-03 2024-04-12 武汉长江通信智联技术有限公司 车载音视频监控系统实现多方通话的一种音频混音方法
CN114827656A (zh) * 2022-04-22 2022-07-29 深圳市皓丽软件有限公司 麦克风数据中混合多路音频的处理方法及装置

Also Published As

Publication number Publication date
CN101989430B (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN101989430B (zh) 一种混音处理系统及混音处理方法
CN101751926B (zh) 信号编码、解码方法及装置、编解码系统
CN1121684C (zh) 用于选择性地改变一帧数字信号的方法和装置
CN102576542B (zh) 从窄频带信号确定上频带信号的方法和设备
RU2670797C2 (ru) Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов
CN1953048B (zh) 一种混音的处理方法
CN102610235B (zh) 混音处理方法、装置及智能设备
US20070050189A1 (en) Method and apparatus for comfort noise generation in speech communication systems
CN101421780B (zh) 用于编码和解码时变信号的方法和设备
CN101533641B (zh) 对多声道信号的声道延迟参数进行修正的方法和装置
CN103988486B (zh) 在多方电话会议的混音中选择活动信道的方法
CN104981870B (zh) 声音增强装置
CN1186765C (zh) 2.3kb/s谐波激励线性预测语音编码方法
CN101308655B (zh) 一种音频编解码方法与装置
CN1132327C (zh) 产生舒适噪声的设备和包括其部件的语音编解码器
CN101960514A (zh) 信号分析控制系统及其方法、信号控制装置及其方法和程序
CN104934034A (zh) 用于信号处理的方法和装置
CN102982807A (zh) 用于对语音信号lpc系数进行多级矢量量化的方法和系统
JP3472279B2 (ja) 音声符号化パラメータ符号化方法及び装置
CN112995425B (zh) 一种等响度混音方法及装置
CN101533639B (zh) 语音信号处理方法及装置
CN1256000A (zh) 增强音调的方法和装置
CN102054482B (zh) 一种语音信号增强的方法和装置
CN101937675A (zh) 语音检测方法及其设备
CN101587711B (zh) 基音后处理方法、滤波器以及基音后处理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200106

Address after: 518119 1 Yanan Road, Kwai Chung street, Dapeng New District, Shenzhen, Guangdong

Patentee after: Shenzhen BYD Microelectronics Co., Ltd.

Address before: 518118 Pingshan Road, Pingshan Town, Shenzhen, Guangdong, No. 3001, No.

Patentee before: Biyadi Co., Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518119 No.1 Yan'an Road, Kuiyong street, Dapeng New District, Shenzhen City, Guangdong Province

Patentee after: BYD Semiconductor Co.,Ltd.

Address before: 518119 No.1 Yan'an Road, Kuiyong street, Dapeng New District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN BYD MICROELECTRONICS Co.,Ltd.