CN105023577B - 混音处理方法、装置和系统 - Google Patents

混音处理方法、装置和系统 Download PDF

Info

Publication number
CN105023577B
CN105023577B CN201410156348.XA CN201410156348A CN105023577B CN 105023577 B CN105023577 B CN 105023577B CN 201410156348 A CN201410156348 A CN 201410156348A CN 105023577 B CN105023577 B CN 105023577B
Authority
CN
China
Prior art keywords
value
level
obtains
signal
actual gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410156348.XA
Other languages
English (en)
Other versions
CN105023577A (zh
Inventor
王天宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410156348.XA priority Critical patent/CN105023577B/zh
Publication of CN105023577A publication Critical patent/CN105023577A/zh
Application granted granted Critical
Publication of CN105023577B publication Critical patent/CN105023577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了一种混音处理方法,所述方法包括:接收多路输入语音信号,分别对所述多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值;将所述信号采样点值从16位扩展为32位,并对所述每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;对所述第一和值进行压限,得到第二和值,所述第二和值为32位;将所述第二和值从32位缩回16位,得到输出信号。采用本发明,可以有效地解决信号失真问题。此外,还提供了一种混音处理装置和系统。

Description

混音处理方法、装置和系统
技术领域
本发明涉及语音处理技术领域,特别是涉及一种混音处理方法、装置和系统。
背景技术
随着通信技术的发展以及广大用户的需求,目前各即时通信软件已经具备了多路混音的功能。即时通信软件需要将多路解码后的音频流进行混音处理,合成单个语音信号后再输出。
传统的混音处理方法是预先为各路语音信号设置相同的权重,再将各路语音信号进行加权求和。然而,随着语音信号路数的增多,语音信号的输出能量会大幅度减少,进而导致严重的失真问题。
发明内容
基于此,有必要提供一种能降低信号失真的混音处理方法。
一种混音处理方法,所述方法包括:
接收多路输入语音信号,分别对所述多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值;
将所述信号采样点值从16位扩展为32位,并对所述每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
对所述第一和值进行压限,得到第二和值,所述第二和值为32位;
将所述第二和值从32位缩回16位,得到输出语音信号。
此外,还有必要提供一种能降低信号失真的混音处理装置。
一种混音处理装置,所述装置包括:
采样模块,用于接收多路输入语音信号,分别对所述多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值;
扩展模块,用于将所述信号采样点值从16位扩展为32位,并对所述每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
压限模块,用于对所述第一和值进行压限,得到第二和值,所述第二和值为32位;
缩回模块,用于将所述第二和值从32位缩回16位,得到输出语音信号。
此外,还有必要提供一种能降低信号失真的混音处理系统。
一种混音处理系统,所述系统包括:扩展器、求和器、压限器和缩回器,其中:
扩展器用于接收多路输入语音信号,分别对所述多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值,将所述信号采样点值从16位扩展为32位;
求和器用于对所述每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
压限器用于对所述第一和值进行压限,得到第二和值,所述第二和值为32位;
缩回器用于将所述第二和值从32位缩回16位,得到输出语音信号。
由于直接将16位的采样点值进行相加,有可能导致求和后得到的和值超出16位二进制所能表示的最大范围。上述混音处理方法、装置和系统,通过将信号采样点值从16位扩展至32位,有效地解决了因信号采样点值进行求和后所得到的第一和值可能超出16位二进制所能表示的最大范围的问题。此外,当信号采样点的第一和值的超过16位二进制所能表示的最大范围时,不是直接取饱和值作为第二和值,而是对第一和值进行压限得到第二和值,有效地降低了信号失真的概率。
附图说明
图1为一个实施例中混音处理方法的流程示意图;
图2为一个实施例中对第一和值进行压限的流程示意图;
图3为一个实施例中电平曲线示意图;
图4为一个实施例中混音处理装置的结构框图;
图5为一个实施例中压限模块的结构框图;
图6为另一个实施例中压限模块的结构框图;
图7为另一个实施例中混音处理装置的结构框图;
图8为一个实施例中混音处理系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1所示,提供了一种混音处理方法,该方法包括如下步骤:
步骤102,接收多路输入语音信号,分别对多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值。
采样也称抽样,是模拟信号在时间上的离散化,即按照一定时间间隔在模拟信号上逐点采取其瞬时值。它是通过采样脉冲和模拟信号相乘来实现的。通常采样频率越高,采样点数就越密,所得到的离散信号就越逼近于原信号。
信号采样点是在脉冲作用下,将时间、幅度都连续的模拟信号转换成时间上离散(时间上有固定间隔)、但幅度上仍连续的离散模拟信号(数字信号)。信号采样点值则是指对模拟信号进行采样的瞬间、模拟信号在该时刻的幅度值。
本实施例中,输入信号为语音信号,也就是模拟信号,步骤102中对输入的语音信号进行采样,得到信号采样点值。
步骤104,将信号采样点值从16位扩展为32位,并对每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值。
计算机采用二进制来表示数据,位(bit,又称比特)是数据的最小单位,是二进制的一个位数,用0或1表示。通常以8位二进制作为一个存储单元,也就是一个字节。在32位的计算机中,short型数据一般是16位,占用2个字节,可以表示的最大范围为-32768~32767,而int型数据是32位,占用4个字节,可以表示的最大范围为-232~232-1。在本实施例中,可将各信号采样点的数据类型从16位的short型转换为32位的int型。
同一信号有多个信号采样点,每个信号采样点的幅度值即为该信号采样点的信号采样点值。同理,当接收到多路输入的语音信号时,各输入信号均有多个信号采样点值。在本实施例中,第一和值是指将每路输入信号的信号采样点值直接进行对应相加所得到的和值,也可称为第一采样点值。所有的第一和值组成一个和值数组,其中,该和值数组中的每个元素为各路信号所对应的同一采样点相加得到的和值(即第一和值)。
例如,假设有两路输入信号,第一输入信号的信号采样点构成第一数组x1_16[i],该数组原本是16位的short型数组(该数组中的元素为short型),将其扩展为32位的int型数组x1_32[i](该数组中的元素为int型),第二输入信号的信号采样点构成第二数组x2_16[i],同理将其扩展为32位的int数组x2_32[i],其中,第一输入信号的信号采样点值x1_32[0]对应第二输入信号的信号采样点值x2_32[0],第一输入信号的信号采样点值x1_32[1]对应第二输入信号的信号采样点值x2_32[1],以此类推。进一步的,将int型数组x1_32[i]和x2_32[i]中对应同一信号采样点的元素进行求和,进而得到第一和值y_32[i],该第一和值y_32[i]可组成一个和值数组,其中,该和值数组中的元素个数即为信号采样点的个数。
步骤106,对第一和值进行压限,得到第二和值,该第二和值为32位。
压限表示压缩和限制,用于保证各种信号强度的均衡。压缩是指当输入信号达到一定程度时,输出信号随着输入信号的增加以不同比例进行增加。限制是指当输入信号达到阈值时,输出信号不再随着输入信号的增加而增加。
在本实施例中,将第一和值压限后得到第二和值,第二和值也可称为第二采样点值。
步骤108,将第二和值从32位缩回16位,得到输出语音信号。
具体的,将第一和值所组成的和值数组中的每个元素都从32位缩回到16位,得到缩回后的和值所组成的数组,该数组中的每个元素为16位的,该数组形成的信号即为输出的语音信号。
应当说明的是,将第二和值从32位缩回到16位的过程中要注意取饱和,即:如果有的第一和值的取值大于32767,则取32767,否则会溢出。
本实施例中,由于将信号采样点值从16位扩展至32位,有效地解决了因信号采样点值进行求和后所得到的第一和值可能超出16位二进制所能表示的最大范围的问题。此外,当信号采样点的第一和值的超过预设的阈值时,不是直接取饱和值作为第二和值,而是对第一和值进行压限得到第二和值,有效地降低了信号失真的概率。
在一个实施例中,步骤106包括:
步骤202,获取第一和值对应的第一电平值。
电平值是指信号经过包络检波,检出的包络的幅度用对数表示,这个对数值称为对应信号采样点的电平值。比如,第一和值组成的信号序列[64,55,44],送入包络检波器,得到一个结果,假设为[57,60,54],对这个结果取db,得到对应的电平值。
在本实施例中,可通过公式:
P=20*lg(S1/S0)
获取第一和值对应的第一电平值,其中,P表示第一电平值,S1表示第一和值,S0表示预设值。
由于在数字信号中,信号采样点值的数据类型通常是16位的short型,而16位的short型数据所能表示的最大值为-216=-32768,因此在一个实施例中,可将32768作为预设值S0
步骤204,获取实际增益值,根据第一电平值和实际增益值,得到第二电平值。
具体的,将第一电平值与预设的实际增益值相加,得到第二电平值。本实施例中,实际增益值为负数且为db值,该实际增益值也可称之为增益电平。
由于将信号采样点值的数据类型从16位short型扩展至32位int型,而16位short类型数据所能表示的数据范围为-32768到32767,因此多个16位short型的信号采样点值相加所得到的第一和值可能会大于32676或者小于-32768(即该第一和值的第一电平值大于0db)。
进一步的,获取实际增益值,根据该实际增益值可将第一和值的第一电平值压限至0dB以下(即第一电平值与负数的实际增益值相加),进而得到压限后的第二电平值。
步骤206,根据第二电平值,获取第二电平值对应的第二和值。
可以理解,第一电平值是信号输入的电平,而第二电平值是信号输出的电平(实际输出电平)。
同理,在本实施例中,还可根据公式P=20*lg(S1/S0)、第二电平值P和预设值S0,该预设值为32768,来获取第二电平值对应的第二和值S1
本实施例中,获取的实际增益值是取db后的值,将第一电平值与该实际增益值相加,得到第二电平值,由于第二电平值也是取db后的值,因此需要将该第二电平值转换为第二和值,也就是第二采样点值。
将信号采样点值的数据类型从16位扩展至32位,会出现大于32767小于-32768的第一和值(即这些第一和值的第一电平值大于0dB),因此用压限器将0dB以上的信号采样点值压限至0dB以下完成混音,从而解决了当第一和值超出16位数据所能表示的最大范围时,取饱和值作为第二和值(即截顶)导致的破音情况。
在一个实施例中,步骤106包括:获取实际增益值,将实际增益值进行线性域的变换,将变换后的实际增益值与第一和值进行相乘,得到第二和值。
在本实施例中,可将实际增益值进行线性变换,即将实际增益值由dB形式折算为系数形式。实际增益值为小于1的线性系数。
具体的,将第一和值直接乘以线性系数形式的实际增益值,得到的乘积即为压限后的第二和值。例如,系数形式的实际增益值为0.8,第一和值组成的信号序列[60,55,50],则得到的第二和值组成的信号序列则为[48,44,40]。
在一个实施例中,获取实际增益值的步骤包括:获取预设的电平曲线,根据该电平曲线获取目标增益值;对目标增益值进行增益平滑,得到实际增益值。
在本实施例中,目标增益值是根据预设的电平曲线获取的。在预设的电平曲线中,在压限拐点之前,第一电平值等于理想第二电平值,在压限拐点之后,理想第二电平值小于第一电平值。
图3为预设的电平曲线示意图,如图3所示,横坐标为预设的第一电平值,纵坐标为预设的理想第二电平值,同一点的横纵坐标的差值即为目标增益值,图3中的曲线表示第一电平值和理想第二电平值的关系。所谓理想第二电平值,是指预先设置的可能趋近于实际第二电平值的电平。
由图3可知,B点为对第一电平值压限的压限拐点。在压限拐点之前,第一电平值等于理想第二电平值(即输入的信号采样点值等于输出的信号采样点值),目标增益值为0dB(在线性域上,目标增益值为系数1);在压限拐点之后,理想第二电平值小于第一电平值(即对信号采样点值进行压限),目标增益为理想第二电平值减去第一电平值,因此,目标增益为负数(在线性域上,则为压限拐点之后的射线的斜率系数,且小于1)。
增益平滑是指根据预设的目标增益值来调整实际增益值,使得实际增益值逐渐接近目标增益值,以限制增益变化的速度。具体的,根据当前信号采样点的目标增益值和与该信号采样点相邻的前一信号采样点的实际增益值,对当前信号采样点的目标增益进行调整,得到该信号采样点的实际增益值,进而根据该实际增益值对当前信号采样点进行压限。
例如,实际增益值为dB形式时,假设要对某一信号采样点的第一和值y_32[21]进行压限,获取到该信号采样点对应的第一电平值为3dB、目标增益值为-6dB,与该信号采样点的相邻的前一信号采样点的第一和值y_32[20]对应的实际增益值为-2dB,则根据y_32[20]的实际增益值-2dB和y_32[21]的目标增益值-6dB,对y_32[21]的目标增益值进行调整,进而获取y_32[21]的实际增益值。假设y_32[21]的实际增益值为-4dB,则该信号采样点的第一和值y_32[21]的第一电平值3dB经过压限后,得到第二电平值3dB+(-4dB)=-1dB。
再例如,实际增益形式为系数形式时,假设要对某一信号采样点的第一和值y_32[21]进行压限,获取到该信号采样点对应的目标增益值的线性域系数为1,与该信号采样点的相邻的前一信号采样点的第一和值y_32[20]对应的实际增益值的线性域系数为0.8。假设将目标增益值的线性系数进行调整后,得到的实际增益值的线性域系数0.9,则将该信号采样点的第一和值y_32[21]直接乘以0.9,得到压限后的第二和值。
由于在实际过程中,信号采样点和值的目标增益值和实际增益值可能不相同,甚至相差很大,若按照目标增益值对信号采样点和值直接进行压限,可能会出现压限过轻过度而导致的信号失真问题。而对一信号采样点和值的目标增益值进行增益平滑,得到对应的实际增益值,根据调整后的实际增益压限,有效地降低了信号失真的问题。
在一个实施例中,获取输入信号的步骤之前,还包括:获取输入信号的路数,根据路数设置电平曲线。
路数是指输入的语音信号的个数。输入语音信号的路数越多,信号采样点和值就越大,进而第一电平值容易超过预设的电平阈值。在本实施例中,根据输入信号的路数设置电平曲线,路数越多,电平曲线的斜率设置得越低,目标增益值越大。
根据输入信号的路数设置电平曲线,当路数越多,电平曲线对应的目标增益值越大,对信号采样点和值压限程度越高,因此有效地解决了传统技术中随着输入信号路数增多而降低输出导致的信号失真和引入噪声的问题。
如图4所示,在一个实施例中,一种混音处理装置,包括:
采样模块402,用于接收多路输入语音信号,分别对多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值。
扩展模块404,用于将信号采样点值从16位扩展为32位,并对每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
压限模块406,用于对第一和值进行压限,得到第二和值,第二和值为32位。
缩回模块408,用于将第二和值从32位缩回16位,得到输出语音信号。
本实施例中,同一信号有多个信号采样点,每个信号采样点的幅度值即为该信号采样点的信号采样点值。同理,当采样模块402接收到多路输入的语音信号时,各输入信号均有多个信号采样点值。在本实施例中,第一和值是指将每路输入信号的信号采样点值直接进行对应相加所得到的和值。所有的第一和值组成一个和值数组,其中,该和值数组中的每个元素为各路信号所对应的同一采样点相加得到的和值(即第一和值)。
进一步的,缩回模块408用于将第一和值所组成的和值数组中的每个元素都从32位缩回到16位,得到缩回后的和值所组成的数组,该数组中的每个值为16位的,该数组形成的信号即为输出的语音信号。
在一个实施例中,如图5所示,压限模块406包括:
第一电平检测模块416,用于获取第一和值对应的第一电平值。
在本实施例中,可通过公式:
P=20*lg(S1/S0)
获取第一和值对应的第一电平值,其中,P表示第一电平值,S1表示第一和值,S0表示预设的阈值。
由于在数字信号中,信号采样点值的数据类型通常是16位的short型,而16位的short型数据所能表示的最大值为-216=-32768,因此在一个实施例中,可将32768作为预设的阈值S0。实际增益值获取模块426,则获取实际增益值。
电平转换模块436,用于根据第一电平值和实际增益值,得到第二电平值。
样电值转换模块446,用于将第二电平值转换为第二和值。
同理,在本实施例中,还可根据公式P=20*lg(S1/S0)、第二电平值P和预设值S0,来获取第二电平值对应的第二和值S1
如图6所示,在一个实施例中,压限模块406包括:
实际增益值获取模块426,用于获取实际增益值。
增益值变换模块456,用于将实际增益值进行线性域的变换。
在本实施例中,增益值变换模块466用于将实际增益值进行线性变换,即将实际增益值由dB形式折算为系数形式。
和值计算模块466,用于将变换后的增益值与第一和值相乘,得到第二和值。
具体的,和值计算模块466用于将第一和值直接乘以线性系数形式的实际增益值,得到的乘积即为压限后的第二和值。
在一个实施例中,实际增益值获取模块426还用于获取预设的电平曲线,根据该电平曲线获取目标增益值;对目标增益值进行增益平滑,得到实际增益值。
具体的,实际增益值获取模块426用于根据当前信号采样点的目标增益值和与该信号采样点相邻的前一信号采样点的实际增益值,对当前信号采样点的目标增益进行调整,得到该信号采样点的实际增益值,进而根据该实际增益值对当前信号采样点压限。
在一个实施例中,在预设的电平曲线中,在压限拐点之前,第一电平值等于理想第二电平值,在压限拐点之后,理想第二电平值小于第一电平值。
在一个实施例中,如图7所示,装置还包括设置模块410,设置模块410用于获取输入语音信号的路数,根据路数设置电平曲线,其中,路数越多,电平曲线的斜率越小。
在一个实施例中,如图8所示,一种混音处理系统,包括:扩展器802、求和器804、压限器806和缩回器808,其中:
扩展器802,用于接收多路输入语音信号,分别对多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值,将信号采样点值从16位扩展为32位;
求和器804,用于对每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
压限器806,用于对第一和值进行压限,得到第二和值,第二和值为32位;
缩回器808,用于将第二和值从32位缩回16位,得到输出语音信号。
在一个实施例中,压限器806还用于获取第一和值对应的第一电平值;获取实际增益值,根据第一电平值和实际增益值,得到第二电平值;将第二电平值转换为第二和值。
在一个实施例中,压限器806还用于获取实际增益值,将实际增益值进行线性域的变换,将变换后的实际增益值与第一和值进行相乘,得到第二和值。
在一个实施例中,压限器806还用于获取预设的电平曲线,根据电平曲线获取目标增益值;对目标增益值进行增益平滑,得到实际增益值。
在一个实施例中,预设的电平曲线中,在压限拐点之前,第一电平值和理想第二电平值相等,在压限拐点之后,理想第二电平值小于第一电平值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种混音处理方法,其特征在于,所述方法包括:
接收多路输入语音信号,分别对所述多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值;
将所述信号采样点值从16位扩展为32位,并对所述每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
对所述第一和值进行压限,得到第二和值,所述第二和值为32位;
将所述第二和值从32位缩回16位,得到输出语音信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一和值进行压限,得到第二和值的步骤包括:
获取所述第一和值对应的第一电平值;
获取实际增益值,根据所述第一电平值和实际增益值,得到第二电平值;
将所述第二电平值转换为所述第二和值。
3.根据权利要求1所述的方法,其特征在于,所述对第一和值进行压限,得到第二和值的步骤,包括:
获取实际增益值,将所述实际增益值进行线性域的变换,将变换后的实际增益值与所述第一和值进行相乘,得到所述第二和值。
4.根据权利要求2或3所述的方法,其特征在于,所述获取实际增益值的步骤包括:
获取预设的电平曲线,根据所述电平曲线获取目标增益值;
对所述目标增益值进行增益平滑,得到所述实际增益值。
5.根据权利要求4所述的方法,其特征在于,所述预设的电平曲线用于表示第一电平值与理想第二电平值的关系,所述预设的电平曲线中,在压限拐点之前,第一电平值和理想第二电平值相等,在压限拐点之后,理想第二电平值小于第一电平值,所述电平曲线上同一点的理想第二电平值与第一电平值的差值为所述第一电平值所对应的目标增益值。
6.一种混音处理装置,其特征在于,所述装置包括:
采样模块,用于接收多路输入语音信号,分别对所述多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值;
扩展模块,用于将所述信号采样点值从16位扩展为32位,并对所述每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
压限模块,用于对所述第一和值进行压限,得到第二和值,所述第二和值为32位;
缩回模块,用于将所述第二和值从32位缩回16位,得到输出语音信号。
7.根据权利要求6所述的装置,其特征在于,所述压限模块包括:
第一电平获取模块,用于获取所述第一和值对应的第一电平值;
实际增益值获取模块,用于则获取实际增益值;
电平转换模块,用于根据所述第一电平值和实际增益值,得到第二电平值;
样点值转换模块,用于将所述第二电平值转换为所述第二和值。
8.根据权利要求6所述的装置,其特征在于,所述压限模块包括:
实际增益值获取模块,用于获取实际增益值;
增益值变换模块,用于将所述实际增益值进行线性域的变换;
和值计算模块,用于将变换后的增益值与所述第一和值相乘,得到所述第二和值。
9.根据权利要求7或8所述的装置,其特征在于,所述实际增益值获取模块用于获取预设的电平曲线,根据所述电平曲线获取目标增益值;对所述目标增益值进行增益平滑,得到所述实际增益值。
10.根据权利要求9所述的装置,其特征在于,所述预设的电平曲线用于表示第一电平值与理想第二电平值的关系,所述预设的电平曲线中,在压限拐点之前,第一电平值和理想第二电平值相等,在压限拐点之后,理想第二电平值小于第一电平值,所述电平曲线上同一点的理想第二电平值与第一电平值的差值为所述第一电平值所对应的目标增益值。
11.一种混音处理系统,其特征在于,所述系统包括:扩展器、求和器、压限器和缩回器,其中:
扩展器用于接收多路输入语音信号,分别对所述多路输入语音信号进行采样,得到每路输入语音信号的信号采样点值,将所述信号采样点值从16位扩展为32位;
求和器用于对所述每路输入语音信号的32位的信号采样点值进行对应求和,得到第一和值;
压限器用于对所述第一和值进行压限,得到第二和值,所述第二和值为32位;
缩回器用于将所述第二和值从32位缩回16位,得到输出语音信号。
12.根据权利要求11所述的系统,其特征在于,所述压限器还用于获取所述第一和值对应的第一电平值;获取实际增益值,根据所述第一电平值和实际增益值,得到第二电平值;将所述第二电平值转换为所述第二和值。
13.根据权利要求11所述的系统,其特征在于,所述压限器还用于获取实际增益值,将所述实际增益值进行线性域的变换,将变换后的实际增益值与所述第一和值进行相乘,得到所述第二和值。
14.根据权利要求12或13所述的系统,其特征在于,所述压限器还用于获取预设的电平曲线,根据所述电平曲线获取目标增益值;对所述目标增益值进行增益平滑,得到所述实际增益值。
15.根据权利要求14所述的系统,其特征在于,所述预设的电平曲线用于表示第一电平值与理想第二电平值的关系,所述预设的电平曲线中,在压限拐点之前,第一电平值和理想第二电平值相等,在压限拐点之后,理想第二电平值小于第一电平值,所述电平曲线上同一点的理想第二电平值与第一电平值的差值为所述第一电平值所对应的目标增益值。
CN201410156348.XA 2014-04-17 2014-04-17 混音处理方法、装置和系统 Active CN105023577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410156348.XA CN105023577B (zh) 2014-04-17 2014-04-17 混音处理方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410156348.XA CN105023577B (zh) 2014-04-17 2014-04-17 混音处理方法、装置和系统

Publications (2)

Publication Number Publication Date
CN105023577A CN105023577A (zh) 2015-11-04
CN105023577B true CN105023577B (zh) 2019-07-05

Family

ID=54413494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410156348.XA Active CN105023577B (zh) 2014-04-17 2014-04-17 混音处理方法、装置和系统

Country Status (1)

Country Link
CN (1) CN105023577B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107426651B (zh) * 2017-08-10 2018-07-06 长沙世邦通信技术有限公司 多通道的混音方法及装置
CN111739496B (zh) * 2020-06-24 2023-06-23 腾讯音乐娱乐科技(深圳)有限公司 音频处理方法、装置及存储介质
CN113342306B (zh) * 2021-06-18 2022-10-11 广州市保伦电子有限公司 一种2路音频混合方法及处理终端

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0749110A2 (en) * 1995-06-07 1996-12-18 AT&T IPM Corp. Adaptive codebook-based speech compression system
CN101251995A (zh) * 2008-02-18 2008-08-27 王逸驰 一种通过midi信息控制音频整体音效并且便于后期修改和补救的方法
CN102150204A (zh) * 2008-07-14 2011-08-10 韩国电子通信研究院 编码和解码语音与音频统合信号的设备
CN102572369A (zh) * 2010-12-17 2012-07-11 华为终端有限公司 语音音量提示的方法、终端及视频通信系统
CN103500580A (zh) * 2013-09-23 2014-01-08 广东威创视讯科技股份有限公司 混音处理方法及系统
CN103714847A (zh) * 2013-12-31 2014-04-09 广州市花都区中山大学国光电子与通信研究院 一种基于dsp的多通道数字音频处理器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0749110A2 (en) * 1995-06-07 1996-12-18 AT&T IPM Corp. Adaptive codebook-based speech compression system
CN101251995A (zh) * 2008-02-18 2008-08-27 王逸驰 一种通过midi信息控制音频整体音效并且便于后期修改和补救的方法
CN102150204A (zh) * 2008-07-14 2011-08-10 韩国电子通信研究院 编码和解码语音与音频统合信号的设备
CN102572369A (zh) * 2010-12-17 2012-07-11 华为终端有限公司 语音音量提示的方法、终端及视频通信系统
CN103500580A (zh) * 2013-09-23 2014-01-08 广东威创视讯科技股份有限公司 混音处理方法及系统
CN103714847A (zh) * 2013-12-31 2014-04-09 广州市花都区中山大学国光电子与通信研究院 一种基于dsp的多通道数字音频处理器

Also Published As

Publication number Publication date
CN105023577A (zh) 2015-11-04

Similar Documents

Publication Publication Date Title
CN104853280B (zh) 一种可扩展动态范围的麦克风及其控制方法
US11553428B2 (en) Signal sending method, signal receiving method, and apparatuses
CN105023577B (zh) 混音处理方法、装置和系统
CN106209322A (zh) 一种视频信号中混合传输数据的方法及装置
CN105429642B (zh) 一种提高数据采集系统动态范围的方法
CN101533641A (zh) 对多声道信号的声道延迟参数进行修正的方法和装置
CN108259095B (zh) 联合sfft与coa的无线传感器网络部署结构及频谱重建方法
JP2016539582A (ja) 信号サンプル点データの処理方法及び装置
CN109655644B (zh) 一种降低任意波信号输出抖动的方法和装置
CN108494508A (zh) 基于mwc相关支撑集恢复的高效频谱检测方法
CN113376570A (zh) 一种基于信道化处理的相关干涉仪实时测向方法
CN102843316B (zh) 一种莫尔斯报信号处理装置和处理方法
CN104616665A (zh) 基于语音类似度的混音方法
KR20190009440A (ko) 오디오 신호를 처리하기 위한 방법 및 장치
CN203813771U (zh) 基于fpga的大动态范围数字信道化接收机
CN109547377B (zh) 一种改进压扩变换接收端的降低多载波水声通信系统峰均比方法
CN103718525A (zh) 一种削波方法、装置及系统
CN104218954A (zh) 一种宽带阵列天线压缩采样方法及装置
EP2911360B1 (en) Complex digital signal compression device, method and computer-readable storage medium, complex digital signal expansion device, method and computer-readable storage medium, and communication device
Long et al. Signal-to-noise ratio in stretch processing
CN102694568A (zh) 多进制伪随机序列扩频通信方法
CN108983191B (zh) Ofdm雷达通信一体化系统的低速信号处理方法
CN103581923A (zh) 一种基于加权矩阵滤波的能量检测方法
CN103856419A (zh) 对至eNB的上行信道进行信道估计的方法与设备
CN105632510A (zh) 一种提高声信号传输精度和还原精度的系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant