CN101656072A - 混音装置、混音方法及利用该混音装置的会议系统 - Google Patents
混音装置、混音方法及利用该混音装置的会议系统 Download PDFInfo
- Publication number
- CN101656072A CN101656072A CN200910170235A CN200910170235A CN101656072A CN 101656072 A CN101656072 A CN 101656072A CN 200910170235 A CN200910170235 A CN 200910170235A CN 200910170235 A CN200910170235 A CN 200910170235A CN 101656072 A CN101656072 A CN 101656072A
- Authority
- CN
- China
- Prior art keywords
- root
- mean
- voice data
- square value
- road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
混音装置、方法及利用该混音装置的会议系统。一种混音装置,包括:均方根计算器(201),用于分别计算N路音频数据在预定时间内的均方根值,其中N≥1,且N为整数;比较器(202),用于对计算出的N个均方根值进行比较,以对计算出的N个均方根值进行排序,并分别为N路音频数据附加表示其均方根值大小顺序的识别信息;混合系数分配器(203),根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述N路音频数据分配的系数按照其均方根值由大到小的顺序依次递减;和混合器(204),将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
Description
技术领域
本发明涉及对来自多个设备的数字语音信号进行混音的混音装置及方法,特别地,涉及用于多媒体会议的混音装置及方法。
背景技术
在现代社会中,多媒体会议已经在越来越多的场合被应用,而音频数据是多媒体会议中最基本的要素。在多媒体会议中,通常需要利用中央处理设备或终端设备对多个音频数据进行混音,并输出混音后得到的信号。
在现有的混音系统中,通常,采用对来自各个设备的音频数据进行线性叠加。但是,通常的语音数据为16bit量化(或者更少,如8bit),其取值范围是-32768≤采样值≤32767,因此,采用将多个音频数据直接线性叠加的方式会带来溢出的问题,并产生噪音。
对于这样的问题,考虑到:如果将两个连续平滑的波形进行叠加,其结果也应该是平滑的,所以,产生的噪音就是由于叠加溢出而引入的,那么可以通过采用滤波来处理溢出部分,以改善由于溢出造成的语音质量下降。一个常用的方式就是对来自各个终端设备的音频数据进行线性叠加,即,使用更多的位数来表示音频数据的一个样本,在混音完毕以后,再通过归一化降低其振幅,使其分布在16bit所能表示的范围之内,例如使用32bit来表示线性叠加以后的数据,这样的方式实现简单,运算也比较快,并且能满足很多路音频同时进行混音的需要。然而,采用这样的混音方式虽然解决了溢出的问题,但是由于线性混音的方式没有改变,所以混音路数越多,每一路声音的幅度就越小,声音的辨识度也越低,混音效果随路数的增加而变差。
进行滤波处理的另外一种常用方法就是“箝位”,其采用时域叠加作为基本的处理手段,对叠加后的信号进行溢出检测,针对发生溢出的采样点进行饱和运算,即将超过上限的结果设为上限值、超过下限的结果设为下限值。箝位方法存在实现简单、快速高效的优点,但是箝位方法相当于在最大和最小的临界值处切强行切断波形,非常生硬,会造成较大的波形失真,在听觉上会带来如嘈杂、音调变化等效果。同时,随着参与混音的终端设备增加,出现溢出的频率也不断上升,实验证明,采用这种时域直接叠加的方式进行混音,一般不能突破4路输入音频流的限制,否则将无法分辨语音流的内容了。
本发明正是为了克服现有的混音系统中存在的一个或多个问题,并结合多媒体会议应用特点而做出的改进。
发明内容
因此,本发明的目的是:提供一种能够解决现有的混音系统中由于线性叠加产生数据溢出,造成噪音和语音不连续现象的混音系统和方法。
本发明的目的还在于:提供一种能够不会产生很大的延迟、实时性能够得到保证、混音听觉效果优良的,可以用于多媒体会议的混音系统和方法。
本发明一方面提供了一种用于会议系统的混音装置,包括:均方根计算器(201),用于分别计算N路音频数据在预定时间内的均方根值,其中N≥1,且N为整数;比较器(202),用于对计算出的N个均方根值进行比较,以对计算出的N个均方根值进行排序,并分别为N路音频数据附加表示其均方根值大小顺序的识别信息;混合系数分配器(203),根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述N路音频数据分配的系数按照其均方根值由大到小的顺序依次递减;和混合器(204),将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
本发明第二方面提供了一种用于会议系统的混音装置,包括:均方根计算器(201),用于计算N路音频数据在预定时间内的均方根值,其中N≥1,且N为整数;比较器(202),用于对计算出的N个均方根值进行比较以确定所述N个均方根值中最大的m个均方根值,并为与确定出的m个均方根值对应的m路音频数据分别附加表示其均方根值大小顺序的识别信息,其中m为整数,且1≤m<N;混合系数分配器(203),根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述m路音频数据分配的系数按照其均方根值由大到小的顺序依次递减,为剩余的N-m路音频数据分配的系数相等并且小于为所述m路音频数据分配的系数;和混合器(204),将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
本发明第三方面提供了一种会议系统,包括中央控制设备(107)和一个以上的终端设备;所述中央控制设备(107)或所述终端设备包括:如本发明第一方面或第二方面所述的混音装置(102)。
本发明第四方面提供了一种用于会议系统的混音方法,包括:均方根计算步骤,用于计算N路音频数据在固定时间内的均方根值,其中N≥1,且N为整数;比较步骤,用于对计算出的N个均方根值进行比较,以对计算出的N个均方根值进行排序,并为N路音频数据相应地附加表示其均方根值大小顺序的识别信息;混合系数分配步骤,根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述N路音频数据分配的系数按照其均方根值由大到小的顺序依次递减;和混合步骤,将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
本发明第五方面提供了一种用于会议系统的混音方法,包括:均方根计算步骤,用于计算N路音频数据在固定时间内的均方根值,其中N≥1,且N为整数;比较步骤,用于对计算出的N个均方根值进行比较以确定所述N个均方根值中最大的m个均方根值,并为与确定出的m个均方根值对应的m路音频数据分别附加表示其均方根值大小顺序的识别信息,其中m为整数,且1≤m<N;混合系数分配步骤,根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述m路音频数据分配的系数按照其均方根值由大到小的顺序依次递减,为剩余的N-m路音频数据分配的系数相等并且小于为所述m路音频数据分配的系数;和混合步骤,将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
附图说明
图1是解释本发明的混音装置的结构方框图;
图2是解释一种采用本发明的混音装置进行混音的中央控制设备的框图;
图3是解释另一种采用本发明的混音装置进行混音的中央控制设备的框图;
图4是解释又一种采用本发明的混音装置进行混音的中央控制设备的框图。
具体实施方式
下面,结合附图对本发明的实施例进行说明。
另外,在说明实施例的所有的图中,具有相同功能的部分采用相同的符号,省略反复的说明。
本发明的混音装置利用了人耳的掩蔽域效应,即,一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象,由于人耳的掩蔽域效应,使得当大的语音信号(或者说能量强的语音信号)与小的语音信号(或者说能量弱的语音信号)同时存在时,小的语音信号无法被人耳有效地识别,因此,在实际的会议系统中,当多人同时发言时,通常只有少部分声音大的人的声音可以被人耳有效地识别。本发明的混音装置正是基于实际会议系统工作条件下的上述声学特性,进行多路人声处理逻辑而实现的,本发明的混音装置在进行混音处理时,通过动态地对一段时间内声音能量值相对较高的语音数据分配较大的混音系数,为声音能量值相对较低的语音数据分配较小的混音系数,从而使原始输入的声音能量较强的几路语音数据在进行混音时被相对强化,而使其他各路语音数据被相对弱化,从而在保持与现场实际语音效果相一致的前提下,更好地重现在实际会议过程中能够被人耳有效识别的语音,同时通过对混音系数的设计,能够保证混音后的数据不溢出。
以下,结合附图来对本发明的混音装置进行具体说明。
图1是解释本发明的混音装置的结构方框图。
本发明的混音装置102用于对一路以上的音频数据进行混合。
具体地,本实施方式的混音装置102包含均方根计算器201,比较器202,混合系数分配器203和混合器204。其中,均方根计算器201计算在预定时间T内、第n(1≤n≤N,且n为整数)路音频数据的均方根值En,即:
其中:
t为预定时间T内的采样点个数,其值等于时间T(单位:秒)乘以采样率k(单位:赫兹),即t=T*k;xn,i为在该预定时间中,第n路音频数据的第i个采样值。
均方根计算器201而后将计算出的N个均方根值E1,E2,…En发送至比较器202;比较器202对接收到的分别与N路音频数据对应的N个均方根值E1,E2,…En进行比较,按照E1,E2,…En由大到小的顺序进行排序,并为与E1,E2,…En对应的N路音频数据相应地附加表示其均方根值大小顺序的识别信息,然后将附加了该识别信息的N路音频数据提供给混合系数分配器203,混合系数分配器203根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为均方根值越大的音频数据分配的系数越大,为均方根值越小的音频数据分配的系数越小,例如,为N路音频数据分配的系数按照其均方根值由大到小的顺序依次为:1/2,1/4,1/8,1/16,1/32,1/64,1/128,1/256……,依次类推。在为N路音频数据分配了用于混合的系数后,混合器204利用分配得到的系数对接收到的N路音频数据进行混合,将接收到的N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。例如,为N路音频数据分配的系数按照其均方根值由大到小的顺序依次为:1/2,1/4,1/8,1/16,1/32,1/64,1/128,1/256……时,其混音后的音频数据yi可以用公式表示为:
其中,xn,i为在预定时间中,第n路音频数据的第i个采样值;n’表示第n路音频数据为在预定时间中的能量En大小排在第n’位,1≤n’≤N(n’=1时,表示能量最大);N表示用于进行混音的音频信号数;yi表示在预定时间中得到的音频数据的第i个音频样值。
显然,对于上述系数的选择并不限于按照公式(2)中的方式来进行,只要为均方根值越大的音频数据分配的系数越大,为均方根值越小的音频数据分配的系数越小就可以在不产生数据溢出的同时使系统的实时性能够得到保证,获得优良的混音听觉效果。
采用这样的混音装置,优点在于:使原始输入的声音能量较强的几路语音数据在进行混音时被相对强化,而使其他各路语音数据被相对弱化,从而在保持与现场实际语音效果相一致的前提下,更好地重现语音,同时通过对混音系数的设计,能够保证混音后的数据不溢出。
根据人耳的听觉特性,在实际的会议系统中,多人同时说话时,最多只有3-5人的声音可以被有效识别,因此,通过仅确定出均方根值最大的m路音频数据,并为该m路音频数据由大到小分配用于混合的系数,为剩余的N-m路音频数据分配相同的小于为该m路音频数据分配的系数,能够在不影响人耳的语音辨识度的前提下,进一步减化计算过程,提高计算速度。基于此,优选地,比较器202在对接收到的与N路音频数据分别对应的N个均方根值进行比较后,不对所有的N路音频数据的N个均方值进行排序,而是确定其中最大的m(1≤m<N,m为整数)个均方根值,并为确定出的该最大的m个均方根值所对应的m路音频数据分别附加表示其均方根值大小顺序的识别信息,然后将附加了该识别信息的m路音频数据和剩余的N-m路音频数据提供给混合系数分配器203,混合系数分配器203根据所附加的识别信息为接收到的N路音频数据分别分配用于进行混合运算的系数,其中,为均方根值最大的m路音频数据分配的系数按照其均方根值由大到小的顺序依次递减,并且为其余N-m路音频数据分配一个相等的系数,并且该系数小于为该m路音频数据分配的系数,例如,为均方根值最大的5路音频数据分配的系数按照均方根值由大到小的顺序依次为:1/2,1/4,1/8,1/16,1/32,为剩余的N-5路音频数据分别分配的系数为1/(32*(N-5))。在为从N个设备接收到的音频数据分配了用于混合的系数后,混合器204利用分配得到的系数对其进行混合,将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
例如,当为均方根值最大的5路音频数据分配的系数按照均方根值由大到小的顺序依次为:1/2,1/4,1/8,1/16,1/32,为剩余的N-5路音频数据分别分配的系数为1/(32*(N-5))时,其混音后的样值yi可以用公式表示为:
其中,xn,i为在预定时间中,第n路音频数据的第i个采样值;n’表示第n路音频数据为在预定时间中的能量En大小排在第n’位,1≤n’≤N(n’=1时,表示能量最大);N表示用于进行混音的N路音频信号,m为整数,1≤m<N;yi表示在预定时间片段T中对N路音频信号混音后得到的音频数据的第i个音频样值。
显然,对于上述系数的选择并不限于按照公式(3)中的方式来进行,只要为均方根值最大的m路音频数据分配的系数按照其均方根值由大到小的顺序依次递减,并且为其余N-m路音频数据分配一个相等的系数,并且该系数小于为该m路音频数据分配的系数,就可以在不产生数据溢出的同时使系统的实时性能够得到保证,获得优良的混音听觉效果。
在此,m可以确定等于2,3,4,5或者其他数值,即表示:选取N个均方根值中最大的2个、3个、4个、5个或者更多个均方根值对应的音频数据,并为选取的音频数据分配比其他各路音频数据更大的混音系数,这可以根据实际的需要来进行适当的选择。通过上述的方法,被选定的m个语音通道在混音过程中得到相对增强,即能量高的语音得到相对增强,能量低的语音相对减弱,通过牺牲能量低的语音通道的辨识度来达到增强能量高的语音通道辨识度的效果。
另一方面选择的m值越大,相对增强的语音通道路数越多,增强程度越不明显;而选择的m值越小,增强的程度越显著,但是相对增强的语音通道路数越少,因此对于m值的选择实际上可以根据实际的应用场合和要求的语音辨识程度进行选择和调整。
例如,在实际的会议系统中,在多人同时通过麦克说话时,人耳最多只能有效地识别3至5人的说话内容,因此,通过使用本方案提供的混音方法,将m选为3、4或者5,可以在原有听觉效果不失真的基础上,使可辨识的语音具有更加清晰的辨识度。
并且,为均方根值最大的几路音频数据分配的系数也不限于1/2,1/4,1/8,1/16,1/32的方式,只要按照音频数据的均方根值从大到小的顺序为能量最大的几路音频数据分配的系数依次减小即可。
上述混音装置可以用于会议系统,通常,会议系统包括中央控制设备(107)和一个以上的终端设备,上述混音装置可以设置在中央控制设备侧,并对来自中央控制设备外部的音频数据按照以上描述的方式进行混音,从而实现上述效果。
优选地,位于中央控制设备侧的混音装置还可以同时接收来自中央控制设备本地的音频数据,并将其与来自中央控制设备外部的音频数据进行混音。
上述混音装置也可以设置在各个终端设备侧,并对来自其外部的音频数据按照以上描述的方式进行混音,从而实现上述效果。
优选地,位于所述各个终端设备侧的混音装置还可以同时接收来自该终端设备本地的音频数据,并将其与来自外部的音频数据进行混音。
以下,对这样的会议系统中包含了所述混音装置的中央控制设备的结构进行具体地描述。
图2中例示了一种采用本发明的混音装置进行混音的中央控制设备的框图。
在该会议系统中,本发明的混音装置102可以设置在数字会议系统的中央控制设备107侧,其将来自多个参与会议的终端设备的音频数据进行混合。
来自多个终端设备的音频数据(未图示)被提供给中央控制设备107的下行端口105,下行端口105将接收到的来自一个或多个终端设备的音频数据顺序提供给音频包解析器104,音频包解析器104对接收到的音频数据进行解析,然后根据各个音频数据各自携带的识别信息将其分别存储在多个音频缓冲区103内,其中,来自相同的终端设备的音频数据被存储在相同的音频缓冲区内。混音装置102将来自多个音频缓冲区103的音频数据按照以上具体描述的方式进行混合,得到混音信号,并将混音信号分别发送给本地音频编/解码器101和下行音频包合成器106,本地音频编/解码器101对混音信号进行解码,并将其在本地进行输出,同时,下行音频包合成器106将混音信号按照预定协议打包,并将其进一步输出至下行端口105,供下行端口105下行传输至各个终端设备。
在此,可以将混音信号在系统中的所有终端设备处进行播放,也可以根据终端设备的请求仅在发送了混音信号输出请求的终端设备上播放,也可以根据从中央控制设备107的输入装置(未示出)输入的终端设备指定信息在混音信号中加入相应的终端设备标识信息,从而仅在由终端设备指定信息所指定的终端设备上进行语音播放,也可以仅仅将混音信号在中央控制设备107处进行存储而不将其发送给其他设备,供以后的查询使用,即如何进一步处理混音后得到的数据可以根据实际的应用需要进行选择,并不限于以上几种方式,只要采用了上述方式进行混音处理即可。
图3中例示了另一种采用本发明的混音装置进行混音的中央控制设备的框图。
在该会议系统中,本发明的混音装置102可以设置在数字会议系统的中央控制设备107侧,其与图2中示出的混音装置的区别仅在于:其不是仅将来自多个终端设备的音频数据进行混合,而是将经过本地音频编/解码器101编码的来自中央控制设备107本地的模拟音频数据与来自一个或多个参与会议的终端设备(未示出)的音频数据进行混合。
位于中央控制设备107侧的本地音频编/解码器101对从中央控制设备本地输入的模拟语音信号进行采样编码处理,并将编码后得到的音频数据输入混音装置102;并且,来自一个或多个终端设备的音频数据被提供给中央控制设备107的下行端口105,下行端口105将接收到的来自一个或多个终端设备的音频数据顺序提供给音频包解析器104,音频包解析器104对接收到的音频数据进行解析,然后根据各个音频数据各自携带的识别信息将其分别存储在多个音频缓冲区103内,其中,来自相同的终端设备的音频数据被存储在相同的音频缓冲区内。混音装置102将来自音频缓冲区103和本地音频编/解码器101的音频数据进行混合,得到混音信号,并将混音信号分别发送给本地音频编/解码器101和下行音频包合成器106,本地音频编/解码器101对混音信号进行解码,并将其在本地进行输出,同时,下行音频包合成器106将混音信号按照预定协议打包,并将其进一步输出至下行端口105,供下行端口105下行传输至终端设备。
同样,在此,可以将混音信号输出给系统中的所有终端设备,也可以根据从中央控制设备107的输入装置(未示出)输入的终端设备指定信息在混音信号中加入相应的终端设备标识信息,从而仅将混音数据发送至由终端设备指定信息所指定的终端设备。
优选地,在该会议系统中,上述中央控制设备可以对16路音频数据进行混合,其中1路为从中央控制设备本地输入的、经过本地音频编/解码器101采样编码的音频数据,另外15路为从15个终端设备输入的音频数据。
图4中例示了又一种采用本发明的混音装置进行混音的中央控制设备的框图。
在该会议系统中,本发明的混音装置102设置在数字会议系统的中央控制设备107侧,其与图2中示出的混音装置的区别仅在于:其不是仅将来自多个终端设备的音频数据进行混合,而是将来自中央控制设备107本地的音频数据、来自一个或多个参与会议的终端设备(未示出)的音频数据以及从外部存储设备108读取的语音数据进行混合。
在该外部存储设备108中预先存储了可以用于进行混音的语音数据,并通过中央控制设备107的外部接口(未示出)输入该混音装置102,该语音数据例如可以是预先存储的可用作混音的背景音乐。
其中,与上述会议系统中类似地,位于中央控制设备107侧的本地音频编/解码器101对从中央控制设备本地输入的模拟语音信号进行采样编码处理,并将编码后得到的音频数据输入混音装置102;并且,来自一个或多个终端设备的音频数据被提供给中央控制设备107的下行端口105,下行端口105将接收到的来自一个或多个终端设备的音频数据顺序提供给音频包解析器104,音频包解析器104对接收到的音频数据进行解析,然后根据各个音频数据各自携带的识别信息将其分别存储在多个音频缓冲区103内,其中,来自相同的终端设备的音频数据被存储在相同的音频缓冲区内。混音装置102按照前述的混音方式将来自音频缓冲区103、本地音频编/解码器101的音频数据以及从外部存储设备108输入的语音数据进行混合,得到混音信号,并将混音信号分别发送给本地音频编/解码器101和下行音频包合成器106,本地音频编/解码器101对混音信号进行解码,并将其在本地进行输出,同时,下行音频包合成器106将混音信号按照预定协议打包,并将其输出至下行端口105,供下行端口105下行传输至终端设备。
同样,在此,可以将混音信号在系统中连接的所有终端设备和中央控制设备107的本地进行语音播放,也可以根据终端设备的请求仅在发送了混音信号输出请求的终端设备和中央控制设备107的本地进行语音播放,也可以根据从中央控制设备107的输入装置(未示出)输入的终端设备指定信息在混音信号中加入相应的终端设备标识信息,从而仅在由终端设备指定信息所指定的终端设备和中央控制设备107的本地进行语音播放。
当然,在会议系统中,上述中央控制设备也可以仅对来自一个或多个参与会议的终端设备(未示出)的音频数据与从外部存储设备108读入的音频数据进行混合。
以上,作为示例,混音装置都位于会议系统中的中央控制设备侧,进行集中式混音处理,但是混音装置也可以位于各个终端设备侧,用于进行分布式混音处理,以对分别来自该各个终端设备外部的设备的音频数据进行与以上类似的混音处理,或者对分别来自该各个终端设备的外部设备的音频数据和该各个终端设备本地的音频数据进行与以上类似的混音处理,在此不再赘述。
虽然为了说明的目的,本发明是参照所选择的特定实施例描述的,但显而易见的,本领域的技术人员可以对其进行各种修改而不脱离本发明的基本原理和范围。
Claims (11)
1.一种用于会议系统的混音装置,包括:
均方根计算器(201),用于分别计算N路音频数据在预定时间内的均方根值,其中N≥1,且N为整数;
比较器(202),用于对计算出的N个均方根值进行比较,以对计算出的N个均方根值进行排序,并分别为N路音频数据附加表示其均方根值大小顺序的识别信息;
混合系数分配器(203),根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述N路音频数据分配的系数按照其均方根值由大到小的顺序依次递减;和
混合器(204),将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
2.一种用于会议系统的混音装置,包括:
均方根计算器(201),用于计算N路音频数据在预定时间内的均方根值,其中N≥1,且N为整数;
比较器(202),用于对计算出的N个均方根值进行比较以确定所述N个均方根值中最大的m个均方根值,并为与确定出的m个均方根值对应的m路音频数据分别附加表示其均方根值大小顺序的识别信息,其中m为整数,且1≤m<N;
混合系数分配器(203),根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述m路音频数据分配的系数按照其均方根值由大到小的顺序依次递减,为剩余的N-m路音频数据分配的系数相等并且小于为所述m路音频数据分配的系数;和
混合器(204),将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
3.根据权利要求1或2所述的混音装置,其特征在于:
所述混音装置设置在会议系统的中央控制设备侧。
4.根据权利要求3所述的混音装置,其特征在于:
所述N路语音数据中的一路或多路来自能够提供语音数据的终端设备。
5.根据权利要求3所述的混音装置,还包括:
所述N路语音数据中的一路或多路来自位于中央控制设备外部的存储设备,其中,所述外部存储设备将预先存储在该外部存储设备中的语音数据输入所述混音装置。
6.根据权利要求2所述的混音装置,其中,N=16,m=3,按照均方根值从大到小的顺序为均方根值最大的3路语音数据分配的混合系数依次为:1/2、1/4和1/8,为其他13路语音数据分配的混合系数为1/128。
7.根据权利要求1或2所述的混音装置,其特征在于:
所述混音装置设置在会议系统中的终端设备侧。
8.一种会议系统,包括中央控制设备(107)和一个以上的终端设备;
所述中央控制设备(107)或所述终端设备包括:
如权利要求1或2所述的混音装置(102)。
9.根据权利要求8所述的会议系统,其中,
所述中央控制设备(107)包括:
所述混音装置(102);
下行端口(105),接收来自所述一个以上的终端设备的音频数据;
音频包解析器(104),其对从所述下行端口(104)接收到的音频数据进行解析,然后根据各个音频数据各自携带的识别信息将其分别存储在多个音频缓冲区(103)内;
所述混音装置(102)将来自所述多个音频缓冲区(103)的音频数据进行混合。
10.一种用于会议系统的混音方法,包括:
均方根计算步骤,用于计算N路音频数据在固定时间内的均方根值,其中N≥1,且N为整数;
比较步骤,用于对计算出的N个均方根值进行比较,以对计算出的N个均方根值进行排序,并为N路音频数据相应地附加表示其均方根值大小顺序的识别信息;
混合系数分配步骤,根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述N路音频数据分配的系数按照其均方根值由大到小的顺序依次递减;和
混合步骤,将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
11.一种用于会议系统的混音方法,包括:
均方根计算步骤,用于计算N路音频数据在固定时间内的均方根值,其中N≥1,且N为整数;
比较步骤,用于对计算出的N个均方根值进行比较以确定所述N个均方根值中最大的m个均方根值,并为与确定出的m个均方根值对应的m路音频数据分别附加表示其均方根值大小顺序的识别信息,其中m为整数,且1≤m<N;
混合系数分配步骤,根据所附加的识别信息为N路音频数据分别分配用于进行混合运算的系数,其中,为所述m路音频数据分配的系数按照其均方根值由大到小的顺序依次递减,为剩余的N-m路音频数据分配的系数相等并且小于为所述m路音频数据分配的系数;和
混合步骤,将N路音频数据分别与为其分配的系数进行加权求和,从而得到混音后的混音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910170235A CN101656072A (zh) | 2009-09-08 | 2009-09-08 | 混音装置、混音方法及利用该混音装置的会议系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910170235A CN101656072A (zh) | 2009-09-08 | 2009-09-08 | 混音装置、混音方法及利用该混音装置的会议系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101656072A true CN101656072A (zh) | 2010-02-24 |
Family
ID=41710329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910170235A Pending CN101656072A (zh) | 2009-09-08 | 2009-09-08 | 混音装置、混音方法及利用该混音装置的会议系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101656072A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101917291A (zh) * | 2010-08-13 | 2010-12-15 | 北京飞利信科技股份有限公司 | 一种串行总线流媒体传输系统及该系统中的终端设备 |
CN102005206A (zh) * | 2010-11-16 | 2011-04-06 | 上海华平信息技术股份有限公司 | 多路音频的混音方法 |
CN102664019A (zh) * | 2012-04-27 | 2012-09-12 | 深圳市邦彦信息技术有限公司 | 一种全交互会议的dsp混音方法和装置 |
CN102968995A (zh) * | 2012-11-16 | 2013-03-13 | 新奥特(北京)视频技术有限公司 | 一种音频信号的混音方法及装置 |
CN103188595A (zh) * | 2011-12-31 | 2013-07-03 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
CN103680508A (zh) * | 2013-12-09 | 2014-03-26 | Tcl集团股份有限公司 | 多级混音的动态分配方法及动态分配装置 |
CN103870234A (zh) * | 2014-02-27 | 2014-06-18 | 北京六间房科技有限公司 | 一种混音方法及其装置 |
CN105593932A (zh) * | 2013-10-09 | 2016-05-18 | 索尼公司 | 编码设备和方法、解码设备和方法、以及程序 |
CN106935244A (zh) * | 2017-03-24 | 2017-07-07 | 成都市极米科技有限公司 | 一种音频处理方法、装置及系统 |
CN109389989A (zh) * | 2017-08-07 | 2019-02-26 | 上海谦问万答吧云计算科技有限公司 | 混音方法、装置、设备及存储介质 |
CN109473117A (zh) * | 2018-12-18 | 2019-03-15 | 广州市百果园信息技术有限公司 | 音频特效叠加方法、装置及其终端 |
CN110910892A (zh) * | 2018-09-17 | 2020-03-24 | 北京京东尚科信息技术有限公司 | 会议系统终端、音频数据处理方法和远程会议系统 |
CN112750444A (zh) * | 2020-06-30 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 混音方法、装置及电子设备 |
CN113053399A (zh) * | 2019-12-26 | 2021-06-29 | 浙江大搜车软件技术有限公司 | 一种多路音频混音方法及装置 |
CN115119111A (zh) * | 2022-06-21 | 2022-09-27 | 世邦通信股份有限公司 | 一种数字会议实现方法及系统、智能设备与数字会议系统 |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
-
2009
- 2009-09-08 CN CN200910170235A patent/CN101656072A/zh active Pending
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101917291A (zh) * | 2010-08-13 | 2010-12-15 | 北京飞利信科技股份有限公司 | 一种串行总线流媒体传输系统及该系统中的终端设备 |
CN101917291B (zh) * | 2010-08-13 | 2012-03-28 | 北京飞利信科技股份有限公司 | 一种串行总线流媒体传输系统及该系统中的终端设备 |
CN102005206A (zh) * | 2010-11-16 | 2011-04-06 | 上海华平信息技术股份有限公司 | 多路音频的混音方法 |
CN102005206B (zh) * | 2010-11-16 | 2012-07-25 | 华平信息技术股份有限公司 | 多路音频帧的混音方法 |
CN103188595A (zh) * | 2011-12-31 | 2013-07-03 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
CN103188595B (zh) * | 2011-12-31 | 2015-05-27 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
CN102664019A (zh) * | 2012-04-27 | 2012-09-12 | 深圳市邦彦信息技术有限公司 | 一种全交互会议的dsp混音方法和装置 |
CN102968995A (zh) * | 2012-11-16 | 2013-03-13 | 新奥特(北京)视频技术有限公司 | 一种音频信号的混音方法及装置 |
CN102968995B (zh) * | 2012-11-16 | 2018-10-02 | 新奥特(北京)视频技术有限公司 | 一种音频信号的混音方法及装置 |
CN105593932B (zh) * | 2013-10-09 | 2019-11-22 | 索尼公司 | 编码设备和方法、解码设备和方法、以及程序 |
CN105593932A (zh) * | 2013-10-09 | 2016-05-18 | 索尼公司 | 编码设备和方法、解码设备和方法、以及程序 |
CN103680508A (zh) * | 2013-12-09 | 2014-03-26 | Tcl集团股份有限公司 | 多级混音的动态分配方法及动态分配装置 |
CN103680508B (zh) * | 2013-12-09 | 2018-03-16 | Tcl集团股份有限公司 | 多级混音的动态分配方法及动态分配装置 |
CN103870234A (zh) * | 2014-02-27 | 2014-06-18 | 北京六间房科技有限公司 | 一种混音方法及其装置 |
CN103870234B (zh) * | 2014-02-27 | 2017-03-15 | 北京六间房科技有限公司 | 一种混音方法及其装置 |
CN106935244A (zh) * | 2017-03-24 | 2017-07-07 | 成都市极米科技有限公司 | 一种音频处理方法、装置及系统 |
CN106935244B (zh) * | 2017-03-24 | 2020-05-19 | 成都极米科技股份有限公司 | 一种音频处理方法、装置及系统 |
CN109389989A (zh) * | 2017-08-07 | 2019-02-26 | 上海谦问万答吧云计算科技有限公司 | 混音方法、装置、设备及存储介质 |
CN109389989B (zh) * | 2017-08-07 | 2021-11-30 | 苏州谦问万答吧教育科技有限公司 | 混音方法、装置、设备及存储介质 |
CN110910892A (zh) * | 2018-09-17 | 2020-03-24 | 北京京东尚科信息技术有限公司 | 会议系统终端、音频数据处理方法和远程会议系统 |
CN109473117A (zh) * | 2018-12-18 | 2019-03-15 | 广州市百果园信息技术有限公司 | 音频特效叠加方法、装置及其终端 |
CN113053399A (zh) * | 2019-12-26 | 2021-06-29 | 浙江大搜车软件技术有限公司 | 一种多路音频混音方法及装置 |
CN112750444A (zh) * | 2020-06-30 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 混音方法、装置及电子设备 |
CN112750444B (zh) * | 2020-06-30 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 混音方法、装置及电子设备 |
CN115119111A (zh) * | 2022-06-21 | 2022-09-27 | 世邦通信股份有限公司 | 一种数字会议实现方法及系统、智能设备与数字会议系统 |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101656072A (zh) | 混音装置、混音方法及利用该混音装置的会议系统 | |
KR101443568B1 (ko) | 오디오 디코더 | |
CN101443842B (zh) | 信息信号编码 | |
EP2786552B1 (en) | Method to select active channels in audio mixing for multi-party teleconferencing | |
CA2645911C (en) | Method for encoding and decoding object-based audio signal and apparatus thereof | |
CN102016982B (zh) | 结合装置、远程通信系统以及结合方法 | |
DE69804478T2 (de) | Verfahren und vorrichtung zur codierung und decodierung mehrere tonkanäle mit geringer bitrate | |
CN101010725A (zh) | 多信道信号编码装置以及多信道信号解码装置 | |
CN102792374A (zh) | 多通道音频中语音相关通道的缩放回避的方法和系统 | |
MX2008012986A (es) | Metodos y aparatos para codificar y decodificar señales de audio basadas en objetos. | |
CN101460998A (zh) | 音频信号的线性预测编码 | |
CN101542596A (zh) | 用于编码和解码基于对象的音频信号的方法和装置 | |
KR101062353B1 (ko) | 오디오 신호의 디코딩 방법 및 그 장치 | |
CN101107505A (zh) | 语音编码装置和语音编码方法 | |
CN103262158A (zh) | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 | |
US20040022367A1 (en) | System and method for testing telecommunication devices | |
CN102395097A (zh) | 一种多声道音频信号缩混方法及系统 | |
CN111181949B (zh) | 一种声音检测方法、装置、终端设备和存储介质 | |
CN101502043A (zh) | 用于实施语音会议的方法和语音会议系统 | |
CN1682280A (zh) | 控制用来传送语音的信号中可能有害的信号的方法与系统 | |
CN1666571A (zh) | 音频处理 | |
JP2003131686A (ja) | 音声と音楽の混合比推定方法及び装置並びにそれを用いたオーディオ装置 | |
JP4437011B2 (ja) | 音声符号化装置 | |
CN103035237B (zh) | 一种中文语音信号处理方法、装置和助听设备 | |
WO2023173941A1 (zh) | 一种多声道信号的编解码方法和编解码设备以及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20100224 |