CN104934037A - 一种直录播互动系统中的音频处理方法及装置 - Google Patents

一种直录播互动系统中的音频处理方法及装置 Download PDF

Info

Publication number
CN104934037A
CN104934037A CN201510293434.XA CN201510293434A CN104934037A CN 104934037 A CN104934037 A CN 104934037A CN 201510293434 A CN201510293434 A CN 201510293434A CN 104934037 A CN104934037 A CN 104934037A
Authority
CN
China
Prior art keywords
audio
collecting device
weighted value
audio collecting
audio mixing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510293434.XA
Other languages
English (en)
Other versions
CN104934037B (zh
Inventor
顾驰
高华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codyy Education Technology Co Ltd
Original Assignee
Codyy Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codyy Education Technology Co Ltd filed Critical Codyy Education Technology Co Ltd
Priority to CN201510293434.XA priority Critical patent/CN104934037B/zh
Publication of CN104934037A publication Critical patent/CN104934037A/zh
Application granted granted Critical
Publication of CN104934037B publication Critical patent/CN104934037B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

本发明提供一种直录播互动系统中的音频处理方法及装置,上述方法包括以下步骤:采集当前图像;根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值;根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值;根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,获取混音后的音频输出值。本发明还提供一种直录播互动系统中的音频处理装置,上述装置包括:全景摄像机、音频采集设备和智能导播设备;所述全景摄像机和所述音频采集设备分别与所述智能导播设备相连。

Description

一种直录播互动系统中的音频处理方法及装置
技术领域
本发明属于音频处理领域,尤其涉及一种直录播互动系统中的音频处理方法及装置。
背景技术
在音频信号的采集和录制过程中,需对接收到的音频信号进行处理,再通过音频混音算法对采集到的多路语音信号进行混合,使混合后的语音信号中包含每一路麦克风采集到的信息,以便能够让发声者的说话信息传送给每一个参与会议的成员。
传统的音频混音算法大都是对采集到的语音信号进行分析,根据信号的强弱分配不同的混音权重值,最后进行加权求和以达到混音的目的。这种方法可以在一定程度上实现混音的效果,但是由于其使用的是后验知识,即必须首先得到语音信号才能对每路麦克风通道赋予相应的权重值,存在着处理上的滞后性和信号产生方位的不确定性,如果能够利用一些先验知识,即在得到语音信号前就分配好了每路麦克风所对应的权重值,则可以更为精准地实现混音的效果。
发明内容
本发明提供一种直录播互动系统中的音频处理方法及装置,以解决上述问题。
本发明提供一种直录播互动系统中的音频处理方法。上述方法包括以下步骤:采集当前图像;根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值;根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值;根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,获取混音后的音频输出值。
本发明还提供一种直录播互动系统中的音频处理装置,上述装置包括:全景摄像机、音频采集设备和智能导播设备;所述全景摄像机和所述音频采集设备分别与所述智能导播设备相连;所述全景摄像机,用于采集当前图像;所述音频采集设备,用于采集音频信息;所述智能导播设备,用于根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值,并根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值;所述智能导播设备还用于根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,并获取混音后的音频输出值。
相较于先前技术,根据本发明提供的直录播互动系统中的音频处理方法及装置,首先对获取到的视频图像进行分析,提取出发声者在房间内的具体位置,利用人员的位置信息提前对房间内的多个麦克风设备分配相应的混音权重值,并且可以随着人员的移动实时改变权重值的大小,精准地实现混音效果。本发明利用根据发声者实时的位置变化,能够更加准确有效地根据人员实时位置从而避免权重值变化的滞后,能够使最终的混音效果变化平缓、自然真实。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1所示为根据本发明的较佳实施例提供的直录播互动系统中的音频处理方法的流程图;
图2所示为根据本发明的较佳实施例提供的整个直录播教室的图像中教师与麦克风的位置示意图;
图3所示为根据本发明的另一较佳实施例提供的整个直录播教室的图像中教师与麦克风的位置示意图;
图4所示为根据本发明的较佳实施例提供的直录播互动系统中的音频处理装置的结构图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本发明的较佳实施例提供的直录播互动系统中的音频处理方法的流程图。如图1所示,本发明的较佳实施例提供的直录播互动系统中的音频处理方法包括步骤101-104。
步骤101:采集当前图像;
步骤102:根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值;
所述第一策略包括:建立各个音频采集设备与划分区域的对应关系;根据声源所在的区域、声源区域及音频采集设备混音权重动态分配表,确定各个音频采集设备对应的一次混音权重值。
所述声源区域及音频采集设备混音权重动态分配表包括:声源所在区域的音频采集设备对应的一次混音权重值、划分区域中非声源所在区域中的各个音频采集设备分别对应的一次混音权重值。
举例而言:在另一优选的实施例中,在确定所述当前图像中各个音频采集设备对应的一次混音权重值的方法还包括:假设声源的发出者为教师,建立教师所在区域和麦克风的混音权重动态分配表,具体如表1所示,将全景摄像头采集到的图像进行区域划分,具体如图3所示,将采集到的图像按照6个麦克风的位置划分为6个区域,每个区域分别对应着一个麦克风,假设教师在区域2中,根据混音权重动态分配表得到区域1中麦克风1对应的一次混音权重值为0.5,区域2中麦克风2对应的一次混音权重值为1,区域3中麦克风3对应的一次混音权重值0.5,区域4中麦克风4对应的一次混音权重值为0.25,区域5中麦克风5对应的一次混音权重值0.5,区域6中麦克风6对应的一次混音权重值为0.25。
表1混音权重动态分配表
所述第一策略包括:根据获取的声源与各个音频采集设备之间距离,确定各个音频采集设备对应的一次混音权重值。
根据获取的声源与各个音频采集设备之间距离,确定各个音频采集设备对应的一次混音权重值的过程为:
l i = 1 ( x i - x p ) 2 + ( y i - y p ) 2 ;
k i = l i l 1 + l 2 + l 3 + ... ... + l n ;
其中,P(xp,yp)为所述声源位置坐标,所述声源位置坐标通过运动目标检测方法实时获取;
其中,li为第i路音频采集设备位置坐标Mici(xi,yi)和声源位置坐标P(xp,yp)之间距离平方的倒数,i=1,2,3……n;
其中,ki为第i路音频采集设备的一次混音权重值。
步骤103:根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值;
根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值,获取各个音频采集设备进行一次混音权重分配后的语音信号包络值;对获取的各个音频采集设备进行一次混音权重分配后的语音信号包络值进行平滑处理;获取各个音频采集设备平滑处理后的语音信号包络值总和,并根据获取的各个音频采集设备平滑处理后的语音信号包络值总和,获取各个音频采集设备的语音信号权重值,并对所述语音信号权重值进行平滑处理,得到二次混音权重值。
根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值,获取各个音频采集设备进行一次混音权重分配后的语音信号包络值的过程为:envi=|ei|*ki;其中,ei表示第i路音频采集设备直接采集到的语音信号幅值,ki是第i路音频采集设备的一次混音权重值;envi表示第i路音频采集设备进行一次混音权重分配后的语音信号包络值。
对一次混音权重分配后的语音信号包络值envi进行平滑处理;其中,处理过程如下:Ei=envi*h+env'i*(1-h);其中,env'i表示第i路音频采集设备上一个采样点的语音信号包络值,h表示平滑系数,Ei表示第i路音频采集设备平滑处理后的语音信号包络值。
获取各个音频采集设备平滑处理后的语音信号包络值总和即及各个音频采集设备的语音信号权重值
将各个音频采集设备平滑处理后的语音信号包络值总和E与阈值Eth进行比较,并根据比较结果做出相应处理。
根据比较结果做出相应处理的过程为:
若E≤Eth,Eth表示音频采集设备语音信号包络总和的阈值,则对权重值Wi做平滑,得到二次混音权重值wi
w i = { W i * ( 1 - m 1 ) + w t h * m 1 W i &GreaterEqual; w t h W i * ( 1 - m 2 ) + w t h * m 2 W i < w t h ;
其中m1、m2表示平滑系数,wth表示权重值的阈值;
如果E>Eth,对权重值做平滑:
w i = { W i * ( 1 - m 1 ) + W i &prime; * m 1 W i &GreaterEqual; W i &prime; W i * ( 1 - m 2 ) + W i &prime; * m 2 W i < W i &prime; ;
其中W'i表示第i路音频采集设备上一个采样点所分配的权重值。
根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,获取混音后的音频输出值的过程:混音后的音频输出值
步骤104:根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,获取混音后的音频输出值。
所述方法还包括对混音后的音频输出值进行限幅处理,根据混音后的音频输出值与预设限幅的阈值上限和预设限幅的阈值下限的比较,并根据比较结果进行对应的处理,得到混音后的最终输出值。
具体而言,将混音后的音频输出值的绝对值与预设限幅的阈值上限(EH)和预设限幅的阈值下限(EL)进行比较,假设EH为1.5,EL为0.5,当|Em|<EL时,混音后的最终输出值Eout=Em;当EL≤|Em|<EH时,混音后的最终输出值当|Em|≥EH,混音后的最终输出值Eout=sign(Em),其中, s i g n ( E m ) = { 1 E m > 0 0 E m = 0 - 1 E m < 0 .
下面举例进行详细说明:
假设在直录播互动教室中,安装有1个全景摄像头用于拍摄整个录播教室的图像,在教室中的不同的位置安装6个麦克风(即n=6)并记录每个麦克风的位置坐标,得到麦克风1的坐标Mic1(53,60),麦克风2的坐标Mic2(159,60),麦克风3的坐标Mic3(265,60),麦克风4的坐标Mic4(53,180),麦克风5的坐标Mic5(159,180),麦克风6的坐标Mic6(265,180)。
假设声源的发出者为教师,通过全景摄像头获取尺寸为320×240的整个录播教室的当前帧图像如图2所示,根据运动目标检测法检测得到教师所在当前帧图像中的位置为P(120,100),根据公式计算得到麦克风1对应的按照同样方法得到麦克风2对应的l2为3.204e-4,麦克风3对应的l3为4.420e-5,麦克风4对应的l4为9.184e-5,麦克风5对应的l5为1.262e-4,麦克风6对应的l6为3.646e-5。再通过公式计算分别得到麦克风1对应的一次混音权重值k1为0.2096,麦克风2对应的一次混音权重值k2为0.4090,麦克风3对应的一次混音权重值k3为0.0564,麦克风4对应的一次混音权重值k4为0.1172,麦克风5对应的一次混音权重值k5为0.1611,麦克风6对应的一次混音权重值k6为0.0466。
假设图像的采样频率为30Hz,声音的采样频率为44.1KHz,因此当前帧图像的采样点a对应多个声音采样点,以其中一个声音采样点B为例,声音采样点B的前一个声音采样点为A,且该采样点A对应的当前帧图像的采样点a,各麦克风在声音采样点B进行采样时,麦克风1采集到的语音信号幅值为0.4,麦克风2采集到的语音信号幅值为0.6,麦克风3采集到的语音信号幅值为0.4,麦克风4采集到的语音信号幅值为0.1,麦克风5采集到的语音信号幅值为0.5,麦克风6采集到的语音信号幅值为0.1,得到麦克风1进行一次混音权重分配后的语音信号包络值为env1=|e1|*k1=0.4×0.2096=0.08384,得到麦克风2进行一次混音权重分配后的语音信号包络值为env2=|e2|*k2=0.6×0.4090=0.2454,得到麦克风3进行一次混音权重分配后的语音信号包络值为env3=|e3|*k3=0.4×0.0564=0.02256,得到麦克风4进行一次混音权重分配后的语音信号包络值为env4=|e4|*k4=0.1×0.1172=0.01172,得到麦克风5进行一次混音权重分配后的语音信号包络值为env5=|e5|*k5=0.5×0.1611=0.08055,得到麦克风6进行一次混音权重分配后的语音信号包络值为env6=|e6|*k6=0.1×0.0466=0.00466。
假设各麦克风在声音采样点A(即声音采样点B的前一个声音采样点)进行采样时,得到的一次混音权重分配后的语音信号包络值分别为env'1=0.08421、env'2=0.2412、env'3=0.0223、env'4=0.0116、env'5=0.08231、env'6=0.00435,
假设平滑系数为0.0023,得到麦克风1的E1=env1*h+env'1*(1-h)=0.08384×0.0023+0.08421×0.9977=0.084,麦克风2的E2为0.241,麦克风3的E3为0.022,麦克风4的E4为0.012,麦克风5的E5为0.082,麦克风6的E6为0.004。因此,麦克风1-6平滑处理后的语音信号包络值总和E为0.445,并通过计算得到麦克风1的语音信号权重值W1为0.189,麦克风2的W2为0.542,麦克风3的W3为0.049,麦克风4的W4为0.027,麦克风5的W5为0.184,麦克风6的W6为0.009。
假设Eth为0.85、wth为1、m1为0.9925、m2为0.9996,EH为1.5,EL为0.5,麦克风1-6平滑处理后的语音信号包络值总和E为0.445,E小于Eth,因此根据公式 w i = W i * ( 1 - m 1 ) + w t h * m 1 W i &GreaterEqual; w t h W i * ( 1 - m 2 ) + w t h * m 2 W i < w t h 对麦克风1-6的权重值Wi进行平滑,以麦克风1的权重值W1的平滑为例,W1为0.189,由于W1小于wth,因此将数值带入公式Wi*(1-m2)+wth*m2中得到二次混音权重值w1为0.9997,并根据上述公式依次得到w2为0.9998,w3为0.9996,w4为0.9996,w5为0.9997,w6为0.9996,得到混音后的音频输出值由于得到的Em的绝对值小于EL 0.5,因此对混音后的音频输出值Em进行限幅处理,得到混音后最终输出值Eout为0.491。
图4所示为根据本发明的较佳实施例提供的直录播互动系统中的音频处理装置,如图4所示,本发明的较佳实施例提供的直录播互动系统中的音频处理装置,上述装置包括:全景摄像机401、音频采集设备402和智能导播设备403;所述全景摄像机401和所述音频采集设备402分别与所述智能导播设备403相连;所述全景摄像机401,用于采集当前图像;所述音频采集设备402,用于采集音频信息;所述智能导播设备403,用于根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值,并根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值;所述智能导播设备403还用于根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,并获取混音后的音频输出值。
此外,关于上述装置的具体操作过程同上述方法所述,故于此不再赘述。
综上所述,相较于先前技术,根据本发明提供的直录播互动系统中的音频处理方法及装置,首先对获取到的视频图像进行分析,提取出发声者在房间内的具体位置,利用人员的位置信息提前对房间内的多个麦克风设备分配相应的混音权重值,并且可以随着人员的移动实时改变权重值的大小,精准地实现混音效果。本发明利用根据发声者实时的位置变化,能够更加准确有效地根据人员实时位置从而避免权重值变化的滞后,能够使最终的混音效果变化平缓、自然真实。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种直录播互动系统中的音频处理方法,其特征在于,包括以下步骤:
采集当前图像;
根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值;
根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值;
根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,获取混音后的音频输出值。
2.根据权利要求1所述的方法,其特征在于,所述第一策略包括:建立各个音频采集设备与划分区域的对应关系;根据声源所在的区域、声源区域及音频采集设备混音权重动态分配表,确定各个音频采集设备对应的一次混音权重值。
3.根据权利要求2所述的方法,其特征在于,所述声源区域及音频采集设备混音权重动态分配表包括:声源所在区域的音频采集设备对应的一次混音权重值、划分区域中非声源所在区域中的各个音频采集设备分别对应的一次混音权重值。
4.根据权利要求1所述的方法,其特征在于,所述第一策略包括:
根据获取的声源与各个音频采集设备之间距离,确定各个音频采集设备对应的一次混音权重值。
5.根据权利要求4所述的方法,其特征在于,根据获取的声源与各个音频采集设备之间距离,确定各个音频采集设备对应的一次混音权重值的过程为:
l i = 1 ( x i - x p ) 2 + ( y i - y p ) 2 ;
k i = l i l 1 + l 2 + l 3 + ... + l n ;
其中,P(xp,yp)为所述声源位置坐标,所述声源位置坐标通过运动目标检测方法实时获取;
其中,li为第i路音频采集设备位置坐标Mici(xi,yi)和声源位置坐标P(xp,yp)之间距离平方的倒数,i=1,2,3……n;
其中,ki为第i路音频采集设备的一次混音权重值。
6.根据权利要求1所述的方法,其特征在于,根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值,获取各个音频采集设备进行一次混音权重分配后的语音信号包络值;
对获取的各个音频采集设备进行一次混音权重分配后的语音信号包络值进行平滑处理;
获取各个音频采集设备平滑处理后的语音信号包络值总和,并根据获取的各个音频采集设备平滑处理后的语音信号包络值总和,获取各个音频采集设备的语音信号权重值,并对所述语音信号权重值进行平滑处理,得到二次混音权重值。
7.根据权利要求6所述的方法,其特征在于,根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值,获取各个音频采集设备进行一次混音权重分配后的语音信号包络值的过程为:envi=|ei|*ki;其中,ei表示第i路音频采集设备直接采集到的语音信号幅值,ki是第i路音频采集设备的一次混音权重值;envi表示第i路音频采集设备进行一次混音权重分配后的语音信号包络值。
8.根据权利要求7所述的方法,其特征在于,对一次混音权重分配后的语音信号包络值envi进行平滑处理;其中,处理过程如下:Ei=envi*h+env′i*(1-h);env′i表示第i路音频采集设备上一个采样点的语音信号包络值,h表示平滑系数,Ei表示第i路音频采集设备平滑处理后的语音信号包络值。
9.根据权利要求8所述的方法,其特征在于,获取各个音频采集设备平滑处理后的语音信号包络值总和即及各个音频采集设备的语音信号权重值
10.根据权利要求9所述的方法,其特征在于,将各个音频采集设备平滑处理后的语音信号包络值总和E与阈值Eth进行比较,并根据比较结果做出相应处理。
11.根据权利要求10所述的方法,其特征在于,根据比较结果做出相应处理的过程为:
若E≤Eth,Eth表示音频采集设备语音信号包络总和的阈值,则对权重值Wi做平滑,得到二次混音权重值wi
w i = W i * ( 1 - m 1 ) + w t h * m 1 W i &GreaterEqual; w t h W i * ( 1 - m 2 ) + w t h * m 2 W i < w t h ;
其中m1、m2表示平滑系数,wth表示权重值的阈值;
如果E>Eth,对权重值做平滑:
w i = W i * ( 1 - m 1 ) + W i &prime; * m 1 W i &GreaterEqual; W i &prime; W i * ( 1 - m 2 ) + W i &prime; * m 2 W i < W i &prime; ;
其中Wi'表示第i路音频采集设备上一个采样点所分配的权重值。
12.根据权利要求11所述的方法,其特征在于,根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,获取混音后的音频输出值的过程:混音后的音频输出值 E m = &Sigma; i = 1 n e i * k i * w i .
13.根据权利要求12所述的方法,其特征在于,所述方法还包括对混音后的音频输出值进行限幅处理,根据混音后的音频输出值与预设限幅的阈值上限和预设限幅的阈值下限的比较,并根据比较结果进行对应的处理,得到混音后的最终输出值。
14.一种直录播互动系统中的音频处理装置,其特征在于,上述装置包括:全景摄像机、音频采集设备和智能导播设备;所述全景摄像机和所述音频采集设备分别与所述智能导播设备相连;
所述全景摄像机,用于采集当前图像;
所述音频采集设备,用于采集音频信息;
所述智能导播设备,用于根据第一策略确定所述当前图像中各个音频采集设备对应的一次混音权重值,并根据各个音频采集设备采集的音频信息、各个音频采集设备对应的一次混音权重值确定各个音频采集设备的二次混音权重值;所述智能导播设备还用于根据各个音频采集设备的二次混音权重值、各个音频采集设备采集的音频信息,进行混音,并获取混音后的音频输出值。
CN201510293434.XA 2015-06-02 2015-06-02 一种直录播互动系统中的音频处理方法及装置 Expired - Fee Related CN104934037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510293434.XA CN104934037B (zh) 2015-06-02 2015-06-02 一种直录播互动系统中的音频处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510293434.XA CN104934037B (zh) 2015-06-02 2015-06-02 一种直录播互动系统中的音频处理方法及装置

Publications (2)

Publication Number Publication Date
CN104934037A true CN104934037A (zh) 2015-09-23
CN104934037B CN104934037B (zh) 2019-06-25

Family

ID=54121178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510293434.XA Expired - Fee Related CN104934037B (zh) 2015-06-02 2015-06-02 一种直录播互动系统中的音频处理方法及装置

Country Status (1)

Country Link
CN (1) CN104934037B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105245811A (zh) * 2015-10-16 2016-01-13 广东欧珀移动通信有限公司 一种录像方法及装置
CN107333093A (zh) * 2017-05-24 2017-11-07 苏州科达科技股份有限公司 一种声音处理方法、装置、终端及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100118201A1 (en) * 2008-11-13 2010-05-13 So-Young Jeong Sound zooming apparatus and method synchronized with moving picture zooming function
CN102045618A (zh) * 2009-10-19 2011-05-04 联想(北京)有限公司 自动调整的麦克风阵列、方法和携带麦克风阵列的装置
CN102137318A (zh) * 2010-01-22 2011-07-27 华为终端有限公司 拾音控制方法和装置
CN102404542A (zh) * 2010-09-09 2012-04-04 华为终端有限公司 多屏视频会议中对与会者图像显示进行调整的方法及装置
CN103581606A (zh) * 2012-08-09 2014-02-12 北京博威康技术有限公司 一种多媒体采集装置和方法
CN103841360A (zh) * 2013-12-11 2014-06-04 三亚中兴软件有限责任公司 分布式视频会议的实现方法及系统、终端、音视频一体化设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100118201A1 (en) * 2008-11-13 2010-05-13 So-Young Jeong Sound zooming apparatus and method synchronized with moving picture zooming function
CN102045618A (zh) * 2009-10-19 2011-05-04 联想(北京)有限公司 自动调整的麦克风阵列、方法和携带麦克风阵列的装置
CN102137318A (zh) * 2010-01-22 2011-07-27 华为终端有限公司 拾音控制方法和装置
CN102404542A (zh) * 2010-09-09 2012-04-04 华为终端有限公司 多屏视频会议中对与会者图像显示进行调整的方法及装置
CN103581606A (zh) * 2012-08-09 2014-02-12 北京博威康技术有限公司 一种多媒体采集装置和方法
CN103841360A (zh) * 2013-12-11 2014-06-04 三亚中兴软件有限责任公司 分布式视频会议的实现方法及系统、终端、音视频一体化设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105245811A (zh) * 2015-10-16 2016-01-13 广东欧珀移动通信有限公司 一种录像方法及装置
CN105245811B (zh) * 2015-10-16 2018-03-27 广东欧珀移动通信有限公司 一种录像方法及装置
CN107333093A (zh) * 2017-05-24 2017-11-07 苏州科达科技股份有限公司 一种声音处理方法、装置、终端及计算机可读存储介质
CN107333093B (zh) * 2017-05-24 2019-11-08 苏州科达科技股份有限公司 一种声音处理方法、装置、终端及计算机可读存储介质

Also Published As

Publication number Publication date
CN104934037B (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
CN101567969B (zh) 基于麦克风阵列声音制导的智能视频导播方法
US8989401B2 (en) Audio zooming process within an audio scene
CN109788382A (zh) 一种分布式麦克风阵列拾音系统及方法
DE112015003945T5 (de) Mehrquellen-Rauschunterdrückung
CN103841357A (zh) 基于视频跟踪的麦克风阵列声源定位方法、装置及系统
CN111429939B (zh) 一种双声源的声音信号分离方法和拾音器
US9591229B2 (en) Image tracking control method, control device, and control equipment
CN106356067A (zh) 录音方法、装置及终端
CN107820037A (zh) 音频信号、图像处理的方法、装置和系统
CN109874096A (zh) 一种基于智能终端选择输出的双耳麦克风助听器降噪算法
CN114563141B (zh) 一种门类密闭性能及其漏点位置的主动式检测方法
CN103248855B (zh) 基于固定机位的课程录制系统、视频处理装置和录课方法
CN110376551B (zh) 一种基于声信号时频联合分布的tdoa定位方法
CN104934037A (zh) 一种直录播互动系统中的音频处理方法及装置
CN111696515A (zh) 一种用于教学录播的音频混音方法
CN101727908B (zh) 基于混合信号局部峰值方差检测的盲源分离方法
CN105611478B (zh) 一种实时定位录音装置及方法
CN103123802B (zh) 课程录制系统及其音频处理方法
CN117573764A (zh) 一种基于5g通信技术的音视频监控方法及系统
CN107547813A (zh) 一种采集处理多路音频信号的系统和方法
CN104735582B (zh) 一种声音信号处理方法、装置及设备
CN104202694A (zh) 语音拾取装置的定向方法和系统
WO2015070790A3 (en) System and method for localization and traffic density estimation via segmentation and calibration sampling
CN110046655A (zh) 一种基于集成学习的音频场景识别方法
CN202364294U (zh) 课程录制系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190625

Termination date: 20200602