CN102969003A - 摄像声音提取方法及装置 - Google Patents

摄像声音提取方法及装置 Download PDF

Info

Publication number
CN102969003A
CN102969003A CN2012104616687A CN201210461668A CN102969003A CN 102969003 A CN102969003 A CN 102969003A CN 2012104616687 A CN2012104616687 A CN 2012104616687A CN 201210461668 A CN201210461668 A CN 201210461668A CN 102969003 A CN102969003 A CN 102969003A
Authority
CN
China
Prior art keywords
sound
signal
microphone
voice signal
target subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104616687A
Other languages
English (en)
Inventor
闫正航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Dongguan Yulong Telecommunication Technology Co Ltd
Original Assignee
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Dongguan Yulong Telecommunication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yulong Computer Telecommunication Scientific Shenzhen Co Ltd, Dongguan Yulong Telecommunication Technology Co Ltd filed Critical Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority to CN2012104616687A priority Critical patent/CN102969003A/zh
Publication of CN102969003A publication Critical patent/CN102969003A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种摄像声音提取方法及装置,所述方法包括:根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;根据公式SF(t)=vF(t)-βBvB(t)获取第一麦克风得到的最终声音信号SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取第二麦克风得到的最终声音信号SB(t);对SF(t)和SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。本发明适用于在摄像过程中对不同目标的声音进行区分和调整。

Description

摄像声音提取方法及装置
技术领域
本发明涉及通信技术领域,特别涉及一种摄像声音提取方法及装置。
背景技术
随着音频技术的发展,人们对音乐品质的要求也越来越高。现有的音频技术主要包括单声道、双声道立体声和声道环绕声。其中,单声道音频在录制过程中使用一个麦克风,播放效果仅能够体现出声音的强弱;双声道立体声音频在录制过程中模拟人的双耳,在播放时使用两个喇叭分别播放左声道和右声道录制的信号,能够使听者既感知到声音的强弱,又感知到声音的水平方位变化;声道环绕声利用多个麦克风进行录制,并且使用多个喇叭进行播放,能够让听者感知声音的空间方位,具有立体的现场感觉。
现有技术中至少存在如下问题:目前的单声道、双声道立体声以及声道环绕声只是将麦克风或麦克风阵列感知的信号还原为所录制的声音,但是对于所录制的声音并没有区分。例如,用户用智能手机为朋友所参加的某项表演比赛录像,并在录像的同时进行解说,当将其录制的声音还原时,既有解说音也有其朋友的声音,同时还有一定的干扰音源。由于用户距离手机要比其朋友近得多,所以解说声音要远大于其朋友的声音,再加上干扰音源的干扰,使得混合信号播放出来以后效果很差,无法对解说者的声音和被摄目标的声音进行清晰的分辨。
发明内容
提供一种摄像声音提取方法及装置,能够解决录像过程中由于解说者和被摄目标距离麦克风远近不同而带来的声音强度差别很大的问题,将解说声音和被摄目标声音分别清晰的播放出来,并降低干扰音源的影响。
第一方面,提供一种摄像声音提取方法,包括:
根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;
根据公式SF(t)=vF(t)-βBvB(t)获取所述第一麦克风得到的最终声音信号SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取所述第二麦克风得到的最终声音信号SB(t);
对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。
在第一种可能的实现方式中,在所述对所述SF(t)和所述SB(t)进行自动增益调整之前,还包括:
将所述vF(t)和vB(t)代入所述SF(t),得到SF(t)=sF(t)(1-βBβF)+(1-βB)n(t);将所述vF(t)和vB(t)代入所述SB(t),得到SB(t)=sB(t)(1-βBβF)+(1-βF)n(t)。将所述vF(t)和vB(t)代入所述SF(t),得到SF(t)=sF(t)(1-βBβF)+(1-βB)n(t),将所述vF(t)和vB(t)代入所述SB(t),得到SB(t)=sB(t)(1-βBβF)+(1-βF)n(t)。
可选的,所述对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)包括:
调节所述SF(t)和所述SB(t)的增益值,将调节后的SF(t)信号作为s'F(t),将调节后的SB(t)信号作为sB'(t)。
进一步的,在所述获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)之后,还包括:根据用户需要分别对所述s'F(t)和所述sB'(t)的声音强度进行调节;或者,
根据用户需要对所述s'F(t)和所述sB'(t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
第二方面,提供一种摄像声音提取装置,包括:
第一信号获取单元,用于根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;
第二信号获取单元,用于根据公式SF(t)=vF(t)-βBvB(t)获取所述第一麦克风得到的最终声音信号SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取所述第二麦克风得到的最终声音信号SB(t);
调整单元,用于对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。
在第一种可能的实现方式中,所述第二信号获取单元还包括:
第一计算子单元,用于将所述vF(t)和vB(t)代入所述SF(t),得到SF(t)=sF(t)(1-βBβF)+(1-βB)n(t);
第二计算子单元,用于将所述vF(t)和vB(t)代入所述SB(t),得到SB(t)=sB(t)(1-βBβF)+(1-βF)n(t)。
可选的,所述调整单元还用于:
调节所述SF(t)和所述SB(t)的增益值,将调节后的SF(t)信号作为s'F(t),将调节后的SB(t)信号作为sB'(t)。
进一步的,所述装置还包括:
第一音量调节单元,用于根据用户需要分别对所述s'F(t)和所述sB'(t)的声音强度进行调节;或者,
第二音量调节单元,用于根据用户需要对所述s'F(t)和所述sB'(t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声音和被摄目标的声音,可以在视频中播放解说者的声音和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例一提供的方法流程图;
图2为本发明实施例二提供的方法流程图;
图3为本发明实施例二提供的解说者和被拍摄者的空间位置示意图;
图4为本发明实施例二提供的音量调节示意图;
图5、图6为本发明实施例三提供的装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。
实施例一
本实施例提供一种摄像声音提取方法,如图1所示,所述方法包括:
101、获取第一麦克风得到的初始声音信号vF(t)和第二麦克风得到的初始声音信号vB(t)。
例如,根据公式vF(t)=sF(t)+βBsB(t)+n(t)得到vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)得到vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号。
102、根据vF(t)和vB(t)获取第一麦克风得到的最终声音信号SF(t)以及获取第二麦克风得到的最终声音信号SB(t)。
例如,根据公式SF(t)=vF(t)-βBvB(t)获取SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取SB(t)。将所述vF(t)和vB(t)代入所述SF(t),得到SF(t)=sF(t)(1-βBβF)+(1-βB)n(t),将所述vF(t)和vB(t)代入所述SB(t),得到SB(t)=sB(t)(1-βBβF)+(1-βF)n(t)。
103、对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。
例如,所述对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)包括:调节所述SF(t)和所述SB(t)的信号增益值,将调节后的SF(t)信号作为s'F(t),将调节后的SB(t)信号作为sB'(t)。
可选的,在无解说音时,将SF(t)=sF(t)(1-βBβF)+(1-βB)n(t)式中的βB调整为1,将βF调整为0,获得被摄目标的声音信号SF(t)=sF(t)。
进一步的,在所述获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)之后,还包括:
根据用户需要分别对所述s'F(t)和所述sB'(t)的声音强度进行调节;或者,
根据用户需要对所述s'F(t)和所述sB'(t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声音和被摄目标的声音,可以在视频中播放解说者的声音和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。
实施例二
本实施例提供一种摄像声音提取方法,以通过智能终端进行摄像为例,如图2所示,所述方法包括:
201、通过后置麦克风接收被拍摄者的初始声音信号sF(t),同时通过前置麦克风接收解说者的初始声音信号sB(t)。
例如,如图3所示,当用智能终端对目标进行摄像时,因为解说者(一般来说即为摄像者)位于终端的正面,距离前置的麦克风较近,而目标位于终端背面,距离后置的麦克风较近,所以为了提取更加清晰的声音,使用终端正面前置的麦克风接收解说者的声音信号,使用终端背面(与摄像头同侧)后置的麦克风接收目标的声音信号。
当然,由于声音的传播特性,前置的麦克风在接收解说者声音信号的同时,也会接收到一定的被拍摄者的声音信号。同理,后置麦克风也接收到解说者的声音信号。再加上不可避免的噪声信号,所以需要综合考虑,利用步骤202得到一个总的声音信号
202、获取第一麦克风得到的初始声音信号vF(t)和第二麦克风得到的初始声音信号vB(t)。
例如,根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t)。其中,βB为解说声音到第一麦克风的衰减系数,βBsB(t)即为后置麦克风接收到的经过衰减的解说者的声音信号,βF为被摄目标声音到第二麦克风的衰减系数,βFsF(t)即为前置麦克风接收到的经过衰减的被拍摄者的声音信号,n(t)为噪声信号。可选的,默认被拍摄者与后置麦克风之间的声音传播信道为1,默认解说者与前置麦克风之间的声音传播信道为1。
其中,经过此步骤得出的vF(t)和vB(t)为混合的声音信号,如果按照此信号进行声音的还原,那么用户听到的声音将会十分嘈杂,不一定能分辨出解说者和被拍摄者的声音,所以需要利用步骤203对这两个声音信号作进一步的处理。
需要说明的是,两个衰减系数βB和βF,是根据时域和频域的匹配算法估计出来的,该匹配算法为本领域人员所熟知的现有技术,此处不再对其进行详细的说明。
203、构造信号SF(t)和SB(t)。其中,SF(t)为后置麦克风获得的被拍摄者的最终声音信号,SB(t)为前置麦克风获得的解说者的最终声音信号。
例如,使用公式SF(t)=vF(t)-βBvB(t)得到信号SF(t),利用此公式可以消除解说者给后置麦克风带来的声音干扰,将步骤202得到的vF(t)和vB(t)代入该公式,得到:SF(t)=sF(t)-βBβFsF(t)+(1-βB)n(t),经过整理后得到:SF(t)=sF(t)(1-βBβF)+(1-βB)n(t),可以看出经过整理后的公式中并没有解说者的初始声音信号sB(t),只包括被拍摄者的初始声音信号和噪声信号。
同理,使用公式SB(t)=vB(t)-βFvF(t)得到信号SB(t),利用此公式可以消除被拍摄者给前置麦克风带来的声音干扰,将步骤202得到的vF(t)和vB(t)代入该公式,得到:SB(t)=sB(t)-βBβFsB(t)+(1-βF)n(t),经过整理后得到:SB(t)=sB(t)(1-βBβF)+(1-βF)n(t),可以看出经过整理后的公式中并没有被拍摄者的初始声音信号sF(t),只包括解说者的初始声音信号和噪声信号。
进一步的,执行步骤204,对整理后的声音信号进行微调,消除噪声的干扰,最大化的提取解说者和被拍摄者的声音信号。
204、对信号SF(t)和SB(t)进行自动增益调整。
例如,调整SF(t)和SB(t)的增益值,将最清晰的SF(t)信号作为s'F(t),将最清晰的SB(t)信号作为sB'(t)。
可选的,当仅有被拍摄者的声音,并没有解说时,可以令βB为1,令βF为0,获得被拍摄者的声音信号SF(t)=s'F(t),即仅存在清晰的被拍摄者的声音,噪声几乎为0。在此种情形下,能够显著降低周围噪声对摄像的影响,提高录制效果。
205、对被拍摄者的声音信号和解说者的声音信号进行还原。
206、根据用户需要对被拍摄者的声音强度和解说者的声音强度进行调节。
可选的,在实际播放时,可以根据用户喜好只播放被拍摄者的声音,或者只播放解说者的声音,或者同时播放二者的声音。例如,在进行调节时,如图4所示,调节方案A中,可以分别对解说音和目标音(被拍摄者的声音)进行调节,二者的调节互不干扰;调解方案B中,对解说音和目标音进行联动调节,即当调高解说音时目标音降低相应的音量,反之亦然;调解方案C中,使用旋钮对解说音和目标音进行联动调节,能够达到和方案B相同的效果。
与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声音和被摄目标的声音,可以在视频中播放解说者的声音和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。
实施例三
本实施例提供一种摄像声音提取装置30,如图5所示,所述装置30包括:
第一信号获取单元31,用于根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;
第二信号获取单元32,用于根据公式SF(t)=vF(t)-βBvB(t)获取所述第一麦克风得到的最终声音信号SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取所述第二麦克风得到的最终声音信号SB(t);
调整单元33,用于对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。
进一步的,如图6所示,所述第二信号获取单元32还可以包括:
第一计算子单元321,用于将所述vF(t)和vB(t)代入所述SF(t),得到SF(t)=sF(t)(1-βBβF)+(1-βB)n(t);
第二计算子单元322,用于将所述vF(t)和vB(t)代入所述SB(t),得到SB(t)=sB(t)(1-βBβF)+(1-βF)n(t)。
进一步的,如图6所示,所述调整单元33还用于:
调整所述SF(t)和所述SB(t)的增益值,将调整后的SF(t)信号作为s'F(t),将调整后的SB(t)信号作为sB'(t)。
进一步的,如图6所示,所述装置30还可以包括:
第一音量调节单元34,用于根据用户需要分别对所述s'F(t)和所述sB'(t)的声音强度进行调节;或者,
第二音量调节单元35,用于根据用户需要对所述s'F(t)和所述sB'(t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
其中,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
与现有技术相比,本发明实施例首先通过两个麦克风获取解说音初始信号和被摄目标初始信号;然后利用新的算法消除解说音初始信号中被摄目标的干扰信号,消除被摄目标初始信号中解说音的干扰信号,通过公式变换获得二者最终的声音信号;最后通过自动增益调整,消除噪声信号的干扰,获得清晰的被摄目标声音和解说者的声音。能够获得清晰的解说者的声音和被摄目标的声音,可以在视频中播放解说者的声音和/或被摄目标的声音,消除了解说者和被摄目标由于距离麦克风的远近差异带来的声音强弱影响,并降低周围环境噪声的影响,提高用户体验。
本发明实施例提供的摄像声音提取装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。本发明实施例提供的摄像声音提取方法及装置可以适用于在摄像过程中对不同目标的声音进行区分和调整,但不仅限于此。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种摄像声音提取方法,其特征在于,包括:
根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;
根据公式SF(t)=vF(t)-βBvB(t)获取所述第一麦克风得到的最终声音信号SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取所述第二麦克风得到的最终声音信号SB(t);
对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。
2.根据权利要求1所述的方法,其特征在于,在所述对所述SF(t)和所述SB(t)进行自动增益调整之前,还包括:
将所述vF(t)和vB(t)代入所述SF(t),得到SF(t)=sF(t)(1-βBβF)+(1-βB)n(t);将所述vF(t)和vB(t)代入所述SB(t),得到SB(t)=sB(t)(1-βBβF)+(1-βF)n(t)。
3.根据权利要求2所述的方法,其特征在于,所述对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)包括:
调节所述SF(t)和所述SB(t)的信号增益值,将调节后的SF(t)信号作为s'F(t),将调节后的SB(t)信号作为sB'(t)。
4.根据权利要求1所述的方法,其特征在于,在所述获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)之后,还包括:
根据用户需要分别对所述s'F(t)和所述sB'(t)的声音强度进行调节;或者,
根据用户需要对所述s'F(t)和所述sB'(t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
6.一种摄像声音提取装置,其特征在于,包括:
第一信号获取单元,用于根据公式vF(t)=sF(t)+βBsB(t)+n(t)获取第一麦克风得到的初始声音信号vF(t),根据公式vB(t)=sB(t)+βFsF(t)+n(t)获取第二麦克风得到的初始声音信号vB(t),其中,sF(t)为被摄目标的初始声音信号,sB(t)为解说初始声音信号,βB为解说声音到第一麦克风的衰减系数,βF为被摄目标声音到第二麦克风的衰减系数,n(t)为噪声信号;
第二信号获取单元,用于根据公式SF(t)=vF(t)-βBvB(t)获取所述第一麦克风得到的最终声音信号SF(t),根据公式SB(t)=vB(t)-βFvF(t)获取所述第二麦克风得到的最终声音信号SB(t);
调整单元,用于对所述SF(t)和所述SB(t)进行自动增益调整,获得被摄目标的声音信号s'F(t)和解说声音信号sB'(t)。
7.根据权利要求6所述的装置,其特征在于,所述第二信号获取单元还包括:
第一计算子单元,用于将所述vF(t)和vB(t)代入所述SF(t),得到SF(t)=sF(t)(1-βBβF)+(1-βB)n(t);
第二计算子单元,用于将所述vF(t)和vB(t)代入所述SB(t),得到SB(t)=sB(t)(1-βBβF)+(1-βF)n(t)。
8.根据权利要求7所述的装置,其特征在于,所述调整单元还用于:
调节所述SF(t)和所述SB(t)的增益值,将调节后的SF(t)信号作为s'F(t),将调节后的SB(t)信号作为sB'(t)。
9.根据权利要求6所述的装置,其特征在于,还包括:
第一音量调节单元,用于根据用户需要分别对所述s'F(t)和所述sB'(t)的声音强度进行调节;或者,
第二音量调节单元,用于根据用户需要对所述s'F(t)和所述sB'(t)的声音强度进行联动调解,当调高其中一个信号的声音强度时,另一个信号的声音强度相应降低。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述第一麦克风与被摄目标的距离小于所述第二麦克风与所述被摄目标的距离;所述第一麦克风与解说者的距离大于所述第二麦克风与所述解说者的距离。
CN2012104616687A 2012-11-15 2012-11-15 摄像声音提取方法及装置 Pending CN102969003A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012104616687A CN102969003A (zh) 2012-11-15 2012-11-15 摄像声音提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012104616687A CN102969003A (zh) 2012-11-15 2012-11-15 摄像声音提取方法及装置

Publications (1)

Publication Number Publication Date
CN102969003A true CN102969003A (zh) 2013-03-13

Family

ID=47799104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012104616687A Pending CN102969003A (zh) 2012-11-15 2012-11-15 摄像声音提取方法及装置

Country Status (1)

Country Link
CN (1) CN102969003A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016127506A1 (zh) * 2015-02-09 2016-08-18 宇龙计算机通信科技(深圳)有限公司 语音处理方法、语音处理装置和终端
CN107331407A (zh) * 2017-06-21 2017-11-07 深圳市泰衡诺科技有限公司 下行通话降噪方法及装置
CN107885329A (zh) * 2015-05-19 2018-04-06 广东欧珀移动通信有限公司 一种旋转摄像头调节方法及用户终端
CN108109630A (zh) * 2016-11-23 2018-06-01 中兴通讯股份有限公司 一种音频的处理方法、装置和媒体服务器
WO2020051841A1 (en) * 2018-09-13 2020-03-19 Alibaba Group Holding Limited Human-machine speech interaction apparatus and method of operating the same
CN111405416A (zh) * 2020-03-20 2020-07-10 北京达佳互联信息技术有限公司 立体声录制方法、电子设备及存储介质
WO2022062531A1 (zh) * 2020-09-25 2022-03-31 Oppo广东移动通信有限公司 一种多通道音频信号获取方法、装置及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
CN1277756A (zh) * 1997-09-05 2000-12-20 乌尔夫·林格伦 用于信号分离的设备
JP2006197552A (ja) * 2004-12-17 2006-07-27 Univ Waseda 音源分離システムおよび音源分離方法、並びに音響信号取得装置
CN101192411A (zh) * 2007-12-27 2008-06-04 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
CN1277756A (zh) * 1997-09-05 2000-12-20 乌尔夫·林格伦 用于信号分离的设备
JP2006197552A (ja) * 2004-12-17 2006-07-27 Univ Waseda 音源分離システムおよび音源分離方法、並びに音響信号取得装置
CN101192411A (zh) * 2007-12-27 2008-06-04 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016127506A1 (zh) * 2015-02-09 2016-08-18 宇龙计算机通信科技(深圳)有限公司 语音处理方法、语音处理装置和终端
CN107885329A (zh) * 2015-05-19 2018-04-06 广东欧珀移动通信有限公司 一种旋转摄像头调节方法及用户终端
CN107885329B (zh) * 2015-05-19 2021-04-16 Oppo广东移动通信有限公司 一种旋转摄像头调节方法及用户终端
CN108109630A (zh) * 2016-11-23 2018-06-01 中兴通讯股份有限公司 一种音频的处理方法、装置和媒体服务器
CN108109630B (zh) * 2016-11-23 2022-01-25 中兴通讯股份有限公司 一种音频的处理方法、装置和媒体服务器
CN107331407A (zh) * 2017-06-21 2017-11-07 深圳市泰衡诺科技有限公司 下行通话降噪方法及装置
CN107331407B (zh) * 2017-06-21 2020-10-16 深圳市泰衡诺科技有限公司 下行通话降噪方法及装置
WO2020051841A1 (en) * 2018-09-13 2020-03-19 Alibaba Group Holding Limited Human-machine speech interaction apparatus and method of operating the same
CN111405416A (zh) * 2020-03-20 2020-07-10 北京达佳互联信息技术有限公司 立体声录制方法、电子设备及存储介质
CN111405416B (zh) * 2020-03-20 2022-06-24 北京达佳互联信息技术有限公司 立体声录制方法、电子设备及存储介质
WO2022062531A1 (zh) * 2020-09-25 2022-03-31 Oppo广东移动通信有限公司 一种多通道音频信号获取方法、装置及系统

Similar Documents

Publication Publication Date Title
CN102969003A (zh) 摄像声音提取方法及装置
CN105530580B (zh) 听力系统
US8699742B2 (en) Sound system and a method for providing sound
CN104185130B (zh) 具有空间信号增强的助听器
US20050281421A1 (en) First person acoustic environment system and method
KR101546514B1 (ko) 오디오 시스템 및 그의 동작 방법
US20100329490A1 (en) Audio device and method of operation therefor
US10880659B2 (en) Providing and transmitting audio signal
US9756437B2 (en) System and method for transmitting environmental acoustical information in digital audio signals
EP2759978A2 (en) Method for providing a compensation service for characteristics of an audio device using a smart device
CN106792365B (zh) 一种音频播放方法及装置
EP3020212A1 (en) Pre-processing of a channelized music signal
JP5320303B2 (ja) 音響再生装置および映像音響再生システム
CN109218948B (zh) 助听系统、系统信号处理单元及用于产生增强的电音频信号的方法
WO2013111038A1 (en) Generation of a binaural signal
US11863949B2 (en) Directional sound recording and playback
US20190182557A1 (en) Method of presenting media
US11297454B2 (en) Method for live public address, in a helmet, taking into account the auditory perception characteristics of the listener
CN115460526B (zh) 一种听力模型的确定方法、电子设备及系统
CN112673648B (zh) 处理装置、处理方法、再现方法以及存储介质
CN113949981A (zh) 在涉及听力设备的电子设备处执行的方法
CN113611272A (zh) 基于多移动终端的扬声方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130313