CN100442837C - 一种具有声音位置信息的视频通讯系统及其获取方法 - Google Patents

一种具有声音位置信息的视频通讯系统及其获取方法 Download PDF

Info

Publication number
CN100442837C
CN100442837C CNB2006100618122A CN200610061812A CN100442837C CN 100442837 C CN100442837 C CN 100442837C CN B2006100618122 A CNB2006100618122 A CN B2006100618122A CN 200610061812 A CN200610061812 A CN 200610061812A CN 100442837 C CN100442837 C CN 100442837C
Authority
CN
China
Prior art keywords
sound
source
angle
camera
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006100618122A
Other languages
English (en)
Other versions
CN1901663A (zh
Inventor
詹五洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2006100618122A priority Critical patent/CN100442837C/zh
Publication of CN1901663A publication Critical patent/CN1901663A/zh
Priority to PCT/CN2007/070207 priority patent/WO2008014697A1/zh
Priority to EP07764136.3A priority patent/EP2046032B1/en
Application granted granted Critical
Publication of CN100442837C publication Critical patent/CN100442837C/zh
Priority to US12/357,201 priority patent/US8115799B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/803Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics
    • G01S3/8034Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics wherein the signals are derived simultaneously

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Stereophonic System (AREA)

Abstract

本发明公开了一种具有声音位置信息的视频通讯系统,包括用于采集多路声音的多个麦克风,可以接收控制命令转动或调整焦距的摄像头,和摄像头及多个麦克风相连接的处理器。处理器根据多个麦克风采集的多路语音计算音源位置信息,并根据摄像头的控制信息调整音源的位置信息。本发明解决了当摄像机镜头转动时,画面中说话人的位置和采集的声音方位信息不匹配的问题,采用本发明所述的视频通讯系统,可以使得重放的声音和画面中说话人的位置实现准确的匹配。

Description

一种具有声音位置信息的视频通讯系统及其获取方法
技术领域
本发明涉及视频通讯技术领域,具体涉及一种具有声音位置信息的视频通讯系统。
背景技术
目前电视机的屏幕越来越大,此外有的视频通讯系统采用投影仪或电视墙显示,导致与会者在画面上移动的位置较大,而目前的多媒体通讯系统的声音并没有根据说话者的位置发生改变,即声音没有方位信息,导致视频通讯缺乏真实感。
在公开号为20030048353的美国专利中,公开了一种解决上述问题的方法,具体方案是:在电视机顶部放置一个长条型的装置,在该装置里有多个麦克风,多个扬声器,以及摄像头。对多个麦克风采集的声音信号进行处理之后,可以获得一个语音信号,以及一个相对于长条型装置的说话人方位信息。视频通讯系统的发送端将获得的语音信号和说话人方位信息通过网络传送到接收端,接收端根据接受到的方位信息,选择一个或多个扬声器播放,这样在接收端就可以重现说话者的方位信息。
上述专利公开的方案中,发送端采集的方位信息是相对于长条型装置的,而不是相对于摄像机镜头的。这样会带来一个问题:当转动摄像机镜头时,长条形装置正前方的说话人就在画面的旁边,甚至不在画面之内,而采集的声音方位信息还是正前方的,这样就导致画面中说话人的位置和采集的方位信息不匹配。
因此需要提供一种方法来解决上述专利中存在的当摄像机镜头转动时,画面中说话人的位置和采集的声音方位信息不匹配的问题。
发明内容
本发明的目的在于提供一种视频通讯系统及其获取方法,可以使得重放的声音和画面中说话人的位置实现准确的匹配。
为达到本发明的目的,所采取的技术方案是:
一种具有声音位置信息的视频通讯系统,所述的视频通讯系统包括:
11)两个以上麦克风,用于采集声音;
12)可以转动或调整焦距的摄像头;
13)处理器,用于根据所述麦克风采集的语音计算音源位置信息,并根据摄像头的控制信息调整音源的位置信息。
所述的音源位置信息包括水平角度、垂直角度和所述麦克风与音源之间的距离。所述的音源水平角度和垂直角度调整的方法为:
修正后的音源水平角度=音源水平角度-摄像头的水平转动角度
修正后的音源垂直角度=音源垂直角度-摄像头的垂直转动角度
所述的所述麦克风与音源之间的距离修正方法为:
修正后的所述麦克风与音源之间的距离=修正系数×所述麦克风与音源之间的距离
其中修正系数和摄像头的焦距成反比。
所述的视频通讯系统,所述处理器进一步用于将所述的音源位置信息转换成音源在画面上的相应位置。所述的音源在画面上的相应位置包括音源在画面上水平方向的相对位置和垂直方向的相对位置,分别用下式计算:
画面上水平方向相对位置=tanω/tanω0
画面上垂直方向相对位置=tanθ/tanθ0
式中ω是修正之后的音源水平方向角度,ω0是水平方向会议场景边缘偏离摄像机镜头的角度,θ是修正之后的音源垂直方向角度,θ0是垂直方向会议场景边缘偏离摄像机镜头的角度。
所述的视频通讯系统,还进一步包括下面(一)和(二)之一:
(一)、
71)发送终端将所述的音源在画面上的位置信息、所述麦克风与音源之间的距离以及声音信号发送到网络;
72)接收终端从网络接收所述的音源在画面上的位置信息、所述麦克风与音源之间的距离以及声音信号;
73)接收终端根据音源在画面上的位置信息、所述麦克风与音源之间的距离对声音信号进行处理;
74)接收终端在扬声器上播放处理过的声音信号。
(二)、
81)发送终端根据音源在画面上的位置信息、所述麦克风与音源之间的距离对声音信号进行处理;
81)发送终端将处理之后的声音信号发送到网络;
82)接收终端从网络接收处理之后的声音信号;
84)接收终端在扬声器上播放处理之后的声音信号。
所述的视频通讯系统,进一步包括:重放声音的扬声器由左右两个扬声器组成,通过调整左右声道声音的幅度,使得音源在水平方向和画面匹配,通过调整声音的总体幅度来调整声源的距离,左右两声道调整的幅度采用下面两式计算:
w’=(g1-g2)/(g1+g2)
c=g1*g1+g2*g2
式中g1是左声道幅度增益,g2是右声道幅度增益,w’是声源水平方向在画面上的相对距离,c和所述麦克风与音源之间的距离成反比,如果不调整所述麦克风与音源之间的距离,c是一个固定值。
一种和所述的视频通讯系统相对应的获取声音位置信息的方法,包括以下步骤:
91)用多个麦克风采集多路声音,并根据采集的多路语音计算音源位置信息;
92)获取摄像头控制信息;
93)根据摄像头的控制信息调整音源的位置信息。
一种和所述获取声音位置信息方法对应的装置,其特征在于,所述的装置根据麦克风采集的声音计算音源位置信息,并根据摄像头的控制信息调整音源位置信息。
采用上述技术方案,本发明有益的技术效果在于:
1)本发明采用摄像机控制信息调整音源位置信息,使得声源和画面中说话人的位置实现准确的匹配,增强的视频通讯系统的临场感。
2)本发明在对声音信号进行处理时,将声音的位置信息转换成了声源在画面上的相对位置,使得重放的声音方位不受电视机屏幕大小的影响。
附图说明
下面通过具体实施方式并结合附图对本发明作进一步的详细说明。
图1A是视频通信系统的示意图,其中发送端摄像头朝向正前方。
图1B是视频通信系统的示意图,其中发送端摄像头转动了一定的角度。
图2是调整声音位置信息的流程图。
图3是会议场景成像示意图。
图4是传递声音到远端并播放的流程图,其中对声音的处理在接收端进行。
图5是传递声音到远端并播放的流程图,其中对声音的处理在发送端进行。
具体实施方式
图1A是视频通信系统的示意图,图中110是发送端会场,111是接收端会场,109是通信网络,通信网络可以是IP网络、PSTN网络、无线网络等。在会场110中,101是摄像头,102是视频通信终端,103是电视机,104、105是参会者,112、113是扬声器。会场110中还有多个麦克风,麦克风可以是置于终端102的内部或者摄像头101的内部,也可以是独立的置于外部,通过传输线和终端102相连接,或者内部外部都有麦克风。在会场111中,106是摄像头,107是视频通信终端,108是电视机,104a、105a是参会者104、105的图像,114、115是扬声器。会场111中还有多个麦克风,麦克风可以是置于终端107的内部或者摄像头106的内部,也可以是独立的置于外部,通过传输线和终端107相连接,或者内部外部都有麦克风。发送端会场110中的摄像头101捕获图像后,传送到终端102,终端102对图像经过编码等处理之后,通过网络109传输到终端107,终端107对接收到的图像码流进行解码,并将解码之后的图像传输到电视机108上显示。会场110中的麦克风捕获声音信号之后,传递给终端102,终端102进行音频编码,通过网络109将编码后的音频码流传输给终端107,终端107对接收到的音频码流解码之后,传送给扬声器114、115重放。图1B是和图1A完全相同的视频通信系统,只是摄像头101转动了一定的角度。在图1A中,摄像头101正对参会者104,因此参会者104的图像104a也显示在电视机屏幕的中间。在图1B中,摄像头101正对参会者105,因此参会者105的图像105a显示在电视机屏幕的中间,而此时参会者104的图像104a显示在电视机屏幕的左边。
不失一般性,如果是通过内置在终端102中的多个麦克风采集的声音信号计算说话者的方位,假设当前说话者是104,由于在图1A和图1B中,说话者104相对于终端的位置都处于正前方,因此计算出的声音方位也都是正前方的,而实际上在图1B中,说话者104的图像104a已经偏移到电视机108的左边屏幕,即声音方位并没有和图像匹配,因此需要根据摄像机镜头的转动角度调整声音的方位信息。图2说明了声音位置信息的调整流程。
在图2中,步骤201用多个麦克风采集多路声音信号,步骤202对步骤201采集的多路声音信号进行处理,计算出音源的位置信息,具体来说,位置信息包括水平角度、垂直角度、距离等。用同时采集的多路声音计算音源的位置信息的技术,可以在现有的公开的文献中查到,在本发明中不再详述。步骤203收集摄像头的控制信息,所述的控制信息包括水平转动角度、垂直转动角度、焦距等。步骤204根据步骤203收集到的摄像头控制信息,调整音源的位置信息。步骤205输出调整后的音源位置信息。
用ωs、θs、Ds分别表示步骤202计算的水平角度、垂直角度和距离,用ωc、θc、f分别表示步骤203收集的摄像头的水平角度、垂直角度和焦距,用ω、θ、D分别表示步骤204中修正的水平角度、垂直角度和距离,则ω、θ、D可用下面的公式计算:
ω=ωsc    (1)
θ=θsc    (2)
D  =(f0/f)*Ds    (3)
公式(3)中f0是摄像头默认的焦距,也可以是某一个设置的值。
通常情况下,图2中的步骤201至步骤205都在发送端完成,作为一种变通的手段,步骤204和步骤205也可以在接收端完成,在这种情况下,在发送端完成的步骤201、202、203以及在接收端完成的步骤204、205还应视为同一个流程,只是在不同的终端处理。
图3是会议场景成像示意图,其中301是会议场景,302是摄像头,303是会议场景在摄像头靶面上的成像,304是会场中的一个说话者,304a是说话者304的成像,W是会议场景的宽度、H是会议场景的高度、w是成像的宽度、h是成像的高度、L是会议场景据摄像头的距离,f是摄像头的焦距,说话人的图像304a距离靶面中心的宽度和高度分别是w0和h0。此外图3中θ是说话人在垂直方向偏离镜头的角度,即修正之后的音源垂直方向角度,θ0是垂直方向会议场景边缘偏离镜头的角度,即最大能捕获图像的视角;说话人在水平方向偏离镜头的角度(即修正之后的音源水平方向角度)在图中没有画出,用ω表示,另外用ω0表示水平方向会议场景边缘偏离镜头的角度。
根据音源位置信息处理声音时,为了使声音和画面上的说话人匹配,需要将音源的位置信息转换成音源在画面上的相应位置。下面描述如何计算音源在画面上的相应位置。音源在画面上的相应位置可以用相对位置来表示,令w’和h’分别表示水平和垂直方向的相对位置,则可用下面的公式计算:
w’=w0/(w/2)(4)
h’=h0/(h/2)(5)
从图3中我们可以看出:
h0/(h/2)=(h0/f)/((h/2)/f)=tanθ/tanθ0
同理
w0/(w/2)=(w0/f)/((w/2)/f)=tanω/tanω0
因此公式(4)、(5)等价于:
w’=tanω/tanω0(6)
h’=tanθ/tanθ0(7)
公式(6)、(7)中的tanω0和tanθ0可分别用下面的两个公式计算:
tanω0=(w/2)/f    (8)
tanθ0=(h/2)/f    (9)
为了在接收端扬声器重放具有位置信息的声音,需要根据声源在画面上的相应位置以及修正后声源距离对声音进行处理。处理可在接收端进行,也可以在发送端进行,图4和图5说明了这两个不同的方案。
图4是传递声音到远端并播放的流程图,步骤401中,发送端传输声音和音源位置信息到网络,其中声音可以是一路也可以是多路,优选的方案是一路,音源位置信息指的是根据公式(3)调整的音源距离以及根据公式(6)、(7)计算的音源在画面上的相应位置,网络指的是图1A和图1B中的109;步骤402中,接收端从网络接收声音和音源位置信息;步骤403根据接收到的音源位置信息处理接收到的声音;步骤404用扬声器重放处理过的声音。
图5是传递声音到远端并播放的流程图,在步骤501中,发送端根据音源的位置信息处理传送到远端的声音,其中声音可以是一路也可以是多路,优选的方案是二路,音源位置信息指的是根据公式(3)调整的音源距离以及根据公式(6)、(7)计算的音源在画面上的相应位置;步骤502传输已被处理的声音到网络,网络指的是图1A和图1B中的109;步骤503中,接收端从网络接收已被处理的声音;步骤504用扬声器重放处理过的声音。
在图4的步骤403和图5的步骤501都需要根据音源位置信息处理声音信号,如果重放的是两个扬声器,且两个扬声器分别在电视机左右两边,一个声音处理方案是,通过调整左右声道声音的幅度,来达到音源在水平方向和画面匹配的目的,另外可通过调整声音的总体幅度来调整音源的距离,可用下面的两个公式描述具体的调整的方法:
w’=(g1-g2)/(g1+g2)(10)
c=g1*g1+g2*g2(11)
公式(10)、(11)中g1是左声道幅度增益,g2是右声道幅度增益,w’是根据公式(6)计算的声源水平方向在画面上的相对距离,如果不调整音源距离,c是一个固定值,例如可以等于1,如果需调整音源距离,c和修正的音源距离成反比,如下式所示:
c=C0/D    (12)
公式(12)中C0是一个设定的固定值,D是根据公式(3)计算的修正的音源距离。
另外一种根据音源位置信息处理声音的方法是采用HRTF(Head RelatedTransfer Functions),头部相关传输函数。采用HRTF虚拟出一个声源的技术在现有的技术文献中都已公开,在本发明中不再详述。

Claims (10)

1、一种视频通讯系统,其特征在于,该系统包括:
11)两个以上麦克风,用于采集声音;
12)可以转动或调整焦距的摄像头;
13)处理器,用于根据所述麦克风采集的语音计算音源位置信息,并根据摄像头的控制信息调整音源位置信息。
2、根据权利要求1所述的视频通讯系统,所述的音源位置信息包括水平角度、垂直角度和所述麦克风与音源之间的距离。
3、根据权利要求2所述的视频通讯系统,所述的音源水平角度和垂直角度调整的方法为:
修正后的音源水平角度=音源水平角度-摄像头的水平转动角度
修正后的音源垂直角度=音源垂直角度-摄像头的垂直转动角度
4、根据权利要求2所述的视频通讯系统,所述的所述麦克风与音源之间的距离修正方法为:
修正后的所述麦克风与音源之间的距离=修正系数×所述麦克风与音源之间的距离
其中修正系数和摄像头的焦距成反比。
5、根据权利要求1所述的视频通讯系统,所述处理器进一步用于将所述的音源位置信息转换成音源在画面上的相应位置。
6、根据权利要求5所述的视频通讯系统,所述的音源在画面上的相应位置包括音源在画面上水平方向的相对位置和垂直方向的相对位置,分别用下式计算:
画面上水平方向相对位置=tanω/tanω0
画面上垂直方向相对位置=tanθ/tanθ0
式中ω是修正之后的音源水平方向角度,ω0是水平方向会议场景边缘偏离摄像机镜头的角度,θ是修正之后的音源垂直方向角度,θ0是垂直方向会议场景边缘偏离摄像机镜头的角度。
7、根据权利要求5所述的视频通讯系统,进一步包括:一个发送终端和至少一个接收终端,所述发送终端和接收终端通过网络互通,
71)发送终端将所述的音源在画面上的位置信息、所述麦克风与音源之间的距离以及声音信号发送到网络;
72)接收终端从网络接收所述的音源在画面上的位置信息、所述麦克风与音源之间的距离以及声音信号;
73)接收终端根据音源在画面上的位置信息、所述麦克风与音源之间的距离对声音信号进行处理;
74)接收终端在扬声器上播放处理过的声音信号。
8、根据权利要求5所述的视频通讯系统,进一步包括:一个发送终端和至少一个接收终端,所述发送终端和接收终端通过网络互通,
81)发送终端根据音源在画面上的位置信息、所述麦克风与音源之间的距离对声音信号进行处理;
81)发送终端将处理之后的声音信号发送到网络;
82)接收终端从网络接收处理之后的声音信号;
84)接收终端在扬声器上播放处理之后的声音信号。
9、一种在视频通讯系统中获取声音位置信息的方法,其特征在于,包括以下步骤:
91)用麦克风采集声音,并根据采集的语音计算音源位置信息;
92)获取摄像头控制信息;
93)根据摄像头的控制信息调整音源的位置信息。
10、一种在视频通讯系统中获取声音位置信息的装置,其特征在于,所述的装置根据麦克风采集的声音计算音源位置信息,并根据摄像头的控制信息调整音源位置信息。
CNB2006100618122A 2006-07-25 2006-07-25 一种具有声音位置信息的视频通讯系统及其获取方法 Active CN100442837C (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CNB2006100618122A CN100442837C (zh) 2006-07-25 2006-07-25 一种具有声音位置信息的视频通讯系统及其获取方法
PCT/CN2007/070207 WO2008014697A1 (fr) 2006-07-25 2007-06-29 Procédé et dispositif pour obtenir des informations de position initiale acoustiques et système e communication multimédia
EP07764136.3A EP2046032B1 (en) 2006-07-25 2007-06-29 A method and an apparatus for obtaining acoustic source location information and a multimedia communication system
US12/357,201 US8115799B2 (en) 2006-07-25 2009-01-21 Method and apparatus for obtaining acoustic source location information and a multimedia communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100618122A CN100442837C (zh) 2006-07-25 2006-07-25 一种具有声音位置信息的视频通讯系统及其获取方法

Publications (2)

Publication Number Publication Date
CN1901663A CN1901663A (zh) 2007-01-24
CN100442837C true CN100442837C (zh) 2008-12-10

Family

ID=37657373

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100618122A Active CN100442837C (zh) 2006-07-25 2006-07-25 一种具有声音位置信息的视频通讯系统及其获取方法

Country Status (4)

Country Link
US (1) US8115799B2 (zh)
EP (1) EP2046032B1 (zh)
CN (1) CN100442837C (zh)
WO (1) WO2008014697A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102223594A (zh) * 2010-04-19 2011-10-19 鸿富锦精密工业(深圳)有限公司 麦克风控制装置及方法

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8085290B2 (en) * 2006-12-06 2011-12-27 Cisco Technology, Inc. System and method for displaying a videoconference
CN101132516B (zh) * 2007-09-28 2010-07-28 华为终端有限公司 一种视频通讯的方法、系统及用于视频通讯的装置
US8363512B2 (en) * 2009-02-27 2013-01-29 Honda Motors Method and apparatus for estimating sound source
US20100328419A1 (en) * 2009-06-30 2010-12-30 Walter Etter Method and apparatus for improved matching of auditory space to visual space in video viewing applications
CN102572382B (zh) * 2010-12-29 2015-04-08 南陵县生产力促进中心有限公司 摄像系统及其同步播放影像及声音的方法
PL2475193T3 (pl) * 2011-01-05 2014-06-30 Advanced Digital Broadcast Sa Sposób odtwarzania treści multimedialnej zawierającej audio i stereoskopowe video
CN102547209B (zh) * 2012-02-06 2015-07-22 华为技术有限公司 视讯设备控制方法、装置及视讯系统
CN103486997B (zh) * 2012-06-13 2017-12-15 鸿富锦精密工业(深圳)有限公司 镜头拍摄范围确定方法及系统
KR102003462B1 (ko) * 2013-04-10 2019-07-24 노키아 테크놀로지스 오와이 오디오 레코딩 및 재생 장치
WO2015008538A1 (ja) * 2013-07-19 2015-01-22 ソニー株式会社 情報処理装置および情報処理方法
CN104601637B (zh) * 2013-12-31 2018-10-30 腾讯科技(深圳)有限公司 一种数据处理方法、数据处理服务器、用户终端和系统
CN104036789B (zh) 2014-01-03 2018-02-02 北京智谷睿拓技术服务有限公司 多媒体处理方法及多媒体装置
JP2015152316A (ja) * 2014-02-10 2015-08-24 株式会社小野測器 音源可視化装置
CN104154439A (zh) * 2014-07-29 2014-11-19 浙江生辉照明有限公司 智能led照明装置及基于该装置的远程视频聊天系统
CN104253944B (zh) * 2014-09-11 2018-05-01 陈飞 基于目光连接的声音命令下达装置和方法
CN104580992B (zh) * 2014-12-31 2018-01-23 广东欧珀移动通信有限公司 一种控制方法及移动终端
CN104811610B (zh) * 2015-04-01 2017-11-17 广东欧珀移动通信有限公司 一种控制摄像头旋转的方法及装置
CN107124540A (zh) * 2016-02-25 2017-09-01 中兴通讯股份有限公司 采集处理方法、装置及系统
CN106157986B (zh) * 2016-03-29 2020-05-26 联想(北京)有限公司 一种信息处理方法及装置、电子设备
CN105847698A (zh) * 2016-05-17 2016-08-10 惠州Tcl移动通信有限公司 一种视频通讯中手动控制对方终端取景的实现方法及系统
CN108604453B (zh) * 2016-10-31 2022-11-04 华为技术有限公司 一种定向录音方法及电子设备
CN107491101A (zh) * 2017-09-14 2017-12-19 歌尔科技有限公司 一种麦克风阵列拾音角度的调节方法、装置及电子设备
FR3074584A1 (fr) * 2017-12-05 2019-06-07 Orange Traitement de donnees d'une sequence video pour un zoom sur un locuteur detecte dans la sequence
CN110719553B (zh) * 2018-07-13 2021-08-06 国际商业机器公司 具有认知声音分析和响应的智能扬声器系统
CN112073663B (zh) * 2019-06-10 2023-08-11 海信视像科技股份有限公司 音频增益调节方法、视频聊天方法及显示设备
CN111526295B (zh) * 2020-04-30 2023-02-28 臻迪科技股份有限公司 音视频处理系统、采集方法、装置、设备及存储介质
CN113994426B (zh) * 2020-05-28 2023-08-01 深圳市大疆创新科技有限公司 音频处理方法、电子设备及计算机可读存储介质
CN112533070B (zh) * 2020-11-18 2024-02-06 深圳Tcl新技术有限公司 视频声音和画面的调整方法、终端和计算机可读存储介质
CN113608449B (zh) * 2021-08-18 2023-09-15 四川启睿克科技有限公司 一种智慧家庭场景下语音设备定位系统及自动定位方法
CN115242971A (zh) * 2022-06-21 2022-10-25 海南视联通信技术有限公司 摄像头控制方法、装置、终端设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994016517A1 (en) * 1993-01-12 1994-07-21 Bell Communications Research, Inc. Sound localization system for teleconferencing using self-steering microphone arrays
JPH1084539A (ja) * 1996-09-06 1998-03-31 Nec Corp ステレオ音声テレビ会議装置
CN1257631A (zh) * 1997-03-27 2000-06-21 法国电讯公司 视频会议系统
US20020057347A1 (en) * 1996-03-13 2002-05-16 Shinya Urisaka Video/audio communication system with confirmation capability
US6469732B1 (en) * 1998-11-06 2002-10-22 Vtel Corporation Acoustic source location using a microphone array
US20030048353A1 (en) * 2001-08-07 2003-03-13 Michael Kenoyer System and method for high resolution videoconferencing
CN1460185A (zh) * 2001-03-30 2003-12-03 皇家菲利浦电子有限公司 用于音频/图像的说话者检测和定位的方法和装置
US6788337B1 (en) * 1998-03-02 2004-09-07 Nec Corporation Television voice control system capable of obtaining lively voice matching with a television scene

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5959667A (en) * 1996-05-09 1999-09-28 Vtel Corporation Voice activated camera preset selection system and method of operation
US5940118A (en) * 1997-12-22 1999-08-17 Nortel Networks Corporation System and method for steering directional microphones
US6593956B1 (en) * 1998-05-15 2003-07-15 Polycom, Inc. Locating an audio source
US7606372B2 (en) * 2003-02-12 2009-10-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for determining a reproduction position
NO318096B1 (no) 2003-05-08 2005-01-31 Tandberg Telecom As Arrangement og fremgangsmate for lokalisering av lydkilde
US20050147261A1 (en) * 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
US7667728B2 (en) * 2004-10-15 2010-02-23 Lifesize Communications, Inc. Video and audio conferencing system with spatial audio
US7473040B2 (en) * 2004-10-15 2009-01-06 Lifesize Communications, Inc. High definition camera pan tilt mechanism
US7864210B2 (en) * 2005-11-18 2011-01-04 International Business Machines Corporation System and methods for video conferencing

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994016517A1 (en) * 1993-01-12 1994-07-21 Bell Communications Research, Inc. Sound localization system for teleconferencing using self-steering microphone arrays
US20020057347A1 (en) * 1996-03-13 2002-05-16 Shinya Urisaka Video/audio communication system with confirmation capability
JPH1084539A (ja) * 1996-09-06 1998-03-31 Nec Corp ステレオ音声テレビ会議装置
CN1257631A (zh) * 1997-03-27 2000-06-21 法国电讯公司 视频会议系统
US6788337B1 (en) * 1998-03-02 2004-09-07 Nec Corporation Television voice control system capable of obtaining lively voice matching with a television scene
US6469732B1 (en) * 1998-11-06 2002-10-22 Vtel Corporation Acoustic source location using a microphone array
CN1460185A (zh) * 2001-03-30 2003-12-03 皇家菲利浦电子有限公司 用于音频/图像的说话者检测和定位的方法和装置
US20030048353A1 (en) * 2001-08-07 2003-03-13 Michael Kenoyer System and method for high resolution videoconferencing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102223594A (zh) * 2010-04-19 2011-10-19 鸿富锦精密工业(深圳)有限公司 麦克风控制装置及方法
CN102223594B (zh) * 2010-04-19 2014-02-19 鸿富锦精密工业(深圳)有限公司 麦克风控制装置及方法

Also Published As

Publication number Publication date
EP2046032B1 (en) 2020-05-27
EP2046032A4 (en) 2010-08-04
CN1901663A (zh) 2007-01-24
EP2046032A1 (en) 2009-04-08
WO2008014697A1 (fr) 2008-02-07
US20090128617A1 (en) 2009-05-21
US8115799B2 (en) 2012-02-14

Similar Documents

Publication Publication Date Title
CN100442837C (zh) 一种具有声音位置信息的视频通讯系统及其获取方法
WO2018014730A1 (zh) 一种摄像机参数调整方法、导播摄像机及系统
US10873666B2 (en) Camera tracking method and director device
US8823769B2 (en) Three-dimensional video conferencing system with eye contact
KR102277438B1 (ko) 단말 장치들 간의 멀티미디어 통신에 있어서, 오디오 신호를 송신하고 수신된 오디오 신호를 출력하는 방법 및 이를 수행하는 단말 장치
US20100238264A1 (en) Three dimensional video communication terminal, system, and method
EP2352290B1 (en) Method and apparatus for matching audio and video signals during a videoconference
CN100556151C (zh) 一种视频终端以及一种音频码流处理方法
WO2012142975A1 (zh) 会场终端音频信号处理方法及会场终端和视讯会议系统
CN107948577A (zh) 一种全景视讯会议的方法及其系统
EP2381738A1 (en) Adaptive volume adjustment method, device and communication terminal
US20050280701A1 (en) Method and system for associating positional audio to positional video
US20130340014A1 (en) Home Theater Component For A Virtualized Home Theater System
US20110193933A1 (en) Apparatus, System and Method for Video Call
WO2010022633A1 (zh) 音频信号的生成、播放方法及装置、处理系统
CN106992959A (zh) 一种3d全景音视频直播系统及音视频采集方法
KR20060107328A (ko) 촬상 장치, 음성 기록 장치 및 음성 기록 방법
US7720212B1 (en) Spatial audio conferencing system
CN101132516A (zh) 一种视频通讯的方法、系统及用于视频通讯的装置
US8743172B2 (en) Image capturing for video conference system
KR20130045553A (ko) 휴대용 단말기에서 입체 데이터를 생성하기 위한 장치 및 방법
WO2010094219A1 (zh) 一种语音信号的处理、播放方法和装置
WO2011110107A1 (zh) 即时通信中实现立体视频通信的系统及方法
JPWO2014192804A1 (ja) デコーダ及び監視システム
CN207266143U (zh) 具有usb3.0接口的语音跟踪ptz摄像机

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant