CN101785306B - 用于自动摄像机控制的方法和系统 - Google Patents

用于自动摄像机控制的方法和系统 Download PDF

Info

Publication number
CN101785306B
CN101785306B CN2008801042875A CN200880104287A CN101785306B CN 101785306 B CN101785306 B CN 101785306B CN 2008801042875 A CN2008801042875 A CN 2008801042875A CN 200880104287 A CN200880104287 A CN 200880104287A CN 101785306 B CN101785306 B CN 101785306B
Authority
CN
China
Prior art keywords
people
image
equipment
interest
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008801042875A
Other languages
English (en)
Other versions
CN101785306A (zh
Inventor
吉斯勒·昂斯塔德
简·托雷·科内柳森
珀·奥韦·胡索伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Systems International SARL
Original Assignee
Cisco Systems International SARL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Systems International SARL filed Critical Cisco Systems International SARL
Publication of CN101785306A publication Critical patent/CN101785306A/zh
Application granted granted Critical
Publication of CN101785306B publication Critical patent/CN101785306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Studio Devices (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Accessories Of Cameras (AREA)

Abstract

本发明使用视频检测技术来检测由摄像机捕捉到的视频画面中的参会者及其各自的位置,并且基于所述检测到的参会者的位置和大小来自动地确定和使用最佳摄像机朝向和变焦,使得捕捉所有参会者的最佳视图。

Description

用于自动摄像机控制的方法和系统
技术领域
本发明涉及视频会议以及摄像机朝向和变焦的自动调整。
背景技术
在大多数的高端视频会议系统中,使用具有平摆(pan)、俯仰(tilt)和变焦(zoom)能力的高质量摄像机来取景(frame)会议中的会议室和参会者的视图。这类摄像机通常具宽视野(field of view,FOV)和高机械变焦能力。这样就得到会议室的良好概图以及捕捉参会者的特写(close-up)图像的能力。来自摄像机的视频流被压缩并且被发送到视频会议中的一个或多个接收站点。会议中的所有站点都从会议中的其他站点接收直播视频和音频,因此使得能够实时地进行具有视觉和听觉信息的通信。
当谈及用途、参会者的数目、会议室的布局等,各视频会议差异很大。每个会议配置通常需要摄像机的独立调整,使得呈现最佳视图。在视频会议之前和期间都可能需要对摄像机的调整。例如,当视频会议室落座了高达16个人时,视频摄像机很自然地被预设成取景所有的16个可用座椅位置。然而,如果只有2或3个参会者出席,则摄像机设置的宽视野会给接收端非常差的视觉表现。
通常通过手动地控制摄像机平摆、俯仰和变焦,或者通过在一组预定义的摄像机位置之间进行选择,经由远程控制来完成对摄像机的调整。这些预定义的位置要手工地编制。经常地,在视频会议之前或期间,用户不希望专注于摄像机的手动控制,或者缺少经验的用户甚至可能没有意识到能够(或如何)改变摄像机视野。因此,在视频会议中,摄像机经常没有被最优地调整,而导致视频体验的降级。
因此,为了确保用于视频会议室中每个情况的良好摄像机朝向,需要一种自动视野调整系统。
存在一些具有摄像机跟踪能力的视频会议系统。然而,这些系统的目的是使摄像机自动地集中于活动的发言者。这些系统通常基于通过利用麦克风阵列的音频信号处理和/或结合图像处理的发言者定位。
一些数字视频摄像机(例如,web-cams)使用视频分析在数字平摆、俯仰和变焦的有限范围内检测、集中于并且跟随一个人的人脸。然而,这些系统仅适合于一个人,要求在初始正确布置摄像机,并且系统具有非常有限的数字工作范围。
因此,以上提到的现有技术没有描述一种用于在视频会议设置中的摄像机的自动化配置的系统。
发明内容
本发明的目的在于提供一种解决上述现有技术中的问题的至少一个的方法和系统。
包括的独立权利要求所定义的特征描述了该方法和系统的特征。
根据本发明的一个发明,提供了一种用于自动操纵与视频会议系统相关联的图像拾取设备的朝向和变焦的方法,其中,所述方法包括下述步骤:在所述图像拾取设备生成图像信号,该图像信号表示所述图像拾取设备所取景的图像,以及处理所述图像信号以识别所述图像中的对象,并且,当预定义的事件发生,则:将所述图像拾取设备操纵成初始朝向;确定所有被识别对象相对于参考点的位置以及各个被识别对象的大小;定义所述图像中的关注区域,其中所述关注区域至少包括所有被识别对象;以及操纵所述图像拾取设备来取景所定义的所述关注区域。
根据本发明的另一个方面,提供了一种用于自动操纵与视频会议系统相关联的图像拾取设备的朝向和变焦的系统,其中,所述图像拾取设备生成用来表示所述图像拾取设备所取景的图像的图像信号,其中,所述系统包括视频检测单元,所述视频检测单元被配置成处理所述图像信号以识别所述图像中的对象,并且确定所有被识别对象相对于参考点的位置以及各个被识别对象的大小,所述系统的特征在于,所述系统进一步包括:图像处理单元,所述图像处理单元被配置用来定义所述图像中的关注区域,其中,所述关注区域至少包括所有被识别对象;以及控制单元,所述控制单元被配置成当发生预定义的事件时,则:将所述图像拾取设备操纵成初始朝向,从所述图像处理单元接收与所述关注区域相对应的摄像机坐标,以及操纵所述图像拾取设备来取景所定义的所述关注区域。
附图说明
为了使更容易地理解本发明,下面的讨论将参考附图。其中
图1图示了典型的视频会议室,
图2示意性地示出了根据本发明的“最佳视图”定位器的组件,
图3是“最佳视图”定位器的操作的流程图,
图4示意性地示出了典型的会议情况以及图像拾取设备的示例性初始朝向,
图5图示了包含两个参会者的图像中的人脸检测,
图6图示了一个示例性定义的关注区域(“最佳视图”),
图7图示了另一个示例性定义的关注区域(“最佳视图”),
图8图示了图6中所述定义的区域的摄像机取景,
图9图示了在当前取景的图像外检测到的音频源,
图10图示了包括表示图9中所述音频源的参会者的摄像机取景,
图11图示了离开摄像机视野的参会者,其中
图11a图示了人离开会议;
图11b图示了人在画面的边缘附近;
图11c图示了剩下的两个人;以及
图11d图示了对于剩下的人的最佳视图。
具体实施方式
在下文中,将通过描述优选实施例并且通过参考附图来讨论本发明。然而,本领域的技术人员将认识到,其它应用和修改也落在独立权利要求所定义的本发明的范围内。
图1图示了典型的视频会议室10以及示例性视频会议系统20。视频会议系统20通常由下面的组件组成:编解码器11(用于编码和解码音频和视频信息)、用户输入设备8(即,遥控器或键盘)、图像捕捉设备6(摄像机)、音频捕捉设备4、7(麦克风)、视频显示器9(屏幕)以及音频再现设备5(扬声器)。经常地,高端视频会议系统(VCS)使用具有电动的平摆、俯仰和变焦能力的高质量摄像机6。
本发明使用视频检测技术来检测由摄像机6所捕捉到的视频画面中的参会者及其各自的位置,并且基于所检测到的参会者的位置和大小来自动地确定和使用最佳摄像机朝向和变焦,从而捕捉所有参会者的最佳视图。
可能存在关于何为视频会议中的一组参会者的“最佳视图”的很多观点。然而,在下文中,“最佳视图”是指一组参会者的特写(close-up),其中,视频画面的中心基本上与该组的中心一致,并且其中变焦的程度在所述组的周围给出非常适合的图像。然而,图像必须不能太紧密,至少显示参会者的上身,并且给予参会者在不退出视频画面的情况下稍稍移动的空间。
图2示意性地示出了根据本发明的“最佳视图”定位器52中的模块。视频检测单元30被配置成连续地检测捕捉到的视频信号的画面中的对象,例如人脸和/或人头。在预定义的事件时(例如,当接通VCS时、当通过用户输入设备8来发起时等),摄像机推远(zoom out)到其最大视野,并且移动到预定义的平摆和俯仰朝向(方位角和仰角),尽可能地捕捉系统所位于的房间10。视频检测单元30分析视频信号中的画面,并且检测视频画面中的所有的人脸/人头以及其相对于预定的和不变的参考点(例如,画面的中心)的位置。视频图像中的人脸/人头的位置和大小(或区域)被变换成摄像机坐标(方位角和仰角以及变焦系数)。将关于每个检测到的人脸/人头的信息(例如,位置、大小等)经由人脸跟踪单元35发送到图像处理单元50。基于所述人脸/人头信息,图像处理单元定义至少包括所有检测到的人脸/人头的矩形区域。预定义的一组规则规定应当如何定义这种区域,并且该区域表示画面(或视频会议室10)中的人的最佳视图。用于所定义区域的摄像机坐标(方位角和仰角以及变焦系数)及其位置被发送到控制单元45。控制单元指示摄像机控制单元12将摄像机移动到所述摄像机坐标,并且调整摄像机6的平摆、俯仰和变焦来取景与所定义区域相对应的图像。
图像拾取设备(或摄像机)6包括用于布置该图像拾取设备的摄像机控制单元12。摄像机控制单元12是包括马达的操纵机构,用于控制图像拾取设备6的平摆和俯仰朝向以及变焦的程度。摄像机控制单元12还可按要求报告其当前方位角和仰角以及变焦系数。图像处理单元50和控制单元45可以将控制信号提供给摄像机控制单元12。摄像机控制单元12使用摄像机坐标系,摄像机坐标系基于描述捕捉到的画面相对于摄像机6的方向和变焦程度的方位角和仰角以及变焦系数来指示位置。配置视频检测单元30,使得当摄像机6捕捉到画面时,使用摄像机6的方位角和仰角以及变焦系数把用视频(或图像)坐标系表达的坐标度量转换成用摄像机坐标系表达的坐标度量。
图3是“最佳视图”定位器52的操作的流程图。摄像机6输出包括一些列画面(图像)的视频信号。视频检测单元30分析该画面。在预定义的事件时,摄像机控制单元12被指示将摄像机移动到初始朝向(步骤60)。初始朝向的目的在于确保摄像机可以“看到”会议室中的所有人。已存在若干确定这样的初始朝向的方法。
参考图4,根据本发明的一个示例性实施例,摄像机推远到其最大视野,并且移动到预定义的平摆和俯仰朝向13,尽可能地捕捉房间10a和/或捕捉房间的一部分,最大可能地找到会议参会者。预定义的平摆和俯仰朝向(或初始朝向)通常通过配置功能被手动输入到系统中(例如,将摄像机手动地移动到最佳初始位置,并且然后保存位置),或者它是默认出厂值。
根据本发明的另一示例性实施例,摄像机被配置成通过检查具有最大视野的一组初始朝向(14、15)以及该组的视野重叠的位置来捕捉整个房间。在多数情况下,2个朝向构成的组就足够了。然而,朝向的数目将取决于摄像机最大视野,并且可以是3、4、5、6等。对于每个朝向(14、15)来说,视频检测单元30分析一个或多个视频画面,以检测人脸和/或人头及其各自的位置。在分析所有的朝向之后,图像处理单元50计算包括所有检测到的参会者的平摆和俯仰朝向,并且将所述计算的朝向定义为初始朝向。
视频检测单元30分析来自摄像机6的视频信号25,以检测和定位视频画面中的人脸和/或人头(步骤70)。视频检测单元30测量检测到的人脸/人头的位置与一些预定和静态参考点(例如,视频图像的中心)之间的偏移。
不同的算法可以用于对象检测。给定任意视频画面,人脸检测算法的目标在于确定图像中是否存在任何人脸,并且如果存在,则返回每个人脸图像的图像位置和区域(大小)。参考图5,根据本发明的一个示例性实施例,在图像上移动(或扫描)分析窗33。对于分析窗33的每个位置来说,至少关于典型人脸特征的存在来分析在分析窗33内的图像信息。然而,应当理解,本发明不限于使用这种类型的人脸检测。另外,还可以使用人头检测算法来检测那些人头没有朝向摄像机的参会者。
当检测人脸/人头的图像时,视频检测单元30定义所述人脸/人头的图像周围的矩形部分(或框)。根据本发明的一个实施例,所述矩形部分是所述分析窗33。相对于基于视频画面的视频坐标系来测量包含人脸/人头的图像的所述部分的位置。将视频坐标系应用于摄像机6所捕捉到的每个画面。视频坐标系具有水平或x轴以及垂直或y轴。当确定像素或图像的位置时,视频检测单元30确定该像素的或图像的视频画面的相对于x轴和y轴的位置。在本发明的一个示例性实施例中,分析窗33中心点31(窗口中间的像素)是位置参考点,并且在所述视频坐标系中由坐标x和y来定义其位置。当视频检测单元30已经计算了画面中的所有人脸/人头的位置(x,y)和大小(例如,dx=20,dy=24像素)时,视频检测单元30使用视频画面、光学和机械学的知识来针对人脸/人头的每个图像计算摄像机坐标系中的方位角和仰角中的对应位置
Figure GSB00000655492500071
以及大小
Figure GSB00000655492500072
(步骤80)。然后,将每个人脸/人头的摄像机坐标发送到人脸跟踪单元35。
人脸跟踪单元35把从当前视频画面检测到的人脸与在先前视频画面中检测到的人脸关联起来,并且因此跟踪一系列画面中检测到的人脸。只要在一系列画面中在基本上相同的位置处检测到了人脸/人头,该检测就被验证为肯定性检测。首先,这防止了错误的人脸检测,除非在若干连续视频画面中出现相同的检测。而且,如果人脸检测单元没有检测到在与先前检测到的人脸基本上相同的坐标中的人脸,图像跟踪单元不认为该人脸不存在于该图像,除非这种检测在若干连续画面中都是未检测到。这防止了错误的否定性检测。另外,这样的跟踪允许获得可能在视频画面中移动的参会者的适当位置。为了执行这样的跟踪,人脸跟踪单元35创建并且保存用于每个检测到的人脸的跟踪文件。例如,跟踪文件可以被保存在存储器设备中。
在步骤90中,图像处理单元50定义关注区域34(最佳视图)。在图6中示出了该关注区域34,其中,所述区域34至少包括在该画面中的所有检测到的人脸图像。
根据本发明的一个实施例,基于每个人脸的位置
Figure GSB00000655492500081
及其对应的大小
Figure GSB00000655492500082
图像处理单元50可以计算由一组边界(M1、M2、M3和M4)约束的第一区域,其中所述边界是从最左边人脸部分的左侧(M1)、最上边人脸部分的上侧(M3)、最右边人脸部分的右侧(M2)以及最下边人脸部分的下侧(M4)得到的。现在可以基于所述边界以摄像机坐标计算所述第一区域的中心的位置
Figure GSB00000655492500083
所述第一区域的位置是相对于参考点
Figure GSB00000655492500084
即,通常当方位角和仰角为0时的摄像机的方向的。
另外,将第一区域的宽度和高度变换成变焦系数(Zfa)。
该第一区域非常接近参会者的人脸,并且可能不表示参会者的最舒适的视图(最佳视图),尤其当如该示例性实施例中所示只有两个参会者出席时。因此,当已经计算了所述边界(M1、M2、M3和M4)时,通过将所述边界扩展一组补偿值a、b、c和d来定义第二区域(最佳视图画面34)。这些补偿值可能是相等的,或者它们可能是不同的,使得除了参会者的人头还捕捉在参会者前面的桌子。该补偿值可以是预设的和静态的,或者它们可能是计算出的以适合每个状态。
根据另一个示例性实施例,通过仅从计算的变焦系数Zfa中减去补偿值Zc、使摄像机推远额外的距离来定义最佳视图画面34。补偿值Zc可以是不变的,或者根据第一区域变焦系数Zfa的大小来线性变化。
图7示意性地示出了从初始摄像机朝向拍摄的示例性视频画面。在视频画面中检测到了3个人脸,并且图像处理单元50已经定义了最佳视图画面34,并且计算了最佳视图画面的位置
用于视频会议系统的大多数图像拾取设备6以标准电视图像宽高比(例如4∶3(1.33∶1)或16∶9(1.78∶1))来操作。由于如上所述的大多数计算的最佳视图画面34具有不同于例如4∶3或16∶9这样的标准宽高比,所以当确定变焦坐标时必须做出一些考虑。由于是区域34的最短边缘,如果摄像机拉近以捕捉精确的高度则由于摄像机的宽高比与定义的区域不同,所以大部分的区域将错过摄像机中的光敏区域(例如,图像传感器)。如果摄像机拉近以捕捉定义的区域34的精确的宽度Aα,则不会丢失信息。
因此,根据本发明的一个示例性实施例,比较最佳视图画面34的两侧
Figure GSB00000655492500094
和Aα。两侧的每一个分别在水平和垂直方向中定义配合图像画面中的关注区域所需要的变焦系数。因此,由两个计算的变焦系数中的最小一个来定义变焦程度,确保当变焦到关注区域时不会裁剪该关注区域。
在步骤100中,图像处理单元50经由控制单元45来为摄像机控制单元12提供在步骤90中所得到的摄像机布置指令
Figure GSB00000655492500095
一旦接收到摄像机布置指令,摄像机就移动并且变焦到指定的坐标,以获得视频会议中的参会者的最佳视图。图8示出了来自图6中的会议室10a的参会者1和2的最佳视图。
当摄像机已经移动到新的朝向时,它将保持该朝向,直至检测到事件(步骤110)。如前所述,仅在某些预定义的事件时才指示摄像机将摄像机移动到初始朝向(步骤60)。这样的预定义的事件可以包括,当启动视频会议系统时、当从休眠模式唤醒时、当接收和发送会议呼叫发起请求时、当经由例如遥控器或键盘由用户发起时等。通常当已经找到参会者的最佳视图时,通常不太需要改变摄像机的朝向。然而,在视频会议期间可能产生如下的情况,即,创建重新配置朝向的需要,例如,参会者的一个可能离开、新的参会者可能到达、参会者的一个改变他的/她的座位等。在这样的情况下,用户的一个当然可以通过按下遥控器上的按钮来发起重新布置(步骤60)。然而,优选的是对这样的事件的自动检测。
因此,根据本发明的一个实施例,将音频源定位用作在步骤110中的事件触发器。如上所示,图8示出了在大会议室10a中的参会者1和2的最佳视图。如可以在图8中看到的,在该视图中,摄像机已经被非常极端地拉近(zoom in),并且如果人要晚些进入会议,并且在座椅12的一个中坐下,则他/她将不会被摄像机所捕捉到。当进入会议时,很自然地自己致歉和/或介绍自己。这是礼貌的问题,并且提醒其他参会者(可能仅在音频上加入)新的参会者已经进入会议。通过使用公知的音频源定位装置7、40,视频会议系统可以检测音频源(参会者)200已经被定位在摄像机的当前视野的外部。音频源定位器40用摄像机坐标来操作。当检测到音频源并且由音频源定位器40来定位该音频源时,其将音频源坐标发送到控制单元45。如果音频源坐标在摄像机的当前视野内,则什么都不做。然而,如果音频源在当前视野外,则指示当前视野没有捕捉所有的参会者,并且重复根据步骤60-100的检测过程。可以在图10中看到该结果。因此,根据本发明的一个实施例,摄像机的当前视野外的至少一个音频源的这样的检测被视作在步骤110中触发步骤60-100的重复的事件。
音频源定位装置是公知的,并且这里将不详细讨论。它们通常是多个空间上分隔的麦克风7,并且经常基于麦克风的输出处的信号之间的延迟差的确定。如果麦克风的位置和源与不同麦克风之间的传播路径之间的延迟差是已知的,则可以计算源的位置。在美国专利号5,778,082中示出了音频源定位器的一个示例。
根据本发明的另一个实施例,另一个预定义的事件是当检测到参会者离开房间(或者视野)时。这样的检测取决于前述的跟踪功能。如图11a中所示,当参会者离开房间时,跟踪文件或跟踪历史将示出检测到的人脸的位置/定位
Figure GSB00000655492500111
在一系列画面(图11a-11b)上从位置
Figure GSB00000655492500112
改变到接近画面边缘的位置如果相同的人脸检测突然消失(不再检测人脸)并且在某个时间画面内没有返回(图11c),则该人脸检测被视作参会者离开会议。当检测这样的事件时,重复步骤60-100以将摄像机的视野调整到如图11d中所示的新的最佳视图。
根据本发明的又一实施例,另一个预定义的事件是当在视频画面的边缘附近检测到移动时。并不是每个进入视频会议的人都将立即开始讲话。这将取决于参会者的状态、职位等。因此,在系统检测到该新来的人并且相应地进行动作之前可能需要一些时间。返回参考图9,即使大多数人都在摄像机的视野外,但是也可以在视频画面中捕捉到参会者的一部分38。由于相对于静止的家具,人几乎不可能完全静止地坐着,所以视频检测单元35可以容易地将该部分38检测为图像中的移动。当检测这样的事件(在图像/画面边缘附近检测到移动)时,重复步骤60-100以将摄像机的视野调整到新的最佳视图。
根据本发明的系统提供了一种自动地获得视频会议室中的所有参会者的最佳视觉表示的新颖方法。另外,该系统自动地适应于新的情况,诸如参会者离开或进入会议室,并且相应地改变视觉表示。本发明为高质量视觉体验提供了一种更加用户友好的方法。

Claims (22)

1.一种用于自动操纵与视频会议系统相关联的图像拾取设备的朝向和变焦的方法,其中,所述方法包括下述步骤:
在所述图像拾取设备生成图像信号,该图像信号表示所述图像拾取设备所取景的图像,以及
处理所述图像信号以识别所述图像中的对象,并且,当预定义的事件发生,则:将所述图像拾取设备操纵成初始朝向;确定所有被识别对象相对于参考点的位置以及各个被识别对象的大小;定义所述图像中的关注区域,其中所述关注区域至少包括所有被识别对象;以及操纵所述图像拾取设备来取景所定义的所述关注区域。
2.根据权利要求1所述的方法,其中,操纵所述图像拾取设备来取景所定义的所述关注区域的所述步骤包括下述子步骤:
改变所述图像拾取设备的方位角和仰角,以及
改变所述图像拾取设备的变焦。
3.根据权利要求1所述的方法,其中,将所述图像拾取设备操纵成初始朝向的所述步骤进一步包括下述子步骤:
将所述图像拾取设备推远到最大视野,并且根据预定义的平摆和俯仰顺序来移动所述图像拾取设备,尽可能地取景所述图像拾取设备所在的房间。
4.根据权利要求1所述的方法,其中,所述图像信号表示视频图像的画面,并且识别对象的所述步骤进一步包括下述子步骤:
检测所述视频的画面中的人脸和/或人头的图像;
在一系列画面中跟踪所检测到的人脸和/或人头;
只有当检测发生在全部预定义数目的相继画面中时,将该检测识别为人脸和/或人头。
5.根据权利要求4所述的方法,其中,所述的定义关注区域的步骤进一步包括下述子步骤:
为第一矩形区域定义一组边界,其中,所述第一矩形区域是包括所有所述的检测到的人脸和/或人头的图像的最小可定义的区域;以及
通过用一组补偿值扩展所述一组边界来定义所述关注区域。
6.根据权利要求5所述的方法,其中,所述关注区域进一步被扩展以适合标准图像宽高比。
7.根据权利要求1所述的方法,其中,所述关注区域表示对象或对象组的特写视图。
8.根据权利要求1所述的方法,其中,所述预定义的事件包括:
接通所述视频会议系统、接收或发送会议呼叫发起请求、和/或接收来自用户的命令。
9.根据权利要求1所述的方法,其中,所述方法进一步包括:
处理来自一组音频拾取设备的音频信号,以确定音频源相对于摄像机坐标的位置。
10.根据权利要求8所述的方法,其中,所述预定义的事件包括:
检测所取景的关注区域外的音频源的存在。
11.根据权利要求1所述的方法,其中,所述预定义的事件包括:
检测参会者的一个或多个从所取景的关注区域的消失。
12.一种用于自动操纵与视频会议系统相关联的图像拾取设备的朝向和变焦的系统,其中,所述图像拾取设备生成用来表示所述图像拾取设备所取景的图像的图像信号,其中,所述系统包括视频检测单元,所述视频检测单元被配置成处理所述图像信号以识别所述图像中的对象,并且确定所有被识别对象相对于参考点的位置以及各个被识别对象的大小,
所述系统的特征在于,所述系统进一步包括:
图像处理单元,所述图像处理单元被配置用来定义所述图像中的关注区域,其中,所述关注区域至少包括所有被识别对象;以及
控制单元,所述控制单元被配置成当发生预定义的事件时,则:将所述图像拾取设备操纵成初始朝向,从所述图像处理单元接收与所述关注区域相对应的摄像机坐标,以及操纵所述图像拾取设备来取景所定义的所述关注区域。
13.根据权利要求12所述的系统,其中,所述图像信号表示视频图像的画面,并且其中,所述被识别对象是所述视频的画面中所检测到的人脸和/或人头的图像。
14.根据权利要求13所述的系统,进一步包括:
人脸跟踪单元,所述人脸跟踪单元被配置成在一系列画面中跟踪所检测到的人脸和/或人头,并且只有当检测在全部预定义数目的相继画面中发生时,将该检测识别为人脸和/或人头。
15.根据权利要求13所述的系统,其中,所述图像处理单元进一步被配置成:
为第一矩形区域定义一组边界,其中,所述第一矩形区域是包括所有所述的检测到的人脸和/或人头的图像的最小可定义的区域,以及
通过用一组补偿值扩展所述一组边界来定义所述关注区域。
16.根据权利要求15所述的系统,其中,所述关注区域进一步被扩展以适合标准图像宽高比。
17.根据权利要求13到16中的任何一项所述的系统,所述系统进一步包括:
音频源定位器,所述音频源定位器被配置成处理来自一组音频拾取设备的音频信号,以确定音频源相对于摄像机坐标的位置。
18.根据权利要求13到16中的任何一项所述的系统,其中,所述控制单元进一步被配置成:
从所述音频源定位器接收音频源坐标,
将所述音频源坐标与当前视野作比较。
19.根据权利要求13到16中的任何一项所述的系统,其中,所述图像拾取设备包括摄像机控制单元,所述摄像机控制单元用于布置所述图像拾取设备,其中,所述控制单元向所述摄像机控制单元提供控制信号来用于所述图像拾取设备的朝向和变焦,所述控制信号基于所述关注区域而生成。
20.根据权利要求13到16中的任何一项所述的系统,其中,所述预定义的事件包括:
检测在当前视野外的音频源的存在。
21.根据权利要求13到16中的任何一项所述的系统,其中,所述预定义的事件包括:
检测参会者的一个或多个从所取景的关注区域的消失。
22.根据权利要求13到16中的任何一项所述的系统,其中,所述预定义的事件包括:
检测在当前取景的关注区域外的音频源的存在。
CN2008801042875A 2007-07-13 2008-06-30 用于自动摄像机控制的方法和系统 Active CN101785306B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US94971807P 2007-07-13 2007-07-13
NO20073621 2007-07-13
NO20073621A NO327899B1 (no) 2007-07-13 2007-07-13 Fremgangsmate og system for automatisk kamerakontroll
US60/949,718 2007-07-13
PCT/NO2008/000249 WO2009011592A1 (en) 2007-07-13 2008-06-30 Method and system for automatic camera control

Publications (2)

Publication Number Publication Date
CN101785306A CN101785306A (zh) 2010-07-21
CN101785306B true CN101785306B (zh) 2012-07-18

Family

ID=40252752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801042875A Active CN101785306B (zh) 2007-07-13 2008-06-30 用于自动摄像机控制的方法和系统

Country Status (6)

Country Link
US (1) US8169463B2 (zh)
EP (1) EP2179586B1 (zh)
JP (1) JP2010533416A (zh)
CN (1) CN101785306B (zh)
NO (1) NO327899B1 (zh)
WO (1) WO2009011592A1 (zh)

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7794396B2 (en) * 2006-11-03 2010-09-14 Stryker Corporation System and method for the automated zooming of a surgical camera
AU2009236675A1 (en) * 2008-04-14 2009-10-22 Gvbb Holdings S.A.R.L. Technique for automatically tracking an object
CN101442654B (zh) * 2008-12-26 2012-05-23 华为终端有限公司 视频通信中视频对象切换的方法、装置及系统
KR20100081049A (ko) * 2009-01-05 2010-07-14 삼성전자주식회사 휴대용 단말기에서 영상 촬영 방법 및 장치
US8274544B2 (en) * 2009-03-23 2012-09-25 Eastman Kodak Company Automated videography systems
JP5446546B2 (ja) * 2009-07-28 2014-03-19 ソニー株式会社 撮像制御装置、撮像制御方法、プログラム、撮像システム
NO332170B1 (no) * 2009-10-14 2012-07-16 Cisco Systems Int Sarl Anordning og fremgangsmate for kamerakontroll
WO2011071478A1 (en) * 2009-12-07 2011-06-16 Hewlett-Packard Development Company, L.P. 3d video conference
US8395653B2 (en) * 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
CN102404584B (zh) * 2010-09-13 2014-05-07 腾讯科技(成都)有限公司 调整场景左右摄像机的方法及装置、3d眼镜、客户端
US8553934B2 (en) 2010-12-08 2013-10-08 Microsoft Corporation Orienting the position of a sensor
CN102611872B (zh) * 2011-01-19 2014-07-02 株式会社理光 基于感兴趣区域动态检测的场景影像转换系统和方法
US9191616B2 (en) 2011-05-26 2015-11-17 Microsoft Technology Licensing, Llc Local participant identification in a web conferencing system
US9030520B2 (en) * 2011-06-20 2015-05-12 Polycom, Inc. Automatic camera selection for videoconferencing
KR101811717B1 (ko) * 2011-11-14 2018-01-25 삼성전자주식회사 줌 제어 방법 및 장치와, 디지털 촬영 장치
US8892123B2 (en) 2012-03-07 2014-11-18 Microsoft Corporation Identifying meeting attendees using information from devices
EP2837211B1 (en) 2012-04-13 2017-08-30 Nokia Technologies Oy Method, apparatus and computer program for generating an spatial audio output based on an spatial audio input
CN103384319B (zh) * 2012-05-04 2018-06-15 中兴通讯股份有限公司 双流视频会议终端的图像缩放方法和系统
GB2519006B (en) * 2012-07-02 2018-05-16 Panasonic Ip Man Co Ltd Size measurement device and size measurement method
CN103581603B (zh) * 2012-07-24 2017-06-27 联想(北京)有限公司 一种多媒体数据的传输方法及电子设备
US9424859B2 (en) * 2012-11-21 2016-08-23 Harman International Industries Canada Ltd. System to control audio effect parameters of vocal signals
US9485459B2 (en) * 2012-12-14 2016-11-01 Biscotti Inc. Virtual window
US9654563B2 (en) 2012-12-14 2017-05-16 Biscotti Inc. Virtual remote functionality
GB2511730A (en) * 2013-01-28 2014-09-17 Microsoft Corp Spatially adaptive video coding
US8957940B2 (en) 2013-03-11 2015-02-17 Cisco Technology, Inc. Utilizing a smart camera system for immersive telepresence
US10750132B2 (en) * 2013-03-14 2020-08-18 Pelco, Inc. System and method for audio source localization using multiple audio sensors
CN103197491B (zh) * 2013-03-28 2016-03-30 华为技术有限公司 快速自动聚焦的方法和图像采集装置
CN103248824A (zh) * 2013-04-27 2013-08-14 天脉聚源(北京)传媒科技有限公司 一种摄像头拍摄角度的确定方法、装置及摄像系统
JP6201440B2 (ja) * 2013-06-11 2017-09-27 株式会社リコー 配置算出方法、及びプログラム
US9088689B2 (en) * 2013-06-26 2015-07-21 Avaya, Inc. Automated field of view adjustment based on screen size
US9165182B2 (en) 2013-08-19 2015-10-20 Cisco Technology, Inc. Method and apparatus for using face detection information to improve speaker segmentation
CN103458219A (zh) * 2013-09-02 2013-12-18 小米科技有限责任公司 一种视频通话面部调整方法、装置及终端设备
CN103491397B (zh) * 2013-09-25 2017-04-26 歌尔股份有限公司 一种实现自适应环绕声的方法和系统
GB201318658D0 (en) * 2013-10-22 2013-12-04 Microsoft Corp Controlling resolution of encoded video
KR20170030463A (ko) * 2014-01-10 2017-03-17 리볼브 로보틱스 인코포레이티드 화상 회의 운영 동안 로봇식 스탠드들을 제어하기 위한 시스템들 및 방법들
US9215411B2 (en) * 2014-02-03 2015-12-15 Google Inc. Enhancing video conferences
JP6642420B2 (ja) * 2014-02-26 2020-02-05 株式会社ニコン 撮像装置
US9307200B2 (en) 2014-04-10 2016-04-05 Cisco Technology, Inc. Use of face and motion detection for best view framing in video conference endpoint
US9338544B2 (en) 2014-06-03 2016-05-10 Cisco Technology, Inc. Determination, display, and adjustment of best sound source placement region relative to microphone
TW201601118A (zh) * 2014-06-26 2016-01-01 群光電子股份有限公司 畫面重心追蹤系統及其方法
US9197856B1 (en) 2014-06-26 2015-11-24 Cisco Technology Inc. Video conferencing framing preview
CN106575027B (zh) 2014-07-31 2020-03-06 麦克赛尔株式会社 摄像装置及其被摄体跟踪方法
US10291597B2 (en) 2014-08-14 2019-05-14 Cisco Technology, Inc. Sharing resources across multiple devices in online meetings
US9584763B2 (en) 2014-11-06 2017-02-28 Cisco Technology, Inc. Automatic switching between dynamic and preset camera views in a video conference endpoint
CN105592288B (zh) * 2014-11-07 2021-01-26 中兴通讯股份有限公司 实现会场画面自动调整的方法和多点控制单元
CA2874715C (en) 2014-12-15 2022-03-15 Ibm Canada Limited - Ibm Canada Limitee Dynamic video and sound adjustment in a video conference
US10542126B2 (en) 2014-12-22 2020-01-21 Cisco Technology, Inc. Offline virtual participation in an online conference meeting
US10244175B2 (en) * 2015-03-09 2019-03-26 Apple Inc. Automatic cropping of video content
US9398258B1 (en) * 2015-03-26 2016-07-19 Cisco Technology, Inc. Method and system for video conferencing units
JP6966421B2 (ja) * 2015-04-01 2021-11-17 オウル・ラブズ・インコーポレイテッドOwl Labs, Inc. 角度分離されたサブシーンの合成およびスケーリング
US9948786B2 (en) 2015-04-17 2018-04-17 Cisco Technology, Inc. Handling conferences using highly-distributed agents
JP6504899B2 (ja) * 2015-04-21 2019-04-24 キヤノン株式会社 制御装置、光学機器、撮像装置および制御方法
CN104835359A (zh) * 2015-05-14 2015-08-12 韩凤英 远程教学辅助装置
CN105204269B (zh) * 2015-07-04 2018-11-13 魅族科技(中国)有限公司 一种激光辅助对焦方法及拍摄装置
JP6547496B2 (ja) * 2015-08-03 2019-07-24 株式会社リコー 通信装置、通信方法、プログラムおよび通信システム
US10397484B2 (en) * 2015-08-14 2019-08-27 Qualcomm Incorporated Camera zoom based on sensor data
CN105357442A (zh) * 2015-11-27 2016-02-24 小米科技有限责任公司 摄像头拍摄角度调整方法及装置
US9946259B2 (en) 2015-12-18 2018-04-17 Raytheon Company Negative obstacle detector
CN105701466A (zh) * 2016-01-13 2016-06-22 杭州奇客科技有限公司 快速的全角度人脸跟踪方法
US10382701B2 (en) 2016-01-27 2019-08-13 Raytheon Company Active imaging systems and method
US10602070B2 (en) 2016-01-27 2020-03-24 Raytheon Company Variable magnification active imaging system
US9743042B1 (en) 2016-02-19 2017-08-22 Microsoft Technology Licensing, Llc Communication event
US9633270B1 (en) 2016-04-05 2017-04-25 Cisco Technology, Inc. Using speaker clustering to switch between different camera views in a video conference system
US9756286B1 (en) 2016-08-05 2017-09-05 Microsoft Technology Licensing, Llc Communication event
CN106210606A (zh) * 2016-08-10 2016-12-07 张北江 安防视频会议的头像追踪方法及系统
WO2018027698A1 (zh) * 2016-08-10 2018-02-15 张北江 安防视频会议的头像追踪方法及系统
EP3287947A1 (en) 2016-08-25 2018-02-28 Dolby Laboratories Licensing Corp. Automatic video framing of conference participants
US10592867B2 (en) 2016-11-11 2020-03-17 Cisco Technology, Inc. In-meeting graphical user interface display using calendar information and system
CN106603912B (zh) * 2016-12-05 2020-09-11 科大讯飞股份有限公司 一种视频直播控制方法及装置
US10516707B2 (en) 2016-12-15 2019-12-24 Cisco Technology, Inc. Initiating a conferencing meeting using a conference room device
US9942518B1 (en) 2017-02-28 2018-04-10 Cisco Technology, Inc. Group and conversational framing for speaker tracking in a video conference system
US10440073B2 (en) 2017-04-11 2019-10-08 Cisco Technology, Inc. User interface for proximity based teleconference transfer
US10375125B2 (en) 2017-04-27 2019-08-06 Cisco Technology, Inc. Automatically joining devices to a video conference
US10375474B2 (en) 2017-06-12 2019-08-06 Cisco Technology, Inc. Hybrid horn microphone
US10157476B1 (en) * 2017-06-15 2018-12-18 Satori Worldwide, Llc Self-learning spatial recognition system
CN109151295B (zh) * 2017-06-16 2020-04-03 杭州海康威视数字技术股份有限公司 一种目标对象抓拍方法、装置及视频监控设备
US10477148B2 (en) 2017-06-23 2019-11-12 Cisco Technology, Inc. Speaker anticipation
US10516709B2 (en) 2017-06-29 2019-12-24 Cisco Technology, Inc. Files automatically shared at conference initiation
US10706391B2 (en) 2017-07-13 2020-07-07 Cisco Technology, Inc. Protecting scheduled meeting in physical room
US10091348B1 (en) 2017-07-25 2018-10-02 Cisco Technology, Inc. Predictive model for voice/video over IP calls
JP2019029998A (ja) * 2017-07-28 2019-02-21 キヤノン株式会社 撮像装置、撮像装置の制御方法、および制御プログラム
CN107317994B (zh) * 2017-08-24 2020-08-11 维沃移动通信有限公司 一种视频通话方法及电子设备
US10372298B2 (en) 2017-09-29 2019-08-06 Apple Inc. User interface for multi-user communication session
CN109981967B (zh) * 2017-12-27 2021-06-29 深圳市优必选科技有限公司 用于智能机器人的拍摄方法、装置、终端设备及介质
CN108235816B (zh) * 2018-01-10 2020-10-16 深圳前海达闼云端智能科技有限公司 图像识别方法、系统、电子设备和计算机程序产品
EP3553629B1 (en) 2018-04-12 2024-04-10 Nokia Technologies Oy Rendering a message within a volumetric data
DK201870364A1 (en) 2018-05-07 2019-12-03 Apple Inc. MULTI-PARTICIPANT LIVE COMMUNICATION USER INTERFACE
GB201811301D0 (en) * 2018-07-10 2018-08-29 Emotech Ltd Robotic system
US10965873B1 (en) * 2018-09-24 2021-03-30 Facebook, Inc. Systems and methods for updating camera displays
US11128792B2 (en) 2018-09-28 2021-09-21 Apple Inc. Capturing and displaying images with multiple focal planes
EP3884661A4 (en) * 2018-11-22 2022-07-27 Polycom, Inc. COMMON USE OF FACE, MOTION AND UPPER BODY DETECTION IN A GROUP FRAMING
CN111461104B (zh) * 2019-01-22 2024-04-09 北京京东乾石科技有限公司 视觉识别方法、装置、设备及存储介质
NO344836B1 (en) 2019-04-08 2020-05-18 Huddly As Interpolation based camera motion for transitioning between best overview frames in live video
CN111918018B (zh) * 2019-05-08 2022-05-06 奥图码股份有限公司 视频会议系统、视频会议设备以及视频会议方法
US10951858B1 (en) * 2020-03-30 2021-03-16 Logitech Europe S.A. Advanced video conferencing systems and methods
US10965908B1 (en) 2020-03-30 2021-03-30 Logitech Europe S.A. Advanced video conferencing systems and methods
US10904446B1 (en) 2020-03-30 2021-01-26 Logitech Europe S.A. Advanced video conferencing systems and methods
US10972655B1 (en) 2020-03-30 2021-04-06 Logitech Europe S.A. Advanced video conferencing systems and methods
US11079913B1 (en) 2020-05-11 2021-08-03 Apple Inc. User interface for status indicators
CN111931564A (zh) * 2020-06-29 2020-11-13 北京大学 一种基于人脸识别的目标跟踪方法及装置
CN112211526B (zh) * 2020-09-11 2022-07-08 深圳英狮科技有限公司 一种基于会议室移动的智能服务方法及其系统
US11431891B2 (en) 2021-01-31 2022-08-30 Apple Inc. User interfaces for wide angle video conference
US11350029B1 (en) 2021-03-29 2022-05-31 Logitech Europe S.A. Apparatus and method of detecting and displaying video conferencing groups
US11778339B2 (en) 2021-04-30 2023-10-03 Apple Inc. User interfaces for altering visual media
US11893214B2 (en) 2021-05-15 2024-02-06 Apple Inc. Real-time communication user interface
US11907605B2 (en) 2021-05-15 2024-02-20 Apple Inc. Shared-content session user interfaces
US20220368548A1 (en) 2021-05-15 2022-11-17 Apple Inc. Shared-content session user interfaces
US11558209B1 (en) 2021-07-30 2023-01-17 Zoom Video Communications, Inc. Automatic spotlight in video conferencing
US11770600B2 (en) 2021-09-24 2023-09-26 Apple Inc. Wide angle video conference

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1118961A (zh) * 1994-04-06 1996-03-20 美国电报电话公司 具有综合的感知语音和视频编码的比特率视听通讯系统
WO1999006940A1 (en) * 1997-08-01 1999-02-11 Interval Research Corporation A method and apparatus for personnel detection and tracking
WO1999060788A1 (en) * 1998-05-15 1999-11-25 Picturetel Corporation Locating an audio source
CN1423487A (zh) * 2001-12-03 2003-06-11 微软公司 使用多种线索对多个人的自动探测和追踪
CN1460185A (zh) * 2001-03-30 2003-12-03 皇家菲利浦电子有限公司 用于音频/图像的说话者检测和定位的方法和装置
US20040257432A1 (en) * 2003-06-20 2004-12-23 Apple Computer, Inc. Video conferencing system having focus control

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62150341A (ja) * 1985-12-25 1987-07-04 Canon Inc カメラの自動構図決定装置
JPH0376385A (ja) * 1989-08-17 1991-04-02 Nec Eng Ltd 会議場撮影装置
JPH05219421A (ja) * 1992-01-31 1993-08-27 Nippon Hoso Kyokai <Nhk> テレビジョンカメラの制御装置
WO1995011566A1 (en) 1993-10-20 1995-04-27 Videoconferencing Systems, Inc. Adaptive videoconferencing system
US5852669A (en) * 1994-04-06 1998-12-22 Lucent Technologies Inc. Automatic face and facial feature location detection for low bit rate model-assisted H.261 compatible coding of video
US5778082A (en) 1996-06-14 1998-07-07 Picturetel Corporation Method and apparatus for localization of an acoustic source
US7057636B1 (en) 1998-12-22 2006-06-06 Koninklijke Philips Electronics N.V. Conferencing system and method for the automatic determination of preset positions corresponding to participants in video-mediated communications
JP3733258B2 (ja) * 1999-02-23 2006-01-11 キヤノン株式会社 画像撮影装置、画像撮影方法、記憶媒体、テレビ会議システム
JP2001148843A (ja) * 1999-11-18 2001-05-29 Mega Chips Corp 撮影装置及びこの撮影装置を用いた防犯システム
US6766035B1 (en) 2000-05-03 2004-07-20 Koninklijke Philips Electronics N.V. Method and apparatus for adaptive position determination video conferencing and other applications
US6611281B2 (en) 2001-11-13 2003-08-26 Koninklijke Philips Electronics N.V. System and method for providing an awareness of remote people in the room during a videoconference
JP2004193933A (ja) * 2002-12-11 2004-07-08 Canon Inc 画像拡大表示方法・装置・メディア・プログラム
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US20050080849A1 (en) * 2003-10-09 2005-04-14 Wee Susie J. Management system for rich media environments
JP2007067963A (ja) * 2005-08-31 2007-03-15 Canon Inc 撮像装置の制御システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1118961A (zh) * 1994-04-06 1996-03-20 美国电报电话公司 具有综合的感知语音和视频编码的比特率视听通讯系统
WO1999006940A1 (en) * 1997-08-01 1999-02-11 Interval Research Corporation A method and apparatus for personnel detection and tracking
WO1999060788A1 (en) * 1998-05-15 1999-11-25 Picturetel Corporation Locating an audio source
CN1460185A (zh) * 2001-03-30 2003-12-03 皇家菲利浦电子有限公司 用于音频/图像的说话者检测和定位的方法和装置
CN1423487A (zh) * 2001-12-03 2003-06-11 微软公司 使用多种线索对多个人的自动探测和追踪
US20040257432A1 (en) * 2003-06-20 2004-12-23 Apple Computer, Inc. Video conferencing system having focus control

Also Published As

Publication number Publication date
JP2010533416A (ja) 2010-10-21
US20090015658A1 (en) 2009-01-15
CN101785306A (zh) 2010-07-21
WO2009011592A1 (en) 2009-01-22
EP2179586A1 (en) 2010-04-28
EP2179586A4 (en) 2012-06-13
NO327899B1 (no) 2009-10-19
US8169463B2 (en) 2012-05-01
EP2179586B1 (en) 2017-03-15
NO20073621L (no) 2009-01-14

Similar Documents

Publication Publication Date Title
CN101785306B (zh) 用于自动摄像机控制的方法和系统
US9641585B2 (en) Automated video editing based on activity in video conference
KR101231518B1 (ko) 카메라 제어 장치, 카메라 시스템, 전자 회의 시스템 및카메라 제어 방법
CN103329518B (zh) 拍摄系统及其使用的摄像机控制装置、拍摄方法及摄像机控制方法
US8044990B2 (en) Camera controller and teleconferencing system
CN112073613B (zh) 会议人像的拍摄方法、交互平板、计算机设备及存储介质
US8456503B2 (en) Method and device for automatic camera control
KR100953029B1 (ko) 보안 시스템 및 보안 방법
US20030090564A1 (en) System and method for providing an awareness of remote people in the room during a videoconference
EP3075142A1 (en) Shift camera focus based on speaker position
JP2006523043A (ja) 監視を行なう方法及びシステム
US20020041324A1 (en) Video conference system
JP2005033570A (ja) 移動体画像提供方法、移動体画像提供システム
Cutler et al. Multimodal active speaker detection and virtual cinematography for video conferencing
CN113905204A (zh) 图像显示方法、装置、设备及存储介质
KR100711950B1 (ko) 하이브리드 광학 및 가상 주밍 장치를 사용한 관심있는물체의 실시간 트래킹
CN104349112A (zh) 视频会议装置及其方法
EP2682895A2 (en) Video display apparatus and video display method
US20200252548A1 (en) Method of generating a digital video image using a wide-angle field of view lens
JPH04309087A (ja) ビデオカメラ制御装置
KR20190110369A (ko) 지정 피사체의 자동 추적이 가능한 지능형 카메라 시스템 및 이를 이용한 영상촬영 방법
US20240284032A1 (en) Processing Method for Conference System, and Control Apparatus for Conference System
US20230401808A1 (en) Group framing in a video system
JP2011049990A (ja) インターホン装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: CISCO SYSTEMS INTERNATIONAL BV

Free format text: FORMER OWNER: TANDBERG TELECOM AS

Effective date: 20120420

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20120420

Address after: Swiss basil

Applicant after: Cisco Systems International Sarl

Address before: Norway Lv Sake

Applicant before: Tandberg Telecom AS

C14 Grant of patent or utility model
GR01 Patent grant