CN1713717A - 摄像机拍摄方位数字声控定向方法 - Google Patents

摄像机拍摄方位数字声控定向方法 Download PDF

Info

Publication number
CN1713717A
CN1713717A CN 200410049724 CN200410049724A CN1713717A CN 1713717 A CN1713717 A CN 1713717A CN 200410049724 CN200410049724 CN 200410049724 CN 200410049724 A CN200410049724 A CN 200410049724A CN 1713717 A CN1713717 A CN 1713717A
Authority
CN
China
Prior art keywords
terminal
video camera
orientation
speech
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200410049724
Other languages
English (en)
Other versions
CN100420298C (zh
Inventor
焉勇
杨劲松
付天禹
施健标
付群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vimicro Corp
Original Assignee
Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vimicro Corp filed Critical Vimicro Corp
Priority to CNB2004100497241A priority Critical patent/CN100420298C/zh
Publication of CN1713717A publication Critical patent/CN1713717A/zh
Application granted granted Critical
Publication of CN100420298C publication Critical patent/CN100420298C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及视频、音频通讯领域,并具体的公开了一种摄像机拍摄方位数字声控定向方法。包括步骤:(1)建立终端方位映射表;(2)各终端上的声音采集设备采集声音数据,并转换为数字信号,经IP网络传送到控制主机;(3)控制主机对语音数字信号实时检测,并对各终端送来的语音数据进行分析,获得各终端上语音音量值;(4)将各终端的语音音量进行比较,获得当前发言终端;(5)判断当前发言者是否已经处在摄像机拍摄范围之中,如果在摄像机拍摄范围之中,则回到步骤(3)、否则,到步骤(6);(6)以当前终端参数调整摄像机拍摄方位,回到步骤(3)。

Description

摄像机拍摄方位数字声控定向方法
技术领域
本发明涉及视频、音频通讯领域,具体地说,是涉及一种摄像机拍摄方位数字声控定向方法。
背景技术
目前,在视频、语音通讯领域里,多点会议系统大多采用的是每一个终端配备一件视频采集设备的模式。这种模式由于其架构直观,实现简单,因此已经被业内广泛采纳。但是,随着视频会议系统中终端数量的增加,一个终端配备一件视频采集设备这种模式的缺点也逐渐暴露出来。
首先,当视频会议系统中终端的数量出现增长时,接入的视频采集设备的数量也将会随之增加,从而导致了整个系统的成本也直线上升。
其次,在整个视频会议系统架构中,最宝贵的资源就是网络带宽,它将直接决定视频会议的终端负载数量,影响会议的通讯效果。而在整个视频会议系统的通讯数据中,视频数据就占据了整个数据传输量的70%以上。以常见的分辨率320×240为例,在每秒钟10帧的采样率下,通过MPEG4进行编码,每路视频仍然要占200K左右的网络带宽。目前国内很多企业、单位的Internet公网出口网络带宽都为2M,所以如果不想方设法降低视频会议对网络带宽的占有量,将会大大限制会议终端的数量,影响会议沟通质量。为了解决多路视频传输对网络带宽的占用问题,业界流行的做法是制订一套会议规则,谁获得了发言权,谁的视频数据才会向外界传输。在整个会议中,对同时发言的人数再做出限制,从而也就限制了视频数据对网络带宽的占用。这样做,仅仅能够被动的解决网络带宽问题,并且,在会议中对同时发言的人数做出限制,也使得会议成员在获得发言权之前,要进行发言申请和排队,整个沟通过程变得复杂而冗长,丧失了语言沟通本应具有的快捷、酣畅的特点,直接影响了会议沟通效果。
发明内容
本发明的目的是提供一种摄像机拍摄方位数字声控定向方法,以减少现有技术中,对多视频源应用系统摄像设备的数量需求,并且可以大量节省数据传输带宽。
为达到上述目的,本发明提供方案如下:
摄像机拍摄方位数字声控定向方法,包括以下步骤:
(1)、建立终端方位映射表;
(2)、各终端上的声音采集设备采集声音数据,并转换为数字信号,经IP网络传送到控制主机;
(3)、控制主机对语音数字信号实时检测,并对各终端送来的语音数据进行分析,获得各终端上语音音量值;
(4)、将各终端的语音音量进行比较,获得当前发言终端;
(5)、判断当前发言者是否已经处在摄像机拍摄范围之中,如果在摄像机拍摄范围之中,则回到步骤(3)、否则,到步骤(6);
(6)、以当前终端参数调整摄像机拍摄方位,回到步骤(3)。
本发明所述的摄像机拍摄方位数字声控定向方法,所述步骤(1)中所述的状态表结构包括:终端号字段、终端相对于摄像机的方位参数字段。
本发明所述的摄像机拍摄方位数字声控定向方法,所述步骤(4)中所述的各终端的语音音量进行比较,包括步骤:
(1)、比较并获得每个终端在各采样点的最高音量数据;
(2)、将各终端的最高音量数据进行比较,得到具有最高音量数据的终端号。
与现有技术相比,本发明的优点在于:
利用本发明的定向方法,可以减少视频会议等多视频源应用系统对摄像设备数量需求,从而节省了大量的数据传输带宽;并且该方法对语音自动响音精度高,抗干扰能力强。
本发明的目的、特点及优点将参照附图,结合具体实施方式作进一步的说明。
附图说明
图1是本发明所述方法的流程框图;
图2是本发明优选实施例的结构框图;
图3是终端方位影射表结构框图。
具体实施方式
参照附图1,摄像机拍摄方位数字声控定向方法,包括以下步骤:
(1)、建立终端方位映射表;
(2)、各终端上的声音采集设备采集声音数据,并转换为数字信号,经IP网络传送到控制主机;
(3)、控制主机对语音数字信号实时检测,并对各终端送来的语音数据进行分析,获得各终端上语音音量值;
(4)、将各终端的语音音量进行比较,获得当前发言终端;
(5)、判断当前发言者是否已经处在摄像机拍摄范围之中,如果在摄像机拍摄范围之中,则回到步骤(3)、否则,到步骤(6);
(6)、以当前终端参数调整摄像机拍摄方位,回到步骤(3)。
本发明所述的摄像机拍摄方位数字声控定向方法,所述步骤(1)中所述的状态表结构包括:终端号字段、终端相对于摄像机的方位参数字段。
本发明所述的摄像机拍摄方位数字声控定向方法,所述步骤(4)中所述的各终端的语音音量进行比较,包括步骤:
(1)、比较并获得每个终端在各采样点的最高音量数据;
(2)、将各终端的最高音量数据进行比较,得到具有最高音量数据的终端号。
参照图2,结合视频会议系统来做进一步的说明。各终端上的麦克风将采集到的声音数据转换为数字信号,然后经由IP网络传送到摄像机控制主机中。摄像机控制主机采用实时的音量检测算法对各终端送来的语音数据进行分析,得出各终端上的语音音量大小。
由于一间会议室中允许同时发言的人数受到摄像机数量的限制,所以必须根据各终端的语音音量大小判断出哪个终端处在正在发言的状态。但是由于受到多种因素的影响,我们不能直接以各终端的当前音量值作为判断的依据。最主要的原因是人的自然发音是不连续、无规律的,从音量的线性数值来看,语音采集的结果呈现离散分布,每个有效语音片段的峰值与长度并没有任何规律可循。如果直接依据各终端的当前音量值作为判断条件,很可能就会出现拿一个终端的波谷值与另一个终端的波峰值进行比较的情况,将很大程度上影响摄像机拍摄方位的声控定向效果。这里,我们通过比较并获得每个终端在各采样点的最高音量数据,再将各终端的最高音量数据进行比较,得到具有最高音量数据的终端号。即,设定mv(i)为终端i在从0到m采样点之间的最高音量,v(i,x)为终端i在x采样点的音量,则
mv(i)=Max[v(i,0),v(i,1),......,v(i,m)]
设N为从终端0到终端n进行语音音量比较之后得到的正在发言的终端号,则
N=Max[mv(0),mv(1),......,mv(n)]
在得到了正在发言的终端号之后,就要将该终端号与摄像机的拍摄方位进行一对一的映射。为了实现快速、准确的映射,需要在会议正式召开之前,建立一个存储有各终端的拍摄方位参数的终端方位映射表,结构如图3所示。终端方位映射表中的每条记录包含两项字段。“终端号”字段表示当前记录所代表的终端。“终端相对于摄像机的方位参数”字段中记录的数据,摄像机可以快速调整拍摄方位,以保证该终端的会议成员的影像能够被捕捉到。图2中的视频会议拥有三个终端。每个终端都通过IP网络连接到摄像机控制主机。控制主机实时检测各终端上麦克风的音量大小,并且判断出正在发言的终端号,然后按照终端方位映射表中预先设定好的摄像机方位参数调整摄像机,最终实现以发言者为导向的摄像机方位数字声控定向。
本发明所述的摄像机拍摄方位数字声控定向方法,并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明之领域,对于熟悉本领域的人员而言可容易地实现另外的优点和进行修改,因此在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示例。

Claims (3)

1、摄像机拍摄方位数字声控定向方法,包括以下步骤:
(1)、建立终端方位映射表;
(2)、各终端上的声音采集设备采集声音数据,并转换为数字信号,经IP网络传送到控制主机;
(3)、控制主机对语音数字信号实时检测,并对各终端送来的语音数据进行分析,获得各终端上语音音量值;
(4)、将各终端的语音音量进行比较,获得当前发言终端;
(5)、判断当前发言者是否已经处在摄像机拍摄范围之中,如果在摄像机拍摄范围之中,则回到步骤(3)、否则,到步骤(6);
(6)、以当前终端参数调整摄像机拍摄方位,回到步骤(3)。
2、根据权利要求1所述的摄像机拍摄方位数字声控定向方法,步骤(1)中所述的状态表结构包括:终端号字段、终端相对于摄像机的方位参数字段。
3、根据权利要求1所述的摄像机拍摄方位数字声控定向方法,步骤(4)中所述的各终端的语音音量进行比较,包括步骤:
(1)、比较并获得每个终端在各采样点的最高音量数据;
(2)、将各终端的最高音量数据进行比较,得到具有最高音量数据的终端号。
CNB2004100497241A 2004-06-25 2004-06-25 摄像机拍摄方位数字声控定向方法 Expired - Fee Related CN100420298C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100497241A CN100420298C (zh) 2004-06-25 2004-06-25 摄像机拍摄方位数字声控定向方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100497241A CN100420298C (zh) 2004-06-25 2004-06-25 摄像机拍摄方位数字声控定向方法

Publications (2)

Publication Number Publication Date
CN1713717A true CN1713717A (zh) 2005-12-28
CN100420298C CN100420298C (zh) 2008-09-17

Family

ID=35719118

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100497241A Expired - Fee Related CN100420298C (zh) 2004-06-25 2004-06-25 摄像机拍摄方位数字声控定向方法

Country Status (1)

Country Link
CN (1) CN100420298C (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010020138A1 (zh) * 2008-08-22 2010-02-25 中兴通讯股份有限公司 监控设备的控制方法和装置
CN102256098A (zh) * 2010-05-18 2011-11-23 宝利通公司 具有多个语音跟踪摄像机的视频会议端点
WO2012142793A1 (zh) * 2011-04-21 2012-10-26 中兴通讯股份有限公司 一种视频通讯终端及视频通讯方法
CN103986901A (zh) * 2013-02-08 2014-08-13 中兴通讯股份有限公司 一种在视频会议中获得所需视频流的方法和相应装置
CN104935819A (zh) * 2015-06-11 2015-09-23 广东欧珀移动通信有限公司 一种控制摄像头拍摄方法及终端
WO2015172630A1 (zh) * 2014-05-15 2015-11-19 努比亚技术有限公司 摄像装置及其对焦方法
CN105227925A (zh) * 2015-10-12 2016-01-06 北京奇虎科技有限公司 一种实现网络摄像机的移动监控的方法、装置和系统
CN105278380A (zh) * 2015-10-30 2016-01-27 小米科技有限责任公司 智能设备的控制方法和装置
WO2017004753A1 (zh) * 2015-07-03 2017-01-12 马岩 会议的灯光控制方法及系统
WO2018027697A1 (zh) * 2016-08-10 2018-02-15 张北江 音频目标查找方法在安防视频会议应用方法及系统
WO2018053679A1 (zh) * 2016-09-20 2018-03-29 深圳市沃特沃德股份有限公司 实现定位摄录的方法和定位辅助装置
CN109547732A (zh) * 2018-12-19 2019-03-29 深圳银澎云计算有限公司 一种音视频处理方法、装置、服务器及视频会议系统
CN112651350A (zh) * 2020-12-29 2021-04-13 安徽创世科技股份有限公司 一种视频处理方法、装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997008896A1 (en) * 1995-08-23 1997-03-06 Scientific-Atlanta, Inc. Open area security system
US6469732B1 (en) * 1998-11-06 2002-10-22 Vtel Corporation Acoustic source location using a microphone array
US7852369B2 (en) * 2002-06-27 2010-12-14 Microsoft Corp. Integrated design for omni-directional camera and microphone array

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010020138A1 (zh) * 2008-08-22 2010-02-25 中兴通讯股份有限公司 监控设备的控制方法和装置
CN102256098A (zh) * 2010-05-18 2011-11-23 宝利通公司 具有多个语音跟踪摄像机的视频会议端点
CN102256098B (zh) * 2010-05-18 2014-06-04 宝利通公司 具有多个语音跟踪摄像机的视频会议端点
WO2012142793A1 (zh) * 2011-04-21 2012-10-26 中兴通讯股份有限公司 一种视频通讯终端及视频通讯方法
CN103986901A (zh) * 2013-02-08 2014-08-13 中兴通讯股份有限公司 一种在视频会议中获得所需视频流的方法和相应装置
WO2015172630A1 (zh) * 2014-05-15 2015-11-19 努比亚技术有限公司 摄像装置及其对焦方法
CN104935819B (zh) * 2015-06-11 2018-03-02 广东欧珀移动通信有限公司 一种控制摄像头拍摄方法及终端
CN104935819A (zh) * 2015-06-11 2015-09-23 广东欧珀移动通信有限公司 一种控制摄像头拍摄方法及终端
WO2017004753A1 (zh) * 2015-07-03 2017-01-12 马岩 会议的灯光控制方法及系统
CN105227925A (zh) * 2015-10-12 2016-01-06 北京奇虎科技有限公司 一种实现网络摄像机的移动监控的方法、装置和系统
CN105227925B (zh) * 2015-10-12 2019-02-01 北京奇虎科技有限公司 一种实现网络摄像机的移动监控的方法、装置和系统
CN105278380A (zh) * 2015-10-30 2016-01-27 小米科技有限责任公司 智能设备的控制方法和装置
CN105278380B (zh) * 2015-10-30 2019-10-01 小米科技有限责任公司 智能设备的控制方法和装置
WO2018027697A1 (zh) * 2016-08-10 2018-02-15 张北江 音频目标查找方法在安防视频会议应用方法及系统
WO2018053679A1 (zh) * 2016-09-20 2018-03-29 深圳市沃特沃德股份有限公司 实现定位摄录的方法和定位辅助装置
CN109547732A (zh) * 2018-12-19 2019-03-29 深圳银澎云计算有限公司 一种音视频处理方法、装置、服务器及视频会议系统
CN112651350A (zh) * 2020-12-29 2021-04-13 安徽创世科技股份有限公司 一种视频处理方法、装置

Also Published As

Publication number Publication date
CN100420298C (zh) 2008-09-17

Similar Documents

Publication Publication Date Title
CN1713717A (zh) 摄像机拍摄方位数字声控定向方法
US9030520B2 (en) Automatic camera selection for videoconferencing
US9270941B1 (en) Smart video conferencing system
US8130257B2 (en) Speaker and person backlighting for improved AEC and AGC
CN1248502C (zh) 自动多摄像机视频合成
CN100473154C (zh) 图像拾取设备和图像分配方法
EP1613124A2 (en) Processing of stereo microphone signals for teleconferencing
CN1731859A (zh) 一种视频压缩方法及使用该方法的视频系统
CN1863301A (zh) 视频会议系统和方法
EP1895776A3 (en) Method and device for monitoring and administering many video conference devices within a network
CN1586074A (zh) 用于在视频会议期间提供对远端房间中的人的了解的系统和方法
EP1624702A3 (en) A system and method for off-line multi-view video compression
CN1921622A (zh) 视频监控设备及方法
WO2007003061A1 (en) System for videoconferencing
NZ520986A (en) Audiovisual media encoding system
US20050024486A1 (en) Video codec system with real-time complexity adaptation
CN1956497A (zh) 自动调整撷取装置的信号撷取角度的系统以及方法
CN1553710A (zh) 一种视频会议中的流转换系统和方法
CN108712407A (zh) 一种基于浏览器的音频/视频直播方法及其系统
CN113473066A (zh) 一种视频会议画面调整方法
CN1855793A (zh) 一种视音频编码速度的控制方法
CN109348164A (zh) 一种电视电话会议自助保障控制系统
CN115706774A (zh) 相机视图声学栅栏
CN200966067Y (zh) 远程监控装置
CN1285197C (zh) 视频会议音频质量检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090306

Address after: Beijing, Haidian District, Xueyuan Road No. 35, Nanjing building, 15 floor, zip code: 100083

Co-patentee after: Vimicro Electronics Co., Ltd.

Patentee after: Vimicro Corp in Beijing

Address before: Beijing, Haidian District, Xueyuan Road No. 35, Nanjing building, 15 floor, zip code: 100083

Patentee before: Beijing Vimicro Corporation

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080917

Termination date: 20120625