CN101068308A - 一种控制图像采集装置进行目标定位的系统及方法 - Google Patents

一种控制图像采集装置进行目标定位的系统及方法 Download PDF

Info

Publication number
CN101068308A
CN101068308A CNA2007101043729A CN200710104372A CN101068308A CN 101068308 A CN101068308 A CN 101068308A CN A2007101043729 A CNA2007101043729 A CN A2007101043729A CN 200710104372 A CN200710104372 A CN 200710104372A CN 101068308 A CN101068308 A CN 101068308A
Authority
CN
China
Prior art keywords
collecting device
image collecting
focusing position
expection
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101043729A
Other languages
English (en)
Other versions
CN100505837C (zh
Inventor
叶茂林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2007101043729A priority Critical patent/CN100505837C/zh
Publication of CN101068308A publication Critical patent/CN101068308A/zh
Priority to JP2010500057A priority patent/JP5123373B2/ja
Priority to PCT/CN2008/070782 priority patent/WO2008138246A1/zh
Priority to EP08734140A priority patent/EP2146340A4/en
Application granted granted Critical
Publication of CN100505837C publication Critical patent/CN100505837C/zh
Priority to US12/581,615 priority patent/US8363119B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Studio Devices (AREA)
  • Stereophonic System (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

一种控制图像采集装置进行目标定位的系统及方法,其中,所述系统包括:声源定位单元,用于根据接收到的声音信号进行目标定位,并将定位出的声源位置发送给应用层策略单元;声音识别单元,用于根据接收到的声音信号与已保存的声音信号进行识别匹配,并将得到的声音识别结果发送给应用层策略模块;应用层策略单元,根据所述声源位置及声音识别结果决策出图像采集装置的预期对焦位置;图像采集控制单元,将从应用层策略单元得到的图像采集装置的预期位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置;本发明实施例通过声源定位和声音识别的结果来控制图像采集装置自动进行目标定位,从而提高图像采集装置的操作维护性。

Description

一种控制图像采集装置进行目标定位的系统及方法
技术领域
本发明涉及多媒体技术领域,尤其涉及一种控制图像采集装置进行目标定位的系统及方法。
背景技术
目前,可视电话、电话会议和视频会议等系统中广泛采用声源定位技术来控制摄像机对准正在说话的人。
比如,在多个人参加的会议中,基于声源定位技术的摄像机会可以根据声源的位置自动对准正在发言的人(如会场代表、汇报人等),但期间如果有其他人发出声音,将会导致摄像机转向发出声音的人,达不到期望的结果。
再比如,在多个人可发言讨论的会议中,我们期望讨论时优先对准参与讨论的专家,而基于声源定位技术的摄像机一般会对准声音强度大的说话人,如果讨论时专家的声音没有其他人大,摄像机就无法对准到专家身上。
总之,现有基于声源定位的摄像机无法满足多种场景的需要,如果要满足多种场景的需要,需要管理员手动遥控摄像机,操作维护很不方便。
发明内容
鉴于上述现有技术所存在的问题,本发明实施例提供了一种控制图像采集装置进行目标定位的系统及方法,通过声源定位和声音识别的结果来控制图像采集装置自动进行目标定位,从而提高图像采集装置的操作维护性。
本发明实施例的目的是通过以下技术方案实现:
本发明提供了一种控制图像采集装置进行目标定位的系统,所述系统包括:
声源定位单元,用于根据接收到的声音信号进行定位,并将定位出的声源位置发送给应用层策略单元;
声音识别单元,用于根据接收到的声音信号与已保存的声音信号进行识别匹配,并将得到的声音识别结果发送给应用层策略模块;
应用层策略单元,用于根据所述声源位置及声音识别结果决策出图像采集装置的预期对焦位置;
图像采集控制单元,用于将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置。
本发明实施例还提供了一种控制图像采集装置进行目标定位的方法,所述方法包括以下步骤:
根据接收到的声音信号定位出声源位置;
将接收到的声音信号与已保存的声音信号进行识别匹配,得到声音识别结果;
根据所述声源位置及所述声音识别结果决策出图像采集装置的预期对焦位置;
将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置。
由上述本发明实施例提供的技术方案可以看出,本发明实施例提供了一种控制图像采集装置进行目标定位的系统及方法,通过声源定位和声音识别的结果来控制图像采集装置自动进行目标定位,从而达到提高图像采集装置的操作维护性。
附图说明
图1为本发明实施例的系统结构示意图;
图2为本发明实施例所述系统中的图像采集控制单元的结构示意图;
图3为本发明实施例所述方法的流程图。
具体实施方式
下面结合附图1和附图2对本发明实施例所述的声源定位系统进行详细说明。
附图1为本发明实施例的系统结构示意图,如图1所示,本发明实施例所述系统在具体实现过程中可以包括:声源定位单元、声音识别单元、应用层策略单元、图像采集控制单元,下面对各单元分别进行介绍。
声源定位单元:将其得到的外界的声音信号进行处理,定位出声源位置,并将声源位置发送给应用层策略单元,当所述声音信号为多个时,所述声源定位单元可以定位出多个声源位置,并将多个所述声源位置发送给应用层策略单元;所述声源定位的具体处理过程现在已有成熟解决方案,这里就不再赘述。
声音识别单元:根据其从得到的外界的声音信号和已保存的声音信号进行识别匹配,并将得出的声音识别结果发送给应用层策略模块,所述声音识别结果可以为,与预先设定的声音匹配,或者与预先设定的声音不匹配,或者没有匹配到预设定的声音,但是声音强度大的声源和上次不一样。当已保存的声音信号为多个时,所述声音识别单元可以得出多个声音识别结果。
应用层策略单元:根据从声源定位单元得到的声源位置和从声音识别单元得到的声音识别结果进行决策,得到所述决策结果为图像采集装置的预期对焦位置,然后将图像采集装置的预期对焦位置发送给图像采集控制单元;
当已保存的声音信号为多个时,所述应用层策略单元根据多个声源位置、多个声音识别结果以及要识别声音的优先级进行综合决策,得到图像采集装置的预期对焦位置,并将所述预期对焦位置发送给图像采集控制单元。
图像采集控制单元:将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,如果相同,则不对图像采集装置进行操作,如果不同,则对图像采集装置进行操作,使图像采集装置的位置变化到预期位置。
系统配置单元:根据不同的应用场景需求分析出系统参数,所述系统参数可以包括:手动还是自动遥控摄像机、是否需要进行声源定位、是否需要进行声音识别、已保存声音信号的优先级、声音强度大小的优先级等,然后将所述系统参数分别发送给应用层策略单元,比如,可以将自动遥控摄像机、进行声源定位、进行声音识别这些系统参数发送给应用层策路模块,以便应用层策略模块根据这些系统参数及声源位置和声音识别结果进行决策,决策出图像采集单元的预期对焦位置。
本发明实施例所述系统还包括:
声音录制单元:用于预先录制要识别的声音信号,并将所述要识别的声音信号发送到声音识别单元,所述预先录制的要识别的声音信号可以有一个或多个,这时,所述声音录制单元可以将录下所有要识别的声音信号,并发送到声音识别单元。
从以上描述可以看出,本发明实施例所述系统通过声源定位单元定位出的声源位置和声音识别单元的声音识别结果来触发应用层策略单元进行决策,从而根据图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较的结果来控制图像采集装置自动进行目标定位,进而达到提高图像采集装置的操作维护性的目的。
图2为本发明实施例所述系统中的图像采集控制单元的结构示意图,如图2所示,所述图像采集控制单元具体包括:策略存储模块、策略比较模块;
策略存储模块:用于存储图像采集装置的当前对焦位置;
策略比较模块:将得图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置。具体的说就是,策略比较模块将得到的图像采集装置的预期位置与图像采集装置的当前对焦位置进行比较,如果比较结果相同,则操作图像采集装置改变位置,否则,更新图像采集装置的当前对焦位置为图像采集装置的预期对焦位置,并根据图像采集装置的预期位置操作图像采集装置进行位置移动。
下面结合附图3对本发明实施例所述方法进行详细说明。
如附图3所示,本发明实施例所述方法具体包括以下步骤:
步骤31、根据接收到的声音信号定位出声源位置;
步骤32、将接收到的声音信号与预先已保存的声音信号进行对比识别,得到声音识别结果;
步骤33、根据所述声源位置及声音识别结果决策出图像采集装置的预期位置;当所述已保存的声音信号为多个时,还要根据已保存声音信号的优先级进行综合决策出图像采集装置的预期位置;
步骤34、将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,如果相同,则执行步骤37,否则,执行步骤35;
步骤35、变更图像采集装置的当前对焦位置为预期位置;
步骤36、根据图像采集装置的预期对焦位置操作图像采集装置,使其变化到预期位置;
步骤37、不操作图像采集装置。
从以上描述可以看出,本发明实施例所述方法通过声源定位和声音识别的结果来控制图像采集装置自动进行目标定位,从而提高图像采集装置的操作维护性的目的。
下面对本发明实施例所述系统及方法的应用进行具体举例说明。
本发明实施应用在一个场景中可以为:
开会前,操作管理员通过系统配置单元把采用声源定位技术/声音识别技术自动控制摄像机的策略输入到应用层策略模块,同时把需要识别的会场代表/汇报人声音通过声音预录模块发送到声音识别单元中;会议过程中系统自动定位声源的位置以及识别声源的声音是否和预先保存的声音匹配,如果匹配到新的声音那么转动摄像机对准新的声源位置,如果匹配到和上次一样的声音或者没有匹配到保存的声音,则不操作摄像机进行转动。
本发明实施例应用在另一个场景中可以为:
开会前,操作管理员通过系统配置单元把采用声源定位技术/声音识别技术自动控制摄像机策略和专家声音优先和声音大次优先策略输入到应用层策略模块,同时把需要识别的专家声音录制保存到系统声音识别单元中,并设定专家声音优先等级和声音强度大小的优先等级;会议过程中系统自动定位声源的位置以及识别声源的声音是否和预先保存的声音匹配,如果匹配到新的声音那么转动摄像机对准新的声源位置,如果没有匹配到新的声音,但是声音强度大的声源和上次不一样那么也转动摄像机对准新的声源位置,否则不操作摄像机进行转动。本发明实施例所述的系统及方法对于其他场景的应用也都类似,这里就不再赘述。
另外,本发明实施例所述的图像采集装置可以为摄像机,但本领域技术人员都应该知道,本发明实施例同样适用于其他的图像采集装置,比如摄像头。
至此,本发明实施例提供了一种控制图像采集装置进行目标定位的系统及方法,通过声源定位和声音识别的结果来控制图像采集装置自动进行定位,提高图像采集装置的可操作维护性,另外,本发明实施例还可以通过系统配置单元,对不同的场景配置相应的系统参数,以便满足多种场景的需要。
以上所述,仅为本发明实施例较佳的具体实施方式,但本发明实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明实施例的保护范围之内。因此,本发明实施例的保护范围应该以权利要求的保护范围为准。

Claims (11)

1、一种控制图像采集装置进行目标定位的系统,其特征在于,包括:
声源定位单元,用于根据接收到的声音信号进行定位,并将定位出的声源位置发送给应用层策略单元;
声音识别单元,用于根据接收到的声音信号与已保存的声音信号进行识别匹配,并将得到的声音识别结果发送给应用层策略模块;
应用层策略单元,用于根据所述声源位置及声音识别结果决策出图像采集装置的预期对焦位置;
图像采集控制单元,用于将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置。
2、根据权利要求1所述的系统,其特征在于,所述系统还包括:
系统配置单元,用于根据不同应用场景配置系统参数,并将所述系统参数发送给应用层策略单元,所述应用层策略单元根据所述系统参数、所述声源位置和所述声音识别结果决策出图像采集装置的预期对焦位置。
3、根据权利要求2所述的系统,其特征在于,所述系统参数包括下列参数中的一个或多个:手动还是自动控制图像采集装置、是否需要进行声源定位、是否需要进行声音识别、已保存声音信号的优先级、声音强度大小的优先级。
4、根据权利要求3所述的系统,其特征在于,当已保存声音信号为多个时,所述应用层策略单元还根据已保存声音信号的优先级决定图像采集装置的预期对焦位置,并将所述预期对焦位置发送给图像采集控制单元。
5、根据权利要求1到4中任意一项所述的系统,其特征在于,所述系统还包括:
声音录制单元,用于预先录制要识别的声音信号,并将所述要识别的声音信号发送到声音识别单元。
6、根据权利要求1到4中任意一项所述的系统,其特征在于,所述图像采集控制单元具体包括:
策略存储模块,用于存储图像采集装置的当前对焦位置;
策略比较模块,用于将所述图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制所述图像采集装置。
7、一种控制图像采集装置进行目标定位的方法,其特征在于,所述方法包括:
根据接收到的声音信号定位出声源位置;
将接收到的声音信号与已保存的声音信号进行识别匹配,得到声音识别结果;
根据所述声源位置及所述声音识别结果决策出图像采集装置的预期对焦位置;
将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置。
8、根据权利要求7所述的方法,其特征在于,在执行所述方法前还包括:
根据不同的场景配置系统参数、所述声源位置及所述声音识别结果决策出图像采集装置的预期对焦位置。
9、根据权利要求8所述的系统,其特征在于,所述系统参数至少包括下列参数中的一个或多个:手动还是自动控制图像采集装置、是否需要进行声源定位、是否需要进行声音识别、已保存声音信号的优先级。
10、根据权利要求9所述的系统,其特征在于,当已保存的声音信号为多个时,所述方法还包括:
根据已保存声音信号的优先级决定图像采集装置的预期对焦位置,并将所述预期对焦位置发送给所述图像采集控制单元。
11、根据权利要求7到10所述的方法,所述将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置的步骤具体包括:
如果所述得到的图像采集装置的预期对焦位置与所述图像采集装置的当前对焦位置一致,则操作图像采集装置位置不变,否则,更新所述图像采集装置的当前对焦位置为所述图像采集装置的预期对焦位置,并根据所述图像采集装置的预期对焦位置操作所述图像采集装置进行位置对焦。
CNB2007101043729A 2007-05-10 2007-05-10 一种控制图像采集装置进行目标定位的系统及方法 Active CN100505837C (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CNB2007101043729A CN100505837C (zh) 2007-05-10 2007-05-10 一种控制图像采集装置进行目标定位的系统及方法
JP2010500057A JP5123373B2 (ja) 2007-05-10 2008-04-23 目標物の位置探索を実行する画像収集装置を制御するためのシステム及び方法
PCT/CN2008/070782 WO2008138246A1 (fr) 2007-05-10 2008-04-23 Système et procédé de commande d'un dispositif collecteur d'image permettant d'effectuer une localisation de cible
EP08734140A EP2146340A4 (en) 2007-05-10 2008-04-23 SYSTEM AND METHOD FOR CONTROLLING AN IMAGE COLLECTOR DEVICE FOR PERFORMING TARGET LOCATION
US12/581,615 US8363119B2 (en) 2007-05-10 2009-10-19 System and method for controlling an image collecting device to carry out a target location

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007101043729A CN100505837C (zh) 2007-05-10 2007-05-10 一种控制图像采集装置进行目标定位的系统及方法

Publications (2)

Publication Number Publication Date
CN101068308A true CN101068308A (zh) 2007-11-07
CN100505837C CN100505837C (zh) 2009-06-24

Family

ID=38880733

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007101043729A Active CN100505837C (zh) 2007-05-10 2007-05-10 一种控制图像采集装置进行目标定位的系统及方法

Country Status (5)

Country Link
US (1) US8363119B2 (zh)
EP (1) EP2146340A4 (zh)
JP (1) JP5123373B2 (zh)
CN (1) CN100505837C (zh)
WO (1) WO2008138246A1 (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008138246A1 (fr) * 2007-05-10 2008-11-20 Huawei Technologies Co., Ltd. Système et procédé de commande d'un dispositif collecteur d'image permettant d'effectuer une localisation de cible
CN101511000A (zh) * 2009-02-27 2009-08-19 中山大学 一种利用声波定位的智能监控摄像头装置
US7986875B2 (en) 2008-12-29 2011-07-26 Hon Hai Precision Industry Co., Ltd. Sound-based focus system and focus method thereof
CN102136269A (zh) * 2010-01-22 2011-07-27 微软公司 经由标识信息的语音识别分析
CN102413276A (zh) * 2010-09-21 2012-04-11 天津三星光电子有限公司 具有声控聚焦功能的数码摄像机
CN103139466A (zh) * 2011-11-21 2013-06-05 索尼公司 信息处理装置、成像装置、信息处理方法和程序
CN103841360A (zh) * 2013-12-11 2014-06-04 三亚中兴软件有限责任公司 分布式视频会议的实现方法及系统、终端、音视频一体化设备
CN103957359A (zh) * 2014-05-15 2014-07-30 深圳市中兴移动通信有限公司 摄像装置及其对焦方法
CN104036789A (zh) * 2014-01-03 2014-09-10 北京智谷睿拓技术服务有限公司 多媒体处理方法及多媒体装置
CN104092936A (zh) * 2014-06-12 2014-10-08 小米科技有限责任公司 自动对焦方法及装置
CN104378635A (zh) * 2014-10-28 2015-02-25 西交利物浦大学 基于麦克风阵列辅助的视频感兴趣区域的编码方法
CN104954673A (zh) * 2015-06-11 2015-09-30 广东欧珀移动通信有限公司 一种摄像头旋转控制方法及用户终端
CN104967771A (zh) * 2015-04-30 2015-10-07 广东欧珀移动通信有限公司 一种控制摄像头的方法及移动终端
CN105812721A (zh) * 2014-12-30 2016-07-27 浙江大华技术股份有限公司 一种跟踪监控方法及跟踪监控设备
CN105872366A (zh) * 2016-03-30 2016-08-17 南昌大学 一种基于fastica算法的盲源分离技术控制聚焦系统
CN105957521A (zh) * 2016-02-29 2016-09-21 青岛克路德机器人有限公司 一种用于机器人的语音和图像复合交互执行方法及系统
CN106803886A (zh) * 2017-02-28 2017-06-06 深圳天珑无线科技有限公司 一种拍照的方法及装置
CN109009170A (zh) * 2018-07-20 2018-12-18 深圳市沃特沃德股份有限公司 探测情绪的方法与装置
CN109506568A (zh) * 2018-12-29 2019-03-22 苏州思必驰信息科技有限公司 一种基于图像识别和语音识别的声源定位方法及装置
CN109905616A (zh) * 2019-01-22 2019-06-18 视联动力信息技术股份有限公司 一种切换视频画面的方法和装置
CN110223700A (zh) * 2018-03-02 2019-09-10 株式会社日立制作所 讲话者推定方法及讲话者推定装置
CN110619895A (zh) * 2019-09-06 2019-12-27 Oppo广东移动通信有限公司 定向发声控制方法及装置、发声设备、介质和电子设备
CN110855927A (zh) * 2019-10-17 2020-02-28 深圳摩尔声学科技有限公司 一种会议摄像声音追踪装置
WO2020118503A1 (zh) * 2018-12-11 2020-06-18 华为技术有限公司 一种确定图像对焦区域的方法及装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9315883B2 (en) 2012-09-14 2016-04-19 Tata Steel Nederland Technology Bv High strength and low density particle-reinforced steel with improved E-modulus and method for producing said steel
US20150146078A1 (en) * 2013-11-27 2015-05-28 Cisco Technology, Inc. Shift camera focus based on speaker position
CN105763787A (zh) * 2014-12-19 2016-07-13 索尼公司 图像形成方法、装置以及电子设备
CN105657253B (zh) * 2015-12-28 2019-03-29 联想(北京)有限公司 一种对焦方法及电子设备
KR20170097519A (ko) * 2016-02-18 2017-08-28 삼성전자주식회사 음성 처리 방법 및 장치
CN112703376A (zh) * 2018-07-24 2021-04-23 弗兰克公司 用于表示来自目标场景的声学特征的系统和方法
KR20200076441A (ko) * 2018-12-19 2020-06-29 삼성전자주식회사 전자 장치 및 그의 제어 방법
CN110505399A (zh) * 2019-08-13 2019-11-26 聚好看科技股份有限公司 图像采集的控制方法、装置及采集终端
CN113420783B (zh) * 2021-05-27 2022-04-08 中国人民解放军军事科学院国防科技创新研究院 一种基于图文匹配的智能人机交互方法及装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742329A (en) * 1992-10-26 1998-04-21 Canon Kabushiki Kaisha Image pickup system and communication system for use in video conference system or the like
US5508734A (en) * 1994-07-27 1996-04-16 International Business Machines Corporation Method and apparatus for hemispheric imaging which emphasizes peripheral content
US5778082A (en) * 1996-06-14 1998-07-07 Picturetel Corporation Method and apparatus for localization of an acoustic source
JPH10276417A (ja) 1997-03-31 1998-10-13 Matsushita Electric Works Ltd テレビ会議システム
US5957667A (en) * 1997-05-23 1999-09-28 Ballard Generation Systems Inc. Oilless compressor with a pressurizable crankcase and motor containment vessel
US6593956B1 (en) * 1998-05-15 2003-07-15 Polycom, Inc. Locating an audio source
US6192342B1 (en) * 1998-11-17 2001-02-20 Vtel Corporation Automated camera aiming for identified talkers
JP2000341658A (ja) 1999-05-27 2000-12-08 Nec Eng Ltd 話者方向検出システム
US20020009203A1 (en) * 2000-03-31 2002-01-24 Gamze Erten Method and apparatus for voice signal extraction
JP2002135642A (ja) 2000-10-24 2002-05-10 Atr Onsei Gengo Tsushin Kenkyusho:Kk 音声翻訳システム
KR101047194B1 (ko) * 2002-05-03 2011-07-06 하만인터내셔날인더스트리스인코포레이티드 사운드 검출 및 위치측정 시스템
JP2005086365A (ja) * 2003-09-05 2005-03-31 Sony Corp 通話装置、会議装置および撮像条件調整方法
JP2005142640A (ja) * 2003-11-04 2005-06-02 Canon Inc 端末装置
DE102004000043A1 (de) * 2004-11-17 2006-05-24 Siemens Ag Verfahren zur selektiven Aufnahme eines Schallsignals
JP2007067972A (ja) * 2005-08-31 2007-03-15 Canon Inc 会議システム及び会議システムの制御方法
CN100505837C (zh) * 2007-05-10 2009-06-24 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363119B2 (en) 2007-05-10 2013-01-29 Huawei Technologies Co., Ltd. System and method for controlling an image collecting device to carry out a target location
WO2008138246A1 (fr) * 2007-05-10 2008-11-20 Huawei Technologies Co., Ltd. Système et procédé de commande d'un dispositif collecteur d'image permettant d'effectuer une localisation de cible
US7986875B2 (en) 2008-12-29 2011-07-26 Hon Hai Precision Industry Co., Ltd. Sound-based focus system and focus method thereof
CN101770139B (zh) * 2008-12-29 2012-08-29 鸿富锦精密工业(深圳)有限公司 对焦控制系统及方法
CN101511000A (zh) * 2009-02-27 2009-08-19 中山大学 一种利用声波定位的智能监控摄像头装置
CN101511000B (zh) * 2009-02-27 2011-02-16 中山大学 一种利用声波定位的智能监控摄像头装置
CN102136269A (zh) * 2010-01-22 2011-07-27 微软公司 经由标识信息的语音识别分析
CN102136269B (zh) * 2010-01-22 2013-05-22 微软公司 经由标识信息的语音识别分析
CN102413276A (zh) * 2010-09-21 2012-04-11 天津三星光电子有限公司 具有声控聚焦功能的数码摄像机
CN103139466B (zh) * 2011-11-21 2017-08-25 索尼公司 信息处理装置、成像装置、信息处理方法和计算机可读存储介质
CN103139466A (zh) * 2011-11-21 2013-06-05 索尼公司 信息处理装置、成像装置、信息处理方法和程序
CN103841360A (zh) * 2013-12-11 2014-06-04 三亚中兴软件有限责任公司 分布式视频会议的实现方法及系统、终端、音视频一体化设备
CN104036789A (zh) * 2014-01-03 2014-09-10 北京智谷睿拓技术服务有限公司 多媒体处理方法及多媒体装置
CN103957359A (zh) * 2014-05-15 2014-07-30 深圳市中兴移动通信有限公司 摄像装置及其对焦方法
WO2015172630A1 (zh) * 2014-05-15 2015-11-19 努比亚技术有限公司 摄像装置及其对焦方法
CN103957359B (zh) * 2014-05-15 2016-08-24 努比亚技术有限公司 摄像装置及其对焦方法
CN104092936A (zh) * 2014-06-12 2014-10-08 小米科技有限责任公司 自动对焦方法及装置
CN104092936B (zh) * 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
CN104378635A (zh) * 2014-10-28 2015-02-25 西交利物浦大学 基于麦克风阵列辅助的视频感兴趣区域的编码方法
CN104378635B (zh) * 2014-10-28 2017-12-05 西交利物浦大学 基于麦克风阵列辅助的视频感兴趣区域的编码方法
CN105812721A (zh) * 2014-12-30 2016-07-27 浙江大华技术股份有限公司 一种跟踪监控方法及跟踪监控设备
CN104967771A (zh) * 2015-04-30 2015-10-07 广东欧珀移动通信有限公司 一种控制摄像头的方法及移动终端
CN104954673A (zh) * 2015-06-11 2015-09-30 广东欧珀移动通信有限公司 一种摄像头旋转控制方法及用户终端
CN104954673B (zh) * 2015-06-11 2018-01-19 广东欧珀移动通信有限公司 一种摄像头旋转控制方法及用户终端
CN105957521A (zh) * 2016-02-29 2016-09-21 青岛克路德机器人有限公司 一种用于机器人的语音和图像复合交互执行方法及系统
CN105872366A (zh) * 2016-03-30 2016-08-17 南昌大学 一种基于fastica算法的盲源分离技术控制聚焦系统
CN105872366B (zh) * 2016-03-30 2018-08-24 南昌大学 一种基于fastica算法的盲源分离技术控制聚焦系统
CN106803886A (zh) * 2017-02-28 2017-06-06 深圳天珑无线科技有限公司 一种拍照的方法及装置
CN110223700A (zh) * 2018-03-02 2019-09-10 株式会社日立制作所 讲话者推定方法及讲话者推定装置
CN109009170A (zh) * 2018-07-20 2018-12-18 深圳市沃特沃德股份有限公司 探测情绪的方法与装置
WO2020118503A1 (zh) * 2018-12-11 2020-06-18 华为技术有限公司 一种确定图像对焦区域的方法及装置
CN111656275B (zh) * 2018-12-11 2021-07-20 华为技术有限公司 一种确定图像对焦区域的方法及装置
CN111656275A (zh) * 2018-12-11 2020-09-11 华为技术有限公司 一种确定图像对焦区域的方法及装置
CN109506568A (zh) * 2018-12-29 2019-03-22 苏州思必驰信息科技有限公司 一种基于图像识别和语音识别的声源定位方法及装置
CN109905616A (zh) * 2019-01-22 2019-06-18 视联动力信息技术股份有限公司 一种切换视频画面的方法和装置
CN109905616B (zh) * 2019-01-22 2021-08-31 视联动力信息技术股份有限公司 一种切换视频画面的方法和装置
CN110619895A (zh) * 2019-09-06 2019-12-27 Oppo广东移动通信有限公司 定向发声控制方法及装置、发声设备、介质和电子设备
CN110855927A (zh) * 2019-10-17 2020-02-28 深圳摩尔声学科技有限公司 一种会议摄像声音追踪装置
CN110855927B (zh) * 2019-10-17 2021-11-02 深圳摩尔声学科技有限公司 一种会议摄像声音追踪装置

Also Published As

Publication number Publication date
US8363119B2 (en) 2013-01-29
CN100505837C (zh) 2009-06-24
EP2146340A1 (en) 2010-01-20
WO2008138246A1 (fr) 2008-11-20
JP2010523025A (ja) 2010-07-08
EP2146340A4 (en) 2010-07-07
JP5123373B2 (ja) 2013-01-23
US20100033585A1 (en) 2010-02-11

Similar Documents

Publication Publication Date Title
CN101068308A (zh) 一种控制图像采集装置进行目标定位的系统及方法
CN1252984C (zh) 可与多个声音获取单元组合的便携式摄像机
CN2819691Y (zh) 发音和采音部件的防水滴结构及具有该结构的电子装置
WO2015172630A1 (zh) 摄像装置及其对焦方法
US8185387B1 (en) Automatic gain control
CN101184168B (zh) 基于车牌亮度对比度的摄像机快门与增益综合控制方法
CN1825953A (zh) 图像拾取设备和图像分配方法
CN1921622A (zh) 视频监控设备及方法
DE102021204829A1 (de) Automatische korrektur fehlerhafter audioeinstellungen
CN1949756A (zh) 基于语音的人机通讯系统和方法
CN108513063A (zh) 一种自动捕捉的智能会议拍摄系统
CN109862316A (zh) 一种基于图像分析技术的自动监听方法装置
CN108062359B (zh) 一种机器人采访与撰稿的方法和采访与撰稿的机器人
CN104378635A (zh) 基于麦克风阵列辅助的视频感兴趣区域的编码方法
WO2020164277A1 (zh) 一种基于音视频联动的监控方法、装置、终端设备及介质
CN1933413A (zh) 一种无线局域网ip组播帧传输的组播成员管理方法
CN1794032A (zh) 一种自动对焦方法
CN1859046A (zh) 接收数字多媒体广播的装置和方法
CN101035214A (zh) 具有手机数据录像功能的录相电视接收机及其手机数据录像方法
CN1866871A (zh) 分区域管理用户设备功能的方法和用户设备
CN1878374A (zh) 一种可正确识别测量报告的实现方法
CN1713717A (zh) 摄像机拍摄方位数字声控定向方法
CN1932632A (zh) 移动通信终端中的镜头自动调焦方法及装置
CN1882050A (zh) 接收装置和接收天线设定方法
CN200969654Y (zh) 一种多模式预警高速智能球装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant