CN103841357A - 基于视频跟踪的麦克风阵列声源定位方法、装置及系统 - Google Patents

基于视频跟踪的麦克风阵列声源定位方法、装置及系统 Download PDF

Info

Publication number
CN103841357A
CN103841357A CN201210475401.3A CN201210475401A CN103841357A CN 103841357 A CN103841357 A CN 103841357A CN 201210475401 A CN201210475401 A CN 201210475401A CN 103841357 A CN103841357 A CN 103841357A
Authority
CN
China
Prior art keywords
video
current
microphone array
sound source
carried out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210475401.3A
Other languages
English (en)
Inventor
孙涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210475401.3A priority Critical patent/CN103841357A/zh
Publication of CN103841357A publication Critical patent/CN103841357A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于视频跟踪的麦克风阵列声源定位方法、装置及系统,所述方法包括:统计麦克风阵列中多个麦克风获取当前语音的时间差信息;依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集并执行人脸检测;依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。采用本发明,在用户使用电视会议系统中,不用人工控制摄像头,摄像机即能实现自动对发言人的精确视频定位跟踪,并且由于进一步结合了人脸识别,从而可以进一步提高声源定位的精确性。

Description

基于视频跟踪的麦克风阵列声源定位方法、装置及系统
技术领域
本发明涉及电视会议技术领域,具体而言,涉及一种基于视频跟踪的麦克风阵列声源定位方法、装置及系统。
背景技术
目前商用的多媒体视频会议系统包括用以采集会场视频画面的摄像机、用以采集发言人音频信号的麦克风阵列以及用以播放当前会场视频画面的显示装置。在会议进行当中,为了更好的使与会人员更能详细的了解当前发言人的情况,通常需要将布置于会场的摄像机对准当前发言人,并实时采集并播放其实际发言情况。
目前,声源定位技术的应用非常广泛,在多媒体视频会议中,通过声源定位技术可以估计出声源的位置和方向角,并以此控制摄像机进行转向,以对当前发言人进行实时视频跟踪,并实时通过显示装置播出其发言视频。
然而在实际应用中,其声源定位常常采用麦克风阵列技术,但该技术由于易受噪声、混响等因素的影响,以致在进行声源定位时往往不够精确,存在一定的偏差。
发明内容
为了解决现有的声源定位技术还存在的易受噪声、混响等因素的影响,导致定位不够精确的技术问题,本发明的目的在于提供一种基于视频跟踪的麦克风阵列声源定位方法、装置及系统。
为了达到本发明的目的,本发明采用以下技术方案实现:
一种基于视频跟踪的麦克风阵列声源定位方法,包括:
统计麦克风阵列中多个麦克风获取当前语音的时间差信息;
依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集并执行人脸检测;
依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
优选地,依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息的方法为:
利用所述时间差信息以及和麦克风阵列中多个麦克风与摄像机之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
优选地,依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置的方法为:
依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
依据所述当前发言人所处的位置对摄像机执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
一种基于视频跟踪的麦克风阵列声源定位装置,包括:
时延计算模块,用于统计麦克风阵列中多个麦克风获取当前语音的时间差信息;
位置估算模块,用于依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
摄像机控制模块,用于依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集;
人脸识别模块,用于对采集的视频图像执行人脸检测;
位置校正模块,用于依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
优选地,位置估算模块利用所述时间差信息以及和麦克风阵列中多个麦克风与摄像机之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
优选地,位置校正模块包括:
筛选模块,用于依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
执行模块,用于依据所述当前发言人所处的位置对摄像机执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
一种电视会议系统,包括:
麦克风阵列,用于采集语音信息;
摄像机,用于采集会场视频信息;
显示装置,用于播放当前会场视频图像;
其中,所述电视会议系统还包括:
基于视频跟踪的麦克风阵列声源定位装置,所述装置包括:
时延计算模块,用于统计麦克风阵列中多个麦克风获取当前语音的时间差信息;
位置估算模块,用于依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
摄像机控制模块,用于依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集;
人脸识别模块,用于对采集的视频图像执行人脸检测;
位置校正模块,用于依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
优选地,位置估算模块利用所述时间差信息以及和麦克风阵列中多个麦克风与摄像机之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
优选地,位置校正模块包括:
筛选模块,用于依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
执行模块,用于依据所述当前发言人所处的位置对摄像机执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
通过上述本发明的技术方案可以看出,采用本发明,在用户使用电视会议系统中,不用人工控制摄像头,摄像机即能实现自动对发言人的精确视频定位跟踪,并且由于进一步结合了人脸识别,从而可以进一步提高声源定位的精确性,以将发言人置于视频播放画面的中间位置,便于与会者能够清楚的了解当前发言人的发言情况,采用本发明,提高了用户体验。
附图说明
图1是本发明实施例提供的一种基于视频跟踪的麦克风阵列声源定位方法流程示意图;
图2是本发明实施例提供的一种电视会议系统结构示意图。
本发明目的的实现、功能特点及优异效果,下面将结合具体实施例以及附图做进一步的说明。
具体实施方式
下面结合附图和具体实施例对本发明所述技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
如图1所示,本发明实施例提供的一种基于视频跟踪的麦克风阵列声源定位方法,包括如下具体步骤:
S10、统计麦克风阵列中多个麦克风获取当前语音的时间差信息;
S11、依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
S12、依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集并执行人脸检测;
S13、依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
本实施例中,在所述步骤S11中,依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息的方法为:
S110、利用所述时间差信息以及和麦克风阵列中多个麦克风与摄像机之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
本实施例中,在所述步骤S12中,依据步骤S11所得到的大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集的方式可以采用现有的摄像机调整方法执行,另外,对采集到的视频图像信息执行人脸检测的方法同样采用现有技术中的人脸识别算法执行。
通过上述技术方案可以看出,本发明实施例提供的基于视频跟踪的麦克风阵列声源定位方法的核心思想是:充分利用音视频领域的现有技术,首先采用麦克风阵列初步估算发言人的大致位置,然后再结合人脸检测技术进一步定位,使发言人位于摄像机采集的视频图像的中间位置,从而实现发言人的精确定位。
下面结合附图对该方法在会议电视中的具体实施应用作进一步的详细介绍,其包括如下步骤:
步骤1、通过麦克风阵列接收发言人的语音信息,并估计出语音到达不同麦克风的时间差;
步骤2、利用时间差以及麦克风阵列与会议电视摄像头之间的位置构造多个双曲面,并在某种最优准则下,通过计算多个双曲面的交点得到声源的大致位置,其中,本实施方式中,采用某种现有技术中的最优准则,以及采用现有技术计算多个双曲面的焦点得到声源的大致位置;
步骤3、根据步骤2求得的声源的大致位置控制摄像头进行视频跟踪,这样参加会议的人员无需手动控制摄像头,该算法自动控制摄像头对发言人进行跟踪;
步骤4、在步骤3的跟踪的基础上,在摄像头新采集的视频图像上对当前发言人进行快速有效的人脸检测;
步骤5、根据当前发言人的人脸在采集的视频图像中的位置,对步骤3的视频跟踪结果进行校准,使发言人位于视频图像的中间位置,从而达到精确定位的目的。
另外,特殊的场合下,置于摄像机采集的视频图像中的人脸图像可能有至少2幅,此时需要对发言人进行筛选,因此在本实施例中,在所述步骤S13中,依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置的方法为:
S131、依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
S132、依据所述当前发言人所处的位置对摄像机执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
参考图2,本发明实施例还提供了一种基于视频跟踪的麦克风阵列声源定位装置100,包括:
时延计算模块10,用于统计麦克风阵列200中多个麦克风获取当前语音的时间差信息;
位置估算模块20,用于依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
摄像机控制模块30,用于依据所述大致位置信息对摄像机300执行第一次声源跟踪控制,以进行视频采集;
人脸识别模块40,用于对采集的视频图像执行人脸检测;
位置校正模块50,用于依据人脸检测结果对摄像机300执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
具体地,位置估算模块20利用所述时间差信息以及和麦克风阵列200中多个麦克风与摄像机300之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
特殊的场合下,置于摄像机300采集的视频图像中的人脸图像可能有至少2幅,此时需要对发言人进行筛选,因此在本实施例中,参考图2,具体地,位置校正模块50包括:
筛选模块501,用于依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
执行模块502,用于依据所述当前发言人所处的位置对摄像机300执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
继续参考图2,本发明实施例还提供了一种电视会议系统,包括:
麦克风阵列200,用于采集语音信息;
摄像机300,用于采集会场视频信息;
显示装置400,用于播放当前会场视频图像;
其中,所述电视会议系统还包括:
基于视频跟踪的麦克风阵列声源定位装置100,所述装置100包括:
时延计算模块10,用于统计麦克风阵列200中多个麦克风获取当前语音的时间差信息;
位置估算模块20,用于依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
摄像机300控制模块30,用于依据所述大致位置信息对摄像机300执行第一次声源跟踪控制,以进行视频采集;
人脸识别模块40,用于对采集的视频图像执行人脸检测;
位置校正模块50,用于依据人脸检测结果对摄像机300执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
具体地,位置估算模块20利用所述时间差信息以及和麦克风阵列200中多个麦克风与摄像机300之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
特殊的场合下,置于摄像机300采集的视频图像中的人脸图像可能有至少2幅,此时需要对发言人进行筛选,因此在本实施例中,具体地,位置校正模块50包括:
筛选模块501,用于依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
执行模块502,用于依据所述当前发言人所处的位置对摄像机300执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
综上,采用本发明,在用户使用电视会议系统中,不用人工控制摄像机300,摄像机300即能实现自动对发言人的精确视频定位跟踪,并且由于进一步结合了人脸识别,从而可以进一步提高声源定位的精确性,以将发言人置于视频播放画面的中间位置,便于与会者能够清楚的了解当前发言人的发言情况,采用本发明,提高了用户体验。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种基于视频跟踪的麦克风阵列声源定位方法,其特征在于,包括:
统计麦克风阵列中多个麦克风获取当前语音的时间差信息;
依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集并执行人脸检测;
依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
2.如权利要求1所述的基于视频跟踪的麦克风阵列声源定位方法,其特征在于,依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息的方法为:
利用所述时间差信息以及和麦克风阵列中多个麦克风与摄像机之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
3.如权利要求1所述的基于视频跟踪的麦克风阵列声源定位方法,其特征在于,依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置的方法为:
依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
依据所述当前发言人所处的位置对摄像机执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频画面的中间位置。
4.一种基于视频跟踪的麦克风阵列声源定位装置,其特征在于,包括:
时延计算模块,用于统计麦克风阵列中多个麦克风获取当前语音的时间差信息;
位置估算模块,用于依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
摄像机控制模块,用于依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集;
人脸识别模块,用于对采集的视频图像执行人脸检测;
位置校正模块,用于依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
5.如权利要求4所述的基于视频跟踪的麦克风阵列声源定位装置,其特征在于,位置估算模块利用所述时间差信息以及和麦克风阵列中多个麦克风与摄像机之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
6.如权利要求4所述的基于视频跟踪的麦克风阵列声源定位装置,其特征在于,位置校正模块包括:
筛选模块,用于依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
执行模块,用于依据所述当前发言人所处的位置对摄像机执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
7.一种电视会议系统,包括:
麦克风阵列,用于采集语音信息;
摄像机,用于采集会场视频信息;
显示装置,用于播放当前会场视频图像;
其特征在于,所述电视会议系统还包括:
基于视频跟踪的麦克风阵列声源定位装置,所述装置包括:
时延计算模块,用于统计麦克风阵列中多个麦克风获取当前语音的时间差信息;
位置估算模块,用于依据所述时间差信息以及多个麦克风的位置信息获取当前声源的大致位置信息;
摄像机控制模块,用于依据所述大致位置信息对摄像机执行第一次声源跟踪控制,以进行视频采集;
人脸识别模块,用于对采集的视频图像执行人脸检测;
位置校正模块,用于依据人脸检测结果对摄像机执行第二次声源跟踪控制,以将当前发言人的人脸图像置于当前视频图像的中间位置。
8.如权利要求7所述的电视会议系统,其特征在于,位置估算模块利用所述时间差信息以及和麦克风阵列中多个麦克风与摄像机之间的位置关系构造多个双曲面,并通过计算多个双曲面的交点得到当前声源的大致位置信息。
9.如权利要求7所述的电视会议系统,其特征在于,位置校正模块包括:
筛选模块,用于依据预设的发言者姿态模型对采集的多个人脸图像进行筛选,得到当前发言人人脸图像;
执行模块,用于依据所述当前发言人所处的位置对摄像机执行第二次声源跟踪控制,以将该当前发言人的人脸图像置于当前视频图像的中间位置。
CN201210475401.3A 2012-11-21 2012-11-21 基于视频跟踪的麦克风阵列声源定位方法、装置及系统 Pending CN103841357A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210475401.3A CN103841357A (zh) 2012-11-21 2012-11-21 基于视频跟踪的麦克风阵列声源定位方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210475401.3A CN103841357A (zh) 2012-11-21 2012-11-21 基于视频跟踪的麦克风阵列声源定位方法、装置及系统

Publications (1)

Publication Number Publication Date
CN103841357A true CN103841357A (zh) 2014-06-04

Family

ID=50804449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210475401.3A Pending CN103841357A (zh) 2012-11-21 2012-11-21 基于视频跟踪的麦克风阵列声源定位方法、装置及系统

Country Status (1)

Country Link
CN (1) CN103841357A (zh)

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104092936A (zh) * 2014-06-12 2014-10-08 小米科技有限责任公司 自动对焦方法及装置
CN104240606A (zh) * 2014-08-22 2014-12-24 京东方科技集团股份有限公司 显示装置及显示装置观看角度的调节方法
CN104270655A (zh) * 2014-10-24 2015-01-07 四川省科本哈根能源科技有限公司 一种多点视频汇聚系统
CN104301659A (zh) * 2014-10-24 2015-01-21 四川省科本哈根能源科技有限公司 一种多点视频汇聚识别系统
CN104954673A (zh) * 2015-06-11 2015-09-30 广东欧珀移动通信有限公司 一种摄像头旋转控制方法及用户终端
CN105184214A (zh) * 2015-07-20 2015-12-23 北京进化者机器人科技有限公司 一种基于声源定位和人脸检测的人体定位方法和系统
CN105554443A (zh) * 2015-12-04 2016-05-04 浙江宇视科技有限公司 视频图像中异响来源的定位方法及装置
CN105578097A (zh) * 2015-07-10 2016-05-11 宇龙计算机通信科技(深圳)有限公司 一种录像方法及终端
CN105684422A (zh) * 2016-01-18 2016-06-15 王晓光 一种视频网络会议的人物跟踪方法及系统
CN105744208A (zh) * 2014-12-11 2016-07-06 北京视联动力国际信息技术有限公司 一种视频会议控制系统及其控制方法
CN106024003A (zh) * 2016-05-10 2016-10-12 北京地平线信息技术有限公司 结合图像的语音定位和增强系统及方法
CN106042005A (zh) * 2016-06-01 2016-10-26 山东科技大学 仿生眼定位追踪系统及其工作方法
CN106210511A (zh) * 2016-06-30 2016-12-07 纳恩博(北京)科技有限公司 一种定位用户的方法和装置
CN106292732A (zh) * 2015-06-10 2017-01-04 上海元趣信息技术有限公司 基于声源定位和人脸检测的智能机器人转动方法
CN106597378A (zh) * 2016-12-26 2017-04-26 大连民族大学 机器人声源定位学习中视觉示教声源角度的方法
WO2017088378A1 (zh) * 2015-11-27 2017-06-01 小米科技有限责任公司 摄像头拍摄角度调整方法及装置
CN106888361A (zh) * 2015-12-11 2017-06-23 深圳市轻生活科技有限公司 视频交互控制方法和装置
WO2017143910A1 (zh) * 2016-02-25 2017-08-31 中兴通讯股份有限公司 采集处理方法、装置、系统和计算机存储介质
WO2017147827A1 (zh) * 2016-03-02 2017-09-08 武克易 一种图像获取方法
CN107580192A (zh) * 2017-09-15 2018-01-12 上海启诺信息科技有限公司 音像联动控制装置及音像联动系统
CN107613243A (zh) * 2017-11-02 2018-01-19 深圳市裂石影音科技有限公司 一种基于语音跟踪的全景视频录制设备及录制方法
CN107809596A (zh) * 2017-11-15 2018-03-16 重庆科技学院 基于麦克风阵列的视频会议跟踪系统及方法
WO2018049957A1 (zh) * 2016-09-14 2018-03-22 中兴通讯股份有限公司 音频信号、图像处理的方法、装置和系统
CN107832720A (zh) * 2017-11-16 2018-03-23 北京百度网讯科技有限公司 基于人工智能的信息处理方法和装置
CN108076304A (zh) * 2016-11-15 2018-05-25 深圳三微思博科技有限公司 一种内置投影和摄像头阵列的视频处理方法和会议系统
CN108089152A (zh) * 2016-11-23 2018-05-29 杭州海康威视数字技术股份有限公司 一种设备控制方法、装置及系统
CN108259926A (zh) * 2018-03-15 2018-07-06 田英 一种基于人物声音的访谈直播切换方法
CN108366216A (zh) * 2018-02-28 2018-08-03 深圳市爱影互联文化传播有限公司 会议视频录制、记录及传播方法、装置及服务器
CN108682032A (zh) * 2018-04-02 2018-10-19 广州视源电子科技股份有限公司 控制视频图像输出的方法、装置、可读存储介质及终端
CN108957392A (zh) * 2018-04-16 2018-12-07 深圳市沃特沃德股份有限公司 声源方向估计方法和装置
CN109257559A (zh) * 2018-09-28 2019-01-22 苏州科达科技股份有限公司 一种全景视频会议的图像显示方法、装置及视频会议系统
CN109318243A (zh) * 2018-12-11 2019-02-12 珠海市微半导体有限公司 一种视觉机器人的声源跟踪系统、方法和清洁机器人
CN109492506A (zh) * 2017-09-13 2019-03-19 华为技术有限公司 图像处理方法、装置和系统
CN109886071A (zh) * 2018-12-25 2019-06-14 仁福宜康(天津)科技有限公司 一种基于声源定位和人脸检测的人体定位方法和系统
CN110062200A (zh) * 2018-01-19 2019-07-26 浙江宇视科技有限公司 视频监控方法、装置、网络摄像机及存储介质
CN110082723A (zh) * 2019-05-16 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置、设备及存储介质
CN110134233A (zh) * 2019-04-24 2019-08-16 福建联迪商用设备有限公司 一种基于人脸识别的智能音箱唤醒方法及终端
CN110389597A (zh) * 2018-04-17 2019-10-29 北京京东尚科信息技术有限公司 基于声源定位的摄像头调整方法、装置和系统
CN110691196A (zh) * 2019-10-30 2020-01-14 歌尔股份有限公司 一种音频设备的声源定位的方法及音频设备
CN110876032A (zh) * 2018-08-31 2020-03-10 比亚迪股份有限公司 车载音视频通话终端、车辆和音视频通话的方法
CN110992971A (zh) * 2019-12-24 2020-04-10 达闼科技成都有限公司 一种语音增强方向的确定方法、电子设备及存储介质
CN111046850A (zh) * 2019-12-31 2020-04-21 杭州晨安科技股份有限公司 一种基于声音与图像融合的发言者定位方法
CN111222117A (zh) * 2019-12-30 2020-06-02 云知声智能科技股份有限公司 身份信息的识别方法及装置
CN111260313A (zh) * 2020-01-09 2020-06-09 苏州科达科技股份有限公司 发言者的识别方法、会议纪要生成方法、装置及电子设备
CN111343411A (zh) * 2020-03-20 2020-06-26 青岛海信智慧家居系统股份有限公司 一种智能远程视频会议系统
CN111432115A (zh) * 2020-03-12 2020-07-17 浙江大华技术股份有限公司 基于声音辅助定位的人脸追踪方法、终端及存储装置
CN111551921A (zh) * 2020-05-19 2020-08-18 北京中电慧声科技有限公司 一种声像联动的声源定向系统及方法
CN112487246A (zh) * 2020-11-30 2021-03-12 深圳卡多希科技有限公司 一种多人视频中发言人的识别方法和装置
CN112543302A (zh) * 2020-12-03 2021-03-23 云知声智能科技股份有限公司 一种多人远程会议中智能降噪的方法和设备
CN112959336A (zh) * 2021-03-01 2021-06-15 河南大学 一种基于声源定位路径跟踪功能的二轮机器人
CN112995566A (zh) * 2019-12-17 2021-06-18 佛山市云米电器科技有限公司 基于显示设备的声源定位方法、显示设备及存储介质
CN112995565A (zh) * 2019-12-17 2021-06-18 佛山市云米电器科技有限公司 显示设备的摄像头调整方法、显示设备及存储介质
CN113281706A (zh) * 2021-04-02 2021-08-20 南方科技大学 一种目标定位方法、装置及计算机可读存储介质
WO2021168620A1 (zh) * 2020-02-24 2021-09-02 京东方科技集团股份有限公司 声源跟踪控制方法和控制装置、声源跟踪系统
CN114442039A (zh) * 2020-11-05 2022-05-06 中国移动通信集团山东有限公司 一种声源定位方法、装置和电子设备
CN115242971A (zh) * 2022-06-21 2022-10-25 海南视联通信技术有限公司 摄像头控制方法、装置、终端设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CE WANG ET AL.: "real-time automated video and audio capture with multiple cameras and microphones", 《JOURNAL OF VLSI SIGNAL PROCESSING》 *
金乃高: "视频联合说话人定位与跟踪方法研究", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104092936B (zh) * 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
CN104092936A (zh) * 2014-06-12 2014-10-08 小米科技有限责任公司 自动对焦方法及装置
CN104240606A (zh) * 2014-08-22 2014-12-24 京东方科技集团股份有限公司 显示装置及显示装置观看角度的调节方法
US9690262B2 (en) 2014-08-22 2017-06-27 Boe Technology Group Co., Ltd. Display device and method for regulating viewing angle of display device
CN104270655A (zh) * 2014-10-24 2015-01-07 四川省科本哈根能源科技有限公司 一种多点视频汇聚系统
CN104301659A (zh) * 2014-10-24 2015-01-21 四川省科本哈根能源科技有限公司 一种多点视频汇聚识别系统
CN105744208A (zh) * 2014-12-11 2016-07-06 北京视联动力国际信息技术有限公司 一种视频会议控制系统及其控制方法
CN105744208B (zh) * 2014-12-11 2019-09-27 视联动力信息技术股份有限公司 一种视频会议控制系统及其控制方法
CN106292732A (zh) * 2015-06-10 2017-01-04 上海元趣信息技术有限公司 基于声源定位和人脸检测的智能机器人转动方法
CN104954673A (zh) * 2015-06-11 2015-09-30 广东欧珀移动通信有限公司 一种摄像头旋转控制方法及用户终端
CN105578097A (zh) * 2015-07-10 2016-05-11 宇龙计算机通信科技(深圳)有限公司 一种录像方法及终端
CN105184214A (zh) * 2015-07-20 2015-12-23 北京进化者机器人科技有限公司 一种基于声源定位和人脸检测的人体定位方法和系统
US10375296B2 (en) 2015-11-27 2019-08-06 Xiaomi Inc. Methods apparatuses, and storage mediums for adjusting camera shooting angle
WO2017088378A1 (zh) * 2015-11-27 2017-06-01 小米科技有限责任公司 摄像头拍摄角度调整方法及装置
CN105554443B (zh) * 2015-12-04 2018-11-13 浙江宇视科技有限公司 视频图像中异响来源的定位方法及装置
CN105554443A (zh) * 2015-12-04 2016-05-04 浙江宇视科技有限公司 视频图像中异响来源的定位方法及装置
CN106888361A (zh) * 2015-12-11 2017-06-23 深圳市轻生活科技有限公司 视频交互控制方法和装置
CN105684422A (zh) * 2016-01-18 2016-06-15 王晓光 一种视频网络会议的人物跟踪方法及系统
WO2017124225A1 (zh) * 2016-01-18 2017-07-27 王晓光 一种视频网络会议的人物跟踪方法及系统
WO2017143910A1 (zh) * 2016-02-25 2017-08-31 中兴通讯股份有限公司 采集处理方法、装置、系统和计算机存储介质
CN107124540A (zh) * 2016-02-25 2017-09-01 中兴通讯股份有限公司 采集处理方法、装置及系统
WO2017147827A1 (zh) * 2016-03-02 2017-09-08 武克易 一种图像获取方法
CN106024003A (zh) * 2016-05-10 2016-10-12 北京地平线信息技术有限公司 结合图像的语音定位和增强系统及方法
CN106024003B (zh) * 2016-05-10 2020-01-31 北京地平线信息技术有限公司 结合图像的语音定位和增强系统及方法
CN106042005A (zh) * 2016-06-01 2016-10-26 山东科技大学 仿生眼定位追踪系统及其工作方法
CN106210511A (zh) * 2016-06-30 2016-12-07 纳恩博(北京)科技有限公司 一种定位用户的方法和装置
WO2018049957A1 (zh) * 2016-09-14 2018-03-22 中兴通讯股份有限公司 音频信号、图像处理的方法、装置和系统
CN108076304A (zh) * 2016-11-15 2018-05-25 深圳三微思博科技有限公司 一种内置投影和摄像头阵列的视频处理方法和会议系统
CN108089152B (zh) * 2016-11-23 2020-07-03 杭州海康威视数字技术股份有限公司 一种设备控制方法、装置及系统
CN108089152A (zh) * 2016-11-23 2018-05-29 杭州海康威视数字技术股份有限公司 一种设备控制方法、装置及系统
US10816633B2 (en) 2016-11-23 2020-10-27 Hangzhou Hikvision Digital Technology Co., Ltd. Device control method, apparatus and system
CN106597378A (zh) * 2016-12-26 2017-04-26 大连民族大学 机器人声源定位学习中视觉示教声源角度的方法
CN106597378B (zh) * 2016-12-26 2019-02-12 大连民族大学 机器人声源定位学习中视觉示教声源角度的方法
CN109492506A (zh) * 2017-09-13 2019-03-19 华为技术有限公司 图像处理方法、装置和系统
CN107580192A (zh) * 2017-09-15 2018-01-12 上海启诺信息科技有限公司 音像联动控制装置及音像联动系统
CN107580192B (zh) * 2017-09-15 2019-03-15 上海启诺信息科技有限公司 音像联动控制装置及音像联动系统
CN107613243A (zh) * 2017-11-02 2018-01-19 深圳市裂石影音科技有限公司 一种基于语音跟踪的全景视频录制设备及录制方法
CN107809596A (zh) * 2017-11-15 2018-03-16 重庆科技学院 基于麦克风阵列的视频会议跟踪系统及方法
CN107832720A (zh) * 2017-11-16 2018-03-23 北京百度网讯科技有限公司 基于人工智能的信息处理方法和装置
CN110062200A (zh) * 2018-01-19 2019-07-26 浙江宇视科技有限公司 视频监控方法、装置、网络摄像机及存储介质
CN108366216A (zh) * 2018-02-28 2018-08-03 深圳市爱影互联文化传播有限公司 会议视频录制、记录及传播方法、装置及服务器
CN108259926A (zh) * 2018-03-15 2018-07-06 田英 一种基于人物声音的访谈直播切换方法
CN108682032B (zh) * 2018-04-02 2021-06-08 广州视源电子科技股份有限公司 控制视频图像输出的方法、装置、可读存储介质及终端
CN108682032A (zh) * 2018-04-02 2018-10-19 广州视源电子科技股份有限公司 控制视频图像输出的方法、装置、可读存储介质及终端
CN108957392A (zh) * 2018-04-16 2018-12-07 深圳市沃特沃德股份有限公司 声源方向估计方法和装置
CN110389597A (zh) * 2018-04-17 2019-10-29 北京京东尚科信息技术有限公司 基于声源定位的摄像头调整方法、装置和系统
CN110389597B (zh) * 2018-04-17 2024-05-17 北京京东尚科信息技术有限公司 基于声源定位的摄像头调整方法、装置和系统
CN110876032A (zh) * 2018-08-31 2020-03-10 比亚迪股份有限公司 车载音视频通话终端、车辆和音视频通话的方法
CN109257559A (zh) * 2018-09-28 2019-01-22 苏州科达科技股份有限公司 一种全景视频会议的图像显示方法、装置及视频会议系统
CN109318243A (zh) * 2018-12-11 2019-02-12 珠海市微半导体有限公司 一种视觉机器人的声源跟踪系统、方法和清洁机器人
CN109886071A (zh) * 2018-12-25 2019-06-14 仁福宜康(天津)科技有限公司 一种基于声源定位和人脸检测的人体定位方法和系统
CN110134233A (zh) * 2019-04-24 2019-08-16 福建联迪商用设备有限公司 一种基于人脸识别的智能音箱唤醒方法及终端
CN110134233B (zh) * 2019-04-24 2022-07-12 福建联迪商用设备有限公司 一种基于人脸识别的智能音箱唤醒方法及终端
CN110082723A (zh) * 2019-05-16 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置、设备及存储介质
CN110082723B (zh) * 2019-05-16 2022-03-15 浙江大华技术股份有限公司 一种声源定位方法、装置、设备及存储介质
CN110691196A (zh) * 2019-10-30 2020-01-14 歌尔股份有限公司 一种音频设备的声源定位的方法及音频设备
CN112995566B (zh) * 2019-12-17 2024-04-05 佛山市云米电器科技有限公司 基于显示设备的声源定位方法、显示设备及存储介质
CN112995565B (zh) * 2019-12-17 2024-03-08 佛山市云米电器科技有限公司 显示设备的摄像头调整方法、显示设备及存储介质
CN112995565A (zh) * 2019-12-17 2021-06-18 佛山市云米电器科技有限公司 显示设备的摄像头调整方法、显示设备及存储介质
CN112995566A (zh) * 2019-12-17 2021-06-18 佛山市云米电器科技有限公司 基于显示设备的声源定位方法、显示设备及存储介质
CN110992971A (zh) * 2019-12-24 2020-04-10 达闼科技成都有限公司 一种语音增强方向的确定方法、电子设备及存储介质
CN111222117A (zh) * 2019-12-30 2020-06-02 云知声智能科技股份有限公司 身份信息的识别方法及装置
CN111046850A (zh) * 2019-12-31 2020-04-21 杭州晨安科技股份有限公司 一种基于声音与图像融合的发言者定位方法
CN111260313A (zh) * 2020-01-09 2020-06-09 苏州科达科技股份有限公司 发言者的识别方法、会议纪要生成方法、装置及电子设备
CN113631942B (zh) * 2020-02-24 2024-04-16 京东方科技集团股份有限公司 声源跟踪控制方法和控制装置、声源跟踪系统
WO2021168620A1 (zh) * 2020-02-24 2021-09-02 京东方科技集团股份有限公司 声源跟踪控制方法和控制装置、声源跟踪系统
CN113631942A (zh) * 2020-02-24 2021-11-09 京东方科技集团股份有限公司 声源跟踪控制方法和控制装置、声源跟踪系统
CN111432115B (zh) * 2020-03-12 2021-12-10 浙江大华技术股份有限公司 基于声音辅助定位的人脸追踪方法、终端及存储装置
CN111432115A (zh) * 2020-03-12 2020-07-17 浙江大华技术股份有限公司 基于声音辅助定位的人脸追踪方法、终端及存储装置
CN111343411B (zh) * 2020-03-20 2021-07-06 青岛海信智慧家居系统股份有限公司 一种智能远程视频会议系统
CN111343411A (zh) * 2020-03-20 2020-06-26 青岛海信智慧家居系统股份有限公司 一种智能远程视频会议系统
CN111551921A (zh) * 2020-05-19 2020-08-18 北京中电慧声科技有限公司 一种声像联动的声源定向系统及方法
CN114442039A (zh) * 2020-11-05 2022-05-06 中国移动通信集团山东有限公司 一种声源定位方法、装置和电子设备
CN112487246A (zh) * 2020-11-30 2021-03-12 深圳卡多希科技有限公司 一种多人视频中发言人的识别方法和装置
CN112543302B (zh) * 2020-12-03 2023-01-31 云知声智能科技股份有限公司 一种多人远程会议中智能降噪的方法和设备
CN112543302A (zh) * 2020-12-03 2021-03-23 云知声智能科技股份有限公司 一种多人远程会议中智能降噪的方法和设备
CN112959336A (zh) * 2021-03-01 2021-06-15 河南大学 一种基于声源定位路径跟踪功能的二轮机器人
CN113281706A (zh) * 2021-04-02 2021-08-20 南方科技大学 一种目标定位方法、装置及计算机可读存储介质
CN113281706B (zh) * 2021-04-02 2024-01-05 南方科技大学 一种目标定位方法、装置及计算机可读存储介质
CN115242971A (zh) * 2022-06-21 2022-10-25 海南视联通信技术有限公司 摄像头控制方法、装置、终端设备和存储介质

Similar Documents

Publication Publication Date Title
CN103841357A (zh) 基于视频跟踪的麦克风阵列声源定位方法、装置及系统
CN103581606B (zh) 一种多媒体采集装置和方法
CN107820037B (zh) 音频信号、图像处理的方法、装置和系统
JP5857674B2 (ja) 画像処理装置、及び画像処理システム
US10816633B2 (en) Device control method, apparatus and system
CN107316651B (zh) 基于麦克风的音频处理方法和装置
CN103581608A (zh) 发言人检测系统、发言人检测方法和音频/视频会议系统
CN101189872A (zh) 照相机的规格化图像
WO2018209879A1 (zh) 自动选择摄像头画面的方法、装置及音视频系统
EP2993860B1 (en) Method, apparatus, and system for presenting communication information in video communication
JP2005045779A (ja) オーディオ装置を管理する方法およびインタフェース・ツール、並びにオーディオ装置を管理するコンピュータが実行するコンピュータ・プログラム製品
CN111046850B (zh) 一种基于声音与图像融合的发言者定位方法
CN110706717B (zh) 一种基于麦克风阵列板的人声检测定向方法
CN102724604B (zh) 一种视频会议的声音处理方法
CN204539315U (zh) 一种声源定位的视频会议机
CN110958537A (zh) 一种智能音箱及智能音箱使用的方法
US9165182B2 (en) Method and apparatus for using face detection information to improve speaker segmentation
CN111551921A (zh) 一种声像联动的声源定向系统及方法
TW200804852A (en) Method for tracking vocal target
EP1705911A1 (en) Video conference system
CN115242971A (zh) 摄像头控制方法、装置、终端设备和存储介质
CN102209225B (zh) 视频通信的实现方法及装置
CN112738705A (zh) 一种音效调节方法、装置、电子设备及存储介质
Libal et al. Multimodal classification of activities of daily living inside smart homes
CN112015364A (zh) 拾音灵敏度的调整方法、装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140604