CN108089152B - 一种设备控制方法、装置及系统 - Google Patents
一种设备控制方法、装置及系统 Download PDFInfo
- Publication number
- CN108089152B CN108089152B CN201611047345.8A CN201611047345A CN108089152B CN 108089152 B CN108089152 B CN 108089152B CN 201611047345 A CN201611047345 A CN 201611047345A CN 108089152 B CN108089152 B CN 108089152B
- Authority
- CN
- China
- Prior art keywords
- position point
- microphone
- coordinate information
- sound source
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/78—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using electromagnetic waves other than radio waves
- G01S3/782—Systems for determining direction or deviation from predetermined direction
- G01S3/785—Systems for determining direction or deviation from predetermined direction using adjustment of orientation of directivity characteristics of a detector or detector system to give a desired condition of signal derived from that detector or detector system
- G01S3/786—Systems for determining direction or deviation from predetermined direction using adjustment of orientation of directivity characteristics of a detector or detector system to give a desired condition of signal derived from that detector or detector system the desired condition being maintained automatically
- G01S3/7864—T.V. type tracking systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/62—Control of parameters via user interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
- H04N23/675—Focus control based on electronic image sensor signals comprising setting of focusing regions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Human Computer Interaction (AREA)
- Electromagnetism (AREA)
- Acoustics & Sound (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明实施例提供了一种设备控制方法、装置及系统,所述方法应用于声源定位系统中的视频采集设备,该声源定位系统还包括设置于视频采集设备外部的麦克风,所述方法包括:获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
Description
技术领域
本发明涉及自动控制技术领域,特别是涉及一种设备控制方法、装置及系统。
背景技术
随着通信技术的发展,信息交互变得越来越方便。例如,在办公领域,处于不同地区的用户可以进行视频会议;或者,在教育领域,可以通过直播的方式进行在线教学,或通过录播视频的方式进行教学等。
在视频会议、在线教学或视频录播过程中,通常需要定位正在讲话的人,并控制视频采集设备对准正在讲话的人。具体地,可以在会议室或教室安装视频采集设备,如,可以为能够360度旋转及上下调节的云台摄像机,通过该视频采集设备定位声源位置,即为正在讲话的人所处位置,进一步地控制其对准正在讲话的人。
已知的设备控制方法,主要为将麦克风安装在视频采集设备上,通过对麦克风接收的声源进行检测,从而定位声源位置,即为正在讲话的人所处位置,进而控制视频采集设备对准声源位置。但是,上述方法中,由于将麦克风安装在视频采集设备上,因此通常只能定位距离视频采集设备距离较近的声源,而不能准确定位距离视频采集设备距离较远的声源。因此,上述方法中,声源定位准确性较低,从而导致设备控制准确性较低。
发明内容
本发明实施例的目的在于提供一种设备控制方法、装置及系统,以提高设备控制的准确性。具体技术方案如下:
第一方面,本发明实施例提供了一种设备控制方法,应用于声源定位系统中的视频采集设备,所述声源定位系统还包括设置于所述视频采集设备外部的麦克风,所述方法包括:
获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;
根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;
识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。
可选地,所述根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值的步骤包括:
根据各麦克风采集的语音信号,计算各语音信号的傅里叶变换;
针对每个预设位置点,根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差;
根据各语音信号的傅里叶变换,以及所述该预设位置点到每两个相邻麦克风的时延差,计算所述该预设位置点到每两个相邻麦克风的广义互相关;
根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值。
可选地,所述针对每个预设位置点,根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差的步骤包括:
根据以下公式,计算任一预设位置点m到任两个相邻麦克风k、l的时延差τmkl:
其中,所述Dmk为所述预设位置点m到麦克风k的距离,所述Dml为所述预设位置点m到麦克风l的距离,所述c为声速。
可选地,所述根据所述各语音信号的傅里叶变换,以及所述该预设位置点到每两个相邻麦克风的时延差,计算所述该预设位置点到每两个相邻麦克风的广义互相关的步骤包括:
根据以下公式,计算所述任一预设位置点m到所述任两个相邻麦克风k、l的广义互相关R(τmkl):
可选地,所述根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值的步骤包括:
根据以下公式,计算所述任一预设位置点m对应的语音功率值P(m):
其中,所述M为麦克风总数。
可选地,所述方法还包括:
确定所述声源位置处的人体的身高;
根据自身的坐标信息、自身的高度、所述声源位置的坐标信息、以及所述声源位置处的人体的身高,计算从自身到所述人体的目标距离;
根据预先保存的各距离与焦距的对应关系,识别与所述目标距离对应的目标焦距,并调节自身的焦距为所述目标焦距。
可选地,所述确定所述声源位置处的人体的身高的步骤包括:
获取预先保存的人体平均身高,并将所获取的人体平均身高确定为所述声源位置处的人体的身高;或
采集包含所述声源位置处的人体的图像,对所述图像进行分析,得到所述声源位置处的人体的身高。
第二方面,本发明实施例提供了一种设备控制装置,应用于声源定位系统中的视频采集设备,所述声源定位系统还包括设置于所述视频采集设备外部的麦克风,所述装置包括:
获取模块,用于获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;
第一计算模块,用于根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;
控制模块,用于识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。
可选地,所述计算模块,包括:
第一计算子模块,用于根据各麦克风采集的语音信号,计算各语音信号的傅里叶变换;
第二计算子模块,用于针对每个预设位置点,根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差;
第三计算子模块,用于根据各语音信号的傅里叶变换,以及所述该预设位置点到每两个相邻麦克风的时延差,计算所述该预设位置点到每两个相邻麦克风的广义互相关;
第四计算子模块,用于根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值。
可选地,所述第二计算子模块,具体用于根据以下公式,计算任一预设位置点m到任两个相邻麦克风k、l的时延差τmkl:
其中,所述Dmk为所述预设位置点m到麦克风k的距离,所述Dml为所述预设位置点m到麦克风l的距离,所述c为声速。
可选地,所述第三计算子模块,具体用于根据以下公式,计算所述任一预设位置点m到所述任两个相邻麦克风k、l的广义互相关R(τmkl):
可选地,所述第四计算子模块,具体用于根据以下公式,计算所述任一预设位置点m对应的语音功率值P(m):
其中,所述M为麦克风总数。
可选地,所述装置还包括:
确定模块,用于确定所述声源位置处的人体的身高;
第二计算模块,用于根据所述视频采集设备的坐标信息、所述视频采集设备的高度、所述声源位置的坐标信息、以及所述声源位置处的人体的身高,计算从自身到所述人体的目标距离;
调节模块,用于根据预先保存的各距离与焦距的对应关系,识别与所述目标距离对应的目标焦距,并调节自身的焦距为所述目标焦距。
可选地,所述确定模块,具体用于:
获取预先保存的人体平均身高,并将所获取的人体平均身高确定为所述声源位置处的人体的身高;或
采集包含所述声源位置处的人体的图像,对所述图像进行分析,得到所述声源位置处的人体的身高。
第三方面,本发明实施例提供了一种设备控制系统,所述系统包括:视频采集设备、以及设置于所述视频采集设备外部的麦克风;
所述视频采集设备,用于获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置;
所述各麦克风,用于采集语音信号,并将其采集的语音信号发送给所述视频采集设备。
本发明实施例提供了一种设备控制方法、装置及系统,视频采集设备可以获取各麦克风采集的语音信号,并获取各麦克风的坐标信息,以及各预设位置点的坐标信息,然后根据各麦克风采集的语音信号、各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值,最后识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种设备控制方法的流程图;
图2(a)为本发明实施例的一种教室中麦克风分布情况示意图;
图2(b)为本发明实施例的另一种教室中麦克风分布情况示意图;
图3为本发明实施例提供的一种设备控制方法的另一流程图;
图4为本发明实施例的一种三维坐标系示意图;
图5为本发明实施例提供的一种设备控制装置的结构示意图;
图6为本发明实施例提供的一种设备控制系统的结构示意图。
具体实施方式
为了提高声源定位的准确性,从而提高设备控制的准确性,本发明实施例提供了一种设备控制方法、装置及系统。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明实施例提供了一种设备控制方法过程,如图1所示,该过程可以包括以下步骤:
S101,获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息。
在本发明实施例中,为了提高声源定位的准确性,可以在需要进行声源定位的采集场景中,如教室、会议室等,安装视频采集设备,并在视频采集设备外部安装麦克风。其中,上述视频采集设备可以为球机、摄像机等,本发明实施例对此不进行限定。
具体地,可以安装多个麦克风,并且为了能够很好地接收教室、会议室等采集场景各个区域的语音信号,可以将多个麦克风安装在采集场景的各个区域中。例如,如图2(a)所示,其示出了本发明实施例的一种教室中麦克风分布情况示意图,图中为教室俯视图。如图2(a)所示,可以将视频采集设备210安装在讲台附近,将多个麦克风安装在教室四周的墙壁上。并且,每面墙壁上安装的麦克风可以等间距排列,或者,也可以根据教室中学生230的分布情况不等间距排列。
或者,如图2(b)所示,其示出了本发明实施例的另一种教室中麦克风分布情况示意图,图中为教室俯视图。如图2(b)所示,可以将视频采集设备210安装在讲台附近,将多个麦克风安装在教室屋顶。并且,屋顶的各麦克风可以等间距排列,或者,也可以根据教室中学生230的分布情况不等间距排列。
并且,还可以确定各麦克风以及各预设位置点的标识信息,如,各麦克风的标识信息可以为a、b、l、k等,各预设位置点的标识信息可以为1、2、3等。还可以在采集场景中构建平面坐标系,并根据构建的平面坐标系,确定各麦克风以及各预设位置点的坐标信息。上述各预设位置点即为讲话的人可能出现的各位置点。
例如,如图2(a)、2(b)所示,可以将沿教室某一墙壁与地面相交直线的方向确定为X轴,与该墙壁相邻的另一墙壁与地面相交直线的方向确定为Y轴,X轴与Y轴相交点为O点。确定X轴、Y轴后,即可确定各麦克风的坐标信息,如麦克风n的坐标信息可以为:(Xn、Yn)。并且,可以将各麦克风的坐标信息存储在视频采集设备中。视频采集设备中存储的各麦克风的坐标信息可以如表1所示:
表1
麦克风标识信息 | 坐标信息 |
n | (1.0、0.2) |
k | (3.0、0.2) |
l | (5.0、0.2) |
t | (7.0、0.2) |
在教室中,讲话的人可能为老师或学生,并且,教师通常在讲台上,学生通常在自己座位上。也就是说,讲话的人可能出现的各位置点即为讲台或各学生的座位。因此,当确定X轴、Y轴后,还可以确定讲台的坐标信息,以及各学生座位的坐标信息,如可以确定第i个预设位置点的坐标信息可以为:(Xi、Yi)。并且,可以将讲台的坐标信息,以及各学生座位的坐标信息作为各预设位置点的坐标信息存储在视频采集设备中。视频采集设备中存储的各预设位置点的坐标信息可以如表2所示:
表2
预设位置点标识信息 | 坐标信息 |
1 | (4.0、7.8) |
2 | (2.0、6.2) |
3 | (4.0、6.2) |
4 | (6.0、6.2) |
在本发明实施例中,麦克风采集的语音信号可以通过模拟电路传输给视频采集设备。因此,在本发明实施例中,视频采集设备可以获取各麦克风采集的语音信号。并且,为了进行声源定位,视频采集设备还可以获取各麦克风的坐标信息,以及各预设位置点的坐标信息。例如,视频采集设备可以从本地预定存储空间中获取各麦克风的坐标信息,以及各预设位置点的坐标信息。
S102,根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值。
在本发明实施例中,获取到各麦克风采集的语音信号、各麦克风的坐标信息、以及各预设位置点的坐标信息后,视频采集设备可以根据各麦克风采集的语音信号、各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值,以确定声源所在的位置点。
各位置点对应的语音功率值,可以用来表征各位置点声音的大小。可以理解,语音功率值最大的位置点,也就是声音最大的位置点,即为声源位置点。具体地,视频采集设备可以分别针对每个预设位置点,计算该位置点对应的语音功率值。
例如,视频采集设备可以根据各麦克风采集的语音信号,计算各语音信号的傅里叶变换。具体地,视频采集设备可以根据现有的方式,计算各语音信号的傅里叶变换,本发明实施例对此不进行赘述。
针对任一预设位置点,视频采集设备可以首先根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差。具体地,可以根据以下公式,计算任一预设位置点m到任两个相邻麦克风k、l的时延差τmkl:
其中,Dmk为预设位置点m到麦克风k的距离,Dml为预设位置点m到麦克风l的距离,c为声速,c=340m/s。
当预设位置点m的坐标信息为(Xm、Ym),麦克风k的坐标信息为(Xk、Yk),麦克风l的坐标信息为(Xl、Yl)时,Dmk、Dml分别为:
然后,视频采集设备可以根据各语音信号的傅里叶变换,以及该预设位置点到每两个相邻麦克风的时延差,计算该预设位置点到每两个相邻麦克风的广义互相关。
具体地,视频采集设备可以根据以下公式,计算预设位置点m到相邻麦克风k、l的广义互相关R(τmkl):
最后,视频采集设备可以根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值。具体地,视频采集设备可以根据以下公式,计算预设位置点m对应的语音功率值P(m):
其中,M为麦克风总数。
S103,识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。
当视频采集设备计算得到每个预设位置点对应的语音功率值后,其可以识别语音功率值最大的位置点,并将该位置点确定为声源位置。
声源位置即为正在讲话的人所在位置,与其他位置相比,该位置的声音应该是最大的,因此该位置对应的语音功率值也应该是最大的。因此,在本发明实施例中,可以将语音功率值最大的位置点确定为声源位置。
确定声源位置后,视频采集设备即可控制自身对准该声源位置,以对正在讲话的人进行视频录制。例如,视频采集设备可以控制其镜头方向,使其对准声源位置。视频采集设备控制其镜头方向,使其对准声源位置的过程,可以采用现有的任一种方法,本发明实施例对此过程不进行赘述。
本发明实施例提供了一种设备控制方法,视频采集设备可以获取各麦克风采集的语音信号,并获取各麦克风的坐标信息,以及各预设位置点的坐标信息,然后根据各麦克风采集的语音信号、各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值,最后识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
视频采集设备在视频录制过程中,针对不同距离的目标物体,其通常需要调节焦距,以达到更好的录制效果。例如,当录制距离较近的目标物体时,可以使用较小的焦距,以使录制图像中包括整个目标物体;当录制距离较远的目标物体时,可以使用较大的焦距,以放大目标物体,保证录制图像中目标物体的清晰度。
作为本发明实施例的一种实施方式,视频采集设备控制自身对准声源位置后,针对不同的声源位置,视频采集设备还可以调节其焦距,以达到更好的录制效果。如图3所示,本发明实施例提供的设备控制方法,还可以包括:
S301,确定所述声源位置处的人体的身高。
在本发明实施例中,视频采集设备确定的声源位置仅能确定声源位置的二维坐标。为了准确地确定视频采集设备与声源位置处的人体的精确距离,视频采集设备控制自身对准声源位置后,还可以确定声源位置处的人体的身高。
在一种实现方式中,视频采集设备可以预先保存人体平均身高,如1.68米、1.70米、1.72米等。在确定声源位置处的人体的身高时,获取预先保存的人体平均身高,并将所获取的人体平均身高确定为声源位置处的人体的身高。
在另一种实现方式中,为了提高确定的人体身高的准确性,视频采集设备可以采集包含声源位置处的人体的图像,对该图像进行分析,得到声源位置处的人体的身高。视频采集设备采集图像的过程,以及对图像进行分析的过程,可以采用现有的任一种方法,本发明实施例对此过程不进行赘述。
S302,根据自身的坐标信息、自身的高度、所述声源位置的坐标信息、以及所述声源位置处的人体的身高,计算从自身到所述人体的目标距离。
视频采集设备确定声源位置处人体的身高后,其可以进一步地根据自身的坐标信息、自身的高度、声源位置的坐标信息、以及声源位置处的人体的身高,计算从自身到该人体的目标距离。
具体地,视频采集设备可以根据自身的坐标信息、自身的高度,确定自身的三维坐标,根据声源位置的坐标信息、以及声源位置处的人体的身高,确定人体的三维坐标,进而可以根据自身的三维坐标,以及人体的三维坐标,确定从自身到人体的距离。
例如,如图4所示的三维坐标系,当视频采集设备的三维坐标为(X0,Y0,Z0),人体的三维坐标为(X1,Y1,Z1)时,可以确定从视频采集设备到人体头部的目标距离l为:
S303,根据预先保存的各距离与焦距的对应关系,识别与所述目标距离对应的目标焦距,并调节自身的焦距为所述目标焦距。
在本发明实施例中,视频采集设备可以预先保存各距离与焦距的对应关系。例如,可以由用户根据经验值,确定各距离与焦距的对应关系,并保存在视频采集设备中。如,视频采集设备中保存的各距离与焦距的对应关系可以如表3所示:
表3
距离 | 焦距 |
1米 | a1 |
2米 | a2 |
3米 | a3 |
4米 | a4 |
当视频采集设备确定从自身到人体的目标距离后,其可以根据预先保存的各距离与焦距的对应关系,识别与目标距离对应的目标焦距,并调节自身的焦距为该目标焦距。
例如,视频采集设备可以在其保存的各距离与焦距的对应关系中,识别与目标距离相同的距离,并将该距离对应的焦距确定为与目标距离对应的目标焦距。视频采集设备调节焦距的过程,可以采用现有的任一种方法,本发明实施例对此过程不进行赘述。
有些情况下,视频采集设备计算得到的目标距离可能为小数,在其保存的各距离与焦距的对应关系中,识别不到与目标距离相同的距离。这种情况下,视频采集设备可以在其保存的各距离与焦距的对应关系中,识别与目标距离整数部分对应的距离,并将该距离对应的焦距确定为与目标距离对应的目标焦距。
本发明实施例中,视频采集设备可以根据其与声源位置处人体的实际距离,来调节其焦距,因此,能够提高视频录制效果。
相应于上面的方法实施例,本发明实施例还提供了相应的装置实施例。
图5为本发明实施例提供的一种设备控制装置,应用于声源定位系统中的视频采集设备,所述声源定位系统还包括设置于所述视频采集设备外部的麦克风,所述装置包括:
获取模块510,用于获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;
第一计算模块520,用于根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;
控制模块530,用于识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。
本发明实施例提供了一种设备控制装置,视频采集设备可以获取各麦克风采集的语音信号,并获取各麦克风的坐标信息,以及各预设位置点的坐标信息,然后根据各麦克风采集的语音信号、各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值,最后识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
作为本发明实施例的一种实施方式,所述第一计算模块520,包括:
第一计算子模块(图中未示出),用于根据各麦克风采集的语音信号,计算各语音信号的傅里叶变换;
第二计算子模块(图中未示出),用于针对每个预设位置点,根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差;
第三计算子模块(图中未示出),用于根据各语音信号的傅里叶变换,以及所述该预设位置点到每两个相邻麦克风的时延差,计算所述该预设位置点到每两个相邻麦克风的广义互相关;
第四计算子模块(图中未示出),用于根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值。
作为本发明实施例的一种实施方式,所述第二计算子模块,具体用于根据以下公式,计算任一预设位置点m到任两个相邻麦克风k、l的时延差τmkl:
其中,所述Dmk为所述预设位置点m到麦克风k的距离,所述Dml为所述预设位置点m到麦克风l的距离,所述c为声速。
作为本发明实施例的一种实施方式,所述第三计算子模块,具体用于根据以下公式,计算所述任一预设位置点m到所述任两个相邻麦克风k、l的广义互相关R(τmkl):
作为本发明实施例的一种实施方式,所述第四计算子模块,具体用于根据以下公式,计算所述任一预设位置点m对应的语音功率值P(m):
其中,所述M为麦克风总数。
作为本发明实施例的一种实施方式,所述装置还包括:
确定模块(图中未示出),用于确定所述声源位置处的人体的身高;
第二计算模块(图中未示出),用于根据所述视频采集设备的坐标信息、所述视频采集设备的高度、所述声源位置的坐标信息、以及所述声源位置处的人体的身高,计算从自身到所述人体的目标距离;
调节模块(图中未示出),用于根据预先保存的各距离与焦距的对应关系,识别与所述目标距离对应的目标焦距,并调节自身的焦距为所述目标焦距。
作为本发明实施例的一种实施方式,所述确定模块,具体用于:
获取预先保存的人体平均身高,并将所获取的人体平均身高确定为所述声源位置处的人体的身高;或
采集包含所述声源位置处的人体的图像,对所述图像进行分析,得到所述声源位置处的人体的身高。
如图6所示,本发明实施例还提供了一种设备控制系统,所述系统包括:视频采集设备610、以及设置于所述视频采集设备610外部的麦克风620;
所述视频采集设备610,用于获取各麦克风620采集的语音信号,并获取所述各麦克风620的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风620采集的语音信号、所述各麦克风620的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置;
所述各麦克风620,用于采集语音信号,并将其采集的语音信号发送给所述视频采集设备610。
本发明实施例提供了一种设备控制系统,视频采集设备可以获取各麦克风采集的语音信号,并获取各麦克风的坐标信息,以及各预设位置点的坐标信息,然后根据各麦克风采集的语音信号、各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值,最后识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
对于装置/系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (13)
1.一种设备控制方法,其特征在于,应用于声源定位系统中的视频采集设备,所述声源定位系统还包括设置于所述视频采集设备外部的麦克风,所述方法包括:
获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;
根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;
识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置;
其中,所述根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值的步骤包括:
根据各麦克风采集的语音信号,计算各语音信号的傅里叶变换;
针对每个预设位置点,根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差;
根据各语音信号的傅里叶变换,以及所述该预设位置点到每两个相邻麦克风的时延差,计算所述该预设位置点到每两个相邻麦克风的广义互相关;
根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
确定所述声源位置处的人体的身高;
根据自身的坐标信息、自身的高度、所述声源位置的坐标信息、以及所述声源位置处的人体的身高,计算从自身到所述人体的目标距离;
根据预先保存的各距离与焦距的对应关系,识别与所述目标距离对应的目标焦距,并调节自身的焦距为所述目标焦距。
6.根据权利要求5所述的方法,其特征在于,所述确定所述声源位置处的人体的身高的步骤包括:
获取预先保存的人体平均身高,并将所获取的人体平均身高确定为所述声源位置处的人体的身高;或
采集包含所述声源位置处的人体的图像,对所述图像进行分析,得到所述声源位置处的人体的身高。
7.一种设备控制装置,其特征在于,应用于声源定位系统中的视频采集设备,所述声源定位系统还包括设置于所述视频采集设备外部的麦克风,所述装置包括:
获取模块,用于获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;
第一计算模块,用于根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;
控制模块,用于识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置;
其中,所述第一计算模块,包括:
第一计算子模块,用于根据各麦克风采集的语音信号,计算各语音信号的傅里叶变换;
第二计算子模块,用于针对每个预设位置点,根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差;
第三计算子模块,用于根据各语音信号的傅里叶变换,以及所述该预设位置点到每两个相邻麦克风的时延差,计算所述该预设位置点到每两个相邻麦克风的广义互相关;
第四计算子模块,用于根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值。
11.根据权利要求7-10任一项所述的装置,其特征在于,所述装置还包括:
确定模块,用于确定所述声源位置处的人体的身高;
第二计算模块,用于根据所述视频采集设备的坐标信息、所述视频采集设备的高度、所述声源位置的坐标信息、以及所述声源位置处的人体的身高,计算从自身到所述人体的目标距离;
调节模块,用于根据预先保存的各距离与焦距的对应关系,识别与所述目标距离对应的目标焦距,并调节自身的焦距为所述目标焦距。
12.根据权利要求11所述的装置,其特征在于,所述确定模块,具体用于:
获取预先保存的人体平均身高,并将所获取的人体平均身高确定为所述声源位置处的人体的身高;或
采集包含所述声源位置处的人体的图像,对所述图像进行分析,得到所述声源位置处的人体的身高。
13.一种设备控制系统,其特征在于,所述系统包括:视频采集设备、以及设置于所述视频采集设备外部的麦克风;
所述视频采集设备,用于获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置;所述根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值包括:根据各麦克风采集的语音信号,计算各语音信号的傅里叶变换;针对每个预设位置点,根据该预设位置点的坐标信息、以及各麦克风的坐标信息,计算该预设位置点到每两个相邻麦克风的时延差;根据各语音信号的傅里叶变换,以及所述该预设位置点到每两个相邻麦克风的时延差,计算所述该预设位置点到每两个相邻麦克风的广义互相关;根据该预设位置点到每两个相邻麦克风的广义互相关,计算该位置点对应的语音功率值;
所述各麦克风,用于采集语音信号,并将其采集的语音信号发送给所述视频采集设备。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611047345.8A CN108089152B (zh) | 2016-11-23 | 2016-11-23 | 一种设备控制方法、装置及系统 |
US16/462,453 US10816633B2 (en) | 2016-11-23 | 2017-10-19 | Device control method, apparatus and system |
EP17874320.9A EP3546976B1 (en) | 2016-11-23 | 2017-10-19 | Device control method, apparatus and system |
PCT/CN2017/106800 WO2018095166A1 (zh) | 2016-11-23 | 2017-10-19 | 一种设备控制方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611047345.8A CN108089152B (zh) | 2016-11-23 | 2016-11-23 | 一种设备控制方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108089152A CN108089152A (zh) | 2018-05-29 |
CN108089152B true CN108089152B (zh) | 2020-07-03 |
Family
ID=62171146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611047345.8A Active CN108089152B (zh) | 2016-11-23 | 2016-11-23 | 一种设备控制方法、装置及系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10816633B2 (zh) |
EP (1) | EP3546976B1 (zh) |
CN (1) | CN108089152B (zh) |
WO (1) | WO2018095166A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110874909A (zh) * | 2018-08-29 | 2020-03-10 | 杭州海康威视数字技术股份有限公司 | 监控方法、系统及可读存储介质 |
CN110009770A (zh) * | 2018-12-10 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种标识用户的方法、设备及门禁装置 |
CN109506568B (zh) * | 2018-12-29 | 2021-06-18 | 思必驰科技股份有限公司 | 一种基于图像识别和语音识别的声源定位方法及装置 |
CN110221797B (zh) * | 2019-05-28 | 2022-09-30 | 上海寰视网络科技有限公司 | 多屏拼接系统中信号源设备的控制方法及系统 |
CN110534105B (zh) * | 2019-07-24 | 2021-10-15 | 珠海格力电器股份有限公司 | 一种语音控制方法及装置 |
CN110398727B (zh) * | 2019-07-31 | 2023-08-01 | 深圳市康冠商用科技有限公司 | 一种设备控制方法和设备控制系统 |
CN111526295B (zh) * | 2020-04-30 | 2023-02-28 | 臻迪科技股份有限公司 | 音视频处理系统、采集方法、装置、设备及存储介质 |
CN113625223B (zh) * | 2020-05-08 | 2024-04-30 | 中信科智联科技有限公司 | 一种定位方法及终端设备 |
CN112562664A (zh) * | 2020-11-27 | 2021-03-26 | 上海仙塔智能科技有限公司 | 音响调节方法、系统、车辆及计算机存储介质 |
CN112367473A (zh) * | 2021-01-13 | 2021-02-12 | 北京电信易通信息技术股份有限公司 | 一种基于声纹到达相位的可旋转摄像装置及其控制方法 |
CN113466793B (zh) * | 2021-06-11 | 2023-10-17 | 五邑大学 | 一种基于麦克风阵列的声源定位方法、装置及存储介质 |
CN115134499B (zh) * | 2022-06-28 | 2024-02-02 | 世邦通信股份有限公司 | 一种音视频监控方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101534413A (zh) * | 2009-04-14 | 2009-09-16 | 深圳华为通信技术有限公司 | 一种远程呈现的系统、装置和方法 |
CN103841357A (zh) * | 2012-11-21 | 2014-06-04 | 中兴通讯股份有限公司 | 基于视频跟踪的麦克风阵列声源定位方法、装置及系统 |
CN104142492A (zh) * | 2014-07-29 | 2014-11-12 | 佛山科学技术学院 | 一种srp-phat多源空间定位方法 |
EP2953348A1 (en) * | 2014-06-03 | 2015-12-09 | Cisco Technology, Inc. | Determination, display, and adjustment of best sound source placement region relative to microphone |
CN205490942U (zh) * | 2016-03-16 | 2016-08-17 | 上海景瑞信息技术有限公司 | 一种基于语音识别的摄像机自动定位系统 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6731334B1 (en) * | 1995-07-31 | 2004-05-04 | Forgent Networks, Inc. | Automatic voice tracking camera system and method of operation |
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
JP2003322790A (ja) * | 2002-05-02 | 2003-11-14 | Nippon Hoso Kyokai <Nhk> | 自動焦点カメラ |
US7190775B2 (en) * | 2003-10-29 | 2007-03-13 | Broadcom Corporation | High quality audio conferencing with adaptive beamforming |
US7667728B2 (en) * | 2004-10-15 | 2010-02-23 | Lifesize Communications, Inc. | Video and audio conferencing system with spatial audio |
US7421113B2 (en) * | 2005-03-30 | 2008-09-02 | The Trustees Of The University Of Pennsylvania | System and method for localizing imaging devices |
US20080267423A1 (en) * | 2007-04-26 | 2008-10-30 | Kabushiki Kaisha Kobe Seiko Sho | Object sound extraction apparatus and object sound extraction method |
US8391472B2 (en) * | 2007-06-06 | 2013-03-05 | Dreamworks Animation Llc | Acoustic echo cancellation solution for video conferencing |
CN102318373B (zh) * | 2009-03-26 | 2014-09-10 | 松下电器产业株式会社 | 解码装置、编解码装置及解码方法 |
US8855205B2 (en) * | 2010-05-26 | 2014-10-07 | Newratek Inc. | Method of predicting motion vectors in video codec in which multiple references are allowed, and motion vector encoding/decoding apparatus using the same |
US20120250984A1 (en) * | 2010-12-01 | 2012-10-04 | The Trustees Of The University Of Pennsylvania | Image segmentation for distributed target tracking and scene analysis |
US8761412B2 (en) * | 2010-12-16 | 2014-06-24 | Sony Computer Entertainment Inc. | Microphone array steering with image-based source location |
US8693713B2 (en) * | 2010-12-17 | 2014-04-08 | Microsoft Corporation | Virtual audio environment for multidimensional conferencing |
JP5701142B2 (ja) * | 2011-05-09 | 2015-04-15 | 株式会社オーディオテクニカ | マイクロホン |
US9226088B2 (en) * | 2011-06-11 | 2015-12-29 | Clearone Communications, Inc. | Methods and apparatuses for multiple configurations of beamforming microphone arrays |
CN102395030B (zh) * | 2011-11-18 | 2014-05-07 | 杭州海康威视数字技术股份有限公司 | 基于视频压缩码流的运动分析方法、码流转换方法及其装置 |
US9246543B2 (en) * | 2011-12-12 | 2016-01-26 | Futurewei Technologies, Inc. | Smart audio and video capture systems for data processing systems |
US9197974B1 (en) * | 2012-01-06 | 2015-11-24 | Audience, Inc. | Directional audio capture adaptation based on alternative sensory input |
CN103780870B (zh) * | 2012-10-17 | 2017-11-21 | 杭州海康威视数字技术股份有限公司 | 视频图像质量诊断系统及其方法 |
TWI593294B (zh) * | 2013-02-07 | 2017-07-21 | 晨星半導體股份有限公司 | 收音系統與相關方法 |
JP6253031B2 (ja) | 2013-02-15 | 2017-12-27 | パナソニックIpマネジメント株式会社 | キャリブレーション方法 |
US9312826B2 (en) * | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
CN103235287B (zh) | 2013-04-17 | 2015-05-20 | 华北电力大学(保定) | 一种声源定位摄像追踪装置 |
CN105898185A (zh) * | 2014-11-19 | 2016-08-24 | 杜比实验室特许公司 | 调节视频会议系统中的空间一致性 |
CN105635635A (zh) * | 2014-11-19 | 2016-06-01 | 杜比实验室特许公司 | 调节视频会议系统中的空间一致性 |
US9654868B2 (en) * | 2014-12-05 | 2017-05-16 | Stages Llc | Multi-channel multi-domain source identification and tracking |
CN106210612A (zh) * | 2015-04-30 | 2016-12-07 | 杭州海康威视数字技术股份有限公司 | 视频编码方法、解码方法及其装置 |
CN104898091B (zh) | 2015-05-29 | 2017-07-25 | 复旦大学 | 基于迭代优化算法的麦克风阵列自校准声源定位系统 |
US9584758B1 (en) * | 2015-11-25 | 2017-02-28 | International Business Machines Corporation | Combining installed audio-visual sensors with ad-hoc mobile audio-visual sensors for smart meeting rooms |
US9621795B1 (en) * | 2016-01-08 | 2017-04-11 | Microsoft Technology Licensing, Llc | Active speaker location detection |
US9992580B2 (en) * | 2016-03-04 | 2018-06-05 | Avaya Inc. | Signal to noise ratio using decentralized dynamic laser microphones |
CN107437420A (zh) * | 2016-05-27 | 2017-12-05 | 富泰华工业(深圳)有限公司 | 语音信息的接收方法、系统及装置 |
US9659576B1 (en) * | 2016-06-13 | 2017-05-23 | Biamp Systems Corporation | Beam forming and acoustic echo cancellation with mutual adaptation control |
CN107026934B (zh) * | 2016-10-27 | 2019-09-27 | 华为技术有限公司 | 一种声源定位方法和装置 |
US9966059B1 (en) * | 2017-09-06 | 2018-05-08 | Amazon Technologies, Inc. | Reconfigurale fixed beam former using given microphone array |
US10110994B1 (en) * | 2017-11-21 | 2018-10-23 | Nokia Technologies Oy | Method and apparatus for providing voice communication with spatial audio |
-
2016
- 2016-11-23 CN CN201611047345.8A patent/CN108089152B/zh active Active
-
2017
- 2017-10-19 US US16/462,453 patent/US10816633B2/en active Active
- 2017-10-19 EP EP17874320.9A patent/EP3546976B1/en active Active
- 2017-10-19 WO PCT/CN2017/106800 patent/WO2018095166A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101534413A (zh) * | 2009-04-14 | 2009-09-16 | 深圳华为通信技术有限公司 | 一种远程呈现的系统、装置和方法 |
CN103841357A (zh) * | 2012-11-21 | 2014-06-04 | 中兴通讯股份有限公司 | 基于视频跟踪的麦克风阵列声源定位方法、装置及系统 |
EP2953348A1 (en) * | 2014-06-03 | 2015-12-09 | Cisco Technology, Inc. | Determination, display, and adjustment of best sound source placement region relative to microphone |
CN104142492A (zh) * | 2014-07-29 | 2014-11-12 | 佛山科学技术学院 | 一种srp-phat多源空间定位方法 |
CN205490942U (zh) * | 2016-03-16 | 2016-08-17 | 上海景瑞信息技术有限公司 | 一种基于语音识别的摄像机自动定位系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2018095166A1 (zh) | 2018-05-31 |
US20190317178A1 (en) | 2019-10-17 |
US10816633B2 (en) | 2020-10-27 |
EP3546976A4 (en) | 2019-10-09 |
EP3546976A1 (en) | 2019-10-02 |
EP3546976B1 (en) | 2021-12-08 |
CN108089152A (zh) | 2018-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108089152B (zh) | 一种设备控制方法、装置及系统 | |
US9008320B2 (en) | Apparatus, system, and method of image processing, and recording medium storing image processing control program | |
CN107820037B (zh) | 音频信号、图像处理的方法、装置和系统 | |
CN111432115B (zh) | 基于声音辅助定位的人脸追踪方法、终端及存储装置 | |
CN105611167B (zh) | 一种对焦平面调整方法及电子设备 | |
CN103685906A (zh) | 一种控制方法、控制装置及控制设备 | |
US9591229B2 (en) | Image tracking control method, control device, and control equipment | |
KR20160010590A (ko) | 자체 적응 서라운드 사운드를 구현하는 방법 및 시스템 | |
US11601731B1 (en) | Computer program product and method for auto-focusing a camera on an in-person attendee who is speaking into a microphone at a hybrid meeting that is being streamed via a videoconferencing system to remote attendees | |
CN111551921A (zh) | 一种声像联动的声源定向系统及方法 | |
KR101884446B1 (ko) | 다자간 회의에서의 화자 인식 및 화자 추적 방법 | |
CN108089153A (zh) | 一种声源定位方法、装置及系统 | |
KR101976937B1 (ko) | 마이크로폰 어레이를 이용한 회의록 자동작성장치 | |
CN114270802A (zh) | 信息处理装置、信息处理方法和程序 | |
CN104954730B (zh) | 一种播放视频的方法及装置 | |
US20240064485A1 (en) | Systems and methods for sound-enhanced meeting platforms | |
CN118202641A (zh) | 用于房间智能的会议系统及方法 | |
Ronzhin et al. | A software system for the audiovisual monitoring of an intelligent meeting room in support of scientific and education activities | |
CN112073668B (zh) | 一种远程教室互动方法、系统、装置和存储介质 | |
CN110730378A (zh) | 一种信息处理方法及系统 | |
Chen et al. | Speaker tracking and identifying based on indoor localization system and microphone array | |
WO2023276701A1 (ja) | 話者ダイアライゼーションシステム、コミュニケーション解析システム、及び、発話量推定方法 | |
WO2023276700A1 (ja) | 注力判定システム、コミュニケーション解析システム、及び、注力判定方法 | |
Minoh | Automatic lecture archiving system | |
KR101687676B1 (ko) | 강의 콘텐츠 운용 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |