CN110632582A - 声源定位方法、装置及存储介质 - Google Patents
声源定位方法、装置及存储介质 Download PDFInfo
- Publication number
- CN110632582A CN110632582A CN201910912441.1A CN201910912441A CN110632582A CN 110632582 A CN110632582 A CN 110632582A CN 201910912441 A CN201910912441 A CN 201910912441A CN 110632582 A CN110632582 A CN 110632582A
- Authority
- CN
- China
- Prior art keywords
- coordinate system
- coordinate
- sound source
- value
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000006243 chemical reaction Methods 0.000 claims abstract description 49
- 230000005236 sound signal Effects 0.000 claims abstract description 41
- 230000004807 localization Effects 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 9
- 238000012544 monitoring process Methods 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000009434 installation Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101000912561 Bos taurus Fibrinogen gamma-B chain Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S11/00—Systems for determining distance or velocity not using reflection or reradiation
- G01S11/14—Systems for determining distance or velocity not using reflection or reradiation using ultrasonic, sonic, or infrasonic waves
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本申请涉及一种声源定位方法、装置及存储介质,属于计算机技术领域,该方法包括:在采集到目标声音信号时,确定目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,第一坐标系是基于音频采集组件的位置建立的;获取坐标转换关系;使用坐标转换关系将第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集第二坐标系坐标值对应的声源的图像,第二坐标系是基于音频采集组件和图像采集组件的位置建立的;可以解决使用第一坐标系坐标值来采集声源图像,采集结果不准确的问题;第二坐标系为音频采集组件和图像采集组件共有的坐标系,因此根据第二坐标系坐标值来采集声源图像可以提高采集结果的准确性。
Description
技术领域
本申请涉及声源定位方法、装置及存储介质,属于计算机技术领域。
背景技术
城区内车辆鸣笛会严重扰民,故大多地区规定城区内禁止车辆鸣笛。为了保证对违章鸣笛的监测,需要对鸣笛位置进行定位,并将该鸣笛位置传输至车牌抓拍装置,车牌抓拍装置抓拍违章鸣笛的车辆的车牌号并存储。
中国专利201710062470.4公开了一种汽车鸣笛执法取证系统,该系统包括鸣笛监测系统和高清摄像机抓拍系统,利用鸣笛监测系统采集声音信号并输出鸣笛坐标,然后将鸣笛坐标发送至高清摄像机抓拍系统,利用高清摄像机对车牌进行抓取。其中,鸣笛坐标是鸣笛检测系统基于自有坐标系确定的,该自有坐标系是以鸣笛检测系统为坐标原点建立的。
但是,鸣笛监测系统检测到的鸣笛坐标可能并不适用于高清摄像机,高清摄像机直接根据该鸣笛坐标抓拍车牌,可能导致抓拍到错误车牌的问题,声源定位结果不准确。
发明内容
本申请提供了一种声源定位方法、装置及存储介质,可以解决使用第一坐标系坐标值来采集声源图像,采集结果不准确的问题。本申请提供如下技术方案:
第一方面,提供了一种声源定位方法,所述方法包括:
在采集到所述目标声音信号时,确定所述目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,所述第一坐标系是基于音频采集组件的位置建立的,所述音频采集组件用于采集所述目标声音信号;
获取坐标转换关系;
使用所述坐标转换关系将所述第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集所述第二坐标系坐标值对应的声源的图像,所述第二坐标系是基于所述音频采集组件和所述图像采集组件的位置建立的,所述图像采集组件用于采集所述声源的图像。
可选地,所述获取坐标转换关系,包括:
确定所述第一坐标系相对于所述第二坐标系的偏转角度;
基于所述偏转角度确定预设的坐标转换公式的参数,得到所述坐标转换关系,所述坐标转换关系以所述第一坐标系坐标值为变量。
可选地,所述确定所述第一坐标系相对于所述第二坐标系的偏转角度,包括:
在有效采集区域内的参考位置发出所述目标声音信号后,获取所述参考位置在所述第一坐标系中的第一坐标系参考坐标值;
获取所述参考位置在所述第二坐标系中的实际参考位置;
获取k组预测坐标系偏转角度;所述k为正整数,所述预测坐标系偏转角度是指预测的所述第一坐标系相对于所述第二坐标系的偏转角度;
对于每组预测坐标系偏转角度,将所述第一坐标系参考坐标值、所述预测坐标系偏转角度代入所述坐标转换公式中,得到所述参考位置在所述第二坐标系中的第二坐标系参考坐标值;
基于所述实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异,从所述多组预测坐标系偏转角度中确定所述偏转角度。
可选地,所述基于所述实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异,从所述多组预测坐标系偏转角度中确定所述偏转角度,包括:
构建代价函数,所述代价函数用于指示所述实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异;
从所述多组预测坐标系中确定代价函数最小的预测坐标系偏转角度,得到所述偏转角度。
可选地,所述参考位置的个数为n个,所述n为大于1的整数;
所述基于所述偏转角度确定预设的坐标转换公式的参数,得到所述坐标转换关系,包括:
获取n个参考位置中每个参考位置对应的偏转角度;
计算n个偏转角度的期望值,得到所述坐标转换公式的参数。
可选地,在所述参考位置发出所述目标声音信号的次数为m次,所述m为大于1的整数;
所述获取所述参考位置在所述第一坐标系中的第一坐标系参考坐标值,包括:
获取每次发出所述目标声音信号后,所述参考位置在所述第一坐标系中的坐标位置;
计算所述坐标位置的期望值,得到所述第一坐标系参考坐标值。
可选地,所述坐标转换公式包括:
第二方面,提供了一种声源定位装置,所述装置包括:
第一确定模块,用于在采集到所述目标声音信号时,确定所述目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,所述第一坐标系是基于音频采集组件的位置建立的,所述音频采集组件用于采集所述目标声音信号;
关系获取模块,用于获取坐标转换关系;
第二确定模块,用于使用所述坐标转换关系将所述第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集所述第二坐标系坐标值对应的声源的图像,所述第二坐标系是基于所述音频采集组件和所述图像采集组件的位置建立的,所述图像采集组件用于采集所述声源的图像。
第三方面,提供一种声源定位装置,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现第一方面所述的声源定位方法。
第四方面,提供一种计算机可读存储介质,所述存储介质中存储有程序,所述程序由所述处理器加载并执行以实现第一方面所述的声源定位方法。
本申请的有益效果在于:通过在采集到目标声音信号时,确定目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,第一坐标系是基于音频采集组件的位置建立的;获取坐标转换关系;使用坐标转换关系将第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集第二坐标系坐标值对应的声源的图像,第二坐标系是基于音频采集组件和图像采集组件的位置建立的;可以解决使用第一坐标系坐标值来采集声源图像,采集结果不准确的问题;由于在确定出第一坐标系坐标值后,会将该第一坐标系坐标值转换至第二坐标系中得到第二坐标系坐标值;第二坐标系为音频采集组件和图像采集组件共有的坐标系,即,音频采集组件确定出的第二坐标系坐标值对于图像采集组件同样适用,因此,根据第二坐标系坐标值来采集声源图像可以提高采集结果的准确性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。
附图说明
图1是本申请一个实施例提供的声源定位系统的结构示意图;
图2是本申请一个实施例提供的声源定位方法的流程图;
图3是本申请一个实施例提供的第一坐标系的示意图;
图4是本申请一个实施例提供的第一坐标系和第二坐标系的示意图;
图5是本申请一个实施例提供的声源定位装置的框图;
图6是本申请一个实施例提供的声源定位装置的框图。
具体实施方式
下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
图1是本申请一个实施例提供的声源定位系统的结构示意图,如图1所示,该系统至少包括:音频采集组件110和图像采集组件120。
音频采集组件110可以是麦克风或者麦克风阵列等具有采集声音信号功能的设备,本实施例不对音频采集组件110的类型作限定。
可选地,音频采集组件110用于:在采集到目标声音信号时,确定目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值;获取坐标转换关系;使用坐标转换关系将第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值。
其中,第一坐标系是基于音频采集组件的位置建立的。第一坐标系坐标值可以是球坐标系的坐标值;当然,也可以是笛卡尔坐标系的坐标值,本实施例不对第一坐标系坐标值的表示形式作限定。可选地,第一坐标系的坐标原点为音频采集组件所在的位置。
第二坐标系是基于音频采集组件110和图像采集组件120的位置建立的。换句话说,第二坐标系是音频采集组件110和图像采集组件120共有的坐标系。可选地,第二坐标系的一个坐标平面与地面平行。第二坐标系坐标值可以是球坐标系的坐标值;当然,也可以是笛卡尔坐标系的坐标值,本实施例不对第二坐标系坐标值的表示形式作限定。
音频采集组件110通过有线或者无线的方式与图像采集组件120通信连接。
图像采集组件120可以是摄像机、照相机等具有图像采集功能的设备,本实施例不对图像采集组件120的类型作限定。
图像采集组件120用于采集第二坐标系坐标值对应的声源的图像。
需要补充说明的是,音频采集组件110获取到第一坐标系坐标值之后,也可以将该第一坐标系坐标值发送至其它设备,以触发其它设备执行获取坐标转换关系;使用坐标转换关系将第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值的步骤,本申请中仅以音频采集组件执行上述步骤为例进行说明。其它设备可以是计算机、手机、图像采集组件120、平板电脑、服务器等,本实施例不对其它设备的类型作限定。
另外,声源定位系统和对应的声源定位方法的应用场景包括但不限于以下几种中的至少一种:
1、鸣笛监测场景。即,音频采集组件110定位鸣笛位置,触发图像采集组件120抓拍该鸣笛位置的车辆的图像。
2、课堂监控场景。即,音频采集组件110定位学生说话位置,触发图像采集组件120抓拍该说话位置的学生的图像。
3、视频会议场景。即,音频采集组件110当前参会人员说话的发言位置,触发图像采集组件120该发言位置的参会人员的图像。
当然,该声源定位系统和声源定位方法还可以应用于类似的其它场景中,本申请在此不再一一列举。
图2是本申请一个实施例提供的声源定位方法的流程图,本实施例以该方法应用于图1所示的声源定位系统中,且各个步骤的执行主体为该系统中的音频采集组件110为例进行说明。该方法至少包括以下几个步骤:
步骤201,在采集到目标声音信号时,确定目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,该第一坐标系是基于音频采集组件的位置建立的。
音频采集组件用于采集目标声音信号。
可选地,第一坐标系为三维坐标系,且坐标原点为音频采集组件的位置。
示意性地,音频采集组件110可以使用麦克风阵列的声源定位方法确定目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,该声源定位方法包括基于波束形成器、基于高分辨频谱估计、基于时延差等,本实施例不对该声源定位方法的类型作限定。
参考图3所示的第一坐标系(包括坐标原点o’、x’轴、y’轴和z’轴)和声源位置之间的示意图,声源s在第一坐标系中第一坐标系坐标值为 该第一坐标系坐标值通过球坐标系的坐标值表示。在实际实现时,第一坐标系坐标值也可以通过笛卡尔坐标系的坐标值来表示,即:
本申请不对第一坐标系坐标值的表示方式作限定。其中,为声源位置与第一坐标系的坐标原点之间的连线在x’o’y’平面的投影与x’轴的夹角(又称水平角);θ为声源位置与第一坐标系的坐标原点之间的连线与z’轴的夹角(又称俯仰角);r为声源位置与第一坐标系的坐标原点之间的距离。
步骤202,获取坐标转换关系。
在一个示例中,坐标转换关系存储在存储介质中,比如:坐标转换关系通过RS232/485或以太网Ethernet预先写入只读存储器(Read-Only Memory,ROM)中,音频采集组件110从ROM中读取坐标转换关系。
在另一个示例中,坐标转换关系通过多次标定过程得到。此时,获取坐标转换关系,包括:确定第一坐标系相对于第二坐标系的偏转角度;基于偏转角度确定预设的坐标转换公式的参数,得到坐标转换关系,坐标转换关系以第一坐标系坐标值为变量。
可选地,第二坐标系是基于音频采集组件和图像采集组件的位置建立的。即,第二坐标系是音频采集组件和图像采集组件共有的坐标系。此时,音频采集组件确定出的坐标值对于图像采集组件同样适用。
第一坐标系相对于第二坐标系存在三个方向的夹角(α’,β’,γ’),α’为第一坐标系的x’轴相对于第二坐标系的x轴的夹角;β’为第一坐标系的y’轴相对于第二坐标系的y轴的夹角;γ’为第一坐标系的z’轴相对于第二坐标系的z轴的夹角。参考图4所示的第一坐标系与第二坐标系(包括坐标原点o、x轴、y轴和z轴)之间的相对位置关系图。
可选地,确定第一坐标系相对于第二坐标系的偏转角度,包括:在有效采集区域内的参考位置发出目标声音信号后,获取参考位置在第一坐标系中的第一坐标系参考坐标值;获取参考位置在第二坐标系中的实际参考位置;获取k组预测坐标系偏转角度;预测坐标系偏转角度是指预测的第一坐标系相对于第二坐标系的偏转角度;对于每组预测坐标系偏转角度,将第一坐标系参考坐标值、预测坐标系偏转角度代入坐标转换公式中,得到参考位置在第二坐标系中的第二坐标系参考坐标值;基于实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异,从多组预测坐标系偏转角度中确定偏转角度。
有效采集区域是指音频采集组件对声音信号的有效采集范围。
其中,基于实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异,从多组预测坐标系偏转角度中确定偏转角度,包括:构建代价函数,代价函数用于指示实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异;从多组预测坐标系中确定代价函数最小的预测坐标系偏转角度,得到偏转角度。
代价函数的求解方法包括但不限于:梯度下降法、牛顿法、莱温柏杰-马夸德(Levenberg-Marquard,LM)法等,本实施例在此不再一一列举。
可选地,参考位置的个数为n个,n为大于1的整数;此时,基于偏转角度确定预设的坐标转换公式的参数,得到坐标转换关系,包括:获取n个参考位置中每个参考位置对应的偏转角度;计算n个偏转角度的期望值,得到坐标转换公式的参数。
可选地,在参考位置发出目标声音信号的次数为m次,m为大于1的整数;此时,获取参考位置在第一坐标系中的第一坐标系参考坐标值,包括:获取每次发出目标声音信号后,参考位置在第一坐标系中的坐标位置;计算坐标位置的期望值,得到第一坐标系参考坐标值。
其中,坐标位置的期望值可以是对同一参考位置的m次坐标位置取平均值得到的。
为了更清楚地理解上述标定过程,下面以一个实例对转换关系的获取过程进行介绍,本实例中以目标声音信号为鸣笛信号为例进行说明。假设在有效采集区域内的参考位置为n个,每个参考位置鸣笛次数为m次,每次得到的n个位置的m个坐标位置通过如下矩阵U表示:
对矩阵U中每个参考位置的m个坐标位置取平均值,得到各个参考位置在第一坐标系中最准确的点(即,第一坐标系参考坐标值),n个参考位置的第一坐标系参考坐标值通过下述矩阵表示:
假设预测坐标系偏转角度通过(α,β,γ)表示,α为第一坐标系的x’轴相对于第二坐标系的x轴的预测夹角;β为第一坐标系的y’轴相对于第二坐标系的y轴的预测夹角;γ为第一坐标系的z’轴相对于第二坐标系的z轴的预测夹角。α为从[-100°,100°]中取的i个值(i为正整数),比如:100个值,且为αi(i=1...100),β为从[-100°,100°]中取的j个值(j为正整数),比如:100个值,且为βj(j=1...100),γ为从[-100°,100°]中取的h个值(h为正整数),比如:100个值,且为γh(h=1...100),由于每个方向的偏转角度均为100个值,则可以构成100*100*100=1000000组预测坐标系偏转角度。
当然,上述α,β和γ的角度取值范围也可以是其它范围,本实施例对此不作限定。
坐标转换公式包括:
将上述第一坐标系参考坐标值和每组预测坐标系偏转角度代入上述坐标转换公式,得到每个参考位置在第二坐标系中的第二坐标系参考坐标值其中,t=1...1000000。
将代价函数值最小的预测坐标系偏转角度确定为当前参考位置对应的偏转角度。最后,取n个参考位置的偏转角度的平均值,得到坐标转换公式的参数;或者,将n个参考位置的偏转角度代入上述矩阵得到n组然后对n组取平均值,得到最终的转换矩阵 从而得到最终的坐标转换关系。
步骤203,使用坐标转换关系将第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集第二坐标系坐标值对应的声源的图像,该第二坐标系是基于音频采集组件和图像采集组件的位置建立的。
图像采集组件用于采集声源的图像。
由于坐标转换关系是以第一坐标系坐标值为变量,因此,可以通过向坐标转换关系输入当前的第一坐标系坐标值,得到第二坐标系坐标值。
综上所述,本实施例提供的声源定位方法,通过在采集到目标声音信号时,确定目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,第一坐标系是基于音频采集组件的位置建立的;获取坐标转换关系;使用坐标转换关系将第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集第二坐标系坐标值对应的声源的图像,第二坐标系是基于音频采集组件和图像采集组件的位置建立的;可以解决使用第一坐标系坐标值来采集声源图像,采集结果不准确的问题;由于在确定出第一坐标系坐标值后,会将该第一坐标系坐标值转换至第二坐标系中得到第二坐标系坐标值;第二坐标系为音频采集组件和图像采集组件共有的坐标系,即,音频采集组件确定出的第二坐标系坐标值对于图像采集组件同样适用,因此,根据第二坐标系坐标值来采集声源图像可以提高采集结果的准确性。
另外,通过在参考位置发出目标声音信号来对音频采集组件的偏转角度进行标定,无需测量音频采集组件的安装偏转角度,可以降低确定音频采集组件的偏转角度的难度,提高确定效率。
另外,音频采集组件无需相对于图像采集组件固定设置在某一特定位置,可以简化音频采集组件的安装条件,提高安装效率。
另外,对音频采集组件的偏转角度只需要进行一次标定(当然,也可以每隔一段时间进行一次标定)即可在坐标转换关系中重复使用,可以快速地确定出第二坐标系坐标值,保证确定第二坐标系坐标值的及时性。
图5是本申请一个实施例提供的声源定位装置的框图,本实施例以该装置应用于图1所示的声源定位系统中的音频采集组件110中为例进行说明。该装置至少包括以下几个模块:第一确定模块510、关系获取模块520和第二确定模块530。
第一确定模块510,用于在采集到所述目标声音信号时,确定所述目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,所述第一坐标系是基于音频采集组件的位置建立的,所述音频采集组件用于采集所述目标声音信号;
关系获取模块520,用于获取坐标转换关系;
第二确定模块530,用于使用所述坐标转换关系将所述第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集所述第二坐标系坐标值对应的声源的图像,所述第二坐标系是基于所述音频采集组件和所述图像采集组件的位置建立的,所述图像采集组件用于采集所述声源的图像。
相关细节参考上述方法实施例。
需要说明的是:上述实施例中提供的声源定位装置在进行声源定位时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将声源定位装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的声源定位装置与声源定位方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图6是本申请一个实施例提供的声源定位装置的框图,该装置可以是图1所示的声源定位系统中的音频采集组件110。该装置至少包括处理器601和存储器602。
处理器601可以包括一个或多个处理核心,比如:4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器601所执行以实现本申请中方法实施例提供的声源定位方法。
在一些实施例中,声源定位装置还可选包括有:外围设备接口和至少一个外围设备。处理器601、存储器602和外围设备接口之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口相连。示意性地,外围设备包括但不限于:射频电路、音频电路、音频采集电路和电源等。
当然,声源定位装置还可以包括更少或更多的组件,本实施例对此不作限定。
可选地,本申请还提供有一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的声源定位方法。
可选地,本申请还提供有一种计算机产品,该计算机产品包括计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的声源定位方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种声源定位方法,其特征在于,所述方法包括:
在采集到所述目标声音信号时,确定所述目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,所述第一坐标系是基于音频采集组件的位置建立的,所述音频采集组件用于采集所述目标声音信号;
获取坐标转换关系;
使用所述坐标转换关系将所述第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集所述第二坐标系坐标值对应的声源的图像,所述第二坐标系是基于所述音频采集组件和所述图像采集组件的位置建立的,所述图像采集组件用于采集所述声源的图像。
2.根据权利要求1所述的方法,其特征在于,所述获取坐标转换关系,包括:
确定所述第一坐标系相对于所述第二坐标系的偏转角度;
基于所述偏转角度确定预设的坐标转换公式的参数,得到所述坐标转换关系,所述坐标转换关系以所述第一坐标系坐标值为变量。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一坐标系相对于所述第二坐标系的偏转角度,包括:
在有效采集区域内的参考位置发出所述目标声音信号后,获取所述参考位置在所述第一坐标系中的第一坐标系参考坐标值;
获取所述参考位置在所述第二坐标系中的实际参考位置;
获取k组预测坐标系偏转角度;所述k为正整数,所述预测坐标系偏转角度是指预测的所述第一坐标系相对于所述第二坐标系的偏转角度;
对于每组预测坐标系偏转角度,将所述第一坐标系参考坐标值、所述预测坐标系偏转角度代入所述坐标转换公式中,得到所述参考位置在所述第二坐标系中的第二坐标系参考坐标值;
基于所述实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异,从所述多组预测坐标系偏转角度中确定所述偏转角度。
4.根据权利要求3所述的方法,其特征在于,所述基于所述实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异,从所述多组预测坐标系偏转角度中确定所述偏转角度,包括:
构建代价函数,所述代价函数用于指示所述实际参考位置与每组预测坐标系偏转角度对应的第二坐标系参考坐标值之间的差异;
从所述多组预测坐标系中确定代价函数最小的预测坐标系偏转角度,得到所述偏转角度。
5.根据权利要求3所述的方法,其特征在于,所述参考位置的个数为n个,所述n为大于1的整数;
所述基于所述偏转角度确定预设的坐标转换公式的参数,得到所述坐标转换关系,包括:
获取n个参考位置中每个参考位置对应的偏转角度;
计算n个偏转角度的期望值,得到所述坐标转换公式的参数。
6.根据权利要求3所述的方法,其特征在于,在所述参考位置发出所述目标声音信号的次数为m次,所述m为大于1的整数;
所述获取所述参考位置在所述第一坐标系中的第一坐标系参考坐标值,包括:
获取每次发出所述目标声音信号后,所述参考位置在所述第一坐标系中的坐标位置;
计算所述坐标位置的期望值,得到所述第一坐标系参考坐标值。
8.一种声源定位装置,其特征在于,所述装置包括:
第一确定模块,用于在采集到所述目标声音信号时,确定所述目标声音信号的声源位置在第一坐标系中的第一坐标系坐标值,所述第一坐标系是基于音频采集组件的位置建立的,所述音频采集组件用于采集所述目标声音信号;
关系获取模块,用于获取坐标转换关系;
第二确定模块,用于使用所述坐标转换关系将所述第一坐标系坐标值转换至第二坐标系,得到第二坐标系坐标值,以触发图像采集组件采集所述第二坐标系坐标值对应的声源的图像,所述第二坐标系是基于所述音频采集组件和所述图像采集组件的位置建立的,所述图像采集组件用于采集所述声源的图像。
9.一种声源定位装置,其特征在于,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的声源定位方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有程序,所述程序被处理器执行时用于实现如权利要求1至7任一项所述的声源定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910912441.1A CN110632582B (zh) | 2019-09-25 | 2019-09-25 | 声源定位方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910912441.1A CN110632582B (zh) | 2019-09-25 | 2019-09-25 | 声源定位方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110632582A true CN110632582A (zh) | 2019-12-31 |
CN110632582B CN110632582B (zh) | 2022-03-29 |
Family
ID=68974199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910912441.1A Active CN110632582B (zh) | 2019-09-25 | 2019-09-25 | 声源定位方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110632582B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111260313A (zh) * | 2020-01-09 | 2020-06-09 | 苏州科达科技股份有限公司 | 发言者的识别方法、会议纪要生成方法、装置及电子设备 |
CN111323751A (zh) * | 2020-03-25 | 2020-06-23 | 苏州科达科技股份有限公司 | 声源定位方法、装置及存储介质 |
CN111551899A (zh) * | 2020-03-31 | 2020-08-18 | 河北科技大学 | 超声波定位方法、终端设备及存储介质 |
CN111785032A (zh) * | 2020-06-22 | 2020-10-16 | 杭州海康威视数字技术股份有限公司 | 音频信号定位方法、装置、电子设备及智能交通系统 |
CN113093106A (zh) * | 2021-04-09 | 2021-07-09 | 北京华捷艾米科技有限公司 | 一种声源定位方法及系统 |
CN113497914A (zh) * | 2020-03-20 | 2021-10-12 | 阿里巴巴集团控股有限公司 | 信息确定方法及系统、电子设备、自主移动设备、摄像头 |
CN113625223A (zh) * | 2020-05-08 | 2021-11-09 | 大唐高鸿数据网络技术股份有限公司 | 一种定位方法及终端设备 |
CN113639639A (zh) * | 2021-08-31 | 2021-11-12 | 追觅创新科技(苏州)有限公司 | 位置数据的数据处理方法、装置及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6446672A (en) * | 1987-08-17 | 1989-02-21 | Nippon Avionics Co Ltd | Searching and displaying device for sound source position |
JP2000075014A (ja) * | 1998-09-01 | 2000-03-14 | Isuzu Motors Ltd | 音源探索方法 |
CN106653041A (zh) * | 2017-01-17 | 2017-05-10 | 北京地平线信息技术有限公司 | 音频信号处理设备、方法和电子设备 |
CN106842131A (zh) * | 2017-03-17 | 2017-06-13 | 浙江宇视科技有限公司 | 麦克风阵列声源定位方法及装置 |
CN106875678A (zh) * | 2017-01-23 | 2017-06-20 | 上海良相智能化工程有限公司 | 一种汽车鸣笛执法取证系统 |
CN107820037A (zh) * | 2016-09-14 | 2018-03-20 | 南京中兴新软件有限责任公司 | 音频信号、图像处理的方法、装置和系统 |
CN108682161A (zh) * | 2018-08-10 | 2018-10-19 | 东方智测(北京)科技有限公司 | 确认车辆鸣笛的方法和系统 |
CN109683135A (zh) * | 2018-12-28 | 2019-04-26 | 科大讯飞股份有限公司 | 一种声源定位方法及装置、目标抓拍系统 |
-
2019
- 2019-09-25 CN CN201910912441.1A patent/CN110632582B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6446672A (en) * | 1987-08-17 | 1989-02-21 | Nippon Avionics Co Ltd | Searching and displaying device for sound source position |
JP2000075014A (ja) * | 1998-09-01 | 2000-03-14 | Isuzu Motors Ltd | 音源探索方法 |
CN107820037A (zh) * | 2016-09-14 | 2018-03-20 | 南京中兴新软件有限责任公司 | 音频信号、图像处理的方法、装置和系统 |
CN106653041A (zh) * | 2017-01-17 | 2017-05-10 | 北京地平线信息技术有限公司 | 音频信号处理设备、方法和电子设备 |
CN106875678A (zh) * | 2017-01-23 | 2017-06-20 | 上海良相智能化工程有限公司 | 一种汽车鸣笛执法取证系统 |
CN106842131A (zh) * | 2017-03-17 | 2017-06-13 | 浙江宇视科技有限公司 | 麦克风阵列声源定位方法及装置 |
CN108682161A (zh) * | 2018-08-10 | 2018-10-19 | 东方智测(北京)科技有限公司 | 确认车辆鸣笛的方法和系统 |
CN109683135A (zh) * | 2018-12-28 | 2019-04-26 | 科大讯飞股份有限公司 | 一种声源定位方法及装置、目标抓拍系统 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111260313A (zh) * | 2020-01-09 | 2020-06-09 | 苏州科达科技股份有限公司 | 发言者的识别方法、会议纪要生成方法、装置及电子设备 |
CN113497914A (zh) * | 2020-03-20 | 2021-10-12 | 阿里巴巴集团控股有限公司 | 信息确定方法及系统、电子设备、自主移动设备、摄像头 |
CN111323751A (zh) * | 2020-03-25 | 2020-06-23 | 苏州科达科技股份有限公司 | 声源定位方法、装置及存储介质 |
CN111323751B (zh) * | 2020-03-25 | 2022-08-02 | 苏州科达科技股份有限公司 | 声源定位方法、装置及存储介质 |
CN111551899A (zh) * | 2020-03-31 | 2020-08-18 | 河北科技大学 | 超声波定位方法、终端设备及存储介质 |
CN113625223A (zh) * | 2020-05-08 | 2021-11-09 | 大唐高鸿数据网络技术股份有限公司 | 一种定位方法及终端设备 |
CN113625223B (zh) * | 2020-05-08 | 2024-04-30 | 中信科智联科技有限公司 | 一种定位方法及终端设备 |
CN111785032A (zh) * | 2020-06-22 | 2020-10-16 | 杭州海康威视数字技术股份有限公司 | 音频信号定位方法、装置、电子设备及智能交通系统 |
CN113093106A (zh) * | 2021-04-09 | 2021-07-09 | 北京华捷艾米科技有限公司 | 一种声源定位方法及系统 |
CN113639639A (zh) * | 2021-08-31 | 2021-11-12 | 追觅创新科技(苏州)有限公司 | 位置数据的数据处理方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110632582B (zh) | 2022-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110632582B (zh) | 声源定位方法、装置及存储介质 | |
CN111323751B (zh) | 声源定位方法、装置及存储介质 | |
CN110491060B (zh) | 一种机器人及其安全监控方法、装置及存储介质 | |
US20200209365A1 (en) | Laser data calibration method and robot using the same | |
CN113447923A (zh) | 目标检测方法、装置、系统、电子设备及存储介质 | |
CN111815707A (zh) | 点云确定方法、点云筛选方法、装置、计算机设备 | |
CN116229036B (zh) | 数据采集系统、方法、计算机设备及存储介质 | |
CN109828250B (zh) | 一种雷达标定方法、标定装置及终端设备 | |
CN113744348A (zh) | 一种参数标定方法、装置及雷视融合检测设备 | |
CN111553956A (zh) | 拍摄装置的标定方法、装置、电子设备和存储介质 | |
CN112198878B (zh) | 一种即时地图构建方法、装置、机器人及存储介质 | |
CN111105465A (zh) | 一种摄像装置校准方法、装置、系统电子设备及存储介质 | |
US20180278914A1 (en) | Image generation system and image generation method | |
CN111445513A (zh) | 基于深度图像的植株冠层体积获取方法、装置、计算机设备和存储介质 | |
CN115265366A (zh) | 物体的变形检测方法、装置、终端设备和存储介质 | |
CN111862208B (zh) | 一种基于屏幕光通信的车辆定位方法、装置及服务器 | |
CN109003686A (zh) | 核电站松脱部件的定位方法、装置、计算机设备及存储介质 | |
CN114063024A (zh) | 传感器的标定方法、装置、电子设备和存储介质 | |
CN115457202B (zh) | 一种三维模型更新的方法、装置及存储介质 | |
KR102177460B1 (ko) | 사물인터넷을 기반으로 선박 접안 시 항만 시설의 손상을 예방하는 방법 및 시스템 | |
CN111336938A (zh) | 一种机器人及其物体距离检测方法和装置 | |
CN114140608B (zh) | 一种光伏板标记方法、装置、电子设备及存储介质 | |
CN113188569B (zh) | 车辆与激光雷达的坐标系标定方法、设备及存储介质 | |
CN111223139A (zh) | 目标定位方法及终端设备 | |
CN115507840A (zh) | 一种栅格地图构建方法、栅格地图构建装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |