CN106597378A - 机器人声源定位学习中视觉示教声源角度的方法 - Google Patents
机器人声源定位学习中视觉示教声源角度的方法 Download PDFInfo
- Publication number
- CN106597378A CN106597378A CN201611216416.2A CN201611216416A CN106597378A CN 106597378 A CN106597378 A CN 106597378A CN 201611216416 A CN201611216416 A CN 201611216416A CN 106597378 A CN106597378 A CN 106597378A
- Authority
- CN
- China
- Prior art keywords
- sound source
- angle
- robot
- learning
- learning machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Manipulator (AREA)
Abstract
本发明公开了一种机器人声源定位学习中的视觉示教声源角度的方法,其步骤是:将云台正前方与机器人正前方进行校准;在机器人平台的合适位置安装麦克风阵列;构造视觉示教板,构造一个能够学习非线性函数的学习机,用于声源角度学习;选定一个需要示教的空间位置,点声源持续发声,控制摄像头的云台运动,令示教板的几何图形的几何中心位于摄像头感知区域的中心,将此时云台的方位角和俯仰角作为声源相对于机器人的方位角和俯仰角;将多个相对时延值声源定位学习机的输入值,将声源相对于机器人的方位角和俯仰角作为声源定位学习机的目标值,对声源定位学习机进行训练。本发明可以为声源定位学习机的在线学习提供声源角度。
Description
技术领域
本发明涉及人机交互技术,特别涉及一种机器人声源定位学习中的视觉示教声源角度的方法,即利用视觉方式提供机器人声源定位学习中所需的声源角度的方法。
背景技术
声源定位对于提高机器人的环境感知和理解以及友好的人机交互能力具有重要意义。现有的机器人声源定位方法主要有基于双耳的方法和基于阵列的方法两大类。这些声源定位方法大多是依据麦克风的几何位置关系以及对声学环境的各种假设,人工构造声源定位函数。为了使得构造出的声源定位方法可解或者减少计算量,必须进行多种假设,例如近场模型、远场模型、窄带信号等。由于这些假设与实际应用环境不相符,且无法综合考虑机器人声源定位中的多种约束,导致机器人声源定位的性能无法满足实用要求。
如果能够利用机器学习的方法以在线学习方式得到声源定位函数,将能够解决声源定位过程中由于定位函数所引入各种假设造成的定位性能下降问题。但是,以学习方式得到某种函数的前提是具有示教条件。针对机器人声源定位学习问题中的声源角度示教问题,本发明利用视频示教的方式来提供声源角度。
发明内容
本发明的目的在于提供一种声源定位学习中的视觉示教声源角度的方法。
本发明的目的是这样实现的:
一种机器人声源定位学习中视觉示教声源角度的方法,其特征在于,包括如下步骤:
(1)将具有云台的摄像机安装在机器人平台上,使得云台的方位角为0°时,摄像机的视线方向与机器人正前方重合,云台的俯仰角为0°时,摄像机的视线方向与水平面间的角度为0°;
(2)在机器人平台上安装M个麦克风,构成麦克风阵列以拾取声音信号,至少存在一个麦克风与其它麦克风中的至少一个位于不同平面,其中M>3;
(3)构造视觉示教板,该视觉示教板上具有易于识别的规则平面几何图形,在所述规则平面图形的几何中心安装一个点声源;
(4)构造一个能够学习非线性函数的学习机,该学习机具有I个输入,I是从M个不同的麦克风中取出2个麦克风的组合数,该学习机具有2个输出,分别对应点声源的方位角和俯仰角;
(5)选定一个需要示教的空间位置,令视觉示教板具有规则平面几何图形的一面朝向摄像机,控制摄像头的云台运动,令视觉示教板的规则平面几何图形的几何中心位于摄像头感知区域的中心,此时云台的方位角β和俯仰角γ看作是声源相对于机器人的方位角和俯仰角;
(6)令位于规则几何图形中心的点声源持续发声,利用数据采集卡对各麦克风感知到的信号进行采样,令采样点数为N点,记第i个麦克风所采集到的声音信号序列为si[n],0≤i≤M-1,0≤n≤N-1;
(7)从M个不同的声音信号序列中取出2个不同的序列Si[n]和Sj[n],计算它们之间的时延τij,τij的数目与I相同;
(8)将I个时延τij作为学习机的输入,方位角β和俯仰角γ作为目标值,构成训练样本对学习机进行训练;
(9)重复步骤(5)-(8),直至任务结束。
由于采用上述技术方案,本发明提供的一种声源定位学习中的视觉示教声源角度的方法,与现有技术相比具有这样的有益效果:
机器人具有声源定位能力对于提高机器人的环境感知能力和人机交互能力具有重要意义。现有的声源定位方法,大多数需要对声学环境做出某些假设,另外,从计算的可行性方面考虑,对麦克风的拓扑结构有较为严格的限制。利用视觉示教声源位置的方法,可以忽略上述约束,而是通过机器学习的方式来获得声源定位函数,可以提高机器人对声源的定位精度。
附图说明
图1是机器人声源定位学习中视觉示教声源角度方法流程图。
图2是示教板示意图。
图3是学习机示意图。
具体实施方式
下面结合附图举例对本发明做详细的描述:
一种机器人声源定位学习中视觉示教声源角度的方法,其实施例流程图如图1所示,现根据图1对本发明方法做详细说明如下:
(1)将具有云台的摄像机安装在机器人平台上,使得云台的方位角为0°时,摄像机的视线方向与机器人正前方重合,云台的俯仰角为0°时,摄像机的视线方向与水平面间的角度为0°;
(2)在机器人平台的合适位置上安装M个麦克风,不能所有的麦克风都位于同一平面中,构成麦克风阵列以拾取声音信号,其中M≥3;
(3)构造视觉示教板,该示教板上具有易于识别的规则平面几何图形,在平面图形的几何中心安装一个点声源,示教板示意图如图2所示;
(4)构造一个能够学习非线性函数的学习机,该学习机具有I个输入,I是从M个不同的麦克风中取出2个麦克风的组合数,即I=C(M,2),该学习机具有2个输出,分别对应声源的方位角和俯仰角,学习机示意图如图3所示;
(5)选定一个需要示教的空间位置,令示教板具有几何图形的一面朝向摄像机,控制摄像头的云台运动,令示教板的几何图形的几何中心位于摄像头感知区域的中心,此时云台的方位角β和俯仰角γ可以看作是声源相对于机器人的方位角和俯仰角;
(6)令位于几何图形中心的点声源持续发声,利用数据采集卡对各麦克风感知到的信号进行采样,令采样点数为N点,记第i个麦克风所采集到的声音信号序列为si[n],0≤i≤M-1,0≤n≤N-1;
(7)从M个不同的声音信号序列中取出2个不同的序列Si[n]和Sj[n],计算它们之间的时延τij,τij的数目与I相同;
(8)将I个时延τij作为学习机的输入,方位角β和俯仰角γ作为目标值,构成训练样本对学习机进行训练;
(9)重复步骤(5)-(8),直至任务结束。
以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。
Claims (1)
1.一种机器人声源定位学习中视觉示教声源角度的方法,其特征在于,包括如下步骤:
(1)将具有云台的摄像机安装在机器人平台上,使得云台的方位角为0°时,摄像机的视线方向与机器人正前方重合,云台的俯仰角为0°时,摄像机的视线方向与水平面间的角度为0°;
(2)在机器人平台上安装M个麦克风,构成麦克风阵列以拾取声音信号,至少存在一个麦克风与其它麦克风中的至少一个位于不同平面,其中M>3;
(3)构造视觉示教板,该视觉示教板上具有易于识别的规则平面几何图形,在所述规则平面图形的几何中心安装一个点声源;
(4)构造一个能够学习非线性函数的学习机,该学习机具有I个输入,I是从M个不同的麦克风中取出2个麦克风的组合数,该学习机具有2个输出,分别对应点声源的方位角和俯仰角;
(5)选定一个需要示教的空间位置,令视觉示教板具有规则平面几何图形的一面朝向摄像机,控制摄像头的云台运动,令视觉示教板的规则平面几何图形的几何中心位于摄像头感知区域的中心,此时云台的方位角β和俯仰角γ看作是声源相对于机器人的方位角和俯仰角;
(6)令位于规则几何图形中心的点声源持续发声,利用数据采集卡对各麦克风感知到的信号进行采样,令采样点数为N点,记第i个麦克风所采集到的声音信号序列为si[n],0≤i≤M-1,0≤n≤N-1;
(7)从M个不同的声音信号序列中取出2个不同的序列Si[n]和Sj[n],计算它们之间的时延τij,τij的数目与I相同;
(8)将I个时延τij作为学习机的输入,方位角β和俯仰角γ作为目标值,构成训练样本对学习机进行训练;
(9)重复步骤(5)-(8),直至任务结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611216416.2A CN106597378B (zh) | 2016-12-26 | 2016-12-26 | 机器人声源定位学习中视觉示教声源角度的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611216416.2A CN106597378B (zh) | 2016-12-26 | 2016-12-26 | 机器人声源定位学习中视觉示教声源角度的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106597378A true CN106597378A (zh) | 2017-04-26 |
CN106597378B CN106597378B (zh) | 2019-02-12 |
Family
ID=58603820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611216416.2A Expired - Fee Related CN106597378B (zh) | 2016-12-26 | 2016-12-26 | 机器人声源定位学习中视觉示教声源角度的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106597378B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111323752A (zh) * | 2020-03-25 | 2020-06-23 | 哈尔滨工程大学 | 远近场过渡区间声源定位方法 |
CN117935861A (zh) * | 2024-02-23 | 2024-04-26 | 广东朝歌智慧互联科技有限公司 | 一种云台边界定位方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1460185A (zh) * | 2001-03-30 | 2003-12-03 | 皇家菲利浦电子有限公司 | 用于音频/图像的说话者检测和定位的方法和装置 |
CN103841357A (zh) * | 2012-11-21 | 2014-06-04 | 中兴通讯股份有限公司 | 基于视频跟踪的麦克风阵列声源定位方法、装置及系统 |
CN104135653A (zh) * | 2014-08-15 | 2014-11-05 | 魏鹏 | 一种声源定位与视频联动平台 |
-
2016
- 2016-12-26 CN CN201611216416.2A patent/CN106597378B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1460185A (zh) * | 2001-03-30 | 2003-12-03 | 皇家菲利浦电子有限公司 | 用于音频/图像的说话者检测和定位的方法和装置 |
CN103841357A (zh) * | 2012-11-21 | 2014-06-04 | 中兴通讯股份有限公司 | 基于视频跟踪的麦克风阵列声源定位方法、装置及系统 |
CN104135653A (zh) * | 2014-08-15 | 2014-11-05 | 魏鹏 | 一种声源定位与视频联动平台 |
Non-Patent Citations (1)
Title |
---|
仲维灿: "不确定性条件下机器人声源定位模型研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111323752A (zh) * | 2020-03-25 | 2020-06-23 | 哈尔滨工程大学 | 远近场过渡区间声源定位方法 |
CN111323752B (zh) * | 2020-03-25 | 2022-10-14 | 哈尔滨工程大学 | 远近场过渡区间声源定位方法 |
CN117935861A (zh) * | 2024-02-23 | 2024-04-26 | 广东朝歌智慧互联科技有限公司 | 一种云台边界定位方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106597378B (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106803271B (zh) | 一种视觉导航无人机的摄像机标定方法及装置 | |
CN107024863B (zh) | 一种避免微分爆炸的uuv轨迹跟踪控制方法 | |
EP2845065B1 (en) | Imitation learning method for a multi-axis manipulator | |
MX2017010913A (es) | Modelado fisico para sensores de radar y ultrasonicos. | |
WO2020227383A8 (en) | Combining machine learning with domain knowledge and first principles for modeling in the process industries | |
US20230419113A1 (en) | Attention-based deep reinforcement learning for autonomous agents | |
CN107481292A (zh) | 车载摄像头的姿态误差估计方法和装置 | |
CN108334677A (zh) | 一种基于gru网络的uuv实时避碰规划方法 | |
EP4283596A3 (en) | Learning management system for a real-time simulated virtual reality welding training environment | |
EP4224418A3 (en) | Flow analysis in 4d mr image data | |
CN104035065A (zh) | 基于主动旋转的声源定向装置及其应用方法 | |
Youssef et al. | A binaural sound source localization method using auditive cues and vision | |
CN106454108B (zh) | 基于人工智能的跟踪拍摄方法、装置和电子设备 | |
CN106597378A (zh) | 机器人声源定位学习中视觉示教声源角度的方法 | |
CN113246131B (zh) | 运动捕捉方法、装置、电子设备以及机械臂控制系统 | |
CN112241001B (zh) | 雷达人体动作识别方法、装置、电子设备和存储介质 | |
CN105096341A (zh) | 基于三焦张量和关键帧策略的移动机器人位姿估计方法 | |
Kuzucuoglu et al. | Development of a web-based control and robotic applications laboratory for control engineering education | |
CN110298134A (zh) | 提高水下机器人自航对接瞬态运动预报的数值方法 | |
CN116848495A (zh) | 用于选择虚拟对象以进行扩展现实交互的设备、方法、系统和介质 | |
JP2022081613A (ja) | 自動運転特徴の特定方法、装置、設備、媒体及びコンピュータプログラム | |
Pfaff | Multitarget Tracking Using Orientation Estimation for Optical Belt Sorting | |
Konyo et al. | ImPACT-TRC thin serpentine robot platform for urban search and rescue | |
JP2020140641A5 (ja) | 情報処理装置、方法、制御装置及び装置 | |
Lipko | Identification of the horizontal movement of the underwater vehicle MiddleAUV |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190212 Termination date: 20211226 |