CN107340498A

CN107340498A - 机器人及声源位置的确定方法和装置

Info

Publication number: CN107340498A
Application number: CN201610288519.3A
Authority: CN
Inventors: 不公告发明人
Original assignee: Shenzhen Guangqi Hezhong Technology Co Ltd
Current assignee: Shenzhen Kuang Chi Hezhong Technology Ltd; Shenzhen Guangqi Hezhong Technology Co Ltd
Priority date: 2016-05-03
Filing date: 2016-05-03
Publication date: 2017-11-10
Also published as: WO2017190552A1

Abstract

本发明公开了一种机器人及声源位置的确定方法和装置。其中，该机器人包括：音频采集模块，包括设置在机器人内部不同位置的多个音频采集器，音频采集模块用于采集从声源位置发出的音频信号，其中，多个音频采集器接收到音频信号的时间不同；以及信号处理模块，与音频采集模块相连接，用于依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。本发明解决了相关技术中机器人不具备确定声源位置的功能的技术问题。

Description

机器人及声源位置的确定方法和装置

技术领域

本发明涉及机器人领域，具体而言，涉及一种机器人及声源位置的确定方法和装置。

背景技术

随着机器人技术的快速发展，各种类型的机器人已经被广泛应用于实际生活和生产中，比如家用机器人、工业机器人等。而且，人类城市化进程的推进，使得生活和工作节奏不断增加，各种家用机器人已经成为生活和工作中必不可少的一部分，比如宠物机器人能够避免饲养宠物照料护理很麻烦的问题，已经成为了家庭的好伙伴。目前，为了满足用户使用需求，针对宠物机器人的设计要求越来越高，除了要求其具备宠物特征之外，还需要其更加智能化。如果为机器人设计听觉系统，使机器人能够根据主人的声源位置判断路径，将会大大提高用户对机器人的喜爱程度。但是，现有技术中的机器人主要以娱乐为主，还不具备确定声源位置的功能，无法根据声源位置判断方位和路径。

针对相关技术中机器人不具备确定声源位置的功能的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种机器人及声源位置的确定方法和装置，以至少解决相关技术中机器人不具备确定声源位置的功能的技术问题。

根据本发明实施例的一个方面，提供了一种机器人，包括：音频采集模块，包括设置在机器人内部不同位置的多个音频采集器，音频采集模块用于采集从声源位置发出的音频信号，其中，多个音频采集器接收到音频信号的时间不同；以及信号处理模块，与音频采集模块相连接，用于依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。

进一步地，信号处理模块包括：模数转换模块，与音频采集模块相连接，用于将音频信号转换为数字信号；计算模块，与模数转换模块相连接，用于根据数字信号中音频的峰值获取多个音频采集器中的每个音频采集器接收到音频信号的时间，并依据多个音频采集器中的每个音频采集器接收到音频信号的时间对多个音频采集器进行排序，并计算相邻两个音频采集器接收到音频信号的时间的差值，利用差值确定声源位置的空间坐标。

进一步地，机器人还包括：动作集实现模块，用于控制机器人执行预定动作；主控系统模块，分别与信号处理模块和动作集实现模块相连接，用于将空间坐标转化为执行指令输送至动作集实现模块，其中，执行指令用于指示机器人执行预定动作。

进一步地，动作集实现模块包括：模式设置模块，用于设置机器人的状态模式，其中，机器人的状态模块包括静态模式和动态模式；驱动模块，分别与主控系统模块和模式设置模块相连接，用于驱动机器人以空间坐标为目标位置执行与机器人当前的状态模式相适应的动作。

进一步地，在机器人当前的状态模式为静态模式时，驱动模块用于驱动机器人执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频；在机器人当前的状态模式为动态模式时，驱动模块用于驱动机器人执行的动作包括：朝向声源位置移动。

进一步地，音频采集模块包括：音频放大模块，分别与音频采集模块和模数转换模块相连接，用于分别对多个音频采集器中的每个音频采集器接收到的音频信号进行放大处理。

根据本发明实施例的另一方面，还提供了一种声源位置的确定方法，包括：获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间，其中，音频信号由声源位置发出，多个音频采集器接收到音频信号的时间不同；以及依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。

进一步地，依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标包括：将多个音频采集器按照接收到音频信号的时间先后顺序进行排序；以及依次计算相邻两个音频采集器接收到音频信号的时间的差值，利用差值确定声源位置的空间坐标。

进一步地，利用差值确定声源位置的空间坐标包括：记录相邻两个音频采集器接收到音频信号的时间的差值；在多个音频采集器的数量为4时，采用以下公式确定声源位置的空间坐标：

其中，4个音频采集器依次接收到音频信号的时间的差值分别为Δt₁₂、Δt₂₃Δt₃₄、Δt₄₁，ν为音频信号的传播速度，L为4个音频采集器之间的间距，以4个音频采集器的中心作为坐标原点，4个音频采集器的坐标为 (x_s,y_s,z_s)为以4个音频采集器的中心为坐标原点的球面坐标，球面坐标用于表示声源位置的空间坐标。

进一步地，获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间包括：采集从声源位置发出的音频信号；对采集到的音频信号进行放大处理，并将放大后的音频信号转换为数字信号；以及根据数字信号中音频的峰值获取多个音频采集器中的每个音频采集器接收到音频信号的时间。

进一步地，在依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标之后，该方法还包括：将声源位置的空间坐标转换为用于控制机器人执行预定动作的执行指令；以及根据执行指令控制机器人以声源位置的空间坐标为目标位置执行与机器人当前的状态模式相适应的动作。

进一步地，根据执行指令控制机器人以声源位置的空间坐标为目标位置执行与机器人当前的状态模式相适应的动作包括：检测机器人当前的状态模式，其中，机器人的状态模式包括静态模式和动态模式；在机器人当前的状态模式为静态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频；在机器人当前的状态模式为动态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括：朝向声源位置移动。

根据本发明实施例的另一方面，还提供了一种声源位置的确定装置，包括：获取模块，用于获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间，其中，音频信号由声源位置发出，多个音频采集器接收到音频信号的时间不同；以及确定模块，用于依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。

进一步地，确定模块包括：排序模块，用于将多个音频采集器按照接收到音频信号的时间先后顺序进行排序；以及第一子确定模块，用于依次计算相邻两个音频采集器接收到音频信号的时间的差值，利用差值确定声源位置的空间坐标。

进一步地，确定模块包括：记录模块，用于记录相邻两个音频采集器接收到音频信号的时间的差值；在多个音频采集器的数量为4时，采用以下公式确定声源位置的空间坐标：

进一步地，获取模块包括：采集模块，用于采集从声源位置发出的音频信号；第一转换模块，用于对采集到的音频信号进行放大处理，并将放大后的音频信号转换为数字信号；以及提取模块，用于根据数字信号中音频的峰值获取多个音频采集器中的每个音频采集器接收到音频信号的时间。

进一步地，该装置还包括：第二转换模块，用于在依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标之后，将声源位置的空间坐标转换为用于控制机器人执行预定动作的执行指令；以及控制模块，用于根据执行指令控制机器人以声源位置的空间坐标为目标位置执行与机器人当前的状态模式相适应的动作。

进一步地，控制模块包括：检测模块，用于检测机器人当前的状态模式，其中，机器人的状态模式包括静态模式和动态模式；第一子控制模块，用于在机器人当前的状态模式为静态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频；第二子控制模块，用于在机器人当前的状态模式为动态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括：朝向声源位置移动。

在本发明实施例中，机器人包括音频采集模块，包括设置在机器人内部不同位置的多个音频采集器，音频采集模块用于采集从声源位置发出的音频信号，其中，多个音频采集器接收到音频信号的时间不同；以及信号处理模块，与音频采集模块相连接，用于依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。本发明实施例中的机器人根据多个音频采集器接收音频信号的时间确定声源位置，达到了机器人能够确定声源位置的目的，从而实现了提高机器人使用性能和用户对机器人的喜爱程度的技术效果，进而解决了相关技术中机器人不具备确定声源位置的功能的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的机器人的结构示意图；

图2是根据本发明实施例的多麦克风阵列与声源之间的位置关系的示意图；

图3是根据本发明实施例的另一种可选的机器人的结构示意图；

图4是根据本发明实施例的再一种可选的机器人的结构示意图；

图5是根据本发明实施例的一种可选的声源位置的确定方法的流程图；

图6是根据本发明实施例的另一种可选的声源位置的确定方法的流程图；

图7是根据本发明实施例的再一种可选的声源位置的确定方法的流程图；

图8是根据本发明实施例的又一种可选的声源位置的确定方法的流程图；

图9是根据本发明实施例的另外一种可选的声源位置的确定方法的流程图；

图10是根据本发明实施例的一种可选的声源位置的确定装置的示意图；

图11是根据本发明实施例的另一种可选的声源位置的确定装置的示意图；以及

图12是根据本发明实施例的再一种可选的声源位置的确定装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例，提供了一种机器人的实施例，需要说明的是，本发明实施例中的机器人具备能够确定声源位置的功能，且本发明实施例对机器人的类型不做具体限定，其可以是任意种类，比如宠物机器人、工业机器人等，此处不再一一举例说明。

图1是根据本发明实施例的一种可选的机器人的结构示意图，如图1所示，本发明实施例的机器人01可以包括：音频采集模块10，包括设置在机器人内部不同位置的多个音频采集器，音频采集模块10用于采集从声源位置发出的音频信号，其中，多个音频采集器接收到音频信号的时间不同，也即音频信号达到每个音频采集器的时间不同；以及信号处理模块20，与音频采集模块10相连接，用于依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。

需要说明的是，本发明实施例中的音频采集器可以是麦克风，也可以是其他能够采集音频的设备，此处不再一一举例。本发明实施例均以音频采集器为麦克风为例对本发明进行详细说明，以下内容所涉及到的麦克风均代表本发明实施例中的音频采集器。音频采集模块10可以由多麦克风阵列组成，其中，多麦克风阵列可以包括多个麦克风，且每个麦克风可以设置在机器人01内部的不同位置。需要说明的是，本发明实施例对多麦克风阵列中麦克风的个数和麦克风之间的间距不做具体限定，且本发明实施例对每个麦克风在机器人01内部设置的位置也不做具体限定，比如可以将麦克风设置在机器人01的头部、本体等其他可以按照预定要求安装的位置。音频采集模块10可以利用设置在机器人01内部不同位置的多个麦克风采集从声源位置发出的音频信号，其中，由于多个麦克风在机器人01内部的位置不同，音频信号的在空气介质中传播需要时间，且音频信号在不空气介质中的传播速度相同，故多个麦克风接收到从声源位置发出的音频信号的时间不同。此处需要说明的是，声源位置可以是任意空间位置，可以与机器人01之间有一定距离，本发明对声源位置与机器人01之间的间距不做具体限定。可选地，本发明实施例可以设置一音频放大模块与音频采集模块10相连接，利用该音频放大模块分别对多个麦克风中的每个麦克风接收到的音频信号进行放大处理，以达到提高音频信号质量的目的。当声源位置与机器人01之间的间距较大时，本发明实施例可以通过优化放大模块和滤波电路来实现提高音频信号质量的目的。

如图1所示，本发明实施例中的信号处理模块20可以与音频采集模块10相连接，可以用于依据音频采集模块10中多个麦克风中的每个麦克风接收到音频信号的时间确定声源位置的空间坐标，其中，空间坐标用于表示发出音频信号的声源位置。需要说明的是，信号处理模块20为了实现确定声源位置的空间坐标，可选地，其内部可以包括：模数转换模块和计算模块，其中，模数转换模块可以与音频采集模块10相连接，可以用于将音频采集模块10采集到的音频信号转换为数字信号；计算模块可以与模数转换模块相连接，可以用于根据数字信号中音频的峰值获取多个麦克风中的每个麦克风接收到音频信号的时间，并依据多个麦克风中的每个麦克风接收到音频信号的时间对多个麦克风进行排序，并计算相邻两个麦克风接收到音频信号的时间的差值，利用差值确定声源位置的空间坐标。

需要说明的是，多麦克风阵列接收到的音频信号为模拟信号，随着从声场的增强，音频信号的模拟量逐渐增大。为了减少计算量，本发明实施例可以利用模数转换模块将音频信号转换为数字信号，并利用计算模块从数字信号中提取到每个麦克风接收到音频信号的时间。由于每个麦克风接收到音频信号的时间不同，计算模块可以按照接收到音频信号的时间先后顺序将多个麦克风进行排序，可以直观地获取排序后的相邻两个麦克风接收到音频信号的时间的差值，并利用这些差值确定声源位置的空间坐标。

为了更好地说明机器人如何确定声源位置的空间坐标，本发明还提供了一种优选实施例，在该优选实施例中，假设音频采集模块10中多麦克风阵列包括4个麦克风，声源以及上述4个麦克风的空间位置如图2所示，图2中的S表示声源，M1、M2、M3、M4分别表示上述4个麦克风，空间球面坐标系下的坐标轴分别为x、y、z，声源S的坐标为(x_s,y_s,z_s)。多麦克风阵列接收到从声源S发出的声音时会产生模拟的音频信号，将该音频信号转换为数字信号后可以从中提取到每个麦克风接收到该音频信号的时间，假设定时器记录的音频信号到达M1、M2、M3、M4的时间分布为t1，t2，t3，t4，依据上述4个麦克风接收到音频信号的时间进行排序，假设麦克风M1先接收到音频信号，依次为M2、M3、M4，则相邻两个麦克风之间接收到音频信号的时间的差值分别为第1、2、3、4个麦克风之间的时间差分别为Δt₁₂、Δt₂₃Δt₃₄、Δt₄₁，那么声源S的位置可以用以下公式确定：

其中，v为音频信号的传播速度，L为上述4个麦克风之间的间距，以4个麦克风的中心作为坐标原点，4个麦克风的坐标为 (x_s,y_s,z_s)为以4个麦克风的中心为坐标原点的球面坐标，球面坐标可以用于表示声源S的位置的空间坐标，也即(x_s,y_s,z_s)为声源S的空间坐标。

需要说明的是，本发明实施例并未限定机器人内部的多麦克风阵列只能包括4个麦克风，也并未限定麦克风之间的间距，也并未限定声源和机器人内部多个麦克风的位置。本发明实施例的机器人能够通过多麦克风阵列采集音频信号，根据音频信号达到每个麦克风的时间的差值确定声源位置的空间坐标，解决了相关技术中机器人不具备确定声源位置的功能的技术问题，从而实现了提高机器人使用性能和用户对机器人的喜爱程度的技术效果。

作为一种可选的实施例，图3是根据本发明实施例的另一种可选的机器人的结构示意图，如图3所示，该实施例中的机器人01除了包括本发明上述实施例中的音频采集模块10和信号处理模块20之外，还可以包括：主控系统模块30和动作集实现模块40。具体地：

主控系统模块30可以分别与信号处理模块20和动作集实现模块40相连接，可以将信号处理模块20确定的声源位置的空间坐标转化为执行指令，其中，该执行指令可以用于指示机器人01执行预定动作，需要说明的是，机器人01执行的预定动作可以依据实际情况需求预先设定，比如预定动作可以包括但不限于抬头、转动眼球、移动等。主控系统模块30将声源位置的空间坐标转化为执行指令时，可以优选地将空间坐标转化为串口输出形式的执行指令，以便于通过串口将执行指令发送至动作集实现模块40。

动作集实现模块40可以按照主控系统模块30发送的执行指令执行预定动作，可选地，动作集实现模块40可以包括：模式设置模块和驱动模块，其中，模式设置模块可以用于设置机器人01的状态模式，其中，机器人01的状态模块可以包括静态模式和动态模式。静态模式可以为相对于声源位置机器人01当前处于静止状态，此处的静止状态仅用于表示机器人01为发生移动，并不代表机器人01不执行任何动作，机器人01处于静态模式时，也可以执行类似与抬头、挥动手臂，转动眼球等动作。动态模式可以为相对于声源位置机器人01当前处于移动状态，比如朝某个方向移动。驱动模块可以分别与主控系统模块30和模式设置模块相连接，可以用于驱动机器人01以空间坐标为目标位置执行与机器人01当前的状态模式相适应的动作。具体地：当机器人01当前处于静态模式时，驱动模块可以用于驱动机器人01执行的动作包括以下至少之一：抬头、摇头、转动眼球、挥动手臂、播放音频等。当机器人01当前处于动态模式时，驱动模块可以用于驱动机器人01执行的动作包括：朝向声源位置移动等。需要说明的是，动作集实现模块40按照执行指令驱动机器人01执行与当前状态模式相适应的预定动作包括但并不限于上述列举的动作，不同状态模式对应的预定动作还可以依据实际需求进行调整，本发明实施例对其不做具体限定。

该可选实施例在确定声源位置的空间坐标后可以利用主控系统模块30与动作集实现模块40控制机器人01以声源位置的空间坐标为目标位置执行某种预定动作，且执行的预定动作可以与机器人01当前的状态模式相适应，实现了对声源位置进行追踪，极大地增强了机器人的智能化特征，使其与用户的交互更加真实生动，极大地提高了用户对机器人的喜爱程度。

图4是根据本发明实施例的再一种可选的机器人的结构示意图，如图4所示，该可选实施例中的机器人01可以包括：音频采集模块10、与音频采集模块10相连接的信号处理模块20、与信号处理模块20相连接的主控系统模块30以及与主控系统模块30相连接的动作集实现模块40。具体地，信号处理模块20可以包括模数转换模块201和计算模块202，其中，模数转换模块201分别与音频采集模块10和计算模块202相连接，计算模块202与主控系统模块30相连接。动作集实现模块40可以包括驱动模块401和模式设置模块402，其中，驱动模块401分别与主控系统模块30和模式设置模块402相连接。需要说明的是，图4中所示的各个模块的详细介绍可以参见本发明上述实施例，此处不再赘述。

根据本发明实施例，提供了一种声源位置的确定方法的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图5是根据本发明实施例的一种可选的声源位置的确定方法的流程图，如图5所示，该方法包括如下步骤：

步骤S102，获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间，其中，音频信号由声源位置发出，多个音频采集器接收到音频信号的时间不同；

步骤S104，依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。

通过上述步骤，可以实现控制机器人能够确定声源位置的目的，从而实现了提高机器人使用性能和用户对机器人的喜爱程度的技术效果，进而解决了相关技术中机器人不具备确定声源位置的功能的技术问题。需要说明的是，本发明实施例的声源位置的确定方法可以有机器人或者机器人内部的各个功能模块执行。

需要说明的是，本发明实施例中的音频采集器可以是麦克风，也可以是其他能够采集音频的设备，此处不再一一举例。本发明实施例均以音频采集器为麦克风为例对本发明进行详细说明，以下内容所涉及到的麦克风均代表本发明实施例中的音频采集器。

在步骤S102提供的方案中，机器人内部可以设置有多麦克风阵列，多麦克风阵列可以包括多个麦克风，每个可以设置在机器人内部的不同位置。需要说明的是，本发明实施例对多麦克风阵列中麦克风的个数和麦克风之间的间距不做具体限定，且本发明实施例对每个麦克风在机器人01内部设置的位置也不做具体限定。利用设置在机器人01内部不同位置的多个麦克风采集从声源位置发出的音频信号，其中，由于多个麦克风在机器人01内部的位置不同，音频信号的在空气介质中传播需要时间，且音频信号在不空气介质中的传播速度相同，故多个麦克风接收到从声源位置发出的音频信号的时间不同。此处需要说明的是，声源位置可以是麦克风有效检测范围内的任意空间位置，可以与机器人01之间有一定距离，本发明对声源位置与机器人01之间的间距不做具体限定。

可选地，如图6所示，步骤S102可以包括以下步骤：

步骤S1022，采集从声源位置发出的音频信号。

需要说明的是，该步骤可以利用机器人内部设置的音频采集模块实现，利用音频采集模块中的多麦克风阵列可以采集从声源位置发出的音频信号。本发明实施例对声源位置与机器人之间的间距不做限定。

步骤S1024，对采集到的音频信号进行放大处理，并将放大后的音频信号转换为数字信号。

需要说明的是，本发明实施例可以在采集从声源位置发出的音频信号之后，可以对采集到的音频信号进行放大处理，以达到提高音频信号质量的目的。当声源位置与机器人之间的间距较大时，本发明实施例可以通过优化放大模块和滤波电路来实现提高音频信号质量的目的。该步骤可以利用机器人内部设置的信号处理模块实现，利用信号处理模块中的模数转换模块将音频信号转换为数字信号，数字信号处理能够减小计算量。

步骤S1026，根据数字信号中音频的峰值获取多个麦克风中的每个麦克风接收到音频信号的时间。

需要说明的是，该步骤可以利用机器人内部设置的信号处理模块实现，利用信号处理模块中的计算模块可以根据数字信号中音频的峰值确定音频信号到达多个麦克风中的每个麦克风的时间。

在步骤S104提供的方案中，依据由步骤S102获取到的多个麦克风中的每个麦克风接收到音频信号的时间可以确定声源位置的空间坐标。可选地，如图7所示，步骤S104可以包括以下步骤：

步骤S1042，将多个麦克风按照接收到音频信号的时间先后顺序进行排序。

步骤S1044，依次计算相邻两个麦克风接收到音频信号的时间的差值，利用差值确定声源位置的空间坐标。

上述步骤S1042和步骤S1044可以利用机器人内部设置的信号处理模块实现，利用信号处理模块中的计算模块可以计算排序后的多个麦克风中相邻两个麦克风接收到音频信号的时间的差值，并利用该差值确定声源位置的空间坐标。

需要说明的是，多麦克风阵列接收到的音频信号为模拟信号，随着从声场的增强，音频信号的模拟量逐渐增大。为了减少计算量，本发明实施例可以将音频信号转换为数字信号，并从数字信号中提取到每个麦克风接收到音频信号的时间。由于每个麦克风接收到音频信号的时间不同，本发明实施例可以按照接收到音频信号的时间先后顺序将多个麦克风进行排序，可以直观地获取排序后的相邻两个麦克风接收到音频信号的时间的差值，并利用这些差值确定声源位置的空间坐标。

可选地，在计算排序后的多个麦克风中相邻两个麦克风接收到音频信号的时间的差值时，可以记录相邻两个麦克风接收到音频信号的时间的差值。例如，当机器人中的多麦克风阵列中包括4个麦克风时，声源以及上述4个麦克风的空间位置如图2所示，假设定时器记录的音频信号到达M1、M2、M3、M4的时间分布为t1，t2，t3，t4，依据上述4个麦克风接收到音频信号的时间进行排序，假设麦克风M1先接收到音频信号，依次为M2、M3、M4，则相邻两个麦克风之间接收到音频信号的时间的差值分别为第1、2、3、4个麦克风之间的时间差分别为Δt₁₂、Δt₂₃Δt₃₄、Δt₄₁，那么声源S的位置可以用以下公式确定：

其中，v为音频信号的传播速度，L为上述4个麦克风之间的间距，以4个麦克风的中心作为坐标原点，4个麦克风的坐标为 (x_s,y_s,z_s)为以4个麦克风的中心为坐标原点的球面坐标，球面坐标可以用于表示声源S的位置的空间坐标。

需要说明的是，本发明实施例并未限定机器人内部的多麦克风阵列只能包括4个麦克风，也并未限定麦克风之间的间距，也并未限定声源和机器人内部多个麦克风的位置。还需要说明的是，本发明实施例的声源位置的确定方法中所利用的机器人以及机器人内部设置的各个模块已经在本发明实施例的机器人中进行了详细介绍，此处不再赘述。

本发明实施例的声源位置的确定方法能够通过机器人多麦克风阵列采集音频信号，根据音频信号达到每个麦克风的时间的差值确定声源位置的空间坐标，解决了相关技术中机器人不具备确定声源位置的功能的技术问题，从而实现了提高机器人使用性能和用户对机器人的喜爱程度的技术效果。

作为一种可选地实施例，图8是根据本发明实施例的又一种可选的声源位置的确定方法的流程图，如图8所示，在步骤S104依据多个麦克风中的每个麦克风接收到音频信号的时间确定声源位置的空间坐标之后，该可选实施例还可以包括以下步骤：

步骤S106，将声源位置的空间坐标转换为用于控制机器人执行预定动作的执行指令。

步骤S108，根据执行指令控制机器人以声源位置的空间坐标为目标位置执行与机器人当前的状态模式相适应的动作。

需要说明的是，步骤S106可以利用机器人内部设置的主控系统模块实现，步骤S108可以利用机器人内部设置的动作集实现模块实现。需要说明的是，控制机器人执行的预定动作可以依据实际情况需求预先设定，比如预定动作可以包括但不限于抬头、转动眼球、移动等。该可选实施例在将声源位置的空间坐标转化为执行指令时，可以优选地将空间坐标转化为串口输出形式的执行指令，以便于通过串口将执行指令发送至动作集实现模块。

可选地，如图9所示，步骤S108根据执行指令控制机器人以声源位置的空间坐标为目标位置执行与机器人当前的状态模式相适应的动作可以包括：

步骤S1082，检测机器人当前的状态模式，其中，机器人的状态模式包括静态模式和动态模式。

步骤S1084，在机器人当前的状态模式为静态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频。

步骤S1086，在机器人当前的状态模式为动态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括：朝向声源位置移动。

需要说明的是，步骤S1082可以利用动作集执行模块中的模式设置模块实现。步骤S1084和步骤S1086可以利用动作集执行模块中的驱动模块实现。需要说明的是，静态模式可以为相对于声源位置机器人当前处于静止状态，此处的静止状态仅用于表示机器人01为发生移动，并不代表机器人01不执行任何动作，机器人01处于静态模式时，也可以执行类似与抬头、挥动手臂，转动眼球等动作。动态模式可以为相对于声源位置机器人01当前处于移动状态，比如朝某个方向移动。

需要说明的是，该可选实施例的声源位置的确定方法中所利用的机器人以及机器人内部设置的各个模块已经在本发明实施例的机器人中进行了详细介绍，此处不再赘述。还需要说明的是，该可选实施例按照执行指令驱动机器人执行与当前状态模式相适应的预定动作包括但并不限于上述列举的动作，不同状态模式对应的预定动作还可以依据实际需求进行调整，本发明实施例对其不做具体限定。

该可选实施例的声源位置的确定方法在确定声源位置的空间坐标后可以控制机器人以声源位置的空间坐标为目标位置执行某种预定动作，且执行的预定动作可以与机器人当前的状态模式相适应，实现了对声源位置进行追踪，极大地增强了机器人的智能化特征，使其与用户的交互更加真实生动，极大地提高了用户对机器人的喜爱程度。

根据本发明实施例，还提供了一种声源位置的确定装置的装置实施例，需要说明的是，该声源位置的确定装置可以用于执行本发明实施例中的声源位置的确定方法，本发明实施例中的声源位置的确定方法可以在该声源位置的确定装置中执行。

图10是根据本发明实施例的一种可选的声源位置的确定装置的示意图，如图10所示，该装置可以包括：获取模块22，用于获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间，其中，音频信号由声源位置发出，多个音频采集器接收到音频信号的时间不同；以及确定模块24，用于依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标。

需要说明的是，该实施例中的获取模块22可以用于执行本申请实施例中的步骤S102，该实施例中的确定模块24可以用于执行本申请实施例中的步骤S104。上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例所公开的内容。

可选地，获取模块22可以包括：采集模块，用于采集从声源位置发出的音频信号；第一转换模块，用于对采集到的音频信号进行放大处理，并将放大后的音频信号转换为数字信号；以及提取模块，用于根据数字信号中音频的峰值获取多个音频采集器中的每个音频采集器接收到音频信号的时间。

可选地，确定模块24可以包括：排序模块，用于将多个音频采集器按照接收到音频信号的时间先后顺序进行排序；以及第一子确定模块，用于依次计算相邻两个音频采集器接收到音频信号的时间的差值，利用差值确定声源位置的空间坐标。

可选地，确定模块24可以包括：记录模块，用于记录相邻两个音频采集器接收到音频信号的时间的差值；在多个音频采集器的数量为4时，采用以下公式确定声源位置的空间坐标：

本发明实施例的声源位置的确定装置，通过获取模块22获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间，其中，音频信号由声源位置发出，多个音频采集器接收到音频信号的时间不同，通过确定模块24依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标，解决了相关技术中机器人不具备确定声源位置的功能的技术问题，从而实现了提高机器人使用性能和用户对机器人的喜爱程度的技术效果。

作为一种可选的实施例，图11是根据本发明实施例的另一种可选的声源位置的确定装置的示意图，如图11所示，该可选实施例还可以包括：第二转换模块26，用于在依据多个音频采集器中的每个音频采集器接收到音频信号的时间确定声源位置的空间坐标之后，将声源位置的空间坐标转换为用于控制机器人执行预定动作的执行指令；以及控制模块28，用于根据执行指令控制机器人以声源位置的空间坐标为目标位置执行与机器人当前的状态模式相适应的动作。

需要说明的是，该实施例中的第二转换模块26可以用于执行本申请实施例中的步骤S106，该实施例中的控制模块28可以用于执行本申请实施例中的步骤S108。上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例所公开的内容。

可选地，控制模块28可以包括：检测模块，用于检测机器人当前的状态模式，其中，机器人的状态模式包括静态模式和动态模式；第一子控制模块，用于在机器人当前的状态模式为静态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频；第二子控制模块，用于在机器人当前的状态模式为动态模式时，控制机器人以声源位置的空间坐标为目标位置执行的动作包括：朝向声源位置移动。

该可选实施例的声源位置的确定装置通过在确定声源位置的空间坐标后可以控制机器人以声源位置的空间坐标为目标位置执行某种预定动作，且执行的预定动作可以与机器人当前的状态模式相适应，实现了对声源位置进行追踪，极大地增强了机器人的智能化特征，使其与用户的交互更加真实生动，极大地提高了用户对机器人的喜爱程度。

图12是根据本发明实施例的再一种可选的声源位置的确定装置的示意图，如图12所示，该可选实施例的声源位置的确定装置可以包括：获取模块22、确定模块24、第二转换模块26以及控制模块28。具体地，获取模块22可以包括采集模块222和提取模块224；确定模块24可以包括排序模块242和第一子确定模块244；控制模块28可以包括检测模块282和第一子控制模块284。需要说明的是，图12中所示的各个模块的详细介绍可以参见本发明上述实施例，此处不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种机器人，其特征在于，包括：

音频采集模块，包括设置在机器人内部不同位置的多个音频采集器，所述音频采集模块用于采集从声源位置发出的音频信号，其中，所述多个音频采集器接收到所述音频信号的时间不同；以及

信号处理模块，与所述音频采集模块相连接，用于依据所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间确定所述声源位置的空间坐标。

2.根据权利要求1所述的机器人，其特征在于，所述信号处理模块包括：

模数转换模块，与所述音频采集模块相连接，用于将所述音频信号转换为数字信号；

计算模块，与所述模数转换模块相连接，用于根据所述数字信号中音频的峰值获取所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间，并依据所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间对所述多个音频采集器进行排序，并计算相邻两个音频采集器接收到所述音频信号的时间的差值，利用所述差值确定所述声源位置的空间坐标。

3.根据权利要求1或2所述的机器人，其特征在于，所述机器人还包括：

动作集实现模块，用于控制所述机器人执行预定动作；

主控系统模块，分别与所述信号处理模块和所述动作集实现模块相连接，用于将所述空间坐标转化为执行指令输送至所述动作集实现模块，其中，所述执行指令用于指示所述机器人执行所述预定动作。

4.根据权利要求3所述的机器人，其特征在于，所述动作集实现模块包括：

模式设置模块，用于设置所述机器人的状态模式，其中，所述机器人的状态模块包括静态模式和动态模式；

驱动模块，分别与所述主控系统模块和所述模式设置模块相连接，用于驱动所述机器人以所述空间坐标为目标位置执行与所述机器人当前的状态模式相适应的动作。

5.根据权利要求4所述的机器人，其特征在于，

在所述机器人当前的状态模式为所述静态模式时，所述驱动模块用于驱动所述机器人执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频；

在所述机器人当前的状态模式为所述动态模式时，所述驱动模块用于驱动所述机器人执行的动作包括：朝向所述声源位置移动。

6.根据权利要求2所述的机器人，其特征在于，所述音频采集模块包括：

音频放大模块，分别与所述音频采集模块和所述模数转换模块相连接，用于分别对所述多个音频采集器中的每个音频采集器接收到的所述音频信号进行放大处理。

7.一种声源位置的确定方法，其特征在于，包括：

获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间，其中，所述音频信号由声源位置发出，所述多个音频采集器接收到所述音频信号的时间不同；以及

依据所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间确定所述声源位置的空间坐标。

8.根据权利要求7所述的方法，其特征在于，依据所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间确定所述声源位置的空间坐标包括：

将所述多个音频采集器按照接收到所述音频信号的时间先后顺序进行排序；以及

依次计算相邻两个音频采集器接收到所述音频信号的时间的差值，利用所述差值确定所述声源位置的空间坐标。

9.根据权利要求8所述的方法，其特征在于，利用所述差值确定所述声源位置的空间坐标包括：

记录相邻两个音频采集器接收到所述音频信号的时间的差值；

在所述多个音频采集器的数量为4时，采用以下公式确定所述声源位置的空间坐标：

<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mo>|</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>|</mo> <mo>=</mo> <msub> <mi>&Delta;t</mi> <mn>12</mn> </msub> <mo>&CenterDot;</mo> <mi>v</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>|</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>|</mo> <mo>=</mo> <msub> <mi>&Delta;t</mi> <mn>23</mn> </msub> <mo>&CenterDot;</mo> <mi>v</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>|</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>|</mo> <mo>=</mo> <msub> <mi>&Delta;t</mi> <mn>34</mn> </msub> <mo>&CenterDot;</mo> <mi>v</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>|</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>-</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>-</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>+</mo> <mfrac> <mi>L</mi> <mn>2</mn> </mfrac> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>z</mi> <mi>s</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>|</mo> <mo>=</mo> <msub> <mi>&Delta;t</mi> <mn>41</mn> </msub> <mo>&CenterDot;</mo> <mi>v</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>

其中，4个音频采集器依次接收到所述音频信号的时间的差值分别为Δt₁₂、Δt₂₃Δt₃₄、Δt₄₁，ν为所述音频信号的传播速度，L为所述4个音频采集器之间的间距，以所述4个音频采集器的中心作为坐标原点，所述4个音频采集器的坐标为(x_s,y_s,z_s)为以所述4个音频采集器的中心为坐标原点的球面坐标，所述球面坐标用于表示所述声源位置的空间坐标。

10.根据权利要求7至9中任一项所述的方法，其特征在于，获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间包括：

采集从所述声源位置发出的音频信号；

对采集到的所述音频信号进行放大，并将放大后的所述音频信号转换为数字信号；以及

根据所述数字信号中音频的峰值获取所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间。

11.根据权利要求7至9中任一项所述的方法，其特征在于，在依据所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间确定所述声源位置的空间坐标之后，所述方法还包括：

将所述声源位置的空间坐标转换为用于控制所述机器人执行预定动作的执行指令；以及

根据所述执行指令控制所述机器人以所述声源位置的空间坐标为目标位置执行与所述机器人当前的状态模式相适应的动作。

12.根据权利要求11所述的方法，其特征在于，根据所述执行指令控制所述机器人以所述声源位置的空间坐标为目标位置执行与所述机器人当前的状态模式相适应的动作包括：

检测所述机器人当前的状态模式，其中，所述机器人的状态模式包括静态模式和动态模式；

在所述机器人当前的状态模式为所述静态模式时，控制所述机器人以所述声源位置的空间坐标为目标位置执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频；

在所述机器人当前的状态模式为所述动态模式时，控制所述机器人以所述声源位置的空间坐标为目标位置执行的动作包括：朝向所述声源位置移动。

13.一种声源位置的确定装置，其特征在于，包括：

获取模块，用于获取设置在机器人内部不同位置的多个音频采集器中的每个音频采集器接收到音频信号的时间，其中，所述音频信号由声源位置发出，所述多个音频采集器接收到所述音频信号的时间不同；以及

确定模块，用于依据所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间确定所述声源位置的空间坐标。

14.根据权利要求13所述的装置，其特征在于，所述确定模块包括：

排序模块，用于将所述多个音频采集器按照接收到所述音频信号的时间先后顺序进行排序；以及

第一子确定模块，用于依次计算相邻两个音频采集器接收到所述音频信号的时间的差值，利用所述差值确定所述声源位置的空间坐标。

15.根据权利要求14所述的装置，其特征在于，所述确定模块包括：

记录模块，用于记录相邻两个音频采集器接收到所述音频信号的时间的差值；

其中，4个音频采集器依次接收到所述音频信号的时间的差值分别为Δt₁₂、Δt₂₃Δt₃₄、Δt₄₁，v为所述音频信号的传播速度，L为所述4个音频采集器之间的间距，以所述4个音频采集器的中心作为坐标原点，所述4个音频采集器的坐标为(x_s,y_s,z_s)为以所述4个音频采集器的中心为坐标原点的球面坐标，所述球面坐标用于表示所述声源位置的空间坐标。

16.根据权利要求13至15中任一项所述的装置，其特征在于，所述获取模块包括：

采集模块，用于采集从所述声源位置发出的音频信号；

第一转换模块，用于对采集到的所述音频信号进行放大，并将放大后的所述音频信号转换为数字信号；以及

提取模块，用于根据所述数字信号中音频的峰值获取所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间。

17.根据权利要求13至15中任一项所述的装置，其特征在于，所述装置还包括：

第二转换模块，用于在依据所述多个音频采集器中的每个音频采集器接收到所述音频信号的时间确定所述声源位置的空间坐标之后，将所述声源位置的空间坐标转换为用于控制所述机器人执行预定动作的执行指令；以及

控制模块，用于根据所述执行指令控制所述机器人以所述声源位置的空间坐标为目标位置执行与所述机器人当前的状态模式相适应的动作。

18.根据权利要求17所述的装置，其特征在于，所述控制模块包括：

检测模块，用于检测所述机器人当前的状态模式，其中，所述机器人的状态模式包括静态模式和动态模式；

第一子控制模块，用于在所述机器人当前的状态模式为所述静态模式时，控制所述机器人以所述声源位置的空间坐标为目标位置执行的动作包括以下至少之一：抬头、摇头、转动眼球、播放音频；

第二子控制模块，用于在所述机器人当前的状态模式为所述动态模式时，控制所述机器人以所述声源位置的空间坐标为目标位置执行的动作包括：朝向所述声源位置移动。