CN111856399A

CN111856399A - 基于声音的定位识别方法、装置、电子设备及存储介质

Info

Publication number: CN111856399A
Application number: CN201910346368.6A
Authority: CN
Inventors: 向仲宇
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2019-04-26
Filing date: 2019-04-26
Publication date: 2020-10-30
Anticipated expiration: 2039-04-26
Also published as: CN111856399B

Abstract

本申请提供了一种基于声音的定位识别方法、装置、电子设备及存储介质。本申请实施例通过获取目标声音信息，提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息、以及目标样本声音信息对应的属性信息，并根据属性信息，生成目标样本声音信息对应的行为轨迹，使得可以根据所生成的目标样本声音信息对应的行为轨迹确定声音与目标声音信息相似的人的行为轨迹，从而在目标声音信息对应的目标人员确定时，可以分析目标人员可能所在的位置或行为走向，在目标声音信息对应的目标人员未确定时，可以确定与目标声音信息相似的人中可能为目标人员的人，实现了对目标人员更准确地定位和识别，具有更高的定位识别效率。

Description

基于声音的定位识别方法、装置、电子设备及存储介质

技术领域

本申请涉及定位识别技术领域，具体而言，涉及一种基于声音的定位识别方法、装置、电子设备及存储介质。

背景技术

随着信息技术的发展，对目标人员进行识别和定位已经成为公共安全领域不可或缺的技术手段。例如，对某个指定的目标人员进行识别和定位可以尽快确定该目标人员的位置或及时掌握该目标人员的行踪。

目前，对目标人员进行识别和定位的方法主要包括：1)通过对安装在特定场合(如街道、电梯等)的监控摄像头所采集的视频图像进行分析，确定目标人物是否出现在视频图像中，从而对目标人物进行识别和定位；2)通过核查身份信息(如身份证、手机号等)，对目标人物进行识别和定位。

但是，上述现有对目标人员进行识别和定位的方法中，通过分析视频图像确定目标人物时，必须要求监控摄像头的拍摄角度需要对准、且具有较高的清晰度，若遮挡物较多时，视频图像较难采集，导致对目标人员进行识别和定位的准确率不高；而通过核查身份信息确定目标人物时，由于身份证、手机号等身份信息极易存在冒用或造假的可能，也严重降低了对目标人员进行识别和定位的准确率。

发明内容

有鉴于此，本申请实施例的目的在于提供一种基于声音的定位识别方法、装置、电子设备及存储介质，用于解决现有对目标人员进行识别和定位的方法中存在的识别和定位准确率不高的问题。

第一方面，本申请实施例提供一种基于声音的定位识别方法，包括：

获取目标声音信息；提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息、以及目标样本声音信息对应的属性信息，其中，声音数据库中保存有样本声音信息和样本声音信息对应的属性信息，属性信息包括：身份标识属性、位置属性和时间属性；根据属性信息，生成目标样本声音信息对应的行为轨迹。

可选地，上述提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息，包括：根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度；提取相似度大于预设阈值的样本声音信息作为目标样本声音信息。

可选地，上述根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度之前，该方法还包括：获取目标声音信息对应的声纹特征、以及声音数据库中的样本声音信息对应的声纹特征；相应的，上述根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度，包括：根据预设算法计算声音数据库中的样本声音信息与目标声音信息分别对应的声纹特征之间的相似度。

可选地，预设算法包括：余弦相似算法或欧氏距离算法。

可选地，身份标识属性包括下述一项或多项：设备信息、账号信息、以及证件信息；上述根据属性信息，生成目标样本声音信息对应的行为轨迹，包括：根据身份标识属性对目标样本声音信息进行分组，得到多个身份标识属性对应的多组目标样本声音信息；根据时间属性对每组目标样本声音信息中的目标样本声音信息进行排序；根据位置属性、以及每组目标样本声音信息的排序结果，生成每组目标样本声音信息对应的行为轨迹。

可选地，上述获取目标声音信息之前，该方法还包括：采集样本声音信息，并记录样本声音信息对应的属性信息；将样本声音信息和对应的属性信息存储至声音数据库。

可选地，上述采集样本声音信息，并记录样本声音信息对应的属性信息，包括：获取目标设备采集的样本声音信息，记录样本声音信息、以及样本声音信息对应的属性信息；若目标设备绑定有多个身份标识属性，则根据各身份标识属性对应的采集频率，对所记录的样本声音信息、以及样本声音信息对应的属性信息排序。

可选地，上述获取目标声音信息，包括：接收外部采集设备发送的目标声音信息；或从声音数据库中提取指定的目标声音信息。

第二方面，本申请实施例提供一种目标人员定位装置，包括：

获取模块，用于获取目标声音信息；提取模块，用于提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息、以及目标样本声音信息对应的属性信息，其中，声音数据库中保存有样本声音信息和样本声音信息对应的属性信息，属性信息包括：身份标识属性、位置属性和时间属性；生成模块，用于根据属性信息，生成目标样本声音信息对应的行为轨迹。

可选地，上述提取模块包括：计算子模块，用于根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度；提取子模块，用于提取相似度大于预设阈值的样本声音信息作为目标样本声音信息。

可选地，该装置还包括：声纹获取模块，用于在计算子模块根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度之前，获取目标声音信息对应的声纹特征、以及声音数据库中的样本声音信息对应的声纹特征；相应的，计算子模块具体用于根据预设算法计算声音数据库中的样本声音信息与目标声音信息分别对应的声纹特征之间的相似度。

可选地，预设算法包括：余弦相似算法或欧氏距离算法。

可选地，身份标识属性包括下述一项或多项：设备信息、账号信息、以及证件信息；上述生成模块包括：分组子模块，用于根据身份标识属性对目标样本声音信息进行分组，得到多个身份标识属性对应的多组目标样本声音信息；排序子模块，用于根据时间属性对每组目标样本声音信息中的目标样本声音信息进行排序；生成子模块，用于根据位置属性、以及每组目标样本声音信息的排序结果，生成每组目标样本声音信息对应的行为轨迹。

可选地，该装置还包括：采集模块，用于采集样本声音信息，并记录样本声音信息对应的属性信息；存储模块，用于将样本声音信息和对应的属性信息存储至声音数据库。

可选地，上述采集模块，具体用于获取目标设备采集的样本声音信息，记录样本声音信息、以及样本声音信息对应的属性信息；若目标设备绑定有多个身份标识属性，则根据各身份标识属性对应的采集频率，对所记录的样本声音信息、以及样本声音信息对应的属性信息排序。

可选地，上述获取模块，具体用于接收外部采集设备发送的目标声音信息；或从声音数据库中提取指定的目标声音信息。

第三方面，本申请实施例提供一种电子设备，包括：处理器、存储介质和总线，存储介质存储有处理器可执行的机器可读指令，当电子设备运行时，处理器与存储介质之间通过总线通信，处理器执行机器可读指令，以执行时执行如第一方面所述的基于声音的定位识别方法的步骤。

第四方面，本申请实施例还提供一种存储介质，存储介质上存储有计算机程序，计算机程序被处理器运行时执行如第一方面所述的基于声音的定位识别方法的步骤。

基于上述一方面，本申请具有以下有益效果：

本申请实施例通过获取目标声音信息，提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息、以及目标样本声音信息对应的属性信息，并根据属性信息，生成目标样本声音信息对应的行为轨迹，使得可以根据所生成的目标样本声音信息对应的行为轨迹确定声音与目标声音信息相似的人的行为轨迹，从而可以在目标声音信息对应的目标人员确定时，根据与目标声音信息相似的人的行为轨迹分析目标人员可能所在的位置或行为走向，在目标声音信息对应的目标人员未确定时，根据与目标声音信息相似的人的行为轨迹确定与目标声音信息相似的人中可能为目标人员的人，实现了对目标人员更准确地定位和识别，具有更高的定位识别效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的基于声音的定位识别方法的流程示意图；

图2示出了本申请实施例提供的基于声音的定位识别方法的另一流程示意图；

图3示出了本申请实施例提供的基于声音的定位识别方法的又一流程示意图；

图4示出了本申请实施例提供的目标样本声音信息对应的行为轨迹的示意图；

图5示出了本申请实施例提供的基于声音的定位识别方法的又一流程示意图；

图6示出了本申请实施例提供的基于声音的定位识别方法的又一流程示意图；

图7示出了本申请实施例提供的基于声音的定位识别装置的结构示意图；

图8示出了本申请实施例提供的基于声音的定位识别装置的另一结构示意图；

图9示出了本申请实施例提供的基于声音的定位识别装置的又一结构示意图；

图10示出了本申请实施例提供的基于声音的定位识别装置的又一结构示意图；

图11示出了本申请实施例提供的基于声音的定位识别装置的又一结构示意图；

图12示出了本申请实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

此外，还需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

本申请实施例提供一种基于声音的定位识别方法，可以基于目标声音信息获取目标人员的定位信息。其中，目标人员可以是指定的某一个人，使用该方法对目标人员进行定位识别时，可以具有更高地准确率。该基于声音的定位识别方法可以应用于服务器、计算机等电子设备，本申请在此不作限制。

图1示出了本申请实施例提供的基于声音的定位识别方法的流程示意图。如图1所示，该基于声音的定位识别方法包括：

S101、获取目标声音信息。

其中，目标声音信息可以是待定位识别的目标人员的声音信息，或与待定位识别的目标人员相关的声音信息。例如，若目标人员的身份已经被确认，则所获取的目标声音信息可以为已确认身份的目标人员的声音信息；若目标人员的身份暂时未确定，则所获取的目标声音信息可以是与目标人员相关的声音信息，如目标人员曾经待过的场合的录音、目标人员曾经接触过的电子设备中的音频记录等。

以网约车服务为例，在网约车服务中，司机和乘客的身份一般可以确定，若司机或乘客为目标人员，则所获取的目标声音信息可以是司机或乘客的手机中的语音聊天记录、录音或其他被保存的音频信息等。

S102、提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息、以及目标样本声音信息对应的属性信息。

其中，声音数据库中保存有样本声音信息和样本声音信息对应的属性信息，属性信息包括：身份标识属性、位置属性和时间属性。

在一些实施例中，声音数据库可以包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory，ROM)等，或其任意组合。作为举例，大容量存储器可以包括磁盘、光盘、固态驱动器等；可移动存储器可包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等；易失性读写存储器可以包括随机存取存储器(Random AccessMemory，RAM)；RAM可以包括动态RAM(Dynamic Random Access Memory，DRAM)，双倍数据速率同步动态RAM(Double Date-Rate SynchronousRAM，DDR SDRAM)；静态RAM(StaticRandom-Access Memory，SRAM)，晶闸管RAM(Thyristor-Based Random Access Memory，T-RAM)和零电容器RAM(Zero-RAM)等。作为举例，ROM可以包括掩模ROM(Mask Read-OnlyMemory，MROM)、可编程ROM(Programmable Read-Only Memory，PROM)、可擦除可编程ROM(Programmable Erasable Read-only Memory，PEROM)、电可擦除可编程ROM(ElectricallyErasable Programmable read only memory，EEPROM)、光盘ROM(CD-ROM)、以及数字通用磁盘ROM等。在一些实施例中，声音数据库也可以在云平台上实现。仅作为示例，云平台可以包括私有云、公有云、混合云、社区云、分布式云、跨云、多云或者其它类似的等，或其任意组合。

具体地，可以将上述所获取的目标声音信息与声音数据库中所保存的样本声音信息进行对比，分析样本声音信息与目标声音信息之间的相似度，并提取与目标声音信息相似度大于预设阈值的样本声音信息作为目标样本声音信息。例如，若预设阈值可以为80％，则可以提取声音数据库中与目标声音信息相似度大于80％的样本声音信息作为目标样本声音信息。另外，对任一目标样本声音信息进行提取时，可以将该目标样本声音信息对应的属性信息一起进行提取。其中，身份标识属性可以表示该目标样本声音信息的来源，位置属性可以表示该目标样本声音信息所出现的地点，时间属性可以表示该目标样本声音信息所发生的时间。

需要特别说明的是，在提取与目标声音信息相似度大于预设阈值的样本声音信息作为目标样本声音信息时，预设阈值也可以设置为90％、95％等比80％更大的值，也可以设置为75％、78％等比80％更小的值，对于预设阈值的具体大小，可以根据需要进行选择或设定，例如：可以根据需要提取的目标样本声音信息的数量或声音数据库的大小将预设阈值设置为更大或更小的值，本申请在此不作限定。

S103、根据属性信息，生成目标样本声音信息对应的行为轨迹。

具体地，通过上述步骤S101和步骤S102所得到的目标样本声音信息即为与目标人员相似的人的声音信息，对所提取的上述目标样本声音信息，可以根据对应的属性信息，生成目标样本声音信息对应的行为轨迹，从而可以确定声音与目标声音信息相似的人的行为轨迹。

其中，目标样本声音信息对应的行为轨迹可以是根据目标样本声音信息对应的属性信息，将目标样本声音信息在地图上进行标记所得。例如，可以根据目标样本声音信息对应的位置属性，在地图上标记每个目标样本声音信息所出现的地点，并根据目标样本声音信息对应的时间属性，将每个目标样本声音信息所出现的地点在地图上依次进行连接，从而生成目标样本声音信息对应的行为轨迹。

如上所述，步骤S101中所获取的目标声音信息可以是待定位识别的目标人员的声音信息，或与待定位识别的目标人员相关的声音信息。现针对两种情况分别作如下举例说明：

1)若步骤S101中所获取的目标声音信息是待定位识别的目标人员的声音信息，例如，所获取的目标声音信息为已确认身份的目标人员的声音信息，则可以根据上述步骤S103中所生成的目标样本声音信息对应的行为轨迹确定声音与已确认身份的目标人员的声音信息相似的人的行为轨迹，从而可以从声音与已确认身份的目标人员的声音信息相似的人的行为轨迹中，分析可能符合目标人员的行为轨迹，如：行为轨迹的走向符合目标人员可能的行动路线或与目标人员曾经所处的地点有关联等，进而可以确定目标人员可能所在的位置或行为走向。

2)若步骤S101中所获取的目标声音信息是与待定位识别的目标人员相关的声音信息，例如，所获取的目标声音信息为在目标人员曾经待过的场合采集的声音信息，但是暂时未确定该目标声音信息对应的目标人员的身份，则可以根据上述步骤S103中所生成的目标样本声音信息对应的行为轨迹确定声音与在目标人员曾经待过的场合采集的声音信息相似的人的行为轨迹，从而可以从声音与在目标人员曾经待过的场合采集的声音信息相似的人的行为轨迹中，分析得到与目标人员曾经待过的场合相关的行为轨迹，如：行为轨迹集中于目标人员曾经待过的场合附近或轨迹起点在目标人员曾经待过的场合等，进而可以对声音与在目标人员曾经待过的场合采集的声音信息相似的人进行排查，确定其中是否存在目标人员。

可选地，上述对目标样本声音信息进行标记的过程中，也可以根据目标样本声音信息对应的身份标识属性，将具有相同身份标识属性的目标样本信息标记在同一行为轨迹中。

以上述网约车服务为例，若确定司机或乘客为目标人员，且可以确定司机或乘客的声音信息对应的身份标识属性包含电话号码“13*********”，则生成行为轨迹时，可以将身份标识属性包含有该电话号码“13*********”的所有目标样本声音信息标记在同一行为轨迹中。

可选地，在所生成的行为轨迹中，每个目标样本声音信息所对应的轨迹点可以具有一种或多种相同的身份标识属性，本申请对此不作限定。

由上所述，本申请实施例通过获取目标声音信息，提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息、以及目标样本声音信息对应的属性信息，并根据属性信息，生成目标样本声音信息对应的行为轨迹，使得可以根据所生成的目标样本声音信息对应的行为轨迹确定声音与目标声音信息相似的人的行为轨迹，从而可以在目标声音信息对应的目标人员确定时，根据与目标声音信息相似的人的行为轨迹分析目标人员可能所在的位置或行为走向，在目标声音信息对应的目标人员未确定时，根据与目标声音信息相似的人的行为轨迹确定与目标声音信息相似的人中可能为目标人员的人，实现了对目标人员更准确地定位和识别，具有更高的定位识别效率。

图2示出了本申请实施例提供的基于声音的定位识别方法的另一流程示意图。

可选地，如图2所示，上述提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息，包括：

S201、根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度。

具体地，通过预设算法对声音数据库中的样本声音信息与目标声音信息进行计算，可以得到样本声音信息与目标声音信息之间的相似度，计算得到的相似度可以表示声音数据库中的样本声音信息对应的人与目标声音信息对应的目标人员为同一人的可能性大小。对于声音数据库中的任一样本声音信息而言，若计算得到与目标声音信息的相似度越高，则表明该样本声音信息对应的人为目标声音信息对应的目标人员的可能性越高，反之，则越低。

S202、提取相似度大于预设阈值的样本声音信息作为目标样本声音信息。

如上所述，预设阈值可以是75％、78％、80％或95％等根据实际需要所设定的值。

可选地，在从声音数据库中提取相似度大于预设阈值的样本声音信息作为目标样本声音信息时，可以将声音数据库中所有与目标声音信息相似度大于该预设阈值的样本声音信息进行提取，也可以根据实际需求提取固定范围内的样本声音信息，例如，可以提取XX省或XX市内的样本声音信息，以缩减排查范围，提高定位识别的效率。

可选地，上述根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度之前，该方法还包括：获取目标声音信息对应的声纹特征、以及声音数据库中的样本声音信息对应的声纹特征。相应的，上述根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度，包括：根据预设算法计算声音数据库中的样本声音信息与目标声音信息分别对应的声纹特征之间的相似度。

具体地，声纹是指通过电声学仪器显示的携带言语信息的声波频谱，声纹不仅具有特定性，而且有相对稳定性的特点。实验证明，人不论以何种方式进行讲话时，其声纹却始终相同。因此，可以先获取目标声音信息对应的声纹特征、以及声音数据库中的样本声音信息对应的声纹特征，并计算目标声音信息和样本声音信息分别对应的声纹特征之间的相似度，从而确定声音数据库中的样本声音信息与目标声音信息之间的相似度。

可选地，可以通过电声学仪器先将目标声音信息、以及声音数据库中的样本声音信息转换为各自对应的声纹，并以向量的形式将转换后的声纹进行表示，也即，所获取的目标声音信息、以及声音数据库中的样本声音信息分别对应的声纹特征可以是声纹向量。

需要说明的是，本申请实施例中，声音数据库也以是直接对声纹进行存储的声纹数据库，其中存储的是样本声音信息对应的声纹。在获取样本声音信息对应的声纹特征时，可以直接基于声纹数据库中的声纹进行获取，而无需经过上述将样本声音信息转换为声纹的步骤。

可选地，上述计算声音数据库中的样本声音信息与目标声音信息分别对应的声纹特征之间的相似度时，所采用的预设算法可以是余弦相似算法或欧氏距离算法。

其中，余弦相似算法是通过计算两个向量的夹角余弦值来评估二者的相似度，可以将上述目标声音信息、以及声音数据库中的样本声音信息分别对应的声纹特征用声纹向量的形式进行表示，通过余弦相似算法计算目标声音信息对应的声纹向量与样本声音信息对应的声纹向量之间的夹角的余弦值，样本声音信息与目标声音信息分别对应的声纹特征之间的相似度与计算得到的余弦值之间存在如下对应关系：

余弦值越大，表明样本声音信息与目标声音信息分别对应的声纹特征之间的相似度越高(如：余弦值越接近于1，则相似度越高)；相反，余弦值越小，表明样本声音信息与目标声音信息分别对应的声纹特征之间的相似度越低(如：余弦值越接近于-1，则相似度越低)。

举例说明，假设样本声音信息对应的声纹特征为向量A(X₁，X₂，X₃，X₄，X₅)，目标声音信息对应的声纹特征为向量B(Y₁，Y₂，Y₃，Y₄，Y₅)，向量A和向量B之间的夹角为θ，则向量A和向量B之间夹角的余弦值为：

此时，可以根据上述样本声音信息与目标声音信息分别对应的声纹特征之间的相似度与计算得到的余弦值之间的对应关系，确定样本声音信息对应的声纹特征与目标声音信息对应的声纹特征之间的相似度大小。

可选地，可以建立余弦值cosθ的取值范围[-1，1]与相似度之间的映射关系，如，若用百分比％表示相似度，则可以将区间[-1，1]内的值均匀的映射到区间[0％，100％]中。具体地，可以如表1所示：

表1

余弦值cosθ	相似度
		1	100％
……	……
		0	50％
……	……
		-1	0％

而欧式距离算法是通过计算样本声音信息对应的声纹特征与目标声音信息对应的声纹特征之间的欧式距离，例如，可以将目标声音信息对应的声纹向量作为参考点，计算其他样本声音信息对应的声纹向量与该参考点之间的欧氏距离，并通过欧氏距离的大小来表示样本声音信息与目标声音信息分别对应的声纹特征之间的相似度大小，样本声音信息与目标声音信息分别对应的声纹特征之间的相似度与计算得到的欧式距离之间的对应关系如下：

对于任一样本声音信息对应的声纹特征，若其与目标声音信息对应的声纹特征之间的欧氏距离越小，则表明该样本声音信息对应的声纹特征与目标声音信息对应的声纹特征之间的相似度越高；相反，若其与目标声音信息对应的声纹特征之间的欧氏距离越大，则表明该样本声音信息对应的声纹特征与目标声音信息对应的声纹特征之间的相似度越低。

可选地，本申请其他实施方式中，上述预设算法也可以是皮尔逊相关系数算法、谷本系数(Tanimoto Coefficient)算法等其他可以计算样本声音信息与目标声音信息之间相似度的算法，本申请在此不作特别限定。

图3示出了本申请实施例提供的基于声音的定位识别方法的又一流程示意图。

可选地，身份标识属性包括下述一项或多项：设备信息、账号信息、以及证件信息。

如图3所示，上述根据属性信息，生成目标样本声音信息对应的行为轨迹，可以包括：

S301、根据身份标识属性对目标样本声音信息进行分组，得到多个身份标识属性对应的多组目标样本声音信息。

其中，设备信息可以是用于采集目标样本声音信息的采集设备的设备号、或设备特有的其他标识信息，如：若采集设备为手机，则设备信息可以是国际移动设备识别码(International Mobile Equipment Identity，IMEI)；账号信息可以是与目标样本声音信息对应的目标人员所绑定的手机号码、某些网站或软件的注册ID等，例如，网约车服务中，账号信息可以是司机或乘客的手机号码或打车软件的ID；证件信息可以是目标样本声音信息对应的目标人员特有的证件，如可以是身份证、驾驶证、学生证等。

通过上述设备信息、账号信息、以及证件信息等身份标识属性，可以将目标样本声音信息划分为多组，例如，若存在20条目标样本声音信息所对应的设备信息均为“IMEI：3548500”，则可以以“IMEI：3548500”为分组依据，将具有该20条目标样本声音信息划分为同一组，从而得到多个身份标识属性对应的多组目标样本声音信息。

可选地，在对目标样本声音信息进行分组时，可以同时以上述设备信息、账号信息、以及证件信息中的一种或多种为依据进行划分。例如，可以仅仅将具有相同的设备信息a的目标样本声音信息划分为一组；也可以将同时具有相同的设备信息a和账号信息b的目标样本声音信息划分为一组；还可以将同时具有相同的设备信息a、账号信息b、以及证件信息的目标样本声音信息划分为一组等。也即，所划分的同一组内的目标样本声音信息可以具有一种或多种相同的身份标识属性，本申请对此不作限定。

S302、根据时间属性对每组目标样本声音信息中的目标样本声音信息进行排序。

具体地，时间属性可以表示目标样本声音信息所发生的时间。对任一组目标样本声音信息而言，可以根据该组内的每条目标样本声音信息对应的时间属性(即发生时间)，对所有的目标样本声音信息进行排序，例如，可以按照时间顺序对所有的目标样本声音信息依次进行排序，也可以按照时间逆序对所有的目标样本声音信息依次进行排序。

可选地，对于任一目标样本声音信息而言，时间属性可以是该目标样本声音信息发生的初始时刻或结束时刻，也可以从发生到结束的时间段或时间段内的某一时刻，例如，若目标样本声音信息P的发生时间为2018年5月12日9:00:55至9:03:02，则时间属性可以是“2018年5月12日9:00:55”或“2018年5月12日9:03:02”，也可以是“2018年5月12日9:00:55——2018年5月12日9:03:02”等，本申请在此不作限定。

S303、根据位置属性、以及每组目标样本声音信息的排序结果，生成每组目标样本声音信息对应的行为轨迹。

其中，位置属性可以是目标样本声音信息对应的GPS坐标或IP地址等，可以标识该目标样本声音信息所出现的地点坐标。

对于上述任一组排序后的目标样本声音信息，可以根据该组内的所有目标样本声音信息各自对应的位置属性，将该组内所有目标样本声音信息出现的地点在地图上进行标记，并根据该组目标样本声音信息的排序结果，将地图上的所有标记点依次进行连接，从而得到该组目标样本声音信息对应的行为轨迹。例如，所生成的目标样本声音信息对应的行为轨迹可以参考图4所示。

图5示出了本申请实施例提供的基于声音的定位识别方法的又一流程示意图。

可选地，如图5所示，上述获取目标声音信息之前，该方法还包括：

S401、采集样本声音信息，并记录样本声音信息对应的属性信息。

具体地，可以通过手机、电脑等采集设备实现对样本声音信息的采集，该采集设备在采集样本声音信息的同时可以将样本声音信息对应的属性信息与所采集的样本声音信息一共进行记录。

可选地，采集设备在可以按照预设周期采集样本声音信息，如：可以每隔5分钟采集一次或每隔10分钟采集一次等，每次采集的时长可以是样本声音信息的发生时长，也可以是按照固定时长(如：1分钟、3分钟等)对样本声音信息进行采集，本申请在此均不作要求。

S402、将样本声音信息和对应的属性信息存储至声音数据库。

具体地，可以采集海量样本声音信息，并将所采集的样本声音信息与对应的属性信息一起进行存储，建立声音数据库。

可选地，如前述实施例中所述，也可以先将所采集的样本声音信息转换为声纹特征，并将转换后的声纹特征与对应的属性信息一起进行存储，从而建立声纹数据库。

图6示出了本申请实施例提供的基于声音的定位识别方法的又一流程示意图。

可选地，如图6所示，上述采集样本声音信息，并记录样本声音信息对应的属性信息，包括：

S501、获取目标设备采集的样本声音信息，记录样本声音信息、以及样本声音信息对应的属性信息。

其中，目标设备可以是如上所述电脑、手机等，也可以是录音笔、摄影机等其他可以采集音频数据的设备，本申请对此不作限定。

S502、若目标设备绑定有多个身份标识属性，则根据各身份标识属性对应的采集频率，对所记录的样本声音信息、以及样本声音信息对应的属性信息排序。

以网约车服务为例，若目标设备为司机的手机，身份标识属性为司机的手机号，且司机的手机中存在手机号1和手机号2，即该目标设备至少绑定有2个身份标识属性，则可以根据手机号1和手机号2对应的样本声音信息的采集频率，对手机号1和手机2、以及手机号1和手机2分别对应的样本声音信息按照采集频率的高低进行重要性排序。

类似的，目标设备中也可能存在3个或3个以上的其他身份标识属性，如注册ID，则同样可以按照上述方式对所记录的样本声音信息、以及样本声音信息对应的属性信息排序，本申请在此不再赘述。

可选地，上述获取目标声音信息，包括：

接收外部采集设备发送的目标声音信息；或从声音数据库中提取指定的目标声音信息。

具体地，上述所获取的目标声音信息对应的目标人员可以是已确定身份的目标人员，也可以是未确定身份的目标人员。例如，若需要查找已确认身份的目标人员的下落，则可以从声音数据库中提取该目标人员的样本声音信息作为目标声音信息，即可以从声音数据库中提取指定的目标声音信息；若还未确定目标人员的具体身份，则所获取的目标声音信息可以是从目标人员曾经待过的场合所提取的与目标人员相关的声音信息，即可以接收外部采集设备发送的目标声音信息。

本申请实施例还提供一种基于声音的定位识别装置，用于执行前述方法实施例中所述的基于声音的定位识别方法，该装置可以集成于终端或服务器等电子设备，本申请中不作限制。

在一些实施例中，服务器可以是单个服务器，也可以是服务器组。服务器组可以是集中式的，也可以是分布式的(例如，服务器可以是分布式系统)。在另外一些实施例中，服务器也可以在云平台上实现；仅作为示例，云平台可以包括私有云、公有云、混合云、社区云(community-cloud)、分布式云、跨云(inter-cloud)、多云(multi-cloud)等，或者它们的任意组合。

在一些实施例中，服务器可以包括处理器。处理器可以包括一个或多个处理核(例如，单核处理器(S)或多核处理器(S))。仅作为举例，处理器可以包括中央处理单元(Central Processing Unit，CPU)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor，ASIP)、图形处理单元(Graphics Processing Unit，GPU)、物理处理单元(Physics Processing Unit，PPU)、数字信号处理器(Digital Signal Processor，DSP)、现场可编程门阵列(Field Programmable Gate Array，FPGA)、可编程逻辑器件(Programmable Logic Device，PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing，RISC)、或微处理器等，或其任意组合。

图7示出了本申请实施例提供的基于声音的定位识别装置的结构示意图。如图7所示，该目标人员定位装置包括：

获取模块11，用于获取目标声音信息；提取模块12，用于提取声音数据库中与目标声音信息相似度大于预设阈值的目标样本声音信息、以及目标样本声音信息对应的属性信息，其中，声音数据库中保存有样本声音信息和样本声音信息对应的属性信息，属性信息包括：身份标识属性、位置属性和时间属性；生成模块13，用于根据属性信息，生成目标样本声音信息对应的行为轨迹。

图8示出了本申请实施例提供的基于声音的定位识别装置的另一结构示意图。

可选地，如图8所示，上述提取模块12包括：计算子模块121，用于根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度；提取子模块122，用于提取相似度大于预设阈值的样本声音信息作为目标样本声音信息。

图9示出了本申请实施例提供的基于声音的定位识别装置的又一结构示意图。

可选地，如图9所示，该基于声音的定位识别装置还包括：声纹获取模块14，用于在计算子模块121根据预设算法计算声音数据库中的样本声音信息与目标声音信息之间的相似度之前，获取目标声音信息对应的声纹特征、以及声音数据库中的样本声音信息对应的声纹特征；相应的，计算子模块121具体用于根据预设算法计算声音数据库中的样本声音信息与目标声音信息分别对应的声纹特征之间的相似度。

可选地，预设算法包括：余弦相似算法或欧氏距离算法。

图10示出了本申请实施例提供的基于声音的定位识别装置的又一结构示意图。

可选地，身份标识属性包括下述一项或多项：设备信息、账号信息、以及证件信息；如图10所示，上述生成模块13包括：分组子模块131，用于根据身份标识属性对目标样本声音信息进行分组，得到多个身份标识属性对应的多组目标样本声音信息；排序子模块132，用于根据时间属性对每组目标样本声音信息中的目标样本声音信息进行排序；生成子模块133，用于根据位置属性、以及每组目标样本声音信息的排序结果，生成每组目标样本声音信息对应的行为轨迹。

图11示出了本申请实施例提供的基于声音的定位识别装置的又一结构示意图。

可选地，如图11所示，该基于声音的定位识别装置还包括：采集模块15，用于采集样本声音信息，并记录样本声音信息对应的属性信息；存储模块16，用于将样本声音信息和对应的属性信息存储至声音数据库。

可选地，上述采集模块15，具体用于获取目标设备采集的样本声音信息，记录样本声音信息、以及样本声音信息对应的属性信息；若目标设备绑定有多个身份标识属性，则根据各身份标识属性对应的采集频率，对所记录的样本声音信息、以及样本声音信息对应的属性信息排序。

可选地，上述获取模块11，具体用于接收外部采集设备发送的目标声音信息；或从声音数据库中提取指定的目标声音信息。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述基于声音的定位识别装置的具体工作过程，可以参考前述方法实施例中的对应过程，本申请在此不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。

基于前述实施例，本申请还提供一种电子设备，该电子设备可以是通用计算机或特殊用途的计算机，两者都可以用于实现本申请的基于声音的定位识别方法。本申请尽管仅示出了一个计算机，但是为了方便起见，可以在多个类似平台上以分布式方式实现本申请描述的功能，以均衡处理负载。

图12示出了本申请实施例提供的电子设备的结构示意图。

如图12所示，该电子设备包括：处理器21、存储介质22和总线(图中未标出)，存储介质22存储有处理器21可执行的机器可读指令，当电子设备运行时，处理器21与存储介质22之间通过总线通信，处理器21执行机器可读指令，以执行时执行如前述方法实施例中所述的基于声音的定位识别方法的步骤，具体实现方式和技术效果类似，在此不再赘述。

为了便于说明，本申请在电子设备中仅描述了一个处理器。然而，应当注意，本申请中的电子设备还可以包括多个处理器，因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如，若电子设备的处理器执行步骤A和步骤B，则应该理解，步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如，第一处理器执行步骤A，第二处理器执行步骤B，或者第一处理器和第二处理器共同执行步骤A和B。

另外，该电子设备中，存储介质可以包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

前述实施例中所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，也可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

基于此，本申请实施例还提供一种存储介质，存储介质上存储有计算机程序，计算机程序被处理器运行时执行如前述方法实施例中所述的基于声音的定位识别方法的步骤。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于声音的定位识别方法，其特征在于，所述方法包括：

获取目标声音信息；

提取声音数据库中与所述目标声音信息相似度大于预设阈值的目标样本声音信息、以及所述目标样本声音信息对应的属性信息，其中，所述声音数据库中保存有样本声音信息和样本声音信息对应的属性信息，所述属性信息包括：身份标识属性、位置属性和时间属性；

根据所述属性信息，生成目标样本声音信息对应的行为轨迹。

2.根据权利要求1所述的方法，其特征在于，所述提取声音数据库中与所述目标声音信息相似度大于预设阈值的目标样本声音信息，包括：

根据预设算法计算声音数据库中的样本声音信息与所述目标声音信息之间的相似度；

提取相似度大于预设阈值的样本声音信息作为目标样本声音信息。

3.根据权利要求2所述的方法，其特征在于，所述根据预设算法计算声音数据库中的样本声音信息与所述目标声音信息之间的相似度之前，所述方法还包括：

获取所述目标声音信息对应的声纹特征、以及声音数据库中的样本声音信息对应的声纹特征；

相应的，所述根据预设算法计算声音数据库中的样本声音信息与所述目标声音信息之间的相似度，包括：

根据预设算法计算声音数据库中的样本声音信息与所述目标声音信息分别对应的声纹特征之间的相似度。

4.根据权利要求2或3所述的方法，其特征在于，所述预设算法包括：余弦相似算法或欧氏距离算法。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述身份标识属性包括下述一项或多项：设备信息、账号信息、以及证件信息；

所述根据所述属性信息，生成目标样本声音信息对应的行为轨迹，包括：

根据所述身份标识属性对所述目标样本声音信息进行分组，得到多个身份标识属性对应的多组目标样本声音信息；

根据所述时间属性对每组目标样本声音信息中的所述目标样本声音信息进行排序；

根据所述位置属性、以及每组所述目标样本声音信息的排序结果，生成每组所述目标样本声音信息对应的行为轨迹。

6.根据权利要求1所述的方法，其特征在于，所述获取目标声音信息之前，所述方法还包括：

采集样本声音信息，并记录所述样本声音信息对应的属性信息；

将所述样本声音信息和对应的所述属性信息存储至声音数据库。

7.根据权利要求6所述的方法，其特征在于，所述采集样本声音信息，并记录所述样本声音信息对应的属性信息，包括：

获取目标设备采集的样本声音信息，记录所述样本声音信息、以及所述样本声音信息对应的属性信息；

若所述目标设备绑定有多个身份标识属性，则根据各所述身份标识属性对应的采集频率，对所记录的所述样本声音信息、以及所述样本声音信息对应的属性信息排序。

8.根据权利要求1所述的方法，其特征在于，所述获取目标声音信息，包括：

接收外部采集设备发送的目标声音信息；或

从所述声音数据库中提取指定的目标声音信息。

9.一种基于声音的定位识别装置，其特征在于，包括：

获取模块，用于获取目标声音信息；

提取模块，用于提取声音数据库中与所述目标声音信息相似度大于预设阈值的目标样本声音信息、以及所述目标样本声音信息对应的属性信息，其中，所述声音数据库中保存有样本声音信息和样本声音信息对应的属性信息，所述属性信息包括：身份标识属性、位置属性和时间属性；

生成模块，用于根据所述属性信息，生成目标样本声音信息对应的行为轨迹。

10.根据权利要求9所述的装置，其特征在于，所述提取模块包括：

计算子模块，用于根据预设算法计算声音数据库中的样本声音信息与所述目标声音信息之间的相似度；

提取子模块，用于提取相似度大于预设阈值的样本声音信息作为目标样本声音信息。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

声纹获取模块，用于在所述计算子模块根据预设算法计算声音数据库中的样本声音信息与所述目标声音信息之间的相似度之前，获取所述目标声音信息对应的声纹特征、以及声音数据库中的样本声音信息对应的声纹特征；

相应的，所述计算子模块具体用于根据预设算法计算声音数据库中的样本声音信息与所述目标声音信息分别对应的声纹特征之间的相似度。

12.根据权利要求10或11所述的装置，其特征在于，所述预设算法包括：余弦相似算法或欧氏距离算法。

13.根据权利要求9-11任一项所述的装置，其特征在于，所述身份标识属性包括下述一项或多项：设备信息、账号信息、以及证件信息；所述生成模块包括：

分组子模块，用于根据所述身份标识属性对所述目标样本声音信息进行分组，得到多个身份标识属性对应的多组目标样本声音信息；

排序子模块，用于根据所述时间属性对每组目标样本声音信息中的所述目标样本声音信息进行排序；

生成子模块，用于根据所述位置属性、以及每组所述目标样本声音信息的排序结果，生成每组所述目标样本声音信息对应的行为轨迹。

14.根据权利要求9所述的装置，其特征在于，所述装置还包括：

采集模块，用于采集样本声音信息，并记录所述样本声音信息对应的属性信息；

存储模块，用于将所述样本声音信息和对应的所述属性信息存储至声音数据库。

15.根据权利要求14所述的装置，其特征在于，所述采集模块，具体用于获取目标设备采集的样本声音信息，记录所述样本声音信息、以及所述样本声音信息对应的属性信息；若所述目标设备绑定有多个身份标识属性，则根据各所述身份标识属性对应的采集频率，对所记录的所述样本声音信息、以及所述样本声音信息对应的属性信息排序。

16.根据权利要求9所述的装置，其特征在于，所述获取模块，具体用于接收外部采集设备发送的目标声音信息；或从所述声音数据库中提取指定的目标声音信息。

17.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行时执行如权利要求1-8任一项所述的基于声音的定位识别方法的步骤。

18.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1-8任一项所述的基于声音的定位识别方法的步骤。