CN112802482B - 一种声纹串并的识别方法、单兵系统及存储介质 - Google Patents

一种声纹串并的识别方法、单兵系统及存储介质 Download PDF

Info

Publication number
CN112802482B
CN112802482B CN202110404175.9A CN202110404175A CN112802482B CN 112802482 B CN112802482 B CN 112802482B CN 202110404175 A CN202110404175 A CN 202110404175A CN 112802482 B CN112802482 B CN 112802482B
Authority
CN
China
Prior art keywords
similarity
voice data
account
voiceprint feature
target voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110404175.9A
Other languages
English (en)
Other versions
CN112802482A (zh
Inventor
白世杰
吴富章
赵宇航
王秋明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuanjian Information Technology Co Ltd
Original Assignee
Beijing Yuanjian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuanjian Information Technology Co Ltd filed Critical Beijing Yuanjian Information Technology Co Ltd
Priority to CN202110404175.9A priority Critical patent/CN112802482B/zh
Publication of CN112802482A publication Critical patent/CN112802482A/zh
Application granted granted Critical
Publication of CN112802482B publication Critical patent/CN112802482B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本申请提供了一种声纹串并的识别方法、单兵系统及存储介质。识别方法包括:分别生成多个第一声纹特征向量和多个第二声纹特征向量;将每个第一声纹特征向量与多个第二声纹特征向量进行相似度计算,确定第一目标语音数据和第二目标语音数据的相似度比例;在相似度比例大于预设相似度比例时,确定作业账号设备对应的作业账号与生活账号设备对应的生活账号之间具有强相关性。本申请通过将第一声纹特征向量与第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为作业账号的身份信息,有助于公安办案人员能够准确的确定作案人员。

Description

一种声纹串并的识别方法、单兵系统及存储介质
技术领域
本申请涉及声纹数据技术领域,尤其是涉及一种声纹串并的识别方法、单兵系统及存储介质。
背景技术
现有技术中,公安人员在执行公务中需要确定作案人员身份信息的过程中,由于作案人员不用采用包含真实的账号进行作案,一般采用多个作案账号进行作案活动,且作案人员的作案账号与真实账号并不一致。由于作案人员反侦察意识强,作案账号绑定的身份信息与真实账号绑定的身份信息并不一致,作案账号绑定是虚假身份信息,真实账号使用的是嫌疑人的真实身份信息。公安办案人员在作案现场只能获取作案账号,或从受害者提供的线索中只能获取到作案账号的信息,但作案账号的身份信息并非作案人员真实身份信息。而真实账号有时可当场获取或从网络库中获取,因此,如何从作案账号定位到真实账号以及真实身份信息是公安办案人员一直亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种声纹串并的识别方法、单兵系统及存储介质,通过将由第一目标语音数据提取得到的第一声纹特征向量与由第二目标语音数据提取得到的第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为作业账号的身份信息,有助于公安办案人员能够准确的确定作案人员。
本申请主要包括以下几个方面:
第一方面,本申请实施例提供了一种声纹串并的识别方法,所述识别方法包括:
获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据;
针对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,分别生成多个第一声纹特征向量和多个第二声纹特征向量;
将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例;
在所述相似度比例大于预设相似度比例时,确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性;
将与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,并进行显示,以用于公安作业人员确定目标人物。
在一种可能的实施方式中,所述将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例,包括:
将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,得到多个相似度分数;
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
在一种可能的实施方式中,所述将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例,包括:
将多个所述相似度分数与预设阈值相似度分数进行对比,确定多个所述相似度分数中大于预设阈值相似度分数的个数;
将所述大于预设阈值相似度分数的个数与多个所述相似度分数的总数量进行比例计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
在一种可能的实施方式中,所述获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,包括:
所述获取作业账号设备中的第一初始语音数据和生活账号设备中的第二初始语音数据;
针对所述第一初始语音数据和所述第二初始语音数据均进行降噪方式的数据处理和清洗方式的数据处理,生成所述作业账号设备中的第一目标语音数据和所述生活账号设备中的第二目标语音数据。
在一种可能的实施方式中,通过以下方式对所述第一初始语音数据和所述第二初始语音数据均进行清洗方式的数据处理:
根据数据文件的命名规则,分别确定所述第一初始语音数据中与作业账号设备绑定的作业账号的语音信息以及所述第二初始语音数据中与生活账号设备绑定的生活账号的语音信息;
将所述作业账号的语音信息和所述生活账号的语音信息分别确定为第一目标语音数据和第二目标语音数据。
第二方面,本申请实施例还提供了一种声纹串并的识别方法,所述识别方法还包括:
获取作业账号设备中的第一目标语音数据;
针对所述第一目标语音数据进行声纹特征提取,生成多个第一声纹特征向量;
将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例;
将所述相似度比例进行比例降序排序,将所述比例降序排序中位于前预设数量的所述预设生活账号声纹特征向量对应的预设生活账号所绑定的个人身份信息进行显示,用于公安作业人员确定目标人物。
第三方面,本申请实施例还提供了一种声纹串并的单兵系统,所述单兵系统包括:
获取模块,用于获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据;
提取模块,用于针对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,分别生成多个第一声纹特征向量和多个第二声纹特征向量;
第一声纹串并模块,用于将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例;
确定模块,用于在所述相似度比例大于预设相似度比例时,确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性;
确定显示模块,用于将与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,并进行显示,以用于公安作业人员确定目标人物。
在一种可能的实施方式中,所述单兵系统还包括:
第二声纹串并模块,用于将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例;
识别排序模块,用于将所述相似度比例进行比例降序排序,将所述比例降序排序中位于前预设数量的所述预设生活账号声纹特征向量对应的预设生活账号所绑定的个人身份信息进行显示,用于公安作业人员确定目标人物。
第四方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第二方面中任一种可能的实施方式中所述的识别方法的步骤。
第五方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行述第一方面或第二方面中任一种可能的实施方式中所述的识别方法的步骤。
本申请实施例中,通过直接获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,并对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,将提取后生成的第一声纹特征向量与第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为所述作业账号的身份信息,有助于公安办案人员能够准确的确定作案人员,提升了公安办案人员的现场办公效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种声纹串并的识别方法的流程图;
图2示出了本申请实施例所提供的另一种声纹串并的识别方法的流程图;
图3示出了本申请实施例所提供的一种声纹串并的单兵系统的结构示意图;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
主要元件符号说明:
图中:300-单兵系统;310-获取模块;320-提取模块;330-第一声纹串并模块;340-确定模块;350-确定显示模块;360-第二声纹串并模块;370-识别排序模块;400-电子设备;410-处理器;420-存储器;430-总线。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“声纹串并的识别”,给出以下实施方式,对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。
本申请实施例下所述方法、系统、电子设备及存储介质可以应用于任何需要进行声纹串并识别的场景,本申请实施例并不对具体的应用场景作限制,任何使用本申请实施例提供的声纹串并的识别方法、单兵系统、电子设备及存储介质的方案均在本申请保护范围内。
值得注意的是,经研究发现,在本申请提出之前,现有技术中公安人员在执行公务中需要确定作案人员身份信息的过程中,由于作案人员不用采用包含真实的账号进行作案,一般采用多个作案账号进行作案活动,且作案人员的作案账号与真实账号并不一致。由于作案人员反侦察意识强,作案账号绑定的身份信息与真实账号绑定的身份信息并不一致,作案账号绑定是虚假身份信息,真实账号使用的是嫌疑人的真实身份信息。公安办案人员在作案现场只能获取作案账号,或从受害者提供的线索中只能获取到作案账号的信息,但作案账号的身份信息并非作案人员真实身份信息。而真实账号有时可当场获取或从网络库中获取,因此,如何从作案账号定位到真实账号以及真实身份信息是公安办案人员一直亟待解决的问题。
基于此,本申请实施例提供了一种声纹串并的识别方法、单兵系统300及存储介质,通过将由第一目标语音数据提取得到的第一声纹特征向量与由第二目标语音数据提取得到的第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为所述作业账号的身份信息,使得公安办案人员能够准确的确定作案人员。
为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。
请参阅图1,图1为本申请实施例所提供的一种声纹串并的识别方法的流程图。如图1中所示,本申请实施例提供的声纹串并的识别方法,包括以下步骤:
S101、获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据。
该步骤中,当在现场获取到作业账号设备以及生活账号设备时,从作业账号设备中的存储的数据信息中搜寻语音信息,并获取所述语音信息中的第一目标语音信息,以及从生活账号设备的存储的数据信息中搜寻语音信息,并获取所述语音信息中的第二目标语音信息。
其中,所述作业账号设备为作案人员,即犯罪嫌疑人在作案现场实所使用的犯罪账号设备,所述生活账号设备为作案人员,即犯罪嫌疑人在作案现场实所使用的真实的账号设备。
这里,所述第一目标语音信息以及所述第二目标语音信息为由所述第一初始语音信息以及第二初始语音信息经由信息处理后生成的。
这样,所述作业账号设备和所述生活账号设备处于位于同一案发现场。
其中,对于所述第一目标语音信息以及所述第二目标语音信息的传输使用单兵传输系统,单兵传输系统能够满足武警、公安及特警等特殊工作人员在执法取证的过程中便携式监控的需求。
进一步的,所述获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,包括:
所述获取作业账号设备中的第一初始语音数据和生活账号设备中的第二初始语音数据。
其中,所述第一初始语音数据是从所述作业账号设备中直接获取的初始语音数据,所述第二初始语音数据同样是从所述生活账号设备中直接获取的语音数据。
针对所述第一初始语音数据和所述第二初始语音数据均进行降噪方式的数据处理和清洗方式的数据处理,生成所述作业账号设备中的第一目标语音数据和所述生活账号设备中的第二目标语音数据。
这里,通过以下方式对所述第一初始语音数据和所述第二初始语音数据均进行清洗方式的数据处理:
根据数据文件的命名规则,分别确定所述第一初始语音数据中与作业账号设备绑定的作业账号的语音信息以及所述第二初始语音数据中与生活账号设备绑定的生活账号的语音信息。
其中,由于与作业账号设备绑定的作业账号的语音信息所对应的语音文件的命名规则和所述第一初始语音数据中其他语音信息所对应的语音文件的命名规则不同,因此,根据不同的文件的命名规则,可以自动区分出所述第一初始语音数据中与作业账号设备绑定的作业账号的语音信息;同理,由于与生活账号设备绑定的生活账号的语音信息所对应的语音文件的命名规则和所述第二初始语音数据中其他语音信息所对应的语音文件的命名规则不同,因此,根据不同的文件的命名规则,可以自动区分出所述第二初始语音数据中与生活账号设备绑定的生活账号的语音信息,起到排除非作业账号和生活账号中的非作案人员本人的语音信息。
将所述作业账号的语音信息和所述生活账号的语音信息分别确定为第一目标语音数据和第二目标语音数据。
其中,所述第一目标语音数据和所述第二目标语音数据分别为所述第一初始语音数据和所述第二初始语音数据中与所述作业账号和所述生活账号绑定的语音信息。
S102、针对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,分别生成多个第一声纹特征向量和多个第二声纹特征向量。
该步骤中,对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,提取出所述第一目标语音数据中第一声纹特征向量和所述第二目标语音数据中的第二声纹特征向量,将所述第一声纹特征向量和所述第二声纹特征向量进行存储。
其中,Fi表示第i条第一声纹特征向量,其中,i€Rm,m代表第一声纹特征向量的条数;同理,Sj表示第j条第二声纹特征向量,其中j€Rn,n代表第二声纹特征向量的条数。
S103、将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
这里,将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,得到多个相似度分数。
其中,将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,得到每个所述第一声纹特征向量与每个第二声纹特征向量进行相似度计算的多个相似度分数。
例如,将个所述第一声纹特征向量Fi逐一与第二声纹特征向量Sj进行相似性计算,得到m*n个余弦相似度分数。
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
这里,将多个所述相似度分数与公安作业人员根据案发现场的实际情况设定的预设阈值进行对比,计算所述第一目标语音数据和所述第二目标语音数据的相似度比例。
其中,所述相似度比例是由大于所述预设阈值相似度分数的个数与相似度分数的总数量进行比例计算得到的。
进一步的,所述将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例,包括:
将多个所述相似度分数与预设阈值相似度分数进行对比,确定多个所述相似度分数中大于预设阈值相似度分数的个数。
这里,例如,设定所述预设阈值为s,将m*n个余弦相似度分数与预设阈值的相似度分数s进行对比,确定m*n个余弦相似度分数中大于预设阈值相似度分数s的个数为x个。
将所述大于预设阈值相似度分数的个数与多个所述相似度分数的总数量进行比例计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
这里,将x个大于预设阈值相似度分数的个数与m*n个余弦相似度分数进行比例计算,计算x/(m*n),得到所述第一目标语音数据和所述第二目标语音数据的相似度比例。
S104、在所述相似度比例大于预设相似度比例时,确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性。
该步骤中,公安作业人员根据案发现场的实际需要的实际情况,设定预设相似度比例t,若所述相似度比例x/(m*n)大于t时,则确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性。
其中,所述相似度比例x/(m*n)小于t或所述相似度比例x/(m*n)等于t时,则确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间不具有相关性,进而确定所述作业账号设备中的所述作业账号存在作案嫌疑。
S105、将与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,并进行显示,以用于公安作业人员确定目标人物。
该步骤中,在确定所述相似度比例大于预设相似度比例,与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,将所述个人身份信息进行显示,可以直接定位确定现场的目标人物,并对所述现场作案人员的个人身份信息进行显示、现场核实以及稽查。
其中,所述作案人员即为所述案发现场的作案嫌疑人。
本申请实施例提供的识别方法,与现有技术中相比,本申请通过直接获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,并对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,将提取后生成的第一声纹特征向量与第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为所述作业账号的身份信息,有助于公安办案人员能够准确的确定作案人员,提升了公安办案人员的现场办公效率。
请参阅图2,图2为本申请另一实施例提供的一种声纹串并的识别方法的流程图。如图2中所示,本申请实施例提供的声纹串并的识别方法,包括以下步骤:
S201、获取作业账号设备中的第一目标语音数据。
S202、针对所述第一目标语音数据进行声纹特征提取,生成多个第一声纹特征向量。
S203、将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例。
进一步的,所述将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例,包括:
将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,得到多个相似度分数。
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例。
进一步的,将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例,包括:
将多个所述相似度分数与预设阈值相似度分数进行对比,确定多个所述相似度分数中大于预设阈值相似度分数的个数。
将所述大于预设阈值相似度分数的个数与多个所述相似度分数的总数量进行比例计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例。
S204、将所述相似度比例进行比例降序排序,将所述比例降序排序中位于前预设数量的所述预设生活账号声纹特征向量对应的预设生活账号所绑定的个人身份信息进行显示,用于公安作业人员确定目标人物。
这里,将所述相似度比例进行比例降序排序,此时,公安作业人员根据案发现场的实际需求设定预设数量,并选取预设数量个数之前的所述预设生活账号声纹特征向量对应的预设生活账号所绑定的个人身份信息进行显示,并根据所述预设生活账号所绑定的个人身份信息查找对应的案发现场的作案人员及犯罪嫌疑人。
本申请实施例提供的识别方法,与现有技术中相比,本申请通过直接获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,并对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,将提取后生成的第一声纹特征向量与第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为所述作业账号的身份信息,有助于公安办案人员能够准确的确定作案人员,提升了公安办案人员的现场办公效率。
请参阅图3,图3为本申请实施例所提供的一种声纹串并的单兵系统300的结构示意图。如图3中所示,所述一种声纹串并的单兵系统300包括:
获取模块310,用于获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据。
提取模块320,用于针对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,分别生成多个所述第一声纹特征向量和多个所述第二声纹特征向量。
第一声纹串并模块330,用于将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
确定模块340,用于在所述相似度比例大于预设相似度比例时,确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性。
确定显示模块350,用于将与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,并进行显示,以用于公安作业人员确定目标人物。
第二声纹串并模块360,用于将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例。
识别排序模块370,用于将所述相似度比例进行比例降序排序,将所述比例降序排序中位于前预设数量的所述预设生活账号声纹特征向量对应的预设生活账号所绑定的个人身份信息进行显示,用于公安作业人员确定目标人物。
本申请实施例提供的单兵系统300,与现有技术中相比,本申请通过直接获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,并对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,将提取后生成的第一声纹特征向量与第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为所述作业账号的身份信息,有助于公安办案人员能够准确的确定作案人员,提升了公安办案人员的现场办公效率。
请参阅图4,图4为本申请实施例所提供的一种电子设备400的结构示意图,包括:处理器410、存储器420和总线430,所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过所述总线430进行通信,所述机器可读指令被所述处理器410运行时执行如上述实施例中任一所述的声纹串并的识别方法的步骤。
具体地,所述机器可读指令被所述处理器410执行时可以执行如下处理:
获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据。
针对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,分别生成多个第一声纹特征向量和多个第二声纹特征向量。
将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
在所述相似度比例大于预设相似度比例时,确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性。
将与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,并进行显示,以用于公安作业人员确定目标人物。
本申请实施例中,请通过直接获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,并对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,将提取后生成的第一声纹特征向量与第二声纹特征向量进行相似度比例计算,进而确定作业账号与生活账号之间的相关性,进而实现将生活账号绑定的个人身份信息确定为所述作业账号的身份信息,有助于公安办案人员能够准确的确定作案人员,提升了公安办案人员的现场办公效率。
基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例提供的声纹串并的识别方法的步骤。
具体地,所述存储介质能够为通用的存储介质,如移动磁盘、硬盘等,所述存储介质上的计算机程序被运行时,能够执行上述声纹串并的识别方法,可以实现将生活账号绑定的个人身份信息确定为所述作业账号的身份信息,使得公安办案人员能够准确的确定作案人员,提升了公安办案人员的现场办公效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种声纹串并的识别方法,其特征在于,所述识别方法包括:
获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据;其中,所述作业账号设备和所述生活账号设备处于位于同一案发现场;
针对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,分别生成多个第一声纹特征向量和多个第二声纹特征向量;
将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例;
在所述相似度比例大于预设相似度比例时,确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性;
将与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,并进行显示,以用于公安作业人员确定目标人物;
所述将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例,包括:
将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,得到多个相似度分数;
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例;
所述将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例,包括:
将多个所述相似度分数与预设阈值相似度分数进行对比,确定多个所述相似度分数中大于预设阈值相似度分数的个数;
将所述大于预设阈值相似度分数的个数与多个所述相似度分数的总数量进行比例计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
2.根据权利要求1所述的识别方法,其特征在于,所述获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据,包括:
所述获取作业账号设备中的第一初始语音数据和生活账号设备中的第二初始语音数据;
针对所述第一初始语音数据和所述第二初始语音数据均进行降噪方式的数据处理和清洗方式的数据处理,生成所述作业账号设备中的第一目标语音数据和所述生活账号设备中的第二目标语音数据。
3.根据权利要求2所述的识别方法,其特征在于,通过以下方式对所述第一初始语音数据和所述第二初始语音数据均进行清洗方式的数据处理:
根据数据文件的命名规则,分别确定所述第一初始语音数据中与作业账号设备绑定的作业账号的语音信息以及所述第二初始语音数据中与生活账号设备绑定的生活账号的语音信息;
将所述作业账号的语音信息和所述生活账号的语音信息分别确定为第一目标语音数据和第二目标语音数据。
4.一种声纹串并的识别方法,其特征在于,所述识别方法还包括:
获取作业账号设备中的第一目标语音数据;
针对所述第一目标语音数据进行声纹特征提取,生成多个第一声纹特征向量;
将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例;
将所述相似度比例进行比例降序排序,将所述比例降序排序中位于前预设数量的所述预设生活账号声纹特征向量对应的预设生活账号所绑定的个人身份信息进行显示,用于公安作业人员确定目标人物;
所述将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例,包括:
将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,得到多个相似度分数;
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例;
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例,包括:
将多个所述相似度分数与预设阈值相似度分数进行对比,确定多个所述相似度分数中大于预设阈值相似度分数的个数;
将所述大于预设阈值相似度分数的个数与多个所述相似度分数的总数量进行比例计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例。
5.一种声纹串并的单兵系统,其特征在于,所述单兵系统包括:
获取模块,用于获取作业账号设备中的第一目标语音数据和生活账号设备中的第二目标语音数据;其中,所述作业账号设备和所述生活账号设备处于位于同一案发现场;
提取模块,用于针对所述第一目标语音数据和所述第二目标语音数据分别进行声纹特征提取,分别生成多个第一声纹特征向量和多个第二声纹特征向量;
第一声纹串并模块,用于将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例;
确定模块,用于在所述相似度比例大于预设相似度比例时,确定所述作业账号设备对应的作业账号与所述生活账号设备对应的生活账号之间具有强相关性;
确定显示模块,用于将与所述生活账号绑定的个人身份信息确定为所述作业账号的身份信息,并进行显示,以用于公安作业人员确定目标人物;
所述将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例,包括:
将每个所述第一声纹特征向量与多个所述第二声纹特征向量进行相似度计算,得到多个相似度分数;
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例;
所述将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例,包括:
将多个所述相似度分数与预设阈值相似度分数进行对比,确定多个所述相似度分数中大于预设阈值相似度分数的个数;
将所述大于预设阈值相似度分数的个数与多个所述相似度分数的总数量进行比例计算,确定所述第一目标语音数据和所述第二目标语音数据的相似度比例。
6.根据权利要求5所述的单兵系统,其特征在于,所述单兵系统还包括:
第二声纹串并模块,用于将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例;
识别排序模块,用于将所述相似度比例进行比例降序排序,将所述比例降序排序中位于前预设数量的所述预设生活账号声纹特征向量对应的预设生活账号所绑定的个人身份信息进行显示,用于公安作业人员确定目标人物;
所述将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例,包括:
将每个所述第一声纹特征向量与多个预设生活账号声纹特征向量进行相似度计算,得到多个相似度分数;
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例;
将多个所述相似度分数与预设阈值相似度分数进行对比,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例,包括:
将多个所述相似度分数与预设阈值相似度分数进行对比,确定多个所述相似度分数中大于预设阈值相似度分数的个数;
将所述大于预设阈值相似度分数的个数与多个所述相似度分数的总数量进行比例计算,确定所述第一目标语音数据和每个所述预设生活账号声纹特征向量的相似度比例。
7.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器运行时执行如上述权利要求1至4中任一所述的识别方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述权利要求1至4中任一所述的识别方法的步骤。
CN202110404175.9A 2021-04-15 2021-04-15 一种声纹串并的识别方法、单兵系统及存储介质 Active CN112802482B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110404175.9A CN112802482B (zh) 2021-04-15 2021-04-15 一种声纹串并的识别方法、单兵系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110404175.9A CN112802482B (zh) 2021-04-15 2021-04-15 一种声纹串并的识别方法、单兵系统及存储介质

Publications (2)

Publication Number Publication Date
CN112802482A CN112802482A (zh) 2021-05-14
CN112802482B true CN112802482B (zh) 2021-07-23

Family

ID=75811432

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110404175.9A Active CN112802482B (zh) 2021-04-15 2021-04-15 一种声纹串并的识别方法、单兵系统及存储介质

Country Status (1)

Country Link
CN (1) CN112802482B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114125153A (zh) * 2021-11-05 2022-03-01 北京声智科技有限公司 通话的预警方法、装置、服务器、存储介质及产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107395352A (zh) * 2016-05-16 2017-11-24 腾讯科技(深圳)有限公司 基于声纹的身份识别方法及装置
CN108682414A (zh) * 2018-04-20 2018-10-19 深圳小祺智能科技有限公司 语音控制方法、语音系统、设备和存储介质
CN111050063A (zh) * 2019-03-29 2020-04-21 苏州浩哥文化传播有限公司 一种基于声源识别的自动化摄像方法及其系统
CN111883141A (zh) * 2020-07-27 2020-11-03 李林林 一种文本半相关的声纹识别方法及系统
CN112435673A (zh) * 2020-12-15 2021-03-02 北京声智科技有限公司 一种模型训练方法及电子终端

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447188B (zh) * 2007-11-27 2011-06-15 北京金运昭德数字科技有限公司 数字声纹鉴定系统及确认和辨认方法
US9293140B2 (en) * 2013-03-15 2016-03-22 Broadcom Corporation Speaker-identification-assisted speech processing systems and methods
CN106782564B (zh) * 2016-11-18 2018-09-11 百度在线网络技术(北京)有限公司 用于处理语音数据的方法和装置
US11152006B2 (en) * 2018-05-07 2021-10-19 Microsoft Technology Licensing, Llc Voice identification enrollment
CN109036434A (zh) * 2018-08-07 2018-12-18 广州势必可赢网络科技有限公司 一种通过声纹协助案件侦破的方法、装置及设备
CN109192216A (zh) * 2018-08-08 2019-01-11 联智科技(天津)有限责任公司 一种声纹识别用训练数据集仿真获取方法及其获取装置
CN109036436A (zh) * 2018-09-18 2018-12-18 广州势必可赢网络科技有限公司 一种声纹数据库建立方法、声纹识别方法、装置及系统
CN109473105A (zh) * 2018-10-26 2019-03-15 平安科技(深圳)有限公司 与文本无关的声纹验证方法、装置和计算机设备
CN111028845A (zh) * 2019-12-06 2020-04-17 广州国音智能科技有限公司 多音频识别方法、装置、设备及可读存储介质
CN112104675B (zh) * 2020-11-19 2021-02-05 深圳市房多多网络科技有限公司 身份验证方法和系统
CN112382300A (zh) * 2020-12-14 2021-02-19 北京远鉴信息技术有限公司 声纹鉴定方法、模型训练方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107395352A (zh) * 2016-05-16 2017-11-24 腾讯科技(深圳)有限公司 基于声纹的身份识别方法及装置
CN108682414A (zh) * 2018-04-20 2018-10-19 深圳小祺智能科技有限公司 语音控制方法、语音系统、设备和存储介质
CN111050063A (zh) * 2019-03-29 2020-04-21 苏州浩哥文化传播有限公司 一种基于声源识别的自动化摄像方法及其系统
CN111883141A (zh) * 2020-07-27 2020-11-03 李林林 一种文本半相关的声纹识别方法及系统
CN112435673A (zh) * 2020-12-15 2021-03-02 北京声智科技有限公司 一种模型训练方法及电子终端

Also Published As

Publication number Publication date
CN112802482A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN113257255B (zh) 一种伪造语音的识别方法、装置、电子设备及存储介质
CN112802482B (zh) 一种声纹串并的识别方法、单兵系统及存储介质
CN112671806B (zh) 一种用户的认证方法、用户认证设备及用户认证系统
CN111814128B (zh) 基于融合特征的身份认证方法、装置、设备及存储介质
CN110825893A (zh) 一种目标查找方法、装置、系统及存储介质
CN112351047B (zh) 基于双引擎的声纹身份认证方法、装置、设备及存储介质
CN110196924B (zh) 特征信息库的构建、目标对象的追踪方法及装置
CN112992152B (zh) 一种单兵声纹识别系统、方法、存储介质及电子设备
CN113032821A (zh) 数据脱敏方法、装置、电子设备及可读存储介质
CN106874505A (zh) 一种搜索方法及装置
CN110888877A (zh) 事件信息显示方法、装置、计算设备及存储介质
CN113987489A (zh) 一种网络未知威胁的检测方法、装置、电子设备及存储介质
CN112090087B (zh) 游戏外挂的检测方法及装置、存储介质、计算机设备
CN113343010A (zh) 一种图像识别方法、电子设备及计算机可读存储介质
CN113923011A (zh) 一种网络诈骗的预警方法、装置、计算机设备及存储介质
CN114023331A (zh) 声纹识别系统的性能检测方法、装置、设备和存储介质
CN111291150A (zh) 一种待搜索信息的确定方法、确定装置及可读存储介质
CN113011301A (zh) 一种活体识别方法、装置及电子设备
CN106682612B (zh) 一种基于图像识别的报警方法、终端、服务器及系统
CN111627146A (zh) 一种用户行为识别方法及装置
CN111770080A (zh) 一种设备指纹的恢复方法及装置
CN117240554B (zh) 安全事件的治理方法及电子设备
CN113111689A (zh) 一种样本挖掘方法、装置、设备及存储介质
CN110046910B (zh) 判断客户通过电子支付平台所进行交易合法性的方法和设备
CN114971643B (zh) 异常交易识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant