CN112530438B

CN112530438B - 一种基于知识图谱辅助声纹识别的身份认证方法

Info

Publication number: CN112530438B
Application number: CN202011364919.0A
Authority: CN
Inventors: 孟悦恒; 金宇; 龚霄; 潘嵩; 苏畅; 孙已茹; 朱鹏; 蒋猛; 沈云春
Original assignee: Guizhou Power Grid Co Ltd
Current assignee: Guizhou Power Grid Co Ltd
Priority date: 2020-11-27
Filing date: 2020-11-27
Publication date: 2023-04-07
Anticipated expiration: 2040-11-27
Also published as: CN112530438A

Abstract

本发明公开了一种基于知识图谱辅助声纹识别的身份认证方法，包括，利用原始数据提取各个实体之间的关系构建知识图谱及电网调度关键词库；当声纹识别准确率下降时，根据语音识别策略将调度通话录音转换为调度文本；基于所述电网调度关键词库和自然语言处理策略提取所述调度文本中的关键实体及关系；利用所述知识图谱匹配策略辅助所述声纹识别进行身份认证。本发明实现声纹识别失效下大幅提高了人员身份认证的准确性，保证电网调度过程的安全进行。

Description

一种基于知识图谱辅助声纹识别的身份认证方法

技术领域

本发明涉及电网调度系统、身份认证的技术领域，尤其涉及一种基于知识图谱辅助声纹识别的身份认证方法。

背景技术

目前电网调度系统进行身份认证主要是通过行政管理手段进行把关，例如，调度操作票填写的“五核实”、“三审签字”以及通话核实等，现行管理方式下，人员身份核实仍然存在盲点，通话确认身份的方式往往缺乏可信度，存在无资质操作的隐患；现阶段电网调度系统正在做声纹识别改造，拟通过声纹识别的方式进行身份认证，但是受现场环境及设备的影响，通话录音往往质量不高，存在噪音、盲音等情况，影响声纹识别的效果，从而导致声纹识别失效的情况。

当前通过声纹识别确认通话双方身份的方式对比以前通过行政管理的方式虽然在效率和规范性上都有很大提高，但是受现场条件的约束，通话现场环境的影响，通话录音质量可能不高，存在噪音、盲音、声音太小无法识别等情况，从而导致声纹识别失败，还是会存在一定的安全隐患。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊，而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有存在的问题，提出了本发明。

因此，本发明提供了一种基于知识图谱辅助声纹识别的身份认证方法，能够解决现有声纹识别认证身份存在效率和安全规范不足的问题。

为解决上述技术问题，本发明提供如下技术方案：包括，利用原始数据提取各个实体之间的关系构建知识图谱及电网调度关键词库；当声纹识别准确率下降时，根据语音识别策略将调度通话录音转换为调度文本；基于所述电网调度关键词库和自然语言处理策略提取所述调度文本中的关键实体及关系；利用所述知识图谱匹配策略辅助所述声纹识别进行身份认证。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：所述原始数据包括，结构化数据、非结构化数据及半结构化数据。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：所述实体包括，人名、地域名称、设备名称和电话号码。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：构建所述知识图谱包括，数据预处理、实体识别及关系抽取、实体对齐和生成所述知识图谱；所述数据预处理包括，利用所述语音识别策略将语音转化为文本。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：包括，根据电网调度专业语料库生成自定义分词器，对所述文本进行分词，利用CRF+双向LSTM进行所述实体识别，结合SDP+LSTM进行关系抽取，形成初步知识。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：所述知识对齐包括，对所述实体进行消岐、同义词装换处理，对所述实体间关系进行共指消解操作，进行质量评估，形成正确的所述知识并存入生成的所述知识图谱中。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：对所述调度通话录音进行识别对比分析需建立识别分析模型，包括，叠加多个残差网络ResNet，y＝F(x)+x；建立区域生成网络，P_i＝FC₂[FC₁[Pooling(f,R_i)]]，设置阈值为0.5，若P_i超过0.5，则保留候选区域，若P_i低于0.5，则舍弃；生成分类分支，

生成掩码分支，M_i＝FC₆[FC₅[Pooling(f,R_i′)]]；其中，y：残差网络的输出，x：残差网络的输入，F：卷积运算函数，f：残差网络输出的语音特征，R_i：候选区域，Pooling：池化运算，FC₁、FC₂分别为第一层、第二层全连接层运算，P_i：候选区域R_i属于前景(即包含待识别特征)的概率，R_i′：保留的候选区域，FC₃、FC₄分别为第三层、第四层全连接层运算，

候选区域R_i′待识别物体c的概率，FC₅、FC₆分别为第五层、第六层全连接层运算，矩阵M_i与候选区域R_i′像素大小一致，M_i中每个位置代表候选区域内该目标点属于识别特征的概率。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：识别包括，利用所述残差网络提取语音待识别特征；所述区域生成网络利用所述语音待识别特征对待识别语音进行分析，且将候选区域的特征分别送入所述分类分支和所述掩码分支中；所述分类分支识别所述待识别特征的种类；所述掩码分支定位所述待识别特征在所述调度语音中的波点。

作为本发明所述的基于知识图谱辅助声纹识别的身份认证方法的一种优选方案，其中：进行所述验证包括，若声纹识别结果通过身份验证，则直接进入所述语音识别；若所述声纹识别结果未通过身份验证，则对所述下令人身份进行ID地址核实，若核实正确，则重新继续所述身份验证，若核实错误，则终止对当前所述语音的声纹识别。

本发明的有益效果：本发明通过构建知识图谱，构建人与设备、组织机构、地点、固定电话号码等实体的关系，在声纹识别失效时，通过语音识别，将通话录音转化为文本，提起文本中的实体及关系，再经过图匹配算法与知识图谱中的实体-关系进行匹配，再与声纹识别结果进行筛选，从而实现极端情况(声纹识别失效)下大幅提高了人员身份认证的准确性，保证电网调度过程的安全进行。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。其中：

图1为本发明一个实施例所述的基于知识图谱辅助声纹识别的身份认证方法的流程示意图；

图2为本发明一个实施例所述的基于知识图谱辅助声纹识别的身份认证方法的知识图谱示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明，显然所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明的保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。

本发明结合示意图进行详细描述，在详述本发明实施例时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本发明保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。

同时在本发明的描述中，需要说明的是，术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一、第二或第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

本发明中除非另有明确的规定和限定，术语“安装、相连、连接”应做广义理解，例如：可以是固定连接、可拆卸连接或一体式连接；同样可以是机械连接、电连接或直接连接，也可以通过中间媒介间接相连，也可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

实施例1

参照图1和图2，为本发明的第一个实施例，提供了一种基于知识图谱辅助声纹识别的身份认证方法，包括：

S1：利用原始数据提取各个实体之间的关系构建知识图谱及电网调度关键词库。其中需要说明的是，原始数据包括：

结构化数据、非结构化数据及半结构化数据；

实体包括，人名、地域名称、设备名称和电话号码；

构建知识图谱包括，数据预处理、实体识别及关系抽取、实体对齐和生成知识图谱；

数据预处理包括，利用语音识别策略将语音转化为文本；

知识对齐包括，对实体进行消岐、同义词装换处理，对实体间关系进行共指消解操作，进行质量评估，形成正确的知识并存入生成的知识图谱中。

S2：当声纹识别准确率下降时，根据语音识别策略将调度通话录音转换为调度文本。

S3：基于电网调度关键词库和自然语言处理策略提取调度文本中的关键实体及关系。其中还需要说明的是，实体识别及关系抽取包括：

根据电网调度专业语料库生成自定义分词器，对文本进行分词，利用CRF+双向LSTM进行实体识别，结合SDP+LSTM进行关系抽取，形成初步知识。

S4：利用知识图谱匹配策略辅助声纹识别进行身份认证。本步骤还需要说明的是，对调度通话录音进行识别对比分析需建立识别分析模型，包括：

叠加多个残差网络ResNet，y＝F(x)+x；

建立区域生成网络，P_i＝FC₂[FC₁[Pooling(f,R_i)]]，设置阈值为0.5，若P_i超过0.5，则保留候选区域，若P_i低于0.5，则舍弃；

生成分类分支，

生成掩码分支，

其中，y：残差网络的输出，x：残差网络的输入，F：卷积运算函数，f：残差网络输出的语音特征，R_i：候选区域，Pooling：池化运算，FC₁、FC₂分别为第一层、第二层全连接层运算，P_i：候选区域R_i属于前景(即包含待识别特征)的概率，R_i′：保留的候选区域，FC₃、FC₄分别为第三层、第四层全连接层运算，

识别包括：

利用残差网络提取语音待识别特征；

区域生成网络利用语音待识别特征对待识别语音进行分析，且将候选区域的特征分别送入分类分支和掩码分支中；

分类分支识别待识别特征的种类；

掩码分支定位待识别特征在调度语音中的波点。

进行验证包括：

若声纹识别结果通过身份验证，则直接进入语音识别；

若声纹识别结果未通过身份验证，则对下令人身份进行ID地址核实，若核实正确，则重新继续身份验证，若核实错误，则终止对当前语音的声纹识别。

较佳的是，本实施例根据电网调度系统获取值班调度员调度电话获取通话录音，并调用声纹识别服务进行声纹识别，如果声纹识别返回的结果匹配率≥80％,则表示身份识别成功，返回匹配率最高的人；如果声纹识别返回的结果＜80％，表示声纹识别失败，不能根据声纹确定人员身份，此时获取匹配率最高的三个用户，调用语音识别服务，将通话录音转换为文本，并通过实体识别及关系抽取技术，对文本进行处理，将提取出的实体及关系与知识图谱中的知识进行图匹配，查找到匹配程度最高的三个用户，再与声纹识别时匹配率最高的三个用户进行筛选，找到最佳匹配用户，从而完成辅助声纹识别进行身份认证。

需要说明的是，本实施例中的数据预处理，由于以往电网调度过程中产生的数据存在多样化、复杂化的特点，如数据有可能是通话录音、操作票等非结构化数据以及关系型数据库存储的结构化数据，对不同的数据需要采取不同的方式进行处理，如对于通话录音，利用语音识别技术将语音转化为文本，再通过下一步实体识别及关系抽取转换为知识，对于关系型数据库存储的结构化数据，直接通过D2R转换提取实体及关系。具体实现的部分程序如下：

参照图2，本实施例还需要说明的是，若受调度人“李华”接通电话，通话内容为“贞丰供电局李华，在35kV纳夜变10kV麻山线0023刀闸线路侧装设接地线一组”，声纹识别服务对其通话录音进行声纹识别，但是当时“李华”所处环境噪音太大，声纹识别失效，识别出的结果列表匹配率都小于80％，此时可以通过语音识别，识别出实体“李华”、“贞丰供电局”、“35kV纳夜变10kV麻山线0023刀闸”，通话电话号码为“085106384756”，此时就可以根据这些实体-关系与知识图谱进行匹配，找到其中匹配率最高的人，再与声纹识别返回的结果列表进行筛选，识别出当前人员为“李华”。

实施例2

为了对本发明方法中采用的技术效果加以验证说明，本实施例选择以传统的知识图谱声纹识别认证方法与本发明方法进行对比测试，以科学论证的手段对比试验结果，验证本发明方法所具有的真实效果。

传统的知识图谱声纹识别认证方法存在安全隐患，对于身份认证的准确度不高，为验证本发明方法相对于传统方法具有较高的安全性和准确性，本实施例中将此案有传统的知识图谱声纹识别认证方法和本发明方法分别对仿真电网调度系统的身份认证进行实时测量对比。

测试环境：将仿真电网调度系统运行在仿真平台模拟运行并模拟四种场景(噪音、盲音、声音过小及合成音)，采用历史声纹识别数据作为测试样本，分别利用传统方法的智能化操作进行声纹测试并获得测试结果；采用本发明方法，则开启自动化测试设备并运用MATLB实现本发明方法的仿真测试，根据实验结果得到仿真数据；每种方法各测试100组数据，计算获得每组数据的时间，通过与仿真模拟输入的实际预测值进行误差对比计算，结果如下表所示：

表1：四种场景下误差对比数据表。

参照表1，能够直观的看出，在相同的四种模拟场景下，传统方法输出的误差值过大，即身份认证准确性较低，其不能很好地在复杂环境下对电网调度的身份认证进行有效验证，而本发明方法虽然也存在误差，但是相对于传统方法已有较高的提升，显然，本发明方法对于身份认证是一种优选方法，且能够保证稳定的准确度和安全性。

应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于知识图谱辅助声纹识别的身份认证方法，其特征在于：包括，

利用原始数据提取各个实体之间的关系构建知识图谱及电网调度关键词库；

当声纹识别匹配率小于阈值时，根据语音识别策略将调度通话录音转换为调度文本；

基于所述电网调度关键词库和自然语言处理策略提取所述调度文本中的关键实体及关系；

利用所述知识图谱匹配策略辅助所述声纹识别进行身份认证，包括将提取出的实体及关系与知识图谱中的知识进行图匹配，查找匹配程度最高的多名用户，再与声纹识别时匹配率最高的多名用户进行筛选，找到最佳匹配用户，完成辅助声纹识别进行身份认证。

2.如权利要求1所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：所述原始数据包括，结构化数据、非结构化数据及半结构化数据。

3.如权利要求1或2所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：所述实体包括，人名、地域名称、设备名称和电话号码。

4.如权利要求3所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：构建所述知识图谱包括，数据预处理、实体识别及关系抽取、实体对齐和生成所述知识图谱；

所述数据预处理包括，利用所述语音识别策略将语音转化为文本。

5.如权利要求4所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：包括，根据电网调度专业语料库生成自定义分词器，对所述文本进行分词，利用CRF+双向LSTM进行所述实体识别，结合SDP+LSTM进行关系抽取，形成初步知识。

6.如权利要求5所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：所述实体对齐包括，对所述实体进行消岐、同义词装换处理，对所述实体间关系进行共指消解操作，进行质量评估，形成正确的所述知识并存入生成的所述知识图谱中。

7.如权利要求6所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：对所述调度通话录音进行识别对比分析需建立识别分析模型，包括，

叠加多个残差网络ResNet，；

建立区域生成网络，，设置阈值为0.5，若超过0.5，则保留候选区域，若低于0.5，则舍弃；

生成分类分支，；

生成掩码分支，；

其中，：残差网络的输出，：残差网络的输入，：卷积运算函数，：残差网络输出的语音特征，：候选区域，：池化运算，分别为第一层、第二层全连接层运算，：候选区域属于前景（即包含待识别特征）的概率，：保留的候选区域，分别为第三层、第四层全连接层运算，：候选区域待识别物体的概率，分别为第五层、第六层全连接层运算，矩阵与候选区域像素大小一致，中每个位置代表候选区域内目标点属于识别特征的概率。

8.根据权利要求7所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：识别包括，

利用所述残差网络提取语音待识别特征；

所述区域生成网络利用所述语音待识别特征对待识别语音进行分析，且将候选区域的特征分别送入所述分类分支和所述掩码分支中；

所述分类分支识别所述待识别特征的种类；

所述掩码分支定位所述待识别特征在所述调度通话录音中的波点。

9.根据权利要求8所述的基于知识图谱辅助声纹识别的身份认证方法，其特征在于：进行所述认证包括，

若声纹识别结果通过身份认证，则直接进入所述语音识别；

若所述声纹识别结果未通过身份认证，则对下令人身份进行ID地址核实，若核实正确，则重新继续所述身份认证，若核实错误，则终止对当前所述语音的声纹识别。