CN114741478A

CN114741478A - 一种基于知识图谱的语音档案检索方法、设备和存储介质

Info

Publication number: CN114741478A
Application number: CN202210481721.3A
Authority: CN
Inventors: 翁非; 林衍; 林小雨; 张望华; 黄云飞; 陈璐
Original assignee: State Grid Fujian Electric Power Co Ltd
Current assignee: State Grid Fujian Electric Power Co Ltd
Priority date: 2022-05-05
Filing date: 2022-05-05
Publication date: 2022-07-12

Abstract

本发明涉及一种基于知识图谱的语音档案检索方法，包括以下步骤：建立知识图谱，基于历史档案构建档案中的实体，并建立实体之间的关联关系；获取用户输入的语音数据，对语音数据进行声纹提取，得到声纹特征数据；将声纹特征数据输入预训练的语音识别模型，通过语音识别模型识别声纹特征数据得到若干文本词汇；在知识图谱中基于各文本词汇分别进行关联评价，建立评价标签以度量各文本词汇与知识图谱中各实体在文本中的距离以及共现的频率，并基于生成的若干评价标签得到与输入的语音数据关联的实体分支；基于所述关联的实体分支在档案检索系统中进行条件查询，查询获得对应的档案内容作为展示结果反馈给用户。

Description

一种基于知识图谱的语音档案检索方法、设备和存储介质

技术领域

本发明涉及一种基于知识图谱的语音档案检索方法、设备和存储介质，属于自然语言处理和档案检索技术领域。

背景技术

检索服务是现代智慧档案服务的专项建设内容之一。在传统检索系统中，要实现检索内容的针对性，准确性的全方位数据精准标识，需要对所有待检索系统业务的基本服务规则内容抽离、其中包括业务相关的信息，多类别，多标签等进行统一收集，通过分类型体系计算开展应用。

目前对档案的检索主要是通过档案的分类号、题名、文号和密级等方面对档案的整理和归档进行结构化分类整编。通过主观经验人为设置的服务难以对不同种类、不同标签关联、不同业务分析等方面得到更精细的服务树，对日益多分类多标签要求的业务需求、业务管理工作难以提供更有针对性、对答树等参考信息和策略支撑。随着人工智能的技术日渐成熟，利用人工智能技术对但档案检索建立检索体系成为了一条必然的解决之路。知识图谱属于人工智能领域近年比较成熟技术，通过知识图谱进行本体构建，再进行知识抽取、知识表示、知识融合，最后进行知识存储。实现对不同档案信息、档案整编、档案结构化数据构建等进行知识融合，实现从多个维度对档案检索系统进行综合支持，为对档案检索服务实行精准检索管理提供了坚实的数据依据。

申请号为“CN202010562906.8”的专利提出了一种用于电力调控的多轮次语音交互智能检索系统及方法，包括以下步骤：S1、语音交互：用户与调度服务交互终端进行多轮次语音交互；；S2、意图发现：面对用户各种各样的意图表达,得到候选服务本体,排序并依次询问用户当前服务是否是用户所需；S3、智能搜索：待用户意图确定后,需要对用户需要的电力调度服务进行检索,将搜索结果进行结构化的组织与排序,提供给用户；S4、对用户选择的服务进行调度。本发明提出的语音多轮次交互智能检索的方法和系统，通过多轮次的语音交互，获得用户的意图表达和细节特征，多轮次询问确认用户服务，结合实际工作的业务，从而使得结构化的组织、排序、数据检索等特点，可以大大提高语音检索的准确度和效率，提升检索大数据的质量。

上述现有技术的方案通过对档案检索数据进行人工设置的分级分类进行整编，难以客观、准确的得到档案数据的关系模型。

发明内容

为了解决上述现有技术中存在的问题，本发明提出了一种基于知识图谱的语音档案检索方法，建立知识图谱，进行档案相关实体构建，并建立实体间的关联关系，建立评价体系以度量语音数据中词汇与知识图谱中实体的关联关系；基于知识图谱进行知识推理，实现客观的从多个维度对档案检索系统进行综合支持。

本发明的技术方案如下：

第一方面，本发明提供一种基于知识图谱的语音档案检索方法，包括以下步骤：

建立知识图谱，基于历史档案构建档案中的实体，并建立实体之间的关联关系；

获取用户输入的语音数据，对语音数据进行声纹提取，得到声纹特征数据；

将声纹特征数据输入预训练的语音识别模型，通过语音识别模型识别声纹特征数据得到若干文本词汇；

在知识图谱中基于各文本词汇分别进行关联评价，建立评价标签以度量各文本词汇与知识图谱中各实体在文本中的距离以及共现的频率，并基于生成的若干评价标签得到与输入的语音数据关联的实体分支；

基于所述关联的实体分支在档案检索系统中进行条件查询，查询获得对应的档案内容作为展示结果反馈给用户。

作为优选实施方式，在所述基于历史档案构建档案中的实体，并建立实体之间的关联关系步骤中：

所述实体包括：档案题名、档案类型、保管信息、卷盒信息、归档信息、承办部门、成文信息、甲方/乙方、第三方；

所述实体之间的关联关系包括：档案题名与档案类型之间的规范关系，档案题名与保管信息之间的编写关系，档案题名与保管信息之间的制定关系，档案题名与归档信息之间的关联关系，档案题名与成文信息之间的发布关系，归档信息与承办部门之间的指向关系，承办部门与甲方/乙方之间的签约关系，甲方/乙方与第三方之间的承办关系。

作为优选实施方式，所述预训练的语音识别模型，预先使用包括档案中专业词汇的声纹特征数据进行训练。

作为优选实施方式，所述在知识图谱中基于各文本词汇分别进行关联评价，建立评价标签以度量各文本词汇与知识图谱中各实体在文本中的距离以及共现的频率的方法具体为：

建立如下所示的评价标签CA(e_ij)：

CA(e_ij)＝I(e_i,e_j)*D(e_i,e_j)*Max(e_i,e_j)；

式中，e_i和e_j分别为文本词汇i和实体j，I(e_i,e_j)为文本词汇i和实体j共现的概率，D(e_i,e_j)为文本词汇i和实体j的距离，Max(e_i,e_j)为文本词汇i和实体j两者共同出现的峰值；

其中：

式中，P(e_i,e_j)为文本词汇i和实体j同时出现在一句子中的频率，P(e_i)为文本词汇i单独出现在对应句子中的频率，P(e_j)为实体j单独出现在对应句子中的频率；

其中：

式中，sent(e_i)为包含了文本词汇i的句子的索引号，sent(e_j)为包含了实体j的句子的索引号，WS为句子的搜索窗口大小。

作为优选实施方式，所述基于所述关联的实体分支在档案检索系统中进行条件查询，查询获得对应的档案内容作为展示结果反馈给用户的步骤具体为：

在用户输入语音数据时，根据实时语音数据在知识图谱进行关联评价，反馈在知识图谱中评价标签得分最高的实体分支给用户；

由用户确认是否采纳反馈的实体分支，若采纳，则依据采纳的实体分支作为条件查询获得对应的档案内容；若不采纳，则继续进行关联评价；同时，根据采纳结果对得出的实体分支与实时语音数据中的文本词汇进行关联度评分，作为历史检索依据为后续检索提供评分依据；

当从实时语音数据识别到结束词汇时，结束关联评价，将得到的所有实体分支作为组合条件输入至检索系统中，根据组合条件查询对应的档案内容。

第二方面，本发明提供一种基于知识图谱的语音档案检索系统，包括：知识图谱构建模块、语音提取模块、语音识别模块、评价模块和检索模块；

所述知识图谱构建模块，用于建立知识图谱，基于历史档案构建档案中的实体，并建立实体之间的关联关系；

所述语音提取模块，用于获取用户输入的语音数据，对语音数据进行声纹提取，得到声纹特征数据；

所述语音识别模块，用于将声纹特征数据输入预训练的语音识别模型，通过语音识别模型识别声纹特征数据得到若干文本词汇；

所述评价模块，用于在知识图谱中基于各文本词汇分别进行关联评价，建立评价标签以度量各文本词汇与知识图谱中各实体在文本中的距离以及共现的频率，并基于生成的若干评价标签得到与输入的语音数据关联的实体分支；

所述检索模块，用于基于所述关联的实体分支在档案检索系统中进行条件查询，查询获得对应的档案内容作为展示结果反馈给用户。

第三方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明任一实施例所述的基于知识图谱的语音档案检索方法。

第四方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任一实施例所述的基于知识图谱的语音档案检索方法。

本发明具有如下有益效果：

1、本发明一种基于知识图谱的语音档案检索方法，建立知识图谱，进行档案相关实体构建，并建立实体间的关联关系，建立评价体系以度量语音数据中词汇与知识图谱中实体的关联关系；基于知识图谱进行知识推理，实现客观的从多个维度对档案检索系统进行综合支持。

2、本发明一种基于知识图谱的语音档案检索方法，通过专业词汇的声纹特征数据进行训练，能够更好的保留语音中的一些专业词汇，避免过度分词导致专业词汇被拆分，同时也避免一些同音词的出现。

附图说明

图1为本发明实施例一的方法流程图；

图2为本实施例中的知识图谱的示例图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，文中所使用的步骤编号仅是为了方便描述，不对作为对步骤执行先后顺序的限定。

应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

实施例一：

参见图1，一种基于知识图谱的语音档案检索方法，包括以下步骤：

获取用户通过语音收录设备录入的语音数据，并依据用户录入语音数据分片上传音频文件，通过声纹提取模型(声纹提取模型可以基于模板匹配法、高斯混合模型法(GMM)、联合因子分析法(JFA)和神经网络法(DNN)等)对收到的音频文件进行进行声纹提取，得到声纹特征数据；

将声纹特征数据输入预训练的语音识别模型，该语音识别模型基于神经网络构建，通过语音识别模型识别声纹特征数据得到若干文本词汇；

在知识图谱中进行知识推理，基于各文本词汇分别进行关联评价，建立评价标签以度量各文本词汇与知识图谱中各实体在文本中的距离以及共现的频率，并基于生成的若干评价标签得到与输入的语音数据关联的实体分支；

具体参见图2，作为本实施例的优选实施方式，在所述基于历史档案构建档案中的实体，并建立实体之间的关联关系步骤中：

所述实体包括：档案题名、档案类型、保管期限、保管密级、保管年度、卷盒信息、卷盒文号、卷盒规则、归档日期、归档状态、承办部门、成文日期、甲方/乙方、第三方、签订日期、承办日期等；

作为本实施例的优选实施方式，所述预训练的语音识别模型，预先使用包括档案中专业词汇的声纹特征数据进行训练，也包括了大量基础词汇的声纹特征数据，通过专业词汇的声纹特征数据进行训练，能够更好的保留语音中的一些专业词汇，避免过度分词导致专业词汇被拆分，同时也避免一些同音词的出现，例如：人名，公司名称等方面。

作为本实施例的优选实施方式，所述在知识图谱中基于各文本词汇分别进行关联评价，建立评价标签以度量各文本词汇与知识图谱中各实体在文本中的距离以及共现的频率的方法具体为：

本实施好了建立如下所示的评价标签CA(e_ij)度量文本词汇和实体的共现以及文本词汇和实体在文本中的距离：

CA(e_ij)＝I(e_i,e_j)*D(e_i,e_j)*Max(e_i,e_j)；

其中：

式中，P(e_i,e_j)为文本词汇i和实体j同时出现在一句子中的频率，P(e_i)为文本词汇i单独出现在对应句子中的频率，P(e_j)为实体j单独出现在对应句子中的频率；如果e_i和e_j一起出现的频率比e_j单独出现的频率高即P(e_j|e_i)>P(e_i)，那么e_i可能是e_j的一个原因实体，形式化的描述就是

这和点互信息非常类似；

因此，如果

则I(e_i,e_j)是正值。

对于在文本中距离更近的词汇应该得到奖励，那些在文本上距离更远的词汇对应该被惩罚，因此，提出以下距离度量：

式中，sent(e_i)为包含了文本词汇i的句子的索引号，sent(e_j)为包含了实体j的句子的索引号，WS为句子的搜索窗口大小。如果e_i和e_j是从同一个句子中获得的，以上公式的分子就是1。如果e_i和e_j出现在多个句子中，那么拥有最小值的共现将会被选择出来并且把它赋值给上面的公式。在本实施例中，WS设置为3，因此如果出现在第n个句子中，那么可以搜索的最远的句子是第n+2个句子。

作为本实施例的优选实施方式，所述基于所述关联的实体分支在档案检索系统中进行条件查询，查询获得对应的档案内容作为展示结果反馈给用户的步骤具体为：

当从实时语音数据识别到结束词汇时，结束关联评价，将得到的所有实体分支作为组合条件输入至检索系统中，根据组合条件查询对应的档案内容，最终展示用户所检索的内容，多条件的查询可以使得数据更加的准确，精炼。

并且，在用户录入语音数据过程中可能会存在知识图谱不存在图数据元结构的情况，则就在知识图谱中进行新增实体分支，保证下次检索丰富分支情况。

实施例二：

本实施例提供一种基于知识图谱的语音档案检索系统，包括：知识图谱构建模块、语音提取模块、语音识别模块、评价模块和检索模块；

实施例三：

本实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明任一实施例所述的基于知识图谱的语音档案检索方法。

实施例四：

本实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任一实施例所述的基于知识图谱的语音档案检索方法。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于知识图谱的语音档案检索方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于知识图谱的语音档案检索方法，其特征在于，在所述基于历史档案构建档案中的实体，并建立实体之间的关联关系步骤中：

3.根据权利要求1所述的一种基于知识图谱的语音档案检索方法，其特征在于：所述预训练的语音识别模型，预先使用包括档案中专业词汇的声纹特征数据进行训练。

4.根据权利要求1所述的一种基于知识图谱的语音档案检索方法，其特征在于，所述在知识图谱中基于各文本词汇分别进行关联评价，建立评价标签以度量各文本词汇与知识图谱中各实体在文本中的距离以及共现的频率的方法具体为：

建立如下所示的评价标签CA(e_ij)：

CA(e_ij)＝I(e_i,e_j)*D(e_i,e_j)*Max(e_i,e_j)；

其中：

其中：

5.根据权利要求4所述的一种基于知识图谱的语音档案检索方法，其特征在于，所述基于所述关联的实体分支在档案检索系统中进行条件查询，查询获得对应的档案内容作为展示结果反馈给用户的步骤具体为：

6.一种基于知识图谱的语音档案检索系统，其特征在于，包括：知识图谱构建模块、语音提取模块、语音识别模块、评价模块和检索模块；

7.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至5任一权利要求所述的基于知识图谱的语音档案检索方法。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至5任一权利要求所述的基于知识图谱的语音档案检索方法。