CN113157870B

CN113157870B - 一种知识关联的方法、装置及电子设备

Info

Publication number: CN113157870B
Application number: CN202110560878.0A
Authority: CN
Inventors: 宗宇; 丁锐; 李婷
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2021-05-19
Filing date: 2021-05-19
Publication date: 2024-02-02
Anticipated expiration: 2041-05-19
Also published as: CN113157870A

Abstract

本发明公开了一种知识关联的方法、装置及电子设备，包括：通过获取知识库中知识之间的关联参数，关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数，从知识之间的关联参数的信息中提取关联特征，并确定各个关联特征的权重，通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数，基于知识间关联系数建立知识库中知识间的关联关系。由此，不仅实现了更加智能化的知识关联，提升了处理效率，并且分别从用户浏览角度和知识内容角度两个方面分析知识的关联关系，以此建立的关联关系更符合用户的需求。

Description

一种知识关联的方法、装置及电子设备

技术领域

本发明涉及人工智能领域，尤其涉及一种知识关联的方法、装置及电子设备。

背景技术

知识库是海量知识管理工具平台，主要功能是进行知识存储、管理，并提供知识检索的能力，但是知识库中的知识通常是独立存在的，无法通过知识之间的联系感知用户的潜在需求。

现有技术中，为了解决上述问题，通过手动的方式人为建立知识之间的关联，这种方式处理效率低，而且手动关联的方式也比较主观，难以发现知识之间隐含的关联信息。

发明内容

有鉴于此，本发明实施例提供了一种知识关联的方法及装置，实现了更加智能化的知识关联，提升了处理效率，并且分别从用户浏览角度和知识内容角度两个方面分析知识的关联关系，以此建立的关联关系更符合用户的需求，除此之外，建立的关联关系还能够体现知识之间的关联程度，有利于后续用户在知识库中进行搜索时，按照关联程度为用户提供相关结果，提升了用户的搜索体验。

本发明实施例公开了一种知识关联的方法，包括：

获取知识库中知识之间的关联参数的信息；所述关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数，所述用户浏览行为与用户浏览知识的下一跳信息有关；

从知识之间的关联参数的信息中提取关联特征并确定各个关联特征的权重；

通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数；

基于知识间的关联系数建立知识库中知识间的关联关系。

可选的，还包括：

获取用户查看知识的下一跳信息；所述用户查看知识的下一跳信息包括：查看第一知识后查看第二知识的次数；

通过所述用户查看知识的下一跳信息计算与用户浏览行为有关的知识之间的关联系数。

可选的，所述知识之间的关联参数的信息中提取关联特征并确定各个关联特征的权重，包括：

将所述关联参数的信息输入到预设的第一特征工程模型中，得到关联特征；所述第一特征工程模型为具备特征提取功能的模型；

将所述关联特征输入到预设的第二特征工程模型中，得到关联特征的权重；所述第二特征工程模型为具备特征选择的机器学习模型。

可选的，所述通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数，包括：

根据预设的关联公式和每个关联特征的权重，计算知识间的关联系数。

将关联特征和关联特征的权重输入到预先训练的关联系数分析模型中，得到知识间的关联系数；

其中，关联系数分析模型是通过如下方式进行训练后得到的：

以已知知识间关联系数的历史知识作为训练样本；

获取历史知识之间的关联参数的信息；

从历史知识关联参数的信息中提取历史关联特征，并确定历史关联特征的权重；

将历史知识的关联特征和历史关联特征的权重输入到关联系数分析模型中，对关联系数分析模型进行训练。

本发明实施例公开了一种知识关联的装置，包括：

关联参数获取单元，用于获取知识库中知识之间的关联参数的信息；所述关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数；

特征处理单元，用于从知识之间的关联参数的信息中提取关联特征并确定各个关联特征的权重；

关联系数计算单元，用于通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数；

关系建立单元，用于基于知识间的关联系数建立知识库中知识间的关联关系。

可选的，还包括：

轨迹信息获取单元，用于获取用户查看知识的下一跳信息；所述用户查看知识的下一跳信息包括：查看第一知识后查看第二知识的次数；

关联关系确定单元，用于通过所述用户查看知识的下一跳信息计算与用户浏览行为有关的知识之间的关联系数。

可选的，所述特征处理单元，包括：

特征提取子单元，用于将所述关联参数的信息输入到预设的第一特征工程模型中，得到关联特征；所述第一特征工程模型为具备特征提取功能的模型；

特征权重计算子单元，用于将所述关联特征输入到预设的第二特征工程模型中，得到关联特征的权重；所述第二特征工程模型为具备特征选择的机器学习模型。

可选的，所述关联系数计算单元，包括：

第一关联系数计算子单元，用于根据预设的关联公式和每个关联特征的权重，计算知识间的关联系数。

本发明实施例还公开了一种电子设备，包括：

处理器和存储器；

所述存储器用于存储程序，所述处理器用于执行所述存储程序时，执行上述所述的知识关联方法。

本发明实施例公开了一种知识关联的方法及装置，包括：通过获取知识库中知识之间的关联参数，关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数，其中，用户浏览行为与用户浏览知识的下一跳信息有关；从知识之间的关联参数的信息中提取关联特征，并确定各个关联特征的权重，通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数，基于知识间关联系数建立知识库中知识间的关联关系。由此，不仅实现了更加智能化的知识关联，提升了处理效率，并且分别从用户浏览角度和知识内容角度两个方面分析知识的关联关系，以此建立的关联关系更符合用户的需求，除此之外，建立的关联关系还能够体现知识之间的关联程度，有利于后续用户在知识库中进行搜索时，按照关联程度为用户提供相关结果，提升了用户的搜索体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1示出了本发明实施例提供的一种知识关联的方法的流程示意图；

图2示出了与用户浏览行为有关的知识间的关联系数的确定方法的流程示意图；

图3示出了本发明实施例提供的一种知识关联的装置的结构示意图；

图4示出了本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参考图1，示出了本发明实施例提供的一种知识关联的方法的流程示意图，在本实施例中，该方法包括：

S101：获取知识库中知识之间的关联参数的信息；

其中，关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似系数。

本实施例中，与用户浏览行为有关的知识间的关联系数与用户浏览的轨迹有关，例如，用户在知识库中查看相关信息时，查看了知识A后，可能会查看知识B、知识C和知识D，这表示用户的浏览轨迹，该浏览轨迹表示了知识之间的关联。

在一次浏览过程中，用户的浏览轨迹包含的知识众多，为了体现用户浏览行为的关联性，本实施例中，将用户浏览时间隔最近的两条知识之间的联系作为与用户浏览行为有关的知识间的关联性，即采用用户浏览知识的下一跳信息体现与用户浏览行为有关的知识之间的关联性，具体的，参考图2，示出了与用户浏览行为有关的知识间的关联系数的确定方法包括：

S201：获取用户查看知识的下一跳信息；所述用户查看知识的下一跳信息包括：查看第一知识后查看第二知识的次数；

S202：通过所述用户查看知识的下一跳信息计算与用户浏览行为有关的知识之间的关联系数；

用户在查看第一知识后查看第二知识的不同次数，可以表示出其他的第二知识与第一知识的关联程度，其中用户查看第一知识后查看第二知识的次数越多，表示第二知识与第一知识的关联程度越高。

其中，知识间文本的相似系数，可以理解为知识之间实际内容的相似程度，本实施例中，可以采用多种方式计算知识间文本的相似系数，本实施例中不进行限定，例如可以采用文本的特征向量的欧式距离计算、或者采用分类模型分析文本间的相似度系数。

优选的，可以采用预设的文本相似度分析模型计算文本之间的相似度，具体的，包括：

将待分析的多条知识输入到预设的文本相似度分析模型中，得到知识之间的相似度；

其中，预设的文本相似度分析模型是通过如下方法训练的：

将获取的历史知识作为训练样本；

将历史知识输入到相似度分析模型中，以相似度分析模型预测的历史知识的相似度趋近于标准相似度对相似度分析模型进行优化。

其中，标准相似度是已知的或者预先确定的历史知识间的相似度。

S102：从知识之间的关联参数的信息中提取关联特征并确定各个关联特征的权重；

本实施例中，进行特征提取前，提取了特征之后，可能有一些特征存在一些残缺等有问题的数据，为了保障后续处理的稳定性和准确性，可以预先对提取到的特征进行预处理，例如对数据进行数据清洗。

本实施例中，可以采用多种方法进行特征提取和特征选择，本实施例中不进行限定，优选的，可以采用如下的方法，实现特征提取和特征选择：

其中，第一特征工程模型可以包括多种，本实施例中不进行限定，例如可以采用主成分分析模型、线性判别分析模型。

第二特征工程模型可以包括多种，本实施例中不进行限定，例如可以采用随机森林模型。

S103：通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数；

其中，知识间的关联系数表示知识间关联的程度，其中，可以通过如下的两种方式计算知识间的关联系数，包括：

实施方式一：

根据预设的关联公式和每个关联特征的权重，计算知识间的关联系数；

其中，预设的关联公式可以为加权平均公式，即可以将每个特征进行加权平均，从而确定每条知识间的关联系数。

实施方式二：

以已知知识间关联系数的历史知识作为训练样本；

获取历史知识之间的关联参数的信息；

其中，关联系数分析模型可以是任意一种分类模型，本实施例中不进行限定。

S104：基于知识间的关联系数建立知识库中知识间的关联关系；

本实施例中，知识间的关联系数不同，表示知识间关联的程度不同，本实施例中可以基于知识间的关联程度对知识进行关联，具体的，S104包括：

根据知识间的关联系数，选取出大于预设阈值的关联系数对应的知识；

将大于预设阈值的关联系数对应的知识建立关联关系。

本实施中，对于关联系数较小的，则认为知识的关联程度较小，那么可以认为这样的知识是不存在关联的，由此，选取出大于预设阈值的关联系数对应的知识，并对大于预设阈值的关联系数的知识建立关联。

本实施例中，通过获取知识库中知识之间的关联参数，关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数，从知识之间的关联参数的信息中提取关联特征，并确定各个关联特征的权重，通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数，基于知识间关联系数建立知识库中知识间的关联关系。由此，本实施例中，通过对知识间的关联参数进行分析，实现了更加智能化的知识关联，提升了处理效率，并且分别从用户浏览角度和知识内容角度两个方面分析知识的关联关系，以此建立的关联关系更符合用户的需求，除此之外，建立的关联关系还能够体现知识之间的关联程度，有利于后续用户在知识库中进行搜索时，按照关联程度为用户提供相关结果，提升了用户的搜索体验。

参考图3，示出了本发明实施例提供的一种知识关联的装置的结构示意图，在本实施例中，该装置包括：

关联参数获取单元301，用于获取知识库中知识之间的关联参数的信息；所述关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数，所述用户浏览行为与用户浏览知识的下一跳信息有关；

特征处理单元302，用于从知识之间的关联参数的信息中提取关联特征并确定各个关联特征的权重；

关联系数计算单元303，用于通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数；

关系建立单元304，用于基于知识间的关联系数建立知识库中知识间的关联关系。

可选的，还包括：

可选的，所述特征处理单元，包括：

可选的，所述关联系数计算单元，包括：

本实施例的装置，通过获取知识库中知识之间的关联参数，关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数，从知识之间的关联参数的信息中提取关联特征，并确定各个关联特征的权重，通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数，基于知识间关联系数建立知识库中知识间的关联关系。由此，本实施例中，通过对知识间的关联参数进行分析，实现了更加智能化的知识关联，提升了处理效率，并且分别从用户浏览角度和知识内容角度两个方面分析知识的关联关系，以此建立的关联关系更符合用户的需求，除此之外，建立的关联关系还能够体现知识之间的关联程度，有利于后续用户在知识库中进行搜索时，按照关联程度为用户提供相关结果，提升了用户的搜索体验。

参考图4，示出了本发明实施例提供的一种电子设备的结构示意图，在本实施例中，该电子设备包括：

处理器401和存储器402；

所述存储器用于存储程序，所述处理器用于执行所述存储程序时，执行下述所述的知识关联方法：

基于知识间的关联系数建立知识库中知识间的关联关系。

可选的，还包括：

以已知知识间关联系数的历史知识作为训练样本；

获取历史知识之间的关联参数的信息；

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种知识关联的方法，其特征在于，包括：

从所述知识之间的关联参数的信息中提取关联特征并确定各个关联特征的权重；

基于知识间的关联系数建立知识库中知识间的关联关系；

其中，所述知识关联的方法，还包括：

通过所述用户查看知识的下一跳信息计算与用户浏览行为有关的知识之间的关联系数；

所述知识之间的关联参数的信息中提取关联特征并确定各个关联特征的权重，包括：

2.根据权利要求1所述的方法，其特征在于，所述通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数，包括：

3.根据权利要求1所述的方法，其特征在于，所述通过提取的关联特征以及每个关联特征的权重，计算知识间的关联系数，包括：

以已知知识间关联系数的历史知识作为训练样本；

获取历史知识之间的关联参数的信息；

4.一种知识关联的装置，其特征在于，包括：

关联参数获取单元，用于获取知识库中知识之间的关联参数的信息；所述关联参数包括：与用户浏览行为有关的知识间的关联系数和知识间文本相似度系数，所述用户浏览行为与用户浏览知识的下一跳信息有关；

关系建立单元，用于基于知识间的关联系数建立知识库中知识间的关联关系；

其中，所述知识关联的装置，还包括：

关联关系确定单元，用于通过所述用户查看知识的下一跳信息计算与用户浏览行为有关的知识之间的关联系数；

所述特征处理单元，包括：

5.根据权利要求4所述的装置，其特征在于，所述关联系数计算单元，包括：

6.一种电子设备，其特征在于，包括：

处理器和存储器；

所述存储器用于存储程序，所述处理器用于执行所述存储程序时，执行上述权利要求1-3中任意一项所述的知识关联方法。