CN112069249A - 知识图谱关系挖掘方法、装置、计算机设备及存储介质 - Google Patents
知识图谱关系挖掘方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112069249A CN112069249A CN202011095927.XA CN202011095927A CN112069249A CN 112069249 A CN112069249 A CN 112069249A CN 202011095927 A CN202011095927 A CN 202011095927A CN 112069249 A CN112069249 A CN 112069249A
- Authority
- CN
- China
- Prior art keywords
- entities
- potential
- graph
- relationship
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005065 mining Methods 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000013528 artificial neural network Methods 0.000 claims abstract description 69
- 239000013598 vector Substances 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000011478 gradient descent method Methods 0.000 claims description 5
- 238000012804 iterative process Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 206010020850 Hyperthyroidism Diseases 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2358—Change logging, detection, and notification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大数据技术领域,公开了一种知识图谱关系挖掘方法、装置、计算机设备及存储介质,包括:从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图;通过预置成熟神经网络根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。本发明还涉及区块链技术,信息可存储于区块链节点中。本发明仅通过对待识别子图中各实体的内容、关联关系的内容以及实体与实体之间的结构,即可对潜在关联关系进行挖掘,而无需扩充推理规则,避免了知识图谱中出现了推理规则未涉及过的关联关系,导致关系推理模型无法基于该关联关系对知识图谱的潜在关系进行挖掘的问题出现。
Description
技术领域
本发明涉及大数据的数据分析技术领域,尤其涉及一种知识图谱关系挖掘方法、装置、计算机设备及存储介质。
背景技术
通常的,在本体构建后,知识图谱的雏形便已经搭建好了,但知识图谱之间大多数关系都是残缺的,这个时候,就可以使用知识推理技术,去完成进一步的知识发现。
目前通常采用关系推理模型根据其中的推理规则,对知识图谱中各实体之间的关联关系进行挖掘,但发明人意识到,一旦知识图谱中出现了推理规则未涉及过的关联关系,将会导致关系推理模型无法基于该关联关系对知识图谱的潜在关系进行挖掘。
发明内容
本发明的目的是提供一种知识图谱关系挖掘方法、装置、计算机设备及存储介质,用于解决现有技术存在的知识图谱中出现了推理规则未涉及过的关联关系,将会导致关系推理模型无法基于该关联关系对知识图谱的潜在关系进行挖掘的问题。
为实现上述目的,本发明提供一种知识图谱关系挖掘方法,包括:从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图;
通过预置的成熟神经网络,根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
上述方案中,所述从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图的步骤,包括:
控制知识图谱展示任一本体,其中,所述本体中至少具有一个实体及各所述实体之间的关联关系;
调用截图工具对所述本体中的所述实体及各所述实体之间的关联关系进行拍摄得到所述待识别子图。
上述方案中,所述通过预置的成熟神经网络,根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体的步骤,包括:
调用预置的成熟神经网络识别所述待识别子图中的所述实体得到实体特征,及识别所述待识别子图中各所述实体之间的关联关系得到关系特征;
通过所述成熟神经网络计算所述实体特征和所述关系特征,得到以向量形式反映所述待识别子图中关系路径的路径向量,所述关系路径反映了各所述实体在待识别子图中通过关联关系所形成的全程路由;
通过所述成熟神经网络识别所述关系路径的意图,并根据所述意图挖掘所述待识别子图中不具有关联关系的实体之间的潜在关系,以及所述潜在关系对应的潜在实体。
上述方案中,所述成熟神经网络通过以下步骤训练获得:
获得初始神经网络及训练样本,其中,所述训练样本包括用于录入输入层的输入样本,及用于作为输出层的输出样本;
执行训练进程,以将所述输入样本录入所述初始神经网络得到训练结果;
调用迭代进程根据所述训练结果对所述初始神经网络进行迭代,直至所述输出样本和训练结果之间的差异小于预设的损失阈值时,得到成熟神经网络。
上述方案中,所述迭代进程包括:
将训练识别实体及其训练识别关系与所述输出样本中的标记实体及其标记关系进行比对,得到反映所述输出样本和初始结果之间差异的训练标记差值;
判断所述训练标记差值是否小于所述损失阈值;
若是,则将所述初始神经网络设为成熟神经网络;
若否,则采用梯度下降法根据所述训练标记差值计算得到调整数据,并采用反向传播算法根据所述调整数据调整所述初始神经网络中输入层、卷积层、池化层、全连接层和输出层的权重和偏执值,再调用所述训练进程。
上述方案中,所述挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体的步骤之后,所述方法还包括:
根据所述潜在关系及其潜在实体修改所述知识图谱,以更新所述知识图谱;
所述根据所述潜在关系及其潜在实体修改所述知识图谱,以更新所述知识图谱的步骤之后,所述方法还包括:
将所述知识图谱上传至区块链中。
上述方案中,所述根据所述潜在关系及其潜在实体修改所述知识图谱的步骤,包括:
提取所述知识图谱中与所述待识别子图对应的本体;
识别所述本体中与所述潜在实体对应的目标实体;
在所述目标实体之间构建所述潜在关系。
为实现上述目的,本发明还一种知识图谱关系挖掘装置,包括:
子图获取模块,用于从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图;
关系识别模块,用于通过预置的成熟神经网络,根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
为实现上述目的,本发明还提供一种计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机设备的处理器执行所述计算机程序时实现上述知识图谱关系挖掘方法的步骤。
为实现上述目的,本发明还提供一种计算机存储介质,所述存储介质上存储有计算机程序,所述存储介质存储的所述计算机程序被处理器执行时实现上述知识图谱关系挖掘方法的步骤。
本发明提供的知识图谱关系挖掘方法、装置、计算机设备及存储介质,通过成熟神经网络对所述待识别子图中的实体及其关联关系进行运算,以挖掘各实体之间所存在的潜在关系,以及与所述潜在关系对应的实体,因此仅通过对待识别子图中各实体的内容、关联关系的内容以及实体与实体之间的结构,即可对潜在关联关系进行挖掘,而无需扩充推理规则,避免了一旦知识图谱中出现了推理规则未涉及过的关联关系,将会导致关系推理模型无法基于该关联关系对知识图谱的潜在关系进行挖掘的问题出现。同时还避免了由人工对知识图谱中各本体中实体进行进一步挖掘,导致挖掘效率低下,挖掘成本高的问题。
附图说明
图1为本发明知识图谱关系挖掘方法实施例一的流程图;
图2为本发明知识图谱关系挖掘方法实施例二中知识图谱关系挖掘方法的环境应用示意图;
图3是本发明知识图谱关系挖掘方法实施例二中知识图谱关系挖掘方法的具体方法流程图;
图4是本发明知识图谱关系挖掘方法实施例二中知识图谱关系挖掘方法的具体方法流程图;
图5是本发明知识图谱关系挖掘方法实施例二中知识图谱关系挖掘方法的具体方法流程图;
图6是本发明知识图谱关系挖掘方法实施例二中知识图谱关系挖掘方法的具体方法流程图;
图7是本发明知识图谱关系挖掘方法实施例二中知识图谱关系挖掘方法的具体方法流程图;
图8是本发明知识图谱关系挖掘方法实施例二中知识图谱关系挖掘方法的具体方法流程图;
图9为本发明知识图谱关系挖掘装置实施例三的程序模块示意图;
图10为本发明计算机设备实施例四中计算机设备的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的知识图谱关系挖掘方法、装置、计算机设备及存储介质,适用于大数据的数据分析技术领域,为提供一种基于子图获取模块、关系识别模块和图谱更新模块的知识图谱关系挖掘方法。本发明通过从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图;通过预置成熟神经网络根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
实施例一:
请参阅图1,本实施例的一种知识图谱关系挖掘方法,包括:
S101:从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图。
S102:通过预置成熟神经网络根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
于本实施例中,所述待识别子图是以图片的形式展现的,以便于成熟神经网络对该待识别子图中的实体和关联关系所形成的结构形状进行识别,进而有助于识别出各实体及其关联关系的关联路径。
通过预置的成熟神经网络对所述待识别子图中的实体及其关联关系进行运算,以挖掘各实体之间所存在的潜在关系,以及与所述潜在关系对应的实体。因此,本申请通过采用适用于图片识别的CNN神经网络对知识图谱中待识别子图进行识别,以挖掘预测出,其中可能还会包含的潜在关系和潜在实体。因此,仅通过对待识别子图中各实体的内容、关联关系的内容以及实体与实体之间的结构,即可对潜在关联关系进行挖掘,而无需扩充推理规则,避免了一旦知识图谱中出现了推理规则未涉及过的关联关系,将会导致关系推理模型无法基于该关联关系对知识图谱的潜在关系进行挖掘的问题出现。
同时还避免了由人工对知识图谱中各本体中实体进行进一步挖掘,导致挖掘效率低下,挖掘成本高的问题。并且避免了依次对知识图谱的本体中的实体依次进行识别,而导致无法在整体上理解各实体及其关联关系所形成的关联路径,故造成潜在关系及其潜在实体无法识别,或识别准确度较低的问题发生。
实施例二:
本实施例为上述实施例一的一种具体应用场景,通过本实施例,能够更加清楚、具体地阐述本发明所提供的方法。
下面,以在运行有知识图谱关系挖掘方法的服务器中,根据待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体为例,来对本实施例提供的方法进行具体说明。需要说明的是,本实施例只是示例性的,并不限制本发明实施例所保护的范围。
图2示意性示出了根据本申请实施例二的知识图谱关系挖掘方法的环境应用示意图。
在示例性的实施例中,知识图谱关系挖掘方法所在的服务器2通过网络3分别连接知识图谱4;所述服务器2可以通过一个或多个网络3提供服务,网络3可以包括各种网络设备,例如路由器,交换机,多路复用器,集线器,调制解调器,网桥,中继器,防火墙,代理设备和/或等等。网络3可以包括物理链路,例如同轴电缆链路,双绞线电缆链路,光纤链路,它们的组合和/或类似物。网络3可以包括无线链路,例如蜂窝链路,卫星链路,Wi-Fi链路和/或类似物。
图3是本发明一个实施例提供的一种知识图谱关系挖掘方法的具体方法流程图,该方法具体包括步骤S201至S203。
S201:从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图。
本步骤中,所述待识别子图是以图片的形式展现的,以便于成熟神经网络对该待识别子图中的实体和关联关系所形成的结构形状进行识别,进而有助于识别出各实体及其关联关系的关联路径。
在一个优选的实施例中,请参阅图4,从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图的步骤,包括:
S11:控制知识图谱展示任一本体,其中,所述本体中至少具有一个实体及各所述实体之间的关联关系。
本步骤中,通过知识图谱的配置文件获得所述知识图谱中的任一本体,使所述知识图谱仅展示该本体中的实体和关系,其中,所述本体对特定领域之中某套概念及其相互之间关系的形式化表达,该形式化表达的方式是采用图形化的实体及关联关系构成的有向图或无向图。
S12:调用截图工具对所述本体中的所述实体及各所述实体之间的关联关系进行拍摄得到所述待识别子图。
本步骤中,通过截图工具对本体进行拍摄,得到以图片形式存在的待识别子图。同时,在拍摄之间使知识图谱仅展示一个本体,使得本申请可对本体中各实体及其关联关系进行识别,以便于基于所述本体对其中的实体及关联关系进行运算,并挖掘所述本体中的潜在关系,避免了其他本体干扰所述本体的潜在关系挖掘的问题发生。
需要说明的是,所述截图工具是对系统(如:知识图谱系统)所展示的图像进行拍摄,得到内容与所述图像一致的图片的计算机工具,例如:浏览器截图工具、SnippingTool、Droplr等。
示例性地,获得本体为“核保”的待识别子图,其中,包括有实体“甲亢”,实体“ICD10疾病”和实体“F人保”其中,实体“甲亢”—实体“ICD10疾病”之间,具有关联关系“属于”,实体“ICD10疾病”与实体“F人保”之间具有关联关系“可核保疾病”。
S202:通过预置的成熟神经网络根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
为识别待识别子图中的潜在关系,本步骤通过预置的成熟神经网络对所述待识别子图中的实体及其关联关系进行运算,以挖掘各实体之间所存在的潜在关系,以及与所述潜在关系对应的实体。
在一个优选的实施例中,请参阅图5,通过预置的成熟神经网络根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体的步骤,包括:
S21:调用预置的成熟神经网络识别所述待识别子图中的所述实体得到实体特征,及识别所述待识别子图中各所述实体之间的关联关系得到关系特征。
本步骤中,调用所述成熟神经网络的输入层识别待识别子图中的实体,得到以向量形式反映实体的实体特征,及识别所述待识别子图中的关联关系得到以向量形式表达实体之间关联关系的关联特征。
S22:通过所述成熟神经网络计算所述实体特征和所述关系特征,得到以向量形式反映所述待识别子图中关系路径的路径向量,所述关系路径反映了各所述实体在待识别子图中通过关联关系所形成的全程路由。
本步骤中,通过成熟神经网络的卷积层对所述输入层的实体特征和关系特征进行计算,获得以向量形式表达各实体及其关联路径的卷积向量。其中,卷积层是将各实体及其关联关系组合起来,并通过卷积向量整体的表达待识别子图中的关系路径,其中,该关系路径是将各实体通过相应的关联关系连接起来,以反映所述实体在待识别子图中通过关联关系所形成的全程路由。
S23:通过所述成熟神经网络识别所述关系路径的意图,并根据所述意图挖掘所述待识别子图中不具有关联关系的实体之间的潜在关系,以及所述潜在关系对应的潜在实体。
本步骤中,通过成熟神经网络的池化层对卷积层发送的卷积向量进行降维得到池化向量,并通过所述成熟神经网络的全连接层对所述池化层发送的池化向量进行分类,以理解所述关系路径的意图,并根据所述意图判断所述待识别子图中不具有关联关系的实体之间,应当具有关联关系的潜在实体,以及应当具有何种关联关系的潜在关系,并通过成熟神经网络的输出层输出所述潜在实体以及潜在关系。
于本实施例中,采用CNN神经网络作为成熟神经网络,所述CNN神经网络(Convolutional Neural Network,CNN,卷积神经网络)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图片处理有出色表现。
因此,以挖掘预测出,其中可能还会包含的潜在关系和潜在实体。因此,仅通过对待识别子图中各实体的内容、关联关系的内容以及实体与实体之间的结构,即可对潜在关联关系进行挖掘,而无需扩充推理规则,避免了一旦知识图谱中出现了推理规则未涉及过的关联关系,将会导致关系推理模型无法基于该关联关系对知识图谱的潜在关系进行挖掘的问题出现。同时还避免了由人工对知识图谱中各本体中实体进行进一步挖掘,导致挖掘效率低下,挖掘成本高的问题。并且避免了依次对知识图谱的本体中的实体依次进行识别,而导致无法在整体上理解各实体及其关联关系所形成的关联路径,故造成潜在关系及其潜在实体无法识别,或识别准确度较低的问题发生。
在一个优选的实施例中,请参阅图6,所述成熟神经网络通过以下步骤训练获得:
X1:获得初始神经网络及训练样本,其中,所述训练样本包括用于录入输入层的输入样本,及用于作为输出层的输出样本。
本步骤中,所述输入样本包括样本实体以及连接两个所述实体的样本关联关系,所述输出样本包括标记实体以及连接两个所述标记实体的标记关联关系。
X2:执行训练进程,以将所述输入样本录入所述初始神经网络得到训练结果。
本步骤中,所述训练进程包括:
X21:通过初始神经网络的输入层识别输入样本中的样本实体,得到以向量形式表达所述样本实体的样本实体特征,及识别输入样本中的样本关联关系,得到以向量形式表达所述样本关联关系的样本关联特征。
X22:通过初始神经网络的卷积层对样本实体特征和样本关联特征进行计算,获得以向量形式表达各实体及其关联路径的样本卷积向量。
X23:通过初始成熟神经网络的池化层对卷积层发送的样本卷积向量进行降维得到样本池化向量,初始神经网络的全连接层对所述样本池化向量进行分类,以理解所述关系路径的意图,并根据所述意图判断所述待识别子图中不具有关联关系的实体之间,应当具有关联关系的训练识别实体,以及应当具有何种关联关系的训练识别关系,并通过初始神经网络的输出层输出所述训练识别实体以及训练识别关系,将所述训练识别实体及其训练识别关系作为所述训练结果。
X3:调用迭代进程根据所述训练结果对所述初始神经网络进行迭代,直至所述输出样本和训练结果之间的差异小于预设的损失阈值时,得到成熟神经网络。
于本实施例中,请参阅图7,所述迭代进程包括:
X31:将训练识别实体及其训练识别关系与所述输出样本中的标记实体及其标记关系进行比对,得到反映所述输出样本和初始结果之间差异的训练标记差值。
X32:判断所述训练标记差值是否小于所述损失阈值。
X33:若是,则将所述初始神经网络设为成熟神经网络。
X34:若否,则采用梯度下降法根据所述训练标记差值计算得到调整数据,并采用反向传播算法根据所述调整数据调整所述初始神经网络中输入层、卷积层、池化层、全连接层和输出层的权重和偏执值,再调用所述训练进程。
需要说明的是,损失函数是通过神经网络将目标(实际)值与预测值进行匹配,再经过损失函数就可以计算出损失,以用于优化神经网络的参数的计算机函数。梯度下降法应用在在机器学习中领域,用于通过迭代找到损失函数的最小值,或者收敛到最小值。反向传播算法:是建立在梯度下降法的基础上,用于对神经网络中所有权重或偏执值进行调整,使损失函数的损失值不断下降的计算机算法。
示例性地,如果输入样本包括有实体“感冒”,实体“ICD10疾病”和实体“F人保”其中,实体“感冒”—实体“ICD10疾病”之间,具有关联关系“属于”,实体“ICD10疾病”与实体“F人保”之间具有关联关系“可核保疾病”。
而输出样本的潜在实体是实体“感冒”和实体“F人保”,其潜在关系是“核保核赔”。
那么,经过上述训练样本所训练而成的成熟神经网络,会将属于“ICD10疾病”的疾病实体,及可用于对ICD10疾病”进行核保的保险产品实体来说,该疾病实体和保险产品实体之间均具有“核保核赔”的关系。
S203:根据所述潜在关系及其潜在实体修改所述知识图谱,以更新所述知识图谱。
为实现自动更新知识图谱,避免人工更新导致更新效率缓慢的问题发生,本步骤通过自动识别知识图谱中的潜在实体,并在所述潜在实体之间构建潜在关系,以实现知识图谱的更新,提高了知识图谱更新的效率。
在一个优选的实施例中,请参阅图8,根据所述潜在关系及其潜在实体修改所述知识图谱的步骤,包括:
S31:提取所述知识图谱中与所述待识别子图对应的本体。
为避免与所述待识别子图对应本体之外的其他本体中具有潜在实体,导致其他本体中与潜在实体对应但本不应具有所述潜在关系,导致知识图谱更新错乱,降低知识图谱可靠性的问题发生,本步骤通过提取与所述待识别子图对应的本体,以保证潜在实体和潜在关系的识别仅局限在该本体的范围内,避免对其他本体进行干扰,保证了更新知识图谱操作的可靠性。
S32:识别所述本体中与所述潜在实体对应的目标实体。
示例性地,若潜在实体是“甲亢”和“F人保”,则识别知识图谱中与“甲亢”和“F人保”对应的实体,并将其设为目标实体。
S33:在所述目标实体之间构建所述潜在关系。
本步骤通过将所述潜在关系载入所述目标实体对应的配置文件中,以构建所述目标实体之间的潜在关系。
进一步地,根据所述潜在关系及其潜在实体修改所述知识图谱,以更新所述知识图谱之后,还包括:
将所述知识图谱上传至区块链中。
需要说明的是,基于知识图谱得到对应的摘要信息,具体来说,摘要信息由知识图谱进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息,以便查证知识图谱是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例三:
请参阅图9,本实施例的一种知识图谱关系挖掘装置1,包括:
子图获取模块11,用于从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图;
关系识别模块12,用于通过预置的成熟神经网络,根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
可选的,所述知识图谱关系挖掘装置1还包括:
图谱更新模块13,用于根据所述潜在关系及其潜在实体修改所述知识图谱,以更新所述知识图谱。
本技术方案应用于大数据的数据分析领域,通过根据待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体,以实现对知识图谱的知识关系挖掘的技术效果。
实施例四:
为实现上述目的,本发明还提供一种计算机设备5,实施例三的知识图谱关系挖掘装置1的组成部分可分散于不同的计算机设备中,计算机设备5可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个应用服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于:可通过系统总线相互通信连接的存储器51、处理器52,如图10所示。需要指出的是,图10仅示出了具有组件-的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器51(即存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器51可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,存储器51也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器51还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器51通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例三的知识图谱关系挖掘装置的程序代码等。此外,存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器52在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制计算机设备的总体操作。本实施例中,处理器52用于运行存储器51中存储的程序代码或者处理数据,例如运行知识图谱关系挖掘装置,以实现实施例一和实施例二的知识图谱关系挖掘方法。
实施例五:
为实现上述目的,本发明还提供一种计算机存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器52执行时实现相应功能。本实施例的计算机存储介质用于存储知识图谱关系挖掘装置,被处理器52执行时实现实施例一和实施例二的知识图谱关系挖掘方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种知识图谱关系挖掘方法,其特征在于,包括:
从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图;
通过预置的成熟神经网络,根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
2.根据权利要求1所述的知识图谱关系挖掘方法,其特征在于,所述从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图的步骤,包括:
控制知识图谱展示任一本体,其中,所述本体中至少具有一个实体及各所述实体之间的关联关系;
调用截图工具对所述本体中的所述实体及各所述实体之间的关联关系进行拍摄得到所述待识别子图。
3.根据权利要求1所述的知识图谱关系挖掘方法,其特征在于,所述通过预置的成熟神经网络,根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体的步骤,包括:
调用预置的成熟神经网络识别所述待识别子图中的所述实体得到实体特征,及识别所述待识别子图中各所述实体之间的关联关系得到关系特征;
通过所述成熟神经网络计算所述实体特征和所述关系特征,得到以向量形式反映所述待识别子图中关系路径的路径向量,所述关系路径反映了各所述实体在待识别子图中通过关联关系所形成的全程路由;
通过所述成熟神经网络识别所述关系路径的意图,并根据所述意图挖掘所述待识别子图中不具有关联关系的实体之间的潜在关系,以及所述潜在关系对应的潜在实体。
4.根据权利要求1所述的知识图谱关系挖掘方法,其特征在于,所述成熟神经网络通过以下步骤训练获得:
获得初始神经网络及训练样本,其中,所述训练样本包括用于录入输入层的输入样本,及用于作为输出层的输出样本;
执行训练进程,以将所述输入样本录入所述初始神经网络得到训练结果;
调用迭代进程根据所述训练结果对所述初始神经网络进行迭代,直至所述输出样本和训练结果之间的差异小于预设的损失阈值时,得到成熟神经网络。
5.根据权利要求4所述的知识图谱关系挖掘方法,其特征在于,所述迭代进程包括:
将训练识别实体及其训练识别关系与所述输出样本中的标记实体及其标记关系进行比对,得到反映所述输出样本和初始结果之间差异的训练标记差值;
判断所述训练标记差值是否小于所述损失阈值;
若是,则将所述初始神经网络设为成熟神经网络;
若否,则采用梯度下降法根据所述训练标记差值计算得到调整数据,并采用反向传播算法根据所述调整数据调整所述初始神经网络中输入层、卷积层、池化层、全连接层和输出层的权重和偏执值,再调用所述训练进程。
6.根据权利要求1所述的知识图谱关系挖掘方法,其特征在于,所述挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体的步骤之后,所述方法还包括:
根据所述潜在关系及其潜在实体修改所述知识图谱,以更新所述知识图谱;
所述根据所述潜在关系及其潜在实体修改所述知识图谱,以更新所述知识图谱的步骤之后,所述方法还包括:
将所述知识图谱上传至区块链中。
7.根据权利要求6所述的知识图谱关系挖掘方法,其特征在于,所述根据所述潜在关系及其潜在实体修改所述知识图谱的步骤,包括:
提取所述知识图谱中与所述待识别子图对应的本体;
识别所述本体中与所述潜在实体对应的目标实体;
在所述目标实体之间构建所述潜在关系。
8.一种知识图谱关系挖掘装置,其特征在于,包括:
子图获取模块,用于从知识图谱中获得至少具有一个实体及各所述实体之间关联关系的待识别子图;
关系识别模块,用于通过预置的成熟神经网络,根据所述待识别子图中的实体及各所述实体之间的关联关系,挖掘各所述实体之间的潜在关系以及与所述潜在关系对应的潜在实体。
9.一种计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机设备的处理器执行所述计算机程序时实现权利要求1至7任一项所述知识图谱关系挖掘方法的步骤。
10.一种计算机存储介质,所述存储介质上存储有计算机程序,其特征在于,所述存储介质存储的所述计算机程序被处理器执行时实现权利要求1至7任一项所述知识图谱关系挖掘方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095927.XA CN112069249A (zh) | 2020-10-14 | 2020-10-14 | 知识图谱关系挖掘方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095927.XA CN112069249A (zh) | 2020-10-14 | 2020-10-14 | 知识图谱关系挖掘方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112069249A true CN112069249A (zh) | 2020-12-11 |
Family
ID=73655915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011095927.XA Pending CN112069249A (zh) | 2020-10-14 | 2020-10-14 | 知识图谱关系挖掘方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112069249A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112989127A (zh) * | 2021-02-22 | 2021-06-18 | 中国银联股份有限公司 | 基于知识图谱的推理方法、装置及计算机可读存储介质 |
CN113961760A (zh) * | 2021-10-26 | 2022-01-21 | 北京市科学技术情报研究所 | 基于区块链的信息价值图谱构建方法 |
CN115858698A (zh) * | 2023-02-22 | 2023-03-28 | 北京融信数联科技有限公司 | 智能体图谱分析方法、系统和可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073711A (zh) * | 2017-12-21 | 2018-05-25 | 北京大学深圳研究生院 | 一种基于知识图谱的关系抽取方法和系统 |
CN108694469A (zh) * | 2018-06-08 | 2018-10-23 | 哈尔滨工程大学 | 一种基于知识图谱的关系预测方法 |
CN109815345A (zh) * | 2019-02-25 | 2019-05-28 | 南京大学 | 一种基于路径的知识图谱嵌入方法 |
CN110796254A (zh) * | 2019-10-30 | 2020-02-14 | 南京工业大学 | 一种知识图谱推理方法、装置、计算机设备及存储介质 |
US20200293905A1 (en) * | 2019-03-12 | 2020-09-17 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for generating neural network |
-
2020
- 2020-10-14 CN CN202011095927.XA patent/CN112069249A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073711A (zh) * | 2017-12-21 | 2018-05-25 | 北京大学深圳研究生院 | 一种基于知识图谱的关系抽取方法和系统 |
CN108694469A (zh) * | 2018-06-08 | 2018-10-23 | 哈尔滨工程大学 | 一种基于知识图谱的关系预测方法 |
CN109815345A (zh) * | 2019-02-25 | 2019-05-28 | 南京大学 | 一种基于路径的知识图谱嵌入方法 |
US20200293905A1 (en) * | 2019-03-12 | 2020-09-17 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for generating neural network |
CN110796254A (zh) * | 2019-10-30 | 2020-02-14 | 南京工业大学 | 一种知识图谱推理方法、装置、计算机设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112989127A (zh) * | 2021-02-22 | 2021-06-18 | 中国银联股份有限公司 | 基于知识图谱的推理方法、装置及计算机可读存储介质 |
CN113961760A (zh) * | 2021-10-26 | 2022-01-21 | 北京市科学技术情报研究所 | 基于区块链的信息价值图谱构建方法 |
CN113961760B (zh) * | 2021-10-26 | 2022-04-19 | 北京市科学技术情报研究所 | 基于区块链的信息价值图谱构建方法 |
CN115858698A (zh) * | 2023-02-22 | 2023-03-28 | 北京融信数联科技有限公司 | 智能体图谱分析方法、系统和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112069249A (zh) | 知识图谱关系挖掘方法、装置、计算机设备及存储介质 | |
CN110473083B (zh) | 树状风险账户识别方法、装置、服务器及存储介质 | |
WO2021174774A1 (zh) | 神经网络关系抽取方法、计算机设备及可读存储介质 | |
CN110929047A (zh) | 关注邻居实体的知识图谱推理方法和装置 | |
CN112214775A (zh) | 对图数据的注入式攻击方法、装置、介质及电子设备 | |
US20220245424A1 (en) | Microgenre-based hyper-personalization with multi-modal machine learning | |
CN112529429B (zh) | 客户信息校验方法、装置、计算机设备及存储介质 | |
CN113361658A (zh) | 一种基于隐私保护的图模型训练方法、装置及设备 | |
CN112231416A (zh) | 知识图谱本体更新方法、装置、计算机设备及存储介质 | |
CN111984792A (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
CN112995414B (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN112116436A (zh) | 一种智能推荐方法、装置、计算机设备及可读存储介质 | |
CN114328277A (zh) | 一种软件缺陷预测和质量分析方法、装置、设备及介质 | |
CN114580794B (zh) | 数据处理方法、装置、程序产品、计算机设备和介质 | |
CN113761525A (zh) | 基于联邦学习的智能入侵检测方法和系统 | |
CN110378543A (zh) | 离职风险预测方法、装置、计算机设备和存储介质 | |
CN111625567A (zh) | 数据模型匹配方法、装置、计算机系统及可读存储介质 | |
CN113254649B (zh) | 敏感内容识别模型的训练方法、文本识别方法及相关装置 | |
CN117291722A (zh) | 对象管理方法、相关设备及计算机可读介质 | |
CN111951112A (zh) | 基于区块链的智能合约执行方法、终端设备和存储介质 | |
CN116187422A (zh) | 神经网络的参数更新方法及相关设备 | |
CN114461619A (zh) | 能源互联网多源数据融合方法、装置、终端及存储介质 | |
CN115099875A (zh) | 基于决策树模型的数据分类方法及相关设备 | |
CN111737319B (zh) | 用户集群的预测方法、装置、计算机设备和存储介质 | |
CN114742572A (zh) | 异常流量的识别方法和装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |