CN117290366A - 一种不确定性态势时空知识图谱更新方法及系统 - Google Patents
一种不确定性态势时空知识图谱更新方法及系统 Download PDFInfo
- Publication number
- CN117290366A CN117290366A CN202311021948.0A CN202311021948A CN117290366A CN 117290366 A CN117290366 A CN 117290366A CN 202311021948 A CN202311021948 A CN 202311021948A CN 117290366 A CN117290366 A CN 117290366A
- Authority
- CN
- China
- Prior art keywords
- updated
- graph
- updating
- entity
- existing knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000008859 change Effects 0.000 claims abstract description 56
- 238000010801 machine learning Methods 0.000 claims abstract description 18
- 238000003058 natural language processing Methods 0.000 claims abstract description 13
- 238000005516 engineering process Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 18
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000000691 measurement method Methods 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims 6
- 238000000605 extraction Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 7
- 239000013598 vector Substances 0.000 description 13
- 238000001514 detection method Methods 0.000 description 7
- 239000010410 layer Substances 0.000 description 6
- 230000006872 improvement Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种不确定性态势时空知识图谱更新方法及系统,属于指挥控制领域,方法包括:将待更新态势数据与已有知识大图谱进行比较,以检测已有知识大图谱中实体以及实体关系的变化,并在已有知识大图谱上进行更新并解决更新冲突;对整个更新后的知识大图谱进行图谱一致性检查,利用机器学习和自然语言处理技术提取待更新态势数据的变化特征;以待更新态势数据的变化特征以及已有知识子图谱为训练完毕的更新预测模型的输入,预测更新节点以及更新节点在已有知识子图谱中的位置;在更新节点所在已有知识子图谱中的位置处进行节点属性、节点间关系以及子图谱索引的更新。本发明解决了原有知识图谱同步过程中效率低和准确率较弱的问题。
Description
技术领域
本发明属于指挥控制领域,更具体地,涉及一种不确定性态势时空知识图谱更新方法及系统。
背景技术
态势时空知识图谱是指挥信息系统的重要组成部分,具体来说是一种集合了海量地理信息、动态时序数据和复杂关系的图数据管理平台。它将现实世界中的地理信息、平台和装备信息、各类感知数据,以及态势分析与认知结果进行结构化的组织和存储,以三维空间模型为基础,以动态时序数据为纽带,实时准确地记录了现实世界中每一个目标在每一时刻的空间位置和状态变化,以及目标与目标、目标与环境间的关系变化。由于传感器探测数据、各类情报数据中蕴含了模糊性、随机性和偏差等多种不确定性,态势时空知识图谱的更新成为一个难题。
知识图谱的更新涉及到知识工程、不确定性建模、数据集成和机器学习等多个学科和技术领域。其中,增量式更新方法受到大量关注,其通过识别和处理新的数据变化,并将其与已有的知识进行融合,以实现知识图谱的持续演化和更新。
但是目前的增量式更新方法在不确定性时空态势条件下,由于获取的数据存在模糊性、随机性和偏差性等多种不确定性特征,使得更新结果通常存在一致性问题,导致效率和准确性往往达不到预期。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种不确定性态势时空知识图谱更新方法及系统,旨在解决现有的知识图谱增量式更新方法在不确定性时空态势条件下,由于获取的数据存在模糊性、随机性和偏差性等多种不确定性特征,使得更新结果通常存在一致性问题,导致效率和准确性往往达不到预期的问题。
为实现上述目的,本发明提供了一种不确定性态势时空知识图谱更新方法,包括以下步骤:
D1:将待更新态势数据与已有知识大图谱进行比较,以检测已有知识大图谱中实体以及实体关系的变化;并基于每个变化的实体和实体关系,在已有知识大图谱上进行更新并解决更新冲突;
D2:对整个更新后的知识大图谱进行图谱一致性检查,利用机器学习和自然语言处理技术提取待更新态势数据的变化特征;
D3:以待更新态势数据的变化特征以及已有知识子图谱为训练完毕的更新预测模型的输入,预测更新节点以及更新节点在已有知识子图谱中的位置;
D4:在更新节点所在已有知识子图谱中的位置处进行节点属性、节点间关系以及子图谱索引的更新;
其中,已有知识大图谱为类图谱;已有知识子图谱为已有知识大图谱的衍生,为子类图谱。
进一步优选地,D4后还包括D5,D5为:当D4执行后,对所有更新后的知识子图谱,基于图模型的表示对节点和关系进行不确定性标注,计算每个节点和关系的概率传播,使得每个节点的更新概率均在[0,1]的取值范围内。
进一步优选地,D1包括以下步骤:
D1.1:使用相似性度量方法进行语义匹配,对待更新态势数据中的实体与已有知识大图谱进行比对,在已有知识大图谱中筛选出相似度大于预设相似度的实体;
D1.2:基于D1.1筛选出的实体,采用相似性度量方法,比较待更新态势数据与已有知识大图谱中的关系,以确定筛选出的实体在已有知识大图谱中是否存在增改或删除的关系;
D1.3:确定筛选出的实体在已有知识大图谱中的更新方式,将新增实体和关系增加到已有知识大图谱中,对修改的实体对已有知识大图谱中的现有实体和关系进行更新,对删除的实体从现有知识大图谱中移除;
D1.4:检查是否对同一实体或关系存在不同的修改造成的冲突,若存在则按照优先级规则、时间戳规则和合并方法解决冲突;
其中,优先级规则为优先级高的操作覆盖优先级低的更新;时间戳规则为优先选择时间戳新的更新;合并方法为将不同更新的信息进行合并;
D1.5:待筛选的实体均更新完毕后,对整个更新后的知识大图谱进行图谱一致性检查;其中,图谱一致性检查包括语义一致性检查、约束检查和关系完整性检查;语义一致性检查为更新后的实体和关系与已有知识大图谱的语义关系保持一致;约束检查为检查更新后的已有知识大图谱是否满足预先设定的约束条件;关系完整性检查为检查更新后的已有知识大图谱不存在孤立的节点。
进一步优选地,更新预测模型为基于图神经网络的模型,采用半监督学习中的生成式方法,利用标记数据和未标记数据进行训练;其中,标记数据进行监督学习,未标记数据进行生成式学习;标记数据为带有更新节点的变化特征;未标记数据为不带有更新节点的变化特征。
进一步优选地,待更新态势数据的变化特征的提取方法,具体包括以下步骤:
将待更新态势数据使用自然语言处理技术提取文本特征,使用机器学习算法提取其他类型的特征;
将待更新态势数据的文本特征和其他类型的特征进行合并,构建成特征矩阵;
将特征矩阵作为机器学习模型的输入,学习待更新态势数据的变化模式,输出待更新态势数据的变化特征。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下
有益效果:
本发明提供了一种不确定性态势时空知识图谱更新方法及系统,其中,引入图神经网络对知识图谱的更新位置进行预测,图神经网络可以学习和理解图谱中的复杂语义关系,确定需要更新的实体节点,实现增量更新子图谱,解决原有知识图谱同步过程中效率低和准确率较弱的问题。
本发明提供了一种不确定性态势时空知识图谱更新方法及系统,其中,基于相似度算法计算数据间差异,引入一致性规范确保更新前后的知识子图谱语义一致,避免了传统增量式更新方法可能造成的冲突,提高效率和准确率;其中,一致性规范不同于传统方法,结合了图模型的表达和概念推断,通过引入不确定性标注和概率传播,可以在复杂的不确定性态势变化中保持数据的一致性,实现包含复杂语义的实体关系的更新问题。
附图说明
图1是本发明实施例提供的不确定性态势时空知识图谱更新方法框架图;
图2是本发明实施例提供的不确定性态势时空知识图谱更新方法中的详细流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种不确定性态势时空知识图谱更新方法及系统,基于计算态势数据变化的检测,利用更新预测模型完成已有知识子图谱更新,并引入一致性规范,解决如下问题:
(1)利用目标航迹、目标意图识别和威胁评估等结果,面对复杂的语义关系和模式时,准确处理数据的变化,获取态势变化特征,实现态势变化检测;
(2)基于态势变化特征,建立更新预测模型实现知识子图谱更新预测,输出需要更新的节点,完成时空知识子图谱的增量更新。
如图1和图2所示,本发明提供了一种不确定性态势时空知识图谱更新方法,实现过程包括以下步骤:
S1:接收待更新态势数据
态势时空知识图谱接收船舶指挥控制系统或者船舶监测系统目标航迹、目标意图识别结果(攻击、侦察和防御等意图)以及目标威胁评估结果(敌方目标对我方平台的威胁等级);
采集用于更新知识图谱的时空态势数据,并进行数据清洗和预处理,且实时存储;
S2:不确定性态势变化检测
将待更新态势数据与已有知识大图谱进行比较,以检测数据变化;结合机器学习和自然语言处理等技术,获取态势数据的变化特征;其中,已有知识大图谱可以理解为宏观的类,如船舶,雷达站,飞机等平台,而已有知识子图谱是已有知识大图谱的衍生,如船舶类里具体的渔船或军舰;
S2具体包括以下步骤:
S2.1:识别数据差异,接收待更新态势数据,通过数据特征的差异,识别待更新态势数据与已有知识大图谱之间的差异;首先,使用相似度度量方法进行语义匹配,对待更新态势数据中的实体与已有知识大图谱进行比对,在已有知识大图谱中找出相似性较高的实体;其次,基于相似度较高的实体,采用相似性度量方法,比较待更新态势数据与已有知识图谱中的关系,以确定已有知识大图谱中相似性较高的实体之间是否存在增改或删除的关系;最后,通过预先设定的规则和模式,检测出已有知识大图谱存在的待更新的态势数据变化情况;
不确定性态势时空知识图谱为G,初始时刻的已有知识大图谱为G0,新的实体和实体关系变化为ΔG,变化检测机制为:
ΔG=DetectChanges(G,G0)
通过比较更新后知识大图谱G和初始已有知识大图谱G0,检测出实体和实体关系的变化ΔG;其中,DetectChanges用于变化检测;
相似性度量方法是余弦相似度(Cosine Similarity),假设有两个向量a和b,它们分别表示待比较的数据,可以使用余弦相似度以衡量它们之间的相似程度,公式如下:
cos(θ)=(a·b)/(||a||*||b||)
其中,a·b表示向量a和向量b的内积,||a||和||b||表示向量a和向量b的模长;余弦相似度的取值范围在-1到1之间,值越接近1表示两个向量越相似,值越接近-1表示两个向量越不相似;基于预先的规则可以使用逻辑规则或条件以判断新增、修改或删除的数据;
S2.2:在识别待更新态势数据与已有知识大图谱的差异后,确定已有知识大图谱数据的更新方式;对于待更新态势数据与已有知识大图谱相比存在的新增的实体,将新增实体或关系增加到已有知识大图谱中;对于修改的实体,对现有实体和关系进行更新,确保其反映了最新的信息,对于删除的实体将其从现有知识大图谱中移除;
S2.3:冲突解决;在实体更新过程中,可能出现多个更新操作对同一实体或关系进行不同的修改造成冲突,需要对冲突进行解决,根据预先设定的优先级或冲突解决方法确定最终的更新结果;此外,进行图谱一致性检查,确保更新后的知识大图谱不包含矛盾或不完整的信息;
更为具体地,定义一系列规则,当进行实体更新时,可能会出现多个更新操作针对同一实体或同一条边导致冲突;为了解决这些冲突,采取以下方法:a.优先级规则:给每个更新操作设置优先级,优先级高的操作会覆盖优先级低的操作;b.时间戳:记录每个更新操作的时间戳,优先选择时间戳较新的操作进行更新;c.合并方法:对于更新操作之间的冲突,采用合并策略,将不同操作的信息进行合并,以保留尽可能多的信息;
S2.4:图谱一致性检查;需要对更新后的整个知识大图谱进行一致性检查,确保更新后的数据与已有的数据保持一致;图谱一致性检查可以包括以下方面:a.语义一致性检查:确保更新后的实体和关系与知识大图谱的语义关系保持一致,不引入不合理的语义;b.约束检查:检查更新后的图谱是否满足预先设定的约束条件,例如某些实体之间的关系或属性值的取值范围;c.关系完整性检查:确保更新后的数据不存在孤立的节点,所有节点之间都能够建立正确的关系;若未通过冲突解决和图谱一致性检查,将重新执行S1;
S2.4:获取态势变化特征;利用机器学习和自然语言处理技术提取变化特征,进一步提高对复杂语义关系和模式的处理能力;
更为具体地,结合机器学习和自然语言处理等技术,进一步提高对复杂语义关系和模式的处理能力,算法改进机制为:
G”=Improve(G',ΔG)
其中,G”为态势变化转换为特征的大图谱;G'为通过一致性检查的大图谱;Improve为算法改进;迭代改进更新算法,引入机器学习模型,提高更新的准确性和鲁棒性;
具体而言,首先对于待更新态势数据进行预处理,包括:数据清洗、去噪和标准化等步骤,以确保数据的质量和一致性;其次从预处理后的态势数据中提取特征;然后将从不同来源提取的特征进行合并和表示,最后将提取的特征作为机器学习模型的输入,训练模型以学习态势变化的模式和规律;
假设态势数据集为D,包含N条数据;对于每条数据d_i,使用自然语言处理技术提取文本特征,表示为向量x_iNLP,使用机器学习算法提取其他类型的特征,表示为向量x_iML,然后将不同类型的特征合并成最终的特征向量x_i,即:
x_i=[x_iNLP,x_iML]
其中,x_i是一个维度较高的特征向量,包含了文本特征和其他类型特征;将所有数据的特征向量组成特征矩阵X,即:
X=[x_1;x_2;...;x_N]
将特征矩阵X作为机器学习模型的输入,用于学习态势变化的模式和规律,以提供输入更新预测模型的变化特征;
综合起来,可以表达整个过程为:
G”=Improve(MC(DetectChanges(G,G0),ΔG)),ΔG)
其中,DetectChanges用于变化检测,MC(MaintainConsistency)用于一致性检查,Improve用于算法改进;
S3:知识子图谱更新预测
为了保证更新一致,本发明针对已有知识子图谱需要进行更新的几种情况,提出了更新预测模型,确定需要更新的节点,实现增量更新已有知识子图谱,解决原有知识图谱同步过程中效率低和准确率较弱的问题。
S3具体包括以下步骤:
S3.1:建立更新预测模型,基于S2获取态势变化特征,建立已有知识子图谱的更新预测模型,采用半监督学习中的生成式方法,利用已有的标记数据和未标记数据进行模型训练;通过对已有标签的数据进行监督学习,同时对未标记数据进行生成式学习,提高预测模型的准确性和泛化能力;其中,标记数据为附带更新节点的特征,未标记数据仅是特征;
更为具体地,目前新增的节点和节点关系已经过预处理的筛选步骤,将新增节点和节点关系与知识图谱结合起来;常用的预测模型是基于图神经网络(Graph NeuralNetwork,GNN)的模型,其中,模型是GCN(Graph Convolutional Network);下面是描述GCN模型工作流程的实例,并结合数学公式进行说明;GCN模型工作流程为:a.输入:给定一个已有的知识子图谱,其中,包含节点和边的信息;b.特征初始化:为每个节点设置初始特征向量;c.层间信息传递:通过多个图卷积层,从相邻节点中聚合信息并更新节点的特征表示;d.预测模型:利用更新后的节点特征进行预测,预测新增节点在知识子图谱上的位置;
假设有一个包含N个节点的知识图谱,表示为图g=(X,A),其中,X是节点特征矩阵,A是邻接矩阵;特征传播公式如下:
其中,H(l)表示第l层节点的特征矩阵,初始时H(0)=X;是邻接矩阵A加上自连接后的结果;/>是/>的度矩阵;W(l)是第l层的权重矩阵;σ是激活函ReLU;
这个公式表示通过多层的特征传播,将节点的邻居信息进行聚合和更新,得到更新后的节点特征矩阵H(l+1),预测公式为:
Y=softmax(H(L)W(L+1))
其中,H(L)表示最后一层的节点特征矩阵;W(L+1)是最后一层到预测结果的权重矩阵;softmax函数将节点的特征映射为概率分布,用于进行分类或预测,确定需要更新的节点;
S3.2:增量更新子图谱;将上一步S3.1确定的需要更新的节点作为焦点进行增量更新已有知识子图谱;通过增量更新方式,只对发生变化的部分进行更新,避免对整个图谱进行更新,从而节省计算资源和更新所需时间。
更为具体地,更新节点属性:对于需要更新的节点v_i,根据新的节点信息更新其属性值;具体的更新方式根据实际应用场景而定,可以是替换原有属性值或者添加新的属性值,或者通过某种规则进行属性值的更新;
更新节点间关系:对于需要更新的节点v_i,根据新的数据信息,更新其与其他节点之间的关系,可能的更新方式包括添加新的边,删除原有的边,或者修改已有边的权重等;
更新记录追踪:对于更新过的节点和关系,建立相应的更新记录,用于追踪更新的历史信息;这些记录可以用于后续数据分析、回溯和审计等目的;
更新子图谱索引:随着节点和关系的更新,子图谱的结构可能发生变化;因此,在更新完成后,需要对子图谱的索引进行相应的更新,以确保查询效率和准确性;
S3.3:一致性规范,为保持知识图谱的一致性,引入一致性规范;在进行节点更新后,对预更新后的知识子图谱基于图模型的表示对节点和关系进行不确定性标注,计算每个节点和关系的概率传播,使得每个节点的更新概率均在[0,1]的取值范围内,使节点的更新更加灵活和准确;
更为具体地,引入严格一致性规范,确保更新的结果与知识图谱的语义关系和模式保持一致;包括验证更新操作的合法性、应用事务机制以保证数据的完整性,并进行冲突解决和图谱一致性检查等步骤;
G'=MaintainConsistency(G,ΔG)
根据变化ΔG,确保更新后的知识图谱G'与原有的语义关系和模式保持一致;MaintainConsistency用于一致性维护;
将知识子图谱表示为一个图Gn=(V,E),其中,V表示知识图谱中的节点,边E表示实体之间的语义关系;每个v∈V都有一个状态表示s(v),表示其当前状态;
对于知识子图谱中的每个v∈V,引入不确定性标注u(v)∈[0,1],表示该节点的更新概率;u(v)的取值范围为[0,1],其中,u(v)=0表示实体v不需要更新,u(v)=1表示节点v需要进行完全更新;
定义节点更新规则f(v):节点v的更新状态s'(v)等于当前状态s(v)与不确定性标注u(v)加权的结果;即,s'(v)=f(v)=u(v)*s(v);
为了确保图2中节点更新的一致性,需要对节点的更新概率进行传播;对于每个节点v∈V,将其更新概率u(v)传播给其邻居节点;假设N(v)表示v的邻居集合,则更新节点和关系的概率传播公式为:
u'(v)=g(v)=Σu(u)*w(u,v)
其中,u'(v)表示v的传播后更新概率,u(u)表示u的更新概率,w(u,v)表示u对v的传播权重;传播权重w(u,v)可以根据节点间的语义关系和距离等因素进行计算;
在概率传播完成后,对所有节点的更新概率进行一致性检查;确保每个节点的更新概率u(v)都在[0,1]的取值范围内,表示合理的更新概率,该概率为当前的更新准确率的判断,和后续的更新策略提供指导。
综上所述,本发明与现有技术相比,存在以下优势:
本发明提供了一种不确定性态势时空知识图谱更新方法及系统,其中,引入图神经网络对知识图谱的更新位置进行预测,图神经网络可以学习和理解图谱中的复杂语义关系,确定需要更新的实体节点,实现增量更新子图谱,解决原有知识图谱同步过程中效率低和准确率较弱的问题。
本发明提供了一种不确定性态势时空知识图谱更新方法及系统,其中,基于相似度算法计算数据间差异,引入一致性规范确保更新前后的知识子图谱语义一致,避免了传统增量式更新方法可能造成的冲突,提高效率和准确率;其中,一致性规范不同于传统方法,结合了图模型的表达和概念推断,通过引入不确定性标注和概率传播,可以在复杂的不确定性态势变化中保持数据的一致性,实现包含复杂语义的实体关系的更新问题。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种不确定性态势时空知识图谱更新方法,其特征在于,包括以下步骤:
D1:将待更新态势数据与已有知识大图谱进行比较,以检测已有知识大图谱中实体以及实体关系的变化;并基于每个变化的实体和实体关系,在已有知识大图谱上进行更新并解决更新冲突;
D2:对整个更新后的知识大图谱进行图谱一致性检查,利用机器学习和自然语言处理技术提取待更新态势数据的变化特征;
D3:以待更新态势数据的变化特征以及已有知识子图谱为训练完毕的更新预测模型的输入,预测更新节点以及更新节点在已有知识子图谱中的位置;
D4:在更新节点所在已有知识子图谱中的位置处进行节点属性、节点间关系以及子图谱索引的更新;
其中,已有知识大图谱为类图谱,已有知识子图谱为大图谱的衍生,为子类图谱。
2.根据权利要求1所述的不确定性态势时空知识图谱更新方法,其特征在于,D4后还包括D5,D5为:当D4执行后,对所有更新后的知识子图谱,基于图模型的表示对节点和关系进行不确定性标注,计算每个节点和关系的概率传播,使得每个节点的更新概率均在[0,1]的取值范围内。
3.根据权利要求1或2所述的不确定性态势时空知识图谱更新方法,其特征在于,D1包括以下步骤:
D1.1:使用相似性度量方法进行语义匹配,对待更新态势数据中的实体与已有知识大图谱进行比对,在已有知识大图谱中筛选出相似度大于预设相似度的实体;
D1.2:基于D1.1筛选出的实体,采用相似性度量方法,比较待更新态势数据与已有知识大图谱中的关系,以确定筛选出的实体在已有知识大图谱中是否存在增改或删除的关系;
D1.3:确定筛选出的实体在已有知识大图谱中的更新方式,将新增实体和关系增加到已有知识大图谱中,对已有知识大图谱中需要修改的实体和关系进行更新,对删除的实体从现有知识大图谱中移除;
D1.4:检查是否对同一实体或关系存在不同的修改造成的更新冲突,若存在则按照优先级规则、时间戳规则和合并方法解决更新冲突;
其中,优先级规则为优先级高的操作覆盖优先级低的更新;时间戳规则为优先选择时间戳新的更新;合并方法将不同更新的信息进行合并;
D1.5:待筛选的实体均更新完毕后,对整个更新后的知识大图谱进行图谱一致性检查;其中,图谱一致性检查包括语义一致性检查、约束检查和关系完整性检查;所述语义一致性检查为更新后的实体和关系与已有知识大图谱的语义关系保持一致;所述约束检查为检查更新后的已有知识大图谱是否满足预先设定的约束条件;所述关系完整性检查为检查更新后的已有知识大图谱不存在孤立的节点。
4.根据权利要求1所述的不确定性态势时空知识图谱更新方法,其特征在于,所述更新预测模型为基于图神经网络的模型,采用半监督学习中的生成式方法,利用标记数据和未标记数据进行训练;其中,所述标记数据进行监督学习,未标记数据进行生成式学习;所述标记数据为带有更新节点的变化特征;所述未标记数据为不带有更新节点的变化特征。
5.根据权利要求3所述的不确定性态势时空知识图谱更新方法,其特征在于,待更新态势数据的变化特征的提取方法,包括以下步骤:
将待更新态势数据使用自然语言处理技术提取文本特征,使用机器学习算法提取其他类型的特征;
将待更新态势数据的文本特征和其他类型的特征进行合并,构建成特征矩阵;
将特征矩阵作为机器学习模型的输入,学习待更新态势数据的变化模式,输出待更新态势数据的变化特征。
6.一种不确定性态势时空知识图谱更新系统,其特征在于,包括:
已有知识大图谱更新模块,用于将待更新态势数据与已有知识大图谱进行比较,以检测已有知识大图谱中实体以及实体关系的变化;并基于每个变化的实体和实体关系,在已有知识大图谱上进行更新并解决更新冲突;
变化特征提取模块,用于对整个更新后的知识大图谱进行图谱一致性检查,利用机器学习和自然语言处理技术提取待更新态势数据的变化特征;
节点位置预测模块,用于以待更新态势数据的变化特征以及已有知识子图谱为训练完毕的更新预测模型的输入,预测更新节点以及更新节点在已有知识子图谱中的位置;
已有知识子图谱更新模块,用于在更新节点所在已有知识子图谱中的位置处进行节点属性、节点间关系以及子图谱索引的更新;
其中,所述已有知识大图谱为类图谱;所述已有知识子图谱为已有知识大图谱的衍生,为子类图谱。
7.根据权利要求6所述的不确定性态势时空知识图谱更新系统,其特征在于,还包括一致性规范模块,用于对所有更新后的知识子图谱,基于图模型的表示对节点和关系进行不确定性标注,计算每个节点和关系的概率传播,使得每个节点的更新概率均在[0,1]的取值范围内。
8.根据权利要求6或7所述的不确定性态势时空知识图谱更新系统,其特征在于,所述已有知识大图谱更新模块包括实体筛选单元、关系确定单元、实体更新单元、更新冲突解决单元和一致性检查单元;
实体筛选单元用于使用相似性度量方法进行语义匹配,对待更新态势数据中的实体与已有知识大图谱进行比对,在已有知识大图谱中筛选出相似度大于预设相似度的实体;
关系确定单元用于基于筛选出的实体,采用相似性度量方法,比较待更新态势数据与已有知识大图谱中的关系,以确定筛选出的实体在已有知识大图谱中是否存在增改或删除的关系;
实体更新单元用于确定筛选出的实体在已有知识大图谱中的更新方式,将新增实体和关系增加到已有知识大图谱中,对修改的实体对已有知识大图谱中的现有实体和关系进行更新,对删除的实体从现有知识大图谱中移除;
更新冲突解决单元用于检查是否对同一实体或关系存在不同的修改造成的冲突,若存在则按照优先级规则、时间戳规则和合并方法解决冲突;
其中,优先级规则为优先级高的操作覆盖优先级低的更新;时间戳规则为优先选择时间戳新的更新;合并方法为将不同更新的信息进行合并;
一致性检查单元用于待筛选的实体均更新完毕后,对整个更新后的知识大图谱进行图谱一致性检查;其中,图谱一致性检查包括语义一致性检查、约束检查和关系完整性检查;语义一致性检查为更新后的实体和关系与已有知识大图谱的语义关系保持一致;约束检查为检查更新后的已有知识大图谱是否满足预先设定的约束条件;关系完整性检查为检查更新后的已有知识大图谱不存在孤立的节点。
9.根据权利要求6所述的不确定性态势时空知识图谱更新系统,其特征在于,更新预测模型为基于图神经网络的模型,采用半监督学习中的生成式方法,利用标记数据和未标记数据进行训练;其中,所述标记数据进行监督学习,所述未标记数据进行生成式学习;所述标记数据为带有更新节点的变化特征;所述未标记数据为不带有更新节点的变化特征。
10.根据权利要求8所述的不确定性态势时空知识图谱更新系统,其特征在于,所述变化特征提取模块中待更新态势数据的变化特征的提取方法,具体包括以下步骤:
将待更新态势数据使用自然语言处理技术提取文本特征,使用机器学习算法提取其他类型的特征;
将待更新态势数据的文本特征和其他类型的特征进行合并,构建成特征矩阵;
将特征矩阵作为机器学习模型的输入,学习待更新态势数据的变化模式,输出待更新态势数据的变化特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311021948.0A CN117290366A (zh) | 2023-08-14 | 2023-08-14 | 一种不确定性态势时空知识图谱更新方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311021948.0A CN117290366A (zh) | 2023-08-14 | 2023-08-14 | 一种不确定性态势时空知识图谱更新方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117290366A true CN117290366A (zh) | 2023-12-26 |
Family
ID=89239895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311021948.0A Pending CN117290366A (zh) | 2023-08-14 | 2023-08-14 | 一种不确定性态势时空知识图谱更新方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117290366A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109388716A (zh) * | 2017-08-04 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 关系图更新方法及设备 |
CN112231416A (zh) * | 2020-10-14 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 知识图谱本体更新方法、装置、计算机设备及存储介质 |
CN112365576A (zh) * | 2020-11-10 | 2021-02-12 | 网易(杭州)网络有限公司 | 庄园组件位置的推荐方法、装置及服务器 |
CN114111764A (zh) * | 2021-08-21 | 2022-03-01 | 西北工业大学 | 一种导航知识图谱构建及推理应用方法 |
CN114357180A (zh) * | 2021-12-14 | 2022-04-15 | 青岛海信网络科技股份有限公司 | 知识图谱的更新方法及电子设备 |
CN114860891A (zh) * | 2022-06-01 | 2022-08-05 | 国家石油天然气管网集团有限公司 | 一种智慧管网时空图谱构建的方法及装置 |
CN115438197A (zh) * | 2022-11-07 | 2022-12-06 | 巢湖学院 | 一种基于双层异质图的事理知识图谱关系补全方法及系统 |
-
2023
- 2023-08-14 CN CN202311021948.0A patent/CN117290366A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109388716A (zh) * | 2017-08-04 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 关系图更新方法及设备 |
CN112231416A (zh) * | 2020-10-14 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 知识图谱本体更新方法、装置、计算机设备及存储介质 |
CN112365576A (zh) * | 2020-11-10 | 2021-02-12 | 网易(杭州)网络有限公司 | 庄园组件位置的推荐方法、装置及服务器 |
CN114111764A (zh) * | 2021-08-21 | 2022-03-01 | 西北工业大学 | 一种导航知识图谱构建及推理应用方法 |
CN114357180A (zh) * | 2021-12-14 | 2022-04-15 | 青岛海信网络科技股份有限公司 | 知识图谱的更新方法及电子设备 |
CN114860891A (zh) * | 2022-06-01 | 2022-08-05 | 国家石油天然气管网集团有限公司 | 一种智慧管网时空图谱构建的方法及装置 |
CN115438197A (zh) * | 2022-11-07 | 2022-12-06 | 巢湖学院 | 一种基于双层异质图的事理知识图谱关系补全方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110889556B (zh) | 一种企业经营风险特征数据信息提取方法和提取系统 | |
Liu et al. | Combination of classifiers with different frames of discernment based on belief functions | |
US20070260563A1 (en) | Method to continuously diagnose and model changes of real-valued streaming variables | |
Hu et al. | System reliability prediction model based on evidential reasoning algorithm with nonlinear optimization | |
CN113312447A (zh) | 基于概率标签估计的半监督日志异常检测方法 | |
Choi et al. | Identifying emerging technologies to envision a future innovation ecosystem: A machine learning approach to patent data | |
Hoskere et al. | Deep Bayesian neural networks for damage quantification in miter gates of navigation locks | |
Luan et al. | Out-of-distribution detection for deep neural networks with isolation forest and local outlier factor | |
CN103810266A (zh) | 语义网络目标识别判证方法 | |
Zhang et al. | Multi-state deterioration prediction for infrastructure asset: Learning from uncertain data, knowledge and similar groups | |
CN114463540A (zh) | 使用神经网络对图像进行分割 | |
CN116628212A (zh) | 面向国民经济和社会发展调查领域的不确定性知识图谱建模方法 | |
Glavind et al. | On a simple scheme for systems modeling and identification using big data techniques | |
Liang et al. | Multi-source information grey fusion method of torpedo loading reliability | |
Kumar et al. | Community-enhanced Link Prediction in Dynamic Networks | |
CN117290366A (zh) | 一种不确定性态势时空知识图谱更新方法及系统 | |
CN116226404A (zh) | 一种针对肠-脑轴的知识图谱构建方法及知识图谱系统 | |
CN114579761A (zh) | 信息安全知识实体关系连接预测方法、系统及介质 | |
Jungbluth et al. | The DeepCAR Method: Forecasting Time-Series Data That Have Change Points | |
Toğaçar | The Contribution of AI-Based Approaches in the Determination of CO | |
Buddarapu et al. | Data Shift in Legal AI Systems. | |
CN117217392B (zh) | 一种通用装备保障需求的确定方法及装置 | |
Moghtadernejad et al. | Estimating the values of missing data related to infrastructure condition states using their spatial correlation | |
Zhu | Life cycle fatigue management for high-speed vessel using Bayesian updating approaches | |
Nor et al. | Explainable artificial intelligence for anomaly detection and prognostic of gas turbines using uncertainty quantification with sensor-related data explainable artificial intelligence for anomaly detection and prognostic of gas turbines using uncertainty Q |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |