CN114117078A - 一种基于d-s证据理论的电力异构知识融合的方法 - Google Patents

一种基于d-s证据理论的电力异构知识融合的方法 Download PDF

Info

Publication number
CN114117078A
CN114117078A CN202111463105.7A CN202111463105A CN114117078A CN 114117078 A CN114117078 A CN 114117078A CN 202111463105 A CN202111463105 A CN 202111463105A CN 114117078 A CN114117078 A CN 114117078A
Authority
CN
China
Prior art keywords
knowledge
triple
event
confidence
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111463105.7A
Other languages
English (en)
Inventor
钱旭盛
翟千惠
康雨萌
程雅梦
吴伟将
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
Original Assignee
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangsu Electric Power Co ltd Marketing Service Center filed Critical State Grid Jiangsu Electric Power Co ltd Marketing Service Center
Priority to CN202111463105.7A priority Critical patent/CN114117078A/zh
Publication of CN114117078A publication Critical patent/CN114117078A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于D‑S证据理论的电力异构知识融合的方法,包括:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;对单个输入知识K,利用BM25分别从本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;分别计算知识候选集中每个知识的置信度;基于置信度,利用D‑S证据理论融合计算出候选集中每一知识的融合置信度;对融合置信度进行排序,筛选得到与查询语句K最相关的知识。本发明基于检索及文本表征,利用D‑S证据理论,对异构知识置信度结果进行融合排序,实现异构知识的融合,提升了知识融合的效率及效果。

Description

一种基于D-S证据理论的电力异构知识融合的方法
技术领域
本发明属于电力知识融合技术领域,涉及一种基于D-S证据理论的电力异构知识融合的方法。
背景技术
由于人类知识的复杂性、开放性、多样性,同时具有巨大的规模,需要大规模常识知识库来支撑类人推理和自然语言理解。但是,知识图谱中的知识来源广泛,多源异构的知识之间会存在重复、语义多样、质量参差不齐等问题,需要进行冲突检测、实体消歧、实体对齐等操作,将多种来源的知识有机融合在一起,形成高质量知识图谱。
传统的知识融合技术大多仅针对单种知识类型的进行融合,对于异构知识的融合方案相对交少,
D-S证据理论起源于20世纪60年代的哈佛大学数学家A.P.Dempster利用上、下限概率解决多值映射问题,1967年他起连续发表一系列论文,标志着证据理论的正式诞生。而后Dempster的学生G.shafer对证据理论做了进一步研究,引入信任函数概念,形成了一套“证据”和“组合”来处理不确定性推理的数学方法从而形成了该理论,利用D-S证据理论对电力异构知识进行融合,可有效提升知识融合的整理效率。
发明内容
为解决现有技术中的不足,本申请提供一种基于D-S证据理论的电力异构知识融合的方法。
为了实现上述目标,本发明采用如下技术方案:
一种基于D-S证据理论的电力异构知识融合的方法,包括以下步骤:
步骤1:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;
步骤2:对单个输入知识K,即查询语句K,利用BM25分别从步骤1的本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;
步骤3:分别计算步骤2得到的知识候选集中每个知识的置信度;
步骤4:基于步骤3计算得到的置信度,利用D-S证据理论融合计算出候选集中每一知识的融合置信度;
步骤5:对步骤4得到的融合置信度进行排序,筛选得到与查询语句K最相关的知识。
本发明进一步包括以下优选方案:
优选地,步骤1中,获取电力智能知识中心多种类型知识,包括本体知识Onto_data,三元组知识Triple_data,以及事件知识Event_data;
所述本体知识Onto_data={O1,O2,…,Oi,…,On},其中Oi为第i个本体知识;
所述三元组知识Triple_data={T1,T2,…,Ti,…,Tn},其中Ti为第i个三元组知识;
所述事件知识Event_data={E1,E2,…,Ei,…,En},其中Ei为第i个事件知识;
n为每类知识中的知识数量。
优选地,步骤2中,对单个输入知识K,利用BM25分别从步骤1的本体知识Onto_data、三元组知识Triple_data以及事件知识Event_data中检索出最优的M个知识候选集,得到:
本体知识候选集Onto_dataK={OK1,OK2,…,OKj,…,OKm};
其中,OKj为输入知识K对应的第j个本体知识;
三元组知识候选集Triple_dataK={TK1,TK2,…,TKj,…,TKm};
其中,TKj为输入知识K对应的第j个三元组知识;
事件知识候选集Event_dataK={EK1,EK2,…,EKj,…,EKm};
其中,EKj为输入知识K对应的第j个事件知识;
m为每个候选集中的知识数量。
优选地,步骤2具体包括:
步骤2.1:利用BM25算法分别计算本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score;
步骤2.2:对步骤2.1得到的相似程度score在本知识内进行排序,选取相似程度score最高的M个相应知识,分别构成本体知识候选集Onto_dataK、三元组知识候选集Triple_dataK、事件知识候选集Event_dataK。
优选地,步骤2.1中,本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score的计算公式分别为公式(1)、公式(2)、公式(3)
Figure BDA0003389382370000031
Figure BDA0003389382370000032
Figure BDA0003389382370000033
其中,fOdj为本体知识中信息特征fOd的第j个元素;
fTdj为三元组知识中信息特征fTd的第j个元素;
fEdj为事件知识中信息特征fEd的第j个元素;
Kk为输入的单条知识中第k个词;
Wk为Kk的权重;
R(fOdj,qk)为Kk与电力本体知识fOdj的相关性分数;
R(fTdj,qk)为Kk与电力三元组知识fTdj的相关性分数;
R(fEdj,qk)为Kk与电力事件知识fEdj的相关性分数;
fdj来代表fd中每个信息特征的第j个元素;
fd来代表三种知识类型的信息特征集合;
n为输入的知识K中词的个数。
优选地,Kk的权重Wk的计算公式为:
Figure BDA0003389382370000034
Kk与电力存储知识fdj的相关性分数R(fdj,qk)的计算公式为:
Figure BDA0003389382370000035
Figure BDA0003389382370000041
其中,k1、k2和b是调协因子;
Xk表示单体知识K中词汇Kk在fd中出现的次数;
Yk表示词汇Kk在输入的知识K中出现的次数;
lj为单个知识fdj的长度,avg_lj为fd所有知识fdj的平均长度。
优选地,步骤3中,计算本体知识候选集Onto_dataK每个本体知识的置信度,第j个本体知识OKj的置信度Pokj计算公式为:
Figure BDA0003389382370000042
其中,KVec为单条知识对应的向量表征,OKjVec为本体知识OKj对应的向量表征;
计算三元组知识候选集Triple_dataK中每个三元组知识的置信度,第j个三元组知识TKj的置信度PTkj计算为:
Figure BDA0003389382370000043
其中,TKjVec为三元组知识TKj对应的向量表征;
计算事件知识候选集Event_dataK中每个事件知识的置信度,第j个事件知识EKj的置信度PEkj计算公式为:
Figure BDA0003389382370000044
其中,EKjVec为事件知识EKj对应的向量表征。
优选地,步骤3中,采用基于预训练语言模型的方法获取向量表征。
优选地,步骤4具体包括:
步骤4.1:设置置信度评分区间和等级;
步骤4.2:基于D-S证据理论设置用于置信度评分计算的Dempster合成规则;
步骤4.3:根据步骤3的置信度,采用步骤4.2的Dempster合成规则计算每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分;
步骤4.4:确定每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分这三个评分值所在的评分区间,得到这三个评分值的权重,结合权重进行这三个评分值叠加,得到该知识基于D-S证据理论的融合置信度。
优选地,步骤4.1:设置如下置信度评分区间和等级:
1)高等:[0.75,1.0]
2)中等:[0.25,0.75]
3)低等:[0,0.25]。
优选地,步骤4.2中设置用于置信度评分计算的Dempster合成规则为:
Figure BDA0003389382370000051
其中,Sv表示知识Kj第v种类型候选集的置信度得分,v=1,2,3,分别表示本体知识、三元组知识和事件知识类型候选集的置信度评分;
n表示第v种类型知识候选集中除知识Kj外的知识的数目;
PKj表示知识Kj的置信度;
Figure BDA0003389382370000052
表示第v种类型知识候选集中知识Ki的置信度,知识Ki为第v种类型知识候选集中除知识Kj外的知识。
优选地,步骤4.4中,评分值属于高等、中等、低等评分区间时,分别对评分值分配权重θ,μ,ω,其中,θ,μ,ω预先设定。
本申请所达到的有益效果:
本发明基于检索及文本表征,将原始无法进行融合,单独表征的多源知识,进行同意表征,并利用D-S证据理论,对异构知识置信度结果进行融合排序,利用相关度排序,可以为知识融合提供多元信息,实现异构知识的融合,提升了知识融合的效率及效果。
附图说明
图1是本发明一种基于D-S证据理论的电力异构知识融合的方法流程图;
图2是本发明实施例中采用BERT获取向量表征示例。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
如图1所示,本发明的一种基于D-S证据理论的电力异构知识融合的方法,包括以下步骤:
步骤1:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;
具体实施时,获取电力智能知识中心多种类型知识,包括本体知识Onto_data,三元组知识Triple_data,以及事件知识Event_data;
所述本体知识Onto_data={O1,O2,…,Oi,…,On},其中Oi为第i个本体知识;
所述三元组知识Triple_data={T1,T2,…,Ti,…,Tn},其中Ti为第i个三元组知识;
所述事件知识Event_data={E1,E2,…,Ei,…,En},其中Ei为第i个事件知识。
步骤2:对单个输入知识K,即查询语句K,例如查询语句“江苏省阶梯电价计算方式”,利用BM25分别从步骤1的本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;
具体实施时,对单个输入知识K,利用BM25分别从步骤1的本体知识Onto_data、三元组知识Triple_data以及事件知识Event_data中检索出最优的M个知识候选集,得到:
本体知识候选集Onto_dataK={OK1,OK2,…,OKj,…,OKm};
其中,OKj为输入知识K对应的第j个本体知识;
三元组知识候选集Triple_dataK={TK1,TK2,…,TKj,…,TKm};
其中,TKj为输入知识K对应的第j个三元组知识;
事件知识候选集Event_dataK={EK1,EK2,…,EKj,…,EKm};
其中,EKj为输入知识K对应的第j个事件知识。
步骤2具体包括:
步骤2.1:利用BM25算法分别计算本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score;
步骤2.1中,公式如公式(1)、公式(2)、公式(3)所示。
Figure BDA0003389382370000071
Figure BDA0003389382370000072
Figure BDA0003389382370000073
其中,fOdj为本体知识中信息特征fOd的第j个元素;即本体知识中每个信息特征fOd的一个元素;
fTdj为三元组知识中信息特征fTd的第j个元素;
fEdj为事件知识中信息特征fEd的第j个元素;
Kk为输入的单条知识中第k个词;
Wk为Kk的权重;
fdj来代表fd中每个信息特征的第j个元素;
fd来代表三种知识类型的信息特征集合;
n为输入的知识K中词的个数。
R(fOdj,qk)为Kk与电力本体知识fOdj的相关性分数,如表1所示;
表1 Kk与电力本体知识fOdj的相关性分数示例
Figure BDA0003389382370000074
R(fTdj,qk)为Kk与电力三元组知识fTdj的相关性分数,如表2所示;
表2 Kk与电力三元组知识fTdj的相关性分数示例
Figure BDA0003389382370000075
Figure BDA0003389382370000081
R(fEdj,qk)为Kk与电力事件知识fEdj的相关性分数,如表3所示;
表3 Kk与电力事件知识fEdj的相关性分数示例
Figure BDA0003389382370000082
Figure BDA0003389382370000083
其中,N表示fd列表中的所有元素的个数,dfd表示包含词汇Kk的元素的个数。
Kk与电力存储知识fdj的相关性分数R(fdj,qk)的计算公式为:
Figure BDA0003389382370000084
Figure BDA0003389382370000085
进一步的,k1、k2和b是调协因子,一般分别设为2,1,0.75;
Xk表示单体知识K中词汇Kk在相应知识fd列表中出现的次数;例如针对K“江苏省阶梯电价计算方式”中词汇Kk“阶梯电价”,在三元组知识<电价政策,包含,阶梯电价>中出现次数为1;
Yk表示词汇Kk在查询语句K中出现的次数;
lj为单个知识fdj的长度,avg_lj为fd所有知识fdj的平均长度。
例如三元组知识<电价政策,包含,阶梯电价>的长度为10。
步骤2.2:对步骤2.1得到的相似程度score在本知识内进行排序,选取相似程度score最高的M个相应知识,分别构成本体知识候选集Onto_dataK、三元组知识候选集Triple_dataK、事件知识候选集Event_dataK。相关示例如表4所示。
表4筛选得到的本体知识候选集、三元组知识候选集、事件知识候选集示例
Figure BDA0003389382370000086
Figure BDA0003389382370000091
步骤3:分别计算步骤2得到的知识候选集中每个知识的置信度,具体的:
计算本体知识候选集Onto_dataK每个本体知识OKj的置信度POkj,计算公式如公式(7)所示:
Figure BDA0003389382370000092
其中,K为输入的单条知识,OKj为本体知识候选集Onto_dataK中的第j个本体知识,KVec为单条知识对应的向量表征,OKjVec为本体知识OKj对应的向量表征;
向量表征的方式,采用基于预训练语言模型的方法获取向量表征,进一步的,本发明具体实施时,采用BERT获取向量表征,例如:针对单条知识K“<绕组电阻,测量方法,直流测试方式>”,
如图2所示,采用基于BERT的文本表征方法,其中采用
Figure BDA0003389382370000093
作为输入的单条知识K的向量表征,即KVec;同理,可以获得单个本体知识OKj的向量表征OKjVec。
例如单条知识“<电力电阻,测试方法,直流测试>”
计算后得到POkj为0.6586。
计算三元组知识候选集Triple_dataK中每个三元组知识TKj的置信度PTkj,计算公式(8)所示:
Figure BDA0003389382370000094
其中,K为输入的单条知识,TKj为三元组知识候选集Triple_dataK中第j个三元组知识,同样采用基于预训练BERT的文本表征方法获取相应知识的向量表征,KVec为单条知识对应的向量表征,TKjVec为三元组知识TKj对应的向量表征。
计算事件知识候选集Event_dataK中每个事件知识EKj的置信度PEkj,计算公式如公式(9)所示:
Figure BDA0003389382370000101
其中,K为输入的单条知识,EKj为事件知识候选集Event_dataK中第j个事件知识,同样采用基于预训练BERT的文本表征方法获取相应知识的向量表征,KVec为单条知识对应的向量表征,EKjVec为事件知识EKj对应的向量表征。
步骤4:基于步骤3计算得到的置信度,利用D-S证据理论融合计算出候选集中每一知识的融合置信度;
即基于步骤3计算出的每个本体知识OKj置信度POKj、三元组知识TKj的置信度PTKj以及事件知识EKj的置信度PEkj,利用D-S证据理论得到每个本体知识OKj基于D-S证据理论的融合置信度M-POKj、三元组知识TKj基于D-S证据理论的融合置信度M-PTKj以及事件知识EKj基于D-S证据理论的置信度M-PEKj,利用D-S证据理论融合计算出知识K的融合置信度M-PK,具体的:
步骤4.1:设置置信度评分区间和等级:
1)高等:[0.75,1.0]
2)中等:[0.25,0.75]
3)低等:[0,0.25]
步骤4.2:基于D-S证据理论设置用于置信度评分计算的Dempster合成规则;
1)D-S证据理论识别框架:
假设Θ为变量x所有取值的值集合,Θ={θ1,θ2,...,θn},集合Θ中的每个元素之间时互斥的,在任何时刻x只能赋予集合Θ中的一个元素值,那么Θ就被称作为x的样本空间,或者成为识别框架。
在证据理论中,识别框架任何一个子集A都对应于一个关于x的命题。因此,关于x命题的可靠程度由其对应的识别框架Θ中的子集A所取决。
在本发明中,命题x及为输入的单条知识K,Θ为知识库中每个知识与单条数据知识K的置信度,子集A则表示步骤3中获取得到的每个相关知识的类型,A={本体知识候选集Onto_dataK,三元组知识候选集Triple_dataK,事件知识候选集Event_dataK}。
2)设置用于置信度评分计算的Dempster合成规则;
Dempster合成规则为:
Figure BDA0003389382370000111
其中,Sv表示知识Kj第v种类型候选集的置信度得分,v=1,2,3,分别表示本体知识、三元组知识和事件知识类型候选集的置信度评分;
n表示第v种类型知识候选集中的除知识Kj外的知识的数目;
PKj表示知识Kj的置信度;
Figure BDA0003389382370000113
表示第v种类型知识候选集中知识Ki的置信度,知识Ki为第v种类型知识候选集中除知识Kj外的知识。
步骤4.3:根据步骤3的置信度,采用步骤4.2的Dempster合成规则计算每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分;
步骤4.4:确定每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分这三个评分值所在的评分区间,得到这三个评分值的权重,结合权重进行这三个评分值叠加,得到该知识基于D-S证据理论的融合置信度。
步骤4.4中,评分值属于高等、中等、低等评分区间时,分别对评分值分配权重θ,μ,ω,其中,θ,μ,ω预先设定。
具体实施时,融合置信度可分为每个本体知识OKj的融合置信度M-POKj三元组知识TKj的融合置信度M-PTKj以及事件知识EKj的融合置信度M-PEKj,如表5所示。
表5基于D-S证据理论的融合置信度M-PK示例
Figure BDA0003389382370000112
Figure BDA0003389382370000121
步骤5:对步骤4中获得的融合置信度从大到小进行排序,得到最终结果。
例如表5中,与知识K江苏省阶梯电价计算方式最相关的知识为三元组知识<电价政策,包含,阶梯电价>。
综上所述,本发明基于检索及文本表征,利用D-S证据理论,对异构知识置信度结果进行融合排序,实现异构知识的融合,提升了知识融合的效率及效果。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (12)

1.一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
所述方法包括以下步骤:
步骤1:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;
步骤2:对单个输入知识K,即查询语句K,利用BM25分别从步骤1的本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;
步骤3:分别计算步骤2得到的知识候选集中每个知识的置信度;
步骤4:基于步骤3计算得到的置信度,利用D-S证据理论融合计算出候选集中每一知识的融合置信度;
步骤5:对步骤4得到的融合置信度进行排序,筛选得到与查询语句K最相关的知识。
2.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤1中,获取电力智能知识中心多种类型知识,包括本体知识Onto_data,三元组知识Triple_data,以及事件知识Event_data;
所述本体知识Onto_data={O1,O2,…,Oi,…,On},其中Oi为第i个本体知识;
所述三元组知识Triple_data={T1,T2,…,Ti,…,Tn},其中Ti为第i个三元组知识;
所述事件知识Event_data={E1,E2,…,Ei,…,En},其中Ei为第i个事件知识;
n为每类知识中的知识数量。
3.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤2中,对单个输入知识K,利用BM25分别从步骤1的本体知识Onto_data、三元组知识Triple_data以及事件知识Event_data中检索出最优的M个知识候选集,得到:
本体知识候选集Onto_dataK={OK1,OK2,…,OKj,…,OKm};
其中,OKj为输入知识K对应的第j个本体知识;
三元组知识候选集Triple_dataK={TK1,TK2,…,TKj,…,TKm};
其中,TKj为输入知识K对应的第j个三元组知识;
事件知识候选集Event_dataK={EK1,EK2,…,EKj,…,EKm};
其中,EKj为输入知识K对应的第j个事件知识;
m为每个候选集中的知识数量。
4.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤2具体包括:
步骤2.1:利用BM25算法分别计算本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score;
步骤2.2:对步骤2.1得到的相似程度score在本知识内进行排序,选取相似程度score最高的M个相应知识,分别构成本体知识候选集Onto_dataK、三元组知识候选集Triple_dataK、事件知识候选集Event_dataK
5.根据权利要求4所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤2.1中,本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score的计算公式分别为公式(1)、公式(2)、公式(3)
Figure FDA0003389382360000021
Figure FDA0003389382360000022
Figure FDA0003389382360000023
其中,fOdj为本体知识中信息特征fOd的第j个元素;
fTdj为三元组知识中信息特征fTd的第j个元素;
fEdj为事件知识中信息特征fEd的第j个元素;
Kk为输入的单条知识中第k个词;
Wk为Kk的权重;
R(fOdj,qk)为Kk与电力本体知识fOdj的相关性分数;
R(fTdj,qk)为Kk与电力三元组知识fTdj的相关性分数;
R(fEdj,qk)为Kk与电力事件知识fEdj的相关性分数;
fdj来代表fd中每个信息特征的第j个元素;
fd来代表三种知识类型的信息特征集合;
n为输入的知识K中词的个数。
6.根据权利要求5所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
Kk的权重Wk的计算公式为:
Figure FDA0003389382360000031
Kk与电力存储知识fdj的相关性分数R(fdj,qk)的计算公式为:
Figure FDA0003389382360000032
Figure FDA0003389382360000033
其中,k1、k2和b是调协因子;
Xk表示单体知识K中词汇Kk在fd中出现的次数;
Yk表示词汇Kk在输入的知识K中出现的次数;
lj为单个知识fdj的长度,avg_lj为fd所有知识fdj的平均长度。
7.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤3中,计算本体知识候选集Onto_dataK每个本体知识的置信度,第j个本体知识OKj的置信度POkj计算公式为:
Figure FDA0003389382360000034
其中,KVec为单条知识对应的向量表征,OKjVec为本体知识OKj对应的向量表征;
计算三元组知识候选集Triple_dataK中每个三元组知识的置信度,第j个三元组知识TKj的置信度PTkj计算为:
Figure FDA0003389382360000041
其中,TKjVec为三元组知识TKj对应的向量表征;
计算事件知识候选集Event_dataK中每个事件知识的置信度,第j个事件知识EKj的置信度PEkj计算公式为:
Figure FDA0003389382360000042
其中,EKjVec为事件知识EKj对应的向量表征。
8.根据权利要求7所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤3中,采用基于预训练语言模型的方法获取向量表征。
9.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤4具体包括:
步骤4.1:设置置信度评分区间和等级;
步骤4.2:基于D-S证据理论设置用于置信度评分计算的Dempster合成规则;
步骤4.3:根据步骤3的置信度,采用步骤4.2的Dempster合成规则计算每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分;
步骤4.4:确定每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分这三个评分值所在的评分区间,得到这三个评分值的权重,结合权重进行这三个评分值叠加,得到该知识基于D-S证据理论的融合置信度。
10.根据权利要求9所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤4.1:设置如下置信度评分区间和等级:
1)高等:[0.75,1.0]
2)中等:[0.25,0.75]
3)低等:[0,0.25]。
11.根据权利要求9所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤4.2中设置用于置信度评分计算的Dempster合成规则为:
Figure FDA0003389382360000051
其中,Sv表示知识Kj第v种类型候选集的置信度得分,v=1,2,3,分别表示本体知识、三元组知识和事件知识类型候选集的置信度评分;
n表示第v种类型知识候选集中除知识Kj外的知识的数目;
PKj表示知识Kj的置信度;
Figure FDA0003389382360000052
表示第v种类型知识候选集中知识Ki的置信度,知识Ki为第v种类型知识候选集中除知识Kj外的知识。
12.根据权利要求10所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤4.4中,评分值属于高等、中等、低等评分区间时,分别对评分值分配权重θ,μ,ω,其中,θ,μ,ω预先设定。
CN202111463105.7A 2021-12-02 2021-12-02 一种基于d-s证据理论的电力异构知识融合的方法 Pending CN114117078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111463105.7A CN114117078A (zh) 2021-12-02 2021-12-02 一种基于d-s证据理论的电力异构知识融合的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111463105.7A CN114117078A (zh) 2021-12-02 2021-12-02 一种基于d-s证据理论的电力异构知识融合的方法

Publications (1)

Publication Number Publication Date
CN114117078A true CN114117078A (zh) 2022-03-01

Family

ID=80366225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111463105.7A Pending CN114117078A (zh) 2021-12-02 2021-12-02 一种基于d-s证据理论的电力异构知识融合的方法

Country Status (1)

Country Link
CN (1) CN114117078A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115166748A (zh) * 2022-07-08 2022-10-11 上海埃威航空电子有限公司 一种基于信息融合的飞行目标识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115166748A (zh) * 2022-07-08 2022-10-11 上海埃威航空电子有限公司 一种基于信息融合的飞行目标识别方法

Similar Documents

Publication Publication Date Title
CN109492101B (zh) 基于标签信息与文本特征的文本分类方法、系统及介质
CN110968699B (zh) 一种基于事理推荐的逻辑图谱构建及预警方法和装置
CN107291783B (zh) 一种语义匹配方法及智能设备
EP2192500B1 (en) System and method for providing robust topic identification in social indexes
CN109815336B (zh) 一种文本聚合方法及系统
CN108363790A (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN111538824A (zh) 一种基于bert的智能问答实现方法及系统
CN110232395A (zh) 一种基于故障中文文本的电力系统故障诊断方法
CN107180084A (zh) 词库更新方法及装置
CN112182249B (zh) 针对航空安全报告的自动分类方法和装置
CN112650886A (zh) 基于跨模态动态卷积网络的跨模态视频时刻检索方法
CN110046264A (zh) 一种面向手机文档的自动分类方法
CN111506732A (zh) 一种文本多层次标签分类方法
CN112256866A (zh) 一种基于深度学习的文本细粒度情感分析方法
CN116089873A (zh) 模型训练方法、数据分类分级方法、装置、设备及介质
Das et al. Diving deep into modes of fact hallucinations in dialogue systems
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
Zhang et al. Research on feature fusion speech emotion recognition technology for smart teaching
CN114117078A (zh) 一种基于d-s证据理论的电力异构知识融合的方法
CN114817454A (zh) 一种结合信息量和BERT-BiLSTM-CRF的NLP知识图谱构建方法
CN111859910B (zh) 一种用于语义角色识别的融合位置信息的词特征表示方法
Wang et al. Weakly Supervised Chinese short text classification algorithm based on ConWea model
Li et al. Attention-based LSTM-CNNs for uncertainty identification on Chinese social media texts
Yang et al. Hierarchical dialog state tracking with unknown slot values
CN111046191A (zh) 一种电力领域语义增强方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination