CN114117078A - 一种基于d-s证据理论的电力异构知识融合的方法 - Google Patents
一种基于d-s证据理论的电力异构知识融合的方法 Download PDFInfo
- Publication number
- CN114117078A CN114117078A CN202111463105.7A CN202111463105A CN114117078A CN 114117078 A CN114117078 A CN 114117078A CN 202111463105 A CN202111463105 A CN 202111463105A CN 114117078 A CN114117078 A CN 114117078A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- triple
- event
- confidence
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007500 overflow downdraw method Methods 0.000 title description 3
- 230000004927 fusion Effects 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012163 sequencing technique Methods 0.000 claims abstract description 8
- 238000012216 screening Methods 0.000 claims abstract description 3
- 238000004364 calculation method Methods 0.000 claims description 25
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- PXUQTDZNOHRWLI-OXUVVOBNSA-O malvidin 3-O-beta-D-glucoside Chemical compound COC1=C(O)C(OC)=CC(C=2C(=CC=3C(O)=CC(O)=CC=3[O+]=2)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)=C1 PXUQTDZNOHRWLI-OXUVVOBNSA-O 0.000 claims description 3
- 239000000178 monomer Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 230000005611 electricity Effects 0.000 description 9
- 238000012512 characterization method Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Water Supply & Treatment (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于D‑S证据理论的电力异构知识融合的方法,包括:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;对单个输入知识K,利用BM25分别从本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;分别计算知识候选集中每个知识的置信度;基于置信度,利用D‑S证据理论融合计算出候选集中每一知识的融合置信度;对融合置信度进行排序,筛选得到与查询语句K最相关的知识。本发明基于检索及文本表征,利用D‑S证据理论,对异构知识置信度结果进行融合排序,实现异构知识的融合,提升了知识融合的效率及效果。
Description
技术领域
本发明属于电力知识融合技术领域,涉及一种基于D-S证据理论的电力异构知识融合的方法。
背景技术
由于人类知识的复杂性、开放性、多样性,同时具有巨大的规模,需要大规模常识知识库来支撑类人推理和自然语言理解。但是,知识图谱中的知识来源广泛,多源异构的知识之间会存在重复、语义多样、质量参差不齐等问题,需要进行冲突检测、实体消歧、实体对齐等操作,将多种来源的知识有机融合在一起,形成高质量知识图谱。
传统的知识融合技术大多仅针对单种知识类型的进行融合,对于异构知识的融合方案相对交少,
D-S证据理论起源于20世纪60年代的哈佛大学数学家A.P.Dempster利用上、下限概率解决多值映射问题,1967年他起连续发表一系列论文,标志着证据理论的正式诞生。而后Dempster的学生G.shafer对证据理论做了进一步研究,引入信任函数概念,形成了一套“证据”和“组合”来处理不确定性推理的数学方法从而形成了该理论,利用D-S证据理论对电力异构知识进行融合,可有效提升知识融合的整理效率。
发明内容
为解决现有技术中的不足,本申请提供一种基于D-S证据理论的电力异构知识融合的方法。
为了实现上述目标,本发明采用如下技术方案:
一种基于D-S证据理论的电力异构知识融合的方法,包括以下步骤:
步骤1:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;
步骤2:对单个输入知识K,即查询语句K,利用BM25分别从步骤1的本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;
步骤3:分别计算步骤2得到的知识候选集中每个知识的置信度;
步骤4:基于步骤3计算得到的置信度,利用D-S证据理论融合计算出候选集中每一知识的融合置信度;
步骤5:对步骤4得到的融合置信度进行排序,筛选得到与查询语句K最相关的知识。
本发明进一步包括以下优选方案:
优选地,步骤1中,获取电力智能知识中心多种类型知识,包括本体知识Onto_data,三元组知识Triple_data,以及事件知识Event_data;
所述本体知识Onto_data={O1,O2,…,Oi,…,On},其中Oi为第i个本体知识;
所述三元组知识Triple_data={T1,T2,…,Ti,…,Tn},其中Ti为第i个三元组知识;
所述事件知识Event_data={E1,E2,…,Ei,…,En},其中Ei为第i个事件知识;
n为每类知识中的知识数量。
优选地,步骤2中,对单个输入知识K,利用BM25分别从步骤1的本体知识Onto_data、三元组知识Triple_data以及事件知识Event_data中检索出最优的M个知识候选集,得到:
本体知识候选集Onto_dataK={OK1,OK2,…,OKj,…,OKm};
其中,OKj为输入知识K对应的第j个本体知识;
三元组知识候选集Triple_dataK={TK1,TK2,…,TKj,…,TKm};
其中,TKj为输入知识K对应的第j个三元组知识;
事件知识候选集Event_dataK={EK1,EK2,…,EKj,…,EKm};
其中,EKj为输入知识K对应的第j个事件知识;
m为每个候选集中的知识数量。
优选地,步骤2具体包括:
步骤2.1:利用BM25算法分别计算本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score;
步骤2.2:对步骤2.1得到的相似程度score在本知识内进行排序,选取相似程度score最高的M个相应知识,分别构成本体知识候选集Onto_dataK、三元组知识候选集Triple_dataK、事件知识候选集Event_dataK。
优选地,步骤2.1中,本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score的计算公式分别为公式(1)、公式(2)、公式(3)
其中,fOdj为本体知识中信息特征fOd的第j个元素;
fTdj为三元组知识中信息特征fTd的第j个元素;
fEdj为事件知识中信息特征fEd的第j个元素;
Kk为输入的单条知识中第k个词;
Wk为Kk的权重;
R(fOdj,qk)为Kk与电力本体知识fOdj的相关性分数;
R(fTdj,qk)为Kk与电力三元组知识fTdj的相关性分数;
R(fEdj,qk)为Kk与电力事件知识fEdj的相关性分数;
fdj来代表fd中每个信息特征的第j个元素;
fd来代表三种知识类型的信息特征集合;
n为输入的知识K中词的个数。
优选地,Kk的权重Wk的计算公式为:
Kk与电力存储知识fdj的相关性分数R(fdj,qk)的计算公式为:
其中,k1、k2和b是调协因子;
Xk表示单体知识K中词汇Kk在fd中出现的次数;
Yk表示词汇Kk在输入的知识K中出现的次数;
lj为单个知识fdj的长度,avg_lj为fd所有知识fdj的平均长度。
优选地,步骤3中,计算本体知识候选集Onto_dataK每个本体知识的置信度,第j个本体知识OKj的置信度Pokj计算公式为:
其中,KVec为单条知识对应的向量表征,OKjVec为本体知识OKj对应的向量表征;
计算三元组知识候选集Triple_dataK中每个三元组知识的置信度,第j个三元组知识TKj的置信度PTkj计算为:
其中,TKjVec为三元组知识TKj对应的向量表征;
计算事件知识候选集Event_dataK中每个事件知识的置信度,第j个事件知识EKj的置信度PEkj计算公式为:
其中,EKjVec为事件知识EKj对应的向量表征。
优选地,步骤3中,采用基于预训练语言模型的方法获取向量表征。
优选地,步骤4具体包括:
步骤4.1:设置置信度评分区间和等级;
步骤4.2:基于D-S证据理论设置用于置信度评分计算的Dempster合成规则;
步骤4.3:根据步骤3的置信度,采用步骤4.2的Dempster合成规则计算每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分;
步骤4.4:确定每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分这三个评分值所在的评分区间,得到这三个评分值的权重,结合权重进行这三个评分值叠加,得到该知识基于D-S证据理论的融合置信度。
优选地,步骤4.1:设置如下置信度评分区间和等级:
1)高等:[0.75,1.0]
2)中等:[0.25,0.75]
3)低等:[0,0.25]。
优选地,步骤4.2中设置用于置信度评分计算的Dempster合成规则为:
其中,Sv表示知识Kj第v种类型候选集的置信度得分,v=1,2,3,分别表示本体知识、三元组知识和事件知识类型候选集的置信度评分;
n表示第v种类型知识候选集中除知识Kj外的知识的数目;
PKj表示知识Kj的置信度;
优选地,步骤4.4中,评分值属于高等、中等、低等评分区间时,分别对评分值分配权重θ,μ,ω,其中,θ,μ,ω预先设定。
本申请所达到的有益效果:
本发明基于检索及文本表征,将原始无法进行融合,单独表征的多源知识,进行同意表征,并利用D-S证据理论,对异构知识置信度结果进行融合排序,利用相关度排序,可以为知识融合提供多元信息,实现异构知识的融合,提升了知识融合的效率及效果。
附图说明
图1是本发明一种基于D-S证据理论的电力异构知识融合的方法流程图;
图2是本发明实施例中采用BERT获取向量表征示例。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
如图1所示,本发明的一种基于D-S证据理论的电力异构知识融合的方法,包括以下步骤:
步骤1:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;
具体实施时,获取电力智能知识中心多种类型知识,包括本体知识Onto_data,三元组知识Triple_data,以及事件知识Event_data;
所述本体知识Onto_data={O1,O2,…,Oi,…,On},其中Oi为第i个本体知识;
所述三元组知识Triple_data={T1,T2,…,Ti,…,Tn},其中Ti为第i个三元组知识;
所述事件知识Event_data={E1,E2,…,Ei,…,En},其中Ei为第i个事件知识。
步骤2:对单个输入知识K,即查询语句K,例如查询语句“江苏省阶梯电价计算方式”,利用BM25分别从步骤1的本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;
具体实施时,对单个输入知识K,利用BM25分别从步骤1的本体知识Onto_data、三元组知识Triple_data以及事件知识Event_data中检索出最优的M个知识候选集,得到:
本体知识候选集Onto_dataK={OK1,OK2,…,OKj,…,OKm};
其中,OKj为输入知识K对应的第j个本体知识;
三元组知识候选集Triple_dataK={TK1,TK2,…,TKj,…,TKm};
其中,TKj为输入知识K对应的第j个三元组知识;
事件知识候选集Event_dataK={EK1,EK2,…,EKj,…,EKm};
其中,EKj为输入知识K对应的第j个事件知识。
步骤2具体包括:
步骤2.1:利用BM25算法分别计算本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score;
步骤2.1中,公式如公式(1)、公式(2)、公式(3)所示。
其中,fOdj为本体知识中信息特征fOd的第j个元素;即本体知识中每个信息特征fOd的一个元素;
fTdj为三元组知识中信息特征fTd的第j个元素;
fEdj为事件知识中信息特征fEd的第j个元素;
Kk为输入的单条知识中第k个词;
Wk为Kk的权重;
fdj来代表fd中每个信息特征的第j个元素;
fd来代表三种知识类型的信息特征集合;
n为输入的知识K中词的个数。
R(fOdj,qk)为Kk与电力本体知识fOdj的相关性分数,如表1所示;
表1 Kk与电力本体知识fOdj的相关性分数示例
R(fTdj,qk)为Kk与电力三元组知识fTdj的相关性分数,如表2所示;
表2 Kk与电力三元组知识fTdj的相关性分数示例
R(fEdj,qk)为Kk与电力事件知识fEdj的相关性分数,如表3所示;
表3 Kk与电力事件知识fEdj的相关性分数示例
其中,N表示fd列表中的所有元素的个数,dfd表示包含词汇Kk的元素的个数。
Kk与电力存储知识fdj的相关性分数R(fdj,qk)的计算公式为:
进一步的,k1、k2和b是调协因子,一般分别设为2,1,0.75;
Xk表示单体知识K中词汇Kk在相应知识fd列表中出现的次数;例如针对K“江苏省阶梯电价计算方式”中词汇Kk“阶梯电价”,在三元组知识<电价政策,包含,阶梯电价>中出现次数为1;
Yk表示词汇Kk在查询语句K中出现的次数;
lj为单个知识fdj的长度,avg_lj为fd所有知识fdj的平均长度。
例如三元组知识<电价政策,包含,阶梯电价>的长度为10。
步骤2.2:对步骤2.1得到的相似程度score在本知识内进行排序,选取相似程度score最高的M个相应知识,分别构成本体知识候选集Onto_dataK、三元组知识候选集Triple_dataK、事件知识候选集Event_dataK。相关示例如表4所示。
表4筛选得到的本体知识候选集、三元组知识候选集、事件知识候选集示例
步骤3:分别计算步骤2得到的知识候选集中每个知识的置信度,具体的:
计算本体知识候选集Onto_dataK每个本体知识OKj的置信度POkj,计算公式如公式(7)所示:
其中,K为输入的单条知识,OKj为本体知识候选集Onto_dataK中的第j个本体知识,KVec为单条知识对应的向量表征,OKjVec为本体知识OKj对应的向量表征;
向量表征的方式,采用基于预训练语言模型的方法获取向量表征,进一步的,本发明具体实施时,采用BERT获取向量表征,例如:针对单条知识K“<绕组电阻,测量方法,直流测试方式>”,
例如单条知识“<电力电阻,测试方法,直流测试>”
计算后得到POkj为0.6586。
计算三元组知识候选集Triple_dataK中每个三元组知识TKj的置信度PTkj,计算公式(8)所示:
其中,K为输入的单条知识,TKj为三元组知识候选集Triple_dataK中第j个三元组知识,同样采用基于预训练BERT的文本表征方法获取相应知识的向量表征,KVec为单条知识对应的向量表征,TKjVec为三元组知识TKj对应的向量表征。
计算事件知识候选集Event_dataK中每个事件知识EKj的置信度PEkj,计算公式如公式(9)所示:
其中,K为输入的单条知识,EKj为事件知识候选集Event_dataK中第j个事件知识,同样采用基于预训练BERT的文本表征方法获取相应知识的向量表征,KVec为单条知识对应的向量表征,EKjVec为事件知识EKj对应的向量表征。
步骤4:基于步骤3计算得到的置信度,利用D-S证据理论融合计算出候选集中每一知识的融合置信度;
即基于步骤3计算出的每个本体知识OKj置信度POKj、三元组知识TKj的置信度PTKj以及事件知识EKj的置信度PEkj,利用D-S证据理论得到每个本体知识OKj基于D-S证据理论的融合置信度M-POKj、三元组知识TKj基于D-S证据理论的融合置信度M-PTKj以及事件知识EKj基于D-S证据理论的置信度M-PEKj,利用D-S证据理论融合计算出知识K的融合置信度M-PK,具体的:
步骤4.1:设置置信度评分区间和等级:
1)高等:[0.75,1.0]
2)中等:[0.25,0.75]
3)低等:[0,0.25]
步骤4.2:基于D-S证据理论设置用于置信度评分计算的Dempster合成规则;
1)D-S证据理论识别框架:
假设Θ为变量x所有取值的值集合,Θ={θ1,θ2,...,θn},集合Θ中的每个元素之间时互斥的,在任何时刻x只能赋予集合Θ中的一个元素值,那么Θ就被称作为x的样本空间,或者成为识别框架。
在证据理论中,识别框架任何一个子集A都对应于一个关于x的命题。因此,关于x命题的可靠程度由其对应的识别框架Θ中的子集A所取决。
在本发明中,命题x及为输入的单条知识K,Θ为知识库中每个知识与单条数据知识K的置信度,子集A则表示步骤3中获取得到的每个相关知识的类型,A={本体知识候选集Onto_dataK,三元组知识候选集Triple_dataK,事件知识候选集Event_dataK}。
2)设置用于置信度评分计算的Dempster合成规则;
Dempster合成规则为:
其中,Sv表示知识Kj第v种类型候选集的置信度得分,v=1,2,3,分别表示本体知识、三元组知识和事件知识类型候选集的置信度评分;
n表示第v种类型知识候选集中的除知识Kj外的知识的数目;
PKj表示知识Kj的置信度;
步骤4.3:根据步骤3的置信度,采用步骤4.2的Dempster合成规则计算每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分;
步骤4.4:确定每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分这三个评分值所在的评分区间,得到这三个评分值的权重,结合权重进行这三个评分值叠加,得到该知识基于D-S证据理论的融合置信度。
步骤4.4中,评分值属于高等、中等、低等评分区间时,分别对评分值分配权重θ,μ,ω,其中,θ,μ,ω预先设定。
具体实施时,融合置信度可分为每个本体知识OKj的融合置信度M-POKj三元组知识TKj的融合置信度M-PTKj以及事件知识EKj的融合置信度M-PEKj,如表5所示。
表5基于D-S证据理论的融合置信度M-PK示例
步骤5:对步骤4中获得的融合置信度从大到小进行排序,得到最终结果。
例如表5中,与知识K江苏省阶梯电价计算方式最相关的知识为三元组知识<电价政策,包含,阶梯电价>。
综上所述,本发明基于检索及文本表征,利用D-S证据理论,对异构知识置信度结果进行融合排序,实现异构知识的融合,提升了知识融合的效率及效果。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (12)
1.一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
所述方法包括以下步骤:
步骤1:获取电力智能知识中心多种类型知识,包括本体知识、三元组知识以及事件知识;
步骤2:对单个输入知识K,即查询语句K,利用BM25分别从步骤1的本体知识、三元组知识、以及事件知识中检索出最优的M个知识候选集;
步骤3:分别计算步骤2得到的知识候选集中每个知识的置信度;
步骤4:基于步骤3计算得到的置信度,利用D-S证据理论融合计算出候选集中每一知识的融合置信度;
步骤5:对步骤4得到的融合置信度进行排序,筛选得到与查询语句K最相关的知识。
2.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤1中,获取电力智能知识中心多种类型知识,包括本体知识Onto_data,三元组知识Triple_data,以及事件知识Event_data;
所述本体知识Onto_data={O1,O2,…,Oi,…,On},其中Oi为第i个本体知识;
所述三元组知识Triple_data={T1,T2,…,Ti,…,Tn},其中Ti为第i个三元组知识;
所述事件知识Event_data={E1,E2,…,Ei,…,En},其中Ei为第i个事件知识;
n为每类知识中的知识数量。
3.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤2中,对单个输入知识K,利用BM25分别从步骤1的本体知识Onto_data、三元组知识Triple_data以及事件知识Event_data中检索出最优的M个知识候选集,得到:
本体知识候选集Onto_dataK={OK1,OK2,…,OKj,…,OKm};
其中,OKj为输入知识K对应的第j个本体知识;
三元组知识候选集Triple_dataK={TK1,TK2,…,TKj,…,TKm};
其中,TKj为输入知识K对应的第j个三元组知识;
事件知识候选集Event_dataK={EK1,EK2,…,EKj,…,EKm};
其中,EKj为输入知识K对应的第j个事件知识;
m为每个候选集中的知识数量。
4.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤2具体包括:
步骤2.1:利用BM25算法分别计算本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score;
步骤2.2:对步骤2.1得到的相似程度score在本知识内进行排序,选取相似程度score最高的M个相应知识,分别构成本体知识候选集Onto_dataK、三元组知识候选集Triple_dataK、事件知识候选集Event_dataK。
5.根据权利要求4所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤2.1中,本体知识Onto_data中每个信息特征fOd、三元组知识Triple_data中每个信息特征fTd以及事件知识Event_data中每个信息特征fEd与单个输入知识K的相似程度score的计算公式分别为公式(1)、公式(2)、公式(3)
其中,fOdj为本体知识中信息特征fOd的第j个元素;
fTdj为三元组知识中信息特征fTd的第j个元素;
fEdj为事件知识中信息特征fEd的第j个元素;
Kk为输入的单条知识中第k个词;
Wk为Kk的权重;
R(fOdj,qk)为Kk与电力本体知识fOdj的相关性分数;
R(fTdj,qk)为Kk与电力三元组知识fTdj的相关性分数;
R(fEdj,qk)为Kk与电力事件知识fEdj的相关性分数;
fdj来代表fd中每个信息特征的第j个元素;
fd来代表三种知识类型的信息特征集合;
n为输入的知识K中词的个数。
7.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤3中,计算本体知识候选集Onto_dataK每个本体知识的置信度,第j个本体知识OKj的置信度POkj计算公式为:
其中,KVec为单条知识对应的向量表征,OKjVec为本体知识OKj对应的向量表征;
计算三元组知识候选集Triple_dataK中每个三元组知识的置信度,第j个三元组知识TKj的置信度PTkj计算为:
其中,TKjVec为三元组知识TKj对应的向量表征;
计算事件知识候选集Event_dataK中每个事件知识的置信度,第j个事件知识EKj的置信度PEkj计算公式为:
其中,EKjVec为事件知识EKj对应的向量表征。
8.根据权利要求7所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤3中,采用基于预训练语言模型的方法获取向量表征。
9.根据权利要求1所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤4具体包括:
步骤4.1:设置置信度评分区间和等级;
步骤4.2:基于D-S证据理论设置用于置信度评分计算的Dempster合成规则;
步骤4.3:根据步骤3的置信度,采用步骤4.2的Dempster合成规则计算每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分;
步骤4.4:确定每一知识的本体知识候选集置信度评分、三元组知识候选集置信度评分置信度评分以及事件知识候选集置信度评分这三个评分值所在的评分区间,得到这三个评分值的权重,结合权重进行这三个评分值叠加,得到该知识基于D-S证据理论的融合置信度。
10.根据权利要求9所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤4.1:设置如下置信度评分区间和等级:
1)高等:[0.75,1.0]
2)中等:[0.25,0.75]
3)低等:[0,0.25]。
12.根据权利要求10所述的一种基于D-S证据理论的电力异构知识融合的方法,其特征在于:
步骤4.4中,评分值属于高等、中等、低等评分区间时,分别对评分值分配权重θ,μ,ω,其中,θ,μ,ω预先设定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111463105.7A CN114117078A (zh) | 2021-12-02 | 2021-12-02 | 一种基于d-s证据理论的电力异构知识融合的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111463105.7A CN114117078A (zh) | 2021-12-02 | 2021-12-02 | 一种基于d-s证据理论的电力异构知识融合的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114117078A true CN114117078A (zh) | 2022-03-01 |
Family
ID=80366225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111463105.7A Pending CN114117078A (zh) | 2021-12-02 | 2021-12-02 | 一种基于d-s证据理论的电力异构知识融合的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114117078A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115166748A (zh) * | 2022-07-08 | 2022-10-11 | 上海埃威航空电子有限公司 | 一种基于信息融合的飞行目标识别方法 |
-
2021
- 2021-12-02 CN CN202111463105.7A patent/CN114117078A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115166748A (zh) * | 2022-07-08 | 2022-10-11 | 上海埃威航空电子有限公司 | 一种基于信息融合的飞行目标识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492101B (zh) | 基于标签信息与文本特征的文本分类方法、系统及介质 | |
CN110968699B (zh) | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 | |
CN107291783B (zh) | 一种语义匹配方法及智能设备 | |
EP2192500B1 (en) | System and method for providing robust topic identification in social indexes | |
CN109815336B (zh) | 一种文本聚合方法及系统 | |
CN108363790A (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
CN111538824A (zh) | 一种基于bert的智能问答实现方法及系统 | |
CN110232395A (zh) | 一种基于故障中文文本的电力系统故障诊断方法 | |
CN107180084A (zh) | 词库更新方法及装置 | |
CN112182249B (zh) | 针对航空安全报告的自动分类方法和装置 | |
CN112650886A (zh) | 基于跨模态动态卷积网络的跨模态视频时刻检索方法 | |
CN110046264A (zh) | 一种面向手机文档的自动分类方法 | |
CN111506732A (zh) | 一种文本多层次标签分类方法 | |
CN112256866A (zh) | 一种基于深度学习的文本细粒度情感分析方法 | |
CN116089873A (zh) | 模型训练方法、数据分类分级方法、装置、设备及介质 | |
Das et al. | Diving deep into modes of fact hallucinations in dialogue systems | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
Zhang et al. | Research on feature fusion speech emotion recognition technology for smart teaching | |
CN114117078A (zh) | 一种基于d-s证据理论的电力异构知识融合的方法 | |
CN114817454A (zh) | 一种结合信息量和BERT-BiLSTM-CRF的NLP知识图谱构建方法 | |
CN111859910B (zh) | 一种用于语义角色识别的融合位置信息的词特征表示方法 | |
Wang et al. | Weakly Supervised Chinese short text classification algorithm based on ConWea model | |
Li et al. | Attention-based LSTM-CNNs for uncertainty identification on Chinese social media texts | |
Yang et al. | Hierarchical dialog state tracking with unknown slot values | |
CN111046191A (zh) | 一种电力领域语义增强方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |