CN111858958B - 基于隐空间邻域聚合的智能网联汽车产业图谱融合方法 - Google Patents
基于隐空间邻域聚合的智能网联汽车产业图谱融合方法 Download PDFInfo
- Publication number
- CN111858958B CN111858958B CN202010711346.8A CN202010711346A CN111858958B CN 111858958 B CN111858958 B CN 111858958B CN 202010711346 A CN202010711346 A CN 202010711346A CN 111858958 B CN111858958 B CN 111858958B
- Authority
- CN
- China
- Prior art keywords
- entity
- neighborhood
- hidden space
- information
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002776 aggregation Effects 0.000 title claims abstract description 22
- 238000004220 aggregation Methods 0.000 title claims abstract description 22
- 238000007500 overflow downdraw method Methods 0.000 title claims abstract description 16
- 230000006855 networking Effects 0.000 title description 2
- 230000004931 aggregating effect Effects 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 229910052739 hydrogen Inorganic materials 0.000 claims description 11
- 241000612182 Rexea solandri Species 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于门控隐空间邻域聚合的智能网联汽车产业图谱融合方法,基于智能网联汽车产业图谱,生成产业图谱隐空间(嵌入空间);然后基于产业图谱的原始拓扑结构产生实体的拓扑邻域,基于产业图谱的隐空间产生实体的隐空间邻域;接着产生中心实体在聚合拓扑邻域中的邻接实体信息后的拓扑邻域信息表示,产生中心实体在聚合隐空间邻域中的邻接实体信息后的隐空间邻域表示,产生包含拓扑邻域信息和隐空间邻域信息的实体嵌入表示;进一步在得到最后的实体嵌入表示之后,通过计算实体嵌入表示之间的余弦相似度产生实体的相似度矩阵;最后将实体对齐问题表示为经典的稳定匹配问题,并通过延迟接受算法去实现全局的实体对齐。
Description
技术领域
本发明属于知识图谱技术领域,具体涉及一种基于门控隐空间邻域聚合的智能网联汽车产业图谱融合方法,运用到深度学习与自然语言处理技术,为基于产业图谱的区域产业关联效应趋势预测研究提供支持。
背景技术
随着科技的发展,人工智能在人们的生活中无处不在,机器拥有智能的背后离不开知识图谱的支撑。构建湖北省智能网联汽车产业图谱,能够多视角地识别和预测产业内的企业重大风险、企业群集行为和企业群集事件的演化趋势,能够动态辨析产业间关联关系,实现区域产业关联效应发展趋势的有效测度。本发明专利主要是通过产业图谱内的实体对齐技术将湖北省智能网联汽车产业图谱内表示现实中同一对象的实体进行对齐融合,形成一个包含产业结构、产业分布、产业分工、产业内企业关系等因素的完整湖北省智能网联汽车产业图谱。
传统的实体对齐技术主要分为基于实体的标签信息和基于人工定义特征两类,但是随着深度学习的发展,传统方法逐渐出现劣势。目前基于深度学习的实体对齐技术主要采用嵌入表示的学习方法,将产业图谱映射到低维的向量空间中,图谱中三元组中的实体映射为向量空间中的一个点。在现行的实体对齐技术实现中,大多采用产业图谱内的拓扑结构信息,但是实体经常有异构的拓扑邻域结构,并且结构比较稀疏,达不到很好的效果。因此在实体对齐的过程中,引入实体的隐空间邻域信息,聚合远距离邻居的有益信息,能够缓解拓扑邻域结构的异构,对于产业图谱内的实体对齐融合非常重要。
发明内容:
为了解决背景技术中存在的不足,本发明提供了一种基于门控隐空间邻域聚合的智能网联汽车产业图谱融合方法。
本发明所采用的技术方案是:一种基于门控隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于,包括以下步骤:
步骤1:基于构建的智能网联汽车产业图谱,将产业图谱内实体、关系向量化,生成产业图谱隐空间;
步骤2:基于产业图谱的原始拓扑结构产生实体的拓扑邻域,基于产业图谱的隐空间产生实体的隐空间邻域;
步骤3:在原产业图谱的拓扑结构中,通过聚合中心实体在拓扑邻域中的邻接实体信息,产生中心实体在聚合拓扑邻域中的邻接实体信息后的拓扑邻域信息表示;
步骤4:在产业图谱隐空间中,通过聚合中心实体的在隐空间邻域中的邻接实体信息,产生中心实体在聚合隐空间邻域中的邻接实体信息后的隐空间邻域表示;
步骤5:在生成中心实体的拓扑邻域信息表示和隐空间邻域信息表示后,通过门控机制对中心实体的隐空间邻域信息和拓扑邻域信息进行聚合,产生包含拓扑邻域信息和隐空间邻域信息的实体嵌入表示;
步骤6:在得到最后的实体嵌入表示之后,通过计算实体嵌入表示之间的余弦相似度产生实体的相似度矩阵;
步骤7:为了制定全局的实体对齐决策,将实体对齐问题表示为经典的稳定匹配问题,并实现集体的实体对齐。
进一步的,步骤1中基于初步构建的湖北省智能网联汽车产业图谱,利用图谱嵌入模型HAKE将产业图谱映射到一个低维的向量空间,生成产业图谱的隐空间(嵌入空间),得到实体、关系的嵌入表示。
进一步的,步骤2中基于产业图谱的原始拓扑结构,通过中心实体的一跳邻居集合{e1,...,en}产生中心实体的拓扑邻域NT(u),在利用图谱嵌入模型HAKE得到产业图谱的嵌入空间之后,通过在嵌入空间中计算中心实体向量表示和其他实体的向量表示之间的相似度,如果相似度大于给定的阈值,则它是中心实体在隐空间中的邻接实体,从而产生中心实体的隐空间邻域NH(u)。
进一步的,步骤3中在原产业图谱的拓扑结构中,利用vanilla GCN去聚合中心实体在拓扑邻域中的邻接实体ej,T∈NT(u)的信息,vanilla GCN的层数为l,它的最后一层的输出hi,T就是中心实体ei在聚合拓扑邻域中的邻接实体信息后的拓扑邻域信息嵌入表示。
进一步的,步骤4中通过产业图谱嵌入模型HAKE产生隐空间后,利用vanilla GCN去聚合中心实体在隐空间邻域中的邻接实体ej,H∈NH(u)的信息,vanilla GCN的层数为l,它的最后一层的输出hi,H就是中心实体ei在聚合隐空间邻域中的邻接实体信息后的拓扑邻域信息嵌入表示。
进一步的,步骤5中通过vanilla GCN对实体邻域信息的聚合,分别得到了中心实体的拓扑邻域信息嵌入表示hi,T和隐空间邻域信息嵌入表示hi,H后,需要对实体的拓扑邻域信息和隐空间邻域信息聚合得到实体的嵌入表示,首先计算拓扑邻域信息嵌入表示和隐空间邻域信息嵌入表示的平均向量表示,然后通过门控机制GM(·)去聚合hi,T和hi,H,得到实体ei最后的嵌入表示hi。
进一步的,步骤6中国在得到包含拓扑邻域信息和隐空间邻域信息的实体嵌入表示之后,通过计算实体嵌入表示之间的余弦相似度产生实体的相似度矩阵,矩阵中每一个元素都代表产业图谱中实体与实体之间的余弦相似性,值域为[0,1]。
进一步的,步骤7中为了制定全局的实体对齐决策,将实体对齐问题表示为经典的稳定匹配问题,每一次实体对齐的决策之间都是相互关联的,如果实体与另一个具有较高置信度的实体对齐,那么它与其他实体匹配的可能性较小,通过延迟接受算法(DAA)去实现全局的实体对齐。
本发明的有益效果在于:本发明基于初步构建的湖北省智能网联汽车产业图谱,首先通过产业图谱嵌入模型HAKE学习产业图谱的嵌入表示,形成产业图谱的隐空间,得到包含结构信息和语义信息的实体嵌入。在通过计算实体嵌入表示之间的余弦相似度确定在隐空间中各实体的邻接实体集合,从而形成实体的隐空间邻域。在分别采用vanilla GCN去聚合实体在隐空间邻域中的邻接实体信息和在拓扑邻域中的邻接实体信息,得到实体的隐空间邻域信息和拓扑邻域信息,在通过门控机制去控制拓扑邻域信息和隐空间邻域信息的聚合,得到最后的实体嵌入表示。然后计算实体嵌入表示之间的余弦相似度产生一个实体相似度矩阵,由于每一次实体对齐的决策之间都是相互关联的,所以将产业图谱中的实体对齐问题转换为稳定匹配问题,并利用延迟接受算法(DAA)去解决稳定匹配问题,实现产业图谱全局的实体对齐。
附图说明
图1为本发明实施例的流程图。
图2为本发明实施例的中心实体隐空间邻域图。
图3为本发明实施例的产业图谱融合方法的结构图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1和图3,本发明提供了一种基于门控隐空间邻域聚合的智能网联汽车产业图谱融合方法,包括以下步骤:
步骤1:基于现有的初步构建好的湖北省智能网联汽车产业图谱,通过产业图谱嵌入模型将产业图谱内实体、关系向量化(Embedding),生成产业图谱隐空间(嵌入空间);
本实施例中,利用图谱嵌入模型HAKE将产业图谱映射到一个低维的向量空间,生成产业图谱的隐空间(嵌入空间),得到实体、关系的嵌入表示;
图谱嵌入模型HAKE包含模长部分和角度部分,模长部分用于建模分属不同层级的实体,角度部分用于建模属于同一层级的实体;对于一个三元组(h,r,t),其中h为头实体,r为关系,t为尾实体,hm∈Rk,tm∈Rk分别为模长部分中头实体、关系、尾实体的向量表示,hp,rp,tp∈[0,2π)k分别为角度部分中实体、关系、尾实体的向量表示,Rk表示实数的k维向量,R表示实数集,k表示向量的维度模长部分三元组建模为/>角度部分三元组建模为hp+rp≈tp,其中,/>表示向量的逐元素相乘;+表示两个向量相加;≈指的是头实体的向量加上关系的向量尽可能的接近尾实体的向量,所以使用约等于。
模长部分和角度部分分别对应的距离函数为:
dr,p(hp,tp)=||sin((hp+rp-tp)/2)||1。
步骤2:基于产业图谱的原始拓扑结构产生实体的拓扑邻域,基于产业图谱的隐空间产生实体的隐空间邻域;
本实施例中,在隐空间中,实体的向量表示与中心实体的向量表示的之间的距离小于预先定义的相似度阈值ρ,就认为该实体为中心实体在隐空间中的邻接实体,从而形成隐空间邻域NH(u),如图2所示。拓扑邻域和隐空间邻域分别表示为:
NT(u)={v|v∈E,(u,v)∈R}
NH(u)={v|v∈E,d(eu,ev)<ρ}
其中u,v都是实体,R表示关系集合;eu,ev分别为实体u和实体v的向量表示,d(eu,ev)为计算向量之间距离的函数,采用余弦相似度。
步骤3:在原产业图谱的拓扑结构中,通过聚合中心实体(当某个实体有邻接实体时,在聚合它的邻接实体信息时,这个实体就可以称为中心实体)在拓扑邻域中的邻接实体信息,产生中心实体在聚合拓扑邻域中的邻接实体信息后的拓扑邻域信息表示;
本实施例中,在原产业图谱的拓扑结构中,利用vanilla GCN去聚合中心实体在拓扑邻域中的邻接实体ej,T∈NT(u)的信息,vanilla GCN的层数为l,层与层之间的传播公式为:
其中,NT(·)表示中心实体的一跳拓扑邻域,也包括中心实体自己;表示中心实体在vanilla GCN的第l层中,聚合拓扑邻域中的邻接实体信息后的向量表示;;ai是一个归一化常数,/>是第l层权重矩阵,σ(·)是激活函数;/>表示中心实体的第j个拓扑邻域邻接实体在vanilla GCN的l-1层的向量表示;i表示第i个中心实体,下标j表示中心实体的拓扑邻域中的第j个邻接实体;NT(i)是第i个中心实体的拓扑邻域,T表示是拓扑。
GCN的最后一层的输出hi,T就是中心实体ei在聚合拓扑邻域中的邻接实体信息后的拓扑邻域信息嵌入表示。
步骤4:在产业图谱嵌入模型产生的产业图谱隐空间中,通过聚合中心实体的在隐空间邻域中的邻接实体信息,产生中心实体在聚合隐空间邻域中的邻接实体信息后的隐空间邻域表示;
本实施例中,通过产业图谱嵌入模型HAKE产生隐空间后,利用vanilla GCN去聚合中心实体在隐空间邻域中的邻接实体ej,H∈NH(u)的信息,vanilla GCN的层数为l,隐空间邻域信息在GCN中层与层之间的传播公式为:
其中,NH(i)表示包括中心实体自已的隐空间邻域,代表隐空间的权重矩阵;ai是一个归一化常数,σ(·)是激活函数;/>表示中心实体的在隐空间邻域中第j个邻接实体在vanilla GCN的l-1层的向量表示;i表示第i个中心实体,下标j表示中心实体在隐空间邻域中的第j个邻接实体;H表示的是隐空间;/>表示中心实体在vanilla GCN第l层中,聚合隐空间邻域中的邻接实体信息后的向量表示。
GCN的最后一层的输出hi,H就是中心实体ei在聚合隐空间邻域中的邻接实体信息后的拓扑邻域信息嵌入表示。
步骤5:在生成中心实体的拓扑邻域信息表示和隐空间邻域信息表示后,通过门控机制对中心实体的隐空间邻域信息和拓扑邻域信息进行聚合,产生包含拓扑邻域信息和隐空间邻域信息的实体嵌入表示;
本实施例中,通过vanilla GCN对实体邻域信息进行聚合,分别得到中心实体的拓扑邻域信息嵌入表示hi,T和隐空间邻域信息嵌入表示hi,H,需要对实体的拓扑邻域信息和隐空间邻域信息聚合得到实体的嵌入表示hi;
首先计算实体ei的拓扑邻域信息嵌入表示和隐空间邻域信息嵌入表示的平均向量然后通过门控机制GM(·)聚合hi,T和hi,H,得到实体ei最后的嵌入表示hi,计算公式如下:
其中,下标i表示的是第i个实体,和实体ei的下标一样;公式中的j表示的是T、H中的一个,下标T表示的是拓扑,H表示的隐空间;n表示的是邻域的个数,本专利中只有拓扑邻域和隐空间邻域,它的值为2;GM(·)是一个控制拓扑邻域信息和隐空间邻域信息聚合的函数,用如下公式表示:
其中W是一个权重矩阵,这样门控能跟随模型一起训练,表示实体ei的拓扑邻域信息嵌入表示和隐空间邻域信息嵌入表示的平均向量σ(·)是激活函数。
步骤6:在得到最后的实体嵌入表示之后,通过计算实体嵌入表示之间的余弦相似度产生实体的相似度矩阵;
本实施例中,通过计算实体嵌入表示之间的余弦相似度产生实体的相似度矩阵M,矩阵中每一个元素mij都代表产业图谱中实体与实体之间的余弦相似性,值域为[0,1];
mij=cos(ei,ej)
其中,ei和ej分别表示实体i和j的嵌入向量表示。
步骤7:为了制定全局的实体对齐决策,将实体对齐问题表示为经典的稳定匹配问题,并通过延迟接受算法(DAA)去实现集体的实体对齐。
本实施例中,为了制定全局的实体对齐决策,将实体对齐问题表示为经典的稳定匹配问题,每一次实体对齐的决策之间都是相互关联的,如果实体与另一个具有较高置信度的实体对齐,那么它与其他实体匹配的可能性较小,通过延迟接受算法(DAA)去实现全局的实体对齐。在第一轮中,每个源实体根据相似度矩阵选出相似度最大的目标实体进行匹配,然后目标实体也临时选择跟它匹配的最相似的源实体进行匹配;然后,在接下来的每一轮中,每一个未匹配的源实体向没有匹配的与它最相似的目标实体进行匹配(无论目标实体是否已经匹配),如果目标实体发现在与它匹配的源实体中,有更相似的实体,那么它就会和最相似的源实体匹配;重复这个过程,直到每个源实体都已经和目标实体匹配,就完成了产业图谱的全局实体对齐任务。
本实施例适用于湖北省智能网联汽车产业图谱,还适用于需要用到实体对齐技术的产业图谱。
应当理解的是,本说明书未详细阐述的部分均属于现有技术;上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (8)
1.一种基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于,包括以下步骤:
步骤1:基于构建的智能网联汽车产业图谱,将产业图谱内实体、关系向量化,生成产业图谱隐空间;
步骤2:基于产业图谱的原始拓扑结构产生实体的拓扑邻域,基于产业图谱的隐空间产生实体的隐空间邻域;
步骤3:在原产业图谱的拓扑结构中,通过聚合中心实体在拓扑邻域中的邻接实体信息,产生中心实体在聚合拓扑邻域中的邻接实体信息后的拓扑邻域信息表示;
步骤4:在产业图谱隐空间中,通过聚合中心实体的在隐空间邻域中的邻接实体信息,产生中心实体在聚合隐空间邻域中的邻接实体信息后的隐空间邻域表示;
步骤5:在生成中心实体的拓扑邻域信息表示和隐空间邻域信息表示后,通过门控机制对中心实体的隐空间邻域信息和拓扑邻域信息进行聚合,产生包含拓扑邻域信息和隐空间邻域信息的实体嵌入表示;
步骤6:在得到最后的实体嵌入表示之后,通过计算实体嵌入表示之间的余弦相似度产生实体的相似度矩阵;
步骤7:为了制定全局的实体对齐决策,将实体对齐问题表示为经典的稳定匹配问题,并实现集体的实体对齐。
2.根据权利要求1所述的基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于:步骤1中,利用图谱嵌入模型HAKE将产业图谱映射到一个低维的向量空间,生成产业图谱的隐空间,得到实体、关系的嵌入表示;
所述图谱嵌入模型HAKE包含模长部分和角度部分,模长部分用于建模分属不同层级的实体,角度部分用于建模属于同一层级的实体;对于一个三元组(h,r,t),其中h为头实体,r为关系,t为尾实体,hm∈Rk,tm∈Rk分别为模长部分中头实体、关系、尾实体的向量表示,hp,rp,tp∈[0,2π)k分别为角度部分中实体、关系、尾实体的向量表示;Rk表示实数的k维向量,R表示实数集,k表示向量的维度;模长部分三元组建模为/>角度部分三元组建模为hp+rp≈tp,其中,/>表示向量的逐元素相乘;+表示两个向量相加;≈指的是头实体的向量加上关系的向量尽可能的接近尾实体的向量;
模长部分和角度部分分别对应的距离函数为:
dr,p(hp,tp)=||sin((hp+rp-tp)/2)||1。
3.根据权利要求1所述的基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于:步骤2中,基于产业图谱的原始拓扑结构,通过中心实体的一跳邻居集合{e1,…,en}产生中心实体的拓扑邻域NT(u),在利用图谱嵌入模型HAKE得到产业图谱的嵌入空间之后,通过在嵌入空间中计算中心实体向量表示和其他实体的向量表示之间的相似度,如果相似度大于给定的阈值,则它是中心实体在隐空间中的邻接实体,从而产生中心实体的隐空间邻域NH(u);
其中,拓扑邻域和隐空间邻域分别表示为:
NT(u)={v|v∈E,(u,v)∈R}
NH(u)={v|v∈E,d(eu,eV)<ρ}
其中u,v都是实体,R表示关系集合;eu,ev分别为实体u和实体v的向量表示,d(eu,ev)为计算向量之间距离的函数,采用余弦相似度;ρ表示预先定义的相似度阈值。
4.根据权利要求1所述的基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于:步骤3中,在原产业图谱的拓扑结构中,利用vanilla GCN去聚合中心实体在拓扑邻域中的邻接实体ej,T∈NT(u)的信息,vanilla GCN的层数为l,层与层之间的传播公式为:
其中,NT(·)表示中心实体的一跳拓扑邻域,也包括中心实体自己,表示中心实体在vanilla GCN的第l层中,聚合拓扑邻域中的邻接实体信息后的向量表示;ai是一个归一化常数,/>是第l层权重矩阵,σ(·)是激活函数;/>表示中心实体的第j个邻接实体在vanilla GCN的l-1层的向量表示;i表示第i个中心实体,下标j表示中心实体的拓扑邻域中的第j个邻接实体;NT(i)是第i个中心实体的拓扑邻域,T表示是拓扑;
GCN的最后一层的输出hi,T就是中心实体ei在聚合拓扑邻域中的邻接实体信息后的拓扑邻域信息嵌入表示。
5.根据权利要求1所述的基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于:步骤4中,利用vanilla GCN去聚合中心实体在隐空间邻域中的邻接实体ej,H∈NH(u)的信息,vanilla GCN的层数为l,隐空间邻域信息在GCN中层与层之间的传播公式为:
其中,NH(i)表示包括中心实体自己的隐空间邻域,代表隐空间的权重矩阵;ai是一个归一化常数,σ(·)是激活函数;/>表示中心实体的在隐空间邻域中第j个邻接实体在vanilla GCN的l-1层的向量表示;i表示第i个中心实体,下标j表示中心实体在隐空间邻域中的第j个邻接实体;H表示的是隐空间;/>表示中心实体在vanilla GCN第l层中,聚合隐空间邻域中的邻接实体信息后的向量表示;
GCN的最后一层的输出hi,H就是中心实体ei在聚合隐空间邻域中的邻接实体信息后的拓扑邻域信息嵌入表示。
6.根据权利要求1所述的基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于:步骤5中,通过vanilla GCN对实体邻域信息进行聚合,分别得到中心实体的拓扑邻域信息嵌入表示hi,T和隐空间邻域信息嵌入表示hi,H,需要对实体的拓扑邻域信息和隐空间邻域信息聚合得到实体的嵌入表示hi;
首先计算实体ei的拓扑邻域信息嵌入表示和隐空间邻域信息嵌入表示的平均向量然后通过门控机制GM(·)聚合hi,T和hi,H,得到实体ei最后的嵌入表示hi,计算公式如下:
其中,下标i表示的是第i个实体,和实体ei的下标一样;公式中的j表示的是T、H中的一个,下标T表示的是拓扑,H表示的隐空间;n表示的是邻域的个数;GM(·)是一个控制拓扑邻域信息和隐空间邻域信息聚合的函数,用如下公式表示:
其中W是一个权重矩阵,这样门控能跟随模型一起训练,表示实体ei的拓扑邻域信息嵌入表示和隐空间邻域信息嵌入表示的平均向量,σ(·)是激活函数。
7.根据权利要求1所述的基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于:步骤6中,通过计算实体嵌入表示之间的余弦相似度产生实体的相似度矩阵M,矩阵中每一个元素mij都代表产业图谱中实体与实体之间的余弦相似性,值域为[0,1];
mij=cos(ei,ej)
其中,ei和ej分别表示实体i和j的嵌入向量表示。
8.根据权利要求1-7任意一项所述的基于隐空间邻域聚合的智能网联汽车产业图谱融合方法,其特征在于:步骤7中,每一次实体对齐的决策之间都是相互关联的,如果实体与另一个具有较高置信度的实体对齐,那么它与其他实体匹配的可能性较小,通过延迟接受算法DAA去实现全局的实体对齐;在第一轮中,每个源实体根据相似度矩阵选出相似度最大的目标实体进行匹配,然后目标实体也临时选择跟它匹配的最相似的源实体进行匹配;然后,在接下来的每一轮中,每一个未匹配的源实体向没有匹配的与它最相似的目标实体进行匹配,如果目标实体发现在与它匹配的源实体中,有更相似的实体,那么它就会和最相似的源实体匹配;重复这个过程,直到每个源实体都已经和目标实体匹配,就完成了产业图谱的全局实体对齐任务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010711346.8A CN111858958B (zh) | 2020-07-22 | 2020-07-22 | 基于隐空间邻域聚合的智能网联汽车产业图谱融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010711346.8A CN111858958B (zh) | 2020-07-22 | 2020-07-22 | 基于隐空间邻域聚合的智能网联汽车产业图谱融合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111858958A CN111858958A (zh) | 2020-10-30 |
CN111858958B true CN111858958B (zh) | 2024-02-02 |
Family
ID=72949333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010711346.8A Active CN111858958B (zh) | 2020-07-22 | 2020-07-22 | 基于隐空间邻域聚合的智能网联汽车产业图谱融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111858958B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2309487A1 (en) * | 2009-09-11 | 2011-04-13 | Honda Research Institute Europe GmbH | Automatic speech recognition system integrating multiple sequence alignment for model bootstrapping |
CN109189945A (zh) * | 2018-09-28 | 2019-01-11 | 武汉理工大学 | 一种基于可信度向量的知识图谱表示学习方法 |
CN109523012A (zh) * | 2018-10-11 | 2019-03-26 | 上海交通大学 | 基于变分解耦合方式对符号有向网络的表达学习方法 |
CN109992670A (zh) * | 2019-04-04 | 2019-07-09 | 西安交通大学 | 一种基于知识图谱邻域结构的图谱完备化方法 |
CN110472065A (zh) * | 2019-07-25 | 2019-11-19 | 电子科技大学 | 基于gcn孪生网络的跨语言知识图谱实体对齐方法 |
CN110516160A (zh) * | 2019-08-30 | 2019-11-29 | 中国科学院自动化研究所 | 基于知识图谱的用户建模方法、序列推荐方法 |
-
2020
- 2020-07-22 CN CN202010711346.8A patent/CN111858958B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2309487A1 (en) * | 2009-09-11 | 2011-04-13 | Honda Research Institute Europe GmbH | Automatic speech recognition system integrating multiple sequence alignment for model bootstrapping |
CN109189945A (zh) * | 2018-09-28 | 2019-01-11 | 武汉理工大学 | 一种基于可信度向量的知识图谱表示学习方法 |
CN109523012A (zh) * | 2018-10-11 | 2019-03-26 | 上海交通大学 | 基于变分解耦合方式对符号有向网络的表达学习方法 |
CN109992670A (zh) * | 2019-04-04 | 2019-07-09 | 西安交通大学 | 一种基于知识图谱邻域结构的图谱完备化方法 |
CN110472065A (zh) * | 2019-07-25 | 2019-11-19 | 电子科技大学 | 基于gcn孪生网络的跨语言知识图谱实体对齐方法 |
CN110516160A (zh) * | 2019-08-30 | 2019-11-29 | 中国科学院自动化研究所 | 基于知识图谱的用户建模方法、序列推荐方法 |
Non-Patent Citations (6)
Title |
---|
基于关系拓展的改进词袋模型研究;陈行健;胡雪娇;薛卫;;小型微型计算机系统(第05期);全文 * |
基于可信向量的知识图谱上下文感知表示学习;熊盛武;陈振东;段鹏飞;刘晓赟;武汉大学学报(理学版)(第005期);全文 * |
基于深度学习的智慧图书馆移动视觉搜索服务模式研究;李默;;现代情报(第05期);全文 * |
基于知识图谱的人员关系构建;王焮;李鑫;;电子技术与软件工程(第10期);全文 * |
基于空间投影和关系路径的地理知识图谱表示学习;段鹏飞;王远;熊盛武;毛晶晶;;中文信息学报(第03期);全文 * |
段鹏飞 ; 王远 ; 熊盛武 ; 毛晶晶.基于空间投影和关系路径的地理知识图谱表示学习.中文信息学报.2018,(第003期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111858958A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108132968B (zh) | 网络文本与图像中关联语义基元的弱监督学习方法 | |
CN110889015B (zh) | 面向图数据的独立解耦卷积神经网络表征方法 | |
CN107578061A (zh) | 基于最小化损失学习的不平衡样本分类方法 | |
CN109753589A (zh) | 一种基于图卷积网络的图可视化方法 | |
CN113378913A (zh) | 一种基于自监督学习的半监督节点分类方法 | |
CN109002858B (zh) | 一种用于用户行为分析的基于证据推理的集成聚类方法 | |
CN116503676B (zh) | 一种基于知识蒸馏小样本增量学习的图片分类方法及系统 | |
Bassier et al. | Segmentation of large unstructured point clouds using octree-based region growing and conditional random fields | |
CN113128667B (zh) | 一种跨域自适应的图卷积平衡迁移学习方法与系统 | |
Pronobis et al. | Hierarchical Multi-Modal Place Categorization. | |
CN116757460B (zh) | 基于深度学习的应急指挥调度平台构建方法及系统 | |
CN112256870A (zh) | 基于自适应随机游走的属性网络表示学习方法 | |
CN112256904A (zh) | 一种基于视觉描述语句的图像检索方法 | |
Henriques et al. | Spatial clustering using hierarchical SOM | |
CN111858958B (zh) | 基于隐空间邻域聚合的智能网联汽车产业图谱融合方法 | |
Gu et al. | Fuzzy time series forecasting based on information granule and neural network | |
CN117056763A (zh) | 基于变分图嵌入的社区发现方法 | |
CN115273645B (zh) | 一种室内面要素自动聚类的地图制图方法 | |
CN114037866B (zh) | 一种基于可辨伪特征合成的广义零样本图像分类方法 | |
CN110347933B (zh) | 一种ego网络社交圈子识别方法 | |
JP3712582B2 (ja) | 情報クラスタリング装置および情報クラスタリングプログラムを記録した記録媒体 | |
Pai et al. | Forecasting tourism demand using a multifactor support vector machine model | |
CN117237141B (zh) | 一种基于自适应曲率的双曲图卷积网络的社区检测方法 | |
Chen et al. | Extractive adversarial networks for network embedding | |
CN114186691B (zh) | 一种网络社区挖掘方法及其在零件加工区域识别中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |