CN111949801B

CN111949801B - 医生经验知识与超声影像信息的知识图谱融合方法

Info

Publication number: CN111949801B
Application number: CN202010729546.6A
Authority: CN
Inventors: 习佳宁; 黄庆华
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-07-27
Filing date: 2020-07-27
Publication date: 2023-10-24
Anticipated expiration: 2040-07-27
Also published as: CN111949801A

Abstract

本发明提供了一种医生经验知识与超声影像信息的知识图谱融合方法。首先，将医生经验标注信息逐条叙述为三元组规则化知识，并将各条规则化知识构建为医生经验知识图谱；然后，对医生经验知识图谱和超声影像知识图谱中的实体进行语义本体查询，并进行对齐处理和知识图谱嵌入表示；最后，求解所构建的融合目标函数，得到不同图谱的联合空间嵌入向量，结合距离判断，实现医生经验知识图谱和超声影像知识图谱的融合。本发明通过知识图谱方式将医生经验融合至超声影像中，可以突破计算机辅助诊断方法仅采用医学影像数据驱动的局限，使辅助诊断过程更加吻合医生经验。

Description

医生经验知识与超声影像信息的知识图谱融合方法

技术领域

本发明属医学信息处理领域，具体涉及一种医生经验知识与超声影像信息的知识图谱融合方法。

背景技术

在临床中，医学超声属于最高频的医学影像诊查，为在大规模筛查时有效缓解医生诊断过程中的工作强度，医院主要采用计算机辅助诊断技术对医生诊断进行辅助。现有计算机辅助诊断技术的研究，主要集中于诊查所采集的医学影像，通过数据驱动方式挖掘出图像与疾病的潜在关联，对疾病的诊断结果进行预测。

由于仅来自医学图像数据的信息对于辅助诊断参考价值往往有限，因此可以在医学影像的基础上进一步融合其他医学信息，从而对超声数据的信息进行补充。如Lafitte等人在文献"Lafitte L,Zachiu C,Kerkmeijer L G W,et al.Accelerating multi-modalimage registration using a supervoxel-based variational framework[J].Physicsin Medicine and Biology,2018,63(23):235009"中采用基于超像素变分框架的图像配准方法，将超声影像与多种其他医学影像模态进行融合。Lei等人在文献"Lei B Y,Li W J,Yao Y,et al.Multi-modal and multi-layout discriminative learning forplacental maturity staging[J].Pattern Recognition,2017,63:719-730"中提出了基于特征融合的多层Fisher向量判别式学习，可有效融合B型超声图像和彩色多普勒能量图两种信息。Ye等人在文献"Ye C Y,Vaidya V,Zhao F,et al.:Improved Mass Detectionin 3D Automated Breast Ultrasound Using Region Based Features and Multi-viewInformation,2014 36th Annual International Conference of the IEEE Engineeringin Medicine and Biology Society,2014:2865-2868"中通过多视角学习方法实现了三维超声的多视角信息融合。此外，其他医学影像的多模态融合研究，也对超声影像信息融合具有重要借鉴意义。如Wen等人在文献"Wen H W,Liu Y,Rekik I,et al.Multi-modalmultiple kernel learning for accurate identification of Tourette syndromechildren[J].Pattern Recognition,2017,63:601-611"中通过多核学习方法对多种模态的医学影像信息进行融合。Cao等人在文献"Cao X H,Yang J H,Gao Y Z,et al.Region-Adaptive Deformable Registration of CT/MRI Pelvic Images via Learning-BasedImage Synthesis[J].IEEE Transactions on Image Processing,2018,27(7):3500-3512"中提出区域适应的可变形图像配准方法以融合多种医学模态信息。

总的来说，虽然上述方法可有效实现影像模态层面的融合，但仍然围绕着医学影像数据本身的信息开展分析，忽视了超声医生长期积累的经验知识，致使计算机辅助诊断的诸多预测结果仍与医生诊断结果有较大偏离。Liu等人在文献"Liu T J,Guo Q Q,Lian CF,et al.Automated detection and classification of thyroid nodules inultrasound images using clinical-knowledge-guided convolutional neuralnetworks[J].Medical Image Analysis,2019,58"中通过医生经验预先确定区域选取的尺寸和形状分布，采用多分支网络的输出对影像医生的常用特征进行拟合，初步实现了将超声医生经验知识对应超声数据的融合。但所融合的医生经验知识仅局限于影像指标，与影像不直接相关的经验知识则无法进行融合。

发明内容

为了解决现有数据驱动超声辅助诊断无法有效融合医生经验知识的问题，本发明提供一种医生经验知识与超声影像信息的知识图谱融合方法。首先，将医生经验标注信息逐条叙述为三元组规则化知识，并将各条规则化知识构建为知识图谱结构；然后，对实体进行语义本体查询，并进行对齐处理和知识图谱嵌入表示；最后，求解所构建的融合目标函数，得到不同图谱的联合嵌入空间嵌入向量，结合距离判断，实现医生经验知识图谱和超声影像知识图谱的融合。

一种医生经验知识与超声影像信息的知识图谱融合方法，其特征在于步骤如下：

步骤1：以乳腺超声诊查的指标为实体，以医生标注的实体间的必要、充分或相关关系为标注关系，并将实体和标注关系表示为实体1-关系类型-实体2的三元组形式；所述的指标包括形状、方位、边缘、病灶边界、内部回声类型、后方回声特征、病灶是否钙化、周围组织变化情况；

步骤2：以步骤1中的实体为节点，以医生标注关系为邻边，并分别对实体和标注关系进行编号；对所有以三元组形式表示的实体和标注关系，根据其所对应的编号构建成为医生经验知识图谱；

步骤3：从医学术语本体知识库中，分别查询医生经验知识图谱和超声影像知识图谱中的实体名称所对应的语义本体，对于可查询到语义本体的实体，进行实体对齐处理，然后转至步骤6；对于无法在本体知识库中查询到语义本体的实体，进行独立嵌入空间表示处理，然后转至步骤4；

所述的实体对齐处理包括：对于两个图谱中所对应的语义本体相同的实体，赋予相同的标注标签；

所述的独立嵌入空间表示处理，具体为：以图谱A表示医生经验知识图谱，以图谱B表示超声影像知识图谱，图谱A有N_A个实体，其以编号表示的图谱A实体集合表示为S_A＝{1,2,...,N_A}，图谱B有N_B个实体，其以编号表示的图谱B实体集合表示为S_B＝{1,2,...,N_B}，采用TransD算法分别对两个知识图谱进行实体嵌入处理，得到图谱A中实体的独立嵌入向量和图谱B中实体的独立嵌入向量/>其中，i^A表示知识图谱A的实体编号，i^A∈S_A，i^B表示知识图谱B的实体编号，i^B∈S_B；图谱A与图谱B中的相同实体构成共有实体集合S_C，设共有N_C个相同实体，以/>表示来自图谱A中编号为i^A的实体在共有实体集合S_C中的编号，以/>表示来自图谱B中编号为i^B的实体在共有实体集合S_C中的编号，以/>表示共有实体集合S_C中编号为/>的实体的独立嵌入向量，满足/>以/>表示集合S_C中编号为/>的实体所对应的独立嵌入向量，满足/>

步骤4：构建如下知识图谱融合的目标函数L_CoEm：

其中，表示共有实体集合S_C中编号为/>的实体对应在知识图谱A中的实体在联合嵌入空间的嵌入向量，/> 表示共有实体集合S_C中编号为/>的实体对应在知识图谱B中的实体在联合嵌入空间的嵌入向量，/> 和/>分别为独立嵌入向量/>和/>的重建向量；|S_C|表示集合S_C中的元素个数，|S_A|表示集合S_A中的元素个数，|S_B|表示集合S_B中的元素个数；/>表示两个知识图谱的对齐误差，/>表示知识图谱A的重建误差，/>表示知识图谱B的重建误差；λ表示对齐误差和重建误差之间的调谐参数，取值范围为(0,+∞)；

所述的联合嵌入空间的嵌入向量为独立嵌入向量/>经由知识图谱A的编码器网络A(e)处理得到，即/>f_A表示知识图谱A的编码器网络函数，表示知识图谱A的编码器网络第1、2层的权值矩阵/> 和偏置向量/>的参数集合；

所述的联合嵌入空间嵌入向量为独立嵌入向量/>经由知识图谱B的编码器网络B(e)处理得到，即/>f_B表示知识图谱B的编码器网络函数，表示知识图谱B的编码器网络第1、2层的权值矩阵/> 和偏置向量/>的参数集合；

所述的重建向量为联合嵌入空间的嵌入向量/>经由知识图谱A的解码器网络A(d)处理得到，即/>g_A表示知识图谱A的解码器网络函数，/>表示知识图谱A的解码器网络第1、2层的权值矩阵/> 和偏置向量/>的参数集合；/>表示知识图谱A中编号为i^A的实体在联合嵌入空间的嵌入向量，/>为独立嵌入向量/>经由知识图谱A的编码器网络A(e)处理得到，即

所述的重建向量为联合嵌入空间的嵌入向量/>经由知识图谱B的解码器网络B(d)处理得到，即/>g_B表示知识图谱B的解码器网络函数，/>表示知识图谱A的解码器网络第1、2层的权值矩阵/> 和偏置向量/>的参数集合；/>表示知识图谱B中编号为i^B的实体在联合嵌入空间的嵌入向量，/>为独立嵌入向量/>经由知识图谱B的编码器网络B(e)处理得到，即/>

步骤5：采用随机梯度下降法求解公式1的目标函数，最终得到两个知识图谱的所有实体的联合嵌入空间的嵌入向量和/>i^A∈S_A，i^B∈S_B；

步骤6：融合医生经验知识图谱和超声影像知识图谱，得到最终的融合后知识图谱，具体为：

步骤6.1：将两个图谱中的具有相同标注标签的实体或联合嵌入空间的嵌入向量之间的欧式距离小于给定阈值δ的实体，合并为同一个实体，对于除以上情况外的其他实体，保留原实体；其中，所述的阈值δ∈(0,+∞)；

步骤6.2：对于原有两个图谱中实体间已有关系，将其作为融合后知识图谱中相应实体之间的关系；

步骤6.3：对于融合后知识图谱中的实体间未包含关系，从医学术语本体知识库中进行查询，当实体所对应的语义本体间存在单向性关联关系时，增加其单向性关联关系标注；当实体所对应的语义本体间存在互逆关系时，增加其双向性关联关系标注；其中，单向性关联关系包括传递关系、部分整体关系、继承关系、概念实例关系和属性关系。

本发明的有益效果是：由于采用将医生经验标注信息逐条叙述为三元组规则化知识的方式，可以有效将医生经验知识转化为计算机可处理的知识图谱结构；由于采用语义本体的实体对齐匹配和实体嵌入向量的邻近关系处理，可以有效将影像信息与其不直接相关的医生经验知识映射至同一嵌入空间中，进而便于知识融合；由于通过知识图谱方式将医生经验融合至超声影像中，可以突破计算机辅助诊断方法仅采用医学影像数据驱动的局限，使辅助诊断过程更加吻合医生经验。

附图说明

图1是本发明的医生经验知识与超声影像信息的知识图谱融合方法流程图；

图2是本发明的医生经验知识与超声影像信息的知识图谱融合方法原理图。

具体实施方式

下面结合附图和实施例对本发明进一步说明，本发明包括但不仅限于下述实施例。

如图1和2所示，本发明提供了一种医生经验知识与超声影像信息的知识图谱融合方法，其具体实现过程如下：

1、医生经验标注信息三元组表示

以乳腺超声诊查的指标为实体，以医生标注的实体间的必要、充分或相关关系为标注关系，并将实体和标注关系表示为实体1-关系类型-实体2的三元组形式。所述的指标是由超声科医生罗列的常见概念指标，包括形状、方位、边缘、病灶边界、内部回声类型、后方回声特征、病灶是否钙化、周围组织变化情况。标注关系主要是医生依据超声诊查相关的医学指南标注出的关系。

2、超声医生的经验知识图谱构建

以实体和医生标注关系作为节点和邻边，并分别进行编号；所有以三元组形式表示的实体和标注关系根据其所对应的编号构建成为医生经验知识图谱。在此知识图谱中，各节点代表临床指标，各邻边代表指标之间的充分条件关系/必要条件关系/相关关系。

3、医学语义本体的已录入术语判断和处理

鉴于上述所得的医生经验知识图谱和现有超声影像知识图谱存在同物异名现象，通过医学术语本体知识库，分别查询两个知识图谱的实体名称所对应的语义本体。对于同物异名的实体，若两者可在语义本体查询到已录入的术语，则对两实体进行后续对齐处理；若两者在本体知识库中无法查询到已录入的术语，则对这些未录入术语的实体进行共有嵌入空间表示处理。

为实现两个知识图谱的实体对齐，将不同图谱的实体名称在本体知识库的查询结果进行比对。若查询结果完全符合相同的本体语义，则将两个实体在不同知识图谱中进行相同标签的标注。

对于本体语义库中未录入的同物异名实体，根据两个知识图谱的已录入同语义实体的相同标签，将两个知识图谱向独立嵌入空间进行映射。具体为：

以图谱A表示医生经验知识图谱，以图谱B表示超声影像知识图谱，图谱A有N_A个实体，其以编号表示的实体集合表示为S_A＝{1,2,...,N_A}，图谱B有N_B个实体，其以编号表示的实体集合表示为S_B＝{1,2,...,N_B}，采用文献"Ji G L,He S Z,Xu L H,et al.KnowledgeGraph Embedding via Dynamic Mapping Matrix[M].Stroudsburg:Assoc ComputationalLinguistics-ACL,2015:687-696"的TransD算法，分别对两个知识图谱进行实体嵌入处理，得到图谱A中实体的独立嵌入向量和图谱B中实体的独立嵌入向量/>其中，i^A表示知识图谱A的实体编号，i^A∈S_A，i^B表示知识图谱B的实体编号，i^B∈S_B；图谱A与图谱B中的相同实体构成共有实体集合S_C，设共有N_C个相同实体，以/>表示来自图谱A中编号为i^A的实体在共有实体集合S_C中的编号，以/>表示来自图谱B中编号为i^B的实体在共有实体集合S_C中的编号，以/>表示共有实体集合S_C中编号为/>的实体的独立嵌入向量，满足/>以/>表示集合S_C中编号为/>的实体所对应的独立嵌入向量，满足/>

4、嵌入融合

对于上述独立嵌入向量，构建如下知识图谱融合的目标函数L_CoEm：

其中，表示共有实体集合S_C中编号为/>的实体对应在知识图谱A中的实体在联合嵌入空间的嵌入向量，/> 表示共有实体集合S_C中编号为/>的实体对应在知识图谱B中的实体在联合嵌入空间的嵌入向量，/> 和/>分别为独立嵌入向量/>和/>的重建向量；|S_C|表示集合S_C中的元素个数，|S_A|表示集合S_A中的元素个数，|S_B|表示集合S_B中的元素个数；/>表示两个知识图谱的对齐误差，/>表示知识图谱A的重建误差，/>表示知识图谱B的重建误差；λ表示对齐误差和重建误差之间的调谐参数，取值范围为(0,+∞)。

公式(2)的目标函数中，第一项用于将两个知识图谱中标注相同的实体映射到联合嵌入空间的相近位置，第二/三项分别用于确保知识图谱A/B映射到联合嵌入空间的嵌入向量可有效重建两者的原始嵌入向量。

在实体联合嵌入空间表示中，选取深度学习自动编码机分别作为知识图谱A与B对联合嵌入空间的映射和逆映射。本申请均选用三层自动编码机，输入层到中间隐层的前半部分为原始嵌入向量到联合嵌入空间的映射，中间隐层到输出层的后半部分为联合嵌入空间嵌入向量到原始嵌入向量的逆映射。设e表示编码器网络的标志，A(e)表示知识图谱A的编码器网络的标志，B(e)表示知识图谱B的编码器网络的标志，d表示解码器网络的标志，A(d)表示知识图谱A的解码器网络的标志，B(d)表示知识图谱B的解码器网络的标志；对于公式(2)的目标函数L_CoEm，通过神经网络编码器输出通过神经网络解码器输出/>和具体如下：

知识图谱A的编码器网络函数为其中为包含网络第1、2层的权值矩阵/>和/>及偏置向量/>和/>的参数集合，当分别输入图谱A的序号为i^A和/>的实体的独立嵌入向量/>和/>时，当对该编码器网络分别输出两者的联合嵌入空间嵌入向量/>和/>即/>和知识图谱B的编码器网络函数为/>其中/>为包含网络第1、2层的权值矩阵/>和/>及偏置向量和/>的参数集合，当对该编码器网络分别输入图谱B的序号为i^B和/>的实体的独立嵌入向量/>和/>时，分别输出两者的联合嵌入空间嵌入向量/>和/>即/>和

同时，知识图谱A的解码器网络函数为其中为包含网络第1、2层的权值矩阵/>和/>及偏置向量/>和的参数集合，当对该解码器网络分别输入图谱A的序号为i^A的实体的联合嵌入空间嵌入向量/>时，输出的独立嵌入向量的重建向量/>即/>知识图谱B的解码器网络函数为/>其中为包含网络第1、2层的权值矩阵/>和/>及偏置向量/>和/>的参数集合，当对该解码器网络分别输入图谱B的序号为i^B的实体的联合嵌入空间嵌入向量/>时，输出的独立嵌入向量的重建向量/>即/>

根据上述所给出的和/>的编码器/解码器表达式，带入至目标函数L_CoEm中，可以得到更新后的优化函数：

对此公式(3)优化函数，采用随机梯度下降法对向量和/>和参数Φ^A(e)、Φ^A(d)、Φ^B(e)和Φ^B(d)进行交替求解，将求解结果中的参数Φ^A(e)和Φ^B(e)所对应的编码器网络分别应用于知识图谱A与B的所有独立嵌入向量/>和/>最终得到两个知识图谱的所有实体的联合嵌入空间嵌入向量/>和/>其中i^A∈S_A，i^B∈S_B。

5、融合医生经验知识图谱和超声影像知识图谱

通过上述步骤，可将分别来源于医生经验和超声影像的两个知识图谱进行融合，其中，本体语义匹配的相同实体(即具有相同标注标签的实体)在融合后的知识图谱中直接合并，本体语义未录入(即无法在本体知识库中查询到语义本体)的实体，按照上述过程计算二者在联合嵌入空间嵌入向量和/>之间的欧氏距离，距离小于预定义的阈值δ(δ∈(0,+∞))时视为两者在嵌入空间邻近，为相同实体，进而将两个实体进行合并。对于两个知识图谱中无法合并的实体，分别将这些实体作为融合后知识图谱的其余实体。

对于原有两个图谱中实体间已有关系，将其作为融合后知识图谱中相应实体之间的关系。对于实体间未包含关系，通过在本体知识库中查询实体概念的逻辑关系进行补充：若查询结果中两个实体在本体中存在了传递关系、部分整体关系、继承关系、概念实例关系、属性关系，则根据描述在两个实体之间增加单向性关联关系；若查询结果中两实体在本体中存在互逆关系，则在两实体之间构建互逆的双向性关联关系。对融合后知识图谱中的相应实体之间完成所有关系填充，确保融合后知识图谱中含有来自图谱A和B的已有关系，得到融合后的知识图谱。

Claims

1.一种医生经验知识与超声影像信息的知识图谱融合方法，其特征在于步骤如下：

步骤4：构建如下知识图谱融合的目标函数L_CoEm：

所述的联合嵌入空间的嵌入向量为独立嵌入向量/>经由知识图谱A的编码器网络A(e)处理得到，即/>f_A表示知识图谱A的编码器网络函数，/>表示知识图谱A的编码器网络第1、2层的权值矩阵/> 和偏置向量/>的参数集合；

所述的联合嵌入空间嵌入向量为独立嵌入向量/>经由知识图谱B的编码器网络B(e)处理得到，即/>f_B表示知识图谱B的编码器网络函数，/>表示知识图谱B的编码器网络第1、2层的权值矩阵/> 和偏置向量/>的参数集合；

所述的重建向量为联合嵌入空间的嵌入向量/>经由知识图谱A的解码器网络A(d)处理得到，即/>g_A表示知识图谱A的解码器网络函数，/>表示知识图谱A的解码器网络第1、2层的权值矩阵/> 和偏置向量/>的参数集合；/>表示知识图谱A中编号为i^A的实体在联合嵌入空间的嵌入向量，/>为独立嵌入向量/>经由知识图谱A的编码器网络A(e)处理得到，即/>