CN111309930B - 一种基于表示学习的医学知识图谱实体对齐方法 - Google Patents

一种基于表示学习的医学知识图谱实体对齐方法 Download PDF

Info

Publication number
CN111309930B
CN111309930B CN202010151549.6A CN202010151549A CN111309930B CN 111309930 B CN111309930 B CN 111309930B CN 202010151549 A CN202010151549 A CN 202010151549A CN 111309930 B CN111309930 B CN 111309930B
Authority
CN
China
Prior art keywords
entity
entities
aligned
medical knowledge
recommending
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010151549.6A
Other languages
English (en)
Other versions
CN111309930A (zh
Inventor
滕飞
钟文
许强
李天瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202010151549.6A priority Critical patent/CN111309930B/zh
Publication of CN111309930A publication Critical patent/CN111309930A/zh
Application granted granted Critical
Publication of CN111309930B publication Critical patent/CN111309930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种基于表示学习的医学知识图谱实体对齐方法,实体的完全字符串匹配,去除公有实体得到待对齐实体;通过知识表示学习模型对两个知识图谱中的三元组进行训练,得到每个实体的嵌入向量;计算待对齐实体与标准实体的语义距离,找出语义距离值最高的前十个推荐实体;通过构造医学知识数据的词根集,去除词根完全不同的候选实体;判断待对齐实体与推荐实体是否为同一科室和部位,去除推荐实体中不可靠的结果;将最后获得的待对齐实体与推荐实体进行标注,找出推荐实体中与待对齐实体指向相同的实体,完成实体对齐。本发明在表示学习的基础上,根据医学领域知识的特点,加入词根和规则对候选实体进行筛选,得到更精确的实体对齐结果。

Description

一种基于表示学习的医学知识图谱实体对齐方法
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种基于表示学习的医学知识图谱实体对齐方法。
背景技术
随着互联网的发展,互联网医学科普搜索需求急剧增加,互联网上现有的医学科普网站种类繁多,比如疾病百科网、39健康网、寻医问药网等。虽然这些网站包含丰富的医疗知识,但是网站导航过于专业让普通用户无法快速找到所需的内容,而且缺乏针对性,无法根据用户的不同问题给出针对性的回答,因此,基于知识图谱技术构建智慧医疗的任务刻不容缓。知识图谱是一种大规模的语义网络,以三元组(头实体,关系,尾实体)的形式表示知识,在信息检索、智能问答、推荐系统等领域广为应用,然而医学知识图谱数据来源众多,通常包含了大量相互重合的三元组信息。如果要同时使用不同数据源的医学知识图谱,就必须将实体进行对齐来判断差别数据源中的不同实体是否指向现实世界中的同一事物。由于医学领域对于实体对齐结果的精度要求非常高,给在该领域实现对齐工作带来了巨大的挑战。
通过对现有的专利及相关技术的检索发现,针对医学领域的实体对齐方法几乎没有,但在通用知识图谱领域,提出一种基于多源数据的知识融合方法,该发明基于实体名和实体属性对实体进行分块聚合,将同一分块内不同来源的实体作为候选实体对,减少计算复杂度,然后采用实体对齐算法计算实体间的相似度,如果相似度值大于预先给定的阈值,则认为二者指向同一实体,最终得到不同数据源之间所有实体的等价链接;以及根据预设的频率选择方法生成实体对齐种子集,然后通过关系三元组和属性三元组联合嵌入模块生成对应三元组的联合嵌入空间,迭代训练选取语义距离最小的一对实体组成实体对,最后将满足预设距离阈值的实体对添加到实体对齐种子集进行更新,迭代直至不存在满足预设距离阈值的实体对。
然而,上述方法依赖预先设定的阈值,而阈值的选取没有固定的标准,只能依靠经验和实验来估计,给实体对齐的结果产生决定性影响,也无法判断对齐结果的可靠性,因此很难适用于对精度要求高的医学领域,同时上述方法相似度计算的方法相对单一,不易应用到更多的领域知识图谱,基于此,本发明采用表示学习进行医学知识图谱实体对齐,将实体映射成低维稠密向量学习实体的深度特征,不依赖任何文本信息,不受语言特征和结构信息的限制,具有很好的可扩展性。由于知识图谱实体数量巨大,在对齐过程中既要确保找出所有指向相同的实体,也要减少对齐的工作量,因此本发明在表示学习的基础上,根据医学领域知识的特点,加入词根和规则对候选实体进行筛选,得到更精确的对齐结果,词根作用是作为实体中的一个有代表意义的子串,且能够反映该医学实体中的重要特征。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于表示学习的医学知识图谱实体对齐方法,解决了医学知识图谱实体对齐中阈值选取模糊和模型结构单一,导致无法保证对齐结果可靠性的问题。
为了达到以上目的,本发明采用的技术方案为:
本方案提供一种基于表示学习的医学知识图谱实体对齐方法,包括以下步骤:
S1、去除标准医学知识图谱K1和待对齐医学知识图谱K2中的公有实体,得到标准医学知识图谱K1的剩余实体E′1和待对齐医学知识图谱K2的剩余实体E'2
S2、通过知识表示学习模型分别对标准医学知识图谱K1和待对齐医学知识图谱K2中所有的三元组T1和T2进行训练,得到剩余实体E′1中每个实体的嵌入向量和剩余实体E'2中每个实体的嵌入向量;
S3、利用余弦相似度函数计算得到剩余实体E′1中每个实体的嵌入向量和剩余实体E'2中每个实体的嵌入向量的相似度值,并根据所述相似度值得到剩余实体E'2中每个待对齐实体与剩余实体E′1中所有实体相似度值最高的前十个推荐实体;
S4、根据标准医学知识图谱K1的所有实体E1和待对齐医学知识图谱K2中的所有实体E2构造词根集,并利用词根集获取剩余实体E'2中待对齐实体的词根与所述前十个推荐实体的词根,并去除词根不相同的推荐实体;
S5、判断所述剩余实体E'2中待对齐实体所在的科室或部位是否与经删除不同词根后的推荐实体{e1,e2,...,em}所在的科室或部位相同,若是,则保留该推荐实体,否则,删除该推荐实体,并根据判断结果得到新的推荐实体{e1,e2,...,el},其中,m表示删除不同词根后的推荐实体数,l表示删除不同科室或部位后的推荐实体数;
S6、将剩余实体E'2中待对齐实体与步骤S5中新的推荐实体{e1,e2,...,el}进行标注,并找出新的推荐实体{e1,e2,...,el}与剩余实体E'2中待对齐实体指向相同的实体,从而完成医学知识图谱实体对齐。
进一步地,所述步骤S3中相似度值的表达式如下:
Figure BDA0002402608850000031
其中,
Figure BDA0002402608850000032
表示相似度值,
Figure BDA0002402608850000033
表示剩余实体E′1中每个实体的嵌入向量,
Figure BDA0002402608850000041
表示剩余实体E'2中每个实体的嵌入向量,
Figure BDA0002402608850000042
Figure BDA0002402608850000043
分别表示嵌入向量
Figure BDA0002402608850000044
Figure BDA0002402608850000045
的模。
再进一步地,所述步骤S4包括以下步骤:
S401、根据标准医学知识图谱K1的所有实体E1和待对齐医学知识图谱K2中的所有实体E2构建词典W,W={W1,W2,...,Wn},并对Wi进行子串解析,其中,Wi表示词典中的某个词,i=1,2,...,n,n表示E1和E2为的实体数量之和;
S402、将解析后的子串分别置于整个词典W中进行频数统计,并选取频数前3的子串作为词根;
S403、判断是否遍历完整个词典W,若是,则对选取的词根作去重处理,得到词根集WE,并进入步骤S404,否则,返回步骤S402;
S404、分别对剩余实体E'2中待对齐实体与其对应的剩余实体E′1中前十个推荐实体进行子串解析,并判断解析后的子串是否存在于词根集WE中,若是,则分别得到剩余实体E′1中前十个推荐实体的子串集{We11,We12,...,We110}和剩余实体E'2中待对齐实体的子串集We2,并进入步骤S405,否则,重复步骤S404,直至遍历完剩余实体E'2中所有子串和E′1中前十个推荐实体的子串;
S405、判断子串集{We11,We12,...,We110}与子串集We2中是否有相同的子串,若有,则保留生成该子串集的推荐实体,否则,删除该推荐实体,去除词根不相同的推荐实体,并根据判断结果得到新的推荐实体{e1,e2,...,em},并进入步骤S5,其中,m表示删除没有相同词根后的推荐实体数。
再进一步地,所述步骤S402中词根还包括:
针对有频数相同时,选择长度最长的子串作为词根。
再进一步地,所述步骤S6具体为:
将剩余实体E'2中每个待对齐实体在剩余实体E′1中的推荐实体{e1,e2,...,el}进行标注,并找出推荐实体{e1,e2,...,el}中与待对齐实体指向相同的实体,得到实体对(esim1,esim2),从而完成医学知识图谱的实体对齐,其中,esim1为剩余实体E′1中的推荐实体,esim2为剩余实体E'2中的待对齐实体。
本发明的有益效果:
(1)本发明通过知识表示学习模型进行候选实体的推荐,可以解决模型单一导致的特征学习不足,对齐效果差的问题;
(2)本发明充分利用医学知识的特点,构造有意义的词根,反映医学实体中的重要特征,确保找出所有指向相同的实体,也减少了实体对齐的工作量;
(3)本发明根据医学知识所包含的特殊规则,实体的部位和科室可以判定实体是否指向同一实体,进一步减少推荐结果的数量同时也保证了准确性;
(4)本发明采用标注的方法得到对齐的正确实体,在医学领域,对齐结果的正确性关乎到医学知识图谱的可靠性,采用本发明已经极大减少了标注的工作量,同时还保证了医学知识图谱的质量。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例
假设存在一个标准的医学知识图谱K1={E1,R1,T1},E1为K1中的所有实体,R1为K1中的所有关系,T1为K1中的所有三元组;待对齐的医学知识图谱K2={E2,R2,T2},E2为K2中的所有实体,R2为K2中的所有关系,T2为K2中的所有三元组。最终目的是将K2中的所有实体E2与K1中的所有实体E1进行对齐,找出指向相同的实体。
如图1所示,本发明公开了一种基于表示学习的医学知识图谱实体对齐方法,其实现方法如下:
S1、去除标准医学知识图谱K1和待对齐医学知识图谱K2中的公有实体,得到标准医学知识图谱K1的剩余实体E′1和待对齐医学知识图谱K2的剩余实体E'2
本实施例中,实体的完全字符串匹配,找出两个知识图谱中的完全相同的实体,即公有实体Esim。对于对齐知识图谱K1,剩余实体为E′1=E1-Esim,对于待对齐知识图谱K2,剩余实体为E'2=E2-Esim,则最终目的转化为将E'2中的每个实体与E′1中的所有实体进行对齐。
S2、通过知识表示学习模型分别对标准医学知识图谱K1和待对齐医学知识图谱K2中所有的三元组T1和T2进行训练,得到剩余实体E′1中每个实体的嵌入向量和剩余实体E'2中每个实体的嵌入向量;
本实施例中,通过知识表示学习模型对K1和K2中的所有三元组T1和T2进行训练,直到知识表示学习模型的损失函数小于设定值,从而得到E'2与E′1中每个实体的嵌入向量,
Figure BDA0002402608850000061
为E′1中每个实体的嵌入向量,
Figure BDA0002402608850000062
为E'2中每个实体的嵌入向量。
S3、利用余弦相似度函数计算得到剩余实体E′1中每个实体的嵌入向量和剩余实体E'2中每个实体的嵌入向量的相似度值,并根据所述相似度值得到剩余实体E'2中每个待对齐实体与剩余实体E′1中所有实体相似度值最高的前十个推荐实体;相似度值的表达式如下:
Figure BDA0002402608850000071
其中,
Figure BDA0002402608850000072
表示相似度值,
Figure BDA0002402608850000073
表示剩余实体E′1中每个实体的嵌入向量,
Figure BDA0002402608850000074
表示剩余实体E'2中每个实体的嵌入向量,
Figure BDA0002402608850000075
Figure BDA0002402608850000076
分别表示嵌入向量
Figure BDA0002402608850000077
Figure BDA0002402608850000078
的模
S4、根据标准医学知识图谱K1的所有实体E1和待对齐医学知识图谱K2中的所有实体E2构造词根集,并利用词根集获取剩余实体E'2中待对齐实体的词根与所述前十个推荐实体的词根,并去除词根不相同的推荐实体;其实现方法如下:
S401、根据标准医学知识图谱K1的所有实体E1和待对齐医学知识图谱K2中的所有实体E2构建词典W,W={W1,W2,...,Wn},并对Wi进行子串解析,其中,Wi表示词典中的某个词,i=1,2,...,n,n表示E1和E2为的实体数量之和;
本实施例中,假设词典W为E1与E2中的所有实体,词典中共有n个词,n为E1和E2为的实体数量之和,W={W1,W2,...,Wn},对Wi(i=1,2,...,n)进行子串解析。在医学数据中,一个长度为L的实体存在L-1+L-2+....+1个子串,且子串中至少有一个为词根,规定词根的字数不小于2,对于一个实体而言,其子串出现频率越高,越有可能是一个词根。以“髌前囊炎”实体为例,其子串就包括“髌前”、“前囊”、“囊炎”、“髌前囊”、“前囊炎”、“髌前囊炎”。
S402、将解析后的子串分别置于整个词典W中进行频数统计,并选取频数前3的子串作为词根;针对有频数相同时,选择长度最长的子串作为词根。
本实施例中,当对“髌前囊炎”进行拆解后,将其子串分别置于整个字典W中进行频数统计。选取频数前3的子串作为词根,若有频数相同,但长度更长的子串,则优先选择长度更长的,由此将可能是词根的子串添加到词根集中。
S403、判断是否遍历完整个词典W,若是,则对选取的词根作去重处理,得到词根集WE,并进入步骤S404,否则,返回步骤S402;
S404、分别对剩余实体E'2中待对齐实体与其对应的剩余实体E′1中前十个推荐实体进行子串解析,并判断解析后的子串是否存在于词根集WE中,若是,则分别得到剩余实体E′1中前十个推荐实体的子串集{We11,We12,...,We110}和剩余实体E'2中待对齐实体的子串集We2,并进入步骤S405,否则,重复步骤S404,直至遍历完剩余实体E'2中所有子串和E′1中前十个推荐实体的子串;
S405、判断子串集{We11,We12,...,We110}与子串集We2中是否有相同的子串,若有,则保留生成该子串集的推荐实体,否则,删除该推荐实体,去除词根不相同的推荐实体,并根据判断结果得到新的推荐实体{e1,e2,...,em},并进入步骤S5,其中,m表示删除不同词根后的推荐实体数;
S5、判断所述剩余实体E'2中待对齐实体所在的科室或部位是否与经删除不同词根后的推荐实体{e1,e2,...,em}所在的科室或部位相同,若是,则保留该推荐实体,否则,删除该推荐实体,并根据判断结果得到新的推荐实体{e1,e2,...,el},其中,m表示删除没有相同词根后的推荐实体数,l表示删除不同科室或部位后的推荐实体数;
S6、将剩余实体E'2中待对齐实体与步骤S5中新的推荐实体进行标注,并找出新的推荐实体与剩余实体E'2中待对齐实体指向相同的实体,从而完成医学知识图谱实体对齐,其具体为:
将剩余实体E'2中每个待对齐实体在剩余实体E′1中的推荐实体{e1,e2,...,el}进行标注,并找出推荐实体{e1,e2,...,el}中与待对齐实体指向相同的实体,得到实体对(esim1,esim2),从而完成医学知识图谱的实体对齐,其中,esim1为剩余实体E′1中的推荐实体,esim2为剩余实体E'2中的待对齐实体。
本发明通过以上设计,在表示学习的基础上,根据医学领域知识的特点,加入词根和规则(科室或部位是否相同的判断)对候选实体进行筛选,得到更精确的实体对齐结果,解决了医学知识图谱实体对齐中阈值选取模糊和模型结构单一,导致无法保证对齐结果可靠性的问题。

Claims (3)

1.一种基于表示学习的医学知识图谱实体对齐方法,其特征在于,包括以下步骤:
S1、去除标准医学知识图谱K1和待对齐医学知识图谱K2中的公有实体,得到标准医学知识图谱K1的剩余实体E’1和待对齐医学知识图谱K2的剩余实体E'2,其中,实体的完全字符串匹配,找出两个知识图谱中的完全相同的实体,即公有实体Esim;对于对齐标准医学知识图谱K1,剩余实体为E’1=E1-Esim,对于待对齐医学知识图谱K2,剩余实体为E'2=E2-Esim,则将E'2中的每个实体与E’1中的所有实体进行对齐;
S2、通过知识表示学习模型分别对标准医学知识图谱K1和待对齐医学知识图谱K2中所有的三元组T1和T2进行训练,得到剩余实体E’1中每个实体的嵌入向量和剩余实体E'2中每个实体的嵌入向量;
S3、利用余弦相似度函数计算得到剩余实体E’1中每个实体的嵌入向量和剩余实体E'2中每个实体的嵌入向量的相似度值,并根据所述相似度值得到剩余实体E'2中每个待对齐实体与剩余实体E’1中所有实体相似度值最高的前十个推荐实体;
S4、根据标准医学知识图谱K1的所有实体E1和待对齐医学知识图谱K2中的所有实体E2构造词根集,并利用词根集获取剩余实体E'2中待对齐实体的词根与所述前十个推荐实体的词根,并去除词根不相同的推荐实体;
所述步骤S4包括以下步骤:
S401、根据标准医学知识图谱K1的所有实体E1和待对齐医学知识图谱K2中的所有实体E2构建词典W,W={W1,W2,...,Wn},并对Wi进行子串解析,其中,Wi表示词典中的某个词,i=1,2,...,n,n表示E1和E2为的实体数量之和;
S402、将解析后的子串分别置于整个词典W中进行频数统计,并选取频数前3的子串作为词根;所述步骤S402中词根还包括:针对有频数相同时,选择长度最长的子串作为词根;
S403、判断是否遍历完整个词典W,若是,则对选取的词根作去重处理,得到词根集WE,并进入步骤S404,否则,返回步骤S402;
S404、分别对剩余实体E'2中待对齐实体与其对应的剩余实体E’1中前十个推荐实体进行子串解析,并判断解析后的子串是否存在于词根集WE中,若是,则分别得到剩余实体E’1中前十个推荐实体的子串集{We11,We12,...,We110}和剩余实体E'2中待对齐实体的子串集We2,并进入步骤S405,否则,重复步骤S404,直至遍历完剩余实体E'2中所有子串和E’1中前十个推荐实体的子串;
S405、判断子串集{We11,We12,...,We110}与子串集We2中是否有相同的子串,若有,则保留生成该子串集的推荐实体,否则,删除该推荐实体,去除词根不相同的推荐实体,并根据判断结果得到新的推荐实体{e1,e2,...,em},并进入步骤S5,其中,m表示删除没有相同词根后的推荐实体数;
S5、判断所述剩余实体E'2中待对齐实体所在的科室或部位是否与经删除不同词根后的推荐实体{e1,e2,...,em}所在的科室或部位相同,若是,则保留该推荐实体,否则,删除该推荐实体,并根据判断结果得到新的推荐实体{e1,e2,...,el},其中,m表示删除不同词根后的推荐实体数,l表示删除不同科室或部位后的推荐实体数;
S6、将剩余实体E'2中待对齐实体与步骤S5中新的推荐实体{e1,e2,...,el}进行标注,并找出新的推荐实体{e1,e2,...,el}与剩余实体E'2中待对齐实体指向相同的实体,从而完成医学知识图谱实体对齐。
2.根据权利要求1所述的基于表示学习的医学知识图谱实体对齐方法,其特征在于,所述步骤S3中相似度值的表达式如下:
Figure FDA0003996981620000031
其中,
Figure FDA0003996981620000032
表示相似度值,
Figure FDA0003996981620000033
表示剩余实体E’1中每个实体的嵌入向量,
Figure FDA0003996981620000034
表示剩余实体E'2中每个实体的嵌入向量,
Figure FDA0003996981620000035
Figure FDA0003996981620000036
分别表示嵌入向量
Figure FDA0003996981620000037
Figure FDA0003996981620000038
的模。
3.根据权利要求1所述的基于表示学习的医学知识图谱实体对齐方法,其特征在于,所述步骤S6具体为:
将剩余实体E'2中每个待对齐实体在剩余实体E’1中的推荐实体{e1,e2,...,el}进行标注,并找出推荐实体{e1,e2,...,el}中与待对齐实体指向相同的实体,得到实体对(esim1,esim2),从而完成医学知识图谱的实体对齐,其中,esim1为剩余实体E’1中的推荐实体,esim2为剩余实体E'2中的待对齐实体。
CN202010151549.6A 2020-03-06 2020-03-06 一种基于表示学习的医学知识图谱实体对齐方法 Active CN111309930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010151549.6A CN111309930B (zh) 2020-03-06 2020-03-06 一种基于表示学习的医学知识图谱实体对齐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010151549.6A CN111309930B (zh) 2020-03-06 2020-03-06 一种基于表示学习的医学知识图谱实体对齐方法

Publications (2)

Publication Number Publication Date
CN111309930A CN111309930A (zh) 2020-06-19
CN111309930B true CN111309930B (zh) 2023-02-28

Family

ID=71147280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010151549.6A Active CN111309930B (zh) 2020-03-06 2020-03-06 一种基于表示学习的医学知识图谱实体对齐方法

Country Status (1)

Country Link
CN (1) CN111309930B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966124B (zh) * 2021-05-18 2021-07-30 腾讯科技(深圳)有限公司 知识图谱对齐模型的训练方法、对齐方法、装置及设备
CN113420161A (zh) * 2021-06-24 2021-09-21 平安科技(深圳)有限公司 一种节点文本融合方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109378053A (zh) * 2018-11-30 2019-02-22 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN110188206A (zh) * 2019-05-08 2019-08-30 北京邮电大学 基于翻译模型的协同迭代联合实体对齐方法及装置
CN110852895A (zh) * 2019-11-13 2020-02-28 易联众信息技术股份有限公司 一种基于知识图谱的医疗保障骗保行为发现方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105431839A (zh) * 2013-03-15 2016-03-23 罗伯特·哈多克 具有提供对知识的一步访问的自适应用户接口的智能互联网系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109378053A (zh) * 2018-11-30 2019-02-22 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN110188206A (zh) * 2019-05-08 2019-08-30 北京邮电大学 基于翻译模型的协同迭代联合实体对齐方法及装置
CN110852895A (zh) * 2019-11-13 2020-02-28 易联众信息技术股份有限公司 一种基于知识图谱的医疗保障骗保行为发现方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Review and Trend Analysis of Knowledge Graphs for Crop Pest and Diseases;Liu Xiaoxue;《IEEE》;20190509;全文 *
复杂网络的重叠社区发现并行算法;滕飞;《西南交通大学学报》;20190228;全文 *
知识图谱学习和推理研究进展;吴运兵等;《小型微型计算机系统》;20160915(第09期);全文 *
自适应属性选择的实体对齐方法;苏佳林等;《山东大学学报(工学版)》;20200229(第01期);全文 *
表示学习知识图谱的实体对齐算法;朱继召等;《东北大学学报(自然科学版)》;20181115(第11期);全文 *

Also Published As

Publication number Publication date
CN111309930A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN110399457B (zh) 一种智能问答方法和系统
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
US11520812B2 (en) Method, apparatus, device and medium for determining text relevance
CN111639190A (zh) 医疗知识图谱构建方法
CN112380325B (zh) 基于联合知识嵌入模型和事实记忆网络的知识图谱问答系统
CN102663129A (zh) 医疗领域深度问答方法及医学检索系统
CN104866593A (zh) 一种基于知识图谱的数据库搜索方法
CN112035511A (zh) 基于医学知识图谱的目标数据搜索方法及相关设备
WO2020010834A1 (zh) 一种faq问答库泛化方法、装置及设备
CN110175585B (zh) 一种简答题自动批改系统及方法
CN105045875A (zh) 个性化信息检索方法及装置
CN111026815B (zh) 基于用户辅助修正下的实体对特定关系抽取方法
CN111309930B (zh) 一种基于表示学习的医学知识图谱实体对齐方法
CN115599899B (zh) 基于飞行器知识图谱的智能问答方法、系统、设备及介质
CN113590784A (zh) 三元组信息抽取方法、装置、电子设备、及存储介质
CN112784065A (zh) 基于多阶邻域注意力网络的无监督知识图谱融合方法及装置
CN112395425A (zh) 一种数据处理方法、装置、计算机设备以及可读存储介质
CN115658846A (zh) 一种适用于开源软件供应链的智能搜索方法及装置
CN116561264A (zh) 一种基于知识图谱的智能问答系统的构建方法
CN113254671B (zh) 基于query分析的图谱优化方法、装置、设备及介质
CN114911893A (zh) 基于知识图谱的自动化构建知识库的方法及系统
CN114519107A (zh) 一种联合实体关系表示的知识图谱融合方法
CN113610626A (zh) 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质
CN114579606B (zh) 预训练模型数据处理方法、电子设备及计算机存储介质
CN116069876A (zh) 基于知识图谱的问答方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant