CN111816273B - 一种海量电子病历的大规模医学知识图谱构建方法 - Google Patents

一种海量电子病历的大规模医学知识图谱构建方法 Download PDF

Info

Publication number
CN111816273B
CN111816273B CN202010925515.8A CN202010925515A CN111816273B CN 111816273 B CN111816273 B CN 111816273B CN 202010925515 A CN202010925515 A CN 202010925515A CN 111816273 B CN111816273 B CN 111816273B
Authority
CN
China
Prior art keywords
sub
map
data source
graph
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010925515.8A
Other languages
English (en)
Other versions
CN111816273A (zh
Inventor
李瑞瑞
吴晓东
赵伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Futong Oriental Technology Co ltd
Original Assignee
Beijing Futong Oriental Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Futong Oriental Technology Co ltd filed Critical Beijing Futong Oriental Technology Co ltd
Priority to CN202010925515.8A priority Critical patent/CN111816273B/zh
Publication of CN111816273A publication Critical patent/CN111816273A/zh
Application granted granted Critical
Publication of CN111816273B publication Critical patent/CN111816273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种海量电子病历的大规模医学知识图谱构建方法,包括根据电子病历所给出的数据标签对电子病历数据源进行划分,得到样本数均衡的子数据源;采用并行的构建方式,为每一个子数据源构建一个对应的子图谱;计算所有子图谱的图谱密度,根据图谱密度进一步对子数据源进行划分,使得所有子图谱的图谱密度均衡;采用并行的方式对子图谱进行融合,直到最后只有一个图谱。通过上述方式,本发明能够大大提高利用海量电子病历构建大规模医学知识图谱的效率。

Description

一种海量电子病历的大规模医学知识图谱构建方法
技术领域
本发明涉及计算技术领域,特别是涉及一种海量电子病历的大规模医学知识图谱构建方法。
背景技术
随着医疗行业信息化水平的不断提高,传统的、功能相对独立的各类信息系统应用已经无法满足以病人为中心的医疗服务模式的需要,以精准医疗、智慧医疗为核心的医院信息化建设正在逐步推进。如何利用传统信息系统运行产生的大量电子病历来构建一个高质量的医学知识图谱,使其为入院导诊、病情分析等提供数据支持解决优质医疗资源不足的问题成为当前亟待解决的问题。
针对医学知识图谱的构建,目前有自顶向下和自底向上等两种方式,现在主要采用自底向上的构建方式。自底向上通常为从相关互联网专业网站爬取医学知识,结合专业医师的意见,设计医学知识表示方法,抽取实体和实体关系,然后对实体和实体关系数据进行整合、消歧和加工融合知识,构建一个医学知识图谱。然而,对于利用海量的电子病历数据构建大规模医学知识图谱效率较低,因此亟待提出一种新的技术方案来克服上述问题。
发明内容
本发明提供一种海量电子病历的大规模医学知识图谱构建方法,能够解决的面向海量数据构建大规模医学知识图谱效率低的问题。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种海量电子病历的大规模医学知识图谱构建方法,其特征在于,包括:
S1数据源划分:根据电子病历所给出的数据标签,按照科室-疾病-症状的顺序对电子病历数据源进行划分,得到样本数均衡的子数据源;
S2子图谱构建:采用并行的构建方式,为每一个子数据源构建一个对应的子图谱;
S3子图谱评价:计算所有子图谱的图谱密度,根据图谱密度进一步对所述子数据源进行划分,使得所有子图谱的图谱密度均衡;
S4子图谱合并:采用并行的方式融合子图谱得到大规模医学知识图谱。
进一步的,所述数据源划分,包括:
S11根据所述电子病历所属科室情况,将电子病历数据按照所属科室类别进行分类,并为划分后的子数据源添加划分依据属性;
S12以数据规模最小的子数据源作为标准集,标准集中的样本数记为
Figure DEST_PATH_IMAGE001
,计算子数据源 样本数的方差F1;
S13按照设定的比例选取样本数据量较大的子数据源作为待划分子数据源集;
S14若所述待划分子数据源集中所有子数据源的最新的划分依据属性都是症状,则结束数据源划分;
S15否则,将最新的划分依据属性不是症状的子数据源,按照疾病和症状属性,参照
Figure 498669DEST_PATH_IMAGE001
将子数据源划分为m份,并为划分后的子数据源添加划分依据属性;
S16以数据规模最小的子数据源作为标准集,标准集中的样本数记为
Figure 212547DEST_PATH_IMAGE001
S17计算当前划分下,子数据源样本数的方差F1';
S18若F1'小于0.9*F1,则令F1的值为F1',转入步骤S13;否则,结束数据源划分;
其中,m为将子数据源样本数除以标准集中的样本数
Figure 523443DEST_PATH_IMAGE001
得到的商进行向下取整得到的 值。
进一步的,所述子图谱构建,包括:
S21采用实体标注和关系抽取对子数据源进行数据抽取,获得实体和实体关系;
S22根据所述实体和实体关系构建一个结构化的语义知识库,并以三元组的形式储存实体、实体之间的关系;
S23在子图谱内部进行知识消歧和融合。
进一步的,所述子图谱评价,包括:
S31统计子图谱中的三元组数量T、实体数量E和关系数量R;
S32计算各个子图谱的实体密度(entity density, ED)和关系密度(relationdensity, RD),其中ED=2*T/E,RD=T/R;
S33计算各个子图谱的子图谱密度SD,计算公式如下:
Figure DEST_PATH_IMAGE002
S34计算平均子图谱密度值
Figure DEST_PATH_IMAGE003
S35若有图谱密度大于平均图谱密度1.5倍的子图谱,则将所述子图谱作为第一待划分子图谱集,转入步骤S36,否则转入步骤S38;
S36将所述第一待划分子图谱集对应的,且最新的划分依据属性不是症状的子数据源作为待划分子数据源集;
S37将所述待划分子数据源集中的子数据源划分得到k份子数据源,并添加划分依据属性,再对所述k份子数据源进行子图谱构建后,转入步骤S31;
S38结束子图谱评价;
其中,k为待划分子数据源集中的子数据源对应的子图谱密度与平均子图谱密度的熵向下取整得到的值。
进一步的,所述子图谱合并,包括:
S41子图谱相似度计算:以最新的划分依据属性为标准对子图谱进行归类并计算同一类下不同子图谱之间的相似度;
S42子图谱融合:采用贪婪算法,将所有子图谱按照子图谱相似度的高低程度进行两两选取后,采用并行的方式将子图谱融合成更大的子图谱;
S43若只剩下一个子图谱,则得到了大规模医学知识图谱,结束子图谱融合;若否,转入S41。
进一步的,所述子图谱相似度计算,包括:
按照最新的划分依据属性对所有子图谱进行归类,将最新的划分依据属性相同的子图谱放入C1类,并计算C1类中子图谱之间的相似度;
分别计算同一类下任意两个子图谱中的实体词的相似度和实体关系的相似度,所述实体词包括疾病、症状、药品或检查类实体词;
将所述实体词的相似度和实体关系的相似度进行加权求和得到两个子图谱的相似度。
进一步的,所述子图谱融合,包括:
选取待融合子图谱对:采用贪婪算法,依次选取相似度最大的两个子图谱作为待融合子图谱对,直到所有子图谱都已被选取或剩下一个子图谱;
子图谱对并行融合:对所述待融合子图谱对采用并行合并的方式进行子图谱融合。
本发明的有益效果是:本发明将大规模电子病历数据源按照其属性分为若干类样本量均衡的子数据源,对各个子数据源进行实体标注和关系抽取后构建子图谱,基于图谱密度评价反向指子数据源的划分从而得到图谱密度均衡的子图谱,最后将子图谱按照图谱相似度的高低对子图谱进行来两两组合后进行并行融合,迭代融合多次后得到最终的大规模医学知识图谱。本发明提出的反向指导的数据源划分、采用逆向划分方式并行进行图谱融合大大提高了医学知识图谱构建的效率。
附图说明
图1是本发明一种海量电子病历的大规模医学知识图谱构建方法示意图。
图2是一种海量电子病历的大规模医学知识图谱构建方法步骤4的示意图。
图3是一种海量电子病历的大规模医学知识图谱构建方法的另一实施例的示意图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
请参阅图1,本发明实施例包括:
一种海量电子病历的大规模医学知识图谱构建方法,包括如下步骤:
步骤S1数据源划分:根据电子病历所给出的数据标签,按照科室-疾病-症状的顺序对电子病历数据源进行划分,得到样本数均衡的子数据源;
步骤S2子图谱构建:采用并行的构建方式,为每一个子数据源构建一个对应的子图谱;
步骤S3子图谱评价:计算所有子图谱的图谱密度,根据图谱密度进一步对所述子数据源进行划分,使得所有子图谱的图谱密度均衡;
步骤S4子图谱合并:采用并行的方式融合子图谱得到大规模医学知识图谱;
其中,样本数均衡的子数据源,不是指各个子数据源的样本数全部一样,而是指通过步骤S11~S18得到样本数量差异较小的子数据源。
所述数据源划分,包括如下步骤:
S11根据所述电子病历所属科室情况,将电子病历数据按照所属科室类别进行分类,并为划分后的子数据源添加划分依据属性;
例如,首先按照科室进行划分,例如按照科室:内科进行划分,对得到的子数据源添加划分依据属性为科室:内科,此时最新的划分依据属性就是科室:内科,若第二次对所述子数据源进行划分,子数据源添加的划分依据属性为疾病:肿瘤,此时最新的划分依据属性就是疾病:肿瘤。
S12以数据规模最小的子数据源作为标准集,标准集中的样本数记为
Figure 184231DEST_PATH_IMAGE001
,计算子数 据源样本数的方差F1;
S13按照设定的比例选取样本数据量较大的子数据源作为待划分子数据源集;
S14若所述待划分子数据源集中所有子数据源的最新的划分依据属性都是症状,则结束数据源划分;
S15否则,将最新的划分依据属性不是症状的子数据源,按照疾病和症状属性,参照
Figure 529762DEST_PATH_IMAGE001
将子数据源划分为m份,并为划分后的子数据源添加划分依据属性;;
S16以数据规模最小的子数据源作为标准集,标准集中的样本数记为
Figure 148962DEST_PATH_IMAGE001
S17计算当前划分下,子数据源样本数的方差F1';
S18若F1'小于0.9*F1,则令F1的值为F1',转入步骤S13;否则,结束数据源划分。
其中,m为将子数据源样本数除以标准集中的样本数得到的商进行向下取整得到的值。
例如,选取样本数量较大的前10%的子数据源,参照
Figure 415995DEST_PATH_IMAGE001
按照疾病属性进行划分,得到 下取整
Figure DEST_PATH_IMAGE004
,即3个子数据源,并为划分后的子数据源添加划分依据属性疾病:心脏病。
所述子图谱构建,包括如下步骤:
S21采用实体标注和关系抽取对子数据源进行数据抽取,获得实体和实体关系;
S22构建一个结构化的语义知识库,以三元组的形式储存实体、实体之间的关系,存储结构包括<实体-关系-实体>、<实体-属性-属性值>;
S23在子图谱内部进行知识消歧和融合。
所述子图谱评价,包括如下步骤:
S31统计子图谱中的三元组数量T、实体数量E和关系数量R;
S32计算各个子图谱的实体密度(entity density, ED)和关系密度(relationdensity, RD),其中ED=2*T/E,RD=T/R;
S33计算各个子图谱的子图谱密度,计算公式如下:
Figure 677212DEST_PATH_IMAGE002
S34计算平均子图谱密度值
Figure 80512DEST_PATH_IMAGE003
S35若有图谱密度大于平均图谱密度1.5倍的子图谱,则将所述子图谱作为第一待划分子图谱集,转入步骤S36,否则转入步骤S38;
S36将所述第一待划分子图谱集对应的,且最新的划分依据属性不是症状的子数据源作为待划分子数据源集;
S37将所述待划分子数据源集中的子数据源划分得到k份子数据源,并添加划分依据属性,再对所述k份子数据源进行子图谱构建后,转入步骤S31;
S38结束子图谱评价;
其中,k为待划分子数据源集中的子数据源对应的子图谱密度与平均子图谱密度的熵向下取整得到的值。
请参阅图2,所述子图谱合并,包括如下步骤:
S41子图谱相似度计算:以最新的划分依据属性为标准对子图谱进行归类并计算同一类下不同子图谱之间的相似度;
S42子图谱融合:采用贪婪算法,将所有子图谱按照子图谱相似度的高低程度进行两两选取后,采用并行的方式将子图谱融合成更大的子图谱;
S43若只剩下一个子图谱,则得到了大规模医学知识图谱,结束子图谱融合;若否,转入S41。
所述子图谱相似度计算,包括如下步骤:
按照最新的划分依据属性对所有子图谱进行归类,将最新的划分依据属性相同的子图谱放入C1类,并计算C1类中子图谱之间的相似度;
分别计算同一类下任意两个子图谱中的实体词的相似度和实体关系的相似度,所述实体词包括疾病、症状、药品或检查类实体词;
将所述实体词的相似度和实体关系的相似度进行加权求和得到两个子图谱的相似度。
其中,对于一个划分了三次得到的子数据源,它的划分依据属性按添加的时间顺序依次为科室、疾病、症状,最新的划分依据属性为症状;对于只进行了两次划分得到的子数据源,它最新的划分依据属性为症状;所述C1类可以是症状类、疾病类或科室类;
计算同一类下任意两个子图谱中的疾病、症状、药品与检查等实体词的相似度和实体关系的相似度,按如下公式计算两子图谱相似度:
Figure DEST_PATH_IMAGE005
其中, V1,V2表示两个子图谱,score(Vn1,Vn2)表示两个子图谱中实体词之间的相似性得分;score(Vr1,Vr2)表示两个子图谱中实体关系之间的相似性得分,γ表示权重。
例如,如下表1所示为某一类下子图谱之间的相似度:
表1 子图谱相似度
Figure DEST_PATH_IMAGE006
根据表1的数据,采用贪婪算法选取两两待融合的子图谱,能得到相似度为0.534的子图谱1和子图谱2,相似度为0.387的子图谱3和子图谱5和相似度为0.136的子图谱4和子图谱6作为待融合的子图谱对。
所述S42子图谱融合,包括如下步骤:
S421选取待融合子图谱对:采用贪婪算法,依次选取相似度最大的两个子图谱作为待融合子图谱对,直到所有子图谱都已被选取或剩下一个子图谱;
S422子图谱对并行融合:对待融合子图谱对采用并行合并的方式进行子图谱融合。
请参阅图3,本发明的另一实施例包括:
一种海量电子病历的大规模医学知识图谱构建方法,包括如下步骤:
步骤S1数据源划分:根据电子病历所给出的数据标签,按照科室-疾病-症状的顺序对电子病历数据源进行划分,得到样本数均衡的子数据源;
将数据源划分得到n份子数据源。
步骤S2子图谱构建:采用并行的构建方式,为每一个子数据源构建一个对应的子图谱;
子图谱构建包括对子数据源进行实体标注和关系抽取;
步骤S3子图谱评价:计算所有子图谱的图谱密度,根据图谱密度进一步对所述子数据源进行划分,使得所有子图谱的图谱密度均衡;
通过本步骤得到图谱密度相近的m个子图谱。
步骤S4子图谱合并:采用并行的方式融合子图谱得到大规模医学知识图谱;
经过
Figure DEST_PATH_IMAGE007
次子图谱合并后,只剩下一个子图谱,即得到大规模医学知识图谱。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (5)

1.一种海量电子病历的大规模医学知识图谱构建方法,其特征在于,包括:
S1数据源划分:根据电子病历所给出的数据标签,按照科室-疾病-症状的顺序对电子病历数据源进行划分,得到样本数均衡的子数据源;
S2子图谱构建:采用并行的构建方式,为每一个子数据源构建一个对应的子图谱;
S3子图谱评价:计算所有子图谱的图谱密度,根据图谱密度进一步对所述子数据源进行划分,使得所有子图谱的图谱密度均衡;
S4子图谱合并:采用并行的方式融合子图谱得到大规模医学知识图谱;
所述子图谱评价,包括:
S31统计子图谱中的三元组数量T、实体数量E和关系数量R;
S32计算各个子图谱的实体密度ED和关系密度RD,其中ED=2*T/E,RD=T/R;
S33计算各个子图谱的子图谱密度SD,计算公式如下:SD=αED+(1-α)RD;
S34计算平均子图谱密度值
Figure FDA0002772752460000011
S35若有图谱密度大于平均图谱密度1.5倍的子图谱,则将所述子图谱作为第一待划分子图谱集,转入步骤S36,否则转入步骤S38;
S36将所述第一待划分子图谱集对应的,且最新的划分依据属性不是症状的子数据源作为待划分子数据源集;
S37将所述待划分子数据源集中的子数据源划分得到k份子数据源,并添加划分依据属性,再对所述k份子数据源进行子图谱构建后,转入步骤S31;
S38结束子图谱评价;
其中,k为待划分子数据源集中的子数据源对应的子图谱密度与平均子图谱密度的熵向下取整得到的值;
所述子图谱合并,包括:
S41子图谱相似度计算:以最新的划分依据属性为标准对子图谱进行归类并计算同一类下不同子图谱之间的相似度;
S42子图谱融合:采用贪婪算法,将所有子图谱按照子图谱相似度的高低程度进行两两选取后,采用并行的方式将子图谱融合成更大的子图谱;
S43若只剩下一个子图谱,则得到了大规模医学知识图谱,结束子图谱融合;若否,转入S41。
2.如权利要求1所述的方法,其特征在于,所述数据源划分,包括:
S11根据所述电子病历所属科室情况,将电子病历数据按照所属科室类别进行分类,并为划分后的子数据源添加划分依据属性;
S12以数据规模最小的子数据源作为标准集,标准集中的样本数记为
Figure FDA0002772752460000021
计算子数据源样本数的方差F1;
S13按照设定的比例选取样本数据量大的子数据源作为待划分子数据源集;
S14若所述待划分子数据源集中所有子数据源的最新的划分依据属性都是症状,则结束数据源划分;
S15否则,将最新的划分依据属性不是症状的子数据源,按照疾病和症状属性,参照
Figure FDA0002772752460000022
将子数据源划分为m份,并为划分后的子数据源添加划分依据属性;
S16以数据规模最小的子数据源作为标准集,标准集中的样本数记为
Figure FDA0002772752460000023
S17计算当前划分下,子数据源样本数的方差F1';
S18若F1'小于0.9*F1,则令F1的值为F1',转入步骤S13;否则,结束数据源划分;
其中,m为将子数据源样本数除以标准集中的样本数
Figure FDA0002772752460000024
得到的商进行向下取整得到的值。
3.如权利要求1所述的方法,其特征在于,所述子图谱构建,包括:
S21采用实体标注和关系抽取对子数据源进行数据抽取,获得实体和实体关系;
S22根据所述实体和实体关系构建一个结构化的语义知识库,并以三元组的形式储存实体、实体之间的关系;
S23在子图谱内部进行知识消歧和融合。
4.如权利要求1所述的方法,其特征在于,所述子图谱相似度计算,包括:
按照最新的划分依据属性对所有子图谱进行归类,将最新的划分依据属性相同的子图谱放入C1类,并计算C1类中子图谱之间的相似度;
分别计算同一类下任意两个子图谱中的实体词的相似度和实体关系的相似度,所述实体词包括疾病、症状、药品或检查类实体词;
将所述实体词的相似度和实体关系的相似度进行加权求和得到两个子图谱的相似度。
5.如权利要求1所述的方法,其特征在于,所述子图谱融合,包括:
选取待融合子图谱对:采用贪婪算法,依次选取相似度最大的两个子图谱作为待融合子图谱对,直到所有子图谱都已被选取或剩下一个子图谱;
子图谱对并行融合:对所述待融合子图谱对采用并行合并的方式进行子图谱融合。
CN202010925515.8A 2020-09-07 2020-09-07 一种海量电子病历的大规模医学知识图谱构建方法 Active CN111816273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010925515.8A CN111816273B (zh) 2020-09-07 2020-09-07 一种海量电子病历的大规模医学知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010925515.8A CN111816273B (zh) 2020-09-07 2020-09-07 一种海量电子病历的大规模医学知识图谱构建方法

Publications (2)

Publication Number Publication Date
CN111816273A CN111816273A (zh) 2020-10-23
CN111816273B true CN111816273B (zh) 2020-12-22

Family

ID=72859981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010925515.8A Active CN111816273B (zh) 2020-09-07 2020-09-07 一种海量电子病历的大规模医学知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN111816273B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507138B (zh) * 2020-12-28 2022-10-21 医渡云(北京)技术有限公司 专病知识图谱构建方法及装置、介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427491A (zh) * 2019-07-04 2019-11-08 北京爱医生智慧医疗科技有限公司 一种基于电子病历的医学知识图谱构建方法及装置
CN110472061A (zh) * 2019-07-08 2019-11-19 郑州大学 一种基于短文本相似度计算的知识图谱融合方法
CN110866124A (zh) * 2019-11-06 2020-03-06 北京诺道认知医学科技有限公司 基于多数据源的医学知识图谱融合方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11823798B2 (en) * 2016-09-28 2023-11-21 Merative Us L.P. Container-based knowledge graphs for determining entity relations in non-narrative text
US20180089383A1 (en) * 2016-09-29 2018-03-29 International Business Machines Corporation Container-Based Knowledge Graphs for Determining Entity Relations in Medical Text

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427491A (zh) * 2019-07-04 2019-11-08 北京爱医生智慧医疗科技有限公司 一种基于电子病历的医学知识图谱构建方法及装置
CN110472061A (zh) * 2019-07-08 2019-11-19 郑州大学 一种基于短文本相似度计算的知识图谱融合方法
CN110866124A (zh) * 2019-11-06 2020-03-06 北京诺道认知医学科技有限公司 基于多数据源的医学知识图谱融合方法及装置

Also Published As

Publication number Publication date
CN111816273A (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
Lamy et al. Explainable artificial intelligence for breast cancer: A visual case-based reasoning approach
Fasang et al. Visualizing sequences in the social sciences: Relative frequency sequence plots
Rotolo et al. Strategic intelligence on emerging technologies: Scientometric overlay mapping
Cao et al. Facetatlas: Multifaceted visualization for rich text corpora
Turner et al. An algorithmic definition of the axial map
JP5822680B2 (ja) 平坦データの階層情報を取得する方法及び装置
CN109074858A (zh) 没有明显准标识符的去识别的健康护理数据库的医院匹配
CN110470303A (zh) 一种医院内就诊导航方法及装置
Bernal et al. GTCreator: a flexible annotation tool for image-based datasets
CN113488180B (zh) 一种临床指南知识建模方法及系统
CN113742443A (zh) 多药共用查询方法、移动终端及存储介质
Gómez‐Núñez et al. Updating the SCI mago journal and country rank classification: A new approach using W ard's clustering and alternative combination of citation measures
CN111816273B (zh) 一种海量电子病历的大规模医学知识图谱构建方法
Yao et al. Mapping longitudinal scientific progress, collaboration and impact of the Alzheimer’s disease neuroimaging initiative
CN111524600A (zh) 基于neighbor2vec的肝癌术后复发风险预测系统
Mohamed et al. Space syntax has come of age: A bibliometric review from 1976 to 2023
CN111581969A (zh) 医疗术语向量表示方法、装置、存储介质及电子设备
Carlow et al. TOPOI–A method for analysing settlement units and their linkages in an urban–rural fabric
CN114637811A (zh) 数据表实体关系图生成方法、装置、设备及存储介质
US10614136B2 (en) Method and system for managing primary field-specific entity records required by user
Sleit et al. Corner-based splitting: An improved node splitting algorithm for R-tree
Das et al. Machine learning landscapes and predictions for patient outcomes
CN116737945B (zh) 一种患者emr知识图谱映射方法
Yang et al. LAZY R-tree: The R-tree with lazy splitting algorithm
Lin et al. Automatic tourist attraction and representative icon determination for tourist map generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant