CN107357924A - 一种精准医学知识图谱构建方法和装置 - Google Patents

一种精准医学知识图谱构建方法和装置 Download PDF

Info

Publication number
CN107357924A
CN107357924A CN201710611965.8A CN201710611965A CN107357924A CN 107357924 A CN107357924 A CN 107357924A CN 201710611965 A CN201710611965 A CN 201710611965A CN 107357924 A CN107357924 A CN 107357924A
Authority
CN
China
Prior art keywords
infrastructure elements
data framework
evidence
data
daughter element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710611965.8A
Other languages
English (en)
Other versions
CN107357924B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shuo Medical Data Technology (beijing) Co Ltd
Original Assignee
Shuo Medical Data Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shuo Medical Data Technology (beijing) Co Ltd filed Critical Shuo Medical Data Technology (beijing) Co Ltd
Priority to CN201710611965.8A priority Critical patent/CN107357924B/zh
Publication of CN107357924A publication Critical patent/CN107357924A/zh
Application granted granted Critical
Publication of CN107357924B publication Critical patent/CN107357924B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种精准医学知识图谱构建方法和装置,该方法包括:根据预设的筛选标准,从医学知识结构中,确定构建精准医学知识图谱需要的至少一个基础元素;针对确定的每个所述基础元素,基于预设的基础元素与子元素的映射关系、子元素与医学属性信息的映射关系,确定该基础元素的数据框架;根据确定的各个基础元素的数据框架,从预设的精准医学知识库提取各个数据框架之间的关系信息;根据各个所述数据框架、各个数据框架之间的关系信息,基于预设的循证精准医学知识库,确定循证临床注释模型;根据各个基础元素的数据框架以及循证临床注释模型,构建精准医学知识图谱。本发明还公开相应的精准医学知识图谱构建装置。

Description

一种精准医学知识图谱构建方法和装置
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种精准医学知识图谱构建方法和装置。
背景技术
知识图谱是一种图结构的知识库,属于知识工程的范畴。不同于普通知识库,知识图谱融合所有学科,将不同来源、不同类型、不同结构的知识单元通过链接关联成图,基于各学科的元数据,为用户提供更广度、更深度的知识体系并不断扩充。其本质上是将领域知识数据体系化、关系化,并以图的方式将知识可视化。简单来说,知识图谱是基于信息系统建立的知识体系,通过数据采集、数据挖掘、信息处理、知识计量和图形绘制等技术把复杂的知识领域系统地显示出来,揭示知识领域的动态发展规律。
目前临床医学领域中的病症、疾病即诊疗手段之间通常存在着错综复杂的关系,而现有的关系模型的数据存储模式固定,形式单一,缺乏直观性和灵活性,不适用于规模数量大或具有结构化层次的医学知识的表达,不便于医学知识体系内容的扩充,也不能为医护人员提供直观的参考。
发明内容
有鉴于此,本发明的目的在于提供一种精准医学知识图谱构建方法和装置,便于大规模数量的医学知识的表达,为医学人员提供更直观的参考,从而减少医疗事故的发生,提高医疗服务质量。
第一方面,本发明实施例提供一种精准医学知识图谱构建方法,包括:
确定构建精准医学知识图谱需要的至少一个基础元素;
针对确定的每个所述基础元素,基于预设的基础元素、子元素、医学属性信息的映射关系,确定该基础元素的数据框架,所述数据框架包括与基础元素相关的至少一个子元素和与每个子元素相关的医学属性信息;
根据确定的各个基础元素的数据框架,从预设的精准医学知识库提取各个基础元素的数据框架之间的关系信息;
根据确定各个所述数据框架、各个基础元素的数据框架之间的关系信息,基于预设的循证精准医学知识库,确定至少一个循证临床注释模型,所述循证临床注释模型为对相关数据框架的临床注释,所述循证数据库表征数据框架、各个基础元素的数据框架之间的关系信息以及循证临床注释之间的映射关系;
根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱。
可选地,所述针对确定的每个所述基础元素,基于预设的基础元素与子元素的映射关系、子元素与医学属性信息的映射关系,确定该基础元素的数据框架,包括:
针对确定的每个所述基础元素,基于预设的基础元素和子元素的映射关系,确定与该基础元素匹配的至少一个子元素;
针对确定的每个子元素,基于预设的子元素与医学属性信息的映射关系,确定该子元素的医学属性信息;
根据所述基础元素、确定的所述至少一个子元素和各个子元素的医学属性信息,针对每个基础元素,确定该基础元素的数据框架。
可选地,还包括:
将确定的各基础元素的数据框架以及循证临床注释模型以二维表的形式存储。
可选地,所述根据各个基础元素的数据框架、各个数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱,包括:
将存储的包括各基础元素的数据框架以及循证临床注释模型的二维表转化为图数据;
根据所述图数据构建所述精准医学图谱。
可选地,所述根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱,包括:
根据确定的各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,以各个基础元素的数据框架的标识或各个循证临床注释模型的标识作为节点,以各个基础元素的数据框架之间的关系信息作为有向线段,构建精准医学知识图谱。
第二方面,本发明的实施例提供一种精准医学知识图谱构建装置,包括:
第一确定单元,用于确定构建精准医学知识图谱需要的至少一个基础元素;
第二确定单元,用于针对确定的每个所述基础元素,基于预设的基础元素、子元素、医学属性信息的映射关系,确定该基础元素的数据框架,所述数据框架包括与基础元素相关的至少一个子元素和与每个子元素相关的医学属性信息;
提取单元,用于根据确定的各个基础元素的数据框架,从预设的精准医学知识库提取各个基础元素的数据框架之间的关系信息;
第三确定单元,用于根据确定各个所述数据框架、各个基础元素的数据框架之间的关系信息,基于预设的循证精准医学知识库,确定至少一个循证临床注释模型,所述循证临床注释模型为对相关数据框架的临床注释,所述循证数据库表征数据框架、各个基础元素的数据框架之间的关系信息以及循证临床注释之间的映射关系;
第四确定单元,用于根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱。
可选地,所述第二确定单元具体用于:
针对确定的每个所述基础元素,基于预设的基础元素和子元素的映射关系,确定与该基础元素匹配的至少一个子元素;
针对确定的每个子元素,基于预设的子元素与医学属性信息的映射关系,确定该子元素的医学属性信息;
根据所述基础元素、确定的所述至少一个子元素和各个子元素的医学属性信息,针对每个基础元素,确定该基础元素的数据框架。
可选地,所述第二确定单元还用于,将确定的各基础元素的数据框架以二维表的形式存储;
第三确定单元还用于将循证临床注释模型以二维表的形式存储。
可选地,所述第四确定单元具体用于:
将存储的包括各基础元素的数据框架以及循证临床注释模型的二维表转化为图数据;
根据所述图数据构建所述精准医学图谱。
可选地,所述第四确定单元具体用于:
根据确定的各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,以各个基础元素的数据框架的标识或各个循证临床注释模型的标识作为节点,以各个基础元素的数据框架之间的关系信息作为有向线段,构建精准医学知识图谱。
根据本发明的技术方案,确定构建精准医学知识图谱所需要的至少一个基础元素,确定各基础元素的数据框架,构建循证临床注释模型,最终建立精准医学知识图谱,使得大规模医学知识的表达更加直观,提高医护人员的效率,减少医疗事故的发生,提高医疗服务质量。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种精准医学知识图谱构建方法的流程图;
图2为本发明实施例提供的一种精准精准医学知识库结构的示意图;
图3为本发明实施例提供的一种精准医学知识图谱构建装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种精准医学知识图谱构建方法的流程图。如图1所示,该方法始于步骤S110。
在步骤S110中,确定构建精准医学知识图谱需要的至少一个基础元素。
在步骤S120中,针对确定的每个所述基础元素,基于预设的基础元素、子元素、医学属性信息的映射关系,确定该基础元素的数据框架,所述数据框架包括与基础元素相关的至少一个子元素和与每个子元素相关的医学属性信息。
在步骤S130中,根据确定的各个基础元素的数据框架,从预设的精准医学知识库提取各个基础元素的数据框架之间的关系信息。
在步骤S140中,根据确定各个所述数据框架、各个基础元素的数据框架之间的关系信息,基于预设的循证精准医学知识库,确定至少一个循证临床注释模型,所述循证临床注释模型为对相关数据框架的临床注释,所述循证数据库表征数据框架、各个基础元素的数据框架之间的关系信息以及循证临床注释之间的映射关系。
在步骤S150中,根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱。
可选地,根据预设的筛选标准,从精准医学知识结构中,确定构建精准医学知识图谱需要的至少一个基础元素。
在执行步骤S110时,可通过对精准医学知识结构的构成特征进行分析研究,基础元素在临床层面或组学层面的指标影响因素,确定四个基础元素。
可选地,所述基础元素至少包括疾病元素、药物元素、生物标记物元素、组学变异元素。
可选地,在执行步骤S120时,所述针对确定的每个所述基础元素,基于预设的基础元素与子元素的映射关系、子元素与医学属性信息的映射关系,确定该基础元素的数据框架,包括:
针对确定的每个所述基础元素,基于预设的基础元素和子元素的映射关系,确定与该基础元素匹配的至少一个子元素;
针对确定的每个子元素,基于预设的子元素与医学属性信息的映射关系,确定该子元素的医学属性信息;
根据所述基础元素、确定的所述至少一个子元素和各个子元素的医学属性信息,针对每个基础元素,确定该基础元素的数据框架。
精准医学的本质是通过基因组、蛋白质组等组学技术和医学前沿技术,对于大样本人群与特定疾病类型进行生物标记物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的靶点,并对一种疾病不同状态和过程进行精确分类,最终实现对于疾病和特定患者进行个体化精准治疗的目的,提高疾病诊治与预防的效益。
具体地,以肺癌为例说明,不同的肺癌类型对药物的响应、临床诊疗方法都存在差异。而在组学方面,癌基因和抑癌基因作为多数靶向药物的靶标,其不同组学层面的变异,如脱氧核糖核酸(DNA)层面的单核苷酸变异、插入缺失、拷贝数变化、甲基化等,核糖核酸(RNA)层面的表达水平变化和融合变异等,蛋白层面的表达变化,都会影响患者对靶向药物的敏感性、化疗药物的药效、以及预后效果;另外药物代谢酶类、药物转运体、和药物靶标相关基因的胚系多态性变异,也会造成不同患者个体在药物代谢快慢、所需药物剂量、不良反应、及药效等方面的差异。为了正确刻画不同的变异对不同的肺癌类型、不同药物的临床影响,实现对患者个体组学变异的正确临床解读,整合肺癌相关科研文献研究结果、监管机构的审批结果、临床指南等信息,构建结构化循证肺癌精准精准医学知识库,形成肺癌的精准医学知识图谱,实现自动化的肺癌患者个体组学变异数据的循证临床解读。以下进行详细叙述。
具体地,参考图2,在建立疾病元素的数据框架时,以肺癌为例进行说明,参照MeSH对不同类型肺癌的命名与分类,采用层级树状分类法确定每个框架间的从属关系,构成肺癌疾病的框架网络。不同类型的肺癌(如小细胞肺癌)由其对应的框架来存储相关医学属性信息,框架名即该疾病名称。每种肺癌类型的医学属性信息为医学主题词表标识(MeSHID)、别名、症状、常见病因描述、常见诊断方法描述及对应的数据类型限制等,即确立相对应的槽及侧面。槽值、侧面值等内容的填充参考医学主题词表(MeSH)、在线《人类孟德尔遗传》(OMIM)、疾病本体(DiseaseOntology)、国家癌症研究词典(NCIThesaurus)等数据库,按照该产品开发标准作业程序(SOP)进行格式化、标准化,并以自己的语言进行中英双语表述。在线《人类孟德尔遗传》(OMIM)用于持续更新的关于人类基因和遗传紊乱的数据库。
在建立药物元素的数据框架时,参考药物库(DrugBank)进行药物命名填充,药物的相关结构化描述(槽及侧面)为参考药物库标识(DrugBankID)、别名、靶标、类型、作用机制、副作用等及对应的数据类型限制等。槽值、侧面值等属性内容填充参考药物库(DrugBank)、丙氨酸氨基转移酶(ACT)等数据库,按照产品开发SOP进行格式化、标准化,并以自己的语言进行中英双语表述,以储存肺癌相关的药物的信息知识,框架名即药物名。
在建立生物标记物(Biomarker)元素的数据框架时,用以储存收录的生物标记物相关信息知识。肺癌相关生物标记物的命名采用国际人类基因命名委员会(Human GeneNomenclature Committee,HGNC)和人类染色体命名符号与核型式(ISCN)标准,包括基因、假基因、信使RNA(mRNA)、非编码RNA、蛋白、核型等类型。框架名即生物标记物名,生物标记物的医学属性信息(槽及侧面)为美国国家生物技术信息中心在线资源检索器标识(EntrezID)、别名、生物标记物类型、基因类型、所处染色体、在染色体上的物理位置、所处DNA链(正链/负链)、参考基因组版本、功能类别、简述、机制描述等。槽值、侧面值等属性信息内容填充参考美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)、英国韦尔科姆基因会桑格研究所基金会及欧洲分子生物学实验室所属分部欧洲生物信息学研究所共同协作运营的生物信息数据库(Ensemble)、科研文献等的相关内容,按照产品开发SOP进行格式化、标准化,并以自己的语言进行中英双语表述。
在建立组学变异(Variation)数据框架时,用以存储收录的组学变异相关信息。每个组学变异关联变异所处的生物标记物,并根据变异的组学层级及其类型的不同、采用层级树状分类确立框架间的从属关系,如组学变异分为DNA、RNA、蛋白三个水平,其中,DNA水平上的组学变异有单核苷酸变异、插入缺失、基因拷贝数变异(Copy number variations,CNV)、结构性变异、甲基化等,RNA水平上的组学变异有差异表达、融合等,蛋白水平上的组学变异有差异表达等。组学变异的医学属性信息(槽值)为关联的生物标记物、DNA链、所处染色体、变异的物理位置、参考基因组版本及变异的分子机制描述。不同水平不同类型的组学变异因其特征不同,其框架内定义的槽和侧面也不同。以单核苷酸变异为例,其定义的槽和侧面包括转录本、参考序列、变异后序列、编码序列变化、氨基酸变化、所处/相邻外显子、单核苷酸多态性参考文献(Ref SNP)等描述,而多态性单核苷酸变异还包括变异在不同人群中的发生率;融合变异模型还包括5’基因和3’基因的转录本、观察到的外显子、插入序列、断点位置等。槽值、侧面值等内容的填充根据所收录循证文献提及的组学变异,选择相适配的框架,从NCBI、Ensembl、单核苷酸多态性数据库(db SNP)、癌症体细胞变异目录(COSMIC)、遗传药理学和基因组药理学数据库(The Pharmacogenetics&Pharmacogenomicsknowledgebase,PharmGKB)等公共组学数据库中抽取整合相关属性信息填入槽中,槽值、侧面值等皆通过为朔开发的算法、依照HGVS组学变异命名标准对其进行了错误校正和标准化、归一化处理。
参考文献(Reference)框架一般用以储存收录的参考文献相关信息。框架名即参考文献名,参考文献的医学属性信息(槽及侧面)为:文献的题目、作者、年代、出版社、证据等级、美国公共医学数据库标识(PubMed ID)、文献研究的疾病、人群、关键词、文献链接、文献简介、在知识库中所关联的框架等。槽值、侧面值等属性信息内容填充参考美国国立生物技术信息中心(NCBI)、Ensemble、相关文献等内容,按照产品开发SOP进行格式化、标准化,并以自己的语言进行中英双语表述。
建立治疗方案(Treatment)数据框架时,用以存储收录的治疗方案相关信息。主要有美国食品药品管理局(FDA)、中国国家食品药品监督管理总局(CFDA)已审批通过的方案、美国国立综合癌症网络(National Comprehensive Cancer Network,NCCN)指南中的方案、专家共识及处于临床研究阶段但已有显著效果的治疗方案的相关信息。治疗方案包括靶向治疗、内分泌疗法等生物疗法,以及与生物疗法联合生物疗法、生物疗法联合化疗等的联合方案。框架名为治疗方案名,治疗方案的结构化属性描述(槽及侧面)为适应症、疾病分期、应用患者、客观响应率等相关信息。按照产品开发SOP进行格式化、标准化,并以自己的语言进行中英双语表述。
建立联合组学变异(Combined Variation)数据框架时,用以存储组学变异的联合关系。多个组学变异的发生对临床的联合影响包括并发协同(“与”关系)和替代相似(“或”关系)两种联合类型,如,一个同一生物标记物上多个位点的单核苷酸变异都有相同的表型影响,则这些变异为”或”关系。构建的联合变异框架网络兼容“与”和“或”两种类型,包括同一层次、同一类型的联合变异;同一层次不同类型的联合变异;不同层次的联合变异及药物基因组学的星型基因型表示法。可通过转换可将受检者个体的组学变异转换为药物基因组学的星型基因型,并与知识库中收录的联合组学变异名进行匹配。
建立循证临床医学注释(Annotation)模型时,依据循证精准医学知识库,存储组学变异对临床表型(如生物体外在表现出来的功能等)的影响信息。根据对肺癌进行分子检测的临床应用环境的不同,肺癌相关组学变异对临床表型的影响包括组学变异对生物疗法(包括靶向药物、内分泌药物、免疫疗法等)的易感性、药物代谢动力学、药效动力学、预后的影响四种类型。
基于不同类型的影响,构建相适配的临床注释模型,关联循证依据(相关文献、指南等)中证实的疾病、药物和具体的组学变异。对循证注释的结构化属性描述(槽及侧面)包括循证医学证据等级(临床试验、队列研究、病例对照等)、样本量、样本人群、临床指标等。
生物疗法的易感性注释模型包括DNA组织来源、对药物的敏感、可能敏感、可能耐药、耐药的等级划分、包括总生存期、客观缓解率、无进展生存期等指标在内的循证依据结果描述。
药物代谢动力学注释模型包括预先设置的证据等级、遗传药理学和基因组药理学数据库(PharmGKB)中临床注释等级、代谢类型(超快代谢、快代谢、正常代谢、中间代谢、慢代谢)划分、药物剂量升高或降低的划分、包括剂量、血药浓度等指标在内的药代动力学描述。
药效动力学注释模型包括证据等级、PharmGKB中临床注释等级、药物效率提高或降低的划分、不良反应风险增加或降低的等级划分、包括抗性风险、不良反应、生存期等指标在内的药效动力学描述。
预后注释模型包括预后好或坏的等级划分、包括总生存期、客观缓解率、无进展生存期等指标在内的循证依据结果描述。
信息来源包括美国国立综合癌症网络(NCCN)、临床药物基因组学实施联盟(clinical problems index of complexity,CPIC)、荷兰遗传药理工作组(DPWG)指南和生物医学文献期刊等,通过自然语言处理工具可自动化搜索、定位、分类美国公共医学数据库(Pubmed)中的文献,遵循“引用>试验设计*>样本大小>杂志影响因子>杂志”的文献选取原则和SOP结构化抽取循证证据,进行标准化、归一化,并以相应的语言进行中英双语表述。对于研究结果相矛盾的文献,采取在循证依据结果描述中同时呈现的原则。
基于上述基础要素框架、基础要素的联合框架、关联基础要素的循证临床注释模型,根据其名称(框架名、槽名、侧面名)、内容(槽值和侧面值)的相互关联整合形成循证结构化精准医学知识图谱。每个实体具有唯一确定的标示符,每个框架刻画实体内在属性,循证关系连接实体,刻画它们的关联。并提供时态数据刻画知识图谱的时态信息,包括知识的生成时间、在特定时间的状态和版本等。
可选地,该方法还包括:
将确定的各基础元素的数据框架以及循证临床注释模型以二维表的形式存储。
可选地,所述根据各个基础元素的数据框架、各个数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱,包括:
将存储的包括各基础元素的数据框架以及循证临床注释模型的二维表转化为图数据;
根据所述图数据构建所述精准医学图谱。
可选地,所述根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱,包括:
根据确定的各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,以各个基础元素的数据框架的标识或各个循证临床注释模型的标识作为节点,以各个基础元素的数据框架之间的关系信息作为有向线段,构建精准医学知识图谱。通过上述方式构建的精准医学知识图谱,采用非关系型数据存储模式,为医护人员提供更直观的参考,从而降低医疗事故的发生。
图3为本发明实施例提供的一种精准医学知识图谱构建装置的结构示意图。如图3所示,该装置包括:第一确定单元310、第二确定单元320、提取单元330、第三确定单元340、第四确定单元350。
第一确定单元310,用于确定构建精准医学知识图谱需要的至少一个基础元素。
第二确定单元320,用于针对确定的每个所述基础元素,基于预设的基础元素、子元素、医学属性信息的映射关系,确定该基础元素的数据框架,所述数据框架包括与基础元素相关的至少一个子元素和与每个子元素相关的医学属性信息。
提取单元330,用于根据确定的各个基础元素的数据框架,从预设的精准医学知识库提取各个基础元素的数据框架之间的关系信息。
第三确定单元340,用于根据确定各个所述数据框架、各个基础元素的数据框架之间的关系信息,基于预设的循证精准医学知识库,确定至少一个循证临床注释模型,所述循证临床注释模型为对相关数据框架的临床注释,所述循证数据库表征数据框架、各个基础元素的数据框架之间的关系信息以及循证临床注释之间的映射关系。
第四确定单元350,用于根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱。
可选地,所述第二确定单元320具体用于:
针对确定的每个所述基础元素,基于预设的基础元素和子元素的映射关系,确定与该基础元素匹配的至少一个子元素;
针对确定的每个子元素,基于预设的子元素与医学属性信息的映射关系,确定该子元素的医学属性信息;
根据所述基础元素、确定的所述至少一个子元素和各个子元素的医学属性信息,针对每个基础元素,确定该基础元素的数据框架。
可选地,所述第二确定单元320还用于,将确定的各基础元素的数据框架以二维表的形式存储;
第三确定单元340还用于将循证临床注释模型以二维表的形式存储。
可选地,所述第四确定单元350具体用于:
将存储的包括各基础元素的数据框架以及循证临床注释模型的二维表转化为图数据;
根据所述图数据构建所述精准医学图谱。
可选地,所述第四确定单元350具体用于:
根据确定的各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,以各个基础元素的数据框架的标识或各个循证临床注释模型的标识作为节点,以各个基础元素的数据框架之间的关系信息作为有向线段,构建精准医学知识图谱。
本发明实施例所提供一种精准医学知识图谱构建装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种精准医学知识图谱构建方法,其特征在于,包括:
确定构建精准医学知识图谱需要的至少一个基础元素;
针对确定的每个所述基础元素,基于预设的基础元素、子元素、医学属性信息的映射关系,确定该基础元素的数据框架,所述数据框架包括与基础元素相关的至少一个子元素和与每个子元素相关的医学属性信息;
根据确定的各个基础元素的数据框架,从预设的精准医学知识库提取各个基础元素的数据框架之间的关系信息;
根据确定各个所述数据框架、各个基础元素的数据框架之间的关系信息,基于预设的循证精准医学知识库,确定至少一个循证临床注释模型,所述循证临床注释模型为对相关数据框架的临床注释,所述循证数据库表征数据框架、各个基础元素的数据框架之间的关系信息以及循证临床注释之间的映射关系;
根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱。
2.如权利要求1所述的方法,其特征在于,所述针对确定的每个所述基础元素,基于预设的基础元素与子元素的映射关系、子元素与医学属性信息的映射关系,确定该基础元素的数据框架,包括:
针对确定的每个所述基础元素,基于预设的基础元素和子元素的映射关系,确定与该基础元素匹配的至少一个子元素;
针对确定的每个子元素,基于预设的子元素与医学属性信息的映射关系,确定该子元素的医学属性信息;
根据所述基础元素、确定的所述至少一个子元素和各个子元素的医学属性信息,针对每个基础元素,确定该基础元素的数据框架。
3.如权利要求1所述的方法,其特征在于,还包括:
将确定的各基础元素的数据框架以及循证临床注释模型以二维表的形式存储。
4.如权利要求3所述的方法,其特征在于,所述根据各个基础元素的数据框架、各个数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱,包括:
将存储的包括各基础元素的数据框架以及循证临床注释模型的二维表转化为图数据;
根据所述图数据构建所述精准医学图谱。
5.如权利要求1所述的方法,其特征在于,所述根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱,包括:
根据确定的各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,以各个基础元素的数据框架的标识或各个循证临床注释模型的标识作为节点,以各个基础元素的数据框架之间的关系信息作为有向线段,构建精准医学知识图谱。
6.一种精准医学知识图谱构建装置,其特征在于,包括:
第一确定单元,用于确定构建精准医学知识图谱需要的至少一个基础元素;
第二确定单元,用于针对确定的每个所述基础元素,基于预设的基础元素、子元素、医学属性信息的映射关系,确定该基础元素的数据框架,所述数据框架包括与基础元素相关的至少一个子元素和与每个子元素相关的医学属性信息;
提取单元,用于根据确定的各个基础元素的数据框架,从预设的精准医学知识库提取各个基础元素的数据框架之间的关系信息;
第三确定单元,用于根据确定各个所述数据框架、各个基础元素的数据框架之间的关系信息,基于预设的循证精准医学知识库,确定至少一个循证临床注释模型,所述循证临床注释模型为对相关数据框架的临床注释,所述循证数据库表征数据框架、各个基础元素的数据框架之间的关系信息以及循证临床注释之间的映射关系;
第四确定单元,用于根据各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,构建精准医学知识图谱。
7.如权利要求6所述的装置,其特征在于,所述第二确定单元具体用于:
针对确定的每个所述基础元素,基于预设的基础元素和子元素的映射关系,确定与该基础元素匹配的至少一个子元素;
针对确定的每个子元素,基于预设的子元素与医学属性信息的映射关系,确定该子元素的医学属性信息;
根据所述基础元素、确定的所述至少一个子元素和各个子元素的医学属性信息,针对每个基础元素,确定该基础元素的数据框架。
8.如权利要求6所述的装置,其特征在于,所述第二确定单元还用于,将确定的各基础元素的数据框架以二维表的形式存储;
第三确定单元还用于将循证临床注释模型以二维表的形式存储。
9.如权利要求8所述的装置,其特征在于,所述第四确定单元具体用于:
将存储的包括各基础元素的数据框架以及循证临床注释模型的二维表转化为图数据;
根据所述图数据构建所述精准医学图谱。
10.如权利要求6所述的装置,其特征在于,所述第四确定单元具体用于:
根据确定的各个基础元素的数据框架、各个基础元素的数据框架之间的关系信息以及各个循证临床注释模型,以各个基础元素的数据框架的标识或各个循证临床注释模型的标识作为节点,以各个基础元素的数据框架之间的关系信息作为有向线段,构建精准医学知识图谱。
CN201710611965.8A 2017-07-25 2017-07-25 一种精准医学知识图谱构建方法和装置 Active CN107357924B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710611965.8A CN107357924B (zh) 2017-07-25 2017-07-25 一种精准医学知识图谱构建方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710611965.8A CN107357924B (zh) 2017-07-25 2017-07-25 一种精准医学知识图谱构建方法和装置

Publications (2)

Publication Number Publication Date
CN107357924A true CN107357924A (zh) 2017-11-17
CN107357924B CN107357924B (zh) 2020-04-24

Family

ID=60285534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710611965.8A Active CN107357924B (zh) 2017-07-25 2017-07-25 一种精准医学知识图谱构建方法和装置

Country Status (1)

Country Link
CN (1) CN107357924B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243528A (zh) * 2018-08-14 2019-01-18 张旭蓓 基于知识图谱有向图的生物过程控制方法
CN109378053A (zh) * 2018-11-30 2019-02-22 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN109543096A (zh) * 2018-10-15 2019-03-29 平安科技(深圳)有限公司 数据查询方法、装置、计算机设备和存储介质
CN109657065A (zh) * 2018-10-31 2019-04-19 百度在线网络技术(北京)有限公司 知识图谱处理方法、装置及电子设备
CN109919585A (zh) * 2019-05-14 2019-06-21 上海市浦东新区行政服务中心(上海市浦东新区市民中心) 基于知识图谱的人工智能辅助行政审批方法、系统及终端
CN110189831A (zh) * 2019-06-06 2019-08-30 厦门大学 一种基于动态图序列的病历知识图谱构建方法及系统
CN110245242A (zh) * 2019-06-20 2019-09-17 北京百度网讯科技有限公司 医学知识图谱构建方法、装置以及终端
CN112015905A (zh) * 2020-08-05 2020-12-01 河北工程大学 一种疲劳标志疾病知识图谱的构建方法
CN112800283A (zh) * 2021-01-29 2021-05-14 重庆恒真维实医药科技有限公司 一种基于药代动力学的医学数据库的建立方法
CN113488180A (zh) * 2021-07-28 2021-10-08 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
WO2022198625A1 (zh) * 2021-03-26 2022-09-29 深圳华大基因股份有限公司 变异文献解读知识库的构建方法、解读方法及电子设备
WO2023071530A1 (zh) * 2021-10-26 2023-05-04 之江实验室 一种小样本弱标注条件下的医疗事件识别方法及系统
CN117292846A (zh) * 2023-11-27 2023-12-26 神州医疗科技股份有限公司 一种肠道微生物知识图谱的构建方法及装置
CN117747096A (zh) * 2024-02-21 2024-03-22 神州医疗科技股份有限公司 一种基于病理组学知识库的辅助诊疗系统及构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021281A (zh) * 2016-04-29 2016-10-12 京东方科技集团股份有限公司 医学知识图谱的构建方法、其装置及其查询方法
CN106874695A (zh) * 2017-03-22 2017-06-20 北京大数医达科技有限公司 医疗知识图谱的构建方法和装置
CN106971071A (zh) * 2017-03-27 2017-07-21 为朔医学数据科技(北京)有限公司 一种临床决策支持系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021281A (zh) * 2016-04-29 2016-10-12 京东方科技集团股份有限公司 医学知识图谱的构建方法、其装置及其查询方法
CN106874695A (zh) * 2017-03-22 2017-06-20 北京大数医达科技有限公司 医疗知识图谱的构建方法和装置
CN106971071A (zh) * 2017-03-27 2017-07-21 为朔医学数据科技(北京)有限公司 一种临床决策支持系统及方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243528B (zh) * 2018-08-14 2022-02-08 张旭蓓 基于知识图谱有向图的生物过程控制方法
CN109243528A (zh) * 2018-08-14 2019-01-18 张旭蓓 基于知识图谱有向图的生物过程控制方法
CN109543096A (zh) * 2018-10-15 2019-03-29 平安科技(深圳)有限公司 数据查询方法、装置、计算机设备和存储介质
CN109657065A (zh) * 2018-10-31 2019-04-19 百度在线网络技术(北京)有限公司 知识图谱处理方法、装置及电子设备
CN109378053A (zh) * 2018-11-30 2019-02-22 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN109378053B (zh) * 2018-11-30 2021-07-06 安徽影联云享医疗科技有限公司 一种用于医学影像的知识图谱构建方法
CN109919585A (zh) * 2019-05-14 2019-06-21 上海市浦东新区行政服务中心(上海市浦东新区市民中心) 基于知识图谱的人工智能辅助行政审批方法、系统及终端
CN110189831A (zh) * 2019-06-06 2019-08-30 厦门大学 一种基于动态图序列的病历知识图谱构建方法及系统
CN110245242A (zh) * 2019-06-20 2019-09-17 北京百度网讯科技有限公司 医学知识图谱构建方法、装置以及终端
CN112015905A (zh) * 2020-08-05 2020-12-01 河北工程大学 一种疲劳标志疾病知识图谱的构建方法
CN112800283A (zh) * 2021-01-29 2021-05-14 重庆恒真维实医药科技有限公司 一种基于药代动力学的医学数据库的建立方法
CN112800283B (zh) * 2021-01-29 2023-03-14 重庆恒真维实医药科技有限公司 一种基于药代动力学的医学数据库的建立方法
WO2022198625A1 (zh) * 2021-03-26 2022-09-29 深圳华大基因股份有限公司 变异文献解读知识库的构建方法、解读方法及电子设备
CN113488180A (zh) * 2021-07-28 2021-10-08 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
CN113488180B (zh) * 2021-07-28 2023-07-18 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
WO2023071530A1 (zh) * 2021-10-26 2023-05-04 之江实验室 一种小样本弱标注条件下的医疗事件识别方法及系统
CN117292846A (zh) * 2023-11-27 2023-12-26 神州医疗科技股份有限公司 一种肠道微生物知识图谱的构建方法及装置
CN117747096A (zh) * 2024-02-21 2024-03-22 神州医疗科技股份有限公司 一种基于病理组学知识库的辅助诊疗系统及构建方法
CN117747096B (zh) * 2024-02-21 2024-06-07 神州医疗科技股份有限公司 一种基于病理组学知识库的辅助诊疗系统及构建方法

Also Published As

Publication number Publication date
CN107357924B (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
CN107357924A (zh) 一种精准医学知识图谱构建方法和装置
Collister et al. Calculating polygenic risk scores (PRS) in UK Biobank: a practical guide for epidemiologists
Lin et al. CAMOIP: a web server for comprehensive analysis on multi-omics of immunotherapy in pan-cancer
Mecham et al. Supervised normalization of microarrays
Farrell et al. Current status and new features of the Consensus Coding Sequence database
CN106971071A (zh) 一种临床决策支持系统及方法
US9384321B2 (en) Organization, visualization and utilization of genomic data on electronic devices
US11183269B2 (en) Systems and methods for tumor clonality analysis
Sharma et al. CESAR 2.0 substantially improves speed and accuracy of comparative gene annotation
Le Van et al. Simultaneous discovery of cancer subtypes and subtype features by molecular data integration
Qu et al. Visual analytics of genomic and cancer data: a systematic review
Niroula et al. PON-mt-tRNA: a multifactorial probability-based method for classification of mitochondrial tRNA variations
Knowles et al. Grape RNA-Seq analysis pipeline environment
US20230122305A1 (en) A precision medicine portal for human diseases
Allen et al. Probe mapping across multiple microarray platforms
Poos et al. Structuring osteosarcoma knowledge: an osteosarcoma-gene association database based on literature mining and manual annotation
CN110235203A (zh) 用于创建个人基因概况产品的系统及方法
WO2016118771A1 (en) System and method for drug target and biomarker discovery and diagnosis using a multidimensional multiscale module map
Capriotti et al. SARA: a server for function annotation of RNA structures
Aparicio-Puerta et al. liqDB: a small-RNAseq knowledge discovery database for liquid biopsy studies
Jang et al. CaPSSA: visual evaluation of cancer biomarker genes for patient stratification and survival analysis using mutation and expression data
Jang et al. An integrated clinical and genomic information system for cancer precision medicine
Zhou et al. Imputing gene expression to maximize platform compatibility
CN114913919A (zh) 一种单基因病遗传变异智能解读及报告的方法、系统及服务器
Gerussi et al. Artificial intelligence for precision medicine in autoimmune liver disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant