CN117747096B - 一种基于病理组学知识库的辅助诊疗系统及构建方法 - Google Patents

一种基于病理组学知识库的辅助诊疗系统及构建方法 Download PDF

Info

Publication number
CN117747096B
CN117747096B CN202410192053.1A CN202410192053A CN117747096B CN 117747096 B CN117747096 B CN 117747096B CN 202410192053 A CN202410192053 A CN 202410192053A CN 117747096 B CN117747096 B CN 117747096B
Authority
CN
China
Prior art keywords
entity
information
pathogroup
pathology
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410192053.1A
Other languages
English (en)
Other versions
CN117747096A (zh
Inventor
刘军华
张妙直
郭栋梁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Health China Technologies Co Ltd
Original Assignee
Digital Health China Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Health China Technologies Co Ltd filed Critical Digital Health China Technologies Co Ltd
Priority to CN202410192053.1A priority Critical patent/CN117747096B/zh
Publication of CN117747096A publication Critical patent/CN117747096A/zh
Application granted granted Critical
Publication of CN117747096B publication Critical patent/CN117747096B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及医疗系统技术领域,具体涉及一种基于病理组学知识库的辅助诊疗系统及构建方法;本方法包括:对文献指南信息的文本内容进行实体提取,构建病理组学实体库,建立病理组学实体库数据框架,构建各实体相关的医学属性信息,根据文献指南信息,确定所述病理组学实体库中实体间的关联关系,构建病理组学知识图谱库,通过肿瘤基因组图谱数据对所述模型库中的预测模型进行训练和测试,形成病理组学临床预测模型库;通过本发明基于病理组学知识库,能在肿瘤辅助诊断和分型、基因突变预测、预后评估、治疗指导及疾病研究等方面进行临床应用。

Description

一种基于病理组学知识库的辅助诊疗系统及构建方法
技术领域
本发明涉及医疗系统技术领域,具体涉及一种基于病理组学知识库的辅助诊疗系统及构建方法。
背景技术
病理组学是指基于人工智能将病理图像转化为高保真度、高通量的可挖掘的数据,并用于定量化病理诊断和疾病预后等,最后自动生成病理诊断报告。病理组学能超越病理医生的视觉和记忆,能对人类的知识和经验进行量化建模,构建超越人的视觉水平的亚视觉特征;同时利用高性能计算机对大规模数字化切片进行训练和学习,通过归纳数据中的共性、趋势和规律,可以超越诊断的任务,实现疾病的预测和预后等更复杂问题的解决。
随着数字病理技术的推动,模拟的玻璃切片正在被大规模数字化,其数字化病理切片以几何级数量快速增加。目前,病理学组已经在数字病理技术、人工智能技术和互联网技术的支撑下发展起来。随之产生了大量的科研成果。目前对于病理组学研究成果仍处于研究阶段,且并没有针对病理组学相关的知识库,能够将病理组学相关研究成果进行结构化,体系化,也并没有基于病理组学知识库的辅助诊疗系统,能够把相关研究成果系统的落地于临床,服务于临床。
发明内容
针对上述现有技术的不足,本发明旨在提供一种基于病理组学知识库的辅助诊疗系统及构建方法,以实现基于病理组学在肿瘤辅助诊断和分型、基因突变预测、预后评估、治疗指导及疾病研究等方面进行临床应用。
为了解决上述问题,本发明采用了如下的技术方案:
一种基于病理组学知识库的辅助诊疗系统的构建方法,包括:
获取病理组学相关的文献指南信息;
对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库;
在所述病理组学实体库的基础上,建立病理组学实体库数据框架,构建各实体相关的医学属性信息;
根据文献指南信息,确定所述病理组学实体库中实体间的关联关系;
对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据;
根据所述病理组学实体库数据框架、所述病理组学实体库中实体间的关联关系和所述病理组学各类临床预测模型的注释数据,以各个实体的数据框架的标识或各类临床预测模型的标识作为节点,各个实体的数据框架之间的关系和各类临床预测模型及其相关的数据元素信息的从属关系信息作为有向线段,构建病理组学知识图谱库;
将所述文献指南信息中涉及的病理组学模型进行整合,形成模型库,通过肿瘤基因组图谱数据作为模型的训练集和测试集对所述模型库中的预测模型进行训练和测试,形成病理组学临床预测模型库。
作为一种可实施方式,还包括建立报告平台:
配置病理图像获取模块,病理图像获取模块被配置为获取目标患者的病理学切片并扫描成数字化图像,进行预处理;
配置特征获取模块,特征获取模块被配置为采用深度学习模型进行自动特征获取或采用人工特征获取;
配置模型库调用模块,模型库调用模块被配置为基于获取的病理图像和特征,从病理组学临床预测模型库中调用能采用获取的病理图像和特征进行预测的模型进行预测,得出不同的预测结果;
配置病理组学知识库调用模块,病理组学知识库调用模块被配置为基于得出的不同的预测结果,调用病理组学知识图谱库,根据所述得出的不同的预测结果关联相关询证证据及治疗指导或预后信息;
配置报告生成模块,报告生成模块被配置为根据目标患者的病理学切片、采用的预测模型及其预测结果和询证证据及治疗指导或预后信息形成综合报告。
作为一种可实施方式,所述获取病理组学相关的文献指南信息,包括:
利用自然语言处理和机器学习技术搜索和筛选病理组学文献及指南,利用人工智能辅助搜索工具搜索病理组学相关文献和研究成果;
从PubMed、Google学术、Web of Science、Scopus和CNKI网站或数据库收集病理组学相关的文献及指南。
作为一种可实施方式,所述对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库,包括:
对所述文献指南信息进行预处理;
通过NLP语言模型识别文本中的实体,实体包括但不限于文献或指南名称、疾病、病理组学特征、基因和药物;
对识别的实体进行标准化,并抽取实体进行人工纠正,形成病理组学实体库。
作为一种可实施方式,所述建立病理组学实体库数据框架,构建各实体相关的医学属性信息,包括:
通过文献指南医学属性信息构建文献指南实体数据框架,文献指南医学属性信息包括ID、作者信息、文献标题、摘要、关键词、出版信息、引用信息、研究对象和文献链接;
通过疾病医学属性信息根据ICD疾病分类系统构建树状层级结构的疾病实体数据框架,疾病医学属性信息包括疾病ID、病名、症状、病因、诊断方法、治疗方法、预防措施、并发症、流行病学特征、遗传性质、患病人群和疾病的阶段;
通过病理组学特征构建树状层级结构的病理组学特征实体数据框架,病理组学特征包括图片形态特征,图像强度特征,图像纹理特征和空间拓扑特征;
通过基因医学属性信息构建基因实体数据框架,基因医学属性信息包括基因ID、Symbol、基因组学信息、基因表达、基因功能和药物反应相关信息;
通过药物相关医学属性信息根据ATC药物分类系统构建树状层级结构的药物实体数据框架,药物相关医学属性信息包括药物ID、药物名称、药理学特性、适应症、禁忌症、不良反应和给药途径;
以文献指南、疾病、基因、药物的实体标识以及各个实体相关的实体数据框架为节点,以各实体与其医学属性信息的从属关系信息作为有向线段,连接实体与其医学属性元素,确定关联关系。
作为一种可实施方式,所述根据文献指南信息,确定所述病理组学实体库中实体间的关联关系,包括:
根据文献指南信息,提取实体间的关联信息,关联信息的类型包括:疾病和病理学特征关联、疾病和病理学特征和基因关联、疾病和病理学特征和药物关联、疾病和病理学特征和基因和药物关联,所有关联的类型与文献指南实体相关联;
以文献指南、疾病 、病理组学特征、基因和药物实体标识作为节点,以各个实体的数据的关系信息作为有向线段,连接各个实体,确定所述病理组学实体库中实体间的关联关系。
作为一种可实施方式,所述对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据,包括:
对所述文献指南信息的文本内容进行信息提取整合病理组学相关的预测模型得病理组学各类临床预测模型,病理组学各类临床预测模型包括但不限于肿瘤辅助诊断和分型模型、基因突变预测模型、预后评估模型和治疗指导模型;
获取与病理组学各类临床预测模型相关的数据元素,数据元素包括研究对象、预测模型类型、结局指标、研究类型、研究目的和预测变量;
以病理组学各类临床预测模型以及各类模型相关的数据元素作为节点,以临床预测模型与其相关的数据元素的从属关系信息作为有向线段,连接各类预测模型与其属性数据信息,确定关联,得到病理组学各类临床预测模型的注释数据。
一种基于病理组学知识库的辅助诊疗系统,包括病理组学知识图谱库构建模块、病理组学临床预测模型库构建模块、和报告平台;
所述病理组学知识图谱库构建模块用于获取病理组学相关的文献指南信息;对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库;在所述病理组学实体库的基础上,建立病理组学实体库数据框架,构建各实体相关的医学属性信息;根据文献指南信息,确定所述病理组学实体库中实体间的关联关系;对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据;根据所述病理组学实体库数据框架、所述病理组学实体库中实体间的关联关系和所述病理组学各类临床预测模型的注释数据,以各个实体的数据框架的标识或各类临床预测模型的标识作为节点,各个实体的数据框架之间的关系和各类临床预测模型及其相关的数据元素信息的从属关系信息作为有向线段,构建病理组学知识图谱库;
所述病理组学临床预测模型库构建模块用于将所述文献指南信息中涉及的病理组学模型进行整合,形成模型库,通过肿瘤基因组图谱数据作为模型的训练集和测试集对所述模型库中的预测模型进行训练和测试,形成病理组学临床预测模型库;
所述报告平台包括病理图像获取模块、特征获取模块、模型库调用模块、病理组学知识库调用模块和报告生成模块;
所述病理图像获取模块被配置为获取目标患者的病理学切片并扫描成数字化图像,进行预处理;
所述特征获取模块被配置为采用深度学习模型进行自动特征获取或采用人工特征获取;
所述模型库调用模块被配置为基于获取的病理图像和特征,从病理组学临床预测模型库中调用能采用获取的病理图像和特征进行预测的模型进行预测,得出不同的预测结果;
所述病理组学知识库调用模块被配置为基于得出的不同的预测结果,调用病理组学知识图谱库,根据所述得出的不同的预测结果关联相关询证证据及治疗指导或预后信息;
所述报告生成模块被配置为根据目标患者的病理学切片、采用的预测模型及其预测结果和询证证据及治疗指导或预后信息形成综合报告。
作为一种可实施方式,所述建立病理组学实体库数据框架,构建各实体相关的医学属性信息,包括:
通过文献指南医学属性信息构建文献指南实体数据框架,文献指南医学属性信息包括ID、作者信息、文献标题、摘要、关键词、出版信息、引用信息、研究对象和文献链接;
通过疾病医学属性信息根据ICD疾病分类系统构建树状层级结构的疾病实体数据框架,疾病医学属性信息包括疾病ID、病名、症状、病因、诊断方法、治疗方法、预防措施、并发症、流行病学特征、遗传性质、患病人群和疾病的阶段;
通过病理组学特征构建树状层级结构的病理组学特征实体数据框架,病理组学特征包括图片形态特征,图像强度特征,图像纹理特征和空间拓扑特征;
通过基因医学属性信息构建基因实体数据框架,基因医学属性信息包括基因ID、Symbol、基因组学信息、基因表达、基因功能和药物反应相关信息;
通过药物相关医学属性信息根据ATC药物分类系统构建树状层级结构的药物实体数据框架,药物相关医学属性信息包括药物ID、药物名称、药理学特性、适应症、禁忌症、不良反应和给药途径;
以文献指南、疾病、基因、药物的实体标识以及各个实体相关的实体数据框架为节点,以各实体与其医学属性信息的从属关系信息作为有向线段,连接实体与其医学属性元素,确定关联关系。
作为一种可实施方式,所述根据文献指南信息,确定所述病理组学实体库中实体间的关联关系,包括:
根据文献指南信息,提取实体间的关联信息,关联信息的类型包括:疾病和病理学特征关联、疾病和病理学特征和基因关联、疾病和病理学特征和药物关联、疾病和病理学特征和基因和药物关联,所有关联的类型与文献指南实体相关联;
以文献指南、疾病 、病理组学特征、基因和药物实体标识作为节点,以各个实体的数据的关系信息作为有向线段,连接各个实体,确定所述病理组学实体库中实体间的关联关系;
所述对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据,包括:
对所述文献指南信息的文本内容进行信息提取整合病理组学相关的预测模型得病理组学各类临床预测模型,病理组学各类临床预测模型包括但不限于肿瘤辅助诊断和分型模型、基因突变预测模型、预后评估模型和治疗指导模型;
获取与病理组学各类临床预测模型相关的数据元素,数据元素包括研究对象、预测模型类型、结局指标、研究类型、研究目的和预测变量;
以病理组学各类临床预测模型以及各类模型相关的数据元素作为节点,以临床预测模型与其相关的数据元素的从属关系信息作为有向线段,连接各类预测模型与其属性数据信息,确定关联,得到病理组学各类临床预测模型的注释数据。
本发明的有益效果在于:通过本发明建立一种基于病理组学知识库的辅助诊疗系统,能够基于病理组学知识库,在肿瘤辅助诊断和分型、基因突变预测、预后评估、治疗指导及疾病研究等方面进行临床应用,在临床中,常常出现肿瘤基因检测样本不足等问题,此时结合病理组学的方法,来综合评估患者诊断和分型,分子特征 (基因突变,蛋白表达水平等),预后和治疗等信息,病理组学诊疗系统可以弥补不能进行基因检测的不足;且病理组学相较于基因检测,可以在较短的时间内获取分子特征,预后等信息,有助于医生更快地制定治疗方案和监测疾病进展。
附图说明
图1为本发明实施例中一种基于病理组学知识库的辅助诊疗系统的构建方法流程图。
图2为本发明实施例中一种基于病理组学知识库的辅助诊疗系统示意图。
具体实施方式
下面结合具体实施例对本发明作进一步的详细说明。
需要说明的是,这些实施例仅用于说明本发明,而不是对本发明的限制,在本发明的构思前提下本方法的简单改进,都属于本发明要求保护的范围。
实施例1
参见图1,为一种基于病理组学知识库的辅助诊疗系统的构建方法,包括:
S100、获取病理组学相关的文献指南信息:
利用自然语言处理和机器学习技术搜索和筛选病理组学文献及指南,利用人工智能辅助搜索工具搜索病理组学相关文献和研究成果;
从PubMed、Google学术、Web of Science、Scopus和CNKI网站或数据库收集病理组学相关的文献及指南。
S200、对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库:
对所述文献指南信息进行预处理;
通过NLP语言模型识别文本中的实体,实体包括但不限于文献或指南名称、疾病、病理组学特征、基因和药物;
对识别的实体进行标准化,并抽取实体进行人工纠正,形成病理组学实体库。
S300、在所述病理组学实体库的基础上,建立病理组学实体库数据框架,构建各实体相关的医学属性信息:
通过文献指南医学属性信息构建文献指南实体数据框架,文献指南医学属性信息包括ID、作者信息、文献标题、摘要、关键词、出版信息、引用信息、研究对象和文献链接;
通过疾病医学属性信息根据ICD疾病分类系统构建树状层级结构的疾病实体数据框架,疾病医学属性信息包括疾病ID、病名、症状、病因、诊断方法、治疗方法、预防措施、并发症、流行病学特征、遗传性质、患病人群和疾病的阶段;
通过病理组学特征构建树状层级结构的病理组学特征实体数据框架,病理组学特征包括图片形态特征,图像强度特征,图像纹理特征和空间拓扑特征,见表1;
表1 病理组学特征表
特征 描述
图片形态特征 面积,周长,形成因数,固性,范围,紧密度,欧拉数,边界框面积,偏心度,长轴长度,短轴长度等
图像强度特征 综合强度,平均强度,强度标准差,最小强度,最大强度,综合强度边缘,平均强度边缘,强度边沿标准差,最小强度边沿,最大强度边缘等
图像纹理特征 图像同质性,对比度,相关性,纹理方差,图像异质性,归一化平均值,归一化方差,归一化熵,复杂性熵,随机性熵,同现矩阵方差等
空间拓扑特征 肿瘤浸润淋巴细胞的空间排列特征、密度特征等
通过基因医学属性信息构建基因实体数据框架,基因医学属性信息包括基因ID、Symbol、基因组学信息、基因表达、基因功能和药物反应相关信息;
通过药物相关医学属性信息根据ATC药物分类系统构建树状层级结构的药物实体数据框架,药物相关医学属性信息包括药物ID、药物名称、药理学特性、适应症、禁忌症、不良反应和给药途径;
以文献指南、疾病、基因、药物的实体标识以及各个实体相关的实体数据框架为节点,以各实体与其医学属性信息的从属关系信息作为有向线段,连接实体与其医学属性元素,确定关联关系。
S400、根据文献指南信息,确定所述病理组学实体库中实体间的关联关系:
根据文献指南信息,提取实体间的关联信息,关联信息的类型包括:疾病和病理学特征关联、疾病和病理学特征和基因关联、疾病和病理学特征和药物关联、疾病和病理学特征和基因和药物关联,所有关联的类型与文献指南实体相关联;
以文献指南、疾病 、病理组学特征、基因和药物实体标识作为节点,以各个实体的数据的关系信息作为有向线段,连接各个实体,确定所述病理组学实体库中实体间的关联关系。
S500、对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据:
对所述文献指南信息的文本内容进行信息提取整合病理组学相关的预测模型得病理组学各类临床预测模型,病理组学各类临床预测模型包括但不限于肿瘤辅助诊断和分型模型、基因突变预测模型、预后评估模型和治疗指导模型;
获取与病理组学各类临床预测模型相关的数据元素,数据元素包括研究对象、预测模型类型、结局指标、研究类型、研究目的和预测变量;
以病理组学各类临床预测模型以及各类模型相关的数据元素作为节点,以临床预测模型与其相关的数据元素的从属关系信息作为有向线段,连接各类预测模型与其属性数据信息,确定关联,得到病理组学各类临床预测模型的注释数据。
S600、根据所述病理组学实体库数据框架、所述病理组学实体库中实体间的关联关系和所述病理组学各类临床预测模型的注释数据,以各个实体的数据框架的标识或各类临床预测模型的标识作为节点,各个实体的数据框架之间的关系和各类临床预测模型及其相关的数据元素信息的从属关系信息作为有向线段,构建病理组学知识图谱库。
S700、将所述文献指南信息中涉及的病理组学模型进行整合,形成模型库,通过肿瘤基因组图谱数据作为模型的训练集和测试集对所述模型库中的预测模型进行训练和测试,形成病理组学临床预测模型库。
还包括S800、建立报告平台:
配置病理图像获取模块,病理图像获取模块被配置为获取目标患者的病理学切片并扫描成数字化图像,进行预处理;
配置特征获取模块,特征获取模块被配置为采用深度学习模型进行自动特征获取或采用人工特征获取;
配置模型库调用模块,模型库调用模块被配置为基于获取的病理图像和特征,从病理组学临床预测模型库中调用能采用获取的病理图像和特征进行预测的模型进行预测,得出不同的预测结果;
配置病理组学知识库调用模块,病理组学知识库调用模块被配置为基于得出的不同的预测结果,调用病理组学知识图谱库,根据所述得出的不同的预测结果关联相关询证证据及治疗指导或预后信息;
配置报告生成模块,报告生成模块被配置为根据目标患者的病理学切片、采用的预测模型及其预测结果和询证证据及治疗指导或预后信息形成综合报告。
参见图2,为一种基于病理组学知识库的辅助诊疗系统,包括病理组学知识图谱库构建模块10、病理组学临床预测模型库构建模块20、和报告平台30;
所述病理组学知识图谱库构建模块10用于获取病理组学相关的文献指南信息;对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库;在所述病理组学实体库的基础上,建立病理组学实体库数据框架,构建各实体相关的医学属性信息;根据文献指南信息,确定所述病理组学实体库中实体间的关联关系;对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据;根据所述病理组学实体库数据框架、所述病理组学实体库中实体间的关联关系和所述病理组学各类临床预测模型的注释数据,以各个实体的数据框架的标识或各类临床预测模型的标识作为节点,各个实体的数据框架之间的关系和各类临床预测模型及其相关的数据元素信息的从属关系信息作为有向线段,构建病理组学知识图谱库;
所述病理组学临床预测模型库构建模块20用于将所述文献指南信息中涉及的病理组学模型进行整合,形成模型库,通过肿瘤基因组图谱数据作为模型的训练集和测试集对所述模型库中的预测模型进行训练和测试,形成病理组学临床预测模型库;
所述报告平台30包括病理图像获取模块31、特征获取模块32、模型库调用模块33、病理组学知识库调用模块34和报告生成模块35;
所述病理图像获取模块31被配置为获取目标患者的病理学切片并扫描成数字化图像,进行预处理;
所述特征获取模块32被配置为采用深度学习模型进行自动特征获取或采用人工特征获取;
所述模型库调用模块33被配置为基于获取的病理图像和特征,从病理组学临床预测模型库中调用能采用获取的病理图像和特征进行预测的模型进行预测,得出不同的预测结果;
所述病理组学知识库调用模块34被配置为基于得出的不同的预测结果,调用病理组学知识图谱库,根据所述得出的不同的预测结果关联相关询证证据及治疗指导或预后信息;
所述报告生成模块35被配置为根据目标患者的病理学切片、采用的预测模型及其预测结果和询证证据及治疗指导或预后信息形成综合报告。
其中,所述建立病理组学实体库数据框架,构建各实体相关的医学属性信息,包括:
通过文献指南医学属性信息构建文献指南实体数据框架,文献指南医学属性信息包括ID、作者信息、文献标题、摘要、关键词、出版信息、引用信息、研究对象和文献链接;
通过疾病医学属性信息根据ICD疾病分类系统构建树状层级结构的疾病实体数据框架,疾病医学属性信息包括疾病ID、病名、症状、病因、诊断方法、治疗方法、预防措施、并发症、流行病学特征、遗传性质、患病人群和疾病的阶段;
通过病理组学特征构建树状层级结构的病理组学特征实体数据框架,病理组学特征包括图片形态特征,图像强度特征,图像纹理特征和空间拓扑特征;
通过基因医学属性信息构建基因实体数据框架,基因医学属性信息包括基因ID、Symbol、基因组学信息、基因表达、基因功能和药物反应相关信息;
通过药物相关医学属性信息根据ATC药物分类系统构建树状层级结构的药物实体数据框架,药物相关医学属性信息包括药物ID、药物名称、药理学特性、适应症、禁忌症、不良反应和给药途径;
以文献指南、疾病、基因、药物的实体标识以及各个实体相关的实体数据框架为节点,以各实体与其医学属性信息的从属关系信息作为有向线段,连接实体与其医学属性元素,确定关联关系。
其中,所述根据文献指南信息,确定所述病理组学实体库中实体间的关联关系,包括:
根据文献指南信息,提取实体间的关联信息,关联信息的类型包括:疾病和病理学特征关联、疾病和病理学特征和基因关联、疾病和病理学特征和药物关联、疾病和病理学特征和基因和药物关联,所有关联的类型与文献指南实体相关联;
以文献指南、疾病 、病理组学特征、基因和药物实体标识作为节点,以各个实体的数据的关系信息作为有向线段,连接各个实体,确定所述病理组学实体库中实体间的关联关系;
所述对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据,包括:
对所述文献指南信息的文本内容进行信息提取整合病理组学相关的预测模型得病理组学各类临床预测模型,病理组学各类临床预测模型包括但不限于肿瘤辅助诊断和分型模型、基因突变预测模型、预后评估模型和治疗指导模型;
获取与病理组学各类临床预测模型相关的数据元素,数据元素包括研究对象、预测模型类型、结局指标、研究类型、研究目的和预测变量;
以病理组学各类临床预测模型以及各类模型相关的数据元素作为节点,以临床预测模型与其相关的数据元素的从属关系信息作为有向线段,连接各类预测模型与其属性数据信息,确定关联,得到病理组学各类临床预测模型的注释数据。
实施例2
基于实施例1的方法或系统,基于本地数据、肿瘤基因组图谱TCGA公开数据库图像信息以及外部数据验证集作为建立模型的图像来源。
根据文献”基于深度学习和组织形态分析的肺癌基因突变预测” 建立EGFR基因突变风险预测模型,该模型建立的整体框架包括:全扫描图像-组织分割-细胞核分割-特征提取-特征选择-构建分类器。构建该模型并纳入模型库,以揭示全扫描组织病理图像和EGFR基因突变风险的关联性。
比如医院或者患者处,获得患者LUAD病理切片,基于病理切片预测EGFR基因突变风险的步骤如下:
首先对图像进行归一化等预处理
组织分割和细胞核分割,并进行特征提取,主要包括细胞核全局图特征,局部聚类图特征,细胞核形状特征,细胞核方向熵特征以及核纹理特征等。
基于MRMR进行特征选择。
调用模型库,经EGFR基因突变风险预测模型进行模型分析。
分析结束后将结果导入病理组学知识库,获取相关循证文献证据,为EGFR基因突变风险预测提供证据参考。在病理组学知识库中,基于上述文献,病理组学特征(细胞核全局图特征,局部聚类图特征,细胞核形状特征,细胞核方向熵特征以及核纹理特征)几个实体之间以及与癌种(肺癌)实体和EGFR基因实体间建立关联,在EGFR基因突变风险预测模型下,临床注释具体说明了病理组学特征实体与预测EGFR基因突变风险的关系。
将EGFR基因突变预测结果和知识库获取的相关循证证据(临床注释与文献等)导出获取报告。
结束。
实施例3
基于实施例1的方法或系统,基于本地数据、肿瘤基因组图谱TCGA公开数据库图像信息以及外部数据验证集作为建立模型的图像来源。
根据文献”Classifification and mutation prediction based onhistopathology H&E images in liver cancer using deep learning” 建立基于组织病理学H&E图像的肝癌分类和突变预测模型,该模型基于自动特征学习,该模型建立的整体框架包括:肝癌组织病理学数据集整理-卷积神经网络的深度学习-训练深度学习网络-模型评价。构建该模型并纳入模型平台,以帮助病理学家分类肝癌和检测基因突变。
比如:医院或者患者处,获得患者H&E染色肝组织的全视野数字病理切片,基于病理切片进行肝癌分类和突变预测。
首先对图像进行预处理。
图像导入肝脏组织分类模型 (突变预测分离器)。
分析结束后将结果导入病理组学知识库,获取相关循证文献证据,为肝癌分类和突变预测模型提供证据参考。在病理组学知识库中,肝癌重要预后相关基因(ARID1A、ASH1L、CSMD1、CTNNB1、EYS、FMN2、MDM4、RB1、TP53、ZFX4等)与癌种 (肝癌) 实体建立关联,临床注释具体说明了该模型预测在分类肝癌和检测基因突变中的作用。
肝癌分类和突变预测结果和病理组学知识库获取的相关循证证据(临床注释与文献等)导出获取报告。
结束。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。

Claims (3)

1.一种基于病理组学知识库的辅助诊疗系统的构建方法,其特征在于,包括:
获取病理组学相关的文献指南信息;
对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库;
在所述病理组学实体库的基础上,建立病理组学实体库数据框架,构建各实体相关的医学属性信息;
根据文献指南信息,确定所述病理组学实体库中实体间的关联关系;
对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据;
根据所述病理组学实体库数据框架、所述病理组学实体库中实体间的关联关系和所述病理组学各类临床预测模型的注释数据,以各个实体的数据框架的标识或各类临床预测模型的标识作为节点,各个实体的数据框架之间的关系和各类临床预测模型及其相关的数据元素信息的从属关系信息作为有向线段,构建病理组学知识图谱库;
将所述文献指南信息中涉及的病理组学模型进行整合,形成模型库,通过肿瘤基因组图谱数据作为模型的训练集和测试集对所述模型库中的预测模型进行训练和测试,形成病理组学临床预测模型库;
还包括建立报告平台:
配置病理图像获取模块,病理图像获取模块被配置为获取目标患者的病理学切片并扫描成数字化图像,进行预处理;
配置特征获取模块,特征获取模块被配置为采用深度学习模型进行自动特征获取或采用人工特征获取;
配置模型库调用模块,模型库调用模块被配置为基于获取的病理图像和特征,从病理组学临床预测模型库中调用能采用获取的病理图像和特征进行预测的模型进行预测,得出不同的预测结果;
配置病理组学知识库调用模块,病理组学知识库调用模块被配置为基于得出的不同的预测结果,调用病理组学知识图谱库,根据所述得出的不同的预测结果关联相关询证证据及治疗指导或预后信息;
配置报告生成模块,报告生成模块被配置为根据目标患者的病理学切片、采用的预测模型及其预测结果和询证证据及治疗指导或预后信息形成综合报告;
所述对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库,包括:
对所述文献指南信息进行预处理;
通过NLP语言模型识别文本中的实体,实体包括文献或指南名称、疾病、病理组学特征、基因和药物;
对识别的实体进行标准化,并抽取实体进行人工纠正,形成病理组学实体库;
所述建立病理组学实体库数据框架,构建各实体相关的医学属性信息,包括:
通过文献指南医学属性信息构建文献指南实体数据框架,文献指南医学属性信息包括ID、作者信息、文献标题、摘要、关键词、出版信息、引用信息、研究对象和文献链接;
通过疾病医学属性信息根据ICD疾病分类系统构建树状层级结构的疾病实体数据框架,疾病医学属性信息包括疾病ID、病名、症状、病因、诊断方法、治疗方法、预防措施、并发症、流行病学特征、遗传性质、患病人群和疾病的阶段;
通过病理组学特征构建树状层级结构的病理组学特征实体数据框架,病理组学特征包括图片形态特征,图像强度特征,图像纹理特征和空间拓扑特征;
通过基因医学属性信息构建基因实体数据框架,基因医学属性信息包括基因ID、Symbol、基因组学信息、基因表达、基因功能和药物反应相关信息;
通过药物相关医学属性信息根据ATC药物分类系统构建树状层级结构的药物实体数据框架,药物相关医学属性信息包括药物ID、药物名称、药理学特性、适应症、禁忌症、不良反应和给药途径;
以文献指南、疾病、基因、药物的实体标识以及各个实体相关的实体数据框架为节点,以各实体与其医学属性信息的从属关系信息作为有向线段,连接实体与其医学属性元素,确定关联关系;
所述根据文献指南信息,确定所述病理组学实体库中实体间的关联关系,包括:
根据文献指南信息,提取实体间的关联信息,关联信息的类型包括:疾病和病理学特征关联、疾病和病理学特征和基因关联、疾病和病理学特征和药物关联、疾病和病理学特征和基因和药物关联,所有关联的类型与文献指南实体相关联;
以文献指南、疾病 、病理组学特征、基因和药物实体标识作为节点,以各个实体的数据的关系信息作为有向线段,连接各个实体,确定所述病理组学实体库中实体间的关联关系;
所述对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据,包括:
对所述文献指南信息的文本内容进行信息提取整合病理组学相关的预测模型得病理组学各类临床预测模型,病理组学各类临床预测模型包括肿瘤辅助诊断和分型模型、基因突变预测模型、预后评估模型和治疗指导模型;
获取与病理组学各类临床预测模型相关的数据元素,数据元素包括研究对象、预测模型类型、结局指标、研究类型、研究目的和预测变量;
以病理组学各类临床预测模型以及各类模型相关的数据元素作为节点,以临床预测模型与其相关的数据元素的从属关系信息作为有向线段,连接各类预测模型与其属性数据信息,确定关联,得到病理组学各类临床预测模型的注释数据。
2.根据权利要求1所述的基于病理组学知识库的辅助诊疗系统的构建方法,其特征在于,所述获取病理组学相关的文献指南信息,包括:
利用自然语言处理和机器学习技术搜索和筛选病理组学文献及指南,利用人工智能辅助搜索工具搜索病理组学相关文献和研究成果;
从PubMed、Google学术、Web of Science、Scopus和CNKI网站或数据库收集病理组学相关的文献及指南。
3.一种基于病理组学知识库的辅助诊疗系统,其特征在于,包括病理组学知识图谱库构建模块、病理组学临床预测模型库构建模块、和报告平台;
所述病理组学知识图谱库构建模块用于获取病理组学相关的文献指南信息;对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库;在所述病理组学实体库的基础上,建立病理组学实体库数据框架,构建各实体相关的医学属性信息;根据文献指南信息,确定所述病理组学实体库中实体间的关联关系;对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据;根据所述病理组学实体库数据框架、所述病理组学实体库中实体间的关联关系和所述病理组学各类临床预测模型的注释数据,以各个实体的数据框架的标识或各类临床预测模型的标识作为节点,各个实体的数据框架之间的关系和各类临床预测模型及其相关的数据元素信息的从属关系信息作为有向线段,构建病理组学知识图谱库;
所述病理组学临床预测模型库构建模块用于将所述文献指南信息中涉及的病理组学模型进行整合,形成模型库,通过肿瘤基因组图谱数据作为模型的训练集和测试集对所述模型库中的预测模型进行训练和测试,形成病理组学临床预测模型库;
所述报告平台包括病理图像获取模块、特征获取模块、模型库调用模块、病理组学知识库调用模块和报告生成模块;
所述病理图像获取模块被配置为获取目标患者的病理学切片并扫描成数字化图像,进行预处理;
所述特征获取模块被配置为采用深度学习模型进行自动特征获取或采用人工特征获取;
所述模型库调用模块被配置为基于获取的病理图像和特征,从病理组学临床预测模型库中调用能采用获取的病理图像和特征进行预测的模型进行预测,得出不同的预测结果;
所述病理组学知识库调用模块被配置为基于得出的不同的预测结果,调用病理组学知识图谱库,根据所述得出的不同的预测结果关联相关询证证据及治疗指导或预后信息;
所述报告生成模块被配置为根据目标患者的病理学切片、采用的预测模型及其预测结果和询证证据及治疗指导或预后信息形成综合报告;
所述对所述文献指南信息的文本内容进行实体提取,构建病理组学实体库,包括:
对所述文献指南信息进行预处理;
通过NLP语言模型识别文本中的实体,实体包括文献或指南名称、疾病、病理组学特征、基因和药物;
对识别的实体进行标准化,并抽取实体进行人工纠正,形成病理组学实体库;
所述建立病理组学实体库数据框架,构建各实体相关的医学属性信息,包括:
通过文献指南医学属性信息构建文献指南实体数据框架,文献指南医学属性信息包括ID、作者信息、文献标题、摘要、关键词、出版信息、引用信息、研究对象和文献链接;
通过疾病医学属性信息根据ICD疾病分类系统构建树状层级结构的疾病实体数据框架,疾病医学属性信息包括疾病ID、病名、症状、病因、诊断方法、治疗方法、预防措施、并发症、流行病学特征、遗传性质、患病人群和疾病的阶段;
通过病理组学特征构建树状层级结构的病理组学特征实体数据框架,病理组学特征包括图片形态特征,图像强度特征,图像纹理特征和空间拓扑特征;
通过基因医学属性信息构建基因实体数据框架,基因医学属性信息包括基因ID、Symbol、基因组学信息、基因表达、基因功能和药物反应相关信息;
通过药物相关医学属性信息根据ATC药物分类系统构建树状层级结构的药物实体数据框架,药物相关医学属性信息包括药物ID、药物名称、药理学特性、适应症、禁忌症、不良反应和给药途径;
以文献指南、疾病、基因、药物的实体标识以及各个实体相关的实体数据框架为节点,以各实体与其医学属性信息的从属关系信息作为有向线段,连接实体与其医学属性元素,确定关联关系;
所述根据文献指南信息,确定所述病理组学实体库中实体间的关联关系,包括:
根据文献指南信息,提取实体间的关联信息,关联信息的类型包括:疾病和病理学特征关联、疾病和病理学特征和基因关联、疾病和病理学特征和药物关联、疾病和病理学特征和基因和药物关联,所有关联的类型与文献指南实体相关联;
以文献指南、疾病 、病理组学特征、基因和药物实体标识作为节点,以各个实体的数据的关系信息作为有向线段,连接各个实体,确定所述病理组学实体库中实体间的关联关系;
所述对所述文献指南信息的文本内容进行信息提取,确定病理组学各类临床预测模型的注释数据,包括:
对所述文献指南信息的文本内容进行信息提取整合病理组学相关的预测模型得病理组学各类临床预测模型,病理组学各类临床预测模型包括肿瘤辅助诊断和分型模型、基因突变预测模型、预后评估模型和治疗指导模型;
获取与病理组学各类临床预测模型相关的数据元素,数据元素包括研究对象、预测模型类型、结局指标、研究类型、研究目的和预测变量;
以病理组学各类临床预测模型以及各类模型相关的数据元素作为节点,以临床预测模型与其相关的数据元素的从属关系信息作为有向线段,连接各类预测模型与其属性数据信息,确定关联,得到病理组学各类临床预测模型的注释数据。
CN202410192053.1A 2024-02-21 2024-02-21 一种基于病理组学知识库的辅助诊疗系统及构建方法 Active CN117747096B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410192053.1A CN117747096B (zh) 2024-02-21 2024-02-21 一种基于病理组学知识库的辅助诊疗系统及构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410192053.1A CN117747096B (zh) 2024-02-21 2024-02-21 一种基于病理组学知识库的辅助诊疗系统及构建方法

Publications (2)

Publication Number Publication Date
CN117747096A CN117747096A (zh) 2024-03-22
CN117747096B true CN117747096B (zh) 2024-06-07

Family

ID=90261434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410192053.1A Active CN117747096B (zh) 2024-02-21 2024-02-21 一种基于病理组学知识库的辅助诊疗系统及构建方法

Country Status (1)

Country Link
CN (1) CN117747096B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971071A (zh) * 2017-03-27 2017-07-21 为朔医学数据科技(北京)有限公司 一种临床决策支持系统及方法
CN107357924A (zh) * 2017-07-25 2017-11-17 为朔医学数据科技(北京)有限公司 一种精准医学知识图谱构建方法和装置
CN110569372A (zh) * 2019-09-20 2019-12-13 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN112035511A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 基于医学知识图谱的目标数据搜索方法及相关设备
WO2022198625A1 (zh) * 2021-03-26 2022-09-29 深圳华大基因股份有限公司 变异文献解读知识库的构建方法、解读方法及电子设备
CN116110570A (zh) * 2023-02-07 2023-05-12 深圳清华大学研究院 糖尿病辅助诊断系统、文本处理法、图谱的构建方法
CN117292846A (zh) * 2023-11-27 2023-12-26 神州医疗科技股份有限公司 一种肠道微生物知识图谱的构建方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971071A (zh) * 2017-03-27 2017-07-21 为朔医学数据科技(北京)有限公司 一种临床决策支持系统及方法
CN107357924A (zh) * 2017-07-25 2017-11-17 为朔医学数据科技(北京)有限公司 一种精准医学知识图谱构建方法和装置
CN110569372A (zh) * 2019-09-20 2019-12-13 四川大学 一种心脏病大数据知识图谱系统的构建方法
CN112035511A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 基于医学知识图谱的目标数据搜索方法及相关设备
WO2022198625A1 (zh) * 2021-03-26 2022-09-29 深圳华大基因股份有限公司 变异文献解读知识库的构建方法、解读方法及电子设备
CN116110570A (zh) * 2023-02-07 2023-05-12 深圳清华大学研究院 糖尿病辅助诊断系统、文本处理法、图谱的构建方法
CN117292846A (zh) * 2023-11-27 2023-12-26 神州医疗科技股份有限公司 一种肠道微生物知识图谱的构建方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于异构数据源的疾病知识图谱构建研究——以高血压为例";何建平;《中国优秀硕士学位论文全文数据库(医药卫生科技辑)》;20230115(第01期);第E054-81页 *
基于EMR的乳腺肿瘤知识图谱构建研究;崔洁;陈德华;乐嘉锦;;计算机应用与软件;20171215(第12期);第128-132页 *

Also Published As

Publication number Publication date
CN117747096A (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
Parwani Next generation diagnostic pathology: use of digital pathology and artificial intelligence tools to augment a pathological diagnosis
CN110459287B (zh) 来自医学文本报告的结构化报告数据
CN108198621B (zh) 一种基于神经网络的数据库数据综合诊疗决策方法
CN110911009A (zh) 一种临床诊断辅助决策系统和医学知识图谱积累方法
CN111370128A (zh) 一种肺癌患者预后预测系统及方法
CN108206056B (zh) 一种鼻咽癌人工智能辅助诊疗决策终端
CN108335756B (zh) 鼻咽癌数据库及基于所述数据库的综合诊疗决策方法
WO2021248695A1 (zh) 基于临床特征和序列变异的单基因病名称推荐方法及系统
Heinemann et al. Deep neural network based histological scoring of lung fibrosis and inflammation in the mouse model system
CN111191456A (zh) 一种使用序列标注进行识别文本分段的方法
CN112530535B (zh) 基于健康医疗大数据建立疾病专病队列的方法及装置
CN111667891A (zh) 应用于专病临床试验的队列识别方法及装置
CN112270988A (zh) 一种罕见病辅助诊断的方法及系统
CN112071385A (zh) 基于人工智能的罕见病辅助分析方法、装置及存储介质
CN112802600A (zh) 软组织肿瘤信息化病理辅助诊断全程监管系统及方法
CN115831350A (zh) 头颈部肿瘤分布式智能诊断方法、装置、设备、存储介质
Moscalu et al. Histopathological images analysis and predictive modeling implemented in digital pathology—current affairs and perspectives
US20020132258A1 (en) Knowledge database and method for constructing knowledge database
CN108320797B (zh) 一种鼻咽癌数据库及基于所述数据库的综合诊疗决策方法
Jing et al. A comprehensive survey of intestine histopathological image analysis using machine vision approaches
CN117747096B (zh) 一种基于病理组学知识库的辅助诊疗系统及构建方法
He et al. Extracting molecular entities and their interactions from pathway figures based on deep learning
Wu et al. A personalized diagnostic generation framework based on multi-source heterogeneous data
US20220044762A1 (en) Methods of assessing breast cancer using machine learning systems
CN108335748A (zh) 一种鼻咽癌人工智能辅助诊疗决策服务器集群

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant