CN112270988B - 一种罕见病辅助诊断的方法 - Google Patents

一种罕见病辅助诊断的方法 Download PDF

Info

Publication number
CN112270988B
CN112270988B CN202011114018.6A CN202011114018A CN112270988B CN 112270988 B CN112270988 B CN 112270988B CN 202011114018 A CN202011114018 A CN 202011114018A CN 112270988 B CN112270988 B CN 112270988B
Authority
CN
China
Prior art keywords
disease
information
rare
diagnosis
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011114018.6A
Other languages
English (en)
Other versions
CN112270988A (zh
Inventor
黄书鑫
陈詹妮
陈荣山
熊慧
张丰丰
曾缘欢
廖晓佳
郭莉莎
王琳
谢文龙
姚迅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Jiyuan Medical Laboratory Co ltd
Original Assignee
Xiamen Genokon Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Genokon Medical Technology Co ltd filed Critical Xiamen Genokon Medical Technology Co ltd
Priority to CN202011114018.6A priority Critical patent/CN112270988B/zh
Publication of CN112270988A publication Critical patent/CN112270988A/zh
Application granted granted Critical
Publication of CN112270988B publication Critical patent/CN112270988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种罕见病辅助诊断的方法,能通过对临床症状信息的分析,为罕见病患者提供实时的就诊建议,包括临床症状对应的可能相关的罕见病信息,疾病描述、疾病受累系统的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段等信息。让罕见病患者不再毫无目的性的四处奔波求医,大大缩短了罕见病的诊断时间,为患者赢得最佳治疗时机,同时也减轻了患者家庭的经济和精神负担。

Description

一种罕见病辅助诊断的方法
技术领域
本发明属临床医学辅助诊断、导诊领域,具体涉及一种罕见病辅助诊断的方法。
背景技术
罕见病,原指发病率很低、很少见的一类疾病。然而随着社会进步,特别是医疗技术的迅猛发展,越来越多的罕见病患者得以存续,以此带来的巨大的医疗需求凸显。
由于罕见病存在着单病种人群发病率低、病例分散、临床表现复杂多样、常常涉及多个器官多个系统等特点,造成了近30%的罕见病患者从症状初显到确诊需经历5-10家医院,2-5种科室,平均耗时5-30年,误诊、漏诊率高达65%。因此,如何提高罕见病患者的就医效率,特别是如何有效地缩短罕见病患者从症状初显到疾病确诊之间的时间,以及对医疗资源的合理支配和缓解医患矛盾,一直是罕见病诊疗的关键难点问题。
发明内容
本发明实施例的目的是提供一种罕见病辅助诊断的方法,能通过对临床症状信息的分析,为罕见病患者提供实时的就诊建议,包括临床症状对应的可能相关的罕见病信息,疾病描述、疾病受累系统的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段等信息。
为实现上述目的,本发明实施例提供了一种罕见病辅助诊断的方法,包括如下步骤。
步骤1,获取用户的输入信息,包含临床信息如下:对患者的临床症状自我表述、临床病历、临床检查数据。
步骤2,对步骤1的信息通过罕见病诊断术语模型、DAG模型(directed acyclicgraphs,有向无环图)和/或DP模型(dynamical programming,动态规划)和/或HMM模型(Hidden Markov Model,隐式马尔科夫模型)进行分词,获得关键诊断信息。提取信息如下:提取HPO(Human Phenotype Ontology,人类表型本体)英文数据库、中文CHPO数据库中的HPO号、HPO名称、定义、描述、同义词、关联关系和文献名及摘要,进行清洗整理,并根据HPO的类别信息映射医院科室信息后,构建HPO中英文数据库。对HPO中英文数据库进行分词,清洗并统计词频,对高频医学词汇进行校正,构建HPO中英文词库,同时收集罕见病的问诊记录信息和/或就诊病历信息,建立罕见病的术语词典,构建包含训练集,验证集和测试集的罕见病诊断术语知识库系统,建立trie树分词模型,最终获得罕见病诊断术语模型。
步骤3,建立罕见病典型诊断表型模型,对步骤2获得的关键信息通过罕见病典型诊断表型模型、LSA模型(Latent Semantic Analysis,潜在语义分析)和聚类分析模型,进行模糊匹配,映射为标准表型。收集罕见病的各类症状信息及诊断信息及罕见病专家医师的先验知识,建立罕见病的诊断表型数据库和诊断表型数据库里面的各病历信息,构建包含训练集,验证集和测试集的罕见病诊断表型知识库系统。
步骤4,将得到的标准表型进行HPO(Human Phenotype Ontology,人类表型本体)转换,提炼为HPO号。
步骤5,依据预先建立的典型疾病训练模型,对获得的HPO号进行处理,输出结果信息,所述的结果信息包括至少20种可能相关疾病,以及每一种可能相关疾病的介绍,包括信息如下:疾病的描述、疾病受累系统的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段、遗传模式以及基因检测策略。收集罕见病标准表型和疾病信息,建立罕见病表型疾病数据库,构建包含训练集,验证集和测试集的罕见病表型疾病数据库,最终建立罕见病表型疾病模型;使用罕见病表型疾病模型进行模型映射,获得OMIM(Online Mendelian Inheritance in Man,人类孟德尔遗传病)号,并使用OMIM号,运用人类遗传病预测模型,进行预测相关疾病基因,使用疾病基因反向预测关联疾病,与罕见病表型疾病模型预测结果相互校正,获得最终关联疾病和相关基因,检测策略结果,其中包括:收集OMIM网站上收录的所有OMIM号词条信息;依据收集的OMIM号词条信息建立OMIM表型数据库;收集NCBI上收录的基因介绍,基因在染色体上的位置信息;依据收集的基因信息,建立基因数据库;使用建立的基因数据库,与现有检测技术进行数据统计,建立基因检测手段数据库。
本发明实施例提供了一种罕见病辅助诊断系统,由信息收集模块,信息处理模块和输出模块组成。进一步地,所述的信息收集模块,用于收集患者临床症状信息,由文字词条组成。所述的信息处理模块,用于将信息收集模块的文字词条进行分析,并转换为标准的疾病表型术语(CHPO)。所述的信息输出模块,用于输出结果信息。
本发明的具有的有益效果如下。
本发明的系统部署于云端,用户可通过电脑、手机等智能设备通过互联网随时随地使用。让罕见病患者,尤其是无法通过现有医疗手段进行快速确诊的罕见病患者,能够通过本系统了解临床症状对应的罕见病疾病信息及科学的就诊流程,确诊的关键临床指征及检查手段,为罕见病患者提供实时的就诊建议和详实的疾病相关信息。让罕见病患者不再毫无目的性的四处奔波求医,大大缩短了罕见病的诊断时间,为患者赢得最佳治疗时机,同时也减轻了患者家庭的经济和精神负担。
本发明的系统也可以部署到医院内部使用,通过收集罕见病的问诊消息和病历信息,结合医生诊断之后的先验知识,通过人工智能技术,运行统计模型建立智能辅助诊断系统,帮助基层全科医生进行常见病多发病的规范化诊疗、实时对危重症的识别、罕见病的提醒,实现罕见病的真正分级诊疗。借此智能诊断系统,可以解决罕见病医生资源分布不均的问题,使罕见病患者无需特意选择专家问诊,在附近医院便可获得初步检查,无法解决再寻找专家,合理分配医疗资源,保证罕见病患者,医院双方利益最大化。
本发明提供了一种罕见病辅助诊断的方法,为罕见病患者提供实时的就诊建议,优化了罕见病诊断流程、提高了诊断效率和诊断准确率,为患者的早日确诊提供了强有力的支持。本发明还缓解了患者都集中到大医院的问题,顺应了国家分级诊疗的改革趋势,让医疗资源得到更合理的应用。
附图说明
图1为本发明的系统流程图。
图2为本发明的系统分词流程图。
具体实施方式
下面结合实施例具体说明本发明。如图1所示,本发明提供的一种罕见病辅助诊断系统,由信息收集模块,信息处理模块和输出模块组成。
进一步地,所述的信息收集模块,用于收集患者临床症状信息,由文字词条组成。获取用户的输入信息,包含临床信息如下:对患者的临床症状自我表述、临床病历、临床检查数据。
所述的信息处理模块,用于将信息收集模块的文字词条进行分析,并转换为标准的疾病表型术语(CHPO)。如图2所示,对信息收集模块获取的信息通过罕见病诊断术语模型、DAG模型(directed acyclic graphs,有向无环图)和/或DP模型(dynamicalprogramming,动态规划)和/或HMM模型(Hidden Markov Model,隐式马尔科夫模型)进行分词,获得关键诊断信息。提取信息如下:提取HPO(Human Phenotype Ontology,人类表型本体)英文数据库、中文CHPO数据库中的HPO号、HPO名称、定义、描述、同义词、关联关系和文献名及摘要,进行清洗整理,并根据HPO的类别信息映射医院科室信息后,构建HPO中英文数据库。对HPO中英文数据库进行分词,清洗并统计词频,对高频医学词汇进行校正,构建HPO中英文词库,同时收集罕见病的问诊记录信息和/或就诊病历信息,建立罕见病的术语词典,进而构建包含训练集,验证集和测试集的罕见病诊断术语知识库系统,建立trie树分词模型,最终获得罕见病诊断术语模型。
进一步地,建立罕见病典型诊断表型模型,对获得关键诊断信息通过罕见病典型诊断表型模型、LSA模型(Latent Semantic Analysis,潜在语义分析)和聚类分析模型,进行模糊匹配,映射为标准表型。其中罕见病典型诊断表型模型的构建方法如下:收集罕见病的各类症状信息及诊断信息及罕见病专家医师的先验知识,建立罕见病的诊断表型数据库和诊断表型数据库里面的各病历信息,进而构建包含训练集,验证集和测试集的罕见病诊断表型知识库系统。
进一步地,将得到的标准表型进行HPO(Human Phenotype Ontology,人类表型本体)转换,提炼为HPO号。
进一步地,所述的信息输出模块,依据预先建立的典型疾病训练模型,对获得的HPO号进行处理,输出结果信息,所述的结果信息包括至少20种可能相关疾病,以及每一种可能相关疾病的介绍,包括信息如下:疾病的描述、疾病受累系统的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段、遗传模式以及基因检测策略。所述的方法包括,收集罕见病标准表型和疾病信息;依据收集的罕见病标准表型和疾病信息,建立罕见病表型疾病数据库;通过罕见病表型疾病数据库,构建训练集,验证集和测试集;采用构建的罕见病表型疾病数据库,建立罕见病表型疾病模型;使用罕见病表型疾病模型进行模型映射,获得OMIM(Online Mendelian Inheritance in Man,人类孟德尔遗传病)号,并使用OMIM号,运用人类遗传病预测模型,进行预测相关疾病基因,使用疾病基因反向预测关联疾病,与罕见病表型疾病模型预测结果相互校正,获得最终关联疾病和相关基因,检测策略结果,其中包括:收集OMIM网站上收录的所有OMIM号词条信息;依据收集的OMIM号词条信息建立OMIM表型数据库;收集NCBI上收录的基因介绍,基因在染色体上的位置信息;依据收集的基因信息,建立基因数据库;使用建立的基因数据库,与现有检测技术进行数据统计,建立基因检测手段数据库。

Claims (1)

1.一种罕见病辅助诊断的方法,包括:
步骤1,获取用户的输入信息,包含临床信息如下:对患者的临床症状自我表述、临床病历、临床检查数据;
步骤2,通过罕见病诊断术语模型、DAG模型和/或DP模型和/或HMM模型进行分词,获得关键诊断信息;提取信息如下:HPO英文数据库、中文CHPO数据库中的HPO号、HPO名称、定义、描述、同义词、关联关系和文献名及摘要,进行清洗整理,并根据HPO的类别信息映射医院科室信息后,构建HPO中英文数据库;对HPO中英文数据库进行分词,清洗并统计词频,对高频医学词汇进行校正,构建HPO中英文词库,同时收集罕见病的问诊记录信息和/或就诊病历信息,建立罕见病的术语词典,构建包含训练集,验证集和测试集的罕见病诊断术语知识库系统,建立trie树分词模型,最终获得罕见病诊断术语模型;
步骤3,建立罕见病典型诊断表型模型,对步骤2获得的关键信息通过罕见病典型诊断表型模型、LSA模型和聚类分析模型,进行模糊匹配,映射为标准表型;收集罕见病的各类症状信息及诊断信息及罕见病专家医师的先验知识,建立罕见病的诊断表型数据库和诊断表型数据库里面的各病历信息,构建包含训练集,验证集和测试集的罕见病诊断表型知识库系统;
步骤4,将得到的标准表型进行HPO转换,提炼为HPO号;
步骤5,依据预先建立的典型疾病训练模型,对获得的HPO号进行处理,输出结果信息,所述的结果信息包括至少20种可能相关疾病,以及每一种可能相关疾病的介绍,包括信息如下:疾病的描述、疾病受累系统的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段、遗传模式以及基因检测策略;收集罕见病标准表型和疾病信息,建立罕见病表型疾病数据库,构建包含训练集,验证集和测试集的罕见病表型疾病数据库,最终建立罕见病表型疾病模型;使用罕见病表型疾病模型进行模型映射,运用人类遗传病预测模型,进行预测相关疾病基因,使用疾病基因反向预测关联疾病,与罕见病表型疾病模型预测结果相互校正,获得最终关联疾病和相关基因,检测策略结果,其中包括:收集OMIM号词条信息,收集NCBI上收录的基因介绍,基因在染色体上的位置信息,建立基因数据库,并与现有检测技术进行数据统计,建立基因检测手段数据库。
CN202011114018.6A 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法 Active CN112270988B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011114018.6A CN112270988B (zh) 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011114018.6A CN112270988B (zh) 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法

Publications (2)

Publication Number Publication Date
CN112270988A CN112270988A (zh) 2021-01-26
CN112270988B true CN112270988B (zh) 2022-07-29

Family

ID=74337260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011114018.6A Active CN112270988B (zh) 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法

Country Status (1)

Country Link
CN (1) CN112270988B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724867A (zh) * 2021-11-03 2021-11-30 北京大学第三医院(北京大学第三临床医学院) 提示系统及方法
CN115482926B (zh) * 2022-09-20 2024-04-09 浙江大学 知识驱动的罕见病可视化问答式辅助鉴别诊断系统及方法
CN116562266B (zh) * 2023-07-10 2023-09-15 中国医学科学院北京协和医院 文本分析方法、计算机设备及计算机可读存储介质
CN116796046B (zh) * 2023-08-29 2023-11-10 武汉大学人民医院(湖北省人民医院) 基于罕见特征的病例检索方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577907B (zh) * 2017-09-08 2021-04-02 成都奇恩生物科技有限公司 一种基于互联网的罕见病辅助诊断系统及使用方法
JP2021521886A (ja) * 2018-04-18 2021-08-30 レディ チルドレンズ ホスピタル リサーチ センター 迅速な遺伝子解析のための方法およびシステム
CN110688493B (zh) * 2019-09-26 2022-12-06 京东方科技集团股份有限公司 一种关联关系构建方法、装置及电子设备
CN111951955A (zh) * 2020-08-13 2020-11-17 神州数码医疗科技股份有限公司 一种基于规则推理的临床决策支持系统构建方法及装置

Also Published As

Publication number Publication date
CN112270988A (zh) 2021-01-26

Similar Documents

Publication Publication Date Title
CN112270988B (zh) 一种罕见病辅助诊断的方法
Alizadehsani et al. A database for using machine learning and data mining techniques for coronary artery disease diagnosis
CN109599185B (zh) 疾病数据处理方法、装置、电子设备及计算机可读介质
Hammami et al. Automated classification of cancer morphology from Italian pathology reports using Natural Language Processing techniques: A rule-based approach
Bhatt Artificial intelligence in managing clinical trial design and conduct: Man and machine still on the learning curve?
WO2003040965A2 (en) Patient data mining
CN112530535B (zh) 基于健康医疗大数据建立疾病专病队列的方法及装置
CN111899828A (zh) 一种知识图谱驱动的乳腺癌诊疗方案推荐系统
US20190266243A1 (en) Automated mapping of service codes in healthcare systems
CN117271804B (zh) 一种共病特征知识库生成方法、装置、设备及介质
CN110085314A (zh) 医学检验数据的智能分析方法、系统以及设备
CN113643825B (zh) 基于临床关键特征信息的医疗案例知识库构建方法和系统
CN111667891A (zh) 应用于专病临床试验的队列识别方法及装置
CN108206056A (zh) 一种鼻咽癌人工智能辅助诊疗决策终端
US10403391B2 (en) Automated mapping of service codes in healthcare systems
CN115862897A (zh) 一种基于临床数据的症候群监测方法及系统
CN108335756A (zh) 鼻咽癌数据库及基于所述数据库的综合诊疗决策方法
KR101295785B1 (ko) 유전변이 데이터 베이스 구축 장치 및 방법
Panwar et al. A review: Exploring the role of ChatGPT in the diagnosis and treatment of oral pathologies
Feng Applications of artificial intelligence to diagnosis of neurodegenerative diseases
CN119314693B (zh) 肿瘤全病程智能管理平台及方法
CN108320797A (zh) 一种鼻咽癌数据库及基于所述数据库的综合诊疗决策方法
US20240112765A1 (en) Method and system for clinical trials matching
Schiappa et al. Validation of RUBY for breast cancer knowledge extraction from a large French electronic medical record system
CN112992303B (zh) 人类表型标准用语提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240328

Address after: Room 304, No. 59-1 Wanghai Road, Siming District, Xiamen City, Fujian Province, 361008

Patentee after: Xiamen Jiyuan medical laboratory Co.,Ltd.

Country or region after: China

Address before: 361008 4th floor, South Building, 61 Wanghai Road, Siming District, Xiamen City, Fujian Province

Patentee before: XIAMEN GENOKON MEDICAL TECHNOLOGY CO.,LTD.

Country or region before: China

TR01 Transfer of patent right