CN116313141A - 一种基于知识图谱的不明原因发热智能问诊方法 - Google Patents

一种基于知识图谱的不明原因发热智能问诊方法 Download PDF

Info

Publication number
CN116313141A
CN116313141A CN202310179477.XA CN202310179477A CN116313141A CN 116313141 A CN116313141 A CN 116313141A CN 202310179477 A CN202310179477 A CN 202310179477A CN 116313141 A CN116313141 A CN 116313141A
Authority
CN
China
Prior art keywords
keywords
fever
data
knowledge graph
cause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310179477.XA
Other languages
English (en)
Inventor
郭茂耘
向阳
朱芯雨
汤炳文
杨懿凡
杨涵
张程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202310179477.XA priority Critical patent/CN116313141A/zh
Publication of CN116313141A publication Critical patent/CN116313141A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种基于知识图谱的不明原因发热智能问诊方法,属于人工智能与医学交叉领域。该方法涉及不明原因发热症状数据的收集,知识图谱,自然语言处理的运用。本发明主要提供如下内容:收集引起不明原因发热(FUO)的病因及其特征病状,利用这些数据构建关于不明原因发热病因的知识图谱,将病人描述信息通过自然语言处理分词得到关键字及各个关键词的向量,并将关键字和知识图谱特征病状通过向量进行相似度计算,以得到病人的相关病状,最终从知识图谱自底向上得到病因,从而提高问诊的效率。

Description

一种基于知识图谱的不明原因发热智能问诊方法
技术领域
本发明属于人工智能与医学交叉领域,涉及一种基于知识图谱的不明原因发热智能问诊方法。
背景技术
医学上引起不明原因发热的病因超过200种,分为感染性疾病、肿瘤性疾病、非感染性炎症性疾病、其他疾病。其病因复杂且临床表现多样,为了确定发热的病因,从而及时治疗,临床医生往往会详细地询问发热病人其它异常表现。
传统的问诊方法采用的是人力,需要医生和病人面对面接触,由病人描述自己的病状,医生基于病人描述进行诊断,此方法比较繁琐,且由于传染性疾病的原因,医生有感染的风险,因此在现在智能时代,需要能够快速覆盖的低成本问诊工具,即智能问诊,有利于快速锁定病因,控制病情,避免传染性疾病扩散,节省人力物力资源。
发明内容
基于此,本发明的目的在于提供一种基于知识图谱的不明原因发热智能问诊方法,从而提高问诊效率,减少传染性疾病的传播。
为达到上述目的,本发明提供如下技术方案:
一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:该方法包括以下步骤:
S 1:构建关于不明原因发热病因的知识图谱,表现为“a-(可能是)>b”;其中,b为收集的关于不明原因发热的病因,a为该病因的特征病状之一,整理相关资料后通过知识抽取得到实体、属性及其关系,采用自底向上构建不明原因发热病状知识图谱,创造节点,关系及属性,便于后续查询。
S2:将病人的描述进行自然语言处理,通过分词得到关键词,以及各个关键词的向量;
S3:基于S2得到各关键词的向量,通过一定方法计算比较两个向量的相似度,根据S1的数据,计算病人提取的关键词和知识图谱上的特征病状间的相似度,确定关键词与特征病状是否相同。
S4:利用关于不明原因发热病因的知识图谱以及自然语言处理技术,并依赖于具有编程功能的相关软件,根据S1-S3的内容和数据以及病人描述的基础信息,实现对不明原因发热病人的诊断,确定其病因。
进一步,本发明基础数据决定于关于不明原因发热可能的病因相关信息原始病症数据,对原始数据进行预处理,提取不同病因的不同发病特点与特征病状,联系梳理相关关系,得到实体,属性及其关系,综合为本发明的基础数据。
该方法分词操作现有词库可以对日常的描述进行分词操作,但由于本发明包含医学方面的特殊词,需要依据现有词库进行扩充操作,将涉及的关键词按一定格式输入,通过程序对其进行扩充,以达到对病人描述的正确分词以及赋予分词合适的相关向量。
另外,该方法包含一种关键词相似度的计算方法,通过对关键词间相关性的分析,根据大量文本提取关键词的特征,并基于一定的训练方法,通过文本训练得到词语的向量,最终得到一个向量空间模型,基于向量空间模型,可以以向量来表示关键词,以向量的空间距离来体现关键词间的语义相似度,基于一定的方法可以计算出两个关键词间的相似度。
本发明的有益效果在于:结合人工智能和医学知识,基于知识图谱的不明原因发热智能问诊,提高了问诊效率,保障问诊的准确度,有效地降低了传染性疾病的传播。
附图说明
为了使本发明的目的,技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为基于知识图谱的不明原因发热智能问诊方法流程图。
图2为自然语言处理流程图
图3为关于不明原因发热病因知识图谱的构建及流程
图4为构建的一种关于不明原因发热病因的知识图谱简略模型
图5为具体实施案例
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
图1为基于知识图谱的不明原因发热智能诊断方法流程图。设定合适的病人描述测试语句以及正确提取的特征病状和最终可能的病因,从而客观,合理,全面地测试该方法诊断的准确率。图2为自然语言处理流程图,输入病人描述的测试语句,进行分词得到描述中包含的关键词数据,将关键词数据中的每一个关键词与知识图谱中每一个底层特征病状进行相似度计算,经过筛选分析,得到特征病状数据,将特征病状数据与该测试案列正确的特征病状比较,记录匹配率,即得到的病状正确数/该案例总的特征病状数。
通过图4显示的关于不明原因发热病因的知识图谱,采用自底向上方法,通过节点查询器,将病状数据与知识图谱的特征病状相匹配,再通过关系查询器,得到特征病状指向的病因,分析病状数据得到的病因,通过一定筛选方法得到最有可能的病因,与该测试案例正确的病因进行比较,记录正确率,令病因与正确病因相同时正确率为100%,不同时正确率为50%,便于计算准确率。
设定准确率为匹配率和正确率的均值。可以发现,当词库中对某一病状的别称越多越全面时,准确率越高,即乏力与无力相同,反之,病人描述的病状中,与特征病状相匹配的关键词在词库中无记录时,该特征病状无法识别,导致匹配率下降,进而影响病因的正确率以及结果的准确率。因此词库越全面,问诊越准确,而本方法中词库基本包含常用的病状别称,经检验准确率为90%以上。图5为基于本方法构建的不明原因发热智能诊断原型系统。
最后可以说明,本发明能够实现不明原因发热病因的智能化诊断,提高诊断效率。

Claims (5)

1.一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:该方法包括以下步骤:
S1:构建关于不明原因发热病因的知识图谱,表现为“a-(可能是)>b”,其中,b为收集的关于不明原因发热的病因,a为该病因的特征病状之一,采用自底向上构建关于不明原因发热病因的知识图谱,基于收集的数据通过知识抽取得到实体、属性及其关系,创造为节点,关系及属性,从而构建成知识图谱。
S2:将病人描述进行自然语言处理,通过分词得到关键词,以及各个关键词的向量;
S3:基于S2得到各关键词的向量,通过一定方法计算比较两个向量的相似度,根据S1的数据,计算基于病人描述所提取的关键词和知识图谱上的特征病状的相似度,确定关键词与特征病状是否相同。
S4:利用关于不明原因发热病因的知识图谱以及自然语言处理技术,依赖于具有编程功能的相关软件,并根据S1-S3的内容和数据,实现对不明原因发热病因的诊断,确定病因。
2.根据权利要求1所述的一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:整理关于不明原因发热病因及其相关病状的原始病症数据,对原始数据进行预处理,提取不同病因的不同发病特点与特征病状,联系梳理相关关系,得到实体,属性及其关系,统合为本发明的基础数据,用于知识图谱的构建与应用。
3.根据权利要求1所述的一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:
现有词库可以对日常的描述进行分词操作,但由于本发明包含医学方面的特殊词,需要依据现有词库进行扩充操作,将涉及的关键词按一定格式输入,通过程序对其进行扩充,以达到对病人描述的正确分词,及各个分词的表示向量。
4.根据权利要求1所述的一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:
关键词相似度的比较通过对关键词间相关性的分析,根据大量文本提取关键词的特征,并基于一定的训练方法,通过文本训练得到词语的相关向量,最终得到一个向量空间模型,基于向量空间模型,可以以向量来表示该关键词,以向量的空间距离来体现两个关键词间的语义相似度,因此基于一定的方法可以计算出两个关键词间的相似度。
5.根据权利要求4所述的计算两个关键词的相似度方法,其特征在于:基于病人描述提取的关键词数据,以及基于不明原因发热病因的知识图谱提取的底层特征病状的数据,计算得到两个数据的相似度值,规定大于某一阈值则记录此时的特征病状,否则遍历其它特征病状数据,最后通过比较最大相似度,得到关键词匹配到的最大相似度下的特征病状,遍历其它关键词,并循环此过程,最后得到病人描述中提取的所有可能关键词表示的特征病状。
CN202310179477.XA 2023-02-28 2023-02-28 一种基于知识图谱的不明原因发热智能问诊方法 Pending CN116313141A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310179477.XA CN116313141A (zh) 2023-02-28 2023-02-28 一种基于知识图谱的不明原因发热智能问诊方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310179477.XA CN116313141A (zh) 2023-02-28 2023-02-28 一种基于知识图谱的不明原因发热智能问诊方法

Publications (1)

Publication Number Publication Date
CN116313141A true CN116313141A (zh) 2023-06-23

Family

ID=86791735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310179477.XA Pending CN116313141A (zh) 2023-02-28 2023-02-28 一种基于知识图谱的不明原因发热智能问诊方法

Country Status (1)

Country Link
CN (1) CN116313141A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153378A (zh) * 2023-10-31 2023-12-01 北京博晖创新生物技术集团股份有限公司 一种导诊方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153378A (zh) * 2023-10-31 2023-12-01 北京博晖创新生物技术集团股份有限公司 一种导诊方法、装置、电子设备及存储介质
CN117153378B (zh) * 2023-10-31 2024-03-01 北京博晖创新生物技术集团股份有限公司 一种导诊方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN108831559B (zh) 一种中文电子病历文本分析方法与系统
WO2022227294A1 (zh) 一种基于多模态融合的疾病风险预测方法和系统
CN109920501B (zh) 基于卷积神经网络和主动学习的电子病历分类方法及系统
CN106874643B (zh) 基于词向量自动构建知识库实现辅助诊疗的方法和系统
CN111222340B (zh) 基于多标准主动学习的乳腺电子病历实体识别系统
CN112241457A (zh) 一种融合扩展特征的事理知识图谱事件检测方法
CN111191456B (zh) 一种使用序列标注进行识别文本分段的方法
Jatav An algorithm for predictive data mining approach in medical diagnosis
CN114188022A (zh) 一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统
CN113342973A (zh) 一种基于疾病二分类器的辅助诊断模型的诊断方法
CN115545021A (zh) 一种基于深度学习的临床术语识别方法与装置
CN112749277A (zh) 医学数据的处理方法、装置及存储介质
CN116313141A (zh) 一种基于知识图谱的不明原因发热智能问诊方法
CN114191665A (zh) 机械通气过程中人机异步现象的分类方法和分类装置
CN113360643A (zh) 一种基于短文本分类的电子病历数据质量评价方法
CN107085655B (zh) 基于属性的约束概念格的中医数据处理方法及系统
Chen et al. Automatically structuring on Chinese ultrasound report of cerebrovascular diseases via natural language processing
CN116110594B (zh) 基于关联文献的医学知识图谱的知识评价方法及系统
Cui et al. Intelligent recommendation for departments based on medical knowledge graph
CN116719840A (zh) 一种基于病历后结构化处理的医疗信息推送方法
CN116994689A (zh) 医疗数据的特征化处理方法、装置、设备、介质及产品
CN116344028A (zh) 一种基于多模态异构数据的肺部疾病自动识别方法及装置
Lakshmi et al. Diagnosis of chronic kidney disease using random forest algorithms
CN114861663A (zh) 一种实体关系联合抽取方法
CN111966780A (zh) 一种基于词向量建模和信息检索的回顾性队列选择方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination