CN116313141A - 一种基于知识图谱的不明原因发热智能问诊方法 - Google Patents
一种基于知识图谱的不明原因发热智能问诊方法 Download PDFInfo
- Publication number
- CN116313141A CN116313141A CN202310179477.XA CN202310179477A CN116313141A CN 116313141 A CN116313141 A CN 116313141A CN 202310179477 A CN202310179477 A CN 202310179477A CN 116313141 A CN116313141 A CN 116313141A
- Authority
- CN
- China
- Prior art keywords
- keywords
- fever
- data
- knowledge graph
- cause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010037660 Pyrexia Diseases 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000007170 pathology Effects 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 19
- 208000024891 symptom Diseases 0.000 claims abstract description 13
- 238000003058 natural language processing Methods 0.000 claims abstract description 8
- 208000037194 Fever of Unknown Origin Diseases 0.000 claims description 12
- 201000010099 disease Diseases 0.000 claims description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000003745 diagnosis Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 claims description 2
- 230000001351 cycling effect Effects 0.000 claims 1
- 239000013604 expression vector Substances 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 208000035473 Communicable disease Diseases 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012106 screening analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种基于知识图谱的不明原因发热智能问诊方法,属于人工智能与医学交叉领域。该方法涉及不明原因发热症状数据的收集,知识图谱,自然语言处理的运用。本发明主要提供如下内容:收集引起不明原因发热(FUO)的病因及其特征病状,利用这些数据构建关于不明原因发热病因的知识图谱,将病人描述信息通过自然语言处理分词得到关键字及各个关键词的向量,并将关键字和知识图谱特征病状通过向量进行相似度计算,以得到病人的相关病状,最终从知识图谱自底向上得到病因,从而提高问诊的效率。
Description
技术领域
本发明属于人工智能与医学交叉领域,涉及一种基于知识图谱的不明原因发热智能问诊方法。
背景技术
医学上引起不明原因发热的病因超过200种,分为感染性疾病、肿瘤性疾病、非感染性炎症性疾病、其他疾病。其病因复杂且临床表现多样,为了确定发热的病因,从而及时治疗,临床医生往往会详细地询问发热病人其它异常表现。
传统的问诊方法采用的是人力,需要医生和病人面对面接触,由病人描述自己的病状,医生基于病人描述进行诊断,此方法比较繁琐,且由于传染性疾病的原因,医生有感染的风险,因此在现在智能时代,需要能够快速覆盖的低成本问诊工具,即智能问诊,有利于快速锁定病因,控制病情,避免传染性疾病扩散,节省人力物力资源。
发明内容
基于此,本发明的目的在于提供一种基于知识图谱的不明原因发热智能问诊方法,从而提高问诊效率,减少传染性疾病的传播。
为达到上述目的,本发明提供如下技术方案:
一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:该方法包括以下步骤:
S 1:构建关于不明原因发热病因的知识图谱,表现为“a-(可能是)>b”;其中,b为收集的关于不明原因发热的病因,a为该病因的特征病状之一,整理相关资料后通过知识抽取得到实体、属性及其关系,采用自底向上构建不明原因发热病状知识图谱,创造节点,关系及属性,便于后续查询。
S2:将病人的描述进行自然语言处理,通过分词得到关键词,以及各个关键词的向量;
S3:基于S2得到各关键词的向量,通过一定方法计算比较两个向量的相似度,根据S1的数据,计算病人提取的关键词和知识图谱上的特征病状间的相似度,确定关键词与特征病状是否相同。
S4:利用关于不明原因发热病因的知识图谱以及自然语言处理技术,并依赖于具有编程功能的相关软件,根据S1-S3的内容和数据以及病人描述的基础信息,实现对不明原因发热病人的诊断,确定其病因。
进一步,本发明基础数据决定于关于不明原因发热可能的病因相关信息原始病症数据,对原始数据进行预处理,提取不同病因的不同发病特点与特征病状,联系梳理相关关系,得到实体,属性及其关系,综合为本发明的基础数据。
该方法分词操作现有词库可以对日常的描述进行分词操作,但由于本发明包含医学方面的特殊词,需要依据现有词库进行扩充操作,将涉及的关键词按一定格式输入,通过程序对其进行扩充,以达到对病人描述的正确分词以及赋予分词合适的相关向量。
另外,该方法包含一种关键词相似度的计算方法,通过对关键词间相关性的分析,根据大量文本提取关键词的特征,并基于一定的训练方法,通过文本训练得到词语的向量,最终得到一个向量空间模型,基于向量空间模型,可以以向量来表示关键词,以向量的空间距离来体现关键词间的语义相似度,基于一定的方法可以计算出两个关键词间的相似度。
本发明的有益效果在于:结合人工智能和医学知识,基于知识图谱的不明原因发热智能问诊,提高了问诊效率,保障问诊的准确度,有效地降低了传染性疾病的传播。
附图说明
为了使本发明的目的,技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为基于知识图谱的不明原因发热智能问诊方法流程图。
图2为自然语言处理流程图
图3为关于不明原因发热病因知识图谱的构建及流程
图4为构建的一种关于不明原因发热病因的知识图谱简略模型
图5为具体实施案例
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
图1为基于知识图谱的不明原因发热智能诊断方法流程图。设定合适的病人描述测试语句以及正确提取的特征病状和最终可能的病因,从而客观,合理,全面地测试该方法诊断的准确率。图2为自然语言处理流程图,输入病人描述的测试语句,进行分词得到描述中包含的关键词数据,将关键词数据中的每一个关键词与知识图谱中每一个底层特征病状进行相似度计算,经过筛选分析,得到特征病状数据,将特征病状数据与该测试案列正确的特征病状比较,记录匹配率,即得到的病状正确数/该案例总的特征病状数。
通过图4显示的关于不明原因发热病因的知识图谱,采用自底向上方法,通过节点查询器,将病状数据与知识图谱的特征病状相匹配,再通过关系查询器,得到特征病状指向的病因,分析病状数据得到的病因,通过一定筛选方法得到最有可能的病因,与该测试案例正确的病因进行比较,记录正确率,令病因与正确病因相同时正确率为100%,不同时正确率为50%,便于计算准确率。
设定准确率为匹配率和正确率的均值。可以发现,当词库中对某一病状的别称越多越全面时,准确率越高,即乏力与无力相同,反之,病人描述的病状中,与特征病状相匹配的关键词在词库中无记录时,该特征病状无法识别,导致匹配率下降,进而影响病因的正确率以及结果的准确率。因此词库越全面,问诊越准确,而本方法中词库基本包含常用的病状别称,经检验准确率为90%以上。图5为基于本方法构建的不明原因发热智能诊断原型系统。
最后可以说明,本发明能够实现不明原因发热病因的智能化诊断,提高诊断效率。
Claims (5)
1.一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:该方法包括以下步骤:
S1:构建关于不明原因发热病因的知识图谱,表现为“a-(可能是)>b”,其中,b为收集的关于不明原因发热的病因,a为该病因的特征病状之一,采用自底向上构建关于不明原因发热病因的知识图谱,基于收集的数据通过知识抽取得到实体、属性及其关系,创造为节点,关系及属性,从而构建成知识图谱。
S2:将病人描述进行自然语言处理,通过分词得到关键词,以及各个关键词的向量;
S3:基于S2得到各关键词的向量,通过一定方法计算比较两个向量的相似度,根据S1的数据,计算基于病人描述所提取的关键词和知识图谱上的特征病状的相似度,确定关键词与特征病状是否相同。
S4:利用关于不明原因发热病因的知识图谱以及自然语言处理技术,依赖于具有编程功能的相关软件,并根据S1-S3的内容和数据,实现对不明原因发热病因的诊断,确定病因。
2.根据权利要求1所述的一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:整理关于不明原因发热病因及其相关病状的原始病症数据,对原始数据进行预处理,提取不同病因的不同发病特点与特征病状,联系梳理相关关系,得到实体,属性及其关系,统合为本发明的基础数据,用于知识图谱的构建与应用。
3.根据权利要求1所述的一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:
现有词库可以对日常的描述进行分词操作,但由于本发明包含医学方面的特殊词,需要依据现有词库进行扩充操作,将涉及的关键词按一定格式输入,通过程序对其进行扩充,以达到对病人描述的正确分词,及各个分词的表示向量。
4.根据权利要求1所述的一种基于知识图谱的不明原因发热智能问诊方法,其特征在于:
关键词相似度的比较通过对关键词间相关性的分析,根据大量文本提取关键词的特征,并基于一定的训练方法,通过文本训练得到词语的相关向量,最终得到一个向量空间模型,基于向量空间模型,可以以向量来表示该关键词,以向量的空间距离来体现两个关键词间的语义相似度,因此基于一定的方法可以计算出两个关键词间的相似度。
5.根据权利要求4所述的计算两个关键词的相似度方法,其特征在于:基于病人描述提取的关键词数据,以及基于不明原因发热病因的知识图谱提取的底层特征病状的数据,计算得到两个数据的相似度值,规定大于某一阈值则记录此时的特征病状,否则遍历其它特征病状数据,最后通过比较最大相似度,得到关键词匹配到的最大相似度下的特征病状,遍历其它关键词,并循环此过程,最后得到病人描述中提取的所有可能关键词表示的特征病状。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310179477.XA CN116313141A (zh) | 2023-02-28 | 2023-02-28 | 一种基于知识图谱的不明原因发热智能问诊方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310179477.XA CN116313141A (zh) | 2023-02-28 | 2023-02-28 | 一种基于知识图谱的不明原因发热智能问诊方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116313141A true CN116313141A (zh) | 2023-06-23 |
Family
ID=86791735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310179477.XA Pending CN116313141A (zh) | 2023-02-28 | 2023-02-28 | 一种基于知识图谱的不明原因发热智能问诊方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116313141A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117153378A (zh) * | 2023-10-31 | 2023-12-01 | 北京博晖创新生物技术集团股份有限公司 | 一种导诊方法、装置、电子设备及存储介质 |
-
2023
- 2023-02-28 CN CN202310179477.XA patent/CN116313141A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117153378A (zh) * | 2023-10-31 | 2023-12-01 | 北京博晖创新生物技术集团股份有限公司 | 一种导诊方法、装置、电子设备及存储介质 |
CN117153378B (zh) * | 2023-10-31 | 2024-03-01 | 北京博晖创新生物技术集团股份有限公司 | 一种导诊方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108831559B (zh) | 一种中文电子病历文本分析方法与系统 | |
WO2022227294A1 (zh) | 一种基于多模态融合的疾病风险预测方法和系统 | |
CN109920501B (zh) | 基于卷积神经网络和主动学习的电子病历分类方法及系统 | |
CN106874643B (zh) | 基于词向量自动构建知识库实现辅助诊疗的方法和系统 | |
CN111222340B (zh) | 基于多标准主动学习的乳腺电子病历实体识别系统 | |
CN112241457A (zh) | 一种融合扩展特征的事理知识图谱事件检测方法 | |
CN111191456B (zh) | 一种使用序列标注进行识别文本分段的方法 | |
Jatav | An algorithm for predictive data mining approach in medical diagnosis | |
CN114188022A (zh) | 一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统 | |
CN113342973A (zh) | 一种基于疾病二分类器的辅助诊断模型的诊断方法 | |
CN115545021A (zh) | 一种基于深度学习的临床术语识别方法与装置 | |
CN112749277A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN116313141A (zh) | 一种基于知识图谱的不明原因发热智能问诊方法 | |
CN114191665A (zh) | 机械通气过程中人机异步现象的分类方法和分类装置 | |
CN113360643A (zh) | 一种基于短文本分类的电子病历数据质量评价方法 | |
CN107085655B (zh) | 基于属性的约束概念格的中医数据处理方法及系统 | |
Chen et al. | Automatically structuring on Chinese ultrasound report of cerebrovascular diseases via natural language processing | |
CN116110594B (zh) | 基于关联文献的医学知识图谱的知识评价方法及系统 | |
Cui et al. | Intelligent recommendation for departments based on medical knowledge graph | |
CN116719840A (zh) | 一种基于病历后结构化处理的医疗信息推送方法 | |
CN116994689A (zh) | 医疗数据的特征化处理方法、装置、设备、介质及产品 | |
CN116344028A (zh) | 一种基于多模态异构数据的肺部疾病自动识别方法及装置 | |
Lakshmi et al. | Diagnosis of chronic kidney disease using random forest algorithms | |
CN114861663A (zh) | 一种实体关系联合抽取方法 | |
CN111966780A (zh) | 一种基于词向量建模和信息检索的回顾性队列选择方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |