CN112749286A - 知识图谱的构建和使用方法、装置和介质 - Google Patents
知识图谱的构建和使用方法、装置和介质 Download PDFInfo
- Publication number
- CN112749286A CN112749286A CN202110105784.4A CN202110105784A CN112749286A CN 112749286 A CN112749286 A CN 112749286A CN 202110105784 A CN202110105784 A CN 202110105784A CN 112749286 A CN112749286 A CN 112749286A
- Authority
- CN
- China
- Prior art keywords
- disease
- entity
- attribute
- characteristic
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 106
- 238000010276 construction Methods 0.000 title description 4
- 201000010099 disease Diseases 0.000 claims abstract description 1379
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 1379
- 230000009897 systematic effect Effects 0.000 claims abstract description 21
- 208000024891 symptom Diseases 0.000 description 58
- 238000012545 processing Methods 0.000 description 54
- 230000009471 action Effects 0.000 description 34
- 230000008569 process Effects 0.000 description 34
- 230000002829 reductive effect Effects 0.000 description 21
- 206010047700 Vomiting Diseases 0.000 description 19
- 238000012216 screening Methods 0.000 description 18
- 230000008673 vomiting Effects 0.000 description 17
- 201000008197 Laryngitis Diseases 0.000 description 16
- 201000010550 acute laryngitis Diseases 0.000 description 16
- 206010006451 bronchitis Diseases 0.000 description 16
- 230000001960 triggered effect Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 206010011224 Cough Diseases 0.000 description 11
- 206010036790 Productive cough Diseases 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 208000002193 Pain Diseases 0.000 description 8
- 238000013507 mapping Methods 0.000 description 8
- 230000009191 jumping Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000007717 exclusion Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- BALXUFOVQVENIU-KXNXZCPBSA-N pseudoephedrine hydrochloride Chemical compound [H+].[Cl-].CN[C@@H](C)[C@@H](O)C1=CC=CC=C1 BALXUFOVQVENIU-KXNXZCPBSA-N 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 206010028813 Nausea Diseases 0.000 description 3
- 206010041349 Somnolence Diseases 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008693 nausea Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 208000032140 Sleepiness Diseases 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 210000002345 respiratory system Anatomy 0.000 description 2
- 230000037321 sleepiness Effects 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 210000004916 vomit Anatomy 0.000 description 2
- 208000010201 Exanthema Diseases 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 210000002249 digestive system Anatomy 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 201000005884 exanthem Diseases 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 206010018388 glossodynia Diseases 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 206010037844 rash Diseases 0.000 description 1
- 210000004994 reproductive system Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000005181 root of the tongue Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000005182 tip of the tongue Anatomy 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明实施例提供一种知识图谱的构建和使用方法、装置和介质。方法包括:在知识图谱中,建立疾病特征实体与疾病实体之间的关联;所述疾病实体的属性包括如下中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、及高发年龄属性;所述特征集合中包括:与疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;所述临床占比属性用于表征疾病在疾病系统中的发病概率;所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。本发明实施例可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
Description
技术领域
本发明实施例涉及医疗技术领域,尤其涉及一种知识图谱的构建和使用方法、装置和介质。
背景技术
疾病预测处理是基于用户的症状,推断可能患有的疾病或临床事件的风险。随着互联网的普及和医疗资源的增加,越来越多的用户通过互联网,获取可能患有的疾病的信息。
目前的知识图谱的使用方法,通常利用知识图谱将琐碎、零散的医疗信息知识相互连接,并将知识图谱应用于疾病预测处理。具体地,知识图谱中通常包括疾病实体与症状实体之间的边关系,这样,能够依据上述边关系,针对用户的症状,预测得到对应的疾病。
发明人在实施本发明实施例的过程中发现,利用现有知识图谱,在多种疾病与用户的症状匹配的情况下,很难实现对多种疾病的准确区分。
发明内容
本发明实施例设计了一种新型的医疗知识图谱,并提供一种知识图谱的构建和使用方法、装置和介质,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
为了解决上述问题,本发明实施例公开了一种知识图谱的构建方法,包括:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
为了解决上述问题,本发明实施例公开了一种知识图谱的使用方法,包括:
依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
另一方面,本发明实施例公开了一种知识图谱的构建装置,包括:
第一关联模块,用于在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
另一方面,本发明实施例公开了一种知识图谱的使用装置,包括:
查找模块,用于依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
得分确定模块,用于依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
再一方面,本发明实施例公开了一种用于构建知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
再一方面,本发明实施例公开了一种用于使用知识图谱的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的知识图谱的构建方法。
本发明实施例包括以下优点:
本发明实施例的知识图谱中,疾病实体包括多种属性,其中,疾病系统属性、特征集合属性、临床占比属性等属性对应有概率信息,这些概率信息可用于准确地反映疾病特征与疾病之间的关联、以及疾病之间的区分度。在疾病预测处理场景下,在多种疾病与用户疾病特征相匹配的情况下,上述概率信息可用于对该多种疾病进行区分。
首先,上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
在本发明实施例的一种应用示例1中,对于出现“咳嗽”症状、“咳痰”症状的病人,在进行疾病预测处理的过程中,虽然“急性喉炎”和“支气管炎”都能与这两个症状匹配,但是“咳嗽”在“急性喉炎”中的概率为0.6,“咳痰”在“急性喉炎”中的概率为0.4;而“咳嗽”在“支气管炎”中的概率为0.8,“咳痰”在“支气管炎”中的概率为0.6。依据上述条件概率,可以确定这两个症状与“支气管炎”之间的匹配程度高于这两个症状与“急性喉炎”之间的匹配程度,由于能够排除匹配程度更低的候选疾病,因此能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
其次,上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
再者,临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
进一步,在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种疾病实体及其属性的示意图;
图2是本发明实施例的一种疾病特征实体及其属性的示意图;
图3是本发明的一种知识图谱的构建方法实施例的步骤流程图;
图4是本发明的一种知识图谱的使用方法实施例的步骤流程图;
图5是本发明的一种知识图谱的构建装置实施例的结构框图;
图6是本发明的一种知识图谱的使用装置实施例的结构框图;
图7是本发明的一种用于构建知识图谱的装置1100的框图;及
图8是本发明的一些实施例中服务端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对传统技术中很难实现对多种疾病的准确区分的技术问题,本发明实施例提供了一种知识图谱的构建方法,该方法可以包括:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,上述疾病实体的属性具体包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
上述特征集合中包括:与上述疾病特征实体相关联的疾病特征;上述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
上述临床占比属性用于表征疾病在疾病系统中的发病概率;
上述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
本发明实施例的知识图谱中的疾病实体包括多种属性,其中,疾病系统属性、特征集合属性、临床占比属性等属性对应有概率信息,这些概率信息可用于准确地反映疾病特征与疾病之间的关联、以及疾病之间的区分度。在多种疾病与用户的症状匹配的情况下,上述概率信息可用于对该多种疾病进行区分。
首先,上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
其次,上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
再者,临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
进一步,在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
实施例一
本发明实施例中,知识图谱是结构化的语义知识库,用于描述物理世界中的概念及其相互关系。
本发明实施例中,实体(Entity)是指客观存在并可相互区别的事务,包括具体的人、事、物、抽象的概念或联系等。实体可以是具体的对象,如:一种疾病,一种疾病特征等;也可以是抽象的事件,如:针对疾病特征的一次问诊等。
实体可以有很多特性,单个特性称为属性。每个属性有一个值域,其类型可以是整数型、实数型、或字符串型等。标记属性的命名单位称为字段。字段的状态可以包括:已填充状态或未填充状态,其中,已填充状态对应已填充的字段内容,未填充状态表征对应的字段内容待填充。
医疗领域中的实体可以称为医疗实体。医疗实体可以包括:疾病实体、疾病特征实体、或问题实体等。
疾病实体可以表征具体的疾病,如“高血压”、“白血病”等。疾病可以对应有疾病系统。疾病系统可以对应解剖学意义上的系统,如疾病系统可以包括:运动系统、消化系统、呼吸系统、泌尿系统、生殖系统、内分泌系统、免疫系统、神经系统和循环系统等。
可选地,疾病实体的属性可以包括如下属性中的至少一种:
疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中可以包括:与该疾病特征实体相关联的疾病特征;
所述临床占比用于表征疾病在疾病系统中的发病概率,可以依据疾病的发病数量与疾病系统的发病数量得到。
参照图1,示出了本发明实施例的一种疾病实体及其属性的示意图。其中,疾病实体的属性可以包括:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性。疾病实体包含了临床占比、所属系统、高发年龄、高发季节等医疗领域的传统知识图谱不具备的信息。
单个属性可以对应有属性参数。
例如,疾病系统属性的属性参数可以包括:系统概率,可以表征单个疾病系统的患者,占所有疾病系统的患者的比例,可以依据单个疾病系统的病人和所有疾病系统的病人的比值得到。
又如,特征集合属性的属性参数可以包括如下参数中的至少一种:
疾病特征在疾病的条件下的条件概率;特征集合中通常包括多种疾病特征,条件概率可以为多种疾病特征在疾病的条件下分别对应的条件概率;
疾病特征在疾病的条件下的惩罚因子,该惩罚因子可以对应在疾病的条件下不能出现的疾病特征,用于在疾病预测处理的过程中,对疾病的概率进行惩罚。
参照表1,示出了本发明实施例的一种疾病实体的实例的示意,其中,疾病名称“急性喉炎”和“支气管炎”均为“呼吸系统”的疾病,其分别对应多种疾病特征,每种疾病特征分别对应有条件概率。
表1
疾病特征实体可以表征具体的疾病特征。疾病特征的类型可以包括:症状、诱因、高发季节、接触史、家族史等。
疾病特征实体的属性可以包括:命中动作属性,该命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
疾病特征实体的属性可以包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。从属关系属性的属性参数可以包括:父疾病特征或子疾病特征。
例如,疾病特征“呕吐”的子疾病特征包括:“喷射性呕吐”;又如,疾病特征“发热”的子疾病特征包括:“低热”、“高热”等。
参照图2,示出了本发明实施例的一种疾病特征实体及其属性的示意图。其中,疾病特征实体的属性可以包括:特征标识属性、类型属性、从属关系属性、频次属性、命中动作属性、释义属性等。其中,频次属性可以表征对应疾病特征在所有疾病实体的特征集合中出现的次数。疾病特征实体包含了从属关系、特征对应的类型、频次、命中动作情况下的问题等信息,是医疗领域的传统知识图谱所不具备的。
参照表2,示出了本发明实施例的一种疾病特征实体的实例的示意。其中,疾病特征“呕吐”的命名动作属性“问题实体的标识18”,表征在疾病特征“呕吐”被选中的情况下,将触发问题实体标识为18的问题实体。
表2
上述命中动作属性可以提高问诊流程中问题接序的合理性。例如,若用户选中了“呕吐”症状,则会根据该“呕吐”症状的命中动作属性,查找到对应的问题实体标识18,以进一步针对“喷射性呕吐”症状进行问诊。
问题实体用于表征一次问诊对应的问题。由于一次问诊可以涉及至少一个疾病特征,因此,问题实体对应的问题可以涉及至少一个疾病特征。
可选地,问题实体的字段可以包括:问题文本字段和答案选项字段。问题文本字段用于表征待回复的问题。问题文本字段的示例可以包括:“是否没有恶心动作直接呕吐?”、“有以下哪些症状?”、“之前得过以下哪些疾病?、“皮疹是什么类型的?“大便的形状是怎样的?”等。答案选项字段用于表征可供选择的答案选项。
可选地,问题实体的字段还可以包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征疾病特征实体;
所述触发条件字段用于表征对应的问题实体为依据疾病特征实体触发得到;
所述跳转关系字段用于选中答案选项的条件下执行预设跳转。
可选地,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
当然,本领域技术人员可以根据实际应用需求,确定预设跳转,例如,预设跳转还可以包括:执行预设函数,预设函数可用于结束问题实体的查找等。
参照表3,示出了问题实体的字段的意义和取值。
表3
本发明实施例的问题实体可以包括:问题实体实例、和/或、问题实体模板。模板是将一个事物的结构规律予以固定化、标准化的成果,它体现的是结构形式的标准化。具体到本发明实施例,问题实体模板可以将问题实体实例的结构规律标准化,以体现问题实体实例的结构形式的标准化。
其中,问题实体实例的所有字段处于已填充状态。问题实体实例可以与预设的疾病特征相应。
参照表4,示出了本发明实施例的一种问题实体实例的示意。该问题实体实例的标识为18,为依据疾病特征“呕吐”触发得到,也即,在“呕吐”特征被选中的情况下,可以触发标识为18的问题实体实例。
该问题实体实例与疾病特征“喷射性呕吐”相应,用于对疾病特征“喷射性呕吐”进行问诊。问题文本中可以包含疾病特征“喷射性呕吐”的释义,以帮助用户确定是否命中对应的疾病特征,并选择对应的答案选项。
表4
标识 | 18 |
问题文本 | 是否没有恶心动作直接呕吐? |
答案选项 | [是,否,我不知道] |
疾病特征 | 喷射性呕吐 |
触发条件 | 呕吐 |
问题实体模板的问题文本字段处于已填充状态,问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。预设字段可以包括:答案选项字段、疾病特征字段、触发条件字段、以及跳转关系字段中的任一或组合。
问题实体模板可以与预设类型的疾病特征相应,这样,在问诊流程中,可以依据用户相关的疾病特征对应的类型,在知识图谱中查找得到对应的问题实体模板,并依据用户相关的疾病特征,对问题实体模板进行字段填充,字段填充后的问题实体模板可以作为动态的问题实体实例,动态的问题实体实例可以包含用于问诊的问题。由于问题实体模板与预设类型的疾病特征相应,故字段填充后的问题实体模板中可以包含预设类型的多种疾病特征的信息,因此能够提高用于问诊的问题所包含的疾病特征数量,进而能够减少问诊的交互轮数,以及能够提高问诊效率。
上述对问题实体模板进行字段填充,具体可以包括:依据用户相关的疾病特征,对答案选项字段进行填充,不同的疾病特征可以对应不同的答案选项。具体地,可以在答案选项字段中填充用户相关的疾病特征对应的释义,不同的释义可以对应不同的答案选项。
上述对问题实体模板进行字段填充,具体可以包括:依据用户相关的疾病特征对应的命中动作属性,对跳转关系字段进行填充。具体地,可以在跳转关系字段中填充用户相关的疾病特征对应的命中动作属性。
例如,跳转关系字段的内容可以为:答案选项被选中的情况下,跳转至预设的问题实体,假设答案选项对应第一疾病特征实体,第一疾病特征实体的命中动作属性中记录有第二疾病特征实体,则预设的问题实体可以为:第二疾病特征实体对应的问题实体信息。
假设用户相关的疾病特征为第一疾病特征,则可以在问题实体模板的答案选项字段中填充第一疾病特征的信息,以及,在跳转关系字段中填充第二疾病特征实体对应的问题实体信息。
参照表5,示出了本发明实施例的一种问题实体模板的示意。该问题实体模板可以与症状类型的疾病特征相应,用于对症状类型的疾病特征进行问诊。
在问诊流程中,可以依据用户相关的症状1、症状2…症状N(N可以为大于0的自然数),对该问题实体模板进行字段填充。
例如,在答案选项字段中填充症状1、症状2…症状N等症状的释义,以帮助用户确定是否命中对应的疾病特征,并选择对应的答案选项。
需要说明的是,本发明实施例中,在答案选项与疾病特征一一对应的情况下,“选中答案选项”与“选中疾病特征”可以为等同特征。例如,选中症状1对应的答案选项,可以等同于选中症状1。
又如,可以在疾病特征字段中填充症状类型。或者,在跳转关系字段中填充症状1、症状2…症状N的子症状对应的问题实体标识等。
可以理解,除了答案选项字段的填充之外,其他预设字段的填充是可选的,也即,可以不进行疾病特征字段、触发条件字段、以及跳转关系字段的填充。
可以理解,表5所示与症状类型的疾病特征相应的问题实体模板只是作为可选实施例,实际上,本领域技术人员还可以根据实际应用需求,采用与其他类型的疾病特征相应的问题实体模板。例如,还可以采用与接触史类型的疾病特征相应的问题实体模板,对应的问题文本可以包括:“是否接触过如下病原、有害因素、疾病患者?”等。
表5
综上,本发明实施例的知识图谱可以包括:疾病实体及疾病特征实体。
其中,疾病实体包括多种属性,其中,疾病系统属性、特征集合属性、临床占比属性等属性对应有概率信息,这些概率信息可用于疾病预测处理。在多种疾病与用户的症状匹配的情况下,上述概率信息可用于对该多种疾病进行区分,因此能够提高疾病预测处理的准确率。
疾病特征实体包含了从属关系、特征对应的类型、频次、命中动作情况下的问题等信息,是医疗领域的传统知识图谱所不具备的。
实施例二
本发明的一种知识图谱的构建方法实施例,具体可以包括:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,上述疾病实体的属性具体包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
上述特征集合中可以包括:与上述疾病特征实体相关联的疾病特征;上述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
上述临床占比属性用于表征疾病在疾病系统中的发病概率;
上述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
本发明实施例中,疾病特征实体可以表征与疾病相关的特征,其可以包括:疾病中出现的疾病特征,也可以包括:疾病中不能出现的疾病特征。
在本发明的一种可选实施例中,确定疾病特征实体的过程可以包括:确定主诉列表,并确定所述主诉列表对应的疾病列表;依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;依据所述主诉列表中主诉、以及填充得到的疾病特征,确定疾病特征实体。
在医疗技术领域,主诉用于表征患者或代诊者对最主要的症状和(或)体征的叙述,主诉通常包括:患者或代诊者陈述的症状、体征、性质、以及持续时间等内容中的至少一种。
本发明实施例可以从医疗查询数据和/或病历数据等医疗资源中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。预设的标准可以包括:主诉的字符数量不超过数量阈值等,数量阈值可以为20等。
在具体实现中,可以根据主诉列表中的单个主诉,确定对应的疾病,进而将确定的疾病添加至疾病列表。一种实现方式可以为,向医生终端发送主诉,由医生终端对应的用户确定主诉对应的疾病。其中,医生终端的用户可以为具有M(M可以为大于0的自然数,M可以大于7)年以上临床经验的医生,其可以依据知识和经验,确定主诉对应的疾病。
疾病列表中的疾病可以作为知识图谱中疾病实体的数据源。也即,可以疾病列表中的疾病,构建对应的疾病实体。
在确定疾病列表后,本发明实施例可以依据医学书籍、医学数据库、医学问答数据等医疗资源,对疾病列表中的疾病进行疾病特征的扩充。也即,针对疾病,在疾病对应的主诉的基础上,对除了主诉之外的疾病特征进行扩充。扩充所涉及疾病特征的类型可以包括:症状、诱因、高发季节、接触史、家族史等。
可选地,可以从医疗资源中获取疾病对应的疾病内容,并从疾病内容中抽取上述类型对应的疾病特征。
上述主诉列表中主诉、以及填充得到的疾病特征,可以作为疾病特征实体对应疾病特征的数据源。也即,还可以依据主诉列表中主诉、以及填充得到的疾病特征,构建疾病特征实体。
在本发明的一种可选实施例中,还可以向医生终端发送疾病对应的候选疾病特征(主诉和填充得到的疾病特征),以使医生终端的用户对候选疾病特征进行更新。上述对候选疾病特征进行更新具体可以包括:候选疾病特征的增加、候选疾病特征的删除、或者候选疾病特征的修改等。
更新后的候选疾病特征,可以作为疾病特征实体对应疾病特征的数据源。例如,可以针对疾病对应的更新后的候选疾病特征,确定疾病对应的特征集合。
在本发明的另一种可选实施例中,还可以针对疾病,确定特征集合中疾病特征在疾病的条件下的条件概率、和/或、疾病特征在疾病的条件下的惩罚因子。可选地,可以依据疾病特征在疾病对应医疗资源中的出现信息,确定上述条件概率或惩罚因子;或者,可由医生终端的用户确定上述条件概率或惩罚因子。
在本发明的再一种可选实施例中,还可以依据疾病及疾病所属疾病系统的医疗数据,确定疾病在疾病系统中的发病概率(临床占比)、和/或、单个疾病系统的患者,占所有疾病系统的患者的比例(系统概率)。
上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
在本发明实施例的一种应用示例1中,对于出现“咳嗽”症状、“咳痰”症状的病人,在进行疾病预测处理的过程中,虽然“急性喉炎”和“支气管炎”都能与这两个症状匹配,但是“咳嗽”在“急性喉炎”中的概率为0.6,“咳痰”在“急性喉炎”中的概率为0.4;而“咳嗽”在“支气管炎”中的概率为0.8,“咳痰”在“支气管炎”中的概率为0.6。由于上述条件概率,可以确定这两个症状与“支气管炎”之间的匹配程度高于这两个症状与“急性喉炎”之间的匹配程度,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
在本发明的一种可选实施例中,上述确定疾病特征实体,具体可以包括:对主诉、以及填充得到的疾病特征进行特征归一化,以得到归一化后的疾病特征;并依据归一化后的疾病特征,确定疾病特征实体。
上述特征归一化可以将语义相同且描述不同的疾病特征,统一为标准描述。例如,“头疼”对应的个性化或口语化的症状描述具体包括:“针扎一样疼”、“一抽一抽的痛”、“一摸就疼”、“咽口水跟着疼”等。又如,“舌痛”对应的个性化或口语化的症状描述具体包括:“舌头左边疼”、“舌尖疼痛”、“舌头根疼”、“舌头边缘痛”等。
本发明实施例中,确定疾病特征实体,具体可以包括:确定疾病特征实体对应的多个属性,并针对特定的疾病特征实体,确定对应的属性值。疾病特征实体对应的多个属性具体可以包括:特征标识属性、类型属性、从属关系属性、频次属性、命中动作属性、释义属性等。
在具体实现中,可以将疾病实体与其特征集合中疾病特征对应的疾病特征实体进行关联。可以理解,本发明实施例对于疾病实体与疾病特征实体之间的具体关联方式不加以限制。
综上,本发明实施例的知识图谱的构建方法,知识图谱中保存有疾病实体与疾病实体之间的关联关系。在疾病预测处理过程中,上述关联关系可用于得到与用户疾病特征相匹配的疾病实体。
本发明实施例的知识图谱中的疾病实体包括多种属性,其中,疾病系统属性、特征集合属性、临床占比属性等属性对应有概率信息,这些概率信息可用于疾病预测处理。在多种疾病与用户的症状匹配的情况下,上述概率信息可用于对该多种疾病进行区分,因此能够提高疾病预测处理的准确率。
首先,上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
其次,上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
再者,临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
进一步,在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
实施例三
本发明的一种知识图谱的构建方法实施例,具体可以包括:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
依据所述疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联;
其中,上述疾病实体的属性具体包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
上述特征集合中包括:与上述疾病特征实体相关联的疾病特征;上述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
上述临床占比属性用于表征疾病在疾病系统中的发病概率;
上述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
本发明实施例的问题实体,用于对疾病特征实体对应的疾病症状进行问诊,以帮助用户确定是否出现对应的疾病症状。
本领域技术人员可以根据实际应用需求,确定疾病特征实体对应的问题实体。根据一种实施例,可以向医生终端发送疾病特征实体的信息,以使医生设置疾病特征实体对应的问题实体。
根据另一种实施例,可以依据疾病特征实体对应的类型、以及历史问诊数据,确定疾病特征实体对应的问题实体。
本发明实施例中,问题实体的字段可以包括:问题文本字段和答案选项字段,其中,问题文本字段或答案选项字段中可以包括疾病特征实体的标识或释义等信息。
可选地,问题实体的字段还可以包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于选中答案选项的条件下执行预设跳转。
可选地,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
当然,本领域技术人员可以根据实际应用需求,确定预设跳转,例如,预设跳转还可以包括:执行预设函数,预设函数可用于结束问题实体的查找等。
本发明实施例还可以向医生终端发送问题实体的信息,以使医生终端的用户对问题实体的信息进行审核。
在具体实现中,问题实体可以包括:问题实体实例,问题实体实例可以与预设的疾病特征相应。因此,本发明实施例可以在知识图谱中,建立预设的疾病特征实体与问题实体实例之间的关联。
在具体实现中,本发明实施例的问题实体可以包括:问题实体模板,问题实体模板可以与预设类型的疾病特征相应。因此,本发明实施例可以在知识图谱中,建立预设类型的疾病特征实体与问题实体实例之间的关联。
本发明实施例中,建立疾病特征实体与问题实体之间的关联,具体可以包括:依据问题实体中的疾病特征字段,建立疾病特征实体与问题实体之间的映射关系,其中,问题实体中的疾病特征字段与疾病特征实体相匹配。
若问题实体中的疾病特征字段表征预设的疾病特征,则映射关系中的问题实体为问题实体实例,映射关系中的疾病特征实体对应一种预设的疾病特征。
若问题实体中的疾病特征字段表征预设类型的疾病特征,则映射关系中的问题实体为问题实体模板,映射关系中的疾病特征实体对应预设类型的多种疾病特征。
综上,本发明实施例的知识图谱的构建方法,在知识图谱中建立疾病特征实体与问题实体之间的关联。这样,在问诊流程中,可以依据用户相关的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可用于在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用、以及节省人工问诊所花费的成本,进而能够提高问诊效率和问诊的智能性。
并且,本发明实施例在疾病特征实体中通过命中动作属性表征了:疾病特征与问题实体的信息之间的关系,在对应疾病特征被选中的情况下,将触发对应的问题实体。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
另外,本发明实施例在问题实体中通过跳转关系字段表征了:疾病特征对应的答案选项被选中的情况下、将跳转至预设的问题实体,这样可以提高问诊流程中问题接序的合理性。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
实施例四
参照图3,示出了本发明的一种知识图谱的构建方法实施例的步骤流程图,该实施例具体可以包括如下步骤:
步骤301、确定主诉列表;
在实际应用中,可以从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
步骤302、确定疾病列表;
医生根据各主诉对应的疾病构建疾病列表。这些疾病即为知识图谱中的疾病集合。
步骤303、特征扩充;
在实际应用中,可以依据医学书籍、网络资源等医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充,疾病特征可以包括:症状、接触史等类型。
步骤304、特征审核和概率标注;
在实际应用中,多年(例如8年)以上资历的医生,可以根据临床经验审核这些疾病特征,进行疾病特征的增删改,并标注各个疾病的条件下、各疾病特征出现的条件概率。
步骤305、特征归一化;
根据医学信息,对这些疾病特征进行归一化,即合并、调整。
步骤306、设置问题实体,并将设置的问题实体保存至知识图谱。
在实际应用中,可以根据归一化后的疾病特征,考虑可能询问的所有问题,设置问题实体。设置的问题实体可由医生审核后确定和保存。
实施例五
参照图4,示出了本发明的一种知识图谱的使用方法实施例的步骤流程图,该实施例具体可以包括如下步骤:
步骤401、依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
步骤402、依据概率特征,确定上述候选疾病的得分;
上述概率特征包括如下特征中的至少一种:
与上述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与上述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例(系统概率)。
本发明实施例提供的知识图谱,可应用于疾病预测处理场景,该疾病预测处理场景用于确定与用户疾病特征相关联的候选疾病。该候选疾病可以为至少一个,该候选疾病可以对应有得分,该得分可以表征在用户疾病特征的条件下候选疾病的概率。
步骤401中,用户疾病特征可以表征用户出现的疾病特征。
在具体实现中,可以从至少一次用户输入中确定出用户疾病特征。用户疾病特征的确定方法可以包括但不限于:实体识别方法、或疾病特征表的匹配方法等。
需要说明的是,至少一次用户输入中可以包括用户疾病特征对应的标准描述。或者,至少一次用户输入中可以包括用户疾病特征对应的非标准描述,如口语化描述等,此种情况下,可以将至少一次用户输入中的非标准描述转换为标准描述。因此,本发明实施例将使用用户疾病特征的标准描述,进行疾病预测处理,以提高与用户疾病特征相匹配的多种疾病之间的区分度。
在具体实现中,可以将用户疾病特征与上述关联关系中的疾病特征实体进行匹配,若匹配成功,则将上述关联关系中的疾病实体对应的疾病,作为候选疾病。
可以理解,一种用户疾病特征可以对应至少一种候选疾病。不同的用户疾病特征可以对应相同或不同的候选疾病。本发明实施例可以优先选择多种用户疾病特征共同对应的候选疾病。
例如,用户疾病特征包括:“咳嗽”症状、“咳痰”症状,在进行疾病预测处理的过程中,“急性喉炎”和“支气管炎”都能与这两个症状匹配,因此,“咳嗽”症状和“咳痰”症状对应的候选疾病可以包括:“急性喉炎”和“支气管炎”。
步骤402中,上述概率特征可以为知识图谱中记录的特征,根据上述概率特征确定候选疾病的得分,可以提高候选疾病之间的区分性。
在具体实现中,可以依据上述条件概率,确定候选疾病的得分。上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
在本发明实施例的一种应用示例1中,用户疾病特征包括:“咳嗽”和“咳痰”这两个症状,在进行疾病预测处理的过程中,虽然“急性喉炎”和“支气管炎”都能与这两个症状匹配,但是“咳嗽”在“急性喉炎”中的概率为0.6,“咳痰”在“急性喉炎”中的概率为0.4;而“咳嗽”在“支气管炎”中的概率为0.8,“咳痰”在“支气管炎”中的概率为0.6。依据上述条件概率,可以确定这两个症状与“支气管炎”之间的匹配程度高于这两个症状与“急性喉炎”之间的匹配程度,因此可以确定“支气管炎”的得分高于“急性喉炎”的得分。
在具体实现中,可以依据上述惩罚因子,确定候选疾病的得分。该惩罚因子可以对应在候选疾病的条件下不能出现的疾病特征,用于在疾病预测处理的过程中,对候选疾病的概率进行惩罚。
例如,候选疾病包括:候选疾病A,但用户疾病特征包括:不应该出现在候选疾病A中的疾病特征X,此种情况下,可以依据疾病特征X和候选疾病A对应的惩罚因子,减少候选疾病A的得分。
在具体实现中,可以依据上述临床占比,确定候选疾病的得分。临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。通常,临床占比越高,则对应候选疾病的得分越高。
在具体实现中,可以依据上述临床占比和系统概率,确定候选疾病的得分。可以依据临床占比和系统概率确定候选疾病的先验概率,进而可以依据该先验概率,确定候选疾病的得分。通常候选疾病的先验概率越高,则候选疾病的得分越高。
在采用多种概率特征的情况下,可以对多种概率特征进行融合,并依据融合概率特征,确定候选疾病的得分。对应的融合方式可以包括:加权平均方式、或者乘积方式、贝叶斯推断算法等。
在确定上述候选疾病的得分后,本发明实施例可以依据候选疾病的得分,对候选疾病进行筛选,以得到筛选后的目标候选疾病。对应的筛选过程具体可以包括:选取得分大于得分阈值的候选疾病,和/或,选取得分排在前P(P可以为大于0的自然数)位的候选疾病。
本发明实施例可以提供目标候选疾病的如下处理方式:
处理方式1、对目标候选疾病的信息进行输出。
在具体实现中,可以将目标候选疾病的信息,作为疾病预测处理结果进行输出。例如,输出的目标候选疾病的信息可以包括:得分最高的至少一种目标候选疾病的名称及得分等。又如,输出的目标候选疾病的信息可以包括:与目标候选疾病相匹配的用户疾病特征、以及、用户疾病特征在目标候选疾病的条件下的条件概率等。
疾病预测处理结果中,目标候选疾病的得分可以表征在用户疾病特征的条件下候选疾病的概率,该得分可以区分用户疾病特征对应的不同候选疾病。
疾病预测处理结果中,用户疾病特征在目标候选疾病的条件下的条件概率,可用于准确地反映用户疾病特征与目标候选疾病之间的关联。
可选地,可以依据得分从高到低的顺序,对目标候选疾病的信息进行输出。例如,可以依次输出目标候选疾病列表,目标候选疾病列表中目标候选疾病的得分递减。
处理方式2、依据所述目标候选疾病对应的疾病特征,生成目标问题,所述目标问题用于对用户进行问诊。
在问诊场景下,可以依据目标候选疾病对应的疾病特征,自动生成目标问题,因此能够提高问诊效率。
本发明实施例的疾病预测处理和生成目标问题,可以为动态过程;因此,能够依据问诊过程中用户疾病特征的累积,得到与用户疾病特征更相关的目标问题,因此可以提高问诊的合理性;以及,能够依据问诊过程中用户疾病特征的累积,得到与用户疾病特征更匹配的候选疾病,因此可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
综上,本发明实施例的知识图谱的使用方法,依据知识图谱中的疾病实体包括的属性对应的概率信息,确定概率特征,并依据概率特征,确定候选疾病的得分。上述得分可以反映候选疾病之间的差异,可以提高候选疾病之间的区分性,因此能够利用知识图谱实现提高疾病预测的准确率。
首先,概率特征中的条件概率,能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
其次,概率特征中的惩罚因子,能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
再者,概率特征中的临床占比,能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
进一步,概率特征中可以包括:临床占比和系统概率。在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
实施例六
本实施例对生成目标问题的过程进行说明。
本发明实施例在知识图谱中建立疾病特征实体与问题实体之间的关联。这样,在问诊流程中,可以依据候选疾病对应的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的目标问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可用于在问诊流程中自动生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高问诊效率、以及问诊的智能性。
本发明实施例可以依据疾病特征对应的疾病特征实体,在知识图谱包括的疾病特征实体与问题实体之间的映射关系中进行查找,以得到疾病特征对应的问题实体。
在本发明的一种可选实施例中,可以依据疾病特征对应的重要性得分,从所述候选疾病对应的疾病特征中确定出目标疾病特征。目标疾病特征可以为重要性较高的疾病特征。将目标疾病特征应用于目标问题的生成过程,能够在降低运算量的情况下,提高问诊效率。
上述重要性得分的因子具体可以包括如下特征中的至少一种:
疾病特征在疾病的条件下的条件概率;
疾病在疾病系统中的发病概率;
疾病系统的系统概率;
候选疾病对应的疾病特征与用户疾病特征之间的相关性。
本发明实施例可以依据候选疾病所包含的疾病特征对应的疾病特征实体在各个疾病中的条件概率、以及疾病在疾病系统中的发病概率等信息,计算各个疾病特征的重要性得分,并依据重要性得分,对候选疾病所包含的症状特征进行排序。可选地,可以按照预设的标准,依据排序结果选择符合标准的目标疾病特征进行询问。例如,预设的标准可以包括:重要性得分大于重要性阈值,或者按照重要性得分从高到低的顺序,排在前X(X可以为大于0的自然数)位等。
本发明实施例可以提供生成目标问题的如下技术方案:
技术方案1、
技术方案1中,可以依据疾病特征实体与问题实体实例之间的映射关系,确定疾病特征对应的问题实体实例。
在具体实现中,可以从目标疾病特征对应的问题实体实例中获取问题文本字段的内容和答案选项字段的内容,以得到目标问题;也即,目标问题可以包括:问题文本字段的内容和答案选项字段的内容。例如,在目标疾病特征为“呕吐”的情况下,可以依据“呕吐”对应的问题实体实例,确定目标问题A。目标问题A的问题文本可以为“是否呕吐”,目标问题A的答案选项可以为:[是,否,我不知道]。
在目标疾病特征对应的答案选项被选中的情况下,可以依据所述目标疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体。
例如,目标疾病特征为“呕吐”,在目标问题A对应的答案选项[是]被选中的情况下,根据表2所示疾病特征实体的命中动作属性,将触发问题实体标识为18的问题实体实例。此种情况下,可以依据问题实体标识为18的问题实体实例,生成目标问题B。目标问题B的问题文本可以为“是否没有恶心动作直接呕吐?”,目标问题B的答案选项可以为:[是,否,我不知道]。
技术方案2、
技术方案2中,可以依据疾病特征实体的类型与问题实体模板之间的映射关系,确定目标疾病特征对应的问题实体模板。
此种情况下,上述确定目标问题,具体可以包括:依据上述目标疾病特征,对上述问题实体模板进行字段填充,以得到目标问题。
问题实体模板的字段具体包括:问题文本字段和答案选项字段;上述对所述问题实体模板进行字段填充,具体包括:步骤S1、和/或、步骤S2。步骤S1和步骤S2的执行顺序不分先后。
其中,步骤S1可以依据属于一种类型的至少一种目标疾病特征,对所述类型对应的问题实体模板进行答案字段的填充,以在得到的目标问题中携带至少一种目标疾病特征的信息。例如,目标疾病特征的类型为“症状”,则可以在“症状”对应问题实体模板的答案选项字段中,填充症状1、症状2…症状N等症状的释义,以帮助用户确定是否命中对应的疾病特征,并选择对应的答案选项。
步骤S2可以依据所述目标疾病特征对应疾病特征实体中的命中动作属性,对问题实体模板的跳转关系字段进行填充。具体地,可以在跳转关系字段中填充目标疾病特征对应命中动作属性的信息。
例如,跳转关系字段的内容可以为:答案选项被选中的情况下,跳转至预设的问题实体,假设答案选项对应第一疾病特征实体,第一疾病特征实体的命中动作属性中记录有第二疾病特征实体,则预设的问题实体可以为:第二疾病特征实体对应的问题实体信息。
假设目标疾病特征为第一疾病特征,则可以在问题实体模板的答案选项字段中填充第一疾病特征的信息,以及,在跳转关系字段中填充第二疾病特征实体对应的问题实体标识。
技术方案3、
技术方案3中,可以在目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
所述跳转关系字段用于选中答案选项的条件下执行预设跳转。可选地,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体可以为父子关系。
例如,在目标问题B对应的答案选项[是]被选中的情况下,可以根据问题实体的跳转关系字段,触发“嗜睡”等症状对应的问题实体实例。此种情况下,可以依据“嗜睡”等症状对应的问题实体实例,生成目标问题C。目标问题C的问题文本可以为“是否嗜睡?”,目标问题C的答案选项可以为:[是,否,我不知道]。
技术方案1基于问题实体实例确定目标问题;技术方案2基于问题实体模板的填充确定目标问题;技术方案3可以通过问题实体中的跳转关系字段,获取问题实体。可以理解,本领域技术人员可以根据实际应用需求,采用技术方案1至技术方案3中的任一或组合。
综上,本发明实施例的知识图谱的使用方法,在知识图谱中建立疾病特征实体与问题实体之间的关联。这样,可以依据候选疾病对应的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可用于在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高问诊效率和问诊的智能性。
并且,本发明实施例在疾病特征实体中通过命中动作属性表征了:疾病特征与问题实体的信息之间的关系,在对应疾病特征被选中的情况下,将触发对应的问题实体。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
另外,本发明实施例在问题实体中通过跳转关系字段表征了:疾病特征对应的答案选项被选中的情况下、将跳转至预设的问题实体,这样可以提高问诊流程中问题接序的合理性。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
本发明的一种知识图谱的构建装置,具体可以包括:。
第一关联模块,用于在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,上述疾病实体的属性可以包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
上述特征集合中可以包括:与上述疾病特征实体相关联的疾病特征;上述特征集合属性的属性参数可以包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
上述临床占比属性用于表征疾病在疾病系统中的发病概率;
上述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
可选地,上述疾病特征实体的属性可以包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
参照图5,示出了本发明的一种知识图谱的构建装置实施例的结构框图,具体可以包括:
第一关联模块501,用于在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
问题实体确定模块502,用于依据上述疾病特征实体,确定问题实体;上述问题实体用于表征与上述疾病特征实体相关的问题;
第二关联模块503,用于在知识图谱中,建立上述疾病特征实体与上述问题实体之间的关联。
可选地,上述问题实体的字段可以包括:问题文本字段和答案选项字段。
可选地,上述问题实体的字段还可以包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,上述疾病特征字段用于表征对应的疾病特征实体;
上述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
上述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
可选地,上述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与上述第二问题实体对应的疾病特征实体为父子关系。
可选地,上述问题实体可以包括:
问题实体实例;上述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;上述问题实体模板的问题文本字段处于已填充状态,上述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
可选地,上述疾病特征实体的属性可以包括:命中动作属性,上述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
可选地,上述装置还可以包括:
主诉确定模块,用于确定主诉列表,并确定上述主诉列表对应的疾病列表;
特征扩充模块,用于依据医疗资源,对上述疾病列表中的疾病进行疾病特征的扩充;
特征实体确定模块,用于依据上述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
可选地,上述主诉确定模块可以包括:
主诉处理模块,用于从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
综上,本发明实施例的知识图谱的构建装置,知识图谱中的疾病实体包括多种属性,其中,疾病系统属性、特征集合属性、临床占比属性等属性对应有概率信息,这些概率信息可用于疾病预测处理。在多种疾病与用户的症状匹配的情况下,上述概率信息可用于对该多种疾病进行区分,因此能够提高疾病预测处理的准确率。
首先,上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
其次,上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
再者,临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
进一步,在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
此外,本发明实施例的知识图谱包含的疾病特征实体与问题实体之间的关联,可用于在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用、以及节省人工问诊所花费的成本,进而能够提高问诊效率和问诊的智能性。
参照图6,示出了本发明的一种知识图谱的使用装置实施例的结构框图,具体可以包括:
查找模块601,用于依据用户疾病特征,在知识图谱可以包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
得分确定模块602,用于依据概率特征,确定所述候选疾病的得分;
上述概率特征可以包括如下特征中的至少一种:
与上述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与上述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
可选地,上述装置还可以包括:
筛选模块,用于依据上述候选疾病的得分,对上述候选疾病进行筛选,以得到筛选后的目标候选疾病;
输出模块,用于输出上述目标候选疾病的信息。
可选地,上述装置还可以包括:
筛选模块,用于依据上述候选疾病的得分,对上述候选疾病进行筛选,以得到筛选后的目标候选疾病;
问题生成模块,用于依据上述目标候选疾病对应的疾病特征,生成目标问题,上述目标问题用于对用户进行问诊。
可选地,上述问题生成模块可以包括:
问题实体获取模块,用于依据上述疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;上述问题实体用于表征与上述疾病特征实体相关的问题;
第一问题生成模块,用于依据上述问题实体对应的问题,生成目标问题。
可选地,上述问题实体可以包括:问题实体模板;上述第一问题生成模块可以包括:
填充模块,用于依据上述疾病特征,对上述问题实体模板进行字段填充,以得到目标问题。
可选地,上述填充模块可以包括:
第一填充模块,用于依据属于一种类型的至少一种疾病特征,对上述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种疾病特征的信息。
可选地,上述问题实体模板的字段可以包括:问题文本字段和答案选项字段;
上述填充模块可以包括:
第二填充模块,用于在上述问题实体模板的答案选项字段中填充上述疾病特征的信息。
可选地,上述填充模块可以包括:
第三填充模块,用于依据上述疾病特征对应疾病特征实体中的命中动作属性,对上述问题实体模板的跳转关系字段进行填充。
可选地,上述问题实体获取模块可以包括:
第一问题实体获取模块,用于在上述疾病特征对应的答案选项被选中的情况下,依据上述疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
第二问题实体获取模块,用于在疾病特征对应的答案选项被选中的情况下,依据上述疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
可选地,上述问题生成模块可以包括:
目标疾病特征确定模块,用于依据疾病特征对应的重要性得分,从上述目标候选疾病对应的疾病特征中确定出目标疾病特征;上述目标疾病特征用于表征本轮问诊向用户询问的疾病特征;
获取模块,用于依据上述目标疾病特征对应的类型,从知识图谱中获取对应类型的问题实体;上述问题实体用于表征与上述疾病特征实体相关的问题;
第二问题生成模块,用于依据上述问题实体、以及属于上述类型的目标疾病特征,生成目标问题。
综上,本发明实施例的知识图谱的使用装置,依据知识图谱中的疾病实体包括的属性对应的概率信息,确定概率特征,并依据概率特征,确定候选疾病的得分。上述得分可以反映候选疾病之间的差异,可以提高候选疾病之间的区分性,因此能够利用知识图谱实现提高疾病预测的准确率。
首先,概率特征中的条件概率,能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
其次,概率特征中的惩罚因子,能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
再者,概率特征中的临床占比,能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
进一步,概率特征中可以包括:临床占比和系统概率。在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于构建知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:在知识图谱中,建立疾病特征实体与疾病实体之间的关联;其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;所述临床占比属性用于表征疾病在疾病系统中的发病概率;所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
图7是根据一示例性实施例示出的一种用于构建知识图谱的装置1100的框图。例如,装置1100可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置1100可以包括以下一个或多个组件:处理组件1102,存储器1104,电源组件1106,多媒体组件1108,音频组件1110,输入/输出(I/O)的接口1112,传感器组件1114,以及通信组件1116。
处理组件1102通常控制装置1100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1102可以包括一个或多个处理器1120来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1102可以包括一个或多个模块,便于处理组件1102和其他组件之间的交互。例如,处理组件1102可以包括多媒体模块,以方便多媒体组件1108和处理组件1102之间的交互。
存储器1104被配置为存储各种类型的数据以支持在设备1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1106为装置1100的各种组件提供电力。电源组件1106可以包括电源管理系统,一个或多个电源,及其他与为装置1100生成、管理和分配电力相关联的组件。
多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1108包括一个前置摄像头和/或后置摄像头。当设备1100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1110被配置为输出和/或输入音频信号。例如,音频组件1110包括一个麦克风(MIC),当装置1100处于操作模式,如呼叫模式、记录模式和语音数据处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中,音频组件1110还包括一个扬声器,用于输出音频信号。
I/O接口1112为处理组件1102和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1114包括一个或多个传感器,用于为装置1100提供各个方面的状态评估。例如,传感器组件1114可以检测到设备1100的打开/关闭状态,组件的相对定位,例如所述组件为装置1100的显示器和小键盘,传感器组件1114还可以检测装置1100或装置1100一个组件的位置改变,用户与装置1100接触的存在或不存在,装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1114还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1116还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频数据处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1104,上述指令可由装置1100的处理器1120执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图8是本发明的一些实施例中服务端的结构示意图。该服务端1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务端中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务端1900上执行存储介质1930中的一系列指令操作。
服务端1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务端或者终端)的处理器执行时,使得装置能够执行图3所示的知识图谱的构建方法、或者图4所示的知识图谱的使用方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务端或者终端)的处理器执行时,使得装置能够执行一种知识图谱的构建方法,所述方法包括:在知识图谱中,建立疾病特征实体与疾病实体之间的关联;其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;所述临床占比属性用于表征疾病在疾病系统中的发病概率;所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
本发明实施例公开了A1、一种知识图谱的构建方法,所述方法包括:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
A2、根据A1所述的方法,所述疾病特征实体的属性包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
A3、根据A1所述的方法,所述方法还包括:
依据所述疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
A4、根据A3所述的方法,所述问题实体的字段包括:问题文本字段和答案选项字段。
A5、根据A4所述的方法,所述问题实体的字段还包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征对应的疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
A6、根据A5所述的方法,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
A7、根据A4或A5或A6所述的方法,所述问题实体包括:
问题实体实例;所述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;所述问题实体模板的问题文本字段处于已填充状态,所述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
A8、根据A3至A6中任一所述的方法,所述疾病特征实体的属性包括:命中动作属性,所述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
A9、根据A1至A6中任一所述的方法,所述方法还包括:
确定主诉列表,并确定所述主诉列表对应的疾病列表;
依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;
依据所述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
A10、根据A9所述的方法,所述确定主诉列表,包括:
从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
本发明实施例公开了B11、一种知识图谱的使用方法,所述方法包括:
依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
B12、根据B11所述的方法,所述方法还包括:
依据所述候选疾病的得分,对所述候选疾病进行筛选,以得到筛选后的目标候选疾病;
输出所述目标候选疾病的信息。
B13、根据B11所述的方法,所述方法还包括:
依据所述候选疾病的得分,对所述候选疾病进行筛选,以得到筛选后的目标候选疾病;
依据所述目标候选疾病对应的疾病特征,生成目标问题,所述目标问题用于对用户进行问诊。
B14、根据B13所述的方法,所述依据所述目标候选疾病对应的疾病特征,生成目标问题,包括:
依据所述疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体对应的问题,生成目标问题。
B15、根据B14所述的方法,所述问题实体包括:问题实体模板;所述依据所述问题实体对应的问题,生成目标问题,包括:
依据所述疾病特征,对所述问题实体模板进行字段填充,以得到目标问题。
B16、根据B15所述的方法,所述对所述问题实体模板进行字段填充,包括:
依据属于一种类型的至少一种疾病特征,对所述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种疾病特征的信息。
B17、根据B15所述的方法,所述问题实体模板的字段包括:问题文本字段和答案选项字段;
所述对所述问题实体模板进行字段填充,包括:
在所述问题实体模板的答案选项字段中填充所述疾病特征的信息。
B18、根据B15所述的方法,所述对所述问题实体模板进行字段填充,包括:
依据所述疾病特征对应疾病特征实体中的命中动作属性,对所述问题实体模板的跳转关系字段进行填充。
B19、根据B14所述的方法,所述从知识图谱中获取对应的问题实体,包括:
在所述疾病特征对应的答案选项被选中的情况下,依据所述疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
在疾病特征对应的答案选项被选中的情况下,依据所述疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
B20、根据B13所述的方法,所述依据所述目标候选疾病对应的疾病特征,生成目标问题,包括:
依据疾病特征对应的重要性得分,从所述目标候选疾病对应的疾病特征中确定出目标疾病特征;所述目标疾病特征用于表征本轮问诊向用户询问的疾病特征;
依据所述目标疾病特征对应的类型,从知识图谱中获取对应类型的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体、以及属于所述类型的目标疾病特征,生成目标问题。
本发明实施例公开了C21、一种知识图谱的构建装置,包括:
第一关联模块,用于在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
C22、根据C21所述的装置,所述疾病特征实体的属性包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
C23、根据C21所述的装置,所述装置还包括:
问题实体确定模块,用于依据所述疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
第二关联模块,用于在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
C24、根据C23所述的装置,所述问题实体的字段包括:问题文本字段和答案选项字段。
C25、根据C24所述的装置,所述问题实体的字段还包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征对应的疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
C26、根据C25所述的装置,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
C27、根据C24或C25或C26所述的装置,所述问题实体包括:
问题实体实例;所述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;所述问题实体模板的问题文本字段处于已填充状态,所述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
C28、根据C23至C26中任一所述的装置,所述疾病特征实体的属性包括:命中动作属性,所述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
C29、根据C21至C26中任一所述的装置,所述装置还包括:
主诉确定模块,用于确定主诉列表,并确定所述主诉列表对应的疾病列表;
特征扩充模块,用于依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;
特征实体确定模块,用于依据所述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
C30、根据C29所述的装置,所述主诉确定模块包括:
主诉处理模块,用于从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
本发明实施例公开了D31、一种知识图谱的使用装置,包括:
查找模块,用于依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
得分确定模块,用于依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
D32、根据D31所述的装置,所述装置还包括:
筛选模块,用于依据所述候选疾病的得分,对所述候选疾病进行筛选,以得到筛选后的目标候选疾病;
输出模块,用于输出所述目标候选疾病的信息。
D33、根据D31所述的装置,所述装置还包括:
筛选模块,用于依据所述候选疾病的得分,对所述候选疾病进行筛选,以得到筛选后的目标候选疾病;
问题生成模块,用于依据所述目标候选疾病对应的疾病特征,生成目标问题,所述目标问题用于对用户进行问诊。
D34、根据D33所述的装置,所述问题生成模块包括:
问题实体获取模块,用于依据所述疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
第一问题生成模块,用于依据所述问题实体对应的问题,生成目标问题。
D35、根据D34所述的装置,所述问题实体包括:问题实体模板;所述第一问题生成模块包括:
填充模块,用于依据所述疾病特征,对所述问题实体模板进行字段填充,以得到目标问题。
D36、根据D35所述的装置,所述填充模块包括:
第一填充模块,用于依据属于一种类型的至少一种疾病特征,对所述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种疾病特征的信息。
D37、根据D35所述的装置,所述问题实体模板的字段包括:问题文本字段和答案选项字段;
所述填充模块包括:
第二填充模块,用于在所述问题实体模板的答案选项字段中填充所述疾病特征的信息。
D38、根据D35所述的装置,所述填充模块包括:
第三填充模块,用于依据所述疾病特征对应疾病特征实体中的命中动作属性,对所述问题实体模板的跳转关系字段进行填充。
D39、根据D34所述的装置,所述问题实体获取模块包括:
第一问题实体获取模块,用于在所述疾病特征对应的答案选项被选中的情况下,依据所述疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
第二问题实体获取模块,用于在疾病特征对应的答案选项被选中的情况下,依据所述疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
D40、根据D33所述的装置,所述问题生成模块包括:
目标疾病特征确定模块,用于依据疾病特征对应的重要性得分,从所述目标候选疾病对应的疾病特征中确定出目标疾病特征;所述目标疾病特征用于表征本轮问诊向用户询问的疾病特征;
获取模块,用于依据所述目标疾病特征对应的类型,从知识图谱中获取对应类型的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
第二问题生成模块,用于依据所述问题实体、以及属于所述类型的目标疾病特征,生成目标问题。
本发明实施例公开了E41、一种用于构建知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
E42、根据E41所述的装置,所述疾病特征实体的属性包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
E43、根据E41所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据所述疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
E44、根据E43所述的装置,所述问题实体的字段包括:问题文本字段和答案选项字段。
E45、根据E44所述的装置,所述问题实体的字段还包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征对应的疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
E46、根据E45所述的装置,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
E47、根据E44或E45或E46所述的装置,所述问题实体包括:
问题实体实例;所述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;所述问题实体模板的问题文本字段处于已填充状态,所述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
E48、根据E43至E46中任一所述的装置,所述疾病特征实体的属性包括:命中动作属性,所述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
E49、根据E41至E46中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定主诉列表,并确定所述主诉列表对应的疾病列表;
依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;
依据所述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
E50、根据E49所述的装置,所述确定主诉列表,包括:
从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
本发明实施例公开了F51、一种用于使用知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
F52、根据F51所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据所述候选疾病的得分,对所述候选疾病进行筛选,以得到筛选后的目标候选疾病;
输出所述目标候选疾病的信息。
F53、根据F51所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据所述候选疾病的得分,对所述候选疾病进行筛选,以得到筛选后的目标候选疾病;
依据所述目标候选疾病对应的疾病特征,生成目标问题,所述目标问题用于对用户进行问诊。
F54、根据F53所述的装置,所述依据所述目标候选疾病对应的疾病特征,生成目标问题,包括:
依据所述疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体对应的问题,生成目标问题。
F55、根据F54所述的装置,所述问题实体包括:问题实体模板;所述依据所述问题实体对应的问题,生成目标问题,包括:
依据所述疾病特征,对所述问题实体模板进行字段填充,以得到目标问题。
F56、根据F55所述的装置,所述对所述问题实体模板进行字段填充,包括:
依据属于一种类型的至少一种疾病特征,对所述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种疾病特征的信息。
F57、根据F55所述的装置,所述问题实体模板的字段包括:问题文本字段和答案选项字段;
所述对所述问题实体模板进行字段填充,包括:
在所述问题实体模板的答案选项字段中填充所述疾病特征的信息。
F58、根据F55所述的装置,所述对所述问题实体模板进行字段填充,包括:
依据所述疾病特征对应疾病特征实体中的命中动作属性,对所述问题实体模板的跳转关系字段进行填充。
F59、根据F54所述的装置,所述从知识图谱中获取对应的问题实体,包括:
在所述疾病特征对应的答案选项被选中的情况下,依据所述疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
在疾病特征对应的答案选项被选中的情况下,依据所述疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
F60、根据F53所述的装置,所述依据所述目标候选疾病对应的疾病特征,生成目标问题,包括:
依据疾病特征对应的重要性得分,从所述目标候选疾病对应的疾病特征中确定出目标疾病特征;所述目标疾病特征用于表征本轮问诊向用户询问的疾病特征;
依据所述目标疾病特征对应的类型,从知识图谱中获取对应类型的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体、以及属于所述类型的目标疾病特征,生成目标问题。
本发明实施例公开了G61、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A10中一个或多个所述的知识图谱的构建方法。
本发明实施例公开了H62、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如B11至B20中一个或多个所述的知识图谱的使用方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种知识图谱的构建方法、一种知识图谱的处理构建和一种用于构建知识图谱的装置、一种知识图谱的使用方法、一种知识图谱的使用装置和一种用于使用知识图谱的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种知识图谱的构建方法,其特征在于,所述方法包括:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
2.根据权利要求1所述的方法,其特征在于,所述疾病特征实体的属性包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
依据所述疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
4.一种知识图谱的使用方法,其特征在于,所述方法包括:
依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
5.一种知识图谱的构建装置,其特征在于,包括:
第一关联模块,用于在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
6.一种知识图谱的使用装置,其特征在于,包括:
查找模块,用于依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
得分确定模块,用于依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
7.一种用于构建知识图谱的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在知识图谱中,建立疾病特征实体与疾病实体之间的关联;
其中,所述疾病实体的属性包括如下属性中的至少一种:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;所述特征集合属性的属性参数包括:疾病特征在疾病的条件下的条件概率,和/或,疾病特征在疾病的条件下的惩罚因子;
所述临床占比属性用于表征疾病在疾病系统中的发病概率;
所述疾病系统属性对应有系统概率,用于表征单个疾病系统的患者,占所有疾病系统的患者的比例。
8.一种用于使用知识图谱的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户疾病特征,在知识图谱包括的疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据概率特征,确定所述候选疾病的得分;
所述概率特征包括如下特征中的至少一种:
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的条件概率;
与所述用户疾病特征相匹配的疾病特征在候选疾病的条件下的惩罚因子;
候选疾病在疾病系统中的发病概率;以及
单个疾病系统的患者,占所有疾病系统的患者的比例。
9.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至3中一个或多个所述的知识图谱的构建方法。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求4所述的知识图谱的使用方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110105784.4A CN112749286A (zh) | 2021-01-26 | 2021-01-26 | 知识图谱的构建和使用方法、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110105784.4A CN112749286A (zh) | 2021-01-26 | 2021-01-26 | 知识图谱的构建和使用方法、装置和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112749286A true CN112749286A (zh) | 2021-05-04 |
Family
ID=75653040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110105784.4A Pending CN112749286A (zh) | 2021-01-26 | 2021-01-26 | 知识图谱的构建和使用方法、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112749286A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948599A (zh) * | 2021-05-13 | 2021-06-11 | 北京富通东方科技有限公司 | 一种基于医学知识图谱的路径推理的疾病诊断方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461151A (zh) * | 2017-12-15 | 2018-08-28 | 北京大学深圳研究生院 | 一种知识图谱的逻辑增强方法及装置 |
CN109448838A (zh) * | 2018-09-28 | 2019-03-08 | 小伍健康科技(上海)有限责任公司 | 一种基于深度神经网络的症状诊断方法及设备 |
CN109887596A (zh) * | 2019-02-18 | 2019-06-14 | 广州天鹏计算机科技有限公司 | 基于知识图谱的慢阻肺疾病诊断方法、装置和计算机设备 |
CN110391021A (zh) * | 2019-07-04 | 2019-10-29 | 北京爱医生智慧医疗科技有限公司 | 一种基于医学知识图谱的疾病推理系统 |
CN110504028A (zh) * | 2019-08-22 | 2019-11-26 | 上海软中信息系统咨询有限公司 | 一种疾病问诊方法、装置、系统、计算机设备和存储介质 |
CN112035636A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
-
2021
- 2021-01-26 CN CN202110105784.4A patent/CN112749286A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461151A (zh) * | 2017-12-15 | 2018-08-28 | 北京大学深圳研究生院 | 一种知识图谱的逻辑增强方法及装置 |
CN109448838A (zh) * | 2018-09-28 | 2019-03-08 | 小伍健康科技(上海)有限责任公司 | 一种基于深度神经网络的症状诊断方法及设备 |
CN109887596A (zh) * | 2019-02-18 | 2019-06-14 | 广州天鹏计算机科技有限公司 | 基于知识图谱的慢阻肺疾病诊断方法、装置和计算机设备 |
CN110391021A (zh) * | 2019-07-04 | 2019-10-29 | 北京爱医生智慧医疗科技有限公司 | 一种基于医学知识图谱的疾病推理系统 |
CN110504028A (zh) * | 2019-08-22 | 2019-11-26 | 上海软中信息系统咨询有限公司 | 一种疾病问诊方法、装置、系统、计算机设备和存储介质 |
CN112035636A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948599A (zh) * | 2021-05-13 | 2021-06-11 | 北京富通东方科技有限公司 | 一种基于医学知识图谱的路径推理的疾病诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI684874B (zh) | 智慧型音箱及其操作方法 | |
CN105845124B (zh) | 音频处理方法及装置 | |
CN107527619B (zh) | 语音控制业务的定位方法及装置 | |
US20230268073A1 (en) | Inquiry information processing method and apparatus, and medium | |
CN107451240B (zh) | 一种基于交互的知识图谱问答q/a系统检索提升方法和装置 | |
CN113099297B (zh) | 卡点视频的生成方法、装置、电子设备及存储介质 | |
CN106777016B (zh) | 基于即时通信进行信息推荐的方法及装置 | |
CN111339744A (zh) | 票务信息展示方法、装置及存储介质 | |
CN111708943A (zh) | 一种搜索结果展示方法、装置和用于搜索结果展示的装置 | |
CN112068711A (zh) | 一种输入法的信息推荐方法、装置和电子设备 | |
CN112749287A (zh) | 知识图谱的构建方法和使用方法、装置和介质 | |
CN111460172A (zh) | 产品问题的答案确定方法、装置和电子设备 | |
CN110633391B (zh) | 一种信息搜索方法及装置 | |
CN112749286A (zh) | 知识图谱的构建和使用方法、装置和介质 | |
CN111368161A (zh) | 一种搜索意图的识别方法、意图识别模型训练方法和装置 | |
CN111246255B (zh) | 视频推荐方法、装置、存储介质、终端及服务器 | |
CN112000840B (zh) | 一种业务对象的展示方法和装置 | |
CN111241844A (zh) | 一种信息推荐方法及装置 | |
CN112328809A (zh) | 实体分类方法、装置及计算机可读存储介质 | |
CN110147426B (zh) | 一种查询文本的分类标签确定方法及相关装置 | |
CN115190209A (zh) | 通话管理方法及装置 | |
CN112083811B (zh) | 一种候选项展示方法和装置 | |
CN112836026B (zh) | 基于对话的问诊方法及装置 | |
CN113870195A (zh) | 目标贴图检测模型的训练、贴图检测方法及装置 | |
US20160224640A1 (en) | Social-distance permission-based search algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |