CN112309580A - 疾病类型的确定方法、装置、电子设备及存储介质 - Google Patents
疾病类型的确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112309580A CN112309580A CN202011354426.9A CN202011354426A CN112309580A CN 112309580 A CN112309580 A CN 112309580A CN 202011354426 A CN202011354426 A CN 202011354426A CN 112309580 A CN112309580 A CN 112309580A
- Authority
- CN
- China
- Prior art keywords
- disease type
- target
- disease
- determined
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 599
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 599
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000007499 fusion processing Methods 0.000 claims abstract description 15
- 238000003745 diagnosis Methods 0.000 claims description 70
- 238000012549 training Methods 0.000 claims description 50
- 239000013598 vector Substances 0.000 claims description 26
- 208000024891 symptom Diseases 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 11
- 238000007689 inspection Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 18
- 230000015654 memory Effects 0.000 description 16
- 238000013473 artificial intelligence Methods 0.000 description 11
- 206010011224 Cough Diseases 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 206010037660 Pyrexia Diseases 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 206010008479 Chest Pain Diseases 0.000 description 2
- 208000000112 Myalgia Diseases 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 206010039101 Rhinorrhoea Diseases 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 206010061428 decreased appetite Diseases 0.000 description 2
- 208000010753 nasal discharge Diseases 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 206010063659 Aversion Diseases 0.000 description 1
- 206010013082 Discomfort Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010028372 Muscular weakness Diseases 0.000 description 1
- 206010068319 Oropharyngeal pain Diseases 0.000 description 1
- 201000007100 Pharyngitis Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 206010029410 night sweats Diseases 0.000 description 1
- 230000036565 night sweats Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000009666 routine test Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明实施例公开了一种疾病类型的确定方法、装置、电子设备及存储介质,该方法包括:获取目标病历模板中编辑的文本信息;通过对所述文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据所述目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型;所述疾病类型规则库中包括与各疾病类型,以及与各疾病类型所对应的判断条件;通过对所述至少一个待确定疾病类型进行融合处理,确定与所述文本信息相对应的目标疾病类型。通过本发明实施例的技术方案,实现了根据疾病类型规则库确定目标疾病类型,提高了目标疾病类型确定的准确性和可解释性。
Description
技术领域
本发明实施例涉及医疗技术领域,尤其涉及一种疾病类型的确定方法、装置、电子设备及存储介质。
背景技术
现阶段,在为各个医院分配资源时,存在资源分配不均的问题,多是医务人员的分配不均,因此,在资源比较少的医院中存在无法对有些疾病进行有效诊断的问题。为了解决上述问题引入辅助诊断技术来辅助相应的医师确定患者的疾病类型,从而为患者提供相应的治疗。
现有的辅助诊断技术是基于AI(Artificial Intelligence,人工智能)算法实现的,AI算法可以从大量病历数据中学习各个症状与疾病类型的潜在关系,对于疾病类型的覆盖率和泛化性往往可以达到较好的效果。
但是,推荐诊断结果易受病历中无关因素的影响。同时,AI算法的是用户无感知的,因此算法得到的结果无法得到相应的医学知识进行支撑,故无法对推荐出的结果进行有效解释,从而导致无法确定其推荐结果的准确性,进而不能对患者进行有效治疗的技术问题。
发明内容
本发明提供一种疾病类型的确定方法、装置、电子设备及存储介质,以实现根据疾病类型规则库确定目标疾病类型,提高了目标疾病类型确定的准确性和可解释性。
第一方面,本发明实施例提供了一种疾病类型的确定方法,包括:
获取目标病历模板中编辑的文本信息;
通过对所述文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据所述目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型;所述疾病类型规则库中包括与各疾病类型,以及与各疾病类型所对应的判断条件;
通过对所述至少一个待确定疾病类型进行融合处理,确定与所述文本信息相对应的目标疾病类型。
第二方面,本发明实施例还提供了一种疾病类型的确定装置,包括:
信息获取模块,用于获取目标病历模板中编辑的文本信息;
待确定疾病类型确定模块,用于通过对所述文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据所述目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型;所述疾病类型规则库中包括与各疾病类型,以及与各疾病类型所对应的判断条件;
目标疾病类型确定模块,用于通过对所述至少一个待确定疾病类型进行融合处理,确定与所述文本信息相对应的目标疾病类型。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例任一所述的疾病类型的确定方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一所述的疾病类型的确定方法。
本发明实施例的技术方案,通过获取目标病历模板中编辑的文本信息,生成目标疾病类型判断条件,并根据目标疾病类型判断条件从预先建立的疾病类型规则库确定出至少一个待确定疾病类型,通过对所述至少一个待确定疾病类型进行融合处理确定目标疾病类型,解决了基于AI算法推荐诊断结果时准确性和解释性差的技术问题,实现了在根据疾病类型规则库确定目标疾病类型,并有相应的诊断理由时,可以提高目标疾病类型确定的准确性和可解释性的技术效果。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一所提供的一种疾病类型的确定方法流程示意图;
图2为本发明实施例二所提供的一种疾病类型的确定方法流程示意图;
图3为本发明实施例三所提供的一种疾病类型的确定方法流程示意图;
图4为本发明实施例四所提供的一种疾病类型的确定装置的结构示意图;
图5为本发明实施例五所提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一所提供的一种疾病类型的确定方法流程示意图,本实施例可适用于根据病历模板结合规则和算法对疾病类型进行确定的情况,该方法可以由疾病类型的确定装置来执行,该装置可以通过软件和/或硬件的形式实现。
为了更清楚的介绍本实施例的技术方案,先简单介绍应用场景。目前,在医师为患者进行诊断时,医师会根据与患者的沟通内容,以及根据医学知识对患者的初步判断,可以在诊疗系统中完成病历单的撰写。诊疗系统是预先建立的用于记录和辅助医师进行诊疗的系统,其中,可以包括病历单的模板信息,以使医师能够快速完成病历单的撰写。根据医师撰写的病历单,诊疗系统中可以具有辅助模块,根据该模块可以对患者的患病情况进行初步分析,确定疾病类型并推送至医师,以供医师后续诊断和治疗参考。
如图1所述,本实施例的方法具体包括如下步骤:
S110、获取目标病历模板中编辑的文本信息。
其中,目标病历模板可以是医师根据预先制定的病历模板完成撰写的病历模板,也可以是根据目标病历单进行识别后的得到的病历模板,目标病历单是医师为患者诊疗时撰写的病历单,可以在病历模板可以中导入目标病历单中的各个信息,例如:病历模板中可以包括主诉,现病史等。文本信息指的是病历模板中的编辑的文本信息,即目标病历模板中与模板信息所对应的文本信息,例如:主诉:咳嗽、咽痛,则可以将咳嗽、咽痛作为文本信息。
具体的,从目标病历模板中可以获取与模板信息部分相对应的文本信息,该文本信息可以是后续进行疾病类型确定的基本信息。
可选的,可以根据如下方法来从目标病历单中的获取关键信息并对目标病历模板进行编辑。
步骤一、接收上传的目标病历单,并获取目标病历单中的待处理文本信息。
其中,待处理文本信息是目标病历单中的文本信息。在接收到上传的目标病历单后,对目标病历单中的各个信息进行识别,将识别到的各个信息作为待处理文本信息。
步骤二、提取待处理文本信息中的关键信息,并将关键信息对应编辑至目标病历模板中,以从目标病历模板中获取与关键信息对应的文本信息。
其中,关键信息是用于诊断治疗的信息,关键信息可以是主诉内容,现病史内容,体征信息内容等。
具体的,从待处理文本中识别并提取关键信息,识别并提取关键信息的方法可以是:通过设定关键词匹配识别并提取待处理文本中的关键信息;或者,通过设定正则表达式识别并提取待处理文本中的关键信息。在获取关键信息之后,将关键信息编辑至目标病历模板中与关键信息相对应的位置,以实现对目标病历模板的编辑。在目标病历模板完成后,可以从该目标病历模板中提取编辑的与关键信息对应的文本信息。
S120、通过对文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型。
其中,目标疾病类型判断条件是根据目标病历模板中的文本信息进行关键词提取后,并将提取出的关键词分别进行组合,以得到的用于判断疾病类型的条件。
示例性的,目标病历模板中的文本信息包括:主诉:咳嗽、咽痛3天,加重伴发热1天;现病史:患者约4天前受凉后出现咳嗽、咽痛,伴流涕,为清涕,无咳痰、胸痛,感全身不适、四肢乏力及食欲不振,在当地诊所就诊诊断为“上感”,经治疗无明显好转,1天前,上述症状较前加重,同时伴发热,体温达39.5℃,感畏寒、肌肉痛。根据上述文本信息,可以进一步确定用于判断疾病类型的条件为:条件1:主诉.症状包含[咳嗽咽痛发热];条件2:主诉.症状.咳嗽.病程3天且主诉.症状.咳嗽.发展趋势加重;条件3:主诉.症状.咽痛.病程3天且主诉.症状.咽痛.发展趋势加重;条件4:现病史.症状包含[咳嗽咽痛流涕全身不适四肢乏力食欲不振];条件5:生命体征.体温39.5℃;条件6:现病史.体征包含[畏寒肌肉痛];条件7:现病史.症状.咳痰;条件8:现病史.症状.胸痛等。
具体的,对从目标病历模板中获取的文本信息进行关键词提取,并将获取到的所有关键词进行组合,进而能够根据各个关键词组合生成相对应的目标疾病类型判断条件。从疾病类型规则库中确定与目标疾病类型判断条件相对应的至少一个待确定疾病类型。确定至少一个待确定疾病类型可以是若疾病类型规则库中判断条件包含目标疾病类型判断条件,则将数据库中该判断条件所对应的疾病类型确定为至少一个待确定疾病类型。例如:目标疾病类型判断条件为A和B,疾病类型规则库中的判断条件有疾病类型1-判断条件A和B,疾病类型2-判断条件A,B和C,疾病类型3-判断条件A和C,疾病类型4-判断条件A,可以将疾病类型1和2作为至少一个待确定疾病类型。
由于根据关键词组合生成的相对应的目标疾病类型判断条件为至少一个,并且根据每一个目标疾病类型判断条件在疾病类型规则库中确定的疾病类型也可能是多个,因此,可以从疾病类型规则库中确定至少一个待确定疾病类型。为了节省在疾病类型规则库中确定至少一个待确定疾病类型的时间,该确定过程可以是根据多个目标疾病类型判断条件并行确定的。
可选的,为了能够在疾病类型规则库中确定至少一个待确定疾病类型,可以预先建立疾病类型规则库中的疾病类型和与疾病类型相对应的判断条件。
针对各疾病类型,确定与当前疾病类型相对应的关联信息,基于关联信息生成至少一个判断条件,将至少一个判断条件与当前疾病类型对应存储。
其中,关联信息可以是用于确诊疾病时的信息,根据关联信息可以进行关键词提取以生成至少一个判断条件。
具体的,针对各疾病类型,可以根据大量书本中记载的先验知识以及大量已确认疾病类型的病历单来确定与各疾病类型相对应的关联信息。将关联信息进行关键词提取并进行组合后生成至少一个判断条件,并将生成的至少一个判断条件与该判断条件所对应的疾病类型对应存储。
S130、通过至少一个待确定疾病类型进行融合处理,确定与文本信息相对应的目标疾病类型。
其中,融合处理可以是对至少一个待确定疾病类型进行统计,过滤等处理,目标疾病类型是基于疾病类型规则库进行分析后确定的患者可能患病的疾病类型。
具体的,可以将至少一个待确定疾病类型进行统计处理,将频次最高的一个待确定疾病类型作为目标疾病类型。也可以是根据预先设置的优先级,确定优先级最高的待确定疾病类型为目标疾病类型,并可以将各目标疾病类型以及相对应的判断条件共同显示在医师的辅助诊疗系统中,以供医师参考。
本实施例的技术方案,通过获取目标病历模板中编辑的文本信息,生成目标疾病类型判断条件,并根据目标疾病类型判断条件从预先建立的疾病类型规则库确定出至少一个待确定疾病类型,通过对所述至少一个待确定疾病类型进行融合处理确定目标疾病类型,解决了基于AI算法推荐诊断结果时准确性和解释性差的技术问题,实现了在根据疾病类型规则库确定目标疾病类型,并有相应的诊断理由时,可以提高目标疾病类型确定的准确性和可解释性的技术效果。
实施例二
图2为本发明实施例二所提供的一种疾病类型的确定方法流程示意图。在上述实施例的基础上,为了进一步准确的确定与文本信息相对应的待确定疾病类型,可以在前述实施例的基础上,结合预先训练的模型输出的疾病类型判断结果,综合确定与文本信息相对应的目标疾病类型。其中,S220和S230为基于目标疾病类型判断条件从疾病类型规则库中确定出待确定疾病类型,上述实施例已做具体介绍,在此不再具体限定。本实施例主要是介绍基于预先训练的模型,来确定待确定疾病类型,其具体的实施方式可以参见S240至S260。其中与上述各实施例相同或相应的术语的解释在此不再赘述。
参见图2,本实施例提供的疾病类型的确定方法包括:
S210、获取目标病历模板中编辑的文本信息。
S220、根据各文本信息在目标模板信息中所对应的属性类别,生成与文本信息相对应的目标疾病类型判断条件。
其中,属性类别包括主诉、现病史以及与文本信息对应的冲突信息。主诉是患者自述的症状、体征、性质,以及持续时间等内容。现病史是医师记录的患者病后的全过程,即发生、发展、演变等经过。与文本信息对应的冲突信息可以是与用户基本信息,例如年龄,性别等相冲突的信息,例如男性不会患有妇科疾病等。
具体的,根据目标病历模板中的文本信息针对主诉、现病史以及与文本信息对应的冲突信息三个属性类别分别进行关键词提取,并将提取出的关键词进行组合生成与文本信息相对应的目标疾病类型判断条件。这样做的好处在于可以提取出病历模板中较为重要的信息,以供后续确定目标疾病类型使用。
S230、根据目标疾病类型判断条件,从疾病类型规则库中存储的与各疾病类型所对应的判断条件进行匹配处理,得到与目标疾病类型判断条件相匹配的各待确定疾病类型。
具体的,在疾病类型规则库中,将目标疾病类型判断条件与各疾病类型所对应的判断条件分别进行逐一匹配和/或批量匹配,确定与目标疾病类型判断条件相匹配的疾病类型规则库中的判断条件,进一步确定与目标疾病类型判断条件相匹配疾病类型,作为待确定疾病类型。
S240、基于分词工具将各文本信息划分为至少一个待处理关键词汇,并剔除至少一个待处理关键词汇中的停用词,得到至少一个待输入关键词汇。
其中,分词工具可以是分词词典或结巴工具等。待处理关键词汇是根据分词工具处理后得到的词汇,停用词是语气助词等没有实际含义的无效词汇,例如:的,了等。待输入关键词汇是待处理关键词汇中剔除停用词后的词汇。计算机的所有语言知识都来自机器词典、句法规则以及有关词和句子的语义、语境、语用知识库。根据现有的分词工具,可以将文本信息中包含的各个文本切分成词汇序列,词汇序列可以以词语为单位的词汇集合。
需要说明的是,可以基于分词词典将文本信息划分为至少一个待处理关键词汇,或者是基于结巴工具将目标语句划分为至少一个待处理关键词汇。可以将待处理词汇中的停用词剔除后得到的待处理关键词汇作为待输入关键词汇。也就是说,在将文本信息进行分词处理后,去除所有待处理关键词汇中的停用词,将此类得到的词汇作为与各文本信息对应的待输入关键词汇。
S250、基于词向量字典确定与至少一个待输入关键词汇所对应的词向量。
其中,词向量字典中的词汇以及各词汇所对应的词向量都与具体应用场景相关,在本实施例中,词向量字典应当是与医疗相关的词向量字典
具体的,在确定各文本信息对应的待输入关键词汇后,可以根据预先确定的词向量字典,确定各个待输入关键词汇对应的词向量。
S260、将各待输入关键词汇所对应的词向量输入至预先训练得到的疾病类型确定模型中,基于疾病类型确定模型的输出结果确定与文本信息相对应的待确定疾病类型。
其中,疾病类型确定模型为预先训练的,用于对输入的词向量进行处理,得到与词向量相对应的疾病类型判断结果。
具体的,将各待输入关键词汇所对应的词向量作为疾病类型确定模型的输入信息输入至该模型中,该模型经过运算后可以输出结果。根据输出结果与疾病类型的对应关系,确定与文本信息相对应的待确定疾病类型。
需要说明的是,疾病类型确定模型可以是深度学习模型/机器学习模型,例如:LSTM(Long Short-Term Memory,长短期记忆网络),CNN(ConvolutionalNeural Networks,卷积神经网络),SVM(Support Vector Machine,支持向量机)等,具体的模型选择可以根据实际需求进行选择。
为了获得更准确的疾病类型确定模型,在使用该模型前,可以对疾病类型确定模型进行构建和训练。在本实施例中,以LSTM模型为例,具体的模型构建和训练步骤如下。
初始待训练疾病类型确定模型具体的构建过程可以是:将各个文本信息所对应的词向量作为长短时记忆网络层的输入;将长短时记忆网络层的输出作为全连接的输入,输入至全连接层;将全连接层的输出结果作为激活函数层的输入,输入至激活函数层中,将激活函数层的输出结果作为与文本信息相对应的疾病类型。
在构建完成之后,可以获取训练样本数据对疾病类型确定模型进行训练。具体的训练步骤如下:
步骤一、获取多个训练样本数据。
为了提高模型的准确性以及通用性,可以尽可能多的获取训练样本数据。每个训练样本数据中包括的数据类型相同,区别在于具体内容存在一定的差异。训练样本数据中包括文本信息,以及预先确定的与文本信息相对应的疾病类型标识。
其中,与文本信息相对应的疾病类型标识是与疾病类型相对应的设定输出结果,设定输出结果可以是与不同疾病类型相对应的标签,例如:糖尿病所对应的输出结果为2等。
具体的,可以从现有的已确定疾病类型的病历单中,提取文本信息以及疾病类型作为样本数据。也可以根据医学先验知识以及书本知识等,提取上述知识中的文本信息以及疾病类型作为样本数据。
步骤二、将训练样本数据输入至初始待训练疾病类型确定模型中,得到与训练样本数据相对应的初始输出结果。
其中,初始待训练模型是建立后的模型参数值为默认值的模型。
具体的,将训练样本数据输入至初始待训练疾病类型确定模型中,经过该模型可以得到与各个训练样本数据相对应的输出结果,可以将该输出结果作为初始输出结果。
步骤三、基于初始输出结果以及与训练样本数据相对应的设定输出结果,对初始待训练疾病类型确定模型中的损失函数进行修正,将损失函数达到收敛作为训练目标,训练得到待使用疾病类型确定模型中。
需要说明的是,在训练初始待训练疾病类型确定模型之前可以将初始待训练疾病类型确定模型中的模型参数设置为默认值,以在基于训练样本数据训练时,修正初始待训练疾病类型确定模型中的模型参数。
具体的,基于初始输出结果以及与训练样本数据相对应的设定输出结果,可以计算出初始输出结果以及与设定输出结果之间的损失值,基于损失值调整待使用疾病类型确定模型中的模型参数。
需要说明的是,LSTM模型的输出结果是各个疾病类型所对应的概率值,即各个疾病类型所对应的输出结果的概率值,在这种情况下,可以将概率值最高的疾病类型所对应的输出结果作为最终的输出结果。
基于损失值调整待使用疾病类型确定模型中的模型参数的方法可以是:将损失函数的训练误差,即损失参数作为检测损失函数当前是否达到收敛的条件,比如训练误差是否小于预设误差或误差变化趋势是否趋于稳定,或者当前的迭代次数是否等于预设次数。若检测达到收敛条件,比如损失函数的训练误差达到小于预设误差或误差变化趋于稳定,表明初始待训练疾病类型确定模型训练完成,此时可以停止迭代训练。若检测到当前未达到收敛条件,可以进一步获取样本数据对初始待训练疾病类型确定模型进行训练,直至损失函数的训练误差在预设范围之内。当损失函数的训练误差达到收敛时,可以将初始待训练疾病类型确定模型作为待使用疾病类型确定模型。
步骤四、获取校验数据,并将校验数据输入至待使用疾病类型确定模型中进行校验,当校验结果满足预设条件时,将待使用疾病类型确定模型作为疾病类型确定模型。
其中,校验数据是与样本数据结构一致的数据,即校验数据中也包括文本信息,以及预先确定的与文本信息相对应的疾病类型标识。预设条件是预先设定的用于判断待使用疾病类型确定模型是否可用的条件,预设条件可以是校验数据所对应的准确率是否达到预设准确率阈值。
具体的,获取预设数量的校验数据,将校验数据输入至待使用疾病类型确定模型中,基于待使用疾病类型确定模型的输出结果确定待使用疾病类型确定模型的准确率,当准确率达到预设准确率阈值,则将待使用疾病类型确定模型作为疾病类型确定模型;若准确率未达到所述准确率阈值,则获取训练样本数据对待使用疾病类型确定模型继续训练直至待使用疾病类型确定模型的准确率达到预设准确率阈值。
在本实施例中,基于上述训练得到的模型,可以将模型的输出结果确定为与文本信息相对应的待确定疾病类型。
S270、通过至少一个待确定疾病类型进行融合处理,确定与文本信息相对应的目标疾病类型。
其中,至少一个待确定疾病类型包括基于疾病类型确定模型确定的待确定疾病类型,以及基于病类型规则库确定的待确定疾病类型。
具体的,可以将根据疾病类型确定模型确定待确定疾病类型的与根据疾病类型规则库确定的待确定疾病类型进行融合处理。融合处理可以是对上述两种方法确定的待确定疾病类型进行优先级划分,以得到目标疾病类型,也可以是将至少一个待确定疾病类型与相对应的判断原因进行融合,以得到目标疾病类型。
本实施例的技术方案,在根据疾病类型规则库确定至少一个待确定疾病类型的基础上,结合基于预先训练的模型输出的疾病类型,确定目标疾病类型,解决了仅基于AI算法模型推荐诊断结果时准确性和可解释性差的技术问题,实现了将根据疾病类型规则库确定的疾病类型与基于预先训练的模型确定的疾病类型融合,以获得目标疾病类型,达到了提高目标疾病类型确定的准确性和可解释性的技术效果。
实施例三
图3为本发明实施例三所提供的一种疾病类型的确定方法流程示意图。在上述各实施例的基础上,对根据疾病类型规则库确定至少一个待确定疾病类型进行优化。其中与上述各实施例相同或相应的术语的解释在此不再赘述。
参见图3,本实施例提供的疾病类型的确定方法包括:
S310、获取病历信息。
其中,病历信息是目标病历单中的信息。
S320、病历结构化。
具体的,在目标病历模板中编辑病历信息,并将目标病历模板中编辑的病历信息作为文本信息。
S330、诊疗因子提取。
其中,诊疗因子是所有文本信息相对应的目标疾病类型判断条件。
具体的,通过对文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件。
S340、根据疾病类型规则库确定诊疗因子对应的拦截诊断、初步诊断以及确诊诊断。
其中,拦截诊断是待排除疾病类型,是根据与文本信息冲突的信息,即与用户基础信息不匹配的信息确定的疾病类型;初步诊断是初步待确定疾病类型,是根据用户症状,体征信息和基础信息确定的疾病类型;确诊诊断是确诊待确定疾病类型,是初步诊断的基础上结合检查和/或检验报告信息确定的疾病类型。
具体的,确定拦截诊断、初步诊断以及确诊诊断,进而确定待确定疾病类型的步骤可以是如下方式:
步骤一、基于预先设置的划分规则,将目标疾病类型判断条件划分为至少三类。
其中,划分规则包括基于症状、体征信息和用户基础信息确定出的疾病判断条件作为第一类疾病类型判断条件;第二类疾病类型判断条件中包括第一类疾病类型判断条件,以及与检查和/或检验报告信息对应疾病类型判断条件;第三类疾病类型判断条件包括基于与文本信息对应的冲突信息确定的排除疾病类型的疾病判断条件,冲突信息包括与用户基础信息不匹配的信息。
症状是机体因发生疾病而表现出来的异常感觉和状态,如咳嗽、盗汗。体征信息是用来判断病人的病情轻重和危急程度的指征,如心率、脉搏、血压、血氧等。用户基础信息是用户的年龄,性别等信息。检查报告信息是检查身体器官部位的报告,如超声等。检验报告信息是对人体成分化验的报告,如血常规报告信息等。冲突信息是与用户基础信息不匹配的信息,例如女性和男性为互相冲突的信息等。
示例性的,第一类疾病类型判断条件可以是咳嗽,咽痛。第二类疾病类型判断条件可以是咳嗽,咽痛,血常规检验报告中白细胞升高,中性粒细胞百分比升高。若用户为女性,儿童,第三类疾病类型判断条件是男性,成人。
步骤二、根据第一类目标疾病类型判断条件,从疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到初步待确定疾病类型。
具体的,根据第一类目标疾病类型判断条件,从疾病类型规则库中确定与第一类目标疾病类型判断条件相匹配的疾病类型,作为初步待确定疾病类型。
确定初步待确定疾病类型可以是若疾病类型规则库中判断条件包含第一类目标疾病类型判断条件,则将数据库中该判断条件所对应的疾病类型确定为初步待确定疾病类型。需要说明的是初步待确定疾病类型可以是一个或多个。
步骤三、根据第二类目标疾病类型判断条件,从所述疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到确诊待确定疾病类型。
具体的,根据第二类目标疾病类型判断条件,从疾病类型规则库中确定与第二类目标疾病类型判断条件相匹配的疾病类型,作为确诊待确定疾病类型。
确定确诊待确定疾病类型可以是若疾病类型规则库中判断条件包含第二类目标疾病类型判断条件,则将数据库中该判断条件所对应的疾病类型确定为确诊待确定疾病类型。需要说明的是确诊待确定疾病类型可以是一个或多个。
步骤四、根据第三类目标疾病类型判断条件,从所述疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到待排除疾病类型。
具体的,根据第三类目标疾病类型判断条件,从疾病类型规则库中确定与第三类目标疾病类型判断条件相匹配的疾病类型,作为待排除疾病类型。
确定待排除疾病类型可以是若疾病类型规则库中判断条件包含第三类目标疾病类型判断条件,则将数据库中该判断条件所对应的疾病类型确定为待排除疾病类型。需要说明的是待排除疾病类型可以是一个或多个。
步骤五、将初步待确定疾病类型、确诊待确定疾病类型以及待排除疾病类型,作为与目标疾病类型判断条件相匹配的各待确定疾病类型。
可以将上述规则条件所确定出的待确定疾病类型,均作为与目标用户相对应的待确定疾病类型。同时,可以将各待确定疾病类型作为目标疾病类型展示在终端设备的显示界面上。
需要说明的是,由于确诊待确定疾病类型是基于用户基本信息和检查和/或检验报告信息确定出来的,因此得到的结果可能与目标用户的实际疾病类型契合度最高,因此可以将确诊待确定疾病类型显示在终端显示界面的第一个位置处,以达到重要性突出的效果。
S350、将病历信息输入至疾病类型确定模型。
具体的,将病历信息进行分词处理并获取相对应的词向量后,将词向量作为模型输入,输入至经过预先训练的疾病类型确定模型中,得到算法模型的输出结果。其中,疾病类型确定模型是根据需求训练得到的人工智能算法模型。
S360、将算法模型输出结果作为疑似诊断。
具体的,将病历信息经过疾病类型确定模型运算后的输出结果作为疑似诊断,即待确定疾病类型。
S370、诊断结果融合。
具体的,将根据疾病类型规则库确定的拦截诊断、初步诊断和确诊诊断,以及根据疾病类型确定模型确定的疑似诊断进行诊断结果融合,以得到目标疾病类型。
可选的,可以是先将拦截诊断、初步诊断以及确诊诊断进行融合,融合方法可以是如下方法。
由于初步诊断是根据用户基本信息确定的疾病类型,而确诊诊断是在用户基本信息的基础上结合检查和/或检验报告信息确定的疾病类型,因此,确诊诊断可能与目标用户的实际疾病类型契合度最高,因此,可以将确诊诊断先于初步诊断显示在终端上。并且,拦截诊断表示的是目标用户不会患有的疾病类型,因此可以将确诊诊断以及初步诊断中与拦截诊断相同的疾病类型剔除,以最终确定至少一个待确定疾病类型。
将基于疾病类型确定模型确定出的待确定疾病类型与根据疾病类型规则库确定出的待确定疾病类型进行融合以得到目标疾病类型,采取的方法可以是:
获取与各类目标疾病类型判断条件所对应的优先级等级。
将基于疾病类型确定模型确定出的待确定疾病类型与根据疾病类型规则库确定出的待确定疾病类型进行优先级划分,例如:根据疾病类型规则库确定出的待确定疾病类型为第一优先级,基于疾病类型确定模型确定出的待确定疾病类型为第二优先级。
需要说明的是,具体的优先级排布可以按实际需求进行设定,例如:由于初步诊断是根据用户基本信息确定的疾病类型,而确诊诊断是在用户基本信息的基础上结合检查和/或检验报告信息确定的疾病类型,因此,确诊诊断可能与目标用户的实际疾病类型契合度最高,故,确诊诊断的优先级可以高于初步诊断的优先级。
进一步,将优先级等级最高的一类目标疾病类型判断条件所对应的待确定疾病类型,作为目标疾病类型。
为了将目标疾病类型展示给医师以为医师诊断提供帮助,可以将至少一个目标疾病判断条件和目标疾病类型显示在目标终端上。
可选的,可以是确定得到目标疾病类型的至少一个目标疾病判断条件,并基于至少一个目标疾病判断条件和目标疾病类型,生成展示在目标终端上的分析报告。
具体的,在确定目标疾病类型后,将目标疾病类型以及与目标疾病类型相对应的目标疾病判断条件发送至目标终端,并在终端界面上可视化显示目标疾病类型以及与目标疾病类型相对应的目标疾病判断条件。为了使医师能够了解目标疾病类型的判断过程,可以将根据疾病类型规则库确定诊疗因子对应的拦截诊断、初步诊断以及确诊诊断,以及,根据人工智能算法模型确定的疑似诊断形成分析报告,作为附件添加至可视化界面中,以供医师参考使用。
本实施例的技术方案,通过在根据预先建立的疾病类型规则库确定出至少一个待确定疾病类型中,分别确定拦截诊断、初步诊断以及确诊诊断,并通过融合处理确定目标疾病类型,解决了基于AI算法推荐诊断结果时准确性和解释性差的技术问题,实现了在根据疾病类型规则库确定目标疾病类型,并有相应的诊断理由时,可以提高目标疾病类型确定的准确性和可解释性的技术效果。
实施例四
图4为本发明实施例四所提供的一种疾病类型的确定装置的结构示意图,该装置包括:信息获取模块410,待确定疾病类型确定模块420和目标疾病类型确定模块430。
其中,信息获取模块410,用于获取目标病历模板中编辑的文本信息;待确定疾病类型确定模块420,用于通过对文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型;疾病类型规则库中包括与各疾病类型,以及与各疾病类型所对应的判断条件;目标疾病类型确定模块430,用于通过对至少一个待确定疾病类型进行融合处理,确定与文本信息相对应的目标疾病类型。
可选的,所述装置还包括:
待处理文本信息获取模块,用于接收上传的目标病历单,并获取目标病历单中的待处理文本信息;
目标病历模板编辑模块,用于提取待处理文本信息中的关键信息,并将关键信息对应编辑至目标病历模板中,以从目标病历模板中获取与关键信息对应的文本信息。
可选的,所述装置还包括:
待输入关键词汇确定模块,用于基于分词工具将各文本信息划分为至少一个待处理关键词汇,并剔除至少一个待处理关键词汇中的停用词,得到至少一个待输入关键词汇;
词向量确定模块,用于基于词向量字典确定与至少一个待输入关键词汇所对应的词向量;
待确定疾病类型确定模块,用于将各待输入关键词汇所对应的词向量输入至预先训练得到的疾病类型确定模型中,基于疾病类型确定模型的输出结果确定与文本信息相对应的待确定疾病类型;
其中,疾病类型确定模型为预先训练的,用于对输入的词向量进行处理,得到与词向量相对应的疾病类型判断结果。
可选的,所述装置还包括:模型训练模块,用于训练得到所述疾病类型确定模型;
模型训练模块,包括:
数据获取单元,用于获取多个训练样本数据;多个训练样本数据包括与每种疾病类型相对应的文本信息以及与所述疾病类型相对应的设定输出结果;
初始结果输出单元,用于将训练样本数据输入至初始待训练疾病类型确定模型中,得到与训练样本数据相对应的初始输出结果;初始待训练疾病类型确定模型包括:长短时记忆网络层、全连接层以及激活函数层;
第一模型确定单元,用于基于初始输出结果以及与训练样本数据相对应的设定输出结果,对初始待训练疾病类型确定模型中的损失函数进行修正,将损失函数达到收敛作为训练目标,训练得到待使用疾病类型确定模型中;
第二模型确定单元,用于获取校验数据,并将校验数据输入至待使用疾病类型确定模型中进行校验,当校验结果满足预设条件时,将待使用疾病类型确定模型作为疾病类型确定模型。
可选的,待确定疾病类型确定模块420,包括:
判断条件生成单元,用于根据各文本信息在目标模板信息中所对应的属性类别,生成与文本信息相对应的目标疾病类型判断条件;属性类别包括主诉、现病史以及过敏史;
待确定疾病类型确定单元,用于根据目标疾病类型判断条件,从疾病类型规则库中存储的与各疾病类型所对应的判断条件进行匹配处理,得到与目标疾病类型判断条件相匹配的各待确定疾病类型。
可选的,待确定疾病类型确定单元,包括:
判断条件划分子单元,用于基于预先设置的划分规则,将目标疾病类型判断条件划分为至少三类;划分规则包括基于症状、体征信息和用户基础信息确定出的疾病判断条件作为第一类疾病类型判断条件;第二类疾病类型判断条件中包括第一类疾病类型判断条件,以及与检查和/或检验报告信息对应疾病类型判断条件;第三类疾病类型判断条件包括基于与所述文本信息对应的冲突信息确定的排除疾病类型的疾病判断条件;冲突信息包括与用户基础信息不匹配的信息;基于每一类目标疾病类型判断条件得到与所述目标疾病类型判断条件相匹配的各待确定疾病类型。
可选的,待确定疾病类型确定单元,还包括:
初步待确定疾病类型确定子单元,用于根据第一类目标疾病类型判断条件,从疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到初步待确定疾病类型;
确诊待确定疾病类型确定子单元,用于根据第二类目标疾病类型判断条件,从疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到确诊待确定疾病类型;
待排除疾病类型确定子单元,用于根据第三类目标疾病类型判断条件,从疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到待排除疾病类型;
待确定疾病类型确定子单元,用于将初步待确定疾病类型、确诊待确定疾病类型以及待排除疾病类型,作为与目标疾病类型判断条件相匹配的各待确定疾病类型。
可选的,待确定疾病类型还包括基于疾病类型确定模型确定出的待确定疾病类型,目标疾病类型确定模块430,包括:
优先级等级获取单元,用于获取与各类目标疾病类型判断条件所对应的优先级等级;
目标疾病类型确定单元,用于将优先级等级最高的一类目标疾病类型判断条件所对应的待确定疾病类型,作为目标疾病类型。
可选的,所述装置还包括:规则库建立模块,用于建立疾病类型规则库中的疾病类型和与疾病类型相对应的判断条件;
规则库建立模块,包括:
存储单元,针对各疾病类型,确定与当前疾病类型相对应的关联信息,基于所述关联信息生成至少一个判断条件,将所述至少一个判断条件与所述当前疾病类型对应存储。
可选的,所述装置还包括:
分析展示模块,用于确定得到目标疾病类型的至少一个目标疾病判断条件,并基于至少一个目标疾病判断条件和目标疾病类型,生成展示在目标终端上的分析报告。
本实施例的技术方案,通过获取目标病历模板中编辑的文本信息,生成目标疾病类型判断条件,并根据目标疾病类型判断条件从预先建立的疾病类型规则库确定出至少一个待确定疾病类型,通过对所述至少一个待确定疾病类型进行融合处理确定目标疾病类型,解决了基于AI算法推荐诊断结果时准确性和解释性差的技术问题,实现了在根据疾病类型规则库确定目标疾病类型,并有相应的诊断理由时,可以提高目标疾病类型确定的准确性和可解释性的技术效果。
本发明实施例所提供的疾病类型的确定装置可执行本发明任意实施例所提供的疾病类型的确定方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
实施例五
图5为本发明实施例五所提供的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施例实施方式的示例性电子设备50的框图。图5显示的电子设备50仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备50以通用计算设备的形式表现。电子设备50的组件可以包括但不限于:一个或者多个处理器或者处理单元501,系统存储器502,连接不同系统组件(包括系统存储器502和处理单元501)的总线503。
总线503表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备50典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备50访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器502可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)504和/或高速缓存存储器505。电子设备50可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统506可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线503相连。存储器502可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块507的程序/实用工具508,可以存储在例如存储器502中,这样的程序模块507包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块507通常执行本发明所描述的实施例中的功能和/或方法。
电子设备50也可以与一个或多个外部设备509(例如键盘、指向设备、显示器510等)通信,还可与一个或者多个使得用户能与该电子设备50交互的设备通信,和/或与使得该电子设备50能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口511进行。并且,电子设备50还可以通过网络适配器512与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器512通过总线503与电子设备50的其它模块通信。应当明白,尽管图5中未示出,可以结合电子设备50使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元501通过运行存储在系统存储器502中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的疾病类型的确定方法。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行疾病类型的确定方法。
该方法包括:
获取目标病历模板中编辑的文本信息;
通过对文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型;疾病类型规则库中包括与各疾病类型,以及与各疾病类型所对应的判断条件;
通过对至少一个待确定疾病类型进行融合处理,确定与文本信息相对应的目标疾病类型。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (13)
1.一种疾病类型的确定方法,其特征在于,包括:
获取目标病历模板中编辑的文本信息;
通过对所述文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据所述目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型;所述疾病类型规则库中包括与各疾病类型,以及与各疾病类型所对应的判断条件;
通过对所述至少一个待确定疾病类型进行融合处理,确定与所述文本信息相对应的目标疾病类型。
2.根据权利要求1所述的方法,其特征在于,在所述获取目标病历模板中编辑的文本信息之前,还包括:
接收上传的目标病历单,并获取所述目标病历单中的待处理文本信息;
提取所述待处理文本信息中的关键信息,并将所述关键信息对应编辑至所述目标病历模板中,以从所述目标病历模板中获取与所述关键信息对应的文本信息。
3.根据权利要求1所述的方法,其特征在于,还包括:
基于分词工具将各所述文本信息划分为至少一个待处理关键词汇,并剔除所述至少一个待处理关键词汇中的停用词,得到至少一个待输入关键词汇;
基于词向量字典确定与所述至少一个待输入关键词汇所对应的词向量;
将各待输入关键词汇所对应的词向量输入至预先训练得到的疾病类型确定模型中,基于所述疾病类型确定模型的输出结果确定与所述文本信息相对应的待确定疾病类型;
其中,所述疾病类型确定模型为预先训练的,用于对输入的词向量进行处理,得到与词向量相对应的疾病类型判断结果。
4.根据权利要求3所述的方法,其特征在于,还包括:训练得到所述疾病类型确定模型;
所述训练得到所述疾病类型确定模型,包括:
获取多个训练样本数据;所述多个训练样本数据包括与每种疾病类型相对应的文本信息以及与所述疾病类型相对应的设定输出结果;
将所述训练样本数据输入至初始待训练疾病类型确定模型中,得到与所述训练样本数据相对应的初始输出结果;所述初始待训练疾病类型确定模型包括:长短时记忆网络层、全连接层以及激活函数层;
基于所述初始输出结果以及与所述训练样本数据相对应的设定输出结果,对所述初始待训练疾病类型确定模型中的损失函数进行修正,将所述损失函数达到收敛作为训练目标,训练得到待使用疾病类型确定模型中;
获取校验数据,并将校验数据输入至所述待使用疾病类型确定模型中进行校验,当校验结果满足预设条件时,将所述待使用疾病类型确定模型作为所述疾病类型确定模型。
5.根据权利要求1所述的方法,其特征在于,所述通过对所述文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据所述目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型,包括:
根据各文本信息在所述目标模板信息中所对应的属性类别,生成与所述文本信息相对应的目标疾病类型判断条件;所述属性类别包括主诉、现病史以及与所述文本信息对应的冲突信息;
根据目标疾病类型判断条件,从疾病类型规则库中存储的与各疾病类型所对应的判断条件进行匹配处理,得到与所述目标疾病类型判断条件相匹配的各待确定疾病类型。
6.根据权利要求5所述的方法,其特征在于,所述根据目标疾病类型判断条件,从疾病类型规则库中存储的与各疾病类型所对应的判断条件进行匹配处理,得到与所述目标疾病类型判断条件相匹配的各待确定疾病类型,包括:
基于预先设置的划分规则,将所述目标疾病类型判断条件划分为至少三类;所述划分规则包括基于症状、体征信息和用户基础信息确定出的疾病判断条件作为第一类疾病类型判断条件;第二类疾病类型判断条件中包括第一类疾病类型判断条件,以及与检查和/或检验报告信息对应疾病类型判断条件;第三类疾病类型判断条件包括基于与所述文本信息对应的冲突信息确定的排除疾病类型的疾病判断条件;所述冲突信息包括与所述用户基础信息不匹配的信息;
基于每一类目标疾病类型判断条件得到与所述目标疾病类型判断条件相匹配的各待确定疾病类型。
7.根据权利要求6所述的方法,其特征在于,所述基于每一类目标疾病类型判断条件得到与所述目标疾病类型判断条件相匹配的各待确定疾病类型,包括:
根据第一类目标疾病类型判断条件,从所述疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到初步待确定疾病类型;
根据第二类目标疾病类型判断条件,从所述疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到确诊待确定疾病类型;
根据第三类目标疾病类型判断条件,从所述疾病类型规则库中存储的各疾病类型所对应的判断条件进行匹配处理,得到待排除疾病类型;
将所述初步待确定疾病类型、所述确诊待确定疾病类型以及所述待排除疾病类型,作为与所述目标疾病类型判断条件相匹配的各待确定疾病类型。
8.根据权利要求7所述的方法,其特征在于,所述待确定疾病类型还包括基于疾病类型确定模型确定出的待确定疾病类型,所述通过对所述至少一个待确定疾病类型进行融合处理,确定与所述文本信息相对应的目标疾病类型,包括:
获取与各类目标疾病类型判断条件所对应的优先级等级;
将优先级等级最高的一类目标疾病类型判断条件所对应的待确定疾病类型,作为所述目标疾病类型。
9.根据权利要求1所述的方法,其特征在于,还包括:建立疾病类型规则库中的疾病类型和与疾病类型相对应的判断条件;
所述建立疾病类型规则库中的疾病类型和与疾病类型相对应的判断条件,包括:
针对各疾病类型,确定与当前疾病类型相对应的关联信息,基于所述关联信息生成至少一个判断条件,将所述至少一个判断条件与所述当前疾病类型对应存储。
10.根据权利要求1所述的方法,其特征在于,还包括:
确定得到所述目标疾病类型的至少一个目标疾病判断条件,并基于所述至少一个目标疾病判断条件和所述目标疾病类型,生成展示在目标终端上的分析报告。
11.一种疾病类型的确定装置,其特征在于,包括:
信息获取模块,用于获取目标病历模板中编辑的文本信息;
待确定疾病类型确定模块,用于通过对所述文本信息进行处理,生成与所有文本信息相对应的目标疾病类型判断条件,并根据所述目标疾病类型判断条件从预先建立的疾病类型规则库中确定出至少一个待确定疾病类型;所述疾病类型规则库中包括与各疾病类型,以及与各疾病类型所对应的判断条件;
目标疾病类型确定模块,用于通过对所述至少一个待确定疾病类型进行融合处理,确定与所述文本信息相对应的目标疾病类型。
12.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的疾病类型的确定方法。
13.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-10中任一所述的疾病类型的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011354426.9A CN112309580A (zh) | 2020-11-26 | 2020-11-26 | 疾病类型的确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011354426.9A CN112309580A (zh) | 2020-11-26 | 2020-11-26 | 疾病类型的确定方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112309580A true CN112309580A (zh) | 2021-02-02 |
Family
ID=74487822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011354426.9A Pending CN112309580A (zh) | 2020-11-26 | 2020-11-26 | 疾病类型的确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112309580A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112860842A (zh) * | 2021-03-05 | 2021-05-28 | 联仁健康医疗大数据科技股份有限公司 | 病历标注方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573350A (zh) * | 2014-12-26 | 2015-04-29 | 深圳市前海安测信息技术有限公司 | 基于网络医院的全科医生辅助诊疗系统及方法 |
CN108154928A (zh) * | 2017-12-27 | 2018-06-12 | 北京嘉和美康信息技术有限公司 | 一种疾病诊断方法及装置 |
CN109192300A (zh) * | 2018-08-17 | 2019-01-11 | 百度在线网络技术(北京)有限公司 | 智能问诊方法、系统、计算机设备和存储介质 |
CN110249392A (zh) * | 2018-08-20 | 2019-09-17 | 深圳市全息医疗科技有限公司 | 智能辅助诊疗系统及方法 |
-
2020
- 2020-11-26 CN CN202011354426.9A patent/CN112309580A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573350A (zh) * | 2014-12-26 | 2015-04-29 | 深圳市前海安测信息技术有限公司 | 基于网络医院的全科医生辅助诊疗系统及方法 |
CN108154928A (zh) * | 2017-12-27 | 2018-06-12 | 北京嘉和美康信息技术有限公司 | 一种疾病诊断方法及装置 |
CN109192300A (zh) * | 2018-08-17 | 2019-01-11 | 百度在线网络技术(北京)有限公司 | 智能问诊方法、系统、计算机设备和存储介质 |
CN110249392A (zh) * | 2018-08-20 | 2019-09-17 | 深圳市全息医疗科技有限公司 | 智能辅助诊疗系统及方法 |
Non-Patent Citations (2)
Title |
---|
吴骋;徐蕾;秦婴逸;何倩;王志勇;: "中文电子病历多层次信息抽取方法的探索", 中国数字医学, no. 06 * |
王若佳;魏思仪;王继民;: "BiLSTM-CRF模型在中文电子病历命名实体识别中的应用研究", 文献与数据学报, no. 02 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112860842A (zh) * | 2021-03-05 | 2021-05-28 | 联仁健康医疗大数据科技股份有限公司 | 病历标注方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ghosh et al. | Quro: facilitating user symptom check using a personalised chatbot-oriented dialogue system | |
US9965548B2 (en) | Analyzing natural language questions to determine missing information in order to improve accuracy of answers | |
US11048874B2 (en) | Medical record error detection system and method | |
US20140122109A1 (en) | Clinical diagnosis objects interaction | |
CN110675951A (zh) | 智能化的疾病诊断方法及装置、计算机设备与可读介质 | |
CN112802575B (zh) | 基于图形状态机的用药决策支持方法、装置、设备、介质 | |
KR102424085B1 (ko) | 기계-보조 대화 시스템 및 의학적 상태 문의 장치 및 방법 | |
US10892056B2 (en) | Artificial intelligence based alert system | |
US11495332B2 (en) | Automated prediction and answering of medical professional questions directed to patient based on EMR | |
CN112331298A (zh) | 开具药方的方法、装置、电子设备及存储介质 | |
CN113468894B (zh) | 对话交互方法及装置、电子设备和计算机可读存储介质 | |
CN111627512A (zh) | 一种相似病历的推荐方法、装置,电子设备及存储介质 | |
CN111383754B (zh) | 医疗决策方法、医疗决策装置、电子设备及存储介质 | |
CN114240160A (zh) | 电子病历的质控方法、装置、电子设备及存储介质 | |
US11532387B2 (en) | Identifying information in plain text narratives EMRs | |
CN114218955A (zh) | 基于医疗知识图谱的辅助参考信息的确定方法及系统 | |
CN112309580A (zh) | 疾病类型的确定方法、装置、电子设备及存储介质 | |
US10957432B2 (en) | Human resource selection based on readability of unstructured text within an individual case safety report (ICSR) and confidence of the ICSR | |
Nair et al. | Automated clinical concept-value pair extraction from discharge summary of pituitary adenoma patients | |
Biswas et al. | Can ChatGPT be Your Personal Medical Assistant? | |
Adibi et al. | Emotion recognition support system: Where physicians and psychiatrists meet linguists and data engineers | |
CN113761899A (zh) | 一种医疗文本生成方法、装置、设备及存储介质 | |
CN113111660A (zh) | 数据处理方法、装置、设备和存储介质 | |
Lacson et al. | Automatic processing of spoken dialogue in the home hemodialysis domain | |
Wenstrup et al. | A retrospective study on machine learning-assisted stroke recognition for medical helpline calls |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |