CN112331335B - 分诊方法、装置、存储介质及电子设备 - Google Patents
分诊方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN112331335B CN112331335B CN202011298881.1A CN202011298881A CN112331335B CN 112331335 B CN112331335 B CN 112331335B CN 202011298881 A CN202011298881 A CN 202011298881A CN 112331335 B CN112331335 B CN 112331335B
- Authority
- CN
- China
- Prior art keywords
- data
- sub
- triage
- entity
- structured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000003745 diagnosis Methods 0.000 claims abstract description 82
- 238000002372 labelling Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 8
- 206010011224 Cough Diseases 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 210000000621 bronchi Anatomy 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 206010008479 Chest Pain Diseases 0.000 description 3
- 208000000059 Dyspnea Diseases 0.000 description 3
- 206010013975 Dyspnoeas Diseases 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 238000002405 diagnostic procedure Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 208000013220 shortness of breath Diseases 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 206010063659 Aversion Diseases 0.000 description 2
- 206010013700 Drug hypersensitivity Diseases 0.000 description 2
- 208000004262 Food Hypersensitivity Diseases 0.000 description 2
- 206010016946 Food allergy Diseases 0.000 description 2
- 208000000616 Hemoptysis Diseases 0.000 description 2
- 206010062717 Increased upper airway secretion Diseases 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 201000005311 drug allergy Diseases 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 208000026435 phlegm Diseases 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000008733 trauma Effects 0.000 description 2
- 238000002255 vaccination Methods 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 208000001528 Coronaviridae Infections Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 208000032023 Signs and Symptoms Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000037841 lung tumor Diseases 0.000 description 1
- 210000005015 mediastinal lymph node Anatomy 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 206010029410 night sweats Diseases 0.000 description 1
- 230000036565 night sweats Effects 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 210000004224 pleura Anatomy 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000002636 symptomatic treatment Methods 0.000 description 1
- 208000006601 tracheal stenosis Diseases 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及一种分诊方法、装置、存储介质及电子设备。该分诊方法包括:获取目标病历文本的结构化数据,该结构化数据包括不同粒度大小的信息之间的对应关系,该结构化数据中的最小粒度信息为实体属性粒度下的实体属性信息;根据该对应关系从该结构化数据中确定结构化子数据,每一结构化子数据包括一条实体属性信息;针对每一结构化子数据,确定该结构化子数据属于每一分诊科室的概率值;针对每一分诊科室,将各结构化子数据属于该分诊科室的所述概率值进行加权求和,得到该分诊科室的接诊概率值;将接诊概率值中的最大值所对应的分诊科室作为目标病历文本的目标分诊科室。采用这种方式可以提升分诊结果的准确率。
Description
技术领域
本公开涉及计算机技术领域,具体地,涉及一种分诊方法、装置、存储介质及电子设备。
背景技术
分诊是指根据病人的主要症状及体征判断病人病情的轻重缓急及其隶属专科的过程。更具体地,分诊是指分诊护士对每一位来诊病人进行简单迅速的评估、了解病人的医疗需求,并决策病人的就诊科室和就诊紧急程度,以使病人在恰当的时机、恰当的专科获得恰当的治疗与护理的过程。
由于分诊结果是由分诊护士根据病人的主观信息和客观信息进行主观决策而得出的。其中病人的主观信息包括姓名、年龄、地址等自然条件信息,以及疼痛或不适的性质、部位与范围、程度、病程、持续时间、相关症状、好转与恶化的因素等主诉信息与现病史,还包括病人的既往史与过敏史等。病人的客观信息包括即时测量的T(体温)值、P(脉搏)值、R(呼吸)值、BP(血压)值,以及分诊护士通过望、触、叩、听的检查方法对病人进行全身体格检查或局部体检得到的结果。因此,分诊护士给出的分诊结果具有高度的主观性和随机性,这常导致分诊护士给予病人错误的分诊结果。
发明内容
本公开的目的是提供一种分诊方法、装置、存储介质及电子设备,以解决相关技术中存在的问题。
为了实现上述目的,本公开实施例的第一部分提供一种分诊方法,所述方法包括:
获取目标病历文本的结构化数据,所述结构化数据包括不同粒度大小的信息之间的对应关系,所述结构化数据中的最小粒度信息为实体属性粒度下的实体属性信息,每一所述实体属性信息包括属性名称以及属性内容;
根据所述对应关系从所述结构化数据中确定结构化子数据,每一所述结构化子数据包括一条所述实体属性信息;
针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值;
针对每一所述分诊科室,将各所述结构化子数据属于该分诊科室的所述概率值进行加权求和,得到该分诊科室的接诊概率值;
将所述接诊概率值中的最大值所对应的所述分诊科室作为所述目标病历文本的目标分诊科室。
可选地,所述结构化数据的粒度从大到小依次为:病历粒度、句子粒度、实体粒度、所述实体属性粒度。
可选地,所述结构化子数据由所述实体属性粒度下的所述实体属性信息,该实体属性信息对应的实体粒度下的实体信息中的实体名称,该实体名称对应的句子粒度下的句子信息中的句子名称,该句子名称对应的病历粒度下的病历信息中的病历名称组成,其中,每一所述实体信息包括实体名称和实体内容,每一所述句子信息包括句子名称和句子内容,每一所述病历信息包括病历名称和病历内容。
可选地,所述针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,包括:
获取所有所述分诊科室的已分诊病历文本中,存在所述结构化子数据的所有目标已分诊病历文本的总和;
针对每一所述分诊科室,将该分诊科室具有的所述目标已分诊病历文本占所有目标已分诊病历文本的总和的比例值作为所述结构化子数据属于该分诊科室的所述概率值。
可选地,所述针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,包括:
通过如下计算公式计算该结构化子数据属于任一分诊科室的概率值:
P(a|b)=p1(a|b1)×p2(a|b2)×p3(a|b3)×p4(a|b4);
pn(a|bn)=p(abn)/p(bn),n∈(1,2,3,4);
其中,P(a|b)表征结构化子数据b属于分诊科室a的概率值,p1(a|b1)表征该结构化子数据b中的所述实体属性信息b1属于分诊科室a的条件概率值,p2(a|b2)表征所述实体名称b2属于分诊科室a的条件概率值,p3(a|b3)表征所述句子名称b3属于分诊科室a的条件概率值,p4(a|b4)表征所述病历名称b4属于分诊科室a的条件概率值,p(abn)表征分诊科室a中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值,p(bn)表征所有分诊科室中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值。
可选地,所述获取目标病历文本的结构化数据,包括:
对所述目标病历文本进行句子分段处理,得到多条句子信息;
针对每一条所述句子信息,根据与该句子信息中的句子名称对应的实体标注模型标注该句子信息的句子内容中存在的实体信息。
可选地,所述获取目标病历文本的结构化数据还包括:
针对每一所述实体信息,根据与该实体信息中的实体名称对应的属性标注模型标注该实体信息的实体内容中的所述实体属性信息。
本公开实施例的第二部分提供一种分诊装置,所述装置包括:
获取模块,被配置为用于获取目标病历文本的结构化数据,所述结构化数据包括不同粒度大小的信息之间的对应关系,所述结构化数据中的最小粒度信息为实体属性粒度下的实体属性信息,每一所述实体属性信息包括属性名称以及属性内容;
第一确定模块,被配置为用于根据所述对应关系从所述结构化数据中确定结构化子数据,每一所述结构化子数据包括一条所述实体属性信息;
第二确定模块,被配置为用于针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值;
计算模块,被配置为用于针对每一所述分诊科室,将各所述结构化子数据属于该分诊科室的所述概率值进行加权求和,得到该分诊科室的接诊概率值;
执行模块,被配置为用于将所述接诊概率值中的最大值所对应的所述分诊科室作为所述目标病历文本的目标分诊科室。
可选地,所述结构化数据的粒度从大到小依次为:病历粒度、句子粒度、实体粒度、所述实体属性粒度。
可选地,所述结构化子数据由所述实体属性粒度下的所述实体属性信息,该实体属性信息对应的实体粒度下的实体信息中的实体名称,该实体名称对应的句子粒度下的句子信息中的句子名称,该句子名称对应的病历粒度下的病历信息中的病历名称组成,其中,每一所述实体信息包括实体名称和实体内容,每一所述句子信息包括句子名称和句子内容,每一所述病历信息包括病历名称和病历内容。
可选地,所述第二确定模块包括:
获取子模块,被配置为用于获取所有所述分诊科室的已分诊病历文本中,存在所述结构化子数据的所有目标已分诊病历文本的总和;
执行子模块,被配置为用于针对每一所述分诊科室,将该分诊科室具有的所述目标已分诊病历文本占所有目标已分诊病历文本的总和的比例值作为所述结构化子数据属于该分诊科室的所述概率值。
可选地,所述第二确定模块包括:
计算子模块,被配置为用于通过如下计算公式计算该结构化子数据属于任一分诊科室的概率值:
P(a|b)=p1(a|b1)×p2(a|b2)×p3(a|b3)×p4(a|b4);
pn(a|bn)=p(abn)/p(bn),n∈(1,2,3,4);
其中,P(a|b)表征结构化子数据b属于分诊科室a的概率值,p1(a|b1)表征该结构化子数据b中的所述实体属性信息b1属于分诊科室a的条件概率值,p2(a|b2)表征所述实体名称b2属于分诊科室a的条件概率值,p3(a|b3)表征所述句子名称b3属于分诊科室a的条件概率值,p4(a|b4)表征所述病历名称b4属于分诊科室a的条件概率值,p(abn)表征分诊科室a中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值,p(bn)表征所有分诊科室中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值。
可选地,所述获取模块包括:
分段处理子模块,被配置为用于对所述目标病历文本进行句子分段处理,得到多条句子信息;
标注子模块,被配置为用于针对每一条所述句子信息,根据与该句子信息中的句子名称对应的实体标注模型标注该句子信息的句子内容中存在的实体信息。
可选地,所述标注子模块,还被配置为用于针对每一所述实体信息,根据与该实体信息中的实体名称对应的属性标注模型标注该实体信息的实体内容中的所述实体属性信息。
本公开实施例的第三部分,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一部分中任一项所述方法的步骤。
本公开实施例的第四部分,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一部分中任一项所述方法的步骤。
采用上述技术方案,至少能够取得如下技术效果:
通过获取目标病历文本的结构化数据,根据该结构化数据中不同粒度大小的信息之间的对应关系确定结构化子数据,每一该结构化子数据包括一条最小粒度的实体属性信息。针对每一结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,并针对每一分诊科室,将各结构化子数据属于该分诊科室的概率值进行加权求和,得到该分诊科室的接诊概率值。将各分诊科室的接诊概率值中的最大值所对应的分诊科室作为该目标病历文本的目标分诊科室。采用这种方式可以避免相关技术中分诊护士对病人进行分诊时由该分诊护士的主观性导致的误分诊问题。因此,这种方式提升了分诊结果的准确率。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据本公开一示例性实施例示出的一种分诊方法的流程图。
图2是根据本公开一示例性实施例示出的一种分诊装置的框图。
图3是根据本公开一示例性实施例示出的一种电子设备的框图。
图4是根据本公开一示例性实施例示出的另一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
由于分诊护士给出的分诊结果具有高度的主观性和随机性,这常导致分诊护士给予病人错误的分诊结果。因此,为了克服人工分诊的主观性导致的误分诊问题,提出了利用基于NLP(Natural Language Process,自然语言处理)技术的模型对病人进行自动分诊的方式。具体地,将病人的病历信息输入预先训练好的模型中,通过该模型提取病历信息中的特征向量,根据提取到的特征向量与已分诊数据集进行比对,从已分诊数据集中选择与该提取到的特征向量相似度最高的已分诊数据,并将相似度最高的已分诊数据对应的分诊科室作为该病人的分诊科室。
虽然这种利用模型从病历维度对病人进行自动分诊的方式克服了人工分诊的主观性和随机性导致的误分诊问题,但是这种方式仍然存在较高的误分诊率。原因是很多病症的症状、体征具有“不典型”性,即不同病症之间可能存在症状、体征相似度很高的情况,而不相似的少部分症状、体征可能是区分该不同病症的关键因素。因此,采用这种从病历维度计算待分诊病历文本与已分诊病历文本的相似度,并根据相似度值的大小确定待分诊病历对应的分诊科室的方式也很容易出现误分诊的问题。
此外,从病历维度计算待分诊病历文本与已分诊病历文本的相似度的方式,还忽略了病历文本中各病症、体征之间的关联关系,而这很容易导致误分诊的问题。例如将病历文本“咳嗽次数多、打喷嚏次数少”拆分成“咳嗽、打喷嚏、次数、多、少”的情况下,该病例文本与另一病例文本“咳嗽次数少、打喷嚏次数较多”拆分成的“咳嗽、打喷嚏、次数、较多、少”进行相似度计算,会得到相似度极高的结果。然而该两个病例文本实际区别很大。
有鉴于此,本公开实施例提供一种分诊方法、装置、存储介质及电子设备,以提升分诊结果的准确率。
图1是根据本公开一示例性实施例示出的一种分诊方法的流程图,如图1所述,该方法包括以下步骤:
S11、获取目标病历文本的结构化数据,所述结构化数据包括不同粒度大小的信息之间的对应关系,所述结构化数据中的最小粒度信息为实体属性粒度下的实体属性信息,每一所述实体属性信息包括属性名称以及属性内容。
其中,目标病历文本是指待分诊对象的病历文本信息。
相关技术中,病历类型包括病人主诉、现病史、既往史、疾病史、传染病史、食物或药物过敏史、手术外伤史、预防接种疫苗史、输血史、麻醉史等等。因而目标病历文本可以包括一种或多种病历类型对应的文本。如目标病历文本可以包括上述病历类型中的至少一种类型的病历文本。
示例地,目标病历文本具体可以包括,现病史:患者4年前无明显诱因下出现咳血丝痰,量不多,无畏寒、发热、盗汗,无胸痛、胸闷、气促等,曾于我院就诊胸部增强CT示:1.左下肺术后改变。2.左主支气管后壁结节影,紧邻半奇静脉,性质待定,转移瘤?原发性肿瘤?(类癌?)建议纤支镜活检。诊断“左主支气管转移癌;经支气管镜左主支气管结节”,经对症处理好转后出院。出院后仍间断有咳嗽,咯血丝痰,量少。1月余前患者出现气促,活动后加重,平素快步行走及轻微活动即气促明显,无胸痛,无畏寒发热,当地医院行胸部CT检查示:1.气管下段-左主支气管内软组织密度影,考虑肿瘤复发;2.左肺阴影,考虑炎症,未除外合并肿瘤;3.左肺门及纵膈淋巴结转移;4.左侧胸膜增厚。现为求进一步治疗,前来我院门诊,门诊拟诊“肺肿瘤;气管狭窄”收入我科。患者起病以来,精神、胃纳、睡眠可,大小便正常。近期无明显体重下降。既往史:平素健康状况为良好。疾病史:患者于某年在我院诊断左下肺癌并行手术切除,术后回当地某市人民医院行5次化疗。无“高血压、冠心病、糖尿病、慢阻肺”。传染病史:无“肺结核、肝炎”病史,入院前已行血常规,新冠病毒核酸检测等检查,目前排除新冠病毒感染。食物或药物过敏史:无。手术外伤史:无。预防接种史:无。输血史:无。
一种实施方式,所述结构化数据的粒度从大到小依次为:病历粒度、句子粒度、实体粒度、实体属性粒度。另一种实施方式,结构化数据的粒度从大到小依次可以为:病历粒度、实体粒度、实体属性粒度。应当理解的是,在具体的分诊过程中,若目标病历文本中数据量较大,那么可以选择上述两种实施方式中的前一种粒度划分方式。若目标病历文本中数据量较小,那么可以选择上述两种实施方式中的后一种粒度划分方式。亦或者可以针对目标病历文本中每一种类型的病历文本,根据该种病历文本的数据量大小选择对应的粒度划分方式。
应当说明的是,病历粒度下的每一条病历信息包括病历名称和病历内容。句子粒度下的每一条句子信息包括句子名称和句子内容。实体粒度下的每一条实体信息包括实体名称和实体内容。实体属性粒度下的每一条实体属性信息包括属性名称以及属性内容。其中,病历名称表征病历信息对应的病历类别。句子名称、实体名称、属性名称亦然。
基于信息的粒度(granularity)是指信息单元的相对大小或粗糙程度,即大粒度的信息包括多个小粒度的信息的定义,容易理解的是,目标病历文本包括至少一条病历粒度下的病历信息。每一条病历信息包括至少一条句子粒度下的句子信息。每一条句子信息包括至少一条实体粒度下的实体信息。每一条实体信息包括至少一条实体属性信息。
进一步地,上述步骤S11中不同粒度大小的信息之间的对应关系是指,病历粒度下的病历信息与该病历信息包括的至少一条句子粒度下的句子信息的对应关系。句子粒度下的句子信息与该句子信息包括的至少一条实体粒度下的实体信息的对应关系。实体粒度下的实体信息与该实体信息包括的至少一条实体属性信息的对应关系。
示例地,以前述实施例中的现病史和既往史为目标病历文本为例,获取到的该目标病历文本的结构化数据可以如表1所示。
表1
S12、根据所述对应关系从所述结构化数据中确定结构化子数据,每一所述结构化子数据包括一条所述实体属性信息。
其中,每一结构化子数据包括一条实体属性信息,该结构化数据中实体属性信息的数量与结构化子数据的数量相同。
可选地,所述结构化子数据由所述实体属性粒度下的所述实体属性信息,该实体属性信息对应的实体粒度下的实体信息中的实体名称,该实体名称对应的句子粒度下的句子信息中的句子名称,该句子名称对应的病历粒度下的病历信息中的病历名称组成。
应当说明的是,结构化子数据还可以包括实体粒度下的实体信息中的实体内容、病历粒度下的病历信息中的病历内容。但优选地,本公开实施例中的结构化子数据不包括实体内容和病历内容。原因在于,实体内容和病历内容的文字量较大,文字变化形式太多,容易在计算概率的过程中扩大整个结构化子数据的概率误差。
具体地,以上述表1为例,根据不同粒度大小的信息之间的对应关系从表1所示的结构化数据中确定得到的其中一条结构化子数据为:时间点、4年前、咳嗽、症状描述、现病史。再示例地,得到的另一条结构化子数据为诱因、无、咳嗽、症状描述、现病史。再示例地,得到的再一条结构化子数据为痰、血丝、量不多、咳嗽、症状描述、现病史。再示例地,得到的又一条结构化子数据具体为检查项名称、增强CT、检查项、检查信息、现病史。
容易理解的是,当结构化数据的粒度从大到小依次为:病历粒度、实体粒度、实体属性粒度的情况下,根据不同粒度大小的信息之间的对应关系从表1所示的结构化数据中确定得到的其中一条结构化子数据为:情况、良好、健康状况、既往史。
S13、针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值。
一种可实现的实施方式,所述针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,具体可以包括以下步骤:
获取所有所述分诊科室的已分诊病历文本中,存在所述结构化子数据的所有目标已分诊病历文本的总和;针对每一所述分诊科室,将该分诊科室具有的所述目标已分诊病历文本占所有目标已分诊病历文本的总和的比例值作为所述结构化子数据属于该分诊科室的所述概率值。
具体地,针对每一结构化子数据,获取所有分诊科室的已分诊病历文本中存在该结构化子数据的目标已分诊病历文本的总和。针对每一分诊科室,确定该分诊科室具有的该目标已分诊病历文本的数量,将该分诊科室具有的该目标已分诊病历文本的数量作为被除数,将所有目标已分诊病历文本的总和作为除数,用该被除数除以该除数得到该结构化子数据属于该分诊科室的概率值。如此,可以得到每一结构化子数据属于每一分诊科室的概率值。
示例地,假设针对结构化子数据A,获取所有分诊科室的已分诊病历文本中存在该结构化子数据A的目标已分诊病历文本的总和为100。针对分诊科室M,确定该分诊科室M具有的该目标已分诊病历文本的数量为20,将该分诊科室M具有的该目标已分诊病历文本的数量20作为被除数,将所有目标已分诊病历文本的总和100作为除数,用该被除数20除以该除数100得到该结构化子数据A属于该分诊科室M的概率值为1/5。
可选地,所述针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,包括:
通过如下计算公式计算该结构化子数据属于任一分诊科室的概率值:
P(a|b)=p1(a|b1)×p2(a|b2)×p3(a|b3)×p4(a|b4);
pn(a|bn)=p(abn)/p(bn),n∈(1,2,3,4);
其中,P(a|b)表征结构化子数据b属于分诊科室a的概率值,p1(a|b1)表征该结构化子数据b中的所述实体属性信息b1属于分诊科室a的条件概率值,p2(a|b2)表征所述实体名称b2属于分诊科室a的条件概率值,p3(a|b3)表征所述句子名称b3属于分诊科室a的条件概率值,p4(a|b4)表征所述病历名称b4属于分诊科室a的条件概率值,p(abn)表征分诊科室a中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值,p(bn)表征所有分诊科室中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值。
另一种相同原理的实施方式,针对所有分诊科室的已分诊病历文本进行已分诊结构化子数据抽取。并计算每一已分诊结构化子数据对应于每一分诊科室的条件概率P(科室|结构化子数据)。进一步地,在步骤S13中,目标结构化子数据对应于目标科室的概率即为对应的条件概率P(目标科室|目标结构化子数据)。如此,也可以确定每一结构化子数据属于每一分诊科室的概率值。
更详细地,条件概率P(目标科室|目标结构化子数据)的计算公式具体为:设目标科室为a,目标结构化子数据为b,目标实体属性信息为b1,目标实体名称为b2,目标句子名称为b3,目标病历名称为b4。
P(a|b)=p1(a|b1)×p2(a|b2)×p3(a|b3)×p4(a|b4),其中,pn(a|bn)=p(abn)/p(bn),n∈(1,2,3,4),p(a|bn)表征目标科室a中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值,p(bn)表征所有分诊科室中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值。
容易理解的是p1(a|b1)=p1(a|目标属性名称)×p1(a|目标属性内容)。
S14、针对每一所述分诊科室,将各所述结构化子数据属于该分诊科室的所述概率值进行加权求和,得到该分诊科室的接诊概率值。
在得到目标病历文本的结构化数据中每一结构化子数据属于每一分诊科室的概率值之后,针对每一分诊科室,根据所有结构化子数据属于该分诊科室的所有概率值进行加权求和/加权平均,得到该分诊科室的接诊概率值。其中,各结构化子数据的权重值根据实际需求进行设置。对此本公开不做限定。
S15、将所述接诊概率值中的最大值所对应的所述分诊科室作为所述目标病历文本的目标分诊科室。
在得到每一分诊科室接诊该目标病历文本对应的病例的接诊概率值之后,将各分诊科室的接诊概率值中的最大值所对应的分诊科室作为目标病历文本的目标分诊科室。
示例地,假设第一分诊科室的接诊概率值为10%,第二分诊科室的接诊概率值为20%,第三分诊科室的接诊概率值为30%。那么该三个分诊科室的接诊概率值中的最大值为30%。进一步地,将该最大接诊概率值30%对应第三分诊科室作为目标分诊科室。
采用这种方式,通过获取目标病历文本的结构化数据,根据该结构化数据中不同粒度大小的信息之间的对应关系确定结构化子数据,每一该结构化子数据包括一条最小粒度的实体属性信息。针对每一结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,并针对每一分诊科室,将各结构化子数据属于该分诊科室的概率值进行加权求和,得到该分诊科室的接诊概率值。将各分诊科室的接诊概率值中的最大值所对应的分诊科室作为该目标病历文本的目标分诊科室。采用这种方式可以避免相关技术中分诊护士对病人进行分诊时由该分诊护士的主观性导致的误分诊问题。因此,这种方式提升了分诊的准确率。
并且,本公开的上述技术方案与从病历维度计算待分诊病历文本与已分诊病历文本的相似度,并根据相似度值的大小确定待分诊病历对应的分诊科室的方式相比,本公开的上述技术方案中,由于结构化子数据包括最小粒度实体属性信息,因而可以使所有结构化子数据完全覆盖目标病历文本中的特征信息。如此可以避免计算相似度的方式中不相似的部分特征信息被忽略而导致的误分诊问题。并且,本公开的上述技术方案中,由于结构化子数据是根据目标病历文本的结构化数据中不同粒度大小的信息之间的对应关系确定的,因此该结构化子数据中包括了不同粒度大小的信息之间的对应关系,进而本公开的上述技术方案还克服了计算相似度的方式中因忽略病历文本中各病症、体征之间的关联关系而导致的误分诊问题。
一种可实现的实施方式,上述步骤S11所述获取目标病历文本的结构化数据,具体可以包括以下步骤:根据病历类型对目标病历文本进行划分,得到一条或多条病历粒度下的病历信息。
其中,值得说明的是,不同病历类型对应的病历信息一般为独立的文本信息,具有对应的文本格式或标签。因此,可以根据病历信息的文本格式或标签对目标病历文本进行划分,得到该目标病历文本中的一条或多条病历粒度下的病历信息。
进一步地,所述获取目标病历文本的结构化数据,具体还可以包括以下步骤:
对所述目标病历文本进行句子分段处理,得到多条句子信息;针对每一条所述句子信息,根据与该句子信息中的句子名称对应的实体标注模型标注该句子信息的句子内容中存在的实体信息。
具体地,可以根据症状描述、疾病信息、检查信息、检验信息等句子类别(即句子名称)对目标病历文本进行句子分段处理,得到句子粒度下的至少一条句子信息。针对每一条句子信息,根据与该句子信息中的句子名称对应的实体标注模型标注该句子信息的句子内容中存在的实体信息,得到至少一条实体信息。其中,句子类别可以是由人工定义的,也可以是由模型学习得到的。
一种可能的实施方式,每一句子名称对应的实体标注模型是根据该句子名称对应的训练数据集进行训练得到的。容易理解的是,不同句子类别(句子名称)对应的句子内容存在很大的差异,因此采用这种方式训练得到的实体标注模型可以更准确的标注出对应的句子信息中的实体信息。
另一种可能的实施方式,所有句子类别(句子名称)可以对应于同一实体标注模型。对此,本公开不做具体地限制。例如,实体标注模型可以根据已有的医疗实体知识图谱对每一条句子信息进行实体标注,得到实体信息。
再进一步地,所述获取目标病历文本的结构化数据,还可以包括:针对每一所述实体信息,根据与该实体信息中的实体名称对应的属性标注模型标注该实体信息的实体内容中的所述实体属性信息。
该标注实体属性信息的具体实施方式与上述标注实体信息的方式相类似,此处不再赘述。
图2是根据本公开一示例性实施例示出的一种分诊装置的框图,如图2所示,所述分诊装置200包括:
获取模块210,被配置为用于获取目标病历文本的结构化数据,所述结构化数据包括不同粒度大小的信息之间的对应关系,所述结构化数据中的最小粒度信息为实体属性粒度下的实体属性信息,每一所述实体属性信息包括属性名称以及属性内容;
第一确定模块220,被配置为用于根据所述对应关系从所述结构化数据中确定结构化子数据,每一所述结构化子数据包括一条所述实体属性信息;
第二确定模块230,被配置为用于针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值;
计算模块240,被配置为用于针对每一所述分诊科室,将各所述结构化子数据属于该分诊科室的所述概率值进行加权求和,得到该分诊科室的接诊概率值;
执行模块250,被配置为用于将所述接诊概率值中的最大值所对应的所述分诊科室作为所述目标病历文本的目标分诊科室。
采用这种装置,通过获取目标病历文本的结构化数据,根据该结构化数据中不同粒度大小的信息之间的对应关系确定结构化子数据,该结构化子数据包括一条最小粒度的实体属性信息。针对每一结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,并针对每一分诊科室,将各结构化子数据属于该分诊科室的概率值进行加权求和,得到该分诊科室的接诊概率值。将各分诊科室的接诊概率值中的最大值所对应的分诊科室作为该目标病历文本的目标分诊科室。采用这种方式提升了分诊的准确率。
可选地,所述结构化数据的粒度从大到小依次为:病历粒度、句子粒度、实体粒度、所述实体属性粒度。
可选地,所述结构化子数据由所述实体属性粒度下所述实体属性信息,该实体属性信息对应的实体粒度下实体信息中的实体名称,该实体名称对应的句子粒度下句子信息中的句子名称,该句子名称对应的病历粒度下病历信息中的病历名称组成,其中,每一所述实体信息包括实体名称和实体内容,每一所述句子信息包括句子名称和句子内容,每一所述病历信息包括病历名称和病历内容。
可选地,所述第二确定模块230包括:
获取子模块,被配置为用于获取所有所述分诊科室的已分诊病历文本中,存在所述结构化子数据的所有目标已分诊病历文本的总和;
执行子模块,被配置为用于针对每一所述分诊科室,将该分诊科室具有的所述目标已分诊病历文本占所有目标已分诊病历文本的总和的比例值作为所述结构化子数据属于该分诊科室的所述概率值。
可选地,所述第二确定模块230包括:
计算子模块,被配置为用于通过如下计算公式计算该结构化子数据属于任一分诊科室的概率值:
P(a|b)=p1(a|b1)×p2(a|b2)×p3(a|b3)×p4(a|b4);
pn(a|bn)=p(abn)/p(bn),n∈(1,2,3,4);
其中,P(a|b)表征结构化子数据b属于分诊科室a的概率值,p1(a|b1)表征该结构化子数据b中的所述实体属性信息b1属于分诊科室a的条件概率值,p2(a|b2)表征所述实体名称b2属于分诊科室a的条件概率值,p3(a|b3)表征所述句子名称b3属于分诊科室a的条件概率值,p4(a|b4)表征所述病历名称b4属于分诊科室a的条件概率值,p(abn)表征分诊科室a中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值,p(bn)表征所有分诊科室中包括bn的已分诊病历文本的数量占所有分诊科室的已分诊病历文本的比值。
可选地,所述获取模块210包括:
分段处理子模块,被配置为用于对所述目标病历文本进行句子分段处理,得到多条句子信息;
标注子模块,被配置为用于针对每一条所述句子信息,根据与该句子信息中的句子名称对应的实体标注模型标注该句子信息的句子内容中存在的实体信息。
可选地,所述标注子模块,还被配置为用于针对每一所述实体信息,根据与该实体信息中的实体名称对应的属性标注模型标注该实体信息的实体内容中的所述实体属性信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据本公开一示例性实施例示出的一种电子设备700的框图。如图3所示,该电子设备700可以包括:处理器701,存储器702。该电子设备700还可以包括多媒体组件703,输入/输出(I/O)接口704,以及通信组件705中的一者或多者。
其中,处理器701用于控制该电子设备700的整体操作,以完成上述的分诊方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作,这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件705可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备700可以被一个或至少一个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的分诊方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的分诊方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器702,上述程序指令可由电子设备700的处理器701执行以完成上述的分诊方法。
图4是根据本公开一示例性实施例示出的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图4,电子设备1900包括处理器1922,其数量可以为一个或至少一个,以及存储器1932,用于存储可由处理器1922执行的计算机程序。存储器1932中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器1922可以被配置为执行该计算机程序,以执行上述的分诊方法。
另外,电子设备1900还可以包括电源组件1926和通信组件1950,该电源组件1926可以被配置为执行电子设备1900的电源管理,该通信组件1950可以被配置为实现电子设备1900的通信,例如,有线或无线通信。此外,该电子设备1900还可以包括输入/输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM等等。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的分诊方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器1932,上述程序指令可由电子设备1900的处理器1922执行以完成上述的分诊方法。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的分诊方法的代码部分。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (6)
1.一种分诊方法,其特征在于,所述方法包括:
获取目标病历文本的结构化数据,所述结构化数据包括不同粒度大小的信息之间的对应关系,所述结构化数据中的最小粒度信息为实体属性粒度下的实体属性信息,每一所述实体属性信息包括属性名称以及属性内容;
根据所述对应关系从所述结构化数据中确定结构化子数据,每一所述结构化子数据包括一条所述实体属性信息;
针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值;
针对每一所述分诊科室,将各所述结构化子数据属于该分诊科室的所述概率值进行加权求和,得到该分诊科室的接诊概率值;
将所述接诊概率值中的最大值所对应的所述分诊科室作为所述目标病历文本的目标分诊科室;
所述结构化数据的粒度从大到小依次为:
病历粒度、句子粒度、实体粒度、所述实体属性粒度;
所述结构化子数据由所述实体属性粒度下的所述实体属性信息,该实体属性信息对应的实体粒度下的实体信息中的实体名称,该实体名称对应的句子粒度下的句子信息中的句子名称,该句子名称对应的病历粒度下的病历信息中的病历名称组成,其中,每一所述实体信息包括实体名称和实体内容,每一所述句子信息包括句子名称和句子内容,每一所述病历信息包括病历名称和病历内容;
所述针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,包括:
获取所有所述分诊科室的已分诊病历文本中,存在所述结构化子数据的所有目标已分诊病历文本的总和;
针对每一所述分诊科室,将该分诊科室具有的所述目标已分诊病历文本占所有目标已分诊病历文本的总和的比例值作为所述结构化子数据属于该分诊科室的所述概率值;
或者,所述针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值,包括:
通过如下计算公式计算该结构化子数据属于任一分诊科室的概率值:
2.根据权利要求1所述的方法,其特征在于,所述获取目标病历文本的结构化数据,包括:
对所述目标病历文本进行句子分段处理,得到多条句子信息;
针对每一条所述句子信息,根据与该句子信息中的句子名称对应的实体标注模型标注该句子信息的句子内容中存在的实体信息。
3.根据权利要求2所述的方法,其特征在于,所述获取目标病历文本的结构化数据还包括:
针对每一所述实体信息,根据与该实体信息中的实体名称对应的属性标注模型标注该实体信息的实体内容中存在的所述实体属性信息。
4.一种分诊装置,其特征在于,所述装置包括:
获取模块,被配置为用于获取目标病历文本的结构化数据,所述结构化数据包括不同粒度大小的信息之间的对应关系,所述结构化数据中的最小粒度信息为实体属性粒度下的实体属性信息,每一所述实体属性信息包括属性名称以及属性内容;
第一确定模块,被配置为用于根据所述对应关系从所述结构化数据中确定结构化子数据,每一所述结构化子数据包括一条所述实体属性信息;
第二确定模块,被配置为用于针对每一所述结构化子数据,确定该结构化子数据属于每一分诊科室的概率值;
计算模块,被配置为用于针对每一所述分诊科室,将各所述结构化子数据属于该分诊科室的所述概率值进行加权求和,得到该分诊科室的接诊概率值;
执行模块,被配置为用于将所述接诊概率值中的最大值所对应的所述分诊科室作为所述目标病历文本的目标分诊科室;
所述结构化数据的粒度从大到小依次为:病历粒度、句子粒度、实体粒度、所述实体属性粒度;
所述结构化子数据由所述实体属性粒度下的所述实体属性信息,该实体属性信息对应的实体粒度下的实体信息中的实体名称,该实体名称对应的句子粒度下的句子信息中的句子名称,该句子名称对应的病历粒度下的病历信息中的病历名称组成,其中,每一所述实体信息包括实体名称和实体内容,每一所述句子信息包括句子名称和句子内容,每一所述病历信息包括病历名称和病历内容;
所述第二确定模块包括:
获取子模块,被配置为用于获取所有所述分诊科室的已分诊病历文本中,存在所述结构化子数据的所有目标已分诊病历文本的总和;
执行子模块,被配置为用于针对每一所述分诊科室,将该分诊科室具有的所述目标已分诊病历文本占所有目标已分诊病历文本的总和的比例值作为所述结构化子数据属于该分诊科室的所述概率值;
或者,
所述第二确定模块包括:
计算子模块,被配置为用于通过如下计算公式计算该结构化子数据属于任一分诊科室的概率值:
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-3中任一项所述方法的步骤。
6.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-3中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011298881.1A CN112331335B (zh) | 2020-11-18 | 2020-11-18 | 分诊方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011298881.1A CN112331335B (zh) | 2020-11-18 | 2020-11-18 | 分诊方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112331335A CN112331335A (zh) | 2021-02-05 |
CN112331335B true CN112331335B (zh) | 2023-07-07 |
Family
ID=74321441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011298881.1A Active CN112331335B (zh) | 2020-11-18 | 2020-11-18 | 分诊方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112331335B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492107A (zh) * | 2018-11-21 | 2019-03-19 | 上海依智医疗技术有限公司 | 一种导诊的方法及装置 |
CN110517767A (zh) * | 2019-08-27 | 2019-11-29 | 北京百度网讯科技有限公司 | 辅助诊断方法、装置、电子设备及存储介质 |
CN111444686A (zh) * | 2020-03-16 | 2020-07-24 | 上海联影智能医疗科技有限公司 | 医学数据标注方法、装置、存储介质及计算机设备 |
CN111564210A (zh) * | 2020-04-01 | 2020-08-21 | 心医国际数字医疗系统(大连)有限公司 | 智能导诊方法、装置、电子设备及存储介质 |
CN111710412A (zh) * | 2020-05-29 | 2020-09-25 | 北京百度网讯科技有限公司 | 诊断结果的校验方法、装置及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180218126A1 (en) * | 2017-01-31 | 2018-08-02 | Pager, Inc. | Determining Patient Symptoms and Medical Recommendations Based on Medical Information |
-
2020
- 2020-11-18 CN CN202011298881.1A patent/CN112331335B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492107A (zh) * | 2018-11-21 | 2019-03-19 | 上海依智医疗技术有限公司 | 一种导诊的方法及装置 |
CN110517767A (zh) * | 2019-08-27 | 2019-11-29 | 北京百度网讯科技有限公司 | 辅助诊断方法、装置、电子设备及存储介质 |
CN111444686A (zh) * | 2020-03-16 | 2020-07-24 | 上海联影智能医疗科技有限公司 | 医学数据标注方法、装置、存储介质及计算机设备 |
CN111564210A (zh) * | 2020-04-01 | 2020-08-21 | 心医国际数字医疗系统(大连)有限公司 | 智能导诊方法、装置、电子设备及存储介质 |
CN111710412A (zh) * | 2020-05-29 | 2020-09-25 | 北京百度网讯科技有限公司 | 诊断结果的校验方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
"电子病历存储模式研究";宇文姝丽;《医学信息学杂志》;第7-12页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112331335A (zh) | 2021-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110459320B (zh) | 一种基于知识图谱的辅助诊疗系统 | |
Higginson et al. | Where do cancer patients die? Ten-year trends in the place of death of cancer patients in England | |
JP5952835B2 (ja) | 撮像プロトコルの更新及び/又はリコメンダ | |
Hripcsak et al. | Use of natural language processing to translate clinical information from a database of 889,921 chest radiographic reports | |
US9165116B2 (en) | Patient data mining | |
Sjoding et al. | Deep learning to detect acute respiratory distress syndrome on chest radiographs: a retrospective study with external validation | |
Ronco et al. | Remote patient management of peritoneal dialysis during COVID-19 pandemic | |
Warren et al. | Attributable cost of catheter-associated bloodstream infections among intensive care patients in a nonteaching hospital | |
US8670997B2 (en) | Quality metric extraction and editing for medical data | |
O’Halloran et al. | Characterizing the patients, hospitals, and data quality of the eICU collaborative research database | |
Sjoding et al. | Evaluating delivery of low tidal volume ventilation in six ICUs using electronic health record data | |
JP2017509946A (ja) | コンテキスト依存医学データ入力システム | |
JP6408436B2 (ja) | 診療支援装置とその作動方法および作動プログラム、並びに診療支援システム | |
US20150294088A1 (en) | Patient Summary Generation | |
US20230142909A1 (en) | Clinically meaningful and personalized disease progression monitoring incorporating established disease staging definitions | |
Ping et al. | Information extraction for tracking liver cancer patients' statuses: from mixture of clinical narrative report types | |
Sjoding et al. | Recognition and appropriate treatment of the acute respiratory distress syndrome remains unacceptably low | |
Zaballa et al. | Identifying common treatments from Electronic Health Records with missing information. An application to breast cancer | |
Dilek et al. | Different chest CT scoring systems in patients with COVID-19: could baseline CT be a helpful tool in predicting survival in patients with matched ages and co-morbid conditions? | |
Zhang et al. | Comparison of chest radiograph captions based on natural language processing vs completed by radiologists | |
Wu et al. | Reducing chest radiography utilization in the medical intensive care unit | |
Elmahdy et al. | A snapshot of artificial intelligence research 2019–2021: is it replacing or assisting physicians? | |
CN112331335B (zh) | 分诊方法、装置、存储介质及电子设备 | |
Ogunyemi et al. | Combining geometric and probabilistic reasoning for computer-based penetrating-trauma assessment | |
Lezcano et al. | Predictors of mechanical ventilation and mortality in critically ill patients with COVID-19 pneumonia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |