CN112712868A - 医学数据的分析方法、装置及存储介质 - Google Patents
医学数据的分析方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112712868A CN112712868A CN202011606035.1A CN202011606035A CN112712868A CN 112712868 A CN112712868 A CN 112712868A CN 202011606035 A CN202011606035 A CN 202011606035A CN 112712868 A CN112712868 A CN 112712868A
- Authority
- CN
- China
- Prior art keywords
- medical
- information
- medical data
- medical information
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 30
- 238000007405 data analysis Methods 0.000 title description 4
- 238000004458 analytical method Methods 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000003745 diagnosis Methods 0.000 claims description 84
- 201000010099 disease Diseases 0.000 claims description 67
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 67
- 208000024891 symptom Diseases 0.000 claims description 30
- 238000003062 neural network model Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 13
- 238000004891 communication Methods 0.000 description 7
- 238000013479 data entry Methods 0.000 description 5
- 208000001910 Ventricular Heart Septal Defects Diseases 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 201000003130 ventricular septal defect Diseases 0.000 description 3
- 206010006895 Cachexia Diseases 0.000 description 2
- 208000000059 Dyspnea Diseases 0.000 description 2
- 206010013975 Dyspnoeas Diseases 0.000 description 2
- 208000008454 Hyperhidrosis Diseases 0.000 description 2
- 208000006083 Hypokinesia Diseases 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 208000026500 emaciation Diseases 0.000 description 2
- 230000037315 hyperhidrosis Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 208000035211 Heart Murmurs Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000002741 palatine tonsil Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 208000013220 shortness of breath Diseases 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及医学数据的分析方法、医学数据的分析装置及计算机可读存储介质,分析方法包括:获取医学数据;提取所述医学数据中的实体,所述实体包含各种第一医学信息;根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;基于所述第一医学信息和第二医学信息的对比,得到分析结果。分析装置包括:获取单元;提取模块;确定模块;分析模块。通过本公开的各实施例能够对医学数据进行准确、高效地分析,从而提升医学数据处理的能力。
Description
技术领域
本公开涉及医学数据智能处理技术领域,具体涉及一种医学数据的分析方法、医学数据的分析装置及计算机可读存储介质。
背景技术
在医院的临床决策支持系统(CDSS)诊断系统中,给定医学数据,包括诸如病历文本(主诉、现病史、体格检查),以及患者诊断疾病,从这些医学数据中提取患者疾病的诊断依据是有非常重大的意义。
发明内容
本公开意图提供一种医学数据的分析方法、医学数据的分析装置及计算机可读存储介质,能够对医学数据进行准确、高效地分析,从而提升医学数据处理的能力。
根据本公开的方案之一,提供一种医学数据的分析方法,包括:
获取医学数据;
提取所述医学数据中的实体,所述实体包含各种第一医学信息;
根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;
基于所述第一医学信息和第二医学信息的对比,得到分析结果。
在一些实施例中,其中,所述提取所述医学数据中的实体,所述实体包含各种第一医学信息,包括:
基于神经网络模型,解析所述医学数据;
根据表述包括症状、部位的内容,提取所述医学数据的实体。
在一些实施例中,其中,所述提取所述医学数据中的实体,所述实体包含各种第一医学信息,还包括:
以状态和部位作为提取的实体的属性;
建立实体列表。
在一些实施例中,其中,所述根据所述医学数据的判读结果,确定包含第二医学信息的信息范围,包括:
当所述判读结果对应于疾病名称的情况下,提取该疾病名称;
对照于包含有疾病名称和诊断依据的诊断依据配置文件,确定出诊断依据配置文件中与该疾病名称对应的诊断依据;
建立诊断依据待选表。
在一些实施例中,其中,所述诊断依据配置文件的构建方式,包括:
建立疾病与诊断依据的关联;
以一定的格式记录每一条疾病名称与一条或者多条诊断依据;
基于每条记录建立所述诊断依据配置文件。
在一些实施例中,其中,所述基于所述第一医学信息和第二医学信息的对比,得到分析结果,包括:
遍历所提取的实体;
将每一实体所包含的第一医学信息与第二医学信息做分别对比;
当第一医学信息与第二医学信息所包含的症状信息不匹配的情况下,输出分析结果为将该实体排除在所述医学数据的诊断依据之外。
在一些实施例中,其中,所述基于所述第一医学信息和第二医学信息的对比,得到分析结果,还包括:
当第一医学信息与第二医学信息所包含的症状信息匹配,并且所述第一医学信息与第二医学信息所包含的部位信息匹配,输出分析结果为将该实体纳入所述医学数据的诊断依据。
在一些实施例中,其中,所述医学数据的生成方式,包括:
基于原始录入的文本而生成;和/或
基于AI算法识别而生成。
根据本公开的方案之一,提供医学数据的分析装置,包括:
获取单元,其配置为用于获取医学数据;
提取模块,其配置为用于提取所述医学数据中的实体,所述实体包含各种第一医学信息;
确定模块,其配置为用于根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;
分析模块,其配置为用于基于所述第一医学信息和第二医学信息的对比,得到分析结果。
根据本公开的方案之一,提供计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:
根据上述的医学数据的分析方法。
本公开的各种实施例的医学数据的分析方法、医学数据的分析装置及计算机可读存储介质,通过获取医学数据;提取所述医学数据中的实体,所述实体包含各种第一医学信息;根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;基于所述第一医学信息和第二医学信息的对比,得到分析结果,从而能够将医学数据中实体以及判读结果作为输入对象,例如将病历中疾病信息的描述内容提取出来作为实体,并且以病历中对于疾病判断得出的疾病名称作为输入,对照于疾病信息表来分析疾病名称是否与实体所表达的内容相符,据此来分析医学数据的判读结果是否包含准确的疾病名称,以及所包含的诊断依据是否符合疾病信息的描述。本公开可以以病历中记录的疾病信息所有依据、症状、体征、检验、检查、原始病历文本(主诉、体格检查等)作为输入,输出原始病历是否包含诊断依据,准确地从病历文本中提取出诊断依据,分析结果的准确率在90%以上,从而提升医学研究、医疗诊治的精确性和效率。
应当理解,前面的大体描述以及后续的详细描述只是示例性的和说明性的,并非对所要求保护的本公开的限制。
附图说明
在未必按照比例绘制的附图中,不同视图中相似的附图标记可以表示相似的构件。具有字母后缀的相似附图标记或具有不同字母后缀的相似附图标记可以表示相似构件的不同实例。附图通常作为示例而非限制地图示各种实施例,并且与说明书和权利要求书一起用于解释所公开的实施例。
图1示出本公开实施例涉及的医学数据的分析方法的一种流程图;
图2示出本公开实施例涉及的医学数据的分析装置的一种架构图。
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。
本公开涉及关于医学数据的分析,用于得出医学数据精准性的分析结果。在医院的临床决策支持系统(CDSS)诊断系统中,给定医学数据,包括诸如病历文本(主诉、现病史、体格检查),以及患者诊断疾病,从这些医学数据中提取患者疾病的诊断依据是有非常重大的意义。在具体应用场景中,考虑到需要通过给定原始病历和某个诊断依据,从而判断原始病历中是否包含该诊断依据。一方面,在面对医学数据来自于临床医生的判读而形成文本的情况下,通过从病历文本中查找诊断依据的方法可以复核病历内容,并提醒医生下的临床诊断是否正确,另一方面,在面对医学数据来自于算法预测的识别和处理的情况下,通过诊断依据的方式可以辅助医生判断算法预测的诊断是否合理。
作为方案之一,如图1所示,本公开的实施例提供了一种医学数据的分析方法,包括:
S101:获取医学数据;
S102:提取所述医学数据中的实体,所述实体包含各种第一医学信息;
S103:根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;
S104:基于所述第一医学信息和第二医学信息的对比,得到分析结果。
本公开的发明构思之一,旨在将医学数据中实体以及判读结果作为输入对象,例如将病历中疾病信息的描述内容提取出来作为实体,并且以病历中对于疾病判断得出的疾病名称作为输入,对照于疾病信息表来分析疾病名称是否与实体所表达的内容相符,据此来分析医学数据的判读结果是否包含准确的疾病名称,以及所包含的诊断依据是否符合疾病信息的描述。
本公开各实施例中的医学数据,其所属的数据源并不需要特别加以限定,可以是历史数据,也可以是当前实时的数据。从数据格式上,可以是病历文本数据、视频数据、音频数据等等,只要能够通过识别手段,例如文本识别(例如,NLP识别,OCR识别等方式)提取其中的实体,以识别其中能够包含的医学信息,语音识别、视频图像识别等方式识别其中记载的诊断内容、手术内容等一些医学信息,抑或是通过字符拆分、词句拆分等方式识别的医学信息内容等。同时,本公开各实施例中的医学数据包含有判读结果,例如针对病历,其包含有疾病名称等信息。具体应用场景中,本公开的医学数据也可以是包含于病历、诊断书,其中包含有多个或者多种诊断信息、手术信息,可以用于人工、机器等通过标注或者解析方式进行相关医学信息的判读。
在一些实施例中,本公开涉及的医学数据,根据其生成方式不同,可以由多种生成方式实现数据生成。例如,各实施例中的医学数据的生成方式,包括:
基于原始录入的文本而生成;和/或
基于AI算法识别而生成。
具体的,可以医学数据可以由临床医生通过人工诊断记录生成,例如由临床医生做出的病历、诊断书、诊断报告等文本。也可以由AI算法识别生成的医学数据,包括病历、诊断书、诊断报告等。无论基于何种方式生成本实施例的医学数据,其都包含有可提取的实体,各实体包含有各种医学信息。同时,医学数据中具有疾病名称。也就是医学数据可以是来自给定病历文本,具有主诉、现病史、体格检查等信息,以及患者诊断疾病,可以是算法预测的诊断,也可以是临床医生下的诊断。
在一些实施例中,本公开的所述提取所述医学数据中的实体,所述实体包含各种第一医学信息,包括:
基于神经网络模型,解析所述医学数据;
根据表述包括症状、部位的内容,提取所述医学数据的实体。
具体的,本公开在实现过程中,可以通过神经网络模型提取本实施例的实体。在实现过程中,具体的神经网络模型不做特别限定,可以采用符合要求且架构匹配的神经网络模型实现。更优选的方案,可以进一步基于在预训练模型的基础上,通过适配的神经网络模型优化实体的提取精度。
针对提取实体,可以基于文本识别的方式,例如NLP(自然语言处理)等文本识别方式进行实体提取,并结合医学概念对实体进行分句、分类。更优选的,可以结合标准医学信息表,例如ICD各类信息表对实体进行解析,并在解析结果的基础上进行提取。
进一步的,通过解析诸如病历文本,提取其中的所有实体,包括病历中记录的症状、生命特征、身体部位等内容的数据信息作为实体。
在一些实施例中,本公开的所述提取所述医学数据中的实体,所述实体包含各种第一医学信息,还包括:
以状态和部位作为提取的实体的属性;
建立实体列表。
具体的,结合前述内容,从病历中提取出来所有的实体,各实体可能包含单一的第一医学信息,或者包含多种第一医学信息。在第一医学信息涉及病患症状、并发症状、病发部位等情况下,对每个实体进行属性处理,具体可以是每个实体包含两个属性,即状态和部位,以此属性将实体进行结构化处理,例如,处理为“症状,状态,部位”的记录格式,对症状属性通过离散值或者离散描述,例如用“阳性”或者“阴性”作为症状属性的标识方式。举例来说,从病历中提取以下实体:
实体1:(发热,阳性,无)
实体2:(咳嗽,阴性,无)
实体3:(肿大,阳性,扁桃体)
将上述提取的实体,以一定格式记录,并建立能够表征医学数据的本实施例的实体列表,为后续提取诊断数据提供对应统一的格式。
在一些实施例中,本公开的所述根据所述医学数据的判读结果,确定包含第二医学信息的信息范围,包括:
当所述判读结果对应于疾病名称的情况下,提取该疾病名称;
对照于包含有疾病名称和诊断依据的诊断依据配置文件,确定出诊断依据配置文件中与该疾病名称对应的诊断依据;
建立诊断依据待选表。
具体的,结合前述内容,本公开的医学数据包含有判读结果,例如包含有基于人工标注或者基于AI识别的疾病名称。
根据医学数据中的疾病名称,在诊断依据配置文件中检索并且对照该疾病对应的诊断依据。将诊断依据配置文件中与该疾病对应的记录筛选出来,作为本实施例的诊断依据待选表。
具体的,本公开的诊断依据配置文件的构建方式,包括:
建立疾病与诊断依据的关联;
以一定的格式记录每一条疾病名称与一条或者多条诊断依据;
基于每条记录建立所述诊断依据配置文件。
在各种实施例中,本公开的诊断依据配置文件,可以是遵照上述构建方式,可以通过人工标注建立,也可以通过深度学习模型基于大数据学习建立。例如,以人工标准的方式建立,可以是有专业医学人员梳理每个疾病可能需要关注的所有诊断依据,包括症状、生命特征等信息,以每个疾病名称为单元,按照一定的格式建立数据条目记录,例如按照“疾病名称,诊断依据1,诊断依据2,诊断依据3,诊断依据4……”这样的格式形成数据条目记录。又如,以深度学习模型基于大数据学习的方式建立,可以是通过专业医学人员标注疾病可能需要关注的所有诊断依据进行预训练,在此基础上通过海量医学数据的输入,构建深度学习模型学习相应的构建知识,从而形成诸如“疾病名称,诊断依据1,诊断依据2,诊断依据3,诊断依据4……”这样格式的数据条目记录。具体的诊断依据配置文件,以下示例一条数据条目:
“室间隔缺损,生长缓慢,体重不增,消瘦,喂养困难,活动后乏力,气促,多汗,心杂音,心前区膨隆”
其中,“室间隔缺损”作为疾病名称,“生长缓慢,体重不增,消瘦,喂养困难,活动后乏力,气促,多汗,心杂音,心前区膨隆”作为与“室间隔缺损”这一疾病所需要关注的所有诊断依据。
作为优选方案,本实施例中诊断依据配置文件中,可以将诊断依据汇总并做去重处理,每个症状、体征、检验/检查等配置一个或者多个相关术语库节点,以“中心词”“中心词+属性”,以及“正则”等这些方式配置文件。结合后文可知,正则至少包括:输入“症状、体征、检验/检查”等信息,以及原始病历,当信息能够与原始病历中关键字匹配,且“状态”属性为“阳性”,则输出肯定结论;如果不能相匹配,则输出否定结论。
作为进一步优选方案,本公开的所述基于所述第一医学信息和第二医学信息的对比,得到分析结果,包括:
遍历所提取的实体;
将每一实体所包含的第一医学信息与第二医学信息做分别对比;
当第一医学信息与第二医学信息所包含的症状信息不匹配的情况下,输出分析结果为将该实体排除在所述医学数据的诊断依据之外。
具体的,继续结合前述内容,一方面,遍历实体列表,将从病历中提取的所有实体作为对比分析的对象,另一方面,将通过本公开实施例建立的诊断依据待选表作为对比分析的对象。
结合上述关于实体列表中的实体记录格式,将实体列表中每一实体的“症状”与诊断依据待选表对比,判断该实体所对应的“症状”是否包含于诊断依据待选表中的症状,并且该实体的属性记录是否为“阳性”。如果该判断结果为“否”,那么说明该实体对应的内容与诊断依据待选表不匹配,也就是从医学概念上能够确定该实体不能作为这次病历的有效诊断依据。
进一步的,本公开的所述基于所述第一医学信息和第二医学信息的对比,得到分析结果,还包括:
当第一医学信息与第二医学信息所包含的症状信息匹配,并且所述第一医学信息与第二医学信息所包含的部位信息匹配,输出分析结果为将该实体纳入所述医学数据的诊断依据。
具体的,继续结合前述内容,如果判断为该实体所对应的“症状”包含于诊断依据待选表中的症状,那么进一步分析实体的另外一个属性,即“部位”。当判断实体的“部位”属性包含于诊断依据待选表中症状的部位中,那么说明该实体对应的内容与诊断依据待选表匹配,也就是从医学概念上能够确定该实体能够作为这次病历的有效诊断依据。与“症状”属性判断同理,当判断实体的“部位”属性没有包含于诊断依据待选表中症状的部位中,那么说明该实体对应的内容与诊断依据待选表不匹配,也就是从医学概念上能够确定该实体不能作为这次病历的有效诊断依据。
作为本公开的方案之一,如图2所示,本公开还提供了一种医学数据的分析装置,包括:
获取单元,其配置为用于获取医学数据;
提取模块,其配置为用于提取所述医学数据中的实体,所述实体包含各种第一医学信息;
确定模块,其配置为用于根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;
分析模块,其配置为用于基于所述第一医学信息和第二医学信息的对比,得到分析结果。
在一些实施例中,本公开的获取单元,可以为输入设备、屏幕截取装置、文本识别装置等,旨在实现能够获取基于原始录入的文本而生成;和/或基于AI算法识别而生成医学数据。
在一些实施例中,本公开的提取模块,可以进一步配置为:
基于神经网络模型,解析所述医学数据;
根据表述包括症状、部位的内容,提取所述医学数据的实体。
在一些实施例中,本公开的提取模块,可以进一步配置为:
以状态和部位作为提取的实体的属性;
建立实体列表。
在一些实施例中,本公开的确定模块,可以进一步配置为:
所述根据所述医学数据的判读结果,确定包含第二医学信息的信息范围,包括:
当所述判读结果对应于疾病名称的情况下,提取该疾病名称;
对照于包含有疾病名称和诊断依据的诊断依据配置文件,确定出诊断依据配置文件中与该疾病名称对应的诊断依据;
建立诊断依据待选表。
进一步的,所述诊断依据配置文件的构建方式,包括:
建立疾病与诊断依据的关联;
以一定的格式记录每一条疾病名称与一条或者多条诊断依据;
基于每条记录建立所述诊断依据配置文件。
在一些实施例中,本实施例的分析模块,可以进一步配置为:
遍历所提取的实体;
将每一实体所包含的第一医学信息与第二医学信息做分别对比;
当第一医学信息与第二医学信息所包含的症状信息不匹配的情况下,输出分析结果为将该实体排除在所述医学数据的诊断依据之外。
在一些实施例中,本实施例的分析模块,可以进一步配置为:
当第一医学信息与第二医学信息所包含的症状信息匹配,并且所述第一医学信息与第二医学信息所包含的部位信息匹配,输出分析结果为将该实体纳入所述医学数据的诊断依据。
具体来说,本公开的发明构思之一,旨在通过获取医学数据;提取所述医学数据中的实体,所述实体包含各种第一医学信息;根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;基于所述第一医学信息和第二医学信息的对比,得到分析结果,从而能够将医学数据中实体以及判读结果作为输入对象,例如将病历中疾病信息的描述内容提取出来作为实体,并且以病历中对于疾病判断得出的疾病名称作为输入,对照于疾病信息表来分析疾病名称是否与实体所表达的内容相符,据此来分析医学数据的判读结果是否包含准确的疾病名称,以及所包含的诊断依据是否符合疾病信息的描述。本公开可以以病历中记录的疾病信息所有依据、症状、体征、检验、检查、原始病历文本(主诉、体格检查等)作为输入,输出原始病历是否包含诊断依据,准确地从病历文本中提取出诊断依据,分析结果的准确率在90%以上,从而提升医学研究、医疗诊治的精确性和效率。
作为本公开的方案之一,本公开还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,主要实现根据上述的医学数据的分析方法,至少包括:
获取医学数据;
提取所述医学数据中的实体,所述实体包含各种第一医学信息;
根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;
基于所述第一医学信息和第二医学信息的对比,得到分析结果。
在一些实施例中,执行算机可执行指令处理器可以是包括一个以上通用处理设备的处理设备,诸如微处理器、中央处理单元(CPU)、图形处理单元(GPU)等。更具体地,该处理器可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。该处理器还可以是一个以上专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、片上系统(SoC)等。
在一些实施例中,计算机可读存储介质可以为存储器,诸如只读存储器(ROM)、随机存取存储器(RAM)、相变随机存取存储器(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、电可擦除可编程只读存储器(EEPROM)、其他类型的随机存取存储器(RAM)、闪存盘或其他形式的闪存、缓存、寄存器、静态存储器、光盘只读存储器(CD-ROM)、数字通用光盘(DVD)或其他光学存储器、盒式磁带或其他磁存储设备,或被用于储存能够被计算机设备访问的信息或指令的任何其他可能的非暂时性的介质等。
在一些实施例中,计算机可执行指令可以实现为多个程序模块,多个程序模块共同实现根据本公开中任何一项所述的医学影像的显示方法。
本公开描述了各种操作或功能,其可以实现为软件代码或指令或者定义为软件代码或指令。显示单元可以实现为在存储器上存储的软件代码或指令模块,其由处理器执行时可以实现相应的步骤和方法。
这样的内容可以是可以直接执行(“对象”或“可执行”形式)的源代码或差分代码(“delta”或“patch”代码)。这里描述的实施例的软件实现可以通过其上存储有代码或指令的制品提供,或者通过操作通信接口以通过通信接口发送数据的方法提供。机器或计算机可读存储介质可以使机器执行所描述的功能或操作,并且包括以可由机器(例如,计算显示设备、电子系统等)访问的形式存储信息的任何机制,例如可记录/不可记录介质(例如,只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪存显示设备等)。通信接口包括与硬连线、无线、光学等介质中的任何一种接口以与其他显示设备通信的任何机制,例如存储器总线接口、处理器总线接口、因特网连接、磁盘控制器等。通信接口可以通过提供配置参数和/或发送信号来配置以准备通信接口,以提供描述软件内容的数据信号。可以通过向通信接口发送一个或多个命令或信号来访问通信接口。
本公开的实施例的计算机可执行指令可以组织成一个或多个计算机可执行组件或模块。可以用这类组件或模块的任何数量和组合来实现本公开的各方面。例如,本公开的各方面不限于附图中示出的和本文描述的特定的计算机可执行指令或特定组件或模块。其他实施例可以包括具有比本文所示出和描述的更多或更少功能的不同的计算机可执行指令或组件。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本公开的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本公开的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本公开的示例性实施例,不用于限制本公开,本公开的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内,对本公开做出各种修改或等同替换,这种修改或等同替换也应视为落在本公开的保护范围内。
Claims (10)
1.医学数据的分析方法,包括:
获取医学数据;
提取所述医学数据中的实体,所述实体包含各种第一医学信息;
根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;
基于所述第一医学信息和第二医学信息的对比,得到分析结果。
2.根据权利要求1所述的方法,其中,所述提取所述医学数据中的实体,所述实体包含各种第一医学信息,包括:
基于神经网络模型,解析所述医学数据;
根据表述包括症状、部位的内容,提取所述医学数据的实体。
3.根据权利要求2所述的方法,其中,所述提取所述医学数据中的实体,所述实体包含各种第一医学信息,还包括:
以状态和部位作为提取的实体的属性;
建立实体列表。
4.根据权利要求1所述的方法,其中,所述根据所述医学数据的判读结果,确定包含第二医学信息的信息范围,包括:
当所述判读结果对应于疾病名称的情况下,提取该疾病名称;
对照于包含有疾病名称和诊断依据的诊断依据配置文件,确定出诊断依据配置文件中与该疾病名称对应的诊断依据;
建立诊断依据待选表。
5.根据权利要求4所述的方法,其中,所述诊断依据配置文件的构建方式,包括:
建立疾病与诊断依据的关联;
以一定的格式记录每一条疾病名称与一条或者多条诊断依据;
基于每条记录建立所述诊断依据配置文件。
6.根据权利要求1所述的方法,其中,所述基于所述第一医学信息和第二医学信息的对比,得到分析结果,包括:
遍历所提取的实体;
将每一实体所包含的第一医学信息与第二医学信息做分别对比;
当第一医学信息与第二医学信息所包含的症状信息不匹配的情况下,输出分析结果为将该实体排除在所述医学数据的诊断依据之外。
7.根据权利要求6所述的方法,其中,所述基于所述第一医学信息和第二医学信息的对比,得到分析结果,还包括:
当第一医学信息与第二医学信息所包含的症状信息匹配,并且所述第一医学信息与第二医学信息所包含的部位信息匹配,输出分析结果为将该实体纳入所述医学数据的诊断依据。
8.根据权利要求1-7中任一项所述的方法,其中,所述医学数据的生成方式,包括:
基于原始录入的文本而生成;和/或
基于AI算法识别而生成。
9.医学数据的分析装置,包括:
获取单元,其配置为用于获取医学数据;
提取模块,其配置为用于提取所述医学数据中的实体,所述实体包含各种第一医学信息;
确定模块,其配置为用于根据所述医学数据的判读结果,确定包含第二医学信息的信息范围;
分析模块,其配置为用于基于所述第一医学信息和第二医学信息的对比,得到分析结果。
10.一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:
根据权利要求1至8中任一项所述的医学数据的分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011606035.1A CN112712868A (zh) | 2020-12-30 | 2020-12-30 | 医学数据的分析方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011606035.1A CN112712868A (zh) | 2020-12-30 | 2020-12-30 | 医学数据的分析方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112712868A true CN112712868A (zh) | 2021-04-27 |
Family
ID=75547131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011606035.1A Pending CN112712868A (zh) | 2020-12-30 | 2020-12-30 | 医学数据的分析方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112712868A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582494A (zh) * | 2022-03-03 | 2022-06-03 | 数坤(北京)网络科技股份有限公司 | 诊断结果分析方法、装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100256991A1 (en) * | 2007-09-27 | 2010-10-07 | Canon Kabushiki Kaisha | Medical diagnosis support apparatus |
US20170323071A1 (en) * | 2016-05-05 | 2017-11-09 | James Stewart Bates | Systems and methods for generating medical diagnosis |
CN111292821A (zh) * | 2020-01-21 | 2020-06-16 | 上海联影智能医疗科技有限公司 | 一种医学诊疗系统 |
CN111681728A (zh) * | 2020-06-09 | 2020-09-18 | 北京嘉和海森健康科技有限公司 | 一种电子病历的内涵质控方法及装置 |
CN111863174A (zh) * | 2020-07-27 | 2020-10-30 | 北京颐圣智能科技有限公司 | 一种病历质量评估方法及计算设备 |
-
2020
- 2020-12-30 CN CN202011606035.1A patent/CN112712868A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100256991A1 (en) * | 2007-09-27 | 2010-10-07 | Canon Kabushiki Kaisha | Medical diagnosis support apparatus |
US20170323071A1 (en) * | 2016-05-05 | 2017-11-09 | James Stewart Bates | Systems and methods for generating medical diagnosis |
CN111292821A (zh) * | 2020-01-21 | 2020-06-16 | 上海联影智能医疗科技有限公司 | 一种医学诊疗系统 |
CN111681728A (zh) * | 2020-06-09 | 2020-09-18 | 北京嘉和海森健康科技有限公司 | 一种电子病历的内涵质控方法及装置 |
CN111863174A (zh) * | 2020-07-27 | 2020-10-30 | 北京颐圣智能科技有限公司 | 一种病历质量评估方法及计算设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582494A (zh) * | 2022-03-03 | 2022-06-03 | 数坤(北京)网络科技股份有限公司 | 诊断结果分析方法、装置、存储介质及电子设备 |
CN114582494B (zh) * | 2022-03-03 | 2022-11-15 | 数坤(北京)网络科技股份有限公司 | 诊断结果分析方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108831559B (zh) | 一种中文电子病历文本分析方法与系统 | |
CN107562732B (zh) | 电子病历的处理方法及系统 | |
US10929420B2 (en) | Structured report data from a medical text report | |
US10910100B2 (en) | System and method for generating descriptions of abnormalities in medical images | |
CN107644011B (zh) | 用于细粒度医疗实体提取的系统和方法 | |
CN117744654A (zh) | 基于机器学习的自然语言情境中数值数据的语义分类方法以及系统 | |
CN111291554B (zh) | 标注方法、关系抽取方法、存储介质和运算装置 | |
CN112541066B (zh) | 基于文本结构化的医技报告检测方法及相关设备 | |
AI-Atroshi et al. | Automated speech based evaluation of mild cognitive impairment and Alzheimer’s disease detection using with deep belief network model | |
CN112560400A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN111145903A (zh) | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 | |
Kaswan et al. | AI-based natural language processing for the generation of meaningful information electronic health record (EHR) data | |
Zhao et al. | Exploiting classification correlations for the extraction of evidence-based practice information | |
CN115424692A (zh) | 一种结构化电子病历的构建方法、电子设备及存储介质 | |
CN108735198A (zh) | 基于医学疾病数据的语音合成方法、装置及电子设备 | |
CN112749277B (zh) | 医学数据的处理方法、装置及存储介质 | |
CN112712868A (zh) | 医学数据的分析方法、装置及存储介质 | |
CN112735545A (zh) | 自训练方法、模型、处理方法、装置及存储介质 | |
CN113435200A (zh) | 实体识别模型训练、电子病历处理方法、系统及设备 | |
CN116168793A (zh) | 体检数据的处理分析方法及相关设备 | |
CN113111660A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN113362964A (zh) | 一种药品数据的处理方法、系统及其存储介质 | |
CN112735543A (zh) | 医学数据的处理方法、装置及存储介质 | |
Zubke et al. | Using openEHR archetypes for automated extraction of numerical information from clinical narratives | |
Rajathi et al. | Named Entity Recognition-based Hospital Recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |