CN117079781A - 医疗数据分析方法及装置、电子设备和存储介质 - Google Patents
医疗数据分析方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117079781A CN117079781A CN202310636418.0A CN202310636418A CN117079781A CN 117079781 A CN117079781 A CN 117079781A CN 202310636418 A CN202310636418 A CN 202310636418A CN 117079781 A CN117079781 A CN 117079781A
- Authority
- CN
- China
- Prior art keywords
- data
- analysis
- target medical
- quality
- medical data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000007405 data analysis Methods 0.000 title claims abstract description 34
- 238000004458 analytical method Methods 0.000 claims abstract description 151
- 238000003908 quality control method Methods 0.000 claims abstract description 27
- 238000010606 normalization Methods 0.000 claims description 56
- 238000004590 computer program Methods 0.000 claims description 13
- 238000011160 research Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 238000011157 data evaluation Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000007689 inspection Methods 0.000 description 7
- 238000013441 quality evaluation Methods 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/22—Social work or social welfare, e.g. community support activities or counselling services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Child & Adolescent Psychology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及一种医疗数据分析方法及装置、电子设备和存储介质,所述方法包括:基于医疗大数据质量控制平台,获取需要进行质量分析的目标医疗数据;对所述目标医疗数据进行分析,得到所述目标医疗数据的数据质量分析结果。通过本公开实施例,基于医疗大数据质量控制平台进行数据分析,可以快速获取准确、可靠的质量分析结果,提高数据质量分析效率,具备安全性、稳定性、可靠性、高效性和低成本等优点。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种医疗数据分析方法及装置、电子设备和存储介质。
背景技术
在医疗大数据平台开发的过程中,需要对平台涉及的医疗数据的质量进行规范性评估,以判断某一环节的医疗数据是否可以传递给下一环节。为了保证医疗数据的真实质量,避免低质量数据带来的误差,需要对医疗数据的质量进行分析和统计。
发明内容
本公开提出了一种医疗数据分析方法及装置、电子设备和存储介质的技术方案。
根据本公开的一方面,提供了一种医疗数据分析方法,包括:基于医疗大数据质量控制平台,获取需要进行质量分析的目标医疗数据;对所述目标医疗数据进行分析,得到所述目标医疗数据的数据质量分析结果。
在一种可能的实现方式中,所述对所述目标医疗数据进行分析,得到所述目标医疗数据的数据质量分析结果,包括:对所述目标医疗数据进行数据规范性分析,得到所述目标医疗数据的数据规范性分析结果;和/或,对所述目标医疗数据进行数据差异性分析,得到所述目标医疗数据的数据差异性分析结果。
在一种可能的实现方式中,所述对所述目标医疗数据进行数据规范性分析,得到所述目标医疗数据的数据规范性分析结果,包括:根据预设数据质量标准,生成数据规范性约束;利用所述数据规范性约束,对所述目标医疗数据进行数据规范性分析,得到所述数据规范性分析结果。
在一种可能的实现方式中,进行所述数据规范性分析的所述目标医疗数据包括:临床数据库、医院数据库、科研数据库、生信数据库、电子病历以及流行病数据库中的数据。
在一种可能的实现方式中,所述数据规范性分析结果包括:数据命名违规率、数据缺失率、数据类型违规率、数据表达违规率和孤儿数据率。
在一种可能的实现方式中,所述对所述目标医疗数据进行数据差异性分析,得到所述目标医疗数据的数据差异性分析结果,包括:针对所述目标医疗数据中任意两个相同属性的数据,进行比对和数据差异性分析,得到所述相同属性的数据之间的数据差异性分析结果。
在一种可能的实现方式中,所述数据差异性分析结果包括:数据缺失率。
在一种可能的实现方式中,所述方法还包括:根据所述数据质量分析结果,对所述目标医疗数据进行数据质量在线统计,得到所述目标医疗数据的数据质量统计结果。
在一种可能的实现方式中,所述对所述目标医疗数据进行数据质量在线统计,包括:对所述数据质量分析结果,进行多维度分析、时间维度分析、科室维度数据分析、孤儿数据评估和定向分析。
在一种可能的实现方式中,所述数据质量统计的内容包括:病例数和数据缺失率。
在一种可能的实现方式中,所述方法还包括:根据所述数据质量分析结果和所述数据质量统计结果,生成数据报告和预警报告。
根据本公开的一方面,提供了一种医疗数据分析装置,包括:数据获取模块,用于基于医疗大数据质量控制平台,获取需要进行质量分析的目标医疗数据;数据分析模块,用于对所述目标医疗数据进行分析,得到所述目标医疗数据的数据质量分析结果。
根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
在本公开实施例中,基于医疗大数据质量控制平台,在医疗大数据中进行选择并获取需要进行质量分析的目标医疗数据,对获取的目标医疗数据进行在线的质量分析,得到数据质量分析结果。医疗大数据质量控制平台具备安全性、稳定性、可靠性、高效性和低成本等优点,基于平台在线进行质量分析,可以快速获取准确、可靠的质量分析结果,提高数据质量分析效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出根据本公开实施例的一种医疗数据分析方法的流程图;
图2示出根据本公开实施例的一种医疗数据分析装置的框图;
图3示出根据本公开实施例的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
医疗大数据主要来自于医生对患者诊疗和治疗过程中产生的数据,包括患者的基本数据、电子病历、诊疗数据、医学影像报告数据、医学管理、经济数据、医疗设备和仪器数据等。以患者为中心构建的医疗大数据,不仅具有大数据的规模性、高速性、多样性和价值性(4V)的特点,还具有医疗领域固有的时序性、隐私性和不完整性等特征。
基于医疗大数据平台,医疗机构可以有效地聚合、分析、管理、利用医疗大数据,实现医疗大数据的有效管理和应用。《医院信息化建设应用技术指引(试行)》中指出医疗大数据平台主要包括数据交换汇集、数据存储、分布式计算和数据可视化。医疗大数据平台提供的大数据服务为数据挖掘和建模、数据应用服务和数据治理。开发一个高效、稳定运行的医疗大数据平台,运用大数据的分析和挖掘技术,可以帮助医疗机构提高生产力,改进护理水平,增强竞争力。同时,实现现有各种医疗数据库的数据共享与交换,让大数据处理更加便捷、快速、贴近用户,有效实现数据的流通及使用价值的增值。
在医疗大数据平台开发的过程中,需要对平台涉及的医疗数据的质量进行规范性评估,以判断某一环节的医疗数据是否可以传递给下一环节。为了保证医疗数据的真实质量,避免低质量数据带来的误差,需要对医疗数据的质量进行分析和统计。
相关技术中,数据质量评估主要依赖于人工检测,由平台开发的过程中各环节的开发人员负责检查当前环节相关的数据的质量。由于人工检测的数据质量评估标准不统一,很难保证数据的真实质量,而且,低质量数据带来的误差,也会影响数据分析师和数据运营师的工作。
本公开实施例提供了一种医疗数据分析方法,可以应用于上述医疗大数据质量控制平台,自动获取需要进行质量分析的目标医疗数据,并进行在线质量分析和统计,获得目标医疗数据的数据质量分析结果。
下面对本公开实施例提供的医疗数据分析方法进行详细说明。
图1示出根据本公开实施例的一种医疗数据分析方法的流程图。该医疗数据分析方法可以由终端设备或服务器等电子设备执行,终端设备可以为用户设备(UserEquipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(PersonalDigital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等,该医疗数据分析方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现,或者,可通过服务器执行该医疗数据分析方法。如图1所示,所述医疗数据分析方法包括:
在步骤S11中,基于医疗大数据质量控制平台,获取需要进行质量分析的目标医疗数据;
本公开实施例中,医疗大数据质量控制平台可以是用于对医疗数据的质量进行统计和分析,并能够通过Web网页展示和编辑的质量分析系统。
医疗大数据质量控制平台的配置包括医院信息、产品线信息、数据版本信息等内容,可以根据使用需求,在医疗大数据质量控制平台上选择需要进行数据质量分析的目标医疗数据。
本公开实施例中,目标医疗数据可以是医生对患者进行诊疗和治疗过程中产生的医疗数据,例如,患者的基本数据、电子病历、诊疗数据、医学影像报告、医学管理、经济数据、医疗设备和仪器数据等。
原始的医疗数据处理生成目标医疗数据时,可以根据目标医疗数据的不同应用场景,生成不同的数据层,在本公开实施例中,也被称为数据库、数据表。
基于医疗大数据质量控制平台,可以直接在医疗大数据质量控制平台中获取需要进行质量分析的目标医疗数据,也可以通过医疗大数据质量控制平台,获取来自医疗大数据工具平台中的其他平台的目标医疗数据。对于获取目标医疗数据的方法,本公开不做具体限定。
在步骤S12中,对目标医疗数据进行分析,得到目标医疗数据的数据质量分析结果。
基于医疗大数据质量控制平台,可以通过预设的质量评估规则,对获取到的目标医疗数据进行分析,得到目标医疗数据的数据质量分析结果。此外,还可以根据使用需求,管理并发布每个目标医疗数据的数据质量分析结果。
后文会结合本公开可能的实现方式,对数据质量在线分析的具体过程进行描述,此处不做赘述。
在本公开实施例中,能够基于医疗大数据质量控制平台,在医疗大数据中进行选择并获取需要进行质量分析的目标医疗数据,基于预设的质量评估规则,对获取的目标医疗数据进行在线的质量分析和统计,医疗大数据质量控制平台具备安全性、稳定性、可靠性、高效性和低成本,从而可以基于医疗大数据质量控制快速获取准确、可靠的数据质量分析结果,提高数据质量分析效率。
在一种可能的实现方式中,对目标医疗数据进行分析,得到目标医疗数据的数据质量分析结果,包括:对目标医疗数据进行数据规范性分析,得到目标医疗数据的数据规范性分析结果;和/或,对目标医疗数据进行数据差异性分析,得到目标医疗数据的数据差异性分析结果。
数据质量在线分析,可以包括对目标医疗数据进行数据规范性分析、数据差异性分析两个方面中的至少一个。
数据规范性分析,是通过建立统一的数据规范,进而基于统一的数据规范,对目标医疗数据进行分析。
数据差异性分析,可以包括传输层差异分析和数据版本差异分析。其中,传输层差异,可以指示目标医疗数据在不同的数据处理环节中,也就是在不同传输层间传输时产生的数据差异;数据版本差异,可以指示相同的目标医疗数据在不同数据版本的数据层中的显示差别,例如不同的数据版本之间,同一个数据层中相同字段的目标医疗数据的差异。
在一种可能的实现方式中,对目标医疗数据进行数据规范性分析,得到目标医疗数据的数据规范性分析结果,包括:根据预设数据质量标准,生成数据规范性约束;利用数据规范性约束,对目标医疗数据进行数据规范性分析,得到数据规范性分析结果。
基于预设数据质量标准,生成不同数据层间的目标医疗数据的数据规范性约束。数据规范性约束可以包括数据命名规范、数据类型规范、数据格式规范、数据标准一致性规范。
根据使用需求,针对目标医疗数据的某一字段,设置对应的数据规范性约束。例如,为患者性别字段设置数据规范性约束,即患者性别字段对应的数据命名包括:男性、女性、未知;为患者联系方式字段设置规范性数据约束,即患者联系方式字段的数据格式包括:长度为4-8位的电话号码、长度为11位的手机号码、不包含下划线和空格等特殊符号。
将数据规范性约束注入医疗大数据质量控制平台中的数据约束规则质检工具,以实现基于医疗大数据质量控制平台,对目标医疗数据进行规范性质检,得到数据规范性分析结果。
数据规范性分析结果可以通过不同方式在医疗大数据质量控制平台上进行查看。例如,数据分析师和数据运营师可以通过Web网页查看数据质量标签和质检结果,数据工程师可以通过命令行方式查看数据质量标签和质检结果。
在一种可能的实现方式中,进行数据规范性分析的目标医疗数据包括:临床数据库、医院数据库、科研数据库、生信数据库、电子病历以及流行病数据库中的数据。
数据规范性分析的内容,可以是根据不同应用场景生成的不同数据层中的目标医疗数据,包括来自于临床数据库(Clinical Data Repository,CDR)、医院数据库(HospitalData Repository,HDR)、科研数据库(Research Data Repository,RDR)、生信数据库(Bioinformatics Data Repository,BDR)、电子病历(Electronic Medical Record,EMR)以及流行病数据库(Epidemic Data Repository,EDR)中的部分或全部医疗数据。
其中,临床数据库可以是各种收录医学临床信息的数据库,例如,临床试验数据库、药物临床试验数据库等;医院数据库可以是各种收录医院信息的数据库;科研数据库可以是各种收录医学相关的科研信息的数据库;生信数据库可以是各种收录生物信息学的数据库,例如核酸数据库、蛋白质数据库和专用数据库等;电子病历可以是医疗机构以患者的医疗信息为中心集成的数据库。例如数字化的患者病程记录、手术记录等;流行病数据库可以是各种收录生命医学和流行病学关系相关的数据库。
在一种可能的实现方式中,数据规范性分析结果包括:数据命名违规率、数据缺失率、数据类型违规率、数据表达违规率和孤儿数据率。
对目标医疗数据进行数据规范性分析时,根据前述生成的每一个数据规范性约束,都可以确定对应的数据规范性分析结果,包括数据命名违规率、数据缺失率、数据类型违规率、数据表达违规率和孤儿数据率。
其中,数据命名违规率,可以指示目标医疗数据中出现数据命名违规的数据占总数据的概率;数据缺失率,可以指示目标医疗数据中缺失具体内容的数据占总数据的概率;数据类型违规率,可以指示目标医疗数据中出现数据类型违规的数据占总数据的概率;数据表达违规率,可以指示目标医疗数据中数据表达方式违规的数据占总数据的概率;孤儿数据率,可以指示目标医疗数据中与原始数据不相关的新增数据占总数据的概率。
示例性的,可以根据数据命名规范,对每一个目标医疗数据都判断数据命名是否符合规范,分别统计符合和不符合命名规范的目标医疗数据的数量,确定数据命名违规率。
在确定目标医疗数据的数据规范性分析结果之后,可以根据数据规范性分析结果,对目标医疗数据打上质量标签,以使得可以根据质量标签统计得到质检结果。
此外,还可以将质检结果传输到后台数据中心,生成规范性数据报告,供数据工程师和数据平台运营人员查看分析。其中,数据中心可以是存储着应用前端所需使用的数据的数据库,或者医疗大数据工具平台的服务器,对于将质检结果传输到后台数据中心的方法,可以是异步传输,也可以是其他传输方式,本公开实施例对此不做具体限定。
在一种可能的实现方式中,对目标医疗数据进行数据差异性分析,得到目标医疗数据的数据差异性分析结果,包括:针对目标医疗数据中任意两个相同属性的数据,进行比对和数据差异性分析,得到相同属性的数据之间的数据差异性分析结果。
在不同传输层或者不同数据版本的目标医疗数据中,选择任意两个相同属性的数据,比对这两个数据的内容,进行数据差异性分析,得到这两个目标医疗数据的数据差异性分析结果。
示例性的,电子病历中记录有患者基本信息,患者基本信息中包含有患者体重这一字段,可以在两个不同版本的电子病历中,选择患者体重进行比对,确定两个版本的电子病历中患者体重这一字段,是否都记录了数据,并分析患者体重的数据变化,确定数据差异性分析结果。
对不同传输层或者数据版本中,所有相同属性的目标医疗数据都可以进行上述数据差异性分析,得到所有目标医疗数据的数据差异性分析结果。
在一种可能的实现方式中,数据差异性分析结果包括:数据缺失率。
在一个数据层的目标医疗数据中,可能会因多种原因产生数据缺失,导致这个数据层是不完整的。为了确定目标医疗数据的完整性,可以在数据差异性分析中确定数据缺失率,通过数据缺失率指示目标医疗数据中缺失具体内容的数据占总数据的概率。
在一种可能的实现方式中,该医疗数据分析方法还包括:根据数据质量分析结果,对目标医疗数据进行数据质量在线统计,得到目标医疗数据的数据质量统计结果。
完成前述对目标医疗数据的数据质量分析过程后,可以根据获得的数据质量分析结果,任意选择目标医疗数据,例如某个数据层、就诊类型、科室和时间的数据,并对选择的数据进行数据质量统计,得到目标医疗数据的数据质量统计结果。
在一种可能的实现方式中,对目标医疗数据进行数据质量在线统计,包括:对数据质量分析结果,进行多维度分析、时间维度分析、科室维度数据分析、孤儿数据评估和定向分析。
对数据质量分析结果进行统计的方法可以是各种数据统计分析方法,包括:通过多个不同的指标或维度对比的多维度分析;以时间变化作为描述和表达变量的尺度的时间维度分析;以医院科室功能划分作为描述和表达变量的尺度的科室维度分析;对过往版本中新增的、与其他数据不相关的新增数据的孤儿数据评估;以及针对特定目标医疗数据或数据质量分析结果的定向分析。
在一种可能的实现方式中,数据质量统计的内容包括:病例数和数据缺失率。
可以根据使用需求,选择数据质量分析结果中的部分或全部结果,包括病例数和数据缺失率,对目标医疗数据进行数据质量统计。
在一种可能的实现方式中,该医疗数据分析方法还包括:根据数据质量分析结果和数据质量统计结果,生成数据报告和预警报告。
完成上述过程后,根据使用需求,选择医疗数据质量分析结果和数据质量统计结果中的全部或部分结果,生成并发布数据报告。
示例性的,可以根据主题、数据命名违规率、数据缺失率、数据类型违规率和数据表达违规率等内容生成数据报告,并发布在医疗大数据质量控制平台。
针对上述目标医疗数据的数据质量分析过程和数据质量统计过程,统计医疗大数据质量控制平台在每个过程中出现错误的记录,获得错误记录表,记录表中可以包含患者医疗信息,例如医嘱指标、就诊主题等,以及医疗大数据质量控制平台的运行情况信息,例如进行数据质量分析的目标医疗数据的数量、平台运行错误率、数据详情等。
此外,还可以统计数据质量分析过程中,数据质量评估规则的实际应用情况,例如生成的规则总数、正在进行数据质量分析的目标医疗数据个数、数据质量分析失败的次数、成功生成有效的数据质量分析结果的个数等内容。
根据统计获得的错误记录表,以及数据质量评估规则的实际应用情况,生成并发布预警报告。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了医疗数据分析装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种医疗数据分析方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
图2示出根据本公开实施例的一种医疗数据分析装置的框图。如图2所示,该装置200包括:
数据获取模块201,用于基于医疗大数据质量控制平台,获取需要进行质量分析的目标医疗数据;
数据分析模块202,用于对目标医疗数据进行分析,得到目标医疗数据的数据质量分析结果。
在一种可能的实现方式中,数据分析模块202,用于:对目标医疗数据进行数据规范性分析,得到目标医疗数据的数据规范性分析结果;和/或,对目标医疗数据进行数据差异性分析,得到目标医疗数据的数据差异性分析结果。
在一种可能的实现方式中,数据分析模块202,具体用于:根据预设数据质量标准,生成数据规范性约束;利用数据规范性约束,对目标医疗数据进行数据规范性分析,得到数据规范性分析结果。
在一种可能的实现方式中,进行数据规范性分析的目标医疗数据包括:临床数据库、医院数据库、科研数据库、生信数据库、电子病历以及流行病数据库中的数据。
在一种可能的实现方式中,数据规范性分析结果包括:数据命名违规率、数据缺失率、数据类型违规率、数据表达违规率和孤儿数据率。
在一种可能的实现方式中,数据分析模块202,还用于:针对目标医疗数据中任意两个相同属性的数据,进行比对和数据差异性分析,得到相同属性的数据之间的数据差异性分析结果。
在一种可能的实现方式中,数据差异性分析结果包括:数据缺失率。
在一种可能的实现方式中,装置200还包括:数据统计模块;
数据统计模块,用于根据数据质量分析结果,对目标医疗数据进行数据质量在线统计,得到目标医疗数据的数据质量统计结果。
在一种可能的实现方式中,数据统计模块,具体用于:对数据质量分析结果,进行多维度分析、时间维度分析、科室维度数据分析、孤儿数据评估和定向分析。
在一种可能的实现方式中,数据质量统计的内容包括:病例数和数据缺失率。
在一种可能的实现方式中,装置200还包括:报告生成模块;
报告生成模块,用于根据数据质量分析结果和数据质量统计结果,生成数据报告和预警报告。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
图3示出根据本公开实施例的一种电子设备的框图。如图3所示,电子设备1900可以被提供为一服务器或终端设备。参照图3,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(Mac OSXTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (14)
1.一种医疗数据分析方法,其特征在于,包括:
基于医疗大数据质量控制平台,获取需要进行质量分析的目标医疗数据;
对所述目标医疗数据进行分析,得到所述目标医疗数据的数据质量分析结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标医疗数据进行分析,得到所述目标医疗数据的数据质量分析结果,包括:
对所述目标医疗数据进行数据规范性分析,得到所述目标医疗数据的数据规范性分析结果;和/或,
对所述目标医疗数据进行数据差异性分析,得到所述目标医疗数据的数据差异性分析结果。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标医疗数据进行数据规范性分析,得到所述目标医疗数据的数据规范性分析结果,包括:
根据预设数据质量标准,生成数据规范性约束;
利用所述数据规范性约束,对所述目标医疗数据进行数据规范性分析,得到所述数据规范性分析结果。
4.根据权利要求3所述的方法,其特征在于,进行所述数据规范性分析的所述目标医疗数据包括:临床数据库、医院数据库、科研数据库、生信数据库、电子病历以及流行病数据库中的数据。
5.根据权利要求3或4所述的方法,其特征在于,所述数据规范性分析结果包括:数据命名违规率、数据缺失率、数据类型违规率、数据表达违规率和孤儿数据率。
6.根据权利要求2至5任意一项所述的方法,其特征在于,所述对所述目标医疗数据进行数据差异性分析,得到所述目标医疗数据的数据差异性分析结果,包括:
针对所述目标医疗数据中任意两个相同属性的数据,进行比对和数据差异性分析,得到所述相同属性的数据之间的数据差异性分析结果。
7.根据权利要求6所述的方法,其特征在于,所述数据差异性分析结果包括:数据缺失率。
8.根据权利要求1至7任意一项所述的方法,其特征在于,所述方法还包括:
根据所述数据质量分析结果,对所述目标医疗数据进行数据质量在线统计,得到所述目标医疗数据的数据质量统计结果。
9.根据权利要求8所述的方法,其特征在于,所述对所述目标医疗数据进行数据质量在线统计,包括:
对所述数据质量分析结果,进行多维度分析、时间维度分析、科室维度数据分析、孤儿数据评估和定向分析。
10.根据权利要求8或9所述的方法,其特征在于,所述数据质量统计的内容包括:病例数和数据缺失率。
11.根据权利要求1至10任意一项所述的方法,其特征在于,所述方法还包括:
根据所述数据质量分析结果和所述数据质量统计结果,生成数据报告和预警报告。
12.一种医疗数据分析装置,其特征在于,包括:
数据获取模块,用于基于医疗大数据质量控制平台,获取需要进行质量分析的目标医疗数据;
数据分析模块,用于对所述目标医疗数据进行分析,得到所述目标医疗数据的数据质量分析结果。
13.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至11中任意一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至11中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310636418.0A CN117079781A (zh) | 2023-05-31 | 2023-05-31 | 医疗数据分析方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310636418.0A CN117079781A (zh) | 2023-05-31 | 2023-05-31 | 医疗数据分析方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117079781A true CN117079781A (zh) | 2023-11-17 |
Family
ID=88704970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310636418.0A Withdrawn CN117079781A (zh) | 2023-05-31 | 2023-05-31 | 医疗数据分析方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117079781A (zh) |
-
2023
- 2023-05-31 CN CN202310636418.0A patent/CN117079781A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10769228B2 (en) | Systems and methods for web analytics testing and web development | |
CN109062780B (zh) | 自动化测试用例的开发方法及终端设备 | |
US8151248B1 (en) | Method and system for software defect management | |
US20130086556A1 (en) | System for ensuring comprehensiveness of requirements testing of software applications | |
CN109634941B (zh) | 医疗数据处理方法、装置、电子设备及存储介质 | |
CN111563257B (zh) | 数据检测方法及装置、计算机可读介质及终端设备 | |
CN110866205B (zh) | 用于存储信息的方法和装置 | |
CN109614327B (zh) | 用于输出信息的方法和装置 | |
CN110647523A (zh) | 数据质量的分析方法及装置、存储介质、电子设备 | |
CN110990274A (zh) | 一种生成测试案例的数据处理方法、装置及系统 | |
CN105868956A (zh) | 一种数据处理方法及装置 | |
CN111666201A (zh) | 回归测试方法、装置、介质及电子设备 | |
CN110688111A (zh) | 业务流程的配置方法、装置、服务器和存储介质 | |
CN112445866A (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
US10241957B2 (en) | Workload patterns for realistic load recreation in performance testing | |
CN114201615B (zh) | 基于数据快照的科研数据变动回顾方法及服务器 | |
CN109558619B (zh) | 基于建筑信息模型的数据处理方法、终端及可读存储介质 | |
CN114118985A (zh) | 资源信息管理方法、系统、介质及计算机设备 | |
CN111488386A (zh) | 数据查询方法和装置 | |
CN116185393A (zh) | 接口文档的生成方法、装置、设备、介质及产品 | |
CN116737535A (zh) | 接口测试方法、装置、计算机设备和存储介质 | |
CN117079781A (zh) | 医疗数据分析方法及装置、电子设备和存储介质 | |
US11307850B2 (en) | Efficient change analysis in poly-lingual corpus hierarchies | |
CN115129575A (zh) | 一种代码覆盖结果生成方法及装置 | |
CN112379967A (zh) | 模拟器检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20231117 |
|
WW01 | Invention patent application withdrawn after publication |