CN113488182A - 多源异构医疗化验检查数据处理方法、装置、设备和介质 - Google Patents
多源异构医疗化验检查数据处理方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN113488182A CN113488182A CN202110571974.5A CN202110571974A CN113488182A CN 113488182 A CN113488182 A CN 113488182A CN 202110571974 A CN202110571974 A CN 202110571974A CN 113488182 A CN113488182 A CN 113488182A
- Authority
- CN
- China
- Prior art keywords
- data
- standardized
- measurement unit
- establishing
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000005259 measurement Methods 0.000 claims abstract description 78
- 238000013499 data model Methods 0.000 claims abstract description 48
- 238000007689 inspection Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000003556 assay Methods 0.000 claims abstract description 40
- 238000013507 mapping Methods 0.000 claims abstract description 38
- 201000010099 disease Diseases 0.000 claims abstract description 35
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims description 57
- 238000007619 statistical method Methods 0.000 claims description 13
- 239000003814 drug Substances 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 7
- 238000013523 data management Methods 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000011179 visual inspection Methods 0.000 claims description 5
- 230000001684 chronic effect Effects 0.000 abstract description 9
- 208000031662 Noncommunicable disease Diseases 0.000 abstract description 8
- 238000007726 management method Methods 0.000 description 11
- 238000011282 treatment Methods 0.000 description 8
- 238000003745 diagnosis Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000009533 lab test Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 206010020772 Hypertension Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 208000029078 coronary artery disease Diseases 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Automatic Analysis And Handling Materials Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本申请涉及数据处理技术领域,具体来说,本申请涉及多源异构医疗化验检查数据处理方法、装置、设备及介质。所述方法包括:获取预设疾病化验检查指标的多源自定义数据集;对所述多源自定义数据集进行预处理,形成规范化原始数据;将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;建立所述规范化原始数据字段与标准化字段的多对一映射;对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。本申请所述方法可减少在数据处理时对人工操作的依赖,提升对常见慢性非传染性疾病多源异构化验检查数据处理的效率。
Description
技术领域
本申请涉及数据处理技术领域,更为具体来说,本申请涉及多源异构医疗化验检查数据处理方法、装置、设备和介质。
背景技术
化验检查数据是健康医疗数据的核心类型之一,具有数量庞大、类别繁多和持续激增的特点。鉴于医疗专业的特殊性,传统数据融合技术难以直接应用于多源异构化验检查数据的批量标准化融合。在利用医疗大数据开展医院管理、区域信息平台建设、患者随访管理、科学研究等等多个方面,多源异构化验检查数据的高效标准化整合是亟待突破的技术瓶颈之一。
以常见的重大慢性非传染性疾病(糖尿病、高血压、冠心病、慢性肾脏病)为例,上述疾病的发生发展过程常相互促进、互为因果,已经成为我国医疗卫生体系的重大负担。上述疾病的诊疗管理需要长期的综合一体化防治,而在该过程中,相关重点化验检查结果的多源共享则是推动疾病分级诊疗和管理必不可少的环节。随着患病率持续增加,借助智能化手段进行上述疾病的一体化管理已成为重要的趋势与手段。然而截至目前,在利用智能化手段改善上述疾病诊疗和管理的问题上,化验检查数据的标准化和融合共享工作局限于单中心或少数中心的专病或专题,分析量相对较小,人工依赖程度高,病种兼容程度低,难以拓展应用于大批量的多源异构化验检查数据的整合处理,也尚缺乏在处理过程中覆盖上述常见重大慢性非传染性疾病的通用数据模型。
发明内容
为实现上述技术目的,本申请提供了一种多源异构医疗化验检查数据的处理方法,包括以下步骤:
获取预设疾病化验检查指标的多源自定义数据集;
对所述多源自定义数据集进行预处理,形成规范化原始数据;
将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
建立所述规范化原始数据字段与标准化字段的多对一映射;
对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
优选地,所述方法还包括:
根据所述通用数据模型,绘制结果数据分布图,以及建立多源异构化验检查数据的数据统计分析和可视化查验模块;
结合所述通用数据模型中每个化验检查数据包括的参考范围,查找异常数据。
优选地,所述方法还包括:
获取通过所述数据统计分析和可视化查验模块对所述通用数据模型的查验结果;
基于所述通用数据模型的查验结果,对所述通用数据模型进行优化处理。
具体地,建立所述规范化原始数据字段与标准化字段的多对一映射,包括:
从所述规范化原始数据中获取文本语义相同的多个指标名称;
确定所述多个指标名称对应的标准化指标名称,建立所述多个指标名称与所述标准化指标名称之间的映射关系;
所述标准化指标名称是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。
优选地,所述方法还包括:
分别获取文本语义相同的每个指标名称对应的化验检查数据中包括的计量单位;
确定所述每个指标名称对应的计量单位对应的标准化计量单位,建立所述每个指标名称对应的计量单位与所述标准化计量单位之间的映射关系;
所述标准化计量单位是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。
进一步地,所述对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型,包括:
根据标准化指标名称字段对应的每个化验检查数据中包括的计量单位及其对应的标准化计量单位,确定所述每个化验检查数据的计量单位换算为所述标准化计量单位所需的标准化系数;所述标准化系数是根据化验项目的理化性质、检验方法中的一种或多种来确定的。
根据所述每个化验检查数据的计量单位对应的所述标准化系数,分别将所述每个化验检查数据的检验结果换算为以所述标准化计量单位进行计量的检验结果,得到通用数据模型。
选择性地,所述多源异构医疗化验检查数据的处理方法还包括:
根据医疗机构信息系统中实验室检查数据管理模块的字段变动对所述通用数据模型进行更新配置。
本发明第二方面提供了一种多源异构医疗化验检查数据处理装置,所述装置包括:
获取模块,用于获取预设疾病化验检查指标的多源自定义数据集;
预处理模块,用于对所述多源自定义数据集进行预处理,形成规范化原始数据;
字段划分模块,用于将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
标准化映射建立模块,用于建立所述规范化原始数据字段与标准化字段的多对一映射;
计量单位统一模块,用于对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
本发明第三方面提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如下步骤:
获取预设疾病化验检查指标的多源自定义数据集;
对所述多源自定义数据集进行预处理,形成规范化原始数据;
将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
建立所述规范化原始数据字段与标准化字段的多对一映射;
对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
本发明第四方面提供了一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如下步骤:
获取预设疾病化验检查指标的多源自定义数据集;
对所述多源自定义数据集进行预处理,形成规范化原始数据;
将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
建立所述规范化原始数据字段与标准化字段的多对一映射;
对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
本申请的有益效果为:本发明方法中通用数据模型覆盖了常见重大慢性非传染性疾病,可用于上述疾病关键化验检查数据的高效标准化整合,满足相关领域的管理或临床应用需求。与此同时,本发明可以在专病领域针对性微调后快速扩展应用于更广泛的疾病范畴,为相关从业人员建立了工作模板,有力降低了相关从业人员的工作量,提升了常见重大慢性非传染性疾病相关多源异构化验检查数据标准化整合的准确性和时效性,优化了医疗系统管理、区域信息平台建设、疾病长期诊疗管理等方面的效率的标准性。总之,本发明可减少在对多源异构数据处理时对人工操作的依赖,提升对常见慢性非传染性疾病多源异构化验检查数据处理的效率。
附图说明
图1示出了本申请实施例1的方法流程示意图;
图2示出了本申请实施例2的方法流程示意图;
图3示出了本申请实施例2的多对一映射示意图;
图4示出了本申请实施例2的联动计算示意图;
图5示出了本申请实施例3的装置结构示意图;
图6示出了本申请一实施例所提供的一种电子设备的结构示意图;
图7示出了本申请一实施例所提供的一种存储介质的示意图。
具体实施方式
以下,将参照附图来描述本申请的实施例。但是应该理解的是,这些描述只是示例性的,而并非要限制本申请的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本申请的概念。对于本领域技术人员来说显而易见的是,本申请可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本申请发生混淆,对于本领域公知的一些技术特征未进行描述。
应予以注意的是,这里所使用的术语仅是为了描述具体实施例,而非意图限制根据本申请的示例性实施例。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式。此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组合。
现在,将参照附图更详细地描述根据本申请的示例性实施例。然而,这些示例性实施例可以多种不同的形式来实施,并且不应当被解释为只限于这里所阐述的实施例。附图并非是按比例绘制的,其中为了清楚表达的目的,可能放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
实施例1:
本实施例实施了一种多源异构医疗化验检查数据的处理方法,如图1 所示,包括以下步骤:
S1、获取预设疾病化验检查指标的多源自定义数据集;
S2、对所述多源自定义数据集进行预处理,形成规范化原始数据;
S3、将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
S4、建立所述规范化原始数据字段与标准化字段的多对一映射;
S5、对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
优选地,所述方法还包括:
根据所述通用数据模型,绘制结果数据分布图,以及建立多源异构化验检查数据的数据统计分析和可视化查验模块;
结合所述通用数据模型中每个化验检查数据包括的参考范围,查找异常数据。
优选地,所述方法还包括:
获取通过所述数据统计分析和可视化查验模块对所述通用数据模型的查验结果;
基于所述通用数据模型的查验结果,对所述通用数据模型进行优化处理。
具体地,建立所述规范化原始数据字段与标准化字段的多对一映射,包括:
从所述规范化原始数据中获取文本语义相同的多个指标名称;
确定所述多个指标名称对应的标准化指标名称,建立所述多个指标名称与所述标准化指标名称之间的映射关系;
所述标准化指标名称是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。
优选地,所述方法还包括:
分别获取文本语义相同的每个指标名称对应的化验检查数据中包括的计量单位;
确定所述每个指标名称对应的计量单位对应的标准化计量单位,建立所述每个指标名称对应的计量单位与所述标准化计量单位之间的映射关系;
所述标准化计量单位是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。
进一步地,所述对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型,包括:
根据标准化指标名称字段对应的每个化验检查数据中包括的计量单位及其对应的标准化计量单位,确定所述每个化验检查数据的计量单位换算为所述标准化计量单位所需的标准化系数,所述标准化系数是基于检验项目的理化性质、检验技术中的一种或多种来确定的;
根据所述每个化验检查数据的计量单位对应的所述标准化系数,分别将所述每个化验检查数据的检验结果换算为以所述标准化计量单位进行计量的检验结果,得到通用数据模型。
选择性地,所述多源异构医疗化验检查数据的处理方法还包括:
根据医疗机构信息系统中实验室检查数据管理模块的字段变动对所述通用数据模型进行更新配置。
实施例2:
本实施例实施了一种多源异构医疗化验检查数据的处理方法,包括以下步骤:
获取预设疾病化验检查指标的多源自定义数据集;
对所述多源自定义数据集进行预处理,形成规范化原始数据;
将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
建立所述规范化原始数据字段与标准化字段的多对一映射;
对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
具体地,预设疾病选取常见的重大慢性非传染性疾病中的糖尿病、高血压、冠心病和慢性肾脏。获取预设疾病化验检查指标的多源自定义数据集时,如图2所示,配置不同医疗机构信息系统中实验室检查数据管理模块,形成目标通用数据模型所需的自定义数据集。具体来说,整合不同管理模块的多源数据,将各数据源分别自定义的业务数据转化为通用数据模型所需的数据类型,形成常见重大慢性非传染性疾病重点化验检查指标的自定义数据集。数据集字段中涉及机构代码、项目代码(机构特异化,字符串)、指标名称中文名称(自由文本,字符串)、指标名称英文名称(自由文本,字符串)、计量单位(自由文本,字符串)、参考范围(数字+ 字符串)、检验结果(数字+字符串)。
再如图2所示,对所述多源自定义数据集进行预处理时,采用模式匹配完成异构数据相同字段的映射,清理无效数据。化验检查数据分布在不同的医疗机构中,往往采用不同的数据模式进行描述,首先在数据集成之前利用模式匹配完成不同数据模式属性之间的映射关系,建立化验检查数据的统一模式,完成原始数据整合。利用SQL语言获取原始化验数据中可用于鉴别化验项目语义的信息,包括指标名称、计量单位等。由于数据采集遗漏、设备故障等原因,原始数据中存在一些无效信息,例如化验项目名称为空的记录,需要对其进行清理,剔除无效数据。
接着将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;该字段分区基于疾病诊疗管理过程中获取和利用化验检查项目的逻辑层级。对前述原始自定义数据集的字段进行归类处理,选取核心重点字段,按照实践所需的逻辑层级分别建立的映射或处理规则还可以根据具体实践需求相应增加。
进一步地,对前述疾病相关化验检查数据进行名称标准化,分别建立原始数据字段与标准化字段的多对一映射。名称标准化的多对一映射的建立严格基于疾病的发生发展机理和真实诊疗实践现状,基于原始数据集中采集的真实诊疗实践应用项目名称字段建立差异数据池,基于疾病诊断学、检验医学和单病种国际指南确定化验检查项目的标准化名称,建立差异数据池中对应字段与标准化名称的多对一映射,以SQL方法实现,图3 为多对一映射示意图。关于指标名称的多对一映射的步骤为:从所述规范化原始数据中获取文本语义相同的多个指标名称;确定所述多个指标名称对应的标准化指标名称,建立所述多个指标名称与所述标准化指标名称之间的映射关系;所述标准化指标名称是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。关于计量单位的多对一映射的步骤为:分别获取文本语义相同的每个指标名称对应的化验检查数据中包括的计量单位;确定所述每个指标名称对应的计量单位对应的标准化计量单位,建立所述每个指标名称对应的计量单位与所述标准化计量单位之间的映射关系;所述标准化计量单位是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。本实施例中名称字段多对一映射是一个可以直接应用并随需求扩展的差异名称映射模板,本领域普通技术人员可以在不增加劳动的情况下直接应用,或适度微调后进行自定义应用,大大降低了相关从业人员从事相关工作时的劳动成本。
进一步地,对标准化名称对应数据计量单位字段分别建立基于标准化系数的可计算模块,扩展原始数据集到通用数据模型数据集名称字段的计量单位标准化计算模块,并联动计算检验结果字段,生成通用数据模型。针对待标准化整合的项目分别建设单位字段的可计算模块,待标准化项目的确立基于真实诊疗实践中不同检验技术对应检验物质对应的计量单位。标准化计量单位的选定基于该化验项目应用相关的诊断学、检验医学和国际指南知识。严格基于对应检验物质的理化性质和所用检验技术逐一计算标准化系数,分别建立参考单位对应字段的可计算模块,过程以SQL方法实现。其中,所述标准化系数是基于检验项目的理化性质、检验技术中的一种或多种来确定的。
计量单位字段的可计算模块是一系列相同化验检查项目不同指标单位的映射与标准化系数计算的联合模块。针对同一化验检查项目,根据诊断学、检验医学和国际指南知识确立标准化目标单位,依据不同检验项目对应检验物质的理化性质逐一计算标准化系数,按照标准化系数进行化验检查项目结果的联动计算,如图4所示,同步实现指标单位的标准化与对应结果的整合。具体步骤为:根据标准化指标名称字段对应的每个化验检查数据中包括的计量单位及其对应的标准化计量单位,确定所述每个化验检查数据的计量单位换算为所述标准化计量单位所需的标准化系数;根据所述每个化验检查数据的计量单位对应的所述标准化系数,分别将所述每个化验检查数据的检验结果换算为以所述标准化计量单位进行计量的检验结果,得到通用数据模型。这里的通用模型可以选择为粗颗粒通用数据模型,待后续再不断精化或优化,即根据医疗机构信息系统中实验室检查数据管理模块的字段变动进行所述通用数据模型的更新配置。医疗机构信息系统中的实验室检查数据管理模块关键字段发生变化时,原始自定义数据集涉及的关键字段同步发生变化,标准化内容及规则根据前述步骤做出相应匹配修改,定期完成前述通用数据模型的配置更新。
作为可变换的实施方式,本实施例还可基于前述数据集相应字段的映射规则和单位标准化计算结果数据检验参数,绘制结果数据分布图,同时建立多源异构化验检查数据的数据统计分析和可视化查验模块;结合所述通用数据模型中每个化验检查数据包括的参考范围,查找异常数据。其中,化验检查项目的数据统计分析时,对同一化验检查项目的不同数据形式 (定性数据/定量数据)分别保留,按照各自特性进行查验分析;绘制不同化验检查项目的结果数据分布图,分布图形式依据需求自定义选择;通过数据统计分析和可视化查验模块实现标准化整合数据结果的双重查验和质量控制,及时发现异常数据,并为进一步精化标准化整合规则提供依据。该过程以SQL形式实现,数据统计分析和可视化查验模块是结果数据统计检验和可视化输出的联合模块。数据统计分析时,定性和定量数据分别独立分析,对同一检验项目中定性定量数据共存的情况,实行不同类别数据的平行分析,使标准化整合数据保留的信息量最大化。根据数据特点与查验需求绘制结果字段的数据分布图,图形绘制需求和可视化方式以 SQL形式实现,同时产生相应功能模块。本领域相关普通技术人员可以在不付出额外劳动的情况下实现结果数据统计分析和可视化图形分析的双重查验,可以通过适度微调完成该模块在不同需求下的自定义应用。
作为可变换的实施方式,本实施例还包括:获取通过所述数据统计分析和可视化查验模块对所述通用数据模型的查验结果;基于所述通用数据模型的查验结果,对所述通用数据模型进行优化处理。
实施例3:
本实施例实施了一种多源异构医疗化验检查数据的处理装置,该装置用于执行上述任一实施例提供的多源异构医疗化验检查数据的处理方法,如图5所示,所述装置包括:
获取模块501,用于获取预设疾病化验检查指标的多源自定义数据集;
预处理模块502,用于对所述多源自定义数据集进行预处理,形成规范化原始数据;
字段划分模块503,用于将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
标准化映射建立模块504,用于建立所述规范化原始数据字段与标准化字段的多对一映射;
计量单位统一模块505,用于对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
接下来请参考图6,其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图6所示,所述电子设备2包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器 200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的多源异构医疗化验检查数据的处理方法。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述多源异构医疗化验检查数据的处理方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的多源异构医疗化验检查数据的处理方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的多源异构医疗化验检查数据的处理方法对应的计算机可读存储介质,请参考图7,其示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的多源异构医疗化验检查数据的处理方法。
所述计算机可读存储介质的例子还可以包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
需要说明的是:在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备有固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种多源异构医疗化验检查数据处理方法,其特征在于,包括以下步骤:
获取预设疾病化验检查指标的多源自定义数据集;
对所述多源自定义数据集进行预处理,形成规范化原始数据;
将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
建立所述规范化原始数据字段与标准化字段的多对一映射;
对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
2.根据权利要求1所述的多源异构医疗化验检查数据处理方法,其特征在于,所述方法还包括:
根据所述通用数据模型,绘制结果数据分布图,以及建立多源异构化验检查数据的数据统计分析和可视化查验模块;
结合所述通用数据模型中每个化验检查数据包括的参考范围,查找异常数据。
3.根据权利要求2所述的多源异构医疗化验检查数据处理方法,其特征在于,所述方法还包括:
获取通过所述数据统计分析和可视化查验模块对所述通用数据模型的查验结果;
基于所述通用数据模型的查验结果,对所述通用数据模型进行优化处理。
4.根据权利要求1所述的多源异构医疗化验检查数据处理方法,其特征在于,建立所述规范化原始数据字段与标准化字段的多对一映射,包括:
从所述规范化原始数据中获取文本语义相同的多个指标名称;
确定所述多个指标名称对应的标准化指标名称,建立所述多个指标名称与所述标准化指标名称之间的映射关系;
所述标准化指标名称是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。
5.根据权利要求4所述的多源异构医疗化验检查数据处理方法,其特征在于,所述方法还包括:
分别获取文本语义相同的每个指标名称对应的化验检查数据中包括的计量单位;
确定所述每个指标名称对应的计量单位对应的标准化计量单位,建立所述每个指标名称对应的计量单位与所述标准化计量单位之间的映射关系;
所述标准化计量单位是基于疾病诊断学、检验医学和单病种国际指南中的一种或多种来确定的。
6.根据权利要求4所述的多源异构医疗化验检查数据处理方法,其特征在于,所述对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型,包括:
根据标准化指标名称字段对应的每个化验检查数据中包括的计量单位及其对应的标准化计量单位,确定所述每个化验检查数据的计量单位换算为所述标准化计量单位所需的标准化系数;
根据所述每个化验检查数据的计量单位对应的所述标准化系数,分别将所述每个化验检查数据的检验结果换算为以所述标准化计量单位进行计量的检验结果,得到通用数据模型。
7.根据权利要求1-6任一项所述的多源异构医疗化验检查数据处理方法,其特征在于,所述方法还包括:
根据医疗机构信息系统中实验室检查数据管理模块的字段变动对所述通用数据模型进行更新配置。
8.一种多源异构医疗化验检查数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取预设疾病化验检查指标的多源自定义数据集;
预处理模块,用于对所述多源自定义数据集进行预处理,形成规范化原始数据;
字段划分模块,用于将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;
标准化映射建立模块,用于建立所述规范化原始数据字段与标准化字段的多对一映射;
计量单位统一模块,用于对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。
9.一种计算机设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-7任一项方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110571974.5A CN113488182A (zh) | 2021-05-25 | 2021-05-25 | 多源异构医疗化验检查数据处理方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110571974.5A CN113488182A (zh) | 2021-05-25 | 2021-05-25 | 多源异构医疗化验检查数据处理方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113488182A true CN113488182A (zh) | 2021-10-08 |
Family
ID=77933123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110571974.5A Pending CN113488182A (zh) | 2021-05-25 | 2021-05-25 | 多源异构医疗化验检查数据处理方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113488182A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114880430A (zh) * | 2022-05-10 | 2022-08-09 | 马上消费金融股份有限公司 | 名称处理方法及装置 |
CN116682519A (zh) * | 2023-08-03 | 2023-09-01 | 广东杰纳医药科技有限公司 | 一种临床实验数据单位分析方法 |
CN117153419A (zh) * | 2023-10-31 | 2023-12-01 | 湖北福鑫科创信息技术有限公司 | 一种面向医疗机构的数据集成工具 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109448841A (zh) * | 2018-11-09 | 2019-03-08 | 天津开心生活科技有限公司 | 建立数据模型方法及装置、临床辅助决策方法及装置 |
CN111508574A (zh) * | 2019-04-19 | 2020-08-07 | 上海智众医疗科技有限公司 | 检验检查数据对接方法及系统 |
CN111914011A (zh) * | 2020-08-06 | 2020-11-10 | 上海智众医疗科技有限公司 | 跨平台数据转换方法及系统 |
CN111949692A (zh) * | 2020-07-30 | 2020-11-17 | 合肥森亿智能科技有限公司 | 基于dto的自定义指标配置方法、系统、设备和介质 |
CN112559491A (zh) * | 2020-12-17 | 2021-03-26 | 山东健康医疗大数据有限公司 | 基于医疗行业内数据模型适配管理实现方法及系统 |
CN112788026A (zh) * | 2020-08-20 | 2021-05-11 | 王红根 | 基于移动互联网和生物认证的信息管理方法及管理系统 |
-
2021
- 2021-05-25 CN CN202110571974.5A patent/CN113488182A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109448841A (zh) * | 2018-11-09 | 2019-03-08 | 天津开心生活科技有限公司 | 建立数据模型方法及装置、临床辅助决策方法及装置 |
CN111508574A (zh) * | 2019-04-19 | 2020-08-07 | 上海智众医疗科技有限公司 | 检验检查数据对接方法及系统 |
CN111949692A (zh) * | 2020-07-30 | 2020-11-17 | 合肥森亿智能科技有限公司 | 基于dto的自定义指标配置方法、系统、设备和介质 |
CN111914011A (zh) * | 2020-08-06 | 2020-11-10 | 上海智众医疗科技有限公司 | 跨平台数据转换方法及系统 |
CN112788026A (zh) * | 2020-08-20 | 2021-05-11 | 王红根 | 基于移动互联网和生物认证的信息管理方法及管理系统 |
CN112559491A (zh) * | 2020-12-17 | 2021-03-26 | 山东健康医疗大数据有限公司 | 基于医疗行业内数据模型适配管理实现方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114880430A (zh) * | 2022-05-10 | 2022-08-09 | 马上消费金融股份有限公司 | 名称处理方法及装置 |
CN114880430B (zh) * | 2022-05-10 | 2023-07-18 | 马上消费金融股份有限公司 | 名称处理方法及装置 |
CN116682519A (zh) * | 2023-08-03 | 2023-09-01 | 广东杰纳医药科技有限公司 | 一种临床实验数据单位分析方法 |
CN116682519B (zh) * | 2023-08-03 | 2024-03-19 | 广东杰纳医药科技有限公司 | 一种临床实验数据单位分析方法 |
CN117153419A (zh) * | 2023-10-31 | 2023-12-01 | 湖北福鑫科创信息技术有限公司 | 一种面向医疗机构的数据集成工具 |
CN117153419B (zh) * | 2023-10-31 | 2024-01-26 | 湖北福鑫科创信息技术有限公司 | 一种面向医疗机构的数据集成工具 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113488182A (zh) | 多源异构医疗化验检查数据处理方法、装置、设备和介质 | |
CN109670054B (zh) | 知识图谱构建方法、装置、存储介质及电子设备 | |
JP6905219B2 (ja) | 電子医療レコードからの自動的な知識ベースの特徴抽出 | |
US20130238363A1 (en) | Medical examination assistance system and method of assisting medical examination | |
US20160042134A1 (en) | Method of calculating a score of a medical suggestion as a support in medical decision making | |
US20200311610A1 (en) | Rule-based feature engineering, model creation and hosting | |
CN112507138B (zh) | 专病知识图谱构建方法及装置、介质及电子设备 | |
KR101926632B1 (ko) | 규칙 최적화를 통한 임상 병리 검사에 대한 전문가 경험 지식 학습 및 소견 생성 방법 | |
Zhang et al. | Computable eligibility criteria through ontology-driven data access: a case study of hepatitis C virus trials | |
US20160292235A1 (en) | Data format for clinical test creation supporting method, and information processing device | |
Kurtz et al. | Hospital length of stay and 30-day mortality prediction in stroke: a machine learning analysis of 17,000 ICU admissions in Brazil | |
CN114005498A (zh) | 临床试验数据逻辑核查方法和装置、设备、存储介质 | |
CN113505236B (zh) | 医疗知识图谱的构建方法、装置、设备及计算机可读介质 | |
Dogan | Process mining based on patient waiting time: an application in health processes | |
Wang et al. | Application Prospect of the SOFA score and related modification research Progress in sepsis | |
Santomartino et al. | Performance and usability of code-free deep learning for chest radiograph classification, object detection, and segmentation | |
CN112133389A (zh) | 临床辅助决策高危自动预警方法、系统、设备和介质 | |
Scrivner et al. | XD Metrics on Demand Value Analytics: Visualizing the Impact of Internal Information Technology Investments on External Funding, Publications, and Collaboration Networks | |
Lee et al. | Developing an electronic nursing record system for clinical care and nursing effectiveness research in a Korean home healthcare setting | |
CN107818501B (zh) | 精算方法和装置 | |
CN115579150A (zh) | 专病数据库的创建方法、装置、电子设备及计算机介质 | |
Permanasari et al. | A web-based decision support system of patient time prediction using iterative dichotomiser 3 algorithm | |
CN114078576A (zh) | 临床辅助决策方法、装置、设备及介质 | |
CN111584089A (zh) | 患者数据搜索方法、装置及存储介质 | |
CN117809841B (zh) | 一种基于大模型技术的皮肤专病患者管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |