CN106815337A - 医疗大数据关联存储系统及方法 - Google Patents

医疗大数据关联存储系统及方法 Download PDF

Info

Publication number
CN106815337A
CN106815337A CN201611267777.XA CN201611267777A CN106815337A CN 106815337 A CN106815337 A CN 106815337A CN 201611267777 A CN201611267777 A CN 201611267777A CN 106815337 A CN106815337 A CN 106815337A
Authority
CN
China
Prior art keywords
data
patient
medical
information table
medical data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611267777.XA
Other languages
English (en)
Inventor
张贯京
葛新科
王海荣
高伟明
张红治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen E Techco Information Technology Co Ltd
Original Assignee
Shenzhen E Techco Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen E Techco Information Technology Co Ltd filed Critical Shenzhen E Techco Information Technology Co Ltd
Priority to CN201611267777.XA priority Critical patent/CN106815337A/zh
Publication of CN106815337A publication Critical patent/CN106815337A/zh
Priority to PCT/CN2017/088351 priority patent/WO2018120668A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • G06F19/32
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种医疗大数据关联存储系统及方法,该方法包括步骤:从多个医疗数据源收集患者的原始医疗数据;对原始医疗数据进行清洗转换处理得到规范医疗数据;从规范医疗数据抽取患者的身份信息、生命体征数据和历史就诊信息;根据患者的身份信息产生患者的身份标识号;将患者的身份标识号与生命体征数据进行关联并建立患者体征信息表,将患者的身份标识号与历史就诊信息进行关联并建立患者就诊信息表;将患者体征信息表存储在大数据存储仓库的第一分区数据库,将患者就诊信息表存储在大数据存储仓库的第二分区数据库。本发明能够从不同医疗数据源采集医疗数据并进行关联存储,提高了采集医疗数据的全面性、准确性及处理医疗数据的效率。

Description

医疗大数据关联存储系统及方法
技术领域
本发明涉及医疗信息化的技术领域,尤其涉及一种医疗大数据关联存储系统及方法。
背景技术
目前,随着我国经济持续稳定的发展和现代科技的日新月异,人们越来越多的关注自身健康,在满足日常工作和生活的需求之外,人们也迫切希望通过网络或者手机上网就能随时查看流行病的季节信息、了解每种疾病下的用药情况以及针对自身疾病获得一些个性化的推荐服务等。对于公共卫生机构,它们希望各个社区居民的医疗数据能够自动汇总,并自动对这些数据进行统计分析,统计的结果用来进行流行病的趋势分析和爆发预警,从而为制定防治干预计划提供有力的参考依据。
随着国家新医改政策的颁布和实施,与健康直接相关的医疗行业开始迅猛发展,医疗数据越来越趋于高度集中化。在海量医疗数据的访问上,存在大规模数据统计分析的服务,而且需要尽可能快的查询响应时间。由于医疗数据规模很大,医疗数据之间具有强关联性,不同类型的用户对同一数据具有不同的观察视角,从而对医疗数据的存储模型有很高的要求以应付灵活多变的数据请求,大规模数据上还存在大量已知的或者未知的数据分析需求,查询的总类多,需要支持各种定制性查询。由此可见,用户对查询医疗数据的要求高,对海量医疗数据的存储与管理要求就越高,因此现有医疗数据存储系统简单地采用传统数据库、商业并行数据库或者SQL数据库对海量医疗数据进行存储已不能满足实际情况和需求。
发明内容
本发明的主要目的在于提供一种医疗大数据关联存储系统及方法,旨在解决现有医疗数据存储系统对海量医疗数据进行分散存储而影响医疗数据分析处理效率的问题。
为实现上述目的,本发明提供了一种医疗大数据关联存储系统,运行于云服务器中,所述云服务器通过通信网络与多个医疗数据源建立通信连接,并通过数据库连接与大数据存储仓库连接,该系统包括:
数据采集模块,用于从多个医疗数据源收集每一个患者的原始医疗数据;
数据清洗模块,用于对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;
数据抽取模块,用于从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息,以及根据每一个患者的身份信息为每一个患者产生一个身份标识号;
数据关联模块,用于将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表;
数据存储模块,用于将所述患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将所述患者就诊信息表存储在大数据存储仓库中的第二分区数据库中。
优选的,所述数据采集模块从多个医疗数据源收集每一个患者的原始医疗数据的方式为:设定一个定时器脚本的执行时间和执行周期,以及按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集每一个患者的原始医疗数据。
优选的,所述数据清洗模块对每一个患者的原始医疗数据进行清洗转换处理的方式为:利用ETL数据过滤转换组件移除原始医疗数据中无意义的词,将原始医疗数据中一个词的不同形式转换为相同形式,以及删除原始医疗数据中重复的数据。
优选的,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。
优选的,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据,所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历。
本发明还提供了一种医疗大数据关联存储方法,应用于云服务器中,所述云服务器通过通信网络与多个医疗数据源建立通信连接,并通过数据库连接与大数据存储仓库连接,所述医疗大数据关联存储方法包括步骤:
从多个医疗数据源收集每一个患者的原始医疗数据;
对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;
从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息;
根据每一个患者的身份信息为每一个患者产生一个身份标识号;
将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表;
将所述患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将所述患者就诊信息表存储在大数据存储仓库中的第二分区数据库中。
优选的,所述从多个医疗数据源收集每一个患者的原始医疗数据的步骤包括如下步骤:
设定一个定时器脚本的执行时间和执行周期;
按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集每一个患者的原始医疗数据。
优选的,所述对每一个患者的原始医疗数据进行清洗转换处理的步骤包括如下步骤:利用ETL数据过滤转换组件移除原始医疗数据中无意义的词;将原始医疗数据中的一个词的不同形式转换为相同形式;删除原始医疗数据中重复的数据。
优选的,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。
优选的,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据,所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历。
相较于现有技术,本发明所述医疗大数据关联存储系统及方法采用上述技术方案,带来的技术效果为:通过采集不同的医疗数据源中的医疗数据,并将对医疗数据进行清洗转换处理得到规范医疗数据,从而使得医疗数据采集更加全面、更加准确。此外,将每个患者的身份标识号作为体征信息表与就诊信息表之间的关联关系,并将患者的体征信息表与就诊信息表分开存储在大数据存储仓库的不同分区数据库中,减轻了系统负载,提高了数据处理效率,避免了访问医疗数据时产生冲突,加快了对医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。
附图说明
图1是本发明医疗大数据关联存储系统优选实施例的架构图;
图2是本发明医疗大数据关联存储方法优选实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为更进一步阐述本发明为达成上述目的所采取的技术手段及功效,以下结合附图及优选实施例,对本发明的具体实施方式、结构、特征及其功效进行详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参考图1所示,图1是本发明医疗大数据关联存储系统优选实施例的应用环境架构示意图。在本实施例中,所述医疗大数据关联存储系统10应用并运行于云服务器1中,所述云服务器1通过通信网络3与多个医疗数据源2(图1中以两个为例进行说明)建立通信连接,以及通过数据库连接5与大数据存储仓库4连接。所述通信网络3可以是有线通信网络或无线通信网络。在本实施例中,所述通信网络3优选为无线通信网络,包括但不限于,GSM网络、GPRS网络、CDMA网络、TD-SCDMA网络、WiMAX网络、TD-LTE网络、FDD-LTE网络等无线传输网络。所述数据库连接5可以为一种开放数据库连接(Open Database Connectivity,ODBC)以及Java数据库连接(Java Data Base Connectivity,JDBC)。
所述云服务器1是一种云平台或云平台中的一台服务器,通过云服务器1的数据传输能力、数据存储能力及数据处理能力,可以快速地从不同的医疗数据源2采集到不同的原始医疗数据。所述医疗数据源2存储有患者的原始医疗数据,可以为产生临床数据的医院信息系统,例如HIS系统、EMR、LIS、PACS系统,也可以为体检中心、私人诊所和急救中心等任何适合的临床业务系统。所述大数据存储仓库4包括第一分区数据库41以及第二分区数据库42,第一分区数据库41用于存储有患者体征信息表,第二分区数据库42用于存储有患者就诊信息表。所述患者体征信息表用于存储从不同医疗数据源2采集的患者的生命体征数据,所述患者就诊信息表用于存储从不同医疗数据源2采集的患者的历史就诊数据。
在本实施例中,所述云服务器1包括,但不仅限于,医疗大数据关联存储系统10、通信单元11、存储单元12以及处理单元13。所述通信单元11为一种有线通讯接口或者为无线通讯接口,例如,支持GSM、GPRS、WCDMA、CDMA、TD-SCDMA、WiMAX、TD-LTE、FDD-LTE等通讯技术的通讯接口。所述存储单元12可以为一种只读存储单元ROM,电可擦写存储单元EEPROM、快闪存储单元FLASH或固体硬盘等。所述的处理单元13可以为一种中央处理器(CentralProcessing Unit,CPU)、微控制器(MCU)、数据处理芯片、或者具有数据处理功能的信息处理单元。
所述医疗大数据关联存储系统10,包括但不仅限于,数据采集模块101、数据清洗模块102、数据抽取模块103、数据关联模块104以及数据存储模块105。本发明所称的模块是指一种能够被所述云平台服务器1的处理单元13执行并且能够完成固定功能的一系列计算机程序指令段,其存储在所述云平台服务器1的存储单元12中。
所述数据采集模块101用于从多个不同的医疗数据源2收集每一个患者的原始医疗数据。一般地,患者的原始医疗数据的生成和采集通常来自于医院信息系统所产生的临床数据,例如HIS系统、EMR、LIS、PACS系统,但是随着物联网的发展,患者的原始医疗数据还可以来自于体检中心、私人诊所和急救中心等任何适合的临床业务系统。具体地,所述数据采集模块101具体用于设定一个定时器脚本的执行时间和执行周期,以及按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集原始医疗数据。
所述数据清洗模块102用于对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据。在本实施例中,由于从不同的医疗数据源2收集上来的原始医疗数据可能有坏数据、不合理的数据或者是重复的数据等,因此数据清洗模块102需要利用ETL(抽取(extract)、转换(transform)、加载(load))数据过滤转换组件对所收集的原始医疗数据进行清洗转换处理得到规范医疗数据,从而并保证了医疗数据的准确性,并为医疗数据的存储节省了存储空间。具体地,所述数据清洗模块102对每一个患者的原始医疗数据进行清洗转换处理的方式为:利用ETL数据过滤转换组件移除原始医疗数据中无意义的词,将原始医疗数据中一个词的不同形式转换为相同形式,以及删除原始医疗数据中重复的数据等处理。
所述数据抽取模块103用于从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息,以及根据每一个患者的身份信息为每一个患者产生一个身份标识号(ID)。在本实施例中,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据、血糖数据等数据信息。所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历等数据信息。
所述数据关联模块104用于将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表。在本实施例中,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。
所述数据存储模块105用于将患者体征信息表存储在大数据存储仓库4中的第一分区数据库41中,并将患者就诊信息表存储在大数据存储仓库4中的第二分区数据库42中。由于每个患者的身份标识号是唯一,因此将每个患者的身份标识号作为患者体征信息表与患者就诊信息表之间的关联关系,并将患者体征信息表与患者就诊信息表分开存储在大数据存储仓库4的不同分区数据库中,避免了访问医疗数据时产生冲突,加快了对海量医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。
为实现本发明目的,本发明还提供了一种医疗大数据关联存储方法。如图2所示,图2是本发明医疗大数据关联存储方法优选实施例的流程图。在本实施例中,所述的医疗大数据关联存储方法包括如下步骤:
步骤S21,从不同的医疗数据源收集每一个患者的原始医疗数据;具体地,数据采集模块101从多个不同的医疗数据源2收集每一个患者的原始医疗数据。一般地,患者的原始医疗数据的生成和采集通常来自于医院信息系统所产生的临床数据,例如HIS系统、EMR、LIS、PACS系统,但是随着物联网的发展,患者的原始医疗数据还可以来自于体检中心、私人诊所和急救中心等任何适合的临床业务系统。在本实施例中,数据采集模块101对每一个患者的原始医疗数据进行清洗转换处理的步骤包括步骤:设定一个定时器脚本的执行时间和执行周期,按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集原始医疗数据。
步骤S22,对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;具体地,数据清洗模块102对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据。在本实施例中,由于从不同的医疗数据源2收集上来的原始医疗数据可能有坏数据、不合理的数据或者是重复的数据等,因此数据清洗模块102需要利用ETL(抽取(extract)、转换(transform)、加载(load)数据过滤转换组件对所收集的原始医疗数据进行清洗转换处理得到规范医疗数据,从而并保证了医疗数据的准确性,并为医疗数据的存储节省了存储空间。具体地,数据清洗模块102对每一个患者的原始医疗数据进行清洗转换处理的步骤包括步骤:利用利用ETL数据过滤转换组件移除原始医疗数据中无意义的词,将原始医疗数据中一个词的不同形式转换为相同形式,以及删除原始医疗数据中重复的数据等处理。
步骤S23,从每一个患者的规范医疗数据中抽取每一个患者的身份信息和生命体征数据;具体地,数据抽取模块103从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息。在本实施例中,所述患者的生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据等数据信息。所述患者的历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历等数据信息。
步骤S24,根据每一个患者的身份信息为每一个患者产生一个身份标识号;具体地,数据抽取模块103根据每一个患者的身份信息为每一个患者产生一个身份标识号,作为每一个患者唯一的身份标识。
步骤S25,将每一个患者的身份标识号与该患者的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与该患者的历史就诊信息进行关联并建立一个患者就诊信息表;具体地,数据关联模块104将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表。在本实施例中,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。
步骤S26,将患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将患者就诊信息表存储在大数据存储仓库中的第二分区数据库中;具体地,数据存储模块105将患者体征信息表存储在大数据存储仓库4中的第一分区数据库41中,并将患者就诊信息表存储在大数据存储仓库4中的第二分区数据库42中。在本实施例中,由于每个患者的身份标识号是唯一,每个患者的身份标识号作为患者体征信息表与患者就诊信息表之间的关联关系,并将患者体征信息表与患者就诊信息表分开存储在大数据存储仓库4的不同分区数据库中,因此增强了数据结构化存储以及避免了访问医疗数据时产生冲突,加快了云服务器1对医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。
本发明所述医疗大数据关联存储系统及方法通过采集不同的医疗数据源2中的医疗数据,并将对医疗数据进行清洗转换处理得到规范医疗数据,从而使得医疗数据采集更加全面、更加准确。此外,将每个患者的身份标识号作为体征信息表与就诊信息表之间的关联关系,并将患者的体征信息表与就诊信息表分开存储在大数据存储仓库的不同分区数据库中,减轻了系统负载,提高了数据处理效率,避免了访问医疗数据时产生冲突,加快了对医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效功能变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种医疗大数据关联存储系统,运行于云服务器中,所述云服务器通过通信网络与多个医疗数据源建立通信连接,并通过数据库连接与大数据存储仓库连接,其特征在于,所述医疗大数据关联存储系统包括:
数据采集模块,用于从多个医疗数据源收集每一个患者的原始医疗数据;
数据清洗模块,用于对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;
数据抽取模块,用于从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息,以及根据每一个患者的身份信息为每一个患者产生一个身份标识号;
数据关联模块,用于将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表;
数据存储模块,用于将所述患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将所述患者就诊信息表存储在大数据存储仓库中的第二分区数据库中。
2.如权利要求1所述的医疗大数据关联存储系统,其特征在于,所述数据采集模块从多个医疗数据源收集每一个患者的原始医疗数据的方式为:设定一个定时器脚本的执行时间和执行周期,以及按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集每一个患者的原始医疗数据。
3.如权利要求1所述的医疗大数据关联存储系统,其特征在于,所述数据清洗模块对每一个患者的原始医疗数据进行清洗转换处理的方式为:利用ETL数据过滤转换组件移除原始医疗数据中无意义的词,将原始医疗数据中一个词的不同形式转换为相同形式,以及删除原始医疗数据中重复的数据。
4.如权利要求1所述的医疗大数据关联存储系统,其特征在于,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。
5.如权利要求1所述的医疗大数据关联存储系统,其特征在于,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据,所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历。
6.一种医疗大数据关联存储方法,应用于云服务器中,所述云服务器通过通信网络与多个医疗数据源建立通信连接,并通过数据库连接与大数据存储仓库连接,其特征在于,所述医疗大数据关联存储方法包括步骤:
从多个医疗数据源收集每一个患者的原始医疗数据;
对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;
从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息;
根据每一个患者的身份信息为每一个患者产生一个身份标识号;
将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表;
将所述患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将所述患者就诊信息表存储在大数据存储仓库中的第二分区数据库中。
7.如权利要求6所述的医疗大数据关联存储方法,其特征在于,所述从多个医疗数据源收集每一个患者的原始医疗数据的步骤包括如下步骤:
设定一个定时器脚本的执行时间和执行周期;
按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集每一个患者的原始医疗数据。
8.如权利要求6所述的医疗大数据关联存储方法,其特征在于,所述对每一个患者的原始医疗数据进行清洗转换处理的步骤包括如下步骤:
利用ETL数据过滤转换组件移除原始医疗数据中无意义的词;
将原始医疗数据中的一个词的不同形式转换为相同形式;
删除原始医疗数据中重复的数据。
9.如权利要求6所述的医疗大数据关联存储方法,其特征在于,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。
10.如权利要求6所述的医疗大数据关联存储方法,其特征在于,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据,所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历。
CN201611267777.XA 2016-12-31 2016-12-31 医疗大数据关联存储系统及方法 Pending CN106815337A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201611267777.XA CN106815337A (zh) 2016-12-31 2016-12-31 医疗大数据关联存储系统及方法
PCT/CN2017/088351 WO2018120668A1 (zh) 2016-12-31 2017-06-15 医疗大数据关联存储系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611267777.XA CN106815337A (zh) 2016-12-31 2016-12-31 医疗大数据关联存储系统及方法

Publications (1)

Publication Number Publication Date
CN106815337A true CN106815337A (zh) 2017-06-09

Family

ID=59110605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611267777.XA Pending CN106815337A (zh) 2016-12-31 2016-12-31 医疗大数据关联存储系统及方法

Country Status (2)

Country Link
CN (1) CN106815337A (zh)
WO (1) WO2018120668A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704600A (zh) * 2017-10-16 2018-02-16 上海康云科技有限公司 一种结核检测云数据管理分析系统
WO2018120669A1 (zh) * 2016-12-31 2018-07-05 深圳市易特科信息技术有限公司 基于大数据关联存储的医疗数据查询系统及方法
WO2018120668A1 (zh) * 2016-12-31 2018-07-05 深圳市易特科信息技术有限公司 医疗大数据关联存储系统及方法
CN108847274A (zh) * 2018-05-16 2018-11-20 上海术木医疗科技有限公司 一种基于云平台的生命体征数据处理方法及系统
CN108922607A (zh) * 2018-05-31 2018-11-30 康键信息技术(深圳)有限公司 服务器、数据处理的方法及存储介质
CN109119138A (zh) * 2018-09-19 2019-01-01 广州视源电子科技股份有限公司 一种体征数据采集系统
CN109471863A (zh) * 2018-11-12 2019-03-15 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
CN109597801A (zh) * 2018-11-14 2019-04-09 金色熊猫有限公司 医疗数据标准化管理方法及系统、电子设备、存储介质
CN109710682A (zh) * 2018-12-31 2019-05-03 深圳市道通科技股份有限公司 一种诊断数据处理方法、装置、诊断设备和服务器
CN109935285A (zh) * 2019-01-30 2019-06-25 杭州脉兴医疗科技有限公司 一种icu护理单数据的结构化处理方法及处理系统
CN110085326A (zh) * 2019-04-30 2019-08-02 上海复繁信息科技有限公司 一种基于MySQL数据库的房颤多维大数据分析系统
CN110442638A (zh) * 2019-07-23 2019-11-12 万达信息股份有限公司 一种医疗数据的可视化信息生成方法及系统
CN113537529A (zh) * 2021-07-30 2021-10-22 国能铁路装备有限责任公司 货车轴承关联数据生成方法、装置和计算机设备
CN113938539A (zh) * 2021-12-17 2022-01-14 中国人民解放军总医院 医疗数据的溯源方法和系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112582056A (zh) * 2020-12-21 2021-03-30 曙光星云信息技术(北京)有限公司 一种基于大数据技术的区域医疗信息管理平台
CN112863626A (zh) * 2021-03-08 2021-05-28 北京冠新医卫软件科技有限公司 多平台相似医疗数据去除方法、装置及设备
CN114974565A (zh) * 2022-05-17 2022-08-30 上海市第四人民医院 新冠患者诊疗阶段精细化管控方法及系统
CN117272395B (zh) * 2023-11-21 2024-01-26 江西曼荼罗软件有限公司 一种患者医疗数据处理方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7788040B2 (en) * 2003-12-19 2010-08-31 Siemens Medical Solutions Usa, Inc. System for managing healthcare data including genomic and other patient specific information
CN100429667C (zh) * 2006-05-15 2008-10-29 李永和 医疗数据处理系统及处理方法
CN101782935A (zh) * 2009-01-19 2010-07-21 中国人民解放军第二军医大学 一种中医电子病历系统和病历数据解析处理方法
CN102054032A (zh) * 2010-12-22 2011-05-11 广州市慧通计算机有限公司 一种医疗数据信息处理方法及其系统
CN104392132B (zh) * 2014-11-24 2019-11-12 深圳市第二人民医院 一种基于云计算的医疗数据存储系统
CN106815337A (zh) * 2016-12-31 2017-06-09 深圳市易特科信息技术有限公司 医疗大数据关联存储系统及方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018120669A1 (zh) * 2016-12-31 2018-07-05 深圳市易特科信息技术有限公司 基于大数据关联存储的医疗数据查询系统及方法
WO2018120668A1 (zh) * 2016-12-31 2018-07-05 深圳市易特科信息技术有限公司 医疗大数据关联存储系统及方法
CN107704600A (zh) * 2017-10-16 2018-02-16 上海康云科技有限公司 一种结核检测云数据管理分析系统
WO2019219035A1 (zh) * 2018-05-16 2019-11-21 上海术木医疗科技有限公司 一种基于云平台的生命体征数据处理方法及系统
CN108847274A (zh) * 2018-05-16 2018-11-20 上海术木医疗科技有限公司 一种基于云平台的生命体征数据处理方法及系统
CN108922607A (zh) * 2018-05-31 2018-11-30 康键信息技术(深圳)有限公司 服务器、数据处理的方法及存储介质
CN109119138A (zh) * 2018-09-19 2019-01-01 广州视源电子科技股份有限公司 一种体征数据采集系统
CN109471863A (zh) * 2018-11-12 2019-03-15 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
CN109471863B (zh) * 2018-11-12 2021-07-20 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
CN109597801A (zh) * 2018-11-14 2019-04-09 金色熊猫有限公司 医疗数据标准化管理方法及系统、电子设备、存储介质
CN109710682A (zh) * 2018-12-31 2019-05-03 深圳市道通科技股份有限公司 一种诊断数据处理方法、装置、诊断设备和服务器
CN109935285A (zh) * 2019-01-30 2019-06-25 杭州脉兴医疗科技有限公司 一种icu护理单数据的结构化处理方法及处理系统
CN110085326A (zh) * 2019-04-30 2019-08-02 上海复繁信息科技有限公司 一种基于MySQL数据库的房颤多维大数据分析系统
CN110442638A (zh) * 2019-07-23 2019-11-12 万达信息股份有限公司 一种医疗数据的可视化信息生成方法及系统
CN113537529A (zh) * 2021-07-30 2021-10-22 国能铁路装备有限责任公司 货车轴承关联数据生成方法、装置和计算机设备
CN113938539A (zh) * 2021-12-17 2022-01-14 中国人民解放军总医院 医疗数据的溯源方法和系统

Also Published As

Publication number Publication date
WO2018120668A1 (zh) 2018-07-05

Similar Documents

Publication Publication Date Title
CN106815337A (zh) 医疗大数据关联存储系统及方法
CN106778021A (zh) 医疗就诊信息管理系统及方法
CN106815336A (zh) 基于大数据关联存储的医疗数据查询系统及方法
Chen et al. 5G-smart diabetes: Toward personalized diabetes diagnosis with healthcare big data clouds
Sopic et al. Real-time event-driven classification technique for early detection and prevention of myocardial infarction on wearable systems
CN108366763A (zh) 用于评估精神状态的方法和系统
CN103258137A (zh) 远程问诊方法
CN206601705U (zh) 一种基于远程数据获取与分析的医疗健康系统
CN107092799B (zh) 一种基于云计算的生命体征数据管理系统及方法
Ramesh et al. Atrial fibrillation classification with smart wearables using short-term heart rate variability and deep convolutional neural networks
Ingolfsson et al. Ecg-tcn: Wearable cardiac arrhythmia detection with a temporal convolutional network
CN111063437A (zh) 一种个性化慢病分析系统
Sharmila et al. Diagnosing Diabetic Dataset using Hadoop and K-means Clustering Techniques.
Panwar et al. CardioNet: Deep learning framework for prediction of CVD risk factors
CN111789629A (zh) 一种基于深度学习的呼吸音智能诊疗系统及方法
CN114117053A (zh) 病种分类模型训练方法、装置、存储介质及电子装置
CN110473631A (zh) 基于真实世界研究的智能睡眠监测方法和系统
CN107066816B (zh) 基于临床数据的就医指导方法、装置及服务器
CN108338777A (zh) 一种脉搏信号检测分析方法及装置
CN111554405A (zh) 一种循证医学rct的智能数据提取和质量评价方法
Bhat et al. A Real-Time IoT Based Arrhythmia Classifier Using Convolutional Neural Networks
US20200337567A1 (en) Systems and Methods of Arrhythmia Detection
Ramesh et al. An intelligent decision support system for enhancing an m-health application
Walke et al. On-line real time feature extraction of ECG signal: Recent advances & survey
CN202589515U (zh) 智能心电监护系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170609