CN111243748A - 针推康数据标准化系统 - Google Patents

针推康数据标准化系统 Download PDF

Info

Publication number
CN111243748A
CN111243748A CN201911391093.4A CN201911391093A CN111243748A CN 111243748 A CN111243748 A CN 111243748A CN 201911391093 A CN201911391093 A CN 201911391093A CN 111243748 A CN111243748 A CN 111243748A
Authority
CN
China
Prior art keywords
data
input end
output end
presentation
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911391093.4A
Other languages
English (en)
Inventor
章薇
蒋小云
李金香
娄必丹
钟峰
李洪亮
龙抗胜
刘民权
付昭桂
盛军
张耀婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Chinese Medicine
Original Assignee
Hunan University of Chinese Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Chinese Medicine filed Critical Hunan University of Chinese Medicine
Priority to CN201911391093.4A priority Critical patent/CN111243748A/zh
Publication of CN111243748A publication Critical patent/CN111243748A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供针推康数据标准化系统,涉及移动互联网技术领域。该针推康数据标准化系统,包括院内业务系统、标准化处理系统、平台层、应用层和展现层,数据清洗系统的输出端与针推康标准化数据中心的输入端连接,针推康标准化数据中心的输出端与管理核心元数据的输入端连接,所述管理核心元数据的输出端与交换元数据的输入端连接,所述交换元数据的输出端与日志管理系统的输入端连接。本发明通过交换元数据和管理核心元数据等,造成信息系统复杂、大数据的价值没有发挥等问题,建立针推康的行业统一规范化采集标准体系,增强各中心之间的针推康数据的互联共通,所以该发明可以达到标准化处理且可以发挥数据的作用与价值的目的。

Description

针推康数据标准化系统
技术领域
本发明涉及移动互联网技术领域,具体为针推康数据标准化系统。
背景技术
随着新一代移动互联网的快速发展,以及物联网和云计算技术的兴起,数据呈现爆炸式增长,大数据的时代已经悄然到来,医疗行业从二十世纪九十年代开始,医院信息化发展迅速,积累了海量结构数据和非结构化数据,也面临着大数据的挑战。
作为基于数据和循证的一门科学,医疗行业是大数据技术应用最有潜力的领域之一。针推康数据标准化系统涉及的医疗大数据是指在医疗服务过程中产生的与临床相关的数据,包括HIS、电子病历数据、用药记录等。临床数据资源普遍具有以下特点:①医学术语更新快,医院信息系统不同,标准不统一,数据获取困难;②大量医疗数据来源于手工记录,导致数据记录经常出现偏差和残缺,数据完整性准确性难以保证,收集数据困难;③信息孤岛普遍存在,导致同一医疗机构也存储大量重复信息;④不同数据使用者(如医生、护士、医技)所需信息要求不一,导致数据的处理方式差别较大,然而现有的针灸推拿康复科室一直以来都没有专门针对针灸推拿康复方面的医疗数据标准化处理系统,传统数据处理方式为通过各种业务系统,将数据从系统中进行导出操作后,基于office的产品进行文档编辑,人工对数据进行抽取与标化处理,并没有专业的中医医疗用语的标准化处理系统,造成大量的历史数据无法挖掘,没有发挥数据的作用与价值,所以针对此问题,可以设计出一种标准化处理且可以发挥数据的作用与价值的针推康数据标准化系统。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了针推康数据标准化系统,达到标准化处理且可以发挥数据的作用与价值的目的。
(二)技术方案
为实现上述具有标准化处理且可以发挥数据的作用与价值的目的,本发明提供如下技术方案:针推康数据标准化系统,包括院内业务系统、标准化处理系统、平台层、应用层和展现层,其特征在于:所述标准化处理系统包括数据抽取系统、数据脱敏系统和数据清洗系统,所述平台层包括节点管理系统、数库适配器、文件适配器、日志管理系统、数据传输转换文件、交换元数据和管理核心元数据,所述应用层包括临床应用服务系统、病种科研服务系统和数据智能分析系统,所述展现层包括展现系统、展现实施单元和展现实施器,所述院内业务系统的Webservice窗口与数据抽取系统的输入端连接,所述数据抽取系统的输出端与数据脱敏系统的输入端连接,所述数据脱敏系统的输出端与数据清洗系统的输入端连接,所述数据清洗系统的输出端与针推康标准化数据中心的输入端连接,所述针推康标准化数据中心的输出端与管理核心元数据的输入端连接,所述管理核心元数据的输出端与交换元数据的输入端连接,所述交换元数据的输出端与日志管理系统的输入端连接。
优选的,所述日志管理系统的输出端与节点管理系统的输入端连接,所述节点管理系统的输出端与数库适配器的输入端连接。
优选的,所述数库适配器的输出端与文件适配器的输入端连接,所述文件适配器的输出端与数据传输转换文件的输入端连接。
优选的,所述数据传输转换文件的输出端与临床应用服务系统的输入端连接,所述临床应用服务系统的输出端与病种科研服务系统的输入端连接。
优选的,所述病种科研服务系统的输出端与数据智能分析系统的输入端连接,所述数据智能分析系统的输出端与展现系统的输入端连接。
优选的,所述展现系统的输出端与展现实施单元的输入端连接,所述展现实施单元的输出端与展现实施器的输入端连接。
(三)有益效果
与现有技术相比,本发明提供了针推康数据标准化系统,具备以下有益效果:
1、本发明通过数据抽取系统、数据脱敏系统、数据清洗系统、节点管理系统、数库适配器、文件适配器、日志管理系统、数据传输转换文件、交换元数据和管理核心元数据等,对医疗大数据进行研究,首先是收集各个业务系统的异构数据,这种数据包括医疗诊断、处方、检验等结构化的数据,也包括PACS系统的大量非结构化的数据,要进行大数据研究,必须制定统一的数据共享标准,打破信息孤岛造成的障碍,医院的各系统使用的技术架构各不相同,数据的异构性也普遍存在,其中比较典型的例如医院的电子病历,数据不能方便地提取,造成信息系统复杂、数据量大种类多、数据分析共享困难、大数据的价值没有发挥等问题,建立针推康的行业统一规范化采集标准体系,增强各中心之间的针推康数据的互联共通,为后期数据处理做好基础和准备,该技术不仅能用于针推康一体化临床数据,而且很容易推广到其他疾病的临床数据标准化,整合患者历次在医院的就诊记录以及体检信息,形成完整的患者全视图,应用统计学方法可以分析出哪类人群容易感染哪种疾病、不同地区患者所患病种类的不同、各个病种年龄段的分布情况等,所以由此可知,该发明可以达到标准化处理且可以发挥数据的作用与价值的目的。
2、本发明通过临床应用服务系统、病种科研服务系统、数据智能分析系统、展现系统、展现实施单元和展现实施器等,采用快速检索系统语义标签化技术,通过拖拽不同筛选条件的标签,自动生成查询计划,使查询工作不再需要依赖操作人员的计算机水平,建立规范化的针推康大数据采集、存储、管理、规范、交换和检索系统,可为国内各中心之间的针推康大数据互联共享提供平台支撑,实现不同来源数据资源的汇聚、不同类型不同层次医疗相关数据的整合,形成与医疗相关的一系列数据库,针对针推康临床医疗数据,建立相应指标规范,实现针推康数据标准化,为针推康大数据后续的深度挖掘、分析、及其应用奠定标准基础,所以由此可知,该发明更实用且更方便。
附图说明
图1为本发明平台逻辑构架结构示意图;
图2为本发明图1的平台层连接结构示意图;
图3为本发明图1的应用层连接结构示意图;
图4为本发明患者病症搜索构建流程图。
图中:1院内业务系统、2标准化处理系统、201数据抽取系统、202数据脱敏系统、203数据清洗系统(203)、3针推康标准化数据中心、4平台层、401节点管理系统、402数库适配器、403文件适配器、404日志管理系统、405数据传输转换文件、406交换元数据、407管理核心元数据、5应用层、501临床应用服务系统、502病种科研服务系统、503数据智能分析系统、6展现层、601展现系统、602展现实施单元、603展现实施器。
具体实施方式
请参阅图1-4,针推康数据标准化系统,包括院内业务系统1、标准化处理系统2、平台层4、应用层5和展现层6,标准化处理系统2包括数据抽取系统201、数据脱敏系统202和数据清洗系统203,平台层4包括节点管理系统401、数库适配器402、文件适配器403、日志管理系统404、数据传输转换文件405、交换元数据406和管理核心元数据407,应用层5包括临床应用服务系统501、病种科研服务系统502和数据智能分析系统503,展现层6包括展现系统601、展现实施单元602和展现实施器603,院内业务系统1的Webservice窗口与数据抽取系统201的输入端电性连接,数据抽取系统201的输出端与数据脱敏系统202的输入端电性连接,数据脱敏系统202的输出端与数据清洗系统203的输入端电性连接,数据清洗系统203的输出端与针推康标准化数据中心3的输入端电性连接,针推康标准化数据中心3的输出端与管理核心元数据407的输入端电性连接,管理核心元数据407的输出端与交换元数据406的输入端电性连接,交换元数据406的输出端与日志管理系统404的输入端电性连接,日志管理系统404的输出端与节点管理系统401的输入端电性连接,节点管理系统401的输出端与数库适配器402的输入端电性连接,数库适配器402的输出端与文件适配器403的输入端电性连接,文件适配器403的输出端与数据传输转换文件405的输入端电性连接,数据传输转换文件405的输出端与临床应用服务系统501的输入端电性连接,临床应用服务系统501的输出端与病种科研服务系统502的输入端电性连接,病种科研服务系统502的输出端与数据智能分析系统503的输入端电性连接,数据智能分析系统503的输出端与展现系统601的输入端电性连接,展现系统601的输出端与展现实施单元602的输入端电性连接,展现实施单元602的输出端与展现实施器603的输入端电性连接,针推康数据标准化系统,通过数据抽取系统201、数据脱敏系统202、数据清洗系统203、节点管理系统401、数库适配器402、文件适配器403、日志管理系统404、数据传输转换文件405、交换元数据406和管理核心元数据407等,对医疗大数据进行研究,首先是收集各个业务系统的异构数据,这种数据包括医疗诊断、处方、检验等结构化的数据,也包括PACS系统的大量非结构化的数据,要进行大数据研究,必须制定统一的数据共享标准,打破信息孤岛造成的障碍,医院的各系统使用的技术架构各不相同,数据的异构性也普遍存在,其中比较典型的例如医院的电子病历,数据不能方便地提取,造成信息系统复杂、数据量大种类多、数据分析共享困难、大数据的价值没有发挥等问题,建立针推康的行业统一规范化采集标准体系,增强各中心之间的针推康数据的互联共通,为后期数据处理做好基础和准备,该技术不仅能用于针推康一体化临床数据,而且很容易推广到其他疾病的临床数据标准化,整合患者历次在医院的就诊记录以及体检信息,形成完整的患者全视图,应用统计学方法可以分析出哪类人群容易感染哪种疾病、不同地区患者所患病种类的不同、各个病种年龄段的分布情况等,所以由此可知,该发明可以达到标准化处理且可以发挥数据的作用与价值的目的,通过临床应用服务系统501、病种科研服务系统502、数据智能分析系统503、展现系统601、展现实施单元602和展现实施器603等,采用快速检索系统语义标签化技术,通过拖拽不同筛选条件的标签,自动生成查询计划,使查询工作不再需要依赖操作人员的计算机水平,建立规范化的针推康大数据采集、存储、管理、规范、交换和检索系统,可为国内各中心之间的针推康大数据互联共享提供平台支撑,实现不同来源数据资源的汇聚、不同类型不同层次医疗相关数据的整合,形成与医疗相关的一系列数据库,针对针推康临床医疗数据,建立相应指标规范,实现针推康数据标准化,为针推康大数据后续的深度挖掘、分析、及其应用奠定标准基础,所以由此可知,该发明更实用且更方便。
在使用时,数据预处理技术时:在存储和处理前,需对数据进行清洗、整理,又称ETL过程,主要完成对数据的抽取、转换、清洗、加载等操作,基于Java技术和标准数据库接口JDBC、ODBC等,支持在各种主流操作系统和国产操作系统上部署,支持与各种主流数据库、开源数据库、国产数据库的接入,支持对各种结构化非结构化格式文件的读写,以及通过多种协议与其他应用系统的交互;数据抽取系统201时,数据抽取即将所需数据从医院信息平台提取;数据脱敏系统202时,数据清洗包括检查数据一致性、处理无效值和缺失值等,是发现并纠正数据文件中可识别错误的最后一道程序,数据传输转换文件405时,从医院信息平台抽取的数据存在格式不统一、内容不完整、输入错误等问题,需要对其进行相关加工后,以满足目的库的要求,加载时,ETL的最后步骤是将转换后的数据装载到目的数据库,装载数据所采用的技术方法由数据操作类型和数据量决定,一般可用SQL语句的方式或采用批量装载的方式。
数据存储和管理技术时:为提高数据处理能力,降低数据存储成本,医疗大数据采用分布式数据存储管理技术,主要涉及分布式文件系统、关系数据库、非关系数据库3种;布式文件系统,分布式文件系统是由多个网络节点组成的向上层应用提供统一文件服务的文件系统,具有代表性的HDFS,HDFS由一个主节点NameNode和多个子节点DataNode组成,是一种典型Master/Slave架构,NameNode是一个中心服务器,负责文件系统名字空间的操作,负责维护文件路径到数据块的映射等,DataNode负责管理它所在节点上的存放;关系型数据库,关系型数据库主要以Oracle、MySQL、DB2、MicrosoftSQLServer等为代表;非关系型数据库,传统关系数据库存储已不能满足医疗数据快速增长的需求,而非关系型的数据库则由于其本身的特点得到了迅速发展,目前其数据库类型主要有列存储数据库、键值存储数据库、图形数据库以及文档型数据库等。
数据分析和挖掘技术时:对于医生遗嘱、出院小结和描述性质的分析报告等非结构化和半结构化的数据,需要进行文本处理形成机器可读的数据,主要包括以下算法和技术:文本分词,文本分词是指将汉字、英文等按照一定的规范切分成单独词语的过程;文本挖掘,文本挖掘是机器学习中的重要部分,包括文本分类/聚类、实体挖掘、实体关系模型等主要方法;③语义分析,在医疗领域,医生的一些口语化词汇如“乙肝”、“大三阳”等和一些书面化的词汇“乙型肝炎”、“HBeAg阳性”虽然字符串完全不同,但表达含义相同,因此需要对这种文本的语义进行识别,以方便处理非结构化数据,语义分析即对信息包含语义的识别,通过建立计算模型,使其能够理解自然语言。
数据可视化技术:数据可视化是指运用计算机相关处理技术,将数据转换为图形或图像在屏幕上显示,以方便用户理解数据的方法,数据可视化借助于人眼快速的视觉感知和大脑的智能认知能力,可起到清晰有效地传达、沟通并辅助数据挖掘和数据分析的作用,数据可视化将各种类型的数据,通过不同的呈现方式,包括结合地理信息系统、数据统计图表、三维建模、时空态势展示等展现形式,将数据直观地呈现给用户。
针推康临床数据预处理:利用ETL工具从科室的不同数据中选取、整合并传送,充分利用建模工具对整理好的各项数据进行模型的建立,形成多维度可分析模型集合;将模型进行关联整合或分割,对模型的增量进行设计,将模型集逐步完善,最终产生数据仓库,针推康临床数据仓库是构建整个系统的基础,针推康数据标准化系统的数据来源于医院各个业务系统,通过对多个系统的数据进行汇聚,实现数据中心底层数据的初始化积累。再结合数据标准化、数据分析及建模,逐步构建规范的数据中心,所以,整体上来讲,底层数据的加工主要包括数据采集及数据加工这两大部分:.数据采集时,由于数据来源于不同业务系统,不同数据源不同结构的数据,就需要用一定的技术手段进行加工处理,ETL产品包含转换、作业两个功能,通过转换功能进行相关数据抽取操作,进行数据清洗,包括定义数据源、数据去空格、字段名称映射、数据抽取转换装载的一系列操作,通过作业组件将业务之间有相互关联的转换组织在—起进行管理,再通过Windows的定时任务,去调用作业,实现数据的定时抽取;数据加工时,各业务系统的数据,通过数据映射,集中汇聚到数据中心进行治理,在数据的ETL及治理过程中,就需进行相关规则定义,如表存储,ETL规范等,在数据加工的过程中,重点在于对数据进行加工,提升数据质量,同时分析出具有主索引特性的数据,分析具有关联性的数据,规范数据结构,对表名、字段名称、表空间名称进行规范定义。
针推康数据标化处理时:数据标准化处理主要包括数据清洗、数据集成、数据变换及数据归约四个基本功能。数据清洗的作用是清洗噪声数据、无关数据、处理遗漏数据、填补空缺值、识别删除孤立点等。数据清洗的内容主要包括属性清洗和相似重复记录清洗。其中,相似重复记录是指一个现实实体在数据集合中用多条不完全相同的记录来表示,由于它们在格式、表达上的差异,导致数据库管理系统不能正确识别。相似重复记录清洗主要包含检测重复记录和消除重复记录两个步骤,医疗数据资源标准化清洗时时,基于标准医学术语库和临床数据采集规范,系统能从以下几个方面对异构异源的诊疗数据资源进行标准化清洗,实现数据资源的清理与整合,首先是对于临床医疗数据标准化,包括对于临床医疗诊断数据、检验数据、体征数据、手术数据以及用药数据等进行标准化转换,其次是对于临床医疗数据的清洗,临床医疗数据资源清理主要是对临床医疗数据,如诊断数据、手术数据、用药数据、检验数据、体征数据、电子病历中抽取的数据进行数据清理,如数据项(字段)的定义与名称歧义、值域代码不统一,信息模型与资源内容缺乏统一描述和表达,单位出现中英文、数据名称使用简写等,对异构异源的临床医疗数据资源实施有效的数据清理工作,数据标准化处理时,对接医学术语标准,对针推康的临床医疗诊断、用药、费用、检验检查、手术等数据进行语义标准化处理,其医学术语在参照《中华人民共和国国家标准中医临床诊疗术语》,再综合补充医院内部科室标准。
针推康标准数据库时:在科室业务数据集成的基础上,建设针推康标准化数据中心,根据数据整合关联的分析结果和具体业务需求,分别建设相应的主题库、专题库、分析库和应用库,科室数据规模不断扩大,数据仓库成为数据存储和分析的重要工具。在数据仓库的应用中,数据仓库的性能问题变得越来越重要。数据仓库的性能优化策略包括逻辑设计优化和物理设计优化,逻辑模型设计要确定系统的数据粒度,通过粗略估算待建的数据仓库数据量级来确定合适的系统数据粒度。根据估算的数据量级规模,确定不同的数据粒度策略,若数据规模较小,可使用单一的数据粒度,直接进行细节数据存储,周期性地在存储的细节数据上进行数据综合,若数据规模较大,可使用双重的粒度,数据仓库保留近期的细节数据,到达行业、机构的数据保留周期时,导出距离当前较远的数据到磁盘,优化数据仓库的存储空间,这样,对于周期之后的数据,数据仓库中仅保留其综合数据,根据使用的数据粒度,确定表的分割策略,可按照时间进行表的分割,在每张表上增加合适的时间字段,将表按确定的数据粒度和分割策略的进行完善或定义新表,根据设计的系统关系模式,通过记录系统的定义实现其具体化,即明确数据仓库关系表与各业务数据系统的具体对应关系,实施时,应将数据仓库关系模式中的字段与业务系统中的同义字段对应,物理设计也要考虑优化,数据仓库包含大量数据,决定其数据存储应采用并行存储结构,在如下的环节中可以采用并行化处理,抽取/综合处理的并行化,由于在数据仓库中不存在数据互斥访问的情况,因此抽取处理可以并行工作,细节数据聚合成综合数据的处理也可以并行,数据写入的并行化、数据访问的并行化、查询的并行化,查询的并行化包括两层的含义,一是不同查询之间的查询过程可以并行,在操作型环境中,大量的查询是对数据进行更新处理,通过加锁进行互斥控制,限制了并发度;在分析型环境中,查询通常只涉及读操作,可以并发运行,二是查询内的并行化可将复杂的查询任务被划分为多个子查询任务,子查询任务再进行并行化查询。
临床应用服务时:医疗数据的规模在急剧增长,且呈现出了大数据的特性,数据类型正向复杂、多样、海量、时效性的数据类型方式转变,但是目前大部分医生对医院真实临床数据的获取方式不多,效率低下,从而导致医院临床数据的利用水平不高,绝大部分具有挖掘价值的数据处于“沉睡”状态,主要表现在:一是大部分临床医护人员只能与信息科人员协调,通过Excel等工具少量收集临床样本数据进行研究,导致数据支撑面小或不精确,不能利用临床数据更好地为临床从业者服务,二是没有对医院积累的临床真实数据进行深度分析,没有把该部分数据转化为知识,三是缺少将大量的医学知识整合在一起为临床人员提供服务的方式,医学知识至少包括如下几类:基础知识库、临床诊疗知识库、参考文献、从历史病例挖掘形成,本系统使用大数据框架技术,构建具有高效精准性能的数据检索系统,有模糊搜索、关键词搜索等具体的应用模式,且在各种复杂场景下的搜索性能表现也较为强健,具有快速响应和智能化的功能,精准地为医生提供检索服务。
类似症状患者定位时:类似症状患者定位的特色功能是通过输入患者病症,在标准化临床数据中心的大样本信息中,快速比对查找出类似症状的患者,从而帮助医生精确定位到疾病原因、诊断治疗方案和路径,找到针对目标患者的最佳诊疗方案,达到对疾病和特定患者进行个性化精准治疗的目的,基于临床数据中心的大数据,利用工具建立索引,在界面的检索输入框内,可以输入患者的姓名、年龄、诊断、治疗方案等字段进行检索,类似症状患者的定位,即类似症状患者检索,首先,需要对检索作基于语义的相似度的计算;然后分析待检索的一些特征,设置检索条件;最后是构建特征模型,特征模型的构建基于本体库包含某个症状的权重,可利用该知识对初始相似度做进一步修正,得出最终的相似度,由于症状词典词语较多,初步构建出的向量维度较大,从运算速度和语义意义上需要做降维处理,对所筛选出来的患者数据,构建一个特征向量的矩阵模型,接下来需要对矩阵模型做相似度计算,从而检索出类似患者,点击可查看患者的疾病原因、诊断治疗方案和路径,从而找到针对目标患者的最佳诊疗方案,辅助医生高效完成个性化精准化治疗方案的设计。
针推康科研服务时:针推康科研服务为医院医疗数据的开发利用打开了一个新视窗,随着大数据技术的发展和数据挖掘算法的不断优化,服务于临床科研的能力也进一步提高,基于针推康标准化数据中心,为科室各类用户提供个性化的科研服务,使医生和科研人员能够科学地管理科研病历,快速筛选和匹配样本信息,使数据分析结果可以直接用于科研,支撑医学研究,促进科研成果的转化与落地,本模块从科研数据的灵活提取和有效利用需求出发,提供更加灵活、便捷的数据利用工具,建立CRF表单数据库,诊疗过程中产生的临床数据,可以自动提取到预先设计好的CRF表单中,大大简化了科研过程中研究档案的收集整理工作,科研过程中可以自建分组,灵活选取一组患者,将患者拉入分组,同时支持预先设置好入组条件,后续符合条件的患者,系统将自动匹配入组。在本模块,集成Cox、t检验、回归分析等统计分析工具,可生成响应的统计模型,对研究结果进行预分析。
数据智能分析系统503应用:基于科室标准化的临床数据中心,采用语义标签化查询方式,并对标签进行自由组合作为检索条件,使得用户可灵活方便地进行多维度数据查询,实现各业务系统中数据的自动关联查询和导航,支持基于关键词的快捷模糊检索、支持对各类专项数据的精确检索。
智能数据分析,是指运用统计学、模式识别、机器学习、数据抽象等数据分析工具从数据中发现知识的分析方法,智能数据分析方法主要为两种类型,一是数据抽象,主要涉及数据的智能化解释,以及如何将这种解释以可视化或符号化的形式表示出来;二是数据挖掘,主要涉及从数据中分析和抽取知识,目的是为了支持业务管理或预测趋势,一方面,大数据分析相比传统的数据分析,具有数据量大、查询分析复杂等特点,因而需要有新的大数据分析方法和理论的出现,现有的单一智能数据分析方法已经不能全面、高效地胜任数据分析的工作,由此一种趋势是交叉融合多种智能数据分析技术的方法和技术应运而生,如模糊数学和其他理论融合形成了模糊人工神经网络、模糊遗传算法、模糊进化算法、模糊计算学习理论;演化计算和其他理论融合渗透形成了模糊演化算法、演化人工神经网络等,另一方面大数据的智能分析技术的发展有赖于新型的数据存储和组织技术以及新的高效率的计算方法的支持,数据存储和组织技术应该采用的更好的分布式的数据存储策略,并尽量提高数据的吞吐效率、降低故障率,利用客户端的分析挖掘工具,对数据进行挖掘,最后根据实际情况产生不同的图表以及报表。通过报表的设计,不同用户所看见的信息与界面是不同的。
基础平台建设:平台提供统一支持服务,包括统一用户管理、统一组织管理、系统日志等功能,提供全体实名用户的用户资料信息集中存储,这些资料由统一用户认证后集中管理,平台管理员可以维护所有人员的用户信息,用户具备某个权限之后,在该系统中具有用户身份,由于用户信息由平台统一管理,因此就需要将用户信息同步到应用系统中。同步的用户信息指的是用户的帐号信息,平台具备通用的用户信息,负责将统一帐号信息以通用的接口方式发送给各个应用系统,按照平台的规范性要求实现自身的用户信息同步接口,获取统一用户信息后,完成用户从平台到各系统的新增、修改、删除的同步操作,日志管理功能是平台基础管理另一个必备的模块,系统具备用户同步日志管理功能,可以查看同步是否成功,同步不成功时也可以看到具体的错误跟踪信息,系统具备用户登录日志管理功能,可以査看用户的登录情况,在功能组件方面,应用支撑平台提供强大的流程、用户、角色、业务表单等定制工具,实现跨应用系统、跨部门、跨系统平台的应用和数据的共享、传输和流转。

Claims (6)

1.针推康数据标准化系统,包括院内业务系统(1)、标准化处理系统(2)、平台层(4)、应用层(5)和展现层(6),其特征在于:所述标准化处理系统(2)包括数据抽取系统(201)、数据脱敏系统(202)和数据清洗系统(203),所述平台层(4)包括节点管理系统(401)、数库适配器(402)、文件适配器(403)、日志管理系统(404)、数据传输转换文件(405)、交换元数据(406)和管理核心元数据(407),所述应用层(5)包括临床应用服务系统(501)、病种科研服务系统(502)和数据智能分析系统(503),所述展现层(6)包括展现系统(601)、展现实施单元(602)和展现实施器(603),所述院内业务系统(1)的Webservice窗口与数据抽取系统(201)的输入端连接,所述数据抽取系统(201)的输出端与数据脱敏系统(202)的输入端连接,所述数据脱敏系统(202)的输出端与数据清洗系统(203)的输入端连接,所述数据清洗系统(203)的输出端与针推康标准化数据中心(3)的输入端连接,所述针推康标准化数据中心(3)的输出端与管理核心元数据(407)的输入端连接,所述管理核心元数据(407)的输出端与交换元数据(406)的输入端连接,所述交换元数据(406)的输出端与日志管理系统(404)的输入端连接。
2.根据权利要求1所述的针推康数据标准化系统,其特征在于:所述日志管理系统(404)的输出端与节点管理系统(401)的输入端连接,所述节点管理系统(401)的输出端与数库适配器(402)的输入端连接。
3.根据权利要求1所述的针推康数据标准化系统,其特征在于:所述数库适配器(402)的输出端与文件适配器(403)的输入端连接,所述文件适配器(403)的输出端与数据传输转换文件(405)的输入端连接。
4.根据权利要求1所述的针推康数据标准化系统,其特征在于:所述数据传输转换文件(405)的输出端与临床应用服务系统(501)的输入端连接,所述临床应用服务系统(501)的输出端与病种科研服务系统(502)的输入端连接。
5.根据权利要求1所述的针推康数据标准化系统,其特征在于:所述病种科研服务系统(502)的输出端与数据智能分析系统(503)的输入端连接,所述数据智能分析系统(503)的输出端与展现系统(601)的输入端连接。
6.根据权利要求1所述的针推康数据标准化系统,其特征在于:所述展现系统(601)的输出端与展现实施单元(602)的输入端连接,所述展现实施单元(602)的输出端与展现实施器(603)的输入端连接。
CN201911391093.4A 2019-12-30 2019-12-30 针推康数据标准化系统 Withdrawn CN111243748A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911391093.4A CN111243748A (zh) 2019-12-30 2019-12-30 针推康数据标准化系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911391093.4A CN111243748A (zh) 2019-12-30 2019-12-30 针推康数据标准化系统

Publications (1)

Publication Number Publication Date
CN111243748A true CN111243748A (zh) 2020-06-05

Family

ID=70879447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911391093.4A Withdrawn CN111243748A (zh) 2019-12-30 2019-12-30 针推康数据标准化系统

Country Status (1)

Country Link
CN (1) CN111243748A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183771A (zh) * 2020-08-18 2021-01-05 北京城建信捷轨道交通工程咨询有限公司 一种轨道交通智能运维生态系统及其运行方法
CN112347266A (zh) * 2020-09-11 2021-02-09 湖南中医药大学 儿童康复专科术语标准化系统
CN112486967A (zh) * 2020-11-27 2021-03-12 智业软件股份有限公司 一种数据采集方法、终端设备及存储介质
CN112632618A (zh) * 2020-12-30 2021-04-09 深圳市华傲数据技术有限公司 一种标签人群数据的脱敏方法、装置及计算机设备
CN113704811A (zh) * 2021-07-16 2021-11-26 杭州医康慧联科技股份有限公司 数据价值管理方法
CN116936124A (zh) * 2023-09-18 2023-10-24 中电科大数据研究院有限公司 一种健康医疗标准体系构建方法、系统及装置
CN117216040A (zh) * 2023-11-08 2023-12-12 中电数据服务有限公司 基于医疗数据运营模式下的数据分层治理设计方法及系统
CN117995332A (zh) * 2024-04-07 2024-05-07 北方健康医疗大数据科技有限公司 一种值域代码标准化转换系统及方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183771A (zh) * 2020-08-18 2021-01-05 北京城建信捷轨道交通工程咨询有限公司 一种轨道交通智能运维生态系统及其运行方法
CN112347266A (zh) * 2020-09-11 2021-02-09 湖南中医药大学 儿童康复专科术语标准化系统
CN112486967A (zh) * 2020-11-27 2021-03-12 智业软件股份有限公司 一种数据采集方法、终端设备及存储介质
CN112632618A (zh) * 2020-12-30 2021-04-09 深圳市华傲数据技术有限公司 一种标签人群数据的脱敏方法、装置及计算机设备
CN112632618B (zh) * 2020-12-30 2024-04-16 深圳市华傲数据技术有限公司 一种标签人群数据的脱敏方法、装置及计算机设备
CN113704811A (zh) * 2021-07-16 2021-11-26 杭州医康慧联科技股份有限公司 数据价值管理方法
CN116936124A (zh) * 2023-09-18 2023-10-24 中电科大数据研究院有限公司 一种健康医疗标准体系构建方法、系统及装置
CN116936124B (zh) * 2023-09-18 2024-01-02 中电科大数据研究院有限公司 一种健康医疗标准体系构建方法、系统及装置
CN117216040A (zh) * 2023-11-08 2023-12-12 中电数据服务有限公司 基于医疗数据运营模式下的数据分层治理设计方法及系统
CN117216040B (zh) * 2023-11-08 2024-04-09 中电数据服务有限公司 基于医疗数据运营模式下的数据分层治理设计方法及系统
CN117995332A (zh) * 2024-04-07 2024-05-07 北方健康医疗大数据科技有限公司 一种值域代码标准化转换系统及方法

Similar Documents

Publication Publication Date Title
CN111243748A (zh) 针推康数据标准化系统
US11500818B2 (en) Method and system for large scale data curation
WO2022116430A1 (zh) 基于大数据挖掘的模型部署方法、装置、设备及存储介质
US7707045B2 (en) System and method for multi-dimensional extension of database information
CN109785927A (zh) 基于互联网一体化医疗平台的临床文档结构化处理方法
Lin et al. Temporal event tracing on big healthcare data analytics
JP7432801B2 (ja) デプスマップマッチングに基づく医療データエレメント自動化分類方法及びシステム
CN115497631A (zh) 一种临床科研大数据分析系统
Chennamsetty et al. Predictive analytics on electronic health records (EHRs) using hadoop and hive
KR102358038B1 (ko) Xml 기반의 의료 기관 데이터베이스 통합 관리 시스템
Wang et al. Automatic diagnosis with efficient medical case searching based on evolving graphs
CN113934750A (zh) 基于编译方式的数据血缘关系分析方法
CN111797296A (zh) 基于网络爬取的毒物-靶标文献知识挖掘方法及系统
Ren et al. Dimensional modeling of medical data warehouse based on ontology
US20200089664A1 (en) System and method for domain-specific analytics
Muniswamaiah et al. Data virtualization for decision making in big data
Sreevalli et al. Prediction of diseases using random forest classification algorithm
Safaei Text-based multi-dimensional medical images retrieval according to the features-usage correlation
Begoli et al. Real-time discovery services over large, heterogeneous and complex healthcare datasets using schema-less, column-oriented methods
Hu Research on monitoring system of daily statistical indexes through big data
CN115295165A (zh) 一种用于医学的知识图谱系统及其决策辅助方法
CN110853745A (zh) 一种皮肤病患者规范化系统
Su et al. [Retracted] Design and Application of Intelligent Management Platform Based on Big Data
Paneva-Marinova et al. Intelligent Data Curation in Virtual Museum for Ancient History and Civilization
WO2006005715A1 (en) System for interrogating heterogeneous databases and method for interrogation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200605