CN108231136A - 一种医疗临床数据抓取预处理方法 - Google Patents

一种医疗临床数据抓取预处理方法 Download PDF

Info

Publication number
CN108231136A
CN108231136A CN201611131517.XA CN201611131517A CN108231136A CN 108231136 A CN108231136 A CN 108231136A CN 201611131517 A CN201611131517 A CN 201611131517A CN 108231136 A CN108231136 A CN 108231136A
Authority
CN
China
Prior art keywords
data
medicinal
grabber
preprocess method
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611131517.XA
Other languages
English (en)
Inventor
梁威
廖上平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha Biovision Software Technology Co Ltd
Original Assignee
Changsha Biovision Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha Biovision Software Technology Co Ltd filed Critical Changsha Biovision Software Technology Co Ltd
Priority to CN201611131517.XA priority Critical patent/CN108231136A/zh
Publication of CN108231136A publication Critical patent/CN108231136A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种医疗临床数据抓取预处理方法,所述方法针对医疗相关信息系统中抓取的通用格式的医学临床数据使用相关通用接口进行接收,并进行数据的格式化、规范化、数据排重、字段拆分、字段合并等数据处理,然后通过通用格式装载至数据中心。本发明对于采集的数据可以通过预处理流程自由组合,可实现逻辑处理,灵活性高,预处理流程可以写入JS\C#\VB等代码,实现各种复杂和特殊问题。

Description

一种医疗临床数据抓取预处理方法
技术领域
本发明涉及互联网技术领域,特别涉及医疗临床数据抓取过程中对数据的预处理方法。
背景技术
随着我国医院数字化、信息化建设的发展,医院信息管理系统(HIS)、检验信息系统(LIS)、影像系统(PACS)、体检管理系统(PEIS)、电子病历(EMR)等各种医疗子系统已被医院所采用。以往医院需要对各系统的数据进行关联并在院内共享,以方便在各个科室提取并分析数据。在现有的互联网时代,如能够将数据正确地提取、重构并利用互联网传输,将极大地提高医疗资源的灵活配置,使远程会诊、远程医疗成为一种常见的、低成本的、便捷的就诊手段。
在远程会诊、远程医疗系统的使用过程中,需要发起方将病案相关资料如病人信息、病情描述、检查信息等 通过Internet发送至受邀方进行诊断,其资料可能是文字、图片、音频、视频等。等待受邀方诊断完成后再将诊断结果、相关医嘱及报告返回给发起方,以完成一次诊断。而本发明用于解决发起方资料采集及发送的问题。
现有技术中,通常采取下述方式实现资料的采集:
第一,在远程会诊、远程医疗系统中提供资料上传的接口,例如支持文件的上传、文字或图片的扫描、摄像头的拍照等。同时部分系统支持实时的视频语音聊天,以支持问诊功能。采用该方式的优点在于:该方式无需介入医院自生的子系统,开发实施都较为简便。
第二,在远程会诊、远程医疗系统开发的过程中与各个医院的子系统做接口,进行数据的采集,并转换为自身可以识别的数据在远程会诊的过程中提供给受邀方查阅。采用该方式的优点在于:该方式可以整合医院所有子系统的数据,并且数据的准确性及完成性可以得到有效的保证。
第三,开发专有的远程会诊系统,使用特有的设备来支持该系统的运行,一般仅用医技相关科室。如远程病理系统,使用全自动数字切片扫描系统用以支持受邀方远程调整设备,进行标本检查,并出相关报告。采用该方式的优点在于:该方式可以让受邀方一定程度上控制检查的过程,以保证检查数据的有效性,提高诊断的正确性。
现有技术至少存在以下问题:
资料传输过来的数据存在很多重复的数据,无用的数据,错误的数据,导致数据的不完整性,无法具体完成数据的结构化和清晰化,使得数据展示和分析难度很大。
发明内容
为了解决现有技术的问题,本发明提供了一种医疗临床数据抓取预处理方法,所述技术方案如下:
本发明采用微软Windows Workflow Foundation对数据进行预处理,通过流程的逻辑处理,与数据中心的数据结合,对数据进行修改,删除,增加,排重,重构等一系列预处理。
针对医疗相关信息系统中,包括医院信息管理系统(HIS)、检验信息系统(LIS)、影像系统(PACS)、体检管理系统(PEIS)、电子病历(EMR)等各种医疗子系统抓取的通用格式的医学临床数据使用相关通用接口进行接收,并进行数据的格式化、规范化、数据排重、字段拆分、字段合并等数据处理,然后通过通用格式装载至数据中心。
所述通用格式可包含但不局限于XML、Json、CSV等常用文本数据交换格式,对于其他二进制数据采用Base64编码进行传输。
所述通用接口可包含但不局限于WebService、WCF、FTP等常用上层数据或文件传输通道。
所述数据处理使用微软Windows Workflow Foundation实现,Windows WorkflowFoundation支持自定义Activity,通过使用VsaEngine、CodeDom扩展Activity使其支持JScript、C#、VB等代码扩展,同时自定义Activity以支持常用的数据转换。
针对C/S结构医疗相关信息系统软件界面中抓取的医学临床数据进行整合提交;针对C/S结构医疗相关信息系统软件界面中抓取的医学临床数据在数据中心中,通过workflow让数据关联和自定义字段进行排重判定,更新和重新组合数据,并整合数据提交到数据中心。
抓取数据通过调用webservice提交到workflow数据流程入库工具,进行逻辑处理,修正数据,与数据中心中数据进行字段内容匹配、字段内容组合匹配、时间匹配、自定义字段关联匹配,判定重复并定位,更新数据中心相关记录。
本发明提供的技术方案带来的有益效果是:对于采集的数据可以通过预处理流程自由组合,可实现逻辑处理,灵活性高,预处理流程可以写入JS\C#\VB等代码,实现各种复杂和特殊问题。
对于常见数据转换可以使用自定义Activity对现有流程进行扩展,以实现更多、更简便的数据转换功能。
附图说明
图1数据抓取预处理流程示意图。
具体实施方式
本发明具体实施方式在于:
1、数据用JSON\XML格式通过调用WebService\FTP传送到服务端;
2、使用配置工具配置好相应的Windows Workflow Foundation数据预处理流程,以XML形式存储于流程服务器;
3、数据转换服务获取并解析数据。
4、数据转换服务根据数据标识使用微软Windows Workflow Foundation流程引擎转载对应的预处理流程对数据进行预处理。
5、数据转换服务根据数据标识使用微软Windows Workflow Foundation流程引擎转载对应的预处理流程对数据进行逻辑处理,判定数据是否新增,更新,或者丢弃。
6、重新处理后的数据导入至数据中心。
其流程引擎支持如下处理方式:
1.预处理流程既可访问数据本身也可访问元数据信息。
2.预处理流程可访问指定的数据库,支持新增、修改、删除的功能。
3.预处理流程支持异常处理。
4.预处理流程支持分支处理。
5.预处理流程支持事务处理。
6.预处理流程支持延迟处理。
7.同一类数据使用同一流程进行处理。
数据抓取预处理流程
1.采集数据客户端配置处理该数据的预处理流程标识,定义数据元数据。
2.根据采集到数据格式及业务功能,定义数据处理的方案。
3.根据数据处理的方案配置数据处理流程。
4.使用数据配置工具调试数据处理流程,无误后提交至流程服务器。
5.采集数据客户端配置流程服务器地址。
6.流程服务器接收采集数据客户端提交的数据,并解析数据。
7.流程服务器通过数据中包含的预处理流程标识装载预处理流程。
8.流程服务器使用流程引擎执行预处理流程,完成数据预处理。

Claims (5)

1.一种医疗临床数据抓取预处理方法,其特征在于:
针对医疗相关信息系统中抓取的通用格式的医学临床数据使用相关通用接口进行接收,并进行数据的格式化、规范化、数据排重、字段拆分、字段合并等数据处理,然后通过通用格式装载至数据中心。
2.如权利要求1所述医疗临床数据抓取预处理方法,其特征在于:
所述通用格式可包含但不局限于XML、Json、CSV等常用文本数据交换格式,对于其他二进制数据采用Base64编码进行传输,所述通用接口可包含但不局限于WebService、WCF、FTP等常用上层数据或文件传输通道。
3.如权利要求1所述医疗临床数据抓取预处理方法,其特征在于:
所述数据处理使用微软Windows Workflow Foundation实现,Windows WorkflowFoundation支持自定义Activity,通过使用VsaEngine、CodeDom扩展Activity使其支持JScript、C#、VB等代码扩展,同时自定义Activity以支持常用的数据转换。
4.如权利要求1所述医疗临床数据抓取预处理方法,其特征在于:
针对C/S结构医疗相关信息系统软件界面中抓取的医学临床数据进行整合提交;针对C/S结构医疗相关信息系统软件界面中抓取的医学临床数据在数据中心中,通过workflow让数据关联和自定义字段进行排重判定,更新和重新组合数据,并整合数据提交到数据中心。
5.如权利要求1所述医疗临床数据抓取预处理方法,其特征在于:
抓取数据通过调用webservice提交到workflow数据流程入库工具,进行逻辑处理,修正数据,与数据中心中数据进行字段内容匹配、字段内容组合匹配、时间匹配、自定义字段关联匹配,判定重复并定位,更新数据中心相关记录。
CN201611131517.XA 2016-12-09 2016-12-09 一种医疗临床数据抓取预处理方法 Pending CN108231136A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611131517.XA CN108231136A (zh) 2016-12-09 2016-12-09 一种医疗临床数据抓取预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611131517.XA CN108231136A (zh) 2016-12-09 2016-12-09 一种医疗临床数据抓取预处理方法

Publications (1)

Publication Number Publication Date
CN108231136A true CN108231136A (zh) 2018-06-29

Family

ID=62637336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611131517.XA Pending CN108231136A (zh) 2016-12-09 2016-12-09 一种医疗临床数据抓取预处理方法

Country Status (1)

Country Link
CN (1) CN108231136A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109167724A (zh) * 2018-09-10 2019-01-08 四川长虹电器股份有限公司 一种api网关中实现数据预处理的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799809A (zh) * 2009-02-10 2010-08-11 中国移动通信集团公司 数据挖掘方法和数据挖掘系统
CN102054001A (zh) * 2009-10-28 2011-05-11 中国移动通信集团公司 一种数据挖掘系统中数据预处理的方法、系统及装置
CN104574248A (zh) * 2015-01-23 2015-04-29 广东众意医疗科技有限公司 区域卫生一体化信息管理系统
CN104715436A (zh) * 2013-12-13 2015-06-17 北京美智医疗科技有限公司 一种医疗信息采集和归档方法及系统
CN104915909A (zh) * 2015-07-01 2015-09-16 深圳市申泓科技有限公司 数据聚合平台

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799809A (zh) * 2009-02-10 2010-08-11 中国移动通信集团公司 数据挖掘方法和数据挖掘系统
CN102054001A (zh) * 2009-10-28 2011-05-11 中国移动通信集团公司 一种数据挖掘系统中数据预处理的方法、系统及装置
CN104715436A (zh) * 2013-12-13 2015-06-17 北京美智医疗科技有限公司 一种医疗信息采集和归档方法及系统
CN104574248A (zh) * 2015-01-23 2015-04-29 广东众意医疗科技有限公司 区域卫生一体化信息管理系统
CN104915909A (zh) * 2015-07-01 2015-09-16 深圳市申泓科技有限公司 数据聚合平台

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109167724A (zh) * 2018-09-10 2019-01-08 四川长虹电器股份有限公司 一种api网关中实现数据预处理的方法

Similar Documents

Publication Publication Date Title
CN106570307B (zh) 用于流化来自除纤颤器的病人信息的系统和方法
CN109584975B (zh) 医疗数据标准化处理方法及装置
US20170185714A1 (en) Radiology data processing and standardization techniques
US9691167B1 (en) Systems, apparatus and methods for collecting and storing raw scan data and software for performing data processing, image reconstruction and interpretation
US11250936B1 (en) Universal application integrator
CN103258137A (zh) 远程问诊方法
CN111008957A (zh) 医疗信息处理方法和装置
CN107491654A (zh) 一种数字化康复评定系统
EP4449441A1 (en) A computer implemented method and a system
US20140046694A1 (en) Systems and methods for synoptic element structured reporting
CN105446669A (zh) 基于虚拟打印机的医疗数据采集传输方法及其系统
CN113424267A (zh) 用于使用分散式计算平台按优先级来分析跨地理区域的健康数据的系统架构和方法
França et al. An overview of the impact of PACS as health informatics and technology e-health in healthcare management
CN108231136A (zh) 一种医疗临床数据抓取预处理方法
CN116824670A (zh) 基于微表情的问诊辅助方法、装置、设备及介质
CN112397178A (zh) 一种基于人工智能的医学影像分类处理系统
CN115579094B (zh) 一种多模态医疗数据湖构建方法及系统
US20230317278A1 (en) System for Aggregating, Analyzing, and Reporting Medical Information
CN111279424A (zh) 用于优化图像采集工作流的设备、系统和方法
CN204856498U (zh) 数字化心血管风险评估系统
JP2005044359A (ja) 読み取り可能なデータモデルをワークフローマネージメントシステムへ取り込むための装置
CN113539446A (zh) Ct图像标注方法及系统、存储介质及终端
CN110021446A (zh) 一种结合界面数据抓取采集dicom影像文件的方法
Pivithuru et al. E-patient Card: An Integrated Electronic Health Recording System for Patient
CN107741862A (zh) 一种桌面应用程序跨进程的数据抓取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180629