CN105279375A - 一种基于Hadoop的区域医学影像存储系统 - Google Patents
一种基于Hadoop的区域医学影像存储系统 Download PDFInfo
- Publication number
- CN105279375A CN105279375A CN201510686905.3A CN201510686905A CN105279375A CN 105279375 A CN105279375 A CN 105279375A CN 201510686905 A CN201510686905 A CN 201510686905A CN 105279375 A CN105279375 A CN 105279375A
- Authority
- CN
- China
- Prior art keywords
- storage system
- image
- data
- medical image
- hadoop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种基于Hadoop的区域医学影像存储系统。本发明包括管理系统,管理系统中的用户管理主要是管理员用来管理系统的用户,严格管理用户对数据的进行操作的权限;数据管理主要用来管理云存储系统中的数据。商业云存储系统,由Hadoop的HDFS分布文件系统构建,用于存储医院不经常使用。私有云存储系统,由各个科室的高性能PC组成,通过光纤进行数据交互;私有云系统下包括各科室的图像采集工作站、诊断服务器以及打印服务器。通过本发明可以开展医学影像远程会诊、影像转诊、虚拟影像专科、远程教学、图像内容检索服务,实现区域内影像设备及影像诊断技术的充分共享和高效协作。
Description
技术领域
本发明属于数字化医疗信息技术领域,具体的讲,涉及一种基于Hadoop的分布式区域医学影像存储系统及医学影像存储格式。
背景技术
近年来,随着社会经济的不断发展,医疗影像信息化技术在各级、各类医院得到广泛应用,参考医学图像早已成为医生诊断的重要手段;随之而来的是每天产生大量的医学影像数据,并且还有不断增加的趋势,目前一所普通三甲医院每年处理的PACS影像规模已经达到TB到数十TB级别,因此如何更加有效地管理这些庞大的医学数据是医学工作者面对的难题。
就目前来讲,各大医院主要使用PACS(PictureArchivingandCommunicationSystems)系统来管理各种医学影像,区域PACS和大型医院的PACS通常采用集中式存储,存储架构大多采用“在线-近线-离线”三级存储模式,这种模式下,存储设备直接与主机相连,容量扩充不方便,维护升级困难,另外,区域PACS数据是PB级的,要保证所有数据的存储被高速实时访问,目前技术下,直连式存储显然满足不了这要求,即使是SAN(存储区域网络)和NAS(网络连接式存储)也难以实现。目前的架构下,远期影像数据一般是以离线方式,通过光盘库或磁带库的方式保存,实时访问困难,系统可用性差,而且安全性不高,存储数据的备份不足,很容易因硬盘故障或者其他不可抗力灾害等原因导致影像数据的大量丢失,造成不可恢复的损失。
PACS主要专注于应用层面,存储层面的专业性不够,此为现有技术的不足之处。而基于Hadoop的分布式文件系统HDFS可有效解决以上问题;
HDFS系统的优点:
1.适合处理PB量级的数据;
2.数据有极高的安全性:因为在默认情况下HDFS系统对每个数据块都建立了三个备份;
3.系统极易扩展:要想提升HDFS分布式系统的存储容量和计算能力只需增加服务器数量即可;
4.数据写入后很少修改,适合需要长时间保存的数据;
除了数据存储能力外,与HDFS同时存在的MapReduce可以对分布式文件系统中的数据块进行并行处理,从而在大大提升了系统的计算能力的同时也降低了算法的时间复杂度。
虽然Hadoop系统的以上特性可以支持海量数据的管理,但结合医院的临床实际得知Hadoop在构建医学图像存储系统以及在管理海量医学图像数据方面仍然存在以下问题:
1.在医学上常见的图像大小约为512KB左右,比如像CT、X光片等等,一般情况下一次拍摄的图像数量约为5MB左右,这比Hadoop当中默认的64MB数据块空间要小许多,HDFS文件系统中一旦存储了大量这样的小文件,势必会因为元数据过多而给HDFS中的NameNode节点带来极大的负担,从而导致整个集群的性能下降。
2.在临床医学当中对医学图像数据的实时性要求很高,而在HDFS系统当中写入数据时,要为每个数据块建立三份的数据拷贝,导致其写入能力较差,因此Hadoop的读写性能不太适合对实时性要求较高的临床应用。
鉴于上述Hadoop的特点,虽然在存储和计算方面有优势,但数据的实时性为其不足之处。
发明内容
本发明的目的在于针对现有技术的不足,提供了一种区域性医疗影像信息存储系统。
本发明所涉及的系统包括:
管理系统,包括用户管理和数据管理两大主要部分,用户管理主要是管理员用来管理系统的用户,严格管理用户对数据的进行操作的权限,保护数据安全及病人隐私;数据管理主要用来管理云存储系统中的数据。
商业云存储系统,由Hadoop的HDFS分布文件系统构建,用于存储医院不经常使用,但需要长期存储的大量影像数据,由区域影像数据中心存储。
私有云存储系统,由各个科室的高性能PC组成,通过光纤进行数据交互,该系统主要用于存储医院需要经常使用的数据,一般三个月内的影像存储在本地医院的私有云中,可以快速访问;私有云系统下包括各科室的图像采集工作站、诊断服务器以及打印服务器。
所述图像采集工作站有四个,分别为放射采集工作站,超声采集工作站、内科镜采集工作站和眼科采集工作站等。
所述诊断服务器为各科室医生进行诊断时所使用的计算机。
所述采集工作站采集到的图像格式均为无损DICM格式。
所述商业云存储系统和私有云存储系统通过光纤进行数据交互,每个私有云与多个下属服务器、工作站等通过光纤进行数据交互;
本发明的有益效果:
1.节约资源:使用本系统不再需要大量的胶片,而是直接使用数字化成像技术将医生和病人所需的图像资料展现出来;而且整个存储过程自动化成度高,可以极大的减少对人员的需要,由于采用了HDFS存储系统,拥有了无限大的网络存储空间,空间扩展也极为容易,只需增加廉价的PC客户端即可,从而又可以大幅度节省医院开销。
2.医院与社会效益:本系统一旦投入使用会给医疗机构的工作方式带来重大变革,医生可以通过Hadoop集群全面应用各种图像信息,更快地获取各个方面的有关病人的医疗信息和检查结果,因此可以提高医疗诊断效率。
3.通过构建基于云计算的区域医学影像存储中心,为后期开展医学影像远程会诊、影像转诊、虚拟影像专科、远程教学、图像内容检索服务,实现区域内影像设备及影像诊断技术的充分共享和高效协作,对于均衡医疗资源、提高基层医院的诊疗水平、提高影像设备的使用效率、提高医疗服务质量、降低医疗费用等方面具有重要的意义。
附图说明
图1.Hdp-DICOM文件格式。
图2a.为商业云存储系统总体框架结构图。
图2b.为私有云存储系统总体框架结构图。
图3.为系统的工作流程图。
具体实施方式
以下结合附图对本发明作进一步说明。
1医学图像存储格式,
根据Hadoop平台的优缺点,结合医学影像文件的特点和数据量,设计一种基于Hadoop的序列化医学图像存储格式—“Hdp-DICOM格式”,它主要以Key/Value键值对的形式将医学图像进行存储,非常适合HDFS系统,它主要的工作就是将病人检查时所形成的大量的较小的医学图像进行合并,形成一个适合HDFS系统存储的大文件,从而在提高Hadoop处理能力的同时又有效防止了NameNode节点因为元数据过多而降低系统的能力。
一般情况下,病人在做医学图像检查时,都会产生数量不等的医疗图片,比如像CT,每张图片的大小一般情况下约为512KB,前面我们也分析过,如果将这些小的图片直接存储到HDFS当中显然是不合适的,但我们发现,如果将这些小图合并到一起,那么其数据量非常接近HDFS数据块的默认大小64MB,因此将一个病人检查所形成的图像合并在一起,然后再将其存储到HDFS当中是非常适合的。所以我们采用Hdp-DICOM文件格式,就是将每个病人所检查的图像文件转化成键值(Key/Value)的形式合并在一起,然后进行保存,具体文件格式如附图1所示,其中Header表示文件起始位置,里面的信息包括文件名类型、文件类型、元数据以及结束标志;Record表示图像文件,其中包括文件名的长度、文件的长度等信息;Key和Value分别表示原始文件名及文件内容,由Key和Value构成键值对。
2存储架构
针对上述问题,采用私有云存储和商业云存储相结合的方式,参见图2a和图2b,更改区域PACS架构,将集中式存储改为分布式存储,去除“离线”部分,将“在线-近线-离线”三级存储架构更改为“在线-归档”二级存储架构,这样既可以满足PB级存储容量的需求,也可以实现原来“离线”数据的实时访问,提升系统可用性。
存储系统的总体布局采用了PC存储和分布存储(HDFS)相结合的二级存储体系,并通过管理软件、自动医疗仪器配合人工的方式来管理海量图像数据。三个月以内的数据都采用高端PC机存储在本科室内,三个月以上的数据则转换成Hdp-DICOM格式后转存到HDFS当中长期保存。
根据临床应用的实际情况,我们采用了PC存储与分布存储相结合的总体框架:
1.前台高性能PC存储:它的保存读取速度快,适应临床实时的要求,在每个科室内都使用一台高端PC机保存本科室三个月内的临床医学图像,因此也带来了较高的存储费用,并且提供的存储空间也比较有限。
2.后台HDFS存储:由于是分布式存储,因此它提供的存储空间巨大,且存储价格也最低,主要是对三个月以上合并后的医学图像数据长期保存及备份。我们还对病人的信息设置了保密机制,医生在对分布存储中的数据查阅时,需要发出查阅请求并且还要有足够的权限级别,否则系统不会显示出病人的相关信息。
实施例:
如图1所示,根据Hadoop平台的优缺点,结合医学影像文件的特点和数据量,设计的一种基于Hadoop的序列化医学图像存储格式—“Hdp-DICOM格式”,其中Header表示文件起始位置,里面的信息包括文件名类型、文件类型、元数据以及结束标志;Record表示图像文件,其中包括文件名的长度、文件的长度等信息;Key和Value分别表示原始文件名及文件内容,由Key和Value构成键值对。
如图2a和图2b所示,系统主要包括商业云存储系统以及区域内各个医院的私有云存储系统,其中,私有云系统还包括图像采集工作站、诊断服务器和打印服务器等终端设备,具体的讲:
1,商业云存储系统,由Hadoop的HDFS分布文件系统构建,用于存储医院不经常使用,但需要长期存储的大量影像数据,由区域影像数据中心存储;
2,私有云存储系统,由各个科室的高性能PC组成,通过光纤进行数据交互,该系统主要用于存储医院需要经常使用的数据,一般三个月内的影像存储在本地医院的私有云中,可以快速访问;私有云系统下包括各科室的图像采集工作站、诊断服务器以及打印服务器。
所述图像采集工作站包括有四个,分别为放射采集工作站,超声采集工作站、内科镜采集工作站和眼科采集工作站等;
所述诊断服务器为各科室医生进行诊断时所使用的计算机;
所述采集工作站采集到的图像格式均为无损DICM格式;
所述商业云存储系统和私有云存储系统通过光纤进行数据交互,每个私有云与多个下属服务器、工作站等通过光纤进行数据交互;
基于上述系统内容,本发明实施步骤如下,参照图3:
1,首先医院各图像采集工作站采集病人的各类医学影像。
2,对于三个月内的影像数据,则存储于本地的高性能服务器中,即各医院的私有云存储系统中。
3,对于三个月以上的影像数据,使用账号登陆区域影像存储中心,通过光纤网络将影像数据上传到商业云中存储。
4,医生读取高性能服务器上的数据,在诊断服务器上进行诊断。
5,如果医生要查阅病人的历史影像资料,可以通过有授权的账户登录系统,调阅相关影像或者下载。
6,需要打印的影像,先从高性能服务器上读取到打印服务器,然后打印出来供病人携带。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种基于Hadoop的区域医学影像存储系统,其特征在于包括:
管理系统,包括用户管理和数据管理两大主要部分,用户管理主要是管理员用来管理系统的用户,严格管理用户对数据的进行操作的权限,保护数据安全及病人隐私;数据管理主要用来管理云存储系统中的数据;
商业云存储系统,由Hadoop的HDFS分布文件系统构建,用于存储医院不经常使用,但需要长期存储的大量影像数据,由区域影像数据中心存储;
私有云存储系统,由各个科室的PC组成,通过光纤进行数据交互,主要用于存储医院需要经常使用的数据,一般三个月内的影像存储在本地医院的私有云中,可以快速访问;私有云存储系统包括各科室的图像采集工作站、诊断服务器以及打印服务器;
所述的HDFS分布文件系统中序列化医学图像存储格式采用“Hdp-DICOM格式”,它主要以Key/Value键值对的形式将医学图像进行存储。
2.根据权利要求1所述的一种基于Hadoop的区域医学影像存储系统,其特征在于:所述图像采集工作站有四个,分别为放射采集工作站,超声采集工作站、内科镜采集工作站和眼科采集工作站。
3.根据权利要求1所述的一种基于Hadoop的区域医学影像存储系统,其特征在于:所述诊断服务器为各科室医生进行诊断时所使用的计算机。
4.根据权利要求2所述的一种基于Hadoop的区域医学影像存储系统,其特征在于:所述采集工作站采集到的图像格式均为无损DICM格式。
5.根据权利要求1所述的一种基于Hadoop的区域医学影像存储系统,其特征在于:所述商业云存储系统和私有云存储系统通过光纤进行数据交互。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510686905.3A CN105279375A (zh) | 2015-10-22 | 2015-10-22 | 一种基于Hadoop的区域医学影像存储系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510686905.3A CN105279375A (zh) | 2015-10-22 | 2015-10-22 | 一种基于Hadoop的区域医学影像存储系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105279375A true CN105279375A (zh) | 2016-01-27 |
Family
ID=55148378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510686905.3A Pending CN105279375A (zh) | 2015-10-22 | 2015-10-22 | 一种基于Hadoop的区域医学影像存储系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105279375A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220338A (zh) * | 2017-05-25 | 2017-09-29 | 郑州云海信息技术有限公司 | 基于pacs的分层存储的方法、系统及存储设备 |
CN110096495A (zh) * | 2019-03-22 | 2019-08-06 | 武汉明炀大数据科技有限公司 | 精准医学大数据分析处理系统 |
CN112015344A (zh) * | 2020-08-28 | 2020-12-01 | 朱彦霞 | 一种基于dtfs的存储系统 |
CN113254533A (zh) * | 2021-06-04 | 2021-08-13 | 王兆河 | 一种适用于影像数据全球化存储的方法和结构 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751510A (zh) * | 2008-11-27 | 2010-06-23 | 杭州创业软件股份有限公司 | 基于多影像融合的全院级pacs系统 |
CN102368283A (zh) * | 2011-02-21 | 2012-03-07 | 麦克奥迪实业集团有限公司 | 一种基于数字切片的数字病理远程诊断系统及其方法 |
CN102831561A (zh) * | 2012-09-05 | 2012-12-19 | 重庆中迪医疗设备有限公司 | 医疗云存储系统 |
CN104463748A (zh) * | 2014-10-29 | 2015-03-25 | 广州河谷互动医疗科技有限公司 | 基于嵌入式操作系统与云平台的影像学医疗信息共享系统 |
-
2015
- 2015-10-22 CN CN201510686905.3A patent/CN105279375A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751510A (zh) * | 2008-11-27 | 2010-06-23 | 杭州创业软件股份有限公司 | 基于多影像融合的全院级pacs系统 |
CN102368283A (zh) * | 2011-02-21 | 2012-03-07 | 麦克奥迪实业集团有限公司 | 一种基于数字切片的数字病理远程诊断系统及其方法 |
CN102831561A (zh) * | 2012-09-05 | 2012-12-19 | 重庆中迪医疗设备有限公司 | 医疗云存储系统 |
CN104463748A (zh) * | 2014-10-29 | 2015-03-25 | 广州河谷互动医疗科技有限公司 | 基于嵌入式操作系统与云平台的影像学医疗信息共享系统 |
Non-Patent Citations (1)
Title |
---|
李彭军等: "基于HDFS的区域医学影像分布式存储架构设计", 《南方医科大学学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220338A (zh) * | 2017-05-25 | 2017-09-29 | 郑州云海信息技术有限公司 | 基于pacs的分层存储的方法、系统及存储设备 |
CN110096495A (zh) * | 2019-03-22 | 2019-08-06 | 武汉明炀大数据科技有限公司 | 精准医学大数据分析处理系统 |
CN112015344A (zh) * | 2020-08-28 | 2020-12-01 | 朱彦霞 | 一种基于dtfs的存储系统 |
CN113254533A (zh) * | 2021-06-04 | 2021-08-13 | 王兆河 | 一种适用于影像数据全球化存储的方法和结构 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102006054538B4 (de) | Verfahren zum Vorabrufen von Datensätzen | |
CN109979606B (zh) | 一种基于容器化构建微服务化医疗影像云及云胶片的方法 | |
CN102385633B (zh) | 虚拟存储目录的文件管理系统 | |
CN105260142B (zh) | 一种云存储区域医疗影像装置及运行方法 | |
US7411693B2 (en) | Image data dissemination system and method | |
CN102377827A (zh) | 多级云存储系统及其存储方法 | |
CN102831561A (zh) | 医疗云存储系统 | |
CN103607435A (zh) | 一种基于云计算的医学图像存储系统及方法 | |
CN104917843B (zh) | 云存储与医疗图像无缝对接系统 | |
CN108959660B (zh) | 一种基于hdfs分布式文件系统的存储方法及使用方法 | |
CN105279375A (zh) | 一种基于Hadoop的区域医学影像存储系统 | |
US8041156B2 (en) | Single-frame and multi-frame image data conversion system and method | |
Sirota-Cohen et al. | Implementation and benefits of a vendor-neutral archive and enterprise-imaging management system in an integrated delivery network | |
Lee et al. | Managing the CT data explosion: initial experiences of archiving volumetric datasets in a mini-PACS | |
US20130179462A1 (en) | Apparatus and Method for Viewing Medical Information | |
Liu et al. | Picture archiving and communication systems and electronic medical records for the healthcare enterprise | |
Madrigal et al. | Digital media archive for gross pathology images based on open-source tools and Fast Healthcare Interoperability Resources (FHIR) | |
US20160078173A1 (en) | Method for editing data and associated data processing system or data processing system assembly | |
Núñez-Gaona et al. | A dependable massive storage service for medical imaging | |
Gutiérrez-Martínez et al. | A software and hardware architecture for a high-availability PACS | |
Sudakov et al. | User clients for working with medical images in Ukrainian Grid infrastructure | |
Fennell et al. | PACS and Other Image Management Systems | |
Kumar | Literature based study on cloud computing for health and sustainability in view of covid19 | |
Li et al. | A two-level cloud storage system based on asynchronous message for medical image big data | |
JP6904878B2 (ja) | 読影管理システム及び読影管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160127 |