CN104361222A - 医联多病种影像特征库的构建方法 - Google Patents
医联多病种影像特征库的构建方法 Download PDFInfo
- Publication number
- CN104361222A CN104361222A CN201410605266.9A CN201410605266A CN104361222A CN 104361222 A CN104361222 A CN 104361222A CN 201410605266 A CN201410605266 A CN 201410605266A CN 104361222 A CN104361222 A CN 104361222A
- Authority
- CN
- China
- Prior art keywords
- data
- image
- image feature
- disease
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明提供了多病种影像特征库的构建方法。所述的基于区域医疗大数据的多病种影像特征库的构建方法包括:步骤1:问题确定步骤;步骤2:数据收集步骤;步骤3:数据抽取步骤:步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则;步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库;步骤4:将样本数据库中的数据录入特征库,经过验证后录入基于区域医疗大数据的多病种影像特征库。本发明可实现对影像数据中心平台所存储数据进行数据的抽取分析,获取有效的数据。
Description
技术领域
本发明涉及一种大数据挖掘技术的应用,具体涉及一种医学影像信息的分析、挖掘与应用。
背景技术
目前我国三级医院大多建有PACS系统,实现了影像数据的院内的统一存储和调用,在北京、上海、江苏等地还建成了多个区域影像共享中心,实现了区域内的影像共享和远程诊断。影像信息学的研究也逐渐转向了大数据应用。无论是医疗影像设备的发展带来的原始影像数据量的暴涨,还是医院内或是区域医疗联合体的大量建成,造就了许多拥有海量影像大数据的平台。
上海申康医院发展中心管理的覆盖全市34家三级医院的所有诊疗数据的“医联工程”项目,目前已经完成27家(4家分院)三级医院PACS系统联网工作,形成了日均约150GB的区域影像数据中心。该影像数据平台收集了大量的病例,医联影像中心现存的影像检查数据目前已达到1900多万人次。
医联平台中存在的海量数据一直以来都被认为有很高的价值,这些数据中包括了各类的诊疗数据,其中的影像类数据无疑极为庞大。如何能透过数据的表象从这些海量的数据中找到隐藏在数据背后的如数据之间的关系、数据特征以及数据发展趋势预测等信息?又如何能从中整理出对疾病的诊断有价值乃至对病人生存有价值的信息,供给医疗教育、辅助决策和医学科研等方面使用,从而提高医疗质量和服务品质?这些需求迫使我们引入大数据分析手段及一些有效数据建模的工具,来解决这些区域医疗建设中存在的问题。
在数字化系统较为普及的美国和日、韩等国,数字化软读片训练已经成为医学生的必修课程,因此基于PACS系统的影像特征资料库,就成为稳定和大容量、高速的教学平台。通过实践证明,利用影像特征库可以节省75%的影像医学教学准备时间,提高临床学习效率40%左右。与传统型医院相比,采用影像特征库的医疗机构影像专业住院医师培训周期缩短3-6个月,临床学科住院医师影像医学考核分值高7-16%。影像特征资料库能为临床不同层次教学提供有力后盾,使得临床教学自主化的实现变成可能。
发明内容
本发明的目的在于对医联工程影像数据平台存储的海量数据进行分析后,从中挖掘出符合疾病临床诊断、有较强特征性的病例建立区域医疗多病种的影像特征库,对院内医生进行影像诊断和教学学习起到重要的参考和支持作用,为院内专家的科研工作提供数据参考。
为了达到上述目的,本发明提供了一种基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,具体步骤包括:
步骤1:问题确定步骤:
分析目标应用病种,定义目标数据,所述的目标数据包括影像以及与之对应的影像学报告;
步骤2:数据收集步骤:
步骤2.1:数据选取步骤:
将影像原始数据库中的影像数据、非影像数据库中与影像匹配的报告表和电子病历中其他诊断结果收集形成初步数据集;
步骤2.2:数据预处理步骤:
消除初步数据集中的缺失数据和重复记录;
步骤3:数据抽取(筛选)步骤:
步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则;
步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库;
步骤4:将样本数据库中的数据录入特征库,经过验证后录入基于区域医疗大数据的多病种影像特征库。
优选地,所述的步骤4中,在录入特征库之前,先对样本数据库中的数据进行评估规则反馈步骤,所述的评估规则反馈步骤包括:从样本数据库中的数据中收集评估数据,通过从样本数据库中每病种随机导出多个数据形成临时数据表,对该表数据进行逐条检查,检查方法为针对临时表中的Yxzd、Yxbx、Jcbw字段是否符合抽取数据的具体规则,将符合抽取数据的具体规则的录入特征库,将不符合的数据抽出。
优选地,所述的步骤4中的验证步骤为在特征库系统上使用搜索模块验证是否有与搜索病种不相符的数据,将通过验证的数据录入基于区域医疗大数据的多病种影像特征库。
优选地,所述的步骤4还包括将没有通过验证的数据抽出并查看具体的数据字段,将这些字段汇总并与步骤3.1中确定的抽取数据的具体规则进行比对,并用于校正步骤3.1中的抽取数据的具体规则。
优选地,所述的步骤2中的影像数据包括X光、CT、MRI、DSA、ECT、PET、SPECT、PET-CT、超声和内窥镜影像数据。
优选地,所述的步骤1中的目标应用病种包括结直肠癌、胃癌、急性心肌梗塞、主动脉夹层、脑卒中(含脑梗塞、脑出血)、骨肿瘤、肺癌、乳腺癌和冠心病。
与现有技术相比,本发明的有益效果是:
1、本发明可实现对影像数据中心平台所存储数据进行数据的抽取分析,获取有效的数据(符合疾病临床诊断、有较强特征性的病例数据)将展示给医联联网医院影像及相关科室医生,供其参考、学习、科研使用。
2、本发明所述的,基于医联数据平台的影像样本能结合如患者体征、出院诊断、病理诊断等数据与影像描述内容进行大数据量挖掘分析,找出其中的规律,对于辅助医生对类似疾病的影像诊断有很大作用。
3、本发明所述的通过具有典型代表意义的样本影像,供医联联网医院影像及相关科室医生进行影像诊断参考、学习使用,与卫生部医学影像专业住院医师培训基本要求结合,起到教学意义不同于一般基于医院内PACS的医学影像学教学软件,具有样本资料基数更为庞大,带教人群更为广泛等的优势。
4、本发明所述的影像特征库系统可应用于科研。通过选定多病种影像特征库这种具有典型代表作用的业务场景应用进行分析,在病种影像特征库的基础上实现医学影像数据的分析利用,也能助力科研工作。
附图说明
图1为本发明实施例的一种影像特征库的整体工作流程图。
图2为本发明实施例的一种多病种样本影像特征资料库数据抽取规则图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
实施例1
如图1所示,基于区域医疗大数据的多病种影像特征库的构建方法,其步骤为:
步骤1、问题确定步骤;
分析目标应用病种,所述的目标应用病种包括结直肠癌、胃癌、急性心肌梗塞、主动脉夹层、脑卒中(含脑梗塞、脑出血)、骨肿瘤、肺癌、乳腺癌和冠心病。定义目标数据,所述的目标数据包括影像以及与之对应的影像学报告。
步骤2:数据收集步骤:
步骤2.1:数据选取步骤:
参照大数据技术架构,根据由问题确定阶段中得到的用户需求和专家的建议,从医联平台中将影像原始数据库“DICOMDB”中的影像数据、非影像数据库中与影像匹配的报告表和电子病历中其他诊断结果收集形成初步数据集;所述的影像数据包括X光、CT、MRI、DSA、ECT、PET、SPECT、PET-CT、超声和内窥镜影像数据。
步骤2.2:数据预处理步骤:
消除初步数据集中的缺失数据和重复记录;通过数据分析方法,如SQL语句:处理初步数据集没有影像的校验语句、处理电子病历接口数据中的空项数据语句,从初步数据集中找出真正有用的属性以减少数据挖掘时要考虑的属性或变量个数。
步骤3:数据抽取(筛选)步骤:
步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则,如图2所示;
步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库;
步骤4:将样本数据库中的数据进行评估规则反馈步骤,所述的评估规则反馈步骤包括:从样本数据库中的数据中收集评估数据,通过从样本数据库中每病种随机导出约100条数据形成临时数据表,对该表数据进行逐条检查,检查方法为针对临时表中的Yxzd、Yxbx、Jcbw字段是否符合抽取数据的具体规则,将符合抽取数据的具体规则的录入特征库,在特征库系统上使用搜索模块对目标病种进行查询,验证查询结果是否有与搜索的病种不相符的数据,将通过验证的数据录入基于区域医疗大数据的多病种影像特征库,将没有通过验证的数据抽出并查看具体的数据字段如Yxzd、Yxbx、Jcbw包含的字段,将这些字段汇总并与步骤3.1中确定的抽取数据的具体规则进行比对,并用于校正步骤3.1中的抽取数据的具体规则,完善步骤3.1中Yxzd、Yxbx、Jcbw字段抽取规则使其能过滤掉这些数据。抽取出的数据中可能存在冗余或与问题无关的模式,需要对结果进行解释和评估,及时反馈数据至步骤3.1。
Claims (6)
1.一种基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,具体步骤包括:
步骤1:问题确定步骤:
分析目标应用病种,定义目标数据,所述的目标数据包括影像以及与之对应的影像学报告;
步骤2:数据收集步骤:
步骤2.1:数据选取步骤:
将影像原始数据库中的影像数据、非影像数据库中与影像匹配的报告表和电子病历中其他诊断结果收集形成初步数据集;
步骤2.2:数据预处理步骤:
消除初步数据集中的缺失数据和重复记录;
步骤3:数据抽取步骤:
步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则;
步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库;
步骤4:将样本数据库中的数据录入特征库,经过验证后录入基于区域医疗大数据的多病种影像特征库。
2.如权利要求1所述的基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,所述的步骤4中,在录入特征库之前,先对样本数据库中的数据进行评估规则反馈步骤,所述的评估规则反馈步骤包括:从样本数据库中的数据中收集评估数据,通过从样本数据库中每病种随机导出多个数据形成临时数据表,对该表数据进行逐条检查,检查方法为针对临时表中的Yxzd、Yxbx、Jcbw字段是否符合抽取数据的具体规则,将符合抽取数据的具体规则的录入特征库,将不符合的数据抽出。
3.如权利要求1所述的基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,所述的步骤4中的验证步骤为在特征库系统上使用搜索模块验证是否有与搜索病种不相符的数据,将通过验证的数据录入基于区域医疗大数据的多病种影像特征库。
4.如权利要求1所述的基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,所述的步骤4还包括将没有通过验证的数据抽出并查看具体的数据字段,将这些字段汇总并与步骤3.1中确定的抽取数据的具体规则进行比对,并用于校正步骤3.1中的抽取数据的具体规则。
5.如权利要求1所述的基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,所述的步骤2中的影像数据包括X光、CT、MRI、DSA、ECT、PET、SPECT、PET-CT、超声和内窥镜影像数据。
6.如权利要求1所述的基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,所述的步骤1中的目标应用病种包括结直肠癌、胃癌、急性心肌梗塞、主动脉夹层、脑卒中、骨肿瘤、肺癌、乳腺癌和冠心病。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410605266.9A CN104361222A (zh) | 2014-10-31 | 2014-10-31 | 医联多病种影像特征库的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410605266.9A CN104361222A (zh) | 2014-10-31 | 2014-10-31 | 医联多病种影像特征库的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104361222A true CN104361222A (zh) | 2015-02-18 |
Family
ID=52528481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410605266.9A Pending CN104361222A (zh) | 2014-10-31 | 2014-10-31 | 医联多病种影像特征库的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104361222A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776750A (zh) * | 2018-04-20 | 2018-11-09 | 新疆维吾尔自治区胸科医院 | 一种耐药结核分枝杆菌库构建方法 |
CN110415791A (zh) * | 2019-01-29 | 2019-11-05 | 四川大学华西医院 | 一种病种库建立系统及方法 |
TWI696145B (zh) * | 2018-06-01 | 2020-06-11 | 國立臺灣大學 | 大腸鏡影像電腦輔助辨識系統及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814110A (zh) * | 2009-02-25 | 2010-08-25 | 中国联合网络通信集团有限公司 | 数据归档方法和系统、前置机 |
CN103093002A (zh) * | 2013-02-28 | 2013-05-08 | 谢星球 | 一种医疗影像通讯归档系统运行方法 |
CN103473466A (zh) * | 2013-09-22 | 2013-12-25 | 江苏美伦影像系统有限公司 | 一种医学影像处理装置 |
-
2014
- 2014-10-31 CN CN201410605266.9A patent/CN104361222A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814110A (zh) * | 2009-02-25 | 2010-08-25 | 中国联合网络通信集团有限公司 | 数据归档方法和系统、前置机 |
CN103093002A (zh) * | 2013-02-28 | 2013-05-08 | 谢星球 | 一种医疗影像通讯归档系统运行方法 |
CN103473466A (zh) * | 2013-09-22 | 2013-12-25 | 江苏美伦影像系统有限公司 | 一种医学影像处理装置 |
Non-Patent Citations (4)
Title |
---|
何萍等: "数据质量评估在区域医疗信息化中的应用与分析", 《中国数字医学》 * |
姚侃敏等: "基于区域医疗数据平台的多病种影像特征库的建设及应用情况", 《中国医疗设备》 * |
母晓莉等: "区域医疗影像数据中心存储系统研究与设计", 《中国数字医学》 * |
陆勇等: "医疗影像特征库的应用", 《中国数字医学》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776750A (zh) * | 2018-04-20 | 2018-11-09 | 新疆维吾尔自治区胸科医院 | 一种耐药结核分枝杆菌库构建方法 |
TWI696145B (zh) * | 2018-06-01 | 2020-06-11 | 國立臺灣大學 | 大腸鏡影像電腦輔助辨識系統及方法 |
CN110415791A (zh) * | 2019-01-29 | 2019-11-05 | 四川大学华西医院 | 一种病种库建立系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210158531A1 (en) | Patient Management Based On Anatomic Measurements | |
CN110598722B (zh) | 多模态神经影像数据自动信息融合系统 | |
CN104331469A (zh) | 医联多病种影像特征库系统 | |
Williams et al. | Process mining in primary care: a literature review | |
Fang | Visualizing the structure and the evolving of digital medicine: a scientometrics review | |
CN104115144A (zh) | 用于多维时域和相关数据挖掘框架、分析和子分组的系统、方法和计算机程序 | |
CN105528529A (zh) | 基于大数据分析的中医临床技能评价体系的数据处理方法 | |
US11037659B2 (en) | Data-enriched electronic healthcare guidelines for analytics, visualization or clinical decision support | |
Giorgio et al. | Efficient detection of ventricular late potentials on ECG signals based on wavelet denoising and SVM classification | |
CN112199425A (zh) | 基于混合数据库结构的医疗大数据中心及其建设方法 | |
Kumar et al. | Center of excellence for mobile sensor data-to-knowledge (MD2K) | |
CN106919804A (zh) | 基于临床数据的药物推荐方法、推荐装置及服务器 | |
CN103098061B (zh) | 临床状态时间线 | |
CN104361222A (zh) | 医联多病种影像特征库的构建方法 | |
Dössel et al. | Computer modeling of the heart for ECG interpretation—a review | |
Toyne et al. | An introduction to advances in Andean South American paleopathology | |
CN106295092A (zh) | 临床医疗的多维度数据分析方法和系统 | |
Zhu et al. | Robust heartbeat classification for wearable Single-Lead ECG via extreme gradient boosting | |
CN112863625A (zh) | 患者后续分析 | |
Li et al. | Big data is essential for further development of integrative medicine | |
Amara et al. | Design of a Breast Image Data Warehouse Framework | |
Al-Shanableh et al. | Predicting the number of multiple chronic conditions in Arizona state using data mining algorithms | |
JP2015011446A (ja) | 3次元画像解析表示制御装置および方法並びにプログラム | |
Dojat et al. | NeuroLOG: A framework for the sharing and reuse of distributed tools and data in neuroimaging | |
CN117831640A (zh) | 基于超算的医药产业数字孪生平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150218 |