CN105718732A - 一种医疗数据采集分析方法及系统 - Google Patents
一种医疗数据采集分析方法及系统 Download PDFInfo
- Publication number
- CN105718732A CN105718732A CN201610038571.3A CN201610038571A CN105718732A CN 105718732 A CN105718732 A CN 105718732A CN 201610038571 A CN201610038571 A CN 201610038571A CN 105718732 A CN105718732 A CN 105718732A
- Authority
- CN
- China
- Prior art keywords
- data
- medical
- therapeutic scheme
- rdf
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G06F19/32—
-
- G06F19/325—
-
- G06F19/36—
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种医疗数据采集分析方法,包括以下步骤:1、将原始数据上传至数据平台;2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;5、对分析结论进行整理和分类,构建治疗方案知识库。本发明有针对性的采集人员的整个临床诊疗数据,通过对大量数据进行分析,做出临床辅助诊断、疾病预警和分析患者的行为,在临床上可以帮助医生制定更加有效的、精确的、个性化的治疗方案。
Description
技术领域
本发明涉及数据分析领域,具体涉及一种医疗数据采集分析方法及系统。
背景技术
既往患者的数据无法跟随患者移动,不容易对患者进行跟踪随访,对于国内患者失访现象非常严重,这就是为什么我国临床试验研究起步和进展缓慢的根本原因,我国患者在全世界排第一,但是临床研究在世界上排不上号,正式因为患者的数据没有保存,无法对各种手术治疗方法进行比对,分析,无法提供有效的数据说明,严重阻碍了医学研究工作的开展,和医学事业的发展。
发明内容
本发明所要解决的技术问题是提供一种医疗数据采集分析方法及系统。
本发明解决上述技术问题的技术方案如下:
一种医疗数据采集分析方法,包括以下步骤:
S1、将原始数据上传至数据平台;
S2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;
S3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;
S4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;
S5、对分析结论进行整理和分类,构建治疗方案知识库。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步的,所述步骤S1的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。
进一步的,所述步骤S1之前,还包括在前置服务器上对原始数据进行筛选和整理的步骤。
进一步的,所述步骤S4中的对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。
一种医疗数据采集分析系统,包括以下部分:
数据平台,用于存储上传的原始数据;
格式转换模块,用于采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;
数据库存储模块,用于通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;
统计分析模块,用于利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;
治疗方案知识库构建模块,用于对分析结论进行整理和分类,构建治疗方案知识库。
进一步的,所述数据平台存储的的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。
进一步的,还包括前置处理模块,用于前置服务器上对原始数据进行筛选和整理,并将处理后的数据发送给数据平台。
进一步的,所述统计分析模块对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。
本发明的有益效果是:本发明有针对性的采集人员的整个临床诊疗数据,分布式的存储可以存储海量的医疗数据,通过对大量的有效数据进行分析,做出临床辅助诊断、疾病预警和分析患者的行为,在临床上可以帮助医生更好的根据患者的临床信息制定更加有效的、精确的、个性化的治疗方案。实现了将病人的多次、异地的诊疗信息自动关联起来。
附图说明
图1为本发明方法流程图;
图2为本发明系统流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本发明的医疗数据采集分析方法,包括以下步骤:
在有条件部署前置服务器的地方,在前置服务器上部署数据采集工具,通过数据采集工具对数据进行整理和筛选后上传到数据平台;在没有条件部署前置服务器的地方,通过数据上报平台将数据上传到数据平台;
由于上传到数据平台的数据既包含结构化数据,如检验结果,病人基本信息等,又包括非结构化数据,如检查结果,病史等,为了更好的对这些数据进行分析,本发明没有使用传统的关系模型来描述这些数据,而是采用了RDF来描述这些数据。为了将这些数据转换为RDF格式的数据,本发明采用了基于CRF(条件随机域)和依存语法相结合的语义标注算法将这些数据转换为RDF格式的数据;
将这些RDF格式的数据进行分析,根据病人的基本信息通过数据挖掘算法将同一个病人的RDF数据关联起来存储到基于分布式文件系统的Hbase数据库中;
运用统计方法,机器学习方法对Hbase数据库中的数据进行分析,得出数据中的规律,分析出数据的潜在意义;
将分析后的数据运用在医疗领域,做出临床辅助诊断,帮助医生更好的根据患者的临床信息制定更加有效的、精确的、个性化的治疗方案。
一种医疗数据采集分析系统,包括以下部分:
数据平台,用于存储上传的原始数据;
格式转换模块,用于采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;
数据库存储模块,用于通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;
统计分析模块,用于利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;
治疗方案知识库构建模块,用于对分析结论进行整理和分类,构建治疗方案知识库。
所述数据平台存储的的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。
本系统还包括前置处理模块,用于前置服务器上对原始数据进行筛选和整理,并将处理后的数据发送给数据平台。
所述统计分析模块对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。
与现有技术相比,本发明具有以下的有益效果:
(1)实现了医疗数据的海量存储;
本发明采用了高可靠性、高性能、面向列、可伸缩的分布式存储系统Hbase,可以实现将海量的医疗数据存储起来,便于后面的分析。
(2)实现了对非结构化数据的分析;
为了有效的对非结构化的数据进行有效处理,本发明采用了基于CRF(条件随机域)和依存语法相结合的语义标注算法将非结构化数据转换为RDF格式的数据。
(3)实现了将病人的多次、异地的诊疗信息自动关联起来
本发明通过数据挖掘算法对标注后的RDF格式的数据进行关联分析,将同一个病人的多次、异地的诊疗信息关联起来存储到数据平台。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种医疗数据采集分析方法,其特征在于,包括以下步骤:
S1、将原始数据上传至数据平台;
S2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;
S3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;
S4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;
S5、对分析结论进行整理和分类,构建治疗方案知识库。
2.根据权利要求1所述的医疗数据采集分析方法,其特征在于,所述步骤S1的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况数据。
3.根据权利要求1所述的医疗数据采集分析方法,其特征在于,所述步骤S1之前,还包括在前置服务器上对原始数据进行筛选和整理的步骤。
4.根据权利要求1所述的医疗数据采集分析方法,其特征在于,所述步骤S4中的对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。
5.一种医疗数据采集分析系统,其特征在于,包括以下部分:
数据平台,用于存储上传的原始数据;
格式转换模块,用于采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;
数据库存储模块,用于通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;
统计分析模块,用于利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;
治疗方案知识库构建模块,用于对分析结论进行整理和分类,构建治疗方案知识库。
6.根据权利要求5所述的医疗数据采集分析系统,其特征在于,所述数据平台存储的的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。
7.根据权利要求5所述的医疗数据采集分析系统,其特征在于,还包括前置处理模块,用于前置服务器上对原始数据进行筛选和整理,并将处理后的数据发送给数据平台。
8.根据权利要求5所述的医疗数据采集分析系统,其特征在于,所述统计分析模块对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610038571.3A CN105718732B (zh) | 2016-01-20 | 2016-01-20 | 一种医疗数据采集分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610038571.3A CN105718732B (zh) | 2016-01-20 | 2016-01-20 | 一种医疗数据采集分析系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105718732A true CN105718732A (zh) | 2016-06-29 |
CN105718732B CN105718732B (zh) | 2018-07-27 |
Family
ID=56147986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610038571.3A Expired - Fee Related CN105718732B (zh) | 2016-01-20 | 2016-01-20 | 一种医疗数据采集分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105718732B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339593A (zh) * | 2016-08-31 | 2017-01-18 | 青岛睿帮信息技术有限公司 | 基于医疗数据建模的川崎病分类预测方法 |
CN106650229A (zh) * | 2016-11-09 | 2017-05-10 | 中国人民解放军第二军医大学第二附属医院 | 肾癌病例数字化信息管理系统 |
CN107025376A (zh) * | 2017-03-16 | 2017-08-08 | 西南医科大学附属医院 | 甲状腺疾病大数据统计管理系统及其管理方法 |
CN107610777A (zh) * | 2017-09-07 | 2018-01-19 | 广州九九加健康管理有限公司 | 健康管理平台的肿瘤康复管理及生存质量分析方法及系统 |
CN108133747A (zh) * | 2017-12-27 | 2018-06-08 | 苏州麦迪斯顿医疗科技股份有限公司 | 一种医疗用品出库方法、装置、终端及计算机可读介质 |
CN108511067A (zh) * | 2018-04-02 | 2018-09-07 | 武汉久乐科技有限公司 | 预警方法及电子设备 |
CN108538387A (zh) * | 2018-03-02 | 2018-09-14 | 北京广健君安健康管理有限公司 | 一种五治五养肿瘤治疗装置 |
CN110096495A (zh) * | 2019-03-22 | 2019-08-06 | 武汉明炀大数据科技有限公司 | 精准医学大数据分析处理系统 |
CN110189802A (zh) * | 2019-04-28 | 2019-08-30 | 万达信息股份有限公司 | 基于指标存储模型的双向映射队列研究信息系统 |
CN111178444A (zh) * | 2019-12-31 | 2020-05-19 | 山东中医药大学第二附属医院 | 一种基于向量分析的中药配方治疗效果统计方法 |
CN112614598A (zh) * | 2021-01-06 | 2021-04-06 | 尚林梅 | 基于大数据的医疗信息处理方法和系统 |
CN114547662A (zh) * | 2022-04-25 | 2022-05-27 | 华伦医疗用品(深圳)有限公司 | 基于图像传感器的医疗数据处理方法及其系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678665A (zh) * | 2013-12-24 | 2014-03-26 | 焦点科技股份有限公司 | 一种基于数据仓库的异构大数据整合方法和系统 |
US20140088989A1 (en) * | 2012-09-27 | 2014-03-27 | Balaji Krishnapuram | Rapid Learning Community for Predictive Models of Medical Knowledge |
CN104281570A (zh) * | 2013-07-01 | 2015-01-14 | 富士通株式会社 | 信息处理方法和装置以及机构名规范化方法和设备 |
CN104834826A (zh) * | 2015-05-25 | 2015-08-12 | 南京伯索网络科技有限公司 | 基于数据挖掘和图论技术的临床路径建立和优化方法及系统 |
-
2016
- 2016-01-20 CN CN201610038571.3A patent/CN105718732B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140088989A1 (en) * | 2012-09-27 | 2014-03-27 | Balaji Krishnapuram | Rapid Learning Community for Predictive Models of Medical Knowledge |
EP2713293A2 (en) * | 2012-09-27 | 2014-04-02 | Siemens Medical Solutions USA, Inc. | Rapid community learning for predictive models of medical knowledge |
CN104281570A (zh) * | 2013-07-01 | 2015-01-14 | 富士通株式会社 | 信息处理方法和装置以及机构名规范化方法和设备 |
CN103678665A (zh) * | 2013-12-24 | 2014-03-26 | 焦点科技股份有限公司 | 一种基于数据仓库的异构大数据整合方法和系统 |
CN104834826A (zh) * | 2015-05-25 | 2015-08-12 | 南京伯索网络科技有限公司 | 基于数据挖掘和图论技术的临床路径建立和优化方法及系统 |
Non-Patent Citations (2)
Title |
---|
周宇等: "面向关联数据的高校机构知识库构建方法研究", 《图书情报工作》 * |
毛亮: "基于模糊神经网络的智能医疗诊断辅助系统的研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339593A (zh) * | 2016-08-31 | 2017-01-18 | 青岛睿帮信息技术有限公司 | 基于医疗数据建模的川崎病分类预测方法 |
CN106339593B (zh) * | 2016-08-31 | 2023-04-18 | 北京万灵盘古科技有限公司 | 基于医疗数据建模的川崎病分类预测方法 |
CN106650229A (zh) * | 2016-11-09 | 2017-05-10 | 中国人民解放军第二军医大学第二附属医院 | 肾癌病例数字化信息管理系统 |
CN107025376A (zh) * | 2017-03-16 | 2017-08-08 | 西南医科大学附属医院 | 甲状腺疾病大数据统计管理系统及其管理方法 |
CN107610777A (zh) * | 2017-09-07 | 2018-01-19 | 广州九九加健康管理有限公司 | 健康管理平台的肿瘤康复管理及生存质量分析方法及系统 |
CN108133747B (zh) * | 2017-12-27 | 2021-09-28 | 苏州麦迪斯顿医疗科技股份有限公司 | 一种医疗用品出库方法、装置、终端及计算机可读介质 |
CN108133747A (zh) * | 2017-12-27 | 2018-06-08 | 苏州麦迪斯顿医疗科技股份有限公司 | 一种医疗用品出库方法、装置、终端及计算机可读介质 |
CN108538387A (zh) * | 2018-03-02 | 2018-09-14 | 北京广健君安健康管理有限公司 | 一种五治五养肿瘤治疗装置 |
CN108511067B (zh) * | 2018-04-02 | 2020-12-08 | 武汉久乐科技有限公司 | 预警方法及电子设备 |
CN108511067A (zh) * | 2018-04-02 | 2018-09-07 | 武汉久乐科技有限公司 | 预警方法及电子设备 |
CN110096495A (zh) * | 2019-03-22 | 2019-08-06 | 武汉明炀大数据科技有限公司 | 精准医学大数据分析处理系统 |
CN110189802A (zh) * | 2019-04-28 | 2019-08-30 | 万达信息股份有限公司 | 基于指标存储模型的双向映射队列研究信息系统 |
CN110189802B (zh) * | 2019-04-28 | 2023-05-02 | 万达信息股份有限公司 | 基于指标存储模型的双向映射队列研究信息系统 |
CN111178444A (zh) * | 2019-12-31 | 2020-05-19 | 山东中医药大学第二附属医院 | 一种基于向量分析的中药配方治疗效果统计方法 |
CN111178444B (zh) * | 2019-12-31 | 2023-06-02 | 山东中医药大学第二附属医院 | 一种基于向量分析的中药配方治疗效果统计方法 |
CN112614598A (zh) * | 2021-01-06 | 2021-04-06 | 尚林梅 | 基于大数据的医疗信息处理方法和系统 |
CN114547662A (zh) * | 2022-04-25 | 2022-05-27 | 华伦医疗用品(深圳)有限公司 | 基于图像传感器的医疗数据处理方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105718732B (zh) | 2018-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105718732A (zh) | 一种医疗数据采集分析方法及系统 | |
WO2023202508A1 (zh) | 一种基于认知图谱的全科患者个性化诊疗方案推荐系统 | |
JP6907831B2 (ja) | コンテキストベースの患者類似性の方法及び装置 | |
CN104699985A (zh) | 一种医疗大数据采集分析系统及方法 | |
CN101034410A (zh) | 一种医疗事件索引模型及基于该模型的电子病历系统 | |
Carrington et al. | Nursing informatics year in review | |
JP2016516231A (ja) | 医療意志決定時の支援としての医療提案のスコアを計算する方法 | |
CN1582443A (zh) | 病人数据挖掘 | |
CN104598764A (zh) | 基于电子病历实现异常病例和事件数据监测的系统及方法 | |
ZA202308369B (en) | Chronic pain internet plus management platform and construction method thereof | |
Canino et al. | On the analysis of diseases and their related geographical data | |
CN112232065A (zh) | 挖掘同义词的方法及装置 | |
CN112259243B (zh) | 一种基于双向GRUs的单病种临床路径构建方法及系统 | |
CN112466462B (zh) | 一种基于图深度学习的emr信息关联及演化方法 | |
Cadenas et al. | Context-aware fuzzy databases | |
Chen | Smart health and wellbeing [Trends & Controversies] | |
Lin et al. | An exploratory study using an openEHR 2-level modeling approach to represent common data elements | |
Comito et al. | Exploiting social media to enhance clinical decision support | |
Fang et al. | A study on specialist or special disease clinics based on big data | |
Ming et al. | AI assisted clinical diagnosis & treatment and development strategy | |
Sony et al. | Concept-based electronic health record retrieval system in healthcare IOT | |
Ren et al. | HMDFF: a heterogeneous medical data fusion framework supporting multimodal query | |
Liu et al. | PatientEG dataset: bringing event graph model with temporal relations to electronic medical records | |
US20160371457A1 (en) | System and Method for Data Analyzing of Health-Related Data | |
CN106354715A (zh) | 医疗词汇处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180727 Termination date: 20190120 |