CN112635068A - 基于医保与死因监测数据的肿瘤现患监测方法及装置 - Google Patents
基于医保与死因监测数据的肿瘤现患监测方法及装置 Download PDFInfo
- Publication number
- CN112635068A CN112635068A CN202011356262.3A CN202011356262A CN112635068A CN 112635068 A CN112635068 A CN 112635068A CN 202011356262 A CN202011356262 A CN 202011356262A CN 112635068 A CN112635068 A CN 112635068A
- Authority
- CN
- China
- Prior art keywords
- tumor
- time period
- monitoring
- data
- death
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 309
- 238000012544 monitoring process Methods 0.000 title claims abstract description 183
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000004083 survival effect Effects 0.000 claims abstract description 81
- 238000003745 diagnosis Methods 0.000 claims description 42
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 25
- 201000010099 disease Diseases 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000009411 base construction Methods 0.000 claims description 5
- 238000003032 molecular docking Methods 0.000 claims description 5
- 238000012806 monitoring device Methods 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 3
- 201000011510 cancer Diseases 0.000 description 21
- 238000010586 diagram Methods 0.000 description 13
- 230000002496 gastric effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000003908 quality control method Methods 0.000 description 4
- 230000036541 health Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000006806 disease prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 210000002438 upper gastrointestinal tract Anatomy 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 208000031662 Noncommunicable disease Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000028659 discharge Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于医保与死因监测数据的肿瘤现患监测方法及装置,其中该方法包括:从医保系统中提取预设统计时间段内的新发肿瘤病例数据;从死因监测系统中提取预设统计时间段内的死因监测数据;根据预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,肿瘤病例生存状态信息库中包含:各肿瘤病例的生存状态信息;基于肿瘤病例生存状态信息库,统计预设统计时间段内多个预设时刻的观察生存率;根据预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值;根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。本发明能够更加准确实时地实现肿瘤现患监测。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于医保与死因监测数据的肿瘤现患监测方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
恶性肿瘤(癌症)对人们的健康构成了严重威胁。作为肿瘤监测领域的一个重要指标,现患率(流行率)可反映某一地区实际的肿瘤医疗负担。因而,如何准确实时地进行肿瘤现患监测,对于指导医疗资源配置政策、预防控制措施及科学研究工作均具有重要意义。
目前,现有技术中,主要通过在多个区域设立肿瘤登记点,来收集各个区域的肿瘤新发病例数据,进而将收集的肿瘤新发病例数据与死因监测系统的死因监测数据进行对接,以实现肿瘤现患监测,出具相关肿瘤现患监测报告。一方面,由于对肿瘤新发病例数据的采集、补充、质控工作耗时较长(例如,3年),肿瘤现患监测报告存在一定的滞后性;另一方面,由于肿瘤登记点未覆盖的区域很多,肿瘤现患监测工作难以在未覆盖区域开展。可见,依托于肿瘤登记工作的固有模式,肿瘤现患监测工作在提高人群覆盖度以及数据实时性方面面临很大的挑战。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例中提供了一种基于医保与死因监测数据的肿瘤现患监测方法,用以解决现有的肿瘤现患监测工作依托于肿瘤登记的固有模式,存在数据统计覆盖面受限且实时性差的技术问题,该方法包括:从医保系统中提取预设统计时间段内的新发肿瘤病例数据;从死因监测系统中提取预设统计时间段内的死因监测数据;根据预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,肿瘤病例生存状态信息库中包含:各肿瘤病例的生存状态信息;基于肿瘤病例生存状态信息库,统计预设统计时间段内多个预设时刻的观察生存率;根据预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值;根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。
本发明实施例中还提供了一种基于医保与死因监测数据的肿瘤现患监测装置,用以解决现有的肿瘤现患监测工作依托于肿瘤登记的固有模式,存在数据统计覆盖面受限且实时性差的技术问题,该装置包括:新发肿瘤病例数据获取模块,用于从医保系统中提取预设统计时间段内的新发肿瘤病例数据;死因监测数据获取模块,用于从死因监测系统中提取预设统计时间段内的死因监测数据;肿瘤病例生存状态信息库构建模块,用于根据预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,肿瘤病例生存状态信息库中包含:各肿瘤病例的生存状态信息;观察生存率统计模块,用于基于肿瘤病例生存状态信息库,统计预设统计时间段内多个预设时刻的观察生存率;肿瘤现患监测指标统计模块,用于根据预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值;肿瘤现患监测报告生成模块,用于根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。
本发明实施例中还提供了一种计算机设备,用以解决现有的肿瘤现患监测工作依托于肿瘤登记的固有模式,存在数据统计覆盖面受限且实时性差的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于医保与死因监测数据的肿瘤现患监测方法。
本发明实施例中还提供了一种计算机可读存储介质,用以解决现有的肿瘤现患监测工作依托于肿瘤登记的固有模式,存在数据统计覆盖面受限且实时性差的技术问题,该计算机可读存储介质存储有执行上述基于医保与死因监测数据的肿瘤现患监测方法的计算机程序。
本发明实施例中,利用从医保系统中提取预设统计时间段内的新发肿瘤病例数据,与从死因监测系统中提取该预设统计时间段内的死因监测数据进行对接,构建肿瘤病例生存状态信息库,进而基于构建的肿瘤病例生存状态信息库,统计该预设统计时间段内多个预设时刻的观察生存率,以便根据预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值,最后根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告,与现有技术中依托于肿瘤登记的肿瘤现患监测方案相比,本发明实施例中基于医保系统提取新发肿瘤病例数据,能够扩大现患监测人群的覆盖面,降低肿瘤数据收集与质控工作的投入成本,提高肿瘤现患监测报告的实时性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种基于医保与死因监测数据的肿瘤现患监测方法流程图;
图2为本发明实施例中提供的一种肿瘤部位划分及ICD-10疾病编码示意图;
图3为本发明实施例中提供的一种基于医保和死因监测数据进行肿瘤现患监测的具体实现流程图;
图4为本发明实施例中提供的A县上消化道恶性肿瘤现患统计结果示意图;
图5为本发明实施例中提供的一种基于医保与死因监测数据的肿瘤现患监测装置示意图;
图6为本发明实施例中提供的一种可选的基于医保与死因监测数据的肿瘤现患监测装置示意图;
图7为本发明实施例中提供的一种计算机设备示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
医保系统包括城镇职工基本医疗保险、新型农村合作医疗保险和城镇居民基本医疗保险三大基本医疗保险,数据覆盖面很大。由于肿瘤属于重大慢性非传染性疾病,对医疗资源的需求与消耗较大,对患者家庭造成的经济负担较重,因此选择医保进行报销的肿瘤患者比例理论上可接近100%,由此可以看出,医保系统可作为实时捕捉肿瘤病例的一个理想数据来源,因而,在更广泛区域内构建基于医保和死因监测数据的肿瘤现患监测系统,是可行、实时与高效的。
基于上述发明构思,本发明实施例中提供了一种基于医保与死因监测数据的肿瘤现患监测方法,用于基于医保系统提供的医保数据,来确定某一统计时间段内的新发肿瘤病例数据,结合死因监测系统提供的死因监测数据,计算该统计时间段内多个预设时刻的观察生存率,结合新发肿瘤病例数据,实现该统计时间段的最大时刻的肿瘤现患监测。本发明实施例中涉及到的医保数据和死因监测数据均为大数据。
本发明实施例中提供了一种基于医保与死因监测数据的肿瘤现患监测方法,图1为本发明实施例中提供的一种基于医保与死因监测数据的肿瘤现患监测方法流程图,如图1所示,该方法包括如下步骤:
S101,从医保系统中提取预设统计时间段内的新发肿瘤病例数据。
在一个实施例中,上述S101可以通过如下步骤来实现:从医保系统中提取第一时间段、预设统计时间段和第二时间段内各个患者的报销记录信息,第一时间段为与预设统计时间段相邻且发生在预设统计时间段的最小时刻之前的一个时间段,第二时间段为与预设统计时间段相邻且发生在预设统计时间段的最大时刻之后的一个时间段;根据第一时间段、预设统计时间段和第二时间段内每个患者的报销记录信息,筛选出第一时间段、预设统计时间段和第二时间段内的肿瘤病例数据;根据第一时间段内的肿瘤病例数据,剔除预设统计时间段内的现患病例数据,并根据第二时间段内的肿瘤病例数据,补充预设统计时间段内未统计到的肿瘤病例数据,得到预设统计时间段内的新发肿瘤病例数据。
例如,统计某一地区2014-2018年新发肿瘤病例的2018年末现患率,可从医保系统获取时间跨度为2012年1月1日-2019年6月30日的报销记录。其中,2012-2013年(即上述第一时间段)的报销记录用于识别并剔除在2014-2018年(即上述预设统计时间段)报销记录中的现患病例,2019年1月1日-6月30日(即上述第二时间段)的报销记录用于补充因报销结算延迟而未出现在2014-2018年医保报销记录中的肿瘤新发病例。最终,从住院报销结算记录提取的2014-2018年新发肿瘤病例用于现患统计。
可选地,本发明实施例中从医保系统中提取的报销记录信息中至少包含:疾病文字诊断信息和/或疾病分类编码,肿瘤病例数据为疾病文字诊断信息中包含肿瘤关键字或词或疾病分类编码属于肿瘤分类编码的患者的病例数据。
在具体实施时,可提取《国际疾病分类》第10版(简称ICD-10)中所有提示肿瘤的关键字或词(例如,“癌”、“肉瘤”、“恶性肿瘤”、“白血病”、“淋巴瘤”、“霍奇金”等)构建肿瘤诊断字典,将出院诊断含有肿瘤诊断字典中任一个关键字或词的医保报销记录导出;根据ICD-10中的肿瘤相关代码(即上述肿瘤分类编码),将疾病诊断对应ICD编码中以C00-C97开头的医保报销记录导出。
图2示出了本发明实施例中提供的一种肿瘤部位划分及对应的ICD-10疾病编码,图2中a表示除外鼻咽癌,b表示除外C16.0。
需要说明的是,从医保系统中提取的关键变量还可包括性别、出生年份、入院日期、诊断所在医院名称、文字诊断、ICD-10编码和报销日期等信息。由于数据安全与隐私保护是开展本项工作的重要前提和基础。因而,在导出数据的过程中,需对姓名、身份证号、医疗证号等用户个人敏感信息进行遮盖。本发明实施例中通过十六进制加密算法,对新发肿瘤病例数据中的用户个人敏感信息进行加密处理,生成“无意义唯一识别代码”对患者的身份进行标记,以供后续数据对接及数据清理。
在一个实施例中,本发明实施例中提供的基于医保与死因监测数据的肿瘤现患监测方法,还可以包括如下步骤:构建肿瘤诊断字典,肿瘤诊断字典包含:多个肿瘤关键字或词;基于构建的肿瘤诊断字典,判断疾病文字诊断信息中是否包含肿瘤关键字或词。
S102,从死因监测系统中提取预设统计时间段内的死因监测数据。
在具体实施时,可采用十六进制加密算法,对死因监测数据中包含的用户个人敏感信息进行加密处理。
S103,根据预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,肿瘤病例生存状态信息库中包含:各肿瘤病例的生存状态信息。
具体地,上述S103可以通过如下步骤来实现:将死因监测数据与新发肿瘤病例数据库进行对接,得到基于死因监测的第一肿瘤病例死亡名单信息;根据第一肿瘤病例死亡名单信息和基于随访数据得到的第二肿瘤病例死亡名单信息,生成肿瘤病例生存状态信息库。
S104,基于肿瘤病例生存状态信息库,统计预设统计时间段内多个预设时刻的观察生存率。
在具体实施时,本发明实施例中计算特定时长观察生存率的方法,可参照国际癌症研究机构(International Agency for Research on Cancer,IARC)于2002年、2013年分别发表于International Journal of Cancer的《全球恶性肿瘤现患估计》,以及我国国家癌症中心于2016年发表于Cancer letters的《2011年中国恶性肿瘤现患报告》,此处不再赘述。
S105,根据预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值。
需要说明的是,本发明实施例中统计的肿瘤现患监测指标可以是如下任意之一:现患病例数、现患率和现患发病比。
在具体实施时,本发明实施例中肿瘤现患统计的指标选用以及统计图表的制作,可参照IARC于2002年、2013年分别发表于International Journal of Cancer的《全球恶性肿瘤现患估计》,以及我国国家癌症中心于2016年发表于Cancer letters的《2011年中国恶性肿瘤现患报告》,此处不再赘述。
S106,根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。
具体地,在统计出现患病例数、现患率和现患发病比等肿瘤现患监测指标的指标值后,可以生成包含这些指标值的肿瘤现患监测报告。可选地,本发明实施例中生成的肿瘤现患监测报告可以是可视化图表,以更好地呈现某一统计时间段内新发肿瘤病例的肿瘤现患情况。
需要说明的是,根据本发明实施例上述S101~S106提供的方案,可以开发一个肿瘤现患监测系统,该肿瘤现患监测系统分别与医保系统、死因监测系统通信,根据医保系统提供的医保数据和死因监测系统提供的死因监测数据,实现某一时刻的肿瘤现患监测。
以统计某一地区2018年末的肿瘤现患率为例,图3为本发明实施例中提供的一种基于医保和死因监测数据进行肿瘤现患监测的具体实现流程图,如图3所示,首先需要从医保系统数据库中提取2018年当地按照性别(男、女)、年龄(1岁年龄别)划分的参保人数。2018年参保全人口的年龄性别构成可为2018年肿瘤现患率的计算提供人口基数(即分母)。
由于计算2018年现患率需要过去5年(2014-2018)的新发肿瘤病例数据,可从医保系统获取时间跨度为2012年1月1日-2019年6月30日的报销记录。其中,2012-2013年(即上述第一时间段)的报销记录用于识别并剔除在2014-2018年(即上述预设统计时间段)报销记录中的现患病例,2019年1月1日-6月30日(即上述第二时间段)的报销记录用于补充因报销结算延迟而未出现在2014-2018年医保报销记录中的肿瘤新发病例。最终,从住院报销结算记录提取的2014-2018年新发肿瘤病例用于一系列特定时长观察生存率的计算以及肿瘤现患的统计。
为了确保用户个人敏感信息不被泄漏,本发明实施例中,采用加密算法(例如,上述十六进制加密算法)对个人敏感信息进行遮盖处理,利用肿瘤分类编码和肿瘤诊断字典,导出肿瘤病例的报销记录信息。
为了提高准确性,本发明实施例中,将就诊医院按诊治资质从高到低进行等级标定,医院分级信息可参考中华人民共和国国家卫生健康委员会的官方数据。例如,标定为“三级”、“二级”、“一级或未分级”。排除低等级(例如“一级或未分级”)医院的肿瘤诊断,保留“三级”、“二级”医院的诊断记录,进行肿瘤诊断的自动判读与人工复核,例如,对疾病文字诊断与疾病分类编码信息进行计算机自动比对以明确肿瘤诊断信息。比对结果一致则确定诊断信息(肿瘤发病部位及诊断时间)。对于疾病编码或文字诊断信息不全或二者诊断部位不一致的记录,通过小组讨论、专家咨询进行人工判读与复核。人工判读原则为:明确部位与性质则判定为肿瘤诊断,若位置不明确但性质明确则归为其他部位,若性质不明确则予以剔除。
对于每个患者的每种肿瘤诊断,只保留入院时间最早的一条记录,排除后续重复诊断。保留入院时间在2014年1月1日-2018年12月31日期间的记录,构成2014-2018年当地“新发肿瘤病例库”,将当次入院日期定义为肿瘤诊断日期。
在获取到新发肿瘤病例数据后,对接疾病预防控制中心的死因监测数据库(被动随访)并辅以主动随访进行确认,可得到新发肿瘤病例库中各肿瘤病例的生存状态信息。需要注意的是,肿瘤患者生存状态的随访截止日期为2019年12月31日。
在具体实施时,从死因监测系统中导出2014年1月1日至2019年12月31日的死因监测数据。在遮盖个人敏感信息的同时,按照与医保系统导出时相同的十六进制加密算法,生成“无意义唯一识别代码”用于身份的标记,并导出相应的“无意义唯一识别代码”及死亡日期信息。按照“无意义唯一识别代码”,将导出的死因监测数据库和2014-2018年新发肿瘤病例库进行数据对接,得到基于死因监测数据的肿瘤病例死亡名单。
为确保肿瘤病例生存状态信息收集的准确性与全面性,需同步开展主动随访工作,对死亡病例进行核实与补充。以县级区域为例,在当地政府及乡镇卫生院的支持下,通过访谈村医获取肿瘤病例的死亡名单。将该名单同上述基于死因监测数据的死亡名单以及新发肿瘤病例库所提供的随访总名单进行比对,对于死亡信息不一致的肿瘤病例以及两份死亡名单均未包括的病例,再进行个体水平的主动随访(入户/电话等途径)以核实所有病例的生存信息(除外失访病例),最终形成“肿瘤病例生存状态库”。
N年观察生存率是指在一批随访的肿瘤患者中,生存期大于等于N年的患者所占的比例,常用寿命表法或Kaplan-Meier法进行估计。在观察生存率的分析过程中,患者死亡即为观察终点,包括死于肿瘤和死于其他原因。
本发明实施例中肿瘤现患监测所需的原始数据来源于上述的“新发肿瘤病例库”以及“肿瘤病例生存状态库”。
按照国际惯用的现患统计方法,现患病例数的估算基于一系列特定时长观察生存率以及各年度新发肿瘤病例数,计算方式参照以下公式:
其中,P(n)表示统计时长n年的现患病例数;ICk表示该地区k岁确诊的新发肿瘤病例数,Sk(t)表示k岁诊断的肿瘤病例的t年观察生存率。该公式基于以下假设:所有肿瘤病例都在相应发病年份的年中诊断;以半年为单位间隔的观察生存率曲线服从Weibull分布。5年现患率即为上述公式(1)计算出的5年现患病例数与统计时刻该地区总人口数的比值,即:
此外,现患发病比的计算,可参照以下公式:
以A县为例,报告当地2018年末上消化道恶性肿瘤现患率。本发明实施例中提供的基于医保与死因监测数据的肿瘤现患监测方法,可以具体包括:
①数据来源:
参保人口构成与住院报销结算记录均来源于A县全人群覆盖的医保系统,死亡数据来源于A县疾病预防控制中心的死因监测系统以及主动随访的补充。
②时间框架设定:
参保人口构成使用2018年的数据,住院报销记录的起止时间为2012年1月1日-2019年6月30日。死因监测数据的起止时间为2014年1月1日-2019年12月31日。对所有肿瘤患者的生存状态随访至2019年12月31日。肿瘤现患统计的时间点为2018年12月31日。
③生成“上消化道恶性肿瘤病例生存状态库(2019年末)”:
在遮盖个人敏感信息的前提下,利用ICD-10(C00-C97)及诊断字典识别并导出医保系统中的上消化道恶性肿瘤(食管癌、胃癌)相关的报销记录,形成“上消化道恶性肿瘤病例原始库”;剔除“一级或未分级医院”的诊断记录,仅保留二、三级医院的诊断记录,再进行诊断的自动判读与人工复核,形成“上消化道恶性肿瘤病例质控库”;保留每个病例的首条记录,再进一步剔除2012、2013、2019年的所有记录,形成“新发上消化道恶性肿瘤病例库(2014-2018)”。将该库同死因监测数据库进行对接,并辅以访谈村医,对死亡信息不一致或不明确的病例进行入户的主动随访,明确各个肿瘤患者的生存状态信息(除外失访病例)。
④统计分析:统计指标与计算方法参见上述内容,此处不再赘述。
根据本发明实施例中提供的基于医保与死因监测数据的肿瘤现患监测方法,得到A县上消化道恶性肿瘤现患统计的结果如图4所示。
基于同一发明构思,本发明实施例中还提供了一种基于医保与死因监测数据的肿瘤现患监测装置,如下面的实施例所述。由于该装置解决问题的原理与基于医保与死因监测数据的肿瘤现患监测方法相似,因此该装置的实施可以参见基于医保与死因监测数据的肿瘤现患监测方法的实施,重复之处不再赘述。
图5为本发明实施例中提供的一种基于医保与死因监测数据的肿瘤现患监测装置示意图,如图5所示,该装置包括:新发肿瘤病例数据获取模块51、死因监测数据获取模块52、肿瘤病例生存状态信息库构建模块53、观察生存率统计模块54、肿瘤现患监测指标统计模块55和肿瘤现患监测报告生成模块56。
其中,新发肿瘤病例数据获取模块51,用于从医保系统中提取预设统计时间段内的新发肿瘤病例数据;死因监测数据获取模块52,用于从死因监测系统中提取预设统计时间段内的死因监测数据;肿瘤病例生存状态信息库构建模块53,用于根据预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,肿瘤病例生存状态信息库中包含:各肿瘤病例的生存状态信息;观察生存率统计模块54,用于基于肿瘤病例生存状态信息库,统计预设统计时间段内多个预设时刻的观察生存率;肿瘤现患监测指标统计模块55,用于根据预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值;肿瘤现患监测报告生成模块56,用于根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。
在一个实施例中,上述新发肿瘤病例数据获取模块51还用于:从医保系统中提取第一时间段、预设统计时间段和第二时间段内各个患者的报销记录信息,第一时间段为与预设统计时间段相邻且发生在预设统计时间段的最小时刻之前的一个时间段,第二时间段为与预设统计时间段相邻且发生在预设统计时间段的最大时刻之后的一个时间段;根据第一时间段、预设统计时间段和第二时间段内每个患者的报销记录信息,筛选出第一时间段、预设统计时间段和第二时间段内的肿瘤病例数据;根据第一时间段内的肿瘤病例数据,剔除预设统计时间段内的现患病例数据,并根据第二时间段内的肿瘤病例数据,补充预设统计时间段内未统计到的肿瘤病例数据,得到预设统计时间段内的新发肿瘤病例数据。
可选地,上述新发肿瘤病例数据获取模块51提取的报销记录信息中至少包含:疾病文字诊断信息和/或疾病分类编码,肿瘤病例数据为疾病文字诊断信息中包含肿瘤关键字或词或疾病分类编码属于肿瘤分类编码的患者的病例数据。
在一个实施例中,如图6所示,本发明实施例中提供的基于医保与死因监测数据的肿瘤现患监测装置还包括:肿瘤诊断字典构建模块57,用于构建肿瘤诊断字典,肿瘤诊断字典包含:多个肿瘤关键字或词;肿瘤诊断字典查询模块58,用于基于构建的肿瘤诊断字典,判断疾病文字诊断信息中是否包含肿瘤关键字或词。
在一个实施例中,如图6所示,本发明实施例中提供的基于医保与死因监测数据的肿瘤现患监测装置还包括:加密模块59,用于采用十六进制加密算法,对新发肿瘤病例数据和死因监测数据中包含的用户个人敏感信息进行加密处理。
在一个实施例中,上述肿瘤病例生存状态信息库构建模块53还用于:将死因监测数据与新发肿瘤病例数据库进行对接,得到基于死因监测的第一肿瘤病例死亡名单信息;根据第一肿瘤病例死亡名单信息和基于随访数据得到的第二肿瘤病例死亡名单信息,生成肿瘤病例生存状态信息库。
可选地,上述肿瘤现患监测指标统计模块55确定的肿瘤现患监测指标可以是不限于如下任意之一:现患病例数、现患率和现患发病比。
基于同一发明构思,本发明实施例中还提供了一种计算机设备,用以解决现有的肿瘤现患监测工作依托于肿瘤登记的固有模式,存在数据统计覆盖面受限且实时性差的技术问题,图7为本发明实施例中提供的一种计算机设备示意图,如图7所示,该计算机设备70包括存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序,处理器702执行计算机程序时实现上述基于医保与死因监测数据的肿瘤现患监测方法。
基于同一发明构思,本发明实施例中还提供了一种计算机可读存储介质,用以解决现有的肿瘤现患监测工作依托于肿瘤登记的固有模式,存在数据统计覆盖面受限且实时性差的技术问题,该计算机可读存储介质存储有执行上述基于医保与死因监测数据的肿瘤现患监测方法的计算机程序。
综上所述,本发明实施例中提供了一种基于医保与死因监测数据的肿瘤现患监测方法、装置、计算机设备及计算机可读存储介质,利用从医保系统中提取预设统计时间段内的新发肿瘤病例数据,与从死因监测系统中提取预设统计时间段内的死因监测数据进行对接,构建肿瘤病例生存状态信息库,进而基于构建的肿瘤病例生存状态信息库,统计该预设统计时间段内多个预设时刻的观察生存率,以便根据该预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值,最后根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。与现有技术中依托于肿瘤登记的肿瘤现患监测方案相比,本发明实施例中基于医保系统提取新发肿瘤病例数据,能够扩大现患监测人群的覆盖面,降低肿瘤数据收集与质控工作的投入成本,提高肿瘤现患监测报告的实时性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于医保与死因监测数据的肿瘤现患监测方法,其特征在于,包括:
从医保系统中提取预设统计时间段内的新发肿瘤病例数据;
从死因监测系统中提取所述预设统计时间段内的死因监测数据;
根据所述预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,所述肿瘤病例生存状态信息库中包含:各肿瘤病例的生存状态信息;
基于所述肿瘤病例生存状态信息库,统计所述预设统计时间段内多个预设时刻的观察生存率;
根据所述预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值;
根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。
2.如权利要求1所述的方法,其特征在于,从医保系统中提取预设统计时间段内的新发肿瘤病例数据,包括:
从医保系统中提取第一时间段、预设统计时间段和第二时间段内各个患者的报销记录信息,所述第一时间段为与所述预设统计时间段相邻且发生在所述预设统计时间段的最小时刻之前的一个时间段,所述第二时间段为与所述预设统计时间段相邻且发生在所述预设统计时间段的最大时刻之后的一个时间段;
根据所述第一时间段、所述预设统计时间段和所述第二时间段内每个患者的报销记录信息,筛选出所述第一时间段、所述预设统计时间段和所述第二时间段内的肿瘤病例数据;
根据所述第一时间段内的肿瘤病例数据,剔除所述预设统计时间段内的现患病例数据,并根据所述第二时间段内的肿瘤病例数据,补充所述预设统计时间段内未统计到的肿瘤病例数据,得到所述预设统计时间段内的新发肿瘤病例数据。
3.如权利要求2所述的方法,其特征在于,所述报销记录信息中至少包含:疾病文字诊断信息和/或疾病分类编码,所述肿瘤病例数据为疾病文字诊断信息中包含肿瘤关键字或词或疾病分类编码属于肿瘤分类编码的患者的病例数据。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
构建肿瘤诊断字典,所述肿瘤诊断字典包含:多个肿瘤关键字或词;
基于构建的肿瘤诊断字典,判断疾病文字诊断信息中是否包含肿瘤关键字或词。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
采用十六进制加密算法,对新发肿瘤病例数据和死因监测数据中包含的用户个人敏感信息进行加密处理。
6.如权利要求1所述的方法,其特征在于,根据所述预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,包括:
将死因监测数据与新发肿瘤病例数据库进行对接,得到基于死因监测的第一肿瘤病例死亡名单信息;
根据所述第一肿瘤病例死亡名单信息和基于随访数据得到的第二肿瘤病例死亡名单信息,生成肿瘤病例生存状态信息库。
7.如权利要求1至6任一项所述的方法,其特征在于,所述肿瘤现患监测指标为如下任意之一:现患病例数、现患率和现患发病比。
8.一种基于医保与死因监测数据的肿瘤现患监测装置,其特征在于,包括:
新发肿瘤病例数据获取模块,用于从医保系统中提取预设统计时间段内的新发肿瘤病例数据;
死因监测数据获取模块,用于从死因监测系统中提取所述预设统计时间段内的死因监测数据;
肿瘤病例生存状态信息库构建模块,用于根据所述预设统计时间段内的新发肿瘤病例数据和死因监测数据,构建肿瘤病例生存状态信息库,所述肿瘤病例生存状态信息库中包含:各肿瘤病例的生存状态信息;
观察生存率统计模块,用于基于所述肿瘤病例生存状态信息库,统计所述预设统计时间段内多个预设时刻的观察生存率;
肿瘤现患监测指标统计模块,用于根据所述预设统计时间段内的新发肿瘤病例数据和各个预设时刻的观察生存率,确定一个或多个肿瘤现患监测指标的指标值;
肿瘤现患监测报告生成模块,用于根据各个肿瘤现患监测指标的指标值,生成肿瘤现患监测报告。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述基于医保与死因监测数据的肿瘤现患监测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至7任一项所述基于医保与死因监测数据的肿瘤现患监测方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011356262.3A CN112635068A (zh) | 2020-11-27 | 2020-11-27 | 基于医保与死因监测数据的肿瘤现患监测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011356262.3A CN112635068A (zh) | 2020-11-27 | 2020-11-27 | 基于医保与死因监测数据的肿瘤现患监测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112635068A true CN112635068A (zh) | 2021-04-09 |
Family
ID=75306500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011356262.3A Pending CN112635068A (zh) | 2020-11-27 | 2020-11-27 | 基于医保与死因监测数据的肿瘤现患监测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112635068A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582519A (zh) * | 2022-03-11 | 2022-06-03 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种基于多源数据的医院随访方法、装置及终端设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150178461A1 (en) * | 2013-12-19 | 2015-06-25 | International Business Machines Corporation | Group posture health risk management |
CN111696659A (zh) * | 2019-09-09 | 2020-09-22 | 北京市肿瘤防治研究所 | 基于医保大数据的肿瘤发病信息监测方法及装置 |
-
2020
- 2020-11-27 CN CN202011356262.3A patent/CN112635068A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150178461A1 (en) * | 2013-12-19 | 2015-06-25 | International Business Machines Corporation | Group posture health risk management |
CN111696659A (zh) * | 2019-09-09 | 2020-09-22 | 北京市肿瘤防治研究所 | 基于医保大数据的肿瘤发病信息监测方法及装置 |
Non-Patent Citations (4)
Title |
---|
RONGSHOU ZHENG ET AL.: ""National estimates of cancer prevalence in China, 2011"", 《ELSEVIER》, pages 33 - 38 * |
任南 主编: "《实用医院感染监测方法学》", 30 April 2012, pages: 84 - 95 * |
吴莎莎;周璇;肖治宇;陈冰;: "2013年-2015年某三级综合医院死亡病例死因分析", 中国病案, no. 05 * |
左婷婷: ""2006-2010年北京地区女性乳腺癌高精度生存分析"", 《CNKI》, pages 1 - 73 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582519A (zh) * | 2022-03-11 | 2022-06-03 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 一种基于多源数据的医院随访方法、装置及终端设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bottle et al. | Global comparators project: international comparison of hospital outcomes using administrative data | |
KR101873926B1 (ko) | 빅데이터 기반 의료자문 서비스 제공 방법 | |
Cheung et al. | Detecting residual/recurrent head neck squamous cell carcinomas using PET or PET/CT: systematic review and meta-analysis | |
Kirlidog et al. | A fraud detection approach with data mining in health insurance | |
Nordstrom et al. | Identification of metastatic cancer in claims data | |
Rosenberg et al. | Data quality in the Swedish quality register of gynecologic cancer–a Swedish Gynecologic Cancer Group (SweGCG) study | |
Strauss et al. | Identifying primary and recurrent cancers using a SAS-based natural language processing algorithm | |
Anis et al. | Oral cancer in the UAE: a multicenter, retrospective study | |
Aliabadi et al. | Electronic health record–based disease surveillance systems: a systematic literature review on challenges and solutions | |
Fondain et al. | Merkel cell carcinoma in France: a registries‐based, comprehensive epidemiological survey | |
Swaminathan et al. | Lack of active follow-up of cancer patients in Chennai, India: implications for population-based survival estimates | |
Shi et al. | Using health insurance reimbursement data to identify incident cancer cases | |
Yang et al. | Have health human resources become more equal between rural and urban areas after the new reform? | |
US7742933B1 (en) | Method and system for maintaining HIPAA patient privacy requirements during auditing of electronic patient medical records | |
Brierley et al. | The value of collecting population-based cancer stage data to support decision-making at organizational, regional and population levels | |
Lacy et al. | Development of a new staging system for recurrent oral cavity and oropharyngeal squamous cell carcinoma | |
Zigras et al. | Uptake of sentinel lymph node procedures in women with vulvar cancer over time in a population based study | |
CN111696659A (zh) | 基于医保大数据的肿瘤发病信息监测方法及装置 | |
Eng et al. | Uptake and impact of synoptic reporting in a community care setting | |
CN112635068A (zh) | 基于医保与死因监测数据的肿瘤现患监测方法及装置 | |
Badiye et al. | Morphologic variations of lip-print patterns in a Central Indian population: A preliminary study | |
Sheikhtaheri et al. | Development of a tool for comprehensive evaluation of population-based cancer registries | |
Ziamanesh et al. | Design and implementation of a national quality registry of thyroid cancer in Iran: study protocol | |
CN112509659A (zh) | 基于医保与死因监测数据的肿瘤患者生存监测方法及装置 | |
Okwor et al. | Survivorship of patients with head and neck cancer receiving care in a tertiary health facility in Nigeria |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |