CN112542220B - 基于住院病案首页的肿瘤登记随访数据处理方法及系统 - Google Patents
基于住院病案首页的肿瘤登记随访数据处理方法及系统 Download PDFInfo
- Publication number
- CN112542220B CN112542220B CN202011485864.9A CN202011485864A CN112542220B CN 112542220 B CN112542220 B CN 112542220B CN 202011485864 A CN202011485864 A CN 202011485864A CN 112542220 B CN112542220 B CN 112542220B
- Authority
- CN
- China
- Prior art keywords
- tumor
- information
- diagnosis
- pieces
- codes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 558
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 238000003745 diagnosis Methods 0.000 claims abstract description 263
- 238000000034 method Methods 0.000 claims abstract description 29
- 201000011510 cancer Diseases 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 20
- 238000012216 screening Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 26
- 230000000717 retained effect Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 7
- 230000003902 lesion Effects 0.000 description 6
- 206010025323 Lymphomas Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 208000028659 discharge Diseases 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 208000005623 Carcinogenesis Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000036952 cancer formation Effects 0.000 description 2
- 231100000504 carcinogenesis Toxicity 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011369 optimal treatment Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于住院病案首页的肿瘤登记随访数据处理方法及系统,该方法包括步骤:获得肿瘤患者的住院病案首页文本;从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。通过本发明,不仅可以完善记录肿瘤登记随访数据,而且可以从重复多余的信息中抽取出有效数据,避免重复冗余数据对后期例如发病率分析的影响,继而提高分析结果的准确性。
Description
技术领域
本发明涉及医疗信息处理技术领域,具体涉及一种基于住院病案首页的肿瘤登记随访数据处理方法及系统。
背景技术
肿瘤登记是国际公认的关于人群肿瘤发病信息收集的标准方法,目的是了解人群中恶性肿瘤的发病、死亡和生存状况,为肿瘤病因研究提供依据。传统的肿瘤登记随访主要由人工登记,然后基于行政区域逐级上报。人工登记方式受登记人员主观因素影响导致误差大,漏报高且效率低。随着计算机技术的发展,有人提出了基于计算机实现的登记系统,例如公开号为CN 109243551 A的中国发明专利申请提出了一种肿瘤登记随访网络直报系统,各登记处可将其汇总的数据直接上报系统,系统再将所有登记处上报的数据进行汇总。虽然该系统也会对重卡数据进行筛选,但是也仅仅是筛选重卡数据,而对于同一患者持有同一张卡也可能登记多条数据,且各登记处也是基于人工汇总方式获得数据,因此该方方案依然存在数据冗余或重复的情况,继而会导致依据肿瘤登记数据进行例如发病率计算等分析的结果不准确。
发明内容
为了改善现有技术中存在的肿瘤登记随访数据中存在着大量重复冗余数据的技术问题,提供一种基于住院病案首页的肿瘤登记随访数据处理方法及系统,可以消除重复或冗余的数据,以提高肿瘤登记随访数据的准确性,继而为后续数据分析提供更可靠的数据支持,例如提高发病率分析的准确性。
为实现上述目的,本发明采用的技术方案如下:
一方面,本发明实施例提供了一种基于住院病案首页的肿瘤登记随访数据处理方法,包括以下步骤:
获得肿瘤患者的住院病案首页文本文本;
从所述住院病案首页文本文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;
当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。
上述方案从单一肿瘤患者的角度而言的,针对于同一患者,先提取住院病案首页文本,然后再对住院病案首页文本中的信息进行分析。肿瘤的确诊都需要通过医院进行,确诊的过程中也需要住院,继而会产生住院病案,住院病案都会根据规定记录相关信息,因此病案首页文本中记载的信息的真实性准确性有保障,继而通过提取住院病案首页文本中的字段信息进行分析,避免了人工统计,不仅效率高,而且准确度高,准确度高体现在两方面,一是病案首页文本这个数据来源准确,二是机器处理的客观性更强,可以避免人为错误。数据真实准确,继而基于肿瘤信息进行的例如发病率、死亡率等分析的结果的准确度也被提高。
另外,通过对肿瘤诊断编码的分析,继而剔除重复或冗余的肿瘤信息,由于肿瘤诊断编码是病案首页文本中必有的字段信息,且诊断编码有相应的标准,可以保障准确性,因此基于肿瘤诊断编码进行重复冗余分析,可以有效保障本方案的可行性及可靠性。
所述肿瘤信息还包括确诊时间;所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息的步骤,包括:当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息。
确诊时间是肿瘤分析的一项重要参数,也是病案首页文本中的必有字段,记录确诊时间最早的肿瘤信息,更有利于对该种肿瘤的起始时间、发病历史等进行分析。也就是说,可以进行更多的分析,继而扩大肿瘤数据的应用面,还可以解决因时间记录不准确而导致后续肿瘤分析结果不准确的技术问题。
所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息的步骤,包括:
判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息;
判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。
研究分析,肿瘤的影响很大,在其病变过程中可能会引起很多其他部位的病变,即是说,虽然在不同住院病案中记录着不同的肿瘤诊断编码,但是很可能也是由于原有肿瘤病变引起的。上述方案中,肿瘤诊断编码是采用国际通用的ICD-10编码,通过对肿瘤诊断编码进行分类,即C00-C75、C81-C95为一类,C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1为另一类,针对于不同类别的肿瘤诊断编码进行不同处理,可以进一步消除实际为同一肿瘤导致的其他变异而引起的数据重复,进一步提高肿瘤登记随访数据的准确性。
所述判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息的步骤,包括:将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序;按照时间先后依次遍历,针对于肿瘤诊断编码为C00-C75或者C81-C95中的任一种的肿瘤信息,若当前肿瘤信息中的肿瘤诊断编码首次出现,则保留该条肿瘤信息;若当前肿瘤信息中的肿瘤诊断编码非首次出现,则剔除该条肿瘤信息。
若多条肿瘤信息中包含C82-C85中的任一种或多种肿瘤诊断编码时,则只保留该多条肿瘤信息中确诊时间最早的一条肿瘤信息。
所述判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息的步骤,包括:
所述多条肿瘤信息中,若肿瘤诊断编码仅包含D32-D33、D42-D43、D45-D47中的一种或多种,则仅保留确诊时间最早的一条肿瘤信息;
若肿瘤诊断编码仅包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则仅保留确诊时间最早的一条肿瘤信息;
若肿瘤诊断编码中包含D32-D33、D42-D43、D45-D47中的一种或多种,且包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则保留肿瘤诊断编码为D32-D33、D42-D43、D45-D47中任一种中,确诊时间最早的一条肿瘤信息,以及肿瘤诊断编码为C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种中,确诊时间最早的一条肿瘤信息。
采用以下方式判断肿瘤诊断编码是否重复:若所述肿瘤诊断编码中不包含小数点,则直接根据肿瘤诊断编码中的数字是否相同进行判断,若相同,则肿瘤诊断编码重复;若所述肿瘤诊断编码中包含小数点,则只根据肿瘤诊断编码中小数点前面的数字是否相同进行判断,若相同,则肿瘤诊断编码重复。
还包括步骤:根据保留下来的肿瘤信息中的肿瘤诊断编码和确诊时间,确定肿瘤患者的肿瘤种类和发病时间。
另一方面,本发明实施例提供了一种基于住院病案首页的肿瘤登记随访数据处理系统,包括:
接收单元,用于接收获得肿瘤患者的住院病案首页文本,并存储于缓存或固存;
信息提取单元,与所述接收单元通信,用于从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;
信息筛选单元,与所述信息筛选单元通信,用于在所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。
还包括癌种确定单元,与信息筛选单元通信,用于根据保留下来的肿瘤信息中的肿瘤诊断编码和确诊时间,确定肿瘤患者的肿瘤种类和发病时间。
与现有技术相比,本发明一方面通过提取住院病案首页文本中的字段信息继而进行分析的方式,避免了人工收集统计,不仅准确度高,而且效率极高;另一方面,通过对肿瘤诊断编码的分析,由于肿瘤诊断编码是病案首页文本中必有的字段信息,且诊断编码有相应的标准,可以保障准确性,因此基于肿瘤诊断编码进行重复冗余分析,可以有效保障本方案的可行性及可靠性。
本发明可以按标准的逻辑判定整合数据,提取并生成肿瘤登记数据的关键变量,以提高肿瘤登记随访数据的准确性、时效性,继而为后续数据分析提供更可靠的数据支持,例如提高发病率、发病构成的准确性。
基于本发明方法进行癌种归类和发病时间统计时,可以横向、纵向全局整合病案首页文本信息,实现肿瘤登记随访大数据标准提取、判定、整合、处理,避免重复、冗余、零散数据对患者癌种判定的干扰,保证个案癌种判定的准确性、同质性,为后期数据统计分析奠定精准数据基础(如发病率、发病构成等),继而提高分析结果的准确性。
针对于本发明还具有的其他优势将在后续的实施例中进行更细致的分析。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍, 应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1本发明基于住院病案首页的肿瘤登记随访数据处理方法的流程图。
图2为本发明实施例中剔除重复或冗余数据的流程图。
图3为本发明实施例中基于住院病案首页的肿瘤登记随访数据处理系统的框架图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,本实施例中提供了一种基于住院病案首页的肿瘤登记随访数据处理方法,包括以下步骤:
S100,获得肿瘤患者的住院病案首页文本。
恶性肿瘤的确诊都需要通过医院进行,几乎所有恶性肿瘤在确诊和治疗过程中必然经历住院环节,继而会产生住院病案。病案首页是由我国卫生部按照统一规范编制的用于记录病人基本情况、住院医疗及诊断核心信息、住院医疗费用等的病案概要性医学文书资料,也是各级卫生行政部门进行医疗监管、质控、审查等的主要依据,各医疗机构对每一位住院病人都会根据医疗规定记录相关信息,因此通过患者的住院病案首页文本可以提取到准确的诊疗信息,如个人信息,肿瘤诊断信息、治疗信息等。
本实施方法是基于个体肿瘤患者而言的,也就是说针对于每个肿瘤患者个体,执行本方法步骤S100-S300。因此,需要从所有的住院患者的住院病案首页文本中抽取出肿瘤患者的住院病案首页文本。
具体地,本步骤可以通过以下步骤实现:
S101,获得统计区域内所有的住院病案首页文本。
一般地,肿瘤登记是以户籍为单位统计区域内恶性肿瘤的发病死亡情况,例如采集本省内户籍的肿瘤患者数据报告省域内肿瘤流行情况、采集本市内的肿瘤患者数据报告市域内肿瘤流行情况,因此,此处只需要根据统计需求,采集本统计区域内所有的住院病案首页文本即可。这些住院病案首页文本中,既包括肿瘤患者的住院病案首页文本,又包括非肿瘤患者的住院病案首页文本。对于住院病案首页文本的获取,作为较优的实施方式,可从当地卫生健康委员会的信息管理机构获得,因其经过统一质控,信息完整无漏报,可以进一步提高数据源的质量。
S102,从所有的住院病案首页文本中,抽取出肿瘤患者的住院病案首页文本。
作为一种实施方式,可以从所述住院病案首页文本中提取出住院患者的个人信息,并判断所述住院病案首页文本中是否包含肿瘤信息,如果包含,则根据所述个人信息,抽取出该住院患者的所有的住院病案首页文本,或者抽取出该住院患者的仅包含有肿瘤信息的住院病案首页文本。
作为另一种实施方式,也可以先判断出住院病案首页文本中是否包含肿瘤信息,如果包含,则提取该住院病案首页文本中住院患者的个人信息,再根据个人信息提取出该住院患者所有的住院病案首页文本。
抽取出住院患者的住院病案首页文本后,可以从住院病案首页文本中提取所需的字段信息,例如可以包括:患者姓名、性别、出生日期、身份证号、户籍信息、民族、联系方式、出入院日期、出院诊断中全部肿瘤相关诊断名称及编码、病理类型名称及编码、出院状态等信息。具体抽取哪些信息,可以根据需要选择。
此处提取住院患者的个人信息的目的是作为身份标识,以便于提取出同一患者相关的住院病案首页文本,只要能实现身份标识即可,例如身份证号等,但如果要为了进一步丰富信息,也可以还包括姓名、家庭住址等信息。
本文中所述的肿瘤患者是指至少被确诊为一种肿瘤的患者,也就是至少有一条肿瘤信息中记录有一个肿瘤诊断编码。肿瘤信息是指记录有肿瘤相关信息的数据,例如记录有肿瘤诊断编码、肿瘤名称等信息的数据。作为一种实施方式,判断住院病案首页文本中是否含有肿瘤信息的方式是,判断出院诊断是否包含肿瘤相关诊断,例如是否包含ICD-10编码为C00-C97、D00-D48及Z51.0、Z51.1中的任一编码。
通常的,一份住院病案首页文本中只有一条肿瘤信息,一条肿瘤信息中记录有一个或多个肿瘤诊断编码。本文中所述的多个(包括后文提及之处)均表示两个或两个以上。当一条肿瘤信息中记录有多个肿瘤诊断编码时,如果该条肿瘤信息被保留,那么当然地,该条肿瘤信息中的所有肿瘤诊断编码都被保留。
抽取肿瘤患者的住院病案首页文本时,有两种实施方式,一种方式是提取出同一肿瘤患者的所有的住院病案首页文本,这样做的优势是可以相对完善该肿瘤患者的信息,以备后续可能有其他相关分析所用。另一种方式是只提取出该肿瘤患者仅包含有肿瘤信息的住院病案首页文本,例如提取出中西医住院病案首页文本中全部诊断里面有ICD-10编码为C00-C97、D00-D48及Z51.0、Z51.1中的任一编码的住院病案首页文本,这样做的优势是可以避免无肿瘤信息的住院病案首页文本的干扰,降低本发明基于住院病案首页文本的肿瘤登记随访数据处理的运算量,提高处理效率。
S200,从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码。
住院病案首页文本中记录的肿瘤信息一般包括肿瘤诊断编码,肿瘤名称诊断时间、病理类型等肿瘤相关信息,肿瘤诊断编码都是按照《国际疾病分类标准ICD-10》编制的,具有全球通用性,本步骤提取出肿瘤诊断编码,后续步骤仅以肿瘤诊断编码进行相应处理,一方面不仅提高本发明方法的通用性,另一方面也可以降低后续处理的运算量,若基于计算机实现,则可以降低计算机硬件成本,同时提高效率。
S300,(针对于同一肿瘤患者而言)判断肿瘤信息的条数,根据不同判断结果进行不同处理。若只有一条,则直接保留该条肿瘤信息;当肿瘤信息为多条,但每条肿瘤信息都不重复或冗余时,保留所有的肿瘤信息;当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。
本文中的保留肿瘤信息,也可以理解为从众多的肿瘤信息中抽取出所需的肿瘤信息。
基于保留下来的肿瘤信息,即可进行相应的分析。例如,针对于癌症种类和发病时间的统计应用时,就可以根据保留下来的肿瘤信息,确定癌症患者的肿瘤诊断编码和发病时间,即确定肿瘤患者的肿瘤种类和发病时间,例如,以保留下来的肿瘤信息中的肿瘤诊断编码作为该癌症患者的肿瘤诊断编码,即确定癌症种类,以该肿瘤信息中的确诊时间作为该癌症的发病时间。
因此,上述方法中,可选地,还可以包括步骤S400:根据保留下来的肿瘤信息中的肿瘤诊断编码和确诊时间,确定肿瘤患者的肿瘤种类和发病时间。由于本步骤中可选步骤,因此图中以虚线框表示。
因为根据研究分析,肿瘤在其病变过程中可能会引起很多其他部位的病变,即是说,虽然在不同肿瘤信息中记录着不同的肿瘤诊断编码,但是很可能也是由于原有肿瘤病变引起的(如转移性恶性肿瘤),实际上只能算做一个肿瘤类型。本方案中,并非像现有技术一样,将同一患者的所有的肿瘤信息都保留,而是将重复或冗余的肿瘤信息剔除,而是仅保留其中一条或两条肿瘤信息,继而可以提高保留的肿瘤信息的有效率,例如在进行肿瘤发病率分析时,不会导致同一肿瘤重复参与多次计算的情况,即不会导致某一肿瘤的发病率偏高的情况。
肿瘤信息中会包含确诊时间,确诊时间是肿瘤分析的一项重要参数。利用肿瘤数据进行后续相关分析,例如年度发病率分析,都是以第一次确诊肿瘤的时间作为发病时间的依据。因此,在更优化的方案中,当肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,优选保留确诊时间最早的一条或两条肿瘤信息。即,选择确诊原发恶性肿瘤时间最早的一次入院时间,作为该个体该肿瘤的发病时间。可以避免因反复入院治疗,多次肿瘤诊断对应多个入院时间,导致肿瘤最早确诊时间不准确导致病例的年度分类混乱,影响年度发病率的准确性。
当肿瘤信息为多条时,如果肿瘤诊断编码重复,仅保留其中确诊时间最早的一条肿瘤信息;如果肿瘤诊断编码冗余,仅保留其中确诊时间最早的一条或两条肿瘤信息。
在实施时,仅针对肿瘤诊断编码按照国际标准ICD-10的编码方式而言,判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则进一步判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息。判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级,且不参与优先级排序,即直接保留。
也就是说,当多条肿瘤信息中的肿瘤诊断编码中仅包含C00-C75或者C81-C95中的任一种或多种时,如果肿瘤诊断编码重复,则仅保留确诊时间最早的一条肿瘤信息(C00-C75、C81-C95是解剖部位明确的原发恶性肿瘤诊断编码,表达的肿瘤信息明确清楚且为原发肿瘤,是肿瘤登记数据统计中癌种分类的目标分类细目,因此,出现该类诊断即视为患者确诊为该原发恶性肿瘤,若出现同属上述范围的不同编码(仅比左起前三位,如C02),则视为多个原发肿瘤,分别记录癌种分类(需要合并部位的编码除外),因此直接保留该肿瘤信息),如果肿瘤诊断编码不重复,则保留全部肿瘤信息;当多条肿瘤信息中的肿瘤诊断编码中仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种时,如果肿瘤诊断编码冗余,则仅保留肿瘤诊断编码优先级最高的肿瘤信息中确诊时间最早的一条或两条肿瘤信息;当多条肿瘤信息中的肿瘤诊断编码中既包含C00-C75或者C81-C95中的任一种或多种,又包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种时,不管肿瘤诊断编码是否冗余(也就是包含有C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种的肿瘤信息全部都不保留),只要肿瘤诊断编码重复,则仅保留确诊时间最早的一条肿瘤信息,如不重复,则全部保留。
作为一种简单的处理方式,所述的重复是指肿瘤诊断编码相同。举例,肿瘤患者A具有两条肿瘤信息,一条肿瘤信息包含有:确诊时间2008年7月1日,肿瘤诊断编码为C43,另一条肿瘤信息包含有:确诊时间2011年3月1日,肿瘤诊断编码为C75,由于两个肿瘤诊断编码不重复,因此,两条肿瘤信息都要保留;但是,如果两条肿瘤信息中的肿瘤诊断编码都是C43,那么仅保留确诊时间2008年7月1日的那一条肿瘤信息。
另外,肿瘤诊断编码中有时候会带有小数点,在判断两个肿瘤诊断编码是否相同时,只判断小数点前面的数字是否相同。也就是说,若肿瘤诊断编码中不包含小数点,则直接根据肿瘤诊断编码中的数字是否相同进行判断,若相同,则肿瘤诊断编码重复;若肿瘤诊断编码中包含小数点,则只根据肿瘤诊断编码中小数点前面的数字是否相同进行判断,若相同,则肿瘤诊断编码重复。例如,两个肿瘤诊断编码分别为C34.2和C53.9,那么这两个肿瘤诊断编码不相同;若两个肿瘤诊断编码分别为C34.2和C34.9,那么这两个肿瘤诊断编码相同。
小数点后(即肿瘤诊断编码左起第五位表示肿瘤发生的亚部位,例如肺癌发生在肺的上叶、中叶等),因肿瘤随时间推移是一个发展的过程,会出现肿瘤累及范围逐渐扩大等,导致亚部位编码有所变化,因此,为保证记录肿瘤发生的最起源部位,且不重复记录发生在同一主部位的肿瘤,此处判定编码是否相同,仅比较主部位编码(即编码左起前三位),在出现主部位相同,亚部位不同(左起第五位)的多个编码时,记录出现时间最早的那一个。
作为更优化的处理方式,所述的重复既包含肿瘤诊断编码相同的情况,也包含肿瘤诊断编码相近的情况,例如肿瘤诊断编码C82-C85,这区间的肿瘤诊断编码之间相近。举例,肿瘤患者B具有两条肿瘤信息,一条肿瘤信息包含有:确诊时间2018年7月1日,肿瘤诊断编码为C82,另一条肿瘤信息包含有:确诊时间2019年7月10日,肿瘤诊断编码为C85,由于两个肿瘤诊断编码相近,因此,仅保留确诊时间2018年7月1日的那一条肿瘤信息。
C82-C85均为淋巴瘤编码,淋巴瘤是一种全身性的肿瘤疾病,常常因患者多次在不同医疗机构病检,进行不同程度的病理检查,病理分型程度不同,导致所报告淋巴瘤的诊断程度、诊断名称差异,因而会编码不同,但均同属淋巴瘤,适宜记为一例肿瘤,因此做以上处理。
另外,肿瘤诊断编码中包含C00-C75或者C81-C95中的任一种或多种,且肿瘤诊断编码不重复时,可以有两种处理方式,一种方式是直接将肿瘤诊断编码不重复的多条肿瘤信息并列记录;另一种方式是将确诊时间靠后的肿瘤信息补充记录在确诊时间最早的肿瘤信息中,也就是肿瘤诊断编码不重复的多条肿瘤信息记录在同一条记录里。
更具体地,判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息的步骤中,包括以下几种情况:
A)若肿瘤诊断编码仅包含D32-D33、D42-D43、D45-D47中的一种或多种,则仅保留确诊时间最早的一条肿瘤信息。例如,有两条肿瘤信息,一条肿瘤信息中的肿瘤诊断编码为D32,确诊时间为2011年6月1日,另一条肿瘤信息中的肿瘤诊断编码为D43,确诊时间为2017年7月5日,那么仅保留确诊时间为2011年6月1日的那条肿瘤信息。
D32-D33、D42-D43、D45-D47为中枢神经系统良性肿瘤,是肿瘤登记随访中规定必须登记的肿瘤,但是此类既与原发恶性肿瘤没有直接联系,也与恶性原发、恶性转移等没有直接关系,因此独立为一级进行判定并记录,可以提高数据处理结果的准确性。
B)若肿瘤诊断编码仅包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则根据肿瘤诊断编码的优先级,仅保留优先级最高的肿瘤信息中确诊时间最早的一条肿瘤信息。例如,有三条肿瘤信息,一条肿瘤信息中的肿瘤诊断编码为C77,确诊时间为2011年6月1日,另一条肿瘤信息中的肿瘤诊断编码为C80,确诊时间为2017年7月5日,另一条肿瘤信息中的肿瘤诊断编码为C96,确诊时间为2019年7月5日,那么仅保留确诊时间为2017年7月5日的那条肿瘤信息。
C)若肿瘤诊断编码中包含D32-D33、D42-D43、D45-D47中的一种或多种,且包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则保留肿瘤诊断编码为D32-D33、D42-D43、D45-D47中任一种中,确诊时间最早的一条肿瘤信息,以及肿瘤诊断编码为C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种中,优先级最高的肿瘤信息中确诊时间最早的一条肿瘤信息。例如,有三条肿瘤信息,一条肿瘤信息中的肿瘤诊断编码为D32,确诊时间为2011年6月1日,另一条肿瘤信息中的肿瘤诊断编码为D43,确诊时间为2017年7月5日,另一条肿瘤信息中的肿瘤诊断编码为C77,确诊时间为2019年1月5日,那么同时保留确诊时间为2011年6月1日的那条肿瘤信息,和确诊时间为2019年1月5日的那条肿瘤信息。
另外,当肿瘤诊断编码中既包含C76又包含C80时,仅记录包含C76的肿瘤信息。
请参阅图2,上述步骤S300中,当肿瘤信息为多条时,可以通过以下步骤实现:
S301,将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序,以便于按照时间先后依次处理每一条肿瘤信息;
S302,根据当前肿瘤信息中的肿瘤诊断编码进行不同处理:
1)若肿瘤诊断编码为C00-C75、C81、C86-C95中的任一种,则判断当前肿瘤信息中的肿瘤诊断编码是否与已保留的肿瘤信息中的肿瘤诊断编码相同,即判断当前肿瘤信息中的肿瘤诊断编码是否首次出现,若不同(首次出现),则保留本条肿瘤信息,进入下一条肿瘤信息分析,若相同(非首次出现),则剔除本条肿瘤信息,然后直接进入下一条肿瘤信息分析。
2)若肿瘤诊断编码为C82-C85中的任一种,则判断当前肿瘤信息中的肿瘤诊断编码是否与已保留的肿瘤信息中的肿瘤诊断编码相近,即判断已保留的肿瘤信息中的肿瘤诊断编码是否已包含有C82-C85中的任一种,如果不是,则保留本条肿瘤信息,进入下一条肿瘤信息分析,如果是,则剔除本条肿瘤信息,然后直接进入下一条肿瘤信息分析。
3)若肿瘤诊断编码为C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种,则判断是否已保留肿瘤诊断编码为C00-C75或者C81-C95中的任一种或多种的肿瘤信息,如果是,则剔除本条肿瘤信息,然后直接进入下一条肿瘤信息分析,如果不是,则暂时保留本条肿瘤信息,并进入下一条肿瘤信息分析,如果下一条肿瘤信息中的肿瘤诊断编码的优先级更高,则以优先级更高的肿瘤信息替换原保留的肿瘤信息,使得待遍历完所有的肿瘤信息后,仅保留肿瘤诊断编码优先级最高且确诊时间最早的一条或两条肿瘤信息。优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。
需要说明的是,本文中,针对于同一肿瘤患者,是从其全部肿瘤信息中剔除肿瘤诊断编码重复和冗余的肿瘤信息,仅保留不重复和不冗余的肿瘤信息,但是容易理解的,作为等同替换的实施方式,也可以是从全部肿瘤信息中抽取出不重复和不冗余的肿瘤信息另外单独记录。
容易理解的,上述步骤S302的处理过程仅是基于当前时间所获得的数据而言的,如果不断有新的数据进来,则不断执行步骤S302判断过程。例如,针对于患者A,假设当前保留下来的肿瘤信息中,肿瘤诊断编码为C76,如果新进来一条肿瘤信息,该肿瘤信息中的肿瘤诊断编码为C95,则将肿瘤诊断编码为C76的肿瘤信息替换为肿瘤诊断编码为C95的肿瘤信息。基于保留下来的确定癌症种类的应用中,则将该患者A的肿瘤诊断编码由C76更新为C95。
本发明方案并非像现有技术一样,将同一患者的所有的肿瘤信息都保留,或是单纯的剔除重复冗余诊断,而是将重复或多样的肿瘤相关诊断信息进行逐级迭代循环的逻辑判定,赋予个体真实的原发部位恶性肿瘤诊断编码继而保证最终获得的肿瘤分类信息能够真实的反应个体所发生的的全部原发恶性肿瘤诊断,摒除转移性癌、部位不明确癌等无效信息对数据的混淆以及对统计结果准确性的影响。例如在进行肿瘤发病率分析时,不会导致同一个体病案记录中的不同肿瘤诊断(但这些不同诊断间具备一定因果联系,抑或存在精确、模糊之区别)重复参与多次计算之情况,即不会导致某些肿瘤的发病率偏高的情况。
请参阅图3,本实施例中同时提供了一种基于住院病案首页文本的肿瘤登记随访数据处理系统,包括:
接收单元,用于接收获得肿瘤患者的住院病案首页文本,并存储于缓存或固存;
信息提取单元,与所述接收单元通信,用于从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;
信息筛选单元,与所述信息筛选单元通信,用于在所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息,例如保留确诊时间最早的一条或两条肿瘤信息。
上述系统中,还可以包括癌种确定单元,与信息筛选单元通信,用于根据保留下来的肿瘤信息,确定肿瘤患者的肿瘤诊断编码和确诊时间,继而确定肿瘤患者的肿瘤种类(癌种)和发病时间。通过统计所有肿瘤患者的肿瘤诊断编码和确诊时间,即可进行癌种归类及发病率等数据分析。
本系统是基于前述方法相同的发明构思而设计的,因此对于本系统中各个单元的具体操作未描述之处,可以参阅前述方法的相应描述,此处不再赘述。
另外,上述方法也可以编辑成计算机可读指令,并存储在计算机可读存储介质中,由处理器执行。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (7)
1.一种基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,包括以下步骤:
获得肿瘤患者的住院病案首页文本;
从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码、确诊时间;
当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息,包括:
判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息,包括:将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序;按照时间先后依次遍历,针对于肿瘤诊断编码为C00-C75或者C81-C95中的任一种的肿瘤信息,若当前肿瘤信息中的肿瘤诊断编码首次出现,则保留该条肿瘤信息;若当前肿瘤信息中的肿瘤诊断编码非首次出现,则剔除该条肿瘤信息;
判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。
2.根据权利要求1所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,若多条肿瘤信息中包含C82-C85中的任一种或多种肿瘤诊断编码时,则只保留该多条肿瘤信息中确诊时间最早的一条肿瘤信息。
3.根据权利要求1所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,所述判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息的步骤,包括:
所述多条肿瘤信息中,若肿瘤诊断编码仅包含D32-D33、D42-D43、D45-D47中的一种或多种,则仅保留确诊时间最早的一条肿瘤信息;
若肿瘤诊断编码仅包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则仅保留确诊时间最早的一条肿瘤信息;
若肿瘤诊断编码中包含D32-D33、D42-D43、D45-D47中的一种或多种,且包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则保留肿瘤诊断编码为D32-D33、D42-D43、D45-D47中任一种中,确诊时间最早的一条肿瘤信息,以及肿瘤诊断编码为C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种中,确诊时间最早的一条肿瘤信息。
4.根据权利要求1所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,采用以下方式判断肿瘤诊断编码是否重复:
若所述肿瘤诊断编码中不包含小数点,则直接根据肿瘤诊断编码中的数字是否相同进行判断,若相同,则肿瘤诊断编码重复;
若所述肿瘤诊断编码中包含小数点,则只根据肿瘤诊断编码中小数点前面的数字是否相同进行判断,若相同,则肿瘤诊断编码重复。
5.根据权利要求1所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,还包括步骤:根据保留下来的肿瘤信息中的肿瘤诊断编码和确诊时间,确定肿瘤患者的肿瘤种类和发病时间。
6.一种基于住院病案首页的肿瘤登记随访数据处理系统,其特征在于,包括:
接收单元,用于接收获得肿瘤患者的住院病案首页文本,并存储于缓存或固存;
信息提取单元,与所述接收单元通信,用于从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;
信息筛选单元,与所述信息筛选单元通信,用于在所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息,包括:判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息,包括:将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序;按照时间先后依次遍历,针对于肿瘤诊断编码为C00-C75或者C81-C95中的任一种的肿瘤信息,若当前肿瘤信息中的肿瘤诊断编码首次出现,则保留该条肿瘤信息;若当前肿瘤信息中的肿瘤诊断编码非首次出现,则剔除该条肿瘤信息;判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。
7.根据权利要求6所述的基于住院病案首页的肿瘤登记随访数据处理系统,其特征在于,还包括癌种确定单元,与信息筛选单元通信,用于根据保留下来的肿瘤信息中的肿瘤诊断编码和确诊时间,确定肿瘤患者的肿瘤种类和发病时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011485864.9A CN112542220B (zh) | 2020-12-16 | 2020-12-16 | 基于住院病案首页的肿瘤登记随访数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011485864.9A CN112542220B (zh) | 2020-12-16 | 2020-12-16 | 基于住院病案首页的肿瘤登记随访数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112542220A CN112542220A (zh) | 2021-03-23 |
CN112542220B true CN112542220B (zh) | 2024-07-09 |
Family
ID=75019019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011485864.9A Active CN112542220B (zh) | 2020-12-16 | 2020-12-16 | 基于住院病案首页的肿瘤登记随访数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112542220B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108257667A (zh) * | 2016-12-28 | 2018-07-06 | 中国科学院深圳先进技术研究院 | 一种数据处理方法及终端设备 |
CN111863158A (zh) * | 2020-07-06 | 2020-10-30 | 天津市疾病预防控制中心 | 一种肿瘤登记自动编码系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000268116A (ja) * | 1999-03-16 | 2000-09-29 | Ibm Japan Ltd | 生存時間解析のための診療支援システムおよびそれに用いるデータ自動抽出システム |
US20080288292A1 (en) * | 2007-05-15 | 2008-11-20 | Siemens Medical Solutions Usa, Inc. | System and Method for Large Scale Code Classification for Medical Patient Records |
CN109243551A (zh) * | 2017-07-11 | 2019-01-18 | 河南省肿瘤医院 | 一种肿瘤登记随访网络直报系统 |
CN107967948B (zh) * | 2017-12-07 | 2021-10-08 | 泰康保险集团股份有限公司 | 医疗大数据分析方法与装置 |
JP6588584B2 (ja) * | 2018-02-02 | 2019-10-09 | 公益財団法人がん研究会 | 構造化診療データ統合管理データベースを用いた匿名化医療情報検索支援システム |
CN108182977A (zh) * | 2018-02-05 | 2018-06-19 | 南方医科大学顺德医院(佛山市顺德区第人民医院) | 门诊诊断编码方法和系统 |
CN110444264B (zh) * | 2019-08-16 | 2023-04-14 | 宜昌市中心人民医院 | 基于DRGs的病案首页智能填写及训练系统 |
CN110739034A (zh) * | 2019-09-20 | 2020-01-31 | 上海金仕达卫宁软件科技有限公司 | 一种对病案数据进行DRGs分组的方法 |
CN111276203B (zh) * | 2020-01-20 | 2024-03-01 | 和宇健康科技股份有限公司 | 一种肿瘤自动登记分析方法及系统 |
-
2020
- 2020-12-16 CN CN202011485864.9A patent/CN112542220B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108257667A (zh) * | 2016-12-28 | 2018-07-06 | 中国科学院深圳先进技术研究院 | 一种数据处理方法及终端设备 |
CN111863158A (zh) * | 2020-07-06 | 2020-10-30 | 天津市疾病预防控制中心 | 一种肿瘤登记自动编码系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112542220A (zh) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pukkala et al. | Nordic Cancer Registries–an overview of their procedures and data comparability | |
Raab et al. | Clinical impact and frequency of anatomic pathology errors in cancer diagnoses | |
Bray et al. | Evaluation of data quality in the cancer registry: principles and methods. Part I: comparability, validity and timeliness | |
Széles et al. | A preliminary evaluation of a health monitoring programme in Hungary | |
Sung et al. | Papanicolaou smear history and diagnosis of invasive cervical carcinoma among members of a large prepaid health plan | |
Zarbo et al. | Error detection in anatomic pathology | |
Burhenne et al. | Interval breast cancers in the Screening Mammography Program of British Columbia: analysis and classification. | |
Broeders et al. | The impact of mammographic screening on breast cancer mortality in Europe: a review of observational studies | |
Parkin | The evolution of the population-based cancer registry | |
Cronin et al. | Case-control studies of cancer screening: theory and practice | |
Otto et al. | Effective PSA contamination in the Rotterdam section of the European Randomized Study of Screening for Prostate Cancer | |
Duijm et al. | Inter-observer variability in mammography screening and effect of type and number of readers on screening outcome | |
Glance et al. | Does date stamping ICD‐9‐CM codes increase the value of clinical information in administrative data? | |
Webster et al. | Validity of registry data: Agreement between cancer records in an end‐stage kidney disease registry (voluntary reporting) and a cancer register (statutory reporting) | |
CN113934895A (zh) | 一种辅助建立患者主索引的方法 | |
Kamineni et al. | Cervical cancer screening research in the PROSPR I consortium: rationale, methods and baseline findings from a US cohort | |
Zhu et al. | An empiric modification to the probabilistic record linkage algorithm using frequency-based weight scaling | |
Colgan et al. | Reparative changes and the false-positive/false-negative Papanicolaou test: a study from the College of American Pathologists Interlaboratory Comparison Program in Cervicovaginal Cytology | |
Megwalu et al. | Racial/ethnic disparities in use of high‐quality hospitals among oral cancer patients in California | |
Solin et al. | Analysis of a claims database for the identification of patients with carcinoma of the breast | |
CN112542220B (zh) | 基于住院病案首页的肿瘤登记随访数据处理方法及系统 | |
El Sheikh et al. | Rates and outcomes of breast lesions of uncertain malignant potential (B3) benchmarked against the National Breast Screening Pathology Audit; improving performance in a high volume screening unit | |
Boo et al. | Descriptive epidemiology of cancer of unknown primary in South Korea, 1999–2017 | |
Ma et al. | Comparison of urine cytology diagnostic reports before and after the implementation of the Paris System classification system in China | |
Condon et al. | Northern Territory Cancer Register, data quality 1981-2001 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |