CN113823414B - 主诊断与主手术匹配检测方法、装置、计算设备和存储介质 - Google Patents
主诊断与主手术匹配检测方法、装置、计算设备和存储介质 Download PDFInfo
- Publication number
- CN113823414B CN113823414B CN202110967675.3A CN202110967675A CN113823414B CN 113823414 B CN113823414 B CN 113823414B CN 202110967675 A CN202110967675 A CN 202110967675A CN 113823414 B CN113823414 B CN 113823414B
- Authority
- CN
- China
- Prior art keywords
- association
- codes
- diagnosis
- pair
- dip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 133
- 238000001514 detection method Methods 0.000 title claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 54
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 40
- 238000001356 surgical procedure Methods 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 238000009411 base construction Methods 0.000 claims description 6
- 230000001225 therapeutic effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/40—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Surgery (AREA)
- Urology & Nephrology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发一种主诊断与主手术匹配检测方法、装置、计算设备以及存储介质,包括:收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP‑growth算法在样本集上进行关联规则提取,提取2‑项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;综合DIP规则库和关联规则库得到总规则库;利用总规则库对病案中主诊断与主手术进行匹配检测,通过高效检测主诊断与主手术的匹配性,以此来提高病案首页质量同时减轻编码员工作量。
Description
技术领域
本发明属于病案质量监控领域,具体涉及一种主诊断与主手术匹配检测方法、装置、计算设备和存储介质。
背景技术
世界卫生组织和我国卫生部规定,当就诊者存在一种以上的疾病、损伤或情况时,需选择其中一个作为主要诊断,手术也同理。在实践中,编码员一般按照主要诊断及主要手术填报指南进行主要诊断和主要手术的选择。考虑到编码员背景及经验差异,这不可避免会带来一定的主要诊断或主要手术的选择错误,进而导致主诊断与主手术不匹配。
目前,对于主诊断与主手术不匹配问题主要靠有经验的编码员进行人工检查,这不仅较大程度浪费人力及资源,也容易疲劳导致进一步出错。因此,如果能通过自动化方式快速找出病案首页中不匹配的主要诊断和主要手术,将会极大提高病案首页质量并较大程度减少编码员工作量。
发明内容
鉴于上述,本发明的目的是提供一种主诊断与主手术匹配检测方法、装置、计算设备和存储介质,通过高效检测主诊断与主手术的匹配性,以此来提高病案首页质量同时减轻编码员工作量。
一种主诊断与主手术匹配检测方法,包括以下步骤:
收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;
提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;
综合DIP规则库和关联规则库得到总规则库;
利用总规则库对病案中主诊断与主手术进行匹配检测。
在一个实施例中,DIP规则库和关联规则库中的关联对{诊断编码,手术编码}处于亚目级别,即提取包含关联对{诊断编码亚目,手术编码亚目}的DIP规则库;提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码亚目,手术编码亚目},组成关联规则库。
在一个实施例中,收集并提取DIP目录库中每条记录包含诊断编码和手术编码;
所述对提取的DIP目录库进行预处理包括:对DIP目录库中的每条记录,依据诊断编码对手术编码进行去重处理,每条记录形成一个关联对{诊断编码,手术编码},组成DIP规则库;或,
对DIP目录库中的每条记录进行诊断编码亚目和手术编码亚目的提取,根据诊断编码亚目对手术编码亚目进行去重处理,每条记录形成一个关联对{诊断编码亚目,手术编码亚目},组成DIP规则库。
在一个实施例中,在病案中提取所有诊断记录,其中,诊断记录包括患者和诊断信息,每个患者对应的所有诊断信息包括的诊断编码和手术编码经过编码后作为1个样本,或每个患者对应的所有诊断信息包括的诊断编码亚目和手术编码亚目经过编码后作为1个样本。
在一个实施例中,利用FP-growth算法在样本集上进行关联规则提取,包括:
(a)将样本集分成训练集和测试集
(b)利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(c);
(c)依据当前关联对在测试集上的覆盖度计算覆盖度预提升幅度,依据覆盖度预提升幅度构建的权重来降低FP-growth算法的置信度,依据新置信度,利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(d);
(d)以覆盖度预提升幅度构建的权重来降低FP-growth算法的支持度,依据新支持度和新置信度,利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则,执行步骤(e);
(e)跳转执行步骤(c),直到满足关联对能够覆盖设置阈值以上的测试集中的样本为止,提取当前关联对,组成关联规则库,其中,关联对包括关联对{诊断编码,手术编码}或关联对{诊断编码亚目,手术编码亚目}。
在一个实施例中,依据覆盖度预提升幅度构建权重,包括:为每轮次设置对应的调整系数,以调整系数与覆盖度预提升幅度的倒数乘积为构建的权重。
在一个实施例中,所述利用总规则库对病案中主诊断与主手术进行匹配检测,包括:
筛选手术编码类型为手术、介入性操作、治疗性操作,且在CHS-DRG中有分组规则的病案,并提取病案中数据对,其中,数据对包括主诊断编码及对应的主手术编码,或主诊断编码亚目与对应的主手术编码亚目;
将提取的数据对与总规则库中的关联对进行匹配,得到匹配结果,其中,关联对包括关联对{诊断编码,手术编码}或关联对{诊断编码亚目,手术编码亚目}。
第二方面,实施例提供的一种主诊断与主手术匹配检测装置,包括:
DIP规则库构建模块,用于收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;
关联规则库构建模块,用于提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;
综合模块,用于综合DIP规则库和关联规则库得到总规则库;
匹配模块,用于利用总规则库对病案中主诊断与主手术进行匹配检测。
第三方面,实施例提供的一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的主诊断与主手术匹配检测方法的步骤。
第四方面,实施例提供的一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理执行时实现第一方面所述的主诊断与主手术匹配检测方法的步骤。
上述实施例提供的技术方案,具有的有益效果至少包括:
通过收集DIP目录库和病案分别构建DIP规则库、关联规则库,依次建立包含关联对的总规则库,然后利用总规则库对病案中主诊断与主手术进行匹配检测,这样能够实现对主诊断与主手术匹配性的快速准确检测,提高病案质量,同时减轻编码员工作量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1和图2是一实施例提供的主诊断与主手术匹配检测方法的流程图;
图3是一实施例提供的主诊断与主手术匹配检测装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1和图2是一实施例提供的主诊断与主手术匹配检测方法的流程图。如图1和图2所示,实施例提供的主诊断与主手术匹配检测方法,该检测方法既使用于诊断信息类目级别的匹配检测,也适用于诊断信息亚目级别的匹配检测。具体包括以下步骤:
步骤1,收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库。
实施例中,收集各地区各机构发布的DIP目录库,并提取DIP目录库中的每条记录整理如表1所示,其中,每条记录包含诊断编码和手术编码。
表1 DIP目录库
在对提取的DIP目录库进行预处理包括:对DIP目录库中的每条记录,依据诊断编码对手术编码进行去重处理,每条记录形成一个关联对{诊断编码,手术编码},组成DIP规则库。
在对提取的DIP目录库进行预处理还包括:对DIP目录库中的每条记录进行诊断编码亚目和手术编码亚目的提取,根据诊断编码亚目对手术编码亚目进行去重处理,每条记录形成一个关联对{诊断编码亚目,手术编码亚目},组成DIP规则库,如表2所示。
表2
步骤1构建的DIP规则库作为总规则库的一部分,用于主诊断与主手术匹配检测。
步骤2,提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库。
实施例中,在在病案首页提取同时具有患者和诊断信息的所有诊断记录,并将每个患者对应的所有诊断信息包含的诊断编码和手术编码合并成一条诊断记录,该条诊断记录经过编码后作为1个样本;针对亚目级别,还可以将将每个患者对应的所有诊断信息包含的诊断编码亚目和手术编码亚目合并成一条诊断记录,该条诊断记录经过编码后作为1个样本。表3为示例性给出的每个患者对应的一条诊断记录。
表3
实施例中,对诊断记录采用独热编码(one-hot)方式,保证每条记录编码的维度均为所有诊断编码亚目类别与所有手术编码亚目类别总数,针对每条记录出现的诊断编码亚目和手术编码亚目编码为1,未出现的编码为0,编码后的样本如表4所示,组成样本集。
表4
由于FP-growth算法能够快速有效地挖掘频繁项集,因此,实施例采用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库。
实施例中,利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},包括:
(a)将样本集分成训练集和测试集;
(b)利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(c);
(c)依据当前关联对在测试集上的覆盖度计算覆盖度预提升幅度,依据覆盖度预提升幅度构建的权重来降低FP-growth算法的置信度,依据新置信度,利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(d);
(d)以覆盖度预提升幅度构建的权重来降低FP-growth算法的支持度,依据新支持度和新置信度,利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则,执行步骤(e);
(e)跳转执行步骤(c),直到满足关联对能够覆盖设置阈值以上的测试集中的样本为止,提取当前关联对,组成关联规则库,其中,关联对包括关联对{诊断编码,手术编码}或关联对{诊断编码亚目,手术编码亚目}。
实施例中,阈值依据需求精度设置,可以设置90%,即如果关联对能够覆盖90%以上的测试集中的样本,则认为FP-growth算法的超参数合适。
实施例中,覆盖度预提升幅度理解为提升多少才能达到设置阈值,例如达到90%。具体计算公式为:其中,C为覆盖度预提升幅度,α为设置阈值,x为当前关联对在测试集上的覆盖度。
实施例中,依据覆盖度预提升幅度构建权重,包括:为每轮次设置对应的调整系数,以调整系数与覆盖度预提升幅度的倒数乘积为构建的权重。
优选地,可以每轮次设置调整系数分别为k=1,2,3,……,然后构建权重以该权重分别与FP-growth算法的支持度和置信度的乘积,来降低支持度和置信度,得到新支持度和新置信度,利用新支持度和新置信度进行FP-growth算法的再训练,再提取关联对,以构建关联规则库。
步骤3,综合DIP规则库和关联规则库得到总规则库。
实施例中,步骤1得到的DIP规则库和步骤2得到的关联规则库进行合并,以得到总规则库,这样得到的中规则库包含了非常全面的关联对,以用于对主诊断与主手术的匹配检测。
步骤4,利用总规则库对病案中主诊断与主手术进行匹配检测。
实施例中,利用总规则库对病案中主诊断与主手术进行匹配检测,包括:
筛选手术编码类型为手术、介入性操作、治疗性操作,且在CHS-DRG(国家医疗保障疾病诊断相关分组)中有分组规则的病案,并提取病案中数据对,其中,数据对包括主诊断编码及对应的主手术编码,或主诊断编码亚目与对应的主手术编码亚目;
将提取的数据对与总规则库中的关联对进行匹配,得到匹配结果,其中,关联对包括关联对{诊断编码,手术编码}或关联对{诊断编码亚目,手术编码亚目}。
由于手术编码类型为手术、介入性操作、治疗性操作的手术编码大概率会出现与诊断编码不匹配的问题,因此,为提高匹配检测效率,实施例中,提取手术编码类型为手术、介入性操作、治疗性操作的病案中数据对进行主诊断与主手术匹配检测。
ICD编码分成按照精度由小到大分成类目、亚目以及细目,精度越大,表示分类越细致,在同时权衡匹配检测速率、计算消耗以及准备率的情况下,优选在亚目级别进行主诊断与主手术的匹配检测。即构建的总规则库中关联对为{诊断编码亚目,手术编码亚目},提取的数据对也是{诊断编码亚目,手术编码亚目}。在对数据对进行匹配检测时,采用一一对比的原则,如果数据对中的诊断编码亚目,手术编码亚目分别与总关联库中的关联对中的诊断编码亚目,手术编码亚目相同,则认为数据对中的诊断编码亚目,手术编码亚目具有临床匹配性,否则,认为不匹配。
上述实施例提供的主诊断与主手术匹配检测方法,通过收集DIP目录库和病案分别构建DIP规则库、关联规则库,依次建立包含关联对的总规则库,然后利用总规则库对病案中主诊断与主手术进行匹配检测在,这样能够实现对主诊断与主手术匹配性的快速准确检测,提高病案质量,同时减轻编码员工作量。
图3是一实施例提供的主诊断与主手术匹配检测装置的结构示意图。如图3所示,实施例提供的主诊断与主手术匹配检测装置300,包括:
DIP规则库构建模块310,用于收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;
关联规则库构建模块320,用于提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;
综合模块330,用于综合DIP规则库和关联规则库得到总规则库;
匹配模块340,用于利用总规则库对病案中主诊断与主手术进行匹配检测。
需要说明的是,上述实施例提供的主诊断与主手术匹配检测装置在进行主诊断与主手术匹配检测时,应以上述各功能模块的划分进行举例说明,可以根据需要将上述功能分配由不同的功能模块完成,即在终端或服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的主诊断与主手术匹配检测装置与主诊断与主手术匹配检测方法实施例属于同一构思,其具体实现过程详见主诊断与主手术匹配检测方法实施例,这里不再赘述。
实施例还提供了一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,处理器执行所述计算机程序时实现上述主诊断与主手术匹配检测方法,包括以下步骤:
步骤1,收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;
步骤2,提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;
步骤3,综合DIP规则库和关联规则库得到总规则库;
步骤4,利用总规则库对病案中主诊断与主手术进行匹配检测。
实际应用中,存储器可以为在近端的易失性存储器,如RAM,还可以是非易失性存储器,如ROM,FLASH,软盘,机械硬盘等,还可以是远端的存储云。处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)、或现场可编程门阵列(FPGA),即可以通过这些处理器实现主诊断与主手术匹配检测步骤。
实施例还提供了一种计算机存储介质,其上存储有计算机程序,计算机程序被处理执行时实现上述主诊断与主手术匹配检测方法,包括以下步骤:
步骤1,收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;
步骤2,提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;
步骤3,综合DIP规则库和关联规则库得到总规则库;
步骤4,利用总规则库对病案中主诊断与主手术进行匹配检测。
实施例中,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种主诊断与主手术匹配检测方法,其特征在于,包括以下步骤:
收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;
提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;其中,利用FP-growth算法在样本集上进行关联规则提取,包括:
(a)将样本集分成训练集和测试集;
(b)利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(c);
(c)依据当前关联对在测试集上的覆盖度计算覆盖度预提升幅度,具体覆盖度预提升幅度其中α为设置阈值,x为当前关联对在测试集上的覆盖度,依据覆盖度预提升幅度构建权重,具体包括为每轮次设置对应的调整系数,以调整系数与覆盖度预提升幅度的倒数乘积为构建的权重,依据权重来降低FP-growth算法的置信度,具体包括权重与FP-growth算法的置信度的乘积来降低置信度得到新置信度,依据新置信度利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(d);
(d)以覆盖度预提升幅度构建的权重来降低FP-growth算法的支持度,具体包括权重与FP-growth算法的支持度的乘积来降低支持度得到新支持度,依据新支持度和新置信度,利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则,执行步骤(e);
(e)跳转执行步骤(c),直到满足关联对能够覆盖设置阈值以上的测试集中的样本为止,提取当前关联对,组成关联规则库,其中,关联对包括关联对{诊断编码,手术编码}或关联对{诊断编码亚目,手术编码亚目};
综合DIP规则库和关联规则库得到总规则库;
利用总规则库对病案中主诊断与主手术进行匹配检测。
2.如权利要求1所述的主诊断与主手术匹配检测方法,其特征在于,DIP规则库和关联规则库中的关联对{诊断编码,手术编码}处于亚目级别,即提取包含关联对{诊断编码亚目,手术编码亚目}的DIP规则库;提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码亚目,手术编码亚目},组成关联规则库。
3.如权利要求1或2所述的主诊断与主手术匹配检测方法,其特征在于,收集并提取DIP目录库中的每条记录包含诊断编码和手术编码;
所述对提取的DIP目录库进行预处理包括:对DIP目录库中的每条记录,依据诊断编码对手术编码进行去重处理,每条记录形成一个关联对{诊断编码,手术编码},组成DIP规则库;或,
对DIP目录库中的每条记录进行诊断编码亚目和手术编码亚目的提取,根据诊断编码亚目对手术编码亚目进行去重处理,每条记录形成一个关联对{诊断编码亚目,手术编码亚目},组成DIP规则库。
4.如权利要求1或2所述的主诊断与主手术匹配检测方法,其特征在于,在病案中提取所有诊断记录,其中,诊断记录包括患者和诊断信息,每个患者对应的所有诊断信息包括诊断编码和手术编码经过编码后作为1个样本,或每个患者对应的所有诊断信息包括的诊断编码亚目和手术编码亚目经过编码后作为1个样本。
5.如权利要求1所述的主诊断与主手术匹配检测方法,其特征在于,所述利用总规则库对病案中主诊断与主手术进行匹配检测,包括:
筛选手术编码类型为手术、介入性操作、治疗性操作,且在CHS-DRG中有分组规则的病案,并提取病案中数据对,其中,数据对包括主诊断编码及对应的主手术编码,或主诊断编码亚目与对应的主手术编码亚目;
将提取的数据对与总规则库中的关联对进行匹配,得到匹配结果,其中,关联对包括关联对{诊断编码,手术编码}或关联对{诊断编码亚目,手术编码亚目}。
6.一种主诊断与主手术匹配检测装置,其特征在于,包括:
DIP规则库构建模块,用于收集并提取DIP目录库,对提取的DIP目录库进行预处理,得到包含关联对{诊断编码,手术编码}的DIP规则库;
关联规则库构建模块,用于提取、预处理病案中诊断编码和手术编码来构建样本集;利用FP-growth算法在样本集上进行关联规则提取,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对{诊断编码,手术编码},组成关联规则库;其中,利用FP-growth算法在样本集上进行关联规则提取,包括:
(a)将样本集分成训练集和测试集;
(b)利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(c);
(c)依据当前关联对在测试集上的覆盖度计算覆盖度预提升幅度,具体覆盖度预提升幅度其中α为设置阈值,x为当前关联对在测试集上的覆盖度,依据覆盖度预提升幅度构建权重具体包括为每轮次设置对应的调整系数,以调整系数与覆盖度预提升幅度的倒数乘积为构建的权重,依据权重来降低FP-growth算法的置信度,具体包括权重与FP-growth算法的置信度的乘积来降低置信度得到新置信度,依据新置信度利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则执行步骤(d);
(d)以覆盖度预提升幅度构建的权重来降低FP-growth算法的支持度,具体包括权重与FP-growth算法的支持度的乘积来降低支持度得到新支持度,依据新支持度和新置信度,利用FP-growth算法在训练集上进行关联规则训练,提取2-项集关联规则中同时具有诊断编码和手术编码的关联对;利用关联对检测测试集中的样本,如果关联对能够覆盖设置阈值以上的测试集中的样本,则认为FP-growth算法的超参数合适,否则,执行步骤(e);
(e)跳转执行步骤(c),直到满足关联对能够覆盖设置阈值以上的测试集中的样本为止,提取当前关联对,组成关联规则库,其中,关联对包括关联对{诊断编码,手术编码}或关联对{诊断编码亚目,手术编码亚目};
其中,依据覆盖度预提升幅度构建权重,包括:为每轮次设置对应的调整系数,以调整系数与覆盖度预提升幅度的倒数乘积为构建的权重;
综合模块,用于综合DIP规则库和关联规则库得到总规则库;
匹配模块,用于利用总规则库对病案中主诊断与主手术进行匹配检测。
7.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~5任一项所述的主诊断与主手术匹配检测方法的步骤。
8.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理执行时实现权利要求1~5任一项所述的主诊断与主手术匹配检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110967675.3A CN113823414B (zh) | 2021-08-23 | 2021-08-23 | 主诊断与主手术匹配检测方法、装置、计算设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110967675.3A CN113823414B (zh) | 2021-08-23 | 2021-08-23 | 主诊断与主手术匹配检测方法、装置、计算设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113823414A CN113823414A (zh) | 2021-12-21 |
CN113823414B true CN113823414B (zh) | 2024-04-05 |
Family
ID=78923180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110967675.3A Active CN113823414B (zh) | 2021-08-23 | 2021-08-23 | 主诊断与主手术匹配检测方法、装置、计算设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113823414B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114550885A (zh) * | 2021-12-28 | 2022-05-27 | 杭州火树科技有限公司 | 基于联邦式关联规则挖掘的主诊断与主手术匹配检测方法和系统 |
CN115148370B (zh) * | 2022-07-01 | 2023-12-05 | 山东康网网络科技有限公司 | 一种生成dip病种目录的方法及系统 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202955A (zh) * | 2016-07-19 | 2016-12-07 | 中电科软件信息服务有限公司 | 基于编码智能适配的诊断相关分组方法及系统 |
CN106709248A (zh) * | 2016-12-16 | 2017-05-24 | 浙江大学 | 一种基于FP‑Growth算法的疾病并发症挖掘方法 |
CN106874693A (zh) * | 2017-03-15 | 2017-06-20 | 国信优易数据有限公司 | 一种医疗大数据分析处理系统及方法 |
CN107533586A (zh) * | 2015-03-23 | 2018-01-02 | 私有通道公司 | 用于加强生物信息学数据隐私和实现生物信息学数据广泛共享的系统、方法和设备 |
WO2018001237A1 (en) * | 2016-06-30 | 2018-01-04 | Huawei Technologies Co., Ltd. | Data mining interest generator |
CN109065157A (zh) * | 2018-08-01 | 2018-12-21 | 中国人民解放军第二军医大学 | 一种疾病诊断标准化编码推荐列表确定方法及系统 |
KR20190049536A (ko) * | 2017-10-30 | 2019-05-09 | 서울대학교산학협력단 | 연관 규칙의 단계적 추출 장치 및 방법 |
CN110444264A (zh) * | 2019-08-16 | 2019-11-12 | 宜昌市中心人民医院 | 基于DRGs的病案首页智能填写及训练系统 |
CN111210916A (zh) * | 2019-12-23 | 2020-05-29 | 望海康信(北京)科技股份公司 | 病案首页编码方法及系统 |
CN111241806A (zh) * | 2019-12-23 | 2020-06-05 | 望海康信(北京)科技股份公司 | 电子病历和病案首页诊断一致性校验方法及系统 |
CN111339126A (zh) * | 2020-02-27 | 2020-06-26 | 平安医疗健康管理股份有限公司 | 医疗数据筛选方法、装置、计算机设备和存储介质 |
CN111538845A (zh) * | 2020-04-03 | 2020-08-14 | 肾泰网健康科技(南京)有限公司 | 一种构建肾病专科医学知识图谱的方法、模型及系统 |
CN112349400A (zh) * | 2020-11-12 | 2021-02-09 | 杭州火树科技有限公司 | 基于drg原理的病案编码质控方法 |
CN112349399A (zh) * | 2020-11-12 | 2021-02-09 | 杭州火树科技有限公司 | 基于关联算法的手术缺漏自动检测方法 |
CN112365987A (zh) * | 2020-10-27 | 2021-02-12 | 平安科技(深圳)有限公司 | 诊断数据异常检测方法、装置、计算机设备及存储介质 |
CN112885481A (zh) * | 2021-03-09 | 2021-06-01 | 联仁健康医疗大数据科技股份有限公司 | 病例分组方法、装置、电子设备及存储介质 |
CN113257429A (zh) * | 2021-05-12 | 2021-08-13 | 吾征智能技术(北京)有限公司 | 一种基于关联规则认知发热疾病的系统、设备、存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080171916A1 (en) * | 2005-05-20 | 2008-07-17 | Carlos Feder | Practical computer program that diagnoses diseases in actual patients |
US9715576B2 (en) * | 2013-03-15 | 2017-07-25 | II Robert G. Hayter | Method for searching a text (or alphanumeric string) database, restructuring and parsing text data (or alphanumeric string), creation/application of a natural language processing engine, and the creation/application of an automated analyzer for the creation of medical reports |
US9672495B2 (en) * | 2014-12-23 | 2017-06-06 | Sap Se | Enhancing frequent itemset mining |
-
2021
- 2021-08-23 CN CN202110967675.3A patent/CN113823414B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107533586A (zh) * | 2015-03-23 | 2018-01-02 | 私有通道公司 | 用于加强生物信息学数据隐私和实现生物信息学数据广泛共享的系统、方法和设备 |
WO2018001237A1 (en) * | 2016-06-30 | 2018-01-04 | Huawei Technologies Co., Ltd. | Data mining interest generator |
CN106202955A (zh) * | 2016-07-19 | 2016-12-07 | 中电科软件信息服务有限公司 | 基于编码智能适配的诊断相关分组方法及系统 |
CN106709248A (zh) * | 2016-12-16 | 2017-05-24 | 浙江大学 | 一种基于FP‑Growth算法的疾病并发症挖掘方法 |
CN106874693A (zh) * | 2017-03-15 | 2017-06-20 | 国信优易数据有限公司 | 一种医疗大数据分析处理系统及方法 |
KR20190049536A (ko) * | 2017-10-30 | 2019-05-09 | 서울대학교산학협력단 | 연관 규칙의 단계적 추출 장치 및 방법 |
CN109065157A (zh) * | 2018-08-01 | 2018-12-21 | 中国人民解放军第二军医大学 | 一种疾病诊断标准化编码推荐列表确定方法及系统 |
CN110444264A (zh) * | 2019-08-16 | 2019-11-12 | 宜昌市中心人民医院 | 基于DRGs的病案首页智能填写及训练系统 |
CN111210916A (zh) * | 2019-12-23 | 2020-05-29 | 望海康信(北京)科技股份公司 | 病案首页编码方法及系统 |
CN111241806A (zh) * | 2019-12-23 | 2020-06-05 | 望海康信(北京)科技股份公司 | 电子病历和病案首页诊断一致性校验方法及系统 |
CN111339126A (zh) * | 2020-02-27 | 2020-06-26 | 平安医疗健康管理股份有限公司 | 医疗数据筛选方法、装置、计算机设备和存储介质 |
CN111538845A (zh) * | 2020-04-03 | 2020-08-14 | 肾泰网健康科技(南京)有限公司 | 一种构建肾病专科医学知识图谱的方法、模型及系统 |
CN112365987A (zh) * | 2020-10-27 | 2021-02-12 | 平安科技(深圳)有限公司 | 诊断数据异常检测方法、装置、计算机设备及存储介质 |
CN112349400A (zh) * | 2020-11-12 | 2021-02-09 | 杭州火树科技有限公司 | 基于drg原理的病案编码质控方法 |
CN112349399A (zh) * | 2020-11-12 | 2021-02-09 | 杭州火树科技有限公司 | 基于关联算法的手术缺漏自动检测方法 |
CN112885481A (zh) * | 2021-03-09 | 2021-06-01 | 联仁健康医疗大数据科技股份有限公司 | 病例分组方法、装置、电子设备及存储介质 |
CN113257429A (zh) * | 2021-05-12 | 2021-08-13 | 吾征智能技术(北京)有限公司 | 一种基于关联规则认知发热疾病的系统、设备、存储介质 |
Non-Patent Citations (11)
Title |
---|
A NOVEL SEMI-SUPERVISED LEARNING FOR SMS CLASSIFICATION;Ahmed, I et al;《 PROCEEDINGS OF 2014 INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND CYBERNETICS》;20140101;第856-861页 * |
Cai,ZQ et al .Gallbladdder Diagnosis and importance Analysis based on Bayesian Network.《PROCEEDINGS OF THE 23RD INTERNATIONAL CONFERENCE ON INDUSTRIAL ENGINEERING AND ENGINEERING MANAGEMENT 2016》.2018,第269-273页. * |
DIP内镜评分法在慢性鼻窦炎鼻内镜手术中的应用;马明忠;周霞;伊纪亮;郑娟;;中国中西医结合耳鼻咽喉科杂志(第01期);第31-33页 * |
Shen,XY et al.Association rules mining of traditional chinese medical syndrome differentiation oriented .《CIS WORKSHOPS 2007:INTERNATIONAL CONFERENCE ON COMPUTATI》.2023,第389页. * |
丁卫平 ; 祁恒 ; 董建成 ; 管致锦 ; .基于关联规则的电子病历挖掘算法研究与应用.微电子学与计算机.2007,(第03期),第75-79、82. * |
基于关联规则的Apriori改进算法的研究综述;彭新宇;李丛煊;郭金盈;赫彦文;;电脑知识与技术;20191205(第34期);第222-223页 * |
基于关联规则的电子病历挖掘算法研究与应用;丁卫平;祁恒;董建成;管致锦;;微电子学与计算机(第03期);第75-79、82 * |
基于支持度与置信度阈值优化技术的关联分类算法;张健;王蔚;;计算机应用;20071215(第12期);第154-156、160页 * |
基于频繁链表的完全加权项频繁集挖掘算法;蒙韧;李新友;袁鼎荣;邵延振;;网络安全技术与应用(第08期);第39-41页 * |
数据挖掘中的关联规则算法优化研究及应用;蒋秀英;《管理科学与工程》;20031231;全文 * |
浅谈疾病诊断与DRGs的关系;夏慧芬;;中国医院统计(第02期);第72-73页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113823414A (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113823414B (zh) | 主诊断与主手术匹配检测方法、装置、计算设备和存储介质 | |
CN109920506B (zh) | 医疗统计报告生成方法、装置、设备及存储介质 | |
CN107563383A (zh) | 一种医学影像辅助诊断及半监督样本生成系统 | |
CN113241135A (zh) | 一种基于多模态融合的疾病风险预测方法和系统 | |
US20170147753A1 (en) | Method for searching for similar case of multi-dimensional health data and apparatus for the same | |
CN109993227B (zh) | 自动添加国际疾病分类编码的方法、系统、装置和介质 | |
CN109009102B (zh) | 一种基于脑电图深度学习的辅助诊断方法及系统 | |
CN110141219A (zh) | 基于导联融合深度神经网络的心肌梗死自动检测方法 | |
CN113808738B (zh) | 一种基于自识别影像的疾病识别系统 | |
CN111524570B (zh) | 一种基于机器学习的超声随访患者筛选方法 | |
CN115148370B (zh) | 一种生成dip病种目录的方法及系统 | |
CN116504392A (zh) | 一种基于数据分析的智能辅助诊断提示系统 | |
US20220415456A1 (en) | Character acquisition, page processing and knowledge graph construction method and device, medium | |
CN115424691A (zh) | 病例匹配方法、系统、设备和介质 | |
CN113723056A (zh) | Icd编码转化方法、装置、计算设备和存储介质 | |
CN111863135B (zh) | 一种假阳性结构变异过滤方法、存储介质及计算设备 | |
CN116172573A (zh) | 一种基于改进的Inception-ResNet-v2的心律失常图像分类方法 | |
CN113010685B (zh) | 医学术语标准化方法、电子设备和存储介质 | |
CN114694787A (zh) | 健康体检项目的优化方法、优化系统及信息数据处理终端 | |
CN111784631A (zh) | 一种图像处理装置、方法及存储介质 | |
CN111199081A (zh) | 一种能谱数据处理装置及其模拟能谱曲线仿真系统、方法 | |
CN111063430A (zh) | 一种疾病预测方法及装置 | |
Zhao et al. | Arrhythmia Classification Algorithm Based on a Two‐Dimensional Image and Modified EfficientNet | |
CN112786130B (zh) | 一种获取病历主诊断信息的方法、装置、存储介质和设备 | |
Rahman et al. | A Wavelet-CNN Feature Fusion Approach for Detecting COVID-19 from Chest Radiographs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |