CN114708983B - 基于关联规则和复杂网络的院内感染风险分析方法及系统 - Google Patents

基于关联规则和复杂网络的院内感染风险分析方法及系统 Download PDF

Info

Publication number
CN114708983B
CN114708983B CN202111550228.4A CN202111550228A CN114708983B CN 114708983 B CN114708983 B CN 114708983B CN 202111550228 A CN202111550228 A CN 202111550228A CN 114708983 B CN114708983 B CN 114708983B
Authority
CN
China
Prior art keywords
node
infection
complex network
hospital infection
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111550228.4A
Other languages
English (en)
Other versions
CN114708983A (zh
Inventor
周迎
李晨爽
丁烈云
骆汉宾
王宇
梅雅琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202111550228.4A priority Critical patent/CN114708983B/zh
Publication of CN114708983A publication Critical patent/CN114708983A/zh
Application granted granted Critical
Publication of CN114708983B publication Critical patent/CN114708983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Primary Health Care (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Computational Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Fuzzy Systems (AREA)
  • Algebra (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于关联规则和复杂网络的院内感染风险分析方法及系统。该方法包括:通过网络爬虫进行关键词检索,获取院内感染相关数据;基于所述院内感染相关数据制定院内感染事件风险因素汇总表;基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则;基于所述频繁项集和所述关联规则构建复杂网络;根据复杂网络中节点度和中介中心度确定关键风险节点,标记为院内感染事故的关键风险因素;根据所述关键风险因素,进行预防和管控。本发明基于真实的院内感染数据,考虑多风险因素之间的相互影响,将关联规则挖掘和复杂网络相结合确定关键风险因素,从而进行有效的预防和管控。

Description

基于关联规则和复杂网络的院内感染风险分析方法及系统
技术领域
本发明涉及公共卫生技术领域,特别是涉及一种基于关联规则和复杂网络的院内感染风险分析方法及系统。
背景技术
院内感染又称医院获得性感染,是指人群在医院停留和治疗过程中获得的非原发性感染。它不仅对患者和医护人员的健康构成威胁,还影响治疗的效率,导致疫情的进一步蔓延。调查表明,院内感染的管理通常需要延长住院时间、额外的调研、手术干预和抗菌治疗,这些都大大增加了医疗成本。
作为应对突发公共卫生事件的关键机构,医院对于院内感染的监测预警、及时响应和科学应对在很大程度上决定了整个突发公共卫生事件防控工作的成败,而识别院内感染风险更是重中之重。
目前,对于院内感染风险分析方法,大多只针对单一风险因素而忽略风险之间的相互影响,需要针对整个医院感染管理过程进行系统性风险分析。
发明内容
基于所述问题,本发明的目的是提供一种基于关联规则和复杂网络的院内感染风险分析方法及系统,基于真实的院内感染数据,考虑多风险因素之间的相互影响,将关联规则挖掘和复杂网络相结合确定关键风险因素,从而进行有效的预防和管控。
为实现所述目的,本发明提供了如下方案:
一种基于关联规则和复杂网络的院内感染风险分析方法,包括:
通过网络爬虫进行关键词检索,获取院内感染相关数据;所述院内感染相关数据包括发生院内感染的医院、发生原因、发生事件及感染程度;
基于所述院内感染相关数据制定院内感染事件风险因素汇总表;
基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则;
基于所述频繁项集和所述关联规则构建复杂网络;所述复杂网络的节点为频繁项集,所述复杂网络的边为关联规则;
根据复杂网络中节点度和中介中心度确定关键风险节点,标记为院内感染事故的关键风险因素;所述节点度表示与当前节点直接相连的节点数目;所述中介中心度表示当前节点在网络中沟通其它节点的能力;
根据所述关键风险因素,进行预防和管控。
可选地,所述通过网络爬虫进行关键词检索,获取院内感染相关数据,具体包括:
通过网络爬虫利用关键词组合检索院内感染相关报道;
通过对比标题和摘要,删去重复的报道。
可选地,所述基于所述院内感染相关数据制定院内感染事件风险因素汇总表,具体包括:
对院内感染事故的发生原因进行分类;
对院内感染事故的感染程度进行分级;
对分类和分级的数据进行离散化处理,得到院内感染事件风险因素汇总表。
可选地,所述基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则,具体包括:
扫描院内感染事件风险因素汇总表,对出现的所有事物集的项进行计数,同时计算单个事物集的支持度;
生成频繁1-项目集L1,判断支持度是否满足算法预先设置的最小支持度;若符合,根据Apriori运算由L1得到频繁2-项集L2,再由L2去寻找L3,以此类推,直至算法结束;
根据生成的频繁项集确定数据集之间满足阈值条件的关联规则。
可选地,所述节点度及其分布计算公式如下:
Figure GDA0003940828840000031
Figure GDA0003940828840000032
其中,ki表示第i个节点的节点度,p(k)表示节点度的分布,v表示复杂网络中节点的总数,j表示复杂网络中除i之外的节点,当j与i直接相连时,aij取为1,否则取为0;nk表示网络中节点度为k的节点数,n表示网络中节点的总数。
可选地,所述中介中心度的计算公式如下:
Figure GDA0003940828840000033
其中,B(v)表示节点v的中介中心度,gst表示在节点s和节点t之间最短路径的数量,gst(v)表示节点s和节点t之间通过节点v的最短路径的数量。
本发明还提供了一种基于关联规则和复杂网络的院内感染风险分析系统,包括:
院内感染相关数据获取模块,用于通过网络爬虫进行关键词检索,获取院内感染相关数据;所述院内感染相关数据包括发生院内感染的医院、发生原因、发生事件及感染程度;
院内感染事件风险因素汇总表制定模块,用于基于所述院内感染相关数据制定院内感染事件风险因素汇总表;
挖掘模块,用于基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则;
复杂网络构建模块,用于基于所述频繁项集和所述关联规则构建复杂网络;所述复杂网络的节点为频繁项集,所述复杂网络的边为关联规则;
院内感染事故的关键风险因素确定模块,用于根据复杂网络中节点度和中介中心度确定关键风险节点,标记为院内感染事故的关键风险因素;所述节点度表示与当前节点直接相连的节点数目;所述中介中心度表示当前节点在网络中沟通其它节点的能力;
预防和管控模块,用于根据所述关键风险因素,进行预防和管控。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明基于真实的院内感染数据,考虑多风险因素之间的相互影响,将关联规则挖掘和复杂网络相结合,构建院内感染风险因素目标网络,并通过特征指标进行定量分析,获得关键风险节点,进而有针对性地对院内感染进行预防和管控。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于关联规则和复杂网络的院内感染风险分析方法的流程图;
图2为本发明实施例基于关联规则和复杂网络的院内感染风险分析系统的结构框图;
图3为院内感染事故原因进行分类归纳示意图;
图4为利用Apriori算法进行数据挖掘获取频繁项集和关联规则的流程图;
图5为将关联规则映射到复杂网络的示意图;
图6为按节点度和中介中心度呈现院内感染风险因素目标网络的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的所述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的基于关联规则和复杂网络的院内感染风险分析方法,包括以下步骤:
步骤101:通过网络爬虫进行关键词检索,获取院内感染相关数据;所述院内感染相关数据包括发生院内感染的医院、发生原因、发生事件及感染程度。
步骤102:基于所述院内感染相关数据制定院内感染事件风险因素汇总表。
步骤103:基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则。
步骤104:基于所述频繁项集和所述关联规则构建复杂网络;所述复杂网络的节点为频繁项集,所述复杂网络的边为关联规则。
步骤105:根据复杂网络中节点度和中介中心度确定关键风险节点,标记为院内感染事故的关键风险因素;所述节点度表示与当前节点直接相连的节点数目;所述中介中心度表示当前节点在网络中沟通其它节点的能力。
步骤106:根据所述关键风险因素,进行预防和管控。
其中,步骤101具体包括:
利用关键词组合检索院内感染相关报道,包括院内感染、原因、院内感染事件、院感防控、院感漏洞。
通过对比标题和摘要,删去重复的报道;删去没有描述医院具体感染事件或是没有指明感染原因的报道。
其中,步骤102具体包括:
对上述筛选后院内感染事故的原因进行分类归纳,并参考《医院感染暴发报告及处置管理规范》对事故感染程度分级,经离散化处理后得到院内感染事件风险因素汇总表。
1、将报道中的院内感染事故原因进行分类归纳,分为医院管理、医疗人员、医疗设备和医疗建筑四个方面,更进一步的划分如图3所示。
2、参考《医院感染暴发报告及处置管理规范》,将Ⅰ级感染定义为感染人数在1到5人之间的院内感染,II级感染定义为感染人数在5到10人之间的院内感染,III级感染定义为感染人数大于等于10人的院内感染。
3、对数据进行离散化处理,用0或1表示某一感染事故的发生是否由于该风险,并使用Hospital+代表医院名称,数字代表医院对应序号,字母代表各原因。同时,为了分析院内感染、感染程度与风险因素间的关系,在表中加入W:院内感染是否发生,并将各事故按照对应感染等级重复处理。
根据上述步骤可得到院内感染事件风险因素汇总表,如表1所示。
表1
Hospital A B C D E F G H I J K L M N o P Q R S T U V W
Hospital1 1 1 1 1 1 1 1 1 1 1 1 1 1
Hospital1 1 1 1 1 1 1 1 1 1 1 1 1 1
Hospital2 1 1 1 1 1 1 1 1 1 1 1
Hospital2 1 1 1 1 1 1 1 1 1 1 1
Hospital3 1 1 1 1 1 1 1 1 1 1 1
Hospital3 1 1 1 1 1 1 1 1 1 1 1
Hospital3 1 1 1 1 1 1 1 1 1 1 1
Hospital4 1 1 1 1 1 1 1 1 1 1
Hospital4 1 1 1 1 1 1 1 1 1 1
Hospital4 1 1 1 1 1 1 1 1 1 1
Hospital5 1 1 1 1 1 1 1 1
Hospital5 1 1 1 1 1 1 1 1
Hospital5 1 1 1 1 1 1 1 1
其中,步骤103具体包括:
关联规则
Figure GDA0003940828840000061
的支持度是同时包含项集A和C的事务在所有事务项D中所占的百分比,其计算公式如下:
Figure GDA0003940828840000062
关联规则
Figure GDA0003940828840000063
的置信度是同时包含项集A和B的事务在所有包含项集A的事务中所占的百分比,其计算公式如下:
Figure GDA0003940828840000071
Apriori算法的具体步骤为:
1、扫描整个数据集,对出现的所有事物集的项进行计数,同时计算单个事物集的支持度;
2、生成频繁1-项目集L1,判断其支持度是否满足算法预先设置的最小支持度。若符合,根据Apriori运算由L1得到频繁2-项集L2.再由L2去寻找L3,以此类推,直至算法结束;
3、根据生成的频繁项集可以得到数据集之间满足阈值条件的关联规则。
具体的:
数据导入:将上述离散化处理后的院内感染事件风险因素表作为输入数据存储在文件(.csv)中,导入Python进行关联规则挖掘。
设定最小阈值;分析在不同支持度和置信度下Apriori算法能挖掘出的关联规则数目,实施例中最小支持度为35%,最小置信度为40%。
产生频繁项集;通过Apriori算法筛选出满足上述阈值的频繁项集。
生成关联规则;在获取频繁项集的基础上,利用Apriori算法筛选得到关联规则,并计算出关联规则相应的支持度和置信度;利用算法得到关联规则的具体过程如图4。
其中,步骤104具体包括:
将上述满足最小阈值的频繁项集作为网络的节点,各关联规则作为复杂网络的边,并将各关联规则的置信度作为边的权重,构建院内感染风险目标网络。图5是将关联规则映射到复杂网络的示意图。
其中,步骤105具体包括:
计算复杂网络中节点度和中介中心度,对这两个指标从大到小进行排序,排名靠前的节点作为关键风险节点。
节点度表示该节点所在网络中与其直接相连的节点数目,节点度越大,该节点在网络中就越关键,节点度的分布是该节点度为k的概率。节点度及其分布计算公式如下:
Figure GDA0003940828840000081
Figure GDA0003940828840000082
其中,ki表示第i个节点的节点度,p(k)表示节点度的分布,v表示复杂网络中节点的总数,j表示复杂网络中除i之外的节点,当j与i直接相连时,aij取为1,否则取为0;nk表示网络中节点度为k的节点数,n表示网络中节点的总数。
在复杂网络中,节点度表示一个节点是否重要,中介中心度表示该节点在网络中沟通其它节点的能力。节点的中介中心度越高,当其它节点与之相连时,通过该节点的最短路径数就越多。中介中心度的计算公式如下:
Figure GDA0003940828840000083
在复杂网络中,两个特定的点s和v之间会通过不同的边和点连接,形成不同的路径。其中,gst为在节点s和t之间最短路径的数量,gst(v)为节点s和t之间通过点v的最短路径的数量。
本发明旨在按节点度和中介中心度呈现院内感染风险因素目标网络,计算网络中各节点的度和中介中心度,表2为节点度和中介中心度前6的节点。节点的度和中介中心度数值对应节点的颜色和大小,构建院内感染风险因素目标网络,如图6所示,(a)按节点度呈现目标网络,(b)按中介中心度呈现目标网络。节点度和中介中心度较高的节点,即院内感染事故的关键风险因素。
表2
Figure GDA0003940828840000091
如图2所示,本发明还提供了一种基于关联规则和复杂网络的院内感染风险分析系统,包括:
院内感染相关数据获取模块201,用于通过网络爬虫进行关键词检索,获取院内感染相关数据;所述院内感染相关数据包括发生院内感染的医院、发生原因、发生事件及感染程度;
院内感染事件风险因素汇总表制定模块202,用于基于所述院内感染相关数据制定院内感染事件风险因素汇总表;
挖掘模块203,用于基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则;
复杂网络构建模块204,用于基于所述频繁项集和所述关联规则构建复杂网络;所述复杂网络的节点为频繁项集,所述复杂网络的边为关联规则;
院内感染事故的关键风险因素确定模块205,用于根据复杂网络中节点度和中介中心度确定关键风险节点,标记为院内感染事故的关键风险因素;所述节点度表示与当前节点直接相连的节点数目;所述中介中心度表示当前节点在网络中沟通其它节点的能力;
预防和管控模块206,用于根据所述关键风险因素,进行预防和管控。
相对于现有方法,本发明的主要优点在于:
1、从控制院内感染的角度考虑医院应急能力建设的重点;
2、首次将关联规则挖掘和复杂网络相结合,用于分析院内感染事件的关键风险因素;
3、考虑到多因素风险相互影响,并对风险节点的关键性进行了定量分析与评价;
4、形成一种以控制院内感染为导向的院内感染风险分析方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种基于关联规则和复杂网络的院内感染风险分析方法,其特征在于,包括:
通过网络爬虫进行关键词检索,获取院内感染相关数据;所述院内感染相关数据包括发生院内感染的医院、发生原因、发生事件及感染程度;
基于所述院内感染相关数据制定院内感染事件风险因素汇总表;
基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则;
基于所述频繁项集和所述关联规则构建复杂网络;所述复杂网络的节点为频繁项集,所述复杂网络的边为关联规则;
根据复杂网络中节点度和中介中心度确定关键风险节点,标记为院内感染事故的关键风险因素;所述节点度表示与当前节点直接相连的节点数目;所述中介中心度表示当前节点在网络中沟通其它节点的能力;
根据所述关键风险因素,进行预防和管控;
所述节点度及其分布计算公式如下:
ki=∑iaij
Figure FDA0003895422440000011
其中,ki表示第i个节点的节点度,p(k)表示节点度的分布,v表示复杂网络中节点的总数,j表示复杂网络中除i之外的节点,当j与i直接相连时,aij取为1,否则取为0;nk表示网络中节点度为k的节点数,n表示网络中节点的总数。
2.根据权利要求1所述的基于关联规则和复杂网络的院内感染风险分析方法,其特征在于,所述通过网络爬虫进行关键词检索,获取院内感染相关数据,具体包括:
通过网络爬虫利用关键词组合检索院内感染相关报道;
通过对比标题和摘要,删去重复的报道。
3.根据权利要求1所述的基于关联规则和复杂网络的院内感染风险分析方法,其特征在于,所述基于所述院内感染相关数据制定院内感染事件风险因素汇总表,具体包括:
对院内感染事故的发生原因进行分类;
对院内感染事故的感染程度进行分级;
对分类和分级的数据进行离散化处理,得到院内感染事件风险因素汇总表。
4.根据权利要求1所述的基于关联规则和复杂网络的院内感染风险分析方法,其特征在于,所述基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则,具体包括:
扫描院内感染事件风险因素汇总表,对出现的所有事物集的项进行计数,同时计算单个事物集的支持度;
生成频繁1-项目集L1,判断支持度是否满足算法预先设置的最小支持度;若符合,根据Apriori运算由L1得到频繁2-项集L2,再由L2去寻找L3,以此类推,直至算法结束;
根据生成的频繁项集确定数据集之间满足阈值条件的关联规则。
5.根据权利要求1所述的基于关联规则和复杂网络的院内感染风险分析方法,其特征在于,所述中介中心度的计算公式如下:
Figure FDA0003895422440000021
其中,B(v)表示节点v的中介中心度,gst表示在节点s和节点t之间最短路径的数量,gst(v)表示节点s和节点t之间通过节点v的最短路径的数量。
6.一种基于关联规则和复杂网络的院内感染风险分析系统,其特征在于,包括:
院内感染相关数据获取模块,用于通过网络爬虫进行关键词检索,获取院内感染相关数据;所述院内感染相关数据包括发生院内感染的医院、发生原因、发生事件及感染程度;
院内感染事件风险因素汇总表制定模块,用于基于所述院内感染相关数据制定院内感染事件风险因素汇总表;
挖掘模块,用于基于所述院内感染事件风险因素汇总表,利用Apriori算法进行数据挖掘,获取频繁项集和关联规则;
复杂网络构建模块,用于基于所述频繁项集和所述关联规则构建复杂网络;所述复杂网络的节点为频繁项集,所述复杂网络的边为关联规则;
院内感染事故的关键风险因素确定模块,用于根据复杂网络中节点度和中介中心度确定关键风险节点,标记为院内感染事故的关键风险因素;所述节点度表示与当前节点直接相连的节点数目;所述中介中心度表示当前节点在网络中沟通其它节点的能力;
预防和管控模块,用于根据所述关键风险因素,进行预防和管控;
所述节点度及其分布计算公式如下:
ki=∑aij
Figure FDA0003895422440000031
其中,ki表示第i个节点的节点度,p(k)表示节点度的分布,v表示复杂网络中节点的总数,j表示复杂网络中除i之外的节点,当j与i直接相连时,aij取为1,否则取为0;nk表示网络中节点度为k的节点数,n表示网络中节点的总数。
CN202111550228.4A 2021-12-17 2021-12-17 基于关联规则和复杂网络的院内感染风险分析方法及系统 Active CN114708983B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111550228.4A CN114708983B (zh) 2021-12-17 2021-12-17 基于关联规则和复杂网络的院内感染风险分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111550228.4A CN114708983B (zh) 2021-12-17 2021-12-17 基于关联规则和复杂网络的院内感染风险分析方法及系统

Publications (2)

Publication Number Publication Date
CN114708983A CN114708983A (zh) 2022-07-05
CN114708983B true CN114708983B (zh) 2022-12-27

Family

ID=82166931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111550228.4A Active CN114708983B (zh) 2021-12-17 2021-12-17 基于关联规则和复杂网络的院内感染风险分析方法及系统

Country Status (1)

Country Link
CN (1) CN114708983B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709252A (zh) * 2016-12-26 2017-05-24 重庆星空云医疗科技有限公司 预测、诊断、治疗和控制医院感染的智能决策辅助系统
CN109360655A (zh) * 2018-12-13 2019-02-19 湖南德雅曼达科技有限公司 一种医疗机构院科两级感染风险评估系统及方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8498879B2 (en) * 2006-04-27 2013-07-30 Wellstat Vaccines, Llc Automated systems and methods for obtaining, storing, processing and utilizing immunologic information of individuals and populations for various uses
CN104866979B (zh) * 2015-06-08 2018-10-23 苏芮 一种突发急性传染病的中医病例数据处理方法和系统
CN105095673B (zh) * 2015-08-26 2018-03-13 中国人民解放军军事医学科学院放射与辐射医学研究所 一种基于医疗大数据挖掘的慢性病风险模型的构建方法
CN105488183B (zh) * 2015-12-01 2018-12-04 北京邮电大学世纪学院 挖掘石窟壁画群中石窟壁画时空关联关系的方法和装置
CN105740615B (zh) * 2016-01-28 2018-10-16 中山大学 利用手机轨迹追踪传染源和预测传染病流行趋势的方法
US11830606B2 (en) * 2020-04-28 2023-11-28 Siemens Healthcare Gmbh Risk prediction for COVID-19 patient management
CN112885483A (zh) * 2020-09-16 2021-06-01 北京建筑大学 传染病传播趋势的模拟方法、装置、电子设备以及存储介质
CN112579849A (zh) * 2021-01-11 2021-03-30 上海勘察设计研究院(集团)有限公司 基于全量数据的结构安全影响因素关联分析方法
CN113658715B (zh) * 2021-07-15 2024-01-12 大连海事大学 一种面向船舶航行风险管控的安全屏障管理方法及系统
CN113506020A (zh) * 2021-07-26 2021-10-15 西安科技大学 一种基于复杂网络的房屋建筑施工风险评价方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709252A (zh) * 2016-12-26 2017-05-24 重庆星空云医疗科技有限公司 预测、诊断、治疗和控制医院感染的智能决策辅助系统
CN109360655A (zh) * 2018-12-13 2019-02-19 湖南德雅曼达科技有限公司 一种医疗机构院科两级感染风险评估系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
突发公共卫生事件下的医院院感风险识别及其韧性评价研究;梅雅琴;《工程科技Ⅱ辑》;20210501;第1-103页 *

Also Published As

Publication number Publication date
CN114708983A (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
Herland et al. Big data fraud detection using multiple medicare data sources
US20060161527A1 (en) Preserving privacy when statistically analyzing a large database
CN110322356B (zh) 基于hin挖掘动态多模式的医保异常检测方法及系统
US8285585B2 (en) System and method for peer-profiling individual performance
US20160117778A1 (en) Systems and Methods for Computerized Fraud Detection Using Machine Learning and Network Analysis
US7788203B2 (en) System and method of accident investigation for complex situations involving numerous known and unknown factors along with their probabilistic weightings
Skarkala et al. Privacy preservation by k-anonymization of weighted social networks
CN109842628A (zh) 一种异常行为检测方法及装置
CN111883223B (zh) 患者样本数据中结构变异的报告解读方法及系统
US11488722B2 (en) Biosurveillance notifications
CN112259210B (zh) 医疗大数据访问控制方法、装置及计算机可读存储介质
CN108595655A (zh) 一种基于会话特征相似性模糊聚类的异常用户检测方法
CN110620696A (zh) 针对企业网络安全态势感知的评分方法和装置
Afeni et al. Hypertension prediction system using naive bayes classifier
CN112632612B (zh) 一种医疗数据发布匿名化方法
CA2304387A1 (en) A system for identification of selectively related database records
CN113642672A (zh) 医保数据的特征加工方法、装置、计算机设备及存储介质
CN111079179A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN113590603A (zh) 基于数据源智能选择的数据处理方法、装置、设备及介质
CN114708983B (zh) 基于关联规则和复杂网络的院内感染风险分析方法及系统
US20190355480A1 (en) Biosurveillance Notifications
CN112968873B (zh) 一种用于隐私数据传输的加密方法和装置
Shin et al. Electronic medical records privacy preservation through k-anonymity clustering method
KR101402808B1 (ko) 익명화를 위한 시드 선택 방법, 익명화 방법 및 이를 이용하는 정보 보호 장치
US20050176031A1 (en) Kinship analysis program for missing persons and mass disaster

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant