CN115064280A - 基于急性呼吸道传染病感染人群的数据分析方法及系统 - Google Patents
基于急性呼吸道传染病感染人群的数据分析方法及系统 Download PDFInfo
- Publication number
- CN115064280A CN115064280A CN202210650481.5A CN202210650481A CN115064280A CN 115064280 A CN115064280 A CN 115064280A CN 202210650481 A CN202210650481 A CN 202210650481A CN 115064280 A CN115064280 A CN 115064280A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- infected
- infectious disease
- personnel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2308—Concurrency control
- G06F16/2315—Optimistic concurrency control
- G06F16/2322—Optimistic concurrency control using timestamps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Abstract
本发明公开了一种基于急性呼吸道传染病感染人群的数据分析方法及系统,属于大数据治理中的公共卫生领域,本发明要解决的技术问题为感染人群数据分散、平台不统一、数据共享不及时、相关人员定位不精准以及协查反馈慢,采用的技术方案为:数据共享交换:通过传染病共享交换中心节点将感染人员数据推送至共享交换子节点;数据融合:数据同步后,利用手机号、姓名以及身份证号码三种关键信息对户籍信息、行程信息、传染病疫苗接种信息以及传染病抗原监测信息进行多源数据匹配及融合,形成感染人员标准库;应用主题库建设;分析展示:基于应用主题库,对感染人员进行一键直查及监测分析。
Description
技术领域
本发明涉及大数据治理中的公共卫生领域,具体地说是一种基于急性呼吸道传染病感染人群的数据分析方法及系统。
背景技术
目前传染病防治和管控等信息系统缺乏整体联动,各地方建设的传染病防治管控系统独立建设、分散部署,建设规模、模式、环境、架构不一致,暂未形成标准化、规范化的数据共享模式,急需在现有信息化工作基础上整合完善标准统一、上下协同、互联互通的传染病管理平台。
同时感染人员数据准确性不足。目前对感染人员协同排查、流调等主要通过人工对涉疫人员手机号码进行手工调查,没有做到人、身份证、手机号“三统一”,提供的手机定位信息也只能精确到地市级,还需要二次计算匹配,将位置信息落位到区县级才能下发使用,导致排查效率低、难度大,难以迅速落地精准排查。同时,由于“时空伴随”数据算法不够精准,导致下发的手机信令数据量较大,基层需逐一电话调查,排查任务重、时间长、不精准。此外,火车、飞机同乘数据算法也尚未根据病毒传播特点进行调整。
故如何避免感染人群数据分散、平台不统一、数据共享不及时、相关人员定位不精准以及协查反馈慢等漏洞是目前亟待解决的技术问题。
发明内容
本发明的技术任务是提供一种基于急性呼吸道传染病感染人群的数据分析方法及系统,来解决感染人群数据分散、平台不统一、数据共享不及时、相关人员定位不精准以及协查反馈慢的问题。
本发明的技术任务是按以下方式实现的,一种基于急性呼吸道传染病感染人群的数据分析方法,该方法具体如下:
数据共享交换:通过传染病共享交换中心节点将感染人员数据推送至共享交换子节点;
数据融合:数据同步后,利用手机号、姓名以及身份证号码三种关键信息对户籍信息、行程信息、传染病疫苗接种信息以及传染病抗原监测信息进行多源数据匹配及融合,形成感染人员标准库;
应用主题库建设:对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
分析展示:基于应用主题库,对感染人员进行一键直查及监测分析。
作为优选,数据共享交换具体如下:
在共享交换子节点使用kafka group消费组订阅共享交换中心节点的感染风险人员资源目录主题topic;
在数据新增的情况下,监听到数据和文件变化,通知共享交换子节点通过pull方式实时将已经使用国密算法SM2/SM3/SM4加密的最新当日和/或最新ID新增原始数据文件拉取至本节点;
原始数据文件通过数字信封和数据签名的验证,保证数据文件的数据完整性;
在原始数据文件的完整性验证无误后,通过SM2/SM3/SM4解密算法将数据文件的感染人员数据进行解密为明文数据,同时存入感染人员原始主题库,并对姓名、身份证及手机敏感信息进行加密存储,防止数据泄露。
作为优选,数据融合具体如下:
利用BF(暴力匹配)算法依次逐步将姓名、身份证号及手机号匹配其他数据源数据;
匹配成功后,补齐缺失的姓名、身份证及手机关键数据信息;
补全数据时,添加补全数据来源,并根据数据来源信息利用Kafka Connect实时监测各类数据变化,进行实时更新补全数据;
当关键信息数据发生改变和新增,利用incrementing自增模式、timestamp时间戳模式集timestamp+incrementing时间戳自增混合模式三种方式实现新增数据的同步,同时进行关键字段的同步和更新,补全和更新关键字段包括人员姓名、身份证号、停留场所、停留时间、所在位置、传染病疫苗接种及传染病抗原检测信息;
补全关键信息后,形成融合库,为开展快速流调和感染人员排查提供数据支撑。
更优地,利用BF(暴力匹配)算法进行数据匹配具体如下:
在主串中,检查起始位置分别是0、1、2…n-m且长度为m的n-m+1个子串,比对模式串匹配字段,在匹配过程中依次将姓名、身份证号及手机号信息以及人口信息、行程信息、传染病疫苗接种数据及传染病抗原检测的各类数据进行匹配。
作为优选,应用主题库建设具体如下:
将融合库信息逐级分配给网格员或者基层单位,由基层人员对传染病风险人员进行流行病学分析和管控信息填报补充,同时将汇集的数据通过实体提取、关系提取、事件抽取及属性抽取的NLP技术对其中文本内容进行关键信息提取;
经过实体对齐后,将同一风险人员关键信息存储到图数据库Neo4j中,形成涉疫风险人员流调知识图谱,同时形成协查信息库、感染人员信息库及隔离管控人员库应用主题库,最终形成信息完整且可用的高质的数据,实现本感染人员全程可溯、管控、分析等业务闭环分析数据基础。
作为优选,关键信息包括姓名、性别、年龄、联系电话、住址所在地市、现住址、诊断类型、感染来源、密切接触者信息、发病日期、是否关联聚集性事件、负责流调单位、人员时序GIS空间轨迹和时空伴随人员的信息。
作为优选,分析展示具体如下:
利用应用主题库,使用展示本区域“人数清、人头清、位置清和状态清”四清情况,并展示感染人群感染分析和态势分析;
通过流调、协查及管控信息结合知识图谱推理及GIS地图通过Echart和百度地图API相结合,并采用路径排序算法和TransE算法对风险人员和病例患者的行为轨迹回放、密接人群关系推演、传播模式分析和潜在感染人群发现分析及空间传播地理展示。
一种基于急性呼吸道传染病感染人群的数据分析系统,该系统包括,
数据共享交换模块,用于通过订阅共享交换中心节点的感染人员库表数据,完成数据文件的安全推送,并将已经通过国密算法进行加密的原始数据进行存储,形成原始库;
数据融合模块,用于综合利用身份证信息、行程信息、传染病疫苗接种以及传染病抗原检测信息,补齐风险人员的姓名、证件号码和手机号码、时空伴随人员姓名、伴随时间、伴随人员轨迹及位置信息,并对多源数据信息进行匹配及融合,形成感染人员标准库形成标准库;
应用主题库建设模块,用于对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
分析展示模块,用于基于应用主题库,进行感染人员的人群、轨迹及传播模式的相关梳理分析展示,形成可监控、可预测、可预警的人员排查、管控及分析体系,为传染病防控提供科学的决策数据支持。
一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器上存储有计算机程序;
所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如上述的基于急性呼吸道传染病感染人群的数据分析方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如上述的基于急性呼吸道传染病感染人群的数据分析方法。
本发明的基于急性呼吸道传染病感染人群的数据分析方法及系统具有以下优点:
(一)本发明能够确保传染病感染人员信息高效的收集、管控与统计,提高了感染人员排查、管控、分析效率,实现数据共享交换、多部门数据协同,提升现场流调和风险人员排查的精准性、及时性和智能化能力;
(二)本发明利用信息化手段提升排查及时性、准确性,实现了对呼吸道传染病感染人群的信息化、线上化、智能化管理和分析,全面提升急性呼吸道传染病的防控水平和效率,降低传染病传染风险和传播范围,同时提升感染人员的协同排查、管控及时性、准确性和智能化水平;
(三)本发明通过整合户籍信息、行程记录、疫苗接种、抗原检测、停留场所等各类感染人员相关数据,同时对感染人员进行逐级协同排查、管控,解决了感染人员定位不精准、协查反馈慢等短板漏洞,对感染人员准确及时的实现“人数清、人头清、位置清和状态清”四清的方式方法;本发明聚焦利用信息化手段提升感染人群的排查、管控的及时性、准确性,实现感染人群管控的信息化、数字化、智能化,全面提升传染病感染人员管控水平和效率。
附图说明
下面结合附图对本发明进一步说明。
附图1为基于急性呼吸道传染病感染人群的数据分析方法的流程示意图。
具体实施方式
参照说明书附图和具体实施例对本发明的基于急性呼吸道传染病感染人群的数据分析方法及系统作以下详细地说明。
实施例1:
如附图1所示,本实施例提供了一种基于急性呼吸道传染病感染人群的数据分析方法,该方法具体如下:
S1、数据共享交换:通过传染病共享交换中心节点将感染人员数据推送至共享交换子节点;
S2、数据融合:数据同步后,利用手机号、姓名以及身份证号码三种关键信息对户籍信息、行程信息、传染病疫苗接种信息以及传染病抗原监测信息进行多源数据匹配及融合,形成感染人员标准库;
S3、应用主题库建设:对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
S4、分析展示:基于应用主题库,对感染人员进行一键直查及监测分析。
本实施例步骤S1中的数据共享交换具体如下:
S101、在共享交换子节点使用kafka group消费组订阅共享交换中心节点的感染风险人员资源目录主题topic;
S102、在数据新增的情况下,监听到数据和文件变化,通知共享交换子节点通过pull方式实时将已经使用国密算法SM2/SM3/SM4加密的最新当日和/或最新ID新增原始数据文件拉取至本节点;
S103、原始数据文件通过数字信封和数据签名的验证,保证数据文件的数据完整性;
S104、在原始数据文件的完整性验证无误后,通过SM2/SM3/SM4解密算法将数据文件的感染人员数据进行解密为明文数据,同时存入感染人员原始主题库,并对姓名、身份证及手机敏感信息进行加密存储,防止数据泄露。
本实施例步骤S2中的数据融合具体如下:
S201、利用BF(暴力匹配)算法依次逐步将姓名、身份证号及手机号匹配其他数据源数据;
S202、匹配成功后,补齐缺失的姓名、身份证及手机关键数据信息;
S203、补全数据时,添加补全数据来源,并根据数据来源信息利用Kafka Connect实时监测各类数据变化,进行实时更新补全数据;
S204、当关键信息数据发生改变和新增,利用incrementing自增模式、timestamp时间戳模式集timestamp+incrementing时间戳自增混合模式三种方式实现新增数据的同步,同时进行关键字段的同步和更新,补全和更新关键字段包括人员姓名、身份证号、停留场所、停留时间、所在位置、传染病疫苗接种及传染病抗原检测信息;
S205、补全关键信息后,形成融合库,为开展快速流调和感染人员排查提供数据支撑。
本实施例步骤S201中的利用BF(暴力匹配)算法进行数据匹配具体如下:
在主串中,检查起始位置分别是0、1、2…n-m且长度为m的n-m+1个子串,比对模式串匹配字段,在匹配过程中依次将姓名、身份证号及手机号信息以及人口信息、行程信息、传染病疫苗接种数据及传染病抗原检测的各类数据进行匹配。
本实施例步骤S3中的应用主题库建设具体如下:
S301、将融合库信息逐级分配给网格员或者基层单位,由基层人员对传染病风险人员进行流行病学分析和管控信息填报补充,同时将汇集的数据通过实体提取、关系提取、事件抽取及属性抽取的NLP技术对其中文本内容进行关键信息提取;
S302、经过实体对齐后,将同一风险人员关键信息存储到图数据库Neo4j中,形成涉疫风险人员流调知识图谱,同时形成协查信息库、感染人员信息库及隔离管控人员库应用主题库,最终形成信息完整且可用的高质的数据,实现本感染人员全程可溯、管控、分析等业务闭环分析数据基础。
本实施例步骤S302中的关键信息包括姓名、性别、年龄、联系电话、住址所在地市、现住址、诊断类型、感染来源、密切接触者信息、发病日期、是否关联聚集性事件、负责流调单位、人员时序GIS空间轨迹和时空伴随人员的信息。
本实施例步骤S4中的分析展示具体如下:
S401、利用应用主题库,使用展示本区域“人数清、人头清、位置清和状态清”四清情况,并展示感染人群感染分析和态势分析;
S402、通过流调、协查及管控信息结合知识图谱推理及GIS地图通过Echart和百度地图API相结合,并采用路径排序算法和TransE算法对风险人员和病例患者的行为轨迹回放、密接人群关系推演、传播模式分析和潜在感染人群发现分析及空间传播地理展示。
实施例2:
本发明提供了一种基于急性呼吸道传染病感染人群的数据分析系统,该系统包括,
数据共享交换模块,用于通过订阅共享交换中心节点的感染人员库表数据,完成数据文件的安全推送,并将已经通过国密算法进行加密的原始数据进行存储,形成原始库;
数据融合模块,用于综合利用身份证信息、行程信息、传染病疫苗接种以及传染病抗原检测信息,补齐风险人员的姓名、证件号码和手机号码、时空伴随人员姓名、伴随时间、伴随人员轨迹及位置信息,并对多源数据信息进行匹配及融合,形成感染人员标准库形成标准库;
应用主题库建设模块,用于对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
分析展示模块,用于基于应用主题库,进行感染人员的人群、轨迹及传播模式的相关梳理分析展示,形成可监控、可预测、可预警的人员排查、管控及分析体系,为传染病防控提供科学的决策数据支持。
实施例3:
本发明实施例还提供了一种电子设备,包括:存储器和处理器;
其中,存储器存储计算机执行指令;
处理器执行所述存储器存储的计算机执行指令,使得处理器执行本发明任一实施例中的基于急性呼吸道传染病感染人群的数据分析方法。
处理器可以是中央处理单元(,CPU),还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通过处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可用于储存计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现电子设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器还可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,只能存储卡(SMC),安全数字(SD)卡,闪存卡、至少一个磁盘存储期间、闪存器件、或其他易失性固态存储器件。
实施例4:
本发明实施例还提供了一种计算机可读存储介质,其中存储有多条指令,指令由处理器加载,使处理器执行本发明任一实施例中的基于急性呼吸道传染病感染人群的数据分析方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RYM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,该方法具体如下:
数据共享交换:通过传染病共享交换中心节点将感染人员数据推送至共享交换子节点;
数据融合:数据同步后,利用手机号、姓名以及身份证号码三种关键信息对户籍信息、行程信息、传染病疫苗接种信息以及传染病抗原监测信息进行多源数据匹配及融合,形成感染人员标准库;
应用主题库建设:对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
分析展示:基于应用主题库,对感染人员进行一键直查及监测分析。
2.根据权利要求1所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,数据共享交换具体如下:
在共享交换子节点使用kafka group消费组订阅共享交换中心节点的感染风险人员资源目录主题topic;
在数据新增的情况下,监听到数据和文件变化,通知共享交换子节点通过pull方式实时将已经使用国密算法SM2/SM3/SM4加密的最新当日和/或最新ID新增原始数据文件拉取至本节点;
原始数据文件通过数字信封和数据签名的验证;
在原始数据文件的完整性验证无误后,通过SM2/SM3/SM4解密算法将数据文件的感染人员数据进行解密为明文数据,同时存入感染人员原始主题库,并对姓名、身份证及手机敏感信息进行加密存储。
3.根据权利要求1所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,数据融合具体如下:
利用BF算法依次逐步将姓名、身份证号及手机号匹配其他数据源数据;
匹配成功后,补齐缺失的姓名、身份证及手机关键数据信息;
补全数据时,添加补全数据来源,并根据数据来源信息利用Kafka Connect实时监测各类数据变化,进行实时更新补全数据;
当关键信息数据发生改变和新增,利用incrementing自增模式、timestamp时间戳模式集timestamp+incrementing时间戳自增混合模式三种方式实现新增数据的同步,同时进行关键字段的同步和更新,补全和更新关键字段包括人员姓名、身份证号、停留场所、停留时间、所在位置、传染病疫苗接种及传染病抗原检测信息;
补全关键信息后,形成融合库。
4.根据权利要求3所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,利用BF算法进行数据匹配具体如下:
在主串中,检查起始位置分别是0、1、2…n-m且长度为m的n-m+1个子串,比对模式串匹配字段,在匹配过程中依次将姓名、身份证号及手机号信息以及人口信息、行程信息、传染病疫苗接种数据及传染病抗原检测的各类数据进行匹配。
5.根据权利要求1所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,应用主题库建设具体如下:
将融合库信息逐级分配给网格员或者基层单位,由基层人员对传染病风险人员进行流行病学分析和管控信息填报补充,同时将汇集的数据通过实体提取、关系提取、事件抽取及属性抽取的NLP技术对其中文本内容进行关键信息提取;
经过实体对齐后,将同一风险人员关键信息存储到图数据库Neo4j中,形成涉疫风险人员流调知识图谱,同时形成协查信息库、感染人员信息库及隔离管控人员库应用主题库,最终形成信息完整且可用的高质的数据。
6.根据权利要求5所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,关键信息包括姓名、性别、年龄、联系电话、住址所在地市、现住址、诊断类型、感染来源、密切接触者信息、发病日期、是否关联聚集性事件、负责流调单位、人员时序GIS空间轨迹和时空伴随人员的信息。
7.根据权利要求1所述的基于急性呼吸道传染病感染人群的数据分析方法,其特征在于,分析展示具体如下:
利用应用主题库,展示感染人群感染分析和态势分析;
通过流调、协查及管控信息结合知识图谱推理及GIS地图通过Echart和百度地图API相结合,并采用路径排序算法和TransE算法对风险人员和病例患者的行为轨迹回放、密接人群关系推演、传播模式分析和潜在感染人群发现分析及空间传播地理展示。
8.一种基于急性呼吸道传染病感染人群的数据分析系统,其特征在于,该系统包括,
数据共享交换模块,用于通过订阅共享交换中心节点的感染人员库表数据,完成数据文件的安全推送,并将已经通过国密算法进行加密的原始数据进行存储,形成原始库;
数据融合模块,用于综合利用身份证信息、行程信息、传染病疫苗接种以及传染病抗原检测信息,补齐风险人员的姓名、证件号码和手机号码、时空伴随人员姓名、伴随时间、伴随人员轨迹及位置信息,并对多源数据信息进行匹配及融合,形成感染人员标准库形成标准库;
应用主题库建设模块,用于对感染人员协同调查、流行病学调查、隔离管控信息补充补全,形成完整详细的协查信息库、流调信息库、风险人员库和隔离管控人员库;
分析展示模块,用于基于应用主题库,进行感染人员的人群、轨迹及传播模式的相关梳理分析展示,形成可监控、可预测、可预警的人员排查、管控及分析体系,为传染病防控提供科学的决策数据支持。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器上存储有计算机程序;
所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如权利要求1至7任一项所述的基于急性呼吸道传染病感染人群的数据分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如权利要求1至7中任一项所述的基于急性呼吸道传染病感染人群的数据分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210650481.5A CN115064280A (zh) | 2022-06-10 | 2022-06-10 | 基于急性呼吸道传染病感染人群的数据分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210650481.5A CN115064280A (zh) | 2022-06-10 | 2022-06-10 | 基于急性呼吸道传染病感染人群的数据分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115064280A true CN115064280A (zh) | 2022-09-16 |
Family
ID=83201123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210650481.5A Pending CN115064280A (zh) | 2022-06-10 | 2022-06-10 | 基于急性呼吸道传染病感染人群的数据分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115064280A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117635402A (zh) * | 2024-01-25 | 2024-03-01 | 中国人民解放军国防科技大学 | 智慧流调系统、方法、计算机设备和存储介质 |
CN117635402B (zh) * | 2024-01-25 | 2024-05-17 | 中国人民解放军国防科技大学 | 智慧流调系统、方法、计算机设备和存储介质 |
-
2022
- 2022-06-10 CN CN202210650481.5A patent/CN115064280A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117635402A (zh) * | 2024-01-25 | 2024-03-01 | 中国人民解放军国防科技大学 | 智慧流调系统、方法、计算机设备和存储介质 |
CN117635402B (zh) * | 2024-01-25 | 2024-05-17 | 中国人民解放军国防科技大学 | 智慧流调系统、方法、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bay et al. | BlueTrace: A privacy-preserving protocol for community-driven contact tracing across borders | |
CN103098070B (zh) | 用于监视网络服务中数据位置的方法、装置和系统 | |
Fähnrich et al. | Surveillance and Outbreak Response Management System (SORMAS) to support the control of the Ebola virus disease outbreak in West Africa | |
CN111177252B (zh) | 一种业务数据的处理方法及装置 | |
Angelopoulos et al. | DHP Framework: Digital Health Passports Using Blockchain--Use case on international tourism during the COVID-19 pandemic | |
TW202032488A (zh) | 基於區塊鏈的地圖應用群眾外包 | |
Lin et al. | Privacy, security and resilience in mobile healthcare applications | |
Park et al. | Development and utilization of a rapid and accurate epidemic investigation support system for COVID-19 | |
US20210313026A1 (en) | Systems and methods for accelerated epidemic recovery | |
CN108711006A (zh) | 收入管理方法、管理节点、系统及存储设备 | |
US9736155B2 (en) | System, method, and apparatus for authentication | |
US20200034545A1 (en) | Information provision device, information provision system, information provision method, and program | |
CN111460330A (zh) | 数据处理方法、装置、设备及存储介质 | |
Casagrande et al. | Contact tracing made un-relay-able | |
Corte-Real et al. | Blockchain technology and universal health coverage: Health data space in global migration | |
Hsaini et al. | Contact-tracing approaches to fight COVID-19 pandemic: limits and ethical challenges | |
WO2021212113A1 (en) | Storing, authenticating, and transmitting health data | |
Gangadhar et al. | Mental Health Programme in India: Has the tide really turned? | |
CN115064280A (zh) | 基于急性呼吸道传染病感染人群的数据分析方法及系统 | |
Chaudhary et al. | Organ bank based on blockchain | |
CN111161109A (zh) | 一种基于区块链的学生档案存储、提取方法及存储、提取系统 | |
US20200184430A1 (en) | Electronic ticket management system, electronic ticket management method and electronic ticket management program | |
Behnaminia et al. | Blockchain technology applications in patient tracking systems regarding privacy-preserving concerns and COVID-19 pandemic | |
CN115190122A (zh) | 基于区块链的行程关联方法、装置、设备及存储介质 | |
Bhattacharya et al. | COVID-19: privacy and confidentiality issues with contact tracing apps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |