CN112992375A - 一种疾病的预警方法、预警装置、设备及介质 - Google Patents
一种疾病的预警方法、预警装置、设备及介质 Download PDFInfo
- Publication number
- CN112992375A CN112992375A CN202110445923.8A CN202110445923A CN112992375A CN 112992375 A CN112992375 A CN 112992375A CN 202110445923 A CN202110445923 A CN 202110445923A CN 112992375 A CN112992375 A CN 112992375A
- Authority
- CN
- China
- Prior art keywords
- data
- early warning
- disease
- model
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明涉及疾病的预警技术领域,涉及一种疾病的预警方法、预警装置、设备及介质。预警方法,步骤包括:获取已知疾病数据,并且根据疾病数据建立基础模型;获取公卫数据建立公卫数据集;将获取的公卫数据集处理获得完整数据;根据所述完整数据分成建模用的预警数据,所述预警数据分解出已知数据和异常数据;将所述已知数据进入基础模型进行预警模拟;用所述异常数据建立预警模型进行趋势预测。本实施例预警模型实时的对公卫数据中疾病进行预警,当出现异常疾病时,建立相应的预警模型进行预警。通过多次模拟实验结果,得出多套预防方案,将这些方案做组合以及实施方式和实施时间点的选择,得出预防该疾病的最优方案,采取更有效的手段做防控管理。
Description
技术领域
本发明涉及疾病的预警技术领域,具体地,涉及一种疾病的预警方法、预警装置、设备及介质。
背景技术
目前市面上存在的预警决策方法缺少传染病模型的支撑,建立模型库系统填补目前的技术缺失,通过建立模型库系统解决目前缺少传染病模型的问题,模型库系统的参数设置决定预测结果的准确性,专业技术人员基于行业的累积与对疾病的认知,对模型库进行合理的参数设置,解决模型预测结果与实际偏差较大的问题;通过实时监测系统与预警系统,能够解决提高公共卫生突发事件的应急反应能力。
本发明发明人在实现本发明的过程中,发现:目前,预警方法无法对数据异常情况进行研判分析,无法准确发现突发传染病,无法更早的为相关机构和人员发出预警信号。
发明内容
针对现有技术的上述缺陷,本发明的主要目的在于提供一种疾病的预警方法,主要步骤包括:
获取已知疾病数据,并且根据疾病数据建立基础模型,其中所述疾病数据包括疾病的症状、发病时间;
获取公卫数据建立公卫数据集,所述公卫数据是医疗机构接诊记录中的就诊数据;
将获取的公卫数据集分别通过清洗处理、脱敏处理和归一化处理,获得完整数据;
根据所述完整数据分成建模用的预警数据,所述预警数据分解出已知数据和异常数据;
将所述已知数据进入基础模型进行预警模拟;
用所述异常数据建立预警模型进行趋势预测,其中具体的:
在所述公卫数据集查找出相同的异常数据,根据异常数据的疾病症状设定模型因子,和疾病症状的比重设定模型因子权重,根据模型因子和模型因子权重在基础模型上建立预警模型,用于预测该异常数据的发展趋势。
进一步的,所述预警数据分解出常规数据和异常数据是,将获得的所述预警数据中的数据与基础模型比对;
如所述预警数据与所述基础模型任意一数据特征相同,则所述预警数据为已知数据;否则,该所述预警数据为异常数据。
进一步的,在获得所述异常数据后,针对异常数据的进行预警,所述预警包括症状类型预警和症状区域预警;
所述症状类型预警是一时期内针对异常数据中该相同症状的类型疾病出现的地区进行预警;
症状区域预警是则是一地区内该相同症状的疾病统计。
进一步的,所述针对异常数据的进行预警还会从病症层进行分析是对病症数据做处理,通过数据归纳得出近期各病症的数据情况,分析人群分布,病症携带者区域分布,以及未来病状扩散趋势。
进一步的,所述清洗处理是通过双线性插值法对所述数据集进行完整性处理,具体的是将数据集内缺失的数据进行插值处理从而获得完整数据集。
进一步的,所述脱敏处理是通过替代法、无效化、均值法或者偏移法其中一只或者两种以上组合方法对数据集进行脱敏处理,从而获得脱敏数据集。
进一步的,所述归一化处理是将数据集中分为时序数据集和非归序数据;
所述时序数据是按照时间顺序排列的数据集;所述非归序数据是非按照时间顺序排列的数据集。
本实施例是,预警模型实时的对公卫数据中不同的疾病进行预警,当出现异常疾病时,适当的更加疾病的病症,建立相应的预警模型进行预警。也就可以针对该疾病在某种特定条件下,通过多次模拟实验结果,得出多套预防方案,将这些方案做组合以及实施方式和实施时间点的选择,得出预防该疾病的最优方案,以及满足该套方案的外在医疗资源,追溯该疾病的起源,便于疾控部门复盘急性传染病的整个过程,并采取更有效的手段做防控管理。
另一方面还公开了一种疾病的预警装置,包括:
基础模型建立模块,用于获取已知疾病数据,并且根据疾病数据建立基础模型,其中所述疾病数据包括疾病的症状、发病时间;
公卫数据获取模块,用于获取公卫数据建立公卫数据集,所述公卫数据是医疗机构接诊记录中的就诊数据;
公卫数据处理模块,用于将获取的公卫数据集分别通过清洗处理、脱敏处理和归一化处理,获得完整数据;
预警数据获取模块,用于根据所述完整数据分成建模用的预警数据,所述预警数据是从完整数据中分解出已知数据和异常数据;
已知数据预警模块,用于将所述已知数据进入基础模型进行预警模拟;
异常数据预警模块,用于用所述异常数据建立预警模型进行趋势预测,其中具体的:
在所述公卫数据集查找出相同的异常数据,根据异常数据的疾病症状设定模型因子,和疾病症状的比重设定模型因子权重,根据模型因子和模型因子权重在基础模型上建立预警模型,用于预测该异常数据的发展趋势。
另一方面还公开了一种设备,其中,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如任一项所述的一种疾病的预警方法。
另一方面还公开了一种计算机可读存储介质,其中,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令由处理器加载并执行如任一项的一种疾病的预警方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1是本发明中一实施例的疾病的预警方法的流程图;
图2是本发明中一实施例的疾病的预警装置;
图3是本发明中一实施例的预警模型中学习算法的示例图;
图4是本发明中一实施例的负二项分布模型的示意图;
图5是本发明中一实施例的随机数模拟获得季节因素的示意图;
图6是本发明中用于实现本发明实施例所提供的方法的设备的硬件结构示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
下面,将通过几个具体的实施例对发明实施例提供的一种疾病的预警方法及装置进行详细介绍和说明。
一种疾病的预警方法,步骤包括:
步骤S201:获取已知疾病数据,并且根据疾病数据建立基础模型,其中所述疾病数据包括疾病的症状、发病时间。
可以理解的,是从所述医疗机构获取到相关的传染病的病例数据和与传染病相识病症的病例数据,并且使用这些病例数据建立基础的基础模型。
实施例中,在建立基础模型时,是建立一多维度的基础模型,可以随着时间不断的迭代新增优化。如在基础模型建立之初可以有以下几种简单的处理模型:
按照身体的部位出现的疾病症状,进行症状的划分建立身体部位的基础模型。比如人体的症状分为:全身、头部、颈部、胸部、背部、腹部、腰部、臀部、盆腔、四肢、生殖部位、皮肤等部位的症状。基础模型可依据不同身体部位的症状进行概率加权相关性分析。
按照人群划分从而建立人群的基础模型,可以按照年龄的层次进行划分。可以分为老年、幼儿和成人。按照性别可以分为男性和女性。不通的年龄层次以及性别的差异对应的计算标准进行差异化识别。
根据医学地理进行划分从而建立区域的基础模型。如分为可以分为低风险、中风险、高风险等等级区域。其中,医学地理区划是据人群疾病和健康水平与地理环境关系的地域划分,进行医学地理区域单元的划分。即按一定的区划原则把某一地区划分成若干具有相似自然-人文地理条件和健康效应的医学地理区。为制定医学保健规划,控制和预防疾病、增进健康提供科学依据和对策。
公共卫生服务医疗水平划分。可以分为落后、一般和发达等。
可以按照职业人群进行划分。如学生,医生,工人等用于判断某种疾病的易发人群。
其中多维度的基础模型由多个参数组成,如包括:不同传染病类型因素、不同城市地域风险等级、校园缺课率及防控物资储备等社会学因素。通过现有的疾病因素、不同城市情况、药品物资消耗等多元数据,按设定时间周期为自身对照,挖掘传染病排除混杂因素后的基线情况,保证模型算法的灵敏度。
实施例具体的,在建立多维度的基础模型时,需要考虑城市风险预警因素、疾病风险等级因素和药品、防控物资因素等预测因素。
实施例中,所述疾病风险等级因素的确定:
实施例,为了尽量克服数据的延迟性,确保数据准确,以T-1(天)数据为准,对不同种类传染病分别标准化。以支气管炎为例:
通过获取当天的支气管炎患者人数,排除气候、环境等外在影响因素,得到当日患病的参考数据;
获取该疾病前三天的患病人数,作为影响干扰因素数据;
将干扰因素数据与参考数据作对照,可得出当日的风险值。具体的是,排除气候、环境等外在影响因素后,即获得前三天经过标准化后的患病人数和当日标准化患病人数,并获取前三天经过标准化后的患病人数和当日标准化患病人数的比值作为特定统计量风险值:
并且预先设置阈值,并根据阀值与风险值的对比判断风险等级。实施例,如风险值≤1,则判定为低风险;在阈值A与阈值B中为中风险;大于阈值B为高风险,这里的阈值A小于阈值B。
将当日风险值与城市风险预警基线值对比,按预设阈值推算出该疾病的风险情况;
具体是,将风险值与预警基线值就是对比获得对比值,并根据对比值判断该疾病的风险情况。
如当对比值≤1时可认为是低风险;对比值>1时,则比较计算超出部分,具体计算如:(风险值-基线值)/基线值,得到一个百分数值投入相应阈值区间,进行判断该疾病的风险情况。
结合多种病症数据,纳入基础模型,就可以得到该城市这一天的病症预警风险等级,如将等级设定包括:高、中、低。
实施例中,所述城市风险预警因素确定如下:
由于城市内气温、空气质量、人口学等环境因素对流行病的作用可能存在延时性,不一定即时反馈出来。因此,需要结合该疾病和该城市的基线情况综合判断,获得针对该疾病的城市风险预警因素。
实施例中,以支气管炎为例,以过往N年前的支气管炎数据为数据基础,例如3月1日(17年,18年,19年,20年)的患病数,分别扣除当年那天因为环境、气候等外在影响因素,从而得到这一天支气管炎的患病基线值。
实施例中,结合多种疾病的病症预警风险等级,按不同权重纳入基础模型,就可以得到该城市某一天的病症预警基线值,这里的权重根据该类传染病病例数在该城市总体人口中的比例获得;
同理,医疗数据和药品销售预警基线值,通过过往数据用时间序列平滑移动算出得到。这里的医疗数据包括医疗机构医护人员、床位和医用防护物资数量等。时间序列平滑移动是指用长期时间下的相关数据保证模拟基线值。
将病症预警基线值、医疗数据和药品销售预警基线值数据结合,实施例,数据结合是指数据标准化后进行相加,从而算出城市风险预警基线值,实施例通过城市风险预警基线值作为该城市的传染病风险基线情况,可根据后期气候因素、物资消耗情况等变量在该基线上预测。
实施例中,所述药品、防控物资等要素确定:
获取当天疾病对应的药品物资的当天销售数据,并且通过疾病与当天销售数据结合,从而推算出城市当天的风险等级和预警;
具体的:在获得的城市传染病风险基线值的基础上,将当日的病例数、药品销售数据标准化后加入城市传染病风险基线值,获得结果后投入阈值区间进行对比,得到当日或未来预测风险等级。
获取当天的前N天对应药品销售情况作为前N天销售参考值;
用前N天销售参考值和当天销售数据作对比,如当天疾病对应的药品物资卖得越多,物资使用越多,传染病风险等级越高,如果,药品销售数据缺失严重,可能存在较严重误差,则数据不准确。
在实施例中,如某日该地区的气温骤降,出现大面积感冒并咳嗽发烧等症状,此时患病人数、药品消耗、校园缺课率都将大幅提升,认为属于可控范畴,则认为与传染病风险等级无直接关联,将该数据进行处理不采纳该数据减小对预测的影响。
步骤S202:获取公卫数据建立公卫数据集,所述公卫数据是医疗机构接诊记录中的就诊数据。
可以理解的,是从所述医疗机构获取到相关的传染病的病例数据和与传染病相识病症的病例数据,并且使用这些病例数据建立基础的基础模型。
实施例中,从医院和诊所等医疗机构,例如从医疗机构的软件系统中获取急性上呼吸道感染就诊数、支气管炎就诊数、急性支气管炎就诊数等数据,在大屏页面上集中展示。
并且,从药品销售相关机构合作,获取常用药品的数据,例如,感冒类、消炎类和发热类数据。
与教育部门相关机构合作获取今日缺课数据,以各个中学为单位,在大屏页面上轮播展示。
实施例中,通过目前数据抽取技术,来实现公共卫生数据的收集。通过爬虫对互联网数据的爬取,比如舆论,来增强公共卫生领域有关疾病的预测机制。通过数据抽取技术来进行数据同步采集,将公卫相关的数据采集到数据处理中心。
实施例中,公卫数据包括症状数据、化验室数据、实验室数据、临床诊断数据和药房相关数据直接医疗数据,以及地理信息、人口学数据、舆情数据、水文水质水生态数据、全球安全指数、气象数据、环境检验数据和环境监测数据等辅助数据。
步骤S203:将获取的公卫数据集分别通过清洗处理、脱敏处理和归一化处理,获得完整数据。
将采集的医疗数据与其他大数据平台的原始数据传输到传染病预警决策平台系统中,对数据进行清洗、分类、管理、分析等处理获得完整数据。
实施例中,所述清洗处理是通过双线性插值法对所述数据集进行完整性处理,具体的是将数据集内缺失的数据进行插值处理从而获得完整数据集。
也就是,通过双线性插值法对缺失的数据进行插值处理。双线性插值,在像素点矩阵上面,x和y两个方向的线性插值所得的结果,双线性内插法的计算比最邻近点法复杂,计算量较大,但没有灰度不连续的缺点,结果基本令人满意。所述双线性插值法如下:
进一步的,所述脱敏处理是通过替代法、无效化、均值法或者偏移法其中一只或者两种以上组合方法对数据集进行脱敏处理,从而获得脱敏数据集。具体的:
替换:以虚构的数据代替真值。例如,建立一个较大的虚拟值数据表,对每一真实值记录产生随机种子,对原始数据内容进行哈希映射替换。这种方法得到的数据与真实数据非常相似。
无效化:以NULL 或***** 代替真值或真值的一部分,如遮盖信用卡号的后12 位。
均值化:针对数值型数据,首先计算它们的均值,然后使脱敏后的值在均值附近随机分布,从而保持数据的总和不变,通常用于产品成本表、工资表等场合。
偏移:通过随机移位改变数字数据。
进一步的,所述归一化处理是将数据集中分为时序数据集和非归序数据;
所述时序数据是按照时间顺序排列的数据集;所述非归序数据是非按照时间顺序排列的数据集。
实施例中,min-max模型和z-score模型对数据集进行归一化处理。归一化处理的数据集,
步骤S204:根据所述完整数据分成建模用的预警数据,所述预警数据分解出已知数据和异常数据。
进一步的,所述预警数据分解出常规数据和异常数据是,将获得的所述预警数据中的数据与基础模型比对;
如所述预警数据与所述基础模型任意一数据特征相同,则所述预警数据为已知数据;否则,该所述预警数据为异常数据。
步骤S205:将所述已知数据进入基础模型进行预警模拟。
已知数据则进入模型库系统进行基础模型的仿真演练,基础模型通过虚拟仿真和动力学建模技术搭建而成,基础模型可以应用到多种疾病,同时会根据不断的演练,预测结果将会无限接近预测结果。
实施例是,实时对各种疾病的仿真演练、研判分析,最终输出决策报告为决策部门提供技术支持,同时利用可视化技术进行综合展示,对评价防控措施进行有效性和成本效益评价,在战时提高决策的精准性。
步骤S206:异常数据发送异常提示,并且用所述异常数据建立预警模型进行趋势预测,其中具体的:
在所述公卫数据集查找出相同的异常数据,根据异常数据的疾病症状设定模型因子,和疾病症状的比重设定模型因子权重,根据模型因子和模型因子权重在基础模型上建立预警模型,用于预测该异常数据的发展趋势。
进一步的,在获得所述异常数据后,针对异常数据的进行双维度预警,所述双维度预警包括症状类型预警和症状区域预警;
所述症状类型预警是一时期内针对异常数据中该相同症状的类型疾病出现的地区进行预警;
症状区域预警是则是一地区内该相同症状的疾病统计;
并且,还会从病症层进行分析是对病症数据做处理,通过数据归纳得出近期各病症的数据情况,分析人群分布,病症携带者区域分布,以及未来病状扩散趋势。
实施例中,所述建立预警模型包括预警模型、风险评估模型和预测发病趋势模型。
1)预警模型
预警模型需要构建SEIR模型、多元线性回归模型、负二项分布模型、时序模型、时空分析模型、政策模拟仿真等至少一种以上的预警模型,预警模型具备较高的灵敏度与特异度,并且可以随着输入参数的调优、增加,不断的提高。
SEIR模型是传染病动力学模型:一般SEIR动力学模型中涉及的随机过程包括4个状态,具体如下:
(1)S:易感人群(susceptible),指有机会接触感染者的人群;
(2)E:处于潜伏期的感染者(infection latent);
(3)I:感染发病并被隔离者(infection isolated);
(4)R:移出人群(remover),包括病死或康复后具有免疫力(recovered andimmune)。
相应的一般动力学模型为:
这里的SEIR模型,SEIR模型中的参数设置至关重要。实施例中,的SEIR模型的参数将依据两部分决定:
首先,根据传染病的疫情的症状特征及专家提供的建议,拟定一个初步范围;其次,将已有疫情数据划分为训练集和独立验证集,进行计算机蒙特卡罗模拟,进而得到最优的参数。
2)风险评估模型:实施例,基于多元线性回归方法进行患病率、感染人数的分析预计,多元线性回归模型通常用来描述变量y和x之间的随机线性关系,其中多元线性回归模型如下:
Yk=β0+β1X1+β2X2+……+βkXk
其中,X1,X2……Xk是非随机的变量,Yk是随机的因变量,β是经过回归拟合后模拟出的参数。
实施例中,通过异常数据进行参数估计和显著性检验,可以的得到随因变量变化的准确模型。将异常数据中传染病疫情相关参数作为自变量纳入模型后,可以获得地区感染率或是感染人数的估计值,并且在不同地域间的差异可以通过回归模型体现。
3)预测发病趋势模型:实施例中所述预测发病趋势模型使用负二项分布模型,负二项分布是统计学上一种离散概率分布。其中,满足以下条件的称为负二项分布:实验包含一系列独立的实验,每个实验都有成功、失败两种结果,成功的概率是恒定的,实验持续到r次不成功,r为正整数。
F(k;r,p)=Ck+r-1 r-1 ·pr·(1—p)k,表示已知一个事件在伯努利试验中每次的出现概率是p,在一连串伯努利试验中,一件事件刚好在第r + k次试验出现第r次的概率.在疫情发病风险预测模型中,以p来表示发病率,则(1—p)可表示未发病率,通过负二项模型得到不同地域的发病概率趋势。
实施例,以新冠为例,通过基础模型中针对新冠疫情的模型,可以对实际疫情规模、疫情拐点、病床需求、境外输入风险、成本效益等方面进行分析、预测,同时也可以对防控效果进行评价分析;
通过模型对各种疾病的仿真演练、研判分析,最终输出决策报告为决策部门提供技术支持,同时利用可视化技术进行综合展示,对评价防控措施进行有效性和成本效益评价,在战时提高决策的精准性。
实施例,使用多种算法或参数修正,采用交叉验证验证模型结果,依据数据训练样本的模拟数据的演练,同时结合历史数据的对比和分析等手段,采用预测算法评估某种疾病的爆发周期和爆发的地点以及规模,根据疾病特征对应的药品数据预估药品的使用量。
实施例中,根据模型因子和模型因子权重在基础模型上建立预警模型,是根据参数匹配进行设定模型因子和模型因子权重,其中参数配置包含基因参数、环境参数和诱因参数,使得预警模型可以更加精确的进行计算。预警模型根据模拟结果的呈现、溯源、风险评估,针对某种疾病在某种特定条件下,通过多次模拟实验结果,得出多套预防方案,将这些方案做组合以及实施方式和实施时间点的选择,得出预防该疾病的最优方案,以及满足该套方案的外在医疗资源,追溯该疾病的起源,便于疾控部门复盘急性传染病的整个过程,并采取更有效的手段做防控管理,以医院公开的数据资料作为基础的症状特征量,把未知的症状作为未知因子进行引入进行后期的数据修正参考,比如常见的流感特征量有:发热,体温,咳嗽,痰,咽痛,流涕,疲劳,胸痛,头痛,呼吸困难,气短,萎靡不振,畏寒,肌肉酸痛,关节痛,恶心,呕吐,腹泻等,针对特征量进行分类,比如流感可以分为单纯性流感、肺炎性流感、中毒性流感、特殊人群流感、儿童流感、不明流感,相对传统的已经识别的流感类型,利用机器学习的相关性匹配算法,精确匹配预警,对于未知的样本症状的分析,可以采用数据驱动学习的算法进行预测,面对一个受限有穷空间到一个扩大的有穷空间的泛华问题,预警模型从以下几个方面入手解决如何将未知样本症状变为已知的样本症状的迭代过程。
实施例一方面公开了一种疾病的预警装置,包括:
基础模型建立模块101,用于获取已知疾病数据,并且根据疾病数据建立基础模型,其中所述疾病数据包括疾病的症状、发病时间;
公卫数据获取模块102,用于获取公卫数据建立公卫数据集,所述公卫数据是医疗机构接诊记录中的就诊数据;
公卫数据处理模块103,用于将获取的公卫数据集分别通过清洗处理、脱敏处理和归一化处理,获得完整数据;
预警数据获取模块104,用于根据所述完整数据分成建模用的预警数据,所述预警数据是从完整数据中分解出已知数据和异常数据;
已知数据预警模块105,用于将所述已知数据进入基础模型进行预警模拟;
异常数据预警模块106,用于用所述异常数据建立预警模型进行趋势预测,其中具体的:
在所述公卫数据集查找出相同的异常数据,根据异常数据的疾病症状设定模型因子,和疾病症状的比重设定模型因子权重,根据模型因子和模型因子权重在基础模型上建立预警模型,用于预测该异常数据的发展趋势。
本实施例是,预警模型实时的对公卫数据中不同的疾病进行预警,当出现异常疾病时,适当的更加疾病的病症,建立相应的预警模型进行预警。也就可以针对该疾病在某种特定条件下,通过多次模拟实验结果,得出多套预防方案,将这些方案做组合以及实施方式和实施时间点的选择,得出预防该疾病的最优方案,以及满足该套方案的外在医疗资源,追溯该疾病的起源,便于疾控部门复盘急性传染病的整个过程,并采取更有效的手段做防控管理。
上述实施例中提供的装置可执行本发明任意实施例所提供方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的一种疾病的预警方法。
本实施例还提供了一种计算机可读存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令由处理器加载并执行本实施例上述的一种疾病的预警方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例还提供了一种设备,所述设备包括处理器和存储器,其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行本实施例上述的一种疾病的预警方法。
所述镜面设备可以为设备、客户端或服务器,所述设备还可以参与构成本发明实施例所提供的装置或系统。如图6所示,设备11可以包括一个或多个(图中采用1102a、1102b,…… 1102n来示出)处理器1102(处理器1102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1104、以及用于通信功能的传输装置1106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图6所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端11还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
存储器1104可用于存储应用软件的软件程序以及模块,如本发明实施例中所述的方法对应的程序指令/数据存储装置,处理器1102通过运行存储在存储器1104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种疾病的预警方法。存储器1104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1104可进一步包括相对于处理器1102远程设置的存储器,这些远程存储器可以通过网络连接至镜面设备11。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与镜面设备11(或移动终端)的用户界面进行交互。
本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤和顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或中断产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本实施例中所示出的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。应当理解到,本实施例中所揭露的方法、装置等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元模块的间接耦合或通信连接。
基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员还可以进一步意识到,结合本说明书所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但这种实现不应认为超出本发明的范围。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种疾病的预警方法,其特征在于,步骤包括:
获取已知疾病数据,并且根据疾病数据建立基础模型,其中所述疾病数据包括疾病的症状、发病时间;
获取公卫数据建立公卫数据集,所述公卫数据是医疗机构接诊记录中的就诊数据;
将获取的公卫数据集分别通过清洗处理、脱敏处理和归一化处理,获得完整数据;
根据所述完整数据分成建模用的预警数据,所述预警数据分解出已知数据和异常数据;
将所述已知数据进入基础模型进行预警模拟;
用所述异常数据建立预警模型进行趋势预测,其中具体的:
在所述公卫数据集查找出相同的异常数据,根据异常数据的疾病症状设定模型因子,和疾病症状的比重设定模型因子权重,根据模型因子和模型因子权重在基础模型上建立预警模型,用于预测该异常数据的发展趋势。
2.根据权利要求1所述的疾病的预警方法,其特征在于,所述预警数据分解出常规数据和异常数据是,将获得的所述预警数据中的数据与基础模型比对;
如所述预警数据与所述基础模型任意一数据特征相同,则所述预警数据为已知数据;否则,该所述预警数据为异常数据。
3.根据权利要求2所述的疾病的预警方法,其特征在于,在获得所述异常数据后,针对异常数据的进行预警,所述预警包括症状类型预警和症状区域预警;
所述症状类型预警是一时期内针对异常数据中该相同症状的类型疾病出现的地区进行预警;
症状区域预警是则是一地区内该相同症状的疾病统计。
4.根据权利要求3所述的疾病的预警方法,其特征在于,所述针对异常数据的进行预警还会从病症层进行分析是对病症数据做处理,通过数据归纳得出近期各病症的数据情况,分析人群分布,病症携带者区域分布,以及未来病状扩散趋势。
5.根据权利要求1所述的疾病的预警方法,其特征在于,所述清洗处理是通过双线性插值法对所述数据集进行完整性处理,具体的是将数据集内缺失的数据进行插值处理从而获得完整数据集。
6.根据权利要求1所述的疾病的预警方法,其特征在于,所述脱敏处理是通过替代法、无效化、均值法或者偏移法其中一只或者两种以上组合方法对数据集进行脱敏处理,从而获得脱敏数据集。
7.根据权利要求1所述的疾病的预警方法,其特征在于,所述归一化处理是将数据集中分为时序数据集和非归序数据;
所述时序数据是按照时间顺序排列的数据集;所述非归序数据是非按照时间顺序排列的数据集。
8.一种疾病的预警装置,其特征在于,包括:
基础模型建立模块,用于获取已知疾病数据,并且根据疾病数据建立基础模型,其中所述疾病数据包括疾病的症状、发病时间;
公卫数据获取模块,用于获取公卫数据建立公卫数据集,所述公卫数据是医疗机构接诊记录中的就诊数据;
公卫数据处理模块,用于将获取的公卫数据集分别通过清洗处理、脱敏处理和归一化处理,获得完整数据;
预警数据获取模块,用于根据所述完整数据分成建模用的预警数据,所述预警数据是从完整数据中分解出已知数据和异常数据;
已知数据预警模块,用于将所述已知数据进入基础模型进行预警模拟;
异常数据预警模块,用于用所述异常数据建立预警模型进行趋势预测,其中具体的:
在所述公卫数据集查找出相同的异常数据,根据异常数据的疾病症状设定模型因子,和疾病症状的比重设定模型因子权重,根据模型因子和模型因子权重在基础模型上建立预警模型,用于预测该异常数据的发展趋势。
9.一种设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-7任一项所述的一种疾病的预警方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令由处理器加载并执行如权利要求1-7任一项的一种疾病的预警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110445923.8A CN112992375A (zh) | 2021-04-25 | 2021-04-25 | 一种疾病的预警方法、预警装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110445923.8A CN112992375A (zh) | 2021-04-25 | 2021-04-25 | 一种疾病的预警方法、预警装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112992375A true CN112992375A (zh) | 2021-06-18 |
Family
ID=76340028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110445923.8A Pending CN112992375A (zh) | 2021-04-25 | 2021-04-25 | 一种疾病的预警方法、预警装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112992375A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744888A (zh) * | 2021-09-02 | 2021-12-03 | 深圳万海思数字医疗有限公司 | 区域流行病趋势预测预警方法及系统 |
CN115101216A (zh) * | 2022-08-25 | 2022-09-23 | 南京汉卫公共卫生研究院有限公司 | 一种基于大数据的新发传染病监测及应对系统 |
CN115223728A (zh) * | 2022-09-21 | 2022-10-21 | 南京汉卫公共卫生研究院有限公司 | 一种基于大数据的传染病预测方法及系统 |
CN115394455A (zh) * | 2022-05-31 | 2022-11-25 | 北京乾图科技有限公司 | 基于空间聚类离散格网的传染病时空扩散预测方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108198630A (zh) * | 2018-03-09 | 2018-06-22 | 中华人民共和国陕西出入境检验检疫局 | 一种机场疾病预警与防控方法 |
CN108417274A (zh) * | 2018-03-06 | 2018-08-17 | 东南大学 | 流行病预测方法、系统及设备 |
CN108766584A (zh) * | 2018-05-25 | 2018-11-06 | 重庆电子工程职业学院 | 疾病预警方法及系统 |
WO2019168323A1 (ko) * | 2018-02-27 | 2019-09-06 | 엘지이노텍 주식회사 | 이상 개체 검출 장치 및 방법, 이를 포함하는 촬상 장치 |
CN111081334A (zh) * | 2019-12-18 | 2020-04-28 | 鲁东大学 | 一种基于风险因素概率组合分析的慢性疾病早期预警方法 |
CN111899893A (zh) * | 2020-09-29 | 2020-11-06 | 南京汉卫公共卫生研究院有限公司 | 一种传染病预警决策平台系统 |
-
2021
- 2021-04-25 CN CN202110445923.8A patent/CN112992375A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019168323A1 (ko) * | 2018-02-27 | 2019-09-06 | 엘지이노텍 주식회사 | 이상 개체 검출 장치 및 방법, 이를 포함하는 촬상 장치 |
CN108417274A (zh) * | 2018-03-06 | 2018-08-17 | 东南大学 | 流行病预测方法、系统及设备 |
CN108198630A (zh) * | 2018-03-09 | 2018-06-22 | 中华人民共和国陕西出入境检验检疫局 | 一种机场疾病预警与防控方法 |
CN108766584A (zh) * | 2018-05-25 | 2018-11-06 | 重庆电子工程职业学院 | 疾病预警方法及系统 |
CN111081334A (zh) * | 2019-12-18 | 2020-04-28 | 鲁东大学 | 一种基于风险因素概率组合分析的慢性疾病早期预警方法 |
CN111899893A (zh) * | 2020-09-29 | 2020-11-06 | 南京汉卫公共卫生研究院有限公司 | 一种传染病预警决策平台系统 |
Non-Patent Citations (1)
Title |
---|
孙玺菁等: "《复杂网络算法与应用》", 31 July 2015, 北京:国防工业出版社 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744888A (zh) * | 2021-09-02 | 2021-12-03 | 深圳万海思数字医疗有限公司 | 区域流行病趋势预测预警方法及系统 |
CN113744888B (zh) * | 2021-09-02 | 2023-09-22 | 深圳万海思数字医疗有限公司 | 区域流行病趋势预测预警方法及系统 |
CN115394455A (zh) * | 2022-05-31 | 2022-11-25 | 北京乾图科技有限公司 | 基于空间聚类离散格网的传染病时空扩散预测方法及装置 |
CN115101216A (zh) * | 2022-08-25 | 2022-09-23 | 南京汉卫公共卫生研究院有限公司 | 一种基于大数据的新发传染病监测及应对系统 |
CN115223728A (zh) * | 2022-09-21 | 2022-10-21 | 南京汉卫公共卫生研究院有限公司 | 一种基于大数据的传染病预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112992375A (zh) | 一种疾病的预警方法、预警装置、设备及介质 | |
Sosa-Rubi et al. | Heterogeneous impact of the “Seguro Popular” program on the utilization of obstetrical services in Mexico, 2001–2006: A multinomial probit model with a discrete endogenous variable | |
Zhang et al. | Using CatBoost algorithm to identify middle-aged and elderly depression, national health and nutrition examination survey 2011–2018 | |
Chen et al. | Efficient social distancing during the COVID-19 pandemic: Integrating economic and public health considerations | |
Cano Martín et al. | Economic impact assessment from the use of a mobile app for the self-management of heart diseases by patients with heart failure in a Spanish region | |
CN107111679A (zh) | 用于确定健康风险的方法 | |
CN105528526A (zh) | 一种基于中医药传承与大数据挖掘的生命周期动态健康管理系统 | |
Raballo et al. | Tracking salience in young people: A psychometric field test of the Aberrant Salience Inventory (ASI) | |
Webster et al. | Salt intakes, knowledge, and behavior in Samoa: monitoring salt‐consumption patterns through the World Health Organization's Surveillance of Noncommunicable Disease Risk Factors (STEPS) | |
Bermudez et al. | The relationship between SCHIP enrollment and hospitalizations for ambulatory care sensitive conditions in California | |
Aram et al. | Estimating an individual’s probability of revision surgery after knee replacement: a comparison of modeling approaches using a national data set | |
CN112768074A (zh) | 一种基于人工智能的重疾风险预测方法及系统 | |
Zhang et al. | Predictivity of tourism demand data | |
Li et al. | A spatial hierarchical model for integrating and bias-correcting data from passive and active disease surveillance systems | |
Cylus et al. | Cross-national efficiency comparisons of health systems, subsectors and disease areas | |
US20230409926A1 (en) | Index for risk of non-adherence in geographic region with patient-level projection | |
Alemayehu et al. | Considerations on the use of patient-reported outcomes in comparative effectiveness research | |
O'Malley et al. | Modeling a bivariate residential‐workplace neighborhood effect when estimating the effect of proximity to fast‐food establishments on body mass index | |
Zauner et al. | Microscopic modelling of international (re-) hospitalisation effects in the CEPHOS-LINK setting | |
Sevgen et al. | Comparison of machine learning algorithms for mass appraisal of real estate data | |
Mohebbi et al. | Exploring the Association Between Structural Racism and Mental Health: Geospatial and Machine Learning Analysis | |
Peterson et al. | Spatial temporal aggregated predictors to examine built environment health effects | |
US20230238145A1 (en) | Health score and predictive analysis | |
Cossio | Digital social determinants of health | |
Gao | Social Media Use in Public Health and Policy Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210618 |
|
RJ01 | Rejection of invention patent application after publication |