CN112951443B - 症候群监测预警方法、装置、计算机设备及存储介质 - Google Patents
症候群监测预警方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112951443B CN112951443B CN202110412510.XA CN202110412510A CN112951443B CN 112951443 B CN112951443 B CN 112951443B CN 202110412510 A CN202110412510 A CN 202110412510A CN 112951443 B CN112951443 B CN 112951443B
- Authority
- CN
- China
- Prior art keywords
- syndrome
- keywords
- target
- symptom
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及智能决策技术,尤其涉及预测模型,提供了一种症候群监测预警方法、装置、计算机设备及可读存储介质,通过从就诊人的电子病历中提取症状关键词;根据症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例;若确定就诊人属于其中一个症候群的病例,确定症候群为目标症候群;获取预设的时间单位内所述目标症候群的病例数;根据当前的预设时间单位内目标症候群的病例数,计算目标症候群的若干统计指标;将目标症候群的若干统计指标输入风险预测模型,以获取目标症候群的风险等级;根据目标症候群的风险等级,发布目标症候群的预警信息。本申请还涉及区块链技术,得到的风险等级可以存储于区块链中。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种症候群监测预警方法、装置、计算机设备及存储介质。
背景技术
公共卫生是关系到一国或一个地区人民大众健康的公共事业。公共卫生的重要工作之一是对重大疾病尤其是传染病(如结核、艾滋病、SARS、新冠肺炎等)的预防、监控和治疗。其中,症候群监测预警就是一种提前于传染病监测预警的公共卫生异常事件监测预警机制。症候群监测预警能够主动监测公共卫生事件的萌芽状态并进行预警,为公共卫生人员采取有效的防治策略提供依据。症候群监测能够及时发现异常或者疾病爆发信号的特点。基于症候群监测的症候群预警通过对症候群异常的捕获,能够提前于特定疾病预警之前发出预警信号。
传统的症候群监测预警主要通过对历史数据进行分析,然后根据人工设置的阈值判断风险等级,需要耗费大量人力,预警效果受限于凭经验设置的阈值,且通过阈值判断风险等级容易造成“一刀切”,容易造成风险等级误报或漏报。
发明内容
本申请提供了一种症候群监测预警方法、装置、计算机设备及存储介质,能够通过智能化的方法高效、有效地提供症候群预警风险等级,以为公共卫生人员采取有效的防治策略提供依据。
第一方面,本申请提供了一种症候群监测预警方法,所述方法包括:
从就诊人的电子病历中提取症状关键词;
根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例;
若确定就诊人属于其中一个症候群的病例,确定所述症候群为目标症候群;
获取预设的时间单位内所述目标症候群的病例数;
根据当前的预设时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标;
将所述目标症候群的若干统计指标输入风险预测模型,以获取所述目标症候群的风险等级;
根据所述目标症候群的风险等级,发布所述目标症候群的预警信息。
第二方面,本申请提供了一种症候群监测预警装置,包括:
症状提取模块,用于从就诊人的电子病历中提取症状关键词;
症状匹配模块,用于根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个目标症候群的病例;
目标症候群确定模块,用于若确定就诊人属于其中一个症候群的病例,确定所述症候群为目标症候群;
病例统计模块,用于获取预设的时间单位内所述目标症候群的病例数;
指标计算模块,用于根据当前的预设时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标;
风险预测模块,用于将所述目标症候群的若干统计指标输入风险预测模型,以获取所述目标症候群的风险等级;
预警模块,用于根据所述目标症候群的风险等级,发布所述目标症候群的预警信息。
第三方面,本申请提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现上述的症候群监测预警方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,若所述计算机程序被处理器执行,实现上述的症候群监测预警方法。
本申请公开了一种症候群监测方法、装置、计算机设备及存储介质,通过从就诊人的电子病历中提取症状关键词;根据所述症状关键词及目标症候群的关键词的匹配情况,判断就诊人是否属于目标症候群的病例;根据当前的预设时间单位统计所述目标症候群的病例数;根据所述目标症候群的病例数,计算目标症候群的若干统计指标;将所述统计指标输入风险预测模型,以获取预测的风险等级,实现基于人工智能的症候群监测预警,提升症候群监测预警的效率及准确性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种症候群监测预警方法的流程示意图;
图2是本申请一实施例提供的一种症候群监测预警装置的结构示意框图;
图3是本申请一实施例提供的一种计算机设备的结构示意框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
本申请的实施例提供了一种症候群监测预警方法、装置、计算机设备及计算机可读存储介质。用于基于人工智能技术,提高症候群监测预警的效率及准确性。示例性的,在症候群的监测预警中,若通过对历史数据进行分析,然后根据人工设置的阈值判断风险等级,需要耗费大量人力,预警效果受限于凭经验设置的阈值。根据本申请实施例的症候群预警方法,通过基于人工智能的方法高效地提供预警风险等级,避免了传统方法中依赖人工设置阈值判断风险等级时根据阈值“一刀切”造成误报或漏报的问题,提高了风险等级预测的准确性。
其中,该症候群监测预警方法可以用于服务器,当然也可以用于终端,其中,终端可以是手机、平板电脑、笔记本电脑、台式电脑等电子设备;服务器例如可以为单独的服务器或服务器集群。但为了便于理解,以下实施例将以应用于服务器的症候群监测预警方法进行详细介绍。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请实施例提供的一种症候群监测预警方法的示意流程图。
如图1所示,该症候群监测预警方法可以包括以下步骤S110-步骤S170。
步骤S110、从就诊人的电子病历中提取症状关键词。
所述症状关键词可以包括症状的表现和症状的相关属性,相关属性可以是症状发生的时间、持续时间及严重程度等,例如就诊人的电子病例中记载有“就诊人三天前开始持续发热”,对应的症状关键词为“发热三天”,其中“三天”是症状的表现,“三天”是症状的相关属性之一。具体实施时,可以根据所述目标症候群的关键词的构成确定所述症状关键词的构成,例如所述目标症候群的关键词只有症状表现,那么所述症状关键词同样只保留“发热”等症状表现即可,如果所述目标症候群的关键词包括症状的表现及症状的相关属性,那么所述症状关键词同样包括症状的表现及症状的相关属性。
示例性的,步骤S110具体包括步骤S111-S112:
步骤S111、通过命名实体识别,从所述电子病历的文本中提取就诊人的症状初始关键词;
命名实体识别技术(NER,Named Entity Recognition),是一项识别文本中具有特定意义的实体的自然语言处理技术。通过命名实体识别,可以将希望获取到的实体类型,从文本里提取出来。例如,就诊人的症状是希望获取到的实体类型,通过命名实体识别技术开发的工具可以将句子中的“发热”、“恶心”等具体的症状从电子病例从提取出来。
步骤S112、基于预设的标准化词汇表,将所述症状初始关键词中的别名词汇替换成标准词汇,以获取所述症状关键词。
例如,症状初始关键词为“闹肚子”,而医学上对应的标准词汇应为“腹泻”,则“闹肚子”为别名词汇,通过标准词汇替换后获得的所述症状关键词为“腹泻”。
可通过收集整理症状相关的别名词汇及标准词汇,以形成所述标准化词汇表。
示例性的,将所述症状关键词整理成结构化数据。结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理,通过结构化可方便数据的管理、使用、展示。
步骤S120、根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例。
症候群,指在某些可能的疾病出现时,经常会同时出现的多种临床症状。例如,如表1所示,是一实施例中预设的五个症候群及与其症状对应的关键词。具体实施时,可以根据需要添加或定义新的症候群。
表1:症候群及其对应的关键词
一些实施例中,步骤S120具体包括精确匹配步骤和/或模糊匹配步骤。
示例性的,所述精确匹配步骤包括:
将所述症状关键词与各个症候群的每个关键词进行比较,若所有所述症状关键词在其中一个症候群中均有对应的关键词,则确定所述就诊人属于所述其中一个症候群的病例。
例如,预设的若干症候群中包括第一症候群,第一症候群的关键词为{A,B,C,D},就诊人甲的症状关键词为{A,B,C,D},就诊人乙的症状关键词为{C,D,E,F,G}。将就诊人甲的症状关键词与第一症候群的每个关键词进行一对一比较,根据匹配度计算公式:匹配度=被比较的症候群的关键词中与所述症状关键词一致的个数/所述症状关键词的个数,得到匹配度为4/4=1,说明就诊人甲的每个所述症状关键词均有与其一致的第一症候群的关键词,因此就诊人甲为第一症候群的病例;将就诊人乙的症状关键词与第一症候群的每个关键词进行一对一比较,根据所述匹配度计算公式得到的匹配度为2/5=0.4,匹配度小于1,说明就诊人乙的症状关键词中存在部分无与其一致的第一症候群的关键词,目前不能判定就诊人乙是第一症候群的病例。
示例性的,所述模糊匹配步骤包括步骤S122a-步骤S122e:
步骤S122a、根据所述症状关键词及某个症候群的关键词,构建所述症状关键词的多热编码(multi-hot encoding)及所述某个症候群的关键词的多热编码。
例如,就诊人乙的症状关键词为{C、D、E、F、G},第一症候群的关键词为{A、B、C、D},就诊人乙的症状关键词对应的多热编码为{0、0、1、1、1、1、1},该多热编码中的元素分别代表没有关键词A、没有关键词B、存在关键词C……,而第一症候群的关键词对应的多热编码为{1、1、1、1、0、0、0}。
步骤S122b、将所述症状关键词的多热编码输入自编码器(autoencoder),获取所述自编码器输出的自编码向量。
示例性的,本方法还包括获取所述自编码器的训练步骤S210,具体包括步骤S211-步骤S215。
步骤S211、获取训练数据,所述训练数据包括多热编码。
示例性的,可以将所述症状关键词的多热编码或所述某个症候群的关键词的多热编码作为训练数据,也可以通过随机生成的方式获得作为训练数据的多热编码。
步骤S212、获取待训练的自编码器,所述自编码器包括第一网络和第二网络。
示例性的,所述第一网络与所述第二网络结构对称;所述第一网络及所述第二网络均包括多层全连接层。全连接层,即该层的每一个结点均与上一层的所有结点相连,通过多层全连接层可提高所述自编码器的非线性表达能力。
步骤S213、将所述训练数据中的多热编码输入所述第一网络,得到所述第一网络输出的自编码向量,所述自编码向量的维度低于所述多热编码的维度。
所述第一网络,构成一个编码器,将高维稀疏的多热编码压缩成低维密实的所述自编码向量。
步骤S214、将所述第一网络输出的自编码向量输入所述第二网络,得到所述第二网络输出的向量,所述第二网络输出的向量的维度等于所述多热编码的维度;
所述第二网络,构成一个解码器,将低维密实的自编码向量重构成高维稀疏的多热编码。
步骤S215、根据所述第二网络输出的向量和所述多热编码,对所述第一网络和所述第二网络进行训练。
示例性,根据所述第二网络输出的向量和所述多热编码的误差,调整所述第一网络及所述第二网络的网络参数,以使所述第二网络输出的向量和所述多热编码趋于一致。
示例性的,完成自编码器的训练后,将所述多热编码输入所述自编码器,在所述第一网络的输出获取所述自编码向量。
步骤S122c、根据所述某个症候群的关键词的多热编码,通过所述自编码器获取所述某个症候群的关键词的自编码向量;
示例性的,将所述某个症候群的关键词的多热编码输入所述自编码器,在所述第一网络的输出获取所述某个症候群的自编码向量。
步骤S122d、计算所述症状关键词的自编码向量及所述某个症候群的关键词的自编码向量的相似度;
示例性的,通过余弦相似度计算所述相似度,余弦相似度的计算公式为:
其中,X为所述症状关键词的自编码向量、Y为所述某个症候群的关键词的自编码向量,n为所述自编码向量的维度。
其他实施例中,也可以通过欧几里得距离、曼哈顿距离、明可夫斯基距离等方法计算所述相似度。
步骤S122e、根据所述相似度判断所述就诊人是否属于所述某个症候群的病例。
示例性的,预设一个相似度阈值,例如,将所述相似度阈值设置为0.8。若所述相似度超过所述相似度阈值,则对应的就诊人是所述某个症候群的病例;否则,对应的就诊人不是所述某个症候群的病例。
示例性的,将所述精确匹配步骤及所述模糊匹配步骤结合使用,例如,先执行所述精确匹配步骤,对于经过所述精确匹配步骤还不能判断就诊人是否属于所述某个症候群的病例的,再执行所述模糊匹配步骤以进一步判断该就诊人是否属于所述某个症候群的病例。
步骤S130、若确定就诊人属于其中一个症候群的病例,确定所述症候群为目标症候群。
示例性的,通过步骤S110至步骤S130对一个个电子病历进行处理,以获取所有所述目标症候群;若处理完所有电子病历后,所述目标症候群的个数仍为0,则说明当前无预设的症候群的病例,不需要进行风险预警。
步骤S140、获取预设的时间单位内所述目标症候群的病例数。
例如,预设的时间单位为天,获取以天为单位的所述目标症候群的病例数。
示例性的,所述目标症候群的病例数,可以在步骤S120或步骤S130的执行过程中进行统计。例如,确定一个就诊人属于其中一个症候群的病例,就将该症候群对应就诊日期的病例数增加一个。
步骤S150、根据当前的预设时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标。
示例性的,根据当前的预设时间单位内所述目标症候群的历史病例数,以及所述目标症候群的历史病例数,计算所述目标症候群的若干统计指标,所述统计指标包括环比增长率、同比增长率、历史百分位中的一种或多种。环比增长率,表示连续2个统计周期内的统计量的变化比,具体实施时,可以计算对应多个统计周期的环比,例如,当天为2020年9月17日,需对2020年9月18日进行预警,则可以根据2020年9月17日所述目标症候群的病例数(当前的预设时间单位内所述目标症候群的病例数),及2020年9月16日所述目标症候群的病例数(所述目标症候群的历史病例数)计算日-环比增长率,根据2020年9月11日至2020年9月17日所述目标症候群的病例数及2020年9月4日至2020年9月10日所述目标症候群的病例数计算周-环比增长率,根据2020年8月18日至2020年9月17日所述目标症候群的病例数及2020年7月18日至2020年8月17日所述目标症候群的病例数计算月-环比增长率;同比增长率一般是指今年某个统计周期内的统计量相对于去年同期的量的变化比,类似的,可以计算对应多个统计周期的同比,例如,根据2020年9月11日至2020年9月17日所述目标症候群病例数及2019年9月11日至2019年9月17日所述目标症候群的病例数计算周-同比增长率,根据2020年8月18日至2020年9月17日所述目标症候群的病例数及2019年8月18日至2020年9月17日所述目标症候群的病例数计算月-同比增长率;历史百分位,指某个周期内的统计量在历史参考数据中通过百分比量化的位置,例如,过去四天的所述病例数分别为100、500、300、200,今天的病例数为400,过去4天共有3天所述病例数低于今天的病例数,那么以过去四天的病例数作为历史参考数据,今天的病例数的历史百分位为3/4=75%;类似的,可以计算对应多个统计周期的历史百分位,例如,以2019年1月1日至2019年12月31日所述目标症候群的病例数作为历史参考数据,根据2020年9月17日所述目标症候群的病例数及2019年1月1日至2019年12月31日所述目标症候群的病例数计算日-历史百分位,根据2020年9月11日至2020年9月17日所述目标症候群的病例数及2019年1月1日至2019年12月31日所述目标症候群的病例数计算周-历史百分位,根据2020年8月18日至2020年9月17日所述目标症候群的病例数及2019年1月1日至2019年12月31日所述目标症候群的病例数计算月-历史百分位。当然,具体实施时,本方法中采纳的统计指标并不局限于上述几种,例如,还可以类似上述求所述日-环比增长率的方法,求2020年9月17日所述目标症候群的病例数分别相对于2020年9月14日所述目标症候群的病例数、2020年9月15日所述目标症候群的病例数的增长率,此外,定基比等其他可反映数据变化情况的统计指标也可以使用在本方法中。
本实施例中,是以所述目标症候群的病例数作为统计量计算所述统计指标,其他实施例中,也可以以根据所述目标症候群的病例数得到的数据作为统计量计算所述统计指标,例如以所述目标症候群的病例数占所述就诊人的比例作为统计量计算所述统计指标。
步骤S160、将所述目标症候群的若干统计指标输入风险预测模型,以获取预测的风险等级。
示例性的,将所述统计指标以及风险因子输入风险预测模型,以获取所述目标症候群的风险等级,所述风险因子包括天气数据和/或环境数据。例如,所述天气数据包括当时的温度、湿度及是否为晴天阴天或雨天,所述环境数据包括当时的空气质量、水质等级等。通过引入所述风险因子,使得所述风险等级模型可以从更丰富的数据维度对风险等级进行预测,使得风险等级的预测更加准确。所述风险预测模型可通过以下方法训练得到:分别将过去某个时间对应的所述统计指标及所述风险因子输入初始模型,本实施例中所述初始模型为XGboost模型,具体实施时也可以采用前馈神经网络、支持向量机等其他机器学习模型;将所述某个时间的风险等级作为所述统计指标的标签,将所述标签作为模型的期望输出,对模型进行训练。过去某个时间的风险等级,若有相应的查询渠道,则可以直接通过这些渠道进行查询,例如所述目标症候群为发热呼吸道症候群,而社会上有相应的发热呼吸道的风险等级公布,则可以通过对以往公布的发热呼吸道的风险等级,获得过去某个时间的发热呼吸道症候群的风险等级;若无相应的查询渠道,则可以根据所述目标症候群能查询到的主要相关疾病的风险等级进行判断得到,例如所述目标症候群为发热呼吸道症候群,目前没有相应的发热呼吸道的风险等级,而发热呼吸道症候群相关的主要疾病是新冠疫情,则可以根据该时间的新冠疫情的风险等级,得到所述发热呼吸道症候群在该时间的风险等级。
示例性的,通过解释模型(SHAP,SHapley Additive exPlanations)对所述风险预测模型进行解释。通过解释模型,可以对所述风险模型的输入中的所述统计指标或所述风险因子在得到风险预测结果中所起的影响进行评估,从而可以知道是哪些数据对风险等级产生了重要影响,后续可对产生重要影响的数据进行重点关注,提高了所述风险预测模型的可用性。
步骤S170、根据所述目标症候群的风险等级,发布所述目标症候群的预警信息。
例如,所述目标症候群的风险等级包括高、中、低,所述目标症候群为发热呼吸道症候群。若所述目标症候群的风险等级为高,发布所述目标症候群的预警信息包括:发热呼吸道症候群高风险,提高警惕,实施高级别防治措施;若所述目标症候群的风险等级为中,发布的所述目标症候群的预警信息包括:发热呼吸道症候群中风险,密切关注病情动态,实施一般防治措施;若所述目标症候群的风险等级为低,发布的所述目标症候群的预警信息包括:发热呼吸道症候群低风险。
本申请通过基于风险预测模型的方法对风险等级预测,避免了的人工分析中耗费人力、效率低的缺陷,同时获取风险等级由风险预测模型通过非线性的计算得到,避免了通过阈值判断风险等级时容易造成“一刀切”,提高了风险等级预测的准确性。
需要强调的是,为进一步保证上述症状关键词、统计指标、风险预测模型及风险等级的私密和安全性,上述症状关键词、统计指标、所述风险预测模型以及风险等级还可以存储于一区块链的节点中。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
如图2所示,该症候群监测预警装置,包括:症状提取模块110、症状匹配模块120、目标症候群确定模块130、病例统计模块140、指标计算模块150、风险预测模块160及预警模块170。
症状提取模块110,用于从就诊人的电子病历中提取症状关键词;
示例性的,症状提取模块110包括初始关键词提取模块及标准化模块。
初始关键词提取模块,用于通过命名实体识别,从所述电子病历的文本中提取就诊人的症状初始关键词;
标准化模块,用于基于预设的标注化词汇表,将所述症状初始关键词中的别名词汇替换成标准词汇,以获取所述症状关键词。可通过收集整理症状相关的别名词汇及标准词汇,以形成所述标准化词汇表。
示例性的,将所述症状关键词整理成结构化数据。结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理,通过结构化可方便数据的管理、使用、展示。
症状匹配模块120,用于根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例。
示例性的症状匹配模块120包括精确匹配模块及模糊匹配模块。
示例性的,精确匹配模块,用于将所述症状关键词与各个症候群的每个关键词进行比较,若所有所述症状关键词在其中一个症候群中均有对应的关键词,则确定所述就诊人属于所述其中一个症候群的病例。
示例性的,模糊匹配模块包括多热编码构建模块、症状关键词编码模块、目标症候群关键词编码模块、相似度计算模块及病例判断模块。
多热编码构建模块,用于根据所述症状关键词及某个症候群的关键词,构建所述症状关键词的多热编码及所述某个症候群的关键词的多热编码。
症状关键词编码模块,用于将所述症状关键词的多热编码输入自编码器,获取所述自编码器输出的自编码向量。
症候群关键词编码模块,用于根据所述某个症候群的关键词的多热编码,通过所述自编码器获取所述某个症候群的关键词的自编码向量。
相似度计算模块,用于计算所述症状关键词的自编码向量及所述某个症候群的关键词的自编码向量的相似度。
示例性的,通过余弦相似度计算所述相似度,余弦相似度的计算公式为:
其中,X为所述症状关键词的自编码向量、Y为所述某个症候群的关键词的自编码向量,n为所述自编码向量的维度。
病例判断模块,用于根据所述相似度判断所述就诊人是否属于所述某个症候群的病例。
示例性的,预设一个相似度阈值,例如,将所述相似度阈值设置为0.8。若所述相似度超过所述相似度阈值,则对应的就诊人是所述某个症候群的病例;否则,对应的就诊人不是所述某个症候群的病例。
示例性的,本装置还包括自编码器训练模块,所述自编码器的训练模块包括训练数据获取模块、自编码器初始模块、压缩模块、解压模块及自编码器训练模块。
训练数据获取模块,用于获取训练数据,所述训练数据包括多热编码;
自编码器初始模块,用于获取待训练的自编码器,所述自编码器包括第一网络和第二网络;
压缩模块,用于将所述训练数据中的多热编码输入所述第一网络,得到所述第一网络输出的自编码向量,所述自编码向量的维度低于所述多热编码的维度;
解压模块,用于将所述第一网络输出的自编码向量输入所述第二网络,得到所述第二网络输出的向量,所述第二网络输出的向量的维度等于所述多热编码的维度;
自编码器训练模块,用于根据所述第二网络输出的向量和所述多热编码,对所述第一网络和所述第二网络进行训练。
目标症候群确定模块130,用于若确定就诊人属于其中一个症候群的病例,确定所述症候群为目标症候群。
病例统计模块140,用于获取预设的时间单位内所述目标症候群的病例数;
指标计算模块150,用于根据预设的时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标;
示例性的,根据当前的预设时间单位内所述目标症候群的病例数,以及所述目标症候群的历史病例数,计算所述目标症候群的若干统计指标,所述统计指标包括环比增长率、同比增长率、历史百分位中的一种或多种。
风险预测模块160,用于将所述目标症候群的若干统计指标输入风险预测模型,以获取所述目标症候群的风险等级。
示例性的,将所述统计指标以及风险因子输入风险预测模型,以获取所述目标症候群的风险等级,所述风险因子包括天气数据和/或环境数据。例如,所述天气数据包括当时的温度、湿度及是否为晴天阴天或雨天,所述环境数据包括当时的空气质量、水质等级等。通过引入所述风险因子,使得所述风险等级模型可以从更丰富的数据维度对风险等级进行预测,使得风险等级的预测更加准确。
示例性的,通过解释模型(SHAP,SHapley Additive exPlanations)对所述风险预测模型进行解释。通过解释模型,可以对所述风险模型的输入中的所述统计指标或所述风险因子在得到风险预测结果中所起的影响进行评估,从而可以知道是哪些数据对风险等级产生了重要影响,后续可对产生重要影响的数据进行重点关注,提高了所述风险预测模型的可用性。
预警模块170,用于根据所述风险等级,发布所述目标症候群的预警信息。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的方法、装置可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
示例性地,上述的方法、装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。
请参阅图3,图3是本申请实施例提供的一种计算机设备的示意图。该计算机设备可以是服务器或终端。
如图3所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种症候群监测预警方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种症候群监测预警方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,该计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一些实施方式中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:从就诊人的电子病历中提取症状关键词;根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例;若确定就诊人属于其中一个症候群的病例,确定所述症候群为目标症候群;获取预设的时间单位内所述目标症候群的病例数;根据当前的预设时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标;将所述目标症候群的若干统计指标输入风险预测模型,以获取所述目标症候群的风险等级;根据所述目标症候群的风险等级,发布所述目标症候群的预警信息。
示例性的,处理器用于实现从就诊人的电子病历中提取症状关键词,实现:通过命名实体识别,从所述病历的文本中提取就诊人的症状初始关键词;基于预设的标准化词汇表,将所述症状初始关键词中的别名词汇替换成标准词汇,以获取所述症状关键词。
示例性的,处理器用于实现根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于目标症候群的病例时,实现:将所述症状关键词与各个症候群的每个关键词进行比较,若所有所述症状关键词均在其中一个症候群中均有对应的关键词,则确定所述就诊人属于所述其中一个症候群的病例;或/与实现:根据所述症状关键词及某个症候群的关键词,构建所述症状关键词的多热编码及所述某个症候群的关键词的多热编码;将所述症状关键词的多热编码输入自编码器,获取所述自编码器输出的所述症状关键词的自编码向量;根据所述某个症候群的关键词的多热编码,通过所述自编码器获取所述某个症候群的关键词的自编码向量;计算所述症状关键词的自编码向量及所述某个症候群的关键词的自编码向量的相似度;根据所述相似度判断所述就诊人是否属于所述某个症候群的病例。
示例性的,处理器用于获取所述自编码器时,实现:获取训练数据,所述训练数据包括多热编码;获取待训练的自编码器,所述自编码器包括第一网络和第二网络;将所述训练数据中的多热编码输入所述第一网络,得到所述第一网络输出的自编码向量,所述自编码向量的维度低于所述多热编码的维度;将所述第一网络输出的自编码向量输入所述第二网络,得到所述第二网络输出的向量,所述第二网络输出的向量的维度等于所述多热编码的维度;根据所述第二网络输出的向量和所述多热编码,对所述第一网络和所述第二网络进行训练。
示例性的,处理器用于当前的预设时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标时,实现:根据当前的预设时间单位内所述目标症候群的病例数,以及所述目标症候群的历史病例数,计算所述目标症候群的若干历史统计指标,所述统计指标包括环比增长率、同比增长率、历史百分位中的一种或多种。
示例性的,处理器用于将所述目标症候群的若干统计指标输入风险预测模型,以获取预测的风险等级时,实现:将所述统计指标以及风险因子输入风险预测模型,以获取所述目标症候群的风险等级,所述风险因子包括天气数据和/或环境数据。例如,所述天气数据包括当时的温度、湿度及是否为晴天阴天或雨天,所述环境数据包括当时的空气质量、水质等级等。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项症候群监测预警方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种症候群监测预警方法,其特征在于,所述方法包括:
从就诊人的电子病历中提取症状关键词;
根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例;
若确定就诊人属于其中一个症候群的病例,确定所述症候群为目标症候群;
获取预设的时间单位内所述目标症候群的病例数;
根据当前的预设时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标;
将所述目标症候群的若干统计指标输入风险预测模型,以获取所述目标症候群的风险等级;
根据所述目标症候群的风险等级,发布所述目标症候群的预警信息;
其中,所述根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例,包括:
根据所述症状关键词及某个症候群的关键词,构建所述症状关键词的多热编码及所述某个症候群的关键词的多热编码;
将所述症状关键词的多热编码输入自编码器,获取所述自编码器输出的所述症状关键词的自编码向量;
根据所述某个症候群的关键词的多热编码,通过所述自编码器获取所述某个症候群的关键词的自编码向量;
计算所述症状关键词的自编码向量及所述某个症候群的关键词的自编码向量的相似度;
根据所述相似度判断所述就诊人是否属于所述某个症候群的病例。
2.根据权利要求1所述的症候群监测预警方法,其特征在于,所述根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个症候群的病例,包括:
将所述症状关键词与各个症候群的每个关键词进行比较,若所有所述症状关键词在其中一个症候群中均有对应的关键词,则确定所述就诊人属于所述其中一个症候群的病例。
3.根据权利要求1所述的症候群监测预警方法,其特征在于:所述方法还包括:
获取训练数据,所述训练数据包括多热编码;
获取待训练的自编码器,所述自编码器包括第一网络和第二网络;
将所述训练数据中的多热编码输入所述第一网络,得到所述第一网络输出的自编码向量,所述自编码向量的维度低于所述多热编码的维度;
将所述第一网络输出的自编码向量输入所述第二网络,得到所述第二网络输出的向量,所述第二网络输出的向量的维度等于所述多热编码的维度;
根据所述第二网络输出的向量和所述多热编码,对所述第一网络和所述第二网络进行训练。
4.根据权利要求1-3中任一项所述的症候群监测预警方法,其特征在于:所述根据当前的预设时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标,包括:
根据当前的预设时间单位内所述目标症候群的病例数,以及所述目标症候群的历史病例数,计算所述目标症候群的若干统计指标,所述统计指标包括环比增长率、同比增长率、历史百分位中的一种或多种。
5.根据权利要求1-3中任一项所述的症候群监测预警方法,其特征在于:将所述统计指标输入风险预测模型,以获取所述目标症候群的风险等级,包括:
将所述统计指标以及风险因子输入风险预测模型,以获取所述目标症候群的风险等级,所述风险因子包括天气数据和/或环境数据。
6.根据权利要求1所述的症候群监测预警方法,其特征在于,所述从就诊人的电子病历中提取症状关键词,包括:
通过命名实体识别,从所述病历的文本中提取就诊人的症状初始关键词;
根据预设的标准化词汇表,将所述症状初始关键词中的别名词汇替换成标准词汇,以获取所述症状关键词。
7.一种症候群监测预警装置,其特征在于,所述装置包括:
症状提取模块,用于从就诊人的电子病历中提取症状关键词;
症状匹配模块,用于根据所述症状关键词及预设的若干症候群的关键词的匹配情况,判断就诊人是否属于其中一个目标症候群的病例;
目标症候群确定模块,用于若确定就诊人属于其中一个症候群的病例,确定所述症候群为目标症候群;
病例统计模块,用于获取预设的时间单位内所述目标症候群的病例数;
指标计算模块,用于根据预设的时间单位内所述目标症候群的病例数,计算目标症候群的若干统计指标;
风险预测模块,用于将所述目标症候群的若干统计指标输入风险预测模型,以获取所述目标症候群的风险等级;
预警模块,用于根据所述目标症候群的风险等级,发布所述目标症候群的预警信息;
其中,所述症状匹配模块用于:
根据所述症状关键词及某个症候群的关键词,构建所述症状关键词的多热编码及所述某个症候群的关键词的多热编码;
将所述症状关键词的多热编码输入自编码器,获取所述自编码器输出的所述症状关键词的自编码向量;
根据所述某个症候群的关键词的多热编码,通过所述自编码器获取所述某个症候群的关键词的自编码向量;
计算所述症状关键词的自编码向量及所述某个症候群的关键词的自编码向量的相似度;
根据所述相似度判断所述就诊人是否属于所述某个症候群的病例。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现如权利要求1-6任一项所述的症候群监测预警方法。
9.一种计算机可读存储介质,所述计算机的可读存储介质存储有计算机程序,其特征在于,若所述计算机程序被处理器执行,实现如权利要求1-6任一项所述的症候群监测预警方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110412510.XA CN112951443B (zh) | 2021-04-16 | 2021-04-16 | 症候群监测预警方法、装置、计算机设备及存储介质 |
PCT/CN2021/097415 WO2022217713A1 (zh) | 2021-04-16 | 2021-05-31 | 症候群监测预警方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110412510.XA CN112951443B (zh) | 2021-04-16 | 2021-04-16 | 症候群监测预警方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112951443A CN112951443A (zh) | 2021-06-11 |
CN112951443B true CN112951443B (zh) | 2023-08-04 |
Family
ID=76232767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110412510.XA Active CN112951443B (zh) | 2021-04-16 | 2021-04-16 | 症候群监测预警方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112951443B (zh) |
WO (1) | WO2022217713A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113345598B (zh) * | 2021-07-21 | 2021-11-26 | 深圳市知酷信息技术有限公司 | 基于数据分析的区域疫情监测预警系统 |
CN113569058A (zh) * | 2021-08-05 | 2021-10-29 | 武汉美之修行信息科技有限公司 | 一种信息查询方法、装置及计算机可读存储介质 |
CN113724891A (zh) * | 2021-08-31 | 2021-11-30 | 平安国际智慧城市科技股份有限公司 | 医院疫情监测方法、装置及相关设备 |
CN113871019A (zh) * | 2021-12-06 | 2021-12-31 | 江西易卫云信息技术有限公司 | 一种疾病舆情的监控方法、系统、存储介质及设备 |
CN115148373A (zh) * | 2022-07-28 | 2022-10-04 | 深圳市腾云数据系统有限公司 | 一种基于症状监测的疫情监测方法及系统 |
CN115862897B (zh) * | 2023-02-21 | 2023-05-23 | 江西曼荼罗软件有限公司 | 一种基于临床数据的症候群监测方法及系统 |
CN116959692A (zh) * | 2023-09-18 | 2023-10-27 | 北方健康医疗大数据科技有限公司 | 电子病历质控方法、系统、终端及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659411A (zh) * | 2019-08-21 | 2020-01-07 | 桂林电子科技大学 | 一种基于神经注意力自编码器的个性化推荐方法 |
CN111767707A (zh) * | 2020-06-30 | 2020-10-13 | 平安科技(深圳)有限公司 | 雷同病例检测方法、装置、设备及存储介质 |
CN112037930A (zh) * | 2020-11-02 | 2020-12-04 | 平安科技(深圳)有限公司 | 一种传染病预测设备、方法、装置及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160283686A1 (en) * | 2015-03-23 | 2016-09-29 | International Business Machines Corporation | Identifying And Ranking Individual-Level Risk Factors Using Personalized Predictive Models |
CN111785380B (zh) * | 2020-07-01 | 2022-12-02 | 医渡云(北京)技术有限公司 | 传染性疾病患病风险等级的预测方法及装置、介质、设备 |
CN112216402A (zh) * | 2020-10-16 | 2021-01-12 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的疫情预测方法、装置、计算机设备及介质 |
-
2021
- 2021-04-16 CN CN202110412510.XA patent/CN112951443B/zh active Active
- 2021-05-31 WO PCT/CN2021/097415 patent/WO2022217713A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659411A (zh) * | 2019-08-21 | 2020-01-07 | 桂林电子科技大学 | 一种基于神经注意力自编码器的个性化推荐方法 |
CN111767707A (zh) * | 2020-06-30 | 2020-10-13 | 平安科技(深圳)有限公司 | 雷同病例检测方法、装置、设备及存储介质 |
CN112037930A (zh) * | 2020-11-02 | 2020-12-04 | 平安科技(深圳)有限公司 | 一种传染病预测设备、方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022217713A1 (zh) | 2022-10-20 |
CN112951443A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112951443B (zh) | 症候群监测预警方法、装置、计算机设备及存储介质 | |
CN109036577B (zh) | 糖尿病并发症分析方法及装置 | |
Gong et al. | Predicting clinical outcomes across changing electronic health record systems | |
Darban et al. | Deep learning for time series anomaly detection: A survey | |
CN116386869B (zh) | 一种基于多变量的病情危重程度评估方法 | |
Shen et al. | Discovering the potential opportunities of scientific advancement and technological innovation: A case study of smart health monitoring technology | |
CN111506723B (zh) | 问答响应方法、装置、设备及存储介质 | |
CN113707297A (zh) | 医疗数据的处理方法、装置、设备及存储介质 | |
Jiang et al. | A hybrid intelligent model for acute hypotensive episode prediction with large-scale data | |
CN116580849B (zh) | 医疗数据的采集分析系统及其方法 | |
US20220405619A1 (en) | Intelligent updating and data processing for deployed machine learning models | |
CN113094477A (zh) | 数据结构化方法、装置、计算机设备及存储介质 | |
CN111914166B (zh) | 应用于社区矫正人员的矫正策略个性化推荐系统 | |
EP3779757B1 (en) | Simulated risk contributions | |
CN112435755A (zh) | 疾病分析方法、装置、电子设备及存储介质 | |
CN112651782A (zh) | 基于缩放点积注意力的行为预测方法、装置、设备及介质 | |
CN116884636A (zh) | 传染病数据分析方法、装置、计算机设备及存储介质 | |
Bhat et al. | An efficient prediction model for diabetic database using soft computing techniques | |
CN116843395A (zh) | 一种业务系统的告警分级方法、装置、设备及存储介质 | |
CN116844711A (zh) | 基于深度学习的疾病辅助识别方法及装置 | |
Shahn et al. | Predicting health outcomes from high‐dimensional longitudinal health histories using relational random forests | |
CN114417165A (zh) | 一种心理矫治方法、装置及终端设备 | |
Yang et al. | A patient outcome prediction based on random forest | |
CN116738972B (zh) | 基于人工智能的药学服务推广分析方法 | |
Siddiqi et al. | Detecting Outliers in Non-IID Data: A Systematic Literature Review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |