CN116884636A - 传染病数据分析方法、装置、计算机设备及存储介质 - Google Patents
传染病数据分析方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116884636A CN116884636A CN202310798693.2A CN202310798693A CN116884636A CN 116884636 A CN116884636 A CN 116884636A CN 202310798693 A CN202310798693 A CN 202310798693A CN 116884636 A CN116884636 A CN 116884636A
- Authority
- CN
- China
- Prior art keywords
- analysis
- model
- infectious disease
- data
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000035473 Communicable disease Diseases 0.000 title claims abstract description 167
- 208000015181 infectious disease Diseases 0.000 title claims abstract description 162
- 238000007405 data analysis Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004458 analytical method Methods 0.000 claims abstract description 222
- 239000013598 vector Substances 0.000 claims abstract description 118
- 238000012549 training Methods 0.000 claims abstract description 96
- 201000010099 disease Diseases 0.000 claims abstract description 37
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 37
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 230000015654 memory Effects 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 17
- 230000007246 mechanism Effects 0.000 claims description 10
- 230000000306 recurrent effect Effects 0.000 claims description 8
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 230000036541 health Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本申请涉及人工智能以及医疗健康技术领域,揭示了一种传染病数据分析方法、装置、计算机设备及存储介质,其中,方法包括:获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;根据所述分析向量进行向量分析,得到分析结果,本发明能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
Description
技术领域
本发明涉及人工智能以及医疗健康技术领域,尤其涉及一种传染病数据分析方法、装置、计算机设备及存储介质。
背景技术
随着人工智能技术的兴起与发展,通过人工智能技术对传染病进行分析处理,可以支持疾病辅助诊断、健康管理、远程会诊等功能。
在公共卫生领域中,采用何种技术对传染病的进行分析处理,是一个重要问题。通常采用的技术包括统计学习方法及机器学习的预测方法,比如多元线性回归、神经网络等。例如,神经网络模型在对文本分析领域中有较为不错表现,可以采用神经网络模型进行分析处理。
但是,采用神经网络模型对传染病进行分析的效果不佳,从而导致医生根据分析结果进行诊断的效果不佳。
发明内容
基于此,有必要针对现有技术的对传染病的分析不够准确的技术问题,提出了一种传染病数据分析方法。
第一方面,提供了一种传染病数据分析方法,所述方法包括:
获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
根据所述分析向量进行向量分析,得到分析结果。
第二方面,提供了一种传染病数据分析装置,所述装置包括:
获取模块,用于获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
数据分析模块,用于将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
向量分析模块,用于根据所述分析向量进行向量分析,得到分析结果。
第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述传染病数据分析方法的步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述传染病数据分析方法的步骤。
本发明提出的传染病数据分析方法,通过获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据,接着将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型,最后根据所述分析向量进行向量分析,得到分析结果,能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中传染病数据分析方法的应用环境图;
图2为一个实施例中传染病数据分析方法的流程图;
图3为一个实施例中传染病数据分析装置的结构框图;
图4为一个实施例中计算机设备的结构框图;
图5为另一个实施例中计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的传染病数据分析方法,可应用在如图1的应用环境中,可应用于智能诊疗、远程会诊、传染病数据识别、医疗数据分析,其中,客户端110通过网络与服务端120进行通信。服务端120可以通过客户端110接收传染病数据,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据,接着服务端120将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型,最后服务端120根据所述分析向量进行向量分析,得到分析结果,能够通过目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。其中,客户端110可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
请参阅图2所示,图2为本发明第一实施例提供的传染病数据分析方法的一个流程示意图,包括如下步骤:
S101:获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
在本实施例中,首先获取传染病数据,传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据,其中,历史发病数据可以是过去每日传染病的新增发病人数,历史病媒检测数据可以是过去每个观测日病媒生物的密度,气象数据可以是过去每日的气象监测数据,比如气温、气压、湿度。
S102:将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
还需要说明的是,目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型,编码模型用于对传染病数据进行编码处理,得到适于模型训练的特征数据,注意力模型用于对特征数据中提取关键信息,以对每个特征的重要性进行评估,全连接模型用于将特征进行连接处理。
在本实施例中,通过目标分析模型中的编码模型、注意力模型和全连接模型,对传染病数据进行数据分析,得到目标分析模型输出的分析向量。
可选的,目标分析模型可以是医疗数据分析模型,其中,所述医疗数据分析模型可用于对医疗数据进行分析,得到分析文本,医疗数据可以是传染病数据。
可选的,目标分析模型可以是医学图像生成模型,其中,所述医学图像生成模型用于对传染病数据进行分析,生成每一种传染病数据对应的医学图像。
可选的,目标分析模型可以是医学数据分类模型,其中,所述医学医学数据分类模型可用于对传染病数据进行分类处理,生成传染病数据对应的一个或者多个医学分类标签。
S103:根据所述分析向量进行向量分析,得到分析结果。
在本实施例中,在一种实现方式中,通过对分析向量进行向量分析,生成传染病数据的分析向量对应的病症画像。在另一种实现方式中,通过对分析向量进行向量分析,生成传染病数据的病症分析文本。
本实施例提出的传染病数据分析方法,通过获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据,接着将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型,最后根据所述分析向量进行向量分析,得到分析结果,能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
基于第一实施例,提出本发明传染病数据分析方法的第二实施例,在本实施例中,所述编码模型包括多个编码单元,每个编码单元包括依次连接的输入层以及编码层,所述将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,包括:
S201:将所述传染病数据的每个目标特征分别输入所述目标特征对应的编码单元的输入层中,得到第一输出结果,其中,所述目标特征是所述传染病数据中的任一个特征;
S202:将所述第一输出结果输入所述目标特征对应的所述编码单元的编码层中进行编码,得到所述编码层的第二输出结果;
S203:根据所述传染病数据对应的各个所述第二输出结果、注意力模型和全连接模型进行数据分析,得到所述分析向量。
其中,目标特征是传染病数据中的任一个特征,编码单元包括依次连接的输入层以及编码层,其中,编码层可以采用编码器,编码器用于将目标特征转换为低维度的表示,以捕捉目标特征的重要的特征。
在本实施例中,将传染病数据的每个目标特征分别输入目标特征对应的编码单元的输入层中,得到输入层输出的第一输出结果。而后,将第一输出结果输入目标特征对应的编码单元的编码层中进行编码,得到编码层输出的第二输出结果。需要说明的是,对于每一个目标特征,均有目标特征对应的第二输出结果。最后,根据传染病数据对应的各个第二输出结果、注意力模型和全连接模型进行数据分析,得到分析向量。
本实施例提出的传染病数据分析方法,通过将所述传染病数据的每个目标特征分别输入所述目标特征对应的编码单元的输入层中,得到第一输出结果,其中,所述目标特征是所述传染病数据中的任一个特征,而后将所述第一输出结果输入所述目标特征对应的所述编码单元的编码层中进行编码,得到所述编码层的第二输出结果,接着根据所述传染病数据对应的各个所述第二输出结果、注意力模型和全连接模型进行数据分析,得到所述分析向量,能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
进一步地,在一个实施例中,注意力模型包括循环神经网络单元和注意力层,各个循环神经网络单元并联连接,每个循环神经网络单元与注意力层连接,所述根据所述传染病数据对应的各个所述第二输出结果、注意力模型和全连接模型进行数据分析,得到分析向量,包括:
S2031,将所述第二输出结果分别输入所述目标特征对应的所述循环神经网络单元,得到第三输出结果;
S2032,将所述传染病数据对应的各个所述第三输出结果输入所述目标特征对应的所述注意力层进行针对所述目标特征的多头注意力机制的特征提取,得到所述目标特征对应的第四输出结果;
S2033,将所述目标特征的所述第四输出结果输入所述目标特征对应的所述全连接模型,得到单特征向量;
S2034,根据所述传染病数据对应的各个所述单特征向量确定所述分析向量。
其中,注意力模型包括循环神经网络单元和注意力层,循环神经网络单元可以是LSTM(Long short-term memory)模型,注意力层可以是多头注意力机制或者是自注意力机制。各个循环神经网络单元并联连接,每个循环神经网络单元与注意力层连接。
在本实施例中,首先,将第二输出结果分别输入目标特征对应的循环神经网络单元,得到循环神经网络单元输出的第三输出结果,而后将传染病数据对应的各个第三输出结果输入目标特征对应的注意力层,进行针对目标特征的多头注意力机制的特征提取,得到特征提取后的目标特征对应的第四输出结果,接着将目标特征的第四输出结果输入目标特征对应的全连接模型,得到单特征向量,最后根据传染病数据对应的各个单特征向量确定分析向量,作为一示例,将各个单特征向量作为分析向量。
本实施例提出的传染病数据分析方法,通过将所述第二输出结果分别输入所述目标特征对应的所述循环神经网络单元,得到第三输出结果,将所述传染病数据对应的各个所述第三输出结果输入所述目标特征对应的所述注意力层进行针对所述目标特征的多头注意力机制的特征提取,得到所述目标特征对应的第四输出结果,而后将所述目标特征的所述第四输出结果输入所述目标特征对应的所述全连接模型,得到单特征向量,最后根据所述传染病数据对应的各个所述单特征向量确定所述分析向量,能够通过注意力模型,对目标特征的多头注意力机制的特征提取,从而得到关注特征重要性的第四输出结果,而后通过全连接模型,对第四输出结果进行高效准确的数据分析,得到提高了分析准确率的单特征向量。
进一步地,一实施例中,所述全连接模型包括多个解码单元,每个解码单元包括依次连接的解码层、全连接层以及输出层,所述将所述目标特征的所述第四输出结果输入所述目标特征对应的所述全连接模型,得到单特征向量,包括:
S301:将所述目标特征的所述第四输出结果输入所述目标特征对应的所述解码单元的所述解码层中进行解码,得到第五输出结果;
S302:将所述目标特征的所述第五输出结果输入所述目标特征对应的所述解码单元的全连接层进行连接,得到第六输出结果;
S303:将所述目标特征的所述第六输出结果输入所述目标特征对应的所述解码单元的输出层进行向量输出,得到所述单特征向量。
其中,全连接模型包括多个解码单元,每个解码单元包括依次连接的解码层、全连接层以及输出层,解码层可以采用解码器,全连接层可以是FC(fully connected layer),输出层可以采用激活函数,作为一示例,激活函数可以是ReLU(Rectified Linear Unit)函数,ReLU函数又称为修正线性单元。
在本实施例中,将目标特征的第四输出结果输入目标特征对应的解码单元的解码层中进行解码,得到第五输出结果,而后将目标特征的第五输出结果输入目标特征对应的解码单元的全连接层进行连接,得到第六输出结果,接着将目标特征的第六输出结果输入目标特征对应的解码单元的输出层进行向量输出,从而得到每个目标特征的单特征向量。
本实施例提出的传染病数据分析方法,通过将所述目标特征的所述第四输出结果输入所述目标特征对应的所述解码单元的所述解码层中进行解码,得到第五输出结果,而后将所述目标特征的所述第五输出结果输入所述目标特征对应的所述解码单元的全连接层进行连接,得到第六输出结果,最后将所述目标特征的所述第六输出结果输入所述目标特征对应的所述解码单元的输出层进行向量输出,得到所述单特征向量,能够通过全连接模型,对第四输出结果进行高效准确的数据分析,得到提高了分析准确率的每个目标特征的单特征向量。
基于第一实施例,提出本发明传染病数据分析方法的第三实施例,在本实施例中,所述传染病数据分析方法还包括:
S401:获取各个传染病的训练数据和标签树,其中,所述标签树包括多层树结构,第i层树结构包括多个目标标签,与第i+1层树结构包括每个目标标签对应的子标签,i是大于1的整数;
S402:根据所述训练数据和所述标签树,对初始分析模型进行分类预测的训练,其中,所述初始分析模型包括依次相连的编码模型、注意力模型和全连接模型;
S403:将训练结束的所述初始分析模型作为所述目标分析模型。
其中,标签树包括多层树结构,第i层树结构包括多个目标标签,与第i+1层树结构包括每个目标标签对应的子标签,i是大于1的整数,目标标签可以是消化道传播、呼吸道传播、性传播、接触传播、血液传播、虫媒传播等标签。
在本实施例中,获取各个传染病的训练数据和标签树,而后根据训练数据和标签树,对初始分析模型进行分类预测的训练,其中,初始分析模型包括依次相连的编码模型、注意力模型和全连接模型,从而更新初始分析模型中的网络参数,最后将训练结束的初始分析模型作为目标分析模型。
本实施例提出的传染病数据分析方法,通过获取各个传染病的训练数据和标签树,其中,所述标签树包括多层树结构,第i层树结构包括多个目标标签,与第i+1层树结构包括每个目标标签对应的子标签,i是大于1的整数,而后根据所述训练数据和所述标签树,对初始分析模型进行分类预测的训练,其中,所述初始分析模型包括依次相连的编码模型、注意力模型和全连接模型,最后将训练结束的所述初始分析模型作为所述目标分析模型,能够通过各个传染病的训练数据和标签树,对初始分析模型进行分类预测的训练,从而得到能以高准确度分类传染病数据的目标分析模型,使得而后通过编码模型、注意力模型和全连接模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
进一步地,一实施例中,所述根据所述训练数据和所述标签树,对初始分析模型进行分类预测的训练,包括:
S501:从所述训练数据中获取一个训练样本,作为目标样本;
S502:将所述目标样本输入所述初始分析模型进行分类预测,得到样本向量;
S503:根据所述样本向量和所述标签树进行损失值计算;
S504:根据所述损失值,对所述初始分析模型中的网络参数进行更新;
S505:判断所述初始分析模型是否满足训练结束条件;
S506:若不满足,则跳转所述从所述训练数据中获取一个训练样本,作为目标样本的步骤重新执行;
S507:若满足,则确定所述初始分析模型训练结束。
在本实施例中,从训练数据中获取一个训练样本,作为目标样本,而后将目标样本输入初始分析模型进行分类预测,得到样本向量,其中,训练数据可以是实验人员收集的大量的传染病相关的数据。
根据样本向量和标签树进行损失值计算,得到损失值,而后根据损失值,对初始分析模型中的网络参数进行更新,而后判断初始分析模型是否满足训练结束条件。若不满足,跳转从所述训练数据中获取一个训练样本,作为目标样本的步骤重新执行,若满足,则确定初始分析模型训练结束。
作为一示例,通过损失值对初始分析模型中的网络参数进行更新后,判断初始分析模型是否收敛,若未收敛,则跳转从所述训练数据中获取一个训练样本,作为目标样本的步骤重新执行,若收敛,则满足训练结束条件,将收敛后的初始分析模型作为目标分析模型。作为又一示例,通过损失值对初始分析模型中的网络参数进行更新后,跳转从所述训练数据中获取一个训练样本,作为目标样本的步骤重新执行,计算迭代次数,当迭代次数达到预设次数,则满足训练结束条件,将训练结束后的初始分析模型作为目标分析模型。
一实施例中,所述根据所述样本向量和所述标签树进行损失值计算,包括:对所述样本向量和所述标签树计算均方误差,作为所述损失值。在一种实现方式中,对所述样本向量和所述标签树计算平均绝对值误差,作为所述损失值。
本实施例提出的传染病数据分析方法,通过从所述训练数据中获取一个训练样本,作为目标样本,接着将所述目标样本输入所述初始分析模型进行分类预测,得到样本向量,而后根据所述样本向量和所述标签树进行损失值计算,从而根据所述损失值,对所述初始分析模型中的网络参数进行更新,然后判断所述初始分析模型是否满足训练结束条件,若不满足,则跳转所述从所述训练数据中获取一个训练样本,作为目标样本的步骤重新执行,最后若满足,则确定所述初始分析模型训练结束,能够通过各个传染病的训练数据和标签树,对初始分析模型进行分类预测的训练,从而得到能以高准确度分类传染病数据的目标分析模型,使得而后通过编码模型、注意力模型和全连接模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
请参阅图3所示,在一实施例中,提供一种传染病数据分析装置,所述装置包括:
获取模块601,用于获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
数据分析模块602,用于将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
向量分析模块603,用于根据所述分析向量进行向量分析,得到分析结果。
本实施例提出的传染病数据分析方法,通过获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据,接着将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型,最后根据所述分析向量进行向量分析,得到分析结果,能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
在一个实施例中,数据分析模块602,还用于:
将所述传染病数据的每个目标特征分别输入所述目标特征对应的编码单元的输入层中,得到第一输出结果,其中,所述目标特征是所述传染病数据中的任一个特征;
将所述第一输出结果输入所述目标特征对应的所述编码单元的编码层中进行编码,得到所述编码层的第二输出结果;
根据所述传染病数据对应的各个所述第二输出结果、注意力模型和全连接模型进行数据分析,得到所述分析向量。
本实施例提出的传染病数据分析方法,通过将所述传染病数据的每个目标特征分别输入所述目标特征对应的编码单元的输入层中,得到第一输出结果,其中,所述目标特征是所述传染病数据中的任一个特征,而后将所述第一输出结果输入所述目标特征对应的所述编码单元的编码层中进行编码,得到所述编码层的第二输出结果,接着根据所述传染病数据对应的各个所述第二输出结果、注意力模型和全连接模型进行数据分析,得到所述分析向量,能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
在一个实施例中,数据分析模块602,还用于:
将所述第二输出结果分别输入所述目标特征对应的所述循环神经网络单元,得到第三输出结果;
将所述传染病数据对应的各个所述第三输出结果输入所述目标特征对应的所述注意力层进行针对所述目标特征的多头注意力机制的特征提取,得到所述目标特征对应的第四输出结果;
将所述目标特征的所述第四输出结果输入所述目标特征对应的所述全连接模型,得到单特征向量;
根据所述传染病数据对应的各个所述单特征向量确定所述分析向量。
本实施例提出的传染病数据分析方法,通过将所述第二输出结果分别输入所述目标特征对应的所述循环神经网络单元,得到第三输出结果,将所述传染病数据对应的各个所述第三输出结果输入所述目标特征对应的所述注意力层进行针对所述目标特征的多头注意力机制的特征提取,得到所述目标特征对应的第四输出结果,而后将所述目标特征的所述第四输出结果输入所述目标特征对应的所述全连接模型,得到单特征向量,最后根据所述传染病数据对应的各个所述单特征向量确定所述分析向量,能够通过注意力模型,对目标特征的多头注意力机制的特征提取,从而得到关注特征重要性的第四输出结果,而后通过全连接模型,对第四输出结果进行高效准确的数据分析,得到提高了分析准确率的单特征向量。
在一个实施例中,数据分析模块602,还用于:
将所述目标特征的所述第四输出结果输入所述目标特征对应的所述解码单元的所述解码层中进行解码,得到第五输出结果;
将所述目标特征的所述第五输出结果输入所述目标特征对应的所述解码单元的全连接层进行连接,得到第六输出结果;
将所述目标特征的所述第六输出结果输入所述目标特征对应的所述解码单元的输出层进行向量输出,得到所述单特征向量。
本实施例提出的传染病数据分析方法,通过将所述目标特征的所述第四输出结果输入所述目标特征对应的所述解码单元的所述解码层中进行解码,得到第五输出结果,而后将所述目标特征的所述第五输出结果输入所述目标特征对应的所述解码单元的全连接层进行连接,得到第六输出结果,最后将所述目标特征的所述第六输出结果输入所述目标特征对应的所述解码单元的输出层进行向量输出,得到所述单特征向量,能够通过全连接模型,对第四输出结果进行高效准确的数据分析,得到提高了分析准确率的每个目标特征的单特征向量。
在一个实施例中,传染病数据分析装置,还用于:
获取各个传染病的训练数据和标签树,其中,所述标签树包括多层树结构,第i层树结构包括多个目标标签,与第i+1层树结构包括每个目标标签对应的子标签,i是大于1的整数;
根据所述训练数据和所述标签树,对初始分析模型进行分类预测的训练,其中,所述初始分析模型包括依次相连的编码模型、注意力模型和全连接模型;
将训练结束的所述初始分析模型作为所述目标分析模型。
在一个实施例中,传染病数据分析装置,还用于:
从所述训练数据中获取一个训练样本,作为目标样本;
将所述目标样本输入所述初始分析模型进行分类预测,得到样本向量;
根据所述样本向量和所述标签树进行损失值计算;
根据所述损失值,对所述初始分析模型中的网络参数进行更新;
判断所述初始分析模型是否满足训练结束条件;
若不满足,则跳转所述从所述训练数据中获取一个训练样本,作为目标样本的步骤重新执行;
若满足,则确定所述初始分析模型训练结束。
在一个实施例中,传染病数据分析装置,还用于:
对所述样本向量和所述标签树计算均方误差,作为所述损失值。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种传染病数据分析方法服务端侧的功能或步骤。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种传染病数据分析方法客户端侧的功能或步骤。
在一个实施例中,提出了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
根据所述分析向量进行向量分析,得到分析结果。
本实施例提出的传染病数据分析方法,通过获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据,接着将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型,最后根据所述分析向量进行向量分析,得到分析结果,能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
在一个实施例中,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
根据所述分析向量进行向量分析,得到分析结果。
本实施例提出的传染病数据分析方法,通过获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据,接着将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型,最后根据所述分析向量进行向量分析,得到分析结果,能够通过基于依次相连的编码模型、注意力模型和全连接模型训练得到的目标分析模型,实现对传染病数据进行高效准确的数据分析,从而得到提高了分析准确率的分析结果。
需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种传染病数据分析方法,所述方法包括:
获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
根据所述分析向量进行向量分析,得到分析结果。
2.根据权利要求1所述的传染病数据分析方法,其特征在于,所述编码模型包括多个编码单元,每个编码单元包括依次连接的输入层以及编码层,所述将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,包括:
将所述传染病数据的每个目标特征分别输入所述目标特征对应的编码单元的输入层中,得到第一输出结果,其中,所述目标特征是所述传染病数据中的任一个特征;
将所述第一输出结果输入所述目标特征对应的所述编码单元的编码层中进行编码,得到所述编码层的第二输出结果;
根据所述传染病数据对应的各个所述第二输出结果、注意力模型和全连接模型进行数据分析,得到所述分析向量。
3.根据权利要求2所述的传染病数据分析方法,其特征在于,所述注意力模型包括循环神经网络单元和注意力层,各个所述循环神经网络单元并联连接,每个所述循环神经网络单元与注意力层连接,所述根据所述传染病数据对应的各个所述第二输出结果、注意力模型和全连接模型进行数据分析,得到分析向量,包括:
将所述第二输出结果分别输入所述目标特征对应的所述循环神经网络单元,得到第三输出结果;
将所述传染病数据对应的各个所述第三输出结果输入所述目标特征对应的所述注意力层进行针对所述目标特征的多头注意力机制的特征提取,得到所述目标特征对应的第四输出结果;
将所述目标特征的所述第四输出结果输入所述目标特征对应的所述全连接模型,得到单特征向量;
根据所述传染病数据对应的各个所述单特征向量确定所述分析向量。
4.根据权利要求3所述的传染病数据分析方法,其特征在于,所述全连接模型包括多个解码单元,每个解码单元包括依次连接的解码层、全连接层以及输出层,所述将所述目标特征的所述第四输出结果输入所述目标特征对应的所述全连接模型,得到单特征向量,包括:
将所述目标特征的所述第四输出结果输入所述目标特征对应的所述解码单元的所述解码层中进行解码,得到第五输出结果;
将所述目标特征的所述第五输出结果输入所述目标特征对应的所述解码单元的全连接层进行连接,得到第六输出结果;
将所述目标特征的所述第六输出结果输入所述目标特征对应的所述解码单元的输出层进行向量输出,得到所述单特征向量。
5.根据权利要求1所述的传染病数据分析方法,其特征在于,所述方法还包括:
获取各个传染病的训练数据和标签树,其中,所述标签树包括多层树结构,第i层树结构包括多个目标标签,与第i+1层树结构包括每个目标标签对应的子标签,i是大于1的整数;
根据所述训练数据和所述标签树,对初始分析模型进行分类预测的训练,其中,所述初始分析模型包括依次相连的编码模型、注意力模型和全连接模型;
将训练结束的所述初始分析模型作为所述目标分析模型。
6.根据权利要求5所述的传染病数据分析方法,其特征在于,所述根据所述训练数据和所述标签树,对初始分析模型进行分类预测的训练,包括:
从所述训练数据中获取一个训练样本,作为目标样本;
将所述目标样本输入所述初始分析模型进行分类预测,得到样本向量;
根据所述样本向量和所述标签树进行损失值计算;
根据所述损失值,对所述初始分析模型中的网络参数进行更新;
判断所述初始分析模型是否满足训练结束条件;
若不满足,则跳转所述从所述训练数据中获取一个训练样本,作为目标样本的步骤重新执行;
若满足,则确定所述初始分析模型训练结束。
7.根据权利要求6所述的传染病数据分析方法,其特征在于,所述根据所述样本向量和所述标签树进行损失值计算,包括:
对所述样本向量和所述标签树计算均方误差,作为所述损失值。
8.一种传染病数据分析装置,其特征在于,所述传染病数据分析装置包括:
获取模块,用于获取传染病数据,其中,所述传染病数据包括历史发病数据、历史病媒检测数据以及历史气象数据;
数据分析模块,用于将所述传染病数据输入目标分析模型中进行数据分析,得到分析向量,其中,所述目标分析模型是基于依次相连的编码模型、注意力模型和全连接模型训练得到的模型;
向量分析模块,用于根据所述分析向量进行向量分析,得到分析结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述传染病数据分析方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述传染病数据分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310798693.2A CN116884636A (zh) | 2023-06-30 | 2023-06-30 | 传染病数据分析方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310798693.2A CN116884636A (zh) | 2023-06-30 | 2023-06-30 | 传染病数据分析方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116884636A true CN116884636A (zh) | 2023-10-13 |
Family
ID=88265465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310798693.2A Pending CN116884636A (zh) | 2023-06-30 | 2023-06-30 | 传染病数据分析方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116884636A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117690600A (zh) * | 2024-02-01 | 2024-03-12 | 北方健康医疗大数据科技有限公司 | 基于知识图谱的传染病预测方法、系统、终端及存储介质 |
-
2023
- 2023-06-30 CN CN202310798693.2A patent/CN116884636A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117690600A (zh) * | 2024-02-01 | 2024-03-12 | 北方健康医疗大数据科技有限公司 | 基于知识图谱的传染病预测方法、系统、终端及存储介质 |
CN117690600B (zh) * | 2024-02-01 | 2024-04-30 | 北方健康医疗大数据科技有限公司 | 基于知识图谱的传染病预测方法、系统、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7162726B2 (ja) | 機械学習に基づく医療データ分類方法、装置、コンピュータデバイス及び記憶媒体 | |
CN110459324B (zh) | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 | |
CN112016279B (zh) | 电子病历结构化方法、装置、计算机设备和存储介质 | |
CN108922622B (zh) | 一种动物健康监测方法、装置及计算机可读存储介质 | |
CN110162779B (zh) | 病历质量的评估方法、装置及设备 | |
WO2020177377A1 (zh) | 基于机器学习的数据预测处理方法、装置和计算机设备 | |
CN111767707B (zh) | 雷同病例检测方法、装置、设备及存储介质 | |
CN108766545B (zh) | 在线问诊科室分配方法、装置、计算机设备和存储介质 | |
US20120109683A1 (en) | Method and system for outcome based referral using healthcare data of patient and physician populations | |
US20160110502A1 (en) | Human and Machine Assisted Data Curation for Producing High Quality Data Sets from Medical Records | |
CN112035611B (zh) | 目标用户推荐方法、装置、计算机设备和存储介质 | |
CN111914562A (zh) | 电子信息分析方法、装置、设备及可读存储介质 | |
CN113094477B (zh) | 数据结构化方法、装置、计算机设备及存储介质 | |
CN116884636A (zh) | 传染病数据分析方法、装置、计算机设备及存储介质 | |
CN113657105A (zh) | 基于词汇增强的医学实体抽取方法、装置、设备及介质 | |
CN113821668A (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
Peng et al. | BiteNet: bidirectional temporal encoder network to predict medical outcomes | |
CN113724359A (zh) | 一种基于Transformer的CT报告生成方法 | |
CN115424691A (zh) | 病例匹配方法、系统、设备和介质 | |
Ju et al. | 3D-CNN-SPP: A patient risk prediction system from electronic health records via 3D CNN and spatial pyramid pooling | |
Ao et al. | Continual deep learning for time series modeling | |
CN112507059B (zh) | 金融领域舆情监控中的事件抽取方法、装置和计算机设备 | |
CN111782821B (zh) | 基于fm模型的医学热点的预测方法、装置和计算机设备 | |
CN117316462A (zh) | 一种医疗数据管理方法 | |
CN113537560A (zh) | 用户投保意愿预测的方法、系统、电子装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |