CN115295159A - 基于区域数据挖掘的区域人口健康信息管理系统 - Google Patents
基于区域数据挖掘的区域人口健康信息管理系统 Download PDFInfo
- Publication number
- CN115295159A CN115295159A CN202210964221.5A CN202210964221A CN115295159A CN 115295159 A CN115295159 A CN 115295159A CN 202210964221 A CN202210964221 A CN 202210964221A CN 115295159 A CN115295159 A CN 115295159A
- Authority
- CN
- China
- Prior art keywords
- physical examination
- feature
- regional
- data
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000036541 health Effects 0.000 title claims abstract description 159
- 238000007418 data mining Methods 0.000 title claims abstract description 52
- 238000007726 management method Methods 0.000 claims abstract description 69
- 239000013598 vector Substances 0.000 claims description 268
- 239000011159 matrix material Substances 0.000 claims description 146
- 230000008859 change Effects 0.000 claims description 76
- 238000013527 convolutional neural network Methods 0.000 claims description 68
- 238000012549 training Methods 0.000 claims description 33
- 238000000354 decomposition reaction Methods 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 abstract description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 37
- 230000005182 global health Effects 0.000 description 14
- 230000003862 health status Effects 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 9
- 238000005065 mining Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 6
- 230000002411 adverse Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 102100033620 Calponin-1 Human genes 0.000 description 1
- 102100033591 Calponin-2 Human genes 0.000 description 1
- 101000945318 Homo sapiens Calponin-1 Proteins 0.000 description 1
- 101000945403 Homo sapiens Calponin-2 Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及健康信息的智能管理领域,其具体地公开了一种基于区域数据挖掘的区域人口健康信息管理系统及其管理方法,其通过使用多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据作为输入数据,采用深度神经网络模型来作为特征提取器,以在对于待评估区域的成员的健康状况变化是否满足预定标准的判断上利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。这样,能够准确地对于所述待评估区域的成员的健康状况变化进行评估,以提前预防疾病的发生,保障人们的生命健康。
Description
技术领域
本发明涉及健康信息的智能管理领域,且更为具体地,涉及一种基于区域数据挖掘的区域人口健康信息管理系统及其管理方法。
背景技术
近年来,随着环境污染和生态环境的破坏,生活在特定区域人的健康状态会受影响,但是这种影响是质性的,没有明确的指标证明特定区域的环境会对特定区域的人的健康状况造成不良影响。
人们早就注意到地理环境与人类健康的密切关联。生活在不同区域的环境下的人会因所处的地理位置、气候变化以及生活习性的不同,健康状况也会随之产生不同的变化。但是,这种健康状况的变化有好有坏,有的会使得人们的身体更加健康强壮,有的则会对于人们的身体健康产生不良的影响,甚至危及生命。
因此,期望一种基于区域数据挖掘的区域人口健康信息管理系统,以对于区域内人员的健康状况变化进行评估,进而提前预防疾病的发生,保障人们的生命健康。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展,为区域人口的健康信息管理提供了解决思路和方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于区域数据挖掘的区域人口健康信息管理系统及其管理方法,其通过使用多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据作为输入数据,采用深度神经网络模型来作为特征提取器,以在对于待评估区域的成员的健康状况变化是否满足预定标准的判断上利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。这样,能够准确地对于所述待评估区域的成员的健康状况变化进行评估,以提前预防疾病的发生,保障人们的生命健康。
根据本申请的一个方面,提供了一种基于区域数据挖掘的区域人口健康信息管理系统,其包括:
体检数据采集单元,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;
体检数据变化评估单元,用于计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;
体检变化数据编码单元,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;
区域体检特征编码单元,用于将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;
全局体检特征编码单元,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;
待评估区域单元,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;
向量查询单元,用于以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及
健康信息管理结果生成单元,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
在上述基于区域数据挖掘的区域人口健康信息管理系统中,所述体检变化数据编码单元,包括:输入数据构造子单元,用于使用所述基于转换器的上下文编码器的嵌入层分别将所述每个成员的差分体检数据的序列转化为输入向量以获得输入向量的序列;以及,上下文编码子单元,用于使用所述基于转换器的上下文编码器的转换器对所述输入向量的序列进行基于全局的上下文语义编码以获得所述对应于每个成员的差分体检向量。
在上述基于区域数据挖掘的区域人口健康信息管理系统中,所述区域体检特征编码单元,进一步用于:所述经训练完成的作为过滤器的第一卷积神经网络的各层在层的正向传递中对输入数据分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述第一卷积神经网络的最后一层的输出为所述对应于各个区域的区域体检特征向量,所述第一卷积神经网络的第一层的输入为所述二维特征矩阵。
在上述基于区域数据挖掘的区域人口健康信息管理系统中,所述全局体检特征编码单元,进一步用于:所述经训练完成的作为特征提取器的第二卷积神经网络的各层在层的正向传递中对输入数据分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部通道维度的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述第二卷积神经网络的最后一层的输出为所述全局体检特征矩阵,所述第二卷积神经网络的第一层的输入为所述二维区域特征矩阵。
在上述基于区域数据挖掘的区域人口健康信息管理系统中,进一步包括训练模块,包括:训练数据采集单元,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;训练体检数据变化评估单元,用于计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;训练体检变化数据编码单元,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;训练区域体检特征编码单元,用于将各个所述区内所有成员的差分体检向量进行二维排列为二维特征矩阵后通过作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;训练全局体检特征编码单元,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维特征矩阵后通过作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;训练待评估区域单元,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;训练向量查询单元,用于以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;分类损失单元,用于将所述分类特征向量通过分类器以得到分类损失函数值;节俭分解鼓励损失单元,用于计算基于所述全局体检特征矩阵的节俭分解鼓励损失函数值,所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值与所述全局体检特征矩阵在与所述区域体检特征向量对应的行方向上求和值有关;以及,训练单元,用于以所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值和所述分类损失函数值的加权和作为损失函数值来训练所述第一卷积神经网络和所述第二卷积神经网络。
在上述基于区域数据挖掘的区域人口健康信息管理系统中,所述分类损失单元,进一步用于:使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果,其中,所述公式为:softmax{(Wn,Bn):…:(W1,B1)|X},其中,W1到Wn为权重矩阵,B1到Bn为偏置向量,X为所述分类特征向量;以及,计算所述分类结果与真实值之间的交叉熵值作为所述分类损失函数值。
在上述基于区域数据挖掘的区域人口健康信息管理系统中,所述节俭分解鼓励损失单元,进一步用于:计算基于所述全局体检特征矩阵的所述节俭分解鼓励损失函数值;
其中,所述公式为:
根据本申请的另一方面,一种基于区域数据挖掘的区域人口健康信息管理系统的管理方法,其包括:
获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;
计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;
将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;
将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;
将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;
从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;
以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
在上述基于区域数据挖掘的区域人口健康信息管理系统的管理方法中,将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量,包括:使用所述基于转换器的上下文编码器的嵌入层分别将所述每个成员的差分体检数据的序列转化为输入向量以获得输入向量的序列;以及,使用所述基于转换器的上下文编码器的转换器对所述输入向量的序列进行基于全局的上下文语义编码以获得所述对应于每个成员的差分体检向量。
在上述基于区域数据挖掘的区域人口健康信息管理系统的管理方法中,将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量,包括:所述经训练完成的作为过滤器的第一卷积神经网络的各层在层的正向传递中对输入数据分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述第一卷积神经网络的最后一层的输出为所述对应于各个区域的区域体检特征向量,所述第一卷积神经网络的第一层的输入为所述二维特征矩阵。
在上述基于区域数据挖掘的区域人口健康信息管理系统的管理方法中,将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵,包括:所述经训练完成的作为特征提取器的第二卷积神经网络的各层在层的正向传递中对输入数据分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部通道维度的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述第二卷积神经网络的最后一层的输出为所述全局体检特征矩阵,所述第二卷积神经网络的第一层的输入为所述二维区域特征矩阵。
在上述基于区域数据挖掘的区域人口健康信息管理系统的管理方法中,进一步包括训练阶段,包括:获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;将各个所述区内所有成员的差分体检向量进行二维排列为二维特征矩阵后通过作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;将所述多个区域的多个区域体检特征向量进行二维排列为二维特征矩阵后通过作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;将所述分类特征向量通过分类器以得到分类损失函数值;计算基于所述全局体检特征矩阵的节俭分解鼓励损失函数值,所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值与所述全局体检特征矩阵在与所述区域体检特征向量对应的行方向上求和值有关;以及,以所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值和所述分类损失函数值的加权和作为损失函数值来训练所述第一卷积神经网络和所述第二卷积神经网络。
在上述基于区域数据挖掘的区域人口健康信息管理系统的管理方法中,将所述分类特征向量通过分类器以得到分类损失函数值,包括:使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果,其中,所述公式为:softmax{(Wn,Bn):…:(W1,B1)|X},其中,W1到Wn为权重矩阵,B1到Bn为偏置向量,X为所述分类特征向量;以及,计算所述分类结果与真实值之间的交叉熵值作为所述分类损失函数值。
在上述基于区域数据挖掘的区域人口健康信息管理系统的管理方法中,计算基于所述全局体检特征矩阵的节俭分解鼓励损失函数值,包括:计算基于所述全局体检特征矩阵的所述节俭分解鼓励损失函数值;
其中,所述公式为:
与现有技术相比,本申请提供的基于区域数据挖掘的区域人口健康信息管理系统及其管理方法,其通过使用多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据作为输入数据,采用深度神经网络模型来作为特征提取器,以在对于待评估区域的成员的健康状况变化是否满足预定标准的判断上利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。这样,能够准确地对于所述待评估区域的成员的健康状况变化进行评估,以提前预防疾病的发生,保障人们的生命健康。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统的框图。
图2为根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统中训练模块的框图。
图3为根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统的管理方法的流程图。
图4为根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统的管理方法的架构示意图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如前所述,近年来,随着环境污染和生态环境的破坏,生活在特定区域人的健康状态会受影响,但是这种影响是质性的,没有明确的指标证明特定区域的环境会对特定区域的人的健康状况造成不良影响。
人们早就注意到地理环境与人类健康的密切关联。生活在不同区域的环境下的人会因所处的地理位置、气候变化以及生活习性的不同,健康状况也会随之产生不同的变化。但是,这种健康状况的变化有好有坏,有的会使得人们的身体更加健康强壮,有的则会对于人们的身体健康产生不良的影响,甚至危及生命。
因此,期望一种基于区域数据挖掘的区域人口健康信息管理系统,以对于区域内人员的健康状况变化进行评估,进而提前预防疾病的发生,保障人们的生命健康。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展,为区域人口的健康信息管理提供了解决思路和方案。
基于此,本申请的发明人考虑到由于在不同区域的环境下的人会因所处的地理位置、气候变化以及生活习性的不同,健康状况也会随之产生不同的变化,而由于这种变化的不确定性,对于这种变化的评估,也就是对于某个区域的成员健康状况变化的评估是没有依据可寻的,这就会使得评估的准确性和有效性都难以保证。并且,本申请发明人还考虑到,由于每个区域的所有成员之间的健康状况变化存在着隐含的关联,且各个所述区域的所有成员之间的健康状况变化也存在着关联性,因此,在对于某个区域的成员健康状况变化进行评估时,期望利用这些隐含的关联性信息进行全局的分类判断。
具体地,在本申请的技术方案中,首先,获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据。然后,应可以理解,由于需要对于区域内成员的健康状况变化进行评估,因此需要更加关注于所述体检数据的变化特征,这样,进一步计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列。
并且,考虑到所述每个成员的差分体检数据的序列之间存在着关联信息,因此为了更为充分地提取出这种隐含的关联特征信息,进一步将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器进行编码,以提取出所述每个成员的差分体检数据的序列之间的基于全局的高维语义特征以更适于表征所述每个成员的健康状况变化的本质特征,从而得到对应于每个成员的差分体检向量。
然后,将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵,以整合各个所述区域的所有成员的全局健康隐含变化特征后通过作为过滤器的第一卷积神经网络中进行特征挖掘,以提取出各个所述区域的所有成员的健康变化特征的高维隐含关联特征信息,从而得到对应于各个区域的区域体检特征向量。应可以理解,通过所述作为过滤器的第一卷积神经网络来进行特征挖掘,不仅能够挖掘出数据的隐含特征信息,还能够降低参数的数量,进而降低计算量,防止过拟合以提高后续分类的准确性。
进一步地,对于所述各个区域的区域体检特征向量来说,为了提高对于所述区域成员的健康状况的变化是否满足预定标准的评估准确性,还需要利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。也就是,具体地,在本申请的技术方案中,需要进一步将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过作为特征提取器的第二卷积神经网络中进行特征挖掘,以得到全局体检特征矩阵。
当对于待评估区域的成员的健康状况变化进行评估时,首先,从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量。然后,以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘,以将所述待评估区域的区域体检特征向量映射到所述全局体检特征矩阵的高维特征空间中,从而得到分类特征向量。
但是,由于以所述区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量,因此,在本申请的技术方案中,对于所述全局体检特征矩阵,期望其能够获得良好的与区域体检特征向量方向垂直的方向上的各个区域体检特征向量之间的类间表达能力。
因此,在本申请的技术方案中,引入基于全局体检特征矩阵的节俭分解(parsimonious decomposition)鼓励损失函数,表示为:
也就是,该损失函数通过对特征在类间表达的各行排列的方向上进行分组,并对类内表达的行方向内元素的重叠施加惩罚,通过计算符号化函数的距离式联合来促进高维流形的节俭分解,也就是,基于凸多面体(convex polytope)的集合来构建高维流形的较为坚固的几何形状。这样,就提高了所述全局体检特征矩阵的高维流形在高维空间内的类间维度单调性,从而提高了与各个所述区域体检特征向量对应的类间表达能力,进而提高了分类的准确性。
基于此,本申请提出了一种基于区域数据挖掘的区域人口健康信息管理系统,其包括:体检数据采集单元,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;体检数据变化评估单元,用于计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;体检变化数据编码单元,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;区域体检特征编码单元,用于将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;全局体检特征编码单元,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;待评估区域单元,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;向量查询单元,用于以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及,健康信息管理结果生成单元,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1图示了根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统的框图。如图1所示,根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统200,包括:体检数据采集单元210,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;体检数据变化评估单元220,用于计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;体检变化数据编码单元230,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;区域体检特征编码单元240,用于将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;全局体检特征编码单元250,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;待评估区域单元260,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;向量查询单元270,用于以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及,健康信息管理结果生成单元280,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
具体地,在本申请实施例中,所述体检数据采集单元210和所述体检数据变化评估单元220,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据,并计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列。如前所述,应可以理解,考虑到由于在不同区域的环境下的人会因所处的地理位置、气候变化以及生活习性的不同,健康状况也会随之产生不同的变化,而由于这种变化的不确定性,对于这种变化的评估,也就是对于某个区域的成员健康状况变化的评估是没有依据可寻的,这就会使得评估的准确性和有效性都难以保证。并且,还考虑到由于每个区域的所有成员之间的健康状况变化存在着隐含的关联,且各个所述区域的所有成员之间的健康状况变化也存在着关联性,因此,在本申请的技术方案中,在对于某个区域的成员健康状况变化进行评估时,期望利用这些隐含的关联性信息进行全局的分类判断。
也就是,具体地,在本申请的技术方案中,首先,获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据。然后,应可以理解,由于需要对于区域内成员的健康状况变化进行评估,因此需要更加关注于所述体检数据的变化特征,这样,进一步计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列。
具体地,在本申请实施例中,所述体检变化数据编码单元230,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量。应可以理解,考虑到所述每个成员的差分体检数据的序列之间存在着关联信息,因此,在本申请的技术方案中,为了更为充分地提取出这种隐含的关联特征信息,进一步将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器进行编码,以提取出所述每个成员的差分体检数据的序列之间的基于全局的高维语义特征以更适于表征所述每个成员的健康状况变化的本质特征,从而得到对应于每个成员的差分体检向量。
更具体地,在本申请实施例中,所述体检变化数据编码单元,包括:输入数据构造子单元,用于使用所述基于转换器的上下文编码器的嵌入层分别将所述每个成员的差分体检数据的序列转化为输入向量以获得输入向量的序列;以及,上下文编码子单元,用于使用所述基于转换器的上下文编码器的转换器对所述输入向量的序列进行基于全局的上下文语义编码以获得所述对应于每个成员的差分体检向量。
具体地,在本申请实施例中,所述区域体检特征编码单元240,用于将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量。也就是,在本申请的技术方案中,将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵,以整合各个所述区域的所有成员的全局健康隐含变化特征后通过作为过滤器的第一卷积神经网络中进行特征挖掘,以提取出各个所述区域的所有成员的健康变化特征的高维隐含关联特征信息,从而得到对应于各个区域的区域体检特征向量。应可以理解,通过所述作为过滤器的第一卷积神经网络来进行特征挖掘,不仅能够挖掘出数据的隐含特征信息,还能够降低参数的数量,进而降低计算量,防止过拟合以提高后续分类的准确性。
更具体地,在本申请实施例中,所述区域体检特征编码单元,进一步用于:所述经训练完成的作为过滤器的第一卷积神经网络的各层在层的正向传递中对输入数据分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述第一卷积神经网络的最后一层的输出为所述对应于各个区域的区域体检特征向量,所述第一卷积神经网络的第一层的输入为所述二维特征矩阵。
具体地,在本申请实施例中,所述全局体检特征编码单元250,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵。应可以理解,进一步地,对于所述各个区域的区域体检特征向量来说,为了提高对于所述区域成员的健康状况的变化是否满足预定标准的评估准确性,还需要利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。也就是,具体地,在本申请的技术方案中,需要进一步将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过作为特征提取器的第二卷积神经网络中进行特征挖掘,以得到全局体检特征矩阵。
更具体地,在本申请实施例中,所述全局体检特征编码单元,进一步用于:所述经训练完成的作为特征提取器的第二卷积神经网络的各层在层的正向传递中对输入数据分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部通道维度的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述第二卷积神经网络的最后一层的输出为所述全局体检特征矩阵,所述第二卷积神经网络的第一层的输入为所述二维区域特征矩阵。
具体地,在本申请实施例中,所述待评估区域单元260、所述向量查询单元270和所述健康信息管理结果生成单元280,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量,并以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量,再将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。也就是,在本申请的技术方案中,当对于待评估区域的成员的健康状况变化进行评估时,首先,从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量。然后,以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘,以将所述待评估区域的区域体检特征向量映射到所述全局体检特征矩阵的高维特征空间中,从而得到分类特征向量。这样,就可以将所述分类特征向量通过分类器以得到用于表示待评估区域的成员的健康状况变化是否超过预定标准的分类结果。
但是,由于以所述区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量,因此,对于所述全局体检特征矩阵,期望其能够获得良好的与区域体检特征向量方向垂直的方向上的各个区域体检特征向量之间的类间表达能力。因此,在本申请的技术方案中,引入基于全局体检特征矩阵的节俭分解(parsimoniousdecomposition)鼓励损失函数来对于所述第一卷积神经网络和所述第二卷积神经网络进行训练。
图2图示了根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统中训练模块的框图。如图2所示,所述训练模块320,包括:训练数据采集单元3201,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;训练体检数据变化评估单元3202,用于计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;训练体检变化数据编码单元3203,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;训练区域体检特征编码单元3204,用于将各个所述区内所有成员的差分体检向量进行二维排列为二维特征矩阵后通过作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;训练全局体检特征编码单元3205,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维特征矩阵后通过作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;训练待评估区域单元3206,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;训练向量查询单元3207,用于以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;分类损失单元3208,用于将所述分类特征向量通过分类器以得到分类损失函数值;节俭分解鼓励损失单元3209,用于计算基于所述全局体检特征矩阵的节俭分解鼓励损失函数值,所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值与所述全局体检特征矩阵在与所述区域体检特征向量对应的行方向上求和值有关;以及,训练单元3210,用于以所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值和所述分类损失函数值的加权和作为损失函数值来训练所述第一卷积神经网络和所述第二卷积神经网络。
具体地,在本申请实施例中,所述分类损失单元3208,用于将所述分类特征向量通过分类器以得到分类损失函数值。也就是,在本申请的技术方案中,在训练模块中,可以按照如上所述方式来得到所述分类特征向量,进而再将所述分类特征向量通过分类器中计算分类损失函数值来辅助对于所述第一卷积神经网络和所述第二卷积神经网络的训练。
更具体地,在本申请实施例中,所述分类损失单元,进一步用于:使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果,其中,所述公式为:softmax{(Wn,Bn):…:(W1,B1)|X},其中,W1到Wn为权重矩阵,B1到Bn为偏置向量,X为所述分类特征向量;以及,计算所述分类结果与真实值之间的交叉熵值作为所述分类损失函数值。
具体地,在本申请实施例中,所述节俭分解鼓励损失单元3209,用于计算基于所述全局体检特征矩阵的节俭分解鼓励损失函数值,所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值与所述全局体检特征矩阵在与所述区域体检特征向量对应的行方向上求和值有关。应可以理解,由于以所述区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量,因此,对于所述全局体检特征矩阵,期望其能够获得良好的与区域体检特征向量方向垂直的方向上的各个区域体检特征向量之间的类间表达能力。因此,在本申请的技术方案中,引入基于全局体检特征矩阵的节俭分解(parsimonious decomposition)鼓励损失函数来对于所述第一卷积神经网络和所述第二卷积神经网络进行训练。也就是,该所述节俭分解鼓励损失函数值通过对特征在类间表达的各行排列的方向上进行分组,并对类内表达的行方向内元素的重叠施加惩罚,通过计算符号化函数的距离式联合来促进高维流形的节俭分解,也就是,基于凸多面体(convexpolytope)的集合来构建高维流形的较为坚固的几何形状。这样,就提高了所述全局体检特征矩阵的高维流形在高维空间内的类间维度单调性,从而提高了与各个所述区域体检特征向量对应的类间表达能力,进而提高了分类的准确性。
更具体地,在本申请实施例中,所述节俭分解鼓励损失单元,进一步用于:计算基于所述全局体检特征矩阵的所述节俭分解鼓励损失函数值;
其中,所述公式为:
综上,基于本申请实施例的所述基于区域数据挖掘的区域人口健康信息管理系统200被阐明,其通过使用多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据作为输入数据,采用深度神经网络模型来作为特征提取器,以在对于待评估区域的成员的健康状况变化是否满足预定标准的判断上利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。这样,能够准确地对于所述待评估区域的成员的健康状况变化进行评估,以提前预防疾病的发生,保障人们的生命健康。
如上所述,根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统200可以实现在各种终端设备中,例如基于区域数据挖掘的区域人口健康信息管理算法的服务器等。在一个示例中,根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于区域数据挖掘的区域人口健康信息管理系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于区域数据挖掘的区域人口健康信息管理系统200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于区域数据挖掘的区域人口健康信息管理系统200与该终端设备也可以是分立的设备,并且该基于区域数据挖掘的区域人口健康信息管理系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图3图示了基于区域数据挖掘的区域人口健康信息管理系统的管理方法的流程图。如图3所示,根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统的管理方法,包括步骤:S110,获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;S120,计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;S130,将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;S140,将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;S150,将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;S160,从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;S170,以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及,S180,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
图4图示了根据本申请实施例的基于区域数据挖掘的区域人口健康信息管理系统的管理方法的架构示意图。如图4所示,在所述基于区域数据挖掘的区域人口健康信息管理系统的管理方法的网络架构中,首先,计算每个所述成员的第二年体检数据(例如,如图4中所示意的P2)和第一年体检数据(例如,如图4中所示意的P1)之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列(例如,如图4中所示意的IN);接着,将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器(例如,如图4中所示意的E1)以得到对应于每个成员的差分体检向量(例如,如图4中所示意的VF1);然后,将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵(例如,如图4中所示意的M1)后通过经训练完成的作为过滤器的第一卷积神经网络(例如,如图4中所示意的CNN1)以得到对应于各个区域的区域体检特征向量(例如,如图4中所示意的VF2);接着,将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵(例如,如图4中所示意的M2)后通过经训练完成的作为特征提取器的第二卷积神经网络(例如,如图4中所示意的CNN2)以得到全局体检特征矩阵(例如,如图4中所示意的MF);然后,从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量(例如,如图4中所示意的VF3);接着,以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量(例如,如图4中所示意的VF);以及,最后,将所述分类特征向量通过分类器(例如,如图4中所示意的圈S)以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
更具体地,在步骤S110和S120中,获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据,并计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列。应可以理解,考虑到由于在不同区域的环境下的人会因所处的地理位置、气候变化以及生活习性的不同,健康状况也会随之产生不同的变化,而由于这种变化的不确定性,对于这种变化的评估,也就是对于某个区域的成员健康状况变化的评估是没有依据可寻的,这就会使得评估的准确性和有效性都难以保证。并且,还考虑到由于每个区域的所有成员之间的健康状况变化存在着隐含的关联,且各个所述区域的所有成员之间的健康状况变化也存在着关联性,因此,在本申请的技术方案中,在对于某个区域的成员健康状况变化进行评估时,期望利用这些隐含的关联性信息进行全局的分类判断。
也就是,具体地,在本申请的技术方案中,首先,获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据。然后,应可以理解,由于需要对于区域内成员的健康状况变化进行评估,因此需要更加关注于所述体检数据的变化特征,这样,进一步计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列。
更具体地,在步骤S130中,将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量。应可以理解,考虑到所述每个成员的差分体检数据的序列之间存在着关联信息,因此,在本申请的技术方案中,为了更为充分地提取出这种隐含的关联特征信息,进一步将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器进行编码,以提取出所述每个成员的差分体检数据的序列之间的基于全局的高维语义特征以更适于表征所述每个成员的健康状况变化的本质特征,从而得到对应于每个成员的差分体检向量。
更具体地,在步骤S140中,将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量。也就是,在本申请的技术方案中,将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵,以整合各个所述区域的所有成员的全局健康隐含变化特征后通过作为过滤器的第一卷积神经网络中进行特征挖掘,以提取出各个所述区域的所有成员的健康变化特征的高维隐含关联特征信息,从而得到对应于各个区域的区域体检特征向量。应可以理解,通过所述作为过滤器的第一卷积神经网络来进行特征挖掘,不仅能够挖掘出数据的隐含特征信息,还能够降低参数的数量,进而降低计算量,防止过拟合以提高后续分类的准确性。
更具体地,在步骤S150中,将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵。应可以理解,进一步地,对于所述各个区域的区域体检特征向量来说,为了提高对于所述区域成员的健康状况的变化是否满足预定标准的评估准确性,还需要利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。也就是,具体地,在本申请的技术方案中,需要进一步将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过作为特征提取器的第二卷积神经网络中进行特征挖掘,以得到全局体检特征矩阵。
更具体地,在步骤S160、步骤S170和步骤S180中,从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量,并以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量,再将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。也就是,在本申请的技术方案中,当对于待评估区域的成员的健康状况变化进行评估时,首先,从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量。然后,以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘,以将所述待评估区域的区域体检特征向量映射到所述全局体检特征矩阵的高维特征空间中,从而得到分类特征向量。这样,就可以将所述分类特征向量通过分类器以得到用于表示待评估区域的成员的健康状况变化是否超过预定标准的分类结果。
综上,基于本申请实施例的所述基于区域数据挖掘的区域人口健康信息管理系统的管理方法被阐明,其通过使用多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据作为输入数据,采用深度神经网络模型来作为特征提取器,以在对于待评估区域的成员的健康状况变化是否满足预定标准的判断上利用所述各个区域的成员健康状况变化特征的全局体检特征关联信息来进行特征的映射分类。这样,能够准确地对于所述待评估区域的成员的健康状况变化进行评估,以提前预防疾病的发生,保障人们的生命健康。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种基于区域数据挖掘的区域人口健康信息管理系统,其特征在于,包括:
体检数据采集单元,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;
体检数据变化评估单元,用于计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;
体检变化数据编码单元,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;
区域体检特征编码单元,用于将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;
全局体检特征编码单元,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;
待评估区域单元,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;
向量查询单元,用于以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及
健康信息管理结果生成单元,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
2.根据权利要求1所述的基于区域数据挖掘的区域人口健康信息管理系统,其特征在于,所述体检变化数据编码单元,包括:
输入数据构造子单元,用于使用所述基于转换器的上下文编码器的嵌入层分别将所述每个成员的差分体检数据的序列转化为输入向量以获得输入向量的序列;以及
上下文编码子单元,用于使用所述基于转换器的上下文编码器的转换器对所述输入向量的序列进行基于全局的上下文语义编码以获得所述对应于每个成员的差分体检向量。
3.根据权利要求2所述的基于区域数据挖掘的区域人口健康信息管理系统,其特征在于,所述区域体检特征编码单元,进一步用于:所述经训练完成的作为过滤器的第一卷积神经网络的各层在层的正向传递中对输入数据分别进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述第一卷积神经网络的最后一层的输出为所述对应于各个区域的区域体检特征向量,所述第一卷积神经网络的第一层的输入为所述二维特征矩阵。
4.根据权利要求3所述的基于区域数据挖掘的区域人口健康信息管理系统,其特征在于,所述全局体检特征编码单元,进一步用于:所述经训练完成的作为特征提取器的第二卷积神经网络的各层在层的正向传递中对输入数据分别进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行基于局部通道维度的均值池化以得到池化特征图;以及
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述第二卷积神经网络的最后一层的输出为所述全局体检特征矩阵,所述第二卷积神经网络的第一层的输入为所述二维区域特征矩阵。
5.根据权利要求4所述的基于区域数据挖掘的区域人口健康信息管理系统,其特征在于,进一步包括训练模块,包括:
训练数据采集单元,用于获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;
训练体检数据变化评估单元,用于计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;
训练体检变化数据编码单元,用于将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;
训练区域体检特征编码单元,用于将各个所述区内所有成员的差分体检向量进行二维排列为二维特征矩阵后通过作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;
训练全局体检特征编码单元,用于将所述多个区域的多个区域体检特征向量进行二维排列为二维特征矩阵后通过作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;
训练待评估区域单元,用于从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;
训练向量查询单元,用于以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及
分类损失单元,用于将所述分类特征向量通过分类器以得到分类损失函数值;
节俭分解鼓励损失单元,用于计算基于所述全局体检特征矩阵的节俭分解鼓励损失函数值,所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值与所述全局体检特征矩阵在与所述区域体检特征向量对应的行方向上求和值有关;以及
训练单元,用于以所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值和所述分类损失函数值的加权和作为损失函数值来训练所述第一卷积神经网络和所述第二卷积神经网络。
6.根据权利要求5所述的基于区域数据挖掘的区域人口健康信息管理系统,其特征在于,所述分类损失单元,进一步用于:
使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果,其中,所述公式为:softmax{(Wn,Bn):…:(W1,B1)|X},其中,W1到Wn为权重矩阵,B1到Bn为偏置向量,X为所述分类特征向量;以及
计算所述分类结果与真实值之间的交叉熵值作为所述分类损失函数值。
8.一种基于区域数据挖掘的区域人口健康信息管理系统的管理方法,其特征在于,包括:
获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;
计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;
将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;
将各个所述区域的所有成员的差分体检向量进行二维排列为二维特征矩阵后通过经训练完成的作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;
将所述多个区域的多个区域体检特征向量进行二维排列为二维区域特征矩阵后通过经训练完成的作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;
从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;
以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待评估区域的成员的健康状况变化是否超过预定标准。
9.根据权利要求8所述的基于区域数据挖掘的区域人口健康信息管理系统的管理方法,其特征在于,所述将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量,包括:
使用所述基于转换器的上下文编码器的嵌入层分别将所述每个成员的差分体检数据的序列转化为输入向量以获得输入向量的序列;以及
使用所述基于转换器的上下文编码器的转换器对所述输入向量的序列进行基于全局的上下文语义编码以获得所述对应于每个成员的差分体检向量。
10.根据权利要求9所述的基于区域数据挖掘的区域人口健康信息管理系统的管理方法,其特征在于,进一步包括训练阶段,包括:
获取多个区域中各个区域的所有成员的第一年体检数据和第二年体检数据;
计算每个所述成员的第二年体检数据和第一年体检数据之间的按体检项目之间的差分以得到对应于每个成员的差分体检数据的序列;
将所述每个成员的差分体检数据的序列通过基于转换器的上下文编码器以得到对应于每个成员的差分体检向量;
将各个所述区内所有成员的差分体检向量进行二维排列为二维特征矩阵后通过作为过滤器的第一卷积神经网络以得到对应于各个区域的区域体检特征向量;
将所述多个区域的多个区域体检特征向量进行二维排列为二维特征矩阵后通过作为特征提取器的第二卷积神经网络以得到全局体检特征矩阵;
从所述多个区域的多个区域体检特征向量提取待评估区域的区域体检特征向量;
以所述待评估区域的区域体检特征向量作为查询特征向量与所述全局体检特征矩阵进行相乘以得到分类特征向量;以及
将所述分类特征向量通过分类器以得到分类损失函数值;
计算基于所述全局体检特征矩阵的节俭分解鼓励损失函数值,所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值与所述全局体检特征矩阵在与所述区域体检特征向量对应的行方向上求和值有关;以及
以所述基于所述全局体检特征矩阵的节俭分解鼓励损失函数值和所述分类损失函数值的加权和作为损失函数值来训练所述第一卷积神经网络和所述第二卷积神经网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210964221.5A CN115295159A (zh) | 2022-08-11 | 2022-08-11 | 基于区域数据挖掘的区域人口健康信息管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210964221.5A CN115295159A (zh) | 2022-08-11 | 2022-08-11 | 基于区域数据挖掘的区域人口健康信息管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115295159A true CN115295159A (zh) | 2022-11-04 |
Family
ID=83827251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210964221.5A Pending CN115295159A (zh) | 2022-08-11 | 2022-08-11 | 基于区域数据挖掘的区域人口健康信息管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115295159A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116108143A (zh) * | 2023-04-10 | 2023-05-12 | 长春财经学院 | 基于区块链技术的数字经济监测方法及其系统 |
-
2022
- 2022-08-11 CN CN202210964221.5A patent/CN115295159A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116108143A (zh) * | 2023-04-10 | 2023-05-12 | 长春财经学院 | 基于区块链技术的数字经济监测方法及其系统 |
CN116108143B (zh) * | 2023-04-10 | 2023-07-04 | 长春财经学院 | 基于区块链技术的数字经济监测方法及其系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165692B (zh) | 一种基于弱监督学习的用户性格预测装置及方法 | |
CN111291678A (zh) | 一种基于多特征融合的人脸图像聚类方法及装置 | |
Mohanty et al. | A multi-modal approach towards mining social media data during natural disasters-A case study of Hurricane Irma | |
CN107767954A (zh) | 一种基于空间贝叶斯网络的环境健康风险监测预警系统及方法 | |
CN103886341A (zh) | 基于特征组合的步态行为识别方法 | |
CN106991447A (zh) | 一种嵌入式多类别属性标签动态特征选择算法 | |
WO2015165372A1 (en) | Method and apparatus for classifying object based on social networking service, and storage medium | |
JP6892606B2 (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
CN115013298A (zh) | 污水泵的实时性能在线监测系统及其监测方法 | |
CN111553419A (zh) | 一种图像识别方法、装置、设备以及可读存储介质 | |
CN115168443A (zh) | 一种基于gcn-lstm和注意力机制的异常检测方法及系统 | |
CN115295159A (zh) | 基于区域数据挖掘的区域人口健康信息管理系统 | |
CN112100486B (zh) | 一种基于图模型的深度学习推荐系统及其方法 | |
CN111145913A (zh) | 基于多重注意力模型的分类方法、装置及设备 | |
CN115458045B (zh) | 一种基于异构信息网络和推荐系统的药物对相互作用预测方法 | |
CN116468300A (zh) | 基于神经网络的军队总医院学科评估方法及系统 | |
CN115730125A (zh) | 对象识别方法、装置、计算机设备和存储介质 | |
CN104143117B (zh) | 一种电网特殊负荷与日负荷之间的相关系数提取方法 | |
CN113761192A (zh) | 文本处理方法、文本处理装置及文本处理设备 | |
DeSarbo | Canonical/redundancy factoring analysis | |
CN116704609A (zh) | 基于时序注意力的在线手卫生评估方法及系统 | |
CN116796248A (zh) | 森林康养环境评估系统及其方法 | |
CN110955804A (zh) | 一种针对用户时空数据行为检测的Adaboost方法 | |
US9208440B2 (en) | Method of analyzing a scenario represented as elements of a tensor space, and scored using tensor operators | |
CN115456259A (zh) | 基于中尺度数据的风电场选址优化系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |