CN112270996B - 一种可用于多变量医疗传感数据流的分类方法 - Google Patents
一种可用于多变量医疗传感数据流的分类方法 Download PDFInfo
- Publication number
- CN112270996B CN112270996B CN202011267085.1A CN202011267085A CN112270996B CN 112270996 B CN112270996 B CN 112270996B CN 202011267085 A CN202011267085 A CN 202011267085A CN 112270996 B CN112270996 B CN 112270996B
- Authority
- CN
- China
- Prior art keywords
- time
- signature matrix
- time series
- sensing data
- medical sensing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 239000011159 matrix material Substances 0.000 claims abstract description 146
- 230000007246 mechanism Effects 0.000 claims abstract description 15
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 14
- 230000007787 long-term memory Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000013145 classification model Methods 0.000 abstract description 14
- 230000015654 memory Effects 0.000 abstract description 2
- 230000003042 antagnostic effect Effects 0.000 abstract 1
- 230000004913 activation Effects 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 238000005457 optimization Methods 0.000 description 8
- 238000001125 extrusion Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种可用于多变量医疗传感数据流的分类方法,首先构造签名矩阵,该签名矩阵可以捕捉各个时间序列之间的相关性并可以代表这些时间序列,此外它还对噪声具有鲁棒性;随后,针对个别不平衡的类别,我们采用辅助分类器生成对抗网络ACGAN来生成足够该类别所对应的签名矩阵;最后我们构建了一个基于注意力Attention机制的双向卷积长短期记忆BPCLSTM轻量级网络分类模型,以实现对多变量医疗传感数据流地准确分类,该分类模型不仅可以提高分类的准确率,而且还能够降低原始分类模型的规模。
Description
技术领域
本发明涉及计算机技术领域,特别是一种可用于多变量医疗传感数据流的分类方法。
背景技术
医用传感器是应用于生物医学领域的那一部分传感器,是把人体的生理信息转换成为与之有确定函数关系的电信息的变换装置。它所拾取的信息是人体的生理信息,而它的输出常以电信号来表现。医用传感器常用于检测生物体信息、临床监护、控制人体生理过程等。随着医用传感器类别与性能的快速发展,其已经成为医学不可或缺的一部分。通过使用医用传感器收集各种医学数据,医生可以第一时间获取需要的病人人体信息,从而能够更准确更方便地实现对病人身体状况的监控,进一步提供更优质的治疗。
但是,在传统的治疗过程中,医用传感器提供的信息往往只能提供给具有专业知识的专业医生,不具备专业知识的从业者无法有效使用医用传感器提供的信息。因此,这就导致了专业医生的工作负担大、医疗资源分配不平衡、救治效率低等各方面的问题。
现有技术中还存在以下问题:
(1)数据存在噪声影响分类效果。实际收集的医疗感应数据流中存在大量噪声,且实际医疗异常诊断问题一般是多分类问题。如何区分噪声和具有少量训练样本的类,消除噪声,提升多分类的准确率是亟待解决的问题之一;
(2)现实数据较少。现实中已被准确标记的医疗样本很少。如何基于少量标记样本,设计有效的数据生成和分类模型,降低分类误差,进一步提升分类的准确率和效率是亟待解决的问题之二;
(3)现有模型规模较大。边缘计算要求轻量化分类模型的规模(即计算量和存储量)。如何在保证分类准确率的前提下,降低分类模型的规模,使分类模型的分类准确率、效率和模型规模达到最优平衡是亟待解决的问题之三。
发明内容
本发明所要解决的技术问题是克服现有技术的不足而提供一种可用于多变量医疗传感数据流的分类方法,本发明通过使用深度学习的方法,实现了对多变量医疗数据流分类,可以自动处理医用传感器提供的多变量信息,不仅可以大大降低专业医生的工作负担,还可以有效提供客观的分类结果。
本发明为解决上述技术问题采用以下技术方案:
根据本发明提出的一种可用于多变量时间序列医疗传感数据流的分类方法,包括以下步骤:
步骤1、采用辅助分类器生成对抗网络ACGAN生成不平衡的传感器医疗数据对应的签名矩阵;具体如下:
先收集多变量时间序列医疗传感数据,设收集到的数据中包括不平衡的多变量时间序列医疗传感数据,该不平衡的多变量时间序列医疗传感数据的类别一共有k种,这k个类别进行一位有效编码,得到不平衡的多变量时间序列医疗传感数据所对应的签名矩阵的类别的一位有效编码张量C;随后将收集到的不同类别的不平衡的多变量时间序列医疗传感数据转换成签名矩阵,从而得到不平衡的多变量时间序列医疗传感数据对应的签名矩阵的集合M={M1,M2,…,Mk},其中Mi是第i种类别的不平衡时间序列数据的签名矩阵集合,是属于第i种类别的第q个签名矩阵,q=1,2…j,j是第i种类别签名矩阵的个数;
ACGAN的生成器的输入包含了两个部分,一个是不平衡的多变量时间序列医疗传感数据所对应的签名矩阵的类别的一位有效编码张量C,另一个是满足高斯分布的随机噪声Z,然后再对这两个部分进行拼接操作,最后生成器输出的是与不平衡多变量时间序列医疗传感数据类别一致的签名矩阵集合Mg;ACGAN的判别器的输入为收集到的不平衡的医疗多变量时间序列数据所生成的签名矩阵的集合M,ACGAN的判别器用于对收集到的M进行真假的判断,并进行签名矩阵的分类;其中,真假的判断的损失函数LS表示为公式(1),分类的损失函数LC表示为公式(2);
其中,表示生成器生成的签名矩阵集合Mg中第i种类别的第qfake个签名矩阵,qfake为大于0的整数,c表示第i种类别对应的一位有效编码张量,S表示数据来源的类别,该数据分为不平衡的多变量时间序列医疗传感数据对应的签名矩阵real和生成器生成的签名矩阵fake,E[]表示取括号内的数学期望,P()指计算括号内概率值;
ACGAN中判别器D的目标函数是最大化LS+LC,生成器G的目标函数是最大化LC-LS;D和G交替训练,二者相互博弈,D的目标是区分出收集得到的不平衡类别的签名矩阵与生成器生成的签名矩阵G的目的是让D将生成器G生成的签名矩阵判定为收集得到的不平衡类别的签名矩阵;总体上,ACGAN的目的是为了让生成的签名矩阵尽可能接近收集得到的不平衡类别的签名矩阵
记收集到的所有多变量时间序列医疗传感数据对应的签名矩阵集合为M',M'包括两部分,一部分是多变量时间序列医疗传感数据对应的签名矩阵集合,另一部分是不平衡的多变量时间序列医疗传感数据对应的签名矩阵的集合M;取签名矩阵集合Minput,Minput由M'与Mg共同组成,其中Mg为ACGAN的生成器的输出结果,Minput将作为步骤2中模型的输入;
步骤2:构建基于注意力机制的双向卷积长短期记忆网络BPCLSTM模型对输入的签名矩阵集合Minput进行分类。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,步骤2中构建基于注意力机制的双向卷积长短期记忆网络BPCLSTM模型,具体如下:
BPCLSTM模型包括两层堆叠的BPCLSTM网络、一个MobileNet v3模块、dropout层,全连接层和softmax函数,向BPCLSTM模型中输入签名矩阵集合Minput,在BPCLSTM模型处理过程中,签名矩阵在每一层网络中被提取分类特征处理为特征图,将BPCLSTM网络输出得到的特征图H1送入MobileNet v3模块中进行进一步训练,将MobileNet v3模块输出的特征图H2分别经dropout层,全连接层和softmax函数进行处理分类。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,所述M为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子κ=ω,t表示时间序列中的某一时刻。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,所述为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,所述为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,所述为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,所述Mg为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,所述M'为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
作为本发明所述的一种可用于多变量时间序列医疗传感数据流的分类方法进一步优化方案,所述Minput为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
(1)本发明适用于多变量医疗数据流分类;
本发明通过引入签名矩阵,可以有效描述出多变量时间序列数据流间相关性。相较于单时间序列数据流处理,多变量时间学列处理难度更高、更复杂,本发明以签名矩阵且结合网络模型,使用softmax网络层的做法实现了对多变量时间序列数据流处理,且分类效果较好。
(2)本发明可以保证模型具有较高的抗噪能力;
本发明通过使用签名矩阵描述多变量时间序列数据流间相关性,且该签名矩阵经过实验证明对含噪声数据具有鲁棒性,抗噪能力较强,有助于提高在实际应用中的分类准确度。
(3)本发明可以较为有效地降低模型规模;
本发明在网络模型设计中,使用了轻量化模型的思想,本发明在搭建BPCLSTM网络之后还加入了MobileNet v3这一轻量化网络的基础模块,在增加网络层数以提高分类性能的基础上尽可能地减少了网络规模,有利于节省计算与存储资源。
(4)本发明可以有效生成医疗数据;
本发明使用ACGAN来生成足够的不平衡的传感器医疗数据。现实医疗情景中,传感器收集到的数据往往是不平衡的,也即大部分的数据属于正常类别,而异常类别往往所占比例很少,这种不同类别的样本数量差异就导致了样本不平衡性。而本发明通过使用ACGAN,可以生成充分的不同类别样本数据,保证了网络模型的分类性能。
附图说明
图1是多变量医疗传感数据流的分类方案的总体框架;
图2是ACGAN的结构。
图3a是ACGAN生成器G的内部结构,图3b是判别器D的内部结构。
图4是MobileNet v3的基础网络模块。
图5是基于注意力机制的BPCLSTM轻量级网络分类模型的结构。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
本发明重点围绕对多变量医疗传感数据流的分类展开具体研究,运用深度学习技术,设计出适用于传感器收集到的多变量医疗数据流的分类方案,从而进一步推动智慧医疗在现代化社会的发展。本发明提出了可用于多变量医疗传感数据流的分类模型。首先构造签名矩阵,该签名矩阵可以捕捉各个时间序列之间的相关性并可以代表这些时间序列,此外它还对噪声具有鲁棒性;随后,针对个别不平衡的类别,我们采用辅助分类器生成对抗网络(Auxiliary Classifier Generative Adversarial Networks,简称ACGAN)来生成足够该类别所对应的签名矩阵;最后我们构建了一个基于注意力(Attention)机制的双向卷积长短期记忆(Bi-directional Convolutional Long Short-Term Memory,简称BPCLSTM)轻量级网络分类模型,以实现对多变量医疗传感数据流地准确分类,该分类模型不仅可以提高分类的准确率,而且还能够降低原始分类模型的规模。该模型的总体框架见图1。
本发明主要有以下步骤:
步骤1:由医疗传感数据流构造签名矩阵。
1.1根据多元时间序列数据,按照区间长度划分不同时间序列区间,分别计算得到签名矩阵。
步骤2:ACGAN生成不平衡的传感器医疗数据。
2.1使用ACGAN生成足够的不平衡的传感器医疗数据。
步骤3:构建基于注意力机制的BPCLSTM轻量级网络进行分类。
3.1构建网络模型。
3.2划分数据集,生成训练集与测试集。
3.3使用训练集对网络模型进行训练。
3.4使用测试集进行测试,此时的模型可以输入未知类别的多变量医疗数据流实现多分类。
本节演示了整个对多变量医疗传感数据流分类的过程。
步骤1由医疗传感数据流构造签名矩阵。
1.1由多元时间序列数据生成签名矩阵。为了捕获多元时间序列区间[t-ω,t]中不同对时间序列之间的相互关系,我们构建了一个n×n的签名矩阵Mt,该签名矩阵是基于该时间段内两个时间序列的两两内积构造而成。给定一个多变量时间序列片段的集合Xω中的两段时间序列:和 与之间的相关性的计算公式如公式(1)所示:
其中,κ是一个重新调节因子(κ=ω)。该签名矩阵Mt不仅能够捕捉到两个时间序列之间的形状相似性和值尺度相关性,而且对输入噪声具有鲁棒性。Xω中的多条时间片段就可以由对应的签名矩阵表示。
步骤2使用ACGAN生成足够的不平衡的传感器医疗数据。
2.1使用ACGAN生成足够的不平衡的传感器医疗数据,ACGAN的总体结构见图2。首先,假设收集到的不平衡的的医疗数据的类别一共有k种,这k个类别需要进行One-hot编码。随后将收集到的不同类别的时间序列转换成1.1中所提的签名矩阵,得到签名矩阵的集合M={M1,M2,…,Mk},其中 是这k种类型的签名矩阵中的一类,是属于这一类的一个签名矩阵,j是这一类签名矩阵的个数。
ACGAN的生成器的输入包含了两个部分,一个是不平衡的医疗数据所对应的签名矩阵类别的One-hot编码张量C,另一个是满足高斯分布的随机噪声Z,然后再对这两个部分进行拼接操作,最后生成器输出的是“假”的签名矩阵。判别器的输入为采样的签名矩阵的数据,它的输出有两个部分,一个是对采样到的签名矩阵进行真假的判断,另一个是签名矩阵的分类结果。其中,真假判断的损失函数LS表示为公式(2),分类的损失函数LC表示为公式(3)。
ACGAN中判别器D的目标函数是最大化LS+LC,生成器G的目标函数是最大化LC-LS。D和G交替训练,二者相互博弈,D的目标是尽可能地区分出真实的签名矩阵与生成的签名矩阵,并能对签名矩阵进行有效的分类,判别器D的具体结构见图3b;G的目的是使它生成的”假”的签名矩阵能“骗过”D,尽可能地让D将生成地签名矩阵判定为真实的签名矩阵,生成器G的具体结果见图3a。
步骤3构建基于注意力机制的BPCLSTM轻量级网络进行分类。
3.1构建完整的网络模型。为了有效地捕捉传感器医疗数据之间的时间信息,使对签名矩阵的分类准确性更高,以及降低网络的规模以适应边缘计算的需求,我们设计了BPCLSTM轻量级网络。同时,考虑到BPCLSTM的性能会因签名矩阵的尺寸较大而受影响,所以还使用了注意力机制,它可以跨不同的时间步自适应地选择相关的隐藏状态(特征图)。
BPCLSTM是在卷积长短期记忆(Convolutional Long Short-Term Memory,简称ConvLSTM)网络的基础上发展而来的,前向的ConvLSTM与后向的ConvLSTM相结合就形成了BPCLSTM。在ConvLSTM中,给定第l个卷积层的特征映射Xt,l以及前一个隐藏状态Ht-1,l,则当前的隐藏状态Ht,l被更新为Ht,l=ConvLSTM(Xt,l,Ht-1,l)。在每一个ConvLSTM单元中,遗忘门决定了信息的丢弃,公式(4)是遗忘门的激活;输入门添加有用的信息到细胞状态中,公式(5)决定哪些信息需要被更新;公式(6)将新的信息添加到新的细胞Ct,l中以替换掉原来的细胞Ct-1,l;输出门选择重要的信息作为细胞的输出,公式(7)决定了输出的信息ot,l;公式(8)将ot,l转换为当前的隐藏状态Ht,l。
其中,Vec(·)表示的是向量,χ是一个重新调节因子。也就是说,我们将最后一个隐藏状态Ht,l作为组级上下文向量,并通过softmax函数度量前一步的重要度权重αi。与一般的注意机制引入转换和上下文参数不同的是,公式(9)纯粹是基于学习到的隐藏特征图,并实现了与传统注意力机制相似的功能。
此外,由于边缘计算要求轻量化分类模型的规模(即计算量和存储量),即在提取特征的同时尽可能降低计算量,在BPCLSTM网络层后,我们使用了MobileNet v3的轻量化网络结构,MobileNet v3是在MobileNet v1和MobileNet v2基础上改进得到的轻量化网络模型,MobileNet v3的基础模块见图4。
MobileNet v3在之前两个版本的基础之上,进一步引入了SE模块(Squeeze-and-Excite)。SE模块提出了压缩与激励机制,主要用来学习了不同通道之间的相关性,筛选出了针对通道的注意力,通过增加了一点计算量,较好地改善了分类效果。对于任意的卷积运算Ftr:X→U,X∈RW′×H′×C′,U∈RW×H×C,Ftr的输出为U=[u1,u2,…,uC],uC由公式(10)表示。
其中,*表示卷积运算,表示作用于s通道上的卷积核。经过卷积运算后特征图还要依次进行挤压(Squeeze)和激励(Excite)操作。挤压操作通过使用全局平均池化生成通道统计数据,对于Ftr操作输出的C个通道特征图uc所做的挤压操作如下:
其中,zc是经过挤压操作之后得到的维度为1×1×C的张量。经过挤压操作之后,需要进一步进行激励操作,激励操作目的是为了度量出不同通道的重要性,激励操作表示如下:
s=Fex(z,w)=σ(g(z,w))=σ(W2δ(W1z)) (12)
其中,与是两个可学习参数矩阵,r是一个由使用者指定的压缩比参数,δ指RELU激活函数,σ指sigmoid激活函数。W1与W2用来限制模型复杂度与增加通道数,使得激活操作之后输出维度与卷积运算Ftr的输出结果U的通道数相同。最后,得到激活操作的输出后,与U相应通道相乘得到经过SE模块处理后的输出结果表述如下:
除了引入SE模块来提高分类准确度之外,MobileNet v3还提出了一种新的激活函数用来代替ReLU激活函数,用以提高网络分类精度。函数公式如下:
swish(x)=x*σ(x) (14)
其中,σ为sigmoid激活函数。但是由于sigmoid函数需要的计算量较大,考虑到移动端等场景可用的计算资源较少,选择使用另一个近似函数,公式如下:
综上,在两层堆叠的BPCLSTM网络之后我们加入了一个MobileNet v3的基础网络模块来减小网络的规模,之后为防止过拟合又加入了dropout层,然后由全连接层整合提取的特征,最后通过softmax函数得到分类的结果,基于注意力机制的BPCLSTM轻量级网络分类模型的结构见图5。
3.2划分数据集,生成训练集与测试集。我们采用十折交叉验证,该方法是常用的测试方法。将数据集分成十分,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。
3.3使用训练集对网络模型进行训练。将划分好的训练集分别输入构建好的网络模型中进行训练。
3.4使用测试集进行测试,此时的模型可以输入未知类别的多变量医疗数据流实现多分类。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围内。
Claims (9)
1.一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,包括以下步骤:
步骤1、采用辅助分类器生成对抗网络ACGAN生成不平衡的传感器医疗数据对应的签名矩阵;具体如下:
先收集多变量时间序列医疗传感数据,设收集到的数据中包括不平衡的多变量时间序列医疗传感数据,该不平衡的多变量时间序列医疗传感数据的类别一共有k种,这k个类别进行一位有效编码,得到不平衡的多变量时间序列医疗传感数据所对应的签名矩阵的类别的一位有效编码张量C;随后将收集到的不同类别的不平衡的多变量时间序列医疗传感数据转换成签名矩阵,从而得到不平衡的多变量时间序列医疗传感数据对应的签名矩阵的集合M={M1,M2,…,Mk},其中Mi是第i种类别的不平衡时间序列数据的签名矩阵集合,是属于第i种类别的第q个签名矩阵,q=1,2…j,j是第i种类别签名矩阵的个数;
ACGAN的生成器的输入包含了两个部分,一个是不平衡的多变量时间序列医疗传感数据所对应的签名矩阵的类别的一位有效编码张量C,另一个是满足高斯分布的随机噪声Z,然后再对这两个部分进行拼接操作,最后生成器输出的是与不平衡多变量时间序列医疗传感数据类别一致的签名矩阵集合Mg;ACGAN的判别器的输入为收集到的不平衡的医疗多变量时间序列数据所生成的签名矩阵的集合M,ACGAN的判别器用于对收集到的M进行真假的判断,并进行签名矩阵的分类;其中,真假的判断的损失函数LS表示为公式(1),分类的损失函数LC表示为公式(2);
其中,表示生成器生成的签名矩阵集合Mg中第i种类别的第qfake个签名矩阵,qfake为大于0的整数,c表示第i种类别对应的一位有效编码张量,S表示数据来源的类别,该数据分为不平衡的多变量时间序列医疗传感数据对应的签名矩阵real和生成器生成的签名矩阵fake,E[]表示取括号内的数学期望,P()指计算括号内概率值;
ACGAN中判别器D的目标函数是最大化LS+LC,生成器G的目标函数是最大化LC-LS;D和G交替训练,二者相互博弈,D的目标是区分出收集得到的不平衡类别的签名矩阵与生成器生成的签名矩阵G的目的是让D将生成器G生成的签名矩阵判定为收集得到的不平衡类别的签名矩阵;总体上,ACGAN的目的是为了让生成的签名矩阵尽可能接近收集得到的不平衡类别的签名矩阵
记收集到的所有多变量时间序列医疗传感数据对应的签名矩阵集合为M',M'包括两部分,一部分是多变量时间序列医疗传感数据对应的签名矩阵集合,另一部分是不平衡的多变量时间序列医疗传感数据对应的签名矩阵的集合M;取签名矩阵集合Minput,Minput由M'与Mg共同组成,其中Mg为ACGAN的生成器的输出结果,Minput将作为步骤2中模型的输入;
步骤2:构建基于注意力机制的双向卷积长短期记忆网络BPCLSTM模型对输入的签名矩阵集合Minput进行分类。
2.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,步骤2中构建基于注意力机制的双向卷积长短期记忆网络BPCLSTM模型,具体如下:
BPCLSTM模型包括两层堆叠的BPCLSTM网络、一个MobileNet v3模块、dropout层,全连接层和softmax函数,向BPCLSTM模型中输入签名矩阵集合Minput,在BPCLSTM模型处理过程中,签名矩阵在每一层网络中被提取分类特征处理为特征图,将BPCLSTM网络输出得到的特征图H1送入MobileNet v3模块中进行进一步训练,将MobileNet v3模块输出的特征图H2分别经dropout层,全连接层和softmax函数进行处理分类。
3.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,所述M为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
4.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,所述为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
5.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,所述为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
6.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,所述为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
7.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,所述Mg为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
8.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,所述M'为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
9.根据权利要求1所述的一种可用于多变量时间序列医疗传感数据流的分类方法,其特征在于,所述Minput为签名矩阵Mt或是由Mt构成的集合,签名矩阵Mt为n×n的签名矩阵,其中,n为签名矩阵的尺寸,签名矩阵的尺寸n由多变量时间序列医疗传感数据流内包含的单元时间序列的数量决定;Mt中的元素获得方式如下:
具体来说,给定一个多变量时间序列医疗传感数据流片段的集合Xω中的两段时间序列数据:和 分别表示同一段时间长度ω内多变量时间序列医疗传感数据流中的某两种不同医疗传感器收集到的时间序列数据,和分别表示两种时间序列数据在时刻t之前δ时长的数据,δ表示t之后的时间偏移量,与之间的相关性的计算公式如下所示:
其中,κ是一个重新调节因子,κ=ω,t表示时间序列中的某一时刻。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011267085.1A CN112270996B (zh) | 2020-11-13 | 2020-11-13 | 一种可用于多变量医疗传感数据流的分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011267085.1A CN112270996B (zh) | 2020-11-13 | 2020-11-13 | 一种可用于多变量医疗传感数据流的分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112270996A CN112270996A (zh) | 2021-01-26 |
CN112270996B true CN112270996B (zh) | 2023-04-25 |
Family
ID=74340538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011267085.1A Active CN112270996B (zh) | 2020-11-13 | 2020-11-13 | 一种可用于多变量医疗传感数据流的分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112270996B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379593B (zh) * | 2021-06-25 | 2022-04-19 | 深圳市安软科技股份有限公司 | 一种图像生成方法、系统及相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108182259A (zh) * | 2018-01-03 | 2018-06-19 | 华南理工大学 | 一种基于深度长短期记忆神经网络对多变量时间序列分类的方法 |
CN109784401A (zh) * | 2019-01-15 | 2019-05-21 | 西安电子科技大学 | 一种基于acgan的极化sar图像分类方法 |
CN110378044A (zh) * | 2019-07-23 | 2019-10-25 | 燕山大学 | 基于注意力机制的多时间尺度卷积神经网络软测量方法 |
CN111027439A (zh) * | 2019-12-03 | 2020-04-17 | 西北工业大学 | 基于辅助分类生成对抗网络的sar目标识别方法 |
US10810508B1 (en) * | 2016-03-22 | 2020-10-20 | EMC IP Holding Company LLC | Methods and apparatus for classifying and discovering historical and future operational states based on Boolean and numerical sensor data |
CN111860406A (zh) * | 2020-07-29 | 2020-10-30 | 福州大学 | 基于区域混淆机制神经网络的血细胞显微图像分类方法 |
-
2020
- 2020-11-13 CN CN202011267085.1A patent/CN112270996B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10810508B1 (en) * | 2016-03-22 | 2020-10-20 | EMC IP Holding Company LLC | Methods and apparatus for classifying and discovering historical and future operational states based on Boolean and numerical sensor data |
CN108182259A (zh) * | 2018-01-03 | 2018-06-19 | 华南理工大学 | 一种基于深度长短期记忆神经网络对多变量时间序列分类的方法 |
CN109784401A (zh) * | 2019-01-15 | 2019-05-21 | 西安电子科技大学 | 一种基于acgan的极化sar图像分类方法 |
CN110378044A (zh) * | 2019-07-23 | 2019-10-25 | 燕山大学 | 基于注意力机制的多时间尺度卷积神经网络软测量方法 |
CN111027439A (zh) * | 2019-12-03 | 2020-04-17 | 西北工业大学 | 基于辅助分类生成对抗网络的sar目标识别方法 |
CN111860406A (zh) * | 2020-07-29 | 2020-10-30 | 福州大学 | 基于区域混淆机制神经网络的血细胞显微图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112270996A (zh) | 2021-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Shallow convolutional neural networks for human activity recognition using wearable sensors | |
CN107730474B (zh) | 图像处理方法、处理装置和处理设备 | |
Edel et al. | Binarized-blstm-rnn based human activity recognition | |
Xu et al. | Adaptive feature projection with distribution alignment for deep incomplete multi-view clustering | |
CN113191215A (zh) | 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法 | |
CN110138595A (zh) | 动态加权网络的时间链路预测方法、装置、设备及介质 | |
CN111046961B (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN112233798B (zh) | 基于病理模式与注意力机制的可解释疾病风险分析系统 | |
Kowal | Fast, optimal, and targeted predictions using parameterized decision analysis | |
CN113128459B (zh) | 一种基于多层次脑电信号表达下的特征融合方法 | |
Tonekaboni et al. | Decoupling local and global representations of time series | |
CN116522265A (zh) | 工业互联网时序数据异常检测方法及装置 | |
CN115759461A (zh) | 一种面向物联网的多元时间序列预测方法及系统 | |
Zhou et al. | A hybrid attention-based deep neural network for simultaneous multi-sensor pruning and human activity recognition | |
CN115348182A (zh) | 一种基于深度堆栈自编码器的长期频谱预测方法 | |
CN111798980A (zh) | 基于深度学习网络的复杂医学生物信号处理方法和装置 | |
CN112270996B (zh) | 一种可用于多变量医疗传感数据流的分类方法 | |
CN118094427A (zh) | 基于动态图注意力的物联网时序数据异常检测方法及系统 | |
CN117892915A (zh) | 基于核算单位的商品碳标签生成方法及系统 | |
CN118315022A (zh) | 儿童早期康复训练智能管理系统及方法 | |
Wu et al. | Topological machine learning for multivariate time series | |
CN114021011A (zh) | 一种基于自注意力机制的下一个兴趣点推荐方法 | |
Hayajneh et al. | TinyML Empowered Transfer Learning on the Edge | |
CN116189800B (zh) | 基于气体检测的模式识别方法、装置、设备及存储介质 | |
Zhou et al. | A novel neural network for improved in-hospital mortality prediction with irregular and incomplete multivariate data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |