CN110647891A - 基于cnn和自编码器时序数据特征自动提取方法及系统 - Google Patents
基于cnn和自编码器时序数据特征自动提取方法及系统 Download PDFInfo
- Publication number
- CN110647891A CN110647891A CN201910877495.9A CN201910877495A CN110647891A CN 110647891 A CN110647891 A CN 110647891A CN 201910877495 A CN201910877495 A CN 201910877495A CN 110647891 A CN110647891 A CN 110647891A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- time sequence
- stage
- cnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于CNN和自编码器时序数据特征自动提取方法及系统,方法包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,数据准备阶段是对获取原始数据进行预处理,数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,模型使用阶段则是针对时序数据,利用训练好的模型来提取特征。本发明在保留原始表征的前提下,将时序数据图像化,达到高质量的自动提取时序数据特征的效果,应用领域广泛。
Description
技术领域
本发明属于时序数据、特征提取、时序数据图像化、自编码器领域,具体涉及一种基于CNN和自编码器时序数据特征自动提取方法及系统。
背景技术
随着深度学习和神经网络的发展,时序数据的分析处理也越来越受到人们的关注,应用领域诸如气象、医疗、交通、水务等。一些典型的分析处理如时序数据的预测、行为模式的提取等等都需要对原始时序数据提取出高质量的特征。传统的特征提取工程一般是在时域和频域进行一些统计特征的提取,需要大量的先验知识和技巧,而且无法保证特征的质量,需要对特征进一步的分析和筛选。行为模式提取等任务则会更关注时序数据的形状、变化趋势等性质,相关的专利比如CN109711277A、CN103052964A等等,现有的一些进行域转换的自动特征提取方式不能很好地保持这些表征,往往在转换过程中丢失或者弱化这些重要的形状、趋势等,因此亟待提出一种新的高质量的自动特征提取方法。
发明内容
有鉴于此,本发明的目的是提供一种基于CNN和自编码器时序数据特征自动提取方法及系统,能够在尽可能的保留原始表征的同时,实现更高质量的时序特征自动提取。以解决现有技术中的不足。
为了达到上述目的,本发明的目的是通过下述技术方案实现的:
一方面,提供一种基于CNN和自编码器时序数据特征自动提取方法,其中,包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,所述数据准备阶段是对获取原始数据进行预处理,所述数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,所述模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,所述模型使用阶段则是针对时序数据,利用训练好的模型来提取特征。
上述基于CNN和自编码器时序数据特征自动提取方法,其中,包括如下步骤:
S1.数据准备阶段
获取时序数据,并进行预处理,得到数据集合{XIi}(i∈1,2...m),其中XIi∈Rk为k维向量;
S2.数据图像化阶段
将k维向量转换为二维灰度图像,当k值偏大时,采用至少两次降维的方法,一次降维首先利用分段聚合近似(Piecewise Aggregate Approximation,PAA)将k维向量转换成k1维向量,得到{Xi}∈(i∈1,2...m),其中Xi∈Rk为k1维向量,k1<k;
将得到的数据集合进行Min-Max归一化,使得所有元素的取值在0-1之间;
将k1维的向量Xi转换成的灰度图Mi∈Rk1*k1,其中:
ceil()表示取上整数界;
当k1值仍然偏大时,继续降维,二次降维对上面生成的灰度图进行操作,将图像Mi等比例缩放成Ni∈Rk2*k2,得到转换后的数据集合{Ni}(i∈1,2...m),其中k2<k1;
S3.模型训练阶段
基于CNN的自编码器模型包括输入层、编码层、解码层和输出层,输入层的输入N为上面构造的数据集合{Ni};
编码层进行下采样和特征提取,得到特征Feature;
解码层通过反卷积,将Feature还原为输入N;
S4.模型使用阶段
假设需要进行特征提取的时序数据为G∈Rk,为k维向量,通过上面提到的方法将时序数据G转换为二维图像NG∈Rk2*k2,然后将NG通过上面的训练的模型,将编码层的输出Feature作为最后提取的特征。
上述基于CNN和自编码器时序数据特征自动提取方法,其中,模型训练过程中输出Y还原输入N,损失函数定义为F(Y,N),损失函数包括MSE。
另一方面,提供一种基于CNN和自编码器时序数据特征自动提取系统,其中,包括数据准备模块、数据图像化模块、模型训练模块和模型使用模块,基于如上述任意一项所述方法实现特征提取。
本发明技术方案的有益效果是:
在保留原始表征的前提下,将时序数据图像化,达到高质量的自动提取时序数据特征的效果,应用领域广泛。
附图说明
图1为本发明时序数据特征自动提取方法流程示意图;
图2为本发明自编码模型的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
参看图1所示,本发明基于CNN和自编码器时序数据特征自动提取方法包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,数据准备阶段是对获取原始数据进行预处理,包括数据异常值处理、缺失值填补等操作。数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,模型使用阶段则是针对时序数据,利用训练好的模型来提取特征。
本方法具体包括如下步骤:
S1.数据准备阶段
S2.数据图像化阶段
将k维向量转换为二维灰度图像,当k值偏大时,为了减少生成图像的大小,加快后续模型提取特征的速度,采用至少两次降维的方法,一次降维首先利用分段聚合近似将k维向量转换成k1维向量,得到{Xi}(i∈1,2...m),其中Xi∈Rk1为k1维向量,k1<k;
将得到的数据集合进行Min-Max归一化,使得所有元素的取值在0-1之间;
将k1维的向量Xi转换成的灰度图Mi∈Rk1*k1,其中:
ceil()表示取上整数界;
当k1值仍然偏大时,继续降维,二次降维对上面生成的灰度图进行操作,将图像Mi等比例缩放成Ni∈Rk2*k2,得到转换后的数据集合{Ni}(i∈1,2...m),其中k2<k1;
S3.模型训练阶段
参看图2所示,基于CNN的自编码器模型包括输入层1、编码层2、解码层3和输出层4,输入层1的输入N为上面构造的数据集合{Ni};
编码层2通过卷积和池化等操作进行下采样和特征提取,得到特征Feature;
解码层3通过反卷积,将Feature还原为输入N;
S4.模型使用阶段
假设需要进行特征提取的时序数据为G∈Rk,为k维向量,通过上面提到的方法将时序数据G转换为二维图像NG∈Rk2*k2,然后将NG通过上面的训练的模型,将编码层的输出Feature作为最后提取的特征。
模型训练过程中同时使用编码层2和解码层3,而在使用模型进行特征提取的时候,不使用解码层3。
模型训练过程中输出Y还原输入N,损失函数定义为F(Y,N),其中典型的损失函数为MSE(Mean Squared Error)。
本发明还提供一种基于CNN和自编码器时序数据特征自动提取系统,包括数据准备模块、数据图像化模块、模型训练模块和模型使用模块,基于如上述任意一项方法实现特征提取。
本发明技术方案的有益效果是:
在保留原始表征的前提下,将时序数据图像化,达到高质量的自动提取时序数据特征的效果,应用领域广泛。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (4)
1.一种基于CNN和自编码器时序数据特征自动提取方法,其特征在于,包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,所述数据准备阶段是对获取原始数据进行预处理,所述数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,所述模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,所述模型使用阶段则是针对时序数据,利用训练好的模型来提取特征。
2.如权利要求1所述基于CNN和自编码器时序数据特征自动提取方法,其特征在于,包括如下步骤:
S1.数据准备阶段
获取时序数据,并进行预处理,得到数据集合{XIi}(i∈1,2...m),其中XIi∈Rk为k维向量;
S2.数据图像化阶段
将k维向量转换为二维灰度图像,当k值偏大时,采用至少两次降维的方法,一次降维首先利用分段聚合近似将k维向量转换成k1维向量,得到{Xi}(i∈1,2...m),其中Xi∈Rk1为k1维向量,k1<k;
将得到的数据集合进行Min-Max归一化,使得所有元素的取值在0-1之间;
将k1维的向量Xi转换成的灰度图Mi∈Rk1*k1,其中:
ceil()表示取上整数界;
当k1值仍然偏大时,继续降维,二次降维对上面生成的灰度图进行操作,将图像Mi等比例缩放成Ni∈Rk2*k2,得到转换后的数据集合{Ni}(i∈1,2...m),其中k2<k1;
S3.模型训练阶段
基于CNN的自编码器模型包括输入层、编码层、解码层和输出层,输入层的输入N为上面构造的数据集合{Ni};
编码层进行下采样和特征提取,得到特征Feature;
解码层通过反卷积,将Feature还原为输入N;
S4.模型使用阶段
假设需要进行特征提取的时序数据为G∈Rk,为k维向量,通过上面提到的方法将时序数据G转换为二维图像NG∈Rk2*k2,然后将NG通过上面的训练的模型,将编码层的输出Feature作为最后提取的特征。
3.如权利要求2所述基于CNN和自编码器时序数据特征自动提取方法,其特征在于,模型训练过程中输出Y还原输入N,损失函数定义为F(Y,N),损失函数包括MSE。
4.一种基于CNN和自编码器时序数据特征自动提取系统,其特征在于,包括数据准备模块、数据图像化模块、模型训练模块和模型使用模块,基于如上述权利要求1至3中任意一项所述方法实现特征提取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910877495.9A CN110647891B (zh) | 2019-09-17 | 2019-09-17 | 基于cnn和自编码器时序数据特征自动提取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910877495.9A CN110647891B (zh) | 2019-09-17 | 2019-09-17 | 基于cnn和自编码器时序数据特征自动提取方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110647891A true CN110647891A (zh) | 2020-01-03 |
CN110647891B CN110647891B (zh) | 2023-01-24 |
Family
ID=69010589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910877495.9A Active CN110647891B (zh) | 2019-09-17 | 2019-09-17 | 基于cnn和自编码器时序数据特征自动提取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110647891B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931819A (zh) * | 2020-07-13 | 2020-11-13 | 江苏大学 | 一种基于深度学习的机器故障的预测和分类方法 |
CN113011557A (zh) * | 2021-02-22 | 2021-06-22 | 山东航空股份有限公司 | 基于卷积神经网络的飞机不稳定进近判断方法及系统 |
CN113468820A (zh) * | 2021-07-21 | 2021-10-01 | 上海眼控科技股份有限公司 | 数据训练方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170213000A1 (en) * | 2016-01-25 | 2017-07-27 | Shenzhen University | Metabolic mass spectrometry screening method for diseases based on deep learning and the system thereof |
WO2018209932A1 (zh) * | 2017-05-17 | 2018-11-22 | 清华大学 | 多量化深度二值特征学习方法及装置 |
CN109490861A (zh) * | 2018-10-29 | 2019-03-19 | 北京科技大学 | 一种高炉料线提取方法 |
CN109829495A (zh) * | 2019-01-29 | 2019-05-31 | 南京信息工程大学 | 基于lstm和dcgan的时序性图像预测方法 |
CN110163815A (zh) * | 2019-04-22 | 2019-08-23 | 桂林电子科技大学 | 基于多阶段变分自编码器的低照度还原方法 |
-
2019
- 2019-09-17 CN CN201910877495.9A patent/CN110647891B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170213000A1 (en) * | 2016-01-25 | 2017-07-27 | Shenzhen University | Metabolic mass spectrometry screening method for diseases based on deep learning and the system thereof |
WO2018209932A1 (zh) * | 2017-05-17 | 2018-11-22 | 清华大学 | 多量化深度二值特征学习方法及装置 |
CN109490861A (zh) * | 2018-10-29 | 2019-03-19 | 北京科技大学 | 一种高炉料线提取方法 |
CN109829495A (zh) * | 2019-01-29 | 2019-05-31 | 南京信息工程大学 | 基于lstm和dcgan的时序性图像预测方法 |
CN110163815A (zh) * | 2019-04-22 | 2019-08-23 | 桂林电子科技大学 | 基于多阶段变分自编码器的低照度还原方法 |
Non-Patent Citations (1)
Title |
---|
司阳等: "基于自动编码器和神经网络的人体运动识别", 《国外电子测量技术》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931819A (zh) * | 2020-07-13 | 2020-11-13 | 江苏大学 | 一种基于深度学习的机器故障的预测和分类方法 |
CN113011557A (zh) * | 2021-02-22 | 2021-06-22 | 山东航空股份有限公司 | 基于卷积神经网络的飞机不稳定进近判断方法及系统 |
CN113011557B (zh) * | 2021-02-22 | 2021-09-21 | 山东航空股份有限公司 | 基于卷积神经网络的飞机不稳定进近判断方法及系统 |
CN113468820A (zh) * | 2021-07-21 | 2021-10-01 | 上海眼控科技股份有限公司 | 数据训练方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110647891B (zh) | 2023-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110782399B (zh) | 一种基于多任务cnn的图像去模糊方法 | |
CN110647891B (zh) | 基于cnn和自编码器时序数据特征自动提取方法及系统 | |
CN110163815B (zh) | 基于多阶段变分自编码器的低照度还原方法 | |
CN110738605A (zh) | 基于迁移学习的图像去噪方法、系统、设备及介质 | |
CN107563965A (zh) | 基于卷积神经网络的jpeg压缩图像超分辨率重建方法 | |
CN110070091A (zh) | 用于街景理解的基于动态插值重建的语义分割方法及系统 | |
CN109191392B (zh) | 一种语义分割驱动的图像超分辨率重构方法 | |
CN111797891B (zh) | 基于生成对抗网络的非成对异质人脸图像生成方法、装置 | |
CN111080591A (zh) | 基于编码解码结构结合残差模块的医学图像分割方法 | |
CN102243711A (zh) | 一种基于邻域嵌套的图像超分辨率重建方法 | |
CN113379601A (zh) | 基于降质变分自编码器的真实世界图像超分辨方法及系统 | |
CN111696033B (zh) | 基于角点引导级联沙漏网络结构学习的真实图像超分辨率模型及方法 | |
CN110930327B (zh) | 基于级联深度残差网络的视频去噪方法 | |
CN117274059A (zh) | 基于图像编码-解码的低分辨率图像重构方法及其系统 | |
CN112001843A (zh) | 一种基于深度学习的红外图像超分辨率重建方法 | |
CN107292316A (zh) | 一种基于稀疏表示的提升图像清晰度的方法 | |
CN112950480A (zh) | 一种融合多感受野和密集残差注意的超分辨率重建方法 | |
CN108492252A (zh) | 基于二次重建的人脸图像超分辨率重建方法 | |
CN114202460A (zh) | 面对不同损伤图像的超分辨率高清重建方法和系统及设备 | |
Zhou et al. | Efficient Lightweight Image Denoising with Triple Attention Transformer | |
CN108805844A (zh) | 一种基于先验滤波的轻量化回归网络构建方法 | |
CN117237188A (zh) | 基于遥感图像的多尺度注意网络的显著性目标检测方法 | |
CN103632357B (zh) | 一种基于光照分离的图像超分辨率增强方法 | |
CN112381725A (zh) | 基于深度卷积对抗生成网络的图像修复方法及装置 | |
Huang et al. | A non-local enhanced network for image restoration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |