CN110647891B - 基于cnn和自编码器时序数据特征自动提取方法及系统 - Google Patents

基于cnn和自编码器时序数据特征自动提取方法及系统 Download PDF

Info

Publication number
CN110647891B
CN110647891B CN201910877495.9A CN201910877495A CN110647891B CN 110647891 B CN110647891 B CN 110647891B CN 201910877495 A CN201910877495 A CN 201910877495A CN 110647891 B CN110647891 B CN 110647891B
Authority
CN
China
Prior art keywords
data
time sequence
model
stage
cnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910877495.9A
Other languages
English (en)
Other versions
CN110647891A (zh
Inventor
刘建志
高冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inesa R&d Center
Original Assignee
Inesa R&d Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inesa R&d Center filed Critical Inesa R&d Center
Priority to CN201910877495.9A priority Critical patent/CN110647891B/zh
Publication of CN110647891A publication Critical patent/CN110647891A/zh
Application granted granted Critical
Publication of CN110647891B publication Critical patent/CN110647891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于CNN和自编码器时序数据特征自动提取方法及系统,方法包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,数据准备阶段是对获取原始数据进行预处理,数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,模型使用阶段则是针对时序数据,利用训练好的模型来提取特征。本发明在保留原始表征的前提下,将时序数据图像化,达到高质量的自动提取时序数据特征的效果,应用领域广泛。

Description

基于CNN和自编码器时序数据特征自动提取方法及系统
技术领域
本发明属于时序数据、特征提取、时序数据图像化、自编码器领域,具体涉及一种基于CNN和自编码器时序数据特征自动提取方法及系统。
背景技术
随着深度学习和神经网络的发展,时序数据的分析处理也越来越受到人们的关注,应用领域诸如气象、医疗、交通、水务等。一些典型的分析处理如时序数据的预测、行为模式的提取等等都需要对原始时序数据提取出高质量的特征。传统的特征提取工程一般是在时域和频域进行一些统计特征的提取,需要大量的先验知识和技巧,而且无法保证特征的质量,需要对特征进一步的分析和筛选。行为模式提取等任务则会更关注时序数据的形状、变化趋势等性质,相关的专利比如CN109711277A、CN103052964A等等,现有的一些进行域转换的自动特征提取方式不能很好地保持这些表征,往往在转换过程中丢失或者弱化这些重要的形状、趋势等,因此亟待提出一种新的高质量的自动特征提取方法。
发明内容
有鉴于此,本发明的目的是提供一种基于CNN和自编码器时序数据特征自动提取方法及系统,能够在尽可能的保留原始表征的同时,实现更高质量的时序特征自动提取。以解决现有技术中的不足。
为了达到上述目的,本发明的目的是通过下述技术方案实现的:
一方面,提供一种基于CNN和自编码器时序数据特征自动提取方法,其中,包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,所述数据准备阶段是对获取原始数据进行预处理,所述数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,所述模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,所述模型使用阶段则是针对时序数据,利用训练好的模型来提取特征。
上述基于CNN和自编码器时序数据特征自动提取方法,其中,包括如下步骤:
S1.数据准备阶段
获取时序数据,并进行预处理,得到数据集合{XIi}(i∈1,2...m),其中XIi∈Rk为k维向量;
S2.数据图像化阶段
将k维向量转换为二维灰度图像,当k值偏大时,采用至少两次降维的方法,一次降维首先利用分段聚合近似(Piecewise Aggregate Approximation,PAA)将k维向量转换成k1维向量,得到{Xi}∈(i∈1,2...m),其中Xi∈Rk为k1维向量,k1<k;
将得到的数据集合进行Min-Max归一化,使得所有元素的取值在0-1之间;
将k1维的向量Xi转换成的灰度图Mi∈Rk1*k1,其中:
Figure BDA0002204782800000021
ceil()表示取上整数界;
当k1值仍然偏大时,继续降维,二次降维对上面生成的灰度图进行操作,将图像Mi等比例缩放成Ni∈Rk2*k2,得到转换后的数据集合{Ni}(i∈1,2...m),其中k2<k1;
S3.模型训练阶段
基于CNN的自编码器模型包括输入层、编码层、解码层和输出层,输入层的输入N为上面构造的数据集合{Ni};
编码层进行下采样和特征提取,得到特征Feature;
解码层通过反卷积,将Feature还原为输入N;
S4.模型使用阶段
假设需要进行特征提取的时序数据为G∈Rk,为k维向量,通过上面提到的方法将时序数据G转换为二维图像NG∈Rk2*k2,然后将NG通过上面的训练的模型,将编码层的输出Feature作为最后提取的特征。
上述基于CNN和自编码器时序数据特征自动提取方法,其中,模型训练过程中输出Y还原输入N,损失函数定义为F(Y,N),损失函数包括MSE。
另一方面,提供一种基于CNN和自编码器时序数据特征自动提取系统,其中,包括数据准备模块、数据图像化模块、模型训练模块和模型使用模块,基于如上述任意一项所述方法实现特征提取。
本发明技术方案的有益效果是:
在保留原始表征的前提下,将时序数据图像化,达到高质量的自动提取时序数据特征的效果,应用领域广泛。
附图说明
图1为本发明时序数据特征自动提取方法流程示意图;
图2为本发明自编码模型的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
参看图1所示,本发明基于CNN和自编码器时序数据特征自动提取方法包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,数据准备阶段是对获取原始数据进行预处理,包括数据异常值处理、缺失值填补等操作。数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,模型使用阶段则是针对时序数据,利用训练好的模型来提取特征。
本方法具体包括如下步骤:
S1.数据准备阶段
获取时序数据,并进行预处理,得到数据集合{XIi}(i∈1,2...m),其中
Figure BDA0002204782800000031
为k维向量;
S2.数据图像化阶段
将k维向量转换为二维灰度图像,当k值偏大时,为了减少生成图像的大小,加快后续模型提取特征的速度,采用至少两次降维的方法,一次降维首先利用分段聚合近似将k维向量转换成k1维向量,得到{Xi}(i∈1,2...m),其中Xi∈Rk1为k1维向量,k1<k;
将得到的数据集合进行Min-Max归一化,使得所有元素的取值在0-1之间;
将k1维的向量Xi转换成的灰度图Mi∈Rk1*k1,其中:
Figure BDA0002204782800000032
ceil()表示取上整数界;
当k1值仍然偏大时,继续降维,二次降维对上面生成的灰度图进行操作,将图像Mi等比例缩放成Ni∈Rk2*k2,得到转换后的数据集合{Ni}(i∈1,2...m),其中k2<k1;
S3.模型训练阶段
参看图2所示,基于CNN的自编码器模型包括输入层1、编码层2、解码层3和输出层4,输入层1的输入N为上面构造的数据集合{Ni};
编码层2通过卷积和池化等操作进行下采样和特征提取,得到特征Feature;
解码层3通过反卷积,将Feature还原为输入N;
S4.模型使用阶段
假设需要进行特征提取的时序数据为G∈Rk,为k维向量,通过上面提到的方法将时序数据G转换为二维图像NG∈Rk2*k2,然后将NG通过上面的训练的模型,将编码层的输出Feature作为最后提取的特征。
模型训练过程中同时使用编码层2和解码层3,而在使用模型进行特征提取的时候,不使用解码层3。
模型训练过程中输出Y还原输入N,损失函数定义为F(Y,N),其中典型的损失函数为MSE(Mean Squared Error)。
本发明还提供一种基于CNN和自编码器时序数据特征自动提取系统,包括数据准备模块、数据图像化模块、模型训练模块和模型使用模块,基于如上述任意一项方法实现特征提取。
本发明技术方案的有益效果是:
在保留原始表征的前提下,将时序数据图像化,达到高质量的自动提取时序数据特征的效果,应用领域广泛。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (3)

1.一种基于CNN和自编码器时序数据特征自动提取方法,其特征在于,包括数据准备阶段、数据图像化阶段、模型训练阶段和模型使用阶段,所述数据准备阶段是对获取原始数据进行预处理,所述数据图像化阶段是将预处理的时序数据转换为二维图像数据,图像化的过程中保留时序数据的原始表征,所述模型训练阶段是构建基于CNN的自编器模型,利用生成的图像数据进行模型训练,所述模型使用阶段则是针对时序数据,利用训练好的模型来提取特征,包括如下步骤:
S1.数据准备阶段
获取时序数据,并进行预处理,得到数据集合{XIi}(i∈1,2...m},其中XIi∈Rk为k维向量;
S2.数据图像化阶段
将k维向量转换为二维灰度图像,当k值偏大时,采用至少两次降维的方法,一次降维首先利用分段聚合近似将k维向量转换成k1维向量,得到{Xi}(i∈1,2...m),其中
Figure FDA0003910224000000012
为k1维向量,k1<k;
将得到的数据集合进行Min-Max归一化,使得所有元素的取值在0-1之间;
将k1维的向量Xi转换成的灰度图Mi∈Rk1*k1,其中:
Figure FDA0003910224000000011
ceil()表示取上整数界;
当k1值仍然偏大时,继续降维,二次降维对上面生成的灰度图进行操作,将图像Mi等比例缩放成Ni∈Rk2*k2,得到转换后的数据集合{Ni}(i∈1,2...m),其中k2<k1;
S3.模型训练阶段
基于CNN的自编码器模型包括输入层、编码层、解码层和输出层,输入层的输入N为上面构造的数据集合[Ni];
编码层进行下采样和特征提取,得到特征Feature;
解码层通过反卷积,将Feature还原为输入N;
S4.模型使用阶段
假设需要进行特征提取的时序数据为G∈Rk,为k维向量,通过上面提到的方法将时序数据G转换为二维图像NG∈Rk2*k2,然后将NG通过上面的训练的模型,将编码层的输出Feature作为最后提取的特征。
2.如权利要求1所述基于CNN和自编码器时序数据特征自动提取方法,其特征在于,模型训练过程中输出Y还原输入N,损失函数定义为F(Y,N),损失函数包括MSE。
3.一种基于CNN和自编码器时序数据特征自动提取系统,其特征在于,包括数据准备模块、数据图像化模块、模型训练模块和模型使用模块,基于如上述权利要求1或2中任意一项所述方法实现特征提取。
CN201910877495.9A 2019-09-17 2019-09-17 基于cnn和自编码器时序数据特征自动提取方法及系统 Active CN110647891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910877495.9A CN110647891B (zh) 2019-09-17 2019-09-17 基于cnn和自编码器时序数据特征自动提取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910877495.9A CN110647891B (zh) 2019-09-17 2019-09-17 基于cnn和自编码器时序数据特征自动提取方法及系统

Publications (2)

Publication Number Publication Date
CN110647891A CN110647891A (zh) 2020-01-03
CN110647891B true CN110647891B (zh) 2023-01-24

Family

ID=69010589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910877495.9A Active CN110647891B (zh) 2019-09-17 2019-09-17 基于cnn和自编码器时序数据特征自动提取方法及系统

Country Status (1)

Country Link
CN (1) CN110647891B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931819A (zh) * 2020-07-13 2020-11-13 江苏大学 一种基于深度学习的机器故障的预测和分类方法
CN113011557B (zh) * 2021-02-22 2021-09-21 山东航空股份有限公司 基于卷积神经网络的飞机不稳定进近判断方法及系统
CN113468820A (zh) * 2021-07-21 2021-10-01 上海眼控科技股份有限公司 数据训练方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018209932A1 (zh) * 2017-05-17 2018-11-22 清华大学 多量化深度二值特征学习方法及装置
CN109490861A (zh) * 2018-10-29 2019-03-19 北京科技大学 一种高炉料线提取方法
CN109829495A (zh) * 2019-01-29 2019-05-31 南京信息工程大学 基于lstm和dcgan的时序性图像预测方法
CN110163815A (zh) * 2019-04-22 2019-08-23 桂林电子科技大学 基于多阶段变分自编码器的低照度还原方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718744B (zh) * 2016-01-25 2018-05-29 深圳大学 一种基于深度学习的代谢质谱筛查方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018209932A1 (zh) * 2017-05-17 2018-11-22 清华大学 多量化深度二值特征学习方法及装置
CN109490861A (zh) * 2018-10-29 2019-03-19 北京科技大学 一种高炉料线提取方法
CN109829495A (zh) * 2019-01-29 2019-05-31 南京信息工程大学 基于lstm和dcgan的时序性图像预测方法
CN110163815A (zh) * 2019-04-22 2019-08-23 桂林电子科技大学 基于多阶段变分自编码器的低照度还原方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于自动编码器和神经网络的人体运动识别;司阳等;《国外电子测量技术》;20180115(第01期);全文 *

Also Published As

Publication number Publication date
CN110647891A (zh) 2020-01-03

Similar Documents

Publication Publication Date Title
CN110647891B (zh) 基于cnn和自编码器时序数据特征自动提取方法及系统
CN110782399B (zh) 一种基于多任务cnn的图像去模糊方法
CN110163815B (zh) 基于多阶段变分自编码器的低照度还原方法
WO2022267641A1 (zh) 一种基于循环生成对抗网络的图像去雾方法及系统
CN111612711B (zh) 一种基于生成对抗网络改进的图片去模糊方法
CN102156875B (zh) 基于多任务ksvd字典学习的图像超分辨率重构方法
CN110738605A (zh) 基于迁移学习的图像去噪方法、系统、设备及介质
CN110070091B (zh) 用于街景理解的基于动态插值重建的语义分割方法及系统
CN107680077A (zh) 一种基于多阶梯度特征的无参考图像质量评价方法
CN110930327B (zh) 基于级联深度残差网络的视频去噪方法
CN108537133A (zh) 一种基于监督学习深度自编码器的人脸重构方法
CN111080591A (zh) 基于编码解码结构结合残差模块的医学图像分割方法
CN112598602A (zh) 一种基于掩码的深度学习视频去摩尔纹方法
CN110111272A (zh) 一种人工智能红外图像处理仪、控制系统及控制方法
CN112991199A (zh) 一种基于残差密集网络的图像高低频分解噪声去除方法
CN108492252A (zh) 基于二次重建的人脸图像超分辨率重建方法
CN107133915A (zh) 一种基于学习的图像超分辨率重构方法
Liu et al. Facial image inpainting using multi-level generative network
CN117274059A (zh) 基于图像编码-解码的低分辨率图像重构方法及其系统
CN114529482A (zh) 基于小波多通道深度网络的图像压缩感知重建方法
CN112802160B (zh) 一种基于u-gat-it改进的秦腔角色卡通化风格迁移的方法
Bera et al. A lightweight convolutional neural network for image denoising with fine details preservation capability
Li et al. An enhanced image denoising method using method noise
Yao et al. A Deep Image Denoising Method at Transmit Electricity Surveillance Environment
Hilles Spatial Frequency Filtering Using Sofm For Image Compression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant