CN110489810A - 一种基于数据块的趋势自动提取方法 - Google Patents

一种基于数据块的趋势自动提取方法 Download PDF

Info

Publication number
CN110489810A
CN110489810A CN201910672987.4A CN201910672987A CN110489810A CN 110489810 A CN110489810 A CN 110489810A CN 201910672987 A CN201910672987 A CN 201910672987A CN 110489810 A CN110489810 A CN 110489810A
Authority
CN
China
Prior art keywords
data
trend
local
point
data block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910672987.4A
Other languages
English (en)
Other versions
CN110489810B (zh
Inventor
谢国
李锦妮
黑新宏
费蓉
姬文江
赵金伟
马维纲
李鑫
上官安琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinrun Lianhui Digital Technology Co ltd
Xi'an Huaqi Zhongxin Technology Development Co ltd
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN201910672987.4A priority Critical patent/CN110489810B/zh
Publication of CN110489810A publication Critical patent/CN110489810A/zh
Application granted granted Critical
Publication of CN110489810B publication Critical patent/CN110489810B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Train Traffic Observation, Control, And Security (AREA)
  • Complex Calculations (AREA)

Abstract

本发明的目的是提供一种基于数据块的趋势自动提取方法,首先采集某列车轴温数据作为原始数据,然后绘制原始数据曲线;然后寻找原始数据的最优分段值,提取出数据包络中心线,并寻找其局部极值点;最后根据得到的局部极值点将数据划分成数据块,在每个数据块内进行趋势提取分析,为后面进一步预测轴温变化、判断列车故障等问题提供理论基础。本发明解决了现有技术中存在的对采集到的数据先采用滤波平滑等数据处理方法后再提取趋势,处理后的数据结果会直接影响趋势结果,并且数据平滑程度难以确定,过度平滑时会导致数据特征丢失的问题。

Description

一种基于数据块的趋势自动提取方法
技术领域
本发明属于数据处理技术领域,具体涉及一种基于数据块的趋势自动提取方法。
背景技术
伴随着大数据的发展,数据处理与分析技术领域也在不断发展,数据的趋势代表了参数的变化状态,在已有海量数据的基础上通过数据趋势提取分析,可以为后面的行为做出指导与决策。在尊重原始数据的基础上如何对数据进行准确的趋势提取,成为了一个要解决的主要问题。直接从工业上采集到的数据受噪声的影响产生的波动大,难以直接提取趋势,若先对采集到的数据先采用滤波平滑等数据处理方法后再提取趋势,处理后的数据结果会直接影响趋势结果,并且数据平滑程度难以确定,当过度平滑时会导致数据特征丢失,故针对此问题,利用一种基于特征保持的方法对数据进行趋势提取,该方法采用寻找原始数据最优包络中心线的方法,在保持数据特征的同时使得数据更平滑,最终得到准确的提取趋势结果。
发明内容
本发明的目的是提供一种基于数据块的趋势自动提取方法,解决了现有技术中存在的对采集到的数据先采用滤波平滑等数据处理方法后再提取趋势,处理后的数据结果会直接影响趋势结果,并且数据平滑程度难以确定,过度平滑时会导致数据特征丢失的问题。
本发明所采用的技术方案是,一种基于数据块的趋势自动提取方法,具体按照以下步骤实施:
步骤1、采集某列车轴温数据作为原始数据,然后绘制原始数据曲线;
步骤2、寻找原始数据的最优分段值,提取出数据包络中心线,并寻找其局部极值点;
步骤3、根据步骤2得到的局部极值点将数据划分成数据块,在每个数据块内进行趋势提取分析,为后面进一步预测轴温变化、判断列车故障等问题提供理论基础。
本发明的特点还在于,
步骤1中原始数据data={x1,x2,...,xN|N∈N*},绘制原始数据data的曲线,其中,xN表示列车轴温,N表示时刻。
步骤2具体按照以下步骤实施:
步骤2.1、求取原始数据长度值的全部约数,除1以外,并按照从小到大顺序排列,得到排序后的约数序列D={d1,d2,...,d|ii∈N*},其中,di表示约数值,下标i表示数据点的个数;
步骤2.2、根据步骤2.1得到的序列D的第一个位置开始遍历,根据约数值将原始数据划分为等宽度的段,首先,每段取一个最高点,连接所有最高点得到原始数据的上包络线,然后,每段取一个最低点,连接所有最低点得到原始数据的下包络线,最后,对上下包络线求平均得到包络线的中心线;
步骤2.3、寻找步骤2.2中得到的包络中心线的局部极大值点,局部极大值满足的条件为(data(x)>data(x-1))&&(data(x)>=data(x+1)),并且记局部极大值为Xmax={xmaxn|1≤xmaxn≤xN,1≤n≤N},其中,xmaxn表示局部极大值,n表示极大值点对应的时刻;
步骤2.4、寻找步骤2.2中得到的包络中心线的局部极小值点,局部极小值满足的条件为(data(x)<data(x-1))&&(data(x)<=data(x+1)),并且记局部极小值为Xmin={xminm|1≤xminm≤xN,1≤m≤N},其中,xminm表示局部极小值,m表示极小值点对应的时刻;
步骤2.5、定义遍历终止条件:若xmaxn=xmaxn+1||xminm=xminm+1,则重复步骤2.2~步骤2.4,直到第一次出现无连续相同的局部极大值点和局部极小值点,其中,xmaxn+1表示xmaxn下一时刻的局部极大值,xminm+1表示xminm下一时刻的局部极小值;
步骤2.6、根据步骤2.5得到的约数值为最优分段值,此时得到了最优包络中心线及其局部极大值点和局部极小值点。
步骤3具体按照以下步骤实施:
步骤3.1、将数据的起点、局部极大值点、局部极小值点以及数据的终点按时刻从小到大的顺序合并为原始数据的特征点集合,每相邻两个特征点之间的数据划分成一个数据块;
步骤3.2、根据现有定义的三种线性趋势基元:上升、不变、下降,对每个数据块分块拟合,进行趋势提取,根据一元线性拟合的结果,如果斜率大于零则为上升趋势,斜率等于零为不变趋势,斜率小于零为下降趋势。
本发明的有益效果是,一种基于数据块的趋势自动提取方法,通过寻找原始数据最优包络中心线的方法,对变化复杂的数据,得到的包络线不同于信号处理中的包络线,需要将原数据分成等宽度的小段,宽度需要取原始数据长度的约数,每段取一个最高点,连接所有最高点得到原始数据的包络线。而不同分段值会影响趋势提取的结果,例如,当分段值过小时,会导致局部极值点的误判,得到了多个连续相同的局部极值大点或局部极小值点,影响后面的趋势分析结果准确性,因此就需要寻找最优分段值,使得到的最优包络中心线既能保持原有数据的特征,又能寻找出有效的局部极值点,最后将数据的起点、最优包络中心线的局部值点以及数据终点按顺序合并后的数据的特征点集合,根据每相邻两个特征点之间的数据划分成一个数据块,根据现有的定性线性趋势基元,对每个数据块的趋势进行提取。
附图说明
图1是本发明一种基于数据块的趋势自动提取方法的总体流程图;
图2是本发明一种基于数据块的趋势自动提取方法中的步骤1中原始曲线图,其中,数据data={x1,x2,...,xN|N∈N*}中选取的N=32000;
图3(a)是本发明一种基于数据块的趋势自动提取方法中的步骤(2.6)中最优包络中心线;
图3(b)是本发明一种基于数据块的趋势自动提取方法中的步骤(2.6)中局部极大值点和局部极小值点;
图4是本发明一种基于数据块的趋势自动提取方法中的步骤(1.5)中现有的定性线性趋势基元;
图5(a)是本发明一种基于数据块的趋势自动提取方法中的分段值为20时的中心包络线及其局部极值点;
图5(b)是本发明一种基于数据块的趋势自动提取方法中分段值为20时的中心包络线的局部放大图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
针对工业采集数据受噪声影响产生波动大的情况下,当先对采集到的数据先采用滤波平滑等数据处理方法后再提取趋势,处理后的数据结果会直接影响趋势结果,并且数据平滑程度难以确定,过度平滑时会导致数据特征丢失的问题,如何在尊重原始数据并保持数据特征的基础上准确提取数据趋势,为了解决该问题,建立一种基于数据块的趋势自动提取方法。
本发明一种基于数据块的趋势自动提取方法,流程图如图1所示,具体按照以下步骤实施:
步骤1、采集某列车轴温数据作为原始数据,然后绘制原始数据曲线,如图2所示;
步骤2、寻找原始数据的最优分段值,提取出数据包络中心线,并寻找其局部极值点;
步骤3、根据步骤2得到的局部极值点将数据划分成数据块,在每个数据块内进行趋势提取分析,为后面进一步预测轴温变化、判断列车故障等问题提供理论基础。
其中,步骤1中原始数据data={x1,x2,...,xN|N∈N*},绘制原始数据data的曲线,其中,xN表示列车轴温,N表示时刻。
步骤2具体按照以下步骤实施:
步骤2.1、求取原始数据长度值的全部约数,除1以外,并按照从小到大顺序排列,得到排序后的约数序列D={d1,d2,...,di|i∈N*},如表1所示,其中,di表示约数值,下标i表示数据点的个数;
表1排序后的约数序列
步骤2.2、根据步骤2.1得到的序列D的第一个位置开始遍历,根据约数值将原始数据划分为等宽度的段,首先,每段取一个最高点,连接所有最高点得到原始数据的上包络线,然后,每段取一个最低点,连接所有最低点得到原始数据的下包络线,最后,对上下包络线求平均得到包络线的中心线;
步骤2.3、寻找步骤2.2中得到的包络中心线的局部极大值点,局部极大值满足的条件为(data(x)>data(x-1))&&(data(x)>=data(x+1)),并且记局部极大值为Xmax={xmaxn|1≤xmaxn≤xN,1≤n≤N},其中,xmaxn表示局部极大值,n表示极大值点对应的时刻;
步骤2.4、寻找步骤2.2中得到的包络中心线的局部极小值点,局部极小值满足的条件为(data(x)<data(x-1))&&(data(x)<=data(x+1)),并且记局部极小值为Xmin={xminm|1≤xminm≤xN,1≤m≤N},其中,xminm表示局部极小值,m表示极小值点对应的时刻;
步骤2.5、定义遍历终止条件:若xmaxn=xmaxn+1||xminm=xminm+1,则重复步骤2.2~步骤2.4,直到第一次出现无连续相同的局部极大值点和局部极小值点,其中,xmaxn+1表示xmaxn下一时刻的局部极大值,xminm+1表示xminm下一时刻的局部极小值;
步骤2.6、根据步骤2.5得到的约数值为最优分段值,本次实验的最优分段值为100,此时得到了最优包络中心线及其局部极大值点和局部极小值点,如图3(a)、图3(b)所示。
步骤3具体按照以下步骤实施:
步骤3.1、将数据的起点、局部极大值点、局部极小值点以及数据的终点按时刻从小到大的顺序合并为原始数据的特征点集合,每相邻两个特征点之间的数据划分成一个数据块;
步骤3.2、根据现有定义的三种线性趋势基元:上升、不变、下降,对每个数据块分块拟合,进行趋势提取,根据一元线性拟合的结果,如果斜率大于零则为上升趋势,斜率等于零为不变趋势,斜率小于零为下降趋势,如图4所示。得到的极大值点为16个,极小值点为15个,因此,得到原始数据特征点个数为33,因此可划分为32个数据块,其中,奇数个数数据块为上升趋势,偶数个数数据块为下降趋势,通过对列车轴温数据进行趋势自动提取,可为后面进一步预测轴温变化、判断列车故障等问题提供理论基础。
针对如何在尊重原始数据并保持数据特征的基础上准确提取数据趋势,本发明,该方法通过寻找原始数据最优包络中心线的方法,基于特征保持的方法对数据进行趋势提取,在保持数据特征的同时使得数据更平滑,最终得到准确的提取趋势。
通过寻找原始数据最优包络中心线的方法,对变化复杂的数据,得到的包络线不同于信号处理中的包络线,需要将原数据分成等宽度的小段,宽度需要取原始数据长度的约数,每段取一个最高点,连接所有最高点得到原始数据的包络线。而不同分段值会影响趋势提取的结果,例如,当分段值过小时,会导致局部极值点的误判,得到了多个连续相同的局部极值大点或局部极小值点,如图5(a)和图5(b)所示,影响后面的趋势分析结果准确性,因此就需要寻找最优分段值,使得到的最优包络中心线既能保持原有数据的特征,又能寻找出有效的局部极值点,最后将数据的起点、最优包络中心线的局部值点以及数据终点按顺序合并后的数据的特征点集合,根据每相邻两个特征点之间的数据划分成一个数据块,根据现有的定性线性趋势基元,对每个数据块的趋势进行提取。

Claims (4)

1.一种基于数据块的趋势自动提取方法,其特征在于,具体按照以下步骤实施:
步骤1、采集某列车轴温数据作为原始数据,然后绘制原始数据曲线;
步骤2、寻找原始数据的最优分段值,提取出数据包络中心线,并寻找其局部极值点;
步骤3、根据步骤2得到的局部极值点将数据划分成数据块,在每个数据块内进行趋势提取分析,为后面进一步预测轴温变化、判断列车故障等问题提供理论基础。
2.根据权利要求1所述的一种基于数据块的趋势自动提取方法,其特征在于,所述步骤1中原始数据data={x1,x2,...,xN|N∈N*},绘制原始数据data的曲线,其中,xN表示列车轴温,N表示时刻。
3.根据权利要求2所述的一种基于数据块的趋势自动提取方法,其特征在于,所述步骤2具体按照以下步骤实施:
步骤2.1、求取原始数据长度值的全部约数,除1以外,并按照从小到大顺序排列,得到排序后的约数序列D={d1,d2,...,di|i∈N*},其中,di表示约数值,下标i表示数据点的个数;
步骤2.2、根据步骤2.1得到的序列D的第一个位置开始遍历,根据约数值将原始数据划分为等宽度的段,首先,每段取一个最高点,连接所有最高点得到原始数据的上包络线,然后,每段取一个最低点,连接所有最低点得到原始数据的下包络线,最后,对上下包络线求平均得到包络线的中心线;
步骤2.3、寻找步骤2.2中得到的包络中心线的局部极大值点,局部极大值满足的条件为(data(x)>data(x-1))&&(data(x)>=data(x+1)),并且记局部极大值为Xmax={xmaxn|1≤xmaxn≤xN,1≤n≤N},其中,xmaxn表示局部极大值,n表示极大值点对应的时刻;
步骤2.4、寻找步骤2.2中得到的包络中心线的局部极小值点,局部极小值满足的条件为(data(x)<data(x-1))&&(data(x)<=data(x+1)),并且记局部极小值为Xmin={xminm|1≤xminm≤xN,1≤m≤N},其中,xminm表示局部极小值,m表示极小值点对应的时刻;
步骤2.5、定义遍历终止条件:若xmaxn=xmaxn+1||xminm=xminm+1,则重复步骤2.2~步骤2.4,直到第一次出现无连续相同的局部极大值点和局部极小值点,其中,xmaxn+1表示xmaxn下一时刻的局部极大值,xminm+1表示xminm下一时刻的局部极小值;
步骤2.6、根据步骤2.5得到的约数值为最优分段值,本次实验的最优分段值为100,此时得到了最优包络中心线及其局部极大值点和局部极小值点。
4.根据权利要求3所述的一种基于数据块的趋势自动提取方法,其特征在于,所述步骤3具体按照以下步骤实施:
步骤3.1、将数据的起点、局部极大值点、局部极小值点以及数据的终点按时刻从小到大的顺序合并为原始数据的特征点集合,每相邻两个特征点之间的数据划分成一个数据块;
步骤3.2、根据现有定义的三种线性趋势基元:上升、不变、下降,对每个数据块分块拟合,进行趋势提取,根据一元线性拟合的结果,如果斜率大于零则为上升趋势,斜率等于零为不变趋势,斜率小于零为下降趋势。
CN201910672987.4A 2019-07-24 2019-07-24 一种基于数据块的趋势自动提取方法 Active CN110489810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910672987.4A CN110489810B (zh) 2019-07-24 2019-07-24 一种基于数据块的趋势自动提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910672987.4A CN110489810B (zh) 2019-07-24 2019-07-24 一种基于数据块的趋势自动提取方法

Publications (2)

Publication Number Publication Date
CN110489810A true CN110489810A (zh) 2019-11-22
CN110489810B CN110489810B (zh) 2022-11-25

Family

ID=68548203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910672987.4A Active CN110489810B (zh) 2019-07-24 2019-07-24 一种基于数据块的趋势自动提取方法

Country Status (1)

Country Link
CN (1) CN110489810B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765562A (zh) * 2021-01-15 2021-05-07 杭州安脉盛智能技术有限公司 一种基于动态网格划分的时序数据趋势特征提取方法
CN118133974A (zh) * 2024-05-08 2024-06-04 西安航天动力试验技术研究所 一种发动机试车数据处理方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140093183A1 (en) * 2012-09-28 2014-04-03 Industrial Technology Research Institute Smoothing method and apparatus for time data sequences
CN106600449A (zh) * 2015-10-16 2017-04-26 国家电网公司 一种自动的功率趋势识别方法
CN108492345A (zh) * 2018-01-24 2018-09-04 西安理工大学 一种基于尺度变换的数据块划分方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140093183A1 (en) * 2012-09-28 2014-04-03 Industrial Technology Research Institute Smoothing method and apparatus for time data sequences
CN106600449A (zh) * 2015-10-16 2017-04-26 国家电网公司 一种自动的功率趋势识别方法
CN108492345A (zh) * 2018-01-24 2018-09-04 西安理工大学 一种基于尺度变换的数据块划分方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
谢婷玉等: "基于重要点双重评价的时间序列趋势提取", 《信息与控制》 *
邢邗等: "时间序列数据趋势转折点提取算法", 《计算机工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765562A (zh) * 2021-01-15 2021-05-07 杭州安脉盛智能技术有限公司 一种基于动态网格划分的时序数据趋势特征提取方法
CN112765562B (zh) * 2021-01-15 2022-07-01 杭州安脉盛智能技术有限公司 一种基于动态网格划分的时序数据趋势特征提取方法
WO2022151829A1 (zh) * 2021-01-15 2022-07-21 杭州安脉盛智能技术有限公司 一种基于动态网格划分的时序数据趋势特征提取方法
CN118133974A (zh) * 2024-05-08 2024-06-04 西安航天动力试验技术研究所 一种发动机试车数据处理方法、装置、设备及介质

Also Published As

Publication number Publication date
CN110489810B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
CN108711158B (zh) 基于轮廓拟合和径向分割的指针式仪表图像识别方法
KR960016421B1 (ko) 문자 분할 방법 및 장치와 문자열의 추출방법 및 장치
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
CN107392141B (zh) 一种基于显著性检测和lsd直线检测的机场提取方法
CN105321176A (zh) 一种基于分层高阶条件随机场的图像分割方法
CN110489810A (zh) 一种基于数据块的趋势自动提取方法
CN106340010B (zh) 一种基于二阶轮廓差分的角点检测方法
CN103400388A (zh) 一种利用RANSAC消除Brisk关键点错误匹配点对的方法
CN106447605B (zh) 基于pca和fft的青铜器三维碎片虚拟拼接方法
CN114406502A (zh) 激光金属切割方法及系统
CN116030396B (zh) 一种用于视频结构化提取的精确分割方法
Sun et al. Research on fatigue crack growth detection of M (T) specimen based on image processing technology
CN104614386A (zh) 一种镜片疵病类型的识别方法
CN109146888A (zh) 一种基于差商分析的土裂隙分形维数计算方法
CN117274820B (zh) 一种测绘地理信息地图数据采集方法及系统
CN114494704A (zh) 二值化图像抗噪声提取骨架的方法及系统
CN110032585B (zh) 一种时间序列双层符号化方法及装置
WO2022061922A1 (zh) 材料微结构的分析方法和装置
CN115170820B (zh) 一种应用于数据曲线过渡阶段的特征提取及界限识别方法
CN114663562B (zh) 基于人工智能和模式识别的中间画图像优化方法及系统
CN109785328B (zh) 一种结合区域合并与深度连通性的似物性估计方法
CN114970630A (zh) 一种时序数据多尺度分段的模型训练方法
CN106844767B (zh) 格式文档关键信息块配准及提取的方法及装置
CN115640546A (zh) 一种图像与特征信息融合的岩性识别方法
CN114609258B (zh) 基于液相色谱-高分辨质谱的石油分子表征数据处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20221110

Address after: 710000 No. B49, Xinda Zhongchuang space, 26th Street, block C, No. 2 Trading Plaza, South China City, international port district, Xi'an, Shaanxi Province

Applicant after: Xi'an Huaqi Zhongxin Technology Development Co.,Ltd.

Address before: 710048 Shaanxi province Xi'an Beilin District Jinhua Road No. 5

Applicant before: XI'AN University OF TECHNOLOGY

Effective date of registration: 20221110

Address after: Room 14,067, Zone 1, Building 1, No. 888, Huanhu West Second Road, Lingang New Area, China (Shanghai) Pilot Free Trade Zone, Pudong New Area, Shanghai, 200,120

Applicant after: Shanghai Jinrun Lianhui Digital Technology Co.,Ltd.

Address before: 710000 No. B49, Xinda Zhongchuang space, 26th Street, block C, No. 2 Trading Plaza, South China City, international port district, Xi'an, Shaanxi Province

Applicant before: Xi'an Huaqi Zhongxin Technology Development Co.,Ltd.

GR01 Patent grant
GR01 Patent grant