CN107851291B - 时序数据处理装置 - Google Patents
时序数据处理装置 Download PDFInfo
- Publication number
- CN107851291B CN107851291B CN201580082003.7A CN201580082003A CN107851291B CN 107851291 B CN107851291 B CN 107851291B CN 201580082003 A CN201580082003 A CN 201580082003A CN 107851291 B CN107851291 B CN 107851291B
- Authority
- CN
- China
- Prior art keywords
- segment
- vibration data
- vibration
- data
- segment vibration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 54
- 238000000605 extraction Methods 0.000 claims abstract description 88
- 230000007423 decrease Effects 0.000 claims abstract description 56
- 230000000630 rising effect Effects 0.000 claims abstract description 48
- 238000013075 data extraction Methods 0.000 claims description 31
- 239000000284 extract Substances 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 21
- 238000012800 visualization Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 22
- 230000015654 memory Effects 0.000 description 15
- 238000013480 data collection Methods 0.000 description 14
- 230000002159 abnormal effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 241001269238 Data Species 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000003534 oscillatory effect Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 241001416181 Axis axis Species 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000009428 plumbing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Train Traffic Observation, Control, And Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
具备片段振动列确定部(3)和数据库登记部(4),该片段振动列确定部(3)在时序数据(X)中,对由片段提取部(2)提取出的上升片段和下降片段交替出现的片段的序列即片段振动列进行确定,对构成该片段振动列的片段的数量即振动数及片段振动列的开始时间点和结束时间点的范围即窗口尺寸进行计数,该数据库登记部(4)将由片段振动列确定部(3)确定出的片段振动列的开始时间点的观测时刻、该片段振动列所包含的片段的振幅、以及由片段振动列确定部(3)计出的振动数及窗口尺寸的组,作为片段振动数据登记于数据库(5)。
Description
技术领域
本发明涉及时序数据处理装置,其取得例如工厂、大厦、以及车间等的控制系统中的传感器值、证券交易所处的股价、以及公司的销售额等作为时刻变化的观测值,对排列有各时刻的观测值的时序数据进行分析。
背景技术
例如,在火力、水力、核能等发电厂、化工厂、钢铁厂、以及上下水厂等中,导入了对工厂的工艺进行控制的控制系统。另外,在大厦、车间等的设备中,也导入了对空调、电、照明、以及给排水等进行控制的控制系统。
在这些控制系统中有时具有如下功能,即,例如通过每隔固定时间取得在各种装置安装的传感器的传感器值即观测值,从而对排列有各时刻的观测值的时序数据进行累积。
另外,在对证券交易所处的股价、公司的销售额等进行处理的信息系统中有时也具有如下功能,即,例如通过每隔固定时间取得股价、销售额等作为观测值,从而对排列有各时刻的观测值的时序数据进行累积。
在对控制系统、信息系统中累积的时序数据进行分析的时序数据处理装置中,为了能够检测出例如工厂的设备的异常、公司经营的异常等,对所累积的时序数据进行分析,对观测值的上升、下降等变化进行检测。
例如,虽然股价等观测值不断上下变化,但存在排列有如下观测值的局部时序:虽然局部小幅地上下变化,但从大范围来说表示出上升的倾向的观测值(以下,将这样的局部时序称为“上升片段(leg)”);以及虽然局部小幅地上下变化,但从大范围来说表示出下降的倾向的观测值(以下,将这样的局部时序称为“下降片段”)。
作为用于对工厂的设备的异常、公司经营的异常等进行检测的指标,由于与局部小幅地上下变化的部分相比,上升片段、下降片段更准确,因此在时序数据处理装置中,从所累积的时序数据中提取上升片段和下降片段。
例如,以下的非专利文献1公开了从所累积的时序数据中提取上升片段及下降片段的片段检索技术。
非专利文献1:Fink,E.and Kevin B.P.:Indexing of Compressed Time series,DATA MINING IN TIME SERIES DATABASES,World Scientific,pp.43-65(2004)
发明内容
由于当前的时序数据处理装置是以上述方式构成的,因此能够从时序数据中提取上升片段和下降片段,该上升片段为排列有伴随着时间的经过而表示出上升倾向的观测值的局部时序,该下降片段为排列有伴随着时间的经过而表示出下降倾向的观测值的局部时序。但是,为了对工厂的设备的异常、公司经营的异常等进行检测,与单纯的上升片段、下降片段相比,上升片段和下降片段交替出现的片段的序列即片段振动列成为重要的指标,但由于不具备对片段振动列进行确定的手段,因此存在不能够确定成为重要的指标的片段振动列这一课题。
例如,作为工厂设备的异常,有时会对设备的晃动现象、振荡现象等进行检测,但因为即便单纯提取出了上升片段、下降片段,也难以准确地掌握观测值的振动状况,因此不能够容易地对设备的晃动现象、振荡现象等进行检测。
与此相对,由于片段振动列为上升片段和下降片段交替出现的片段的序列,因此能够容易地掌握观测值的振动状况。因此,在对设备的晃动现象、振荡现象等进行检测方面,片段振动列成为重要的指标。
本发明就是为了解决上述课题而提出的,其目的在于得到一种时序数据处理装置,该时序数据处理装置能够对与上升片段和下降片段交替出现的片段振动列相关的信息即片段振动数据进行累积。
本发明涉及的时序数据处理装置构成为,设置有:片段提取部,其从排列有各时刻的观测值的时序数据中提取上升片段和下降片段,该上升片段为排列有伴随着时间的经过而表示出上升倾向的观测值的局部时序,该下降片段为排列有伴随着时间的经过而表示出下降倾向的观测值的局部时序;片段振动列确定部,其在时序数据中,对由片段提取部提取出的上升片段和下降片段交替出现的片段的序列即片段振动列进行确定,对构成该片段振动列的片段的数量即振动数及片段振动列的开始时间点和结束时间点的范围即窗口尺寸进行计数;以及数据库登记部,其将由片段振动列确定部确定出的片段振动列的开始时间点的观测时刻、该片段振动列所包含的片段的振幅、以及由片段振动列确定部计出的振动数及窗口尺寸的组,作为片段振动数据登记于数据库,片段振动数据检索部从登记于数据库的片段振动数据中,对与检索条件相符的片段振动数据进行检索。
发明的效果
根据本发明,由于构成为设置有片段振动列确定部和数据库登记部,因此具有如下效果,即,能够对与上升片段和下降片段交替出现的片段振动列相关的信息即片段振动数据进行累积,该片段振动列确定部在时序数据中,对由片段提取部提取出的上升片段和下降片段交替出现的片段的序列即片段振动列进行确定,对构成该片段振动列的片段的数量即振动数及片段振动列的开始时间点和结束时间点的范围即窗口尺寸进行计数,该数据库登记部将由片段振动列确定部确定出的片段振动列的开始时间点的观测时刻、该片段振动列所包含的片段的振幅、以及由片段振动列确定部计出的振动数及窗口尺寸的组作为片段振动数据登记于数据库。
附图说明
图1是表示本发明的实施方式1的时序数据处理装置的结构图。
图2是表示本发明的实施方式1的时序数据处理装置的硬件结构图。
图3是在时序数据处理装置由计算机构成的情况下的硬件结构图。
图4是表示本发明的实施方式1的时序数据处理装置的处理内容的流程图。
图5是表示由时序数据收集部1收集的时序数据及时序数据的一部分即局部列的一个例子的说明图。
图6是表示由片段提取部2提取的片段的一个例子的说明图。
图7是表示片段振动列和振动数的说明图。
图8是表示由时序数据收集部1收集的时序数据、在数据库5存储的片段振动数据(片段振动列的开始时间点的观测时刻、片段振动列的振幅、振动数、以及窗口尺寸)的一个例子的说明图。
图9是表示片段振动数据检索部9的片段振动数据的检索式和检索结果的一个例子的说明图。
图10是表示由可视化部10实现的片段振动数据检索部9的检索结果的可视化例的说明图。
图11是表示对片段振动列s进行提取的算法(GetLongestLegSeq)的示例代码的说明图。
图12是表示求出就振幅而言窗口尺寸最小的片段振动数据的算法(GetMLV)的示例代码的说明图。
图13是表示本发明的实施方式2的时序数据处理装置的结构图。
图14是表示本发明的实施方式2的时序数据处理装置的处理内容的流程图。
图15是表示由片段振动数据提取部6的振幅最大片段提取部11进行的所需要的片段振动数据的提取处理的说明图。
图16是表示由可视化部10实现的片段振动数据检索部9的检索结果的可视化例的说明图。
具体实施方式
下面,为了对本发明进行更详细地说明,参照附图对用于实施本发明的方式进行说明。
实施方式1.
图1是表示本发明的实施方式1的时序数据处理装置的结构图。另外,图2是表示本发明的实施方式1的时序数据处理装置的硬件结构图。
在图1及图2中,时序数据收集部1是由例如对从外部发送来的数据进行接收的通信装置21、或者具备USB端口等输入输出端口的输入输出装置22实现的,实施对排列有由控制系统、信息系统等观测到的各时刻的观测值的时序数据进行收集的处理。
由时序数据收集部1收集到的时序数据存储于例如由RAM、硬盘等构成的主存储装置23或外部存储装置24。
片段提取部2是通过由例如安装有CPU(Central Processing Unit)的半导体集成电路、或单片微型计算机等构成的运算装置25实现的,实施从在主存储装置23或外部存储装置24存储的时序数据中,提取上升片段和下降片段的处理,该上升片段是排列有伴随着时间的经过而表示出上升倾向的观测值的局部时序,该下降片段是排列有伴随着时间的经过而表示出下降倾向的观测值的局部时序。
此处,排列有伴随着时间的经过而表示出上升倾向的观测值的局部时序指的是,排列有虽然局部小幅地上下变化,但从大范围来说表示出上升的倾向的观测值的局部时序。
另外,排列有伴随着时间的经过而表示出下降倾向的观测值的局部时序指的是,排列有虽然局部小幅地上下变化,但从大范围来说表示出下降的倾向的观测值的局部时序。
片段振动列确定部3是通过例如运算装置25实现的,其实施如下处理,即,在存储于主存储装置23或外部存储装置24的时序数据中,对由片段提取部2提取出的上升片段和下降片段交替出现的片段的序列即片段振动列进行确定,对构成该片段振动列的片段的数量即振动数及片段振动列的开始时间点和结束时间点的范围即窗口尺寸进行计数。
数据库登记部4是通过例如运算装置25实现的,其实施如下处理,即,将由片段振动列确定部3确定出的片段振动列的开始时间点的观测时刻、该片段振动列所包含的片段的振幅、以及由片段振动列确定部3计出的振动数及窗口尺寸的组作为片段振动数据登记于数据库5的表格LV。
数据库5是通过主存储装置23或外部存储装置24实现的,其将片段振动列的开始时间点的观测时刻、片段的振幅、振动数及窗口尺寸的组作为片段振动数据存储于表格LV。
片段振动数据提取部6是由振幅最小片段提取部7及振动数最小片段提取部8构成的,其实施在登记于数据库5的片段振动数据中,提取所需要的片段振动数据的处理。
振幅最小片段提取部7是通过例如运算装置25实现的,从在数据库5的表格LV登记的片段振动数据中,以振幅将振动数相同的片段振动数据分组。
另外,振幅最小片段提取部7实施如下处理,即,通过针对每个组,对属于该组的片段振动数据的窗口尺寸进行比较,由此,从属于该组的片段振动数据中,提取任意1个片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
例如,对属于该组的大于或等于1个片段振动数据,即,振幅相同的大于或等于1个片段振动数据的窗口尺寸进行比较,从大于或等于1个片段振动数据中,提取窗口尺寸最小的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
振动数最小片段提取部8是通过例如运算装置25实现的,从在数据库5的表格LV登记的片段振动数据中,以振动数将振幅相同的片段振动数据分组。
另外,振动数最小片段提取部8实施如下处理,即,通过针对每个组,对属于该组的片段振动数据的窗口尺寸进行比较,由此,从属于该组的片段振动数据中,提取任意1个片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
例如,对属于该组的大于或等于1个片段振动数据,即,振动数相同的大于或等于1个片段振动数据的窗口尺寸进行比较,从大于或等于1个片段振动数据中,提取窗口尺寸最小的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
片段振动数据检索部9是通过例如运算装置25实现的,其实施如下处理,即,从在数据库5的表格MLV登记的片段振动数据中,检索与检索条件相符的片段振动数据。
另外,片段振动数据检索部9实施如下处理,即,在与检索条件相符的片段振动数据中,对振幅、振动数及窗口尺寸相同的片段振动数据的个数即总出现数进行计数。
可视化部10是通过由例如GPU(Graphics Processing Unit)、液晶显示器等构成的显示装置26实现的,其实施如下处理,即,在第1轴为振幅,第2轴为窗口尺寸,第3轴为总出现数的3维图表上,对由片段振动数据检索部9检索出的片段振动数据的振幅、窗口尺寸及总出现数进行显示。
在图1的例子中,设想的是时序数据处理装置的结构要素即时序数据收集部1、片段提取部2、片段振动列确定部3、数据库登记部4、数据库5、片段振动数据提取部6、片段振动数据检索部9及可视化部10的每一者由专用的硬件构成,但时序数据处理装置也可以是由计算机构成的。
图3是在时序数据处理装置由计算机构成的情况下的硬件结构图。
在时序数据处理装置由计算机构成的情况下,只要在计算机的存储器41上构成数据库5,并且将记述有时序数据收集部1、片段提取部2、片段振动列确定部3、数据库登记部4、片段振动数据提取部6、片段振动数据检索部9及可视化部10的处理内容的程序存储于计算机的存储器41,计算机的处理器42执行存储于存储器41的程序即可。
图4是表示本发明的实施方式1的时序数据处理装置的处理内容的流程图。
图5是表示由时序数据收集部1收集的时序数据及时序数据的一部分即局部列(局部时序)的一个例子的说明图。
时序数据X为m个观测值以观测时刻顺序排列的顺序列表{x1,x2,…,xm},以下,将时序数据X的第i个观测值xi标记为X[i]。
下标的i为满足1≤i≤m的整数,称为“时间点”。另外,m为时序数据X所包含的观测值的数据数量,排列有m个观测值的时序数据X的长度用length(m)表示。
在图5(a)中,纵轴表示构成时序数据X的观测值X[i],横轴表示观测值X[i]的时间点i。
通过提取时序数据X的第i个观测值X[i]至第j个观测值X[j]而得到的列表X[i:j]={xi,xi+1,…,xj}称为时序数据X的局部列。
另外,将局部列X[i:j]的开始时间点p标记为start(X[i:j]),将局部列X[i:j]的结束时间点q标记为end(X[i:j])。
局部列X[i:j]的长度为j-i+1。该局部列的长度表示局部列的开始时间点和结束时间点的范围,以下,称为“窗口尺寸”。
在图5(b)中示出的是,在图5(a)所示的时序数据中,i=11、j=19的情况的局部列。
图6是表示由片段提取部2提取的片段的一个例子的说明图。
特别地,图6(a)示出片段的一个例子,图6(b)示出成为片段的例子和没有成为片段的例子。
片段指的是虽然局部有小幅的上下变化,但从大范围来说上升或下降的局部列。
即,在上升片段的情况下,与局部列的开始时间点的观测值相比局部列的结束时间点的观测值大。另外,开始时间点和结束时间点之间的全部观测值大于或等于局部列的开始时间点的观测值,且小于或等于局部列的结束时间点的观测值。
另一方面,在下降片段的情况下,与局部列的开始时间点的观测值相比局部列的结束时间点的观测值小。另外,开始时间点和结束时间点之间的全部观测值小于或等于局部列的开始时间点的观测值,且大于或等于局部列的结束时间点的观测值。
因此,在图6(a)、(b)的例子中,由于31、32为从大范围来说上升的局部列,因此为上升片段。
与此相对,在局部列33中,与开始时间点的观测值33a相比结束时间点的观测值33b大,但开始时间点和结束时间点之间的观测值33c比开始时间点的观测值33a小,因此不是上升片段。
以下,在形式上对片段进行定义。
[单调片段]
例如,在作为局部列的X[p:q]满足下述条件式(1)、(2)中的任意条件式的情况下,将局部列X[p:q]称为单调片段。
条件式(1)
相对于满足p+1≤i≤q-1的全部i,
X[i-1]<X[i]<X[i+1]
条件式(2)
相对于满足p+1≤i≤q-1的全部i,
X[i-1]>X[i]>X[i+1]
[片段]
例如,在作为局部列的X[p:q]满足下述条件式(3)、(4)中的任意条件式的情况下,将局部列X[p:q]称为片段。特别地,在满足条件式(3)的情况下,将局部列X[p:q]称为上升片段,在满足条件式(4)的情况下,将局部列X[p:q]称为下降片段。
条件式(3)
相对于满足p≤i≤q的全部i,
X[p]≤X[i]≤X[q]
条件式(4)
相对于满足p≤i≤q的全部i,
X[p]≥X[i]≥X[q]
即,上升片段为如下局部列,即,虽然不一定如单调片段那样,从局部列X[p:q]的开始时间点p至结束时间点q为止观测值X[i]单调上升,但开始时间点p和结束时间点q之间的全部的观测值X[i]具有大于或等于开始时间点p的观测值X[p]的值,并且具有小于或等于结束时间点q的观测值X[q]的值。
另外,下降片段为如下局部列,即,虽然不一定如单调片段那样,从局部列X[p:q]的开始时间点p至结束时间点q为止观测值X[i]单调下降,但开始时间点p和结束时间点q之间的全部的观测值X[i]具有小于或等于开始时间点p的观测值X[p]的值,并且具有大于或等于结束时间点q的观测值X[q]的值。
[最大片段]
例如,在作为局部列的X[p:q]为上升片段,并且满足下述条件式(5)~(8)的情况下,将局部列X[p:q]称为最大上升片段。
条件式(5)
相对于满足p<i≤q的全部i,
X[p]<X[i]
条件式(6)
相对于满足p≤i<q的全部i,
X[i]<X[q]
条件式(7)
X[p-1]≥X[p]
条件式(8)
X[q]≥X[q+1]
其中,在不存在X[p-1]或X[q+1]的情况下,条件式(7)或条件式(8)不包含在条件中。
例如,在作为局部列的X[p:q]为下降片段,并且满足下述条件式(9)~(12)的情况下,将局部列X[p:q]称为最大下降片段。
条件式(9)
相对于满足p<i≤q的全部i,
X[p]>X[i]
条件式(10)
相对于满足p≤i<q的全部i,
X[i]>X[q]
条件式(11)
X[p-1]≤X[p]
条件式(12)
X[q]≤X[q+1]
其中,在不存在X[p-1]或X[q+1]的情况下,条件式(11)或条件式(12)不包含在条件中。
在局部列X[p:q]为片段的情况下,如下述的式(13)所示那样表示该片段的振幅amp(X[p:q])。
amp(X[p:q])=abs(X[q]-X[p]) (13)
在式(13)中,abs(A)是返回A的绝对值的函数。
另外,如下述的式(14)所示那样表示片段的符号sign(X[p:q]),如果符号为正则为上升片段,如果符号为负则为下降片段。
sign(X[p:q])=sign(X[q]-X[p]) (14)
在式(14)中,sign(A)是返回A的符号的函数。
在图6(b)中,34为上升片段31的振幅,35为上升片段32的振幅。
图7是表示片段振动列和振动数的说明图。
图7(a)表示出紧接着上升片段出现下降片段的片段振动列的例子,该情况下的振动数为2。
图7(b)表示出紧接着下降片段出现上升片段的片段振动列的例子,该情况下的振动数为-2。
图7(c)表示出片段以上升片段、下降片段、上升片段、下降片段、上升片段、下降片段、以及上升片段的顺序出现的片段振动列的例子,该情况下的振动数为7。
以下,对片段振动列和振动数进行定义。
[片段振动列]
例如,在X1,X2,…,Xn为最大片段时,在满足下述的条件式(15)~(17)的情况下,将片段的序列s=[X1,X2,…,Xn]称为振幅a的片段振动列。另外,将构成片段振动列的片段的数量标记为length(s)。a为正的实数。
条件式(15)
相对于满足1≤i≤n-1的全部i,
end(Xi)≤start(Xi+1)
条件式(16)
amp(Xi)≥a
条件式(17)
amp(Xi)·amp(Xi+1)<0
即,在片段振动列中,符号为+的振幅的局部列和符号为-的振幅的局部列交替排列,并且这些局部列的振幅的绝对值大于或等于a。
此处,使用片段振动列的开头的片段X1和片段振动列的末尾的片段Xn,将片段振动列的符号sign、开始时间点start、结束时间点end、末尾片段last像下式(18)~(21)那样定义。
sign(s)=sign(X1) (18)
start(s)=start(X1) (19)
end(s)=end(Xn) (20)
last(s)=Xn (21)
[片段振动列集合]
例如,在时序数据为X,振幅大于或等于a,窗口尺寸为w,时间点为t时,将满足下述条件式(22)、(23)的振幅大于或等于a的片段振动列s的集合称为片段振动列集合S(X,a,w,t)。
条件式(22)
t≤start(s)
条件式(23)
end(s)≤t+w-1
作为对片段振动数进行定义的准备,对与具有最大长度的片段振动列的符号相关的下述引理进行证明。
[引理:最长片段振动列的符号的相同性]
在片段振动列集合S(X,a,w,t)中,具有最大的长度的片段振动列彼此为相同符号。
[证明]
假设片段振动列s=[Xs1,Xs2,…,Xsn]、片段振动列u=[Xu1,Xu2,…,Xun]为具有最大的长度的片段振动列,并且片段振动列s和片段振动列u为符号不同的片段振动列。
下面,证明该假设是矛盾的。此处,为了方便,将片段振动列s的符号设为正,将片段振动列u的符号设为负而进行说明,但即使像这样规定符号也不会丧失一般性。
最先,示出的是片段振动列s的开头片段Xs1的时间区间[start(Xs1),end(Xs1)]、以及片段振动列u的开头片段Xu1的时间区间[start(Xu1),end(Xu1)]没有交叉。
如果假设start(Xs1)<start(Xu1)<end(Xs1)<end(Xu1),则由于片段振动列s的符号为正,片段振动列s为最大上升片段,因此满足X[start(Xu1)]<X[end(Xs1)],
由于片段振动列u的符号为负,片段振动列u为最大下降片段,因此满足X[start(Xu1)]>X[end(Xs1)],所以矛盾。
在start(Xu1)<start(Xs1)<end(Xu1)<end(Xs1)的情况下也同样矛盾。
因此,必须是end(Xs1)≤start(Xu1),或者end(Xu1)≤start(Xs1)。
如果end(Xs1)≤start(Xu1),则[Xs1,Xu1,…,Xun]变为长度n+1的片段振动列,这与片段振动列s和片段振动列u具有最大的长度矛盾。
另外,如果end(Xu1)≤start(Xs1),则[Xu1,Xs1,…,Xsn]变为长度n+1的片段振动列,这与片段振动列s和片段振动列u具有最大的长度矛盾。
因此,开头片段Xs1和开头片段Xu1的符号必须相同。根据片段振动列的符号sign的定义,片段振动列s和片段振动列u为相同符号。
[片段振动数]
例如,在片段振动列集合为S(X,a,w,t)时,如下述式(24)那样对片段振动数FX,a,w(t)进行定义。
FX,a,w(t)=sign(lmax)×length(lmax) (24)
lmax=argmaxl∈S(X,a,w,t)length(l)
其中,argmax为表示length(l)成为最大的定义域的元素的集合的记号。即,lmax表示在片段振动列集合S(X,a,w,t)中具有最大的长度的片段振动列。
在上述的引理中,示出了即使在具有最大的长度的片段振动数有多个的情况下,也会唯一确定sign(lmax),因此能够无矛盾地定义出片段振动数。
下面,对片段振动数的直观含义进行说明。
片段振动数将从时间点t开始的窗口尺寸w的局部列的上下振动的动作进行定量化。即,含义是,片段振动数的绝对值变得越大则以越高频率进行振动,另外,振幅a变得越大则以越大的振幅进行振动。
另外,在片段振动数的符号为正的情况下,表示的是振动从上升开始,在片段振动数的符号为负的情况下,表示的是振动从下降开始。
例如,在片段振动数为1的情况下,与上述非专利文献1公开的上升片段对应,在片段振动数为-1的情况下,与上述非专利文献1公开的下降片段对应。
另外,在片段振动数为2的情况下,开头片段为振幅大于或等于a且上升的片段,次于开头片段的片段为振幅大于或等于a且下降的片段,因此意味着从时间点t开始的窗口尺寸w的局部列具有凸型的峰形状。
在片段振动数为-2的情况下,开头片段为振幅大于或等于a且下降的片段,次于开头片段的片段为振幅大于或等于a且上升的片段,因此意味着在从时间点t开始的窗口尺寸w的局部列存在凹型的上下振动。作为对设备的异常进行检测的规则,多数情况下使用对大于或等于某固定的振幅的峰进行检测的条件,具体而言,存在凸型的峰形状、凹型的上下振动的条件,因此对片段振动数为2、-2的局部列进行检测在对设备的异常进行检测方面是有用的。
另外,在片段振动数为4的情况下,意味着振幅大于或等于a的上升片段、下降片段、上升片段、以及下降片段依次出现的图案(pattern)。作为对设备的异常进行检测的规则,经常使用片段振动数的绝对值大于或等于4的条件,对片段振动数为4的局部列进行检测也在对设备的异常进行检测方面是有用的。
图8是表示由时序数据收集部1收集的时序数据、在数据库5存储的片段振动数据(片段振动列的开始时间点的观测时刻、片段的振幅、振动数、以及窗口尺寸)的一个例子的说明图。
图8(a)的时序数据基于下述非专利文献2(图7)公开的航天飞机的马洛塔阀门的数据。
[非专利文献2]
E.Keogh,J.Lin and A.Fu(2005),“HOT SAX:Efficiently Finding the MostUnusual Time Series Subsequence:Algorithms and Applications”,http://www.cs.ucr.edu/~eamonn/discords/
图8(a)的时序数据的采样周期为1毫秒,单位为安培。
在该时序数据中存在振幅为4左右,时间点数量为400左右的凸形状的大的图案(该图中,用虚线框表示的(A)的部分)。
另外,存在振幅为1.5至2左右,时间点数量为30至50左右的上升下降图案(该图中,用虚线框表示的(B)的部分),存在处于凸形状的大的图案之后的振幅为1左右,时间点数量为50左右的凸形状的图案(该图中,用虚线框表示的(C)的部分)。
例如,在控制系统处的传感器值即观测值的异常检测中,重要的是对通常存在的(A)~(C)那样的图案进行提取,在这些图案之间对形状进行比较。因此,将片段的振幅、振动数、以及窗口尺寸作为检索条件的时序数据的检索在应用方面是重要的。
图8(b)表示出存储于数据库5的片段振动数据的一个例子,对该片段振动数据进行了表格化。即,片段振动数据登记于表格LV。
片段振动数据由片段振动列的开始时间点的观测时刻(开始时刻)、片段的振幅、振动数、以及窗口尺寸构成。
例如,表格LV的第1行的含义是“在从时刻101开始的长度217的窗口存在振幅大于或等于4.25的上升片段”。
同样地,表格LV的第2行的含义是“在从时刻101开始的长度153的窗口存在由振幅大于或等于2.25的上升片段、下降片段以及上升片段构成的片段序列”。
另外,表格LV的第8行的含义是“在从时刻227开始的长度27的窗口存在由振幅大于或等于2.25的下降片段和上升片段构成的片段序列”。
图9是表示片段振动数据检索部9的片段振动数据的检索式和检索结果的一个例子的说明图。
图9(a)表示出片段振动数据检索部9的片段振动数据的检索式的一个例子。
将检索式的结构和含义设为遵循于作为现有技术的关系数据库的检索语言SQL,但在图9(a)中表示出如下例子,即,将片段振动列的振动数为2(凸形状的图案)作为检索条件,从在数据库5登记的多个片段振动数据中,对与该检索条件相符的片段振动数据进行检索。
在图9(b)所示的检索结果中,除了提示出片段振动列的振动数为2的片段振动数据的振幅和窗口尺寸之外,还提示出总出现数count(*)。
该总出现数count(*)的含义是振幅、振动数及窗口尺寸相同的片段振动数据的个数。该总出现数count(*)的计算是通过后述的片段振动数据检索部9进行的。
例如,图9(b)所示的检索结果的第1行的含义是存在1个振幅大于或等于4、窗口尺寸为267的凸形状的图案。
另外,第2行的含义是存在2个振幅大于或等于3.75、窗口尺寸为299的凸形状的图案。
图10是表示由可视化部10实现的片段振动数据检索部9的检索结果的可视化例的说明图。
在图10中,从近端处至左侧远端处的轴(第1轴)表示片段的振幅,从近端处至右侧远端处的轴(第2轴)表示片段振动数据的窗口尺寸,与第1轴、第2轴这两者正交的轴(第3轴)表示片段振动数据的总出现数count(*)。
在具有第1~第3轴的3维图表上,显示出由片段振动数据检索部9检索到的片段振动数据的振幅、窗口尺寸以及总出现数。
图10中的(A)、(B)、(C)与图8(a)所示的(A)、(B)、(C)的部分对应。
通过在振幅和窗口尺寸这两个轴上,观察凸形状的图案的频率,从而能够对时序的凸形状图案的分布情况进行浏览。
下面,对动作进行说明。
下面,适当参照图4的流程图进行说明。
时序数据收集部1对排列有在控制系统、信息系统等中观测到的各时刻的观测值X[i](1≤i≤m)的时序数据X进行收集(图4的步骤ST1)。即,时序数据收集部1对例如如图5(a)、图8(a)所示那样的时序数据X进行收集。
由时序数据收集部1收集到的时序数据X存储于例如由RAM、硬盘等构成的主存储装置23或外部存储装置24。
片段提取部2从在主存储装置23或外部存储装置24存储的时序数据X中,提取满足上述条件式(3)的局部列X[p:q]作为上升片段,另外,从时序数据X中提取满足上述条件式(4)的局部列X[p:q]作为下降片段(图4的步骤ST2)。
例如,片段提取部2针对在主存储装置23或外部存储装置24存储的时序数据X,对提取上升片段及下降片段的范围(时间点的范围)进行初始设定,一边使该进行提取的范围偏移,一边从时序数据X提取上升片段及下降片段。在收集的是如图8(a)所示那样的时序数据X的情况下,例如,初始设定为时间点0~100左右的小的提取范围。但是,被初始设定的提取范围是任意的。
如上所述,在一边使进行提取的范围偏移,一边从时序数据X提取上升片段及下降片段的情况下,由于能够容易地对上升片段、下降片段的开始时间点、结束时间点进行探索,因此与以对时序数据X的整体进行提取的范围来提取上升片段及下降片段的情况相比,能够迅速地进行上升片段及下降片段的提取处理。
此处,示出了片段提取部2一边使提取上升片段及下降片段的范围偏移,一边从时序数据X中提取上升片段及下降片段的例子,但从时序数据X中提取上升片段及下降片段的片段检索技术已被上述非专利文献1公开,也可以使用非专利文献1公开的片段检索技术,从时序数据X中提取上升片段及下降片段。
如果片段提取部2从时序数据X中提取了上升片段和下降片段,则片段振动列确定部3在时序数据X中,对由片段提取部2提取出的上升片段和下降片段交替出现的片段的序列即片段振动列s进行确定(图4的步骤ST3)。
即,片段振动列确定部3对满足上述条件式(15)~(17)的片段振动列s进行确定,但例如,如果指定了振幅大于或等于a、窗口尺寸w、以及时间点t,则在满足上述条件式(22)、(23)的片段振动列集合S(X,a,w,t)中,提取具有最大的长度的局部列作为片段振动列s。
此处,图11是表示对片段振动列s进行提取的算法(GetLongestLegSeq)的示例代码的说明图。
下面,简单地对从片段振动列集合S(X,a,w,t)中提取片段振动列s的动作进行说明。
片段振动列确定部3在图11(a)的示例代码的第1行至第5行,针对时序数据X的每个时间点t求出片段振动列smax,求出该片段振动列smax的片段振动数FX,a,w(t)。
即,片段振动列确定部3在图11(a)的示例代码的第2行,将长度0的片段振动列[]作为参数,进行图11(b)所示的“GetLegSeq_leftMost”的调用,从而求出从开始时间点t至结束时间点t+w-1为止的窗口内的最左片段振动列。在后面对最左片段振动列的定义进行叙述。
片段振动列确定部3如果求出了最左片段振动列smax,则在图11(a)的示例代码的第3行,根据该最左片段振动列smax的符号sign(smax)和长度length(smax),求出片段振动数FX,a,w(t)。
下面,对图11(b)所示的“GetLegSeq_leftMost”的动作进行说明。
片段振动列确定部3在示例代码的第1行,对表示在作为参数的片段振动列s之后是否存在最左片段(最左片段将在后面记述)的标志“exit_leg”代入“false”。
然后,片段振动列确定部3在示例代码的第2行,对表示下一个时间点的“tnext”,依次代入t+1至tend的时间点,在示例代码的第3行,对由变量lnext表示的之后的片段候补代入局部列X[t:tnext]。
片段振动列确定部3在示例代码的第4行~第6行,如果片段候补lnext的振幅amp(lnext)大于或等于a,并且片段振动列s为空列,则对标志“exit_leg”代入“true”。
另外,片段振动列确定部3在示例代码的第4行、第7行~第8行,如果片段候补lnext的振幅amp(lnext)大于或等于a,并且“片段振动列s的末尾片段last(s)的符号sign(last(s))”和“片段候补lnext的符号sign(lnext)”的积为负,则片段候补lnext成为最左片段,因此对标志“exit_leg”代入“true”。
片段振动列确定部3在示例代码的第11行~第13行,如果标志“exit_leg”为“true”,则退出图11(b)所示的“GetLegSeq_leftMost”的for语句。
片段振动列确定部3在退出for语句后,在示例代码的第15行~第18行,在标志“exit_leg”为“true”的情况下,在片段振动列s的末尾追加片段候补lnext,将追加了片段候补lnext的片段振动列代入到snext,递归地调用GetLegSeq_leftMost(snext,tnext,tend,X),将其返回值代入到片段振动列s。
最后,片段振动列确定部3在示例代码的第19行,将片段振动列s作为smax,返回给图11(a)所示的“GetLongestLegSeq”。
在图11的算法中,求出的是通过以符号不同的顺序对结束时间点处于最左的片段(最左片段),即,结束时间点最早的片段进行选择而得到的片段振动列(最左片段振动列)。为了求出片段振动数,需要片段振动列的长度最大,但如以下所示,能够证明出最左片段振动列在片段振动列中长度最大。
[最左片段振动列]
在时序数据为X、振幅大于或等于a(正实数值)、窗口尺寸为w、时间点为t时,将局部列X[t,t+w-1]内的振幅大于或等于a的片段的集合设为L。
首先,在片段集合L中,将结束时间点最早的片段设为m1。接着,在振幅的符号与片段mi不同,处于片段mi之后的片段中,将结束时间点最早的片段设为mi+1。即,如下述式(25)所示,递归地对片段mi+1进行选择。
mi+1=argmaxl∈Liend(1) (25)
其中,Li=def{l∈L|
start(1)≥end(mi)and
sign(1)×sign(mi)<0}
将通过依次应用该操作得到的片段的序列[m1,m2,…,mn]称为局部列X[t,t+w-1]的最左片段振动列。
[定理:最左片段振动列的最长性]
在片段振动列集合为S(X,a,w,t)时,局部列X[t,t+w-1]中的最左片段振动列为在S(X,a,w,t)中具有最大的长度的片段振动列。
[证明]
设最左片段振动列为s=[Xs1,Xs2,…,Xsn],最左片段振动列s的长度为n。
另外,设具有最大长度的任意的片段振动列为u=[Xu1,Xu2,…,Xum],片段振动列u的长度为m。
此时,示出的是如果假设n<m,则矛盾。
首先,示出的是片段Xs1和片段Xu1必须为相同符号。这是因为如果将片段Xs1和片段Xu1设为不同符号,则由于s为最左片段振动列,如果使用与上述的引理同样的推理方法,则[Xs1,Xu1,Xu2,…,Xum]成为长度m+1的片段振动列,因此与片段振动列u具有最大的长度相悖。
由于片段Xs1和片段Xu1为相同符号,并且s为最左片段振动列,因此end(Xs1)≤end(Xu1)≤start(Xu2)成立。因此,[Xs1,Xu2,…,Xum]成为长度m的片段振动列。
同样地,由于s为最左片段振动列,end(Xs2)≤end(Xu2)≤start(Xu3),因此[Xs1,Xs2,Xu3,…,Xum]成为长度m的片段振动列。
如果假设n<m,则能够重复n次上述操作,因此[Xs1,…,Xsn,Xun+1,…,Xum]成为片段振动列。但是,由于在局部列X[end(sn):end(um)]中应当存在与片段Xun+1相同符号的最左片段,因此与s为最左片段振动列矛盾。因此,定理得到了证明。
片段振动列确定部3如果确定出片段振动列s,则对构成该片段振动列s的片段的数量即振动数及片段振动列的开始时间点和结束时间点的范围即窗口尺寸进行计数(图4的步骤ST3)。
数据库登记部4将由片段振动列确定部3确定出的片段振动列的开始时间点的观测时刻、该片段振动列所包含的片段的振幅、以及由片段振动列确定部3计出的振动数及窗口尺寸的组作为片段振动数据登记于数据库5的表格LV(图4的步骤ST4)。
由此,在数据库5的表格LV中,如图8(b)所示,存储由片段振动列的开始时间点的观测时刻、片段的振幅、振动数及窗口尺寸的组构成的片段振动数据。
如果数据库登记部4将片段振动数据登记于数据库5的表格LV,则在数据库5的表格LV中包含冗长的片段振动数据,因此片段振动数据提取部6实施如下处理,即,从在数据库5的表格LV登记的片段振动数据中,提取所需要的片段振动数据。
即,片段振动数据提取部6的振幅最小片段提取部7从在数据库5的表格LV登记的片段振动数据中,以振幅对振动数相同的片段振动数据进行分组,针对每个组,对属于该组的片段振动数据的窗口尺寸进行比较。
然后,振幅最小片段提取部7针对每个组,从属于该组的片段振动数据(振幅相同的大于或等于1个片段振动数据)中,提取窗口尺寸最小的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV(图4的步骤ST5)。
下面,对就振幅而言窗口尺寸最小的片段振动数据进行定义。即,对与就振幅而言最小的片段振动列s相关的片段振动数据进行定义。
[就振幅而言窗口尺寸最小的片段振动数据]
在对就振幅而言窗口尺寸最小的片段振动数据进行定义前,如下述式(26)所示对时序数据为X、片段振动数为f、窗口尺寸为w、时间点为t、片段振动列集合为S(X,a,w,t)时的片段振幅AX,f,w(t)进行定义。
AX,f,w(t)=maxs∈(X,a,w,t)amp(s) (26)
例如,在片段振动数为f的情况下,将满足下述式(27)、(28)的片段振动列s设为就振幅而言最小的片段振动列。
AX,f,w(t)>AX,f,w-1(t-1) (27)
AX,f,w(t)>AX,f,w-1(t) (28)
其中,t=start(s),w=end(s)-start(s)+1。
因此,与满足式(27)、(28)的片段振动列s相关的片段振动数据为就振幅而言窗口尺寸最小的片段振动数据。
图12是表示求出就振幅而言窗口尺寸最小的片段振动数据的算法(GetMLV)的示例代码的说明图。
下面,简单地对求出就振幅而言窗口尺寸最小的片段振动数据的动作进行说明。
振幅最小片段提取部7在示例代码的第1行,对表示在数据库5的表格MLV存储的片段振动数据的变量即MLV代入空集合{}。
然后,振幅最小片段提取部7在示例代码的第2行,从窗口尺寸的列表W依次一个一个地取出窗口尺寸w。
然后,振幅最小片段提取部7在示例代码的第3行,对时间点t依次代入从1至w为止的值。
然后,振幅最小片段提取部7在示例代码的第4行至第5行,通过调用图11(a)所示的“GetLongestLegSeq”,从而求出振幅大于或等于a、窗口尺寸w的片段振动列s。
振幅最小片段提取部7在示例代码的第6行至第7行,如果片段振动列s为最小的片段振动列,则将与最小的片段振动列相关的片段振动数据即(t,a,FX,a,w(t),w)追加至MLV。
片段振动数据提取部6的振动数最小片段提取部8从在数据库5的表格LV登记的片段振动数据中,以振动数对振幅相同的片段振动数据进行分组,针对每个组,对属于该组的片段振动数据的窗口尺寸进行比较。
然后,振动数最小片段提取部8针对每个组,从属于该组的片段振动数据(振动数相同的大于或等于1个片段振动数据)中,提取窗口尺寸最小的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV(图4的步骤ST6)。
下面,对就振动数而言窗口尺寸最小的片段振动数据进行定义。即,对与就振动数而言最小的片段振动列s相关的片段振动数据进行定义。
[就振动数而言窗口尺寸最小的片段振动数据]
例如,在振幅大于或等于a的情况下,将满足下述式(29)、(30)的片段振动列s设为就振动数而言最小的片段振动列。
abs(FX,a,w(t))>abs(FX,a,w-1(t-1)) (29)
abs(FX,a,w(t))>abs(FX,a,w-1(t)) (30)
其中,t=start(s),w=end(s)-start(s)+1。
因此,与满足式(29)、(30)的片段振动列s相关的片段振动数据为就振动数而言窗口尺寸最小的片段振动数据。
如果片段振动数据提取部6的振幅最小片段提取部7及振动数最小片段提取部8从数据库5的表格LV中,提取出所需要的片段振动数据而登记于数据库5的表格MLV,则片段振动数据检索部9从在数据库5的表格MLV登记的片段振动数据中,对与检索条件相符的片段振动数据进行检索(图4的步骤ST7)。
图8(b)为登记有片段振动数据的数据库5的表格LV,但如果为了便于说明,将图8(b)设为登记有由振幅最小片段提取部7及振动数最小片段提取部8提取出的片段振动数据的数据库5的表格MLV,则例如,如果检索条件为“振动数=3”,则检索出开始时刻为101、振幅大于或等于2.25、窗口尺寸为153的片段振动数据。
另外,如果检索条件为“振动数=-2”,则检索出开始时刻为227、振幅大于或等于2.25、窗口尺寸为27的片段振动数据。
此处,示出的是检索条件为振动数的例子,但检索条件并不限于振动数,检索条件也可以为开始时刻、振幅或窗口尺寸。
另外,检索条件也可以为多个,还可以为开始时刻、振幅、振动数、窗口尺寸的全部或一部分的AND条件。
此外,检索条件既可以预先设定于片段振动数据检索部9,也可以从外部赋予。
片段振动数据检索部9如果从在数据库5的表格MLV登记的片段振动数据中,检索出与检索条件相符的片段振动数据,则在检索出的大于或等于1片段振动数据中,对振幅、振动数及窗口尺寸相同的片段振动数据的个数即总出现数count(*)进行计数。
图9(b)表示出片段振动数据检索部9的检索结果的一个例子。
在图9(b)中表示出:例如,检索出1个振幅大于或等于4、窗口尺寸为267的片段振动数据,检索出2个振幅大于或等于3.75、窗口尺寸为299的片段振动数据。
此处,示出的是片段振动数据检索部9从在数据库5的表格MLV登记的片段振动数据中,对与检索条件相符的片段振动数据进行检索的例子,但在相同振动数的片段振动数据、相同振幅的片段振动数据少的状况下,由于冗长的片段振动数据少,因此也可以从在数据库5的表格LV登记的片段振动数据中,对与检索条件相符的片段振动数据进行检索。在该情况下,由于不需要片段振动数据提取部6,因此能够将时序数据处理装置的结构简化。
可视化部10如图10所示,例如,在第1轴为振幅,第2轴为窗口尺寸,第3轴为总出现数的3维图表上,对由片段振动数据检索部9检索出的片段振动数据的振幅、窗口尺寸及总出现数进行显示(图4的步骤ST8)。
由此可知,根据该实施方式1,由于构成为设置有片段振动列确定部3和数据库登记部4,因此取得了如下效果,即,能够对片段振动数据进行累积作为与在检测工厂的设备异常等方面成为重要的指标的片段振动列相关的信息,该片段振动列确定部3在时序数据X中,对由片段提取部2提取出的上升片段和下降片段交替出现的片段的序列即片段振动列进行确定,对构成该片段振动列的片段的数量即振动数及片段振动列的开始时间点和结束时间点的范围即窗口尺寸进行计数,该数据库登记部4将由片段振动列确定部3确定出的片段振动列的开始时间点的观测时刻、该片段振动列所包含的片段的振幅、以及由片段振动列确定部3计出的振动数及窗口尺寸的组作为片段振动数据登记于数据库5。
由此,例如,使用现有的SQL语言等,能够进行自由地对片段振动数据的开始时间点、窗口尺寸、振幅、以及振动数进行指定的检索。
实施方式2.
在上述实施方式1中示出的是,片段振动数据提取部6的振幅最小片段提取部7及振动数最小片段提取部8从在数据库5的表格LV登记的片段振动数据中,提取所需要的片段振动数据,但也可以是片段振动数据提取部6除了包含振幅最小片段提取部7及振动数最小片段提取部8之外,还包含后述的振幅最大片段提取部11及振动数最大片段提取部12,振幅最小片段提取部7、振动数最小片段提取部8、振幅最大片段提取部11及振动数最大片段提取部12从在数据库5的表格LV登记的片段振动数据中,提取所需要的片段振动数据。
图13是表示本发明的实施方式2的时序数据处理装置的结构图,在图中,由于与图1相同的标号表示相同或相当的部分,因此省略说明。
振幅最大片段提取部11是通过例如运算装置25实现的,从在数据库5的表格LV登记的片段振动数据中,提取观测时刻的全部或一部分相同的大于或等于1个片段振动数据。即,提取在某种大小的时间点的范围存在的大于或等于1个片段振动数据。
振幅最大片段提取部11实施如下处理,即,通过对提取出的大于或等于1个片段振动数据的振幅进行比较,从而提取任意1个片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
例如,对观测时刻的全部或一部分相同的大于或等于1个片段振动数据的振幅进行比较,从大于或等于1个片段振动数据中,提取振幅最大的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
振动数最大片段提取部12是通过例如运算装置25实现的,从在数据库5的表格LV登记的片段振动数据中,提取观测时刻的全部或一部分相同的大于或等于1个片段振动数据。即,提取在某种大小的时间点的范围存在的大于或等于1个片段振动数据。
振动数最大片段提取部12实施如下处理,即,通过对提取出的大于或等于1个片段振动数据的振动数进行比较,从而提取任意1个片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
例如,对观测时刻的全部或一部分相同的大于或等于1个片段振动数据的振动数进行比较,从大于或等于1个片段振动数据中,提取振动数最大的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV。
在图13的例子中,设想的是时序数据处理装置的结构要素即时序数据收集部1、片段提取部2、片段振动列确定部3、数据库登记部4、数据库5、片段振动数据提取部6、片段振动数据检索部9及可视化部10的每一者由专用的硬件构成,但时序数据处理装置也可以是由计算机构成的。
在时序数据处理装置由计算机构成的情况下,只要在图3所示的计算机的存储器41上构成数据库5,并且将记述有时序数据收集部1、片段提取部2、片段振动列确定部3、数据库登记部4、片段振动数据提取部6、片段振动数据检索部9及可视化部10的处理内容的程序存储于计算机的存储器41,计算机的处理器42执行存储于存储器41的程序即可。
图14是表示本发明的实施方式2的时序数据处理装置的处理内容的流程图。
图15是表示由片段振动数据提取部6的振幅最大片段提取部11进行的所需要的片段振动数据的提取处理的说明图。
图15(a)示出的是如下处理,即,提取观测时刻的全部或一部分相同的多个片段振动数据即在观测时刻为例如1230~1520左右的范围存在的多个片段振动数据中的在数据库5的表格MLV登记的1个片段振动数据。
在图15(a)的例子中,存在振幅为1的凸片(convex piece)形状图案的片段振动数据、以及振幅为3的凸片形状图案的片段振动数据,由于与振幅为1的凸片形状图案相比,振幅为3的凸片形状图案的振幅大,因此判断为振幅为3的凸片形状图案是振幅最大片段,将振幅为3的凸片形状图案的片段振动数据作为向数据库5的表格MLV登记的片段振动数据而提取。
在该情况下,不是振幅最大片段的振幅为1的凸片形状图案的片段振动数据没有登记于数据库5的表格MLV。
图15(b)表示出片段振动数据提取部6的振幅最大片段的提取结果。
图16是表示由片段振动数据提取部6提取出的振幅最大片段的可视化例的说明图。
在图16的例子中,图8(a)中的(A)的部分的图案被清晰地提取。
下面,对动作进行说明。
由于除了追加了振幅最大片段提取部11及振动数最大片段提取部12之外,与上述实施方式1同样,因此此处,主要对振幅最大片段提取部11及振动数最大片段提取部12的处理内容进行说明。
片段振动数据提取部6的振幅最大片段提取部11从在数据库5的表格LV登记的片段振动数据中,提取观测时刻的全部或一部分相同的大于或等于1个片段振动数据。即,提取在某种大小的时间点的范围存在的大于或等于1个片段振动数据。
振幅最大片段提取部11如果提取出大于或等于1个片段振动数据,则对该提取出的大于或等于1个片段振动数据的振幅进行比较。
在图15(a)的例子中,由于在窗口尺寸为1230~1520左右的范围,存在2个片段振动数据(振幅为1的凸片形状图案的片段振动数据、振幅为3的凸片形状图案的片段振动数据),因此对2个片段振动数据的振幅进行比较。
振幅最大片段提取部11从观测时刻的全部或一部分相同的大于或等于1个片段振动数据中,提取振幅最大的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV(图14的步骤ST11)。
在图15(a)的例子中,判断为振幅为3的凸片形状图案是振幅最大片段,从数据库5的表格LV提取振幅为3的凸片形状图案的片段振动数据。
片段振动数据提取部6的振动数最大片段提取部12从在数据库5的表格LV登记的片段振动数据中,提取观测时刻的全部或一部分相同的大于或等于1个片段振动数据。即,提取在某种大小的时间点的范围存在的大于或等于1个片段振动数据。
振动数最大片段提取部12如果提取出大于或等于1个片段振动数据,则对该提取出的大于或等于1个片段振动数据的振动数进行比较。
振动数最大片段提取部12从观测时刻的全部或一部分相同的大于或等于1个片段振动数据中,提取振动数最大的片段振动数据,将该提取出的片段振动数据登记于数据库5的表格MLV(图14的步骤ST12)。
如果片段振动数据提取部6的振幅最小片段提取部7、振动数最小片段提取部8、振幅最大片段提取部11及振动数最大片段提取部12从在数据库5的表格LV登记的片段振动数据中,提取出所需要的片段振动数据而登记于表格MLV,则片段振动数据检索部9从在数据库5的表格MLV登记的片段振动数据中,对与检索条件相符的片段振动数据进行检索(图14的步骤ST7)。
可视化部10如图16所示,例如,在第1轴为振幅,第2轴为窗口尺寸,第3轴为总出现数的3维图表上,对由片段振动数据检索部9检索出的片段振动数据的振幅、窗口尺寸及总出现数进行显示(图14的步骤ST8)。
由此可知,根据该实施方式2,由于构成为具备振幅最大片段提取部11,因此取得能够将在检测工厂的设备异常等方面重要的指标容易理解地显示于3维图表上的效果,该振幅最大片段提取部11通过对在数据库5的表格LV登记的片段振动数据中的、观测时刻的全部或一部分相同的大于或等于1个片段振动数据的振幅进行比较,从而从观测时刻的全部或一部分相同的大于或等于1个片段振动数据中,提取任意1个片段振动数据而将数据登记于数据库5的表格MLV。
另外,由于构成为具备振动数最大片段提取部12,因此取得能够将在检测工厂的设备异常等方面重要的指标容易理解地显示于3维图表上的效果,该振动数最大片段提取部12通过对在数据库5的表格LV登记的片段振动数据中的、观测时刻的全部或一部分相同的大于或等于1个片段振动数据的振动数进行比较,从而从观测时刻的全部或一部分相同的大于或等于1个片段振动数据中,提取任意1个片段振动数据而将数据登记于数据库5的表格MLV。
此外,本发明在其发明的范围内,能够进行各实施方式的自由的组合、或各实施方式的任意的构成要素的变形、或者各实施方式中任意的构成要素的省略。
工业实用性
本发明涉及的时序数据处理装置适用于需要从排列有各时刻的观测值的时序数据,提取用于对工厂的设备的异常、公司经营的异常等进行检测的指标的情况。
标号的说明
1时序数据收集部,2片段提取部,3片段振动列确定部,4数据库登记部,5数据库,6片段振动数据提取部,7振幅最小片段提取部,8振动数最小片段提取部,9片段振动数据检索部,10可视化部,11振幅最大片段提取部,12振动数最大片段提取部,21通信装置,22输入输出装置,23主存储装置,24外部存储装置,25运算装置,26显示装置,31、32上升片段,33局部列,33a开始时间点的观测值,33b结束时间点的观测值,33c开始时间点和结束时间点之间的观测值,34上升片段31的振幅,35上升片段32的振幅,41存储器,42处理器。
Claims (8)
1.一种时序数据处理装置,其具备:
片段提取部,其从排列有各时刻的观测值的时序数据中提取上升片段和下降片段,该上升片段为排列有伴随着时间的经过而表示出上升倾向的观测值的局部时序,该下降片段为排列有伴随着时间的经过而表示出下降倾向的观测值的局部时序;
片段振动列确定部,其在所述时序数据中,对由所述片段提取部提取出的上升片段和下降片段交替出现的片段的序列即片段振动列进行确定,对构成所述片段振动列的片段的数量即振动数及所述片段振动列的开始时间点和结束时间点的范围即窗口尺寸进行计数;
数据库登记部,其将由所述片段振动列确定部确定出的片段振动列的开始时间点的观测时刻、该片段振动列所包含的片段的振幅、以及由所述片段振动列确定部计出的振动数及窗口尺寸这四者的组,作为片段振动数据登记于数据库;以及
片段振动数据检索部,其从登记于所述数据库的片段振动数据中,对与检索条件相符的片段振动数据进行检索。
2.根据权利要求1所述的时序数据处理装置,其特征在于,
所述片段提取部针对所述时序数据,对提取所述上升片段及所述下降片段的范围进行初始设定,一边使所述提取的范围偏移,一边从所述时序数据提取所述上升片段及所述下降片段。
3.根据权利要求1所述的时序数据处理装置,其特征在于,
所述片段振动数据检索部在与所述检索条件相符的片段振动数据中,对振幅、振动数及窗口尺寸相同的片段振动数据的个数即总出现数进行计数。
4.根据权利要求3所述的时序数据处理装置,其特征在于,
具备可视化部,该可视化部在第1轴为振幅,第2轴为窗口尺寸,第3轴为总出现数的3维图表上,对由所述片段振动数据检索部检索出的片段振动数据的振幅、窗口尺寸及总出现数进行显示。
5.根据权利要求1所述的时序数据处理装置,其特征在于,
具备片段振动数据提取部,该片段振动数据提取部通过在登记于所述数据库的片段振动数据中,以振幅对振动数相同的片段振动数据进行分组,针对每个组,对属于该组的片段振动数据的窗口尺寸进行比较,从而从属于该组的片段振动数据中,提取任意1个片段振动数据,
所述片段振动数据检索部从由所述片段振动数据提取部提取出的片段振动数据中,对与检索条件相符的片段振动数据进行检索。
6.根据权利要求1所述的时序数据处理装置,其特征在于,
具备片段振动数据提取部,该片段振动数据提取部通过在登记于所述数据库的片段振动数据中,以振动数对振幅相同的片段振动数据进行分组,针对每个组,对属于该组的片段振动数据的窗口尺寸进行比较,从而从属于该组的片段振动数据中,提取任意1个片段振动数据,
所述片段振动数据检索部从由所述片段振动数据提取部提取出的片段振动数据中,对与检索条件相符的片段振动数据进行检索。
7.根据权利要求1所述的时序数据处理装置,其特征在于,
将在某种大小的时间点的范围存在的大于或等于1个片段振动数据称作观测时刻的全部或一部分相同的大于或等于1个片段振动数据,
所述时序数据处理装置具备片段振动数据提取部,该片段振动数据提取部通过对登记于所述数据库的片段振动数据中的、观测时刻的全部或一部分相同的大于或等于1个片段振动数据的振幅进行比较,从而从所述观测时刻的全部或一部分相同的大于或等于1个片段振动数据中,提取任意1个片段振动数据,
所述片段振动数据检索部从由所述片段振动数据提取部提取出的片段振动数据中,对与检索条件相符的片段振动数据进行检索。
8.根据权利要求1所述的时序数据处理装置,其特征在于,
将在某种大小的时间点的范围存在的大于或等于1个片段振动数据称作观测时刻的全部或一部分相同的大于或等于1个片段振动数据,
所述时序数据处理装置具备片段振动数据提取部,该片段振动数据提取部通过对登记于所述数据库的片段振动数据中的、观测时刻的全部或一部分相同的大于或等于1个片段振动数据的振动数进行比较,从而从所述观测时刻的全部或一部分相同的大于或等于1个片段振动数据中,提取任意1个片段振动数据,
所述片段振动数据检索部从由所述片段振动数据提取部提取出的片段振动数据中,对与检索条件相符的片段振动数据进行检索。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/071368 WO2017017785A1 (ja) | 2015-07-28 | 2015-07-28 | 時系列データ処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107851291A CN107851291A (zh) | 2018-03-27 |
CN107851291B true CN107851291B (zh) | 2019-04-19 |
Family
ID=57884300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580082003.7A Active CN107851291B (zh) | 2015-07-28 | 2015-07-28 | 时序数据处理装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20180046950A1 (zh) |
JP (1) | JP6355849B2 (zh) |
KR (1) | KR101823848B1 (zh) |
CN (1) | CN107851291B (zh) |
DE (1) | DE112015006488T5 (zh) |
TW (1) | TWI570581B (zh) |
WO (1) | WO2017017785A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11093548B1 (en) * | 2017-08-29 | 2021-08-17 | Vmware, Inc. | Dynamic graph for time series data |
CN109885598B (zh) * | 2019-01-25 | 2021-03-02 | 沈阳无距科技有限公司 | 故障识别方法、装置、计算机可读存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012128583A (ja) * | 2010-12-14 | 2012-07-05 | Mitsubishi Electric Corp | 異常検知装置、異常検知方法及び異常検知プログラム |
CN103487788A (zh) * | 2013-09-03 | 2014-01-01 | 中国电子科技集团公司第四十一研究所 | 一种序列脉冲信号快速自动提取方法 |
CN103853402A (zh) * | 2012-11-29 | 2014-06-11 | 瑞萨Sp驱动器公司 | 半导体装置及电子设备 |
KR20140110216A (ko) * | 2013-03-05 | 2014-09-17 | 서울대학교병원 | 진료패턴분석 시스템 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319706A (ja) * | 1994-05-24 | 1995-12-08 | Hitachi Ltd | ルール合成方法 |
US20050283337A1 (en) * | 2004-06-22 | 2005-12-22 | Mehmet Sayal | System and method for correlation of time-series data |
US8584073B2 (en) * | 2008-07-21 | 2013-11-12 | Synopsys, Inc. | Test design optimizer for configurable scan architectures |
-
2015
- 2015-07-28 KR KR1020177024449A patent/KR101823848B1/ko active IP Right Grant
- 2015-07-28 WO PCT/JP2015/071368 patent/WO2017017785A1/ja active Application Filing
- 2015-07-28 US US15/550,220 patent/US20180046950A1/en not_active Abandoned
- 2015-07-28 DE DE112015006488.5T patent/DE112015006488T5/de not_active Ceased
- 2015-07-28 JP JP2017530518A patent/JP6355849B2/ja active Active
- 2015-07-28 CN CN201580082003.7A patent/CN107851291B/zh active Active
- 2015-11-12 TW TW104137287A patent/TWI570581B/zh not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012128583A (ja) * | 2010-12-14 | 2012-07-05 | Mitsubishi Electric Corp | 異常検知装置、異常検知方法及び異常検知プログラム |
CN103853402A (zh) * | 2012-11-29 | 2014-06-11 | 瑞萨Sp驱动器公司 | 半导体装置及电子设备 |
KR20140110216A (ko) * | 2013-03-05 | 2014-09-17 | 서울대학교병원 | 진료패턴분석 시스템 |
CN103487788A (zh) * | 2013-09-03 | 2014-01-01 | 中国电子科技集团公司第四十一研究所 | 一种序列脉冲信号快速自动提取方法 |
Also Published As
Publication number | Publication date |
---|---|
TW201705023A (zh) | 2017-02-01 |
DE112015006488T5 (de) | 2018-01-04 |
CN107851291A (zh) | 2018-03-27 |
KR101823848B1 (ko) | 2018-01-30 |
JP6355849B2 (ja) | 2018-07-11 |
KR20170104633A (ko) | 2017-09-15 |
US20180046950A1 (en) | 2018-02-15 |
WO2017017785A1 (ja) | 2017-02-02 |
TWI570581B (zh) | 2017-02-11 |
JPWO2017017785A1 (ja) | 2017-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dutta et al. | In situ distribution guided analysis and visualization of transonic jet engine simulations | |
CN102915347B (zh) | 一种分布式数据流聚类方法及系统 | |
Sivaranjani et al. | Crime prediction and forecasting in Tamilnadu using clustering approaches | |
CN104112026B (zh) | 一种短信文本分类方法及系统 | |
US10496730B2 (en) | Factor analysis device, factor analysis method, and factor analysis program | |
Prasad et al. | Stream data mining: platforms, algorithms, performance evaluators and research trends | |
JP2002351897A (ja) | 情報利用頻度予測プログラム、情報利用頻度予測装置および情報利用頻度予測方法 | |
US20160253366A1 (en) | Analyzing a parallel data stream using a sliding frequent pattern tree | |
CN107851291B (zh) | 时序数据处理装置 | |
CN109144964A (zh) | 基于机器学习的日志解析方法和装置 | |
CN109791402B (zh) | 时间序列数据处理装置 | |
Plevris et al. | Literature review of masonry structures under earthquake excitation utilizing machine learning algorithms | |
JP2013164765A (ja) | ソースコード類似関係可視化装置 | |
Flick et al. | Conceptual Framework for manufacturing data preprocessing of diverse input sources | |
da F. Vieira et al. | Modularity based hierarchical community detection in networks | |
Loglisci et al. | Mining periodic changes in complex dynamic data through relational pattern discovery | |
Rahul et al. | Data cleaning mechanism for big data and cloud computing | |
CN104361058A (zh) | 一种面向海量数据流的哈希结构复杂事件检测方法 | |
EP3144749B1 (en) | Time-series data processing device and time-series data processing program | |
Ziying et al. | A New Bearing Fault Diagnosis Method Based on Refined Composite Multiscale Global Fuzzy Entropy and Self‐Organizing Fuzzy Logic Classifier | |
Vágner | The GridOPTICS clustering algorithm | |
Iglesias et al. | SDOclust: Clustering with Sparse Data Observers | |
Nagpal et al. | Feature selection using mutual information for high-dimensional data sets | |
Abu-Aisheh | Anytime and distributed approaches for graph matching | |
Sathya et al. | Detecting Spatial Outliers Algorithm for Spotting Non-linear Datasets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |