CN110476158A - 数据分析设备、数据分析方法和数据分析程序 - Google Patents

数据分析设备、数据分析方法和数据分析程序 Download PDF

Info

Publication number
CN110476158A
CN110476158A CN201880022162.1A CN201880022162A CN110476158A CN 110476158 A CN110476158 A CN 110476158A CN 201880022162 A CN201880022162 A CN 201880022162A CN 110476158 A CN110476158 A CN 110476158A
Authority
CN
China
Prior art keywords
data
unit
analysis
frequency analysis
training data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880022162.1A
Other languages
English (en)
Inventor
加藤京子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN110476158A publication Critical patent/CN110476158A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks

Abstract

一种数据分析设备(10),包括:频率分析单元(11),其在预定条件下对多个训练数据块中的每块执行频率分析,所述多个训练数据块包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块;聚类分析单元(12),其将频率分析后训练数据块聚类成数个类的频率分析后训练数据;计算单元(13),其基于聚类来计算被分配了同一标签的频率分析后训练数据块没有被包括在同一聚类中的程度;以及选择单元(14),其从多个被计算出的程度当中选择根据当最小的程度被计算出时的聚类分析单元(12)的聚类结果,作为用于对训练数据块分配标签的聚类模型。

Description

数据分析设备、数据分析方法和数据分析程序
技术领域
本发明涉及数据分析设备、数据分析方法和数据分析程序。
背景技术
需要一种基于由传感器等捕获的振动数据来自动检测诸如传感器的待观察设备中的异常的技术。注意,振动数据对应于例如随时间变化的数据。
通常,由这种传感器捕获的数据倾向于变成长时间序列数据。例如,为了从这种长时间序列数据中提取有用信息并检测异常,需要有关诸如统计分析和机器学习等领域的知识。还需要对数据重复执行各种操作。
另外,为了分析这种振动数据,已知利用例如快速傅立叶变换(FFT)对振动数据进行频率分析是有效的。
例如,设备的管理员很可能通过检查捕获的振动数据来确定设备是处于正常状态还是异常状态。这提高通过执行机器学习来自动检测设备的异常状态的可能性以允许通过检测模型自动地进行确定状态的管理员的任务。
然而,机器学习需要将“正常”标签或“异常”标签分配给大量振动数据。也就是说,执行机器学习带来执行高代价的标签任务的需要的问题。
此外,可以想见的是,对大量振动数据执行频率分析将导致检测模型的准确度增加。然而,简单地执行频率分析仍然难以从诸如传感器捕获的数据的长时间序列数据中提取有用信息并且找到有用的分析条件。
专利文献1公开一种图像处理设备,其包括:计算单元,该计算单元扫描在构成运动图像的每个帧中具有预定尺寸的每个区域以计算每个区域的重要程度;以及聚类单元(clustering unit),该聚类单元基于重要程度对区域进行聚类以生成至少一个区域聚类。
此外,专利文献2公开一种数据处理系统,其包括学习装置,该学习装置通过学习分配给学习图像上的至少一个区域的监督的标签与该区域中表示的图像之间的关系来构建模型。专利文献2中公开的数据处理系统包括检测装置,该检测装置接收与学习图像不同的检测图像作为输入,并且基于来自于被经历预定图像处理的检测图像和未经历图像处理的检测图像的模型检测包含对象的各自的区域。
此外,专利文献3公开一种过程异常诊断设备,其能够预先缩小将数据分离为正常数据和异常数据的阈值位于的区域,以确保即使在最坏的情况下,在阈值可能位于的区域中设置阈值,并且高可靠性地聚类正常数据和异常数据。
此外,专利文献4公开一种评估方法,其允许减少当对包括一个或多个滑动构件的机械设备中是否发生任何异常进行诊断时应用的算术处理负荷,并且实现诊断任务的速度和可靠性的增加。在专利文献4中公开的评估方法中,根据机械设备发出的声音或振动产生测量的频谱数据。
使用专利文献2中公开的技术允许有效地执行昂贵的标记任务。此外,使用专利文献1和专利文献3至4中公开的任何一种技术允许从诸如由传感器捕获的数据的长时间序列数据中提取有用信息,并且还允许找到有用的分析条件。
引用清单
专利文献
专利文献1:日本专利申请公开No.2016-219879
专利文献2:日本专利申请公开No.2016-062524
专利文献3:日本专利No.4762088
专利文献4:日本专利No.4003086
发明内容
技术问题
在专利文献2中,已经描述了减少将标签分配给学习图像的负担,但是还没有描述通过提出的学习处理生成的模型的准确度的增加。类似地,在专利文献1和专利文献3至4中,没有描述通过提出的学习处理生成的模型的准确度的提高。
[本发明的目的]
因此,本发明的目的是为了提供一种数据分析设备、数据分析方法和数据分析程序,其解决上述问题并允许提高由学习处理产生的模型的准确性。
问题的解决方案
根据本发明的数据分析设备包括频率分析单元,该频率分析单元被配置成在预定条件下对多个训练数据块中的每块执行频率分析,所述多个训练数据块包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块;聚类分析单元,该聚类分析单元被配置成将频率分析后训练数据块聚类成数个类的频率分析后训练数据;计算单元,该计算单元被配置成基于聚类来计算被分配了同一标签的频率分析后训练数据块没有被包括在同一聚类中的程度;以及选择单元,该选择单元被配置成,从当频率分析单元在多个条件下对多个类的训练数据块中的每一个执行频率分析时计算出的多个程度当中,选择根据当计算出最小程度时的聚类分析单元的聚类结果,作为用于对训练数据块分配标签的聚类模型。
根据本发明的数据分析方法包括:在预定条件下对多个训练数据块的每块执行频率分析,所述多个训练数据块包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块;将频率分析后训练数据块聚类成数个类的频率分析后训练数据;基于聚类,来计算被分配了同一标签的频率分析后训练数据块没有被包括在同一聚类中的程度;以及,从当在多个条件下对多个类的训练数据块中的每一个执行频率分析时计算出的多个程度当中,选择当计算出最小程度时做出的聚类结果,作为用于对训练数据块分配标签的聚类模型。
根据本发明的数据分析程序使计算机执行:
频率分析处理,在预定条件下对多个训练数据块中的每块执行频率分析,所述多个训练数据块包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块;聚类分析处理,将频率分析后训练数据块聚类成数个类的频率分析后训练数据;计算处理,基于聚类来计算被分配了同一标签的频率分析后训练数据块没有被包括在同一聚类中的程度;以及选择处理,从当在多个条件下对多个类的训练数据块中的每一个执行频率分析时计算出的多个程度当中,选择当计算出最小程度时做出的聚类结果,作为用于对训练数据块分配标签的聚类模型。
本发明的有益效果
根据本发明,可以提高由学习处理生成的模型的精度。
附图说明
图1是示出根据本发明的数据分析设备的第一示例性实施例的示例性配置的框图。
图2是示出第一示例性实施例的数据分析设备10的分析处理的操作的流程图。
图3是示出根据本发明的振动数据分析设备的第二示例性实施例的示例性配置的框图。
图4是示出由学习频率分析单元121执行的时频分析处理的示例的说明图。
图5是示出由距离计算单元124要执行的距离计算处理的示例的说明图。
图6是示出由学习矩阵转换单元125执行的矩阵转换处理的示例的说明图。
图7是示出第二示例性实施例的振动数据分析设备100的学习处理的操作的流程图。
图8是示出第二示例性实施例的振动数据分析设备100的确定处理的操作的流程图。
图9是示出根据本发明的振动数据分析设备的第三示例性实施例的示例性配置的框图。
图10是示出第三示例性实施例的振动数据分析设备101的学习处理的操作的流程图。
具体实施方式
示例性实施例1
在下文中,将参考附图给出对本发明的示例性实施例的描述。图1是示出根据本发明的数据分析设备的第一示例性实施例的示例性配置的框图。根据本发明的数据分析设备10包括频率分析单元11(例如,学习频率分析单元121),其被配置成在预定条件下对包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块的多个训练数据块中的每块执行频率分析;聚类分析单元12(例如,聚类处理单元122),其被配置成将频率分析后训练数据块聚类成多个类的频率分析后训练数据;计算单元13(例如,误分类率计算单元128),其被配置成基于聚类来计算被分配同一标签的频率分析后训练数据块不包括在同一聚类中的程度;以及选择单元14(例如,最佳条件选择单元123),其被配置成,从当频率分析单元11在多个条件下对多个类的训练数据块中的每一个执行频率分析时计算出的多个程度当中,选择根据当计算出最小程度时的聚类分析单元12的聚类结果,作为用于给训练数据块分配标签的聚类模型。
在下文中,将描述由数据分析设备10执行的分析处理。图2是示出第一示例性实施例的数据分析设备10的分析处理的操作的流程图。
首先,频率分析单元11从指定条件中提取尚未执行频率分析的预定条件。也就是说,频率分析单元11进入条件循环(步骤S11)。
频率分析单元11在预定条件下对多个训练数据块中的每块执行频率分析(步骤S12),所述多个训练数据块包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块。
接下来,聚类分析单元12将频率分析后训练数据块聚类成数个类的频率分析后训练数据(步骤S13)。
接下来,计算单元13基于聚类计算分配同一标签的频率分析后训练数据块不包括在同一聚类中的程度(步骤S14)。
数据分析设备10重复执行步骤S12至步骤S14中的处理,同时保持在指定条件中尚未执行频率分析的条件。在每个指定条件下执行步骤S12至步骤S14中的处理,并且将其重复与指定条件的数量一样多的次数。
当在用于频率分析的所有指定的条件下执行频率分析时,数据分析设备10退出条件循环(步骤S15)。
接下来,选择单元14从多个计算出的程度中选择当计算最小程度时根据聚类分析单元12的聚类模型作为用于向训练数据块分配标签的聚类模型(步骤S16)。在选择之后,数据分析设备10使分析处理结束。
这样的配置允许数据分析设备提高由学习处理生成的模型的准确性。
数据分析设备10还可以包括学习单元(例如,学习单元127),其被配置成通过使用已经选择的聚类模型执行学习处理来生成包括在预定类中的数据的确定模型。
这样的配置允许数据分析设备通过执行学习处理来生成更准确的模型。
数据分析设备10还可以包括存储单元(例如,条件存储单元130),其被配置成存储与已经选择的聚类模型相关联的条件。
这种配置允许数据分析设备管理用于频率分析的最佳条件。
数据分析设备10还可以包括:确定单元(例如,确定单元163),被配置成确定输入数据是否对应于包括在预定类中的数据,频率分析单元11可以在存储在存储单元中的条件下对输入数据执行频率分析;以及确定单元,该确定单元可以使用由学习单元生成的预定类中包括的数据的确定模型来确定频率分析的输入数据是否对应于包括在预定类中的数据。
这样的配置允许数据分析设备使用高度精确的模型来确定输入数据的类型。
此外,学习单元可以使用通过将每个频率分析后训练数据块转换为矩阵而得到的数据来执行学习处理。
这样的配置允许数据分析设备生成适合于学习处理的算法的数据。
此外,可以根据深度学习算法来执行学习处理。
这样的配置允许数据分析设备通过执行学习处理来生成更准确的模型。
示例性实施例2
[配置的描述]
在下文中,将参考附图给出对本发明的第二示例性实施例的描述。图3是示出根据本发明的振动数据分析设备的第二示例性实施例的示例性配置的框图。
本示例性实施例的振动数据分析设备通过对相对于时间的振动数据集执行频率分析来获得频谱图。接下来,振动数据分析设备通过使用由此获得的频谱图执行机器学习来生成异常检测模型。
具体地,本示例性实施例的振动数据分析设备对除了时间之外的分析目标范围、频率等在各种条件下的振动数据集执行综合频率分析。振动数据分析设备在每个条件下执行频率分析,并且然后将频率分析后数据集聚类成两个聚类。
然后,振动数据分析设备基于最佳聚类结果向频谱图分配“正常”标签或“异常”标签。使用上述方法允许本示例性实施例的振动数据分析设备在有效地执行标记的同时生成高度精确的异常检测模型。
如图3中所示,振动数据分析设备100包括训练振动数据存储单元110、振动数据学习单元120、条件存储单元130、模型存储单元140、输入振动数据存储单元150和振动数据确定单元160。
振动数据分析设备100是分析振动数据的设备。振动数据分析设备100例如是个人计算机(PC)。此外,振动数据分析设备100可以是服务器、智能电话等。
此外,振动数据分析设备100可以由一个终端构成,或者可以由多个终端构成。例如,振动数据学习单元120和振动数据确定单元160可以包括在同一终端中,或者可以单独地包括在不同的终端中。
训练振动数据存储单元110具有存储振动数据组(时间序列数据集)的能力,该振动数据组是要在机器学习中使用的时间序列数据。例如,训练振动数据存储单元110存储包含用于每个目标数据的逗号分隔的值(CSV)文件格式的数值的时间序列数据。注意,训练振动数据存储单元110是通用存储设备。
如图3中所示,振动数据学习单元120包括学习频率分析单元121、聚类处理单元122、最佳条件选择单元123、学习矩阵转换单元125、标记单元126和学习单元127。
振动数据学习单元120对训练振动数据存储单元110中保持的训练振动数据执行时频分析。接下来,振动数据学习单元120通过使用被经历时频分析的数据(以下称为时频分析的数据)执行监督的机器学习来生成异常检测模型。
学习频率分析单元121具有通过基于预先准备的条件组对时序数据集(训练振动数据集)执行时频分析来生成时频分析的数据的能力。
频率分析的条件例如是分析目标范围、时间条件和频率条件的组合。分析目标范围是用于提取相对于时间的分析目标范围的条件。分析目标范围定义在训练振动数据中要分析的时间范围。
例如,“时间0到时间2”或“时间10到时间30”被指定为分析目标范围。请注意,分析目标范围是由用户或系统预定义。
当分析指定为分析目标范围的范围时,时间条件是时间轴的条件。例如,时间条件指示通过划分诸如四或八的时间轴而获得的片段的数量。请注意,时间条件由用户或系统预定义。
当分析指定为分析目标范围的范围时,频率条件是频率轴的条件。例如,频率条件指示诸如4、8或12的频带数或带宽。也就是说,频率条件指示通过划分频率轴获得的片段的数量。频率条件由用户或系统预定义。
图4是示出由学习频率分析单元121执行的时频分析处理的示例的说明图。图4示出要在顶部处理的训练振动数据。由图4的顶部所示的虚线定义的矩形是指定为分析目标范围的范围。
例如,学习频率分析单元121对被指定为分析目标范围的范围中的数据的其数量由时间条件指示的每个片段应用快速傅立叶变换。接下来,学习频率分析单元121根据作为快速傅里叶变换的结果输出的值来计算功率积分值,并生成功率矢量。
图4示出由学习频率分析单元121生成的时频分析的数据被绘制在中间的曲线图。横坐标轴上的Pij表示片段i和频带fj中的功率谱。纵坐标轴表示每个功率谱(功率)的值。注意,时频分析的其他条件在图4中间所示的示例中指定。
图4示出由学习频率分析单元121在底部生成的功率矢量。Ti表示片段i中的时间窗长度。如图4的底部所示,功率矢量由功率谱组成。
聚类处理单元122具有基于时频分析的数据针对频率分析的每个条件将训练振动数据集聚类为两个聚类、正常数据和异常数据的能力。
聚类处理单元122使用的聚类方法是例如k均值方法。注意,聚类处理单元122可以使用除了k均值方法之外的方法来执行聚类。
最佳条件选择单元123具有选择具有聚类中心之间的最大距离的聚类模型作为最佳模型的能力。最佳条件选择单元123在条件存储单元130中存储最佳条件,该最佳条件是与已经选择的聚类模型相关联的频率分析的条件。
最佳条件选择单元123包括距离计算单元124。距离计算单元124具有计算聚类中心之间的距离的能力。距离计算单元124计算例如欧几里德距离作为距离。注意,距离计算单元124可以计算欧几里德距离以外的距离。
图5是示出距离计算单元124要执行的距离计算处理的示例的说明图。图5示出要在左侧处理的训练振动数据。要处理的训练振动数据由20块数据D1至D20构成。此外,图5示出由学习频率分析单元121在中间执行的时频分析的结果。
图5示出右侧处的聚类处理单元122生成聚类模型的结果。例如,图5右侧的“第一条件:聚类结果”表示通过聚类处理单元122在图5的中间所示的第一条件下将时频分析的结果聚类为由白色圆圈表示的数据和由黑色圆圈表示的数据的结果。
基于聚类处理单元122执行的聚类的结果,距离计算单元124计算聚类的中心之间的距离。如图5的右侧所示,在第二条件下,聚类之间的距离大于在第一条件下的距离。也就是说,第二个条件是更优选的。
学习矩阵转换单元125具有将时频分析的数据转换成适合于学习算法的矩阵的能力。例如,当学习单元127使用卷积神经网络(CNN)作为学习算法时,学习矩阵转换单元125将时频分析的数据转换为图像。
图6是示出由学习矩阵转换单元125执行的矩阵转换处理的示例的说明图。在图6中示出的示例中,学习矩阵转换单元125将功率矢量转换为灰度光谱图图像。注意,Lij表示当执行矩阵转换时从Pij获得的值(亮度值)。
虽然图6示出将功率矢量转换为灰度图像的示例,但是学习矩阵转换单元125可以将功率矢量转换为彩色图像。
标记单元126具有将“正常”标签或“异常”标签分配给转换成矩阵的时频分析的数据的能力。
在许多情况下,异常数据的量通常小于训练振动数据集中的正常数据。因此,当给出“正常”标签或“异常”标签时,标记单元126可以将“异常”标签分配给包括在具有较少数量元素的聚类中的数据,并将“正常”标签分配给包括在具有更多元素的聚类中的数据。
请注意,可以手动执行标签本身。例如,对于这种手动标记,仅可视觉识别代表性数据,诸如位于聚类中心的数据,并且然后将“正常”标签或“异常”标签分配给数据。
学习单元127具有使用被标记并转换成矩阵的时频分析的数据执行监督的机器学习的能力。学习单元127通过执行监督的机器学习来生成异常检测模型。
由学习单元127执行的监督的机器学习的学习算法例如是诸如卷积神经网络(CNN)的深度学习算法。然而,学习算法可以是除了深度学习算法之外的算法。
条件存储单元130具有保持由振动数据学习单元120的最佳条件选择单元123选择的时间-频率分析的最佳条件的能力。注意,条件存储单元130是一般的存储设备,如在训练振动数据存储单元110的情况中一样。
模型存储单元140具有保持由振动数据学习单元120生成的学习的异常检测模型的能力。注意,模型存储单元140是与训练振动数据存储单元110的情况一样的通用存储设备。
输入振动数据存储单元150具有存储要确定的振动数据组的能力。注意,输入振动数据存储单元150是与训练振动数据存储单元110的情况一样的通用存储设备。
如图3中所示,振动数据确定单元160包括确定频率分析单元161、确定矩阵转换单元162和确定单元163。
振动数据确定单元160对保持在输入振动数据存储单元150中的输入振动数据执行时频分析,并将输入的振动数据转换为矩阵。接下来,振动数据确定单元160通过将转换成矩阵的时频分析的数据输入到异常检测模型来确定输入的振动数据是正常数据还是异常数据。
确定频率分析单元161具有与学习频率分析单元121的能力相同的能力。确定频率分析单元161检索存储在条件存储单元130中的条件,并将该条件用作时频分析的条件。
确定矩阵转换单元162具有与学习矩阵转换单元125的能力相同的能力。
确定单元163具有通过将转换成矩阵的时频分析的数据输入到从模型存储单元140检索的异常检测模型中来确定要确定的输入振动数据是正常数据还是异常数据的能力。
[操作的描述]
在下文中,将参考图7至图8给出本示例性实施例的振动数据分析设备100的操作的描述。振动数据分析设备100的操作被划分成两个:学习阶段的操作和确定阶段的操作。
在学习阶段,振动数据分析设备100通过学习要学习的振动数据与正常数据和异常数据之间的关系来生成异常检测模型。另一方面,在确定阶段,振动数据分析设备100通过将要确定的振动数据输入到异常检测模型中来确定要确定的振动数据是正常数据还是异常数据。
首先,将参考图7给出对本示例性实施例的振动数据分析设备100的学习阶段中的操作的描述。图7是示出第二示例性实施例的振动数据分析设备100的学习处理的操作的流程图。
首先,振动数据学习单元120从训练振动数据存储单元110检索要用于学习的训练振动数据集。振动数据学习单元120读取已经检索的训练振动数据集(步骤S101)。
接下来,振动数据学习单元120从用于频率分析的指定条件的组合中提取尚未执行频率分析的条件的组合。也就是说,振动数据学习单元120进入条件循环(步骤S102)。
接下来,振动数据学习单元120从已经读取的训练振动数据集中提取尚未执行频率分析的训练振动数据。也就是说,振动数据学习单元120进入频率分析循环(步骤S103)。
振动数据学习单元120的学习频率分析单元121通过在已经提取的条件下对目标训练振动数据执行时频分析来生成诸如功率矢量的时频分析的数据(步骤S104)。注意,已经提取的条件对应于上述分析目标范围、时间条件、频率条件等的组合。
学习频率分析单元121重复执行步骤S104中的处理,同时保留已经在已经读取的训练振动数据集中尚未执行时频分析的训练振动数据。对每块训练振动数据执行步骤S104中的处理,并且重复与在步骤S101中检索的训练振动数据的块数一样多的次数。
当如此检索的所有训练振动数据已经被经历时频分析时,学习频率分析单元121退出频率分析循环(步骤S105)。
接下来,振动数据学习单元120的聚类处理单元122将时频分析的数据集聚类为针对每个条件的两个聚类(步骤S106)。
接下来,振动数据学习单元120的最佳条件选择单元123的距离计算单元124计算聚类的中心之间的距离L(步骤S107)。
接下来,当在步骤S107中计算的距离L大于最大值(max(L))时,最佳条件选择单元123将最大值更新为距离L(max(L)=L)。此外,最佳条件选择单元123将最佳条件(分析目标范围、时间条件、频率条件)更新为用于计算距离L的聚类结果的条件(步骤S108)。
振动数据学习单元120重复执行步骤S103至步骤S108中的处理,同时在频率分析的指定条件的组合中仍然存在尚未执行时频分析的条件的组合。在每个条件组合下执行步骤S103到步骤S108中的处理,并且重复与用于频率分析的指定条件的组合的数目一样多的次数。
当在用于频率分析的指定条件的所有组合下执行时频分析时,学习频率分析单元121退出条件循环(步骤S109)。
接下来,最佳条件选择单元123将距离的最大值max(L)与预设阈值d进行比较,以检查max(L)是否小于d(步骤S110)。注意,不需要预设阈值d。
当max(L)小于d时(步骤S110中的真),最佳条件选择单元123确定聚类已经失败(步骤S111)。振动数据分析设备100终止学习处理。
当max(L)等于或大于d时(步骤S110中的假),最佳条件选择单元123将最佳条件(分析目标范围、时间条件、频率条件)存储到条件存储单元130中(步骤S112)。
接下来,振动数据学习单元120从已经存储的最佳条件下处理的时频分析的数据集中提取尚未标记的时频分析的数据。也就是说,振动数据学习单元120进入标记循环(步骤S113)。
振动数据学习单元120的学习矩阵转换单元125将在最佳条件下处理的目标时频分析的数据转换为适合于学习算法的矩阵(步骤S114)。
接下来,振动数据学习单元120的标记单元126使用与最佳条件相关联的聚类模型(聚类结果)对每个转换成矩阵的数据进行分类。接下来,标记单元126将“正常”标签或“异常”标签分配给如此分类的每块数据(步骤S115)。
振动数据学习单元120重复执行步骤S114和步骤S115中的处理,同时保留尚未在时频分析的数据集中标记的时频分析的数据。对于每块被时频分析的数据执行步骤S114和步骤S115中的处理,并且重复与在步骤S101中检索的训练振动数据的数量一样多的次数。
当已经标记所有时频分析的数据时,振动数据学习单元120退出标记循环(步骤S116)。
接下来,学习单元127使用在步骤S115中标记的训练振动数据集(转换成矩阵的时频分析的数据集)执行监督的机器学习(步骤S117)。学习单元127通过执行监督的机器学习来生成异常检测模型。
接下来,学习单元127将在步骤S117中生成的异常检测模型存储到模型存储单元140中(步骤S118)。在存储之后,振动数据分析设备100结束学习处理。
注意,在上面的示例中,学习单元127自动地将聚类之间具有最大距离的聚类模型作为最佳模型。然而,最佳条件选择单元123可以按照距离的降序将聚类模型候选输入到学习矩阵转换单元125中,并且学习单元127可以从多个模型中选择最佳模型。
接下来,将参考图8给出对本示例性实施例的振动数据分析设备100的确定阶段中的操作的描述。图8是示出第二示例性实施例的振动数据分析设备100的确定处理的操作的流程图。
首先,振动数据确定单元160从模型存储单元140读取由学习单元127生成的异常检测模型(步骤S121)。
接下来,振动数据确定单元160从输入振动数据存储单元150中检索输入振动数据集。振动数据确定单元160读取由此检索的输入振动数据集(步骤S122)。
接下来,振动数据确定单元160从条件存储单元130读取由最佳条件选择单元123选择的最佳条件(步骤S123)。
接下来,振动数据确定单元160从已经读取的输入振动数据集中提取尚未确定的输入振动数据。也就是说,振动数据确定单元160进入确定循环(步骤S124)。
振动数据确定单元160的确定频率分析单元161通过在步骤S123中读取的最佳条件(分析目标范围、时间条件、频率条件)下对目标输入振动数据执行时频分析来生成诸如功率矢量的时频分析的数据(步骤S125)。注意,时频分析处理与学习阶段中的步骤S104中的处理相同。
接下来,振动数据确定单元160的确定矩阵转换单元162将时频分析的数据转换为矩阵(步骤S126)。注意,矩阵转换处理与学习阶段中的步骤S114中的处理相同。
接下来,振动数据确定单元160的确定单元163通过将在步骤S126中转换为矩阵的时频分析的数据输入到在步骤S121中读取的异常检测模型确定目标输入振动数据是正常数据还是异常数据(步骤S127)。
振动数据确定单元160重复执行步骤S125至步骤S127中的处理,同时保留输入振动数据集中尚未确定的输入振动数据。对于每块输入振动数据执行步骤S125到步骤S127中的处理,并且重复与在步骤S122中检索的输入振动数据的数量一样多的次数。
当已经确定所有输入振动数据时,振动数据确定单元160退出确定循环(步骤S128)。在退出确定循环之后,振动数据分析设备100使确定处理结束。上述处理允许振动数据分析设备100确定振动数据是正常数据还是异常数据。
[效果的描述]
本示例性实施例的振动数据学习单元120的学习频率分析单元121在各种条件下(分析目标范围、频率、时间等等)对作为多块时间序列数据的集合的振动数据集执行频率分析。
聚类处理单元122基于针对每个条件的频率分析后数据而将每个训练振动数据聚类成两个聚类。接下来,最佳条件选择单元123选择最佳聚类模型。
接下来,学习矩阵转换单元125将频率分析后数据转换为与学习算法兼容的矩阵。接下来,标记单元126使用已经选择的最佳聚类模型将“正常”标签或“异常”标签分配给转换成矩阵的频率分析后数据。
接下来,学习单元127通过使用分配有标签的多块数据执行机器学习来生成异常检测模型。上述配置允许本示例性实施例的振动数据学习单元120有效地执行标记。也就是说,减少标记的工作量。
此外,因为学习单元127学习根据分析目标范围、时间、频率等的组合提取的特征作为确定数据是正常数据还是异常数据的因素,所以要生成的异常检测模型精度被增加。
此外,本示例性实施例的振动数据确定单元160可以检测异常振动数据。此外,当学习单元127执行使用深度学习的监督的学习时,确定单元163可以掌握比仅执行聚类的情况更详细的特征,并且然后对输入的振动数据进行确定。
示例性实施例3
[配置的描述]
在下文中,将参考附图给出对本发明的第三示例性实施例的描述。图9是示出根据本发明的振动数据分析设备的第三示例性实施例的示例性配置的框图。
除了最佳条件选择单元123包括误分类率计算单元128而不是距离计算单元124之外,本示例性实施例的振动数据分析设备101在配置上与第二示例性实施例的振动数据分析设备100相同。
存储在本示例性实施例的训练振动数据存储单元110中的训练振动数据集包含预先分配“正常”标签或“异常”标签的振动数据。振动数据学习单元120提取标记的训练振动数据。
本示例性实施例的误分类率计算单元128计算误分类率,该误分类率表示已被分配同一标签但尚未被分组到同一聚类中的数据的程度。本示例性实施例的最佳条件选择单元123选择作为最佳条件的这样计算的误分类率变为最小值的条件的组合,而不是聚类之间的距离变为最大值的条件的组合。
例如,假设提取分配“正常”标签的M块振动数据和分配“异常”标签的N块振动数据。当所有“正常”振动数据存在于同一聚类中并且所有“异常”振动数据存在于除了存在“正常”振动数据的聚类之外的聚类中时,误分类率计算单元128将误分类率计算为“0”。
此外,例如,当m块“正常”振动数据和n块“异常”振动数据被分组成与预期聚类不同的聚类时,误分类率计算单元128将误分类率计算为“(m/M)+(n/N)”。注意,误分类率计算单元128可以通过任何方法计算误分类率,只要误分类率表示已经分配同一标签但尚未被分组到同一聚类中的数据的程度。
注意,当由此计算的误分类率大于阈值d时,本示例性实施例的最佳条件选择单元123可以确定聚类已经失败。
[操作的描述]
在下文中,将参考图10给出对本示例性实施例的振动数据分析设备101的学习阶段中的操作的描述。图10是示出第三示例性实施例的振动数据分析设备101的学习处理的操作的流程图。
注意,本示例性实施例的振动数据分析设备101的确定阶段中的操作与图8中所示的确定处理的操作相同。
首先,振动数据学习单元120从训练振动数据存储单元110检索已被标记并将用于学习的训练振动数据集。振动数据学习单元120读取由此检索的训练振动数据集(步骤S201)。
步骤S202至步骤S206中的处理与图7中所示的步骤S102至步骤S106中的处理相同。
接下来,振动数据学习单元120的最佳条件选择单元123的误分类率计算单元128根据聚类结果计算误分类率W(步骤S207)。
接下来,当在步骤S207中计算的误分类率W小于最小值(min(W))时,最佳条件选择单元123将最小值更新为误分类率W(min(W)=W)。此外,最佳条件选择单元123将最佳条件(分析目标范围、时间条件、频率条件)更新为用于根据其计算误分类率W的聚类结果的条件(步骤S208)。
步骤S209中的处理与图7中所示的步骤S109中的处理相同。
接下来,最佳条件选择单元123将误分类率的最小值min(W)与预设阈值d进行比较,以检查min(W)是否大于d(步骤S210)。注意,不需要预设阈值d。
当min(W)大于d(步骤S210中为真)时,最佳条件选择单元123确定聚类已经失败(步骤S211)。振动数据分析设备100终止学习处理。
当min(W)等于或小于d时(步骤S210中的假),最佳条件选择单元123将最佳条件(分析目标范围、时间条件、频率条件)存储到条件存储单元130中(步骤S212)。
步骤S213至步骤S218中的处理与图7中所示的步骤S113至步骤S118中的处理相同。
[效果的描述]
在本示例性实施例的振动数据分析设备101中,聚类处理单元122对每个预先分配正确标签的多块振动数据进行聚类,并且最佳条件选择单元123基于聚类结果选择最佳条件,允许生成的异常检测模型的准确性被增加。
可以想见每个示例性实施例的振动数据分析设备适用于诸如机器工具的故障检测的领域。
注意,示例性实施例的数据分析设备10、振动数据分析设备100和振动数据分析设备101可以各自利用例如根据存储在非暂时性存储介质中的程序执行处理的中央处理单元(CPU)来实现。即,频率分析单元11、聚类分析单元12、计算单元13、选择单元14、学习频率分析单元121、聚类处理单元122、最佳条件选择单元123、学习矩阵转换单元125、标记单元126、学习单元127、确定频率分析单元161、确定矩阵转换单元162和确定单元163可以利用例如在程序的控制下执行处理的CPU来实现。
此外,训练振动数据存储单元110、条件存储单元130、模型存储单元140和输入振动数据存储单元150可以利用例如随机存取存储器(RAM)来实现。
此外,示例性实施例的数据分析设备10、振动数据分析设备100和振动数据分析设备101的每个组件可以利用硬件电路实现。作为示例,频率分析单元11、聚类分析单元12、计算单元13、选择单元14、训练振动数据存储单元110、学习频率分析单元121、聚类处理单元122、最佳条件选择单元123、学习矩阵转换单元125、标记单元126、学习单元127、条件存储单元130、模型存储单元140、输入振动数据存储单元150、确定频率分析单元161、确定矩阵转换单元162和确定单元163均利用大规模集成(LSI)来实现。可替选地,所有上述单元可以利用单个LSI实现。
尽管在上面参考示例性实施例和示例描述本申请的发明,但是本申请的发明不限于上述示例性实施例和示例。在本申请的发明范围内,可以对本申请的发明的配置和细节进行本领域技术人员可以理解的各种改变。
本申请要求基于2017年3月28日提交的日本专利申请No.2017-062119的优先权,其公开内容以其整体合并在此。
参考标记清单
10 数据分析设备
100、101 振动数据分析设备
11 频率分析单元
12 聚类分析单元
13 计算单元
14 选择单元
110 训练振动数据存储单元
120 振动数据学习单元
121 学习频率分析单元
122 聚类处理单元
123 最佳条件选择单元
124 距离计算单元
125 学习矩阵转换单元
126 标签单元
127 学习单元
128 误分类率计算单元
130 条件存储单元
140 模型存储单元
150 输入振动数据存储单元
160 振动数据确定单元
161 确定频率分析单元
162 确定矩阵转换单元
163 确定单元

Claims (10)

1.一种数据分析设备,包括:
频率分析单元,所述频率分析单元被配置成:在预定条件下对多个训练数据块中的每块执行频率分析,所述多个训练数据包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块;
聚类分析单元,所述聚类分析单元被配置成将频率分析后的训练数据块聚类成数个类的频率分析后训练数据;
计算单元,所述计算单元被配置成:基于所述聚类,计算被分配了同一标签的频率分析后训练数据块没有被包括在同一聚类中的程度;以及
选择单元,所述选择单元被配置成:从当所述频率分析单元在多个条件下对所述多个类的训练数据块中的每一个执行频率分析时所计算出的多个程度当中,选择根据当计算出最小程度时的所述聚类分析单元的聚类结果,作为用于对训练数据块分配标签的聚类模型。
2.根据权利要求1所述的数据分析设备,还包括学习单元,所述学习单元被配置成:
通过使用已经被选择的聚类模型执行学习处理,来生成在预定类中包括的数据的确定模型。
3.根据权利要求2所述的数据分析设备,还包括存储单元,所述存储单元被配置成:
存储与已经被选择的聚类模型相关联的条件。
4.根据权利要求3所述的数据分析设备,还包括确定单元,所述确定单元被配置成:
确定输入数据是否对应于在所述预定类中包括的数据,
其中,
所述频率分析单元在所述存储单元所存储的条件下对所述输入数据执行所述频率分析,以及
所述确定单元使用由所述学习单元生成的所述预定类中包括的数据的确定模型,来确定频率分析后的输入数据是否对应于在所述预定类中包括的数据。
5.根据权利要求2至4中任意一项所述的数据分析设备,其中,
所述学习单元使用从将每个所述频率分析后训练数据块转换成矩阵而得到的数据,来执行所述学习处理。
6.根据权利要求1至5中的任意一项所述的数据分析设备,其中,
根据深度学习算法,来执行所述学习处理。
7.一种数据分析方法,包括:
在预定条件下,对多个训练数据块中的每块执行频率分析,所述多个训练数据块包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块;
将频率分析后的训练数据块聚类成数个类的频率分析后训练数据;
基于所述聚类,计算被分配了同一标签的频率分析后训练数据块没有被包括在同一聚类中的程度;以及
从当在多个条件下对所述多个类的训练数据块中的每一个执行所述频率分析时所计算出的多个程度当中,选择当计算出最小程度时做出的聚类结果,作为用于对训练数据块分配标签的聚类模型。
8.根据权利要求7所述的数据分析方法,还包括:
通过使用已经被选择的聚类模型执行学习处理,来生成在预定类中包括的数据的确定模型。
9.一种数据分析程序,其用于使计算机执行:
频率分析处理,在预定条件下对多个训练数据块中的每块执行频率分析,所述多个训练数据块包括其中一些已经被分配了指示数据类的标签的多个类的训练数据块;
聚类分析处理,将频率分析后的训练数据块聚类成数个类的频率分析后训练数据;
计算处理,基于所述聚类,计算被分配了同一标签的频率分析后训练数据块没有被包括在同一聚类中的程度;以及
选择处理,从当在多个条件下对所述多个类的训练数据块中的每一个执行所述频率分析时所计算出的多个程度当中,选择当计算出最小程度时做出的聚类结果,作为用于对训练数据块分配标签的聚类模型。
10.根据权利要求9所述的数据分析程序,还使所述计算机执行:
生成处理,通过使用已经被选择的聚类模型执行学习处理,来生成在预定类中包括的数据的确定模型。
CN201880022162.1A 2017-03-28 2018-03-02 数据分析设备、数据分析方法和数据分析程序 Pending CN110476158A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017062119 2017-03-28
JP2017-062119 2017-03-28
PCT/JP2018/008007 WO2018180197A1 (ja) 2017-03-28 2018-03-02 データ解析装置、データ解析方法およびデータ解析プログラム

Publications (1)

Publication Number Publication Date
CN110476158A true CN110476158A (zh) 2019-11-19

Family

ID=63675493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880022162.1A Pending CN110476158A (zh) 2017-03-28 2018-03-02 数据分析设备、数据分析方法和数据分析程序

Country Status (4)

Country Link
US (1) US11593299B2 (zh)
JP (1) JP6828807B2 (zh)
CN (1) CN110476158A (zh)
WO (1) WO2018180197A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7134845B2 (ja) * 2018-11-21 2022-09-12 株式会社日立製作所 分析支援装置、分析支援方法、および分析支援プログラム
JP7313828B2 (ja) * 2019-01-22 2023-07-25 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP7249580B2 (ja) * 2019-02-28 2023-03-31 富士通株式会社 付与方法、付与プログラム及び付与装置
DE112019007886T5 (de) * 2019-11-12 2022-08-18 Mitsubishi Electric Corporation Fehlervorhersageeinrichtung, Lerneinrichtung und Lernverfahren
WO2022249266A1 (ja) * 2021-05-25 2022-12-01 日本電気株式会社 不正検知システム、不正検知方法およびプログラム記録媒体
KR102582839B1 (ko) * 2021-08-06 2023-09-25 동의대학교 산학협력단 데이터 분석 알고리즘 기반 신발 밑창의 마모 상태 안내 시스템 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1511312A (zh) * 2001-04-13 2004-07-07 多尔拜实验特许公司 音频信号的高质量时间标度和音调标度
JP2005115569A (ja) * 2003-10-06 2005-04-28 Matsushita Electric Works Ltd 信号識別装置および信号識別方法
CN101118434A (zh) * 2006-08-03 2008-02-06 松下电工株式会社 异常监控设备
JP2009146149A (ja) * 2007-12-13 2009-07-02 Panasonic Electric Works Co Ltd 信号識別方法及び信号識別装置
JP2010117336A (ja) * 2008-11-13 2010-05-27 Yec:Kk 異音判定ツール

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072659A (ja) 2004-09-01 2006-03-16 Matsushita Electric Works Ltd 信号識別方法および信号識別装置
JP4003086B2 (ja) 2006-08-07 2007-11-07 日本精工株式会社 評価方法及び装置
JP4762088B2 (ja) 2006-08-31 2011-08-31 株式会社東芝 プロセス異常診断装置
JP2008181294A (ja) 2007-01-24 2008-08-07 Sony Corp 情報処理装置および方法、並びにプログラム
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
CA2925021A1 (en) * 2013-11-01 2015-05-07 Curevac Ag Modified rna with decreased immunostimulatory properties
US20220005291A1 (en) * 2014-05-20 2022-01-06 State Farm Mutual Automobile Insurance Company Autonomous vehicle operation feature monitoring and evaluation of effectiveness
JP6320524B2 (ja) 2014-05-29 2018-05-09 株式会社日立製作所 X線管故障予兆検知装置、x線管故障予兆検知方法およびx線撮像装置
JP6435740B2 (ja) 2014-09-22 2018-12-12 日本電気株式会社 データ処理システム、データ処理方法およびデータ処理プログラム
JP6511950B2 (ja) 2015-05-14 2019-05-15 株式会社リコー 画像処理装置、画像処理方法及びプログラム
US10460251B2 (en) * 2015-06-19 2019-10-29 Preferred Networks Inc. Cross-domain time series data conversion apparatus, methods, and systems
US10817065B1 (en) * 2015-10-06 2020-10-27 Google Llc Gesture recognition using multiple antenna
US11151655B1 (en) * 2015-12-11 2021-10-19 State Farm Mutual Automobile Insurance Company Structural characteristic extraction and claims processing using 3D images
US10410113B2 (en) * 2016-01-14 2019-09-10 Preferred Networks, Inc. Time series data adaptation and sensor fusion systems, methods, and apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1511312A (zh) * 2001-04-13 2004-07-07 多尔拜实验特许公司 音频信号的高质量时间标度和音调标度
JP2005115569A (ja) * 2003-10-06 2005-04-28 Matsushita Electric Works Ltd 信号識別装置および信号識別方法
CN101118434A (zh) * 2006-08-03 2008-02-06 松下电工株式会社 异常监控设备
JP2009146149A (ja) * 2007-12-13 2009-07-02 Panasonic Electric Works Co Ltd 信号識別方法及び信号識別装置
JP2010117336A (ja) * 2008-11-13 2010-05-27 Yec:Kk 異音判定ツール

Also Published As

Publication number Publication date
US20200019855A1 (en) 2020-01-16
JP6828807B2 (ja) 2021-02-10
JPWO2018180197A1 (ja) 2020-01-23
WO2018180197A1 (ja) 2018-10-04
US11593299B2 (en) 2023-02-28

Similar Documents

Publication Publication Date Title
CN110476158A (zh) 数据分析设备、数据分析方法和数据分析程序
Schlegel et al. Towards a rigorous evaluation of XAI methods on time series
JP7183471B2 (ja) 将来の動作の予測分類
US10810491B1 (en) Real-time visualization of machine learning models
US20210133018A1 (en) A unifying semi-supervised approach for machine condition monitoring and fault diagnosis
Bashivan et al. Teacher guided architecture search
KR20190013017A (ko) 센서 군집화 기반의 설비 건강 모니터링 방법 및 장치
KR102476679B1 (ko) 객체 탐지 장치 및 방법
CN116760772B (zh) 汇聚分流器的管控系统及其方法
CN111104242A (zh) 基于深度学习的操作系统的异常日志的处理方法及装置
CN113506009A (zh) 一种基于智慧云服务的设备管理方法及系统
CN111949429A (zh) 基于密度聚类算法的服务器故障监测方法及系统
Ni et al. Neurally-inspired hyperdimensional classification for efficient and robust biosignal processing
CN117541021A (zh) 一种流水线任务管理系统
KR20220007030A (ko) 관심영역별 골 성숙 분포를 이용한 성장 분석 예측 장치 및 방법
CN109743200B (zh) 基于资源特征的云计算平台计算任务成本预测方法及系统
JP6781957B2 (ja) 通知装置、通知方法、及びそのプログラム
Betting et al. Oikonomos: An Opportunistic, Deep-Learning, Resource-Recommendation System for Cloud HPC
JP2023054769A (ja) 柔軟で適応的なロボット学習のための人間ロボット協働
Dhandapani et al. Bearing Faults Diagnosis and Classification Using Generalized Gaussian Distribution Multiscale Dispersion Entropy Features
CN105468887A (zh) 数据分析系统以及方法
US20210373987A1 (en) Reinforcement learning approach to root cause analysis
Aimiyekagbon et al. Rule-based diagnostics of a production line
Kamranfar et al. Meta-learning for industrial system monitoring via multi-objective optimization
JP7028259B2 (ja) 分析装置、分析方法、及び、プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191119