CN113646786A - 信号选择装置、学习装置、信号选择方法及程序 - Google Patents

信号选择装置、学习装置、信号选择方法及程序 Download PDF

Info

Publication number
CN113646786A
CN113646786A CN201980094583.XA CN201980094583A CN113646786A CN 113646786 A CN113646786 A CN 113646786A CN 201980094583 A CN201980094583 A CN 201980094583A CN 113646786 A CN113646786 A CN 113646786A
Authority
CN
China
Prior art keywords
learning
signal
label
signals
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980094583.XA
Other languages
English (en)
Inventor
增崎隆彦
那须督
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN113646786A publication Critical patent/CN113646786A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

信号选择装置(10)从多个候选信号选择用于对数据分析所使用的模型(20)进行学习的学习信号。信号选择装置(10)具有:第1取得部(11),其相关联地取得多个候选信号、以及与由所述模型得到的分析结果对应的状态值即学习标签;特征量计算部(13),其针对所述多个候选信号的每一者,对1个或多个特征量进行计算;以及选择部(16),其基于所述特征量与所述学习标签的关联程度,从所述多个候选信号对所述学习信号进行选择。

Description

信号选择装置、学习装置、信号选择方法及程序
技术领域
本发明涉及信号选择装置、学习装置、信号选择方法及程序。
背景技术
在生产工厂的现场及车间中,使用各种信号进行以预防维护为代表的目的的分析。如果从各种信号中发现了对这样的分析有效的信号,则能够缩短分析所耗费的时间。但是,从多个信号中发现这样的有效的信号通常是困难的,大多依赖于熟练者的经验及技术诀窍。因此,考虑利用根据需要从多个数据对数据进行选择的技术(例如,参照专利文献1)。
在专利文献1中记载有在对车间进行控制的系统中,将从监视控制装置所收集到的数据选择出的必要的数据发送至与监视控制装置连接的工程工作站。该监视控制装置基于收集到的数据的种类或数据的值,对应该发送的数据进行选择。
专利文献1:日本特开2015-28742号公报
发明内容
但是,在专利文献1所记载的技术中,需要与选择出的数据的用途对应地,设定所选择的数据的种类及用于对数据进行选择的条件即该数据的值。因此,依然要求用于进行恰当的设定的专业知识,这样的基于专业知识的设定作业变得繁杂。由此,有可能导致设定变得不充分,没有选择出恰当的数据。
在包含信号的各种数据的分析中,通常使用预先准备的模型。该模型例如是对数据是否异常进行判定的分类器、及用于回归分析的回归式,是根据现有的数据而生成的。但是,通常难以从大量数据对适合于模型的生成的数据进行选择,在未选择出恰当的数据的情况下,模型的精度有可能降低。
本发明就是鉴于上述情况而提出的,其目的在于使数据分析所使用的模型的精度提高。
为了达成上述目的,本发明的信号选择装置从多个候选信号选择用于对数据分析所使用的模型进行学习的学习信号,该信号选择装置具有:第1取得单元,其相关联地取得多个候选信号、以及与由模型得到的分析结果对应的状态值即学习标签;特征量计算单元,其根据多个候选信号对1个或多个特征量进行计算;以及选择单元,其基于特征量与学习标签的关联程度,从多个候选信号对学习信号进行选择。
发明的效果
根据本发明,选择单元基于特征量与学习标签的关联程度,从多个候选信号对学习信号进行选择。由此,能够使数据分析所使用的模型的精度提高。
附图说明
图1是表示本发明的实施方式1涉及的学习装置的功能性结构的框图。
图2是用于说明实施方式1涉及的模型的例子的图。
图3是用于说明实施方式1涉及的模型的学习的图。
图4是用于说明实施方式1涉及的特征量的计算的第1图。
图5是例示实施方式1涉及的特征量和学习标签的关系的第1图。
图6是例示实施方式1涉及的特征量和学习标签的关系的第2图。
图7是例示实施方式1涉及的特征量和学习标签的关系的第3图。
图8是例示实施方式1涉及的特征量和学习标签的关系的第4图。
图9是用于说明实施方式1涉及的特征量的计算的第2图。
图10是表示实施方式1涉及的积蓄数据的例子的图。
图11是用于说明实施方式1涉及的新的模型的生成的图。
图12是用于说明实施方式1涉及的标签的一致率的图。
图13是用于说明实施方式1涉及的贡献度的提示的图。
图14是表示实施方式1涉及的学习装置的硬件结构的图。
图15是表示实施方式1涉及的学习处理的流程图。
图16是表示由实施方式1涉及的第1取得部取得的数据的例子的图。
图17是表示由实施方式1涉及的第2取得部取得的追加信号的例子的图。
图18是用于说明实施方式1涉及的特征量和标签的关系的图。
图19是表示实施方式1涉及的贡献度输出处理的流程图。
图20是表示实施方式2涉及的贡献度输出处理的流程图。
图21是用于说明将多个特征量和标签相关联的情况的图。
具体实施方式
下面,一边参照附图,一边对本发明的实施方式涉及的学习装置100详细地进行说明。
实施方式1.
图1示出本实施方式涉及的学习装置100的结构。学习装置100为以IPC(Industrial Personal Computer)为代表的计算机装置,对模型进行学习,该模型是使用输入进来的输入信号进行分析的模型。该模型用于各种数据分析。例如,该模型是作为将输入信号进行分类后的结果而将多个标签的任意者赋予给输入信号的模型。另外,模型也可以是如以回归分析为代表那样赋予示出连续值的标签的模型。学习装置100通常设置于对学习得到的模型进行利用的工厂。
输入至模型的输入信号是从存在于工厂内的各种信号作为对分析有效的信号而选择出的。输入信号例如也可以是由构成在工厂中构建的生产系统的传感器得到的测量值的时序数据。该输入信号是以1微秒、1毫秒或1秒的采样周期为单位而示出8位、32位或1024位的数字值的数字信号。但是,输入信号的形式并不限于此而是任意的。此外,输入信号不限于是1个,也可以是多个,输入信号的采样值不限于标量值,也可以是包含多个值的矢量值。
另外,标签的赋予是对与输入信号对应的标签进行诊断。标签是作为数据的分析结果而应该被赋予的状态值,例如可以是“正常”和“异常”中的任意者,也可以如“正常”、“反应速度降低”、“存储器访问错误”、“硬件故障”这样是大于或等于3个组合中的任意者。而且,标签也可以是连续值。通过学习装置100学习得到的模型用于基于在生产系统中实时地收集到的传感器的测量值进行的有无异常的监视。但是,模型的用途并不限于此,只要使生产系统的效率提高即可。例如,也可以对用于预防维护、预兆检测、劣化诊断、或寿命预测的模型进行学习。下面,以对判定有无异常的模型进行学习的例子为中心进行说明。
这里,使用图2对由学习装置100学习的模型进行说明。在图2中例示出作为输入信号的第1输入信号及第2输入信号。而且,通过将第1输入信号的值a1、第2输入信号的值a2输入至模型M而决定标签Lb。模型M能够表现为a1、a2的函数M(a1,a2)。根据模型判定的标签Lb为标签L1和标签L2中的任意者。
详细而言,通过将从各输入信号以时刻T1~T2的区间剪切出的部分信号输入至模型M,从而对该区间赋予标签。之后,在相邻的区间,也重复进行按照模型M实施的标签的赋予。该区间预先被规定为与标签对应的期间。区间例如可以是10毫秒或10秒的周期性的区间,也可以是非周期性的区间。
如图2所示,想到如果从多个输入信号通过模型对标签进行判断,则能够对各种异常进行监视。这样的模型根据生产系统而不同,因此需要对与生产系统对应的模型进行学习。因此,如图3所示,根据作为用于对模型进行学习的输入信号而赋予的学习信号、以及应该对学习信号赋予的标签即学习标签,对模型进行学习。学习信号与输入信号的样本相当,例如,是从与输入信号相同或同种的传感器输出的信号。但是,学习信号也可以是为了模型学习而加工后的样本。例如,即使与标签L2相当的异常实际上很少,也优选学习信号是为了模型学习而以比实际更多地包含异常时的信号的方式加工后的样本。模型的学习通过在所谓的机器学习、模式识别或统计解析领域中使用的方法而达成。为了对模型进行学习,学习标签例如由用户预先赋予给学习信号。即,学习标签是与由模型得到的分析结果对应的状态值。
但是,关于在生产系统中收集的信号,通常其数量可能非常庞大。另外,有时会收集对于标签的赋予来说不需要的信号。因此,为了对模型进行学习,从成为学习信号的候选的多个候选信号对学习信号进行选择。
在图4中例示出作为候选信号的第1候选信号、第2候选信号及第3候选信号。在通过学习装置100从候选信号对学习信号进行选择时,根据候选信号对特征量进行计算。详细而言,针对与学习标签对应的各个区间,对候选信号各自的特征量进行计算。该特征量例如是从候选信号以该区间划分出的部分信号的统计值,但并不限于此。而且,选择特征量与对计算出该特征量的区间赋予的学习标签之间的关联程度高的候选信号作为学习信号。
例如,如图5所示,关于根据第1候选信号计算出的第1特征量,针对各个学习标签对频度分布进行创建。图5中的线L11是在赋予了学习标签“L1”的区间中计算出的第1特征量的频度分布,线L12是在赋予了学习标签“L2”的区间中计算出的第2特征量的频度分布。在图5的例子中,由于值大的第1特征量与学习标签“L2”对应,值小的第1特征量与学习标签“L1”对应,因此可以说第1特征量是与学习标签相关的,与学习标签的关联程度高。与这样的第1特征量对应的第1候选信号被选择为学习信号。
另一方面,在图6中,关于根据第3候选信号计算出的第3特征量,示出与图5同样地创建出的频度分布。图6中的线L31是在赋予了学习标签“L1”的区间中计算出的第3特征量的频度分布,线L32是在赋予了学习标签“L2”的区间中计算出的第3特征量的频度分布。在图6的例子中,可以说第3特征量的值与学习标签不相关,第3特征量与学习标签的关联程度低。与这样的第3特征量对应的第3候选信号通常不被选择为学习信号而被排除。
此外,在图5、6所示的频度分布的例子中,设想了对数据进行分类而赋予离散值的标签,但并不限于此。在对数据实施回归分析的情况下,在关于第1特征量,如图7所示,与标签的关联程度高,关于第2特征量,如图8所示,与标签的关联程度低时,选择与第1特征量对应的第1候选信号作为学习信号。即,也可以通过特征量和标签的相关系数,将标签和特征量的关联程度定量化。
返回到图1,作为功能性的结构,学习装置100具有:信号选择装置10,其从多个候选信号对学习信号进行选择;方法积蓄部101,其积蓄表示对模型20进行学习的方法的数据;学习部102,其基于由信号选择装置10选择出的学习信号对模型20进行学习;贡献度输出部103,其对表示学习信号各自对模型20作出贡献的程度的贡献度进行输出;以及模型输出部104,其输出学习得到的模型。
信号选择装置10具有:第1取得部11,其取得多个候选信号和对上述多个候选信号赋予的学习标签;第2取得部12,其取得作为多个候选信号追加的追加信号和对该追加信号赋予的学习标签;特征量计算部13,其根据多个候选信号对特征量进行计算;提供部14,其将计算出的特征量和学习标签提供给外部;条件输入部15,其设定用于对学习信号进行选择的条件;以及选择部16,其基于特征量和学习标签的比较对学习信号进行选择。
第1取得部11取得将由用户提供的多个候选信号及学习标签相关联地示出的数据。该数据的取得可以是接收由用户输入的数据,也可以是从由用户提供的记录介质读出数据,还可以是从在由用户指定的地址处储存的数据的存储装置读出。第1取得部11将取得的数据发送至特征量计算部13。第1取得部11是在信号选择装置10中相关联地取得多个候选信号和学习标签的第1取得单元的一个例子。
第2取得部12从服务器40取得包含由与学习装置100不同的学习装置100a提供的追加信号及学习标签的积蓄数据41。学习装置100a设置于与学习装置100相同的工厂或不同的工厂,是具有与学习装置100等同的结构的装置。服务器40是与学习装置100、100a经由网络连接的数据库服务器。在由第2取得部12取得的积蓄数据41中能够包含后述的特征量。在由第1取得部11取得的数据不充分的情况以及在使由通过第1取得部11取得的数据实现的信号选择及模型学习的精度提高的情况下,利用由第2取得部12取得的积蓄数据41。此外,追加信号表示作为感测结果的时序数据,被追加至与输出了该时序数据的传感器相同机型的传感器所对应的候选信号。第2取得部12将取得的积蓄数据41发送至特征量计算部13。第2取得部12是在信号选择装置10中取得多个追加信号和与上述多个追加信号相关联的特征量的第2取得单元的一个例子。
特征量计算部13根据由第1取得部11取得的多个候选信号对1个或多个特征量进行计算。特征量例如是以从候选信号中剪切出的部分信号的自相关、平均及方差为代表的统计值、最大值或最小值,但并不限于此,也可以将其它值设为特征量。另外,特征量计算部13在由第2取得部12取得的积蓄数据41不包含特征量的情况下,根据积蓄数据41所包含的候选信号对特征量进行计算。然后,特征量计算部13将取得的候选信号及学习标签、计算出的特征量发送至提供部14及选择部16。特征量计算部13是根据多个候选信号对1个或多个特征量进行计算的特征量计算单元的一个例子。
此外,在图4中示出根据候选信号分别对1个特征量进行计算的例子,但并不限于此。特征量计算部13也可以如图9所示,根据第1候选信号对第1特征量及第2特征量进行计算。另外,特征量计算部13也可以在从第1候选信号提取被赋予了第1学习标签的部分后对第3特征量进行计算,在提取被赋予了第2学习标签的部分后,作为与第3特征量不同的特征量而对第4特征量进行计算。而且,特征量计算部13也可以根据多个候选信号对比该候选信号的数量少的数量的特征量进行计算。例如,如图9所示,特征量计算部13也可以根据第1候选信号及第2候选信号对第5特征量进行计算。这样的第5特征量例如是以相关系数及平均值为代表的统计值。
返回到图1,提供部14将从特征量计算部13得到的候选信号、学习标签及特征量相关联,作为积蓄数据42提供给服务器40。该积蓄数据42用于由其它学习装置100b进行的信号选择及模型学习。在图10中示出积蓄数据42的例子。提供部14是将多个候选信号和特征量相关联地提供给其它装置的提供单元的一个例子。
向条件输入部15中输入与模型的学习相关的条件、与学习信号的选择相关的条件中的至少一者。这些条件例如是以想要进行预兆检测这样的目的为代表的课题或模型的用途、包含模型学习的方法在内的信号分析方法的指定、用户要求的分析精度、应选择的学习信号的数量、及用户允许的处理时间。输入至条件输入部15的条件被通知给选择部16。
选择部16基于从条件输入部15通知的条件、从特征量计算部13发送的数据,从多个候选信号对适于模型学习的学习信号进行选择。详细而言,选择部16基于特征量和学习标签之间的与条件对应的关系对信号进行选择。例如,选择部16在将异常检测这样的目的设定为条件的情况下,将与学习标签相关的特征量所对应的候选信号选择为学习信号。此外,选择部16根据条件,通过其它方法对学习信号进行选择。例如,在将劣化诊断或寿命预测这样的目的设定为条件的情况下,选择部16将与学习标签的关系伴随着时间的经过而产生变化的特征量所对应的候选信号选择为学习信号。
另外,在作为条件输入了分析方法的情况下,选择部16也可以选择用于生成以使用该分析方法为前提的特征量的信号。例如,在指定了基于电流值的分析方法的情况下,选择部16也可以对表示电流值的信号进行选择。在作为条件输入了比较高的要求精度的情况下,为了提高模型的精度,选择部16也可以增加所选择的信号的数量。在作为条件输入了较短的允许处理时间的情况下,选择部16也可以减少所选择的信号的数量。
另外,选择部16也可以在计算出表示特征量对标签的赋予有用的程度的有用度的基础上对信号进行选择。例如,关于图5所例示的第1特征量,由于等级被良好地分离,因此有用度高,关于图6所例示的第3特征量,由于等级没有被良好地分离,因此有用度低。而且,选择部16也可以预先规定用于对与等级对应的分布间的距离为哪种程度时设为选择对象进行判断的阈值,根据分布间距离与阈值的大小关系而对信号进行选择。选择部16是基于特征量与学习标签的关联程度,从多个候选信号对学习信号进行选择的选择单元的一个例子。
返回到图1,学习部102与输入至条件输入部15的条件对应地,从方法积蓄部101读出表示学习方法的数据,通过读出的方法对模型进行学习。学习部102是基于由信号选择装置10选择出的学习信号对模型进行学习的学习单元的一个例子。此外,在方法积蓄部101中积蓄有用于进行各种模型学习的信息。该信息例如可以是表示模型学习的流程或算法的信息,也可以是执行模型学习的程序。
贡献度输出部103对学习信号对标签的赋予作出贡献的程度进行计算、输出。详细而言,贡献度输出部103从多个学习信号提取大于或等于1个提取信号,根据提取信号及学习模型使学习部102对新的模型进行学习。在提取信号的贡献度高的情况下,通过新的模型对提取信号赋予的标签与学习标签的一致率高,另一方面,在提取信号的贡献度低的情况下,通过新的模型对提取信号赋予的标签与学习标签的一致率变低。
例如,如图11所示,在存在第1学习信号、第2学习信号及第3学习信号这3个信号的情况下,排除第3学习信号而根据第1学习信号以及第2学习信号重新对模型M12进行学习。同样地,排除第2学习信号而根据第1学习信号及第3学习信号重新对模型M13进行学习,排除第1学习信号而根据第2学习信号及第3学习信号重新对模型M23进行学习。
然后,如图12所示,通过由新的模型M12、M13、M23各自赋予的标签与学习标签的比较,从而得到由新的模型赋予的标签与学习标签的一致率。在图10的例子中,由模型M12得到的标签与学习标签的一致率比较高,为80%。因此,即使排除第3学习信号也会赋予一定程度正确的标签,所以可知第1学习信号及第2学习信号的贡献度比较高,第3学习信号的贡献度比较低。同样地,由于由模型M13得到的标签与学习标签的一致率比较低,因此可知第2学习信号的贡献度高。
如图13所示,贡献度输出部103根据标签的一致率对各学习信号的贡献度进行计算、输出。根据一致率对贡献度进行计算的方法是任意的。例如,贡献度输出部103也可以将由使用一个学习信号学习到的新模型得到的一致率的平均值作为贡献度。即,贡献度输出部103在图13所示的例子中,也可以将由使用第1学习信号学习到的新的模型M12、M13得到的一致率的平均值50%作为该第1学习信号的贡献率。同样地,也可以将由模型M12、M23得到的一致率的平均值65%设为第2学习信号的贡献率,将由模型M13、M23得到的一致率的平均值35%设为第3学习信号的贡献率。另外,贡献度的输出可以是由画面显示实现的向用户的提示,也可以是向存储装置的写入,还可以是向其它装置的发送。贡献度输出部103是贡献度输出单元的一个例子,该贡献度输出单元对表示由信号选择装置10选择出的多个学习信号各自对标签的赋予作出贡献的程度的贡献度进行输出。
模型输出部104输出表示由学习部102学习得到的模型的数据。该输出可以是向存储装置的写入,也可以是向其它装置的发送。由模型输出部104输出的模型用于对输入信号赋予标签。
学习装置100为了发挥上述功能,作为其硬件结构,如图14所示的,具有处理器51、主存储部52、辅助存储部53、输入部54、输出部55及通信部56。主存储部52、辅助存储部53、输入部54、输出部55及通信部56均经由内部总线57与处理器51连接。
处理器51包含CPU(Central Processing Unit)。处理器51通过执行在辅助存储部53存储的程序P1,从而实现学习装置100的各种功能,执行后述的处理。
主存储部52包含RAM(Random Access Memory)。从辅助存储部53将程序P1载入至主存储部52。而且,主存储部52被用作处理器51的工作区域。
辅助存储部53包含以EEPROM(Electrically Erasable Programmable Read-OnlyMemory)及HDD(Hard Disk Drive)为代表的非易失性存储器。辅助存储部53除了程序P1之外,还对处理器51的处理所用的各种数据进行存储。辅助存储部53按照处理器51的指示,将由处理器51利用的数据供给至处理器51,对从处理器51供给来的数据进行存储。
输入部54包含以输入键及指点设备为代表的输入设备。输入部54取得由学习装置100的用户输入的信息,将取得的信息通知给处理器51。
输出部55包含以LCD(Liquid Crystal Display)及扬声器为代表的输出设备。输出部55按照处理器51的指示,将各种信息提示给用户。
通信部56包含用于与外部的装置进行通信的网络接口电路。通信部56从外部对信号进行接收,将该信号所示的数据向处理器51输出。另外,通信部56将表示从处理器51输出的数据的信号向外部的装置发送。
图14所示的硬件结构进行协同动作,从而学习装置100发挥图1所示的各种功能。详细而言,通过处理器51、输入部54及通信部56中的至少1者实现第1取得部11。另外,通过通信部56实现第2取得部12及提供部14。通过处理器51实现特征量计算部13、选择部16及学习部102。通过输入部54实现条件输入部15。通过辅助存储部53实现方法积蓄部101。通过处理器51、输出部55及通信部56中的至少1者实现贡献度输出部103及模型输出部104。
接下来,使用图15~19,对由学习装置100执行的学习处理进行说明。在图15中示出根据从候选信号选择出的学习信号对模型进行学习的学习处理。该学习处理通过执行学习装置100的特定的程序而开始。
在学习处理中,第1取得部11取得候选信号和学习标签(步骤S1)。例如,第1取得部11取得图16所例示的数据。
接下来,学习装置100对是否存在从外部提供的积蓄数据进行判定(步骤S2)。具体而言,第2取得部12访问服务器40,对是否存在包含追加于通过步骤S1取得的候选信号中的追加信号、学习标签的积蓄数据进行查询。另外,第2取得部12也可以仅在由用户指定的情况下,对积蓄数据的存在进行确认。
在判定为没有积蓄数据的情况下(步骤S2;No),由学习装置100进行的处理向步骤S4跳转。另一方面,在判定为存在积蓄数据的情况下(步骤S2;Yes),第2取得部12取得追加信号和学习标签作为积蓄数据(步骤S3)。这里,在所取得的积蓄数据中也可以包含根据追加信号由其它学习装置计算出的特征量。由此,如图17所示,将追加信号追加至在步骤S1中取得的候选信号,能够使得用于信号的选择及模型的学习的信号充分。
返回到图15,在步骤S3之后,特征量计算部13根据候选信号对特征量进行计算(步骤S4)。具体而言,特征量计算部13根据从候选信号以预先规定的区间剪切出的部分信号对特征量进行计算。然后,提供部14将候选信号和学习标签相关联地作为积蓄数据向外部提供(步骤S5)。由此,其它学习装置能够利用积蓄数据进行信号的选择及模型的学习。
接下来,选择部16对表示在步骤S1中取得的学习标签与在步骤S4中计算出的特征量之间的关联程度的关联度进行计算(步骤S6)。具体而言,与输入至条件输入部15的条件对应地,选择部16对学习标签和特征量的关联度进行计算。例如,在输入了异常检测这样的条件的情况下,选择部16计算学习标签与特征量的相关程度作为关联度。该学习标签和特征量的相关程度例如可以是如图5那样观测的分布不同的尺度,也可以是通过对各个学习标签的特征量的独立性进行评价而进行计算。此外,如图18所例示的那样,表示与3种学习标签各自对应的频度分布的线中的与线L31、L32对应的分布彼此重复,但与线L33对应的分布与其它分布不重复。因此,第3特征量与对应于线L33的第3学习标签的关联度高。另外,在输入了劣化诊断这样的条件的情况下,选择部16计算学习标签和特征量的关系伴随着时间的经过而产生变化的程度作为关联度。关联度的计算方法是任意的,只要在候选信号对标签的赋予有用时,从该候选信号得到的特征量的关联度高即可。
接下来,选择部16将与在步骤S6中计算出的关联度高的特征量对应的候选信号选择为学习信号(步骤S7)。具体而言,选择部16按照与关联度从高到低的特征量对应的顺序,对全部候选信号中的预先设定的数量的候选信号进行选择。即,选择部16将多个候选信号中的与学习标签的关联程度比其它特征量高的特征量所对应的候选信号选择为学习信号。
接下来,学习部102根据在步骤S7中选择出的学习信号、在步骤S1中取得的学习标签对模型进行学习(步骤S8),模型输出部104将在步骤S8中学习到的模型输出(步骤S9)。
接下来,贡献度输出部103执行贡献度输出处理(步骤S10)。使用图19对该贡献度输出处理进行说明。
在贡献度输出处理中,贡献度输出部103从多个学习信号提取大于或等于1个提取信号(步骤S101)。具体而言,贡献度输出部103从多个学习信号,排除至少1个学习信号,将剩余大于或等于1个学习信号提取为提取信号。这里,排除的数量是任意的,提取的对象也是任意的。例如,贡献度输出部103也可以提取从多个学习信号提取大于或等于1个信号的全部组合中的尚未提取的组合的信号。但是,如果学习信号的数量多则组合的数量变得庞大,因此贡献度输出部103也可以从多个学习信号随机地提取信号。另外,也可以是在预先规定了提取信号的数量的基础上,贡献度输出部103提取从多个学习信号提取提取信号的全部组合中的尚未提取的组合的信号。提取信号的数量例如为1个或2个。
接下来,学习部102根据在步骤S101中提取出的提取信号和学习标签对新的模型进行学习(步骤S102),贡献度输出部103通过在步骤S102中学习到的新的模型对提取信号赋予标签(步骤S103)。然后,贡献度输出部103对在步骤S103中赋予的标签与学习标签的一致率进行计算(步骤S104)。
接下来,贡献度输出部103对提取的尝试次数是否充分进行判定(步骤S105)。具体而言,贡献度输出部103对是否以预先规定的次数执行了步骤S101~S104进行判定。在判定为尝试次数不充分的情况下(步骤S105;No),贡献度输出部103重复步骤S101及其后的处理。
另一方面,在判定为尝试次数充分的情况下(步骤S105;Yes),贡献度输出部103根据在重复执行的步骤S104中计算出的一致率,对各学习信号的贡献度进行计算、输出(步骤S106)。之后,如果贡献度输出处理结束,则如图15所示,学习处理结束。
以上,如说明过那样,选择部16基于特征量与学习标签的关联程度,从多个候选信号对学习信号进行选择。具体而言,选择部16将与学习标签的关联程度比其它特征量高的特征量所对应的候选信号选择为学习信号。与学习标签的关联程度高的特征量对于对输入信号赋予标签是有用的,与该特征量对应的候选信号适合于模型的学习。因此,能够对适合于模型生成的学习信号进行选择。而且,能够使数据分析所用的模型的精度提高,能够缩短信号的分析所花费的时间。
另外,通过对恰当的学习信号进行选择,从而能够对恰当的模型进行学习,根据在生产工厂的现场或车间中处理的各种信号自动且高精度地赋予标签而对信号进行分析。
另外,通过由第2取得部12取得积蓄数据,能够利用在相同的工厂内、或其它工厂设置的同种传感器仪器的信息而选择对高精度有用的信号。
另外,通过由贡献度输出部103输出学习信号的贡献度,从而利用了模型的信号分析的运用范围扩大。例如,由用户进行的分析方法的选择变得容易。另外,由于分析结果中可能包含误判定,因此应该预计到何种程度的风险的研究变得容易。而且,分析结果包含错误的情况下的应对变得容易。
实施方式2.
接下来,以与上述实施方式1的区别为中心对实施方式2进行说明。此外,对与上述实施方式1相同或等同的结构使用等同的标号,并且省略或简略其说明。在上述实施方式1中,通过重复尝试从学习信号提取一部分信号而对尝试结果进行比较,从而对学习信号的贡献度进行计算。相对于此,下面说明通过对学习信号的值进行变更的尝试而计算贡献度的方式。
贡献度输出部103执行图20所示的贡献度输出处理。在该贡献度输出处理中,贡献度输出部103将多个学习信号中的大于或等于1个学习信号的值变更(步骤S111)。值的变更方法是任意的,例如变更为随机的值。
接下来,学习部102根据变更了值的学习信号和学习标签对新的模型进行学习(步骤S112),贡献度输出部103通过新的模型对学习信号赋予标签(步骤S113)。然后,贡献度输出部103对在步骤S103中赋予的标签与学习标签的一致率进行计算(步骤S114)。认为,即使变更贡献度低的学习信号的值,与由根据学习信号学习到的模型赋予的标签的学习标签之间的一致率也比较高,如果变更了贡献度高的学习信号的值,则一致率大幅降低。因此,通过重复尝试变更多个学习信号中的一部分学习信号的值,能够得到贡献度。
接下来,贡献度输出部103对值的变更的尝试次数是否充分进行判定(步骤S115)。在判定为尝试次数不充分的情况下(步骤S115;No),贡献度输出部103重复步骤S111及其后的处理。另一方面,在判定为尝试次数充分的情况下(步骤S115;Yes),贡献度输出部103根据在重复执行的步骤S114中计算出的一致率,对各学习信号的贡献度进行计算、输出(步骤S116)。之后,贡献度输出处理结束。
以上,如说明过那样,贡献度输出部103通过变更学习信号的值,从而对贡献度进行计算。这样的方式也能够得到与实施方式1等同的效果。
以上,对本发明的实施方式进行了说明,但本发明并不限于上述实施方式。
例如,在上述实施方式1、2中,为了易于理解发明,以1个候选信号与1个特征量对应的例子为中心进行了说明,但并不限于此。例如,在图21所示的例子中,在与第1特征量相关的频度分布中,线L11和线L12重复,因此第1特征量并不有助于标签的判别,在与第2特征量相关的频度分布中,线L11和线L12重复,因此第2特征量看起来并不有助于标签的判别。但是,如果观察第1特征量及第2特征量的多维分布,则通过将线L30设定为边界,从而能够准确地对标签进行判定。因此,将第1特征量及第2特征量合起来,可以说是与第1学习标签及第2学习标签的关联度高的特征量。
另外,也可以将上述实施方式1、2的方法组合。即,也可以从学习信号提取大于或等于1个提取信号,并且在变更了提取出的信号的值的基础上对新的模型进行学习,根据由新的模型赋予的标签与学习标签的一致率对贡献度进行计算。
另外,也可以在由提供部14提供的积蓄数据中,进一步对与候选信号相关联的特征量关联加权系数。例如,也可以对与从可靠性高的仪器得到的候选信号相关的特征量关联大的加权系数,对与从可靠性低的仪器得到的候选信号相关的特征量关联小的加权系数。由此,能够与仪器的可靠性对应地对特征量进行处理。而且,在更加要求可靠性的类似仪器中,在特征量与标签的关联性明确的情况下,也可以在对象仪器中使该关联性的值偏移后进行利用。具体而言,假设存在对从可靠性高的类似仪器得到的候选信号的特征量赋予了“故障”、“危险”、“注意”、“观察中”及“正常”这5个阶段的标签的积蓄数据这样的例子。在从第2取得部12取得而沿用该积蓄数据时,也可以一次性地将“危险”变更为“注意”,将“注意”变更为“观察中”,将“观察中”及“正常”变更为“正常”,调整为与对象仪器相符的标签。
另外,在上述实施方式中,示出对生产系统中的信号的分析所用的模型进行学习的例子,但并不限于此,学习装置100也可以对加工系统、检查系统、其它系统中的信号的分析所用的模型进行学习。模型只要是对在以工厂及车间为代表的设施中处理的信号进行分析的模型即可。
另外,对学习装置100包含信号选择装置10的例子进行了说明,但也可以将这些装置设为彼此独立的结构。
另外,学习装置100的功能也能够通过专用硬件或通常的计算机系统实现。
例如,能够通过将由处理器51执行的程序P1储存至计算机可读取的非暂时性的记录介质而进行分发,将该程序P1安装于计算机,从而构成执行上述处理的装置。作为这样的记录介质,例如想到软盘、CD-ROM(Compact Disc Read-Only Memory)、DVD(DigitalVersatile Disc)、MO(Magneto-Optical Disc)。
另外,也可以是预先将程序P1储存于以互联网为代表的通信网络上的服务器装置所具有的磁盘装置,例如,使其叠加于载波而下载至计算机。
另外,通过在经由通信网络转发程序P1的同时启动执行,也能够实现上述处理。
并且,通过在服务器装置之上执行程序P1的全部或一部分,计算机经由通信网络对与该处理相关的信息进行收发,与此同时,执行程序,也能够实现上述处理。
此外,在由OS(Operating System)分担地实现上述功能的情况下或通过OS和应用的协同动作实现上述功能等情况下,可以仅将OS之外的部分储存于介质而进行分发,另外,也可以下载至计算机。
另外,实现学习装置100的功能的方法并不限于软件,也可以通过包含电路的专用硬件实现其一部分或全部。
本发明在不脱离本发明的广义的精神和范围的情况下,能够设为各种实施方式及变形。另外,上述实施方式用于对本发明进行说明,并不是对本发明的范围进行限定。即,本发明的范围不是由实施方式而是由权利要求书表示的。而且,将在权利要求的范围内及与其等同的发明意义的范围内实施的各种变形视为落在本发明的范围内。
工业适用性
本发明适于对输入信号赋予标签的模型的学习。
标号的说明
100、100a、100b学习装置,10信号选择装置,11第1取得部,12第2取得部,13特征量计算部,14提供部,15条件输入部,16选择部,20模型,40服务器,41积蓄数据,42积蓄数据,51处理器,52主存储部,53辅助存储部,54输入部,55输出部,56通信部,57内部总线,101方法积蓄部,102学习部,103贡献度输出部,104模型输出部,L11、L12、L30、L31、L32、L33线,P1程序。

Claims (10)

1.一种信号选择装置,其从多个候选信号选择用于对数据分析所使用的模型进行学习的学习信号,
该信号选择装置具有:
第1取得单元,其相关联地取得所述多个候选信号、以及与由所述模型得到的分析结果对应的状态值即学习标签;
特征量计算单元,其根据所述多个候选信号对1个或多个特征量进行计算;以及
选择单元,其基于所述特征量与所述学习标签的关联程度,从所述多个候选信号对所述学习信号进行选择。
2.根据权利要求1所述的信号选择装置,其中,
所述特征量计算单元根据从所述候选信号以预先规定的区间剪切出的部分信号,对所述特征量进行计算。
3.根据权利要求1或2所述的信号选择装置,其中,
所述选择单元将所述多个候选信号中的与所述学习标签的关联程度比其它所述特征量高的所述特征量所对应的所述候选信号选择为所述学习信号。
4.根据权利要求1至3中任一项所述的信号选择装置,其中,
还具有提供单元,该提供单元将所述多个候选信号和所述特征量相关联地提供给其它装置。
5.根据权利要求1至4中任一项所述的信号选择装置,其中,
还具有第2取得单元,该第2取得单元取得作为所述多个候选信号而追加的多个追加信号、以及与该多个追加信号相关联的所述特征量。
6.一种学习装置,其具有:
权利要求1至5中任一项所述的信号选择装置,其从多个候选信号选择用于对数据分析所使用的模型进行学习的学习信号;以及
学习单元,其基于由所述信号选择装置选择出的所述学习信号对所述模型进行学习。
7.根据权利要求6所述的学习装置,其中,
还具有贡献度输出单元,该贡献度输出单元输出贡献度,该贡献度表示由所述信号选择装置选择出的多个所述学习信号各自对由所述模型实现的标签的赋予作出贡献的程度,
所述信号选择装置取得与由所述模型得到的分析结果对应的状态值即学习标签,
所述学习单元重复进行以下尝试,即,从多个所述学习信号提取大于或等于1个所述学习信号作为提取信号,基于所述提取信号生成新的模型,
所述贡献度输出单元基于按照通过所述尝试生成的所述新的模型对所述提取信号赋予的赋予标签与所述学习标签的比较,对所述贡献度进行计算而输出。
8.根据权利要求6所述的学习装置,其中,
还具有贡献度输出单元,该贡献度输出单元输出贡献度,该贡献度表示由所述信号选择装置选择出的多个所述学习信号各自对由所述模型实现的标签的赋予作出贡献的程度,
所述信号选择装置取得与由所述模型得到的分析结果对应的状态值即学习标签,
所述学习单元重复尝试对多个所述学习信号各自的值进行变更而生成新的模型,
所述贡献度输出单元基于按照通过所述尝试生成的所述新的模型对所述学习信号赋予的赋予标签与所述学习标签的比较,对所述贡献度进行计算而输出。
9.一种信号选择方法,其从多个候选信号选择用于对数据分析所使用的模型进行学习的学习信号,
该信号选择方法包含:
特征量计算步骤,特征量计算单元根据所述多个候选信号对特征量进行计算;以及
选择步骤,选择单元基于所述特征量与学习标签的关联程度,从所述多个候选信号对所述学习信号进行选择,该学习标签是与由所述模型得到的分析结果对应的状态值。
10.一种程序,其使从多个候选信号选择用于对数据分析所使用的模型进行学习的学习信号的计算机执行如下处理:
根据所述多个候选信号对特征量进行计算,
基于所述特征量与学习标签的关联程度,从所述多个候选信号对所述学习信号进行选择,该学习标签是与由所述模型得到的分析结果对应的状态值。
CN201980094583.XA 2019-03-28 2019-03-28 信号选择装置、学习装置、信号选择方法及程序 Pending CN113646786A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/013810 WO2020194716A1 (ja) 2019-03-28 2019-03-28 信号選択装置、学習装置、信号選択方法及びプログラム

Publications (1)

Publication Number Publication Date
CN113646786A true CN113646786A (zh) 2021-11-12

Family

ID=71663986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980094583.XA Pending CN113646786A (zh) 2019-03-28 2019-03-28 信号选择装置、学习装置、信号选择方法及程序

Country Status (4)

Country Link
US (1) US11367020B2 (zh)
JP (1) JP6727478B1 (zh)
CN (1) CN113646786A (zh)
WO (1) WO2020194716A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115202163B (zh) * 2022-09-15 2022-12-30 全芯智造技术有限公司 选择光阻模型的方法、设备和计算机可读存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000297443A (ja) 1999-04-15 2000-10-24 Komatsu Ltd 建設機械の情報管理装置
JP2001175972A (ja) 1999-12-17 2001-06-29 Toshiba Corp 異常監視装置
US7958096B2 (en) * 2000-09-20 2011-06-07 Ndsu-Research Foundation System and method for organizing, compressing and structuring data for data mining readiness
JP5338492B2 (ja) * 2009-06-08 2013-11-13 富士電機株式会社 入力変数選択支援装置
JP5014500B1 (ja) 2011-04-04 2012-08-29 シャープ株式会社 異常要因特定方法および装置、上記異常要因特定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
JP5737696B2 (ja) 2013-07-31 2015-06-17 株式会社日立ソリューションズ センサデータ収集システム
JP6550783B2 (ja) * 2015-02-19 2019-07-31 富士通株式会社 データ出力方法、データ出力プログラムおよびデータ出力装置
JP6686593B2 (ja) * 2016-03-23 2020-04-22 日本電気株式会社 データ処理装置、データ処理システム、データ処理方法及びプログラム
US11327475B2 (en) * 2016-05-09 2022-05-10 Strong Force Iot Portfolio 2016, Llc Methods and systems for intelligent collection and analysis of vehicle data
JP2018005640A (ja) * 2016-07-04 2018-01-11 タカノ株式会社 分類器生成装置、画像検査装置、及び、プログラム
JP6847787B2 (ja) 2017-08-04 2021-03-24 株式会社東芝 情報処理装置、情報処理方法及びコンピュータプログラム
US10410121B2 (en) * 2017-10-25 2019-09-10 SparkCognition, Inc. Adjusting automated neural network generation based on evaluation of candidate neural networks
US11138568B2 (en) * 2018-01-29 2021-10-05 Microsoft Technology Licensing, Llc Calendar-aware resource retrieval
US10810512B1 (en) * 2018-03-21 2020-10-20 Verily Life Sciences Llc Validating a machine learning model prior to deployment
US11120364B1 (en) * 2018-06-14 2021-09-14 Amazon Technologies, Inc. Artificial intelligence system with customizable training progress visualization and automated recommendations for rapid interactive development of machine learning models
US20200167659A1 (en) * 2018-11-27 2020-05-28 Electronics And Telecommunications Research Institute Device and method for training neural network
US20210407638A1 (en) * 2020-06-25 2021-12-30 Kpn Innovations, Llc. Methods and systems for an apparatus for an emotional pattern matching system

Also Published As

Publication number Publication date
US20220044152A1 (en) 2022-02-10
JP6727478B1 (ja) 2020-07-22
US11367020B2 (en) 2022-06-21
WO2020194716A1 (ja) 2020-10-01
JPWO2020194716A1 (ja) 2021-04-08

Similar Documents

Publication Publication Date Title
EP3552067B1 (en) Methods and systems for discovery of prognostic subsequences in time series
CN112272763B (zh) 异常探测装置、异常探测方法以及计算机可读取的存储介质
WO2018009643A1 (en) Computer systems and methods for performing root cause analysis and building a predictive model for rare event occurrences in plant-wide operations
CN111459700A (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
US20200143292A1 (en) Signature enhancement for deviation measurement-based classification of a detected anomaly in an industrial asset
CN112334849B (zh) 诊断装置、诊断方法及程序
JP2004531815A (ja) 予測的状態監視のための診断システムおよび方法
JP2019101495A (ja) 診断装置、診断方法、プログラム、および記録媒体
JP2020198092A (ja) 教師なし異常検出及び高次元センサデータの多数決投票による原因説明のための方法及びシステム
JP6828807B2 (ja) データ解析装置、データ解析方法およびデータ解析プログラム
EP3948438B1 (en) Method and system for anomaly detection and diagnosis in industrial processes and equipment
JP6777142B2 (ja) システム分析装置、システム分析方法、及び、プログラム
EP3506229A1 (en) Method for pre-detecting abnormality sign of nuclear power plant device including processor for determining device importance and warning validity, and system therefor
US11585732B2 (en) Apparatus and method for diagnosing failure of plant
US20210080924A1 (en) Diagnosis Method and Diagnosis System for a Processing Engineering Plant and Training Method
CN113646786A (zh) 信号选择装置、学习装置、信号选择方法及程序
JP7251955B2 (ja) 検出装置及び機械学習方法
US11372741B2 (en) Information processing apparatus configured to perform debug analysis based on a distributed representation vector for lines of a debug log, method, and non-transitory recording medium
US11954131B2 (en) Time-series data processing method
US11966218B2 (en) Diagnosis device, diagnosis method and program
JP7028259B2 (ja) 分析装置、分析方法、及び、プログラム
US20240192095A1 (en) State detection system, state detection method, and computer readable medium
EP4379618A1 (en) Computer implemented method for determining a quality result for input data of a data model
JP7028260B2 (ja) 分析システム、分析方法、及び、プログラム
CN116974260A (zh) 信息处理系统、信息处理方法以及信息处理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211112

RJ01 Rejection of invention patent application after publication