CN110895719A - 验证装置 - Google Patents
验证装置 Download PDFInfo
- Publication number
- CN110895719A CN110895719A CN201910860129.2A CN201910860129A CN110895719A CN 110895719 A CN110895719 A CN 110895719A CN 201910860129 A CN201910860129 A CN 201910860129A CN 110895719 A CN110895719 A CN 110895719A
- Authority
- CN
- China
- Prior art keywords
- learning
- learning data
- unit
- data
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Testing And Monitoring For Control Systems (AREA)
- General Factory Administration (AREA)
Abstract
本发明提供一种验证装置,用于验证所存储的学习数据的妥当性。该验证装置通过基于该学习数据的学习来生成学习模型,根据学习数据来进行使用了学习模型的推断,进一步按照用于分析学习数据的分析方法以及决定了该分析中的基准的分析标准,使用上述推断的结果来分析学习数据,并按照该分析的结果来加工学习数据。
Description
技术领域
本发明涉及一种验证装置,特别涉及进行在工厂等生产现场中使用的机器学习装置的学习相关的验证的验证装置。
背景技术
在工厂等生产现场中,从设置在该生产现场中的多个机床或机器人等工业机械收集数据,应用有监督学习等机器学习,将基于收集到的数据的级别分类或回归、异常检测等工序自动化(例如参照日本特开2017-162252号公报以及日本特开2018-077757号公报)。机器学习装置的推断等性能一般依赖于学习所使用的学习数据的质量,因此按照每个任务大量地准备专用学习数据的情况也比较多。
但是,在使用学习完毕的机器学习装置进行推断处理时,有时会输出与事先设想的结果不同的结果。这种情况下,需要分析是什么原因导致不能很好地进行学习并进行改善使得成为设想的结果,但是机器学习装置一般是多个参数相互关联来进行推断,因此难以进行人工的分析和改善。
另外,作为学习数据而收集到的数据中大多包括异常数据,即使在使用这种学习数据进行学习的情况下,也会有在机器学习装置中输出与设想的结果不同的结果的情况,但是即使进行从用于学习的学习数据中提取异常数据的分析,学习所使用的学习数据也有很多,因此还是难以通过人工进行分析等。进一步,特别是有监督学习中所使用的学习数据,由人工进行标记赋予(标准设计、标记标注等),但是不能够完全地排除进行标记赋予的作业人员的主观性,因此会有难以担保赋予学习数据的标记的一致性以及再现性的问题。
发明内容
因此,本发明的目的为提供进行在工厂等生产现场中使用的机器学习装置的学习相关的验证的验证装置。
本发明中,分析由设置在工厂等中的工业机械使用的机器学习装置的学习所使用的学习数据的推断结果的分布,检测与事先设想的结果之间的差值,由此实现自动检测学习数据中的错误(偏离值、标记的过量或不足、错误的标记标注)并进行订正的功能,从而解决上述问题。
本发明的验证装置验证存储在学习数据存储部中的学习数据的妥当性,具备:学习部,其通过基于存储在上述学习数据存储部中的学习数据的学习来生成学习模型;推断部,其根据存储在上述学习数据存储部中的学习数据来进行使用了上述学习模型的推断;分析部,其按照用于分析存储在上述学习数据存储部中的学习数据的分析方法以及决定了该分析中的基准的分析标准,使用上述推断部的推断结果来分析存储在上述学习数据存储部中的学习数据;以及加工部,其按照上述分析部的分析结果来加工存储在上述学习数据存储部中的学习数据。
上述分析标准使用上述推断部的推断结果来决定用于从存储在上述学习数据存储部中的学习数据中提取异常数据的阈值,并且,上述分析部按照上述分析标准从存储在上述学习数据存储部中的学习数据提取异常数据,上述加工部从上述学习数据存储部去除上述分析部提取出的异常数据。
上述分析标准决定作为与存储在上述学习数据存储部中的学习数据相关的上述推断部的推断结果的可靠度的阈值,并且,上述分析部按照上述分析标准从存储在上述学习数据存储部中的学习数据提取可靠度低的学习数据,上述加工部针对上述分析部提取出的可靠度低的数据,赋予与被赋予存储在上述学习数据存储部中的学习数据的标记不同的新标记。
根据本发明,去除成为偏离事先设定好的基准的推断结果的原因的学习数据,自动进行再次学习推断,由此能够帮助用于提高精度的分析和改善。另外,在学习数据的具有相同标记的部分的推断结果的分布分散时,自动按照每个分布再次重新赋予新的标记并进行学习推断,由此能够通过更接近实际情况的标记来构筑机器学习装置。
附图说明
图1是一个实施方式的验证装置的概略硬件结构图。
图2是一个实施方式的验证装置的概略功能框图。
具体实施方式
图1是表示本发明一个实施方式的验证装置的主要部件的概略硬件结构图。
本实施方式的验证装置1能够作为设置在工厂等生产现场中的计算机来安装,另外,能够作为与设置在工厂等的生产现场中的计算机经由网络连接的边缘计算机、单元计算机、主计算机、云服务器等计算机来安装。图1表示作为设置在工厂等生产现场中的计算机安装了验证装置1的情况的例子。
本实施方式的验证装置1所具备的CPU11是整体控制验证装置1的处理器。CPU11读出存储在经由总线22连接的ROM12中的系统程序,根据该系统程序控制验证装置1整体。RAM13中存储暂时的计算数据和用于显示在显示装置70中的显示数据以及操作员经由输入装置71输入的各种数据等。
非易失性存储器14由例如通过电池(未图示)进行备份供电的SRAM或SSD等构成,构成为即使验证装置1的电源被切断也保持存储状态的存储器。非易失性存储器14中存储经由输入装置71输入的数据和程序、从经由接口17与网络7连接的(控制装置或主计算机等)其他计算机5取得的数据等。非易失性存储器14中存储的数据和程序等可以在使用时展开于RAM13。另外,ROM12中预先写入用于执行为了分析数据所需要的各种算法、其他所必要的处理的系统程序。
接口17是用于将验证装置1和有线/无线网络7连接的接口。网络7与控制设置在工厂内的机床的控制装置或个人电脑、边缘计算机、单元计算机、主计算机等计算机5等连接,相互进行经由了网络7的信息的交换。
接口23是连接验证装置1和机器学习装置300的接口。机器学习装置300构成为,经由总线305将控制机器学习装置300整体的处理器301、存储了系统程序等的ROM302、用于进行机器学习相关的各个处理的暂时存储的RAM303以及学习模型等的存储所使用的非易失性存储器304连接。机器学习装置300能够观测可通过验证装置1经由接口23取得的各个信息。另外,验证装置1根据从机器学习装置300输出的检查对象相关的验证结果的推定来进行之后的处理。
图2是第一实施方式的验证装置1和机器学习装置300的概要功能框图。
图1所示的验证装置1所具备的CPU11以及机器学习装置300的处理器301分别执行系统程序,并控制验证装置1以及机器学习装置300的各部的动作,从而实现图2所示的各个功能块。
本实施方式的验证装置1具备数据取得部100、预处理部110、分析部120以及加工部130,验证装置1所具备的机器学习装置300具备学习部310以及推断部320。另外,在非易失性存储器14上设置了存储机器学习装置300的学习以及推断所使用的数据的学习数据存储部200,另外设定了学习数据相关的分析标准210。进一步,在机器学习装置300的非易失性存储器304上设置了存储通过学习部310的机器学习构筑的学习模型的学习模型存储部330。
数据取得部100从输入装置71或其他计算机5等取得作为学习数据而使用的各种数据。数据取得部100例如从作为按照作业人员的指示来控制工业机械(未图示)的控制装置的计算机5取得在该工业机械的作业工序中检测出的数据(信号数据、图像数据等)、(根据需要)表示作业人员目视对该取得的数据进行检查而得到的结果的标签数据、从其他计算机5取得的学习数据等,并存储在学习数据存储部200中。数据取得部100也可以从外部存储装置(未图示)取得数据。
预处理部110根据存储在学习数据存储部200中的学习数据来生成机器学习装置300的学习乃至推断所使用的数据。预处理部110例如根据存储在学习数据存储部200中的学习数据来生成机器学习装置300进行无监督学习时的学习所使用的状态数据S。预处理部110例如根据存储在学习数据存储部200中的学习数据来生成机器学习装置300进行有监督学习时的学习所使用的状态数据S以及标签数据L的组即训练数据。或者,预处理部110例如根据存储在学习数据存储部200中的学习数据来生成使用了机器学习装置300中的学习模型后的推断所使用的状态数据S。预处理部110将所取得的数据转换(数值化、正规化、采样等)为在机器学习装置300中处理的统一形式,从而生成状态数据S以及标签数据L。
预处理部110所生成的状态数据S例如可以是构成例如拍摄了通过工业机械生产的产品而得到的图像的像素值的数组数据等。另外,预处理部110所生成的状态数据S例如可以是包括例如从工业机械取得的各轴的速度值或转矩值、电流值、电压值、通过声音传感器检测出的传感器等的物理数据的数组数据等。
另外,预处理部110所生成的标签数据L例如可以是将通过工业机械生产出的产品的良品/次品进行分类的标签等,也可以是将工业机器的动作状态的正常/异常进行分类的标签等。
这些状态数据S以及标签数据L结合机器学习装置300的学习目的和学习方法、学习模型的种类等,能够取得各种形式。
学习部310进行使用了由预处理部110生成的数据的机器学习,生成(学习)作为学习结果的学习模型。学习部310在无监督学习中,使用由预处理部110生成的状态数据S来进行学习,另外,在有监督学习中,进行使用了由预处理部110生成的训练数据(状态数据S以及标签数据L)的学习。学习部310可以构成为例如进行将神经网络作为学习模型而使用的有监督学习。这样构成的情况下,作为学习模型可以使用具备了输入层、中间层、输出层三层的神经网络,但是也可以构成为通过使用所谓的深度学习的方法进行更有效的学习以及推断,该深度学习的方法使用了组成三层以上的层的神经网络。另外,学习部310例如可以进行使用了例如回归模型或SVM、Isolation Forest、Random Forest、Local OutlierFactor(孤立森林、随机森林、局部异常因子)等其他各种公知的学习模型的学习。由学习部310生成的学习模型被存储在设置在非易失性存储器304上的学习模型存储部330中,并用于推断部320的推断处理。
推断部320根据从预处理部110输入的状态数据S来进行使用了存储在学习模型存储部330中的学习模型的推断处理。推断部320使用由学习部310的学习生成(决定了参数)的学习模型,进行将从预处理部110输入的状态数据S作为输入数据的运算处理,由此输出根据该输入数据推断出的结果。由推断部320推断出的结果例如被输出给分析部120并用于分析,除此之外,可以显示输出给显示装置70,或者经由网络7发送输出给主计算机或云计算机等其他计算机5来使用。
分析部120根据分析标准210来进行存储在学习数据存储部120中的学习数据的分析。分析标准210是决定用于分析学习数据的分析方法和该分析的基准的标准,预先经由输入装置71由作业人员设定在被设置在非易失性存储器14上的验证装置1的设定区域中。分析标准210例如列举有学习数据中的异常数据的提取方法和该提取方法中的阈值等。作为该分析标准210的例子,列举有(a)在生成了集群集合时,在从任意集群(从任意集群都有距离)都偏离的数据内,从偏离程度高的一方提取n%的数据作为异常数据、(b)将学习数据空间中的周围密度相对于周围的学习数据的周围密度的比率不足预定比率r的学习数据作为异常数据来提取、(c)将学习模型的推断结果的可靠度不足m的数据作为异常数据来提取等。分析部120根据所设定的分析标准210,使用将存储在学习数据存储部200中的学习数据作为了输入数据的推断部320的推断结果,从该学习数据中提取异常数据。
加工部130根据存储在分析部120的学习数据存储部200中的学习数据的分析结果,进行被存储在学习数据存储部200中的学习数据的加工。加工部130例如可以进行从学习数据去除作为异常数据被提取出的数据的加工,另外,也可以针对作为异常数据被提取出的数据,赋予对当前被存储在学习数据存储部200中的学习数据赋予的标记以外的标记。加工部130例如可以对显示装置70显示作为异常数据被提取出的学习数据的列表,并且,催促作业人员指示对该异常数据进行的加工处理。此时,加工部130根据经由输入装置71的来自作业人员的指令,进行针对从被存储在学习数据存储部200中的学习数据提取出的异常数据的加工处理。
以下,表示分析部120以及加工部130进行的处理的例子。
作为分析部120以及加工部130进行的处理的第一例,考虑在金属制智能手机壳出货前的良品/次品检查中,进行将拍摄该金属制智能手机壳而得到的二维图像作为学习数据的无监督学习(Isolation Forest孤立森林),并使用作为该学习结果的学习模型进行产品的自动检查的例子。
此时,通过数据取得部100取得为了生成学习模型而拍摄很多产品而得的二维图像数据,并作为学习数据存储在学习数据存储部200中,但是其中很多良品的二维图像和少数次品的二维图像混在一起。一般在通过无监督学习生成用于进行分类的学习模型的情况下,只使用良品的学习数据,由此能够提高推断的精度,但是为此需要人工预先确认学习数据并进行良品/次品的区分。在本实施方式的验证装置1中能够基本自动进行该工序。
首先,进行使用了被存储在学习数据存储部200中的学习数据的学习部310的学习(Isolation Forest:孤立森林),构筑临时的学习模型。接着,推断部320进行基于所构筑的学习模型的针对各个学习数据的推断处理,由此推断针对各个学习数据的异常度。分析部120根据这样推断出的针对各个学习数据的异常度(学习数据集合中的该学习数据的偏离程度),提取上位的n%(以在生产现场中事先推定出的正常次品率作为基础而定义在分析标准中)的部分作为异常数据。然后,加工部130从学习数据存储部120除去作为分析部120的分析结果而被提取出的异常数据。之后,使用学习数据存储部200中所剩余的学习数据,由学习部310重新生成学习模型。这样,不需要针对学习数据的人工进行的事先的区分,因此提高作业效率,另外,能够通过去除异常数据来提高自动检查的性能。
作为分析部120以及加工部130进行的处理的第2例,考虑以下例子,在机床的故障诊断中,进行将在该机床动作时检测出的振动数据或声音数据作为学习数据的无监督学习(Local Outlier Factor局部异常因子),使用作为其学习结果的学习模型来自动诊断机床的故障状态。
此时,通过数据取得部110为了生成学习模型而从大量安装在机床上的传感器取得振动数据或声音数据,作为学习数据而存储在学习数据存储部200中,但是其中大量在正常状态下检测出的振动数据或声音数据和少数在故障状态下检测出的振动数据或声音数据混在一起。一般,在通过无监督学习生成用于分类的学习模型时,只使用正常状态的学习数据,由此能够提高推断的精度,但是为此需要预先人工确认学习数据并进行正常状态/故障状态的区分。在本实施方式的验证装置1中,基本能够自动进行该工序。
首先,学习部310进行使用了被存储在学习数据存储部200中的学习数据的学习(Local Outlier Factor),构筑临时的学习模型。接着,推断部320进行基于所构筑的学习模型的针对各个学习数据的推断处理。于是,关于各个学习数据,推断学习数据空间中的该学习数据的周围密度和周围的学习数据的周围密度的比率。
分析部120将这样推断出的各个学习数据的周围密度相对于周围的学习数据的周围密度的比率(相对于周围学习数据的偏离程度)不足预定比率r(通过分析标准定义)的学习数据作为异常数据来提取。并且,加工部130从学习数据存储部120除去作为分析部120的分析结果而被提取出的异常数据。之后,使用学习数据存储部200中剩余的学习数据,由学习部310重新生成学习模型。这样,不需要针对学习数据的人工事先的区分,因此提高作业效率,另外,能够通过去除异常数据来提高自动诊断的性能。
作为分析部120以及加工部130进行的处理的第3例,考虑以下例子,例如在金属制智能手机壳出货前的损伤模式检查中,进行将拍摄该金属制智能手机壳而得到的二维图像作为学习数据的有监督学习(Random Forest随机森林),使用作为其学习结果的学习模型来进行产品的损伤模式的自动检查。
此时,确定事先设想的损伤模式(擦伤、切伤等),通过数据取得部100取得为了生成学习模型而拍摄很多产品而得的二维图像数据,将是良品或者被分类为哪个损伤模式作为标签赋予所取得的各个数据的学习数据作为学习数据而存储在学习数据存储部200中,但是此时难以决定损伤模式的定量分类基准,因此标记标注容易变得不明确,其结果会有自动诊断的质量容易出现波动的问题。在本实施方式的验证装置1中,关于该分类所使用的标记的妥当性,基本能够自动验证。
首先,进行使用了存储(赋予了临时标签)在学习数据存储部200中的学习数据的学习部310的学习(Random Forest),构筑临时的学习模型。接着,推断部320进行基于所构筑的学习模型的针对各个学习数据的推断处理,由此推断针对每个学习数据的分类及其可靠度。分析部120根据这样推断出的针对各个学习数据的分类和可靠度(学习数据属于该分类的可靠程度),提取可靠度不足m(通过分析标准定义)的学习数据作为被赋予异常标记的数据。并且,加工部130针对作为分析部120的分析结果而提取出的被赋予异常标记的学习数据存储部200内的学习数据重新赋予新的标记(例如损伤模式A等)。之后,使用学习数据存储部200中剩余的学习数据,由学习部310重新生成临时的学习模型,重复以上工序,直到所有的学习数据为可靠度m以上为止,将在所有的学习数据为可靠度m以上的时间点的学习模型设为产品的损伤模式的自动检查中所使用的学习模型。通过这样,能够决定遵从学习数据中可能出现的损伤模式的分类基准,并能够提高自动检查的性能。
以上,说明了本发明的实施方式,但是本发明不仅限于上述实施方式的例子,能够通过增加适当的变更以各种方式来实施。
Claims (3)
1.一种验证装置,验证存储在学习数据存储部中的学习数据的妥当性,其特征在于,
该验证装置具备:
学习部,其通过基于存储在上述学习数据存储部中的学习数据的学习来生成学习模型;
推断部,其根据存储在上述学习数据存储部中的学习数据来进行使用了上述学习模型的推断;
分析部,其按照用于分析存储在上述学习数据存储部中的学习数据的分析方法以及决定了该分析中的基准的分析标准,使用上述推断部的推断结果来分析存储在上述学习数据存储部中的学习数据;以及
加工部,其按照上述分析部的分析结果来加工存储在上述学习数据存储部中的学习数据。
2.根据权利要求1所述的验证装置,其特征在于,
上述分析标准使用上述推断部的推断结果来决定用于从存储在上述学习数据存储部中的学习数据中提取异常数据的阈值,
上述分析部按照上述分析标准从存储在上述学习数据存储部中的学习数据提取异常数据,
上述加工部从上述学习数据存储部去除上述分析部提取出的异常数据。
3.根据权利要求1所述的验证装置,其特征在于,
上述分析标准决定作为与存储在上述学习数据存储部中的学习数据相关的上述推断部的推断结果的可靠度的阈值,
上述分析部按照上述分析标准从存储在上述学习数据存储部中的学习数据提取可靠度低的学习数据,
上述加工部针对上述分析部提取出的可靠度低的数据,赋予与被赋予存储在上述学习数据存储部中的学习数据的标记不同的新标记。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018170951A JP2020042673A (ja) | 2018-09-12 | 2018-09-12 | 検証装置 |
JP2018-170951 | 2018-09-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110895719A true CN110895719A (zh) | 2020-03-20 |
Family
ID=69621628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910860129.2A Pending CN110895719A (zh) | 2018-09-12 | 2019-09-11 | 验证装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200082281A1 (zh) |
JP (1) | JP2020042673A (zh) |
CN (1) | CN110895719A (zh) |
DE (1) | DE102019123763A1 (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5510642B2 (ja) * | 2010-02-25 | 2014-06-04 | 富士電機株式会社 | 予測・診断モデルの構築装置 |
JP6453086B2 (ja) * | 2015-01-30 | 2019-01-16 | 株式会社日立ハイテクノロジーズ | 稼働データ分類装置 |
-
2018
- 2018-09-12 JP JP2018170951A patent/JP2020042673A/ja active Pending
-
2019
- 2019-08-21 US US16/546,301 patent/US20200082281A1/en not_active Abandoned
- 2019-09-05 DE DE102019123763.7A patent/DE102019123763A1/de not_active Withdrawn
- 2019-09-11 CN CN201910860129.2A patent/CN110895719A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
DE102019123763A1 (de) | 2020-03-12 |
US20200082281A1 (en) | 2020-03-12 |
JP2020042673A (ja) | 2020-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6693938B2 (ja) | 外観検査装置 | |
US10835930B2 (en) | Sorting system | |
JP6450858B2 (ja) | 設備管理装置および方法 | |
US20200143292A1 (en) | Signature enhancement for deviation measurement-based classification of a detected anomaly in an industrial asset | |
CN109955242B (zh) | 巡维机器人控制方法、装置、计算机设备以及存储介质 | |
JP6795562B2 (ja) | 検査装置及び機械学習方法 | |
JP7012888B2 (ja) | 異常要因推定装置、異常要因推定方法、及びプログラム | |
JP6823025B2 (ja) | 検査装置及び機械学習方法 | |
JP7148311B2 (ja) | 製品検査装置 | |
JP7148322B2 (ja) | 画像処理装置 | |
JP7251955B2 (ja) | 検出装置及び機械学習方法 | |
US11676055B2 (en) | System for detecting data drift in machine-learning process monitoring | |
CN110895719A (zh) | 验证装置 | |
US20230274408A1 (en) | Inspection device | |
CN112599234A (zh) | 诊断装置 | |
WO2023181277A1 (ja) | 外観検査装置、外観検査方法、及びコンピュータ読み取り可能な記録媒体 | |
WO2023139750A1 (ja) | データセット作成装置及びコンピュータ読み取り可能な記録媒体 | |
JP2021086219A (ja) | 協調作業システム、解析収集装置および解析プログラム | |
EP3640751A1 (en) | Apparatus for gas analysis and emission prediction | |
JPWO2020194716A1 (ja) | 学習装置、学習方法及びプログラム | |
WO2022065273A1 (ja) | 外観検査のためのモデル作成装置及び外観検査装置 | |
CN116702030B (zh) | 一种基于传感器可靠性分析的高炉状态监测方法及装置 | |
WO2022065272A1 (ja) | 外観検査のためのモデル作成装置及び外観検査装置 | |
JP6840294B1 (ja) | プログラマブル表示器、制御システムおよび解析方法 | |
CN112947507B (zh) | 无人机的维修处理方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200320 |