CN109558936A - 异常判定方法和程序 - Google Patents
异常判定方法和程序 Download PDFInfo
- Publication number
- CN109558936A CN109558936A CN201811023742.0A CN201811023742A CN109558936A CN 109558936 A CN109558936 A CN 109558936A CN 201811023742 A CN201811023742 A CN 201811023742A CN 109558936 A CN109558936 A CN 109558936A
- Authority
- CN
- China
- Prior art keywords
- data
- value
- normal
- noise
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 230000005856 abnormality Effects 0.000 title claims abstract description 55
- 238000013528 artificial neural network Methods 0.000 claims abstract description 156
- 230000002159 abnormal effect Effects 0.000 claims abstract description 73
- 238000001514 detection method Methods 0.000 claims description 62
- 238000012360 testing method Methods 0.000 claims description 24
- 238000000513 principal component analysis Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 48
- 238000004364 calculation method Methods 0.000 description 32
- 230000006870 function Effects 0.000 description 31
- 230000009467 reduction Effects 0.000 description 27
- 238000004891 communication Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 14
- 239000000470 constituent Substances 0.000 description 13
- 230000008859 change Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 210000005036 nerve Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 210000004218 nerve net Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003585 interneuronal effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1425—Traffic logging, e.g. anomaly detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Image Analysis (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
异常检测方法对第一数据附加正常噪声,生成第二数据(102),对所述第一数据附加异常噪声,生成第三数据(103),向神经网络(211)输入所述第一数据、所述第二数据以及所述第三数据中的每一个,算出第一正常得分、第二正常得分以及第三正常得分,基于第一差和第二差算出第三差(105),所述第一差基于所述第一正常得分与所述第二正常得分的差异,所述第二差基于所述第一正常得分与所述第三正常得分的差异,以将所述第三差设为最小的方式变更所述神经网络(105),向变更了的所述神经网络输入正常还是异常为未知的第四数据,判定所述第四数据为正常还是异常(106)。
Description
技术领域
本公开涉及使用了神经网络的异常判定方法和程序。
背景技术
例如,非专利文献1公开了被称为得分匹配的学习方法与被称为降噪自动编码器的学习方法的关系。得分匹配具有能够应用于各种模型的优点,另一方面,具有学习困难的缺点。然而,示出了从得分匹配和降噪自动编码器的每一个得到的解一致这一情况。因此,就模型的表达而言,基于得分匹配,就学习方法而言,基于降噪自动编码器,由此保持能够应用于各种模型这一优点,且学习变得容易。另外,非专利文献2公开了基于非专利文献1公开的方法对图像数据、时序数据以及多维数据使用了多层神经网络的异常检测方法。专利文献1公开了使用复原型神经网络检测故障的方法。
在先技术文献
专利文献
专利文献1:国际公开第2016/132468号
非专利文献
非专利文献1:Pascal Vincent,“A Connection Between Score Matching andDenoising Autoencoders”,Neural Computation,2011年7月,第23卷,第7期,第1661-1674页
非专利文献2:Shuangfei Zhai等,“Deep structured energy based models foranomaly detection”,Proceedings of the 33rd International Conference onMachine Learning(ICML.2016),2016年6月,第48卷,第1100-1109页
非专利文献3:J.Ngiam、Z.Chen、P.W.Koh以及A.Y.Ng,“Learning Deep EnergyModels”,Proceedings of the 28th International Conference on Machine Learning(ICML.2011),2011年,第1105-1112页
非专利文献4:Pascal Vincent等,“Extracting and composing robustfeatures with denoising autoencoders”,Proceedings of the 25th InternationalConference on Machine learning(ICML.2008),2008年,第1096-1103页
发明内容
在将非专利文献1和2记载的技术应用于使用了专利文献1的神经网络的异常检测时,精度有可能变低。
本公开提供一种提高使用了神经网络的异常检测的精度的异常判定方法和程序。
本公开的一个技术方案涉及的异常判定方法是异常检测方法,包括:(a1)取得作为正常数据的第一数据,在此,所述正常数据是通过神经网络判定为正常的数据,(a2)用根据所述第一数据的种类预先设定的方法对所述第一数据附加正常噪声,生成第二数据,在此,所述第二数据是通过所述神经网络判定为正常的数据,(a3)用根据所述第一数据的种类预先设定的方法对所述第一数据附加异常噪声,生成第三数据,在此,所述第三数据是通过所述神经网络判定为异常的数据,(a4)向所述神经网络输入所述第一数据、所述第二数据以及所述第三数据中的每一个,算出第一正常得分、第二正常得分以及第三正常得分,在此,所述第一正常得分、所述第二正常得分以及所述第三正常得分表示将输入到所述神经网络的数据的像正常数据的程度进行了数值化而得到的值,(a5)算出基于所述第一正常得分与所述第二正常得分的差异的第一差,算出基于所述第一正常得分与所述第三正常得分的差异的第二差,算出基于所述第一差与所述第二差的差异的第三差,(a6)算出使所述第三差为最小的所述神经网络的参数,(a7)使用算出的所述参数变更所述神经网络,(a8)从存储有正常还是异常为未知的数据的测试数据库取得第四数据,将所述第四数据输入到变更了的所述神经网络,算出第四正常得分,基于所述第四正常得分判定所述第四数据为正常还是异常,所述(a1)~所述(a8)中的至少一个由处理器执行。
本公开的一个技术方案涉及的程序使计算机执行:(a1)取得作为正常数据的第一数据,在此,正常数据是通过神经网络判定为正常的数据,(a2)用根据所述第一数据的种类预先设定的方法对所述第一数据附加正常噪声,生成第二数据,在此,所述第二数据是通过所述神经网络判定为正常的数据,(a3)用根据所述第一数据的种类预先设定的方法对所述第一数据附加异常噪声,生成第三数据,在此,所述第三数据是通过所述神经网络判定为异常的数据,(a4)向所述神经网络输入所述第一数据、所述第二数据以及所述第三数据中的每一个,算出第一正常得分、第二正常得分以及第三正常得分,在此,所述第一正常得分、所述第二正常得分以及所述第三正常得分表示将输入到所述神经网络的数据的像正常数据的程度进行了数值化而得到的值,(a5)算出基于所述第一正常得分与所述第二正常得分的差异的第一差,算出基于所述第一正常得分与所述第三正常得分的差异的第二差,算出基于所述第一差与所述第二差的差异的第三差,(a6)算出使所述第三差为最小的所述神经网络的参数,(a7)使用算出的所述参数变更所述神经网络,(a8)从存储有正常还是异常为未知的数据的测试数据库取得第四数据,将所述第四数据输入到变更了的所述神经网络,算出第四正常得分,基于所述第四正常得分判定所述第四数据为正常还是异常。
此外,上述总括或具体的技术方案既可以用系统、装置、方法、集成电路、计算机程序或计算机可读取的记录盘等记录介质来实现,也可以用系统、装置、方法、集成电路、计算机程序以及记录介质的任意组合来实现。计算机可读取记录介质例如包含CD-ROM(CompactDisc-Read Only Memory)等非易失性记录介质。
根据本公开的异常判定方法等,能够提高使用了神经网络的异常检测的精度。
附图说明
图1是示出实施方式涉及的异常检测系统的功能性构成的框图。
图2是示出实施方式涉及的异常检测装置的处理的整体流程的一例的流程图。
图3是示出在图2的步骤S102中第一输入数据为图像的情况下的处理的详细情况的一例的流程图。
图4是示出与图3和图5的处理对应的图像数据的例子的示意图。
图5是示出在图2的步骤S103中第一输入数据为图像的情况下的处理的详细情况的一例的流程图。
图6是示出在图2的步骤S102中第一输入数据为时序数据的情况下的处理的详细情况的一例的流程图。
图7是示出与图6和图9的处理对应的时序数据的例子的示意图。
图8是示出使用第一输入数据的微分值取代第一输入数据的情况下的处理的例子的示意图。
图9是示出在图2的步骤S103中第一输入数据为时序数据的情况下的处理的详细情况的一例的流程图。
图10是示出在图2的步骤S102中第一输入数据为多维数据的情况下的处理的详细情况的一例的流程图。
图11是示出与图10的处理对应的多维数据的例子的示意图。
图12是示出在图2的步骤S103中第一输入数据为多维数据的情况下的处理的详细情况的一例的流程图。
具体实施方式
[成为本公开的见解]
近年来,在图像辨认和自然语言处理等领域中,基于多层神经网络的辨认和识别方法取得显著的进步,也开始应用于异常检测方法。例如,专利文献1公开了将复原型神经网络和识别型神经网络组合并检测设备的故障的系统。复原型神经网络是自动编码器(自编码器)。例如,非专利文献4公开了在学习数据中加入噪声并利用自动编码器除去噪声的降噪自动编码器。噪声一般使用高斯噪声。例如,非专利文献3公开了将多层神经网络的输出作为能量处理,并进行无监督学习的能量模型(Energy Based Model)。
在使用降噪自动编码器的情况下,成为学习的准则的目标函数被定义为输入数据与复原数据的误差。虽然其计算容易,但另一方面,由于需要编码器和解码器,所以具有如下缺点:在计算中使用的神经网络的参数增大或限定了可利用的网络构造。在使用能量模型的情况下,由于不需要与降噪自动编码器中的解码器相当的网络,所以具有能够利用多种网络构造这一优点。然而,成为学习准则的目标函数的函数值的计算很困难。
另外,非专利文献1公开了降噪自动编码器与得分匹配的关系。具体而言,非专利文献1公开了降噪自动编码器与应用得分匹配的能量模型的关联性。由此,能够进行将目标函数的函数值的计算容易这一降噪自动编码器的优点和能够利用多种网络构造这一能量模型的优点双方组合而成的学习。在非专利文献1中,基于从能量模型和降噪自动编码器得到的解一致,且学习数据周边的真实的分布能够利用高斯分布近似这一假定,在降噪自动编码器的噪声函数中使用高斯分布。另外,非专利文献2公开了基于非专利文献1公开的方法,对图像数据、时序数据以及多维数据使用了多层神经网络的异常检测方法。
然而,本发明人们发现:在非专利文献1公开的降噪自动编码器与能量模型的关联性中,近似计算的精度有改善的余地。在降噪自动编码器中,对输入数据施加高斯噪声并以能够利用神经网络复原输入数据的方式进行学习,相当于在能量模型中,在与输入数据的分布相关的期待值计算时用高斯分布对输入数据的周围的分布进行近似并积分。然而,输入数据的周围的分布不一定能够用高斯分布高精度地近似。在利用高斯分布无法对输入数据周边的真实的分布进行近似的情况下,噪声函数的近似精度变差,在应用于异常检测方法等的情况下,成为神经网络的性能下降的因素。因此,本发明人们发现:为了提高异常检测的性能,需要提高应施加到输入数据的噪声所对应的噪声函数的近似精度。
降噪自动编码器原本是以通用性能的提高为目的而提出的,未考虑对输入数据的分布进行近似。在非专利文献1中,公开了降噪自动编码器与能量模型的关系,但未提及降噪自动编码器中的噪声的施加方法。另外,专利文献1和非专利文献2未公开在降噪自动编码器中根据数据变更噪声函数。因此,本发明人们为了提高异常判定中的性能,完成以下记载的技术。而且,以下记载的技术通过变更降噪自动编码器中的噪声的种类,从而能够更准确地进行与能量模型中的输入数据的分布相关的期待值计算,改善正常模型的学习,并使异常检测的性能提高。
本公开的一个技术方案涉及的异常判定方法是异常检测方法,包括:
(a1)取得作为正常数据的第一数据,在此,所述正常数据是通过神经网络判定为正常的数据,(a2)用根据所述第一数据的种类预先设定的方法对所述第一数据附加正常噪声,生成第二数据,在此,所述第二数据是通过所述神经网络判定为正常的数据,(a3)用根据所述第一数据的种类预先设定的方法对所述第一数据附加异常噪声,生成第三数据,在此,所述第三数据是通过所述神经网络判定为异常的数据,(a4)向所述神经网络输入所述第一数据、所述第二数据以及所述第三数据中的每一个,算出第一正常得分、第二正常得分以及第三正常得分,在此,所述第一正常得分、所述第二正常得分以及所述第三正常得分表示将输入到所述神经网络的数据的像正常数据的程度进行了数值化而得到的值,(a5)算出基于所述第一正常得分与所述第二正常得分的差异的第一差,算出基于所述第一正常得分与所述第三正常得分的差异的第二差,算出基于所述第一差与所述第二差的差异的第三差,(a6)算出使所述第三差为最小的所述神经网络的参数,(a7)使用算出的所述参数变更所述神经网络,(a8)从存储有正常还是异常为未知的数据的测试数据库取得第四数据,将所述第四数据向变更了的所述神经网络输入,算出第四正常得分,基于所述第四正常得分判定所述第四数据为正常还是异常,所述(a1)~所述(a8)中的至少一个由处理器执行。
根据上述技术方案,通过使用正常噪声和异常噪声作为向正常数据施加的噪声,从而能够提高正常数据的分布的近似精度,并更准确地进行学习时的神经网络的目标函数的函数值的计算。其结果,能够改善正常模型的学习,并使异常检测的性能提高。此外,数据库既可以由一个数据库构成,也可以由多个数据库构成。第一数据可以存储于后述的学习数据库。
例如,在降噪自动编码器中,学习输入数据成为局部解(localized solution)的正常模型。在仅使用了高斯噪声的情况下,不依据输入数据而一样地施加高斯噪声,加入了噪声的输入数据全部做完正常得分会减少的数据来处理。然而,施加于输入数据的噪声不一定使全部正常得分减少。例如,将数字“0”的图像A设为正常,将图像A的正常得分设为正常得分A。在图像A与图像B的差异为数字“0”的像的微小的位置的不同、微小的倾斜的不同或者微小的线的粗细的不同的情况下,可认为图像B的正常得分可以与正常得分A同等。因此,作为噪声的施加方法,通过使用使正常得分减少的异常噪声和不使正常得分减少的正常噪声并将它们区分,能够高精度地算出能量模型中的目标函数的函数值。
记述不使正常得分减少的全部噪声施加方法并定义为正常噪声是困难的。然而,基于与输入数据相关的见解,如果将施加了噪声之后也应把输入数据作为正常来进行处理的噪声的施加方法的一部分定义为正常噪声,则由于在以往的降噪自动编码器中能够适当地处理异常噪声所包含的正常噪声,所以能够实现目标函数的函数值的算出精度的提高。
也可以是,在本公开的一个技术方案涉及的异常判定方法中,在所述第一数据为图像的情况下,在所述(a1)与所述(a2)之间,(b1)检测包含于所述图像的边缘的像素位置,(b2)将距所述边缘的像素位置为第一距离以下的像素位置的区域设定为异常噪声区域,且将所述图像中不包含于所述异常噪声区域的区域设定为正常噪声区域,所述(a2)中的所述预先设定的方法中,对所述正常噪声区域附加噪声,制作所述第二数据,所述(a3)中的所述预先设定的方法中,对所述异常噪声区域附加噪声,制作所述第三数据。
根据上述技术方案,能够将使被摄体的图像的形状发生变化且可使正常数据变形为异常数据的噪声作为异常噪声处理,将不使被摄体的图像的形状发生变化且对正常数据附加噪声后的数据也是正常数据的噪声也作为正常噪声处理使用。由此,能够高精度地算出神经网络中的目标函数的函数值,并使异常检测的性能提高。
也可以是,在本公开的一个技术方案涉及的异常判定方法中,在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,在所述(a1)中,(c1)算出所述第一数据值的平均值,(c2)对于所述第一数据值中超过所述平均值的超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数超过相对于所述超过数据值的总数据数的预先设定的比例时的数据值设定为上阈值,对于所述第一数据值中的小于所述平均值的非超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的数据值设定为下阈值,(c3)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,(c4)将不包含于所述正常噪声区域的区域设定为异常噪声区域,在所述(a2)中,在包含于所述多个数据值的数据值i包含于正常噪声区域的情况下,对所述数据值i附加所述正常噪声,在所述(a3)中,在包含于所述多个数据值的数据值j包含于异常噪声区域的情况下,对所述数据值j附加所述异常噪声。
根据上述技术方案,能够将使时序数据的图案发生变化且可使正常数据变形为异常数据的噪声作为异常噪声处理,将不使时序数据的图案发生变化且对正常数据附加噪声后的数据也保持为正常数据的噪声也作为正常噪声处理使用。由此,能够高精度地算出神经网络中的目标函数的函数值,并使异常检测的性能提高。
也可以是,在本公开的一个技术方案涉及的异常判定方法中,在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,在所述(a1)中,(d1)算出与所述多个数据值对应的多个微分数据值,(d2)算出所述多个微分数据值的平均值,(d3)对于所述多个微分数据值中超过所述平均值的超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为上阈值,对于所述多个微分数据值中的、作为小于所述平均值的微分数据值的非超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为下阈值,(d4)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,(d5)将不包含于所述正常噪声区域的区域设定为异常噪声区域,在所述(a2)~所述(a4)中,使用所述微分数据值取代所述第一数据的数据值,在所述(a2)中,在包含于所述多个微分数据值的微分数据值i包含于正常噪声区域的情况下,对所述微分数据值i附加所述正常噪声,在所述(a3)中,在包含于所述多个微分数据值的微分数据值j包含于异常噪声区域的情况下,对所述微分数据值j附加所述异常噪声,在所述(a8)中,使用包含于所述第四数据的数据值的微分值来取代包含于所述第四数据的数据值。
根据上述技术方案,能够将对于时序数据的时间变化可使正常数据变形为异常数据的噪声作为异常噪声处理,将对于时序数据的时间变化不使正常数据变化为异常数据且对正常数据附加噪声后的数据也保持为正常数据的噪声也作为正常噪声处理使用。由此,能够高精度地算出神经网络中的目标函数的函数值,并使异常检测的性能提高。
也可以是,在本公开的一个技术方案涉及的异常判定方法中,在所述第一数据为多维数据的情况下,在所述(a1)中,(e1)进行所述第一数据的主成分分析,算出主成分的特征值和特征向量,(e2)基于所述特征值和所述特征向量,算出所述第一数据的微分方向,(e3)将所述微分方向设定为异常噪声方向,(e4)将与所述异常噪声方向垂直的方向设定为正常噪声方向,在所述(a2)中,作为所述预先设定的方法,将所述正常噪声方向的噪声附加于所述第一数据,制作所述第二数据,在所述(a3)中,作为所述预先设定的方法,将所述异常噪声方向的噪声附加于所述第一数据,制作所述第三数据。
根据上述技术方案,能够将对于多维数据可使正常数据变形为异常数据的噪声作为异常噪声处理,将不使多维数据变化为异常数据且对正常数据附加噪声后的数据也保持为正常数据的噪声也作为正常噪声处理使用。由此,能够高精度地算出神经网络中的目标函数的函数值,并使异常检测的性能提高。
也可以是,在本公开的一个技术方案涉及的异常判定方法中,在所述(a7)中,算出所述神经网络的变更前后的所述第三差的变动量,在所述第三差减少的情况下,变更所述神经网络,在所述第三差增加的情况下,以基于所述第三差的变动量的概率变更所述神经网络。
另外,本公开的一个技术方案涉及的程序使计算机执行:
(a1)取得作为正常数据的第一数据,在此,所述正常数据是通过神经网络判定为正常的数据,(a2)用根据所述第一数据的种类预先设定的方法对所述第一数据附加正常噪声,生成第二数据,在此,所述第二数据是通过所述神经网络判定为正常的数据,(a3)用根据所述第一数据的种类预先设定的方法对所述第一数据附加异常噪声,生成第三数据,在此,所述第三数据是通过所述神经网络判定为异常的数据,(a4)向所述神经网络输入所述第一数据、所述第二数据以及所述第三数据中的每一个,算出第一正常得分、第二正常得分以及第三正常得分,在此,所述第一正常得分、所述第二正常得分以及所述第三正常得分表示将输入到所述神经网络的数据的像正常数据的程度进行了数值化而得到的值,(a5)算出基于所述第一正常得分与所述第二正常得分的差异的第一差,算出基于所述第一正常得分与所述第三正常得分的差异的第二差,算出基于所述第一差与所述第二差的差异的第三差,(a6)算出使所述第三差为最小的所述神经网络的参数,(a7)使用算出的所述参数变更所述神经网络,(a8)从存储有正常还是异常为未知的数据的测试数据库取得第四数据,将所述第四数据输入到变更了的所述神经网络,算出第四正常得分,基于所述第四正常得分判定所述第四数据为正常还是异常。根据上述技术方案,能够得到与本公开的一个技术方案涉及的异常判定方法同样的效果。
也可以是,在本公开的一个技术方案涉及的程序中,在所述第一数据为图像的情况下,在所述(a1)与所述(a2)之间,(b1)检测包含于所述图像的边缘的像素位置,(b2)将距所述边缘的像素位置第一距离以下的像素位置的区域设定为异常噪声区域,且将所述图像中的不包含于所述异常噪声区域的区域设定为正常噪声区域,所述(a2)中的所述预先设定的方法中,对所述正常噪声区域附加噪声,制作所述第二数据,所述(a3)中的所述预先设定的方法中,对所述异常噪声区域附加噪声,制作所述第三数据。
也可以是,在本公开的一个技术方案涉及的程序中,在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,在所述(a1)中,(c1)算出所述第一数据值的平均值,(c2)对于所述第一数据值中超过所述平均值的超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数相对于所述超过数据值的总数据数的比例超过预先设定的比例时的数据值设定为上阈值,对于所述第一数据值中的小于所述平均值的非超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的数据值设定为下阈值,(c3)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,(c4)将不包含于所述正常噪声区域的区域设定为异常噪声区域,在所述(a2)中,在包含于所述多个数据值的数据值i包含于正常噪声区域的情况下,对所述数据值i附加所述正常噪声,在所述(a3)中,在包含于所述多个数据值的数据值j包含于异常噪声区域的情况下,对所述数据值j附加所述异常噪声。
也可以是,在本公开的一个技术方案涉及的程序中,在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,在所述(a1)中,(d1)算出与所述多个数据值对应的多个微分数据值,(d2)算出所述多个微分数据值的平均值,(d3)对于所述多个微分数据值中超过所述平均值的超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为上阈值,对于所述多个微分数据值中作为小于所述平均值的微分数据值的非超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为下阈值,(d4)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,(d5)将不包含于所述正常噪声区域的区域设定为异常噪声区域,在所述(a2)~所述(a4)中,使用所述微分数据值取代所述第一数据的数据值,在所述(a2)中,在包含于所述多个微分数据值的微分数据值i包含于正常噪声区域的情况下,对所述微分数据值i附加所述正常噪声,在所述(a3)中,在包含于所述多个微分数据值的微分数据值j包含于异常噪声区域的情况下,对所述微分数据值j附加所述异常噪声,在所述(a8)中,使用包含于所述第四数据的数据值的微分值来取代包含于所述第四数据的数据值。
也可以是,在本公开的一个技术方案涉及的程序中,在所述第一数据为多维数据的情况下,在所述(a1)中,(e1)进行所述第一数据的主成分分析,算出主成分的特征值和特征向量,(e2)基于所述特征值和所述特征向量,算出所述第一数据的微分方向,(e3)将所述微分方向设定为异常噪声方向,(e4)将与所述异常噪声方向垂直的方向设定为正常噪声方向,在所述(a2)中,作为所述预先设定的方法,将所述正常噪声方向的噪声附加于所述第一数据,制作所述第二数据,在所述(a3)中,作为所述预先设定的方法,将所述异常噪声方向的噪声附加于所述第一数据,制作所述第三数据。
也可以是,在本公开的一个技术方案涉及的程序中,在所述(a7)中,算出所述神经网络的变更前后的所述第三差的变动量,在所述第三差减少的情况下,变更所述神经网络,在所述第三差增加的情况下,以基于所述第三差的变动量的概率变更所述神经网络。
上述异常判定方法的作用效果在异常检测装置和异常检测系统中也同样地实现。此外,上述总括或具体的技术方案既可以用系统、装置、方法、集成电路、计算机程序或计算机可读取的记录盘等记录介质来实现,也可以用系统、装置、方法、集成电路、计算机程序以及记录介质的任意组合来实现。计算机可读取记录介质例如包含CD-ROM等非易失性记录介质。
[实施方式]
以下,参照附图说明实施方式。此外,以下说明的实施方式均为示出总括或具体的例子的实施方式。在以下实施方式示出的数值、形状、构成要素、构成要素的配置位置以及连接方式、步骤、步骤(工序)的顺序等均为一例,并不意图限定本公开。另外,关于以下实施方式的构成要素中的、在表示最上位概念的独立权利要求中没有记载的构成要素,作为任意的构成要素进行说明。另外,在以下的实施方式的说明中,有时使用大致平行、大致正交这样的伴随着“大致”的表达。例如,大致平行不仅意味着完全平行,也意味着实质上平行,即,例如包括数个百分比程度的差异。其他伴随着“大致”的表达也同样如此。另外,各图为示意图,并不是严格地进行了图示的图。并且,在各图中,有时对实质上相同的构成要素标注同一标号,并省略或简化重复的说明。
在图1中,用框图示出实施方式涉及的异常检测系统1000的功能性构成。异常检测系统1000使用神经网络211检测输入数据中的异常的有无。进而,异常检测系统1000通过进行使用了神经网络211的机器学习,从而使异常的检测精度提高。
如图1所示,异常检测系统1000具备异常检测装置100、学习数据库(以下,有时称为“学习DB”)201、测试数据库(以下,有时称为“测试DB”)202以及神经网络211。进而,异常检测装置100具备输入数据取得部101、正常噪声附加数据生成部102、异常噪声附加数据生成部103、网络参数算出部105、异常检测部106以及存储部107。此外,异常检测系统也可以包含神经网络211。
作为异常检测装置100的构成要素的输入数据取得部101、正常噪声附加数据生成部102、异常噪声附加数据生成部103、网络参数算出部105以及异常检测部106、神经网络211可以由包含CPU(Central Processing Unit)或DSP(Digital Signal Processor)等处理器、RAM(Random Access Memory)和ROM(Read-Only Memory)等存储器的处理电路构成。上述构成要素的一部分或全部功能也可以通过CPU或DSP使用RAM作为作业用的存储器并执行记录于ROM的程序而实现。另外,上述构成要素的一部分或全部功能可以利用电子电路或集成电路等专用的硬件电路实现。上述构成要素的一部分或全部功能可以利用软件功能与硬件电路的组合构成。程序可以作为应用程序提供。该应用程序可以经由使用了互联网等通信网络的通信、基于移动通信标准的通信或广播(broadcast)等提供。可以使用无线网络或有线网络提供该应用程序。
学习数据库201和测试数据库202可以与异常检测装置100一起设置于一个装置,也可以设置于与异常检测装置100分离的装置。在学习数据库201和测试数据库202设置于与异常检测装置100分离的装置的情况下,学习数据库201和测试数据库202可以经由有线通信或无线通信与异常检测装置100连接。在学习数据库201和测试数据库202中的每一个经由无线通信与异常检测装置100连接的情况下,学习数据库201和测试数据库202中的每一个可以经由互联网等通信网络与异常检测装置100连接,在该情况下,学习数据库201和测试数据库202可以设置于云服务器。异常检测装置100可以设置于一个装置,也可以分离地设置于两个以上装置。在异常检测装置100分离地设置于两个以上装置的情况下,该两个以上装置可以经由有线通信或无线通信连接。例如,后述的与神经网络的学习相关的输入数据取得部101、正常噪声附加数据生成部102、异常噪声附加数据生成部103以及网络参数算出部105可以设置于云服务器。
学习数据库201和测试数据库202能够存储信息,且存储于学习数据库201和测试数据库202的信息能够取出。学习数据库201在异常检测系统1000中记录被视为正常数据的第一输入数据。例如,正常数据是示出正常状态的数据或正确的数据等,异常数据是示出异常状态的数据或不正确的数据等。
正常数据和异常数据的定义可以由用户根据数据的用途决定。例如,在数据是安装于建筑物的振动传感器的时序数据的情况下,可以将在建筑物上有裂纹或破损的状态下取得的数据作为异常数据,将在除此以外的状态下取得的数据作为正常数据。或者,也可以将发生了地震的情况下的数据作为异常数据,将除此以外的情况下的数据作为正常数据。
具体而言,用户通过仅将正常数据预先记录于学习数据库201从而定义正常数据。即,用户将想作为正常数据处理的数据记录于学习数据库201即可。此外,如裂纹或破损的产生、地震的发生这样,异常数据不一定能够观测,且难以预先正确地仅区分正常数据的情况下,可以在正常数据中以一定的比例,例如10%的比例包含异常数据。
第一输入数据可以是图像数据、时序数据以及多维数据等中的任一种。第一输入数据可以与数据的种类关联并存储。数据的种类是利用图像数据、时序数据以及多维数据等区分的种类。测试数据库202记录正常还是异常为未知的第二输入数据。虽然第二输入数据可以是图像数据、时序数据以及多维数据中的任一种,但需要是与学习数据库201相同种类的数据。在此,第一输入数据是第一数据的一例,第二输入数据是第四数据的一例。另外,学习数据库201是数据库的一例。学习数据库201可以保持多个正常数据。此外,多个正常数据中的每一个可以是不同的图像数据、时序数据或多维数据。
学习数据库201和测试数据库202例如利用ROM、RAM、闪速存储器等半导体存储器、硬盘驱动器或SSD(Solid State Drive:固态硬盘)等存储装置实现。
存储部107能够存储信息,且存储于存储部107的信息能够取出。存储部107存储异常检测装置100的各构成要素用于执行处理的计算机程序、识别器、从学习数据库201和测试数据库202取得的数据等。存储部107例如利用ROM、RAM、闪速存储器等半导体存储器、硬盘驱动器或SSD等存储装置实现。存储部107可以包含学习数据库201或测试数据库202,也可以与它们分开。也就是说,存储部107与学习数据库201和测试数据库202中的至少一方既可以相同,也可以不同。另外,学习数据库201与测试数据库202既可以相同,也可以不同。在此,存储部107是数据库的一例。
神经网络211是具有多个神经元层的多层构造的神经网络即多层神经网络。多个神经元层中的每一个包含至少一个神经元。神经网络211包含数据运算器(未图示),当向神经网络211输入数据时,例如,运算器使用所输入的数据、包含多个由加权系数和偏置构成的组的神经网络的参数,输出该数据的正常得分。正常得分表示将输入到神经网络211的数据的像正常数据的程度进行了数值化而得到的值。正常得分是表示输入到神经网络211的数据是否为正常或正确的数据的指标。正常得分例如以0~1的范围内的值表示,其值越接近“1”,则意味着所输入的数据是正常或正确的数据的可能性越高。
输入数据取得部101从学习数据库201取得作为正常数据的第一输入数据,并将其向正常噪声附加数据生成部102、异常噪声附加数据生成部103以及网络参数算出部105输出。
正常噪声附加数据生成部102取得第一输入数据和第一输入数据的种类。正常噪声附加数据生成部102可以取得与第一输入数据关联了的数据的种类,也可以基于用户的输入取得数据的种类。在异常检测系统1000具有接口部的情况下,正常噪声附加数据生成部102可以经由接口部取得用户的输入,也可以经由异常检测系统1000外部的接口部,通过有线通信或无线通信取得用户的输入。
在使用预先决定的一种第一输入数据的情况下,正常噪声附加数据生成部102可以不取得第一输入数据的种类。此时,记录于学习数据库201的第一输入数据、后述的第一方法和第二方法仅包含与预先决定的一种第一输入数据对应的信息即可。异常检测装置100的存储部107或异常检测系统1000具备的未图示的存储器记录与数据的种类对应的至少一个第一方法,正常噪声附加数据生成部102从该存储器取得与第一输入数据的种类对应的第一方法。
正常噪声附加数据生成部102通过用根据第一输入数据的种类预先设定的第一方法对第一输入数据施加正常噪声,从而生成正常噪声附加数据,并向网络参数算出部105输出正常噪声附加数据。在此,说明正常噪声。第一输入数据具有多个参数。多个参数包含至少一个第一参数和至少一个第二参数。第一参数是给后述的正常得分带来预定以上的影响的参数,第二参数是给正常得分带来小于预定的影响的参数。正常噪声是指施加到第一输入数据具有的多个参数所包含的至少一个第二参数的噪声。
异常噪声附加数据生成部103取得第一输入数据和第一输入数据的种类。异常噪声附加数据生成部103可以取得与第一输入数据关联了的数据的种类,也可以基于用户的输入取得数据的种类。在异常检测系统1000具有接口部的情况下,异常噪声附加数据生成部103可以经由接口部取得用户的输入,也可以经由异常检测系统1000外部的接口部,通过有线通信或无线通信取得用户的输入。
异常噪声附加数据生成部103通过用根据第一输入数据的种类预先设定的第二方法对从输入数据取得部101取得的第一输入数据施加异常噪声,从而生成异常噪声附加数据,并向网络参数算出部105输出异常噪声附加数据。在此,说明异常噪声。如上所述,第一输入数据具有的多个参数包含至少一个第一参数和至少一个第二参数。异常噪声是指施加到第一输入数据具有的多个参数所包含的至少一个第一参数的噪声。
异常检测装置100可以包含输入输出器108(未图示)。异常检测装置100可以经由输入输出器108向神经网络211输出数据和命令。异常检测装置100可以经由输入输出器108从神经网络211接收对上述命令的回复。即,网络参数算出部105、异常检测部106中的每一个可以经由输入输出器108向神经网络211输出数据和命令。网络参数算出部105、异常检测部106中的每一个可以经由输入输出器108从神经网络211接收对上述命令的回复。
网络参数算出部105向神经网络211输出从输入数据取得部101取得的第一输入数据、从正常噪声附加数据生成部102取得的正常噪声附加数据以及从异常噪声附加数据生成部103取得的异常噪声附加数据。神经网络211算出与第一输入数据、正常噪声附加数据以及异常噪声附加数据分别对应的第一正常得分、第二正常得分以及第三正常得分来作为输出结果。在此,正常噪声附加数据是第二数据的一例,异常噪声附加数据是第三数据的一例。神经网络211将第一正常得分、第二正常得分以及第三正常得分作为输出结果向网络参数算出部105输出。
网络参数算出部105使用从神经网络211取得的第一正常得分、第二正常得分以及第三正常得分,算出神经网络的参数,并向异常检测部106输出算出的参数。具体而言,网络参数算出部105算出基于第一正常得分与第二正常得分的差异的第一差、基于第一正常得分与第三正常得分的差异的第二差。进而,网络参数算出部105从乘有系数的第一差减去乘有系数的第二差而算出第三差,也就是说,算出基于第一差与第二差的差异的第三差。
网络参数算出部105通过变更神经网络的参数以使得第三差为最小,从而算出第三差为最小的神经网络的参数。也就是说,能够定义使用了第三差的目标函数来作为用于神经网络211的学习的目标函数。这样的目标函数使用正常数据、附加有正常噪声的正常数据以及附加有异常噪声的正常数据。因此,目标函数能够提高在神经网络211中受到噪声的影响的情况下的正常数据的分布的近似精度。因此,目标函数的函数值的计算精度提高。进而,目标函数的函数值的计算也容易。此外,神经网络的参数的例子为神经网络211所包含的神经元间的加权系数、偏置等。另外,若用数学式表达从第一正常得分、第二正常得分以及第三正常得分算出第三差的过程,如下述的式1。
在此,系数α是决定在神经网络的参数算出时重视第一差和第二差中的哪一个的参数。值域为(0,1)。也就是说,系数α取0~1的值,越接近0,意味着越重视第一差,越接近1,意味着越重视第二差。具体而言,例如,可以使用0.5作为系数α的值。另外,在第一差和第二差的算出中,可以使用正常得分之差的绝对值来取代正常得分之差的平方。在使第三差为最小的神经网络的参数的算出中,例如能够利用专利文献1记载的反向传播法(也称为“误差逆传播法”)等与神经网络的学习相关的公知的方法。反向传播法是为了在机器学习中为了使神经网络学习而使用的算法之一。使用反向传播法的神经网络的更新式例如能够使用下述的式2。
W_t+1=W_t-γ×dD(W_t)/dW_t (式2)
W_t表示神经网络的参数的更新前的值,W_t+1表示更新后的值。D(W)表示神经网络的参数为W时的第三差。γ表示学习系数。
上述更新式可以使用第一输入数据的全部而算出。或者,也可以取出第一输入数据的一部分数据,对该一部分数据算出更新式并更新参数,进而在变更依次取出的数据的同时反复进行更新。或者,也可以基于更新前后的第三差的变动量,决定是否采用更新。例如,可以在第三差减少的情况下必定采用更新,在第三差增加的情况下以用下述式3示出的概率采用更新。此外,在第三差不变化的情况下,可以不更新。
(更新概率)=min(1,eD) (式3)
e表示自然对数,D表示第三差的减少量。第三差的减少量D在第三差减少的情况下取正的值。这样的更新概率是1和eD中的较小的值。更新概率为“1”表示更新概率为“100%”。例如,在第三差减少的情况下,D>0,更新概率=min(1,eD>1)=1,在第三差增加的情况下,D<0,更新概率=min(1,eD<1)=eD。异常检测部106指示神经网络211采用从网络参数算出部105输出的更新后的神经网络的参数。神经网络211在神经网络211中设定更新后的神经网络的参数。异常检测部106可以向神经网络211输出更新后的神经网络的参数。
异常检测部106从存储有正常还是异常为未知的数据的测试数据库202取得第二输入数据。异常检测部106向设定了从网络参数算出部105取得的神经网络的参数即更新后的神经网络的参数的神经网络211输出第二输入数据。神经网络211使用更新后的神经网络的参数,算出对于第二输入数据的第四正常得分。神经网络211向异常检测部106输出第四正常得分。异常检测部106在第四正常得分不超过第一阈值的情况下判定为该第二输入数据是异常数据。在此,第一阈值是预先设定的阈值。也可以是,在学习数据库201中存储有n个(n≥2,n为自然数)正常数据,将n个正常数据输入到设定了更新后的神经网络的参数的神经网络211,并得到从设定了更新后的神经网络的参数的神经网络211输出的n个正常得分的情况下,使用判定为0.9×n个正常得分为正常的值作为第一阈值。或者,也可以算出正常数据的正常得分的标准差σ,并使用从正常得分的平均值减去3σ得到的值来作为第一阈值。
接着,参照图2,说明异常检测装置100的工作。图2是示出实施方式涉及的异常检测装置100的处理的整体流程的一例的流程图。
在步骤S101中,输入数据取得部101从学习DB201取得作为正常数据的第一输入数据。进而,输入数据取得部101向正常噪声附加数据生成部102、异常噪声附加数据生成部103以及网络参数算出部105输出第一输入数据。
接着,在步骤S102中,正常噪声附加数据生成部102通过用根据第一输入数据的种类预先设定的正常噪声附加方法(也称为“第一方法”)对第一输入数据附加噪声,从而生成正常噪声附加数据。正常噪声附加数据生成部102将生成的正常噪声附加数据向网络参数算出部105输出。
接着,在步骤S103中,异常噪声附加数据生成部103通过用根据第一输入数据的种类预先设定的异常噪声附加方法(也称为“第二方法”)对第一输入数据附加噪声,从而生成异常噪声附加数据。异常噪声附加数据生成部103将生成的异常噪声附加数据向网络参数算出部105输出。
接着,在步骤S106中,网络参数算出部105向相同的神经网络(也称为“NN”)211发送第一输入数据、正常噪声附加数据以及异常噪声附加数据。神经网络211算出第一正常得分、第二正常得分以及第三正常得分。神经网络211将算出的第一正常得分、第二正常得分以及第三正常得分向网络参数算出部105输出。在本例中,神经网络设为多层神经网络,当输入第一输入数据时输出第一正常得分,当输入正常噪声附加数据时输出第二正常得分,当输入异常噪声附加数据时输出第三正常得分。
在步骤S105中,网络参数算出部105算出基于第一正常得分与第二正常得分的差异的第一差,并算出基于第一正常得分与第三正常得分的差异的第二差。进而,网络参数算出部105算出基于第一差与第二差的差异的第三差。
在步骤S106中,网络参数算出部105通过变更神经网络的参数,从而算出使第三差为最小的神经网络的参数。该算出的神经网络的参数是更新后的神经网络的参数。网络参数算出部105将更新后的神经网络的参数向异常检测部106输出。
接着,在步骤S107中,异常检测部106从测试DB202取得正常还是异常为未知的第二输入数据。第二输入数据是与第一输入数据相同种类的数据。例如,关于图像数据、时序数据以及多维数据等数据的种类,第二输入数据可以是与第一输入数据相同的种类的数据。另外,第二输入数据和第一输入数据的对象可以是相同的种类。在该情况下,例如,在第一输入数据是从汽车向前方能看见的景象的图像的情况下,第二输入数据也是从汽车向前方能看见的景象的图像。
接着,在步骤S108中,异常检测部106指示神经网络211采用在步骤S106中算出的更新后的神经网络的参数。神经网络211在神经网络211中设定更新后的神经网络的参数。异常检测部106可以向神经网络211输出更新后的神经网络的参数。进而,异常检测部106向采用了更新后的神经网络的参数的更新后的神经网络211输出第二输入数据。更新后的神经网络211使用更新后的神经网络的参数,算出对于第二输入数据的第四正常得分。更新后的神经网络211向异常检测部106输出第四正常得分。
接着,在步骤S109中,异常检测部106对第四正常得分和预先设定的第一阈值进行比较。在第四正常得分超过第一阈值的情况下(在步骤S109中为否),异常检测部106判定为第二输入数据是正常数据(步骤S111)。在第四正常得分为第一阈值以下的情况下(在步骤S109中为是),异常检测部106判定为第二输入数据是异常数据(步骤S110)。
如上所述,异常检测装置100使用正常数据、对正常数据附加了正常噪声或异常噪声得到的正常噪声附加数据和异常噪声附加数据,使神经网络211进行学习,使用学习后的神经网络211,进行正常还是异常为不清楚的数据的异常判定。此外,以使第三差成为最小的方式进行神经网络211的学习,所述第三差与正常数据、正常噪声附加数据以及异常噪声附加数据的正常得分的差异关联。
进而,参照图3,对于第一输入数据为图像数据的情况,说明作为图2的步骤S102的处理的、正常噪声附加数据的算出方法。图3是示出在图2的步骤S102中第一输入数据的种类为图像的情况下的处理的详细情况的一例的流程图。
首先,在步骤S201中,正常噪声附加数据生成部102检测作为图像数据的第一输入数据的边缘。也就是说,正常噪声附加数据生成部102检测与第一输入数据的边缘对应的像素的位置。边缘的检测可利用包含Canny法、微分边缘检测法在内的公知方法。接着,在步骤S202中,正常噪声附加数据生成部102扩张在步骤S201中检测出的边缘。扩张方法例如可以是如下方法:将从步骤S201中检测出的边缘起预先确定的距离以内包含的像素定义为扩张后的边缘。预先确定的距离例如能够设为10像素,但不限定于此。通过按这种方式扩张边缘,从而形成在原本的边缘的周围扩宽而成的边缘区域。
接着,在步骤S203中,正常噪声附加数据生成部102对第一输入数据中的、不包含于在步骤S202中扩张而成的边缘区域的区域施加噪声,并算出正常噪声附加数据。在此,例如,在第一输入数据的像素值为0~255的情况下,可以生成平均值为0且方差为10的高斯噪声,生成的高斯噪声作为噪声与像素值相加。高斯噪声是正态分布的噪声。或者,也可以使用随机地例如以10%的概率将像素值置换为0或255的椒盐噪声作为噪声。在此,不包含于边缘区域的区域是正常噪声区域的一例。
在此,参照图4,说明对图像数据附加正常噪声的具体例。图4是示出与图3和图5的处理对应的图像数据的例子的示意图。图4所示的图像200是第一输入数据的一例。图4所示的图像201与步骤S201的处理对应,图像202与步骤S202的处理对应,图像203是步骤S203的处理后的图像数据。
图像201的无色线段与在步骤S201中检测出的边缘对应。相对于图像201的无色线段,图像202的无色线段变粗,图像202与通过步骤S202扩张了边缘而成的图像数据对应。可知,图像203的与图像202的边缘部分对应的边缘区域以外的部分相对于图像200发生变化。图像203与对图像202的边缘区域以外的部分附加正常噪声得到的图像数据对应。
如上所述,异常检测装置100通过进行步骤S201至步骤S203的处理,从而在图2的步骤S102中算出正常噪声附加数据。
接着,参照图5,对于第一输入数据为图像数据的情况,说明作为图2的步骤S103的处理的、异常噪声附加数据的算出方法。图5是示出在图2的步骤S103中第一输入数据的种类为图像的情况下的处理的详细情况的一例的流程图。
首先,异常噪声附加数据生成部103与正常噪声附加数据生成部102同样地,进行步骤S201和步骤S202的处理。接着,在步骤S303中,异常噪声附加数据生成部103对第一输入数据中的、在步骤S202中扩张而成的边缘区域所包含的区域施加噪声,并算出异常噪声附加数据。参照图4,作为图像204,示出了对图像202的边缘区域附加有异常噪声的图像数据的例子。在此,边缘区域是异常噪声区域的一例。
如上所述,异常检测装置100通过进行步骤S201、S202以及S303的处理,从而在图2的步骤S103中算出异常噪声附加数据。
接着,参照图6,对于第一输入数据为时序数据的情况,说明作为图2的步骤S102的处理的、正常噪声附加数据的算出方法。图6是示出在图2的步骤S102中第一输入数据的种类为时序数据的情况下的处理的详细情况的一例的流程图。时序数据是指,包含在多个时刻测定且将多个时刻的每一个与测定值等数据值关联而成的数据。
首先,在步骤S401中,正常噪声附加数据生成部102算出在作为时序数据的第一输入数据中包含于作为对象的时间区间中的数据的平均值。作为对象的时间区间既可以是第一输入数据的时间区间的整个区间,也可以是一部分区间。
接着,在步骤S402中,正常噪声附加数据生成部102算出第一输入数据中的、超过在步骤S401中算出的平均值的数据的数量。具体而言,正常噪声附加数据生成部102从接近平均值的数据起按顺序对超过平均值的数据的数量进行计数。进而,正常噪声附加数据生成部102将计数到相对于超过平均值的数据的总数的比例超过预先设定的第一比例的数量时的数据的值设定为上阈值。第一比例例如能够设为80%,但不限定于此。另外,正常噪声附加数据生成部102也同样地算出第一输入数据中的、小于在步骤S401中算出的平均值的数据的数量,进而,基于算出的数据的数量设定下阈值。在该情况下,正常噪声附加数据生成部102将计数到超过相对于小于平均值的数据的总数的预先设定的第二比例的数量时的数据的值设定为下阈值。第二比例也与第一比例同样地,例如能够设为80%,但不限定于此。此外,在上述说明中,正常噪声附加数据生成部102不对作为平均值的数据进行计数,但不限定于此。正常噪声附加数据生成部102可以将作为平均值的数据的计数加入到超过平均值的数据的计数和小于平均值的数据的计数中的任一个中,也可以按预定比例分配给它们中的任一个。例如,预定比例可以设为50%:50%。
接着,在步骤S403中,正常噪声附加数据生成部102对第一输入数据中的、包含于在步骤S402中算出的上阈值与下阈值之间的数据施加噪声,并算出正常噪声附加数据。在此,例如,在将正常噪声附加数据设为y,将原来的第一输入数据的值设为x,将平均值为0且方差为1的高斯随机数设为a的情况下,正常噪声附加数据y能够使用下述的式4或式5算出。
y=x×(100+a)/100 (式4)
y=x+a (式5)
在此,参照图7,说明对时序数据附加正常噪声的具体例。图7是示出与图6和图9的处理对应的时序数据的例子的示意图。在图7中,图300是第一输入数据的一例,图301是示出在第一输入数据中相同值的数据的计数的分布的直方图。在图300中,第一输入数据的时间区间是横轴的0~1000。正常噪声附加数据生成部102算出在图300中包含于0~1000的时间区间的数据的平均值Av。而且,正常噪声附加数据生成部102对包含于0~1000的时间区间的数据进行计数,将计数到超过相对于超过平均值的数据的总数的第一比例的数量时的数据的值设定为上阈值。另外,正常噪声附加数据生成部102将计数到超过相对于小于平均值的数据的总数的第二比例的数量时的数据的值设定为下阈值。并且,正常噪声附加数据生成部102对包含于上阈值与下阈值之间的数据施加噪声并算出正常噪声附加数据。在图7中上阈值与下阈值之间的区域为正常噪声区域。
另外,正常噪声附加数据生成部102既可以直接使用图7的图所示的时序数据算出正常噪声附加数据,也可以使用由对上述时序数据的数据值进行微分得到的微分值构成的数据算出正常噪声附加数据。此外,图7的图所示的时序数据例如是通过计测或检测等得到的数据。正常噪声附加数据生成部102可以算出并使用第一输入数据的微分值来取代第一输入数据。
例如,在图8中,示意地示出使用第一输入数据的微分值来取代第一输入数据的情况下的处理的例子。在图8中,图400是由图300的数据的微分值构成的数据的一例,图401是示出在图400中相同微分值的计数的分布的直方图。正常噪声附加数据生成部102对图8所示的由微分值构成的数据也算出平均值、上阈值以及下阈值,对包含于上阈值与下阈值之间的数据施加基于上述式4或式5的噪声,并算出正常噪声附加数据。此外,在式4和式5中,向“x”应用数据的微分值。在图8中上阈值与下阈值之间的区域为正常噪声区域。
此外,在使用第一输入数据的微分值取代第一输入数据的情况下,在图2的步骤S106中,向神经网络211输入第一输入数据的微分值、第一输入数据的微分值的正常噪声附加数据以及第一输入数据的微分值的异常噪声附加数据,并输出第一正常得分、第二正常得分以及第三正常得分。神经网络211构成为:当被输入了输入数据的微分值时,输出该微分值的正常得分。而且,使用输出的第一正常得分、第二正常得分以及第三正常得分,算出使第三差为最小的神经网络的参数。并且,在步骤S107~S111中,向神经网络211输入第二输入数据的微分值,基于其结果输出的第四正常得分,判定第二输入数据是正常还是异常。
如上所述,异常检测装置100通过进行步骤S401至步骤S403的处理,从而在图2的步骤S102中算出正常噪声附加数据。
接着,参照图9,对于第一输入数据为时序数据的情况,说明作为图2的步骤S103的处理的、异常噪声附加数据的算出方法。图9是示出在图2的步骤S103中第一输入数据的种类为时序数据的情况下的处理的详细情况的一例的流程图。
首先,异常噪声附加数据生成部103与正常噪声附加数据生成部102同样地,进行步骤S401和步骤S402的处理。接着,在步骤S503中,异常噪声附加数据生成部103对第一输入数据中的、不包含于在步骤S402中算出的上阈值与下阈值之间的数据施加噪声,并算出异常噪声附加数据。例如,参照图7,不包含于上阈值与下阈值之间的区域为两个异常噪声区域。在此,例如,在将异常噪声附加数据设为y,将原来的第一输入数据的值设为x,将平均值为0且方差为1的高斯随机数设为a的情况下,异常噪声附加数据y能够使用下述的式6或式7算出。
y=x×(100+a)/100 (式6)
y=x+a (式7)
如上所述,异常检测装置100通过进行步骤S401、S402以及S503的处理,从而在图2的步骤S103中算出异常噪声附加数据。此外,在算出异常噪声附加数据的情况下,异常噪声附加数据生成部103也算出并使用第一输入数据的微分值来取代第一输入数据。
接着,参照图10,对于第一输入数据为多维数据的情况,说明作为图2的步骤S102的处理的、正常噪声附加数据的算出方法。图10是示出在图2的步骤S102中第一输入数据的种类为多维数据的情况下的处理的详细情况的一例的流程图。
首先,在步骤S601中,正常噪声附加数据生成部102对作为多维数据的第一输入数据进行主成分分析,求出特征向量(eigen vector)和特征值(eigen value)。在主成分分析中,求出与多维数据的变量的数量相同的数量的主成分。例如,第一主成分是基于变量的所有线性合成中的、具有最大方差的线性合成。第二主成分是在与第一主成分不相关这一条件下线性合成中的具有最大方差的线性合成。第三主成分以下也同样地,是在与其之前的主成分不相关这一条件下线性合成中的具有最大方差的线性合成。即,作为变量的线性合成,得到按方差从大到小的顺序转换而成的正交成分来作为主成分。特征值是主成分的方差。特征向量是使用多维数据的变量示出主成分的情况下的、将与各变量相乘的权重系数设为要素的向量。
接着,在步骤S602中,正常噪声附加数据生成部102在以步骤S601中算出的特征向量为轴且以特征值为对应的轴的方差的高斯分布上,算出第一输入数据的微分方向。具体而言,算出第一输入数据的坐标中的高斯分布的值减少的方向。第一输入数据的坐标是将第一输入数据的变量作为要素的多维坐标系中的坐标。
接着,在步骤S603中,正常噪声附加数据生成部102对第一输入数据施加与步骤S602中算出的微分方向垂直的方向上的噪声,并算出正常噪声附加数据。上述与微分方向垂直的方向是正常噪声方向的一例。在此,例如,在将正常噪声附加数据设为y,将在步骤S602中算出的微分方向设为df/dx,将原来的第一输入数据的值设为x,将平均值为0且方差为1的高斯随机数设为a的情况下,正常噪声附加数据y能够使用下述的式8算出。其中,在式8中,“·”表示内积。在第一输入数据为M维数据的情况下,“y”、“x”以及“a”是M维向量。“f”表示在步骤S602中提及的高斯分布,用定义了第一输入数据的向量x的M维坐标系的空间来定义。“f”是M维→一维(标量(scalar))的映射函数。“d”是微分运算符。
y=x+a-((df(x)/dx)·a)df(x)/dx
=x+a-(df/dx·a)df/dx (式8)
在式8中,“a”表示噪声,“(df/dx·a)df/dx”表示与df/dx即微分方向平行的噪声的成分,“a-(df/dx·a)df/dx”表示与微分方向垂直的噪声的成分。
在此,参照图11,说明对多维数据附加正常噪声的具体例。图11是示出与图10的处理对应的多维数据的例子的示意图。在图11中,图500示出对第一输入数据进行主成分分析而得到的第一主成分与第二主成分的关系的一例。进而,在图500中,示出高斯分布的等值线G。该高斯分布的等值线G是以第一主成分和第二主成分的主成分特征向量为轴且以特征值为对应的轴的方差的高斯分布的等值线。算出数据点并在算出的各个数据点上算出微分方向,所述数据点是与包含于第一输入数据的多个数据值分别对应的等值线G上的点。例如,在图11中,用箭头示出与包含于第一输入数据的一个数据值对应的等值线G上的数据点P的微分方向。
在数据点的微分方向,即在该数据点的第一主成分和第二主成分的微分方向是从等值线G向外的方向,并作为异常噪声的方向处理。从等值线G向外的方向是正常得分减少的方向。与微分方向垂直的方向是沿着等值线G的方向即切线方向,并作为正常噪声的方向处理。沿着等值线G的方向也是正常得分不增减的方向。此外,从等值线G向内的方向是正常得分增加的方向。而且,也如式8所示,在等值线G上的各个数据点处,使用在各数据点算出的微分方向,算出相对于该数据点的数据值的正常噪声附加数据。
如上所述,异常检测装置100通过进行步骤S601至步骤S603的处理,从而在图2的步骤S102中算出正常噪声附加数据。
接着,参照图12,对于第一输入数据为多维数据的情况,说明作为图2的步骤S103的处理的、异常噪声附加数据的算出方法。图12是示出在图2的步骤S103中第一输入数据的种类为多维数据的情况下的处理的详细情况的流程图。
首先,异常噪声附加数据生成部103与正常噪声附加数据生成部102同样地,进行步骤S601和步骤S602的处理。接着,在步骤S703中,异常噪声附加数据生成部103对第一输入数据施加在步骤S602中算出的微分方向的噪声,并算出异常噪声附加数据。上述微分方向是异常噪声方向的一例,异常噪声方向与正常噪声方向正交。例如,参照图11,从高斯分布的等值线G上的点P向外的微分方向是异常噪声的方向。在此,例如,在将异常噪声附加数据设为y,将在步骤S602中算出的微分方向设为df/dx,将原来的第一输入数据的值设为x,将平均值为0且方差为1的高斯随机数设为a的情况下,异常噪声附加数据y能够使用下述的式9算出。其中,式9的“·”表示内积。
y=x+|(df(x)/dx)·a|df(x)/dx
=x+|df/dx·a|df/dx (式9)
在式9中,“|df/dx·a|df/dx”表示与df/dx即与微分方向平行且f减少的方向上的噪声的成分。
如上所述,异常检测装置100通过进行步骤S601、S602以及S703的处理,从而在图2的步骤S103中算出异常噪声附加数据。
如上所述,利用异常检测装置100,通过使用正常噪声和异常噪声来作为施加到第一输入数据的噪声,从而能够提高正常数据的分布的近似精度,并更准确地进行学习时的目标函数的函数值的计算。其结果,能够改善正常模型的学习,并使异常检测的性能提高。
以上,基于实施方式说明本公开涉及的异常检测装置等,但本公开不限定于这些实施方式。只要不脱离本发明的宗旨,对本实施方式实施了本领域的技术人员想到的各种变形而成的方式和将不同的实施方式的构成要素组合而构建的方式等也包括在本发明的范围内。
具体而言,上述异常检测装置等可以构成为计算机系统,所述计算机系统由微处理器、ROM、RAM、硬盘驱动器、显示器单元、键盘、鼠标等构成。在RAM或硬盘驱动器中存储有计算机程序。通过微处理器按照计算机程序工作,异常检测装置等实现其功能。在此,计算机程序是为了达成预定功能而组合多条命令代码而构成的,所述命令代码示出对计算机的指令。
并且,构成上述异常检测装置等的构成要素的一部分或全部可以由一个系统LSI(Large Scale Integration:大规模集成电路)构成。系统LSI是将多个构成部集成在一个芯片上制造而成的超多功能LSI,具体而言,是包含微处理器、ROM以及RAM等而构成的计算机系统。在RAM中存储有计算机程序。通过微处理器按照计算机程序工作,系统LSI实现其功能。
并且,另外,构成上述异常检测装置等的构成要素的一部分或全部可以由相对于装置等可拆装的IC(Integrated Circuit)卡或单体的模块构成。IC卡和模块是由微处理器、ROM以及RAM等构成的计算机系统。IC卡和模块也可以包括上述的超多功能LSI。通过微处理器按照计算机程序工作,IC卡和模块实现该功能。该IC卡和模块也可以具有防篡改性。
另外,本公开的技术也可以是上述示出的方法。另外,既可以是利用计算机实现这些方法的计算机程序,也可以是由上述计算机程序构成的数字信号。
并且,本公开的技术也可以将上述计算机程序或上述数字信号记录于计算机可读的非易失性记录介质,例如软盘、硬盘、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(注册商标)Disc)以及半导体存储器等。另外,也可以是记录在这些非易失性记录介质中的上述数字信号。
另外,本公开的技术可以经由电通信线路、无线或有线通信线路、以互联网为代表的网络或数据广播等输送上述计算机程序或上述数字信号。
另外,本公开的技术可以是具备微处理器和存储器的计算机系统,上述存储器存储有上述计算机程序,上述微处理器按照上述计算机程序工作。
另外,也可以将上述程序或上述数字信号记录于上述非易失性记录介质并移送,或经由上述网络等移送上述程序或上述数字信号,由此利用其他独立的计算机系统实施。
由于本公开能够进行高精度的异常检测,所以在进行故障检测、看守系统等异常检测的技术中是有用的。
标号说明
100 异常检测装置
101 输入数据取得部
102 正常噪声附加数据生成部
103 异常噪声附加数据生成部
105 网络参数算出部
106 异常检测部
107 存储部(数据库)
201 学习数据库(数据库)
202 测试数据库
1000 异常检测系统
Claims (12)
1.一种异常判定方法,是异常检测方法,包括:
(a1)取得作为正常数据的第一数据,在此,所述正常数据是通过神经网络判定为正常的数据,
(a2)用根据所述第一数据的种类预先设定的方法对所述第一数据附加正常噪声,生成第二数据,在此,所述第二数据是通过所述神经网络判定为正常的数据,
(a3)用根据所述第一数据的种类预先设定的方法对所述第一数据附加异常噪声,生成第三数据,在此,所述第三数据是通过所述神经网络判定为异常的数据,
(a4)向所述神经网络输入所述第一数据、所述第二数据以及所述第三数据中的每一个,算出第一正常得分、第二正常得分以及第三正常得分,在此,所述第一正常得分、所述第二正常得分以及所述第三正常得分表示将输入到所述神经网络的数据的像正常数据的程度进行了数值化而得到的值,
(a5)算出基于所述第一正常得分与所述第二正常得分的差异的第一差,算出基于所述第一正常得分与所述第三正常得分的差异的第二差,算出基于所述第一差与所述第二差的差异的第三差,
(a6)算出使所述第三差为最小的所述神经网络的参数,
(a7)使用算出的所述参数变更所述神经网络,
(a8)从存储有正常还是异常为未知的数据的测试数据库取得第四数据,将所述第四数据输入到变更了的所述神经网络,算出第四正常得分,基于所述第四正常得分判定所述第四数据为正常还是异常,
所述(a1)~所述(a8)中的至少一个由处理器执行。
2.根据权利要求1所述的异常判定方法,
在所述第一数据为图像的情况下,
在所述(a1)与所述(a2)之间,
(b1)检测包含于所述图像的边缘的像素位置,
(b2)将距所述边缘的像素位置为第一距离以下的像素位置的区域设定为异常噪声区域,且将所述图像中不包含于所述异常噪声区域的区域设定为正常噪声区域,
所述(a2)中的所述预先设定的方法中,对所述正常噪声区域附加噪声,制作所述第二数据,
所述(a3)中的所述预先设定的方法中,对所述异常噪声区域附加噪声,制作所述第三数据。
3.根据权利要求1所述的异常判定方法,
在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,
在所述(a1)中,
(c1)算出所述第一数据值的平均值,
(c2)对于所述第一数据值中超过所述平均值的超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数相对于所述超过数据值的总数据数的比例超过预先设定的比例时的数据值设定为上阈值,对于所述第一数据值中小于所述平均值的非超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的数据值设定为下阈值,
(c3)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,
(c4)将不包含于所述正常噪声区域的区域设定为异常噪声区域,
在所述(a2)中,在包含于所述多个数据值的数据值i包含于正常噪声区域的情况下,对所述数据值i附加所述正常噪声,
在所述(a3)中,在包含于所述多个数据值的数据值j包含于异常噪声区域的情况下,对所述数据值j附加所述异常噪声。
4.根据权利要求1所述的异常判定方法,
在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,
在所述(a1)中,
(d1)算出与所述多个数据值对应的多个微分数据值,
(d2)算出所述多个微分数据值的平均值,
(d3)对于所述多个微分数据值中超过所述平均值的超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为上阈值,对于所述多个微分数据值中作为小于所述平均值的微分数据值的非超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为下阈值,
(d4)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,
(d5)将不包含于所述正常噪声区域的区域设定为异常噪声区域,
在所述(a2)~所述(a4)中,使用所述微分数据值取代所述第一数据的数据值,
在所述(a2)中,在包含于所述多个微分数据值的微分数据值i包含于正常噪声区域的情况下,对所述微分数据值i附加所述正常噪声,
在所述(a3)中,在包含于所述多个微分数据值的微分数据值j包含于异常噪声区域的情况下,对所述微分数据值j附加所述异常噪声,
在所述(a8)中,使用包含于所述第四数据的数据值的微分值来取代包含于所述第四数据的数据值。
5.根据权利要求1所述的异常判定方法,
在所述第一数据为多维数据的情况下,
在所述(a1)中,
(e1)进行所述第一数据的主成分分析,算出主成分的特征值和特征向量,
(e2)基于所述特征值和所述特征向量,算出所述第一数据的微分方向,
(e3)将所述微分方向设定为异常噪声方向,
(e4)将与所述异常噪声方向垂直的方向设定为正常噪声方向,
在所述(a2)中,作为所述预先设定的方法,将所述正常噪声方向的噪声附加于所述第一数据,制作所述第二数据,
在所述(a3)中,作为所述预先设定的方法,将所述异常噪声方向的噪声附加于所述第一数据,制作所述第三数据。
6.根据权利要求1~5中任一项所述的异常判定方法,
在所述(a7)中,
算出所述神经网络的变更前后的所述第三差的变动量,
在所述第三差减少的情况下,变更所述神经网络,
在所述第三差增加的情况下,以基于所述第三差的变动量的概率变更所述神经网络。
7.一种程序,使计算机执行:
(a1)取得作为正常数据的第一数据,在此,所述正常数据是通过神经网络判定为正常的数据,
(a2)用根据所述第一数据的种类预先设定的方法对所述第一数据附加正常噪声,生成第二数据,在此,所述第二数据是通过所述神经网络判定为正常的数据,
(a3)用根据所述第一数据的种类预先设定的方法对所述第一数据附加异常噪声,生成第三数据,在此,所述第三数据是通过所述神经网络判定为异常的数据,
(a4)向所述神经网络输入所述第一数据、所述第二数据以及所述第三数据中的每一个,算出第一正常得分、第二正常得分以及第三正常得分,在此,所述第一正常得分、所述第二正常得分以及所述第三正常得分表示将输入到所述神经网络的数据的像正常数据的程度进行了数值化而得到的值,
(a5)算出基于所述第一正常得分与所述第二正常得分的差异的第一差,算出基于所述第一正常得分与所述第三正常得分的差异的第二差,算出基于所述第一差与所述第二差的差异的第三差,
(a6)算出使所述第三差为最小的所述神经网络的参数,
(a7)使用算出的所述参数变更所述神经网络,
(a8)从存储有正常还是异常为未知的数据的测试数据库取得第四数据,将所述第四数据输入到变更了的所述神经网络,算出第四正常得分,基于所述第四正常得分判定所述第四数据为正常还是异常。
8.根据权利要求7所述的程序,
在所述第一数据为图像的情况下,
在所述(a1)与所述(a2)之间,
(b1)检测包含于所述图像的边缘的像素位置,
(b2)将距所述边缘的像素位置为第一距离以下的像素位置的区域设定为异常噪声区域,且将所述图像中不包含于所述异常噪声区域的区域设定为正常噪声区域,
所述(a2)中的所述预先设定的方法中,对所述正常噪声区域附加噪声,制作所述第二数据,
所述(a3)中的所述预先设定的方法中,对所述异常噪声区域附加噪声,制作所述第三数据。
9.根据权利要求7所述的程序,
在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,
在所述(a1)中,
(c1)算出所述第一数据值的平均值,
(c2)对于所述第一数据值中超过所述平均值的超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数相对于所述超过数据值的总数据数的比例超过预先设定的比例时的数据值设定为上阈值,对于所述第一数据值中小于所述平均值的非超过数据值,从接近所述平均值的数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的数据值设定为下阈值,
(c3)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,
(c4)将不包含于所述正常噪声区域的区域设定为异常噪声区域,
在所述(a2)中,在包含于所述多个数据值的数据值i包含于正常噪声区域的情况下,对所述数据值i附加所述正常噪声,
在所述(a3)中,在包含于所述多个数据值的数据值j包含于异常噪声区域的情况下,对所述数据值j附加所述异常噪声。
10.根据权利要求7所述的程序,
在所述第一数据为具有与多个时间对应的多个数据值的时序数据的情况下,
在所述(a1)中,
(d1)算出与所述多个数据值对应的多个微分数据值,
(d2)算出所述多个微分数据值的平均值,
(d3)对于所述多个微分数据值中超过所述平均值的超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为上阈值,对于所述多个微分数据值中作为小于所述平均值的微分数据值的非超过数据值,从接近所述平均值的微分数据值起按顺序对数据数进行计数,将所述计数相对于所述非超过数据值的总数据数的比例超过预先设定的比例时的微分数据值设定为下阈值,
(d4)将包含于所述上阈值与所述下阈值的范围内的区域设定为正常噪声区域,
(d5)将不包含于所述正常噪声区域的区域设定为异常噪声区域,
在所述(a2)~所述(a4)中,使用所述微分数据值取代所述第一数据的数据值,
在所述(a2)中,在包含于所述多个微分数据值的微分数据值i包含于正常噪声区域的情况下,对所述微分数据值i附加所述正常噪声,
在所述(a3)中,在包含于所述多个微分数据值的微分数据值j包含于异常噪声区域的情况下,对所述微分数据值j附加所述异常噪声,
在所述(a8)中,使用包含于所述第四数据的数据值的微分值来取代包含于所述第四数据的数据值。
11.根据权利要求7所述的程序,
在所述第一数据为多维数据的情况下,
在所述(a1)中,
(e1)进行所述第一数据的主成分分析,算出主成分的特征值和特征向量,
(e2)基于所述特征值和所述特征向量,算出所述第一数据的微分方向,
(e3)将所述微分方向设定为异常噪声方向,
(e4)将与所述异常噪声方向垂直的方向设定为正常噪声方向,
在所述(a2)中,作为所述预先设定的方法,将所述正常噪声方向的噪声附加于所述第一数据,制作所述第二数据,
在所述(a3)中,作为所述预先设定的方法,将所述异常噪声方向的噪声附加于所述第一数据,制作所述第三数据。
12.根据权利要求7~11中任一项所述的程序,
在所述(a7)中,
算出所述神经网络的变更前后的所述第三差的变动量,
在所述第三差减少的情况下,变更所述神经网络,
在所述第三差增加的情况下,以基于所述第三差的变动量的概率变更所述神经网络。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-187056 | 2017-09-27 | ||
JP2017187056A JP2019061577A (ja) | 2017-09-27 | 2017-09-27 | 異常判定方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109558936A true CN109558936A (zh) | 2019-04-02 |
Family
ID=65809389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811023742.0A Pending CN109558936A (zh) | 2017-09-27 | 2018-09-04 | 异常判定方法和程序 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10757125B2 (zh) |
JP (1) | JP2019061577A (zh) |
CN (1) | CN109558936A (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6796092B2 (ja) * | 2018-01-17 | 2020-12-02 | 株式会社東芝 | 情報処理装置、情報処理方法及びプログラム |
US12099571B2 (en) * | 2018-01-18 | 2024-09-24 | Ge Infrastructure Technology Llc | Feature extractions to model large-scale complex control systems |
US10949951B2 (en) * | 2018-08-23 | 2021-03-16 | General Electric Company | Patient-specific deep learning image denoising methods and systems |
EP3629240B1 (en) * | 2018-09-07 | 2023-08-23 | Panasonic Intellectual Property Corporation of America | Generative adversarial networks for local noise removal from an image |
WO2020071086A1 (ja) * | 2018-10-04 | 2020-04-09 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
US11568261B2 (en) * | 2018-10-26 | 2023-01-31 | Royal Bank Of Canada | System and method for max-margin adversarial training |
CN109978079A (zh) * | 2019-04-10 | 2019-07-05 | 东北电力大学 | 一种改进的堆栈降噪自编码器的数据清洗方法 |
WO2020217762A1 (ja) * | 2019-04-25 | 2020-10-29 | ソニー株式会社 | 通信装置、通信方法、及び通信プログラム |
JP6994224B2 (ja) * | 2020-04-15 | 2022-01-14 | 株式会社Ridge-i | 情報処理装置、情報処理方法及び情報処理プログラム |
WO2022060088A1 (en) * | 2020-09-15 | 2022-03-24 | Samsung Electronics Co., Ltd. | A method and an electronic device for detecting and removing artifacts/degradations in media |
US20220335347A1 (en) * | 2021-04-15 | 2022-10-20 | Business Objects Software Ltd | Time-series anomaly prediction and alert |
US12015624B2 (en) * | 2021-11-18 | 2024-06-18 | Motorola Solutions, Inc. | Automated detection of network security anomalies using a denoising diffusion probabilistic model |
CN115761611B (zh) * | 2022-12-18 | 2023-05-30 | 四川数聚智造科技有限公司 | 基于图像对比异常检测的多阶段多底图图像差异过滤方法 |
CN117474999B (zh) * | 2023-12-25 | 2024-04-19 | 惠州市德立电子有限公司 | 一种微型片式电感双线绕线异常定位方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8306931B1 (en) * | 2009-08-06 | 2012-11-06 | Data Fusion & Neural Networks, LLC | Detecting, classifying, and tracking abnormal data in a data stream |
WO2012154657A2 (en) * | 2011-05-06 | 2012-11-15 | The Penn State Research Foundation | Robust anomaly detection and regularized domain adaptation of classifiers with application to internet packet-flows |
KR101621019B1 (ko) * | 2015-01-28 | 2016-05-13 | 한국인터넷진흥원 | 시계열 통계 기반 공격의심 이상징후를 탐지하기 위한 방법 |
WO2016132468A1 (ja) | 2015-02-18 | 2016-08-25 | 株式会社日立製作所 | データ評価方法および装置、故障診断方法および装置 |
US10498752B2 (en) * | 2016-03-28 | 2019-12-03 | Cisco Technology, Inc. | Adaptive capture of packet traces based on user feedback learning |
US10346981B2 (en) * | 2016-11-04 | 2019-07-09 | Eric Kenneth Anderson | System and method for non-invasive tissue characterization and classification |
US10909671B2 (en) * | 2018-10-02 | 2021-02-02 | International Business Machines Corporation | Region of interest weighted anomaly detection |
-
2017
- 2017-09-27 JP JP2017187056A patent/JP2019061577A/ja active Pending
-
2018
- 2018-09-04 CN CN201811023742.0A patent/CN109558936A/zh active Pending
- 2018-09-19 US US16/135,520 patent/US10757125B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019061577A (ja) | 2019-04-18 |
US10757125B2 (en) | 2020-08-25 |
US20190098034A1 (en) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109558936A (zh) | 异常判定方法和程序 | |
JP6243080B1 (ja) | プリプロセッサおよび異常予兆診断システム | |
US20190087737A1 (en) | Anomaly detection and automated analysis in systems based on fully masked weighted directed | |
CN111080360B (zh) | 行为预测方法、模型训练方法、装置、服务器及存储介质 | |
JP2020537787A5 (zh) | ||
JP2015506026A (ja) | 画像分類 | |
CN113673697A (zh) | 基于相邻卷积的模型剪枝方法、装置及存储介质 | |
WO2018188533A1 (zh) | 用于健康评估的健康模型构建方法、终端及存储介质 | |
JP6334431B2 (ja) | データ分析装置、データ分析方法、およびデータ分析プログラム | |
CN109711530B (zh) | 一种滑坡预测方法及系统 | |
CN106446091A (zh) | 一种多源时序数据的预处理方法和装置 | |
US11748527B2 (en) | Automated generation and evaluation of architectural designs | |
US20190087248A1 (en) | Anomaly detection and automated analysis using weighted directed graphs | |
CN112233200A (zh) | 剂量确定方法及装置 | |
CN109426655A (zh) | 数据分析方法、装置、电子设备及计算机可读存储介质 | |
CN104930980A (zh) | 提取设备和方法 | |
US20160283862A1 (en) | Multi-distance similarity analysis with tri-point arbitration | |
CN106874286B (zh) | 一种筛选用户特征的方法及装置 | |
del Amo et al. | SRCS: a technique for comparing multiple algorithms under several factors in Dynamic Optimization Problems | |
EP3850495A1 (en) | Computer-implemented method and electronic device for detecting influential components in a netlist representing an electrical circuit | |
CN112700275B (zh) | 基于大数据的产品生产方法及平台 | |
JP6568488B2 (ja) | 計算機及び分析指標の算出方法 | |
CN110264333B (zh) | 一种风险规则确定方法和装置 | |
WO2022183019A1 (en) | Methods for mitigation of algorithmic bias discrimination, proxy discrimination and disparate impact | |
JP2017207878A (ja) | 欠落データ推定方法、欠落データ推定装置および欠落データ推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190402 |
|
WD01 | Invention patent application deemed withdrawn after publication |