CN111507934A - 训练设备、训练方法和计算机可读记录介质 - Google Patents

训练设备、训练方法和计算机可读记录介质 Download PDF

Info

Publication number
CN111507934A
CN111507934A CN202010071123.XA CN202010071123A CN111507934A CN 111507934 A CN111507934 A CN 111507934A CN 202010071123 A CN202010071123 A CN 202010071123A CN 111507934 A CN111507934 A CN 111507934A
Authority
CN
China
Prior art keywords
discriminator
training
generator
trained
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010071123.XA
Other languages
English (en)
Other versions
CN111507934B (zh
Inventor
河东孝
岩本和树
上村健人
安富优
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN111507934A publication Critical patent/CN111507934A/zh
Application granted granted Critical
Publication of CN111507934B publication Critical patent/CN111507934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及训练设备、训练方法和计算机可读记录介质。一种异常检测设备执行用于生成器和鉴别器的训练,使得生成器使鉴别器的鉴别误差最大化,并且鉴别器使鉴别误差最小化。异常检测设备在训练正被执行时,存储经半训练并且满足预设条件的生成器的状态,并且通过使用由具有所存储的状态的经半训练的生成器生成的图像对鉴别器进行再训练。

Description

训练设备、训练方法和计算机可读记录介质
技术领域
本文讨论的实施方式涉及训练设备、训练方法以及训练程序。
背景技术
近年来,在医学图像分析等领域中,使用图像数据来检测异常,诸如病变。特别地,在医药学等领域中,通常难以获得异常状态的图像数据以用于训练数据;因此,需要仅使用正常状态的图像数据进行机器训练,并且还需要提高检测速度以便于处理大量精确且大规模的数据。
在如上所描述的情况下,作为使用机器训练的异常检测方法,已知生成式对抗网络(generative adversarial networks,GAN),其用于估计正常数据的分布并且检测偏离该分布的数据作为异常数据。图17是用于说明GAN的图。如图17所示,GAN是包括生成器和鉴别器并且用于无监督训练的训练模型,在该训练模型中用于训练生成器的网络和用于训练鉴别器的网络被同时训练。
在GAN中,生成器被训练成根据输入数据例如噪声生成与真实数据相似的伪数据,并且鉴别器被训练成鉴别通过生成器生成的数据是真实数据还是伪数据。作为使用GAN的异常检测,使用如下两种方法:确定经训练的生成器是否具有生成给定样本的能力并且如果经训练的生成器不具有生成给定样本的能力则将所生成的数据视为异常数据的方法;以及将通过经训练的鉴别器确定为伪数据的数据视为异常数据的方法。
非专利文献1:Schlegl,Thomas等人,“Unsupervised anomaly detection withgenerative adversarial networks to guide marker discovery.”,InternationalConference on Information Processing in Medical Imaging,Springer,Cham,2017年。
非专利文献2:M.Sabokrou等人,“Adversarially Learned One-ClassClassifier for Novelty Detection”,Proceedings of IEEE Conference on ComputerVision and Pattern Recognition,2018年。
因此,本发明的实施方式的一个方面的目的是提供能够防止降低鉴别器检测异常的能力的训练设备、训练方法和训练程序。
发明内容
根据实施方式的一方面,一种训练设备包括:生成器,其被配置成生成图像数据;以及鉴别器,其被配置成鉴别图像数据真伪;训练单元,其被配置成执行用于生成器和鉴别器的训练,使得生成器使鉴别器的鉴别误差最大化并且鉴别器使鉴别误差最小化;存储单元,其被配置成在训练正被执行时,存储经半训练(half-trained)并且满足预设条件的生成器的状态;以及再训练单元,其被配置成通过使用由具有所存储的状态的经半训练的生成器生成的图像对鉴别器进行再训练。
附图说明
图1是用于说明根据第一实施方式的异常检测设备的图;
图2是用于说明训练前的步骤的图;
图3是用于说明训练开始后的步骤的图;
图4是用于说明训练期间的步骤的图;
图5是用于说明训练结束后的鉴别器的图;
图6是示出根据第一实施方式的异常检测设备的功能配置的功能框图;
图7是用于说明检测结果的示例的图;
图8是示出根据第一实施方式的训练过程的流程的流程图;
图9是示出根据第一实施方式的检测过程的流程的流程图;
图10是用于说明临时存储和再训练的图;
图11是用于说明效果的图;
图12是用于说明根据第二实施方式的训练过程的图;
图13是示出根据第二实施方式的训练过程的流程的流程图;
图14是用于说明根据第三实施方式的训练过程的图;
图15是示出根据第三实施方式的训练过程的流程的流程图;
图16是用于说明硬件配置示例的图;以及
图17是用于说明GAN的图。
具体实施方式
然而,在如上描述的技术中,在某些情况下,鉴别器检测异常的能力可能降低。具体地,当使用鉴别器时,鉴别器的特性取决于在训练结束时通过生成器错误地生成的除正常数据以外的数据,从而可能会增加检测的遗漏。例如,期望鉴别器具有鉴别正常数据与来自生成器的输出之间的差异的能力;然而,鉴别器不能训练来自生成器的输出中不包括的并且正常数据中不包括的数据,从而不可能预计特定的输出。同时,使用生成器的方法需要较高的检测成本,因此,该方法不适于需要高速执行的异常检测。
将参照附图说明优选实施方式。本发明不受以下实施方式的限制。另外,只要不产生矛盾,就可以对实施方式进行适当地组合。
[a]第一实施方式
异常检测设备10的描述
图1是用于说明根据第一实施方式的异常检测设备10的图。如图1所示,异常检测设备10是训练设备的示例,该训练设备在训练阶段中通过GAN对生成器和鉴别器进行训练,并且在预测阶段中通过使用经训练的鉴别器关于预测目标图像数据执行异常检测。
同时,在使用通用GAN的训练中,在某些情况下,鉴别器检测异常的能力可能降低。下面将参照图2至图5来描述通用GAN的问题。在图2至图5中,关于使用通用GAN的训练,示出了训练开始之前、训练期间以及训练结束之后的步骤。图2是用于说明训练之前的步骤的图。图3是用于说明训练开始之后的步骤的图。图4是用于说明训练期间的步骤的图。图5是用于说明训练结束之后的鉴别器的图。
如图2所示,在训练之前,生成器生成与正常数据的分布不同的分布的数据,并且鉴别器训练正常数据的分布与通过生成器生成的数据的分布之间的差异。换句话说,鉴别器在正常数据的分布与通过生成器生成的数据的分布之间进行清楚地区分和鉴别。
随后,如图3所示,在开始训练时,进行生成器的训练,使得通过鉴别器鉴别为正常的数据增加而鉴别为异常的数据减少。换句话说,生成器被训练成生成可能通过鉴别器错误地鉴别的数据,并且因此生成器被训练成使得通过生成器生成的数据的分布包括可以通过鉴别器确定为正常的范围。相反,当随着训练的开始而改变通过生成器生成的数据的分布时,指示数据被鉴别为正常的鉴别结果的可能性发生改变;因此,鉴别器训练正常数据的分布与通过生成器生成的数据的分布之间的差异。
随后,当从如图3所示的时间点进行训练时,如图4所示,执行训练,使得通过生成器生成的数据的分布包括图3中可以通过鉴别器鉴别为正常的范围。换句话说,更新通过生成器生成的数据的分布,以使其大部分包括在可以通过鉴别器鉴别为正常的范围内。相反,鉴别器被训练成在通过经更新的生成器生成的数据的分布与正常数据的分布之间进行鉴别。
当进一步进行训练时,如图5所示,生成器被训练成模仿处于如图4示出的状态中的通过鉴别器鉴别为正常的范围中的数据,从而使鉴别器产生错误,使得更新通过生成器生成的数据的分布以便包括图4中的可以通过鉴别器鉴别的范围。当训练完成时,该经训练的鉴别器被训练成在通过生成器生成的数据与正常数据(真实数据)之间进行鉴别。
然而,在通用的GAN中,鉴别器的特性取决于在训练结束时通过生成器错误地生成的除正常数据以外的数据,从而可能会增加检测的遗漏。具体地,可以关于存在于可以通过该经训练的鉴别器确定为异常的范围内的异常数据准确地检测异常,但是不可能检测存在于该范围之外的异常数据。换句话说,在通用的GAN中,在某些情况下,可能难以将鉴别器训练到与期望检测到的异常数据的范围相同的程度。
为了解决该问题,根据第一实施方式的异常检测设备10关注以下事实:期望要在医疗过程中检测的异常数据没有出现在与正常数据的分布较大偏离的位置处。此外,通过生成器生成的数据的分布可能在训练进程中暂时偏离正常数据的分布,并且因此,异常检测设备10以规则的间隔存储经半训练的生成器,并通过使用存储的生成器中的全部来训练鉴别器。
具体地,如图1所示,异常检测设备10通过GAN对生成器和鉴别器进行训练,并且以规则的间隔获取关于经半训练的生成器的信息。然后,在通过GAN对鉴别器的训练完成之后,异常检测设备10通过使用在训练进程中存储的生成器中的每一个来对经训练的鉴别器进行再训练。在再训练完成之后,异常检测设备10将预测目标图像数据输入至经再训练的鉴别器并执行异常检测。
功能配置
图6是示出根据第一实施方式的异常检测设备10的功能配置的功能框图。如图6所示,异常检测设备10包括通信单元11、存储单元12和控制单元20。
通信单元11是控制与其他设备的通信的处理单元,并且例如是通信接口等。例如,通信单元11从管理员终端接收开始各种过程的指令、正常数据、预测目标数据等,并且将训练结果、预测结果等发送至管理员终端。
存储单元12是在其中存储要由控制单元20执行的各种类型的数据和程序的存储装置的一个示例,并且是例如存储器、硬盘等。存储单元12在其中存储正常数据数据库(DB)13、中间过程信息DB 14、训练结果DB 15等。
正常数据DB 13是用于存储通过捕获处于正常状态的内部器官等的图像而获得的图像数据的数据库。例如,正常数据DB 13在其中存储在通过GAN对鉴别器的训练中使用的正常数据。
中间过程信息DB 14是用于存储在通过GAN对生成器进行训练时的经半训练的生成器的信息的数据库。例如,中间过程信息DB 14在其中存储各种参数,通过这些参数可以在训练进程中再现(构造)经半训练的生成器。
训练结果DB 15是用于存储生成器和鉴别器的训练结果的数据库。例如,训练结果DB 15在其中存储通过其可以生成经训练的生成器和经训练的鉴别器(其中针对它们中的每一个完成训练)的各种参数,作为使用GAN的生成器和鉴别器的训练结果以及鉴别器的再训练结果。
控制单元20是控制整个异常检测设备10的处理单元,并且例如是处理器等。控制单元20包括训练处理单元30、再训练单元40和检测单元50,训练具有高鉴别准确度的鉴别器,并且关于输入的预测目标图像数据执行异常检测。
训练处理单元30是包括生成器训练单元31、鉴别器训练单元32和临时存储单元33的处理单元,并且使用GAN来训练生成器和鉴别器。
生成器训练单元31是训练GAN的生成器的处理单元。具体地,类似于通用GAN,生成器训练单元31训练生成器,使得要通过鉴别器确定为正常的数据增加而要被确定为异常的数据减少。换句话说,生成器被训练成使鉴别器的鉴别误差最大化。
例如,生成器训练单元31通过使用潜变量(latent variable)使生成器生成图像数据,该潜变量是随机数、随机噪声等,并且是所谓的种子(seed)。然后,生成器训练单元31将生成的图像数据(在下文中,可以描述为生成的数据)输入至鉴别器,并且获取鉴别器的鉴别结果。然后,生成器训练单元31通过使用鉴别结果来训练生成器,使得生成的数据可以通过鉴别器鉴别为正常数据。
换句话说,生成器训练单元31训练生成器,以使得通过生成器生成的生成数据的分布与正常数据的分布相匹配。如果训练完成,则生成器训练单元31将关于经训练的生成器的信息存储在训练结果DB 15中。
鉴别器训练单元32是训练GAN的鉴别器的处理单元。具体地,类似于通用GAN,鉴别器训练单元32训练鉴别器,使得鉴别器能够在存储在正常数据DB 13中的正常数据与通过生成器生成的生成数据之间进行区分。换句话说,鉴别器被训练成使鉴别误差最小化。
例如,鉴别器训练单元32从生成器获取生成的数据,将生成的数据输入至鉴别器,并获取鉴别器的输出结果。然后,鉴别器训练单元32训练鉴别器,使得关于指示包括在输出结果中的正常数据的常态可能性和指示生成的数据的异常可能性,异常可能性增加而常态可能性降低。
换句话说,鉴别器训练单元32使鉴别器训练通过生成器生成的生成数据的分布与正常数据的分布之间的差异。如果训练完成,则鉴别器训练单元32将关于经训练的鉴别器的信息存储在训练结果DB 15中。
临时存储单元33是用于存储经半训练的生成器的处理单元。例如,在通过生成器训练单元31对生成器进行训练的同时,临时存储单元33以规则的时间间隔或每次执行了预定次数的训练时从生成器获取指示经半训练的生成器的状态的各种参数,并将各种参数存储在中间过程信息DB14中。
再训练单元40是对通过GAN训练的鉴别器进行再训练的处理单元。具体地,再训练单元40通过使用存储在临时存储单元33中的经半训练的生成器的全部来对鉴别器进行再训练。
例如,如果训练处理单元30完成训练,则再训练单元40从中间过程信息DB 14读取诸如参数的信息,并且生成经半训练的生成器中的每一个。类似地,再训练单元40从训练结果DB 15读取鉴别器的参数等,并生成经训练的鉴别器。
在此,假设生成四个经半训练的生成器。在这种情况下,再训练单元40通过使用第一生成器生成生成数据,将生成数据输入至训练的鉴别器,并训练鉴别器。随后,再训练单元40通过使用第二生成器构造生成数据,将生成数据输入至利用第一生成器训练的鉴别器,并且训练鉴别器。以这种方式,再训练单元40通过顺序地使用经半训练的生成器中的每一个对鉴别器进行再训练。然后,如果再训练完成,则再训练单元40将关于经再训练的鉴别器的信息存储在训练结果DB 15中。
检测单元50是从输入图像数据检测异常的处理单元。例如,如果再训练单元40完成再训练,则检测单元50从训练结果DB 15读取与经再训练的鉴别器有关的参数等,并构造鉴别器。然后,在接收到预测目标图像数据时,检测单元50将图像数据输入至构造的鉴别器并获得输出结果。
在此,就指示包括在输出结果中的正常数据的常态可能性和指示生成的数据的异常可能性而言,如果常态可能性较高,则检测单元50将输入的图像数据鉴别为正常图像数据,而如果异常可能性较高,则检测单元50将输入的图像数据鉴别为异常图像数据。然后,检测单元50将鉴别结果发送至管理员终端,在显示单元例如显示器上显示鉴别结果,或者将鉴别结果存储在存储单元12中。
图7是用于说明检测结果的示例的图。如图7所示,检测单元50首先将作为预测目标的输入图像划分为小区域,然后将图像数据输入至通过再训练单元40训练的鉴别器,并获取鉴别结果。然后,检测单元50能够向用户提供通过鉴别器确定为异常的区域。
训练过程的流程
图8是示出根据第一实施方式的训练过程的流程的流程图。如图8所示,如果发布了关于训练过程的指令,则训练处理单元30初始化生成器和鉴别器(S101)。
随后,生成器训练单元31使生成器生成数据(生成的数据)(S102),并且鉴别器训练单元32训练鉴别器,使得鉴别器能够在正常数据与生成的数据之间进行区分(S103)。然后,生成器训练单元31训练生成器,使得生成的数据可以通过鉴别器鉴别为正常数据(S104)。
此后,如果期间未存储生成器的时间或重复次数(训练次数)等于或大于预定值(S105:是),则临时存储单元33在其中存储经半训练的生成器(S106)。如果期间未存储生成器的时间或重复次数小于预定值(S105:否),则执行S107处的过程而不执行S106处的过程。
此后,重复从S102的过程,直到训练完成(S107:否)。相反,如果训练完成(S107:是),则再训练单元40再训练鉴别器,使得鉴别器能够在正常数据与通过存储的生成器生成的数据(生成的数据)之间进行鉴别(S108)。如果再训练完成,则再训练单元40存储鉴别器(S109)。
检测过程的流程
图9是示出根据第一实施方式的检测过程的流程的流程图。如图9所示,如果发出了关于检测过程的指令,则检测单元50读取存储的鉴别器(S201)。随后,检测单元50将目标数据输入至鉴别器,并确定(鉴别)目标数据是否异常(S202)。
如果检测单元50确定目标数据正常(S203:是),则检测单元50终止该过程。如果检测单元50未确定目标数据是正常的(S203:否),则检测单元50将目标数据作为异常数据输出(S204)。
效果
如上所描述的,异常检测设备10关注以下事实:例如,期望要在医疗过程中检测的异常数据没有出现在与正常数据的分布偏离较大的位置处,并且异常检测设备10通过使用经半训练的生成器对鉴别器进行再训练。因此,异常检测设备10能够通过使用能够穷尽生成期望存在于正常数据周围的异常数据的生成器来重新训练鉴别器。因此,可以扩展鉴别器的鉴别范围。
图10是用于说明临时存储和再训练的图。存储经半训练的生成器是存储经半训练的生成器的状态,并且是存储通过经半训练的生成器生成的生成数据的分布,以使得该分布与正常数据的分布相匹配。换句话说,如图10中所示,可以存储从训练的开始到训练的结束训练通过生成器生成的每条生成数据的分布的过程。因此,通过使用经存储的生成器的全部来执行再训练,可以训练通过生成器中的每一个生成的每条生成数据的分布中的每一个,从而可以训练没有被通过GAN训练的鉴别器涵盖的范围。
图11是用于说明效果的图。如图11所示,在通用的GAN中,鉴别器的特性取决于在训练结束时通过生成器错误地生成的不同于正常数据的数据,从而难以训练鉴别器以便涵盖期望被检测到的异常的范围,并且经常发生检测遗漏。在图11所示的示例中,鉴别器不能够检测位于生成器的数据分布范围之外的数据A作为异常。
相反,在根据第一实施方式的鉴别器的训练中,可以再训练通过在训练进程中存储的生成器生成的生成数据的分布,从而可以涵盖正常数据周围的更大区域,而不取决于经完全训练的生成器的状态。因此,经再训练的鉴别器能够检测没有被通用GAN的鉴别器检测到的数据A作为异常数据。
[b]第二实施方式
在第一实施方式中,已经描述了以规则的间隔存储经半训练的生成器的示例,但是通过控制存储的间隔来代替采用规则的间隔可以提高鉴别的性能。因此,在第二实施方式中,将描述这样的示例,其中不是以规则的间隔存储生成器,而是以在鉴别器的损失(loss)暂时地升到阈值或更高之后再次降低到阈值以下的定时存储生成器。
图12是用于说明根据第二实施方式的训练过程的图。在图12中,示出了鉴别器的损失的时间变化,换句话说,示出了在基于GAN的训练中通过鉴别器的鉴别不成功的比率的时间变化。如图12所示,当通过GAN对生成器进行训练时,通过生成器生成的数据的分布偏离至鉴别器未涵盖的区域(图12(a)),并且鉴别器的损失增加(图12(b))。此后,进行鉴别器的训练,并且鉴别器跟随经训练的生成器,从而鉴别器的损失减小(图12(c)),并且消除了偏差(图12(d))。
因此,当鉴别器的损失增加并且此后开始减少时,临时存储单元33在其中存储生成器的状态。同时,如果临时存储单元33在该定时存储多个生成器,则可以从鉴别器的损失减少开始以规则的时间间隔存储生成器。利用该配置,可以存储通过生成器生成的数据的分布与正常数据的分布之间的差异大的时间点,从而可以扩展可以通过鉴别器训练的范围。于是,可以提高鉴别器的性能。
图13是示出根据第二实施方式的训练过程的流程的流程图。如图13所示,如果发布了关于训练过程的指令,则训练处理单元30初始化生成器和鉴别器(S301)。
随后,生成器训练单元31使生成器生成数据(生成的数据)(S302),并且鉴别器训练单元32训练鉴别器,使得鉴别器能够在正常数据与生成的数据之间进行区分(S303)。然后,生成器训练单元31训练生成器,使得生成的数据可以通过鉴别器鉴别为正常数据(S304)。
此后,如果期间未存储生成器的时间或重复次数等于或大于预定值(S305:是),并且如果鉴别器的损失减少(S306:是),则临时存储单元33在其中存储经半训练的生成器(S307)。如果期间未存储生成器的时间或重复次数小于预定值(S305:否),或者如果鉴别器的损失没有减少(S306:否),则执行S308处的过程而不执行S307处的过程。
此后,重复从S302的过程,直到训练完成(S308:否)。相反,如果训练完成(S308:是),则再训练单元40再训练鉴别器,使得鉴别器能够在正常数据与通过存储的生成器生成的数据(生成的数据)之间进行区分(S309)。如果再训练完成,则再训练单元40存储鉴别器(S310)。检测过程与第一实施方式的检测过程相同,并且因此,将省略其详细说明。
[c]第三实施方式
在第二实施方式中,当生成器开始生成异常数据时,鉴别器立即跟随生成器;因此,在没有被鉴别器涵盖的区域中通过生成器生成的生成数据的分布的偏差的范围受到限制,并且难以确定偏差的进展的程度。
因此,在第三实施方式中,使用设置了不同训练速度的两个鉴别器,并且准确地存储在偏差已经进展的状态下的生成器,从而提高鉴别器的性能。具体地,使用低速鉴别器来训练生成器,并且使用高速鉴别器来测量偏差的进展程度。在第三实施方式中,可以被高速鉴别器鉴别为生成数据的生成数据的百分比用作索引。此外,如果偏差进展到一定程度或更高,则存储生成器,并将高速鉴别器复制到低速鉴别器,以便防止偏差的进一步进展。
图14是用于说明根据第三实施方式的训练过程的图。如图14所示,图14示出了在基于使用两个鉴别器的GAN的训练中,鉴别器中的每一个的损失的时间变化,两个鉴别器例如是设置了低训练速度的鉴别器A(在下文中,可以被描述为鉴别器A或者低速鉴别器A)和设置了高训练速度的鉴别器B(在下文中,可以被描述为鉴别器B或者高速鉴别器B)。
如图14所示,当通过GAN对生成器进行训练时,通过生成器生成的数据的分布开始偏离到高速鉴别器B未涵盖的区域(图14(a)),并且高速鉴别器B的损失增加(图14(b))。然而,由于低速鉴别器A的训练速度低,所以低速鉴别器A的损失的增加小于高速鉴别器B的损失的增加。
此后,对鉴别器两者进行训练,特别是对高速鉴别器B进行训练并且跟随生成器的训练,从而高速鉴别器B的损失减少而低速鉴别器A不能够允许偏差(图14(c))。换句话说,低速鉴别器A不能跟随生成器的训练,从而不进行对鉴别的校正。
此时,临时存储单元33在其中存储经半训练的生成器。换句话说,当高速鉴别器B的偏差进展至一定程度或较高程度时,临时存储单元33在其中存储使用低速鉴别器A进行训练的生成器。换句话说,在高速鉴别器A的损失增加且此后开始减少并且低速鉴别器B的损失增加的情况下,临时存储单元33存储生成器的状态。可以针对鉴别器A和鉴别器B使用相同的值,作为用于确定损失是否等于或大于预定值的阈值。
然后,临时存储单元33将高速鉴别器的参数诸如权重复制到低速鉴别器A,并以两个训练速度恢复训练(图14(d))。换句话说,将鉴别器两者都修改成具有高速鉴别器的状态,并且从修改的状态执行低速训练和高速训练。
以此方式,如果完成了使用两个鉴别器的训练,则再训练单元40使用临时存储的经半训练的生成器对鉴别器B进行再训练。
图15是示出根据第三实施方式的训练过程的流程的流程图。如图15所示,如果发布了关于训练处理的指令,则训练处理单元30初始化生成器、鉴别器A和鉴别器B(S401)。
随后,生成器训练单元31执行设置,使得鉴别器A的训练速度比鉴别器B的训练速度低(S402)。例如,生成器训练单元31通过降低训练速率或训练频率来降低训练速度。
然后,生成器训练单元31使生成器生成数据(生成的数据)(S403),并且鉴别器训练单元32训练鉴别器A和鉴别器B,使得鉴别器能够在正常数据与生成的数据之间进行区分(S404)。随后,生成器训练单元31训练生成器,使得生成的数据可以通过鉴别器A鉴别为正常数据(S405)。
此后,如果期间未存储生成器的时间或重复次数等于或大于预定值(S406:是),并且如果鉴别器B的损失减少(S407:是),则临时存储单元33在其中存储经半训练的生成器(S408)。随后,临时存储单元33将鉴别器B的参数诸如权重复制到鉴别器A(S409)。
如果期间未存储生成器的时间或重复次数小于预定值(S406:否),或者如果鉴别器的损失没有减少(S407:否),则执行S410处的过程而不执行S408和S409处的过程。
此后,重复从S403的过程,直到训练完成(S410:否)。相反,如果训练完成(S410:是),则再训练单元40再训练鉴别器B,使得鉴别器能够在正常数据与由存储的生成器生成的数据(生成的数据)之间进行鉴别(S411)。如果再训练完成,则再训练单元40存储鉴别器B(S412)。检测过程与第一实施方式的检测过程相同,并且因此,将省略其详细说明。
[d]第四实施方式
尽管上面已经描述了本发明的实施方式,但是本发明可以以除了以上描述的实施方式之外的各种形式实施。
训练
例如,可以将终止训练过程的定时设置成任意时间点,诸如完成了使用预定数量或更多条训练数据的训练的时间点或者鉴别器的损失降低到阈值以下的时间点。此外,除了应用于医学图像数据之外,该技术可以应用于确定是否发生未经授权的入侵或引入了有害物质的各种领域。
再训练的定时
在如上所描述的实施方式中,已经描述了在训练完成之后再训练鉴别器的示例,但是实施方式不限于该示例。例如,可以通过使用正常GAN的过程和通过使用临时存储的经半训练的生成器的过程同时训练鉴别器。换句话说,为了防止重新生成可能已经由存储的生成器生成的异常数据的生成器的存储,即使在训练过程期间,存储的生成器也用于训练鉴别器。利用该配置,可以在校正鉴别器的训练的同时减少训练时间并执行训练,从而可以改善鉴别器的鉴别性能。
系统
除非另外指定,否则可以任意地改变以上描述的文档和附图中所示的处理过程、控制过程、特定名称以及包括各种类型的数据和参数的信息。
此外,附图中所示的设备的组件在功能上是概念性的,并且不必以附图中所示的方式在物理上进行配置。换句话说,设备的分布和集成的具体形式不限于附图中所示的那些形式。即,设备的全部或部分可以根据各种负载或使用条件在功能上或物理上分布或集成在任意单元中。例如,训练处理单元30、再训练单元40和检测单元50可以由不同的设备来实现。
此外,对于由每个设备执行的每个处理功能,处理功能的全部或任何部分可以由CPU以及由CPU分析和执行的程序来实现,或者可以由有线逻辑实现为硬件。
硬件
图16是用于说明硬件配置示例的图。如图16所示,异常检测设备10包括通信设备10a、硬盘驱动器(HDD)10b、存储器10c和处理器10d。图16中所示的单元的全部经由总线等连接至彼此。
通信设备10a是网络接口卡等,并且执行与其他服务器的通信。HDD10b在其中存储用于操作如图6所示的功能的程序和多个DB。
处理器10d从HDD 10b等读取用于执行与图6所示的处理单元中的每个处理单元的过程相同的过程的程序,并加载存储器10c上的程序,从而操作用于实现参照图6等描述的功能中的每个功能的过程。换句话说,该过程实现与异常检测设备10中包括的处理单元的全部处理单元的那些功能相同的功能。具体地,处理器10d从HDD 10b等读取具有与训练处理单元30、再训练单元40、检测单元50等的那些功能相同的功能的程序。然后,处理器10d执行用于实现与训练处理单元30、再训练单元40、检测单元50等的那些过程相同的过程。
以这种方式,异常检测设备10通过读取并执行程序,用作执行异常检测方法的信息处理设备。此外,异常检测设备10可以能够使介质读取装置从记录介质读取以上描述的程序并执行所读取的程序,从而实现与以上描述的实施方式的那些功能相同的功能。同时,在其他实施方式中描述的程序不必总是由异常检测设备10执行。例如,当不同的计算机或不同的服务器执行程序或者不同的计算机和不同的服务器以协作的方式执行程序时,可以以相同的方式应用本发明。
根据实施方式,可以防止鉴别器检测异常的能力的降低。

Claims (8)

1.一种训练设备,包括:
生成器,其被配置成生成图像数据;
鉴别器,其被配置成鉴别所述图像数据真伪;
训练单元,其被配置成执行用于所述生成器和所述鉴别器的训练,使得所述生成器使所述鉴别器的鉴别误差最大化并且所述鉴别器使所述鉴别误差最小化;
存储单元,其被配置成在所述训练正被执行时,存储经半训练并且满足预设条件的生成器的状态;以及
再训练单元,其被配置成通过使用由具有所存储的状态的经半训练的生成器生成的图像对所述鉴别器进行再训练。
2.根据权利要求1所述的训练设备,其中,在所述鉴别器的损失达到阈值或更高并且此后再次达到所述阈值以下的情况下,所述存储单元存储所述生成器的状态。
3.根据权利要求1所述的训练设备,其中,
所述鉴别器包括:
第一鉴别器;以及
第二鉴别器,设置有比所述第一鉴别器的训练速度快的训练速度,所述训练单元训练所述生成器以使所述第一鉴别器的鉴别误差最大化,训练所述第一鉴别器以使所述第一鉴别器的鉴别误差最小化,以及训练所述第二鉴别器以使所述第二鉴别器的鉴别误差最小化,以及
在所述第二鉴别器的损失增加且此后开始减少并且所述第一鉴别器的损失等于或大于所述阈值的情况下,所述存储单元存储所述生成器的状态。
4.根据权利要求1所述的训练设备,其中,所述再训练单元通过使用所述经半训练的生成器的状态对通过所述训练单元已经完成所述训练的经训练的鉴别器进行再训练。
5.根据权利要求1所述的训练设备,其中,与通过所述训练单元执行的训练并行,所述再训练单元使用所述经半训练的生成器的状态执行再训练。
6.根据权利要求1所述的训练设备,还包括:
检测单元,其被配置成:当鉴别目标图像数据被划分为多个区域并且被输入至经再训练的鉴别器,并且如果所述经再训练的鉴别器检测到异常,则呈现通过所述经再训练的鉴别器指示为异常的区域。
7.一种训练方法,包括:
执行训练,使得被配置成生成图像数据的生成器使被配置成鉴别所述图像数据真伪的鉴别器的鉴别误差最大化;
执行训练,使得所述鉴别器使所述鉴别误差最小化;
在所述训练正被执行时,存储经半训练并且满足预设条件的生成器的状态;以及
通过使用由具有所存储的状态的经半训练的生成器生成的图像对所述鉴别器进行再训练。
8.一种计算机可读记录介质,其中存储有使计算机执行以下操作的训练程序:
执行训练,使得被配置成生成图像数据的生成器使被配置成鉴别所述图像数据真伪的鉴别器的鉴别误差最大化;
执行训练,使得所述鉴别器使所述鉴别误差最小化;
在所述训练正被执行时,存储经半训练并且满足预设条件的所述生成器的状态;以及
通过使用由具有所存储的状态的经半训练的生成器生成的图像对所述鉴别器进行再训练。
CN202010071123.XA 2019-01-30 2020-01-21 训练设备、训练方法和计算机可读记录介质 Active CN111507934B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-014035 2019-01-30
JP2019014035A JP7268367B2 (ja) 2019-01-30 2019-01-30 学習装置、学習方法および学習プログラム

Publications (2)

Publication Number Publication Date
CN111507934A true CN111507934A (zh) 2020-08-07
CN111507934B CN111507934B (zh) 2024-04-26

Family

ID=69185374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010071123.XA Active CN111507934B (zh) 2019-01-30 2020-01-21 训练设备、训练方法和计算机可读记录介质

Country Status (4)

Country Link
US (1) US11250297B2 (zh)
EP (1) EP3690743A1 (zh)
JP (1) JP7268367B2 (zh)
CN (1) CN111507934B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022088089A1 (zh) * 2020-10-30 2022-05-05 京东方科技集团股份有限公司 图像处理方法、图像处理装置、电子设备及可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401138B (zh) * 2020-02-24 2023-11-07 上海理工大学 生成对抗神经网络训练过程的对抗优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180293734A1 (en) * 2017-04-06 2018-10-11 General Electric Company Visual anomaly detection system
CN108769993A (zh) * 2018-05-15 2018-11-06 南京邮电大学 基于生成对抗网络的通信网络异常用户检测方法
JP2018192264A (ja) * 2017-05-18 2018-12-06 キヤノンメディカルシステムズ株式会社 医用画像処理装置
US20180365089A1 (en) * 2015-12-01 2018-12-20 Preferred Networks, Inc. Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10937540B2 (en) * 2017-12-21 2021-03-02 International Business Machines Coporation Medical image classification based on a generative adversarial network trained discriminator
DE112018007236T5 (de) * 2018-03-08 2020-12-24 Intel Corporation Verfahren und vorrichtung zum erzeugen eines dreidimensionalen (3d) modells zur rekonstruktion einer 3d-szene

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180365089A1 (en) * 2015-12-01 2018-12-20 Preferred Networks, Inc. Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model
US20180293734A1 (en) * 2017-04-06 2018-10-11 General Electric Company Visual anomaly detection system
JP2018192264A (ja) * 2017-05-18 2018-12-06 キヤノンメディカルシステムズ株式会社 医用画像処理装置
CN108769993A (zh) * 2018-05-15 2018-11-06 南京邮电大学 基于生成对抗网络的通信网络异常用户检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MOHAMMAD SABOKROU ET AL: "Adversarially Learned One-Class Classifier for Novelty Detection" *
THOMAS SCHLEGL ET AL: "Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery" *
VINCENT DUMOULIN ET AL: "Generative Adversarial Networks: An Overview" *
WANG YAXING ET AL: "Transferring GANs: Generating Images from Limited Data" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022088089A1 (zh) * 2020-10-30 2022-05-05 京东方科技集团股份有限公司 图像处理方法、图像处理装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
JP2020123096A (ja) 2020-08-13
CN111507934B (zh) 2024-04-26
JP7268367B2 (ja) 2023-05-08
EP3690743A1 (en) 2020-08-05
US11250297B2 (en) 2022-02-15
US20200242412A1 (en) 2020-07-30

Similar Documents

Publication Publication Date Title
EP3690746A1 (en) Training apparatus, training method, and training program
CN111967571A (zh) 一种基于mhma的异常检测方法和设备
US11790237B2 (en) Methods and apparatus to defend against adversarial machine learning
CN111507934B (zh) 训练设备、训练方法和计算机可读记录介质
WO2019168167A1 (ja) 検証方法、検証装置、コンピュータプログラム、及び、検証システム
US11562294B2 (en) Apparatus and method for analyzing time-series data based on machine learning
US7788307B2 (en) Method and apparatus for generating random number
CN111174370A (zh) 故障检测方法及装置、存储介质、电子装置
CN111967573A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN115034369A (zh) 故障诊断的方法、装置、存储介质和电子设备
CN116129888A (zh) 一种音频数据分类方法、装置、设备及介质
EP4127984B1 (en) Neural network watermarking
CN117092525A (zh) 电池热失控预警模型的训练方法、装置及电子设备
JP2023154373A (ja) 情報処理装置
CN111639718B (zh) 分类器应用方法及装置
KR102046249B1 (ko) 머신러닝 기반 악성코드 탐지를 위한 특성선정 방법 및 이를 수행하기 위한 기록매체 및 장치
CN117827667A (zh) 测试覆盖率提高装置
CN111582446A (zh) 用于神经网络剪枝的系统和神经网络的剪枝处理方法
JP2021056928A (ja) 最適解獲得プログラム、最適解獲得方法および情報処理装置
KR102251898B1 (ko) 태양 영상 노이즈 처리 장치 및 방법
KR102618020B1 (ko) 차량용 인포테인먼트 시스템 네트워크 침입 탐지 방법 및 장치
Ugrenovic et al. Towards classification trustworthiness: one-class classifier ensemble
JP2024040006A (ja) 訓練データ生成プログラム、訓練データ生成方法及び情報処理装置
JP6886112B2 (ja) 学習プログラム、学習装置及び学習方法
CN118193606A (zh) 数据回填方法、系统、设备、可读存储介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant