CN115362445A

CN115362445A - 数据分类装置、数据分类方法以及数据分类程序

Info

Publication number: CN115362445A
Application number: CN202180024451.7A
Authority: CN
Inventors: 水田慎吾; 池田庆太
Original assignee: Toray Industries Inc
Current assignee: Toray Industries Inc
Priority date: 2020-03-31
Filing date: 2021-02-10
Publication date: 2022-11-18
Also published as: EP4131074A4; EP4131074A1; KR20220160536A; JPWO2021199706A1; US20230126191A1; WO2021199706A1

Abstract

本发明的数据分类装置具备：数据取得部，其取得分类对象的数据；分类部，其用使用神经网络进行学习而得的学得模型将所述数据分类成多个类别中的某一类；相似度算出部，其算出所述数据与生成所述学得模型时所用的已学习数据的相似度；以及判定部，其基于所述相似度对所述数据是否属于所述多个类别进行判定，在所述数据不属于所述多个类别中的任一类的情况下，判定为所述数据属于未知类别。

Description

数据分类装置、数据分类方法以及数据分类程序

技术领域

本发明涉及数据分类装置、数据分类方法以及数据分类程序。

背景技术

已知有如下技术：使通过使用卷积神经网络的学习构成的分类器对数据进行分类(例如、参照专利文献1)。

现有技术文献

专利文献

专利文献1:日本特开2019－96313号公报

发明内容

发明所要解决的课题

就上述的分类器而言，即使是本来无法进行分类的未知类别的数据，也会分类成已学习的已知类别的某一类。因此，在数据之中会产生未知类别的情况下，分类的精度恐会降低。因而，寻求能够抑制将未知类别的数据分类成已知类别的技术。

本发明是鉴于上述而完成的，以提供能够抑制将未知类别的数据分类成已知类别的数据分类装置、数据分类方法以及数据分类程序为目的。

用于解决课题的手段

为了解决上述的课题并达成目的，本发明的数据分类装置具备：数据取得部，其取得分类对象的数据；分类部，其用使用神经网络进行学习而得的学得模型将所述数据分类成多个类别中的某一类；相似度算出部，其算出所述数据与生成所述学得模型时所用的已学习数据的相似度；以及判定部，其基于所述相似度对所述数据是否属于所述多个类别进行判定，在所述数据不属于所述多个类别中的任一类的情况下，判定为所述数据属于未知类别。

本发明的优选方式的数据分类装置，在上述发明中，所述学得模型中，将所述数据设为输入参数、将分类结果及所述数据的特征量设为输出参数。

本发明的优选方式的数据分类装置，在上述发明中，所述相似度算出部使用所述数据及所述已学习数据的特征量算出相似度，所述判定部在所述相似度满足基准的情况下、按照所述分类部的分类结果判定所述数据所属的类别，在所述相似度不满足所述基准的情况下、判定为所述数据为未知类别。

本发明的优选方式的数据分类装置，在上述发明中，所述数据分类装置具备控制部，所述控制部至少使与所述数据最为相似的数据和所述判定部所作出的判定结果一并显示于显示装置。

本发明的优选方式的数据分类装置，在上述发明中，所述数据分类装置具备：评价值算出部，其在所述判定部的判定次数达到基准次数的情况下算出判定评价值，所述判定评价值为进行了所述基准次数的判定中判定为所述数据属于所述多个类别中的某一类的比例；和控制部，其在所述判定评价值比阈值小时，输出评价结果和催促进行所述学得模型的重构的信息中的至少任一方。

本发明的优选方式的数据分类装置，在上述发明中，所述相似度算出部算出所述数据的特征量与所述已学习数据的特征量在特征空间中的欧几里得距离在各类别中的最小值，作为与各类别的相似度。

本发明的优选方式的数据分类装置，在上述发明中，所述相似度算出部算出所述数据的特征量与分别代表所述多个类别的所述已学习数据在特征空间中的规定距离，作为与各类别的相似度。

本发明的数据分类方法包括：数据取得步骤，取得分类对象的数据；分类步骤，从存储部读出使用神经网络进行学习而得的学得模型，使用所述学得模型将所述数据分类成多个类别的某一类；相似度算出步骤，算出所述数据与生成所述学得模型时所用的已学习数据的相似度；和判定步骤，基于所述相似度对所述数据是否属于所述多个类别进行判定，在所述数据不属于所述多个类别的任一类的情况下，判定为所述数据属于未知类别。

本发明的数据分类程序使计算机执行以下步骤：数据取得步骤，取得分类对象的数据；分类步骤，用使用神经网络进行学习而得的学得模型将所述数据分类成多个类别的某一类；相似度算出步骤，算出所述数据与生成所述学得模型时所用的已学习数据的相似度；和判定步骤，基于所述相似度对所述数据是否属于所述多个类别进行判定，在所述数据不属于所述多个类别的任一类的情况下，判定为所述数据属于未知类别。

发明的效果

根据本发明，能够抑制将未知类别的数据分类成已知类别。

附图说明

图1是示出本发明的一实施方式的数据分类装置的功能构成的框图。

图2是示出已学习数据存储部92所存储的缺陷图像数据的例子的图。

图3是示出本发明的一实施方式的数据分类装置所进行的处理的概要的流程图。

图4是示出判定结果的显示例(其1)的图。

图5是示出判定结果的显示例(其2)的图。

图6是对本发明的一实施方式的效果进行说明的图。

图7是示出将图6所示的例子中对已知类别与未知类别进行辨别的阈值变更的情况下的未知类别的检出率与已知类别的误检出率的变动的图。

图8是说明本发明的一实施方式中、赋予用于对已知类别与未知类别进行辨别的界限的阈值的其他确定方法的图。

具体实施方式

以下，参照附图对用于实施本发明的方式(以下称为“实施方式”)进行说明。需要说明的是，本发明并不受以下说明的实施方式限定。

图1是示出本发明的一实施方式的数据分类装置的功能构成的框图。该图所示的数据分类装置100是将对在使用聚合物的薄膜制造过程中产生的缺陷进行拍摄而得的缺陷图像的数据、根据缺陷种类分类成不同的多个类别中的某一类的装置。分类对象的缺陷是在薄膜的制造过程中熔融的原料在制造装置内部滞留并因过度的温度、热、时间等而改性的产物、在制造工序中混入的异物、因制造装置而起的损伤等。

以下，对数据分类装置100的功能构成进行说明。数据分类装置100具备输入部1、数据取得部2、图像处理部3、分类部4、相似度算出部5、判定部6、评价值算出部7、控制部8以及存储部9。

输入部1接受各种信息的输入。输入部1使用键盘、鼠标、麦克风等用户接口构成。

数据取得部2获取从缺陷检查机送来的缺陷图像的数据，输出并存储于存储部9，所述缺陷检查机对薄膜表面进行拍摄提取缺陷并生成包含该缺陷的缺陷图像的数据。

图像处理部3对缺陷图像的数据进行已知的图像处理，并且进行以缺陷图像的数据的除缺陷以外的部分为共通背景、将缺陷部分重叠于该背景的图像处理。背景例如由灰色这一单色形成。

分类部4通过对使用神经网络进行学习而得的学得模型输入图像处理部3实施处理而得的缺陷图像的数据，从而将缺陷图像的数据分类成多个类别中的某一类。学得模型包括输入层、中间层以及输出层，各层为具有一个或多个节点的神经网络。学得模型是通过进行使神经网络的网络参数最优化的学习而生成的。网络参数包括与神经网络的层间权重、偏差有关的信息。学得模型的输入参数为缺陷图像的数据，输出参数为属于多个类别中的各个类别的概率、和缺陷图像的数据中的规定的特征量。该神经网络为导入Softmax损失函数(更优选导入对Softmax损失函数施加L₂范数的正则所得的L₂ Softmax损失函数)而得的卷积神经网络(CNN)(关于L₂Softmax损失函数，参照例如R.Ranjan et al.,“L2-contsrained Softmax Loss for Discriminative Face Verification”,preprint,arXiv:1703.09507[cs.CV](https://arxiv.org/pdf/1703.09507.pdf))。特征量定义为由通常赋予图像数据的特征的多个成分形成的多维向量。

相似度算出部5算出缺陷图像的数据与生成学得模型时所用的已学习的缺陷图像的数据(以下也成为已学习数据)的相似度。相似度算出部5使用缺陷图像的数据的特征量和已学习数据的特征量算出相似度。作为相似度可以使用例如欧几里得距离、马氏距离、余弦相似度等任一指标。

判定部6基于相似度对缺陷图像的数据是否属于多个类别进行判定，在该数据不属于多个类别的任何类别的情况下判定为属于未知类别。判定部6在相似度满足规定的基准的情况下、按照分类部4的分类结果判定缺陷图像的数据所属的类别，另一方面在相似度不满足基准的情况下、判定为缺陷图像的数据为未知类别。

评价值算出部7在判定部6的判定次数达到规定的基准次数的情况下算出判定评价值、即在按基准次数的量进行判定中判定为缺陷图像的数据属于多个种类中的某一类的比例。

控制部8统括控制数据分类装置100的动作。控制部8具有使判定部6的判定结果显示于显示装置的显示控制部81。显示控制部81将与缺陷图像的数据最为相似的缺陷图像的数据和判定部6作出的判定结果一并输出并显示于显示装置。另外，控制部8在判定评价值比阈值小时、输出评价结果及催促进行学得模型的重构的信息中的至少任一方。控制部8既可以向显示装置输出并显示该信息，也可以向声音输出装置输出该信息并使其进行声音输出。

存储部9具备学得模型存储部91和已学习数据存储部92。学得模型存储部91存储上述的学得模型。已学习数据存储部92存储在对学得模型进行学习时所用的缺陷图像数据(以下称为已学习数据)、该已学习数据的特征量以及所属类别。图2是示出已学习数据存储部92所存储的已学习数据的例子的图。图2中，例示出缺陷种类的类别为4个的情况(缺陷种类1～缺陷种类4)。

存储部9存储判定部6的判定次数。当该判定次数达到规定的基准次数时，在控制部8的控制之下进行重置。另外，存储部9存储用于使数据分类装置100动作的各种程序、以及包括数据分类装置100的动作所必需的各种参数等的数据。各种程序也包括本实施方式的数据分类程序。存储部9使用预先安装有各种程序等的ROM(Read Only Memory，只读存储器)、以及存储各处理的运算参数、数据等的RAM(Random Access Memory，随机存取存储器)等构成。

各种程序既可以存储于HDD(Hard Disk Drive，硬盘驱动器)、SSD(Solid StateDrive，固态硬盘)、闪存、CD-ROM、DVD-ROM、Blu-ray(注册商标)等计算机可读的存储介质，也可以设为能够经由通信网络进行下载。此处所说的通信网络由例如既有的公共交换电话网络、LAN(Local Area Network，局域网)以及WAN(Wide Area Network，广域网)等中的至少一种构成，有线、无线皆可。

具有以上功能构成的数据分类装置100是由CPU(Central Processing Unit，中央处理单元)、GPU(Graphics Processing Unit，图形处理单元)、ASIC(ApplicationSpecific Integrated Circuit，专用集成电路)、FPGA(Field Programmable Gate Array，现场可编程门阵列)等中的一个或多个硬件构成的计算机。

图3是示出数据分类装置100所进行的处理的概要的流程图。首先，数据取得部2从缺陷检查机取得缺陷图像的数据(步骤S1)。

接下来，图像处理部3进行图像处理(步骤S2)。此时，图像处理部3实施基于规则的图像处理。此处的目的是将图像中的除缺陷部位以外的不需要区域去除、将明显没有拍摄到缺陷的图像排除等。步骤S3之后的分类处理既可以使用所有的图像，也可以通过步骤S2的图像处理来实施分类对象的图像选别。这里，进行以缺陷部分为中心以特定的尺寸进行切除的处理、和/或将除缺陷以外的背景部分设为灰色等单色的背景的处理，并将缺陷部分重叠于该背景。

之后，分类部4使用学得模型存储部91所存储的学得模型进行分类(步骤S3)。具体而言，分类部4将图像处理部3实施处理所得的缺陷图像的数据输入到学得模型，取得属于多个类别中的各个类别的概率、和所输入的缺陷图像的数据的特征量并作为输出参数。

接着，相似度算出部5参照已学习数据存储部92算出在步骤S1取得的缺陷图像的数据与已学习数据的相似度(步骤S4)。例如、相似度算出部5算出缺陷图像的数据的特征量与已学习数据的特征量的欧几里得距离，算出每个类别的欧几里得距离的最小值作为相似度。

之后，判定部6首先判定相似度是否满足规定的基准(步骤S5)。在步骤S5中相似度满足基准的情况下(步骤S5：是)，数据分类装置100向步骤S6转移。此处的基准定义为：在将例如缺陷图像的数据的特征量与各类别的已学习数据的特征量的欧几里得距离的最小值设为相似度的情况下，该最小值所取值的范围。

步骤S6中，判定部6按照分类部4所得出的分类结果进行判定(步骤S6)。具体而言，判定部6将步骤S3中取得的概率为最大的类别判定为缺陷图像的数据所属的类别。

步骤S5中，在相似度不满足基准的情况下(步骤S5：否)，判定部6判定为缺陷图像的数据为未知类别(步骤S7)。

在步骤S6或S7之后，控制部8使存储部9所存储的判定次数增加1次(步骤S8)。

接着，显示控制部81向显示装置输出判定结果并使其显示(步骤S9)。图4及图5是显示判定部6所作出的判定结果的显示装置中的显示例的图。具体而言，图4示出缺陷图像的数据为已知类别的情况，图5示出缺陷图像的数据为未知类别的情况。

图4所示的画面201中，显示出表示缺陷图像的数据(图像名“Sample1.png”)被分类为缺陷种类1的信息、和按欧几里得距离从小到大顺序的4个图像和欧几里得距离。这4个图像全部为缺陷种类1的图像。

图5所示的画面202中，示出了表示缺陷图像的数据(图像名“Sample3.png”)为未知类别的信息、和按欧几里得距离从小到大顺序的4个图像。这4个图像彼此缺陷种类不同。

根据这些显示例，一并显示判定结果和与分类对象的图像相似的图像，因此不仅提示判定的结果，还提示成为该判定的根据的信息，能够使用户通过视觉获悉判定结果。需要说明的是，也可以仅显示相似的图像和欧几里得距离中的至少一方。另外，显示的图像不限于4个，只要为1个以上则可以任意地设定。

步骤S9后，评价值算出部7参照存储部9，将判定部6的判定次数与规定的基准次数进行比较(步骤S10)。在判定部6的判定次数不足基准次数的情况下(步骤10：否)，返回步骤S1的数据取得处理重复执行处理。在判定部6的判定次数达到了基准次数的情况下(步骤S10：是)，评价值算出部7算出判定评价值、即进行了基准次数的判定中判定为缺陷图像的数据属于多个类别中的某一类别的比例(步骤S11)。

在算出的判定评价值比规定的阈值小的情况下(步骤S12：是)，显示控制部81向显示装置输出并显示判定评价结果的信息，从而将判定评价结果报知给用户(步骤S13)。需要说明的是，显示控制部81也可以取代判定评价结果，或使显示装置显示催促进行学得模型的重构的信息，或使显示装置显示判定评价结果及催促进行学得模型的重构的信息。由此，用户能够认识到学得模型的精度不合适。

接着，控制部8重置存储部9所存储的判定次数、设为0(步骤S14)。之后，数据分类装置100结束一连串的处理。

步骤S12中，在算出的判定评价值为规定的阈值以上的情况下(步骤S12：否)，数据分类装置100向步骤S14转移，重置判定次数结束一连串的处理。

图6是对以上说明的实施方式的效果进行说明的图。具体而言，图6是分别示出下述的柱形图：(a)算出了已知类别的样本与已学习数据的各类别的欧几里得距离的最小值而得的结果、(b)算出了未知类别的样本与已学习数据的各类别的欧几里得距离的最小值而得的结果。这里，设为预先已判别样本所属的类别并制作了柱形图。图6中，示出了作为赋予用于对已知类别与未知类别进行辨别的界限的阈值，设定了2个阈值Th1、Th2的情况。

首先，对将阈值设为Th1的情况下、即阈值Th1以下的样本定义为已知类别的情况进行说明。该情况下，根据(a)已知类别的样本的一部分包含于未知类别，而根据(b)未知类别的样本不包含于已知类别。

接下来，对将阈值设为Th2的情况、即阈值Th2以下的样本定义为已知类别的情况进行说明。该情况下，根据(a)已知类别的样本全部包含于阈值以下，而根据(b)未知类别多包含于已知类别。

图7是示出图6所示的例子中变更了阈值的情况下的未知类别的检出率与已知类别的误检出率的变动的图。图7所示的曲线301是被称为接受者响应曲线(ROC：ReceiverOperating Characteristic)的曲线，曲线上的点P及点Q分别对应阈值Th1及Th2。在阈值Th1的情况下，检出率为100％，而误检出率不足10％。与此相对，在阈值Th2的情况下，检出率为15％左右，而误检出率为0％。已知，作为该曲线301与横轴之间的面积的AUC(AreaUnder ROC Curve)为0.9899，为相当接近可完全分离的情况(AUC＝1.00)的值。即，根据本实施方式，显然能够以高精度对已知类别与未知类别进行分离。

图8是对以上说明了的实施方式中、赋予用于对已知类别与未知类别进行辨别的界限的阈值的其他确定方法进行说明的图。图8(a)是示出算出了已知类别的样本与已学习数据的各类别的欧几里得距离的最小值而得的结果的柱形图、和该正态分布曲线C的图。该正态分布曲线C是假定柱形图为正态分布所画出的线。图8(b)是示出算出了未知类别的样本与已学习数据的各类别的欧几里得距离的最小值而得的结果的柱形图。图8中，与图6相同，设为预先已判别样本所属的类别并制作了柱形图。图8中，示出了作为赋予用于对已知类别与未知类别进行辨别的界限的阈值、设定了阈值Th3或Th4的情况。

在设定用于对已知类别与未知类别进行辨别的界限的阈值时，有时难以预先准备未知类别的样本。在这样的情况下，阈值根据已知类别的样本与已学习数据的各类别的欧几里得距离的最小值来设定。

首先，在示出算出了已知类别的样本与已学习数据的各类别的欧几里得距离的最小值而得的结果的柱形图中假定正态分布。接着，根据基于该正态分布的平均μ和标准偏差σ算出的可信区间来设定阈值。需要说明的是，所求的分布不限于正态分布，也可以使用半正态分布、泊松分布，或将考虑了多峰性的混合分布等假定为概率分布。

这里，对将阈值设为Th3(正态分布的66％可信区间：平均μ+1σ)的情况、即阈值Th3以下的样本定义为已知类别的情况进行说明。在该情况下，如图8(a)所示，已知类别的样本的一部分包含于未知类别，另一方面如图8(b)所示，未知类别的样本不包含于已知类别。

另外，对将阈值设为Th4(正态分布的99.9997可信区间：平均μ+6σ)的情况、即阈值Th4以下的样本定义为已知类别的情况进行说明。在该情况下，如图8(a)所示，已知类别的样本全部包含于阈值以下，另一方面如图8(b)所示，未知类别多包含于已知类别。

根据以上说明，在难以预先准备未知类别的样本的情况下，只要仅根据已知类别的样本来设定与运用用途相应的阈值即可。例如在想避免将已知类别的样本误判别为未知类别的样本的情况下，只要如阈值Th4那样进行设定即可。相反，在想避免将未知类别的样本误判别为已知类别的样本的情况下，只要如阈值Th3那样进行设定即可。阈值的设定不限定于上述，优选根据运用目的来设定阈值。

根据以上说明的本发明的一实施方式，算出取得的缺陷图像的数据与生成学得模型时所用的已学习数据的相似度，基于算出的相似度对缺陷图像的数据是否属于多个类别进行判定，在该数据不属于多个类别中的任何类别的情况下判定为属于未知类别，因此能够抑制将未知类别的数据分类成已知类别。

另外，根据本实施方式，使至少将与缺陷图像的数据最为相似的缺陷图像的数据和判定结果一并显示于显示装置，因此用户除了把握缺陷图像的数据属于已知类别和未知类别哪一方之外，还能够通过视觉把握该判定的根据。

另外，根据本实施方式，在判定次数达到了基准次数的情况下，算出判定评价值即进行了基准次数的判定中判定为缺陷图像的数据属于多个类别中的某一类的比例，在算出结果比阈值小时，输出评价结果或催促进行学得模型的重构的信息，因此在使用的学得模型并非有效的情况下能够迅速报知此事。关于这一点，在以往的薄膜制造过程中，若变更了缺陷检查机的光学系统或变更产品的制造条件，则通过此前使用的学得模型恐无法准确地进行分类。而且，在运用中对分类自身进行评价本身就困难。与此相对，本实施方式中，以规定的间隔对分类本身进行评价，因此在制造过程有变更的情况下，能够将学得模型的不适合准确地报知给用户。另外，步骤S2中实施对图像的前期处理，考虑到此处可能有误，还可以进行如下处理等：通过预先准备的未实施步骤S2的图像处理的图像进行分类；实施变更了预先准备的阈值、过滤器等的条件的其他图像处理方法、尝试再次步骤S3以后的分类。

至此，对用于实施本发明的方式进行了说明，但本发明不应仅受上述的一实施方式限定。例如、相似度算出部5也可以算出缺陷图像的数据的特征量与各类别的代表图像的数据的特征量之间的相似度。代表图像既可以是具有最接近各类别的特征量在特征空间中重心的特征量的图像，也可以是具有最接近各类别的特征量的平均的特征量的图像。

另外，本发明除薄膜制造时的缺陷判定以外、也可以适用于时间序列数据的异常检测(例如人的心率数据的心律失常检测)等。

产业上的利用可能性

本发明的数据分类装置、数据分类方法以及数据分类程序优选适用于抑制将未知类别的数据分类成已知类别，但适用范围不限于此。

附图标记说明

1 输入部

2 数据取得部

3 图像处理部

4 分类部

5 相似度判定部

6 判定部

7 评价值算出部

8 控制部

9 存储部

81 显示控制部

91 学得模型存储部

92 已学习数据存储部

100 数据分类装置

201、202 画面

301 曲线

Claims

1.数据分类装置，其具备：

数据取得部，其取得分类对象的数据；

分类部，其用使用神经网络进行学习而得的学得模型将所述数据分类成多个类别中的某一类；

相似度算出部，其算出所述数据与生成所述学得模型时所用的已学习数据的相似度；以及

判定部，其基于所述相似度对所述数据是否属于所述多个类别进行判定，在所述数据不属于所述多个类别中的任一类的情况下，判定为所述数据属于未知类别。

2.根据权利要求1所述的数据分类装置，其中，

所述学得模型中，将所述数据设为输入参数、将分类结果及所述数据的特征量设为输出参数。

3.根据权利要求1或2所述的数据分类装置，其中，

所述相似度算出部使用所述数据及所述已学习数据的特征量算出相似度，

所述判定部在所述相似度满足基准的情况下、按照所述分类部的分类结果判定所述数据所属的类别，在所述相似度不满足所述基准的情况下、判定为所述数据为未知类别。

4.根据权利要求1至3中任一项所述的数据分类装置，其中，

所述数据分类装置具备控制部，所述控制部至少使与所述数据最为相似的数据和所述判定部所作出的判定结果一并显示于显示装置。

5.根据权利要求1至4中任一项所述的数据分类装置，其中，所述数据分类装置具备：

评价值算出部，其在所述判定部的判定次数达到基准次数的情况下算出判定评价值，所述判定评价值为进行了所述基准次数的判定中判定为所述数据属于所述多个类别中的某一类的比例；和

控制部，其在所述判定评价值比阈值小时，输出评价结果和催促进行所述学得模型的重构的信息中的至少任一方。

6.根据权利要求1至5中任一项所述的数据分类装置，其中，

所述相似度算出部算出所述数据的特征量与所述已学习数据的特征量在特征空间中的欧几里得距离在各类别中的最小值，作为与各类别的相似度。

7.根据权利要求1至5中任一项所述的数据分类装置，其中，

所述相似度算出部算出所述数据的特征量与分别代表所述多个类别的所述已学习数据在特征空间中的规定距离，作为与各类别的相似度。

8.数据分类方法，其包括：

数据取得步骤，取得分类对象的数据；

分类步骤，从存储部读出使用神经网络进行学习而得的学得模型，使用所述学得模型将所述数据分类成多个类别的某一类；

相似度算出步骤，算出所述数据与生成所述学得模型时所用的已学习数据的相似度；和

判定步骤，基于所述相似度对所述数据是否属于所述多个类别进行判定，在所述数据不属于所述多个类别的任一类的情况下，判定为所述数据属于未知类别。

9.数据分类程序，其使计算机执行以下步骤：

数据取得步骤，取得分类对象的数据；

分类步骤，用使用神经网络进行学习而得的学得模型将所述数据分类成多个类别的某一类；