CN117011209A

CN117011209A - 用于可视化解释和稳健性验证的方法和装置

Info

Publication number: CN117011209A
Application number: CN202210438827.5A
Authority: CN
Inventors: 徐啸顺; 干徐淳; 朱烨添; 林立
Original assignee: SAIC General Motors Corp Ltd
Current assignee: Saic General Power Technology Shanghai Co ltd; SAIC General Motors Corp Ltd
Priority date: 2022-04-25
Filing date: 2022-04-25
Publication date: 2023-11-07

Abstract

本申请涉及一种用于可视化解释和稳健性验证的方法和装置，所述方法包括：处理步骤、推断步骤、分析步骤和评估步骤。所述处理步骤包括：对原图的多个区域分别进行掩膜处理，以获得多个图像样本。所述推断步骤包括：对所述多个图像样本进行推断，以获得得分结果，所述得分结果包括量化得分或置信度概率。所述分析步骤包括：分析所述多个区域对所述得分结果的影响程度，以得出显著性差异。所述评估步骤包括：至少根据所述显著性差异来评估关键特征区域并且确认推断过程的稳健性。本申请所提供的方案实现了对黑盒/白盒模型形式的机器视觉系统推断结果的可视化解释和稳健性验证。

Description

用于可视化解释和稳健性验证的方法和装置

技术领域

本发明涉及机器视觉领域，具体而言涉及用于机器视觉系统推断过程的可视化解释和稳健性验证。

背景技术

目前在工业场景中，许多常用的机器视觉系统为黑盒模型，即其内部原理完全封装不可知。典型的例子有深度学习图像分类模型、制造商拥有专利并封装的模板匹配算法等。这些黑盒模型的推断结果得分概率一致性不足、可解释性较差。用户既不能了解推断过程依赖的图像特征内容是什么，也不能根据得分的大小准确估算出模型或算法判断过程对待测目标可靠特征的掌握程度。另外，如果推断过程所依赖的图像特征出现过于细小、与实际经验理解不符、容易受环境干扰等情况，则可能会导致模型稳健性不足，少量合理的输入干扰就会带来大幅异常的结果变动。已有的机器学习可解释性解决方案往往需要拆解黑盒模型，了解内部结构设计、工作流程、参数细节等，但在工业场景中难以满足，且用于复杂黑盒模型的工作量极大。

发明内容

本申请提供了一种可用于机器视觉系统判断过程的可视化解释和稳健性验证的方法和装置，其既能够适用于黑盒模型形式的机器视觉系统，也可以应用于白盒模型形式的机器视觉系统。本申请的用于可视化解释和稳健性验证的方法和装置能够实现对各类工业机器视觉选型分类防错应用中的深度学习神经网络模型或模板匹配算法所关注的显著性区域的着重突出显示，并且能够提供用于计算可视化区域数据特性的量化指标，以验证模型或算法的推断稳健性。

根据本申请的第一方面，提供了一种用于可视化解释和稳健性验证的方法，所述方法包括：处理步骤、推断步骤、分析步骤和评估步骤。所述处理步骤包括：对原图的多个区域分别进行掩膜处理，以获得多个图像样本。所述推断步骤包括：对所述多个图像样本进行推断，以获得得分结果，所述得分结果包括量化得分或置信度概率。所述分析步骤包括：分析所述多个区域对所述得分结果的影响程度，以得出显著性差异。所述评估步骤包括：至少根据所述显著性差异来评估关键特征区域并且确认推断过程的稳健性。

根据本申请的第一方面的一个或多个实施例，可选地，所述分析步骤包括：使用算法操作将所述得分结果融合，计算得出特征显著性区域和显著性数值，并且将所述特征显著性区域和所述显著性数值可视化为显著性差异图，所述算法操作包括数据维度相关性分析和矩阵元素加权运算。

根据本申请的第一方面的一个或多个实施例，可选地，所述评估步骤包括：对所述显著性数值进行数据分布分析，二值化分割并加权叠加所述显著性差异图，以获得能够体现最关键特征区域的大小和边界的优势显著性图。

根据本申请的第一方面的一个或多个实施例，可选地，所述评估步骤包括：根据二值化分割的比例来计算最关键特征区域所占图像像素的比例，如果所述比例的大小合适，则判断所述推断过程稳健可靠，如果所述比例的大小不合适，则判断所述推断过程不合理。

根据本申请的第二方面，提供了一种用于可视化解释和稳健性验证的装置，所述装置包括：处理单元、推断单元、分析单元以及评估单元。所述处理单元配置成：对原图的多个区域分别进行掩膜处理，以获得多个图像样本。所述推断单元配置成：对所述多个图像样本进行推断，以获得得分结果，所述得分结果包括量化得分或置信度概率。所述分析单元配置成：分析所述多个区域对所述得分结果的影响程度，以得出显著性差异。所述评估单元配置成：至少根据所述显著性差异来评估关键特征区域并且确认推断过程的稳健性。

根据本申请的第二方面的一个或多个实施例，可选地，所述分析步骤单元进一步配置成：使用算法操作将所述得分结果融合，计算得出特征显著性区域和显著性数值，并且将所述特征显著性区域和所述显著性数值可视化为显著性差异图，所述算法操作包括数据维度相关性分析和矩阵元素加权运算。

根据本申请的第二方面的一个或多个实施例，可选地，所述评估单元进一步配置成：对所述显著性数值进行数据分布分析，二值化分割并加权叠加所述显著性差异图，以获得能够体现最关键特征区域的大小和边界的优势显著性图。

根据本申请的第二方面的一个或多个实施例，可选地，所述评估单元进一步配置成：根据二值化分割的比例来计算最关键特征区域所占图像像素的比例，如果所述比例的大小合适，则判断所述推断过程稳健可靠，如果所述比例的大小不合适，则判断所述推断过程不合理。

根据本申请的第三方面，提供了一种计算机存储介质，所述计算机存储介质包括指令，所述指令在运行时执行如本申请第一方面所述的方法。

根据本申请的第四方面，提供了一种机器视觉系统，所述机器视觉系统包括如本申请第一方面所述的装置。

本申请的用于可视化解释和稳健性验证的方法和装置在可视化解释的基础上，进一步提供了量化计算指标，可作为精确评估视觉系统稳健性的依据。

附图说明

从结合附图的以下详细说明中，将会使本发明的上述和其他目的及优点更加完整清楚，其中，相同或相似的要素采用相同的标号表示。

图1示出了本申请一个实施例的用于可视化解释和稳健性验证的方法的示意图；

图2示出了本申请一个实施例的用于可视化解释和稳健性验证的装置的示意图。

具体实施方式

以下将结合附图对本申请涉及的用于可视化解释和稳健性验证的方法和装置作进一步的详细描述。需要注意的是，以下的具体实施方式是示例性而非限制的，其旨在提供对本申请的基本了解，并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。

下文参考本申请实施例的方法和装置的框图说明、框图和/或流程图来描述本申请。将理解这些流程图说明和/或框图的每个框、以及流程图说明和/或框图的组合可以由计算机程序指令来实现。可以将这些计算机程序指令提供给通用计算机、专用计算机或其它可编程数据处理设备的处理器以构成机器，以便由计算机或其它可编程数据处理设备的处理器执行的这些指令创建用于实施这些流程图和/或框和/或一个或多个流程框图中指定的功能/操作的部件。

可以将这些计算机程序指令存储在计算机可读存储器中，这些指令可以指示计算机或其它可编程处理器以特定方式实现功能，以便存储在计算机可读存储器中的这些指令构成包含实施流程图和/或框图的一个或多个框中指定的功能/操作的指令部件的制作产品。

可以将这些计算机程序指令加载到计算机或其它可编程数据处理器上以使一系列的操作步骤在计算机或其它可编程处理器上执行，以便构成计算机实现的进程，以使计算机或其它可编程数据处理器上执行的这些指令提供用于实施此流程图和/或框图的一个或多个框中指定的功能或操作的步骤。还应该注意在一些备选实现中，框中所示的功能/操作可以不按流程图所示的次序来发生。例如，依次示出的两个框实际可以基本同时地执行或这些框有时可以按逆序执行，具体取决于所涉及的功能/操作。

下面，将结合图1来说明根据本申请的一个实施方式的用于机器视觉系统推断过程的可视化解释和稳健性验证的方法100。

图1是本申请一个实施例的用于可视化解释和稳健性验证的方法100的示意图。在本申请的实施例中，可视化解释和稳健性验证的方法100适用于机器视觉系统的推断过程，通过突出显示算法所关注的显著性区域以及量化最关键特征区域所占图像像素的比例来评估机器视觉系统的推断过程的稳健性。如图1中所示，可视化解释和稳健性验证的方法100包括处理步骤110、推断步骤120、分析步骤130和评估步骤140。

处理步骤110可以对机器视觉系统所获取的原图的多个区域分别进行掩膜处理，以获得多个图像样本。在本实施例中，掩膜处理为针对原图的随机掩膜干扰。处理步骤110通过采用多种特定的算法来对少量原图中随机选取的不同区域加入多种干扰掩膜处理，从而可以获得足够多的图像样本。其中，所获得的图像样本大体相似，但受干扰掩膜的区域的不同而有所不同。

推断步骤120包括：记录干扰掩膜区域的信息，结合有待评估的深度学习神经网络模型或传统模板匹配算法对经掩膜干扰而获得的多个图像样本进行批量推断或匹配，以获得大量有差异的得分结果。其中，所获得的得分结果可以包括量化得分或置信度概率的结果。

分析步骤130包括：采用数据维度相关性分析和矩阵元素加权运算等算法操作来分析各个受掩膜干扰的区域对得分结果的不同影响程度，并且将关于不同影响程度的信息相融合，以得出模型或算法对原输入图像的未加掩膜特征区域的显著性差异。其中，显著性差异包括显著性区域和显著性数值。可选地，分析步骤130还包括：将所得到的特征显著性区域和显著性数值可视化为显著性差异图。其中，将特征显著性区域和显著性数值可视化为显著性差异图的方式包括：以热力图、等高线图、等值线图等方式来将可视化和量化的特征显著性区域和显著性数值叠加到机器视觉系统所获取的原图上。

评估步骤140包括：对显著性差异的标量数据进行数据分布分析，根据特定公式计算得到显著性二值化阈值，采用设定的二值化阈值对显著性差异图进行二值化分割，并且对采用热力图等方式可视化显示的显著性差异图进行加权叠加，对显著性数值加权运算，从而获得优势显著性图。所述优势显著性图可以结合热力图、等高线图等形式将显著性数据可视化和量化地体现关键显著性区域相对次要、无关特征的优势，从而能够体现最关键显著性区域的大小和边界。评估步骤140可以根据优势显著性图来评估理解算法所真正关注的关键特征区域，并且结合特征区域的量化指标和参考原有的得分结果来确认模型或算法推断过程的正确性、合理性和稳健性。

可选地，评估步骤140还包括：根据二值化分割的比例来量化计算最关键特征区域所占图像像素的比例，如果所述比例的大小合适，则判断模型对此图的推断过程稳健可靠，如果所述比例的大小不合适，则判断模型对此图的推断过程易受干扰，因而使推断结果不合理。

在一些实施例中，用于判断推断过程稳健可靠所对应的最关键特征区域占图像像素的比例范围为0.1%至1%。例如，当最关键特征区域占图像像素的比例范围为0.59%时，可以判断出机器视觉系统的推断过程稳健可靠。在一些实施例中，用于判断推断过程不合理所对应的最关键特征区域占图像像素的比例范围为小于0.1%。例如，当最关键特征区域占图像像素的比例范围为0.049%时，即可以判断出机器视觉系统的推断过程不合理。在其它实施例中，可以选取其它的范围来作为判断推断过程稳健可靠所对应的区间范围或者推断过程不合理所对应的区间范围。

接下来，将结合图2来说明根据本申请的一个实施方式的用于可视化解释和稳健性验证的装置200。

图2是本申请一个实施例的用于可视化解释和稳健性验证的装置200的示意图。用于可视化解释和稳健性验证的装置200可以设置在机器视觉系统中，以用于可视化解释以及评估机器视觉系统的推断过程的正确性、合理性和稳健性。如图2中所示，用于可视化解释和稳健性验证的装置200包括处理单元210、推断单元220、分析单元230和评估单元240。

处理单元210配置成可以执行如上文所描述的处理步骤110，包括对机器视觉系统所获取的原图的多个区域分别进行掩膜处理，以获得多个图像样本。

推断单元220配置成可以执行如上文所描述的推断步骤120，包括对经掩膜干扰而获得的多个图像样本进行批量推断或匹配，以获得量化得分或置信度概率的结果。

分析单元230配置成可以执行如上文所描述的分析步骤130，包括采用算法操作来分析各个受掩膜干扰的区域对得分结果的不同影响程度，并且将关于不同影响程度的信息相融合，以得出显著性区域和显著性数值。其中，显著性区域和显著性数值可以可视化为显著性差异图。

评估单元240配置成可以执行如上文所描述的评估步骤140，包括采用设定的二值化阈值对显著性差异图进行二值化分割并且对显著性差异图进行加权叠加，从而将显著性数据可视化和量化地体现优势显著性区域相对次要、无关特征的优势，以评估时最关键特征的区域，并利用优势显著性区域参考评估推断过程的稳健性。

根据本申请的另一方面，提供一种计算机可读存储介质，其中存储有指令，当所述指令由处理器执行时，使得所述处理器执行如上文所述的任意一种方法。本申请中所称的计算机可读介质包括各种类型的计算机存储介质，可以是通用或专用计算机能够存取的任何可用介质。举例而言，计算机可读介质可以包括RAM、ROM、EPROM、E2PROM、寄存器、硬盘、可移动盘、CD-ROM或其他光盘存储器、磁盘存储器或其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码单元并能够由通用或专用计算机、或者通用或专用处理器进行存取的任何其他临时性或者非临时性介质。如本文所使用的盘通常磁性地复制数据，而碟则用激光来光学地复制数据。上述的组合也应当包括在计算机可读介质的保护范围之内。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读写信息。在替换方案中，存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中，处理器和存储介质可作为分立组件驻留在用户终端中。

本申请实现了对黑盒/白盒模型形式（即算法封装/可调）的机器视觉系统推断结果的可视化解释和稳健性验证。并且本文在可视化解释的基础上，进一步提供了量化计算指标，可作为精确评估视觉系统稳健性的依据，方案整体实施成本低速度快，易于理解和推广实施。

尽管只对其中一些本发明的实施方式进行了描述，但是本领域普通技术人员应当了解，本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此，所展示的例子与实施方式被视为示意性的而非限制性的，在不脱离如所附各权利要求所定义的本发明精神及范围的情况下，本发明可能涵盖各种的修改与替换。

Claims

1.一种用于可视化解释和稳健性验证的方法，其特征在于，所述方法包括：

处理步骤，所述处理步骤包括：对原图的多个区域分别进行掩膜处理，以获得多个图像样本；

推断步骤，所述推断步骤包括：对所述多个图像样本进行推断，以获得得分结果，所述得分结果包括量化得分或置信度概率；

分析步骤，所述分析步骤包括：分析所述多个区域对所述得分结果的影响程度，以得出显著性差异；以及

评估步骤，所述评估步骤包括：至少根据所述显著性差异来评估关键特征区域并且确认推断过程的稳健性。

2.根据权利要求1所述的方法，其特征在于，所述分析步骤包括：使用算法操作将所述得分结果融合，计算得出特征显著性区域和显著性数值，并且将所述特征显著性区域和所述显著性数值可视化为显著性差异图，所述算法操作包括数据维度相关性分析和矩阵元素加权运算。

3.根据权利要求2所述的方法，其特征在于，所述评估步骤包括：对所述显著性数值进行数据分布分析，二值化分割并加权叠加所述显著性差异图，以获得能够体现最关键特征区域的大小和边界的优势显著性图。

4.根据权利要求3所述的方法，其特征在于，所述评估步骤包括：根据二值化分割的比例来计算最关键特征区域所占图像像素的比例，如果所述比例的大小合适，则判断所述推断过程稳健可靠，如果所述比例的大小不合适，则判断所述推断过程不合理。

5.一种用于可视化解释和稳健性验证的装置，其特征在于，所述装置包括：

处理单元，所述处理单元配置成：对原图的多个区域分别进行掩膜处理，以获得多个图像样本；

推断单元，所述推断单元配置成：对所述多个图像样本进行推断，以获得得分结果，所述得分结果包括量化得分或置信度概率；

分析单元，所述分析单元配置成：分析所述多个区域对所述得分结果的影响程度，以得出显著性差异；以及

评估单元，所述评估单元配置成：至少根据所述显著性差异来评估关键特征区域并且确认推断过程的稳健性。

6.根据权利要求5所述的装置，其特征在于，所述分析步骤单元进一步配置成：使用算法操作将所述得分结果融合，计算得出特征显著性区域和显著性数值，并且将所述特征显著性区域和所述显著性数值可视化为显著性差异图，所述算法操作包括数据维度相关性分析和矩阵元素加权运算。

7.根据权利要求6所述的装置，其特征在于，所述评估单元进一步配置成：对所述显著性数值进行数据分布分析，二值化分割并加权叠加所述显著性差异图，以获得能够体现最关键特征区域的大小和边界的优势显著性图。

8.根据权利要求7所述的装置，其特征在于，所述评估单元进一步配置成：根据二值化分割的比例来计算最关键特征区域所占图像像素的比例，如果所述比例的大小合适，则判断所述推断过程稳健可靠，如果所述比例的大小不合适，则判断所述推断过程不合理。

9.一种计算机存储介质，其特征在于，所述计算机存储介质包括指令，所述指令在运行时执行如权利要求1至4中任一项所述的方法。

10.一种机器视觉系统，其特征在于，所述机器视觉系统包括如权利要求5至8中任一项所述的装置。