CN113033561B

CN113033561B - 影像分析装置与影像分析方法

Info

Publication number: CN113033561B
Application number: CN201911257650.3A
Authority: CN
Inventors: 黄茂杞; 何智祥
Original assignee: Institute for Information Industry
Current assignee: Institute for Information Industry
Priority date: 2019-12-09
Filing date: 2019-12-10
Publication date: 2023-07-07
Anticipated expiration: 2039-12-10
Also published as: CN113033561A; US20210174126A1; US11164034B2; TW202123170A; TWI741437B

Abstract

一种影像分析装置与影像分析方法被公开。该影像分析装置分别正规化第一影像与第二影像，以产生第一校正后影像与第二校正后影像，该第一校正后影像中的第一货柜门与该第二校正后影像中的第二货柜门的尺寸相同且像素座标相同。该影像分析装置以相同的方式，分割该第一校正后影像为多个第一区块，且分割该第二校正后影像为多个第二区块。该影像分析装置计算各该第一区块与相对应的第二区块之间的相关性，各该多个相关性包含灰度相关性与至少一彩色相关性。该影像分析装置基于该多个相关性，判断该第一与该第二货柜门是否代表同一个货柜门。

Description

影像分析装置与影像分析方法

【技术领域】

本发明的实施例是关于一种影像分析装置与影像分析方法。更具体而言，本发明的实施例是关于一种通过影像分析判断二影像中的二个货柜门是否代表同一个货柜门的影像分析装置与影像分析方法。

【背景技术】

为了判断入站货柜(运送后的货柜)是否与出站货柜(运送前的货柜)是同一个货柜，现有的做法大多是由入站的检验人员人工地比对出站货柜的货柜门影像和入站货柜的货柜门外观。然而，普遍来说，这样的人工检验的效率与精确性并不理想。在少数情况下，有可能会通过普通电脑来取代所述人工检验的某些动作，但这样的普通电脑并不具有单独检验货柜的能力，故整体上的效率和精确性仍不佳。因此，如何改善现有的货柜检验的效率与精确性，将是本发明所属技术领域中亟待解决的问题。

【发明内容】

为了解决至少上述的问题，本发明的实施例提供了一种影像分析装置，其可包含互相电性连接的一存储器与一处理器。该存储器可用以存储一第一影像与一第二影像，该第一影像包含一第一货柜门，该第二影像包含一第二货柜门。该处理器可用以：分别正规化该第一影像与该第二影像，以产生一第一校正后影像与一第二校正后影像，该第一校正后影像中的该第一货柜门与该第二校正后影像中的该第二货柜门的尺寸相同且像素座标相同；以相同的方式，分割该第一校正后影像为多个第一区块，且分割该第二校正后影像为多个第二区块；计算各该第一区块与相对应的第二区块之间的一相关性，各该多个相关性包含一灰度相关性与至少一彩色相关性；以及基于该多个相关性，判断该第一货柜门与该第二货柜门是否代表同一个货柜门。

为了解决至少上述的问题，本发明的实施例还提供了一种由一影像分析装置执行的影像分析方法，其可包含以下步骤：分别正规化一第一影像与一第二影像，以产生一第一校正后影像与一第二校正后影像，该第一校正后影像中的该第一货柜门与该第二校正后影像中的该第二货柜门的尺寸相同且像素座标相同；以相同的方式，分割该第一校正后影像为多个第一区块，且分割该第二校正后影像为多个第二区块；计算各该第一区块与相对应的第二区块之间的一相关性，各该多个相关性包含一灰度相关性与至少一彩色相关性；以及基于该多个相关性，判断该第一货柜门与该第二货柜门是否代表同一个货柜门。

在本发明的实施例中，借由针对第一影像与第二影像的正规化处理，能够在相同比较基础下自动化地比较第一校正后影像和第二校正后影像并直接根据比较的结果来判断入站货柜是否与出站货柜代表同一个货柜。因此，本发明的实施例能够提供较高的检验效率。另一方面，在比对第一校正后影像与一第二校正后影像的过程中，不需要计算这二个影像之间的差异，而是分别计算同一位置的二个相对应区块(第一区块和第二区块)之间的相关性，故可以增强这二个影像之间的局部差异。除此之外，因针对同一位置的二个相对应区块所计算的相关性包含了灰度相关性与彩色相关性，故能更反映出更多面向的特征(例如图案、形状、颜色等)差异。因此，本发明的实施例也能够提供较高的检验精确性。

以上内容并非为了限制本发明，而只是概括地叙述了本发明可解决的技术问题、可采用的技术手段以及可达到的技术功效，以让本领域技术人员初步地了解本发明。根据检附的附图及以下的实施方式所记载的内容，本领域技术人员便可进一步了解本发明的各种实施例的细节。

【附图说明】

检附的附图可辅助说明本发明的各种实施例，其中：

图1例示了根据本发明的某些实施例的影像分析装置；

图2A-2B例示了图1所示的影像分析装置如何分析影像；

图3是根据本发明的某些实施例的相关性计算的示意图；以及

图4例示了根据本发明的某些实施例的影像分析方法。

【符号说明】

如下所示：

1…影像分析装置

11…处理器

13…存储器

IM1…第一影像

IM2…第二影像

D1…第一货柜门

D2…第二货柜门

ED1…第一货柜门的边缘

ED2…第二货柜门的边缘

RIM1…第一校正后影像

RIM2…第二校正后影像

x…x轴

y…y轴

B1、B11、B12…第一区块

B2、B21、B22…第二区块

R3、R31、R32…相关性

4…影像分析方法

41、43、45、47…步骤

【具体实施方式】

以下将通过多个实施例来说明本发明，惟该多个实施例并非用以限制本发明只能根据所述操作、环境、应用、结构、流程或步骤来实施。为了易于说明，与本发明的实施例无直接关联的内容或是不需特别说明也能理解的内容，将于本文以及附图中省略。于附图中，各元件(element)的尺寸以及各元件之间的比例仅是范例，而非用以限制本发明。除了特别说明之外，在以下内容中，相同(或相近)的元件符号可对应至相同(或相近)的元件。在可被实现的情况下，如未特别说明，以下所述的每一个元件的数量可以是一个或多个。

本公开使用的用语仅用于描述实施例，并不意图限制本发明。除非上下文另有明确说明，否则单数形式「一」也旨在包括多个形式。「包括」、「包含」等用语指示所述特征、整数、步骤、操作、元素及/或元件的存在，但并不排除一或多个其他特征、整数、步骤、操作、元素、元件及/或前述的组合的存在。用语「及/或」包含一或多个相关所列项目的任何及所有的组合。

图1例示了根据本发明的某些实施例的影像分析装置。图1所示内容仅是为了举例说明本发明的实施例，而非为了限制本发明。

参照图1，影像分析装置1可基本上包含互相电性连接(直接或间接连接)的处理器11与存储器13。影像分析装置1可以是例如但不限于：服务器、笔记型电脑、平板电脑、桌上型电脑、移动装置等。

处理器11可以是各种具备信号处理功能的微处理器(microprocessor)或微控制器(microcontroller)。微处理器或微控制器是一种可程序化的特殊集成电路，其具有运算、存储、输出/输入等能力，且可接受并处理各种编码指令，借以进行各种逻辑运算与算术运算，并输出相应的运算结果。举例而言，如后所述，处理器11可用以根据存储于存储器13的二个影像，分别产生二个校正后影像，并以相同的方式分割该二个校正后影像。在分割该二个校正后影像后，处理器11还可以计算相应的二个区块之间的相关性，并根据所有的区块相关性判断此二个影像中出现的第一货柜门与第二货柜门是否代表同一个货柜门。

存储器13可包含第一级存储装置(又称主存储器或内部存储器)，通常简称为存储器，其与处理器11直接连接。处理器11可读取存储在存储器内的指令集，并在需要时执行该多个指令集。存储器13还可包含第二级存储装置(又称外部存储器或辅助存储器)，其通过存储器的I/O通道来与处理器11连接，并使用数据缓冲器来将数据传输至第一级存储装置。第二级存储器可例如是各种类型的硬盘、光盘等。存储器13亦可包含第三级存储装置，例如可直接插入或自电脑拔除的随身碟、或是云端硬盘。存储器13可存储影像分析装置1本身产生的数据以及输入至影像分析装置1的各种数据。举例而言，如后所述，存储器13可用以存储多个影像，该多个影像包含第一影像IM1与第二影像IM2。

在某些实施例中，除了处理器11与存储器13，影像分析装置1还可以包含输入单元、输出单元、及/或网络单元等等。输入单元用以提供各种输入接口(例如：文字、声音、及/或影像输入接口)，以使影像分析装置1从外部装置(例如：鼠标、键盘、麦克风、触控屏幕)接收数据或指令。输出单元用以提供各种输出接口(例如：文字、声音、及/或影像输出接口)，以使影像分析装置1输出数据或指令到外部装置(例如：喇叭、显示器、触控屏幕)。网络单元用以提供各种网络接口(例如：有线网络接口及/或无线网络接口)，以使影像分析装置1通过各种网络(例如：无线移动网络、光纤网络、Wi-Fi网络等)与其他网络装置连接。

图2A-2B例示了根据某些实施例图1所示的影像分析装置进行影像分析的流程，而图3是根据本发明的某些实施例的相关性计算的示意图。图2A-2B、3所示内容仅是为了举例说明本发明的实施例，而非为了限制本发明。举例而言，在图2A-2B中，第一货柜门D1和第二货柜门D2的图案只是作为例示，而非限制。另外，呈现在图2B中的相关性的数值只是例示，而非限制。

参照图2A，首先，处理器11可先从存储器13撷取出第一影像IM1与第二影像IM2，其中第一影像IM1包含第一货柜门D1，且第二影像IM2包含第二货柜门D2。在第一影像IM1的座标系统的第一货柜门D1与第二影像IM2的第二货柜门D2的尺寸与像素座标不相同时，处理器11可分别正规化存储器13所存储的第一影像IM1与第二影像IM2，以产生一第一校正后影像RIM1与一第二校正后影像RIM2，且使第一校正后影像RIM1中的第一货柜门D1与第二校正后影像RIM2的第二货柜门D2的尺寸相同且对应的像素座标相同。另外，可使用二维座标(x轴与y轴)系统来定义与表示第一校正后影像RIM1与第二校正后影像RIM2。

在某些实施例中，处理器11可从第一影像IM1中辨识出该第一货柜门D1的边缘ED1，然后根据该第一货柜门D1的该边缘ED1的位置正规化该第一影像IM1。相似地，处理器11可从第二影像IM2中辨识出该第二货柜门D2的边缘ED2，且根据该第二货柜门D2的该边缘ED2的位置正规化该第二影像IM2。

以下有关处理器11正规化第一影像IM1与第二影像IM2的过程，将以第一影像IM1为例来说明，而在理解处理器11如何正规化第一影像IM1之后，本领域技术人员将能够了解处理器11如何正规化第二影像IM2。

举例而言，处理器11可以通过索伯运算子(Sobel operator)分别计算出第一影像IM1中第一货柜门D1的边缘ED1以及第二影像IM2中第二货柜门D2的边缘ED2。详言之，处理器11可以通过处理器11可使用x轴方向的核函数(X-Direction Kernel)与y轴方向的核函数(Y-Direction Kernel)以分别在第一影像IM1上进行卷积运算，并根据运算结果检测出第一影像IM1中货柜门的边缘ED1。以相同的方法，处理器11可检测出第二影像IM2中第二货柜门D2的边缘ED2。举例而言，x轴方向的核函数与y轴方向的核函数可表示如下：

根据边缘ED1与边缘ED2，处理器11可分别从第一影像IM1与第二影像IM2中辨识出第一货柜门D1与第二货柜门D2。在检测出第一影像IM1中第一货柜门D1的边缘ED1之后，处理器11可根据第一货柜门D1的转角的座标正规化第一影像IM1，以产生第一校正后影像RIM1。同样地，在检测出第二影像IM2中第二货柜门D2的边缘ED2之后，处理器11可根据第二货柜门D2的转角的座标正规化第二影像IM2，以产生第二校正后影像RIM2。举例而言，处理器11可以根据以下线性转换式来计算出第一校正后影像RIM1与第二校正后影像RIM2：

在式一中，(x，y)是指第一影像IM1/第二影像IM2的像素的原始座标，而(T_x(x，y)，T_y((x，y))则是指第一影像IM1/第二影像IM2被正规化后相同像素的新座标。处理器11可根据第一影像IM1中第一货柜门D1中的多个像素(例如，在边缘ED1上的多个像素)的原始座标(x，y)，以及其被转换为第一校正后影像RIM1后的对应的多个预设像素的座标(T_x(x，y)，T_y((x，y))，计算出该式一中的系数c₁、c₂、c₃、c₄、c₅、c₆、c₇、c₈，以建立第一影像IM1转换为第一校正后影像RIM1的一座标转换规则。须说明，在上述示例中，式一中系数的数量为八个，故处理器11将需要根据第一影像IM1中的至少八个像素以及第一校正后影像RIM1中的对应的八个预设像素的座标，始能建立该座标转换规则。同理，处理器11可以根据类似操作，以建立第二影像IM2转换为第二校正后影像RIM2的一座标转换规则。然后，处理器11可根据上述座标转换规则，分别正规化第一影像IM1与第二影像IM2，以产生第一校正后影像RIM1与第二校正后影像RIM2。

第一校正后影像RIM1中的第一货柜门D1与第二校正后影像RIM2中的第二货柜门D2的尺寸相同且像素座标相同。换言之，第一校正后影像RIM1中的第一货柜门D1与第二校正后影像RIM2中的第二货柜门D2的像素数量相同，且第一校正后影像RIM1中的第一货柜门D1的每一个像素的座标分别与第二校正后影像RIM2中的第二货柜门D2的每一个像素的座标彼此完全对应。

在产生第一校正后影像RIM1与第二校正后影像RIM2之后，处理器11以相同的方式，分割第一校正后影像RIM1为多个第一区块B1，且分割第二校正后影像RIM2为多个第二区块B2。详言之，如图2A所示，处理器11分别将第一校正后影像RIM1与第二校正后影像RIM2分割成数量相同的第一区块B1与第二区块B2，且对应的第一区块B1与第二区块B2的尺寸也相同。区块的数量可以根据不同的需求而调整，并不以图2A-2B中所示内容为限。

在分别分割第一校正后影像RIM1与第二校正后影像RIM2后，处理器11可计算各第一区块B1与对应的第二区块B2之间的相关性，各该多个相关性可单纯包含灰度相关性，也可以包含灰度相关性与至少一彩色相关性。

在某些实施例中，处理器11可以根据以下函式来计算第一校正后影像RIM1的各第一区块B1与相对应的第二校正后影像RIM2的第二区块B2之间的相关性：

以图3为例，第一区块B1与第二区块B2的尺寸皆为k×j，f(s，t)表示为第一校正后影像RIM1中第一区块B1中的像素，

是第一区块B1的所有像素的平均值，w(s，t)表示为相对应的第二校正后影像RIM2中第二区块B2中的像素，/>

是第二区块B2的所有像素的平均值。根据式二，处理器11便可计算各第一区块B1和相对应的第二区块B2之间的相关性。

在某些实施例中，第一校正后影像RIM1与第二校正后影像RIM2中的像素可以仅以灰度参数来表示，或者以灰度参数和色彩参数来表示。举例而言，可以使用YCbCr色彩空间来表示第一校正后影像RIM1与第二校正后影像RIM2中的像素，其中「Y」、「Cb」和「Cr」分别为流明(luminance)、蓝色浓度偏移量和红色浓度偏移量。「Y」可代表像素的灰度值，而「Cb」值或「Cr」值则可代表像素的色彩值。

在使用YCbCr色彩空间表示第一校正后影像RIM1与第二校正后影像RIM2中的像素的情况下，处理器11针对每一个第一区块B1以及相对应的第二区块B2所计算的相关性也就属于YCbCr色彩空间。举例而言，在分别以「Y」、「Cb」和「Cr」来表示第一区块B1与对应的第二区块B2的像素的情况下，处理器11可分别计算出与「Y」相关的灰度相关性、以及与「Cb」和「Cr」相关的二个色彩相关性，然后根据此三个相关性，决定第一区块B1与对应的第二区块B2之间的最终相关性。在此范例中，处理器11可以从此三个相关性中选择最小的一个作为第一区块B1与对应的第二区块B2之间的最终相关性。或者，处理器11可以将此三个相关性的平均值作为第一区块B1与对应的第二区块B2之间的最终相关性。

在某些实施例中，也可以使用RGB色彩空间或HSI色彩空间来表示第一校正后影像RIM1与第二校正后影像RIM2中的像素，并在此情况下计算各第一区块B1与对应的第二区块B2之间的相关性。

接着参照图2B，根据上述，处理器11可以计算各第一区块B1与对应的第二区块B2之间的相关性R3。举例而言，处理器11可以计算第一区块B11与对应的第二区块B21之间的相关性R31，且计算第一区块B12与对应的第二区块B22之间的相关性R32，以此类推。每一个相关性R3可以是介于「0」与「1」之间的数值，且数值越高代表两个区块之间的相关性越高(相似度越高)；反之，则代表两个区块之间越不相关(相似度越低)。举例而言，因第一区块B11与第二区块B21的内容相当近似，故相关性R31达到「0.91」，而因第一区块B12与第二区块B22的内容不同(具有不同的形状的图案)，故相关性R32仅有「0.23」。

在计算出所有第一区块B1与对应的第二区块B2之间的相关性R3之后，处理器11可基于该多个相关性R3，判断第一货柜门D1与第二货柜门D2是否代表同一个货柜门。在某些实施例中，处理器11可针对各该多个第一区块B1设定一相关性门槛值，且借由分别比较该多个相关性R3与该多个相关性门槛值来判断该第一货柜门D1与该第二货柜门D2是否代表同一个货柜门。根据不同的应用，该多个相关性门槛值可以相同也可以不同。举例而言，处理器11可以为所有第一区块B1设定一个相同的相关性门槛值，若每一个相关性R3皆大于该相关性门槛值，则判定该第一货柜门D1与第二货柜门D2代表同一个货柜门；而若任一个相关性R3小于该相关性门槛值，则判定该第一货柜门D1与第二货柜门D2不代表同一个货柜门。又举例而言，处理器11可根据每一个第一区块B1的重要性(权重)设定不同的相关性门槛值，若每一个相关性R3皆大于相对应的相关性门槛值，则判定该第一货柜门D1与第二货柜门D2代表同一个货柜门；而若任一个相关性R3小于相对应的相关性门槛值，则判定该第一货柜门D1与第二货柜门D2不代表同一个货柜门。

图4例示了根据本发明的某些实施例的影像分析方法。图4所示内容仅是为了举例说明本发明的实施例，而非为了限制本发明。

参照图4，一种由一影像分析装置执行的影像分析方法4可包含以下步骤：分别正规化一第一影像与一第二影像，以产生一第一校正后影像与一第二校正后影像，该第一校正后影像中的一第一货柜门与该第二校正后影像中的一第二货柜门的尺寸相同且像素座标相同(标示为步骤41)；以相同的方式，分割该第一校正后影像为多个第一区块，且分割该第二校正后影像为多个第二区块(标示为步骤43)；计算各该第一区块与相对应的第二区块之间的一相关性，各该多个相关性包含一灰度相关性与至少一彩色相关性(标示为步骤45)；以及基于该多个相关性，判断该第一货柜门与该第二货柜门是否代表同一个货柜门(标示为步骤47)。

图4所示的步骤顺序并非限制，且在仍可以实施影像分析方法4的情况下，该步骤顺序可以被调整。

在某些实施例中，步骤47还可包含以下步骤：针对各该多个第一区块设定一相关性门槛值，且借由分别比较该多个相关性与该多个相关性门槛值来判断该第一货柜门与该第二货柜门是否代表同一个货柜门。

在某些实施例中，上述各该多个相关性可以属于YCbCr色彩空间。

在某些实施例中，步骤41还可包含以下步骤：从第一影像中辨识出该第一货柜门的边缘，且根据该第一货柜门的该边缘正规化该第一影像；以及从第二影像中辨识出该第二货柜门的边缘，且根据该第二货柜门的该边缘正规化该第二影像。

影像分析方法4的每一个实施例本质上都会与影像分析装置1的某一个实施例相对应。因此，即使上文漏未针对影像分析方法4的每一个实施例进行详述，本领域技术人员仍可根据上文针对影像分析装置1的说明而直接了解影像分析方法4的未详述的实施例。

上述实施例只是举例来说明本发明，而非为了限制本发明。任何针对上述实施例进行修饰、改变、调整、整合而产生的其他实施例，只要是本领域技术人员不难思及的，都涵盖在本发明的保护范围内。本发明的保护范围以权利要求为准。

Claims

1.一种影像分析装置，其特征在于，包含：

一存储器，用以存储一第一影像与一第二影像，该第一影像包含一第一货柜门，该第二影像包含一第二货柜门；以及

一处理器，与该存储器电性连接，且用以：

分别正规化该第一影像与该第二影像，以产生一第一校正后影像与一第二校正后影像，该第一校正后影像中的该第一货柜门与该第二校正后影像中的该第二货柜门的尺寸相同且像素座标相同；

以相同的方式，分割该第一校正后影像为多个第一区块，且分割该第二校正后影像为多个第二区块；

计算各该第一区块与相对应的第二区块之间的一相关性，各该多个相关性包含一灰度相关性与至少一彩色相关性；以及

基于该多个相关性，判断该第一货柜门与该第二货柜门是否代表同一个货柜门。

2.如权利要求1所述的影像分析装置，其特征在于，该处理器还针对各该多个第一区块设定一相关性门槛值，且借由分别比较该多个相关性与该多个相关性门槛值来判断该第一货柜门与该第二货柜门是否代表同一个货柜门。

3.如权利要求1所述的影像分析装置，其特征在于，各该多个相关性属于YCbCr色彩空间。

4.如权利要求1所述的影像分析装置，其特征在于，该处理器还用以：

从第一影像中辨识出该第一货柜门的边缘，且根据该第一货柜门的该边缘正规化该第一影像；以及

从第二影像中辨识出该第二货柜门的边缘，且根据该第二货柜门的该边缘正规化该第二影像。

5.一种由一影像分析装置执行的影像分析方法，其特征在于，包含：

分别正规化一第一影像与一第二影像，以产生一第一校正后影像与一第二校正后影像，该第一校正后影像中的一第一货柜门与该第二校正后影像中的一第二货柜门的尺寸相同且像素座标相同；

6.如权利要求5所述的影像分析方法，其特征在于，判断该第一货柜门与该第二货柜门是否代表同一个货柜门的该步骤还包含：针对各该多个第一区块设定一相关性门槛值，且借由分别比较该多个相关性与该多个相关性门槛值来判断该第一货柜门与该第二货柜门是否代表同一个货柜门。

7.如权利要求5所述的影像分析方法，其特征在于，各该多个相关性属于YCbCr色彩空间。

8.如权利要求5所述的影像分析方法，其特征在于，正规化该第一影像与该第二影像的该步骤还包含：