WO2020237480A1

WO2020237480A1 - 基于图像识别的控制方法与装置

Info

Publication number: WO2020237480A1
Application number: PCT/CN2019/088640
Authority: WO
Inventors: 唐立三; 胡飞凰; 周冠兴
Original assignee: 西门子股份公司; 西门子（中国）有限公司
Priority date: 2019-05-27
Filing date: 2019-05-27
Publication date: 2020-12-03
Also published as: CN113841156A; CN113841156B

Abstract

本发明公开了基于图像识别的控制方法与装置。该方法包括：对图像进行特征提取，以获得与图像相关联的至少一个特征图像；基于至少一个特征图像来对图像进行划分，以获得至少一个图像子块以及至少一个图像子块的位置信息；以及对至少一个图像子块进行索引提取，以获得与至少一个图像子块相关联的至少一个索引信息，并且基于至少一个索引信息获得与至少一个图像子块相关联的描述信息，进而获得图像的识别结果。通过采用本发明的技术方案，可以提升图像识别的效率，还可以使得具备图像识别的物料接收和检验的系统可以更好地与其他生产系统集成。

Description

基于图像识别的控制方法与装置

技术领域

本发明涉及数据处理领域，特别涉及一种基于图像识别的控制方法与装置。

背景技术

物料清单(Bill of Materials，BOM)用来描述企业产品组成，其可以表明产品的总装件、分装件、组件、部件、零件、直到原材料之间的结构关系，以及所需的数量。

在产品的制造过程基于物料清单来实施。当材料从材料供应商交付到产品制造工厂时，会附上材料信息。材料信息通常以交货单和包装标签的形式来表示，这些标签往往由材料供应商基于指定的格式进行打印。

发明内容

针对传统方法的物料计划和质量策略很难及时更新的，本发明提出一种基于图像识别的控制方法与装置。

本发明一方面提出了一种基于图像识别的控制方法，包括：对图像进行特征提取，以获得与所述图像相关联的至少一个特征图像；基于所述至少一个特征图像来对所述图像进行划分，以获得至少一个图像子块以及所述至少一个图像子块的位置信息；以及对所述至少一个图像子块进行索引提取，以获得与所述至少一个图像子块相关联的至少一个索引信息，并且基于所述至少一个索引信息获得与所述至少一个图像子块相关联的描述信息，进而获得所述图像的识别结果。该图像识别方法可以实现对图像的划分后进行语义识别，进而确定图像中所包含的信息。

在一种实施方式中，如果所述至少一个特征图像中包括模板标记，则至少基于与所述模板标记相关联的划分模板来对所述图像进行划分；如果所述至少一个特征图像中未包括所述模板标记，则基于所述至少一个特征图像的类型来对所述图像进行划分。通过此实施方式，可以灵活地对图像进行划分处理。当存在划分模板时，可以较快地划分、识别图像；当不存在划分模板时，也可以根据特征图像的类型来划分图像，从而延展了本发明的应用范围。

在一种实施方式中，如果所述划分模板与所述图像的匹配度大于等于第一阈值，则基于所述划分模板来对所述图像进行划分；如果所述划分模板与所述图像的匹配度小于所述第一阈值，则基于所述划分模板对所述图像的第一部分进行划分，并且基于所述图像的第二部分中的特征图像类型来对所述第二部分进行划分，其中，所述第一部分为所述图像中与所述划分模板相匹配的部分，所述图像的剩余部分包括所述第二部分。该实施方式更加详细地阐述了如何利用划分模板来划分图像，并且实现了划分模板与特征图像结合使用的特点。

在一种实施方式中，基于所述描述信息，以预设形式的信息文本表示所述识别结果。通过执行该实施方式，可以将所识别的内容以指定的形式呈现，同时降低了数据库维护的复杂性，便于与其它系统集成。

在一种实施方式中，获得来自数据库的验证信息，基于所述验证信息来验证所述识别结果是否存在异常，若所述识别结果存在异常，则基于所述异常的类型以及内容，生成对所述数据库的第一更新操作指示，以更新所述数据库中与所述识别结果相关联的部分。当数据库更新后，可以提升图像识别的效率以及准确度。

在一种实施方式中，若所述图像的识别结果不存在异常，则获得与所述图像相关联的待测物的质量检验信息；如果所述质量检验信息存在异常，则生成对所述数据库的第二更新操作指示，以更新所述数据库中与所述质量检验信息相关联的部分。该实施方式提供了根据待测物(譬如，所接收的物料)的质量来确定是否对数据库进行维护。

在一种实施方式中，在对所述图像进行特征提取之前，对所述图像进行预处理，以使得所述图像中的指定区域的像素与其他像素区域之间的差值大于等于第二阈值。通过执行该实施方式，可以提高文本识别的性能。

本发明另一方面还提出了基于图像识别的装置，包括：提取模块，配置为对图像进行特征提取，以获得与所述图像相关联的至少一个特征图像；划分模块，配置为基于所述至少一个特征图像来对所述图像进行划分，以获得至少一个图像子块以及所述至少一个图像子块的位置信息；识别模块，配置为对所述至少一个图像子块进行索引提取，以获得与所述至少一个图像子块相关联的至少一个索引信息，并且基于所述至少一个索引信息获得与所述至少一个图像子块相关联的描述信息，进而获得所述图像的识别结果。

本发明另一方面还提出了计算机存储介质，该介质上其上存储有计算机可执行指令，当所述可执行指令被执行时，执行前述的方法。

本发明另一方面还提出了计算机装置，其包括存储器与处理器，所述存储器上存储有计算机可执行指令，当所述可执行指令被执行时，使得所述处理器执行前述的方法。

本发明另一方面还提出了计算机程序产品，所述计算机程序产品被有形地存储在计算机可读介质上，并且包括计算机可执行指令，所述计算机可执行指令在被执行时，使至少一个处理器执行前述的方法。

通过采用本发明的技术方案，可以使得物料接收和检查系统可以更好地与其他生产系统集成，能够实现整个工厂的自动化，减少了大量的人工操作以及人为的错误，降低了成本。

附图说明

参考附图示出并阐明实施例。这些附图用于阐明基本原理，从而仅仅示出了对于理解基本原理必要的方面。这些附图不是按比例的。在附图中，相同的附图标记表示相似的特征。

图1为依据本发明实施例的图像识别方法的流程图；

图2为依据本发明实施例的图像识别装置架构图；

图3为依据本发明实施例的物料检验流程图；

图4为依据本发明实施例的过程控制系统的网络架构示意图。

具体实施方式

在以下优选的实施例的具体描述中，将参考构成本发明一部分的所附的附图。所附的附图通过示例的方式示出了能够实现本发明的特定的实施例。示例的实施例并不旨在穷尽根据本发明的所有实施例。可以理解，在不偏离本发明的范围的前提下，可以利用其他实施例，也可以进行结构性或者逻辑性的修改。因此，以下的具体描述并非限制性的，且本发明的范围由所附的权利要求所限定。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

首先，对本发明所涉及到的术语进行阐述。语义是指字段所要表达的意思，多个不同的字段可以表示同一个语义。图像的语义则是指图像中的特征图像、字符等等所要表达的意思。

通过大量的实践，发明人发现对于来自不同供应商的物料清单，材料信息往往会采用不同的语言，甚至是以手写的方式来呈现。为了获得准确的物料清单，材料接收和检查高度依赖于工厂的人工操作，这导致了较低的生产率，还会导致异常和产品质量问题，例如，相关人员必须比较一些无规则的数字来检查材料类型，当错误类型材料被当成正确的批次时，会导致最终的产品不合格。另外，由于需要大量的人工操作和非实时反馈，基于传统方法的物料计划和质量策略很难及时更新。

基于上述问题，本发明提出了一种基于图像识别的数据处理方法和系统，来实现物料接收和检测的自动化过程。下面结合附图来阐述本发明所提出的用于图像识别的数据处理方法和系统。

首先，请参阅图1，其为依据本发明实施例的图像识别方法的流程图。

步骤S101：对所获得的图像进行预处理。

由上文可知，对于不同的图像来源，所获得的图像类型、清晰度、色彩或是其他特征可能不同，因此，在该步骤中，将对所获得的图像进行预处理，以使得经预处理的图像更加便于识别。本实施例中的预处理可以是反色、调整对比度、去除灰色区域、去除气泡等方式，以使得图像中的指定的区域(譬如，字符、特征码)的像素与周边的像素之间的差大于等于指定的阈值。

步骤S102：对经预处理的图像进行特征图像提取。

通过提取到的至少一个特征图像，可以确定图像中与特征图像的分类，譬如，特征码、表格、预定的标记等。可以理解的，一幅图像中可以包括一类或多类不同的特征图像。例如，当特征图像包括预定的标记(譬如，供应商的徽标、特征码等)时，可以通过识别图像中的徽标来确定与之相对应的供应商，进而在数据库中找到与该供应商相对应的划分模板。

在一种实施方式中，上述的特征图像以关键信息的形式存储在数据库中，并且在生命周期内持续改进。譬如，该关键信息可以按照键值对的形式存储在数据库中。关键字K可以是特征图像的类别、相关公司的格式化标识、相关公司的名称等，相应的值V可以是这些关键字的信息集，例如，公司信息、交货单模板和材料包装标签等等。

然后，可以基于特征图像来对图像进行划分，以确定至少一个图像子块以及该子块的位置信息。

执行步骤S103以判断特征图像是否指向现有的划分模板。具体地，如果特征图像中包括模板标记，则进一步判断与模板标记相关联的划分模板与图像的匹配度是否大于等于指定阈值(步骤S104)。可以理解的，这里的模板标记可以是供应商的徽标也可以是其他指定的标记。如果划分模板与图像的匹配度小于指定阈值，则基于划分模板对图像的第一部分进行划分，并且基于图像的第二部分中的特征图像类型来对第二部分进行划分，其中，第一部分为图像中与划分模板相匹配的部分，图像的剩余部分包括第二部分(步骤S105)；如果该划分模板与图像的匹配度大于等于指定阈值，则基于划分模板来对图像进行划分(步骤109)。这里的匹配度可以是划分模板与图像中图像子块布局的相似度，也可以是其它衡量划分模板与图像之间匹配程度的参数。

例如，若通过该特征图像能够在数据库中找到与供应商相对应的划分模板A，则可以利用该划分模板A对图像进行划分。可以理解的，在供应商A所提供的图像中，该图像中的至少一部分是依照现有的划分模板A规律性地分布。因此，针对具有规律的这一部分图像，可以基于划分模板A来对图像进行划分，以获得图像子块以及相应的位置信息；针对图像的剩余部分，则可以至少基于该部分所包括的特征图像的类型来进行划分，从而获得至少一个图像子块。换而言之，图像的剩余部分还可以包括第三部分，该第三部分以指定的划分规则进行划分，譬如，以尺寸、位置、形状等因素来划分。

以特征码(例如，条形码、二维码等)为例，可以基于预设的规则来确定与该特征码对应的图像子块。具体而言，当该特征码为条形码时，该图像子块对应于该条形码的至少一条边缘在与该边缘垂直方向上延伸指定的长度后形成的区域，以供后续识别。可以理解的，当图像中包括表格或是其他提取标记(例如，空行、黑色空格、粗体字)时，也可以将与该表格对应的区域或与提取标记对应的区域，以指定的规则从图像中划分出。譬如，可以将表格的上下边缘作为基础，分别向上、向下延伸指定的长度，进而确定与该表格相对应的图像子块。这里的图像子块与特征图像之间的位置尺寸关系可以基于具体的应用来设定，在此无需穷尽列举。在一种实施方式中，通过上述步骤，还可以对现有的与供应商A相对应的划分规则进行更新，即基于最终的识别结果的正确性，来调整划分模板。

若数据库中不存在与该供应商相对应的划分模板，则可以基于所提取的特征图像的类型来确定图像的划分规则，进而基于该划分规则来对该图像进行划分(步骤S110)。

步骤S106：对划分后的图像子块进行识别。

在该步骤中，对图像子块进行索引提取(譬如，识别图像中的字符、特征码等等)，以获得图像子块的所包含的索引信息。譬如，当特征图像是条形码时，与其相对应的图像子块中可以包括位于条形码上方的字符/二维码，通过识别该字符/二维码，可以获得索引信息。

当图像中包括多个条形码时，该多个条形码识别后所表示的数字串可能存在重合。可以通过与该条形码对应的索引信息、数字串以及条形码的位置来在数据库中找到该多个条形码相关联的描述信息，即，产品类别以及相关信息。

步骤S107：基于描述信息，获得具有指定表示形式的识别结果。

在实际应用中，对于相同的语义关键词，不同的供应商可能会给出不同的类型。例如，对于不同的供应商，词条“电话号码”可能采用不同语言或缩写的方式来表示(例如，Tel、phone、电话)。在该步骤中，基于预设的学习模型和/或匹配规则，将“Tel、phone、电话”均映射到数据库中的“电话号码”。因此，通过学习模型和/或匹配规则，可以在数据库中获得与多个不同表示形式的字段相对应的一个词条，即实现多对一的转换。换而言之，学习模型、匹配规则均用于语义匹配，以将图像子块的识别内容转换成以预设形式的信息文本(例如，标准化信息文本)中的条目。

通过将所识别的内容以指定的表示形式(譬如，标准化信息文本)来表示，可以便于用户的使用以及多个系统间的集成。例如，采用不同语言或缩写的方式来表示的术语“电话号码”能够以指定的术语(譬如，Tel No.)来表示，其它系统可以直接调用该识别内容时，而不需要再次进行识别或转换。

步骤S108：对识别结果进行验证。

在该步骤中，获得来自数据库的验证信息，基于验证信息来验证识别结果是否存在异常，即可以通过数据库中已经预存的信息对该识别内容进行验证。若识别结果存在异常，则基于异常的类型以及内容，生成对数据库的第一更新操作指示。可以理解的，当根据第一更新操作指示来操作数据库时，可以对与识别结果相关的部分(譬如，图像识别所涉及到的模板、划分规则等等)进行更新。作为示例，可以对以下项中的至少一个进行更新：关键信息、划分规则、划分模板、学习模型、订单信息。在一种实施方式中，可以通过调取数据库中的订单信息来对该识别结果进行验证，并将验证且修正后的识别内容提供到数据库。可以理解的，具有指定的表示形式的识别结果可以便于和数据库中的信息进行验证。

在一种实施方式中，对于前述的两种情形：(1)不存在划分模板(2)存在划分模板但图像还有一部分无法与划分模板匹配，可以基于验证结果来更新模板。若验证结果准确，则基于上述的划分规则来生成或更新划分模板，以供后续使用。例如，当不存在划分模板时，可以至少基于图像子块的索引信息以及位置来生成划分模板。

图2为依据本发明实施例的图像识别装置架构图。

图像处理装置200包括预处理模块201、提取模块202、划分模块203、识别模块204以及验证模块205。具体地，预处理模块201配置为对获得的图像进行预处理，以使得图像中的文字的像素与其他像素之间的差值达到指定的阈值。提取模块202接收经预处理的图像，然后对该图像进行特征图像提取，以获得与图像相关联的至少一个特征图像，譬如，特征码、表格和/或其他提取标记(例如，空行、黑色空格、粗体字等)。

划分模块203基于所获得的特征图像来对图像进行划分，以获得分别与该特征图像相对应的图像子块以及该图像子块的位置，其中，图像子块包括该特征图像。识别模块204对图像子块进行识别，以确定图像子块的索引信息，进而确定与该索引信息相对应的数据记录。识别模块204还基于指定的匹配规则，将识别内容转换为预设形式的信息文本的条目。

验证模块205配置为获得来自验证数据库的验证信息，基于所述验证信息来验证上述的识别内容是否存在异常，若存在异常，则基于异常的类型以及内容，生成相应的数据库更新操作指示。

图3为依据本发明实施例的物料检验流程图。

首先，执行步骤S301，以获得用于表征物料的图像的识别结果，进而执行步骤S302以判断该识别结果是否产生异常。当该识别结果准确时，执行步骤S303，以获得物料检验结果；反之，则执行步骤S306来以更新数据库中的相关内容。譬如，生成对数据库的第一更新操作指示，以更新据库中与图像识别结果相关联的部分。

执行步骤S304，判断物料的检验是否通过，即判断物料的检验结果是否产生异常，若准确且准确的批次达到一定的数值，可以周期性地调整检验计划(S305)，譬如，减少对该物料的检验项目；若不准确，则执行步骤S306来生成第二更新操作指示。当根据第二更新操作指示来操作数据库时，可以对数据库中与质量检验相关的部分进行更新。可以理解的，可以基于异常的类型和/或异常产生的阶段，来在数据库中更新待测物的检验计划。

图4为依据本发明实施例的过程控制系统的网络架构示意图。

如图所示，数据处理系统DPS接收来自图像获得设备IMD的图像数据(譬如，由现场设备捕获的交货单和/或材料包标签的多个图像)，通过对图像识别来确定所收到的物料。

上述图像获得设备可以包括但不限于2D彩色或灰度型摄像头、3D摄像头等。2D摄像头可以用于检查材料包是否被损坏，3D摄像头可以用于检查物料的形状与数据库中预先记录的形状是否一致。

数据处理系统DPS与ERP系统通信连接，以从ERP系统中查询材料订单和供应商信息，并且也可以向ERP系统提交物料的检验结果，以针对该物料的订单执行相应的操作，譬如，完成采购订单或退回不合格物料。

另外，数据处理系统DPS还与故障数据系统EDS通信连接，以获得物料在生产过程中的使用和质量检验信息，譬如，物料的使用信息、物料在生产过程中的质量一致性的信息，进而更新数据处理系统在图像识别、物料检验中的所涉及的数据库中的内容，譬如，模型和规则。

在一个实施方式中，数据处理系统DPS还与远程服务器(譬如，云服务器)通信连接，以在云服务器上实现物料使用数据分析、更新模型和规则、管理供应商等等。

图1、3中所记载的方法的流程还代表计算机可读指令，该计算机可读指令包括由处理器执行的程序。该程序可被实体化在被存储于有形计算机可读介质中，该有形计算机可读介质如CD-ROM、软盘、硬盘、数字通用光盘(DVD)、蓝光光盘或其它形式的存储器。替代的，图1、3中的示例方法中的一些步骤或所有步骤可利用专用集成电路(ASIC)、可编程逻辑器件(PLD)、现场可编程逻辑器件(EPLD)、离散逻辑、硬件、固件等的任意组合被实现。在可读介质上信息可以存储任意时间。可以理解的，该计算机可读指令还可以存储在网络服务器中、云端平台上，以便于用户使用。

本发明还提出了一种计算机装置，该计算机装置包括处理器以及存储器。该存储器用于存储指令，当指令在执行时使得处理器执行图1、3中所记载的方法。

本发明另一方面还提出了计算机程序产品，该计算机程序产品被有形地存储在计算机可读介质上，并且包括计算机可执行指令，当该计算机可执行指令在被执行时，使至少一个处理器执行图1、3中所记载的方法。

上文通过附图和优选实施例对本发明进行了详细展示和说明，然而本发明不限于这些已揭示的实施例，本领域技术人员从中推导出来的其他方案也在本发明的保护范围之内。

Claims

基于图像识别的控制方法，其特征在于，包括：

对图像进行特征提取，以获得与所述图像相关联的至少一个特征图像；

基于所述至少一个特征图像来对所述图像进行划分，以获得至少一个图像子块以及所述至少一个图像子块的位置信息；以及

对所述至少一个图像子块进行索引提取，以获得与所述至少一个图像子块相关联的至少一个索引信息，并且基于所述至少一个索引信息获得与所述至少一个图像子块相关联的描述信息，进而获得所述图像的识别结果。
如权利要求1所述的方法，其特征在于，还包括：

如果所述至少一个特征图像中包括模板标记，则至少基于与所述模板标记相关联的划分模板来对所述图像进行划分；

如果所述至少一个特征图像中未包括所述模板标记，则基于所述至少一个特征图像的类型来对所述图像进行划分。
如权利要求2所述的方法，其特征在于，还包括：

如果所述划分模板与所述图像的匹配度大于等于第一阈值，则基于所述划分模板来对所述图像进行划分；

如果所述划分模板与所述图像的匹配度小于所述第一阈值，则基于所述划分模板对所述图像的第一部分进行划分，并且基于所述图像的第二部分中的特征图像类型来对所述第二部分进行划分，

其中，所述第一部分为所述图像中与所述划分模板相匹配的部分，所述图像的剩余部分包括所述第二部分。
如权利要求1所述的方法，其特征在于，还包括：

基于所述描述信息，以预设形式的信息文本表示所述识别结果。
如权利要求1所述的方法，其特征在于，还包括：

获得来自数据库的验证信息，基于所述验证信息来验证所述识别结果是否存在异常，若所述识别结果存在异常，则基于所述异常的类型以及内容，生成对所述数据库的第一更新操作指示，以更新所述数据库中与所述识别结果相关联的部分。
如权利要求5所述的方法，其特征在于，包括：

若所述图像的识别结果不存在异常，则获得与所述图像相关联的待测物的质量检验信息；

如果所述质量检验信息存在异常，则生成对所述数据库的第二更新操作指示，以更新所述数据库中与所述质量检验信息相关联的部分。
如权利要求1所述的方法，其特征在于，包括：

在对所述图像进行特征提取之前，对所述图像进行预处理，以使得所述图像中的指定区域的像素与其他像素区域之间的差值大于等于第二阈值。
基于图像识别的装置，其特征在于，包括：

提取模块，配置为对图像进行特征提取，以获得与所述图像相关联的至少一个特征图像；

划分模块，配置为基于所述至少一个特征图像来对所述图像进行划分，以获得至少一个图像子块以及所述至少一个图像子块的位置信息；

识别模块，配置为对所述至少一个图像子块进行索引提取，以获得与所述至少一个图像子块相关联的至少一个索引信息，并且基于所述至少一个索引信息获得与所述至少一个图像子块相关联的描述信息，进而获得所述图像的识别结果。
如权利要求8所述的装置，其特征在于，所述划分模块还配置为：

如果所述至少一个特征图像中包括模板标记，则至少基于与所述模板标记相关联的划分模板来对所述图像进行划分；

如果所述至少一个特征图像中未包括所述模板标记，则基于所述至少一个特征图像的类型来对所述图像进行划分。
如权利要求9所述的装置，其特征在于，所述划分模块还配置为：

如果所述划分模板与所述图像的匹配度大于等于第一阈值，则基于所述划分模板来对所述图像进行划分；

如果所述划分模板与所述图像的匹配度小于所述第一阈值，则基于所述划分模板对所述图像的第一部分进行划分，并且基于所述图像的第二部分中的特征图像类型来对所述第二部分进行划分，

其中，所述第一部分为所述图像中与所述划分模板相匹配的部分，所述图像的剩余部分包括所述第二部分。
如权利要求8所述的装置，其特征在于，所述识别模块还配置为：

基于所述描述信息，以预设形式的信息文本表示所述识别结果。
如权利要求8所述的装置，还包括：

验证模块，配置为获得来自数据库的验证信息，基于所述验证信息来验证所述识别结果是否存在异常，若所述识别结果存在异常，则基于所述异常的类型以及内容，生成对所述数据库的第一更新操作指示，以更新所述数据库中与所述识别结果相关联的部分。
如权利要求12所述的装置，其特征在于，所述验证模块还配置为：

若所述图像的识别结果不存在异常，则获得与所述图像相关联的待测物的质量检验信息，

如果所述质量检验信息表示异常，则生成对所述数据库的第二更新操作指示，以更新所述数据库中与所述质量检验信息相关联的部分。
如权利要求8所述的装置，其特征在于，还包括：

预处理模块，配置为在对所述图像进行特征图像提取之前，对所述图像进行预处理，以使得所述图像中的指定区域的像素与其他区域像素之间的差值大于等于第二阈值。
计算机存储介质，其上存储有计算机可执行指令，当所述可执行指令被执行时，执行如权利要求1至7中任一项所述的方法。
计算机设备，包括存储器与处理器，所述存储器上存储有计算机可执行指令，当所述可执行指令被执行时，使得所述处理器执行如权利要求1至7中任一项所述的方法
计算机程序产品，所述计算机程序产品被有形地存储在计算机可读介质上，并且包括计算机可执行指令，所述计算机可执行指令在被执行时，使至少一个处理器执行如权利要求1至7中任一项所述的方法。