CN116524529A

CN116524529A - 一种基于图形嵌套关系的图层识别新方法

Info

Publication number: CN116524529A
Application number: CN202310806871.1A
Authority: CN
Inventors: 孙钦平; 马嘉林; 王锁成; 潘超杰; 崔方剑; 张东亮; 韩岩杰; 孙光辉; 夏波; 李帅斌; 王学平; 张春雨
Original assignee: Qingdao Hisense Information Technology Co ltd
Current assignee: Qingdao Hisense Information Technology Co ltd
Priority date: 2023-07-04
Filing date: 2023-07-04
Publication date: 2023-08-01
Anticipated expiration: 2043-07-04
Also published as: CN116524529B

Abstract

本发明提供了一种基于图形嵌套关系的图层识别新方法，属于人工智能技术领域，其方法包括：对图片进行区域化处理，获取处理后的图片；基于所述处理后的图片进行嵌套结构提取；根据提取结果识别出各个嵌套结构之间的关系；基于所述各个嵌套结构之间的关系构建图层嵌套树；基于所述图层嵌套树进行常规字体笔画提取。解决了传统的图像文字识别技术通过图像处理和统计机器学习方法从图像中提取文本信息，包括二值化、噪声滤波、相关域分析等，其依赖于充足的训练样本以及清晰地特征规则，但在很多实际问题中无法获取足够训练样本，这对传统技术提出挑战，对具有普适性的新识别技术产生需求的问题。

Description

一种基于图形嵌套关系的图层识别新方法

技术领域

本发明涉及人工智能技术领域，特别涉及一种基于图形嵌套关系的图层识别新方法。

背景技术

目前，图像文字识别是计算机识别的重要方面，有广泛应用，比如光学识别、工业图文识别、屏幕图文识别等，例如医药品包装上的文字、各种钢制部件上的文字、容器表面的喷涂文字、商店标志上的个性文字等，在这样的图像中，字符部分可能出现在弯曲阵列、曲面异形、斜率分布、皱纹变形、不完整等各种形式中，并且与标准字符的特征大不相同，因此难以检测和识别图像字符，传统的图像文字识别技术通过图像处理和统计机器学习方法从图像中提取文本信息，包括二值化、噪声滤波、相关域分析等，根据处理方法可分为图像准备、文本识别和后处理三个阶段，其依赖于充足的训练样本以及清晰地特征规则，但在很多实际问题中无法获取足够训练样本，这对传统技术提出挑战，对具有普适性的新识别技术产生需求。

因此，本发明提出一种基于图形嵌套关系的图层识别新方法。

发明内容

本发明提供一种基于图形嵌套关系的图层识别新方法，通过对图片进行区域化处理，获取处理后的图片，基于所述处理后的图片进行嵌套结构提取，根据提取结果识别出各个嵌套结构之间的关系，基于所述各个嵌套结构之间的关系构建图层嵌套树，基于所述图层嵌套树进行常规字体笔画提取，解决了背景技术中很多实际问题中无法获取足够训练样本，对具有普适性的新识别技术产生需求的问题。

本发明提出一种基于图形嵌套关系的图层识别新方法，该方法包括：

步骤1：对图片进行区域化处理，获取处理后的图片；

步骤2：基于所述处理后的图片进行嵌套结构提取；

步骤3：根据提取结果识别出各个嵌套结构之间的关系；

步骤4：基于所述各个嵌套结构之间的关系构建图层嵌套树；

步骤5：基于所述图层嵌套树进行常规字体笔画提取。

优化的，对图片进行区域化处理，获取处理后的图片，包括：

获取屏幕分辨率，根据屏幕分辨率获取像素总行数和像素总列数；

根据所述像素总行数和像素总列数确定多个坐标点；

获取所述多个坐标点上的像素向量；

根据所述像素向量创建像素集；

设定一个判定数字，并创建第一空集和第二空集；

在像素集中创建第一初始类集合并确定第一初始类集合的代表元；

将所述第一初始类集合中的元素放入第一空集，所述第一初始类集合的代表元中的元素放入到第二空集中；

其中，第一空集和第二空集中的元素按照两个维度变量的下标排列；

逐一取定像素集中的元素和第二空集中的元素，按照预设算法判定元素的计算结果是否小于等于所述判定数字，若满足，则将所述像素集中的元素和第二空集中的元素进行合并，若不满足，则创建第二初始类并进行重复判定直到满足计算结果；

当像素集中没有计算元素时，获取区域类。

优化的，基于所述处理后的图片进行嵌套结构提取，包括：

基于所述区域类中取一个类，从所取的类中获取所有元素对应的第一坐标集的最大值；

从取的类中获取以第一坐标集最大值为第一坐标的所有元素的集合；

从所述所有元素的集合中获取所有元素对应的第二坐标的最大值；

基于所述第一坐标集的最大值、第二坐标的最大值和多个坐标点上的像素向量构建所取类的基点；

根据所取类的基点构建嵌套元素集合；

根据嵌套元素集合生成若干个嵌套结构元素集合。

优化的，根据提取结果识别出各个嵌套结构之间的关系，包括：

根据嵌套结构元素集合中各元素之间的包含关系将所有元素进行分类；

根据分类结果确定各类元素之间的相对关系；

获取每个嵌套结构元素的包含元素；

根据各类元素之间的相对关系和每个嵌套结构元素的包含元素确定各个嵌套结构之间的关系。

优化的，基于所述各个嵌套结构之间的关系构建图层嵌套树，包括：

根据每个嵌套结构的划分元素按照各个嵌套结构之间的关系连接成树状结构；

其中，树的每个节点是一个图层。

优化的，对图片进行区域化处理之前，还包括：

对图片进行遮挡判断，根据判断结果选择性的对图片进行优化，获取优化后的图片；

将优化后的图片作为图片进行区域化处理的参考图片。

优化的，基于所述图层嵌套树进行常规字体笔画提取，包括：

创建第一集合和第二集合；

将嵌套元素集合中的所有元素的极小元存入到第一集合中，所有元素的次极小元存入到第二集合中；

任取某元素在第二集合中的第一次极小元，并获取该元素在第一集合中的第一极小元；

计算第一次极小元在图片上围起来的第一面积和第一极小元在图片上围起来的第二面积；

判断第二面积与第一面积之间的比值是否小于预设的参数范围内，若小于，则保留该元素在第二集合中的第一次极小元，否则，在第二集合中删除该元素的第一次极小元且从第一集合中删除该元素的第一极小元；

其中，剩余的第一集合中的子集为常规字体笔画。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种基于图形嵌套关系的图层识别新方法的流程图；

图2为本发明实施例中一种基于图形嵌套关系的图层识别新方法的另一流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例1：

本发明提供一种基于图形嵌套关系的图层识别新方法，如图1所示，该方法包括：

步骤1：对图片进行区域化处理，获取处理后的图片；

步骤2：基于所述处理后的图片进行嵌套结构提取；

步骤3：根据提取结果识别出各个嵌套结构之间的关系；

步骤4：基于所述各个嵌套结构之间的关系构建图层嵌套树；

步骤5：基于所述图层嵌套树进行常规字体笔画提取。

该实施例中，区域化处理是指输入像素及其周边像素共同参加运算，得到一个输出像素的处理过程。

该实施例中，嵌套结构比如是背景图在文字上方、文字在背景图上方或者是背景图在文字中间。

该实施例中，图层嵌套树是指表示各种嵌套结构的树状图。

该实施例中，常规字体笔画是指平时所见的汉字笔画。

上述技术方案的有益效果是：通过对图片进行区域化处理，并对处理后的图片进行嵌套结构提取，根据各个嵌套结构之间的关系构建图层嵌套树，可以快速对图片中的嵌套关系做出判断，增强字符识别能力，提高人机交互体验感，为解决跨系统屏幕识别问题形成技术基础。

实施例2：

本发明提供一种基于图形嵌套关系的图层识别新方法，如图2所示，对图片进行区域化处理，获取处理后的图片，包括：

根据所述像素总行数和像素总列数确定多个坐标点；

获取所述多个坐标点上的像素向量；

根据所述像素向量创建像素集；

设定一个判定数字，并创建第一空集和第二空集；

当像素集中没有计算元素时，获取区域类。

该实施例中，假定屏幕的分辨率为，其中，/>是像素总列数，/>是像素总行数，假定/>。

设定一个判定数字，空集/>。

假定任意坐标点上的像素向量为/>，或简记为/>。

创建像素集

。

创建初始类

，

是/>的代表元。

令。其中，/>和/>中的元素按照两个维度变量的下标排列。

令。

逐一取定。

遍历，则令

；

若中没有任何元素满足此条件，则创建一个新的初始类

。

令。

直到，获得区域类/>。

上述技术方案的有益效果是：通过屏幕分辨率确定多个坐标点，并获取坐标点上的像素向量，根据像素向量创建像素集，创建第一空集、第二空集和第一初始类集合并确定第一初始类集合的代表元，逐一取定像素集中的元素和第二空集中的元素进行计算，对计算结果进行判定，可以快速对图片进行区域化处理，同时更大程度的控制图片处理的范围和程度。

实施例3：

本发明提供一种基于图形嵌套关系的图层识别新方法，基于所述处理后的图片进行嵌套结构提取，包括：

根据所取类的基点构建嵌套元素集合；

根据嵌套元素集合生成若干个嵌套结构元素集合。

该实施例中，区域类是指具有区域特征的连成一片的区域。

该实施例中，从区域类中取一个类/>，/>是代表元。

从中获取所有元素对应的第一坐标集/>的最大值/>。

从中获取以/>为第一坐标的所有元素的集合/>。

从中获取所有元素对应的第二坐标/>的最大值/>。

构造的基点

。

构造集合，令

。

依托的元素/>获得了若干/>，所有的/>构成集合。

上述技术方案的有益效果是：通过获取所取的类中所有元素对应的第一坐标集的最大值，从取的类中获取以第一坐标集最大值为第一坐标的所有元素的集合，所有元素的集合中获取所有元素对应的第二坐标的最大值，根据第一坐标集的最大值、第二坐标的最大值和多个坐标点上的像素向量构建所取类的基点，可以准确的确定出若干个嵌套结构元素集合，根据集合能够对图片的嵌套结构做出更精准的判断。

实施例4：

本发明提供一种基于图形嵌套关系的图层识别新方法，如图2所示，根据提取结果识别出各个嵌套结构之间的关系，包括：

S01：根据嵌套结构元素集合中各元素之间的包含关系将所有元素进行分类；

S02：根据分类结果确定各类元素之间的相对关系；

S03：获取每个嵌套结构元素的包含元素；

S04：根据各类元素之间的相对关系和每个嵌套结构元素的包含元素确定各个嵌套结构之间的关系。

该实施例中，任取，建立类/>，使得/>。

令。

构造。

任取，若/>，对于任意/>，令：

是/>中所有元素第一坐标的最大值；/>是/>中所有元素第一坐标的最小值；/>是/>中所有元素第二坐标的最大值；/>是/>中所有元素第二坐标的最小值；

是/>中所有元素第一坐标的最大值；/>是/>中所有元素第一坐标的最小值；/>是/>中所有元素第二坐标的最大值；/>是/>中所有元素第二坐标的最小值。

若以下两组条件必居其一，则令

若不满足前述条件，则

建立类，使得/>，并令/>。

两组条件是：

。

由此，我们依托区域类集合和集合/>，获得了图形嵌套关系。上述技术方案的有益效果是：对嵌套结构元素中的元素进行分类，确定各类元素之间的相对关系，获取每个嵌套结构元素的包含元素，可以确定各个嵌套结构之间的关系加快对图层和文字的识别。

实施例5：

本发明提供一种基于图形嵌套关系的图层识别新方法，基于所述各个嵌套结构之间的关系构建图层嵌套树，包括：

根据每个嵌套结构的划分元素按照各个嵌套结构之间的关系连接成图层嵌套树；

其中，树的每个节点是一个图层。

该实施例中，图层嵌套树是指表示各种嵌套结构的树状图。

上述技术方案的有益效果是：通过构建图层嵌套树，可以准确的判断出每个图层之间的关系，也可以清晰的展现出图层的嵌套结构，方便对图层进行识别。

实施例6：

本发明提供一种基于图形嵌套关系的图层识别新方法，对图片进行区域化处理之前，还包括：

将优化后的图片作为图片进行区域化处理的参考图片。

该实施例中，对图片的遮挡物进行判断，若图片的遮挡物为人为，比如书、杯子遮挡住图片。则直接将遮挡物进行移出。

若遮挡物为阴影，则需要进行对图片进行ps处理。

上述技术方案的有益效果是：通过对图片进行遮挡判断，并根据判断结果对图片进行优化，可以使图片显示更清晰，后期图层和文字的识别也更加精准。

实施例7：

本发明提供一种基于图形嵌套关系的图层识别新方法，基于所述图层嵌套树进行常规字体笔画提取，包括：

创建第一集合和第二集合；

其中，剩余的第一集合中的子集为常规字体笔画。

该实施例中，创建集合和/>，获取嵌套元素集合中的元素/>，遍历，取/>的极小元/>，遍历/>，取/>的次极小元/>存入，任取/>，以及与之对应的/>，计算/>在图片上围起来的面积，分别记为/>小于一个恰当的（大于0小于1）的参数，则在/>中保留/>；若否，则从/>中删除/>，且从/>中删除/>对应的/>，

常规字体笔画对应的是的子集。

上述技术方案的有益效果是：通过获取元素极小元和次极小元之间的比值，判断是否保留该元素，可以快速使满足条件的元素保留下来，避免出现误差，使常规字体笔画识别不完整。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于图形嵌套关系的图层识别新方法，其特征在于，该方法包括：

步骤1：对图片进行区域化处理，获取处理后的图片；

步骤2：基于所述处理后的图片进行嵌套结构提取；

步骤3：根据提取结果识别出各个嵌套结构之间的关系；

步骤4：基于所述各个嵌套结构之间的关系构建图层嵌套树；

步骤5：基于所述图层嵌套树进行常规字体笔画提取。

2.根据权利要求1所述的基于图形嵌套关系的图层识别新方法，其特征在于，对图片进行区域化处理，获取处理后的图片，包括：

根据所述像素总行数和像素总列数确定多个坐标点；

获取所述多个坐标点上的像素向量；

根据所述像素向量创建像素集；

设定一个判定数字，并创建第一空集和第二空集；

当像素集中没有计算元素时，获取区域类。

3.根据权利要求2所述的基于图形嵌套关系的图层识别新方法，其特征在于，基于所述处理后的图片进行嵌套结构提取，包括：

根据所取类的基点构建嵌套元素集合；

根据嵌套元素集合生成若干个嵌套结构元素集合。

4.根据权利要求3所述的基于图形嵌套关系的图层识别新方法，其特征在于，根据提取结果识别出各个嵌套结构之间的关系，包括：

根据分类结果确定各类元素之间的相对关系；

获取每个嵌套结构元素的包含元素；

5.根据权利要求1所述的基于图形嵌套关系的图层识别新方法，其特征在于，基于所述各个嵌套结构之间的关系构建图层嵌套树，包括：

其中，树的每个节点是一个图层。

6.根据权利要求1所述的基于图形嵌套关系的图层识别新方法，其特征在于，对图片进行区域化处理之前，还包括：

将优化后的图片作为图片进行区域化处理的参考图片。

7.根据权利要求1所述的基于图形嵌套关系的图层识别新方法，其特征在于，基于所述图层嵌套树进行常规字体笔画提取，包括：

创建第一集合和第二集合；

其中，剩余的第一集合中的子集为常规字体笔画。