CN115291864B

CN115291864B - 一种基于图神经网络的零碎图层检测方法及装置

Info

Publication number: CN115291864B
Application number: CN202210766142.3A
Authority: CN
Inventors: 陈柳青; 甄焱鲲; 李佳智; 常艳芳; 周婷婷; 孙凌云
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-06-30
Filing date: 2022-06-30
Publication date: 2024-03-29
Anticipated expiration: 2042-06-30
Also published as: CN115291864A

Abstract

本发明公开了一种基于图神经网络的零碎图层检测方法，包括：步骤1、根据UI设计稿的图层信息，生成树状无向图和图层的初始特征向量；步骤2、将树状无向图与初始特征向量，输入至预构建的图神经网络模型中，获得图层的融合特征向量；步骤3、将融合特征向量与对应的图层，输入至多层感知机分类模型中，经过二分类处理，输出图层分类结果；步骤4、对分类获得的零碎图层集合进行聚类，并对聚类结果进行编组与合并，获得高质量的UI设计稿。本发明还公开了一种基于上述方法的零碎图层检测装置。本发明提供的方法通过将原UI设计稿中的零碎图层进行分类与聚类，从而获得高质量的UI设计稿。

Description

一种基于图神经网络的零碎图层检测方法及装置

技术领域

本申请涉及UI设计领域，尤其涉及一种基于图神经网络的零碎图层检测方法及装置。

背景技术

用户图形界面(GUI)为软件应用和用户建立了沟通的桥梁。优秀的GUI设计使得软件应用更高效、更方便使用，对推广软件和吸引客户有着重要影响。然而软件的GUI开发需要大量的前端开发人员，而且复杂多变的UI布局和重复的UI视图开发极大降低了开发率，增加了开发成本。为了辅助前端开发人员进行前端开发，一些前人的研究工作使用机器学习的技术从UI图片智能生成前端代码，然而由机器学习模型基于UI图片生成的前端代码可用性和维护性较差，往往无法达到工业级标准。

现阶段有人提出了设计稿元信息与UI设计稿图片相结合的方法，保证生成代码的复用性。然而在实际UI设计过程，设计师只考虑UI的美观性，往往为了达到美观的视觉效果而忽略了设计规范，这会影响利用设计稿元信息生成前端代码的质量，但是要求设计师严格按照规范进行设计，则大大增加了设计师的工作成本。

近年来，如何让机器智能生成代码受到了学术界和工业界的广泛关注。相关的研究工作，比如sketch2json和pix2code，将UI图片作为输入自动生成前端代码，然而其质量与可用性通常无法符合工业使用标准。

如果设计稿中存在大量琐碎的图层，将直接导致最终生成代码不可复用。传统的图层合并方法是一种人工辅助与启发式规则结合的方法，这类方法过度依赖于设计师与开发者的主观判断，同时一个设计稿中往往存在着大量的零碎图层，对所有图层进行筛选与判断极大增加了设计稿检查的时间成本。

专利文献CN111914197A公开了一种图层数据处理方法、装置及存储介质，其中方法包括：从显示区域的多个初始图层中确定图层对；图层对包括所述多个初始图层中的任意两个初始图层；将图层对组合设置信度大于目标置信度的图层对确定为目标图层对，并将目标图层对中的两个初始图层进行组合，得到组合图层；将组合图层和剩余图层确定为初始图层，直至显示区域中不存在置信度大于目标置信度的图层对时，输出与组合图层相关联的组合图像；剩余图层为多个初始图层中除组合图层外的初始图层。该方法提出了一种提高图层组合效率和准确度的方法，但是文中并没有给出如何解决UI设计稿中零碎图层分类的方法。

学术文献Owl Eyes:Spotting UI Display Issues via Visual Understanding[C]//2020.该文献中的模型将检测任务分为有问题的图片及定位图片中的有问题区域。首先，它通过一个卷积神经网络进行二分类，找出存在显示问题的图片；其次，通过应用热力图分析方法，定位出图片中出现显示问题的区域。该模型能够检测出如文字重叠、图片无法显示等问题。该方案的输入为纯视觉信息，忽略了UI布局中非常重要的结构化信息，而在实际的设计场景中，设计师通常会参照一些布局结构进行设计。

发明内容

为了解决上述问题，本发明提供了一种基于图神经网络的零碎图层检测方法，通过该方法可以将原UI设计稿中的零碎图层进行整理编组与合并，从而获得高质量的UI设计稿。

一种基于图神经网络的零碎图层检测方法，包括：

步骤1、根据UI设计稿的图层信息，生成用于体现图层包含关系的树状无向图和图层的初始特征向量；

步骤2、将步骤1获得的树状无向图与初始特征向量，输入至预构建的图神经网络模型中，获得图层的融合特征向量；

步骤3、将步骤2获得的融合特征向量与对应的图层，输入至多层感知机分类模型中，经过二分类处理，输出图层分类结果，所述图层分类结果包括零碎图层集合和非零碎图层集合；

步骤4、对步骤3分类获得的零碎图层集合进行聚类，并对聚类结果进行编组与合并，获得高质量的UI设计稿。

本发明通过图神经网络模型将原UI设计稿中的图层信息与树状无向图进行融合，获得带有图层包含关系的融合特征向量，并根据融合特征向量对图层进行分类，获得零碎图层集合，最终对零碎图层集合进行聚类，完成各零碎图层之间的编组与合并，增强了各零碎图层之间的关联关系，从而获得高质量的UI设计稿。

具体的，所述编组包括建立Sketch文件包与修改Sketch文件包名称。

优选的，所述UI设计稿在获取图层信息之前，进行UI设计稿的预处理，包括缩放和裁剪，保证获取的各图层特征向量统一，方便后续的数据处理。

具体的，所述预处理的具体过程：首先将画板的宽和高调整为750的倍数，然后将画板切割成尺寸为750*750的切片。

具体的，所述步骤1中的图层信息包括图层的类型，尺寸以及位置信息。

优选的，所述步骤1中的树状无向图是根据预处理后的图层进行构建：一个尺寸为750*750的虚拟根节点会被创建，随后将图层一个个添加进这棵树中，每一次添加时判断图层与当前深度的每一个节点的包含关系，如果它被包含在某个节点中，它会继续和那个节点的子节点进行比较，直到它不被某个节点的子节点包含，它将成为那个节点的子节点。

优选的，所述步骤1中的初始特征向量是由图层信息构建的特征矩阵与视觉特征矩阵拼接而成，所述视觉特征矩阵是通过卷积网络与全连接层对UI设计稿图层进行特征提取获得，从而增加可识别分类的特征信息。

优选的，一种视觉特征矩阵的提取策略，首先将UI图片经过卷积网络提取特征图，然后根据每一个图层的位置与尺寸信息，在特征图对应位置取出对应大小的图层特征表达，然后利用RoI池化方法得到该图层固定大小的特征矩阵，最后利用一个全连接层得到该图层的视觉特征向量，其中，RoI池化的过程是将尺寸为H×W的特征矩阵划分为h×w个网格，然后每一个网格经过最大池化即取出最大值，得到固定h×w大小的特征矩阵，可以获得信息更加丰富的视觉特征矩阵。

优选的，一种视觉特征矩阵的提取策略，根据图层的尺寸和位置，通过CNN主干网络从UI图片中取出对应大小的图层图像，然后调整图层尺寸到固定大小，再经过全连接层得到特定维度的特征向量，可以提高视觉特征矩阵的获取速度，且方便后续特征矩阵的初始化。

优选的，所述图神经网络模型是在VGG16模型和GAT模型组合的基础上，引入了多头注意力机制进行构建，其中采用VGG16模型和GAT模型进行构建可以减少参数量和训练时间，从而降低系统的运算压力，同时通过引入多头注意力机制可以提高组合模型的学习能力与稳定性。

具体的，所述多头注意力机制的具体表达式如下：

式中，表示向量连接，/>表示初始特征向量的参数矩阵，i表示目标节点，j表示与目标节点相邻的节点，α_ij表示注意力系数，σ表示sigmoid激活函数，K表示多头注意力的数量，/>表示i的邻居节点集，/>表示节点j的特征向量，/>表示节点i的特征向量，通常下在模型的最后一层使用一个平均函数，当然先对K个注意力头部进行平均运算，再进行非线性激活，而在中间层通常使用简单的连接将K个注意力头部结果结合在一起。

具体的，所述步骤4的聚类是基于两个零碎图层之间的相似度距离与包含关系进行分析，将相似度距离大于阈值或/和存在包含关系的两个零碎图层合并到同一个编组中。

具体的，所述步骤4的具体过程：

步骤4.1、对零碎图层集合中所有零碎图层进行初始化，获得对应N*N的邻接矩阵；

步骤4.2、通过欧氏距离公式计算目标图层与相邻图层之间邻接矩阵的相似度，进行判断：

当相似度大于阈值时，将相邻图层合并到目标图层所在编组中；

当相似度小于阈值时，则不执行合并；

步骤4.3、将已合并的图层从未合并的图层集合中除去，更换目标图层重复步骤4.2，直至剩余零碎图之间的相似度均小于阈值；

步骤4.4、基于步骤4.3剩余零碎图层的包含关系进行聚类，根据树状无向图中的图层包含关系进行判断，若相邻图层位于目标图层的树状子节点中，则将相邻图层合并到目标图层所在编组中；

步骤4.5、将已合并的图层从未合并的图层集合中除去，更换目标图层重复步骤4.4，直至所有零碎图层被合并到相应的编组中，结束操作。

具体的，目标图层与相邻图层之间的距离计算：

(x_i-x_j)²+(y_i-y_j)²+(w_i-w_j)²+(h_i-h_j)²+∝HRCHY(i，j)

式中，x,y表示图层的中心点的2D坐标，w和h是图层的宽与高，HRCHY(i，j)表示图层i和图层j在设计稿中是否在同一个编组下，是则为1，否则为0。

具体的，所述包含关系判断的表达式如下：

若图层j与图层i同时满足上述不等式，则说明图层i包含图层j。

本发明还提供了一种零碎图层检测装置，包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序，所述计算机存储器中采用上述的基于图神经网络的零碎图层检测方法；所述计算机处理器执行所述计算机程序时实现以下步骤：输入待检测的UI设计稿，通过零碎图层检测方法对UI设计稿的图层进行分类与聚类，输出高质量的UI设计稿。

具体的，所述高质量的UI设计稿为UI设计稿对应的前端代码符合工业级标准，便于后续日常维护与更新，且通过所述前端代码生成的UI界面不会出现图文重叠的问题。

与现有技术相比，本发明的有益效果：

(1)为UI设计稿构建用于体现图层包含关系的树状无相图，从而增加了分类时可识别的特征信息。

(2)将树状无向图与图层的初始特征向量，通过图神经网络模型进行融合更新，获得带有包含关系的特征向量。

(3)对分类获得的零碎图层进行相似度距离与包含关系的判断，从而保证所有零碎图层都能进入相应的编组中。

(4)通过对UI设计稿的图层进行重新分类与聚类，使得对应的前端代码符合工业级标准，提高了UI设计稿的质量。

附图说明

图1为本发明提供的一种基于图神经网络的零碎图层检测方法的流程示意图；

图2为本实施例中提供的树状无向图的构建流程图；

图3为本实施例中提供的一种视觉特征矩阵的获取方法流程图；

图4为本实施例中提供的另一种视觉特征矩阵的获取方法流程图；

图5为本实施例中提供的一种零碎图层的聚类方法流程图；

图6为本实施例中提供的零碎图层检测装置的使用流程图。

具体实施方式

在实际UI设计过程中，设计师通常会使用零碎图层组成UI组件，他们通常只考虑UI设计过程中的美观性，往往为了较好的视觉效果通常会忽略设计规范，从而使得生成的前端代码质量不高，日常维护困难。

如图1所示，一种基于图神经网络的零碎图层检测方法，包括：

步骤1、导出Sketch软件中UI设计稿的画板，将每个画板进行缩放处理(高宽调整为750的倍数)，然后将画板切割成尺寸为750*750的图层；

如图2所示，构建树状无向图：构建750*750的虚拟根节点后，将处理后的图层一个个添加进这棵树中，每一次添加时判断图层与当前深度的每一个节点的包含关系，如果它被包含在某个节点中，它会继续和那个节点的子节点进行比较，直到它不被某个节点的子节点包含，它将成为那个节点的子节点；

生成图层的初始特征向量：根据每个图层的类型、尺寸、位置和视觉特征的多模态信息，对于图层的尺寸和位置信息，我们使用一个参数矩阵Wx将其编码成特征向量，而关于视觉特征则通过卷积网络与全连接层对UI设计稿图层进行特征提取获得，将两个特征进行拼接，通过one-hot向量表达图层的类型，并使用一个参数矩阵Wt将其嵌入到潜空间中。

如图3所示，一种视觉特征矩阵的获取方法流程图，首先图片吗刚刚CNN主干网络将UI图片经过卷积网络提取特征图，然后根据每一个图层的位置与尺寸信息，在特征图对应位置取出对应大小的图层特征表达，然后利用RoI池化方法得到该图层固定大小的特征矩阵，最后利用一个全连接层得到该图层的视觉特征向量。RoI池化的过程是将尺寸为H×W的特征矩阵划分为h×w个网格，然后每一个网格经过最大池化即取出最大值，得到固定h×w大小的特征矩阵，在我们方案中h和w取定为5。

如图4所示，一种视觉特征矩阵的获取方法流程图，根据图层的尺寸和位置，通过CNN主干网络直接从UI图片中取出对应大小的图层图像，然后调整图层尺寸到固定大小，再经过全连接层得到特定维度的特征向量；

该图神经网络模型由VGG16模型和GAT模型组合构建，同时引入多头注意力机制：将参数矩阵的所有节点特征线性映射到嵌入空间，然后通过映射a:R^F′×R^F′→R来计算注意系数然后通过映射a:R^F′×R^F′→R来计算注意系数：

这个系数衡量着节点j对于i的重要性，其中a使用一个单层前馈神经网络，它的参数是

将树状无向图的特征融入到注意力机制中进行掩盖注意力，即只有与节点i相邻的节点会参与权重的计算，其他节点权重设为0。

将和节点i相邻节点的注意力系数进行softmax标准化，可以算得每一个相邻节点参与节点i状态更新的权重系数，这样节点i的状态更新公式可以表达成：

常下在模型的最后一层使用一个平均函数，当然先对K个注意力头部进行平均运算，再进行非线性激活，而在中间层通常使用简单的连接将K个注意力头部结果结合在一起。

该多层感知机分类模型以GNN模型的MLP分类器为基础进行构建。

步骤4、如图5所示，对步骤3分类获得的零碎图层集合进行聚类，对聚类结果进行编组与合并，获得高质量的UI设计稿：

(x_i-x_j)²+(y_i-y_j)²+(w_i-w_j)²+(h_i-h_j)²+∝HRCHY(i，j)

式中，x,y表示图层的中心点的2D坐标，w和h是图层的宽与高，HRCHY(i，j)表示图层i和图层j在设计稿中是否在同一个编组下，是则为1，否则为0；

当相似度小于阈值时，则不执行合并；

步骤4.4、基于步骤4.3剩余零碎图层的包含关系进行聚类，根据树状无向图中的图层包含关系进行判断:

若图层j与图层i同时满足上述不等式，则说明图层i包含图层j，并将相邻图层合并到目标图层所在编组中。

本实施例还提供了一种零碎图层检测装置，包括计算机存储器、计算机处理器以及存储在该计算机存储器中并可在该计算机处理器上执行的计算机程序，该计算机存储器中采用上述的基于图神经网络的零碎图层检测方法。

如图6所示，计算机处理器执行该计算机程序时实现以下步骤：输入待检测的UI设计稿，通过零碎图层检测方法对UI设计稿的图层进行分类与聚类，使得UI设计稿对应的前端代码符合工业级标准，便于后续日常的维护与更新；在Sketch软件中，则体现为相同语义的关联图层合并在一个编组底下，且生成的UI界面不会出现图文重叠的问题。

Claims

1.一种基于图神经网络的零碎图层检测方法，其特征在于，包括：

步骤2、将步骤1获得的树状无向图与初始特征向量，输入至预构建的图神经网络模型中，获得图层的融合特征向量，所述图神经网络模型是在VGG16模型和GAT模型基础上，引入了多头注意力机制进行构建，所述多头注意力机制的具体表达式如下：

式中，表示向量连接，/>表示初始特征向量的参数矩阵，i表示目标节点，j表示与目标节点相邻的节点，α_ij表示注意力系数，σ表示sigmoid激活函数，K表示多头注意力的数量，/>表示i的邻居节点集，/>表示节点j的特征向量，/>表示节点i的特征向量；

步骤4、对步骤3分类获得的零碎图层集合进行聚类，所述聚类是基于两个零碎图层之间的相似度距离与包含关系进行分析，将相似度距离大于阈值或/和存在包含关系的两个零碎图层合并到同一个编组中，并对聚类结果进行编组与合并，获得高质量的UI设计稿，其具体过程：

当相似度小于阈值时，则不执行合并；

2.根据权利要求1所述的基于图神经网络的零碎图层检测方法，其特征在于，所述UI设计稿在获取图层信息之前，进行UI设计稿的预处理，包括缩放和裁剪。

3.根据权利要求1所述的基于图神经网络的零碎图层检测方法，其特征在于，所述步骤1中的图层信息包括图层的类型，尺寸以及位置信息。

4.根据权利要求1所述的基于图神经网络的零碎图层检测方法，其特征在于，所述步骤1中的初始特征向量是由图层信息构建的特征矩阵与视觉特征矩阵拼接而成，所述视觉特征矩阵是通过卷积网络与全连接层对UI设计稿图层进行特征提取获得。

5.一种零碎图层检测装置，包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序，其特征在于，所述计算机存储器中采用权利要求1-4任一项所述的基于图神经网络的零碎图层检测方法。