CN114387608A - 一种联合卷积与图神经网络的表格结构识别方法 - Google Patents
一种联合卷积与图神经网络的表格结构识别方法 Download PDFInfo
- Publication number
- CN114387608A CN114387608A CN202210293274.9A CN202210293274A CN114387608A CN 114387608 A CN114387608 A CN 114387608A CN 202210293274 A CN202210293274 A CN 202210293274A CN 114387608 A CN114387608 A CN 114387608A
- Authority
- CN
- China
- Prior art keywords
- neural network
- graph
- convolution
- table structure
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种联合卷积与图神经网络的表格结构识别方法,其特征在于,所述方法包括:构建联合卷积图神经网络,所述的联合卷积神经网络包括深度二维卷积神经网络、二维卷积神经网络和图神经网络;利用不确定度加权的多任务学习损失函数训练所述的联合卷积图神经网络;使用二维卷积神经网络预测表格各单元格中心点坐标,基于中心点构建表格结构的图,利用所述的图神经网络对图的每条边进行分类;后处理算法处理分好类的表格结构的图,得到各单元格的结构属性,并转换为描述表格结构的标记语言。本发明方法提供一种端到端可训练的基于图神经网络显示建模表格结构的方法来高效识别表格结构。
Description
技术领域
本发明属于图像处理及模式识别技术领域,尤其涉及一种联合卷积与图神经网络的表格结构识别方法。
背景技术
表格是易于人理解的,强有力的信息展现工具,常出现在纸张照片或电子扫描图片形式的文档中,用于直观展示信息。但图像中的表格为非结构化数据,无法直接被计算机解析理解。而且表格存在共用行列单元格的情况,具有复杂的结构,加大了表格结构解析算法的开发难度。这些困难阻碍了文档中表格信息自动解析、识别及数字化技术的发展,因此亟需发明具有高精度识别图像中表格结构的计算机算法,以解决上述问题。
深度学习技术在表格结构识别任务上取得长足进展,目前基于深度学习的表格结构识别方法可以分为三种:基于分割及后处理的方式、基于图像到序列端到端的方式和基于图神经网络的方式。基于分割的方式得到的是各单元格、行或列的位置信息,还须依赖进一步的复杂后处理才能得到表格结构,这增加了算法的步骤以及引入了复杂后处理出错时新的识别误差。基于图像到序列端到端的方式,虽然省略了后续的处理步骤,一步到位地实现了图像结构的标记语言(如Latex、HTML等)的预测输出,但是现有模型没有显示地利用表格结构天然的逻辑关系信息,限制了模型的精度上限。基于图神经网络的方式,根据表格单元格结构关系,显示地建立图后应用图神经网络对图顶点、边进行分类或回归得到各单元格结构属性,实现表格结构的预测,但是该方法通常需要使用文本检测算法预先得到单元格各文本行的区域,然后再利用这些区域坐标来构建图,而非端到端可训练的方式,这导致一方面降低了模型的识别效率,另一方面没有在训练过程中结合单元格分割任务及图分类任务的标签信息以提高精度。
综上所述,现有表格结构识别方法还没有能显示建模表格结构的端到端识别方法,以同时提高模型识别精度及效率。因此,需要提供一种端到端可训练的基于图神经网络显示建模表格结构的方法来识别表格结构。
发明内容
有鉴于此,有必要针对上述技术问题,提供一种联合卷积与图神经网络的表格结构识别方法,所述方法提供了一种端到端可训练的基于图神经网络显示建模表格结构的方式,能够高精度、高效地识别表格结构。
一种联合卷积与图神经网络的表格结构识别方法,包括以下步骤:
步骤1,构建联合卷积图神经网络,所述的联合卷积神经网络包括深度二维卷积神经网络、二维卷积神经网络和图神经网络,所述的深度二维卷积神经网络输出的图像特征,作为所述的二维卷积神经网络和所述的图神经网络的输入;
步骤2,利用不确定度加权的多任务学习损失函数训练所述的联合卷积图神经网络;
步骤3,所述的深度二维卷积神经网络用于提取表格图像高维语义特征,使用二维卷积神经网络预测表格各单元格中心点坐标,基于中心点构建表格结构的图,利用所述的图神经网络对图的每条边进行分类;
步骤4,后处理算法处理分好类的表格结构的图,得到各单元格的结构属性,并转换为描述表格结构的标记语言。
进一步地,所述的基于中心点构建表格结构的图,包括如下步骤:
对每个顶点采用K-NN算法,构建图g的边;
根据边两个顶点的CNN特征向量,取均值得边的CNN特征向量,并拼接两顶点的x轴绝对与相对距离、y轴绝对与相对距离和绝对与相对欧式距离,得到每个边的特征向量v m ,其中m为边的编号:
其中H,W分别为图像的高与宽,由此获得图g=({f n }, {v m }, A),其中A为图g的邻接矩阵。
优选地,所述的预测表格各单元格中心点坐标,包括以下步骤:
利用轮廓中心矩求解每个轮廓的几何中心得到各单元格中心点的预测坐标。
具体地,所述各单元格的结构属性,包括起始行、列号和结束行列、列号。
更进一步地,所述后处理算法,包括以下步骤:
对分好类的图g的每个顶点按行进行排序,对于跨多行的节点,将行号取值为所有左同行相邻顶点中y值最小的顶点的行号,得到每个单元格起始行号;
对g每个顶点按行进行排序,对于跨多行的节点,将行号取值为所有左同行相邻顶点中y值最大的顶点的行号,得到每个单元格结束行号;
对g每个顶点按列进行排序,对于跨多列的节点,将列号取值为所有下同列相邻顶点中x值最小的顶点的列号,得到每个单元格起始列号;
对g每个顶点按列进行排序,对于跨多列的节点,将列号取值为所有下同列相邻顶点中x值最大的顶点的列号,得到每个单元格结束列号。
与现有技术相比,本发明的有益效果在于,本发明方法能够同时完成表格各单元格中心点坐标预测任务与表格结构的图分类任务,通过多任务学习方式联合训练中心点预测卷积神经网络与用于表格结构图分类的图神经网络,提高了网络整体预测的性能,能够高精度地对表格各单元格中心点连接构成的图的边关系进行分类,基于边分好类的图通过后处理计算各单元格结构属性,完成表格(全线表、各类省线表)结构的识别。
附图说明
图1示出了本发明实施方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了更好地理解本实施例的技术内容,先介绍一下本实施例中涉及到的术语解释。
端到端可训练:深度学习提供了一种端到端的学习范式,整个学习的流程并不进行人为的子问题划分,而是完全交给深度学习模型直接学习从原始数据到期望输出的映射。
卷积神经网络:卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一。
图神经网络:图神经网络(GNNs)是一种连接主义模型,它通过图节点之间的消息传递来捕获图的依赖性。
图卷积神经网络(GCN, Graph Convolutional Network):模型由图上的卷积操作构成的一种图神经网络。
图注意力网络(GAT, Graph Attention Network):模型由自注意力模块构成的一种图神经网络。
多任务学习:多任务学习(Multi-task learning)是和单任务学习(single-tasklearning)相对的一种机器学习方法。在机器学习领域,标准的算法理论是一次学习一个任务,也就是系统的输出为实数的情况,而多任务学习是一种联合学习,多个任务并行学习,结果相互影响。
损失函数:损失函数(loss function)或代价函数(cost function)是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在应用中,损失函数通常作为学习准则与优化问题相联系,即通过最小化损失函数求解和评估模型。
表格结构:一般用表格各单元格的结构属性来表示。结构属性包括单元格的起始行号、起始列号,结束行号、结束列号。
标记语言:是一种将文本以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的电脑文字编码。
HTML语言:超文本标记语言(HTML,Hyper Text Markup Language)是一种标记语言。它包括一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整体。
HRNet(High Resolution Net):高分辨率网络模型。
图1示出了本发明实施例的流程示意图。一种联合卷积与图神经网络的表格结构识别方法,包括以下步骤:
步骤1,构建联合卷积图神经网络,所述的联合卷积神经网络包括深度二维卷积神经网络、二维卷积神经网络和图神经网络,所述的深度二维卷积神经网络,分别接入所述的二维卷积神经网络和所述的图神经网络;
步骤2,利用不确定度加权的多任务学习损失函数训练所述的联合卷积图神经网络;
步骤3,所述的深度二维卷积神经网络用于提取表格图像高维语义特征,使用二维卷积神经网络预测表格各单元格中心点坐标,基于中心点构建表格结构的图,利用所述的图神经网络对图的每条边进行分类;
步骤4,后处理算法处理分好类的表格结构的图,得到各单元格的结构属性,并转换为描述表格结构的标记语言。
下面结合实例具体说明联合卷积与图神经网络的表格结构识别过程。
下面结合实例具体说明联合卷积与图神经网络的表格结构识别过程。
执行步骤1,构建联合卷积图神经网络,所述的联合卷积神经网络包括深度二维卷积神经网络、二维卷积神经网络和图神经网络,所述的深度二维卷积神经网络,分别接入所述的二维卷积神经网络和所述的图神经网络。
进一步地,所述的基于中心点构建表格结构的图,包括如下步骤:
对每个顶点采用K-NN算法,构建图g的边。首先取K值为20,然后构建以中心点为图顶点的完全图,并计算每条边的欧式距离;下一步,裁剪距离较远的边,以减少图的边数从而提高算法的计算速度,具体地,遍历完全图的每个顶点,遍历到某顶点时,具体的处理方式为,对该顶点的每条边按距离从小到大排序,仅保留前20条边(包括20),去除后20条边,当总边数小于20时则保留全部边,遍历地处理完所有顶点后,便完成图g的构建。
根据边两个顶点的CNN特征向量,取均值得边的CNN特征向量,并拼接两顶点的x轴绝对与相对距离、y轴绝对与相对距离和绝对与相对欧式距离,得到每个边的特征向量vm,其中m为边的编号:
其中H,W分别为图像的高与宽,由此获得图g=({fn}, {vm}, A),其中A为图g的邻接矩阵。
执行步骤2,利用不确定度加权的多任务学习损失函数训练所述的联合卷积图神经网络。
执行步骤3,使用二维卷积神经网络预测表格各单元格中心点坐标,基于中心点构建表格结构的图,利用所述的图神经网络对图的每条边进行分类。
所述的预测表格各单元格中心点坐标,包括以下步骤:
寻找二值图中所有连通区域的轮廓;
利用轮廓中心矩求解每个轮廓的几何中心得到各单元格中心点的预测坐标。
具体地,所述各单元格的结构属性,包括起始行、列号和结束行列、列号。
更进一步地,所述后处理算法,包括以下步骤:
对分好类的图g的每个顶点按行进行排序,对于跨多行的节点,将行号取值为所有左同行相邻顶点中y值最小的顶点的行号,得到每个单元格起始行号;
对g每个顶点按行进行排序,对于跨多行的节点,将行号取值为所有左同行相邻顶点中y值最大的顶点的行号,得到每个单元格结束行号;
对g每个顶点按列进行排序,对于跨多列的节点,将列号取值为所有下同列相邻顶点中x值最小的顶点的列号,得到每个单元格起始列号;
对g每个顶点按列进行排序,对于跨多列的节点,将列号取值为所有下同列相邻顶点中x值最大的顶点的列号,得到每个单元格结束列号。
本发明方法的技术原理是:本发明实施例中提出一个联合卷积神经网络及图神经网络的统一框架,支持端到的训练,从而提高了模型的预测以及训练效率。因为本方法显示地构建了表达表格结构的图,并用图神经网络进行边的分类,因此提升了模型整体识别结构的精度,且同时利用多任务损失函数联合训练了卷积神经网络以及图神经网络,充分地利用了各任务标签信息,因此进一步提升了识别精度。
执行步骤4,后处理算法处理分好类的表格结构的图,得到各单元格的结构属性,并转换为描述表格结构的标记语言。
具体的,基于各单元格的结构属性,转换成HTML语法描述的表格(HTML表格)。首先根据所有单元格的最大起始行号,确定HTML的<tr></tr>标签对个数,得到HTML表格的行数,然后依次根据每行的单元格数量,确定每个<tr></tr>标签对中<td></td>标签对的个数,最后根据结束行/列号与起始行/列号的差值得到各单元格的跨行/列属性值并回填到对应<td></td>标签对的属性赋值区,得到表格结构的完整HTML描述,完成标记语言HTML的转换过程。
以上实施例的各技术特征或步骤可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征或步骤所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
Claims (10)
1.一种联合卷积与图神经网络的表格结构识别方法,其特征在于,所述方法包括:
构建联合卷积图神经网络,所述的联合卷积神经网络包括深度二维卷积神经网络、二维卷积神经网络和图神经网络,所述的深度二维卷积神经网络输出的图像特征,作为所述的二维卷积神经网络和所述的图神经网络的输入;
利用不确定度加权的多任务学习损失函数训练所述的联合卷积图神经网络;
所述的深度二维卷积神经网络用于提取表格图像高维语义特征,使用二维卷积神经网络预测表格各单元格中心点坐标,基于中心点构建表格结构的图,利用所述的图神经网络对图的每条边进行分类;
后处理算法处理分好类的表格结构的图,得到各单元格的结构属性,并转换为描述表格结构的标记语言。
5.如权利要求3或4所述的一种联合卷积与图神经网络的表格结构识别方法,其特征在于,基于中心点构建表达表格结构的图,包括如下步骤:
对每个顶点采用K-NN算法,构建图g的边;
根据边两个顶点的CNN特征向量,取均值得边的CNN特征向量,并拼接两顶点的x轴绝对与相对距离、y轴绝对与相对距离和绝对与相对欧式距离,得到每个边的特征向量v m ,其中m为边的编号:
9.如权利要求8所述的一种联合卷积与图神经网络的表格结构识别方法,其特征在于,所述各单元格的结构属性,包括起始行、列号和结束行列、列号。
10.如权利要求9所述的一种联合卷积与图神经网络的表格结构识别方法,其特征在于,所述后处理算法,包括以下步骤:
对分好类的图g的每个顶点按行进行排序,对于跨多行的节点,将行号取值为所有左同行相邻顶点中y值最小的顶点的行号,得到每个单元格起始行号;
对g每个顶点按行进行排序,对于跨多行的节点,将行号取值为所有左同行相邻顶点中y值最大的顶点的行号,得到每个单元格结束行号;
对g每个顶点按列进行排序,对于跨多列的节点,将列号取值为所有下同列相邻顶点中x值最小的顶点的列号,得到每个单元格起始列号;
对g每个顶点按列进行排序,对于跨多列的节点,将列号取值为所有下同列相邻顶点中x值最大的顶点的列号,得到每个单元格结束列号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210293274.9A CN114387608B (zh) | 2022-03-24 | 2022-03-24 | 一种联合卷积与图神经网络的表格结构识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210293274.9A CN114387608B (zh) | 2022-03-24 | 2022-03-24 | 一种联合卷积与图神经网络的表格结构识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114387608A true CN114387608A (zh) | 2022-04-22 |
CN114387608B CN114387608B (zh) | 2022-06-21 |
Family
ID=81205718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210293274.9A Active CN114387608B (zh) | 2022-03-24 | 2022-03-24 | 一种联合卷积与图神经网络的表格结构识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114387608B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115639935A (zh) * | 2022-12-14 | 2023-01-24 | 亿海蓝(北京)数据技术股份公司 | 表格操作方法、装置和可读存储介质 |
CN117576699A (zh) * | 2023-11-06 | 2024-02-20 | 华南理工大学 | 一种基于深度学习的机车工单信息智能识别方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717617A (zh) * | 2019-09-09 | 2020-01-21 | 广东工业大学 | 一种基于深度图网络自编码器的无监督关系预测方法 |
CN110751038A (zh) * | 2019-09-17 | 2020-02-04 | 北京理工大学 | 一种基于图注意力机制的pdf表格结构识别方法 |
CN113221181A (zh) * | 2021-06-09 | 2021-08-06 | 上海交通大学 | 具有隐私保护的表格类信息抽取系统及方法 |
CN113297975A (zh) * | 2021-05-25 | 2021-08-24 | 新东方教育科技集团有限公司 | 表格结构识别的方法、装置、存储介质及电子设备 |
US20210319314A1 (en) * | 2020-04-09 | 2021-10-14 | Naver Corporation | End-To-End Graph Convolution Network |
US20210349954A1 (en) * | 2020-04-14 | 2021-11-11 | Naver Corporation | System and method for performing cross-modal information retrieval using a neural network using learned rank images |
-
2022
- 2022-03-24 CN CN202210293274.9A patent/CN114387608B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717617A (zh) * | 2019-09-09 | 2020-01-21 | 广东工业大学 | 一种基于深度图网络自编码器的无监督关系预测方法 |
CN110751038A (zh) * | 2019-09-17 | 2020-02-04 | 北京理工大学 | 一种基于图注意力机制的pdf表格结构识别方法 |
US20210319314A1 (en) * | 2020-04-09 | 2021-10-14 | Naver Corporation | End-To-End Graph Convolution Network |
US20210349954A1 (en) * | 2020-04-14 | 2021-11-11 | Naver Corporation | System and method for performing cross-modal information retrieval using a neural network using learned rank images |
CN113297975A (zh) * | 2021-05-25 | 2021-08-24 | 新东方教育科技集团有限公司 | 表格结构识别的方法、装置、存储介质及电子设备 |
CN113221181A (zh) * | 2021-06-09 | 2021-08-06 | 上海交通大学 | 具有隐私保护的表格类信息抽取系统及方法 |
Non-Patent Citations (1)
Title |
---|
李一仁等: "基于图卷积网络的表格结构提取", 《信息系统工程 》, no. 01, 20 January 2021 (2021-01-20), pages 132 - 134 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115639935A (zh) * | 2022-12-14 | 2023-01-24 | 亿海蓝(北京)数据技术股份公司 | 表格操作方法、装置和可读存储介质 |
CN117576699A (zh) * | 2023-11-06 | 2024-02-20 | 华南理工大学 | 一种基于深度学习的机车工单信息智能识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114387608B (zh) | 2022-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111489358B (zh) | 一种基于深度学习的三维点云语义分割方法 | |
CN114387608B (zh) | 一种联合卷积与图神经网络的表格结构识别方法 | |
Adhikari et al. | Iterative bounding box annotation for object detection | |
CN112434721A (zh) | 一种基于小样本学习的图像分类方法、系统、存储介质及终端 | |
RU2767162C2 (ru) | Сверточная нейронная сеть на основе октодерева | |
CN108334805B (zh) | 检测文档阅读顺序的方法和装置 | |
Moitra et al. | Cluster-based data reduction for persistent homology | |
CN113936287A (zh) | 基于人工智能的表格检测方法、装置、电子设备及介质 | |
CN111178196B (zh) | 一种细胞分类的方法、装置及设备 | |
Jiang et al. | Tabcellnet: Deep learning-based tabular cell structure detection | |
CN115797962A (zh) | 基于装配式建筑ai设计的墙柱识别方法及装置 | |
Juyal et al. | Multilabel image classification using the CNN and DC-CNN model on Pascal VOC 2012 dataset | |
Zhang et al. | Using BLSTM for interpretation of 2-D languages: case of handwritten mathematical expressions | |
CN115471833A (zh) | 一种动态局部自注意力卷积网络点云分析系统及方法 | |
Leon-Garza et al. | An interval type-2 fuzzy-based system to create building information management models from 2D floor plan images | |
CN114821188A (zh) | 图像处理方法、场景图生成模型的训练方法以及电子设备 | |
CN114154572A (zh) | 一种基于异构平台的异构数据集中接入分析方法 | |
CN114565752A (zh) | 一种基于类不可知前景挖掘的图像弱监督目标检测方法 | |
Aggarwal et al. | Object Detection Based Approaches in Image Classification: A Brief Overview | |
Anggoro et al. | Classification of Solo Batik patterns using deep learning convolutional neural networks algorithm | |
CN117608545B (zh) | 一种基于知识图谱的标准作业程序生成方法 | |
Mafipour et al. | Heuristic optimization for digital twin modeling of existing bridges from point cloud data by parametric prototype models | |
Zhou et al. | Deep learning and visual perception | |
Yang et al. | A precise and robust clustering approach using homophilic degrees of graph kernel | |
Moradi et al. | Revealing connectivity in residential Architecture: An algorithmic approach to extracting adjacency matrices from floor plans |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |