CN111553363B - 一种端到端的图章识别方法及系统 - Google Patents

一种端到端的图章识别方法及系统 Download PDF

Info

Publication number
CN111553363B
CN111553363B CN202010310895.4A CN202010310895A CN111553363B CN 111553363 B CN111553363 B CN 111553363B CN 202010310895 A CN202010310895 A CN 202010310895A CN 111553363 B CN111553363 B CN 111553363B
Authority
CN
China
Prior art keywords
text
network
text box
graph
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010310895.4A
Other languages
English (en)
Other versions
CN111553363A (zh
Inventor
朱军民
王勇
康铁钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yidao Boshi Technology Co ltd
Original Assignee
Beijing Yidao Boshi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yidao Boshi Technology Co ltd filed Critical Beijing Yidao Boshi Technology Co ltd
Priority to CN202010310895.4A priority Critical patent/CN111553363B/zh
Publication of CN111553363A publication Critical patent/CN111553363A/zh
Application granted granted Critical
Publication of CN111553363B publication Critical patent/CN111553363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种端到端的图章识别方法及系统,属于图像处理领域。该方法包括:输入原始图章图像,并提取原始图章图像的卷积网络特征图;基于卷积网络特征图,通过文本框定位网络定位原始图章图像中的文本框;通过卷积网络特征图和文本框的位置,获取文本框包含文字特征对应的文字编码,得到文本信息;通过卷积网络特征图和文本框的位置获取图网络特征,并通过图网络特征推理得到各文本框之间的关联关系;根据关联关系合并文本框以及文本信息,得到每一个关联的文本行几何信息以及相应的文本行信息,并输出结果。本发明可以处理所有可能的不规则的图章,在一个训练环节完成整个图章识别的所有步骤,真正做到自动化学习。

Description

一种端到端的图章识别方法及系统
技术领域
本发明涉及图像处理领域,尤其是一种端到端的图章识别方法及系统。
背景技术
在企业事业单位、银行、保险等等日常的工作中,有大量的合同、票据、公文、单据等正式的文档需要处理、检查、识别、结构化,其中很重要的一个工作就是检查这些正式文档是否有盖章,以及所盖的章是否正确,是否清晰可辨别等等。
以往的图章识别方法采用了多种传统图像处理方法(尤其OpenCV)或者多个深度学习的方法组合,步骤多,处理复杂,消耗内存,消耗时间。
深度学习模型在训练过程中,从输入端(输入数据)到输出端会得到一个预测结果,与真实结果相比较会得到一个误差,这个误差会在模型中的每一层传递(反向传播),每一层的表示都会根据这个误差来做调整,直到模型收敛或达到预期的效果才结束,中间所有的操作都包含在神经网络内部,不再分成多个模块处理。由原始数据输入,到结果输出,从输入端到输出端,中间的神经网络自成一体(也可以当做黑盒子看待),这即为端到端技术。
本发明提供了一个端到端的图章识别方法,可以处理诸如合同、发票、票据、单据、公文、报告中图章,如图1所示。根据图章的使用类别可以包括合同专用章、发票专用章、保险专用章、公司公章、政府公章等等,按照形状分,可以分为圆章、椭圆章、正方形章、长方形章、三角形章、菱形章、六边形章等等,按照取图方式分有扫描仪扫描、高拍仪拍摄、手机拍摄等等,按照颜色分红色、蓝色、灰色、二值图像等等。
发明介绍
本发明提供了一种端到端的完整图章识别方法及系统,可以处理所有可能的不规则的图章,在一个训练环节完成整个图章识别的所有步骤,真正做到自动化学习。
根据本发明的第一方面,提供一种端到端的图章识别方法,所述方法包括:
步骤1:输入原始图章图像,并提取所述原始图章图像的卷积网络特征图;
步骤2:基于卷积网络特征图,通过文本框定位网络定位所述原始图章图像中的文本框;
步骤3:通过卷积网络特征图和文本框的位置,获取文本框包含文字特征对应的文字编码,得到文本信息;
步骤4:通过卷积网络特征图和文本框的位置获取图网络特征,并通过所述图网络特征推理得到各文本框之间的关联关系;
步骤5:根据关联关系合并文本框以及文本信息,得到每一个关联的文本行几何信息以及相应的文本行信息,并输出结果。
进一步地,所述步骤1采用U型卷积神经网络提取所述原始图章图像的卷积网络特征图。
进一步地,所述U型卷积神经网络包括但不限于VGGNet、ResNet。
进一步地,步骤1前还包括图章类型检测步骤。
进一步地,步骤2中,所述文本框定位网络包括但不限于图像分割网络、字符框回归网络或者RCNN系列网络。
进一步地,所述步骤3具体包括:
步骤31:根据文本框的位置,将文本框映射到卷积网络特征图中;
步骤32:提取文本框内已有的卷积网络特征;
步骤33:经过全连接神经网络,得到各文本框包含文字特征对应的文字编码,基于文字编码得到相应的文本信息。
进一步地,所述步骤4具体包括:
步骤41:对文本框的坐标信息进行卷积网络特征嵌入;
步骤42:提取文本框下面已有的卷积网络特征;
步骤43:提取该文本框跟周边其他文本框的局部图特征;
步骤44:将嵌入的卷积网络特征、已有的卷积网络特征以及局部图特征进行融合,形成图网络特征;
步骤45:将所述图网络特征输入图卷积神经网络,计算各文本框相互之间的关联关系,通过关联关系表述文本框之间的先后顺序以及连接关系。
进一步地,步骤41中,文本框的坐标信息形式为(x,y,Θ,w,h),x表示文本框距y轴距离,y表示文本框距x轴距离,Θ表示文本框与水平线夹角,w表示文本框宽度,h表示文本框高度。
进一步地,步骤43中,根据(x,y)的关系提取该文本框跟周边其他文本框的局部图特征。
进一步地,步骤44中,将嵌入的卷积网络特征、已有的卷积网络特征以及局部图特征进行融合的方式为:
步骤441:将文字框的坐标信息通过几何特征嵌入(embedding)方法,得到第一特征向量(矩阵);
步骤442:提取文本框下面已有的卷积网络特征,并展开成第二特征向量(矩阵);
步骤443:将第一特征向量(矩阵)和第二特征向量(矩阵)进行concat,得到该文本框的节点特征向量矩阵,并进行特征的归一化,得到归一化特征向量矩阵F;
步骤444:以文本框几何中心点为中心节点,依据空间相似度寻找中心节点的二阶邻阶,得到文本框的相邻特征向量矩阵A,相邻的置为1,不相邻的置为0;
步骤445:最后得到局部融合特征(A,F)。
根据本发明的第二方面,提供一种端到端的图章识别系统,所述系统包括:处理器和用于存储可执行指令的存储器;其中,所述处理器被配置为执行所述可执行指令,以执行如以上任一方面所述的端到端的图章识别方法。
根据本发明的第三方面,提供一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如以上任一方面所述的端到端的图章识别方法。
本发明的有益效果包括:
1、在一个端到端的网络里面集成了图章识别所需的所有的功能,包含字符定位、字符识别、字符框的管理关系抽取,最后完成图章中文本行信息提取过程,在一个统一的训练框架下完成一个完整的步骤,无需将这一过程分成多个分离的网络,极大提高了图章识别的可靠性,可训练性。
2、在这个整体网络中,各个子模块之间共享了最大的信息量,
特别是前面的卷积网络特征提取特征;这样最大范围共享特征,加速了训练和推理的过程,使得网络更容易训练;
3、利用图卷积网络获得各个文本框之间的相互关系和字符顺序关系,解决了图章字符任意形状排列导致常规分析语义不清晰的问题,用机器学习的图神经网络来学习这种关联关系,使得无需设计人工规则,极大统一了规则库的学习。
4、该方法能够适应各种排列方式和几何形状的图章,使得图章识别可以在一个统一的、整体的、端到端的网络一把完成,具有很好的工程价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1示出现有技术中各种形状的章;
图2示出根据本发明实施例的一种端到端的图章识别方法流程图;
图3示出根据本发明实施例的图章识别数据流示意图;
图4示出根据本发明实施例的特征提取网络结构示意图;
图5示出根据本发明实施例的字符文本框预测结果示意图;
图6示出根据本发明实施例的文字识别结果示意图;
图7示出根据本发明实施例的图网络特征提取过程流程图;
图8示出根据本发明实施例的文本框的关联关系示意图;
图9示出根据本发明实施例的合并得到文字行几何信息和文字信息示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
多个,包括两个或者两个以上。
和/或,应当理解,对于本公开中使用的术语“和/或”,其仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
实施例
根据本发明,提供了一种图章识别方法方法,整个流程图如图2-3所示,具体包括:
1、卷积网络特征提取
利用卷积神经网络对输入图像进行特征提取,本申请选用了一个U型网络,主干网络是VGG类似或者其他Resnet等等,如图4所示,先下采样然后进行向上融合,这是一种典型网络,对于输出的特征层称作卷积网络特征。
2、字符文本框预测
根据卷积网络特征,马上接上文本框网络子网络,文本框子网络可以是图像分割网络(如Pixellink、TextField等等)、或者是字符框回归网络(EAST、Textboxes等等),或者RCNN系列网络。该网络产生图像中每一个字符的文本框,如图5所示。
在这个方法中,卷积网络特征已经被提取了,所以主干网络无线计算,只是利用上述方法中的预测输出部分。
3、字符分类识别
根据步骤2得到的文本框以及步骤1得到特征图,提取文本框内已有的卷积网络特征向量,直接进行全连接FC网络,得到该文本框包含文字特征对应的文字编码,如图6所示。
4、局部图特征提取
根据步骤1的卷积网络特征和步骤2得到的预测文本框,
提取相应的图网络特征。对于每一个文本框,本申请提取三个特征:
1)对文本框坐标信息(x,y,Θ,w,h)进行特征嵌入;
2)同时提取该框下面已有的卷积网络特征,
3)根据(x,y)的关系,提取其跟周边其他文本框的局部图特征
将这三个特征进行融合,得到局部图融合特征。图7示出一种生成局部图特征的方式:
a)将文字框定位的几何特征(x,y,Θ,w,h)通过几何特征嵌入(embedding)的方法,得到相应的特征向量(矩阵);
b)提取对应文本框位置下的卷积网络特征,并展开成对应的特征向量(矩阵);
c)将步骤1和步骤2生成的特征进行concat,得到该文本框的节点特征矩阵,并进行特征的归一化F;
d)以文本框中心点为中心点依据空间相似度寻找中心节点的二阶邻阶,得到所有框的相邻矩阵A,相邻的置为1,不相邻的置为0;
e)最后得到局部图的融合特征(A,F)。
5、图卷积网络推理
将局部图的融合特征输入一个图卷积神经网络(GCN Graph ConvolutionalNetwork),计算各个文本框相互之间的关联关系,通过关联关系表述文本框之间的先后顺序以及连接关系,如图8所示。
6、将图网络推理得到的关联关系合并文本框及其文本
将图网络推理得到的关联关系合并文本框以及文本,得到每一个关联的文字行几何信息以及相应的文本行信息,如图9所示。
7、输出图章文本串
将图章识别的所有文字行及其每一个字符的文本框、文字编码输出成JSON、xml、txt等格式。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (8)

1.一种端到端的图章识别方法,其特征在于,所述方法包括:
步骤1:输入原始图章图像,并提取所述原始图章图像的卷积网络特征图;
步骤2:基于卷积网络特征图,通过文本框定位网络定位所述原始图章图像中的文本框;
步骤3:通过卷积网络特征图和文本框的位置,获取文本框包含文字特征对应的文字编码,得到文本信息;
步骤4:通过卷积网络特征图和文本框的位置,获取图网络特征,并通过所述图网络特征推理得到各文本框之间的关联关系;
步骤5:根据关联关系合并文本框以及文本信息,得到每一个关联的文本行几何信息以及相应的文本行信息,并输出结果,
其中,所述步骤4具体包括:
步骤41:对文本框的坐标信息进行卷积网络特征嵌入;
步骤42:提取文本框内已有的卷积网络特征;
步骤43:提取该文本框跟周边其他文本框的局部图特征;
步骤44:将嵌入的卷积网络特征、已有的卷积网络特征以及局部图特征进行融合,形成图网络特征;
步骤45:将所述图网络特征输入图卷积神经网络,计算各文本框相互之间的关联关系,通过关联关系表述文本框之间的先后顺序以及连接关系,
其中,步骤44中,将嵌入的卷积网络特征、已有的卷积网络特征以及局部图特征进行融合的方式为:
步骤441:将文字框的坐标信息通过几何特征嵌入方法,得到第一特征向量;
步骤442:提取文本框内已有的卷积网络特征,并展开成第二特征向量;
步骤443:将第一特征向量和第二特征向量进行concat,得到该文本框的节点特征向量,并进行特征的归一化,得到归一化特征向量F;
步骤444:以文本框几何中心点为中心节点,依据空间相似度寻找中心节点的二阶邻阶,得到文本框的相邻特征向量A,相邻的置为1,不相邻的置为0;
步骤445:最后得到图网络特征(A,F)。
2.根据权利要求1所述的图章识别方法,其特征在于,步骤1中,采用U型卷积神经网络提取所述原始图章图像的卷积网络特征图。
3.根据权利要求1所述的图章识别方法,其特征在于,步骤2中,所述文本框定位网络包括但不限于图像分割网络、字符框回归网络或者RCNN系列网络。
4.根据权利要求1所述的图章识别方法,其特征在于,所述步骤3具体包括:
步骤31:根据文本框的位置,将文本框映射到卷积网络特征图中;
步骤32:提取文本框内已有的卷积网络特征;
步骤33:经过全连接神经网络,得到各文本框包含文字特征对应的文字编码,基于文字编码得到相应的文本信息。
5.根据权利要求1所述的图章识别方法,其特征在于,步骤41中,文本框的坐标信息形式为(x,y,Θ,w,h),x表示文本框距y轴距离,y表示文本框距x轴距离,Θ表示文本框与水平线夹角,w表示文本框宽度,h表示文本框高度。
6.根据权利要求5所述的图章识别方法,其特征在于,步骤43中,根据(x,y)的关系提取该文本框跟周边其他文本框的局部图特征。
7.一种端到端的图章识别系统,其特征在于,所述系统包括:处理器和用于存储可执行指令的存储器;其中,所述处理器被配置为执行所述可执行指令,以执行如权利要求1至6中任一项所述的端到端的图章识别方法。
8.一种计算机可读存储介质,其特征在于,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的端到端的图章识别方法。
CN202010310895.4A 2020-04-20 2020-04-20 一种端到端的图章识别方法及系统 Active CN111553363B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010310895.4A CN111553363B (zh) 2020-04-20 2020-04-20 一种端到端的图章识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010310895.4A CN111553363B (zh) 2020-04-20 2020-04-20 一种端到端的图章识别方法及系统

Publications (2)

Publication Number Publication Date
CN111553363A CN111553363A (zh) 2020-08-18
CN111553363B true CN111553363B (zh) 2023-08-04

Family

ID=72000196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010310895.4A Active CN111553363B (zh) 2020-04-20 2020-04-20 一种端到端的图章识别方法及系统

Country Status (1)

Country Link
CN (1) CN111553363B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016438B (zh) * 2020-08-26 2021-08-10 北京嘀嘀无限科技发展有限公司 一种基于图神经网络识别证件的方法及系统
CN112232149B (zh) * 2020-09-28 2024-04-16 北京易道博识科技有限公司 一种文档多模信息和关系提取方法及系统
CN112464781B (zh) * 2020-11-24 2023-06-02 厦门理工学院 基于图神经网络的文档图像关键信息提取及匹配方法
CN115640401B (zh) * 2022-12-07 2023-04-07 恒生电子股份有限公司 文本内容提取方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033000A (zh) * 2019-03-21 2019-07-19 华中科技大学 一种票据图像的文本检测与识别方法
CN110147786A (zh) * 2019-04-11 2019-08-20 北京百度网讯科技有限公司 用于检测图像中的文本区域的方法、装置、设备以及介质
CN110363252A (zh) * 2019-07-24 2019-10-22 山东大学 趋向于端到端的场景文字检测与识别方法以及系统
CN110377686A (zh) * 2019-07-04 2019-10-25 浙江大学 一种基于深度神经网络模型的地址信息特征抽取方法
CN110472242A (zh) * 2019-08-05 2019-11-19 腾讯科技(深圳)有限公司 一种文本处理方法、装置和计算机可读存储介质
CN110472003A (zh) * 2019-08-08 2019-11-19 东北大学 基于图卷积网络的社交网络文本情感细粒度分类方法
CN110502626A (zh) * 2019-08-27 2019-11-26 重庆大学 一种基于卷积神经网络的方面级情感分析方法
CN110580292A (zh) * 2019-08-28 2019-12-17 腾讯科技(深圳)有限公司 一种文本标签生成方法、装置和计算机可读存储介质
CN110909867A (zh) * 2019-11-26 2020-03-24 南通恒趣新材料有限公司 一种基于力导图的图神经网络可视分析方法
CN110929721A (zh) * 2019-10-28 2020-03-27 世纪保众(北京)网络科技有限公司 文本切割方法、装置、计算机设备和存储介质
CN110928997A (zh) * 2019-12-04 2020-03-27 北京文思海辉金信软件有限公司 意图识别方法、装置、电子设备及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3598339A1 (en) * 2018-07-19 2020-01-22 Tata Consultancy Services Limited Systems and methods for end-to-end handwritten text recognition using neural networks

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033000A (zh) * 2019-03-21 2019-07-19 华中科技大学 一种票据图像的文本检测与识别方法
CN110147786A (zh) * 2019-04-11 2019-08-20 北京百度网讯科技有限公司 用于检测图像中的文本区域的方法、装置、设备以及介质
CN110377686A (zh) * 2019-07-04 2019-10-25 浙江大学 一种基于深度神经网络模型的地址信息特征抽取方法
CN110363252A (zh) * 2019-07-24 2019-10-22 山东大学 趋向于端到端的场景文字检测与识别方法以及系统
CN110472242A (zh) * 2019-08-05 2019-11-19 腾讯科技(深圳)有限公司 一种文本处理方法、装置和计算机可读存储介质
CN110472003A (zh) * 2019-08-08 2019-11-19 东北大学 基于图卷积网络的社交网络文本情感细粒度分类方法
CN110502626A (zh) * 2019-08-27 2019-11-26 重庆大学 一种基于卷积神经网络的方面级情感分析方法
CN110580292A (zh) * 2019-08-28 2019-12-17 腾讯科技(深圳)有限公司 一种文本标签生成方法、装置和计算机可读存储介质
CN110929721A (zh) * 2019-10-28 2020-03-27 世纪保众(北京)网络科技有限公司 文本切割方法、装置、计算机设备和存储介质
CN110909867A (zh) * 2019-11-26 2020-03-24 南通恒趣新材料有限公司 一种基于力导图的图神经网络可视分析方法
CN110928997A (zh) * 2019-12-04 2020-03-27 北京文思海辉金信软件有限公司 意图识别方法、装置、电子设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的自然场景文本检测;袁琪;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200215(第(2020)04期);I138-1849 *

Also Published As

Publication number Publication date
CN111553363A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN111553363B (zh) 一种端到端的图章识别方法及系统
US10762376B2 (en) Method and apparatus for detecting text
CN109543690B (zh) 用于提取信息的方法和装置
CN112232149B (zh) 一种文档多模信息和关系提取方法及系统
US10891329B2 (en) Image recognition method and image recognition apparatus
CN111931664A (zh) 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN109740515B (zh) 一种评阅方法及装置
CN111160352A (zh) 一种基于图像分割的工件金属表面文字识别方法及系统
CN115457531A (zh) 用于识别文本的方法和装置
CN113435240B (zh) 一种端到端的表格检测和结构识别方法及系统
CN111178290A (zh) 一种签名验证方法和装置
Den Hartog et al. Knowledge-based interpretation of utility maps
CN116311214B (zh) 车牌识别方法和装置
CN112686219A (zh) 手写文本识别方法及计算机存储介质
CN115810197A (zh) 一种多模态电力表单识别方法及装置
CN112597925B (zh) 手写字迹的识别/提取、擦除方法及擦除系统、电子设备
CN114758341A (zh) 一种智能化合同图像识别与合同要素抽取方法及装置
CN112365451B (zh) 图像质量等级的确定方法、装置、设备及计算机可读介质
CN114445620A (zh) 一种改进Mask R-CNN的目标分割方法
CN113496212A (zh) 箱式结构的文本识别方法、装置及电子设备
CN114155540B (zh) 基于深度学习的文字识别方法、装置、设备及存储介质
CN111274863A (zh) 一种基于文本山峰概率密度的文本预测方法
CN116912872A (zh) 图纸识别方法、装置、设备及可读存储介质
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
CN115909378A (zh) 单据文本检测模型的训练方法及单据文本检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 office A-501, 5th floor, building 2, yard 1, Nongda South Road, Haidian District, Beijing

Applicant after: BEIJING YIDAO BOSHI TECHNOLOGY Co.,Ltd.

Address before: 100083 office a-701-1, a-701-2, a-701-3, a-701-4, a-701-5, 7th floor, building 2, No.1 courtyard, Nongda South Road, Haidian District, Beijing

Applicant before: BEIJING YIDAO BOSHI TECHNOLOGY Co.,Ltd.

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zhu Junmin

Inventor after: Wang Yong

Inventor after: Kang Tiegang

Inventor before: Zhu Junmin

Inventor before: Wang Yong

Inventor before: Kang Tiegang

GR01 Patent grant
GR01 Patent grant