CN111986220A - 一种基于图像变换的环形文本检测和识别方法 - Google Patents

一种基于图像变换的环形文本检测和识别方法 Download PDF

Info

Publication number
CN111986220A
CN111986220A CN202010866455.7A CN202010866455A CN111986220A CN 111986220 A CN111986220 A CN 111986220A CN 202010866455 A CN202010866455 A CN 202010866455A CN 111986220 A CN111986220 A CN 111986220A
Authority
CN
China
Prior art keywords
image
text
annular
area
circle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010866455.7A
Other languages
English (en)
Inventor
高飞
葛逸凡
卢书芳
翁立波
张元鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010866455.7A priority Critical patent/CN111986220A/zh
Publication of CN111986220A publication Critical patent/CN111986220A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/66Analysis of geometric attributes of image moments or centre of gravity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像变换的环形文本检测和识别方法,首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果。相比于现有的环形文本检测和识别技术,本发明所提出的方法时间消耗短、识别准确率高并且不会因为图像变换而丢失原有的语义信息。

Description

一种基于图像变换的环形文本检测和识别方法
技术领域
本发明涉及图像处理和场景文字检测识别技术领域,具体为一种基于图像变换的环形文本检测和识别方法。
背景技术
文本作为图像中的高层语义信息,能够帮助人们更好地理解图像。将图像中的文本通过计算机技术识别出,是实现人工智能技术的基础。相比于光学字符识别(OCR技术),自然场景下的文字识别具有更高的难度。而在自然场景文字识别领域中,相比于水平或竖直文本的识别,曲线文本甚至是环形文本的识别挑战性更大。因此,提出一种能够高效、精准的环形文本检测和识别方法具有重要的意义。
针对环形文本的检测和识别,国内外专家和学者展开了重点研究。其中与本发明较为接近的包括:。发明专利(发明人:李辉;朱文康;申胜男;方启航;谭震彪,申请号:CN201910920945.8,名称:环形文字快速识别方法及装置)通过深度神经网络YOLO算法检测图像中的环形区域,通过坐标转换方法将环形文字带转换为矩形文字带,通过深度神经网络YOLO算法定位转换后图像中的文字区域,将定位到的文字区域进行分割和校正,得到各个字符图像,将每个分割好的字符图像进行神经网络的字符识别,得出文字的识别结果。
在现有环形文本检测方法中,存在如下不足:1)以上方法所提到的采用深度神经网络YOLO算法来检测图像中的环形区域,该方法对运行设备资源占用率大、时间消耗长;2)通过基于坐标转换方法转换后的图像在边缘处平滑度不高,容易丢失细节信息;3)在图像转换之前未检测文本在环形区域中的位置,直接转换图像可能会导致因为对单个文字的切分或对某段文字的切分而造成的语义信息丢失的问题。
发明内容
为解决现有方法的不足,本发明提出一种基于图像变换的针对环形文本检测和识别方法;首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果,用于解决现有环形文本检测和识别技术中效率低、精度差、容易丢失语义信息等问题。
本发明的技术方案如下:
一种基于图像变换的环形文本检测和识别方法,其特征在于,包括如下步骤:
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk);
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dk<δ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示满足条件的圆的数量,δ表示距离阈值常数;
Figure BDA0002649892700000021
步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;
步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:
步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;
Figure BDA0002649892700000031
Figure BDA0002649892700000032
其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;
步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0的像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;
步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;
步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);
Figure BDA0002649892700000033
其中Δθq=max(Δθ1,Δθ2,...,ΔθKSL) (4)
步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:
步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目;
Figure BDA0002649892700000041
其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;
步骤3.3:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;
Figure BDA0002649892700000042
步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;
步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;
步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。
本发明的优点是:本发明提出一种针对环形文本检测和识别方法。首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS(Thin-Plate-Spline transforms)插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果。相比于现有的环形文本检测和识别技术,本发明所提出的方法时间消耗短、识别准确率高并且不会因为图像变换而丢失原有的语义信息。
附图说明
图1为霍夫圆检测后的效果;
图2为变换后的图像;
图3为文本区域中的图像;
图中:R1为L中半径最大的圆;R2为L′中除了R1之外半径最大的圆;s1-s8第1-8个组合字符簇所在的最小外接矩形。
具体实施方式
下面结合实施例和图片来详细阐述本发明。
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk),在本实施例中,λ=20;
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数,在本实施例中,λ0=5;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dk<δ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示保留后的检测圆的数量,δ表示距离阈值常数,在本实施例中,δ=10;
Figure BDA0002649892700000061
步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;如图1所示,最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;
步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:
步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;
Figure BDA0002649892700000062
Figure BDA0002649892700000063
其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;
步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;
步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;
步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);
Figure BDA0002649892700000064
其中
Figure BDA0002649892700000065
步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:
步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目,在本实施例中N=36;
Figure BDA0002649892700000071
其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;
步骤3.2:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;
Figure BDA0002649892700000072
步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;得到矫正后的图像如图2所示;
步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;如图3所示为s5所包围的图像;
步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。

Claims (1)

1.一种基于图像变换的环形文本检测和识别方法,其特征在于,包括:
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk);
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dk<δ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示满足条件的圆的数量,δ表示距离阈值常数;
Figure FDA0002649892690000011
步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;
步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:
步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;
Figure FDA0002649892690000012
Figure FDA0002649892690000013
其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;
步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0的像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;
步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;
步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);
Figure FDA0002649892690000021
其中
Figure FDA0002649892690000024
步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:
步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目;
Figure FDA0002649892690000022
其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;
步骤3.3:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;
Figure FDA0002649892690000023
步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;
步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;
步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。
CN202010866455.7A 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法 Withdrawn CN111986220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010866455.7A CN111986220A (zh) 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010866455.7A CN111986220A (zh) 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法

Publications (1)

Publication Number Publication Date
CN111986220A true CN111986220A (zh) 2020-11-24

Family

ID=73442624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010866455.7A Withdrawn CN111986220A (zh) 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法

Country Status (1)

Country Link
CN (1) CN111986220A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990134A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 图像仿真方法、装置、电子设备及存储介质
CN113378821A (zh) * 2021-07-02 2021-09-10 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质
CN113516123A (zh) * 2021-05-14 2021-10-19 南京工程学院 一种针对轮胎压印字符的检测识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990134A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 图像仿真方法、装置、电子设备及存储介质
CN112990134B (zh) * 2021-04-29 2021-08-20 北京世纪好未来教育科技有限公司 图像仿真方法、装置、电子设备及存储介质
CN113516123A (zh) * 2021-05-14 2021-10-19 南京工程学院 一种针对轮胎压印字符的检测识别方法
CN113516123B (zh) * 2021-05-14 2023-11-24 南京工程学院 一种针对轮胎压印字符的检测识别方法
CN113378821A (zh) * 2021-07-02 2021-09-10 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质
CN113378821B (zh) * 2021-07-02 2023-02-28 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111986220A (zh) 一种基于图像变换的环形文本检测和识别方法
Fey et al. Splinecnn: Fast geometric deep learning with continuous b-spline kernels
Dong et al. Ellipse R-CNN: Learning to infer elliptical object from clustering and occlusion
CN111160440B (zh) 一种基于深度学习的安全帽佩戴检测方法及装置
CN111862289B (zh) 一种基于gan网络的点云上采样方法
CN110163093B (zh) 一种基于遗传算法的路牌识别对抗防御方法
Xu et al. icurb: Imitation learning-based detection of road curbs using aerial images for autonomous driving
AU2006252025A1 (en) Recognition of parameterised shapes from document images
CN109815948B (zh) 一种复杂场景下的试卷分割算法
US20190163750A1 (en) System for the automatic separation of documents in a batch of documents
CN111222447A (zh) 基于神经网络及多通道融合lbp特征的活体检测方法
US12033364B2 (en) Method, system, and computer-readable medium for using face alignment model based on multi-task convolutional neural network-obtained data
CN110889385A (zh) 一种基于局部邻近注意力的手写文本识别方法
CN111126173A (zh) 一种高精度人脸检测方法
KR20200133424A (ko) 자기조직 생성망 학습 방법 및 시스템
CN115797639A (zh) 一种基于多视图一致性的文本监督语义分割算法
CN107679505B (zh) 一种实现对手写体字符拒识的方法
CN115690811A (zh) 一种基于深度学习的点阵字符识别方法
CN115688234A (zh) 一种基于条件卷积的建筑布局生成方法、装置及介质
KR20190085584A (ko) 인공지능기반 휴대용 디스플레이 시스템과 연계된 문자래스터 매핑시스템
CN113177599A (zh) 一种基于gan的强化样本生成方法
Viswanathan et al. Text to image translation using generative adversarial networks
CN113705562A (zh) 目标区域确定方法、装置、设备及存储介质
CN113538615A (zh) 基于双流生成器深度卷积对抗生成网络的遥感图像上色方法
CN112883957B (zh) 一种车胎文本检测和识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201124