CN111986220A - 一种基于图像变换的环形文本检测和识别方法 - Google Patents

一种基于图像变换的环形文本检测和识别方法 Download PDF

Info

Publication number
CN111986220A
CN111986220A CN202010866455.7A CN202010866455A CN111986220A CN 111986220 A CN111986220 A CN 111986220A CN 202010866455 A CN202010866455 A CN 202010866455A CN 111986220 A CN111986220 A CN 111986220A
Authority
CN
China
Prior art keywords
image
text
area
circle
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010866455.7A
Other languages
English (en)
Inventor
高飞
葛逸凡
卢书芳
翁立波
张元鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010866455.7A priority Critical patent/CN111986220A/zh
Publication of CN111986220A publication Critical patent/CN111986220A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/66Analysis of geometric attributes of image moments or centre of gravity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像变换的环形文本检测和识别方法,首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果。相比于现有的环形文本检测和识别技术,本发明所提出的方法时间消耗短、识别准确率高并且不会因为图像变换而丢失原有的语义信息。

Description

一种基于图像变换的环形文本检测和识别方法
技术领域
本发明涉及图像处理和场景文字检测识别技术领域,具体为一种基于图像变换的环形文本检测和识别方法。
背景技术
文本作为图像中的高层语义信息,能够帮助人们更好地理解图像。将图像中的文本通过计算机技术识别出,是实现人工智能技术的基础。相比于光学字符识别(OCR技术),自然场景下的文字识别具有更高的难度。而在自然场景文字识别领域中,相比于水平或竖直文本的识别,曲线文本甚至是环形文本的识别挑战性更大。因此,提出一种能够高效、精准的环形文本检测和识别方法具有重要的意义。
针对环形文本的检测和识别,国内外专家和学者展开了重点研究。其中与本发明较为接近的包括:。发明专利(发明人:李辉;朱文康;申胜男;方启航;谭震彪,申请号:CN201910920945.8,名称:环形文字快速识别方法及装置)通过深度神经网络YOLO算法检测图像中的环形区域,通过坐标转换方法将环形文字带转换为矩形文字带,通过深度神经网络YOLO算法定位转换后图像中的文字区域,将定位到的文字区域进行分割和校正,得到各个字符图像,将每个分割好的字符图像进行神经网络的字符识别,得出文字的识别结果。
在现有环形文本检测方法中,存在如下不足:1)以上方法所提到的采用深度神经网络YOLO算法来检测图像中的环形区域,该方法对运行设备资源占用率大、时间消耗长;2)通过基于坐标转换方法转换后的图像在边缘处平滑度不高,容易丢失细节信息;3)在图像转换之前未检测文本在环形区域中的位置,直接转换图像可能会导致因为对单个文字的切分或对某段文字的切分而造成的语义信息丢失的问题。
发明内容
为解决现有方法的不足,本发明提出一种基于图像变换的针对环形文本检测和识别方法;首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果,用于解决现有环形文本检测和识别技术中效率低、精度差、容易丢失语义信息等问题。
本发明的技术方案如下:
一种基于图像变换的环形文本检测和识别方法,其特征在于,包括如下步骤:
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk);
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dk<δ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示满足条件的圆的数量,δ表示距离阈值常数;
Figure BDA0002649892700000021
步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;
步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:
步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;
Figure BDA0002649892700000031
Figure BDA0002649892700000032
其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;
步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0的像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;
步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;
步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);
Figure BDA0002649892700000033
其中Δθq=max(Δθ1,Δθ2,...,ΔθKSL) (4)
步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:
步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目;
Figure BDA0002649892700000041
其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;
步骤3.3:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;
Figure BDA0002649892700000042
步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;
步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;
步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。
本发明的优点是:本发明提出一种针对环形文本检测和识别方法。首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS(Thin-Plate-Spline transforms)插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果。相比于现有的环形文本检测和识别技术,本发明所提出的方法时间消耗短、识别准确率高并且不会因为图像变换而丢失原有的语义信息。
附图说明
图1为霍夫圆检测后的效果;
图2为变换后的图像;
图3为文本区域中的图像;
图中:R1为L中半径最大的圆;R2为L′中除了R1之外半径最大的圆;s1-s8第1-8个组合字符簇所在的最小外接矩形。
具体实施方式
下面结合实施例和图片来详细阐述本发明。
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk),在本实施例中,λ=20;
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数,在本实施例中,λ0=5;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dk<δ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示保留后的检测圆的数量,δ表示距离阈值常数,在本实施例中,δ=10;
Figure BDA0002649892700000061
步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;如图1所示,最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;
步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:
步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;
Figure BDA0002649892700000062
Figure BDA0002649892700000063
其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;
步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;
步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;
步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);
Figure BDA0002649892700000064
其中
Figure BDA0002649892700000065
步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:
步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目,在本实施例中N=36;
Figure BDA0002649892700000071
其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;
步骤3.2:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;
Figure BDA0002649892700000072
步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;得到矫正后的图像如图2所示;
步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;如图3所示为s5所包围的图像;
步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。

Claims (1)

1.一种基于图像变换的环形文本检测和识别方法,其特征在于,包括:
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk);
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dk<δ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示满足条件的圆的数量,δ表示距离阈值常数;
Figure FDA0002649892690000011
步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;
步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:
步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;
Figure FDA0002649892690000012
Figure FDA0002649892690000013
其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;
步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0的像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;
步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;
步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);
Figure FDA0002649892690000021
其中
Figure FDA0002649892690000024
步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:
步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目;
Figure FDA0002649892690000022
其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;
步骤3.3:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;
Figure FDA0002649892690000023
步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;
步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;
步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。
CN202010866455.7A 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法 Withdrawn CN111986220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010866455.7A CN111986220A (zh) 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010866455.7A CN111986220A (zh) 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法

Publications (1)

Publication Number Publication Date
CN111986220A true CN111986220A (zh) 2020-11-24

Family

ID=73442624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010866455.7A Withdrawn CN111986220A (zh) 2020-08-25 2020-08-25 一种基于图像变换的环形文本检测和识别方法

Country Status (1)

Country Link
CN (1) CN111986220A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990134A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 图像仿真方法、装置、电子设备及存储介质
CN113378821A (zh) * 2021-07-02 2021-09-10 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质
CN113516123A (zh) * 2021-05-14 2021-10-19 南京工程学院 一种针对轮胎压印字符的检测识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990134A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 图像仿真方法、装置、电子设备及存储介质
CN112990134B (zh) * 2021-04-29 2021-08-20 北京世纪好未来教育科技有限公司 图像仿真方法、装置、电子设备及存储介质
CN113516123A (zh) * 2021-05-14 2021-10-19 南京工程学院 一种针对轮胎压印字符的检测识别方法
CN113516123B (zh) * 2021-05-14 2023-11-24 南京工程学院 一种针对轮胎压印字符的检测识别方法
CN113378821A (zh) * 2021-07-02 2021-09-10 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质
CN113378821B (zh) * 2021-07-02 2023-02-28 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109344874B (zh) 一种基于深度学习的染色体自动分析方法及系统
CN110929665B (zh) 一种自然场景曲线文本检测方法
CN111986220A (zh) 一种基于图像变换的环形文本检测和识别方法
US8238666B2 (en) Recognition of parameterised shapes from document images
CN110689482B (zh) 一种基于有监督逐像素生成对抗网络的人脸超分辨率方法
CN108108746A (zh) 基于Caffe深度学习框架的车牌字符识别方法
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
US7991233B2 (en) Method and apparatus for dynamic connector analysis
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
CN111553346A (zh) 一种基于字符区域感知的场景文本检测方法
CN113569194B (zh) 用于目标检测的旋转矩形框表示及回归方法
CN106503694A (zh) 基于八邻域特征的数字识别方法
Liu et al. Fine-grained multilevel fusion for anti-occlusion monocular 3d object detection
CN107220644B (zh) 一种心电图扫描图像倾斜度校正方法
CN108427919A (zh) 一种基于形状引导显著性模型的无监督油罐目标检测方法
CN111047603A (zh) 一种基于新型马尔可夫随机场和区域合并的航拍图像混合分割算法
CN116612478A (zh) 一种脱机手写汉字的评分方法、装置及存储介质
CN113052215A (zh) 基于神经网络可视化的声呐图像自动目标识别方法
CN109598771B (zh) 一种多地貌特征约束的地形合成方法
Xie et al. 3D surface segmentation from point clouds via quadric fits based on DBSCAN clustering
CN114387454A (zh) 一种基于区域筛选模块和多层次对比的自监督预训练方法
JP2002099911A (ja) ラスタ像のベクトル化のコンピュータ自動化による方法
Zheng et al. Improvement of grayscale image 2D maximum entropy threshold segmentation method
CN101567045A (zh) 一种人脸特征点精确定位方法
CN113705562A (zh) 目标区域确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201124

WW01 Invention patent application withdrawn after publication