CN110796082B - 铭牌文本检测方法、装置、计算机设备和存储介质 - Google Patents
铭牌文本检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110796082B CN110796082B CN201911038868.XA CN201911038868A CN110796082B CN 110796082 B CN110796082 B CN 110796082B CN 201911038868 A CN201911038868 A CN 201911038868A CN 110796082 B CN110796082 B CN 110796082B
- Authority
- CN
- China
- Prior art keywords
- nameplate
- region
- text
- points
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 44
- 238000012937 correction Methods 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000013507 mapping Methods 0.000 claims abstract description 21
- 238000013136 deep learning model Methods 0.000 claims description 53
- 230000006870 function Effects 0.000 claims description 42
- 230000009466 transformation Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 19
- 230000000007 visual effect Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000013135 deep learning Methods 0.000 claims description 10
- 230000000750 progressive effect Effects 0.000 claims description 10
- 238000005286 illumination Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种铭牌文本检测方法、装置、计算机设备和存储介质,所述方法通过定位待检测图像中的铭牌区域,并对铭牌区域进行检测,以得到铭牌区域中若干个文本区域的轮廓,进而确定文本区域的若干个轮廓点中的特征点,对特征点进行特征映射以得到对应文本区域的目标顶点,并根据特征点和目标顶点对文本区域进行透视校正,以得到校正后的铭牌区域中的各文本区域,从而为后续对铭牌区域中的文本区域进行机器识别提供了保障,提高了机器识别铭牌文本的准确度。
Description
技术领域
本申请涉及图像识别技术领域,特别是涉及一种铭牌文本检测方法、装置、计算机设备和存储介质。
背景技术
铭牌又称标牌,铭牌主要用来记载生产厂家及额定工作情况下的一些技术数据。而用于车辆的铭牌则标明了车辆的基本特征,包括车辆型号、发动机型号、发动机排量、发动机额定功率、车辆识别代号、总质量、载重量或载客人数等信息。
传统的车辆年检中车辆铭牌信息的核对主要由人工完成,但由于机动车保有量的迅猛增长,车辆基数较大,容易导致审核人员疲劳而出现误检的情况。基于此,出现了铭牌文本的机器识别,但是由于车辆铭牌的拍摄环境通常较差,导致拍摄的车辆铭牌的图像角度随机,且存在透视的情况,因此导致对车辆铭牌文本进行机器识别时准确度较低。
发明内容
基于此,有必要针对上述铭牌文本的机器识别准确度低的问题,提供一种能够提高铭牌文本的机器识别准确度的铭牌文本检测方法、装置、计算机设备和存储介质。
为了实现上述目的,一方面,本申请实施例提供了一种铭牌文本检测方法,所述方法包括:
定位待检测图像中的铭牌区域;
对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,其中,文本区域的轮廓包括若干个轮廓点;
确定文本区域的若干个轮廓点中的特征点;
对特征点进行特征映射以得到对应文本区域的目标顶点;
根据特征点和目标顶点对文本区域进行透视校正,得到校正后的铭牌区域中的各文本区域。
在其中一个实施例中,确定文本区域的若干个轮廓点中的特征点,包括:根据文本区域的若干个轮廓点调用第一视觉库函数得到与文本区域的轮廓对应的最小外接矩形;基于最小外接矩形调用第二视觉库函数得到最小外接矩形的四个顶点;根据文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到特征点。
在其中一个实施例中,根据文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到特征点,包括:计算文本区域的若干个轮廓点分别与最小外接矩形的四个顶点之间的距离;将得到的分别与最小外接矩形的四个顶点之间距离最小的四个轮廓点作为特征点。
在其中一个实施例中,根据特征点和目标顶点对文本区域进行透视校正,包括:根据特征点和映射后的对应文本区域的目标顶点,调用第一透视变换函数计算得到变换矩阵;基于变换矩阵并调用第二透视变换函数透视校正文本区域。
在其中一个实施例中,通过第一深度学习模型定位待检测图像中的铭牌区域,则第一深度学习模型的生成方法包括:获取在不同角度和不同光照下拍摄的铭牌样本图像;通过矩形框标注铭牌样本图像中的铭牌区域;采用标注了铭牌区域的铭牌样本图像训练基于深度学习的定位模型,以获得第一深度学习模型。
在其中一个实施例中,通过第一深度学习模型定位待检测图像中的铭牌区域,包括:将待检测图像输入第一深度学习模型以识别铭牌区域;若识别到待检测图像中包含铭牌区域,则定位铭牌区域。
在其中一个实施例中,通过第二深度学习模型对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,第二深度学习模型的生成方法包括:获取不同角度和不同质量的铭牌区域样本图像;通过描点标注铭牌区域样本图像中若干个文本区域的轮廓,并记录文本区域的轮廓上各点的坐标;采用标注后的铭牌区域样本图像以及对应的坐标训练渐进式扩张网络模型,以获得第二深度学习模型。
另一方面,本申请实施例还提供了一种铭牌文本检测装置,所述装置包括:
铭牌区域识别模块,用于定位待检测图像中的铭牌区域;
文本区域检测模块,用于对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,其中文本区域的轮廓包括若干个轮廓点;
文本区域定位模块,用于确定文本区域的若干个轮廓点中的特征点;
文本区域映射模块,用于对特征点进行特征映射以得到对应文本区域的目标顶点;
文本区域校正模块,用于根据特征点和目标顶点对文本区域进行透视校正,得到校正后的铭牌区域中的各文本区域。
又一方面,本申请实施例还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
再一方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
上述铭牌文本检测方法、装置、计算机设备和存储介质,通过定位待检测图像中的铭牌区域,并对铭牌区域进行检测,以得到铭牌区域中若干个文本区域的轮廓,进而确定文本区域的若干个轮廓点中的特征点,对特征点进行特征映射以得到对应文本区域的目标顶点,并根据特征点和目标顶点对文本区域进行透视校正,以得到校正后的铭牌区域中的各文本区域,从而为后续对铭牌区域中的文本区域进行机器识别提供了保障,提高了机器识别铭牌文本的准确度。
附图说明
图1为一个实施例中铭牌文本检测方法的应用环境图;
图2为一个实施例中铭牌文本检测方法的流程示意图;
图3为一个实施例中第一深度学习模型生成步骤的流程示意图;
图4为一个实施例中通过第一深度学习模型定位铭牌区域的示意图;
图5为一个实施例中第二深度学习模型生成步骤的流程示意图;
图6为一个实施例中通过第二深度学习模型识别文本区域的示意图;
图7为一个实施例中确定特征点步骤的流程示意图;
图8为一个实施例中与文本区域对应的最小外接矩形的示意图;
图9为一个实施例中与文本区域对应的特征点示意图;
图10为一个实施例中对文本区域进行透视校正步骤的流程示意图;
图11为一个实施例中校正后的文本区域示意图;
图12为一个实施例中铭牌文本检测装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供了一种铭牌文本检测方法,可以应用于如图1所示的应用环境中。其中,终端102与服务器104通过网络进行通信,在本实施例中,终端102可以是各种具有图像采集功能的设备,如可以但不限于各种智能手机、平板电脑、相机和便携式图像采集设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。具体的,终端102用于采集待检测图像,并将采集的待检测图像通过网络发送至服务器104,当然待检测图像也可以预先存储在服务器104中。服务器104则定位待检测图像中的铭牌区域,并对铭牌区域进行检测,以得到铭牌区域中若干个文本区域的轮廓,进而确定文本区域的若干个轮廓点中的特征点,对特征点进行特征映射以得到对应文本区域的目标顶点,根据特征点和目标顶点对文本区域进行透视校正,得到校正后的铭牌区域中的各文本区域,从而避免机器识别铭牌文本准确度低的问题。
在一个实施例中,如图2所示,提供了一种铭牌文本检测方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,定位待检测图像中的铭牌区域。
其中,待检测图像是指前端采集的待进行铭牌文本机器识别的图像,铭牌区域则是指展示铭牌信息的铭牌图像区域。在实际应用中,由于拍摄环境以及拍摄角度的影响,待检测图像中不一定包含有铭牌区域,或者待检测图像中既包含有铭牌区域也包含有非铭牌区域,因此,在本实施例中首先需要对待检测图像中的铭牌区域进行检测并定位,具体可采用基于深度学习的定位模型定位铭牌区域。
步骤204,对铭牌区域进行检测,以得到铭牌区域中若干个文本区域的轮廓。
其中,文本区域的轮廓可以是指铭牌区域中具有文字信息的区域的边框。在本实施例中,可以通过训练好的模型参数的基于深度学习的渐进式扩张网络模型(ProgressiveScale Expansion Network,简称PSENet)对上述定位的铭牌区域进行文本检测,从而得到铭牌区域中若干个文本区域的轮廓,其中,文本区域的轮廓包括组成该轮廓的若干个点以及对应点的坐标。
步骤206,确定文本区域的若干个轮廓点中的特征点。
其中,特征点可以是指根据文本区域的若干个轮廓点经过特征提取得到的文本区域的轮廓特征点,也即特征点是从若干个轮廓点中提取的用于表示文本区域的轮廓特征的少数几个轮廓点。由于文字信息的宽高比分布较为极端,且并不存在明显的闭合边缘,因此,通过上述步骤得到的文本区域的轮廓呈不规则形状,从而不便于后续的校正处理。在本实施例中,可以采用开源计算机视觉库(Open Source Computer Vision Library,简称OpenCV)函数对文本区域的若干个轮廓点进行特征提取,从而得到文本区域的轮廓特征点,以便于在后续处理中通过文本区域的轮廓特征点得到规则的文本区域。
步骤208,对特征点进行特征映射以得到对应文本区域的目标顶点。
具体的,根据上述步骤得到文本区域的特征点,进而根据特征点通过特征映射以得到相对于特征点的外接矩形,其中,相对于特征点的外接矩形即为映射后的文本区域,目标顶点则是指映射后的文本区域的各顶点,也即相对于特征点的外接矩形的四个顶点。
步骤210,根据特征点和目标顶点对文本区域进行透视校正,得到校正后的铭牌区域中的各文本区域。
具体的,可以基于OpenCV函数对铭牌区域中的每一个文本区域进行透视校正处理,以得到校正后的铭牌区域中的各文本区域,从而为后续对铭牌区域中的文本区域进行机器识别提供了保障。
上述铭牌文本检测方法,通过定位待检测图像中的铭牌区域,并对铭牌区域进行检测,以得到铭牌区域中若干个文本区域的轮廓,进而确定文本区域的若干个轮廓点中的特征点,对特征点进行特征映射以得到对应文本区域的目标顶点,并根据特征点和目标顶点对文本区域进行透视校正,以得到校正后的铭牌区域中的各文本区域,从而为后续对铭牌区域中的文本区域进行机器识别提供了保障,提高了机器识别铭牌文本的准确度。
在一个实施例中,如图3所示,通过第一深度学习模型定位待检测图像中的铭牌区域,其中,第一深度学习模型的生成方法可以包括如下步骤:
步骤302,获取在不同角度和不同光照下拍摄的铭牌样本图像。
在本实施例中,为了获得能够准确定位待检测图像中铭牌区域的定位模型,首先需要准备对基础模型进行训练的铭牌样本图像。又由于铭牌的拍摄环境通常较差,导致拍摄的图像角度随机,且存在透视的情况,因此为了提高模型的定位准确率,用于对基础模型进行训练的铭牌样本图像可以是在不同角度和不同光照条件下拍摄的。
步骤304,通过矩形框标注铭牌样本图像中的铭牌区域。
在本实施例中,可以在铭牌样本图像中以矩形框的方式标注出铭牌区域,从而区分铭牌样本图像中的铭牌区域和非铭牌区域。
步骤306,采用标注了铭牌区域的铭牌样本图像训练基于深度学习的定位模型,以获得第一深度学习模型。
具体的,通过标注了铭牌区域的大量铭牌样本图像对基于深度学习的定位模型进行训练,并在训练过程中调整模型参数,使模型学习到的特征更具有鲁棒性,从而得到训练好模型参数的能够对图像中的铭牌区域进行准确定位的第一深度学习模型。
在一个实施例中,由于在实际应用中拍摄环境以及拍摄角度的影响,终端采集的待检测图像中不一定包含有铭牌区域,因此,在本实施例中通过将待检测图像输入第一深度学习模型,以识别待检测图像中的铭牌区域,当识别到待检测图像中包含铭牌区域时,则对该铭牌区域进行定位,如图4所示,40为具体应用时终端采集的待检测图像,矩形框部分41则为通过第一深度学习模型定位的铭牌区域(本实施例以待检测图像包含了车辆铭牌信息为例进行说明)。当识别到待检测图像中没有铭牌区域时,则结束后续流程,并输出提示信息,以便于工作人员重新采集包含铭牌区域的合格的待检测图像。
在一个实施例中,如图5所示,通过第二深度学习模型对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,其中,第二深度学习模型的生成方法可以包括如下步骤:
步骤502,获取不同角度和不同质量的铭牌区域样本图像。
其中,不同角度和不同质量的铭牌区域样本图像是指在不同拍摄角度和拍摄环境下得到的,具有不同角度和清晰度的铭牌区域样本图像。在本实施例中,为了提高模型识别的准确率,首先需要准备对基础模型进行训练的具有不同角度和不同质量的铭牌区域样本图像。
步骤504,通过描点标注铭牌区域样本图像中若干个文本区域的轮廓,并记录文本区域的轮廓上各点的坐标。
具体的,通过在铭牌区域样本图像中以描点的方式标注出文本区域的轮廓,当铭牌区域样本图像中具有多个文本区域时,则标注出每一个文本区域的轮廓,而每一个文本区域的轮廓又由多个描点组成,因此,在本实施例中,在通过描点标注文本区域的轮廓时,同时记录标注的轮廓上各点的坐标,其中点的坐标可以是指该点对应的X、Y坐标。
步骤506,采用标注后的铭牌区域样本图像以及对应的坐标训练渐进式扩张网络模型,以获得第二深度学习模型。
在本实施例中,通过标注了文本区域的轮廓以及对应坐标的大量铭牌区域样本图像,对渐进式扩张网络模型进行训练,并在训练过程中调整模型参数,从而得到训练好模型参数的能够准确识别铭牌区域样本图像中文本区域的第二深度学习模型。因此,在采用第二深度学习模型对铭牌区域进行文本检测时,将上述定位的铭牌区域输入第二深度学习模型,即可得到铭牌区域中若干个文本区域的轮廓,如图6所示的多个文本区域的轮廓60。
具体的,渐进式扩张网络模型PSENet采用resnet50(残差网络)与fpn(特征金字塔网络)相结合,将低层特征映射与高级特征映射连接起来,从而有四个级联的特征映射。即将铭牌区域样本图像中的每个文本区域分配给多个预测的分割区域,记作S1,S2,...,Sn,这些分割区域表示为“核”,每个Si将是所有文本区域在一定范围内的一个分割掩码。并且对于一个文本区域,有几个对应的内核,每个内核与原始的文本区域共享相似的形状,并且它们都位于相同的中心点但在比例上不同。在这些掩码中,S1给出了具有最小标度(即,最小内核)的文本区域的分割结果,而Sn表示原始分割掩码(即,最大内核)。在获得这些分割掩码后,使用渐进扩展算法将S1中的所有文本区域“内核”逐渐扩展到其Sn中的完整形状,并获得最终的检测结果为R,最后通过查找轮廓得到各个文本区域的轮廓。
在一个实施例中,如图7所示,确定文本区域的若干个轮廓点中的特征点,具体可以包括如下步骤:
步骤702,根据文本区域的若干个轮廓点调用第一视觉库函数得到与文本区域的轮廓对应的最小外接矩形。
其中,最小外接矩形是指以二维坐标表示的文本区域的轮廓的最大范围,即以文本区域的若干个轮廓点定下边界的矩形。由于文字信息的宽高比分布较为极端,且并不存在明显的闭合边缘,因此,通过上述步骤得到的文本区域的轮廓呈不规则形状,在本实施例中,为了便于后续的校正处理,则调用第一视觉库函数,得到与文本区域的轮廓对应的最小外接矩形,如图8所示的与各文本区域的轮廓60对应的矩形框80。具体的,第一视觉库函数为OpenCV中的RotatedRect rot_rt=minAreaRect(v_pt[i]),其中rot_rt为最小外接矩形,v_pt[i]为铭牌区域中某个(第i个)文本区域的轮廓,包括该轮廓上各点的坐标。
步骤704,基于最小外接矩形调用第二视觉库函数得到最小外接矩形的四个顶点。
其中,第二视觉库函数为OpenCV中的rot_rt.points(pt)函数,具体的,通过该函数以及上述得到的最小外接矩形即可获得该最小外接矩形的四个顶点,如图8中某一矩形框80的四个顶点rot_pt1,rot_pt2,rot_pt3,rot_pt4。
步骤706,根据文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到特征点。
其中,特征点是指根据文本区域的若干个轮廓点经过特征提取得到的文本区域的轮廓上的特征点,以便于在后续处理中通过文本区域的轮廓特征点进行校正。在本实施例中,通过上述步骤获得与文本区域的轮廓对应的最小外接矩形以及该最小外接矩形的四个顶点rot_pt1,rot_pt2,rot_pt3,rot_pt4,进而根据文本区域的轮廓点计算每一个点与对应的最小外接矩形的四个顶点之间的距离,将与最小外接矩形的四个顶点中的每一个顶点之间的距离最小的四个轮廓点作为特征点。
具体的,以铭牌区域中某个文本区域的轮廓v_pt[i],以及对应的最小外接矩形的四个顶点中的一个顶点rot_pt1为例进行说明,计算v_pt[i]中的各个点pti与rot_pt1的距离其中,pt1.x和pt1.y是指顶点rot_pt1对应的X坐标和Y坐标,pt0.x和pt0.y是指v_pt[i]中的一个点pt0对应的X坐标和Y坐标,dis则是指点pt0与顶点rot_pt1之间的距离。根据上述公式计算v_pt[i]中的每一个点pti分别与rot_pt1之间的距离,将距离最小时的pti作为一个特征点,并记录为pt1。同样的,依次计算v_pt[i]中的各个点pti分别与rot_pt2、rot_pt3、rot_pt4之间的距离,分别得到与rot_pt2、rot_pt3、rot_pt4之间的距离最小时的pt2、pt3和pt4,从而得到文本区域的轮廓v_pt[i]对应的四个特征点,如图9所示的pt1、pt2、pt3和pt4。依此类推,根据上述方法计算以得到铭牌区域中每一个文本区域分别对应的四个特征点。
在一个实施例中,如图10所示,根据特征点和目标顶点对文本区域进行透视校正,具体可以包括如下步骤:
步骤1002,根据特征点和映射后的对应文本区域的目标顶点,调用第一透视变换函数计算得到变换矩阵。
步骤1004,基于变换矩阵并调用第二透视变换函数透视校正文本区域。
具体的,假设通过上述步骤获得铭牌区域中某一文本区域对应的四个特征点为:左上src_pt[0],左下src_pt[1],右上src_pt[2],右下src_pt[3],则映射后的四个目标顶点坐标为:
dst_pt[0]=Point(MIN(src_pt[0].x,src_pt[1].x),MIN(src_pt[0].y,src_pt[2].y));
dst_pt[1]=Point(MIN(src_pt[0].x,src_pt[1].x),MAX(src_pt[1].y,src_pt[3].y));
dst_pt[2]=Point(MAX(src_pt[2].x,src_pt[3].x),MIN(src_pt[0].y,src_pt[2].y));
dst_pt[3]=Point(MAX(src_pt[2].x,src_pt[3].x),MAX(src_pt[1].y,src_pt[3].y))。
根据上述映射后的四个目标顶点dst_pt[0]、dst_pt[1]、dst_pt[2]和dst_pt[3]即可确定对应文本区域校正后的矩形区域。由4个特征点src_pt和4个映射后的目标顶点dst_pt调用opencv函数中的第一透视变换函数,即可计算映射矩阵WarpMatrix。再调用opencv函数中的第二透视变换函数即可透视校正对应文本区域中的文字,其中,第一透视变换函数具体可以采用getPerspectiveTransform(src_pt,dst_pt)函数,第二透视变换函数具体可以采用warpPerspective函数,从而得到校正后文本区域,如图11所示为铭牌区域中校正后的某一个文本区域。依此类推,根据上述方法对铭牌区域中每一个文本区域都进行上述处理,即可得到铭牌区域中校正后的各个文本区域,从而为后续对铭牌区域中的文本区域进行机器识别提供了保障,能够极大的提高机器识别的准确度以及铭牌审核的效率。
应该理解的是,虽然图1-11的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-11中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图12所示,提供了一种铭牌文本检测装置,包括:铭牌区域识别模块1201、文本区域检测模块1202、文本区域定位模块1203、文本区域映射模块1204和文本区域校正模块1205,其中:
铭牌区域识别模块1201,用于定位待检测图像中的铭牌区域;
文本区域检测模块1202,用于对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,其中文本区域的轮廓包括若干个轮廓点;
文本区域定位模块1203,用于确定文本区域的若干个轮廓点中的特征点;
文本区域映射模块1204,用于对特征点进行特征映射以得到对应文本区域的目标顶点;
文本区域校正模块1205,用于根据特征点和目标顶点对文本区域进行透视校正,得到校正后的铭牌区域中的各文本区域。
在一个实施例中,文本区域定位模块1203具体用于:根据文本区域的若干个轮廓点调用第一视觉库函数得到与文本区域的轮廓对应的最小外接矩形;基于最小外接矩形调用第二视觉库函数得到最小外接矩形的四个顶点;根据文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到特征点。
在一个实施例中,文本区域校正模块1205具体用于:根据特征点和映射后的对应文本区域的目标顶点,调用第一透视变换函数计算得到变换矩阵;基于变换矩阵并调用第二透视变换函数透视校正文本区域。
在一个实施例中,铭牌区域识别模块1201具体用于:获取在不同角度和不同光照下拍摄的铭牌样本图像;通过矩形框标注铭牌样本图像中的铭牌区域;采用标注了铭牌区域的铭牌样本图像训练基于深度学习的定位模型,以获得第一深度学习模型;通过第一深度学习模型定位待检测图像中的铭牌区域。
在一个实施例中,文本区域检测模块1202具体用于:获取不同角度和不同质量的铭牌区域样本图像;通过描点标注铭牌区域样本图像中若干个文本区域的轮廓,并记录文本区域的轮廓上各点的坐标;采用标注后的铭牌区域样本图像以及对应的坐标训练渐进式扩张网络模型,以获得第二深度学习模型;将铭牌区域输入第二深度学习模型以得到铭牌区域中若干个文本区域的轮廓。
关于铭牌文本检测装置的具体限定可以参见上文中对于铭牌文本检测方法的限定,在此不再赘述。上述铭牌文本检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待检测图像数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种铭牌文本检测方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
定位待检测图像中的铭牌区域;
对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,其中,文本区域的轮廓包括若干个轮廓点;
确定文本区域的若干个轮廓点中的特征点;
对特征点进行特征映射以得到对应文本区域的目标顶点;
根据特征点和目标顶点对文本区域进行透视校正,得到校正后的铭牌区域中的各文本区域。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据文本区域的若干个轮廓点调用第一视觉库函数得到与文本区域的轮廓对应的最小外接矩形;基于最小外接矩形调用第二视觉库函数得到最小外接矩形的四个顶点;根据文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到特征点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:计算文本区域的若干个轮廓点分别与最小外接矩形的四个顶点之间的距离;将得到的分别与最小外接矩形的四个顶点之间距离最小的四个轮廓点作为特征点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据特征点和映射后的对应文本区域的目标顶点,调用第一透视变换函数计算得到变换矩阵;基于变换矩阵并调用第二透视变换函数透视校正文本区域。
在一个实施例中,通过第一深度学习模型定位待检测图像中的铭牌区域,则处理器执行计算机程序时还实现以下步骤:获取在不同角度和不同光照下拍摄的铭牌样本图像;通过矩形框标注铭牌样本图像中的铭牌区域;采用标注了铭牌区域的铭牌样本图像训练基于深度学习的定位模型,以获得第一深度学习模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将待检测图像输入第一深度学习模型以识别铭牌区域;若识别到待检测图像中包含铭牌区域,则定位铭牌区域。
在一个实施例中,通过第二深度学习模型对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,则处理器执行计算机程序时还实现以下步骤:获取不同角度和不同质量的铭牌区域样本图像;通过描点标注铭牌区域样本图像中若干个文本区域的轮廓,并记录文本区域的轮廓上各点的坐标;采用标注后的铭牌区域样本图像以及对应的坐标训练渐进式扩张网络模型,以获得第二深度学习模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
定位待检测图像中的铭牌区域;
对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,其中,文本区域的轮廓包括若干个轮廓点;
确定文本区域的若干个轮廓点中的特征点;
对特征点进行特征映射以得到对应文本区域的目标顶点;
根据特征点和目标顶点对文本区域进行透视校正,得到校正后的铭牌区域中的各文本区域。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据文本区域的若干个轮廓点调用第一视觉库函数得到与文本区域的轮廓对应的最小外接矩形;基于最小外接矩形调用第二视觉库函数得到最小外接矩形的四个顶点;根据文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到特征点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算文本区域的若干个轮廓点分别与最小外接矩形的四个顶点之间的距离;将得到的分别与最小外接矩形的四个顶点之间距离最小的四个轮廓点作为特征点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据特征点和映射后的对应文本区域的目标顶点,调用第一透视变换函数计算得到变换矩阵;基于变换矩阵并调用第二透视变换函数透视校正文本区域。
在一个实施例中,通过第一深度学习模型定位待检测图像中的铭牌区域,则计算机程序被处理器执行时还实现以下步骤:获取在不同角度和不同光照下拍摄的铭牌样本图像;通过矩形框标注铭牌样本图像中的铭牌区域;采用标注了铭牌区域的铭牌样本图像训练基于深度学习的定位模型,以获得第一深度学习模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将待检测图像输入第一深度学习模型以识别铭牌区域;若识别到待检测图像中包含铭牌区域,则定位铭牌区域。
在一个实施例中,通过第二深度学习模型对铭牌区域进行文本检测,以得到铭牌区域中若干个文本区域的轮廓,则计算机程序被处理器执行时还实现以下步骤:获取不同角度和不同质量的铭牌区域样本图像;通过描点标注铭牌区域样本图像中若干个文本区域的轮廓,并记录文本区域的轮廓上各点的坐标;采用标注后的铭牌区域样本图像以及对应的坐标训练渐进式扩张网络模型,以获得第二深度学习模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (7)
1.一种铭牌文本检测方法,其特征在于,所述方法包括:
通过第一深度学习模型定位待检测图像中的铭牌区域,所述第一深度学习模型生成方法包括:获取在不同角度和不同光照下拍摄的铭牌样本图像;通过矩形框标注所述铭牌样本图像中的铭牌区域;采用标注了铭牌区域的铭牌样本图像训练基于深度学习的定位模型,以获得所述第一深度学习模型;
通过第二深度学习模型对所述铭牌区域进行文本检测,以得到所述铭牌区域中若干个文本区域的轮廓,所述文本区域的轮廓包括若干个轮廓点,所述第二深度学习模型生成方法包括:获取不同角度和不同质量的铭牌区域样本图像;通过描点标注所述铭牌区域样本图像中若干个文本区域的轮廓,并记录所述文本区域的轮廓上各点的坐标;采用标注后的铭牌区域样本图像以及对应的坐标训练渐进式扩张网络模型,以获得所述第二深度学习模型;
确定所述文本区域的若干个轮廓点中的特征点;
对所述特征点进行特征映射以得到相对于特征点的外接矩形,将所述外接矩形的顶点确定为对应文本区域的目标顶点;
根据所述特征点和所述目标顶点对所述文本区域进行透视校正,得到校正后的所述铭牌区域中的各文本区域;
所述通过第一深度学习模型定位待检测图像中的铭牌区域,包括:将所述待检测图像输入所述第一深度学习模型以识别铭牌区域;若识别到所述待检测图像中包含铭牌区域,则定位所述铭牌区域;
所述确定所述文本区域的若干个轮廓点中的特征点,包括:根据所述文本区域的若干个轮廓点调用第一视觉库函数得到与所述文本区域的轮廓对应的最小外接矩形;基于所述最小外接矩形调用第二视觉库函数得到所述最小外接矩形的四个顶点;根据所述文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到所述特征点,所述特征点是所述文本区域的若干个轮廓点中与所述最小外接矩形的四个顶点中的每一个顶点之间的距离最小的轮廓点。
2.根据权利要求1所述的铭牌文本检测方法,其特征在于,所述根据所述文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到所述特征点,包括:
计算所述文本区域的若干个轮廓点分别与最小外接矩形的四个顶点之间的距离;
将得到的分别与所述最小外接矩形的四个顶点之间距离最小的四个轮廓点作为所述特征点。
3.根据权利要求1所述的铭牌文本检测方法,其特征在于,所述根据所述特征点和所述目标顶点对所述文本区域进行透视校正,包括:
根据所述特征点和映射后的对应文本区域的目标顶点,调用第一透视变换函数计算得到变换矩阵;
基于所述变换矩阵并调用第二透视变换函数透视校正所述文本区域。
4.一种铭牌文本检测装置,其特征在于,所述装置包括:
铭牌区域识别模块,用于通过第一深度学习模型定位待检测图像中的铭牌区域,所述第一深度学习模型生成方法包括:获取在不同角度和不同光照下拍摄的铭牌样本图像;通过矩形框标注所述铭牌样本图像中的铭牌区域;采用标注了铭牌区域的铭牌样本图像训练基于深度学习的定位模型,以获得所述第一深度学习模型;
文本区域检测模块,用于通过第二深度学习模型对所述铭牌区域进行文本检测,以得到所述铭牌区域中若干个文本区域的轮廓,所述文本区域的轮廓包括若干个轮廓点,所述第二深度学习模型生成方法包括:获取不同角度和不同质量的铭牌区域样本图像;通过描点标注所述铭牌区域样本图像中若干个文本区域的轮廓,并记录所述文本区域的轮廓上各点的坐标;采用标注后的铭牌区域样本图像以及对应的坐标训练渐进式扩张网络模型,以获得所述第二深度学习模型;
文本区域定位模块,用于确定所述文本区域的若干个轮廓点中的特征点;
文本区域映射模块,用于对所述特征点进行特征映射以得到相对于特征点的外接矩形,将所述外接矩形的顶点确定为对应文本区域的目标顶点;
文本区域校正模块,用于根据所述特征点和所述目标顶点对所述文本区域进行透视校正,得到校正后的所述铭牌区域中的各文本区域;
所述铭牌区域识别模块具体用于:将所述待检测图像输入所述第一深度学习模型以识别铭牌区域;若识别到所述待检测图像中包含铭牌区域,则定位所述铭牌区域;
所述文本区域定位模块具体用于:根据所述文本区域的若干个轮廓点调用第一视觉库函数得到与所述文本区域的轮廓对应的最小外接矩形;基于所述最小外接矩形调用第二视觉库函数得到所述最小外接矩形的四个顶点;根据所述文本区域的若干个轮廓点以及对应的最小外接矩形的四个顶点计算得到所述特征点,所述特征点是所述文本区域的若干个轮廓点中与所述最小外接矩形的四个顶点中的每一个顶点之间的距离最小的轮廓点。
5.根据权利要求4所述的铭牌文本检测装置,其特征在于,所述文本区域校正模块具体用于:
根据所述特征点和映射后的对应文本区域的目标顶点,调用第一透视变换函数计算得到变换矩阵;
基于所述变换矩阵并调用第二透视变换函数透视校正所述文本区域。
6.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911038868.XA CN110796082B (zh) | 2019-10-29 | 2019-10-29 | 铭牌文本检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911038868.XA CN110796082B (zh) | 2019-10-29 | 2019-10-29 | 铭牌文本检测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110796082A CN110796082A (zh) | 2020-02-14 |
CN110796082B true CN110796082B (zh) | 2020-11-24 |
Family
ID=69441831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911038868.XA Expired - Fee Related CN110796082B (zh) | 2019-10-29 | 2019-10-29 | 铭牌文本检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110796082B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414905B (zh) * | 2020-02-25 | 2023-08-18 | 泰康保险集团股份有限公司 | 一种文本检测方法、文本检测装置、电子设备及存储介质 |
CN111368820A (zh) * | 2020-03-06 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 文本标注方法、装置及存储介质 |
CN111582021B (zh) * | 2020-03-26 | 2024-07-05 | 平安科技(深圳)有限公司 | 场景图像中的文本检测方法、装置及计算机设备 |
CN111401319B (zh) * | 2020-04-15 | 2024-04-12 | 北京深智恒际科技有限公司 | PSENet网络渐进式扩展后处理出现文本粘连的解决方法 |
CN111652144B (zh) * | 2020-06-03 | 2023-09-26 | 广东小天才科技有限公司 | 基于目标区域融合的题目分割方法、装置、设备和介质 |
CN111738223A (zh) * | 2020-07-28 | 2020-10-02 | 上海眼控科技股份有限公司 | 车架号图像生成方法、装置、计算机设备和存储介质 |
CN112508015A (zh) * | 2020-12-15 | 2021-03-16 | 山东大学 | 一种铭牌识别方法、计算机设备、存储介质 |
CN112561789A (zh) * | 2020-12-23 | 2021-03-26 | 中国科学院长春光学精密机械与物理研究所 | 一种不规则图像处理方法 |
CN112580632A (zh) * | 2020-12-24 | 2021-03-30 | 南方电网深圳数字电网研究院有限公司 | 铭牌识别方法、系统、电子设备及计算机可读存储介质 |
CN114943973B (zh) * | 2021-02-09 | 2024-10-18 | 广州视源电子科技股份有限公司 | 一种文本校正方法、装置、计算机设备及存储介质 |
CN114387598A (zh) * | 2021-12-02 | 2022-04-22 | 北京云测信息技术有限公司 | 一种文档标注的方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018229526A1 (en) * | 2017-09-16 | 2019-04-04 | Tata Consultancy Services Limited | Recursive contour merging based detection of text area in an image |
CN110059694A (zh) * | 2019-04-19 | 2019-07-26 | 山东大学 | 电力行业复杂场景下的文字数据的智能识别方法 |
CN110097054A (zh) * | 2019-04-29 | 2019-08-06 | 济南浪潮高新科技投资发展有限公司 | 一种基于图像投影变换的文本图像纠偏方法 |
CN110378338A (zh) * | 2019-07-11 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 一种文本识别方法、装置、电子设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018120388A (ja) * | 2017-01-25 | 2018-08-02 | 株式会社アマダホールディングス | ワーク検出装置及び方法 |
CN107688806B (zh) * | 2017-08-21 | 2021-04-20 | 西北工业大学 | 一种基于仿射变换的自由场景文本检测方法 |
CN109426814B (zh) * | 2017-08-22 | 2023-02-24 | 顺丰科技有限公司 | 一种发票图片特定板块的定位、识别方法、系统、设备 |
-
2019
- 2019-10-29 CN CN201911038868.XA patent/CN110796082B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018229526A1 (en) * | 2017-09-16 | 2019-04-04 | Tata Consultancy Services Limited | Recursive contour merging based detection of text area in an image |
CN110059694A (zh) * | 2019-04-19 | 2019-07-26 | 山东大学 | 电力行业复杂场景下的文字数据的智能识别方法 |
CN110097054A (zh) * | 2019-04-29 | 2019-08-06 | 济南浪潮高新科技投资发展有限公司 | 一种基于图像投影变换的文本图像纠偏方法 |
CN110378338A (zh) * | 2019-07-11 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 一种文本识别方法、装置、电子设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
"Java基于opencv—透视变换矫正图像";奇迹迪;《https://www.jianshu.com/p/173d329afa3a》;20180928;第1-7页 * |
"PSENet解读——Shape Robust Text Detection with Progressive Scale Expansion Network";aift;《https://blog.csdn.net/ft_sunshine/article/details/90244514?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.nonecase》;20190515;第1-8页 * |
"变电站设备铭牌识别系统设计与实现";刘波;《万方》;20160603;第1-6、16-29页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110796082A (zh) | 2020-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110796082B (zh) | 铭牌文本检测方法、装置、计算机设备和存储介质 | |
CN109492643B (zh) | 基于ocr的证件识别方法、装置、计算机设备及存储介质 | |
CN111242126A (zh) | 不规则文本校正方法、装置、计算机设备和存储介质 | |
CN110956171A (zh) | 铭牌自动识别方法、装置、计算机设备和存储介质 | |
CN111079632A (zh) | 文本检测模型的训练方法、装置、计算机设备和存储介质 | |
CN112364715B (zh) | 核电作业异常监控方法、装置、计算机设备和存储介质 | |
CN111461170A (zh) | 车辆图像检测方法、装置、计算机设备及存储介质 | |
CN109285105A (zh) | 水印检测方法、装置、计算机设备和存储介质 | |
CN112766275B (zh) | 印章文字识别方法、装置、计算机设备和存储介质 | |
CN111428552B (zh) | 黑眼圈识别方法、装置、计算机设备和存储介质 | |
CN111144372A (zh) | 车辆检测方法、装置、计算机设备和存储介质 | |
CN110796709A (zh) | 车架号尺寸获取方法、装置、计算机设备和存储介质 | |
CN111476271B (zh) | 图标识别的方法、装置、系统、计算机设备和存储介质 | |
CN112580499A (zh) | 文本识别方法、装置、设备及存储介质 | |
WO2022134354A1 (zh) | 车损检测模型训练、车损检测方法、装置、设备及介质 | |
CN111832561B (zh) | 基于计算机视觉的字符序列识别方法、装置、设备和介质 | |
CN111553268A (zh) | 车辆部件识别方法、装置、计算机设备和存储介质 | |
CN111144285A (zh) | 胖瘦程度识别方法、装置、设备及介质 | |
CN115937003A (zh) | 图像处理方法、装置、终端设备和可读存储介质 | |
CN113538291B (zh) | 卡证图像倾斜校正方法、装置、计算机设备和存储介质 | |
CN113012189A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN117115823A (zh) | 一种篡改识别方法、装置、计算机设备和存储介质 | |
CN109993067B (zh) | 面部关键点提取方法、装置、计算机设备和存储介质 | |
CN111325106A (zh) | 生成训练数据的方法及装置 | |
CN112613402B (zh) | 文本区域检测方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Nameplate text detection method, device, computer equipment and storage medium Effective date of registration: 20220211 Granted publication date: 20201124 Pledgee: Shanghai Bianwei Network Technology Co.,Ltd. Pledgor: SHANGHAI EYE CONTROL TECHNOLOGY Co.,Ltd. Registration number: Y2022310000023 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201124 |
|
CF01 | Termination of patent right due to non-payment of annual fee |