CN109101969A - 一种基于字符识别的图像处理方法及装置 - Google Patents

一种基于字符识别的图像处理方法及装置 Download PDF

Info

Publication number
CN109101969A
CN109101969A CN201810968260.6A CN201810968260A CN109101969A CN 109101969 A CN109101969 A CN 109101969A CN 201810968260 A CN201810968260 A CN 201810968260A CN 109101969 A CN109101969 A CN 109101969A
Authority
CN
China
Prior art keywords
image
filtering
labeled
obtains
pixel point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810968260.6A
Other languages
English (en)
Inventor
刘振坤
林剑亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN TONGWEI COMMUNICATION TECHNOLOGY Co.,Ltd.
Original Assignee
Shenzhen Shenzhen Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shenzhen Science And Technology Co Ltd filed Critical Shenzhen Shenzhen Science And Technology Co Ltd
Priority to CN201810968260.6A priority Critical patent/CN109101969A/zh
Publication of CN109101969A publication Critical patent/CN109101969A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像处理技术领域,公开了一种基于字符识别的图像处理方法及装置,该方法包括:通过摄像头获取待识别字符的三通道图像;将所述三通道图像通过灰度算法公式转化为灰度图像;对所述灰度图像进行透视变换和滤波,得到滤波图像;对所述滤波图像进行二值化,得到二值图像;通过八临域算法对所述二值图像进行连通域检测,获得有效图像;通过灰度化、透视变换、滤波二值化等操作,将输入图像中的待识别字母信息提取出来,提高了算法的抗噪能力和识别率。

Description

一种基于字符识别的图像处理方法及装置
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于字符识别的图像处理方法及装置。
背景技术
随着机器人技术的不断发展,具有各种功能的机器人如雨后春笋般相继诞生,其中,有一种自然拼读儿童教育的小型机器人,该机器人需要实时识别立体式的字母,以此推动一些字母相关游戏的进行,培养儿童学习英语的兴趣。目前字符识别领域主要分为两大类,第一类方法为传统的模板匹配方法,该方法需要的运行资源较少,但是对于噪声较为敏感,识别率偏低;第二类方法为基于神经网络的方法,其中,以LeNet-5作为其中的代表(由Yann LeCun 1994年提出),该方法抗噪能力和识别率都比较理想,但是对于计算能力要求较高,对于小型机器人来说并不能达到实时的要求。除此之外,小型机器人受硬件限制,摄像头采集到的图像视角倾斜严重,并且质量较差,这又会给识别带来更大的挑战。
发明内容
本发明的主要目的在于提出一种基于字符识别的图像处理方法及装置,通过灰度化、透视变换、滤波二值化等操作,将输入图像中的待识别字母信息提取出来,提高了算法的抗噪能力和识别率。
为实现上述目的,本发明提供的一种基于字符识别的图像处理方法,包括:
通过摄像头获取待识别字符的三通道图像;
将所述三通道图像通过灰度算法公式转化为灰度图像;
对所述灰度图像进行透视变换和滤波,得到滤波图像;
对所述滤波图像进行二值化,得到二值图像;
通过八临域算法对所述二值图像进行连通域检测,获得有效图像。
可选地,所述灰度算法公式为:
Y(x,y)=R(x,y)*0.299+G(x,y))*0.587+B(x,y)*0.114
其中,Y(x,y)表示(x,y)坐标处的灰度值;R(x,y)、G(x,y)、B(x,y)分别表示(x,y)坐标处的红、绿、蓝三通道的分量。
可选地,所述对所述灰度图像进行透视变换和滤波,得到滤波图像包括:
通过透视变换公式对所述灰度图像进行图像视角的变换,将图像视角由倾斜视角转为垂直视角;
采用同态滤波算法对垂直视角的灰度图像进行滤波,得到滤波图像。
可选地,所述对所述滤波图像进行二值化,得到二值图像之后还包括:
对所述二值图像进行闭操作,去除图像中的裂缝噪声。
可选地,所述通过八临域算法对所述二值图像进行连通域检测,获得有效图像包括:
从所述二值图像中获取一个未被标记的黑色像素点,标记为N;
对所述黑色像素点进行八临域算法:检测所述黑色像素点临近的八个像素点中未被标记的黑色像素点,将所述未被标记的黑色像素点存入队列D1中;
从所述队列中选取出一个像素点,标记为N,对所述像素点进行八临域算法;
当所述队列D1为空时,所述二值图像中的所以标记为N的黑色像素点组成一个连通域图像;
对N执行+1操作,重复上述步骤,得到标记为N+1的连通域图像;
对所有连通域图像的中心有效区域进行归一化,得到预设像素值的有效图像。
作为本发明的另一方面,提供的一种基于字符识别的图像处理装置,包括:
获取模块,用于通过摄像头获取待识别字符的三通道图像;
灰度模块,用于将所述三通道图像通过灰度算法公式转化为灰度图像;
透视滤波模块,用于对所述灰度图像进行透视变换和滤波,得到滤波图像;
二值化模块,用于对所述滤波图像进行二值化,得到二值图像;
连通域模块,用于通过八临域算法对所述二值图像进行连通域检测,获得有效图像。
可选地,所述灰度算法公式为:
Y(x,y)=R(x,y)*0.299+G(x,y))*0.587+B(x,y)*0.114
其中,Y(x,y)表示(x,y)坐标处的灰度值;R(x,y)、G(x,y)、B(x,y)分别表示(x,y)坐标处的红、绿、蓝三通道的分量。
可选地,所述透视滤波模块包括:
透视转换单元,用于通过透视变换公式对所述灰度图像进行图像视角的变换,将图像视角由倾斜视角转为垂直视角;
滤波单元,用于采用同态滤波算法对垂直视角的灰度图像进行滤波,得到滤波图像。
可选地,还包括:
闭操作模块,用于对所述二值图像进行闭操作,去除图像中的裂缝噪声。
可选地,所述连通域模块包括:
标记单元,用于从所述二值图像中获取一个未被标记的黑色像素点,标记为N;
八临域单元,用于对所述黑色像素点进行八临域算法:检测所述黑色像素点临近的八个像素点中未被标记的黑色像素点,将所述未被标记的黑色像素点存入队列D1中;
选取单元,用于从所述队列中选取出一个像素点,标记为N,对所述像素点进行八临域算法;
连通单元,用于当所述队列D1为空时,所述二值图像中的所以标记为N的黑色像素点组成一个连通域图像;
重复单元,用于对N执行+1操作,重复上述步骤,得到标记为N+1的连通域图像;
归一化单元,用于对所有连通域图像的中心有效区域进行归一化,得到预设像素值的有效图像。
本发明提出的一种基于字符识别的图像处理方法及装置,该方法包括:通过摄像头获取待识别字符的三通道图像;将所述三通道图像通过灰度算法公式转化为灰度图像;对所述灰度图像进行透视变换和滤波,得到滤波图像;对所述滤波图像进行二值化,得到二值图像;通过八临域算法对所述二值图像进行连通域检测,获得有效图像;通过灰度化、透视变换、滤波二值化等操作,将输入图像中的待识别字母信息提取出来,提高了算法的抗噪能力和识别率。
附图说明
图1为本发明实施例一提供的一种基于字符识别的图像处理方法的流程图;
图2为本发明实施例一提供的摄像头的安装位置示意图;
图3为图1中步骤S30的方法流程图;
图4为本发明实施例一提供的透视变换示意图;
图5为本发明实施例一提供的另一种基于字符识别的图像处理方法的流程图;
图6为图1中步骤S50的方法流程图;
图7为本发明实施例二提供的一种基于字符识别的图像处理装置的示范性结构框图;
图8为图7中透视滤波模块的示范性结构框图;
图9为本发明实施例二提供的另一种基于字符识别的图像处理装置的示范性结构框图;
图10为图7中连通域模块的示范性结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一
如图1所示,在本实施例中,一种基于字符识别的图像处理方法,包括:
S10、通过摄像头获取待识别字符的三通道图像;
S20、将所述三通道图像通过灰度算法公式转化为灰度图像;
S30、对所述灰度图像进行透视变换和滤波,得到滤波图像;
S40、对所述滤波图像进行二值化,得到二值图像;
S50、通过八临域算法对所述二值图像进行连通域检测,获得有效图像。
在本实施例中,通过灰度化、透视变换、滤波二值化等操作,将输入图像中的待识别字母信息提取出来,提高了算法的抗噪能力和识别率。
在本实施例中,所述摄像头为安装在机器人主体上的摄像头。如图2所示,为摄像头(相机)的安装位置示意图,摄像头离水平面的高度为H1,摄像头的拍摄角度为θ,摄像头的像素为200万像素,待识别字符的尺寸为宽30mm高40mm。
在本实施例中,所述灰度算法公式为:
Y(x,y)=R(x,y)*0.299+G(x,y))*0.587+B(x,y)*0.114
其中,Y(x,y)表示(x,y)坐标处的灰度值;R(x,y)、G(x,y)、B(x,y)分别表示(x,y)坐标处的红、绿、蓝三通道的分量。
如图3所示,在本实施例中,所述步骤S30包括:
S31、通过透视变换公式对所述灰度图像进行图像视角的变换,将图像视角由倾斜视角转为垂直视角;
S32、采用同态滤波算法对垂直视角的灰度图像进行滤波,得到滤波图像。
在本实施例中,根据机器人摄像头与水平面的夹角θ计算一个单应矩阵,使用该单应矩阵对图像进行透视变换,使图像从倾斜视角转为垂直视角。单应矩阵的计算方法为,使用机器人摄像头拍一个矩形物体,如图4所示,其中左侧为机器人视角看到的矩形,右侧为垂直视角看到的矩形,其中坐标A1-A4与坐标B1-B4为一一对应,必然存在一个3x3的矩阵T1使得下式成立。
A(1,2,3,4)*T1=B(1,2,3,4)
利用最小二乘法即可求出矩阵T1,T1即为该步骤需要的单应矩阵,如图2所示,一般机器人在设计完成之后摄像机高度H1和角度θ就已经确定,所以T1也在此时就已确定。
在本实施例中,透视变换公式为:
其中u,v为像素在原始图片中的坐标;x,y为像素在变换后图片中的坐标,其中x=x’/w’,y=y’/w’。
在本实施例中,同态滤波器构造过程为:
-1
f(x,y)→In→DFT→H(u,v)→(DFT)→exp→g(x,y)
其中,x,y表示像素的坐标,In表示对数操作,DFT为傅里叶变换,H(u,v)为一个高通滤波器,这里为高斯高通滤波器,DFT-1为反傅里叶变换,exp为取值操作。
在本实施例中,二值化公式为:
其中,Bin(x,y)为二值图像中x,y坐标处的值,T2为选定的一个灰度阈值。
如图5所示,在本实施例中,所述步骤S40之后还包括:
S41、对所述二值图像进行闭操作,去除图像中的裂缝噪声。
在本实施例中,闭操作具体为:
(1)对图像先进行膨胀操作,即构造一个3x3的元素,与每一个像素进行‘与’操作,如果中心及邻域像素为0,则该像素为0;
(2)在对图像进行一次腐蚀操作,同样构造3x3的元素,与每一个像素进行‘与’操作,如果邻域中有像素大于0,则该像素为255。
如图6所示,在本实施例中,所述步骤S50包括:
S51、从所述二值图像中获取一个未被标记的黑色像素点,标记为N;
S52、对所述黑色像素点进行八临域算法:检测所述黑色像素点临近的八个像素点中未被标记的黑色像素点,将所述未被标记的黑色像素点存入队列D1中;
S53、从所述队列中选取出一个像素点,标记为N,对所述像素点进行八临域算法;
S54、当所述队列D1为空时,所述二值图像中的所以标记为N的黑色像素点组成一个连通域图像;
S55、对N执行+1操作,重复上述步骤,得到标记为N+1的连通域图像;
S56、对所有连通域图像的中心有效区域进行归一化,得到预设像素值的有效图像。
在本实施例中,所述预设像素值的有效图像与待识别字符的尺寸相关,为30X40的图像。
实施例二
如图7所示,在本实施例中,一种基于字符识别的图像处理装置,包括:
获取模块10,用于通过摄像头获取待识别字符的三通道图像;
灰度模块20,用于将所述三通道图像通过灰度算法公式转化为灰度图像;
透视滤波模块30,用于对所述灰度图像进行透视变换和滤波,得到滤波图像;
二值化模块40,用于对所述滤波图像进行二值化,得到二值图像;
连通域模块50,用于通过八临域算法对所述二值图像进行连通域检测,获得有效图像。
在本实施例中,通过灰度化、透视变换、滤波二值化等操作,将输入图像中的待识别字母信息提取出来,提高了算法的抗噪能力和识别率。
在本实施例中,所述摄像头为安装在机器人主体上的摄像头。如图2所示,为摄像头(相机)的安装位置示意图,摄像头离水平面的高度为H1,摄像头的拍摄角度为θ,摄像头的像素为200万像素,待识别字符的尺寸为宽30mm高40mm。
在本实施例中,所述灰度算法公式为:
Y(x,y)=R(x,y)*0.299+G(x,y))*0.587+B(x,y)*0.114
其中,Y(x,y)表示(x,y)坐标处的灰度值;R(x,y)、G(x,y)、B(x,y)分别表示(x,y)坐标处的红、绿、蓝三通道的分量。
如图8所示,在本实施例中,所述透视滤波模块包括:
透视转换单元31,用于通过透视变换公式对所述灰度图像进行图像视角的变换,将图像视角由倾斜视角转为垂直视角;
滤波单元32,用于采用同态滤波算法对垂直视角的灰度图像进行滤波,得到滤波图像。
在本实施例中,根据机器人摄像头与水平面的夹角θ计算一个单应矩阵,使用该单应矩阵对图像进行透视变换,使图像从倾斜视角转为垂直视角。单应矩阵的计算方法为,使用机器人摄像头拍一个矩形物体,如图4所示,其中左侧为机器人视角看到的矩形,右侧为垂直视角看到的矩形,其中坐标A1-A4与坐标B1-B4为一一对应,必然存在一个3x3的矩阵T1使得下式成立。
A(1,2,3,4)*T1=B(1,2,3,4)
利用最小二乘法即可求出矩阵T1,T1即为该步骤需要的单应矩阵,如图2所示,一般机器人在设计完成之后摄像机高度H1和角度θ就已经确定,所以T1也在此时就已确定。
在本实施例中,透视变换公式为:
其中u,v为像素在原始图片中的坐标;x,y为像素在变换后图片中的坐标,其中x=x’/w’,y=y’/w’。
在本实施例中,同态滤波器构造过程为:
f(x,y)→In→DFT→H(u,v)→(DFT)-1→exp→g(x,y)
其中,x,y表示像素的坐标,In表示对数操作,DFT为傅里叶变换,H(u,v)为一个高通滤波器,这里为高斯高通滤波器,DFT-1为反傅里叶变换,exp为取值操作。
在本实施例中,二值化公式为:
其中,Bin(x,y)为二值图像中x,y坐标处的值,T2为选定的一个灰度阈值。
如图9所示,在本实施例中,还包括:
闭操作模块60,用于对所述二值图像进行闭操作,去除图像中的裂缝噪声。
在本实施例中,闭操作具体为:
(1)对图像先进行膨胀操作,即构造一个3x3的元素,与每一个像素进行‘与’操作,如果中心及邻域像素为0,则该像素为0;
(2)在对图像进行一次腐蚀操作,同样构造3x3的元素,与每一个像素进行‘与’操作,如果邻域中有像素大于0,则该像素为255。
如图10所示,在本实施例中,所述连通域模块包括:
标记单元51,用于从所述二值图像中获取一个未被标记的黑色像素点,标记为N;
八临域单元52,用于对所述黑色像素点进行八临域算法:检测所述黑色像素点临近的八个像素点中未被标记的黑色像素点,将所述未被标记的黑色像素点存入队列D1中;
选取单元53,用于从所述队列中选取出一个像素点,标记为N,对所述像素点进行八临域算法;
连通单元54,用于当所述队列D1为空时,所述二值图像中的所以标记为N的黑色像素点组成一个连通域图像;
重复单元55,用于对N执行+1操作,重复上述步骤,得到标记为N+1的连通域图像;
归一化单元56,用于对所有连通域图像的中心有效区域进行归一化,得到预设像素值的有效图像。
在本实施例中,所述预设像素值的有效图像与待识别字符的尺寸相关,为30X40的图像。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于字符识别的图像处理方法,其特征在于,包括:
通过摄像头获取待识别字符的三通道图像;
将所述三通道图像通过灰度算法公式转化为灰度图像;
对所述灰度图像进行透视变换和滤波,得到滤波图像;
对所述滤波图像进行二值化,得到二值图像;
通过八临域算法对所述二值图像进行连通域检测,获得有效图像。
2.根据权利要求1所述的一种基于字符识别的图像处理方法,其特征在于,所述灰度算法公式为:
Y(x,y)=R(x,y)*0.299+G(x,y))*0.587+B(x,y)*0.114
其中,Y(x,y)表示(x,y)坐标处的灰度值;R(x,y)、G(x,y)、B(x,y)分别表示(x,y)坐标处的红、绿、蓝三通道的分量。
3.根据权利要求2所述的一种基于字符识别的图像处理方法,其特征在于,所述对所述灰度图像进行透视变换和滤波,得到滤波图像包括:
通过透视变换公式对所述灰度图像进行图像视角的变换,将图像视角由倾斜视角转为垂直视角;
采用同态滤波算法对垂直视角的灰度图像进行滤波,得到滤波图像。
4.根据权利要求3所述的一种基于字符识别的图像处理方法,其特征在于,所述对所述滤波图像进行二值化,得到二值图像之后还包括:
对所述二值图像进行闭操作,去除图像中的裂缝噪声。
5.根据权利要求4所述的一种基于字符识别的图像处理方法,其特征在于,所述通过八临域算法对所述二值图像进行连通域检测,获得有效图像包括:
从所述二值图像中获取一个未被标记的黑色像素点,标记为N;
对所述黑色像素点进行八临域算法:检测所述黑色像素点临近的八个像素点中未被标记的黑色像素点,将所述未被标记的黑色像素点存入队列D1中;
从所述队列中选取出一个像素点,标记为N,对所述像素点进行八临域算法;
当所述队列D1为空时,所述二值图像中的所以标记为N的黑色像素点组成一个连通域图像;
对N执行+1操作,重复上述步骤,得到标记为N+1的连通域图像;
对所有连通域图像的中心有效区域进行归一化,得到预设像素值的有效图像。
6.一种基于字符识别的图像处理装置,其特征在于,包括:
获取模块,用于通过摄像头获取待识别字符的三通道图像;
灰度模块,用于将所述三通道图像通过灰度算法公式转化为灰度图像;
透视滤波模块,用于对所述灰度图像进行透视变换和滤波,得到滤波图像;
二值化模块,用于对所述滤波图像进行二值化,得到二值图像;
连通域模块,用于通过八临域算法对所述二值图像进行连通域检测,获得有效图像。
7.根据权利要求6所述的一种基于字符识别的图像处理装置,其特征在于,所述灰度算法公式为:
Y(x,y)=R(x,y)*0.299+G(x,y))*0.587+B(x,y)*0.114
其中,Y(x,y)表示(x,y)坐标处的灰度值;R(x,y)、G(x,y)、B(x,y)分别表示(x,y)坐标处的红、绿、蓝三通道的分量。
8.根据权利要求7所述的一种基于字符识别的图像处理装置,其特征在于,所述透视滤波模块包括:
透视转换单元,用于通过透视变换公式对所述灰度图像进行图像视角的变换,将图像视角由倾斜视角转为垂直视角;
滤波单元,用于采用同态滤波算法对垂直视角的灰度图像进行滤波,得到滤波图像。
9.根据权利要求8所述的一种基于字符识别的图像处理装置,其特征在于,还包括:
闭操作模块,用于对所述二值图像进行闭操作,去除图像中的裂缝噪声。
10.根据权利要求9所述的一种基于字符识别的图像处理装置,其特征在于,所述连通域模块包括:
标记单元,用于从所述二值图像中获取一个未被标记的黑色像素点,标记为N;
八临域单元,用于对所述黑色像素点进行八临域算法:检测所述黑色像素点临近的八个像素点中未被标记的黑色像素点,将所述未被标记的黑色像素点存入队列D1中;
选取单元,用于从所述队列中选取出一个像素点,标记为N,对所述像素点进行八临域算法;
连通单元,用于当所述队列D1为空时,所述二值图像中的所以标记为N的黑色像素点组成一个连通域图像;
重复单元,用于对N执行+1操作,重复上述步骤,得到标记为N+1的连通域图像;
归一化单元,用于对所有连通域图像的中心有效区域进行归一化,得到预设像素值的有效图像。
CN201810968260.6A 2018-08-23 2018-08-23 一种基于字符识别的图像处理方法及装置 Pending CN109101969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810968260.6A CN109101969A (zh) 2018-08-23 2018-08-23 一种基于字符识别的图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810968260.6A CN109101969A (zh) 2018-08-23 2018-08-23 一种基于字符识别的图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN109101969A true CN109101969A (zh) 2018-12-28

Family

ID=64851042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810968260.6A Pending CN109101969A (zh) 2018-08-23 2018-08-23 一种基于字符识别的图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN109101969A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164024A (zh) * 2020-08-29 2021-01-01 北方工业大学 一种基于领域自适应的混凝土表面裂缝检测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法
CN104331688A (zh) * 2014-11-05 2015-02-04 中北大学 一种雷管外壳点阵字符识别方法
CN104751187A (zh) * 2015-04-14 2015-07-01 山西科达自控股份有限公司 抄表图像自动识别方法
US20160259972A1 (en) * 2013-11-08 2016-09-08 Grg Banking Equipment Co., Ltd. Complex background-oriented optical character recognition method and device
CN106503694A (zh) * 2016-12-01 2017-03-15 重庆大学 基于八邻域特征的数字识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法
US20160259972A1 (en) * 2013-11-08 2016-09-08 Grg Banking Equipment Co., Ltd. Complex background-oriented optical character recognition method and device
CN104331688A (zh) * 2014-11-05 2015-02-04 中北大学 一种雷管外壳点阵字符识别方法
CN104751187A (zh) * 2015-04-14 2015-07-01 山西科达自控股份有限公司 抄表图像自动识别方法
CN106503694A (zh) * 2016-12-01 2017-03-15 重庆大学 基于八邻域特征的数字识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
周明辉: "运动车辆车牌识别算法的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
路敬祎 等: "基于改进的连通域算法与垂直投影相结合的车牌字符分割", 《自动化技术与应用》 *
陆玲 等著: "《图像目标分割方法》", 30 November 2016, 哈尔滨工程大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164024A (zh) * 2020-08-29 2021-01-01 北方工业大学 一种基于领域自适应的混凝土表面裂缝检测方法及系统
CN112164024B (zh) * 2020-08-29 2023-09-05 北方工业大学 一种基于领域自适应的混凝土表面裂缝检测方法及系统

Similar Documents

Publication Publication Date Title
US10372226B2 (en) Visual language for human computer interfaces
Guo et al. Spatio-temporal saliency detection using phase spectrum of quaternion fourier transform
CN106446952B (zh) 一种乐谱图像识别方法及装置
US20160154469A1 (en) Mid-air gesture input method and apparatus
CN109948566B (zh) 一种基于权重融合与特征选择的双流人脸反欺诈检测方法
CN104134200B (zh) 一种基于改进加权融合的运动场景图像拼接方法
CN106446872A (zh) 一种低照度下的视频人脸检测识别方法
CN104966285B (zh) 一种显著性区域的检测方法
CN110458063B (zh) 防视频、照片欺骗的人脸活体检测方法
CN109190456B (zh) 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法
CN107066972B (zh) 基于多通道极值区域的自然场景文本检测方法
CN103020965A (zh) 一种基于显著性检测的前景分割方法
CN104202547A (zh) 投影画面中提取目标物体的方法、投影互动方法及其系统
KR101549495B1 (ko) 문자 추출 장치 및 그 방법
CN108171674B (zh) 针对任意视角投影仪图像的视觉矫正方法
Kanter Color Crack: Identifying Cracks in Glass
CN109711420B (zh) 基于人类视觉注意机制的多仿射目标的检测与识别方法
Izzah et al. Translation of sign language using generic fourier descriptor and nearest neighbour
CN105139017B (zh) 融合仿射不变角点特征及视觉颜色特征的车牌定位算法
CN109101969A (zh) 一种基于字符识别的图像处理方法及装置
CN107368826A (zh) 用于文本检测的方法和装置
CN109086738A (zh) 一种基于模板匹配的字符识别方法及装置
JP6517652B2 (ja) 物体顕著性マップ算出装置、方法、及びプログラム
CN109241807B (zh) 一种远距离二维码定位方法
CN115908399A (zh) 一种基于改进视觉注意机制的磁片瑕疵检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200624

Address after: Building 1, No.2, Danzi North Road, Kengzi street, Pingshan District, Shenzhen City, Guangdong Province

Applicant after: SHENZHEN TONGWEI COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 518000 Water Bay 1979 Square Phase II 5A, 111 Prince Road, Shuiwan Community, Merchants Street, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: SHENZHEN DEEPCONV TECHNOLOGIES Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181228