CN116310280A - 一种基于Opencv的铭牌自动定位识别方法 - Google Patents

一种基于Opencv的铭牌自动定位识别方法 Download PDF

Info

Publication number
CN116310280A
CN116310280A CN202310173382.7A CN202310173382A CN116310280A CN 116310280 A CN116310280 A CN 116310280A CN 202310173382 A CN202310173382 A CN 202310173382A CN 116310280 A CN116310280 A CN 116310280A
Authority
CN
China
Prior art keywords
image
nameplate
value
gray
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310173382.7A
Other languages
English (en)
Inventor
蒋飞
陈浩伦
梁经伦
林福清
吴兆乾
张文涛
刘雨成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan University of Technology
Original Assignee
Dongguan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan University of Technology filed Critical Dongguan University of Technology
Priority to CN202310173382.7A priority Critical patent/CN116310280A/zh
Publication of CN116310280A publication Critical patent/CN116310280A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20032Median filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种基于Opencv的铭牌自动定位识别方法,采用工业相机对车辆轮廓进行拍照检测并识别车型;对工业相机获取的图像进行预处理,先对图像进行高斯滤波和中值滤波的处理,将图像的噪声去除;然后进行二值化处理,得到二值化的图像;对二值化后的图像的文字部分进行基于膨胀、腐蚀的开闭合运算,上述处理完成后便可获得n个有可能成为目标的矩形区域,即经处理后的汽车铭牌图像;最后将汽车铭牌图像中目标区域截取出来,并使用OCR模型对铭牌图像进行识别检测,获取铭牌上的信息。本发明能够自动对车辆的铭牌进行定位并且识别,能够节省人工识别成本,并且缩短识别的时间,获取铭牌上信息更为快速、准确。

Description

一种基于Opencv的铭牌自动定位识别方法
技术领域
本发明涉及机器视觉检测技术领域,具体涉及一种基于Opencv的铭牌自动定位识别方法。
背景技术
车辆铭牌放在车辆前部容易看到的地方。 根据车的位置,一般在副驾驶的门的下部,打开门即可查看。 车辆标牌是展示车辆基本特征的标牌。 其主要内容包括:制造商品牌、车辆型号、发动机型号、发动机排气量、发动机额定输出、车辆识别编号、总质量、载重或装载人数、出厂编号、制造年月、制造国及制造商名称等。查看出货铭牌,确保车辆的排气量和生产日期等信息,确认铭牌上是否有拧紧螺钉的痕迹和伤痕。 很多车的发货铭牌安装在不易碰撞的地方,所以一旦动了,就必须仔细查看这辆车。 另外,如果看一下行驶簿的注册日期,多半会在发货日期之后。 如果两个日期相差太多,说明这辆车是剩车,就要仔细查看车的状态。
机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是通过机器视觉产品将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对图像等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据,其在语音和图像识别方面取得的效果,远远超过先前相关技术。机器视觉识别技术是移动机器人平台十分关键的技术,代表着机器人智能化、自动化及先进性的判定标准。基于机器视觉的三维物体目标的识别、检测与定位技术已经成功应用于众多工业领域中。配合着机械臂平台,以其为基础的操作系统可以完成一系列繁重复杂的工作,大大解放了人类的双手,提高了工业生产效率。作为促成这一切成果基础的机器人视觉识别技术正在逐步建立、稳定发展并一步步走向成熟。近年来,随着机器人相关技术的快速发展,其依靠的平台也快速的更新换代。之前价格较为昂贵的3D工业相机、3D图像传感器、3D扫描仪渐渐得到普及,传感器的微型化、智能化、低功耗以及高效率带来的深度图像设备价格大幅下降,随之机器视觉识别技术也越发深入且成熟。
因此,面对查看登记汽车铭牌这种具有重复性与枯燥性的工作,使用机器视觉识别技术对汽车铭牌进行自动定位检测,不仅能够使各单位应对当下日益高昂的的人工成本,也节省了时间成本,提高了准确率,具有非常重要的意义。
发明内容
本发明的目的在于自动定位汽车铭牌,节省时间成本与人力资源,提出了一种基于Opencv的铭牌自动定位识别方法。使用工业相机获取汽车铭牌部位图象,并进行二值化处理与膨胀与腐蚀的开闭合运算,最后通过OCR模型进行铭牌文字部分的识别定位。
为达到上述目的,本发明所采用的技术方案是:
一种基于Opencv的铭牌自动定位识别方法,其包括以下步骤:
步骤一、采用工业相机对车辆轮廓进行拍照检测并识别车型;
步骤二、对工业相机获取的图像进行预处理,先对图像进行高斯滤波和中值滤波的处理,将图像的噪声去除;然后进行二值化处理,得到二值化的图像;
步骤三、对二值化后的图像的文字部分进行基于膨胀、腐蚀的开闭合运算,上述处理完成后便可获得n个有可能成为目标的矩形区域,即经处理后的汽车铭牌图像;
步骤四、最后将汽车铭牌图像中目标区域截取出来,并使用OCR模型对铭牌图像进行识别检测,获取铭牌上的信息。
上述方案中,步骤二的二值化处理原理如下:
二值化把灰度图像转换成二值图像,把大于某个临界灰度值(阈值)的像素灰度设为灰度极大值(255),把小于这个值的像素灰度设为灰度极小值(0),从而实现二值化,也就是设定一个阈值valve,对于视频信号矩阵中的每一行,从左至右比较各像素值和阈值的大小,若图像灰度值大于或等于阈值,则判定该像素对应的255;反之,小于阈值的灰度值则为0。
上述方案中,步骤三的膨胀腐蚀的开闭合运算原理如下:
图像膨胀与卷积操作类似,假设有图像A和结构元素B,结构元素B在A上边移动,其中B定义其中心为锚点,计算B覆盖下A的最大像素值用来替换锚点的像素,其中B作为结构体可以是任何形状;图像腐蚀跟膨胀操作的过程类似,唯一不同的是以最小值替换锚点重叠下的像素值;开闭合运算则是对图像进行膨胀与腐蚀的先后顺序不同。
本发明与现有技术相比,具有以下有益效果:
1、本发明能够自动对车辆的铭牌进行定位并且识别,能够节省人工识别成本,并且缩短识别的时间。
2、本发明先对图象进行二值化处理并进行膨胀与腐蚀的闭合运算,再使用OCR模型对铭牌图象进行识别检测,获取铭牌上信息更为快速、准确。
附图说明
图1为工业相机拍摄原始图;
图2为经过二值化处理与膨胀腐蚀的开闭合运算后的图象;
图3为返回的铭牌定位结果;
图4为OCR模型识别结果。
具体实施方式
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例
参阅图1~4所示,一种基于Opencv的铭牌自动定位识别方法,其包括以下步骤:
步骤一、采用工业相机对车辆轮廓进行拍照检测并识别车型,对于不同的车型,分别具有不同的侧面轮廓特征,特征值选取是车型识别的依据和关键。
步骤二、对工业相机获取的图像进行预处理,先对图像进行高斯滤波和中值滤波的处理,将图像的噪声去除;然后进行二值化处理,得到二值化的图像;二值化可以把灰度图像转换成二值图像,把大于某个临界灰度值(阈值)的像素灰度设为灰度极大值(255),把小于这个值的像素灰度设为灰度极小值(0),从而实现二值化,也就是设定一个阈值valve,对于视频信号矩阵中的每一行,从左至右比较各像素值和阈值的大小,若图像灰度值大于或等于阈值,则判定该像素对应的255;反之,小于阈值的灰度值则为0。就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。二值化的所用就是将图像分成黑和白,更加有利于做图像处理判别。
步骤三、对二值化后的图像的文字部分进行基于膨胀、腐蚀的开闭合运算,上述处理完成后便可获得n个有可能成为目标的矩形区域,即经处理后的汽车铭牌图像。膨胀腐蚀的开闭合运算原理如下:
图像膨胀与卷积操作类似,假设有图像A和结构元素B,结构元素B在A上边移动,其中B定义其中心为锚点,计算B覆盖下A的最大像素值用来替换锚点的像素,其中B作为结构体可以是任何形状;图像腐蚀跟膨胀操作的过程类似,唯一不同的是以最小值替换锚点重叠下的像素值;开闭合运算则是对图像进行膨胀与腐蚀的先后顺序不同。
步骤四、最后将汽车铭牌图像中目标区域截取出来,并使用OCR模型对铭牌图像进行识别检测,即可获取铭牌上的信息。OCR模型包括分类器字符识别模型、字符模板匹配模型或深度学习模型,根据OCR模型的符合度指标值和对应的权重进行识别。
本发明能够自动对车辆的铭牌进行定位并且识别,能够节省人工识别成本,并且缩短识别的时间。先对图象进行二值化处理并进行膨胀与腐蚀的闭合运算,再使用OCR模型对铭牌图象进行识别检测,获取铭牌上信息更为快速、准确。
以上虽然结合附图描述了本发明的较佳具体实施例,但本发明不应被限制于与以上的描述和附图完全相同的结构和操作,对本技术领域的技术人员来说,在不超出本发明构思和范围的情况下通过逻辑分析、推理或者有限的实验还可对上述实施例作出许多等效改进和变化,但这些改进和变化都应属于本发明要求保护的范围。

Claims (3)

1.一种基于Opencv的铭牌自动定位识别方法,其特征在于,包括以下步骤:
步骤一、采用工业相机对车辆轮廓进行拍照检测并识别车型;
步骤二、对工业相机获取的图像进行预处理,先对图像进行高斯滤波和中值滤波的处理,将图像的噪声去除;然后进行二值化处理,得到二值化的图像;
步骤三、对二值化后的图像的文字部分进行基于膨胀、腐蚀的开闭合运算,上述处理完成后便可获得n个有可能成为目标的矩形区域,即经处理后的汽车铭牌图像;
步骤四、最后将汽车铭牌图像中目标区域截取出来,并使用OCR模型对铭牌图像进行识别检测,获取铭牌上的信息。
2.根据权利要求1所述的一种基于Opencv的铭牌自动定位识别方法,其特征在于,步骤二的二值化处理原理如下:
二值化把灰度图像转换成二值图像,把大于某个临界灰度值(阈值)的像素灰度设为灰度极大值(255),把小于这个值的像素灰度设为灰度极小值(0),从而实现二值化,也就是设定一个阈值valve,对于视频信号矩阵中的每一行,从左至右比较各像素值和阈值的大小,若图像灰度值大于或等于阈值,则判定该像素对应的255;反之,小于阈值的灰度值则为0。
3.根据权利要求1所述的一种基于Opencv的铭牌自动定位识别方法,其特征在于,步骤三的膨胀腐蚀的开闭合运算原理如下:
图像膨胀与卷积操作类似,假设有图像A和结构元素B,结构元素B在A上边移动,其中B定义其中心为锚点,计算B覆盖下A的最大像素值用来替换锚点的像素,其中B作为结构体可以是任何形状;图像腐蚀跟膨胀操作的过程类似,唯一不同的是以最小值替换锚点重叠下的像素值;开闭合运算则是对图像进行膨胀与腐蚀的先后顺序不同。
CN202310173382.7A 2023-02-28 2023-02-28 一种基于Opencv的铭牌自动定位识别方法 Pending CN116310280A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310173382.7A CN116310280A (zh) 2023-02-28 2023-02-28 一种基于Opencv的铭牌自动定位识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310173382.7A CN116310280A (zh) 2023-02-28 2023-02-28 一种基于Opencv的铭牌自动定位识别方法

Publications (1)

Publication Number Publication Date
CN116310280A true CN116310280A (zh) 2023-06-23

Family

ID=86786282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310173382.7A Pending CN116310280A (zh) 2023-02-28 2023-02-28 一种基于Opencv的铭牌自动定位识别方法

Country Status (1)

Country Link
CN (1) CN116310280A (zh)

Similar Documents

Publication Publication Date Title
CN111179251B (zh) 基于孪生神经网络利用模板比对的缺陷检测系统及方法
CN111951237B (zh) 外观视觉检测方法
CN109141232B (zh) 一种基于机器视觉的盘类铸件在线检测方法
CN111862037A (zh) 基于机器视觉的精密孔类零件几何特征检测方法及系统
CN110543878A (zh) 一种基于神经网络的指针仪表读数识别方法
CN103020632B (zh) 一种室内环境中移动机器人定位标志点的快速识别方法
CN106897995B (zh) 一种面向机械装配过程的零部件自动识别方法
CN105160652A (zh) 基于计算机视觉的手机外壳检验装置与方法
CN101995223A (zh) 一种芯片外观检测方法及系统
CN113012098B (zh) 一种基于bp神经网络的铁塔角钢冲孔缺陷检测方法
CN112528979B (zh) 变电站巡检机器人障碍物判别方法及系统
CN115937203B (zh) 一种基于模板匹配的视觉检测方法、装置、设备及介质
CN111161237A (zh) 一种果蔬表面质检方法及其储存介质、分拣装置
CN115775246A (zh) 一种pcb元器件缺陷检测的方法
Liu et al. Automatic detection and segmentation of laser stripes for industrial measurement
CN111178405A (zh) 一种融合多种神经网络的相似物体识别方法
CN113269234B (zh) 一种基于目标检测的连接件装配检测方法和系统
CN110687120A (zh) 法兰外观质量检测系统
CN114155610A (zh) 基于上半身姿态估计的面板装配关键动作识别方法
CN112109374A (zh) 一种基于计算机视觉系统定位及控制折弯模具装卸的方法
CN116486177A (zh) 一种基于深度学习的水下目标识别分类方法
CN116823708A (zh) 基于机器视觉的pc构件边模识别与定位研究
CN116310280A (zh) 一种基于Opencv的铭牌自动定位识别方法
CN116051808A (zh) 一种基于YOLOv5的轻量化零件识别定位方法
CN115631169A (zh) 产品检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination