CN111832565A - 一种基于决策树的数码管识别方法 - Google Patents
一种基于决策树的数码管识别方法 Download PDFInfo
- Publication number
- CN111832565A CN111832565A CN202010719933.1A CN202010719933A CN111832565A CN 111832565 A CN111832565 A CN 111832565A CN 202010719933 A CN202010719933 A CN 202010719933A CN 111832565 A CN111832565 A CN 111832565A
- Authority
- CN
- China
- Prior art keywords
- nixie tube
- roi
- gray
- decision tree
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于决策树的数码管识别方法,其特征在于,包括如下步骤:1)图像采集;2)预处理;3)数码管识别。这种方法适用于工业场景,能够提高复杂环境下数码管识别的效率。
Description
技术领域
本发明涉及计算机图像处理技术领域,具体是一种基于决策树的数码管识别方法。
背景技术
现有技术中,数码管识别技术难点主要是在复杂工业环境中,常用的识别方法无法完成数字区域与背景区域的高精度分割,进而影响后续识别的准确度。在数码管识别方面,有仅适用于带背光显示器的数字识别检测算法,该算法无法适应无背光的数码管识别;有针对干净图片采用笔画宽度变换定位感兴趣区域,并使用支持向量机来进一步筛选的算法,但算法的输入图片较为理想,并不是在现实情况下捕获的;有利用OCR技术从数字万用表和其他类似的数字显示设备中获取自动数据的系统,此系统可以自动检测小数点和负号,不过该系统只针对七段显示数码管。目前基于图像的数码管自动识别方法在复杂的工业环境中存在模型失配、适应性不强、准确度较低的问题。
发明内容
本发明的目的在于针对现有技术的不足,而提供一种基于决策树的数码管识别方法。这种方法适用于工业场景,能够提高复杂环境下数码管识别的效率。
实现本发明目的的技术方案是:
一种基于决策树的数码管识别方法,包括如下步骤:
1)图像采集:图像采集就是获取图像中图案的扫描图像即数字图像的过程,假设捕获图像中的数码管所在区域即数码管ROI为已知,从采集到的图像中提取出数码管区域,用于后续处理;
2)预处理:对步骤1)得到的数码管ROI进行预处理,首先,对数码管ROI进行灰度化得到灰度图,计算灰度图的Tsallis熵,采用基于决策树的二值化方法对数码管ROI的灰度图进行二值化处理,图像二值化后进行噪声消除,采用边缘消除、膨胀和填充去除图像中噪点,最后对不同尺寸的数码管ROI进行尺寸归一;,方便后续处理;
3)数码管识别:对步骤2)得到的尺寸归一后的数码管ROI进行识别,包括三个过程:数字分割、特征提取和数值判定,以数码管色块分布特征为依据进行实时自适应的数字分割,最后估计特征编码数值。
步骤2)中所述的决策树的二值化方法为:
2-1)计算数码管ROI对应的灰度频数分布,数码管ROI对应的灰度频数分布为公式(1)所示:
其中J,I分别为数码管ROI的行像素数与列像素数,Q(k)为对应特定灰度的像素点数和,k=1,2,3...256;
2-3)计算Tsallis熵:Tsallis熵为公式(3)所示:
其中,q为Tsallis熵的系数,Tsallis熵是香农熵的扩展,当可调参数q→1时,Tsallis熵等价为香农熵,通过调整q值可以在图像分析中更好地度量图像中不同特征区域的状态差异;
2-4)在Tsallis熵-灰度均值平面上,正常光线、过度曝光、设备关机三种状态下图像度量值能够被决策树分割,依据这一特征,采用灰度均值和Tsallis熵构建双层决策树,在Tsallis熵-灰度均值平面上将正常光线、过度曝光、设备关机三种状态下的图像度量值分开,过程为:
依据决策树判断图片所属场景,进而采用适配不同场景的灰度图二值化方法,并计算门限值∈,其中,场景包括:
2-4-1)设备关机:二值化门限选为灰度最大值,使得二值化图片中数码管区域与背景区
域一致:∈=maxi,jp(i,j);
2-4-2)过度曝光:采用Otsu算法计算二值化门限基准,并附加余量减少过度曝光的影响:
∈=ε+δ,其中ε,δ分别为Otsu算法门限和附加余量;
2-4-3)正常光线:根据Otsu算法计算二值化门限。
步骤3)中所述的数字分割包括:
3-1)由于数码管上每个数字间存在间隔,假设每个数字分割处像素和的特征与数字所在区域不同,依据这种特征上的区别,可以分割出单个数码管,数码管ROI二值化图中每列的像素和,定义如下:
其中i,j表示ROI区域内像素点坐标,第i行、第j列的像素值为p(i,j);
3-2)数字分割点出现在峰值点之间,采用步骤3-1)中c(i)的峰值点计算数字的分割点,计算方法如下:
其中di为第i个分割点,mi为c(i)第i个峰值点。
针对复杂工业场景,为提高数码管识别应用时的可靠性,本技术方案首先从设备采集图像中提取数码管所在区域即ROI,然后对ROI区域进行灰度化,计算灰度图的Tsallis熵,因为不同Tsallis熵值对应于不同的工作环境、数码管状态,然后基于Tsallis熵值,选择预设的二值化算法,完成灰度图的二值化,由于数码管中的数字往往多于一个,需要对数字区域分别识别,因此二值化后,利用数字定位算法对数码管区域进行切分,最后分别对每个数字区域进行识别,分别计算七段数码管所在区域点亮的数码管区域比例,并将其作为识别特征,然后将七段数码管的特征组合为一个向量,使用支持向量机(support vectormachine,简称SVM)完成数字的识别。
这种方法适用于工业场景,能够提高复杂环境下数码管识别的效率。
附图说明
图1为实施例方法的流程示意图;
图2为实施例中正常光照条件下数码管及其灰度直方图;
图3为实施例中过度曝光条件下数码管及其灰度直方图;
图4为实施例中设备关机条件下数码管及其灰度直方图;
图5为实施例中均值、Tsallis熵分布图;
图6为实施例中决策树示意图;
图7为实施例中基于像素和的数字分割示意图。
具体实施方式
下面结合附图和实施例对本发明内容作进一步的说明,但不是对本发明的限定。
实施例:
参照图1,一种基于决策树的数码管识别方法,包括如下步骤:
1)图像采集:图像采集就是获取图像中图案的扫描图像即数字图像的过程,假设捕获图像中的数码管所在区域即数码管ROI为已知,从采集到的图像中提取出数码管区域,用于后续处理;
2)预处理:对步骤1)得到的数码管ROI进行预处理,首先,对数码管ROI进行灰度化得到灰度图,计算灰度图的Tsallis熵,采用基于决策树的二值化方法对数码管ROI的灰度图进行二值化处理,三种光线条件下的灰度统计直方图如图2、图3、图4所示,图像二值化后完成噪声消除,采用边缘消除、膨胀和填充去除图像中噪点,最后对不同尺寸的数码管ROI进行尺寸归一,方便后续处理;
3)数码管识别:对步骤2)得到的尺寸归一后的数码管ROI进行识别,包括三个过程:数字分割、特征提取和数值判定,由于实际工作中的数码管位数差异较大,甚至是时变的,以数码管色块分布特征为依据进行实时自适应的数字分割,最后估计特征编码数值。
步骤2)中所述的决策树的二值化方法为:
2-1)计算数码管ROI对应的灰度频数分布,数码管ROI对应的灰度频数分布为公式(1)所示:
其中J,I分别为数码管ROI的行像素数与列像素数,Q(k)为对应特定灰度的像素点数和,k=1,2,3...256;
2-2)计算数码管ROI灰度均值:数码管ROI灰度均值为公式(2)所示:
其中i为灰度值,P(k)为相应灰度值的灰度频数;
2-3)计算Tsallis熵:Tsallis熵为公式(3)所示:
其中,q为Tsallis熵的系数,Tsallis熵是香农熵的扩展,当可调参数q→1时,Tsallis熵等价为香农熵,通过调整q值可以在图像分析中更好地度量图像中不同特征区域的状态差异,本例中,图片主要差异表现在亮度较高的数码管区域,这一区域占整个ROI的比例通常较低,因此,为突出差异,选择q值为0.5,不同实际场景图片的灰度期望、Tsallis熵值分布图如图5所示;
2-4)在Tsallis熵-灰度均值平面上,正常光线、过度曝光、设备关机三种状态下图像度量值能够被决策树分割,依据这一特征,采用均值和Tsallis熵构建双层决策树,在Tsallis熵-灰度均值平面上将正常光线、过度曝光、设备关机三种状态下的图像度量值分开,本例所构建的双层决策树如图6所示,其中,灰度均值阈值为21、Tsallis熵阈值为40,过程为:
依据决策树判断图片所属场景,进而采用适配不同场景的灰度图二值化方法,并计算门限值∈,其中,场景包括:
2-4-1)设备关机:二值化门限选为灰度最大值,使得二值化图片中数码管区域与背景区
域一致:∈=maxi,jp(i,j);
2-4-2)过度曝光:采用Otsu算法计算二值化门限基准,并附加余量减少过度曝光的影响:
∈=ε+δ,其中ε,δ分别为Otsu算法门限和附加余量;
2-4-3)正常光线:根据Otsu算法计算二值化门限。
步骤3)中所述的数字分割包括:
3-1)由于数码管上每个数字间存在间隔,假设每个数字分割处像素和的特征与数字所在区域不同,依据这种特征上的区别,可以分割出单个数码管,数码管ROI二值化图中每列的像素和,定义如下:
其中i,j表示ROI区域内像素点坐标,第i行、第j列的像素值为p(i,j);
3-2)数字分割点出现在峰值点之间,采用步骤3-1)中c(i)的峰值点计算数字的分割点,计算方法如下:
其中di为第i个分割点,mi为c(i)第i个峰值点,本例中基于像素和的数字分割如图7所示。
本例中采集原始数据集包含七段数码管,共2000张数码管图片,采集图像设备为200万像素网络摄像头,图像中无显示屏闪烁或反射,数据集中有1000张图片为白天均匀光线采集,其中600张为数码管开启,400张图片为数码管关闭;1000张为白天非均匀光照情况采集,其中800张为数码管开启,200张图片为数码管关闭,数据集规格及其性质分别如表1、表2所示,总计捕获数字个数为5903个:
表1数据集拍摄参数
参数项 | 说明 |
拍摄设备 | 200万像素网络摄像头 |
焦距 | 2.6mm |
色彩制式 | RGB |
分辨率 | 1080p |
比特数 | 12 |
,
表2数据集统计参数
采用本例决策树对图像进行分类,选择1000张图片训练决策树,剩余1000张图片进行测试,训练集中包含500张白天均匀光线采集图片,其中300张为数码管开启,200张图片为数码管关闭;500张为白天非均匀光照情况采集,其中400张为数码管开启,100张图片为数码管关闭,训练集与测试集均采用随机方式,决策树分类准确性如表3所示,本例方法能够较好的应对复杂环境中的数字识别,在不同光线下,识别精度达到97.9%以上,数字识别准确度如表4所示,由环境噪声带来的灰度分布变化多样,传统的二值化方法无法给出最佳的二值化门限,采用本文提出的基于决策树的二值化方法后,数码管识别准确性可提高至90%以上,
表3决策树分类准确度
测试图片数 | 分类准确度 | |
正常光线 | 300 | 99.8% |
过度曝光 | 400 | 99.9% |
数码管关闭 | 300 | 100% |
表4数码管识别准确度
数字位置 | 出现次数 | 识别准确度 |
数字1 | 843 | 99.2% |
数字2 | 591 | 98.6% |
数字3 | 495 | 98.5% |
数字4 | 596 | 98.1% |
数字5 | 572 | 98.6% |
数字6 | 551 | 98.5% |
数字7 | 587 | 97.7% |
数字8 | 496 | 98.3% |
数字9 | 634 | 98.5% |
数字0 | 578 | 98.4% |
总体 | 5903 | 98.4% |
。
Claims (3)
1.一种基于决策树的数码管识别方法,其特征在于,包括如下步骤:
1)图像采集:假设捕获图像中的数码管所在区域即数码管ROI为已知,从采集到的图像中提取出数码管区域;
2)预处理:对步骤1)得到的数码管ROI进行预处理,首先,对数码管ROI进行灰度化得到灰度图,计算灰度图的Tsallis熵,采用基于决策树的二值化方法对数码管ROI的灰度图进行二值化处理,图像二值化后进行噪声消除,采用边缘消除、膨胀和填充去除图像中噪点,最后对不同尺寸的数码管ROI进行尺寸归一;
3)数码管识别:对步骤2)得到的尺寸归一后的数码管ROI进行识别,包括三个过程:数字分割、特征提取和数值判定,以数码管色块分布特征为依据进行实时自适应的数字分割,最后估计特征编码数值。
2.根据权利要求1所述的基于决策树的数码管识别方法,其特征在于,步骤2)中所述的基于决策树的二值化方法为:
2-1)计算数码管ROI对应的灰度频数分布,数码管ROI对应的灰度频数分布为公式(1)所示:
其中J,I分别为数码管ROI的行像素数与列像素数,Q(k)为对应特定灰度的像素点数和,k=1,2,3...256;
2-2)计算数码管ROI灰度均值:数码管ROI灰度均值为公式(2)所示:
其中k为灰度值,P(k)为相应灰度值的灰度频数;
2-3)计算Tsallis熵:Tsallis熵为公式(3)所示:
其中,q为Tsallis熵的系数,Tsallis熵是香农熵的扩展,当可调参数q→1时,Tsallis熵等价为香农熵;
2-4)采用灰度均值和Tsallis熵构建双层决策树,在Tsallis熵-灰度均值平面上将正常光线、过度曝光、设备关机三种状态下的图像度量值分开,过程为:
依据决策树判断图片所属场景,进而采用适配不同场景的灰度图二值化方法,并计算门限值∈,其中,场景包括:
2-4-1)设备关机:二值化门限选为灰度最大值,使得二值化图片中数码管区域与背景区域一致:∈=maxi,j p(i,j);
2-4-2)过度曝光:采用Otsu算法计算二值化门限基准,并附加余量减少过度曝光的影响:
∈=ε+δ,其中ε,δ分别为Otsu算法门限和附加余量;
2-4-3)正常光线:根据Otsu算法计算二值化门限。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010719933.1A CN111832565B (zh) | 2020-07-24 | 2020-07-24 | 一种基于决策树的数码管识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010719933.1A CN111832565B (zh) | 2020-07-24 | 2020-07-24 | 一种基于决策树的数码管识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111832565A true CN111832565A (zh) | 2020-10-27 |
CN111832565B CN111832565B (zh) | 2022-10-28 |
Family
ID=72926533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010719933.1A Active CN111832565B (zh) | 2020-07-24 | 2020-07-24 | 一种基于决策树的数码管识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832565B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112861861A (zh) * | 2021-01-15 | 2021-05-28 | 珠海世纪鼎利科技股份有限公司 | 识别数码管文本的方法、装置及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096610A (zh) * | 2016-06-13 | 2016-11-09 | 湖北工业大学 | 一种基于支持向量机的文档图像二值化方法 |
CN108182400A (zh) * | 2017-12-27 | 2018-06-19 | 成都理工大学 | 数码管动态显示识别方法及系统 |
CN109034145A (zh) * | 2018-07-06 | 2018-12-18 | 西安电子科技大学 | 基于OpenCV的银行卡号识别方法 |
CN109255344A (zh) * | 2018-08-15 | 2019-01-22 | 华中科技大学 | 一种基于机器视觉的数显式仪表定位与读数识别方法 |
US20200134333A1 (en) * | 2018-10-31 | 2020-04-30 | Cognizant Technology Solutions India Pvt. Ltd. | Traffic light recognition system and method |
CN111259680A (zh) * | 2020-02-13 | 2020-06-09 | 支付宝(杭州)信息技术有限公司 | 二维码图像二值化处理方法及装置 |
-
2020
- 2020-07-24 CN CN202010719933.1A patent/CN111832565B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096610A (zh) * | 2016-06-13 | 2016-11-09 | 湖北工业大学 | 一种基于支持向量机的文档图像二值化方法 |
CN108182400A (zh) * | 2017-12-27 | 2018-06-19 | 成都理工大学 | 数码管动态显示识别方法及系统 |
CN109034145A (zh) * | 2018-07-06 | 2018-12-18 | 西安电子科技大学 | 基于OpenCV的银行卡号识别方法 |
CN109255344A (zh) * | 2018-08-15 | 2019-01-22 | 华中科技大学 | 一种基于机器视觉的数显式仪表定位与读数识别方法 |
US20200134333A1 (en) * | 2018-10-31 | 2020-04-30 | Cognizant Technology Solutions India Pvt. Ltd. | Traffic light recognition system and method |
CN111259680A (zh) * | 2020-02-13 | 2020-06-09 | 支付宝(杭州)信息技术有限公司 | 二维码图像二值化处理方法及装置 |
Non-Patent Citations (5)
Title |
---|
CHUN-MING TSAI 等: "Binarization of color document images via luminance and saturation color features", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
İMRENDINÇ 等: "DT-Binarize: A decision tree based binarization for protein crystal images", 《EMERGING TRENDS IN IMAGE PROCESSING, COMPUTER VISION AND PATTERN RECOGNITION》 * |
吕雅慧 等: "高分辨率遥感影像农田林网自动识别", 《农业机械学报》 * |
张春洋 等: "液晶数显仪表的缺字自动识别", 《光电工程》 * |
谢钢: "基于机器视觉的智能电表自动化检测技术研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112861861A (zh) * | 2021-01-15 | 2021-05-28 | 珠海世纪鼎利科技股份有限公司 | 识别数码管文本的方法、装置及电子设备 |
CN112861861B (zh) * | 2021-01-15 | 2024-04-09 | 珠海世纪鼎利科技股份有限公司 | 识别数码管文本的方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111832565B (zh) | 2022-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110389127B (zh) | 一种金属陶瓷零件识别及表面缺陷检测系统和方法 | |
CN108898132B (zh) | 一种基于形状上下文描述的太赫兹图像危险品识别方法 | |
CN111539330B (zh) | 一种基于双svm多分类器的变电站数显仪表识别方法 | |
CN111667475B (zh) | 一种基于机器视觉的大枣分级检测方法 | |
CN116703911B (zh) | 一种led灯生产质量检测系统 | |
CN110648330B (zh) | 摄像头玻璃的缺陷检测方法 | |
CN115393657B (zh) | 基于图像处理的金属管材生产异常识别方法 | |
CN113222938A (zh) | 芯片缺陷检测方法及系统与计算机可读存储介质 | |
CN116152242B (zh) | 一种篮球用天然皮革缺陷可视化检测系统 | |
CN114170165A (zh) | 一种芯片表面缺陷检测方法和装置 | |
CN108460344A (zh) | 屏幕中的动态区域智能识别系统及智能识别方法 | |
CN111665199A (zh) | 一种基于机器视觉的电线电缆颜色检测识别方法 | |
CN118097305B (zh) | 一种半导体发光元件质量的检测方法及系统 | |
CN117437226A (zh) | 一种半导体加工质量视觉自动在线检测系统 | |
CN118470015A (zh) | 一种钛合金棒生产质量视觉检测方法及系统 | |
CN111832565B (zh) | 一种基于决策树的数码管识别方法 | |
TWI498830B (zh) | 不均勻光線下的車牌辨識方法及系統 | |
CN114155226A (zh) | 一种微小缺陷边缘计算方法 | |
CN117808746A (zh) | 一种基于图像处理的水果品质分级方法 | |
CN112116600A (zh) | 一种基于图像处理的光伏板计数方法 | |
CN110276260B (zh) | 一种基于深度摄像头的商品检测方法 | |
Tabatabaei et al. | A novel method for binarization of badly illuminated document images | |
CN116797569A (zh) | 一种晶圆缺陷的检测方法及系统 | |
CN114627463A (zh) | 一种基于机器识别的非接触式配电数据识别方法 | |
CN112801963A (zh) | 一种视频图像遮挡检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |