CN107958253A - 一种图像识别的方法和装置 - Google Patents
一种图像识别的方法和装置 Download PDFInfo
- Publication number
- CN107958253A CN107958253A CN201810048782.4A CN201810048782A CN107958253A CN 107958253 A CN107958253 A CN 107958253A CN 201810048782 A CN201810048782 A CN 201810048782A CN 107958253 A CN107958253 A CN 107958253A
- Authority
- CN
- China
- Prior art keywords
- image
- recognized
- images
- projection
- collection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像识别的方法和装置,该方法包括:获取包括数字图像区域和背景图像区域的采集图像;通过对采集图像进行一系列的处理,获得待识别图像;利用包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法的预设投影分割法分割待识别图像,获得目标待识别图像集合;通过根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的支持向量机识别目标待识别图像集合,历史样本图像为已识别的单个数字二值化图像。可见,充分考虑实际环境因素和复杂情况,自动化实现图像识别,降低了人工识别的危险性;降低了人工成本;通过改进投影法分割算法和识别算法,提高了识别精度。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种图像识别的方法和装置。
背景技术
在当今社会,实现自动化是一种必然趋势,越来越多的工厂需要转型为智能工厂。在智能工厂中布置有很多智能设备,这些智能设备一般安装有用于监控测量等的智能仪表,智能仪表的识别对于监控测量智能设备的数据以及后续控制智能设备尤为重要,是实现智能工厂的一个重要组成部分。
现有技术中,仍然采用人工识别的方式来识别智能仪表,例如,工作人员进入智能工厂,靠近智能仪表,利用人眼辨别读取智能仪表的显示屏上的仪表数字。
但是,发明人经过研究发现,采用现有技术中人工识别智能仪表的方式存在以下问题:第一,有些智能仪表所处的环境比较复杂恶劣,人工识别危险系数较高;第二,社会劳动力越来越少,采用人工识别浪费人力,人工成本高;第三,读取仪表数字依靠的是人眼辨别,影响因素较多,人工识别精度低。
发明内容
本发明所要解决的技术问题是,提供一种图像识别的方法和装置,以充分考虑实际环境因素和复杂情况,自动化实现图像识别,降低了人工识别的危险性;尽可能减少人工参与,降低了人工成本;通过改进投影法分割算法和识别算法,提高了识别精度。
第一方面,本发明实施例提供了一种图像识别的方法,该方法包括:
获取采集图像,所述采集图像包括数字图像区域和背景图像区域;
通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像;
利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法;
通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。
优选的,所述基于水平投影的第一预设分割法为根据第一高度和水平投影图像剔除水平方向上的杂点,所述第一高度为数字高度;
所述基于垂直投影的第二预设分割法为根据第二高度分割垂直投影图像,所述第二高度与所述数字高度的比值小于六分之一。
优选的,所述预设投影分割法的顺序为所述基于水平投影的第一预设分割法、所述基于垂直投影的第二预设分割法和所述基于水平投影的第一预设分割法。
优选的,所述利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,包括:
对所述待识别图像进行水平投影,获得所述待识别图像对应的水平投影图像;
根据所述待识别图像中数字高度和所述待识别图像对应的水平投影图像,对应剔除所述待识别图像水平方向上的杂点,获得第一图像;
对所述第一图像进行垂直投影,获得所述第一图像对应的垂直投影图像;
根据十分之一数字高度和所述第一图像对应的垂直投影图像,对应分割所述第一图像,获得第二图像集合,所述第二图像集合中的第二图像为所述第一图像的部分区域图像;
对所述第二图像集合中的第二图像依次进行水平投影,获得所述第二图像对应的水平投影图像;
根据所述第二图像中数字高度和所述第二图像对应的水平投影图像,对应剔除所述第二图像集合中第二图像垂直方向上的杂点,获得目标待识别图像集合,所述第二图像中数字高度与所述待识别图像中数字高度相等。
优选的,所述第一预设值个历史样本图像是根据第二预设值个历史样本图像经过拉伸、缩放和/或旋转处理得到的,所述第二预设值小于所述第一预设值。
优选的,所述历史样本图像的特征信息为所述历史样本图像的所有像素信息。
优选的,所述通过对所述采集图像进行处理,获得待识别图像,包括:
校正所述采集图像;
通过提取校正后的采集图像中数字图像区域,获得数字图像;
对所述数字图像进行预处理,获得待识别图像。
优选的,所述通过提取校正后的采集图像中数字图像区域,获得数字图像,具体为:
根据数字图像区域的特征信息,滤除所述采集图像中背景图像区域,获得数字图像,所述特征信息包括颜色信息、纹理信息和/或形态信息。
优选的,所述对所述数字图像进行预处理,获得待识别图像,包括:
对所述数字图像进行灰度化处理,获得灰度化图像;
对所述灰度化图像进行降噪滤波处理,获得降噪滤波图像;
对所述降噪滤波图像进行有用信息增强处理,获得有用信息增强图像;
对所述有用信息增强图像进行二值化处理,获得待识别图像。
第二方面,本发明实施例提供了一种图像识别的装置,其特征在于,包括:
获取单元,用于获取采集图像,所述采集图像包括数字图像区域和背景图像区域;
第一获得单元,用于通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像;
第二获得单元,用于利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法;
识别单元,用于通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。
与现有技术相比,本发明至少具有以下优点:
采用本发明实施例的技术方案,首先,获取包括数字图像区域和背景图像区域的采集图像;接着,通过对所述采集图像进行一系列的处理,获得具体为数字二值化图像的待识别图像;然后,利用包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法的预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合包括具体为待识别的单个数字二值化图像的目标待识别图像;最后,通过根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的支持向量机识别所述目标待识别图像集合,所述历史样本图像为已识别的单个数字二值化图像。由此可见,本实施例包括了自动获取采集图像,处理得到数字二值化图像,通过优化后的预设投影法分割法分割图像,以剔除杂点、分离粘连数字和利用支持向量机识别图像整个图像识别过程,充分考虑实际环境因素和复杂情况,自动化实现图像识别,降低了人工识别的危险性;尽可能减少人工参与,降低了人工成本;通过改进投影法分割算法和识别算法,提高了识别精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中一种应用场景所涉及的系统框架示意图;
图2为本发明实施例提供的一种图像识别的方法的流程示意图;
图3为本发明实施例提供的待识别图像;
图4为本发明实施例提供的待识别图像对应的水平投影图像;
图5为本发明实施例提供的第一图像;
图6为本发明实施例提供的第一图像对应的垂直投影图像;
图7为本发明实施例提供的第二图像集合;
图8为本发明实施例提供的第二图像集合中第二图像对应的水平投影图像;
图9为本发明实施例提供的目标待识别图像集合;
图10为本发明实施例提供的一种图像识别的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现阶段,实现自动化是一种必然趋势,越来越多的工厂需要转型为智能工厂。其中,智能仪表的识别是实现智能工厂的一个重要组成部分。现有技术中,仍然采用人工识别的方式来识别智能仪表,例如,工作人员进入智能工厂,靠近智能仪表,利用人眼辨别读取智能仪表的显示屏上的仪表数字。
但是,发明人经过研究发现,采用现有技术中人工识别智能仪表的方式存在以下问题:第一,有些智能仪表所处的环境比较复杂恶劣,人工识别危险系数较高,例如,智能仪表所处的环境存在对人体有害的气体等;第二,社会劳动力越来越少,采用人工识别浪费人力,人工成本高,工作人员进入工厂、识别仪表需要浪费时间与体力,额外消耗人工成本;第三,读取仪表数字依靠的是人眼辨别,影响因素较多,人工识别精度低,例如,智能仪表上存在污点,或者工作人员人眼视力不佳等。目前,对智能仪表的识别大多数集中在理论研究,并没有结合具体的应用场景,缺少对整个识别过程的研究与实践。
为了解决这一问题,在本发明实施例中,首先,获取包括数字图像区域和背景图像区域的采集图像;接着,通过对所述采集图像进行一系列的处理,获得具体为数字二值化图像的待识别图像;然后,利用包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法的预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合包括具体为待识别的单个数字二值化图像的目标待识别图像;最后,通过根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的支持向量机识别所述目标待识别图像集合,所述历史样本图像为已识别的单个数字二值化图像。由此可见,本实施例包括了自动获取采集图像,处理得到数字二值化图像,通过优化后的预设投影法分割法分割图像,以剔除杂点、分离粘连数字和利用支持向量机识别图像整个图像识别过程。充分考虑实际环境因素和复杂情况,自动化实现图像识别,降低了人工识别的危险性;尽可能减少人工参与,降低了人工成本;通过改进投影法分割算法和识别算法,提高了识别精度。
举例来说,本发明实施例的场景之一,可以是应用到如图1所示的场景中,该场景包括摄像机101、图像处理识别设备102和处理器103。摄像机101通过摄像头采集智能工厂中的图像,生成采集图像并发送给图像处理识别设备102。图像处理识别设备102获取采集图像,所述采集图像包括数字图像区域和背景图像区域;图像处理识别设备102通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像;图像处理识别设备102利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法;图像处理识别设备102通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。图像处理识别设备102将所述目标待识别图像集合的识别结果发送给处理器103,以便处理器103根据所述目标待识别图像集合的识别结果进行后续分析处理等。
可以理解的是,在上述应用场景中,虽然将本发明实施方式的动作描述由图像处理识别设备102执行,但是,本发明在执行主体方面不受限制,只要执行了本发明实施方式所公开的动作即可。
可以理解的是,上述场景仅是本发明实施例提供的一个场景示例,本发明实施例并不限于此场景。
下面结合附图,通过实施例来详细说明本发明实施例中图像识别的方法和装置的具体实现方式。
示例性方法
参见图2,示出了本发明实施例中一种图像识别的方法的流程示意图。在本实施例中,所述方法例如可以包括以下步骤:
步骤201:获取采集图像,所述采集图像包括数字图像区域和背景图像区域。
可以理解的是,步骤201中图像处理识别设备获取的采集图像是智能工厂中摄像机采集并发送的。图像采集的好坏直接决定了是后续图像处理、图像分割和图像识别的难易程度和优劣效果,当摄像机采集并发送到图像处理识别设备的所述采集图像是高质量图像时,可以大大降低图像处理、图像分割和图像识别的难度,增强图像处理、图像分割和图像识别的效果。因此,选取分辨率高、响应速度快、配置简单以及满足工业三防要求的摄像机采集图像,例如,可以选取海康生产的DS-2红外网络摄像机对图像进行采集,长期工作不易出现故障,而且有简单的图像预处理功能,有利于本实施例的实施。
还可以理解的是,由于智能工厂不仅存在智能仪表还有智能设备等,所以步骤201获取的采集图像不仅包含需要识别的智能仪表的仪表数字,还包含各种背景信息,即,既有数字图像区域,又有背景图像区域。
步骤202:通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像。
需要说明的是,步骤201获取的采集图像必须经过一系列的处理,变成一个待识别的数字二值化图像,才能进行后续的图像分割处理。在实际应用中,采集图像很有可能是倾斜的,首先,需要对倾斜的图像进行校正,以便后续处理更方便;其次,该采集图像包括无需识别的背景图像区域,对于本实施例来说目的就是识别仪表数字,所以需要滤除其背景图像区域提取需要识别的数字图像区域,从而得到数字图像,以减轻后续处理的负担;然后,对于该数字图像需要进行预处理,目的是消除数字图像中的无关信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度的简化数据,从而提高后续图像分割和图像识别的可靠性。因此,在本实施例的一些实施方式中,所述步骤202例如具体可以包括以下步骤:
步骤A:校正所述采集图像;
步骤B:通过提取校正后的采集图像中数字图像区域,获得数字图像;
步骤C:对所述数字图像进行预处理,获得待识别图像。
其中,对于步骤B而言,由于数字图像区域的特征信息与背景图像区域的特征信息完全不同,不同场景下背景图像区域的特征信息也不同,因此,可以预先存储有关数字图像区域的特征信息,以便根据这些特征信息区分数字图像区域和背景图像区域,过滤采集图像中背景图像区域,保留数字图像区域,形成数字图像。即,在本实施例的一些实施方式中,所述步骤B例如具体可以为:根据数字图像区域的特征信息,滤除所述采集图像中背景图像区域,获得数字图像,所述特征信息包括颜色信息、纹理信息和/或形态信息;其中,形态信息例如可以是长宽比信息等。
还需要说明的是,对于步骤C而言,常见的图像预处理包括灰度化处理、降噪滤波处理、有用信息增强处理和二值化处理,上述数字图像经过这些处理操作后最终显示成如图3所示待识别图像,即,一个黑白数字图像。具体地,在本实施例的一些实施方式中,所述步骤C例如可以包括以下步骤:
步骤C1:对所述数字图像进行灰度化处理,获得灰度化图像;
步骤C2:对所述灰度化图像进行降噪滤波处理,获得降噪滤波图像;
步骤C3:对所述降噪滤波图像进行有用信息增强处理,获得有用信息增强图像;
步骤C4:对所述有用信息增强图像进行二值化处理,获得待识别图像。
其中,步骤C2和步骤C3的执行顺序不做限定,可以互换。
步骤203:利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法。
可以理解的是,步骤202获得待识别图像,即,数字二值化图像后,需要对图像进行分割,以便后续识别数字二值化图像包含的数字,图像分割是否合适将直接影响后续图像识别的难易程度和识别正确率。一般地,常用图像分割算法有两种,第一种是基于连通域的外轮廓提取法;第二种是投影分割法。由于本实施例的实际应用场景中需要识别的数字仪表是数字显示仪表,该仪表的数字是由7段数码管拼接而成,每段数码管之间是有间隙的,导致利用第一种外轮廓提取法求取的数字轮廓往往是不完整的;即使额外利用形态学处理的方式进行优化,通过膨胀操作可将各段数码管粘连起来,但是膨胀后会出现相邻数字会粘连到一起的情况,又导致利用外轮廓提取法求取的数字轮廓是错误的。因此,本实施例采取第二种投影分割法进行待识别图像的分割,即,利用数字二值化图像的像素的分布直方图进行分析,找出相邻字符的分界点进行分割;而且投影又可分为水平投影和垂直投影,考虑本实施例的应用场景较复杂,单纯通过垂直投影或者水平投影并不能实现完美的分割效果,在实际应用中,本实施例采用基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法相结合的预设投影分割法。
需要说明的是,传统的投影分割法是依据将相邻字符间为零的像素作为分界点从各个字符的边界位置进行分割,但是,针对本实施例的应用场景而言,仪表数字经投影后有可能出现两个数字粘连在一起的情况;而且待识别图像很可能包括杂点,基于像素为零作为分界点,水平投影后分割出每行数字和垂直投影后分割出每个字符,并没有剔除待识别图像中原有的杂点,会将杂点同时分割出来进行后续步骤,从而杂点会影响后续图像识别的效果。因此,本实施例对传统的投影分割法进行如下改进:
首先,进行水平投影基于数字高度剔除水平方向上的杂点;然后,进行垂直投影基于小于六分之一数字高度的高度分割出每个字符;最后,再次进行水平投影基于数字高度剔除垂直方向上的杂点。其中,由于水平段数码管在垂直投影后的高度是最小的,大概占整个数字高度的六分之一,为了解决了相邻粘连字符无法分割的问题,选取小于六分之一数字高度的高度进行分割。即,在本实施例中,所述预设投影分割法的顺序为所述基于水平投影的第一预设分割法、所述基于垂直投影的第二预设分割法和所述基于水平投影的第一预设分割法。所述基于水平投影的第一预设分割法为根据第一高度和水平投影图像剔除水平方向上的杂点,所述第一高度为数字高度;所述基于垂直投影的第二预设分割法为根据第二高度分割垂直投影图像,所述第二高度与所述数字高度的比值小于六分之一。
根据上述分析说明以及多次试验得到,在实际应用中,在垂直投影之后,基于十分之一数字高度将每行数字分割成单个数字,分割效果最佳。因此,在本实施例的一些实施方式中,所述步骤203例如具体可以包括以下步骤:
步骤D:对所述待识别图像进行水平投影,获得所述待识别图像对应的水平投影图像;
步骤E:根据所述待识别图像中数字高度和所述待识别图像对应的水平投影图像,对应剔除所述待识别图像水平方向上的杂点,获得第一图像;
步骤F:对所述第一图像进行垂直投影,获得所述第一图像对应的垂直投影图像;
步骤G:根据十分之一数字高度和所述第一图像对应的垂直投影图像,对应分割所述第一图像,获得第二图像集合,所述第二图像集合中的第二图像为所述第一图像的部分区域图像;
步骤H:对所述第二图像集合中的第二图像依次进行水平投影,获得所述第二图像对应的水平投影图像;
步骤I:根据所述第二图像中数字高度和所述第二图像对应的水平投影图像,对应剔除所述第二图像集合中第二图像垂直方向上的杂点,获得目标待识别图像集合,所述第二图像中数字高度与所述待识别图像中数字高度相等。
需要说明的是,本实施例通过选取自适应的像素作为分界点进行图像分割,例如,十分之一数字高度和数字高度,既解决了相邻粘连字符无法分割的问题,又可以剔除待识别图像中水平方向和垂直方向上的杂点。例如,对图3所示的待识别图像进行水平投影,获得如图4所示的待识别图像对应的水平投影图像;根据待识别图像中数字高度和待识别图像对应的水平投影图像,对应剔除待识别图像水平方向上的杂点,获得如图5所示的第一图像;对第一图像进行垂直投影,获得如图6所示的第一图像对应的垂直投影图像;根据十分之一数字高度和第一图像对应的垂直投影图像,对应分割第一图像,获得如图7所示的第二图像集合;对第二图像集合中的第二图像依次进行水平投影,获得如图8所示的第二图像集合中第二图像对应的水平投影图像;根据所述第二图像中数字高度和所述第二图像对应的水平投影图像,对应剔除所述第二图像集合中第二图像垂直方向上的杂点,获得如图9所示的目标待识别图像集合;其中,所述第二图像中数字高度与所述待识别图像中数字高度相等。
步骤204:通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。
可以理解的是,在步骤203分割获得到目标待识别图像集合后,最终目的就是识别所述目标待识别图像集合中的目标待识别图像,而机器学习是图像识别技术中最重要的部分,主要是通过对样本进行训练生成分类器,再对输入的图像进行猜测,从而实现图像识别。常见的机器学习算法有K最近邻分类算法、神经网络分类算法和支持向量机算法,其中,支持向量机算法是一个能够将不同类别样本在样本空间分割的超平面,技术上比较成熟,有较强的理论支撑,对低维空间不可分的情况映射到高维空间是可分的已经成为业界的共识。重要的是,支持向量机算法对于小样本的训练也会得到较好的识别效果;在处理数据不可分的情况,通过松弛变量和核函数技术可以将低维不可分的数据映射到高维空间,相对于其他机器学习算法有很大的优势。因此,鉴于支持向量机在理论和实际应用中的优势,本实施例采用训练好的支持向量机进行图像识别。
其中,支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息进行训练的具体过程如下:首先,获取第一预设值个历史样本图像并且制作样本类别的标签;其次,对支持向量机参数进行设置,即设置对应的历史样本图像的特征信息为训练内容;接着,经过训练产生分类器;然后,对目标待识别图像进行预测识别,并分析其识别结果的正确率;最后,获得支持向量构成训练好的支持向量机,支持向量其实是离最优分类平面最近的离散点,可以说分界面就是靠着这些向量确定的。
需要说明的是,获取第一预设值个历史样本图像实质上是制作训练样本集,训练样本集中训练样本数量的大小直接影响支持向量机识别正确率的高低,所以必须保证足够多的训练样本,以提高后续训练好的支持向量机识别正确率。例如,对于本实施例的场景,在对0-9这10个数字进行训练时,若每个数字选100个训练样本,就可以制作成包括1000个训练样本的样本集。但是,人为获取1000个训练样本显然是耗时、耗力的,此时,可以采取对单个训练样本通过一定的拉伸、缩放或者旋转等操作,产生多个相同大小不同形状的训练样本,以满足上述需要大量训练样本的要求。因此,在本实施例中,所述第一预设值个历史样本图像是根据第二预设值个历史样本图像经过拉伸、缩放和/或旋转处理得到的,所述第二预设值小于所述第一预设值。例如,100个历史样本图像为经过拉伸、缩放和/或旋转处理得到1000个历史样本图像。
需要说明的是,在制作完训练样本集后,对训练样本进行训练时并不是把这些训练样本放进分类器就可以了,需要提前告知训练学习的是哪些信息,例如,训练学习样本颜色的变化规律或者纹理的变化趋势等等,也就是说,需要知道历史样本图像的特征信息。而每个历史样本图像的内部结构都是一个二维矩阵,二维矩阵的每一个点表示一个像素,每个像素都可以作为特征信息进行训练学习,因此,将每个历史样本图像的像素转换成一个列矩阵,并将该历史样本图像表示的数字定义为对应该历史样本图像的标签。最终,用一个二维矩阵表示所有历史样本图像的特征信息,其中每列都是一个历史样本图像的特征信息,即,在本实施例中,所述历史样本图像的特征信息为所述历史样本图像的所有像素信息。
通过本实施例提供的各种实施方式,首先,获取包括数字图像区域和背景图像区域的采集图像;接着,通过对所述采集图像进行一系列的处理,获得具体为数字二值化图像的待识别图像;然后,利用包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法的预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合包括具体为待识别的单个数字二值化图像的目标待识别图像;最后,通过根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的支持向量机识别所述目标待识别图像集合,所述历史样本图像为已识别的单个数字二值化图像。由此可见,本实施例包括了自动获取采集图像,处理得到数字二值化图像,通过优化后的预设投影法分割法分割图像,以剔除杂点、分离粘连数字和利用支持向量机识别图像整个图像识别过程。充分考虑实际环境因素和复杂情况,自动化实现图像识别,降低了人工识别的危险性;尽可能减少人工参与,降低了人工成本;通过改进投影法分割算法和识别算法,提高了识别精度。
示例性设备
参见图10,示出了本发明实施例中一种图像识别的装置的结构示意图。在本实施例中,所述装置例如具体可以包括:
获取单元1001,用于获取采集图像,所述采集图像包括数字图像区域和背景图像区域;
处理获得单元1002,用于通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像;
分割获得单元1003,用于利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法;
识别单元1004,用于通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。
可选的,所述处理获得单元1002包括校正子单元、提取获得子单元和预处理获得子单元;
所述校正子单元,用于校正所述采集图像;
所述提取获得子单元,用于通过提取校正后的采集图像中数字图像区域,获得数字图像;
所述预处理获得子单元,用于对所述数字图像进行预处理,获得待识别图像。
可选的,所述提取获得子单元具体用于:
根据数字图像区域的特征信息,滤除所述采集图像中背景图像区域,获得数字图像,所述特征信息包括颜色信息、纹理信息和/或形态信息。
可选的,所述预处理获得子单元包括灰度化模块、降噪滤波模块、有用信息增强模块和二值化模块;
所述灰度化模块,用于对所述数字图像进行灰度化处理,获得灰度化图像;
所述降噪滤波模块,用于对所述灰度化图像进行降噪滤波处理,获得降噪滤波图像;
所述有用信息增强模块,用于对所述降噪滤波图像进行有用信息增强处理,获得有用信息增强图像;
所述二值化模块,用于对所述有用信息增强图像进行二值化处理,获得待识别图像。
可选的,所述基于水平投影的第一预设分割法为根据第一高度和水平投影图像剔除水平方向上的杂点,所述第一高度为数字高度;
所述基于垂直投影的第二预设分割法为根据第二高度分割垂直投影图像,所述第二高度与所述数字高度的比值小于六分之一。
可选的,所述预设投影分割法的顺序为所述基于水平投影的第一预设分割法、所述基于垂直投影的第二预设分割法和所述基于水平投影的第一预设分割法。
可选的,所述分割获得单元1003包括第一获得子单元、第二获得子单元、第三获得子单元、第四获得子单元、第五获得子单元和第六获得子单元;
所述第一获得子单元,用于对所述待识别图像进行水平投影,获得所述待识别图像对应的水平投影图像;
所述第二获得子单元,用于根据所述待识别图像中数字高度和所述待识别图像对应的水平投影图像,对应剔除所述待识别图像水平方向上的杂点,获得第一图像;
所述第三获得子单元,用于对所述第一图像进行垂直投影,获得所述第一图像对应的垂直投影图像;
所述第四获得子单元,用于根据十分之一数字高度和所述第一图像对应的垂直投影图像,对应分割所述第一图像,获得第二图像集合,所述第二图像集合中的第二图像为所述第一图像的部分区域图像;
所述第五获得子单元,用于对所述第二图像集合中的第二图像依次进行水平投影,获得所述第二图像对应的水平投影图像;
所述第六获得子单元,用于根据所述第二图像中数字高度和所述第二图像对应的水平投影图像,对应剔除所述第二图像集合中第二图像垂直方向上的杂点,获得目标待识别图像集合,所述第二图像中数字高度与所述待识别图像中数字高度相等。
可选的,所述第一预设值个历史样本图像是根据第二预设值个历史样本图像经过拉伸、缩放和/或旋转处理得到的,所述第二预设值小于所述第一预设值。
可选的,所述历史样本图像的特征信息为所述历史样本图像的所有像素信息。
通过本实施例提供的各种实施方式,获取单元用于获取采集图像,所述采集图像包括数字图像区域和背景图像区域;处理获得单元用于通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像;分割获得单元用于利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法;识别单元用于通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。由此可见,本实施例包括了自动获取采集图像,处理得到数字二值化图像,通过优化后的预设投影法分割法分割图像,以剔除杂点、分离粘连数字和利用支持向量机识别图像整个图像识别过程。充分考虑实际环境因素和复杂情况,自动化实现图像识别,降低了人工识别的危险性;尽可能减少人工参与,降低了人工成本;通过改进投影法分割算法和识别算法,提高了识别精度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (10)
1.一种图像识别的方法,其特征在于,包括:
获取采集图像,所述采集图像包括数字图像区域和背景图像区域;
通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像;
利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法;
通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。
2.根据权利要求1所述的方法,其特征在于,所述基于水平投影的第一预设分割法为根据第一高度和水平投影图像剔除水平方向上的杂点,所述第一高度为数字高度;
所述基于垂直投影的第二预设分割法为根据第二高度分割垂直投影图像,所述第二高度与所述数字高度的比值小于六分之一。
3.根据权利要求2所述的方法,其特征在于,所述预设投影分割法的顺序为所述基于水平投影的第一预设分割法、所述基于垂直投影的第二预设分割法和所述基于水平投影的第一预设分割法。
4.根据权利要求3所述的方法,其特征在于,所述利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,包括:
对所述待识别图像进行水平投影,获得所述待识别图像对应的水平投影图像;
根据所述待识别图像中数字高度和所述待识别图像对应的水平投影图像,对应剔除所述待识别图像水平方向上的杂点,获得第一图像;
对所述第一图像进行垂直投影,获得所述第一图像对应的垂直投影图像;
根据十分之一数字高度和所述第一图像对应的垂直投影图像,对应分割所述第一图像,获得第二图像集合,所述第二图像集合中的第二图像为所述第一图像的部分区域图像;
对所述第二图像集合中的第二图像依次进行水平投影,获得所述第二图像对应的水平投影图像;
根据所述第二图像中数字高度和所述第二图像对应的水平投影图像,对应剔除所述第二图像集合中第二图像垂直方向上的杂点,获得目标待识别图像集合,所述第二图像中数字高度与所述待识别图像中数字高度相等。
5.根据权利要求1所述的方法,其特征在于,所述第一预设值个历史样本图像是根据第二预设值个历史样本图像经过拉伸、缩放和/或旋转处理得到的,所述第二预设值小于所述第一预设值。
6.根据权利要求1所述的方法,其特征在于,所述历史样本图像的特征信息为所述历史样本图像的所有像素信息。
7.根据权利要求1所述的方法,其特征在于,所述通过对所述采集图像进行处理,获得待识别图像,包括:
校正所述采集图像;
通过提取校正后的采集图像中数字图像区域,获得数字图像;
对所述数字图像进行预处理,获得待识别图像。
8.根据权利要求7所述的方法,其特征在于,所述通过提取校正后的采集图像中数字图像区域,获得数字图像,具体为:
根据数字图像区域的特征信息,滤除所述采集图像中背景图像区域,获得数字图像,所述特征信息包括颜色信息、纹理信息和/或形态信息。
9.根据权利要求7所述的方法,其特征在于,所述对所述数字图像进行预处理,获得待识别图像,包括:
对所述数字图像进行灰度化处理,获得灰度化图像;
对所述灰度化图像进行降噪滤波处理,获得降噪滤波图像;
对所述降噪滤波图像进行有用信息增强处理,获得有用信息增强图像;
对所述有用信息增强图像进行二值化处理,获得待识别图像。
10.一种图像识别的装置,其特征在于,包括:
获取单元,用于获取采集图像,所述采集图像包括数字图像区域和背景图像区域;
第一获得单元,用于通过对所述采集图像进行处理,获得待识别图像,所述待识别图像为数字二值化图像;
第二获得单元,用于利用预设投影分割法分割所述待识别图像,获得目标待识别图像集合,所述目标待识别图像集合中的目标待识别图像为待识别的单个数字二值化图像,所述预设投影分割法包括基于水平投影的第一预设分割法和基于垂直投影的第二预设分割法;
识别单元,用于通过支持向量机识别所述目标待识别图像集合,所述支持向量机是根据第一预设值个历史样本图像和对应的历史样本图像的特征信息训练得到的,所述历史样本图像为已识别的单个数字二值化图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810048782.4A CN107958253A (zh) | 2018-01-18 | 2018-01-18 | 一种图像识别的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810048782.4A CN107958253A (zh) | 2018-01-18 | 2018-01-18 | 一种图像识别的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107958253A true CN107958253A (zh) | 2018-04-24 |
Family
ID=61956262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810048782.4A Pending CN107958253A (zh) | 2018-01-18 | 2018-01-18 | 一种图像识别的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107958253A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109459451A (zh) * | 2018-12-13 | 2019-03-12 | 中国航空工业集团公司上海航空测控技术研究所 | 一种基于射线造影的金属内部微小裂纹检测方法 |
CN109584266A (zh) * | 2018-11-15 | 2019-04-05 | 腾讯科技(深圳)有限公司 | 一种目标检测方法及装置 |
CN110309867A (zh) * | 2019-06-21 | 2019-10-08 | 北京工商大学 | 一种基于卷积神经网络的混合气体识别方法 |
CN112508024A (zh) * | 2020-11-11 | 2021-03-16 | 广西电网有限责任公司南宁供电局 | 一种变压器电气铭牌钢印字体智能识别方法 |
CN115410191A (zh) * | 2022-11-03 | 2022-11-29 | 平安银行股份有限公司 | 文本图像识别方法、装置、设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101692313A (zh) * | 2009-07-03 | 2010-04-07 | 华东师范大学 | 基于嵌入式平台的便携式车辆识别装置 |
CN101833859A (zh) * | 2010-05-14 | 2010-09-15 | 山东大学 | 基于虚拟线圈的自触发车牌识别方法 |
CN106228159A (zh) * | 2016-07-29 | 2016-12-14 | 深圳友讯达科技股份有限公司 | 一种基于图像识别的计量表抄表装置及其方法 |
CN106599896A (zh) * | 2016-11-08 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种字符分割方法和装置、及元件检测方法和装置 |
CN107103320A (zh) * | 2017-04-28 | 2017-08-29 | 常熟理工学院 | 嵌入式医疗数据图像识别及集成方法 |
-
2018
- 2018-01-18 CN CN201810048782.4A patent/CN107958253A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101692313A (zh) * | 2009-07-03 | 2010-04-07 | 华东师范大学 | 基于嵌入式平台的便携式车辆识别装置 |
CN101833859A (zh) * | 2010-05-14 | 2010-09-15 | 山东大学 | 基于虚拟线圈的自触发车牌识别方法 |
CN106228159A (zh) * | 2016-07-29 | 2016-12-14 | 深圳友讯达科技股份有限公司 | 一种基于图像识别的计量表抄表装置及其方法 |
CN106599896A (zh) * | 2016-11-08 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种字符分割方法和装置、及元件检测方法和装置 |
CN107103320A (zh) * | 2017-04-28 | 2017-08-29 | 常熟理工学院 | 嵌入式医疗数据图像识别及集成方法 |
Non-Patent Citations (5)
Title |
---|
MATLAB中文论坛: "《MATLAB神经网络30个案例分析》", 30 April 2010, 北京航空航天大学出版社 * |
卢永艳: "《上市公司财务困境分析与预测》", 30 June 2012, 西安电子科技大学出版社 * |
李文博: "一种基于SVM的数字仪表显示值识别方法", 《现代电子技术》 * |
苑玮琦 等: "一种纸币号码定位分割方法", 《微计算机信息》 * |
陈敏: "《认知计算导论》", 30 April 2017, 华中科技大学出版社 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584266A (zh) * | 2018-11-15 | 2019-04-05 | 腾讯科技(深圳)有限公司 | 一种目标检测方法及装置 |
CN109584266B (zh) * | 2018-11-15 | 2023-06-09 | 腾讯科技(深圳)有限公司 | 一种目标检测方法及装置 |
CN109459451A (zh) * | 2018-12-13 | 2019-03-12 | 中国航空工业集团公司上海航空测控技术研究所 | 一种基于射线造影的金属内部微小裂纹检测方法 |
CN110309867A (zh) * | 2019-06-21 | 2019-10-08 | 北京工商大学 | 一种基于卷积神经网络的混合气体识别方法 |
CN110309867B (zh) * | 2019-06-21 | 2021-09-24 | 北京工商大学 | 一种基于卷积神经网络的混合气体识别方法 |
CN112508024A (zh) * | 2020-11-11 | 2021-03-16 | 广西电网有限责任公司南宁供电局 | 一种变压器电气铭牌钢印字体智能识别方法 |
CN115410191A (zh) * | 2022-11-03 | 2022-11-29 | 平安银行股份有限公司 | 文本图像识别方法、装置、设备和存储介质 |
CN115410191B (zh) * | 2022-11-03 | 2023-02-03 | 平安银行股份有限公司 | 文本图像识别方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107958253A (zh) | 一种图像识别的方法和装置 | |
CN102646193B (zh) | 一种环形排布字符图像分割方法 | |
CN108596880A (zh) | 基于图像处理的焊接缺陷特征提取与焊接质量分析方法 | |
CN108710919A (zh) | 一种基于多尺度特征融合深度学习的裂缝自动化勾画方法 | |
CN108562589A (zh) | 一种对磁路材料表面缺陷进行检测的方法 | |
CN113658131B (zh) | 一种基于机器视觉巡游式环锭纺断纱检测方法 | |
CN109087286A (zh) | 一种基于计算机图像处理和模式识别的检测方法及应用 | |
CN109636824A (zh) | 一种基于图像识别技术的多目标计数方法 | |
CN110032932B (zh) | 一种基于视频处理和决策树设定阈值的人体姿态识别方法 | |
CN102637262B (zh) | 一种自适应细菌计数方法 | |
CN110335233B (zh) | 基于图像处理技术的高速公路护栏板缺陷检测系统和方法 | |
CN109815945A (zh) | 一种基于图像识别的呼吸道检查结果判读系统和方法 | |
CN114549507B (zh) | 改进Scaled-YOLOv4的织物瑕疵检测方法 | |
Patki et al. | Cotton leaf disease detection & classification using multi SVM | |
CN111161295A (zh) | 一种菜品图像背景剥离方法 | |
CN116052222A (zh) | 自然采集牛脸图像的牛脸识别方法 | |
CN108038482A (zh) | 一种汽车发动机缸体序列号视觉智能识别系统 | |
CN107480678A (zh) | 一种棋盘识别方法和识别系统 | |
CN111665199A (zh) | 一种基于机器视觉的电线电缆颜色检测识别方法 | |
CN111161228B (zh) | 一种基于迁移学习的纽扣表面缺陷检测方法 | |
CN117496532A (zh) | 基于0cr的智慧识别工具 | |
CN111105874A (zh) | 一种舌象特征标注方法、装置、计算机设备及存储介质 | |
CN110866917A (zh) | 一种基于机器视觉的药片类型及排列方式识别方法 | |
CN115908399A (zh) | 一种基于改进视觉注意机制的磁片瑕疵检测方法 | |
WO2015168362A1 (en) | Method and apparatus for processing block to be processed of urine sediment image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180424 |