CN111080665B - 图像边框识别方法、装置、设备和计算机存储介质 - Google Patents

图像边框识别方法、装置、设备和计算机存储介质 Download PDF

Info

Publication number
CN111080665B
CN111080665B CN201911423886.XA CN201911423886A CN111080665B CN 111080665 B CN111080665 B CN 111080665B CN 201911423886 A CN201911423886 A CN 201911423886A CN 111080665 B CN111080665 B CN 111080665B
Authority
CN
China
Prior art keywords
image
pixel
pixel value
adaptive
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911423886.XA
Other languages
English (en)
Other versions
CN111080665A (zh
Inventor
王倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Optical Technology Co Ltd
Original Assignee
Goertek Optical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Optical Technology Co Ltd filed Critical Goertek Optical Technology Co Ltd
Priority to CN201911423886.XA priority Critical patent/CN111080665B/zh
Publication of CN111080665A publication Critical patent/CN111080665A/zh
Application granted granted Critical
Publication of CN111080665B publication Critical patent/CN111080665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种图像边框识别方法,包括以下步骤:对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图;根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像;根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像;根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框。本发明还公开了一种图像边框识别装置、设备和计算机存储介质。本发明提高了图像边框识别的准确性。

Description

图像边框识别方法、装置、设备和计算机存储介质
技术领域
本发明涉及图像处理领域,尤其涉及图像边框识别方法、装置、设备和计算机存储介质。
背景技术
随着计算机技术的快速发展,计算机进行图像识别的场景也越来越多。
图像识别首当其冲的就是图像边框识别,现有的图像边框识别算法,主要是采用神经网络或者传统的边缘检测算法找到图片中的所有边缘信息,然后设置各种条件过滤掉一些边缘信息,得到图像边框。这样的图像识别算法较为复杂,图像识别的效率低,且若图像拍摄背景复杂或者拍摄得到的原始图像边缘模糊,容易出现识别错误,从而影响后续对图像信息的提取。
发明内容
本发明的主要目的在于提供一种图像边框识别方法、装置、设备和计算机存储介质,旨在解决当前图像边界识别准确率低的技术问题。
为实现上述目的,本发明提供图像边框识别方法,所述图像边框识别方法包括以下步骤:
对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图;
根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像;
根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像;
根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框。
在一实施例中,所述根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像的步骤,包括:
获取所述灰度直方图中各像素点的像素值,统计像素值相同的像素点的像素点数量;
根据所述像素值和所述像素值对应的像素点数量,确定全局阈值;
若所述原始图像中像素点的像素值大于所述全局阈值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述全局阈值,则将所述像素点的像素值设置为0,获得二值化图像。
在一实施例中,所述根据所述像素值和所述像素值对应的像素点数量,确定全局阈值的步骤,包括:
依次获取灰度直方图中各像素值的像素点数量,其中,像素值为i,i取0-255的自然数,所述像素值i的像素点数量记为Histogram[i];
计算相邻像素值的像素点数量的差值,其中,所述差值包括第一差值和第二差值,所述第一差值为:Delta[i]=Histogram[i]-Histogram[i-1],所述第二差值为:Delta[i+1]=Histogram[i+1]-Histogram[i];
若所述第一差值小于零且所述第二差值大于零,则将所述i对应的像素值作为目标像素值,按照所述目标像素值的像素点数量从小到大排列各所述目标像素值,获取排序靠前的预设数量的目标像素值作为全局阈值。
在一实施例中,所述根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像的步骤,包括:
根据预设自适应阈值算法遍历所述原始图像,得到像素平均值,将所述原始图像中各像素点的像素值与所述像素平均值进行比较;
若所述原始图像中像素点的像素值大于所述像素平均值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述像素平均值,则将所述像素点的像素值设置为0,获得自适应图像。
在一实施例中,所述根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框的步骤,包括:
获取所述二值化图像中目标像素点的第一像素值,获取所述自适应图像中目标像素点的第二像素值;
根据所述第一像素值和所述第二像素值进行异或判断,根据异或判断的结果对所述自适应图像进行处理;
将所述处理后的自适应图像进行去噪,识别去噪后的自适应图像,获得图像边框。
在一实施例中,所述根据所述第一像素值和所述第二像素值进行异或判断,根据异或判断的结果对所述自适应图像进行处理的步骤,包括:
若所述第一像素值和所述第二像素值不同,则将所述自适应图像中目标像素点的像素值调整为0;
若所述第一像素值和所述第二像素值相同,则将所述自适应图像中目标像素点的像素值调整为255,完成对自适应图像的处理。
在一实施例中,所述根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框的步骤之后,包括:
通过字符识别算法识别所述图像边框内的字符信息,将所述字符信息进行输出。
此外,为实现上述目的,本发明还提供一种图像边框识别装置,所述图像边框识别装置包括:
灰度处理模块,用于对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图;
第一处理模块,用于根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像;
第二处理模块,用于根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像;
处理识别模块,用于根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框。
此外,为实现上述目的,本发明还提供一种图像边框识别设备;
所述图像边框识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如上所述的图像边框识别方法的步骤。
此外,为实现上述目的,本发明还提供计算机存储介质;
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的图像边框识别方法的步骤。
本发明实施例提出的一种图像边框识别方法、装置、设备和计算机存储介质,通过对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图;根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像;根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像;根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框。本实施例中先采用局部二值化处理得到二值化图像,二值化图像中包含原始图像的基本轮廓,然后再采用自适应阈值算法处理得到自适应图像,自适应图像中包含较为细致的图像信息,然后终端根据二值化图像对自适应图像进行处理,这样得到的图像根据优化,通过该处理后的自适应图像识别得到的图像边框更加准确。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明图像边框识别方法第一实施例的流程示意图;
图3为本发明图像边框识别方法第一实施例中的原始图像;
图4为本发明图像边框识别方法第一实施例中对原始图像处理得到的灰度直方图;
图5为本发明图像边框识别方法第一实施例中对原始图像处理得到的二值化图像;
图6为本发明图像边框识别方法第一实施例中对原始图像处理得到的自适应图像;
图7为本发明图像边框识别方法第二实施例的流程示意图;
图8为本发明图像边框识别装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端(又叫图像边框识别设备,其中,图像边框识别设备可以是由单独的图像边框识别装置构成,也可以是由其他装置与图像边框识别装置组合形成)结构示意图。
本发明实施例终端可以固定终端,也可以是移动终端,如,带联网功能的智能空调、智能电灯、智能电源、智能音箱、自动驾驶汽车、PC(personal computer)个人计算机、智能手机、平板电脑、电子书阅读器、便携计算机等。
如图1所示,该终端可以包括:处理器1001,例如,中央处理器Central ProcessingUnit,CPU),网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WIFI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如,磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除WiFi外,蓝牙、探针等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,存储介质可以是非易失性可读存储介质,如RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序;操作系统是指电视终端中安装的操作系统,例如,安卓系统;网络通信模块是指用于通信连接的网络模块,本实施例中网络通信模块可以与共享终端建立连接;用户接口模块是指用于接收用户输入的模块,例如,用户接口模块用于接收遥控器发送的指令;计算机程序中保存有图像边框识别程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的图像边框识别方法中的步骤。
基于上述硬件结构提出了本发明图像边框识别方法的实施例。
参照图2,在本发明一种图像边框识别方法的第一实施例中,所述图像边框识别方法包括:
步骤S10,对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图。
本实施例中的图像边框识别方法应用在图像边框识别设备,图像边框识别设备的种类不作限定,本实施例中以终端为例进行说明,终端接收图像识别请求,获取图像识别请求携带的待识别的原始图像;原始图像可以如图3所示。可以理解的是,本实施例中原始图像中包含图像信息,还可以包含除图像之外的其他信息,此外,原始图像的颜色和尺寸不作具体限定,例如,原始图像可以是彩色或者黑白。
终端在获取到原始图像之后,终端对原始图像进行切割将原始图像分割为图像单元,从该原始图像中切割出图像信息,得到初步切割图像,终端对该初步切割图像进行分析,得到原始图像对应的灰度直方图;参照图4,图4为原始图像对应的灰度直方图。
灰度直方图是关于灰度级分布的函数图,是对原始图像中灰度级分布的统计,灰度直方图是将数字图像中的所有像素,按照灰度值的大小,统计其出现的频率,灰度直方图是灰度级的函数,它表示图像中具有某种灰度级的像素的个数,反映了图像中某种灰度出现的频率;将原始图像转化为的灰度直方图实现过程可以参见相关技术,本实施例在对此不做限定。
步骤S20,根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像。
本实施例中在得到原始图像对应的灰度直方图之后,终端根据灰度直方图确定全局阈值,全局阈值是指图像二值化处理的阈值,终端根据灰度直方图确定全局阈值的实现方式不作具体限定,例如:
实现方式一:终端统计灰度直方图中各个像素值对应像素点的数量,终端将像素点数量最少的预设数量(预设数量可以根据具体场景设置,例如预设数量设置为2)个像素值作为全局阈值;
实现方式二:依次获取灰度直方图中各像素值的像素点数量,其中,像素值为i,i取0-255的自然数,像素值i的像素点数量记为Histogram[i];终端计算相邻像素值的像素点数量的差值,其中,所述差值包括第一差值和第二差值,所述第一差值为:Delta[i]=Histogram[i]-Histogram[i-1],所述第二差值为:Delta[i+1]=Histogram[i+1]-Histogram[i];若所述第一差值小于零且所述第二差值大于零,终端则将i对应的像素值作为目标像素值,按照目标像素值的像素点数量从小到大排列各所述目标像素值,获取排序靠前的预设数量(预设数量可以根据具体场景设置,例如预设数量设置为2)的目标像素值作为全局阈值。
本实施例中终端可以确定多个全局阈值,以根据每个全局阈值对原始图像进行局部二值化处理,获得二值化图像(原始图像对应的二值化图像参照图5),例如,本实施例中确定了全局阈值分别是225和100,终端根据第一个全局阈值225对原始图像进行处理生成第一个二值化图像,即,若原始图像中像素点的像素值大于225,终端将所述像素点的像素值设置为255;若原始图像中像素点的像素值小于或等于225,终端将像素点的像素值设置为0,获得第一个二值化图像;例如,终端根据第二个全局阈值100对原始图像进行处理生成第二个二值化图像,若原始图像中像素点的像素值大于100,终端将所述像素点的像素值设置为255;若原始图像中像素点的像素值小于或等于100,终端将像素点的像素值设置为0,获得第二个二值化图像。
步骤S30,根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像。
终端中预设自适应阈值算法,预设自适应阈值算法是预设设置的二值化阈值的算法,终端根据预设自适应阈值算法对原始图像进行处理,获得自适应图像(原始图像对应的自适应图像参照图6),具体地,包括:
步骤a1,根据预设自适应阈值算法遍历所述原始图像,得到像素平均值,将所述原始图像中各像素点的像素值与所述像素平均值进行比较;
步骤a21,若所述原始图像中像素点的像素值大于所述像素平均值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述像素平均值,则将所述像素点的像素值设置为0,获得自适应图像。
即,终端根据预设自适应阈值算法遍历原始图像,得到像素平均值,终端将原始图像中各像素点的像素值与像素平均值进行比较,若原始图像中像素点的像素值大于像素平均值,则终端将像素点的像素值设置为255;若原始图像中像素点的像素值小于或等于所述像素平均值,则将像素点的像素值设置为0,获得自适应图像。
步骤S40,根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框。
终端根据二值化图像对自适应图像进行处理,即,终端根据全局阈值对原始图像进行局部二值化处理获得的二值化图像中图像信息较为简单,终端根据预设自适应阈值算法处理的自适应图像中可能存在干扰点,因此,本实施例中终端根据二值化图像对自适应图像进行再处理,例如,终端将二值化图像和自适应图像进行比对,删除自适应图像中的噪点,得到处理后的自适应图像,终端识别处理后的自适应图像获得图像边框,具体地,包括:
步骤b1,获取所述二值化图像中目标像素点的第一像素值,获取所述自适应图像中目标像素点的第二像素值;
步骤b2,根据所述第一像素值和所述第二像素值进行异或判断,根据异或判断的结果对所述自适应图像进行处理;
步骤b3,将所述处理后的自适应图像进行去噪,识别去噪后的自适应图像,获得图像边框。
终端获取二值化图像中目标像素点的第一像素值,获取自适应图像中目标像素点的第二像素值;其中,目标像素点是指相同位置处的像素点,例如二值化图像和自适应图像都以图像中心为原点建立直角坐标系,二值化图像中目标像素点的坐标(1,1),自适应图像中目标像素点的坐标也是(1,1)。
终端根据第一像素值和第二像素值进行异或判断,根据异或判断的结果对自适应图像进行处理;即,若第一像素值和第二像素值不同,终端则将自适应图像中目标像素点的像素值调整为0;若第一像素值和第二像素值相同,终端则将自适应图像中目标像素点的像素值调整为255,完成对自适应图像的处理,终端将处理后的自适应图像进行去噪,例如,终端将像素点数量少于预设像素点数量(预设像素点数量为10)的作为噪点进行删除,终端识别去噪后的自适应图像,获得图像边框。
需要补充说明的是,若存在多个全局阈值,生成多个二值化图像,终端将每个二值化图像分别和自适应图像进行异或判断,使得处理得到的自适应图像更加符合真实图像,且包含的噪点更少。
本实施例中先采用局部二值化处理得到二值化图像,二值化图像中包含原始图像的基本轮廓,然后再采用自适应阈值算法处理得到自适应图像,自适应图像中包含较为细致的图像信息,然后终端根据二值化图像对自适应图像进行处理,这样得到的图像根据优化,通过该处理后的自适应图像识别得到的图像边框更加准确。
进一步地,参照图7,在本发明第一实施例的基础上,提出了本发明图像边框识别方法的第二实施例。
本实施例是第一实施例中步骤S20的细化步骤,本实施例与本发明第一实施例的区别在于:
步骤S21,获取所述灰度直方图中各像素点的像素值,统计像素值相同的像素点的像素点数量。
终端获取灰度直方图中各像素点的像素值,终端统计像素值相同的像素点的像素点数量,例如,像素值为0的像素点数量为200,像素值为1的像素点数量为125等等。
步骤S22,根据所述像素值和所述像素值对应的像素点数量,确定全局阈值。
终端根据像素值和像素值对应的像素点数量,确定全局阈值,具体地,包括:
步骤c1,依次获取灰度直方图中各像素值的像素点数量,其中,像素值为i,i取0-255的自然数,所述像素值i的像素点数量记为Histogram[i];
步骤c2,计算相邻像素值的像素点数量的差值,其中,所述差值包括第一差值和第二差值,所述第一差值为:Delta[i]=Histogram[i]-Histogram[i-1],所述第二差值为:Delta[i+1]=Histogram[i+1]-Histogram[i];
步骤c3,若所述第一差值小于零且所述第二差值大于零,则将所述i对应的像素值作为目标像素值,按照所述目标像素值的像素点数量从小到大排列各所述目标像素值,获取排序靠前的预设数量的目标像素值作为全局阈值。
即,终端依次获取灰度直方图中各像素值的像素点数量,其中,像素值为i,i取0-255的自然数,像素值i的像素点数量记为Histogram[i];终端计算相邻像素值的像素点数量的差值,其中,差值包括第一差值和第二差值,第一差值为:Delta[i]=Histogram[i]-Histogram[i-1],第二差值为:Delta[i+1]=Histogram[i+1]-Histogram[i];若第一差值小于零且第二差值大于零,则终端判定该像素值为突变点,终端将i对应的像素值作为目标像素值,终端将多个目标像素值进行记录,按照目标像素值的像素点数量从小到大排列各目标像素值,获取排序靠前的预设数量的目标像素值作为全局阈值。
步骤S23,若所述原始图像中像素点的像素值大于所述全局阈值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述全局阈值,则将所述像素点的像素值设置为0,获得二值化图像。
若原始图像中像素点的像素值大于全局阈值,终端则将像素点的像素值设置为255;若原始图像中像素点的像素值小于或等于全局阈值,终端则将像素点的像素值设置为0,获得二值化图像。
在本实施例中终端根据灰度直方图中像素值和像素值对应的像素点数量,确定全局阈值,本实施例中确定的全局阈值是灰度直方图中波谷处的像素值,该像素值可以更加清晰地划分原始图像中各个像素点,以保证了生成的二值化图像更加清晰。
进一步地,基于上述实施例提出了本发明图像边框识别方法的第三实施例,本实施例是本发明第一实施例中步骤S40之后的步骤,本实施例中在图像边框识别完成之后,对图像中的图像信息进行识别,包括:
通过字符识别算法识别所述图像边框内的字符信息,将所述字符信息进行输出。
本实施例中在识别得到图像边框之后,终端根据字符识别算法识别图像边框内的字符信息,并将字符信息进行输出;在本实施例中在识别得到图像边框之后,终端对图像边框内的字符信息进行识别,得到图像中的字符信息,本实施例在通过准确地识别图像边框,然后再对图像边框内部的字符信息进行识别,这样避免了识别到图像边框之外的噪声信息,使得图像识别更加准确。
此外,参照图8,本发明实施例还提出一种图像边框识别装置,所述图像边框识别装置包括:
灰度处理模块10,用于对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图;
第一处理模块20,用于根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像;
第二处理模块30,用于根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像;
处理识别模块40,用于根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框。
在一实施例中,所述第一处理模块20,包括:
获取统计单元,用于获取所述灰度直方图中各像素点的像素值,统计像素值相同的像素点的像素点数量;
阈值确定单元,用于根据所述像素值和所述像素值对应的像素点数量,确定全局阈值;
图像调整单元,用于若所述原始图像中像素点的像素值大于所述全局阈值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述全局阈值,则将所述像素点的像素值设置为0,获得二值化图像。
在一实施例中,所述阈值确定单元,还用于:
依次获取灰度直方图中各像素值的像素点数量,其中,像素值为i,i取0-255的自然数,所述像素值i的像素点数量记为Histogram[i];
计算相邻像素值的像素点数量的差值,其中,所述差值包括第一差值和第二差值,所述第一差值为:Delta[i]=Histogram[i]-Histogram[i-1],所述第二差值为:Delta[i+1]=Histogram[i+1]-Histogram[i];
若所述第一差值小于零且所述第二差值大于零,则将所述i对应的像素值作为目标像素值,按照所述目标像素值的像素点数量从小到大排列各所述目标像素值,获取排序靠前的预设数量的目标像素值作为全局阈值。
在一实施例中,所述第二处理模块30,包括:
遍历比对单元,用于根据预设自适应阈值算法遍历所述原始图像,得到像素平均值,将所述原始图像中各像素点的像素值与所述像素平均值进行比较;
图像调整单元,用于若所述原始图像中像素点的像素值大于所述像素平均值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述像素平均值,则将所述像素点的像素值设置为0,获得自适应图像。
在一实施例中,所述处理去噪模块,包括:
像素值获取单元,用于获取所述二值化图像中目标像素点的第一像素值,获取所述自适应图像中目标像素点的第二像素值;
图像处理单元,用于根据所述第一像素值和所述第二像素值进行异或判断,根据异或判断的结果对所述自适应图像进行处理;
去噪识别单元,用于将所述处理后的自适应图像进行去噪,识别去噪后的自适应图像,获得图像边框。
在一实施例中,所述图像去噪单元,包括:
若所述第一像素值和所述第二像素值不同,则将所述自适应图像中目标像素点的像素值调整为0;
若所述第一像素值和所述第二像素值相同,则将所述自适应图像中目标像素点的像素值调整为255,完成对自适应图像的处理。
在一实施例中,所述的图像边框识别装置,包括:
字符识别模块,用于通过字符识别算法识别所述图像边框内的字符信息,将所述字符信息进行输出。
其中,图像边框识别装置的各个功能模块实现的步骤可参照本发明图像边框识别方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的图像边框识别方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种图像边框识别方法,其特征在于,所述图像边框识别方法包括以下步骤:
对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图;
根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像;
根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像;
根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框,其中,所述根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框的步骤包括:获取所述二值化图像中目标像素点的第一像素值,获取所述自适应图像中目标像素点的第二像素值;根据所述第一像素值和所述第二像素值进行异或判断,根据异或判断的结果对所述自适应图像进行处理;将所述处理后的自适应图像进行去噪,识别去噪后的自适应图像,获得图像边框。
2.如权利要求1所述的图像边框识别方法,其特征在于,所述根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像的步骤,包括:
获取所述灰度直方图中各像素点的像素值,统计像素值相同的像素点的像素点数量;
根据所述像素值和所述像素值对应的像素点数量,确定全局阈值;
若所述原始图像中像素点的像素值大于所述全局阈值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述全局阈值,则将所述像素点的像素值设置为0,获得二值化图像。
3.如权利要求2所述的图像边框识别方法,其特征在于,所述根据所述像素值和所述像素值对应的像素点数量,确定全局阈值的步骤,包括:
依次获取灰度直方图中各像素值的像素点数量,其中,像素值为i,i取0-255的自然数,所述像素值i的像素点数量记为Histogram[i];
计算相邻像素值的像素点数量的差值,其中,所述差值包括第一差值和第二差值,所述第一差值为:Delta[i]=Histogram[i]-Histogram[i-1],所述第二差值为:Delta[i+1]=Histogram[i+1]-Histogram[i];
若所述第一差值小于零且所述第二差值大于零,则将所述i对应的像素值作为目标像素值,按照所述目标像素值的像素点数量从小到大排列各所述目标像素值,获取排序靠前的预设数量的目标像素值作为全局阈值。
4.如权利要求1所述的图像边框识别方法,其特征在于,所述根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像的步骤,包括:
根据预设自适应阈值算法遍历所述原始图像,得到像素平均值,将所述原始图像中各像素点的像素值与所述像素平均值进行比较;
若所述原始图像中像素点的像素值大于所述像素平均值,则将所述像素点的像素值设置为255;若所述原始图像中像素点的像素值小于或等于所述像素平均值,则将所述像素点的像素值设置为0,获得自适应图像。
5.如权利要求1所述的图像边框识别方法,其特征在于,所述根据所述第一像素值和所述第二像素值进行异或判断,根据异或判断的结果对所述自适应图像进行处理的步骤,包括:
若所述第一像素值和所述第二像素值不同,则将所述自适应图像中目标像素点的像素值调整为0;
若所述第一像素值和所述第二像素值相同,则将所述自适应图像中目标像素点的像素值调整为255,完成对自适应图像的处理。
6.如权利要求1至5任意一项所述的图像边框识别方法,其特征在于,所述根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框的步骤之后,包括:
通过字符识别算法识别所述图像边框内的字符信息,将所述字符信息进行输出。
7.一种图像边框识别装置,其特征在于,所述图像边框识别装置包括:
灰度处理模块,用于对待识别的原始图像进行灰度处理,获得所述原始图像的灰度直方图;
第一处理模块,用于根据所述灰度直方图确定全局阈值,根据所述全局阈值对所述原始图像进行局部二值化处理,获得二值化图像;
第二处理模块,用于根据预设自适应阈值算法对所述原始图像进行处理,获得自适应图像;
处理识别模块,用于根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框,其中,所述根据所述二值化图像对所述自适应图像进行处理,识别处理后的自适应图像,获得图像边框的步骤包括:获取所述二值化图像中目标像素点的第一像素值,获取所述自适应图像中目标像素点的第二像素值;根据所述第一像素值和所述第二像素值进行异或判断,根据异或判断的结果对所述自适应图像进行处理;将所述处理后的自适应图像进行去噪,识别去噪后的自适应图像,获得图像边框。
8.一种图像边框识别设备,其特征在于,所述图像边框识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的图像边框识别方法的步骤。
9.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的图像边框识别方法的步骤。
CN201911423886.XA 2019-12-31 2019-12-31 图像边框识别方法、装置、设备和计算机存储介质 Active CN111080665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911423886.XA CN111080665B (zh) 2019-12-31 2019-12-31 图像边框识别方法、装置、设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911423886.XA CN111080665B (zh) 2019-12-31 2019-12-31 图像边框识别方法、装置、设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN111080665A CN111080665A (zh) 2020-04-28
CN111080665B true CN111080665B (zh) 2023-06-09

Family

ID=70321439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911423886.XA Active CN111080665B (zh) 2019-12-31 2019-12-31 图像边框识别方法、装置、设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN111080665B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598076B (zh) * 2020-05-25 2023-05-02 北京明略软件系统有限公司 一种标签图像中日期检测处理方法及装置
CN112150394B (zh) * 2020-10-12 2024-02-20 杭州睿琪软件有限公司 图像处理方法及装置、电子设备和存储介质
CN113763311A (zh) * 2021-01-05 2021-12-07 北京京东乾石科技有限公司 图像识别方法及装置、以及自动分拣机器人

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436644A (zh) * 2011-11-02 2012-05-02 南京物联网研究院发展有限公司 基于自适应边缘配准的非结构化道路检测方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3985928B2 (ja) * 2000-02-14 2007-10-03 株式会社リコー 画像処理方法、画像処理装置、文字認識装置及び記憶媒体
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
JP2003162723A (ja) * 2001-11-26 2003-06-06 Fujitsu Ltd 画像処理プログラム
US6941013B1 (en) * 2002-04-22 2005-09-06 The United States Of America As Represented By The National Security Agency Method of image binarization using histogram modeling
US7636467B2 (en) * 2005-07-29 2009-12-22 Nokia Corporation Binarization of an image
CN101488129B (zh) * 2008-01-14 2011-04-13 夏普株式会社 图像检索装置及图像检索方法
US8155442B2 (en) * 2008-02-04 2012-04-10 The Neat Company, Inc. Method and apparatus for modifying the histogram of an image
US8144986B2 (en) * 2008-09-05 2012-03-27 The Neat Company, Inc. Method and apparatus for binarization threshold calculation
CN102496020B (zh) * 2011-10-31 2013-07-31 天津大学 基于累积边缘点可视灰度范围直方图的图像二值化方法
US9704057B1 (en) * 2014-03-03 2017-07-11 Accusoft Corporation Methods and apparatus relating to image binarization
CN106127751B (zh) * 2016-06-20 2020-04-14 北京小米移动软件有限公司 图像检测方法、装置以及系统
CN106886987B (zh) * 2017-03-23 2019-05-24 重庆大学 一种列车车牌二值化图像融合方法
CN109543686B (zh) * 2018-10-24 2023-04-25 重庆师范大学 基于自适应多阈值的字符识别预处理二值化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436644A (zh) * 2011-11-02 2012-05-02 南京物联网研究院发展有限公司 基于自适应边缘配准的非结构化道路检测方法

Also Published As

Publication number Publication date
CN111080665A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
EP3614333B1 (en) Image processing method, storage medium, and electronic apparatus
CN109685746B (zh) 图像亮度调整方法、装置、存储介质及终端
CN111080665B (zh) 图像边框识别方法、装置、设备和计算机存储介质
US9721387B2 (en) Systems and methods for implementing augmented reality
JP2018088247A (ja) オブジェクトセグメンテーションのための前景マスク補正のための画像処理装置及び方法
CN108234882B (zh) 一种图像虚化方法及移动终端
CN110287891B (zh) 基于人体关键点的手势控制方法、装置及电子设备
US9478037B2 (en) Techniques for efficient stereo block matching for gesture recognition
CN107566749B (zh) 拍摄方法及移动终端
WO2017054442A1 (zh) 一种图像信息识别处理方法及装置、计算机存储介质
CN110070551B (zh) 视频图像的渲染方法、装置和电子设备
CN109116129B (zh) 终端检测方法、检测设备、系统及存储介质
CN110414649B (zh) Dm码的定位方法、装置、终端及存储介质
CN108021863B (zh) 电子装置、基于图像的年龄分类方法及存储介质
CN110619656B (zh) 基于双目摄像头的人脸检测跟踪方法、装置及电子设备
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
CN110910445A (zh) 一种物件尺寸检测方法、装置、检测设备及存储介质
CN111144337A (zh) 火灾检测方法、装置及终端设备
CN111507324A (zh) 卡片边框识别方法、装置、设备和计算机存储介质
CN113888438A (zh) 图像处理方法、装置及存储介质
CN110222576B (zh) 拳击动作识别方法、装置和电子设备
CN117115774A (zh) 草坪边界的识别方法、装置、设备及存储介质
CN109919164B (zh) 用户界面对象的识别方法及装置
CN108805883B (zh) 一种图像分割方法、图像分割装置及电子设备
CN108304840B (zh) 一种图像数据处理方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201016

Address after: 261031, north of Jade East Street, Dongming Road, Weifang hi tech Zone, Shandong province (GoerTek electronic office building, Room 502)

Applicant after: GoerTek Optical Technology Co.,Ltd.

Address before: 261031 Dongfang Road, Weifang high tech Industrial Development Zone, Shandong, China, No. 268

Applicant before: GOERTEK Inc.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant