CN111126254A - 图像识别方法、装置、设备及存储介质 - Google Patents
图像识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111126254A CN111126254A CN201911334327.1A CN201911334327A CN111126254A CN 111126254 A CN111126254 A CN 111126254A CN 201911334327 A CN201911334327 A CN 201911334327A CN 111126254 A CN111126254 A CN 111126254A
- Authority
- CN
- China
- Prior art keywords
- image
- edge
- pixel
- edge information
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 claims abstract description 54
- 238000000605 extraction Methods 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims description 62
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 241000282326 Felis catus Species 0.000 description 2
- 230000003796 beauty Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请实施例提供了一种图像识别方法、装置、设备及存储介质,涉及计算机视觉技术领域。所述方法包括:获取图像;对图像进行边缘提取,得到图像的边缘图像;根据边缘图像对图像进行边缘信息增强处理,得到边缘信息增强后的图像;通过图像识别模型对边缘信息增强后的图像进行处理,得到图像的识别结果。本申请实施例通过对图像进行边缘提取,得到该图像的边缘图像;根据边缘图像对该图像进行边缘信息增强处理,得到边缘信息增强后的图像,通过图像识别模型对上述边缘信息增强后的图像进行处理,得到图像的识别结果,提高了图像中边缘像素对图像识别的贡献比重,从而提高了图像识别的准确性。
Description
技术领域
本申请实施例涉及计算机视觉技术领域,特别涉及一种图像识别方法、装置、设备及存储介质。
背景技术
图像识别是指对图像进行处理、分析和理解,以识别各种不同模式的对象的技术。
在相关技术中,图像识别的流程可以如下:通过图像识别模型对待识别图像进行特征提取,获得待识别图像的特征信息;根据该特征信息,确定待识别图像的识别结果。
发明内容
本申请实施例提供一种图像识别方法、装置、设备及存储介质。所述技术方案如下:
一方面,本申请实施例提供一种图像识别方法,所述方法包括:
获取图像;
对所述图像进行边缘提取,得到所述图像的边缘图像;
根据所述边缘图像对所述图像进行边缘信息增强处理,得到边缘信息增强后的图像;
通过图像识别模型对所述边缘信息增强后的图像进行处理,得到所述图像的识别结果。
另一方面,本申请实施例提供一种图像识别装置,所述装置包括:
图像获取模块,用于获取图像;
图像提取模块,用于对所述图像进行边缘提取,得到所述图像的边缘图像;
图像增强模块,用于根据所述边缘图像对所述图像进行边缘信息增强处理,得到边缘信息增强后的图像;
图像识别模块,用于通过图像识别模型对所述边缘信息增强后的图像进行处理,得到所述图像的识别结果。
另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上述方面所述的图像识别方法。
又一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上述方面所述的图像识别方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过对图像进行边缘提取,得到该图像的边缘图像;根据边缘图像对该图像进行边缘信息增强处理,得到边缘信息增强后的图像,通过图像识别模型对上述边缘信息增强后的图像进行处理,得到图像的识别结果,提高了图像中边缘像素对图像识别的贡献比重,从而提高了图像识别的准确性。
附图说明
图1是本申请一个实施例提供的图像识别方法的流程图;
图2是本申请一个实施例提供的图像的示意图;
图3是本申请一个实施例提供的边缘图像的示意图;
图4是本申请一个实施例提供的边缘信息增强后的图像;
图5是本申请另一个实施例提供的图像识别方法的流程图;
图6是本申请一个实施例提供的图像识别装置的框图;
图7是本申请另一个实施例提供的图像识别装置的框图;
图8是本申请一个实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在相关技术中,图像识别算法基本上都采用主流的深度学习算法,也有采用传统统计学习算法和深度学习算法相结合的方法。但是在图像中并不是所有的像素点都可以为图像识别提供信息,有的位置的像素点可以为图像识别提供较多的信息,有的位置的像素点却并不能为图像识别提供任何信息。在所有图片信息中,对象的轮廓信息是可以为对象的确定提供很多信息的,但是在相关技术中,图像中不同位置的像素对图像识别的贡献比重都是一样的,导致图像识别精度较低。
本申请实施例提供的技术方案中,通过对图像进行边缘提取,得到该图像的边缘图像;根据边缘图像对该图像进行边缘信息增强处理,得到边缘信息增强后的图像,通过图像识别模型对上述边缘信息增强后的图像进行处理,得到图像的识别结果,提高了图像中边缘像素对图像识别的贡献比重,从而提高了图像识别的准确性。
在本申请实施例中,各步骤的执行主体可以是计算机设备,计算机设备是指具备计算和处理能力的电子设备,计算机设备可以是终端,例如,终端可以是手机、平板电脑、PC(Personal Computer,个人计算机)或其它电子设备;计算机设备还可以服务器,例如,服务器可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是云计算中心。
下面,将通过几个实施例对本申请提供的技术方案进行介绍说明。
请参考图1,其示出了本申请一个实施例提供的图像识别方法的流程图。该方法可以包括如下几个步骤。
步骤101,获取图像。
图像可以是任意一个图像,在本申请实施例中,上述图像又可以称之为待识别图像。例如,待识别图像可以是终端上的摄像头采集到的图像。可选地,终端上设置有摄像头且安装有拍摄类应用程序,拍摄类应用程序是指用于拍摄图像的应用程序,例如,相机应用程序、美颜应用程序或其他应用程序等。当该拍摄类应用程序运行时,终端接收作用在当前拍摄界面上的拍摄控件的触发信息时,获取摄像头采集到的图像作为待识别图像。当然,在可能的实现方式中,待识别图像可以不是终端上的摄像头采集到的图像,是用户从其他应用程序中保存的图像。可选地,待识别图像可以是从网络中获取到的图像或者是截图。可选地,当终端的显示界面中显示有待识别图像,当终端接收到对应于该图像的保存指令时,根据该保存指令从网络中获取该图像作为待识别图像。
步骤102,对图像进行边缘提取,得到图像的边缘图像。
边缘图像用于表征图像的边缘信息。结合参考图2和图3,对如图2所示的图像进行边缘提取,得到如图3所示的边缘图像。
步骤103,根据边缘图像对图像进行边缘信息增强处理,得到边缘信息增强后的图像。
结合参考图2、图3和图4,根据如图3所示的边缘图像对如图2所示的图像进行边缘信息增强处理,得到如图4所示的边缘信息增强后的图像。
步骤104,通过图像识别模型对边缘信息增强后的图像进行处理,得到图像的识别结果。
图像的识别结果用于指示图像包括的对象,例如,图像中可以包括一个或多个对象,例如,人物、动物、植物、建筑物、风景等等。边缘信息增强后的图像中的边缘像素对图像识别的贡献比重提高了,因而提高了通过图像识别模型对边缘信息增强后的图像进行处理,得到图像的识别结果的准确性。
综上所述,本申请实施例提供的技术方案中,通过对图像进行边缘提取,得到该图像的边缘图像;根据边缘图像对该图像进行边缘信息增强处理,得到边缘信息增强后的图像,通过图像识别模型对上述边缘信息增强后的图像进行处理,得到图像的识别结果,提高了图像中边缘像素对图像识别的贡献比重,从而提高了图像识别的准确性。
请参考图5,其示出了本申请另一个实施例提供的图像识别方法的流程图。该方法可以包括如下几个步骤。
步骤501,获取图像。
有关步骤501的介绍说明可参见步骤101的介绍说明,此处不再赘述。
步骤502,对图像进行边缘提取,得到图像的边缘图像。
在一个示例中,边缘图像可以通过如下方式获取:
1.1、对于图像中的任意一个像素,将像素的像素值分别和纵向梯度矩阵和横向梯度矩阵相乘,得到像素的横向梯度幅值和纵向梯度幅值;
像素的横向梯度幅值Gx可以通过如下公式计算得到:
Gx=Wx×A;
其中,Wx表示横向梯度矩阵,A表示图像中的像素的像素值。
像素的纵向梯度幅值Gy可以通过如下公式计算得到:
Gy=Wy×A;
其中,Wy表示纵向梯度矩阵,A表示图像中的像素的像素值。
1.2、根据横向梯度幅值和纵向梯度幅值,计算像素的梯度幅值;
像素的梯度幅值G可以通过如下公式计算得到:
在可能的实现方式中,像素的梯度幅值也可以通过如下公式计算得到:
1.3、若梯度幅值大于第一预设阈值,则将像素确定为边缘像素;
第一预设阈值可以由技术人员设置,也可以将默认值设置为第一预设阈值。
1.4、根据各个边缘像素的梯度幅值,得到边缘图像。
边缘图像是由多个边缘像素组成的,通过上述步骤1.1-1.3确定出各个边缘像素,再根据各个边缘像素的梯度幅值,得到边缘图像。
在另一个示例中,边缘图像可以通过如下方式获取:
2.1、对于图像中的任意一个像素,对像素求二阶导数,得到梯度幅值;
梯度幅值可以通过如下公式计算得到:
其中,f(x,y)表示图像中的第x行第y列的像素的像素值,f(x+1,y)表示图像中的第x+1行第y列的像素的像素值,f(x,y+1)表示图像中的第x行第y+1列的像素的像素值,f(x-1,y)表示图像中的第x-1行第y列的像素的像素值,f(x,y-1)表示图像中的第x行第y-1列的像素的像素值。
上式可以简化为下式:
2.2、若梯度幅值大于第二预设阈值,则将像素确定为边缘像素;
2.3、根据各个边缘像素的梯度幅值,得到边缘图像。
在又一个示例中,边缘图像可以通过如下方式获取:
3.1、对图像进行平滑滤波处理,得到处理后的图像;
示例性地,计算机设备可以通过如下公式对图像进行平滑滤波处理,得到处理后的图像:
3.2、根据处理后的图像的横向梯度幅值和纵向梯度幅值,确定处理后的图像的梯度幅值和梯度方向;
处理后的图像的横向梯度幅值Ex可以通过如下公式计算得到:
处理后的图像的纵向梯度幅值Ey可以通过如下公式计算得到:
处理后的图像的梯度幅值可以通过如下公式计算得到:
处理后的图像的梯度方向可以通过如下公式计算得到:
3.3、保留处理后的图像中在梯度方向上具有最大梯度幅值的像素,以及删除处理后的图像中的其它像素,得到初始边缘图像;
可选地,使用一个3*3的滤波器,作用于上述处理后的图像的梯度幅值中的所有点,在每一点上,邻域的中心点像素与沿梯度方向的两个梯度幅值的插值结果进行比较,保留极大值点。
3.4、保留初始边缘图像中的第一像素和第二像素,第一像素的像素值大于第三预设阈值,第二像素的像素值大于第四预设阈值且小于第三预设阈值,第二像素与第一像素相邻;
其中,M(i,j)表示初始边缘图像中的第i行第j列的像素的像素值,τ1表示第四预设阈值,τ2表示第三预设阈值。
第三像素的像素值小于第四预设阈值,计算机设备可以去除该第三像素。
3.5、根据第一像素和第二像素各自的梯度幅值,得到边缘图像。
边缘图像是由第一像素和第二像素各自的梯度幅值组成的。
步骤503,根据边缘图像生成权值矩阵。
在本申请实施例中,权值矩阵用于表征图像中各个像素对应的增强程度。
在示意性实施例中,权值矩阵可以通过如下方式生成:
1、获取边缘图像的边缘像素矩阵;
边缘像素矩阵是指由边缘图像中的各个像素的像素值构成的。
2、对边缘像素矩阵做归一化处理,得到权值矩阵。
示例性地,将边缘像素矩阵中的各个值除以边缘像素矩阵中的最大值,得到权值矩阵。
步骤504,采用权值矩阵对图像进行边缘信息增强处理,得到边缘信息增强后的图像。
示例性地,计算机设备可以执行下述步骤以得到边缘信息增强后的图像:
1、将权值矩阵与图像对应位置像素的像素值相乘,得到加权边缘图像;
加权边缘图像是指对边缘图像进行加权处理后的图像。
2、将加权边缘图像和图像在同一位置像素的像素值相加,得到边缘信息增强后的图像。
将加权边缘图像和图像在同一位置像素的像素值相加,可以使得图像中的边缘像素的像素值更大,从而增强边缘信息。
步骤505,通过图像识别模型对边缘信息增强后的图像进行处理,得到图像的识别结果。
通过图像识别模型对边缘信息增强后的图像进行处理,得到边缘信息增强后的图像的特征信息;计算机设备根据上述边缘信息增强后的图像的特征信息,得到图像的识别结果。通过图像识别模型对边缘信息增强后的图像进行处理,可以使得图像中的边缘像素在图像识别时的贡献比重增大,从而使得最终的图像识别结果更准确。
在通过图像识别模型对边缘信息增强后的图像进行处理之前,需要对图像识别模型进行训练,图像识别模型的训练过程可以包括如下几个步骤:
第一、获取图像识别模型的训练数据,训练数据包括至少一个训练图像和训练图像的标准识别结果;
训练图像可以是任意一张图像,训练图像的标准识别结果可以由人工标注,上述至少一个训练图像的标准识别结果一致。
第二、对训练图像进行边缘提取,得到训练图像的边缘图像;
有关边缘提取的介绍说明可参见上文实施例,此处不再赘述。
第三、根据训练图像的边缘图像对训练图像进行边缘信息增强处理,得到边缘信息增强后的训练图像;
有关边缘信息增强处理的介绍说明可参见上文实施例,此处不再赘述。
第四、通过图像识别模型对边缘信息增强后的训练图像进行处理,得到训练图像的预测识别结果;
可选地,计算机设备可以通过图像识别模型对边缘信息增强后的训练图像进行处理,得到边缘信息增强后的训练图像的特征信息;根据上述边缘信息增强后的训练图像的特征信息,得到训练图像的预测识别结果。
第五、根据预测识别结果和标准识别结果,对图像识别模型进行训练。
可选地,计算机设备根据预测识别结果和标准识别结果,确定图像识别模型的损失函数;根据损失函数,对图像识别模型进行训练。可选地,计算机设备通过相关技术中的图像识别模型对边缘信息增强后的训练图像进行处理,得到训练图像的预测识别结果。根据预测识别结果和标准识别结果,对相关技术中的图像识别模型进行训练,此时只需要对相关技术中的图像识别模型微调,即可得到训练完成的图像识别模型,训练时间短。
在示意性实施例中,当得到图像的识别结果之后,计算机设备可以根据图像的识别结果,将图像存储至与识别结果相匹配的相册中。
例如,图像的识别结果是狗,那么计算机设备可以将该狗的图像存储至存储标签为狗的相册中;再例如,图像的识别结果是猫,那么计算机设备可以将该猫的图像存储至存储标签为猫的相册中。计算机设备根据图像的识别结果,将图像存储至与识别结果相匹配的相册中,可以便于后续用户根据该识别结果查找图像,提高了在相册中搜索图像的搜索效率。根据图像的识别结果,建立相册的存储标签,使得相册的分类更为合理。
综上所述,本申请实施例提供的技术方案中,通过根据图像的识别结果,将图像存储至与识别结果相匹配的相册中,可以便于后续用户根据该识别结果查找图像,提高了在相册中搜索图像的搜索效率。
在可能的实现方式中,边缘提取和边缘信息增强处理的流程可以由图像识别模型进行执行。此时,本申请实施例还提供了另一种图像识别方法的流程图,该方法可以包括如下几个步骤。
第一、获取待识别图像。
待识别图像可以是任意一个图像,例如,待识别图像可以是终端上的摄像头采集到的图像。可选地,终端上设置有摄像头且安装有拍摄类应用程序,拍摄类应用程序是指用于拍摄图像的应用程序,例如,相机应用程序、美颜应用程序或其他应用程序等。当该拍摄类应用程序运行时,终端接收作用在当前拍摄界面上的拍摄控件的触发指令时,获取摄像头采集到的图像作为待识别图像。当然,在可能的实现方式中,待识别图像可以不是终端上的摄像头采集到的图像,是用户从其他应用程序中保存的图像。可选地,待识别图像可以是从网络中获取到的图像或者是截图。可选地,当终端的显示界面中显示有待识别图像,当终端接收到对应该图像的保存指令时,根据该保存指令从网络中获取该图像作为待识别图像。
第二、通过训练后的图像识别模型对待识别图像进行边缘提取,得到待识别图像的的边缘图像。
在本申请实施例中,可以通过图像识别模型对待识别图像进行边缘提取,得到待识别图像的边缘图像。有关边缘提取的介绍说明可参见上文实施例,此处不再赘述。
第三、通过训练后的图像识别模型根据边缘图像对待识别图像进行边缘信息增强处理,得到边缘信息增强后的待识别图像。
有关边缘信息增强处理的介绍说明可参见上文实施例,此处不再赘述。通过图像识别模型对待识别图像进行边缘提取和边缘信息增强处理,计算机设备只需要将待识别图像输入图像识别模型中,即可实现边缘提取、边缘信息增强处理和图像识别的功能,操作流程简单。
第四、通过训练后的图像识别模型对边缘信息增强后的待识别图像进行图像识别,得到待识别图像的识别结果。
可选地,图像识别模型通过如下方式训练得到:
1、获取图像识别模型的训练数据,训练数据包括至少一个训练图像和训练图像的标准识别结果;
2、通过图像识别模型对训练图像进行边缘提取,得到训练图像的边缘图像;
3、通过图像识别模型根据训练图像的边缘图像对训练图像进行边缘信息增强处理,得到边缘信息增强后的训练图像;
4、通过图像识别模型对边缘信息增强后的训练图像对边缘信息增强后的训练图像进行处理,得到训练图像的预测识别结果;
5、根据预测识别结果和标准识别结果,对图像识别模型进行训练,得到训练后的图像识别模型。
综上所述,本申请实施例提供的技术方案中,通过图像识别模型对待识别图像进行边缘提取、边缘信息增强处理和图像识别处理,操作流程简单。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图6,其示出了本申请一个实施例提供的图像识别装置的框图,该装置具有实现上述图像识别方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置600可以包括:图像获取模块610、图像提取模块620、图像增强模块630和图像识别模块640。
图像获取模块610,用于获取图像。
图像提取模块620,用于对所述图像进行边缘提取,得到所述图像的边缘图像。
图像增强模块630,用于根据所述边缘图像对所述图像进行边缘信息增强处理,得到边缘信息增强后的图像。
图像识别模块640,用于通过图像识别模型对所述边缘信息增强后的图像进行处理,得到所述图像的识别结果。
综上所述,本申请实施例提供的技术方案中,通过对图像进行边缘提取,得到该图像的边缘图像;根据边缘图像对该图像进行边缘信息增强处理,得到边缘信息增强后的图像,通过图像识别模型对上述边缘信息增强后的图像进行处理,得到图像的识别结果,提高了图像中边缘像素对图像识别的贡献比重,从而提高了图像识别的准确性。
可选地,如图7所示,所述图像增强模块630,包括:矩阵生成单元631和图像增强单元632。
矩阵生成单元631,用于根据所述边缘图像生成权值矩阵,所述权值矩阵用于表征所述图像中各个像素对应的增强程度。
图像增强单元632,用于采用所述权值矩阵对所述图像进行边缘信息增强处理,得到所述边缘信息增强后的图像。
可选地,所述矩阵生成单元631,用于:
获取所述边缘图像的边缘像素矩阵;
对所述边缘像素矩阵做归一化处理,得到所述权值矩阵。
可选地,所述图像增强单元632,用于:
将所述权值矩阵与所述图像对应位置像素的像素值相乘,得到加权边缘图像;
将所述加权边缘图像和所述图像在同一位置像素的像素值相加,得到所述边缘信息增强后的图像。
可选地,所述图像提取模块620,用于:
对于所述图像中的任意一个像素,将所述像素的像素值分别和纵向梯度矩阵和横向梯度矩阵相乘,得到所述像素的横向梯度幅值和纵向梯度幅值;
根据所述横向梯度幅值和所述纵向梯度幅值,计算所述像素的梯度幅值;
若所述梯度幅值大于第一预设阈值,则将所述像素确定为边缘像素;
根据各个所述边缘像素的梯度幅值,得到所述边缘图像。
可选地,所述图像提取模块620,用于:
对于所述图像中的任意一个像素,对所述像素求二阶导数,得到梯度幅值;
若所述梯度幅值大于第二预设阈值,则将所述像素确定为边缘像素;
根据各个所述边缘像素的梯度幅值,得到所述边缘图像。
可选地,所述图像提取模块620,用于:
对所述图像进行平滑滤波处理,得到处理后的图像;
根据所述处理后的图像的横向梯度幅值和纵向梯度幅值,确定所述处理后的图像的梯度幅值和梯度方向;
保留所述处理后的图像中在所述梯度方向上具有最大梯度幅值的像素,以及删除所述处理后的图像中的其它像素,得到初始边缘图像;
保留所述初始边缘图像中的第一像素和第二像素,所述第一像素的像素值大于第三预设阈值,所述第二像素的像素值大于第四预设阈值且小于所述第三预设阈值,所述第二像素与所述第一像素相邻;
根据所述第一像素和所述第二像素各自的梯度幅值,得到所述边缘图像。
可选地,所述装置600,还包括:数据获取模块650、图像预测模块660和模型训练模块670。
数据获取模块650,用于获取所述图像识别模型的训练数据,所述训练数据包括至少一个训练图像和所述训练图像的标准识别结果。
所述图像提取模块620,还用于对所述训练图像进行边缘提取,得到所述训练图像的边缘图像。
所述图像增强模块630,还用于根据所述训练图像的边缘图像对所述训练图像进行边缘信息增强处理,得到边缘信息增强后的训练图像。
图像预测模块660,用于通过所述图像识别模型对所述边缘信息增强后的训练图像进行处理,得到所述训练图像的预测识别结果。
模型训练模块670,用于根据所述预测识别结果和所述标准识别结果,对所述图像识别模型进行训练。
可选地,所述装置600,还包括:图像存储模块680。
图像存储模块680,用于根据所述图像的识别结果,将所述图像存储至与所述识别结果相匹配的相册中。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图8,其示出了本申请一个实施例提供的计算机设备的结构框图。
本申请实施例中的计算机设备可以包括一个或多个如下部件:处理器810和存储器820。
处理器810可以包括一个或者多个处理核心。处理器810利用各种接口和线路连接整个计算机设备内的各个部分,通过运行或执行存储在存储器820内的指令、程序、代码集或指令集,以及调用存储在存储器820内的数据,执行计算机设备的各种功能和处理数据。可选地,处理器810可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器810可集成中央处理器(CentralProcessing Unit,CPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统和应用程序等;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器810中,单独通过一块芯片进行实现。
可选地,处理器810执行存储器820中的程序指令时实现上述各个方法实施例提供的图像识别方法。
存储器820可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。可选地,该存储器820包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器820可用于存储指令、程序、代码、代码集或指令集。存储器820可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令、用于实现上述各个方法实施例的指令等;存储数据区可存储根据计算机设备的使用所创建的数据等。
上述计算机设备的结构仅是示意性的,在实际实现时,计算机设备可以包括更多或更少的组件,比如:显示屏等,本实施例对此不作限定。
本领域技术人员可以理解,图8中示出的结构并不构成对计算机设备的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由计算机设备的处理器加载并执行以实现上述方法实施例中的各个步骤。
在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于实现上述方法。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (12)
1.一种图像识别方法,其特征在于,所述方法包括:
获取图像;
对所述图像进行边缘提取,得到所述图像的边缘图像;
根据所述边缘图像对所述图像进行边缘信息增强处理,得到边缘信息增强后的图像;
通过图像识别模型对所述边缘信息增强后的图像进行处理,得到所述图像的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述边缘图像对所述图像进行边缘信息增强处理,得到边缘信息增强后的图像,包括:
根据所述边缘图像生成权值矩阵,所述权值矩阵用于表征所述图像中各个像素对应的增强程度;
采用所述权值矩阵对所述图像进行边缘信息增强处理,得到所述边缘信息增强后的图像。
3.根据权利要求2所述的方法,其特征在于,所述根据所述边缘图像生成权值矩阵,包括:
获取所述边缘图像的边缘像素矩阵;
对所述边缘像素矩阵做归一化处理,得到所述权值矩阵。
4.根据权利要求2所述的方法,其特征在于,所述采用所述权值矩阵对所述图像进行边缘强化处理,得到所述边缘信息增强后的图像,包括:
将所述权值矩阵与所述图像对应位置像素的像素值相乘,得到加权边缘图像;
将所述加权边缘图像和所述图像在同一位置像素的像素值相加,得到所述边缘信息增强后的图像。
5.根据权利要求1所述的方法,其特征在于,所述对所述图像进行边缘提取,得到所述图像的边缘图像,包括:
对于所述图像中的任意一个像素,将所述像素的像素值分别和纵向梯度矩阵和横向梯度矩阵相乘,得到所述像素的横向梯度幅值和纵向梯度幅值;
根据所述横向梯度幅值和所述纵向梯度幅值,计算所述像素的梯度幅值;
若所述梯度幅值大于第一预设阈值,则将所述像素确定为边缘像素;
根据各个所述边缘像素的梯度幅值,得到所述边缘图像。
6.根据权利要求1所述的方法,其特征在于,所述对所述图像进行边缘提取,得到所述图像的边缘图像,包括:
对于所述图像中的任意一个像素,对所述像素求二阶导数,得到梯度幅值;
若所述梯度幅值大于第二预设阈值,则将所述像素确定为边缘像素;
根据各个所述边缘像素的梯度幅值,得到所述边缘图像。
7.根据权利要求1所述的方法,其特征在于,所述对所述图像进行边缘提取,得到所述图像的边缘图像,包括:
对所述图像进行平滑滤波处理,得到处理后的图像;
根据所述处理后的图像的横向梯度幅值和纵向梯度幅值,确定所述处理后的图像的梯度幅值和梯度方向;
保留所述处理后的图像中在所述梯度方向上具有最大梯度幅值的像素,以及删除所述处理后的图像中的其它像素,得到初始边缘图像;
保留所述初始边缘图像中的第一像素和第二像素,所述第一像素的像素值大于第三预设阈值,所述第二像素的像素值大于第四预设阈值且小于所述第三预设阈值,所述第二像素与所述第一像素相邻;
根据所述第一像素和所述第二像素各自的梯度幅值,得到所述边缘图像。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述通过图像识别模型对所述边缘信息增强后的图像进行处理,得到所述图像的识别结果之前,还包括:
获取所述图像识别模型的训练数据,所述训练数据包括至少一个训练图像和所述训练图像的标准识别结果;
对所述训练图像进行边缘提取,得到所述训练图像的边缘图像;
根据所述训练图像的边缘图像对所述训练图像进行边缘信息增强处理,得到边缘信息增强后的训练图像;
通过所述图像识别模型对所述边缘信息增强后的训练图像进行处理,得到所述训练图像的预测识别结果;
根据所述预测识别结果和所述标准识别结果,对所述图像识别模型进行训练。
9.根据权利要求1至7任一项所述的方法,其特征在于,所述通过图像识别模型对所述边缘信息增强后的图像进行处理,得到所述图像的识别结果之后,还包括:
根据所述图像的识别结果,将所述图像存储至与所述识别结果相匹配的相册中。
10.一种图像识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取图像;
图像提取模块,用于对所述图像进行边缘提取,得到所述图像的边缘图像;
图像增强模块,用于根据所述边缘图像对所述图像进行边缘信息增强处理,得到边缘信息增强后的图像;
图像识别模块,用于通过图像识别模型对所述边缘信息增强后的图像进行处理,得到所述图像的识别结果。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至9任一项所述的图像识别方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至9任一项所述的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911334327.1A CN111126254A (zh) | 2019-12-23 | 2019-12-23 | 图像识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911334327.1A CN111126254A (zh) | 2019-12-23 | 2019-12-23 | 图像识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111126254A true CN111126254A (zh) | 2020-05-08 |
Family
ID=70501342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911334327.1A Pending CN111126254A (zh) | 2019-12-23 | 2019-12-23 | 图像识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111126254A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257729A (zh) * | 2020-11-13 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、设备及存储介质 |
CN112651451A (zh) * | 2020-12-30 | 2021-04-13 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112862802A (zh) * | 2021-02-26 | 2021-05-28 | 中国人民解放军93114部队 | 基于边缘外观序列匹配的地点识别方法 |
CN113362355A (zh) * | 2021-05-31 | 2021-09-07 | 杭州萤石软件有限公司 | 一种地面材质识别方法、装置和扫地机器人 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1889124A (zh) * | 2005-06-27 | 2007-01-03 | 清华同方威视技术股份有限公司 | 一种辐射成像中图像信息增强的方法 |
US7251053B1 (en) * | 1999-08-13 | 2007-07-31 | Minolta Co., Ltd. | Image processing apparatus and method |
US20100239173A1 (en) * | 2009-03-19 | 2010-09-23 | Fujitsu Limited | Image output apparatus, edge enhancement method, and recording medium |
CN102915537A (zh) * | 2012-09-14 | 2013-02-06 | 飞依诺科技(苏州)有限公司 | 基于帧的超声图像处理方法及系统 |
CN103489188A (zh) * | 2013-09-23 | 2014-01-01 | 华南理工大学 | 一种宫颈lct图像的异常细胞核定位方法 |
CN105225209A (zh) * | 2015-10-29 | 2016-01-06 | Tcl集团股份有限公司 | 一种非均匀插值图像的锐化实现方法及系统 |
CN105225243A (zh) * | 2015-10-15 | 2016-01-06 | 徐德明 | 一种可抗噪声的图像边缘检测方法 |
CN106485727A (zh) * | 2016-09-08 | 2017-03-08 | 乐视控股(北京)有限公司 | 一种视频中物体的分割方法和装置 |
CN107871125A (zh) * | 2017-11-14 | 2018-04-03 | 深圳码隆科技有限公司 | 违章建筑识别方法、装置及电子设备 |
CN109740506A (zh) * | 2018-12-29 | 2019-05-10 | 广东三维家信息科技有限公司 | 一种户型图像识别方法及装置 |
CN109766896A (zh) * | 2018-11-26 | 2019-05-17 | 顺丰科技有限公司 | 一种相似度度量方法、装置、设备和存储介质 |
CN109903224A (zh) * | 2019-01-25 | 2019-06-18 | 珠海市杰理科技股份有限公司 | 图像缩放方法、装置、计算机设备和存储介质 |
-
2019
- 2019-12-23 CN CN201911334327.1A patent/CN111126254A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7251053B1 (en) * | 1999-08-13 | 2007-07-31 | Minolta Co., Ltd. | Image processing apparatus and method |
CN1889124A (zh) * | 2005-06-27 | 2007-01-03 | 清华同方威视技术股份有限公司 | 一种辐射成像中图像信息增强的方法 |
US20100239173A1 (en) * | 2009-03-19 | 2010-09-23 | Fujitsu Limited | Image output apparatus, edge enhancement method, and recording medium |
CN102915537A (zh) * | 2012-09-14 | 2013-02-06 | 飞依诺科技(苏州)有限公司 | 基于帧的超声图像处理方法及系统 |
CN103489188A (zh) * | 2013-09-23 | 2014-01-01 | 华南理工大学 | 一种宫颈lct图像的异常细胞核定位方法 |
CN105225243A (zh) * | 2015-10-15 | 2016-01-06 | 徐德明 | 一种可抗噪声的图像边缘检测方法 |
CN105225209A (zh) * | 2015-10-29 | 2016-01-06 | Tcl集团股份有限公司 | 一种非均匀插值图像的锐化实现方法及系统 |
CN106485727A (zh) * | 2016-09-08 | 2017-03-08 | 乐视控股(北京)有限公司 | 一种视频中物体的分割方法和装置 |
CN107871125A (zh) * | 2017-11-14 | 2018-04-03 | 深圳码隆科技有限公司 | 违章建筑识别方法、装置及电子设备 |
CN109766896A (zh) * | 2018-11-26 | 2019-05-17 | 顺丰科技有限公司 | 一种相似度度量方法、装置、设备和存储介质 |
CN109740506A (zh) * | 2018-12-29 | 2019-05-10 | 广东三维家信息科技有限公司 | 一种户型图像识别方法及装置 |
CN109903224A (zh) * | 2019-01-25 | 2019-06-18 | 珠海市杰理科技股份有限公司 | 图像缩放方法、装置、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
李光明;薛丁华;加小红;李云彤;雷涛;: "基于多尺度图像增强结合卷积神经网络的纸病识别分类" * |
李光明;薛丁华;加小红;李云彤;雷涛;: "基于多尺度图像增强结合卷积神经网络的纸病识别分类", 中国造纸, no. 08 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257729A (zh) * | 2020-11-13 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、设备及存储介质 |
CN112257729B (zh) * | 2020-11-13 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、设备及存储介质 |
CN112651451A (zh) * | 2020-12-30 | 2021-04-13 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112651451B (zh) * | 2020-12-30 | 2023-08-11 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112862802A (zh) * | 2021-02-26 | 2021-05-28 | 中国人民解放军93114部队 | 基于边缘外观序列匹配的地点识别方法 |
CN112862802B (zh) * | 2021-02-26 | 2024-05-14 | 中国人民解放军93114部队 | 基于边缘外观序列匹配的地点识别方法 |
CN113362355A (zh) * | 2021-05-31 | 2021-09-07 | 杭州萤石软件有限公司 | 一种地面材质识别方法、装置和扫地机器人 |
CN113362355B (zh) * | 2021-05-31 | 2023-06-02 | 杭州萤石软件有限公司 | 一种地面材质识别方法、装置和扫地机器人 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112750140B (zh) | 基于信息挖掘的伪装目标图像分割方法 | |
CN110738101B (zh) | 行为识别方法、装置及计算机可读存储介质 | |
CN111126254A (zh) | 图像识别方法、装置、设备及存储介质 | |
CN108154105B (zh) | 水下生物检测与识别方法、装置、服务器及终端设备 | |
CN109960742B (zh) | 局部信息的搜索方法及装置 | |
CN112651438A (zh) | 多类别图像的分类方法、装置、终端设备和存储介质 | |
WO2019033569A1 (zh) | 眼球动作分析方法、装置及存储介质 | |
CN109448007B (zh) | 图像处理方法、图像处理装置及存储介质 | |
CN108876804B (zh) | 抠像模型训练和图像抠像方法、装置和系统及存储介质 | |
CN109117857B (zh) | 一种生物属性的识别方法、装置及设备 | |
CN111935479B (zh) | 一种目标图像确定方法、装置、计算机设备及存储介质 | |
WO2023160312A1 (zh) | 基于自监督学习的行人重识别方法、装置、设备及存储介质 | |
WO2019033570A1 (zh) | 嘴唇动作分析方法、装置及存储介质 | |
CN110046574A (zh) | 基于深度学习的安全帽佩戴识别方法及设备 | |
CN110287862B (zh) | 基于深度学习的防偷拍检测方法 | |
JP6756406B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
CN105825228B (zh) | 图像识别方法及装置 | |
CN111639667B (zh) | 图像识别方法、装置、电子设备及计算机可读存储介质 | |
CN112561879B (zh) | 模糊度评价模型训练方法、图像模糊度评价方法及装置 | |
WO2019033568A1 (zh) | 嘴唇动作捕捉方法、装置及存储介质 | |
CN113298158A (zh) | 数据检测方法、装置、设备及存储介质 | |
CN112528318A (zh) | 一种图像脱敏的方法、装置及电子设备 | |
CN112001285A (zh) | 一种美颜图像的处理方法、装置、终端和介质 | |
CN112307994A (zh) | 基于扫地机的障碍物识别方法、电子装置及存储介质 | |
CN113179421A (zh) | 视频封面选择方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200508 |