CN114863189A - 一种基于大数据的图像智能识别方法 - Google Patents

一种基于大数据的图像智能识别方法 Download PDF

Info

Publication number
CN114863189A
CN114863189A CN202210784871.1A CN202210784871A CN114863189A CN 114863189 A CN114863189 A CN 114863189A CN 202210784871 A CN202210784871 A CN 202210784871A CN 114863189 A CN114863189 A CN 114863189A
Authority
CN
China
Prior art keywords
image
recognized
identified
pixel point
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210784871.1A
Other languages
English (en)
Other versions
CN114863189B (zh
Inventor
贾庆佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Off Site Market Clearing Center Co ltd
Original Assignee
Qingdao Off Site Market Clearing Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Off Site Market Clearing Center Co ltd filed Critical Qingdao Off Site Market Clearing Center Co ltd
Priority to CN202210784871.1A priority Critical patent/CN114863189B/zh
Publication of CN114863189A publication Critical patent/CN114863189A/zh
Application granted granted Critical
Publication of CN114863189B publication Critical patent/CN114863189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像识别技术领域,具体涉及一种基于大数据的图像智能识别方法。该方法包括:获得待识别物体的正视图像并进行预处理得到待识别图像,并将待识别图像进行分块;将分块后的待识别图像输入图像识别网络,输出目标识别效果图;提取待识别图像的边界轮廓信息获得其边界轮廓图像,利用目标识别效果图、待识别图像中每个像素点的特征描述子以及边界轮廓图像获得目标识别图像;将目标识别图像与待识别图像相乘获得待识别图像中的识别目标区域。本发明通过对图像识别网络中损失函数的优化,可提高目标区域的检测精度,同时结合待识别图像自身特征信息保证目标像素点识别的准确度,具有检测速度快,识别精度高,分割效果好等有益效果。

Description

一种基于大数据的图像智能识别方法
技术领域
本发明涉及图像识别技术领域,具体涉及一种基于大数据的图像智能识别方法。
背景技术
图像智能识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。现阶段图像识别技术一般分为人脸识别与商品识别,人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域。
现有的主要的图像识别方法有基于神经网络的图像识别方法、基于小波矩的图像识别方法等。传统语义分割、目标检测网络对目标进行识别检测时,网络在训练过程中不能够达到完全收敛,需要基于标签数据对网络进行反复训练,网络的训练精度不够高,该方法具有较强的人为主观性,无法根据图像本身的特征信息对目标物进行精确识别,且标签制作工作量较大,同时传统语义分割网络在进行目标识别时,分割结果多出现粘连、边缘不连续等状况,使得目标检测结果不够准确。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于大数据的图像智能识别方法,所采用的技术方案具体如下:
本发明一个实施例提供了一种基于大数据的图像智能识别方法:获得待识别物体的正视图像并进行预处理得到待识别图像,并将待识别图像进行分块获得多个相同尺寸子块,所述待识别图像为灰度图;将分块后的待识别图像输入图像识别网络,输出目标识别效果图;
利用大量待识别图像作为训练样本训练图像识别网络,具体过程为:人为构造作为训练样本的各待识别图像对应的标签图像;构建第一损失函数,所述第一损失函数为交叉熵损失函数;将各待识别图像对应的标签图像进行分块中获得相对应的子块;根据目标识别效果图和其对应的标签图像中对应的两个子块的灰度值均值、灰度值方差以及协方差获得相对应的两个子块的局部损失函数;利用待识别图像中各像素点的二阶灰度梯度构成的各像素点的特征矩阵获得各像素点的特征描述子;基于训练样本中每个待识别图像中各子块的像素点的特征描述子的均值、对应的第一损失函数值、对应的局部损失函数值获得图像识别网络的最终损失函数;
提取待识别图像的边界轮廓信息获得其边界轮廓图像,利用目标识别效果图、待识别图像中每个像素点的特征描述子以及边界轮廓图像获得目标识别图像;将目标识别图像与待识别图像相乘获得待识别图像中的识别目标区域。
优选地,获得待识别物体的正视图像并进行预处理获得待识别图像包括:对获得的待识别物体的正视图像进行高斯滤波和伽马变换处理,并对处理后的图像灰度化获得待识别图像。
优选地,图像识别网络的结构为编码器-解码器的网络结构。
优选地,局部损失函数为:
Figure 523984DEST_PATH_IMAGE001
其中,
Figure 306126DEST_PATH_IMAGE002
表示目标识别效果图和其对应的标签图像中相对应的第i个子块的局部损失函数;
Figure 461164DEST_PATH_IMAGE003
Figure 527209DEST_PATH_IMAGE004
分别为大于0的超参数;
Figure 109500DEST_PATH_IMAGE005
为目标识别效果图中第i个子块的灰度值均值;
Figure 769152DEST_PATH_IMAGE006
表示目标识别效果图中第i个子块在标签图像中对应的子块的灰度值均值;
Figure 836203DEST_PATH_IMAGE007
表示目标识别效果图和其对应的标签图像中相对应的第i个子块的协方差;
Figure 897700DEST_PATH_IMAGE008
表示目标识别效果图中第i个子块的灰度值方差的平方;
Figure 916471DEST_PATH_IMAGE009
表示目标识别效果图中第i个子块在标签图像中对应的子块的灰度值方差的平方。
优选地,特征矩阵包括:利用水平方向上和竖直方向上的scharr算子模板对待识别图像进行处理获得图像中每个像素点的4个二阶灰度梯度组成特征矩阵。
优选地,获得各像素点的特征描述子包括:获得待识别图像中各像素点的特征矩阵的特征值,所述各像素点的特征矩阵的特征值的平方的和的算术平方根为各像素点的特征描述子,并对特征描述子进行归一化。
优选地,最终损失函数为:
Figure 922473DEST_PATH_IMAGE010
其中,L表示最终损失函数;
Figure 419314DEST_PATH_IMAGE011
表示训练样本共有
Figure 335317DEST_PATH_IMAGE011
个待识别图像;
Figure 134777DEST_PATH_IMAGE012
表示第k个待识别图像中第i个子块的特征描述子的均值;
Figure 769021DEST_PATH_IMAGE013
表示示第k个待识别图像中第i个子块对应的第一损失函数值;
Figure 69552DEST_PATH_IMAGE014
表示第k个待识别图像中第i个子块对应的局部损失函数值。
优选地,利用目标识别效果图、待识别图像中每个像素点的特征描述子以及边界轮廓图像获得目标识别图像包括:预设值与待识别图像中每个像素点的特征描述子的差值为目标识别效果图中与待识别图像相同位置的每个像素点的权值;待识别图像中每个像素点的特征描述子为边界轮廓图像中与待识别图像相同位置的每个像素点的权值;目标识别图像中每个像素点的灰度值为将目标效果识别图中每个像素点的权值和灰度值乘积,与边界轮廓图像中每个像素点的权值和灰度值乘积相加的结果。
本发明实施例至少具有如下有益效果:本发明基于大量的待识别图像作为训练样本训练图像识别网络,同时基于待识别图像的子块对应的局部损失函数和每个子块的特征描述子的均值对图像识别网络的损失函数进行优化,达到了对图像识别网络的优化,提高了待识别图像中目标区域的检测精度,同时结合待识别图像自身的特征信息保证了目标像素点识别的准确度,因此本发明具有检测速度快,识别精度高,分割效果好等有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为一种基于大数据的图像智能识别方法的方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于大数据的图像智能识别方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于大数据的图像智能识别方法的具体方案。
实施例1:
本发明的主要应用场景为:本发明采集大量的待识别物体的图像数据训练图像识别神经网络,利用训练好的神经网络识别图像数据。
请参阅图1,其示出了本发明一个实施例提供的一种基于大数据的图像智能识别方法的方法流程图,该方法包括以下步骤:
步骤一,获得待识别物体的正视图像并进行预处理得到待识别图像,并将待识别图像进行分块获得多个相同尺寸子块,所述待识别图像为灰度图;将分块后的待识别图像输入图像识别网络,输出目标识别效果图。
本发明将设置图像采集设备,用于获取大量的图像数据,对后续网络进行训练,同时所述图像采集设备用于对待识别的图像数据进行采集,作为图像识别的基准数据。所述图像采集设备包括相机、光源、固定台等,待识别物品放置于固定台上,所述相机镜头处于固定台的正上方,俯视视角对固定台上的物品进行图像采集,以获取待识别物品的正视图像,所述光源部署与固定台的四周,以保证固定台上物品表面的光照。
基于所述图像采集设备即可实现对物品图像进行采集,为保证图像中的目标识别精度,本发明将进一步对所采集的图像数据进行高斯滤波处理,以消除图像中的噪点,避免噪声影响,同时,对待识别图像进行处理以提高图像的对比度,提高图像对比度的现有算法有很多:伽马变换、对数变换、直方图均衡化等,实施者可自行选取,优选地,本实施例中通过伽马变换来提高图像的对比度,以便后续对目标的准确识别,同时还需要对采集的图像数据进行灰度化,将采集的经过预处理并灰度化的图像数据记为待识别图像。
进一步的为了方便分析需要将待识别图像进行分块,将待识别图像分为尺寸相同的子块;至此,获得了大量的待识别图像,并对待识别图像进行了分块。分好块后,将分块的待识别图像输入图像识别网络,输出目标识别效果图,需要说明的是目标识别效果图中也有相应的与待识别图像中相同的子块。
步骤二,利用大量待识别图像作为训练样本训练图像识别网络,具体过程为:人为构造作为训练样本的各待识别图像对应的标签图像;构建第一损失函数,所述第一损失函数为交叉熵损失函数;将各待识别图像对应的标签图像进行分块中获得相对应的子块;根据目标识别效果图和其对应的标签图像中对应的两个子块的灰度值均值、灰度值方差以及协方差获得相对应的两个子块的局部损失函数;利用待识别图像中各像素点的二阶灰度梯度构成的各像素点的特征矩阵获得各像素点的特征描述子;基于训练样本中每个待识别图像中各子块的像素点的特征描述子的均值、对应的第一损失函数值、对应的局部损失函数值获得图像识别网络的最终损失函数。
通过图像采集设备可获取大量的图像数据,并对这些图像数据进行处理,获得大量的待识别图像,用于图像中的目标区域进行识别,本发明通过结合传统语义分割网络及图像自身属性,将建立图像识别网络,实现对图像目标区域的自动智能识别,所述图像识别网络具体为:
首先,本发明设置图像识别网络对待识别图像中的目标区域的像素点进行识别,利用大量的待识别图像作为训练样本对图像识别网络进行训练;所述图像识别网络的结构为传统的编码器-解码器的网络结构,编码器用于对待识别图像进行下采样,采集待识别图像中的特征,解码器用于对待识别图像进行上采样,以获取与原图尺寸大小相同的语义分割图像,对于网络标签,人为的进行标签图像的制作,其中,每个待识别图像都会对应一个标签图像,对于待识别图像,本实施例待识别图像中背景区域像素点的灰度值设置为0,架构目标区域像素点的灰度值设置为1。
接着,对图像识别网络的损失函数进行构建,先将传统的语义分割网络对应的交叉熵损失函数作为图像识别网络的第一损失函数
Figure 699116DEST_PATH_IMAGE015
,用于对像素点的类别进行识别;为避免传统语义分割网络的精度不高问题,本实施例将进一步的建立局部损失函数,首先将待识别图像对应的标签图像进行分块,分成多个尺寸相同的子块,标签图像分成的子块尺寸与待识别图像分成的子块的尺寸相同;对于待识别图像和标签图像的每个子块,本发明将对其内部分布状况进行分析,对于待识别图像
Figure 59691DEST_PATH_IMAGE016
对应的标签图像中的两个对应的子块,待识别图像输入图像识别网络后,输出目标识别效果图,由于待识别网络是分块后输入的,则目标识别效果图输出的时候也是分好块的;计算网络输出的目标识别效果图中第i个子块内的像素点的灰度值均值
Figure 181230DEST_PATH_IMAGE005
和像素点的灰度值方差
Figure 128196DEST_PATH_IMAGE017
,同理计算输出的目标识别效果图对应的标签图像中与第i个子块对应的子块内像素点的灰度值均值
Figure 18791DEST_PATH_IMAGE006
和像素点的灰度值方差
Figure 550267DEST_PATH_IMAGE018
,同时,获取这两个子块之间的协方差
Figure 752578DEST_PATH_IMAGE007
,用于表征两个对应子块分布的相关性:
Figure 660491DEST_PATH_IMAGE019
其中,
Figure 405593DEST_PATH_IMAGE020
为输出的目标识别效果图中第i个子块中第j个像素点的灰度值,
Figure 107970DEST_PATH_IMAGE021
表示对应的标签图像中与目标识别效果图中第i个子块对应的子块中第j个像素点的灰度值,其中J表示子块中像素点的数量。进而基于对应子块内部的结构分布信息构建局部损失函数,以使得图像识别网络能够学习标签图像中各子块的局部分布特征,所述局部损失函数具体为:
Figure 548310DEST_PATH_IMAGE001
其中,
Figure 728755DEST_PATH_IMAGE002
表示目标识别效果图和其对应的标签图像中相对应的第i个子块的局部损失函数;
Figure 452998DEST_PATH_IMAGE003
Figure 326276DEST_PATH_IMAGE004
分别为大于0的超参数,优选地,在本实施例中
Figure 644125DEST_PATH_IMAGE003
Figure 628261DEST_PATH_IMAGE004
的取值都为1;
Figure 456278DEST_PATH_IMAGE005
为目标识别效果图中第i个子块的灰度值均值;
Figure 500457DEST_PATH_IMAGE006
表示目标识别效果图中第i个子块在标签图像中对应的子块的灰度值均值;
Figure 305602DEST_PATH_IMAGE007
表示目标识别效果图和其对应的标签图像中相对应的第i个子块的协方差;
Figure 218063DEST_PATH_IMAGE022
表示目标识别效果图中第i个子块的灰度值方差的平方;
Figure 526685DEST_PATH_IMAGE009
表示目标识别效果图中第i个子块在标签图像中对应的子块的灰度值方差的平方。
基于所述局部损失函数可得,当局部子块中包含边界轮廓信息时,所述局部损失函数值才存在;当子块中不包含边界轮廓信息时,则局部子块内各个像素点之间几乎不存在灰度梯度变化,也即两个对应的子块方差均为零,在网络训练过程中,子块中不包含边界信息对应的局部损失函数值近乎为零,因此,在进行网络的训练过程中,基于本发明所述局部损失函数可进一步提高图像中的边界轮廓特征信息的显著性,使得网络更加关注图像中的边界以及轮廓信息。局部损失函数
Figure 741765DEST_PATH_IMAGE002
越小,也即识别网络的识别效果图中的子块与标签图像中的对应子块之间的局部分布相似度越高。获取各个局部子块的局部损失函数值,各个局部损失函数值均达到最小,也即包含边界轮廓信息的局部子块的损失函数值最小,本发明所述方法可实现对目标区域边界轮廓信息进行准确提取识别。
进一步,为了保证图像识别的精度,本发明将对待识别图像自身特征属性进行分析,以获取图像中各个像素点的特征信息,首先,本发明将对待识别图像
Figure 643993DEST_PATH_IMAGE016
中的各个像素点构建特征描述子,用于对像素点的特征属性进行表征,实现对像素点的分布特征进行检测,所述特征描述子具体为:通过x与y两个方向的两个scharr算子模板对待识别图像进行卷积处理,所述模板分别为:
Figure 969933DEST_PATH_IMAGE023
Figure 398640DEST_PATH_IMAGE024
,通过两个方向的
Figure 909256DEST_PATH_IMAGE025
算子模板对图像中的各个像素点进行卷积操作,获得各个像素点的一阶灰度梯度
Figure 688993DEST_PATH_IMAGE026
Figure 553044DEST_PATH_IMAGE027
,利用一阶灰度梯度进行边界轮廓信息检测大多数会出现检测不准确的情况,为实现对图像中像素点的分布状况进行准确检测,提取图像像素点的特征属性,本发明将对所提取的一阶灰度梯度的基础上进行再次卷积,以获取图像灰度梯度的变化程度,以便准确对图像中像素点的分布特征进行表征,更加精确的提取图像中的纹理分布信息。
对于待识别图像
Figure 204299DEST_PATH_IMAGE016
,本发明将基于一阶灰度梯度进一步获取二阶灰度梯度,以便对像素点的特征描述子进行构建,本发明设置:
Figure 26762DEST_PATH_IMAGE028
Figure 762637DEST_PATH_IMAGE029
Figure 555012DEST_PATH_IMAGE030
Figure 958312DEST_PATH_IMAGE031
对于待识别图像中的各像素点,本发明将基于二阶灰度梯度
Figure 686096DEST_PATH_IMAGE032
Figure 784633DEST_PATH_IMAGE033
Figure 521645DEST_PATH_IMAGE034
Figure 779451DEST_PATH_IMAGE035
构建各像素点的特征矩阵
Figure 537192DEST_PATH_IMAGE036
Figure 513238DEST_PATH_IMAGE037
其中,
Figure 788362DEST_PATH_IMAGE036
表示在
Figure 900674DEST_PATH_IMAGE038
处像素点的特征矩阵,获得特征矩阵的特征值
Figure 344163DEST_PATH_IMAGE039
Figure 541926DEST_PATH_IMAGE040
,并基于此构建特征描述子
Figure 620740DEST_PATH_IMAGE041
Figure 977772DEST_PATH_IMAGE042
其中需要对每个像素点的特征描述子进行归一化处理,保证其值处于[0,1]之间。所述描述子可对像素点的灰度梯度的变化情况,所述特征描述子越大,则认为对应像素点所包含的信息量越多,也即该像素点处的纹理分布越复杂。根据本发明所述方法获取各个像素点特征描述子,用于对图像像素点的分布状况进行表征。
最后,基于所述特征描述子,本发明将对图像识别网络的损失函进行构建优化,图像识别网络的最终损失函数具体为:
Figure 952681DEST_PATH_IMAGE010
其中,L表示最终损失函数;
Figure 903320DEST_PATH_IMAGE011
表示训练样本共有
Figure 130033DEST_PATH_IMAGE011
个待识别图像;
Figure 216938DEST_PATH_IMAGE012
表示第k个待识别图像中第i个子块的特征描述子的均值;
Figure 628327DEST_PATH_IMAGE013
表示示第k个待识别图像中第i个子块对应的第一损失函数值;
Figure 659737DEST_PATH_IMAGE014
表示第k个待识别图像中第i个子块对应的局部损失函数值。基于所构建的最终损失函数对图像识别网络进行训练监督,迭代更新训练网络参数,以保证网络收敛,提高网络的识别精度。
至此,可以完成图像识别网络的训练,通过训练完成的图像识别网络可以对待识别图像中的目标区域进行识别,输出目标识别效果图
Figure 80354DEST_PATH_IMAGE043
步骤三,提取待识别图像的边界轮廓信息获得其边界轮廓图像,利用目标识别效果图、待识别图像中每个像素点的特征描述子以及边界轮廓图像获得目标识别图像;将目标识别图像与待识别图像相乘获得待识别图像中的识别目标区域。
首先,本发明将基于待识别图像自身特征属性对待识别图像中的目标区域进行检测,通过本发明所采集的待识别图像数据,本发明将采用Laplacian算子提取待识别图像的边界轮廓信息,得到对应的边界轮廓图像
Figure 21766DEST_PATH_IMAGE044
,本发明将基于边界轮廓图像以及图像识别网络输出的目标识别效果图
Figure 977958DEST_PATH_IMAGE043
,对图像识别进行进一步的优化,以保证图像智能识别的精度。
进一步的,利用目标识别效果图、待识别图像中每个像素点的特征描述子以及边界轮廓图像获得目标识别图像,具体为:预设值与待识别图像中每个像素点的特征描述子的差值为目标识别效果图中与待识别图像相同位置的每个像素点的权值;待识别图像中每个像素点的特征描述子为边界轮廓图像中与待识别图像相同位置的每个像素点的权值;目标识别图像中每个像素点的灰度值为将目标效果识别图中每个像素点的权值和灰度值乘积,与边界轮廓图像中每个像素点的权值和灰度值乘积相加的结果;其中预设值为1,利用公式表示为:
Figure 637610DEST_PATH_IMAGE045
其中,
Figure 596338DEST_PATH_IMAGE046
表示目标识别图像,
Figure 516890DEST_PATH_IMAGE047
表示预设值,
Figure 535661DEST_PATH_IMAGE041
表示
Figure 417030DEST_PATH_IMAGE038
处像素点的特征描述子。
最后,基于步骤二的图像识别网络,输入待识别图像,获得其对应的目标识别效果图,然后利用Laplacian算子得到对应的边界轮廓图像,根据目标识别效果图和边界轮廓图像获得目标识别图像;将得到的目标识别图像作为掩膜,与待识别图像进行相乘操作,即可得到待识别图像中的目标区域,实现对图像中目标区域的自动智能识别。
至此,即可通过本发明所述方法实现图像中的目标区域进行检测识别,本发明通过对图像识别网络中损失函数的优化,可提高目标区域的检测精度,同时结合图像自身特征信息保证目标像素点识别的准确度,本发明具有检测速度快,识别精度高等有益效果。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于大数据的图像智能识别方法,其特征在于,该方法包括:获得待识别物体的正视图像并进行预处理得到待识别图像,并将待识别图像进行分块获得多个相同尺寸子块,所述待识别图像为灰度图;将分块后的待识别图像输入图像识别网络,输出目标识别效果图;
利用多个待识别图像作为训练样本训练图像识别网络,具体过程为:人为构造作为训练样本的各待识别图像对应的标签图像;构建第一损失函数,所述第一损失函数为交叉熵损失函数;将各待识别图像对应的标签图像进行分块中获得相对应的子块;根据目标识别效果图和其对应的标签图像中对应的两个子块的灰度值均值、灰度值方差以及协方差获得相对应的两个子块的局部损失函数;利用待识别图像中各像素点的二阶灰度梯度构成的各像素点的特征矩阵获得各像素点的特征描述子;基于训练样本中每个待识别图像中各子块的像素点的特征描述子的均值、对应的第一损失函数值、对应的局部损失函数值获得图像识别网络的最终损失函数;
提取待识别图像的边界轮廓信息获得其边界轮廓图像,利用目标识别效果图、待识别图像中每个像素点的特征描述子以及边界轮廓图像获得目标识别图像;将目标识别图像与待识别图像相乘获得待识别图像中的识别目标区域。
2.根据权利要求1所述的一种基于大数据的图像智能识别方法,其特征在于,所述获得待识别物体的正视图像并进行预处理获得待识别图像包括:对获得的待识别物体的正视图像进行高斯滤波和伽马变换处理,并对处理后的图像灰度化获得待识别图像。
3.根据权利要求1所述的一种基于大数据的图像智能识别方法,其特征在于,所述图像识别网络的结构为编码器-解码器的网络结构。
4.根据权利要求1所述的一种基于大数据的图像智能识别方法,其特征在于,所述局部损失函数为:
Figure 89972DEST_PATH_IMAGE001
其中,
Figure 740396DEST_PATH_IMAGE002
表示目标识别效果图和其对应的标签图像中相对应的第i个子块的局部损失函数;
Figure 789123DEST_PATH_IMAGE003
Figure 157788DEST_PATH_IMAGE004
分别为大于0的超参数;
Figure 458319DEST_PATH_IMAGE005
为目标识别效果图中第i个子块的灰度值均值;
Figure 337151DEST_PATH_IMAGE006
表示目标识别效果图中第i个子块在标签图像中对应的子块的灰度值均值;
Figure 697725DEST_PATH_IMAGE007
表示目标识别效果图和其对应的标签图像中相对应的第i个子块的协方差;
Figure 553686DEST_PATH_IMAGE008
表示目标识别效果图中第i个子块的灰度值方差的平方;
Figure 516963DEST_PATH_IMAGE009
表示目标识别效果图中第i个子块在标签图像中对应的子块的灰度值方差的平方。
5.根据权利要求1所述的一种基于大数据的图像智能识别方法,其特征在于,所述特征矩阵包括:利用水平方向上和竖直方向上的scharr算子模板对待识别图像进行处理获得图像中每个像素点的4个二阶灰度梯度组成特征矩阵。
6.根据权利要求1所述的一种基于大数据的图像智能识别方法,其特征在于,所述获得各像素点的特征描述子包括:获得待识别图像中各像素点的特征矩阵的特征值,所述各像素点的特征矩阵的特征值的平方的和的算术平方根为各像素点的特征描述子,并对特征描述子进行归一化。
7.根据权利要求1所述的一种基于大数据的图像智能识别方法,其特征在于,所述最终损失函数为:
Figure 407558DEST_PATH_IMAGE010
其中,L表示最终损失函数;
Figure 939034DEST_PATH_IMAGE011
表示训练样本共有
Figure 892078DEST_PATH_IMAGE011
个待识别图像;
Figure 534411DEST_PATH_IMAGE012
表示第k个待识别图像中第i个子块的特征描述子的均值;
Figure 279514DEST_PATH_IMAGE013
表示示第k个待识别图像中第i个子块对应的第一损失函数值;
Figure 106524DEST_PATH_IMAGE014
表示第k个待识别图像中第i个子块对应的局部损失函数值。
8.根据权利要求1所述的一种基于大数据的图像智能识别方法,其特征在于,所述利用目标识别效果图、待识别图像中每个像素点的特征描述子以及边界轮廓图像获得目标识别图像包括:预设值与待识别图像中每个像素点的特征描述子的差值为目标识别效果图中与待识别图像相同位置的每个像素点的权值;待识别图像中每个像素点的特征描述子为边界轮廓图像中与待识别图像相同位置的每个像素点的权值;目标识别图像中每个像素点的灰度值为将目标效果识别图中每个像素点的权值和灰度值乘积,与边界轮廓图像中每个像素点的权值和灰度值乘积相加的结果。
CN202210784871.1A 2022-07-06 2022-07-06 一种基于大数据的图像智能识别方法 Active CN114863189B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210784871.1A CN114863189B (zh) 2022-07-06 2022-07-06 一种基于大数据的图像智能识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210784871.1A CN114863189B (zh) 2022-07-06 2022-07-06 一种基于大数据的图像智能识别方法

Publications (2)

Publication Number Publication Date
CN114863189A true CN114863189A (zh) 2022-08-05
CN114863189B CN114863189B (zh) 2022-09-02

Family

ID=82627011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210784871.1A Active CN114863189B (zh) 2022-07-06 2022-07-06 一种基于大数据的图像智能识别方法

Country Status (1)

Country Link
CN (1) CN114863189B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116386118A (zh) * 2023-04-17 2023-07-04 广州番禺职业技术学院 一种基于人像识别的粤剧匹配化妆系统及其方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699900A (zh) * 2021-01-05 2021-04-23 东北林业大学 一种改进YOLOv4的交通标志识别方法
US20210133479A1 (en) * 2019-11-05 2021-05-06 Beijing University Of Posts And Telecommunications Fine-grained image recognition method, electronic device and storage medium
CN113361533A (zh) * 2021-05-19 2021-09-07 山东师范大学 重叠遮挡的目标物的分割识别方法及系统
CN113723457A (zh) * 2021-07-28 2021-11-30 浙江大华技术股份有限公司 图像识别方法和装置、存储介质及电子装置
CN114511758A (zh) * 2022-01-28 2022-05-17 北京百度网讯科技有限公司 图像识别方法及装置、电子设备和介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210133479A1 (en) * 2019-11-05 2021-05-06 Beijing University Of Posts And Telecommunications Fine-grained image recognition method, electronic device and storage medium
CN112699900A (zh) * 2021-01-05 2021-04-23 东北林业大学 一种改进YOLOv4的交通标志识别方法
CN113361533A (zh) * 2021-05-19 2021-09-07 山东师范大学 重叠遮挡的目标物的分割识别方法及系统
CN113723457A (zh) * 2021-07-28 2021-11-30 浙江大华技术股份有限公司 图像识别方法和装置、存储介质及电子装置
CN114511758A (zh) * 2022-01-28 2022-05-17 北京百度网讯科技有限公司 图像识别方法及装置、电子设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116386118A (zh) * 2023-04-17 2023-07-04 广州番禺职业技术学院 一种基于人像识别的粤剧匹配化妆系统及其方法
CN116386118B (zh) * 2023-04-17 2024-04-05 广州番禺职业技术学院 一种基于人像识别的粤剧匹配化妆系统及其方法

Also Published As

Publication number Publication date
CN114863189B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN113592845A (zh) 一种电池涂布的缺陷检测方法及装置、存储介质
Sugiarto et al. Wood identification based on histogram of oriented gradient (HOG) feature and support vector machine (SVM) classifier
CN108537751B (zh) 一种基于径向基神经网络的甲状腺超声图像自动分割方法
CN114549981A (zh) 一种基于深度学习的智能巡检指针式仪表识别及读数方法
CN111079620A (zh) 基于迁移学习的白细胞图像检测识别模型构建方法及应用
CN114863189B (zh) 一种基于大数据的图像智能识别方法
Tereikovskyi et al. The method of semantic image segmentation using neural networks
CN111178405A (zh) 一种融合多种神经网络的相似物体识别方法
CN110991374B (zh) 一种基于rcnn的指纹奇异点检测方法
CN117351371A (zh) 一种基于深度学习的遥感图像目标检测方法
CN115953666B (zh) 一种基于改进Mask-RCNN的变电站现场进度识别方法
Guo et al. Fault diagnosis of power equipment based on infrared image analysis
CN113313678A (zh) 一种基于多尺度特征融合的精子形态学自动分析方法
CN117275130B (zh) 基于人脸识别的智慧门禁验证系统
CN115359346B (zh) 基于街景图片的小微空间识别方法、装置及电子设备
CN117173485B (zh) 一种肺癌组织病理图像的智能分类系统方法及系统
Taufik et al. Identification of Plant Types Based on Leaf Image Using Convolutional Neural Network (CNN)
Sun et al. Invariant 2D object recognition using KRA and GRA
Chen et al. Automatic detection of microfabric defects with Gabor fractal network
Joseph et al. Harvestable Black Pepper Recognition Using Computer Vision
Selvaraj et al. Leaf Recognition using Multilayer Perceptron
CN115471494A (zh) 基于图像处理的沃柑质检方法、装置、装备及存储介质
CN116468932A (zh) 基于图像识别的算法结构分析方法
CN117315473A (zh) 一种基于改进YOLOv8的草莓成熟度检测方法及系统
CN118032789A (zh) 基于机器视觉的手表外壳表面检测系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant