CN110781956A - 一种目标检测的方法、装置、电子设备及可读存储介质 - Google Patents

一种目标检测的方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN110781956A
CN110781956A CN201911018536.5A CN201911018536A CN110781956A CN 110781956 A CN110781956 A CN 110781956A CN 201911018536 A CN201911018536 A CN 201911018536A CN 110781956 A CN110781956 A CN 110781956A
Authority
CN
China
Prior art keywords
image sample
target detection
target
pixel
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911018536.5A
Other languages
English (en)
Inventor
孟亚洲
史腾飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing second hand Artificial Intelligence Technology Co.,Ltd.
Original Assignee
Jingshuo Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingshuo Technology Beijing Co Ltd filed Critical Jingshuo Technology Beijing Co Ltd
Priority to CN201911018536.5A priority Critical patent/CN110781956A/zh
Publication of CN110781956A publication Critical patent/CN110781956A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种目标检测的方法、装置、电子设备及可读存储介质,所述方法包括:获取各个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;像素矩阵由各个像素点的像素值按照像素点排列方式排列得到,初始权重向量用于表示每个像素点与目标像素点之间的初始相关度;基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;基于训练好的目标检测模型对待检测图像进行目标检测。通过学习检测图像样本中的像素点与目标像素点之间的相关度训练得到目标检测模型,实现了对目标的准确检测的同时,还无需增加模型层数,检测效率较高。

Description

一种目标检测的方法、装置、电子设备及可读存储介质
技术领域
本发明涉及目标检测的技术领域,具体而言,涉及一种目标检测的方法、装置、电子设备及可读存储介质。
背景技术
目标检测技术是计算机视觉研究领域的重要课题,可以应用在例如视频监控、图像遥感等各种技术领域中。近几年,卷积神经网络被应用在目标检测任务上取得了显著的效果,从而引起科研人员对于卷积神经网络的模型的研究兴趣。
现有的目标检测算法是通过卷积神经网络进行训练,卷积神经网络本身具有特征提取、特征选择和特征分类的功能,直接利用卷积神经网络对视频中的各帧图像进行特征提取,并分别进行候选框采样,判断候选框内的视频是否为待检测目标。
为了提升目标检测的准确度,大多数时候是通过增加神经网络模型的层数来实现,但增加的模型层数会使得网络计算的参数量增加,运算时间变长,从而导致目标的检测效率较低。
发明内容
有鉴于此,本发明的目的在于提供一种目标检测的方法、装置、电子设备及可读存储介质,通过学习检测图像样本中的像素点与目标像素点之间的相关度训练得到目标检测模型,实现了对目标的准确检测的同时,还无需增加模型层数,检测效率较高。
第一方面,本发明实施例提供了一种目标检测的方法,所述方法包括:
获取各个检测图像样本;
针对每个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;所述像素矩阵由检测图像样本中各个像素点的像素值按照像素点排列方式排列得到;所述初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度;所述目标像素点为所述检测图像样本中目标物所对应的像素点;
基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;
基于训练好的目标检测模型对待检测图像进行目标检测。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,通过以下步骤确定初始权重向量:
针对每个检测图像样本,确定该检测图像样本中每个像素点的像素值;
基于各个像素点的像素值以及预设归一化参数,确定各个像素点对应的初始权重值;
将各个像素点对应的初始权重值进行组合,得到与该检测图像样本对应的初始权重向量。
结合第一方面或第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型,包括:
针对每个检测图像样本,确定所述像素矩阵与所述初始权重向量之间的初始乘积量;
将所述像素矩阵与所述初始权重向量之间的初始乘积量输入至待训练的目标检测模型中,得到模型输出的标注信息;
将模型输出的标注信息与该检测图像样本的预先标注信息进行对比,若对比不一致,则调整所述初始权重向量,直至对比一致时,停止调整,得到训练好的目标检测模型。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述目标检测模型包括卷积提取层、池化提取层和输出层;所述将所述像素矩阵与所述初始权重向量之间的初始乘积量输入至待训练的目标检测模型中,得到模型输出的标注信息,包括:
将所述像素矩阵与所述初始权重向量之间的初始乘积量输入至待训练的目标检测模型包括的卷积提取层,得到卷积特征向量;
将所述卷积特征向量输入至所述池化提取层,得到池化特征向量;
将所述池化特征向量输入至所述输出层,得到输出的标注信息。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述将模型输出的标注信息与该检测图像样本的预先标注信息进行对比,若对比不一致,则调整所述初始权重向量,直至对比一致时,停止调整,得到训练好的目标检测模型,包括:
将模型输出的标注信息与该检测图像样本的预先标注信息进行对比;
若对比不一致,则将所述模型输出的标注信息与预先标注信息之间的比对结果反馈至待训练的目标检测模型;
调节该目标检测模型的参数以及所述检测图像样本对应的初始权重向量,直至模型输出的标注信息与该检测图像样本的预先标注信息对比一致,停止调整,得到训练好的目标检测模型。
结合第一方面、第一方面的第一种至第四种可能的实施方式中的任一种,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述基于训练好的目标检测模型对待检测图像进行目标检测,包括:
获取待检测图像;
将所述待检测图像输入训练好的目标检测模型中,得到目标检测结果。
第二方面,本发明实施例还提供了一种目标检测的装置,所述装置包括:
获取模块,用于获取各个检测图像样本;
确定模块,用于针对每个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;所述像素矩阵由检测图像样本中各个像素点的像素值按照像素点排列方式排列得到;所述初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度;所述目标像素点为所述检测图像样本中目标物所对应的像素点;
训练模块,用于基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;
检测模块,用于基于训练好的目标检测模型对待检测图像进行目标检测。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述检测模块包括:
获取单元,用于获取待检测图像;
执行单元,用于将所述待检测图像输入训练好的目标检测模型中,得到目标检测结果。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行如第一方面、第一方面的第一种至第五种可能的实施方式中任一所述目标检测的方法中的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面、第一方面的第一种至第五种可能的实施方式中任一所述目标检测的方法中的步骤。
本发明实施例提供的目标检测方法、装置、电子设备及可读存储介质,与相关技术中通过增加神经网络模型的层数来实现目标检测的方法,由于增加的模型层数会使得网络计算的参数量增加,运算时间变长,导致目标的检测效率较低相比,其首先获取各个检测图像样本;然后针对每个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;像素矩阵由检测图像样本中各个像素点的像素值按照像素点排列方式排列得到;初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度;目标像素点为检测图像样本中目标物所对应的像素点;进而基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;最后基于训练好的目标检测模型对待检测图像进行目标检测。本发明所训练得到的目标检测模型由于学习了检测图像样本中的像素点与目标像素点之间的相关度而使得该目标检测模型能够准确的对目标或非目标进行识别,也即,一个像素点与目标物所属像素点的相关度越高,说明该像素点被识别为目标像素点的概率也就越大,从而提升了目标检测的准确度,这样,利用训练得到的目标检测模型直接可以对待检测图像进行目标检测,达到较高的检测效率。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的一种目标检测的方法的流程图;
图2示出了本发明实施例所提供的另一种目标检测的方法的流程图;
图3示出了本发明实施例所提供的另一种目标检测的方法的流程图;
图4示出了本发明实施例所提供的另一种目标检测的方法的流程图;
图5示出了本发明实施例所提供的另一种目标检测的方法的流程图;
图6示出了本发明实施例所提供的另一种目标检测的方法的流程图;
图7示出了本发明实施例所提供的一种目标检测的装置的结构示意图;
图8示出了本发明实施例所提供的一种电子设备的结构示意图。
主要元件符号说明:
70-目标检测的装置;701-获取模块;702-确定模块;703-训练模块;704-检测模块;80-电子设备;801-处理器;802-存储器;803-总线。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到相关技术中为了提升目标检测的准确度,通过增加神经网络模型的层数来实现,但增加的模型层数会使得网络计算的参数量增加,运算时间变长,导致目标的检测效率较低。基于此,本发明实施例提供了一种目标检测的方法、装置、电子设备及可读存储介质,通过学习检测图像样本中的像素点与目标像素点之间的相关度训练得到目标检测模型,实现了对目标的准确检测的同时,还无需增加模型层数,检测效率较高。
参见图1所示的本发明实施例提供的目标检测的方法的流程图,所述方法具体包括如下步骤:
S101、获取各个检测图像样本;
具体地,检测图像样本是事先收集好的若干个图像,每个图像表示一个检测图像样本;各个检测图像样本包括一种目标物或多种目标物,比如一个检测图像样本中包括人和车,则人和车都可以是目标物,即一个检测图像样本中包括两种目标物;无论检测图像样本上的目标物有几种,都可以应用本发明实施例所提供的目标检测的方法进行目标物的检测。下面以各个检测图像样本只包括一种目标物为例,而各个检测图像样本包括多种目标物的目标检测的方法与各个检测图像样本只包括一种目标物的目标检测的方法相同,后面将不再赘述。
S102、针对每个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;像素矩阵由检测图像样本中各个像素点的像素值按照像素点排列方式排列得到;初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度;目标像素点为检测图像样本中目标物所对应的像素点;
具体的,在对检测图像样本预处理时,初始权重向量是随机确认的,此时,检测图像样本中的每个像素点与目标像素点之间的初始相关度可能很小;同时,初始权重向量也构成了与像素矩阵的维数相同的矩阵,进而便于对检测图像样本做像素级别的处理。
其中,本发明实施例的像素点排列方式采用普通的RGB排列方式,即一个像素点平均分为三个部分——红、绿、蓝的三原色排列方式。
S103、基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;
具体地,将每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息作为输入,进而待训练的目标检测模型对输入的内容进行训练,检测图像样本对应的像素矩阵携带检测图像样本的预先标注信息,预先标注信息表示预先标记的目标像素点的位置信息,初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度,通过检测图像样本对应的像素矩阵与初始权重向量做乘积处理,可以得到检测图像样本上目标像素点的位置信息,通过目标检测模型不断的对初始权重向量进行训练,并将训练中的检测图像样本上目标像素点的位置信息与预先标记的目标像素点的位置信息进行比对,不断的调整初始权重向量,直至训练中的检测图像样本上目标像素点的位置信息与预先标记的目标像素点的位置信息比对一致,停止训练,完成对目标检测模型的训练。
S104、基于训练好的目标检测模型对待检测图像进行目标检测。
具体地,当目标检测模型训练完后,直接将待检测图像输入到训练好的目标检测模型中即可实现对待检测图像的检测,其中,检测结果包括待检测图像中是否包括目标物,以及当存在目标物时,目标物的位置。
本发明实施例提供的目标检测的方法,与相关技术中通过增加神经网络模型的层数来实现目标检测的方法,由于增加的模型层数会使得网络计算的参数量增加,运算时间变长,导致目标的检测效率较低相比,本发明所训练得到的目标检测模型由于学习了检测图像样本中的像素点与目标像素点之间的相关度而使得该目标检测模型能够准确的对目标或非目标进行识别,也即,一个像素点与目标物所属像素点的相关度越高,说明该像素点被识别为目标像素点的概率也就越大,从而提升了目标检测的准确度,这样,利用训练得到的目标检测模型直接可以对待检测图像进行目标检测,达到较高的检测效率。
考虑到本发明实施例中的初始权重向量的确定是本发明实施例的关键步骤。为了更好的计算初始权重向量,上述S102的计算过程,具体通过如下步骤实现,参见图2所示的流程图,所述方法还包括:
S201、针对每个检测图像样本,确定该检测图像样本中每个像素点的像素值;
S202、基于各个像素点的像素值以及预设归一化参数,确定各个像素点对应的初始权重值;
具体地,归一化参数是随机设置的,各个像素点的像素值经过归一化处理后,得到各个像素点对应的初始权重值,初始权重值也是随机的,此时的初始权重值也表示检测图像样本中的每个像素点与目标像素点之间的初始相关度,但由于初始权重值是随机设置的,此时的初始相关度可能很小,进而可能无法根据初始权重值在检测图像样本上确定目标像素点,所以需要目标检测的模型不断对初始权重值进行训练,以获得相关度较高的初始权重值。
S203、将各个像素点对应的初始权重值进行组合,得到与该检测图像样本对应的初始权重向量。
考虑到训练目标检测模型是至关重要的一步,所以上述S103的训练过程具体通过如下步骤实现,参见图3所示的流程图,所述方法还包括:
S301、针对每个检测图像样本,确定像素矩阵与初始权重向量之间的初始乘积量;
具体地,确定像素矩阵与初始权重向量之间的初始乘积量通过如下公式计算:f(x,y)=g(x,y)*h(x,y)
其中,g(x,y)表示检测图像样本,h(x,y)表示由初始权重向量组合形成的初始权重图像,f(x,y)表示乘积后的输入图像,(x,y)表示检测图像样本中各个像素点的位置。
S302、将像素矩阵与初始权重向量之间的初始乘积量输入至待训练的目标检测模型中,得到模型输出的标注信息;
S303、将模型输出的标注信息与该检测图像样本的预先标注信息进行对比,若对比不一致,则调整初始权重向量,直至对比一致时,停止调整,得到训练好的目标检测模型。
具体地,乘积后的输入图像f(x,y)携带了检测图像样本中的所有像素点对应的信息,一开始的初始乘积量与预期偏差较大,为了减少偏差,将f(x,y)输入到目标检测模型中去学习,输出标注信息,并与检测图像样本g(x,y)上的预先标注信息进行比对,根据比对结果不断调整初始权重向量,使得目标像素点所在的区域内,初始权重向量的值逐渐变大,非目标像素点所在的区域内,初始权重向量的值逐渐变小,并不断的将模型输出的标注信息与检测图像样本g(x,y)上的预先标注信息进行对比,直至对比一致时,停止调整。
其中,检测图像样本的预先标注信息为带有目标像素点的位置标注,模型输出的标注信息也为带有目标像素点的位置标注,只不过本发明实施例的带有目标像素点的标注通过相应像素点的初始乘积量表示,这样在调整初始权重向量时就可以直观的看到初始乘积量的改变,相应的就可以看到模型输出的标注信息中目标像素点的位置变化。
由于像素矩阵是一个常量值,初始权重向量是一个变量值,进而调整初始权重向量的值便可以对应的调整初始乘积量的值。最后的结果可以是:目标像素点所在的区域在训练过程中,初始乘积量的值不断变大,非目标像素点所在的区域在训练过程中,初始乘积量的值不断减小,直至减小到0。
除此之外,根据初始乘积量在检测图像样本上的位置,还可以确定目标像素点的位置,能够实现一次性学习到目标像素点以及目标像素点的位置,提升了目标像素点定位的精度。
为了详细说明目标检测模型训练的过程,上述S302的训练过程,具体通过如下步骤实现,参见图4所示的流程图,其中,目标检测模型包括卷积提取层、池化提取层和输出层,所述方法还包括:
S401、将像素矩阵与初始权重向量之间的初始乘积量输入至待训练的目标检测模型包括的卷积提取层,得到卷积特征向量;
S402、将卷积特征向量输入至池化提取层,得到池化特征向量;
S403、将池化特征向量输入至输出层,得到输出的标注信息。
具体地,上述S303的训练过程,具体通过如下步骤实现,参见图5所示的流程图,所述方法包括:
S501、将模型输出的标注信息与该检测图像样本的预先标注信息进行对比;
S502、若对比不一致,则将模型输出的标注信息与预先标注信息之间的比对结果反馈至待训练的目标检测模型;
S503、调节该目标检测模型的参数以及检测图像样本对应的初始权重向量,直至模型输出的标注信息与该检测图像样本的预先标注信息对比一致,停止调整,得到训练好的目标检测模型。
具体地,将像素矩阵与初始权重向量之间的初始乘积量依次输入目标检测模型的卷积提取层、池化提取层和输出层,通过输出层可以得到输出的标注信息,将输出的标注信息与该检测图像样本的预先标注信息进行对比,若对比不一致,则将输出的标注信息依次反馈给目标检测模型的池化提取层和卷积提取层,调整初始权重向量后,再将像素矩阵与调整后的初始权重向量之间的初始乘积量依次输入目标检测模型的卷积提取层、池化提取层和输出层,通过输出层再一次得到输出的标注信息,反复循环修正偏差,直至模型输出的标注信息与该检测图像样本的预先标注信息比对一致,停止调整。
其中,目标检测模型的训练过程需要大量的检测图像样本进行反复训练,最终得到训练好的目标检测模型。
将训练好的目标检测模型应用在任意一个待检测图像上,参见图6所示的流程图,所述方法包括:
S601、获取待检测图像;
S602、将待检测图像输入训练好的目标检测模型中,得到目标检测结果。
具体地,在目标检测模型的应用阶段,直接将待检测图像输入到目标检测模型即可获得目标检测结果。目标检测结果包括待检测图像中是否有目标物,以及当待检测图像中有目标物时,目标物的位置信息。
本发明实施例提供的目标检测的方法,通过学习检测图像样本中的像素点与目标像素点之间的相关度训练得到目标检测模型,实现了对目标的准确检测的同时,还无需增加模型层数,检测效率较高。
基于同一发明构思,本发明实施例还提供了与上述目标检测的方法对应的目标检测的装置,由于本发明实施例中的装置解决问题的原理与本发明实施例上述目标检测的方法相似,因此目标检测的装置的实施可以参见方法的实施,重复之处不再赘述。
参见图7,为本发明实施例提供的一种目标检测的装置的结构示意图,该目标检测的装置70包括:
获取模块701,用于获取各个检测图像样本;
确定模块702,用于针对每个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;像素矩阵由检测图像样本中各个像素点的像素值按照像素点排列方式排列得到;初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度;目标像素点为检测图像样本中目标物所对应的像素点;
训练模块703,用于基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;
检测模块704,用于基于训练好的目标检测模型对待检测图像进行目标检测。
在一种实施方式中,上述确定模块702包括:
第一确定单元,用于针对每个检测图像样本,确定该检测图像样本中每个像素点的像素值;
第二确定单元,用于基于各个像素点的像素值以及预设归一化参数,确定各个像素点对应的初始权重值;
组合单元,用于将各个像素点对应的初始权重值进行组合,得到与该检测图像样本对应的初始权重向量。
考虑到获得目标检测模型是至关重要的一步,所以上述训练模块703具体包括:
计算子模块,用于针对每个检测图像样本,确定像素矩阵与初始权重向量之间的初始乘积量;
输出子模块,用于将像素矩阵与初始权重向量之间的初始乘积量输入至待训练的目标检测模型中,得到模型输出的标注信息;
比对子模块,用于将模型输出的标注信息与该检测图像样本的预先标注信息进行对比,若对比不一致,则调整初始权重向量,直至对比一致时,停止调整,得到训练好的目标检测模型。
在一种实施方式中,上述输出子模块包括:
卷积处理单元,用于将像素矩阵与初始权重向量之间的初始乘积量输入至待训练的目标检测模型包括的卷积提取层,得到卷积特征向量;
池化处理单元,用于将卷积特征向量输入至池化提取层,得到池化特征向量;
输出单元,用于将池化特征向量输入至输出层,得到输出的标注信息。
具体地,上述比对子模块包括:
对比单元,用于将模型输出的标注信息与该检测图像样本的预先标注信息进行对比;
反馈单元,用于若对比不一致,则将模型输出的标注信息与预先标注信息之间的比对结果反馈至待训练的目标检测模型;
调节单元,用于调节该目标检测模型的参数以及检测图像样本对应的初始权重向量,直至模型输出的标注信息与该检测图像样本的预先标注信息对比一致,停止调整,得到训练好的目标检测模型。
将训练好的目标检测模型应用在任意一个待检测图像上,检测模块704包括:
获取单元,用于获取待检测图像;
执行单元,用于将待检测图像输入训练好的目标检测模型中,得到目标检测结果。
本发明实施例所训练得到的目标检测模型由于学习了检测图像样本中的像素点与目标像素点之间的相关度而使得该目标检测模型能够准确的对目标或非目标进行识别,也即,一个像素点与目标物所属像素点的相关度越高,说明该像素点被识别为目标像素点的概率也就越大,从而提升了目标检测的准确度,这样,利用训练得到的目标检测模型直接可以对待检测图像进行目标检测,达到较高的检测效率。
参见图8所示的本发明实施例所提供的一种电子设备的模块组成示意图。如图8所示,电子设备80包括处理器801、存储器802和总线803,存储器802存储有处理器801可执行的机器可读指令,当电子设备80运行时,处理器801与存储器802之间通过总线通信,机器可读指令被处理器801执行如上述图1至图6所示方法实施例中的目标检测的方法中的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述图1至图6所示方法实施例中的目标检测的方法中的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本发明实施例所提供的装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种目标检测的方法,其特征在于,所述方法包括:
获取各个检测图像样本;
针对每个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;所述像素矩阵由检测图像样本中各个像素点的像素值按照像素点排列方式排列得到;所述初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度;所述目标像素点为所述检测图像样本中目标物所对应的像素点;
基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;
基于训练好的目标检测模型对待检测图像进行目标检测。
2.根据权利要求1所述的方法,其特征在于,通过以下步骤确定初始权重向量:
针对每个检测图像样本,确定该检测图像样本中每个像素点的像素值;
基于各个像素点的像素值以及预设归一化参数,确定各个像素点对应的初始权重值;
将各个像素点对应的初始权重值进行组合,得到与该检测图像样本对应的初始权重向量。
3.根据权利要求1或2所述的方法,其特征在于,所述基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型,包括:
针对每个检测图像样本,确定所述像素矩阵与所述初始权重向量之间的初始乘积量;
将所述像素矩阵与所述初始权重向量之间的初始乘积量输入至待训练的目标检测模型中,得到模型输出的标注信息;
将模型输出的标注信息与该检测图像样本的预先标注信息进行对比,若对比不一致,则调整所述初始权重向量,直至对比一致时,停止调整,得到训练好的目标检测模型。
4.根据权利要求3所述的方法,其特征在于,所述目标检测模型包括卷积提取层、池化提取层和输出层;所述将所述像素矩阵与所述初始权重向量之间的初始乘积量输入至待训练的目标检测模型中,得到模型输出的标注信息,包括:
将所述像素矩阵与所述初始权重向量之间的初始乘积量输入至待训练的目标检测模型包括的卷积提取层,得到卷积特征向量;
将所述卷积特征向量输入至所述池化提取层,得到池化特征向量;
将所述池化特征向量输入至所述输出层,得到输出的标注信息。
5.根据权利要求3所述的方法,其特征在于,所述将模型输出的标注信息与该检测图像样本的预先标注信息进行对比,若对比不一致,则调整所述初始权重向量,直至对比一致时,停止调整,得到训练好的目标检测模型,包括:
将模型输出的标注信息与该检测图像样本的预先标注信息进行对比;
若对比不一致,则将所述模型输出的标注信息与预先标注信息之间的比对结果反馈至待训练的目标检测模型;
调节该目标检测模型的参数以及所述检测图像样本对应的初始权重向量,直至模型输出的标注信息与该检测图像样本的预先标注信息对比一致,停止调整,得到训练好的目标检测模型。
6.根据权利要求1~5任一所述的方法,其特征在于,所述基于训练好的目标检测模型对待检测图像进行目标检测,包括:
获取待检测图像;
将所述待检测图像输入训练好的目标检测模型中,得到目标检测结果。
7.一种目标检测的装置,其特征在于,所述装置包括:
获取模块,用于获取各个检测图像样本;
确定模块,用于针对每个检测图像样本,确定与该检测图像样本对应的像素矩阵和初始权重向量;所述像素矩阵由检测图像样本中各个像素点的像素值按照像素点排列方式排列得到;所述初始权重向量用于表示检测图像样本中的每个像素点与目标像素点之间的初始相关度;所述目标像素点为所述检测图像样本中目标物所对应的像素点;
训练模块,用于基于每个检测图像样本对应的像素矩阵和初始权重向量,以及每个检测图像样本的预先标注信息对待训练的目标检测模型进行训练,得到训练好的目标检测模型;
检测模块,用于基于训练好的目标检测模型对待检测图像进行目标检测。
8.根据权利要求7所述的装置,其特征在于,所述检测模块包括:
获取单元,用于获取待检测图像;
执行单元,用于将所述待检测图像输入训练好的目标检测模型中,得到目标检测结果。
9.一种电子设备,其特征在于,包括处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行如权利要求1至6中任一项所述目标检测的方法中的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6中任一项所述目标检测的方法中的步骤。
CN201911018536.5A 2019-10-24 2019-10-24 一种目标检测的方法、装置、电子设备及可读存储介质 Pending CN110781956A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911018536.5A CN110781956A (zh) 2019-10-24 2019-10-24 一种目标检测的方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911018536.5A CN110781956A (zh) 2019-10-24 2019-10-24 一种目标检测的方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN110781956A true CN110781956A (zh) 2020-02-11

Family

ID=69386325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911018536.5A Pending CN110781956A (zh) 2019-10-24 2019-10-24 一种目标检测的方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110781956A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428688A (zh) * 2020-04-16 2020-07-17 成都旸谷信息技术有限公司 基于mask矩阵的车辆的行驶车道智能识别方法、系统
CN111523599A (zh) * 2020-04-24 2020-08-11 上海商汤智能科技有限公司 目标检测方法及装置、电子设备和存储介质
CN111540217A (zh) * 2020-04-16 2020-08-14 成都旸谷信息技术有限公司 基于mask矩阵的平均车速智能监测方法、系统
CN112464742A (zh) * 2021-01-29 2021-03-09 福建农林大学 赤潮图像自动识别的方法及装置
CN113221104A (zh) * 2021-05-12 2021-08-06 北京百度网讯科技有限公司 用户异常行为的检测方法及用户行为重构模型的训练方法
CN113326851A (zh) * 2021-05-21 2021-08-31 中国科学院深圳先进技术研究院 图像特征提取方法、装置、电子设备及存储介质
CN113379657A (zh) * 2021-05-19 2021-09-10 上海壁仞智能科技有限公司 基于随机矩阵的图像处理方法及装置
CN113807378A (zh) * 2020-06-16 2021-12-17 纬创资通股份有限公司 训练数据增量方法、电子装置与计算机可读记录介质
WO2022105197A1 (en) * 2020-11-17 2022-05-27 Zhejiang Dahua Technology Co., Ltd. Systems and methods for image detection
CN114581386A (zh) * 2022-02-23 2022-06-03 清华大学 基于时空数据的缺陷检测方法及装置
CN116503387A (zh) * 2023-06-25 2023-07-28 聚时科技(深圳)有限公司 图像检测方法、装置、设备、系统及可读存储介质
CN117079058A (zh) * 2023-10-11 2023-11-17 腾讯科技(深圳)有限公司 图像处理方法和装置、存储介质及电子设备

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111540217A (zh) * 2020-04-16 2020-08-14 成都旸谷信息技术有限公司 基于mask矩阵的平均车速智能监测方法、系统
CN111428688B (zh) * 2020-04-16 2022-07-26 成都旸谷信息技术有限公司 基于mask矩阵的车辆的行驶车道智能识别方法、系统
CN111428688A (zh) * 2020-04-16 2020-07-17 成都旸谷信息技术有限公司 基于mask矩阵的车辆的行驶车道智能识别方法、系统
CN111523599A (zh) * 2020-04-24 2020-08-11 上海商汤智能科技有限公司 目标检测方法及装置、电子设备和存储介质
CN111523599B (zh) * 2020-04-24 2024-03-26 上海商汤智能科技有限公司 目标检测方法及装置、电子设备和存储介质
CN113807378B (zh) * 2020-06-16 2024-05-31 纬创资通股份有限公司 训练数据增量方法、电子装置与计算机可读记录介质
CN113807378A (zh) * 2020-06-16 2021-12-17 纬创资通股份有限公司 训练数据增量方法、电子装置与计算机可读记录介质
WO2022105197A1 (en) * 2020-11-17 2022-05-27 Zhejiang Dahua Technology Co., Ltd. Systems and methods for image detection
CN112464742A (zh) * 2021-01-29 2021-03-09 福建农林大学 赤潮图像自动识别的方法及装置
CN112464742B (zh) * 2021-01-29 2024-05-24 福建农林大学 赤潮图像自动识别的方法及装置
CN113221104A (zh) * 2021-05-12 2021-08-06 北京百度网讯科技有限公司 用户异常行为的检测方法及用户行为重构模型的训练方法
CN113221104B (zh) * 2021-05-12 2023-07-28 北京百度网讯科技有限公司 用户异常行为的检测方法及用户行为重构模型的训练方法
CN113379657A (zh) * 2021-05-19 2021-09-10 上海壁仞智能科技有限公司 基于随机矩阵的图像处理方法及装置
CN113326851A (zh) * 2021-05-21 2021-08-31 中国科学院深圳先进技术研究院 图像特征提取方法、装置、电子设备及存储介质
CN113326851B (zh) * 2021-05-21 2023-10-27 中国科学院深圳先进技术研究院 图像特征提取方法、装置、电子设备及存储介质
CN114581386B (zh) * 2022-02-23 2024-04-12 清华大学 基于时空数据的缺陷检测方法及装置
CN114581386A (zh) * 2022-02-23 2022-06-03 清华大学 基于时空数据的缺陷检测方法及装置
CN116503387B (zh) * 2023-06-25 2024-03-26 聚时科技(深圳)有限公司 图像检测方法、装置、设备、系统及可读存储介质
CN116503387A (zh) * 2023-06-25 2023-07-28 聚时科技(深圳)有限公司 图像检测方法、装置、设备、系统及可读存储介质
CN117079058A (zh) * 2023-10-11 2023-11-17 腾讯科技(深圳)有限公司 图像处理方法和装置、存储介质及电子设备
CN117079058B (zh) * 2023-10-11 2024-01-09 腾讯科技(深圳)有限公司 图像处理方法和装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN110781956A (zh) 一种目标检测的方法、装置、电子设备及可读存储介质
US10769487B2 (en) Method and device for extracting information from pie chart
CN112162930B (zh) 一种控件识别的方法、相关装置、设备及存储介质
US9754237B2 (en) Index image quality metric
US11790632B2 (en) Method and apparatus for sample labeling, and method and apparatus for identifying damage classification
CN110766095B (zh) 基于图像灰度特征的缺陷检测方法
CN111340126A (zh) 物品识别方法、装置、计算机设备和存储介质
CN111524112B (zh) 追钢识别方法、系统、设备及介质
CN108229418B (zh) 人体关键点检测方法和装置、电子设备、存储介质和程序
CN111310706B (zh) 一种商品价签识别方法及装置、电子设备、存储介质
CN110245747B (zh) 基于全卷积神经网络的图像处理方法及装置
CN110827269B (zh) 农作物生长变化状况检测方法、装置、设备及介质
CN111614959B (zh) 一种视频打码方法、装置以及电子设备
CN110796651A (zh) 图像质量的预测方法及装置、电子设备、存储介质
CN109242882B (zh) 视觉跟踪方法、装置、介质及设备
CN113469025A (zh) 应用于车路协同的目标检测方法、装置、路侧设备和车辆
CN109559707B (zh) 显示面板的伽马值处理方法、装置及显示设备
CN111444833A (zh) 果实测产方法、装置、计算机设备及存储介质
CN110942056A (zh) 服饰关键点定位方法、装置、电子设备及介质
CN113435942A (zh) 评估矿物价格的方法和计算机系统
CN115130366A (zh) 机器学习模型的优化、预测方法、设备及存储介质
CN115035129A (zh) 货物的识别方法、装置、电子设备和存储介质
CN112581001A (zh) 设备的评估方法及装置、电子设备、可读存储介质
CN116452791B (zh) 多相机点位的缺陷区域定位方法、系统、装置及存储介质
CN113627609B (zh) 一种基于仿射变换的网络度量方法和存储设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201221

Address after: A108, 1 / F, curling hall, winter training center, 68 Shijingshan Road, Shijingshan District, Beijing 100041

Applicant after: Beijing second hand Artificial Intelligence Technology Co.,Ltd.

Address before: Room 9014, 9 / F, building 3, yard 30, Shixing street, Shijingshan District, Beijing

Applicant before: ADMASTER TECHNOLOGY (BEIJING) Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211