CN110705633A - 目标物检测、目标物检测模型的建立方法及装置 - Google Patents

目标物检测、目标物检测模型的建立方法及装置 Download PDF

Info

Publication number
CN110705633A
CN110705633A CN201910926688.9A CN201910926688A CN110705633A CN 110705633 A CN110705633 A CN 110705633A CN 201910926688 A CN201910926688 A CN 201910926688A CN 110705633 A CN110705633 A CN 110705633A
Authority
CN
China
Prior art keywords
image
pixel
target object
detected
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910926688.9A
Other languages
English (en)
Other versions
CN110705633B (zh
Inventor
肖航
张子昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Orion Star Technology Co Ltd
Original Assignee
Beijing Orion Star Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Orion Star Technology Co Ltd filed Critical Beijing Orion Star Technology Co Ltd
Priority to CN201910926688.9A priority Critical patent/CN110705633B/zh
Publication of CN110705633A publication Critical patent/CN110705633A/zh
Application granted granted Critical
Publication of CN110705633B publication Critical patent/CN110705633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开一种目标物检测、目标物检测模型的建立方法及装置,属于图像处理技术领域,该方法包括:获取待检测图像,将待检测图像输入到建立的目标物检测模型中,若根据待检测图像中各像素的概率信息确定待检测图像中任一像素属于目标物的概率大于预设概率,则确定待检测图像中包含目标物,这样,可自动检测出图像中的目标物如头发,检测目标物的效率更高,并且,目标物检测模型输出的是待检测图像中每个像素属于目标物的概率,检测粒度细化到像素级别,检测的精度也比较高。

Description

目标物检测、目标物检测模型的建立方法及装置
技术领域
本申请涉及图像处理技术领域,尤其涉及一种目标物检测、目标物检测模型的建立方法及装置。
背景技术
工业生产中,产品在出厂之前基本上都会进行包装,然而一些产品的外包装如塑料材质的外包装非常容易起静电,若外包装上附着了异物如头发、纸屑等,则不能再用来包装产品。
为了保证产品的质量,现有技术中,在包装产品之前,采用人工排查的方式来检查外包装上是否有异物,然而人工排查的方式效率比较低,并且,对一些形状比较小的异物如头发,人工排查的准确度也难以保证,因此,如何便捷地检查出外包装上的异物是亟待解决的问题。
发明内容
本申请实施例提供一种目标物检测、目标物检测模型的建立方法及装置,用以解决现有技术中在检查产品外包装上的异物时存在的检查效率低、检查不准确的问题。
第一方面,本申请实施例提供的一种目标物检测方法,包括:
获取待检测图像;
将所述待检测图像输入到建立的目标物检测模型中,以确定所述待检测图像中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
若根据所述待检测图像中各像素的概率信息确定所述待检测图像中任一像素属于所述目标物的概率大于预设概率,则确定所述待检测图像中包含所述目标物。
可选地,确定所述待检测图像中包含所述目标物之后,还包括:
根据所述待检测图像中各像素的概率信息,对所述待检测图像中的所述目标物进行标注。
可选地,根据所述待检测图像中各像素的概率信息,对所述待检测图像中的所述目标物进行标注,包括:
根据所述待检测图像中各像素的概率信息,对所述待检测图像中属于所述目标物的概率大于所述预设概率的每个像素进行标注;或者
根据所述待检测图像中各像素的概率信息,生成目标图像,对所述目标图像进行轮廓提取,得到所述待检测图像中所述目标物的轮廓信息,根据所述轮廓信息对所述待检测图像中所述目标物的轮廓进行标注。
可选地,对所述待检测图像中的每个像素,若该像素属于所述目标物的概率不大于所述预设概率,则所述目标图像中与该像素对应的像素为第一预设值;否则,所述目标图像中与该像素对应的像素为第二预设值。
可选地,还包括:
若根据所述待检测图像中各像素的概率信息确定所述待检测图像中各像素属于所述目标物的概率均不大于所述预设概率,则确定所述待检测图像中不包含所述目标物。
第二方面,本申请实施例提供的一种目标物检测模型的建立方法,包括:
获取目标物的图像样本;
将所述图像样本输入到深度学习网络模型中,以确定所述图像样本中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
根据所述深度学习网络模型输出的所述图像样本中各像素的概率信息和预先生成的标签图像,确定所述深度学习网络模型的损失值,所述标签图像中包含有所述图像样本中每个像素是否属于所述目标物的信息;
根据所述损失值调整所述深度学习网络模型的参数,建立目标物检测模型。
可选地,根据以下步骤生成所述标签图像:
获取所述图像样本中所述目标物的轮廓标注信息,所述轮廓标注信息包括所述目标物的每个轮廓标注点的位置信息;
根据所述图像样本中所述目标物的每个轮廓标注点的位置信息,生成所述标签图像,其中,所述标签图像中位于闭合区域外的各像素为第一预设值,剩余各像素为第二预设值,所述闭合区域由所述标签图像中与每个轮廓标注点对应的像素形成。
可选地,根据所述图像样本中所述目标物的每个轮廓标注点的位置信息,生成所述标签图像之后,还包括:
根据所述标签图像中各像素的取值,放大所述闭合区域。
可选地,所述第二预设值大于所述第一预设值,根据所述标签图像中各像素的取值,放大所述闭合区域,包括:
对所述标签图像中各像素的取值进行优化,其中,对所述标签图像中的每个像素,确定以该像素为中心的预设大小的像素区域,将该像素的取值更新为所述像素区域中的最大值;
若确定优化次数小于预设次数,则对优化后的所述标签图像执行所述对所述标签图像中各像素的取值进行优化的步骤。
可选地,所述第二预设值大于所述第一预设值,根据所述图像样本中各像素的损失值和所述标签图像,确定所述深度学习网络模型的损失值,包括:
对所述图像样本中的每个像素,根据该像素属于所述目标物的概率和所述标签图像中对应像素的取值,确定该像素的损失值,将该像素的损失值更新为该像素的损失值与所述标签图像中对应像素的取值的乘积;
确定所述图像样本中各像素的损失值的平均值为所述深度学习网络模型的损失值。
第三方面,本申请实施例提供的一种目标物检测装置,包括:
获取模块,用于获取待检测图像;
检测模块,用于将所述待检测图像输入到建立的目标物检测模型中,以确定所述待检测图像中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
确定模块,用于若根据所述待检测图像中各像素的概率信息确定所述待检测图像中任一像素属于所述目标物的概率大于预设概率,则确定所述待检测图像中包含所述目标物。
可选地,还包括标注模块,所述标注模块用于:
在确定所述待检测图像中包含所述目标物之后,根据所述待检测图像中各像素的概率信息,对所述待检测图像中的所述目标物进行标注。
可选地,所述标注模块具体用于:
根据所述待检测图像中各像素的概率信息,对所述待检测图像中属于所述目标物的概率大于所述预设概率的每个像素进行标注;或者
根据所述待检测图像中各像素的概率信息,生成目标图像,对所述目标图像进行轮廓提取,得到所述待检测图像中所述目标物的轮廓信息,根据所述轮廓信息对所述待检测图像中所述目标物的轮廓进行标注。
可选地,对所述待检测图像中的每个像素,若该像素属于所述目标物的概率不大于所述预设概率,则所述目标图像中与该像素对应的像素为第一预设值;否则,所述目标图像中与该像素对应的像素为第二预设值。
可选地,所述确定模块还用于:
若根据所述待检测图像中各像素的概率信息确定所述待检测图像中各像素属于所述目标物的概率均不大于所述预设概率,则确定所述待检测图像中不包含所述目标物。
第四方面,本申请实施例提供的一种目标物检测装置,包括:
获取模块,用于获取目标物的图像样本;
概率确定模块,用于将所述图像样本输入到深度学习网络模型中,以确定所述图像样本中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
损失值确定模块,用于根据所述深度学习网络模型输出的所述图像样本中各像素的概率信息和预先生成的标签图像,确定所述深度学习网络模型的损失值,所述标签图像中包含有所述图像样本中每个像素是否属于所述目标物的信息;
调整模块,用于根据所述损失值调整所述深度学习网络模型的参数,建立目标物检测模型。
可选地,还包括生成模块,用于根据以下步骤生成所述标签图像:
获取所述图像样本中所述目标物的轮廓标注信息,所述轮廓标注信息包括所述目标物的每个轮廓标注点的位置信息;
根据所述图像样本中所述目标物的每个轮廓标注点的位置信息,生成所述标签图像,其中,所述标签图像中位于闭合区域外的各像素为第一预设值,剩余各像素为第二预设值,所述闭合区域由所述标签图像中与每个轮廓标注点对应的像素形成。
可选地,所述生成模块,还用于:
在根据所述图像样本中所述目标物的每个轮廓标注点的位置信息,生成所述标签图像之后,根据所述标签图像中各像素的取值,放大所述闭合区域。
可选地,所述第二预设值大于所述第一预设值,所述生成模块具体用于:
对所述标签图像中各像素的取值进行优化,其中,对所述标签图像中的每个像素,确定以该像素为中心的预设大小的像素区域,将该像素的取值更新为所述像素区域中的最大值;
若确定优化次数小于预设次数,则对优化后的所述标签图像执行所述对所述标签图像中各像素的取值进行优化的步骤。
可选地,所述第二预设值大于所述第一预设值,所述损失值确定模块具体用于:
对所述图像样本中的每个像素,根据该像素属于所述目标物的概率和所述标签图像中对应像素的取值,确定该像素的损失值,将该像素的损失值更新为该像素的损失值与所述标签图像中对应像素的取值的乘积;
确定所述图像样本中各像素的损失值的平均值为所述深度学习网络模型的损失值。
第五方面,本申请实施例提供的一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中:
存储器存储有可被至少一个处理器执行的指令,该指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一方法。
第六方面,本申请实施例提供的一种计算机可读介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述任一方法。
本申请实施例中,在获取到待检测图像后,将待检测图像输入到建立的目标物检测模型中,以确定待检测图像中每个像素属于目标物的概率,若根据待检测图像中各像素的概率信息确定待检测图像中任一像素属于目标物的概率大于预设概率,则确定待检测图像中包含目标物,这样,可自动检测出图像中的目标物如头发,检测目标物的效率更高,并且,目标物检测模型输出的是待检测图像中每个像素属于目标物的概率,检测粒度细化到像素级别,检测的精度也比较高。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种目标物检测方法的流程图;
图2为本申请实施例提供的一种对待检测图像中目标物的轮廓进行标注的流程图;
图3为本申请实施例提供的一种目标物检测模型的建立方法的流程图;
图4为本申请实施例提供的一种对标签图像中的闭合区域进行放大的示意图;
图5为本申请实施例提供的一种确定深度学习网络模型的损失值的流程图;
图6为本申请实施例提供的一种透明管底粘连有头发的图像样本;
图7为本申请实施例提供的一种对图像样本中头发的标注示意图;
图8为本申请实施例提供的一种标签图像的示意图;
图9为本申请实施例提供的一种放大闭合区域后的标签图像的示意图;
图10为本申请实施例提供的一种深度学习网络模型的结构示意图;
图11为本申请实施例提供的一种检测头发的过程示意图;
图12为本申请实施例提供的一种对待检测图像中头发的标注示意图;
图13为本申请实施例提供的一种用于实现目标物检测方法和/或目标物检测模型建立方法的电子设备的硬件结构示意图;
图14为本申请实施例提供的一种目标物检测装置的结构示意图;
图15为本申请实施例提供的一种目标物检测模型建立装置的结构示意图。
具体实施方式
为了解决现有技术中在检查产品外包装上的异物时存在的检查效率低、检查不准确的问题,本申请实施例提供了一种目标物检测、目标物检测模型的建立方法及装置。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
工业生产中,产品在出厂之前基本上都会在流水线上自动地进行包装,若外包装上附着了异物,则不能再用来包装产品。目前,是采用人工排查的方式来检查外包装上是否异物,然而在快速运转的流水线上,排查人员需要时刻集中精力才能检查出异物,对排查人员的要求比较高,而且,排查人员比较难以发现一些细小的异物如头发,因此,排查的准确率也难以保证。
为此,本申请实施例提供一种目标物检测方法,在该方法中以需要进行检查的异物为目标物,建立目标物检测模型,利用目标物检测模型来对外包装上的目标物进行检测,由于目标物检测模型输出的是图像中每个像素属于目标物的概率,检测精度可细致到像素级别,因此,即便如头发这样细小的目标物也可被检测出来,并且,该方法可用于任何需要进行目标物检测的场景,应用前景也比较广阔。
如图1所示,为本申请实施例提供的一种目标物检测方法的流程图,包括以下步骤:
S101:获取待检测图像。
实际应用中,如果外包装为敞口的塑料袋或塑料管,目标物容易掉落进去,则可将图像采集装置设置在塑料袋或塑料管的正上方,以便从正上方进行图像采集,从而得到待检测图像。
S102:将待检测图像输入到建立的目标物检测模型中,以确定待检测图像中各像素的概率信息,其中,每个像素的概率信息包括该像素属于目标物的概率。
为了能够准确地检测出像头发这种细小的目标物,本申请实施例中建立的目标物检测模型可输出待检测图像中每个像素属于目标物的概率,以求从像素级别上对目标物进行辨别,检测的准确率更高。
S103:根据待检测图像中各像素的概率信息,判断待检测图像中是否存在属于目标物的概率大于预设概率的像素,若是,则进入S104;否则,进入S106。
S104:确定待检测图像中包含目标物。
S105:根据待检测图像中各像素的概率信息,对待检测图像中的目标物进行标注。
在一种可能的实施方式中,可根据待检测图像中各像素的概率信息,对待检测图像中属于目标物的概率大于预设概率的每个像素进行标注,这样,标注了待检测图像中属于目标物的每个像素,是对目标物整体进行标注。
在另一种可能的实施方式中,可仅对待检测图像中目标物的轮廓进行标注。
具体地,可按照图2所示的流程对待检测图像中目标物的轮廓进行标注,该流程包括以下步骤:
S201a:根据待检测图像中各像素的概率信息,生成目标图像。
其中,目标图像与待检测图像中的像素一一对应,并且,对待检测图像中的每个像素,若该像素属于目标物的概率不大于预设概率,则目标图像中与该像素对应的像素为第一预设值比如为“0”;否则,目标图像中与该像素对应的像素为第二预设值比如为“1”。
具体实施时,可先获取灰度图像,该灰度图像与待检测图像中的像素一一对应,之后,对待检测图像中的每个像素,若确定该像素属于目标物的概率不大于预设概率,则在灰度图像上将与该像素对应的像素标记为第一预设值;若确定该像素属于目标物的概率大于预设概率,则在灰度图像上将与该像素对应的像素标记为第二预设值,这样,相当于在灰度图像上绘制出了待检测图像中目标物的图像,因此,可将标记后的灰度图像确定为目标图像。
S202a:对目标图像进行轮廓提取,得到待检测图像中目标物的轮廓信息。
具体实施时,可使用opencv库的cv2.findContours函数对目标图像进行轮廓提取,从而得到目标物的轮廓信息,其中,目标物的轮廓信息包括目标物的每个轮廓像素点的位置信息。
S203a:根据轮廓信息对待检测图像中目标物的轮廓进行标注。
这样,可突出显示待检测图像中包含的目标物,以达到提示用户的效果。另外,还可发出告警信息,以便相关人员及时采取处理措施。
S106:确定待检测图像中不包含目标物。
具体实施时,上述实施例中的目标物检测模型的可根据图3所示的流程建立,该流程包括以下步骤:
S301:获取目标物的图像样本。
具体实施时,包含目标物的图像都可以作为图像样本,其中,目标物如头发。
S302:将图像样本输入到深度学习网络模型中,以确定图像样本中各像素的概率信息,每个像素的概率信息包括该像素属于目标物的概率。
具体实施时,将图像样本输入到深度学习网络模型中之后,可控制深度学习网络模型对图像样本进行特征提取,进而根据提取的图像特征预测图像样本中每个像素属于目标物的概率。
S303:根据深度学习网络模型输出的图像样本中各像素的概率信息和预先生成的标签图像,确定深度学习网络模型的损失值。
其中,标签图像中包含有图像样本中每个像素是否属于目标物的信息。
具体实施时,可根据以下步骤生成标签图像:
获取图像样本中目标物的轮廓标注信息,该轮廓标注信息包括目标物的每个轮廓标注点的位置信息,进而根据图像样本中目标物的每个轮廓标注点的位置信息,生成标签图像,其中,标签图像中位于闭合区域外的各像素为第一预设值,剩余各像素为第二预设值,闭合区域由标签图像中与每个轮廓标注点对应的像素形成。
比如,可获取灰度图像,该灰度图像与图像样本中的像素点一一对应,之后,对图像样本中目标物的每个轮廓标注点,根据该轮廓标注点的位置信息,在灰度图像上确定与该轮廓标注点对应的像素,进而确定灰度图像上各轮廓标注点对应的像素所形成的闭合区域,该闭合区域即为目标物所在区域,将灰度图像中位于闭合区域外的各像素的取值修改为第一预设值如“0”,将灰度图像中剩余各像素的取值修改为第二预设值如“1”,这样,相当于在灰度图像上绘制了图像样本中的目标物,因此,可将修改取值后的灰度图像作为标签图像。
另外,考虑到目标物可能比较细小,不易检测。为了提升检测效率,上述过程中,还可对标签图像中代表目标物的闭合区域进行“膨胀”处理,即放大处理。
具体实施时,对标签图像的取值进行优化,其中,对标签图像中的每个像素,确定以该像素为中心的预设大小的像素区域,将该像素的取值更新为此像素区域中的最大值,将此取值作为该像素的取值,进一步地,若确定优化次数小于预设次数,则对优化后的标签图像执行对标签图像的取值进行优化的步骤,直至优化次数到达预设次数。
参见图4,为本申请实施例提供的对标签图像中的闭合区域进行放大的示意图,其中,一个栅格代表一个像素,黑色区域中各像素的取值为“0”,白色区域中各像素的取值为“1”。假设闭合区域如左边图像中的白色区域所示,并假设使用3×3的模板对白色区域进行放大。
具体实施时,对左边图像中的每个像素,确定以该像素为中心的3×3的像素区域,进而确定此像素区域中各像素的最大值,将此最大值作为该像素的取值,对每个像素处理之后的图像为右边图像,白色区域明显已经得到了放大。这里,仅示出了一次放大操作后的图像,若希望继续放大白色区域,则可对右边图像执行上述操作,在此不再赘述。
后续,根据深度学习网络模型输出的图像样本中各像素的概率信息和预先生成的标签图像,确定深度学习网络模型的损失值。
具体实施时,当目标物比较小时,图像样本中目标物所占的区域比较小,非目标物所占的区域比较大,深度学习网络模型的损失值将会由大多数的不属于目标物的像素点控制,对目标物的识别效果会比较差。
鉴于标签图像中目标物所占区域中像素的取值为第二预设值,非目标物所占区域中像素的取值为第一预设值,当第二预设值大于第一预设值时,如果将每个像素的误差值和标签图像中该像素的取值进行相乘,那么,可大大减弱不属于目标物的像素点对深度学习网络模型的损失值的控制,因此,本申请实施例中,根据图像样本中每个像素属于喷码字符的概率和标签图像中该像素的取值,确定深度学习网络模型的损失值。
具体地,参见图5,为本申请实施例提供的一种确定深度学习网络模型的损失值的流程图,该流程包括以下步骤:
S501a:对图像样本中的每个像素,根据该像素属于喷码字符的概率和标签图像中该像素的取值,确定该像素的损失值,确定该像素的损失值与标签图像中对应像素的取值的乘积,将该像素的损失值更新为乘积结果。
假设根据以下公式确定图像样本中第i个像素的损失值bce loss(xi,yi):
bce loss(xi,yi)=-[yilogxi+(1-yi)log(1-xi)];
其中,xi为图像样本中第i个像素属于目标物的概率,yi为标签图像中第i个像素的取值;
那么,图像样本中第i个像素更新后的损失值our bce loss(xi,yi)为:
our bce loss(xi,yi)=bce loss(xi,yi)*yi
S502a:确定图像样本中各像素的损失值的平均值为深度学习网络模型的损失值。
即深度学习网络模型的损失值our bce loss为:
Figure BDA0002219127890000121
其中,M代表图像样本的像素个数。
S304:根据损失值调整深度学习网络模型的参数,建立目标物检测模型。
具体实施时,可利用梯度下降法调整深度学习网络模型的参数,直至确定深度学习网络模型的损失值小于预设损失值时,将当前的深度学习网络模型作为建立的目标物检测模型。
本申请实施例使用深度学习网络模型自动完成对目标物的检测,其中,深度学习网络模型为目标分割网络模型,通过对图像中的像素进行分类,找到需要的目标物,下面以检测透明管底的头发为例对本申请实施例进行介绍。
第一步,获取图像样本。
如图6所示,为本申请实施例获取到的透明管底粘连有头发的图像样本,该图像样本是通过管口向管底方向俯视拍摄的。
第二步,生成标签图像。
由标注人员用标注工具对图6中图像样本中的头发进行标注,具体地,用折线将头发轮廓绘制出来,得到一条闭合的轮廓线,标注后的图像如图7所示,并可将头发的每个轮廓点的位置信息保存在json文件中。
然后,读取标json文件,在一张黑色背景(像素值为0)的灰度图像上绘制头发的图像。具体地,对json文件中的每个轮廓标注点,根据该轮廓标注点的位置信息在灰度图像中确定该轮廓标注点对应的像素点,将各轮廓标注点对应的像素点组成的闭合区域用白色像素(像素值为1)填充,就可得到标签图像,如图8所示。
考虑到头发较细,深度学习网络模型在检测时很容易发生轮廓断开的现象,因此,还可以对图8中标签图像的白色区域进行放大处理,放大处理后的图像如图9所示,放大后头发区域变粗,更便于深度学习网络模型进行检测。
第三步,训练头发检测模型。
本申请实施例采用的深度学习网络模型的结构如图10所示,具体实施时,将图像样本输入到深度学习网络模型中,由深度学习网络模型利用特征金字塔网络(FeaturePyramid Network,FPN)对图像样本进行不同尺度的特征提取,将不同尺度的特征图进行融合,再对融合后的特征图进行卷积运算,输出图像样本中各像素的概率信息,每个像素的概率信息中包含有该像素是否属于头发的概率信息。
进一步地,根据深度学习网络模型输出的图像样本中各像素的概率信息和标签图像,计算损失值。
这里,使用的损失函数为bce loss:
bce loss(xi,yi)=-[yilogxi+(1-yi)log(1-xi)];
其中,xi为图像样本中第i个像素属于目标物的概率,yi为标签图像中第i个像素的取值。
由于图像样本中头发像素比较少,非头发像素比较多,所以计算的损失值由大多数的非头发像素控制,这会导致深度学习网络模型对头发的检测效果差,为此,本申请实施例对损失函数进行了改进,改进之后的损失函数为:
our bce loss(xi,yi)=bce loss(xi,yi)*yi
具体实施时,由于在标签图像中属于头发的像素的取值为“1”,不属于头发的像素取值为“0”,那么,在得到图像样本中第i个像素的损失值之后,计算第i个像素的损失值与标签图像对应像素的取值,可尽可能地减小非头发像素的损失值,削弱非头发像素对最终损失值的影响,提升头发像素对最终损失值的贡献。
然后,再对每个像素点的our bce loss计算均值,得到深度学习网络模型的损失值,即:
Figure BDA0002219127890000141
其中,M代表图像样本的像素个数。
进一步地,根据深度学习网络模型的损失值反向修正每层卷积核中的卷积参数。
如果our bce loss越小,就代表深度学习网络模型的预测结果与标签越相同,预测错的像素越少,当our bce loss小于一定值时,就可认为深度学习网络模型已经学习到了头发的特征,可以自动找到图像中的头发像素,将深度学习网络模型作为建立的头发检测模型,结束训练。
第四步,应用头发检测模型。
如图11所示,为本申请实施例提供的一种检测头发的过程示意图,将获取的待检测图像输入到头发检测模型中,得到待检测图像各像素属于头发的概率信息,若根据待检测图像中各像素的概率信息确定待检测图像中任一像素属于头发的概率大于预设概率,则确定待检测图像中包含头发;否则,确定待检测图像中不包含头发。
为了提醒用户,在确定待检测图像中包含头发之后,还可根据待检测图像中各像素的概率信息,对待检测图像中的头发进行标注,即将头发轮廓绘制在原图中,如图12所示。
具体地,可根据待检测图像中各像素的概率信息,生成目标图像,对目标图像进行轮廓提取,得到待检测图像中头发的轮廓信息,进而根据该轮廓信息对待检测图像中头发的轮廓进行标注,其中,对待检测图像中的每个像素,如果该像素属于头发的概率大于0.5,则目标图像中与该像素对应位置处的像素标注为“1”;如果该像素属于头发的概率不大于0.5,则目标图像中与该像素对应位置处的像素标注为“0”。
本申请实施例中,基于分割的深度学习网络模型可对待检测图像中的每个像素进行分类,识别到像素级别,即使是头发这样细小的目标物也可以识别,并且,模型可以应对不同场景的变化,只要对想要识别的目标物进行标注,然后训练模型,就可以得到想要的目标物检测模型,更换场景时对模型的修改比较少,因此,通用性也较好。
参见图13所示,为本申请实施例提供的一种电子设备的结构示意图,该电子设备包括收发器1301以及处理器1302等物理器件,其中,处理器1302可以是一个中央处理单元(central processing unit,CPU)、微处理器、专用集成电路、可编程逻辑电路、大规模集成电路、或者为数字处理单元等等。收发器1301用于电子设备和其他设备进行数据收发。
该电子设备还可以包括存储器1303用于存储处理器1302执行的软件指令,当然还可以存储电子设备需要的一些其他数据,如电子设备的标识信息、电子设备的加密信息、用户数据等。存储器1303可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1303也可以是非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器1303是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1303可以是上述存储器的组合。
本申请实施例中不限定上述处理器1302、存储器1303以及收发器1301之间的具体连接介质。本申请实施例在图13中仅以存储器1303、处理器1302以及收发器1301之间通过总线1304连接为例进行说明,总线在图13中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器1302可以是专用硬件或运行软件的处理器,当处理器1302可以运行软件时,处理器1302读取存储器1303存储的软件指令,并在所述软件指令的驱动下,执行前述实施例中涉及的目标物检测方法和/或目标物检测模型建立方法。
当本申请实施例中提供的方法以软件或硬件或软硬件结合实现的时候,电子设备中可以包括多个功能模块,每个功能模块可以包括软件、硬件或其结合。
具体的,参见图14所示,为本申请实施例提供的一种目标物检测装置的结构示意图,包括获取模块1401、检测模块1402、确定模块1403。
获取模块1401,用于获取待检测图像;
检测模块1402,用于将所述待检测图像输入到建立的目标物检测模型中,以确定所述待检测图像中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
确定模块1403,用于若根据所述待检测图像中各像素的概率信息确定所述待检测图像中任一像素属于所述目标物的概率大于预设概率,则确定所述待检测图像中包含所述目标物。
可选地,还包括标注模块1404,所述标注模块1404用于:
在确定所述待检测图像中包含所述目标物之后,根据所述待检测图像中各像素的概率信息,对所述待检测图像中的所述目标物进行标注。
可选地,所述标注模块1404具体用于:
根据所述待检测图像中各像素的概率信息,对所述待检测图像中属于所述目标物的概率大于所述预设概率的每个像素进行标注;或者
根据所述待检测图像中各像素的概率信息,生成目标图像,对所述目标图像进行轮廓提取,得到所述待检测图像中所述目标物的轮廓信息,根据所述轮廓信息对所述待检测图像中所述目标物的轮廓进行标注。
可选地,对所述待检测图像中的每个像素,若该像素属于所述目标物的概率不大于所述预设概率,则所述目标图像中与该像素对应的像素为第一预设值;否则,所述目标图像中与该像素对应的像素为第二预设值。
可选地,所述确定模块1403还用于:
若根据所述待检测图像中各像素的概率信息确定所述待检测图像中各像素属于所述目标物的概率均不大于所述预设概率,则确定所述待检测图像中不包含所述目标物。
参见图15所示,为本申请实施例提供的一种目标物检测模型的建立装置的结构示意图,包括获取模块1501、概率确定模块1502、损失值确定模块1503调整模块1504。
获取模块1501,用于获取目标物的图像样本;
概率确定模块1502,用于将所述图像样本输入到深度学习网络模型中,以确定所述图像样本中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
损失值确定模块1503,用于根据所述深度学习网络模型输出的所述图像样本中各像素的概率信息和预先生成的标签图像,确定所述深度学习网络模型的损失值;
调整模块1504,用于根据所述损失值调整所述深度学习网络模型的参数,建立目标物检测模型。
可选地,还包括生成模块1505,用于根据以下步骤生成所述标签图像:
获取所述图像样本中所述目标物的轮廓标注信息,所述轮廓标注信息包括所述目标物的每个轮廓标注点的位置信息;
根据所述图像样本中所述目标物的每个轮廓标注点的位置信息,生成所述标签图像,其中,所述标签图像中位于闭合区域外的各像素为第一预设值,剩余各像素为第二预设值,所述闭合区域由所述标签图像中与每个轮廓标注点对应的像素形成。
可选地,所述生成模块1505,还用于:
在根据所述图像样本中所述目标物的每个轮廓标注点的位置信息,生成所述标签图像之后,根据所述标签图像中各像素的取值,放大所述闭合区域。
可选地,所述第二预设值大于所述第一预设值,所述生成模块1505具体用于:
对所述标签图像中各像素的取值进行优化,其中,对所述标签图像中的每个像素,确定以该像素为中心的预设大小的像素区域,将该像素的取值更新为所述像素区域中的最大值;
若确定优化次数小于预设次数,则对优化后的所述标签图像执行所述对所述标签图像中各像素的取值进行优化的步骤。
可选地,所述第二预设值大于所述第一预设值,所述损失值确定模块1503具体用于:
对所述图像样本中的每个像素,根据该像素属于所述目标物的概率和所述标签图像中对应像素的取值,确定该像素的损失值,将该像素的损失值更新为该像素的损失值与所述标签图像中对应像素的取值的乘积;
确定所述图像样本中各像素的损失值的平均值为所述深度学习网络模型的损失值。
本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。各个模块相互之间的耦合可以是通过一些接口实现,这些接口通常是电性通信接口,但是也不排除可能是机械接口或其它的形式接口。因此,作为分离部件说明的模块可以是或者也可以不是物理上分开的,既可以位于一个地方,也可以分布到同一个或不同设备的不同位置上。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
本申请实施例还提供了一种计算机可读介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行上述任一实施例中的方法。
在一些可能的实施方式中,本申请提供的目标物检测方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行上述任一实施例中的方法。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的用于目标物检测的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种目标物检测方法,其特征在于,包括:
获取待检测图像;
将所述待检测图像输入到建立的目标物检测模型中,以确定所述待检测图像中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
若根据所述待检测图像中各像素的概率信息确定所述待检测图像中任一像素属于所述目标物的概率大于预设概率,则确定所述待检测图像中包含所述目标物。
2.如权利要求1所述的方法,其特征在于,确定所述待检测图像中包含所述目标物之后,还包括:
根据所述待检测图像中各像素的概率信息,对所述待检测图像中的所述目标物进行标注。
3.如权利要求2所述的方法,其特征在于,根据所述待检测图像中各像素的概率信息,对所述待检测图像中的所述目标物进行标注,包括:
根据所述待检测图像中各像素的概率信息,对所述待检测图像中属于所述目标物的概率大于所述预设概率的每个像素进行标注;或者
根据所述待检测图像中各像素的概率信息,生成目标图像,对所述目标图像进行轮廓提取,得到所述待检测图像中所述目标物的轮廓信息,根据所述轮廓信息对所述待检测图像中所述目标物的轮廓进行标注。
4.如权利要求3所述的方法,其特征在于,对所述待检测图像中的每个像素,若该像素属于所述目标物的概率不大于所述预设概率,则所述目标图像中与该像素对应的像素为第一预设值;否则,所述目标图像中与该像素对应的像素为第二预设值。
5.如权利要求1~4任一所述的方法,其特征在于,还包括:
若根据所述待检测图像中各像素的概率信息确定所述待检测图像中各像素属于所述目标物的概率均不大于所述预设概率,则确定所述待检测图像中不包含所述目标物。
6.一种目标物检测模型的建立方法,其特征在于,包括:
获取目标物的图像样本;
将所述图像样本输入到深度学习网络模型中,以确定所述图像样本中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
根据所述深度学习网络模型输出的所述图像样本中各像素的概率信息和预先生成的标签图像,确定所述深度学习网络模型的损失值;
根据所述损失值调整所述深度学习网络模型的参数,建立目标物检测模型。
7.一种目标物检测装置,其特征在于,包括:
获取模块,用于获取待检测图像;
检测模块,用于将所述待检测图像输入到建立的目标物检测模型中,以确定所述待检测图像中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
确定模块,用于若根据所述待检测图像中各像素的概率信息确定所述待检测图像中任一像素属于所述目标物的概率大于预设概率,则确定所述待检测图像中包含所述目标物。
8.一种目标物检测模型的建立装置,其特征在于,包括:
获取模块,用于获取目标物的图像样本;
概率确定模块,用于将所述图像样本输入到深度学习网络模型中,以确定所述图像样本中各像素的概率信息,每个像素的概率信息包括该像素属于所述目标物的概率;
损失值确定模块,用于根据所述深度学习网络模型输出的所述图像样本中各像素的概率信息和预先生成的标签图像,确定所述深度学习网络模型的损失值;
调整模块,用于根据所述损失值调整所述深度学习网络模型的参数,建立目标物检测模型。
9.一种电子设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中:
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6任一权利要求所述的方法。
10.一种计算机可读介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行如权利要求1至6任一权利要求所述的方法。
CN201910926688.9A 2019-09-27 2019-09-27 目标物检测、目标物检测模型的建立方法及装置 Active CN110705633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910926688.9A CN110705633B (zh) 2019-09-27 2019-09-27 目标物检测、目标物检测模型的建立方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910926688.9A CN110705633B (zh) 2019-09-27 2019-09-27 目标物检测、目标物检测模型的建立方法及装置

Publications (2)

Publication Number Publication Date
CN110705633A true CN110705633A (zh) 2020-01-17
CN110705633B CN110705633B (zh) 2022-06-07

Family

ID=69198272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910926688.9A Active CN110705633B (zh) 2019-09-27 2019-09-27 目标物检测、目标物检测模型的建立方法及装置

Country Status (1)

Country Link
CN (1) CN110705633B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115272682A (zh) * 2022-07-29 2022-11-01 上海弘玑信息技术有限公司 目标对象检测方法、目标检测模型的训练方法及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030147558A1 (en) * 2002-02-07 2003-08-07 Loui Alexander C. Method for image region classification using unsupervised and supervised learning
US20170147905A1 (en) * 2015-11-25 2017-05-25 Baidu Usa Llc Systems and methods for end-to-end object detection
CN107194393A (zh) * 2016-03-15 2017-09-22 杭州海康威视数字技术股份有限公司 一种检测临时车牌的方法及装置
CN107590482A (zh) * 2017-09-29 2018-01-16 百度在线网络技术(北京)有限公司 信息生成方法和装置
CN109697460A (zh) * 2018-12-05 2019-04-30 华中科技大学 对象检测模型训练方法、目标对象检测方法
CN109784304A (zh) * 2019-01-29 2019-05-21 北京字节跳动网络技术有限公司 用于标注牙齿图像的方法和装置
CN109829456A (zh) * 2017-11-23 2019-05-31 腾讯科技(深圳)有限公司 图像识别方法、装置及终端
CN109886282A (zh) * 2019-02-26 2019-06-14 腾讯科技(深圳)有限公司 对象检测方法、装置、计算机可读存储介质和计算机设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030147558A1 (en) * 2002-02-07 2003-08-07 Loui Alexander C. Method for image region classification using unsupervised and supervised learning
US20170147905A1 (en) * 2015-11-25 2017-05-25 Baidu Usa Llc Systems and methods for end-to-end object detection
CN107194393A (zh) * 2016-03-15 2017-09-22 杭州海康威视数字技术股份有限公司 一种检测临时车牌的方法及装置
CN107590482A (zh) * 2017-09-29 2018-01-16 百度在线网络技术(北京)有限公司 信息生成方法和装置
CN109829456A (zh) * 2017-11-23 2019-05-31 腾讯科技(深圳)有限公司 图像识别方法、装置及终端
CN109697460A (zh) * 2018-12-05 2019-04-30 华中科技大学 对象检测模型训练方法、目标对象检测方法
CN109784304A (zh) * 2019-01-29 2019-05-21 北京字节跳动网络技术有限公司 用于标注牙齿图像的方法和装置
CN109886282A (zh) * 2019-02-26 2019-06-14 腾讯科技(深圳)有限公司 对象检测方法、装置、计算机可读存储介质和计算机设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115272682A (zh) * 2022-07-29 2022-11-01 上海弘玑信息技术有限公司 目标对象检测方法、目标检测模型的训练方法及电子设备

Also Published As

Publication number Publication date
CN110705633B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN109117831B (zh) 物体检测网络的训练方法和装置
CN109117848B (zh) 一种文本行字符识别方法、装置、介质和电子设备
CN111161349B (zh) 物体姿态估计方法、装置与设备
WO2018108129A1 (zh) 用于识别物体类别的方法及装置、电子设备
US20210183097A1 (en) Spare Part Identification Using a Locally Learned 3D Landmark Database
EP3620981A1 (en) Object detection method, device, apparatus and computer-readable storage medium
CN110705531B (zh) 缺失字符检测、缺失字符检测模型的建立方法及装置
CN114066900A (zh) 图像分割方法、装置、电子设备和存储介质
CN113139543B (zh) 目标对象检测模型的训练方法、目标对象检测方法和设备
CN111611797B (zh) 基于Albert模型的预测数据标注的方法、装置及设备
CN109740752B (zh) 深度模型训练方法及装置、电子设备及存储介质
CN110852257B (zh) 一种人脸关键点的检测方法、装置及存储介质
US11314986B2 (en) Learning device, classification device, learning method, classification method, learning program, and classification program
CN110059637B (zh) 一种人脸对齐的检测方法及装置
CN110910445B (zh) 一种物件尺寸检测方法、装置、检测设备及存储介质
CN111814905A (zh) 目标检测方法、装置、计算机设备和存储介质
CN104881673A (zh) 基于信息整合的模式识别的方法和系统
CN115861400B (zh) 目标对象检测方法、训练方法、装置以及电子设备
CN111310826A (zh) 样本集的标注异常检测方法、装置及电子设备
CN113569852A (zh) 语义分割模型的训练方法、装置、电子设备及存储介质
CN113537070A (zh) 一种检测方法、装置、电子设备及存储介质
CN110705633B (zh) 目标物检测、目标物检测模型的建立方法及装置
CN110728229B (zh) 图像处理方法、装置、设备和存储介质
CN117115823A (zh) 一种篡改识别方法、装置、计算机设备和存储介质
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant