CN111476056A - 目标物体的识别方法、装置、终端设备及计算机存储介质 - Google Patents

目标物体的识别方法、装置、终端设备及计算机存储介质 Download PDF

Info

Publication number
CN111476056A
CN111476056A CN201910063181.5A CN201910063181A CN111476056A CN 111476056 A CN111476056 A CN 111476056A CN 201910063181 A CN201910063181 A CN 201910063181A CN 111476056 A CN111476056 A CN 111476056A
Authority
CN
China
Prior art keywords
image sample
target object
positive image
recognition model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910063181.5A
Other languages
English (en)
Other versions
CN111476056B (zh
Inventor
蔡超
孙文鸿
罗颖瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910063181.5A priority Critical patent/CN111476056B/zh
Publication of CN111476056A publication Critical patent/CN111476056A/zh
Application granted granted Critical
Publication of CN111476056B publication Critical patent/CN111476056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种目标物体的识别方法、装置、终端设备及计算机存储介质。目标物体的识别方法包括:对目标物体对应的正图像样本进行模糊处理,使得正图像样本与显示画面中的目标物体相似度大于设定的相似度阈值;根据目标物体对应的负图像样本以及模糊处理后的正图像样本训练识别模型;根据训练后的识别模型,对显示画面中的目标物体进行识别。本发明实施例提供的方案容错性高于现有的识别方案,还提高了识别目标物体的效率。

Description

目标物体的识别方法、装置、终端设备及计算机存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种目标物体的识别方法、装置、终端设备及计算机存储介质。
背景技术
对于图像或视频等画面中目标物体的识别,现有的方法常常是根据目标物体的几何特征设置对应的检测算法,然后通过检测算法确定图像中与目标物体的几何特征匹配的线条,从而实现目标物体的识别。
上述方案中,只有确定与目标物体的几何特征匹配的线条才能准确的识别,但是,在各种真实场景中,获取的图像由于拍摄技术、目标物体的运动等原因,会导致图像中的目标物体的几何特征不易被识别,进而导致通过现有的检测算法识别目标物体的精度较低,即现有的识别方案容错性较差。
发明内容
有鉴于此,本发明实施例提供一种目标物体的识别方法、装置、终端设备及计算机存储介质,以解决上述问题中的任一个。
根据本发明实施例的第一方面,提供了一种目标物体的识别方法,其包括:对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
根据本发明实施例的第二方面,提供了一种目标物体的识别装置,其包括:模糊处理模块,用于对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;训练模块,用于根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;识别模块,用于根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
根据本发明实施例的第三方面,提供了一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的目标物体的识别方法对应的操作。
根据本发明实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的目标物体的识别方法。
根据本发明实施例提供的目标物体的识别方案,通过对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别,从而可以准确地排除负图像样本对应的物体,并可以识别显示画面中不够清晰的目标物体,即本实施提供的目标物体的识别方案容错性高于现有的识别方案;且本实施例提供的方案还提高了识别目标物体的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例一的一种目标物体的识别方法的步骤流程图;
图2为本发明实施例二的一种目标物体的识别方法的步骤流程图;
图3为本发明实施例三的一种目标物体的识别方法的步骤流程图;
图4为本发明实施例四的一种目标物体的识别装置的结构框图;
图5为本发明实施例五的一种终端设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
实施例一
参照图1,示出了根据本发明实施例一的一种目标物体的识别方法的步骤流程图。
本实施例的目标物体的识别方法包括以下步骤:
S102、对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
本实施例中,目标物体可以为任意一种类别或多种类别的对象(如人脸、动物、球类等)。
目标物体对应的正图像样本可以为通过任意手段获取的包括目标物体的图像,由于在真实场景中目标物体可能处于多个场景、具有多种类别,类别不同可以例如颜色不同。则确定的正图像样本应当尽量包括所有场景下的目标物体、以及尽量包括所有类别的目标物体。且获取的正图像样本应当尽量清晰地表明目标物体的各个特征,以进行准确地识别。
在一个示例中,正图像样本可以为通过网络的图像。在其他示例中,正图像样本也可以为来自任何数据源的图像。
本实施例中,显示画面中具体显示的内容可以为通过相机、手机等拍摄真实场景中的视频或图片。
在真实场景中,由于拍摄技术、目标物体正在运动等原因,使得在真实场景对应的显示画面中,目标物体不够清晰。其中,“清晰”可以理解为能够根据显示画面中目标物体的几何特征等清楚地识别目标物体;“不够清晰”可以理解为根据显示画面中目标物体的几何特征,不能准确地确定目标物体。
因此,本实施例中,通过对目标物体对应的正图像样本进行模糊处理,使其与显示画面中的目标物体相似度大于设定的相似度阈值,进而与真实场景中的目标物体的相似度大于设定的相似度阈值,从而使得通过模糊处理后的正图像样本训练得到的识别模型,可以准确地识别真实场景中的目标物体。
另外,由于真实场景中,不同的拍摄技术、目标物体运动等原因,导致显示画面中目标物体的清晰度不同,则进行模糊处理时,可以对正图像样本进行分批处理,从而得到多批模糊处理后的正图像样本,每一批正图像样本可以对应一个显示画面中目标物体的清晰度范围。
S104、根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型。
本实施例中,根据上述可知,在真实场景中,目标物体可能处于多个场景,则负图像样本对应目标物体的场景中除目标物体的其他物体。例如,若目标物体为篮球,则其处于的目标场景可以为:传球场景、入篮场景、比赛场景等。在各个场景中可能出现的除目标物体的其他物体包括:篮板,篮筐、手、人物,篮球场,海报等。则确定除目标物体的其他物体对应的图像,并将确定的图像作为负图像样本。具体获取负图像样本的方法与上述步骤中获取正图像样本的方法类似,本实施例在此不再赘述。
确定负图像样本后,可以根据负图像样本以及模糊处理后的正图像样本训练识别模型,使得识别模型可以准确地排除负图像样本对应的物体,并可以识别显示画面中不够清晰的目标物体。
S106、根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
根据上述步骤可知,训练后的识别模型可以从真实场景对应的显示画面中准确地排除负图像样本对应的物体,并可以识别显示画面中不够清晰的目标物体。则,本步骤中,可以直接使用训练后的识别模型对显示画面中的目标物体进行识别。
另外,通过训练后的识别模型进行识别时,无需对显示画面进行其他处理,例如去模糊处理等,而是可以直接识别显示画面中的目标物体,使得通过本实施例提供的方案识别目标物体的速度较快,从而提高了识别效率。
本实施例提供的目标物体的识别方案,通过对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别,从而可以准确地排除负图像样本对应的物体,并可以识别显示画面中不够清晰的目标物体,即本实施提供的目标物体的识别方案容错性高于现有的识别方案;且本实施例提供的方案还提高了识别目标物体的效率。
实施例二
参照图2,示出了根据本发明实施例二的一种目标物体的识别方法的步骤流程图。
本实施例中,以目标物体为篮球为例,对方案进行说明,但是并不作为本申请的限定。
本实施例的目标物体的识别方法包括以下步骤:
S202、预先确定篮球对应的正图像样本以及负图像样本。
在预先确定正图像样本时,可以先通过网络确定清晰的若干篮球图片,例如先确定1000张清晰的篮球图片,并将篮球图片进行裁剪,得到仅包括篮球的图片。
在预先确定负图像样本时,可以先分析在真实场景中篮球所处的使用场景,确定使用场景中包括的除篮球之外的物体,例如篮板,篮筐,人物,篮球场,海报等;确定负图像样本时,可以同样通过网络获取篮板、篮筐、人物等对应的图像。例如,可以确定清晰的1000张图像作为负图像样本。
预先确定的正、负图像样本即识别模型的知识库,后续训练识别模型的过程即识别模型学习知识库中知识的过程。训练后的识别模型可以根据学习到的知识库中的知识进行识别,即根据正、负图像样本中的各个特征,识别显示画面中的篮球。
S204、对预先确定的正、负图像样本进行处理。
具体地,对预先确定的正、负图像样本进行处理的流程主要包括:
1)统一所有正、负图像样本的图像尺寸。
具体地,在统一大小时,可以对的正、负图像样本进行补边,使得各个图像的长宽比相同,然后对图像进行长宽等比例缩放,使得所有的图像长宽相同,即所有的正、负图像样本具有相同的图像尺寸。
本实施例中,通过统一正、负图像样本的图像尺寸,使得在进行训练时,可以使用图像尺寸相同的正、负图像样本进行训练,从而降低识别模型对正、负图像样本进行处理的难度。另外,通过对图像进行补边,使得在统一大小的过程中图片中的物体不会发生形变,提高了训练的准确率。
2)对正图像样本进行模糊处理。
由于在真实场景中,篮球主要在打篮球的运动过程中出现,使得篮球是一个运动的物体,再加上拍摄技术、用于拍摄的硬件设备等原因,导致在真实场景对应的显示画面中,篮球存在模糊的可能性极大,即出现显示画面中的篮球可能存在清晰度不足的问题。
针对这种情况,本申请通过对预先确定的正图像样本进行模糊处理,使得处理后的正图像样本中的篮球与显示画面中的篮球的相似度大于设定的相似度阈值。
可选地,进行模糊处理时,可以仅对部分所述正图像样本进行模糊处理,并保留另一部分正图像样本图像不做模糊处理;对应的,在通过步骤S104训练识别模型时,可以根据所述负图像样本、进行模糊处理后的所述正图像样本以及未进行模糊处理的所述正图像样本,训练识别模型。通过仅对一部分正图像样本进行模糊处理,可以使得训练后的识别模型,根据未进行模糊处理的正图像样本准确地确定目标物体的各个特征,以及根据进行模糊处理后的正图像样本确定各个特征被模糊后的结果,从而提高识别模型的准确性。
具体地,本实施例中,可以对所述正图像样本应用高斯模糊和/或运动模糊,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
高斯模糊也叫高斯平滑,通常用于来减少图像噪声以及降低细节层次。本实施例中,根据上述可知,显示画面会存在清晰度不足的问题,则通过对正图像样本应用高斯模糊,可以降低正图像样本的细节层次,使其清晰度接近或等于显示画面的清晰度,进而使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
运动模糊也叫动态模糊,用于使得静态场景下的图片中的对象具有运动效果。根据上述可知,篮球是一个运动的物体,或者拍摄时用于拍摄的手机或相机等存在运动,使得用于拍摄的手机或相机等可能与篮球间存在相对运动,从而使得显示画面中的篮球为运动状态下的篮球,进而导致显示画面不清晰的情况。这种情况在拍摄视频时尤为明显,例如,若观看一个视频录像时,录像中的篮球是运动则,若在观看的过程中按下暂停键,显示画面中显示的并非是清晰的篮球,而是一个处于运动过程的篮球对应的模糊图片。通过对正图像样本进行运动模糊,可以使得其中显示的篮球与处于运动过程的篮球接近或相等,进而使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
具体对正图像样本应用高斯模糊和运动模糊的实现方法可参考相关技术,本实施例在此不再赘述。
3)分别对所述正图像样本以及所述负图像样本进行去中心化处理,以保留所述正图像样本以及所述负图像样本中的差异化部分,使得训练后的所述识别模型对所述差异化信息敏感。
具体地,正图像样本为篮球图像,则对正图像样本进行去中心化处理时,可以将所有的正图像样本均祛除一相同的分量图像,得到正图像样本图像对应的差异化图像,从而通过差异化图像保留有正图像样本中的差异化部分。进而在通过正图像样本训练识别模型后,可以使得训练后的所述识别模型对所述差异化信息敏感,进而使得识别模型可以根据差异化信息,准确地识别出显示画面中的目标物体,提高了识别的准确率。
具体地,可以计算所有正图像样本的平均图像,并将平均图像作为分量图像,通过计算正图像样本以及分量图像的差值,确定差异化图像。
4)将去中心化后的正、负图像样本进行标准化处理,使得图像的值均属于预设范围内。
具体地,图像的值处于预设范围内,是指图像上各个点的像素值属于预设范围内,预设的范围可以为(-1,1)或者(0,1)等。经过标准化处理,可以使得所有的正、负图像样本的值均使用同一范围进行限定,避免由于正、负图像样本使用不同的范围进行衡量导致的训练错误情况,从而保证了训练得到的识别模型的准确性。
S206、根据处理后的正、负图像样本训练识别模型,根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
具体地,在实际使用时,显示画面中播放的具体内容可以为视频,在使用识别模型进行识别时,可以针对视频中的每一帧图像进行识别,并通过识别模型反馈识别结果。
且,在识别时,可以直接识别视频的一帧图像中的目标物体,不需要对该帧图像进行其他处理,从而可以提高识别速度,使得本实施例提供的方案可以及时反馈识别结果,进而可以确定随着视频的播放进度的变化,及时确定目标物体在视频中的位置。
本实施例提供的目标物体的识别方案,通过在预先处理正、负图像样本的过程中,分别对正、负图像样本进行去中心化处理,可以使得训练后的所述识别模型对所述差异化信息敏感,进而使得识别模型可以根据差异化信息,准确地识别出显示画面中的目标物体,提高了识别的准确率。
实施例三
参照图3,示出了根据本发明实施例三的一种目标物体的识别方法的步骤流程图。
本实施例的目标物体的识别方法包括以下步骤:
S302、对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
本步骤的具体实现可参考上述实施例一中的步骤S102,本实施例在此不再赘述。
S304、根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型。
具体地,本实施例中,识别模型具体可以为卷积神经网络识别模型,其卷积层包括深度卷积和点卷积。通过在卷积层中包括深度卷积和点卷积,可以减小卷积层的大小、减小卷积层的参数量、减小卷积层的计算量,使得卷积神经网络模型的大小较小、所需的存储资源以及计算资源变小,进而可以降低卷积神经网络对部署设备的要求,以在步骤S306中可以将卷积神经网络部署至嵌入式设备。
另外,为了提高训练速度,可以根据预先训练的所述卷积层,设置所述卷积神经网络识别模型中深度卷积和点卷积的参数,以初始化所述卷积神经网络识别模型,并根据所述负图像样本以及模糊处理后的所述正图像样本调整所述卷积神经网络识别模型的参数。
由于在实际使用时,通过卷积神经网络识别模型处理图像数据时,卷积层输出的为提取的图像中的不同特征,例如边缘特征、线条特征等;因此预先训练过的卷积层可以在较为类似的多个图像识别领域共用,例如识别篮球图像和识别足球图像可以使用相同或类似的卷积层。
因此,通过预先训练的卷积层设置本申请中的卷积神经网络识别模型中深度卷积和点卷积的参数,从而初始化卷积神经网络识别模型后,在训练的过程中,卷积层中的参数仅需微调即可,与随机生成卷积层的参数并训练相比,上述训练方法使得训练速度大大提高,另外,与随机生成卷积层的参数并训练相比,通过上述方法进行训练时,仅需要少量的正、负图像样本即可,极大地减小了样本的数量,进而降低了采集样本的难度。
进一步地,根据预先训练的所述卷积层,设置所述卷积神经网络识别模型中深度卷积和点卷积的参数,以初始化所述卷积神经网络识别模型后,训练过程中,还需要调整卷积神经网络识别模型中的其他参数,例如,调整激活函数中的参数、调整池化层的参数、调整全连接层的参数等。具体调整的参数可参考现有技术,本实施例对此不再赘述。
另外,在训练过程中,可以将训练后的模型通过预先准备的测试集进行测试,从而评估识别模型对显示画面中目标物体的识别效果。并根据识别效果调整识别模型的超参数,或者调整模型的训练集,得到最终的训练后的识别模型。
S306、将所述训练后的识别模型部署至所述嵌入式设备,以对所述嵌入式设备上显示画面中的目标物体进行识别。
本实施例中,嵌入式设备为包括嵌入式处理器、相关支撑硬件和/或嵌入式软件系统的、可独立工作的“器件”,例如,手机等。
部署至嵌入式设备后,可以通过识别模型识别嵌入式设备的显示画面中的目标物体,且,由于本实施例提供的方案,在识别时无需对显示画面进行其他处理,使得识别显示画面中目标物体的效率较高,即可以通过识别模型快速识别目标物体,并提供识别结果。
在实际应用时,可以通过嵌入式设备中的播放器,例如手机播放器等,播放录制的视频,并通过本实施例提供的识别模型识别视频中的目标物体,例如篮球等,然后可以提示用户在嵌入式设备的屏幕中圈出目标物体,并结合识别模型的识别结果确定用户是否准确圈出了目标物体,从而实现了在播放器播放的过程中与用户的互动。
本实施例一、二、三提供的目标物体的识别方法可以由任意适当的具有数据处理能力的终端设备执行,包括但不限于:移动终端(如平板电脑、手机等)和PC机。
实施例四
参照图4,示出了根据本发明实施例四的一种目标物体的识别装置的结构框图。
本实施例的目标物体的识别装置包括以下模块:模糊处理模块402、训练模块404、识别模块406。
模糊处理模块402,用于对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;
训练模块404,用于根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;
识别模块406,用于根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
可选地,本申请任意实施例中,所述训练后的识别模型部署至所述嵌入式设备,以对所述嵌入式设备上显示画面中的目标物体进行识别。
可选地,本申请任意实施例中,所述识别模型为卷积神经网络识别模型,其卷积层包括深度卷积和点卷积。
可选地,本申请任意实施例中,所述训练模块包括:训练子模块,用于根据预先训练的所述卷积层,设置所述卷积神经网络识别模型中深度卷积和点卷积的参数,以初始化所述卷积神经网络识别模型,并根据所述负图像样本以及模糊处理后的所述正图像样本调整所述卷积神经网络识别模型的参数。
可选地,本申请任意实施例中,所述模糊处理模块具体用于:对所述正图像样本应用高斯模糊和/或运动模糊,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
可选地,本申请任意实施例中,所述模糊处理具体用于对部分所述正图像样本进行模糊处理;所述训练模块具体用于根据所述负图像样本、进行模糊处理后的所述正图像样本以及未进行模糊处理的所述正图像样本,训练识别模型。
可选地,本申请任意实施例中,还包括:去中心化模块,用于分别对所述正图像样本以及所述负图像样本进行去中心化处理,以保留所述正图像样本以及所述负图像样本中的差异化部分,使得训练后的所述识别模型对所述差异化信息敏感。
本实施例提供的目标物体的识别方案,通过对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别,从而可以准确地排除负图像样本对应的物体,并可以识别显示画面中不够清晰的目标物体,即本实施提供的目标物体的识别方案容错性高于现有的识别方案;且本实施例提供的方案还提高了识别目标物体的效率。
实施例五
一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上所述的目标物体的识别方法对应的操作。
具体地,参照图5,示出了根据本发明实施例五的一种终端设备的结构示意图,本发明具体实施例并不对终端设备的具体实现做限定。
如图5所示,该终端设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:
处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它终端设备或服务器进行通信。
处理器502,用于执行程序510,具体可以执行上述目标物体的识别方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
在一种可选的实施方式中,所述训练后的识别模型部署至所述嵌入式设备,以对所述嵌入式设备上显示画面中的目标物体进行识别。
在一种可选的实施方式中,所述识别模型为卷积神经网络识别模型,其卷积层包括深度卷积和点卷积。
在一种可选的实施方式中,所述根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型包括:根据预先训练的所述卷积层,设置所述卷积神经网络识别模型中深度卷积和点卷积的参数,以初始化所述卷积神经网络识别模型,并根据所述负图像样本以及模糊处理后的所述正图像样本调整所述卷积神经网络识别模型的参数。
在一种可选的实施方式中,所述对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的目标物体相似度大于设定的相似度阈值包括:对所述正图像样本应用高斯模糊和/或运动模糊,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
在一种可选的实施方式中,所述对目标物体对应的正图像样本进行模糊处理包括:对部分所述正图像样本进行模糊处理;所述根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型包括:根据所述负图像样本、进行模糊处理后的所述正图像样本以及未进行模糊处理的所述正图像样本,训练识别模型。
在一种可选的实施方式中,还包括:分别对所述正图像样本以及所述负图像样本进行去中心化处理,以保留所述正图像样本以及所述负图像样本中的差异化部分,使得训练后的所述识别模型对所述差异化信息敏感。
程序510中各步骤的具体实现可以参见上述目标物体的识别方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
本实施例的终端设备,通过对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别,从而可以准确地排除负图像样本对应的物体,并可以识别显示画面中不够清晰的目标物体,即本实施提供的目标物体的识别方案容错性高于现有的识别方案;且本实施例提供的方案还提高了识别目标物体的效率。
实施例六
本实施例提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的目标物体的识别方法。
本实施例的计算机存储介质,通过对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别,从而可以准确地排除负图像样本对应的物体,并可以识别显示画面中不够清晰的目标物体,即本实施提供的目标物体的识别方案容错性高于现有的识别方案;且本实施例提供的方案还提高了识别目标物体的效率。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的目标物体的识别方法。此外,当通用计算机访问用于实现在此示出的目标物体的识别方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的目标物体的识别方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

Claims (16)

1.一种目标物体的识别方法,其特征在于,包括:
对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;
根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;
根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
2.根据权利要求1所述的方法,其特征在于,所述训练后的识别模型部署至所述嵌入式设备,以对所述嵌入式设备上显示画面中的目标物体进行识别。
3.根据权利要求1所述的方法,其特征在于,所述识别模型为卷积神经网络识别模型,其卷积层包括深度卷积和点卷积。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型包括:
根据预先训练的所述卷积层,设置所述卷积神经网络识别模型中深度卷积和点卷积的参数,以初始化所述卷积神经网络识别模型,并根据所述负图像样本以及模糊处理后的所述正图像样本调整所述卷积神经网络识别模型的参数。
5.根据权利要求1所述的方法,其特征在于,所述对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的目标物体相似度大于设定的相似度阈值包括:
对所述正图像样本应用高斯模糊和/或运动模糊,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
6.根据权利要求1所述的方法,其特征在于,所述对目标物体对应的正图像样本进行模糊处理包括:对部分所述正图像样本进行模糊处理;
所述根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型包括:
根据所述负图像样本、进行模糊处理后的所述正图像样本以及未进行模糊处理的所述正图像样本,训练识别模型。
7.根据权利要求1所述的方法,其特征在于,还包括:分别对所述正图像样本以及所述负图像样本进行去中心化处理,以保留所述正图像样本以及所述负图像样本中的差异化部分,使得训练后的所述识别模型对所述差异化信息敏感。
8.一种目标物体的识别装置,其特征在于,包括:
模糊处理模块,用于对目标物体对应的正图像样本进行模糊处理,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值;
训练模块,用于根据所述目标物体对应的负图像样本以及模糊处理后的所述正图像样本训练识别模型;
识别模块,用于根据训练后的所述识别模型,对所述显示画面中的所述目标物体进行识别。
9.根据权利要求8所述的装置,其特征在于,所述训练后的识别模型部署至所述嵌入式设备,以对所述嵌入式设备上显示画面中的目标物体进行识别。
10.根据权利要求8所述的装置,其特征在于,所述识别模型为卷积神经网络识别模型,其卷积层包括深度卷积和点卷积。
11.根据权利要求10所述的装置,其特征在于,所述训练模块包括:训练子模块,用于根据预先训练的所述卷积层,设置所述卷积神经网络识别模型中深度卷积和点卷积的参数,以初始化所述卷积神经网络识别模型,并根据所述负图像样本以及模糊处理后的所述正图像样本调整所述卷积神经网络识别模型的参数。
12.根据权利要求8所述的装置,其特征在于,所述模糊处理模块具体用于:
对所述正图像样本应用高斯模糊和/或运动模糊,使得所述正图像样本与显示画面中的所述目标物体相似度大于设定的相似度阈值。
13.根据权利要求8所述的装置,其特征在于,所述模糊处理具体用于对部分所述正图像样本进行模糊处理;
所述训练模块具体用于根据所述负图像样本、进行模糊处理后的所述正图像样本以及未进行模糊处理的所述正图像样本,训练识别模型。
14.根据权利要求8所述的装置,其特征在于,还包括:去中心化模块,用于分别对所述正图像样本以及所述负图像样本进行去中心化处理,以保留所述正图像样本以及所述负图像样本中的差异化部分,使得训练后的所述识别模型对所述差异化信息敏感。
15.一种终端设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7任一项所述的目标物体的识别方法对应的操作。
16.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-7中任一项所述的目标物体的识别方法。
CN201910063181.5A 2019-01-23 2019-01-23 目标物体的识别方法、装置、终端设备及计算机存储介质 Active CN111476056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910063181.5A CN111476056B (zh) 2019-01-23 2019-01-23 目标物体的识别方法、装置、终端设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910063181.5A CN111476056B (zh) 2019-01-23 2019-01-23 目标物体的识别方法、装置、终端设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN111476056A true CN111476056A (zh) 2020-07-31
CN111476056B CN111476056B (zh) 2024-04-16

Family

ID=71743750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910063181.5A Active CN111476056B (zh) 2019-01-23 2019-01-23 目标物体的识别方法、装置、终端设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111476056B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541867A (zh) * 2020-12-04 2021-03-23 Oppo(重庆)智能科技有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN112766387A (zh) * 2021-01-25 2021-05-07 海尔数字科技(上海)有限公司 一种训练数据的纠错方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6578017B1 (en) * 1999-02-26 2003-06-10 Information Decision Technologies, Llc Method to aid object detection in images by incorporating contextual information
CN105844627A (zh) * 2016-03-21 2016-08-10 华中科技大学 一种基于卷积神经网络的海面目标图像背景抑制方法
CN105913003A (zh) * 2016-04-07 2016-08-31 国家电网公司 一种多特征多模型的行人检测方法
CN108596249A (zh) * 2018-04-24 2018-09-28 苏州晓创光电科技有限公司 图像特征提取及分类的方法和装置
WO2018214195A1 (zh) * 2017-05-25 2018-11-29 中国矿业大学 一种基于卷积神经网络的遥感图像桥梁检测方法
CN108921218A (zh) * 2018-06-29 2018-11-30 炬大科技有限公司 一种目标物体检测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6578017B1 (en) * 1999-02-26 2003-06-10 Information Decision Technologies, Llc Method to aid object detection in images by incorporating contextual information
CN105844627A (zh) * 2016-03-21 2016-08-10 华中科技大学 一种基于卷积神经网络的海面目标图像背景抑制方法
CN105913003A (zh) * 2016-04-07 2016-08-31 国家电网公司 一种多特征多模型的行人检测方法
WO2018214195A1 (zh) * 2017-05-25 2018-11-29 中国矿业大学 一种基于卷积神经网络的遥感图像桥梁检测方法
CN108596249A (zh) * 2018-04-24 2018-09-28 苏州晓创光电科技有限公司 图像特征提取及分类的方法和装置
CN108921218A (zh) * 2018-06-29 2018-11-30 炬大科技有限公司 一种目标物体检测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
B.BABENKO ET AL: "Visual tracking with online multiple instance learning", 《PROCESSINGS OF IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, pages 239 - 240 *
何长婷: "课堂签到系统中的人脸识别方法研究与实现", 《中国优秀硕士学位论文全文数据库》 *
王国省等: "《基于图像先验建模的超分辨增强理论与算法》", pages: 239 - 240 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541867A (zh) * 2020-12-04 2021-03-23 Oppo(重庆)智能科技有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN112766387A (zh) * 2021-01-25 2021-05-07 海尔数字科技(上海)有限公司 一种训练数据的纠错方法、装置、设备及存储介质
CN112766387B (zh) * 2021-01-25 2024-01-23 卡奥斯数字科技(上海)有限公司 一种训练数据的纠错方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111476056B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN110176027B (zh) 视频目标跟踪方法、装置、设备及存储介质
CN110232369B (zh) 一种人脸识别方法和电子设备
CN109325954B (zh) 图像分割方法、装置及电子设备
CN109325933A (zh) 一种翻拍图像识别方法及装置
CN108337505B (zh) 信息获取方法和装置
CN111311523B (zh) 图像处理方法、装置、系统和电子设备
CN109740547A (zh) 一种图像处理方法、设备及计算机可读存储介质
US20120154638A1 (en) Systems and Methods for Implementing Augmented Reality
CN109413411B (zh) 一种监控线路的黑屏识别方法、装置及服务器
CN114511041B (zh) 模型训练方法、图像处理方法、装置、设备和存储介质
CN113657528B (zh) 图像特征点提取方法、装置、计算机终端及存储介质
CN111028276A (zh) 图像对齐方法、装置、存储介质及电子设备
CN111476056B (zh) 目标物体的识别方法、装置、终端设备及计算机存储介质
CN111179195A (zh) 深度图像空洞填充方法、装置、电子设备及其存储介质
CN109784322A (zh) 一种基于图像处理的vin码识别方法、设备及介质
WO2020189265A1 (ja) 回転状態推定装置、方法及びプログラム
CN116152166A (zh) 基于特征相关性的缺陷检测方法及相关装置
KR101080375B1 (ko) 객체 학습 방법, 객체 학습 방법을 이용한 객체 추적 방법, 객체 학습 및 추적 시스템
CN112766028A (zh) 人脸模糊处理方法、装置、电子设备及存储介质
CN114613006A (zh) 一种远距离手势识别方法及装置
CN113658196A (zh) 红外图像中船舶的检测方法、装置、电子设备和介质
CN111179245B (zh) 图像质量检测方法、装置、电子设备和存储介质
CN111160340B (zh) 一种运动目标检测方法、装置、存储介质及终端设备
CN110751163B (zh) 目标定位方法及其装置、计算机可读存储介质和电子设备
CN117218633A (zh) 一种物品检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant