CN111062414A - 目标识别方法和装置 - Google Patents

目标识别方法和装置 Download PDF

Info

Publication number
CN111062414A
CN111062414A CN201911094850.1A CN201911094850A CN111062414A CN 111062414 A CN111062414 A CN 111062414A CN 201911094850 A CN201911094850 A CN 201911094850A CN 111062414 A CN111062414 A CN 111062414A
Authority
CN
China
Prior art keywords
potential energy
target
matching
profile
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911094850.1A
Other languages
English (en)
Inventor
李柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingbangda Trade Co Ltd
Beijing Jingdong Qianshi Technology Co Ltd
Original Assignee
Beijing Jingbangda Trade Co Ltd
Beijing Jingdong Qianshi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingbangda Trade Co Ltd, Beijing Jingdong Qianshi Technology Co Ltd filed Critical Beijing Jingbangda Trade Co Ltd
Priority to CN201911094850.1A priority Critical patent/CN111062414A/zh
Publication of CN111062414A publication Critical patent/CN111062414A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种目标识别方法和装置,涉及计算机技术领域。其中,该方法包括:提取待识别目标的轮廓图;获取预先存储的对照物轮廓图的势能场分布;基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。通过以上步骤,能够提高识别效率、提高识别准确率以及识别可靠性。

Description

目标识别方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种目标识别方法和装置。
背景技术
目前,在基于图像进行目标识别(比如识别交通标志)时,主要存在两种方案:模板匹配方案和轮廓特征匹配方案。模板匹配方案由于受光照、镜头光学畸变等因素的影响较大,在工程中的实用性不强,因此现在工程中大多采用轮廓特征匹配方案。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术中,在基于轮廓特征匹配方案进行目标识别时,存在计算效率低下、识别准确率低、可靠性差等问题。
发明内容
有鉴于此,本发明提供一种目标识别方法和装置,能够提高识别效率、提高识别准确率以及识别可靠性。
为实现上述目的,根据本发明的一个方面,提供了一种目标识别方法。
本发明目标识别方法包括:提取待识别目标的轮廓图;获取预先存储的对照物轮廓图的势能场分布;基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。
可选地,所述方法还包括:提取对照物的轮廓图,计算所述对照物的轮廓图上每个像素点的势能,以生成所述对照物轮廓图的势能场分布,并将所述对照物轮廓图的势能场分布进行存储。
可选地,根据如下公式计算所述对照物的轮廓图上每个像素点的势能:
Figure BDA0002268006360000021
其中,APF(a,b)表示对照物的轮廓图上像素点(a,b)处的势能,(xi,yi)表示对照物的轮廓图上每一个轮廓点的位置,m、n为设置的常系数。
可选地,所述最优匹配操作为使匹配质量评估值最大的匹配操作,所述匹配操作为将所述对照物轮廓图的势能场分布经过几何变换后投放在所述待识别目标的轮廓图上;其中,所述几何变换操作包括以下一种或多种:平移、旋转、缩放;以及,所述方法还包括:根据如下公式计算匹配质量评估值:
Figure BDA0002268006360000022
其中,Simi表示匹配质量评估值,K表示待识别目标的轮廓图上的轮廓点个数,APF(ai,bi)表示在匹配操作后所述待识别目标的轮廓图上的任一轮廓点对应的势能。
可选地,所述待识别目标包括:交通标志。
为实现上述目的,根据本发明的另一方面,提供了一种目标识别装置。
本发明的目标识别装置包括:提取模块,用于提取待识别目标的轮廓图;获取模块,用于获取预先存储的对照物轮廓图的势能场分布;匹配模块,用于基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;识别模块,用于在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。
可选地,所述装置还包括:生成模块,用于提取对照物的轮廓图,计算所述对照物的轮廓图上每个像素点的势能,以生成所述对照物轮廓图的势能场分布,并将所述对照物轮廓图的势能场分布进行存储。
可选地,所述生成模块根据如下公式计算所述对照物的轮廓图上每个像素点的势能:
Figure BDA0002268006360000031
其中,APF(a,b)表示对照物的轮廓图上像素点(a,b)处的势能,(xi,yi)表示对照物的轮廓图上每一个轮廓点的位置,m、n为设置的常系数。
为实现上述目的,根据本发明的再一个方面,提供了一种电子设备。
本发明的电子设备,包括:一个或多个处理器;以及,存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明的目标识别方法。
为实现上述目的,根据本发明的又一个方面,提供了一种计算机可读介质。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明的目标识别方法。
上述发明中的一个实施例具有如下优点或有益效果:通过提取待识别目标的轮廓图,基于元启发算法确定预先存储的对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物这些步骤,能够提高识别效率、提高识别准确率以及识别可靠性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明第一个实施例的目标识别方法的主要流程示意图;
图2是根据本发明第二个实施例的目标识别方法的主要流程示意图;
图3是根据本发明第三个实施例的目标识别装置的主要模块的示意图;
图4是根据本发明第四个实施例的目标识别装置的主要模块的示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明中的实施例以及实施例中的特征可以相互组合。
图1是根据本发明第一个实施例的目标识别方法的主要流程示意图。如图1所示,本发明实施例的目标识别方法包括:
步骤S101、提取待识别目标的轮廓图。
示例性地,所述待识别目标可以为交通标志(比如交通指示牌)的、车辆、或者无人机等各种目标。
在该步骤中,可先对待识别目标所在图像进行二值化处理,然后对二值化处理后的图像进行轮廓检测,以得到待识别目标的轮廓图。具体实施时,可采用Canny算法、Sobel算法或者其他轮廓检测算法进行轮廓检测。
步骤S102、获取预先存储的对照物轮廓图的势能场分布。
示例性地,在待识别目标为某种交通标志时,所述对照物轮廓图可以为各种交通标志的轮廓图;在待识别目标为某种车辆时,所述对照物轮廓图可以为各种车辆的轮廓图。
类比于电场中某点的电势等于空间各个带电粒子对该点产生的电势的矢量之和这一物理学模型,本发明实施例引入了轮廓图的势能场的概念。具体来说,可将对照物轮廓图中的轮廓点当做粒子,将整个轮廓图所在平面当成感兴趣范围,在这个感兴趣范围内的每一个像素点都会受到所有粒子的引力或者斥力影响,从而导致在这一点处具有一定的势能。但由于每一个像素点与各个粒子之间的距离不一,因此每个像素点的势能大小也有区别。对照物轮廓图上各个像素点的势能构成了对照物轮廓图的势能场分布。
步骤S103、基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配。
在本发明实施例中,对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行匹配是指将所述对照物轮廓图的势能场分布经过几何变换后投放在所述待识别目标的轮廓图上。其中,所述几何变换操作包括以下一种或多种操作:平移操作、旋转操作、缩放操作。
具体实施时,在对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行某种匹配操作时,还需计算该种匹配操作的匹配质量评估值。进而,可通过元启发算法寻找最优匹配,所述最优匹配是指使匹配质量评估值取得最优值的匹配操作。示例性地,所述元启发算法可以为人工蜂群算法、禁忌搜索算法、模拟退火算法等。
步骤S104、在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。
在一个可选实施方式中,所述最优匹配对应的匹配质量评估值落在预设的取值区间具体为:最优匹配对应的匹配质量评估值大于预设阈值。在另一个可选实施方式中,所述最优匹配对应的匹配质量评估值落在预设的取值区间具体为:最优匹配对应的匹配质量评估值大于或等于预设阈值。
示例性地,假设在步骤S103中所用的对照物为交通标志A,则在满足步骤S104的前提条件(即所述最优匹配对应的匹配质量评估值落在预设的取值区间)时,确定待识别目标为交通标志A;假设在步骤S103中所用的对照物为交通标志A,在所述最优匹配对应的匹配质量评估值没有落在预设的取值区间时,确定待识别目标不是交通标志A。
在本发明实施例中,通过提取待识别目标的轮廓图,基于元启发算法确定预先存储的对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物这些步骤,能够提高识别效率、提高识别准确率以及识别可靠性。
图2是根据本发明第二个实施例的目标识别方法的主要流程示意图。如图2所示,本发明实施例的目标识别方法包括:
步骤S201、提取对照物的轮廓图。
示例性地,在待识别目标为某种交通标志时,所述对照物的轮廓图可以为各种交通标志的轮廓图;在待识别目标为某种车辆时,所述对照物的轮廓图可以为各种车辆的轮廓图。
在该步骤中,可先对对照物所在图像进行二值化处理,然后对二值化处理后的图像进行轮廓检测,以得到对照物的轮廓图。具体实施时,可采用Canny算法、Sobel算法或者其他轮廓检测算法进行轮廓检测。
步骤S202、计算所述对照物的轮廓图上每个像素点的势能,以生成所述对照物轮廓图的势能场分布。
类比于电场中某点的电势等于空间各个带电粒子对该点产生的电势的矢量之和这一物理学模型,本发明实施例引入了轮廓图的势能场的概念。具体来说,可将对照物轮廓图中的轮廓点当做粒子,将整个轮廓图所在平面当成感兴趣范围,在这个感兴趣范围内的每一个像素点都会受到所有粒子的引力或者斥力影响,从而导致在这一点处具有一定的势能。但由于每一个像素点与各个粒子之间的距离不一,因此每个像素点的势能大小也有区别。对照物轮廓图上各个像素点的势能构成了对照物轮廓图的势能场分布。
在一个可选实施方式中,可根据如下公式计算所述对照物的轮廓图上每个像素点的势能:
Figure BDA0002268006360000071
其中,APF(a,b)表示对照物的轮廓图上像素点(a,b)处的势能,(xi,yi)表示对照物的轮廓图上每一个轮廓点的位置,m、n为设置的常系数。
在根据以上可选实施方式计算得到每个像素点的势能后,可根据所述对照物的轮廓图上每个像素点的势能构建所述对照物轮廓图的势能场分布。
步骤S203、将所述对照物轮廓图的势能场分布进行存储。
例如,假设总共对100种交通标志图像进行了步骤S201至步骤S202的处理,则将得到的100种交通标志轮廓图的势能场分布进行存储。具体实施时,可将这100张交通标志轮廓图的势能场分布存储至数据库中。
在本发明实施例中,可预先通过步骤S201至步骤S203离线生成对照物轮廓图的势能场分布,以便于在后续需要进行在线目标识别时使用,能够提高目标识别处理效率。同时,考虑到待检测图像包含杂质,生成势能场的质量不高,本发明通过基于对照物图像生成势能场,并用于后续匹配、识别,有助于提高识别准确率和识别可靠性。
步骤S204、提取待识别目标的轮廓图。
具体实施时,可在接收到请求方的接口调用请求后,执行步骤S204。在该步骤中,可先对待检测图像(即待识别目标所在图像)进行二值化处理,然后对二值化处理后的图像进行轮廓检测,以得到待识别目标的轮廓图。具体实施时,可采用Canny算法、Sobel算法或者其他轮廓检测算法进行轮廓检测。
步骤S205、获取一个对照物轮廓图的势能场分布。
步骤S206、基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配。
在本发明实施例中,对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行匹配是指将所述对照物轮廓图的势能场分布经过几何变换后投放在所述待识别目标的轮廓图上。其中,所述几何变换操作包括以下一种或多种操作:平移操作、旋转操作、缩放操作。
具体实施时,在对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行某种匹配操作时,还需计算该种匹配操作的匹配质量评估值。其中,所述匹配质量评估值用于评价此次匹配操作的效果,即用于评价此次匹配的吸引程度如何。
进一步,可根据如下公式计算匹配质量评估值:
Figure BDA0002268006360000081
其中,Simi表示匹配质量评估值,K表示待识别目标的轮廓图上的轮廓点个数,APF(ai,bi)表示在匹配操作后所述待识别目标的轮廓图上的任一轮廓点对应的势能,即在对照物轮廓图的势能场经过几何变换投放在待识别目标的轮廓图之后,待识别目标的轮廓图中每个轮廓点对应的势能。
进而,可通过元启发算法寻找使通过上市计算得到的匹配质量评估值取得最大值的匹配操作,即最优匹配。其中,所述元启发算法可以为人工蜂群算法、禁忌搜索算法、模拟退火算法等。
以采用人工蜂群算法寻找最优匹配为例,优化变量包括对照物轮廓图势能场几何中心的横向偏移量、纵向偏移量、旋转角度和缩放程度。在优化过程中,对这四个变量不断进行优化从而得到使匹配质量评估值取得最大值的最优匹配。
步骤S207、判断最优匹配对应的匹配质量评估值是否大于预设阈值。
在本发明实施例中,在最优匹配对应的匹配质量评估值大于预设阈值的情况下,执行步骤S208;在最优匹配对应的匹配质量评估值小于或等于预设阈值的情况下,再次执行步骤S05,即获取下一下对照物轮廓图的势能场分布。
步骤S208、将所述待识别目标识别为所述对照物。
例如,假设在步骤S205中获取的对照物轮廓图的势能场为交通标志A的轮廓图势能场,则在所述最优匹配对应的匹配质量评估值大于预设阈值时,确定待识别目标为交通标志A,进而判断出待检测图像中存在交通标志A;在所述最优匹配对应的匹配质量评估值小于或等于预设阈值时,确定待识别目标不是交通标志A,进而可从数据库中获取下一交通标志(比如交通标志B)的轮廓图势能场与待识别目标的轮廓图进行匹配、识别。
进一步,在步骤S208之后,还可将待识别目标在图像中的位置信息、以及待识别目标的识别结果等信息返回给请求方。
在本发明实施例中,类比于微观粒子相似结构相互吸引的概念,从待检测图像(待识别目标所在图像)中提取轮廓图,将轮廓图上的轮廓点当做粒子,将这些粒子与对照物轮廓图对应的势能场分布进行相互匹配,通过势能场对粒子的吸引关系,寻求两者最佳轮廓匹配的位置(即最优匹配),然后在最佳轮廓匹配的位置上对待识别目标进行识别。通过以上步骤,能够提高识别效率、提高识别准确率以及识别可靠性。
图3是根据本发明第三个实施例的目标识别装置的主要模块的示意图。如图3所示,本发明实施例的目标识别装置300包括:提取模块301、获取模块302、匹配模块303、识别模块304。
提取模块301,用于提取待识别目标的轮廓图。
示例性地,所述待识别目标可以为交通标志(比如交通指示牌)的、车辆、或者无人机等各种目标。
具体来说,提取模块301可先对待识别目标所在图像进行二值化处理,然后对二值化处理后的图像进行轮廓检测,以得到待识别目标的轮廓图。具体实施时,可采用Canny算法、Sobel算法或者其他轮廓检测算法进行轮廓检测。
获取模块302,用于获取预先存储的对照物轮廓图的势能场分布。
示例性地,在待识别目标为某种交通标志时,所述对照物轮廓图可以为各种交通标志的轮廓图;在待识别目标为某种车辆时,所述对照物轮廓图可以为各种车辆的轮廓图。
类比于电场中某点的电势等于空间各个带电粒子对该点产生的电势的矢量之和这一物理学模型,本发明实施例引入了轮廓图的势能场的概念。具体来说,可将对照物轮廓图中的轮廓点当做粒子,将整个轮廓图所在平面当成感兴趣范围,在这个感兴趣范围内的每一个像素点都会受到所有粒子的引力或者斥力影响,从而导致在这一点处具有一定的势能。但由于每一个像素点与各个粒子之间的距离不一,因此每个像素点的势能大小也有区别。对照物轮廓图上各个像素点的势能构成了对照物轮廓图的势能场分布。
匹配模块303,用于基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配。
在本发明实施例中,对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行匹配是指将所述对照物轮廓图的势能场分布经过几何变换后投放在所述待识别目标的轮廓图上。其中,所述几何变换操作包括以下一种或多种操作:平移操作、旋转操作、缩放操作。
具体实施时,在对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行某种匹配操作时,还需计算该种匹配操作的匹配质量评估值。进而,可通过元启发算法寻找最优匹配,所述最优匹配是指使匹配质量评估值取得最优值的匹配操作。示例性地,所述元启发算法可以为人工蜂群算法、禁忌搜索算法、模拟退火算法等。
识别模块304,用于在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。
在一个可选实施方式中,所述最优匹配对应的匹配质量评估值落在预设的取值区间具体为:最优匹配对应的匹配质量评估值大于预设阈值。在另一个可选实施方式中,所述最优匹配对应的匹配质量评估值落在预设的取值区间具体为:最优匹配对应的匹配质量评估值大于或等于预设阈值。
示例性地,假设匹配模块进行匹配时所用的对照物为交通标志A,则在所述最优匹配对应的匹配质量评估值落在预设的取值区间时,确定待识别目标为交通标志A;在所述最优匹配对应的匹配质量评估值没有落在预设的取值区间时,确定待识别目标不是交通标志A。
在本发明实施例的装置中,通过提取模块提取待识别目标的轮廓图,通过匹配模块基于元启发算法确定预先存储的对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配,以及,在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,通过识别模块将所述待识别目标识别为所述对照物,能够提高识别效率、提高识别准确率以及识别可靠性。
图4是根据本发明第四个实施例的目标识别装置的主要模块的示意图。如图4所示,本发明实施例的目标识别装置400包括:生成模块401、提取模块402、获取模块403、匹配模块404、识别模块405。
生成模块401,用于提取对照物的轮廓图,计算所述对照物的轮廓图上每个像素点的势能,以生成所述对照物轮廓图的势能场分布,并将所述对照物轮廓图的势能场分布进行存储。
示例性地,生成模块401提取对照物的轮廓图包括:生成模块401可先对对照物所在图像进行二值化处理,然后对二值化处理后的图像进行轮廓检测,以得到对照物的轮廓图。具体实施时,可采用Canny算法、Sobel算法或者其他轮廓检测算法进行轮廓检测。
类比于电场中某点的电势等于空间各个带电粒子对该点产生的电势的矢量之和这一物理学模型,本发明实施例引入了轮廓图的势能场的概念。具体来说,可将对照物轮廓图中的轮廓点当做粒子,将整个轮廓图所在平面当成感兴趣范围,在这个感兴趣范围内的每一个像素点都会受到所有粒子的引力或者斥力影响,从而导致在这一点处具有一定的势能。但由于每一个像素点与各个粒子之间的距离不一,因此每个像素点的势能大小也有区别。对照物轮廓图上各个像素点的势能构成了对照物轮廓图的势能场分布。
在一个可选实施方式中,生成模块401可根据如下公式计算所述对照物的轮廓图上每个像素点的势能:
Figure BDA0002268006360000121
其中,APF(a,b)表示对照物的轮廓图上像素点(a,b)处的势能,(xi,yi)表示对照物的轮廓图上每一个轮廓点的位置,m、n为设置的常系数。
在根据以上可选实施方式计算得到每个像素点的势能后,可根据所述对照物的轮廓图上每个像素点的势能构建所述对照物轮廓图的势能场分布。
在本发明实施例中,可预先通过生成模块401离线生成对照物轮廓图的势能场分布,以便于在后续需要进行在线目标识别时使用,能够提高目标识别处理效率。同时,考虑到待检测图像包含杂质,生成势能场的质量不高,本发明通过基于对照物图像生成势能场,并用于后续匹配、识别,有助于提高识别准确率和识别可靠性。
提取模块402,用于提取待识别目标的轮廓图。
具体实施时,可在接收到请求方的接口调用请求后,通过提取模块提取待识别目标的轮廓图。在一个示例中,提取模块402提取待识别目标的轮廓图包括:提取模块402先对待检测图像(即待识别目标所在图像)进行二值化处理,然后对二值化处理后的图像进行轮廓检测,以得到待识别目标的轮廓图。具体实施时,可采用Canny算法、Sobel算法或者其他轮廓检测算法进行轮廓检测。
获取模块403,用于获取预先存储的对照物轮廓图的势能场分布。
匹配模块404,用于基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配。
在本发明实施例中,对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行匹配是指将所述对照物轮廓图的势能场分布经过几何变换后投放在所述待识别目标的轮廓图上。其中,所述几何变换操作包括以下一种或多种操作:平移操作、旋转操作、缩放操作。
具体实施时,在对所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图进行某种匹配操作时,还需计算该种匹配操作的匹配质量评估值。其中,所述匹配质量评估值用于评价此次匹配操作的效果,即用于评价此次匹配的吸引程度如何。
进一步,匹配模块404可根据如下公式计算匹配质量评估值:
Figure BDA0002268006360000131
其中,Simi表示匹配质量评估值,K表示待识别目标的轮廓图上的轮廓点个数,APF(ai,bi)表示在匹配操作后所述待识别目标的轮廓图上的任一轮廓点对应的势能,即在对照物轮廓图的势能场经过几何变换投放在待识别目标的轮廓图之后,待识别目标的轮廓图中每个轮廓点对应的势能。
进而,匹配模块404可通过元启发算法寻找使通过上市计算得到的匹配质量评估值取得最大值的匹配操作,即最优匹配。其中,所述元启发算法可以为人工蜂群算法、禁忌搜索算法、模拟退火算法等。以采用人工蜂群算法寻找最优匹配为例,优化变量包括对照物轮廓图势能场几何中心的横向偏移量、纵向偏移量、旋转角度和缩放程度。在优化过程中,对这四个变量不断进行优化从而得到使匹配质量评估值取得最大值的最优匹配。
识别模块405,用于判断最优匹配对应的匹配质量评估值是否大于预设阈值,并在最优匹配对应的匹配质量评估值大于预设阈值的情况下,将所述待识别目标识别为所述对照物;在最优匹配对应的匹配质量评估值小于或等于预设阈值的情况下,获取下一下对照物轮廓图的势能场分布继续进行匹配、识别。
在本发明实施例的装置中,通过生成模块离线生成对照物轮廓图的势能场分布,通过提取模块提取待识别目标的轮廓图,通过匹配模块基于元启发算法确定预先存储的对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配,以及,在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,通过识别模块将所述待识别目标识别为所述对照物,能够提高识别效率、提高识别准确率以及识别可靠性。
图5示出了可以应用本发明实施例的目标识别方法或目标识别装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、嵌入式设备(比如车载系统)等等。
服务器505可以是提供各种服务的服务器,例如对利用终端设备501、502、503所发出的请求提供支持的后台管理服务器。后台管理服务器可以对接收到的目标识别请求等数据进行分析等处理,并将处理结果(例如目标识别结果)反馈给终端设备。
需要说明的是,本发明提供的目标识别方法可由服务器505执行,相应地,目标识别装置可设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的计算机系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括提取模块、获取模块、匹配模块和识别模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取对照物轮廓图的势能场分布的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行以下流程:提取待识别目标的轮廓图;获取预先存储的对照物轮廓图的势能场分布;基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种目标识别方法,其特征在于,所述方法包括:
提取待识别目标的轮廓图;
获取预先存储的对照物轮廓图的势能场分布;
基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;
在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
提取对照物的轮廓图,计算所述对照物的轮廓图上每个像素点的势能,以生成所述对照物轮廓图的势能场分布,并将所述对照物轮廓图的势能场分布进行存储。
3.根据权利要求2所述的方法,其特征在于,根据如下公式计算所述对照物的轮廓图上每个像素点的势能:
Figure FDA0002268006350000011
其中,APF(a,b)表示对照物的轮廓图上像素点(a,b)处的势能,(xi,yi)表示对照物的轮廓图上每一个轮廓点的位置,m、n为设置的常系数。
4.根据权利要求1所述的方法,其特征在于,所述最优匹配操作为使匹配质量评估值最大的匹配操作,所述匹配操作为将所述对照物轮廓图的势能场分布经过几何变换后投放在所述待识别目标的轮廓图上;其中,所述几何变换操作包括以下一种或多种:平移、旋转、缩放;以及,所述方法还包括:根据如下公式计算匹配质量评估值:
Figure FDA0002268006350000012
其中,Simi表示匹配质量评估值,K表示待识别目标的轮廓图上的轮廓点个数,APF(ai,bi)表示在匹配操作后所述待识别目标的轮廓图上的任一轮廓点对应的势能。
5.根据权利要求1所述的方法,其特征在于,所述待识别目标包括:交通标志。
6.一种目标识别装置,其特征在于,所述装置包括:
提取模块,用于提取待识别目标的轮廓图;
获取模块,用于获取预先存储的对照物轮廓图的势能场分布;
匹配模块,用于基于元启发算法确定所述对照物轮廓图的势能场分布与所述待识别目标的轮廓图的最优匹配;
识别模块,用于在所述最优匹配对应的匹配质量评估值落在预设的取值区间的情况下,将所述待识别目标识别为所述对照物。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
生成模块,用于提取对照物的轮廓图,计算所述对照物的轮廓图上每个像素点的势能,以生成所述对照物轮廓图的势能场分布,并将所述对照物轮廓图的势能场分布进行存储。
8.根据权利要求7所述的装置,其特征在于,所述生成模块根据如下公式计算所述对照物的轮廓图上每个像素点的势能:
Figure FDA0002268006350000021
其中,APF(a,b)表示对照物的轮廓图上像素点(a,b)处的势能,(xi,yi)表示对照物的轮廓图上每一个轮廓点的位置,m、n为设置的常系数。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至5中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至5中任一所述的方法。
CN201911094850.1A 2019-11-11 2019-11-11 目标识别方法和装置 Pending CN111062414A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911094850.1A CN111062414A (zh) 2019-11-11 2019-11-11 目标识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911094850.1A CN111062414A (zh) 2019-11-11 2019-11-11 目标识别方法和装置

Publications (1)

Publication Number Publication Date
CN111062414A true CN111062414A (zh) 2020-04-24

Family

ID=70298234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911094850.1A Pending CN111062414A (zh) 2019-11-11 2019-11-11 目标识别方法和装置

Country Status (1)

Country Link
CN (1) CN111062414A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115171361A (zh) * 2022-09-02 2022-10-11 广东中科凯泽信息科技有限公司 一种基于计算机视觉的危险行为智能检测预警方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130077830A1 (en) * 2011-09-23 2013-03-28 Ricoh Company, Ltd. Traffic sign detecting method and traffic sign detecting device
CN104732211A (zh) * 2015-03-19 2015-06-24 杭州电子科技大学 一种基于自适应阈值的交通标志检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130077830A1 (en) * 2011-09-23 2013-03-28 Ricoh Company, Ltd. Traffic sign detecting method and traffic sign detecting device
CN103020623A (zh) * 2011-09-23 2013-04-03 株式会社理光 交通标志检测方法和交通标志检测设备
CN104732211A (zh) * 2015-03-19 2015-06-24 杭州电子科技大学 一种基于自适应阈值的交通标志检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BAI LI 等: "An edge-based optimization method for shape recognition using atomic potential function", 《ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115171361A (zh) * 2022-09-02 2022-10-11 广东中科凯泽信息科技有限公司 一种基于计算机视觉的危险行为智能检测预警方法

Similar Documents

Publication Publication Date Title
EP3637317B1 (en) Method and apparatus for generating vehicle damage information
CN108229419B (zh) 用于聚类图像的方法和装置
CN108509915B (zh) 人脸识别模型的生成方法和装置
CN109255337B (zh) 人脸关键点检测方法和装置
CN108629823B (zh) 多视角图像的生成方法和装置
CN108734185B (zh) 图像校验方法和装置
CN109344762B (zh) 图像处理方法和装置
US10970938B2 (en) Method and apparatus for generating 3D information
CN109389072B (zh) 数据处理方法和装置
CN109118456B (zh) 图像处理方法和装置
US20210200971A1 (en) Image processing method and apparatus
CN110414502B (zh) 图像处理方法及装置、电子设备和计算机可读介质
CN109377508B (zh) 图像处理方法和装置
CN111784774B (zh) 目标检测方法、装置、计算机可读介质及电子设备
CN110427915B (zh) 用于输出信息的方法和装置
CN112860993B (zh) 兴趣点的分类方法、装置、设备、存储介质及程序产品
CN112949767A (zh) 样本图像增量、图像检测模型训练及图像检测方法
CN108470179B (zh) 用于检测对象的方法和装置
CN113378855A (zh) 用于处理多任务的方法、相关装置及计算机程序产品
CN109919220B (zh) 用于生成视频的特征向量的方法和装置
CN111062414A (zh) 目标识别方法和装置
CN109523564B (zh) 用于处理图像的方法和装置
CN111027376A (zh) 一种确定事件图谱的方法、装置、电子设备及存储介质
CN110634155A (zh) 一种基于深度学习的目标检测方法和装置
CN113742485A (zh) 一种处理文本的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination