CN110390344B - 备选框更新方法及装置 - Google Patents
备选框更新方法及装置 Download PDFInfo
- Publication number
- CN110390344B CN110390344B CN201810355286.3A CN201810355286A CN110390344B CN 110390344 B CN110390344 B CN 110390344B CN 201810355286 A CN201810355286 A CN 201810355286A CN 110390344 B CN110390344 B CN 110390344B
- Authority
- CN
- China
- Prior art keywords
- candidate
- box
- candidate frame
- updated
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 239000013598 vector Substances 0.000 claims abstract description 90
- 238000004364 calculation method Methods 0.000 claims description 43
- 230000000717 retained effect Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 7
- 238000012216 screening Methods 0.000 description 31
- 230000001629 suppression Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种备选框更新方法及装置,涉及计算机领域。备选框更新方法,包括:根据第一备选框的位置信息和位置向量,得到第一备选框与多个第二备选框的重叠度,第一备选框为备选框集合中分类器得分最高的备选框,第二备选框为备选框集合中除第一备选框之外的备选框,位置向量包括多个第二备选框的位置信息;将第一备选框与多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合。利用本申请的技术方案能够提高更新备选框的效率,进而提高图像识别和检测的工作效率。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种备选框更新的方法及装置。
背景技术
非极大值抑制(英文:Non-Maximum Suppression,NMS)被广泛应用在计算机视觉算法中,比如,人脸识别、边缘检测或目标检测等方面。分类器为NMS计算机视觉算法中的重要部分,其可以用于检测图像中的对象,比如是否为人脸等,针对图像中的一个对象,分类器会产生多个备选框。分类器会对每一个备选框计算分类器得分。为了能够准确地进行对象的检测或识别,对于一个对象只保留一个最优的备选框,将最优的备选框中的内容作为识别或检测出的对象。
具体的,选取图像中所有备选框中分类器得分最高的备选框,遍历计算其他备选框与分类器得分最高的备选框的重叠面积,根据重叠面积删除其他备选框中的部分备选框。在未被删除的其他备选框中再次选取分类器得分最高的备选框,再次执行重叠面积的遍历计算,直至除最优备选框外的其他备选框全部被删除。在较复杂的图像中,备选框的数目非常大,导致遍历计算量增大,从而使得NMS算法的计算量也随之增大,降低了图像识别和检测的工作效率。
发明内容
本申请提供了一种备选框更新的方法及装置,能够提高更新备选框的效率,进而提高图像识别和检测的工作效率。
第一方面,本申请提供了一种备选框更新方法,包括:根据第一备选框的位置信息和位置向量,得到第一备选框与多个第二备选框的重叠度,第一备选框为备选框集合中分类器得分最高的备选框,第二备选框为备选框集合中除第一备选框之外的备选框,位置向量包括多个第二备选框的位置信息;将第一备选框与多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合。
在本申请实施例中,利用第一备选框的位置信息和位置向量,通过一次计算即可得到第一备选框与多个第二备选框的重叠度。并可利用计算得到的第一备选框与第二备选框的重叠度与重叠度阈值,得到更新后的备选框集合中的备选框。在更新备选框的过程中,利用位置向量可大大减少更新备选框集合中的备选框所需要的时间,提高了更新备选框的效率,从而提高了利用本申请中备选框更新方法的NMS方法的效率,进而提高了图像识别和检测的工作效率。
在第一方面的一种实现方式中,将第一备选框与多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合,包括:在多个第二备选框中的第二备选框和第一备选框的重叠度小于或等于重叠度阈值时,确定第二备选框保留在更新后的备选框集合中;在多个第二备选框中的第二备选框和第一备选框的重叠度大于重叠度阈值时,确定第二备选框不保留在更新后的备选框集合中。
保留与第一备选框的重叠度小于或等于重叠度阈值的第二备选框作为更新后的备选框集合中的备选框,删除与第一备选框的重叠度大于重叠度阈值的第二备选框。从而减少了参与下一次备选框集合更新的备选框的数目,相应减小了下一次备选框集合更新所需的运算量和占用资源,进一步提高了备选框集合更新的效率。
在第一方面的一种实现方式中,备选框更新方法还包括:利用更新后的备选框集合中的第一备选框的位置信息和更新后的位置向量,得到更新后的备选框集合中的第一备选框与更新后的备选框集合中多个第二备选框的重叠度,更新后的位置向量包括更新后的备选框集合中的多个第二备选框的位置信息;将更新后的备选框集合中的第一备选框与更新后的备选框集合中的多个第二备选框的重叠度和重叠度阈值进行比较以再次得到更新后的备选框集合,直至更新后的备选框集合中的第一备选框与更新后的备选框集合中的第二备选框的重叠度均大于重叠度阈值,停止对备选框集合的更新;将备选框集合中的第一备选框和每次更新后的备选框集合中的第一备选框,作为目标识别框。
在图像中存在多个目标对象的场景下,通过多次更新备选框集合中的备选框,可得到多个目标识别框,每个目标识别框可识别一个目标对象。而且,在每次更新备选框集合利用位置向量得到第一备选框与第二备选框的重叠度,可减少识别图像中多个目标对象所花费的时间,提高了识别图像中多个目标对象的工作效率。
在第一方面的一种实现方式中,备选框集合中包含多个用于识别图像中人脸的备选框。
第二方面,本申请提供了一种备选框更新装置,包括:重叠度获取模块,用于根据第一备选框的位置信息和位置向量,得到第一备选框与多个第二备选框的重叠度,第一备选框为备选框集合中分类器得分最高的备选框,第二备选框为备选框集合中除第一备选框之外的备选框,位置向量包括多个第二备选框的位置信息;更新模块,用于将第一备选框与多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合。
在第二方面的一种实现方式中,更新模块具体用于:在多个第二备选框中的第二备选框和第一备选框的重叠度小于或等于重叠度阈值时,确定第二备选框保留在更新后的备选框集合中;在多个第二备选框中的第二备选框和第一备选框的重叠度大于重叠度阈值时,确定第二备选框不保留在更新后的备选框集合中。
在第二方面的一种实现方式中,重叠度获取模块还用于利用更新后的备选框集合中的第一备选框的位置信息和更新后的位置向量,得到更新后的备选框集合中的第一备选框与更新后的备选框集合中多个第二备选框的重叠度,更新后的位置向量包括更新后的备选框集合中的多个第二备选框的位置信息;更新模块还用于将更新后的备选框集合中的第一备选框与更新后的备选框集合中的多个第二备选框的重叠度和重叠度阈值进行比较以再次得到更新后的备选框集合,直至重叠度获取模块得到的更新后的备选框集合中的第一备选框与更新后的备选框集合中的第二备选框的重叠度均大于重叠度阈值,更新模块用于停止对备选框集合的更新,并用于将备选框集合中的第一备选框和每次更新后的备选框集合中的第一备选框,作为目标识别框。
在第二方面的一种实现方式中,备选框集合中包含多个用于识别图像中人脸的备选框。
第二方面以及第二方面的实现方式中的备选框更新装置也可达到与上述技术方案中的备选框更新方法相同的技术效果。
第三方面,本申请提供了一种备选框更新装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现如上述技术方案中的备选框更新方法,可达到与上述技术方案中的备选框更新方法相同的技术效果。
第四方面,本申请提供了一种存储介质,其上存储有程序,程序被处理器执行时实现如上述技术方案中的备选框更新方法,可达到与上述技术方案中的备选框更新方法相同的技术效果。
附图说明
图1为本申请实施例中一种备选框更新方法的流程图;
图2为本申请实施例中一种非极大值抑制的方法的流程图;
图3为本申请实施例中NMS计算中两次筛选的备选框的变化示意图;
图4为本申请实施例中被测图像中的备选框示意图;
图5为本申请实施例中一种备选框更新装置的结构示意图;
图6为本申请实施例中的一种备选框更新装置的硬件结构示意图。
具体实施方式
本申请提供了一种备选框更新方法及装置,可应用于视觉图像处理的场景中。在视觉图像处理的场景中,需要在被测图像中识别目标对象或追踪目标对象。为了标识被测图像中的目标对象,可生成目标识别框。目标识别框中的内容即为被测图像中的目标对象。在识别目标对象的过程中,对于一个目标对象可能会产生多个识别框,这多个识别框均为目标识别框的备选,在下文中简称为备选框(包括第一备选框和第二备选框)。在一个目标对象的备选框中筛选出最优的备选框(即第一备选框)作为目标备选框。在一些情况下,被测图像中可能包括多个目标对象,则需要进行多轮备选框的筛选,得到所有目标对象对应的最优的备选框。除最后一轮备选框的筛选以外的每一轮备选框的筛选均会更新得到下一轮备选框的筛选中被筛选的备选框集合。备选框集合中的备选框的更新即可采用本申请中的备选框更新方法。
在本申请实施例中,可通过在图像处理设备中增加向量处理单元或在图像处理设备中已有的单元中增添向量处理功能实现本申请实施例中的备选框更新。本申请实施例中的备选框更新具体可应用于非极大值抑制(英文:Non-Maximum Suppression,NMS)的方法中。NMS方法可用于视觉图像处理的目标对象识别中。在一个示例中,图像处理设备可具体为非极大值抑制设备。非极大值抑制设备可采集非极大值抑制数据,非极大值抑制数据包括被测图像中备选框的分类器得分以及备选框的位置信息等。采集的非极大值抑制数据可通过集成直接存储访问(英文:Integrated Direct Memory Access,IDMA)从系统双倍数据速率(英文:Double Data Rate,DDR)分批次传输本地存储空间(即Local Memory)中。本地存储空间大小是有限的,需要将系统DDR中的非极大值抑制数据分批传输至本地存储空间中。非极大值抑制设备中实现向量处理功能的单元可根据向量化指令和非极大值抑制数据生成位置向量,并进行位置向量与其他数据的计算,直至得到被测图像中的所有识别目标对象或追踪目标对象的目标识别框。
图1为本申请实施例中一种备选框更新方法的流程图。如图1所示,备选框更新方法可包括步骤S101和步骤S102。
在步骤S101中,根据第一备选框的位置信息和位置向量,得到第一备选框与多个第二备选框的重叠度。
其中,第一备选框为备选框集合中分类器得分最高的备选框。第二备选框为备选框集合中除第一备选框之外的备选框。备选框集合包括多个备选框。位置信息可表征备选框在被测图像中的位置。比如,备选框为矩形框,则位置信息可为矩形框的四个顶点在被测图像中的坐标,或者,位置信息可为矩形框的一对位于对角线上的顶点在被测图像中的坐标。根据两个备选框的位置信息,可计算这两个备选框的重叠度。
位置向量包括多个第二备选框的位置信息。也就是说,位置向量包括多个元素,一个元素为一个第二备选框的位置信息。利用第一备选框的位置信息与位置向量,可一次性计算得到第一备选框和多个第二备选框的重叠度。
在步骤S102中,将第一备选框与多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合。
需要说明的是,重叠度可以为重叠面积(Intersection Over Union,IOU),也可为重叠面积占备选框面积的比例,在此并不限定。对应的,重叠度阈值可以为重叠面积阈值,也可以为重叠面积占备选框面积的比例阈值,在此也并不限定。
其中,保留与第一备选框的重叠度小于或等于重叠度阈值的第二备选框作为更新后的备选框集合中的备选框。与第一备选框的重叠度大于重叠度阈值的第二备选框不保留在更新后的备选框集合中。比如,将与第一备选框的重叠度大于重叠度阈值的第二备选框删除。即与第一备选框的重叠度大于重叠度阈值的第二备选框不参与下一轮备选框筛选。减小了下一轮备选框集合更新时所需的计算量,也减小了下一轮备选框集合更新时计算所占用的资源,提高了备选框集合更新的效率,从而进一步提高了NMS方法的效率。
利用本申请实施例的备选框更新方法可实现NMS方法,具体的,可利用更新后的备选框集合重复步骤S101和步骤S102中的重叠度计算以及备选框集合更新的内容,直至更新后的备选框集合中的第一备选框与更新后的备选框集合中的第二备选框的重叠度均大于重叠度阈值,可停止对备选框集合的更新。在多次对备选框进行更新的过程中得到的所有第一备选框可作为目标识别框。
在本申请实施例中,利用第一备选框的位置信息和位置向量,通过一次计算即可得到第一备选框与多个第二备选框的重叠度。并可利用计算得到的第一备选框与第二备选框的重叠度与重叠度阈值,得到更新后的备选框集合中的备选框。在更新备选框的过程中,利用位置向量可大大减少在更新备选框集合中的备选框所需要的时间,提高了更新备选框的效率,从而提高了利用本申请实施例中备选框更新方法的NMS方法的效率,进而提高了图像识别和检测的工作效率。
下面将以采用非极大值抑制方法识别被测图像中的目标对象为例,说明利用备选框更新方法的非极大值抑制方法以及其中的备选框更新方法的细节内容。
图2为本申请实施例中一种非极大值抑制的方法的流程图。如图2所示,非极大值抑制的方法可包括步骤S201至步骤S205。
在步骤S201中,在备选框集合中,选取分类器得分最高的备选框作为第一备选框。
其中,初始的备选框集合包括被测图像上的所有备选框。分类器会对每个备选框计算分类器得分。将被测图像及被测图像上的备选框输入分类器,则可得到被测图像上每个备选框的分类器得分。分类器可通过机器学习逐步完善分类打分标准。分类器得分体现了每个备选框与被测图像中的目标对象的匹配程度。备选框的分类器得分越高,表示该备选框与被测图像中的目标对象的匹配程度越高。
对于被测图像中的每个目标对象都可能产生多个备选框。为了能够识别出被测图像中的与每个目标对象最匹配的第一备选框,需要进行多次筛选。在每次筛选中均可得到一个第一备选框,第一备选框即为与目标对象最匹配的备选框。比如,可选取分类器得分最高的备选框作为第一备选框。
本申请实施例中的备选框更新方法以及NMS方法可应用于人脸识别、边缘检测或目标检测等场景中。比如,在人脸识别场景中,备选框集合包含多个用于识别图像中人脸的备选框。利用本申请实施例中的备选框更新方法以及NMS方法可更高效率的识别图像中的人脸。
在步骤S202中,利用第二备选框的位置信息,生成位置向量。
其中,第二备选框包括备选框集合中除第一备选框外的备选框。比如,被测图像中共有6个备选框,6个备选框分别为D1、D2、D3、D4、D5和D6。其中,备选框D1的分类器得分为0.98,备选框D2的分类器得分为0.81,备选框D3的分类器得分为0.69,备选框D4的分类器得分为0.48,备选框D5的分类器得分为0.24,备选框D6的分类器得分为0.58。则在第一次筛选中,第一备选框为备选框D1,第二备选框为备选框D2、备选框D3、备选框D4、备选框D5和备选框D6。
需要说明的是,生成的位置向量的数目可以为一个,也可以为多个,在此并不限定。每个位置向量包括多个第二备选框的位置信息。每个第二备选框的位置信息均可作为位置向量中的一个元素。位置向量中的元素数目可预先设定,比如根据具体工作场景以及工作需求设定,在此并不限定。
在一个示例中,第二备选框的数目可以被位置向量预设的元素数目整除,即生成了至少一个位置向量。则在备选框更新过程中,根据第一备选框的位置信息和至少一个位置向量,得到第一备选框与所有第二备选框的重叠度。比如,在一次备选框更新的过程中,预设位置向量的元素数目为4个,第二备选框的数目为8个,则可生成2个位置向量。
在另一个示例中,第二备选框的数目不可以被位置向量预设的元素数目整除,则在生成至少一个位置向量的基础上,还存在未形成位置向量的整数个单个第二备选框的位置信息。在备选框更新过程中,可根据第一备选框的位置信息和至少一个位置向量,得到第一备选框与位置向量涉及的第二备选框的重叠度。此外,还可利用第一备选框的位置信息分别与整数个单个第二备选框的位置信息,得到第一备选框与这整数个单个第二备选框的重叠度。比如,在一次筛选中,第二备选框共有8个,预设位置向量的元素数目为3个,则生成2个位置向量和2个单个的第二备选框的位置信息。
在上述实施例中,可按照分类器得分从高到低的顺序将第二备选框排序,并按照分类器得分由高至低的顺序将每预设位置向量的元素数目个第二备选框的位置信息作为一个位置向量。第二备选框的数目与预设位置向量的元素数目求商得到的余数,按照第二备选框的分类器得分从低到高的排列顺序,选取余数个第二备选框。将余数个第二备选框的位置信息,作为整数个单个第二备选框的位置信息。也就是说,若在生成至少一个位置向量的基础上,还存在未形成位置向量的P个第二备选框的位置信息,P为正整数。则这P个第二备选框的位置信息为分类器得分最低的P个第二备选框的位置信息。
在步骤S203中,对第一备选框的位置信息和位置向量进行向量计算,得到第一备选框与第二备选框的重叠度。
可在需要进行向量计算的情况下,生成向量化指令,根据向量化指令触发向量计算。向量计算可一次性计算第一备选框与一个位置向量中的多个第二备选框的重叠度。比如,设第二备选框的数目为8,位置向量中的元素数目为4个。若采用现有技术中的NMS方法,在一次筛选中想得到第一备选框与所有8个第二备选框的重叠度,需要进行8次计算。而采用本申请实施例中的NMS方法,在一次筛选中想得到第一备选框与所有8个第二备选框的重叠度,只需要进行两次计算。大大的缩减了NMS方法中的计算量,降低了NMS方法所花费的计算时间。
在步骤S204中,第一备选框与第二备选框的重叠度并非均大于重叠度阈值的情况下,则将备选框集合更新为,包括与第一备选框的重叠度小于或等于重叠度阈值的第二备选框。
在步骤S205中,第一备选框与第二备选框的重叠度均大于重叠度阈值的情况下,停止对备选框集合的更新。
在被测图像中包括多个备选框的场景中,可能需要进行多次筛选。每次筛选中均需选取第一备选框,并计算第一备选框与当前筛选中的第二备选框的重叠度。与当前筛选的第一备选框的重叠度小于或等于重叠度阈值的第二备选框,作为下一次筛选中的备选框集合中的备选框。直至当前筛选中第一备选框与所有第二备选框的重叠度均大于重叠度阈值,停止筛选。每次筛选中均可得到第一备选框,即得到了与被测图像中所有目标对象各自最匹配的备选框。
在一个示例中,可以在每次筛选中,将与第一备选框的重叠度大于重叠度阈值的第二备选框删除。也就是说当前筛选中被删除的与第一备选框的重叠度大于重叠度阈值的第二备选框不再参与当前筛选之后的筛选的计算。减小了计算量和计算占用的时间,也减小了计算所占用的资源,进一步地提高了NMS方法的效率。
比如,可针对每个备选框设置索引号(即Index),并为每个备选框设置属性(即Flags),备选框的该属性表示当前筛选中该备选框与第一备选框的重叠度是否大于重叠度阈值。图3为本申请实施例中NMS计算中两次筛选的备选框的变化示意图。如图3所示,属性为0表示与第一备选框的重叠度小于或等于重叠度阈值,属性为1表示与第一备选框的重叠度大于重叠度阈值。在第m-1次筛选中,索引号为0、1、2和3依次对应的属性分别为0、1、1和0。在第m-1次筛选删除属性为1的备选框,在第m次筛选中留下了索引号为0和3的备选框。
下面将以两个实例对本申请实施例中的NMS方法进行说明。图4为本申请实施例中被测图像中的备选框示意图。如图4所示,被测图像中共包括7个备选框,分别为备选框D1、备选框D2、备选框D3、备选框D4、备选框D5、备选框D6和备选框D7。备选框D1、备选框D2、备选框D3、备选框D4、备选框D5、备选框D6和备选框D7的分类器得分分别为0.98、0.81、0.69、0.48、0.58、0.24和0.36。重叠度阈值为重叠面积占备选框面积的百分比,重叠度阈值为20%。
第一个实例:
设位置向量中的元素数目为3,则第一次筛选中生成2个位置向量。可将7个备选框按照分类器得分排列,得到排列顺序为备选框D1、备选框D2、备选框D3、备选框D6、备选框D4、备选框D7和备选框D5。在第一次筛选中,选取分类器得分最高的备选框D1作为第一备选框,备选框D2、备选框D3、备选框D6、备选框D4、备选框D7和备选框D5为第二备选框。第1个位置向量包括备选框D2的位置信息、备选框D3的位置信息和备选框D6的位置信息。第2个位置向量包括备选框D4的位置信息、备选框D7的位置信息和备选框D5的位置信息。则需要进行两次计算,第一次计算得到第一备选框D1与第1个位置向量中的备选框D2、备选框D3和备选框D6各自的重叠度,第二次计算得到第一备选框D1与第2个位置向量中的备选框D4、备选框D5和备选框D7各自的重叠度。第一备选框D1与备选框D2的重叠度大于20%;第一备选框D1与备选框D3的重叠度大于20%;第一备选框D1与备选框D6的重叠度小于20%;第一备选框D1与备选框D4的重叠度大于20%;第一备选框D1与备选框D7的重叠度小于20%;第一备选框D5与备选框D2的重叠度小于20%。则删除备选框D2和备选框D3。在第二次筛选中,备选框集合包括备选框D6、备选框D4、备选框D7和备选框D5。选取分类器得分最高的备选框D6作为第一备选框。对应的,生成了1个位置向量,该位置向量包括备选框D4的位置信息、备选框D7的位置信息和备选框D5的位置信息。对第一备选框D6的位置信息与这1个计算向量进行一次向量计算,得到第一备选框D6与第2个计算向量中的备选框D4、备选框D7和备选框D5各自的重叠度。第一备选框D6与备选框D4的重叠度小于20%;第一备选框D6与备选框D7的重叠度大于20%;第一备选框D6与备选框D5的重叠度大于20%。则删除备选框D4。在第三次筛选中,选取备选框D7作为第一备选框,计算第一备选框D7与备选框D5的重叠度。第一备选框D7与备选框D5的重叠度小于20%。则将备选框D5也作为第一备选框,并停止对备选框集合中的备选框的更新,完成了NMS计算。
第二个实例:
设位置向量中的元素数目为4个,则第一次筛选中生成了1个计算向量和2个单个第二备选框的位置信息。可将7个备选框按照分类器得分排列,得到排列顺序为备选框D1、备选框D2、备选框D3、备选框D6、备选框D4、备选框D7和备选框D5。在第一次筛选中,选取分类器得分最高的备选框D1作为第一备选框。位置向量包括备选框D2的位置信息、备选框D3的位置信息、备选框D6的位置信息和备选框D4的位置信息。2个单个第二备选框的位置信息分别为备选框D7的位置信息和备选框D5的位置信息。则需要进行三次计算。第一次计算得到第一备选框D1与位置向量中的备选框D2、备选框D3、备选框D6和备选框D4各自的重叠度,第二次计算得到第一备选框D1与备选框D5的重叠度,第三次计算得到第一备选框D1与备选框D7的重叠度。第一备选框D1与备选框D2的重叠度大于20%;第一备选框D1与备选框D3的重叠度大于20%;第一备选框D1与备选框D6的重叠度小于20%;第一备选框D1与备选框D4的重叠度大于20%;第一备选框D1与备选框D7的重叠度小于20%;第一备选框D5与备选框D2的重叠度小于20%。则删除备选框D2和备选框D3。在第二次筛选中,备选框集合包括备选框D6、备选框D4、备选框D7和备选框D5。选取分类器得分最高的备选框D6作为第一备选框。计算第一备选框D6分别与备选框D4、备选框D7和备选框D5各自的重叠度。第一备选框D6与备选框D4的重叠度小于20%;第一备选框D6与备选框D7的重叠度大于20%;第一备选框D6与备选框D5的重叠度大于20%。则删除备选框D4。在第三次筛选中,选取备选框D7作为第一备选框,计算第一备选框D7与备选框D5的重叠度。第一备选框D7与备选框D5的重叠度小于20%。则将备选框D5也作为第一备选框,并停止对备选框集合中的备选框的更新,完成了NMS计算。
图5为本申请实施例中一种备选框更新装置的结构示意图。如图5所示,备选框更新装置300可包括重叠度获取模块301和更新模块302。
重叠度获取模块301,用于根据第一备选框的位置信息和位置向量,得到第一备选框与多个第二备选框的重叠度。
其中,第一备选框为备选框集合中分类器得分最高的备选框。第二备选框为备选框集合中除第一备选框之外的备选框。位置向量包括多个第二备选框的位置信息。
更新模块302,用于将第一备选框与多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合。
上述更新模块302具体可用于在多个第二备选框中的第二备选框和第一备选框的重叠度小于或等于重叠度阈值时,确定第二备选框保留在更新后的备选框集合中;在多个第二备选框中的第二备选框和第一备选框的重叠度大于重叠度阈值时,确定第二备选框不保留在更新后的备选框集合中。
在一个示例中,上述重叠度获取模块301还用于利用更新后的备选框集合中的第一备选框的位置信息和更新后的位置向量,得到更新后的备选框集合中的第一备选框与更新后的备选框集合中多个第二备选框的重叠度。更新后的位置向量包括更新后的备选框集合中的多个第二备选框的位置信息。
更新模块302还用于将更新后的备选框集合中的第一备选框与更新后的备选框集合中的多个第二备选框的重叠度和重叠度阈值进行比较以再次得到更新后的备选框集合,直至重叠度获取模块301得到的更新后的备选框集合中的第一备选框与更新后的备选框集合中的第二备选框的重叠度均大于重叠度阈值,更新模块302还用于停止对备选框集合的更新,并用于将备选框集合中的第一备选框和每次更新后的备选框集合中的第一备选框,作为目标识别框。
在人脸识别场景中,备选框集合中包含多个用于识别图像中人脸的备选框。在目标识别场景中,备选框集合中包含多个用于识别图像中目标对象的备选框。
上述重叠度获取模块301和更新模块302的具体功能和有益效果说明可参见上述实施例中步骤S101和步骤S102,以及步骤S201至步骤S205的相关细节说明内容,在此不再赘述。
结合图1至图5描述的根据本申请实施例的备选框更新方法和装置可以由备选框更新设备400来实现。图6为本申请实施例中的一种备选框更新装置400的硬件结构示意图。
备选框更新装置400包括存储器401、处理器402及存储在存储器401上并可在处理器402上运行的计算机程序。
在一个示例中,上述处理器402可以包括中央处理器(CPU),或者特定集成电路(ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器401可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器401可包括HDD、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器401可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器401可在备选框更新装置400的内部或外部。在特定实施例中,存储器401是非易失性固态存储器。在特定实施例中,存储器401包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器402通过读取存储器401中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行上述各个实施例中的备选框更新方法和包含备选框更新的NMS方法。
在一个示例中,备选框更新装置400还可包括通信接口403和总线404。其中,如图6所示,存储器401、处理器402、通信接口403通过总线404连接并完成相互间的通信。
通信接口403,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。也可通信接口403接入输入设备和/或输出设备。
总线404包括硬件、软件或两者,将备选框更新装置400的部件彼此耦接在一起。举例来说而非限制,总线404可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线404可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
本申请一实施例还提供一种存储介质,该存储介质上存储有程序,该程序被处理器执行时可实现上述各个实施例中的备选框更新方法和包含备选框更新的NMS方法。
本说明书的各个部分均采用递进的方式进行描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点介绍的都是与其他实施例不同之处。尤其,对于装置实施例和存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例部分的说明即可。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种备选框更新方法,其特征在于,包括:
根据第一备选框的位置信息和位置向量,由向量化指令触发向量计算,对第一备选框的位置信息和位置向量进行向量计算,得到所述第一备选框与多个第二备选框的重叠度,其中,所述向量计算用于一次性计算第一备选框与一个位置向量中的多个第二备选框的重叠度,所述第一备选框为备选框集合中分类器得分最高的备选框,所述第二备选框为所述备选框集合中除所述第一备选框之外的备选框,所述位置向量包括多个元素,每个元素对应一个所述第二备选框的位置信息;
将所述第一备选框与所述多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一备选框与所述多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合,包括:
在所述多个第二备选框中的第二备选框和所述第一备选框的重叠度小于或等于所述重叠度阈值时,确定所述第二备选框保留在更新后的备选框集合中;
在所述多个第二备选框中的第二备选框和所述第一备选框的重叠度大于所述重叠度阈值时,确定所述第二备选框不保留在更新后的备选框集合中。
3.根据权利要求2所述的方法,其特征在于,还包括:
利用更新后的备选框集合中的第一备选框的位置信息和更新后的位置向量,得到更新后的备选框集合中的第一备选框与更新后的备选框集合中多个第二备选框的重叠度,所述更新后的位置向量包括更新后的备选框集合中的多个第二备选框的位置信息;
将更新后的备选框集合中的第一备选框与更新后的备选框集合中的多个第二备选框的重叠度和所述重叠度阈值进行比较以再次得到更新后的备选框集合,直至更新后的备选框集合中的第一备选框与更新后的备选框集合中的第二备选框的重叠度均大于所述重叠度阈值,停止对所述备选框集合的更新;
将所述备选框集合中的所述第一备选框和每次更新后的所述备选框集合中的第一备选框,作为目标识别框。
4.根据权利要求1-3任一所述的方法,其特征在于,所述备选框集合中包含多个用于识别图像中人脸的备选框。
5.一种备选框更新装置,其特征在于,包括:
重叠度获取模块,用于根据第一备选框的位置信息和位置向量,由向量化指令触发向量计算,对第一备选框的位置信息和位置向量进行向量计算,得到所述第一备选框与多个第二备选框的重叠度,其中,所述向量计算用于一次性计算第一备选框与一个位置向量中的多个第二备选框的重叠度,所述第一备选框为备选框集合中分类器得分最高的备选框,所述第二备选框为所述备选框集合中除所述第一备选框之外的备选框,所述位置向量包括多个元素,每个元素对应一个所述第二备选框的位置信息;
更新模块,用于将所述第一备选框与所述多个第二备选框的重叠度和重叠度阈值进行比较以得到更新后的备选框集合。
6.根据权利要求5所述的装置,其特征在于,所述更新模块具体用于:
在所述多个第二备选框中的第二备选框和所述第一备选框的重叠度小于或等于所述重叠度阈值时,确定所述第二备选框保留在更新后的备选框集合中;
在所述多个第二备选框中的第二备选框和所述第一备选框的重叠度大于所述重叠度阈值时,确定所述第二备选框不保留在更新后的备选框集合中。
7.根据权利要求6所述的装置,其特征在于,所述重叠度获取模块还用于利用更新后的备选框集合中的第一备选框的位置信息和更新后的位置向量,得到更新后的备选框集合中的第一备选框与更新后的备选框集合中多个第二备选框的重叠度,所述更新后的位置向量包括更新后的备选框集合中的多个第二备选框的位置信息;
所述更新模块还用于将更新后的备选框集合中的第一备选框与更新后的备选框集合中的多个第二备选框的重叠度和所述重叠度阈值进行比较以再次得到更新后的备选框集合,直至所述重叠度获取模块得到的更新后的备选框集合中的第一备选框与更新后的备选框集合中的第二备选框的重叠度均大于所述重叠度阈值,所述更新模块用于停止对所述备选框集合的更新,并用于将所述备选框集合中的所述第一备选框和每次更新后的所述备选框集合中的第一备选框,作为目标识别框。
8.根据权利要求5-7任一所述的装置,其特征在于,所述备选框集合中包含多个用于识别图像中人脸的备选框。
9.一种备选框更新设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于实现如权利要求1至4中任意一项所述的备选框更新方法。
10.一种存储介质,其特征在于,其上存储有程序,所述程序被处理器执行时实现如权利要求1至4中任意一项所述的备选框更新方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810355286.3A CN110390344B (zh) | 2018-04-19 | 2018-04-19 | 备选框更新方法及装置 |
PCT/CN2019/077397 WO2019201029A1 (zh) | 2018-04-19 | 2019-03-08 | 备选框更新方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810355286.3A CN110390344B (zh) | 2018-04-19 | 2018-04-19 | 备选框更新方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110390344A CN110390344A (zh) | 2019-10-29 |
CN110390344B true CN110390344B (zh) | 2021-10-26 |
Family
ID=68240408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810355286.3A Active CN110390344B (zh) | 2018-04-19 | 2018-04-19 | 备选框更新方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110390344B (zh) |
WO (1) | WO2019201029A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111145215B (zh) * | 2019-12-25 | 2023-09-05 | 北京迈格威科技有限公司 | 一种目标跟踪方法及装置 |
CN111783655A (zh) * | 2020-06-30 | 2020-10-16 | Oppo广东移动通信有限公司 | 一种图像处理方法、装置、电子设备和存储介质 |
CN112817881A (zh) * | 2021-02-26 | 2021-05-18 | 上海阵量智能科技有限公司 | 信息处理方法、装置、设备及存储介质 |
CN114611666B (zh) * | 2022-03-08 | 2024-05-31 | 安谋科技(中国)有限公司 | 一种nms函数的量化方法、电子设备及介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9544577B2 (en) * | 2013-07-18 | 2017-01-10 | A.Tron3D Gmbh | Method of capturing three-dimensional (3D) information on a structure |
US11120478B2 (en) * | 2015-01-12 | 2021-09-14 | Ebay Inc. | Joint-based item recognition |
CN104573731B (zh) * | 2015-02-06 | 2018-03-23 | 厦门大学 | 基于卷积神经网络的快速目标检测方法 |
US20170330059A1 (en) * | 2016-05-11 | 2017-11-16 | Xerox Corporation | Joint object and object part detection using web supervision |
US10509952B2 (en) * | 2016-08-30 | 2019-12-17 | Irida Labs S.A. | Fast, embedded, hybrid video face recognition system |
CN106529398B (zh) * | 2016-09-23 | 2018-06-29 | 深圳云天励飞技术有限公司 | 基于级联结构的快速精准人脸检测方法 |
CN106960178B (zh) * | 2017-02-23 | 2020-02-07 | 中国科学院自动化研究所 | 绝缘子识别模型的训练方法以及绝缘子的识别与定位方法 |
CN107301383B (zh) * | 2017-06-07 | 2020-11-24 | 华南理工大学 | 一种基于Fast R-CNN的路面交通标志识别方法 |
CN107577990B (zh) * | 2017-08-09 | 2020-02-18 | 武汉世纪金桥安全技术有限公司 | 一种基于gpu加速检索的大规模人脸识别方法 |
CN107657224B (zh) * | 2017-09-19 | 2019-10-11 | 武汉大学 | 一种基于部件的多层并行网络sar图像飞机目标检测方法 |
CN107808143B (zh) * | 2017-11-10 | 2021-06-01 | 西安电子科技大学 | 基于计算机视觉的动态手势识别方法 |
-
2018
- 2018-04-19 CN CN201810355286.3A patent/CN110390344B/zh active Active
-
2019
- 2019-03-08 WO PCT/CN2019/077397 patent/WO2019201029A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN110390344A (zh) | 2019-10-29 |
WO2019201029A1 (zh) | 2019-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110390344B (zh) | 备选框更新方法及装置 | |
CN105894464B (zh) | 一种中值滤波图像处理方法和装置 | |
CN109086734B (zh) | 一种对人眼图像中瞳孔图像进行定位的方法及装置 | |
US20190156499A1 (en) | Detection of humans in images using depth information | |
KR102476022B1 (ko) | 얼굴검출 방법 및 그 장치 | |
KR102578209B1 (ko) | 영상 처리 방법과 장치 | |
CN110390327B (zh) | 前景提取方法、装置、计算机设备及存储介质 | |
CN109685805B (zh) | 一种图像分割方法及装置 | |
US11468296B2 (en) | Relative position encoding based networks for action recognition | |
CN109726678B (zh) | 一种车牌识别的方法及相关装置 | |
CN108596079B (zh) | 手势识别方法、装置及电子设备 | |
CN110381310B (zh) | 一种检测视觉系统的健康状态的方法及装置 | |
CN113221768A (zh) | 识别模型训练方法、识别方法、装置、设备及存储介质 | |
CN109447006A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN113378958A (zh) | 自动标注方法、装置、设备、存储介质及计算机程序产品 | |
CN110490058B (zh) | 行人检测模型的训练方法、装置、系统和计算机可读介质 | |
CN113033373B (zh) | 用于训练人脸识别模型及识别人脸的方法及相关装置 | |
US9824462B2 (en) | Method for detecting object and object detecting apparatus | |
CN112579907A (zh) | 一种异常任务检测方法、装置、电子设备和存储介质 | |
CN111950507A (zh) | 数据处理和模型训练方法、装置、设备及介质 | |
CN111967529A (zh) | 识别方法、装置、设备及系统 | |
CN108764206B (zh) | 目标图像识别方法和系统、计算机设备 | |
US10372750B2 (en) | Information processing apparatus, method, program and storage medium | |
CN115019057A (zh) | 图像特征提取模型确定方法及装置、图像识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |