WO2022193074A1

WO2022193074A1 - Rpn网络的后处理方法及装置

Info

Publication number: WO2022193074A1
Application number: PCT/CN2021/080811
Authority: WO
Inventors: 闫隆鑫; 陈创荣; 符雷
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2021-03-15
Filing date: 2021-03-15
Publication date: 2022-09-22

Abstract

一种RPN网络的后处理方法及装置，所述方法包括：获取RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量(101)；从所有候选区域中，确定得分最大的N个目标候选区域(102)；计算目标候选区域的尺寸(103)；据目标候选区域的尺寸，计算目标候选区域之间的重叠率，并根据重叠率，从N个目标候选区域中选取M个目标候选区域(104)。本申请可以先对候选区域进行排序、筛选，确定得分最大的N个目标候选区域，之后再进行N个目标候选区域的尺寸的计算，由于N个目标候选区域的数量相较于RPN网络输出的候选区域的数量已经大幅减少，因此，能够大幅降低计算候选区域尺寸的过程中的运算量。

Description

RPN网络的后处理方法及装置

技术领域

本申请涉及计算机技术领域，特别是涉及一种RPN网络的后处理方法及装置。

背景技术

对于自动驾驶、无人机、智能终端等对目标检测有需求的场景，通常需要利用区域候选网络(RPN，Region Proposal Network)来进行目标的候选区域的生成。

RPN网络的后处理是实现目标检测算法的重要一步，相关技术中，RPN网络的后处理包括：1、针对RPN网络的输出与预设的先验区域，计算得到每个候选区域(ROI，region of interest，感兴趣区域)的尺寸；2、过滤尺寸过小的ROI；3、按照得分对ROI进行排序，并保留得分最高的N个ROI；4、对N个ROI进行非极大值抑制(NMS，Non-Maximum Suppression)处理，得到最终的M个ROI。

但是，在计算候选区域的尺寸的过程中，涉及浮点的指数运算，目前方案中，需要针对大量的候选区域一一计算其尺寸，造成后处理过程的耗时较长，效率低下。

发明内容

本申请提供一种RPN网络的后处理方法及装置，可以解决现有技术中后处理过程的耗时较长，效率低下的问题。

第一方面，本申请实施例提供了一种RPN网络的后处理方法，包括：

获取RPN网络输出的候选区域的得分，以及所述候选区域与对应的先验区域之间的偏移量；

从所有所述候选区域中，确定所述得分最大的N个目标候选区域；

根据所述目标候选区域对应的目标先验区域的尺寸，以及所述目标候选区域与所述目标先验区域之间的目标偏移量，计算所述目标候选区域的尺寸；

根据所述目标候选区域的尺寸，计算所述目标候选区域之间的重叠率，并根据所述重叠率，从所述N个目标候选区域中选取M个目标候选区域，所述M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。

第二方面，本申请实施例提供了一种RPN网络的后处理装置，包括：获取模块和处理器；

获取模块和处理模块；

所述获取模块用于获取RPN网络输出的候选区域的得分，以及所述候选区域与对应的先验区域之间的偏移量；

所述处理模块用于从所有所述候选区域中，确定所述得分最大的N个目标候选区域；

第三方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质包括指令，当其在计算机上运行时，使得计算机执行上述方面所述的方法。

第四方面，本申请提供一种计算机程序产品，所述计算机程序产品包括指令，当其在计算机上运行时，使得计算机执行上述方面所述的方法。

在本申请实施例中，本申请可以根据RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量，先对候选区域进行排序、筛选，确定得分最大的N个目标候选区域，之后再进行N个目标候选区域的尺寸的计算和基于候选区域之间重叠率的考虑，由于N个目标候选区域的数量相较于RPN网络输出的候选区域的数量已经大幅减少，因此，能够大幅降低计算候选区域尺寸的过程中的运算量，减少了大量的冗余计算，降低了处理器的负载压力。

附图说明

图1是本申请实施例提供的一种RPN网络的后处理方法的流程图；

图2是本申请实施例提供的一种RPN网络的后处理方法的具体流程图；

图3是本申请实施例提供的一种TOP N算法的示意图；

图4是本申请实施例提供的另一种TOP N算法的示意图；

图5是本申请实施例提供的一种NMS算法的示意图；

图6是本申请实施例提供的一种RPN网络的后处理装置的框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

在本申请实施例中，基于各个场景下对目标检测的需求，可以利用采用了RPN网络的定点神经网络模型来提高目标检测的效率，其中，RPN网络可以将特征图作为输入，并输出特征图中可能包含目标的候选区域相对于预设的先验区域之间的偏移量，以及用于反映候选区域相对于先验区域的匹配可能性的得分，候选区域与先验区域匹配的几率越大，该得分越大。

具体的，RPN网络的后处理是指利用RPN网络的输出内容进行计算，最终得到M个(M的值可针对实际需求设定)候选区域的具体尺寸，这M个候选区域的选取同时考虑了得分以及重叠率的影响，具有较优价值，将这M个候选区域进行后续的池化、分类回归等操作，可以输出目标的检测类别和位置，完成目标检测。

相关技术中，在计算候选区域的具体尺寸的过程中，涉及到将RPN网络输出的定点格式的数据转换为浮点格式，以及浮点格式的指数运算，这种运算的运算量极大，造成处理器负载急剧提升。而相关技术中首先对RPN网络输出的所有候选区域计算其尺寸，无疑对处理器的负载造成较大压力。另外，计算完候选区域的尺寸后，后续的筛选、排序操作又会筛除一部分候选区域，这些被筛除的候选区域的尺寸所消耗的计算资源则被浪费，造成冗余计算。

在本申请实施例中，则可以根据RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量，先对候选区域进行排序、筛选，确定得分最大的N个目标候选区域，之后再进行N个目标候选区域的尺寸的计算和基于候选区域之间重叠率的考虑，由于N个目标候选区域的数量相较于RPN网络输出的候选区域的数量已经大幅减少，因此，能够大幅降低计算候选区域尺寸的过程中的运算量，减少了大量的冗余计算，降低了处理器的负载压力。

图1是本申请实施例提供的一种RPN网络的后处理方法的流程图，如图1所示，该方法可以包括：

步骤101、获取RPN网络输出的候选区域的得分，以及所述候选区域与对应的先验区域之间的偏移量。

在本申请实施例中，RPN网络可以将特征图作为输入，并输出特征图中可能包含目标的候选区域相对于预设的先验区域之间的偏移量，以及用于反映候选区域相对于先验区域的匹配可能性的得分，候选区域与先验区域匹配的几率越大，该得分越大。

具体的，先验区域(anchor，也称锚区域)是利用先验规则，具有场景中常见目标的框体的尺寸及可能出现位置的区域，RPN网络即是通过将从特征图中提取到的可能包含目标的候选区域与先验区域进行匹配，得到候选区域的得分，以及候选区域与对应的先验区域之间的偏移量。

步骤102、从所有所述候选区域中，确定所述得分最大的N个目标候选区域。

在该步骤中，基于RPN网络输出的所有候选区域，首先可以进行排序和筛选操作，从而得到得分最大的N个(TOPN)目标候选区域。其中，N的值可以根据实际需求进行设定，如在计算资源充足的情况下，N的取值可以较大，在计算资源不充足的情况下，N的取值可以较小。排序和筛选操作具体可以采用多种排序、筛选算法来完成，如，快速排序算法、桶排序算法等。

步骤103、根据所述目标候选区域对应的目标先验区域的尺寸，以及所述目标候选区域与所述目标先验区域之间的目标偏移量，计算所述目标候选区域的尺寸。

在该步骤中，由于N个目标候选区域的数量相较于RPN网络输出的候选区域的数量已经大幅减少，因此，相较于相关技术，本申请实施例能够大幅降低计算候选区域尺寸的过程中的运算量，减少了大量的冗余计算，降低了处理器的负载压力。

步骤104、根据所述目标候选区域的尺寸，计算所述目标候选区域之间的重叠率，并根据所述重叠率，从所述N个目标候选区域中选取M个目标候选区域，所述M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。

在本申请实施例中，若两个候选区域间的重叠率过大，则说明两个候选区域相似度较高，存在冗余计算，此时仅需保留重叠率过大(如大于90％)的两个候选区域中得分较大的候选即可，本申请实施例中，则可以N个目标候选区域的尺寸，计算目标候选区域之间的重叠率，并根据重叠率，从N个目标候选区域中选取M个目标候选区域，且M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。其中，M的值可以根据实际需求进行设定，如在计算资源充足的情况下，M的取值可以较大，在计算资源不充足的情况下，M的取值可以较小。该步骤具体可以采用多种算法来完成，如，一种实现方式中，可以采用非极大值抑制(NMS，Non-maximum Suppression)算法来实现该步骤，NMS的思想是将目标候选区域按照得分排序后，从比某个目标候选区域得分低的目标候选区域里，把重叠率较高的目标候选区域排除掉。

综上，本申请实施例提供的一种RPN网络的后处理方法，通过获取RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量；从所有候选区域中，确定得分最大的N个目标候选区域；根据目标候选区域对应的目标先验区域的尺寸，以及目标候选区域与目标先验区域之间的目标偏移量，计算目标候选区域的尺寸；根据目标候选区域的尺寸，计算目标候选区域之间的重叠率，并根据重叠率，从N个目标候选区域中选取M个目标候选区域，M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。本申请可以根据RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量，先对候选区域进行排序、筛选，确定得分最大的N个目标候选区域，之后再进行N个目标候选区域的尺寸的计算和基于候选区域之间重叠率的考虑，由于N个目标候选区域的数量相较于RPN网络输出的候选区域的数量已经大幅减少，因此，能够大幅降低计算候选区域尺寸的过程中的运算量，减少了大量的冗余计算，降低了处理器的负载压力。

图2是本申请实施例提供的一种RPN网络的后处理方法的具体流程图，如图2所示，该方法可以包括：

步骤201、获取RPN网络输出的候选区域的得分，以及所述候选区域与对应的先验区域之间的偏移量。

步骤201具体可以参照上述步骤101，此处不再赘述。

步骤202、根据所述候选区域的得分的取值范围以及维度，按照桶排序规则，建立桶排序模型，所述桶排序模型用于存储所述索引序号，并在达到预设的终止条件时输出所述得分最大的N个目标候选区域。

其中，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号。

在实际应用中，相关计算采用了快速排序算法获取得分最高的N个候选区域，假设参与快速排序算法的候选模型的数量为n，则使用快速排序等排序算法，其算法复杂度为O(n×log(n))。通常n的数量级都比较大，因此这个过程对计算资源的依赖较大，在计算性能较弱的处理器上的耗时较长。

本申请实施例提供了一种桶排序算法来实现输出得分最大的N个目标候选区域，桶排序算法是将待排序集合中处于同一个值域的元素存入同一个桶中，也就是根据元素值特性将集合拆分为多个区域，则拆分后形成的多个桶，从值域上看是处于有序状态的。对每个桶中元素进行排序，则所有桶中元素构成的集合是已排序的，桶排序算法需要待排序对象具有离散性和有限性，其可以利用这种特性，用分类操作代替排序操作，使得桶排序算法的算法复杂度是O(n)，相比于原算法需要的内存更少，计算量大幅减少。

具体的，参照图3，图3示出了本申请实施例提供的一种TOP N算法的示意图，其中，RPN网络输出rpn_cls_score分支(得分分支)和rpn_bbox_pred(偏移量分支)，针对rpn_cls_score分支，候选区域的得分包括分别对应不同先验区域的得分，以及每个得分对应三个维度的索引序号index，三个维度包括C维度、W维度、H维度；C维度用于反映特征图中每一个位置对应的先验区域的数量。W维度用于反映特征图中存在先验区域的位置的行数。H维度用于反映特征图中存在先验区域的位置的列数。另外，一个候选区域的三个维度上的索引序号index可以构成一组索引，该索引用于查找该候选区域对应的先验区域的尺寸，以用于进行后续候选区域的尺寸计算。

进一步的，对于定点的RPN网络，该RPN网络的输出是定点格式。以8bit的RPN网络为例，其输出的数值范围最多只有256个整数，对于rpn_cls_score这一分支，其输出的得分的数值范围是-128～127，使得rpn_cls_score这一分支具备定点格式的离散性和有限性。因此，本申请实施例可以采用“桶排序”的思想，只保留所有得分数值中最大的N个数值即可，对常规的快速排序算法进行简化和等效替代，达到降低运算负载度和提高运算效率的目的。

在该步骤中，可以根据候选区域的得分的取值范围以及维度，按照桶排序规则，建立桶排序模型，桶排序模型可以存储索引序号，并在达到预设的终止条件时输出得分最大的N个目标候选区域。例如，针对rpn_cls_score这一分支，其输出的得分的数值范围是-128～127，且对应C、H、W三个维度，因此可以建立三组“桶”，每组“桶”包含256个“桶”，即“桶”-128、“桶”-127、“桶”-126….“桶”126、“桶”127，每个“桶”的容量为N。通过将rpn_cls_score分支中的得分与“桶”对应的得分匹配，若匹配则将该得分对应的索引序号存储在该“桶”中，直至达到预设的终止条件时，三组“桶”可以输出得分最大的N个目标候选区域的得分在三个维度上对应的索引序号。

可选的，所述得分的取值范围包括K个得分，步骤202具体可以包括：

子步骤2021、建立与所述三个维度对应的三个存储片区组，得到所述桶排序模型。

其中，每组存储片区组包括K个存储片区，所述K个存储片区与所述K个得分一一对应，每个存储片区的容量上限为N；当一个所述存储片区存入一个所述索引序号时，所述存储片区的容量加一。

针对上述思想，则在该步骤中，可以根据候选区域的得分的取值范围包括K个定点格式的得分，以及三个维度，建立三组存储片区组，每组存储片区组包含K个存储片区，每个存储片区的容量为N，在向存储片区存放索引序号时，每存放一组索引序号，该存储片区的容量加一，直至容量达到N时，该存储片区存满。

步骤203、将所述候选区域的得分的索引序号输入所述桶排序模型，得到所述桶排序模型输出的所述得分最大的N个目标候选区域，以及每个所述目标候选区域的得分在三个维度上对应的索引序号。

在本申请实施例中，可以将rpn_cls_score分支中的得分的索引序号输入桶排序模型，将rpn_cls_score分支中的得分与桶排序模型中每个“桶”对应的得分匹配，若两个得分一致则匹配，此时将该得分对应的索引序号存储在该“桶”中，直至达到预设的终止条件时，三组“桶”可以输出得分最大的N个目标候选区域的得分在三个维度上对应的索引序号。

例如，针对步骤202中图3提供的示例，建立有三组“桶”，每组“桶”包含256个“桶”，即“桶”-128、“桶”-127、“桶”-126….“桶”126、 “桶”127，每个“桶”的容量为N。

通过依次遍历rpn_cls_score分支中的每个得分，将得分对应的索引序号按照维度，放置在维度对应的“桶”中，当得分最高的“桶”(127)容量达到上限N或所有得分遍历完毕，可以认为达到终止条件，此时可以从得分最高的三个“桶”(C127，W127，H127)中，提取N个目标候选区域的得分在三个维度上对应的索引序号；当所有得分遍历完毕，但得分最高的“桶”的容量未达到上限N的情况下，则从得分最高的“桶”开始，依次提取每个得分对应的“桶”中的索引序号，直至得到N个目标候选区域的得分在三个维度上对应的索引序号。

可选的，步骤203具体可以包括：

子步骤2031、在所述候选区域的目标维度的得分，与所述目标维度对应的目标存储片区组中的存储片区对应的得分匹配的情况下，将所述目标维度的得分对应的索引序号，存入与所述得分对应的存储片区中；所述目标维度为所述候选区域的三个维度中的任一维度。

子步骤2032、在将所述候选区域的所有得分的索引序号存储完毕，或所述得分最大的存储片区组中存储片区的容量达到N时，确定达到所述终止条件，并从所述存储片区组中提取所述目标候选区域的得分在所述三个维度上对应的索引序号。

本申请实施例提供了一个具体示例来对子步骤2031及子步骤2032进行描述，参照图4，图4示出了本申请实施例提供的另一种TOP N算法的示意图，其中，假设候选区域的得分的取值范围为-3至3，N＝3，则取值范围包括7个定点格式的得分，C_index的取值范围是0至2，H_index的取值范围0至2，W_index的取值范围0至3；候选区域的得分对应三个维度，可以建立三组存储片区组，每组存储片区组包含7个存储片区，分别对应得分等于-3至3的7种结果，每个存储片区的容量为3，在向存储片区存放索引序号时，每存放一组索引序号，该存储片区的容量加一，直至容量达到3时，该存储片区存满。

创建完毕桶排序模型后，从rpn_cls_score分支中的得分的第一个值开始，按照从左到右，从上到下的顺序进行遍历，把得分在C维度的索引序号C_index、得分在H维度的索引序号H_index、得分在W维度的索引序号 W_index放入相应score的存储片区里。当遍历到第3个值为3的score时，score＝3的存储片区已满，遍历结束，此时可以从score＝3的存储片区提取TOP 3的目标候选区域的得分在三个维度上对应的索引序号。

可选的，子步骤2032具体可以包括：

子步骤A1、在所述得分最大的存储片区组中存储片区的容量达到N时，将从所述得分最大的存储片区组中提取得到的索引序号，作为所述目标候选区域的得分在所述三个维度上对应的索引序号。

在一种情况下，参照图3，当得分最高的“桶”(127)容量达到上限N或所有得分遍历完毕，可以认为达到终止条件，此时可以从得分最高的三个“桶”(C127，W127，H127)中，提取N个目标候选区域的得分在三个维度上对应的索引序号。

子步骤A2、在将所述候选区域的所有得分的索引序号存储完毕的情况下，按照所述存储片区组的得分从大到小的顺序，提取每个所述存储片区组中的索引序号作为所述目标候选区域在所述三个维度上对应的索引序号，直至提取得到N个所述目标候选区域在所述三个维度上对应的索引序号。

在另一种情况下，当所有得分遍历完毕，但得分最高的“桶”的容量未达到上限N的情况下，则从得分最高的“桶”开始，依次提取每个得分对应的“桶”中的索引序号，即提取“桶”127中所有索引序号，若未达到到N个目标候选区域的索引序号要求，则进一步从“桶”126中提取索引序号…直至得到N个目标候选区域的得分在三个维度上对应的索引序号。

步骤204、根据所述目标候选区域的得分在所述三个维度上的索引序号所构建的索引，获取所述目标候选区域对应的目标偏移量和目标先验区域的尺寸。

其中，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号；所述维度的索引序号构建的索引、所述候选区域对应的先验区域的尺寸、所述候选区域的偏移量之间具有对应关系。

在本申请实施例中，电子设备的内存中，由三个维度的索引序号构建的索引、候选区域对应的先验区域的尺寸、候选区域的偏移量之间具有对应关系，在得到了每个目标候选区域的得分在三个维度上的索引序号后，可以由三个维度的索引序号构建的索引，进一步从对应关系中提取得到对应的候选区域对应的先验区域的尺寸、候选区域的偏移量。

可选的，所述偏移量和所述先验区域的尺寸分别存储于由单指令多数据流处理器提供的连续的内存片区中；所述偏移量和所述先验区域的尺寸的值与所述内存片区一一对应，则步骤204具体还可以通过根据所述索引，通过一次提取操作从所述连续的内存片区中提取得到所述目标候选区域对应的目标偏移量和目标先验区域的尺寸的方式进行实现。

在本申请实施例中，可以进一步通过优化数据存取，来实现进一步的运算效率的提升，具体的，处理运算的处理器可以为单指令多数据流(SIMD，Single Instruction Multiple Data)处理器，SIMD处理器可以通过SIMD指令复制多个操作数，并把它们打包在大型寄存器的一组指令集中。具体的，以加法指令为例，在SIMD型的处理器中，指令译码后几个执行部件可以同时访问内存，一次性获得所有操作数进行运算，这个特点使SIMD特别适合于多媒体应用等数据密集型运算。因此，在提取先验区域的尺寸、候选区域的偏移量之前，由于SIMD处理器的向量寄存器的长度较长，则可以将这些数据分别存储于由单指令多数据流处理器提供的连续的内存片区中，且使得所述偏移量和所述先验区域的尺寸的值与所述内存片区一一对应，这样可以更方便地用矢量进行并行计算，在根据索引提取先验区域的尺寸、候选区域的偏移量时，则可以通过一个SIMD指令，一次性提取所有的先验区域的尺寸、候选区域的偏移量，达到更充分地利用带宽，减少数据从内存到向量寄存器的读取时间的目的，获取最高效的访存效率，提高计算速度。

可选的，所述桶排序模型、所述先验区域的尺寸和所述偏移量存储于紧耦合内存处理器中。

在本申请实施例中，用于进行后处理运算的处理器还可以支持紧耦合内存(TCM，Tightly Coupled Memories)，TCM是处理器中离计算单元最近的存储器，计算单元从TCM中获取数据的频率与计算单元的主频是一样的，延时也最低，将桶排序模型、所述先验区域的尺寸和所述偏移量存储于紧耦合内存处理器中，能够有效缩小计算时延，提高计算效率。

步骤205、根据所述目标候选区域对应的目标先验区域的尺寸，以及所述目标候选区域与所述目标先验区域之间的目标偏移量，计算所述目标候选区域的尺寸。

步骤205具体可以参照上述步骤103，此处不再赘述。

具体的，所述先验区域的尺寸包括：所述先验区域的中心点坐标(Xa，Ya)、宽度Wa和高度Ha；所述偏移量包括：中心点偏移量δx，δy、宽度偏移量δw和高度偏移量δh；步骤205具体可以包括：

子步骤2051、根据公式1和公式2计算得到所述目标候选区域的中心点坐标(Xb，Yb)。

子步骤2052、根据公式3和公式4计算得到所述目标候选区域的宽度Wb和高度Hb。

公式1：Xb＝δx×S×v1×Wa+Xa；公式2：Yb＝δy×S×v1×Ha+Ya；

公式3：Wb＝e ^dw×Wa；公式4：Hb＝e ^dh×Ha；

其中，S为定点数到浮点数的转换系数；v1为所述先验区域的中心点坐标与所述先验区域的宽度的方差；dw＝δw×S×v2；dh＝δh×S×v2；v2为所述先验区域的中心点坐标与所述先验区域的高度的方差。

在本申请实施例中，由于利用采用了RPN网络的定点神经网络模型来进行目标检测，但是RPN网络的输出是定点数格式，而且要求RPN后处理过程的最终输出是浮点数格式，因此需要通过定点数与浮点数之间的转换系数S进行定点数与浮点数之间的转换。

将RPN网络输出的rpn_bbox_pred(偏移量分支)分支中的所述先验区域的中心点坐标(Xa，Ya)、宽度Wa和高度Ha；所述偏移量包括：中心点偏移量δx，δy、宽度偏移量δw和高度偏移量δh代入上述公式1至公式3，即可求出目标候选区域的中心点坐标(Xb，Yb)以及目标候选区域的宽度Wb和高度Hb。

可选的，在通过所述公式3和所述公式4计算得到所述宽度Wb和所述高度Hb的过程中，e ^dw的值通过查询第一运算表得到，e ^dh的值通过查询第二运算表得到；δw和δh的取值范围包括J个定点整数；

其中，所述第一运算表包括：根据e ^dw＝e ^δw×S×V2计算得到的J个浮点数格式的结果；所述第二运算表包括：根据e ^dh＝e ^δh×S×V2计算得到的J个浮点数格式的结果。

在本申请实施例中，可以发现，在计算目标候选区域的宽度Wb＝e ^dw×Wa和高度Hb＝e ^dh×Ha的过程中，dw＝δw×S×v2；dh＝δh×S×v2，整个计算涉及到浮点数的指数运算，而浮点数的指数运算复杂度较高，会导致处理器的运算效率较差，因此，考虑到δw和δh都是取值范围为-128至127的定点数，而S、v1，v2都是常数，本申请实施例可以提前计算得到e ^δw×S×V2的所有256种结果并建立为第一运算表存在内存中，以及提前计算得到e ^δh×S× ^V2的所有256种结果并建立为第二运算表存在内存中。

在处理器实际计算过程中，则可以直接通过查找表(LUT，Look Up Table)操作在内存中通过查询第一运算表和第二运算表，获取对应的e ^dw和e ^dh的值，使得整个计算过程省去了浮点数指数运算的过程，优化了运算效率。

步骤206、将所述N个目标候选区域按照得分由大到小的顺序进行排序。

步骤207、根据所述目标候选区域的尺寸，计算每个得分较大目标候选区域与所有得分较小目标候选区域之间的重叠率。

步骤208、将所述重叠率大于所述预设重叠率阈值的得分较小目标候选区域删除。

步骤209、从剩余的所述目标候选区域中选取M个目标候选区域。

在本申请实施例中，若两个候选区域间的重叠率过大，则说明两个候选区域相似度较高，存在冗余计算，此时仅需保留重叠率过大(如大于90％)的两个候选区域中得分较大的候选即可，本申请实施例中，则可以N个目标候选区域的尺寸，计算目标候选区域之间的重叠率，并根据重叠率，从N个目标候选区域中选取M个目标候选区域，且M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。其中，M的值可以根据实际需求进行设定，如在计算资源充足的情况下，M的取值可以较大，在计算资源不充足的情况下，M的取值可以较小。

具体的，可以基于NMS算法的思想，将目标候选区域按照得分排序后，从比某个目标候选区域得分低的目标候选区域里，把重叠率较高的目标候选区域排除掉。

可选的，步骤209具体可以通过在剩余的所述目标候选区域中，从得分最大的目标候选区域开始选取，直至选取得到M个目标候选区域的方式进行实现。

在本申请实施例中，NMS算法需要对全部N个目标候选区域按照得分从高到低的顺序做NMS，将重叠率大于预设重叠率阈值的较小得分目标候选区域的得分设置为0(也即删除)，然后再对得分进行一次排序，保留得分最高的M个目标候选区域作为最终的候选区域。但事实上，在NMS计算过程中，当发现有M个目标候选区域没有被“抑制”时，NMS就可以停止了，其余的NMS计算均为冗余计算。

其次，通过排序来获取得分最高的M个目标候选区域的做法也不是必须的，因为采用了RPN网络的定点神经网络模型的后续算法对这M个目标候选区域的顺序并没有要求。

因此，参照图5，图5示出了本申请实施例提供的一种NMS算法的示意图，NMS的步骤中可以通过复制操作代替排序操作，在将所有重叠率大于预设重叠率阈值的较小得分目标候选区域的得分设置为0之后，第2位、第5位、第M-3位、第M+1位、第M+2位、第M+4位、第N位被抑制(得分置0)，本申请实施例可以将排在第M位之后的保留目标候选区域(得分未置0的目标候选区域)，依次复制到第M位之前的被抑制的“空洞”(得分置0的目标候选区域所处位置)上即可，即按照从前到后的顺序，将第M位的目标候选区域复制至第2位，将第M+3位的目标候选区域复制至第5位，将第M+5位的目标候选区域复制至第M-3位，使得第M位之前所有抑制的“空洞”补全，得到最终M个目标候选区域。这种处理思路降低了冗余计算，并且用复制操作代替排序操作，降低了计算资源的消耗，提高了运算效率。

可选的，在步骤209之后，还可以包括：

步骤210、将所述M个目标候选区域对应的特征图进行池化操作后输入卷积神经网络模型，得到所述卷积神经网络模型输出的对所述M个目标候选区域的内容的识别结果。

在本申请实施例中，最终得到的M个候选区域的选取同时考虑了得分以及重叠率的影响，具有较优价值，将这M个候选区域进行后续的卷积神经网络模型中池化、分类回归等操作，可以输出目标的检测类别和位置，完成目标检测。

综上，本申请实施例提供的一种RPN网络的后处理方法，通过获取RPN 网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量；从所有候选区域中，确定得分最大的N个目标候选区域；根据目标候选区域对应的目标先验区域的尺寸，以及目标候选区域与目标先验区域之间的目标偏移量，计算目标候选区域的尺寸；根据目标候选区域的尺寸，计算目标候选区域之间的重叠率，并根据重叠率，从N个目标候选区域中选取M个目标候选区域，M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。本申请可以根据RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量，先对候选区域进行排序、筛选，确定得分最大的N个目标候选区域，之后再进行N个目标候选区域的尺寸的计算和基于候选区域之间重叠率的考虑，由于N个目标候选区域的数量相较于RPN网络输出的候选区域的数量已经大幅减少，因此，能够大幅降低计算候选区域尺寸的过程中的运算量，减少了大量的冗余计算，降低了处理器的负载压力。

图6是本申请实施例提供的一种RPN网络的后处理装置的框图，如图6所示，该RPN网络的后处理装置300可以包括：获取模块301和处理模块302；

所述获取模块301用于执行：获取RPN网络输出的候选区域的得分，以及所述候选区域与对应的先验区域之间的偏移量；

所述处理模块302用于执行：

可选的，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号；

所述处理模块具体用于：

根据所述候选区域的得分的取值范围以及所述维度，按照桶排序规则，建立桶排序模型，所述桶排序模型用于存储所述索引序号，并在达到预设的终止条件时输出所述得分最大的N个目标候选区域；

将所述候选区域的得分的索引序号输入所述桶排序模型，得到所述桶排序模型输出的所述得分最大的N个目标候选区域，以及每个所述目标候选区域的得分在三个维度上对应的索引序号。

可选的，所述得分的取值范围包括K个得分；所述处理模块具体用于执行：

建立与所述三个维度对应的三个存储片区组，得到所述桶排序模型；

可选的，所述处理模块具体用于执行：

在所述候选区域的目标维度的得分，与所述目标维度对应的目标存储片区组中的存储片区对应的得分匹配的情况下，将所述目标维度的得分对应的索引序号，存入与所述得分对应的存储片区中；所述目标维度为所述候选区域的三个维度中的任一维度；

在将所述候选区域的所有得分的索引序号存储完毕，或所述得分最大的存储片区组中存储片区的容量达到N时，确定达到所述终止条件，并从所述存储片区组中提取所述目标候选区域的得分在所述三个维度上对应的索引序号。

可选的，所述处理模块具体用于执行：

在所述得分最大的存储片区组中存储片区的容量达到N时，将从所述得分最大的存储片区组中提取得到的索引序号，作为所述目标候选区域的得分在所述三个维度上对应的索引序号；

在将所述候选区域的所有得分的索引序号存储完毕的情况下，按照所述存储片区组的得分从大到小的顺序，提取每个所述存储片区组中的索引序号作为所述目标候选区域在所述三个维度上对应的索引序号，直至提取得到N个所述目标候选区域在所述三个维度上对应的索引序号。

可选的，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号；所述维度的索引序号构建的索引、所述候选区域对应的先验区域、所述候选区域的偏移量之间具有对应关系；

所述处理模块还用于执行：

根据所述目标候选区域的得分在所述三个维度上的索引序号所构建的索引，获取所述目标候选区域对应的目标偏移量和目标先验区域的尺寸。

可选的，所述偏移量和所述先验区域的尺寸分别存储于由单指令多数据流处理器提供的连续的内存片区中；所述偏移量和所述先验区域的尺寸的值与所述内存片区一一对应；

所述处理模块具体用于执行：

根据所述索引，通过一次提取操作从所述连续的内存片区中提取得到所述目标候选区域对应的目标偏移量和目标先验区域的尺寸。

可选的，所述先验区域的尺寸包括：所述先验区域的中心点坐标(Xa，Ya)、宽度Wa和高度Ha；所述偏移量包括：中心点偏移量δx，δy、宽度偏移量δw和高度偏移量δh；

所述处理模块具体用于执行：

根据公式1和公式2计算得到所述目标候选区域的中心点坐标(Xb，Yb)；

根据公式3和公式4计算得到所述目标候选区域的宽度Wb和高度Hb；

公式1：Xb＝δx×S×v1×Wa+Xa；公式2：Yb＝δy×S×v1×Ha+Ya；

公式3：Wb＝e ^dw×Wa；公式4：Hb＝e ^dh×Ha；

可选的，所述处理模块具体用于执行：

将所述N个目标候选区域按照得分由大到小的顺序进行排序；

根据所述目标候选区域的尺寸，计算每个得分较大目标候选区域与所有得分较小目标候选区域之间的重叠率；

将所述重叠率大于所述预设重叠率阈值的得分较小目标候选区域删除；

从剩余的所述目标候选区域中选取M个目标候选区域。

可选的，所述处理模块具体用于执行：

在剩余的所述目标候选区域中，从得分最大的目标候选区域开始选取，直至选取得到M个目标候选区域。

可选的，所述处理模块还用于执行：

将所述M个目标候选区域对应的特征图进行池化操作后输入卷积神经网络模型，得到所述卷积神经网络模型输出的对所述M个目标候选区域的内容的识别结果。

综上，本申请实施例提供的RPN网络的后处理装置，通过获取RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量；从所有候选区域中，确定得分最大的N个目标候选区域；根据目标候选区域对应的目标先验区域的尺寸，以及目标候选区域与目标先验区域之间的目标偏移量，计算目标候选区域的尺寸；根据目标候选区域的尺寸，计算目标候选区域之间的重叠率，并根据重叠率，从N个目标候选区域中选取M个目标候选区域，M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。本申请可以根据RPN网络输出的候选区域的得分，以及候选区域与对应的先验区域之间的偏移量，先对候选区域进行排序、筛选，确定得分最大的N个目标候选区域，之后再进行N个目标候选区域的尺寸的计算和基于候选区域之间重叠率的考虑，由于N个目标候选区域的数量相较于RPN网络输出的候选区域的数量已经大幅减少，因此，能够大幅降低计算候选区域尺寸的过程中的运算量，减少了大量的冗余计算，降低了处理器的负载压力。

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述RPN网络的后处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

获取模块可以为外部控制终端与RPN网络的后处理装置连接的接口。例如，外部控制终端可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的控制终端的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。获取模块可以用于接收来自外部控制终端的输入(例如，数据信息、电力等等)并且将接收到的输入传输到RPN网络的后处理装置内的一个或多个元件或者可以用于在RPN网络的后处理装置和外部控制终端之间传输数据。

例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器是控制终端的控制中心，利用各种接口和线路连接整个控制终端的各个部分，通过运行或执行存储在存储器内的软件程序和/或模块，以及调用存储在存储器内的数据，执行控制终端的各种功能和处理数据，从而对控制终端进行整体监控。处理器可包括一个或多个处理单元；优选的，处理器可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器中。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本申请的实施例可提供为方法、控制终端、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的控制终端。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令控制终端的制造品，该指令控制终端实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种RPN网络的后处理方法，其特征在于，所述方法包括：

获取RPN网络输出的候选区域的得分，以及所述候选区域与对应的先验区域之间的偏移量；

从所有所述候选区域中，确定所述得分最大的N个目标候选区域；

根据所述目标候选区域对应的目标先验区域的尺寸，以及所述目标候选区域与所述目标先验区域之间的目标偏移量，计算所述目标候选区域的尺寸；

根据所述目标候选区域的尺寸，计算所述目标候选区域之间的重叠率，并根据所述重叠率，从所述N个目标候选区域中选取M个目标候选区域，所述M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。
根据权利要求1所述的方法，其特征在于，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号；

所述从所有所述候选区域中，确定所述得分最大的N个目标候选区域，包括：

根据所述候选区域的得分的取值范围以及所述维度，按照桶排序规则，建立桶排序模型，所述桶排序模型用于存储所述索引序号，并在达到预设的终止条件时输出所述得分最大的N个目标候选区域；

将所述候选区域的得分的索引序号输入所述桶排序模型，得到所述桶排序模型输出的所述得分最大的N个目标候选区域，以及每个所述目标候选区域的得分在三个维度上对应的索引序号。
根据权利要求2所述的方法，其特征在于，所述得分的取值范围包括K个得分；所述根据所述候选区域的得分的取值范围以及所述维度，按照桶排序规则，建立桶排序模型，包括：

建立与所述三个维度对应的三个存储片区组，得到所述桶排序模型；

其中，每组存储片区组包括K个存储片区，所述K个存储片区与所述K个得分一一对应，每个存储片区的容量上限为N；当一个所述存储片区存入一个所述索引序号时，所述存储片区的容量加一。
根据权利要求3所述的方法，其特征在于，所述将所述候选区域的得分的索引序号输入所述桶排序模型，得到所述桶排序模型输出的所述得分最大的N个目标候选区域，以及每个所述目标候选区域的得分在所述三个维度上对应的索引序号，包括：

在所述候选区域的目标维度的得分，与所述目标维度对应的目标存储片区组中的存储片区对应的得分匹配的情况下，将所述目标维度的得分对应的索引序号，存入与所述得分对应的存储片区中；所述目标维度为所述候选区域的三个维度中的任一维度；

在将所述候选区域的所有得分的索引序号存储完毕，或所述得分最大的存储片区组中存储片区的容量达到N时，确定达到所述终止条件，并从所述存储片区组中提取所述目标候选区域的得分在所述三个维度上对应的索引序号。
根据权利要求4所述的方法，其特征在于，所述从所述存储片区组中提取所述目标候选区域的得分在所述三个维度上对应的索引序号，包括：

在所述得分最大的存储片区组中存储片区的容量达到N时，将从所述得分最大的存储片区组中提取得到的索引序号，作为所述目标候选区域的得分在所述三个维度上对应的索引序号；

在将所述候选区域的所有得分的索引序号存储完毕的情况下，按照所述存储片区组的得分从大到小的顺序，提取每个所述存储片区组中的索引序号作为所述目标候选区域在所述三个维度上对应的索引序号，直至提取得到N个所述目标候选区域在所述三个维度上对应的索引序号。
根据权利要求1所述的方法，其特征在于，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号；所述维度的索引序号构建的索引、所述候选区域对应的先验区域、所述候选区域的偏移量之间具有对应关系；

在所述根据所述目标候选区域对应的目标先验区域的尺寸，以及所述目标候选区域与所述目标先验区域之间的目标偏移量，计算所述目标候选区域的尺寸之前，所述方法还包括：

根据所述目标候选区域的得分在所述三个维度上的索引序号所构建的索引，获取所述目标候选区域对应的目标偏移量和目标先验区域的尺寸。
根据权利要求1所述的方法，其特征在于，所述偏移量和所述先验区域的尺寸分别存储于由单指令多数据流处理器提供的连续的内存片区中；所述偏移量和所述先验区域的尺寸的值与所述内存片区一一对应；

所述根据所述目标候选区域的得分在所述三个维度上的索引序号所构建的索引，获取所述目标候选区域对应的目标偏移量和目标先验区域的尺寸，包括：

根据所述索引，通过一次提取操作从所述连续的内存片区中提取得到所述目标候选区域对应的目标偏移量和目标先验区域的尺寸。
根据权利要求1所述的方法，其特征在于，所述先验区域的尺寸包括：所述先验区域的中心点坐标(Xa，Ya)、宽度Wa和高度Ha；所述偏移量包括：中心点偏移量δx，δy、宽度偏移量δw和高度偏移量δh；

所述根据所述目标候选区域对应的目标先验区域的尺寸，以及所述目标候选区域与所述目标先验区域之间的目标偏移量，计算所述目标候选区域的尺寸，包括：

根据公式1和公式2计算得到所述目标候选区域的中心点坐标(Xb，Yb)；

根据公式3和公式4计算得到所述目标候选区域的宽度Wb和高度Hb；

公式1：Xb＝δx×S×v1×Wa+Xa；公式2：Yb＝δy×S×v1×Ha+Ya；

公式3：Wb＝e ^dw×Wa；公式4：Hb＝e ^dh×Ha；

其中，S为定点数到浮点数的转换系数；v1为所述先验区域的中心点坐标与所述先验区域的宽度的方差；dw＝δw×S×v2；dh＝δh×S×v2；v2为所述先验区域的中心点坐标与所述先验区域的高度的方差。
根据权利要求8所述的方法，其特征在于，在通过所述公式3和所述公式4计算得到所述宽度Wb和所述高度Hb的过程中，e ^dw的值通过查询第一运算表得到，e ^dh的值通过查询第二运算表得到；δw和δh的取值范围包括J个定点整数；

其中，所述第一运算表包括：根据e ^dw＝e ^δw×S×V2计算得到的J个浮点数格式的结果；所述第二运算表包括：根据e ^dh＝e ^δh×S×V2计算得到的J个浮点数格式的结果。
根据权利要求1所述的方法，其特征在于，所述根据所述目标候选区域的尺寸，计算所述目标候选区域之间的重叠率，并根据所述重叠率，从所述N个目标候选区域中选取M个目标候选区域，包括：

将所述N个目标候选区域按照得分由大到小的顺序进行排序；

根据所述目标候选区域的尺寸，计算每个得分较大目标候选区域与所有得分较小目标候选区域之间的重叠率；

将所述重叠率大于所述预设重叠率阈值的得分较小目标候选区域删除；

从剩余的所述目标候选区域中选取M个目标候选区域。
根据权利要求10所述的方法，其特征在于，所述从剩余的所述目标候选区域中选取M个目标候选区域，包括：

在剩余的所述目标候选区域中，从得分最大的目标候选区域开始选取，直至选取得到M个目标候选区域。
根据权利要求1至11任一项所述的方法，其特征在于，在所述从所述N个目标候选区域中选取M个目标候选区域之后，所述方法还包括：

将所述M个目标候选区域对应的特征图进行池化操作后输入卷积神经网络模型，得到所述卷积神经网络模型输出的对所述M个目标候选区域的内容的识别结果。
根据权利要求2所述的方法，其特征在于，所述桶排序模型、所述先验区域的尺寸和所述偏移量存储于紧耦合内存处理器中。
一种RPN网络的后处理装置，其特征在于，所述装置包括：获取模块和处理模块；

所述获取模块用于获取RPN网络输出的候选区域的得分，以及所述候选区域与对应的先验区域之间的偏移量；

所述处理模块用于从所有所述候选区域中，确定所述得分最大的N个目标候选区域；

根据所述目标候选区域对应的目标先验区域的尺寸，以及所述目标候选区域与所述目标先验区域之间的目标偏移量，计算所述目标候选区域的尺寸；

根据所述目标候选区域的尺寸，计算所述目标候选区域之间的重叠率，并根据所述重叠率，从所述N个目标候选区域中选取M个目标候选区域，所述M个目标候选区域之间的重叠率小于或等于预设重叠率阈值。
根据权利要求14所述的装置，其特征在于，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号；

所述处理模块具体用于：

根据所述候选区域的得分的取值范围以及所述维度，按照桶排序规则，建立桶排序模型，所述桶排序模型用于存储所述索引序号，并在达到预设的终止条件时输出所述得分最大的N个目标候选区域；

将所述候选区域的得分的索引序号输入所述桶排序模型，得到所述桶排序模型输出的所述得分最大的N个目标候选区域，以及每个所述目标候选区域的得分在三个维度上对应的索引序号。
根据权利要求15所述的装置，其特征在于，所述得分的取值范围包括K个得分；所述处理模块具体用于执行：

建立与所述三个维度对应的三个存储片区组，得到所述桶排序模型；

其中，每组存储片区组包括K个存储片区，所述K个存储片区与所述K个得分一一对应，每个存储片区的容量上限为N；当一个所述存储片区存入一个所述索引序号时，所述存储片区的容量加一。
根据权利要求16所述的装置，其特征在于，所述处理模块具体用于执行：

在所述候选区域的目标维度的得分，与所述目标维度对应的目标存储片区组中的存储片区对应的得分匹配的情况下，将所述目标维度的得分对应的索引序号，存入与所述得分对应的存储片区中；所述目标维度为所述候选区域的三个维度中的任一维度；

在将所述候选区域的所有得分的索引序号存储完毕，或所述得分最大的存储片区组中存储片区的容量达到N时，确定达到所述终止条件，并从所述存储片区组中提取所述目标候选区域的得分在所述三个维度上对应的索引序号。
根据权利要求17所述的装置，其特征在于，所述处理模块具体用于执行：

在所述得分最大的存储片区组中存储片区的容量达到N时，将从所述得分最大的存储片区组中提取得到的索引序号，作为所述目标候选区域的得分在所述三个维度上对应的索引序号；

在将所述候选区域的所有得分的索引序号存储完毕的情况下，按照所述存储片区组的得分从大到小的顺序，提取每个所述存储片区组中的索引序号作为所述目标候选区域在所述三个维度上对应的索引序号，直至提取得到N个所述目标候选区域在所述三个维度上对应的索引序号。
根据权利要求14所述的装置，其特征在于，所述候选区域的得分包括：所述候选区域的分别对应三个维度的得分以及索引序号；所述维度的索引序号构建的索引、所述候选区域对应的先验区域、所述候选区域的偏移量之间具有对应关系；

所述处理模块还用于执行：

根据所述目标候选区域的得分在所述三个维度上的索引序号所构建的索引，获取所述目标候选区域对应的目标偏移量和目标先验区域的尺寸。
根据权利要求14所述的装置，其特征在于，所述偏移量和所述先验区域的尺寸分别存储于由单指令多数据流处理器提供的连续的内存片区中；所述偏移量和所述先验区域的尺寸的值与所述内存片区一一对应；

所述处理模块具体用于执行：

根据所述索引，通过一次提取操作从所述连续的内存片区中提取得到所述目标候选区域对应的目标偏移量和目标先验区域的尺寸。
根据权利要求14所述的装置，其特征在于，所述先验区域的尺寸包括：所述先验区域的中心点坐标(Xa，Ya)、宽度Wa和高度Ha；所述偏移量包括：中心点偏移量δx，δy、宽度偏移量δw和高度偏移量δh；

所述处理模块具体用于执行：

根据公式1和公式2计算得到所述目标候选区域的中心点坐标(Xb，Yb)；

根据公式3和公式4计算得到所述目标候选区域的宽度Wb和高度Hb；

公式1：Xb＝δx×S×v1×Wa+Xa；公式2：Yb＝δy×S×v1×Ha+Ya；

公式3：Wb＝e ^dw×Wa；公式4：Hb＝e ^dh×Ha；

其中，S为定点数到浮点数的转换系数；v1为所述先验区域的中心点坐标与所述先验区域的宽度的方差；dw＝δw×S×v2；dh＝δh×S×v2；v2为所述先验区域的中心点坐标与所述先验区域的高度的方差。
根据权利要求21所述的装置，其特征在于，在通过所述公式3和所述公式4计算得到所述宽度Wb和所述高度Hb的过程中，e ^dw的值通过查询第一运算表得到，e ^dh的值通过查询第二运算表得到；δw和δh的取值范围包括J个定点整数；

其中，所述第一运算表包括：根据e ^dw＝e ^δw×S×V2计算得到的J个浮点数格式的结果；所述第二运算表包括：根据e ^dh＝e ^δh×S×V2计算得到的J个浮点数格式的结果。
根据权利要求14所述的装置，其特征在于，所述处理模块具体用于执行：

将所述N个目标候选区域按照得分由大到小的顺序进行排序；

根据所述目标候选区域的尺寸，计算每个得分较大目标候选区域与所有得分较小目标候选区域之间的重叠率；

将所述重叠率大于所述预设重叠率阈值的得分较小目标候选区域删除；

从剩余的所述目标候选区域中选取M个目标候选区域。
根据权利要求23所述的装置，其特征在于，所述处理模块具体用于执行：

在剩余的所述目标候选区域中，从得分最大的目标候选区域开始选取，直至选取得到M个目标候选区域。
根据权利要求14至24任一项所述的装置，其特征在于，所述处理模块还用于执行：

将所述M个目标候选区域对应的特征图进行池化操作后输入卷积神经网络模型，得到所述卷积神经网络模型输出的对所述M个目标候选区域的内容的识别结果。
根据权利要求15所述的装置，其特征在于，所述桶排序模型、所述先验区域的尺寸和所述偏移量存储于紧耦合内存处理器中。
一种计算机可读存储介质，其特征在于，包括指令，当其在计算机上运行时，使得所述计算机执行权利要求1至14中任一项所述的RPN网络的后处理方法。