WO2023169369A1

WO2023169369A1 - 一种行人重识别方法、系统、装置、设备及介质

Info

Publication number: WO2023169369A1
Application number: PCT/CN2023/079895
Authority: WO
Inventors: 杨宏斌; 董刚; 刘海威; 蒋东东; 曹其春; 梁玲燕; 晁银银; 胡克坤; 王斌强; 尹文枫
Original assignee: 浪潮(北京)电子信息产业有限公司
Priority date: 2022-03-11
Filing date: 2023-03-06
Publication date: 2023-09-14
Also published as: CN114581952A

Abstract

本申请公开了一种行人重识别方法、系统、装置、设备及计算机可读存储介质，应用于异构计算设备，获取图像特征、量化参数、指令序列和滤波系数；图像特征包括待识别的目标行人图像的图像特征；按照指令序列对图像特征进行池化处理，得到池化处理结果；按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果；基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。本申请借助异构计算设备实现了行人重识别网络，可以提高计算效率，能效比及灵活性高，适用性好。本申请提供的一种行人重识别系统、装置、设备及计算机可读存储介质也解决了相应技术问题。

Description

一种行人重识别方法、系统、装置、设备及介质

相关申请的交叉引用

本申请要求于2022年3月11日提交中国专利局，申请号为202210242524.6，申请名称为“一种行人重识别方法、系统、装置、设备及计算机介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，更具体地说，涉及一种行人重识别方法、系统、装置、设备及非易失性可读存储介质。

背景技术

行人重识别也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。给定一个监控行人图像，检索跨设备下的该行人图像。旨在弥补目前固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。

现有实现行人重识别的方法有：在GPU(graphics processing unit，图形处理器)平台上运行所有的过程，包括图像采集、后面处理流程等，但该方法的计算效率低、能效比低且灵活性差，适用性差。

发明内容

本申请的目的是提供一种行人重识别方法，其能在一定程度上解决如何提高行人重识别的适用性的技术问题。本申请还提供了一种行人重识别系统、装置、设备及非易失性可读存储介质。

为了实现上述目的，本申请提供如下技术方案：

一种行人重识别方法，应用于异构计算设备，包括：

获取图像特征、量化参数、指令序列和滤波系数；图像特征包括待识别的目标行人图像的图像特征；

按照指令序列对图像特征进行池化处理，得到池化处理结果；

按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果；

基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。

在一些实施例中的，按照指令序列对图像特征进行池化处理，得到池化处理结果，包括：

当池化格式为3*3时，基于指令序列，将图像特征对应的数据分开存入三个先入先出存储器中，其中，第三个先入先出存储器的输出端与第一个先入先出存储器的输入端相连接；

对三个先入先出存储器中的数据进行池化处理，得到池化处理结果。

在一些实施例中的，第一个先入先出存储器的深度为目标行人图像的特征图的宽度，第二个及第三个先入先出存储器的深度为两倍的宽度。

在一些实施例中的，基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果之后，还包括：

传输行人重识别结果至预设数据库，以基于行人重识别结果及预设数据库中存储的人物信息确定目标行人信息。

在一些实施例中的，获取图像特征、量化参数、指令序列和滤波系数之后，按照指令序列对图像特征进行池化处理，得到池化处理结果之前，还包括：

将图像特征、量化参数、指令序列和滤波系数存入存储器。

在一些实施例中的，将图像特征、量化参数、指令序列和滤波系数存入存储器，包括：

将图像特征、量化参数、指令序列和滤波系数存入不同的存储器中。

一种行人重识别系统，应用于异构计算设备，包括：

第一获取模块，用于获取图像特征、量化参数、指令序列和滤波系数，图像特征包括待识别的目标行人图像的图像特征；

第一池化模块，用于按照指令序列对图像特征进行池化处理，得到池化处理结果；

第一卷积模块，用于按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果；

第一确定模块，用于基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。

一种行人重识别装置，包括异构计算设备；

异构计算设备包括：PCIE控制器；与PCIE控制器连接的交叉开关矩阵；与交叉开关矩阵连接的调度核；与交叉开关矩阵连接的存储器；分别与调度核、开关交叉矩阵及存储器连接的池化运算器；分别与调度核、开关交叉矩阵及存储器连接的卷积运算器；

PCIE控制器，用于通过交叉开关矩阵将图像特征、量化参数、指令序列及滤波系数存入存储器，图像特征包括待识别的目标行人图像的图像特征；

调度核，用于基于指令序列控制池化运算器、卷积运算器的工作；

池化运算器，用于对图像特征进行池化处理；

卷积运算器，用于基于量化参数、滤波系数对图像特征进行卷积处理。

一种行人重识别设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现如上任一行人重识别方法的步骤。

一种非易失性可读存储介质，非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如上任一行人重识别方法的步骤。

本申请提供的一种行人重识别方法，应用于异构计算设备，获取图像特征、量化参数、指令序列和滤波系数；图像特征包括待识别的目标行人图像的图像特征；按照指令序列对图像特征进行池化处理，得到池化处理结果；按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果；基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。本申请借助异构计算设备实现了行人重识别网络，可以提高计算效率，能效比及灵活性高，适用性好。本申请提供的一种行人重识别系统、装置、设备及非易失性可读存储介质也解决了相应技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种行人重识别方法的流程图；

图2为本申请实施例提供的一种行人重识别系统的结构示意图；

图3为本申请实施例提供的一种行人重识别装置的第一结构示意图；

图4为3x3结构的池化单元示意图；

图5为2x2结构的池化单元示意图；

图6为本申请实施例提供的一种行人重识别装置的第二结构示意图；

图7为卷积单元的结构示意图；

图8为本申请中行人重识别装置的使用示意图；

图9为本申请实施例提供的一种行人重识别设备的结构示意图；

图10为本申请实施例提供的一种行人重识别设备的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1为本申请实施例提供的一种行人重识别方法的流程图。

本申请一些实施例提供的一种行人重识别方法，应用于异构计算设备，可以包括以下步骤：

步骤S101：获取图像特征、量化参数、指令序列和滤波系数；图像特征包括待识别的目标行人图像的图像特征。

实际应用中，异构计算设备可以先获取图像特征、量化参数、指令序列和滤波系数，以便后续基于图像特征、量化参数、指令序列和滤波系数进行行人重识别；且图像特征包括待识别的目标行人图像的图像特征，量化参数、指令序列和滤波系数的具体内容可以根据实际需要确定，本申请在此不做具体限定。

具体应用场景中，异构计算设备在获取图像特征、量化参数、指令序列和滤波系数之后，为了便于应用图像特征、量化参数、指令序列和滤波系数，还可以将图像特征、量化参数、指令序列和滤波系数存入存储器。具体的，为了便于区分图像特征、量化参数、指令序列和滤波系数，还可以将图像特征、量化参数、指令序列和滤波系数存入不同的存储器中等。

步骤S102：按照指令序列对图像特征进行池化处理，得到池化处理结果。

实际应用中，异构计算设备在获取图像特征、量化参数、指令序列和滤波系数之后，便可以按照指令序列对图像特征进行池化处理，得到池化处理结果。

具体应用场景中，异构计算设备在按照指令序列对图像特征进行池化处理，得到池化处理结果的过程中，为了加快处理速率，当池化格式为3*3时，可以基于指令序列，将图像特征对应的数据分开存入三个先入先出存储器中，其中，第三个先入先出存储器的输出端与第一个先入先出存储器的输入端相连接；对三个先入先出存储器中的数据进行池化处理，得到池化处理结果。且具体应用场景中，三个先入先出存储器的参数可以根据实际需要确定，比如第一个先入先出存储器的深度可以为目标行人图像的特征图的宽度，第二个及第三个先入先出存储器的深度可以为两倍的宽度等。

需要说明的是，在一些实施例中，借助不同的先入先出存储器存储用于计算的数据，解耦合了数据加载侧和数据计算侧，使得数据加载模块只需要判断先入先出存储器的不满标志来依次读取外存进行加载，由于数据是连续存放，只需要流式读取即可，不需要判断地址，先入先出存储器输出侧判断各先入先出存储器的不空标志来进行输出，数据计算模块是流水线计算；这样可以数据输入输出的端口固定，无需使用端口选择器，且外部数据只需读取一次，缓存根据池化模式进行数据重用，可以明显简化系统设计，提高系统性能。

步骤S103：按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果。

实际应用中，异构计算设备在按照指令序列对图像特征进行池化处理，得到池化处理结果之后，便可以按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果。

步骤S104：基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。

实际应用中，异构计算设备得到池化处理结果和卷积处理结果之后，便可以基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果，具体的，可以先基于池化处理结果和卷积处理结果确定目标行人图像携带的行人特征，再基于该行人特征确定对应的行人重识别结果等，本申请在此不做具体限定。

具体应用场景中，异构计算设备在基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果之后，还可以传输行人重识别结果至预设数据库，以基于行人重识别结果及预设数据库中存储的人物信息确定目标行人信息，以借助预设数据库尽可能多的获取行人信息，方便用户等使用目标行人信息对目标行人图像进行分析。

本申请提供的一种行人重识别方法，应用于异构计算设备，获取图像特征、量化参数、指令序列和滤波系数；图像特征包括待识别的目标行人图像的图像特征；按照指令序列对图像特征进行池化处理，得到池化处理结果；按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果；基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。本申请借助异构计算设备实现了行人重识别网络，可以提高计算效率，能效比及灵活性高，适用性好。

请参阅图2，图2为本申请实施例提供的一种行人重识别系统的结构示意图。

本申请一些实施例提供的一种行人重识别系统，应用于异构计算设备，可以包括：

第一获取模块101，用于获取图像特征、量化参数、指令序列和滤波系数，图像特征包括待识别的目标行人图像的图像特征；

第一池化模块102，用于按照指令序列对图像特征进行池化处理，得到池化处理结果；

第一卷积模块103，用于按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理，得到卷积处理结果；

第一确定模块104，用于基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。

本申请一些实施例提供的一种行人重识别系统，应用于异构计算设备，第一池化模块可以包括：

第一存储单元，用于当池化格式为3*3时，基于指令序列，将图像特征对应的数据分开存入三个先入先出存储器中，其中，第三个先入先出存储器的输出端与第一个先入先出存储器的输入端相连接；

第一池化单元，用于对三个先入先出存储器中的数据进行池化处理，得到池化处理结果。

本申请一些实施例提供的一种行人重识别系统，应用于异构计算设备，第一个先入先出存储器的深度为目标行人图像的特征图的宽度，第二个及第三个先入先出存储器的深度为两倍的宽度。

本申请一些实施例提供的一种行人重识别系统，应用于异构计算设备，还可以包括：

第一传输模块，用于第一确定模块基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果之后，传输行人重识别结果至预设数据库，以基于行人重识别结果及预设数据库中存储的人物信息确定目标行人信息。

第一存储模块，用于第一获取模块获取图像特征、量化参数、指令序列和滤波系数之后，第一池化模块按照指令序列对图像特征进行池化处理，得到池化处理结果之前，将图像特征、量化参数、指令序列和滤波系数存入存储器。

本申请一些实施例提供的一种行人重识别系统，应用于异构计算设备，第一存储模块可以包括：

第二存储单元，用于将图像特征、量化参数、指令序列和滤波系数存入不同的存储器中。

请参阅图3，图3为本申请实施例提供的一种行人重识别装置的第一结构示意图。

本申请一些实施例提供的一种行人重识别装置，包括异构计算设备；

异构计算设备包括：PCIE(peripheral component interconnect express，高速串行计算机扩展总线标准)控制器；与PCIE控制器连接的交叉开关矩阵(crossbar)；与交叉开关矩阵连接的调度核；与交叉开关矩阵连接的存储器；分别与调度核、开关交叉矩阵及存储器连接的池化运算器(Pooling Unit)；分别与调度核、开关交叉矩阵及存储器连接的卷积运算器(Convolution Unit)；

池化运算器，用于对图像特征进行池化处理；

实际应用中，卷积运算器、池化运算器的结构等均可以根据实际需要确定，比如考虑到深度可分离卷积的3x3部分没有通道累加，一张特征图对应一个3x3kernel，因此滤波的切换频率较低，而1x1卷积有通道累加，为减少中间结果的缓存，优先进行一组数据的各通道计算，这样会涉及到各通道的滤波频繁切换，两者输出给卷积中PE阵列的带宽不同，因此将滤波缓存分为1x1和3x3两组缓存，也即滤波系数可以为1x1滤波器的参数、3x3滤波器的参数；且卷积运算器、池化运算器、存储器、调度核等的数量也可以根据实际需要确定，本申请在此不做具体限定。

需要说明的是，PCIE控制器中缓存图像特征、量化参数、指令序列及滤波系数的方式及容量等也可以根据实际需要确定，比如可以用512K的缓存容量缓存图像特征，用2MB的缓存容量缓存1x1滤波系数，用64KB的缓存空间缓存3x3滤波系数，用8K的缓存容量缓存指令序列，用1M的缓存容量缓存量化参数等，本申请在此不做具体限定。此外，本申请中异构计算设备上行人重识别网络的运行原理可以参阅现有技术，在此不再赘述。此外，还可以根据需要在本申请提供的行人重识别装置中添加实现相应功能的其他器件，本申请在此不再赘述。

需要说明的是，本申请中异构计算设备的框架可以根据实际需要灵活选择，比如异构计算设备的框架可以为FPGA(Field Programmable Gate Array，现场可编程逻辑门阵列)等。

具体应用场景中，指令序列的类型及结构等可以根据实际需要灵活确定，比如卷积指令格式可以如表1所示，池化指令格式可以如表2所示，且指令中的参数定义可以如表3所示，指令序列可以如表4所示等。

表1卷积指令格式

表2池化指令格式

表3参数定义表

表4指令序列示意表

本申请提供的一种行人重识别装置，包括实现行人重识别网络的异构计算设备；异构计算设备包括：PCIE控制器；与PCIE控制器连接的交叉开关矩阵；与交叉开关矩阵连接的调度核；与交叉开关矩阵连接的存储器；分别与调度核、开关交叉矩阵及存储器连接的池化运算器；分别与调度核、开关交叉矩阵及存储器连接的卷积运算器；PCIE控制器，用于通过交叉开关矩阵将图像特征、量化参数、指令序列及滤波系数存入存储器，图像特征包括待识别的目标行人图像的图像特征；调度核，用于基于指令序列控制池化运算器、卷积运算器的工作；池化运算器，用于对图像特征进行池化处理；卷积运算器，用于基于量化参数、滤波系数对图像特征进行卷积处理。本申请借助异构计算设备实现了行人重识别网络，可以提高计算效率，能效比及灵活性高，适用性好。

本申请一些实施例提供的一种行人重识别装置中，为了便于PCIE控制器与交叉开关矩阵进行数据交互，PCIE控制器可以通过寄存器(Register Ctrl)、中断接口(Interrupt Ctrl)及直接存储器访问线路(DMA Transfer)等与交叉开关矩阵相连接。

本申请一些实施例提供的一种行人重识别装置中，为了便于存储计算所需的数据，存储器可以包括存储图像特征的第一存储器，存储滤波系数的第二存储器，存储量化参数的第三存储器；且一组存储器用于存储一个网络层的输入数据或输出数据，这样可以减少片上缓存使用。

需要说明的是，由于行人重识别网络中的池化和残差结果会用作若干层卷积计算后的输入数据，因此需要使用额外的缓存来进行暂存；另外每层的池化、卷积等计算都需要乒乓缓存结构来存取数据，即从一组缓存读取数据，计算完成后将结果写入另外一组缓存，以防止源数据被覆盖，这样便需要多组缓存来进行各层数据流转。

具体应用场景中，为了便于存储数据，存储器可以包括超级随机访问存储器(Ultra Random Access Memory，URAM)等。

请参阅图4和图5，图4为3x3结构的池化单元示意图，图5为2x2结构的池化单元示意图。

本申请一些实施例提供的一种行人重识别装置中，池化运算器的结构为3*3时，池化运算器包括3个存储待计算数据的先入先出存储器(First Input First Output，FIFO)，第三个先入先出存储器的输出端与第一个先入先出存储器的输入端相连接，且第一个先入先出存储器的深度为目标行人图像的特征图的宽度，第二个及第三个先入先出存储器的深度为两倍的宽度，当启动池化运算器的计算后，图4左侧读端口按顺序读取特征图数据，依次加载3个先入先出存储器，如图4左侧所示，当加载到第3行先入先出存储器时，即第三行至少有1个数据时，三行先入先出存储器开始并行输出，一个时钟周期输出三个数据，根据最大池化或平均池化选择进入如图4右侧所示的3输入流水线计算模块；首先3个值通过加法树或比较树结构得到3个值的和或最大值，继而通过累加器或循环比较器用3个时钟周期得到最终结果，在并行输出进行计算的同时，如图4左侧所示，第三行的数据回送给第一行，数据加载模块连续加载二、三行，在输出一行的同时要加载完两行，则数据可以不间断送给相应计算模块，提高系统性能。

池化单元的结构为2*2时，池化运算器包括2个存储待计算数据的先入先出存储器，此时只需加载数据到两个先入先出存储器中，当加载到第二行先入先出存储器时，即第二行至少有1个数据时，两行先入先出存储器开始并行输出，一个时钟周期输出两个数据，根据最大池化或平均池化选择进入如图5所示的2输入流水线计算模块；首先2个值通过加法树或比较树结构得到2个值的和或最大值，继而通过累加器或循环比较器用2个时钟周期得到最终结果。

请参阅图6，图6为本申请实施例提供的一种行人重识别装置的第二结构示意图。

本申请一些实施例提供的一种行人重识别装置，还可以包括：

与异构计算设备连接的数据库，用于存储人物信息，相应的，可以将行人计算结果与数据库进行匹配，得到目标行人的人物信息等。

具体应用场景中，为了便于用户获知目标行人的人物信息，本申请提供的一种行人重识别装置中还可以包括显示器，用于显示数据库中与行人计算结果对应的人物信息，行人计算结果也即异构计算设备对目标行人图像的计算结果。

具体应用场景中，为了便于异构计算设备进行行人识别，还可以借助已有的神经网络预先对行人图像进行目标检测得到检测结果，再基于检测结果确定目标行人图像，并将目标行人图像输入给异构计算设备进行处理，相应的，本申请提供的一种行人重识别装置中还可以包括：与异构计算设备连接的图形处理器，用于基于YOLO网络对预处理后的行人图像进行目标检测，得到用于确定目标行人图像的检测结果，具体的，可以通过对检测结果进行人框预处理，比如经过图像提取、裁剪等来得到目标行人图像。

具体应用场景中，为了便于进行行人重识别，本申请提供的一种行人重识别装置中还可以包括：与图形处理器连接的多路摄像头，用于拍摄原始的行人图像，此时，对原始的行人图像进行解码及预处理，比如按照固定帧率对原始的行人图像进行opencv解码，并进行大小调整、像素调整后等，便可以得到预处理后的行人图像。

需要说明的是，本申请中卷积单元的结构可以根据实际需要确定，比如其结构可以如图7所示，此时卷积单元使用PE阵列，多个通道并行计算，结构中依次有残差、量化和激活模块，具体的，只需根据是否有残差和激活操作，选择通过相应的计算模块，便可以得到最终的计算结果。且在此过程中Feature缓存输出给PE阵列的同时，输出filter加载信号给filter缓存，以便按照确定的时序加载相对应的filter，保证PE阵列高效运行。此外，不难看出，卷积单元的结构简洁高效，减少了多个模块重复访存的同时，简化了信号交互控制，提高了整体计算效率。

请参阅图8，图8为本申请中行人重识别装置的使用示意图。为了便于理解本申请提供的行人重识别装置，现结合用于管控行人重识别装置的上位机，比如服务器等，来对本申请中行人重识别装置的使用过程进行描述，其可以包括以下步骤：

步骤S201：将多路摄像头、GPU计算卡、异构计算加速卡安装到工作站上，连接显示器输出；

步骤S202：上位机通过PCIE接口将滤波器参数写到片上URAM缓存；

步骤S203：上位机通过PCIE接口将量化参数写到片上URAM缓存；

步骤S204：上位机通过PCIE接口将待执行的指令序列写到片上URAM缓存；

步骤S205：多路摄像头根据实时性要求按固定帧率采集图像帧，得到原始的行人图像；

步骤S206：软件调用opencv图像处理函数对原始的行人图像进行解码和预处理，得到预处理后的行人图像；

步骤S207：软件将处理后图像送入GPU上的YOLO网络进行目标检测，得到检测结果；

步骤S208：软件对检测结果进行人框预处理，得到目标行人图像；

步骤S209：上位机通过PCIE接口将目标行人图像的图像特征数据写到片上URAM缓存；

步骤S210：上位机通过PCIE接口发命令给片上调度核开始执行；

步骤S211：调度核取指、译码，依次生成每层的控制和参数信号给卷积单元、池化单元等计算部件；

步骤S212：计算部件依次完成从缓存取数、计算和将结果写回缓存；

步骤S213：待网络中所有层计算完成后，得到一组图像的计算结果；

步骤S214：调度核生成PCIE中断信号给上位机，上位机收到后取回计算结果；

步骤S215：软件将计算结果在数据库进行查询匹配，在显示器上输出显示人物相关信息；

步骤S216：重复执行多路摄像头根据实时性要求按固定帧率采集图像帧及之后的步骤，直到行人重识别任务完成。

本申请还提供了一种行人重识别设备及非易失性可读存储介质，其均具有本申请一些实施例提供的一种行人重识别方法具有的对应效果。请参阅图9，图9为本申请实施例提供的一种行人重识别设备的结构示意图。

本申请一些实施例提供的一种行人重识别设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如上任一实施例所描述行人重识别方法的步骤。

请参阅图10，本申请一些实施例提供的另一种行人重识别设备中还可以包括：与处理器202连接的输入端口203，用于传输外界输入的命令至处理器202；与处理器202连接的显示单元204，用于显示处理器202的处理结果至外界；与处理器202连接的通信模块205，用于实现行人重识别设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等；通信模块205所采用的通信方式包括但不局限于移动高清链接技术(HML)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线连接：无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术。

本申请一些实施例提供的一种非易失性可读存储介质，非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如上任一实施例所描述行人重识别方法的步骤。

本申请所涉及的非易失性可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种行人重识别方法，其特征在于，应用于异构计算设备，包括：

获取图像特征、量化参数、指令序列和滤波系数；所述图像特征包括待识别的目标行人图像的图像特征；

按照所述指令序列对所述图像特征进行池化处理，得到池化处理结果；

按照所述指令序列并基于所述量化参数和所述滤波系数对所述图像特征进行卷积处理，得到卷积处理结果；

基于所述池化处理结果和所述卷积处理结果确定所述目标行人图像对应的行人重识别结果。
根据权利要求1所述的方法，其特征在于，所述按照所述指令序列对所述图像特征进行池化处理，得到池化处理结果，包括：

当池化格式为3*3时，基于所述指令序列，将所述图像特征对应的数据分开存入三个先入先出存储器中，其中，第三个所述先入先出存储器的输出端与第一个所述先入先出存储器的输入端相连接；

对三个所述先入先出存储器中的数据进行池化处理，得到所述池化处理结果。
根据权利要求2所述的方法，其特征在于，第一个所述先入先出存储器的深度为所述目标行人图像的特征图的宽度，第二个及第三个所述先入先出存储器的深度为两倍的所述宽度。
根据权利要求2所述的方法，其特征在于，所述对三个所述先入先出存储器中的数据进行池化处理，得到所述池化处理结果的步骤，包括：

基于所述先入先出存储器的不满标志依次读取外存进行加载，对三个所述先入先出存储器中的数据进行池化处理，得到所述池化处理结果。
根据权利要求1所述的方法，其特征在于，所述基于所述池化处理结果和所述卷积处理结果确定所述目标行人图像对应的行人重识别结果的步骤，包括：

基于所述池化处理结果和所述卷积处理结果确定目标行人图像携带的行人特征；

基于所述行人特征确定对应的行人重识别结果。
根据权利要求1至5任一项所述的方法，其特征在于，所述基于所述池化处理结果和所述卷积处理结果确定所述目标行人图像对应的行人重识别结果之后，还包括：

传输所述行人重识别结果至预设数据库，以基于所述行人重识别结果及所述预设数据库中存储的人物信息确定目标行人信息。
根据权利要求6所述的方法，其特征在于，所述获取图像特征、量化参数、指令序列和滤波系数之后，所述按照所述指令序列对所述图像特征进行池化处理，得到池化处理结果之前，还包括：

将所述图像特征、所述量化参数、所述指令序列和所述滤波系数存入存储器。
根据权利要求7所述的方法，其特征在于，所述将所述图像特征、所述量化参数、所述指令序列和所述滤波系数存入存储器，包括：

将所述图像特征、所述量化参数、所述指令序列和所述滤波系数存入不同的存储器中。
一种行人重识别系统，其特征在于，应用于异构计算设备，包括：

第一获取模块，用于获取图像特征、量化参数、指令序列和滤波系数，所述图像特征包括待识别的目标行人图像的图像特征；

第一池化模块，用于按照所述指令序列对所述图像特征进行池化处理，得到池化处理结果；

第一卷积模块，用于按照所述指令序列并基于所述量化参数和所述滤波系数对所述图像特征进行卷积处理，得到卷积处理结果；

第一确定模块，用于基于所述池化处理结果和所述卷积处理结果确定所述目标行人图像对应的行人重识别结果。
一种行人重识别装置，其特征在于，包括异构计算设备；

所述异构计算设备包括：PCIE控制器；与所述PCIE控制器连接的交叉开关矩阵；与所述交叉开关矩阵连接的调度核；与所述交叉开关矩阵连接的存储器；分别与所述调度核、所述开关交叉矩阵及所述存储器连接的池化运算器；分别与所述调度核、所述开关交叉矩阵及所述存储器连接的卷积运算器；

所述PCIE控制器，用于通过所述交叉开关矩阵将图像特征、量化参数、指令序列及滤波系数存入所述存储器，所述图像特征包括待识别的目标行人图像的图像特征；

所述调度核，用于基于所述指令序列控制所述池化运算器、所述卷积运算器的工作；

所述池化运算器，用于对所述图像特征进行池化处理；

所述卷积运算器，用于基于所述量化参数、所述滤波系数对所述图像特征进行卷积处理。
根据权利要求10所述的装置，其特征在于，所述滤波系数为1x1滤波器的参数或3x3滤波器的参数。
根据权利要求11所述的装置，其特征在于，所述PCIE控制器用512K的缓存容量缓存所述图像特征，用2MB的缓存容量缓存1x1滤波系数，用64KB的缓存空间缓存3x3滤波系数，用8K的缓存容量缓存指令序列，用1M的缓存容量缓存量化参数。
根据权利要求10所述的装置，其特征在于，所述池化运算器为3*3时，所述池化运算器包括三个存储待计算数据的先入先出存储器，第三个先入先出存储器的输出端与第一个先入先出存储器的输入端相连接，且第一个先入先出存储器的深度为目标行人图像的特征图的宽度，第二个及第三个先入先出存储器的深度为两倍的宽度。
根据权利要求13所述的装置，其特征在于，当启动所述池化运算器的计算后，按顺序读取特征图数据，依次加载到三个所述先入先出存储器，当加载到所述第三个先入先出存储器时，所述三个先入先出存储器开始并行输出，一个时钟周期输出三个数据，根据最大池化或平均池化选择进入流水线计算模块。
根据权利要求10所述的装置，其特征在于，所述池化运算器的结构为2*2时，所述池化运算器包括2个存储待计算数据的先入先出存储器。
根据权利要求15所述的装置，其特征在于，将特征图数据依次加载到两个所述先入先出存储器中，当加载到第二个先入先出存储器时，两个先入先出存储器开始并行输出，一个时钟周期输出两个数据，根据最大池化或平均池化选择进入流水线计算模块。
根据权利要求10所述的装置，其特征在于，所述行人重识别装置中还包括：与所述异构计算设备连接的图形处理器，用于基于YOLO网络对预处理后的行人图像进行目标检测，得到用于确定目标行人图像的检测结果。
根据权利要求10所述的装置，其特征在于，所述行人重识别装置中还包括：与图形处理器连接的多路摄像头，用于拍摄原始的行人图像，对所述原始的行人图像进行解码及预处理，得到预处理后的行人图像。
一种行人重识别设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至8任一项所述行人重识别方法的步骤。
一种非易失性可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至8任一项所述行人重识别方法的步骤。