CN113326818B

CN113326818B - 视频编码的海量人脸识别方法、系统、设备和介质

Info

Publication number: CN113326818B
Application number: CN202110877961.0A
Authority: CN
Inventors: 陈丹; 赵景
Original assignee: Hunan Gaozhi Technology Co ltd
Current assignee: Jiangsu Yunpeng Information Technology Co ltd
Priority date: 2021-08-02
Filing date: 2021-08-02
Publication date: 2021-09-24
Anticipated expiration: 2041-08-02
Also published as: CN113326818A

Abstract

本申请涉及一种视频编码的海量人脸识别方法及系统。所述方法包括：获取摄像头拍摄的视频中的多个人脸图片，将人脸图片转化为YUV格式的图像帧，以及将图像帧存储至海思芯片的物理内存中；通过预设的人脸检测算法，得到图像帧中每个人脸的矩形框信息，构建多个人脸图片对应的矩形框链表信息，对矩形框链表信息进行对齐处理；设置硬编码器的多个编码通道，采用异步调用的方式将对齐矩形框链表信息设置到编码通道的裁剪编码信息中；通过编码控制器异步启动编码通道进行编码，得到海量人脸图片包；采用这个方法可以对视频中的多个人脸图片进行海量人脸识别。

Description

视频编码的海量人脸识别方法、系统、设备和介质

技术领域

本申请涉及数据处理领域，特别是涉及一种视频编码的海量人脸识别方法、系统、计算机设备和存储介质。

背景技术

在当今社会的安防监控领域，摄像机监控所需覆盖的场景往往存在大量的如广场、大型场馆、步行街等高密度人群场景，在这些高密度场景中，当人流量较大时，从摄像机中采集到的单帧图像中行人的数量达到200人甚至四五百人，摄像机针对如此庞大的人流量进行的人脸检测称之为海量人脸检测。

目前市面上的人脸摄像机能支持的最大检测人脸数量一般都在一百人以内，远远不及海量人脸的检测体量。

发明内容

基于此，有必要针对上述技术问题，提供一种能够进行海量人脸识别的视频编码的海量人脸识别方法、系统、计算机设备和存储介质。

一种视频编码的海量人脸识别方法，所述方法包括：

获取摄像头拍摄的视频中的多个人脸图片，将人脸图片转化为YUV格式的图像帧，以及将图像帧存储至海思芯片的物理内存中；

通过预设的人脸检测算法，得到图像帧中每个人脸的矩形框信息，根据矩形框信息，构建多个人脸图片对应的矩形框链表信息；

根据摄像头内部海思芯片的硬编码器的编码控制器，对矩形框链表信息进行对齐处理，得到对齐矩形框链表信息；硬编码器还包括：编码接收器；

设置硬编码器的多个编码通道，采用异步调用的方式将对齐矩形框链表信息设置到编码通道的裁剪编码信息中；

根据裁剪编码信息以及物理内存中的图像帧，通过编码控制器异步启动编码通道进行编码，得到编码后的人脸图片和编码后的人脸图片的时间戳；

通过编码接收器对具有相同时间戳的编码后的图片进行归档，得到海量人脸图片包；

利用海量人脸图片包进行人脸识别。

在其中一个实施例中，图像帧中每个人脸的矩形框信息表示为

,其中

表示矩形框左上角

坐标，

表示矩形框左上角

坐标，

表示矩形框宽度，

表示矩形框高度。

在其中一个实施例中，根据矩形框信息，构建多个人脸图片对应的矩形框链表信息，包括:

其中，n表示人脸个数。

在其中一个实施例中，根据摄像头内部海思芯片的硬编码器的编码控制器，对矩形框链表信息进行对齐处理，包括：

将矩形框链表信息中的矩形框信息的

、

、

和

按32字节向前对齐得到对齐矩形框信息的

、

、

和

，公式如下：

其中，INT(A)表示取A的整数部分，

表示对齐矩形框左上角

坐标，

表示对齐矩形框左上角

坐标，

表示对齐矩形框宽度，

表示对齐矩形框高度。

在其中一个实施例中，根据对齐矩形框信息，得到对齐矩形框链表信息，公式如下：

其中，

表示对齐矩形框信息，

表示对齐矩形框链表信息。

在其中一个实施例中，根据裁剪编码信息以及物理内存中的图像帧，通过编码控制器异步启动编码通道进行编码，得到编码后的人脸图片和编码后的人脸图片的时间戳，包括：

根据裁剪编码信息，从物理内存确定裁剪编码信息对应的人脸图片；

将人脸图片加入对应的裁剪编码信息中，通过编码控制器异步启动编码通道进行编码，得到编码后的人脸图片和编码后的人脸图片的时间戳。

在其中一个实施例中，当所有编码通道进行异步编码完成后，通过编码控制器发送编码完成中断信号；通过编码接收器接收所述完成中断信号，并从编码通道中读取编码后的JPG格式的人脸图片；直至得到图像帧编码后的JPG格式的所有人脸图片；编码后的人脸图片的时间戳为编码后的人脸图片的当前时间标识。

一种视频编码的海量人脸识别系统，所述系统包括：摄像头和海思芯片；

摄像头用于拍摄视频，并将视频中的人脸图片转化为YUV格式的图像帧；

海思芯片包括：物理内存和硬编码器；硬编码器包括：编码控制器和编码接收器；

编码控制器对矩形框链表信息进行对齐处理，得到对齐矩形框链表信息；

设置所述硬编码器的多个编码通道，采用异步调用的方式将对齐矩形框链表信息设置到编码通道的裁剪编码信息中；

编码控制器根据裁剪编码信息以及物理内存中的图像帧，异步启动编码通道进行编码，得到编码后的人脸图片和编码后的人脸图片的时间戳；

编码接收器对具有相同时间戳的编码后的图片进行归档，得到海量人脸图片包；利用海量人脸图片包进行人脸识别。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

通过编码接收器对具有相同时间戳的编码后的图片进行归档，得到海量人脸图片包；利用海量人脸图片包进行人脸识别。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述视频编码的海量人脸识别方法、系统、计算机设备和存储介质，首先获取摄像头拍摄的视频中的多个人脸图片，将人脸图片转化为YUV格式的图像帧，以及将图像帧存储至海思芯片的物理内存中；通过预设的人脸检测算法，得到图像帧中每个人脸的矩形框信息，根据矩形框信息，构建多个人脸图片对应的矩形框链表信息；根据摄像头内部海思芯片的硬编码器的编码控制器，对矩形框链表信息进行对齐处理，得到对齐矩形框链表信息；使得对齐后的矩形框链表信息能够被编码，硬编码器还包括：编码接收器；设置硬编码器的多个编码通道，编码通道可以对其中的信息进行编码，本发明使用了裁剪编码，采用异步调用的方式将对齐矩形框链表信息设置到编码通道的裁剪编码信息中；根据裁剪编码信息以及物理内存中的图像帧，通过编码控制器异步启动编码通道进行编码，通过设置的多个编码通道可以对多个人脸图片进行编码，从而得到编码后的人脸图片和编码后的人脸图片的时间戳；通过编码接收器对具有相同时间戳的编码后的图片进行归档，得到海量人脸图片包；因此本发明可以通过对视频中的多个人脸图片进行编码的方法得到海量人脸图片包完成人脸识别。

附图说明

图1为一个实施例中一种视频编码的海量人脸识别方法的流程示意图；

图2为一个实施例中一种视频编码的海量人脸识别系统的结构框图；

图3为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，如图1所示，提供了一种视频编码的海量人脸识别方法，包括：

步骤102，获取摄像头拍摄的视频中的多个人脸图片，将人脸图片转化为YUV格式的图像帧，以及将图像帧存储至海思芯片的物理内存中。

由于需要调用硬件编码器来实现图片编码，所以将图像帧存储至海思芯片的物理内存中，而不是虚拟内存中。

步骤104，通过预设的人脸检测算法，得到图像帧中每个人脸的矩形框信息，根据矩形框信息，构建多个人脸图片对应的矩形框链表信息。

矩形框信息为每个人脸所在的矩形框位于YUV图像帧中的二维坐标。矩形框链表信息为检测出的所有人脸坐标信息形成的链表。

步骤106，根据摄像头内部海思芯片的硬编码器的编码控制器，对矩形框链表信息进行对齐处理，得到对齐矩形框链表信息；硬编码器还包括：编码接收器。

海思芯片自带的硬编码器使用的是裁剪编码的方式，可以充分发挥硬件编码器的效率，释放CPU的调度，降低软件负载。由于硬编码器对内存的访问时是按32字节对齐的，所以在进行裁剪编码之前，需要将矩形框信息中的每个元素的坐标信息进行对齐，使得对齐后的对齐矩形框链表信息可以设置在编码通道的裁剪编码信息中。

步骤108，设置硬编码器的多个编码通道，采用异步调用的方式将对齐矩形框链表信息设置到编码通道的裁剪编码信息中。

为了满足海量人脸图片的编码性能需求，通过自主编码在硬编码器中创建多个编码通道来进行异步操作，异步调用是指发送完设置裁剪编码信息的请求后无需等待回应，可以继续进行设置，将对齐矩形框链表信息设置到编码通道的裁剪编码信息中后可以通过编码通道对其进行编码。

步骤110，根据裁剪编码信息以及物理内存中的图像帧，通过编码控制器异步启动编码通道进行编码，得到编码后的人脸图片和编码后的人脸图片的时间戳。

编码控制器异步启动编码通道进行编码时，所有的编码通道分时复用芯片内部的所有编码器，编码类型为JPG格式。

步骤112，通过编码接收器对具有相同时间戳的编码后的图片进行归档，得到海量人脸图片包；利用海量人脸图片包进行人脸识别。

对具有相同时间戳的编码后的图片进行归档可以使上层业务发送图片信息时能和对应的时间戳的图片或者视频的图像帧对应到一起，以完成视频图像帧中的海量人脸识别。

上述视频编码的海量人脸识别方法、系统、设备和介质，首先获取摄像头拍摄的视频中的多个人脸图片，将人脸图片转化为YUV格式的图像帧，以及将图像帧存储至海思芯片的物理内存中；通过预设的人脸检测算法，得到图像帧中每个人脸的矩形框信息，根据矩形框信息，构建多个人脸图片对应的矩形框链表信息；根据摄像头内部海思芯片的硬编码器的编码控制器，对矩形框链表信息进行对齐处理，得到对齐矩形框链表信息；使得对齐后的矩形框链表信息能够被编码，硬编码器还包括：编码接收器；设置硬编码器的多个编码通道，编码通道可以对其中的信息进行编码，本发明使用了裁剪编码，采用异步调用的方式将对齐矩形框链表信息设置到编码通道的裁剪编码信息中；根据裁剪编码信息以及物理内存中的图像帧，通过编码控制器异步启动编码通道进行编码，通过设置的多个编码通道可以对多个人脸图片进行编码，从而得到编码后的人脸图片和编码后的人脸图片的时间戳；通过编码接收器对具有相同时间戳的编码后的图片进行归档，得到海量人脸图片包；因此本发明可以通过对视频中的多个人脸图片进行编码的方法得到海量人脸图片包完成人脸识别。

,其中

表示矩形框左上角

坐标，

表示矩形框左上角

坐标，

表示矩形框宽度，

表示矩形框高度。

根据每个人脸的矩形框信息，可以找到该人脸在图像帧中的位置，从而将其提取出来。

其中，n表示人脸个数。

通过构建多个人脸图片对应的矩形框链表信息，找到所有人脸在图像帧中的位置，以便后面将其全部提取出来。

将矩形框链表信息中的矩形框信息的

、

、

和

按32字节向前对齐得到对齐矩形框信息的

、

、

和

，公式如下：

其中，INT(A)表示取A的整数部分，

表示对齐矩形框左上角

坐标，

表示对齐矩形框左上角

坐标，

表示对齐矩形框宽度，

表示对齐矩形框高度。

在另一个实施例中，根据对齐矩形框信息，得到对齐矩形框链表信息，公式如下：

其中，

表示对齐矩形框信息，

表示对齐矩形框链表信息。

由于硬编码器对内存的访问时是按32字节对齐的，所以在进行裁剪编码之前，需要将矩形框信息中的每个元素的坐标信息进行对齐，使得对齐后的对齐矩形框链表信息可以设置在编码通道的裁剪编码信息中。

该编码后的图片就是从海量人脸图片中识别的人脸图片，根据编码后的人脸图片的时间戳，将具有相同时间戳的归档到一起得到的海量人脸图片包来对海量人脸图片进行识别。

设置1到10个编码通道，在设置编码通道的同时，编码接收器异步等待各编码通道编码完成后的中断信号，当编码接收器接收到1到10号编码通道的编码完成中断信号后，从编码通道中获取编码后的图片

到

，同时编码控制器等待各编码通道的读图片完成的中断，当该通道获取读数据完成的中断后，编码控制器复位每个编码通道，再依次将

到

设置到1到10号编码通道中，然后启动编码器进行编码，以此方式循环上述操作，直至

全部编码完成为止。JPG格式的图片更易于网络传输和显示。

应该理解的是，虽然图1流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图2所示，提供了一种视频编码的海量人脸识别系统，所述系统包括：摄像头和海思芯片；

在一个实施例中，编码控制器还用于将矩形框链表信息中的矩形框信息的

、

、

和

按32字节向前对齐得到

、

、

和

，公式如下：

其中，INT(A)表示取A的整数部分，

表示对齐矩形框左上角

坐标，

表示对齐矩形框左上角

坐标，

表示对齐矩形框宽度，

表示对齐矩形框高度，

表示对齐矩形框信息，

表示对齐矩形框链表信息。

在一个实施例中，编码控制器还用于根据裁剪编码信息，从物理内存确定裁剪编码信息对应的人脸图片；将人脸图片加入对应的裁剪编码信息中，通过编码控制器异步启动编码通道进行编码，得到编码后的人脸图片和编码后的人脸图片的时间戳。

在另一个实施例中，编码控制器还用于当所有编码通道进行异步编码完成后，通过编码控制器发送编码完成中断信号；通过编码接收器接收所述完成中断信号，并从编码通道中读取编码后的JPG格式的人脸图片；直至得到图像帧编码后的JPG格式的所有人脸图片；编码后的人脸图片的时间戳为编码后的人脸图片的当前时间标识。

关于视频编码的海量人脸识别系统的具体限定可以参见上文中对于一种视频编码的海量人脸识别方法的限定，在此不再赘述。上述视频编码的海量人脸识别系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频编码的海量人脸识别系统方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现上述实施例中方法的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。