WO2021174691A1

WO2021174691A1 - 数据处理的优化方法及装置、存储介质、计算机设备

Info

Publication number: WO2021174691A1
Application number: PCT/CN2020/093173
Authority: WO
Inventors: 张艳; 孙太武; 周超勇; 刘玉宇
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-03-03
Filing date: 2020-05-29
Publication date: 2021-09-10
Also published as: CN111507178B; CN111507178A

Abstract

本申请公开了一种数据处理的优化方法及装置、存储介质、计算机设备，涉及数据处理技术领域，主要目的在于解决现有矩阵之间的单纯相乘在进行代码运算时耗费大量时间，且当矩阵阶数较大时，也会增大计算机的计算量，占用大量CPU资源，降低数据处理的效率的问题。包括：判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。

Description

数据处理的优化方法及装置、存储介质、计算机设备

相关申请的交叉引用

本申请申明享有2020年03月03日递交的申请号为202010138933.2、名称为“数据处理的优化方法及装置、存储介质、计算机设备”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及一种数据处理技术领域，特别是涉及一种数据处理的优化方法及装置、存储介质、计算机设备。

背景技术

随着大数据处理的快速发展，计算机作为运算设备需要处理的数据越来越多，处理数据的形式也越来越复杂。其中，在过程控制、图像处理、科学计算、信号处理、密码学，计算机时序分析等领域，矩阵已经成为大数据处理的基本数据单位。

目前，现有的人脸识别过程中，获取人脸数据后需要将人脸数据作为识别模型的基础数据进行运算，在此过程中，人脸数据需要以矩阵形式进行乘法运行处理，即按照常用的矩阵与矩阵之间相乘进行代码转换运算处理，发明人发现，由于识别人脸的人脸数据是有像素数据构成，构成的矩阵数据阶数较大，在进行识别之前的预处理过程中，这种矩阵之间的单纯相乘在利用代码运算时耗费大量时间，且当矩阵阶数较大时，也会增大计算机的计算量，占用大量CPU资源，降低数据处理的效率。

发明内容

有鉴于此，本申请提供一种数据处理的优化方法及装置、存储介质、计算机设备，主要目的在于解决现有矩阵之间的单纯相乘在进行代码运算时耗费大量时间，且当矩阵阶数较大时，也会增大计算机的计算量，占用大量CPU资源，降低数据处理的效率的问题。

依据本申请一个方面，提供了一种数据处理的优化方法，包括：

当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。

依据本申请另一个方面，提供了一种数据处理的优化装置，包括：

判断模块，用于当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

第一处理模块，用于若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

第二处理模块，用于若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。

根据本申请的又一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行以下操作：

根据本申请的再一方面，提供了一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行以下操作：

借由上述技术方案，本申请实施例提供的技术方案至少具有下列优点：

本申请提供了一种数据处理的优化方法及装置、存储介质、计算机设备，与现有技术按照常用的矩阵与矩阵之间相乘进行代码转换运算处理相比，本申请实施例通过判断出人脸数据矩阵的行数超过预设优化阈值时，对人脸数据矩阵进行降阶处理得到优化矩阵，若判断出人脸数据矩阵的行数未超过预设优化阈值时，利用预置扩展指令对人脸数据矩阵进行和表达式运算处理，以实现减少单纯矩阵相乘时代码迭代运算的耗时，降低占用CPU资源，减少数据处理数量，从而提高数据处理效率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本申请实施例提供的一种数据处理的优化方法流程图；

图2示出了本申请实施例提供的另一种数据处理的优化方法流程图；

图3示出了本申请实施例提供的一种数据处理的优化装置组成框图；

图4示出了本申请实施例提供的另一种数据处理的优化装置组成框图；

图5示出了本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请实施例提供了一种数据处理的优化方法，如图1所示，该方法包括：

101、当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值。

其中，所述人脸数据矩阵包括需要进行矩阵乘法计算的2个矩阵，每个矩阵中都可以利用查找统计行数、列数的方法获取到矩阵的行数与列数。所述预设优化阈值用于限定人脸数据矩阵是否进行优化处理，本申请实施例中，对于预设优化阈值的设定，为了使矩阵在进行计算时，达到矩阵优化计算的平衡，将预设优化阈值设定为32，如，判断人脸数据矩阵的行数是否超过32行，本申请实施例不做具体限定。

102a、若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理。

本申请实施例中，由于人脸数据矩阵可以为2个进行乘法运算的矩阵，因此，当判断出2个矩阵的全部函数均未超过预设优化阈值时，说明矩阵之间的乘法运算可以以和表达式的形式，利用预置扩展指令进行运算处理。其中，所述预置扩展指令为基于arm neon的扩展指令，具体的如基于arm neon的矩阵乘法指令，本申请实施例不做具体限定。

102b、若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。

对于本申请实施例，为了将行数大于预设优化阈值的人脸数据矩阵进行乘法运算时减少运算量，提高运算效率，人脸数据矩阵中的任意一个矩阵行数超过预设优化阈值，如32行时，对人脸数据矩阵进行降阶处理后的得到优化矩阵。

需要说明的是，在得到优化矩阵后，为了进一步的对矩阵进行计算，并判断是否还需要进行优化，将优化矩阵作为人脸数据矩阵返回至步骤101中重新判断，直到人脸数据矩阵中的行数均未超过预设优化阈值，调用预置扩展指令对所述人脸数据矩阵进行整合处理为止。

本申请提供了一种数据处理的优化方法，与现有技术按照常用的矩阵与矩阵之间相乘进行代码转换运算处理相比，本申请实施例通过判断出人脸数据矩阵的行数超过预设优化阈值时，对人脸数据矩阵进行降阶处理得到优化矩阵，若判断出人脸数据矩阵的行数未超过预设优化阈值时，利用预置扩展指令对人脸数据矩阵进行和表达式运算处理，以实现减少单纯矩阵相乘时代码迭代运算的耗时，降低占用CPU资源，减少数据处理数量，从而提高数据处理效率。

本申请实施例提供了另一种数据处理的优化方法，如图2所示，该方法包括：

201、当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值。

本步骤与图1所示的步骤101方法相同，在此不再赘述。

需要说明的是，若需要进行判断的人脸数据矩阵为进行优化后的优化矩阵，则判断优化矩阵中每行中分块的个数为列数，每列中分块的个数为行数，是否超过预设优化阈值。

202a、若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理。

本步骤与图1所示的步骤102a方法相同，在此不再赘述。

进一步地，若当判断人脸数据矩阵的行数超过预设优化阈值，对人脸数据矩阵进行了降阶处理，运算得到人脸数据矩阵的优化矩阵，将优化矩阵作为人脸数据矩阵判断出行数未超过预设优化阈值时，步骤调用预置扩展指令对所述人脸数据矩阵进行整合处理具体可以为：利用预置扩展指令对所述人脸数据矩阵中包含的全部分块矩阵进行和表达式的递归运算处理，得到所述人脸数据矩阵的矩阵运算结果，所述和表达式为将多个分块矩阵进行乘积求和的算法。

由于人脸数据矩阵的行数若未超过预设优化阈值，说明人脸数据矩阵的阶数适用于计算机中的计算指令进行计算，计算过程也不会增大耗时，占用CPU资源较小。因此，当人脸数据矩阵中的全部行数未超过预设优化阈值时，即待进行矩阵乘法计算的2个矩阵的行数均不超过预设优化阈值，则利用预置扩展指令对人脸数据矩阵中包含的全部分块矩阵进行和表达式的递归运算处理，得到矩阵运算结果。

需要说明的是，由于步骤202a为与步骤202b并列的步骤，经过步骤202b后，重新作为人脸数据矩阵的2个优化矩阵中分别包括多个分块矩阵，因此，在利用预置扩展指令进行和表达式的递归运算处理时，需要对作为优化后的一个人脸数据矩阵中的多个分块矩阵单独进行乘法运算处理。本申请实施例中，由于行数未超过预设优化阈值的人脸数据矩阵可能为经过多次进行降阶处理的矩阵，因此，人脸数据矩阵中包含有多个分块矩阵，即分块矩阵中还包括子分块矩阵，因此，在利用预置扩展指令进行和表达式的递归运算处理时，首选需要对属于分块矩阵中的子分块矩阵进行乘法运算，然后再对分块矩阵进行乘法运算，依次递归对每个分块矩阵进行运算处理，最终得到人脸数据矩阵的运行结果。

例如，人脸数据矩阵为

a ₁₁、a ₁₂、a ₂₁、a ₂₂、b ₁₁、b ₁₂、b ₂₁、b ₂₂为分块矩阵，和表达式的公式a _i1b _1j+a _i2b _2j＝c _ij，利用预置扩展指令计算矩阵c中的每个分块的乘积，若分块矩阵中存在子分块矩阵，则首先计算子分块矩阵，然后逐一递归计算全部的分块矩阵，最终得到人脸数据矩阵的乘积。

对于本申请实施例，预置扩展指令可以为基于arm neon的乘法指令，具体如：从数据源地址src里取4个浮点类型float数据,组成一个浮点型32*4的矩阵，即float32*4_t并返回，具体的步骤为输入一个float,复制粘贴4次，组成一个float32*4_t并返回。把一个float32*4_t写到数据源地址dst去，相当于一次写入4个浮点数据float。分别把src中与dst对应元素相加，相乘得到结果。让src里v1元素都乘上s1,将其结果与dst里v2对应位置的元素相加，写到v0，每次算出一个4*4的块，这样不会减少乘法和加法的计算次数，但能把对b矩阵取值的次数减少到原来的1/4，让v1,和v2每一个对应元素相乘得到V3，再与v3的每一个对应元素相加，写到v0，以便编译器设置变量地址时按照4字节边界对齐，数据也比较集中，cache在抓取数据的同时会抓取其周围的数据，从而实现多个矩阵一起进行乘法计算。

202b、若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵。

本申请实施例中，由于人脸数据矩阵的行数超过预设优化阈值，说明人脸数据矩阵的阶数太大，在利用现有的方法进行乘法运算时会消耗CPU大量资源，耗时过长，因此，首选确定人脸数据矩阵中的分块矩阵，以便实现降阶处理。

对于本申请实施例，为了避免确定的分块矩阵中缺少对应的行或列，无法进行完整的分块，步骤对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵之前还包括：对所述人脸数据矩阵中属于奇数的行数、列数进行数据填充。

首先对人脸数据矩阵中的行数与列数判断奇偶性，然后对属于奇数的行、列进行填充。具体过程包括：判断人脸数据矩阵中的第一矩阵的列与第二矩阵的行是否为偶数，若是偶数，则判断第二矩阵的列是否为偶数。填充的过程具体可以将属于奇数的行或列按照预设的数值直接扩增至偶数的行数或列数，本申请实施例中为扩增一行或一列，其中，填充的数值可以为预先设定任意非零自然数，本申请实施例不做具体限定。

对于本申请实施例，为了进一步地的说明及限定，步骤202b具体为：按照第一阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。

在对人脸数据矩阵进行分块时，为了提高分块的效率及运算过程中的运算速度，可以按照第一阶数为单位进行分块，所述第一阶数可以为行数与列数除以2确定的阶数，例如，人脸数据矩阵为100行×100列的矩阵，行数、列数除以2为50，则以2为分块阶数，得到的优化矩阵为50行×50列的矩阵。

对于本申请实施例，为了避免分块至两个1×1的矩阵相乘，影响运算速度，步骤202b之后，还可以包括：判断所述分块矩阵的行数、列数是否小于预设分块阈值；若小于所述预设分块阈值，则按照第二阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。

其中，预设分块阈值可以为确定分块的2 ⁱ×2 ⁱ阶对应的行数与列数，0<i<k，k＝1，2，....，7。当分块矩阵的行数、列数小于预设分块阈值时，按照第二接收为单位对人脸数据矩阵进行分块，所述第二阶数可以为行数与列数除以2 ⁱ确定的阶数，按照此阶数对人脸数据矩阵进行分块后，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。

对于本申请实施例，为了完成使得到的优化矩阵可以进行乘法运算处理，步骤202b之后的步骤将所述优化矩阵确定为人脸数据矩阵，并重新执行判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值的步骤。

本申请提供了另一种数据处理的优化方法，与现有技术按照常用的矩阵与矩阵之间相乘进行代码转换运算处理相比，本申请实施例通过判断出人脸数据矩阵的行数超过预设优化阈值时，对人脸数据矩阵进行降阶处理得到优化矩阵，若判断出人脸数据矩阵的行数未超过预设优化阈值时，利用预置扩展指令对人脸数据矩阵进行和表达式运算处理，以实现减少单纯矩阵相乘时代码迭代运算的耗时，降低占用CPU资源，减少数据处理数量，从而提高数据处理效率。

进一步的，作为对上述图1所示方法的实现，本申请实施例提供了一种数据处理的优化装置，如图3所示，该装置包括：判断模块31、第一处理模块32、第二处理模块33。

判断模块31，用于当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

第一处理模块32，用于若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

第二处理模块33，用于若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。

本申请提供了一种数据处理的优化装置，与现有技术按照常用的矩阵与矩阵之间相乘进行代码转换运算处理相比，本申请实施例通过判断出人脸数据矩阵的行数超过预设优化阈值时，对人脸数据矩阵进行降阶处理得到优化矩阵，若判断出人脸数据矩阵的行数未超过预设优化阈值时，利用预置扩展指令对人脸数据矩阵进行和表达式运算处理，以实现减少单纯矩阵相乘时代码迭代运算的耗时，降低占用CPU资源，减少数据处理数量，从而提高数据处理效率。

进一步的，作为对上述图2所示方法的实现，本申请实施例提供了另一种数据处理的优化装置，如图4所示，该装置包括：判断模块41、第一处理模块42、第二处理模块43、确定模块44、填充模块45、判断模块46、分块模块47。

判断模块41，用于当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

第一处理模块42，用于若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

第二处理模块43，用于若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。

进一步地，所述装置还包括：

确定模块44，用于将所述优化矩阵确定为人脸数据矩阵，并重新执行判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值的步骤。

进一步地，所述第二处理模块43，具体用于对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵。

进一步地，所述装置还包括：

填充模块45，用于对所述人脸数据矩阵中属于奇数的行数、列数进行数据填充。

进一步地，所述第二处理模块43，具体用于按照第一阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。

进一步地，所述第装置还包括：

判断模块46，用于判断所述分块矩阵的行数、列数是否小于预设分块阈值；

分块模块47，用于若小于所述预设分块阈值，则按照第二阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。

进一步地，所述第一处理模块42，具体用于利用预置扩展指令对所述人脸数据矩阵中包含的全部分块矩阵进行和表达式的递归运算处理，得到所述人脸数据矩阵的矩阵运算结果，所述和表达式为将多个分块矩阵进行乘积求和的算法。

本申请提供了另一种数据处理的优化装置，与现有技术按照常用的矩阵与矩阵之间相乘进行代码转换运算处理相比，本申请实施例通过判断出人脸数据矩阵的行数超过预设优化阈值时，对人脸数据矩阵进行降阶处理得到优化矩阵，若判断出人脸数据矩阵的行数未超过预设优化阈值时，利用预置扩展指令对人脸数据矩阵进行和表达式运算处理，以实现减少单纯矩阵相乘时代码迭代运算的耗时，降低占用CPU资源，减少数据处理数量，从而提高数据处理效率。

根据本申请一个实施例提供了一种计算机可读存储介质，其中，所述计算机可读存储介质可以是非易失性，也可以是易失性，所述计算机可读存储介质存储有至少一可执行指令，所述可执行指令使处理器执行以下操作：

图5示出了根据本申请一个实施例提供的一种计算机设备的结构示意图，本申请具体实施例并不对计算机设备的具体实现做限定。

如图5所示，该计算机设备可以包括：处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。

其中：处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器502，用于执行程序510，具体可以执行上述数据处理的优化方法实施例中的相关步骤。

具体地，程序510可以包括程序代码，该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器506，用于存放程序510。存储器506可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行以下操作：

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种数据处理的优化方法，其中，包括：

当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。
根据权利要求1所述的方法，其中，所述对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵之后，所述方法还包括：

将所述优化矩阵确定为人脸数据矩阵，并重新执行判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值的步骤。
根据权利要求2所述的方法，其中，所述对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵包括：

对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵。
根据权利要求3所述的方法，其中，所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵之前，所述方法还包括：

对所述人脸数据矩阵中属于奇数的行数、列数进行数据填充。
根据权利要求4所述的方法，其中，所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵包括：

按照第一阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。
根据权利要求5所述的方法，其中，所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵之后，所述方法还包括：

判断所述分块矩阵的行数、列数是否小于预设分块阈值；

若小于所述预设分块阈值，则按照第二阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。
根据权利要求1-6任一项所述的方法，其中，所述调用预置扩展指令对所述人脸数据矩阵进行整合处理包括：

利用预置扩展指令对所述人脸数据矩阵中包含的全部分块矩阵进行和表达式的递归运算处理，得到所述人脸数据矩阵的矩阵运算结果，所述和表达式为将多个分块矩阵进行乘积求和的算法。
一种数据处理的优化装置，其中，包括：

判断模块，用于判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

第一处理模块，用于若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

第二处理模块，用于若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。
一种计算机可读存储介质，所述存储介质中存储有至少一可执行指令，其中，所述可执行指令使处理器执行以下操作：

当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。
根据权利要求9所述的存储介质，其中，在所述对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵之后，所述可执行指令还使处理器执行以下操作：

将所述优化矩阵确定为人脸数据矩阵，并重新执行判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值的步骤。
根据权利要求10所述的存储介质，其中，在执行所述对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵的操作时，具体包括：

对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵。
根据权利要求11所述的存储介质，其中，在所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵之前，所述可执行指令还使处理器执行以下操作：

对所述人脸数据矩阵中属于奇数的行数、列数进行数据填充。
根据权利要求12所述的存储介质，其中，在执行所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵的操作时，具体包括：

按照第一阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。
根据权利要求13所述的存储介质，其中，在所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵之后，所述可执行指令还使处理器执行以下操作：

判断所述分块矩阵的行数、列数是否小于预设分块阈值；

若小于所述预设分块阈值，则按照第二阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。
根据权利要求9-14任一项所述的存储介质，其中，在执行所述调用预置扩展指令对所述人脸数据矩阵进行整合处理的操作时，具体包括：

利用预置扩展指令对所述人脸数据矩阵中包含的全部分块矩阵进行和表达式的递归运算处理，得到所述人脸数据矩阵的矩阵运算结果，所述和表达式为将多个分块矩阵进行乘积求和的算法。
一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

其中，所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行以下操作：

当根据获取到的人脸数据待进行人脸识别时，截取人脸数据，并判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值；

若所述人脸数据矩阵的全部行数未超过所述预设优化阈值，则调用预置扩展指令对所述人脸数据矩阵进行整合处理；

若所述人脸数据矩阵的任意行数超过所述预设优化阈值，则对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵。
根据权利要求16所述的计算机设备，其中，在所述对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵之后，所述可执行指令使所述处理器还执行以下操作：

将所述优化矩阵确定为人脸数据矩阵，并重新执行判断根据所述人脸数据构建的人脸数据矩阵的行数是否超过预设优化阈值的步骤。
根据权利要求17所述的计算机设备，其中，在执行所述对所述人脸数据矩阵进行降阶处理，得到人脸数据矩阵的优化矩阵的操作时，具体包括：

对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵。
根据权利要求18所述的计算机设备，其中，在所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵之前，所述可执行指令还使处理器执行以下操作：

对所述人脸数据矩阵中属于奇数的行数、列数进行数据填充。
根据权利要求19所述的计算机设备，其中，在执行所述对所述人脸数据矩阵进行分块，并将包含有所述分块矩阵的人脸数据矩阵作为优化矩阵的操作时，具体包括：

按照第一阶数为单位对所述人脸数据矩阵的进行分块，并将确定出的全部分块矩阵作为所述人脸数据矩阵的优化矩阵。