隐私保护的表情识别方法及系统
技术领域
本发明涉及人脸识别技术领域,特别涉及一种隐私保护的表情识别方法及系统。
背景技术
在日常生活中,人脸面部图像包含着丰富的信息,不仅传达了情绪也传递了交流者丰富的情感信息。随着人工智能的不断发展,面部表情识别技术的研究变得日益活跃,在人机交互、计算机辅助学习、健康监控等领域存在广泛应用。
面部表情作为重要的一种生物特征,同时具有一定的隐私性。现有的人脸表情识别算法并未充分考虑到人脸图像信息的安全性。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种隐私保护的表情识别方法,该方法具有更强的鉴别性能、较高的安全性和可撤销性。
本发明的另一个目的在于提出一种隐私保护的表情识别系统。
为达到上述目的,本发明一方面提出了隐私保护的表情识别方法,包括以下步骤:获取多幅彩色人脸图像,并对所述多幅彩色人脸图像进行预处理,得到所述多幅彩色人脸图像的颜色分量;将所述颜色分量作为四元矩阵的虚部,构建第一四元数矩阵,并计算所述第一四元数矩阵的局部方差;将所述局部方差作为四元矩阵的实部,将所述颜色分量作为四元矩阵的虚部,构建第二四元数矩阵;采用四元数Gyrator变换对所述第二四元数矩阵进行加密处理,生成实数矩阵;随机置乱所述实数矩阵,以进行卷积神经网络的训练,并利用训练好的卷积神经网络对所述彩色人脸图像识别验证。
本发明实施例的隐私保护的表情识别方法,通过在表征表情图像时,联合图像的结构信息具有更强的鉴别性能;同时采用四元数Gyrator变换和随机相位掩模对表情图像进行加密处理,可以保护用户的隐私信息,具有较高的安全性;通过构建实数矩阵,将四元数矩阵实数化,便于卷积神经网络的训练和识别;当用户的相关信息被盗用或者泄漏时,可以通过更换新的相位掩模和旋转角度替换已注册的生物特征模板,具有可撤销性。
另外,根据本发明上述实施例的隐私保护的表情识别方法还可以具有以下附加的技术特征:
在本发明的一个实施例中,所述对所述多幅彩色人脸图像进行预处理,包括:对所述多幅彩色人脸图像进行人脸检测、剪切和归一化处理。
在本发明的一个实施例中,所述第一四元数矩阵表示为:
qt(x,y)=fi R(x,y)i+fi G(x,y)j+fi B(x,y)k
其中,fi R(x,y)、fi G(x,y)、fi B(x,y)为所述彩色人脸图像的红、绿、蓝三个颜色分量,i、j、k为虚数单位。
在本发明的一个实施例中,所述局部方差的计算公式为:
其中,Ip为人脸图像像素点的邻域,大小为W1×W2,L=W1W2表示邻域内像素点的总数,表示邻域的平均灰度值,n为人脸图像的幅数。
在本发明的一个实施例中,所述第二四元数矩阵表示为:
ft(x,y)=fi V(x,y)+fi R(x,y)i+fi G(x,y)j+fi B(x,y)k
其中,fi v为第一四元数矩阵的局部方差,fi R(x,y)、fi G(x,y)、fi B(x,y)为所述彩色人脸图像的红、绿、蓝三个颜色分量,i、j、k为虚数单位。
在本发明的一个实施例中,所述采用四元数Gyrator变换对所述第二四元数矩阵进行加密处理,生成实数矩阵,包括:采用所述四元数Gyrator变换对所述第二四元数矩阵进行随机相位编码,获得变换后的四元数矩阵;提取所述变换后的四元数矩阵的四个分量,并将所述四个分量组合成实数矩阵。
在本发明的一个实施例中,所述实数矩阵为:
其中,Ft表示变换后的四元数矩阵,运算符S(·)、X(·)、Y(·)和Z(·)表示分别提取四元数矩阵的第一、第二、第三和第四个分量。
在本发明的一个实施例中,所述随机置乱所述实数矩阵,包括:将所述实数矩阵左右分别与仅含0,1的矩阵相乘。
为达到上述目的,本发明另一方面提出了一种隐私保护的表情识别系统,包括:预处理模块,用于获取多幅彩色人脸图像,并对所述多幅彩色人脸图像进行预处理,得到所述多幅彩色人脸图像的颜色分量;计算模块,用将所述颜色分量作为四元矩阵的虚部,构建第一四元数矩阵,并计算所述第一四元数矩阵的局部方差;构建模块,用于将所述局部方差作为四元矩阵的实部,将所述颜色分量作为四元矩阵的虚部,构建第二四元数矩阵;加密模块,用于采用四元数Gyrator变换对所述第二四元数矩阵进行加密处理,生成实数矩阵;识别验证模块,用于随机置乱所述实数矩阵,以进行卷积神经网络的训练,并利用训练好的卷积神经网络对所述彩色人脸图像识别验证。
本发明实施例的隐私保护的表情识别系统,通过在表征表情图像时,联合图像的结构信息具有更强的鉴别性能;同时采用四元数Gyrator变换和随机相位掩模对表情图像进行加密处理,可以保护用户的隐私信息,具有较高的安全性;通过构建实数矩阵,将四元数矩阵实数化,便于卷积神经网络的训练和识别;当用户的相关信息被盗用或者泄漏时,可以通过更换新的相位掩模和旋转角度替换已注册的生物特征模板,具有可撤销性。
另外,根据本发明上述实施例的隐私保护的表情识别系统还可以具有以下附加的技术特征:
在本发明的一个实施例中,所述预处理模块,包括:对所述多幅彩色人脸图像进行人脸检测、剪切和归一化处理。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的隐私保护的表情识别方法流程图;
图2为根据本发明实施例的隐私保护的表情识别方法的简化流程图;
图3为根据本发明实施例的RafD表情数据库的实验样本图;
图4为根据本发明实施例的实验样本图的实矩阵结果图;
图5为根据本发明实施例的实验样本图的识别率和损失率曲线变化图,其中,(a)为识别率曲线变化图,(b)为损失率曲线变化图;
图6为根据本发明实施例的隐私保护的表情识别系统结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的隐私保护的表情识别方法及系统,首先将参照附图描述根据本发明实施例提出的隐私保护的表情识别方法。
图1是本发明一个实施例的隐私保护的表情识别方法流程图。
如图1所示,该隐私保护的表情识别方法包括以下步骤:
在步骤S101中,获取多幅彩色人脸图像,并对多幅彩色人脸图像进行预处理,得到多幅彩色人脸图像的颜色分量。
在本发明的一个实施例中,对多幅彩色人脸图像进行预处理,包括:对多幅彩色人脸图像进行人脸检测、剪切和归一化处理。
具体而言,如图2所示,对拍摄的人脸图像或者人脸视频序列进行人脸检测、剪切和归一化。假设人脸表情图像分别为f1(x,y)、f2(x,y)、……、f3(x,y),其尺寸为N×M,(x,y)表示空间域坐标。
在步骤S102中,将颜色分量作为四元矩阵的虚部,构建第一四元数矩阵,并计算第一四元数矩阵的局部方差。
在本发明的一个实施例中,第一四元数矩阵表示为:
qt(x,y)=fi R(x,y)i+fi G(x,y)j+fi B(x,y)k
其中,fi R(x,y)、fi G(x,y)、fi B(x,y)为彩色人脸图像的红、绿、蓝三个颜色分量,i、j、k为虚数单位。
也就是说,将彩色图像的颜色分量fi R(x,y)、fi G(x,y)、fi B(x,y)分别作为四元数矩阵的虚部,具体表示为:qt(x,y)=fi R(x,y)i+fi G(x,y)j+fi B(x,y)k
其中,Ip为人脸图像像素点的邻域,大小为W1×W2,L=W1W2表示邻域内像素点的总数,表示邻域的平均灰度值,n为人脸图像的幅数。
具体而言,对第一四元数矩阵计算局部方差:令像素点的邻域Ip大小为W1×W2,则局部方差计算公式为:
其中,Ip为人脸图像像素点的邻域,大小为W1×W2,L=W1W2表示邻域内像素点的总数,表示邻域的平均灰度值,n为人脸图像的幅数,Ip、均为四元数的表示形式。
需要说明的是,对于图像边界的像素点采取对称补齐方式来求其亮度局部方差。
在步骤S103中,将局部方差作为四元矩阵的实部,将颜色分量作为四元矩阵的虚部,构建第二四元数矩阵。
也就是说,将局部方差图作为四元数矩阵的实部、颜色分量分别作为四元数矩阵的虚部,构建图像对应的全四元数矩阵(即第二四元数矩阵)ft(x,y),具体表示为:
ft(x,y)=fi V(x,y)+fi R(x,y)i+fi G(x,y)j+fi B(x,y)k
其中,fi v为第一四元数矩阵的局部方差,fi R(x,y)、fi G(x,y)、fi B(x,y)为彩色人脸图像的红、绿、蓝三个颜色分量,i、j、k为虚数单位。
在步骤S104中,采用四元数Gyrator变换对第二四元数矩阵进行加密处理,生成实数矩阵。
在本发明的一个实施例中,采用四元数Gyrator变换对第二四元数矩阵进行加密处理,生成实数矩阵,包括:
采用四元数Gyrator变换对第二四元数矩阵进行随机相位编码,获得变换后的四元数矩阵;
提取变换后的四元数矩阵的四个分量,并将四个分量组合成实数矩阵。
具体而言,首先基于四元数Gyrator变换,对全四元数矩阵(即第二四元数矩阵)进行随机相位编码,即:
其中,(u,v)表示频域坐标,(x,y)表示空间域坐标,α为旋转角度,μ为任意的单位纯四元数,P1表示随机生成的相位掩模。
再提取四元数矩阵Ft的四个分量,并将其组合成实数矩阵,即:
其中:运算符S(·)、X(·)、Y(·)和Z(·)表示分别提取四元数矩阵的第一、第二、第三和第四个分量。
在步骤S105中,随机置乱实数矩阵,以进行卷积神经网络的训练,并利用训练好的卷积神经网络对彩色人脸图像识别验证。
在本发明的一个实施例中,随机置乱实数矩阵,包括:将实数矩阵左右分别与仅含0,1的矩阵相乘。
也就是说,实数矩阵Ct左乘矩阵Q、右乘矩阵R,则置乱后的矩阵Ii(x,y)可以表示为:
Ii=QCtR
其中:且Q、R中的数值仅包含0、1。
最后通过卷积神经网络(CNN)进行训练和识别。
下面通过一个具体实施例对卷积神经网络对表情识别进一步说明。
为了验证本发明实施例的方法的有效性和可行性,使用RafD表情数据库进行实验,随机选取每人的2个图像做训练,剩余1张做测试。卷积神经网络的结构包括4个卷积层和3池化层,迭代训练100次。部分表情图像如图3所示,相应的实数矩阵表示结果如图4。图5为相应的识别率和loss曲线变化,经过一定的迭代次数后均收敛,经10次训练取平均后最后得到的表情识别准确率为90.1%。
根据本发明实施例提出的隐私保护的表情识别方法,通过在表征表情图像时,联合图像的结构信息具有更强的鉴别性能;同时采用四元数Gyrator变换和随机相位掩模对表情图像进行加密处理,可以保护用户的隐私信息,具有较高的安全性;通过构建实数矩阵,将四元数矩阵实数化,便于卷积神经网络的训练和识别;当用户的相关信息被盗用或者泄漏时,可以通过更换新的相位掩模和旋转角度替换已注册的生物特征模板,具有可撤销性。
其次参照附图描述根据本发明实施例提出的隐私保护的表情识别系统。
图6是本发明一个实施例的隐私保护的表情识别系统结构示意图。
如图2所示,该隐私保护的表情识别系统10包括:预处理模块100、计算模块200、构建模块300、加密模块400和识别验证模块500。
其中,预处理模块100,用于获取多幅彩色人脸图像,并对多幅彩色人脸图像进行预处理,得到多幅彩色人脸图像的颜色分量。计算模块200,用将颜色分量作为四元矩阵的虚部,构建第一四元数矩阵,并计算第一四元数矩阵的局部方差。构建模块300,用于将局部方差作为四元矩阵的实部,将颜色分量作为四元矩阵的虚部,构建第二四元数矩阵。加密模块400,用于采用四元数Gyrator变换对第二四元数矩阵进行加密处理,生成实数矩阵。识别验证模块500,用于随机置乱实数矩阵,以进行卷积神经网络的训练,并利用训练好的卷积神经网络对彩色人脸图像识别验证。
在本发明的一个实施例中,预处理模块,进一步包括:对多幅彩色人脸图像进行人脸检测、剪切和归一化处理。
需要说明的是,前述对隐私保护的表情识别方法实施例的解释说明也适用于该系统,此处不再赘述。
根据本发明实施例提出的隐私保护的表情识别系统,通过在表征表情图像时,联合图像的结构信息具有更强的鉴别性能;同时采用四元数Gyrator变换和随机相位掩模对表情图像进行加密处理,可以保护用户的隐私信息,具有较高的安全性;通过构建实数矩阵,将四元数矩阵实数化,便于卷积神经网络的训练和识别;当用户的相关信息被盗用或者泄漏时,可以通过更换新的相位掩模和旋转角度替换已注册的生物特征模板,具有可撤销性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。