基于图像识别的脱敏处理方法以及装置
技术领域
本申请涉及图像处理技术领域,特别涉及一种基于图像识别的脱敏处理方法。本申请同时涉及一种基于图像识别的脱敏处理装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着大数据时代的到来,数据中蕴藏的商业价值得到充分挖掘,并在数据挖掘的基础上实现用户的精准定位,从而能够向用户提供更有针对性的营销推荐策略和服务策略,但随之也带来了巨大的挑战--用户隐私的保护,如何在进行数据挖掘的同时更好的保护用户的隐私,将成为数据脱敏面对的最大的难题。数据脱敏,是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护,在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。
目前对文本信息的脱敏处理,主要是通过自然语言处理识别文本内容,在识别文本内容的基础上,对文本内容当中包含的用户隐私信息,比如对用户的姓名、身份证号、手机号、银行卡号等进行脱敏处理。但目前的数据脱敏方法在对图像进行脱敏时,只能从文字的角度进行脱敏处理,首先需要识别图像当中的文字信息,然后识别文字信息中包含的敏感信息,最后对图像中包含的敏感信息进行脱敏处理,但对于包含的文字较少或者文字识别难度较大的图像,进行脱敏处理的难度较大,无法从图像处理的角度进行脱敏处理,存在较大缺陷。
发明内容
有鉴于此,本申请实施例提供了一种基于图像识别的脱敏处理方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种基于图像识别的脱敏处理装置,一种计算设备,以及一种计算机可读存储介质。
本申请提供一种基于图像识别的脱敏处理方法,包括:
提取待处理图像在多个特征维度的初始图像特征组成的特征集;
在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理;所述特征子集包含多个特征维度的初始图像特征;
通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别;
判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致;
若是,对所述待处理图像中的敏感特征进行脱敏处理。
可选的,所述特征维度与所述特征降维模型具有对应关系,不同特征降维模型对应的特征子集包含的初始图像特征的特征维度存在不同;
和/或,所述图像脱敏维度与所述图像识别模型具有对应关系,不同图像识别模型对应的图像特征的图像脱敏维度存在不同。
可选的,所述特征降维模型与所述图像识别模型具有一一对应关系,并且,所述特征降维模型输出的至少一个图像脱敏维度的图像特征被输入所述特征降维模型对应的图像识别模型进行敏感特征识别。
可选的,所述在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理,包括:
在所述特征集中提取多个特征子集;
基于每个特征子集包含至少一个特征维度的初始图像特征构建对应的特征向量;所述特征向量的向量维度数值与所述特征子集中的特征维度数值相等;
将所述特征向量输入对应的特征降维模型进行降维计算,将降维计算后获得所述至少一个图像脱敏维度的特征向量作为所述至少一个图像脱敏维度的图像特征。
可选的,所述提取待处理图像在多个特征维度的初始图像特征组成的特征集步骤执行之后,且所述在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理步骤执行之前,包括:
基于所述多个特征维度的初始图像特征对所述待处理图像进行预处理。
可选的,若所述特征维度包含图像特征位置维度,相应的,所述基于所述多个特征维度的初始图像特征对所述待处理图像进行预处理,包括:
根据所述图像特征位置维度的初始图像特征,确定所述待处理图像中包含的图像特征的位置信息;
基于所述待处理图像中包含的图像特征的位置信息,对所述待处理图像进行裁剪。
可选的,所述提取待处理图像在多个特征维度的初始图像特征组成的特征集步骤执行之前,包括:
获取项目成员在项目参与过程中提交的项目案件的案件材料中包含的所述待处理图像。
可选的,所述特征降维模型,采用如下方式进行训练:
获取已完成脱敏处理的已脱敏图像对应的初始图像的初始图像集合;
提取所述初始图像集合中初始图像在多个特征维度的初始图像特征组成的特征集;
对在所述特征集中提取的特征子集包含的多个特征维度的初始图像特征进行降维处理,获得所述初始图像在至少一个图像脱敏维度的真实图像特征;
将所述特征子集和所述至少一个图像脱敏维度的真实图像特征作为第一训练样本,对预先构建的初始特征降维模型进行训练,获得所述特征降维模型。
可选的,所述初始特征降维模型采用第一神经网络算法构建,并且,构建不同初始特征降维模型采用的第一神经网络算法不同。
可选的,所述初始图像识别模型,采用如下方式进行训练:
将携带所述至少一个图像脱敏维度的真实图像特征的初始图像和携带真实敏感特征的初始图像作为第二训练样本,对预先构建的初始图像识别模型进行训练,获得所述图像识别模型。
可选的,所述初始图像识别模型采用第二神经网络算法构建,并且,构建不同初始图像识别模型采用的第二神经网络算法不同。
可选的,所述图像脱敏维度,包括下述至少一项:
图像色彩维度、图像特征位置维度以及图像特征标识维度。
本申请还提供一种基于图像识别的脱敏处理装置,包括:
特征集提取模块,被配置为提取待处理图像在多个特征维度的初始图像特征组成的特征集;
特征降维处理模块,被配置为在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理;所述特征子集包含多个特征维度的初始图像特征;
敏感特征识别模块,被配置为通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别;
敏感特征判断模块,被配置为判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致;
若是,运行脱敏处理模块;所述脱敏处理模块,被配置为对所述待处理图像中的敏感特征进行脱敏处理。
可选的,所述特征维度与所述特征降维模型具有对应关系,不同特征降维模型对应的特征子集包含的初始图像特征的特征维度存在不同;
和/或,所述图像脱敏维度与所述图像识别模型具有对应关系,不同图像识别模型对应的图像特征的图像脱敏维度存在不同。
可选的,所述特征降维模型与所述图像识别模型具有一一对应关系,并且,所述特征降维模型输出的至少一个图像脱敏维度的图像特征被输入所述特征降维模型对应的图像识别模型进行敏感特征识别。
可选的,所述特征降维处理模块,包括:
特征子集提取单元,被配置为在所述特征集中提取多个特征子集;
特征向量构建单元,被配置为基于每个特征子集包含至少一个特征维度的初始图像特征构建对应的特征向量;所述特征向量的向量维度数值与所述特征子集中的特征维度数值相等;
降维计算单元,被配置为将所述特征向量输入对应的特征降维模型进行降维计算,将降维计算后获得所述至少一个图像脱敏维度的特征向量作为所述至少一个图像脱敏维度的图像特征。
本申请还提供一种计算设备,包括:
存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
提取待处理图像在多个特征维度的初始图像特征组成的特征集;
在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理;所述特征子集包含多个特征维度的初始图像特征;
通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别;
判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致;
若是,对所述待处理图像中的敏感特征进行脱敏处理。
本申请还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述基于图像识别的脱敏处理方法的步骤。
与现有技术相比,本申请具有如下优点:
本申请提供一种基于图像识别的脱敏处理方法,包括:提取待处理图像在多个特征维度的初始图像特征组成的特征集;在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理;所述特征子集包含多个特征维度的初始图像特征;通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别;判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致;若是,对所述待处理图像中的敏感特征进行脱敏处理。
本申请提供的基于图像识别的脱敏处理方法,从图像识别的角度出发,首先提取待处理图像在多个特征维度的初始图像特征组成特征集,并采用多个特征降维模型对所述特征集中提取的特征子集进行降维处理,在多个特征降维模型输出的图像特征的基础上利用多个图像识别模型对所述待处理图像进行敏感特征识别,最终通过对多个图像识别模型的敏感特征识别结果进行核对来提升敏感特征识别的准确度,从而来提升针对待处理图像进行脱敏处理的准确度。
附图说明
图1是本申请实施例提供的一种基于图像识别的脱敏处理方法处理流程图;
图2是本申请实施例提供的一种应用于保险项目的基于图像识别的脱敏处理方法的处理流程图;
图3是本申请实施例提供的一种基于图像识别的脱敏处理装置的示意图;
图4是本申请实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请提供一种基于图像识别的脱敏处理方法,本申请还提供一种基于图像识别的脱敏处理装置,一种计算设备,以及一种计算机可读存储介质。以下分别结合本申请提供的实施例的附图逐一进行详细说明,并且对方法的各个步骤进行说明。
本申请提供的一种基于图像识别的脱敏处理方法实施例如下:
参照附图1,其示出了本实施例提供的一种基于图像识别的脱敏处理方法处理流程图,参照附图2,其示出了本申请实施例提供的一种应用于保险项目的基于图像识别的脱敏处理方法的处理流程图。
步骤S102,提取待处理图像在多个特征维度的初始图像特征组成的特征集。
实际应用中,对图像进行描述和衡量的维度有多种多样,比如,在图像色彩维度对待处理图像进行围绕色彩的特征描述和衡量,也可以在图像包含的文字维度或者图像特征标识维度对待处理图像包含的文字或者图像特征标识进行特征描述和衡量,或者在图像纹理维度对待处理图像进行围绕纹理的特征描述和衡量,再或者在图像特征位置维度或者图像特征空间关系维度对待处理图像进行围绕特征位置或者特征空间关系的特征描述和衡量,上述对待处理图像进行特征描述和衡量的维度,均可作为所述待处理图像的特征维度。除此之外,还可以从其他能够描述图像特征的维度对待处理图像进行特征描述和衡量,比如图像中像素点的灰度维度等,同样可以作为所述待处理图像的特征维度,对此不做限定。
本申请提供的基于图像识别的脱敏处理方法,从图像识别的角度出发,对所述待处理图像中的敏感信息隐私信息进行脱敏处理,具体在对所述待处理图像进行脱敏处理的过程中,首先提取待处理图像在多个特征维度的初始图像特征组成的特征集,本申请实施例中,提取所述待处理图像在图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度的初始图像特征组成所述特征集。
需要说明的是,本申请提供的基于图像识别的脱敏处理方法,应用于对项目的项目案件中包含的待处理图像进行脱敏处理,在对项目案件中包含的待处理图像进行脱敏处理之前,优选获取项目成员在项目参与过程中提交的项目案件的案件材料中包含的所述待处理图像,在获取到待处理图像的基础上进行提取所述待处理图像在多个特征维度的初始图像特征的操作,以及后续从图像识别角度出发进行的对所述待处理图像进行脱敏处理的操作,确保参与到项目中的项目成员的敏感信息或者隐私信息不会被泄露。除此之外,本申请提供的基于图像识别的脱敏处理方法,还可以应用于其他场景,其他场景的具体实现过程参照本实施例提供的相应说明即可,在此不再赘述。
所述项目可以是保险项目、众筹项目或者投资项目等,参与到项目中的用户被称之为项目成员;相应的,项目成员在项目参与过程中提交的项目案件,可以是项目成员参与到保险项目之后提出的理赔案件,理赔案件的案件材料中必然会包含项目成员自身的隐私相关信息的图像,比如项目成员的身份证正面照图像、身份证背面照图像、项目成员的照片图像、包含项目成员银行卡账号和手机账号的图像,这些包含项目成员隐私相关信息的图像,均需进行脱敏处理。
上述提取到所述待处理图像在多个特征维度的初始图像特征组成的特征集之后,还可以在提取的多个特征维度的初始图像特征组成的特征集的基础上进行进一步处理,本申请实施例提供的一种优选实施方式中,在提取到所述待处理图像在多个特征维度的初始图像特征组成的特征集之后,基于所述特征集中包含的多个特征维度的初始图像特征对所述待处理图像进行预处理。
以上述图像特征位置维度为例,可选的,基于图像特征位置维度的初始图像特征对所述待处理图像进行预处理,第一步是根据图像特征位置维度的初始图像特征,确定所述待处理图像中包含的图像特征的位置信息;第二步基于所述待处理图像中包含的图像特征的位置信息,对所述待处理图像进行裁剪,以降低后续对所述待处理图像进行敏感特征识别过程中的数据处理量,提升处理效率。
类似的,除上述对所述待处理图像进行裁剪之外,其他对所述待处理图像进行预处理的实现方式,比如在对待处理图像进行裁剪的基础上,对裁剪后的待处理图像进行分类或者归纳,同样能够起到降低后续对所述待处理图像进行敏感特征识别过程中的数据处理量,提升处理效率,或者是提升后续对所述待处理图像进行脱敏处理过程的处理效率的效果。
步骤S104,在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理。
具体实施时,在上述提取到所述待处理图像在多个特征维度的初始图像特征组成的特征集之后,由于提取到的所述特征集中包含的待处理图像的初始图像特征覆盖多个特征维度,相应的,后续在对所述待处理图像进行脱敏处理过程中,也需要分别从多个特征维度出发对所述待处理图像进行脱敏处理,处理难度大,为降低后续对所述待处理图像进行脱敏处理的数据处理量,提升处理效率,在此,对上述获取到的所述待处理图像在多个特征维度的初始图像特征进行降维处理,通过降低对所述待处理图像进行处理的特征维度,来降低后续对待处理图像进行脱敏处理的复杂度,这一过程中,所述待处理图像的特征维度被降维之后的维度被称之为图像脱敏维度,进行降维处理之后所剩的图像脱敏维度也即是后续对所述待处理图像进行脱敏处理的维度。
具体实施时,为了提高图像脱敏处理的准确度,本申请实施例采用多个特征降维模型对所述特征集中提取的特征子集进行降维处理,基于此,分别在多个特征降维模型进行降维处理后获得的至少一个图像脱敏维度的图像特征的基础上,利用多个图像识别模型对所述待处理图像进行敏感特征识别,并通过对多个图像识别模型的敏感特征识别结果进行核对来提升敏感特征识别的准确度,在此基础上针对所述待处理图像进行的脱敏处理的准确度也更高。
为进一步提高图像脱敏处理的准确度,可在不同特征维度利用不同的特征降维模型进行特征降维处理,从而使特征降维处理更加全面,在此基础上进行的图像脱敏处理也更加准确。可选的,所述特征维度与所述特征降维模型具有对应关系,不同特征降维模型对应的特征子集包含的初始图像特征的特征维度存在不同。
例如,图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度当中,图像色彩维度和图像纹理维度这2个特征维度与特征降维模型Model 1具有对应关系,图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度与特征降维模型Model 2具有对应关系;在图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度组成的特征集中,提取特征子集A和特征子集B,特征子集A包含图像色彩维度和图像纹理维度这2个特征维度的初始图像特征,被输入对应的特征降维模型Model 1进行特征降维处理;特征子集B包含图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度的初始图像特征,被输入对应的特征降维模型Model 2进行特征降维处理;
或者,图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度当中,图像色彩维度、图像纹理维度和图像特征标识维度这3个特征维度与特征降维模型Model 3具有对应关系,图像纹理维度、图像特征标识维度和图像特征位置维度这3个特征维度与特征降维模型Model 4具有对应关系,图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度与特征降维模型Model5具有对应关系;在特征集中提取特征子集C、特征子集D和特征子集E,特征子集C包含图像色彩维度、图像纹理维度和图像特征标识维度这3个特征维度的初始图像特征,被输入对应的特征降维模型Model 3进行特征降维处理;特征子集D包含图像纹理维度、图像特征标识维度和图像特征位置维度这3个特征维度的初始图像特征,被输入对应的特征降维模型Model 4进行特征降维处理;特征子集E包含图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度的初始图像特征,被输入对应的特征降维模型Model 5进行特征降维处理。
在上述特征维度与所述特征降维模型具有对应关系,并且不同特征降维模型对应的特征子集包含的初始图像特征的特征维度存在不同这一基础上,本申请实施例提供的一种可选实施方式中,在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理,具体采用如下方式实现:
1)在所述特征集中提取多个特征子集;
其中,每个特征子集包含多个特征维度的初始图像特征;
2)基于每个特征子集包含至少一个特征维度的初始图像特征构建对应的特征向量;所述特征向量的向量维度数值与所述特征子集中的特征维度数值相等;
需要说明的是,基于每个特征子集包含至少一个特征维度的初始图像特征构建对应的特征向量,与所述特征子集中包含的初始图像特征的特征维度是一致的,不仅表现在特征向量的向量维度数值与特征子集中的特征维度数值相等,还表现在特征向量的向量维度与特征子集包含的初始图像特征的特征维度相同;
3)将所述特征向量输入对应的特征降维模型进行降维计算,将降维计算后获得所述至少一个图像脱敏维度的特征向量作为所述至少一个图像脱敏维度的图像特征。
例如,对于参与保险项目的项目成员A,项目成员A在参与保险项目之后发起理赔之后会生成相应的理赔案件,理赔案件的案件材料为图像形式的材料,其中包含有:项目成员A的身份证正面照图像、身份证背面照图像、项目成员A的照片图像、包含项目成员A银行卡账号和手机账号的图像;上述理赔材料的图像中包含项目成员A的隐私信息,因此需对这些图像进行脱敏处理,具体在处理过程中,分别提取每张图像在图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度的初始图像特征组成的特征集;
在特征集中提取图像色彩维度和图像纹理维度这2个特征维度的特征子集,并且图像色彩维度和图像纹理维度这2个特征维度与针对特征子集中包含的这2个特征维度的初始图像特征进行特征降维处理的特征降维模型Model 1具有对应关系,则根据图像在图像色彩维度和图像纹理维度的初始图像特征构建2维特征向量;以及,在特征集中提取图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度的初始图像特征,并且图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度与针对特征子集中包含的这3个特征维度的初始图像特征进行特征降维处理的特征降维模型Model 2具有对应关系,则根据图像在图像特征标识维度、图像特征位置维度和图像特征空间关系维度的初始图像特征构建3维特征向量;
其中,特征向量在图像色彩维度的特征值表征的是图像的色彩特征,特征向量在图像纹理维度的特征值表征的是图像中具有缓慢变化或者周期性变化的局部组织的排列属性,特征向量在图像特征标识维度的特征值表征的是图像中包含的特征块的特征标识,特征向量在图像特征位置的特征值表征的是图像中包含的特征块的位置信息,特征向量在图像特征空间关系维度的特征值表征的是图像中包含的特征块之间的距离关系、层级关系或者重叠关系;
进一步,将图像在图像色彩维度和图像纹理维度这2个特征维度构建的2维特征向量输入特征降维模型Model 1进行降维计算,降维后获得图像在图像色彩维度的1维特征向量(特征降维模型Model 1在对2维特征向量进行降维计算过程中,以n条2维数据为例,首先将数据组成n行2列的矩阵X,然后将X的每一行进行零均值化,即减去这一行的均值,求出协方差矩阵,并进一步求出协方差矩阵的特征值及对应的特征向量,最后将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P,即为从2维降维到k(k<2)维后的数据);
以及,将图像在图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度构建的3维特征向量输入特征降维模型Model 2进行降维计算,降维后获得图像在图像特征标识维度和图像特征位置维度的2维特征向量(特征降维模型Model 1在对3维特征向量进行降维计算过程中,以n条3维数据为例,首先将数据组成n行3列的矩阵X,然后将X的每一行进行零均值化,即减去这一行的均值,求出协方差矩阵,并进一步求出协方差矩阵的特征值及对应的特征向量,最后将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P,即为从3维降维到k(k<3)维后的数据)。
实际应用中,在对所述待处理图像在多个特征维度的初始图像特征进行降维处理的过程中,降维处理过程中的数据计算量比较大,尤其是在待处理图像的数量比较大或者图像较为复杂的情况下,降维处理所需的计算量更大、处理时间也比更长,为提升处理效率,本申请实施例通过引入特征降维模型进行特征降维处理来提升降维处理过程的处理效率。
上述通过所述特征降维模型对所述待处理图像的多个特征维度的初始图像特征进行降维处理,前提是构建并经过训练获得该特征降维模型,本申请实施例提供的一种优选实施方式中,所述特征降维模型,采用如下方式进行训练:
1)获取已完成脱敏处理的已脱敏图像对应的初始图像的初始图像集合;
2)提取所述初始图像集合中初始图像在多个特征维度的初始图像特征组成的特征集;
3)对在所述特征集中提取的特征子集包含的多个特征维度的初始图像特征进行降维处理,获得所述初始图像在至少一个图像脱敏维度的真实图像特征;
4)将所述特征子集和所述至少一个图像脱敏维度的真实图像特征作为第一训练样本,对预先构建的初始特征降维模型进行训练,获得所述特征降维模型。
可选的,所述初始特征降维模型采用第一神经网络算法构建,并且,构建不同初始特征降维模型采用的第一神经网络算法不同。比如基于卷积神经网络算法构建多个初始特征降维模型,但多个初始特征降维模型采用不同的卷积次数、不同的卷积或者不同池化算法。
例如,参与保险项目的项目成员当中,某个时间段内有100个项目成员申请理赔,项目成员申请理赔生成的理赔案件的案件材料均为图像形式的材料,每个项目成员的理赔案件的案件材料中包含50张图像,其中包含有项目成员的身份证正面照图像、身份证背面照图像、项目成员的照片图像、包含项目成员银行卡账号和手机账号的图像等;对于上述100个项目成员各自理赔案件的案件材料中包含50张图像,分别提取每张图像在图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度的特征集;
基于此,在特征集中提取图像色彩维度和图像纹理维度这2个特征维度的初始图像特征组成的特征子集,在对特征降维模型Model 1进行训练过程中,采用有监督训练方式,因此,还需要确定每张图像的初始特征向量降维处理后真实的图像特征,具体是对每张照片的在这2个特征维度的初始图像特征进行降维处理,获得在图像色彩维度(图像脱敏维度)的真实图像特征;
根据每张图像在图像色彩维度和图像纹理维度这2个特征维度的特征子集和真实图像特征二者的对应关系,将每张图像的特征子集和真实图像特征作为一个训练样本,利用确定的5000个训练样本对基于卷积神经网络算法构建的初始特征降维模型进行训练;以此类推,通过大量的训练样本对初始特征降维模型进行训练,训练完成后获得用于对图像的特征向量进行降维处理的特征降维模型Model 1;
类似的,在特征集中提取图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度的初始图像特征组成的特征子集,在对特征降维模型Model 2进行训练过程中,采用有监督训练方式,因此,还需要确定每张图像的初始特征向量降维处理后真实的图像特征,具体是对每张照片的在这3个特征维度的初始图像特征进行降维处理,获得在图像特征标识维度(图像脱敏维度)和图像特征位置维度(图像脱敏维度)的真实图像特征;
根据每张图像在图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度的特征子集和真实图像特征之间的对应关系,将每张图像的特征子集和真实图像特征作为一个训练样本,利用确定的5000个训练样本对基于卷积神经网络算法构建的初始特征降维模型进行训练;以此类推,通过大量的训练样本对初始特征降维模型进行训练,训练完成后获得用于对图像的特征向量进行降维处理的特征降维模型Model 2。
步骤S106,通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别。
本申请实施例所述敏感特征,是指所述待处理图像中包含所述项目成员的隐私信息或者不适于公开展示的敏感信息的图像特征。以项目成员A的身份证正面照这一图像为例,项目成员A的头像所在区域的图像特征,以及项目成员A的身份证号、姓名、出生地址所在区域的图像特征均为敏感特征,因此,需要识别出图像项目成员A的身份证正面照这一图像中包含的所有隐私信息所在区域的敏感特征。
实际应用中,在所述待处理图像中识别敏感特征同样需要较大的计算量和较长的处理时间,本申请实施例通过引入机器学习方法来提升敏感特征识别过程中处理效率,利用图像识别模型在所述待处理图像中进行敏感特征的识别,具体是将携带所述脱敏特征维度的图像特征的待处理图像输入所述图像识别模型进行敏感特征识别,输出所述待处理图像中包含的敏感特征。
如上所述,为了提高图像脱敏处理的准确度,本申请实施例采用多个特征降维模型对所述特征集中提取的特征子集进行降维处理,为了进一步提高图像脱敏处理的准确度,在上述采用多个特征降维模型对所述特征集中提取的特征子集进行降维处理的基础上,利用多个图像识别模型对所述待处理图像进行敏感特征识别,可选的,所述图像脱敏维度与所述图像识别模型具有对应关系,不同图像识别模型对应的图像特征的图像脱敏维度存在不同,比如图像识别模型IR Model 1对应图像色彩维度和图像纹理维度这2个图像脱敏维度,涉及这两个特征维度或者这两个特征维度中任意一个特征维度的图像进行敏感特征识别,都输入图像识别模型IR Model 1进行敏感特征识别;图像识别模型IR Model2对应图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个图像脱敏维度,涉及这3个特征维度或者这3个特征维度中任意一个或者两个特征维度的图像进行敏感特征识别,都输入图像识别模型IR Model 2进行敏感特征识别,通过对多个图像识别模型的敏感特征识别结果进行核对来提升敏感特征识别的准确度,从而来提升针对所述待处理图像进行脱敏处理的准确度。
可选的,所述特征降维模型与所述图像识别模型具有一一对应关系,并且,所述特征降维模型输出的至少一个图像脱敏维度的图像特征被输入所述特征降维模型对应的图像识别模型进行敏感特征识别。
例如,特征降维模型Model 1与图像识别模型IR Model 1具有对应关系,具体处理过程中,特征降维模型Model 1用于在图像色彩维度和图像纹理维度这2个特征维度进行特征降维处理,并将特征降维模型Model 1进行特征降维处理后获得的图像色彩维度这一图像脱敏维度(或者,图像纹理维度这一图像脱敏维度)的图像特征输入图像识别模型IRModel 1,利用图像识别模型IR Model 1在图像色彩维度这一图像脱敏维度(或者,图像纹理维度这一图像脱敏维度)针对待处理图像进行敏感特征识别;
以及,特征降维模型Model 2与图像识别模型IR Model 2具有对应关系,具体处理过程中,特征降维模型Model 2用于在图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度进行特征降维处理,并将特征降维模型Model 2进行特征降维处理后获得的图像特征标识维度和图像特征位置维度这2个图像脱敏维度(或者图像特征标识维度这一图像脱敏维度,或者图像特征空间关系维度这一图像脱敏维度,或者图像特征位置维度和图像特征空间关系维度这2个图像脱敏维度)的图像特征输入图像识别模型IRModel 2,利用图像识别模型IR Model 2在图像特征标识维度和图像特征位置维度这2个图像脱敏维度(或者图像特征标识维度这一图像脱敏维度,或者图像特征空间关系维度这一图像脱敏维度,或者图像特征位置维度和图像特征空间关系维度这2个图像脱敏维度)针对待处理图像进行敏感特征识别。
上述通过图像识别模型在所述待处理图像中进行敏感特征的识别,前提是构建并经过训练获得该图像识别模型,本申请实施例提供的一种优选实施方式中,在训练所述图像识别模型的过程中,在上述训练所述特征降维模型采用的优选实施方式的基础上,将携带所述至少一个图像脱敏维度的真实图像特征的初始图像和携带真实敏感特征的初始图像作为第二训练样本,对预先构建的初始图像识别模型进行训练,训练完成后获得对所述待处理图像进行敏感特征识别的所述图像识别模型。
可选的,所述初始图像识别模型采用第二神经网络算法构建,并且,构建不同初始图像识别模型采用的第二神经网络算法不同。比如基于卷积神经网络算法构建多个初始图像识别模型,但多个初始图像识别模型采用不同的卷积次数、不同的卷积或者不同池化算法。
沿用上例,在训练图像识别模型的过程中,同样采用有监督训练方式,因此,首先采用人工标记的方式对上述100个项目成员各自理赔案件的案件材料中包含50张图像真实的敏感特征进行标记,标记完成后确定每张图像中包含的真实敏感特征;
具体训练时,利用上述获得的每张图像在图像色彩维度(图像脱敏维度)的真实图像特征,根据将未进行敏感特征识别或者标记的图像(携带图像色彩维度的真实图像特征与已标记出真实敏感特征的图像二者的对应关系,将未进行敏感特征识别或者标记的图像与已标记出真实敏感特征的张图像作为一个训练样本(1个训练样本包含的是同一张图像在进行敏感特征标记之前的状态和进行敏感特征标记之后的状态,这两个状态通过2张图像来体现:一张是未标记敏感特征的图像,另一张是已标记敏感特征的图像,二者共同作为一个训练样本),最后利用确定的5000个训练样本对基于卷积神经网络算法构建的初始图像识别模型进行训练;
以此类推,通过大量的训练样本对初始图像识别模型进行训练,训练完成后获得用于对图像中包含的敏感特征进行识别的图像识别模型。
步骤S108,判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致。
上述在采用多个特征降维模型对所述特征集中提取的特征子集进行降维处理的基础上,通过将多个特征降维模型进行特征降维处理后分别获得的至少一个图像脱敏维度的图像特征输出对应的多个图像识别模型进行敏感特征识别,本步骤中,根据多个图像识别模型进行敏感特征识别后获得的敏感特征,通过对多个图像识别模型的敏感特征识别结果进行核对来提升敏感特征识别的准确度,从而来提升针对待处理图像进行脱敏处理的准确度。
本实施例中,具体通过判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致来对多个图像识别模型的敏感特征识别结果进行核对;
若多个图像识别模型进行敏感特征识别后输出的敏感特征一致,则表明在不同特征维度进行敏感特征识别的结果一致,执行下述步骤S110,对所述待处理图像中的敏感特征进行脱敏处理;
若多个图像识别模型进行敏感特征识别后输出的敏感特征不一致,则表明在不同特征维度进行敏感特征识别的结果不一致,还需对多个图像识别模型输出的敏感特征识别进行校验,或者分别计算多个图像识别模型输出的敏感特征的准确率,将准确率最高的敏感特征作为所述待处理图像的敏感特征。
例如,对于参与保险项目的项目成员A,项目成员A在参与保险项目之后发起理赔之后会生成相应的理赔案件,理赔案件的案件材料为图像形式的材料,其中包含有:项目成员A的身份证正面照图像、身份证背面照图像、项目成员A的照片图像、包含项目成员A银行卡账号和手机账号的图像;以项目成员A的身份证正面照图像为例,图像识别模型IR Model1进行敏感特征识别后输出的敏感特征为:身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯;图像识别模型IR Model 2进行敏感特征识别后输出的敏感特征同样为身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯;可见,图像识别模型IR Model 1与图像识别模型IR Model 2二者输出的敏感特征一致,则需执行后续步骤对身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯进行脱敏处理。
步骤S110,对所述待处理图像中的敏感特征进行脱敏处理。
在上述多个图像识别模型对所述待处理图像进行敏感识别后输出的敏感特征一致的情况下,对所述待处理图像中识别出的敏感特征进行脱敏处理。本实施例对所述待处理图像中识别出的敏感特征进行脱敏处理的方式不做限定,比如对待处理图像中识别出的敏感特征添加水印,或者对待处理图像中识别出的敏感特征进行图像模糊化处理,再或者采用裁剪的方式裁剪掉待处理图像中识别出的敏感特征所在区域。
下述结合附图2,以本申请提供的基于图像识别的脱敏处理方法在保险项目的应用为例,对本申请提供的基于图像识别的脱敏处理方法进行进一步说明。
步骤S202,获取保险项目的项目成员A在项目参与过程中提交的项理赔案件的理赔材料中包含的图像。
对于参与保险项目的项目成员A,项目成员A在参与保险项目之后发起理赔之后会生成相应的理赔案件,理赔案件的案件材料为图像形式的材料,其中包含有:项目成员A的身份证正面照图像、身份证背面照图像、项目成员A的照片图像、包含项目成员A银行卡账号和手机账号的图像。
步骤S204,提取图像在5个特征维度的初始图像特征组成的特征集。
上述理赔材料的图像中包含项目成员A的隐私信息,因此需对这些理赔材料中包含项目成员A的隐私信息的图像进行脱敏处理,在处理过程中,分别提取每张图像在图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度的初始图像特征组成的特征集。
步骤S206,基于特征集中包含的5个特征维度的初始图像特征对图像进行预处理。
以上述图像特征位置维度为例,基于图像特征位置维度的初始图像特征对图像进行预处理,第一步是根据图像特征位置维度的初始图像特征,确定图像中包含的图像特征的位置信息;第二步基于图像中包含的图像特征的位置信息,对图像进行裁剪,以降低后续对图像进行敏感特征识别过程中的数据处理量,提升处理效率。
步骤S208,在特征集中提取2个特征子集输入特征降维模型Model 1和特征降维模型Model 2进行特征降维处理。
图像色彩维度、图像纹理维度、图像特征标识维度、图像特征位置维度和图像特征空间关系维度这5个特征维度当中,图像色彩维度和图像纹理维度这2个特征维度与特征降维模型Model 1具有对应关系,图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度与特征降维模型Model 2具有对应关系;在特征集中提取特征子集A和特征子集B,特征子集A包含图像色彩维度和图像纹理维度这2个特征维度的初始图像特征,被输入对应的特征降维模型Model 1进行特征降维处理;特征子集B包含图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度的初始图像特征,被输入对应的特征降维模型Model 2进行特征降维处理。
具体特征降维处理过程中,将图像在图像色彩维度和图像纹理维度这2个特征维度构建的2维特征向量输入特征降维模型Model 1进行降维计算,降维后获得图像在图像色彩维度的1维特征向量;并将图像在图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度构建的3维特征向量输入特征降维模型Model 2进行降维计算,降维后获得图像在图像特征标识维度和图像特征位置维度的2维特征向量。
步骤S210,将特征降维模型Model 1输出的图像色彩维度的图像特征输入对应的图像识别模型IR Model 1进行敏感特征识别,并将特征降维模型Model 2输出的图像特征标识维度和图像特征位置维度的图像特征输入对应的图像识别模型IR Model 2进行敏感特征识别。
其中,特征降维模型Model 1与图像识别模型IR Model 1具有对应关系,具体处理过程中,特征降维模型Model 1用于在图像色彩维度和图像纹理维度这2个特征维度进行特征降维处理,并将特征降维模型Model 1进行特征降维处理后获得的图像色彩维度这一图像脱敏维度的图像特征输入图像识别模型IR Model 1,利用图像识别模型IR Model 1在图像色彩维度这一图像脱敏维度针对图像进行敏感特征识别;
以及,特征降维模型Model 2与图像识别模型IR Model 2具有对应关系,具体处理过程中,特征降维模型Model 2用于在图像特征标识维度、图像特征位置维度和图像特征空间关系维度这3个特征维度进行特征降维处理,并将特征降维模型Model 2进行特征降维处理后获得的图像特征标识维度和图像特征位置维度这2个图像脱敏维度的图像特征输入图像识别模型IR Model 2,利用图像识别模型IR Model 2在图像特征标识维度和图像特征位置维度这2个图像脱敏维度针对图像进行敏感特征识别。
以项目成员A的身份证正面照这一图像为例,项目成员A的头像所在区域的图像特征,以及项目成员A的身份证号、姓名、出生地址所在区域的图像特征均为敏感特征,因此,需要识别出图像项目成员A的身份证正面照图像中包含的所有隐私信息所在区域的敏感特征;项目成员A的身份证正面照这一图像输入图像识别模型IR Model 1进行敏感特征识别后输出的敏感特征为:身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯;项目成员A的身份证正面照这一图像输入图像识别模型IR Model 2进行敏感特征识别后输出的敏感特征为身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯。
步骤S212,判断图像识别模型IR Model 1和图像识别模型IR Model 2输出的图像中的敏感特征是否一致;
若是,执行下述步骤S214;
若否,表明在不同特征维度进行敏感特征识别的结果不一致,则分别计算图像识别模型IR Model 1和图像识别模型IR Model 2输出的敏感特征的准确率,将准确率最高的敏感特征作为图像的敏感特征。
步骤S214,对识别出的图像中的敏感特征进行脱敏处理。
以项目成员A的身份证正面照这一图像为例,在图像识别模型IR Model 1进行敏感特征识别后输出的敏感特征为:身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯;图像识别模型IR Model 2进行敏感特征识别后输出的敏感特征为身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯,在图像识别模型IR Model 1与图像识别模型IR Model 2二者输出的敏感特征一致的情况下,通过对身份证正面照图像中项目成员A的头像照片、项目成员A的姓名、身份证号和籍贯进行图像模糊化处理的方式进行脱敏处理。
综上所述,本申请提供的基于图像识别的脱敏处理方法,从图像识别的角度出发,首先提取待处理图像在多个特征维度的初始图像特征组成特征集,并采用多个特征降维模型对所述特征集中提取的特征子集进行降维处理,在多个特征降维模型输出的图像特征的基础上利用多个图像识别模型对所述待处理图像进行敏感特征识别,最终通过对多个图像识别模型的敏感特征识别结果进行核对来提升敏感特征识别的准确度,从而来提升针对待处理图像进行脱敏处理的准确度。
本申请提供的一种基于图像识别的脱敏处理装置实施例如下:
在上述的实施例中,提供了一种基于图像识别的脱敏处理方法,与之相对应的,本申请还提供了一种基于图像识别的脱敏处理装置,下面结合附图进行说明。
参照附图3,其示出了本申请提供的一种基于图像识别的脱敏处理装置实施例的示意图。
由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本申请提供一种基于图像识别的脱敏处理装置,包括:
特征集提取模块302,被配置为提取待处理图像在多个特征维度的初始图像特征组成的特征集;
特征降维处理模块304,被配置为在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理;所述特征子集包含多个特征维度的初始图像特征;
敏感特征识别模块306,被配置为通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别;
敏感特征判断模块308,被配置为判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致;
若是,运行脱敏处理模块310;所述脱敏处理模块310,被配置为对所述待处理图像中的敏感特征进行脱敏处理。
可选的,所述特征维度与所述特征降维模型具有对应关系,不同特征降维模型对应的特征子集包含的初始图像特征的特征维度存在不同;
和/或,所述图像脱敏维度与所述图像识别模型具有对应关系,不同图像识别模型对应的图像特征的图像脱敏维度存在不同。
可选的,所述特征降维模型与所述图像识别模型具有一一对应关系,并且,所述特征降维模型输出的至少一个图像脱敏维度的图像特征被输入所述特征降维模型对应的图像识别模型进行敏感特征识别。
可选的,所述特征降维处理模块304,包括:
特征子集提取单元,被配置为在所述特征集中提取多个特征子集;
特征向量构建单元,被配置为基于每个特征子集包含至少一个特征维度的初始图像特征构建对应的特征向量;所述特征向量的向量维度数值与所述特征子集中的特征维度数值相等;
降维计算单元,被配置为将所述特征向量输入对应的特征降维模型进行降维计算,将降维计算后获得所述至少一个图像脱敏维度的特征向量作为所述至少一个图像脱敏维度的图像特征。
可选的,所述基于图像识别的脱敏处理装置,包括:
预处理模块,被配置为基于所述多个特征维度的初始图像特征对所述待处理图像进行预处理。
可选的,若所述特征维度包含图像特征位置维度,相应的,预处理模块,包括:
位置信息确定单元,被配置为根据所述图像特征位置维度的初始图像特征,确定所述待处理图像中包含的图像特征的位置信息;
图像裁剪处理单元,被配置为基于所述待处理图像中包含的图像特征的位置信息,对所述待处理图像进行裁剪。
可选的,所述基于图像识别的脱敏处理装置,包括:
待处理图像获取模块,被配置为获取项目成员在项目参与过程中提交的项目案件的案件材料中包含的所述待处理图像。
可选的,所述特征降维模型,通过运行如下单元进行训练:
初始图像集合获取单元,被配置为获取已完成脱敏处理的已脱敏图像对应的初始图像的初始图像集合;
特征集提取单元,被配置为提取所述初始图像集合中初始图像在多个特征维度的初始图像特征组成的特征集;
降维处理单元,被配置为对在所述特征集中提取的特征子集包含的多个特征维度的初始图像特征进行降维处理,获得所述初始图像在至少一个图像脱敏维度的真实图像特征;
特征降维模型训练单元,被配置为将所述特征子集和所述至少一个图像脱敏维度的真实图像特征作为第一训练样本,对预先构建的初始特征降维模型进行训练,获得所述特征降维模型。
可选的,所述初始特征降维模型采用第一神经网络算法构建,并且,构建不同初始特征降维模型采用的第一神经网络算法不同。
可选的,所述初始图像识别模型,通过运行如下单元进行训练:
图像识别模型训练单元,被配置为将携带所述至少一个图像脱敏维度的真实图像特征的初始图像和携带真实敏感特征的初始图像作为第二训练样本,对预先构建的初始图像识别模型进行训练,获得所述图像识别模型。
可选的,所述初始图像识别模型采用第二神经网络算法构建,并且,构建不同初始图像识别模型采用的第二神经网络算法不同。
可选的,所述图像脱敏维度,包括下述至少一项:
图像色彩维度、图像特征位置维度以及图像特征标识维度。
本申请提供的一种计算设备实施例如下:
图4是示出了根据本说明书一实施例的计算设备400的结构框图。该计算设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接,数据库450用于保存数据。
计算设备400还包括接入设备440,接入设备440使得计算设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备400的上述部件以及图4中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图4所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备400可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备400还可以是移动式或静止式的服务器。
本申请提供一种计算设备,包括存储器410、处理器420及存储在存储器上并可在处理器上运行的计算机指令,所述处理器420用于执行如下计算机可执行指令:
提取待处理图像在多个特征维度的初始图像特征组成的特征集;
在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理;所述特征子集包含多个特征维度的初始图像特征;
通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别;
判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致;
若是,对所述待处理图像中的敏感特征进行脱敏处理。
可选的,所述特征维度与所述特征降维模型具有对应关系,不同特征降维模型对应的特征子集包含的初始图像特征的特征维度存在不同;
和/或,所述图像脱敏维度与所述图像识别模型具有对应关系,不同图像识别模型对应的图像特征的图像脱敏维度存在不同。
可选的,所述特征降维模型与所述图像识别模型具有一一对应关系,并且,所述特征降维模型输出的至少一个图像脱敏维度的图像特征被输入所述特征降维模型对应的图像识别模型进行敏感特征识别。
可选的,所述在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理,包括:
在所述特征集中提取多个特征子集;
基于每个特征子集包含至少一个特征维度的初始图像特征构建对应的特征向量;所述特征向量的向量维度数值与所述特征子集中的特征维度数值相等;
将所述特征向量输入对应的特征降维模型进行降维计算,将降维计算后获得所述至少一个图像脱敏维度的特征向量作为所述至少一个图像脱敏维度的图像特征。
可选的,所述提取待处理图像在多个特征维度的初始图像特征组成的特征集指令执行之后,且所述在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理指令执行之前,所述处理器420还用于执行如下计算机可执行指令:
基于所述多个特征维度的初始图像特征对所述待处理图像进行预处理。
可选的,若所述特征维度包含图像特征位置维度,相应的,所述基于所述多个特征维度的初始图像特征对所述待处理图像进行预处理,包括:
根据所述图像特征位置维度的初始图像特征,确定所述待处理图像中包含的图像特征的位置信息;
基于所述待处理图像中包含的图像特征的位置信息,对所述待处理图像进行裁剪。
可选的,所述提取待处理图像在多个特征维度的初始图像特征组成的特征集指令执行之前,所述处理器420还用于执行如下计算机可执行指令:
获取项目成员在项目参与过程中提交的项目案件的案件材料中包含的所述待处理图像。
可选的,所述特征降维模型,采用如下方式进行训练:
获取已完成脱敏处理的已脱敏图像对应的初始图像的初始图像集合;
提取所述初始图像集合中初始图像在多个特征维度的初始图像特征组成的特征集;
对在所述特征集中提取的特征子集包含的多个特征维度的初始图像特征进行降维处理,获得所述初始图像在至少一个图像脱敏维度的真实图像特征;
将所述特征子集和所述至少一个图像脱敏维度的真实图像特征作为第一训练样本,对预先构建的初始特征降维模型进行训练,获得所述特征降维模型。
可选的,所述初始特征降维模型采用第一神经网络算法构建,并且,构建不同初始特征降维模型采用的第一神经网络算法不同。
可选的,所述初始图像识别模型,采用如下方式进行训练:
将携带所述至少一个图像脱敏维度的真实图像特征的初始图像和携带真实敏感特征的初始图像作为第二训练样本,对预先构建的初始图像识别模型进行训练,获得所述图像识别模型。
可选的,所述初始图像识别模型采用第二神经网络算法构建,并且,构建不同初始图像识别模型采用的第二神经网络算法不同。
可选的,所述图像脱敏维度,包括下述至少一项:
图像色彩维度、图像特征位置维度以及图像特征标识维度。
本申请提供的一种计算机可读存储介质实施例如下:
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
提取待处理图像在多个特征维度的初始图像特征组成的特征集;
在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理;所述特征子集包含多个特征维度的初始图像特征;
通过将所述待处理图像和所述特征降维模型输出的至少一个图像脱敏维度的图像特征输入对应的多个图像识别模型进行敏感特征识别;
判断所述多个图像识别模型输出的所述待处理图像中的敏感特征是否一致;
若是,对所述待处理图像中的敏感特征进行脱敏处理。
可选的,所述特征维度与所述特征降维模型具有对应关系,不同特征降维模型对应的特征子集包含的初始图像特征的特征维度存在不同;
和/或,所述图像脱敏维度与所述图像识别模型具有对应关系,不同图像识别模型对应的图像特征的图像脱敏维度存在不同。
可选的,所述特征降维模型与所述图像识别模型具有一一对应关系,并且,所述特征降维模型输出的至少一个图像脱敏维度的图像特征被输入所述特征降维模型对应的图像识别模型进行敏感特征识别。
可选的,所述在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理,包括:
在所述特征集中提取多个特征子集;
基于每个特征子集包含至少一个特征维度的初始图像特征构建对应的特征向量;所述特征向量的向量维度数值与所述特征子集中的特征维度数值相等;
将所述特征向量输入对应的特征降维模型进行降维计算,将降维计算后获得所述至少一个图像脱敏维度的特征向量作为所述至少一个图像脱敏维度的图像特征。
可选的,所述提取待处理图像在多个特征维度的初始图像特征组成的特征集步骤执行之后,且所述在所述特征集中提取多个特征子集输入对应的多个特征降维模型进行特征降维处理步骤执行之前,包括:
基于所述多个特征维度的初始图像特征对所述待处理图像进行预处理。
可选的,若所述特征维度包含图像特征位置维度,相应的,所述基于所述多个特征维度的初始图像特征对所述待处理图像进行预处理,包括:
根据所述图像特征位置维度的初始图像特征,确定所述待处理图像中包含的图像特征的位置信息;
基于所述待处理图像中包含的图像特征的位置信息,对所述待处理图像进行裁剪。
可选的,所述提取待处理图像在多个特征维度的初始图像特征组成的特征集步骤执行之前,包括:
获取项目成员在项目参与过程中提交的项目案件的案件材料中包含的所述待处理图像。
可选的,所述特征降维模型,采用如下方式进行训练:
获取已完成脱敏处理的已脱敏图像对应的初始图像的初始图像集合;
提取所述初始图像集合中初始图像在多个特征维度的初始图像特征组成的特征集;
对在所述特征集中提取的特征子集包含的多个特征维度的初始图像特征进行降维处理,获得所述初始图像在至少一个图像脱敏维度的真实图像特征;
将所述特征子集和所述至少一个图像脱敏维度的真实图像特征作为第一训练样本,对预先构建的初始特征降维模型进行训练,获得所述特征降维模型。
可选的,所述初始特征降维模型采用第一神经网络算法构建,并且,构建不同初始特征降维模型采用的第一神经网络算法不同。
可选的,所述初始图像识别模型,采用如下方式进行训练:
将携带所述至少一个图像脱敏维度的真实图像特征的初始图像和携带真实敏感特征的初始图像作为第二训练样本,对预先构建的初始图像识别模型进行训练,获得所述图像识别模型。
可选的,所述初始图像识别模型采用第二神经网络算法构建,并且,构建不同初始图像识别模型采用的第二神经网络算法不同。
可选的,所述图像脱敏维度,包括下述至少一项:
图像色彩维度、图像特征位置维度以及图像特征标识维度。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的基于图像识别的脱敏处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述基于图像识别的脱敏处理方法的技术方案的描述。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和真实应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。