CN117195286A - 一种基于大数据的用户隐私保护方法和系统 - Google Patents

一种基于大数据的用户隐私保护方法和系统 Download PDF

Info

Publication number
CN117195286A
CN117195286A CN202311127032.3A CN202311127032A CN117195286A CN 117195286 A CN117195286 A CN 117195286A CN 202311127032 A CN202311127032 A CN 202311127032A CN 117195286 A CN117195286 A CN 117195286A
Authority
CN
China
Prior art keywords
image
sub
hot spot
human body
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311127032.3A
Other languages
English (en)
Other versions
CN117195286B (zh
Inventor
罗土生
江连丰
裴雁平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Citic Big Data Technology Co ltd
Original Assignee
Beijing Chaoran Lili Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Chaoran Lili Network Technology Co ltd filed Critical Beijing Chaoran Lili Network Technology Co ltd
Priority to CN202311127032.3A priority Critical patent/CN117195286B/zh
Publication of CN117195286A publication Critical patent/CN117195286A/zh
Application granted granted Critical
Publication of CN117195286B publication Critical patent/CN117195286B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)

Abstract

本发明属于信息安全领域,具体涉及基于大数据的用户隐私保护方法和系统。本发明提供的方法包括:基于第一图像获得包含人体的热点区域信息;基于热点区域信息获得热点区域的类别;基于热点区域的类别获取匹配的图像编码器;使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件;将图像解码器写入第二图像文件;所述第二图像文件与第一图像中包含的人体信息不一致,所述第二图像文件中除人体信息外的图像和第一图像一致。本发明的方法和系统可以提供对于用户隐私信息的保护。

Description

一种基于大数据的用户隐私保护方法和系统
技术领域
本发明属于隐私保护领域,具体涉及一种基于大数据的用户隐私保护方法和系统。
背景技术
随着信息技术的快速发展,包括手机和计算机大量应用,用户设备信息可能被访问,相关的信息会被APP或者本地的可执行程序进行访问,中间会带来个人隐私的泄露问题。
进一步的,由于用户端的资源满足不了个人需求时,用户的相关信息会被存储至云端,用来解决个人移动设备或者个人电脑速度和存储资源不足的问题,但是此过程可能存在账号安全以及信息被三方访问的问题。
无论是本地手机或者云端存储的数据,当用户数据上传至第三方服务器后,用户就失去了对数据的直接控制。此外,通过对用户数据的特征提取,然后和其他数据进行交叉比对可以获取新的二次数据,通过此类数据可以获取关于用户的更多信息,从而提升了用户个人信息的风险等级。
发明内容
本发明的目的为克服现有技术中一个或者多个缺陷,提供一种基于大数据的用户隐私保护方法和系统。
根据本发明的第一个方面,本发明提供了基于大数据的用户隐私保护方法,包括:
基于第一图像获得包含人体的热点区域信息;
基于热点区域信息获得热点区域的类别;
基于热点区域的类别获取匹配的图像编码器;
使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件;
将图像解码器写入第二图像文件;
所述第二图像文件与第一图像中包含的人体信息不一致,所述第二图像文件中除人体信息外的图像和第一图像一致。
根据本发明的第二个方面,本发明提供了基于大数据的用户隐私保护系统,包括:
热点区域获取单元,用于基于第一图像获得包含人体的热点区域信息;
热点区域类别获取单元,用于基于热点区域信息获得热点区域的类别;
图像编码器获取单元,用于基于热点区域的类别获取匹配的图像编码器;
第二图像生成单元,用于使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件,以及将图像解码器写入第二图像文件;
所述第二图像文件与第一图像中包含的人物信息不一致,所述第二图像文件中除人物信息外的图像和第一图像一致。
根据本发明的第三个方面,本发明提供了基于大数据的用户隐私保护系统,还包括:
解码器获取单元,用于从图像文件获得压缩后的图像解码器;
解码器解压单元,用于根据用户的凭据获得解压后的图像解码器;
图像还原单元,用于根据解压后的图像解码器对第二图像文件进行还原获得原始图像。
本发明具有如下的有益效果:
本发明针对原始的图像数据以及二次数据进行保护,通过提供混淆信息,将不一致的内容写入图像文件内,并通过图像涉及人体内容的改写,实现了文件的可逆还原、隐私信息冲突内容的添加和防伪造功能。
附图说明
图1:本发明一个实施例中基于大数据的用户隐私保护方法流程示意图;
图2:本发明一个实施例中选取匹配图像编码器的流程示意图
图3:本发明一个实施例中读取含有图像解码器的流程示意图。
具体实施方式
下面结合实施例并参照附图对本发明作进一步描述。
首先,对本发明涉及的一种实现进行说明。本发明的方法在用户端的设备上实施,用户通过这些设备进行图像的获取或处理。本发明的用户端的设备和服务器通过网络连接,服务器运行用于提供服务的程序。
在本发明中,服务器是在网络上提供、管理网络资源的一个计算机或设备,终端可指各种类型的装置,包括(但不限于)无线电话、蜂窝式电话、膝上型计算机、多媒体无线装置、无线通信个人计算机(PC)卡、个人数字助理(PDA)、外部或内部调制解调器等。客户端设备,即终端可为任何经由无线信道和/或经由有线信道(例如,光纤或同轴电缆)与服务器通信的数据装置。终端可具有多种名称,例如移动台、移动装置、移动单元,移动电话、远程站、远程终端机、远程单元、用户装置、用户设备、手持式装置等。不同用户的设备可并入一个系统中。用户的设备可为移动的或固定的,且可分散遍及一个通信网络。
请参考图1,本发明提供的基于大数据的用户隐私保护方法,包括:
基于第一图像获得包含人体的热点区域信息;
基于热点区域信息获得热点区域的类别;
基于热点区域的类别获取匹配的图像编码器;
使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件;
将图像解码器写入第二图像文件;
所述第二图像文件与第一图像中包含的人体信息不一致,所述第二图像文件中除人体信息外的图像和第一图像一致。
本发明针对原始的图像数据以及二次数据进行保护,通过提供混淆信息,将不一致的内容写入图像文件内,并通过图像内容的改写,实现了文件的可逆还原、和隐私信息冲突内容的添加和防伪造。
所述热点区域信息为包含人体的图像区域和人体信息类别的对应关系,特别是具有典型识别价值的区域信息。
在本发明的若干实施例内,所述热点区域信息包括人物的面部信息和皮肤信息,以及含有这些信息的图像区域。通过对此类人体相关的生物信息识别可以获得和人物关联的身份信息。
所述的面部信息可以用于人的区分,在对人的面部进行风格迁移后,人物的辨识度会降低。人脸的识别是通过人脸识别模型进行的,在进行人脸识别前,可以对图片进行分割,例如采用100*100的尺寸,对输入的图像进行分割,该分辨率可以满足人脸识别最小分辨率。
所述的人脸识别模型通过对大量数据进行训练获得,如通过下述的方式获得:
获取第一人脸图像样本和对应的标签,其中人脸图像具有不同的角度,对应的标签用于区分角度;
获取第二人脸图像样本和对应的标签,其中人脸图像具有不同的露出比例,对应的标签用于区分露出比例;
获取第三人脸图像样本和对应的标签,其中人脸图像具有不同的分辨率,对应的标签用于区分分辨率;
获取第四人脸图像样本和对应的标签,其中人脸图像具有不同的情绪,对应的标签用于区分情绪;
获取第五人脸图像样本和对应的标签,其中人脸图像具有不同的年龄,对应的标签用于区分年龄;
对卷积神经网络进行训练,获得可用于识别人脸的模型,并基于对本地分割后的图像识别获得的标签进行。
由于本发明的目标是对原始的第一图像依据差异信息进行改写,因此,使用基于云端训练的超大参数模型显然可以满足本发明的需求,但是其对用户端本地的需求过高,而针对隐私保护的需求,避免将客户的资源全部或者部分在脱离用户端进行处理,我们选用了具有代表性的图像编码器进行处理,即在本地获取和用户相关的信息,之后基于同类别下不同分类信息和对应的图像解码器对图像进行风格的迁移。
所述图像编码器可以根据关键字进行选取,在进行关键字选取时,一个图像编码器和一个以上的关键字进行关联,通过检索关键字以获得预训练的图像编码器。
所述预训练的图像编码器为在服务器侧基于对具有近似风格的图片进行机器学习获得,获得图像编码器用于对图片进行风格迁移。
通过上述的方式训练神经网络,实现对于图片的分类。
根据图片的分类,可以获得一个图像是否包含热点区域以及热点区域的类别;
例如,针对第一人脸图像数据集,其对应的角度包括上、左、右、低头、仰头等一级标签,以及依据具体角度划分得到的二级标签;
针对第二人脸图像数据集,包含未遮挡、下半部遮挡、左侧遮挡,以及依据具体遮挡面积比例得到的二级标签,二级标签包括的遮挡比例包括0%-50%,选用的划分步长可以为5%;
针对第三人脸图像数据集,对应的标签包括高清晰度、普通清晰度和低清晰度,清晰度可以按照关键部分占像素点进行定义;
针对第四人脸图像数据集,对应的标签包括微笑、开心、悲伤、尴尬、生气等;
获取第五人脸图像数据集,其对应的标签包括婴儿、小儿、儿童、青年、中年和老年。
在进行热点区域信息的获取时,可以将第一图像分割为若干个尺寸相等的图像,分别对图像进行识别,如果图像内包括人脸,则该子图像包含热点区域信息,进而可以得到含有热点区域信息的子图像集合,以及集合中的子图像对应的热点区域的类别信息。
上述的热点区域针对人面部设置的,通过改变数据源可以提供针对其他人体部位的识别模型,例如身体姿态、表面裸露的皮肤等,并提供近似的类别信息。一个分割后的子图像可以包括多个类别,多个图像可以对应一个类别。
如一张图片,其可能包含人物子图像的热点区域占比在5%-8%之间,或者更低,在对图像进行分割后,明显提升了识别的速度。
在本发明的一个实施例内,所述热点区域类别为包含人体的图像区域所关联的人体信息类别的标签,所述基于热点区域信息获得热点区域的类别包括:根据包含人体的图像区域和人体信息类别的对应关系,获取包含人体的图像区域,基于人体信息类别获得人体图像区域对应人体信息类别的标签;在一个图像区域对应了多个人体信息类别时,择一使用人体信息类别对应的标签作为图像区域的人体信息类别的标签。例如通过一个标签可以获得分割后包含“纹身”、“皮肤”和“毛发”三个标签时,选择皮肤作为该图像区域的标签,通过对所有图像区域进行依次遍历,从而可以获得一系列的对应关系,此即为热点区域类别。
在获得热点区域的类别后,可以基于本地预置的模型或者服务器根据标签匹配的模型进行匹配的图像编码器的获取。此处的匹配的图像编码器和图像区域具有共同的标签。例如,原始图像是包含皮肤,且皮肤上不包含印记,获取的图像编码器为对皮肤进行风格迁移,如进行皮肤修饰物的添加以及纹理的改变。此处存在两种可能性,第一种可能性是匹配图像编码器和目标图像区域具有完全一致的标签,例如一个区域识别为“纹身”和“梅花”,那么直接使用预置的可以进行纹身风格迁移的图像编码器,即同时具备“纹身”和“梅花”,由于原图像和图像编码器风格完全一致的可能性极小,因此可以直接进行风格转换,而不涉及处理前后图像风格完全一致的无效处理;第二种可能性是匹配图像编码器和目标图像区域不具有完全一致的标签,例如一个区域识别为“纹身”,其在数据库内对应了如“梅花”、“杜鹃”多个编码器,那么直接使用任一的可以进行纹身风格迁移的图像编码器,由于原图像和图像编码器风格不完全一致,因此可以直接进行风格转换,而无需考虑无效处理的可能性。
请参考图2,在本发明的另外的一些实施例内,具体涉及图像编码器获取包括如下的步骤:
101)对第一图像分割获得了m个子图像;
102)遍历m个子图像,根据热点区域信息的识别结果,即在子图像包括人体信息时,根据子图像对应的人体信息的类别,获得对应的图像分类器;此处的图像分类器用于对图像进行进一步的细分,以获得分类标签,在此处表述为第一标签;第一标签和图像分类器对应设置,在子图像对应了多个热点区域信息的分类结果,例如包含面部和手,则其获得两类不同的图像分类器;
103)基于图像分类器对子图像进行分类,获得第一分类和其归属的第一类别;以面部的分类器为例,使用预训练面部标签的分类器可以获得面部表情的分类,如“高兴”、“悲伤”、“兴奋”,一个子图像被归属到其中的一类,该类别(如“高兴”的标签)为第一分类(对应于表情);
104)获取和子图像对应的第二分类和图像编码器,其中,第二分类属于第一类别,且不同于第一分类,所述图像编码器用于生成子图像的风格迁移图像;即一个图像编码器用于将一个风格的图像转为第二个风格的图像,例如一个图像编码器实现将一个面部表情转换为另外的表情,此过程的实现依赖于面部关键特征点的转换实现。
在本发明中,所述的大数据模型为预训练的模型,所述的预训练为根据原始数据集进行训练的用于将部分涉及人体信息的图像进行风格转换,并提供可接受的转换结果。
转换过程包括:通过公开数据集获得多组图像,每组图像都具有标签,对网络进行训练时,主要基于提供目标图片,用于形成编码器,将所述目标图片输入预先训练的卷积神经网络,所述卷积神经网络用于提取图像特征;
将所述卷积神经网络中至少一个卷积层输出的矩阵,作为所述待处理图片的内容特征;所述训练好的卷积神经网络可以对输入图像进行风格转换,定义损失函数欧式距离为风格的距离,即目标图像经过编码器所提取的特征与输出的图之间的欧氏距离损失,通过最小化欧氏距离来实现风格的转换。
在进行转换时,由于所处理的对象具有近似的标签,从而使得,在原图和目标风格质检转换通过有限次的转换即可实现。
已有国产开源的项目如飞桨提供了模型的训练和优化套件,上述的方案可以参考相应的开发文档。
所述的训练可以于GPU、CPU或者专用芯片上进行,通过训练来获取可用的模型,在通过对模型进行压缩,提供的模型可以在用户侧进行图片的压缩。
本发明针对的图像为小尺寸的图像,其降低了计算机处理的负荷。对于个人计算机,在显存满足2G时,已经可以较快的实施一些风格变化图像的生成。而本发明的应用场景并不是从关键字或者上下文获取一个全新的图像,而是在现有图像基础上形成新的风格的图像,基于此图像的关注点进行新的局部区域的重绘,绘图区域的大小和模型大小均和目前的AIGC有较大的差异,且所处理的图像分辨率均较低,因此,对应硬件和CPU的要求较低。
当由本地发起执行替代热点区域信息的请求时,服务器返回对应的训练好的模型;而由本地发起包含替代热点区域信息的请求时,服务器接受的参数可能为多个特征序列A,对特征序列A进行解析,并在数据库内检索获得同一类别下不同分类的人体信息标签,并返回训练好的模型。
客户端在接收到服务器返回的用于对图像进行编码的训练好的模型,基于选用的图像编码器对图像进行处理,从而实现改变图像的实际呈现效果。
所述第二图像为在画布上对第一图像进行重绘获得,在完成重绘后,隐私信息在一定程序上被消除。将原始图像和第二图像进行对比,可以获得一个差值图像,基于此图像可以实现对于第二图像向第一图像的还原。
所述的差值图像可以被写入图像内,在图像被攻击后,如果差值图像丢失,则图像无法被还原,进而防止了真实图像的泄露。
根据本发明的一个实施例,所述基于第一图像获得包含人体的热点区域信息包括:
对第一图像进行分割,对分割后的子图像的内容进行识别,获得包含人体的子图像以及子图像中所包含人体信息的类别。
在使用图像的内容进行识别获得用户信息时,基于对图像进行分割,并针对分割后的图像使用预制的模型进行匹配,对于常规图像,如4k、8k图像的识别需要消耗大量的资源,但是对于小尺寸的图像,例如100*100,并通过选择常用的场景以缩小计算任务的量,在个人计算机侧不依赖较高的算力即可以实现上下文信息的提取。
其具体可以包括,基于图像分割获取的若干个图像对象,遍历分割得到的若干个图像对象,使用预置的分类模型对子图像进行分类,在子图像的分类结果包含和人物相关信息时,则该区域为热点区域,包含用户信息,分类得到的类别为热点区域的类别。
根据本发明的一个实施例,所述基于热点区域的类别获取匹配的图像编码器具体包括:
在子图像包括人体信息时,获取子图像对应的人体信息的类别,获得对应的图像分类器;
基于图像分类器对子图像进行分类,获得第一分类和其归属的第一类别;
获取和子图像对应的第二分类和图像编码器,其中,第二分类属于第一类别,且不同于第一分类,所述图像编码器用于生成子图像的风格迁移图像。
根据本发明的一个实施例,所述使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件包括:
遍历分割后的子图像,对包含人体信息的子图像使用对应的图像编码器进行编码,得到风格迁移后的子图像;
合并未修改的子图像和编码后的子图像,获得第二图像文件。
在本发明的一个实施例中,一个图像被分割若干个100*100像素区域的图像,对于尺寸不满足此尺寸大小的图像不进行处理,例如对于一个5000万像素的相机,图像传感器获得图像分辨率为8192*6144,对其分割可以获得81*61个图像尺寸为100*100像素的区域,这些子图片将会被分析以获得推测的热点区域信息。
客户端可以配置为保存若干常用的用于推测常见热点区域的分类模型,例如上文提及的针对面部、肢体、皮肤和姿态的预训练的神经网络模型,所述的预训练为在服务器端训练,并在本地部署使用,预训练模型时,对于准确度的需求可以降低,以降低资源的消耗,使得分类过程可以在客户端被执行。
匹配的图像编码器可以基于用户的配置、指示获得或者自动获得, 从而实现根据不同关注热点区域的风格迁移。
基于用户的配置获得时,可以在一个可执行程序的配置文件内设置常用的热点区域分类模型,并使得其中部分或者全部热点区域分类模型是使能的状态,根据当前使能的热点区域分类模型生成热点区域分类模型列表,对第一图像进行分割,获得待分类的图像列表M,遍历待分类的图像列表中的每一张图像Mi∈M,使用热点区域分类模型列表包含的热点区域分类模型对图像Mi进行分类,如果存在对应的热点区域分类则加入图像Mi对应的标签列表,并得到和每一张图像Mi对应的热点区域标签列表,所述的标签在本地的SQLite数据库内和一个类别对应,在本地数据库内进行检索,获得标签所属的类别,根据标签所属的类别获得不同的分类和对应的图像编码器;分别对每一张图像Mi使用图像编码器进行编码,从而第一图像中的内容被替换,得到和第一图像原始内容不一致呈现的第二图像文件;在应用编码过程中,每一张图像Mi被替代热点区域信息对应的编码器进行编码,得到风格迁移的新图像。
上述的执行方法也可以更改为基于用户的指示获得,可以在一个可执行程序的配置文件内设置常用的热点区域分类模型,并使得其中部分或者全部热点区域分类模型是使能的状态,根据当前使能的上下文提示选择选用一个或者多个热点区域分类模型,并获取用户选择的模型生成热点区域分类模型列表,对第一图像进行分割,获得待分类的图像列表M,遍历待分类的图像列表中的每一张图像Mi∈M,使用上下文获取模型列表包含的热点区域分类模型对图像Mi进行分类,如果存在对应的分类则加入图像Mi对应的标签列表,并得到和每一张图像Mi对应的标签列表,基于上下文标签列表可以获得标签和标签的数目,所述的标签和一个类别对应,在本地数据库内进行检索,获得标签所属的类别,根据标签所属的类别获得不同的分类和对应的图像编码器;分别对每一张图像Mi使用图像编码器进行编码,从而第一图像中的内容被替换,得到和第一图像原始内容不一致呈现的第二图像文件;在应用编码过程中,每一张图像Mi被热点区域信息对应的编码器进行编码,得到风格迁移的新图像。
上述的执行方法也可以更改为基于自动匹配获得,可以在一个可执行程序的配置文件内设置常用的热点区域分类模型,并通过更新或者用户手工下载的方式维护本地的模型,并使得其中部分或者全部热点区域分类模型是使能的状态或者全部使能,获取所有使能的模型得到分类模型列表,对第一图像进行分割,获得待分类的图像列表M,遍历待分类的图像列表中的每一张图像Mi∈M,使用上下文获取模型列表包含的热点区域分类模型对图像Mi进行分类,如果存在对应的分类则加入图像Mi对应的标签列表,并得到和每一张图像Mi对应的热点区域标签列表,基于热点区域标签列表可以获得标签和标签的数目,所述的标签在本地的SQLite数据库内和一个以上的编码器对应,在本地数据库内进行检索,获得标签,标签至少和一个类别对应,在本地数据库内进行检索,获得标签所属的类别,根据标签所属的类别获得新的标签和对应的图像编码器,该新的标签可以和提供的标签一致,也可以不一致;分别对每一张图像Mi使用编码器进行编码,从而第一图像中的内容被替换,得到和第一图像原始内容不一致呈现的第二图像文件;在应用编码过程中,每一张图像Mi被替代热点区域信息对应的编码器进行编码,得到风格迁移的新图像。
根据本发明的一个实施例,在使用匹配的图像编码器对子图像进行编码前,判断子图像是否发生了内容变更;
在子图像发生了内容变更,且内容变更后的子图像和图像编码器匹配时,对更新后的子图像进行编码;
所述内容变更后的子图像和图像编码器匹配为变更后的子图像包含人体信息的类别和待使用的图像编码器匹配。
如一个图像编码器为基于第一表情获得表情类别中区分于第一表情的第二表情,并获得和第二表情对应的图像编码器,具体如一个面部表情为“高兴”时,基于第一表情“高兴”所述的表情类别获得第二表情“忧伤”,选择和第二表情忧伤对应的图像编码器进行编码。在使用图像编码器处理子图像时,如果使用热点区域分类模型对修改后的子图像分类得到的类别和第二表情以及其所属的表情类别存在差异,则不使用图像编码器对子图像进行处理,以提高处理速度和避免图像风格的明显变更。
通过此方式可以避免在存在多个图像编码器时,因在先的风格迁移的图像引起了上下文发生了明显变化时,使用在后的图像编码器对图像进行编码时造成图像明显不一致的缺点。
此时对于图像的遍历风格转换步骤具体可为:
对第一图像进行分割,获得待分类的图像列表M,遍历待分类的图像列表中的每一张图像Mi∈M,使用热点区域分类模型列表包含的热点区域分类模型对图像Mi进行分类,如果存在对应的分类则加入图像Mi对应的标签列表,并得到和每一张图像Mi对应的标签列表,基于标签列表可以获得第一组标签和标签的数目,所述的标签在本地的SQLite数据库内和一个编码器对应,根据标签所属的类别获得该类别下不同于第一组标签的第二组标签,以及属于第二组标签的图像编码器,获得和每一张图像Mi对应的图像编码器列表;
每一张图像Mi使用替图像编码器进行编码,在进行编码前,判断子图像Mi是否被更改,如果未更改,应用编码器,子图像Mi被编码器进行编码,得到风格迁移的新图像;如果子图像Mi已经被更改,获取当前待应用的编码器对应的k个标签类别N={N1,N2,N3...Nk},使用热点区域分类模型对图像Mi进行分类,在分类结果包含N中的元素时,对该子图像进行编码;遍历所有的子图像直至所有的子图像被替换为风格迁移的图像。应注意,不是所有的子图像都会被处理,因此,不是所有的子图像都会被应用编码器进行转码。
在合并所有修改后的子图像和未修改的图像后,得到了第二图像文件,第二图像文件被存储到二进制流、易失性内存或者本地的持久性存储器。
根据本发明的一个实施例,所述图像解码器存储于第二图像文件的末尾。
本发明中图像解码器可以和图片一起被存储,或者被单独的存储。在被单独的存储时,可以避免暴力破解的风险,在和图片一起被保存时,可以避免解码器丢失的风险。
由于图像文件的多数协议格式中,数据的长度在文件头中被规定。在数据长度后的内容不会被解析,因此可以通过此方式将解码器保存在图片文件内。
在本发明的一个实施例中,所述图像解码器为替换前的子图像,在进行图像还原时,将相应的图像写入对应位置即可获得原始图像。
在本发明的另外一个实施例中,所述图像解码器为替换后子图像Mi'和原子图像Mi的RGB值的差值矩阵,在进行图像还原时,将相应的图像对应位置的rgb值分别和解码器进行加和即可以获得原始图像。
在本发明的一个实施例中,所述图像解码器为替换后子图像Mi'和原子图像Mi的RGB值的差值矩阵,通过对图像进行尺寸变换,并进行重绘去除隐藏信息,得到的图像无法通过原始的解码器还原。即在一个程序执行预期外的图像操作时,由于发生了对原始内容的攻击,图像的真实信息会被消除。
根据本发明的一个实施例,所述将图像解码器写入第二图像文件包括:
在保存图像解码器时,使用用户提供的凭据对图像解码器进行压缩。
通过此方式可以避免用户外的操作者对数据进行还原。压缩使用的算法应用于经重新布置的解码器序列,使用诸如LZMA、bzip2、Snappy、Gzip、Lempel-Ziv-Oberhumer(LZO)等编码器进行。
进行压缩时,可以通过提示用户使用凭据,例如输入密文来实现加密存储图像解码器。
用户提供的密钥可是固定的,用户可以基于固定密钥对加密的图像进行解密,固定的密钥可以被凭据管理器所储存。
在执行解密时,从图像文件的文件头读取文件的有效图像数据长度,在图像数据后的区域为解码器区域,根据加密后的二进制文件的头获取加密信息,并通过API对其进行解密获得原始的信息。
根据本发明的一个实施例,基于大数据的用户隐私保护系统,该系统包括:
热点区域获取单元,用于基于第一图像获得包含人体的热点区域信息;
热点区域类别获取单元,用于基于热点区域信息获得热点区域的类别;
图像编码器获取单元,用于基于热点区域的类别获取匹配的图像编码器;
第二图像生成单元,用于使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件,以及将图像解码器写入第二图像文件;
所述第二图像文件与第一图像中包含的人物信息不一致,所述第二图像文件中除人物信息外的图像和第一图像一致。
根据本发明的一个实施例,基于大数据的用户隐私保护系统,该系统还包括:
解码器获取单元,用于从图像文件获得压缩后的图像解码器;
解码器解压单元,用于根据用户的凭据获得解压后的图像解码器;
图像还原单元,用于根据解压后的图像解码器对第二图像文件进行还原获得原始图像。
请参考图3,其可以实现从图像文件获得压缩后的图像解码器,即在获取图像文件头信息后,在图像对应的数据后得到的二进制数据记为压缩后的图像解码器;以及根据用户的凭据获得解压后的图像解码器,此过程可以通过编程或者图形界面的形式进行;以及根据解压后的图像解码器和第二图像中对应像素的叠加获得原始的图像。
在本发明的一个实施例中,首先根据图像的头信息获得图像数据文件的长度,并根据数据文件的起始偏移和获得压缩后的解码器;如果压缩后的解码器长度为0,则代表原始数据已经被更改,无法还原;
解码器解压单元,用于根据用户的凭据获得解压后的图像解码器;由于不同的压缩文件具有不同的文件头,如7z固定为0x377A,首先尝试无密码的情况下进行解压,如果解压失败,则提示用户输入凭据;输入凭据方式为通过对话框或者选择文件的方式进行;
图像还原单元,用于根据解压后的图像解码器对第二图像文件进行还原获得原始图像;在进行还原时,使用解压后的图像解码器,在对应的位置分别和图像解码器包含的矩阵中的值相加减,从而使图像被还原。
已依据计算机存储器内的数据位的操作的算法和符号表示呈现了先前详细描述的一些部分。这些算法描述和表示是数据处理领域的技术人员用以将其工作的主旨最有效地传达给所属领域的其他技术人员的方式。算法在这里并且通常被认为是引起所要结果的操作的自洽序列。操作是要求对物理量进行物理操纵的操作。这些量通常但未必呈能够被存储、组合、比较和以其它方式操纵的电或磁信号的形式。主要出于常见使用的原因,有时将此些信号称为位、值、要素、符号、字符、项、数字等已证实是方便的。
然而,应牢记,所有这些和类似术语应与适当物理量相关联,且仅是应用于这些量的方便的标签。本公开可参考将表示为计算机系统的寄存器和存储器内的物理(电子)量的数据操纵和变换为类似地表示为计算机系统存储器或寄存器或其它此类信息存储系统内的物理量的其它数据的计算机系统或类似电子计算装置的动作和过程。
本公开还涉及一种用于执行本文中的操作的设备。此设备可以出于既定目的而专门构造,或其可包含由存储在计算机中的计算机程序选择性地激活或重新配置的通用计算机。此计算机程序可存储在计算机可读存储媒体中,例如(但不限于)任何类型的盘(包含软盘、光盘、CD-ROM和磁光盘)、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁卡或光卡,或适合于存储电子指令的任何类型的媒体,它们各自耦合到计算机系统总线。
本文中呈现的算法和显示并不与任何特定计算机或其它设备在本质上相关。各种通用系统可根据本文中的教示与程序一起使用,或可证明构造更专用的设备来执行所述方法是方便的。将如下文描述中所阐述的那样来呈现多种这些系统的结构。另外,不参考任何特定编程语言来描述本公开。应了解,可使用多种编程语言来实施本文中所描述的本公开的教示。
本公开可以提供为计算机程序产品或软件,其可包含在其上存储有指令的机器可读媒体,所述指令可以用于编程计算机系统(或其它电子装置)以执行根据本公开的过程。机器可读媒体包含用于以机器(例如,计算机)可读的形式存储信息的任何机制。在一些实施例中,机器可读(例如,计算机可读)媒体包含机器(例如,计算机)可读存储媒体,例如只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储媒体、光学存储媒体、快闪存储器组件等。
在以上说明书中,本公开的实施例已经参考其特定的实例实施例进行描述。将显而易见的是,可以在不脱离如所附权利要求书中阐述的本公开的实施例的更广精神和范围的情况下对本公开做出各种修改。因此,应在说明性意义上而非限制性意义上看待说明书和图式。

Claims (8)

1.一种基于大数据的用户隐私保护方法,其特征在于,包括:
基于第一图像获得包含人体的热点区域信息;
基于热点区域信息获得热点区域的类别;
基于热点区域的类别获取匹配的图像编码器;
使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件;
将图像解码器写入第二图像文件;
所述第二图像文件与第一图像中包含的人体信息不一致,所述第二图像文件中除人体信息外的图像和第一图像一致。
2.如权利要求1所述的基于大数据的用户隐私保护方法,其特征在于,所述热点区域信息为包含人体的图像区域和人体信息类别的对应关系,所述基于第一图像获得包含人体的热点区域信息包括:
对第一图像进行分割,对分割后的子图像的内容进行识别,获得包含人体的子图像以及子图像中所包含人体信息的类别。
3.如权利要求2所述的基于大数据的用户隐私保护方法,其特征在于,所述基于热点区域的类别获取匹配的图像编码器具体包括:
在子图像包括人体信息时,根据子图像对应的人体信息的类别,获得对应的图像分类器;
基于图像分类器对子图像进行分类,获得第一分类和其归属的第一类别;
获取和子图像对应的第二分类和图像编码器,其中,第二分类属于第一类别,且不同于第一分类,所述图像用编码器用于生成子图像的风格迁移图像。
4.如权利要求3所述的基于大数据的用户隐私保护方法,其特征在于,所述使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件包括:
遍历分割后的子图像,对包含人体信息的子图像使用对应的图像编码器进行编码,得到风格迁移后的子图像;
合并未修改的子图像和编码后的子图像,获得第二图像文件。
5.如权利要求4所述的基于大数据的用户隐私保护方法,其特征在于,在使用匹配的图像编码器对子图像进行编码前,判断子图像是否发生了内容变更;
在子图像发生内容变更,且内容变更后的子图像和图像编码器匹配时,对更新后的子图像进行编码;
所述内容变更后的子图像和图像编码器匹配为变更后的子图像包含人体信息的类别和待使用的图像编码器匹配。
6.如权利要求1所述的基于大数据的用户隐私保护方法,其特征在于,所述图像解码器存储于第二图像文件的末尾。
7.如权利要求6所述的基于大数据的用户隐私保护方法,其特征在于,所述将图像解码器写入第二图像文件包括:
在保存图像解码器时,使用用户提供的凭据对图像解码器进行压缩。
8.一种基于大数据的用户隐私保护系统,其特征在于,包括:
热点区域获取单元,用于基于第一图像获得包含人体的热点区域信息;
热点区域类别获取单元,用于基于热点区域信息获得热点区域的类别;
图像编码器获取单元,用于基于热点区域的类别获取匹配的图像编码器;
第二图像生成单元,用于使用图像编码器处理第一图像,获取具有和第一图像不一致内容呈现的第二图像文件,以及将图像解码器写入第二图像文件;
所述第二图像文件与第一图像中包含的人物信息不一致,所述第二图像文件中除人物信息外的图像和第一图像一致。
CN202311127032.3A 2023-09-04 2023-09-04 一种基于大数据的用户隐私保护方法和系统 Active CN117195286B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311127032.3A CN117195286B (zh) 2023-09-04 2023-09-04 一种基于大数据的用户隐私保护方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311127032.3A CN117195286B (zh) 2023-09-04 2023-09-04 一种基于大数据的用户隐私保护方法和系统

Publications (2)

Publication Number Publication Date
CN117195286A true CN117195286A (zh) 2023-12-08
CN117195286B CN117195286B (zh) 2024-05-07

Family

ID=89004577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311127032.3A Active CN117195286B (zh) 2023-09-04 2023-09-04 一种基于大数据的用户隐私保护方法和系统

Country Status (1)

Country Link
CN (1) CN117195286B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642409A (zh) * 2021-07-15 2021-11-12 上海交通大学 一种人脸匿名化系统及方法、终端
CN113793254A (zh) * 2021-09-07 2021-12-14 中山大学 人脸图像属性编辑方法、系统、计算机设备及存储介质
CN114139198A (zh) * 2021-11-29 2022-03-04 杭州电子科技大学 基于层次k匿名身份替换的人脸生成隐私保护方法
WO2022237081A1 (zh) * 2021-05-14 2022-11-17 北京市商汤科技开发有限公司 妆容迁移方法、装置、设备和计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022237081A1 (zh) * 2021-05-14 2022-11-17 北京市商汤科技开发有限公司 妆容迁移方法、装置、设备和计算机可读存储介质
CN113642409A (zh) * 2021-07-15 2021-11-12 上海交通大学 一种人脸匿名化系统及方法、终端
CN113793254A (zh) * 2021-09-07 2021-12-14 中山大学 人脸图像属性编辑方法、系统、计算机设备及存储介质
CN114139198A (zh) * 2021-11-29 2022-03-04 杭州电子科技大学 基于层次k匿名身份替换的人脸生成隐私保护方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩胜杰;张义;葛涵涛;: "人脸图片伪造和鉴伪技术研究", 信息通信技术与政策, no. 07 *

Also Published As

Publication number Publication date
CN117195286B (zh) 2024-05-07

Similar Documents

Publication Publication Date Title
JP7002404B2 (ja) データから潜在因子を発見するニューラルネットワーク
Yang et al. Towards coding for human and machine vision: Scalable face image coding
CN108765261B (zh) 图像变换方法和装置、电子设备、计算机存储介质
CN110738203B (zh) 字段结构化输出方法、装置及计算机可读存储介质
CN112418292B (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN116993864A (zh) 一种图像生成方法、装置、电子设备及存储介质
US11887277B2 (en) Removing compression artifacts from digital images and videos utilizing generative machine-learning models
CN117195286B (zh) 一种基于大数据的用户隐私保护方法和系统
CN114821811B (zh) 人物合成图像生成方法、装置、计算机设备及存储介质
CN113538214B (zh) 一种妆容迁移的控制方法、系统和存储介质
US11917142B2 (en) System for training and deploying filters for encoding and decoding
CN113239190B (zh) 文档分类方法、装置、存储介质及电子设备
CN114627211A (zh) 视频名片生成方法、装置、计算机设备和存储介质
CN113190858B (zh) 一种基于隐私保护的图像处理方法、系统、介质和设备
CN117150551B (zh) 基于大数据的用户隐私保护方法和系统
CN110321802B (zh) 面部图像生成方法和装置、存储设备和电子设备
Fan et al. Facial expression animation through action units transfer in latent space
CN116740540B (zh) 一种数据处理方法、装置、设备以及计算机可读存储介质
CN112966150A (zh) 一种视频内容抽取的方法、装置、计算机设备及存储介质
CN110930333A (zh) 图像修复方法、装置、电子设备及计算机可读存储介质
CN117710986B (zh) 一种基于掩码的交互式增强图像文本识别的方法及系统
Sagayaraj et al. A Study on Novel Method of Facial Image Compression Using Master Code
US20240169701A1 (en) Affordance-based reposing of an object in a scene
CN117649358B (zh) 图像处理方法、装置、设备及存储介质
CN111105447B (zh) 一种基于局部处理的屏幕图像传递方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240412

Address after: No. 1602, 16th Floor, Unit 2, No. 22 Business Outer Ring Road, Zhengzhou City (Zhengdong), Henan Province, 450000

Applicant after: Henan CITIC Big Data Technology Co.,Ltd.

Country or region after: China

Address before: Unit 604, Unit 601, 5th Floor, Building 2, Courtyard 5, Guanghua Road, Chaoyang District, Beijing, 100020

Applicant before: Beijing Chaoran Lili Network Technology Co.,Ltd.

Country or region before: China

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant