CN114463168A - 数据脱敏处理的方法、装置和电子设备 - Google Patents
数据脱敏处理的方法、装置和电子设备 Download PDFInfo
- Publication number
- CN114463168A CN114463168A CN202210130586.8A CN202210130586A CN114463168A CN 114463168 A CN114463168 A CN 114463168A CN 202210130586 A CN202210130586 A CN 202210130586A CN 114463168 A CN114463168 A CN 114463168A
- Authority
- CN
- China
- Prior art keywords
- target
- target detection
- detection frame
- region
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000586 desensitisation Methods 0.000 title claims abstract description 179
- 238000003672 processing method Methods 0.000 title description 8
- 238000012545 processing Methods 0.000 claims abstract description 120
- 238000000034 method Methods 0.000 claims abstract description 71
- 238000001514 detection method Methods 0.000 claims description 372
- 239000003086 colorant Substances 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 14
- 238000005516 engineering process Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 5
- 210000000887 face Anatomy 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种数据脱敏处理的方法、装置和电子设备。其中,该方法包括:获取源图像数据;对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域;至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域;对脱敏区域中的图像数据进行脱敏处理。本申请解决了相关技术中采用深度学习算法对自动驾驶数据中的人脸、车牌等隐私数据进行脱敏处理存在召回率不足的技术问题。
Description
技术领域
本申请涉及自动驾驶领域,具体而言,涉及一种数据脱敏处理的方法、装置和电子设备。
背景技术
随着社会对个人隐私保护的关注越来越高,自动驾驶数据在合规使用前,需要进行脱敏处理。这其中,图片、视频等非结构化数据的大小占到自动驾驶数据总量的95%以上,对这些非结构化数据的人脸、车牌处理成为隐私保护不可或缺的环节。
目前非结构化数据脱敏处理的技术较为普遍,有较为成熟的深度学习算法模型可供使用。但完全基于深度学习算法对人脸、车牌进行脱敏,存在召回率不足的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种数据脱敏处理的方法、装置和电子设备,以至少解决相关技术中采用深度学习算法对自动驾驶数据中的人脸、车牌等隐私数据进行脱敏处理存在召回率不足的技术问题。
根据本申请实施例的一个方面,提供了一种数据脱敏处理的方法,包括:获取源图像数据;对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域;至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域;对脱敏区域中的图像数据进行脱敏处理。
可选地,目标对象包括:第一对象和第二对象,且第一对象和第二对象之间具有关联关系;对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,包括:在第一对象为行人的情况下,对目标对象中行人的人脸图像进行检测,并输出第一目标检测框,将第一目标检测框作为与第一对象对应的第一类区域,其中,第一目标检测框为覆盖第一对象的人脸信息的最小外接框;或,在第二对象为车辆的情况下,对车辆的车牌区域进行检测,并输出第二目标检测框,将第二目标检测框作为与第二对象对应的第一类区域,其中,第二目标检测框为覆盖车辆的车牌信息的最小外接框。
可选地,对车辆的车牌区域进行检测,包括:通过基于包括不同颜色的测试集训练得到的测试模型,对不同颜色的车牌区域进行检测。
可选地,在以下之一情况下确定第一对象和第二对象具有关联关系:第一对象和第二对象为目标车辆所处行驶环境中的行人和目标车辆所处环境中的周围车辆;第一对象和第二对象为目标车辆中的乘客和目标车辆所处行驶环境中的周围车辆。
可选地,在第一对象为行人的情况下,对目标对象中行人的人脸图像进行检测,并输出第一目标检测框,包括:确定第一目标检测框在垂直方向上的第一长度,以及在水平方向上的第二长度,当第一长度和第二长度满足第一预设条件时,输出第一目标检测框。
可选地,第一预设条件为第一长度大于或等于第一目标数量的像素,第二长度大于或等于第二目标数量的像素,其中,第一目标数量和第二目标数量均为16至40之间的任意一个值。
可选地,在第二对象为车辆的情况下,对车辆的车牌区域进行检测,并输出第二目标检测框,包括:确定第二目标检测框在垂直方向上的第三长度,以及在水平方向上的第四长度,当第三长度和第四长度满足第二预设条件时,输出第二目标检测框。
可选地,第二预设条件为第三长度大于或等于第三目标数量的像素,第四长度大于或等于第四目标数量的像素,其中,第三目标数量为10至20之间的任意一个值,第四目标数量为20至40之间的任意一个值。
可选地,对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,包括:在第一对象为行人的情况下,对目标对象中的行人轮廓进行检测,并输出第三目标检测框,将第三目标检测框作为与第一对象对应的第二类区域,其中,第三目标检测框为包括行人轮廓的最小外接框;或,在第二对象为车辆的情况下,对车辆的车辆轮廓进行检测,并输出第四目标检测框,将第四目标检测框作为与第二对象对应的第二类区域,其中,第四目标检测框为包括整个车辆的最小外接框。
可选地,在第一对象为行人的情况下,对目标对象中的行人轮廓进行检测,并输出第三目标检测框,包括:确定第三目标检测框在垂直方向上的第五长度,以及在水平方向上的第六长度,当第五长度和第六长度满足第三预设条件时,输出第三目标检测框。
可选地,第三预设条件为第五长度大于或等于第五目标数量的像素,第六长度大于或等于第六目标数量的像素,其中,第五目标数量为60至120之间的任意一个值,第六目标数量为30至60之间的任意一个值。
可选地,在第二对象为车辆的情况下,对车辆的车辆轮廓进行检测,并输出第四目标检测框,包括:确定第四目标检测框在垂直方向上的第七长度,以及在水平方向上的第八长度,当第七长度和第八长度满足第四预设条件时,输出第四目标检测框。
可选地,第四预设条件为第七长度大于或等于第七目标数量的像素,第八长度大于或等于第八目标数量的像素,其中,第七目标数量和第八目标数量均为80至120之间的任意一个值。
可选地,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域,包括:在源图像数据中存在第一目标检测框和第三目标检测框的情况下,将第一目标检测框对应的区域作为脱敏区域;在源图像数据中存在第一目标检测框,不存在第三目标检测框的情况下,将第一目标检测框对应的区域作为脱敏区域;在源图像数据中不存在第一目标检测框,存在第三目标检测框的情况下,对第三目标检测框进行处理,将处理后得到的区域作为脱敏区域;在源图像数据中不存在第一目标检测框和第三目标检测框的情况下,拒绝输出脱敏区域。
可选地,对第三目标检测框进行处理,将处理后得到的区域作为脱敏区域,包括:将第三目标检测框的上边框固定,将其他三条边框按照第一预设比例压缩,将压缩后的第三目标检测框对应的区域作为脱敏区域。
可选地,将其他三条边框按照第一预设比例压缩,包括:将第三目标检测框的左边框和右边框分别向内移动第一目标距离,将第三目标检测框的下边框向上移动至第二目标距离,其中,第一目标距离为第三目标检测框的上边框或第三目标检测框的下边框长度的1/4至1/2之间的任意值,第二目标距离为第三目标检测框的左边框或第三目标检测框的右边框长度的1/8至1/6之间的任意值。
可选地,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域,包括:在源图像数据中存在第二目标检测框和第四目标检测框的情况下,将第二目标检测框对应的区域作为脱敏区域;在源图像数据中存在第二目标检测框,不存在第四目标检测框的情况下,将第二目标检测框对应的区域作为脱敏区域;在源图像数据中不存在第二目标检测框,存在第四目标检测框的情况下,对第四目标检测框进行处理,将处理后得到的区域作为脱敏区域;在源图像数据中不存在第二目标检测框和第四目标检测框的情况下,拒绝输出脱敏区域。
可选地,对第四目标检测框进行处理,将处理后得到的区域作为脱敏区域,包括:以第四目标检测框的几何中心为中心点,将第四目标检测框按照第二预设比例缩放,将缩放后的第四目标检测框对应的区域作为脱敏区域。
可选地,将第四目标检测框按照第二预设比例缩放,包括:确定第四目标检测框的任意一个端点到中心点的距离为第一距离;将第四目标检测框沿端点到中心点的方向向内移动第三目标距离,其中,第三目标距离为第一距离的1/4至第一距离的1/3之间的任意值。
可选地,对脱敏区域中的图像数据进行脱敏处理,包括:将脱敏区域中的像素点随机移动;或者,将脱敏区域中的全部像素点置为目标颜色,其中,像素点的颜色为以下任意一种或多种颜色的组合:红、绿、蓝。
根据本申请实施例的另一方面,还提供了一种数据脱敏处理的装置,包括:获取模块,用于获取源图像数据;检测模块,用于对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域;确定模块,用于至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域;处理模块,用于对脱敏区域中的图像数据进行脱敏处理。
根据本申请实施例的又一方面,还提供了一种电子设备,包括:存储器,用于存储程序指令;处理器,与存储器连接,用于执行实现以下功能的程序指令:获取源图像数据;对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域;至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域;对脱敏区域中的图像数据进行脱敏处理。
在本申请实施例中,通过对源图像数据中的不同目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域,达到了依据脱敏区域对源图像数据进行脱敏处理的目的,从而实现了显著提升脱敏效率的技术效果,进而解决了相关技术中采用深度学习算法对自动驾驶数据中的人脸、车牌等隐私数据进行脱敏处理存在召回率不足的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种用于实现数据脱敏处理的方法的计算机终端(或电子设备)的硬件结构框图;
图2是根据本申请实施例的一种数据脱敏处理的方法的流程图;
图3是根据本申请实施例的图像数据的脱敏流程图;
图4a是根据本申请实施例的人脸检测示例图片;
图4b是根据本申请实施例的车牌检测示例图片;
图5a是根据本申请实施例的一种确定源图像数据中的脱敏区域的流程图;
图5b是根据本申请实施例的对第三目标检测框进行处理的示意图;
图6a是根据本申请实施例的另一种确定源图像数据中的脱敏区域的流程图;
图6b是根据本申请实施例的对第四目标检测框进行处理的示意图;
图7是根据本申请实施例的一种数据脱敏处理的架构图;
图8是根据本申请实施例的一种数据脱敏处理的装置的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了更好地理解本申请实施例,以下对本申请中涉及的术语解释如下:
数据脱敏:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。
人脸识别(Facial Recognition):就是通过视频采集设备获取用户的面部图像,再利用核心的算法对其脸部的五官位置、脸型和角度进行计算分析,进而和自身数据库里已有的范本进行比对,后判断出用户的真实身份。人脸识别技术基于局部特征区域的单训练样本人脸识别方法。第一步,需要对局部区域进行定义;第二步,人脸局部区域特征的提取,依据经过样本训练后得到的变换矩阵将人脸图像向量映射为人脸特征向量;第三步,局部特征选择(可选);后一步是进行分类。分类器多采用组合分类器的形式,每个局部特征对应一个分类器,后可用投票或线性加权等方式得到终识别结果。人脸识别综合运用了数字图像/视频处理、模式识别、计算机视觉等多种技术,核心技术是人脸识别算法。人脸识别的算法有4种:基于人脸特征点的识别算法、基于整幅人脸图像的识别算法、基于模板的识别算法、利用神经网络进行识别的算法。
Yolo算法,其全称是You Only Look Once:Unified,Real-Time ObjectDetection,其是目标检测算法的一种,只需要一次CNN运算,Unified指的是这是一个统一的框架,提供end-to-end的预测,而Real-Time体现是Yolo算法速度快。
目前,非结构化数据脱敏处理的技术较为普遍,有较为成熟的深度学习算法模型可供使用。但完全基于深度学习算法对人脸、车牌进行脱敏,存在召回率不足的问题,主要原因有两点:1.人脸、车牌在自动驾驶数据的图像中目标较小,纹理信息不足,较难进行识别;2.很多需要进行人脸、车牌脱敏的场景属于长尾场景(如人脸、车牌有部分遮挡,车牌存在黄色、红色等特殊车牌)能够用于算法训练的有效数据样本较少,无法满足高召回率的性能要求。虽然还存在人工脱敏方法,即在平台上通过人工对脱敏内容进行识别筛选,但人工脱敏的耗时较多,也无法满足大数据量下的业务时效性要求。针对上述问题,本申请实施例提供了相应的解决方案,以下详细说明。
根据本申请实施例,提供了一种数据脱敏处理的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例所提供的数据脱敏处理的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现数据脱敏处理的方法的计算机终端(或电子设备)的硬件结构框图。如图1所示,计算机终端10(或电子设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或电子设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的数据脱敏处理的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据脱敏处理的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输模块106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或电子设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或电子设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或电子设备)中的部件的类型。
在上述运行环境下,本申请实施例提供了如图2所示的数据脱敏处理的方法。图2是根据本申请实施例的一种数据脱敏处理的方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,获取源图像数据;
步骤S204,对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域;
步骤S206,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域;
步骤S208,对脱敏区域中的图像数据进行脱敏处理。
在本申请实施例中,第一类区域为局部区域,第二类区域为整体区域,具体来说,第一类区域对应人脸图像或车牌区域,可使用第一检测算法检测行人的人脸图像或车辆的车牌区域,第二类区域对应行人轮廓或车辆轮廓,可使用第二检测算法检测行人轮廓或车辆轮廓,行人轮廓中至少包括行人的人脸图像,车辆轮廓中至少包括该车辆的车牌区域,即第二类区域包括第一类区域。
在该数据脱敏处理的方法中的步骤S202中,获取源图像数据时,首先需要判断源图像数据的数据格式,在源图像数据的数据格式为目标格式时,获取源图像数据;在源图像数据的数据格式不是目标格式时,进行格式转换,得到目标格式的图像数据。
如图3所示的图像数据的脱敏流程图,在导入源图像数据后,需要先对源图像数据的数据格式进行判断,在源图像数据的数据格式为目标格式时,通过第一检测算法和第二检测算法同时检测源图像数据,并输出第一类区域和第二类区域,其中,目标格式为图片格式,目标格式包括但不限于jpg、jpeg、png等格式。在源图像数据的数据格式不是目标格式时,需进行格式转换,得到目标格式的图像数据后,再输入第一检测算法和第二检测算法中,并输出第一类区域和第二类区域,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域,对脱敏区域中的图像数据进行脱敏处理,即匿名化处理。
在导入的数据为视频数据时,先对视频格式的数据进行视频解析,该视频格式包括但不限于mp4、avi、mkv等格式,转换成目标格式的图像数据,即图片格式的图像数据,再通过第一检测算法和第二检测算法同时检测转换后的目标格式的图像数据,并输出第一类区域和第二类区域,至少依据第一类区域和第二类区域确定图像数据中的脱敏区域,对脱敏区域中的图像数据进行脱敏处理,即匿名化处理。
需要说明的是,上述整体脱敏流程在合规的私有云上进行,遵循Kafka流式处理流程,其只对脱敏内容进行匿名化处理,不改变数据本身的格式。
在该数据脱敏处理的方法中的步骤S204中,目标对象包括:第一对象和第二对象,且第一对象和第二对象之间具有关联关系;对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,具体包括如下两种情况:
在第一对象为行人的情况下,对目标对象中行人的人脸图像进行检测,并输出第一目标检测框,将第一目标检测框作为与第一对象对应的第一类区域,其中,第一目标检测框为覆盖第一对象的人脸信息的最小外接框;或,
在第二对象为车辆的情况下,对车辆的车牌区域进行检测,并输出第二目标检测框,将第二目标检测框作为与第二对象对应的第一类区域,其中,第二目标检测框为覆盖车辆的车牌信息的最小外接框。考虑到车牌存在黄色、红色等特殊车牌,因此,检测时可对不同颜色的车牌进行检测。
由于第一对象和第二对象之间具有关联关系,则在以下之一的情况下,可以确定第一对象和第二对象具有关联关系:第一对象和第二对象为目标车辆所处行驶环境中的行人和目标车辆所处环境中的周围车辆;第一对象和第二对象为目标车辆中的乘客和目标车辆所处行驶环境中的周围车辆。
在本申请实施例中,第一检测算法为人脸车牌检测算法,该算法封装在SDK(SDK即软件开发工具包)中,该算法的输入为目标格式的源图像数据或视频数据,第一检测算法包含第一算法和第二算法,第一算法即人脸检测算法,第二算法即车牌检测算法,采用深度学习的目标检测模型,输出对应的目标检测框。
人脸检测算法是基于深度学习的目标检测算法,该算法选用如RetinaFace模型进行检测,并输出bounding box(检测框)表示的第一目标检测框。通常情况下,第一目标检测框需要包含行人的人脸信息的最小外接框。
车牌检测算法是基于深度学习的目标检测算法,该算法选用人脸检测算法模型(例如RetinaFace)进行检测,并输出bounding box表示的第二目标检测框。通常情况下,第二目标检测框为覆盖车辆对应的整张车牌信息的最小外接框,同时要能支持检测蓝、绿、黄、白、黑等不同颜色的车牌。具体通过基于不同颜色的算法测试集训练得到的测试模型,可以实现检测不同颜色的车牌。
在目标检测中,通常使用边界框(bounding box)来描述对象的空间位置。边界框是矩形的,由矩形左上角的以及右下角的xx和yy坐标决定。另一种常用的边界框表示方法是边界框中心的(x,y)(x,y)轴坐标以及框的宽度和高度。
在上述步骤中,在第一对象为行人的情况下,对目标对象中行人的人脸图像进行检测,并输出第一目标检测框,具体包括如下步骤:确定第一目标检测框在垂直方向上的第一长度,以及在水平方向上的第二长度,当第一长度和第二长度满足第一预设条件时,输出第一目标检测框,其中,第一预设条件为第一长度大于或等于第一目标数量的像素,第二长度大于或等于第二目标数量的像素,其中,第一目标数量和第二目标数量均为16至40之间的任意一个值,例如,可取16至40之间的16、18、20、25、30、35、40等。
一般情况下,第一检测算法中的两种算法均设置有检测目标的阈值,人脸检测算法对应的第一预设条件可以设置为:第一目标检测框大于或等于16个像素,即上述第一长度和第二长度均设为大于或等于16个像素,在不满足第一预设条件的情况下,不输出第一目标检测框,同时,对于侧脸不进行检测。在图4a所示的人脸检测示例图片中,当检测到的人脸图像为侧脸或像素小于16个像素(人眼不可识别)时,不进行脱敏处理。
在另一种可选地实施例中,将第一预设条件设置为:第一目标检测框大于或等于40个像素,即上述第一长度和第二长度均设为大于或等于40个像素,在不满足第一预设条件的情况下,即当检测到的人脸图像的像素在垂直方向和水平方向的至少一个方向上小于40个像素时,不输出第一目标检测框,也无需进行脱敏处理。
在另一种可选地实施例中,将第一预设条件设置为:第一目标检测框大于或等于30个像素,即上述第一长度和第二长度均设为大于或等于30个像素,在不满足第一预设条件的情况下,即当检测到的人脸图像的像素在垂直方向和水平方向的至少一个方向上小于30个像素时,不输出第一目标检测框,也无需进行脱敏处理。
需要说明的是,此处设置的第一长度和第二长度均用像素表示,表示像素在图片中占据的长度,且为经验值,可根据实际情况自行设置或调整,第一目标检测框在水平方向上和垂直方向上的长度相同。
在上述步骤中,在第二对象为车辆的情况下,对车辆的车牌区域进行检测,并输出第二目标检测框,具体包括如下过程:确定第二目标检测框在垂直方向上的第三长度,以及在水平方向上的第四长度,当第三长度和第四长度满足第二预设条件时,输出第二目标检测框,其中,第二预设条件为第三长度大于或等于第三目标数量的像素,第四长度大于或等于第四目标数量的像素,其中,第三目标数量为10至20之间的任意一个值,第四目标数量为20至40之间的任意一个值,例如,可取10至20之间的10、12、15、18、20等,可取20至40之间的20、25、30、35、40等。
车牌检测算法对应的第二预设条件可以设置为:垂直方向上的长度大于或等于10个像素,水平方向上的长度大于或等于20个像素,即第三长度需满足大于或等于10个像素,第四长度需满足大于或等于20个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,不进行检测。在图4b所示的车牌检测示例图片中,图中的目标车辆的车牌不满足第二预设条件(即人肉眼不可识别),不进行脱敏处理。需要说明的是,此处设置的第三长度和第四长度均用像素表示,表示像素在图片中占据的长度,且为经验值,可根据实际情况自行设置或调整。
在另一种可选地实施例中,将第二预设条件设置为:垂直方向上的长度大于或等于20个像素,水平方向上的长度大于或等于40个像素,即第三长度需满足大于或等于20个像素,第四长度需满足大于或等于40个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,不进行检测。
在另一种可选地实施例中,将第二预设条件设置为:垂直方向上的长度大于或等于15个像素,水平方向上的长度大于或等于30个像素,即第三长度需满足大于或等于15个像素,第四长度需满足大于或等于30个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,不进行检测。
在该数据脱敏处理的方法中的步骤S204中,对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,具体包括如下两种情况:
在第一对象为行人的情况下,对目标对象中的行人轮廓进行检测,并输出第三目标检测框,将第三目标检测框作为与第一对象对应的第二类区域,其中,第三目标检测框为包括行人轮廓的最小外接框;或,
在第二对象为车辆的情况下,对车辆的车辆轮廓进行检测,并输出第四目标检测框,将第四目标检测框作为与第二对象对应的第二类区域,其中,第四目标检测框为包括整个车辆的最小外接框。
在本申请实施例中,第二检测算法包括封装在SDK中的第三算法和第四算法,第三算法为行人检测算法,第四算法为车辆检测算法,这两种算法的输入均为目标格式的源图像数据或视频数据,采用深度学习的目标检测模型,输出对应的目标检测框。
行人检测算法是基于深度学习的目标检测算法,算法选用如Faster R-CNN或Yolo系列模型进行检测,并输出bounding box表示的第三目标检测框。通常情况下,第三目标检测框为包括行人轮廓的最小外接框。
车辆检测算法是基于深度学习的目标检测算法,算法选用如Yolo系列模型进行检测,并输出bounding box表示的第四目标检测框。通常情况下,第四目标检测框为包括整个车辆的最小外接框。
在上述步骤中,在第一对象为行人的情况下,对目标对象中的行人轮廓进行检测,并输出第三目标检测框,具体包括如下步骤:确定第三目标检测框在垂直方向上的第五长度,以及在水平方向上的第六长度,当第五长度和第六长度满足第三预设条件时,输出第三目标检测框,其中,第三预设条件为第五长度大于或等于第五目标数量的像素,第六长度大于或等于第六目标数量的像素,其中,第五目标数量为60至120之间的任意一个值,第六目标数量为30至60之间的任意一个值,例如,可取60至120之间的60、70、80、100、110、120等,可取30至60之间的30、35、40、45、50、55、60等。
一般情况下,第二检测算法中的两种算法均设置有检测目标的阈值,行人检测算法对应的第三预设条件可以设置为:垂直方向上的长度大于或等于60个像素,水平方向上的长度大于或等于30个像素,即第五长度需满足大于或等于60个像素,第六长度需满足大于或等于30个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,认为人脸不可见,不进行检测。需要说明的是,此处设置的第五长度和第六长度均用像素表示,表示像素在图片中占据的长度,且为经验值,可根据实际情况自行设置或调整。
在另一种可选地实施例中,将第三预设条件设置为:垂直方向上的长度大于或等于120个像素,水平方向上的长度大于或等于60个像素,即第三长度需满足大于或等于120个像素,第四长度需满足大于或等于60个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,不进行检测。
在另一种可选地实施例中,将第三预设条件设置为:垂直方向上的长度大于或等于80个像素,水平方向上的长度大于或等于40个像素,即第三长度需满足大于或等于80个像素,第四长度需满足大于或等于40个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,不进行检测。
在上述步骤中,在第二对象为车辆的情况下,对车辆的车辆轮廓进行检测,并输出第四目标检测框,具体包括如下过程:确定第四目标检测框在垂直方向上的第七长度,以及在水平方向上的第八长度,当第七长度和第八长度满足第四预设条件时,输出第四目标检测框,其中,第四预设条件为第七长度大于或等于第七目标数量的像素,第八长度大于或等于第八目标数量的像素,其中,第七目标数量和第八目标数量均为80至120之间的任意一个值,例如,可取80至120之间的80、90、100、110、120等。
车辆检测算法对应的第四预设条件可以设置为:垂直方向上的长度大于或等于80个像素,水平方向上的长度大于或等于80个像素,即第七长度需满足大于或等于80个像素,第八长度需满足大于或等于80个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,认为车牌不可见,不进行检测。需要说明的是,此处设置的第七长度和第八长度均用像素表示,表示像素在图片中占据的长度,且为经验值,可根据实际情况自行设置或调整,第四目标检测框在水平方向上和垂直方向上的像素相同。
在另一种可选地实施例中,将第四预设条件设置为:垂直方向上的长度大于或等于120个像素,水平方向上的长度大于或等于120个像素,即第三长度需满足大于或等于120个像素,第四长度需满足大于或等于120个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,不进行检测。
在另一种可选地实施例中,将第四预设条件设置为:垂直方向上的长度大于或等于100个像素,水平方向上的长度大于或等于100个像素,即第三长度需满足大于或等于100个像素,第四长度需满足大于或等于100个像素,垂直和水平两个方向上的任意一个方向上的像素低于设置的值时,不进行检测。
由于车辆、行人目标物大,轮廓清晰,且像素要求放宽,通过车辆检测算法和行人检测算法得到的召回率会明显优于通过车牌检测算法和人脸检测算法得到的召回率。
在该数据脱敏处理的方法中的步骤S206中,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域,如图5a所示的流程图,具体包括如下步骤:
步骤S502,在源图像数据中存在第一目标检测框和第三目标检测框的情况下,将第一目标检测框对应的区域作为脱敏区域;
步骤S504,在源图像数据中存在第一目标检测框,不存在第三目标检测框的情况下,将第一目标检测框对应的区域作为脱敏区域;
步骤S506,在源图像数据中不存在第一目标检测框,存在第三目标检测框的情况下,对第三目标检测框进行处理,将处理后得到的区域作为脱敏区域;
步骤S508,在源图像数据中不存在第一目标检测框和第三目标检测框的情况下,拒绝输出脱敏区域。
在经过第一检测算法和第二检测算法输出不同类型的区域后,需根据源图像数据中包含的不同类型的区域,确定脱敏区域。该过程包含第一判断算法、第二判断算法和处理算法,其中,第一判断算法的输入为人脸检测算法的检测结果和行人检测算法的检测结果,对这两种检测结果采用投票机制,最终判定需要脱敏的区域。第一判断算法对应的投票条件和投票结果如下表1所示:
表1中的第一类投票条件对应步骤S502,第二类投票条件对应步骤S504,由于第一判断算法的输入为人脸检测算法的检测结果和行人检测算法的检测结果,因此检测结果中可能有与第一对象对应的第一类区域,即第一目标检测框,也可能有与第一对象对应的第二类区域,即第三目标检测框,在源图像数据中存在与第一对象对应的第一目标检测框和第三目标检测框的情况下,将第一目标检测框对应的区域作为脱敏区域;在源图像数据中存在第一目标检测框,不存在第三目标检测框的情况下,将第一目标检测框对应的区域作为脱敏区域;表1中的第三类投票条件对应步骤S506,在源图像数据中不存在第一目标检测框,存在第三目标检测框的情况下,需通过处理算法对第三目标检测框进行处理,将处理后得到的区域作为脱敏区域;表1中的第四类投票条件对应步骤S508,在源图像数据中不存在第一目标检测框和第三目标检测框的情况下,拒绝输出脱敏区域。
在上述步骤S506中,对第三目标检测框进行处理,将处理后得到的区域作为脱敏区域,具体包括如下步骤:将第三目标检测框的上边框固定,将其他三条边框按照第一预设比例压缩,将压缩后的第三目标检测框对应的区域作为脱敏区域,其中,将其他三条边框按照第一预设比例压缩,具体包括:将第三目标检测框的左边框和右边框分别向内移动第一目标距离,将第三目标检测框的下边框向上移动至第二目标距离,其中,第一目标距离为第三目标检测框的上边框或第三目标检测框的下边框长度的1/4至1/2之间的任意值,第二目标距离为第三目标检测框的左边框或第三目标检测框的右边框长度的1/8至1/6之间的任意值。需要说明的是,上述左右和上下为相对概念,在某些情况下可以互换,上边框、下边框的延长线与左边框、右边框的延长线是互相垂直的关系。
上述步骤对应表1中的第三类投票情况,即步骤S506,由于表1中第三目标检测框为通过行人检测算法得到的包含整个行人轮廓的最小外接框,直接对其进行脱敏匿名化处理,可能会对仿真训练等自动驾驶应用产生影响,因此需要对第三目标检测框进行处理。对应的处理算法具体为:将第三目标检测框的上边框固定,其他三条边框按照第一预设比例向内压缩,达到既能遮挡面部,又不会影响行人整体外轮廓的目的。例如,人的头部占身体的比例为1/8到1/6,同时,具体缩放比例还取决于是否影响应用端正常使用数据,综合评估取1/6,即将第三目标检测框的上边框固定,将第三目标检测框的下边框向上移动至第二目标距离,该第二目标距离为第三目标检测框的左边框或第三目标检测框的右边框长度的1/6,根据实际情况将第三目标检测框的左边框和右边框分别向内移动第一目标距离,该第一目标距离为第三目标检测框的上边框或第三目标检测框的下边框长度1/4至1/2之间的任意值,例如取1/2。
在一种可选地实施例中,人的头部占身体的比例为1/8到1/6,在综合评估取1/8的情况下,对应的处理过程为:将第三目标检测框的上边框固定,将第三目标检测框的下边框向上移动至第二目标距离,该第二目标距离为第三目标检测框的左边框或第三目标检测框的右边框长度的1/8,根据实际情况将第三目标检测框的左边框和右边框分别向内移动第一目标距离,该第一目标距离为第三目标检测框的上边框或第三目标检测框的下边框长度1/4至1/2之间的任意值,例如取1/4。
在另一种可选地实施例中,人的头部占身体的比例为1/8到1/6,在综合评估取1/7的情况下,对应的处理过程为:将第三目标检测框的上边框固定,将第三目标检测框的下边框向上移动至第二目标距离,该第二目标距离为第三目标检测框的左边框或第三目标检测框的右边框长度的1/7,根据实际情况将第三目标检测框的左边框和右边框分别向内移动第一目标距离,该第一目标距离为第三目标检测框的上边框或第三目标检测框的下边框长度1/4至1/2之间的任意值,例如取1/3。
如图5b所示的对第三目标检测框进行处理的示意图,图中的外矩形框为行人的最小外接框,将外矩形框的上边框固定,其左边框和右边框各向内移动原外矩形框的上边框或原外矩形框的下边框长度1/4的距离,将其下边框向上移动至原外矩形框的左边框或原外矩形框的右边框长度的1/6,得到内矩形框,将内矩形框作为最终脱敏的区域。
由于行人为非刚性的,其在图像中可能存在不同的姿态。对于非直立姿态的行人,如下蹲的动作,其脱敏区域的选取方式有所不同。同样,对于身高1.1m以下的儿童,其头部占身体的比例相比成人也会有所不同。经过综合评估,在特殊的情况中,当行人的最小外接框的高度小于1.1m时,处理算法具体为:将行人最小外接框的上边框固定,其他三条边框按照1/4至2/7之间的任意比例向内压缩。例如,将行人的最小外接框的上边框固定,将该最小外接框的左边框和右边框分别向内移动原最小外接框的上边框或原最小外接框的下边框长度的1/4,将该最小外接框的下边框向上移动至原最小外接框的左边框或原最小外接框的右边框长度的1/4。
在另一种可选地实施例中,当行人的最小外接框的高度小于1.1m时,对应的处理过程为:将行人的最小外接框的上边框固定,将该最小外接框的左边框和右边框分别向内移动原最小外接框的上边框或原最小外接框的下边框长度的2/7,将该最小外接框的下边框向上移动至原最小外接框的左边框或原最小外接框的右边框长度的2/7。
在另一种可选地实施例中,当行人的最小外接框的高度小于1.1m时,对应的处理过程为:将行人的最小外接框的上边框固定,将该最小外接框的左边框和右边框分别向内移动原最小外接框的上边框或原最小外接框的下边框长度的3/11,将该最小外接框的下边框向上移动至原最小外接框的左边框或原最小外接框的右边框长度的3/11。
在该数据脱敏处理的方法中的步骤S206中,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域,如图6a所示的流程图,具体包括如下步骤:
步骤S602,在源图像数据中存在第二目标检测框和第四目标检测框的情况下,将第二目标检测框对应的区域作为脱敏区域;
步骤S604,在源图像数据中存在第二目标检测框,不存在第四目标检测框的情况下,将第二目标检测框对应的区域作为脱敏区域;
步骤S606,在源图像数据中不存在第二目标检测框,存在第四目标检测框的情况下,对第四目标检测框进行处理,将处理后得到的区域作为脱敏区域;
步骤S608,在源图像数据中不存在第二目标检测框和第四目标检测框的情况下,拒绝输出脱敏区域。
在步骤S602至步骤S608中,使用第二判断算法确定脱敏区域。第二判断算法的输入为车牌检测算法的检测结果和车辆检测算法的检测结果,对这两种检测结果采用投票机制,最终判定需要脱敏的区域。第二判断算法对应的投票条件和投票结果如下
表2所示:
表2中的第一类投票条件对应步骤S602,第二类投票条件对应步骤S604,由于第二判断算法的输入为车牌检测算法的检测结果和车辆检测算法的检测结果,因此检测结果中可能有与第二对象对应的第一类区域,即第二目标检测框,也可能有与第二对象对应的第二类区域,即第四目标检测框。在源图像数据中存在第二目标检测框和第四目标检测框的情况下,将第二目标检测框对应的区域作为脱敏区域;在源图像数据中存在第二目标检测框,不存在第四目标检测框的情况下,将第二目标检测框对应的区域作为脱敏区域;表2中的第三类投票条件对应步骤S606,在源图像数据中不存在第二目标检测框,存在第四目标检测框的情况下,需通过处理算法对第四目标检测框进行处理后,将处理后得到的区域作为脱敏区域;表2中的第四类投票条件对应步骤S608,在源图像数据中不存在第二目标检测框和第四目标检测框的情况下,拒绝输出脱敏区域。
在上述步骤S606中,对第四目标检测框进行处理,将处理后得到的区域作为脱敏区域,具体包括如下步骤:以第四目标检测框的几何中心为中心点,将第四目标检测框按照第二预设比例缩放,将缩放后的第四目标检测框作为脱敏区域,其中,将第四目标检测框按照第二预设比例缩放,具体包括:确定第四目标检测框的任意一个端点到中心点的距离为第一距离;将第四目标检测框沿端点到中心点的方向向内移动第三目标距离,其中,第三目标距离为第一距离的1/4至第一距离的1/3之间的任意值,从而得到缩放后的第四目标检测框。
上述步骤对应表2中的第三类投票情况,即步骤S606,由于表2中第四目标检测框为通过车辆检测算法得到的包含整个车辆的最小外接框,直接对其进行脱敏匿名化处理,可能会对仿真训练等自动驾驶应用产生影响,因此需要对第四目标检测框进行处理。对应的处理算法具体为:以第四目标检测框的几何中心为中心点,将第四目标检测框按照第二预设比例向内缩放,达到既能遮挡车牌,又不会影响车辆外轮廓的目的,具体缩放比例取决于是否影响应用端正常使用数据,例如,经过应用端评估,向内缩放1/3不会影响应用端使用数据,即以第四目标检测框的几何中心为中心点,确定第四目标检测框的任意一个端点到中心点的距离为第一距离;将第四目标检测框沿端点到中心点的方向向内移动第一距离的1/3。
在另一种可选地实施例中,当经过应用端评估后,向内缩放1/4不会影响应用端使用数据时,对应的处理过程为:以第四目标检测框的几何中心为中心点,确定第四目标检测框的任意一个端点到中心点的距离为第一距离;将第四目标检测框沿端点到中心点的方向向内移动第一距离的1/4。
在另一种可选地实施例中,当经过应用端评估后,向内缩放2/7不会影响应用端使用数据时,对应的处理过程为:以第四目标检测框的几何中心为中心点,确定第四目标检测框的任意一个端点到中心点的距离为第一距离;将第四目标检测框沿端点到中心点的方向向内移动第一距离的2/7。
如图6b所示的对第四目标检测框进行处理的示意图,图中的外矩形框为车辆的最小外接框,其向内缩放一个端点距中心点1/3的距离,即先确定外矩形框的任意一个端点到中心点的距离,即第一距离;将外矩形框沿端点到中心点的方向向内移动第一距离的1/3后,得到内矩形框,将内矩形框作为最终脱敏的区域。
在上述过程中,脱敏区域的具体选取流程如下:1.确认应用方的具体使用场景,如自动驾驶仿真、算法训练等;2.初步评估一个缩放比例,并基于此缩放比例输出脱敏后的样例数据,一般为1w帧以上的图片为佳;3.提供样例数据给应用方,通过实测确认不符合应用需求的图片比例,例如对于算法训练,统计不能成功生成卷积模型的图片比例,若小于1%,则认为符合应用需求,从而确定缩放比例;若大于1%,则认为不符合应用需求,需要重新评估缩放比例并再次实测。
在该数据脱敏处理的方法中的步骤S208中,对脱敏区域中的图像数据进行脱敏处理,具体包括以下两种方式:将脱敏区域中的像素点随机移动;或者,将脱敏区域中的全部像素点置为目标颜色,其中,像素点的颜色为以下任意一种或多种颜色的组合:红、绿、蓝。在本申请实施例中,目标颜色可以为黑色,将像素点颜色按照R(红色),G(绿色),B(蓝色)三原色按比例混合而成,黑色的RGB置为(0,0,0),多种颜色包括红绿蓝三种颜色中的其中两种或三种,例如,在只包含红绿蓝三种颜色中的其中两种的情况下,可以为红绿、红蓝或绿蓝。
匿名化脱敏处理方式可配置,按照应用方需求去选择。对于图片数据,匿名化处理后的图片进行时间序列化后以脱敏后图片集的形式存入数据库,等待应用方调用。对于视频数据,程序读取视频的帧率和帧数,并将视频转换为序列帧图片。对于图片进行匿名化处理后,基于原始视频的帧率进行图片序列化,还原成视频文件。按照视频包的时序存入数据库,等待应用方调用。
通过上述步骤S202至步骤S208,通过对源图像数据中的不同目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域,至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域,达到了依据脱敏区域对源图像数据进行脱敏处理的目的,从而实现了显著提升脱敏效率的技术效果,进而解决了相关技术中采用深度学习算法对自动驾驶数据中的人脸、车牌等隐私数据进行脱敏处理存在召回率不足的技术问题。
图7是根据本申请实施例的一种数据脱敏处理的架构图,如图7所示,将源图像数据同时输入第一检测算法和第二检测算法中,第一检测算法包括第一算法和第二算法,第二检测算法包括第三算法和第四算法,在本申请实施例中,第一检测算法为人脸车牌检测算法,第一算法为人脸检测算法,第二算法为车牌检测算法,第三算法为行人检测算法,第四算法为车辆检测算法,得到对应的包括第一类区域或第二类区域的目标图像数据。具体地,源图像数据中的目标对象包括第一对象和第二对象,通过第一算法得到与第一对象对应的第一类区域,即第一目标检测框,通过第二算法得到与第二对象对应的第一类区域,即第二目标检测框,通过第三算法得到与第一对象对应的第二类区域,即第三目标检测框,通过第四算法得到与第二对象对应的第二类区域,即第四目标检测框。将通过第一算法和第三算法得到的检测结果输入第一判断算法中,将通过第二算法和第四算法得到的检测结果输入到第二判断算法中,依据源图像数据中是否包含第一类区域或第二类区域,确定脱敏区域。可以最大程度减少目标漏检,既能保证脱敏的质量,又能尽可能的提升脱敏效率,满足业务使用的时效性要求,从而实现人脸和车牌的高召回率。
图8是根据本申请实施例的一种数据脱敏处理的装置的结构图,如图8所示,该装置包括:
获取模块802,用于获取源图像数据;
检测模块804,用于对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域;
确定模块806,用于至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域;
处理模块808,用于对脱敏区域中的图像数据进行脱敏处理。
需要说明的是,本申请实施例中的数据脱敏处理的装置用于执行图2至图6a所示的数据脱敏处理的方法,因此上述数据脱敏处理的方法中的相关解释说明也适用于该数据脱敏处理的装置,此处不再赘述。
本申请实施例还提供了一种非易失性存储介质,该非易失性存储介质包括存储的程序,其中,在程序运行时控制该非易失性存储介质所在设备执行以下的数据脱敏处理的方法:获取源图像数据;对源图像数据中的目标对象分别检测,得到源图像数据中的第一类区域和第二类区域,其中,第二类区域为目标对象在源图像数据中所占据的区域,第一类区域为源图像数据中目标对象的目标部位所在的区域;至少依据第一类区域和第二类区域确定源图像数据中的脱敏区域;对脱敏区域中的图像数据进行脱敏处理。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (22)
1.一种数据脱敏处理的方法,其特征在于,包括:
获取源图像数据;
对所述源图像数据中的目标对象分别检测,得到所述源图像数据中的第一类区域和第二类区域,其中,所述第二类区域为所述目标对象在所述源图像数据中所占据的区域,所述第一类区域为所述源图像数据中所述目标对象的目标部位所在的区域;
至少依据所述第一类区域和所述第二类区域确定所述源图像数据中的脱敏区域;
对所述脱敏区域中的图像数据进行脱敏处理。
2.根据权利要求1所述的数据脱敏处理的方法,其特征在于,所述目标对象包括:第一对象和第二对象,且所述第一对象和第二对象之间具有关联关系;对所述源图像数据中的目标对象分别检测,得到所述源图像数据中的第一类区域和第二类区域,包括:
在所述第一对象为行人的情况下,对所述目标对象中行人的人脸图像进行检测,并输出第一目标检测框,将所述第一目标检测框作为与所述第一对象对应的第一类区域,其中,所述第一目标检测框为覆盖所述第一对象的人脸信息的最小外接框;或,
在所述第二对象为车辆的情况下,对所述车辆的车牌区域进行检测,并输出第二目标检测框,将所述第二目标检测框作为与所述第二对象对应的第一类区域,其中,所述第二目标检测框为覆盖所述车辆的车牌信息的最小外接框。
3.根据权利要求2所述的数据脱敏处理的方法,其特征在于,对所述车辆的车牌区域进行检测,包括:通过基于包括不同颜色的测试集训练得到的测试模型,对不同颜色的车牌区域进行检测。
4.根据权利要求2所述的数据脱敏处理的方法,其特征在于,在以下之一情况下确定所述第一对象和所述第二对象具有所述关联关系:所述第一对象和第二对象为目标车辆所处行驶环境中的行人和目标车辆所处环境中的周围车辆;所述第一对象和第二对象为目标车辆中的乘客和所述目标车辆所处行驶环境中的周围车辆。
5.根据权利要求2所述的数据脱敏处理的方法,其特征在于,在所述第一对象为行人的情况下,对所述目标对象中行人的人脸图像进行检测,并输出第一目标检测框,包括:
确定所述第一目标检测框在垂直方向上的第一长度,以及在水平方向上的第二长度,当所述第一长度和所述第二长度满足第一预设条件时,输出所述第一目标检测框。
6.根据权利要求5所述的数据脱敏处理的方法,其特征在于,所述第一预设条件为所述第一长度大于或等于第一目标数量的像素,所述第二长度大于或等于第二目标数量的像素,其中,所述第一目标数量和所述第二目标数量均为16至40之间的任意一个值。
7.根据权利要求2所述的数据脱敏处理的方法,其特征在于,在所述第二对象为车辆的情况下,对所述车辆的车牌区域进行检测,并输出第二目标检测框,包括:
确定所述第二目标检测框在垂直方向上的第三长度,以及在水平方向上的第四长度,当所述第三长度和所述第四长度满足第二预设条件时,输出所述第二目标检测框。
8.根据权利要求7所述的数据脱敏处理的方法,其特征在于,所述第二预设条件为所述第三长度大于或等于第三目标数量的像素,所述第四长度大于或等于第四目标数量的像素,其中,所述第三目标数量为10至20之间的任意一个值,所述第四目标数量为20至40之间的任意一个值。
9.根据权利要求2所述的数据脱敏处理的方法,其特征在于,对所述源图像数据中的目标对象分别检测,得到所述源图像数据中的第一类区域和第二类区域,包括:
在所述第一对象为行人的情况下,对所述目标对象中的行人轮廓进行检测,并输出第三目标检测框,将所述第三目标检测框作为与所述第一对象对应的第二类区域,其中,所述第三目标检测框为包括所述行人轮廓的最小外接框;或,
在所述第二对象为车辆的情况下,对所述车辆的车辆轮廓进行检测,并输出第四目标检测框,将所述第四目标检测框作为与所述第二对象对应的第二类区域,其中,所述第四目标检测框为包括整个车辆的最小外接框。
10.根据权利要求9所述的数据脱敏处理的方法,其特征在于,在所述第一对象为行人的情况下,对所述目标对象中的行人轮廓进行检测,并输出第三目标检测框,包括:
确定所述第三目标检测框在垂直方向上的第五长度,以及在水平方向上的第六长度,当所述第五长度和所述第六长度满足第三预设条件时,输出所述第三目标检测框。
11.根据权利要求10所述的数据脱敏处理的方法,其特征在于,所述第三预设条件为所述第五长度大于或等于第五目标数量的像素,所述第六长度大于或等于第六目标数量的像素,其中,所述第五目标数量为60至120之间的任意一个值,所述第六目标数量为30至60之间的任意一个值。
12.根据权利要求9所述的数据脱敏处理的方法,其特征在于,在所述第二对象为车辆的情况下,对所述车辆的车辆轮廓进行检测,并输出第四目标检测框,包括:
确定所述第四目标检测框在垂直方向上的第七长度,以及在水平方向上的第八长度,当所述第七长度和所述第八长度满足第四预设条件时,输出所述第四目标检测框。
13.根据权利要求12所述的数据脱敏处理的方法,其特征在于,所述第四预设条件为所述第七长度大于或等于第七目标数量的像素,所述第八长度大于或等于第八目标数量的像素,其中,所述第七目标数量和所述第八目标数量均为80至120之间的任意一个值。
14.根据权利要求9所述的数据脱敏处理的方法,其特征在于,至少依据所述第一类区域和所述第二类区域确定所述源图像数据中的脱敏区域,包括:
在所述源图像数据中存在所述第一目标检测框和所述第三目标检测框的情况下,将所述第一目标检测框对应的区域作为所述脱敏区域;
在所述源图像数据中存在所述第一目标检测框,不存在所述第三目标检测框的情况下,将所述第一目标检测框对应的区域作为所述脱敏区域;
在所述源图像数据中不存在所述第一目标检测框,存在所述第三目标检测框的情况下,对所述第三目标检测框进行处理,将处理后得到的区域作为所述脱敏区域;
在所述源图像数据中不存在所述第一目标检测框和所述第三目标检测框的情况下,拒绝输出所述脱敏区域。
15.根据权利要求14所述的数据脱敏处理的方法,其特征在于,对所述第三目标检测框进行处理,将处理后得到的区域作为所述脱敏区域,包括:
将所述第三目标检测框的上边框固定,将其他三条边框按照第一预设比例压缩,将压缩后的第三目标检测框对应的区域作为所述脱敏区域。
16.根据权利要求15所述的数据脱敏处理的方法,其特征在于,将其他三条边框按照第一预设比例压缩,包括:将所述第三目标检测框的左边框和右边框分别向内移动第一目标距离,将所述第三目标检测框的下边框向上移动至第二目标距离,其中,所述第一目标距离为所述第三目标检测框的上边框或所述第三目标检测框的下边框长度的1/4至1/2之间的任意值,所述第二目标距离为所述第三目标检测框的左边框或所述第三目标检测框的右边框长度的1/8至1/6之间的任意值。
17.根据权利要求9所述的数据脱敏处理的方法,其特征在于,至少依据所述第一类区域和所述第二类区域确定所述源图像数据中的脱敏区域,包括:
在所述源图像数据中存在所述第二目标检测框和所述第四目标检测框的情况下,将所述第二目标检测框对应的区域作为所述脱敏区域;
在所述源图像数据中存在所述第二目标检测框,不存在所述第四目标检测框的情况下,将所述第二目标检测框对应的区域作为所述脱敏区域;
在所述源图像数据中不存在所述第二目标检测框,存在所述第四目标检测框的情况下,对所述第四目标检测框进行处理,将处理后得到的区域作为所述脱敏区域;
在所述源图像数据中不存在所述第二目标检测框和所述第四目标检测框的情况下,拒绝输出所述脱敏区域。
18.根据权利要求17所述的数据脱敏处理的方法,其特征在于,对所述第四目标检测框进行处理,将处理后得到的区域作为所述脱敏区域,包括:
以所述第四目标检测框的几何中心为中心点,将所述第四目标检测框按照第二预设比例缩放,将缩放后的第四目标检测框对应的区域作为所述脱敏区域。
19.根据权利要求18所述的数据脱敏处理的方法,其特征在于,将所述第四目标检测框按照第二预设比例缩放,包括:
确定所述第四目标检测框的任意一个端点到所述中心点的距离为第一距离;
将所述第四目标检测框沿所述端点到所述中心点的方向向内移动第三目标距离,其中,所述第三目标距离为所述第一距离的1/4至所述第一距离的1/3之间的任意值。
20.根据权利要求1所述的数据脱敏处理的方法,其特征在于,对所述脱敏区域中的图像数据进行脱敏处理,包括:
将所述脱敏区域中的像素点随机移动;或者,
将所述脱敏区域中的全部像素点置为目标颜色,其中,所述像素点的颜色为以下任意一种或多种颜色的组合:红、绿、蓝。
21.一种数据脱敏处理的装置,其特征在于,包括:
获取模块,用于获取源图像数据;
检测模块,用于对所述源图像数据中的目标对象分别检测,得到所述源图像数据中的第一类区域和第二类区域,其中,所述第二类区域为所述目标对象在所述源图像数据中所占据的区域,所述第一类区域为所述源图像数据中所述目标对象的目标部位所在的区域;
确定模块,用于至少依据所述第一类区域和所述第二类区域确定所述源图像数据中的脱敏区域;
处理模块,用于对所述脱敏区域中的图像数据进行脱敏处理。
22.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,与所述存储器连接,用于执行实现以下功能的程序指令:获取源图像数据;对所述源图像数据中的目标对象分别检测,得到所述源图像数据中的第一类区域和第二类区域,其中,所述第二类区域为所述目标对象在所述源图像数据中所占据的区域,所述第一类区域为所述源图像数据中所述目标对象的目标部位所在的区域;至少依据所述第一类区域和所述第二类区域确定所述源图像数据中的脱敏区域;对所述脱敏区域中的图像数据进行脱敏处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210130586.8A CN114463168A (zh) | 2022-02-11 | 2022-02-11 | 数据脱敏处理的方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210130586.8A CN114463168A (zh) | 2022-02-11 | 2022-02-11 | 数据脱敏处理的方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114463168A true CN114463168A (zh) | 2022-05-10 |
Family
ID=81413879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210130586.8A Pending CN114463168A (zh) | 2022-02-11 | 2022-02-11 | 数据脱敏处理的方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114463168A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114841377A (zh) * | 2022-06-28 | 2022-08-02 | 国汽智控(北京)科技有限公司 | 应用于图像目标识别的联邦学习模型训练方法、识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112200132A (zh) * | 2020-10-28 | 2021-01-08 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的数据处理方法、装置及设备 |
CN112380566A (zh) * | 2020-11-20 | 2021-02-19 | 北京百度网讯科技有限公司 | 用于对文档图像进行脱敏的方法、装置、电子设备及介质 |
CN113032821A (zh) * | 2019-12-25 | 2021-06-25 | 航天网安技术(深圳)有限公司 | 数据脱敏方法、装置、电子设备及可读存储介质 |
CN113688837A (zh) * | 2021-09-29 | 2021-11-23 | 平安科技(深圳)有限公司 | 图像脱敏方法、装置、电子设备及计算机可读存储介质 |
CN113837970A (zh) * | 2021-09-30 | 2021-12-24 | 北京地平线信息技术有限公司 | 图像数据的脱敏方法和装置 |
-
2022
- 2022-02-11 CN CN202210130586.8A patent/CN114463168A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113032821A (zh) * | 2019-12-25 | 2021-06-25 | 航天网安技术(深圳)有限公司 | 数据脱敏方法、装置、电子设备及可读存储介质 |
CN112200132A (zh) * | 2020-10-28 | 2021-01-08 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的数据处理方法、装置及设备 |
CN112380566A (zh) * | 2020-11-20 | 2021-02-19 | 北京百度网讯科技有限公司 | 用于对文档图像进行脱敏的方法、装置、电子设备及介质 |
CN113688837A (zh) * | 2021-09-29 | 2021-11-23 | 平安科技(深圳)有限公司 | 图像脱敏方法、装置、电子设备及计算机可读存储介质 |
CN113837970A (zh) * | 2021-09-30 | 2021-12-24 | 北京地平线信息技术有限公司 | 图像数据的脱敏方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114841377A (zh) * | 2022-06-28 | 2022-08-02 | 国汽智控(北京)科技有限公司 | 应用于图像目标识别的联邦学习模型训练方法、识别方法 |
CN114841377B (zh) * | 2022-06-28 | 2022-09-13 | 国汽智控(北京)科技有限公司 | 应用于图像目标识别的联邦学习模型训练方法、识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10372226B2 (en) | Visual language for human computer interfaces | |
CN110544258B (zh) | 图像分割的方法、装置、电子设备和存储介质 | |
CN109118470B (zh) | 一种图像质量评价方法、装置、终端和服务器 | |
CN105359162B (zh) | 用于图像中的与脸部有关的选择和处理的图像掩模 | |
US8199165B2 (en) | Methods and systems for object segmentation in digital images | |
CN108320312B (zh) | 图片的配色方法及装置、计算机终端 | |
CN106951869B (zh) | 一种活体验证方法及设备 | |
US8515164B2 (en) | Non-product image identification | |
CN111627215A (zh) | 基于人工智能的视频图像识别方法及相关设备 | |
CN110059607B (zh) | 活体多重检测方法、装置、计算机设备及存储介质 | |
KR101048582B1 (ko) | 칼라 이미지에서 얼굴들을 검출하기 위한 방법 및 디바이스 | |
CN105913460A (zh) | 一种肤色检测方法及装置 | |
US8611698B2 (en) | Method for image reframing | |
CN108062554B (zh) | 一种车辆年检标签颜色的识别方法及装置 | |
CN114463168A (zh) | 数据脱敏处理的方法、装置和电子设备 | |
CN111369633A (zh) | 设计图的评分方法、装置、计算机可读存储介质和设备 | |
KR100488014B1 (ko) | YCrCb 칼라 기반 얼굴 영역 추출 방법 | |
CN115690934A (zh) | 基于批量人脸识别的师生考勤打卡方法及装置 | |
CN109141457A (zh) | 导航评估方法、装置、计算机设备和存储介质 | |
WO2015117464A1 (zh) | 一种视频图像处理装置和方法 | |
CN115965848B (zh) | 一种图像处理方法和相关装置 | |
Che et al. | Reduced-reference quality metric for screen content image | |
CN116740577B (zh) | 道路积水识别方法、系统、终端及存储介质 | |
CN113158818B (zh) | 用于识别伪造视频的方法、装置和设备 | |
CN116486171A (zh) | 一种颜色识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |