CN115408710A - 一种图像脱敏方法和相关装置 - Google Patents
一种图像脱敏方法和相关装置 Download PDFInfo
- Publication number
- CN115408710A CN115408710A CN202211049570.0A CN202211049570A CN115408710A CN 115408710 A CN115408710 A CN 115408710A CN 202211049570 A CN202211049570 A CN 202211049570A CN 115408710 A CN115408710 A CN 115408710A
- Authority
- CN
- China
- Prior art keywords
- content
- desensitized
- image
- desensitization
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种图像脱敏方法和相关装置,涉及人工智能、计算机视觉技术等领域,以及云技术、智慧交通、辅助驾驶等各种场景。在获取包括待脱敏内容的待脱敏图像时,确定待脱敏内容的外轮廓曲线,并生成形状符合外轮廓曲线的脱敏内容。由于外轮廓曲线可以准确区分出待脱敏图像中待脱敏内容和非待脱敏内容的边界,通过脱敏内容替换待脱敏内容,不会破坏待脱敏图像中非待脱敏内容的图像质量。且脱敏内容和待脱敏内容具有相同的内容类型和不同图像风格,使得脱敏内容和待脱敏图像中非待脱敏内容在图像整体上并不突兀,体现出脱敏内容与非待脱敏内容间的画风区别,有效的提示用户此处为脱敏内容。由此得到不影响图像质量的脱敏图像,提高了用户体验。
Description
技术领域
本申请涉及图像处理领域,特别是涉及一种图像脱敏方法和相关装置。
背景技术
图像脱敏是一种去除图像中例如人脸、车牌等待脱敏内容的技术。在智能交通领域、安防领域等中,都会通过摄像装置采集到可能包括待脱敏内容的视频图像,均需要应用图像脱敏技术来避免待脱敏内容泄露,以提供一个安全的使用环境。
相关技术中,将待脱敏内容作为检测目标,通过目标检测任务从待脱敏图像中检测到待脱敏内容的区域,然后通过马赛克等方式将该区域内进行马赛克涂抹,以此起到待脱敏内容不可见的目的,从而实现图像脱敏。
然而,这种马赛克涂抹的方式过于粗糙,会破坏一些非待脱敏内容所在区域的图像信息,降低图像质量,从而大大降低图像的美观性,影响用户的使用感受。
发明内容
为了解决上述技术问题,本申请提供了一种图像脱敏方法和相关装置,得到不影响图像质量的脱敏图像,而且不同的图像风格可以为脱敏带来趣味性,提高了用户体验。
本申请实施例公开了如下技术方案:
一方面,本申请实施例提供了一种图像脱敏方法,所述方法包括:
获取待脱敏图像,所述待脱敏图像中包括待脱敏内容;
确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线;
根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
通过将所述待脱敏图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏图像。
另一方面,本申请实施例提供了一种图像脱敏装置,所述装置包括获取单元、确定单元、生成单元和替换单元:
所述获取单元,用于获取待脱敏图像,所述待脱敏图像中包括待脱敏内容;
所述确定单元,用于确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线;
所述生成单元,用于根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
所述替换单元,用于通过将所述待脱敏图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏图像。
另一方面,本申请实施例提供了一种图像脱敏方法,所述方法包括:
通过配置在目标车辆的车载终端,获取所述目标车辆对应的车辆环境图像;
当确定所述车辆环境图像包括待脱敏内容时,根据所述待脱敏内容生成对应的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像;
响应于外部设备针对所述车辆环境图像发送的获取请求,向所述外部设备返回所述脱敏环境图像。
另一方面,本申请实施例提供了一种图像脱敏装置,所述装置包括获取单元、生成单元、替换单元和发送单元:
所述获取单元,用于通过配置在目标车辆的车载终端,获取所述目标车辆对应的车辆环境图像;
所述生成单元,用于当确定所述车辆环境图像包括待脱敏内容时,根据所述待脱敏内容生成对应的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
所述替换单元,用于通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像;
所述发送单元,用于响应于外部设备针对所述车辆环境图像发送的获取请求,向所述外部设备返回所述脱敏环境图像。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行以上方面所述的方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行以上方面所述的方法。
另一方面,本申请实施例提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行以上方面所述的方法。
由上述技术方案可以看出,在获取包括待脱敏内容的待脱敏图像时,为了保护待脱敏内容的安全,可以对待脱敏图像进行图像脱敏处理。可确定待脱敏内容的外轮廓在该待脱敏图像中的外轮廓曲线,并生成形状符合外轮廓曲线的脱敏内容。由于外轮廓曲线可以准确区分出待脱敏图像中待脱敏内容和非待脱敏内容的边界,通过脱敏内容替换待脱敏图像中的待脱敏内容,不会破坏待脱敏图像中非待脱敏内容的图像质量。而且,脱敏内容和待脱敏内容具有相同的内容类型和不同的图像风格,相同的内容类型使得脱敏内容处于原待脱敏内容的图像位置时,和待脱敏图像中非待脱敏内容在图像整体上并不突兀,且脱敏内容能够与非待脱敏内容建立原来与待脱敏内容间的内容关联,不同的图像风格可以体现出脱敏内容与非待脱敏内容间的画风区别,有效的提示用户此处为脱敏内容,而非待脱敏图像中的原内容,避免出现误导。由此,通过待脱敏内容外轮廓曲线生成的脱敏内容可以有效的实现图像脱敏,得到不影响图像质量的脱敏图像,而且不同的图像风格可以为脱敏带来趣味性,提高了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种图像脱敏场景的示意图;
图2为本申请实施例提供的一种图像脱敏方法的方法流程图;
图3为本申请实施例提供的一种人脸外轮廓曲线的提取方式示意图;
图4为本申请实施例提供的一种轮廓-脱敏样本对的示意图;
图5为本申请实施例提供的一种用于训练内容生成模型的网络结构示意图;
图6为本申请实施例提供的一种用于训练风格转换模型的网络结构示意图;
图7为本申请实施例提供的一种应用于图5-图6中的生成器网络结构示意图;
图8为本申请实施例提供的一种应用于图5-图6中的判别器网络结构示意图;
图9为本申请实施例提供的一种训练数据集所涉及图像的示意图;
图10为本申请实施例提供的一种通过动漫人脸替换真实人脸的人脸脱敏方法的流程图;
图11为本申请实施例提供的一种通过动漫人脸替换真实人脸的人脸脱敏场景的示意图;
图12为本申请实施例提供的一种人脸检测模型的网络结构示意图;
图13为本申请实施例提供的另一种图像脱敏方法的方法流程图;
图14为本申请实施例提供的一种图像脱敏装置的装置结构图;
图15为本申请实施例提供的另一种图像脱敏装置的装置结构图;
图16为本申请实施例提供的一种终端设备的结构图;
图17为本申请实施例提供的一种服务器的结构图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
由于在很多领域中,都会通过摄像装置采集到可能包括个人待脱敏内容的视频图像,均需要应用图像脱敏技术来避免待脱敏内容泄露,以为用户提供一个安全的使用环境。
相关技术中,主要通过马赛克涂抹的方式对图像中涉及待脱敏内容的部分进行处理,会破坏一些非隐私区域的图像信息,严重降低图像质量,而且会降低图像的美观性,影响用户的使用感受。
为此,本申请实施例提供了一种图像脱敏方法和相关装置,得到不影响图像质量的脱敏图像,而且不同的图像风格可以为脱敏带来趣味性,提高了用户体验。
也就是说,相对于相关技术,本申请实施例提供了一种友好型脱敏:在去除图像中隐私信息或者说敏感信息的同时,尽量不破坏图像中与隐私信息无关的其它区域信息,且尽量维持图像的美观性。这种友好型脱敏可以应用于大量智慧交通、安防场景中,例如至少可以应用于以下场景:
训练数据回传:
自动驾驶、高级辅助驾驶的需要使用图像感知算法检测出行车场景中的各类目标,例如行人、车辆、车道线、交通牌、交通灯、可行驶区域等目标,这些感知算法的开发和迭代需要用到大量的图像数据,如果只依赖专用图像数据采集车来采集显然是不能满足需求的。这时可以将市场上量产车拍到的图像回传,由于量产车数量多且分布广,对图像数据的数量和多样性都有较强保证。
而从车端回传的图像会包含人脸等隐私信息,需要先进行脱敏处理。如果使用相关技术中的对矩形框打码或涂抹的方法,不利于感知模型的训练。而使用本申请提出的图像脱敏方法,则可以在实现脱敏的同时极大限度地避免图像被破坏,对模型训练是友好的。
驻车哨兵模式:
车辆在驻车状态下,可以通过雷达等传感器实时感知周围情况,当检测到有人靠近等异常情况时,将信息实时通知给车主,车主可以用手机等设备,通过车载摄像头远程实时查看车辆周围情况。这时需要对推送给车主的图像进行脱敏,如果使用相关技术中的对矩形框打码或涂抹的方法,脱敏后的图像质量粗糙。
而使用本申请提出的方法,可以将人脸替换为例如动漫脸等风格,增加实时视频的美观性和趣味性,有利于提高产品的竞争力。
除了上述智慧交通场景外,本申请还可以应用于远程自动泊车等产品应用,这些应用也需要实时推送视频,帮助车主实时掌握车辆周围情况,使用本申请提出的脱敏方法,也可以达到类似上述的效果。且本申请的应用场景并不限于智慧交通场景,在例如安防等其它任何需要人脸脱敏的场景中都可以使用。
本申请实施例所提供的图像脱敏方法可以通过计算机设备实施,该计算机设备可以是终端设备或服务器,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
本申请实施例涉及人工智能(Artificial Intelligence,AI),人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
在本申请实施例中主要涉及上述计算机视觉技术、机器学习、智慧交通等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
例如,本申请实施例可以通过计算机视觉技术确定待脱敏图像中的待脱敏内容的识别、待脱敏内容外轮廓的识别等,还可以确定图像样本和重待脱敏内容间的语义相似性、脱敏样本和重建脱敏内容间的语义相似性等。
本申请实施例还可以通过机器学习来训练内容生成模型和风格转换模型。
可以理解的是,在本申请的具体实施方式中,在进行图像脱敏前,待脱敏图像以及用于训练的图像样本中会涉及到用户人脸等待脱敏内容,当本申请以上实施例运用到具体产品或技术中时,每一项均需要单独获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
图1为本申请实施例提供的一种图像脱敏场景的示意图,针对前述计算机设备,在本实施例中示例性的以服务器100为例进行说明。其中包括待脱敏内容的待脱敏图像示例性的为包括真实人脸内容的待脱敏图像。
在服务器100获取包括真实人脸内容的待脱敏图像时,为了保护待脱敏内容的安全,可以对待脱敏图像进行图像脱敏处理。服务器100确定该真实人脸内容的外轮廓在待脱敏图像中的外轮廓曲线,该外轮廓曲线可以准确的标识出真实人脸内容所在的区域,以及标识出待脱敏图像中真实人脸内容的形状,由此可起到准确区分出待脱敏图像中待脱敏内容和非待脱敏内容的边界的作用。
而且外轮廓曲线可以有效标识出待脱敏内容的大致结构,例如真实人脸内容的角度、脸型的大小宽窄等,可以作为服务器100生成脱敏内容的依据。在图1示出的场景中,通过外轮廓曲线可以标识出真实人脸内容的人脸角度为侧脸,脸型较小等。为了避免附图泄露可能的隐私信息,在图1中为真实人脸内容处额外添加了避免隐私泄露的马赛克遮挡,该马赛克并非待脱敏图像的实际内容,即图1中待脱敏图像实际上并没有该马赛克。
由此,服务器100可以根据该外轮廓曲线生成对应的脱敏内容,通过脱敏内容替换待脱敏图像中的待脱敏内容,不会破坏待脱敏图像中非待脱敏内容的图像质量。例如,服务器100可以采用本身部署的内容生成模型200确定外轮廓曲线对应的脱敏内容。
而且,脱敏内容和作为待脱敏内容的真实人脸内容具有相同的内容类型和不同的图像风格,即脱敏内容也是人脸类型,其内容也是一张人脸,但是图像风格不同,即不属于真实图像风格,例如可以属于动漫风格。
相同的内容类型使得脱敏内容处于原待脱敏内容的图像位置时,和待脱敏图像中非待脱敏内容在图像整体上并不突兀,比如图1中真实人脸内容周边有头发,下面是身体部分,即使真实人脸内容被替换为动漫人脸内容,也和周边的头发和下面的身体部分间能够建立内容关联,并不会显得突兀。
且不同的图像风格可以体现出脱敏内容与非待脱敏内容间的画风区别,有效的提示用户此处为脱敏内容,而非待脱敏图像中的原内容,避免出现误导。
由此可见,通过本申请提供图像脱敏方法,仅会对待脱敏内容进行替换,并不会影响非待脱敏内容部分的图像质量(例如图1的脱敏图像中的头发、身体部分的图像质量未受到影响),而且替换的脱敏内容与原待脱敏图像中其他非待脱敏内容间也很建立合理的内容联系,不会显得突兀,由此从多方面综合提升了脱敏图像的质量,而且不同的图像风格可以为脱敏带来趣味性,提高了用户体验。
图2为本申请实施例提供的一种图像脱敏方法的方法流程图,所述方法包括:
S201:获取待脱敏图像,所述待脱敏图像中包括待脱敏内容。
待脱敏图像是包括了待脱敏内容的图像,其中,待脱敏内容可以是任何涉及用户隐私的敏感内容或者说隐私内容,例如用户的生物学特征、社会学特征等,生物学特征可以包括人脸、指纹、掌纹等,社会学特征可以包括身份证、证件号码、手机号码等。除此之外,还可以包括有传播危害的内容,例如不当暴露的肢体、不当行为等,本申请对此不做限定。
需要注意的是,待脱敏图像中可以包括不止一个待脱敏内容,例如包括多张真实人脸的情况,在本实施例中,主要以一个待脱敏内容为例进行说明,不同的待脱敏内容可以通过复用本申请的图像脱敏方案实现图像脱敏。例如,针对包括多个待脱敏内容的待脱敏图像,可以通过并行实施本申请的图像脱敏方案完成对该对脱敏图像的图像脱敏。
本申请可以从多种来源获取待脱敏图像,例如从智慧交通、安防等领域的采集设备实施获取的视频帧,也可以是历史图像等。
在一种可能的实现方式中,所述待脱敏图像是通过智慧交通领域中的采集设备(例如车载终端)得到的。也就是说,本申请实施例可以进行实时的图像脱敏任务,也可以进行非实时的图像脱敏任务,例如在有外部设备请求获取车辆环境图像时,车载终端再对请求获取的该车辆环境图像进行图像脱敏处理,又例如车载终端可以在系统资源相对空闲时再对已采集的车辆环境图像进行图像脱敏。
通过图像脱敏,避免了用户的待脱敏内容被随意传播、查看,提高了所涉及领域的图像传输安全性。
S202:确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线。
待脱敏内容的外轮廓可以准确的标识出待脱敏内容在待脱敏图像中与非待脱敏内容间的边界,外轮廓在所述待脱敏图像中的外轮廓曲线标识出了待脱敏内容在待脱敏图像中的准确范围,故基于该外轮廓曲线进行图像脱敏,不会影响待脱敏图像中非待脱敏内容的正常显示和图像质量。
本申请不限定如何确定待脱敏内容的外轮廓曲线,在一种可能的实现方式中,S202包括:
S2021:对所述待脱敏图像进行待脱敏内容检测,得到所述待脱敏图像中对应所述待脱敏内容的检测框。
S2022:根据所述检测框和所述待脱敏图像生成对应待脱敏内容的扩张裁剪图像。
S2023:对所述扩张裁剪图像进行待脱敏内容分割,得到所述待脱敏内容的外轮廓对应的外轮廓曲线。
上述检测框可以标识出待脱敏内容在待脱敏图像中的可能区域,如图3所示,待脱敏图像中包括作为待脱敏内容的真实人脸内容,其中对应的人脸检测框可以如图3的部分(2)所示,为了避免附图泄露可能的隐私信息,在图3中为真实人脸内容处额外添加了避免隐私泄露的马赛克遮挡,该马赛克并非待脱敏图像的实际内容,即例如部分(1)-部分(4)所示的待脱敏图像实际上并没有该马赛克,从而需要通过待脱敏内容脱敏来避免真实人脸被不当传播。
为了提高外轮廓曲线的提取精度,以及在待脱敏图像中具有多个待脱敏内容时,避免错误提取外轮廓曲线,需要在提取外轮廓曲线前,基于识别的待脱敏内容进行扩张裁剪,得到扩张裁剪图像,例如图3的部分(3)所示。
服务器可以通过人脸分割的方式从扩张裁剪图像中确定出待脱敏内容的外轮廓对应的外轮廓曲线,例如图3的部分(4)和部分(5)所示,服务器确定出真实人脸内容的人脸mask,基于人脸mask进行外轮廓提取,得到对应的外轮廓曲线,如部分(5)。
通过上述方式,可以提高外轮廓曲线的提取精度,以及在待脱敏图像中具有多个待脱敏内容时,避免错误的提取外轮廓曲线,比如将多个待脱敏内容作为一个待脱敏内容进行提取,而将一些非待脱敏内容涵盖到提取的外轮廓曲线中。由此提升了后续的脱敏精度。
S203:根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容。
该外轮廓曲线可以准确的标识出待脱敏内容所在的区域以及区域形状,由此可起到准确区分出待脱敏图像中待脱敏内容和非待脱敏内容的边界的作用。而且外轮廓曲线所体现出的形状信息可标识出待脱敏内容的大致结构,故服务器可以依据外轮廓曲线准确的生成形状符合外轮廓曲线的脱敏内容,由此在将脱敏内容替换待脱敏内容时,降低了待脱敏图像中非待脱敏内容被遮盖、破坏的可能。
需要注意的是,该脱敏内容与该待脱敏内容具有相同的内容类型、不同的图像风格。
相同的内容类型使得脱敏内容处于原待脱敏内容的图像位置时,和待脱敏图像中非待脱敏内容在图像整体上并不突兀,且脱敏内容能够与非待脱敏内容建立原来与待脱敏内容间的内容关联。例如原本真实人脸内容的位置被替换为动漫人脸内容时,
由于替换前后的内容都属于相同的内容类型,故替换后的脱敏图像在内容上并不会缺失脱敏内容与非待脱敏内容间的关联。例如相较于相关技术中通过马赛克涂抹待脱敏内容的突兀情况,采用同一内容类型的脱敏内容替换待脱敏内容会让脱敏内容更融入到原图像中,对图像的美观性影响较低。
不同的图像风格可以体现出脱敏内容与非待脱敏内容间的画风区别,有效的提示用户此处为脱敏内容,而非待脱敏图像中的原内容,避免出现误导。
在一种可能的实现方式中,所述脱敏内容与所述待脱敏内容的内容类型为人脸类型,所述脱敏内容的图像风格为动漫风格,所述待脱敏内容的图像风格为现实风格。
例如原本真实人脸内容的位置被替换为动漫人脸内容时,由于都属于人脸类型,故替换后的脱敏图像在内容上并不会缺失动漫人脸内容与非待脱敏内容间的关联。例如相较于相关技术中通过马赛克涂抹真实人脸的突兀情况,采用动漫人脸内容替换真实人脸内容会让动漫人脸内容更融入到原图像中,对图像的美观性影响较低。
如前所述,如果使用对矩形的检测框对真实人脸进行打码或涂抹的方法,会大大降低图像的美观性,影响用户的使用感受。
而在本实现方式中,可以将真实人脸内容替换为动漫人脸内容,增加脱敏图像的美观性,尤其当待脱敏图像为实时视频中的视频帧时,脱敏后,用户可以看到实时视频中的动漫人脸,在脱敏的基础上增加了趣味性,提高了用户体验,而且有利于提高图像脱敏产品的竞争力。
S204:通过将所述待脱敏图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏图像。
由于脱敏内容的形状符合待脱敏内容的外轮廓曲线,故在进行针对图像脱敏的替换后,脱敏图像中的脱敏内容并不会影响到其他非待脱敏内容,在消除待脱敏内容的同时,极大限度避免了对图像中非待脱敏内容的破坏,同时增加了图像的美观性和趣味性,有利于对图像数据的回传使用或者脱敏后下游应用的开发。
由此可见,在获取包括待脱敏内容的待脱敏图像时,为了保护待脱敏内容的安全,可以对待脱敏图像进行图像脱敏处理。可确定待脱敏内容的外轮廓在该待脱敏图像中的外轮廓曲线,并生成形状符合外轮廓曲线的脱敏内容。由于外轮廓曲线可以准确区分出待脱敏图像中待脱敏内容和非待脱敏内容的边界,通过脱敏内容替换待脱敏图像中的待脱敏内容,不会破坏待脱敏图像中非待脱敏内容的图像质量。而且,脱敏内容和待脱敏内容具有相同的内容类型和不同的图像风格,相同的内容类型使得脱敏内容处于原待脱敏内容的图像位置时,和待脱敏图像中非待脱敏内容在图像整体上并不突兀,且脱敏内容能够与非待脱敏内容建立原来与待脱敏内容间的内容关联,不同的图像风格可以体现出脱敏内容与非待脱敏内容间的画风区别,有效的提示用户此处为脱敏内容,而非待脱敏图像中的原内容,避免出现误导。由此,通过待脱敏内容外轮廓曲线生成的脱敏内容可以有效的实现图像脱敏,得到不影响图像质量的脱敏图像,而且不同的图像风格可以为脱敏带来趣味性,提高了用户体验。
如前所述,服务器可以通过内容生成模型来生成脱敏内容。
故在一种可能的实现方式中,S203包括:根据所述外轮廓曲线,通过内容生成模型生成形状符合所述外轮廓曲线的脱敏内容。
该内容生成模型是一种基于外轮廓曲线生成与待脱敏内容具有相同内容类型的脱敏内容的模型,而且,生成的脱敏内容和待脱敏内容具有不同的图像风格,故为此,本申请实施例提供了一种可选的训练内容生成模型的方式,包括如下步骤,需要注意的是,训练内容生成模型的可以是前述计算机设备,也可以是其他设备,本申请对此不做限定。
S301:获取包括轮廓-脱敏样本对的训练数据集。
所述轮廓-脱敏样本对中的轮廓样本和脱敏样本具有相同的样本外轮廓曲线,所述脱敏样本与所述脱敏内容具有相同的图像风格。
也就是说,为了训练出能够生成脱敏内容的内容生成模型,需要采用与脱敏内容具有相同图像风格的脱敏样本,例如当脱敏内容为动漫风格是,脱敏样本也为动漫风格,而且,该脱敏样本是基于需要脱敏的待脱敏内容确定的,即脱敏样本的内容类型与待脱敏内容的内容类型相同。
在本申请实施例中,训练数据集中的每一个轮廓-脱敏样本对中,脱敏样本的形状符合该轮廓-脱敏样本对中轮廓样本所标识的样本外轮廓曲线,由此才能在训练过程中起到正确指导内容生成模型学习到生成符合外轮廓曲线的脱敏内容的相关知识。
如图4示出了训练数据集中的三个轮廓-脱敏样本对,分别为轮廓-脱敏样本对1、轮廓-脱敏样本对2和轮廓-脱敏样本对3。
每一个轮廓-脱敏样本对的示例中,左侧为轮廓样本,右侧为脱敏样本。
S302:根据所述轮廓样本,通过初始生成器得到与所述脱敏内容具有相同图像风格的第一预测脱敏内容。
S303:根据所述轮廓样本、所述脱敏样本和所述第一预测脱敏内容,通过初始判别器得到第一判别结果和第二判别结果。
所述第一判别结果用于标识所述脱敏样本的形状是否符合所述样本外轮廓曲线、以及所述脱敏样本是否符合所述目标风格,所述第二判别结果用于标识所述第一预测脱敏内容的形状是否符合所述样本外轮廓曲线、以及所述第一预测脱敏内容是否符合所述目标风格。
S304:基于所述第一判别结果和所述第二判别结果生成对第一对抗损失函数,通过所述第一对抗损失函数对所述初始生成器和所述初始判别器进行对抗训练。
S305:根据所述初始生成器,通过所述对抗训练得到所述内容生成模型。
其中,初始生成器和初始判别器构成的网络结构可以如图5所示,其中G为初始生成器,D为初始判别器。Areal为轮廓-脱敏样本对中轮廓样本,Breal为轮廓-脱敏样本对中脱敏样本,Bfake为第一预测脱敏内容。初始判别器根据Breal+Areal得到第一判别结果,根据Bfake+Areal得到第二判别结果。
服务器可以基于第一判别结果和第二判别结果来确定第一对抗损失函数LGAN(G,D),并基于该第一对抗损失函数对图5示出的网络结构进行对抗训练,将初始生成器D训练为前述内容生成模型。
其中第一对抗损失函数可以简化如下式:
LGAN(G,D)=Ex,y[logD(x,y)]+Ex,z[log(1-D(x,G(x)))]
其中,x为轮廓样本,y为脱敏样本,z为初始生成器由x生成的第一预测脱敏内容,E为期望。
对抗训练的实质是指初始生成器和初始判别器之间的对抗,即在对抗训练中,优化目标是让初始生成器输出的第一预测脱敏内容能够骗过初始判别器,让初始判别器判定第一预测脱敏内容为脱敏样本,并使初始判别器尽可能的精准,能够准确的识别出输入的是第一预测脱敏内容还是脱敏样本,避免被初始生成器欺骗。
由于第一判别结果用于标识所述脱敏样本的形状是否符合所述样本外轮廓曲线、以及所述脱敏样本是否符合所述目标风格,第二判别结果用于标识所述第一预测脱敏内容的形状是否符合所述样本外轮廓曲线、以及所述第一预测脱敏内容是否符合所述目标风格,故通过第一判别结果和第二判别结果确定的第一对抗损失函数可以准确的指导如何生成更符合目标类型和样本外轮廓曲线的第一预测脱敏内容,以及如何判别出第一预测脱敏内容,从而训练得到的内容生成模型不仅要在图像风格上与脱敏内容相似,而且在内容结构上也要符合图像样本中待脱敏内容的分布。从而可以基于输入的外轮廓曲线生成符合目标类型和外轮廓曲线的脱敏内容。
在进行对抗训练的过程中,一种可能的实现方式下,S304包括:
通过固定所述初始判别器的模型参数,以最小化所述对抗损失函数为优化目标,调整所述初始生成器的模型参数;
通过固定所述初始生成器的模型参数,以最大化所述对抗损失函数为优化目标,调整所述初始判别器的模型参数。
即在调整初始判别器的模型参数时,不改变初始生成器的模型参数,在调整初始生成器的模型参数时,不改变初始判别器的模型参数。以上固定一方,调整另一方的训练方式可以交替执行。
即采用极大极小零和博弈的训练方式,价值函数G*为:
G*=arg minGmaxDLGAN(G,D)
通过上述对抗训练方式,可以有效的调整初始生成器,提升内容生成模型的模型精度。
需要注意的是,在获取训练数据集时,一般情况下,待脱敏内容对应的外轮廓曲线都是预先标注好的,例如当待脱敏内容为真实人脸内容时,收集到的这类待脱敏内容的外轮廓曲线都已标注,而脱敏内容的外轮廓曲线一般没有足量的标注数据,若要额外进行标注的话,会浪费大量的人力物力,而且当脱敏内容为动漫风格时,动漫人脸的轮廓与真实人脸的轮廓还是具有差异,从而会导致生成的动漫人脸与作为待脱敏内容的真实人脸不能足够贴合,使得脱敏图像中的脱敏内容与其他非待脱敏内容贴合度不高。
故针对包括待脱敏内容的图像样本,本申请实施例提供了一种通过图像样本中已标注的待脱敏内容的外轮廓曲线作为样本外轮廓曲线,这里提及的图像样本和待脱敏图像的图像风格均为源风格。由此可以大大降低标注成本,提高训练效率和训练精度。而且,由于内容生成模型是基于外轮廓曲线进行脱敏内容的生成的,故生成的脱敏内容虽然与待脱敏内容具有相同的内容类型,但是在内容分布上并不完全相似,以人脸为例,脱敏内容中虽然也是人脸,但是其五官、表情等会与待脱敏内容中的真实人脸有所区别,有效的降低了脱敏内容中的敏感信息的程度,高质量的实现了脱敏的作用。
为了能够准确获取匹配的样本外轮廓曲线和脱敏样本构成轮廓-脱敏样本对,在一种可能的实现方式中,训练数据集通过风格转换模型得到,包括如下步骤:
S401:获取所述图像样本,所述图像样本中待脱敏内容的外轮廓被标注了所述样本外轮廓曲线。
S402:根据所述图像样本,通过风格转换模型得到对应的所述脱敏样本。
S403:基于所述图像样本对应的样本外轮廓曲线和脱敏样本构建所述训练数据集。
由于作为风格转换模型输入的图像样本中包括了待脱敏内容,而且待脱敏内容的外轮廓已被标注,故风格转换模型可以依据图像样本中待脱敏内容在内容分布上的指导,以及样本外轮廓曲线在范围和形状上的指导,准确的生成形状符合样本外轮廓曲线的脱敏样本,而且该脱敏样本的内容分布接近图像样本中待脱敏内容的内容分布,以待脱敏内容为真实人脸内容,脱敏样本为动漫人脸内容为例,接近的内容分布可以是指真实人脸内容和动漫人脸内容中人脸的分布接近,例如真实人脸内容中耳朵的位置和动漫人脸内容中耳朵的位置接近等。
该风格转换模型是一种基于外轮廓曲线和待脱敏内容生成与待脱敏内容具有相同内容类型的脱敏内容的模型,而且,生成的脱敏内容和待脱敏内容具有不同的图像风格,故为此,本申请实施例提供了一种可选的训练风格转换模型的方式,包括如下步骤,需要注意的是,训练内容生成模型的可以是前述计算机设备,也可以是其他设备,本申请对此不做限定。
所述风格转换模型通过如下方式训练得到:
S501:获取图像风格为所述目标风格的脱敏图像。
S502:根据所述图像样本,通过初始源-目标生成器得到第二预测脱敏内容;以及根据所述脱敏图像,通过初始目标-源生成器得到预测待脱敏内容。
S503:根据所述第二预测脱敏内容和所述脱敏图像,通过初始目标风格判别器得到第三判别结果,以及根据所述预测待脱敏内容和所述图像样本,通过初始源风格判别器得到第四判别结果。
所述第三判别结果用于分别标识所述第二预测脱敏内容和所述脱敏图像是否符合所述目标风格;所述第四判别结果用于分别标识所述第一预测待脱敏内容和所述图像样本是否符合所述源风格。
S504:基于所述第三判别结果和所述第四判别结果生成对抗损失。
S505:根据所述第二预测脱敏内容,通过所述初始目标-源生成器得到重建待脱敏内容;以及根据所述预测待脱敏内容,通过所述初始源-目标生成器得到重建脱敏内容。
S506:生成用于标识所述图像样本和所述重建待脱敏内容间差异的第一重建差异损失,以及生成用于标识所述脱敏内容和所述重建脱敏内容间差异的第二重建差异损失。
S507:根据所述对抗损失、所述第一重建差异损失和所述第二重建差异损失生成第二对抗损失函数,通过所述第二对抗损失函数对所述初始源-目标生成器、所述初始目标-源生成器、所述初始目标风格判别器和所述初始源风格判别器进行对抗训练。
S508:根据所述初始源-目标生成器,通过所述对抗训练得到所述风格转换模型。
训练得到风格转换模型的网络结构可以如图6所示,
其中GB为初始源-目标生成器,GA初始目标-源生成器,DB为初始目标风格判别器,DA初始源风格判别器。Areal为图像样本,Breal为脱敏图像,Afake为预测待脱敏内容,Bfake为第二预测脱敏内容。Arec为重建待脱敏内容,Brec为重建脱敏内容。GB用于最终生成风格转换模型。虚线部分用于标识生成重建待脱敏内容和重建脱敏内容的流程方向。
其中,待脱敏内容的内容类型为源类型,脱敏内容的内容类型为目标类型。在此网络结构中,以两路风格转换结构进行构建,一路是从源类型到目标类型的转换和判别,由GB和DB构成,一路是从目标类型到源类型的转换和判别,由GA和DA构成。这么设计网络结构的目的是可以实现对生成器生成的预测内容(例如预测待脱敏内容和第二预测脱敏内容)进行重建,由此可以通过基于重建得到的重建差异损失来对生成器的预测能力进行调优。
以第一重建差异损失为例,由于重建待脱敏内容是基于初始源-目标生成器生成的第二预测脱敏内容得到的,第二预测脱敏内容在内容分布上的质量高低能够体现在重建待脱敏内容与图像样本间的差异大小上。
该差异主要体现在图像语义上,以待脱敏内容为真实人脸内容为例,如果重建待脱敏内容的耳朵与图像样本中耳朵的位置一致,则针对耳朵的差异就比较小,如果重建待脱敏内容的鼻子与图像样本中鼻子的位置不一致,则针对鼻子的差异就比较大。而决定重建待脱敏内容中语义分布的主要是前述的第二预测脱敏内容,也就是说,如果第二预测脱敏内容与图像样本的语义分布越接近,基于第二预测脱敏内容得到的重建待脱敏内容与图像样本间的差异就越小。
而针对上述网络结构中的每一路风格转换结构,也可以通过类似前述训练内容生成模型所采用的对抗训练思路进行对抗损失的生成。
以包括初始源-目标生成器和初始目标风格判别器构成的一路风格转换结构为例,所构建的对抗损失的优化目标是让初始源-目标生成器输出的第二预测脱敏内容能够骗过初始目标风格判别器,让初始目标风格判别器判定第一预测脱敏内容为脱敏样本,并使初始目标风格判别器尽可能的精准,能够准确的识别出输入的是第一预测脱敏内容还是脱敏样本,避免被初始源-目标生成器欺骗。
前述的对抗损失的表达可以拆解为两个,分别对应不同路的风格转换结构。
针对包括初始源-目标生成器和初始目标风格判别器构成的一路风格转换结构,可以如下式:
其中,pdata(Breal)用于标识Breal的提取范围,可以理解为脱敏图像的集合;pdata(Areal)用于标识Areal的提取范围,可以理解为图像样本的集合。
针对包括初始目标-源生成器和初始源风格判别器构成的一路风格转换结构,可以如下式:
第一重建差异损失的表达可以入下式:
第二重建差异损失的表达可以入下式:
最终生成的第二对抗损失函数的表达可以入下式:
其中,λ为权重。
由于第三判别结果用于分别标识所述第二预测脱敏内容和所述脱敏图像是否符合所述目标风格;第四判别结果用于分别标识所述第一预测待脱敏内容和所述图像样本是否符合所述源风格。故通过第三别结果和第四判别结果确定的对抗损失可以准确的指导如何生成更符合目标类型的第二预测脱敏内容,以及如何判别出第二预测脱敏内容。由于第一重建差异损失用于标识图像样本和重建待脱敏内容间差异,第二重建差异损失用于标识脱敏内容和重建脱敏内容间差异。故根据对抗损失、第一重建差异损失和第二重建差异损失生成的第二对抗损失函数的指导,还可以让风格转换模型能够生成内容分布与图像样本相似的第二预测脱敏内容。
在进行对抗训练的过程中,一种可能的实现方式下,S507包括:
通过固定所述初始目标风格判别器和所述初始源风格判别器的模型参数,以最小化所述第二对抗损失函数为优化目标,调整所述初始源-目标生成器和所述初始目标-源生成器的模型参数。
通过固定所述初始源-目标生成器和所述初始目标-源生成器的模型参数,以最大化所述第二对抗损失函数为优化目标,调整所述初始目标风格判别器和所述初始源风格判别器的模型参数。
以上固定一方,调整另一方的训练方式可以交替执行。
即采用极大极小零和博弈的训练方式,价值函数G*为:
G*=arg minGmaxDLoss
通过上述对抗训练方式,可以有效的调整初始源-目标生成器,提升风格转换模型的模型精度。
针对作为生成器的初始源-目标生成器和初始目标-源生成器,其任意一个的生成器网络结构可以如图7所示,在编码器和解码器之间设置有上下文信息提取模块。
所述上下文信息提取模块包括不同扩张率的扩张卷积层,所述不同扩张率的扩张卷积层用于提升解码器的感受野。
设计生成器网络时,网络输入为可以红绿蓝RGB图像(例如图像样本),输出为分辨率与输入相同的三通道特征(脱敏样本)。
基于脱敏考虑,为了避免保留过多的细节信息,在风格转换的脱敏过程中,特征的长和宽都通过图7中的下采样模块下采样为原来的1/4。由于下采样倍数过小,容易造成上下文信息不足,这会导致后续解码器能够获取的信息较少。
为此,在编码器和解码器之间设置了上下文信息提取模块,上下文信息提取模块的结构为不同扩张率组成的扩张卷积金字塔,以此为后续的解码器增加网络感受野。例如图7中示出了四种不同扩张率的情况,每个矩形特征图中大小不一的矩形框用于表示不同扩张率的扩展卷积后对应的感受野。
采用多个扩张率的好处在于可以结合多个扩张率输出的上下文信息,提高为解码器提供有效感受野的概率,有助于提升解码器的还原精度。
最后使用较轻量的解码器将特征还原到输入分辨率。
初始源-目标生成器和初始目标-源生成器的网络结构可以均如图7所示。可例如分别负责真实人脸内容到动漫人脸内容、动漫人脸内容到真实人脸内容的风格转换。
在图7中还示出了网络结构所包括的残差卷积模块、下采样模块和上采样模块的可能结构。
其中,残差卷积模块包括卷积层(conv),实例规范层(InstanceNorm,用于风格化迁移的函数),在实例规范层还包括ReLU(一种激活函数)的处理。
下采样模块在拼接层(Concat)前,包括两路并列的输入,分别是最大池化层和卷积层,所采用的步长(stride)为2。
上采样模块在实例规范层前设置有转置层(Transpose),所采用的步长(stride)为2。
前述训练得到风格转换模型的网络结构中包括的初始目标风格判别器和初始源风格判别器均属于判别器,判别器的输入为所对应生成器输出的第二预测脱敏内容或脱敏图像,输出为长和宽都下采样为原来1/16的特征图,特征图通道数为1,其结构可以如图8所示,图8的右侧示出的是所对应层的输出特征图尺寸。
可以使用两个独立的如图8所示的判别器,分别与初始目标风格判别器和初始源风格判别器对应。
由于内容生成模型和风格转换模型均是将源类型的输入图像转换为目标类型的输出图像,故在一种可能的实现方式中,所述初始生成器、所述初始源-目标生成器和所述初始目标-源生成器具有相同的模型结构,所述初始判别器、所述初始目标风格判别器和所述初始源风格判别器具有相同的模型结构。
由于风格转换模型是用于确定训练数据集的,过一般会先于内容生成模型搭建完成,故在构建针对内容生成模型的网络结构时,针对网络结构中的初始生成器,可以复用初始源-目标生成器的模型结构来得到初始生成器,针对初始判别器,可以复用初始目标风格判别器的模型结构来得到初始判别器。由此提高本申请实施例中模型结构的搭建效率。
针对风格转换模型的整个训练过程以及基于风格转换模型所生成的训练数据集,涉及到的脱敏图像、图像样本、样本外轮廓曲线和脱敏样本可以如图9所示,可以看出,基于图像样本和所标识的样本外轮廓曲线所生成的脱敏样本,不仅内容类型区分性很强,而且在图像语义的分布上也与图像样本近似,可以有效的为后续进行内容生成模型的训练进行指导。而脱敏图像可以不用与图像样本有内容上的关联,只要是符合目标类型的均可作为脱敏图像。
需要说明的是,在图9中针对图像样本,为了避免附图泄露可能的隐私信息,在图9中为图像样本的真实人脸内容处额外添加了避免隐私泄露的马赛克遮挡,该马赛克并非图像样本的实际内容,即实际的图像样本上并没有该马赛克。
接下来基于图像脱敏场景,并结合图10和图11对本申请实施例进行整体说明,在图10和图11所示的场景中,待脱敏内容为真实人脸内容,脱敏内容为动漫人脸内容。
针对图11,和前述图3和图9相同的理由,为了避免附图泄露可能的隐私信息,在图11中为图像样本的真实人脸内容处额外添加了避免隐私泄露的马赛克遮挡,该马赛克并非图像样本的实际内容,即实际的图像样本上并没有该马赛克。
S11:检测人脸
针对待脱敏图像,如图11的部分(1)所示,可以先通过人脸检测模型进行人脸检测,确定人脸检测框,如图11的部分(2)所示。
S12:人脸扩张与裁剪
基于人脸检测框,通过扩展与裁剪,可以得到人脸图像,如图11的部分(3)所示。
S13:分割人脸mask
通过人脸分割模型可以对人脸图像进行分割,从人脸图像中分割出人脸mask,如图11的部分(4)所示。
S14:提取外轮廓曲线
由于人脸mask可以标识出真实人脸的外轮廓,故可以基于人脸mask提取待脱敏图像中真实人脸内容的外轮廓曲线,如图11的部分(5)所示。
S15:根据外轮廓曲线生成动漫人脸
可以基于前述内容生成模型,确定外轮廓曲线对应的动漫人脸内容,如图11的部分(6)所示。该动漫人脸内容的形状符合前步骤提取的外轮廓曲线,且人脸五官分布与真实人脸内容相似。
S16:用动漫人脸替换真实人脸
由于本申请实施例可以生成高质量的动漫人脸内容,故通过替换待脱敏图像中的真实人脸内容后得到的脱敏图像在图像整体上并不突兀,且脱敏内容能够与非待脱敏内容建立原来与待脱敏内容间的内容关联,不同的图像风格可以体现出脱敏内容与非待脱敏内容间的画风区别,有效的提示用户此处为脱敏内容,而非待脱敏图像中的原内容,避免出现误导,而且不同的图像风格可以为脱敏带来趣味性,提高了用户体验。
通过S16替换了真实人脸内容的脱敏图像可以如图11的部分(7)所示。
接下来结合S2021和S2023对确定检测框的检测模型和进行待脱敏内容分割的分割模型进行说明。上述实施例中提及了用于确定人脸检测框的人脸检测模型可以是一种检测模型,上述实施例中提及了确定人脸mask的人脸分割模型可以是一种分割模型。
针对前述S2021:对所述待脱敏图像进行待脱敏内容检测,得到所述待脱敏图像中对应所述待脱敏内容的检测框。
可以通过检测模型确定待脱敏内容的检测框,该检测模型的训练和设计思路如下(以待脱敏内容为真实人脸内容为例):
确定网络输出层每个位置的锚框数量B,将人脸矩形框的宽和高视为特征,并用k-mean对所有人脸矩形框聚类为B类,再取这B类的类心为对应锚框的宽和高。
设计针对人脸的检测模型,网络结构可以如图12所示,由于人脸比较小,网络只下采样到原来的1/8,维持较高分辨率的特征。输出层的通道数为B*(4+1+c),其中B为锚框数量,4代表对每个锚框的中心横坐标、中心纵坐标、长、宽的偏移回归量,1代表是否为目标的置信度,c为目标类别,这里为1类。因此输出特征通道为B*6。
在图12中,ConvBnRelu为Conv(卷积)+BN(归一化,Batch Normalization)+Relu(线性修正单元,Rectified Linear Unit)的网络结构。
Res Block是构成ResNet的基础模块。
虚线框中右侧的参数为所对应网络结构的输出特征的尺寸参数。在图12中还示出了ConvBnRelu和Res Block这两个网络结构的具体构成。
针对检测模型的训练,确定损失函数为:
其中第一和第二行为预测框相对锚框中心点和宽高的偏移回归量损失,S表示输出特征图的宽和高;B则是前面提到的输出特征图每个位置上的锚框数量;代表询问输出特征图的(i,j)位置是否在目标,如果存在则值为1,否则为0;第三行为是否存在目标置信度损失;第四行是类别损失,在输出特征图上计算每种类别的损失之和;α,β,γ表示损失的权值。
检测模型可以基于图9中图像样本,并结合对应的人脸检测框进行训练得到。
针对前述S2023:对所述扩张裁剪图像进行待脱敏内容分割,得到所述待脱敏内容的外轮廓对应的外轮廓曲线。
可以通过分割模型对待脱敏内容进行分割,来提取外轮廓曲线。该分割模型的训练和设计思路如下(以待脱敏内容为真实人脸内容为例):
人脸分割可以复用初始生成器中的网络结构(例如图7所示),但下采样比例调整为1/8,输出特征图通道数调整为2。
针对分割模型的损失函数可使用交叉熵损失:
其中,c表示类别数,yc是一个one-hot向量,元素只有0和1两种取值,长度为类别数,每个位置表征一种类别,如果某个位置上对应的类别为标注的真实类别就取1,否则取0。pc表示预测样本属于c的概率。
分割模型可以基于图9中图像样本,并结合对应标注的人脸mask进行训练得到。
本申请实施例还提供了一种基于车端场景的图像脱敏方法,接下来结合图13进行说明。在本实施例中,以车载终端作为前述计算机设备为例进行说明,车载终端可以为用户提供目标车辆的车外环境的视频、图像采集的服务,并可以基于所采集视频、图像中是否具有待脱敏内容来进行本地脱敏工作,避免待脱敏内容被传输而造成可能的隐私泄露问题。除此之外,车载终端还可以提供其他智能服务功能,例如语音控制、应用安装、视频播放、车辆性能管理等。基于图13,上述方法包括如下步骤:
S1301:通过配置在目标车辆的车载终端,获取所述目标车辆对应的车辆环境图像。
车载终端可以采集目标车辆在不同方向、角度的车辆环境图像,本申请对此不做限定,基于方向和角度的不同,车辆环境图像至少可以包括车外环境图像和车内环境图像,车外环境图像为车载终端采集目标车辆外部环境所得到的车辆环境图像,车内环境图像为车载终端采集目标车辆内部环境所得到的车辆环境图像。
例如车外环境图像可以包括车载终端从目标车辆前方、后方采集的环境图像,以及从目标车辆两侧采集的环境图像等。车内环境图像可以包括车载终端从目标车辆内部采集的环境图像,如针对驾驶员、副驾驶、后排的环境图像等。
图像的采集可以在行车过程中进行,例如在目标车辆被正常行驶时、辅助驾驶时,车载终端采集目标车辆的车辆环境图像,车载终端也可以在准备停车时进行采集,车载终端也可以在目标车辆驻车时进行采集。也就是说,当有人经过目标车辆(不论是行驶中还是驻车时)周边或者进入目标车辆内部时,都有可能被目标车辆的车载终端采集到包括该人的车辆环境图像。
例如前述的驻车哨兵模式下,通过雷达等传感器实时感知周围情况,当检测到有人靠近或进入车内等异常情况时,将采集对应的车辆环境图像并实时脱敏后通知给车主,车主可以用手机等个人设备,通过APP调用车载摄像头远程实时查看脱敏图像或者查看车载终端本地保存的历史脱敏图像来了解车辆周围或内部的情况。
除此之外,在远程自动泊车等各种智慧交通场景下都需要通过车载终端采集车辆环境图像,这里不再一一赘述。
需要说明的是,本步骤获取的车辆环境图像可以是静态的单张图像,也可以是动态视频中的一帧,即该车辆环境图像为车载终端所采集车外环境视频中的一个视频帧。也就是说,本实施例中,可以实现车端场景下对静态图像或动态视频进行实时的待脱敏内容检测脱敏服务。
S1302:当确定所述车辆环境图像包括待脱敏内容时,根据所述待脱敏内容生成对应的脱敏内容。
由于目标车辆多处于人的活动区域,例如行车、驻车的场景下,周边时长会有人经过,故在目标车辆的车载终端进行车辆环境图像的采集时,车辆环境图像中会经常包括人像内容,尤其会有真实人脸的内容,这些都属于人的生物学特征,将会被车载终端识别为待脱敏内容,需要进行图像脱敏以避免待脱敏内容被不当扩散。
故当车载终端确定出车辆环境图像具有类似上述真实人脸内容的待脱敏内容时,会根据待脱敏内容生成对应的脱敏内容,该脱敏内容与待脱敏内容具有相同的内容类型、不同的图像风格。针对该脱敏内容的定义可以参见前述实施例的说明,这里不再赘述。
在本实施例中,不限定如何通过待脱敏内容得到对应的脱敏内容,例如在一种可能的实现方式中,S1302包括:确定所述待脱敏内容的外轮廓在所述车辆环境图像中的外轮廓曲线;根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的所述脱敏内容;通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏环境图像。
针对本实现方式的具体说明可以参照前述实施例的相关部分,这里不再赘述。也就是说,本实施例中待脱敏内容对应的脱敏内容可以基于前述图1-图12所对应实施例提供的方式实现。
S1303:通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像。
通过图像脱敏,可以将车辆环境图像中的待脱敏内容替换为不具有敏感信息的脱敏内容。使得脱敏环境图像即使被其他外部设备获取,也不能基于脱敏环境图像得到待脱敏内容,例如还原出真实人脸内容,从而避免了待脱敏内容的不当泄露,保护了用户的待脱敏内容的安全。
需要说明的是,为了保护用户的待脱敏内容的安全,针对车辆环境图像的图像脱敏是在车载终端侧完成的,并不需要将具有待脱敏内容的车辆环境图像发送给服务器或者其他外部设备就能实现图像脱敏。例如通过前述实施例提供的轻量级的内容生成模型,就能快捷的在车载终端本地实现对待脱敏图像进行实时或非实时的图像脱敏。
而且,由于车载终端是在本地进行的图像脱敏,并不依赖联网。即使在车载终端没有连接网络的离线情况下,也不会对车载终端的图像脱敏工作造成影响。使得本申请实施例提供的图像脱敏方式的适用范围更广,安全性更高。
为了进一步的提升待脱敏内容的安全,在一种可能的实现方式中,还可以在得到车辆环境图像对应的脱敏环境图像之后,在车载终端本地删除该车辆环境图像。由此,不论是通过车载设备或者外部设备都不能获得包括待脱敏内容的车辆环境图像,大大提升了待脱敏内容被泄露的可能。
不过在一些场景下,例如驻车场景中,包括待脱敏内容的车辆环境图像可能与一些针对目标车辆的异常事件相关,例如在目标车辆被剐蹭、被恶意破坏等,故车载终端也可以在识别出此类情况下时,有选择的本地保留车辆环境图像,目标车辆的用户或者相关人员可以在车载终端处查看车辆环境图像,从而确定异常行为的成因。
需要说明的是,即使可以在一些情况下在车载终端本地保留车辆环境图像,但是这些车辆环境图像(包含有待脱敏内容)仅能够通过车载终端查看,不能通过各种传输方式从车载终端转移到其他外部设备,例如用户的手机、网盘等,由此在保留车辆环境图像时也保证了待脱敏内容的安全性。
S1304:响应于外部设备针对所述车辆环境图像发送的获取请求,向所述外部设备返回所述脱敏环境图像。
由于车载终端一般与服务器或者用户的个人终端等外部设备间具有数据连接,故外部设备具备从车载终端请求获取所采集车辆环境图像的能力。外部设备为除了车载终端之外的设备,可以包括用户的手机等移动设备,也可以包括车载终端对应的服务器等。
例如目标车辆的用户可以通过手机APP请求调取某一个时段的车辆环境图像或者实时的车辆环境图像。车载终端对应的服务器也可以请求获取车载终端的车辆环境图像等。这些情况下,车载终端都会接收到对应的获取请求。
在接收到此类针对车辆环境图像的获取请求时,车载终端可以将基于车辆环境图像生成的脱敏环境图像代替车辆环境图像进行返回。
本申请不限定车载终端获取外部设备发送的获取请求的时机,例如获取请求可以由外部设备主动向车载终端发起,例如用户希望查看昨晚的车辆环境图像时,服务器周期性获取车辆环境图像时;也可以是在车载终端的提示下被动向车载终端发起的,如当车载终端识别到发生针对目标车辆的异常事件时,会向外部设备例如目标车辆的用户手机发送提示信息,用户可以在提示信息的提示下请求获取对应的车辆环境图像,以便及时在手机上进行查看。
故在一种可能的实现方式中,所述方法还包括:
当确定发生针对所述目标车辆的异常事件时,向所述外部设备发送提示信息,所述车辆环境图像是在所述异常事件发生时通过所述车载终端采集的;
获取所述外部设备基于所述提示信息发送的所述获取请求。
一般情况下,车载终端在目标车辆未遭遇异常事件不会主动向相关的外部设备发送提示信息,用户可以基于自身的查看需求来选择是否查看车辆环境图像,当目标车辆遭遇异常事件时,从安全保障的角度考虑,需要让目标车辆的用户能够尽早察觉,故车载终端在发现目标车辆遭遇异常事件时,会向对应的外部设备发送提示信息,以提示目标车辆遭遇了异常事件,处于不安全的情况。
车载终端可以在异常事件发生过程中进行车辆环境图像的采集,以尽可能记录异常事件的具体情况,故当用户通过外部设备基于提示信息进行车辆环境图像的获取时,车载终端可以将图像脱敏后的脱敏环境图像返回外部设备,以便用户查看异常事件的具体情况。
由此可见,在智慧交通的场景下,目标车辆的车载终端可以采集车辆环境图像,并在确定车辆环境图像具有待脱敏内容时生成脱敏内容进行替换,得到车辆环境图像对应的脱敏环境图像,当获取外部设备针对车辆环境图像的获取请求时,将脱敏环境图像代替车辆环境图像进行返回,而不会将具有待脱敏内容的车辆环境图像进行传输,从而有效避免了智慧交通场景下的待脱敏内容的不当泄露,大大提升了智慧交通场景下的待脱敏内容的安全性。
在前述图1-图12所对应实施例的基础上,图14为本申请实施例提供的一种图像脱敏装置的装置结构图,所述图像脱敏装置1400包括获取单元1401、确定单元1402、生成单元1403和替换单元1404:
所述获取单元1401,用于获取待脱敏图像,所述待脱敏图像中包括待脱敏内容;
所述确定单元1402,用于确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线;
所述生成单元1403,用于根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
所述替换单元1404,用于通过将所述待脱敏图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏图像。
在一种可能的实现方式中,所述生成单元还用于:
根据所述外轮廓曲线,通过内容生成模型生成形状符合所述外轮廓曲线的脱敏内容;
若所述脱敏内容的图像风格为目标风格,所述装置还包括第一训练单元,所述第一训练单元用于通过如下方式训练得到所述内容生成模型:
获取包括轮廓-脱敏样本对的训练数据集,所述轮廓-脱敏样本对中的轮廓样本和脱敏样本具有相同的样本外轮廓曲线,所述脱敏样本与所述脱敏内容具有相同的图像风格;
根据所述轮廓样本,通过初始生成器得到与所述脱敏内容具有相同图像风格的第一预测脱敏内容;
根据所述轮廓样本、所述脱敏样本和所述第一预测脱敏内容,通过初始判别器得到第一判别结果和第二判别结果,所述第一判别结果用于标识所述脱敏样本的形状是否符合所述样本外轮廓曲线、以及所述脱敏样本是否符合所述目标风格,所述第二判别结果用于标识所述第一预测脱敏内容的形状是否符合所述样本外轮廓曲线、以及所述第一预测脱敏内容是否符合所述目标风格;
基于所述第一判别结果和所述第二判别结果生成对第一抗损失函数,通过所述第一对抗损失函数对所述初始生成器和所述初始判别器进行对抗训练;
根据所述初始生成器,通过所述对抗训练得到所述内容生成模型。
在一种可能的实现方式中,所述样本外轮廓曲线是根据图像样本中待脱敏内容的外轮廓确定的,所述图像样本和所述待脱敏图像的图像风格均为源风格。
在一种可能的实现方式中,所述第一训练单元还用于:
通过固定所述初始判别器的模型参数,以最小化所述对抗损失函数为优化目标,调整所述初始生成器的模型参数;
通过固定所述初始生成器的模型参数,以最大化所述对抗损失函数为优化目标,调整所述初始判别器的模型参数。
在一种可能的实现方式中,所述获取单元还用于:
获取所述图像样本,所述图像样本中待脱敏内容的外轮廓被标注了所述样本外轮廓曲线;
根据所述图像样本,通过风格转换模型得到对应的所述脱敏样本;
基于所述图像样本对应的样本外轮廓曲线和脱敏样本构建所述训练数据集。
在一种可能的实现方式中,所述装置还包括第二训练单元,所述第二训练单元通过如下方式训练得到所述风格转换模型:
获取图像风格为所述目标风格的脱敏图像;
根据所述图像样本,通过初始源-目标生成器得到第二预测脱敏内容;以及根据所述脱敏图像,通过初始目标-源生成器得到预测待脱敏内容;
根据所述第二预测脱敏内容和所述脱敏图像,通过初始目标风格判别器得到第三判别结果,所述第三判别结果用于分别标识所述第二预测脱敏内容和所述脱敏图像是否符合所述目标风格;以及根据所述预测待脱敏内容和所述图像样本,通过初始源风格判别器得到第四判别结果,所述第四判别结果用于分别标识所述第一预测待脱敏内容和所述图像样本是否符合所述源风格;
基于所述第三判别结果和所述第四判别结果生成对抗损失;
根据所述第二预测脱敏内容,通过所述初始目标-源生成器得到重建待脱敏内容;以及根据所述预测待脱敏内容,通过所述初始源-目标生成器得到重建脱敏内容;
生成用于标识所述图像样本和所述重建待脱敏内容间差异的第一重建差异损失,以及生成用于标识所述脱敏内容和所述重建脱敏内容间差异的第二重建差异损失;
根据所述对抗损失、所述第一重建差异损失和所述第二重建差异损失生成第二对抗损失函数,通过所述第二对抗损失函数对所述初始源-目标生成器、所述初始目标-源生成器、所述初始目标风格判别器和所述初始源风格判别器进行对抗训练;
根据所述初始源-目标生成器,通过所述对抗训练得到所述风格转换模型。
在一种可能的实现方式中,所述第二训练单元还用于:
通过固定所述初始目标风格判别器和所述初始源风格判别器的模型参数,以最小化所述第二对抗损失函数为优化目标,调整所述初始源-目标生成器和所述初始目标-源生成器的模型参数;
通过固定所述初始源-目标生成器和所述初始目标-源生成器的模型参数,以最大化所述第二对抗损失函数为优化目标,调整所述初始目标风格判别器和所述初始源风格判别器的模型参数。
在一种可能的实现方式中,所述初始源-目标生成器和所述初始目标-源生成器的编码器和解码器之间设置有上下文信息提取模块,所述上下文信息提取模块包括不同扩张率的扩张卷积层,所述不同扩张率的扩张卷积层用于提升解码器的感受野。
在一种可能的实现方式中,所述初始生成器、所述初始源-目标生成器和所述初始目标-源生成器具有相同的模型结构,所述初始判别器、所述初始目标风格判别器和所述初始源风格判别器具有相同的模型结构。
在一种可能的实现方式中,所述确定单元还用于:
对所述待脱敏图像进行待脱敏内容检测,得到所述待脱敏图像中对应所述待脱敏内容的检测框;
根据所述检测框和所述待脱敏图像生成对应待脱敏内容的扩张裁剪图像;
对所述扩张裁剪图像进行待脱敏内容分割,得到所述待脱敏内容的外轮廓对应的外轮廓曲线。
在一种可能的实现方式中,所述待脱敏图像是通过智慧交通领域中的采集设备得到的。
在一种可能的实现方式中,所述脱敏内容与所述待脱敏内容的内容类型为人脸类型,所述脱敏内容的图像风格为动漫风格,所述待脱敏内容的图像风格为现实风格。
由此可见,在获取包括待脱敏内容的待脱敏图像时,为了保护待脱敏内容的安全,可以对待脱敏图像进行图像脱敏处理。可确定待脱敏内容的外轮廓在该待脱敏图像中的外轮廓曲线,并生成形状符合外轮廓曲线的脱敏内容。由于外轮廓曲线可以准确区分出待脱敏图像中待脱敏内容和非待脱敏内容的边界,通过脱敏内容替换待脱敏图像中的待脱敏内容,不会破坏待脱敏图像中非待脱敏内容的图像质量。而且,脱敏内容和待脱敏内容具有相同的内容类型和不同的图像风格,相同的内容类型使得脱敏内容处于原待脱敏内容的图像位置时,和待脱敏图像中非待脱敏内容在图像整体上并不突兀,且脱敏内容能够与非待脱敏内容建立原来与待脱敏内容间的内容关联,不同的图像风格可以体现出脱敏内容与非待脱敏内容间的画风区别,有效的提示用户此处为脱敏内容,而非待脱敏图像中的原内容,避免出现误导。由此,通过待脱敏内容外轮廓曲线生成的脱敏内容可以有效的实现图像脱敏,得到不影响图像质量的脱敏图像,而且不同的图像风格可以为脱敏带来趣味性,提高了用户体验。
在前述图13所对应实施例的基础上,图15为本申请实施例提供的一种图像脱敏装置的装置结构图,所述图像脱敏装置1500包括获取单元1501、生成单元1502、替换单元1503和发送单元1504:
所述获取单元1501,用于通过配置在目标车辆的车载终端,获取所述目标车辆对应的车辆环境图像;
所述生成单元1502,用于当确定所述车辆环境图像包括待脱敏内容时,根据所述待脱敏内容生成对应的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
所述替换单元1503,用于通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像;
所述发送单元1504,用于响应于外部设备针对所述车辆环境图像发送的获取请求,向所述外部设备返回所述脱敏环境图像。
在一种可能的实现方式中,所述装置还包括删除单元,所述删除单元用于在所述车载终端删除所述车辆环境图像。
在一种可能的实现方式中,所述车辆环境图像为所述车载终端所采集车外环境视频中的一个视频帧。
在一种可能的实现方式中,所述发送单元还用于当确定发生针对所述目标车辆的异常事件时,向所述外部设备发送提示信息,所述车辆环境图像是在所述异常事件发生时通过所述车载终端采集的;
所述获取单元还用于获取所述外部设备基于所述提示信息发送的所述获取请求。
由此可见,在智慧交通的场景下,目标车辆的车载终端可以采集车辆环境图像,并在确定车辆环境图像具有待脱敏内容时生成脱敏内容进行替换,得到车辆环境图像对应的脱敏环境图像,当获取外部设备针对车辆环境图像的获取请求时,将脱敏环境图像代替车辆环境图像进行返回,而不会将具有待脱敏内容的车辆环境图像进行传输,从而有效避免了智慧交通场景下的待脱敏内容不当泄露,大大提升了智慧交通场景下的待脱敏内容安全性。
本申请实施例还提供了一种计算机设备,该计算机设备为前述介绍的计算机设备,可以包括终端设备或服务器,前述的图像脱敏装置可以配置在该计算机设备中。下面结合附图对该计算机设备进行介绍。
若该计算机设备为终端设备,请参见图16所示,本申请实施例提供了一种终端设备,以终端设备为手机为例:
图16示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图16,手机包括:射频(Radio Frequency,简称RF)电路1410、存储器1420、输入单元1430、显示单元1440、传感器1450、音频电路1460、无线保真(简称WiFi)模块1470、处理器1480、以及电源1490等部件。本领域技术人员可以理解,图16中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图16对手机的各个构成部件进行具体的介绍:
RF电路1410可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1480处理;另外,将设计上行的数据发送给基站。
存储器1420可用于存储软件程序以及模块,处理器1480通过运行存储在存储器1420的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1430可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1430可包括触控面板1431以及其他输入设备1432。
显示单元1440可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1440可包括显示面板1441。
手机还可包括至少一种传感器1450,比如光传感器、运动传感器以及其他传感器。
音频电路1460、扬声器1461,传声器1462可提供用户与手机之间的音频接口。
WiFi属于短距离无线传输技术,手机通过WiFi模块1470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。
处理器1480是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1420内的软件程序和/或模块,以及调用存储在存储器1420内的数据,执行手机的各种功能和处理数据。
手机还包括给各个部件供电的电源1490(比如电池)。
在本实施例中,该终端设备所包括的处理器1480还具有以下功能:
获取待脱敏图像,所述待脱敏图像中包括待脱敏内容;
确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线;
根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
通过将所述待脱敏图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏图像。
或者,在本实施例中,该终端设备所包括的处理器1480还具有以下功能:
通过配置在目标车辆的车载终端,获取所述目标车辆对应的车辆环境图像;
当确定所述车辆环境图像包括待脱敏内容时,根据所述待脱敏内容生成对应的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像;
响应于外部设备针对所述车辆环境图像发送的获取请求,向所述外部设备返回所述脱敏环境图像。
若计算机设备为服务器,本申请实施例还提供一种服务器,请参见图17所示,图17为本申请实施例提供的服务器1500的结构图,服务器1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,简称CPU)1522(例如,一个或一个以上处理器)和存储器1532,一个或一个以上存储应用程序1542或数据1544的存储介质1530(例如一个或一个以上海量存储设备)。其中,存储器1532和存储介质1530可以是短暂存储或持久存储。存储在存储介质1530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1522可以设置为与存储介质1530通信,在服务器1500上执行存储介质1530中的一系列指令操作。
服务器1500还可以包括一个或一个以上电源1526,一个或一个以上有线或无线网络接口1550,一个或一个以上输入输出接口1558,和/或,一个或一个以上操作系统1541,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于图17所示的服务器结构。
另外,本申请实施例还提供了一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序用于执行上述实施例提供的方法。
本申请实施例还提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例提供的方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:Read-only Memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。而且本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (20)
1.一种图像脱敏方法,其特征在于,所述方法包括:
获取待脱敏图像,所述待脱敏图像中包括待脱敏内容;
确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线;
根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
通过将所述待脱敏图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏图像。
2.根据权利要求1所述的方法,其特征在于,所述根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容,包括:
根据所述外轮廓曲线,通过内容生成模型生成形状符合所述外轮廓曲线的脱敏内容;
若所述脱敏内容的图像风格为目标风格,所述内容生成模型通过如下方式训练得到:
获取包括轮廓-脱敏样本对的训练数据集,所述轮廓-脱敏样本对中的轮廓样本和脱敏样本具有相同的样本外轮廓曲线,所述脱敏样本与所述脱敏内容具有相同的图像风格;
根据所述轮廓样本,通过初始生成器得到与所述脱敏内容具有相同图像风格的第一预测脱敏内容;
根据所述轮廓样本、所述脱敏样本和所述第一预测脱敏内容,通过初始判别器得到第一判别结果和第二判别结果,所述第一判别结果用于标识所述脱敏样本的形状是否符合所述样本外轮廓曲线、以及所述脱敏样本是否符合所述目标风格,所述第二判别结果用于标识所述第一预测脱敏内容的形状是否符合所述样本外轮廓曲线、以及所述第一预测脱敏内容是否符合所述目标风格;
基于所述第一判别结果和所述第二判别结果生成对第一抗损失函数,通过所述第一对抗损失函数对所述初始生成器和所述初始判别器进行对抗训练;
根据所述初始生成器,通过所述对抗训练得到所述内容生成模型。
3.根据权利要求2所述的方法,其特征在于,所述样本外轮廓曲线是根据图像样本中待脱敏内容的外轮廓确定的,所述图像样本和所述待脱敏图像的图像风格均为源风格。
4.根据权利要求2所述的方法,其特征在于,所述通过所述对抗损失函数对所述初始生成器和所述初始判别器进行对抗训练,包括:
通过固定所述初始判别器的模型参数,以最小化所述对抗损失函数为优化目标,调整所述初始生成器的模型参数;
通过固定所述初始生成器的模型参数,以最大化所述对抗损失函数为优化目标,调整所述初始判别器的模型参数。
5.根据权利要求3所述的方法,其特征在于,所述训练数据集通过如下方式获取:
获取所述图像样本,所述图像样本中待脱敏内容的外轮廓被标注了所述样本外轮廓曲线;
根据所述图像样本,通过风格转换模型得到对应的所述脱敏样本;
基于所述图像样本对应的样本外轮廓曲线和脱敏样本构建所述训练数据集。
6.根据权利要求5所述的方法,其特征在于,所述风格转换模型通过如下方式训练得到:
获取图像风格为所述目标风格的脱敏图像;
根据所述图像样本,通过初始源-目标生成器得到第二预测脱敏内容;以及根据所述脱敏图像,通过初始目标-源生成器得到预测待脱敏内容;
根据所述第二预测脱敏内容和所述脱敏图像,通过初始目标风格判别器得到第三判别结果,所述第三判别结果用于分别标识所述第二预测脱敏内容和所述脱敏图像是否符合所述目标风格;以及根据所述预测待脱敏内容和所述图像样本,通过初始源风格判别器得到第四判别结果,所述第四判别结果用于分别标识所述第一预测待脱敏内容和所述图像样本是否符合所述源风格;
基于所述第三判别结果和所述第四判别结果生成对抗损失;
根据所述第二预测脱敏内容,通过所述初始目标-源生成器得到重建待脱敏内容;以及根据所述预测待脱敏内容,通过所述初始源-目标生成器得到重建脱敏内容;
生成用于标识所述图像样本和所述重建待脱敏内容间差异的第一重建差异损失,以及生成用于标识所述脱敏内容和所述重建脱敏内容间差异的第二重建差异损失;
根据所述对抗损失、所述第一重建差异损失和所述第二重建差异损失生成第二对抗损失函数,通过所述第二对抗损失函数对所述初始源-目标生成器、所述初始目标-源生成器、所述初始目标风格判别器和所述初始源风格判别器进行对抗训练;
根据所述初始源-目标生成器,通过所述对抗训练得到所述风格转换模型。
7.根据权利要求6所述的方法,其特征在于,所述通过所述第二对抗损失函数对所述初始源-目标生成器、所述初始目标-源生成器、所述初始目标风格判别器和所述初始源风格判别器进行对抗训练,包括:
通过固定所述初始目标风格判别器和所述初始源风格判别器的模型参数,以最小化所述第二对抗损失函数为优化目标,调整所述初始源-目标生成器和所述初始目标-源生成器的模型参数;
通过固定所述初始源-目标生成器和所述初始目标-源生成器的模型参数,以最大化所述第二对抗损失函数为优化目标,调整所述初始目标风格判别器和所述初始源风格判别器的模型参数。
8.根据权利要求6所述的方法,其特征在于,所述初始源-目标生成器和所述初始目标-源生成器的编码器和解码器之间设置有上下文信息提取模块,所述上下文信息提取模块包括不同扩张率的扩张卷积层,所述不同扩张率的扩张卷积层用于提升解码器的感受野。
9.根据权利要求8所述的方法,其特征在于,所述初始生成器、所述初始源-目标生成器和所述初始目标-源生成器具有相同的模型结构,所述初始判别器、所述初始目标风格判别器和所述初始源风格判别器具有相同的模型结构。
10.根据权利要求1所述的方法,其特征在于,所述确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线,包括:
对所述待脱敏图像进行待脱敏内容检测,得到所述待脱敏图像中对应所述待脱敏内容的检测框;
根据所述检测框和所述待脱敏图像生成对应待脱敏内容的扩张裁剪图像;
对所述扩张裁剪图像进行待脱敏内容分割,得到所述待脱敏内容的外轮廓对应的外轮廓曲线。
11.根据权利要求1所述的方法,其特征在于,所述脱敏内容与所述待脱敏内容的内容类型为人脸类型,所述脱敏内容的图像风格为动漫风格,所述待脱敏内容的图像风格为现实风格。
12.一种图像脱敏方法,其特征在于,所述方法包括:
通过配置在目标车辆的车载终端,获取所述目标车辆对应的车辆环境图像;
当确定所述车辆环境图像包括待脱敏内容时,根据所述待脱敏内容生成对应的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像;
响应于外部设备针对所述车辆环境图像发送的获取请求,向所述外部设备返回所述脱敏环境图像。
13.根据权利要求12所述的方法,其特征在于,在所述通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像之后,所述方法还包括:
在所述车载终端删除所述车辆环境图像。
14.根据权利要求12所述的方法,其特征在于,所述车辆环境图像为所述车载终端所采集车外环境视频中的一个视频帧。
15.根据权利要求12所述的方法,其特征在于,所述方法还包括:
当确定发生针对所述目标车辆的异常事件时,向所述外部设备发送提示信息,所述车辆环境图像是在所述异常事件发生时通过所述车载终端采集的;
获取所述外部设备基于所述提示信息发送的所述获取请求。
16.一种图像脱敏装置,其特征在于,所述装置包括获取单元、确定单元、生成单元和替换单元:
所述获取单元,用于获取待脱敏图像,所述待脱敏图像中包括待脱敏内容;
所述确定单元,用于确定所述待脱敏内容的外轮廓在所述待脱敏图像中的外轮廓曲线;
所述生成单元,用于根据所述外轮廓曲线,生成形状符合所述外轮廓曲线的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
所述替换单元,用于通过将所述待脱敏图像中的所述待脱敏内容替换为所述脱敏内容,得到脱敏图像。
17.一种图像脱敏装置,其特征在于,所述装置包括获取单元、生成单元、替换单元和发送单元:
所述获取单元,用于通过配置在目标车辆的车载终端,获取所述目标车辆对应的车辆环境图像;
所述生成单元,用于当确定所述车辆环境图像包括待脱敏内容时,根据所述待脱敏内容生成对应的脱敏内容,所述脱敏内容与所述待脱敏内容具有相同的内容类型、不同的图像风格;
所述替换单元,用于通过将所述车辆环境图像中的所述待脱敏内容替换为所述脱敏内容,得到所述车辆环境图像对应的脱敏环境图像;
所述发送单元,用于响应于外部设备针对所述车辆环境图像发送的获取请求,向所述外部设备返回所述脱敏环境图像。
18.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-15中任意一项所述的方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1-15中任意一项所述的方法。
20.一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行权利要求1-15中任意一项所述的方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202211049570.0A CN115408710B (zh) | 2022-08-30 | 2022-08-30 | 一种图像脱敏方法和相关装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202211049570.0A CN115408710B (zh) | 2022-08-30 | 2022-08-30 | 一种图像脱敏方法和相关装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN115408710A true CN115408710A (zh) | 2022-11-29 |
| CN115408710B CN115408710B (zh) | 2024-12-03 |
Family
ID=84164167
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202211049570.0A Active CN115408710B (zh) | 2022-08-30 | 2022-08-30 | 一种图像脱敏方法和相关装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN115408710B (zh) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117455751A (zh) * | 2023-12-22 | 2024-01-26 | 新华三网络信息安全软件有限公司 | 路段图像的处理系统及方法 |
| CN117872974A (zh) * | 2023-12-20 | 2024-04-12 | 枣庄市喜神科技有限公司 | 一种基于数字化的生产系统、方法、装置及物联网 |
| WO2025245713A1 (en) * | 2024-05-29 | 2025-12-04 | L'oreal | Image anonymization using synthesized image based on diffusion algorithm |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112561786A (zh) * | 2020-12-22 | 2021-03-26 | 作业帮教育科技(北京)有限公司 | 基于图像卡通化的在线直播方法、装置和电子设备 |
| KR102260628B1 (ko) * | 2020-02-13 | 2021-06-03 | 이인현 | 협력적 스타일 트랜스퍼 기술을 이용한 이미지 생성 시스템 및 방법 |
| CN113066094A (zh) * | 2021-03-09 | 2021-07-02 | 中国地质大学(武汉) | 一种基于生成对抗网络的地理栅格智能化局部脱敏方法 |
| CN113259583A (zh) * | 2020-02-13 | 2021-08-13 | 北京小米移动软件有限公司 | 一种图像处理方法、装置、终端及存储介质 |
| CN113705410A (zh) * | 2021-08-20 | 2021-11-26 | 陈成 | 一种人脸图像脱敏处理、验证方法及系统 |
| CN114842035A (zh) * | 2022-04-24 | 2022-08-02 | 平安国际融资租赁有限公司 | 基于深度学习的车牌脱敏方法、装置、设备及存储介质 |
| CN114841377A (zh) * | 2022-06-28 | 2022-08-02 | 国汽智控(北京)科技有限公司 | 应用于图像目标识别的联邦学习模型训练方法、识别方法 |
-
2022
- 2022-08-30 CN CN202211049570.0A patent/CN115408710B/zh active Active
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102260628B1 (ko) * | 2020-02-13 | 2021-06-03 | 이인현 | 협력적 스타일 트랜스퍼 기술을 이용한 이미지 생성 시스템 및 방법 |
| CN113259583A (zh) * | 2020-02-13 | 2021-08-13 | 北京小米移动软件有限公司 | 一种图像处理方法、装置、终端及存储介质 |
| CN112561786A (zh) * | 2020-12-22 | 2021-03-26 | 作业帮教育科技(北京)有限公司 | 基于图像卡通化的在线直播方法、装置和电子设备 |
| CN113066094A (zh) * | 2021-03-09 | 2021-07-02 | 中国地质大学(武汉) | 一种基于生成对抗网络的地理栅格智能化局部脱敏方法 |
| CN113705410A (zh) * | 2021-08-20 | 2021-11-26 | 陈成 | 一种人脸图像脱敏处理、验证方法及系统 |
| CN114842035A (zh) * | 2022-04-24 | 2022-08-02 | 平安国际融资租赁有限公司 | 基于深度学习的车牌脱敏方法、装置、设备及存储介质 |
| CN114841377A (zh) * | 2022-06-28 | 2022-08-02 | 国汽智控(北京)科技有限公司 | 应用于图像目标识别的联邦学习模型训练方法、识别方法 |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117872974A (zh) * | 2023-12-20 | 2024-04-12 | 枣庄市喜神科技有限公司 | 一种基于数字化的生产系统、方法、装置及物联网 |
| CN117455751A (zh) * | 2023-12-22 | 2024-01-26 | 新华三网络信息安全软件有限公司 | 路段图像的处理系统及方法 |
| CN117455751B (zh) * | 2023-12-22 | 2024-03-26 | 新华三网络信息安全软件有限公司 | 路段图像的处理系统及方法 |
| WO2025245713A1 (en) * | 2024-05-29 | 2025-12-04 | L'oreal | Image anonymization using synthesized image based on diffusion algorithm |
Also Published As
| Publication number | Publication date |
|---|---|
| CN115408710B (zh) | 2024-12-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN115408710A (zh) | 一种图像脱敏方法和相关装置 | |
| WO2022166625A1 (zh) | 一种车辆行驶场景中信息推送的方法以及相关装置 | |
| CN110678873A (zh) | 基于级联神经网络的注意力检测方法、计算机装置及计算机可读存储介质 | |
| CN111444826A (zh) | 视频检测方法、装置、存储介质及计算机设备 | |
| CN117157679A (zh) | 感知网络、感知网络的训练方法、物体识别方法及装置 | |
| CN111325107B (zh) | 检测模型训练方法、装置、电子设备和可读存储介质 | |
| CN111768438A (zh) | 一种图像处理方法、装置、设备以及计算机可读存储介质 | |
| CN112037142A (zh) | 一种图像去噪方法、装置、计算机及可读存储介质 | |
| CN116977484A (zh) | 图像脱敏方法、装置、电子设备及存储介质 | |
| CN111274946B (zh) | 一种人脸识别方法和系统及设备 | |
| WO2024001617A1 (zh) | 玩手机行为识别方法及装置 | |
| US20250181228A1 (en) | Image processing method and apparatus, device, medium, and program product | |
| CN118314537A (zh) | 车牌和人脸图像脱敏方法、装置、计算机设备及存储介质 | |
| CN115565155A (zh) | 神经网络模型的训练方法、车辆视图的生成方法和车辆 | |
| WO2024199155A1 (zh) | 三维语义场景补全方法、设备和介质 | |
| CN112241963A (zh) | 基于车载视频的车道线识别方法、系统和电子设备 | |
| CN114937189B (zh) | 模型的训练方法和装置、目标识别方法、设备、介质 | |
| CN114842466A (zh) | 目标检测方法、计算机程序产品和电子设备 | |
| CN116434173B (zh) | 道路图像检测方法、装置、电子设备及存储介质 | |
| Sun et al. | CDVA/VCM: Language for intelligent and autonomous vehicles | |
| CN119229108A (zh) | 一种图像融合分割方法、装置、设备及存储介质 | |
| CN117953103A (zh) | 图像的生成方法、装置和车辆 | |
| CN110188645A (zh) | 用于车载场景的人脸检测方法、装置、车辆及存储介质 | |
| CN116978056A (zh) | 对象身份识别处理方法、图像处理方法、装置和设备 | |
| CN115966030A (zh) | 图像处理方法、装置及智能终端 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |







