CN112257697A - 图像处理、图像识别模型的训练、图像识别的方法和系统 - Google Patents

图像处理、图像识别模型的训练、图像识别的方法和系统 Download PDF

Info

Publication number
CN112257697A
CN112257697A CN202011532933.7A CN202011532933A CN112257697A CN 112257697 A CN112257697 A CN 112257697A CN 202011532933 A CN202011532933 A CN 202011532933A CN 112257697 A CN112257697 A CN 112257697A
Authority
CN
China
Prior art keywords
image
image data
processing
feature maps
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011532933.7A
Other languages
English (en)
Inventor
王莹桂
郑龙飞
刘健
王力
张本宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202011532933.7A priority Critical patent/CN112257697A/zh
Publication of CN112257697A publication Critical patent/CN112257697A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • G06Q20/40145Biometric identity checks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/12Fingerprints or palmprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例公开了一种图像处理、图像识别模型的训练、图像识别的方法和系统。该方法包括:获取待处理图像数据;对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图;对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据;其中,所述处理包括:对所述多个特征图进行筛选,保留其中部分特征图;基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对多个特征图进行归一化处理;以及,对多个特征图进行融合处理,以获取数量少于特征图的一个或多个融合特征图。

Description

图像处理、图像识别模型的训练、图像识别的方法和系统
技术领域
本说明书涉及图像处理领域,特别涉及一种图像处理、图像识别模型的训练、图像识别的方法和系统。
背景技术
目前,图像识别技术广泛地应用于各种领域在相关技术中,图像识别技术已成为认证用户身份的主要手段之一。例如,可以采集人脸图像,可以利用图像识别技术识别人脸对应的用户身份。
然而,用于身份识别的图像中通常包含用户个人的敏感信息。如何对图像的敏感信息进行隐私保护,是当前亟需解决的问题。
因此,提出一种图像处理、图像识别模型的训练、图像识别的方法和系统,以更好的对图像的敏感信息进行隐私保护。
发明内容
本说明书实施例的一个方面提供一种图像处理方法,该方法包括:获取待处理图像数据;对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图;对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据;其中,所述处理包括:对所述多个特征图进行筛选,保留其中部分特征图;基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对多个特征图进行归一化处理;以及,对多个特征图进行融合处理,以获取数量少于特征图的一个或多个融合特征图。
本说明书实施例的另一个方面提供一种图像处理系统,所述系统包括:第一获取模块,用于获取待处理图像数据;第二获取模块,用于对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图;第一处理模块,用于对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据;其中,所述处理包括:对所述多个特征图进行筛选,保留其中部分特征图;基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对多个特征图进行归一化处理;以及,对多个特征图进行融合处理,以获取数量少于特征图的一个或多个融合特征图。
本说明书实施例的另一个方面提供一种图像识别模型的训练方法,该方法包括获取训练样本图像及其标签;使用上述图像处理方法处理所述训练样本图像,获得训练样本图像的脱敏图像数据;将所述脱敏图像数据作为输入特征输入图像识别模型,得到识别结果;调整所述图像识别模型的参数,以减小识别结果与所述标签之间的差异。
本说明书实施例的另一个方面提供一种图像处理模型的训练系统,该系统包括:第三获取模块,用于获取训练样本图像及其标签;第二处理模块,用于使用上述图像处理方法处理所述训练样本图像,获得训练样本图像的脱敏图像数据;输入模块,用于将所述脱敏图像数据作为输入特征输入图像识别模型,得到识别结果;调整模块,用于调整所述图像识别模型的参数,以减小识别结果与所述标签之间的差异。
本说明书实施例的另一个方面提供一种图像识别方法,该方法包括:获取待识别图像;所述待识别图像用于识别其中是否包含目标对象;使用上述图像处理方法处理所述待识别图像,获得待识别图像的脱敏图像数据;利用图像识别模型处理所述脱敏图像数据,得到预测向量;将所述预测向量与目标对象的特征向量进行比较,当相似度大于预设值时,确定所述待识别图像中包含所述目标对象。
本说明书实施例的另一个方面提供一种图像识别系统,该系统包括:第四获取模块,用于获取待识别图像;所述待识别图像用于识别其中是否包含目标对象;第三处理模块,用于使用上述图像处理方法处理所述待识别图像,获得待识别图像的脱敏图像数据;第四处理模块,用于利用图像识别模型处理所述脱敏图像数据,得到预测向量;确定模块,用于将所述预测向量与目标对象的特征向量进行比较,当相似度大于预设值时,确定所述待识别图像中包含所述目标对象。
本说明书实施例的另一个方面提供一种分词装置,包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现所述图像处理方法。
本说明书实施例的另一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行图像处理方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的图像处理系统的应用场景的示例性示意图;
图2是根据本说明书一些实施例所示的图像处理方法的示例性流程图;
图3是根据本说明书一些实施例所示的将待处理图像数据从空间域转换到频域的示例性示意图;
图4是根据本说明书一些实施例所示的对多个变换结果进行重组的示例性示意图;
图5是根据本说明书一些实施例所示的优选图像处理方法的示例性流程图;
图6是根据本说明书一些实施例所示的图像处理模型的示例性结构图;
图7是根据本说明书一些实施例所示的图像识别方法的示例性流程图;
图8是根据本说明书一些实施例所示的图像处理系统的模块图;
图9是根据本说明书一些实施例所示的图像识别模型的训练系统的模块图;
图10是根据本说明书一些实施例所示的图像识别系统的模块图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
随着计算机技术的发展,图像识别越来越深入人们生活的各个领域。例如,人脸识别,人脸识别已经在很多场景中广泛使用,比如,人脸识别的智能开锁、终端应用登录、刷脸支付等。但是,人脸图像中可能包含一些敏感信息或个人隐私信息,为避免这些信息泄漏造成不必要的损失,有必要对图像中的进行脱敏处理。
人脸识别的过程中包括对人脸图像进行处理,人脸图像是身份识别的重要依据。人脸识别处理的一种方式是将人脸图像输入人脸识别模型进行处理,基于人脸识别模型的处理结果(例如,人脸特征数据)来进行身份验证。但是,由于第三方设备运行环境安全的不可控,人脸原始图像数据或者利用人脸识别模型对原始人脸进行处理后得到的人脸特征数据存在被恶意盗取的可能性。不法分子可能会基于被盗取的人脸特征数据,通过反推等方式还原出原始人脸图像数据,进而基于原始人脸图像数据非法获取人脸数据对应的人操作权限,比如,开锁、盗刷等。这对安全支付、开锁等造成了很大的威胁,随着对个人隐私保护的日益重视,如何对用于人脸识别的人脸图像进行隐私保护亟待解决的问题。
因此,本发明一些实施例提出一种图像处理、图像识别模型的训练、图像识别的方法和系统,通过对人脸图像进行脱敏处理,以更加安全有效地保护人脸图像的个人隐私。
上述中的例子仅作为示例,不应理解为对本方案限制。虽然在本说明书中主要以人脸图像为例进行说明,但应当理解,本说明书所披露的技术方案可以应用于任何类型的需要隐私保护的图像数据,例如,指纹图像数据等。以下通过对附图的描述阐述本说明书披露的技术方案。
图1是根据本说明书一些实施例所示的图像处理系统的应用场景的示例性示意图。
如图1所示,在应用场景中可以包括服务器110、网络120、终端设备130以及存储设备140。
图像处理系统100可以广泛应用于各种图像识别的场景,例如,人脸开锁、人脸支付、人脸终端应用登录等。在一些实施例中,也可以应用于其他任何需要进行图像隐私保护的场景,比如,敏感图像数据的传输、存储等。通过实施本说明书所披露的方法对图像进行处理后,可以基于处理后的图像数据正常完成后续的图像识别工作,且基于处理后的图像数据难以反推出原始图像数据,可以有效地保护图像中的隐私信息不被泄漏。
在一个典型的应用场景中,终端设备130可以通过图像采集设备(如摄像头)采集待识别人脸图像,终端设备130可以通过实施本说明书提出的图像处理方法对采集的人脸图像进行脱敏处理,得到脱敏图像数据,然后将脱敏图像数据通过网络120发送至服务器110。服务器110可以用于处理与数据服务请求和/或图像处理、图像识别有关的信息和/或数据。例如,服务器110可以响应于来自终端设备130的数据服务请求,接收终端设备130发送的脱敏图像数据,完成脱敏图像数据识别后(如确定脱敏图像数据来自合法人脸图像时),向终端设备130反馈识别结果或者向终端设备130提供相应的数据服务。在一些实施例中,服务器110可以通过预先训练的图像识别模型对其进行处理,并得到预测向量。服务器110可以在得到预测向量之后,进一步执行后续操作,例如与已在系统成功注册并存储的人脸图像的特征向量进行对比并将对比结果(例如,身份识别结果)反馈给终端设备130,完成人脸支付、开锁等。
130-3在一些实施例中,服务器110可以是本地的或远程的。例如,服务器110可以在终端设备130本地连接终端设备130以获取其发送的信息和/或数据。又例如,服务器110可以经由网络120远程接收终端设备130发送的信息和/数据。在一些实施例中,服务器110可以在云平台上实施。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
网络120可以促进信息和/或数据的交换。在一些实施例中,图像处理系统100的一个或者多个组件(例如服务器110、终端设备130、存储设备140)可以通过网络120传送信息至图像处理系统100的其他组件。例如,终端设备130可以通过网络120向服务器110发送待识别图像的图像脱敏数据。又例如,服务器110可以将对识别图像的图像脱敏数据进行处理得到的预测向量发送至存储设备进行存储,以及将预测向量与特征向量的比较结果返回给终端设备130等。在一些实施例中,网络120可以是任意形式的有线或者无线网络,或其任意组合。仅作为范例,网络120可以是有线网络、光纤网络、远程通信网络、内部网络、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、城域网(MAN)、广域网(WAN)、公共交换电话网络(PSTN)、蓝牙网络等中的一种或多种组合。
终端设备130可用于处理与图像处理、图像识别相关联的信息和/或数据来执行在本说明书中揭示的一个或者多个功能。在一些实施例中,终端设备130可以是向公众提供图像采集和/或数据处理服务的公共设备,如物联网设备(IoT设备)130-1。示例性的IoT设备130-1可以包括但不限于人脸售货机、人脸支付设备、银行个人业务设备等或其任意组合。用户在终端设备130上完成人脸识别后,便可使用该设备提供的数据服务。在一些实施例中,终端设备130可以用于获取由于设备图像采集装置被触发而采集的待处理图像数据。在一些实施例中,终端设备130可以对待处理图像数据进行分解,获取待处理图像数据对应的多个特征图;以及对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据。在一些实施例中,终端设备130上可以部署有可信执行环境,并在可信执行环境中进行图像采集以及图像处理。在一些实施例中,终端设备130可以包括一个或多个处理引擎(例如,单核心处理引擎或多核心处理器)。仅作为示例,处理引擎可以包括中央处理器(中央处理器)、特定应用集成电路(ASIC)、专用指令集处理器(ASIP)、图像处理器(GPU)、物理运算处理单元(PPU)、数字信号处理器(DSP)、现场可程序门阵列(FPGA)、可程序逻辑装置(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等中的一种或多种组合。
在一些实施例中,终端设备130还可以是带有数据获取、存储和/或发送功能的便携式设备,例如,平板电脑130-2、笔记本电脑130-3、智能手机130-4、摄像头等或其任意组合。在一些实施例中,终端设备130可以通过网络与服务器110进行数据交互,例如,终端设备130可以将对待处理图像数据的进行处理后的脱敏图像数据传输至服务器110。在一些实施例中,终端设备130获取到的数据可以是设备的摄像头采集到的人脸图像数据,对应的,服务器110可以接收来自终端设备130的人脸图像数据,对其进行脱敏处理以及后续的识别。此时,服务器110可以与终端设备130集成在一起。
存储设备140可以存储与图像处理相关的数据和/或指令,例如,存储已在系统成功注册的用户的图像的特征矢量、图像数据、身份信息等。在一些实施例中,存储设备140可以存储终端设备130和/或服务器110获得/获取的数据。在一些实施例中,存储设备140可以存储服务器110用于执行或使用来完成本申请中描述的示例性方法的数据和/或指令。在一些实施例中,存储设备140可以包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。示例性的大容量储存器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性的挥发性只读存储器可以包括随机存取内存(RAM)。示例性的RAM可包括动态RAM(DRAM)、双倍速率同步动态RAM(DDRSDRAM)、静态RAM(SRAM)、闸流体RAM(T-RAM)和零电容RAM(Z-RAM)等。示例性的ROM可以包括掩模ROM(MROM)、可编程ROM(PROM)、可擦除可编程ROM(PEROM)、电子可擦除可编程ROM(EEPROM)、光盘ROM(CD-ROM)和数字通用磁盘ROM等。在一些实施例中,所述存储设备140可以在云平台上实现。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
在一些实施例中,存储设备140可以连接到网络120以与图像处理系统100中的一个或以上组件(例如,服务器110、终端设备130)通信。图像处理100中的一个或以上组件可以通过网络120访问存储设备140中存储的数据或指令。在一些实施例中,存储设备140可以与图像处理系统100中的一个或以上组件(例如,服务器110、终端设备130等)直接连接或通信。在一些实施例中,存储设备140可以是服务器110的一部分。
图2是根据本说明书一些实施例所示的图像处理方法的示例性流程图。在一些实施例中,流程200可以由处理设备,例如,终端设备130或服务器110执行。例如,流程200可以以程序或指令的形式存储在存储装置(如处理设备的自带存储单元或外接存储设备)中,所述程序或指令在被执行时,可以实现流程200。流程200可以包括以下操作。
步骤202,获取待处理图像数据。在一些实施例中,步骤202可以由第一获取模块810执行。
待处理图像数据是指未进行脱敏处理的图像数据。待处理图像数据可以是原始人脸图像数据,也可以是对原始人脸图像数据进行人脸检测或人脸对齐后的图像数据。原始人脸图像数据可以是指直接由图像采集设备(例如,摄像头等)采集到的未进行任何处理的图像数据。人脸检测是指对人脸在图像中的位置进行检测,待处理图像数据可以是基于人脸在图像中的位置进行裁剪后的图像,例如,减去图像中除人脸以外的多余部分。人脸对齐是指对人脸在图像中的角度进行校正,原始人脸图像中的人脸可能会以一定角度倾斜,通过人脸对齐,可以使人脸在图像上摆正,以便于后续对于图像的识别处理等。
在一些实施例中,处理设备可以通过终端设备的摄像头获取待处理图像数据,也可以从数据库、存储设备读取,或调用数据接口等方式获取待处理图像数据。
需要说明的是,获取待处理图像数据的程序/代码可以运行在处理设备中部署的可信执行环境中,利用可行执行环境的安全特征可以保证处理设备获取的图像数据不会被盗取。同时,本说明实施例所披露的方法和/或过程,也可以在可信执行环境中执行,以确保从图像数据获取的源头到图像数据处理的整个过程都是安全可信的,提高对待处理图像数据的隐私保护的安全性。
步骤204,对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图。在一些实施例中,步骤204可以由第二获取模块820执行。
特征图是指采用一定的图像处理手段,从待处理图像数据中提取的多个子图,每个子图携带有待处理图像数据的部分特征。所述子图可以与待处理图像一样大小,如像素点一一对应,也可以不同于待处理图像。
在一些实施例中,对待处理图像数据进行分解可以采用多种方式进行,例如,离散余弦变换、傅里叶变换、小波变换或者正交基变换等。离散余弦变换、傅里叶变换、小波变换可以将待处理图像数据从空间域转换到频域;正交基变换可以将待处理图像数据从二维转换到多维,例如,3维、4维、5维等。
如图3所示,图3是根据本说明书一些实施例所示的将待处理图像数据从空间域转换到频域的示例性示意图。在图3中,空间域以坐标系(x,y)表示,频域通过坐标系(c,v)表示,N*M表示图像的大小,例如,图3中为2*2。空间域和频域转换后的特征点的数量可以一致,空间域中一个方块代表一个像素位置,频域中一个方块代表一个频率位置。
在一些实施例中,可以使用以下所示的离散余弦变换公式(1)对所述待处理图像数据进行分解。
Figure 46047DEST_PATH_IMAGE001
(1)
其中,
Figure 963188DEST_PATH_IMAGE002
为转换后的频域中的特征点(也就是各个频率位置)的值,
Figure 415029DEST_PATH_IMAGE003
为待处理图像数据中的像素值,
Figure 810238DEST_PATH_IMAGE004
为转换后的频域中的特征点的坐标,
Figure 624610DEST_PATH_IMAGE005
为待处理图像数据在空间域中的坐标,N为待处理图像数据的像素点或特征点的行数,M为待处理图像数据的像素点或特征点的列数,例如,图像大小为8*8时,N=M=8。
Figure 447073DEST_PATH_IMAGE006
可以用以下公式(2)表示。
Figure 166636DEST_PATH_IMAGE007
(2)
其中,
Figure 365536DEST_PATH_IMAGE008
。在一些实施例中,可以使用局部离散余弦变换处理待处理图像数据,以得到多个变换结果。具体的,可以选取比待处理图像数据小的图像块,如待处理图像数据大小为256×256,选取的图像块大小为8×8,利用图像块在待处理图像数据上以一定步长移动采样,并对图像块每次采样得到的待处理图像数据的局部数据(即8×8大小)基于公式(1)、(2)进行离散余弦变换,得到多个变换结果,每个变换结果可以是8×8大小。离散余弦变换时图像块的移动步长越小,得到的变换结果特征越多,可以有利于提高后续图像识别的准确率。
然后可以对多个变换结果进行重组,获得多个特征图。例如,可以从多个变换结果中将相同频率位置对应的值组合在一起得到新的图像块,即特征图。不难理解,特征图的个数与变换过程中用于采样的图像块的像素点数量一致。例如,参见图4,图4是根据本说明书一些实施例所示的对多个变换结果进行重组的示例性示意图。其中,410为待处理图像数据,420为经过离散余弦变换后得到的多个变换结果,430为对多个变换结果进行重组后得到的多个特征图。
重组方式可以是按照一定的规律分别从多个变换结果中取出一部分值进行重组。例如,可以将各变换结果中相同频率位置的值组合得到一个特征图,进而得到对应变换结果中不同频率位置的多个特征图。
作为示例,在图4中以步长为2,2*2大小的图像块对4*4大小的待处理图像数据进行采样,实现局部离散余弦变换,变换后可以得到4个变换结果,分别为421、422、423和424,每个变换结果中的各个频率位置的值分别用fi1、fi2、fi3、fi4表示,其中i表示第i个变换结果,fi1表示第i个变换结果中第一频率位置的值。从图中可以看出,每个变换结果都拥有4个对应的频率位置,将各个变换结果中的相同频率位置的值放在一起,即可得到多个特征图。例如,特征图431对应第一频率位置,特征图432对应第二频率位置,特征图433对应第三频率位置,特征图434对应第四频率位置频率f4。在一些实施例中,在读取相同频率的部分对变换结果进行重组时,可以按照“Z”字形顺序进行读取。
在一些实施例中,获得的特征图的数量可以为两个或以上个。不难理解,上述步骤中的离散余弦变换可以替换为傅里叶变换或小波变换,可以获得不同分解方式下的多个特征图。在又一些实施例中,还可以选定一组正交基,将待处理图像数据在正交基上进行分解表示,将二维图像数据变换为多维数据,每一维对应一个基,将相同基的基系数组合得到一个特征图。
步骤206,对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据。在一些实施例中,步骤206可以由第一处理模块830执行。
脱敏图像数据即为对多个特征图进行脱敏处理后的图像数据,可以包括脱敏处理后的一个或多个特征图。脱敏图像数据区别于待处理图像数据,待处理图图像数据为可视化数据,脱敏图像数据为特征图,直接从脱敏图像数据中并不能得到图像数据的原始人脸信息。在一些实施例中,处理方式可以包括对特征图进行重要性筛选、归一化处理、融合处理、顺序随机化等,或其任意组合。
示例性地,处理设备可以按照图2虚线框中所示的步骤2062-步骤2066对所述多个特征图进行处理,以获得脱敏图像数据。
步骤2062,对所述多个特征图进行筛选,保留其中部分特征图。
筛选是指从特征图中选出一部分保留,舍弃其中的至少一个特征图。例如,按照特征图所包含的特征信息的丰富程度进行筛选,保留其中包含特征信息较多部分的特征图,舍弃包含特征信息较少部分的特征图。
在一些实施例中,处理设备可以基于SEnet网络或基于预设选择规则,确定所述多个特征图中的每一个的重要性;并基于重要性,舍弃所述多个特征图中的部分。
在一些实施例中,处理设备可以将多个变换结果输入经过训练的SEnet网络,由SEnet网络给出各个特征图的重要性(如与重要性正相关的分值)。SEnet网络可以随着图像处理模型(如图像识别模型)一起训练得到,例如,在图像处理模型中添加SEnet网络,在对模型的训练过程中对SEnet网络的参数进行调整,得到用于确定特征图的重要性的SEnet网络。
在一些实施例中,预设选择规则可以是选择保留预设比例的包含特征信息较多的部分特征图。例如,在通过离散余弦变换并重组后得到的多个特征图中,可以选择保留预设比例的低频部分特征图,舍弃部分高频特征图。例如,可以保留50%、60%、70%比例的低频特征图,舍弃掉其余部分的高频特征图。比如,保留图4中所示的低频特征图431、432和433,舍弃高频特征图434。其中,在离散余弦变换后的变换结果中,左上方的频率位置的数值对应低频成分,右下方的频率位置的数值对应高频,例如,图4中的变换结果421中f11对应低频数据,f14对应高频数据。参见上述公式(1),
Figure 34415DEST_PATH_IMAGE009
为(0,0)时
Figure 27779DEST_PATH_IMAGE010
Figure 782108DEST_PATH_IMAGE011
中是不含交流分量的,可以看成直流,因此变换结果左上角数值对应的频率最低,随着坐标位置移向右下角,
Figure 519120DEST_PATH_IMAGE012
含有交流分量,且频率增加,因此变换结果中右下角数值对应的频率最高。
在一些实施例中,处理设备还可以对筛选后的多个特征图的顺序随机化。顺序随机化是指对多个特征图的排列顺序进行打乱。例如,筛选后的多个特征图为图4中的431、432和433,顺序随机化后的排列顺序可能为433、431、432。
步骤2064,基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对多个特征图进行归一化处理。
在一些实施例中,归一化参数是指对多个特征图(如经过筛选后保留的多个特征图)进行归一化处理时的参数。在进行归一化处理时,可以根据待处理图像数据或其对应的多个特征图来确定进行归一化的参数。由于不同待处理图像数据或其对应的多个特征图都是不一样的,因此,在进行归一化时,归一化参数只与该图像本身有关,与其他图像无关,这样可以增加对待处理图像数据的反推难度。比如,假设反推出了第一个待处理图像数据,但是由于每个待处理图像数据进行归一化时的参数不一样,也无法利用反推出第一个待处理图像数据的归一化参数反推出其他待处理图像数据。
在一些实施例中,归一化参数可以是待处理图像数据中各像素值的均值或方差,或者待处理图像数据对应的多个特征图的所有频率位置的值的均值或方差的方式,也可以是多个特征图的所有频率位置的值中的最大值或最小值。归一化处理是可以用归一化参数去除各特征图的像素点的数值,用除得的商替换原特征点的数值,从而得到归一化处理后的特征图。
步骤2066,对多个特征图进行融合处理,以获取数量少于特征图的一个或多个融合特征图。
融合处理可以是指对多个特征图中的两个或以上特征图按照预设计算方式进行运算。例如,可以对两个或两个以上特征图中对应像素点的值进行计算,将计算后的值作为融合特征图中对应像素点的值,这样就可以将两个或以上特征图融合成为一个特征图。预设计算方式可以是求均值、和值、差值等。
在一些实施例中,处理设备可以对多个特征图,按照两个或以上特征图为一组的方式进行组合,得到一个或多个组合结果;对于每个组合结果,将其中的特征图按照预设计算方式进行运算,得到融合特征图。
组合是指将两个或以上特征图划分为一组。组合可以是将相邻的两个特征图进行组合,也可以将最低频率的特征图与最高频率的特征图进行组合,或者将任意两个或以上特征图进行组合。需要说明的是,在进行特征图组合时,对于不同的待处理图像数据的特征图,其组合规律应当相同,例如,从第一张特征图开始,将当前特征图与其相邻的下一张特征图进行组合,即第一张特征图与第二张特征图组合,第二张特征图与第三张特征图组合。又例如,将第1~3张特征图组合,将4~6张特征图组合等等。
融合特征图中的各像素点的值相较于融合前的特征图的值已经发生了变化。融合处理可以破坏原多个特征图之间各个像素点的值的大小相对关系,以此可以进一步地增加根据特征图反推出待处理图像数据的难度。
在一些实施例中,处理设备还可以对融合处理得到的融合特征图进行顺序随机化。顺序随机化的方式与对筛选后的多个特征图的顺序随机化的方式相同,可以参见步骤2062的描述,此处不再赘述。
在本实施例中,将待处理图像数据分解转换为多个特征图,然后基于对多个特征图的进行筛选、归一化、融合处理等操作,可以得到数量少于所述多个特征图的融合特征图。最终得到的融合特征图中,由于进行了颜色(空间域)-其他域(频域)变换、筛选、归一化、融合处理,在基于融合特征图反推图像数据时,反推出的图像数据与原始的待处理图像数据将大不相同,达到了避免反推出原始的待处理图像数据的目的,从而可以对人脸支付、解锁、图像数据的网络传输等过程中的数据隐私进行有效地保护。另外,由于对特征图进行了筛选和融合处理,还可以减少图像识别时的数据处理量,提高图像识别效率,以及提高网络传输过程中的数据传输效率。
图5是根据本说明书一些实施例所示的另一图像处理方法的示例性流程图。在一些实施例中,流程500可以由处理设备,例如终端设备或服务器执行。例如,流程500可以以程序或指令的形式存储在存储装置(如处理设备的自带存储单元或外接存储设备)中,所述程序或指令在被执行时,可以实现流程500。如图5所示,流程500可以包括以下操作。
步骤502,获取待处理图像数据。
步骤504,对所述待处理图像数据进行局部离散余弦变换,获得多个变换结果。
步骤506,对所述多个变换结果进行重组,获得所述多个特征图。
步骤508,基于SEnet网络或基于预设选择规则,确定所述多个特征图中的每一个的重要性。
步骤510,基于所述重要性,对多个特征图进行筛选,舍弃所述多个特征图中的部分。
步骤512,对筛选后的多个特征图的顺序随机化。
步骤514,基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对多个特征图进行归一化处理。
步骤516,对多个经过归一化处理后的特征图进行融合处理,以获取数量少于特征图的一个或多个融合特征图。
步骤518,对所述多个融合特征图的顺序随机化,获得待处理图像数据的脱敏图像数据。
关于图5所示的各个步骤的更多描述均可以在图2的说明中找到,此处不再赘述。
在本实施例中,通过对待处理图像数据进行脱敏,可以达到保证人脸识别效果的同时恢复不出原始人脸图像数据的目的,进而实现对人脸隐私保护。在以上过程中涉及了两次通道随机化,将待处理图像数据分解为8*8的图像块就可以构造出64个特征图,并且随机化后特征图使得变换结果中的每个小块频率成分(一个特征图对应一个频率成分)的放置是随机的,随机化暴力破解空间大小则为64!,其中,“!”表示阶乘运算,即使通过重要性对特征图进行筛选确定36个主要特征图,暴力破解空间也为36!(大于2138),脱敏过程中采用两次随机化过程的暴力破解空间大小为36!*35!(大于2270),其值将大于256位AES加密算法的密钥破解空间,这也就使得难以通过暴力破解的方式反推出原始人脸数据。同时,归一化参数仅仅取决于待处理图像数据或待处理图像据的特征图,不同待处理图像数据的归一化参数不同,这就更加难以推断出每张图像数据的归一化参数。同时还对特征图进行了融合处理,只保留融合处理后的结果,这就导致特征图的减少,破坏了特征图之间的值的相对关系,理论上从融合处理结果推出融合前的数据是不可能的,因为有无穷多组解,以上过程有力地保证了图像脱敏数据的隐私。
应当注意的是,上述对流程500的描述仅仅是为了示例和说明,而不是对图像处理过程的限定。对于本领域技术人员来说,在本说明书的指导下可以对流程500进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。例如,添加预处理步骤和存储步骤等。又例如,增加或减少流程步骤,以及更改流程步骤顺序等。
图6是根据本说明书一些实施例所示的图像识别模型的示例性结构图。图像识别模型600可以包括输入层610、特征提取层620和输出层630。
输入层610可以用于接收脱敏后的脱敏图像数据。
在一些实施例中,输入层610可以具有多个输入通道,多个输入通道的数量可以与脱敏图像数据中的融合特征图的数量相同,每个通道对应一个融合特征图。
在搭建初始图像识别模型时,可以对输入通道的数量进行调整,将输入通道的数量与通过上述图像处理方法处理得到的融合特征图的数量一致。例如,调整输入通道为64个等。关于脱敏图像数据的更多内容,可以参见步骤206的相关描述,此处不再赘述。
特征提取层520可以用于对输入的脱敏图像数据进行处理,以获取脱敏图像数据的特征向量或称为预测向量。
在一些实施例中,特征提取层可以是深度神经网络,如CNN、RNN等网络等。特征提取层可以对各个特征图进行处理(如卷积、池化等),获得更加抽象的特征向量表示。
输出层630可以将特征向量转换为对脱敏图像数据对应的目标对象的身份识别结果。
目标对象可以是指图像中的生物体、物体或其一部分。例如,人物、人脸、动物或某个建筑等。
身份识别结果可以是指该图像中的目标对象的对应身份,例如,人物的身份标识、动物的类别、建筑的名称等。
输出层可以对脱敏图像数据的特征向量进行变换得到一个预测值,该预测值可以指示图像中的任务的身份信息,即目标对象的身份识别结果。
在一些实施例中,输出层可以是多层感知器、全连接层等,本实施例对此不作限定。
在一些实施例中,所述图像识别模型可以通过以下训练方式获得。
在一些实施例中,第三获取模块910可以获取训练样本图像及其标签。训练样本图像可以包括人脸图像,其标签可以是与图像中的人脸对应的身份信息,例如,人物姓名等。训练样本图像的标签可以由人工添加,或其他方式添加,本实施例对此不作限定。
在一些实施例中,第三获取模块910可以以从数据库读取或调用数据接口的方式获取训练样本图像及其标签。
在一些实施例中,第二处理模块920可以使用如图2所描述的图像处理方法对所述训练样本图像进行处理,获得训练样本图像的脱敏图像数据。关于图像处理的更多细节,可以参见图2的相关描述,此处不再赘述。
在一些实施例中,输入模块930可以将训练样本图像的脱敏图像数据作为输入特征输入图像识别模型,得到识别结果。在一些实施例中,识别结果可以是图像识别模型预测的目标对象的身份。识别结果可以用于指示图像中的人脸对应的身份信息,例如,姓名、证件编号等。
在一些实施例中,所述图像识别模型可以对训练样本图像的脱敏图像数据进行处理,得到预测向量(即所述特征向量),并基于预测向量确定识别结果。图像识别模型对脱敏图像数据的处理,以及基于预测向量确定识别结果的可以参见上述对图像识别模型的描述,此处不再赘述。
在一些实施例中,调整模块940可以调整所述图像识别模型的参数,以减小识别结果与所述标签之间的差异。
在一些实施例中,调整模块940可以构造反应图像识别模型输出的识别结果与所述标签差值的损失函数,并根据损失函数的值来调整图像识别模型的参数,以减少识别结果与标签之间的差异的。
图7是根据本说明书一些实施例所示的图像识别方法的示例性流程图。在一些实施例中,流程700可以由处理设备执行。例如,流程700可以以程序或指令的形式存储在存储装置(如处理设备的自带存储单元或外接存储设备)中,所述程序或指令在被执行时,可以实现流程700。如图7所示,流程700可以包括。
步骤702,获取待识别图像;所述待识别图像用于识别其中是否包含目标对象。在一些实施例中,步骤702可以由第四获取模块1010执行。
待识别图像是指需要对图像中的目标对象进行识别的图像。例如,人脸图像、指纹图像等。
在一些实施例中,目标对象包括某身份信息对应的人脸。例如,刷脸支付时支付账号的身份信息对应的人脸、人脸解锁时具有开锁权限的身份信息对应的人脸,以及登录终端账号时,具有登录权限的身份信息对应的人脸等。关于目标对象的更多描述可以参见图6的相关描述,此处不再赘述。
在一些实施例中,处理设备可以通过终端设备的摄像头获取待识别图像,也可以从存储设备、数据库读取,或调用数据接口等方式获取待识别图像。
步骤704,处理所述待识别图像,获得待识别图像的脱敏图像数据。在一些实施例中,步骤704可以由第三处理模块1020执行。
在一些实施例中,处理设备可以按照本说明书图2或图5所描述的图像处理方法对待识别图像进行处理,以获得待识别图像的脱敏图像数据。
步骤706,利用图像识别模型处理所述脱敏图像数据,得到预测向量。在一些实施例中,步骤706可以由第四处理模块1030执行。
预测向量是指由图像识别模型对脱敏图像数据进行转换得到的特征向量。
在一些实施例中,可以将待识别图像的脱敏图像数据输入至图像识别处理模型,从特征提取层得到所述预测向量。
在一些实施例中,图像识别模型可以按照图6中所描述的模型训练过程训练得到。
步骤708,将所述预测向量与目标对象的特征向量进行比较,当相似度大于预设值时,确定所述待识别图像中包含所述目标对象。在一些实施例中,步骤708可以由确定模块1040执行。
目标对象的特征向量可以预先存储在存储设备中。在一些实施例中,可以预先将目标对象的人脸图像进行图2或图5中的处理,得到脱敏图像数据,再利用图像识别模型处理所述脱敏图像数据,将模型特征提取层输出的预测向量作为所述目标对象的特征向量并存入存储设备中。
在一些实施例中,目标对象的特征向量可以通过从数据库、存储设备中读取或调用数据接口等方式获得。
在一些实施例中,将预测向量与目标对象的特征向量进行比较,可以是计算两个向量之间的距离,例如,余弦距离、欧式距离等,用两个向量之间的距离来表示两个向量的相似度,相似度大于预设值(例如,99%、99.5%等)时,则可以确定待识别图像中包含目标对象。
在一些实施例中,上述步骤可以在可信执行环境中进行,以确保从图像的获取到图像的识别整个过程都处于安全可信的环境中,避免图像和脱敏图像数据泄露。
应当注意的是,上述各流程的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。例如,对本说明书有关流程步骤的改变,如添加预处理步骤和存储步骤等。
图8是根据本说明书一些实施例所示的图像处理系统的模块图。在一些实施例中,所述图像处理系统800可以包括第一获取模块810、第二获取模块820和第一处理模块830。
第一获取模块810可以用于获取待处理图像数据。
在一些实施例中,待处理图像数据是指未进行脱敏处理的图像数据。待处理图像数据可以是原始人脸图像数据,也可以是对原始人脸图像数据进行人脸检测或人脸对齐后的图像数据。在一些实施例中,第一获取模块810可以通过终端设备的摄像头获取待处理图像数据,也可以从数据库、存储设备读取,或调用数据接口等方式获取待处理图像数据。
第二获取模块820可以用于对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图。
在一些实施例中,特征图是指将待处理图像数据中的像素点特征进行分解转换后的各个像素点的特征的分布图。在一些实施例中,第二获取模块820可以对待处理图像数据进行分解可以采用多种方式进行,例如,离散余弦变换、傅里叶变换、小波变换或者正交基变换等。
在一些实施例中,第二获取模块820可以对所述待处理图像数据进行局部离散余弦变换,获得多个变换结果;以及对所述多个变换结果进行重组,获得所述多个特征图。在一些实施例中,第二获取模块820可以将各变换结果中相同频率位置的值组合得到一个特征图,进而得到对应变换结果中不同频率位置的多个特征图。
第一处理模块830可以用于对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据。
脱敏图像数据即为对多个特征图进行脱敏处理后的图像数据。在一些实施例中,第一处理模块830可以采用对特征图进行重要性筛选、归一化处理、融合处理、顺序随机化等,或其任意组合的方式对多个特征图进行处理。
在一些实施例中,第一处理模块830可以对所述多个特征图进行筛选,保留其中部分特征图。第一处理模块830可以基于SEnet网络或基于预设选择规则,确定所述多个特征图中的每一个的重要性;以及基于所述重要性,舍弃所述多个特征图中的部分。第一处理模块830还可以对筛选后的多个特征图的顺序随机化。
在一些实施例中,第一处理模块830可以基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对多个特征图进行归一化处理。
在一些实施例中,第一处理模块830可以对多个特征图进行融合处理,以获取数量少于特征图的一个或多个融合特征图。第一处理模块830可以对多个特征图,按照两个或以上特征图为一组的方式进行组合,得到一个或多个组合结果;对于每个组合结果,将其中的特征图按照预设计算方式进行运算,得到融合特征图。第一处理模块830还可以对所述多个融合特征图的顺序随机化。
图9是根据本说明书一些实施例所示的图像识别模型的训练系统的模块图。在一些实施例中,所述图像处理系统900可以包括第三获取模块910、第二处理模块920、输入模块930和调整模块940。
第三获取模块910可以用于获取训练样本图像及其标签。
训练样本图像可以包括人脸图像,其标签可以是与图像中的人脸对应的身份信息,例如,人物姓名等。在一些实施例中,第三获取模块910可以以从数据库读取或调用数据接口的方式获取训练样本图像及其标签。
第二处理模块920用于使用如图2所述的图像处理方法对所述训练样本图像进行处理,获得训练样本图像的脱敏图像数据。
输入模块930可以将训练样本图像的脱敏图像数据作为输入特征输入图像识别模型,得到识别结果。
在一些实施例中,输入模块930可以将脱敏图像数据输入图像识别模型,图像识别模型输出识别结果。
调整模块940可以调整所述图像识别模型的参数,以减小识别结果与所述标签之间的差异。
在一些实施例中,调整模块940可以通过损失函数的约束来使得图像识别模型输出的识别结果逼近所述标签,并根据损失函数的值来调整图像识别模型的参数,以减少识别结果与标签之间的差异的。
图10是根据本说明书一些实施例所示的图像识别系统的模块图。在一些实施例中,所述图像处理系统1000可以包括第四获取模块1010、第三处理模块1020、第四处理模块1030和确定模块1040。
第四获取模块1010可以用于获取待识别图像。
所述待识别图像用于识别其中是否包含目标对象。在一些实施例中,第四获取模块1010可以通过终端设备的摄像头获取待识别图像,也可以从存储设备、数据库读取,或调用数据接口等方式获取待识别图像。
第三处理模块1020可以用于处理所述待识别图像,获得待识别图像的脱敏图像数据。
在一些实施例中,第三处理模块1020可以按照本说明书图2至图5所描述的图像处理方法对待识别图像进行处理,以获得待识别图像的脱敏图像数据。
第四处理模块1030可以利用图像识别模型处理所述脱敏图像数据,得到预测向量。
预测向量是指由图像识别模型对脱敏图像数据进行转换得到的特征向量。在一些实施例中,第四处理模块1030可以将待识别图像的脱敏图像数据输入至图像识别处理模型,得到所述预测向量。
确定模块1040可以将所述预测向量与目标对象的特征向量进行比较,当相似度大于预设值时,确定所述待识别图像中包含所述目标对象。
在一些实施例中,确定模块1040可以将预测向量与目标对象的特征向量进行比较,可以是计算两个向量之间的距离,例如,余弦距离、欧式距离等,用两个向量之间的距离来表示两个向量的相似度,相似度大于预设值时,则可以确定待识别图像中包含目标对象。
关于以上各系统的各模块的更多细节可以参见图2至图7及其描述,此处不再赘述。
应当理解,图8至图10所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要注意的是,以上对于图像处理、图像识别、图像识别模型的训练系统及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。例如,在一些实施例中,图8中披露的第一获取模块810和第二获取模块820可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。诸如此类的变形,均在本说明书的保护范围之内。
本说明书实施例可能带来的有益效果包括但不限于:(1)对待处理图像数据进行处理,对可视化图像进行脱敏,从脱敏图像数据很难恢复出原人脸图像数据,提高了人脸识别过程、以及模型训练过程中对人脸信息的隐私保护能力;(2)由于对脱敏后的人脸图像进行识别的过程是对脱敏图像数据的特征矢量进行的比对,和明文人脸识别训练的模型相比,在保证识别准确率的同时有效提升了隐私保护能力;(3)网络训练和图像识别过程中,由于对待识别图像转换得到的特征图进行处理的过程中丢弃了部分特征图,以及脱敏图像数据相较于明文图像数据,其包含的特征信息有一定减少,在提高隐私保护能力的情况下,还能在一定程度上降低运算成本。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、VisualBasic、Fortran2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的处理设备或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims (19)

1.一种图像处理方法,所述方法包括:
获取待处理图像数据;
对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图;
对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据;其中,所述处理包括:
对所述多个特征图进行筛选,保留其中部分特征图;
基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对筛选后的多个特征图进行归一化处理;以及,
对多个归一化处理后的特征图进行融合处理,以获取数量少于所述多个归一化处理后的特征图的一个或多个融合特征图。
2.根据权利要求1所述的方法,所述对多个归一化处理后的特征图进行融合处理,以获取数量少于所述多个归一化处理后的特征图的一个或多个融合特征图,包括:
对多个所述特征图,按照两个或以上特征图为一组的方式进行组合,得到一个或多个组合结果;
对于每个组合结果,将其中的特征图按照预设计算方式进行运算,得到融合特征图。
3.根据权利要求1所述的方法,所述分解基于以下方式进行:
离散余弦变换、傅里叶变换、小波变换或者正交基变换。
4.根据权利要求3所述的方法,基于离散余弦变换对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图,包括:
对所述待处理图像数据进行局部离散余弦变换,获得多个变换结果;
对所述多个变换结果进行重组,获得所述多个特征图。
5.根据权利要求4所述的方法,所述对所述多个变换结果进行重组包括:
将各变换结果中相同频率位置的值组合得到一个特征图,进而得到对应变换结果中不同频率位置的多个特征图。
6.根据权利要求1所述的方法,所述对所述多个特征图进行筛选,保留其中部分特征图,包括:
基于SEnet网络或基于预设选择规则,确定所述多个特征图中的每一个的重要性;
基于所述重要性,舍弃所述多个特征图中的部分。
7.根据权利要求1所述的方法,所述处理还包括:
对筛选后的多个特征图的顺序随机化;以及,
对所述多个融合特征图的顺序随机化。
8.一种图像处理系统,所述系统包括:
第一获取模块,用于获取待处理图像数据;
第二获取模块,用于对所述待处理图像数据进行分解,获取所述待处理图像数据对应的多个特征图;
第一处理模块,用于对所述多个特征图进行处理,获得用于表征所述待处理图像数据的脱敏图像数据;其中,所述处理包括:
对所述多个特征图进行筛选,保留其中部分特征图;
基于所述待处理图像数据和/或其对应的多个特征图确定归一化参数,基于所述归一化参数对筛选后的多个特征图进行归一化处理;以及,
对多个归一化处理后的特征图进行融合处理,以获取数量少于所述多个归一化处理后的特征图的一个或多个融合特征图。
9.一种图像识别模型的训练方法,所述方法包括:
获取训练样本图像及其标签;
使用如权利要求1-7任一项所述的方法处理所述训练样本图像,获得训练样本图像的脱敏图像数据;
将所述脱敏图像数据作为输入特征输入图像识别模型,得到识别结果;
调整所述图像识别模型的参数,以减小识别结果与所述标签之间的差异。
10.根据权利要求9所述的训练方法,所述训练样本图像包括人脸图像,所述标签或者所述识别结果指示人脸对应的身份信息;
所述图像识别模型用于对训练样本图像的脱敏图像数据进行处理,得到预测向量,并基于预测向量确定识别结果。
11.一种图像识别模型的训练系统,所述系统包括:
第三获取模块,用于获取训练样本图像及其标签;
第二处理模块,用于使用如权利要求1-7任一项所述的方法处理所述训练样本图像,获得训练样本图像的脱敏图像数据;
输入模块,用于将所述脱敏图像数据作为输入特征输入图像识别模型,得到识别结果;
调整模块,用于调整所述图像识别模型的参数,以减小识别结果与所述标签之间的差异。
12.一种图像识别方法,所述方法包括:
获取待识别图像;所述待识别图像用于识别其中是否包含目标对象;
使用如权利要求1-7任一项所述的方法处理所述待识别图像,获得待识别图像的脱敏图像数据;
利用图像识别模型处理所述脱敏图像数据,得到预测向量;
将所述预测向量与目标对象的特征向量进行比较,当相似度大于预设值时,确定所述待识别图像中包含所述目标对象。
13.如权利要求12所述的方法,所述目标对象包括某身份信息对应的人脸。
14.如权利要求12所述的方法,所述图像识别模型通过权利要求9或10所述的训练方法训练得到。
15.如权利要求12所述的方法在可信执行环境中执行。
16.一种图像识别系统,所述系统包括:
第四获取模块,用于获取待识别图像;所述待识别图像用于识别其中是否包含目标对象;
第三处理模块,用于使用如权利要求1-7任一项所述的方法处理所述待识别图像,获得待识别图像的脱敏图像数据;
第四处理模块,用于利用图像识别模型处理所述脱敏图像数据,得到预测向量;
确定模块,用于将所述预测向量与目标对象的特征向量进行比较,当相似度大于预设值时,确定所述待识别图像中包含所述目标对象。
17.一种图像处理装置,包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现如权利要求1~7任一项所述的方法。
18.一种图像处理装置,包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现如权利要求9-10任一项所述的方法。
19.一种图像处理装置,包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现如权利要求12-15任一项所述的方法。
CN202011532933.7A 2020-12-23 2020-12-23 图像处理、图像识别模型的训练、图像识别的方法和系统 Pending CN112257697A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011532933.7A CN112257697A (zh) 2020-12-23 2020-12-23 图像处理、图像识别模型的训练、图像识别的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011532933.7A CN112257697A (zh) 2020-12-23 2020-12-23 图像处理、图像识别模型的训练、图像识别的方法和系统

Publications (1)

Publication Number Publication Date
CN112257697A true CN112257697A (zh) 2021-01-22

Family

ID=74225314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011532933.7A Pending CN112257697A (zh) 2020-12-23 2020-12-23 图像处理、图像识别模型的训练、图像识别的方法和系统

Country Status (1)

Country Link
CN (1) CN112257697A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966737A (zh) * 2021-03-04 2021-06-15 支付宝(杭州)信息技术有限公司 图像处理、图像识别模型的训练、图像识别的方法和系统
CN113159214A (zh) * 2021-05-10 2021-07-23 支付宝(杭州)信息技术有限公司 图像处理方法和系统
CN113378982A (zh) * 2021-07-02 2021-09-10 支付宝(杭州)信息技术有限公司 一种图像处理模型的训练方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610469A (zh) * 2019-08-01 2019-12-24 长沙理工大学 一种人脸图像隐私保护方法、装置、设备及存储介质
CN111783803A (zh) * 2020-08-14 2020-10-16 支付宝(杭州)信息技术有限公司 实现隐私保护的图像处理方法及装置
CN111814194A (zh) * 2020-09-04 2020-10-23 支付宝(杭州)信息技术有限公司 基于隐私保护的图像处理方法、装置和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610469A (zh) * 2019-08-01 2019-12-24 长沙理工大学 一种人脸图像隐私保护方法、装置、设备及存储介质
CN111783803A (zh) * 2020-08-14 2020-10-16 支付宝(杭州)信息技术有限公司 实现隐私保护的图像处理方法及装置
CN111814194A (zh) * 2020-09-04 2020-10-23 支付宝(杭州)信息技术有限公司 基于隐私保护的图像处理方法、装置和电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966737A (zh) * 2021-03-04 2021-06-15 支付宝(杭州)信息技术有限公司 图像处理、图像识别模型的训练、图像识别的方法和系统
CN113159214A (zh) * 2021-05-10 2021-07-23 支付宝(杭州)信息技术有限公司 图像处理方法和系统
CN113378982A (zh) * 2021-07-02 2021-09-10 支付宝(杭州)信息技术有限公司 一种图像处理模型的训练方法和系统

Similar Documents

Publication Publication Date Title
CN112257697A (zh) 图像处理、图像识别模型的训练、图像识别的方法和系统
CN112966737A (zh) 图像处理、图像识别模型的训练、图像识别的方法和系统
EP3812988A1 (en) Method for training and testing adaption network corresponding to obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same
US7940929B1 (en) Method for processing documents containing restricted information
US9147127B2 (en) Verification of user photo IDs
CN110610144B (zh) 隐私保护的表情识别方法及系统
Mohsin et al. Based medical systems for patient’s authentication: Towards a new verification secure framework using CIA standard
KR20060021816A (ko) 데이터 처리 방법, 데이터 처리 시스템 및 컴퓨터 판독가능 매체
CN111784556A (zh) 在图像中添加数字水印的方法、装置、终端及存储介质
CN106951796B (zh) 一种数据隐私保护的脱敏方法及其装置
EP3642756B1 (en) Detecting artificial facial images using facial landmarks
CN109241852B (zh) 具有附加特征的人脸识别方法、装置、计算机设备
CN112183496A (zh) 人脸识别信息的二次加密方法、装置、设备及存储介质
Li et al. Data hiding in iris image for privacy protection
Kaur et al. A secure data classification model in cloud computing using machine learning approach
US9009486B2 (en) Biometric authentication apparatus, biometric authentication method, and computer readable storage medium
CN115795415A (zh) 一种基于区块链数字水印的数字文物存证与侵权追溯方法及系统
CN113378982A (zh) 一种图像处理模型的训练方法和系统
CN114612989A (zh) 人脸识别数据集的生成方法及装置、电子设备及存储介质
CN111523867B (zh) 人员信息管理方法、计算机设备和存储介质
CN113159214A (zh) 图像处理方法和系统
CN110678863A (zh) 使用多模式真实性确定的访问控制方法、系统、装置、终端和计算机程序产品
CN112287830A (zh) 一种图像的检测方法及装置
CN112863652A (zh) 一种医学影像数据存证系统
CN115497141A (zh) 图像数据的处理和识别、图像识别模型训练的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210122

RJ01 Rejection of invention patent application after publication