CN117390685B - 一种基于遗忘学习的行人重识别数据隐私保护方法和系统 - Google Patents

一种基于遗忘学习的行人重识别数据隐私保护方法和系统 Download PDF

Info

Publication number
CN117390685B
CN117390685B CN202311667019.7A CN202311667019A CN117390685B CN 117390685 B CN117390685 B CN 117390685B CN 202311667019 A CN202311667019 A CN 202311667019A CN 117390685 B CN117390685 B CN 117390685B
Authority
CN
China
Prior art keywords
data
forgetting
forgotten
pedestrian
privacy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311667019.7A
Other languages
English (en)
Other versions
CN117390685A (zh
Inventor
彭凯
高玮卓
徐博
张晓枫
段先明
邓天平
王琛
刘高扬
王良源
胡梦兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Chutianyun Co ltd
Huazhong University of Science and Technology
Original Assignee
Hubei Chutianyun Co ltd
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Chutianyun Co ltd, Huazhong University of Science and Technology filed Critical Hubei Chutianyun Co ltd
Priority to CN202311667019.7A priority Critical patent/CN117390685B/zh
Publication of CN117390685A publication Critical patent/CN117390685A/zh
Application granted granted Critical
Publication of CN117390685B publication Critical patent/CN117390685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于遗忘学习的行人重识别数据隐私保护方法和系统,该方法包括:获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型;能够有效保护行人重识别数据集中的个人隐私信息,同时保持行人重识别的准确性和可靠性,解决了现有遗忘算法中只针对类别数据样本数量一致的限制问题。

Description

一种基于遗忘学习的行人重识别数据隐私保护方法和系统
技术领域
本发明涉及信息安全领域,尤其涉及一种基于遗忘学习的行人重识别数据隐私保护方法和系统。
背景技术
机器学习是一种人工智能领域的技术,通过让计算机从大量数据中学习模式和规律,以实现特定任务。它基于统计学和数据分析方法,通过训练模型来预测、分类、识别和决策。行人重识别旨在通过分析摄像头捕捉到的行人图像或视频,识别出不同场景下的相同行人,以实现行人在不同时间和地点的跟踪和监测。
随着机器学习和计算机视觉技术的发展,基于机器学习技术的行人重识别技术已逐步成为现代监控系统、智能交通、及安全管理领域的核心应用。然而,机器学习本身存在各种安全问题,在使用过程中存在巨大的安全风险。
行人重识别所使用的图像和视频数据往往包含大量的个人隐私信息,例如行人的外貌特征和身份信息。最近的研究表明,行人重识别模型在应对多样的安全与隐私攻击时表现得尤为脆弱,由于深度学习模型在训练的过程中,会将学到的特征信息以权重的形式保存下来,仅利用模型参数或者梯度信息,攻击者仍可以窃取用户数据信息。因此,如何保护行人重识别系统中训练数据包含的数据隐私信息是机器学习安全领域必须解决的科学问题。
为了保护深度学习模型中的数据隐私,目前已经研究了一些数据遗忘算法,但是,这些遗忘算法在很大程度上是特定于遗忘数据的样本数量充足的情况,而行人重识别数据集中不同行人身份包含的数据样本数量并不均衡,存在样本数量不足的情况。例如,将遗忘数据的标签全部更改为其他标签并对深度学习模型进行微调,这种遗忘方法在遗忘数据较少的情况下不适用。迄今为止,针对遗忘数据样本数量不足的遗忘算法很少,没有能够有效地保护大多数行人重识别数据隐私信息的方法。
发明内容
本发明针对现有技术中存在的技术问题,提供一种基于遗忘学习的行人重识别数据隐私保护方法和系统,解决现有数据隐私保护方法中只针对遗忘数据样本数量充足的限制问题。
根据本发明的第一方面,提供了一种基于遗忘学习的行人重识别数据隐私保护方法,包括:
获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
步骤2,使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
步骤3,使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
在上述技术方案的基础上,本发明还可以作出如下改进。
可选的,所述步骤1中对所述隐私数据进行数据增强的过程包括:
随机选择数据增强方法中的一个或多个对所述隐私数据进行数据增强,获得更多数量的遗忘数据样本;
其中,所述数据增强方法包括:图片水平镜像、图片颜色增强、图片亮度增强、图片锐化以及像素均衡。
可选的,所述步骤1中对数据增强后的所述隐私数据进行选择的过程包括:
将数据增强后的所述隐私数据输入所述深度神经网络模型,得到遗忘特征数据,将所述遗忘特征数据与特征中心进行相似性度量,选择相似度最高的设定数量的所述遗忘数据生成所述遗忘数据集;
其中,所述特征中心为将原始遗忘数据输入所述深度神经网络模型得到的所有特征数据的平均值;所述相似性度量方法使用欧氏距离或余弦距离进行计算。
可选的,所述步骤2包括:
步骤201,将m个遗忘数据的像素信息与对应的标签信息Y作为所述深度网络模型M 的初始输入,得到模型的输出概率/>
步骤202,根据所述输出概率与所述标签信息Y通过损失函数计算损失,获得所述像素信息/>的梯度信息/>
步骤203,根据所述梯度信息对像素信息/>进行设定定步长s的扰动,得到新的像素信息/>
步骤204,将新的像素信息输入所述深度网络模型M,重复扰动迭代过程直至满足设定的迭代条件,获得遗忘数据的新标签/>
可选的,所述迭代条件为:迭代达到指定次数k或者所述深度网络模型M的输出概率最大值与遗忘数据对应的标签信息不同;其中,/>表示模型对第i个遗忘数据的输出概率,/>表示第i个遗忘数据的真实标签。
可选的,所述步骤3包括:
步骤301,将所述遗忘数据输出概率与所述新标签信息/>输入损失函数进行计算,得到损失值;
步骤302,通过反向传播计算所述损失值相对于模型参数的梯度,用随机梯度下降法来更新所述模型参数,基于更新后的所述模型参数得到所述遗忘隐私数据模型。
可选的,所述方法还包括:
步骤4,基于精确率和累计匹配特性CMC值是否小于预定阈值,来判定所述遗忘隐私数据模型对遗忘数据的预测能力。
根据本发明的第二方面,提供一种基于遗忘学习的行人重识别数据隐私保护系统,包括:遗忘数据集构建模块、新标签生成模块和遗忘隐私数据模型生成模块;
所述遗忘数据集构建模块,用于获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
所述新标签生成模块,用于使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
所述遗忘隐私数据模型生成模块,用于使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现基于遗忘学习的行人重识别数据隐私保护方法的步骤。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现基于遗忘学习的行人重识别数据隐私保护方法的步骤。
本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法、系统、电子设备及存储介质,在遗忘算法中添加相应的数据增强方法和遗忘数据选择机制,并在遗忘算法完成后添加判定方法。将原始遗忘数据通过数据增强方法得到样本数量扩充后的遗忘数据,扩充样本数量使遗忘算法更加精确,在额外的遗忘数据补充下,使遗忘算法关注更多数据样本的信息。遗忘数据选择机制根据扩充后的遗忘数据与原始数据的相似度度量结果选择遗忘算法使用的遗忘数据,可以根据不同类型的遗忘数据选择相应的相似度度量方法,更加有效地选择遗忘数据,使遗忘算法更有针对性的遗忘隐私信息,提高了隐私保护效率。
使用遗忘算法对遗忘数据进行扰动得到新的数据标签,迭代过程多次对遗忘数据进行扰动,有效防止了单次扰动过大破坏原始遗忘数据,提高了遗忘算法的有效性。另外,在每次数据扰动迭代过程中不断更新遗忘数据的扰动方向,有效提高了遗忘数据的标签修改效率。
将遗忘数据和对应的新数据标签输入深度神经网络模型进行训练,得到遗忘学习后的模型,从而有效地实现对行人重识别数据隐私保护。
通过所述深度神经网络模型对遗忘数据的预测标签与其真实标签计算精确率与CMC,比较精确率和CMC与阈值,检测模型对遗忘数据的预测能力,从而有效达到行人重识别数据隐私保护的目的。
相比于现有的保护方法,基于数据增强方法的遗忘算法可以应用于不同数量的遗忘数据样本,即针对任意数量的遗忘数据都能够有效保护隐私信息,以此解决现有数据隐私保护方法只针对特定样本数量的局限性问题。
附图说明
图1为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的流程图;
图2为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的实施例的流程图;
图3为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护系统的结构框图;
图4为本发明提供的一种可能的电子设备的硬件结构示意图;
图5为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法流程图,如图1所示,该方法包括:
步骤1,获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集。
由于特定类别的遗忘数据存在样本数量不足的问题,需要生成额外的遗忘样本来达到较好的遗忘效果,本发明使用数据增强从原始行人影像数据集获取遗忘数据。
步骤2,使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签。
应用深度神经网络模型和遗忘学习算法对遗忘数据集进行处理,以遗忘个人隐私信息,同时保留行人重识别所需的主要特征。
步骤3,使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
更新行人重识别模型,将遗忘学习算法处理过的数据用于训练,以增强其重识别能力。
本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法,解决现有数据隐私保护方法中只针对遗忘数据样本数量充足的限制问题,能够有效保护行人重识别数据集中的个人隐私信息,同时保持行人重识别的准确性和可靠性,解决了现有遗忘算法中只针对类别数据样本数量一致的限制问题。
实施例1
本发明提供的实施例1为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的实施例,图2为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的实施例的流程图,结合图1和图2可知,该方法的实施例包括:
步骤1,获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集。
在一种可能的实施例方式中,步骤1中对隐私数据进行数据增强的过程包括:
随机选择数据增强方法中的一个或多个对隐私数据进行数据增强,获得更多数量的遗忘数据样本。
其中,数据增强方法包括:图片水平镜像、图片颜色增强、图片亮度增强、图片锐化以及像素均衡。
由于在遗忘算法中引入数据增强方法扩充样本数量,使遗忘算法更加精确。在额外的遗忘数据中应用遗忘数据选择机制,选择更具代表性的隐私信息进行遗忘,使遗忘算法更关注遗忘数据中的隐私信息。
在一种可能的实施例方式中,步骤1中对数据增强后的隐私数据进行选择的过程包括:
将数据增强后的隐私数据输入深度神经网络模型,得到遗忘特征数据,将遗忘特征数据与特征中心进行相似性度量,选择相似度最高的设定数量的遗忘数据生成遗忘数据集,作为用于更新模型的遗忘数据。
其中,特征中心为将原始遗忘数据输入深度神经网络模型得到的所有特征数据的平均值;相似性度量方法可以使用欧氏距离或余弦距离进行计算。
具体实施中,原始行人重识别数据集为训练初始深度神经网络模型的数据集,包含不同身份行人的影像,其中含有外貌和衣着等信息。原始遗忘数据集包含特定身份行人的影像,其中含有需要保护的隐私信息。另外,经过数据增强方法对原始遗忘数据集进行增强获得增强后的遗忘数据集。由此,上述增强后的遗忘数据集与上述原始遗忘数据集为同类别。另外,使用数据选择机制对增强后的遗忘数据集所含数据进行选择,获得选取后的遗忘数据集,因此,上述选取后的遗忘数据集与原始遗忘数据集也属同类别。
例如,原始行人重识别数据集表示为,共包含C个身份的行人数据集,每个身份的数据集中的标签相同,其中包含敏感信息的遗忘数据集可表示为:,/>表示数据的像素信息,/>表示数据的标签。
需要说明的是,上述方法中描述的遗忘数据获取还包含着数据增强与选择机制,这些机制可以提高机器学习模型对于隐私数据的识别能力。
例如,行人重识别在安全、管理、市场营销、社交等多个领域都有着广泛的应用前景,在优化管理和服务方面具有重要意义。在人员出勤管理领域中,行人重识别可以用于员工出入记录,取代传统的打卡系统,实现更高效准确的出勤管理。另外,智能门禁系统领域中,行人重识别技术可以确保只有授权人员能够进入特定区域。然而,行人重识别技术也面临着一些安全挑战。例如在企业单位中应用行人重识别技术实现门禁系统,在人员调动后需要在系统中删除被调动人员的门禁信息,然而就职人员的在职时间不同导致门禁系统收录的不同人员的数据数量不同,包含较少信息数据的人员需要使用数据增强方法补充数据,保证数据遗忘效果。若不对已离职人员的身份信息进行遗忘,则该人员仍能被行人重识别系统识别认证,会对企业单位带来安全隐患。因此,在行人重识别技术中对数据隐私进行保护具有极其重要的意义。
步骤2,使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签。
在一种可能的实施例方式中,新标签为深度网络模型预测概率中最高的一项对应的数据标签;扰动为遗忘数据样本与其梯度方向上的步长相加得到,具体的,步骤2包括:
步骤201,将m个遗忘数据的像素信息与对应的标签信息Y作为深度网络模型M的初始输入,得到模型的输出概率/>
步骤202,根据输出概率与标签信息Y通过损失函数计算损失,获得像素信息的梯度信息/>
步骤203,根据梯度信息对像素信息/>进行设定定步长s的扰动,得到新的像素信息/>
步骤204,将新的像素信息输入深度网络模型M,重复扰动迭代过程直至满足设定的迭代条件,获得遗忘数据的新标签/>
其中,迭代过程可以描述为:,其中,/>,t为迭代次数。多次迭代可以更快速准确的找到遗忘数据的新标签,用于计算更新模型的损失函数。
在一种可能的实施例方式中,迭代条件为:迭代达到指定次数k或者深度网络模型M的输出概率最大值与遗忘数据对应的标签信息不同;其中,表示模型对第i个遗忘数据的输出概率,/>表示第i个遗忘数据的真实标签。
具体实施中,经过上述的迭代过程,若深度神经网络模型产生了新的预测标签,即对遗忘数据样本的标签进行修改,否则维持不变。
步骤3,使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
在一种可能的实施例方式中,步骤3包括:
步骤301,将遗忘数据输出概率与新标签信息/>输入损失函数进行计算,得到损失值。
具体实施中,步骤301中损失值可以为输出概率与新标签信息/>的交叉熵损失,损失函数可以为:/>
步骤302,通过反向传播计算损失值相对于模型参数的梯度,用随机梯度下降法来更新模型参数,基于更新后的模型参数得到遗忘隐私数据模型。
具体实施中,将深度网络模型更新为遗忘隐私数据模型的过程可以阐述成以下优化问题:
,其中,w为深度网络模型中的参数,在迭代过程中w趋于收敛时,就能够得到最佳的模型参数。
在一种可能的实施例方式中,方法还包括:
步骤4,基于精确率和累计匹配特性CMC值是否小于预定阈值,来判定遗忘隐私数据模型对遗忘数据的预测能力。
具体实施中,为了验证上述行人重识别数据中隐私信息的保护效果,使用精确率和累计匹配特性CMC检测深度神经网络模型对遗忘数据的预测能力;当精确率和CMC值小于预定阈值时,则该方法成功保护行人重识别数据中个人隐私信息,否则不成功。
具体的,使用不包含遗忘数据的原始行人数据集训练得到一新深度神经网络模型/>;将遗忘数据输入该新深度神经网络模型,得到精确率和CMC值;基于精确率和CMC值,确定验证遗忘数据隐私保护效果的阈值。若模型M对遗忘数据/>预测结果的精确率和CMC值小于该阈值时,则认定该遗忘算法实现了对行人重识别数据隐私的保护。
在图像识别任务中,机器学习模型的输入是一张包含隐私信息图片,模型无法输出该图片所属的正确类别。本发明基于此提供的一种基于遗忘学习的行人重识别数据隐私保护方法,首先是获取行人重识别的数据集(其中包含含有隐私信息的图片)的情况下对隐私数据进行数据增强和选取,获取遗忘数据集。然后将遗忘数据输入深度神经网络模型,根据模型输出的梯度信息对遗忘数据进行扰动并再次输入模型,经过迭代过程获得遗忘数据新的所属标签,再对模型进行训练。最后可以通过测试模型对遗忘数据的预测精确率和累计匹配特性结果,检测模型是否无法正确预测遗忘数据。解决现有数据隐私保护方法中只针对遗忘数据样本数量充足的限制问题,能够有效保护行人重识别数据集中的个人隐私信息,同时保持行人重识别的准确性和可靠性,解决了现有遗忘算法中只针对类别数据样本数量一致的限制问题。
实施例2
本发明提供的实施例2为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护系统的实施例,图3为本发明实施例提供的一种基于遗忘学习的行人重识别数据隐私保护系统的结构图,结合图3可知,该系统的实施例包括:遗忘数据集构建模块、新标签生成模块和遗忘隐私数据模型生成模块。
遗忘数据集构建模块,用于获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集。
新标签生成模块,用于使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;
遗忘隐私数据模型生成模块,用于使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
可以理解的是,本发明提供的一种基于遗忘学习的行人重识别数据隐私保护系统与前述各实施例提供的基于遗忘学习的行人重识别数据隐私保护方法相对应,基于遗忘学习的行人重识别数据隐私保护系统的相关技术特征可参考基于遗忘学习的行人重识别数据隐私保护方法的相关技术特征,在此不再赘述。
请参阅图4,图4为本发明实施例提供的电子设备的实施例示意图。如图4所示,本发明实施例提了一种电子设备,包括存储器1310、处理器1320及存储在存储器1310上并可在处理器1320上运行的计算机程序1311,处理器1320执行计算机程序1311时实现以下步骤:获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
请参阅图5,图5为本发明提供的一种计算机可读存储介质的实施例示意图。如图5所示,本实施例提供了一种计算机可读存储介质1400,其上存储有计算机程序1411,该计算机程序1411被处理器执行时实现如下步骤:获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
本发明实施例提供的一种基于遗忘学习的行人重识别数据隐私保护方法、系统、电子设备及存储介质,在遗忘算法中添加相应的数据增强方法和遗忘数据选择机制,并在遗忘算法完成后添加判定方法。将原始遗忘数据通过数据增强方法得到样本数量扩充后的遗忘数据,扩充样本数量使遗忘算法更加精确,在额外的遗忘数据补充下,使遗忘算法关注更多数据样本的信息。遗忘数据选择机制根据扩充后的遗忘数据与原始数据的相似度度量结果选择遗忘算法使用的遗忘数据,可以根据不同类型的遗忘数据选择相应的相似度度量方法,更加有效地选择遗忘数据,使遗忘算法更有针对性的遗忘隐私信息,提高了隐私保护效率。
使用遗忘算法对遗忘数据进行扰动得到新的数据标签,迭代过程多次对遗忘数据进行扰动,有效防止了单次扰动过大破坏原始遗忘数据,提高了遗忘算法的有效性。另外,在每次数据扰动迭代过程中不断更新遗忘数据的扰动方向,有效提高了遗忘数据的标签修改效率。
将遗忘数据和对应的新数据标签输入深度神经网络模型进行训练,得到遗忘学习后的模型,从而有效地实现对行人重识别数据隐私保护。
通过深度神经网络模型对遗忘数据的预测标签与其真实标签计算精确率与CMC,比较精确率和CMC与阈值,检测模型对遗忘数据的预测能力,从而有效达到行人重识别数据隐私保护的目的。
相比于现有的保护方法,基于数据增强方法的遗忘算法可以应用于不同数量的遗忘数据样本,即针对任意数量的遗忘数据都能够有效保护隐私信息,以此解决现有数据隐私保护方法只针对特定样本数量的局限性问题。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种基于遗忘学习的行人重识别数据隐私保护方法,其特征在于,所述方法包括:
步骤1,获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
步骤2,使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
步骤3,使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
2.根据权利要求1所述的方法,其特征在于,所述步骤1中对所述隐私数据进行数据增强的过程包括:
随机选择数据增强方法中的一个或多个对所述隐私数据进行数据增强,获得更多数量的遗忘数据样本;
其中,所述数据增强方法包括:图片水平镜像、图片颜色增强、图片亮度增强、图片锐化以及像素均衡。
3.根据权利要求1所述的方法,其特征在于,所述步骤1中对数据增强后的所述隐私数据进行选择的过程包括:
将数据增强后的所述隐私数据输入所述深度网络模型,得到遗忘特征数据,将所述遗忘特征数据与特征中心进行相似性度量,选择相似度最高的设定数量的所述遗忘数据生成所述遗忘数据集;
其中,所述特征中心为将原始遗忘数据输入所述深度网络模型得到的所有特征数据的平均值;所述相似性度量方法使用欧氏距离或余弦距离进行计算。
4.根据权利要求1所述的方法,其特征在于,所述步骤2包括:
步骤201,将m个遗忘数据的像素信息与对应的标签信息Y作为所述深度网络模型M的初始输入,得到模型的输出概率/>
步骤202,根据所述输出概率与所述标签信息Y通过损失函数计算损失,获得所述像素信息/>的梯度信息/>
步骤203,根据所述梯度信息对像素信息/>进行设定定步长s的扰动,得到新的像素信息/>
步骤204,将新的像素信息输入所述深度网络模型M,重复扰动迭代过程直至满足设定的迭代条件,获得遗忘数据的新标签/>
5.根据权利要求4所述的方法,其特征在于,所述迭代条件为:迭代达到指定次数k或者所述深度网络模型M的输出概率最大值与遗忘数据对应的标签信息不同;其中,/>表示模型对第i个遗忘数据的输出概率,表示第i个遗忘数据的真实标签。
6.根据权利要求4所述的方法,其特征在于,所述步骤3包括:
步骤301,将所述遗忘数据输出概率与所述新标签/>输入损失函数进行计算,得到损失值;
步骤302,通过反向传播计算所述损失值相对于模型参数的梯度,用随机梯度下降法来更新所述模型参数,基于更新后的所述模型参数得到所述遗忘隐私数据模型。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
步骤4,基于精确率和累计匹配特性CMC值是否小于预定阈值,来判定所述遗忘隐私数据模型对遗忘数据的预测能力。
8.一种基于遗忘学习的行人重识别数据隐私保护系统,其特征在于,包括:遗忘数据集构建模块、新标签生成模块和遗忘隐私数据模型生成模块;
所述遗忘数据集构建模块,用于获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
所述新标签生成模块,用于使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
所述遗忘隐私数据模型生成模块,用于使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
9.一种电子设备,其特征在于,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1-7任一项所述的基于遗忘学习的行人重识别数据隐私保护方法的步骤。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现如权利要求1-7任一项所述的基于遗忘学习的行人重识别数据隐私保护方法的步骤。
CN202311667019.7A 2023-12-07 2023-12-07 一种基于遗忘学习的行人重识别数据隐私保护方法和系统 Active CN117390685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311667019.7A CN117390685B (zh) 2023-12-07 2023-12-07 一种基于遗忘学习的行人重识别数据隐私保护方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311667019.7A CN117390685B (zh) 2023-12-07 2023-12-07 一种基于遗忘学习的行人重识别数据隐私保护方法和系统

Publications (2)

Publication Number Publication Date
CN117390685A CN117390685A (zh) 2024-01-12
CN117390685B true CN117390685B (zh) 2024-04-05

Family

ID=89465028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311667019.7A Active CN117390685B (zh) 2023-12-07 2023-12-07 一种基于遗忘学习的行人重识别数据隐私保护方法和系统

Country Status (1)

Country Link
CN (1) CN117390685B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022001489A1 (zh) * 2020-06-28 2022-01-06 北京交通大学 一种无监督域适应的目标重识别方法
CN115392451A (zh) * 2022-08-02 2022-11-25 西安工业大学 一种可持续学习的人工神经网络避免遗忘方法
CN116522007A (zh) * 2023-07-05 2023-08-01 中国科学技术大学 一种面向推荐系统模型的数据遗忘学习方法、装置及介质
CN117056957A (zh) * 2023-05-06 2023-11-14 浙江大学 极小极大学习模型的可验证数据遗忘隐私保护方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4006785A1 (en) * 2020-11-27 2022-06-01 Naver Corporation Method for learning representations less prone to catastrophic forgetting
US20230252279A1 (en) * 2022-02-08 2023-08-10 NavInfo Europe B.V. Self-supervised based approach for mitigating catastrophic forgetting in continual learning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022001489A1 (zh) * 2020-06-28 2022-01-06 北京交通大学 一种无监督域适应的目标重识别方法
CN115392451A (zh) * 2022-08-02 2022-11-25 西安工业大学 一种可持续学习的人工神经网络避免遗忘方法
CN117056957A (zh) * 2023-05-06 2023-11-14 浙江大学 极小极大学习模型的可验证数据遗忘隐私保护方法和装置
CN116522007A (zh) * 2023-07-05 2023-08-01 中国科学技术大学 一种面向推荐系统模型的数据遗忘学习方法、装置及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
克服小样本学习中灾难性遗忘方法研究;李文煜;帅仁俊;郭汉;;计算机应用与软件;20200712(第07期);全文 *
李文煜 ; 帅仁俊 ; 郭汉 ; .克服小样本学习中灾难性遗忘方法研究.计算机应用与软件.2020,(第07期),全文. *

Also Published As

Publication number Publication date
CN117390685A (zh) 2024-01-12

Similar Documents

Publication Publication Date Title
CN111914256B (zh) 一种机器学习训练数据受投毒攻击的防御方法
US11188783B2 (en) Reverse neural network for object re-identification
CN108229314B (zh) 目标人物的搜索方法、装置和电子设备
Chopra et al. Automated Registration of Multiangle SAR Images Using Artificial Intelligence
Braunegg et al. Apricot: A dataset of physical adversarial attacks on object detection
CN109800682B (zh) 驾驶员属性识别方法及相关产品
CN110851835A (zh) 图像模型检测方法、装置、电子设备及存储介质
CN106919921B (zh) 结合子空间学习与张量神经网络的步态识别方法及系统
CN113919497A (zh) 针对连续学习能力系统的基于特征操纵的攻击和防御方法
CN109766755A (zh) 人脸识别方法及相关产品
Singleton et al. Gun identification using tensorflow
CN114758113A (zh) 对抗样本防御训练方法、分类预测方法及装置、电子设备
CN117390685B (zh) 一种基于遗忘学习的行人重识别数据隐私保护方法和系统
Zhang et al. Face occlusion detection using cascaded convolutional neural network
CN112507912B (zh) 一种识别违规图片的方法及装置
Haider AbdAlkreem et al. Detect People's Faces and Protect Them by Providing High Privacy Based on Deep Learning
CN114266041A (zh) 模型的后门防御能力提升方法、装置及系统
Xu et al. Lancex: A versatile and lightweight defense method against condensed adversarial attacks in image and audio recognition
Dhar et al. Detecting deepfake images using deep convolutional neural network
Girish et al. Inter-frame video forgery detection using UFS-MSRC algorithm and LSTM network
Sun et al. Neural Network Semantic Backdoor Detection and Mitigation: A Causality-Based Approach
Gupta et al. Texture, Quality, and Motion-Based Analysis for Face Spoofing Detection System: A Review
CN114065867B (zh) 一种数据分类方法、系统及电子设备
CN114638356B (zh) 一种静态权重引导的深度神经网络后门检测方法及系统
Nagaraj et al. Detection of Frame Duplication Using Multi Scale Local Oriented Feature Descriptors.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant