CN117390685B - 一种基于遗忘学习的行人重识别数据隐私保护方法和系统 - Google Patents
一种基于遗忘学习的行人重识别数据隐私保护方法和系统 Download PDFInfo
- Publication number
- CN117390685B CN117390685B CN202311667019.7A CN202311667019A CN117390685B CN 117390685 B CN117390685 B CN 117390685B CN 202311667019 A CN202311667019 A CN 202311667019A CN 117390685 B CN117390685 B CN 117390685B
- Authority
- CN
- China
- Prior art keywords
- data
- forgetting
- forgotten
- pedestrian
- privacy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 38
- 238000013499 data model Methods 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000003094 perturbing effect Effects 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 10
- 238000007726 management method Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 4
- 238000000691 measurement method Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 description 15
- 238000004590 computer program Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000012804 iterative process Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Bioethics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于遗忘学习的行人重识别数据隐私保护方法和系统,该方法包括:获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型;能够有效保护行人重识别数据集中的个人隐私信息,同时保持行人重识别的准确性和可靠性,解决了现有遗忘算法中只针对类别数据样本数量一致的限制问题。
Description
技术领域
本发明涉及信息安全领域,尤其涉及一种基于遗忘学习的行人重识别数据隐私保护方法和系统。
背景技术
机器学习是一种人工智能领域的技术,通过让计算机从大量数据中学习模式和规律,以实现特定任务。它基于统计学和数据分析方法,通过训练模型来预测、分类、识别和决策。行人重识别旨在通过分析摄像头捕捉到的行人图像或视频,识别出不同场景下的相同行人,以实现行人在不同时间和地点的跟踪和监测。
随着机器学习和计算机视觉技术的发展,基于机器学习技术的行人重识别技术已逐步成为现代监控系统、智能交通、及安全管理领域的核心应用。然而,机器学习本身存在各种安全问题,在使用过程中存在巨大的安全风险。
行人重识别所使用的图像和视频数据往往包含大量的个人隐私信息,例如行人的外貌特征和身份信息。最近的研究表明,行人重识别模型在应对多样的安全与隐私攻击时表现得尤为脆弱,由于深度学习模型在训练的过程中,会将学到的特征信息以权重的形式保存下来,仅利用模型参数或者梯度信息,攻击者仍可以窃取用户数据信息。因此,如何保护行人重识别系统中训练数据包含的数据隐私信息是机器学习安全领域必须解决的科学问题。
为了保护深度学习模型中的数据隐私,目前已经研究了一些数据遗忘算法,但是,这些遗忘算法在很大程度上是特定于遗忘数据的样本数量充足的情况,而行人重识别数据集中不同行人身份包含的数据样本数量并不均衡,存在样本数量不足的情况。例如,将遗忘数据的标签全部更改为其他标签并对深度学习模型进行微调,这种遗忘方法在遗忘数据较少的情况下不适用。迄今为止,针对遗忘数据样本数量不足的遗忘算法很少,没有能够有效地保护大多数行人重识别数据隐私信息的方法。
发明内容
本发明针对现有技术中存在的技术问题,提供一种基于遗忘学习的行人重识别数据隐私保护方法和系统,解决现有数据隐私保护方法中只针对遗忘数据样本数量充足的限制问题。
根据本发明的第一方面,提供了一种基于遗忘学习的行人重识别数据隐私保护方法,包括:
获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
步骤2,使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
步骤3,使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
在上述技术方案的基础上,本发明还可以作出如下改进。
可选的,所述步骤1中对所述隐私数据进行数据增强的过程包括:
随机选择数据增强方法中的一个或多个对所述隐私数据进行数据增强,获得更多数量的遗忘数据样本;
其中,所述数据增强方法包括:图片水平镜像、图片颜色增强、图片亮度增强、图片锐化以及像素均衡。
可选的,所述步骤1中对数据增强后的所述隐私数据进行选择的过程包括:
将数据增强后的所述隐私数据输入所述深度神经网络模型,得到遗忘特征数据,将所述遗忘特征数据与特征中心进行相似性度量,选择相似度最高的设定数量的所述遗忘数据生成所述遗忘数据集;
其中,所述特征中心为将原始遗忘数据输入所述深度神经网络模型得到的所有特征数据的平均值;所述相似性度量方法使用欧氏距离或余弦距离进行计算。
可选的,所述步骤2包括:
步骤201,将m个遗忘数据的像素信息与对应的标签信息Y作为所述深度网络模型M 的初始输入,得到模型的输出概率/>;
步骤202,根据所述输出概率与所述标签信息Y通过损失函数计算损失,获得所述像素信息/>的梯度信息/>;
步骤203,根据所述梯度信息对像素信息/>进行设定定步长s的扰动,得到新的像素信息/>;
步骤204,将新的像素信息输入所述深度网络模型M,重复扰动迭代过程直至满足设定的迭代条件,获得遗忘数据的新标签/>。
可选的,所述迭代条件为:迭代达到指定次数k或者所述深度网络模型M的输出概率最大值与遗忘数据对应的标签信息不同;其中,/>表示模型对第i个遗忘数据的输出概率,/>表示第i个遗忘数据的真实标签。
可选的,所述步骤3包括:
步骤301,将所述遗忘数据输出概率与所述新标签信息/>输入损失函数进行计算,得到损失值;
步骤302,通过反向传播计算所述损失值相对于模型参数的梯度,用随机梯度下降法来更新所述模型参数,基于更新后的所述模型参数得到所述遗忘隐私数据模型。
可选的,所述方法还包括:
步骤4,基于精确率和累计匹配特性CMC值是否小于预定阈值,来判定所述遗忘隐私数据模型对遗忘数据的预测能力。
根据本发明的第二方面,提供一种基于遗忘学习的行人重识别数据隐私保护系统,包括:遗忘数据集构建模块、新标签生成模块和遗忘隐私数据模型生成模块;
所述遗忘数据集构建模块,用于获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
所述新标签生成模块,用于使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
所述遗忘隐私数据模型生成模块,用于使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现基于遗忘学习的行人重识别数据隐私保护方法的步骤。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现基于遗忘学习的行人重识别数据隐私保护方法的步骤。
本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法、系统、电子设备及存储介质,在遗忘算法中添加相应的数据增强方法和遗忘数据选择机制,并在遗忘算法完成后添加判定方法。将原始遗忘数据通过数据增强方法得到样本数量扩充后的遗忘数据,扩充样本数量使遗忘算法更加精确,在额外的遗忘数据补充下,使遗忘算法关注更多数据样本的信息。遗忘数据选择机制根据扩充后的遗忘数据与原始数据的相似度度量结果选择遗忘算法使用的遗忘数据,可以根据不同类型的遗忘数据选择相应的相似度度量方法,更加有效地选择遗忘数据,使遗忘算法更有针对性的遗忘隐私信息,提高了隐私保护效率。
使用遗忘算法对遗忘数据进行扰动得到新的数据标签,迭代过程多次对遗忘数据进行扰动,有效防止了单次扰动过大破坏原始遗忘数据,提高了遗忘算法的有效性。另外,在每次数据扰动迭代过程中不断更新遗忘数据的扰动方向,有效提高了遗忘数据的标签修改效率。
将遗忘数据和对应的新数据标签输入深度神经网络模型进行训练,得到遗忘学习后的模型,从而有效地实现对行人重识别数据隐私保护。
通过所述深度神经网络模型对遗忘数据的预测标签与其真实标签计算精确率与CMC,比较精确率和CMC与阈值,检测模型对遗忘数据的预测能力,从而有效达到行人重识别数据隐私保护的目的。
相比于现有的保护方法,基于数据增强方法的遗忘算法可以应用于不同数量的遗忘数据样本,即针对任意数量的遗忘数据都能够有效保护隐私信息,以此解决现有数据隐私保护方法只针对特定样本数量的局限性问题。
附图说明
图1为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的流程图;
图2为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的实施例的流程图;
图3为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护系统的结构框图;
图4为本发明提供的一种可能的电子设备的硬件结构示意图;
图5为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法流程图,如图1所示,该方法包括:
步骤1,获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集。
由于特定类别的遗忘数据存在样本数量不足的问题,需要生成额外的遗忘样本来达到较好的遗忘效果,本发明使用数据增强从原始行人影像数据集获取遗忘数据。
步骤2,使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签。
应用深度神经网络模型和遗忘学习算法对遗忘数据集进行处理,以遗忘个人隐私信息,同时保留行人重识别所需的主要特征。
步骤3,使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
更新行人重识别模型,将遗忘学习算法处理过的数据用于训练,以增强其重识别能力。
本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法,解决现有数据隐私保护方法中只针对遗忘数据样本数量充足的限制问题,能够有效保护行人重识别数据集中的个人隐私信息,同时保持行人重识别的准确性和可靠性,解决了现有遗忘算法中只针对类别数据样本数量一致的限制问题。
实施例1
本发明提供的实施例1为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的实施例,图2为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护方法的实施例的流程图,结合图1和图2可知,该方法的实施例包括:
步骤1,获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集。
在一种可能的实施例方式中,步骤1中对隐私数据进行数据增强的过程包括:
随机选择数据增强方法中的一个或多个对隐私数据进行数据增强,获得更多数量的遗忘数据样本。
其中,数据增强方法包括:图片水平镜像、图片颜色增强、图片亮度增强、图片锐化以及像素均衡。
由于在遗忘算法中引入数据增强方法扩充样本数量,使遗忘算法更加精确。在额外的遗忘数据中应用遗忘数据选择机制,选择更具代表性的隐私信息进行遗忘,使遗忘算法更关注遗忘数据中的隐私信息。
在一种可能的实施例方式中,步骤1中对数据增强后的隐私数据进行选择的过程包括:
将数据增强后的隐私数据输入深度神经网络模型,得到遗忘特征数据,将遗忘特征数据与特征中心进行相似性度量,选择相似度最高的设定数量的遗忘数据生成遗忘数据集,作为用于更新模型的遗忘数据。
其中,特征中心为将原始遗忘数据输入深度神经网络模型得到的所有特征数据的平均值;相似性度量方法可以使用欧氏距离或余弦距离进行计算。
具体实施中,原始行人重识别数据集为训练初始深度神经网络模型的数据集,包含不同身份行人的影像,其中含有外貌和衣着等信息。原始遗忘数据集包含特定身份行人的影像,其中含有需要保护的隐私信息。另外,经过数据增强方法对原始遗忘数据集进行增强获得增强后的遗忘数据集。由此,上述增强后的遗忘数据集与上述原始遗忘数据集为同类别。另外,使用数据选择机制对增强后的遗忘数据集所含数据进行选择,获得选取后的遗忘数据集,因此,上述选取后的遗忘数据集与原始遗忘数据集也属同类别。
例如,原始行人重识别数据集表示为,共包含C个身份的行人数据集,每个身份的数据集中的标签相同,其中包含敏感信息的遗忘数据集可表示为:,/>表示数据的像素信息,/>表示数据的标签。
需要说明的是,上述方法中描述的遗忘数据获取还包含着数据增强与选择机制,这些机制可以提高机器学习模型对于隐私数据的识别能力。
例如,行人重识别在安全、管理、市场营销、社交等多个领域都有着广泛的应用前景,在优化管理和服务方面具有重要意义。在人员出勤管理领域中,行人重识别可以用于员工出入记录,取代传统的打卡系统,实现更高效准确的出勤管理。另外,智能门禁系统领域中,行人重识别技术可以确保只有授权人员能够进入特定区域。然而,行人重识别技术也面临着一些安全挑战。例如在企业单位中应用行人重识别技术实现门禁系统,在人员调动后需要在系统中删除被调动人员的门禁信息,然而就职人员的在职时间不同导致门禁系统收录的不同人员的数据数量不同,包含较少信息数据的人员需要使用数据增强方法补充数据,保证数据遗忘效果。若不对已离职人员的身份信息进行遗忘,则该人员仍能被行人重识别系统识别认证,会对企业单位带来安全隐患。因此,在行人重识别技术中对数据隐私进行保护具有极其重要的意义。
步骤2,使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签。
在一种可能的实施例方式中,新标签为深度网络模型预测概率中最高的一项对应的数据标签;扰动为遗忘数据样本与其梯度方向上的步长相加得到,具体的,步骤2包括:
步骤201,将m个遗忘数据的像素信息与对应的标签信息Y作为深度网络模型M的初始输入,得到模型的输出概率/>。
步骤202,根据输出概率与标签信息Y通过损失函数计算损失,获得像素信息的梯度信息/>。
步骤203,根据梯度信息对像素信息/>进行设定定步长s的扰动,得到新的像素信息/>。
步骤204,将新的像素信息输入深度网络模型M,重复扰动迭代过程直至满足设定的迭代条件,获得遗忘数据的新标签/>。
其中,迭代过程可以描述为:,其中,/>,t为迭代次数。多次迭代可以更快速准确的找到遗忘数据的新标签,用于计算更新模型的损失函数。
在一种可能的实施例方式中,迭代条件为:迭代达到指定次数k或者深度网络模型M的输出概率最大值与遗忘数据对应的标签信息不同;其中,表示模型对第i个遗忘数据的输出概率,/>表示第i个遗忘数据的真实标签。
具体实施中,经过上述的迭代过程,若深度神经网络模型产生了新的预测标签,即对遗忘数据样本的标签进行修改,否则维持不变。
步骤3,使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
在一种可能的实施例方式中,步骤3包括:
步骤301,将遗忘数据输出概率与新标签信息/>输入损失函数进行计算,得到损失值。
具体实施中,步骤301中损失值可以为输出概率与新标签信息/>的交叉熵损失,损失函数可以为:/>。
步骤302,通过反向传播计算损失值相对于模型参数的梯度,用随机梯度下降法来更新模型参数,基于更新后的模型参数得到遗忘隐私数据模型。
具体实施中,将深度网络模型更新为遗忘隐私数据模型的过程可以阐述成以下优化问题:
,其中,w为深度网络模型中的参数,在迭代过程中w趋于收敛时,就能够得到最佳的模型参数。
在一种可能的实施例方式中,方法还包括:
步骤4,基于精确率和累计匹配特性CMC值是否小于预定阈值,来判定遗忘隐私数据模型对遗忘数据的预测能力。
具体实施中,为了验证上述行人重识别数据中隐私信息的保护效果,使用精确率和累计匹配特性CMC检测深度神经网络模型对遗忘数据的预测能力;当精确率和CMC值小于预定阈值时,则该方法成功保护行人重识别数据中个人隐私信息,否则不成功。
具体的,使用不包含遗忘数据的原始行人数据集训练得到一新深度神经网络模型/>;将遗忘数据输入该新深度神经网络模型,得到精确率和CMC值;基于精确率和CMC值,确定验证遗忘数据隐私保护效果的阈值。若模型M对遗忘数据/>预测结果的精确率和CMC值小于该阈值时,则认定该遗忘算法实现了对行人重识别数据隐私的保护。
在图像识别任务中,机器学习模型的输入是一张包含隐私信息图片,模型无法输出该图片所属的正确类别。本发明基于此提供的一种基于遗忘学习的行人重识别数据隐私保护方法,首先是获取行人重识别的数据集(其中包含含有隐私信息的图片)的情况下对隐私数据进行数据增强和选取,获取遗忘数据集。然后将遗忘数据输入深度神经网络模型,根据模型输出的梯度信息对遗忘数据进行扰动并再次输入模型,经过迭代过程获得遗忘数据新的所属标签,再对模型进行训练。最后可以通过测试模型对遗忘数据的预测精确率和累计匹配特性结果,检测模型是否无法正确预测遗忘数据。解决现有数据隐私保护方法中只针对遗忘数据样本数量充足的限制问题,能够有效保护行人重识别数据集中的个人隐私信息,同时保持行人重识别的准确性和可靠性,解决了现有遗忘算法中只针对类别数据样本数量一致的限制问题。
实施例2
本发明提供的实施例2为本发明提供的一种基于遗忘学习的行人重识别数据隐私保护系统的实施例,图3为本发明实施例提供的一种基于遗忘学习的行人重识别数据隐私保护系统的结构图,结合图3可知,该系统的实施例包括:遗忘数据集构建模块、新标签生成模块和遗忘隐私数据模型生成模块。
遗忘数据集构建模块,用于获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集。
新标签生成模块,用于使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;
遗忘隐私数据模型生成模块,用于使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
可以理解的是,本发明提供的一种基于遗忘学习的行人重识别数据隐私保护系统与前述各实施例提供的基于遗忘学习的行人重识别数据隐私保护方法相对应,基于遗忘学习的行人重识别数据隐私保护系统的相关技术特征可参考基于遗忘学习的行人重识别数据隐私保护方法的相关技术特征,在此不再赘述。
请参阅图4,图4为本发明实施例提供的电子设备的实施例示意图。如图4所示,本发明实施例提了一种电子设备,包括存储器1310、处理器1320及存储在存储器1310上并可在处理器1320上运行的计算机程序1311,处理器1320执行计算机程序1311时实现以下步骤:获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
请参阅图5,图5为本发明提供的一种计算机可读存储介质的实施例示意图。如图5所示,本实施例提供了一种计算机可读存储介质1400,其上存储有计算机程序1411,该计算机程序1411被处理器执行时实现如下步骤:获取原始行人图像数据,对行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;使用遗忘算法计算遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用梯度信息对遗忘数据进行扰动后再次输入深度网络模型,重复扰动迭代过程,获得遗忘数据的新标签;使用遗忘数据和对应的新标签对深度网络模型进行训练,得到遗忘隐私数据模型。
本发明实施例提供的一种基于遗忘学习的行人重识别数据隐私保护方法、系统、电子设备及存储介质,在遗忘算法中添加相应的数据增强方法和遗忘数据选择机制,并在遗忘算法完成后添加判定方法。将原始遗忘数据通过数据增强方法得到样本数量扩充后的遗忘数据,扩充样本数量使遗忘算法更加精确,在额外的遗忘数据补充下,使遗忘算法关注更多数据样本的信息。遗忘数据选择机制根据扩充后的遗忘数据与原始数据的相似度度量结果选择遗忘算法使用的遗忘数据,可以根据不同类型的遗忘数据选择相应的相似度度量方法,更加有效地选择遗忘数据,使遗忘算法更有针对性的遗忘隐私信息,提高了隐私保护效率。
使用遗忘算法对遗忘数据进行扰动得到新的数据标签,迭代过程多次对遗忘数据进行扰动,有效防止了单次扰动过大破坏原始遗忘数据,提高了遗忘算法的有效性。另外,在每次数据扰动迭代过程中不断更新遗忘数据的扰动方向,有效提高了遗忘数据的标签修改效率。
将遗忘数据和对应的新数据标签输入深度神经网络模型进行训练,得到遗忘学习后的模型,从而有效地实现对行人重识别数据隐私保护。
通过深度神经网络模型对遗忘数据的预测标签与其真实标签计算精确率与CMC,比较精确率和CMC与阈值,检测模型对遗忘数据的预测能力,从而有效达到行人重识别数据隐私保护的目的。
相比于现有的保护方法,基于数据增强方法的遗忘算法可以应用于不同数量的遗忘数据样本,即针对任意数量的遗忘数据都能够有效保护隐私信息,以此解决现有数据隐私保护方法只针对特定样本数量的局限性问题。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (10)
1.一种基于遗忘学习的行人重识别数据隐私保护方法,其特征在于,所述方法包括:
步骤1,获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
步骤2,使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
步骤3,使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
2.根据权利要求1所述的方法,其特征在于,所述步骤1中对所述隐私数据进行数据增强的过程包括:
随机选择数据增强方法中的一个或多个对所述隐私数据进行数据增强,获得更多数量的遗忘数据样本;
其中,所述数据增强方法包括:图片水平镜像、图片颜色增强、图片亮度增强、图片锐化以及像素均衡。
3.根据权利要求1所述的方法,其特征在于,所述步骤1中对数据增强后的所述隐私数据进行选择的过程包括:
将数据增强后的所述隐私数据输入所述深度网络模型,得到遗忘特征数据,将所述遗忘特征数据与特征中心进行相似性度量,选择相似度最高的设定数量的所述遗忘数据生成所述遗忘数据集;
其中,所述特征中心为将原始遗忘数据输入所述深度网络模型得到的所有特征数据的平均值;所述相似性度量方法使用欧氏距离或余弦距离进行计算。
4.根据权利要求1所述的方法,其特征在于,所述步骤2包括:
步骤201,将m个遗忘数据的像素信息与对应的标签信息Y作为所述深度网络模型M的初始输入,得到模型的输出概率/>;
步骤202,根据所述输出概率与所述标签信息Y通过损失函数计算损失,获得所述像素信息/>的梯度信息/>;
步骤203,根据所述梯度信息对像素信息/>进行设定定步长s的扰动,得到新的像素信息/>;
步骤204,将新的像素信息输入所述深度网络模型M,重复扰动迭代过程直至满足设定的迭代条件,获得遗忘数据的新标签/>。
5.根据权利要求4所述的方法,其特征在于,所述迭代条件为:迭代达到指定次数k或者所述深度网络模型M的输出概率最大值与遗忘数据对应的标签信息不同;其中,/>表示模型对第i个遗忘数据的输出概率,表示第i个遗忘数据的真实标签。
6.根据权利要求4所述的方法,其特征在于,所述步骤3包括:
步骤301,将所述遗忘数据输出概率与所述新标签/>输入损失函数进行计算,得到损失值;
步骤302,通过反向传播计算所述损失值相对于模型参数的梯度,用随机梯度下降法来更新所述模型参数,基于更新后的所述模型参数得到所述遗忘隐私数据模型。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
步骤4,基于精确率和累计匹配特性CMC值是否小于预定阈值,来判定所述遗忘隐私数据模型对遗忘数据的预测能力。
8.一种基于遗忘学习的行人重识别数据隐私保护系统,其特征在于,包括:遗忘数据集构建模块、新标签生成模块和遗忘隐私数据模型生成模块;
所述遗忘数据集构建模块,用于获取原始行人图像数据,对所述行人图像数据中的隐私数据进行数据增强和选取后得到遗忘数据,构建遗忘数据集;
所述新标签生成模块,用于使用遗忘算法计算所述遗忘数据在用于行人重识别的深度网络模型中的梯度信息,使用所述梯度信息对所述遗忘数据进行扰动后再次输入所述深度网络模型,重复扰动迭代过程,获得所述遗忘数据的新标签;
所述遗忘隐私数据模型生成模块,用于使用所述遗忘数据和对应的所述新标签对所述深度网络模型进行训练,得到遗忘隐私数据模型。
9.一种电子设备,其特征在于,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1-7任一项所述的基于遗忘学习的行人重识别数据隐私保护方法的步骤。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现如权利要求1-7任一项所述的基于遗忘学习的行人重识别数据隐私保护方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311667019.7A CN117390685B (zh) | 2023-12-07 | 2023-12-07 | 一种基于遗忘学习的行人重识别数据隐私保护方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311667019.7A CN117390685B (zh) | 2023-12-07 | 2023-12-07 | 一种基于遗忘学习的行人重识别数据隐私保护方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117390685A CN117390685A (zh) | 2024-01-12 |
CN117390685B true CN117390685B (zh) | 2024-04-05 |
Family
ID=89465028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311667019.7A Active CN117390685B (zh) | 2023-12-07 | 2023-12-07 | 一种基于遗忘学习的行人重识别数据隐私保护方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117390685B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022001489A1 (zh) * | 2020-06-28 | 2022-01-06 | 北京交通大学 | 一种无监督域适应的目标重识别方法 |
CN115392451A (zh) * | 2022-08-02 | 2022-11-25 | 西安工业大学 | 一种可持续学习的人工神经网络避免遗忘方法 |
CN116522007A (zh) * | 2023-07-05 | 2023-08-01 | 中国科学技术大学 | 一种面向推荐系统模型的数据遗忘学习方法、装置及介质 |
CN117056957A (zh) * | 2023-05-06 | 2023-11-14 | 浙江大学 | 极小极大学习模型的可验证数据遗忘隐私保护方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4006785A1 (en) * | 2020-11-27 | 2022-06-01 | Naver Corporation | Method for learning representations less prone to catastrophic forgetting |
US20230252279A1 (en) * | 2022-02-08 | 2023-08-10 | NavInfo Europe B.V. | Self-supervised based approach for mitigating catastrophic forgetting in continual learning |
-
2023
- 2023-12-07 CN CN202311667019.7A patent/CN117390685B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022001489A1 (zh) * | 2020-06-28 | 2022-01-06 | 北京交通大学 | 一种无监督域适应的目标重识别方法 |
CN115392451A (zh) * | 2022-08-02 | 2022-11-25 | 西安工业大学 | 一种可持续学习的人工神经网络避免遗忘方法 |
CN117056957A (zh) * | 2023-05-06 | 2023-11-14 | 浙江大学 | 极小极大学习模型的可验证数据遗忘隐私保护方法和装置 |
CN116522007A (zh) * | 2023-07-05 | 2023-08-01 | 中国科学技术大学 | 一种面向推荐系统模型的数据遗忘学习方法、装置及介质 |
Non-Patent Citations (2)
Title |
---|
克服小样本学习中灾难性遗忘方法研究;李文煜;帅仁俊;郭汉;;计算机应用与软件;20200712(第07期);全文 * |
李文煜 ; 帅仁俊 ; 郭汉 ; .克服小样本学习中灾难性遗忘方法研究.计算机应用与软件.2020,(第07期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN117390685A (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914256B (zh) | 一种机器学习训练数据受投毒攻击的防御方法 | |
US11188783B2 (en) | Reverse neural network for object re-identification | |
CN108229314B (zh) | 目标人物的搜索方法、装置和电子设备 | |
Chopra et al. | Automated Registration of Multiangle SAR Images Using Artificial Intelligence | |
Braunegg et al. | Apricot: A dataset of physical adversarial attacks on object detection | |
CN109800682B (zh) | 驾驶员属性识别方法及相关产品 | |
CN110851835A (zh) | 图像模型检测方法、装置、电子设备及存储介质 | |
CN106919921B (zh) | 结合子空间学习与张量神经网络的步态识别方法及系统 | |
CN113919497A (zh) | 针对连续学习能力系统的基于特征操纵的攻击和防御方法 | |
CN109766755A (zh) | 人脸识别方法及相关产品 | |
Singleton et al. | Gun identification using tensorflow | |
CN114758113A (zh) | 对抗样本防御训练方法、分类预测方法及装置、电子设备 | |
CN117390685B (zh) | 一种基于遗忘学习的行人重识别数据隐私保护方法和系统 | |
Zhang et al. | Face occlusion detection using cascaded convolutional neural network | |
CN112507912B (zh) | 一种识别违规图片的方法及装置 | |
Haider AbdAlkreem et al. | Detect People's Faces and Protect Them by Providing High Privacy Based on Deep Learning | |
CN114266041A (zh) | 模型的后门防御能力提升方法、装置及系统 | |
Xu et al. | Lancex: A versatile and lightweight defense method against condensed adversarial attacks in image and audio recognition | |
Dhar et al. | Detecting deepfake images using deep convolutional neural network | |
Girish et al. | Inter-frame video forgery detection using UFS-MSRC algorithm and LSTM network | |
Sun et al. | Neural Network Semantic Backdoor Detection and Mitigation: A Causality-Based Approach | |
Gupta et al. | Texture, Quality, and Motion-Based Analysis for Face Spoofing Detection System: A Review | |
CN114065867B (zh) | 一种数据分类方法、系统及电子设备 | |
CN114638356B (zh) | 一种静态权重引导的深度神经网络后门检测方法及系统 | |
Nagaraj et al. | Detection of Frame Duplication Using Multi Scale Local Oriented Feature Descriptors. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |