CN113869384B - 基于领域自适应的隐私保护图像分类方法 - Google Patents
基于领域自适应的隐私保护图像分类方法 Download PDFInfo
- Publication number
- CN113869384B CN113869384B CN202111092422.2A CN202111092422A CN113869384B CN 113869384 B CN113869384 B CN 113869384B CN 202111092422 A CN202111092422 A CN 202111092422A CN 113869384 B CN113869384 B CN 113869384B
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- image
- training
- moment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 78
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000009826 distribution Methods 0.000 claims abstract description 17
- 238000013507 mapping Methods 0.000 claims abstract description 15
- 238000013145 classification model Methods 0.000 claims abstract description 13
- 238000005259 measurement Methods 0.000 claims abstract description 9
- 230000009466 transformation Effects 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000001419 dependent effect Effects 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 14
- 238000000354 decomposition reaction Methods 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 208000012868 Overgrowth Diseases 0.000 claims 1
- 238000010801 machine learning Methods 0.000 description 10
- 238000011160 research Methods 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2107—File encryption
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Databases & Information Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Image Analysis (AREA)
Abstract
本发明属于信息安全技术领域,提供了一种基于领域自适应的隐私保护图像分类方法。第一部分:首先对数据作预处理以规范数据,数据集要求至少一个有标签的数据集和多个无标签的数据集;然后给出适用于图像数据的差分隐私定义,并对数据加入噪声扰动以满足差分隐私的要求;最后对噪声扰动后的数据进行可用性衡量以保证数据的可用性。第二部分:首先运用概率分布的矩母函数确定适当的特征变换维度,将数据映射到新的特征空间;其次运用第一部分获取的有标签数据在映射后的特征空间训练图像分类模型Cy;然后运用生成对抗网络增强数据从属数据集的不可区分性;最后运用Cy对无标签数据分类。
Description
技术领域
本发明涉及一种基于领域自适应方法的隐私保护图像分类方法,属于信息安全技术领域。
背景技术
近十年机器学习领域取得的巨大成功依靠算力的提升、新型机器学习范式的涌现(深度神经网络)与大规模数据的支持。以此为基础,研究者们不断提出新的算法和模型并将之应用到各个领域中去。其中,神经网络模型在图像识别与分类领域取得重大进展,在同一任务下神经网络模型的准确程度超过支持向量机等传统方法,也超过了人工分类。在逃多年的犯罪嫌疑人被神经网络等机器学习模型支持下的图像分类技术识别出,神经网络等机器学习模型还可以帮助医生完成快速准确地识别医学图像、确认病灶位置等任务,因此图像分类领域越来越受到学术界和工业界的关注。
Banko.M.等人发现,训练数据在很大程度上影响了最终训练得到的机器学习模型的准确率:随着数据规模的扩大,机器学习模型的准确率随之逐步提高。在这一发现的前提下,相比于个人研究者和小型研究团队,互联网企业因提供互联网服务所以在获取数据方面具有优势,其下属的研究机构可以凭借一般研究团队不具备的庞大数据库获得更为理想的分类准确率。例如在图像分类领域,谷歌研究人员利用仅供谷歌内部使用的JFT-330M、JFT-3B等大规模数据集辅助提升分类模型准确率,使得在ImageNet数据集上的图像分类准确率首次超过90%。为了让一般研究团队也能够获得理想的分类模型,可以将领域自适应方法应用到图像分类领域。领域自适应能够在多数据集间提取域不变特征,选定合适度量方式缩小域间分布差异,以知识迁移的方式对无标签数据集分类,增大训练数据规模提高图像分类模型准确率。
然而在图像分类领域研究蓬勃发展的同时,有研究发现神经网络等机器学习模型能够“记忆”图像数据中的敏感信息,通过对模型梯度信息的计算能够推断和还原图像数据中的部分敏感信息,例如医疗领域中的图像分类学习可能会导致病人患病的隐私信息泄露。在数据隐私保护越来越受到重视的当下,图像分类领域的研究者应该对研究中使用的数据进行隐私保护。
发明内容
为了有效地增大训练数据规模,提升图像分类模型泛化能力,并对数据进行隐私保护,本发明提出了一种基于领域自适应的隐私保护图像分类方法。参照图1,该方法包含两个部分:第一部分运用差分隐私对图像数据进行隐私保护处理并进行可用性衡量;第二部分运用有标签数据训练出的分类模型为无标签数据分类。第一部分具有以下流程:首先对数据作预处理以规范数据,数据集要求至少一个有标签的数据集和多个无标签的数据集;然后给出适用于图像数据的差分隐私定义,并对数据加入噪声扰动以满足差分隐私的要求;最后对噪声扰动后的数据进行可用性衡量以保证数据的可用性。第二部分具有以下流程:首先运用概率分布的矩母函数确定适当的特征变换维度,将数据映射到新的特征空间;其次运用第一部分获取的有标签数据在映射后的特征空间训练图像分类模型Cy;然后运用生成对抗网络增强数据从属数据集的不可区分性;最后运用Cy对无标签数据分类。
本发明的技术方案:
一种基于领域自适应的隐私保护图像分类方法,步骤如下:
(1)首先预处理图像数据,给出适用于图像数据的差分隐私定义;然后对数据加入噪声扰动以满足差分隐私的要求;最后对噪声扰动后的数据进行可用性衡量以保证数据的可用性
(1.1)首先对图像数据进行数值表示与尺寸规范。我们采用实值矩阵为图像建模,给定一张图像,我们将每一个像素点作为一个矩阵元素,则图像数据可以表示为一个实值像素矩阵:
其中m是矩阵的行数,n是矩阵的列数,aij为原图像中的像素值。将Am×n列分块可表示为A=(a1,a2,…,an),其中aj=(a1j,a2j,…,amj)T。
考虑到来自不同数据集的数据尺寸大小不一致,为了方便后续对像素矩阵的分解与变换,将图像统一调整为固定大小的方形尺寸:
所以尺寸规范后的像素矩阵为Am×m是一个方阵。
(1.2)给出基于图像数据的差分隐私定义。对应于差分隐私中近邻数据库的概念,我们定义相差一个列向量的矩阵A与A′互为近邻矩阵,并根据近邻矩阵的概念给出差分隐私关于图像数据的隐私要求:对于给定的近邻矩阵A与A′作为输入,M为作用于输入的随机机制,t为输出结果,若机制M使下式
成立,则机制M满足差分隐私,Pr为事件概率,ε为差分隐私预算因子,ε直接影响差分隐私对数据的保护程度。
(1.3)完善差分隐私关于图像数据的定义后,我们运用拉普拉斯机制对图像数据进行噪声扰动。图像的奇异值分解通过保留图像特征信息实现了对图像的压缩,因此对像素矩阵对应奇异值分解后的奇异值矩阵进行扰动,既可以达到扰动目的,又降低了噪声扰动对像素矩阵的整体影响。因此噪声扰动决定对奇异值分解后的奇异值矩阵进行噪声扰动。像素矩阵A的奇异值分解:
其中U,V为正交矩阵,∑为由奇异值构成的奇异值矩阵。
像素矩阵A为方阵,则分解后的奇异值矩阵∑是满秩矩阵。取奇异值矩阵的奇异值按照从大到小排列在主对角线上(U,V的列向量对应奇异值的排列方式排列),即
σ1≥σ2≥…≥σm,
此时对奇异值矩阵进行噪声扰动得到
其中Δ1∑为矩阵∑的1范数。利用恢复像素矩阵得到/>
扰动后得到的对图像分类模型训练的影响需要通过可用性衡量予以说明。
(1.4)为了保证扰动后数据的可用性,对扰动后的矩阵做如下可用性衡量:
取矩阵A的最大特征值λ1,并计算λ1对应的特征向量x1,因为矩阵的特征值和特征向量满足以下等式:
A·x1=λ1·x1,
对数据进行噪声扰动后等式不再成立,计算矩阵A和与特征向量x1的乘积
A·x1=z
得到两个向量w与z。
从线性代数的角度,矩阵A对特征向量的作用在于两方面:伸缩向量的长度、将向量的方向进行逆向。扰动后的矩阵由于与原矩阵产生偏差,所以会改变特征向量的方向。
若向量w与z的夹角α≤θ(根据具体数据集确定θ),则有理由认为扰动后的矩阵没有与原矩阵偏离过多,所以仍具有可用性。若α>θ,则取
(2)首先依据概率分布的矩母函数确定适当的特征变换维度,将数据映射到新的特征空间;其次使用第一部分获取的有标签数据在映射后的特征空间训练图像分类模型Cy;然后运用GAN方法增强数据所属数据集的不可区分性;最后Cy对第一部分获取的无标签数据分类。
(2.1)矩母函数唯一确定随机变量的分布,所以运用矩母函数作为依据进行特征映射。随机变量X的矩母函数如下:
当随机变量X为矩阵时,通过Jordan分解有:
其中,JX为矩阵X对应的Jordan标准型。
随机变量的矩可以通过矩母函数求导获得:
E(Xn)=M(n)(t)|t=0=M(n)(0)。
对于随机变量X,Y,当二者的一阶矩、二阶矩、三阶矩、四阶矩均相等时,即:
E(X)=E(Y),E(X2)=E(Y2),
E(X3)=E(Y3),E(X4)=E(Y4),
则二者的分布足够接近,可近似认为随机变量X,Y分布趋于一致。
因此通过缩小数据集分布的矩的距离,来确定新的特征空间的维度:
其中,||·||F为矩阵的Frobenius范数,D1,D2,D3,D4是使一阶矩、二阶矩、三阶矩、四阶矩足够接近的维度,为D1,D2,D3,D4对应的取值,/>为最终映射的特征维度。当数据集数目超过两个时,则计算每两个数据集的适当特征维度,取平均得到最终特征维度。
(2.2)确定新的特征空间后,将数据映射到新的特征空间,在新的特征空间运用有标签数据训练训练分类模型Cy:
对于输入样本{A1,A2,A3,...,AN},损失函数其中θ为模型参数,学习率α,批处理规模S,梯度范数上界K,训练步骤如下:
挑选子集:从输入样本集中以概率随机选取规模为S的样本子集;
计算梯度:对S中的每个样本Ai,计算:
梯度剪裁:
梯度下降:
通过重复以上步骤对映射后的数据进行模型训练,得到模型参数和最终分类器Cy。
(2.3)运用生成对抗网络GAN增强数据从属数据集的不可区分性。将数据所属的数据集作为一种“数据来源”标签,GAN的生成器generator为全部数据生成噪声“数据来源”标签,GAN的判别器discriminator判别数据的“数据来源”标签,以此进行监督学习训练。当GAN的判别器discriminator对数据的“数据来源”标签的判定概率接近均匀概率(对于k个数据集,则discriminator对“数据来源”标签的概率均为),则不同数据集的数据在数据特征和“数据来源”两方面都具备一致性。
Gd为判别器,θd为判别器参数,Gd输出为数据来源对应的各类别概率,概率之和为1;Gg为生成器,θg为生成器参数,Gg作用是使不同数据集的“数据来源”分布距离逐渐接近。从训练数据中随机取样进行生成对抗训练,Ai为取样样本中原本有标签的数据,Bi为取样样本中原本无标签的数据。通过增大梯度更新判别器:
减小梯度更新生成器:
使判别器的判定结果趋于均匀概率:
其中j为数据集的数目。Ci为前述训练数据集的任一实例,判定其所属任一数据集的概率都接近均匀概率。
(2.4)基于领域自适应方法,在数据的分布接近一致时,运用分类器Cy为训练数据集中的无标签数据进行分类,以实现对有标签训练数据规模的扩大。
本发明的有益效果:神经网络等机器学习模型和方法在图像分类与识别领域取得了巨大成功,使得图像分类在交通、司法、医疗等众多领域具有广阔的前景和应用潜力。同时,数据的隐私保护日益收到人们的关注,在机器学习图像分类领域同样如此。为此,我们设计了基于领域自适应的隐私保护图像分类方法,领域自适应方法在多数据集间提取域不变特征,选定合适度量方式缩小域间分布差异,以知识迁移的方式实现为无标签数据集分类,以增大训练数据规模。并在整个图像分类机器学习流程的最初阶段,对输入数据进行噪声扰动以实现对数据的隐私保护,对扰动数据的可用性衡量以保证扰动数据仍具有可用性。从而在保证数据隐私性与可用性的情况下,增大数据规模提高模型泛化能力。
附图说明
图1为本发明所述的隐私保护图像分类方法的组织结构图。
图2为本发明所述的噪声扰动与可用性衡量过程。
图3为本发明所述的特征变换与图像分类过程。
具体实施方式
为了将本发明的目的,技术方案和优点表达的更清晰明了,接下来将通过实例和附图,对本发明做进一步的详尽的说明。
一种基于领域自适应的隐私保护图像分类方法,本方法包括对训练数据的扰动、数据可用性的衡量,数据的特征变换,以及对无标签数据的分类。
参照图2,数据隐私保护噪声扰动与可用性衡量的具体运行过程如下:
步骤1.数据预处理,将图像数据转化为像素矩阵,并统一像素矩阵的尺寸:
步骤2.对像素矩阵进行奇异值分解:
步骤3.对奇异值矩阵∑加入拉普拉斯噪声:
并恢复像素矩阵:
步骤4.计算像素矩阵A的最大特征值λ1及λ1对应的特征向量x1,计算矩阵A和与特征向量x1的乘积
得到向量w和z。
步骤5.算法向量w与z的夹角α≤θ,则数据仍具有可用性。若α>θ,则取
参照图3,特征变换与图像分类的具体运行过程如下:
步骤6.计算不同数据集数据的一阶矩,最小化一阶矩的距离
得到特征维度
步骤7.计算不同数据集数据的二阶矩,最小化二阶矩的距离
得到特征维度
步骤8.计算不同数据集数据的三阶矩,最小化三阶矩的距离
得到特征维度
步骤9.计算不同数据集数据的四阶矩,最小化四阶矩的距离
得到特征维度
步骤10.计算特征空间维度:
步骤11.将数据映射到维特征空间,利用训练数据中的有标签数据进行模型训练得到分类器Cy:
步骤12.基于生成对抗网络思想,增大参数梯度更新判别器:
减小参数梯度更新生成器:
使判别器的判定结果趋于均匀概率:
步骤13.运用Cy为无标签数据分类,以实现对有标签训练数据规模的扩大。
Claims (1)
1.一种基于领域自适应的隐私保护图像分类方法,其特征在于,步骤如下:
(1)首先预处理图像数据,给出适用于图像数据的差分隐私定义;然后对图像数据加入噪声扰动以满足差分隐私的要求;最后对噪声扰动后的图像数据进行可用性衡量以保证图像数据的可用性;
(1.1)首先对图像数据进行数值表示与尺寸规范,采用实值矩阵为图像建模,给定一张图像,将每一个像素点作为一个矩阵元素,则图像数据表示为一个实值像素矩阵:
其中,m是矩阵的行数,n是矩阵的列数,aij为原图像中的像素值;将Am×n列分块表示为A=(a1,a2,…,an),其中aj=(a1j,a2j,…,amj)T;
考虑到来自不同数据集的数据尺寸大小不一致,为了方便后续对像素矩阵的分解与变换,将图像统一调整为固定大小的方形尺寸:
所以尺寸规范后的像素矩阵为Am×m是一个方阵;
(1.2)给出基于图像数据的差分隐私定义;对应于差分隐私中近邻数据库的概念,定义相差一个列向量的矩阵A与A′互为近邻矩阵,并根据近邻矩阵的概念给出差分隐私关于图像数据的隐私要求:对于给定的近邻矩阵A与A′作为输入,M为作用于输入的随机机制,t为输出结果,若机制M使下式
成立,则机制M满足差分隐私,Pr为事件概率,ε为差分隐私预算因子,ε直接影响差分隐私对数据的保护程度;
(1.3)完善差分隐私关于图像数据的定义后,运用拉普拉斯机制对图像数据进行噪声扰动;图像的奇异值分解通过保留图像特征信息实现了对图像的压缩;因此噪声扰动决定对奇异值分解后的奇异值矩阵进行噪声扰动;像素矩阵A的奇异值分解:
其中U,V为正交矩阵,∑为由奇异值构成的奇异值矩阵;
像素矩阵A为方阵,则分解后的奇异值矩阵∑是满秩矩阵;取奇异值矩阵的奇异值按照从大到小排列在主对角线上,U,V的列向量对应奇异值的排列方式排列,即
σ1≥σ2≥…≥σm,
此时对奇异值矩阵进行噪声扰动得到
其中Δ1∑为矩阵∑的1范数;利用恢复像素矩阵得到/>
扰动后得到的对图像分类模型训练的影响需要通过可用性衡量予以说明;
(1.4)为了保证扰动后数据的可用性,对扰动后的矩阵做如下可用性衡量:
取矩阵A的最大特征值λ1,并计算λ1对应的特征向量x1,因为矩阵的特征值和特征向量满足以下等式:
A·x1=λ1·x1,
对数据进行噪声扰动后等式不再成立,计算矩阵A和与特征向量x1的乘积
A·x1=z
得到两个向量w与z;
若向量w与z的夹角根据具体数据集确定/>则有理由认为扰动后的矩阵没有与原矩阵偏离过多,所以仍具有可用性;若/>则取/>
(2)首先依据概率分布的矩母函数确定适当的特征变换维度,将数据映射到新的特征空间;其次使用第一部分获取的有标签数据在映射后的特征空间训练图像分类模型Cy;然后运用GAN方法增强数据所属数据集的不可区分性;最后Cy对第一部分获取的无标签数据分类;
(2.1)矩母函数唯一确定随机变量的分布,运用矩母函数作为依据进行特征映射,随机变量X的矩母函数如下:
当随机变量X为矩阵时,通过Jordan分解有:
其中,JX为矩阵X对应的Jordan标准型;
随机变量的矩通过矩母函数求导获得:
E(Xn)=M(n)(t)|t=0=M(n)(0),
对于随机变量X,Y,当二者的一阶矩、二阶矩、三阶矩、四阶矩均相等时,即:
E(X)=E(Y),E(X2)=E(Y2),
E(X3)=E(Y3),E(X4)=E(Y4),
则二者的分布足够接近,认为随机变量X,Y分布趋于一致;
因此通过缩小数据集分布的矩的距离,来确定新的特征空间的维度:
其中,||·||F为矩阵的Frobenius范数,D1,D2,D3,D4是使一阶矩、二阶矩、三阶矩、四阶矩足够接近的维度,为D1,D2,D3,D4对应的取值,/>为最终映射的特征维度;当数据集数目超过两个时,则计算每两个数据集的适当特征维度,取平均得到最终特征维度;
(2.2)确定新的特征空间后,将数据映射到新的特征空间,在新的特征空间运用有标签数据训练训练分类模型Cy:
对于输入样本{A1,A2,A3,...,AN},损失函数其中θ为模型参数,学习率α,批处理规模S,梯度范数上界K,训练步骤如下:
挑选子集:从输入样本集中以概率骑机选取规模为S的样本子集;
计算梯度:对S中的每个样本Ai,计算:
梯度剪裁:
梯度下降:
通过重复以上步骤对映射后的数据进行模型训练,得到模型参数和最终分类器Cy;
(2.3)运用生成对抗网络GAN增强数据从属数据集的不可区分性;将数据所属的数据集作为一种“数据来源”标签,GAN的生成器generator为全部数据生成噪声“数据来源”标签,GAN的判别器discriminator判别数据的“数据来源”标签,以此进行监督学习训练;当GAN的判别器discriminator对数据的“数据来源”标签的判定概率接近均匀概率即对于k个数据集则discriminator对“数据来源”标签的概率均为,则不同数据集的数据在数据特征和“数据来源”两方面都具备一致性;
Gd为判别器,θd为判别器参数,Gd输出为数据来源对应的各类别概率,概率之和为1;Gg为生成器,θg为生成器参数,Gg作用是使不同数据集的“数据来源”分布距离逐渐接近;从训练数据中随机取样进行生成对抗训练,Ai为取样样本中原本有标签的数据,Bi为取样样本中原本无标签的数据;过增大梯度更新判别器:
减小梯度更新生成器:
使判别器的判定结果趋于均匀概率:
其中j为数据源的数目;Ci为前述训练数据集的任一实例,判定其所属任一数据集的概率都接近均匀概率;
(2.4)基于领域自适应方法,在数据的分布接近一致时,运用分类器Cy为训练数据集中的无标签数据进行分类,以实现对有标签训练数据规模的扩大。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111092422.2A CN113869384B (zh) | 2021-09-17 | 2021-09-17 | 基于领域自适应的隐私保护图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111092422.2A CN113869384B (zh) | 2021-09-17 | 2021-09-17 | 基于领域自适应的隐私保护图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113869384A CN113869384A (zh) | 2021-12-31 |
CN113869384B true CN113869384B (zh) | 2024-05-10 |
Family
ID=78996478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111092422.2A Active CN113869384B (zh) | 2021-09-17 | 2021-09-17 | 基于领域自适应的隐私保护图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113869384B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132841B (zh) * | 2023-10-26 | 2024-03-29 | 之江实验室 | 一种保守渐进的领域自适应图像分类方法和装置 |
CN117610080B (zh) * | 2024-01-24 | 2024-04-19 | 山东省计算中心(国家超级计算济南中心) | 一种基于信息瓶颈的医学图像脱敏方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN109034228A (zh) * | 2018-07-17 | 2018-12-18 | 陕西师范大学 | 一种基于差分隐私和层级相关性传播的图像分类方法 |
CN109993212A (zh) * | 2019-03-06 | 2019-07-09 | 西安电子科技大学 | 社交网络图片分享中的位置隐私保护方法、社交网络平台 |
CN111353173A (zh) * | 2020-03-11 | 2020-06-30 | 大连理工大学 | 一种使用图差分隐私模型的敏感标签轨迹数据发布方法 |
CN111737743A (zh) * | 2020-06-22 | 2020-10-02 | 安徽工业大学 | 一种深度学习差分隐私保护方法 |
CN112101404A (zh) * | 2020-07-24 | 2020-12-18 | 西安电子科技大学 | 基于生成对抗网络的图像分类方法、系统及电子设备 |
CN112487482A (zh) * | 2020-12-11 | 2021-03-12 | 广西师范大学 | 自适应切割阈值的深度学习差分隐私保护方法 |
-
2021
- 2021-09-17 CN CN202111092422.2A patent/CN113869384B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN109034228A (zh) * | 2018-07-17 | 2018-12-18 | 陕西师范大学 | 一种基于差分隐私和层级相关性传播的图像分类方法 |
CN109993212A (zh) * | 2019-03-06 | 2019-07-09 | 西安电子科技大学 | 社交网络图片分享中的位置隐私保护方法、社交网络平台 |
CN111353173A (zh) * | 2020-03-11 | 2020-06-30 | 大连理工大学 | 一种使用图差分隐私模型的敏感标签轨迹数据发布方法 |
CN111737743A (zh) * | 2020-06-22 | 2020-10-02 | 安徽工业大学 | 一种深度学习差分隐私保护方法 |
CN112101404A (zh) * | 2020-07-24 | 2020-12-18 | 西安电子科技大学 | 基于生成对抗网络的图像分类方法、系统及电子设备 |
CN112487482A (zh) * | 2020-12-11 | 2021-03-12 | 广西师范大学 | 自适应切割阈值的深度学习差分隐私保护方法 |
Non-Patent Citations (1)
Title |
---|
面向深度神经网络训练的数据差分隐私保护随机梯度下降算法;李英;贺春林;;计算机应用与软件;20200412(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113869384A (zh) | 2021-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kunang et al. | Automatic features extraction using autoencoder in intrusion detection system | |
US11049011B2 (en) | Neural network classifier | |
CN111785329B (zh) | 基于对抗自动编码器的单细胞rna测序聚类方法 | |
CN113869384B (zh) | 基于领域自适应的隐私保护图像分类方法 | |
Jiang et al. | An eight-layer convolutional neural network with stochastic pooling, batch normalization and dropout for fingerspelling recognition of Chinese sign language | |
Xie et al. | Uncertain data classification with additive kernel support vector machine | |
Shi et al. | Sparse bilinear logistic regression | |
Nair et al. | An effective image retrieval system using machine learning and fuzzy c-means clustering approach | |
Zhuang et al. | A handwritten Chinese character recognition based on convolutional neural network and median filtering | |
CN109657693B (zh) | 一种基于相关熵和迁移学习的分类方法 | |
Zhang et al. | Fast image recognition based on independent component analysis and extreme learning machine | |
de Aquino Afonso et al. | Identifying noisy labels with a transductive semi-supervised leave-one-out filter | |
Liu et al. | Support discrimination dictionary learning for image classification | |
Yang et al. | Unsupervised adaptation of neural networks for chinese handwriting recognition | |
CN108009586B (zh) | 封顶概念分解方法及图像聚类方法 | |
Soselia et al. | On Georgian handwritten character recognition | |
Li et al. | Deep convolutional neural network for real and fake face discrimination | |
Iniyan et al. | Wavelet transformation and vertical stacking based image classification applying machine learning | |
Razzak et al. | One‐class tensor machine with randomized projection for large‐scale anomaly detection in high‐dimensional and noisy data | |
Rambhatla et al. | I-SEA: Importance Sampling and Expected Alignment-Based Deep Distance Metric Learning for Time Series Analysis and Embedding | |
CN107341485B (zh) | 人脸识别方法和装置 | |
Rao et al. | Impact of computer vision based secure image enrichment techniques on image classification model | |
Shah et al. | On human iris recognition for biometric identification based on various convolution neural networks | |
Zhang et al. | Quintic spline smooth semi-supervised support vector classification machine | |
Chen et al. | FDEPCA: a novel adaptive nonlinear feature extraction method via fruit fly olfactory neural network for IoMT anomaly detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |