CN115081627B - 一种基于生成式网络的跨模态数据哈希检索攻击方法 - Google Patents
一种基于生成式网络的跨模态数据哈希检索攻击方法 Download PDFInfo
- Publication number
- CN115081627B CN115081627B CN202210893350.XA CN202210893350A CN115081627B CN 115081627 B CN115081627 B CN 115081627B CN 202210893350 A CN202210893350 A CN 202210893350A CN 115081627 B CN115081627 B CN 115081627B
- Authority
- CN
- China
- Prior art keywords
- cross
- modal data
- hash code
- modal
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000008485 antagonism Effects 0.000 claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000013139 quantization Methods 0.000 claims abstract description 13
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims abstract description 9
- 230000003042 antagnostic effect Effects 0.000 claims description 15
- 239000000126 substance Substances 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 241000182988 Assa Species 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 56
- 238000010586 diagram Methods 0.000 description 18
- 238000012360 testing method Methods 0.000 description 18
- 238000012800 visualization Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 101000802640 Homo sapiens Lactosylceramide 4-alpha-galactosyltransferase Proteins 0.000 description 2
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/325—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于生成式网络的跨模态数据哈希检索攻击方法,包括利用重构跨模态数据与请求跨模态数据构造重构函数,然后基于重构跨模态数据的特征向量与sign函数构造量化函数。通过对比重构跨模态数据的哈希码与跨模态检索数据库中哈希码之间的汉明距离,获得积极跨模态数据和消极跨模态数据用于构造对抗性三元组函数,并通过请求跨模态数据哈希码构造基于相对的对抗性三元组函数。最后通过构造训练函数并通过ADAM优化器获得对抗性生成器的最佳参数,接着获得可快速生成对抗性样本的对抗性生成器,降低了传统的基于迭代式攻击获取对抗性样本时会消耗大量算力的缺点,节省算力且精度高。
Description
技术领域
本发明属于对抗攻击技术领域,具体涉及一种基于生成式网络的跨模态数据哈希检索攻击方法。
背景技术
深度神经网络在跨模态哈希检索上的应用极大的提高了跨模态数据在特征空间的表征能力,然而近几年神经网络易受到恶意制造的对抗性扰动的攻击。
现有的对抗性攻击方法可以分为迭代式对抗攻击和生成式对抗攻击两大类。与迭代式对抗攻击相比,生成式对抗攻击通过精心构造一个生成式对抗网络,向良好训练的生成式对抗网络输入良性样本可以快速获得与良性样本在视觉上无法区分的对抗性样本。
目前针对跨模态数据的哈希检索的对抗性攻击方案仅有基于迭代式的无目标攻击方法,该方法的原理是将破坏跨模态的模态间和模态内相似性正则化过程同时集成到对抗样本的构造中,以此提高对抗攻击的准确性。然而,基于迭代式的无目标攻击方案在实际应用中需要消耗大量算力,不适用于真实情况。
发明内容
本发明的目的在于提供一种基于生成式网络的跨模态数据哈希检索攻击方法,能够节省算力并且准确性高。
本发明提供的这种基于生成式网络的跨模态数据哈希检索攻击方法,包括如下步骤:
S1. 通过预设的网络结构构造对抗生成网络中的对抗性生成器,并初始化参数,利用目标网络的结构和参数初始化对抗解码器;
S2. 将请求跨模态数据输入至对抗生成器中,生成重构跨模态数据,获得重构损失函数;
S3. 将重构跨模态数据输入至对抗解码器中,获得重构跨模态数据的特征向量,对重构跨模态数据的特征向量进行二值化,获得重构跨模态数据的哈希码并获得量化损失函数;
S4. 通过点乘获取每一个检索数据库哈希码和请求跨模态数据哈希码的汉明距离,选取汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码;
S5. 将重构跨模态数据哈希码、汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码构造训练三元组,并构造对抗性三元组损失函数;获取请求跨模态数据哈希码,将请求跨模态数据哈希码与汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码构造相对三元组,并构造基于相对的对抗性三元组损失函数;
S6. 构建对抗生成网络的训练函数,通过ADAM优化器对生成器的网络参数进行优化,同时固定对抗解码器的网络参数;
S7. 对给定的请求跨模态数据集合,通过训练好的对抗生成器获得对抗性跨模态数据集合。
所述的步骤S1,包括,定义目标网络与目标网络的参数,其中,δ为参数表示;*为图像或文本检索网络表示,具体的,,代表目标图像检索网络,代表目标文本检索网络;利用目标网络与目标网络的参数,初始化对抗性解码器与对抗性解码器的参数,构造对抗性生成器并初始化对抗性生成器的参数;当上传图像用于搜索相关文本时,设请求跨模态数据为请求图像数据,R表示实数域;q表示请求数据标志;I表示图像;G表示请求图像的宽度;B表示请求图像的高度;O表示请求图像的通道数;当上传文本用于搜索相关图像时,设请求跨模态数据为请求文本数据,T表示文本;L表示查询文本的特征向量维度。
所述的步骤S2,包括,将请求跨模态数据输入至对抗性生成器,获得重构跨模态数据,,其中,*为图像或文本检索网络表示;当请求跨模态数据为图像数据时,对抗型生成器为对抗性图像生成器,当请求跨模态数据为文本数据时,对抗型生成器为对抗性文本生成器;已知请求跨模态数据与重构跨模态数据,获得重构损失函数,
所述的步骤S3,包括如下步骤:
A1. 将重构跨模态数据输入至对抗性解码器,获得重构跨模态数据特征向量,,其中,*为图像或文本检索网络表示;,R表示实数域;N表示重构跨模态数据特征的长度;当重构跨模态数据为图像数据时,对抗性解码器为图像对抗性解码器;当重构跨模态数据为文本数据时,对抗性解码器为文本对抗性解码器;
其中,*为图像或文本检索网络表示;表示点积运算函数,E为检索数据库的跨模态哈希码总数;i表示检索数据库的跨模态哈希码的计数变量;表示数据库中所有的跨模态数据哈希码集合;当重构跨模态数据二元哈希码为重构图像数据哈希码时,跨模态数据哈希码集为文本数据哈希码集;当重构跨模态数据二元哈希码为重构文本数据哈希码时,跨模态数据哈希码集为图像数据哈希码集;
所述的步骤S5,包括如下步骤:
其中,表示汉明距离函数;M表示跨模态数据哈希码的数量,m表示跨模态数据哈希码的计数变量;表示第s个消极跨模态数据哈希码;表示第k个积极跨模态数据哈希码;跨模态数据哈希码包括消极跨模态数据哈希码和积极跨模态数据哈希码;
所述的步骤S6,包括,构造训练损失函数LX,
其中,表示对抗性生成器的参数;表示使模型最小化的对抗性生成器的参数;表示第一平衡常数;J 1为重构损失函数;表示第二平衡常数;J 2表示量化损失函数;表示第三平衡常数;J 3表示对抗性三元组函数;J 4表示基于相对的对抗性三元组函数;
所述的步骤S7,包括,已知一个训练好的对抗性生成器和对抗性生成器的参数,输入请求跨模态数据集合,表示请求跨模态数据,获得对抗性跨模态数据集和,,*为图像或文本检索网络表示;;z表示请求跨模态数据集合的计数变量,Z表示请求跨模态数据集合的总数。
本发明提供的这种基于生成式网络的跨模态数据哈希检索攻击方法,利用重构跨模态数据与请求跨模态数据构造重构函数,然后基于重构跨模态数据的特征向量与sign函数构造量化函数。通过对比重构跨模态数据的哈希码与跨模态检索数据库中哈希码之间的汉明距离,获得积极跨模态数据和消极跨模态数据用于构造对抗性三元组函数,并通过请求跨模态数据哈希码构造基于相对的对抗性三元组函数。最后通过构造训练函数并通过ADAM优化器获得对抗性生成器的最佳参数,接着获得可快速生成对抗性样本的对抗性生成器,降低了传统的基于迭代式攻击获取对抗性样本时会消耗大量算力的缺点。
附图说明
图1为本发明方法的流程示意图。
图2为本发明实施例的图像的可视化示例示意图;其中图2a为本发明实施例的对抗性生成器方法的原图,图2b为本发明实施例的对抗性生成器的方法生成的对抗性图片,图2c为本发明实施例的对抗性生成器的方法生成的对抗性扰动示意图,图2d为本发明实施例的迭代方法的原图,图2e为本发明实施例的迭代方法生成的对抗性图片,图2f为本发明实施例的迭代方法生成的对抗性扰动示意图。
图3为本发明实施例的文本向量的可视化示例示意图;其中图3a为本发明实施例的对抗性生成器的方法的请求文本向量示意图,图3b为本发明实施例的对抗性生成器的方法的对抗性文本向量示意图,图3c为本发明实施例的迭代的方法的请求文本向量示意图,图3d为本发明实施例的迭代的方法的对抗性文本向量示意图。
具体实施方式
如图1为本发明方法的流程示意图:本发明提供的这种基于生成式网络的跨模态数据哈希检索攻击方法,包括如下步骤:
S1. 通过预设的网络结构构造对抗生成网络中的对抗性生成器,并初始化参数,利用目标网络的结构和参数初始化对抗解码器;
S2. 将请求跨模态数据输入至对抗生成器中,生成重构跨模态数据,通过重构跨模态数据与请求跨模态数据获得重构损失函数;
S3. 将重构跨模态数据输入至对抗解码器中,获得重构跨模态数据的特征向量,接着将重构跨模态数据的特征向量通过sign函数进行二值化,获得重构跨模态数据的哈希码并获得量化损失函数;
S4. 将重构跨模态数据哈希码与检索数据库中所有哈希码进行点乘,获取每一个检索数据库哈希码和请求跨模态数据哈希码的汉明距离,接着选取汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码;
S5. 将重构跨模态数据哈希码、汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码构造训练三元组,并构造对抗性三元组损失函数。获取请求跨模态数据哈希码,将请求跨模态数据哈希码与汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码构造相对三元组,并构造基于相对的对抗性三元组损失函数;
S6. 将量化损失函数、重构损失函数、三元组损失函数和基于相对的对抗性三元组损失函数作为对抗生成网络的训练函数,通过ADAM优化器对生成器的网络参数进行优化,同时固定对抗解码器的网络参数;
S7. 已知一个给定的请求跨模态数据集合,通过训练好的对抗生成器可快速获得对抗性跨模态数据集合。
生成式网络是一种区别于传统生成式对抗网络的技术,通过训练生成式网络可获得关于目标网络的知识,这种过程也可以被解释为知识蒸馏。通过一个训练好的生成式网络可以用来快速生成针对目标网络的对抗性样本。
所述的步骤S1,包括,定义目标网络与目标网络的参数,其中,δ为参数表示;*为图像或文本检索网络表示,具体的,,代表目标图像检索网络,代表目标文本检索网络;利用目标网络与目标网络的参数,初始化对抗性解码器与对抗性解码器的参数,构造对抗性生成器并初始化对抗性生成器的参数;当上传图像用于搜索相关文本时,设请求跨模态数据为请求图像数据,R表示实数域;q表示请求数据标志;I表示图像;G表示请求图像的宽度;B表示请求图像的高度;O表示请求图像的通道数;当上传文本用于搜索相关图像时,设请求跨模态数据为请求文本数据,T表示文本;L表示查询文本的特征向量维度。
所述的步骤S2,包括,将请求跨模态数据输入至对抗性生成器,获得重构跨模态数据,,其中,*为图像或文本检索网络表示;当请求跨模态数据为图像数据时,对抗型生成器为对抗性图像生成器,当请求跨模态数据为文本数据时,对抗型生成器为对抗性文本生成器,同时重构跨模态数据和请求跨模态数据的数据格式是一致的。已知请求跨模态数据与重构跨模态数据,获得重构损失函数,
所述的步骤S3,包括如下步骤:
A1. 将重构跨模态数据输入至对抗性解码器,获得重构跨模态数据特征向量,,其中,*为图像或文本检索网络表示;,R表示实数域;q表示请求数据标志;N表示重构跨模态数据特征的长度,为长度为N的连续型向量。当重构跨模态数据为图像数据时,对抗性解码器为图像对抗性解码器;当重构跨模态数据为文本数据时,对抗性解码器为文本对抗性解码器;
其中,*为图像或文本检索网络表示;表示点积运算函数,E为检索数据库的跨模态哈希码总数;i表示检索数据库的跨模态哈希码的计数变量;表示数据库中所有的跨模态数据哈希码集合;当重构跨模态数据二元哈希码为重构图像数据哈希码时,跨模态数据哈希码集为文本数据哈希码集;当重构跨模态数据二元哈希码为重构文本数据哈希码时,跨模态数据哈希码集为图像数据哈希码集;
所述的步骤S5,包括如下步骤:
其中,表示汉明距离函数;M表示跨模态数据哈希码的数量,m表示跨模态数据哈希码的计数变量;表示第s个消极跨模态数据哈希码;表示第k个积极跨模态数据哈希码;跨模态数据哈希码包括消极跨模态数据哈希码和积极跨模态数据哈希码;
所述的步骤S6,包括,构造训练损失函数LX,
其中,表示对抗性生成器的参数;表示使模型最小化的对抗性生成器的参数;表示第一平衡常数;J 1为重构损失函数;表示第二平衡常数;J 2表示量化损失函数;表示第三平衡常数;J 3表示对抗性三元组函数;J 4表示基于相对的对抗性三元组函数;
所述的步骤S7,包括,已知一个训练好的对抗性生成器和对抗性生成器的参数,输入请求跨模态数据集合,表示请求跨模态数据,获得对抗性跨模态数据集和,,*为图像或文本检索网络表示;;z表示请求跨模态数据集合的计数变量,Z表示请求跨模态数据集合的总数。
本发明的上述实施例所述的基于生成式网络的跨模态数据攻击方案,首先利用重构跨模态数据与请求跨模态数据构造重构函数,然后基于重构跨模态数据的特征向量与sign函数构造量化函数。通过对比重构跨模态数据的哈希码与跨模态检索数据库中哈希码之间的汉明距离,获得积极跨模态数据和消极跨模态数据用于构造对抗性三元组函数,并通过请求跨模态数据哈希码构造基于相对的对抗性三元组函数。最后通过构造训练函数并通过ADAM优化器获得对抗性生成器的最佳参数,接着获得可快速生成对抗性样本的对抗性生成器,降低了传统的基于迭代式攻击获取对抗性样本时会消耗大量算力的缺点。
本发明的上述实施例所述的基于生成式网络的跨模态数据攻击方案,对得到的重构跨模态数据进行验证:1、获取测试跨模态数据集并将测试跨模态数据集输入目标网络生成测试跨模态数据集的哈希码数据库;2、将重构跨模态数据输入目标网络生成重构跨模态数据二元哈希码;3、将重构跨模态数据二元哈希码分别与测试跨模态数据集中的每一个哈希码点乘,构建重构跨模态数据二元哈希码与每一个测试跨模态数据集哈希码之间的汉明距离函数,获得重构跨模态数据二元哈希码与每一个测试跨模态数据哈希码之间的汉明距离;4、将重构跨模态数据二元哈希码与每一个测试跨模态数据哈希码之间的汉明距离进行从小到大排序,得到检索结果。若在检索结果中,与重构跨模态数据内容不相关的测试跨模态数据的哈希码的汉明距离排序越靠前,代表内容不相关的测试跨模态数据的哈希码与重构跨模态数据二元哈希码之间汉明距离越小,也就是重构跨模态数据的攻击效果越好;5、定义Mean Average Precision(MAP)用来测量排序以后的检索结果:
其中,R表示测试跨模态数据集中的数据数量;k表示在检索排序结果所有与请求跨模态对抗性样本内容相关的测试跨模态数据集,第r个检索排序测试跨模态数据所对应的位置;P(k)表示精确度,P(k)=k/r,r表示第r个检索排序结果;当第r个排名对应的测试跨模态哈希码与请求跨模态对抗性样本内容相关时,rel(k)为1 ,反之,rel(k)为0。
本发明的上述实施例所述的基于生成式网络的跨模态数据攻击方法,在公开数据集MIRFLICKER-25K的测试集中随机挑选了1000个样本,将剩余的1100个样本用于训练,并在公开数据集NUS-WIDE的测试集中随机挑选了1000个样本用于对抗训练,剩余的1000例子用于测试。上述实施的目标网络通过两个数据集的训练集进行训练。取,,。目标图像网络设置了以Alexnet,Resnet34,Resnet50为骨干网络,目标文本网络为多层感知机为骨干网络。基于Cycle-GEN构造了图像对抗性生成器,通过LSTM构造了文本对抗性生成器。实验结果如表1所示:
表1
MAP结果展示如上表,Iterative代表迭代的方法,即现有技术;GEN代表基于对抗性生成器的方法,即本方法。总结出了三点如下。第一,在上传图像用于搜索文本的任务中,训练好的GEN架构与基于迭代方法在两个数据集上表现出了相似的性能,这证明了本发明框架的有效性。在MIRFLICKR-25K数据集中,基于Alexnet的框架下的CGEN要比基于迭代方法要具有更好的性能。这证明深度更浅的网络能更好的令GEN学习目标模型的知识。其中,Alexnet网络深度仅为8层而Resnet34和Resnet50具有34层和50层。第二,在上传文本用于搜索图像的任务中,训练好的GEN在两个数据集上都具有更优的性能,这证明了通过LSTM构建文本编码器可以获得更好的学习性能。第三,通过训练好的GEN可以快速生成对抗性跨模态数据,而基于迭代的方法需要大量迭代次数。图2-图3展示了一个图像的可视化例子和文本的可视化例子。如图2a为本发明实施例的对抗性生成器方法的原图;如图2b为本发明实施例的对抗性生成器的方法生成的对抗性图片;如图2c为本发明实施例的对抗性生成器的方法生成的对抗性扰动示意图;如图2d为本发明实施例的迭代方法的原图;为了便于比较,迭代的方法和对抗性生成器的方法采用同一副图片;如图2e为本发明实施例的迭代方法生成的对抗性图片;如图2f为本发明实施例的迭代方法生成的对抗性扰动示意图。图3中,横坐标为文本向量中词包的位置索引值;纵坐标为文本向量的取值,其中值为0表示未被选中,值为1表示选中;如图3a为本发明实施例的对抗性生成器的方法的请求文本向量示意图;如图3b为本发明实施例的对抗性生成器的方法的对抗性文本向量示意图;如图3c为本发明实施例的迭代的方法的请求文本向量示意图;如图3d为本发明实施例的迭代的方法的对抗性文本向量示意图。
Claims (4)
1.一种基于生成式网络的跨模态数据哈希检索攻击方法,其特征在于包括如下步骤:
S1. 通过预设的网络结构构造对抗生成网络中的对抗生成器,并初始化参数,利用目标网络的结构和参数初始化对抗解码器;
S2. 将请求跨模态数据输入至对抗生成器中,生成重构跨模态数据,获得重构损失函数;包括,将请求跨模态数据输入至对抗生成器,获得重构跨模态数据,,其中,*为图像或文本检索网络表示;当请求跨模态数据为图像数据时,对抗型生成器为对抗性图像生成器,当请求跨模态数据为文本数据时,对抗型生成器为对抗性文本生成器;已知请求跨模态数据与重构跨模态数据,获得重构损失函数,
S3. 将重构跨模态数据输入至对抗解码器中,获得重构跨模态数据的特征向量,对重构跨模态数据的特征向量进行二值化,获得重构跨模态数据的哈希码并获得量化损失函数;包括如下步骤:
A1. 将重构跨模态数据输入至对抗性解码器,获得重构跨模态数据特征向量,,其中,*为图像或文本检索网络表示;,R表示实数域;N表示重构跨模态数据特征的长度;当重构跨模态数据为图像数据时,对抗性解码器为图像对抗性解码器;当重构跨模态数据为文本数据时,对抗性解码器为文本对抗性解码器;
S4. 通过点乘获取每一个检索数据库哈希码和请求跨模态数据哈希码的汉明距离,选取汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码;
S5. 将重构跨模态数据哈希码、汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码构造训练三元组,并构造对抗性三元组损失函数;获取请求跨模态数据哈希码,将请求跨模态数据哈希码与汉明距离最小的跨模态数据哈希码和汉明距离最大的跨模态数据哈希码构造相对三元组,并构造基于相对的对抗性三元组损失函数;包括如下步骤:
其中,表示汉明距离函数;M表示跨模态数据哈希码的数量,m表示跨模态数据哈希码的计数变量;表示第s个消极跨模态数据哈希码;表示第k个积极跨模态数据哈希码;跨模态数据哈希码包括消极跨模态数据哈希码和积极跨模态数据哈希码;
S6. 构建对抗生成网络的训练函数,通过ADAM优化器对生成器的网络参数进行优化,同时固定对抗解码器的网络参数;包括,构造训练损失函数LX,
其中,表示对抗生成器的参数;表示使模型最小化的对抗生成器的参数;表示第一平衡常数;J 1为重构损失函数;表示第二平衡常数;J 2表示量化损失函数;表示第三平衡常数;J 3表示对抗性三元组函数;J 4表示基于相对的对抗性三元组函数;
S7. 对给定的请求跨模态数据集合,通过训练好的对抗生成器获得对抗性跨模态数据集合。
2.根据权利要求1所述的基于生成式网络的跨模态数据哈希检索攻击方法,其特征在于所述的步骤S1,包括,定义目标网络与目标网络的参数,其中,δ为参数表示;*为图像或文本检索网络表示,具体的,,代表目标图像检索网络,代表目标文本检索网络;利用目标网络与目标网络的参数,初始化对抗性解码器与对抗性解码器的参数,构造对抗生成器并初始化对抗生成器的参数;当上传图像用于搜索相关文本时,设请求跨模态数据为请求图像数据,R表示实数域;q表示请求数据标志;I表示图像;G表示请求图像的宽度;B表示请求图像的高度;O表示请求图像的通道数;当上传文本用于搜索相关图像时,设请求跨模态数据为请求文本数据,T表示文本;L表示查询文本的特征向量维度。
其中,*为图像或文本检索网络表示;表示点积运算函数,E为检索数据库的跨模态哈希码总数;i表示检索数据库的跨模态哈希码的计数变量;表示数据库中所有的跨模态数据哈希码集合;当重构跨模态数据二元哈希码为重构图像数据哈希码时,跨模态数据哈希码集为文本数据哈希码集;当重构跨模态数据二元哈希码为重构文本数据哈希码时,跨模态数据哈希码集为图像数据哈希码集;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210893350.XA CN115081627B (zh) | 2022-07-27 | 2022-07-27 | 一种基于生成式网络的跨模态数据哈希检索攻击方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210893350.XA CN115081627B (zh) | 2022-07-27 | 2022-07-27 | 一种基于生成式网络的跨模态数据哈希检索攻击方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115081627A CN115081627A (zh) | 2022-09-20 |
CN115081627B true CN115081627B (zh) | 2022-11-25 |
Family
ID=83242808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210893350.XA Active CN115081627B (zh) | 2022-07-27 | 2022-07-27 | 一种基于生成式网络的跨模态数据哈希检索攻击方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115081627B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222140A (zh) * | 2019-04-22 | 2019-09-10 | 中国科学院信息工程研究所 | 一种基于对抗学习和非对称哈希的跨模态检索方法 |
CN111460201A (zh) * | 2020-03-04 | 2020-07-28 | 南京邮电大学 | 一种基于生成性对抗网络的模态一致性跨模态检索方法 |
CN113312505A (zh) * | 2021-07-29 | 2021-08-27 | 山东大学 | 一种基于离散在线哈希学习的跨模态检索方法及系统 |
WO2022068196A1 (zh) * | 2020-09-30 | 2022-04-07 | 三维通信股份有限公司 | 跨模态的数据处理方法、装置、存储介质以及电子装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461203A (zh) * | 2020-03-30 | 2020-07-28 | 北京百度网讯科技有限公司 | 跨模态处理方法、装置、电子设备和计算机存储介质 |
CN113076465A (zh) * | 2021-05-14 | 2021-07-06 | 中国石油大学(华东) | 一种基于深度哈希的通用跨模态检索模型 |
-
2022
- 2022-07-27 CN CN202210893350.XA patent/CN115081627B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222140A (zh) * | 2019-04-22 | 2019-09-10 | 中国科学院信息工程研究所 | 一种基于对抗学习和非对称哈希的跨模态检索方法 |
CN111460201A (zh) * | 2020-03-04 | 2020-07-28 | 南京邮电大学 | 一种基于生成性对抗网络的模态一致性跨模态检索方法 |
WO2022068196A1 (zh) * | 2020-09-30 | 2022-04-07 | 三维通信股份有限公司 | 跨模态的数据处理方法、装置、存储介质以及电子装置 |
CN113312505A (zh) * | 2021-07-29 | 2021-08-27 | 山东大学 | 一种基于离散在线哈希学习的跨模态检索方法及系统 |
Non-Patent Citations (2)
Title |
---|
Multi-Level Correlation Adversarial Hashing for Cross-Modal Retrieval;Xinhong Ma等;《IEEE Transactions on Multimedia》;20200127;第3101-3114页 * |
深度哈希图像检索方法综述;刘颖等;《中国图象图形学报》;20200716(第07期);第1296-1317页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115081627A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059198B (zh) | 一种基于相似性保持的跨模态数据的离散哈希检索方法 | |
Zhu et al. | Discrete multimodal hashing with canonical views for robust mobile landmark search | |
CN108334574B (zh) | 一种基于协同矩阵分解的跨模态检索方法 | |
CN106777318B (zh) | 基于协同训练的矩阵分解跨模态哈希检索方法 | |
CN106202256B (zh) | 基于语义传播及混合多示例学习的Web图像检索方法 | |
US20180341862A1 (en) | Integrating a memory layer in a neural network for one-shot learning | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
WO2022199504A1 (zh) | 内容识别方法、装置、计算机设备和存储介质 | |
CN108595688A (zh) | 基于在线学习的潜在语义跨媒体哈希检索方法 | |
US11023473B2 (en) | Recurrent binary embedding for information retrieval | |
CN108470052B (zh) | 一种基于矩阵补全的抗托攻击推荐算法 | |
CN113177141B (zh) | 基于语义嵌入软相似性的多标签视频哈希检索方法及设备 | |
CN112800344B (zh) | 一种基于深度神经网络的电影推荐方法 | |
CN113343025B (zh) | 基于加权梯度哈希激活热力图的稀疏对抗攻击方法 | |
CN111090765B (zh) | 一种基于缺失多模态哈希的社交图像检索方法及系统 | |
Liang et al. | Cross-media semantic correlation learning based on deep hash network and semantic expansion for social network cross-media search | |
CN113409157B (zh) | 一种跨社交网络用户对齐方法以及装置 | |
Wang et al. | Deep graph convolutional quantization networks for image retrieval | |
Zhang et al. | Orthonormal product quantization network for scalable face image retrieval | |
CN111079011A (zh) | 一种基于深度学习的信息推荐方法 | |
CN114385930A (zh) | 一种兴趣点推荐方法及系统 | |
CN115081627B (zh) | 一种基于生成式网络的跨模态数据哈希检索攻击方法 | |
CN116935057A (zh) | 目标评价方法、电子设备和计算机可读存储介质 | |
Kumari et al. | A Semantic Approach to Solve Scalability, Data Sparsity and Cold-Start Problems in Movie Recommendation Systems | |
CN115881211B (zh) | 蛋白质序列比对方法、装置、计算机设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240129 Address after: 410000, No. 1409, Building D3, Phase II, Zhongdian Software Park, No. 18 Jianshan Road, High tech Development Zone, Changsha City, Hunan Province Patentee after: Hunan Hanma Technology Co.,Ltd. Country or region after: China Address before: Yuelu District City, Hunan province 410083 Changsha Lushan Road No. 932 Patentee before: CENTRAL SOUTH University Country or region before: China |