CN112231508B - 一种基于内容的加密jpeg图像检索方法 - Google Patents
一种基于内容的加密jpeg图像检索方法 Download PDFInfo
- Publication number
- CN112231508B CN112231508B CN202011104391.3A CN202011104391A CN112231508B CN 112231508 B CN112231508 B CN 112231508B CN 202011104391 A CN202011104391 A CN 202011104391A CN 112231508 B CN112231508 B CN 112231508B
- Authority
- CN
- China
- Prior art keywords
- encrypted
- jpeg image
- image
- sequence
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000013598 vector Substances 0.000 claims abstract description 52
- 101150060512 SPATA6 gene Proteins 0.000 claims abstract description 39
- 239000002131 composite material Substances 0.000 claims abstract description 18
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000012535 impurity Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提出一种基于内容的加密JPEG图像检索方法,解决了现有对加密后的图像进行检索的方法无法兼顾检索效率和隐私安全性的问题,首先对JPEG图像进行等体积复合加密;根据加密后图像的比特流结构,提取特征信息,将特征信息合并为初步特征向量;训练XGBoost模型,利用训练好的模型将初步特征向量转换为最终特征向量;进行哈希映射,得到哈希序列;计算不同图像对应哈希序列的汉明距离;对查询图像与云服务器上每一张加密JPEG图像的距离进行比较排序,从小到大距离排序前l个的加密图像返回给用户,用户在本地对加密图像进行解密,确保用户隐私安全的同时,实现对加密图像的高效检索。
Description
技术领域
本发明涉及图像信息安全的技术领域,更具体地,涉及一种基于内容的加密JPEG图像检索方法。
背景技术
随着大数据时代的到来,大规模多媒体数据正以爆炸式的速度增长,如医学图像、卫星图像、在线图像数据库等。对于资源受限的普通数据拥有者来说,海量图像数据的存储和处理变得难以承受。幸运的是,云技术以其易于安装、无处不在的访问和廉价/免费存储等优点而备受欢迎。通过云计算,数据拥有者可以将昂贵的数据存储和复杂的图像数据处理外包给云服务器,享受方便的个性化计算服务。然而,出于安全和隐私的考虑,云服务器中的图像数据需要被加密。
当需要对加密后的图像数据进行检索时,现有比较成熟的明文域检索方法并不适用。而对于现有的密文域检索方法,一方面使用同态加密等计算量大耗时严重的技术,无法对于大数据集进行实时检索;另一方面,在考虑到安全信息泄露的风险,在检索过程中多层加密,如2017年12月5日公开的中国专利(公开号:CN107480163A)中提出了一种云环境下支持隐私保护的高效密文图像检索方法,首先图像拥有者对数据库中的图像提取特征向量,并使用AES或RSA加密方式对图像进行加密,加密后的图像和树形检索索引上传到云服务器并执行检索操作,此方法可以达到与明文图像检索相当的检索准确性,也可在一定程度上实现密文图像检索的隐私安全性保护目标,但在这个过程中,需要两个密钥,一个是对图像本身进行加密,另一个是对树形检索加密,比较复杂,影响检索效率;除此之外,还有一些现有图像检索的方法,不是基于图像内容而是基于可视的标签信息,导致检索过程中暴露部分明文内容给云服务器等不良后果,也存在泄密的风险。
发明内容
为解决现有对加密后的图像进行检索的方法无法兼顾检索效率和隐私安全性的问题,本发明提出一种基于内容的加密JPEG图像检索方法,在确保用户隐私安全的同时,实现对加密图像的高效检索。
为了达到上述技术效果,本发明的技术方案如下:
一种基于内容的加密JPEG图像检索方法,至少包括:
S1.对JPEG图像进行等体积复合加密;
S2.根据等体积复合加密后的JPEG图像的比特流结构,提取特征信息,并将特征信息合并为初步特征向量;
S3.训练XGBoost模型,利用训练好的XGBoost模型将初步特征向量转换为最终特征向量;
S4.对最终特征向量进行哈希映射,得到哈希序列;
S5.计算不同图像对应哈希序列的汉明距离,并将其作为加密JPEG图像间的距离;
S6.对加密后的查询图像与云服务器上每一张加密JPEG图像的距离进行比较排序,云服务器从小到大选择距离排序前l个的加密JPEG图像返回给用户,用户在本地对加密JPEG图像进行解密。
在本技术方案中,首先对JPEG图像进行等体积复合加密,加密后的JPEG图像保持原有的占用空间大小不变,即不引入额外数据,也不删除原有数据,然后通过压缩后的JPEG图像比特流结构提取特征信息,不用对JPEG图像进行解密及完全解压缩,不涉及同态加密等计算复杂度大的技术,在加密的JPEG比特流中得到初步特征向量,保证了检索的高效性;初步特征向量通过XGBoost模型进行降维和除杂,进一步得到最终的特征向量,提高图像检索的准确率;另一方面,在计算图像间的距离时,不直接对最终特征向量采用传统的向量距离计算方法,而是首先对最终特征向量进行哈希映射,得到对应的哈希序列,然后再基于汉明距离计算不同图像对应哈希序列的距离,并将其作为图像间的距离,利用哈希映射的不确定性,可以使得同一个图像在每次哈希映射后,得到的哈希序列都不同,从而重复检索同一个图像得到的结果均略有不同,使得两个原本距离近的向量在哈希映射后得到的哈希序列距离相近的概率也很大,在不影响检索正确性的前提下又能够提高安全性,做到安全性和准确性的折中考虑。
优选地,步骤S1所述的等体积复合加密的过程为:
S11.将所有JPEG图像均转换为同一尺寸M*M,且同时随机生成三个长度为128比特的序列P1,P2及P4;
S12.将每一个JPEG图像包含的MCU块标记,构建包括数字标记1到数字标记G的集合S,随机选择G/2个数字构造一个新的集合S',对集合S'中的数字进行随机置乱,生成序列P3;
S13.将集合S-S'中每一个数字i对应的MCU块Bi放入JPEG头文件中的APPn字段,利用序列P1对APPn字段中的比特进行异或加密,i=1,2,...,G;
S14.将集合S'中每一个数字i对应的MCU块Bi放到JPEG文件的压缩数据段,利用序列P2对压缩数据段中所有AC系数的VLI编码进行异或加密;
S15.按照序列P3的顺序对压缩数据段中所有的MCU块进行重新排序;
S16.利用序列P4对JPEG图像Y分量的量化表进行异或加密;
S17.将序列P1、P2、P3和P4合并成一个序列,作为等体积复合加密的密钥。
优选地,步骤S13、步骤S14及步骤S16中均采用AES或RC4加密算法进行异或加密。
优选地,步骤S2所述特征信息的提取过程包括:对等体积复合加密后的JPEG图像的比特流结构进行部分熵解码,得到压缩数据段中的DC系数,根据DC系数提取特征信息,所述特征信息包括:相邻DC系数差值直方图信息HDA、每个MCU块中4个DC系数的平均值所构成的序列信息SAM及改进后的LBP直方图信息HLBP。
优选地,相邻DC系数差值直方图信息HDA的提取过程为:
S21.设加密JPEG图像的压缩数据段存在M个MCU块,对应DC系数为4M个,第i个相邻DC系数插值的二进制长度为Li;
S22.令长度为31的一维数组H表示相邻DC系数差值直方图,即表示相邻DC系数差值直方图信息HDA,根据第i个相邻DC系数插值的二进制长度Li的值,更新一维数组H:判断Li是否为0,若是,H[Li]的值加1;否则,判断Li是否小于0,若是,H[Li]的值加1,否则,H[Li+15]的值加1,其中,i≤4M。
优选地,每个MCU块中4个DC系数的平均值所构成的序列信息SAM的提取过程为:
设加密JPEG图像的压缩数据段存在M个MCU块,第i个MCU块中的4个DC系数分别记作DCi 0,DCi 1,DCi 2和DCi 3,计算4个DC系数的平均值Ai,表达式为:
Ai=(DCi 0+DCi 1+DCi 2+DCi 3)/4;
定义长度为M的一维数组V,令V[i-1]=Ai,一维数组V即表示每个MCU块中4个DC系数的平均值所构成的序列信息SAM。
优选地,改进后的LBP直方图信息HLBP的提取过程为;
设加密JPEG图像的压缩数据段存在M个MCU块,则对应DC系数为4M个,令DCi k表示压缩数据段中第i个MCU块中的第k个DC系数;
构建长度为3的数组F[a,b,c]存放第i个MCU块中的第k个DC系数DCi k与第i个MCU块中除第k个DC系数DCi k之外的剩余DC系数的比较关系,a、b、c取0或1;
判断DCi k与除第k个DC系数DCi k之外的剩余DC系数中每一个DC系数DCi j,的大小,j≠k,j,k均为小于4的整数,若DCi k≤DCi j,则数组F依照顺序存放0,否则,数组F依照顺序存放1;
计算DCi k对应的LBP值value:
value=F[1]+2F[2]+4F[3],0≤value≤7,其中V[1]、V[2]及V[3]分别表示数组F的第一个元素、第二个元素及第三个元素;
构建4*8的二维数组W[i][s]表示所有MCU块中的第i+1个DC系数对应的value值为s的数量,i=0,1,2,3;s=0,1,2,...,7,统计二维数组W[i][s]的值;
将二维数组W[i][s]转换为长度为32的一维数组Q,所述一维数组Q即为改进后的LBP直方图信息HLBP。
优选地,步骤S2所述的初步特征向量是由一维数组H、一维数组V及一维数组Q拼接组成的一维数组。
优选地,步骤S3所述的XGBoost模型通过调用python中的xgboost库,利用云服务器上数据库的加密JPEG图像训练集训练而成;
所述加密JPEG图像训练集里每一个图像的特征为其对应的初步特征向量,初步特征向量作为XGBoost模型的输入,标签为其所属的图像类别,XGBoost模型输出的预测概率向量为每一个图像对应的最终特征向量。
优选地,步骤S4中利用局部敏感哈希算法LSH对最终特征向量进行哈希映射,能使得两个原本距离近的图像向量在哈希映射后得到的哈希序列,距离相近的概率也很大。
与现有技术相比,本发明技术方案的有益效果是:
(1)首先对JPEG图像进行等体积复合加密,然后通过压缩后的JPEG图像比特流结构提取特征信息,不基于标签信息而是基于图像内容本身,不用对JPEG图像进行解密及完全解压缩,也不涉及同态加密等计算复杂度大的技术,在加密的JPEG比特流中得到初步特征向量,保证了检索的高效性;初步特征向量通过XGBoost模型进行降维和除杂,进一步得到最终的特征向量,提高图像检索的准确率。
(2)在计算图像间的距离时,不直接对最终特征向量采用传统的向量距离计算方法,而是首先对最终特征向量进行哈希映射,得到对应的哈希序列,然后再基于汉明距离计算不同图像对应哈希序列的距离,并将其作为图像间的距离,利用哈希映射的不确定性,使得同一个图像在每次哈希映射后得到的哈希序列都不同,从而重复检索同一个图像得到的结果均略有不同,使得两个原本距离近的向量在哈希映射后得到的哈希序列距离相近的概率也很大,在不影响检索正确性的前提下又能够提高安全性,做到安全性和准确性的折中考虑。
附图说明
图1表示本发明实施例中提出的基于内容的加密JPEG图像检索方法的流程示意图;
图2表示本发明实施例中提出的同一JPEG图像检索结果的效果示意图;
图3表示本发明实施例中提出的不同JPEG图像检索结果的效果示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示的基于内容的加密JPEG图像检索方法的流程示意图,参见图1,步骤包括:
S1.对JPEG图像进行等体积复合加密;
S2.根据等体积复合加密后的JPEG图像的比特流结构,提取特征信息,并将特征信息合并为初步特征向量;
S3.训练XGBoost模型,利用训练好的XGBoost模型将初步特征向量转换为最终特征向量;
S4.对最终特征向量进行哈希映射,得到哈希序列;在本实施例中,利用局部敏感哈希算法LSH对最终特征向量进行哈希映射,能使得两个原本距离近的图像向量在哈希映射后得到的哈希序列,距离相近的概率也很大;
S5.计算不同图像对应哈希序列的汉明距离,并将其作为加密JPEG图像间的距离;两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数,如1011101与1001001之间的汉明距离是2,2143896与2233796之间的汉明距离是3;
S6.对加密后的查询图像与云服务器上每一张加密JPEG图像的距离进行比较排序,云服务器从小到大选择距离排序前l个的加密JPEG图像返回给用户,用户在本地对加密JPEG图像进行解密,即返回给用户的k个加密JPEG图像为检索结果,然后用户只需在本地进行解密,不会在检索过程中出现泄漏隐私的风险。
在本实施例中,步骤S1所述的等体积复合加密的过程为:
S11.将所有JPEG图像均转换为同一尺寸M*M,且同时随机生成三个长度为128比特的序列P1,P2及P4;
S12.由于每个JPEG图像的尺寸相同,因此所包含的MCU块的数量也相同,将每一个JPEG图像包含的MCU块标记,构建包括数字标记1到数字标记G的集合S,随机选择G/2个数字构造一个新的集合S',对集合S'中的数字进行随机置乱,生成序列P3;
S13.将集合S-S'中每一个数字i对应的MCU块Bi放入JPEG头文件中的APPn字段,利用序列P1对APPn字段中的比特进行异或加密,i=1,2,...,G,异或加密采用AES或RC4加密算法,在本实施例中,采用AES加密算法;
S14.将集合S'中每一个数字i对应的MCU块Bi放到JPEG文件的压缩数据段,利用序列P2对压缩数据段中所有AC系数的VLI编码进行异或加密,异或加密采用AES或RC4加密算法,在本实施例中,采用AES加密算法;
S15.按照序列P3的顺序对压缩数据段中所有的MCU块进行重新排序;
S16.利用序列P4对JPEG图像Y分量的量化表进行异或加密,异或加密采用AES或RC4加密算法,在本实施例中,采用AES加密算法;
S17.将序列P1、P2、P3和P4合并成一个序列,作为等体积复合加密的密钥。
在本实施例中,特征信息的提取过程包括:对等体积复合加密后的JPEG图像的比特流结构进行部分熵解码,得到压缩数据段中的DC系数,根据DC系数提取特征信息,特征信息包括:相邻DC系数差值直方图信息HDA、每个MCU块中4个DC系数的平均值所构成的序列信息SAM及改进后的LBP直方图信息HLBP。
相邻DC系数差值直方图信息HDA的提取过程为:
S21.设加密JPEG图像的压缩数据段存在M个MCU块,对应DC系数为4M个,第i个相邻DC系数插值的二进制长度为Li;
S22.由于在JPEG编码中,相邻DC系数插值的二进制长度在0-15之间,所以在本实施例中,令长度为31的一维数组H表示相邻DC系数差值直方图,即表示相邻DC系数差值直方图信息HDA,根据第i个相邻DC系数插值的二进制长度Li的值,更新一维数组H:
判断Li是否为0,若是,H[Li]的值加1;否则,判断Li是否小于0,若是,H[Li]的值加1,否则,H[Li+15]的值加1,其中,i≤4M。
每个MCU块中4个DC系数的平均值所构成的序列信息SAM的提取过程为:
设加密JPEG图像的压缩数据段存在M个MCU块,第i个MCU块中的4个DC系数分别记作DCi 0,DCi 1,DCi 2和DCi 3,计算4个DC系数的平均值Ai,表达式为:
Ai=(DCi 0+DCi 1+DCi 2+DCi 3)/4;
定义长度为M的一维数组V,令V[i-1]=Ai,一维数组V即表示每个MCU块中4个DC系数的平均值所构成的序列信息SAM。
改进后的LBP直方图信息HLBP的提取过程为;
设加密JPEG图像的压缩数据段存在M个MCU块,则对应DC系数为4M个,令DCi k表示压缩数据段中第i个MCU块中的第k个DC系数;
构建长度为3的数组F[a,b,c]存放第i个MCU块中的第k个DC系数DCi k与第i个MCU块中除第k个DC系数DCi k之外的剩余DC系数的比较关系,a、b、c取0或1;
判断DCi k与除第k个DC系数DCi k之外的剩余DC系数中每一个DC系数DCi j,的大小,j≠k,j,k均为小于4的整数,若DCi k≤DCi j,则数组F依照顺序存放0,否则,数组F依照顺序存放1;因为一个MCU块对应4个DC系数,比如对于DC1 1,假设DC1 1≤DC1 2,DC1 1≤DC1 3,DC1 1>DC1 4,则DC1 1对应的数组F为[0,0,1],即a取0,b取0,c取1;
计算DCi k对应的LBP值value:
value=F[1]+2F[2]+4F[3],0≤value≤7,其中V[1]、V[2]及V[3]分别表示数组F的第一个元素、第二个元素及第三个元素;
构建4*8的二维数组W[i][s]表示所有MCU块中的第i+1个DC系数对应的value值为s的数量,i=0,1,2,3;s=0,1,2,...,7,统计二维数组W[i][s]的值,对于value为7,则W[0][7]加1;
将二维数组W[i][s]转换为长度为32的一维数组Q,所述一维数组Q即为改进后的LBP直方图信息HLBP;步骤S2所述的初步特征向量是由一维数组H、一维数组V及一维数组Q拼接组成的一维数组。
在本实施例中,步骤S3所述的XGBoost模型通过调用python中的xgboost库,利用云服务器上数据库的加密JPEG图像训练集训练而成;加密JPEG图像训练集里每一个图像的特征为其对应的初步特征向量,初步特征向量作为XGBoost模型的输入,标签为其所属的图像类别,XGBoost模型输出的预测概率向量为每一个图像对应的最终特征向量。
下面结合具体的实验效果,对本发明提出的方法的有效性作进一步说明。在一种具体实施时,采用CIFAR-10图像库进行图像检索测试,同一JPEG图像检索结果的效果示意图如图2所示,参见图2,第一列为相同的JPEG查询图像,从图2中第二列开始,为第一列JPEG查询图像检索的返回结果,由图2可以看出,检索返回的图片,大部分与第一列JPEG查询图像为同一类别,而且对于同一张JPEG查询图像,对比每一行,每次返回的检索结果都不一样,这充分表明了本发明所提方法的准确性和安全性。
表1为利用局部敏感哈希算法LSH对最终特征向量进行哈希映射后不同哈希序列长度的平均检索准确率。
表1
与表1对应,表2为利用局部敏感哈希算法LSH生成不同长度的哈希序列进行检索所需要的时间表。
表2
通过表1和表2可以看出,发明所提出的方法中使用256比特长度的哈希序列是准确率和效率的折中考虑,不仅保证了准确性,而且保证了高效性。
进一步,不同JPEG图像检索结果的效果示意图如图3所示,参见图3,第一列查询图像自上而下均不相同,自第二列开始,均为利用本发明所提方法进行检索的结果返回图像,其中第一行的图像为第一列第一个查询图像的检索返回结果,第二行的图像为第一列第二个查询图像的检索返回结果,后续以此类推,在图3中,黑色框内框出的图像与同一行所在的查询图像不属于同一类,其余的均表示同一类,通过图3中的黑色框的数目与其余图像框的数目对比可以看出,本发明所提方法在图像检索同一类的正确率上是非常高的,表明了本发明所提方法的有效性。
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (7)
1.一种基于内容的加密JPEG图像检索方法,其特征在于,至少包括:
S1.对JPEG图像进行等体积复合加密;
步骤S1所述的等体积复合加密的过程为:
S11.将所有JPEG图像均转换为同一尺寸M*M,且同时随机生成三个长度为128比特的序列P1,P2及P4;
S12.将每一个JPEG图像包含的MCU块标记,构建包括数字标记1到数字标记G的集合S,随机选择G/2个数字构造一个新的集合S',对集合S'中的数字进行随机置乱,生成序列P3;
S13.将集合S-S'中每一个数字i对应的MCU块B i 放入JPEG头文件中的APPn字段,利用序列P1对APPn字段中的比特进行异或加密,i=1,2,...,G;
S14.将集合S'中每一个数字i对应的MCU块Bi放到JPEG文件的压缩数据段,利用序列P2对压缩数据段中所有AC系数的VLI编码进行异或加密;
S15.按照序列P3的顺序对压缩数据段中所有的MCU块进行重新排序;
S16.利用序列P4对JPEG图像Y分量的量化表进行异或加密;
S17.将序列P1、P2、P3和P4合并成一个序列,作为等体积复合加密的密钥;
S2.根据等体积复合加密后的JPEG图像的比特流结构,提取特征信息,并将特征信息合并为初步特征向量;
步骤S2所述特征信息的提取过程包括:对等体积复合加密后的JPEG图像的比特流结构进行部分熵解码,得到压缩数据段中的DC系数,根据DC系数提取特征信息,所述特征信息包括:相邻DC系数差值直方图信息HDA、每个MCU块中4个DC系数的平均值所构成的序列信息SAM及改进后的LBP直方图信息HLBP;
改进后的LBP直方图信息HLBP的提取过程为;
设加密JPEG图像的压缩数据段存在M个MCU块,则对应DC系数为4M个,令DCi k表示压缩数据段中第i个MCU块中的第k个DC系数;
构建长度为3的数组F[a,b,c]存放第i个MCU块中的第k个DC系数DCi k与第i个MCU块中除第k个DC系数DCi k之外的剩余DC系数的比较关系,a、b、c取0或1;
判断DCi k与除第k个DC系数DCi k之外的剩余DC系数中每一个DC系数DCi j的大小,j≠k,j,k均为小于4的整数,若DCi k≤DCi j,则数组F依照顺序存放0,否则,数组F依照顺序存放1;
计算DCi k对应的LBP值value:
value=F[1]+2F[2]+4F[3],0≤value≤7,其中F[1]、F[2]及F[3]分别表示数组F的第一个元素、第二个元素及第三个元素;
构建4*8的二维数组W[i][s]表示所有MCU块中的第i+1个DC系数对应的value值为s的数量,i= 0,1,2,3;s=0,1,2,...,7,统计二维数组W[i][s]的值;
将二维数组W[i][s]转换为长度为32的一维数组Q,所述一维数组Q即为改进后的LBP直方图信息HLBP;
S3.训练XGBoost模型,利用训练好的XGBoost模型将初步特征向量转换为最终特征向量;
S4.对最终特征向量进行哈希映射,得到哈希序列;
S5.计算不同图像对应哈希序列的汉明距离,并将其作为加密JPEG图像间的距离;
S6.对加密后的查询图像与云服务器上每一张加密JPEG图像的距离进行比较排序,云服务器从小到大选择距离排序前l个的加密JPEG图像返回给用户,用户在本地对加密JPEG图像进行解密。
2.根据权利要求1所述的基于内容的加密JPEG图像检索方法,其特征在于,步骤S13、步骤S14及步骤S16中均采用AES或RC4加密算法进行异或加密。
3.根据权利要求2所述的基于内容的加密JPEG图像检索方法,其特征在于,相邻DC系数差值直方图信息HDA的提取过程为:
S21.设加密JPEG图像的压缩数据段存在M个MCU块,对应DC系数为4M个,第i个相邻DC系数插值的二进制长度为L i ;
S22.令长度为31的一维数组H表示相邻DC系数差值直方图,即表示相邻DC系数差值直方图信息HDA,根据第i个相邻DC系数插值的二进制长度L i 的值,更新一维数组H:判断L i 是否为0,若是,H[L i ]的值加1;否则,判断L i 是否小于0,若是,H[Li]的值加1,否则,H[L i +15]的值加1,其中,i≤4M。
4.根据权利要求3所述的基于内容的加密JPEG图像检索方法,其特征在于,每个MCU块中4个DC系数的平均值所构成的序列信息SAM的提取过程为:
设加密JPEG图像的压缩数据段存在M个MCU块,第i个MCU块中的4个DC系数分别记作DC i 0,DCi 1,DC i 2和DC i 3,计算4个DC系数的平均值Ai,表达式为:
Ai =(DC i 0+ DCi 1 + DC i 2 + DC i 3)/4;
定义长度为M的一维数组V,令V[i-1]=Ai,一维数组V即表示每个MCU块中4个DC系数的平均值所构成的序列信息SAM。
5.根据权利要求4所述的基于内容的加密JPEG图像检索方法,其特征在于,步骤S2所述的初步特征向量是由一维数组H、一维数组V及一维数组Q拼接组成的一维数组。
6.根据权利要求5所述的基于内容的加密JPEG图像检索方法,其特征在于,步骤S3所述的XGBoost模型通过调用python中的xgboost库,利用云服务器上数据库的加密JPEG图像训练集训练而成;
所述加密JPEG图像训练集里每一个图像的特征为其对应的初步特征向量,初步特征向量作为XGBoost模型的输入,标签为其所属的图像类别,XGBoost模型输出的预测概率向量为每一个图像对应的最终特征向量。
7.根据权利要求6所述的基于内容的加密JPEG图像检索方法,其特征在于,步骤S4中利用局部敏感哈希算法LSH对最终特征向量进行哈希映射。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011104391.3A CN112231508B (zh) | 2020-10-15 | 2020-10-15 | 一种基于内容的加密jpeg图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011104391.3A CN112231508B (zh) | 2020-10-15 | 2020-10-15 | 一种基于内容的加密jpeg图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112231508A CN112231508A (zh) | 2021-01-15 |
CN112231508B true CN112231508B (zh) | 2022-06-24 |
Family
ID=74118305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011104391.3A Expired - Fee Related CN112231508B (zh) | 2020-10-15 | 2020-10-15 | 一种基于内容的加密jpeg图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112231508B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114598544B (zh) * | 2022-03-22 | 2023-07-11 | 全球能源互联网研究院有限公司南京分公司 | 一种智能物联终端安全状态基线判别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009157914A (ja) * | 2007-12-04 | 2009-07-16 | Ricoh Co Ltd | 検索画像提示装置 |
CN104331448A (zh) * | 2014-10-29 | 2015-02-04 | 上海大学 | 基于jpeg图像交流系数直方图的密文域图像检索方法 |
CN107135391A (zh) * | 2017-05-25 | 2017-09-05 | 南京中孚信息技术有限公司 | 一种针对h.264压缩域的视频感知哈希算法 |
CN107480163A (zh) * | 2017-06-19 | 2017-12-15 | 西安电子科技大学 | 一种云环境下支持隐私保护的高效密文图像检索方法 |
-
2020
- 2020-10-15 CN CN202011104391.3A patent/CN112231508B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009157914A (ja) * | 2007-12-04 | 2009-07-16 | Ricoh Co Ltd | 検索画像提示装置 |
CN104331448A (zh) * | 2014-10-29 | 2015-02-04 | 上海大学 | 基于jpeg图像交流系数直方图的密文域图像检索方法 |
CN107135391A (zh) * | 2017-05-25 | 2017-09-05 | 南京中孚信息技术有限公司 | 一种针对h.264压缩域的视频感知哈希算法 |
CN107480163A (zh) * | 2017-06-19 | 2017-12-15 | 西安电子科技大学 | 一种云环境下支持隐私保护的高效密文图像检索方法 |
Non-Patent Citations (2)
Title |
---|
A Robust Watermarking Scheme for Encrypted JPEG Bitstreams with Format-Compliant Encryption;Wenhao Chen等;《2019 18th IEEE International Conference On Trust, Security And Privacy In Computing And Communications/13th IEEE International Conference on Big Data》;20190805;397-402 * |
加密域图像检索技术综述;梅园等;《华南理工大学学报( 自然科学版)》;20180531;第46卷(第5期);78-85 * |
Also Published As
Publication number | Publication date |
---|---|
CN112231508A (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Robust coverless image steganography based on DCT and LDA topic classification | |
Qin et al. | Coverless image steganography: a survey | |
Cao et al. | High capacity reversible data hiding in encrypted images by patch-level sparse representation | |
Chen et al. | Novel coverless steganography method based on image selection and StarGAN | |
Cheng et al. | Encrypted JPEG image retrieval using block-wise feature comparison | |
CN104331448B (zh) | 基于jpeg图像交流系数直方图的密文域图像检索方法 | |
Rahim et al. | Privacy-preserving image retrieval for mobile devices with deep features on the cloud | |
Xu et al. | A large-scale secure image retrieval method in cloud environment | |
CN110659379B (zh) | 一种基于深度卷积网络特征的可搜索加密图像检索方法 | |
CN111797409A (zh) | 一种大数据中文文本无载体信息隐藏方法 | |
CN112231508B (zh) | 一种基于内容的加密jpeg图像检索方法 | |
Feng et al. | Evit: Privacy-preserving image retrieval via encrypted vision transformer in cloud computing | |
CN111324766A (zh) | 一种基于lbp特征的加密图像检索方法 | |
Gao et al. | High-performance reversible data hiding in encrypted images with adaptive Huffman code | |
Li et al. | Coverless Video Steganography Based on Frame Sequence Perceptual Distance Mapping. | |
Yu et al. | A privacy-preserving JPEG image retrieval scheme using the local Markov feature and bag-of-words model in cloud computing | |
Biswas et al. | Coverless image steganography based on DWT approximation and pixel intensity averaging | |
CN111325807B (zh) | 一种基于jpeg图像的加密与特征提取方法 | |
CN108305298B (zh) | 一种基于数独矩阵索引的图像可恢复信息隐藏方法 | |
Tang et al. | OPPR: An outsourcing privacy-preserving JPEG image retrieval scheme with local histograms in cloud environment | |
CN116383470B (zh) | 一种具有隐私保护的图像搜索方法 | |
Liu et al. | Multi-keywords carrier-free text steganography method based on Chinese pinyin | |
CN108600573B (zh) | 基于树形BoW模型的密文JPEG图像检索方法 | |
CN113378186B (zh) | 一种基于编码的图像加密隐藏信息的方法及装置 | |
CN112434180B (zh) | 基于dct系数值替换和注意力网络的密文jpeg图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220624 |