CN116340277B - 基于隐写的数据压缩方法及其解压缩方法 - Google Patents

基于隐写的数据压缩方法及其解压缩方法 Download PDF

Info

Publication number
CN116340277B
CN116340277B CN202310596478.4A CN202310596478A CN116340277B CN 116340277 B CN116340277 B CN 116340277B CN 202310596478 A CN202310596478 A CN 202310596478A CN 116340277 B CN116340277 B CN 116340277B
Authority
CN
China
Prior art keywords
file
files
steganography
carrier
steganographic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310596478.4A
Other languages
English (en)
Other versions
CN116340277A (zh
Inventor
田辉
周刚
郭玉刚
张志翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei High Dimensional Data Technology Co ltd
Original Assignee
Hefei High Dimensional Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei High Dimensional Data Technology Co ltd filed Critical Hefei High Dimensional Data Technology Co ltd
Priority to CN202310596478.4A priority Critical patent/CN116340277B/zh
Publication of CN116340277A publication Critical patent/CN116340277A/zh
Application granted granted Critical
Publication of CN116340277B publication Critical patent/CN116340277B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1744Redundancy elimination performed by the file system using compression, e.g. sparse files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明特别涉及一种基于隐写的数据压缩方法及其解压缩方法,其中基于隐写的数据压缩方法,包括如下步骤:将待压缩文件中的部分文件,利用隐写算法写到另一部分文件中,并为载体文件添加隐写标识;对另一部分文件利用常规压缩算法进行压缩得到压缩包。利用隐写算法将部分文件隐写到另一部分文件中,那么待压缩的文件体积就缩小了,进一步利用常规压缩进行压缩时,自然也就占用更小的体积,使得压缩比进一步提高。

Description

基于隐写的数据压缩方法及其解压缩方法
技术领域
本发明涉及文件处理技术领域,特别涉及一种基于隐写的数据压缩方法及其解压缩方法。
背景技术
由于计算机处理的信息是以二进制数的形式表示的,因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。为了有助于理解文件压缩,在脑海里想象一幅蓝天白云的图片,对于成千上万单调重复的蓝色像点而言,与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色,还不如告诉电脑:“从这个位置开始存储1117个蓝色像点”来得简洁,而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实,所有的计算机文件归根结底都是以“1”和“0”的形式存储的,和蓝色像点一样,只要通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说,压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响,这时忽略它们是个好主意,这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中,典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。但是更多情况下压缩数据必须准确无误,人们便设计出了无损压缩格式,比如常见的zip、rar等。压缩软件(compression software)就是利用压缩原理压缩数据的工具,压缩后所生成的文件称为压缩包(archive),体积只有原来的几分之一甚至更小。压缩包已经是另一种文件格式了,如果想使用其中的数据,首先得用压缩软件把数据还原,这个过程称作解压缩。
信息隐藏也称作数据隐藏(Data Hiding),是集多学科理论与技术于一身的新兴技术领域。信息隐藏技术主要是指将特定的信息嵌入数字化宿主信息(如文本,数字化的声音、图像、视频信号等)中,信息隐藏的目的不在于限制正常的信息存取和访问,而在于保证隐藏的信息不引起监控者的注意和重视,从而减少被攻击的可能性,在此基础上再使用密码术来加强隐藏信息的安全性,因此信息隐藏比信息加密更为安全。应该注意到,密码术和信息隐藏技术不是互相矛盾、互相竞争的技术,而是相互补充的技术,他们的区别在于应用的场合不同,对算法的要求不同,但可能在实际应用中需要互相配合。
目前,还未见到将信息隐藏和数据压缩结合在一起的方案。
发明内容
本发明的目的在于提供一种基于隐写的数据压缩方法,能够在现有的压缩技术基础上进一步提高压缩率。
为实现以上目的,本发明采用的技术方案为:一种基于隐写的数据压缩方法,包括如下步骤:将待压缩文件中的部分文件,利用隐写算法写到另一部分文件中,并为载体文件添加隐写标识;对另一部分文件利用常规压缩算法进行压缩得到压缩包。
与现有技术相比,本发明存在以下技术效果:利用隐写算法将部分文件隐写到另一部分文件中,那么待压缩的文件体积就缩小了,进一步利用常规压缩进行压缩时,自然也就占用更小的体积,使得压缩比进一步提高。
具体实施方式
下面结合具体的实施例,对本发明做进一步详细叙述。
本发明公开了一种基于隐写的数据压缩方法,包括如下步骤:将待压缩文件中的部分文件,利用隐写算法写到另一部分文件中,并为载体文件添加隐写标识;对另一部分文件利用常规压缩算法进行压缩得到压缩包。利用隐写算法将部分文件隐写到另一部分文件中,那么待压缩的文件体积就缩小了,进一步利用常规压缩进行压缩时,自然也就占用更小的体积,使得压缩比进一步提高。
进一步地,所述的将待压缩文件中的部分文件,利用隐写算法写到另一部分文件中包括:将待压缩文件分为载体文件和隐写文件;逐一遍历载体文件和隐写文件,将遍历到的载体文件记为A,其他载体文件记为X,将遍历到的隐写文件记为B,其他隐写文件记为Y;计算文件A和X的大小得到a1和x1以及它们的隐写容量得到a2和x2;计算文件B和Y的大小得到b和y;根据a1、x1、a2、x2、b以及y的数值大小确定待隐写文件和载体文件;从遍历的结果中挑出最高压缩比的待隐写文件和载体文件作为最终的隐写文件和载体文件。不同的隐写算法用到的载体文件不同,比如尾缀隐写,其需要用到图片文件作为载体文件,因此我们首先要根据隐写算法的需求将待压缩文件分为载体文件和隐写文件。进行划分后,考虑到载体文件和隐写文件会有很多种隐写组合方式,如何挑选出合适的隐写方案也是很重要的。本实施例中,通过逐一遍历载体文件和隐写文件,从而将载体文件分为文件A和文件X,将隐写文件分为文件B和文件Y,仅针对这四个文件,可以方便的确定待隐写文件和载体文件。每次遍历,都会得到一个待隐写文件和载体文件的划分方案,最后选择最高压缩比的那个即可。
此处所说的遍历,也可以这样理解:假设载体文件有m个,分别记为A1、A2、…、Am,隐写文件有n个,分别记为B1、B2、…、Bn,对载体文件和隐写文件进行遍历时,会有m×n个结果。比如,遍历到A1B1时,将载体文件A1记为A,A2、…、Am记为X,隐写文件B1记为B,B2、…、Bn记为Y;遍历到A3B4时,将载体文件A3记为A,A1、A2、A4、…、Am记为X,隐写文件B4记为B,B1、B2、B3、B5、…、Bn记为Y;以此类推。
进一步地,根据各文件的大小去确定具体的隐写文件和载体文件,有很多方案可以实现。本发明中优选地,通过一系列的条件判断,来实现隐写文件和载体文件的合理分配。具体地,所述的根据a1、x1、a2、x2、b以及y的数值大小确定待隐写文件和载体文件包括:若a2≥x1+b+y,将文件X、文件B以及文件Y隐写至载体文件A中,满足该条件时,说明文件A足够大,其隐写容量足够将其他所有文件隐藏;若x2≥a1+b+y,将文件A、文件B以及文件Y隐写至载体文件X中,满足该条件时,说明文件X足够大,其隐写容量足够将其他所有文件隐藏;若a2<x1+b+y且x2<a1+b+y且a2+x2≥b+y,将文件B和文件Y隐写至载体文件A和文件X中,满足该条件时,说明文件A和X均不能隐写其他文件,但两个文件总的隐写容量足够将文件B和文件Y隐藏。
若a2+x2<b+y且b≥y:当a2+x2≥b时,将文件B隐写至文件A和文件X中,文件Y不隐写;当y≤a2+x2<b时,将文件Y隐写至文件A和文件X中,文件B不隐写;当a2+x2<y时,则不具备隐写压缩条件;若a2+x2<b+y且b<y:当a2+x2≥y时,将文件Y隐写至文件A和文件X中,文件B不隐写;当b≤a2+x2<y时,将文件B隐写至文件A和文件X中,文件Y不隐写;当a2+x2<b时,则不具备隐写压缩条件。这两个判断条件的逻辑是相同的,当可被隐写的文件B和文件Y不能全部隐藏至载体文件A和X中时,我们就选择隐藏文件B和文件Y中较大文件,如果较大的文件大于隐写容量,我们才选择隐藏文件B和文件Y中较小的文件,并且,若文件B和文件Y中均大于隐写容量,说明无法进行隐写压缩。
通过以上多个条件判断,使得仅根据文件大小、隐写容量就能快速的确定待隐写文件和载体文件,此种判断过程非常迅速,即使需要遍历所有文件A和文件B,所消耗的时间也是极短的。
进一步地,上述的判断流程针对的是确定的文件A和文件B,我们每选择一个文件A和文件B,都会得到一个隐写方案。不同的隐写方案,其对应的压缩比是不同的,因此本发明中还从遍历的结果中挑出最高压缩比的待隐写文件和载体文件作为最终的隐写文件和载体文件,其中压缩比通过如下步骤计算:对于遍历到的载体文件A和隐写文件B,压缩比等于通过上述判断过程确定的待隐写文件大小和总文件大小的比值。具体执行时,我们可以在每次遍历确定待隐写文件和载体文件后,同时计算出该方案对应的压缩比,当遍历完所有载体文件A和隐写文件B后,即得到多种隐写方案及其对应的压缩比,挑选最大压缩比对应的隐写方案即可。
本发明还公开了一种针对前述基于隐写的数据压缩方法得到的压缩包进行解压缩方法,包括如下步骤:利用常规解压缩算法对压缩包进行解压缩得到多个文件;利用隐写算法对应的提取算法,从包含隐写标识的文件中提取出隐写文件,解压缩得到的多个文件以及提取的隐写文件即为压缩包对应的解压缩文件。由于在压缩的时候,先进行了隐写,因此解压缩的时候,也要进行隐写文件的提取,这样就能方便的提取出所有压缩的文件。
本发明还涉及一种计算机可读存储介质和一种电子设备。其中,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的基于隐写的数据压缩方法或如前所述的解压缩方法。一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如前所述的基于隐写的数据压缩方法或如前所述的解压缩方法。

Claims (6)

1.一种基于隐写的数据压缩方法,其特征在于:包括如下步骤:
将待压缩文件中的部分文件,利用隐写算法写到另一部分文件中,并为载体文件添加隐写标识;
对另一部分文件利用常规压缩算法进行压缩得到压缩包;
所述的将待压缩文件中的部分文件,利用隐写算法写到另一部分文件中包括:
将待压缩文件分为载体文件和隐写文件;
逐一遍历载体文件和隐写文件,将遍历到的载体文件记为A,其他载体文件记为X,将遍历到的隐写文件记为B,其他隐写文件记为Y;
计算文件A和X的大小得到a1和x1以及它们的隐写容量得到a2和x2
计算文件B和Y的大小得到b和y;
根据a1、x1、a2、x2、b以及y的数值大小确定待隐写文件和载体文件;
从遍历的结果中挑出最高压缩比的待隐写文件和载体文件作为最终的隐写文件和载体文件。
2.如权利要求1所述的基于隐写的数据压缩方法,其特征在于:所述的根据a1、x1、a2、x2、b以及y的数值大小确定待隐写文件和载体文件包括:
若a2≥x1+b+y,将文件X、文件B以及文件Y隐写至载体文件A中;
若x2≥a1+b+y,将文件A、文件B以及文件Y隐写至载体文件X中;
若a2<x1+b+y且x2<a1+b+y且a2+x2≥b+y,将文件B和文件Y隐写至载体文件A和文件X中;
若a2+x2<b+y且b≥y:当a2+x2≥b时,将文件B隐写至文件A和文件X中,文件Y不隐写;当y≤a2+x2<b时,将文件Y隐写至文件A和文件X中,文件B不隐写;当a2+x2<y时,则不具备隐写压缩条件;
若a2+x2<b+y且b<y:当a2+x2≥y时,将文件Y隐写至文件A和文件X中,文件B不隐写;当b≤a2+x2<y时,将文件B隐写至文件A和文件X中,文件Y不隐写;当a2+x2<b时,则不具备隐写压缩条件。
3.如权利要求1所述的基于隐写的数据压缩方法,其特征在于:所述的从遍历的结果中挑出最高压缩比的待隐写文件和载体文件作为最终的隐写文件和载体文件中的压缩比通过如下步骤计算:
对于遍历到的载体文件A和隐写文件B,压缩比等于确定的待隐写文件大小和总文件大小的比值。
4.一种针对权利要求1中基于隐写的数据压缩方法得到的压缩包进行解压缩方法,其特征在于:包括如下步骤:
利用常规解压缩算法对压缩包进行解压缩得到多个文件;
利用隐写算法对应的提取算法,从包含隐写标识的文件中提取出隐写文件,解压缩得到的多个文件以及提取的隐写文件即为压缩包对应的解压缩文件。
5.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-3中任一项所述的基于隐写的数据压缩方法或如权利要求4所述的解压缩方法。
6.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-3中任一项所述的基于隐写的数据压缩方法或如权利要求4所述的解压缩方法。
CN202310596478.4A 2023-05-25 2023-05-25 基于隐写的数据压缩方法及其解压缩方法 Active CN116340277B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310596478.4A CN116340277B (zh) 2023-05-25 2023-05-25 基于隐写的数据压缩方法及其解压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310596478.4A CN116340277B (zh) 2023-05-25 2023-05-25 基于隐写的数据压缩方法及其解压缩方法

Publications (2)

Publication Number Publication Date
CN116340277A CN116340277A (zh) 2023-06-27
CN116340277B true CN116340277B (zh) 2023-08-01

Family

ID=86884365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310596478.4A Active CN116340277B (zh) 2023-05-25 2023-05-25 基于隐写的数据压缩方法及其解压缩方法

Country Status (1)

Country Link
CN (1) CN116340277B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107623855A (zh) * 2016-07-13 2018-01-23 谭心瑶 一种基于压缩编码的高嵌入率数据隐写装置及隐写方法
CN111083307A (zh) * 2019-11-25 2020-04-28 北京安信荣达科技有限公司 一种基于隐写术的文件检测和破解方法
EP3968183A1 (en) * 2020-09-14 2022-03-16 Seventy Nine Three Luxembourg S.A. Multi-threaded asset data processing architecture
CN114495955A (zh) * 2020-11-12 2022-05-13 天翼云科技有限公司 Mp3音频隐写分析方法及装置
CN115314601A (zh) * 2022-10-12 2022-11-08 安徽华云安科技有限公司 一种有损格式数据隐写方法、装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4948087B2 (ja) * 2006-08-23 2012-06-06 キヤノン株式会社 情報表示装置及びその制御方法
CN104881489B (zh) * 2015-06-06 2019-01-22 合肥高维数据技术有限公司 一种基于隐写术的载体文件库可扩充的隐蔽文件系统
CN106023053B (zh) * 2016-02-05 2019-01-15 四川长虹电器股份有限公司 基于jpeg图像的高容量文件加密隐写及提取方法
CN108965887B (zh) * 2018-06-29 2020-05-22 中国科学院信息工程研究所 一种基于块间去耦合的视频信息隐藏方法和装置
CN114386103B (zh) * 2022-01-14 2022-10-04 北京邮电大学 秘密信息隐藏方法、秘密信息提取方法及传输系统
CN116156072B (zh) * 2023-02-08 2024-09-27 马上消费金融股份有限公司 隐写图像生成方法、隐写信息提取方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107623855A (zh) * 2016-07-13 2018-01-23 谭心瑶 一种基于压缩编码的高嵌入率数据隐写装置及隐写方法
CN111083307A (zh) * 2019-11-25 2020-04-28 北京安信荣达科技有限公司 一种基于隐写术的文件检测和破解方法
EP3968183A1 (en) * 2020-09-14 2022-03-16 Seventy Nine Three Luxembourg S.A. Multi-threaded asset data processing architecture
CN114495955A (zh) * 2020-11-12 2022-05-13 天翼云科技有限公司 Mp3音频隐写分析方法及装置
CN115314601A (zh) * 2022-10-12 2022-11-08 安徽华云安科技有限公司 一种有损格式数据隐写方法、装置

Also Published As

Publication number Publication date
CN116340277A (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
Jo et al. A digital image watermarking scheme based on vector quantisation
US7224293B2 (en) Data compression system and method
CN107886560B (zh) 动画资源的处理方法及装置
US10062143B2 (en) Method and apparatus for compressing randomly accessed data
Yang et al. Fractal curves to improve the reversible data embedding for VQ-indexes based on locally adaptive coding
Chang et al. Reversible steganographic method using SMVQ approach based on declustering
CN102821279A (zh) 一种保留alpha通道的图片压缩方法
US20060115170A1 (en) Image compression using variable bit size run length encoding
JP2014525183A (ja) 2dマトリクスにエンコーディングパラメータを保存する画像圧縮のための方法および装置
KR20090115208A (ko) 데이터 스트림의 생성 및 데이터 스트림 내부의 위치들의 식별
CN104410424B (zh) 嵌入式设备内存数据的快速无损压缩方法
US10282889B2 (en) Vertex attribute compression and decompression in hardware
CN116340277B (zh) 基于隐写的数据压缩方法及其解压缩方法
JP2003348324A (ja) 多重電子透かし処理方法、多重電子透かし処理装置、並びに多重電子透かし処理プログラム及びその処理プログラムを記録した記憶媒体
KR101100829B1 (ko) 이미지 데이터 무손실 압축 및 해제하는 시스템 및 방법.
CN110086955B (zh) 一种大容量图像隐写方法
Sachnev et al. Reversible watermarking algorithm with distortion compensation
Sheraj et al. Data compression algorithm for audio and image using feature extraction
CN110021349B (zh) 基因数据的编码方法
CN111510767B (zh) 一种视频水印的识别方法及其识别装置
Nursiah et al. Reversible data hiding in PDF document exploiting prefix zeros in glyph coordinates
TW201413637A (zh) 嵌入及取出數位浮水印之方法
CN113507547A (zh) 自适应系数多直方图结合高维直方图的可逆信息隐藏方法
JP2009206715A (ja) 画像圧縮装置
CN111263155B (zh) 一种等分辨率cr图像的压缩方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant