CN111223154B - 一种jpg图片碎片重组方法、终端设备及存储介质 - Google Patents

一种jpg图片碎片重组方法、终端设备及存储介质 Download PDF

Info

Publication number
CN111223154B
CN111223154B CN201911139492.1A CN201911139492A CN111223154B CN 111223154 B CN111223154 B CN 111223154B CN 201911139492 A CN201911139492 A CN 201911139492A CN 111223154 B CN111223154 B CN 111223154B
Authority
CN
China
Prior art keywords
data
huffman
huffman decoding
jpg
head data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911139492.1A
Other languages
English (en)
Other versions
CN111223154A (zh
Inventor
钟臻
沈长达
吴少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN201911139492.1A priority Critical patent/CN111223154B/zh
Publication of CN111223154A publication Critical patent/CN111223154A/zh
Application granted granted Critical
Publication of CN111223154B publication Critical patent/CN111223154B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种JPG图片碎片重组方法、终端设备及存储介质,该方法中包括:提取存储设备中JPG图片对应的所有类型的哈夫曼解码树构建哈夫曼解码树集合;在存储设备的未分配簇空间内查找到带有RSTn签名标记的数据后,将其与哈夫曼解码树集合中的各哈夫曼解码树进行匹配解码,如果匹配解码成功,则根据匹配到的哈夫曼解码树重构其头部数据,将重构的头部数据与查找到的数据组合为重组数据。本发明利用差分编码累计复位标记类型图片编码数据插入复位标记特性提取存储设备JPG图片数据,利用JPG图像的手机相机生产厂商和生成软件固定的哈夫曼表等参数对提取数据解码匹配,最终达到图片数据提取与修复目的。

Description

一种JPG图片碎片重组方法、终端设备及存储介质
技术领域
本发明涉及文件碎片重组领域,尤其涉及一种JPG图片碎片重组方法、终端设备及存储介质。
背景技术
JPG作为目前最常用的图像文件格式之一,对于JPG图片数据提取与修复具有重要的研究意义。现有的图片提取与修复技术一方面是通过图片的头部和尾部的签名恢复来实现的,所以如果图片的头部被覆盖则无法修复。另一方面只能针对单张图片的进行修复。
发明内容
为了解决上述问题,本发明提出了一种JPG图片碎片重组方法、终端设备及存储介质。
具体方案如下:
一种JPG图片碎片重组方法,包括以下步骤:
提取存储设备中JPG图片对应的所有类型的哈夫曼解码树构建哈夫曼解码树集合;
在存储设备的未分配簇空间内查找到带有RSTn签名标记的数据后,将其与哈夫曼解码树集合中的各哈夫曼解码树进行匹配解码,如果匹配解码成功,则根据匹配到的哈夫曼解码树重构其头部数据,将重构的头部数据与查找到的数据组合为重组数据。
进一步的,哈夫曼解码树集合的构建方法包括以下步骤:
对存储设备进行文件系统解析,获取其内存储的所有JPG图片的头部数据组成头部数据集合;
提取头部数据集合中每个头部数据中包含的哈夫曼表,并对提取的所有哈夫曼表进行排重处理后构成哈夫曼表集合;
根据哈夫曼表集合中每个哈夫曼表对应的哈夫曼解码树构建哈夫曼解码树集合。
进一步的,重构头部数据的方法为:根据匹配到的哈夫曼解码树对应的头部数据集合中的头部数据重构该查找到的数据的头部数据。
一种JPG图片碎片重组终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。
本发明采用如上技术方案,利用差分编码累计复位标记类型图片编码数据插入复位标记特性提取存储设备JPG图片数据,利用JPG图像的手机相机生产厂商和生成软件固定的哈夫曼表等参数对提取数据解码匹配,最终达到图片数据提取与修复目的。
附图说明
图1所示为本发明实施例一中的JPG图片结构图。
图2所示为该实施例中的JPG头部标记字段结构图。
图3所示为该实施例中的图像编码数据区结构图。
图4所示为该实施例中方法的流程图。
图5所示为该实施例中具体实施过程的流程图。
图6所示为该实施例中采用现有的签名恢复方法的结果示意图。
图7所示为该实施例中采用本实施例方法的数据提取结果示意图。
具体实施方式
为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
现结合附图和具体实施方式对本发明进一步说明。
实施例一:
如图1所示,JPG文件大体上可以分成头部字段、图像编码数据区及结束字段。其中JPG头部字段主要由一系列的标记码及其表示的相应字段组成。如图2所示,常用的标记字段有SOI、APP0、DQT、SOF0、DHT、DRI、SOS等,其记录了关于图像文件的EXIF信息,分辨率,哈夫曼表,量化表,差分编码累计复位间隔参数等诸种信息。如图3所示为带有差分编码累计复位间隔图像数据,在图像头部的DRI字段里如果定义了差分编码累计复位的间隔N>0,就代表图像编码数据区每N个MCU编码数据块就有一个RSTn标记;第一个标记是RST0,第二个是RST1,以此类推,RST7之后再从RST0开始重复;也就是说在图像编码数据区每隔N个MCU编码数据块就会按顺序插入0XFFD0-0XFFD7的某一固定标记数据。
通过研究发现在手机厂商等移动设备生成的JPG图片数据流编码往往具备差分编码累计复位的功能,也就是在图像编码数据流中会插入固定的复位标记,同时大部分JPG图像的手机相机生产厂商和生成软件都采用固定的哈夫曼表等信息。针对上述研究结果,本发明实施例提供了一种JPG图片碎片重组方法,参考图4所示,针对存储设备中可能存在的多种类型设备或者软件生成的带有差分编码累计复位的图片数据,首先提取存储设备中JPG图片对应的所有类型的哈夫曼解码树构建哈夫曼解码树集合;其次在存储设备的未分配簇空间内查找到带有RSTn签名标记的数据后,将其与哈夫曼解码树集合中的各哈夫曼解码树进行匹配解码,如果匹配解码成功,则根据匹配到的哈夫曼解码树重构其头部数据,将重构的头部数据与查找到的数据组合为重组数据,从而达到图像数据提取与匹配修复的目的。
参考图5,该方法具体包括以下步骤:
S1:对存储设备进行文件系统解析,获取其内存储的所有JPG图片的头部数据组成头部数据集合TP。
TP={P1,P2,P3,...,PN},其中的每个头部数据元素Pi分别包含图像的分辨率,哈夫曼表,量化表等相关信息。
S2:提取头部数据集合中每个头部数据中包含的哈夫曼表,并对提取的所有哈夫曼表进行排重处理后构成哈夫曼表集合HR。
HR={H1,H2,H3,...,HN}其中每个元素Hi表示一种类型的哈夫曼表。排重处理用于使得哈夫曼表集合HR中的每个元素均代表一种不同类型的哈夫曼表。
S3:根据哈夫曼表集合中每个哈夫曼表对应的哈夫曼解码树构建哈夫曼解码树集合HC。
HC={TC1,TC2,TC3,...,TCN},其中每个元素TCi表示一种类型的哈夫曼表构建的哈夫曼解码树。
S4:在存储设备的未分配簇空间内查找带有RSTn签名标记的数据。
S5:根据哈夫曼解码树集合中的各哈夫曼解码树对查找到的数据进行匹配解码,如果匹配解码成功,进入S6;否则,返回S4重新查找,直到未分配簇空间查找完毕,结束。
S6:根据匹配到的哈夫曼解码树对应的头部数据集合中的头部数据重构该查找到的数据的头部数据,将重构的头部数据与查找到的数据组合为重组数据。
实验结果:
为了验证本方法的正确性,做了如下实验。实验过程如下:
1、准备一个存放多种哈夫曼表类型的差分编码累计复位标记图片到镜像;
2、未分配簇存储多个不包含头部的JPG碎片数据;
3、采用本实施例上述方法提取该镜像图片碎片数据。
如图6所示为采用现有的签名恢复方法的结果,对于头部缺失的碎片数据无法恢复。如图7所示为采用本实施例方法的数据提取结果,结果显示能够提取出无头部的碎片数据。
本发明实施例一利用差分编码累计复位标记类型图片编码数据插入复位标记特性提取存储设备JPG图片数据,利用JPG图像的手机相机生产厂商和生成软件固定的哈夫曼表等参数对提取数据解码匹配,最终达到图片数据提取与修复目的。
本发明实施例一利用差分编码累计复位标记类型图片的复位标记参数特性及JPG哈夫曼解码特性能够尽可能的提取图片数据并进行修复,同时能够作为现有的签名恢复方法中的无法修复的补充。
实施例二:
本发明还提供一种JPG图片碎片重组终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。
进一步地,作为一个可执行方案,所述JPG图片碎片重组终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述JPG图片碎片重组终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述JPG图片碎片重组终端设备的组成结构仅仅是JPG图片碎片重组终端设备的示例,并不构成对JPG图片碎片重组终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述JPG图片碎片重组终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。
进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述JPG图片碎片重组终端设备的控制中心,利用各种接口和线路连接整个JPG图片碎片重组终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述JPG图片碎片重组终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。
所述JPG图片碎片重组终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)以及软件分发介质等。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。

Claims (4)

1.一种JPG图片碎片重组方法,其特征在于,包括以下步骤:
提取存储设备中JPG图片对应的所有类型的哈夫曼解码树构建哈夫曼解码树集合;哈夫曼解码树集合的构建方法包括以下步骤:
对存储设备进行文件系统解析,获取其内存储的所有JPG图片的头部数据组成头部数据集合;
提取头部数据集合中每个头部数据中包含的哈夫曼表,并对提取的所有哈夫曼表进行排重处理后构成哈夫曼表集合;
根据哈夫曼表集合中每个哈夫曼表对应的哈夫曼解码树构建哈夫曼解码树集合;
在存储设备的未分配簇空间内查找到带有RSTn签名标记的数据后,将其与哈夫曼解码树集合中的各哈夫曼解码树进行匹配解码,如果匹配解码成功,则根据匹配到的哈夫曼解码树重构其头部数据,将重构的头部数据与查找到的数据组合为重组数据。
2.根据权利要求1所述的JPG图片碎片重组方法,其特征在于:重构头部数据的方法为:根据匹配到的哈夫曼解码树对应的头部数据集合中的头部数据重构该查找到的数据的头部数据。
3.一种JPG图片碎片重组终端设备,其特征在于:包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~2中任一所述方法的步骤。
4.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~2中任一所述方法的步骤。
CN201911139492.1A 2019-11-20 2019-11-20 一种jpg图片碎片重组方法、终端设备及存储介质 Active CN111223154B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911139492.1A CN111223154B (zh) 2019-11-20 2019-11-20 一种jpg图片碎片重组方法、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911139492.1A CN111223154B (zh) 2019-11-20 2019-11-20 一种jpg图片碎片重组方法、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN111223154A CN111223154A (zh) 2020-06-02
CN111223154B true CN111223154B (zh) 2022-12-06

Family

ID=70830651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911139492.1A Active CN111223154B (zh) 2019-11-20 2019-11-20 一种jpg图片碎片重组方法、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN111223154B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954611A (zh) * 2004-04-09 2007-04-25 诺基亚公司 压缩图像数据文件的生成方法,图像数据压缩装置及摄影装置
US6975253B1 (en) * 2004-08-06 2005-12-13 Analog Devices, Inc. System and method for static Huffman decoding
CN102890818B (zh) * 2012-08-06 2015-06-17 厦门市美亚柏科信息股份有限公司 一种基于缩略图的jpg图片碎片重组方法及装置
CN105677797B (zh) * 2015-12-31 2019-07-12 四川秘无痕科技有限责任公司 一种基于jpeg图片文件中数据相似度的碎片重组方法
CN107193838A (zh) * 2016-03-15 2017-09-22 四川效率源信息安全技术股份有限公司 一种自动化检验jpeg图片是否正常的方法
CN108961193B (zh) * 2018-08-10 2021-04-02 厦门市美亚柏科信息股份有限公司 一种图像修复方法、装置及存储介质

Also Published As

Publication number Publication date
CN111223154A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
JP2725969B2 (ja) デジタルデータ表示方法
CN108108394B (zh) Apfs文件系统的压缩文件恢复方法及存储介质
WO2010126451A1 (en) A data file having more than one mode of operation
CN105009067A (zh) 管理对存储数据单元的操作
US9984728B2 (en) Video content alignment
US20130238865A1 (en) Decompression apparatus and decompression method
CN112527736A (zh) 基于dna的数据存储方法、数据恢复方法及终端设备
JP5788047B2 (ja) テキストをマトリクスコードシンボルに符号化するためのエンコーダ、およびマトリクスコードシンボルを復号化するためのデコーダ
Yang et al. A security carving approach for AVI video based on frame size and index
US10037476B2 (en) Method and device for use when reassembling a fragmented JPEG image
Sari et al. A review of graph theoretic and weightage techniques in file carving
CN115630343A (zh) 一种电子文档信息的处理方法、装置及设备
US8930808B2 (en) Processing rich text data for storing as legacy data records in a data storage system
CN111223154B (zh) 一种jpg图片碎片重组方法、终端设备及存储介质
Hadi Reviewing and evaluating existing file carving techniques for JPEG files
CN105009068A (zh) 管理对存储数据单元的操作
US20190026350A1 (en) Structured record compression and retrieval
Hutchins Testing software tools of potential interest for digital preservation activities at the national library of australia
Ravi et al. A method for carving fragmented document and image files
CN111241096A (zh) 一种excel文档的文本提取方法、系统、终端及存储介质
US8463759B2 (en) Method and system for compressing data
US20220199202A1 (en) Method and apparatus for compressing fastq data through character frequency-based sequence reordering
CN114996360A (zh) 数据分析方法、系统、可读存储介质及计算机设备
van der Meer et al. JPEG File Fragmentation Point Detection using Huffman Code and Quantization Array Validation
CN110990640B (zh) 一种数据判定方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant