CN108762979B - 一种基于匹配树的终端信息备份方法及备份设备 - Google Patents

一种基于匹配树的终端信息备份方法及备份设备 Download PDF

Info

Publication number
CN108762979B
CN108762979B CN201810341265.6A CN201810341265A CN108762979B CN 108762979 B CN108762979 B CN 108762979B CN 201810341265 A CN201810341265 A CN 201810341265A CN 108762979 B CN108762979 B CN 108762979B
Authority
CN
China
Prior art keywords
matching
file
tree
backed
backup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810341265.6A
Other languages
English (en)
Other versions
CN108762979A (zh
Inventor
郑巧亮
南江
张艺灿
邱宗炽
郑志贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN201810341265.6A priority Critical patent/CN108762979B/zh
Publication of CN108762979A publication Critical patent/CN108762979A/zh
Application granted granted Critical
Publication of CN108762979B publication Critical patent/CN108762979B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供的一种基于匹配树的终端信息备份方法及备份设备,方法包括预设配置文件,所述配置文件包括起始标识、对应待备份应用的分组,以及对应分组的匹配条目,所述匹配条目由与待备份文件名或目录名对应的匹配项组成;依据所述配置文件构造以所述起始标识为根节点,所述分组及其对应的匹配条目内的匹配项依次逐级分布为树节点的匹配树;匹配待备份终端发送过来的文件名与所述匹配树;若匹配成功,则存储所述文件名对应的文件内容。本发明具有准确地批量采集特定备份信息,降低IO写入、减少备份时间、提高备份效率、降低冗余文件的占用空间、降低设备和终端能源损耗等优点。

Description

一种基于匹配树的终端信息备份方法及备份设备
技术领域
本发明涉及信息备份领域,具体说的是一种基于匹配树的终端信息备份方法及备份设备。
背景技术
目前针对终端(如手机、平板等)的信息备份方式主要是通过外部设备与终端连接进行,现有的终端信息备份方式主要存在以下不足:
1、大量大小不一的文件,频繁对磁盘进行写入操作,存在IO瓶颈;
2、原有备份机制存在备份时间长,速度缓慢的问题;
3、大量冗余文件存储在磁盘上,浪费有限的存储空间;
4、嵌入式设备电池损耗增大,设备长时间与终端连接,增加设备电量损耗,不利于移动采集的持续进行。
基于各种需求,例如司法取证需求,往往需要从智能移动终端中备份出所需的信息。其中,针对目前市场占有率仅次于Android的手机的iPhone手机的取证显得尤为重要。由于苹果公司对于iPhone本身的安全限制做得极其严密,每年更新的操作系统在安全方面也做了大量的升级,使得对于iPhone取证的难度也进一步增加。据数据分析公司SensorTower报告称,预计2017年底,App Store应用数量将达360万个;苹果公司在今年新一代手机iPhone 8系列中,更是搭载了达256G的存储;应用数量之多,存储容量之巨大,都达到了前所未有的高度。这对iPhone手机终端的取证带来更大的挑战。
传统的司法取证对于iPhone智能手机始终使用备份的方法,该方法同样存在上述通用备份方式的不足,耗费大量时间,得到的备份文件往往巨大无比,占用大量的存储空间,即使只是需要系统中的特定的少数文件,也需要备份整个手机,再从中搜索出对应的文件,效率极其低下。
因此,传统的备份方式已经无法满足对智能移动终端进行高效、准确地采集获取特定的具备较高时效性信息的要求。
发明内容
本发明所要解决的技术问题是:提供一种基于匹配树的终端信息备份方法及备份设备,实现高效、精准地从待备份终端采集获取所需的信息。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于匹配树的终端信息备份方法,包括:
预设配置文件,所述配置文件包括起始标识、对应待备份应用的分组,以及对应分组的匹配条目,所述匹配条目由与待备份文件名或目录名对应的匹配项组成;
依据所述配置文件构造以所述起始标识为根节点,所述分组及其对应的匹配条目内的匹配项依次逐级分布为树节点的匹配树;
匹配待备份终端发送过来的文件名与所述匹配树;
若匹配成功,则存储所述文件名对应的文件内容。
本发明提供的另一个技术方案为:
一种备份设备,包括存储单元,所述存储单元存储有计算机程序,所述计算机程序在被处理器调用时能够实现上述基于匹配树的终端信息备份方法所包含的所有步骤。
本发明的有益效果在于:本发明通过构建与预设的配置文件相对应的匹配树,明确所要备份的信息的文件名或目录名及其路径;然后依据匹配树对待备份终端发送过来的文件名进行判断、筛选,实现备份信息的有效过滤,从而快速且精确的采集获取所需的终端信息。本发明具有准确地批量采集特定备份信息,降低IO写入、减少备份时间、提高备份效率、降低冗余文件的占用空间、降低设备和终端能源损耗等优点。
附图说明
图1为本发明一种基于匹配树的终端信息备份方法的流程示意图;
图2为本发明匹配树的示意图;
图3为本发明实施例一的方法流程示意图;
图4为本发明实施例三的系统结构组成示意图;
图5为本发明实施例三的系统中匹配过程的流程示意图。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
本发明最关键的构思在于:通过构建匹配树,明确所要备份的信息的文件名或目录名;依据匹配树对待备份终端发送过来的文件名进行判断、筛选,实现备份信息的有效过滤,从而快速且精确的采集获取所需的终端信息。
本发明涉及的技术术语解释:
Figure BDA0001630718030000031
请参照图1以及图2,本发明提供一种基于匹配树的终端信息备份方法,包括:
预设配置文件,所述配置文件包括起始标识、对应待备份应用的分组,以及对应分组的匹配条目,所述匹配条目由与待备份文件名或目录名对应的匹配项组成;
依据所述配置文件构造以所述起始标识为根节点,所述分组及其对应的匹配条目内的匹配项依次逐级分布为树节点的匹配树;
匹配待备份终端发送过来的文件名与所述匹配树;
若匹配成功,则存储所述文件名对应的文件内容。
从上述描述可知,本发明的有益效果在于:利用本发明,可以实现快速批量过滤终端备份过程中的文件,可适用于所有需要进行信息备份的终端,特别是搭载iOS操作系统的终端,有效解决现有技术对于iOS的数据备份,需要备份整个手机的数据,而不能针对性的对于其中某个文件或者一部分文件进行备份的不足。通过本发明,能够在备份过程中仅针对某个文件或者一些文件进行存储,由此可以大大缩短下载过程耗费的时间,减少冗余文件,降低存储空间占用,特别是大幅提高相关司法取证工作人员的工作效率,节省宝贵时间开支,强悍有力地支持司法工作的迅速有效展开。
本发明对于iPhone备份的改进,相信在各种司法取证应用及其它相关领域有着广阔的市场及应用前景,
进一步的,还包括:
若匹配不成功,则丢弃所述文件名对应的文件内容。
由上述描述可知,直接丢弃不需要进行备份的文件内容,有效缩减备份时长、减少冗余资源对空间的占用。
进一步的,所述依据所述配置文件构造以所述起始标识为根节点,所述分组及其对应的匹配条目内的匹配项依次逐级分布为树节点的匹配树,具体为:
读取并解析所述配置文件,以配置文件的起始标识为根节点,各分组为根节点的下一级节点,每个匹配条目内的每个匹配项作为对应分组所在节点的子节点按照同级目录位于同一层的方式进行逐级分布,生成对应所述配置文件的匹配树。
由上述描述可知,对应配置文件的文件名或目录名的目录结构构建得到匹配树,更好的明确待备份文件的各级目录结构,并在备份过程据此进行逐级匹配,确保待备份文件采集的准确性。
进一步的,所述匹配待备份终端发送过来的文件名与所述匹配树;若匹配成功,则存储所述文件名对应的文件内容,具体为:
接收待备份终端发送过来的文件名及对应的文件内容;
对接收到的文件名按照目录结构进行逐级分割;
逐级匹配分割得到的各级目录与匹配树;
若所述各级目录能够与匹配树中由分组对应的节点开始的完整节点路径逐级匹配成功,则存储所述文件名对应的文件内容。
由上述描述可知,通过将文件名逐级分割后得到的各级目录与匹配树进行逐级的匹配,实现备份文件的过滤,高效且准确的提取出所需的备份文件。
进一步的,所述逐级匹配分割得到的各级目录与匹配树,具体为:
匹配分割得到的第一级目录与所述匹配树中分组对应的节点;
若匹配成功,则匹配分割得到的第二级目录与所述分组对应的节点的下一层级的子节点;
若匹配成功,则继续匹配所述第二级目录的下级目录与所述子节点的再下一层级的子节点,直至匹配失败,或者匹配到当前节点路径的最后一层级的子节点,构成完整节点路径。
由上述描述可知,通过逐级的匹配,保证筛选的准确性,同时又能提高过滤的效率。
进一步的,若待备份文件名或目录名是唯一的,并且其对应的路径是固定的,则以所述待备份文件名或目录名的各级目录名称为匹配项;
若待备份文件名或目录名是可变的,则以其对应的正则表达式为匹配项。
由上述描述可知,同时适用于对可变或者不可变的文件名或目录名进行过滤,确保能够全面且准确的获取所需的备份信息。
进一步的,所述正则表达式以特定符号开头和结尾。
由上述描述可知,由特定符号构建的正则表达式实现针对可变文件名的模式匹配,拓宽匹配对象的适用范围,更好的满足实际运用的需求。
进一步的,所述匹配树中还包含对应各节点的属性说明。
由上述描述可知,匹配树还能包含对应节点的相关属性,如当前节点是文件夹或者文件,当前节点描述的是否是数据库等等,有助于提高匹配精度,明确节点信息。
进一步的,还包括:
建立待备份终端与备份设备之间的通信连接关系;
接收待备份终端发送过来的文件名及其文件内容。
由上述描述可知,只需建立与待备份终端的通信连接关系并接收器发送多来的文件名和文件内容即可实现高效、准确、针对性的对特定信息进行备份,无需对待备份终端进行改进,更实用,更方便,也更具备更广阔的运用前景。
本发明提供的另一个技术方案为:
一种备份设备,包括存储单元,所述存储单元存储有计算机程序,所述计算机程序在被处理器调用时能够实现上述的基于匹配树的终端信息备份方法所包含的所有步骤。
从上述描述可知,本发明的有益效果在于:同时提供一种用于实现上述基于匹配树的终端信息备份方法的备份设备,只需与待备份终端进行通信连接,并启动其同步服务,便可实现本发明所能实现的优点。具体的,备份设备功能的实现,通过其上存储的计算机程序实现,对应本领域普通技术人员可以理解实现上述第一个技术方案中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来实现的,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时,可包括如上述各方法的流程。
实施例一
请参照图2和图3,本实施例提供一种基于匹配树的终端信息备份方法,适用于对所有需要进行信息备份的终端进行特定信息的备份操作。特别适用于ios系统这类由于系统安全限制高,无法仅针对特定信息进行备份的终端实现备份。
本实施例能够实现精准且高效的针对特定信息进行备份,不仅缩短了备份所需时长,同时还能减少冗余文件的空间占用、且无需对待备份终端进行任何改进,显著提高了备份的效率,具有广阔的运用场景,更好的满足实际需求,特别是大幅提高相关司法取证工作人员的工作效率,节省宝贵时间开支,强悍有力地支持司法工作的迅速有效展开。
本实施例的方法基于待备份的终端,以及与其通信连接的备份设备实现。
具体的,请参阅图3,本实施例的方法可以包括以下步骤:
S1:预设配置文件。
所述配置文件预先设置并存储于备份设备中,配置文件是依据文件匹配规则提前定义好的,用于明确本次从待备份终端中备份过来的信息对象。所述匹配规则大致上可以概括为:所述配置文件包括起始标识、对应待备份应用的分组,以及对应分组的匹配条目,所述匹配条目由与待备份文件名或目录名对应的匹配项组成。
具体的,匹配规则具体定义了配置文件中需要包括:
(1)一个起始标识,用于标识内容的起始位置,作为后续所构建的匹配树的根节点;
(2)分组;在起始标识之后,包括多个的分组,分组对应的是待备份对象的应用(如QQ、微信、邮箱、通讯录等),分组定义逻辑功能,用于组织一个功能需求,即需要备份的具体文件内容所对应的具体功能应用,或目录。
(3)匹配条目;每一个的分组包括多条的匹配条目,具体数据依据所要备份的对象不同而定;匹配条目用于匹配目标文件或目标目录(需要下载的文件)的完整的绝对路径;每一条的匹配条目由至少一个的匹配项组成,多个的匹配项之间用特定符号作为分割;优选使用“/”作为分割符号。
(4)匹配项;至少一个的匹配项构成一条匹配条目,单个的匹配项对应的是匹配条目所对应的具体的文件的其中一级目录结构,一条匹配条目中所包含的所有匹配项依序组合成所要采集的一个文件的完整存储路径。
例如想要备份的是QQ邮箱应用下的uploadDir这一子文件的文件内容,由于终端中文件的存储都是以目录结构形式存储的,即对应该子文件的是一条完整目录结构的存储路径,因此,我们可以将明确指向该子文件的这条完整存储路径,依据匹配规则对应到分组-匹配条目-匹配项结构中去,由此生成一条对应该子文件的配置信息,以实现该子文件内容的采集。
而由于文件名又对应有可变的文件名和固定的文件名,因此,在定义配置文件中的匹配项的时候,还需要对应不同类型的文件名采用不同的规则进行定义。具体的:
(1)当文件名或目录名及其路径唯一时,匹配项与文件名或目录名路径保持一致。即直接用待备份文件名或目录名的各级目录名称作为匹配项,各级目录组合后,也就是所有匹配项组合后得到的存储路径,便指向了待备份的文件的存储位置。
例如,将要下载/com.tencent.mqq/Documents/contents/QQAccountsManager这个文件,因为文件路径是固定的并且文件名是唯一的,因此匹配条目就等于/com.tencent.mqq/Documents/contents/QQAccountsManager;
(2)当待备份文件名或目录名是可变的,则以其对应的正则表达式为匹配项。匹配项是以“^”开头并以“$”结束的正则表达式;
例如,将要下载的文件类似于/com.tencent.mqq/Documents/123456/groupSettingInfo的非固定名称的文件(其中123456是QQ号码,该部分是可变的,且有对应的规则可遵循),则可变部分就可以使用正则表达式“^[0-9]+$”实现模式匹配,此时针对QQ号码的匹配项为“^[0-9]+$”,则完整的匹配条目为/com.tencent.mqq/Documents/^[0-9]+$/groupSettingInfo。
通过上述配置文件的设置,能够事先依据所要进行备份(下载采集)的文件的存储路径配置得到对应的包括分组及其下匹配条目的配置项,在后续备份过程,便可依据匹配项只备份对应的特定的文件,比如至备份QQ下的某个文件的内容,就只需要将QQ相关的文件信息事先写入到配置文件中即可,而其他应用程序的文件,即其他无关的冗余文件则无需备份。因此,配置文件的设置,能够作为后续实际备份过程的筛选标准或依据,为后续准确且高效地采集所要备份的文件提供支持。
S2:启动并初始化连接,建立备份设备与待备份终端的通信连接关系。
具体而言,备份设备与待备份终端可以通过TCP/IP协议进行通信,同时支持有线或无线连接方式,为了进一步提高信息传输效率和稳定性,优选二者之间通过USB有线连接方式进行连接。
S3:备份设备加载配置文件,并据此构造出对应的匹配树。
总的来说,即依据所述配置文件构造以所述起始标识为根节点,所述分组及其对应的匹配条目内的匹配项依次逐级分布为树节点的匹配树。而具体而言,就是通过读取并解析配置文件,首先读取配置文件的起始标识,将其作为匹配树的根节点;然后依次读取配置文件的起始标识后的分组及对应分组下的每一个匹配条目,将各个分组作为根节点的下一级节点,即二级节点;将分组下的各个匹配条目所内包含的匹配项依序作为对应分组所在节点的子节点进行逐级分布,从而生成一颗与匹配文件相对应的匹配树。其中,单条的匹配条目作为其对应分组所在二级节点的一个独立分支存在;匹配树中同一级目录对应的匹配项位于同一层树节点;父子目录对应的是父子节点。
优选的,所述匹配树中还包含了对应树节点的相关属性,如当前节点是文件夹或者文件,当前节点描述的是否是数据库等等。
如图2所示,为一简易的匹配树,其中“/”这一根节点,对应的是配置文件中的起始标识;其下第二级节点“com.tencent.mqq”、“com.tencent.qqmail”、“private”对应的是配置文件的分组信息,分别为“应用QQ”、“QQ邮箱”以及“通讯录”的应用程序;在“com.tencent.mqq”这一分组下,包含独立的两条匹配条目,依据匹配条目内已经依据目录层级依序排列的各个匹配项直接逐级排布,且同一级目录位于同一层树节点。
S4:接收待备份终端的同步服务发送过来的文件名及其文件内容;
无需对待备份终端进行任何硬件或软件方面的改进,直接利用其同步服务,在于其建立连接后,便实现可本实施例对特定信息的备份。
S5:匹配待备份终端发送过来的文件名与所述匹配树。
优选待备份终端先发送文件名过来,再发送具体文件内容,本实施例只需通过对文件名的匹配,便可确定对应文件内容是否为所需的文件内容,进而实现仅对所需文件内容的下载。
具体的匹配过程可以包括以下子步骤:
S51:对接收到的文件名按照其目录结构进行逐级分割;即将文件名对应的完整目录存储路径按照每一级目录结构进行分割,例如接收到文件名com.tencent.mqq/Documents/contents/QQAccountsManager,则分割成com.tencent.mqq;Documents;contents;QQAccountsManager;
S52:逐级匹配分割得到的各级目录与匹配树;
具体的,可以包括:
匹配分割得到的第一级目录与所述匹配树中分组对应的节点,即第一级节点;
若匹配成功,则匹配分割得到的第二级目录与所述分组对应的节点的下一层级的子节点,即上述第一级节点的下一级节点;若匹配失败,则丢弃该文件名对应的文件内容,返回步骤S51,接收下一个文件名并对其进行匹配;
若匹配成功,则继续匹配所述第二级目录的下级目录,即第三级目录与上述下一级节点的再下一层级的子节点,直至匹配失败,或者匹配到当前节点路径的最后一层级的子节点,构成完整节点路径。所述完整节点路径,指的是能够由分组对应的节点开始,沿其中一条分支节点匹配到最后一个节点。对于能够匹配至完整节点路径的文件名,则存储该文件名对应的文件内容;然后返回步骤S51,获取下一个文件名进行匹配;若匹配失败,则丢弃该文件名对应的文件内容,返回步骤S51,接收下一个文件名并对其进行匹配。
其中,针对匹配树中以正则表达式表示的匹配项所对应的树节点的匹配方式,则使用模式匹配方式来匹配文件/文件夹,即判断对应的目录结构是否符合该正则表达式的规范要求。
S6:若对接收到的文件名都完整匹配过程,则自动退出。
通过对接收到的文件名与匹配树进行匹配,实现无关冗余文件内容的滤除,能够精确、全面、高效的筛选出所需备份的信息进行存储,大大缩短备份过程所需时间,并且有效排除了冗余文件的干扰,又能减低备份信息的资源占用空间,显著提高备份的效率,实现了一种全新的备份方式。
实施例二
本实施例对应实施例一,提供一种基于匹配树的备份设备,包括存储单元,所述存储单元存储有计算机程序,所述计算机程序在被处理器调用时能够实现上述实施例一提供的基于匹配树的终端信息备份方法所包含的所有步骤。具体步骤请参阅实施例一的描述,在此不进行复述。
实施例三
本实施例对应实施例一,提供一种基于匹配树的终端信息备份系统,请参阅图4,具体包括备份设备以及待备份终端,所述待备份终端可以是任何有需求进行数据备份的终端设备,如手机、平板等,特别是搭载有ios系统的具有较高安全限制,又无法实现仅针对特定数据进行备份的智能终端。
在本实施例中,以所述待备份终端为iPhone手机为例进行说明,但不局限于此。
一、待备份终端
待备份的iPhone手机内具有一固有的同步服务组件,同步服务组件作为备份服务组件提供数据同步服务,同步服务组件属于待备份的iPhone手机本身固有的服务,用于实现iPhone手机内信息的同步备份功能,此为现有功能,无需进行改进。
二、备份设备
备份设备内设有备份服务组件和配置文件组件;所述配置文件组件与备份服务组件连接;在备份过程,所述备份服务组件与待备份的iPhone手机的同步服务组件通信连接。
2.1配置文件组件;
配置文件组件包括文件匹配规则和配置文件两部分。
2.1.1文件匹配规则定义如下:
a、每一条匹配条目由多个匹配项组成,匹配项之间用“/”作为分割符号;
b、每个匹配项匹配一个文件名或者目录名;
c、多个匹配项组成一个匹配条目,用于匹配目标文件或目标目录的完整的绝对路径;
d、文件名及路径确定唯一时,匹配项跟文件名路径保持一致;
e、对于可变文件名,匹配项是以“^”开头并以“$”结束的正则表达式;
2.1.2配置文件组织规则如下:
配置文件由多个分组组成,每个分组包括多条匹配条目。分组定义逻辑功能,用于组织一个功能需求,即需要下载的文件,比如分组可以是QQ、微信、邮件、通信录等;匹配条目用于匹配需要下载的文件。通过这样的组织方式,备份服务组件就可以只备份特定的文件,比如只备份QQ,就只需要将QQ相关的文件写入到文件系统,而其他应用程序的文件则无需保存。
2.2备份服务组件;
具体的,当iPhone手机与备份设备建立通信连接关系后,备份服务组件与iPhone手机的同步服务组件协同工作。具体的,当备份设备中的备份服务组件启动,开始执行与iPhone的初始化连接操作,连接成功后,加载配置文件组件,解析并构造匹配树(具体参与实施例一的S3),针对同步服务组件发送过来的文件名及文件内容进行过滤,保存需要的文件,丢弃冗余的文件,同步服务组件在结束时会发送消息通知备份文件组件,备份文件组件退出,流程结束。
三、基于本实施例的系统的总体工作流程如下:
3.1iPhone通过USB接口与采集设备进行连接;
3.2采集设备启动备份服务组件,并与iPhone的同步服务组件进行通信初始化,建立连接;
3.3备份服务组件加载并解析配置文件组件的内容,根据对应的配置构造出一颗匹配树;
3.4同步服务组件发送消息至备份服务组件,先发送文件名,后发送文件内容;
3.5备份服务组件接收同步服务组件发送过来的文件名,通过匹配树进行过滤,符合匹配条件的,则将该文件写入采集设备文件系统,不符合条件,则丢弃不写入;
3.6同步服务组件文件发送完毕,并发送消息通知备份服务组件,备份服务组件接收消息,备份完成。
四、请参阅图5,具体匹配过程可以包括以下步骤:
4.1判断是否已接收完毕,如已完成则退出;
4.2否则开始接收文件名及文件内容;
4.3将接收到的文件名按照每一级目录结构进行分割,然后与匹配树进行匹配过滤;
4.4匹配树顶层对应根目录,第一层对应文件名第一级,如果该目录匹配当前层级的其中一个节点,则继续匹配该节点的子节点;
4.5否则判定为不匹配,返回结果并丢弃文件内容,继续步骤4.2;
4.6如果匹配树节点以^开头以$结尾,使用模式匹配匹配文件/文件夹,如果没有匹配,则匹配过程结束,丢弃文件内容,继续步骤4.2;
4.7如果匹配到最后一个子节点,文件/文件夹则是需要保存的,则将当前文件内容或者文件夹下所有文件内容写入到文件系统中,继续步骤4.2。
下面,对应本实施例,提供一具体运用场景:
针对iPhone手机内的信息进行司法取证的运用。以备份微信为例,传统的iPhone备份需要备份整部手机的数据,而不能仅仅备份微信的数据,这样耗费了大量的备份时间且浪费了大量的存储空间;通过本实施例,可以过滤掉不属于微信的文件,也可以过滤掉大量取证过程中不需要使用的文件,比如一些表情文件,大量解析应用数据无关的附件和缓存文件;缩短了全盘备份过程浪费的大量时间,减少冗余文件占用的存储空间;特别是在移动式手机采集的应用上,满足了较高的时效性要求,也使有限的设备存储空间能有更高的有效利用率。
具体的,以备份微信的其中一个文件为例,该文件的绝对路径为:/com.tencent.xin/Documents/^[0-9a-z]{32}$/session/session.db;可以包括以下步骤:
1、解析该匹配条目,构造一个包含根节点总共6个层级的匹配树,每个层级分别为一个目录名称,仅最后一个子节点为文件名session.db;
2、其中^[0-9a-z]{32}$为可变文件名,标志着需要匹配的目录名称为:32位的数字与小写字母,该文件名在不同手机上会呈现出不一样的名字,但是具有固定的规则;
3、在备份服务组件接收到文件名时,即对文件名按照目录层级进行逐级分割,如当前接收到文件名为/com.tencent.mqq/Documents/contents/QQAccountsManager,分割后为com.tencent.mqq、Documents、contents、QQAccountsManager,第一个匹配项与com.tencent.xin不匹配,则丢弃,继续匹配下一个文件;
如当前接收到文件名为/com.tencent.xin/Documents/189e725f4587b679740f0f7783745056/session/session.d b,逐级分割并依次匹配,该文件匹配成功,则将文件内容写入到文件系统中;
4、待备份服务接收到结束消息,即一次备份过程结束。
综上所述,本发明提供的一种基于匹配树的终端信息备份方法及备份设备,可以有效过滤掉无关的信息,具有针对性的、全面的仅提取所需的备份信息进行存储,实现备份时长的大大缩减,同时减少冗余文件带来的干扰,以及不必要的存储空间占用,使得有效的设备存储空间能够有更高的有效利用率;可以确保精准地、快速地采集所需备份信息,实现对具备较高时效性信息的及时提取,更好的满足司法取证等各种实际运用场景的需求。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种基于匹配树的终端信息备份方法,其特征在于,包括:
预设配置文件,所述配置文件包括起始标识、对应待备份应用的分组,以及对应分组的匹配条目,所述匹配条目由与待备份文件名或目录名对应的匹配项组成;
依据所述配置文件构造以所述起始标识为根节点,所述分组及其对应的匹配条目内的匹配项依次逐级分布为树节点的匹配树;
所述依据所述配置文件构造以所述起始标识为根节点,所述分组及其对应的匹配条目内的匹配项依次逐级分布为树节点的匹配树,具体为:
读取并解析所述配置文件,以配置文件的起始标识为根节点,各分组为根节点的下一级节点,每个匹配条目内的每个匹配项作为对应分组所在节点的子节点按照同级目录位于同一层的方式进行逐级分布,生成对应所述配置文件的匹配树;
匹配待备份终端发送过来的文件名与所述匹配树;
若匹配成功,则存储所述文件名对应的文件内容;
所述匹配待备份终端发送过来的文件名与所述匹配树;若匹配成功,则存储所述文件名对应的文件内容,具体为:
接收待备份终端发送过来的文件名及对应的文件内容;
对接收到的文件名按照目录结构进行逐级分割;
逐级匹配分割得到的各级目录与匹配树;
所述逐级匹配分割得到的各级目录与匹配树,具体为:
匹配分割得到的第一级目录与所述匹配树中分组对应的节点;
若匹配成功,则匹配分割得到的第二级目录与所述分组对应的节点的下一层级的子节点;
若匹配成功,则继续匹配所述第二级目录的下级目录与所述子节点的再下一层级的子节点,直至匹配失败,或者匹配到当前节点路径的最后一层级的子节点,构成完整节点路径;
若所述各级目录能够与匹配树中由分组对应的节点开始的完整节点路径逐级匹配成功,则存储所述文件名对应的文件内容。
2.如权利要求1所述的基于匹配树的终端信息备份方法,其特征在于,还包括:
若匹配不成功,则丢弃所述文件名对应的文件内容。
3.如权利要求1所述的基于匹配树的终端信息备份方法,其特征在于,若待备份文件名或目录名是唯一的,并且其对应的路径是固定的,则以所述待备份文件名或目录名的各级目录名称为匹配项;
若待备份文件名或目录名是可变的,则以其对应的正则表达式为匹配项。
4.如权利要求3所述的基于匹配树的终端信息备份方法,其特征在于,所述正则表达式以特定符号开头和结尾。
5.如权利要求1所述的基于匹配树的终端信息备份方法,其特征在于,所述匹配树中还包含对应各节点的属性说明。
6.如权利要求1所述的基于匹配树的终端信息备份方法,其特征在于,还包括:
建立待备份终端与备份设备之间的通信连接关系;
接收待备份终端发送过来的文件名及其文件内容。
7.一种备份设备,包括存储单元,其特征在于,所述存储单元存储有计算机程序,所述计算机程序在被处理器调用时能够实现如权利要求1-6任意一项所述的基于匹配树的终端信息备份方法所包含的所有步骤。
CN201810341265.6A 2018-04-17 2018-04-17 一种基于匹配树的终端信息备份方法及备份设备 Active CN108762979B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810341265.6A CN108762979B (zh) 2018-04-17 2018-04-17 一种基于匹配树的终端信息备份方法及备份设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810341265.6A CN108762979B (zh) 2018-04-17 2018-04-17 一种基于匹配树的终端信息备份方法及备份设备

Publications (2)

Publication Number Publication Date
CN108762979A CN108762979A (zh) 2018-11-06
CN108762979B true CN108762979B (zh) 2021-08-10

Family

ID=64010665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810341265.6A Active CN108762979B (zh) 2018-04-17 2018-04-17 一种基于匹配树的终端信息备份方法及备份设备

Country Status (1)

Country Link
CN (1) CN108762979B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858145B (zh) * 2019-04-25 2024-07-09 伊姆西Ip控股有限责任公司 数据备份与恢复的方法、设备和计算机程序产品
CN112988457B (zh) * 2019-12-17 2023-04-25 中国移动通信集团河南有限公司 一种数据备份方法、装置、系统及计算机设备
CN112379891B (zh) * 2020-10-09 2023-12-29 广州博冠信息科技有限公司 一种数据处理方法和装置
CN117891786B (zh) * 2024-03-15 2024-05-31 浙江研通信息科技有限公司 一种基于蒙特卡洛算法的档案路径挂接方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194492B2 (en) * 2001-10-29 2007-03-20 Emc Corporation Method and apparatus for efficiently copying distributed data files
CN102147811A (zh) * 2011-03-22 2011-08-10 杭州华三通信技术有限公司 一种基于日志的系统性能分析方法和装置
CN103177112A (zh) * 2013-04-02 2013-06-26 浪潮电子信息产业股份有限公司 一种备份文件浏览系统
CN105279278A (zh) * 2015-11-13 2016-01-27 珠海市君天电子科技有限公司 文件的搜索方法及装置
CN105930196A (zh) * 2016-05-25 2016-09-07 厦门市美亚柏科信息股份有限公司 基于模式匹配快速批量下载安卓文件的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194492B2 (en) * 2001-10-29 2007-03-20 Emc Corporation Method and apparatus for efficiently copying distributed data files
CN102147811A (zh) * 2011-03-22 2011-08-10 杭州华三通信技术有限公司 一种基于日志的系统性能分析方法和装置
CN103177112A (zh) * 2013-04-02 2013-06-26 浪潮电子信息产业股份有限公司 一种备份文件浏览系统
CN105279278A (zh) * 2015-11-13 2016-01-27 珠海市君天电子科技有限公司 文件的搜索方法及装置
CN105930196A (zh) * 2016-05-25 2016-09-07 厦门市美亚柏科信息股份有限公司 基于模式匹配快速批量下载安卓文件的方法及系统

Also Published As

Publication number Publication date
CN108762979A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
CN108762979B (zh) 一种基于匹配树的终端信息备份方法及备份设备
CN104376053B (zh) 一种基于海量气象数据的存储与检索方法
CN111176976B (zh) 测试数据的生成方法和装置、存储介质及电子装置
CN106657213B (zh) 文件传输方法和装置
CN106982150B (zh) 一种基于Hadoop的移动互联网用户行为分析方法
CN113986873B (zh) 一种海量物联网数据模型化的处理、存储与共享方法
CN103049515A (zh) 一种应用程序分类的方法、装置和设备
CN104778222A (zh) 基于usb存储设备的媒体库建立及更新方法
CN107832440B (zh) 一种数据挖掘方法、装置、服务器及计算机可读存储介质
CN104462141A (zh) 一种数据存储与查询的方法、系统及存储引擎装置
CN110955704A (zh) 一种数据管理方法、装置、设备及存储介质
CN113094355A (zh) 基于国产化通信协议的模型实例化方法、装置、设备及介质
CN109408471B (zh) 一种基于匹配树的压缩包解压方法、装置及存储介质
CN101246440A (zh) Java卡系统垃圾回收方法
CN104636368A (zh) 数据检索方法、装置及服务器
CN104035943A (zh) 存储数据的方法及相应服务器
CN111367916B (zh) 一种数据存储方法及装置
CN105930196B (zh) 基于模式匹配快速批量下载安卓文件的方法及系统
CN112052248A (zh) 一种审计大数据处理方法及系统
CN109165259B (zh) 基于网络附属存储的索引表更新方法、处理器及存储装置
CN112487251A (zh) 一种用户id数据关联方法及装置
CN107104889B (zh) 一种基于imap协议的草稿邮件同步方法、装置和终端
CN108874798B (zh) 一种大数据排序方法和系统
CN113407541B (zh) 数据采集方法、设备、存储介质及装置
CN111061719B (zh) 数据收集方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant