电子邮件的恢复方法
技术领域
本发明涉及数据处理方法,尤其涉及一种电子邮件的恢复方法。
背景技术
随着互联网的普及以及电子邮件具有快捷方便的优点,越来越多地在商业和日常生活中采用电子邮件进行信息交流和沟通。但是实际中,往往会因为计算机的软件或硬件故障,以及用户的误操作而导致邮件的丢失或误删除,从而导致电子邮件中重要资料的丢失。因此在使用过程中,用户需要一种有效的电子邮件的恢复方法来找回删除的资料。虽然现在已有多种电子邮件的恢复方法,然而这些方法一般都需要对整个物理磁盘进行扫描,效率不高且准确率低。
发明内容
本发明要解决的技术问题在于针对现有技术中电子邮件的恢复方法中操作繁琐和效率不高的缺陷,提供一种电子邮件的恢复方法。
本发明解决其技术问题所采用的技术方案是:提供了一种电子邮件的恢复方法,包括步骤:
在后缀名为dbx的文件中进行遍历以确定一封邮件的开始位置;
判断确定的所述一封邮件是否为被删除的邮件;
如果是,则提取所述一封邮件的内容以进行恢复;
如果否,则继续遍历以确定另一封邮件的开始位置。
在依据本发明实施例的电子邮件的恢复方法中,所述在后缀名为dbx的文件中进行遍历以确定一封邮件的开始位置的步骤中,进一步包括:
判断当前文件内容与所述当前文件内容的文件偏移位置是否一致;
如果是,则当前文件内容为所述一封邮件的开始位置;如果否,则继续遍历。
在依据本发明实施例的电子邮件的恢复方法中,所述判断确定的所述一封邮件是否为被删除的邮件的步骤中,进一步包括从所述文件偏移位置处开始寻找预设的开始位特征码,如果找到,则所述一封邮件为被删除的邮件。
在依据本发明实施例的电子邮件的恢复方法中,所述按照所述邮件内容的大小信息提取一封完整的邮件以进行恢复的步骤中,进一步包括:
所述一封邮件内容由一个或多个分段组成;所述提取所述一封邮件的内容以进行恢复的步骤进一步包括:
根据在偏移位置上紧邻分段编码前方的分段内容大小信息,从所述开始位特征码起提取所述被删除的邮件的当前分段内容;其中在偏移位置上紧邻所述开始位特征码前方的四位编码为所述被删除的邮件的分段编码;
判断所述分段编码是否为00 00 00 00,如果是,则当前分段为结尾分段,停止提取下一分段邮件内容;如果否,则在提取完当前分段内容后,继续提取下一分段邮件内容。
在依据本发明实施例的电子邮件的恢复方法中,所述开始位特征码为0000 00 00 3A。
在依据本发明实施例的电子邮件的恢复方法中,所述开始位特征码为0000 00 00 69 76 65 64。
本发明产生的有益效果是:在采用依据本发明的电子邮件的恢复方法中,不需要对计算机的整个物理磁盘进行扫描,只需要在后缀名为dbx的文件中进行遍历即可,大大缩小了扫描范围,提高了恢复效率。另外,在判断当前文件内容与其对应的文件偏移位置一致后,通过寻找开始位特征码的方法进一步确定待恢复的邮件的开头,不需要再进行解析邮件这一繁琐过程,简化了恢复操作,从而进一步提高了恢复效率。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的电子邮件的恢复方法的流程图;
图2是图1中步骤S100的流程图;
图3是图1中步骤S200的流程图;
图4是图1中步骤S300的流程图;
图5是后缀名为dbx的文件内容的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1-4分别示出了依据本发明实施例的电子邮件的恢复方法的流程图,图5示出了后缀名为dbx的文件内容,下面将结合图1-5分步骤对该恢复方法进行详细描述。
步骤S100、在后缀名为dbx的文件中进行遍历以确定一封邮件的开始位置。Outlook Express中的邮件保存在后缀名为dbx的文件中,且该后缀名为dbx的文件是唯一的,当用户或计算机本身(软件或硬件的原因)导致某一封邮件被删除,那么该邮件在后缀名为dbx的文件中的索引区的信息同时被删除,使得无法从Outlook Express界面正常读取该邮件,但该邮件的内容仍然保存在后缀名为dbx的文件中。因此,在依据本发明实施例的电子邮件的恢复过程中,不需要对计算机的整个物理磁盘进行扫描,只需要在后缀名为dbx的文件中进行遍历找寻即可。这样大大减少了扫描时间和扫描范围,提高了恢复效率。
具体而言,如图2所示,通过判断当前文件内容与当前文件内容的文件偏移位置是否一致来确定一封邮件的开始位置。例如,在对图5中示出的后缀名为dbx的文件进行遍历的过程中,实时判断当前文件内容(图中右半区域)与该当前文件内容对应的文件偏移位置(offset)是否一致。判断结果如果是不一致,则继续进行遍历。如果是一致,则表明当前文件内容为一封邮件的开始位置,具体而言,如果当前文件内容为B100(即“E4 91 01 00”),那么此时该当前文件内容对应的文件偏移位置为该行的起始文件偏移位置B200(即“0001 91 D0”)再偏移14位,即为00 01 91 D0+14=00 01 91 E4,反序后即为E491 01 00,该当前文件内容B100正好与其文件偏移位置一致,表明此位置即是一封邮件的开始位置。换句话说,从B100开始的内容是一封邮件的内容。
S200、判断确定的一封邮件是否为被删除的邮件。具体而言,如图3所示,将从以上确定的文件偏移位置开始寻找预设的开始位特征码,来判断确定的这一封邮件是否是一封被删除的邮件。在Outlook Express中,被删除的邮件具有开始位特征码,例如,有的邮件的开始位特征码为“00 00 00 00 61 74 683A”;有的为“00 00 00 00 3A”;还有的为“00 00 00 00 69 76 65 64”。在该步骤中,只要找到任意一个开始位特征码即表明这是一封被删除了的邮件。
在该步骤中,当找寻到预设的开始位特征码后,表明已经找到一封被删除的邮件。如果没有找到开始位特征码,则表明确定的这一封邮件不是一封删除的邮件,将继续在后缀名为dbx的文件中进行遍历来找到另一封邮件。
S300、如果确定为删除的邮件,则提取该一封邮件的完整内容以进行恢复。如图4所示,通过开始位特征码确定一封邮件为被删除的邮件的同时可以确定该删除的邮件的开头,再根据后续文件内容中的大小信息提取一封完整的邮件,并进行恢复。
结合图5所示,在B100之后找到了开始位特征码B300(即“00 00 00 0069 76 65 64”),从而可以确定这是一封被删除的邮件,同时可通过开始位特征码B300确定该删除了的邮件的开始位置。
在后缀名为dbx的文件中,所保存的邮件内容由不同的分段构成,各分段组合成了一封完整的邮件内容。此时,确定了被删除了的邮件的开始位置后,只要找到构成该邮件的每个分段,即可恢复一封完整的邮件。具体如图5所示,在偏移位置上紧接着开始位特征码B300前方的B400(即“F4 93 01 00”)代表这封删除了的邮件的一个分段的开始,称为分段编码,用以表示上述被删除的邮件中一个分段的开始位置。在偏移位置上紧接着分段编码B400前方的八位编码“FC 01 00 00 10 02 00 00”中的“10 02 00 00”(图2中用B500表示)代表了当前分段内容大小。此时即可从“F4 93 01 00”之后开始提取内容大小为B500的一分段邮件内容。
但是一封邮件并不一定是由一段内容组成,可能有多段内容组成,需要通过分段编码来判断需要恢复的邮件从分段之后是否还有分段内容,具体地,当分段编码不是“00 00 00 00”时,即表明需要恢复的邮件从该分段之后还有分段内容;当分段编码是“00 00 00 00”时,即表明需要恢复的邮件从该分段之后没有分段内容;图5中分段编码B400为“F4 93 01 00”,不是“00 00 00 00”,因此提取这一段之后还需要再继续提取其它分段的内容。在提取一段完成后,开始找寻下一段的开始,当找到下一个分段编码“F4 93 01 00”(即B600)之后即找到了下一分段的开始位置,同样地,“FC 01 00 00 10 02 00 00”中的“10020000”(图2中用B700表示)代表了当前分段内容大小。此时应当注意的是,如果紧接“FC 01 00 00 10 02 00 00”之后为的分段编码为“00 00 00 00”,则该分段为结尾分段,这一封删除的邮件没有下一个分段了,即,从“00 00 0000”(B800)往后提取内容大小为B500的一分段邮件内容后,表明邮件内容到此段结束,已经提取了这一封删除的邮件的完整内容。否则,将继续提取下一分段的邮件内容,直至提取了这一封删除的邮件的完整内容为止。
但是需要说明的是,采用该方法可以恢复出所有的被删除的邮件,当存在不止一封被删除的邮件时,需要用户对恢复出的邮件进行筛选,从而判断出该邮件是否为用户需要寻找的邮件。
从以上可以看出,在采用依据本发明的电子邮件的恢复方法中,不需要对计算机的整个物理磁盘进行扫描,只需要在后缀名为dbx的文件中进行遍历即可,大大缩小了扫描范围,提高了恢复效率。另外,通过判断当前文件内容与其对应的文件偏移位置一致,来确定一封邮件的开始位置;继而通过寻找开始位特征码的方法进一步确定该封邮件为被删除的邮件,同时确定该被删除了的邮件的开始位置,省去了解析邮件这一繁琐过程,简化了恢复操作,从而进一步提高了恢复效率。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。