CN112100631B - 一种判断pptx文档加密的处理方法及终端 - Google Patents
一种判断pptx文档加密的处理方法及终端 Download PDFInfo
- Publication number
- CN112100631B CN112100631B CN202010800660.3A CN202010800660A CN112100631B CN 112100631 B CN112100631 B CN 112100631B CN 202010800660 A CN202010800660 A CN 202010800660A CN 112100631 B CN112100631 B CN 112100631B
- Authority
- CN
- China
- Prior art keywords
- bytes
- file
- pptx
- document
- encryption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开了一种判断PPTX文档加密的处理方法及终端,其方法包括步骤:获取待识别文件的前N个字节,遍历前N个字节以进行加密标识的正则匹配,若在前N个字节中匹配到同样顺序的加密标识,则将待识别文件判定为已加密PPTX文档,加密标识包括依次排序的M个字节,N大于M。本发明在对待识别文件的前N个字节中进行加密标识的正则匹配,在匹配到相同顺序的加密标识,则判定为已加密PPTX文档,进而提醒用户提供密码以便对文档进行后续操作。
Description
技术领域
本发明涉及文档处理技术领域,特别涉及一种判断PPTX文档加密的处理方法及终端。
背景技术
PPTX文档是目前使用最为广泛的文档格式之一,文档在使用过程中无法避免复制的操作,这就对文档的安全性提出了要求,对于PPTX文档的加密也是用户保护文档的重要手段之一。目前对于PPTX文档是否是加密之后的PPTX文档,我们在没有使用PowerPoint或者WPS打开的情况下无法得知此文档是否是加密之后的PPTX文档,影响对文档的后续操作。
发明内容
本发明所要解决的技术问题是:提供一种判断PPTX文档加密的处理方法及终端,以判断使用的文档是否是加密文档,进而提醒用户提供密码以便对文档进行后续操作。
为了解决上述技术问题,本发明采用的技术方案为:
一种判断PPTX文档加密的处理方法,包括步骤:
获取待识别文件的前N个字节,遍历所述前N个字节以进行加密标识的正则匹配,若在所述前N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,所述加密标识包括依次排序的M个字节,所述N大于所述M。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种判断PPTX文档加密的处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待识别文件的前N个字节,遍历所述前N个字节以进行加密标识的正则匹配,若在所述前N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,所述加密标识包括依次排序的M个字节,所述N大于所述M。
本发明的有益效果在于:一种判断PPTX文档加密的处理方法及终端,在对待识别文件的前N个字节中进行加密标识的正则匹配,在匹配到相同顺序的加密标识,则判定为已加密PPTX文档,进而提醒用户提供密码以便对文档进行后续操作。
附图说明
图1为本发明实施例的一种判断PPTX文档加密的处理方法的流程示意图;
图2为本发明实施例的一种判断PPTX文档加密的处理终端的结构示意图。
标号说明:
1、一种判断PPTX文档加密的处理终端;2、处理器;3、存储器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种判断PPTX文档加密的处理方法,包括步骤:
获取待识别文件的前N个字节,遍历所述前N个字节以进行加密标识的正则匹配,若在所述前N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,所述加密标识包括依次排序的M个字节,所述N大于所述M。
其中,为了避免误解,对实施例中涉及到的已加密PPTX文档、非PPTX加密文档和未加密PPTX文档说明如下:已加密PPTX文档是指已经加密的PPTX文档。非PPTX加密文档是指并非是已经加密的PPTX文档,那有可能是未加密的PPTX文档,有可能是已加密或未加密的其他格式文档,比如已加密或未加密的word文档等等。未加密PPTX文档是指未进行加密的PPTX文档。
从上述描述可知,本发明的有益效果在于:在对待识别文件的前N个字节中进行加密标识的正则匹配,在匹配到相同顺序的加密标识,则判定为已加密PPTX文档,进而提醒用户提供密码以便对文档进行后续操作。
进一步地,在所述获取待识别文件的前N个字节之前还包括步骤:
S1、判断所述待识别文件的文档长度是否大于或等于32768字节,若是,则执行步骤S2,否则将所述待识别文件判定为非PPTX加密文档;
S2、获取所述待识别文件的前32个字节,判断所述前32个字节中的前两个字节是否依次为0xd0和0xcf,若不是,则为非PPTX加密文档,若是,则判断所述前32个字节中的第30个字节是否大于8且小于16,若是,则跳转至所述获取待识别文件的前N个字节,否则为非PPTX加密文档。
从上述描述可知,32768字节是已加密PPTX文档的最小文件长度,同时,只有前32个字节中的前两个字节依次为0xd0和0xcf,才有可能是已加密PPTX文档,因此,不符合上述要求的待识别文件必然不是已加密PPTX文档,而上述的判断基于长度和前32个字节的判断,相对于后续进行正则匹配的判断来说,更加快速,从而可以快速过滤掉明显不符合要求的待识别文件,以加快匹配效率,更快的得到判断结果。
进一步地,所述步骤S2中若前32个字节中的前两个字节不是依次为0xd0和0xcf,则为非PPTX加密文档之后还包括步骤:
若前32个字节中的前两个字节依次为0x50和0x4b,则将所述待识别文件由所述非PPTX加密文档修改为未加密PPTX文档。
从上述描述可知,由此,在前32个字节中的前两个字节不是依次为0xd0和0xcf,只知道待识别文件不是已加密PPTX文档,通过判断是否依次为0x50和0x4b,则可以进一步得到为未加密PPTX文档,从而区分已加密PPTX文档、未加密PPTX文档和非PPTX文档,以便对待识别文件的后续处理。
进一步地,在所述前N个字节中未匹配到同样顺序的所述加密标识之后还包括步骤:
S4、读取所述待识别文件的后N个字节,遍历所述后N个字节以进行加密标识的正则匹配,若在所述后N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,否则将所述待识别文件判定为非PPTX加密文档。
进一步地,所述N为32768,所述M为18,所述加密标识依次为0x45,0x00,0x6E,0x00,0x63,0x00,0x72,0x00,0x79,0x00,0x70,0x00,0x74,0x00,0x65,0x00,0x64,0x00。
从上述描述可知,对于已加密PPTX文档,根据文档内容具有不同的字节长度,在很多情况下,待识别文件的字节长度较长,明显要大于32768,如果整份文件都进行匹配,则会降低程序效率,分两次匹配仅仅只是匹配部分字节,加快匹配效率,以及只需要读取部分文件流,减少了文件流的读取,提高了读取效率,同时,PPTX加密文件的18字节的加密字节均处于前32768字节或者后32768内,因此,两次匹配方法适用于所有的PPTX加密文件,即在保证匹配准确率的基础上,加快匹配效率,提高了读取效率。
请参照图2,一种判断PPTX文档加密的处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待识别文件的前N个字节,遍历所述前N个字节以进行加密标识的正则匹配,若在所述前N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,所述加密标识包括依次排序的M个字节,所述N大于所述M。
从上述描述可知,本发明的有益效果在于:在对待识别文件的前N个字节中进行加密标识的正则匹配,在匹配到相同顺序的加密标识,则判定为已加密PPTX文档,进而提醒用户提供密码以便对文档进行后续操作。
进一步地,在所述获取待识别文件的前N个字节之前,所述处理器执行所述计算机程序时还实现以下步骤:
S1、判断所述待识别文件的文档长度是否大于或等于32768字节,若是,则执行步骤S2,否则将所述待识别文件判定为非PPTX加密文档;
S2、获取所述待识别文件的前32个字节,判断所述前32个字节中的前两个字节是否依次为0xd0和0xcf,若不是,则为非PPTX加密文档,若是,则判断所述前32个字节中的第30个字节是否大于8且小于16,若是,则跳转至所述获取待识别文件的前N个字节,否则为非PPTX加密文档。
从上述描述可知,32768字节是已加密PPTX文档的最小文件长度,同时,只有前32个字节中的前两个字节依次为0xd0和0xcf,才有可能是已加密PPTX文档,因此,不符合上述要求的待识别文件必然不是已加密PPTX文档,而上述的判断基于长度和前32个字节的判断,相对于后续进行正则匹配的判断来说,更加快速,从而可以快速过滤掉明显不符合要求的待识别文件,以加快匹配效率,更快的得到判断结果。
进一步地,所述步骤S2中若前32个字节中的前两个字节不是依次为0xd0和0xcf,则为非PPTX加密文档之后还包括步骤:
若前32个字节中的前两个字节依次为0x50和0x4b,则将所述待识别文件由所述非PPTX加密文档修改为未加密PPTX文档。
从上述描述可知,由此,在前32个字节中的前两个字节不是依次为0xd0和0xcf,只知道待识别文件不是已加密PPTX文档,通过判断是否依次为0x50和0x4b,则可以进一步得到为未加密PPTX文档,从而区分已加密PPTX文档、未加密PPTX文档和非PPTX文档,以便对待识别文件的后续处理。
进一步地,在所述前N个字节中未匹配到同样顺序的所述加密标识之后,所述处理器执行所述计算机程序时还实现以下步骤:
S4、读取所述待识别文件的后N个字节,遍历所述后N个字节以进行加密标识的正则匹配,若在所述后N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,否则将所述待识别文件判定为非PPTX加密文档。
进一步地,所述N为32768,所述M为18,所述加密标识依次为0x45,0x00,0x6E,0x00,0x63,0x00,0x72,0x00,0x79,0x00,0x70,0x00,0x74,0x00,0x65,0x00,0x64,0x00。
从上述描述可知,对于已加密PPTX文档,根据文档内容具有不同的字节长度,在很多情况下,待识别文件的字节长度较长,明显要大于32768字节,如果整份文件都进行匹配,则会降低程序效率,分两次匹配仅仅只是匹配部分字节,加快匹配效率,以及只需要读取部分文件流,减少了文件流的读取,提高了读取效率,同时,PPTX加密文件的18字节的加密字节均处于前32768字节或者后32768字节内,因此,两次匹配方法适用于所有的PPTX加密文件,即在保证匹配准确率的基础上,加快匹配效率,提高了读取效率。
请参照图1,本发明的实施例一为:
一种判断PPTX文档加密的处理方法,包括步骤:
S1、判断待识别文件的文档长度是否大于或等于32768字节,若是,则执行步骤S2,否则将待识别文件判定为非PPTX加密文档;
S2、获取待识别文件的前32个字节,判断前32个字节中的前两个字节是否依次为0xd0和0xcf,若不是,则为非PPTX加密文档,若是,则判断前32个字节中的第30个字节是否大于8且小于16,若是,则执行步骤S3,否则为非PPTX加密文档;
在本实施例中,若前32个字节中的前两个字节不是依次为0xd0和0xcf,则为非PPTX加密文档之后还包括步骤:
若前32个字节中的前两个字节依次为0x50和0x4b,则将待识别文件由非PPTX加密文档修改为未加密PPTX文档;
S3、获取待识别文件的前32768个字节,遍历前32768个字节以进行加密标识的正则匹配,若在前32768个字节中匹配到同样顺序的加密标识,则将待识别文件判定为已加密PPTX文档,否则执行步骤S4,其中,加密标识包括依次排序的18个字节:0x45,0x00,0x6E,0x00,0x63,0x00,0x72,0x00,0x79,0x00,0x70,0x00,0x74,0x00,0x65,0x00,0x64,0x00。
即在本实施例中,N为32768,M为18;
S4、读取待识别文件的后32768个字节,遍历后32768个字节以进行加密标识的正则匹配,若在后32768个字节中匹配到同样顺序的加密标识,则将待识别文件判定为已加密PPTX文档,否则将待识别文件判定为非PPTX加密文档。
由此,在判定为已加密PPTX文档,弹出窗口提醒用户提供密码以对已加密PPTX文档进行解密,从而使得程序可以获取PPTX文档里面的内容,以进行后续操作。
由此,本实施例通过文件长度和前32个字节的判断,快速过滤掉明显不符合要求的待识别文件,之后通过前32768字节和后32768字节的加密标识的正则匹配,以快速且准确的判断出是否为已加密PPTX文档。
请参照图2,本发明的实施例二为:
一种判断PPTX文档加密的处理终端1,包括存储器3、处理器2及存储在存储器3上并可在处理器2上运行的计算机程序,处理器2执行计算机程序时实现上述实施例一中的各个步骤。
综上所述,本发明提供的一种判断PPTX文档加密的处理方法及终端,通过文件长度和前32个字节的判断,快速过滤掉明显不符合要求的待识别文件,以加快匹配速度,之后在对待识别文件的前32768字节和后32768字节进行加密标识的正则匹配,从而在不使用PowerPoint或者是WPS等软件打开的情况下,快速且准确的判断出是否已加密PPTX文档,进而提醒用户提供密码以便对文档进行后续操作。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种判断PPTX文档加密的处理方法,其特征在于,包括步骤:
获取待识别文件的前N个字节,遍历所述前N个字节以进行加密标识的正则匹配,若在所述前N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,所述加密标识包括依次排序的M个字节,所述N大于所述M;
在所述获取待识别文件的前N个字节之前还包括步骤:
S1、判断所述待识别文件的文档长度是否大于或等于32768字节,若是,则执行步骤S2,否则将所述待识别文件判定为非PPTX加密文档;
S2、获取所述待识别文件的前32个字节,判断所述前32个字节中的前两个字节是否依次为0xd0和0xcf,若不是,则为非PPTX加密文档,若是,则判断所述前32个字节中的第30个字节是否大于8且小于16,若是,则跳转至所述获取待识别文件的前N个字节,否则为非PPTX加密文档。
2.根据权利要求1所述的一种判断PPTX文档加密的处理方法,其特征在于,所述步骤S2中若前32个字节中的前两个字节不是依次为0xd0和0xcf,则为非PPTX加密文档之后还包括步骤:
若前32个字节中的前两个字节依次为0x50和0x4b,则将所述待识别文件由所述非PPTX加密文档修改为未加密PPTX文档。
3.根据权利要求1所述的一种判断PPTX文档加密的处理方法,其特征在于,在所述前N个字节中未匹配到同样顺序的所述加密标识之后还包括步骤:
S4、读取所述待识别文件的后N个字节,遍历所述后N个字节以进行加密标识的正则匹配,若在所述后N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,否则将所述待识别文件判定为非PPTX加密文档。
4.根据权利要求1或3所述的一种判断PPTX文档加密的处理方法,其特征在于,所述N为32768,所述M为18,所述加密标识依次为0x45,0x00,0x6E,0x00,0x63,0x00,0x72,0x00,0x79,0x00,0x70,0x00,0x74,0x00,0x65,0x00,0x64,0x00。
5.一种判断PPTX文档加密的处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
获取待识别文件的前N个字节,遍历所述前N个字节以进行加密标识的正则匹配,若在所述前N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,所述加密标识包括依次排序的M个字节,所述N大于所述M;
在所述获取待识别文件的前N个字节之前,所述处理器执行所述计算机程序时还实现以下步骤:
S1、判断所述待识别文件的文档长度是否大于或等于32768字节,若是,则执行步骤S2,否则将所述待识别文件判定为非PPTX加密文档;
S2、获取所述待识别文件的前32个字节,判断所述前32个字节中的前两个字节是否依次为0xd0和0xcf,若不是,则为非PPTX加密文档,若是,则判断所述前32个字节中的第30个字节是否大于8且小于16,若是,则跳转至所述获取待识别文件的前N个字节,否则为非PPTX加密文档。
6.根据权利要求5所述的一种判断PPTX文档加密的处理终端,其特征在于,所述步骤S2中若前32个字节中的前两个字节不是依次为0xd0和0xcf,则为非PPTX加密文档之后还包括步骤:
若前32个字节中的前两个字节依次为0x50和0x4b,则将所述待识别文件由所述非PPTX加密文档修改为未加密PPTX文档。
7.根据权利要求5所述的一种判断PPTX文档加密的处理终端,其特征在于,在所述前N个字节中未匹配到同样顺序的所述加密标识之后,所述处理器执行所述计算机程序时还实现以下步骤:
S4、读取所述待识别文件的后N个字节,遍历所述后N个字节以进行加密标识的正则匹配,若在所述后N个字节中匹配到同样顺序的所述加密标识,则将所述待识别文件判定为已加密PPTX文档,否则将所述待识别文件判定为非PPTX加密文档。
8.根据权利要求5或7所述的一种判断PPTX文档加密的处理终端,其特征在于,所述N为32768,所述M为18,所述加密标识依次为0x45,0x00,0x6E,0x00,0x63,0x00,0x72,0x00,0x79,0x00,0x70,0x00,0x74,0x00,0x65,0x00,0x64,0x00。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010800660.3A CN112100631B (zh) | 2020-08-11 | 2020-08-11 | 一种判断pptx文档加密的处理方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010800660.3A CN112100631B (zh) | 2020-08-11 | 2020-08-11 | 一种判断pptx文档加密的处理方法及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112100631A CN112100631A (zh) | 2020-12-18 |
CN112100631B true CN112100631B (zh) | 2022-09-06 |
Family
ID=73752784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010800660.3A Active CN112100631B (zh) | 2020-08-11 | 2020-08-11 | 一种判断pptx文档加密的处理方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112100631B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114239028A (zh) * | 2021-12-20 | 2022-03-25 | 中国平安财产保险股份有限公司 | 一种数据处理方法、装置、计算机设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567670A (zh) * | 2011-12-28 | 2012-07-11 | 南京邮电大学 | 文件系统过滤驱动加密实现方法 |
CN104750675A (zh) * | 2015-04-01 | 2015-07-01 | 山东省计算中心(国家超级计算济南中心) | 一种未知格式加密文件的识别方法 |
CN111324901A (zh) * | 2020-02-19 | 2020-06-23 | 陈灿阳 | 一种用于创建和解密企业安全加密文件的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150319147A1 (en) * | 2014-05-01 | 2015-11-05 | Sunix Co., Ltd | System and method for file encrypting and decrypting |
CN106686407B (zh) * | 2016-12-13 | 2019-07-23 | 北京互动百科网络技术股份有限公司 | 一种用于视频数据传输的自动识别加密解密方法及系统 |
-
2020
- 2020-08-11 CN CN202010800660.3A patent/CN112100631B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567670A (zh) * | 2011-12-28 | 2012-07-11 | 南京邮电大学 | 文件系统过滤驱动加密实现方法 |
CN104750675A (zh) * | 2015-04-01 | 2015-07-01 | 山东省计算中心(国家超级计算济南中心) | 一种未知格式加密文件的识别方法 |
CN111324901A (zh) * | 2020-02-19 | 2020-06-23 | 陈灿阳 | 一种用于创建和解密企业安全加密文件的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112100631A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7835390B2 (en) | Network traffic identification by waveform analysis | |
US9792433B2 (en) | Method and device for detecting malicious code in an intelligent terminal | |
US11335213B2 (en) | Method and apparatus for encrypting data, method and apparatus for decrypting data | |
US20160104068A1 (en) | Match engine for detection of multi-pattern rules | |
CN110096433B (zh) | 一种iOS平台上获取加密数据的方法 | |
CN112100631B (zh) | 一种判断pptx文档加密的处理方法及终端 | |
CN110008719B (zh) | 一种文件处理、文件检测方法及装置 | |
CN103823751B (zh) | 一种基于特征注入的仿冒应用程序监测方法 | |
CN109117201B (zh) | 一种程序退出的方法及相关设备 | |
CN110071937B (zh) | 基于区块链的登录方法、系统及存储介质 | |
US9317707B2 (en) | Method and system for protecting a driver | |
US10296765B2 (en) | Multi-level security enforcement | |
CN113704794A (zh) | 电子招投标系统中的投标文件处理方法及装置 | |
CN109214179B (zh) | 一种程序模块安全检测方法及装置 | |
CN105939304A (zh) | 一种隧道报文解析方法及装置 | |
JP2015106914A (ja) | マルウェア通信解析装置、及びマルウェア通信解析方法 | |
CN115174160B (zh) | 基于流级和主机级的恶意加密流量分类方法及装置 | |
US20220345292A1 (en) | Method and device for encryption of video stream, communication equipment, and storage medium | |
CN111274459B (zh) | 一种防止ipa安装包重签名的方法及其终端 | |
CN114428953A (zh) | 一种windows软件的防注入方法及系统 | |
CN107798238A (zh) | 恶意应用的检测方法及装置 | |
CN114172670A (zh) | 授权方法、装置和系统 | |
CN110647760A (zh) | 一种脚本加密、执行方法及装置 | |
CN104537306A (zh) | 识别病毒文件的方法及装置 | |
Lin et al. | A method of multiple encryption and sectional encryption protocol reverse engineering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |