CN110929110A - 一种电子文档检测方法、装置、设备及存储介质 - Google Patents

一种电子文档检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110929110A
CN110929110A CN201911111230.4A CN201911111230A CN110929110A CN 110929110 A CN110929110 A CN 110929110A CN 201911111230 A CN201911111230 A CN 201911111230A CN 110929110 A CN110929110 A CN 110929110A
Authority
CN
China
Prior art keywords
file
consistency
detected
attribute
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911111230.4A
Other languages
English (en)
Other versions
CN110929110B (zh
Inventor
林皓
杨泳
宋海英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Linkdood Technologies SdnBhd
Original Assignee
Linkdood Technologies SdnBhd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Linkdood Technologies SdnBhd filed Critical Linkdood Technologies SdnBhd
Priority to CN201911111230.4A priority Critical patent/CN110929110B/zh
Publication of CN110929110A publication Critical patent/CN110929110A/zh
Application granted granted Critical
Publication of CN110929110B publication Critical patent/CN110929110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本申请提供一种电子文档检测方法、装置、设备及存储介质,涉及信息安全技术领域。该方法包括:读取待检测文件的属性信息;根据预设规则,在预设数据库匹配检测所述属性信息的一致性,获取属性一致性结果;根据所述属性一致性结果,获取文件检测结果。相对于现有技术,避免了现有技术中无法检测到电子文档中夹带的隐藏信息,从而造成泄密风险高的问题。

Description

一种电子文档检测方法、装置、设备及存储介质
技术领域
本申请涉及信息安全技术领域,具体而言,涉及一种电子文档检测方法、装置、设备及存储介质。
背景技术
在电子文档管理过程中,经常会出现人为或恶意软件把敏感内容隐藏在普通的文档附件中,对文档类型进行伪装、按照合法管理流程将文档携带出去。
现有技术中的电子文档检测方法中,通过对电子文档内容进行检测,判断电子文档内容中是否存在敏感内容或涉密信息。
但是这样的检测方法只能对电子文档的内容进行检测,若夹带者将涉密文件以夹带的方式隐藏在电子文档中,则通过建有技术的检测方法无法检测到该隐藏文件,从而会造成泄密的风险高。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种电子文档检测方法、装置、设备及存储介质,以解决现有技术中无法检测到电子文档中夹带的隐藏信息,从而造成泄密风险高的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请一实施例提供了一种电子文档检测方法,包括:
读取待检测文件的属性信息;
根据预设规则,在预设数据库匹配检测所述属性信息的一致性,获取属性一致性结果;
根据所述属性一致性结果,获取文件检测结果。
可选地,所述读取待检测文件的属性信息之前,还包括:
接收上传的文件数据;
根据文件层级,对所述文件数据进行剥离,获取至少一个子文件中符合待检测类型的所述待检测文件。
可选地,所述属性信息包括:文件头信息、文件参数信息;
所述根据预设规则,在预设数据库匹配检测所述属性信息的一致性,获取属性一致性结果,包括:
在预设数据库匹配检测所述文件头信息的一致性;
若所述文件头信息满足一致性,根据所述规则在所述数据库匹配依次检测所述文件参数信息的一致性,获取属性一致性结果。
可选地,所述在预设数据库匹配检测所述文件头信息的一致性之后,还包括:
若所述文件头信息不满足一致性,则确定所述待检测文件不满足一致性;或者,
若所述文件参数信息包含不满足一致性的文件参数信息,则确定所述待检测文件不满足一致性。
可选地,所述文件参数信息包括下述一项或多项:文件大小、文件密级、文件类型、文件元数据;其中,所述文件元数据包括下述一项或多项:数据规模、数据敏感度、数据结构。
可选地,所述根据所述属性一致性结果,获取文件检测结果之后,还包括:
根据所述文件检测结果,生成检测报表。
第二方面,本申请另一实施例提供了一种电子文档检测装置,所述装置包括:读取模块、检测模块和获取模块,其中:
所述读取模块,用于读取待检测文件的属性信息;
所述检测模块,用于根据预设规则,在预设数据库匹配检测所述属性信息的一致性,获取属性一致性结果;
所述获取模块,用于根据所述属性一致性结果,获取文件检测结果。
可选地,所述装置还包括:接收模块,用于接收上传的文件数据;
所述获取模块,还用于根据文件层级,对所述文件数据进行剥离,获取至少一个子文件中符合待检测类型的所述待检测文件。
可选地,所述属性信息包括:文件头信息、文件参数信息;
所述检测模块,还用于在预设数据库匹配检测所述文件头信息的一致性;
所述获取模块,若所述文件头信息满足一致性,根据所述规则在所述数据库匹配依次检测所述文件参数信息的一致性,获取属性一致性结果。
可选地,所述装置还包括:确定模块,用于若所述文件头信息不满足一致性,则确定所述待检测文件不满足一致性;或者,
若所述文件参数信息包含不满足一致性的文件参数信息,则确定所述待检测文件不满足一致性。
可选地,所述装置还包括:生成模块,用于根据所述文件检测结果,生成检测报表。
第三方面,本申请另一实施例提供了一种电子文档检测设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子文档检测设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述第一方面任一所述方法的步骤。
第四方面,本申请另一实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面任一所述方法的步骤。
本申请的有益效果是:预设数据库根据预设规则,对读取待检测文件的属性信息进行判断,判断属性信息的一致性,并根据一致性结果获取文件检测结果,通过一致性的判断,可以确定待检测文件是否违规,通过对违规文档的及时检测,从而降低文档资源泄露的风险。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的电子文档检测方法的流程示意图;
图2为本申请另一实施例提供的电子文档检测方法的流程示意图;
图3为本申请另一实施例提供的电子文档检测方法的流程示意图;
图4为本申请另一实施例提供的电子文档检测方法的流程示意图;
图5为本申请一实施例提供的电子文档检测装置的结构示意图;
图6为本申请另一实施例提供的电子文档检测装置的结构示意图;
图7为本申请另一实施例提供的电子文档检测装置的结构示意图;
图8为本申请另一实施例提供的电子文档检测装置的结构示意图;
图9为本申请一实施例提供的电子文档检测设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
本申请可适用于电子文档检测的实现场景,例如:需要对一个文档或文件夹进行分析检测,判断其是否符合预设规则,即是否是合规数据,本申请提供的电子文档检测方法由设备执行,该设备可以为计算机设备、服务器或其他类型的设备,具体设备类型根据用户需要设计,本申请在此不做任何限制。
图1为本申请一实施例提供的一种电子文档检测方法的流程示意图,如图1所示,该方法包括:
S101:读取待检测文件的属性信息。
待检测文件的文件类型可以为Office word、ppt、excel、Visio, WPS,PDF、RAR、ZIP、DWG、HTML、TXT、BMP、JPEG等任一主流文件类型,本申请在此不做任何限制。
其中,文件的属性信息可以是用来描述文件或指示文件某些特征的信息等,例如文件类型、文件名等,在此不具体限制。
S102:根据预设规则,在预设数据库匹配检测属性信息的一致性,获取属性一致性结果。
其中,预设规则为用户预先配置好的相关规则,在使用过程中可以根据用户的需要调整优化。预设规则可以用来说明如何进行一致性检测,例如什么信息匹配预设数据库的什么信息等。
其中,预设数据库在匹配过程中,根据预设规则逐一比对待检测文件的属性信息是否满足预设规则,并根据比对结果反馈一致性的检测结果:若满足则返回属性一致结果,若不满足则返回属性不一致结果。
S103:根据属性一致性结果,获取文件检测结果。
其中,文件检测结果用于表示当前待检测文件是否违规,若接收到的结果为属性一致,则确定当前待检测文件未违规,为安全文件;若接收到的结果为属性不一致,则确定当前待检测文件违规,为夹带文件。
本实施例中,预设数据库根据预设规则,对读取待检测文件的属性信息进行判断,判断属性信息的一致性,并根据一致性结果获取文件检测结果,通过一致性的判断,可以确定待检测文件是否违规,通过对违规文档的及时检测,从而降低文档资源泄露的风险。
图2为本申请另一实施例提供的电子文档检测方法的流程示意图,如图2所示,S101之前,还包括:
S104:接收上传的文件数据。
其中,文件数据为用户选择的需要检测的文件或文件夹,选择操作可以为用户通过鼠标在多个文件或文件夹中勾选的,也可以为用户通过触屏的方式在多个文件或者文件夹中选择的,具体选择方式可以根据用户需要设计,本申请在此不做任何限制。
S105:根据文件层级,对文件数据进行剥离,获取至少一个子文件中符合待检测类型的待检测文件。
其中,对文件数据进行逐层提取与剥离,是为了对文件数据的一致性进行检查,判断文档中是否存在隐藏信息。
其中,若夹带者在一个word文档中,插入一个对象(例如:压缩文件.rar文件)并且把这个压缩文件隐藏,我们在打开这个文件的时候是看不到这个压缩文件的,所以在检查时,我们需要对接收的文件数据进行剥离后按照文件层级逐层检查。举例说明:若当前文件数据为文件夹或压缩文件,则会对文件数据进行逐层提取文件,并对逐层提取的每个文件进行分析检查;若当前文件数据为一个文件,但文件中有其他文件嵌入时,也需要逐层提取信息,不仅是提取外层文件信息,对嵌入的文件信息也会提取分析。
例如:文件数据为压缩包时,会将该压缩包打开后,对压缩包内的每个文件进行分析:获取到每个文件后,读取分析每个文件,判断当前文件内是否存在夹带文件,若不存在,则获取下一个文件进行读取分析;若存在,则获取夹带文件,并对夹带文件进行逐层提取剥离与分析。
可选地,属性信息包括:文件头信息、文件参数信息。
其中,文件头信息用于表示当前文件的文件类型,例如:jpg格式的文件文件头由16进制组成FFD8FF;pdf格式的文件文件头是%PDF-1。文件参数信息包括下述一项或多项:文件大小、文件密级、文件类型、文件元数据;其中,文件元数据包括下述一项或多项:数据规模、数据敏感度、数据结构。
图3为本申请另一实施例提供的电子文档检测方法的流程示意图,如图3所示,S102包括:
S106:在预设数据库匹配检测文件头信息的一致性。
在本申请的一个实施例中,预设规则将不同类型的文件对应的文件头结构作为一个规则,对当前待检测文件的文件头信息进行分析判断,判断当前待检测文件的文件头信息是否与文件主体信息一致,例如:若夹带者在pdf文件中夹带一张图片,在对该pdf文件进行判断时,该文件的文件头还是%PDF-1格式,但是文件主体却不是该文件头信息对应的文件主体,而是文件主体中有一个文件头FFD8FF的文件信息,即表示文件头信息与文件主体内容不一致,则该pdf文件就是一个违规文件。
S107:若文件头信息满足一致性,根据规则在数据库依次匹配检测文件参数信息的一致性,获取属性一致性结果。
可选地,在本申请的一个实施例中,若文件头信息不满足一致性,则确定待检测文件不满足一致性,则直接返回不满足一致性的结果,即当前待检测文件为夹带文件;若文件头信息满足一致性,但文件参数信息包含不满足一致性的文件参数信息,则确定待检测文件不满足一致性;若文件头信息和文件参数信息均满足一致性结果,则返回满足一致性的结果,即当前待检测文件为安全文件。
其中,若上传的文件数据中,剥离后的每一个待检测文件均为安全文件,则该文件数据为安全文件数据;如剥离后的待检测文件中,存在至少一个待检测文件为夹带文件,则该文件数据为夹带数据。
可选地,在本申请的一个实施例中,若待检测文件的文件头信息满足一致性,可进一步对待检测文件的文档内容进行编码转换,并对转换后的全文信息进行检索,判断是否存在敏感信息,若存在,则发出告警指令,指示当前待检测文件中存在敏感信息;若不存在,则认为该待检测文件为安全文件。
采用本申请提供的电子文档检测方法,对获取的文件数据的剥离,获取至少一个待检测文件,分别对至少一个待检测文件进行深度检查,通过对待检测文件的文件头信息和文件参数信息的逐一对比,从而确定文件数据中是否存在夹带现象,从而降低文档资源泄露的风险。
图4为本申请另一实施例提供的电子文档检测方法的流程示意图,如图4所示,S103之后,该方法还包括:
S108:根据文件检测结果,生成检测报表。
可选地,可以对未通过检测的文件数据生成检测报表;也可以对所有文件数据均生成检测报表;其中,检测报表中可以包括接收的上传文件数据的标识,检测结果、异常信息等;异常信息可包括:文件数据中的异常文件的标识、异常类型及异常位置;具体检测报表的生成方式,以及检测报表中包括的内容可以根据用户需要设计,本申请在此不做任何限制。
可选地,在本申请的一个实施例中,未通过检测的文件不但会生成检测报表,同时对该未通过检测的文件进行预警,预警可以为语音预警或文字预警,本申请在此不做任何限制。
采用本申请提供的电子文档检测方法,通过对文档文件头一致性的检查、文档内容的提取与敏感信息分析、文档参数信息一致性检查、文档元数据解析和深度分析并根据分析结果,生成检测报表,从而实现文档异常信息定位分析等,识别异常的文档或文件夹,从而减低文档或文件夹资源泄露的风险。
图5为本申请一实施例提供的电子文档检测装置的结构示意图,如图5所示,该装置包括:读取模块201、检测模块202和获取模块203,其中:
读取模块201,用于读取待检测文件的属性信息。
检测模块202,用于根据预设规则,在预设数据库匹配检测属性信息的一致性,获取属性一致性结果。
获取模块203,用于根据属性一致性结果,获取文件检测结果。
图6为本申请另一实施例提供的电子文档检测装置的结构示意图,如图6所示,该装置还包括:接收模块204,用于接收上传的文件数据。
获取模块203,还用于根据文件层级,对所述文件数据进行剥离,获取至少一个子文件中符合待检测类型的所述待检测文件。
可选地,属性信息包括:文件头信息、文件参数信息;
检测模块202,还用于在预设数据库匹配检测文件头信息的一致性。
获取模块203,若文件头信息满足一致性,根据规则在数据库匹配依次检测文件参数信息的一致性,获取属性一致性结果。
图7为本申请另一实施例提供的电子文档检测装置的结构示意图,如图7所示,该装置还包括:确定模块205,用于若文件头信息不满足一致性,则确定待检测文件不满足一致性;或者,若文件参数信息包含不满足一致性的文件参数信息,则确定待检测文件不满足一致性。
图8为本申请另一实施例提供的电子文档检测装置的结构示意图,如图8所示,该装置还包括:生成模块206,用于根据所述文件检测结果,生成检测报表。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图9为本申请一实施例提供的电子文档检测设备的结构示意图,该电子文档检测设备可以集成于终端设备或者终端设备的芯片。
该电子文档检测设备包括:处理器501、存储介质502和总线 503。
处理器501用于存储程序,处理器501调用存储介质502存储的程序,以执行上述图1-图5对应的方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种程序产品,例如存储介质,该存储介质上存储有计算机程序,包括程序,该程序在被处理器运行时执行上述方法对应的实施例。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种电子文档检测方法,其特征在于,包括:
读取待检测文件的属性信息;
根据预设规则,在预设数据库匹配检测所述属性信息的一致性,获取属性一致性结果;
根据所述属性一致性结果,获取文件检测结果。
2.根据权利要求1所述的方法,其特征在于,所述读取待检测文件的属性信息之前,还包括:
接收上传的文件数据;
根据文件层级,对所述文件数据进行剥离,获取至少一个子文件中符合待检测类型的所述待检测文件。
3.根据权利要求1所述的方法,其特征在于,所述属性信息包括:文件头信息、文件参数信息;
所述根据预设规则,在预设数据库匹配检测所述属性信息的一致性,获取属性一致性结果,包括:
在预设数据库匹配检测所述文件头信息的一致性;
若所述文件头信息满足一致性,根据所述规则在所述数据库匹配依次检测所述文件参数信息的一致性,获取属性一致性结果。
4.根据权利要求3所述的方法,其特征在于,所述在预设数据库匹配检测所述文件头信息的一致性之后,还包括:
若所述文件头信息不满足一致性,则确定所述待检测文件不满足一致性;或者,
若所述文件参数信息包含不满足一致性的文件参数信息,则确定所述待检测文件不满足一致性。
5.根据权利要求3或4所述的方法,其特征在于,所述文件参数信息包括下述一项或多项:文件大小、文件密级、文件类型、文件元数据;其中,所述文件元数据包括下述一项或多项:数据规模、数据敏感度、数据结构。
6.根据权利要求1所述的方法,其特征在于,所述根据所述属性一致性结果,获取文件检测结果之后,还包括:
根据所述文件检测结果,生成检测报表。
7.一种电子文档检测装置,其特征在于,所述装置包括:读取模块、检测模块和获取模块,其中:
所述读取模块,用于读取待检测文件的属性信息;
所述检测模块,用于根据预设规则,在预设数据库匹配检测所述属性信息的一致性,获取属性一致性结果;
所述获取模块,用于根据所述属性一致性结果,获取文件检测结果。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:接收模块,用于接收上传的文件数据;
所述获取模块,还用于根据文件层级,对所述文件数据进行剥离,获取至少一个子文件中符合待检测类型的所述待检测文件。
9.一种电子文档检测设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子文档检测设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述权利要求1-6任一所述方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述权利要求1-6任一所述方法的步骤。
CN201911111230.4A 2019-11-13 2019-11-13 一种电子文档检测方法、装置、设备及存储介质 Active CN110929110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911111230.4A CN110929110B (zh) 2019-11-13 2019-11-13 一种电子文档检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911111230.4A CN110929110B (zh) 2019-11-13 2019-11-13 一种电子文档检测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110929110A true CN110929110A (zh) 2020-03-27
CN110929110B CN110929110B (zh) 2023-02-21

Family

ID=69853946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911111230.4A Active CN110929110B (zh) 2019-11-13 2019-11-13 一种电子文档检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110929110B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417501A (zh) * 2020-11-18 2021-02-26 中国电子科技集团公司第三十研究所 基于区块链的外网涉密文件检测方法
CN114443000A (zh) * 2022-02-28 2022-05-06 智汇(中山)信息技术有限公司 一种基于互联网+的软件工程开发系统
CN116383148A (zh) * 2023-05-26 2023-07-04 北京网智易通科技有限公司 电子档案的可读性检测方法、装置及设备

Citations (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0280866A2 (en) * 1987-03-03 1988-09-07 International Business Machines Corporation Computer method for automatic extraction of commonly specified information from business correspondence
CN1567255A (zh) * 2003-09-02 2005-01-19 四川大学 一种安全文件系统的存储及访问控制方法
CN1770051A (zh) * 2004-11-04 2006-05-10 华为技术有限公司 一种文件安全检测方法
US20070214189A1 (en) * 2006-03-10 2007-09-13 Motorola, Inc. System and method for consistency checking in documents
WO2009147855A1 (ja) * 2008-06-03 2009-12-10 株式会社 日立製作所 ファイル管理システム
US20100005386A1 (en) * 2007-11-27 2010-01-07 Accenture Global Services Gmbh Document analysis, commenting, and reporting system
WO2010004282A1 (en) * 2008-07-11 2010-01-14 Ingenia Holdings (Uk) Limited Authentication scanner
WO2010012175A1 (zh) * 2008-07-31 2010-02-04 华为技术有限公司 一种文件检测方法和装置
JP2010136141A (ja) * 2008-12-05 2010-06-17 Ricoh Co Ltd 文書処理システムおよび文書処理方法
CN102411523A (zh) * 2011-11-30 2012-04-11 广东威创视讯科技股份有限公司 文件备份存储方法、装置及其文件系统备份方法
CN102571767A (zh) * 2011-12-24 2012-07-11 成都市华为赛门铁克科技有限公司 文件类型识别方法及文件类型识别装置
CN102609654A (zh) * 2012-02-08 2012-07-25 北京百度网讯科技有限公司 一种检测恶意flash文件的方法和装置
CN102609515A (zh) * 2012-02-07 2012-07-25 奇智软件(北京)有限公司 一种文件快速扫描方法和系统
CN103347092A (zh) * 2013-07-22 2013-10-09 星云融创(北京)信息技术有限公司 一种识别缓存文件的方法及装置
CN103353871A (zh) * 2013-05-31 2013-10-16 国家电网公司 一种基于cim/g标准的互操作图形文件校验方法
CN103617401A (zh) * 2013-11-25 2014-03-05 北京深思数盾科技有限公司 一种数据文件保护方法及装置
CN103701821A (zh) * 2013-12-31 2014-04-02 北京网康科技有限公司 文件类型识别方法及装置
CN103927385A (zh) * 2014-04-25 2014-07-16 国家电网公司 数据模型的统一方法及装置
CN104102861A (zh) * 2014-07-16 2014-10-15 中山大学 一种基于文件头和压缩参数的jpeg图片原始性检测方法
CN104281814A (zh) * 2013-07-03 2015-01-14 钟丹东 文件防泄密系统及其工作方法
CN105046159A (zh) * 2015-06-18 2015-11-11 中国科学院信息工程研究所 基于修改标识符的oox文本文档隐私信息检测方法
CN105868171A (zh) * 2015-01-21 2016-08-17 中国移动(深圳)有限公司 一种Excel文件的校验方法及装置
CN106126367A (zh) * 2016-06-28 2016-11-16 湖北锐世数字医学影像科技有限公司 一种文件的自校验方法及系统
CN106227852A (zh) * 2016-07-28 2016-12-14 中国石油天然气集团公司 地震勘探成果数据文件的识别方法和装置
CN106250777A (zh) * 2016-07-26 2016-12-21 合肥赛猊腾龙信息技术有限公司 数据防泄露系统中一种文档指纹提取及匹配方法
CN106919811A (zh) * 2015-12-24 2017-07-04 阿里巴巴集团控股有限公司 文件检测方法和装置
US9746985B1 (en) * 2008-02-25 2017-08-29 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
CN107168762A (zh) * 2017-05-23 2017-09-15 北京航空航天大学 一种基于本体的rucm模型一致性检查方法
CN107590233A (zh) * 2017-09-07 2018-01-16 郑州云海信息技术有限公司 一种文件管理方法及装置
CN107609422A (zh) * 2017-09-29 2018-01-19 维沃移动通信有限公司 一种文件管理方法及移动终端
CN108985073A (zh) * 2018-07-18 2018-12-11 成都链安科技有限公司 一种高度自动化的智能合约形式化验证系统及方法
CN109190724A (zh) * 2018-07-02 2019-01-11 链家网(北京)科技有限公司 一种电子扫描文件的校验方法及电子设备
CN109194739A (zh) * 2018-09-03 2019-01-11 中国平安人寿保险股份有限公司 一种文件上传方法、存储介质和服务器
CN109241780A (zh) * 2018-09-05 2019-01-18 郑州云海信息技术有限公司 一种图像隐藏信息的检测方法、装置及设备
CN109582861A (zh) * 2018-10-29 2019-04-05 复旦大学 一种数据隐私信息检测系统
CN109871685A (zh) * 2019-02-19 2019-06-11 腾讯科技(深圳)有限公司 一种rtf文件的解析方法及装置
CN109960932A (zh) * 2017-12-22 2019-07-02 北京安天网络安全技术有限公司 文件检测方法、装置和终端设备
CN110096889A (zh) * 2019-04-18 2019-08-06 深圳前海微众银行股份有限公司 文件检测方法、装置、设备及计算机可读存储介质
CN110134644A (zh) * 2019-05-17 2019-08-16 成都卫士通信息产业股份有限公司 文件类型识别方法、装置、电子设备及可读存储介质
WO2019184664A1 (zh) * 2018-03-26 2019-10-03 华为技术有限公司 恶意文件的检测方法、设备和系统

Patent Citations (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0280866A2 (en) * 1987-03-03 1988-09-07 International Business Machines Corporation Computer method for automatic extraction of commonly specified information from business correspondence
CN1567255A (zh) * 2003-09-02 2005-01-19 四川大学 一种安全文件系统的存储及访问控制方法
CN1770051A (zh) * 2004-11-04 2006-05-10 华为技术有限公司 一种文件安全检测方法
US20070214189A1 (en) * 2006-03-10 2007-09-13 Motorola, Inc. System and method for consistency checking in documents
US20100005386A1 (en) * 2007-11-27 2010-01-07 Accenture Global Services Gmbh Document analysis, commenting, and reporting system
US9746985B1 (en) * 2008-02-25 2017-08-29 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
WO2009147855A1 (ja) * 2008-06-03 2009-12-10 株式会社 日立製作所 ファイル管理システム
WO2010004282A1 (en) * 2008-07-11 2010-01-14 Ingenia Holdings (Uk) Limited Authentication scanner
WO2010012175A1 (zh) * 2008-07-31 2010-02-04 华为技术有限公司 一种文件检测方法和装置
JP2010136141A (ja) * 2008-12-05 2010-06-17 Ricoh Co Ltd 文書処理システムおよび文書処理方法
CN102411523A (zh) * 2011-11-30 2012-04-11 广东威创视讯科技股份有限公司 文件备份存储方法、装置及其文件系统备份方法
CN102571767A (zh) * 2011-12-24 2012-07-11 成都市华为赛门铁克科技有限公司 文件类型识别方法及文件类型识别装置
CN102609515A (zh) * 2012-02-07 2012-07-25 奇智软件(北京)有限公司 一种文件快速扫描方法和系统
CN102609654A (zh) * 2012-02-08 2012-07-25 北京百度网讯科技有限公司 一种检测恶意flash文件的方法和装置
CN103353871A (zh) * 2013-05-31 2013-10-16 国家电网公司 一种基于cim/g标准的互操作图形文件校验方法
CN104281814A (zh) * 2013-07-03 2015-01-14 钟丹东 文件防泄密系统及其工作方法
CN103347092A (zh) * 2013-07-22 2013-10-09 星云融创(北京)信息技术有限公司 一种识别缓存文件的方法及装置
CN103617401A (zh) * 2013-11-25 2014-03-05 北京深思数盾科技有限公司 一种数据文件保护方法及装置
CN103701821A (zh) * 2013-12-31 2014-04-02 北京网康科技有限公司 文件类型识别方法及装置
CN103927385A (zh) * 2014-04-25 2014-07-16 国家电网公司 数据模型的统一方法及装置
CN104102861A (zh) * 2014-07-16 2014-10-15 中山大学 一种基于文件头和压缩参数的jpeg图片原始性检测方法
CN105868171A (zh) * 2015-01-21 2016-08-17 中国移动(深圳)有限公司 一种Excel文件的校验方法及装置
CN105046159A (zh) * 2015-06-18 2015-11-11 中国科学院信息工程研究所 基于修改标识符的oox文本文档隐私信息检测方法
CN106919811A (zh) * 2015-12-24 2017-07-04 阿里巴巴集团控股有限公司 文件检测方法和装置
CN106126367A (zh) * 2016-06-28 2016-11-16 湖北锐世数字医学影像科技有限公司 一种文件的自校验方法及系统
CN106250777A (zh) * 2016-07-26 2016-12-21 合肥赛猊腾龙信息技术有限公司 数据防泄露系统中一种文档指纹提取及匹配方法
CN106227852A (zh) * 2016-07-28 2016-12-14 中国石油天然气集团公司 地震勘探成果数据文件的识别方法和装置
CN107168762A (zh) * 2017-05-23 2017-09-15 北京航空航天大学 一种基于本体的rucm模型一致性检查方法
CN107590233A (zh) * 2017-09-07 2018-01-16 郑州云海信息技术有限公司 一种文件管理方法及装置
CN107609422A (zh) * 2017-09-29 2018-01-19 维沃移动通信有限公司 一种文件管理方法及移动终端
CN109960932A (zh) * 2017-12-22 2019-07-02 北京安天网络安全技术有限公司 文件检测方法、装置和终端设备
WO2019184664A1 (zh) * 2018-03-26 2019-10-03 华为技术有限公司 恶意文件的检测方法、设备和系统
CN109190724A (zh) * 2018-07-02 2019-01-11 链家网(北京)科技有限公司 一种电子扫描文件的校验方法及电子设备
CN108985073A (zh) * 2018-07-18 2018-12-11 成都链安科技有限公司 一种高度自动化的智能合约形式化验证系统及方法
CN109194739A (zh) * 2018-09-03 2019-01-11 中国平安人寿保险股份有限公司 一种文件上传方法、存储介质和服务器
CN109241780A (zh) * 2018-09-05 2019-01-18 郑州云海信息技术有限公司 一种图像隐藏信息的检测方法、装置及设备
CN109582861A (zh) * 2018-10-29 2019-04-05 复旦大学 一种数据隐私信息检测系统
CN109871685A (zh) * 2019-02-19 2019-06-11 腾讯科技(深圳)有限公司 一种rtf文件的解析方法及装置
CN110096889A (zh) * 2019-04-18 2019-08-06 深圳前海微众银行股份有限公司 文件检测方法、装置、设备及计算机可读存储介质
CN110134644A (zh) * 2019-05-17 2019-08-16 成都卫士通信息产业股份有限公司 文件类型识别方法、装置、电子设备及可读存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
L. POLAK: "SENDING HIDDEN DATA THROUGH WWW PAGES:DETECTION AND PREVENTION", 《ENGINEERING TRANSACTIONS》 *
林意: "基于无损水印的DICOM文件头信息篡改检测", 《计算机工程》 *
葛长涛: "Win32 PE文件病毒行为分析与检测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
谢焕雨: "基于文档信息抽取的信息泄漏检测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417501A (zh) * 2020-11-18 2021-02-26 中国电子科技集团公司第三十研究所 基于区块链的外网涉密文件检测方法
CN114443000A (zh) * 2022-02-28 2022-05-06 智汇(中山)信息技术有限公司 一种基于互联网+的软件工程开发系统
CN116383148A (zh) * 2023-05-26 2023-07-04 北京网智易通科技有限公司 电子档案的可读性检测方法、装置及设备
CN116383148B (zh) * 2023-05-26 2023-09-12 北京网智易通科技有限公司 电子档案的可读性检测方法、装置及设备

Also Published As

Publication number Publication date
CN110929110B (zh) 2023-02-21

Similar Documents

Publication Publication Date Title
US10476908B2 (en) Generating highly realistic decoy email and documents
CN110929110B (zh) 一种电子文档检测方法、装置、设备及存储介质
CN111460446B (zh) 基于模型的恶意文件检测方法及装置
CN103064987B (zh) 一种虚假交易信息识别方法
CN111310205A (zh) 敏感信息的检测方法、装置、计算机设备和存储介质
CN105718795B (zh) Linux下基于特征码的恶意代码取证方法及系统
CN107844409A (zh) 测试用例执行方法和装置
WO2014131306A1 (en) Method and system for detecting network link
US20200125532A1 (en) Fingerprints for open source code governance
CN111460447B (zh) 恶意文件检测方法、装置、电子设备与存储介质
CN112615873A (zh) 物联网设备安全检测方法、设备、存储介质及装置
CN111274149A (zh) 测试数据的处理方法及装置
CN113506045A (zh) 基于移动设备的风险用户识别方法、装置、设备及介质
US9332031B1 (en) Categorizing accounts based on associated images
CN115809466B (zh) 基于stride模型的安全需求生成方法、装置、电子设备及介质
US9027144B1 (en) Semantic-based business events
CN109409091B (zh) 检测Web页面的方法、装置、设备以及计算机存储介质
CN114817518B (zh) 基于大数据档案识别的证照办理方法、系统及介质
CN110598115A (zh) 一种基于人工智能多引擎的敏感网页识别方法及系统
CN111191235A (zh) 可疑文件分析方法、装置和计算机可读存储介质
CN113472686B (zh) 信息识别方法、装置、设备及存储介质
CN108021951A (zh) 一种文档检测的方法、服务器及计算机可读存储介质
CN114511854A (zh) 一种合同规范性的审核方法、装置、设备和介质
CN111444144A (zh) 文件特征提取方法及装置
CN109558418A (zh) 一种自动识别信息的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200327

Assignee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Assignor: BEIJING VRV SOFTWARE Corp.,Ltd.

Contract record no.: X2023110000147

Denomination of invention: An electronic document detection method, device, device, and storage medium

Granted publication date: 20230221

License type: Exclusive License

Record date: 20231201

EE01 Entry into force of recordation of patent licensing contract
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An electronic document detection method, device, device, and storage medium

Effective date of registration: 20231206

Granted publication date: 20230221

Pledgee: CHINA TECHNOLOGY EXCHANGE Co.,Ltd.

Pledgor: BEIJING VRV SOFTWARE Corp.,Ltd.

Registration number: Y2023110000520

PE01 Entry into force of the registration of the contract for pledge of patent right