CN112650956A - Excel文档追踪方法、系统、电子设备及存储介质 - Google Patents

Excel文档追踪方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN112650956A
CN112650956A CN202110013802.6A CN202110013802A CN112650956A CN 112650956 A CN112650956 A CN 112650956A CN 202110013802 A CN202110013802 A CN 202110013802A CN 112650956 A CN112650956 A CN 112650956A
Authority
CN
China
Prior art keywords
excel document
tracking
watermark
tracked
excel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110013802.6A
Other languages
English (en)
Inventor
陈志国
陈宇
胡晓斌
凌云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Technology Shanghai Co Ltd filed Critical Ctrip Travel Information Technology Shanghai Co Ltd
Priority to CN202110013802.6A priority Critical patent/CN112650956A/zh
Publication of CN112650956A publication Critical patent/CN112650956A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种Excel文档追踪方法、系统、电子设备及存储介质,该方法包括以下步骤:S100待追踪Excel文档中植入追踪水印,以及根据追踪水印追踪待追踪Excel文档;S100步骤包括:获取待追踪Excel文档;解压缩待追踪Excel文档获得sheet数据包和功能文件夹;在功能性文件夹中创建追踪水印;获取一sheet表并在sheet表中嵌入追踪水印;将嵌入追踪水印的sheet表保存至sheet数据包;将sheet数据包和功能文件夹压缩获得植入有追踪水印的待追踪Excel文档。本发明的追踪方法能够在较短时间内完成文档泄密的溯源。

Description

Excel文档追踪方法、系统、电子设备及存储介质
技术领域
本发明涉及互联网领域,具体地说,涉及一种Excel文档追踪方法、系统、电子设备及存储介质。
背景技术
目前,Excel文档被广泛用于报表数据的存储和展示,应用大多采用基于Apache开源POI组件实现Excel文档的生成。常见的文件追踪方式有添加文件的创建者、在文件的背景中嵌入水印等。文件下载时设置文件创建人的方式容易被发现和修改,不利于文件泄漏时的溯源,很难保证最后追查到的源头的真实性;在文件背景中添加水印的方式也容易被发现和被消除。
传统的明水印防护系统仅能针对系统页面等形式的泄密进行溯源,无法针对以文件形式的泄密方式进行溯源。目前公司针对Excel文档形式的泄密缺乏有效和快速的追踪方式,采用传统的人工溯源方式,不仅难度大,且工作低效。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明的目的在于提供了一种Excel文档追踪方法、系统、电子设备及存储介质,所述Excel文档追踪方法通过对Excel文档嵌入带有唯一标识的隐藏水印,并在文档被打开时回传唯一标识,如发现文件被泄密时,能够根据文件打开轨迹在较短时间内完成文档泄密的溯源工作,降低运营人员的工作难度,提高文件泄密溯源的速度和准确性,有效预防商业敏感文件泄露,保护公司商业数据资产安全。
本发明的一些实施例提供了一种Excel文档追踪方法,包括以下步骤:
S100:待追踪Excel文档中植入追踪水印,以及
S200:根据所述追踪水印追踪所述待追踪Excel文档;
所述S100步骤包括:
S110:获取待追踪Excel文档;
S120:解压缩所述待追踪Excel文档获得sheet数据包和功能文件夹;
S130:在所述功能性文件夹中创建追踪水印;
S140:获取一sheet表并在所述sheet表中嵌入所述追踪水印;
S150:将嵌入所述追踪水印的所述sheet表保存至所述sheet数据包;
S160:将所述sheet数据包和功能文件夹压缩获得植入有所述追踪水印的待追踪Excel文档。
根据本发明的一些示例,所述获取待追踪Excel文档步骤后,还包括如下步骤:
判断所述待追踪Excel文档是否大于一阈值;
如果所述待追踪Excel文档大于所述阈值,则所述S120步骤中解压缩所述待追踪Excel文档获得压缩状态的sheet数据包和功能文件夹;
所述S140步骤包括创建一新的sheet表;
获取新的sheet表并在所述sheet表中嵌入所述追踪水印;
所述S150步骤为将嵌入所述追踪水印的新的sheet表保存至所述sheet数据包的压缩包。
根据本发明的一些示例,所述获取待追踪Excel文档步骤后,还包括如下步骤:
如果所述待追踪Excel文档不大于所述阈值,则所述S120步骤中解压缩所述待追踪Excel文档获得解压缩状态的sheet数据包和功能文件夹;
所述S140步骤为从所述解压缩状态的sheet数据包中选择一sheet表并在所述sheet表中嵌入所述追踪水印;
所述S150步骤为将嵌入所述追踪水印的所述sheet表保存。
根据本发明的一些示例,所述功能文件夹至少包括xl文件夹,所述S130步骤包括:
S131:在所述xl文件夹的drawings文件夹中创建一所述追踪水印的内容,所述追踪水印的内容为一图片;
S132:在drawings/_rels/drawing1.xml.rels文件中添加所述图片的引用关系,并将所述图片的对象属性设置为URL链接,所述URL链接携带的信息参数包括一URL地址信息,所述URL地址信息为Excel文档追踪系统的信息收集接口的地址信息;以及将所述图片的对象模式属性设置为“External”;
所述S140步骤中的在所述sheet表中嵌入所述追踪水印为在所述sheet表中添加所述图片的引用关系。
根据本发明的一些示例,所述URL链接携带的信息参数还包括一URL字符串,所述URL字符串包含根据所述待追踪Excel文档生成的随机字符串。
根据本发明的一些示例,所述功能文件夹还包括docpProps文件,所述方法还包括以下步骤:
在docpProps文件夹中创建一个custom.xml文件,在所述custom.xml文件中添加自定义内容。
根据本发明的一些示例,所述Excel文档追踪方法还包括以下步骤:
判断是否监测到触发操作;
如监测到,则触发所述S100步骤。
根据本发明的一些示例,所述触发操作包括调用SDK接口操作或调用API接口操作。
根据本发明的一些示例,所述S200步骤包括:
Excel文档追踪系统的信息收集接口接收URL回传信息,所述URL回传信息包括URL字符串;
根据所述URL字符串确定待追踪Excel文档。
本发明的一些实施例还提供了一种Excel文档追踪系统,用于实现所述Excel文档追踪方法,包括水印植入模块和水印追踪模块,其中:
所述水印植入模块用于执行所述S100步骤:待追踪Excel文档中植入追踪水印,以及
所述水印追踪模块用于执行所述S200步骤:根据所述追踪水印追踪所述待追踪Excel文档;
S110:获取待追踪Excel文档;
S120:解压缩所述待追踪Excel文档获得sheet数据包和功能文件夹;
S130:在所述功能性文件夹中创建追踪水印;
S140:获取一sheet表并在所述sheet表中嵌入所述追踪水印;
S150:将嵌入所述追踪水印的所述sheet表保存至所述sheet数据包;
S160:将所述sheet数据包和功能文件夹压缩获得植入有所述追踪水印的待追踪Excel文档。
本发明的实施例还提供了一种电子设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行所述Excel文档追踪方法的步骤。
本发明的实施例还提供了一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现所述Excel文档追踪方法的步骤。
本发明的Excel文档追踪方法根据Excel文档的组成原理和Office Open XMLFile Formats规范,针对Excel文档提出了嵌入隐藏的追踪水印的方法,当嵌入有追踪水印的Excel文档被打开时,文档将自动向特定的URL地址发起请求,回传水印携带的该Excel文档的唯一标识或者其他相关信息,从而实现Excel文档打开轨迹的追踪;当文件发生泄密时,能够根据文件打开轨迹在较短时间内完成泄密的溯源工作,从而降低运营人员的工作难度,提高文件泄密溯源的速度和准确性,有效预防商业敏感文件泄露,保护公司商业数据资产安全。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例的Excel文档追踪方法的流程图;
图2为本发明一实施例的Excel文档追踪系统的结构示意图;
图3为本发明一实施例的电子设备的结构示意图;
图4为本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1为本发明一实施例的Excel文档追踪方法的流程图,具体地,所述Excel文档追踪方法包括以下步骤:
S100:待追踪Excel文档中植入追踪水印,以及
S200:根据所述追踪水印追踪所述待追踪Excel文档;
所述S100步骤包括:
S110:获取待追踪Excel文档;
S120:解压缩所述待追踪Excel文档获得sheet数据包和功能文件夹;
S130:在所述功能性文件夹中创建追踪水印;
S140:获取一sheet表并在所述sheet表中嵌入所述追踪水印;
S150:将嵌入所述追踪水印的所述sheet表保存至所述sheet数据包;
S160:将所述sheet数据包和功能文件夹压缩获得植入有所述追踪水印的待追踪Excel文档。
为了减少文件的磁盘空间占用,Office办公组件所生成的文件其本质上是一种特殊的压缩包。解压缩后的Excel文档一般包括sheet数据包和功能文件夹,如“_rels”文件夹、“docpProps”文件夹、“_xl”文件夹以及“[content_Types].xml”文件等,“_xl”文件夹包括了Excel文档的核心内容,[Content_Types].xml文件用来声明文件的引用。本发明针对Excel文档提出了嵌入隐藏的追踪水印的方法,即在Excel文档的功能性文件夹中创建追踪水印,并在sheet表文件中嵌入该隐藏的水印,当嵌入有追踪水印的Excel文档被打开时,文档将自动向特定的地址发起请求,回传水印携带的该Excel文档的唯一标识、打开轨迹或者其他相关信息,从而实现Excel文档打开轨迹的追踪;当发现文档发生泄密时,能够根据文档打开轨迹在较短时间内完成泄密的溯源工作,从而降低运营人员的工作难度,提高文件泄密溯源的速度和准确性,有效预防商业敏感文件泄露,保护公司商业数据资产安全。
在实际的使用中,S100步骤:待追踪Excel文档中植入追踪水印可以通过一些触发操作触发,因此,该Excel文档追踪方法可以包括以下步骤:
判断是否监测到触发操作;如监测到,则触发所述S100步骤,即在待追踪Excel文档植入追踪水印,所述触发操作可以包括但不限于调用SDK接口操作或调用API接口操作。
在一些实施例中,所述S110:获取待追踪Excel文档步骤后,还包括如下步骤:
S111:判断所述待追踪Excel文档是否大于一阈值;
如果所述待追踪Excel文档大于所述阈值,则所述S120步骤中解压缩所述待追踪Excel文档获得压缩状态的sheet数据包和功能文件夹;
所述S140步骤包括创建一新的sheet表;此时的sheet表可以为不包含数据的空白的sheet表;
获取新的sheet表并在所述sheet表中嵌入所述追踪水印;
所述S150步骤为将嵌入所述追踪水印的新的空白sheet表保存至所述sheet数据包的压缩包。
在另一些实施例中,所述S110:获取待追踪Excel文档步骤后,还包括如下步骤:
如果所述待追踪Excel文档不大于所述阈值,则所述S120步骤中解压缩所述待追踪Excel文档获得解压缩状态的sheet数据包和功能文件夹;
所述S140步骤为从所述解压缩状态的sheet数据包中选择一sheet表并在所述sheet表中嵌入所述追踪水印;
所述S150步骤为将嵌入所述追踪水印的所述sheet表保存。
.xlsx文件本质上是一种特殊的压缩包,本发明主要是对其中的某些文件添加水印内容后再压缩,而对Excel文档中的含数据的sheet数据包进行处理时需要将其解压并读取到内存中,当Excel文档较大是,此过程需要占用大量内存,且加载速度慢。本发明中通过S 111步骤根据Excel文档的大小不同采用不同的处理方式,即当系统判断待追踪Excel文档大于一设定阈值时,只部分解压缩Excel文档中的部分文件,此些文件用于创建追踪水印,同时,创建新的空白的sheet表并在该sheet表中嵌入所创建的追踪水印,最后将嵌入有所述追踪水印的sheet表保存至未解压的sheet数据包中并与其他解压缩的文件压缩,获得植入有所述追踪水印的待追踪Excel文档。
实际的使用中,植入追踪水印的功能可以通过一软件开发工具包(SoftwareDevelopment Kit,SDK)来实现,为了表征上述过程,以对该SDK性能测试为例,SDK针对10MB以下的文件,平均内存消耗为200MB左右,针对大于10MB左右的文件,平均内存消耗为750MB左右。表1为针对不同大小的Excel文档植入追踪水印的耗时测试结果。
表1为针对不同大小的Excel文档植入追踪水印的耗时测试结果
Figure BDA0002885979770000071
Figure BDA0002885979770000081
在上述测试中,当Excel文档预测的解压缩后所占的磁盘空间大于阈值128MB时,则所述S120步骤中解压缩所述待追踪Excel文档获得压缩状态的sheet数据包和功能文件夹;所述S140步骤包括创建一新的空白sheet表。当Excel文档预测的解压缩后所占的磁盘空间不大于阈值128M时,则直接解压缩所有的Excel文档。
从表1可以看出,针对大文件,为了加快文件处理效率,通过构建新的sheet表文件并进行添加隐藏水印操作,避免对含大量数据的sheet表文件进行内存加载操作,通过从原始文件中读取含大量数据的sheet表文件的压缩流到已添加隐藏水印的文件中,避免了含大量数据的sheet表文件的解压缩耗时,减少了内存占用,进而加快文件的整体处理速度。如表1中,虽然序号3Excel文档解压缩后所占的磁盘空间(156MB)大于序号2Excel文档(104MB),但由于避免了对含大量数据的sheet表文件进行内存加载操作,序号3Excel文档植入追踪水印的平均耗时(3560ms)少于序号2Excel文档的平均耗时(3976ms)。
针对不同的文件大小进行了文件添加水印操作耗时测试,处理速度因文件大小而定,系统的配置也会对测试产生影响,因此,本发明中的阈值可根据实际系统运行状态设定。极端地,阈值可以设置为零,即所有的Excel文档植入追踪水印时均不解压缩含大量数据的sheet表文件,只部分解压缩Excel文档中的部分文件,如一大型的Excel文档中的一个或者几个文件或文件夹,在此些文件中创建追踪水印,同时,创建新的空白的sheet表并在该sheet表中嵌入所述追踪水印,最后嵌入所述追踪水印的sheet表保存至未解压的sheet数据包中并与其他解压缩的文件压缩。
进一步地,当完成S120步骤解压缩待追踪Excel文档功能文件夹后,所述功能文件夹至少包括xl文件夹,xl文件中主要包含Excel文档中的具体内容,可以在该文件夹中进行隐藏水印的添加操作,具体地,所述S130步骤在所述功能性文件夹中创建追踪水印包括:
S131:在所述xl文件夹的drawings文件夹中创建一所述追踪水印的内容,所述追踪水印的内容为一图片;图片根据Office Open XML File Formats规范创建;
S132:在drawings/_rels/drawing1.xml.rels文件中添加所述图片的引用关系,并将所述图片的对象属性设置为URL链接,所述URL链接携带的信息参数包括一URL地址信息,所述URL地址信息为Excel文档追踪系统的信息收集接口的地址信息;以及将所述图片的对象模式属性设置为“External”;
所述S140步骤中的在所述sheet表中嵌入所述追踪水印为在所述sheet表中添加所述图片的引用关系。本发明在sheet表中添加水印后,不影响文件的正常使用,且在文件内容展示上无任何差异,难以被发现。
在一些实施例中,所述URL链接携带的信息参数还包括一URL字符串,所述URL字符串包含根据所述待追踪Excel文档生成的随机字符串。每个文件的随机字符串都是唯一的,通过识别该随机字符串,可以区分各个文档,随机字符串可以看成是Excel文档的唯一标识,通过回传的Excel文档的唯一标识将文档信息和文档的打开轨迹进行关联,从而实现文件相关信息的快速搜索。
本发明的文档追踪方法的S200步骤:根据所述追踪水印追踪所述待追踪Excel文档,具体地包括如下步骤:Excel文档追踪系统的信息收集接口接收URL回传信息,所述URL回传信息包括URL字符串。根据所述URL字符串确定待追踪Excel文档。即当植入有追踪水印的待追踪Excel文件在联网的设备上打开时,通过URL链接能够向Excel文档追踪系统的信息收集接口回传信息,在此实施例中,回传信息为URL字符串,通过该URL字符串确定所打开的Excel文档。
进一步地,系统可以对所有URL回传信息做汇总处理,以记录所有待追踪Excel文档的打开轨迹,当发现某一Excel文档发生泄密时,通过上述打开轨迹信息实现文件打开记录的追踪。当然,在所述功能性文件夹中创建追踪水印时,会将根据待追踪Excel文档生成的随机字符串,即Excel文档以及其唯一标识上传Excel文档追踪系统,已备后续追踪溯源时使用。
在另外一些实施例中,所述功能文件夹还可以包括docpProps文件,所述方法还包括以下步骤:
在docpProps文件夹中创建一个custom.xml文件,在所述custom.xml文件中添加自定义内容,此处的自定义内容可根据实际场景的需要设定,在能获取到原始泄密文件时,能够通过custom.xml文件中添加自定义内容快速定位打开文档的使用者等信息。
本发明的一些实施例还提供了一种Excel文档追踪系统,用于实现所述Excel文档追踪方法,图2为本发明一实施例的Excel文档追踪系统的结构示意图;具体地,Excel文档追踪系统包括水印植入模块M100和水印追踪模块M200,其中:
所述水印植入模块M100用于执行所述S100步骤:待追踪Excel文档中植入追踪水印,以及
所述水印追踪模块M200用于执行所述S200步骤:根据所述追踪水印追踪所述待追踪Excel文档;
S110:获取待追踪Excel文档;
S120:解压缩所述待追踪Excel文档获得sheet数据包和功能文件夹;
S130:在所述功能性文件夹中创建追踪水印;
S140:获取一sheet表并在所述sheet表中嵌入所述追踪水印;
S150:将嵌入所述追踪水印的所述sheet表保存至所述sheet数据包;
S160:将所述sheet数据包和功能文件夹压缩获得植入有所述追踪水印的待追踪Excel文档。实际的使用中,水印植入模块M100可为一软件开发工具包。
为了进一步阐述本发明的Excel文档追踪系统,该系统的工作流程如图2,当一合法用户端A(授权用户端)需下载一Excel文档时,向系统的文件下载模块发出下载该Excel文档请求,系统通过水印植入模块M100触发并对该Excel文档植入追踪水印,水印植入模块M100将Excel文档的唯一标识及对应的文档信息上传Excel文档追踪系统;同时,植入有追踪水印的Excel文档通过文件下载模块下载至用户端A,当用户端A打开该文档时,URL链接回传信息,系统记录回传的URL字符串以及用户端A打开该文档的轨迹;当植入追踪水印的Excel文档在不同用户端间流转,如用户端B通过拷贝等形式获得该文档,当用户端B打开该Excel文档时,系统同样地记录回传的URL字符串以及用户端B打开该文档的轨迹。当发现该Excel文档发生泄密时,能够通过系统记录的该文档的所有打开轨迹追踪溯源,实现在较短时间内完成文档泄密的溯源工作,从而降低运营人员的工作难度,提高文件泄密溯源的速度和准确性,有效预防商业敏感文件泄露,保护公司商业数据资产安全。
实施例的Excel文档追踪系统中的各个功能模块的功能实现方式均可以采用上述Excel文档追踪方法中各个步骤的具体实施方式来实现。例如,水印植入模块M100和水印追踪模块M200可以分别采用上述步骤S100至S200的具体实施方式实现其功能,此处不予赘述。
下面参照图3来描述根据本发明的这种实施方式的电子设备600。图3显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行实现Excel文档追踪方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图4所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明提供了一种Excel文档追踪方法、系统、电子设备及存储介质,本发明的Excel文档追踪方法根据Excel文档的组成原理和Office OpenXML File Formats规范,针对Excel文档提出了嵌入隐藏的追踪水印的方法,当嵌入有追踪水印的Excel文档被打开时,文档将自动向特定的URL地址发起请求,回传水印携带的该Excel文档的唯一标识或者其他相关信息,从而实现Excel文档打开轨迹的追踪;当文件发生泄密时,能够根据文件打开轨迹在较短时间内完成泄密的溯源工作,从而降低运营人员的工作难度,提高文件泄密溯源的速度和准确性,有效预防商业敏感文件泄露,保护公司商业数据资产安全。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (12)

1.一种Excel文档追踪方法,其特征在于,包括以下步骤:
S100:待追踪Excel文档中植入追踪水印,以及
S200:根据所述追踪水印追踪所述待追踪Excel文档;
所述S100步骤包括:
S110:获取待追踪Excel文档;
S120:解压缩所述待追踪Excel文档获得sheet数据包和功能文件夹;
S130:在所述功能性文件夹中创建追踪水印;
S140:获取一sheet表并在所述sheet表中嵌入所述追踪水印;
S150:将嵌入所述追踪水印的所述sheet表保存至所述sheet数据包;
S160:将所述sheet数据包和功能文件夹压缩获得植入有所述追踪水印的待追踪Excel文档。
2.根据权利要求1所述的Excel文档追踪方法,其特征在于,所述获取待追踪Excel文档步骤后,还包括如下步骤:
判断所述待追踪Excel文档是否大于一阈值;
如果所述待追踪Excel文档大于所述阈值,则所述S120步骤中解压缩所述待追踪Excel文档获得压缩状态的sheet数据包和功能文件夹;
所述S140步骤包括创建一新的sheet表;
获取新的sheet表并在所述sheet表中嵌入所述追踪水印;
所述S150步骤为将嵌入所述追踪水印的新的sheet表保存至所述sheet数据包的压缩包。
3.根据权利要求1或2所述的Excel文档追踪方法,其特征在于,所述获取待追踪Excel文档步骤后,还包括如下步骤:
如果所述待追踪Excel文档不大于所述阈值,则所述S120步骤中解压缩所述待追踪Excel文档获得解压缩状态的sheet数据包和功能文件夹;
所述S140步骤为从所述解压缩状态的sheet数据包中选择一sheet表并在所述sheet表中嵌入所述追踪水印;
所述S150步骤为将嵌入所述追踪水印的所述sheet表保存。
4.根据权利要求1所述的Excel文档追踪方法,其特征在于,所述功能文件夹至少包括xl文件夹,所述S130步骤包括:
S131:在所述xl文件夹的drawings文件夹中创建一所述追踪水印的内容,所述追踪水印的内容为一图片;
S132:在drawings/_rels/drawing1.xml.rels文件中添加所述图片的引用关系,并将所述图片的对象属性设置为URL链接,所述URL链接携带的信息参数包括一URL地址信息,所述URL地址信息为Excel文档追踪系统的信息收集接口的地址信息;以及将所述图片的对象模式属性设置为“External”;
所述S140步骤中的在所述sheet表中嵌入所述追踪水印为在所述sheet表中添加所述图片的引用关系。
5.根据权利要求4所述的Excel文档追踪方法,其特征在于,所述URL5链接携带的信息参数还包括一URL字符串,所述URL字符串包含根据所述待追踪Excel文档生成的随机字符串。
6.根据权利要求4所述的Excel文档追踪方法,其特征在于,所述功能文件夹还包括docpProps文件,所述方法还包括以下步骤:
在docpProps文件夹中创建一个custom.xml文件,在所述custom.xml文件中添加自定义内容。
7.根据权利要求1所述的Excel文档追踪方法,其特征在于,所述方法还包括以下步骤:
判断是否监测到触发操作;
如监测到,则触发所述S100步骤。
8.根据权利要求7所述的Excel文档追踪方法,其特征在于,所述触发操作包括调用SDK接口操作或调用API接口操作。
9.根据权利要求5所述的Excel文档追踪方法,其特征在于,所述S200步骤包括:
Excel文档追踪系统的信息收集接口接收URL回传信息,所述URL回传信息包括URL字符串;
根据所述URL字符串确定待追踪Excel文档。
10.一种Excel文档追踪系统,用于实现权利要求1至9任意一项所述Excel文档追踪方法,其特征在于,包括水印植入模块和水印追踪模块,其中:
所述水印植入模块用于执行所述S100步骤:待追踪Excel文档中植入追踪水印,以及
所述水印追踪模块用于执行所述S200步骤:根据所述追踪水印追踪所述待追踪Excel文档;
S110:获取待追踪Excel文档;
S120:解压缩所述待追踪Excel文档获得sheet数据包和功能文件夹;
S130:在所述功能性文件夹中创建追踪水印;
S140:获取一sheet表并在所述sheet表中嵌入所述追踪水印;
S150:将嵌入所述追踪水印的所述sheet表保存至所述sheet数据包;
S160:将所述sheet数据包和功能文件夹压缩获得植入有所述追踪水印的待追踪Excel文档。
11.一种电子设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9任意一项所述Excel文档追踪方法的步骤。
12.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至9任意一项所述Excel文档追踪方法的步骤。
CN202110013802.6A 2021-01-06 2021-01-06 Excel文档追踪方法、系统、电子设备及存储介质 Pending CN112650956A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110013802.6A CN112650956A (zh) 2021-01-06 2021-01-06 Excel文档追踪方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110013802.6A CN112650956A (zh) 2021-01-06 2021-01-06 Excel文档追踪方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112650956A true CN112650956A (zh) 2021-04-13

Family

ID=75367497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110013802.6A Pending CN112650956A (zh) 2021-01-06 2021-01-06 Excel文档追踪方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112650956A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113177193A (zh) * 2021-04-23 2021-07-27 深圳依时货拉拉科技有限公司 水印添加方法、校验方法及终端设备
CN114329366A (zh) * 2022-03-14 2022-04-12 天津联想协同科技有限公司 网盘文件控制方法、装置、网盘及存储介质
CN116595498A (zh) * 2023-07-11 2023-08-15 北京升鑫网络科技有限公司 文档追踪溯源方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009200763A (ja) * 2008-02-21 2009-09-03 Ricoh Co Ltd 電子文書追跡装置、方法、プログラムおよび記録媒体
CN102142073A (zh) * 2010-12-27 2011-08-03 成都网安科技发展有限公司 基于隐密水印的纸质文档防泄密及其鉴别系统
CN103500296A (zh) * 2013-09-29 2014-01-08 北京溯源鸿业科技有限公司 一种文本文档中数字水印的嵌入方法和装置
CN104657637A (zh) * 2015-01-29 2015-05-27 深信服网络科技(深圳)有限公司 文档信息嵌入、追踪方法和系统及代理服务设备
CN107358073A (zh) * 2017-07-18 2017-11-17 北京中睿星网科技有限公司 一种在Word文档中嵌入隐藏的追踪水印的方法
CN107423629A (zh) * 2017-04-12 2017-12-01 李晓妮 一种文件信息输出防泄密和溯源追踪的方法和系统
CN110968847A (zh) * 2019-11-27 2020-04-07 北京北信源软件股份有限公司 一种文件水印隐藏、解析方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009200763A (ja) * 2008-02-21 2009-09-03 Ricoh Co Ltd 電子文書追跡装置、方法、プログラムおよび記録媒体
CN102142073A (zh) * 2010-12-27 2011-08-03 成都网安科技发展有限公司 基于隐密水印的纸质文档防泄密及其鉴别系统
CN103500296A (zh) * 2013-09-29 2014-01-08 北京溯源鸿业科技有限公司 一种文本文档中数字水印的嵌入方法和装置
CN104657637A (zh) * 2015-01-29 2015-05-27 深信服网络科技(深圳)有限公司 文档信息嵌入、追踪方法和系统及代理服务设备
CN107423629A (zh) * 2017-04-12 2017-12-01 李晓妮 一种文件信息输出防泄密和溯源追踪的方法和系统
CN107358073A (zh) * 2017-07-18 2017-11-17 北京中睿星网科技有限公司 一种在Word文档中嵌入隐藏的追踪水印的方法
CN110968847A (zh) * 2019-11-27 2020-04-07 北京北信源软件股份有限公司 一种文件水印隐藏、解析方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113177193A (zh) * 2021-04-23 2021-07-27 深圳依时货拉拉科技有限公司 水印添加方法、校验方法及终端设备
CN114329366A (zh) * 2022-03-14 2022-04-12 天津联想协同科技有限公司 网盘文件控制方法、装置、网盘及存储介质
CN116595498A (zh) * 2023-07-11 2023-08-15 北京升鑫网络科技有限公司 文档追踪溯源方法及系统
CN116595498B (zh) * 2023-07-11 2023-09-29 北京升鑫网络科技有限公司 文档追踪溯源方法及系统

Similar Documents

Publication Publication Date Title
CN112650956A (zh) Excel文档追踪方法、系统、电子设备及存储介质
US7769787B2 (en) Method and system for maintaining originality-related information about elements in an editable object
US7093132B2 (en) Method and apparatus for protecting ongoing system integrity of a software product using digital signatures
US8234496B1 (en) Image leak prevention using digital watermark
US7734914B1 (en) System and method for allowing applications to securely access files
US6886132B1 (en) Method and system for packing and unpacking web pages
US20090019223A1 (en) Method and systems for providing remote strage via a removable memory device
US20090157716A1 (en) Apparatus and method for acquiring data from memory of terminal
Mikus et al. An analysis of disc carving techniques
CN114329367B (zh) 网盘文件追溯方法、装置、网盘及存储介质
US20030233352A1 (en) Method and apparatus for screening media
US20120143824A1 (en) Protecting files that include editable metadata
CN113672204A (zh) 一种接口文档生成方法、系统、电子设备及存储介质
CN114329366B (zh) 网盘文件控制方法、装置、网盘及存储介质
CN114564158B (zh) Linux系统下控制文档打印的方法、装置、设备及介质
CN113468118B (zh) 一种基于区块链的文件增量存储方法、装置及存储介质
CN102236698A (zh) 可嵌入的项目数据
CN111414339A (zh) 一种文件的处理方法、系统、装置、设备及介质
CN106354624B (zh) 一种自动化测试方法和装置
CN112036133B (zh) 一种文件保存方法、装置、电子设备及存储介质
CN109002710A (zh) 一种检测方法、装置及计算机可读存储介质
US8082334B1 (en) Providing direct access to managed content
JP5972455B2 (ja) 情報を削除する方法
CN113296854A (zh) 一种数据加载方法、系统、电子设备及存储介质
US20090089301A1 (en) Method and System for Efficiently Managing Content on an Information Handling Device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210413

WD01 Invention patent application deemed withdrawn after publication