CN107515846B - 一种Office文档转化及修改过程中的跟踪方法 - Google Patents

一种Office文档转化及修改过程中的跟踪方法 Download PDF

Info

Publication number
CN107515846B
CN107515846B CN201610422318.8A CN201610422318A CN107515846B CN 107515846 B CN107515846 B CN 107515846B CN 201610422318 A CN201610422318 A CN 201610422318A CN 107515846 B CN107515846 B CN 107515846B
Authority
CN
China
Prior art keywords
office document
document
customization data
office
modification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610422318.8A
Other languages
English (en)
Other versions
CN107515846A (zh
Inventor
刘芳铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foxit Software Inc
Original Assignee
Foxit Software Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foxit Software Inc filed Critical Foxit Software Inc
Priority to CN201610422318.8A priority Critical patent/CN107515846B/zh
Priority to US16/305,604 priority patent/US20200117852A1/en
Priority to PCT/CN2017/000320 priority patent/WO2017215253A1/zh
Publication of CN107515846A publication Critical patent/CN107515846A/zh
Application granted granted Critical
Publication of CN107515846B publication Critical patent/CN107515846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/197Version control

Abstract

本发明公开了一种Office文档转化及修改过程中的跟踪方法,其包括以下步骤:S1:生成一包含唯一ID的客户化数据;S2:当Office文档生成时或生成后,使用Office文档的customXML机制,将所述客户化数据用XML格式保存在Office文档中;S3:对该Office文档进行修改后,该唯一ID保持不变;S4:将该Office文档转化为一目标格式的目标文件后,如果该目标格式能够支持保存该客户化数据,则将该客户化数据转移到该目标文件中,并且用户能够根据该客户化数据对该目标文件进行管理;S5:对S2步骤得到的Office文档进行更新并再次生成了新的Office文档时,该新的Office文档中的该唯一ID保持不变。本发明能够为系统的数据统计和用户的信息查找提供方便,具有很强的实用性。

Description

一种Office文档转化及修改过程中的跟踪方法
技术领域
本发明涉及文档管理领域,具体而言,涉及一种Office文档转化及修改过程中的跟踪方法。
背景技术
Office文档可通过各种计算机软件由其他格式(如PNG、PDF、HTML等)的文件转换而来,这个转换过程涉及到内容的重新表示,除了信息的表现形式发生变化外,同时内容或多或少也会发生改变。通常情况下,转换生成的Office文档是独立的实体,与原始数据之间没有直接的关联。在对生成的Office文档进行转化后,新生成的文档具有与原始文件类似的外观,但内容及表现形式可能有了一定的差别,而用户的进一步使用和修改会使这一差别逐渐扩大。为了使用户于后续使用过程中能够识别文档的来源,用户可以手工记录原始文档与Office文档的同源关系,即,它们是由同一个原始文档修改或转换而来。但是在很多场景下,手工记录非常不方便甚至比较困难。
因此,如何在大量文档的管理中根据同源关系将大量文档划分为同源文档簇,从而为系统的数据统计和用户的信息查找提供方便,是本领域技术人员亟需解决的技术问题。
发明内容
本发明提供一种Office文档转化及修改过程中的跟踪方法,用以在大量文档的管理中根据同源关系将大量文档划分为同源文档簇,从而为系统的数据统计和用户的信息查找提供方便。
为了达到上述目的,本发明提供了一种Office文档转化及修改过程中的跟踪方法,其包括以下步骤:
S1:生成一包含唯一ID的客户化数据;
S2:当Office文档生成时或生成后,使用Office文档的customXML机制,将所述客户化数据用XML格式保存在Office文档中;
S3:对该Office文档进行修改后,该唯一ID保持不变;
S4:将该Office文档转化为一目标格式的目标文件后,如果该目标格式能够支持保存该客户化数据,则将该客户化数据转移到该目标文件中,并且用户能够根据该客户化数据对该目标文件进行管理;
S5:对S2步骤得到的Office文档进行更新并再次生成了新的Office文档时,该新的Office文档中的该唯一ID保持不变。
在本发明的一实施例中,客户化数据存储于该Office文档元数据的标题或备注中。
在本发明的一实施例中,客户化数据存储于该Office文档正文的隐藏文字中。
本发明提供的Office文档转化及修改过程中的跟踪方法不需要用户人工干预即可自动跟踪生成的Office文档的转化和修改过程。使用本发明后,对于具体的两个Office文档,可以判断它们是否由同一个原始文档修改或转换而来,对于由这些Office文档进行再次转换而得到的其他格式的文档,在目标格式能够支持本发明所提到的操作的情况下也可以进行上述判断。因此,本发明能够为系统的数据统计和用户的信息查找提供方便,具有很强的实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的Office文档转化及修改过程中的跟踪方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明提供的Office文档转化及修改过程中的跟踪方法的流程图,如图所示,本发明提供的Office文档转化及修改过程中的跟踪方法包括以下步骤:
S1:生成一包含唯一ID的客户化数据;
S2:当Office文档生成时或生成后,使用Office文档的customXML机制,将所述客户化数据用XML格式保存在Office文档中;
S3:对该Office文档进行修改后,该唯一ID保持不变;
S4:将该Office文档转化为一目标格式的目标文件后,如果该目标格式能够支持保存该客户化数据,则将该客户化数据转移到该目标文件中,并且用户能够根据该客户化数据对该目标文件进行管理;
S5:对S2步骤得到的Office文档进行更新并再次生成了新的Office文档时,该新的Office文档中的该唯一ID保持不变。
在本发明的一具体实施例中,客户化数据可以存储于该Office文档元数据的标题或备注中。
在本发明的另一具体实施例中,客户化数据还可以存储于该Office文档正文的隐藏文字中。
使用本发明提供的Office文档转化及修改过程中的跟踪方法判断两个文档(文档1、文档2)以及可能由它们转化而来的文档是否为同源文档的步骤如下:
(1)若文档1是Office文档,则从Office文档的customXML机制中,获取XML格式表示的包含唯一ID的客户化数据。对于可能由文档1转换生成的其他格式的文档,尝试以对应于该目标格式的方式获取其中的客户化数据;
(2)对文档2同样执行上述操作;
(3)如果这些客户化数据具有相同的唯一ID,则它们是同源的。如果不同,则它们不是同源的。如果未能获取到其中的客户化数据,说明这些文档未在本发明的判别范围内。
本发明提供的Office文档转化及修改过程中的跟踪方法不需要用户人工干预即可自动跟踪生成的Office文档的转化和修改过程。使用本发明后,对于具体的两个Office文档,可以判断它们是否由同一个原始文档修改或转换而来,对于由这些Office文档进行再次转换而得到的其他格式的文档,在目标格式能够支持本发明所提到的操作的情况下也可以进行上述判断。因此,本发明能够为系统的数据统计和用户的信息查找提供方便,具有很强的实用性。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (3)

1.一种Office文档转化及修改过程中的跟踪方法,其特征在于,包括以下步骤:
S1:生成一包含唯一ID的客户化数据;
S2:当Office文档生成时或生成后,使用Office文档的customXML机制,将所述客户化数据用XML格式保存在Office文档中;
S3:对该Office文档进行修改后,该唯一ID保持不变;
S4:将该Office文档转化为一目标格式的目标文件后,如果该目标格式能够支持保存该客户化数据,则将该客户化数据转移到该目标文件中,并且用户能够根据该客户化数据对该目标文件进行管理;
S5:对S2步骤得到的Office文档进行更新并再次生成了新的Office文档时,该新的Office文档中的该唯一ID保持不变。
2.根据权利要求1所述的Office文档转化及修改过程中的跟踪方法,其特征在于,客户化数据存储于该Office文档元数据的标题或备注中。
3.根据权利要求1所述的Office文档转化及修改过程中的跟踪方法,其特征在于,客户化数据存储于该Office文档正文的隐藏文字中。
CN201610422318.8A 2016-06-15 2016-06-15 一种Office文档转化及修改过程中的跟踪方法 Active CN107515846B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610422318.8A CN107515846B (zh) 2016-06-15 2016-06-15 一种Office文档转化及修改过程中的跟踪方法
US16/305,604 US20200117852A1 (en) 2016-06-15 2017-04-25 Method for tracking in office file conversion and modification processes
PCT/CN2017/000320 WO2017215253A1 (zh) 2016-06-15 2017-04-25 一种Office文档转化及修改过程中的跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610422318.8A CN107515846B (zh) 2016-06-15 2016-06-15 一种Office文档转化及修改过程中的跟踪方法

Publications (2)

Publication Number Publication Date
CN107515846A CN107515846A (zh) 2017-12-26
CN107515846B true CN107515846B (zh) 2019-11-15

Family

ID=60663955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610422318.8A Active CN107515846B (zh) 2016-06-15 2016-06-15 一种Office文档转化及修改过程中的跟踪方法

Country Status (3)

Country Link
US (1) US20200117852A1 (zh)
CN (1) CN107515846B (zh)
WO (1) WO2017215253A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143302B (zh) * 2019-12-24 2023-06-16 北京明朝万达科技股份有限公司 一种追踪Office文档内容变更的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053952A (zh) * 2009-11-10 2011-05-11 英华达(上海)电子有限公司 电子书数据格式转换的方法、装置及便携式电子书阅读器
CN103294796A (zh) * 2013-05-24 2013-09-11 上海申腾信息技术有限公司 一种xml解析方法及医疗病案中自定义xml结构表单实现方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090287737A1 (en) * 2007-10-31 2009-11-19 Wayne Hammerly Architecture for enabling rapid database and application development
CN101477517B (zh) * 2009-01-21 2011-03-16 传神联合(北京)信息技术有限公司 一种office文档编辑多点远程同步的方法
US8818961B1 (en) * 2009-10-30 2014-08-26 Symantec Corporation User restoration of workflow objects and elements from an archived database
CN102163233A (zh) * 2011-04-18 2011-08-24 北京神州数码思特奇信息技术股份有限公司 一种网页标记语言格式转换方法及系统
CA2753508C (en) * 2011-09-23 2013-07-30 Guy Le Henaff Tracing a document in an electronic publication
US20130254699A1 (en) * 2012-03-21 2013-09-26 Intertrust Technologies Corporation Systems and methods for managing documents and other electronic content
US8924443B2 (en) * 2012-10-05 2014-12-30 Gary Robin Maze Document management systems and methods
US9529799B2 (en) * 2013-03-14 2016-12-27 Open Text Sa Ulc System and method for document driven actions
WO2015164521A1 (en) * 2014-04-23 2015-10-29 Intralinks, Inc. Systems and methods of secure data exchange
US10097557B2 (en) * 2015-10-01 2018-10-09 Lam Research Corporation Virtual collaboration systems and methods

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053952A (zh) * 2009-11-10 2011-05-11 英华达(上海)电子有限公司 电子书数据格式转换的方法、装置及便携式电子书阅读器
CN103294796A (zh) * 2013-05-24 2013-09-11 上海申腾信息技术有限公司 一种xml解析方法及医疗病案中自定义xml结构表单实现方法

Also Published As

Publication number Publication date
CN107515846A (zh) 2017-12-26
WO2017215253A1 (zh) 2017-12-21
US20200117852A1 (en) 2020-04-16

Similar Documents

Publication Publication Date Title
JP4339554B2 (ja) 階層データを表示するユーザインタフェースを作成し表示するためのシステムおよび方法
US8849895B2 (en) Associating user selected content management directives with user selected ratings
US8510277B2 (en) Informing a user of a content management directive associated with a rating
US8099681B2 (en) Systems and methods for propagating alerts via a hierarchy of grids
US6449620B1 (en) Method and apparatus for generating information pages using semi-structured data stored in a structured manner
US9009173B2 (en) Using views of subsets of nodes of a schema to generate data transformation jobs to transform input files in first data formats to output files in second data formats
US20070214148A1 (en) Invoking content management directives
CN104424265B (zh) 数字资源管理方法及系统
US20090187882A1 (en) Live bidirectional synchronizing of a visual and a textual representation
US20080040397A1 (en) Method and system for enhanced attribute synchronization in a content management system
CN102521230A (zh) 用于有条件的数据显示的结果类型
US6915303B2 (en) Code generator system for digital libraries
CN102810114A (zh) 基于本体的个人计算机资源管理系统
WO2007081017A1 (ja) 文書処理装置
JP2008102736A (ja) 検索装置および検索方法
CN107515846B (zh) 一种Office文档转化及修改过程中的跟踪方法
US8984028B2 (en) Systems and methods for storing data and eliminating redundancy
JP2007034961A (ja) コンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法
US20170116234A1 (en) Generating a view for a schema including information on indication to transform recursive types to non-recursive structure in the schema
WO2007105364A1 (ja) 文書処理装置及び文書処理方法
JP2007034960A (ja) コンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法
JP4836069B2 (ja) コンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法
US7895155B2 (en) Method and system for updating document content and metadata via plug-in chaining in a content management system
US20200034355A1 (en) Importing external content into a content management system
Bürger et al. Interlinking multimedia-Principles and requirements

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant