CN102096661A - 用于对电子文档进行在线编辑的方法和系统 - Google Patents

用于对电子文档进行在线编辑的方法和系统 Download PDF

Info

Publication number
CN102096661A
CN102096661A CN2009102583390A CN200910258339A CN102096661A CN 102096661 A CN102096661 A CN 102096661A CN 2009102583390 A CN2009102583390 A CN 2009102583390A CN 200910258339 A CN200910258339 A CN 200910258339A CN 102096661 A CN102096661 A CN 102096661A
Authority
CN
China
Prior art keywords
electronic document
application program
action sequence
document
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009102583390A
Other languages
English (en)
Inventor
左志波
王欣孃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2009102583390A priority Critical patent/CN102096661A/zh
Priority to PCT/EP2010/068825 priority patent/WO2011069903A1/en
Publication of CN102096661A publication Critical patent/CN102096661A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/197Version control

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种用于对电子文档进行在线编辑的方法,包括:将电子文档由第一应用程序格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档;将转换后的电子文档发送给第二应用程序;接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;基于上述对比确定电子文档的改变;以及基于电子文档的改变生成第一应用程序能够识别的动作序列。通过利用动作来记录电子文档的改变,经过在线编辑的包含丰富格式信息的电子文档的格式信息能够得到保留并得以更新,从而解决了现有方法中格式信息会丢失的问题。

Description

用于对电子文档进行在线编辑的方法和系统
技术领域
本发明涉及电子文档处理领域。特别地,本发明涉及一种用于在线编辑电子文档的方法和系统。
背景技术
电子文档传统的是由各种电子文档编辑软件创建并进行编辑的。电子文档编辑软件例如可以是
Figure B2009102583390D0000011
Open
Figure B2009102583390D0000012
等,支持丰富的格式。利用这些编辑软件能够创建、保存电子文档,并能对电子文档的内容进行增加、删除、修改等编辑操作。这些编辑操作通常称为电子文档的本地编辑。
随着互联网的发展,电子文档可以由各种浏览器进行编辑。例如可以是Internet
Figure B2009102583390D0000013
等。当利用浏览器对由现有的电子文档编辑软件产生的电子文档进行编辑操作时,现有的方法是首先利用格式转换器对电子文档进行文档格式转换,即将电子文档编辑软件产生的电子文档由其对应的文件格式,例如doc、odf等格式转换成浏览器可以识别的文件格式,例如html、xhtml、xml等格式。在进行上述转换之后,由用户利用浏览器创建、保存电子文档,并且直接在浏览器上对文档进行增加、删除、修改等编辑操作。由于利用浏览器对电子文档进行的编辑操作通常用于互联网中的web方式对电子文档进行的编辑操作,因而通常称为电子文档的在线编辑。
当用户利用浏览器对电子文档进行编辑之后,现有的方法利用格式转换器再次对电子文档进行文档格式转换,即将经过浏览器编辑的电子文档由浏览器可以识别的文件格式,例如html、xhtml、xml等格式转换成电子文档编辑软件对应的文件格式,例如doc、odf等格式。
然而,上述现有的方法在对电子文档进行在线编辑的过程中不可避免的会引起其格式信息的丢失。这是因为,电子文档编辑软件对应的文件格式有自己定义的格式集合,这些格式集合往往包含丰富的格式信息,浏览器能够识别的文件格式也有自己的格式集合,两种格式集合之间通常是不统一的。由于电子文档编辑软件对应的文件格式中有些格式不包括在浏览器能够识别的文件格式的格式集合之中,在利用格式转换器将电子文档编辑软件产生的电子文档由电子文档编辑软件对应的文件格式转换成浏览器可以识别的文件格式时,那些浏览器不能识别的格式信息将会被丢弃。当用户对电子文档进行编辑之后将电子文档从浏览器可以识别的文件格式转换回电子文档编辑软件对应的文件格式时,这些丢失的格式信息是不会被恢复的。
发明内容
由于经过在线编辑的电子文档会造成格式信息的丢失,因此,需要一种方法和系统能够有效解决上述问题。
根据本发明的一个方面,提供了一种用于对电子文档进行在线编辑的方法,包括:将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档,其中保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息;将转换后的电子文档发送给第二应用程序;接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;基于上述对比确定电子文档的改变;以及基于电子文档的改变生成第一应用程序能够识别的动作序列。
根据本发明的另一方面,电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式还包括保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息。进一步地,将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储;或者将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及转换后的电子文档一并存储。进一步地,第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变更新至原电子文档。
根据本发明的再一方面,提供了一种用于对电子文档进行在线编辑的系统,包括:格式转换器,被配置为将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档,其中保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息,并将转换后的电子文档发送给第二应用程序;文档改变比较器,配置成接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;并且基于上述对比确定电子文档的改变;以及动作序列生成器,配置成基于电子文档的改变生成第一应用程序能够识别的动作序列。
根据本发明的又一方面,电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式包括保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息。进一步地,动作生成器将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储;或者将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及转换后的电子文档一并存储。进一步地,第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变更新至原电子文档。
通过本发明的方法和系统,经过在线编辑的电子文档的格式信息能够得到保留并得以更新,从而解决了现有方法中格式信息会丢失的问题。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中:
图1显示了根据本发明一个实施例的用于对电子文档进行在线编辑的方法100;
图2a-图2c示意性地显示了电子文档编辑软件和浏览器中电子文档的显示结果;
图3a和图3b示意性地显示了转换后的电子文档与经过在线编辑的电子文档的DOM树;
图4显示了根据本发明另一个实施例的用于对电子文档进行在线编辑的系统400。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于该实际实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本发明公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
本发明的主要思想是利用操作动作作为两种文档格式沟通的桥梁,只要操作动作相同,那么格式也就不会丢失。本发明的方法保留格式转换过程中浏览器不能识别的格式信息,利用电子文档编辑软件支持的操作动作记录在线编辑对电子文档的改变,然后由电子文档编辑软件执行这些操作动作。这样,经过在线编辑的电子文档的格式信息就不会丢失。
现在参看图1,其中显示了根据本发明一个实施例的用于对电子文档进行在线编辑的方法100。图1的方法100从步骤102开始。接着,方法进入步骤104,其中,将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档;接着,方法进入步骤106,其中将转换后的电子文档发送给第二应用程序;接着,方法进入步骤108,其中,接收经过第二应用程序编辑的电子文档;接下来,方法进入步骤110,其中,将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;之后,在步骤112,基于上述对比确定电子文档的改变;然后,在步骤114,基于电子文档的改变生成第一应用程序能够识别的动作序列。之后,方法进入步骤116结束。
进一步地,根据本发明的方法,电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式包括保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息。
进一步地,根据本发明的方法,将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储,或者将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及转换后的电子文档一并存储。进一步地,第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变更新至原电子文档。
由于本发明采取了用电子文档编辑软件能够识别的动作序列来记录浏览器对电子文档的改变,因此,通过电子文档编辑软件执行这些动作序列使得浏览器对电子文档的改变能够更新至电子文档编辑软件对应文件格式的电子文档,同时,由于原电子文档中浏览器不能识别的电子文档编辑软件对应文件格式的格式信息被保留,通过执行动作序列,在浏览器对电子文档的改变能够更新至电子文档编辑软件对应文件格式的电子文档的同时原电子文档中浏览器不能识别的电子文档编辑软件对应文件格式的格式信息也被更新。这样,经过在线编辑的电子文档中浏览器不能识别的电子文档编辑软件对应文件格式的格式信息不会丢失,而且能够得以更新。
下面以
Figure B2009102583390D0000061
作为电子文档编辑软件,以浏览器作为浏览器并以html文件格式作为浏览器能够识别的文件格式为例对本发明进行进一步描述。应该理解,浏览器、html文件格式只是为了说明的目的,不能认为是对本发明要求的保护范围的限制。对于其他的电子文档编辑软件、其他的浏览器以及其他浏览器能够识别的文件格式,由于本领域普通技术人员能够在本发明公开的基础上通过其掌握的知识得到,因而同样落在本发明的保护范围之内。
假设用户I用
Figure B2009102583390D0000062
创建了一篇电子文档A。用户II没有电子文档编辑软件,他希望用浏览器对电子文档A进行在线编辑。这时,用户II用浏览器打开电子文档A。根据现有的方法,在用户II的后台执行下述操作:由格式转换器对电子文档A进行格式转换,即:由doc格式转换为例如html格式,从而使电子文档A能够被用户II的浏览器识别并能够进行在线编辑。电子文档A可以被划分为两个部分:Part I,该电子文档部分中的格式信息能够被doc格式和html格式识别,能够在两种文档格式之间自由转换;Part II,该电子文档部分中的格式信息只能被doc格式识别而不能被html格式识别。正如前面描述的,现有的方法中,格式转换器在将电子文档A由doc格式转换成html格式时,doc格式中不能由浏览器识别的格式信息将会丢失,即Part II中的格式信息将会丢失,这些信息例如是文字闪烁、表格阴影等。根据现有的方法,Part II中不能由浏览器识别的格式信息将被丢弃。
现在以上述例子描述本发明。根据现有的方法,当用户II用浏览器打开电子文档A时,格式转换器将电子文档A由doc格式转换成html格式,这时,仅将电子文档A的Part I进行转换,得到的转换后的电子文档我们将其记录为电子文档B。很显然,电子文档B仅包括Part I。根据本发明,在将电子文档A由doc格式转换成html格式时电子文档A中html格式不能识别的doc格式的格式信息被保留,即Part II中的格式信息。之后,用户II用浏览器对电子文档B进行在线编辑,这种编辑可能包括对电子文档B内容以及对电子文档B中格式信息的增加、删除或改变等操作。这里将经过在线编辑的电子文档B记录为电子文档B1。我们将用户II对电子文档B的改变记录为Part III,很显然,电子文档B1可以表示为B1=Part I+PartIII。
如果按照现有的方法,电子文档A在经过在线编辑之后得到的是电子文档B1,即Part I+Part III。然后,再通过格式转换器将电子文档B1转换为doc格式时,原电子文档A中不能被html格式识别的格式信息都会丢失。
根据本发明的一个实施例,接收经过浏览器编辑的电子文档,即电子文档B1,将经过浏览器编辑的电子文档B1与转换后的电子文档B进行对比,即,通过对比确定电子文档的改变,即Part III。根据本发明的一个实施例,通过将电子文档B1的DOM树D1与电子文档B的DOM树D对比来确定电子文档的改变。按照DOM树的顺序,从根节点开始,将每个节点的所有内容和属性进行对比确定D1和D2的不同之处,确定的不同之处就是电子文档的改变,即Part III。确定的不同之处可以是节点的增加、删除或节点属性的改变;也可是节点内容的增加、删除或改变。
然后,根据本发明的方法基于电子文档的改变,即Part III生成电子文档编辑软件(这里是
Figure B2009102583390D0000071
)能够识别的动作序列。
上述处理的原因在于:Part III是用户II在浏览器上通过一系列操作在产生的,如果在电子文档编辑软件(这里是
Figure B2009102583390D0000081
Figure B2009102583390D0000082
)上进行相同的操作,那么就会产生一个完全相同的Part III。也就是说,把Part III转换为电子文档编辑软件可以识别的一系列动作(即动作序列),然后由电子文档编辑软件去执行该动作序列就会在电子文档编辑软件上生成Part III。上述动作序列就是宏(Macro),在
Figure B2009102583390D0000083
中是用VBA(Visual
Figure B2009102583390D0000084
forApplications)实现的。将上述电子文档的改变转换为宏语句并发送给电子文档编辑软件,由电子文档编辑软件执行这些宏语句,从而将电子文档的改变更新至电子文档编辑软件对应文件格式的电子文档A。如前所述,由于Part II中的格式信息被保留,这样经过上述处理后的电子文档A将包括Part I、Part II以及Part III。即,原电子文档A中的格式信息不会丢失。
下面举例来说明动作序列(宏)的生成。
假设我们有一个电子文档编辑软件对应文件格式的电子文档,该电子文档有一个一行一列的表格,表格中有“一个单元”这几个字符,其中“一个单元”这几个字符具有字符闪烁效果。该电子文档是使用某种文档格式来存储的,例如doc格式或odf格式。该电子文档显示如图2a所示(文字闪烁效果用括号中的内容表示)。
当用户II需要用浏览器对该电子文档进行在线编辑时,首先由格式转换器将其转换为html格式如下:
Figure B2009102583390D0000085
Figure B2009102583390D0000091
上述转换只针对html格式能够识别的格式信息,即Part I进行。这时,由于html格式不支持字符闪烁效果,因而其对应的格式信息将被保留,即Part II。转换后的电子文档B在浏览器中的显示如图2b所示。
上述电子文档B包括一个表格,该表格仅包括一个表格单元,该表格单元中具有文字“一个单元”。
然后,用户II利用浏览器在线编辑转换后的电子文档B。假设用户II对电子文档B进行了以下编辑:
1)在该表中增加一列,使该表格包括两个表格单元;
2)在原来的表格单元中增加“增加文字”字符,并将全部字符变成斜体;
3)在新增加的表格单元中增加“新增加的单元”字符,字体保持原来的字体;
经过用户II在线编辑过的电子文档B形成电子文档B1,其在浏览器中的显示如图2c所示。
相应的html文档如下:
Figure B2009102583390D0000092
接下来,根据本发明的一个实施例,将电子文档B和电子文档B1进行对比确定电子文档的改变。这种对比可以例如通过生成DOM树进行比较。电子文档B和电子文档B1的DOM树如附图3a和3b所示。如图3a所示,电子文档B的DOM树包含3个节点,其中根节点表示表格1,即tbl1,其具有一个叶子节点,表示表格1的第一列col1,该叶子节点进一步具有一个叶子节点,表示第一列col1的表格单元cell1。表格单元cell1具有内容、字体、颜色等属性,这里没有示出。现在参看图3b,电子文档B1的DOM树包括6个节点,与图3a的DOM树相比,根节点具有两个叶子节点,分表表示表格1的第一列col1和第二列col2,第二列col2进一步具有一个叶子节点,表示第二列col2的表格单元cell2。表格单元cell2也具有内容、字体、颜色等属性,这里也没有示出。图3b中用深灰色表示DOM树中的改变。其中,col2、cell2是增加的节点,cell1增加了内容,并且字体发生了改变(未示出),cell2增加了内容(未示出)。
通过对比电子文档B和电子文档B1的DOM树,生成如下动作序列:
@appendText(″tbl1″,″cell1″,“,增加文字”)
@makeItalic(″tbl1″,″cell1″)
@insertcolumnafter(″tbl1″,″col1″)
@insertcell(″tbl1″,″col2″)
@appendText(″tbl1″,″cell2″,“新增加的单元”)
进一步,将生成的动作序列、电子文档中浏览器不能识别的doc格式的格式信息以及经过浏览器编辑的电子文档一并存储,或者将生成的动作序列、电子文档中浏览器不能识别的doc格式的格式信息以及转换后的电子文档一并存储。电子文档编辑软件执行该动作序列,将电子文档的改变更新至原电子文档,其中电子文档编辑软件利用保留的格式信息将电子文档的改变更新至原电子文档。这时,由于原电子文档中浏览器不能识别的电子文档编辑软件对应文件格式的格式信息被保留,同时采用动作序列的方式记录电子文档的改变,原电子文档中的格式信息不会发生丢失。
下面结合图3说明根据本发明的用于对电子文档进行在线编辑的系统400。根据本发明的用于对电子文档进行在线编辑的系统400包括:格式转换器402,被配置为将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档,其中保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息,并将转换后的电子文档发送给第二应用程序;文档改变比较器404,配置成接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;并且基于上述对比确定电子文档的改变;以及动作序列生成器406,配置成基于电子文档的改变生成第一应用程序能够识别的动作序列。
进一步地,根据本发明的方法,在电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式时保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息。
进一步地,动作生成器将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储,或者将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及转换后的电子文档一并存储。进一步地,第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变更新至原电子文档。
类似地,第二应用程序是浏览器,第二应用程序能够识别的文件格式是标注语言格式。其中文档改变比较器将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比是通过对比DOM树的结构进行的。进一步地,动作序列生成器根据DOM树结构的改变生成第一应用程序能够识别的动作序列。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。
还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
虽然已经详细说明了本发明及其优点,但是应当理解在不脱离由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本申请的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者装置中还存在另外的相同要素。

Claims (18)

1.一种用于对电子文档进行在线编辑的方法,包括:
将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档;
将转换后的电子文档发送给第二应用程序;
接收经过第二应用程序编辑的电子文档;
将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;
基于上述对比确定电子文档的改变;以及
基于电子文档的改变生成第一应用程序能够识别的动作序列。
2.根据权利要求1的方法,其中:
将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档还包括保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息。
3.根据权利要求2的方法,还包括:
将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及转换后的电子文档一并存储。
4.根据权利要求2的方法,还包括:
将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储。
5.根据权利要求2、3或4的方法,还包括:
第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变更新至原电子文档。
6.根据权利要求2、3或4的方法,其中:
第一应用程序能够识别的动作序列是宏。
7.根据权利要求2、3或4的方法,其中:
第二应用程序是浏览器,第二应用程序能够识别的文件格式是标注语言格式。
8.根据权利要求7的方法,其中:
将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比是通过对比DOM树的结构进行的。
9.根据权利要求8的方法,其中:
根据DOM树结构的改变生成第一应用程序能够识别的动作序列。
10.一种用于对电子文档进行在线编辑的系统,包括:
格式转换器,被配置为将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档,并将转换后的电子文档发送给第二应用程序;
文档改变比较器,配置成接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;并且基于上述对比确定电子文档的改变;以及
动作序列生成器,配置成基于电子文档的改变生成第一应用程序能够识别的动作序列。
11.根据权利要求10的系统,其中:
将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档包括保留电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息。
12.根据权利要求11的系统,其中:
动作序列生成器将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及转换后的电子文档一并存储。
13.根据权利要求11的系统,其中:
动作序列生成器将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储。
14.根据权利要求11、12或13的系统,其中:
第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变更新至原电子文档。
15.根据权利要求11、12或13的系统,其中:
第一应用程序能够识别的动作序列是宏。
16.根据权利要求11、12或13的系统,其中:
第二应用程序是浏览器,第二应用程序能够识别的文件格式是标注语言格式。
17.根据权利要求16的系统,其中:
文档改变比较器将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比是通过对比DOM树的结构进行的。
18.根据权利要求17的系统,其中:
动作序列生成器根据DOM树结构的改变生成第一应用程序能够识别的动作序列。
CN2009102583390A 2009-12-10 2009-12-10 用于对电子文档进行在线编辑的方法和系统 Pending CN102096661A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009102583390A CN102096661A (zh) 2009-12-10 2009-12-10 用于对电子文档进行在线编辑的方法和系统
PCT/EP2010/068825 WO2011069903A1 (en) 2009-12-10 2010-12-03 Method and system for on-line editing electronic documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102583390A CN102096661A (zh) 2009-12-10 2009-12-10 用于对电子文档进行在线编辑的方法和系统

Publications (1)

Publication Number Publication Date
CN102096661A true CN102096661A (zh) 2011-06-15

Family

ID=43733923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102583390A Pending CN102096661A (zh) 2009-12-10 2009-12-10 用于对电子文档进行在线编辑的方法和系统

Country Status (2)

Country Link
CN (1) CN102096661A (zh)
WO (1) WO2011069903A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104737158A (zh) * 2013-03-13 2015-06-24 华为技术有限公司 网络数据处理方法及装置、终端
CN106168944A (zh) * 2015-05-20 2016-11-30 柯尼卡美能达株式会社 文档转换方法
CN109634588A (zh) * 2018-12-06 2019-04-16 安徽科大国创软件科技有限公司 一种兼容多浏览器的Office文档在线编辑方法和系统
CN110018984A (zh) * 2017-10-31 2019-07-16 北京国双科技有限公司 一种文件格式的转换方法及装置
CN110287462A (zh) * 2019-07-01 2019-09-27 上海一者信息科技有限公司 一种基于浏览器的跟踪修订方法及系统
CN110674082A (zh) * 2019-09-24 2020-01-10 北京字节跳动网络技术有限公司 移除在线文档的方法、装置、电子设备及计算机可读介质
CN113361239A (zh) * 2021-06-01 2021-09-07 北京百度网讯科技有限公司 文档测试方法及其装置、电子设备以及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541322A (zh) * 2020-12-16 2021-03-23 山东师范大学 一种基于Word文档的伪代码自动格式化方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030172113A1 (en) * 2002-03-05 2003-09-11 Cameron Brian A. Synchronization of documents between a server and small devices
US20040230892A1 (en) * 2003-03-17 2004-11-18 Libac Corporation Systems and methods for document project management
US20040268235A1 (en) * 2003-06-26 2004-12-30 International Business Machines Corporation Rich text handling for a web application

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030172113A1 (en) * 2002-03-05 2003-09-11 Cameron Brian A. Synchronization of documents between a server and small devices
US20040230892A1 (en) * 2003-03-17 2004-11-18 Libac Corporation Systems and methods for document project management
US20040268235A1 (en) * 2003-06-26 2004-12-30 International Business Machines Corporation Rich text handling for a web application

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JYOTI JACOB ET AL: "CX-DIFF: A Change Detection Algorithm for XML Content and Change Visualization for WebVigiL", 《DATA & KNOWLEDGE ENGINEERING》 *
YUAN WANG ET AL: "X-Diff: An Effective Change Detection Algorithm for XML Documents", 《THE 19TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104737158A (zh) * 2013-03-13 2015-06-24 华为技术有限公司 网络数据处理方法及装置、终端
CN104737158B (zh) * 2013-03-13 2018-03-13 华为技术有限公司 网络数据处理方法及装置、终端
CN106168944A (zh) * 2015-05-20 2016-11-30 柯尼卡美能达株式会社 文档转换方法
CN106168944B (zh) * 2015-05-20 2021-08-10 柯尼卡美能达株式会社 文档转换方法
CN110018984A (zh) * 2017-10-31 2019-07-16 北京国双科技有限公司 一种文件格式的转换方法及装置
CN109634588A (zh) * 2018-12-06 2019-04-16 安徽科大国创软件科技有限公司 一种兼容多浏览器的Office文档在线编辑方法和系统
CN109634588B (zh) * 2018-12-06 2022-04-08 安徽科大国创软件科技有限公司 一种兼容多浏览器的Office文档在线编辑方法和系统
CN110287462A (zh) * 2019-07-01 2019-09-27 上海一者信息科技有限公司 一种基于浏览器的跟踪修订方法及系统
CN110287462B (zh) * 2019-07-01 2023-03-28 上海一者信息科技有限公司 一种基于浏览器的跟踪修订方法及系统
CN110674082A (zh) * 2019-09-24 2020-01-10 北京字节跳动网络技术有限公司 移除在线文档的方法、装置、电子设备及计算机可读介质
CN110674082B (zh) * 2019-09-24 2023-03-14 北京字节跳动网络技术有限公司 移除在线文档的方法、装置、电子设备及计算机可读介质
CN113361239A (zh) * 2021-06-01 2021-09-07 北京百度网讯科技有限公司 文档测试方法及其装置、电子设备以及存储介质

Also Published As

Publication number Publication date
WO2011069903A1 (en) 2011-06-16

Similar Documents

Publication Publication Date Title
CN102096661A (zh) 用于对电子文档进行在线编辑的方法和系统
CN104461484B (zh) 前端模板的实现方法和装置
CN101059695B (zh) 对控制器结构和变量名称的可编程访问
CN101048773B (zh) 文件分析系统以及文件分析方法
CN101211336B (zh) 可视化生成查询文件的系统及方法
CN103530407B (zh) 一种富文本文档的生成方法与装置
CN106775770A (zh) 基于类信息构建查询语句的查找方法
CN102096581B (zh) 生成微件的方法及装置
CN103020237B (zh) 一种网页更新方法和装置
CN103488754A (zh) 一种异构文档协作云服务间透明互操作的方法
CN101551800A (zh) 标注信息生成装置、查询装置及共享系统
US20080282171A1 (en) System and method for production of online magazines
CN105574092A (zh) 信息挖掘方法和装置
Jiang et al. Towards reengineering web sites to web-services providers
EP2423837B1 (en) Method and system for viewing web page and computer program product thereof
CN111831815B (zh) 问卷显示的控制方法、装置、存储介质和电子设备
CN106874240A (zh) 数字出版方法及系统
CN115293124A (zh) 软件工程化文档自动生成方法及装置
CN101917282B (zh) 一种告警屏蔽规则的处理方法、装置及系统
CN102411498A (zh) 一种实现数据模型的方法及图形化设计器
JP2006244510A (ja) 出力制御装置
CN101840402A (zh) 从多语言网站构建多语言的对象层次结构的方法和系统
KR100337373B1 (ko) 컴퓨터 지원 설계 시스템에서의 설계정보 관리 방법
CN101268438A (zh) 数据处理装置
JP2007183849A (ja) 文書処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110615