CN102360350B - 将样式破坏从可扩展标记语言文档中移除 - Google Patents

将样式破坏从可扩展标记语言文档中移除 Download PDF

Info

Publication number
CN102360350B
CN102360350B CN2011102853950A CN201110285395A CN102360350B CN 102360350 B CN102360350 B CN 102360350B CN 2011102853950 A CN2011102853950 A CN 2011102853950A CN 201110285395 A CN201110285395 A CN 201110285395A CN 102360350 B CN102360350 B CN 102360350B
Authority
CN
China
Prior art keywords
xml
document
pattern
ruined
document based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2011102853950A
Other languages
English (en)
Other versions
CN102360350A (zh
Inventor
S·贡多罗夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102360350A publication Critical patent/CN102360350A/zh
Application granted granted Critical
Publication of CN102360350B publication Critical patent/CN102360350B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及将样式破坏从可扩展标记语言文档中移除。使用系统输入输出通过文档的样式定义部分来将未被使用的、重复的或被破坏的样式从基于XML的文档文件中移除。该移除基于对在相应的文档文件的可压缩分组中包含的信息的分析。也可使用相同的方法来移除其他不正确的文件内容,诸如被破坏的名称范围或未被使用的值格式定义等。

Description

将样式破坏从可扩展标记语言文档中移除
技术领域
本发明涉及将不正确的文件内容从可扩展标记语言文档中移除的方法和计算设备。
背景技术
可扩展标记语言(XML)是用于以机器可读的形式来编码电子文档以获得因特网上的简单性、通用性和可用性的一组标准化规则。尽管对该文本数据格式的设计聚焦于文档,但是例如在web服务中它被广泛使用来表示任意数据结构。具有XML的各种版本和变型。XML类型的一个示例是由华盛顿州雷蒙德市的微软公司开发的标准化Office Open XML(OOXML)文件格式。OOXML包括可用来表示电子office文档的一组文件格式。该格式为文字处理文档、电子表格和演示文稿定义了一组XML标记词汇,并为诸如数学公式、图形、参考书目和类似内容等内容定义了具体的XML标记词汇。该标准化OOXML格式旨在通过使得经由多个创建者的以及在多个平台上的实现成为可能来便于可扩展性和互操作性。
通常被称为“样式表”的样式定义文档部分是将演示文稿与在用于存储及将格式化应用于文本的文档处理程序中的内容分开的表单。各个样式可作为默认样式而被包括在文档模板内,或者可由用户使用指示了如何来对数据的所选部分进行格式化的各种命令来创建。样式表有助于使发布物保持一致性,使得诸如正文、标题、脚注、页码格式、字体颜色、背景颜色等常见元素始终都看起来是相同的。样式表也节省了时间,它允许作者在一个操作中就将格式应用于所选的各个元素,而不是将格式一次应用于一个元素。
当在文档中使用定制样式定义时,具有破坏文件内容的潜在可能。在某些场景中,当内容是从多个文档复制而来的时,具有定制样式可由于与文档结构有关的各种原因而导致文件破坏。OOXML分组是包含XML文档或诸如与文档有关的样式定义等其他资源的经压缩(或可压缩)分组。OOXML分组的内容可由应用程序或工具来访问,而不必激活用来编辑文档本身的应用程序。
发明内容
提供本发明内容以便以简化的形式介绍将在以下的具体实施方式中进一步描述的一些发明内容。本概述并不旨在专门标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
各实施例旨在从基于XML的文档文件中移除未被使用的、重复的或被破坏的样式。该移除可使用系统输入输出来涉及文档的定制样式部分,并且该移除基于对在相应文档文件的可压缩分组中包含的信息的分析。也可使用相同的方法来将诸如被破坏的名称范围或未被使用的值格式定义等其他不正确的文件内容移除。
通过阅读以下的详细描述并参考相关的附图,这些及其它特征和优点将变得显而易见。可以理解,前述一般描述和以下的详细描述都是说明性的,并且不限制所要求保护的各方面。
附图说明
图1是示出了本地和远程破坏移除算法的示例的图示。
图2示出了显示有破坏移除算法的主要组件的系统图示;
图3示出了在破坏移除算法内的各个模块;
图4示出了在概念上将被破坏的样式定义从XML文档移除;
图5是可实现根据各实施例的系统的联网环境;
图6是可实现各实施例的示例性计算操作环境的框图;以及
图7示出了根据各实施例的在XML文档中移除被破坏的样式的过程的逻辑流程图。
具体实施方式
如之前简要描述地,可使用系统输入输出组件来将未被使用的、重复的或被破坏的样式从XML文件的样式部分中移除。对在XML分组部分内包含的信息的分析可指导对被破坏部分的移除。也可移除其他不正确的文件内容。在以下的详细描述中,参考了构成详细描述的一部分并作为说明示出各具体实施例或示例的附图。可以组合这些方面,可以利用其它方面,并且可以在不背离本发明的精神或范围的前提下做出结构上的改变。因此,以下详细描述并不旨在限制,并且本发明的范围由所附权限要求及其等效方案来定义。
尽管在结合在个人计算机上的操作系统上运行的应用程序执行的程序模块的一般上下文中描述了各实施方式,但是本领域的技术人员会认识到各方面也可以结合其它程序模块实现。
一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其它类型的结构。此外,本领域的技术人员可以明白,各实施例可以用其它计算机系统配置来实施,包括手持式设备、多处理器系统、基于微处理器或可编程消费者电子产品、小型计算机、大型计算机以及类似计算设备。各实施例还可以在任务由通过通信网络链接的远程处理设备来执行的分布式计算环境中实现。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备两者中。
各实施例可被实现为计算机实现的过程(方法)、计算系统、或者诸如计算机程序产品或计算机可读介质等的制品。计算机程序产品可以是计算机系统可读并且编码包括用于使计算机或计算系统执行示例过程的指令的计算机程序的计算机存储介质。计算机可读存储介质可例如通过易失性计算机存储器、非易失性存储器、硬盘驱动器、闪存驱动器、软盘或紧致盘以及类似存储介质中的一个或多个来实现。
贯穿本说明书,术语“平台”可以是用于管理计算机和网络操作的软件和硬件组件的组合。平台的示例包括但不限于,在多个服务器上执行的托管服务、在单个服务器上执行的应用程序以及类似系统。术语“服务器”一般指通常在联网环境中执行一个或多个软件程序的计算设备。然而,服务器还可以被实现为被视作网络上的服务器的、在一个或多个计算设备上执行的虚拟服务器(软件程序)。以下提供关于这些技术和示例操作的更多细节。
图1是示出了本地和远程破坏移除算法的示例的图示。在图示100中,本地执行的算法112可访问本地存储在计算机110上的XML文档。该计算机可以是诸如台式机、笔记本、手持式计算机、蜂窝电话、智能电话、PDA和类似设备等任何计算设备。算法可访问定制样式定义中的破坏,并将它们移除(例如,将定制样式定义移除)。算法也可在确定文档使用了哪些样式定义后,保持所使用的样式定义,以避免由于样式的数量超过预定义的阈值而造成的文档破坏。类似地,本地算法122可在膝上型计算机120等上执行。
可通过诸如通过网络下载、(例如使用便携式数据存储设备来进行的)手动安装或类似的方法之类的各种手段来向计算设备(110、120)提供本地算法。根据一些实施例,可执行本地算法的多个实例来处理多个文档。在每一情况中,由于算法可在不打开文档的情况下访问各样式部分,因此激活与文档相关联的应用程序(例如,电子表格应用程序、文字处理应用程序等)是没有必要的。
在其他实施例中,可将移除算法主存在远程服务器140处。本地计算机110和120可通过网络130来在诸如文档共享web服务中访问在文档服务器上的文档。所共享的文档可包括被结构化为XML文档的电子表格、文字处理文档、演示文稿等。因此,可将文档存储在包含XML文档和诸如与文档相关联的样式定义等其他资源的分组中。远程算法可周期性地或依据需求来扫描文档,并在没有打开相应的文档的情况下将破坏的定制样式移除。
图2示出了显示有破坏移除算法的主要组件的系统图示。在图示200中,文档处理器220可以是用于快速处理XML文档的过滤应用程序。这种模块可打开多个XML文档,其包括但不限于电子表格、图表、文字处理文档、和演示文稿等。文档处理器220可通过使用系统IO来快速打开文档。
表单样式工具230可以是设置来利用核心应用程序模块文件解析器210的图形工具。表单样式工具230可向用户呈现允许用户通过图形来与文件解析器210进行交互的界面。分组助手模块240可确定用户所请求的或系统所请求的XML分组的有效性,并用字节流来打开该分组。文件解析器210可基于对在相应文件的XML分组部分中包含的信息的分析,通过程序将未被使用的、重复的、或被破坏的样式从XML分组的样式部分中移除,而无需激活富客户机(与具体文档类型相关联的应用程序)。
图3示出了破坏移除算法内的各个模块。根据一些实施例,文件解析器模块300可实现基于示例性定制样式定义的破坏移除算法。文件解析器模块300的组件320可从文档的XML分组的样式部分中获取样式信息而无需激活富客户机应用程序,而另一个组件330可将文件的内容从该文件的一个实例处复制到另一个实例处。该改变也可在存储于存储器中的相同文件上执行。文件解析器300可通过以下方式来移除未被使用的样式(310):(例如由组件320来)扫描在XML分组中包含的所有样式部分;将在文档中定义的样式与分组中包含的部分相匹配;以及标识未被使用的和/或重复的样式。也可移除重复的样式。
文件解析器300也可在各定制样式之间检查可纠正的样式(312)。也称为内置样式的默认样式(与定制样式相反)较不容易遭到破坏,但是在某些情况下它们也能受到破坏。一般不能使用客户机应用程序对象模型来移除被破坏的内置样式,但能使用本文中描述的算法来对其进行访问和纠正。根据其他实施例,文件解析器模块300的组件可通过将各样式重置为默认格式来将所有的样式设置为普通(314)。然而,另一个组件可提供可任选地显示文档的可能性(316)。
文件解析器模块300也可出于反馈或配置的目的而向用户提供样式信息。此外,如上所述,样式信息可在自动判定过程中由算法使用来判定是保持还是丢弃所使用的定制样式。
图4示出了在概念上将被破坏的样式定义从XML文档中移除。由文件解析器420来实现的移除算法可扫描具有多个样式定义的文档410,该多个样式定义中的一些可能是破坏的、未被使用的或重复的。一旦标识了破坏的、未被使用的、和/或重复的样式,文件解析器420就可尝试将其移除,从而使得文档430具有经纠正的样式定义。如果移除不可行或者失败了,则文件解析器420可通过执行一设置为普通的操作来将文档设置为具有客户机应用程序的默认样式的默认格式。
各文档之间的复制和粘贴操作可增加在最终文档中的定制样式的数量,因为对经复制的数据的格式化也会被延续至新的文档。可能具有为每个客户机应用程序限制的预定数量的定制样式。如果定制样式的数量超出了该限制,则文档可能被破坏并转变成不可修复的状态。达到不可修复的破坏的定制样式的预定限制可能相对较高(例如,对于某些电子表格应用程序而言为65534)。然而,在其中文档内数据被多个用户持续进行修改、复制、粘贴的文档共享环境中,这种限制在相对较短的时间范围内就能达到。为了防止用户沮丧并防止用户浪费时间和精力来重建文档,破坏移除算法可在如下背景下执行:这些文档共享服务通过将破坏的、未被使用的或重复的样式移除来不断地减少与每个文档相关联的样式定义的数量。
算法可使用系统输入输出(I/O)库来直接访问XML文件。系统I/O库提供对破坏文件的直接访问。这可消除在诸如文字处理器应用程序、电子表格应用程序、图表应用程序、浏览应用程序或演示应用程序等相关联的应用程序中打开破坏文件以便清除样式或其他内容的需求。
根据一些实施例,XML文档破坏移除算法可以是可执行的独立命令行。根据其他实施例,算法可被实现为具有图形用户界面的独立应用程序。根据另外的实施例,算法也可被实现为与用于自动纠正文档的服务器侧应用程序集成在一起的服务器侧库(例如,服务器侧特征或工具集)。
以上描述的样式破坏移除算法的系统和实现是为了例示的目的,并且不构成对各实施例的限制。可使用在此描述的原理用其他模块、过程和配置来将破坏的、未被使用的、或重复的样式从诸如XML文档等结构化文档中移除。
图5是可实现各实施例的示例性联网环境。基于定制样式的破坏移除算法可经由在一个或多个服务器544或诸如托管服务的单个服务器(例如web服务器)546上执行的软件来实现。该平台可以通过网络540来与诸如智能电话543、膝上型计算机542、或台式计算机541(“客户机设备”)等各个计算设备上的瘦客户机应用程序进行通信。
如上所述,文档服务器可执行在服务器侧上的算法,以处理由该服务器存储的文档。用户可在终端设备(客户机设备541-543中的任一个、或者智能电话、计算机、智能汽车控制台等)中运行破坏移除算法。算法可自动地或依据需求来将未被使用的或破坏的样式从XML文档中移除。
如之前所描述地,客户机设备541-543可允许对在远程服务器(例如,服务器544中的一个)上执行的应用程序进行访问。服务器可直接地或通过数据库服务器548来从数据存储549中检索相关的数据,或将相关的数据存储到数据存储549中。
网络540可包括服务器、客户机、因特网服务供应商以及通信介质的任何拓扑结构。根据各实施例的系统可以具有静态或动态拓扑结构。网络540可包括诸如企业网络等安全网络、诸如无线开放网络等非安全网络、或因特网。网络540还可通过诸如公共交换电话网络(PSTN)或蜂窝网络等其他网络来协调通信。此外,网络540可包括诸如蓝牙或类似网络等短程无线网络。网络540提供此处描述的节点之间的通信。作为示例而非限制,网络540可以包括例诸如声学、RF、红外线和其它无线介质等的无线介质。
可以采用计算设备、应用程序、数据源和数据分发系统的许多其它配置来实现来自XML文档的破坏移除算法。此外,图5中描述的联网环境仅用于说明的目的。各实施例不限于示例应用程序、模块或过程。
图6及相关描述旨在提供对其中可实现各实施例的合适计算环境的简要概括描述。参考图6,示出了根据各实施的例如计算设备600的用于应用程序的示例性计算操作环境的框图。在基本配置中,计算设备600可以是执行具有破坏样式移除的文档清理工具的客户机设备,并包括至少一个处理单元602和系统存储器604。计算设备600还可以包括协作执行程序的多个处理单元。取决于计算设备的确切配置和类型,系统存储器604可以是易失性(诸如RAM)、非易失性(诸如ROM、闪存等)或是两者的某种组合。系统存储器604通常包括适于控制平台的操作的操作系统605,例如来自华盛顿州雷德蒙市的微软公司的
Figure BSA00000580998400071
操作系统。系统存储器604还可包括一个或多个软件应用程序,诸如程序模块606、样式工具622和文件解析器模块624。
样式工具622可以是在客户机、服务器和其他设备上的用于将XML文件中的基于定制样式的破坏移除的服务的一部分。文件解析模块624可将破坏的、未被使用的、或重复的样式从XML文档中移除。该基本配置在图6中由虚线608内的那些组件示出。
计算设备600可以具有附加特征或功能。例如,计算设备600还以可包括附加数据存储设备(可移动和/或不可移动的),例如磁盘、光盘或磁带。在图6中通过可移动存储609和不可移动存储610示出这样的附加存储。计算机可读介质可以包括以用于存储例如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。系统存储器604、可移动存储609和不可移动存储610都是计算机可读存储介质的示例。计算机可读存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术,CD-ROM、数字多功能盘(DVD)或其它光学存储,磁带盒、磁带、磁盘存储或其它磁存储设备,或能用于存储所需信息且能够由计算设备600访问的任何其它介质。任何这样的计算机可读存储介质都可以是计算设备600的一部分。计算设备600还可以具有输入设备612,诸如键盘、鼠标、笔、语音输入设备、触摸输入设备和类似输入设备。还可以包括输出设备614,诸如显示器、扬声器、打印机和其它类型的输出设备。这些设备在本领域中公知并且无需在此处详细讨论。
计算设备600还可以包含允许该设备与其他设备618通信的通信连接616,诸如通过分布式计算环境中的无线网络、卫星链接、蜂窝链接和类似机制。它他设备618可以包括执行通信应用程序的计算机设备、其它目录或策略服务器和类似设备。通信连接616是通信介质的一个示例。通信介质可以包括计算机可读指令、数据结构、程序模块、或者诸如载波或其它传输机制等的已调制数据信号中的其它数据,并且包括任何信息传递介质。术语“已调制数据信号”是指其一个或多个特征以这样的方式设置或改变以便在信号中对信息进行编码的信号。作为示例而非限制,通信介质包括如有线网络或直接线连接之类的有线介质,以及如声学、RF、红外及其他无线介质之类的无线介质。
各示例实施例还包括各种方法。这些方法可以用任何数量的方式,包括本文中所描述的结构来实现。一种此类方式是通过本文中描述的类型的设备的机器操作。
另一可任选方式是结合一个或多个人类操作者执行该方法的各个操作中的某一些来执行该方法的一个或多个独立操作。这些人类操作者无需彼此同在一处,而是其每一个可以仅与执行程序的一部分的机器同在一处。
图7示出了在根据各实施例的在XML文档中移除被破坏的样式的过程700的逻辑流程图。过程700可由客户机侧算法或由作为文档存储服务器的一部分的服务器侧算法来实现。
过程700起始于操作710,其验证分组是XML分组,将文件标识为XML分组,并确定该XML分组是否有效。XML分组的有效性可确定算法是否能够纠正文档中的任何样式破坏。该算法可通过检查文件是否具有由分组XML文档的标准所定义的所有部分,来确定该XML文件的有效性。在操作720,算法可从分组的样式部分处读取样式信息,而无需在富客户机应用程序中打开相应的文档。在操作730可使用所收集的样式信息来将样式与文档部分匹配,在操作740确定未被使用的、被破坏的和重复的样式。
算法的另一个判定点可以是样式的数量。如之前提到的,具有对可在文档中使用的定制样式的数量的限制。如果超出了那个限制,则整个文档可被破坏并且不可恢复。因此,在操作750处,算法可通过将未被使用的和/或重复的样式以及破坏的样式移除来纠正破坏。或者,算法可将文档恢复成默认样式。算法也可标识并移除如被破坏的命名范围之类的其他被破坏的内容,并将其移除。对于其他内容,方法与用于样式的方法类似:可读入部分定义;可确定该部分是否被破坏;如果该部分未被破坏,可标识需要被移除的内容(例如,测试以查找重复,测试以查看在文档中是否使用了部分内容,以及标记为被使用和/或未被使用)。然后,可允许用户在清理路径上决定:例如保持还是移除标记为未被使用的定义。
包括在过程700内的各操作是用于说明目的。根据各实施例的破坏移除过程可以使用此处所述的各原理通过具有更少或更多步骤的相似过程、以及不同的操作次序来实现。
以上说明书、示例和数据提供了对各实施例组成的制造和使用的全面描述。尽管用结构特征和/或方法动作专用的语言描述了本主题,但是可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求和各实施例的示例形式而公开的。

Claims (13)

1.一种用于将样式破坏从基于可扩展标记语言(XML)的文档中移除的至少部分在计算设备中执行的方法,该方法包括:
读取与基于XML的文档相关联的样式信息;
确定所述基于XML的文档是否具有多于预定数量的定制样式;
如果确定所述基于XML的文档不具有多于预定数量的定制样式,则通过将所述文档的样式定义与文档分组中的样式部分相匹配,来从一组未被使用的、被破坏的或重复的样式中确定至少一个未被使用的、被破坏的或重复的样式;
将所述未被使用的、被破坏的或重复的样式移除,而无需在与所述基于XML的文档相关联的富应用程序中打开所述基于XML的文档;
确定被破坏的名称范围;以及
将所述被破坏的名称范围从所述基于XML的文档中移除。
2.如权利要求1所述的方法,其特征在于,还包括:
如果确定所述基于XML的文档具有多于预定数量的定制样式,则呈现将所述基于XML的文档恢复成默认格式的选项;以及
响应于一肯定的选择,通过移除所有的定制样式来将所述基于XML的文档恢复成所述默认格式。
3.如权利要求1所述的方法,其特征在于,将所述未被使用的、被破坏的或重复的样式移除包括:
向用户呈现所述基于XML的文档的样式信息;
在用户确定后,将所述未被使用的、被破坏的或重复的样式移除。
4.如权利要求1所述的方法,其特征在于,将所述未被使用的、被破坏的或重复的样式移除包括:
自动将所述未被使用的、被破坏的或重复的样式移除。
5.如权利要求4所述的方法,其特征在于,在自动的基于XML的文档的恢复期间,将所述未被使用的、被破坏的或重复的样式移除。
6.一种用于将样式破坏从可扩展标记语言(XML)文档中移除的方法,所述方法包括:
确定包含要被检查的基于XML的文档的文档分组是否是有效的XML分组;
读取与所述基于XML的文档相关联的样式信息;
确定所述基于XML的文档是否具有多于预定数量的定制样式;
如果确定所述基于XML的文档不具有多于预定数量的定制样式,则通过将所述基于XML的文档的样式定义与文档分组中的样式部分相匹配,来从一组未被使用的、被破坏的或重复的样式中确定至少一个未被使用的、被破坏的或重复的样式;
将所述未被使用的、被破坏的或重复的样式移除,而无需在与所述基于XML的文档相关联的富应用程序中打开所述基于XML的文档;
确定被破坏的名称范围;以及
将所述被破坏的名称范围从所述基于XML的文档中移除。
7.如权利要求6所述的方法,其特征在于,还包括:
如果确定所述基于XML的文档具有多于预定数量的定制样式,则呈现将所述基于XML的文档恢复成默认格式的选项;以及
响应于一肯定的选择,通过移除所有的定制样式来将所述基于XML的文档恢复成所述默认格式。
8.如权利要求7所述的方法,其特征在于,所述方法被实现为命令行可执行程序、程序库、和服务器工具集中的一个。
9.如权利要求6所述的方法,其特征在于,所述方法是在文档共享服务中实现的,以自动将样式破坏从所述服务处的共享文档中移除。
10.如权利要求6所述的方法,其特征在于,所述方法被实现为客户机设备上的样式工具,并且还被配置来呈现一图形用户界面来提供具有将被破坏的样式移除的配置的选项。
11.一种用于将样式破坏从可扩展标记语言(XML)文档中移除的方法,所述方法包括:
确定包括要被检查的基于XML的文档的文档分组是否是有效的XML分组;
读取与所述基于XML的文档相关联的样式信息;
确定所述基于XML的文档是否具有多于预定数量的定制样式;
如果所述基于XML的文档具有多于预定数量的定制样式,则通过移除所有的定制样式来将所述基于XML的文档恢复成默认格式;否则
通过将所述基于XML的文档的样式定义与文档分组内的样式部分相匹配,来从一组未被使用的、被破坏的或重复的样式中确定至少一个未被使用的、被破坏的或重复的样式;
将所述未被使用的、被破坏的或重复的样式移除,而无需在与所述基于XML的文档相关联的富应用程序中打开所述基于XML的文档;
确定被破坏的名称范围;以及
将所述被破坏的名称范围从所述基于XML的文档中移除。
12.如权利要求11所述的方法,其特征在于,与所述基于XML的文档相关联的所述富应用程序包括以下各项中的一个:文字处理应用程序、电子表格应用程序、演示应用程序、表格应用程序和浏览应用程序。
13.如权利要求11所述的方法,其特征在于,将所述未被使用的、被破坏的或重复的样式移除包括通过将所述XML中的不正确的值设置成预定的默认值来替换所述不正确的值。
CN2011102853950A 2010-09-08 2011-09-07 将样式破坏从可扩展标记语言文档中移除 Active CN102360350B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/877,860 US8281236B2 (en) 2010-09-08 2010-09-08 Removing style corruption from extensible markup language documents
US12/877,860 2010-09-08

Publications (2)

Publication Number Publication Date
CN102360350A CN102360350A (zh) 2012-02-22
CN102360350B true CN102360350B (zh) 2013-08-21

Family

ID=45585679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102853950A Active CN102360350B (zh) 2010-09-08 2011-09-07 将样式破坏从可扩展标记语言文档中移除

Country Status (7)

Country Link
US (1) US8281236B2 (zh)
EP (1) EP2614447A4 (zh)
CN (1) CN102360350B (zh)
RU (1) RU2586872C2 (zh)
SG (1) SG188256A1 (zh)
WO (1) WO2012033584A2 (zh)
ZA (1) ZA201301388B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011156624A2 (en) 2010-06-09 2011-12-15 Regents Of The University Of Minnesota Dual mode ultrasound transducer (dmut) system and method for controlling delivery of ultrasound therapy
WO2012142455A2 (en) 2011-04-14 2012-10-18 Regents Of The University Of Minnesota Vascular characterization using ultrasound imaging
JP2014206967A (ja) * 2013-03-18 2014-10-30 株式会社Genusion 記憶装置
WO2015013196A2 (en) 2013-07-23 2015-01-29 Regents Of The University Of Minnesota Ultrasound image formation and/or reconstruction using multiple frequency waveforms
US9372681B1 (en) * 2013-10-02 2016-06-21 Google Inc. Redirection of a document URL to a natively-operating application
US9665546B1 (en) 2015-12-17 2017-05-30 International Business Machines Corporation Real-time web service reconfiguration and content correction by detecting in invalid bytes in a character string and inserting a missing byte in a double byte character
US11458337B2 (en) 2017-11-28 2022-10-04 Regents Of The University Of Minnesota Adaptive refocusing of ultrasound transducer arrays using image data
US11596812B2 (en) 2018-04-06 2023-03-07 Regents Of The University Of Minnesota Wearable transcranial dual-mode ultrasound transducers for neuromodulation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7152055B2 (en) * 1999-12-14 2006-12-19 Sun Microsystems, Inc. Method and system for reducing document file size by deleting unused and duplicate template data
CN101004752A (zh) * 2006-12-26 2007-07-25 国电南瑞科技股份有限公司 电力系统多区域网络模型拼接方法
US7673231B2 (en) * 2005-06-24 2010-03-02 Sun Microsystems, Inc. Optimized markup language processing using repeated structures in markup language source

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6230173B1 (en) * 1995-07-17 2001-05-08 Microsoft Corporation Method for creating structured documents in a publishing system
US6463440B1 (en) * 1999-04-08 2002-10-08 International Business Machines Corporation Retrieval of style sheets from directories based upon partial characteristic matching
US6589291B1 (en) * 1999-04-08 2003-07-08 International Business Machines Corporation Dynamically determining the most appropriate location for style sheet application
US6567826B1 (en) 2000-06-23 2003-05-20 Microsoft Corporation Method and system for repairing corrupt files and recovering data
US20040205491A1 (en) * 2001-05-30 2004-10-14 Aravinda Korala Software and method for self-service applications
US7017162B2 (en) * 2001-07-10 2006-03-21 Microsoft Corporation Application program interface for network software platform
AU2002359821A1 (en) * 2001-12-21 2003-07-15 Xmlcities, Inc. Extensible stylesheet designs using meta-tag and/or associated meta-tag information
KR20050011745A (ko) * 2002-04-19 2005-01-29 컴퓨터 어소시에이츠 싱크, 인코포레이티드 추론 서비스 제공 시스템 및 방법
WO2003094007A1 (en) * 2002-05-02 2003-11-13 Sarvega, Inc. System and method for transformation of xml documents using stylesheets
CN1653419A (zh) * 2002-05-17 2005-08-10 皇家飞利浦电子股份有限公司 在浏览器上呈现第一媒体类型内容
US7117429B2 (en) * 2002-06-12 2006-10-03 Oracle International Corporation Methods and systems for managing styles electronic documents
US20040001087A1 (en) * 2002-06-27 2004-01-01 Warmus James L. Methods and apparatus for electronic distribution of customized content via a broadcast signal
US7373595B2 (en) * 2002-06-27 2008-05-13 Microsoft Corporation System and method for validating an XML document and reporting schema violations
US20080077870A1 (en) * 2004-01-09 2008-03-27 Suzanne Napoleon Method and apparatus for producing structured sgml/xml student compositions
US7617444B2 (en) 2004-12-20 2009-11-10 Microsoft Corporation File formats, methods, and computer program products for representing workbooks
US20060259854A1 (en) * 2005-05-10 2006-11-16 Microsoft Corporation Structuring an electronic document for efficient identification and use of document parts
US20070022128A1 (en) * 2005-06-03 2007-01-25 Microsoft Corporation Structuring data for spreadsheet documents
US7496612B2 (en) * 2005-07-25 2009-02-24 Microsoft Corporation Prevention of data corruption caused by XML normalization
US7428582B2 (en) * 2005-12-29 2008-09-23 American Express Travel Related Services Company, Inc Semantic interface for publishing a web service to and discovering a web service from a web service registry
US20080077879A1 (en) * 2006-09-25 2008-03-27 Black Andre B Interface with multiple rows of tabs having tabs at fixed relative positions
US7669089B2 (en) * 2006-11-01 2010-02-23 Microsoft Corporation Multi-level file representation corruption
WO2008097801A2 (en) * 2007-02-05 2008-08-14 Skyway Software, Inc. Method and system for creating, deploying, and utilizing a service
US7895598B2 (en) * 2007-06-15 2011-02-22 Microsoft Corporation Page and device-optimized cascading style sheets
WO2009018177A2 (en) * 2007-07-27 2009-02-05 Deluxe Digital Studios, Inc. Methods and systems for use in customizing displayed content associated with a portable storage medium
US8339641B2 (en) * 2008-12-30 2012-12-25 Konica Minolta Laboratory U.S.A., Inc. Systems and methods for processing packaged print data streams
US8788928B2 (en) * 2009-07-15 2014-07-22 Clandscale, Inc. System and methodology for development of stream processing applications utilizing spreadsheet interface
US11102325B2 (en) * 2009-10-23 2021-08-24 Moov Corporation Configurable and dynamic transformation of web content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7152055B2 (en) * 1999-12-14 2006-12-19 Sun Microsystems, Inc. Method and system for reducing document file size by deleting unused and duplicate template data
US7673231B2 (en) * 2005-06-24 2010-03-02 Sun Microsystems, Inc. Optimized markup language processing using repeated structures in markup language source
CN101004752A (zh) * 2006-12-26 2007-07-25 国电南瑞科技股份有限公司 电力系统多区域网络模型拼接方法

Also Published As

Publication number Publication date
WO2012033584A2 (en) 2012-03-15
US8281236B2 (en) 2012-10-02
RU2586872C2 (ru) 2016-06-10
EP2614447A4 (en) 2017-11-22
WO2012033584A3 (en) 2012-05-03
US20120060086A1 (en) 2012-03-08
EP2614447A2 (en) 2013-07-17
RU2013110284A (ru) 2014-09-20
ZA201301388B (en) 2014-04-30
CN102360350A (zh) 2012-02-22
SG188256A1 (en) 2013-04-30

Similar Documents

Publication Publication Date Title
CN102360350B (zh) 将样式破坏从可扩展标记语言文档中移除
CN101983380B (zh) 文档的同步协作审阅
CN101535934B (zh) 提供用于查看和编辑元数据的定制用户界面的方法和系统
CN1794231B (zh) 具有替换格式的上下文无关的文档部分
CN102246157B (zh) 隔离由插件代码主存的应用程序的方法和系统
EP1830275A1 (en) Information distribution system
CN101263477B (zh) 用于管理与计算机生成文档相关联的数据的系统和方法
CN102541844A (zh) 为第三方内容馈源应用提供多语言翻译
CN103150492A (zh) 用于处理使用权利表达的方法和装置
CN102693127A (zh) 用于描述并执行图形用户界面中的管理任务的数据驱动模式
CN101981567A (zh) 预配之后的用户已翻译站点
CN104272293A (zh) 针对计算设备的远程企业策略/客户端配置安装
US20170300305A1 (en) Executable guidance experiences based on implicitly generated guidance models
CN101416143A (zh) 基于许可的用户界面变形
CN105027116A (zh) 电子阅读器内平面书籍到富书籍的转换
CN102779029A (zh) 一种对JavaScript代码加扰的方法及设备
CN101853163B (zh) 一种基于组装业务建模的行业应用软件系统构建方法
US7546541B2 (en) Method and apparatus for iterative refinement of generated user-interface markup
US7802181B2 (en) Document processing device and document processing method
CN101512972A (zh) 将网络环境中的空间个性化
US20080043272A1 (en) Method, system and article for exposing printer functionality via a logical file system
CN102270129A (zh) 将软件产品分发为包括脚本逻辑和外部资源的可执行文件
Alves Getting Started with Oracle Event Processing 11g
Çelikbaş EPUB use in digital libraries: Developing an online epub creator application
CN102193955B (zh) 一种生成Facelets页面的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150423

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150423

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.