CN104462045B - 一种文档处理方法和装置 - Google Patents

一种文档处理方法和装置 Download PDF

Info

Publication number
CN104462045B
CN104462045B CN201410778704.1A CN201410778704A CN104462045B CN 104462045 B CN104462045 B CN 104462045B CN 201410778704 A CN201410778704 A CN 201410778704A CN 104462045 B CN104462045 B CN 104462045B
Authority
CN
China
Prior art keywords
style
document
content
public
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410778704.1A
Other languages
English (en)
Other versions
CN104462045A (zh
Inventor
侯霞
李宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuxin Kunpeng (Beijing) Information Technology Co.,Ltd.
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN201410778704.1A priority Critical patent/CN104462045B/zh
Publication of CN104462045A publication Critical patent/CN104462045A/zh
Application granted granted Critical
Publication of CN104462045B publication Critical patent/CN104462045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种文档处理方法和装置。所述文档处理方法,包括:获取文档内容;获取所述文档内容对应的至少一种文档式样ID;从所述至少一种文档式样ID中,选择第一文档式样ID;从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;以所述第一文档式样定义的文档式样,显示所述文档内容。本发明中用户仅需编辑内容,可省去大量繁重的式样设置工作,方便了用户的编辑工作,保证式样的规范性,减少存储空间和网络传输的资源消耗。

Description

一种文档处理方法和装置
技术领域
本发明涉及文档处理领域,特别是指一种文档处理方法和装置。
背景技术
XML(可扩展置标语言)的一大特点是内容与式样分离。但是基于XML的办公文档的格式标准中,式样信息在数据中占很大一部分比例。文档格式描述中,内容和式样仍然是混杂在一起的。在所见即所得的编辑模式下,用户编辑文档时,需要做很多的排版工作来编辑文档的式样。文档排版不但给作者带来很大的负担,而且文档作者的排版能力很难达到专业水平,导致最终排版不能完全符合需求。
发明内容
本发明要解决的技术问题是,提供一种文档处理方法和装置,能够方便用户的编辑工作。
一方面,提供一种文档处理方法,包括:
获取文档内容;
获取所述文档内容对应的至少一种文档式样ID;
从所述至少一种文档式样ID中,选择第一文档式样ID;
从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;
以所述第一文档式样定义的文档式样,显示所述文档内容。
所述获取所述文档内容对应的至少一种文档式样ID的步骤包括:
获取所述文档内容的关键字,获取所述关键字对应的文档式样ID;或者
获取所述文档内容的大纲结构,获取所述大纲结构对应的文档式样ID;或者
获取所述文档内容的文档类型,获取所述文档类型对应的文档式样ID; 或者
根据用户指令,获取所述文档内容对应的至少一种文档式样ID。
所述第一文档式样包括至少一种文档子式样;
所述以所述第一文档式样定义的文档式样,显示所述文档内容的步骤包括:
获取所述文档内容的各单元内容;
获取所述文档内容的各单元内容与所述文档子式样之间的对应关系;
根据所述对应关系,获取所述各单元内容对应的文档子式样;
根据所述文档子式样,显示所述文档内容的各单元内容。
所述第一文档式样包括各大纲层次对应的文档子式样;
所述获取所述文档内容的各单元内容与文档子式样之间的对应关系的步骤包括:
根据所述单元内容所属的大纲层次,获取所述文档内容的各单元内容与文档子式样之间的对应关系。
所述第一文档式样包括文档子式样ID对应的文档子式样;
所述获取所述文档内容的各单元内容与文档子式样之间的对应关系的步骤包括:
获取所述文档内容的各单元内容;
根据所述各单元内容与文档子式样ID之间的对应关系,获取所述各单元内容对应的文档子式样。
所述获取所述文档内容的各单元内容与文档子式样之间的对应关系的步骤包括:
当所述单元内容同时对应同一种类型的至少两个文档子式样时,则根据所述至少两个文档子式样的优先级,选择对所述单元内容有效的文档子式样。
所述从所述至少一种文档式样ID中,选择第一文档式样ID的步骤具体为:
根据当前显示环境,从所述至少一种文档式样ID中,选择第一文档式样ID;或者,
根据文档式样ID的优先级,从所述至少一种文档式样ID中,选择第一文档式样ID;或者,
根据用户的指令,从所述至少一种文档式样ID中,选择第一文档式样ID。
所述根据当前显示环境,从所述至少一种文档式样ID中,选择第一文档式样ID的步骤具体为:
当显示环境为微软Office软件时,则选择OOXML类型的第一文档式样ID;
当显示环境为浏览器时,则选择CSS类型的第一文档式样ID;
当显示环境为支持UOF的Office软件时,则选择UOF类型的第一文档式样ID;或
当显示环境为支持ODF的Office软件时,则选择ODF类型的第一文档式样ID。
所述第一文档式样中包括至少一个文档子式样,通过引用第二文档式样ID来定义一文档子式样为第二文档式样ID对应的文档样式。
另一方面,提供一种文档处理装置,包括:
第一获取单元,获取文档内容;
第二获取单元,获取所述文档内容对应的至少一种文档式样ID;
选择单元,从所述至少一种文档式样ID中,选择第一文档式样ID;
第三获取单元,从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;
显示单元,以所述第一文档式样定义的文档式样,显示所述文档内容。
所述第二获取单元包括:
第一获取子单元,获取所述文档内容的关键字,获取所述关键字对应的文档式样ID;或者
第二获取子单元,获取所述文档内容的大纲结构,获取所述大纲结构对应的文档式样ID;或者
第三获取子单元,获取所述文档内容的文档类型,获取所述文档类型对应的文档式样ID;或者
第四获取子单元,根据用户指令,获取所述文档内容对应的至少一种文档式样ID。
所述第一文档式样包括至少一种文档子式样;
所述显示单元包括:
第一获取子单元,获取所述文档内容的各单元内容;
第二获取子单元,获取所述文档内容的各单元内容与所述文档子式样之间的对应关系;
第三获取子单元,根据所述对应关系,获取所述各单元内容对应的文档子式样;
显示子单元,根据所述文档子式样,显示所述文档内容的各单元内容。
本发明的上述技术方案的有益效果如下:
本发明中,获取文档内容;获取所述式样类型对应的至少一种文档式样;获取当前的显示环境;从所述至少一种文档式样中,为所述各单元内容选择所述显示环境对应的式样;根据所述各单元内容以及选择出的所述关联式样,生成目标文件;根据所述目标文件,在所述显示环境下,显示所述文档内容。用户仅需编辑内容,可省去大量繁重的式样设置工作,方便了用户的编辑工作。
附图说明
图1为本发明所述的一种文档处理方法的流程示意图;
图2为本发明所述的一种文档处理装置的连接示意图;
图3为本发明所述的一种文档处理方法的应用场景的原理示意图;
图4为本发明所示式样定义的模式图;
图5为本发明应用场景中用户文档和公共式样集之间的关系示意图;
图6为本发明应用场景中文档不加定制式样的浏览效果图;
图7为本发明应用场景中加了定制式样的浏览效果图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
如图1所示,为本发明所述的一种文档处理方法,包括:
步骤11,获取文档内容;
步骤12,获取所述文档内容对应的至少一种文档式样ID;步骤12具体为:获取所述文档内容的关键字,获取所述关键字对应的文档式样ID;例如,文 档内容的标题包含有“通知”,则,选择定制有通知式样的文档式样ID;或者,步骤12具体为:获取所述文档内容的大纲结构,获取所述大纲结构对应的文档式样ID;或者,步骤12具体为:获取所述文档内容的文档类型,获取所述文档类型对应的文档式样ID;或者,步骤12具体为:根据用户指令,获取所述文档内容对应的至少一种文档式样ID。或者,获取所述文档内容包含的文档类型ID,获取所述文档类型ID对应的文档式样ID。
步骤13,从所述至少一种文档式样ID中,选择第一文档式样ID;步骤13具体为:根据当前显示环境,从所述至少一种文档式样ID中,选择第一文档式样ID;具体为:当显示环境为微软Office软件时,则选择OOXML类型的第一文档式样ID;当显示环境为浏览器时,则选择CSS类型的第一文档式样ID;当显示环境为支持UOF的Office软件时,则选择UOF类型的第一文档式样ID;或当显示环境为支持ODF的Office软件时,则选择ODF类型的第一文档式样ID。或者,步骤13具体为:根据文档式样ID的优先级,从所述至少一种文档式样ID中,选择第一文档式样ID;或者,步骤13具体为:根据用户的指令,从所述至少一种文档式样ID中,选择第一文档式样ID。
步骤14,从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;所述第一文档式样中包括至少一个文档子式样,可以通过引用第二文档式样ID来定义一文档子式样为第二文档式样ID对应的文档样式。
步骤15,以所述第一文档式样定义的文档式样,显示所述文档内容。
可选的,所述第一文档式样包括至少一种文档子式样;相应的,步骤15包括:
步骤151,获取所述文档内容的各单元内容;
步骤152,获取所述文档内容的各单元内容与所述文档子式样之间的对应关系;
步骤153,根据所述对应关系,获取所述各单元内容对应的文档子式样;
步骤154,根据所述文档子式样,显示所述文档内容的各单元内容。
可选的,所述第一文档式样包括各大纲层次对应的文档子式样;相应的,步骤153具体为:根据所述单元内容所属的大纲层次,获取所述文档内容的各单元内容与文档子式样之间的对应关系。例如,文档内容的正文部分对应文档 子式样的正文部分的式样,文档内容的标题对应文档子式样的标题部分的式样。
可选的,所述第一文档式样包括文档子式样ID对应的文档子式样;相应的,步骤153包括:
步骤1531,获取所述文档内容的各单元内容;
步骤1532,根据所述各单元内容与文档子式样ID之间的对应关系,获取所述各单元内容对应的文档子式样。
文档子式样ID对应的文档子式样不一定存在一个式样文件中。例如可以所有段落式样存在一个式样文件中,表格式样存在一个文件中。而一个文档式样分别引用一个段落式样和一个表格式样。即一个文档式样既可以直接包括子式样,也可以包括子式样ID(再通过ID找到子式样)。
可选的,步骤153具体为:
当所述单元内容同时对应同一种类型的至少两个文档子式样时,则根据所述至少两个文档子式样的优先级,选择对所述单元内容有效的文档子式样。
如图2所示,为本发明所述的一种文档处理装置,包括:
第一获取单元21,获取文档内容;
第二获取单元22,获取所述文档内容对应的至少一种文档式样ID;
选择单元23,从所述至少一种文档式样ID中,选择第一文档式样ID;
第三获取单元24,从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;
显示单元25,以所述第一文档式样定义的文档式样,显示所述文档内容。
所述第二获取单元22包括:
第一获取子单元221,获取所述文档内容的关键字,获取所述关键字对应的文档式样ID;或者
第二获取子单元222,获取所述文档内容的大纲结构,获取所述大纲结构对应的文档式样ID;或者
第三获取子单元223,获取所述文档内容的文档类型,获取所述文档类型对应的文档式样ID;或者
第四获取子单元224,根据用户指令,获取所述文档内容对应的至少一种文档式样ID。
所述第一文档式样包括至少一种文档子式样;
所述显示单元25包括:
第一获取子单元251,获取所述文档内容的各单元内容;
第二获取子单元252,获取所述文档内容的各单元内容与所述文档子式样之间的对应关系;
第三获取子单元253,根据所述对应关系,获取所述各单元内容对应的文档子式样;
显示子单元254,根据所述文档子式样,显示所述文档内容的各单元内容。
以下描述本发明的应用场景。
本发明提供一种式样和内容分离的办公文档格式设计方法。该方法中,将式样从内容中完全提出,通过引用来描述文档的显示式样。式样可通过注册的方式成为公共式样,以供多用户引用,式样还可以通过引用已有式样的方式成为组合式样。每个公共式样都具有全局唯一标识符,以保证共享的唯一性。在引用已有式样的基础上,还可以对式样进行定制,以形成新式样。这样,使得用户可以仅关注内容的编辑,既可以把作者从繁杂的式样设置工作中解脱出来,也可以减少手工设置式样过程中引来的错误。文档浏览时,根据指定或默认的式样描述形式(等同于上述的文档式样类型)显示目标文档。不同式样类型中标识符相同的式样是等价式样,由此可使文档在不同环境中都能保证统一的显示式样。原理如图3所示。
以下描述公共式样集。
式样定义的模式如图4所示。式样有公共式样和私有式样之分。
公共式样集中包含经过注册的式样集合,其中的式样可供用户共享使用。
●每个特定类型的式样经过注册后被赋予唯一的全局标识符,成为公共式样。
●全局标识符通过URI的形式进行描述。例如,全局标识符可以通过目标名称空间targetNamespace加上本空间内id的形式进行描述。
●不同类型的式样使用不同的格式名称空间formatNamespace加以区分。具 有不同格式名称空间但相同全局标识符的式样为不同式样类型中的等价式样。
●在现有公共式样的基础上进行扩展后可以重新注册为新的公共式样。
●一个式样可以对基本单元进行式样定义。例如段落式样、表格式样、目录式样等。对于每种单元可以有不止一个预定义式样。例如对段落有不同的式样定义。
●一个式样也可以通过引用一至多个其他式样成为组合式样。例如学术论文的文档结构一般包括:标题、作者、摘要、多级标题和正文、参考文献等部分,式样中对内容的组合形式及其各部分的式样进行定义。不同期刊对学术论文的式样要求不同,甚至内容组织形式也不同,则可以定义不同的组合式样来描述不同学术论文的格式要求。这样,相同的源文档内容通过指定不同的文档式样可以得到不同的目标文档。
●文档式样即为组合式样,其中定义目标文档内容的组织形式及其各部分对应式样。目标文档内容可以由源文档内容根据特定的顺序组成,可以对源文档内容进行裁剪,还可以在源内容的基础上额外添加用于显示的内容信息。
私有式样
用户可以定制私有式样,此类式样不能被其他用户所使用。式样的定义形式与公共式样一样,可以重新定义也可以在已有式样基础上扩展。但是私有式样需要与公共式样使用不同的目标名称空间。私有式样比公共式样具有更高的优先级。
以下描述用户文档
用户文档包含内容和式样两部分。
●文档内容:用户文档包含的具体数据。用户文档可以符合特定的预定义逻辑结构,例如一个符合预定义逻辑结构的通知文档。该预定义结构可以由文档模式描述。
●文档式样:通过直接引用公共式样或/和定义私有式样的方式描述文档式 样,其中说明目标文档如何由文档内容组合而成及其各部分的式样。
以下描述文档的显示
文档内容和文档式样是独立存在的,通过引用的方式进行关联。
文档浏览时,根据指定的式样类型和文档式样找到所用式样,形成目标文档内容和目标文档式样,并在浏览环境中显示。例如当在浏览器中借助HTML显示文档则指定式样类型为CSS式样类型,借助支持UOF的Office软件显示时则使用UOF式样类型。
下面通过一个通知的例子说明本发明的实现方案。通知的文档内容如代码1所示。代码第2行指明了本例子使用的模式文档,该模式用于验证本文档的有效性。
代码1
公共式样
一个典型的公共式样可以定义如代码2。其中代码2(a)是CSS类型的式样定义,代码2(b)是相应的UOF类型的式样定义。
代码2(a)
代码2(b)
每个式样文件的根元素中属性@formatNamespace用于说明式样类型,例如代码2(a)中“http://format.namespace/css”说明为式样类型CSS,而代码2(b)中“http://format.namespace/uof”说明为UOF式样;属性@targetNamespace用于指定式样的目标名称空间。
每个<style>元素定义一个基本式样,其@id属性为该式样在当前targetNamespace中的唯一标识符;@name属性描述该式样的含义;@class则用于说明生成目标式样文件时该式样在特定格式中的映射对象。例如,代码2 (a)中class="p"说明该式样在生成的目标式样文件中为元素“p”的式样;代码2(b)中class="式样.段落式样_9912"说明该式样在生成的目标式样文件中对应UOF中的元素“段落式样_9912”。
每个公共式样在特定式样类型中都具有唯一的全局标识符,通过URI进行描述。在本例中可以使用targetNamespace+id的形式进行描述。例如,使用形如http:// public.styles.lib/public/paragraph/normal#p001的URL作为上述代码中第1个段落式样的全局唯一标识符,通过该标识符即可引用该式样。格式名称空间formatNamespace不同而全局标识符相同的式样为不同格式中的对应式样。代码2(a)和代码2(b)中定义了多个CSS和UOF格式的对应式样。
一个式样定义的描述方式有两种:
(1)完全自定义式样。代码2中的式样定义都是自定义的。
(2)在一个现有式样的基础上定制一个新式样。例如在代码2(a)中第三个段落式样定义的基础上定义一个私有式样如下。本例中格式名称空间说明该式样类型为CSS,目标名称空间说明是私有式样。@StyleRef属性说明该式样定义的基础式样(即引用式样)是全局标识符为“http://public.styles.lib/public/paragraph/normal/1#p003”的式样。本例中重定义段落首行缩进为0,字体大小为30,其他没有重定义的属性值则使用其引用式样的定义。
除了对内容单元进行式样定义外,还可以对页面式样,特定应用类型文档的式样进行定义。例如代码3所示的例子定义了类型为CSS的式样。与代码2 类型,可定义对应的其他式样类型,此处省略。
代码3
例子中第1个<style>元素定义了一个节式样,包括页边距等。第2个<style>元素定义的是一个文档式样,该文档包含一个节,节中包含若干段落。该文档式样的全局标识符为“http://public.styles.lib/public/notice#notice001”。第(15)行说明节式样引用本目标名称空间中id值为"section001"式样。属性@content说明元素的内容,用Xpath形式绑定要从文档内容中提取的相关数据。属性@styeRef指定节点引用的式样。
通过这种文档式样的定义方法,不但可以为文档中不同的内容单元指定式样,还可以对内容进行重组,包括去除某些内容,调整原内容的顺序,甚至为了显示的需要加入一些源内容(如代码1所示)中没有的额外信息等。例如代 码3中,设定目标文档的内容顺序与源文档不同;并且为了显示而添加了额外信息(代码3中斜体加黑的部分)。
文档编辑过程中为文档指定文档式样。例如在代码1中加入处理指令行程代码4。
代码4
其中第2行所示处理指令中@type属性说明其式样类型为CSS,引用全局标识符为“http://public.styles.lib/public/notice/1#notice001”的文档式样。
当文档需要显示时,步骤如下:
(1)提取文档的式样类型和所引用文档式样的标识符,找到所引用的特定文档式样。例如,本例中@type属性说明其式样类型为CSS,@href属性说明该文档引用全局标识符为“http://public.styles.lib/public/notice/1#notice001”的文档式样。根据式样类型和标识符可以找到代码3中定义的式样。
(2)如果没有指定文档式样,则根据文档模式使用默认的文档式样。
(3)根据式样类型和文档式样生成相应类型的目标内容和目标式样。例如本例的式样类型为CSS,因此生成的目标内容文档为html形式(设为email.html,如代码5所示),目标式样为CSS形式(设为email.css,如代码6所示)。
(4)根据文档式样中的映射关系,建立目标内容中各内容对象和式样之间的关联关系。例如本例中的式样通过html元素中的class属性进行式样关联。
代码5中各个元素的内容根据文档式样(代码3)中的@content属性从源 文档中提取。从本例可以看出目标文档的内容顺序可以与原始文档不同(发送者、接收者、时间三者的顺序不同),且目标文档包含原始文档没有的信息(代码5中加黑的斜体部分)。
代码5 email.html
本例中,生成的CSS部分代码如代码6所示。
代码6 email.css
本例中,在原始文档内容中除了在处理指令中引用文档式样之外,还可以针对特定内容单元定制式样。例如为代码4所示通知正文的第一段指定私有式 样,代码4的第(9)行改为:
<ParagraphstyleRef=”http://private.styles.lib/my-paragraph-style#p001”>Dear friend</Paragraph>
由于私有式样比公共式样的优先级高,则主体中的其它段落仍遵循原有式样定义,而第1个段落使用私有式样。因此,最终生成的html中第11行的@class属性值为:
<p class="priv-p001">Dear friend</p>
而notice.css中也相应的多出私有式样的CSS形式,即多出如下内容
文档不加定制式样的浏览效果如图6所示(内容主体中所有段落都是首行缩进),加了定制式样的浏览效果如图7所示(内容主体中第一个段落没有首行缩进,而其他段落仍保持首行缩进;并且首行字体较大)。也就是说,本发明中,当文档的单元内容同时对应两个式样时,则根据所述两个式样的优先级,选择对所述单元内容有效的文档式样。上述实施例中,私有式样的优先级大于基式样的优先级。
图5为本发明应用场景中用户文档和公共式样集之间的关系示意图。如图5所示,用户文档分为文档内容和式样两部分。文档式样中指定该文档显示时所引用的文档式样ID和式样类型,由此可在公共式样库中找到预定义的特定类型的文档式样。文档式样说明了文档显示时的内容和顺序及各部分内容对应的子式样。本例中子式样是通过ID来引用的。用户还可为文档内容中的特定部分指定私有式样。例如对body中的第一个段落指定了私有式样,则第一个段落显示时采用私有式样,而body中的其他段落仍采用文档式样中定义的引用式样。
本发明具有以下有益效果:
1、式样描述中可以包含多种类型,例如UOF、OOXML、CSS等,类型不同而全局标识符相同的式样即为不同式样类型之间的式样映射。这种方式可以为简化XSLT转换的复杂性,保证式样描述和映射的准确性,使得文档在不同环 境中的显现符合统一的式样描述标准。因此,文档既可以直接在浏览器上编辑和浏览,也可在办公软件中使用。
2、通过引用多种简单式样成为复合式样的方法,方便式样的继承和重用;
3、文档式样是式样库中预定好的,用户通过为文档设定不同的文档式样,即可为文档整体更换显示式样。此种方案可极大地降低式样编辑工作。
4、为每个共享式样指定全局的唯一标识符,文档通过资源标识符引用式样,可使被共享的式样具有唯一性。
5、本方案中用户仅编辑内容,可省去大量繁重的式样设置工作
6、不同系统和用户间交换数据时仅需传输不包含式样信息的文档内容,通过提供公开可得的共享式样获得式样信息,因此可以节省网络带宽和存储资源。
7、文档内容中不含繁杂的式样信息,便于针对内容进行数据检索和各种数据集成与处理工作,可提高数据的利用率。
8、目前,国际上有多个办公文档格式并存,例如OOXML(Office Open XML,目前主要应用在Microsoft Office,ISO文档标准)、ODF(Open Document Format,开放文档格式,ISO文档标准)和UOF(Unified Office document Format,标文通,中国国家标准)等,导致相同内容的文档在不同格式和软件中交互时,会存在信息流通不畅、跑版的问题。同时,随着各种电子设备计算能力的增强,文档的浏览和编辑环境变得多样化,不再仅限于桌面办公套件,上述问题更加凸显。本发明使得在各种设备和文档处理环境中既能保证文档内容的正常流通,又能保证文档显现式样的统一。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种文档处理方法,其特征在于,包括:
获取文档内容;
获取所述文档内容对应的至少一种文档式样ID;
从所述至少一种文档式样ID中,选择第一文档式样ID;
从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;
以所述第一文档式样定义的文档式样,显示所述文档内容;
所述第一文档式样包括至少一种文档子式样;
所述以所述第一文档式样定义的文档式样,显示所述文档内容的步骤包括:
获取所述文档内容的各单元内容;
获取所述文档内容的各单元内容与所述文档子式样之间的对应关系;
根据所述对应关系,获取所述各单元内容对应的文档子式样;
根据所述文档子式样,显示所述文档内容的各单元内容;
所述文档式样包括公共式样和私有式样;
公共式样集中包含经过注册的式样集合,其中的式样供用户共享使用;该公共式样具体包括:
每个特定类型的式样经过注册后被赋予唯一的全局标识符,成为公共式样;全局标识符通过URI的形式进行描述,即全局标识符通过目标名称空间targetNamespace加上本空间内id的形式进行描述;不同类型的式样使用不同的格式名称空间formatNamespace加以区分;具有不同格式名称空间但相同全局标识符的式样为不同式样类型中的等价式样;在现有公共式样的基础上进行扩展后重新注册为新的公共式样;
该私有式样具体包括:
用户定制私有式样,私有式样不能被其他用户所使用;私有式样的定义形式与公共式样相同,可以重新定义私有式样也可以在已有私有式样基础上扩展;但是私有式样需要与公共式样使用不同的目标名称空间;私有式样比公共式样具有更高的优先级。
2.根据权利要求1所述的方法,其特征在于,所述获取所述文档内容对应的至少一种文档式样ID的步骤包括:
获取所述文档内容的关键字,获取所述关键字对应的文档式样ID;或者
获取所述文档内容的大纲结构,获取所述大纲结构对应的文档式样ID;或者
获取所述文档内容的文档类型,获取所述文档类型对应的文档式样ID;
获取所述文档内容包含的文档类型ID,获取所述文档类型ID对应的文档式样ID;或者
根据用户指令,获取所述文档内容对应的至少一种文档式样ID。
3.根据权利要求1所述的方法,其特征在于,
所述第一文档式样包括各大纲层次对应的文档子式样;
所述获取所述文档内容的各单元内容与文档子式样之间的对应关系的步骤包括:
根据所述单元内容所属的大纲层次,获取所述文档内容的各单元内容与文档子式样之间的对应关系。
4.根据权利要求1所述的方法,其特征在于,
所述第一文档式样包括文档子式样ID;
所述获取所述文档内容的各单元内容与文档子式样之间的对应关系的步骤包括:
获取所述文档内容的各单元内容;
根据所述各单元内容与文档子式样ID之间的对应关系,获取所述各单元内容对应的文档子式样。
5.根据权利要求1所述的方法,其特征在于,所述获取所述文档内容的各单元内容与文档子式样之间的对应关系的步骤包括:
当所述单元内容同时对应同一种类型的至少两个文档子式样时,则根据所述至少两个文档子式样的优先级,选择对所述单元内容有效的文档子式样。
6.根据权利要求1所述的方法,其特征在于,所述从所述至少一种文档式样ID中,选择第一文档式样ID的步骤具体为:
根据当前显示环境,从所述至少一种文档式样ID中,选择第一文档式样ID;或者,
根据文档式样ID的优先级,从所述至少一种文档式样ID中,选择第一文档式样ID;或者,
根据用户的指令,从所述至少一种文档式样ID中,选择第一文档式样ID。
7.根据权利要求6所述的方法,其特征在于,所述根据当前显示环境,从所述至少一种文档式样ID中,选择第一文档式样ID的步骤具体为:
当显示环境为微软Office软件时,则选择OOXML类型的第一文档式样ID;
当显示环境为浏览器时,则选择CSS类型的第一文档式样ID;
当显示环境为支持UOF的Office软件时,则选择UOF类型的第一文档式样ID;或
当显示环境为支持ODF的Office软件时,则选择ODF类型的第一文档式样ID。
8.根据权利要求1所述的方法,其特征在于,
所述第一文档式样中包括至少一个文档子式样,所述文档子式样在文档式样中直接定义,或者在其他式样文档中定义后通过式样ID被所述第一文档式样引用。
9.一种文档处理装置,其特征在于,包括:
第一获取单元,获取文档内容;
第二获取单元,获取所述文档内容对应的至少一种文档式样ID;
选择单元,从所述至少一种文档式样ID中,选择第一文档式样ID;
第三获取单元,从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;
显示单元,以所述第一文档式样定义的文档式样,显示所述文档内容;
所述第一文档式样包括至少一种文档子式样;
所述显示单元包括:
用于获取所述文档内容的各单元内容的单元;
用于获取所述文档内容的各单元内容与所述文档子式样之间的对应关系的单元;
用于根据所述对应关系,获取所述各单元内容对应的文档子式样的单元;
用于根据所述文档子式样,显示所述文档内容的各单元内容的单元;
所述文档式样包括公共式样和私有式样;
公共式样集中包含经过注册的式样集合,其中的式样供用户共享使用;该公共式样具体包括:
每个特定类型的式样经过注册后被赋予唯一的全局标识符,成为公共式样;全局标识符通过URI的形式进行描述,即全局标识符通过目标名称空间targetNamespace加上本空间内id的形式进行描述;不同类型的式样使用不同的格式名称空间formatNamespace加以区分;具有不同格式名称空间但相同全局标识符的式样为不同式样类型中的等价式样;在现有公共式样的基础上进行扩展后重新注册为新的公共式样;
该私有式样具体包括:
用户定制私有式样,私有式样不能被其他用户所使用;私有式样的定义形式与公共式样相同,可以重新定义私有式样也可以在已有私有式样基础上扩展;但是私有式样需要与公共式样使用不同的目标名称空间;私有式样比公共式样具有更高的优先级。
CN201410778704.1A 2014-12-15 2014-12-15 一种文档处理方法和装置 Active CN104462045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410778704.1A CN104462045B (zh) 2014-12-15 2014-12-15 一种文档处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410778704.1A CN104462045B (zh) 2014-12-15 2014-12-15 一种文档处理方法和装置

Publications (2)

Publication Number Publication Date
CN104462045A CN104462045A (zh) 2015-03-25
CN104462045B true CN104462045B (zh) 2017-11-03

Family

ID=52908117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410778704.1A Active CN104462045B (zh) 2014-12-15 2014-12-15 一种文档处理方法和装置

Country Status (1)

Country Link
CN (1) CN104462045B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532521A (zh) * 2018-05-23 2019-12-03 北京金山办公软件股份有限公司 一种文档格式套用的实现方法、装置及电子设备
CN113779235B (zh) * 2021-09-13 2024-02-02 北京市律典通科技有限公司 一种Word文档大纲识别处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7231602B1 (en) * 2000-11-29 2007-06-12 Microsoft Corporation Live preview for reformatting document text
CN101258489A (zh) * 2005-09-09 2008-09-03 微软公司 用于文档格式化的快速样式
CN101872340A (zh) * 2009-04-23 2010-10-27 北京大学 一种基于版面格式模板的排版方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130290837A1 (en) * 2012-04-30 2013-10-31 James Paul Hudetz Method and Apparatus for Correcting Document Formatting Based on Source Document

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7231602B1 (en) * 2000-11-29 2007-06-12 Microsoft Corporation Live preview for reformatting document text
CN101258489A (zh) * 2005-09-09 2008-09-03 微软公司 用于文档格式化的快速样式
CN101872340A (zh) * 2009-04-23 2010-10-27 北京大学 一种基于版面格式模板的排版方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
文档编辑与排版系统的设计;侯霞 等;《计算机工程与设计》;20120930;第33卷(第9期);第3617-3621页 *

Also Published As

Publication number Publication date
CN104462045A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
US8407585B2 (en) Context-aware content conversion and interpretation-specific views
CA2535093C (en) Generating end-user presentations from structured data
US7979793B2 (en) Graphical creation of a document conversion template
US8869023B2 (en) Conversion of a collection of data to a structured, printable and navigable format
CN101771681B (zh) 一种页面显示控制方法、服务器及系统
US20090199086A1 (en) Document processing and management approach to making changes to a document and its representation
US20040221233A1 (en) Systems and methods for report design and generation
US8171451B2 (en) Providing reports as web services
EP2691873A2 (en) Techniques to create structured document templates using enhanced content controls
CN104598462B (zh) 提取结构化数据的方法及装置
CN102982439A (zh) 生成电子公文的方法及电子公文生成系统
CN102609506A (zh) 一种通过映射生成hl7消息的方法
CN104428763A (zh) 将结构化及非结构化数据实现在xml文件的方法
CN104462045B (zh) 一种文档处理方法和装置
US20090249192A1 (en) Creating a view from multiple templates
CN115309476A (zh) 一种基于浏览器的ofd文件显示和编辑方法
GB2458692A (en) A process for generating database-backed, web-based documents
KR101243058B1 (ko) 풀 텍스트 엑스엠엘 논문 구축 시스템 및 방법
Hu et al. An XML-based implementation of manufacturing route sheet documents for context-sensitive and web-based process planning
JPWO2006051868A1 (ja) 文書処理装置及び文書処理方法
Rishe et al. XML-Based Semantic Database Definition Language.
Seyfang BAT-The Brigid Authoring Tool
Trewitt et al. Producing HTML Documents With Scribe

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220330

Address after: 803, block B, No. 8 Xueqing Road (Science and technology wealth center), Haidian District, Beijing 100083

Patentee after: Fuxin Kunpeng (Beijing) Information Technology Co.,Ltd.

Address before: 100192 Beijing city Haidian District Qinghe small Camp Road No. 12

Patentee before: BEIJING INFORMATION SCIENCE AND TECHNOLOGY University

TR01 Transfer of patent right