CN102866986A - 一种文档格式转换系统 - Google Patents
一种文档格式转换系统 Download PDFInfo
- Publication number
- CN102866986A CN102866986A CN2012103131034A CN201210313103A CN102866986A CN 102866986 A CN102866986 A CN 102866986A CN 2012103131034 A CN2012103131034 A CN 2012103131034A CN 201210313103 A CN201210313103 A CN 201210313103A CN 102866986 A CN102866986 A CN 102866986A
- Authority
- CN
- China
- Prior art keywords
- markup language
- extensible markup
- format file
- language format
- function point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提供一种文档格式转换系统包括第一格式转换模块、数据库或文档、第二格式转换模块;其中,第一格式转换模块从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息;数据库或文档用于存储该任一可扩展置标语言格式中间功能点信息;第二格式转换模块用于提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。本发明系统具有通用性与实用性较高、管理与维护任务较轻、开发周期较短、成本低等特点,可广泛应用于信息领域中。
Description
技术领域
本发明涉及文档处理技术,特别是涉及一种文档格式转换系统。
背景技术
随着全球信息化进程的深入发展,各行各业都在通过文档来共享信息,以数据为中心的计算模式正在演变为以文档为中心,大量电子文档已成为信息化社会中一类重要的信息资源。但是,不同的文档格式成为了通过文档共享信息的障碍。为解决这一问题,采用文档对文档的格式转换器在某种程度上解决了文档数据的互通问题。实际应用中,由于文档标准的不断更新与各种规范的不断涌现,文档对文档的格式转换器也需要随之更新。这样就需要重新开发文档对文档的格式转换器,使得工作量繁重;而且,为了实现文档的兼容性,文档对文档的格式转换器要能够实现基于多个不同标准的格式转换或者基于相同标准的不同版本之间的格式转换,这就使得格式转换器的开发与维护数量以指数级增长。
由此可见,现有技术文档对文档的格式转换器的通用性与实用性比较差,且其管理与维护任务繁重、开发周期长、成本高。
发明内容
有鉴于此,本发明的主要目的在于建立一种通用性与实用性较高、管理与维护任务较轻、开发周期较短、成本低的文档格式转换系统。
为了达到上述目的,本发明提出的技术方案为:
一种文档格式转换系统,包括第一格式转换模块、数据库或文档、第二格式转换模块;其中,
第一格式转换模块,用于从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档。
数据库或文档,用于存储第一格式转换模块发送的该任一可扩展置标语言格式中间功能点信息。
第二格式转换模块,用于从数据库或文档中提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
综上所述,本发明所述文档格式转换系统基于功能点信息,先将源可扩展标记语言格式文档转换为任一可扩展标记语言格式的数据库或文档,再将任一可扩展标记语言格式的数据库或文档转换为目标可扩展标记语言格式文档,从而实现源可扩展标记语言格式文档向目标可扩展标记语言格式文档的转换。本发明系统中,任一可扩展标记语言格式的数据库或文档转换的引入,屏蔽了源可扩展标记语言格式文档与目标可扩展标记语言格式文档之间的结构差异、语种差异等转换细节,使两种结构的文档之间的转换具有更好的通用性与实用性;在整个转换体系中,当源可扩展标记语言格式文档或目标可扩展标记语言格式文档的格式标准更新时,或者,当增加新可扩展标记语言格式文档时,只需要对更新标准涉及到的内容或者增加的新可扩展标记语言格式文档相关内容进行增量式开发即可,这样大大降低了转换体系的开发周期,减少了转换体系的管理与维护工作量,从而也降低了转换体系的开发与维护成本。
附图说明
图1是本发明所述文档格式转换系统的第一种组成结构示意图。
图2为本发明所述文档格式转换系统的第二种组成结构示意图。
图3为本发明所述第一格式转换模块的组成结构示意图。
图4为本发明所述第二格式转换模块的组成结构示意图。
图5为本发明实施例的组成结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
图1是本发明所述文档格式转换系统的第一种组成结构示意图。如图1所示,本发明所述文档格式转换系统包括第一格式转换模块1、数据库或文档2、第二格式转换模块3;其中,
第一格式转换模块1,用于从源可扩展置标语言格式文档中提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档2。
这里,数据库或文档2为任一可扩展置标语言格式的中间功能点信息的容器。
数据库或文档2,用于存储第一格式转换模块1发送的该任一可扩展置标语言格式中间功能点信息。
第二格式转换模块3,用于从数据库或文档2中提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
本发明中,可扩展置标语言(XML,Extensible Markup Language)格式包括开放文件格式(ODF,Open Document Format)、办公开放XML格式(OOXML,Office Open XML)、统一办公格式(UO F,Unified Office document Format)1.0、UOF1.1、UOF2.0等。
实际应用中,对于可扩展置标语言格式文档而言,可按照构成元素的逻辑关系将整个文档划分为若干功能点。异构可扩展置标语言格式文档之间,对应的功能点构成、功能点各构成元素的元素值标识或属性值标识、功能点各构成元素之间的逻辑关系、路径、属性特征、文本特性等数据内容相互对应;但是,在表示方式方面存在差异,即,表示结构与语义方面存在差异。这里,元素是指可扩展置标语言文档中的标签及属性。
总之,本发明所述文档格式转换系统基于功能点信息,由第一格式转换模块将源可扩展置标语言格式文档转换为任一可扩展置标语言格式的数据库或文档,由第二格式转换模块将任一可扩展置标语言格式的数据库或文档转换为目标可扩展置标语言格式文档,为异构可扩展置标语言格式文档之间建立了动态转换关系,任一可扩展置标语言格式文档甚至可以为源可扩展置标语言格式文档或目标可扩展置标语言格式文档,任一可扩展置标语言格式数据库甚至可以为源可扩展置标语言格式文档或目标可扩展置标语言格式文档作为的数据库。从而,本发明所述文档格式转换系统可以实现任意两个异构可扩展置标语言格式文档之间的相互转换。本发明系统中,基于功能点,任一可扩展置标语言格式的数据库或文档的引入,屏蔽了源可扩展置标语言格式文档与目标可扩展置标语言格式文档之间的表示结构差异、语种差异等转换细节,故本发明系统具有更好的通用性与实用性;在由所有异构可扩展置标语言文档构成的整个格式转换系统中,当源可扩展置标语言格式文档或目标可扩展置标语言格式文档的格式标准更新时,或者,当增加新可扩展置标语言格式文档时,只需要对更新标准涉及到的内容或者增加的新可扩展置标语言格式文档相关内容进行增量式开发即可,这样大大降低了转换体系的开发周期,减少了转换体系的管理与维护工作量,从而也降低了转换体系的开发与维护成本。
实际应用中,提取的源可扩展置标语言格式文档功能点信息可以是源可扩展置标语言格式文档中的所有功能点信息,也可以是源可扩展置标语言格式文档中的部分功能点信息;可根据实际需要具体确定提取的源可扩展置标语言格式文档的功能点信息。
本发明中,所述从源可扩展置标语言格式文档中提取源可扩展置标语言格式文档功能点信息采用基于可扩展置标语言的查询(XQuery,XML Query)方式。
本发明中,所述从所述数据库或文档2中提取中间功能点信息采用基于可扩展置标语言的查询方式。
图2为本发明所述文档格式转换系统的第二种组成结构示意图。如图2所示,本发明所述文档格式转换系统还包括预设模块4,用于设置源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息读取配置、中间功能点信息生成配置、目标可扩展置标语言格式文档功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系。
第一格式转换模块1,还用于从预设模块4读取源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系。
第二格式转换模块3,还用于从预设模块4读取中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系。
本发明中,所述源可扩展置标语言格式文档功能点信息读取配置包括源可扩展置标语言格式文档功能点各构成元素、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、源可扩展置标语言格式文档功能点各构成部分元素之间的逻辑关系、源可扩展置标语言格式文档功能点各构成元素路径、源可扩展置标语言格式文档功能点各构成元素属性特征、源可扩展置标语言格式文档功能点各构成元素的元素值或属性值的文本特性。
所述中间功能点信息读取配置包括中间功能点各构成元素、中间功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素之间的逻辑关系、中间功能点各构成元素路径、中间功能点各构成元素属性特征、中间功能点各构成元素的元素值或属性值的文本特性。
所述中间功能点信息生成配置包括中间功能点各构成元素、中间功能点各构成元素的描述,中间功能点各构成元素的描述包括中间功能点各构成元素之间的逻辑关系、作为引用关键词的中间功能点各构成元素的元素值标识或属性值标识。
所述目标可扩展置标语言格式文档功能点信息生成配置包括目标可扩展置标语言文档功能点各构成元素、目标可扩展置标语言文档功能点各构成元素的描述,目标可扩展置标语言文档功能点各构成元素的描述包括目标可扩展置标语言文档功能点各构成的元素之间的逻辑关系、作为引用关键词的目标可扩展置标语言文档功能点各构成元素的元素值标识或属性值标识。
所述源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系为:源可扩展置标语言格式文档功能点与中间功能点相同,源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素的元素值标识或属性值标识相对应;源可扩展置标语言格式文档功能点各构成元素的描述与中间功能点各构成元素的描述相对应;源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述、中间功能点各构成元素的元素值标识或属性值标识的描述相对应。
所述中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系为:中间功能点与目标可扩展置标语言格式文档功能点相同,中间功能点各构成元素的元素值标识或属性值标识、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应;中间功能点各构成元素的描述与目标可扩展置标语言格式文档功能点各构成元素的描述相对应;中间功能点各构成元素的元素值标识或属性值标识的描述、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述相对应。
图3为本发明所述第一格式转换模块的组成结构示意图。如图3所示,第一格式转换模块1包括源可扩展置标语言格式文档读取器11、中间可扩展置标语言格式文档生成器12;其中,
源可扩展置标语言格式文档读取器11,用于根据从预设模块4读取的可扩展置标语言格式文档功能点信息读取配置,从源可扩展置标语言格式文档功提取源可扩展置标语言格式文档功能点信息,并将源可扩展置标语言格式文档功能点信息将发送至中间可扩展置标语言格式文档生成器12。
中间可扩展置标语言格式文档生成器12,用于根据从预设模块4读取的中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系,将源可扩展置标语言格式文档读取器11发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档2。
本发明中,所述从源可扩展置标语言格式文档中提取源可扩展置标语言格式文档功能点信息包括:记录源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识。
本发明中,所述将源可扩展置标语言格式文档读取器11发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息包括:在源可扩展置标语言格式文档功能点与中间功能点相同、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识与中间功能点各构成元素的元素值标识或属性值标识相对应的情况下,将源可扩展置标语言格式文档功能点各构成元素的描述转换为中间功能点构成元素的描述,将源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述转换为中间功能点各构成元素的元素值标识或属性值标识的描述。
图4为本发明所述第二格式转换模块的组成结构示意图。如图4所示,第二格式转换模块3包括中间可扩展置标语言格式文档读取器31、目标可扩展置标语言格式文档生成器32;其中,
中间可扩展置标语言格式文档读取器31,用于中间功能点信息读取配置从所述数据库或文档2中提取中间功能点信息,并将该中间功能点信息发送至目标可扩展置标语言格式文档生成器32。
目标可扩展置标语言格式文档生成器32,用于根据目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系,将中间可扩展置标语言格式文档读取器31发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
本发明中,所述从所述数据库或文档2中提取中间功能点信息包括:记录中间功能点各构成元素的元素值标识或属性值标识;
本发明中,所述将中间可扩展置标语言格式文档读取器31发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息包括:在中间功能点与目标可扩展置标语言格式文档功能点相同、中间功能点各构成元素的元素值标识或属性值标识与目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应的情况下,将中间功能点构成元素的描述转换为目标可扩展置标语言格式文档功能点各构成元素的描述,将中间功能点各构成元素的元素值标识或属性值标识的描述转换为目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述。
实施例
图5为本发明实施例的组成结构示意图。如图5所示,本实施例包括预设模块、源可扩展置标语言格式文档读取器、中间可扩展置标语言格式文档生成器、数据库或文档、中间可扩展置标语言格式文档读取器、目标可扩展置标语言格式文档生成器。源可扩展置标语言格式文档读取器根据从预设模块读取源可扩展置标语言格式文档功能点信息读取配置,从源可扩展置标语言格式文档提取的功能点包括功能点USERINFO、功能点NAME、功能点ADDRESS、功能点EMAIL,功能点USERINFO包含功能点NAME、功能点ADDRESS、功能点EMAIL,功能点NAME、功能点ADDRESS、功能点EMAIL为并列关系。
本实施例中,源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系分别见表1、表2、表3。
表1源可扩展置标语言格式文档读取配置
父元素名称 | 元素名称 | 元素描述 | 备注 |
mapping | reader | 开始读取规则 | |
reader | USERINFO | userinfo功能点开始 | |
USERINFO | path | userinfo路径 | |
USERINFO | NAME | name功能点标签 | |
NAME | path | name路径 | |
NAME | nameAttribute | name功能点标签属性 | |
USERINFO | ADDRESS | address功能点标签 | |
ADDRESS | path | address路径 | |
ADDRESS | addressAttribute | address功能点标签属性 | |
USERINFO | email标签 | ||
path | email路径 | ||
textPath | 获取email文本路径 | ||
nameID | 获取email文本标识 | ||
*Attribute | nameID | 获取相应属性文本标识 | |
*Attribute | path | 获取相应属性路径 | |
*Attribute | isAttribute | 是否是属性 | 是标签属性还是文本 |
*Attribute | attributeStart | 属性开始标志 | 用于截取属性值 |
*Attribute | attributeEnd | 属性结束标志 | 用于截取属性值 |
表2中间功能点信息生成配置
表3源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系
本实施例采用基于可扩展置标语言的查询方式,根据如表1、表2、表3所示的可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系,将源可扩展置标语言格式文档功能点信息转化为表3第3列所示格式的中间功能点信息。实际应用中,表3第3列所示格式的中间功能点信息被存储于数据库或文档中。
本实施例中,中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系分别见表4、表5、表6。
表4中间功能点信息读取配置
父元素名称 | 元素名称 | 元素描述 | 备注 |
mapping | reader | 开始读取规则 | |
reader | userinfo | userinfo功能点开始 | |
userinfo | path | userinfo节点路径 | |
userinfo | name | name为userinfo的子元素 | |
name | path | name路径 | |
name | firstname | firstname为name的子元素 | |
firstname | path | firstname路径 | |
firstname | textPath | firstname文本路径 | |
firstname | nameID | firstname标识 | |
name | lastname | lastname为name的子元素 | |
lastname | path | lastname路径 | |
lastname | textPath | lastname文本路径 | |
lastname | nameID | lastname标识 | |
userinfo | address | address为userinfo的子元素 | |
address | path | address路径 | |
address | street | street为address的子元素 | |
street | path | street路径 | |
street | textpath | street的文本路径 | |
street | nameID | street标识 | |
address | district | district为address的子元素 | |
district | path | district路径 | |
district | textpath | district的文本路径 | |
drstrict | nameID | district标识 | |
address | city | city为address的子元素 | |
city | path | city路径 | |
city | textpath | city的文本路径 | |
city | nameID | city标识 | |
userinfo | email为userinfo的子元素 | ||
path | email路径 |
textpath | email文本路径 | ||
nameID | email文本内容 |
表5目标可扩展置标语言格式文档功能点信息生成配置
表6中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系
本实施例采用基于可扩展置标语言的查询方式,根据如表4、表5、表6所示的中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系,将中间功能点信息转化为表6第3列所示格式的目标可扩展置标语言格式文档功能点信息。
基于上述表1~表6,本实施例实现了源可扩展置标语言格式文档向目标可扩展置标语言格式文档的转换。
实际应用中,如果将上述目标可扩展置标语言格式文档作为新的源可扩展置标语言格式文档,将上述源可扩展置标语言格式文档作为新的目标可扩展置标语言格式文档;那么,采用本发明所述异构可扩展置标语言文档的格式转换方法,同样可以实现新的源可扩展置标语言格式文档向新的目标可扩展置标语言格式文档的转换。转换过程中,采用如表7所示的新的源可扩展置标语言格式文档功能点信息读取配置、如表2所示的中间功能点信息生成配置、如表4所示的中间功能点信息读取配置、如表8所示的新的目标可扩展置标语言格式文档功能点信息生成配置、新的源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系、中间功能点信息与新的目标可扩展置标语言格式文档功能点信息之间的映射关系。这里,新的源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系与表6所示的中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系基本相同,不同之处仅在于将表6中的“目标可扩展置标语言格式文档功能点信息”作为“新的源可扩展置标语言格式文档功能点信息”;同理,中间功能点信息与新的目标可扩展置标语言格式文档功能点信息之间的映射关系与表3所示的源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系基本相同,不同之处仅在于将表3中的“源可扩展置标语言格式文档功能点信息”作为“新的目标可扩展置标语言格式文档功能点信息”。表7所示的新的源可扩展置标语言格式文档功能点信息读取配置实际为原来的目标可扩展置标语言格式文档功能点信息读取配置,表8所示的新的目标可扩展置标语言格式文档功能点信息生成配置实际为原来的源可扩展置标语言格式文档功能点信息生成配置。
表7新的源可扩展置标语言格式文档功能点信息读取配置
父元素名称 | 元素名称 | 元素描述 | 备注 |
mapping | reader | 开始读取规则 | |
reader | 用户基本信息 | userinfo功能点开始 | |
用户基本信息 | path | userinfo路径 | |
用户基本信息 | 姓名 | name功能点 | |
姓名 | path | name路径 | |
姓名 | textPath | 用于读取name功能点标签的文本 | |
姓名 | nameID | name标识 | |
用户基本信息 | 地址 | address功能点 | |
地址 | path | address路径 | |
地址 | 通信地址 | 通信地址为address功能点的子元素 | |
通信地址 | path | 通信地址路径 | |
通信地址 | textPath | 通信地址文本 | |
通信地址 | nameID | 通信地址标识 | |
用户基本信息 | 电子邮件 | email功能点 | |
电子邮件 | path | email路径 | |
电子邮件 | textPath | email文本 | |
电子邮件 | nameID | email标识 |
表8新的目标可扩展置标语言格式文档功能点信息生成配置(表中哪个是nameID)?
本实施例中,将“nameID”作为引用关键词。
基于上述转换,本实施例可以实现转换体系中任意两个异构可扩展置标语言格式文档之间的格式转换。
实际应用中,如果转换体系中某种可扩展置标语言格式文档的标准更新或者增加一种新的可扩展置标语言格式文档,那么,只需要将标准更新后的某种可扩展置标语言格式文档功能点信息读取配置、标准更新后的某种可扩展置标语言格式文档功能点信息生成配置、标准更新后的某种可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系或者新的可扩展置标语言格式文档功能点信息读取配置、新的可扩展置标语言格式文档功能点生成配置、新的可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系添加入转换体系即可。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种文档格式转换系统,其特征在于,所述格式转换系统包括第一格式转换模块、数据库或文档、第二格式转换模块;其中,
第一格式转换模块,用于从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档;
数据库或文档,用于存储第一格式转换模块发送的该任一可扩展置标语言格式中间功能点信息;
第二格式转换模块,用于从数据库或文档中提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
2.根据权利要求1所述文档格式转换系统,其特征在于,所述格式转换系统还包括预设模块,用于设置源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息读取配置、中间功能点信息生成配置、目标可扩展置标语言格式文档功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系;
所述第一格式转换模块,还用于从预设模块读取源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系;
所述第二格式转换模块,还用于从预设模块读取中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系。
3.根据权利要求2所述的文档格式转换系统,其特征在于,所述源可扩展置标语言格式文档功能点信息读取配置包括源可扩展置标语言格式文档功能点各构成元素、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、源可扩展置标语言格式文档功能点各构成部分元素之间的逻辑关系、源可扩展置标语言格式文档功能点各构成元素路径、源可扩展置标语言格式文档功能点各构成元素属性特征、源可扩展置标语言格式文档功能点各构成元素的元素值或属性值的文本特性;
所述中间功能点信息读取配置包括中间功能点各构成元素、中间功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素之间的逻辑关系、中间功能点各构成元素路径、中间功能点各构成元素属性特征、中间功能点各构成元素的元素值或属性值的文本特性;
所述中间功能点信息生成配置包括中间功能点各构成元素、中间功能点各构成元素的描述,中间功能点各构成元素的描述包括中间功能点各构成元素之间的逻辑关系、作为引用关键词的中间功能点各构成元素的元素值标识或属性值标识;
所述目标可扩展置标语言格式文档功能点信息生成配置包括目标可扩展置标语言文档功能点各构成元素、目标可扩展置标语言文档功能点各构成元素的描述,目标可扩展置标语言文档功能点各构成元素的描述包括目标可扩展置标语言文档功能点各构成的元素之间的逻辑关系、作为引用关键词的目标可扩展置标语言文档功能点各构成元素的元素值标识或属性值标识;
所述源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系为:源可扩展置标语言格式文档功能点与中间功能点相同,源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素的元素值标识或属性值标识相对应;源可扩展置标语言格式文档功能点各构成元素的描述与中间功能点各构成元素的描述相对应;源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述、中间功能点各构成元素的元素值标识或属性值标识的描述相对应;
所述中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系为:中间功能点与目标可扩展置标语言格式文档功能点相同,中间功能点各构成元素的元素值标识或属性值标识、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应;中间功能点各构成元素的描述与目标可扩展置标语言格式文档功能点各构成元素的描述相对应;中间功能点各构成元素的元素值标识或属性值标识的描述、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述相对应。
4.根据权利要求3所述的文档格式转换系统,其特征在于,所述第一格式转换模块包括源可扩展置标语言格式文档读取器、中间可扩展置标语言格式文档生成器;其中,
源可扩展置标语言格式文档读取器,用于根据从所述预设模块读取的可扩展置标语言格式文档功能点信息读取配置,从源可扩展置标语言格式文档功提取源可扩展置标语言格式文档功能点信息,并将源可扩展置标语言格式文档功能点信息将发送至中间可扩展置标语言格式文档生成器;
中间可扩展置标语言格式文档生成器,用于根据从所述预设模块读取的中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系,将源可扩展置标语言格式文档读取器发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档。
5.根据权利要求3所述文档格式转换系统,其特征在于,所述第二格式转换模块包括中间可扩展置标语言格式文档读取器、目标可扩展置标语言格式文档生成器;其中,
中间可扩展置标语言格式文档读取器,用于中间功能点信息读取配置从所述数据库或文档中提取中间功能点信息,并将该中间功能点信息发送至目标可扩展置标语言格式文档生成器;
目标可扩展置标语言格式文档生成器,用于根据目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系,将中间可扩展置标语言格式文档读取器发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
6.根据权利要求1或4所述的文档格式转换系统,其特征在于,所述从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息采用基于可扩展置标语言的查询方式;
所述从所述数据库或文档中提取中间功能点信息采用基于可扩展置标语言的查询方式。
7.根据权利要求6所述的文档格式转换系统,其特征在于,所述从源可扩展置标语言格式文档功提取源可扩展置标语言格式文档功能点信息包括:记录源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识;
所述将源可扩展置标语言格式文档读取器发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息包括:在源可扩展置标语言格式文档功能点与中间功能点相同、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识与中间功能点各构成元素的元素值标识或属性值标识相对应的情况下,将源可扩展置标语言格式文档功能点各构成元素的描述转换为中间功能点构成元素的描述,将源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述转换为中间功能点各构成元素的元素值标识或属性值标识的描述。
8.根据权利要求5所述的文档格式转换系统,其特征在于,所述从所述数据库或文档中提取中间功能点信息包括:记录中间功能点各构成元素的元素值标识或属性值标识;
所述将中间可扩展置标语言格式文档读取器发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息包括:在中间功能点与目标可扩展置标语言格式文档功能点相同、中间功能点各构成元素的元素值标识或属性值标识与目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应的情况下,将中间功能点构成元素的描述转换为目标可扩展置标语言格式文档功能点各构成元素的描述,将中间功能点各构成元素的元素值标识或属性值标识的描述转换为目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012103131034A CN102866986A (zh) | 2012-08-30 | 2012-08-30 | 一种文档格式转换系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012103131034A CN102866986A (zh) | 2012-08-30 | 2012-08-30 | 一种文档格式转换系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102866986A true CN102866986A (zh) | 2013-01-09 |
Family
ID=47445864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012103131034A Withdrawn CN102866986A (zh) | 2012-08-30 | 2012-08-30 | 一种文档格式转换系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102866986A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559321A (zh) * | 2013-11-22 | 2014-02-05 | 方正国际软件有限公司 | 文档格式转换系统 |
WO2015010386A1 (zh) * | 2013-07-22 | 2015-01-29 | 北大方正集团有限公司 | 文档格式转换装置和文档格式转换方法 |
CN104765717A (zh) * | 2014-01-08 | 2015-07-08 | 北大方正集团有限公司 | 一种批量文档格式转换的方法及装置 |
CN105760501A (zh) * | 2016-02-22 | 2016-07-13 | 深圳市茁壮网络股份有限公司 | 一种文档格式转换方法及装置 |
CN106649428A (zh) * | 2016-08-09 | 2017-05-10 | 广州视睿电子科技有限公司 | 存储文件的解析方法和装置 |
CN114172973A (zh) * | 2021-11-30 | 2022-03-11 | 深圳市国电科技通信有限公司 | 一种基于mqtt协议和698协议的数据转换处理方法及电子设备 |
CN117499504A (zh) * | 2023-12-29 | 2024-02-02 | 万联易达物流科技有限公司 | 一种报文格式转换方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020143727A1 (en) * | 2001-03-27 | 2002-10-03 | Jingkun Hu | DICOM XML DTD/Schema generator |
CN101055578A (zh) * | 2006-04-12 | 2007-10-17 | 龙搜(北京)科技有限公司 | 基于规则的文档内容挖掘器 |
CN101055577A (zh) * | 2006-04-12 | 2007-10-17 | 龙搜(北京)科技有限公司 | 可扩展标记语言集中器 |
-
2012
- 2012-08-30 CN CN2012103131034A patent/CN102866986A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020143727A1 (en) * | 2001-03-27 | 2002-10-03 | Jingkun Hu | DICOM XML DTD/Schema generator |
CN101055578A (zh) * | 2006-04-12 | 2007-10-17 | 龙搜(北京)科技有限公司 | 基于规则的文档内容挖掘器 |
CN101055577A (zh) * | 2006-04-12 | 2007-10-17 | 龙搜(北京)科技有限公司 | 可扩展标记语言集中器 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015010386A1 (zh) * | 2013-07-22 | 2015-01-29 | 北大方正集团有限公司 | 文档格式转换装置和文档格式转换方法 |
CN104331391A (zh) * | 2013-07-22 | 2015-02-04 | 北大方正集团有限公司 | 文档格式转换装置和文档格式转换方法 |
US9529781B2 (en) | 2013-07-22 | 2016-12-27 | Peking University Founder Group Co., Ltd. | Apparatus and method for document format conversion |
CN103559321A (zh) * | 2013-11-22 | 2014-02-05 | 方正国际软件有限公司 | 文档格式转换系统 |
CN104765717A (zh) * | 2014-01-08 | 2015-07-08 | 北大方正集团有限公司 | 一种批量文档格式转换的方法及装置 |
CN105760501A (zh) * | 2016-02-22 | 2016-07-13 | 深圳市茁壮网络股份有限公司 | 一种文档格式转换方法及装置 |
CN106649428A (zh) * | 2016-08-09 | 2017-05-10 | 广州视睿电子科技有限公司 | 存储文件的解析方法和装置 |
CN114172973A (zh) * | 2021-11-30 | 2022-03-11 | 深圳市国电科技通信有限公司 | 一种基于mqtt协议和698协议的数据转换处理方法及电子设备 |
CN114172973B (zh) * | 2021-11-30 | 2023-12-19 | 深圳市国电科技通信有限公司 | 一种基于mqtt协议和698协议的数据转换处理方法及电子设备 |
CN117499504A (zh) * | 2023-12-29 | 2024-02-02 | 万联易达物流科技有限公司 | 一种报文格式转换方法和系统 |
CN117499504B (zh) * | 2023-12-29 | 2024-03-22 | 万联易达物流科技有限公司 | 一种报文格式转换方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102866986A (zh) | 一种文档格式转换系统 | |
US20070061706A1 (en) | Mapping property hierarchies to schemas | |
Euzenat et al. | Ontology matching | |
Nogueras-Iso et al. | Metadata standard interoperability: application in the geographic information domain | |
CN106202292B (zh) | 一种基于结构化数据模型的标准信息分析方法 | |
CN101739452A (zh) | 一种数据交换接口及其实现方法 | |
CN101908040A (zh) | 一种数据报表系统 | |
Ore et al. | TEI and cultural heritage ontologies: Exchange of information? | |
CN105224631A (zh) | 搭建行业开放云的系统及编制xbrl财务报表的方法 | |
CN105278961A (zh) | 生成数据库表结构文档的方法及系统 | |
CN114792145B (zh) | 一种基于知识图谱的标准数字化管理维护系统及方法 | |
CN102567514A (zh) | 一种数据处理方法及系统 | |
EP2246811A1 (en) | Method for improved ontology engineering | |
CN110889261A (zh) | 一种电子公文业务处理自动化的方法 | |
Kim et al. | A semantic classification model for e-catalogs | |
CN105550176A (zh) | 一种关系数据库与xml的基本映射方法 | |
He et al. | Application of the indent conversion based on XML and DOM | |
CN103020162B (zh) | Cc2000模型转换导入d5000系统的方法 | |
Ramalho et al. | Metamorphosis–a topic maps based environment to handle heterogeneous information resources | |
CN102831228A (zh) | 一种异构可扩展置标语言文档的格式转换方法 | |
CN103377175A (zh) | 基于分割的结构化文档转换 | |
Pardede | Open and Novel Issues in XML Database Applications: Future Directions and Advanced Technologies: Future Directions and Advanced Technologies | |
CN109657010B (zh) | 文档处理方法、装置和存储介质 | |
Hucka | SBMLPkgSpec: a LaTeX style file for SBML package specification documents | |
Yang et al. | Mapping Approach for Model Transformation of MDA Based on XMI/XML Platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C04 | Withdrawal of patent application after publication (patent law 2001) | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20130109 |