CN102866986A - 一种文档格式转换系统 - Google Patents

一种文档格式转换系统 Download PDF

Info

Publication number
CN102866986A
CN102866986A CN2012103131034A CN201210313103A CN102866986A CN 102866986 A CN102866986 A CN 102866986A CN 2012103131034 A CN2012103131034 A CN 2012103131034A CN 201210313103 A CN201210313103 A CN 201210313103A CN 102866986 A CN102866986 A CN 102866986A
Authority
CN
China
Prior art keywords
markup language
extensible markup
format file
language format
function point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN2012103131034A
Other languages
English (en)
Inventor
程德强
张剑英
钱建生
赵志凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN2012103131034A priority Critical patent/CN102866986A/zh
Publication of CN102866986A publication Critical patent/CN102866986A/zh
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种文档格式转换系统包括第一格式转换模块、数据库或文档、第二格式转换模块;其中,第一格式转换模块从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息;数据库或文档用于存储该任一可扩展置标语言格式中间功能点信息;第二格式转换模块用于提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。本发明系统具有通用性与实用性较高、管理与维护任务较轻、开发周期较短、成本低等特点,可广泛应用于信息领域中。

Description

一种文档格式转换系统
技术领域
本发明涉及文档处理技术,特别是涉及一种文档格式转换系统。
背景技术
随着全球信息化进程的深入发展,各行各业都在通过文档来共享信息,以数据为中心的计算模式正在演变为以文档为中心,大量电子文档已成为信息化社会中一类重要的信息资源。但是,不同的文档格式成为了通过文档共享信息的障碍。为解决这一问题,采用文档对文档的格式转换器在某种程度上解决了文档数据的互通问题。实际应用中,由于文档标准的不断更新与各种规范的不断涌现,文档对文档的格式转换器也需要随之更新。这样就需要重新开发文档对文档的格式转换器,使得工作量繁重;而且,为了实现文档的兼容性,文档对文档的格式转换器要能够实现基于多个不同标准的格式转换或者基于相同标准的不同版本之间的格式转换,这就使得格式转换器的开发与维护数量以指数级增长。
由此可见,现有技术文档对文档的格式转换器的通用性与实用性比较差,且其管理与维护任务繁重、开发周期长、成本高。
发明内容
有鉴于此,本发明的主要目的在于建立一种通用性与实用性较高、管理与维护任务较轻、开发周期较短、成本低的文档格式转换系统。
为了达到上述目的,本发明提出的技术方案为:
一种文档格式转换系统,包括第一格式转换模块、数据库或文档、第二格式转换模块;其中,
第一格式转换模块,用于从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档。
数据库或文档,用于存储第一格式转换模块发送的该任一可扩展置标语言格式中间功能点信息。
第二格式转换模块,用于从数据库或文档中提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
综上所述,本发明所述文档格式转换系统基于功能点信息,先将源可扩展标记语言格式文档转换为任一可扩展标记语言格式的数据库或文档,再将任一可扩展标记语言格式的数据库或文档转换为目标可扩展标记语言格式文档,从而实现源可扩展标记语言格式文档向目标可扩展标记语言格式文档的转换。本发明系统中,任一可扩展标记语言格式的数据库或文档转换的引入,屏蔽了源可扩展标记语言格式文档与目标可扩展标记语言格式文档之间的结构差异、语种差异等转换细节,使两种结构的文档之间的转换具有更好的通用性与实用性;在整个转换体系中,当源可扩展标记语言格式文档或目标可扩展标记语言格式文档的格式标准更新时,或者,当增加新可扩展标记语言格式文档时,只需要对更新标准涉及到的内容或者增加的新可扩展标记语言格式文档相关内容进行增量式开发即可,这样大大降低了转换体系的开发周期,减少了转换体系的管理与维护工作量,从而也降低了转换体系的开发与维护成本。
附图说明
图1是本发明所述文档格式转换系统的第一种组成结构示意图。
图2为本发明所述文档格式转换系统的第二种组成结构示意图。
图3为本发明所述第一格式转换模块的组成结构示意图。
图4为本发明所述第二格式转换模块的组成结构示意图。
图5为本发明实施例的组成结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
图1是本发明所述文档格式转换系统的第一种组成结构示意图。如图1所示,本发明所述文档格式转换系统包括第一格式转换模块1、数据库或文档2、第二格式转换模块3;其中,
第一格式转换模块1,用于从源可扩展置标语言格式文档中提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档2。
这里,数据库或文档2为任一可扩展置标语言格式的中间功能点信息的容器。
数据库或文档2,用于存储第一格式转换模块1发送的该任一可扩展置标语言格式中间功能点信息。
第二格式转换模块3,用于从数据库或文档2中提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
本发明中,可扩展置标语言(XML,Extensible Markup Language)格式包括开放文件格式(ODF,Open Document Format)、办公开放XML格式(OOXML,Office Open XML)、统一办公格式(UO F,Unified Office document Format)1.0、UOF1.1、UOF2.0等。
实际应用中,对于可扩展置标语言格式文档而言,可按照构成元素的逻辑关系将整个文档划分为若干功能点。异构可扩展置标语言格式文档之间,对应的功能点构成、功能点各构成元素的元素值标识或属性值标识、功能点各构成元素之间的逻辑关系、路径、属性特征、文本特性等数据内容相互对应;但是,在表示方式方面存在差异,即,表示结构与语义方面存在差异。这里,元素是指可扩展置标语言文档中的标签及属性。
总之,本发明所述文档格式转换系统基于功能点信息,由第一格式转换模块将源可扩展置标语言格式文档转换为任一可扩展置标语言格式的数据库或文档,由第二格式转换模块将任一可扩展置标语言格式的数据库或文档转换为目标可扩展置标语言格式文档,为异构可扩展置标语言格式文档之间建立了动态转换关系,任一可扩展置标语言格式文档甚至可以为源可扩展置标语言格式文档或目标可扩展置标语言格式文档,任一可扩展置标语言格式数据库甚至可以为源可扩展置标语言格式文档或目标可扩展置标语言格式文档作为的数据库。从而,本发明所述文档格式转换系统可以实现任意两个异构可扩展置标语言格式文档之间的相互转换。本发明系统中,基于功能点,任一可扩展置标语言格式的数据库或文档的引入,屏蔽了源可扩展置标语言格式文档与目标可扩展置标语言格式文档之间的表示结构差异、语种差异等转换细节,故本发明系统具有更好的通用性与实用性;在由所有异构可扩展置标语言文档构成的整个格式转换系统中,当源可扩展置标语言格式文档或目标可扩展置标语言格式文档的格式标准更新时,或者,当增加新可扩展置标语言格式文档时,只需要对更新标准涉及到的内容或者增加的新可扩展置标语言格式文档相关内容进行增量式开发即可,这样大大降低了转换体系的开发周期,减少了转换体系的管理与维护工作量,从而也降低了转换体系的开发与维护成本。
实际应用中,提取的源可扩展置标语言格式文档功能点信息可以是源可扩展置标语言格式文档中的所有功能点信息,也可以是源可扩展置标语言格式文档中的部分功能点信息;可根据实际需要具体确定提取的源可扩展置标语言格式文档的功能点信息。
本发明中,所述从源可扩展置标语言格式文档中提取源可扩展置标语言格式文档功能点信息采用基于可扩展置标语言的查询(XQuery,XML Query)方式。
本发明中,所述从所述数据库或文档2中提取中间功能点信息采用基于可扩展置标语言的查询方式。
图2为本发明所述文档格式转换系统的第二种组成结构示意图。如图2所示,本发明所述文档格式转换系统还包括预设模块4,用于设置源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息读取配置、中间功能点信息生成配置、目标可扩展置标语言格式文档功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系。
第一格式转换模块1,还用于从预设模块4读取源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系。
第二格式转换模块3,还用于从预设模块4读取中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系。
本发明中,所述源可扩展置标语言格式文档功能点信息读取配置包括源可扩展置标语言格式文档功能点各构成元素、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、源可扩展置标语言格式文档功能点各构成部分元素之间的逻辑关系、源可扩展置标语言格式文档功能点各构成元素路径、源可扩展置标语言格式文档功能点各构成元素属性特征、源可扩展置标语言格式文档功能点各构成元素的元素值或属性值的文本特性。
所述中间功能点信息读取配置包括中间功能点各构成元素、中间功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素之间的逻辑关系、中间功能点各构成元素路径、中间功能点各构成元素属性特征、中间功能点各构成元素的元素值或属性值的文本特性。
所述中间功能点信息生成配置包括中间功能点各构成元素、中间功能点各构成元素的描述,中间功能点各构成元素的描述包括中间功能点各构成元素之间的逻辑关系、作为引用关键词的中间功能点各构成元素的元素值标识或属性值标识。
所述目标可扩展置标语言格式文档功能点信息生成配置包括目标可扩展置标语言文档功能点各构成元素、目标可扩展置标语言文档功能点各构成元素的描述,目标可扩展置标语言文档功能点各构成元素的描述包括目标可扩展置标语言文档功能点各构成的元素之间的逻辑关系、作为引用关键词的目标可扩展置标语言文档功能点各构成元素的元素值标识或属性值标识。
所述源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系为:源可扩展置标语言格式文档功能点与中间功能点相同,源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素的元素值标识或属性值标识相对应;源可扩展置标语言格式文档功能点各构成元素的描述与中间功能点各构成元素的描述相对应;源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述、中间功能点各构成元素的元素值标识或属性值标识的描述相对应。
所述中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系为:中间功能点与目标可扩展置标语言格式文档功能点相同,中间功能点各构成元素的元素值标识或属性值标识、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应;中间功能点各构成元素的描述与目标可扩展置标语言格式文档功能点各构成元素的描述相对应;中间功能点各构成元素的元素值标识或属性值标识的描述、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述相对应。
图3为本发明所述第一格式转换模块的组成结构示意图。如图3所示,第一格式转换模块1包括源可扩展置标语言格式文档读取器11、中间可扩展置标语言格式文档生成器12;其中,
源可扩展置标语言格式文档读取器11,用于根据从预设模块4读取的可扩展置标语言格式文档功能点信息读取配置,从源可扩展置标语言格式文档功提取源可扩展置标语言格式文档功能点信息,并将源可扩展置标语言格式文档功能点信息将发送至中间可扩展置标语言格式文档生成器12。
中间可扩展置标语言格式文档生成器12,用于根据从预设模块4读取的中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系,将源可扩展置标语言格式文档读取器11发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档2。
本发明中,所述从源可扩展置标语言格式文档中提取源可扩展置标语言格式文档功能点信息包括:记录源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识。
本发明中,所述将源可扩展置标语言格式文档读取器11发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息包括:在源可扩展置标语言格式文档功能点与中间功能点相同、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识与中间功能点各构成元素的元素值标识或属性值标识相对应的情况下,将源可扩展置标语言格式文档功能点各构成元素的描述转换为中间功能点构成元素的描述,将源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述转换为中间功能点各构成元素的元素值标识或属性值标识的描述。
图4为本发明所述第二格式转换模块的组成结构示意图。如图4所示,第二格式转换模块3包括中间可扩展置标语言格式文档读取器31、目标可扩展置标语言格式文档生成器32;其中,
中间可扩展置标语言格式文档读取器31,用于中间功能点信息读取配置从所述数据库或文档2中提取中间功能点信息,并将该中间功能点信息发送至目标可扩展置标语言格式文档生成器32。
目标可扩展置标语言格式文档生成器32,用于根据目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系,将中间可扩展置标语言格式文档读取器31发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
本发明中,所述从所述数据库或文档2中提取中间功能点信息包括:记录中间功能点各构成元素的元素值标识或属性值标识;
本发明中,所述将中间可扩展置标语言格式文档读取器31发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息包括:在中间功能点与目标可扩展置标语言格式文档功能点相同、中间功能点各构成元素的元素值标识或属性值标识与目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应的情况下,将中间功能点构成元素的描述转换为目标可扩展置标语言格式文档功能点各构成元素的描述,将中间功能点各构成元素的元素值标识或属性值标识的描述转换为目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述。
实施例
图5为本发明实施例的组成结构示意图。如图5所示,本实施例包括预设模块、源可扩展置标语言格式文档读取器、中间可扩展置标语言格式文档生成器、数据库或文档、中间可扩展置标语言格式文档读取器、目标可扩展置标语言格式文档生成器。源可扩展置标语言格式文档读取器根据从预设模块读取源可扩展置标语言格式文档功能点信息读取配置,从源可扩展置标语言格式文档提取的功能点包括功能点USERINFO、功能点NAME、功能点ADDRESS、功能点EMAIL,功能点USERINFO包含功能点NAME、功能点ADDRESS、功能点EMAIL,功能点NAME、功能点ADDRESS、功能点EMAIL为并列关系。
本实施例中,源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系分别见表1、表2、表3。
表1源可扩展置标语言格式文档读取配置
  父元素名称   元素名称   元素描述   备注
  mapping   reader   开始读取规则
  reader   USERINFO   userinfo功能点开始
  USERINFO   path   userinfo路径
  USERINFO   NAME   name功能点标签
  NAME   path   name路径
  NAME   nameAttribute   name功能点标签属性
  USERINFO   ADDRESS   address功能点标签
  ADDRESS   path   address路径
  ADDRESS   addressAttribute   address功能点标签属性
  USERINFO   EMAIL   email标签
  EMAIL   path   email路径
  EMAIL   textPath   获取email文本路径
  EMAIL   nameID   获取email文本标识
  *Attribute   nameID   获取相应属性文本标识
  *Attribute   path   获取相应属性路径
  *Attribute   isAttribute   是否是属性   是标签属性还是文本
  *Attribute   attributeStart   属性开始标志   用于截取属性值
  *Attribute   attributeEnd   属性结束标志   用于截取属性值
表2中间功能点信息生成配置
Figure BDA00002074821200101
表3源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系
本实施例采用基于可扩展置标语言的查询方式,根据如表1、表2、表3所示的可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系,将源可扩展置标语言格式文档功能点信息转化为表3第3列所示格式的中间功能点信息。实际应用中,表3第3列所示格式的中间功能点信息被存储于数据库或文档中。
本实施例中,中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系分别见表4、表5、表6。
表4中间功能点信息读取配置
  父元素名称   元素名称   元素描述   备注
  mapping   reader   开始读取规则
  reader   userinfo   userinfo功能点开始
  userinfo   path   userinfo节点路径
  userinfo   name   name为userinfo的子元素
  name   path   name路径
  name   firstname   firstname为name的子元素
  firstname   path   firstname路径
  firstname   textPath   firstname文本路径
  firstname   nameID   firstname标识
  name   lastname   lastname为name的子元素
  lastname   path   lastname路径
  lastname   textPath   lastname文本路径
  lastname   nameID   lastname标识
  userinfo   address   address为userinfo的子元素
  address   path   address路径
  address   street   street为address的子元素
  street   path   street路径
  street   textpath   street的文本路径
  street   nameID   street标识
  address   district   district为address的子元素
  district   path   district路径
  district   textpath   district的文本路径
  drstrict   nameID   district标识
  address   city   city为address的子元素
  city   path   city路径
  city   textpath   city的文本路径
  city   nameID   city标识
  userinfo   email   email为userinfo的子元素
  email   path   email路径
  email   textpath   email文本路径
  email   nameID   email文本内容
表5目标可扩展置标语言格式文档功能点信息生成配置
Figure BDA00002074821200131
表6中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系
Figure BDA00002074821200132
本实施例采用基于可扩展置标语言的查询方式,根据如表4、表5、表6所示的中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系,将中间功能点信息转化为表6第3列所示格式的目标可扩展置标语言格式文档功能点信息。
基于上述表1~表6,本实施例实现了源可扩展置标语言格式文档向目标可扩展置标语言格式文档的转换。
实际应用中,如果将上述目标可扩展置标语言格式文档作为新的源可扩展置标语言格式文档,将上述源可扩展置标语言格式文档作为新的目标可扩展置标语言格式文档;那么,采用本发明所述异构可扩展置标语言文档的格式转换方法,同样可以实现新的源可扩展置标语言格式文档向新的目标可扩展置标语言格式文档的转换。转换过程中,采用如表7所示的新的源可扩展置标语言格式文档功能点信息读取配置、如表2所示的中间功能点信息生成配置、如表4所示的中间功能点信息读取配置、如表8所示的新的目标可扩展置标语言格式文档功能点信息生成配置、新的源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系、中间功能点信息与新的目标可扩展置标语言格式文档功能点信息之间的映射关系。这里,新的源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系与表6所示的中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系基本相同,不同之处仅在于将表6中的“目标可扩展置标语言格式文档功能点信息”作为“新的源可扩展置标语言格式文档功能点信息”;同理,中间功能点信息与新的目标可扩展置标语言格式文档功能点信息之间的映射关系与表3所示的源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系基本相同,不同之处仅在于将表3中的“源可扩展置标语言格式文档功能点信息”作为“新的目标可扩展置标语言格式文档功能点信息”。表7所示的新的源可扩展置标语言格式文档功能点信息读取配置实际为原来的目标可扩展置标语言格式文档功能点信息读取配置,表8所示的新的目标可扩展置标语言格式文档功能点信息生成配置实际为原来的源可扩展置标语言格式文档功能点信息生成配置。
表7新的源可扩展置标语言格式文档功能点信息读取配置
  父元素名称   元素名称  元素描述   备注
  mapping   reader  开始读取规则
  reader   用户基本信息  userinfo功能点开始
  用户基本信息   path  userinfo路径
  用户基本信息   姓名  name功能点
  姓名   path  name路径
  姓名   textPath  用于读取name功能点标签的文本
  姓名   nameID  name标识
  用户基本信息   地址  address功能点
  地址   path  address路径
  地址   通信地址  通信地址为address功能点的子元素
  通信地址   path  通信地址路径
  通信地址   textPath  通信地址文本
  通信地址   nameID  通信地址标识
  用户基本信息   电子邮件  email功能点
  电子邮件   path  email路径
  电子邮件   textPath  email文本
  电子邮件   nameID  email标识
表8新的目标可扩展置标语言格式文档功能点信息生成配置(表中哪个是nameID)?
Figure BDA00002074821200151
Figure BDA00002074821200161
本实施例中,将“nameID”作为引用关键词。
基于上述转换,本实施例可以实现转换体系中任意两个异构可扩展置标语言格式文档之间的格式转换。
实际应用中,如果转换体系中某种可扩展置标语言格式文档的标准更新或者增加一种新的可扩展置标语言格式文档,那么,只需要将标准更新后的某种可扩展置标语言格式文档功能点信息读取配置、标准更新后的某种可扩展置标语言格式文档功能点信息生成配置、标准更新后的某种可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系或者新的可扩展置标语言格式文档功能点信息读取配置、新的可扩展置标语言格式文档功能点生成配置、新的可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系添加入转换体系即可。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种文档格式转换系统,其特征在于,所述格式转换系统包括第一格式转换模块、数据库或文档、第二格式转换模块;其中,
第一格式转换模块,用于从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息,并将该源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档;
数据库或文档,用于存储第一格式转换模块发送的该任一可扩展置标语言格式中间功能点信息;
第二格式转换模块,用于从数据库或文档中提取中间功能点信息,并将中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
2.根据权利要求1所述文档格式转换系统,其特征在于,所述格式转换系统还包括预设模块,用于设置源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息读取配置、中间功能点信息生成配置、目标可扩展置标语言格式文档功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系;
所述第一格式转换模块,还用于从预设模块读取源可扩展置标语言格式文档功能点信息读取配置、中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系;
所述第二格式转换模块,还用于从预设模块读取中间功能点信息读取配置、目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系。
3.根据权利要求2所述的文档格式转换系统,其特征在于,所述源可扩展置标语言格式文档功能点信息读取配置包括源可扩展置标语言格式文档功能点各构成元素、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、源可扩展置标语言格式文档功能点各构成部分元素之间的逻辑关系、源可扩展置标语言格式文档功能点各构成元素路径、源可扩展置标语言格式文档功能点各构成元素属性特征、源可扩展置标语言格式文档功能点各构成元素的元素值或属性值的文本特性;
所述中间功能点信息读取配置包括中间功能点各构成元素、中间功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素之间的逻辑关系、中间功能点各构成元素路径、中间功能点各构成元素属性特征、中间功能点各构成元素的元素值或属性值的文本特性;
所述中间功能点信息生成配置包括中间功能点各构成元素、中间功能点各构成元素的描述,中间功能点各构成元素的描述包括中间功能点各构成元素之间的逻辑关系、作为引用关键词的中间功能点各构成元素的元素值标识或属性值标识;
所述目标可扩展置标语言格式文档功能点信息生成配置包括目标可扩展置标语言文档功能点各构成元素、目标可扩展置标语言文档功能点各构成元素的描述,目标可扩展置标语言文档功能点各构成元素的描述包括目标可扩展置标语言文档功能点各构成的元素之间的逻辑关系、作为引用关键词的目标可扩展置标语言文档功能点各构成元素的元素值标识或属性值标识;
所述源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系为:源可扩展置标语言格式文档功能点与中间功能点相同,源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识、中间功能点各构成元素的元素值标识或属性值标识相对应;源可扩展置标语言格式文档功能点各构成元素的描述与中间功能点各构成元素的描述相对应;源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述、中间功能点各构成元素的元素值标识或属性值标识的描述相对应;
所述中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系为:中间功能点与目标可扩展置标语言格式文档功能点相同,中间功能点各构成元素的元素值标识或属性值标识、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应;中间功能点各构成元素的描述与目标可扩展置标语言格式文档功能点各构成元素的描述相对应;中间功能点各构成元素的元素值标识或属性值标识的描述、目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述相对应。
4.根据权利要求3所述的文档格式转换系统,其特征在于,所述第一格式转换模块包括源可扩展置标语言格式文档读取器、中间可扩展置标语言格式文档生成器;其中,
源可扩展置标语言格式文档读取器,用于根据从所述预设模块读取的可扩展置标语言格式文档功能点信息读取配置,从源可扩展置标语言格式文档功提取源可扩展置标语言格式文档功能点信息,并将源可扩展置标语言格式文档功能点信息将发送至中间可扩展置标语言格式文档生成器;
中间可扩展置标语言格式文档生成器,用于根据从所述预设模块读取的中间功能点信息生成配置、源可扩展置标语言格式文档功能点信息与中间功能点信息之间的映射关系,将源可扩展置标语言格式文档读取器发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息后,发送至数据库或文档。
5.根据权利要求3所述文档格式转换系统,其特征在于,所述第二格式转换模块包括中间可扩展置标语言格式文档读取器、目标可扩展置标语言格式文档生成器;其中,
中间可扩展置标语言格式文档读取器,用于中间功能点信息读取配置从所述数据库或文档中提取中间功能点信息,并将该中间功能点信息发送至目标可扩展置标语言格式文档生成器;
目标可扩展置标语言格式文档生成器,用于根据目标可扩展置标语言格式文档功能点信息生成配置、中间功能点信息与目标可扩展置标语言格式文档功能点信息之间的映射关系,将中间可扩展置标语言格式文档读取器发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息。
6.根据权利要求1或4所述的文档格式转换系统,其特征在于,所述从源可扩展置标语言格式文档提取源可扩展置标语言格式文档功能点信息采用基于可扩展置标语言的查询方式;
所述从所述数据库或文档中提取中间功能点信息采用基于可扩展置标语言的查询方式。
7.根据权利要求6所述的文档格式转换系统,其特征在于,所述从源可扩展置标语言格式文档功提取源可扩展置标语言格式文档功能点信息包括:记录源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识;
所述将源可扩展置标语言格式文档读取器发送的源可扩展置标语言格式文档功能点信息转换为任一可扩展置标语言格式的中间功能点信息包括:在源可扩展置标语言格式文档功能点与中间功能点相同、源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识与中间功能点各构成元素的元素值标识或属性值标识相对应的情况下,将源可扩展置标语言格式文档功能点各构成元素的描述转换为中间功能点构成元素的描述,将源可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述转换为中间功能点各构成元素的元素值标识或属性值标识的描述。
8.根据权利要求5所述的文档格式转换系统,其特征在于,所述从所述数据库或文档中提取中间功能点信息包括:记录中间功能点各构成元素的元素值标识或属性值标识;
所述将中间可扩展置标语言格式文档读取器发送的中间功能点信息转换为目标可扩展置标语言格式文档功能点信息包括:在中间功能点与目标可扩展置标语言格式文档功能点相同、中间功能点各构成元素的元素值标识或属性值标识与目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识相对应的情况下,将中间功能点构成元素的描述转换为目标可扩展置标语言格式文档功能点各构成元素的描述,将中间功能点各构成元素的元素值标识或属性值标识的描述转换为目标可扩展置标语言格式文档功能点各构成元素的元素值标识或属性值标识的描述。
CN2012103131034A 2012-08-30 2012-08-30 一种文档格式转换系统 Withdrawn CN102866986A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012103131034A CN102866986A (zh) 2012-08-30 2012-08-30 一种文档格式转换系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103131034A CN102866986A (zh) 2012-08-30 2012-08-30 一种文档格式转换系统

Publications (1)

Publication Number Publication Date
CN102866986A true CN102866986A (zh) 2013-01-09

Family

ID=47445864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103131034A Withdrawn CN102866986A (zh) 2012-08-30 2012-08-30 一种文档格式转换系统

Country Status (1)

Country Link
CN (1) CN102866986A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559321A (zh) * 2013-11-22 2014-02-05 方正国际软件有限公司 文档格式转换系统
WO2015010386A1 (zh) * 2013-07-22 2015-01-29 北大方正集团有限公司 文档格式转换装置和文档格式转换方法
CN104765717A (zh) * 2014-01-08 2015-07-08 北大方正集团有限公司 一种批量文档格式转换的方法及装置
CN105760501A (zh) * 2016-02-22 2016-07-13 深圳市茁壮网络股份有限公司 一种文档格式转换方法及装置
CN106649428A (zh) * 2016-08-09 2017-05-10 广州视睿电子科技有限公司 存储文件的解析方法和装置
CN114172973A (zh) * 2021-11-30 2022-03-11 深圳市国电科技通信有限公司 一种基于mqtt协议和698协议的数据转换处理方法及电子设备
CN117499504A (zh) * 2023-12-29 2024-02-02 万联易达物流科技有限公司 一种报文格式转换方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020143727A1 (en) * 2001-03-27 2002-10-03 Jingkun Hu DICOM XML DTD/Schema generator
CN101055578A (zh) * 2006-04-12 2007-10-17 龙搜(北京)科技有限公司 基于规则的文档内容挖掘器
CN101055577A (zh) * 2006-04-12 2007-10-17 龙搜(北京)科技有限公司 可扩展标记语言集中器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020143727A1 (en) * 2001-03-27 2002-10-03 Jingkun Hu DICOM XML DTD/Schema generator
CN101055578A (zh) * 2006-04-12 2007-10-17 龙搜(北京)科技有限公司 基于规则的文档内容挖掘器
CN101055577A (zh) * 2006-04-12 2007-10-17 龙搜(北京)科技有限公司 可扩展标记语言集中器

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015010386A1 (zh) * 2013-07-22 2015-01-29 北大方正集团有限公司 文档格式转换装置和文档格式转换方法
CN104331391A (zh) * 2013-07-22 2015-02-04 北大方正集团有限公司 文档格式转换装置和文档格式转换方法
US9529781B2 (en) 2013-07-22 2016-12-27 Peking University Founder Group Co., Ltd. Apparatus and method for document format conversion
CN103559321A (zh) * 2013-11-22 2014-02-05 方正国际软件有限公司 文档格式转换系统
CN104765717A (zh) * 2014-01-08 2015-07-08 北大方正集团有限公司 一种批量文档格式转换的方法及装置
CN105760501A (zh) * 2016-02-22 2016-07-13 深圳市茁壮网络股份有限公司 一种文档格式转换方法及装置
CN106649428A (zh) * 2016-08-09 2017-05-10 广州视睿电子科技有限公司 存储文件的解析方法和装置
CN114172973A (zh) * 2021-11-30 2022-03-11 深圳市国电科技通信有限公司 一种基于mqtt协议和698协议的数据转换处理方法及电子设备
CN114172973B (zh) * 2021-11-30 2023-12-19 深圳市国电科技通信有限公司 一种基于mqtt协议和698协议的数据转换处理方法及电子设备
CN117499504A (zh) * 2023-12-29 2024-02-02 万联易达物流科技有限公司 一种报文格式转换方法和系统
CN117499504B (zh) * 2023-12-29 2024-03-22 万联易达物流科技有限公司 一种报文格式转换方法和系统

Similar Documents

Publication Publication Date Title
CN102866986A (zh) 一种文档格式转换系统
US20070061706A1 (en) Mapping property hierarchies to schemas
Euzenat et al. Ontology matching
Nogueras-Iso et al. Metadata standard interoperability: application in the geographic information domain
CN106202292B (zh) 一种基于结构化数据模型的标准信息分析方法
CN101739452A (zh) 一种数据交换接口及其实现方法
CN101908040A (zh) 一种数据报表系统
Ore et al. TEI and cultural heritage ontologies: Exchange of information?
CN105224631A (zh) 搭建行业开放云的系统及编制xbrl财务报表的方法
CN105278961A (zh) 生成数据库表结构文档的方法及系统
CN114792145B (zh) 一种基于知识图谱的标准数字化管理维护系统及方法
CN102567514A (zh) 一种数据处理方法及系统
EP2246811A1 (en) Method for improved ontology engineering
CN110889261A (zh) 一种电子公文业务处理自动化的方法
Kim et al. A semantic classification model for e-catalogs
CN105550176A (zh) 一种关系数据库与xml的基本映射方法
He et al. Application of the indent conversion based on XML and DOM
CN103020162B (zh) Cc2000模型转换导入d5000系统的方法
Ramalho et al. Metamorphosis–a topic maps based environment to handle heterogeneous information resources
CN102831228A (zh) 一种异构可扩展置标语言文档的格式转换方法
CN103377175A (zh) 基于分割的结构化文档转换
Pardede Open and Novel Issues in XML Database Applications: Future Directions and Advanced Technologies: Future Directions and Advanced Technologies
CN109657010B (zh) 文档处理方法、装置和存储介质
Hucka SBMLPkgSpec: a LaTeX style file for SBML package specification documents
Yang et al. Mapping Approach for Model Transformation of MDA Based on XMI/XML Platform

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C04 Withdrawal of patent application after publication (patent law 2001)
WW01 Invention patent application withdrawn after publication

Application publication date: 20130109