CN105302775A - 一种文件格式转换方法及装置 - Google Patents

一种文件格式转换方法及装置 Download PDF

Info

Publication number
CN105302775A
CN105302775A CN201410307695.8A CN201410307695A CN105302775A CN 105302775 A CN105302775 A CN 105302775A CN 201410307695 A CN201410307695 A CN 201410307695A CN 105302775 A CN105302775 A CN 105302775A
Authority
CN
China
Prior art keywords
page
file
conversion
converter
concrete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410307695.8A
Other languages
English (en)
Inventor
金美玉
刘金朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HONGHE TECHNOLOGY Co Ltd
Original Assignee
HONGHE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HONGHE TECHNOLOGY Co Ltd filed Critical HONGHE TECHNOLOGY Co Ltd
Priority to CN201410307695.8A priority Critical patent/CN105302775A/zh
Publication of CN105302775A publication Critical patent/CN105302775A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种文件格式转换方法及装置创建出一种通用的数据转换方式。本发明通过文件头转换器创建目录、页面转换器转换页面描述信息、对象转换器转换具体对象,并循环判断并调用页面转换器及对象转换器达到将源文件中所有的文件头、页面、及对象全部转换。该方法及装置能够容纳不同软件所存储的对象内容,从而实现不同文件格式到通用数据结构的转换,来达到在白板的使用情况下,基于XML文件格式下所有的页面及对象都能够相互转换的目的。

Description

一种文件格式转换方法及装置
技术领域
本发明涉及数据处理技术领域,特别是指一种文件格式转换方法及装置。
背景技术
目前,白板是最常用的教学工具。对应白板生成的格式文件不同的公司会有自己公司所对应不同的格式,因此在不同公司的产品之间阅读对应的白板文件就需要进行格式转换。
由于大部分文件格式的存储都是以XML这种规则格式语言为基础。不同软件存储的文件就可以基于XML的操作来进行相互转换。主要涉及到XML文件的遍历和DOM树的建立。以及源文件和目标文件之间的对应关系的建立。以及XML节点的读写,文件的压缩和解压缩。
但是在现有技术中,文件转换主要是针对所转换的源文件和目标文件都是基于XML的文件才能实现存储,且现有技术只能转换文本文件,对于图形、图片、视频文件之间的转换并不能够非常好的支持进而无法进行转换。
发明内容
有鉴于此,本发明的目的在于提出一种文件格式转换方法及装置,能够实现不同文件格式到通用数据结构的转换。
基于上述目的本发明提供的一种文件格式转换方法,包括以下步骤:
解压源文件;
生成文件头转换器、页面转换器、对象转换器,并把所有的具体的对象转换器实例化注册到文件头转换器和页面转换器的列表中;
所述文件头转换器按照页面组织形式的对应关系转换文件头信息;
所述页面转换器根据页面对应关系,转换页面信息;
判断页面是否转换完成,如果是则拷贝外部文件,打包到输出目标文件包;如果否则遍历具体页面,然后用页面转换器转换未完成的所述页面信息;
遍历具体页面,转换未完成的页面信息
判断是否有对象需要转换,如果是则读取对象节点,调用页面转换器中的列表进行对比查找,然后调用具体的对象所对应的对象转换器进行具体对象转换,所述具体对象转换完成以后再重新判断是否有对象需要转换;如果否则再判断页面是否转换完成;
拷贝外部文件,将所有已转换的文件头信息、页面信息、具体对象信息打包到输出目标文件包。
可选的,所述的页面组织形式的对应关系具体是指遍历所有的源文件中的页面节点,从节点信息中提取出ID信息,并构造出目录信息;构造目录信息是将提取出目标文件的ID信息列成目录
文件头信息主要是对源文件和/或目标文件的页面组织形式的描述;转换文件头信息就是要把源文件的页面组织形式按照对应关系转换成目标文件的页面组织形式。
可选的,所述的转换页面具体是指遍历源文件的具体的页面描述信息,按照页面对应关系生成目标页面的描述信息;
在转换时,页面转换器抓取到源文件的表达方式的页面描述信息,转换为目标文件的页面描述信息。
可选的,所述的页面对应关系包括ID对应关系、分辨率对应关系、初始位置对应关系、页面特效对应关系、页面颜色对应关系。
可选的,所述的判断页面是否转换完成可以通过判断页面的对象节点是否到最后,如果页面的对象节点到最后,则说明页面转换完成,如果页面的对象节点没到最后,则说明页面转换未完成。
可选的,所述的判断是否有对象需要转换可以是通过是否读取到具体的对象节点进行判断,如果读取到具体的对象节点就说明有对象需要转换,如果没有读取到具体的对象节点就说明没有对象需要转换。
可选的,所有的具体对象都会用唯一的一个标识符来进行表示。
可选的,所述页面转换器中的列表是一种数列数组。
可选的,在对象转换时,对象转换器抓取到源文件对象的表达方式,转换为目标文件对象的表达方式。
文件格式转换装置所述的对象转换器包括直线转换器、三角形转换器、多边形转换器、椭圆形转换器、笔迹转换器、图片转换器、视频转换器。
本发明提供的一种文件格式转换装置,包括解压模块、生成模块、转换器模块、判断模块、读取模块、存储模块;
解压模块用于解压源文件;
生成模块用于生成转换器模块,转换器模块包括文件头转换器、页面转换器、对象转换器,并把所有的具体的对象转换器实例化注册到文件头转换器和页面转换器的列表中;
所述文件头转换器按照页面组织形式的对应关系转换文件头信息;
所述页面转换器根据页面对应关系,转换页面信息;
所述对象转换器用于对转换具体对象;
判断模块用于判断页面是否转换完成,如果是则用存储模块拷贝外部文件,打包到输出目标文件包;如果否则用读取模块遍历具体页面,然后用页面转换器转换未完成的所述页面信息;或者判断模块还用于判断是否有对象需要转换,如果是则用读取模块读取对象节点,如果否则用判断模块再次判断页面是否转换完成;
读取模块用于遍历具体页面,遍历之后由转换器模块转换未完成的页面信息;或者读取模块还用于读取对象节点,调用页面转换器中的列表进行对比查找,然后调用具体的对象所对应的对象转换器进行具体对象转换。具体对象转换完成以后再用判断模块判断是否有对象需要转换;
存储模块用于用于拷贝外部文件,将所有已转换的文件头信息、页面信息、具体对象信息打包到输出目标文件包
可选的,所述的页面组织形式的对应关系具体是指遍历所有的源文件中的页面节点,从节点信息中提取出ID信息,并构造出目录信息;构造目录信息是将提取出目标文件的ID信息列成目录
文件头信息主要是对源文件和/或目标文件的页面组织形式的描述;转换文件头信息就是要把源文件的页面组织形式按照对应关系转换成目标文件的页面组织形式。
可选的,所述的转换页面具体是指遍历源文件的具体的页面描述信息,按照页面对应关系生成目标页面的描述信息;在转换时,页面转换器抓取到源文件的表达方式的页面描述信息,转换为目标文件的页面描述信息。
可选的,所述的页面对应关系包括ID对应关系、分辨率对应关系、初始位置对应关系、页面特效对应关系、页面颜色对应关系。
可选的,所述的判断模块在判断页面是否转换完成可以通过判断页面的对象节点是否到最后,如果页面的对象节点到最后,则说明页面转换完成,如果页面的对象节点没到最后,则说明页面转换未完成。
可选的,所述的判断模块在判断是否有对象需要转换可以是通过是否读取到具体的对象节点进行判断,如果读取到具体的对象节点就说明有对象需要转换,如果没有读取到具体的对象节点就说明没有对象需要转换。
可选的,所有的具体对象都会用唯一的一个标识符来进行表示。
可选的,所述页面转换器中的列表是一种数列数组。
可选的,在对象转换时,对象转换器抓取到源文件对象的表达方式,转换为目标文件对象的表达方式。
可选的,所述的对象转换器包括直线转换器、三角形转换器、多边形转换器、椭圆形转换器、笔迹转换器、图片转换器、视频转换器。
从上面所述可以看出,本发明提供的一种文件格式转换方法及装置创建出一种通用的数据转换方式,本发明通过文件头转换器创建目录、页面转换器转换页面描述信息、对象转换器转换具体对象,并循环判断并调用页面转换器及对象转换器达到将源文件中所有的文件头、页面、及对象全部转换。该方法及装置能够容纳不同软件所存储的对象内容,从而实现不同文件格式到通用数据结构的转换,来达到在白板的使用情况下,基于XML文件格式下所有的页面及对象都能够相互转换的目的。
附图说明
图1为本发明实施例一种文件格式转换方法示意图;
图2为本发明实施例一种文件格式转换装置示意图;
图3为本发明实施例一种文件格式转换装置转换器模块示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
参见图1所示,本发明提供了一种文件格式转换方法,包括以下步骤;
步骤1.解压源文件。
步骤2.生成文件头转换器、页面转换器、对象转换器,并把所有的具体的对象转换器实例化注册到文件头转换器和页面转换器的列表中。
步骤3.所述文件头转换器按照页面组织形式的对应关系转换文件头信息。
作为一个实施例,页面组织形式的对应关系具体是指遍历所有的源文件中的页面节点,从节点信息中提取出ID信息(例如文件名和索引),并构造出目录信息。
作为一个实施例,文件头信息主要是指对源文件和/或目标文件的页面组织形式的描述。转换文件头信息就是要把源文件的页面组织形式按照对应关系转换成目标文件的页面组织形式。
作为一个实施例,构造目录信息是将提取出目标文件的ID信息列成目录。具体的,目录可以是树形列表的形式。
步骤4.所述页面转换器根据页面对应关系,转换页面信息。
作为一个实施例,页面信息是指的页面的描述信息,包括页面的ID、分辨率、初始位置、页面特效、页面颜色。
作为一个实施例,转换页面具体是指遍历源文件的具体的页面描述信息,按照页面对应关系生成目标页面的描述信息。源文件的和/或目标文件通过不同的表达方式来表示页面描述信息。在转换时,页面转换器抓取到源文件的表达方式的页面描述信息,转换为目标文件的页面描述信息。
作为一个实施例,页面对应关系包括ID对应关系、分辨率对应关系、初始位置对应关系、页面特效对应关系、页面颜色对应关系。
具体的,ID对应关系具体是指源文件的ID是一串连续的字符串,目标文件的ID为单一字符(如单一数字或单一字母),在转换ID时,页面转换器抓取到源文件ID的字符串,转换为目标文件ID的单一字符。
分辨率对应关系具体是指源文件将分辨率存储为矩形,从矩形的四角的坐标值所涵盖的8个数字中,可以提取出宽度、高度。而目标文件的分辨率是直接用宽度、高度表示。在转换分辨率时,页面转换器抓取到源文件的矩形四个角的坐标值、转换为目标文件的宽度与高度。
初始位置对应关系具体是指源文件以矩形四角坐标存储分辨率,坐上角的坐标值是源文件的页面初始位置,目标文件直接将初始位置进行设定。在转换初始位置是,页面转换器抓取到矩形左上角坐标值提取出来作为目标文件的初始位置。
页面特效对应关系具体是指源文件以英文单词形式存储某个特效效果,目标文件以数字存储某个效果。在转换页面特效时,页面转换器抓取到源文件页面特效的英文单词,转换为目标文件的数字。例如飞入特效源文件用Flyinto表示,目标文件用1表示。
页面颜色对应关系具体是指源文件以数字方式存储某个颜色,目标文件以字符串方式存储。在页面颜色转换时,页面转换器抓取到源文件表示颜色的数字,转换为目标文件的字符串。例如源文件以255,0,0表示红色,目标文件以#FF0000表示。
上述关于页面转换器中具体页面描述信息的转换的具体实施例,也可以是将上述目标文件的页面描述信息(如页面的ID、分辨率、初始位置、页面特效、页面颜色)转换为源文件的页面描述信息。
步骤5.判断页面是否转换完成,如果是则转到步骤9拷贝外部文件,打包到输出目标文件包;如果否则转到步骤6遍历具体页面,然后用页面转换器转换未完成的所述页面信息。
作为一个实施例,判断页面是否转换完成可以通过判断页面的对象节点是否到最后,如果页面的对象节点到最后,则说明页面转换完成,如果页面的对象节点没到最后,则说明页面转换未完成。
步骤6.遍历具体页面,转换未完成的页面信息。作为一个实施例,转换未完成的页面不包括步骤4已经转换完成的页面。例如,步骤4转换到了页面的第三行,那么步骤6就从步骤5判断为否以后从第四行开始转换。
步骤7.判断是否有对象需要转换,如果是则转到步骤8,如果否则转到步骤5再判断页面是否转换完成。
作为一个实施例,判断是否有对象需要转换可以是通过是否读取到具体的对象节点进行判断,如果读取到具体的对象节点就说明有对象需要转换,如果没有读取到具体的对象节点就说明没有对象需要转换。
步骤8.读取对象节点,调用页面转换器中的列表进行对比查找,然后调用具体的对象所对应的对象转换器进行具体对象转换。具体对象转换完成以后返回步骤7进行判断。
作为一个实施例,所述页面转换器中的列表可以是一种数列数组。
作为一个实施例,所有的具体对象都会用唯一的一个标识符来进行表示,(例如用svg:polygon表示该对象为多边形,svg:image表示该对象为图片等)在对比查找过程中,当所述唯一的标识符被读取到时,则说明此时应该调用与该标识符对应的对象转换器。
作为一个实施例,对象转换器包括直线转换器、三角形转换器、多边形转换器、椭圆形转换器、笔迹转换器、图片转换器、视频转换器。源文件的和/或目标文件中的具体对象通过不同的表达方式来表示具体对象。在转换时,对象转换器抓取到源文件对象的表达方式,转换为目标文件对象的表达方式。
例如在直线的转换中,源文件是用两个坐标值来表示;目标文件是用直线上一个点的坐标值,以及该坐标值所对应的点与另一个点之间的差值来表示。直线转换器抓取到源文件直线上两点的坐标值,转换为目标文件第一个点坐标值和该坐标值所对应的点与另一个点之间的差值来表示。
在三角的形转中,源文件中用stroke-width表示三角形线宽,三个坐标值表示三角形的三个点;目标文件用width表示三角形线宽,三个坐标值表示三角形的三个点。三角形转换器抓取到源文件三角形线宽和坐标值信息,转换成为目标文件的三角形线宽和坐标值的表达方式。
在多边形转换中,源文件用svg:polygon表示多边形,用坐标值表示多边形的各个顶点,目标文件用shape表示多边形,用坐标值表示多边形的各个顶点,并用具体数字表示多边形边数(比如四边形用number=“4”表示)。多边形转换器抓取到源文件的多边形坐标值信息,转换为目标文件的坐标值信息和边数信息的表达方式。
在椭圆形转换时,源文件用(cx,cy)坐标值表示椭圆形的中心点,用长度表示椭圆的两个半径;目标文件用point=“x,y”表示椭圆形的中心点,用长度表示椭圆的两个半径。椭圆形转换器抓取到源文件中中心点及半径信息,转换成为目标文件椭圆形的中心点和长度的表达方式。
作为一个实施例,当椭圆形的两个半径长度一致时,为圆形。
在笔迹转换时,源文件用stroke-dasharray="2,2"表示虚线,用具体的坐标值表示笔迹运动的轨迹;目标文件用stroke-type="DashLine"表示虚线,用起笔时第一个点的坐标值以及在轨迹上后面的点与第一个点之间的差值表示笔记运动的轨迹。笔迹转换器抓取到源文件笔迹及轨迹运动轨迹的表达方式,转换为目标文件笔迹及轨迹运动轨迹的表达方式。
在图片或视频转换时,源文件用图片或视频初始位置(左上角坐标值)、宽、高表示;目标文件用图片或视频中左上角和右下角的坐标值表示;图片或视频转换器抓取到源文件图片或视频初始位置、宽、高信息,转换为目标文件图片或视频中左上角和右下角的坐标值的表达方式。
步骤9.拷贝外部文件,将所有已转换的文件头信息、页面信息、具体对象信息打包到输出目标文件包。
作为一个实施例,图片或视频转换器中,存储的信息只是图片或视频的初始位置及大小信息,而图片或视频的具体内容是存储在外部文件中的。在转换时,先用图片或视频转换器转换初始位置及大小信息,再从源文件的外部文件夹中读取具体内容拷贝到目标文件的外部文件夹中。例如源文件的图片1.jpg存在文件夹/images下,目标文件将图片1.jpg存在文件夹/filelibrary下。
参见图2、图3所示本发明提供了一种文件格式转换装置,包括以下模块:
解压模块301、生成模块302、转换器模块303、判断模块304、读取模块305、存储模块306
解压模块301用于解压源文件。
生成模块302用于生成转换器模块303,转换器模块303包括文件头转换器3031、页面转换器3032、对象转换器3033,并把所有的具体的对象转换器3033实例化注册到文件头转换器3031和页面转换器3032的列表中。
所述文件头转换器3031用于按照页面组织形式的对应关系转换文件头信息。
作为一个实施例,页面组织形式的对应关系具体是指遍历所有的源文件中的页面节点,从节点信息中提取出ID信息(例如文件名和索引),并构造出目录信息。
作为一个实施例,文件头信息主要是指对源文件和/或目标文件的页面组织形式的描述。文件头转换器3031在转换文件头信息时就是要把源文件的页面组织形式按照对应关系转换成目标文件的页面组织形式。
作为一个实施例,构造目录信息是将提取出目标文件的ID信息列成目录。具体的,目录可以是树形列表的形式。
页面转换器3032用于根据页面对应关系,转换页面信息。
作为一个实施例,页面信息是指的页面的描述信息,包括页面的ID、分辨率、初始位置、页面特效、页面颜色。
作为一个实施例,页面转换器3032转换页面具体是指遍历源文件的具体的页面描述信息,按照页面对应关系生成目标页面的描述信息。源文件的和/或目标文件通过不同的表达方式来表示页面描述信息。在转换时,页面转换器3032抓取到源文件的表达方式的页面描述信息,转换为目标文件的页面描述信息。
作为一个实施例,页面对应关系包括ID对应关系、分辨率对应关系、初始位置对应关系、页面特效对应关系、页面颜色对应关系。
具体的,ID对应关系具体是指源文件的ID是一串连续的字符串,目标文件的ID为单一字符(如单一数字或单一字母),在转换ID时,页面转换器3032抓取到源文件ID的字符串,转换为目标文件ID的单一字符。
分辨率对应关系具体是指源文件将分辨率存储为矩形,从矩形的四角的坐标值所涵盖的8个数字中,可以提取出宽度、高度。而目标文件的分辨率是直接用宽度、高度表示。在转换分辨率时,页面转换器3032抓取到源文件的矩形四个角的坐标值、转换为目标文件的宽度与高度。
初始位置对应关系具体是指源文件以矩形四角坐标存储分辨率,坐上角的坐标值是源文件的页面初始位置,目标文件直接将初始位置进行设定。在转换初始位置是,页面转换器3032抓取到矩形左上角坐标值提取出来作为目标文件的初始位置。
页面特效对应关系具体是指源文件以英文单词形式存储某个特效效果,目标文件以数字存储某个效果。在转换页面特效时,页面转换器3032抓取到源文件页面特效的英文单词,转换为目标文件的数字。例如飞入特效源文件用Flyinto表示,目标文件用1表示。
页面颜色对应关系具体是指源文件以数字方式存储某个颜色,目标文件以字符串方式存储。在页面颜色转换时,页面转换器3032抓取到源文件表示颜色的数字,转换为目标文件的字符串。例如源文件以255,0,0表示红色,目标文件以#FF0000表示。
上述关于页面转换器3032中具体页面描述信息的转换的具体实施例,也可以是将上述目标文件的页面描述信息(如页面的ID、分辨率、初始位置、页面特效、页面颜色)转换为源文件的页面描述信息。
判断模块304用于判断页面是否转换完成,如果是则用存储模块306拷贝外部文件,打包到输出目标文件包;如果否则用读取模块305遍历具体页面,然后用页面转换器3032转换未完成的所述页面信息。
作为一个实施例,判断页面是否转换完成可以通过判断页面的对象节点是否到最后,如果页面的对象节点到最后,则说明页面转换完成,如果页面的对象节点没到最后,则说明页面转换未完成。
读取模块305用于遍历具体页面,遍历之后由转换器模块303转换未完成的页面信息。
作为一个实施例,页面转换器3032转换未完成的页面不包括已经转换完成的页面。例如,页面转换器3032已经转换到了页面的第三行,那么未完成的页面就是就从判断模块304判断页面没有转换完成以后从第四行开始转换。
判断模块304还用于判断是否有对象需要转换,如果是则用读取模块305读取对节点,如果否则用判断模块304再次判断页面是否转换完成。
作为一个实施例,判断是否有对象需要转换可以是通过是否读取到具体的对象节点进行判断,如果读取到具体的对象节点就说明有对象需要转换,如果没有读取到具体的对象节点就说明没有对象需要转换。
读取模块305还用于读取对象节点,调用页面转换器中的列表进行对比查找,然后调用具体的对象所对应的对象转换器3033进行具体对象转换。具体对象转换完成以后再用判断模块304判断是否有对象需要转换。
作为一个实施例,所述页面转换器3032中的列表可以是一种数列数组。
作为一个实施例,所有的具体对象都会用唯一的一个标识符来进行表示,(例如用svg:polygon表示该对象为多边形,svg:image表示该对象为图片等)在对比查找过程中,当所述唯一的标识符被读取到时,则说明此时应该调用与该标识符对应的对象转换器。
作为一个实施例,对象转换器3033包括直线转换器、三角形转换器、多边形转换器、椭圆形转换器、笔迹转换器、图片转换器、视频转换器。源文件的和/或目标文件中的具体对象通过不同的表达方式来表示具体对象。在转换时,对象转换器抓取到源文件对象的表达方式,转换为目标文件对象的表达方式。
例如在直线的转换中,源文件是用两个坐标值来表示;目标文件是用直线上一个点的坐标值,以及该坐标值所对应的点与另一个点之间的差值来表示。直线转换器抓取到源文件直线上两点的坐标值,转换为目标文件第一个点坐标值和该坐标值所对应的点与另一个点之间的差值来表示。
在三角的形转中,源文件中用stroke-width表示三角形线宽,三个坐标值表示三角形的三个点;目标文件用width表示三角形线宽,三个坐标值表示三角形的三个点。三角形转换器抓取到源文件三角形线宽和坐标值信息,转换成为目标文件的三角形线宽和坐标值的表达方式。
在多边形转换中,源文件用svg:polygon表示多边形,用坐标值表示多边形的各个顶点,目标文件用shape表示多边形,用坐标值表示多边形的各个顶点,并用具体数字表示多边形边数(比如四边形用number=“4”表示)。多边形转换器抓取到源文件的多边形坐标值信息,转换为目标文件的坐标值信息和边数信息的表达方式。
在椭圆形转换时,源文件用(cx,cy)坐标值表示椭圆形的中心点,用长度表示椭圆的两个半径;目标文件用point=“x,y”表示椭圆形的中心点,用长度表示椭圆的两个半径。椭圆形转换器抓取到源文件中中心点及半径信息,转换成为目标文件椭圆形的中心点和长度的表达方式。
作为一个实施例,当椭圆形的两个半径长度一致时,为圆形。
在笔迹转换时,源文件用stroke-dasharray="2,2"表示虚线,用具体的坐标值表示笔迹运动的轨迹;目标文件用stroke-type="DashLine"表示虚线,用起笔时第一个点的坐标值以及在轨迹上后面的点与第一个点之间的差值表示笔记运动的轨迹。笔迹转换器抓取到源文件笔迹及轨迹运动轨迹的表达方式,转换为目标文件笔迹及轨迹运动轨迹的表达方式。
在图片或视频转换时,源文件用图片或视频初始位置(左上角坐标值)、宽、高表示;目标文件用图片或视频中左上角和右下角的坐标值表示;图片或视频转换器抓取到源文件图片或视频初始位置、宽、高信息,转换为目标文件图片或视频中左上角和右下角的坐标值的表达方式。
存储模块306用于拷贝外部文件,将所有已转换的文件头信息、页面信息、具体对象信息打包到输出目标文件包。
作为一个实施例,在所述的图片或视频转换器中,存储的信息只是图片或视频的初始位置及大小信息,而图片或视频的具体内容是存储在外部文件中的。在转换时,先用图片或视频转换器转换初始位置及大小信息,再从源文件的外部文件夹中读取具体内容拷贝到目标文件的外部文件夹中。例如源文件的图片1.jpg存在文件夹/images下,目标文件将图片1.jpg存在文件夹/filelibrary下。
所属领域的普通技术人员应当理解:以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (20)

1.一种文件格式转换方法,其特征在于包括以下步骤:
解压源文件;
生成文件头转换器、页面转换器、对象转换器,并把所有的具体的对象转换器实例化注册到文件头转换器和页面转换器的列表中;
所述文件头转换器按照页面组织形式的对应关系转换文件头信息;
所述页面转换器根据页面对应关系,转换页面信息;
判断页面是否转换完成,如果是则拷贝外部文件,打包到输出目标文件包;如果否则遍历具体页面,然后用页面转换器转换未完成的所述页面信息;
遍历具体页面,转换未完成的页面信息
判断是否有对象需要转换,如果是则读取对象节点,调用页面转换器中的列表进行对比查找,然后调用具体的对象所对应的对象转换器进行具体对象转换,所述具体对象转换完成以后再重新判断是否有对象需要转换;如果否则再判断页面是否转换完成;
拷贝外部文件,将所有已转换的文件头信息、页面信息、具体对象信息打包到输出目标文件包。
2.根据权利要求1所述的文件格式转换方法,其特征在于,所述的页面组织形式的对应关系具体是指遍历所有的源文件中的页面节点,从节点信息中提取出ID信息,并构造出目录信息;构造目录信息是将提取出目标文件的ID信息列成目录
文件头信息主要是对源文件和/或目标文件的页面组织形式的描述;转换文件头信息就是要把源文件的页面组织形式按照对应关系转换成目标文件的页面组织形式。
3.根据权利要求1所述的文件格式转换方法,其特征在于,所述的转换页面具体是指遍历源文件的具体的页面描述信息,按照页面对应关系生成目标页面的描述信息;
在转换时,页面转换器抓取到源文件的表达方式的页面描述信息,转换为目标文件的页面描述信息。
4.根据权利要求3所述的文件格式转换方法,其特征在于,所述的页面对应关系包括ID对应关系、分辨率对应关系、初始位置对应关系、页面特效对应关系、页面颜色对应关系。
5.根据权利要求1所述的文件格式转换方法,其特征在于,所述的判断页面是否转换完成可以通过判断页面的对象节点是否到最后,如果页面的对象节点到最后,则说明页面转换完成,如果页面的对象节点没到最后,则说明页面转换未完成。
6.根据权利要求1所述的文件格式转换方法,其特征在于,所述的判断是否有对象需要转换可以是通过是否读取到具体的对象节点进行判断,如果读取到具体的对象节点就说明有对象需要转换,如果没有读取到具体的对象节点就说明没有对象需要转换。
7.根据权利要求1所述的文件格式转换方法,其特征在于,所有的具体对象都会用唯一的一个标识符来进行表示。
8.根据权利要求1所述的文件格式转换方法,其特征在于,所述页面转换器中的列表是一种数列数组。
9.根据权利要求1所述的文件格式转换方法,其特征在于,在对象转换时,对象转换器抓取到源文件对象的表达方式,转换为目标文件对象的表达方式。
10.根据权利要求9所述的文件格式转换方法,其特征在于,所述的对象转换器包括直线转换器、三角形转换器、多边形转换器、椭圆形转换器、笔迹转换器、图片转换器、视频转换器。
11.一种文件格式转换装置,其特征在于,包括解压模块、生成模块、转换器模块、判断模块、读取模块、存储模块;
解压模块用于解压源文件;
生成模块用于生成转换器模块,转换器模块包括文件头转换器、页面转换器、对象转换器,并把所有的具体的对象转换器实例化注册到文件头转换器和页面转换器的列表中;
所述文件头转换器按照页面组织形式的对应关系转换文件头信息;
所述页面转换器根据页面对应关系,转换页面信息;
所述对象转换器用于对转换具体对象;
判断模块用于判断页面是否转换完成,如果是则用存储模块拷贝外部文件,打包到输出目标文件包;如果否则用读取模块遍历具体页面,然后用页面转换器转换未完成的所述页面信息;或者判断模块还用于判断是否有对象需要转换,如果是则用读取模块读取对象节点,如果否则用判断模块再次判断页面是否转换完成;
读取模块用于遍历具体页面,遍历之后由转换器模块转换未完成的页面信息;或者读取模块还用于读取对象节点,调用页面转换器中的列表进行对比查找,然后调用具体的对象所对应的对象转换器进行具体对象转换。具体对象转换完成以后再用判断模块判断是否有对象需要转换;
存储模块用于用于拷贝外部文件,将所有已转换的文件头信息、页面信息、具体对象信息打包到输出目标文件包。
12.根据权利要求11所述的文件格式转换装置,其特征在于,所述的页面组织形式的对应关系具体是指遍历所有的源文件中的页面节点,从节点信息中提取出ID信息,并构造出目录信息;构造目录信息是将提取出目标文件的ID信息列成目录
文件头信息主要是对源文件和/或目标文件的页面组织形式的描述;转换文件头信息就是要把源文件的页面组织形式按照对应关系转换成目标文件的页面组织形式。
13.根据权利要求11所述的文件格式转换装置,其特征在于,所述的转换页面具体是指遍历源文件的具体的页面描述信息,按照页面对应关系生成目标页面的描述信息;在转换时,页面转换器抓取到源文件的表达方式的页面描述信息,转换为目标文件的页面描述信息。
14.根据权利要求13所述的文件格式转换装置,其特征在于,所述的页面对应关系包括ID对应关系、分辨率对应关系、初始位置对应关系、页面特效对应关系、页面颜色对应关系。
15.根据权利要求11所述的文件格式转换装置,其特征在于,所述的判断模块在判断页面是否转换完成可以通过判断页面的对象节点是否到最后,如果页面的对象节点到最后,则说明页面转换完成,如果页面的对象节点没到最后,则说明页面转换未完成。
16.根据权利要求11所述的文件格式转换装置,其特征在于,所述的判断模块在判断是否有对象需要转换可以是通过是否读取到具体的对象节点进行判断,如果读取到具体的对象节点就说明有对象需要转换,如果没有读取到具体的对象节点就说明没有对象需要转换。
17.根据权利要求11所述的文件格式转换装置,其特征在于,所有的具体对象都会用唯一的一个标识符来进行表示。
18.根据权利要求11所述的文件格式转换装置,其特征在于,所述页面转换器中的列表是一种数列数组。
19.根据权利要求11所述的文件格式转换装置,其特征在于,在对象转换时,对象转换器抓取到源文件对象的表达方式,转换为目标文件对象的表达方式。
20.根据权利要求19所述的文件格式转换装置,其特征在于,所述的对象转换器包括直线转换器、三角形转换器、多边形转换器、椭圆形转换器、笔迹转换器、图片转换器、视频转换器。
CN201410307695.8A 2014-06-30 2014-06-30 一种文件格式转换方法及装置 Pending CN105302775A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410307695.8A CN105302775A (zh) 2014-06-30 2014-06-30 一种文件格式转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410307695.8A CN105302775A (zh) 2014-06-30 2014-06-30 一种文件格式转换方法及装置

Publications (1)

Publication Number Publication Date
CN105302775A true CN105302775A (zh) 2016-02-03

Family

ID=55200055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410307695.8A Pending CN105302775A (zh) 2014-06-30 2014-06-30 一种文件格式转换方法及装置

Country Status (1)

Country Link
CN (1) CN105302775A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975218A (zh) * 2016-04-28 2016-09-28 武汉开目信息技术有限责任公司 一种基于数据转换器的图形文件浏览及打印装置和方法
CN106202169A (zh) * 2016-06-24 2016-12-07 北京玖扬博文文化发展有限公司 一种ePub文件格式的转换方法
CN108021661A (zh) * 2017-12-04 2018-05-11 北京锐安科技有限公司 一种数据格式转换方法及系统
CN111723230A (zh) * 2019-03-19 2020-09-29 珠海金山办公软件有限公司 一种图片拼接的方法、装置、电子设备及存储介质
CN114118007A (zh) * 2021-12-02 2022-03-01 江苏中威科技软件系统有限公司 一种版式数据流文件转ofd文件的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612136A (zh) * 2001-11-12 2005-05-04 株式会社Ntt都科摩 文件转换系统以及文件转换方法
US20060041502A1 (en) * 2004-08-21 2006-02-23 Blair William R Cost management file translation methods, systems, and apparatuses for extended commerce
CN101051308A (zh) * 2006-04-05 2007-10-10 北京北大方正电子有限公司 一种排版领域里文件输出方法
CN101216828A (zh) * 2007-12-27 2008-07-09 北大方正集团有限公司 一种图像文件转换方法及装置
CN101930370A (zh) * 2010-09-09 2010-12-29 上海普元信息技术股份有限公司 Soa应用系统服务集成中实现数据转换的系统结构及其方法
CN101963955A (zh) * 2010-09-17 2011-02-02 深圳市万兴软件有限公司 XML格式文档转换为Word格式文档的系统和方法
CN102073624A (zh) * 2009-11-25 2011-05-25 李成龙 一种能够存储电子图书格式的方法
CN103649909A (zh) * 2011-07-08 2014-03-19 微软公司 用于XPS和OpenXPS文档的转换工具

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612136A (zh) * 2001-11-12 2005-05-04 株式会社Ntt都科摩 文件转换系统以及文件转换方法
US20060041502A1 (en) * 2004-08-21 2006-02-23 Blair William R Cost management file translation methods, systems, and apparatuses for extended commerce
CN101051308A (zh) * 2006-04-05 2007-10-10 北京北大方正电子有限公司 一种排版领域里文件输出方法
CN101216828A (zh) * 2007-12-27 2008-07-09 北大方正集团有限公司 一种图像文件转换方法及装置
CN102073624A (zh) * 2009-11-25 2011-05-25 李成龙 一种能够存储电子图书格式的方法
CN101930370A (zh) * 2010-09-09 2010-12-29 上海普元信息技术股份有限公司 Soa应用系统服务集成中实现数据转换的系统结构及其方法
CN101963955A (zh) * 2010-09-17 2011-02-02 深圳市万兴软件有限公司 XML格式文档转换为Word格式文档的系统和方法
CN103649909A (zh) * 2011-07-08 2014-03-19 微软公司 用于XPS和OpenXPS文档的转换工具

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
甘登岱: "《BIOS与注册表现用现查》", 31 May 2007, 航空工业出版社 *
麻地河等: "《JSF Web应用开发实战》", 30 September 2008, 机械工业出版社 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975218A (zh) * 2016-04-28 2016-09-28 武汉开目信息技术有限责任公司 一种基于数据转换器的图形文件浏览及打印装置和方法
CN106202169A (zh) * 2016-06-24 2016-12-07 北京玖扬博文文化发展有限公司 一种ePub文件格式的转换方法
CN108021661A (zh) * 2017-12-04 2018-05-11 北京锐安科技有限公司 一种数据格式转换方法及系统
CN111723230A (zh) * 2019-03-19 2020-09-29 珠海金山办公软件有限公司 一种图片拼接的方法、装置、电子设备及存储介质
CN114118007A (zh) * 2021-12-02 2022-03-01 江苏中威科技软件系统有限公司 一种版式数据流文件转ofd文件的方法
CN114118007B (zh) * 2021-12-02 2022-07-08 江苏中威科技软件系统有限公司 一种版式数据流文件转ofd文件的方法

Similar Documents

Publication Publication Date Title
CN105302775A (zh) 一种文件格式转换方法及装置
CN101923723B (zh) 实现电子文档显示的方法
US20130238968A1 (en) Automatic Creation of a Table and Query Tools
CN110083805A (zh) 一种将Word文件转换为EPUB文件的方法及系统
US8508756B2 (en) Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions
US8595614B2 (en) Document generating apparatus, document generating method, computer program and recording medium
JP4854491B2 (ja) 画像処理装置及びその制御方法
CN101887413B (zh) 版式表格的结构处理方法和系统
CN101196886A (zh) Word文件转换成XML文件的系统及方法
RU2004117798A (ru) Способ обработки цифровых рукописных примечаний для распознавания, привязки и переформатирования цифровых рукописных примечаний и система для его осуществления
CN104516867A (zh) 一种表格重排方法和系统
US8386943B2 (en) Method for query based on layout information
JP2004326491A (ja) 画像処理方法
JP2007166541A5 (zh)
CN102402500A (zh) Pdf文件到swf文件转换方法及系统
JP2014197341A (ja) 電子書籍制作装置、電子書籍システム、電子書籍制作方法及びプログラム
JP2012033151A (ja) 画像処理装置、画像処理方法、及びプログラム
CN111881651A (zh) 一种uot流式文档转换成ofd版式文档的方法
Tariq et al. Softconverter: A novel approach to construct OCR for printed Urdu isolated characters
CN112036406A (zh) 一种图像文档的文本抽取方法、装置及电子设备
US20080181513A1 (en) Method, apparatus and algorithm for indexing, searching, retrieval of digital stream by the use of summed partitions
CN103136453B (zh) 文档操作题的自动组卷方法和自动阅卷方法
CN104111913A (zh) 一种流式文档的处理方法及装置
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JP2016532190A (ja) 文書フォーマット変換装置及び方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: C1104 room 100085 Beijing city Haidian District Third Street No. 9 C

Applicant after: Hitevision Polytron Technologies Inc

Address before: C1104 room 100085 Beijing city Haidian District Third Street No. 9 C

Applicant before: HONGHE TECHNOLOGY CO., LTD.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20160203

RJ01 Rejection of invention patent application after publication