CN112433995B - 文件格式转换方法、系统、计算机设备及存储介质 - Google Patents

文件格式转换方法、系统、计算机设备及存储介质 Download PDF

Info

Publication number
CN112433995B
CN112433995B CN202011470583.6A CN202011470583A CN112433995B CN 112433995 B CN112433995 B CN 112433995B CN 202011470583 A CN202011470583 A CN 202011470583A CN 112433995 B CN112433995 B CN 112433995B
Authority
CN
China
Prior art keywords
file
element information
writing
label
xml
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011470583.6A
Other languages
English (en)
Other versions
CN112433995A (zh
Inventor
胡绍文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wanxing Technology Hunan Co ltd
Original Assignee
Wanxing Technology Hunan Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wanxing Technology Hunan Co ltd filed Critical Wanxing Technology Hunan Co ltd
Priority to CN202011470583.6A priority Critical patent/CN112433995B/zh
Publication of CN112433995A publication Critical patent/CN112433995A/zh
Application granted granted Critical
Publication of CN112433995B publication Critical patent/CN112433995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • G06F16/166File name conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1744Redundancy elimination performed by the file system using compression, e.g. sparse files
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明实施例公开了文件格式转换方法、系统、计算机设备及存储介质,其中,方法包括:解析初始文件中的元素信息,并进行分页保存;生成所述元素信息对应的元素信息标签,并将所述元素信息标签写入XML文件中;将所述XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。本发明实施例通过将初始文件格式转换成目标文件格式,满足了用户对及时修改文档内容的需求,同时也满足了用户演示过程中展示文件特性的需求。

Description

文件格式转换方法、系统、计算机设备及存储介质
技术领域
本发明实施例涉及文件转换技术领域,特别涉及一种文件格式转换方法、系统、计算机设备及存储介质。
背景技术
现有技术中,具有固定版式页面内容的文件,其文档编辑体验差,仅能进行局部编辑并阅览传播,不能进行全文编辑,并且缺少一些展示特性,如特效、动画及模板等,即无法满足演示方面的需求。
发明内容
本发明实施例提供了文件格式转换方法、系统、计算机设备及存储介质,旨在解决具有固定版式页面内容的文件不能全文编辑、无法满足演示需求的问题。
第一方面,本发明实施例提供了一种文件格式转换方法,其包括:
解析初始文件中的元素信息,并进行分页保存;
生成所述元素信息对应的元素信息标签,并将所述元素信息标签写入XML文件中;
将所述XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
第二方面,本发明实施例提供了一种文件格式转换系统,其包括:
文件解析单元,用于解析初始文件中的元素信息,并进行分页保存;
文件标签写入单元,用于生成所述元素信息对应的元素信息标签,并将所述元素信息标签写入XML文件中;
目标文件获取单元,用于将所述XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
第三方面,本发明实施例又提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的文件格式转换方法。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的文件格式转换方法。
本发明实施例提供了文件格式转换方法、系统、计算机设备及存储介质,其中,方法包括:解析初始文件中的元素信息,并进行分页保存;生成所述元素信息对应的元素信息标签,并将所述元素信息标签写入XML文件中;将所述XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。本发明实施例通过将初始文件格式转换成目标文件格式,满足了用户对及时修改文档内容的需求,同时也满足了用户演示过程中展示文件特性的需求。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种文件格式转换方法的流程示意图;
图2为本发明实施例所提供的一种文件格式转换系统的示意性框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本发明实施例提供的一种文件格式转换方法的流程示意图,该方法可以包括步骤S101~S103:
S101、解析初始文件中的元素信息,并进行分页保存;
在本步骤中,对初始文件进行解析,获取其中的元素信息,然后将这些元素信息分页保存。其中分页保存可以是将一种元素信息单独保存,也可以是将多种元素共同保存,根据需求选择合适的保存方式。
在一具体实施例中,步骤S101包括:
解析并提取初始文件中的元素信息;
将元素信息输入至转换层,对元素信息中的单位及坐标进行转换,并按元素类型将转换后的元素信息保存至不同的结构体中。
在本实施例中,在对初始文件进行解析后,通过识别算法将初始文件中的元素信息进行提取,然后将元素信息输入至转换层,通过转换层将单位以及坐标转换为目标文件适用的格式,并保存至不同结构体中。结构体是一种集合,它里面包含了多个变量或数组,它们的类型可以相同,也可以不同,每个这样的变量或数组都称为结构体的成员。其中,初始文件可以是PDF文件、Word文件等Office常用文件,目标文件可以是目标文件。
在一具体实施例中,将元素信息输入至转换层,对元素信息中的单位及坐标进行转换,并按元素类型将转换后的元素信息保存至不同的结构体中包括:
将元素信息输入至转换层对元素信息中的单位及坐标进行转换,获取转换后的元素信息;
为每一元素信息设置对应的结构体,通过结构体中的变量接收及更新对应的元素信息。
在本实施例中,将元素信息保存至结构体后,通过结构体中的变量接收及更新该结构体中保存的元素信息。在结构体中可以设置一个变量或者多个变量,并未每一个变量赋予对应的元素信息,通过修改对应的变量,对元素信息进行对应修改。
S102、生成元素信息对应的元素信息标签,并将元素信息标签写入XML文件中;
在本步骤中,通过对所提取的元素信息进行处理,获得对应的元素信息标签,然后将元素信息标签写入XML文件中。
在一具体实施例中,步骤S102包括:
通过RapidXml框架中的文件上传接口将元素信息与对应的标签进行绑定,以获得元素信息标签;其中,元素信息包括文本数据、表格以及路径中的至少一种;
通过文件写入接口将元素信息和对应的元素信息标签写入XML文件中。
在本实施例中,通过RapidXml框架中的文件上传接口(即PutObject())将元素信息与对应的元素信息标签进行绑定,然后通过文件写入接口(即WriteNode())将元素信息与对应的元素信息标签写入XML文件。RapidXml是一个试图创建最快的针对XML(可扩展标记语言)DOM分析器(DOM即文档的标准模型),当然同时也保留它的可用性、移植性和适当的W3C兼容性(W3C即万维网联盟,是Web技术领域最具权威和影响力的国际中立性技术标准机构。)。其中文本数据包括文本内容,是否粗体、斜体、字号、字颜色、下划线、删除线、文字颜色、背景颜色、超链接;表格是由表格文本、边框线和单元格样式、图标样式、表格样式、占位符样式、段落样式、行间距等信息组成的;路径由位置、粗细、路径颜色,形状样式,形状颜色、贝茨码组成。不同类型的元素信息可以由不同的结构体存放,同种类型的元素信息也可以由不同的结构体存放,根据需求进行选择即可。
在一具体实施例中,通过文件写入接口将元素信息和对应的元素信息标签写入XML文件中包括:
先将目标文件所需的默认标签写入至XML文件中;
再将元素信息和对应的元素信息标签写入XML文件中。
在本实施例中,在XML文件写入的标签中,包含有两类标签,一类是目标文件所需要的默认标签,另一类则是写入具体元素所需要的元素信息和对应的元素信息标签。其中默认标签需要在写入具体元素之前写入XML文件中,因此先将默认标签写入XML文件后,再写入元素信息和对应的元素信息标签,以呈现完整的元素效果。
在一具体实施例中,将元素信息和对应的元素信息标签写入XML文件中包括:
创建第一文件和第二文件;
将默认标签以及元素信息和对应的元素信息标签中的一部分写入至第一文件,并将元素信息和对应的元素信息标签中的另一部分写入至第二文件;
将第一文件和第二文件进行合并,得到XML文件。
在本实施例中,由于默认标签需要先进行写入,因此将默认标签全部写入第一文件后,继续在第一文件中写入元素信息和对应的元素信息标签的一部分,然后将元素信息和对应的元素信息标签的剩余部分写入第二文件中,将第一文件和第二文件合并得到XML文件。这里所说的合并是通过创建第三文件,将第一文件和第二文件的内容按顺序拼接写入第三文件中,所获得具有的默认标签以及元素信息和对应的元素信息标签的第三文件,该第三文件即为XML文件。这种合并方式可以防止因一次性在同一文件中写入过多内容而导致内存崩溃。在获得第三文件后将第一文件和第二文件删除,以减少内存。
以获取的目标文件为目标文件为例,具体的,默认标签主要包括:<key:presentation>、<key:size>、<key:theme-list>、<key:slide-list>。其中,<key:presentation>是目标的XML结构中的一级标签,所有写入标签,都被包含其中;<key:size>是一级标签下的次级标签,内部属性表示页面的长宽;<key:theme-list>是二级标签,其中包含的子标签内容和属性表示幻灯片主题的一些样式,可供slidelist.xml中page标签中的元素内容调用,此标签及其子标签都被写入到了themelist.xml中,主要包含<key:theme><key:stylesheet><key:master-slides><key:master-slide><key:page>这些子标签;<key:slide-list>是二级标签,其中包含的子标签内容和属性表示主要的幻灯片的内容和属性,其标签和子标签元素被写入到slidelist.xml中,其中主要包含<key:slide>、<key:stylesheet>、<key:page>这些子标签,其中最主要的便是<key:page>标签,里面写入的是具体元素内容,其它子标签内部包含的是元素属性。
S103、将XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
在本步骤中,将写好的XML文件进行压缩,生成后缀名为zip的文件压缩包,然后将该文件压缩包的后缀名进行更改,以获得目标文件。
在一具体实施例中,当初始文件中包含有图片数据时,步骤S103包括:
将图片数据写入二进制文件中,以获取JPEG格式图片;
将JPEG格式图片和XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
在本实施例中,当初始文件中不仅包含文本数据、表格以及路径这些元素信息,还包含有图片时,将图片数据写入二进制文件中,并更改后缀名为JPEG,以获得JPEG格式图片,然后将JPEG格式图片与XML文件共同压缩为zip格式的文件压缩包,然后再对文件后缀名进行更改,以得到目标文件。
请参阅图2,图2为本发明实施例提供的一种文件格式转换系统的示意性框图,该文件格式转换系统200包括:
文件解析单元201,用于解析初始文件中的元素信息,并进行分页保存;
文件标签写入单元202,用于生成元素信息对应的元素信息标签,并将元素信息标签写入XML文件中;
目标文件获取单元203,用于将XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
在一实施例中,文件解析单元201包括:
元素信息提取单元,用于解析并提取初始文件中的元素信息;
元素信息转换单元,用于将元素信息输入至转换层,对元素信息中的单位及坐标进行转换,并按元素类型将转换后的元素信息保存至不同的结构体中。
在一实施例中,文件标签写入单元202包括:
标签绑定单元,用于通过RapidXml框架中的文件上传接口将元素信息与对应的标签进行绑定,以获得元素信息标签;其中,元素信息包括文本数据、表格以及路径中的至少一种;
XML文件生成单元,用于通过文件写入接口将元素信息和对应的元素信息标签写入XML文件中。
在一实施例中,XML文件生成单元包括:
默认标签写入单元,用于先将目标文件所需的默认标签写入至XML文件中;
元素信息标签写入单元,用于再将元素信息和对应的元素信息标签写入XML文件中。
在一实施例中,元素信息标签写入单元包括:
文件创建单元,用于创建第一文件和第二文件;
分页写入单元,用于将默认标签以及元素信息和对应的元素信息标签中的一部分写入至第一文件,并将元素信息和对应的元素信息标签中的另一部分写入至第二文件;
文件合并单元,用于将第一文件和第二文件进行合并,得到XML文件。
在一实施例中,元素信息转换单元包括:
转换成输入单元,用于将元素信息输入至转换层对元素信息中的单位及坐标进行转换,获取转换后的元素信息;
结构体设置单元,用于为每一元素信息设置对应的结构体,通过结构体中的变量接收及更新对应的元素信息。
在一实施例中,目标文件获取单元包括:
JPEG格式图片获取单元,用于将图片数据写入二进制文件中,以获取JPEG格式图片;
图片与文件压缩单元,用于将JPEG格式图片和XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的一种文件格式转换方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的一种文件格式转换方法。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (4)

1.一种文件格式转换方法,其特征在于,包括:
解析初始文件中的元素信息,并进行分页保存;其中,所述初始文件是PDF文件;
生成所述元素信息对应的元素信息标签,并将所述元素信息标签写入XML文件中;
将所述XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件;
所述解析初始文件中的元素信息,并进行分页保存,包括:
解析并提取所述初始文件中的元素信息;
将所述元素信息输入至转换层,对所述元素信息中的单位及坐标进行转换,并按元素类型将转换后的元素信息保存至不同的结构体中;
所述生成所述元素信息对应的元素信息标签,并将所述元素信息标签写入XML文件中,包括:
通过RapidXml框架中的文件上传接口将所述元素信息与对应的标签进行绑定,以获得元素信息标签;其中,所述元素信息包括文本数据、表格以及路径中的至少一种;
通过文件写入接口将所述元素信息和对应的所述元素信息标签写入XML文件中;
所述通过文件写入接口将所述元素信息和对应的所述元素信息标签写入XML文件中,包括:
先将目标文件所需的默认标签写入至所述XML文件中;
再将所述元素信息和对应的所述元素信息标签写入XML文件中;
所述将所述元素信息和对应的所述元素信息标签写入XML文件中,包括:
创建第一文件和第二文件;
将所述默认标签以及所述元素信息和对应的所述元素信息标签中的一部分写入至第一文件,并将所述元素信息和对应的所述元素信息标签中的另一部分写入至第二文件;
将所述第一文件和第二文件进行合并,得到所述XML文件;所述合并是通过创建第三文件,将第一文件和第二文件的内容按顺序拼接写入第三文件中,获得具有的默认标签以及元素信息和对应的元素信息标签的第三文件;
所述将所述元素信息输入至转换层,对所述元素信息中的单位及坐标进行转换,并按元素类型将转换后的元素信息保存至不同的结构体中,包括:
将所述元素信息输入至转换层对所述元素信息中的单位及坐标进行转换,获取转换后的元素信息;
为每一元素信息设置对应的结构体,通过所述结构体中的变量接收及更新对应的元素信息;
当所述初始文件中包含有图片数据时,所述将所述XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件包括:
将所述图片数据写入二进制文件中,以获取JPEG格式图片;
将所述JPEG格式图片和XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
2.一种文件格式转换系统,其特征在于,包括:
文件解析单元,用于解析初始文件中的元素信息,并进行分页保存;所述初始文件是PDF文件;
文件标签写入单元,用于生成所述元素信息对应的元素信息标签,并将所述元素信息标签写入XML文件中;
目标文件获取单元,用于将所述XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件;
文件解析单元包括:
元素信息提取单元,用于解析并提取初始文件中的元素信息;
元素信息转换单元,用于将元素信息输入至转换层,对元素信息中的单位及坐标进行转换,并按元素类型将转换后的元素信息保存至不同的结构体中;
文件标签写入单元包括:
标签绑定单元,用于通过RapidXml框架中的文件上传接口将元素信息与对应的标签进行绑定,以获得元素信息标签;其中,元素信息包括文本数据、表格以及路径中的至少一种;
XML文件生成单元,用于通过文件写入接口将元素信息和对应的元素信息标签写入XML文件中;
所述XML文件生成单元包括:
默认标签写入单元,用于先将目标文件所需的默认标签写入至XML文件中;
元素信息标签写入单元,用于再将元素信息和对应的元素信息标签写入XML文件中;
所述元素信息标签写入单元包括:
文件创建单元,用于创建第一文件和第二文件;
分页写入单元,用于将默认标签以及元素信息和对应的元素信息标签中的一部分写入至第一文件,并将元素信息和对应的元素信息标签中的另一部分写入至第二文件;
文件合并单元,用于将第一文件和第二文件进行合并,得到XML文件;所述合并是通过创建第三文件,将第一文件和第二文件的内容按顺序拼接写入第三文件中,获得具有的默认标签以及元素信息和对应的元素信息标签的第三文件;
所述元素信息转换单元包括:
转换成输入单元,用于将元素信息输入至转换层对元素信息中的单位及坐标进行转换,获取转换后的元素信息;
结构体设置单元,用于为每一元素信息设置对应的结构体,通过结构体中的变量接收及更新对应的元素信息;
所述目标文件获取单元包括:
JPEG格式图片获取单元,用于将图片数据写入二进制文件中,以获取JPEG格式图片;
图片与文件压缩单元,用于将JPEG格式图片和XML文件进行压缩,并对压缩文件的后缀名进行更改,以获取格式转换后的目标文件。
3.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1所述的文件格式转换方法。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1所述的文件格式转换方法。
CN202011470583.6A 2020-12-14 2020-12-14 文件格式转换方法、系统、计算机设备及存储介质 Active CN112433995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011470583.6A CN112433995B (zh) 2020-12-14 2020-12-14 文件格式转换方法、系统、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011470583.6A CN112433995B (zh) 2020-12-14 2020-12-14 文件格式转换方法、系统、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112433995A CN112433995A (zh) 2021-03-02
CN112433995B true CN112433995B (zh) 2023-06-06

Family

ID=74692280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011470583.6A Active CN112433995B (zh) 2020-12-14 2020-12-14 文件格式转换方法、系统、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112433995B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687832B (zh) * 2021-10-27 2022-03-04 上海捷勃特机器人有限公司 机器人程序的存储及编译方法
CN116594960B (zh) * 2023-06-08 2024-01-30 镁佳(北京)科技有限公司 描述性文件格式转换方法、装置、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644027A (zh) * 2016-07-20 2018-01-30 江苏云媒数字科技有限公司 一种超媒体元数据合成与转换系统
CN111753717A (zh) * 2020-06-23 2020-10-09 北京百度网讯科技有限公司 用于提取文本的结构化信息的方法、装置、设备及介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101963955B (zh) * 2010-09-17 2013-01-30 深圳市万兴软件有限公司 XML格式文档转换为Word格式文档的系统和方法
CN101963956B (zh) * 2010-09-19 2013-09-25 深圳万兴信息科技股份有限公司 一种xml文档转换为pptx文档的方法和装置
US10318614B2 (en) * 2015-07-01 2019-06-11 Tnq Books And Journals Private Limited Transformation of marked-up content into a file format that enables automated browser based pagination

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644027A (zh) * 2016-07-20 2018-01-30 江苏云媒数字科技有限公司 一种超媒体元数据合成与转换系统
CN111753717A (zh) * 2020-06-23 2020-10-09 北京百度网讯科技有限公司 用于提取文本的结构化信息的方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
标文通与XSL-FO的格式分析及转换;许振伟;梁琦;李宁;田英爱;;计算机工程与设计(第08期);全文 *

Also Published As

Publication number Publication date
CN112433995A (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN109408783B (zh) 电子文档在线编辑方法及系统
US8055997B2 (en) System and method for implementing dynamic forms
KR101608112B1 (ko) 웹상의 문서보기를 위해 폰트를 제공하는 컴퓨터 구현방법 및 시스템과 컴퓨터 판독가능 매체
JP4290011B2 (ja) ビューワ装置及びその制御方法、プログラム
CN101271463B (zh) 版式文件的结构处理方法和系统
CN110083805A (zh) 一种将Word文件转换为EPUB文件的方法及系统
US20110087959A1 (en) Method and device for processing the structure of a layout file
CN112433995B (zh) 文件格式转换方法、系统、计算机设备及存储介质
US8411956B2 (en) Associating optical character recognition text data with source images
CN101593186A (zh) 可视化网站编辑方法及可视化网站编辑系统
CN103699591A (zh) 一种基于示例页面的网页正文提取方法
CN105005472B (zh) 一种web上显示维吾尔文字的方法及装置
CN110347390B (zh) 一种快速生成web页面的方法、存储介质、设备及系统
CN112527291A (zh) 网页生成方法、装置、电子设备及存储介质
CN111881651A (zh) 一种uot流式文档转换成ofd版式文档的方法
US9619445B1 (en) Conversion of content to formats suitable for digital distributions thereof
US9817913B2 (en) Method and apparatus for collecting, merging and presenting content
CN117436417A (zh) 演示文稿生成方法、装置、电子设备和存储介质
CN110162301B (zh) 一种表单渲染方法、装置和存储介质
CN111597292A (zh) 基于网页标签位置的文本格式化清洗方法
JPWO2006051974A1 (ja) 文書処理装置および文書処理方法
CN116110065A (zh) 题卡数据生成方法、装置、计算机设备和存储介质
JPH09282218A (ja) Html文書本型整形方法及びその装置
CN111401005B (zh) 文本转换方法、装置及可读存储介质
JP5707937B2 (ja) 電子文書変換装置及び電子文書変換方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant