CN106227717A - 一种文档处理方法及装置、终端设备 - Google Patents
一种文档处理方法及装置、终端设备 Download PDFInfo
- Publication number
- CN106227717A CN106227717A CN201610565913.7A CN201610565913A CN106227717A CN 106227717 A CN106227717 A CN 106227717A CN 201610565913 A CN201610565913 A CN 201610565913A CN 106227717 A CN106227717 A CN 106227717A
- Authority
- CN
- China
- Prior art keywords
- document
- typesetting
- version
- unit
- mapping relations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000013507 mapping Methods 0.000 claims abstract description 94
- 238000000034 method Methods 0.000 claims abstract description 57
- 230000008569 process Effects 0.000 claims description 32
- 238000006243 chemical reaction Methods 0.000 claims description 22
- 238000012360 testing method Methods 0.000 claims description 11
- 230000006399 behavior Effects 0.000 claims 1
- 239000000463 material Substances 0.000 description 9
- 230000000694 effects Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/189—Automatic justification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明实施例涉及电子设备技术领域,公开了一种文档处理方法及装置、终端设备,该方法包括:确定待处理的第一网页版文档以及该第一网页版文档对应的第一映射关系,该第一映射关系用于表示第一排版标签与该第一网页版文档中的第一网页标签的映射关系,当接收到针对该第一网页版文档的文档处理指令时,根据该文档处理指令以及第一映射关系,将该第一网页版文档中的第一网页标签替换成第一排版标签,得到第一方正书版排版文档。实施本发明实施例能够提高文档的处理效率。
Description
技术领域
本发明涉及电子设备技术领域,具体涉及一种文档处理方法及装置、终端设备。
背景技术
目前,随着在线教育以及数字出版等技术的逐渐成熟,当前的教学教材由之前的纸质图书教材逐步向电子图书教材转移,同时,网络化的图文编辑处理也越来越普遍。从出版领域角度来看,部分出版商已经利用网络平台进行电子图书教材的图文编辑来代替传统的纸质稿修改;从在线教育行业来看,部分纸质图书教材已实现了云端化及电子化管理,形成了电子版内容素材。当需要对电子版内容素材进行纸质出版时,需对电子版内容素材的网页版文档(又称“源文件”)进行处理,即首先将电子版内容素材的网页版文档导出来,对该网页版文档去网页标签后重新导入排版软件,人工添加排版标签后才能够用于纸质出版。可见,当前的文档处理方法需要人工添加排版标签,存在处理效率低的问题。
发明内容
本发明实施例公开了一种文档处理方法及装置、终端设备,能够提高文档的处理效率。
本发明实施例第一方面公开了一种文档处理方法,所述方法包括:
确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系,所述第一映射关系用于表示第一排版标签与所述第一网页版文档中第一网页标签的映射关系;
当接收到针对所述第一网页版文档的文档处理指令时,根据所述文档处理指令以及所述第一映射关系,将所述第一网页版文档中的第一网页标签替换成所述第一排版标签,得到第一方正书版排版文档。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
接收用户输入的业务需求,并根据所述业务需求对所述第一方正书版文排版档执行重排版操作,得到第二方正书版排版文档;
其中,所述业务需求包括元素显示需求、尺寸需求、背景颜色需求、元素大小需求以及元素位置需求中的至少一种。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
检测所述第二方正书版排版文档中是否存在预设符号;
当检测结果为是时,输出所述预设符号所对应的第二网页标签以及提示信息,所述提示信息用于提示输入所述第二网页标签对应的第二排版标签;
接收用户输入的所述第二排版标签,并将所述第二网页标签替换成所述第二排版标签,得到第三方正书版排版文档;
建立所述第二排版标签与所述第二网页标签的第二映射关系并存储。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
确定所述第三方正书版排版文档的第三映射关系,所述第三映射关系用于表示第三网页标签与所述第三方正书版排版文档中第三排版标签的映射关系;
根据所述第三映射关系,将所述第三方正书版排版文档中的第三排版标签替换成所述第三网页标签,得到第二网页版文档;
将所述第一网页版文档更新成所述第二网页版文档。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
当所述第三方正书版排版文档中存在图像元素时,根据所述图像元素的图像下载地址下载所述图像元素对应的源图像;
根据所述图像元素的图像属性,将所述源图像添加到所述第三方正书版排版文档中。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
当所述第三方正书版排版文档中存在视频元素时,根据所述视频元素的视频下载地址下载所述视频元素对应的视频截图;
根据所述视频元素的视频属性,将所述视频截图以及所述视频下载地址添加到所述第三方正书版排版文档中。
作为一种可选的实施方式,在本发明实施例第一方面中,所述第一网页版文档为可扩展标记语言XML文档;
所述确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系之前,所述方法还包括:
确定待处理的第三网页版文档,且当所述第三网页版文档为超文本标记语言HTML文档时,将所述HTML文档转化为XML文档,作为待处理的第一网页版文档。
本发明实施例第二方面公开了一种文档处理装置,所述装置确定单元以及替换单元,其中:
所述确定单元,用于确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系,所述第一映射关系用于表示第一排版标签与所述第一网页版文档中第一网页标签的映射关系;
所述替换单元,用于当接收到针对所述第一网页版文档的文档处理指令时,根据所述文档处理指令以及所述第一映射关系,将所述第一网页版文档中的第一网页标签替换成所述第一排版标签,得到第一方正书版排版文档。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括接收单元以及排版单元,其中:
所述接收单元,用于接收用户输入的业务需求,所述业务需求包括元素显示需求、尺寸需求、背景颜色需求、元素大小需求以及元素位置需求中的至少一种;
所述排版单元,用于根据所述业务需求对所述第一方正书版排版文档执行重排版操作,得到第二方正书版排版文档。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括检测单元、输出单元、建立单元以及存储单元,其中:
所述检测单元,用于检测所述第二方正书版排版文档中是否存在预设符号;
所述输出单元,用于当所述检测单元的检测结果为是时,输出所述预设符号所对应的第二网页标签以及提示信息,所述提示信息用于提示输入所述第二网页标签对应的第二排版标签;
所述接收单元,还用于接收用户输入的所述第二排版标签;
所述替换单元,还用于将所述第二网页标签替换成所述第二排版标签,得到第三方正书版排版文档;
所述建立单元,用于建立所述第二排版标签与所述第二网页标签的第二映射关系;
所述存储单元,用于存储所述第二映射关系。
作为一种可选的实施方式,在本发明实施例第二方面中,所述确定单元,还用于确定所述第三方正书版排版文档的第三映射关系,所述第三映射关系用于表示第三网页标签与所述第三方正书版排版文档中第三排版标签的映射关系;
所述替换单元,还用于根据所述第三映射关系,将所述第三方正书版排版文档中的第三排版标签替换成所述第三网页标签,得到第二网页版文档;
所述装置还包括更新单元,其中:
所述更新单元,用于将所述第一网页版文档更新成所述第二网页版文档。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括下载单元以及添加单元,其中:
所述下载单元,用于当所述第三方正书版排版文档中存在图像元素时,根据所述图像元素的图像下载地址下载所述图像元素对应的源图像;
所述添加单元,用于根据所述图像元素的图像属性,将所述源图像添加到所述第三方正书版排版文档中。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括下载单元以及添加单元,其中:
所述下载单元,用于当所述第三方正书版排版文档中存在视频元素时,根据所述视频元素的视频下载地址下载所述视频元素对应的视频截图;
所述添加单元,用于根据所述视频元素的视频属性,将所述视频截图以及所述视频下载地址添加到所述第三方正书版排版文档中。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第一网页版文档为可扩展标记语言XML文档;
所述确定单元,还用于在确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系之前,确定待处理的第三网页版文档;
所述装置还包括转化单元,其中:
所述转化单元,用于当所述第三网页版文档为超文本标记语言HTML文档时,将所述HTML文档转化为XML文档,作为所述第一网页版文档。
本发明实施例第三方面公开了一种终端设备,所述终端设备包括本发明实施例第二方面公开的一种文档处理装置。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,确定待处理的第一网页版文档以及该第一网页版文档对应的第一映射关系,该第一映射关系用于表示第一排版标签与该第一网页版文档中的第一网页标签的映射关系,当接收到针对该第一网页版文档的文档处理指令时,根据该文档处理指令以及第一映射关系,将该第一网页版文档中的第一网页标签替换成第一排版标签,得到第一方正书版排版文档。可见,实施本发明实施例能够直接根据网页标签与排版标签的映射关系为待处理的网页版文档添加排版标签,实现了网页版文档到方正书版排版文档的自动转换,无需人工添加排版标签,技术门槛低,省时省力,提高了文档的处理效率以及处理准确率,便于快速的响应数媒到纸媒的转换,适合规模小且有制作纸质出版物需求的公司。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种文档处理方法的流程示意图;
图2是本发明实施例公开的另一种文档处理方法的流程示意图;
图3是本发明实施例公开的一种文档处理装置的结构示意图;
图4是本发明实施例公开的另一种文档处理装置的结构示意图;
图5是本发明实施例公开的又一种文档处理装置的结构示意图;
图6是本发明实施例公开的一种终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种文档处理方法及装置、终端设备,能够直接根据网页标签与排版标签的映射关系为待处理的网页版文档添加排版标签,实现了网页版文档到方正书版排版文档的自动转换,无需人工添加排版标签,省时省力,技术门槛低,提高了文档的处理效率以及处理准确率,便于快速的响应数媒到纸媒的转换。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种文档处理方法的流程示意图。其中,图1所示的文档处理方法可以应用于具有排版功能的终端设备中。如图1所示,该文档处理方法可以包括以下操作:
101、终端设备确定待处理的第一网页版文档以及该第一网页版文档对应的第一映射关系,该第一映射关系用于表示第一排版标签与第一网页版文档中第一网页标签的映射关系。
本发明实施例中,终端设备中可以预先存储有映射关系(或对应关系),该映射关系是网页或平台标准中的后台标记(即网页标签)与方正书版排版标签之间的映射关系。当确定出待处理的第一网页版文档之后,终端设备从预先存储的映射关系中确定出与该第一网页版文档中的第一网页标签存在映射关系的第一排版标签,即第一网页标签与第一排版标签之间形成第一映射关系(或第一对应关系),且第一网页标签与第一排版标签一一对应,举例来说,若第一网页标签中包括一个用于控制字体颜色的网页标签,则第一排版标签中包括一个同样用于控制字体颜色的排版标签。其中,该待处理的第一网页版文档为可扩展标记语言(XML,Extensible Markup Language)文档,第一网页标签的数量有多个,且第一网页标签中的每个网页标签都由一个开始网页标签和关闭网页标签组成,如<h1>与</h1>、<p>与</p>、<table>与</table>以及<Br>与</Br>等网页标签,且开始网页标签与关闭网页标签之间的内容可以称为元素,排版标签又可以称为方正书版小样控制标签。
102、当接收到针对上述第一网页版文档的文档处理指令时,终端设备根据该文档处理指令以及上述第一映射关系,将上述第一网页版文档中的第一网页标签替换成上述第一排版标签,得到第一方正书版排版文档。
本发明实施例中,当终端设备将上述第一网页版文档中的第一网页标签全部替换为上述第一排版标签之后,得到第一方正书版排版文档并输出,其中,该第一方正书版排版文档为缺省的排版文档,其样式与上述第一网页版文档的样式基本相同。
在一个可选的实施例中,该文档处理方法还可以包括以下操作:
终端设备接收用户输入的业务需求,并根据该业务需求对上述第一方正书版排版文档执行重排版操作,得到第二方正书版排版文档,其中,该业务需求可以包括元素显示需求、尺寸需求、背景颜色需求、元素大小需求以及元素位置需求中的至少一种。
具体的,元素显示需求用于控制终端设备根据用户(或出版商)的实际需求确定最终在上述第一方正书版排版文档中显示的元素,尺寸需求用于控制终端设备根据用户(或出版商)的实际需求调整上述第一方正书版排版文档的尺寸,背景颜色需求用于控制终端设备根据用户(或出版商)的实际需求调整上述第一方正书版排版文档的背景颜色,元素大小需求用于控制终端设备根据用户(或出版商)的实际需求调整部分元素在上述第一方正书版排版文档中的尺寸,元素位置需求用于控制终端设备根据用户(或出版商)的实际需求调整部分元素在上述第一方正书版排版文档中的具体位置。
该可选的实施例能够根据具体的业务需求调整上述第一方正书版排版文档的样式,即能够对生成的初始方正书版排版文档进行二次编辑和排版,最终生成符合业务需求的第二方正书版排版文档,个性化强。
在另一个实施例中,该文档处理方法还可以包括以下操作:
终端设备检测上述第二方正书版排版文档中是否存在预设符号;
当检测结果为是时,终端设备输出该预设符号所对应的第二网页标签以及提示信息,该提示信息用于提示输入第二网页标签对应的第二排版标签;
终端设备接收用户输入的第二排版标签,并将第二网页标签替换成第二排版标签,得到第三方正书版排版文档,作为最终得到的方正书版排版文档;
终端设备建立第二排版标签与第二网页标签的第二映射关系并存储。
在该可选的实施例中,对于网页标签来说,其表现形式为尖括号形式(即“<>”),对于排版标签来说,其表现形式为方括号形式(即“【】”),当上述第二方正书版排版文档中还存在预设符号“<”以及“>”时,终端设备确定上述第二方正书版排版文档中还存在至少一个未能被替换的第二网页标签,即上述第一映射关系中未包括与第二网页标签存在映射关系的排版标签;当上述第二方正书版排版文档中不存在预设符号“<”以及“>”时,终端设备确定已经成功的将上述第一网页版文档转换为方正书版排版文档并输出用于提示转换成功的提示信息。
其中,当上述第二方正书版排版文档中还存在预设符号“<”以及“>”时,终端设备将该预设符号所对应的第二网页标签输出,以使用户输入与第二网页标签对应的第二排版标签,终端设备进一步根据接收到的第二排版标签替换第二网页标签,最终得到第三方正书版排版文档,这样能够提供一个检测机制,提高了最终得到的方正书版排版文档的准确率。
其中,在得到第三方正书版排版文档之后,终端设备还可以将上述第二网页标签与上述第二排版标签添加到上述第一映射关系中,得到更新后的第一映射关系,或者直接建立上述第二网页标签与上述第二排版标签之间的第二映射关系并存储,这样能够在后续处理其它网页版文档且当其它网页版文档中的网页标签包括上述第二网页标签时,直接根据更新后的第一映射关系或者新建立的第二映射关系对该其它网页版文档进行处理,提高了文档的处理效率。
在又一个可选的实施例中,该文档处理方法还可以包括以下操作:
终端设备确定上述第三方正书版排版文档的第三映射关系,其中,第三映射关系用于表示第三网页标签与第三方正书版排版文档中第三排版标签的映射关系;
终端设备根据第三映射关系,将上述第三方正书版排版文档中的第三排版标签替换成第三网页标签,得到第二网页版文档;
终端设备将上述第一网页版文档更新成第二网页版文档,或者直接存储第二网页版文档,并分别为第一网页版文档以及第二网页版文档设置版本标识。
该可选的实施例能够实现方正书版排版文档到网页版文档的转换,且将最终得到的第三方正书版排版文档转化为第二网页版文档,以更新上述第一网页版文档,这样能够及时更新网页版文档,作为后续文档处理的基础网页版文档。
在又一个可选的实施例中,该文档处理方法还可以包括以下操作:
当上述第三方正书版排版文档中存在图像元素时,终端设备根据该图像元素的图像下载地址下载该图像元素对应的源图像;
终端设备根据该图像元素的图像属性,将下载到的源图像添加到第三方正书版排版文档中。
在该可选的实施例中,图像元素在上述第一网页版文档中的表现形式为输出该图像元素的链接地址,当将该图像元素的图像标签替换成相应的排版标签后,终端设备需根据该图像元素的链接地址确定出该图像元素的图像下载地址,根据该图像下载地址下载图像元素对应的源图像并添加至上述第三方正书版排版文档中。这样能够方便用户直观的在第三方正书版排版文档中看到图像元素的排版效果。
在又一个可选的实施例中,该文档处理方法还可以包括以下操作:
当上述第三方正书版排版文档中存在视频元素时,终端设备根据该视频元素的视频下载地址下载该视频元素对应的视频截图;
根据该视频元素的视频属性,终端设备将该视频截图以及视频下载地址添加到上述第三方正书版排版文档中。
该可选的实施例能够方便用户直观的在第三方正书版排版文档中看到针对视频元素的排版效果。
可选的,在执行步骤101之前,终端设备还可以执行以下操作:
确定待处理的第三网页版文档,且当该第三网页版文档为超文本标记语言(HTML,HyperText Markup Language)文档时,将该HTML文档转化为XML文档,作为上述待处理的第一网页版文档。
需要说明的是,将HTML文档转化为XML文档为现有技术,本发明实施例不再赘述。由于HTML文档与XML文档之间能够相互转换,这样极大的提升了HTML文档与方正书版排版文档间的转换效率。
可见,实施图1所描述的文档处理方法能够直接根据网页标签与排版标签的映射关系为待处理的网页版文档添加排版标签,实现了网页版文档到方正书版排版文档的自动转换,无需人工添加排版标签,技术门槛低,省时省力,提高了文档的处理效率以及处理准确率,便于快速的响应数媒到纸媒的转换,且XML文档能够自定义,这样能够支持排版效果和样式的扩展,以满足不同的排版需求。
实施例二
请参阅图2,图2是本发明实施例公开的另一种文档处理方法的流程示意图。其中,图2所示的文档处理方法可以应用于具有排版功能的终端设备中。如图2所示,该文档处理方法可以包括以下操作:
201、确定待处理的网页版文档。
202、判断上述网页版文档是否为HTML文档。
本发明实施例中,当步骤202的判断结果为是时,触发执行步骤203;当步骤202的判断结果为否时,触发执行步骤204。
203、将上述HTML文档转化为XML文档。
204、判断上述第一网页版文档是否为XML文档。
本发明实施例中,当步骤204的判断结果为是时,触发执行步骤205;当步骤204的判断结果为否时,触发执行步骤206。
205、确定上述XML文档的第一映射关系。
本发明实施例中,该第一映射关系用于表示第一排版标签与上述XML文档中第一网页标签的映射关系。
206、输出用于提示确定出的待处理的网页版文档格式错误的提示信息。
本发明实施例中,在执行完毕步骤206之后,可以重新触发执行步骤201。
207、当接收到针对上述XML文档的文档处理指令时,根据该文档处理指令以及上述第一映射关系,将上述XML文档中的第一网页标签替换成上述第一映射关系中与该第一网页标签存在映射关系的第一排版标签,得到第一方正书版FBD排版文档。
208、接收用户输入的业务需求,并根据该业务需求对上述第一方正书版FBD排版文档执行重排版操作,得到第二方正书版FBD排版文档。
209、检测上述第二方正书版FBD排版文档中是否存在预设符号。
本发明实施例中,当步骤209的检测结果为是时,触发执行步骤210;当步骤210的检测结果为否时,触发执行步骤213。
210、输出上述预设符号所对应的第二网页标签以及用于提示输入该第二网页标签对应的第二排版标签的提示信息。
211、接收用户输入的第二排版标签,并将上述第二网页标签替换成该第二排版标签,得到第三方正书版FBD排版文档。
212、建立上述第二排版标签与上述第二网页标签的第二映射关系并存储。
213、确定已成功处理上述XML文档,并输出用于提示上述XML文档已成功转化为方正书版FBD排版文档的提示信息。
可见,实施图2所描述的文档处理方法能够直接根据网页标签与排版标签的映射关系为待处理的网页版文档添加排版标签,实现了网页版文档到方正书版排版文档的自动转换,无需人工添加排版标签,省时省力,技术门槛低,提高了文档的处理效率以及处理准确率,便于快速的响应数媒到纸媒的转换,且能够对处理得到的方正书版FBD排版文档进行检测,这进一步提高了文档的处理准确率。
实施例三
请参阅图3,图3是本发明实施例公开的一种文档处理装置的结构示意图。其中,图3所示的文档处理装置300可以安装在具有排版功能的终端设备上。如图3所示,该文档处理装置300可以包括确定单元301以及替换单元302,其中:
确定单元301用于确定待处理的第一网页版文档以及该第一网页版文档对应的第一映射关系,其中,该第一映射关系用于表示第一排版标签与该第一网页版文档中第一网页标签的映射关系。
替换单元302用于当接收到针对上述第一网页版文档的文档处理指令时,根据该文档处理指令以及上述第一映射关系,将上述第一网页版文档中的第一网页标签替换成上述第一排版标签,得到第一方正书版FBD排版文档。
可见,实施图3所描述的文档处理装置300能够直接根据网页标签与排版标签的映射关系为待处理的网页版文档添加排版标签,实现了网页版文档到方正书版排版文档的自动转换,无需人工添加排版标签,省时省力,技术门槛低,提高了文档的处理效率以及处理准确率,便于快速的响应数媒到纸媒的转换。
在一个可选的实施例中,该文档处理装置300还可以包括接收单元303以及排版单元304,进一步可选的,该文档处理装置300还可以包括检测单元305、输出单元306、建立单元307以及存储单元308,又进一步可选的,该文档处理装置300还可以包括更新单元309,此时,该文档处理装置300的结构可以如图4所示,图4是本发明实施例公开的另一种文档处理装置的结构示意图。其中:
接收单元303用于接收用户输入的业务需求,其中,该业务需求可以包括元素显示需求、尺寸需求、背景颜色需求、元素大小需求以及元素位置需求中的至少一种。
排版单元304用于根据接收单元303接收到的业务需求对替换单元302得到的第一方正书版FBD排版文档执行重排版操作,得到第二方正书版FBD排版文档。
检测单元305用于检测排版单元304执行重排版操作得到的第二方正书版FBD排版文档中是否存在预设符号。
本发明实施例中,当检测单元305的检测结果为否时,确定单元301确定已成功处理上述第一网页版文档,得到正确的第二方正书版FBD排版文档;当检测单元305的检测结果为是时,触发输出单元306执行相应的操作。
输出单元306用于当检测单元305的检测结果为是时,输出上述预设符号所对应的第二网页标签以及提示信息,该提示信息用于提示输入该第二网页标签对应的第二排版标签。
接收单元303还可以用于接收用户输入的第二排版标签。
替换单元302还可以用于将上述第二网页标签替换成接收单元303接收到的第二排版标签,得到第三方正书版FBD排版文档。
建立单元307用于建立上述第二排版标签与上述第二网页标签的第二映射关系。
存储单元308用于存储建立单元307建立的第二映射关系。
确定单元301还可以用于确定上述第三方正书版FBD排版文档的第三映射关系,该第三映射关系用于表示第三网页标签与第三方正书版排版文档中第三排版标签的映射关系。
替换单元302还用于根据确定单元301确定出的第三映射关系,将第三方正书版FBD排版文档中的第三排版标签替换成上述第三网页标签,得到第二网页版文档。
更新单元309用于将上述第一网页版文档更新成替换单元302得到的第二网页版文档。
可见,实施图4所描述的文档处理装置300不仅根据具体的业务需求调整上述第一方正书版排版文档的样式,即能够对生成的初始方正书版排版文档进行二次编辑和排版,最终生成符合业务需求的第二方正书版排版文档,个性化强,而且能够提供一个检测机制,提高了最终得到的方正书版排版文档的准确率。
可选的,在图4所示的文档处理装置300的结构基础上,该文档处理装置300还可以包括下载单元310以及添加单元311,此时,该文档处理装置300的结构可以如图5所示,图5是本发明实施例公开的又一种文档处理装置的结构示意图。其中:
在一种可选的实施方式中,下载单元310用于当上述第三方正书版FBD排版文档中存在图像元素时,根据该图像元素的图像下载地址下载该图像元素对应的源图像。
添加单元311用于根据上述图像元素的图像属性,将下载单元310下载得到的源图像添加到第三方正书版FBD排版文档中。
在另一种可选的实施方式中,下载单元310还可以用于当上述第三方正书版FBD排版文档中存在视频元素时,根据该视频元素的视频下载地址下载该视频元素对应的视频截图。
添加单元311还可以用于根据上述视频元素的视频属性,将下载单元310下载的视频截图以及上述视频下载地址添加到上述第三方正书版FBD排版文档中。
又进一步可选的,如图5所示,该文档处理装置300还可以包括转化单元312,且上述第一网页版文档为XML文档,其中:
确定单元301还可以用于在确定待处理的第一网页版文档以及该第一网页版文档对应的第一映射关系之前,确定待处理的第三网页版文档。
转化单元312用于当确定单元301确定出的第三网页版文档为HTML文档时,将该HTML文档转化为XML文档,以作为待处理的上述第一网页版文档。
可见,实施图5所描述的文档处理装置300不仅能够方便用户直观的在第三方正书版排版文档中看到图像元素以及视频元素的排版效果,还能够极大的提升了HTML文档与方正书版排版文档间的转换效率。
实施例四
请参阅图6,图6是本发明实施例公开的一种终端设备的结构示意图。其中,图6所描述的终端设备具有排版功能。如图6所示,该终端设备可以包括文档处理装置601、壳体602、电路板603以及电源604,其中,文档处理装置601可以是图3至图5所描述的任意一个文档处理装置,本发明实施例不再赘述,电路板603安置在壳体602围成的空间内部,文档处理装置601设置在电路板603上,电源604用于为终端设备上的文档处理装置601供电。可见,实施图6所描述的终端设备能够直接根据网页标签与排版标签的映射关系为待处理的网页版文档添加排版标签,实现了网页版文档到方正书版排版文档的自动转换,无需人工添加排版标签,技术门槛低,省时省力,提高了文档的处理效率以及处理准确率,便于快速的响应数媒到纸媒的转换,且XML文档能够自定义,这样能够支持排版效果和样式的扩展,以满足不同的排版需求。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种文档处理方法及装置、终端设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (15)
1.一种文档处理方法,其特征在于,所述方法包括:
确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系,所述第一映射关系用于表示第一排版标签与所述第一网页版文档中第一网页标签的映射关系;
当接收到针对所述第一网页版文档的文档处理指令时,根据所述文档处理指令以及所述第一映射关系,将所述第一网页版文档中的第一网页标签替换成所述第一排版标签,得到第一方正书版排版文档。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收用户输入的业务需求,并根据所述业务需求对所述第一方正书版排版文档执行重排版操作,得到第二方正书版排版文档;
其中,所述业务需求包括元素显示需求、尺寸需求、背景颜色需求、元素大小需求以及元素位置需求中的至少一种。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
检测所述第二方正书版排版文档中是否存在预设符号;
当检测结果为是时,输出所述预设符号所对应的第二网页标签以及提示信息,所述提示信息用于提示输入所述第二网页标签对应的第二排版标签;
接收用户输入的所述第二排版标签,并将所述第二网页标签替换成所述第二排版标签,得到第三方正书版排版文档;
建立所述第二排版标签与所述第二网页标签的第二映射关系并存储。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
确定所述第三方正书版排版文档的第三映射关系,所述第三映射关系用于表示第三网页标签与所述第三方正书版排版文档中第三排版标签的映射关系;
根据所述第三映射关系,将所述第三方正书版排版文档中的第三排版标签替换成所述第三网页标签,得到第二网页版文档;
将所述第一网页版文档更新成所述第二网页版文档。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当所述第三方正书版排版文档中存在图像元素时,根据所述图像元素的图像下载地址下载所述图像元素对应的源图像;
根据所述图像元素的图像属性,将所述源图像添加到所述第三方正书版排版文档中。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当所述第三方正书版排版文档中存在视频元素时,根据所述视频元素的视频下载地址下载所述视频元素对应的视频截图;
根据所述视频元素的视频属性,将所述视频截图以及所述视频下载地址添加到所述第三方正书版排版文档中。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述第一网页版文档为可扩展标记语言XML文档;
所述确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系之前,所述方法还包括:
确定待处理的第三网页版文档,且当所述第三网页版文档为超文本标记语言HTML文档时,将所述HTML文档转化为XML文档,作为待处理的第一网页版文档。
8.一种文档处理装置,其特征在于,所述装置包括确定单元以及替换单元,其中:
所述确定单元,用于确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系,所述第一映射关系用于表示第一排版标签与所述第一网页版文档中第一网页标签的映射关系;
所述替换单元,用于当接收到针对所述第一网页版文档的文档处理指令时,根据所述文档处理指令以及所述第一映射关系,将所述第一网页版文档中的第一网页标签替换成所述第一排版标签,得到第一方正书版排版文档。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括接收单元以及排版单元,其中:
所述接收单元,用于接收用户输入的业务需求,所述业务需求包括元素显示需求、尺寸需求、背景颜色需求、元素大小需求以及元素位置需求中的至少一种;
所述排版单元,用于根据所述业务需求对所述第一方正书版排版文档执行重排版操作,得到第二方正书版排版文档。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括检测单元、输出单元、建立单元以及存储单元,其中:
所述检测单元,用于检测所述第二方正书版排版文档中是否存在预设符号;
所述输出单元,用于当所述检测单元的检测结果为是时,输出所述预设符号所对应的第二网页标签以及提示信息,所述提示信息用于提示输入所述第二网页标签对应的第二排版标签;
所述接收单元,还用于接收用户输入的所述第二排版标签;
所述替换单元,还用于将所述第二网页标签替换成所述第二排版标签,得到第三方正书版排版文档;
所述建立单元,用于建立所述第二排版标签与所述第二网页标签的第二映射关系;
所述存储单元,用于存储所述第二映射关系。
11.根据权利要求10所述的装置,其特征在于,所述确定单元,还用于确定所述第三方正书版排版文档的第三映射关系,所述第三映射关系用于表示第三网页标签与所述第三方正书版排版文档中第三排版标签的映射关系;
所述替换单元,还用于根据所述第三映射关系,将所述第三方正书版排版文档中的第三排版标签替换成所述第三网页标签,得到第二网页版文档;
所述装置还包括更新单元,其中:
所述更新单元,用于将所述第一网页版文档更新成所述第二网页版文档。
12.根据权利要求10所述的装置,其特征在于,所述装置还包括下载单元以及添加单元,其中:
所述下载单元,用于当所述第三方正书版排版文档中存在图像元素时,根据所述图像元素的图像下载地址下载所述图像元素对应的源图像;
所述添加单元,用于根据所述图像元素的图像属性,将所述源图像添加到所述第三方正书版排版文档中。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括下载单元以及添加单元,其中:
所述下载单元,用于当所述第三方正书版排版文档中存在视频元素时,根据所述视频元素的视频下载地址下载所述视频元素对应的视频截图;
所述添加单元,用于根据所述视频元素的视频属性,将所述视频截图以及所述视频下载地址添加到所述第三方正书版排版文档中。
14.根据权利要求8-13任一项所述的装置,其特征在于,所述第一网页版文档为可扩展标记语言XML文档;
所述确定单元,还用于在确定待处理的第一网页版文档以及所述第一网页版文档对应的第一映射关系之前,确定待处理的第三网页版文档;
所述装置还包括转化单元,其中:
所述转化单元,用于当所述第三网页版文档为超文本标记语言HTML文档时,将所述HTML文档转化为XML文档,作为所述第一网页版文档。
15.一种终端设备,其特征在于,所述终端设备包括如权利要求8-14任一项所述的文档处理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610565913.7A CN106227717A (zh) | 2016-07-15 | 2016-07-15 | 一种文档处理方法及装置、终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610565913.7A CN106227717A (zh) | 2016-07-15 | 2016-07-15 | 一种文档处理方法及装置、终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106227717A true CN106227717A (zh) | 2016-12-14 |
Family
ID=57530856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610565913.7A Pending CN106227717A (zh) | 2016-07-15 | 2016-07-15 | 一种文档处理方法及装置、终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106227717A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108984498A (zh) * | 2017-06-05 | 2018-12-11 | 北大方正集团有限公司 | 文档的排版处理方法及装置 |
CN109033061A (zh) * | 2017-06-09 | 2018-12-18 | 北大方正集团有限公司 | 排版方法和排版装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1471679A (zh) * | 2001-04-09 | 2004-01-28 | XML���й�˾ | 采用元标志信息的可扩展格式底稿设计 |
EP1628227A1 (en) * | 2003-05-22 | 2006-02-22 | Sharp Kabushiki Kaisha | Data processing device, data processing method, data processing program, and computer-readable recording medium containing the data processing program |
CN101281544A (zh) * | 2008-05-13 | 2008-10-08 | 北大方正集团有限公司 | 一种将小样文件转换为扩展标记语言文件的方法和系统 |
CN102262617A (zh) * | 2010-05-24 | 2011-11-30 | 北大方正集团有限公司 | 一种书版小样处理方法及装置 |
-
2016
- 2016-07-15 CN CN201610565913.7A patent/CN106227717A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1471679A (zh) * | 2001-04-09 | 2004-01-28 | XML���й�˾ | 采用元标志信息的可扩展格式底稿设计 |
EP1628227A1 (en) * | 2003-05-22 | 2006-02-22 | Sharp Kabushiki Kaisha | Data processing device, data processing method, data processing program, and computer-readable recording medium containing the data processing program |
CN101281544A (zh) * | 2008-05-13 | 2008-10-08 | 北大方正集团有限公司 | 一种将小样文件转换为扩展标记语言文件的方法和系统 |
CN102262617A (zh) * | 2010-05-24 | 2011-11-30 | 北大方正集团有限公司 | 一种书版小样处理方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108984498A (zh) * | 2017-06-05 | 2018-12-11 | 北大方正集团有限公司 | 文档的排版处理方法及装置 |
CN109033061A (zh) * | 2017-06-09 | 2018-12-18 | 北大方正集团有限公司 | 排版方法和排版装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107678935B (zh) | 数据生成方法、终端及计算机可读存储介质 | |
CN103345388B (zh) | 基于安卓操作系统的软件适应移动终端的方法及装置 | |
CN110875920A (zh) | 一种网络威胁分析方法、装置、电子设备及存储介质 | |
US10908928B2 (en) | Rules-based workflow messaging | |
CN102662921B (zh) | 一种文档处理方法、装置和编辑器 | |
CN108255975B (zh) | 模板构建方法、页面内容抓取方法及装置、介质及设备 | |
CN106919410A (zh) | 组件的布局模板的扩展方法和装置 | |
CN101807199A (zh) | 一种缩略图显示方法及装置 | |
CN111639019A (zh) | 代码测试方法、装置及可读存储介质 | |
US20160103800A1 (en) | Universal rebranding engine | |
CN111159099A (zh) | 在线数据生成方法、装置、电子设备和存储介质 | |
CN110765015A (zh) | 一种对被测应用进行测试的方法和电子设备 | |
CN106899750A (zh) | 基于卡片的信息展示方法、信息展示业务的处理方法及装置 | |
CN106227717A (zh) | 一种文档处理方法及装置、终端设备 | |
CN110888574A (zh) | 页面显示的自适配方法、装置、设备及计算机存储介质 | |
CN110717312A (zh) | 一种文本标注方法及装置 | |
US20190073198A1 (en) | Multi-flavored software execution from a singular code base | |
CN113094287A (zh) | 页面兼容性检测方法、装置、设备及存储介质 | |
US20240160454A1 (en) | Page configuration method, page configuration system, electronic device, and readable storage medium | |
CN109510735A (zh) | 一种报文测试的方法及装置 | |
DE112012007259T5 (de) | Elektronik-Handbuch-Durchblätterapparatur und -system | |
CN107704536A (zh) | 软件内容展示方法及系统 | |
KR20220005745A (ko) | 이미지에서 문서 작성에 적합한 서식을 추출하는 전자 장치 및 그 동작 방법 | |
CN104252288A (zh) | 浏览器多标签页的控制方法及浏览器 | |
CN104424214A (zh) | 一种自定义提取目录内容的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161214 |
|
RJ01 | Rejection of invention patent application after publication |