CN105468577A - 一种文档拆分方法及系统 - Google Patents

一种文档拆分方法及系统 Download PDF

Info

Publication number
CN105468577A
CN105468577A CN201410490430.6A CN201410490430A CN105468577A CN 105468577 A CN105468577 A CN 105468577A CN 201410490430 A CN201410490430 A CN 201410490430A CN 105468577 A CN105468577 A CN 105468577A
Authority
CN
China
Prior art keywords
document
mark
page
split
splitting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410490430.6A
Other languages
English (en)
Other versions
CN105468577B (zh
Inventor
严昌华
杨燕菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201410490430.6A priority Critical patent/CN105468577B/zh
Publication of CN105468577A publication Critical patent/CN105468577A/zh
Application granted granted Critical
Publication of CN105468577B publication Critical patent/CN105468577B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种文档拆分方法及系统,涉及数据加工技术领域,所述方法包括:获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将至少一个印刷排版文档整合成一个待拆分文档;按照预设显示区域尺寸对待拆分文档进行重排;根据强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;根据文档拆分标记对待拆分文档进行拆分。本发明通过强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记,并根据文档拆分标记对待拆分文档进行拆分,达到了合理的文档拆分,避免了人工干预,并提高了文档的拆分效率。

Description

一种文档拆分方法及系统
技术领域
本发明涉及数据加工技术领域,特别涉及一种文档拆分方法及系统。
背景技术
Epub电子书格式是一种新的电子出版物格式。Epub是基于html超文本标记语言,而随着信息网络的发展,超文本标记语言的表达能力也得到了极大的加强,html5的推出,更是进一步提升html在互动和多媒体方面的优势。Epub的最新的3.0版本就是基于html5技术,应该说网络的发展促进了html的进步,基于html技术的epub电子书同样也得到了飞速的发展和普及,这种不断的进步和发展,使得epub成为了未来电子出版物事实的发展方向和标准。
随着电子出版物的普及,传统纸质印刷品出版物面临很大的竞争压力,但是同时对于出版行业,这同样是一种机遇,很多传统的出版企业都转向电子出版领域,相应的这些企业对于从工业流程从传统印刷排版工具平滑过渡到电子出版物制作工具有着强烈的需求。
当前出版发行企业有很多现有的印刷排版文档,需要转换为电子出版物文档,未来新出版发行的出版物也往往同时需要纸质印刷品和电子出版物的同步上线。
现有的很多传统排版工具考虑到这类,都推出了自己的解决方案,对于将传统排版文档转换为Html格式内容,各有各的处理模式,对于将一个比较大的排版文档拆分成多个部分,现有的解决方案无外乎以下两类:
第一类是从内容着手,根据原始内容的格式、样式、章节、片段去拆分,这样做只是为了拆分而拆分,这样简单的拆分存在极大的不确定性,需要人工去判断结果是否合理,如果最终的结果不合理,输出和转换的过程都需要重新来过,极大的影响了效率,浪费了人工。
第二类是从结果Html文件着手,先从原始排版内容输出一个大的html文件,再通过对于Html结果的容量做分配,或者样式、格式等内容作解析,重新拆分,这样相对以第一类来说,生成html的流程可以不用重新执行,但是拆分的结果仍然存在不确定性,需要人工干预,对于效率的影响仍然是可以预见的。
无论第一类还是第二类方案,都存在人工干预,效率问题,而且结果都没有考虑到最终epub文件客户端的显示效果,只有最后把转换的结果传输到客户端设备上,才能最终发现拆分的结果是不是真的合理和完善,如果存在问题,又需要重复排版流程。
发明内容
为了避免人工干预,并提高文档的拆分效率,本发明提供了一种文档拆分方法,所述方法包括:
获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
按照预设显示区域尺寸对所述待拆分文档进行重排;
根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
根据所述文档拆分标记对所述待拆分文档进行拆分。
其中,所述根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记,具体包括:
将所述重排后的待拆分文档的第一个页面作为当前页面;
从所述当前页面开始选取预设数量的页面;
若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面,执行所述从当前页面开始选取预设数量的页面的步骤,直至所述重排后的待拆分文档的所有页面均被选取到,再执行所述根据所述文档拆分标记对所述待拆分文档进行拆分的步骤;
若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,执行所述从当前页面开始选取预设数量的页面的步骤,直至所述重排后的待拆分文档的所有页面均被选取到,再执行所述根据所述文档拆分标记对所述待拆分文档进行拆分的步骤。
其中,所述在寻找到的第一个辅助拆分标记的位置插入文档拆分标记之前,还包括:
判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,直接执行所述从当前页面开始选取预设数量的页面的步骤。
其中,所述根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记之前,还包括:
为所述重排后的待拆分文档中每个页面添加页面序号;
所述从所述当前页面开始选取预设数量的页面,具体包括:
根据所述页面序号从所述当前页面开始选取预设数量的页面。
其中,所述按照预设显示区域尺寸对所述待拆分文档进行重排,具体包括:
根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排。
本发明还公开了一种文档拆分系统,所述系统包括:
获取插入模块,用于获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
文档重排模块,用于按照预设显示区域尺寸对所述待拆分文档进行重排;
标记插入模块,用于根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
文档拆分模块,用于根据所述文档拆分标记对所述待拆分文档进行拆分。
其中,所述标记插入模块具体包括:
页面确定单元,用于将所述重排后的待拆分文档的第一个页面作为当前页面;
页面选取单元,用于从所述当前页面开始选取预设数量的页面;
寻找插入单元,用于若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面;若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
其中,所述系统还包括:
标记判断模块,用于判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
其中,所述系统还包括:
序号添加模块,用于为所述重排后的待拆分文档中每个页面添加页面序号;
所述寻找插入单元,进一步用于根据所述页面序号从所述当前页面开始选取预设数量的页面。
其中,所述文档重排模块,进一步用于根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排。
本发明通过强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记,并根据所述文档拆分标记对所述待拆分文档进行拆分,达到了合理的文档拆分,避免了人工干预,并提高了文档的拆分效率。
附图说明
图1是本发明一种实施方式的文档拆分方法的流程图;
图2a是一般纸质的印刷版面第一页的示意图;
图2b是一般纸质的印刷版面第二页的示意图;
图2c是一般纸质的印刷版面第三页的示意图;
图2d是一般纸质的印刷版面第四页的示意图;
图3是本发明一种实施例的将两个印刷排版文档整合为一个待拆分文档的示意图;
图4a是本发明一种实施例中重排后的待拆分文档的第一页示意图;
图4b是本发明一种实施例中重排后的待拆分文档的第二页示意图;
图4c是本发明一种实施例中重排后的待拆分文档的第三页示意图;
图4d是本发明一种实施例中重排后的待拆分文档的第四页示意图;
图4e是本发明一种实施例中重排后的待拆分文档的第五页示意图;
图4f是本发明一种实施例中重排后的待拆分文档的第六页示意图;
图4g是本发明一种实施例中重排后的待拆分文档的第七页示意图;
图5是本发明一种实施方式的文档拆分系统的结构框图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
图1是本发明一种实施方式的文档拆分方法的流程图;参照图1,所述方法包括:
S100:获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
本步骤中,所述印刷排版文档的强制换页位置为印刷排版文档中具有强制换页符号的位置,例如:word文档中的强制换页符等。
S200:按照预设显示区域尺寸对所述待拆分文档进行重排;
S300:根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
S400:根据所述文档拆分标记对所述待拆分文档进行拆分。
为进一步提高文档被拆分的合理性,优选地,步骤S300具体包括:
S301:将所述重排后的待拆分文档的第一个页面作为当前页面;
S302:从所述当前页面开始选取预设数量的页面(所述预设数量为不小于1且不大于n的整数,所述n为重排后的待拆分文档的页面总数);
S303:若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面,执行步骤S302,直至所述重排后的待拆分文档的所有页面均被选取到,再执行步骤S400;
若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,执行步骤S302,直至所述重排后的待拆分文档的所有页面均被选取到,再执行步骤S400。
若步骤S303中寻找到的第一个辅助拆分标记所在页面还存在强制拆分标记,会导致在第一个辅助拆分标记处添加文档拆分标记后,在该页面中的强制拆分标记处又添加文档拆分标记,导致同一页面被拆分为两部分,从而影响阅读效果,为防止该情况的出现,优选地,步骤S303中,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记之前,还包括:
判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,直接执行步骤S302。
为便于选取页面,优选地,步骤S300之前,还包括:
为所述重排后的待拆分文档中每个页面添加页面序号;
步骤S302具体包括:
根据所述页面序号从所述当前页面开始选取预设数量的页面。
为保证重排的准确性,优选地,步骤S200具体包括:
根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排。
实施例
下面以两个印刷排版文档为例来说明本发明,但不限定本发明的保护范围。一般纸质的印刷版面示意图;参照图2a~2d;实施例的方法包括以下步骤:
(a1)、获取两个印刷排版文档,根据所述印刷排版文档在印刷版面的对应效果在每个印刷排版文档的结尾处插入强制拆分标记SplitA[i],i=1,2,3…,在每个印刷排版文档的段落划分处插入辅助拆分标记SplitB[j],j=1,2,3…,并将所述两个印刷排版文档整合成一个待拆分文档,参照图3;
(a2)、参照图4a~4g,根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸(所述预设显示区域尺寸为电子设备版心的区域尺寸)之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排,本步骤无需考虑效果;
(a3)、为所述重排后的待拆分文档中每个页面的开始位置添加页面序号Page[v],v=1,2,3…n,所述n为重排后的待拆分文档的页面总数;
(a4)、将所述重排后的待拆分文档的第一个页面Page[0]作为当前页面;
(a5)、从所述当前页面开始选取预设数量K的页面,K为整数、K>=1且k<=n;
(a6)、从Page[w]至Page[w+K-1]查找强制拆分标记SplitA[J1];
(a7)、若步骤(a6)找到强制拆分标记SplitA[J1],则在该拆分标记SplitA[J1]的位置插入文档拆分标记Doc[I](I>=1),同时设定I=I+1,并设w=T+1,所述T为拆分标记SplitA[J1]所在页面的序号,返回步骤(a6),直至所述重排后的待拆分文档的所有页面均被选取到,再执行步骤(a12);
(a8)、若步骤(a6)未查找到强制拆分标记SplitA[J1],则从Page[i+K]点至Page[n]向后查找第一个辅助拆分标记SplitB[J2];
(a9)、判断所述第一个辅助拆分标记SplitB[J2]所在页面是否存在强制拆分标记,若是,则执行步骤(a11),否则执行步骤(a10);
(a10)、在所述第一个辅助拆分标记SplitB[J2]所在页面的强制拆分标记的位置插入文档拆分标记Doc[I](I>=1),同时设定I=I+1,并设w=C+1,所述C为拆分标记SplitB[J2]所在页面的序号,返回步骤(a6),直至所述重排后的待拆分文档的所有页面均被选取到,再执行步骤(a12);
(a11)、在所述第一个辅助拆分标记SplitB[J2]的位置插入文档拆分标记Doc[I](I>=1),同时设定I=I+1,并设w=C+1,所述C为拆分标记SplitB[J2]所在页面的序号,返回步骤(a6),直至所述重排后的待拆分文档的所有页面均被选取到,再执行步骤(a12);
(a12)、得到所有的文档拆分标记Doc[I],I=1,2,3..M(M为文档拆分标记的总数);
(a13)、以文档拆分标记Doc[I]为拆分点,将排版文档分拆为M+1个部分。
本发明还公开了一种文档拆分系统,参照图5,所述系统包括:
获取插入模块,用于获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
文档重排模块,用于按照预设显示区域尺寸对所述待拆分文档进行重排;
标记插入模块,用于根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
文档拆分模块,用于根据所述文档拆分标记对所述待拆分文档进行拆分。
优选地,所述标记插入模块具体包括:
页面确定单元,用于将所述重排后的待拆分文档的第一个页面作为当前页面;
页面选取单元,用于从所述当前页面开始选取预设数量的页面;
寻找插入单元,用于若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面;若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
优选地,所述系统还包括:
标记判断模块,用于判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
优选地,所述系统还包括:
序号添加模块,用于为所述重排后的待拆分文档中每个页面添加页面序号;
所述寻找插入单元,进一步用于根据所述页面序号从所述当前页面开始选取预设数量的页面。
优选地,所述文档重排模块,进一步用于根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (10)

1.一种文档拆分方法,其特征在于,所述方法包括:
获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
按照预设显示区域尺寸对所述待拆分文档进行重排;
根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
根据所述文档拆分标记对所述待拆分文档进行拆分。
2.如权利要求1所述的方法,其特征在于,所述根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记,具体包括:
将所述重排后的待拆分文档的第一个页面作为当前页面;
从所述当前页面开始选取预设数量的页面;
若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面,执行所述从当前页面开始选取预设数量的页面的步骤,直至所述重排后的待拆分文档的所有页面均被选取到,再执行所述根据所述文档拆分标记对所述待拆分文档进行拆分的步骤;
若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,执行所述从当前页面开始选取预设数量的页面的步骤,直至所述重排后的待拆分文档的所有页面均被选取到,再执行所述根据所述文档拆分标记对所述待拆分文档进行拆分的步骤。
3.如权利要求2所述的方法,其特征在于,所述在寻找到的第一个辅助拆分标记的位置插入文档拆分标记之前,还包括:
判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面,直接执行所述从当前页面开始选取预设数量的页面的步骤。
4.如权利要求2所述的方法,其特征在于,所述根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记之前,还包括:
为所述重排后的待拆分文档中每个页面添加页面序号;
所述从所述当前页面开始选取预设数量的页面,具体包括:
根据所述页面序号从所述当前页面开始选取预设数量的页面。
5.如权利要求1~4中任一项所述的方法,其特征在于,所述按照预设显示区域尺寸对所述待拆分文档进行重排,具体包括:
根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排。
6.一种文档拆分系统,其特征在于,所述系统包括:
获取插入模块,用于获取至少一个印刷排版文档,在每个印刷排版文档内的强制换页位置和文档的结尾位置插入强制拆分标记,在每个印刷排版文档的章、节或段落划分处插入辅助拆分标记,并将所述至少一个印刷排版文档整合成一个待拆分文档;
文档重排模块,用于按照预设显示区域尺寸对所述待拆分文档进行重排;
标记插入模块,用于根据所述强制拆分标记和辅助拆分标记在重排后的待拆分文档中插入文档拆分标记;
文档拆分模块,用于根据所述文档拆分标记对所述待拆分文档进行拆分。
7.如权利要求6所述的系统,其特征在于,所述标记插入模块具体包括:
页面确定单元,用于将所述重排后的待拆分文档的第一个页面作为当前页面;
页面选取单元,用于从所述当前页面开始选取预设数量的页面;
寻找插入单元,用于若选取到的页面中存在强制拆分标记,则在所述强制拆分标记的位置插入文档拆分标记,将所述强制拆分标记所在页面的后一页面作为新的当前页面;若选取到的页面中不存在强制拆分标记,则从所述选取到的页面的后一页面开始寻找第一个辅助拆分标记,在寻找到的第一个辅助拆分标记的位置插入文档拆分标记,并将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
8.如权利要求7所述的系统,其特征在于,所述系统还包括:
标记判断模块,用于判断所述寻找到的第一个辅助拆分标记所在页面是否存在强制拆分标记,若是,则在所述第一个辅助拆分标记所在页面的强制拆分标记的位置插入文档拆分标记,将所述寻找到的第一个辅助拆分标记所在页面的后一页面作为新的当前页面。
9.如权利要求7所述的系统,其特征在于,所述系统还包括:
序号添加模块,用于为所述重排后的待拆分文档中每个页面添加页面序号;
所述寻找插入单元,进一步用于根据所述页面序号从所述当前页面开始选取预设数量的页面。
10.如权利要求6~10中任一项所述的系统,其特征在于,所述文档重排模块,进一步用于根据所述待拆分文档的显示区域尺寸和预设显示区域尺寸之间的区别对所述待拆分文档的文字字号按比例进行缩放,将缩放后的待拆分文档通过排版引擎进行重排。
CN201410490430.6A 2014-09-23 2014-09-23 一种文档拆分方法及系统 Expired - Fee Related CN105468577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410490430.6A CN105468577B (zh) 2014-09-23 2014-09-23 一种文档拆分方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410490430.6A CN105468577B (zh) 2014-09-23 2014-09-23 一种文档拆分方法及系统

Publications (2)

Publication Number Publication Date
CN105468577A true CN105468577A (zh) 2016-04-06
CN105468577B CN105468577B (zh) 2018-11-09

Family

ID=55606296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410490430.6A Expired - Fee Related CN105468577B (zh) 2014-09-23 2014-09-23 一种文档拆分方法及系统

Country Status (1)

Country Link
CN (1) CN105468577B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106775340A (zh) * 2016-12-27 2017-05-31 语联网(武汉)信息技术有限公司 一种在移动端进行语料对齐的方法及系统
CN106814950A (zh) * 2016-12-25 2017-06-09 语联网(武汉)信息技术有限公司 一种将原文和译文进行调整对齐的方法及系统
CN107391650A (zh) * 2017-07-14 2017-11-24 北京神州泰岳软件股份有限公司 一种文档的结构化拆分方法,装置及系统
CN109815473A (zh) * 2019-01-28 2019-05-28 四川译讯信息科技有限公司 一种文档编辑辅助方法
CN110162764A (zh) * 2018-02-12 2019-08-23 北京庖丁科技有限公司 电子文档的拆分方法、装置、设备及介质
CN111028557A (zh) * 2019-12-30 2020-04-17 苏州卿学信息科技有限公司 一种课件演示方法及系统
CN114153404A (zh) * 2021-11-25 2022-03-08 武汉新新数码彩色印务有限公司 一种移动互联智能印刷方法与移动互联智能印刷系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1558340A (zh) * 2004-02-06 2004-12-29 珠海金山软件股份有限公司 一种排版方法
CN101916246A (zh) * 2010-07-30 2010-12-15 汉王科技股份有限公司 电子文档排版方法及装置
CN102147791A (zh) * 2011-04-02 2011-08-10 数字时代出版设计有限公司 一种图书自动排版方法及系统
CN102521219A (zh) * 2011-12-19 2012-06-27 方正国际软件有限公司 版式与流式混合排版系统及其排版方法
CN103294650A (zh) * 2012-02-29 2013-09-11 北大方正集团有限公司 一种显示电子文档的方法和装置
CN103377183A (zh) * 2012-04-27 2013-10-30 北大方正集团有限公司 重复排版的方法和装置
CN104021112A (zh) * 2014-06-23 2014-09-03 时代新媒体出版社有限责任公司 一种基于自动排版的一键成书系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1558340A (zh) * 2004-02-06 2004-12-29 珠海金山软件股份有限公司 一种排版方法
CN101916246A (zh) * 2010-07-30 2010-12-15 汉王科技股份有限公司 电子文档排版方法及装置
CN102147791A (zh) * 2011-04-02 2011-08-10 数字时代出版设计有限公司 一种图书自动排版方法及系统
CN102521219A (zh) * 2011-12-19 2012-06-27 方正国际软件有限公司 版式与流式混合排版系统及其排版方法
CN103294650A (zh) * 2012-02-29 2013-09-11 北大方正集团有限公司 一种显示电子文档的方法和装置
CN103377183A (zh) * 2012-04-27 2013-10-30 北大方正集团有限公司 重复排版的方法和装置
CN104021112A (zh) * 2014-06-23 2014-09-03 时代新媒体出版社有限责任公司 一种基于自动排版的一键成书系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106814950A (zh) * 2016-12-25 2017-06-09 语联网(武汉)信息技术有限公司 一种将原文和译文进行调整对齐的方法及系统
CN106775340A (zh) * 2016-12-27 2017-05-31 语联网(武汉)信息技术有限公司 一种在移动端进行语料对齐的方法及系统
CN107391650A (zh) * 2017-07-14 2017-11-24 北京神州泰岳软件股份有限公司 一种文档的结构化拆分方法,装置及系统
CN110162764A (zh) * 2018-02-12 2019-08-23 北京庖丁科技有限公司 电子文档的拆分方法、装置、设备及介质
CN109815473A (zh) * 2019-01-28 2019-05-28 四川译讯信息科技有限公司 一种文档编辑辅助方法
CN111028557A (zh) * 2019-12-30 2020-04-17 苏州卿学信息科技有限公司 一种课件演示方法及系统
CN114153404A (zh) * 2021-11-25 2022-03-08 武汉新新数码彩色印务有限公司 一种移动互联智能印刷方法与移动互联智能印刷系统

Also Published As

Publication number Publication date
CN105468577B (zh) 2018-11-09

Similar Documents

Publication Publication Date Title
CN105468577A (zh) 一种文档拆分方法及系统
CN104346319B (zh) 检查文档样式的方法及系统
Al-Zaidy et al. Automatic extraction of data from bar charts
CN105159877B (zh) 一种跨媒体自动排版系统及其方法
JP4150452B2 (ja) フォントの取得方法、登録方法および印刷方法
EP2291010A1 (en) Structure processing method and apparatus for layout file
CN101872340A (zh) 一种基于版面格式模板的排版方法及装置
CN101295290B (zh) 一种多行文字行中排版的方法
EP1732012B1 (en) Method of identifying redundant text in an electronic document
CN102479248A (zh) 一种电子文档结构化处理的方法和系统
CN104636428A (zh) 一种商标推荐方法及装置
CN104951429A (zh) 版式电子文档的页眉页脚识别方法及装置
CN105654022A (zh) 一种提取文档结构化信息的方法及装置
Hardy et al. Mapping and displaying structural transformations between xml and pdf
CN105069116A (zh) 一种将json串转化为数组的方法及系统
CN100517299C (zh) 一种实现文字行内多种对齐的排版方法
CN109582928B (zh) Pdf报表数据提取方法及装置
CN104572874A (zh) 一种网页信息的抽取方法及装置
CN106897287B (zh) 网页发布时间抽取方法和用于网页发布时间抽取的装置
CN104281575A (zh) 一种网页数据获取方法及模版引擎
CA2602749A1 (en) System and method of report representation
CN102262617B (zh) 一种书版小样处理方法及装置
CN105653549A (zh) 一种提取文档信息的方法及装置
Hardy et al. Creating structured PDF files using XML templates
CN101673406A (zh) 字体设置方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220620

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, fangzheng building, 298 Fu Cheng Road, Beijing, Haidian District

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181109

CF01 Termination of patent right due to non-payment of annual fee