CN106649229A - Pdf文件的拆分方法、pdf文件的拆分系统和终端 - Google Patents

Pdf文件的拆分方法、pdf文件的拆分系统和终端 Download PDF

Info

Publication number
CN106649229A
CN106649229A CN201510741974.XA CN201510741974A CN106649229A CN 106649229 A CN106649229 A CN 106649229A CN 201510741974 A CN201510741974 A CN 201510741974A CN 106649229 A CN106649229 A CN 106649229A
Authority
CN
China
Prior art keywords
page
pdf document
split
fractionation
parameter information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510741974.XA
Other languages
English (en)
Inventor
蒋晓舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhengyuan Xingbang Technology Co Glodon
Original Assignee
Beijing Zhengyuan Xingbang Technology Co Glodon
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhengyuan Xingbang Technology Co Glodon filed Critical Beijing Zhengyuan Xingbang Technology Co Glodon
Priority to CN201510741974.XA priority Critical patent/CN106649229A/zh
Publication of CN106649229A publication Critical patent/CN106649229A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种PDF文件的拆分方法、PDF文件的拆分系统和终端,其中,PDF文件的拆分方法,包括:获取页面参数信息;根据页面参数信息对待拆分的PDF文件进行拆分,以生成拆分的PDF文件。通过本发明的技术方案,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。

Description

PDF文件的拆分方法、PDF文件的拆分系统和终端
技术领域
本发明涉及软件技术领域,具体而言,涉及一种PDF文件的拆分方法、一种PDF文件的拆分系统和一种终端。
背景技术
在相关技术中,随着电子政务技术的不断改进,对PDF文档进行自动化批量拆分处理成为了电子文档管理新的需求,目前市面上PDF拆分工具包括可视化工具和组件化PDF拆分工具。
可视化工具需要用户自己选择文件,自己选择拆分的范围,无法实自动化批量处理,也不能被其它应用程序调用。
组件化的PDF拆分工具不能支持多种PDF文档版本,拆分后的横向页会被旋转90度,且不能自动生成页码,由于使用了PDF插件,效率不高,对安装环境也有要求。
因此,如何实现高效的批量PDF文件的拆分成为亟待解决的技术问题。
发明内容
本发明正是基于上述技术问题至少之一,提出了一种新的PDF文件的拆分方案,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。
有鉴于此,本发明提出了一种PDF文件的拆分方法,包括:获取页面参数信息;根据页面参数信息对待拆分的PDF文件进行拆分,以生成拆分的PDF文件。
在该技术方案中,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。
在上述技术方案中,优选地,根据页面参数信息对待拆分的PDF文件进行拆分,具体包括以下步骤:判断获取的页面参数信息是否为页码参数;在判定获取的页面参数信息为页码参数时,在页码参数对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取页码参数为页面参数信息,按照页码拆分PDF文档,高效地实现了PDF文件的批量拆分。
在上述技术方案中,优选地,根据页面参数信息对待拆分的PDF文件进行拆分,具体包括以下步骤:判断获取的页面参数信息是否为书签名称;在判定获取的页面参数信息为书签名称时,在书签名称对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取书签参数为页面参数信息,在书签名称页面拆分PDF文档,每个书签生成一个对应的PDF文件,如果有跨书签的页面,则拆分的前后两个PDF文件均含有该页。
在上述任一项技术方案中,优选地,判断待拆分的PDF文件中的任一页面的页面方向,作为拆分前的页面方向属性;将拆分前的页面方向属性确定为拆分后的PDF文件中的对应页面的页面方向。
在该技术方案中,通过将拆分前后的页面方向保持一致,避免了用户进行页面方向调整的步骤。
在上述技术方案中,优选地,更新拆分后的PDF文件的任一页面的页码参数。
在该技术方案中,通过更新拆分后的PDF文件页码,提高了拆分后的PDF文件的完整性,节省了用户的编码步骤,避免了拆分后的文件的页码的混乱。
根据本发明的第二方面,还提出了一种PDF文件的拆分系统,包括:获取单元,用于获取页面参数信息;拆分单元,用于根据页面参数信息对待拆分的PDF文件进行拆分,以生成拆分的PDF文件。
在该技术方案中,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。
在上述技术方案中,优选地,拆分单元还包括:判断单元,用于判断获取的页面参数信息是否为页码参数;拆分单元还用于:在判定获取的页面参数信息为页码参数时,在页码参数对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取页码参数为页面参数信息,按照页码拆分PDF文档,高效地实现了PDF文件的批量拆分。
在上述技术方案中,优选地,判断单元还包括:判断获取的页面参数信息是否为书签名称;拆分单元还用于:在判定获取的页面参数信息为书签名称时,在书签名称对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取书签参数为页面参数信息,在书签名称页面拆分PDF文档,每个书签生成一个对应的PDF文件,如果有跨书签的页面,则拆分的前后两个PDF文件均含有该页。
在上述任一项技术方案中,优选地,判断单元还用于:判断待拆分的PDF文件中的任一页面的页面方向,作为拆分前的页面方向属性;拆分单元还用于:将拆分前的页面方向属性确定为拆分后的PDF文件中的对应页面的页面方向。
在该技术方案中,通过将拆分前后的页面方向保持一致,避免了用户进行页面方向调整的步骤。
在上述技术方案中,优选地,更新单元,用于更新拆分后的PDF文件的任一页面的页码参数。
在该技术方案中,通过更新拆分后的PDF文件页码,提高了拆分后的PDF文件的完整性,节省了用户的编码步骤,避免了拆分后的文件的页码的混乱。
根据本发明的第三方面,还提出了一种终端,包括:如上述任一项技术方案的PDF文件的拆分系统。
在该技术方案中,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。
附图说明
图1示出了根据本发明的实施例的PDF文件的拆分方法的示意流程图;
图2示出了根据本发明的实施例的PDF文件的拆分系统的示意框图;
图3示出了根据本发明的实施例的终端的示框意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的PDF文件的拆分方法的示意流程图。
如图1所示,根据本发明的实施例的PDF文件的拆分方法,包括:步骤102,获取页面参数信息;步骤104,根据页面参数信息对待拆分的PDF文件进行拆分,以生成拆分的PDF文件。
在该技术方案中,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。
在上述技术方案中,优选地,根据页面参数信息对待拆分的PDF文件进行拆分,具体包括以下步骤:判断获取的页面参数信息是否为页码参数;在判定获取的页面参数信息为页码参数时,在页码参数对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取页码参数为页面参数信息,按照页码拆分PDF文档,高效地实现了PDF文件的批量拆分。
具体地,如表1所示,为按页码拆分PDF文件的方法,所属类名为“PDFSpliter”,方法名为“splitPDFByPage”,方法参数包括:“pdf”即PDF文件名称,“outputFolder”即输出文件夹、“pagesInOnePdf”即切分后单个PDF文件的页码数。
表1
在上述技术方案中,优选地,根据页面参数信息对待拆分的PDF文件进行拆分,具体包括以下步骤:判断获取的页面参数信息是否为书签名称;在判定获取的页面参数信息为书签名称时,在书签名称对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取书签参数为页面参数信息,在书签名称页面拆分PDF文档,每个书签生成一个对应的PDF文件,如果有跨书签的页面,则拆分的前后两个PDF文件均含有该页。
具体地,如表2所示,为按标签拆分PDF文件的方法,所属类名为“PDFSpliter”,方法名为“splitPDFByBookmarks”,方法参数包括:“pdf”即PDF文件名称,“outputFolder”即输出文件夹。
表2
在上述任一项技术方案中,优选地,判断待拆分的PDF文件中的任一页面的页面方向,作为拆分前的页面方向属性;将拆分前的页面方向属性确定为拆分后的PDF文件中的对应页面的页面方向。
在该技术方案中,通过将拆分前后的页面方向保持一致,避免了用户进行页面方向调整的步骤。
在上述技术方案中,优选地,更新拆分后的PDF文件的任一页面的页码参数。
在该技术方案中,通过更新拆分后的PDF文件页码,提高了拆分后的PDF文件的完整性,节省了用户的编码步骤,避免了拆分后的文件的页码的混乱。
图2示出了根据本发明的实施例的一种PDF文件的拆分系统的示意框图。
如图2所示,根据本发明的实施例的一种PDF文件的拆分系统200,包括:获取单元202,用于获取页面参数信息;拆分单元204,用于根据页面参数信息对待拆分的PDF文件进行拆分,以生成拆分的PDF文件。
在该技术方案中,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。
在上述技术方案中,优选地,拆分单元204还包括:判断单元206,用于判断获取的页面参数信息是否为页码参数;拆分单元204还用于:在判定获取的页面参数信息为页码参数时,在页码参数对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取页码参数为页面参数信息,按照页码拆分PDF文档,高效地实现了PDF文件的批量拆分。
在上述技术方案中,优选地,判断单元206还包括:判断获取的页面参数信息是否为书签名称;拆分单元204还用于:在判定获取的页面参数信息为书签名称时,在书签名称对应的页面位置进行待拆分的PDF文件的拆分。
在该技术方案中,通过获取书签参数为页面参数信息,在书签名称页面拆分PDF文档,每个书签生成一个对应的PDF文件,如果有跨书签的页面,则拆分的前后两个PDF文件均含有该页。
在上述任一项技术方案中,优选地,判断单元206还用于:判断待拆分的PDF文件中的任一页面的页面方向,作为拆分前的页面方向属性;拆分单元204还用于:将拆分前的页面方向属性确定为拆分后的PDF文件中的对应页面的页面方向。
在该技术方案中,通过将拆分前后的页面方向保持一致,避免了用户进行页面方向调整的步骤。
在上述技术方案中,优选地,更新单元208,用于更新拆分后的PDF文件的任一页面的页码参数。
在该技术方案中,通过更新拆分后的PDF文件页码,提高了拆分后的PDF文件的完整性,节省了用户的编码步骤,避免了拆分后的文件的页码的混乱。
图3示出了根据本发明的实施例的终端的示框意图。
如图3所示,根据本发明的一个实施例的终端300,包括:如上述任一项技术方案的PDF文件的拆分系统200。
以上结合附图详细说明了本发明的技术方案,考虑到相关技术中提出的如何实现高效率的自动化的批量PDF文件的拆分的技术问题,本发明提出了一种新的PDF文件的拆分方案,通过确定页面参数信息,实现了PDF文档自动按页码拆分或按书签拆分的功能,且能够自动生成页码,并保证了拆分前后的页面方向一致,拆分效率高,可以被其他程序调用。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种PDF文件的拆分方法,其特征在于,包括:
获取页面参数信息;
根据所述页面参数信息对待拆分的PDF文件进行拆分,以生成拆分的PDF文件。
2.根据权利要求1所述的PDF文件的拆分方法,其特征在于,根据所述页面参数信息对待拆分的PDF文件进行拆分,具体包括以下步骤:
判断获取的所述页面参数信息是否为页码参数;
在判定获取的所述页面参数信息为所述页码参数时,在所述页码参数对应的页面位置进行所述待拆分的PDF文件的拆分。
3.根据权利要求1所述的PDF文件的拆分方法,其特征在于,根据所述页面参数信息对待拆分的PDF文件进行拆分,具体包括以下步骤:
判断获取的所述页面参数信息是否为书签名称;
在判定获取的所述页面参数信息为所述书签名称时,在所述书签名称对应的页面位置进行所述待拆分的PDF文件的拆分。
4.根据权利要求1至3中任一项所述的PDF文件的拆分方法,其特征在于,还包括:
判断所述待拆分的PDF文件中的任一页面的页面方向,作为拆分前的页面方向属性;
将所述拆分前的页面方向属性确定为拆分后的PDF文件中的对应页面的页面方向。
5.根据权利要求4所述的PDF文件的拆分方法,其特征在于,还包括:
更新所述拆分后的PDF文件的任一页面的页码参数。
6.一种PDF文件的拆分系统,其特征在于,包括:
获取单元,用于获取页面参数信息;
拆分单元,用于根据所述页面参数信息对待拆分的PDF文件进行拆分,以生成拆分的PDF文件。
7.根据权利要求6所述的PDF文件的拆分系统,其特征在于,
所述拆分单元还包括:判断单元,用于判断获取的所述页面参数信息是否为页码参数;
所述拆分单元还用于:在判定获取的所述页面参数信息为所述页码参数时,在所述页码参数对应的页面位置进行所述待拆分的PDF文件的拆分。
8.根据权利要求6所述的PDF文件的拆分系统,其特征在于,
所述判断单元还包括:判断获取的所述页面参数信息是否为书签名称;
所述拆分单元还用于:在判定获取的所述页面参数信息为所述书签名称时,在所述书签名称对应的页面位置进行所述待拆分的PDF文件的拆分。
9.根据权利要求6至8中任一项所述的PDF文件的拆分系统,其特征在于,
所述判断单元还用于:判断所述待拆分的PDF文件中的任一页面的页面方向,作为拆分前的页面方向属性;
所述拆分单元还用于:将所述拆分前的页面方向属性确定为拆分后的PDF文件中的对应页面的页面方向。
10.根据权利要求9所述的PDF文件的拆分系统,其特征在于,还包括:
更新单元,用于更新所述拆分后的PDF文件的任一页面的页码参数。
11.一种终端,其特征在于,包括:如权利要求6至10中任一项所述的PDF文件的拆分系统。
CN201510741974.XA 2015-11-04 2015-11-04 Pdf文件的拆分方法、pdf文件的拆分系统和终端 Pending CN106649229A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510741974.XA CN106649229A (zh) 2015-11-04 2015-11-04 Pdf文件的拆分方法、pdf文件的拆分系统和终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510741974.XA CN106649229A (zh) 2015-11-04 2015-11-04 Pdf文件的拆分方法、pdf文件的拆分系统和终端

Publications (1)

Publication Number Publication Date
CN106649229A true CN106649229A (zh) 2017-05-10

Family

ID=58850953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510741974.XA Pending CN106649229A (zh) 2015-11-04 2015-11-04 Pdf文件的拆分方法、pdf文件的拆分系统和终端

Country Status (1)

Country Link
CN (1) CN106649229A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633039A (zh) * 2017-09-13 2018-01-26 张贝贝 一种按涉及股权转让主题的pdf文件切割方法
CN107633040A (zh) * 2017-09-13 2018-01-26 张贝贝 一种按涉及重大重组主题的pdf文件切割方法
CN107918662A (zh) * 2017-11-22 2018-04-17 泰康保险集团股份有限公司 单证拆分方法及装置
CN108491365A (zh) * 2018-02-02 2018-09-04 方欣科技有限公司 一种pdf根据不同业务自动拆分组合的方法及装置
CN110162764A (zh) * 2018-02-12 2019-08-23 北京庖丁科技有限公司 电子文档的拆分方法、装置、设备及介质
CN112639762A (zh) * 2018-06-22 2021-04-09 高利得有限公司 数字文档管理系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425089A (zh) * 2008-11-13 2009-05-06 北京中文在线教育科技发展有限公司 用于在线电子图书的加载方法和检索方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425089A (zh) * 2008-11-13 2009-05-06 北京中文在线教育科技发展有限公司 用于在线电子图书的加载方法和检索方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633039A (zh) * 2017-09-13 2018-01-26 张贝贝 一种按涉及股权转让主题的pdf文件切割方法
CN107633040A (zh) * 2017-09-13 2018-01-26 张贝贝 一种按涉及重大重组主题的pdf文件切割方法
CN107918662A (zh) * 2017-11-22 2018-04-17 泰康保险集团股份有限公司 单证拆分方法及装置
CN108491365A (zh) * 2018-02-02 2018-09-04 方欣科技有限公司 一种pdf根据不同业务自动拆分组合的方法及装置
CN110162764A (zh) * 2018-02-12 2019-08-23 北京庖丁科技有限公司 电子文档的拆分方法、装置、设备及介质
CN112639762A (zh) * 2018-06-22 2021-04-09 高利得有限公司 数字文档管理系统

Similar Documents

Publication Publication Date Title
CN106649229A (zh) Pdf文件的拆分方法、pdf文件的拆分系统和终端
WO2011066456A3 (en) Methods and systems for content recommendation based on electronic document annotation
WO2007062140A3 (en) System and method for generating, maintaining, and rendering landing and web pages
CN105630617A (zh) 一种基于规则引擎的业务处理方法及系统
GB2485730A (en) Symmetric live migration of virtual machines
WO2008126796A1 (ja) サービス・プログラムを生成する技術
TW200519729A (en) Method for restoring backup data
ATE515750T1 (de) Verfahren, system und computerprogrammprodukt zur zugangskontrolle
JP2006174462A5 (zh)
WO2009158664A3 (en) Library description of the user interface for federated search results
DE60203525D1 (de) Vorrichtung und verfahren in einer büroapplikation zur bereitstellung von inhaltsabhängiger hilfeinformation
CN101751478A (zh) 一种文件备份方法及系统
CN109450637A (zh) 电子骑缝章的签章数据管理方法及装置
WO2005008414A3 (en) Method and apparatus for parallel action processing
CN102591849B (zh) 文档格式转换的方法及装置
TW200500899A (en) Electronic data management system and method using backup technique for professional service
DE60323249D1 (de) Irreguläres geflecht und eingebettete geometrische beschreibung in einem computergraphiksystem
ATE538580T1 (de) Verfahren zum synchronisieren von inhaltsbezogenen datensegmenten von dateien
CN102855225B (zh) 一种对应用文档设置页码的系统和方法
WO2006077246A3 (de) Verfahren, computerprogramm und system zum bearbeiten von mehreren dokumentenverarbeitungsaufträgen
CN106598933B (zh) 一种基于网页的排版文件校对方法及设备
JP4527709B2 (ja) 電力系統管理図面の描画方法
CN104484168A (zh) 一种对比Excel差异的方法及系统
CN104699779A (zh) 一种对象编号的生成方法和装置
KR20150079856A (ko) 파일 트리밍 방법, 단말기, 서버, 프로그램 및 기록매체

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510