CN112906351A - Pdf文档的生成方法及其装置 - Google Patents

Pdf文档的生成方法及其装置 Download PDF

Info

Publication number
CN112906351A
CN112906351A CN202110160805.2A CN202110160805A CN112906351A CN 112906351 A CN112906351 A CN 112906351A CN 202110160805 A CN202110160805 A CN 202110160805A CN 112906351 A CN112906351 A CN 112906351A
Authority
CN
China
Prior art keywords
pdf
document
generating
pdf document
xml
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110160805.2A
Other languages
English (en)
Inventor
李文博
张庆广
付立仕
陈亚岗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
61428 Unit Of Chinese Pla
Original Assignee
61428 Unit Of Chinese Pla
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 61428 Unit Of Chinese Pla filed Critical 61428 Unit Of Chinese Pla
Priority to CN202110160805.2A priority Critical patent/CN112906351A/zh
Publication of CN112906351A publication Critical patent/CN112906351A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请实施例提供一种PDF文档的生成方法及其装置,PDF文档的生成方法包括:获取XML模板文件;对所述XML模板文件进行解析以获得其中的结构元素;根据所述结构元素,构建文档框架;从目标数据源获取PDF内容数据;根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。由此可见,由于XML模板文件决定了pdf文档的整个格式,因此,PDF内容数据不变的基础上,如果需要调整改变格式,只需要修改xml模板文件就可以,不要改动任何程序代码,从而实现了代码的重复利用以及格式的调整。

Description

PDF文档的生成方法及其装置
技术领域
本申请实施例涉及数据技术领域,尤其涉及一种PDF文档的生成方法及其装置。
背景技术
现有技术的pdf文档生成解决方案中,在生成pdf文档的过程中,需要调用pdf表单填写数据或者直接在程序中绘制填写表单和数据,由此该类解决方案与文档格式耦合度高,生成不同文档格式的pdf就得编写不同的程序代码,导致代码不可重复用,且无法动态调整文档格式。
发明内容
有鉴于此,本申请实施例所解决的技术问题之一在于提供一种PDF文档的生成方法及其装置,用以克服或者缓解现有技术中上述缺陷。
第一方面,本申请实施例提供一种PDF文档的生成方法,其包括:
获取XML模板文件;
对所述XML模板文件进行解析以获得其中的结构元素;
根据所述结构元素,构建文档框架;
从目标数据源获取PDF内容数据;
根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。
可选地,在本申请的一实施例中,所述XML模板文件基于PDF文档数据结构构建。
可选地,在本申请的一实施例中,所述PDF文档数据结构包括如下中的一种或者多种:页面格式、页面元素、编码格式、内容标注。
可选地,在本申请的一实施例中,所述通过调用Itext组件解析所述目标XML文档生成PDF文档,包括:若所述页面元素是Barcode类型的PDF元素,则通过创建BarcodePDF417实例以在生成的PDF文档中展现所述所述PDF内容数据;如果所述页面元素是String类型的PDF元素则通过创建Paragraph实例以在生成的PDF文档中展现所述所述PDF内容数据;如所述页面元素是Table类型的元素则通过创建PdfPTable实例以在生成的PDF文档中展现所述所述PDF内容数据。
可选地,在本申请的一实施例中,所述对所述XML模板文件进行解析以获得其中的结构元素,包括:基于所述ITEXT组件对所述XML模板文件进行解析以获得其中的结构元素。
可选地,在本申请的一实施例中,所述根据所述结构元素,构建文档框架,包括:基于所述ITEXT组件,根据所述结构元素,构建文档框架。
可选地,在本申请的一实施例中,所述通过调用ITEXT组件解析所述目标XML文档生成PDF文档,包括:通过ITEXT组件将所述PDF内容数据填入到所述文档框架的内容标注中,以生成所述PDF文档。
可选地,在本申请的一实施例中,生成的所述PDF文档包括单张PDF文档,或者多张PDF文档;若生成的所述PDF文档是多个模板的PDF文档,则所述生成PDF文档之后还包括:将所述多个模板的PDF文档合并成一个PDF文档。
可选地,在本申请的一实施例中,所述生成PDF文档之后还包括:为所述PDF文档添加水印并设置相关水印属性,所述水印包括文字水印和图片水印中至少其一,所述水印属性包括字体,文字大小,水印大小和角度中至少其一。
本申请实施例的技术方案中,通过获取XML模板文件;对所述XML模板文件进行解析以获得其中的结构元素;根据所述结构元素,构建文档框架;从目标数据源获取PDF内容数据;根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。由此可见,由于XML模板文件决定了pdf文档的整个格式,因此,PDF内容数据不变的基础上,如果需要调整改变格式,只需要修改xml模板文件就可以,不要改动任何程序代码,从而实现了代码的重复利用以及格式的调整。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本申请实施例的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应所述理解,这些附图未必是按比例绘制的。附图中:
图1为本申请实施例中PDF文档的生成方法流程示意图;
图2为本申请实施例PDF文档的生成装置的结构示意图;
图3为本申请实施例中计算机存储介质的示意图;
图4为本申请实施例电子装置的示意图;
图5为本申请实施例电子装置的硬件结构示意图。
具体实施方式
实施本申请实施例的任一技术方案必不一定需要同时达到以上的所有优点。
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
下面结合本申请实施例附图进一步说明本申请实施例的具体实现。
图1为本申请实施例中PDF文档的生成方法流程示意图;如图1所示,PDF文档的生成方法包括:
S101、获取XML模板文件;
可选地,在PDF文档的生成方法的一实施例中,所述XML模板文件基于PDF文档数据结构构建。
可选地,在PDF文档的生成方法的一实施例中,所述PDF文档数据结构包括如下中的一种或者多种:页面格式、页面元素、编码格式、内容标注。
可选地,在PDF文档的生成方法的一实施例中,所述页面格式被分为不同的PDF元素,所述PDF元素的类型包括Document(文件类型),Page(页面),String(字符串),Table(表格),Cell(单元格),Margins(页边距),Font(字体),ColumnWidths(行宽),Watermark(水印),TableName(表格名称),Type(页面类型-单页/多页),Row(列数),MultiCount(即本模板可生成最大pdf页数),Image(图片),Leadding(行间距),Orientation(方向),Head(头),Firstcount(首行),Barcode(条形码)中的一种或任意多种的组合。
S102、对所述XML模板文件进行解析以获得其中的结构元素;
可选地,在PDF文档的生成方法的一实施例中,所述对所述XML模板文件进行解析以获得其中的结构元素,包括:基于所述ITEXT组件对所述XML模板文件进行解析以获得其中的结构元素。
S103、根据所述结构元素,构建文档框架;
可选地,在PDF文档的生成方法的一实施例中,所述根据所述结构元素,构建文档框架,包括:基于所述ITEXT组件,根据所述结构元素,构建文档框架。
S104、从目标数据源获取PDF内容数据;
可选地,在PDF文档的生成方法的一实施例中,所述目标数据源可以为数据库,或者web页面。
S105、根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。
可选地,在PDF文档的生成方法的一实施例中,所述根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用Itext组件解析所述目标XML文档生成PDF文档,包括:若所述页面元素是Barcode类型的PDF元素,则通过创建BarcodePDF417实例以在生成的PDF文档中展现所述所述PDF内容数据;如果所述页面元素是String类型的PDF元素则通过创建Paragraph实例以在生成的PDF文档中展现所述所述PDF内容数据;如所述页面元素是Table类型的元素则通过创建PdfPTable实例以在生成的PDF文档中展现所述所述PDF内容数据。
可选地,在PDF文档的生成方法的一实施例中,通过调用Itext组件解析所述目标XML文档生成PDF文档,包括通过createPdfByConElement对不同类型元素进行处理生成单页pdf文档。该类型元素包括但不限于文本、表格、图片等。
可选地,在PDF文档的生成方法的一实施例中,所述通过调用ITEXT组件解析所述目标XML文档生成PDF文档,包括:通过ITEXT组件将所述PDF内容数据填入到所述文档框架的内容标注中,以生成所述PDF文档,从而实现了用所述PDF内容数据替代所述文档框架的内容标注。
可选地,在PDF文档的生成方法的一实施例中,生成的所述PDF文档包括单张PDF文档,或者多张PDF文档;若生成的所述PDF文档是多个模板的PDF文档,则所述生成PDF文档之后还包括:将所述多个模板的PDF文档合并成一个PDF文档。
可选地,在PDF文档的生成方法的一实施例中,所述生成PDF文档之后还包括:为所述PDF文档添加水印并设置相关水印属性,所述水印包括文字水印和图片水印中至少其一,,所述水印属性包括字体,文字大小,水印大小和角度中至少其一。
此处,需要说明的是,上述添加水印和合并的处理步骤并无严格的时序关系,可以同时进行,也可以先后进行。
可选地,在PDF文档的生成方法的一实施例中,所述从目标数据源获取PDF内容数据之后,所述生成PDF文档之前,包括:将所述PDF内容数据暂存到map容器中,从而便于数据的快速查找、替换。
可选地,在PDF文档的生成方法的一实施例中,所述将所述PDF内容数据暂存到map容器中,包括:将所述PDF内容数据按照<标注,数据>的格式暂存到map容器中,所述标注用于表示XML模板文件的XML标识,该XML标识用于表示所述PDF内容数据在XML模板文件的位置,数据指的是所述PDF内容数据,通过这种<标注,数据>的格式从而建立了XML标识与PDF内容数据的对应关系,从而便于快速的进行数据查找,以使用PDF内容数据替代标注,将PDF内容数据存储到XML模板文件。
可选地,在PDF文档的生成方法的一实施例中,若所述PDF内容数据为图片,则所述将所述PDF内容数据暂存到map容器中包括:将所述图片转换为BASE64格式的字符串,并暂存到map容器中,从而实现了将图片暂存到map容器中,从而进一步将图片存储到XML模板文件中。
可选地,在PDF文档的生成方法的一实施例中,一个XML模板文件对应一个PDF文档。
可选地,在PDF文档的生成方法的一实施例中,通过对个XML模板文件页属性解析,以确定一个XML模板文件是否对应一个PDF文档。比如,页属性是single,则表示一个XML模板文件对应一个单页PDF文档,如果页属性是multipages,则一个XML模板文件对应一个多页PDF文档,从而保证依据PDF数据内容,生成格式相同的多页PDF文档。
综上可见,在本申请实施例方案中,由于对所述XML模板文件进行解析以获得其中的结构元素,且根据所述结构元素,构建文档框架,再进一步根据所述文档框架以及所述PDF内容数据,生成目标XML文档,由于XML模板文件决定了pdf文档的整个格式,因此,PDF内容数据不变的基础上,如果需要调整改变格式,只需要修改xml模板文件就可以,不要改动任何程序代码,从而实现了代码的重复利用以及格式的调整。
图2为本申请实施例PDF文档的生成装置的结构示意图;如图2所示,PDF文档的生成装置包括:
第一获取模块,用于获取XML模板文件;
解析模块,用于对所述XML模板文件进行解析以获得其中的结构元素;
构建模块,用于根据所述结构元素,构建文档框架;
第二获取模块,从目标数据源获取PDF内容数据;
文档生成模块,用于根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。
可选地,在生成装置的一实施例中,所述XML模板文件基于PDF文档数据结构构建。
可选地,在生成装置的一实施例中,所述PDF文档数据结构包括如下中的一种或者多种:页面格式、页面元素、编码格式、内容标注。
可选地,在生成装置的一实施例中,所述页面元素被分为不同的PDF元素,所述PDF元素的类型包括Document(文件类型),Page(页面),String(字符串),Table(表格),Cell(单元格),Margins(页边距),Font(字体),ColumnWidths(行宽),Watermark(水印),TableName(表格名称),Type(页面类型-单页/多页),Row(列数),MultiCount(本模板可生成最大pdf页数),Image(图片),Leadding(行间距),Orientation(方向),Head(头),Firstcount(首行),Barcode(条形码)。
可选地,在生成装置的一实施例中,还包括展示模块,所述展示模块在文档生成模块生成所述PDF文档时,若所述页面元素是Barcode类型的PDF元素,则通过创建BarcodePDF417实例以在所述PDF文档中展现所述所述PDF内容数据;如果所述页面元素是String类型的PDF元素则通过创建Paragraph实例以在所述PDF文档中展现所述所述PDF内容数据;如所述页面元素是Table类型的元素则通过创建PdfPTable实例以在所述PDF文档中展现所述所述PDF内容数据。
可选地,在生成装置的一实施例中,还包括ITEXT组件,基于所述ITEXT组件对所述XML模板文件进行解析以获得其中的结构元素。
可选地,在生成装置的一实施例中,还包括ITEXT组件,基于所述ITEXT组件,根据所述结构元素,构建文档框架。
可选地,在生成装置的一实施例中,还包括ITEXT组件,在生成PDF文档,通过ITEXT组件将所述PDF内容数据填入到所述文档框架的内容标注中,以生成所述PDF文档。
可选地,在生成装置的一实施例中,生成的所述PDF文档包括单张PDF文档,或者多张PDF文档;若生成的所述PDF文档是多个模板的PDF文档,则所述生成装置还包括文档合并模块,用于将所述多个模板的PDF文档合并成一个PDF文档。
可选地,在生成装置的一实施例中,水印添加模块,用于在生成PDF文档之后为所述PDF文档添加水印并设置相关水印属性,所述水印包括文字水印和图片水印中至少其一,所述水印属性包括字体,文字大小,水印大小和角度中至少其一。
可选地,在生成装置的一实施例中,暂存模块,用于在从目标数据源获取PDF内容数据之后将所述PDF内容数据暂存到map容器中。
可选地,在生成装置的一实施例中,所述暂存模块进一步用于将所述PDF内容数据按照<标注,数据>的格式暂存到map容器中,所述标注用于表示XML模板文件的XML标识,该XML标识用于表示所述PDF内容数据在XML模板文件的位置,数据指的是所述PDF内容数据,通过这种<标注,数据>的格式从而建立了XML标识与PDF内容数据的对应关系,从而便于快速的进行数据查找。
可选地,在生成装置的一实施例中,若所述PDF内容数据为图片,则所述暂存模块进一步用于将所述图片转换为BASE64格式的字符串,并暂存到map容器中,从而实现了将图片暂存到map容器中,从而进一步将图片存储到XML模板文件中。
图3为本申请实施例中计算机存储介质的示意图;如图3所示,所述计算机存储介质上存储有计算机程序,所述计算机程序被运行执行如下步骤:
获取XML模板文件;
对所述XML模板文件进行解析以获得其中的结构元素;
根据所述结构元素,构建文档框架;
从目标数据源获取PDF内容数据;
根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。
可选地,在计算机存储介质的一实施例中,所述XML模板文件基于PDF文档数据结构构建。
可选地,在计算机存储介质的一实施例中,所述PDF文档数据结构包括如下中的一种或者多种:页面格式、页面元素、编码格式、内容标注。
可选地,在计算机存储介质的一实施例中,所述页面元素被分为不同的PDF元素,所述PDF元素的类型包括Document(文件类型),Page(页面),String(字符串),Table(表格),Cell(单元格),Margins(页边距),Font(字体),ColumnWidths(行宽),Watermark(水印),TableName(表格名称),Type(页面类型-单页/多页),Row(列数),MultiCount(即本模板可生成最大pdf页数),Image(图片),Leadding(行间距),Orientation(方向),Head(头),Firstcount(首行),Barcode(条形码)。
可选地,在计算机存储介质的一实施例中,所述根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用Itext组件解析所述目标XML文档生成PDF文档,包括:若所述页面元素是Barcode类型的PDF元素,则通过创建BarcodePDF417实例以在生成的PDF文档中展现所述所述PDF内容数据;如果所述页面元素是String类型的PDF元素则通过创建Paragraph实例以在生成的PDF文档中展现所述所述PDF内容数据;如所述页面元素是Table类型的元素则通过创建PdfPTable实例以在生成的PDF文档中展现所述所述PDF内容数据。
可选地,在计算机存储介质的一实施例中,所述对所述XML模板文件进行解析以获得其中的结构元素,包括:基于所述ITEXT组件对所述XML模板文件进行解析以获得其中的结构元素。
可选地,在计算机存储介质的一实施例中,所述根据所述结构元素,构建文档框架,包括:基于所述ITEXT组件,根据所述结构元素,构建文档框架。
可选地,在计算机存储介质的一实施例中,所述通过调用ITEXT组件解析所述目标XML文档生成PDF文档,包括:通过ITEXT组件将所述PDF内容数据填入到所述文档框架的内容标注中,以生成所述PDF文档。
可选地,在计算机存储介质的一实施例中,生成的所述PDF文档包括单张PDF文档,或者多张PDF文档;若生成的所述PDF文档是多个模板的PDF文档,则所述生成PDF文档之后还包括:将所述多个模板的PDF文档合并成一个PDF文档。
可选地,在计算机存储介质的一实施例中,所述生成PDF文档之后还包括:为所述PDF文档添加水印并设置相关水印属性,所述水印包括文字水印和图片水印中至少其一,所述水印属性包括字体,文字大小,水印大小和角度中至少其一。
可选地,在计算机存储介质的一实施例中,所述从目标数据源获取PDF内容数据之后,所述生成PDF文档之前,包括:将所述PDF内容数据暂存到map容器中,从而便于数据的快速查找、替换。
可选地,在计算机存储介质的一实施例中,所述将所述PDF内容数据暂存到map容器中,包括:将所述PDF内容数据按照<标注,数据>的格式暂存到map容器中,所述标注用于表示XML模板文件的XML标识,该XML标识用于表示所述PDF内容数据在XML模板文件的位置,数据指的是所述PDF内容数据,通过这种<标注,数据>的格式从而建立了XML标识与PDF内容数据的对应关系,从而便于快速的进行数据查找。
可选地,在计算机存储介质的一实施例中,若所述PDF内容数据为图片,则所述将所述PDF内容数据暂存到map容器中包括:将所述图片转换为BASE64格式的字符串,并暂存到map容器中,从而实现了将图片暂存到map容器中,从而进一步将图片存储到XML模板文件中。
图4为本申请实施例电子装置的示意图;如图4所示,所述电子装置包括存储器以及处理器,所述存储器上存储有计算机程序,所述处理器运行所述计算机程序运行执行如下步骤:
获取XML模板文件;
对所述XML模板文件进行解析以获得其中的结构元素;
根据所述结构元素,构建文档框架;
从目标数据源获取PDF内容数据;
根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。
可选地,在电子装置的一实施例中,所述XML模板文件基于PDF文档数据结构构建。
可选地,在电子装置的一实施例中,所述PDF文档数据结构包括如下中的一种或者多种:页面格式、页面元素、编码格式、内容标注。
可选地,在电子装置的一实施例中,所述页面元素被分为不同的PDF元素,所述PDF元素的类型包括Document(文件类型),Page(页面),String(字符串),Table(表格),Cell(单元格),Margins(页边距),Font(字体),ColumnWidths(行宽),Watermark(水印),TableName(表格名称),Type(页面类型-单页/多页),Row(列数),MultiCount(本模板可生成最大pdf页数),Image(图片),Leadding(行间距),Orientation(方向),Head(头),Firstcount(首行),Barcode(条形码)。
可选地,在电子装置的一实施例中,所述根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用Itext组件解析所述目标XML文档生成PDF文档,包括:若所述页面元素是Barcode类型的PDF元素,则通过创建BarcodePDF417实例以在生成的PDF文档中展现所述所述PDF内容数据;如果所述页面元素是String类型的PDF元素则通过创建Paragraph实例以在生成的PDF文档中展现所述所述PDF内容数据;如所述页面元素是Table类型的元素则通过创建PdfPTable实例以在生成的PDF文档中展现所述所述PDF内容数据。
可选地,在电子装置的一实施例中,所述对所述XML模板文件进行解析以获得其中的结构元素,包括:基于所述ITEXT组件对所述XML模板文件进行解析以获得其中的结构元素。
可选地,在电子装置的一实施例中,所述根据所述结构元素,构建文档框架,包括:基于所述ITEXT组件,根据所述结构元素,构建文档框架。
可选地,在电子装置的一实施例中,所述通过调用ITEXT组件解析所述目标XML文档生成PDF文档,包括:通过ITEXT组件将所述PDF内容数据填入到所述文档框架的内容标注中,以生成所述PDF文档。
可选地,在电子装置的一实施例中,生成的所述PDF文档包括单张PDF文档,或者多张PDF文档;若生成的所述PDF文档是多个模板的PDF文档,则所述生成PDF文档之后还包括:将所述多个模板的PDF文档合并成一个PDF文档。
可选地,在电子装置的一实施例中,所述生成PDF文档之后还包括:为所述PDF文档添加水印并设置相关水印属性,所述水印包括文字水印和图片水印中至少其一,所述水印属性包括字体,文字大小,水印大小和角度中至少其一。
可选地,在电子装置的一实施例中,所述从目标数据源获取PDF内容数据之后,所述生成PDF文档之前,包括:将所述PDF内容数据暂存到map容器中。
可选地,在电子装置的一实施例中,所述将所述PDF内容数据暂存到map容器中,包括:将所述PDF内容数据按照<标注,数据>的格式暂存到map容器中。
可选地,在电子装置的一实施例中,若所述PDF内容数据为图片,则所述将所述PDF内容数据暂存到map容器中包括:将所述图片转换为BASE64格式的字符串,并暂存到map容器中。
图5为本申请实施例电子装置的硬件结构示意图;如图5所示,该电子装置的硬件结构可以包括:处理器,通信接口,计算机可读介质和通信总线;
其中,处理器、通信接口、计算机可读介质通过通信总线完成相互间的通信;
可选的,通信接口可以为通信模块的接口,如GSM模块的接口;
其中,处理器具体可以配置为运行存储器上存储的可执行程序,从而执行上述任一方法实施例的所有处理步骤或者其中部分处理步骤。
处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请实施例的电子装置以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器710、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
至此,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来运行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他一实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种PDF文档的生成方法,其特征在于,包括:
获取XML模板文件;
对所述XML模板文件进行解析以获得其中的结构元素;
根据所述结构元素,构建文档框架;
从目标数据源获取PDF内容数据;
根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。
2.根据权利要求1所述一种PDF文档的生成方法,其特征在于,所述XML模板文件基于PDF文档数据结构构建。
3.根据权利要求2所述一种PDF文档的生成方法,其特征在于,所述PDF文档数据结构包括如下中的一种或者多种:页面格式、页面元素、编码格式、内容标注。
4.根据权利要求1-3任一项所述一种PDF文档的生成方法,其特征在于,所述通过调用Itext组件解析所述目标XML文档生成PDF文档,包括:若所述页面元素是Barcode类型的PDF元素,则通过创建BarcodePDF417实例以在生成的PDF文档中展现所述所述PDF内容数据;如果所述页面元素是String类型的PDF元素则通过创建Paragraph实例以在生成的PDF文档中展现所述所述PDF内容数据;如所述页面元素是Table类型的元素则通过创建PdfPTable实例以在生成的PDF文档中展现所述所述PDF内容数据。
5.根据权利要求1所述一种PDF文档的生成方法,其特征在于,所述对所述XML模板文件进行解析以获得其中的结构元素,包括:基于所述ITEXT组件对所述XML模板文件进行解析以获得其中的结构元素。
6.根据权利要求1所述一种PDF文档的生成方法,其特征在于,所述根据所述结构元素,构建文档框架,包括:基于所述ITEXT组件,根据所述结构元素,构建文档框架。
7.根据权利要求1所述一种PDF文档的生成方法,其特征在于,所述通过调用ITEXT组件解析所述目标XML文档生成PDF文档,包括:通过ITEXT组件将所述PDF内容数据填入到所述文档框架的内容标注中,以生成所述PDF文档。
8.根据权利要求1所述一种PDF文档的生成方法,其特征在于,生成的所述PDF文档包括单张PDF文档,或者多张PDF文档;若生成的所述PDF文档是多个模板的PDF文档,则所述生成PDF文档之后还包括:将所述多个模板的PDF文档合并成一个PDF文档。
9.根据权利要求1所述一种PDF文档的生成方法,其特征在于,所述生成PDF文档之后还包括:为所述PDF文档添加水印并设置相关水印属性,所述水印包括文字水印和图片水印中至少其一,所述水印属性包括字体,文字大小,水印大小和角度中至少其一。
10.一种PDF文档的生成装置,其特征在于,包括:
第一获取模块,用于获取XML模板文件;
解析模块,用于对所述XML模板文件进行解析以获得其中的结构元素;
构建模块,用于根据所述结构元素,构建文档框架;
第二获取模块,从目标数据源获取PDF内容数据;
文档生成模块,用于根据所述文档框架以及所述PDF内容数据,生成目标XML文档,通过调用ITEXT组件解析所述目标XML文档生成PDF文档。
CN202110160805.2A 2021-02-05 2021-02-05 Pdf文档的生成方法及其装置 Pending CN112906351A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110160805.2A CN112906351A (zh) 2021-02-05 2021-02-05 Pdf文档的生成方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110160805.2A CN112906351A (zh) 2021-02-05 2021-02-05 Pdf文档的生成方法及其装置

Publications (1)

Publication Number Publication Date
CN112906351A true CN112906351A (zh) 2021-06-04

Family

ID=76122808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110160805.2A Pending CN112906351A (zh) 2021-02-05 2021-02-05 Pdf文档的生成方法及其装置

Country Status (1)

Country Link
CN (1) CN112906351A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688619A (zh) * 2021-08-05 2021-11-23 深圳集智数字科技有限公司 Pdf文档生成方法、装置、电子设备及存储介质
CN114936540A (zh) * 2022-07-22 2022-08-23 深圳联友科技有限公司 一种pdf文档模型的数据处理方法及处理组件

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688619A (zh) * 2021-08-05 2021-11-23 深圳集智数字科技有限公司 Pdf文档生成方法、装置、电子设备及存储介质
CN114936540A (zh) * 2022-07-22 2022-08-23 深圳联友科技有限公司 一种pdf文档模型的数据处理方法及处理组件
CN114936540B (zh) * 2022-07-22 2022-10-25 深圳联友科技有限公司 一种pdf文档模型的数据处理方法及处理组件

Similar Documents

Publication Publication Date Title
CN109597617B (zh) 基于模板快速生成业务页面的方法和装置
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
CN113609820B (zh) 基于可扩展标记语言文件生成word文件的方法、装置及设备
US9223764B2 (en) Assistive technology for the visually impaired
US20150033116A1 (en) Systems, Methods, and Media for Generating Structured Documents
CN109634579B (zh) 代码生成方法、装置、计算机装置及存储介质
CN112906351A (zh) Pdf文档的生成方法及其装置
CN111985202A (zh) 基于模板生成pdf电子签章的方法、设备及存储介质
CN111475700A (zh) 一种数据提取方法及相关设备
CN117391192B (zh) 基于图数据库的利用llm从pdf构建知识图谱的方法及装置
CN110162301B (zh) 一种表单渲染方法、装置和存储介质
CN104156421B (zh) 页面的展现方法、装置及系统
KR102087274B1 (ko) 개체를 렌더링하는 웹 전자 문서 편집 장치 및 이의 동작 방법
EP2869216A1 (en) Related content retrieval device and related content retrieval method
CN113033177B (zh) 一种电子病历数据的解析方法及装置
CN113297425A (zh) 文档转换方法、装置、服务器及存储介质
Yang et al. Extracting mathematical expressions from postscript documents
CN115759029A (zh) 文档模板处理方法、装置、电子设备及存储介质
CN114489525B (zh) 打印报表生成方法、装置、设备及存储介质
US10606928B2 (en) Assistive technology for the impaired
CN113139145B (zh) 页面生成方法、装置、电子设备及可读存储介质
CN112149391B (zh) 信息处理方法、信息处理装置、终端设备及存储介质
CN114004209A (zh) Pdf格式数据导出方法、装置、电子设备及可读存储介质
CN113312568A (zh) 一种基于HTML源代码和网页快照的Web信息抽取方法与系统
CN112800078A (zh) 基于javascript的轻量级文本标注方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination