CN111859865A - 用于转换pdf文档的方法、装置、终端及介质 - Google Patents

用于转换pdf文档的方法、装置、终端及介质 Download PDF

Info

Publication number
CN111859865A
CN111859865A CN202010614793.1A CN202010614793A CN111859865A CN 111859865 A CN111859865 A CN 111859865A CN 202010614793 A CN202010614793 A CN 202010614793A CN 111859865 A CN111859865 A CN 111859865A
Authority
CN
China
Prior art keywords
converted
picture
converting
html
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010614793.1A
Other languages
English (en)
Inventor
陈炼抄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Agricultural Products Co ltd
Shenzhen Zhongnong Yixun Information Technology Co ltd
Original Assignee
Shenzhen Agricultural Products Co ltd
Shenzhen Zhongnong Yixun Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Agricultural Products Co ltd, Shenzhen Zhongnong Yixun Information Technology Co ltd filed Critical Shenzhen Agricultural Products Co ltd
Priority to CN202010614793.1A priority Critical patent/CN111859865A/zh
Publication of CN111859865A publication Critical patent/CN111859865A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Record Information Processing For Printing (AREA)

Abstract

本申请公开了一种用于转换PDF文档的方法、装置、终端及介质。其中方法包括:基于待转换处理的html页面,确定html页面对应的dom元素;将dom元素转换为html画布元素;将html画布元素转换为待转换图片;判断待转换图片是否需要进行分页处理;依据判断结果,将待转换图片转换为PDF文档。本申请通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。

Description

用于转换PDF文档的方法、装置、终端及介质
技术领域
本申请涉及计算机技术领域,具体涉及一种用于转换PDF文档的方法、装置、终端及介质。
背景技术
随着web技术的快速发展,浏览器得到普遍应用,尤其是将网页页面转换为PDF文档的浏览器。相关的PDF转换方法因在后台完成转换,因此,转换得到的PDF文档并无法保留html页面的样式;同时,在html页面较为复杂时,转换得到的PDF文档易出现格式错误以及对PDF文档进行打印后的文件不符合用户观看习惯的问题。
发明内容
为了解决上述至少一个技术问题,本申请提供一种用于转换PDF文档的方法、装置、终端及介质。
根据本申请的第一方面,提供了一种用于转换PDF文档的方法,该方法包括:
基于待转换处理的html页面,确定html页面对应的dom元素;
将dom元素转换为html画布元素;
将html画布元素转换为待转换图片;
判断待转换图片是否需要进行分页处理;
依据判断结果,将待转换图片转换为PDF文档。
根据本申请的第二方面,提供了一种用于转换PDF文档的装置,该装置包括:
页面元素确定模块,用于基于待转换处理的html页面,确定html页面对应的dom元素;
画布转换处理模块,用于将dom元素转换为html画布元素;
图片转换处理模块,用于将html画布元素转换为待转换图片;
图片分页判断模块,用于判断待转换图片是否需要进行分页处理;
文档转换处理模块,用于依据判断结果,将待转换图片转换为PDF文档。
根据本申请的第三方面,提供了一种终端,该终端包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时以实现上述用于转换PDF文档的方法。
根据本申请的第四方面,提供了一种计算机可读存储介质,该介质存储有计算机可执行指令,该计算机可执行指令用于以执行上述用于转换PDF文档的方法。
本申请实施例通过确定待转换处理的html页面对应的dom元素,将dom元素转换为html画布元素,从而将html画布元素转换为待转换图片,判断待转换图片是否需要进行分页处理,依据判断结果对待转换图片进行PDF转换处理,得到PDF文档,通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种用于转换PDF文档的方法的流程示意图;
图2为本申请实施例提供的一种用于转换PDF文档的方法中进行PDF转换处理的流程示意图;以及
图3为根据本申请实施例提供的一种用于转换PDF文档的装置的框图结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
根据本申请的一个实施例,提供了一种用于转换PDF文档的方法,如图1所示,该方法包括步骤S101至步骤S105。
步骤S101:基于待转换处理的html页面,确定html页面对应的dom元素。
具体地,浏览器基于待转换处理的html页面,确定html页面对应的dom元素。具体地,浏览器可以通过预设的交互界面或预设的转换控件来检测用户对html页面的操作。例如,若检测到将待转换处理的html页面转换为PDF文档的操作,则将该操作指向的html页面作为待处理的html页面。
具体地,浏览器可以依据预设的dom模型来对html页面进行元素提取,得到html页面的各个元素,即得到html页面对应的dom元素。其中,html页面对应的dom元素一般以树形结构进行存储。
步骤S102:将dom元素转换为html画布元素。
具体地,浏览器可以采用html2canvas库对dom元素进行转换,以得到html画布元素。
具体地,可以采用预设的画布参数,如高度height属性和宽度width属性,以依据这两个参数将dom元素转换为html画布元素。
步骤S103:将html画布元素转换为待转换图片。
具体地,浏览器可以采用html2canvas库提供的转换方法(如toDataURL)将html画布元素转换为待转换图片。
具体地,可以根据预设的图片尺寸将html画布元素转换为待转换图片。
步骤S104:判断待转换图片是否需要进行分页处理。
具体地,可以预设多种打印参数来判断待转换图片是否需要进行分页处理。其中,打印参数一般根据打印纸张来确定。例如,若待打印纸张大小为A4纸,那么以A4纸的大小来判断待转换图片是否需要进行分页处理。
步骤S105:依据判断结果对待转换图片进行PDF转换处理,得到PDF文档。
具体地,根据预设的图片与PDF文档间的转换方法对待转换图片进行PDF转换处理。例如,采用JSPDF方法将待转换图片转换为PDF文档。
具体地,已对待转换图片进行分页处理,那么PDF文档包括多个PDF分页,否则仅包括一个PDF分页。
本申请实施例通过确定待转换处理的html页面对应的dom元素,将dom元素转换为html画布元素,从而将html画布元素转换为待转换图片,判断待转换图片是否需要进行分页处理,依据判断结果对待转换图片进行PDF转换处理,得到PDF文档,通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。
在一些实施例中,步骤S104进一步包括:
确定待转换图片的图片尺寸;
依据图片尺寸和预设的打印尺寸,判断待转换图片是否需要进行分页处理。
具体地,可以依据多种纸张来提供多种打印尺寸。例如,根据A4纸的大小,确定预设的打印尺寸。
在一些实施例中,如图2所示,步骤S105进一步包括:
步骤S1051:若图片尺寸大于打印尺寸,则将待转换图片分割为至少两个子图片;
步骤S1052:依据至少两个子图片,生成至少两个PDF分页;
步骤S1053:将至少连个PDF分页合并处理为PDF文档。
具体地,可以通过计算图片尺寸与打印尺寸的比值来确定分割的子图片的数量。例如,若图片尺寸与打印尺寸的比值为2,那么将待转换图片分割为两个子图片;若图片尺寸与打印尺寸的比值大于1且小于2,那么将待转换图片分割为两个子图片;若图片尺寸与打印尺寸的比值大于2且小于等于3,那么将待转换图片分割为三个子图片,以此类推。
具体地,一个子图片生成一个PDF分页。
具体地,可以依据待转换图片中的分割位置来确定多个子图片的待转换标签,以在将子图片转换为PDF分页时,依据待转换标签来确定转换得到的PDF分页的页码。
在一些实施例中,步骤S1052进一步包括:
基于dom元素,确定html页面的页头和页尾;
将页头和页尾插入至至少两个PDF分页。
具体地,通过dom元素中针对页头的元素对象和针对页尾的元素对象,在html页面进行定位,以确定出页头的视图和页尾的视图,从而将页头的视图和页尾的视图插入至至少两个PDF分页,使得PDF分页保留html页面的特征。
在一些实施例中,步骤S101之前,该方法还包括:
基于预设的PDF转换用户界面,确定多个网页页面;
依据多个网页页面,确定所选定的至少一个html页面。
具体地,PDF转换用户界面一般提供浏览器中当前开启的多个网页页面各自对应的复选框,以供用户进行选择,并根据用户的选择操作来确定所选定的至少一个html页面。
进一步地,步骤S103进一步包括:
基于预定的图片分辨率,将html画布元素转换为待转换图片。
具体地,图片分辨率一般包括图片宽度与高度两个参数,通过这两个参数将html画布元素转换为待转换图片。
为了进一步说明本申请实施例提供的PDF文档转换方法,下面以浏览器为例进行说明。该浏览器中打开有多个网页页面,分别为页面1、页面2和页面3。
该浏览器的打印工具可以提供有PDF文档转换功能的控件,若浏览器检测到用户对该控件的控制操作时,弹窗显示PDF转换用户界面,该PDF转换用户界面提供有页面1、页面2和页面3分别对应的复选框,生成PDF文档的控件。假设检测到用户对PDF文档的控件的操作时,确定用户选中的页面为页面1,那么提取页面1的dom元素,并利用html2canvas库对dom元素进行转换,以得到html画布元素,将html画布元素转换为图片。若转换得到的图片的尺寸大于A4纸(预设的打印尺寸)的尺寸,那么将转换得到的图片分割为多个子图片,构建多个JSPDF对象,并将多个子图片分别插入一个JSPDF对象,得到多个PDF分页后,将多个PDF分页合并处理为PDF文档。
本申请的又一实施例提供了一种用于转换PDF文档的装置,如图3所示,该装置30包括:页面元素确定模块301、画布转换处理模块302、图片转换处理模块303、图片分页判断模块304以及文档转换处理模块305。
页面元素确定模块301,用于基于待转换处理的html页面,确定html页面对应的dom元素;
画布转换处理模块302,用于将dom元素转换为html画布元素;
图片转换处理模块303,用于将html画布元素转换为待转换图片;
图片分页判断模块304,用于判断待转换图片是否需要进行分页处理;
文档转换处理模块305,用于依据判断结果,将待转换图片转换为PDF文档。
本申请实施例通过确定待转换处理的html页面对应的dom元素,将dom元素转换为html画布元素,从而将html画布元素转换为待转换图片,判断待转换图片是否需要进行分页处理,依据判断结果对待转换图片进行PDF转换处理,得到PDF文档,通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。
进一步地,图片分页判断模块包括:
图片尺寸确定子模块,用于确定待转换图片的图片尺寸;
分页判断子模块,用于依据图片尺寸和预设的打印尺寸,判断待转换图片是否需要进行分页处理。
进一步地,文档转换处理模块包括:
分页确定子模块,用于若图片尺寸大于打印尺寸,则将待转换图片分割为多个子图片;
分页处理子模块,用于依据多个子图片,生成多个PDF分页;
文档生成子模块,用于将多个PDF分页合并处理为PDF文档。
进一步地,分页处理子模块包括:
页头页尾提取单元,用于基于dom元素,确定html页面的页头和页尾;
PDF分页生成单元,用于将页头和页尾插入至多个PDF分页。
进一步地,基于待转换处理的html页面,确定html画布元素的步骤之前,页面元素确定模块还包括;
页面确定子模块,用于基于预设的PDF转换用户界面,确定多个网页页面;
页面选定子模块,用于依据多个网页页面,确定所选定的至少一个html页面。
进一步地,页面元素确定模块包括:
图片处理子模块,用于基于预定的图片分辨率,将html画布元素转换为待转换图片。
进一步地,该装置还包括:
文档显示处理模块,用于将PDF文档通过预设的用户界面进行显示处理。
本实施例的用于转换PDF文档的装置可执行本申请实施例提供的用于转换PDF文档的方法,其实现原理相类似,此处不再赘述。
本申请又一实施例提供了一种终端,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时以实现上述用于转换PDF文档的方法。
具体地,处理器可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
具体地,处理器通过总线与存储器连接,总线可包括一通路,以用于传送信息。总线可以是PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。
存储器可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选的,存储器用于存储执行本申请方案的计算机程序的代码,并由处理器来控制执行。处理器用于执行存储器中存储的应用程序代码,以实现图3所示实施例提供的用于转换PDF文档的装置的动作。
本申请实施例通过确定待转换处理的html页面对应的dom元素,将dom元素转换为html画布元素,从而将html画布元素转换为待转换图片,判断待转换图片是否需要进行分页处理,依据判断结果对待转换图片进行PDF转换处理,得到PDF文档,通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。
本申请又一实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,该计算机可执行指令用于执行上述图1或图2所示的用于转换PDF文档的方法。
本申请实施例通过确定待转换处理的html页面对应的dom元素,将dom元素转换为html画布元素,从而将html画布元素转换为待转换图片,判断待转换图片是否需要进行分页处理,依据判断结果对待转换图片进行PDF转换处理,得到PDF文档,通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。
以上所描述的装置实施例仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种用于转换PDF文档的方法,其特征在于,包括:
基于待转换处理的html页面,确定所述html页面对应的dom元素;
将所述dom元素转换为html画布元素;
将所述html画布元素转换为待转换图片;
判断所述待转换图片是否需要进行分页处理;
依据判断结果对所述待转换图片进行PDF转换处理,得到PDF文档。
2.权利要求1所述的方法,其特征在于,所述判断所述待转换图片是否需要进行分页处理的步骤,包括:
确定所述待转换图片的图片尺寸;
依据所述图片尺寸和预设的打印尺寸,判断所述待转换图片是否需要进行分页处理。
3.权利要求2所述的方法,其特征在于,所述依据判断结果对所述待转换图片进行PDF转换处理的步骤,包括:
若所述图片尺寸大于所述打印尺寸,则将所述待转换图片分割为多个子图片;
依据多个所述子图片,生成多个PDF分页;
将多个所述PDF分页合并处理为所述PDF文档。
4.权利要求3所述的方法,其特征在于,所述依据多个所述子图片,生成多个PDF分页的步骤,包括:
基于所述dom元素,确定所述html页面的页头和页尾;
将所述页头和所述页尾插入至多个所述PDF分页。
5.权利要求1所述的方法,其特征在于,所述基于待转换处理的html页面,确定html画布元素的步骤之前,所述方法还包括:
基于预设的PDF转换用户界面,确定多个网页页面;
依据多个所述网页页面,确定所选定的至少一个所述html页面。
6.权利要求1所述的方法,其特征在于,所述将所述html画布元素转换为待转换图片的步骤,包括:
基于预定的图片分辨率,将所述html画布元素转换为所述待转换图片。
7.权利要求1所述的方法,其特征在于,所述方法还包括:
将所述PDF文档通过预设的用户界面进行显示处理。
8.一种用于转换PDF文档的装置,其特征在于,包括:
页面元素确定模块,用于基于待转换处理的html页面,确定所述html页面对应的dom元素;
画布转换处理模块,用于将所述dom元素转换为html画布元素;
图片转换处理模块,用于将所述html画布元素转换为待转换图片;
图片分页判断模块,用于判断所述待转换图片是否需要进行分页处理;
文档转换处理模块,用于依据判断结果,将所述待转换图片转换为PDF文档。
9.一种终端,包括:存储器、处理器及存储在该存储器上并可在该处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要1至7中任一项所述的方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1至7中任一项所述的方法。
CN202010614793.1A 2020-06-30 2020-06-30 用于转换pdf文档的方法、装置、终端及介质 Pending CN111859865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010614793.1A CN111859865A (zh) 2020-06-30 2020-06-30 用于转换pdf文档的方法、装置、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010614793.1A CN111859865A (zh) 2020-06-30 2020-06-30 用于转换pdf文档的方法、装置、终端及介质

Publications (1)

Publication Number Publication Date
CN111859865A true CN111859865A (zh) 2020-10-30

Family

ID=72989182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010614793.1A Pending CN111859865A (zh) 2020-06-30 2020-06-30 用于转换pdf文档的方法、装置、终端及介质

Country Status (1)

Country Link
CN (1) CN111859865A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112558894A (zh) * 2020-12-23 2021-03-26 广州鼎甲计算机科技有限公司 基于canvas的动态网页打印方法、系统及存储介质
CN112764642A (zh) * 2020-12-31 2021-05-07 达而观数据(成都)有限公司 一种基于Canvas技术的通用文档标注方法及系统
CN113627126A (zh) * 2021-08-09 2021-11-09 平安医疗健康管理股份有限公司 基于网站语言的pdf文件生成方法、装置、设备及存储介质
CN117591766A (zh) * 2024-01-18 2024-02-23 成都怡康科技有限公司 一种将网页转为可分页的pdf的方法
CN112613277B (zh) * 2020-12-09 2024-05-28 万兴科技(湖南)有限公司 Pdf文档转成dxf文档的方法、系统及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354700A (zh) * 2016-08-11 2017-01-25 广州爱九游信息技术有限公司 页面文本转换方法及系统
US9727293B1 (en) * 2010-12-21 2017-08-08 Amazon Technologies, Inc. Method and apparatus for paginating electronic documents
CN110674437A (zh) * 2019-08-12 2020-01-10 深圳点猫科技有限公司 网页页面数据转换成pdf附件的方法与装置
CN111159594A (zh) * 2019-12-24 2020-05-15 深圳市优必选科技股份有限公司 信息处理方法、信息处理装置及终端设备
CN111309671A (zh) * 2019-12-04 2020-06-19 珠海派诺科技股份有限公司 一种web报表导出PDF的方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9727293B1 (en) * 2010-12-21 2017-08-08 Amazon Technologies, Inc. Method and apparatus for paginating electronic documents
CN106354700A (zh) * 2016-08-11 2017-01-25 广州爱九游信息技术有限公司 页面文本转换方法及系统
CN110674437A (zh) * 2019-08-12 2020-01-10 深圳点猫科技有限公司 网页页面数据转换成pdf附件的方法与装置
CN111309671A (zh) * 2019-12-04 2020-06-19 珠海派诺科技股份有限公司 一种web报表导出PDF的方法、装置及存储介质
CN111159594A (zh) * 2019-12-24 2020-05-15 深圳市优必选科技股份有限公司 信息处理方法、信息处理装置及终端设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112613277B (zh) * 2020-12-09 2024-05-28 万兴科技(湖南)有限公司 Pdf文档转成dxf文档的方法、系统及存储介质
CN112558894A (zh) * 2020-12-23 2021-03-26 广州鼎甲计算机科技有限公司 基于canvas的动态网页打印方法、系统及存储介质
CN112764642A (zh) * 2020-12-31 2021-05-07 达而观数据(成都)有限公司 一种基于Canvas技术的通用文档标注方法及系统
CN112764642B (zh) * 2020-12-31 2022-11-29 达而观数据(成都)有限公司 一种基于Canvas技术的通用文档标注方法及系统
CN113627126A (zh) * 2021-08-09 2021-11-09 平安医疗健康管理股份有限公司 基于网站语言的pdf文件生成方法、装置、设备及存储介质
CN117591766A (zh) * 2024-01-18 2024-02-23 成都怡康科技有限公司 一种将网页转为可分页的pdf的方法
CN117591766B (zh) * 2024-01-18 2024-04-30 成都怡康科技有限公司 一种将网页转为可分页的pdf的方法

Similar Documents

Publication Publication Date Title
CN111859865A (zh) 用于转换pdf文档的方法、装置、终端及介质
US20210256253A1 (en) Method and apparatus of image-to-document conversion based on ocr, device, and readable storage medium
CN110069767B (zh) 基于电子书的排版方法、电子设备及计算机存储介质
US8515176B1 (en) Identification of text-block frames
KR101955732B1 (ko) 캡처된 이미지 데이터를 스프레드시트와 연관시키는 방법
CN104834645B (zh) 用于展示版式文档的方法和装置
US9734132B1 (en) Alignment and reflow of displayed character images
CN104050185A (zh) 一种页面内容缩放显示处理方法及装置
CN103268185A (zh) 电子书阅读器的文本显示方法及装置
JP5789719B2 (ja) 電子文書の表示モードを確定するための方法と装置
US8248665B2 (en) Information processing device, printing device, information processing system, method, computer-readable medium, and computer data signal
CN115543238B (zh) 一种浏览器页面打印方法、装置、设备及存储介质
CN116402020A (zh) 基于ofd文档的签名图像化处理方法、系统和存储介质
CN109582934B (zh) 版式文档的转换方法及装置
US9218327B2 (en) Optimizing the layout of electronic documents by reducing presentation size of content within document sections so that when combined a plurality of document sections fit within a page
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
CN116778032B (zh) 答题卡生成方法、装置、设备和存储介质
JPH08129550A (ja) 画像処理装置および画像処理方法
CN113655973B (zh) 页面分割方法、装置、电子设备及存储介质
WO2022063191A1 (zh) 电子书手写笔记的显示方法、计算设备及计算机存储介质
CN113011131B (zh) 基于图片类电子书的排版方法、电子设备及存储介质
US8705871B2 (en) Form image managing system and method
US9692936B2 (en) Image processing apparatus and image processing method for clipping, from a second image, an area at a position corresponding to designated position in a first image
CN117291152A (zh) 表格的提取方法和装置
CN112365402B (zh) 智能组卷方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination