CN111476019B - 一种基于表格数据一键成书的自动排版方法 - Google Patents

一种基于表格数据一键成书的自动排版方法 Download PDF

Info

Publication number
CN111476019B
CN111476019B CN202010268756.XA CN202010268756A CN111476019B CN 111476019 B CN111476019 B CN 111476019B CN 202010268756 A CN202010268756 A CN 202010268756A CN 111476019 B CN111476019 B CN 111476019B
Authority
CN
China
Prior art keywords
data
page
typesetting
book
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010268756.XA
Other languages
English (en)
Other versions
CN111476019A (zh
Inventor
李航
潘俊熹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming Ranks Technology Co ltd
Original Assignee
Kunming Ranks Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming Ranks Technology Co ltd filed Critical Kunming Ranks Technology Co ltd
Priority to CN202010268756.XA priority Critical patent/CN111476019B/zh
Publication of CN111476019A publication Critical patent/CN111476019A/zh
Application granted granted Critical
Publication of CN111476019B publication Critical patent/CN111476019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明涉及印刷排版技术领域,具体涉及一种基于表格数据一键成书的自动排版方法;采用的技术方案是:期刊格式设定,EXCEL数据表格导入,系统数据处理并生成PDF文档,校对内容,数据修改,排版,本发明所述方法实施后修改方便,当所有PDF生成完成后,数据需要修改时只需修改当前版面内容,其他版面不变不需要再次生成,节省了时间与程序的算力,成书为矢量图SVG文件,精度提高带来了用户体验的提升,自动生成书籍目录,提高了排版效率,书籍数据为html文件,电子书后期的翻页特效,放大缩小,双页呈现等功能均可实现,书籍模板可完全自定义,支持书籍/期刊的多样化的创造性的设计。

Description

一种基于表格数据一键成书的自动排版方法
技术领域
本发明涉及印刷排版技术领域,具体涉及一种基于表格数据一键成书的自动排版方法。
背景技术
随着印刷技术的发展,现在印刷设备功能越来越强大,印刷成本大大降低,这使得出书对于普通大众来说变得比较容易实现,但是现在存在一个难以解决的问题,那就是排版问题,现在的排版基本还是依赖于人工排版方式,对于一些教材目前有了相对简单的一些模版化方式,但是随着印刷内容的越来越多样化,对于排版的要求越来越高,不再是简单的文字与图形的组合,越来越多的元素和个性化格式需要排版技术随之改进提高。特别是对于一些excel等表格的排版要求更高,在这种情况下就更加需要一种便捷的智能化排版工具出现。
如专利号为CN2014102799860《一种基于自动排版的一键成书方法》,采取以下方式进行设计“步骤一、选择书本尺寸;步骤二、设置排版约束条件;步骤三、判断每一条数据是否均已生成排版数据;步骤四、判断该条数据是否已经排版完,步骤五、判断该条数据图片是否已经排完;步骤六、该尺寸书本相应的板式中最多的图片张数记为n,当前待排数据的图片张数记为m,n和m中的最小值记为1,分别使用前1,2,3,...,1张图、文字待定以及使用含相应张数图片的所有板式,排一页;步骤七、使用当前待排数据的待定文字以及纯文本的所有板式,排一页;步骤八、对步骤六或步骤七中产生的所有一页排法数据进行综合评估,优选出最优的一页排法;步骤九:取出优选并保存的所有页排版数据进行处理渲染预览。”可见,上述方式是基于常规书籍的尺寸来预先定义布局,并设定好辅助规则来根据版面编辑对象的位置、尺寸和属性,自动形成页面布局,将每一页数据生成图片,然后合并生成PDF文件。
该种排版方式存在以下问题:
1)没有修改功能,在使用现有技术生成书籍后,当人工校对内容发现文字错误需要局部修改时,无法进行修改。使用者只能修改原始数据文件后,重新上传新数据再次生成。造成此问题的原因是现有技术是一次性导入需要排版的数据,再基于此数据一次性生成了排版数据,此过程是不可逆的;
2)现有系统生成的书籍数据为图片格式,并将每一页图片合并生成PDF文件,图片格式无法进行高精度印刷;
3)无法实现基于标题的书籍目录的自动生成,也没有页码的自动处理,不太符合常规书籍/期刊的排版方式;
4)数据的初次导入是基于word文件,无法从excel文件中读取数据;
5)此技术生成的基于图片的PDF文件,制作的电子书文件较大,会占用较大的磁盘空间,且电子书在打开的过程中会较慢;
6)基于书籍的尺寸来预设成书样式,比较呆板,无法处理页眉、页脚、侧边栏等细节,无法支持个性化、非常规的书籍或期刊版式及样式的需求,每次变更页面版需要调整代码。
发明内容
本发明的目的是提供一种方便修改、排版效果好、方便读取、模块化的自动排版方法。
为实现上述目的,本发明采用的技术方案是:一种基于表格数据一键成书的自动排版方法,包括以下步骤:
(1)期刊格式设定:确定排版信息,内容包括起始页码、书名、期刊时间、期刊数、选择期刊模版、封面封底内容、目录内容;
(2)EXCEL数据表格导入:上传导入Excel数据,用PHP读取数据,从Excel中按照行数依次读取,将读取后的数据进行json encode编码,存入Mysql数据库,重复此项动作,直至Excel数据为空;
(3)系统数据处理并生成PDF文档:
(4)校对内容:采用人工校对方式进行内容校对;
(5)数据修改:校对完后如果根据需要进行数据修改,修改完成后重新生成当前页PDF,并完成二次校对;
(6)排版:node.js启动无头浏览器,向webkit无头浏览器中放入模版,开始按照单页方式一页一页进行数据处理,其具体方式为读取未排版的100行数据,读取成功后利用vue和js将数据预处理,进行单元格合并,调整字号,将数据全部放入模版,webkit内核自动计算版面,等待页面成型,检查输出内容是否超出版面,如果未超出则提交每行数据所属页码到数据库中存储,并生成本页PDF,此时完成第一页排版工作,此后重复上述方式进行第一页之后的页面内容的排版。
进一步的,所述步骤(2)中用PHP读取数据时,其具体操作方式为:从Excel中获得第一行数据,并判断是否为表头或者标题,如果是的话将读取后的数据进行json encode编码,存入Mysql数据库,之后将本行数据删除,将下一行数据移动到第一行,如果不是的话判断是否需要插入空行或者标题,在此时如果需要插入空行或者标题的话则插入空行或者标题,如果不需要的话PHP替换符号为英文符号,规定数字和单位不能换行。
进一步的,所述步骤(6)中如果读取数据失败的话,按照以下方式进行处理,利用Python合并所有PDF,人工校对是否需要修改,如果需要的话找出需要修改的数据并进行修改,然后手动生成当页PDF。
本发明的有益技术效果是:
1)当所有PDF生成完成后,数据需要修改时只需修改当前版面内容,其他版面不变不需要再次生成,节省了时间与程序的算力;
2)成书为矢量图SVG文件,无论是做电子书,还是印刷的清晰度都较高,在现阶段2K\3K\4K显示屏中均能高清显示,从而带来了用户体验的提升;
3)本技术将书籍的目录生成也从手工操作带到了自动化时代,提高了排版效率;
4)书籍数据为html文件,电子书后期的翻页特效,放大缩小,双页呈现等功能均可实现;
5)书籍模板可完全自定义,只要能设计出来的样式,只要是浏览器能够显示的页面均可生成PDF,支持书籍/期刊的多样化的创造性的设计。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明总体流程图;
图2为本发明中“EXCEL数据表格导入”流程图;
图3为本发明中“排版”流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参见附图1-3,本发明一种基于表格数据一键成书的自动排版方法,包括以下步骤:
(1)期刊格式设定:确定排版信息,内容包括起始页码、书名、期刊时间、期刊数、选择期刊模版、封面封底内容、目录内容;
(2)EXCEL数据表格导入:上传导入Excel数据,用PHP读取数据,从Excel中按照行数依次读取,将读取后的数据进行json encode编码,存入Mysql数据库,重复此项动作,直至Excel数据为空,其中用PHP读取数据时,其具体操作方式为:从Excel中获得第一行数据,并判断是否为表头或者标题,如果是的话将读取后的数据进行json encode编码,存入Mysql数据库,之后将本行数据删除,将下一行数据移动到第一行,如果不是的话判断是否需要插入空行或者标题,在此时如果需要插入空行或者标题的话则插入空行或者标题,如果不需要的话PHP替换符号为英文符号,规定数字和单位不能换行;
(3)系统数据处理并生成PDF文档:
(4)校对内容:采用人工校对方式进行内容校对;
(5)数据修改:校对完后如果根据需要进行数据修改,修改完成后重新生成当前页PDF,并完成二次校对;
(6)排版:node.js启动无头浏览器,向webkit无头浏览器中放入模版,开始按照单页方式一页一页进行数据处理,其具体方式为读取未排版的100行数据,读取成功后利用vue和js将数据预处理,进行单元格合并,调整字号,将数据全部放入模版,webkit内核自动计算版面,等待页面成型,检查输出内容是否超出版面,如果未超出则提交每行数据所属页码到数据库中存储,并生成本页PDF,此时完成第一页排版工作,此后重复上述方式进行第一页之后的页面内容的排版,该步骤中如果读取数据失败的话,按照以下方式进行处理,利用Python合并所有PDF,人工校对是否需要修改,如果需要的话找出需要修改的数据并进行修改,然后手动生成当页PDF。
实施例2
参见附图1-3,本发明一种基于表格数据一键成书的自动排版方法,包括以下步骤:
(1)期刊格式设定:确定排版信息,内容包括起始页码、书名、期刊时间、期刊数、选择期刊模版、封面封底内容、目录内容;
(2)EXCEL数据表格导入:上传导入Excel数据,用PHP读取数据,从Excel中获得第一行数据,判断是否为表头或者标题,如果是则将数据编码json encode存入Mysql数据库,之后将本行数据删除,将下一行移动到第一行,之后判断数据是否为空,如果不为空的话,用用PHP读取数据,从Excel中获得第一行数据,判断是否为表头或者标题,如果是则将数据编码json encode存入Mysql数据库,之后将本行数据删除,将下一行移动到第一行,并重复该步骤,直到数据为空,表明数据录入完成,此时生成PDF,如果从Excel中获得第一行数据,判断是否为表头或者标题时,如果为否的话判断是否需要插入标题空行,需要的话即时插入空行和标题,之后PHP替换符号为英文符号,并规定数字和不能换行,之后将数据编码json encode存入Mysql数据库,之后将本行数据删除,将下一行移动到第一行,并重复该步骤,直到数据为空;
(3)系统数据处理并生成PDF文档:
(4)校对内容:采用人工校对方式进行内容校对;
(5)数据修改:校对完后如果根据需要进行数据修改,修改完成后重新生成当前页PDF,并完成二次校对;
(6)排版:node.js启动无头浏览器,向webkit无头浏览器中放入模版,开始按照单页方式一页一页进行数据处理,其具体方式为读取未排版的100行数据,读取成功后利用vue和js将数据预处理,进行单元格合并,调整字号,将数据全部放入模版,webkit内核自动计算版面,等待页面成型,检查输出内容是否超出版面,如果未超出则提交每行数据所属页码到数据库中存储,并生成本页PDF,此时完成第一页排版工作,此后重复上述方式进行第一页之后的页面内容的排版,该步骤中如果读取数据失败的话,按照以下方式进行处理,利用Python合并所有PDF,人工校对是否需要修改,如果需要的话找出需要修改的数据并进行修改,然后手动生成当页PDF。
本发明中采用全新的逻辑框架,在步骤(1)中将格式根据要求进行了详细的分解,该格式分解针对常见期刊格式进行了自定义,这种分解方式与其后的处理步骤形成了优化对应关系,使得其后的操作步骤可以更加独立,修改更加灵活;步骤(2)中采用EXCEL数据进行导入,针对该中数据方式,优化采用了PHP方式读取,并且读取数据时采用行为其执行标准,使数据的分散化更加优化,使得最后当所有PDF生成完成后,数据需要修改时只需修改当前版面内容,其他版面不变不需要再次生成,节省了时间与程序的算力,该方法排版形成的页面校对修改方便,更加人性化,并且形成的文档清晰易浏览,在步骤(6)排版环节,采用无头浏览器排版,只要能设计出来的样式,只要是浏览器能够显示的页面均可生成PDF,支持书籍/期刊的多样化的创造性的设计,排版后书籍数据为html文件,电子书后期的翻页特效,放大缩小,双页呈现等功能均可实现,本发明采用的方法最终成书为矢量图SVG文件,无论是做电子书,还是印刷的清晰度都较高,在现阶段2K\3K\4K显示屏中均能高清显示,从而带来了用户体验的提升,本发明将书籍的目录生成也从手工操作带到了自动化时代,提高了排版效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于表格数据一键成书的自动排版方法,其特征在于,包括以下步骤:
(1)期刊格式设定:确定排版信息,内容包括起始页码、书名、期刊时间、期刊数、选择期刊模版、封面封底内容、目录内容;
(2)EXCEL数据表格导入:上传导入Excel数据,用PHP读取数据,从Excel中按照行数依次读取,将读取后的数据进行json encode编码,存入Mysql数据库,重复此项动作,直至Excel数据为空;
(3)系统数据处理并生成PDF文档;
(4)校对内容:采用人工校对方式进行内容校对;
(5)数据修改:校对完后根据需要进行数据修改,修改完成后重新生成当前页PDF,并完成二次校对;
(6)排版:node.js启动无头浏览器,向webkit无头浏览器中放入模版,开始按照单页方式一页一页进行数据处理,其具体方式为读取未排版的100行数据,读取成功后利用vue和js将数据预处理,进行单元格合并,调整字号,将数据全部放入模版,webkit内核自动计算版面,等待页面成型,检查输出内容是否超出版面,如果未超出则提交每行数据所属页码到数据库中存储,并生成本页PDF,此时完成第一页排版工作,此后重复上述方式进行第一页之后的页面内容的排版,所述重复上述方式具体指“读取未排版的100行数据,读取成功后利用vue和js将数据预处理,进行单元格合并,调整字号,将数据全部放入模版,webkit内核自动计算版面,等待页面成型,检查输出内容是否超出版面,如果未超出则提交每行数据所属页码到数据库中存储,并生成本页PDF”。
2.根据权利要求1所述的一种基于表格数据一键成书的自动排版方法,其特征在于,所述步骤(2)中用PHP读取数据时,其具体操作方式为:从Excel中获得第一行数据,并判断是否为表头或者标题,如果是的话将读取后的数据进行json encode编码,存入Mysql数据库,之后将本行数据删除,将下一行数据移动到第一行,如果不是的话判断是否需要插入空行或者标题,在此时如果需要插入空行或者标题的话则插入空行或者标题,如果不需要的话PHP替换符号为英文符号,规定数字和单位不能换行。
3.根据权利要求1所述的一种基于表格数据一键成书的自动排版方法,其特征在于,所述步骤(6)中如果读取数据失败的话,按照以下方式进行处理,利用Python合并所有PDF,人工校对是否需要修改,如果需要的话找出需要修改的数据并进行修改,然后手动生成当页PDF。
CN202010268756.XA 2020-04-08 2020-04-08 一种基于表格数据一键成书的自动排版方法 Active CN111476019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010268756.XA CN111476019B (zh) 2020-04-08 2020-04-08 一种基于表格数据一键成书的自动排版方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010268756.XA CN111476019B (zh) 2020-04-08 2020-04-08 一种基于表格数据一键成书的自动排版方法

Publications (2)

Publication Number Publication Date
CN111476019A CN111476019A (zh) 2020-07-31
CN111476019B true CN111476019B (zh) 2023-04-07

Family

ID=71750680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010268756.XA Active CN111476019B (zh) 2020-04-08 2020-04-08 一种基于表格数据一键成书的自动排版方法

Country Status (1)

Country Link
CN (1) CN111476019B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1541362A (zh) * 2002-04-17 2004-10-27 ��ʽ������Ϣ���� WebJINS各种信息刊物自动编辑系统
CN1936882A (zh) * 2006-10-13 2007-03-28 北京北大方正电子有限公司 一种分页表格的数据处理方法及系统
CN104239284A (zh) * 2014-09-15 2014-12-24 广州市西美信息科技有限公司 一种图文自动排版的方法和装置
CN105045776A (zh) * 2015-09-07 2015-11-11 武汉大学 一种页面自动排版方法
CN110969004A (zh) * 2019-12-16 2020-04-07 方正株式(武汉)科技开发有限公司 图文自动排版方法及系统、服务器及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120290601A1 (en) * 2007-11-15 2012-11-15 Master Wave International Co., Ltd. Image-based Data Management Method and System

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1541362A (zh) * 2002-04-17 2004-10-27 ��ʽ������Ϣ���� WebJINS各种信息刊物自动编辑系统
CN1936882A (zh) * 2006-10-13 2007-03-28 北京北大方正电子有限公司 一种分页表格的数据处理方法及系统
CN104239284A (zh) * 2014-09-15 2014-12-24 广州市西美信息科技有限公司 一种图文自动排版的方法和装置
CN105045776A (zh) * 2015-09-07 2015-11-11 武汉大学 一种页面自动排版方法
CN110969004A (zh) * 2019-12-16 2020-04-07 方正株式(武汉)科技开发有限公司 图文自动排版方法及系统、服务器及介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
992被用了.浏览器中的排版方案.《https://blog.csdn.net/qq_39958585/article/details/100601467?ops_request_misc=&request_id=&biz_id=102&utm_term=%E8%87%AA%E5%8A%A8%E6%8E%92%E7%89%88%20%20%E6%A8%A1%E6%9D%BF%20%E6%B5%8F%E8%A7%88%E5%99%A8&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-7-100601467.142^v73^pc_new_rank,201^v4^add_ask,239^v2^insert_chatgpt&spm=1018.2226.3001.4187》.2019,1-2页. *
VB控制Excel及CorelDRAW实现新生信息的自动排版.《电脑学习》.2007,52-53,55. *
weixin_42195476. HMI报表设计与打印,标签、账单、支票、条码数据打印与出版VC++源码解决方案2018!.《https://blog.csdn.net/weixin_42195476/article/details/80595800?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522167806890616800213073157%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=167806890616800213073157&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~first_rank_ecpm_v1~pc_rank_34-6-80595800-null-null.142^v73^pc_new_rank,201^v4^add_ask,239^v2^insert_chatgpt&utm_term=%E8%87%AA%E5%8A%A8%E6%89%93%E5%8D%B0%E6%8E%92%E7%89%88%20%20%E6%A8%A1%E6%9D%BF%20%E6%B5%8F%E8%A7%88%E5%99%A8%20%E8%AF%BB%E5%8F%96%E6%95%B0%E6%8D%AE&spm=1018.2226.3001.4187》.2018,1-10. *
杨倩晨,朱景锋.基于XML的文档自动排版技术.《2012 2nd International Conference on Applied Social Science》.2012,365-371. *

Also Published As

Publication number Publication date
CN111476019A (zh) 2020-07-31

Similar Documents

Publication Publication Date Title
CN109857670B (zh) 一种基于通用模板的测试报告自动生成方法
CN111507073A (zh) 一种基于web富文本的论文编辑与智能排版方法及平台
US11934774B2 (en) Systems and methods for generating social assets from electronic publications
Kottwitz LaTeX beginner's guide
Pierazzo Digital Genetic Editions: The Encoding of Time in Manuscript Transcription 1
JP2011141749A (ja) 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
CN112433995B (zh) 文件格式转换方法、系统、计算机设备及存储介质
CN111476019B (zh) 一种基于表格数据一键成书的自动排版方法
CN102103586B (zh) 一种多语种双向混排字幕的编辑系统
CN111126007B (zh) 一种基于html病历文书分页算法
CN113011129A (zh) 一种通用doc和docx及indd文档排版引擎及方法
US11775733B2 (en) Device dependent rendering of PDF content including multiple articles and a table of contents
US11842141B2 (en) Device dependent rendering of PDF content
CN106776489B (zh) 显示设备的电子文档显示方法和系统
JP3115059B2 (ja) 構造化文書編集方法
CN118194883B9 (zh) 基于机器翻译的文献版式还原方法及装置
JP7003457B2 (ja) 文書再構成装置
CN117236282B (zh) 基于xml数据的智能排版方法、装置、终端及介质
EP4386615A1 (en) Method and system for improving immersive reading of electronic documents
CN102104740B (zh) 一种多语种字幕的混排方法及装置
CN116050360A (zh) Pdf表单文件的快速制作方法及其设备
CN118690732A (zh) Pdf文件批量添加批注的方法、装置、介质及电子设备
WO2024127249A1 (en) Method and system for improving immersive reading of electronic documents
JPH0778800B2 (ja) 文書処理装置
CN114417795A (zh) 一种数据粘贴方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant