CN105183708A - 一种基于微博内容的书籍制作方法及系统 - Google Patents

一种基于微博内容的书籍制作方法及系统 Download PDF

Info

Publication number
CN105183708A
CN105183708A CN201410247149.XA CN201410247149A CN105183708A CN 105183708 A CN105183708 A CN 105183708A CN 201410247149 A CN201410247149 A CN 201410247149A CN 105183708 A CN105183708 A CN 105183708A
Authority
CN
China
Prior art keywords
microblog
content
editing area
metadata information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410247149.XA
Other languages
English (en)
Inventor
朱岩
戴楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO LTD
Peking University Founder Information Industry Group Co Ltd
Peking University Founder Group Co Ltd
Original Assignee
FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO LTD
Peking University Founder Information Industry Group Co Ltd
Peking University Founder Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO LTD, Peking University Founder Information Industry Group Co Ltd, Peking University Founder Group Co Ltd filed Critical FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO LTD
Priority to CN201410247149.XA priority Critical patent/CN105183708A/zh
Publication of CN105183708A publication Critical patent/CN105183708A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种基于微博内容的书籍制作方法及系统,其中,该方法包括:从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所述书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;将所述SVG文件转换为PDF文件,完成书籍制作。本发明的方案采用对需要排版的微博内容元数据信息进行自动排版过程,提高了书籍制作质量以及书籍的制作效率。

Description

一种基于微博内容的书籍制作方法及系统
技术领域
本发明涉及图文编排领域,特别是设计一种基于微博内容的书籍制作方法及系统。
背景技术
随着科技的发展和互联网的普及,大量个性化印品陆续出现,如:个性定制相册、明信片、照片书等等;同时大量的在线定制个性化印品的网站也纷纷出现,国外的如快门网shutterfly等,国内如网易印象派、我的相册网等。也有大量用户开始使用相关产品。常用的在线编辑系统通常都需要让用户逐个图片进行编排,这产生了大量的编排成本:用户需要在成百上千张照片中选择自己需要的照片,并逐一放入编辑系统中再配以文字、装饰等效果进行个性印品的设计和制作;此类制作动辄需要几小时,在很大程度上限制了用户的使用体验。对于互联网中有大量的内容网站,如微博,若用户想要导入成书,则更为麻烦:一个用户的微博可能有上万条甚至几十万几百万条,普通用户对这些内容的编排几乎是人力不能及。
发明内容
本发明的目的是提供一种基于微博内容的书籍制作方法及系统,可以解决当前制作书籍或者个性化印品时需手动排版,效率低下的问题。
为了解决上述技术问题,本发明的实施例提供一种基于微博内容的书籍制作方法,其中,包括:
从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;
根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所述书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;
将所述SVG文件转换为PDF文件,完成书籍制作。
其中,所述排版包括:
步骤a,获取所述书籍一页面对应的可编辑区域信息;
步骤b,根据所述发布微博的时间,依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面可编辑区域的高度方向,由当前页面可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
步骤c,获取下一相邻页面对应的可编辑区域信息;
步骤d,根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面可编辑区域的高度方向,由当前页面可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
步骤e,重复步骤c至步骤d至所述获取的多组微博内容元数据信息全部排完;
其中,所述可编辑区域信息包括当前页面可编辑区域的高度值以及宽度值;所述至少一组微博内容元数据信息占用当前页面可编辑区域的高度值之和小于或者等于当前页面可编辑区域的高度值。
其中,在所述步骤e之后还包括:
步骤f:获取所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息集合S=(S1、S2…Si…Sj),其中,Si是第i组微博内容元数据信息,Sj是第j组微博内容元数据信息;i、j的取值均为正整数,且j大于i;且所述j的取值为所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息的组数值;
步骤g:根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj;其中,所述值域Hi=T(Si,E),所述值域Hj=T(Sj,E);其中,所述E为美观度熵,且E的初始值为1;
步骤h:获取所述值域Hi和所述值域Hj投影在所述值域Hi对应的序列和所述值域Hj对应的序列所处的同一相交维度上的投影的欧氏距离D,即其中,n为所述值域Hi对应的序列和所述值域Hj对应的序列在同一相交维度上的维度数,即值域中元素的个数;x为所述值域Hi所投影的线段的各自距离彼此最近的点,y为所述值域Hj所投影的线段的各自距离彼此最近的点,xi为x点在i维度上的值,yi表示y点在i维度上的值;
步骤i:获取所述集合S中所有D值,并根据公式计算出标准差值;其中,所述SD即为标准差值;N为所述所有D值的总数;μ为所述所有D值的平均值;Di为所述所有D值中第i个D值;
步骤k:将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值;
步骤l:重复步骤g至步骤k至少2次后,获得各页中的微博内容元数据信息之间的距离,根据所获得的距离,重新调整各个微博内容元数据信息的位置。
其中,所述步骤b和所述步骤d分别包括获取各组微博内容元数据信息占用对应页面可编辑区域的高度值的步骤;其中,所述获取各组微博内容元数据信息占用对应页面可编辑区域的高度值的步骤包括:
若所述微博内容元数据信息为微博图片信息,则将所述图片的高度值h作为所述微博内容元数据信息占用所述可编辑区域的高度值h;或
若所述微博内容元数据信息指示为微博文字信息,根据所述可编辑区域的宽度值以及所述可编辑区域预定的每个字符占用所述可编辑区域的宽度值以及所述文字信息中字符的个数,获取所述文字信息在所述可编辑区域的行数l,并根据所述可编辑区域预定的行高h1,获取所述文字信息占用所述可编辑区域的高度值h;其中,所述h=l×h1;所述微博内容元数据信息占用所述可编辑区域的高度值h为所述文字信息占用所述可编辑区域的高度值h;或者
若所述微博内容源数据信息为微博文字信息和与所述微博文字信息对应的微博图片信息,分别获取所述微博文字信息占用所述可编辑区域的高度值h2以及与所述微博文字信息对应的微博图片信息占用所述可编辑区域的高度值h3,则所述微博内容元数据信息占用所述可编辑区域的高度值h为所述h2和所述h3之和。
为了更好地解决上述技术问题,本发明的实施例还提供一种基于微博内容的书籍制作系统,其中,包括:
获取模块,用于从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;
排版模块,用于根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;;
完成模块,用于将所述SVG文件转换为PDF文件,完成书籍制作。
其中,所述排版模块包括:
第一获取子模块,用于获取所述书籍一页面对应的可编辑区域信息;
第一排版子模块,用于根据所述发布微博的时间,依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
第二获取子模块,用于获取下一相邻页面对应的可编辑区域信息;
第二排版子模块,用于根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿所述可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
循环子模块,用于重复执行获取下一相邻页面对应的可编辑区域信息的步骤至根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成的步骤,直至所述获取的多组微博内容元数据信息全部排完;
其中,所述可编辑区域信息包括当前页面可编辑区域的高度值以及宽度值;所述至少一组微博内容元数据信息占用当前页面可编辑区域的高度值之和小于或者等于当前页面可编辑区域的高度值。
其中,所述系统还包括:
第三获取子模块,用于获取所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息集合S=(S1、S2…Si…Sj),其中,Si是第i组微博内容元数据信息,Sj是第j组微博内容元数据信息;i、j的取值均为正整数,且j大于i;且所述j的取值为所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息的组数值;
第四获取子模块,用于根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj;其中,所述值域Hi=T(Si,E),所述值域Hj=T(Sj,E);其中,所述E为美观度熵,且E的初始值为1;
第五获取子模块,用于获取所述值域Hi和所述值域Hj投影在所述值域Hi对应的序列和所述值域HJ对应的序列所处的同一相交维度上的投影的欧氏距离D,即其中,n为所述值域Hi对应的序列和所述值域Hj对应的序列在同一相交维度上的维度数,即值域中元素的个数;x为所述值域Hi所投影的线段的各自距离彼此最近的点,y为所述值域Hj所投影的线段的各自距离彼此最近的点,xi为x点在i维度上的值,yi表示y点在i维度上的值;
第六获取子模块,用于获取所述集合S中所有D值,并根据公式计算出标准差值;其中,所述SD即为标准差值;N为所述所有D值的总数;μ为所述所有D值的平均值;Di为所述所有D值中第i个D值;
第七获取子模块,用于将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值;
调整子模块,用于重复根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj的步骤至将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值的步骤至少2次后,获得各页中的微博内容元数据信息之间的距离,根据所获得的距离,重新调整各个微博内容元数据信息的位置。
其中,所述第一排板子模块和所述第二排板子模块分别包括获取单元;其中,所述获取单元包括:
第一获取子单元,用于在若所述微博内容元数据信息为微博图片信息时,则将所述图片的高度值h作为所述微博内容元数据信息占用所述可编辑区域的高度值h;或
第二获取子单元,用于在若所述微博内容元数据信息指示为微博文字信息时,根据所述可编辑区域的宽度值以及所述可编辑区域预定的每个字符占用所述可编辑区域的宽度值以及所述文字信息中字符的个数,获取所述文字信息在所述可编辑区域的行数l,并根据所述可编辑区域预定的行高h1,获取所述文字信息占用所述可编辑区域的高度值h;其中,所述h=l×h1;所述微博内容元数据信息占用所述可编辑区域的高度值h为所述文字信息占用所述可编辑区域的高度值h;或者
第三获取子单元,用于在若所述微博内容源数据信息为微博文字信息和与所述微博文字信息对应的微博图片信息时,分别获取所述微博文字信息占用所述可编辑区域的高度值h2以及与所述微博文字信息对应的微博图片信息占用所述可编辑区域的高度值h3,则所述微博内容元数据信息占用所述可编辑区域的高度值h为所述h2和所述h3之和。
本发明的有益效果如下:
本发明的基于微博内容的书籍制作方法及系统,采用对需要排版的微博内容元数据信息进行自动排版过程,提高了书籍制作质量以及书籍的制作效率。
附图说明
图1表示本发明的基于微博内容的书籍制作方法流程示意图;
图2表示本发明的基于微博内容的书籍制作方法中对多组微博内容元数据信息进行排版的流程示意图;
图3表示本发明的基于微博内容的书籍制作方法中对排版完成后的多组微博内容元数据信息进行调整的流程示意图;
图4表示本发明的基于微博内容的书籍制作系统结构示意图一;
图5表示图4中的排版模块的结构示意图;
图6表示本发明的基于微博内容的书籍制作系统结构示意图二;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
若自动生成书籍,则需要选择内容源,内容源的选择可以有很多,但是,我们以微博作为内容源有如下考虑:微博上存在大量的用户内容,若将微博上的内容制作成书籍,则更需要自动排版;微博上的文字和图片有天然的对应关系,更便于取材;微博上的用户数量很大,制作个性化印品的需求旺盛。
如图1所示,本发明的基于微博内容的书籍制作方法,包括:
步骤11,从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;
步骤12,根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所述书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;
步骤13,将所述SVG文件转换为便携PDF文件,完成书籍制作。
下面将结合附图以及具体的实施例,对上述各个步骤作详细说明:
上述步骤11,从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;具体为:用户选择自己的微博,授权后,通过微博的开放平台OpenApi可获得该用户的上述微博内容元数据信息,主要为:微博图片信息和/或与该微博图片信息对应的微博文字信息、发布微博的时间信息。其中,该微博图片信息,主要是用于获取该图片的统一资源定位符URL信息,用户可以根据该图片的URL信息获取图片,并将获取的图片以及与该图片对应的文字信息(或者该图片的URL信息和对应的该文字信息),以及该发布微博的时间信息保存至磁盘备用。当然,上述根据图片的URL信息获取的该图片,在下载下来以后即可获取到该图片对应的高度值。
上述步骤12,根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所述书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;其中,该书籍页面版式,在用户进入排版系统之后即可获取到一预定好的书籍页面版式,比如,各页面的页眉页脚位置,各页面的可编辑区域信息,以及装饰元素所在位置等。该多组微博内容元数据信息即在页面的可编辑区域进行排版,其中该步骤中的排版如图2所示,包括:
步骤a,获取所述书籍一页面对应的可编辑区域信息;
步骤b,根据所述发布微博的时间,依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
步骤c,获取下一相邻页面对应的可编辑区域信息;
步骤d,根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
步骤e,重复步骤c至步骤d至所述获取的多组微博内容元数据信息全部排完;
其中,所述可编辑区域信息包括当前页面可编辑区域的高度值以及宽度值;所述至少一组微博内容元数据信息占用当前页面可编辑区域的高度值之和小于或者等于当前页面可编辑区域的高度值。
上述步骤e之后如图3所示,还包括:
步骤f:获取所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息集合S=(S1、S2…Si…Sj),其中,Si是第i组微博内容元数据信息,Sj是第j组微博内容元数据信息;i、j的取值均为正整数,且j大于i;且所述j的取值为所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息的组数值;
步骤g:根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj;其中,所述值域Hi=T(Si,E),所述值域Hj=T(Sj,E);其中,所述E为美观度熵,且E的初始值为1;
步骤h:获取所述值域Hi和所述值域Hj投影在所述值域Hi对应的序列和所述值域Hj对应的序列所处的同一相交维度上的投影的欧氏距离D,即其中,n为所述值域Hi对应的序列和所述值域Hj对应的序列在同一相交维度上的维度数,即值域中元素的个数;x为所述值域Hi所投影的线段的各自距离彼此最近的点,y为所述值域Hj所投影的线段的各自距离彼此最近的点,xi为x点在i维度上的值,yi表示y点在i维度上的值;
步骤i:获取所述集合S中所有D值,并根据公式计算出标准差值;其中,所述SD即为标准差值;N为所述所有D值的总数;μ为所述所有D值的平均值;Di为所述所有D值中第i个D值;
步骤k:将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值;
步骤l:重复步骤g至步骤k至少2次后,获得各页中的微博内容元数据信息之间的距离,根据所获得的距离,重新调整各个微博内容元数据信息的位置。
其中,该步骤b和该步骤d还分别包括:获取各组微博内容元数据信息占用对应页面可编辑区域的高度值的步骤;其中,所述获取各组微博内容元数据信息占用对应页面可编辑区域的高度值的步骤包括:
若所述微博内容元数据信息为单纯的图片,则将所述图片的高度值h作为所述微博内容元数据信息占用所述可编辑区域的高度值h;或
若所述微博内容元数据信息指示为微博文字信息(纯文字信息以及与该纯文字信息对应的图片的URL地址信息或者只是纯文字信息),根据所述可编辑区域预定的每个字符占用所述可编辑区域的宽度值以及所述文字信息中字符的个数,获取所述文字信息在所述可编辑区域的行数l,并根据所述可编辑区域预定的行高h1,获取所述文字信息占用所述可编辑区域的高度值h;其中,所述h=l×h1;所述微博内容元数据信息占用所述可编辑区域的高度值h为所述文字信息占用所述可编辑区域的高度值h;举例说明,如果有一段微博文字信息为“曲曲直直的荷塘上面,弥望的是田田的叶子。叶与叶相互紧挨着,你不让我,我不让你,在月光下拥挤着。”,假设可编辑区域的宽度值为50毫米,每个字符占用可编辑区域的宽度值为3毫米,标点符号占用可编辑区域的宽度值为2毫米,则第一行的内容为“曲曲直直的荷塘上面,弥望的是田田的”,由16个字符和一个“,”标点符号组成,正好占用可编辑区域的宽度值50毫米,第二行则继续计算,得出“叶子。叶与叶相互紧挨着,你不让我,”总共占用可编辑区域的宽度值为48毫米,因为后一个字为“我“,占3毫米的位置,而本行只有50毫米-48毫米=2毫米,因此不能放下,需另起一行。整体算下,文字内容如下:
“曲曲直直的荷塘上面,弥望的是田田的
叶子。叶与叶相互紧挨着,你不让我,
我不让你,在月光下拥挤着。”
获取到上述文字信息在所述可编辑区域的行数l=3,并根据所述可编辑区域预定的行高h1,获取所述文字信息占用所述可编辑区域的高度值h;其中,所述h=3×h1。或者
若所述微博内容源数据信息为微博文字信息和与所述微博文字信息对应的微博图片信息,分别获取所述微博文字信息占用所述可编辑区域的高度值h2以及与所述微博文字信息对应的微博图片信息占用所述可编辑区域的高度值h3,则所述微博内容元数据信息占用所述可编辑区域的高度值h为所述h2和所述h3之和。
对上述步骤a至步骤l举例来说明对书籍各页面中的微博内容元数据信息进行排版和排版完成后再对各页面中的微博内容元数据信息分别进行调整的整个过程进行详细说明。
假设有共有10组微博内容元数据信息需要排版,并假设各页面的可编辑区域的沿高度方向的边缘线为B轴,且由可编辑区域的顶端至底端的方向为B轴正方向,沿宽度方向的边缘线为A轴,且由可编辑区域的左端至右端的方向为A轴正方向;并根据上述获取各组微博内容元数据信息占用对应页面可编辑区域的高度值的步骤,获取各个页面所需排版的微博内容元数据信息的组数。
假设该书籍第一页的可编辑区域的高度值为150毫米,以该页面可放置3组微博内容元数据信息为例。该三组微博内容元数据信息的高度分别为30毫米、60毫米和40毫米,那么假设每组微博内容元数据信息的起排点对应的位置坐标可以表示为(Ai,Bi),则第一组微博内容元数据信息起排点的坐标为(0,0),第二组微博内容元数据信息起排点的坐标为(0,30),第三组微博内容元数据信息起排点的坐标为(0,90);
根据上述步骤f至步骤l,能够得出该3组微博内容元数据信息的标准差值SD,假设为7毫米,由于本页面可编辑区域可用高度值为150毫米,但是上述3组微博内容元数据信息的高度值之和为130毫米,致使本页面的可编辑区域有20毫米的空余区域。则可根据该标准差值各自修正每组微博内容元数据信息的位置,以使每组微博内容元数据信息之间的间距尽量满足该标准差值,即第一组微博内容元数据信息与第二组微博内容元数据信息之间沿本页面可编辑区域高度方向的间距为7毫米,以此类推,第二组微博内容元数据信息与第三组微博内容元数据信息之间空余7毫米,那么第三组微博内容元数据信息与该页面可编辑区域底端之间空余6毫米,则获得本页面中各组微博内容元数据信息调整后的位置,即该第一组微博内容元数据信息起排点的坐标为(0,0),第二组微博内容元数据信息新的起排点的坐标为(0,37),第三组微博内容元数据信息新的起排点的坐标为(0,104)。
当然,对该书籍中其余各页面的微博内容元数据信息进行调整以获取调整好的微博内容元数据信息的过程与上述步骤相同,在此不详细描述。
在对各页面的微博内容元数据信息调整完成后,便可获取到携带有已编排调整好的微博内容元数据信息的可缩放的矢量图形SVG文件
在上顺步骤完成后,如有需要可以在书籍的各页面添加页码。并将该SVG文件打印成便携PDF文件,完成电子书籍的制作,然后准备印制交付。
本发明的方案采用对需要排版的微博内容元数据信息进行自动排版过程,提高了书籍制作质量以及书籍的制作效率。
如图4所示,本发明的实施例还提供一种基于微博内容的书籍系统,包括:
获取模块41,用于从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;
排版模块42,用于根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;
完成模块43,用于将所述SVG文件转换为PDF文件,完成书籍制作。
其中,如图5所示,所述排版模块42包括:
第一获取子模块51,用于获取所述书籍一页面对应的可编辑区域信息;
第一排版子模块52,用于根据所述发布微博的时间,依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
第二获取子模块53,用于获取下一相邻页面对应的可编辑区域信息;
第二排版子模块54,用于根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
循环子模块55,用于重复执行获取下一相邻页面对应的可编辑区域信息的步骤至根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成的步骤,直至所述获取的多组微博内容元数据信息全部排完;
其中,所述可编辑区域信息包括当前页面可编辑区域的高度值以及宽度值;所述至少一组微博内容元数据信息占用当前页面可编辑区域的高度值之和小于或者等于当前页面可编辑区域的高度值。
其中,如图6所示,该系统还包括:
第三获取子模块61,用于获取所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息集合S=(S1、S2…Si…Sj),其中,Si是第i组微博内容元数据信息,Sj是第j组微博内容元数据信息;i、j的取值均为正整数,且j大于i;且所述j的取值为所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息的组数值;
第四获取子模块62,用于根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj;其中,所述值域Hi=T(Si,E),所述值域Hj=T(Sj,E);其中,所述E为美观度熵,且E的初始值为1;
第五获取子模块63,用于获取所述值域Hi和所述值域Hj投影在所述值域Hi对应的序列和所述值域HJ对应的序列所处的同一相交维度上的投影的欧氏距离D,即其中,n为所述值域Hi对应的序列和所述值域Hj对应的序列在同一相交维度上的维度数,即值域中元素的个数;x为所述值域Hi所投影的线段的各自距离彼此最近的点,y为所述值域Hj所投影的线段的各自距离彼此最近的点,xi为x点在i维度上的值,yi表示y点在i维度上的值;
第六获取子模块64,用于获取所述集合S中所有D值,并根据公式计算出标准差值;其中,所述SD即为标准差值;N为所述所有D值的总数;μ为所述所有D值的平均值;Di为所述所有D值中第i个D值;
第七获取子模块65,用于将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值;
调整子模块66,用于重复根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj的步骤至将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值的步骤至少2次后,获得各页中的微博内容元数据信息之间的距离,根据所获得的距离,重新调整各个微博内容元数据信息的位置。
其中,所述第一排板子模块和所述第二排板子模块分别包括获取单元;其中,所述获取单元包括:
第一获取子单元,用于在若所述微博内容元数据信息为微博图片信息时,则将所述图片的高度值h作为所述微博内容元数据信息占用所述可编辑区域的高度值h;或
第二获取子单元,用于在若所述微博内容元数据信息指示为微博文字信息时,根据所述可编辑区域的宽度值以及所述可编辑区域预定的每个字符占用所述可编辑区域的宽度值以及所述文字信息中字符的个数,获取所述文字信息在所述可编辑区域的行数l,并根据所述可编辑区域预定的行高h1,获取所述文字信息占用所述可编辑区域的高度值h;其中,所述h=l×h1;所述微博内容元数据信息占用所述可编辑区域的高度值h为所述文字信息占用所述可编辑区域的高度值h;或者
第三获取子单元,用于在若所述微博内容源数据信息为微博文字信息和与所述微博文字信息对应的微博图片信息时,分别获取所述微博文字信息占用所述可编辑区域的高度值h2以及与所述微博文字信息对应的微博图片信息占用所述可编辑区域的高度值h3,则所述微博内容元数据信息占用所述可编辑区域的高度值h为所述h2和所述h3之和。
需要说明的是,该系统是与上述方法实施例对应的系统,上述方法实施例中所有实现方式均适用于该系统的实施例中,也能达到相同的技术效果。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种基于微博内容的书籍制作方法,其特征在于,包括:
从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;
根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所述书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;
将所述SVG文件转换为PDF文件,完成书籍制作。
2.根据权利要求1所述的书籍制作方法,其特征在于,所述排版包括:
步骤a,获取所述书籍一页面对应的可编辑区域信息;
步骤b,根据所述发布微博的时间,依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
步骤c,获取下一相邻页面对应的可编辑区域信息;
步骤d,根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
步骤e,重复步骤c至步骤d至所述获取的多组微博内容元数据信息全部排完;
其中,所述可编辑区域信息包括当前页面可编辑区域的高度值以及宽度值;所述至少一组微博内容元数据信息占用当前页面可编辑区域的高度值之和小于或者等于当前页面可编辑区域的高度值。
3.根据权利要求2所述的书籍制作方法,其特征在于,在所述步骤e之后还包括:
步骤f:获取所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息集合S=(S1、S2…Si…Sj),其中,Si是第i组微博内容元数据信息,Sj是第j组微博内容元数据信息;i、j的取值均为正整数,且j大于i;且所述j的取值为所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息的组数值;
步骤g:根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj;其中,所述值域Hi=T(Si,E),所述值域Hj=T(Sj,E);其中,所述E为美观度熵,且E的初始值为1;
步骤h:获取所述值域Hi和所述值域Hj投影在所述值域Hi对应的序列和所述值域Hj对应的序列所处的同一相交维度上的投影的欧氏距离D,即其中,n为所述值域Hi对应的序列和所述值域Hj对应的序列在同一相交维度上的维度数,即值域中元素的个数;x为所述值域Hi所投影的线段的各自距离彼此最近的点,y为所述值域Hj所投影的线段的各自距离彼此最近的点,xi为x点在i维度上的值,yi表示y点在i维度上的值;
步骤i:获取所述集合S中所有D值,并根据公式计算出标准差值;其中,所述SD即为标准差值;N为所述所有D值的总数;μ为所述所有D值的平均值;Di为所述所有D值中第i个D值;
步骤k:将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值;
步骤l:重复步骤(2)至步骤(5)至少2次后,获得各页中的微博内容元数据信息之间的距离,根据所获得的距离,重新调整各个微博内容元数据信息的位置。
4.根据权利要求2所述的书籍制作方法,其特征在于,所述步骤b和所述步骤d分别包括获取各组微博内容元数据信息占用对应页面可编辑区域的高度值的步骤;其中,所述获取各组微博内容元数据信息占用对应页面可编辑区域的高度值的步骤包括:
若所述微博内容元数据信息为微博图片信息,则将所述图片的高度值h作为所述微博内容元数据信息占用所述可编辑区域的高度值h;或
若所述微博内容元数据信息指示为微博文字信息,根据所述可编辑区域的宽度值以及所述可编辑区域预定的每个字符占用所述可编辑区域的宽度值以及所述文字信息中字符的个数,获取所述文字信息在所述可编辑区域的行数l,并根据所述可编辑区域预定的行高h1,获取所述文字信息占用所述可编辑区域的高度值h;其中,所述h=l×h1;所述微博内容元数据信息占用所述可编辑区域的高度值h为所述文字信息占用所述可编辑区域的高度值h;或者
若所述微博内容源数据信息为微博文字信息和与所述微博文字信息对应的微博图片信息,分别获取所述微博文字信息占用所述可编辑区域的高度值h2以及与所述微博文字信息对应的微博图片信息占用所述可编辑区域的高度值h3,则所述微博内容元数据信息占用所述可编辑区域的高度值h为所述h2和所述h3之和。
5.一种基于微博内容的书籍制作系统,其特征在于,包括:
获取模块,用于从内容源获取多组微博内容元数据信息;其中,各组所述微博内容元数据信息包括:微博图片信息和/或与所述微博图片信息对应的微博文字信息、发布微博的时间信息;
排版模块,用于根据预设的书籍页面版式信息,对获取到的所述多组微博内容元数据信息在所书籍各页面的可编辑区域进行排版,并获取携带有已编排好的微博内容元数据信息的可缩放的矢量图形SVG文件;
完成模块,用于将所述SVG文件转换为PDF文件,完成书籍制作。
6.根据权利要求5所述的系统,其特征在于,所述排版模块包括:
第一获取子模块,用于获取所述书籍一页面对应的可编辑区域信息;
第一排版子模块,用于根据所述发布微博的时间,依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
第二获取子模块,用于获取下一相邻页面对应的可编辑区域信息;
第二排版子模块,用于根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成;
循环子模块,用于重复执行获取下一相邻页面对应的可编辑区域信息的步骤至根据所述发布微博的时间,从剩余的所述获取的多组微博内容元数据信息中依序获取至少一组微博内容元数据信息,并将所述至少一组微博内容元数据信息沿当前页面的可编辑区域的高度方向,由当前页面的可编辑区域的顶端至底端依次排列,直至当前页面排版完成的步骤,直至所述获取的多组微博内容元数据信息全部排完;
其中,所述可编辑区域信息包括当前页面可编辑区域的高度值以及宽度值;所述至少一组微博内容元数据信息占用当前页面可编辑区域的高度值之和小于或者等于当前页面可编辑区域的高度值。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括:
第三获取子模块,用于获取所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息集合S=(S1、S2…Si…Sj),其中,Si是第i组微博内容元数据信息,Sj是第j组微博内容元数据信息;i、j的取值均为正整数,且j大于i;且所述j的取值为所述书籍一页面对应的可编辑区域所需排版的微博内容元数据信息的组数值;
第四获取子模块,用于根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj;其中,所述值域Hi=T(Si,E),所述值域Hj=T(Sj,E);其中,所述E为美观度熵,且E的初始值为1;
第五获取子模块,用于获取所述值域Hi和所述值域Hj投影在所述值域Hi对应的序列和所述值域HJ对应的序列所处的同一相交维度上的投影的欧氏距离D,即其中,n为所述值域Hi对应的序列和所述值域Hj对应的序列在同一相交维度上的维度数,即值域中元素的个数;x为所述值域Hi所投影的线段的各自距离彼此最近的点,y为所述值域Hj所投影的线段的各自距离彼此最近的点,xi为x点在i维度上的值,yi表示y点在i维度上的值;
第六获取子模块,用于获取所述集合S中所有D值,并根据公式计算出标准差值;其中,所述SD即为标准差值;N为所述所有D值的总数;μ为所述所有D值的平均值;Di为所述所有D值中第i个D值;
第七获取子模块,用于将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值;
调整子模块,用于重复根据预定的查表函数T,获取所述Si占用所述可编辑区域高度值的值域Hi、所述Sj占用所述可编辑区域高度值的值域Hj的步骤至将所述美观度熵的当前值,减去1/logSD,得到修正后的美观度熵的值的步骤至少2次后,获得各页中的微博内容元数据信息之间的距离,根据所获得的距离,重新调整各个微博内容元数据信息的位置。
8.根据权利要求6所述的系统,其特征在于,所述第一排板子模块和所述第二排板子模块分别包括获取单元;其中,所述获取单元包括:
第一获取子单元,用于在若所述微博内容元数据信息为微博图片信息时,则将所述图片的高度值h作为所述微博内容元数据信息占用所述可编辑区域的高度值h;或
第二获取子单元,用于在若所述微博内容元数据信息指示为微博文字信息时,根据所述可编辑区域的宽度值以及所述可编辑区域预定的每个字符占用所述可编辑区域的宽度值以及所述文字信息中字符的个数,获取所述文字信息在所述可编辑区域的行数l,并根据所述可编辑区域预定的行高h1,获取所述文字信息占用所述可编辑区域的高度值h;其中,所述h=l×h1;所述微博内容元数据信息占用所述可编辑区域的高度值h为所述文字信息占用所述可编辑区域的高度值h;或者
第三获取子单元,用于在若所述微博内容源数据信息为微博文字信息和与所述微博文字信息对应的微博图片信息时,分别获取所述微博文字信息占用所述可编辑区域的高度值h2以及与所述微博文字信息对应的微博图片信息占用所述可编辑区域的高度值h3,则所述微博内容元数据信息占用所述可编辑区域的高度值h为所述h2和所述h3之和。
CN201410247149.XA 2014-06-05 2014-06-05 一种基于微博内容的书籍制作方法及系统 Pending CN105183708A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410247149.XA CN105183708A (zh) 2014-06-05 2014-06-05 一种基于微博内容的书籍制作方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410247149.XA CN105183708A (zh) 2014-06-05 2014-06-05 一种基于微博内容的书籍制作方法及系统

Publications (1)

Publication Number Publication Date
CN105183708A true CN105183708A (zh) 2015-12-23

Family

ID=54905797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410247149.XA Pending CN105183708A (zh) 2014-06-05 2014-06-05 一种基于微博内容的书籍制作方法及系统

Country Status (1)

Country Link
CN (1) CN105183708A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015953A (zh) * 2017-04-12 2017-08-04 北京图文天地科技发展有限公司 一种对pdf文件拼折手版印刷排版方法
CN107945096A (zh) * 2017-12-07 2018-04-20 许建军 一种基于互联网技术的明信片收发系统及方法
CN108932221A (zh) * 2017-05-25 2018-12-04 北大方正集团有限公司 基于大对象的文件排版方法和装置
CN109815451A (zh) * 2018-12-13 2019-05-28 方正璞华软件(武汉)股份有限公司 一种pdf生成方法、装置及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5159668A (en) * 1989-05-08 1992-10-27 Apple Computer, Inc. Method and apparatus for manipulating outlines in improving digital typeface on raster output devices
EP0684582A3 (en) * 1994-05-16 1997-04-09 Miles Inc Method and device for storing and accessing font data.
CN101123002A (zh) * 2007-09-14 2008-02-13 北大方正集团有限公司 一种图文的自动排版方法
CN101206639A (zh) * 2007-12-20 2008-06-25 北大方正集团有限公司 一种基于pdf的复杂版面的标引方法
CN101419717A (zh) * 2008-12-11 2009-04-29 北大方正集团有限公司 一种版式文件图文自动关联的方法及系统
CN101458680A (zh) * 2008-09-03 2009-06-17 北京大学 一种自动识别数字文档目录的方法及装置
CN101770446A (zh) * 2008-12-26 2010-07-07 北大方正集团有限公司 一种版式文件中表格识别方法及系统
CN103077156A (zh) * 2012-11-01 2013-05-01 广州汇讯营销咨询有限公司 一种移动设备中电子杂志的制作方法和系统
CN103309878A (zh) * 2012-03-12 2013-09-18 腾讯科技(深圳)有限公司 用于网页显示中的排版的方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5159668A (en) * 1989-05-08 1992-10-27 Apple Computer, Inc. Method and apparatus for manipulating outlines in improving digital typeface on raster output devices
EP0684582A3 (en) * 1994-05-16 1997-04-09 Miles Inc Method and device for storing and accessing font data.
CN101123002A (zh) * 2007-09-14 2008-02-13 北大方正集团有限公司 一种图文的自动排版方法
CN101206639A (zh) * 2007-12-20 2008-06-25 北大方正集团有限公司 一种基于pdf的复杂版面的标引方法
CN101458680A (zh) * 2008-09-03 2009-06-17 北京大学 一种自动识别数字文档目录的方法及装置
CN101419717A (zh) * 2008-12-11 2009-04-29 北大方正集团有限公司 一种版式文件图文自动关联的方法及系统
CN101770446A (zh) * 2008-12-26 2010-07-07 北大方正集团有限公司 一种版式文件中表格识别方法及系统
CN103309878A (zh) * 2012-03-12 2013-09-18 腾讯科技(深圳)有限公司 用于网页显示中的排版的方法和装置
CN103077156A (zh) * 2012-11-01 2013-05-01 广州汇讯营销咨询有限公司 一种移动设备中电子杂志的制作方法和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015953A (zh) * 2017-04-12 2017-08-04 北京图文天地科技发展有限公司 一种对pdf文件拼折手版印刷排版方法
CN108932221A (zh) * 2017-05-25 2018-12-04 北大方正集团有限公司 基于大对象的文件排版方法和装置
CN107945096A (zh) * 2017-12-07 2018-04-20 许建军 一种基于互联网技术的明信片收发系统及方法
CN109815451A (zh) * 2018-12-13 2019-05-28 方正璞华软件(武汉)股份有限公司 一种pdf生成方法、装置及设备
CN109815451B (zh) * 2018-12-13 2023-08-22 方正璞华软件(武汉)股份有限公司 一种pdf生成方法、装置及设备

Similar Documents

Publication Publication Date Title
CN102663125B (zh) 一种收集微博内容制作电子文档的方法及系统
Drucker Is there a “digital” art history?
CN102156688B (zh) 一种文字变形特效处理方法及装置
CN105183708A (zh) 一种基于微博内容的书籍制作方法及系统
CN103186511A (zh) 汉字造字方法和设备、构造字体库的方法
JP2013009286A (ja) 画像表示システム、画像表示装置並びにプログラム
CN103729457A (zh) 基于互联网的数字化图书辅助阅读系统及其方法
CN105069293B (zh) 一种信息录入终端的方法和智能笔记本
JP2017037628A (ja) ユーザによる編集が可能なスマート二次元バーコード
Ehland Thinking Northern: Textures of Identity in the North of England
KR101371406B1 (ko) Pdf 문서의 소스분석을 통한 전자책 제작방법 및 시스템
CN102541481A (zh) 打印机及图片打印方法
CN104462089A (zh) 一种数据处理方法和装置
CN107918648A (zh) 一种平面设计模板库的建立和模板查找方法
CN110489735A (zh) 一种演示文稿生成方法、装置及设备
CN101436177B (zh) 在表格中导入数据文件的方法及装置
CN108196850A (zh) 一种应用于可变信息印刷的自动数据处理与拼版方法
Pelzer-Montada Perspectives on contemporary printmaking: Critical writing since 1986
Noonan Printscape
KR20170096349A (ko) 전자 출판 조판 문서와 워드프로세서, 프리젠테이션 전자 문서를 html5 문서로 변환 할 때 메타데이터를 전달하는 방법 및 이를 이용한 변환기
Weinstein Weinstein on Berger and DiRuggiero,'Einstein: The Man and His Mind'
Delpar The Mobility of Modernism: Art and Criticism in 1920s Latin America
Blaschke “Making History a Slightly Profitable Thing”: The Bettmann Archive and the Commodification of Images
Stalling Words in Characters; Books as Vehicles: An Exhibition Review
Li The Dream Objects of Joseph Cornell

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151223

WD01 Invention patent application deemed withdrawn after publication