一种带超链接的电子书,电子报纸和电子杂志的编码方法
技术领域
本发明涉及一种编码方法,特别是指一种将电子书,电子报纸和电子杂志生成带超链接的TTK格式电子书并下载到电子阅读器中供人们阅读的方法。
背景技术
随着社会的进步,现在信息和信息技术正以前所未有的方式对社会变革的方向起着决定作用,其结果必定导致信息社会在全球的实现。具体表现为,首先,在生产活动的范围广泛的工作过程中,引入了信息处理技术,从而使这些部门的自动化达到一个新的水平;其次,电讯与计算机系统合二为一,可以在几秒钟内将信息传递到全世界的任何地方,从而使人类活动各方面表现出信息活动的特征;最后,信息和信息机器成了一切活动的积极参与者,甚至参与了人类的知觉活动、概念活动和原动性活动。
在上述的过程中信息传播手段极其重要,尤其是可以通过互联网传送的电子书,目前,存在着很多种电子书的编码格式,比如PDF、CHM、EPUB、TXT、HTML、RTF、DJVU等十几种,各种方法各有特点。
首先,便携文档格式(PDF)由Adobe发明,PDF文件是以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的,颜色准确的打印效果。PDF将忠实地再现你原稿的每一个字符,颜色以及图象。
其次,CHM是一种用LZX算法压缩的HTML文件集,除了文件本身外,也有索引数据档以及图像档等,目前此格式也被微软用来散布一些独立的开发文件。由于在HTML Help中可以使用JavaScript来增加交互性,因此在微软的许多说明档中,多利用JavaScript来增加文件的可读性(例如代码缩放或是导览等)。
再次,DjVu主要用于存储扫描的图像。这种格式的特色包括图像分层、渐进载入、算术编码、对二进制图像进行有损压缩,从而以较小的空间,存放高质量的可读图像。渐进载入使得DjVu适合于应用于因特网。DjVu对于大部分的扫描文档,表现都优于PDF。
进一步,EPub是一个自由的开放标准,属于一种可以“自动重新编排”的内容;也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示。EPub档案内部使用了XHTML或DTBook来展现文字、并以zip压缩格式来包裹档案内容。EPub格式中包含了数字版权管理(DRM)相关功能可供选用。EPub于2007年9月成为国际数字出版论坛(IDPF)的正式标准,以取代旧的开放Open eBook电子书标准。EPub包括三项主要规格:
Open Packaging Format,OPF2.0,定义以XML为基础的.epub档案结构;
Open Publication Structure,OPS2.0,定义内容的版面;
OEBPS Container Format,OCF1.0,将所有相关文件收集至ZIP压缩档案之中。
如上所述的以上几种编码方法,主要应用于桌面电子书系统,基本不具备在阅读中导航的功能,不适合在电子阅读器设备上显示电子报纸等需要丰富的导航功能的场合。CHM和EPUB具备有限的导航能力,但通常只用于桌面系统,目前在电子阅读器上还不能有效应用。PDF和DJVU都不具备导航能力,另外,PDF的很多特性主要是针对打印设备,它的缩放功能在手持电子阅读器上效果不好,PDF从一开始就不是为电子阅读器设计的。EPUB和CHM本质上是HTML格式的,HTML的标签在文档中需要占用不少的空间,对于手持电子阅读器来说效率不高。
发明内容
本发明提供一种带超链接的电子书,电子报纸和电子杂志的编码方法,本发明的主要目的是提出了一种应用于电子阅读器的带超链接的电子书编码方法,可以高效地应用于电子阅读器的电子报纸和电子杂志编码。
本发明提供一种带超链接的电子书,电子报纸和电子杂志的编码方法,其另一目的是设计了一种电子报纸和电子杂志的编辑方法,利用该方法出版机构和用户可以用其编辑生成能够在电子阅读器设备上阅读的带超链接的电子出版物。
为了解决以上的技术问题,本发明所采取的技术方案是:
一种带超链接的电子书,电子报纸和电子杂志的编码方法,其包括如下步骤:
第一步、通过TTK格式电子书编辑器将用户输入的文本和图片排版信息进行处理生成带超链接的TTK格式电子书,如上所述第一步中其具体包括如下步骤:
步骤1、将用户输入的该文本和图片排版信息在该TTK格式电子书编辑器中按照Json协议进行处理,生成该TTK格式电子书,其中,Json协议是一种轻量级的数据交换格式,如上所述第一步中该TTK格式电子书由Json文本文件以及图片文件组成,其中,该图片文件为png格式文件、jpeg格式文件或者gif格式文件。
步骤2、对如上所述的该TTK格式电子书进行压缩打包,该TTK格式电子书由多个Json文本文件和图片文件组成,对该TTK格式电子书采用LZO数据压缩算法,压缩后可以形成一个文件,其扩展名是.ttk。
第二步、利用互联网将如上所述第一步中的该TTK格式电子书下载到终端设备中,该终端设备为电子阅读器。
第三步、使用者在如上所述第二步中的该电子阅读器上阅读经过解码的该TTK格式电子书,该电子阅读器直接解压该TTK格式电子书文件,得到分离的Json文本文件和图片文件,其中只有唯一的一个文件名为home.json该文件是主引导文件,打开后根据Json协议的描述,用户可以通过该电子阅读器上设置的按键或触摸屏触发页面之间的导航,在页面之间浏览。
一种带超链接的电子书,电子报纸和电子杂志的编码方法,其包括如下步骤:
第一步、通过TTK格式电子书编辑器将用户输入的文本和图片排版信息进行处理生成带超链接的TTK格式电子书,如上所述第一步中其具体包括如下步骤:
步骤1、将用户输入的该文本和图片排版信息在该TTK格式电子书编辑器中按照Json协议进行处理,生成该TTK格式电子书,其中,Json协议是一种轻量级的数据交换格式,如上所述第一步中该TTK格式电子书由Json文本文件以及图片文件组成,其中,该图片文件为png格式文件、jpeg格式文件或者gif格式文件,或者其他类型的图片格式文件。
步骤2、对如上所述的该TTK格式电子书进行压缩打包,并添加DRM数字版权管理系统,该TTK格式电子书由多个Json文本文件和图片文件组成,为了便于网络下载,添加DRM数字版权管理,对该TTK格式电子书采用LZO数据压缩算法,压缩后可以形成一个文件,其扩展名是.ttk。
第二步、利用互联网将如上所述第一步中的该TTK格式电子书下载到终端设备中,该终端设备为电子阅读器。
如上所述第一步的步骤2中添加有该DRM数字版权管理系统的该TTK格式电子书。
首先,由该DRM数字版权管理系统根据生成的加密后的密钥key-pub,以及电子书的使用权限,产生使用许可证文件,该使用许可证文件是一个XML格式的权限描述文件,包括了base64编码的key-pub。
其次,该电子阅读器通过网络下载加密后的电子书,以及使用许可证文件。
再次,该电子阅读器用自身的私钥解密使用许可证中的加密密钥key-pub得到原来的加密密钥key.。
最后,该电子阅读器用解密后的加密密钥key解密电子书,得到加密前的该TTK格式电子书文件。
第三步、使用者在如上所述第二步中的该电子阅读器上阅读经过解码的该TTK格式电子书。
在此步骤中,按照如上所述第二步中的步骤,如果用户为没有购买的非授权用户,即使下载了电子书,由于没有解密密钥,仍然打不开电子书,起到了版权保护的目的。
而购买了电子书的用户,从服务器得到了使用许可证,使用许可证中含有用这个阅读器的公钥加密后的电子书密钥,阅读器用自己的私钥解密,得到电子书加密密钥,从而解密电子书,得到原始的TTK格式电子书进行阅读。
本发明的有益效果为:本发明的编码方法与现有的电子书编码方法相比最突出的优点是能够在页面间随意导航,编码效率也很高,解压速度很快;这些特点都使得这种编码方法特别适合电子阅读器上的电子报纸和电子杂志。
目前电子阅读器市场内容方面仍然以电子书为主,电子报纸和电子杂志非常少,除了市场原因外,技术上是一个很大的障碍,目前,还没有一个成熟的编码方法适合用于电子报纸和电子杂志。本编码方法就是一个针对这种市场需要而发明的一项具有潜在巨大市场效益的技术,通过该技术的推行,必将带来电子报纸和电子杂志等实时电子媒体在电子阅读器上的广泛使用,进而形成一个巨大的移动信息阅读产业链。
具体实施方式
一种带超链接的电子书,电子报纸和电子杂志的编码方法,其包括如下步骤:
第一步、通过TTK格式电子书编辑器将用户输入的文本和图片排版信息进行处理生成带超链接的TTK格式电子书。
如上所述的该TTK格式电子书也可以为电子报纸或者电子杂志。
如上所述第一步中其具体包括如下步骤:
步骤1、将用户输入的该文本和图片排版信息在该TTK格式电子书编辑器中按照Json协议进行处理,生成该TTK格式电子书。
其中,Json(JavaScript Object Notation)协议是一种轻量级的数据交换格式。
Json协议具有以下形式:
第一种、对象是一个无序的“‘名称/值’对”集合,一个对象以“{”(左括号)开始,“}”(右括号)结束,且每个“名称”后跟一个“:”(冒号);“‘名称/值’对”之间使用“,”(逗号)分隔。
第二种、数组是值(value)的有序集合,一个数组以“[”(左中括号)开始,“]”(右中括号)结束,值之间使用“,”(逗号)分隔。
第三种、值(value)可以是双引号括起来的字符串(string)、数值(number)、true、false、null、对象(object)或者数组(array),上述这些结构可以相互嵌套。
第四种、字符串(string)是由双引号包围的任意数量Unicode字符的集合,使用反斜线转义,一个字符(character)即一个单独的字符串(character string)。
第五种、数值(number)也与C或者Java的数值非常相似,除去未曾使用的八进制与十六进制格式。
如上所述第一步中该TTK格式电子书由Json文本文件以及图片文件组成,其中,该图片文件为png格式文件、jpeg格式文件或者gif格式文件,或者其他类型的图片格式文件。
电子报纸的Json描述与电子书的类似,基本原理是对每一种屏幕元素分别描述,元素分为图片,文本,带链接的图片,带链接的文本,文本列表等。每种元素的位置大小等样式信息在一个样式文件中,这是为了把显示内容和样式呈现分开,使得针对不同的屏幕能共用内容,方便切换样式,引入CSS的样式描述文件。
以下是Json描述电子书内容的格式例子:其中导航采用link属性,可以导航到另一个Json文本。Id和class表示对象元素的标示和类型,在样式描述文件中
如上所述其样式文件格式具体描述为,坐标和尺寸单独列出,其他样式描述在css属性中描述,语法采用标准css语法
步骤2、对如上所述的该TTK格式电子书进行压缩打包,并添加DRM数字版权管理系统。
该TTK格式电子书由多个Json文本文件和图片文件组成,为了便于网络下载,添加DRM数字版权管理,对该TTK格式电子书采用LZO数据压缩算法,压缩后可以形成一个文件,其扩展名是.ttk。
为加快加载速度,文本文件和图片文件也可以分别打包,Json文本文件和首页及前几页的图片用lzo压缩成扩展名是.ttk的文件,图片文件用lzo压缩成扩展名是.tu的文件。这样先打开ttk文件,用户阅读第一页时,在后台解压图片文件,提高加载速度。
一份报纸也可以由多个ttk文件构成,每个单独的栏目由一个ttk文件和一个tu文件组成,所有文件再用lzo压缩成单个扩展名是tt的文件。
lzo是致力于解压速度的一种数据压缩算法,这个算法是无损算法,参考实现程序是线程安全的。
lzo算法实现了许多有下述特点的算法:
·解压简单,速度非常快。
·解压不需要内存。
·压缩相当地快。
·压缩需要64kB的内存。
·允许在压缩部分以损失压缩速度为代价提高压缩率,解压速度不会降低。
·包括生成预先压缩数据的压缩级别,这样可以得到相当有竞争力的压缩比。
·另外还有一个只需要8kB内存的压缩级别。
·算法是线程安全的。
·算法是无损的。
其中,解压速度非常快这个特点特别适合在嵌入式设备上实时解压,其解压速度几乎是所有压缩算法中最快的,而且在提高压缩率的情况下,不影响解压速度。另外该算法需要很小的内存,特别适合小内存设备。
第二步、利用互联网将如上所述第一步中的该TTK格式电子书下载到终端设备中,该终端设备为电子阅读器。
ttk格式的电子书可以灵活地添加DRM数字版权管理系统,是否添加DRM数字版权管理系统是可选的,如果不需要添加,TTK格式的电子书直接下载到阅读器;如果要添加DRM数字版权管理,执行以下步骤:
首先,数字版权保护服务器根据生成的加密后的密钥key-pub,以及电子书的使用权限,产生使用许可证文件。使用许可证文件是一个XML格式的权限描述文件,包括了base64编码的key-pub.。
其次,电子阅读器通过网络下载加密后的电子书,以及使用许可证文件。
再次,电子阅读器用自己的私钥解密使用许可证中的加密密钥key-pub得到原来的加密密钥key.。
最后,电子阅读器用解密后的加密密钥key解密电子书,得到加密前的TTK格式电子书文件。
第三步、使用者在如上所述第二步中的该电子阅读器上阅读经过解码的该TTK格式电子书。
在此步骤中,如果没有添加DRM数字版权保护,阅读器直接解压TTK格式的电子书文件,得到分离的Json文本文件和图片文件,其中只有唯一的一个文件名叫home.json文件是主引导文件,打开后根据json协议的描述,用户可以通过阅读器的按键或触摸屏触发页面之间的导航,在页面之间浏览。
如果添加了DRM数字版权保护,则有以下情况:
首先,没有购买的非授权用户,即使下载了电子书,由于没有解密密钥,仍然打不开电子书,起到了版权保护的目的。
其次,购买了电子书的用户,从服务器得到了使用许可证,使用许可证中含有用这个阅读器的公钥加密后的电子书密钥,阅读器可以用自己的私钥解密,得到电子书加密密钥,从而解密电子书,得到原始的TTK格式电子书进行阅读。
如上所述本发明中对TTK格式编码的实施包括以下几个方面:
1.按照ttk格式编码的电子报纸图文混排系统软件;
2.对ttk格式电子报纸的模拟器软件;
3.电子阅读器对ttk格式的电子报纸的解码软件;
4.对电子报纸的订约发行网络平台;
5.电子阅读器的无线网络下载系统。
如上所述本发明中的一些英文缩写这里解释如下:
TTK格式:指本专利申请发明的一种电子出版物编码方式。
Json:(JavaScript Object Notation)是一种轻量级的数据交换格式,主要用于网络数据通信,可替代XML对数据进行描述。
LZO:是致力于解压速度的一种数据压缩算法,这个算法是无损算法。
DRM:数字版权保护系统。