在纸介质文件上埋入信息和识别埋入信息的实现方法
技术领域
本发明属于信息处理技术,尤其是一种在纸介质文件上埋入信息的实现方法。
背景技术
近年,计算机技术飞速发展,作为数据信息记录的媒体,已由最初的磁介质媒体发展到光介质媒体,存储器媒体等。但是将普通纸作为大量数据存储的媒体却很少被言及。
另外,最初作为超市结算的一种简便的方法,1932年由美国哈夫大学提出了一维条纹码的提案,被广泛利用至今。80年代末期,为满足宝石、半导体、制药、机械产品等行业应能记录更多信息的需求,1989年由美国Intermec公司开发了Code49,从此二维条码诞生了。此后DataMatrix,MaxiCode,ArrayTag等相继登场,在日本也开发了CPCode,QRCode,并被列入国际标准。
但是二维条码是在一维条码的基础上产生出来的,因此很难跳出一维条码的局限,首先所有的二维条码的提案仍然采用将黑色区域表示信息代码“1”,白色区域表示信息代码“0”,而没考虑利用图形变化来直接地表示一个完整的信息代码(如0~9,A~F),造成信息表示的冗长。其次,二维条码同一维条码一样必须单独出现,占用了空间,而且易于被复制,安全性差。况且纸张污染对二维条码的正确解读也是致命的问题。
随着打印设备,扫描设备精度不断提高,同15年前二维条码出现时的硬件设备条件比,有了很大发展,如1200dpi、2400dpi高精度的打印机、扫描仪已司空见惯。于是在金融保险领域中,提出了在纸上进行大量数据记录及印字更加精细的要求。特别是在日本金融行业中,计算机的数据在法律上的规定一定要打印在纸上进行保管。目前因纸上不能存储数据,所以还需要用硬盘进行备份。这些信息如能直接在纸上储存,不再用硬盘进行备份,将会更加安全、方便。这样的需求显然用二维条码技术来实现是比较困难的。
医院所出具的纸介质文件作为一种对个人身体健康状况的诊断的记录,另外也可以作为如申请保险金等办理其他事务的证明材料,对于纸介质文件及其所记录信息管理和保存,以及防止纸介质文件被伪造,或者被篡改就极为重要。
因此,人们迫切需要一种可以在纸介质文件等证明材料中埋入相关信息的处理方法,将纸介质文件既作为证明材料又作为信息记录的载体,来记录纸介质文件的内容,以便于信息存储和管理。同时还可以防止信息被篡改、伪造,即使纸张破损或者被污染也不会影响信息的识别的方法。
发明内容
为解决上述技术中存在的问题,本发明的目的是提出一种可在纸介质文件上埋入信息的处理方法,以便于解决在纸介质文件信息的存储和管理的问题。同时起到防止信息被伪造和篡改的效果。为实现上述目的,本发明采取的技术方案是提供一种在纸介质文件上埋入信息和识别埋入信息的实现方法,该方法包括信息埋入和信息识别两部分,其埋入方法步骤如下:
(1)读取将要埋入信息的纸介质文件数据,并转换为图像数据;
(2)读取将要埋入纸介质文件图像中的附加信息,将附加信息进行分组,并对分组后的每组数据进行包括RS编码在内的加密或纠错处理;
(3)进行8位转9位的变换,包括在规则等距排列的二维点阵中,每一个点位对应一个信息位(bit),如果埋入数据中该位是“1”,则在点阵中对应点位埋入一个黑点;如数据位为“0”,则留出该空白点位,以3*3共九个网点来表示一个字节,避免码字中“0”和“1”的连续出现处理;
(4)进行第1组的第1位+第2组的第1位+…+最后1组的第1位+第1组的第2位+第2组的第2位十…+最后1组的第2位+…+最后1组第最后1位的顺序进行连接组合;
(5)将连接组合的数据依次排列在纸介质文件图像的空隙处实现信息埋入;
(6)将埋入信息的印刷图像打印输出,或输出印刷制版数据进行制版将埋入信息的印刷图像印刷出;
识别信息的步骤如下:
(1)通过包括扫描仪在内的图像读取设备对已埋入信息的纸介质文件进行扫描,读取纸介质文件的图像数据;
(2)在图像数据中查找网屏编码信息点所对应在图像数据中的具体位置,按照构成网屏图像的各个像素点的分布状况对图像进行识别,识别图像中的网屏编码,将网屏编码转换为计算机数据代码,得到埋入的数据;
(3)对识别出的数据进行分组,然后对分组后的每组数据进行RS解码处理,得到原始埋入的信息。
本发明的效果是该处理方法可以在纸介质文件上埋入大量的信息,该信息通过扫描设备可以识别出信息的内容,减少相关信息需要重复输入带来的麻烦,便于信息的管理和保存。同时可以起到防止纸介质文件被伪造和信息被篡改。该处理方法即使在纸介质文件上随机记载一些文字,符号不会影响读取的正确性,打印在纸上的纸介质文件即使被污染和破损时,仍能够准确识别出所埋入的信息内容。
附图说明
图1是本发明的一种在纸介质文件上埋入信息的埋入方法的示意图;
图2是本发明所提出的识别纸介质文件上所埋入信息的识别方法示意图;
图3(a)是本实施方案所提出网屏编码网点的表示代码“1”例子;
图3(b)是本实施方案所提出网屏编码网点的表示代码“0”例子;
图4是埋有网屏编码信息的底纹图像的局部放大图;
图5是埋入信息前的纸介质文件原件;
图6是在纸介质文件上埋入信息后的样图。
101表示信息“1”
102表示信息“0”,
具体实施方式
以下结合附图及实施例对本发明在纸介质文件上埋入信息的处理方法做进一步详述,但本发明所述的实施例是说明性的,而不是限定性的。
以下在本实施方式中,所述的像素点是构成图像的最小单位,网点是与构成图像的最小单位的像素点所对应的网屏最小单位,网点的点阵数是构成网点的按一定规则进行排列的点阵最小单位的点的总数。该点是由印刷设备所能印刷的最小单位“印刷点”组成的,网屏编码是可记忆信息的网屏网点。
定位点阵的定义,以一种区别于信息点阵的排列形式,在印刷媒体出现变形时,作为量化印刷在印刷媒体上的标识性网屏编码各个点阵位置的点阵称为定位点阵。
图3(a)是本实施方案提出的网屏编码网点的例子,表示信息代码“1”,图3(b)表示信息代码“0”。在矩形的埋入区域以点阵的方式埋入经过编码和转化处理的数据,即在规则等距排列的二维点阵中,每一个点位对应一个信息位bit。如果埋入数据中该位是“1”,则在点阵中对应点位埋入一个黑点;如数据位为“0”,则留出该空白点位。
图4是埋有网屏编码信息的底纹图像的局部放大图。图中101表示代码“1”,102表示代码“0”。
图5是埋入信息前的纸介质文件原件。
在进行信息埋入时为了在将来进行信息识别时可以定位到码区,首先在码区四周等距地打印定位点一圈,包围其中的数据区。
然后埋入数据,在进行数据埋入时为了使网点分布均匀,呈现良好的网屏效果,原始数据是经过特殊处理后才埋入的,即将8位数据转换为9位数据。由于用9位表示8位信息,编码的冗余可以有效地避免码字中“0”和“1”的连续出现。既有利于印刷图像的美观,也便于对信息进行识别。在规则等距排列的二维点阵中,每一个点位对应一个信息位bit。如果埋入数据中该位是“1”,则在点阵中对应点位埋入一个黑点;如数据位为“0”,则留出该空白点位。这样以3*3共九个网点来表示一个字节。依次埋入全部信息。
图6是在纸介质文件上埋入信息后的样图。
以上只是给出了将代码自身的点阵作为定位点阵的标识性网屏编码的例子,不仅仅这几种网屏编码,仿照上述方法,可以构成包括1个点阵,2个点阵,3个点阵,4个点阵,以及N个点阵在内的各种各样的标识性网屏编码。只要是以印刷网屏网点进行信息记录的,都属于本实施方案的发明范围之内。
实施例
下面结合图1详细叙述在纸介质文件上埋入大量信息的实现方法的过程:
该在纸介质文件上埋入信息的处理方法,其埋入方法步骤如下:
(1)读取将要埋入信息的纸介质文件数据,并转换为图像数据;
(2)从存储器,外部设备,网络中的至少一个设备中读取将要埋入纸介质文件的图像中的附加信息,将附加信息进行分组,并对分组后的每组数据进行RS编码或纠错处理;对加密后的每组数据进行8位转9位的变换,将编码中的“1”打散,以避免在埋入过程中出现横向连续黑点或空白影响埋入图像的质量;
(3)转化后按照第1组1位+第2组1位+……+最后一组1位+第1组2位+第2组2位+……+最后一组最后一位的顺序进行连接组合,所得至的信息串即为要埋入的数据,这样做有利于抗连续污染。
(4)将上述转换后的将要埋入的数据变换成具有印刷网屏特性的光学可读性的网屏编码。这种光学可读性网屏编码的构成是同时考虑了光学可读性编码的构造特性与印刷网屏的特性,并将光学可读性编码的构造特性与印刷网屏的特性相结合,构成了标识性网屏编码。这里所述的具有印刷网屏特性的光学可读性的网屏编码是指具有印刷网屏的网点灰度特性,印刷网屏的网点大小特性,印刷网屏的网点间隔特性中的至少一个特性的几何学的点阵分布或物理学的点阵分布。
这里所述几何学的点阵分布是指不同位置分布、不同方向分布、不同形状分布中的一种以上几何学的分布。
所述物理学的点阵分布是指二维空间中的不同调制方式,二维空间中的相位调制,二维空间中的不同传播方向中的一种以上物理学的点阵分布的。
这里所述的具有印刷网屏的网点灰度特性是指构造的网屏编码的网点灰度值都是相等的,并且是最小化的即网点的点阵数小于3。
这里所述的具有印刷网屏的网点大小特性是指构造的网屏编码的网点大小都是相等的,并且是最小化的即网点大小小于5*5网点点阵。
这里所述的具有印刷网屏的网点间隔特性是指构造的网屏编码的网点间隔都是相等的。
(5)将上述具有印刷网屏特性的光学可读性的网屏编码按一定间隔排列成二维分布的底纹形式的印刷图像,构成埋入信息的印刷图像;
这里所述按一定间隔排列成二维分布的底纹形式的印刷图像是指按照印刷网屏特性的印刷网屏的灰度特性,印刷网屏的网点间隔特性中的至少一个特性的网屏编码的排列的。
这里按照印刷网屏的灰度特性及印刷网屏的网点间隔特性进行的网屏编码的排列的是指对于同样灰度值的网点,网点的间隔越大印刷网屏的整体灰度越小,反之,网点的间隔越小印刷网屏的整体灰度越大。
(6)将埋入信息的印刷图像打印输出,或输出印刷制版数据进行制版将埋入信息的印刷图像印刷出。
图2是本发明所提出的识别纸介质文件上所埋入信息的识别方法示意图,其识别方法步骤如下:
(1)通过扫描仪等图像读取设备对已埋入信息的纸介质文件进行扫描,读取纸介质文件的图像数据;所述的图像读取设备还可以为包括数码相机、传真机、一体化机、手机在内的可将印刷图像转化为电子图像的装置。
(2)在图像数据中查找网屏编码信息点所对应在图像数据中的具体位置,按照构成网屏图像的各个像素点灰度值对图像进行识别,并将识别出的所有网屏编码的网点转换成网屏编码,将网屏编码转换为计算机数据代码,得到埋入的数据。
(3)对识别出的数据分组,然后进行9位转8位的操作,再对转换后的数据进行RS解码处理,得到原始埋入的信息。