CN101546387B - 多媒体资料索引信息的存储方法及用该方法的印刷出版物 - Google Patents

多媒体资料索引信息的存储方法及用该方法的印刷出版物 Download PDF

Info

Publication number
CN101546387B
CN101546387B CN2009101354591A CN200910135459A CN101546387B CN 101546387 B CN101546387 B CN 101546387B CN 2009101354591 A CN2009101354591 A CN 2009101354591A CN 200910135459 A CN200910135459 A CN 200910135459A CN 101546387 B CN101546387 B CN 101546387B
Authority
CN
China
Prior art keywords
unit
code
sign indicating
indicating number
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009101354591A
Other languages
English (en)
Other versions
CN101546387A (zh
Inventor
张伟
李政放
吕迎丰
顾光一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen MPR Technology Co Ltd
Shenzhen MPR Times Tech Co Ltd
Original Assignee
Shenzhen MPR Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen MPR Technology Co Ltd filed Critical Shenzhen MPR Technology Co Ltd
Priority to CN2009101354591A priority Critical patent/CN101546387B/zh
Publication of CN101546387A publication Critical patent/CN101546387A/zh
Application granted granted Critical
Publication of CN101546387B publication Critical patent/CN101546387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Credit Cards Or The Like (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开一种多媒体资料索引信息的存储方法及用该方法的印刷出版物。该存储方法中,在可印刷介质上存储供正常阅读的图文和供设备识别的存储有所述多媒体资料索引信息的二维码,该印刷出版物印刷有供正常阅读的图文和供设备识别的二维码。所述二维码其码图符号由具有不同光学反射率的条码单元在基底上排列而成,所述码图符号为矩形,所述符号中的所述条码单元为等间距排列的实心点,位于码图四角的单元是用于边界定位与识别的定位点,其余的单元是数据点,所述定位点的面积大于数据点的面积,其特征是:所述码图符号在基底上重复排列,无缝拼接为码图阵列,码图阵列包括至少二个相同的码图符号,并且相邻码图共用定位点。

Description

多媒体资料索引信息的存储方法及用该方法的印刷出版物
本申请是申请号为200610156879.4、名称为《二维码及其解码方法、应用该二维码的印刷出版物》、申请日为2006年11月16日的中国申请的分案申请。
【技术领域】
本发明涉及一种多媒体资料索引信息的存储方法,以及在印刷出版物上的应用。
【背景技术】
习惯上人们一直用眼睛阅读书籍、报纸等传统出版物,时间长眼睛容易疲劳,这种获取信息的方式比较枯燥,而且盲人或者患有眼疾的人,无法阅读这种传统出版物。为此,近年来出现了语音阅读出版物,利用二维码语音阅读装置,可以对一本书中的内容进行解码发音,供读者收听,提供了阅读或记忆的效率,方便了盲人或者患有眼疾的人。
一般来说,二维码的主要形式是明码。在语音阅读出版物上,有二维码符号明显可见的印刷在文字段落之间或页面上某个明显位置,阅读器对准给二维码符号即可读取。这种明码只能在版面的空白处、通常以单个码的形式出现,对版面美观或多或少带来一定影响。而且为使明码便于被找到,明码通常会印得较大,这样虽然对印刷精度要求低,但是读取时,要求阅读器读头的开口较大。
市场上已经出现的二维码语音阅读装置,采用常规二维码来标识发音位置,发音索引数量有限,造成不同出版物共用相同的编码代码,致使阅读装置中的发音文件与目标出版物相对应,出现阅读发音内容张冠李戴的混乱情况。
【发明内容】
本发明的目的主要在于:提供一种多媒体资料索引信息的存储方法、一种适合存储数据、识读方便、解码算法简单的二维码及其解码方法、以及应用该二维码存储相伴随的多媒体资料索引信息的出版物,这种二维码针对出版物在一般常规印刷条件下实现的需求而设计,更适用于印刷出版物上,使用更为方便可靠。
为实现上述目的,本发明首先一种二维码,其码图符号由具有不同光学反射率的条码单元在基底上排列而成;所述码图符号为矩形,所述符号中的所述条码单元为等间距排列的实心点,位于码图四角的单元是用于边界定位与识别的定位点,其余的单元是数据点,所述定位点的面积大于数据点的面积。
上述的二维码,所述数据点单元全部在由相邻的所述定位点单元的中心连接而成的矩形框之内。所述码图符号在基底上重复排列,无缝拼接为码图阵列,码图阵列包括至少二个相同的码图符号,并且相邻码图共用定位点。
上述的二维码,所述条码单元的形状优选为实心圆点,所述定位点单元的直径为数据点单元的直径的二倍。
上述的二维码,所述码图符号具有10×10个条码单元,除定位点外,每相邻的8个数据点为一组,表示一个码字;所述定位点单元的坐标分别为(0,0)、(9,0)、(0,9)以及(9,9);在由定位点坐标规定的棋盘坐标系中,数据点单元分为12组,各表示一个码字;第一组包括的单元坐标为(1,0),(2,0),(0,1),(1,1),(2,1),(0,2),(1,2),(2,2);第二组包括的单元坐标为(3,0),(4,0),(5,0),(6,0),(3,1),(4,1),(5,1),(6,1);第三组包括的单元坐标为(7,0),(8,0),(7,1),(8,1),(9,1),(7,2),(8,2),(9,2);第四组包括的单元坐标为(3,2),(4,2),(2,3),(3,3),(4,3),(2,4),(3,4),(4,4);第五组包括的单元坐标为(5,2),(6,2),(5,3),(6,3),(7,3),(5,4),(6,4),(7,4);第六组包括的单元坐标为(0,3),(1,3),(0,4),(1,4),(0,5),(1,5),(0,6),(1,6);第七组包括的单元坐标为(8,3),(9,3),(8,4),(9,4),(8,5),(9,5),(8,6),(9,6);第八组包括的单元坐标为(2,5),(3,5),(4,5),(2,6),(3,6),(4,6),(3,7),(4,7)为;第九组包括的单元坐标为(5,5),(6,5),(7,5),(5,6),(6,6),(7,6),(5,7),(6,7);第十组包括的单元坐标为(0,7),(1,7),(2,7),(0,8),(1,8),(2,8),(2,9),(2,9);第十一组包括的单元坐标为(3,8),(4,8),(5,8),(6,8),(3,9),(4,9),(5,9),(6,9);第十二组包括的单元坐标为(7,7),(8,7),(9,7),(7,8),(8,8),(9,8),(7,9),(8,9)。
次之,本发明提出了一种印刷出版物,其印刷有供正常阅读的图文和供设备识别的二维码,所述二维码的码图符号由具有不同光学反射率的条码单元在基底上排列而成;所述码图符号为矩形,所述符号中的所述条码单元为等间距排列的实心点,位于码图四角的单元是用于边界定位与识别的定位点,其余的单元是数据点,所述定位点的面积大于数据点的面积。
上述的印刷出版物,所述数据点单元全部在由相邻的所述定位点单元的中心连接而成的矩形框之内。所述码图符号在基底上重复排列,无缝拼接为码图阵列,码图阵列包括至少二个相同的码图符号,并且相邻码图共用定位点。
上述的印刷出版物,所述条码单元的形状优选为实心圆点,所述定位点单元的直径为数据点单元的直径的二倍。
上述的印刷出版物,所述码图符号在通常的阅读环境中肉眼不可见;或相对于普通印刷图文,所述码图符号肉眼不易见。
上述的印刷出版物,所述条码单元包括深色单元和浅色单元,分别表示二进制值1和0,所述浅色单元直接用纸张或者其他印刷媒介的底色表示。所述码图的单元采用对红外光谱的光表现为不同的反射率、对可见光谱内的光表现同样的反射率的红外油墨印刷,覆盖在所述码图上的其它印刷内容采用对红外光谱的光表现为透射的油墨印刷。
上述的印刷出版物,所述二维码携带的信息包括与所述出版物的出版种类索引编码和所述出版物中不同部分的内容相应的多媒体资料索引编码。
所述出版物的出版种类索引编码和所述出版物中不同部分的内容相应的多媒体资料索引编码包括6个具有固定的位数长度的功能段:语种号、分类号、种次号、页序号、码序号和校验号;其中,语种号是语种数字代号,依据出版物的语种而定;分类号是某个语种中的出版物分类数字代号,依据出版物的图书门类而定;种次号代表某语种出版物内某分类图书的具体种次,可以是流水号;页序号是索引编码的内容所对应的所述出版物的页码数字;码序号是对应出版物中使用二维码的页面所用二维码的数量和标注顺序的号码;校验号用以检查索引编码的正误。
所述出版物的出版种类索引编码和所述出版物中不同部分的内容相应的多媒体资料的索引编码包括16位十进制数字,其中每个功能段的长度分别为语种号1位、分类号2位、种次号6位、页序号4位、码序号2位和校验号1位。所述出版种类索引编码和所述多媒体资料索引编码的校验位的数值通过对编码的前面15个十进制数进行计算得到,计算方法是:依次分别取出版物多媒体信息索引号的前15个十进制数的每一位为基数,以“1”和“2”为加权因子,与所取基数的段的十进制数对应相乘,再将各乘积之和被模数10除,即各段基数乘以加权因子,积大于10时,求各项乘积之和时应将该项乘积的十位数与个位数相加,当各项乘积之和少于10时,将其乘积之和加10后再被模数10除,其余数与10的差,即是校验位的数值。
再次,本发明提出了一种二维码解码方法,包括如下步骤:
1)使用识读设备读取码图,获得灰度码图图像;
2)对所述灰度码图图像作二值化处理,得到二值化图像;
3)对二值化图像进行数据分析,检测出每一个点的边缘,得到边缘图像;
4)对边缘图像进行数据分析,跟踪其中的闭合边界,舍弃其中的所有非闭合边界,得到闭合边界图像;
5)对闭合边界图像做数据分析,计算每一个闭合边界内的面积,筛选出定位点单元;
6)对定位点单元作矩形匹配,选定一个单独的码图符号的图像;
7)对该码图符号的图像中的数据点分组;
8)重构数据点矩阵;
9)码字还原。
上述的方法,所述步骤5)筛选出定位点单元的过程包括:
51)计算每一个闭合边界内的面积,统计出所有闭合边界内的面积的直方图,找到面积直方图中分布最集中的面积值S0
52)面积在以S0为中心、并符合规定误差范围内的闭合边界即是数据点单元;面积是S0的已知倍数、并符合规定误差范围内的闭合边界就是定位点单元。
上述的方法,在已知条码单元的形状为圆点时,所述步骤5)之前,还包括步骤5′)进行圆点识别的过程,包括:
51′)将闭合边界所有边界点的象素横坐标累加,将累加和除以边界点总数得到闭合边界的中心点象素横坐标u;将所有边界点象素纵坐标累加,将累加和除以边界点总数得到闭合边界的中心点象素纵坐标v;
52′)以闭合边界中心点象素坐标(u,v)按四个方向扫描寻找闭合边界的直径,分别得到四个长度值d1,d2,d3,d4;
53′)取平均直径为d=(d1+d2+d3+d4)/4,定义圆的规范度为N=|d-d1|/d+|d-d2|/d+|d-d3|/d+|d-d4|/d;
54′)对每一个闭合边界计算其N值,根据实测统计结果将N值大于设定阈值TN的闭合边界丢弃,剩下的闭合边界认为是条码圆点单元的边界。
上述的方法,所述步骤6)对定位点单元作矩形匹配的过程包括:
61)选取离图像中心最近的一个定位点作为第一个参考点;
62)选取离第一个参考点最近的另外一个定位点作为第二个参考点;
63)两个参考点组成的边为目标矩形的参考边,以第一个参考点为原点,计算第二个参考点的极坐标(r0,θ0);
64)计算其余定位点相对于第一个参考点的极坐标(ri,θi),i∈[1~n],n为定位点单元总数;
65)第一个参考点为中心,相对于参考边,计算可能存在的4个码图符号外接矩形的其它定位点的极坐标:
P1=(r0,θ0),
P2=(r0 *1.414,θ0+45),P3=(r0 *1,θ0+90)
P4=(r0 *1.414,θ0+135)
P5=(r0 *1,θ0+180)
P6=(r0 *1.414,θ0+225)
P7=(r0 *1,θ0+270)
P8=(r0 *1.414,θ0+315)
其中:P0为第一参考点,P1为第二参考点,所有极坐标的角度都归一到[0,360]度的范围内;
66)在步骤64)的计算结果中寻找与P1至P8匹配的极坐标点,P0、P1与P2、P3的匹配点组成第一个目标矩形,如果不能成功匹配,则P0与P3、P4以及P5的匹配点组成第二个目标矩形,如果还是不能成功匹配,则P0与P5、P6以及P7的匹配点组成第三个目标矩形,如果还是不能成功匹配,则P0、P1与P8、P7的匹配点组成第四个目标矩形;如果还是不能成功匹配,则解码失败。
上述的方法,所述步骤7)数据点分组的过程包括:
71)以定位点四点坐标划定一个闭合四边形,
72)判断数据点是否位于该四边形内,该四边形内的数据点属于当前码图的数据点。所述步骤72)判断一个点是否在四边形内的方法包括:分别判断一个点是否在四边形的两组对应边内;是,则该点在四边形内;否,则该点不在四边形内;设两边的直线方程为y=k1*x+b1;y=k2*x+b2;点(x0,y0)在两边之内条件为:(k1*x0+b1-y0)*(k2*x0+b2-y0)<0。
上述的方法,所述步骤8)重构数据点矩阵的过程包括:
81)设定四角定位点单元模块的坐标,从而设定每一个条码单元的棋盘坐标;
82)按照坐标校正公式,根据每个数据点的中心坐标计算出对应在条码符号棋盘中的坐标。
本发明还提出一种多媒体资料索引信息的存储方法,包括:在可印刷介质上存储供正常阅读的图文和供设备识别的存储有所述多媒体资料索引信息的二维码;所述二维码其码图符号由具有不同光学反射率的条码单元在基底上排列而成,所述码图符号为矩形,所述符号中的所述条码单元为等间距排列的实心点,位于码图四角的单元是用于边界定位与识别的定位点,其余的单元是数据点,所述定位点的面积大于数据点的面积,其特征是:所述码图符号在基底上重复排列,无缝拼接为码图阵列,码图阵列包括至少二个相同的码图符号,并且相邻码图共用定位点。
所述条码单元的形状为实心圆点,所述定位点单元的直径为数据点单元的直径的二倍。
所述码图符号具有10×10个条码单元,除定位点外,每相邻的8个数据点为一组,表示一个码字;所述定位点单元的坐标分别为(0,0)、(9,0)、(0,9)以及(9,9);在由定位点坐标规定的棋盘坐标系中,数据点单元分为12组,各表示一个码字;第一组包括的单元坐标为(1,0),(2,0),(0,1),(1,1),(2,1),(0,2),(1,2),(2,2);第二组包括的单元坐标为(3,0),(4,0),(5,0),(6,0),(3,1),(4,1),(5,1),(6,1);第三组包括的单元坐标为(7,0),(8,0),(7,1),(8,1),(9,1),(7,2),(8,2),(9,2);第四组包括的单元坐标为(3,2),(4,2),(2,3),(3,3),(4,3),(2,4),(3,4),(4,4);第五组包括的单元坐标为(5,2),(6,2),(5,3),(6,3),(7,3),(5,4),(6,4),(7,4);第六组包括的单元坐标为(0,3),(1,3),(0,4),(1,4),(0,5),(1,5),(0,6),(1,6);第七组包括的单元坐标为(8,3),(9,3),(8,4),(9,4),(8,5),(9,5),(8,6),(9,6);第八组包括的单元坐标为(2,5),(3,5),(4,5),(2,6),(3,6),(4,6),(3,7),(4,7)为;第九组包括的单元坐标为(5,5),(6,5),(7,5),(5,6),(6,6),(7,6),(5,7),(6,7);第十组包括的单元坐标为(0,7),(1,7),(2,7),(0,8),(1,8),(2,8),(2,9),(3,9);第十一组包括的单元坐标为(3,8),(4,8),(5,8),(6,8),(3,9),(4,9),(5,9),(6,9);第十二组包括的单元坐标为(7,7),(8,7),(9,7),(7,8),(8,8),(9,8),(7,9),(8,9)。
所述码图符号在通常的阅读环境中肉眼不可见;或相对于普通印刷图文,所述码图符号肉眼不易见。
所述码图的单元采用对红外光谱的光表现为不同的反射率、对可见光谱内的光表现同样的反射率的红外油墨印刷,覆盖在所述码图上的其它印刷内容采用对红外光谱的光表现为透射的油墨印刷。
所述多媒体资料索引信息是出版物的多媒体资料索引信息,二维码携带的信息包括与所述出版物的出版种类索引编码和所述出版物中不同部分的内容相应的多媒体资料索引编码。
由于采用以上的技术方案,本发明带来了如下的有益效果:
本发明的二维码在码图符号的四个角采用面积大于数据点的定位点,并且码图符号阵列共用定位点,排除了二维码对静区的要求,同样的码图可以重复印刷、无缝拼接为码图阵列,获取码图简便;简化了条码解码算法,使码图可以印刷的更紧密更小,提高了编码效率。本发明的二维码符号可以不需要肉眼清晰可见,无需独自占用空白版面,所以不会对出版物的印刷排版造成影响,使用方便灵活。本发明的二维码应用非常简便,数据读取快捷,可靠性高,误码率低。对设备的要求低,利于广泛推广应用。
使用本发明的二维码的出版物,由于采用同一个码重复排列大面积印刷,便于阅读器读取,而且无须“对准”动作,阅读器随便放总有码在阅读器的阅读范围内。采用重复大面积印刷时,当文字覆盖在二维码的排列区上时,某些二维码可以从字里行间中完整露出;或者采用不同油墨使识读器对覆盖在条码上的印刷内容产生透视效果,使二维码可以方便地被读取。
由于本发明的二维码可以实现对所有出版物的所有语音索引号进行无重复编码,使得使用这种二维码的出版物完全具备成为一种新的出版物种的数量条件,由于解码算法运算量小,解码时间更短,可以采用较低成本的硬件,使应用本发明的二维码的出版物的成本降低。二维码的单元模块取两种颜色,只要前景色的亮度值与背景色的亮度值有足够的差别,即可保证条码的易识读性;背景色可直接用纸张或者其他印刷媒介的底色,节省印刷成本。
【附图说明】
图1是本发明实施例的单个码图符号示意图。
图2是本发明实施例的多个码图相邻重复排列的示意图。
图3是本发明二维码的解码流程图。
图4是使用阅读器获取的本发明二维码的原始图像。
图5是图4所示的原始图像的增强图像。
图6是图5所示的原始图像二值化的图像。
图7是边界检测时某个像素的相邻像素的定义示意图。
图8是对图6所示的二值化图像进行边界检测得到的边界图像。
图9是计算闭合边界图像的圆形规范度的示意图。
图10是解码流程中定位点筛选结果的示意图。
图11是解码流程中进行定位圆点的矩形匹配的示意图。
图12是定位圆点的矩形匹配结果示意图。
图13是解码重构出的条码符号圆点布局图。
【具体实施方式】
下面通过具体的实施例并结合附图对本发明作进一步详细的描述。
本发明的二维码,其码图的条码单元可以采用圆点,也可以是其它形状的实心点。每一个黑点代表一个条码单元,对应地每一个白点也是一个条码单元,如果黑点的值等于1,那么白点的值就等于0,反之也然。白点可以不用印刷,直接用纸张等印刷媒介的底色。
黑点的直径应足够大,以便于印刷具体需视印刷机而定。编码时可以采用RS编码,保证其有足够纠错能力。解码算法运算量小,以便于低成本的MCU运行。
本发明的二维码可以作为暗码印刷,即码图符号在日光下,人眼不可见,只有专用设备或者特定光照下才显现。由于暗码也可以放大明印,或排列成与文字大小相当的阵列并加大黑点明印,以便于肉眼查找,故本发明的二维码能支持暗码就可支持明码。在明码印刷时,多个码图排列,可减少对准要求。码图的总边长希望尽量小。
请结合图1、图2所示,图1是本发明实施例的单个码图符号示意图,图2是本发明实施例的多个码图相邻重复排列的示意图。图1的码图符号中四角的大黑圆点是码图的识别与定位特征,小圆点为条码单元,用来表示数据,大圆点直径可以是小圆点直径的两倍,大圆点总是为深色,小圆点深色表示1,浅色表示0;图1中每8个被标为同一种图案的相邻圆点表示一个码字,一个码图符号具有共12个码字,从左至右从上至下依次标为码字1~码字12,码字在符号中的坐标以及码字的比特位排列顺序定义如下面的码字布局表:
码字布局表;
  码字序号   码字在符号中的坐标(x,y),比特排列顺序(bit7~bit0)
  1   (1,0),(2,0),(0,1),(1,1),(2,1),(0,2),(1,2),(2,2)
  2   (3,0),(4,0),(5,0),(6,0),(3,1),(4,1),(5,1),(6,1)
  3   (7,0),(8,0),(7,1),(8,1),(9,1),(7,2),(8,2),(9,2)
  4   (3,2),(4,2),(2,3),(3,3),(4,3),(2,4),(3,4),(4,4)
  5   (5,2),(6,2),(5,3),(6,3),(7,3),(5,4),(6,4),(7,4)
  6   (0,3),(1,3),(0,4),(1,4),(0,5),(1,5),(0,6),(1,6)
  7   (8,3),(9,3),(8,4),(9,4),(8,5),(9,5),(8,6),(9,6)
  8   (2,5),(3,5),(4,5),(2,6),(3,6),(4,6),(3,7),(4,7)
  9   (5,5),(6,5),(7,5),(5,6),(6,6),(7,6),(5,7),(6,7)
  10   (0,7),(1,7),(2,7),(0,8),(1,8),(2,8),(2,9),(2,9)
  11   (3,8),(4,8),(5,8),(6,8),(3,9),(4,9),(5,9),(6,9)
  12   (7,7),(8,7),(9,7),(7,8),(8,8),(9,8),(7,9),(8,9)
一个码图符号中12个字节的编码容量可以根据应用合理分配数据码和纠错码的长度。同一个码图,在水平方向与垂直方向上多次重复,以提高取景击中概率,相邻两个码图共用两个大定位圆点,因此可以做到码图的无缝拼接,最大限度的提高面积效率。
在获取本发明的二维码符号的图像后,解码开始。作为一个实施例,请参考图3所示的解码流程图,具体步骤包括:图像增强,图像二值化,边缘检测,闭合边界跟踪,圆点识别,筛选定位圆点,定位圆点举行匹配,数据点分组,重构数据点矩阵,码字还原并纠错。
解码流程详述如下:
一、图像增强
为了提高码图的识别率,在有需要的前提下,可以先对读取的如图4所示的原始图像进行图像增强,得到如图5所示的增强图像。图像增强算法可以采用USM(Unsharp Mask)算法,该算法是数字图像处理领域人员熟知的图像增强算法,其原理是先对原图像用二维高斯低通滤波获得模糊的图像,然后从原图像中减去该模糊的图像得到对比度增强的图像。设原图像为F(x,y),经过二维高斯低通滤波后得到图像U(x,y),则增强的图像为V(x,y)=F(x,y)+K×(F(x,y)-U(x,y)),其中K为增强系数,经验值为1~4,K越大增强效果越明显,但图像中的噪声也会被放大。
二、二值化
获得增强的图像后需要对其进行二值化处理,设定一个阈值T(0<T<255),亮度大于T的像素归为白,其它像素归为黑,因为图像增强后像素亮度值的动态范围扩大了,背景亮度趋近于最大值255,组成圆点的像素的亮度趋近于最小值0,因此很容易选择一个固定的或动态的阈值T。二值化处理后得到如图6所示的图像。
三、边缘检测
对二值化后的图像进行边缘检测,边缘像素的定义为:像素值为0且像邻8个像素中有非0像素的像素。某个像素相邻像素的定义如图7所示:编号为0的像素其相邻8个像素分别为编号为1至8的像素。
如果一个像素是边缘像素将标记为最大亮度255,否则标记为0,对二值图像中所有像素作边缘检测得到边界图像,如图8所示。
四、闭合边界跟踪
闭合边界跟踪的操作对象为上一步骤中边界检测得到的边界图像,具体包括如下步骤:
A)对边界图像按行主的方向扫描(即从左至右,从上至下),以扫描到的第一个边缘像素为边界跟踪的起点像素,如果没有边缘像素则表明本次流程结束;
B)将起点像素的坐标放入队列Q,并将该起点像素标记为0,表示已跟踪过了;
C)判断起点像素的相邻8个像素中是否有边缘像素,如果有则任选一个像素作为下次跟踪的起点,跳转到上一步骤B;否则本次跟踪结束,队列Q中的坐标列表即是一个闭合边界,也是候选目标圆点的边界,存储队列Q中的坐标列表并将其清空,跳转到上述步骤A。
此流程结束后圆点图像的边界都被检测出来了,同时部分噪声黑点混入了检测结果。
五、圆点识别
本步骤目的在于从步骤四的检测结果中剔除部分噪声数据,即将非圆形闭合边界丢弃,噪声数据的判断依据是圆的几何特征。如果码图采用的本发明的二维码,其单元是其它形状的实心点,则不执行该步骤。如图9所示,对于一个闭合边界,首先将所有边界点横坐标累加,将累加和除以边界点总数得到闭合边界的中心点横坐标u,然后再将所有边界点纵坐标累加,将累加和除以边界点总数得到闭合边界的中心点纵坐标v,以闭合边界中心点坐标(u,v)按四个方向扫描闭合边界的直径,分别得到四个长度值d1,d2,d3,d4,设平均直径为d=(d1+d2+d3+d4)/4,定义圆的规范度为N=|d-d1|/d+|d-d2|/d+|d-d3|/d+|d-d4|/d,N的值越小则闭合边界是圆的可信度越高。对每一个闭合边界计算其N值,根据实测统计结果将N值大于某个阈值TN的闭合边界丢弃,剩下的闭合边界认为是条码圆点的边界。
六、选定位圆点
此过程从已识别出的圆点中筛选出定位圆点。请参考图10所示,先统计圆点面积的直方图,找到面积直方图中分布最集中的面积值S0,则S0为中心的一个范围对应的即是数据圆点的面积,而定位圆点的面积则在以4*S0为中心的范围,据此将面积直方图分成两部分,一部分对应数据圆点,一部分对应定位圆点。这种基于统计的计算方法是稳定的,因为就一个码图而言,有96个数据点,依据统计值深色圆点的个数为48,因此面积直方图不会出现因为圆点数太少导致统计结果不稳定的问题。
如果码图采用的本发明的二维码,其单元是其它非圆形形状的实心点,则在执行该步骤时,先计算每一个闭合边界内的面积,再统计每一个闭合边界面积的直方图,找到面积直方图中分布最集中的面积值S0,则以S0为中心的一个范围对应的即是数据点的面积,而定位点的面积则是数据点的面积的数倍,该倍数可以根据预先确定的定位点与数据点的尺寸确定。据此在面积直方图提取两部分,一部分以S0为中心对应数据圆点,一部分以S0的数倍为中心对应定位圆点。这种方法对噪声数据的判断依据是闭合边界内的面积大小,一些面积过小或者过大的没有统计特征的闭合边界被舍弃。
七、定位圆点的矩形匹配
四个定位圆点确定一个独立的码图,此过程就是确定哪些定位圆点确定了码图,所依据的前提条件是每个码图四角的定位圆点组成一个矩形。过程如下:
a)选取离图像中心最近的一个定位圆点作为第一个参考点;
b)选取离第一个参考点最近的另外一个定位圆点作为第二个参考点;
c)两个参考点组成的边为目标矩形的参考边,以第一个参考点为原点,计算第二个参考点的极坐标(r0,θ0);
d)计算其余定位点相对于第一个参考点的极坐标(ri,θi),i∈[1~n],n为定位圆点总数;
e)计算以第一个参考点为中心可能存在的4个矩形的其它定位点相对于参考边的极坐标:
P1=(r0,θ0),
P2=(r0 *1.414,θ0+45),P3=(r0 *1,θ0+90)
P4=(r0 *1.414,θ0+135)
P5=(r0 *1,θ0+180)
P6=(r0 *1.414,θ0+225)
P7=(r0 *1,θ0+270)
P8=(r0 *1.414,θ0+315)
如图11、图12所示,P0为所述第一参考点,P1为所述第二参考点,所有极坐标的角度都归一到[0,360]度的范围内;
f)在步骤d)的计算结果中寻找与P1至P8匹配的极坐标点,P0、P1与P2、P3的匹配点组成第一个目标矩形,P0与P3、P4以及P5的匹配点组成第二个目标矩形,P0与P5、P6以及P7的匹配点组成第三个目标矩形,P0、P1与P8、P7的匹配点组成第四个目标矩形。
八、数据点分组
码图的四个定位圆点确定下来后,以定位圆点四点坐标划定一个闭合四边形,四边形内的数据点才属于当前码图的数据点。判断一个点是否在四边形内可以分两次判断一个点是否分别在四边形的两条对边之内,一个点在两边之内的判断方法为:
设两边的直线方程为y=k1*x+b1;y=k2*x+b2;点(x0,y0)在两边之内条件为:
(k1*x0+b1-y0)*(k2*x0+b2-y0)<0;
九、重构数据点矩阵
设四角定位圆点在条码中的名义坐标分别为(0,0)、(20,0)、(0,20)以及(20、20);根据这四个定位圆点的坐标,按照下面的坐标校正公式即计算出数据圆点在条码中的名义坐标:
x’=K0*x+K1*x*y+K2*y+K3
y’=K4*x+K5*x*y+K6*y+K7
(x’,y’)为条码圆点的名义坐标,(x,y)为图像中圆点的中心坐标,将四角定位圆点在条码中的名义坐标以及它们在图像中的坐标代入上面的公式得到8个8元一次方程,解方程组得出K0~K7,将K0~K7代入方程就得到了坐标转换方程,将每个数据点在图像中的中心坐标代入该方程组,计算出该数据点在条码中的名义坐标,由于上面所述的坐标转换是以左上角的定位原点映射为目标矩阵的原点,因此各数据点在条码中的名义坐标值为奇数,转换后的坐标值应向最近的奇数取整。
十、码字还原并纠错
如图13所示,上述步骤九得到了重构的数据点矩阵,根据编码过程的码字布局的逆过程即可还原码字,运用Reed-solomon纠错算法按照与编码参数对应的解码参数对步骤八得到的码字纠错。
随着计算机技术和存储技术的发展,文字图像类的出版物常常伴有相应的多媒体影音资料。图书往往可以按照章节分成几个部分同时还编有页码,读者可以根据图书的目录选择不同的章节阅读;这些与图书相应的多媒体影音资料也可以同样分成几个相应的部分,读者同样可以按照索引选择相应的部分播放。又例如某些出版物中可以为一些文字注音或者翻译成另一种文字,这种翻译和注音也可以使用多媒体方式存储,并配置索引。使用本发明的二维码,这个多媒体资料的索引可以印刷在图书的相应部位,例如在图书的目录处,和/或者在图书的不同章节的首页,或者在页面的不同部位。同时这个多媒体资料的索引能由多媒体播放设备读取并自动选择到要播放的段落。
本发明的二维码用在出版物上,以码图符号的阵列作为页面的底纹印刷,而其它文字内容则覆盖在码图之上,这样识读设备在获取码图符号时,不用特别对准,总能获取字里行间的码图符号。而且页面排版美观。
本发明的二维码应用在出版物上作为多媒体资料的索引时,可以使用统一的编码方式,使得各种不同出版物的每一段多媒体资料都具有统一的唯一编码,这种标准化的统一编码,有利于多媒体资料的出版物的推广应用和交流。
标准的出版物二维码出版物的出版种类索引编码和所述出版物中不同部分的内容相应的多媒体资料的索引编码的编制结构包括:
每个二维码的内容都由16位十进制数字组成,分为6个功能段,每段具有固定的位数长度,包括:语种号、分类号、种次号、页序号、码序号、校验号。
例如一份出版物的多媒体索引编码信息如下:
语种号  分类号  种次号  页序号  码序号  校验号
1       10      100258  0035    12      9
其中:
语种号是指为出版物二维码编制所特别设定的语种数字代号,语种号长度为1位十进制数,分为汉语、英语、法语、日语、德语、俄语、西班牙语、其他语种和二个待补入语种,用数字0、1、2、3、4、5、6、7、8、9对应表示。
分类号是指为出版物二维码编制所特别设定的分类数字代号,所指“分类”是依据出版物所适应的图书门类而专门设定的。这段编号表示每个语种内的具体分类数。每个分类号为2位十进制数,二维码中的分类号在“00-99”之间取值。
种次号是指为出版物二维码编制所特别设定的种次代表数字,本段编号代表某语种出版物内某分类所分图书的具体种次数。每个种次号的位数为6位十进制数,分配时可以按出版品种需要和先后顺序编制流水号,二维码中的种次号在“000000-999999”之间取值。每一分类的每一个出版物必须给出一个不同的种次号。
以上设定,语种号可分数量为10个,每语种可分门类(分类)号是100个,每个门类可容出书100万种。从而,每个语种可出图书为1亿种;本编码方案可供10亿种出版物使用。
页序号是指编入出版物二维码中的页码数字标示。每个页序号的位数为4位十进制数,可以按照该多媒体资料对应出版物的页码对应的流水号编制页序号,每个二维码中的页序号在“0001-9999”之间取值。当超过1万页时,另外给出MPR编号,例如某出版物的第21页有二维码出现,则此二维码中的页序号段的数字是“0021”。
码序号是指出版物中使用二维码的页面所用二维码的数量和标注顺序,并以此作为编制二维码码序号所分配的数值。每页的码序号位数为2位十进制数,按每页用码次序从数字01开始编制流水号。每个二维码中的码序号在“01-99”之间取值。例如某出版物第8页只有一个二维码时,其页序号和码序号表示为“000801”。
校验位是出版物二维码编制的最后一位数字,用以检查编码录用中的正误。
校验位的数值通过对编码的前面15个十进制数进行计算得到,计算方法是:依次分别取出版物多媒体信息索引号的前15个十进制数的每一位为基数,以“1”和“2”为加权因子,与所取基数的段的十进制数对应相乘,再将各乘积之和被模数10除,即各段基数乘以加权因子,积大于10时,求各项乘积之和时应将该项乘积的十位数与个位数相加,如:10→1+0=1,16→1+6=7,当各项乘积之和少于10时,将其乘积之和加10后再被模数10除,其余数与10的差,即是校验位的数值。所以,校验位的数值只能是1-10中的任何一个整数,当校验位为10时,用“0”表示,由此可见校验位只能是1234567890恒为一位数。
例:  1  1  6  0  6  3  4  5   2  0  0  8   6  2  9  (6)
         2  1  2  1  2  1  2   1  2  1  2   1  2  1
乘积:1  2  6  0  6  6  4  10  2  0  0  16  6  4  9
各项乘积之和:
1+2+6+0+6+6+4+(1+0)+2+0+0+(1+6)+6+4+9=54
54÷10=5余4
校验位:10-4=6
验算:1+2+6+0+6+6+4+(1+0)+2+0+0+(1+6)+6+4+9+6=60
60÷10=6
因为:当校验码与编码的前15个十进制数分别乘积所得单位数字之和相加,正好被模数整除时,表明编码正确。
所以:编码1160634520086296是一个正确的出版物多媒体索引编码。
出版物二维码编制结构的特点在于,出版物多媒体索引编码的结构是16位十进制数字,并将该16位十进制数编制为二维码,所分的每段长度是恒定位数,每个的出版物多媒体索引编码的分配都具唯一性,所编制的二维码保证了MPR阅读笔或者其它多媒体播放设备的读出正确,为计算机管理提供了方便。
如:本发明的二维码是1160634520086296时,可按排列顺序区分6段,语种号固定1位数字1,分类号固定2位数字16,种次号固定6位数字063452,页序号固定4位数字0086,码序号固定2位数字29,校验位固定1位数字6,于是得到1-16-063452-0086-29-6,即该二维码编码是指代码为1的语种、分类代码为16的第063452种出版物的第86页的第29个编码。

Claims (5)

1.一种多媒体资料索引信息的存储方法,包括:在可印刷介质上存储供正常阅读的图文和供设备识别的存储有所述多媒体资料索引信息的二维码;所述二维码其码图符号由具有不同光学反射率的条码单元在基底上排列而成,所述码图符号为矩形,其特征是:所述符号中的所述条码单元为等间距排列的实心点,位于码图四角的单元是用于边界定位与识别的定位点,其余的单元是数据点,所述定位点的面积大于数据点的面积,所述码图符号在基底上重复排列,无缝拼接为码图阵列,码图阵列包括至少二个相同的码图符号,并且相邻码图共用定位点;所述多媒体资料索引信息是出版物的多媒体资料索引信息,二维码携带的信息包括与所述出版物的出版种类索引编码和所述出版物中不同部分的内容相应的多媒体资料索引编码。
2.如权利要求2所述的存储方法,其特征是:所述条码单元的形状为实心圆点,所述定位点单元的直径为数据点单元的直径的二倍。
3.如权利要求2中所述的存储方法,其特征是:所述码图符号具有10×10个条码单元,除定位点外,每相邻的8个数据点为一组,表示一个码字;所述定位点单元的坐标分别为(0,0)、(9,0)、(0,9)以及(9,9);在由定位点坐标规定的棋盘坐标系中,数据点单元分为12组,各表示一个码字;第一组包括的单元坐标为(1,0),(2,0),(0,1),(1,1),(2,1),(0,2),(1,2),(2,2);第二组包括的单元坐标为(3,0),(4,0),(5,0),(6,0),(3,1),(4,1),(5,1),(6,1);第三组包括的单元坐标为(7,0), (8,0),(7,1),(8,1),(9,1),(7,2),(8,2),(9,2);第四组包括的单元坐标为(3,2),(4,2),(2,3),(3,3),(4,3),(2,4),(3,4),(4,4);第五组包括的单元坐标为(5,2),(6,2),(5,3),(6,3),(7,3),(5,4),(6,4),(7,4);第六组包括的单元坐标为(0,3),(1,3),(0,4),(1,4),(0,5),(1,5),(0,6),(1,6);第七组包括的单元坐标为(8,3),(9,3),(8,4),(9,4),(8,5),(9,5),(8,6),(9,6);第八组包括的单元坐标为(2,5),(3,5),(4,5),(2,6),(3,6),(4,6),(3,7),(4,7);第九组包括的单元坐标为(5,5),(6,5),(7,5),(5,6),(6,6),(7,6),(5,7),(6,7);第十组包括的单元坐标为(0,7),(1,7),(2,7),(0,8),(1,8),(2,8),(2,9),(3,9);第十一组包括的单元坐标为(3,8),(4,8),(5,8),(6,8),(3,9),(4,9),(5,9),(6,9);第十二组包括的单元坐标为(7,7),(8,7),(9,7),(7,8),(8,8),(9,8),(7,9),(8,9)。
4.如权利2所述的存储方法,其特征是:所述码图符号在通常的阅读环境中肉眼不可见;或相对于普通印刷图文,所述码图符号肉眼不易见。
5.如权利要求2所述的存储方法,其特征是:所述码图的单元采用对红外光谱的光表现为不同的反射率、对可见光谱内的光表现同样的反射率的红外油墨印刷,覆盖在所述码图上的其它印刷内容采用对红外光谱的光表现为透射的油墨印刷。 
CN2009101354591A 2006-11-16 2006-11-16 多媒体资料索引信息的存储方法及用该方法的印刷出版物 Active CN101546387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101354591A CN101546387B (zh) 2006-11-16 2006-11-16 多媒体资料索引信息的存储方法及用该方法的印刷出版物

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101354591A CN101546387B (zh) 2006-11-16 2006-11-16 多媒体资料索引信息的存储方法及用该方法的印刷出版物

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101568794A Division CN100511271C (zh) 2006-11-16 2006-11-16 二维码解码方法

Publications (2)

Publication Number Publication Date
CN101546387A CN101546387A (zh) 2009-09-30
CN101546387B true CN101546387B (zh) 2012-05-23

Family

ID=41193513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101354591A Active CN101546387B (zh) 2006-11-16 2006-11-16 多媒体资料索引信息的存储方法及用该方法的印刷出版物

Country Status (1)

Country Link
CN (1) CN101546387B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043940B (zh) * 2009-10-14 2014-06-18 北大方正集团有限公司 二维码符号数据的识读方法和装置
CN105403235A (zh) * 2014-09-15 2016-03-16 吴旻升 二维空间定位系统及方法
CN105260693B (zh) * 2015-12-01 2017-12-08 浙江工业大学 一种激光二维码定位方法
CN106250833B (zh) * 2016-07-22 2019-11-19 深圳棒棒帮科技有限公司 用于信息映射的微图形组的生成方法和微图组的识别方法
CN109919279B (zh) * 2019-02-28 2020-12-08 尤尼泰克(嘉兴)信息技术有限公司 一种二维码的扩展方法
CN112446918A (zh) * 2019-09-04 2021-03-05 三赢科技(深圳)有限公司 图像中目标物体定位方法、装置、计算机装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1670763A (zh) * 2004-03-15 2005-09-21 深圳矽感科技有限公司 一种二维条码及其编解码方法
CN1801188A (zh) * 2006-01-18 2006-07-12 冯文伦 一种矩阵式二维条码及其编码解码方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1670763A (zh) * 2004-03-15 2005-09-21 深圳矽感科技有限公司 一种二维条码及其编解码方法
CN1801188A (zh) * 2006-01-18 2006-07-12 冯文伦 一种矩阵式二维条码及其编码解码方法

Also Published As

Publication number Publication date
CN101546387A (zh) 2009-09-30

Similar Documents

Publication Publication Date Title
CN100511271C (zh) 二维码解码方法
CN101477638B (zh) 一种二维码、应用该二维码的印刷出版物及解码方法
CN101546387B (zh) 多媒体资料索引信息的存储方法及用该方法的印刷出版物
CN103778451B (zh) 带有用于指定单元位置并与背景区分的特定图案的二维码
US9710741B2 (en) Information code generation method, information code, and information code use system
CN107133571A (zh) 一种将纸质发票自动生成财务报表的系统及方法
CN102194275A (zh) 一种车票自动检票方法
Dongre et al. Development of comprehensive devnagari numeral and character database for offline handwritten character recognition
CN111611988A (zh) 图片验证码识别方法及装置、电子设备和计算机可读介质
Amin et al. Machine recognition of printed Arabic text utilizing natural language morphology
US7878413B2 (en) Method for the dual coding of information on physical media and in a computerized format (DOTEM)
CN107249903A (zh) 包括印刷的个人图像的识别文件
CN107491884A (zh) 条形码管理系统及方法
CN107742089B (zh) 一种使用电子表格进行二维码自动识别的方法
CN116343237A (zh) 基于深度学习和知识图谱的票据识别方法
KR20070015101A (ko) 1차원 흑백 바코드와 2차원 흑백바코드를 칼라코드로전환하는 방법과 그 알고리즘.
Wu et al. Masked vision-language transformers for scene text recognition
CN111611883A (zh) 基于最小单元格聚类的表格版面分析方法、系统及设备
CN115455955A (zh) 基于局部和全局字符表征增强的中文命名实体识别方法
US20150193900A1 (en) Composite device and application process and apparatus thereof
Ovodov Semantic-based annotation enhancement algorithm for semi-supervised machine learning efficiency improvement applied to optical Braille recognition
CN103400176B (zh) 一种数字字符编码及其识别方法
TWM618756U (zh) 影像識別系統
Majid et al. Digitization of Handwritten Chess Scoresheets with a BiLSTM Network
CN111091012A (zh) 条码机条码生成方法及相关产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant