CN104182934B - 基于书脊图像特征和空域滤波的自动图书清点方法 - Google Patents
基于书脊图像特征和空域滤波的自动图书清点方法 Download PDFInfo
- Publication number
- CN104182934B CN104182934B CN201410383904.7A CN201410383904A CN104182934B CN 104182934 B CN104182934 B CN 104182934B CN 201410383904 A CN201410383904 A CN 201410383904A CN 104182934 B CN104182934 B CN 104182934B
- Authority
- CN
- China
- Prior art keywords
- image
- spine
- books
- edge
- oscillogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明属于图书馆管理技术领域,具体提供了一种基于书脊图像特征和空域滤波的自动图书清点方法,包括如下步骤:(1)采集书库内的书脊图像;(2)检测书脊图像中的边缘和直线:对采集到书脊图像进行边缘检测,并将结果进行二值化;将二值化的图像通过Hough变换检测其中的直线,获取图书的排列方向倾角,沿着该方向的垂直方向对检测到的所有边缘像素点进行投影,获得边缘投影波形图;(3)对边缘投影波形图进行低通滤波,得到平滑过的波形图;(4)对图书进行计数清点:检测平滑波形图中的波峰的个数,波峰的个数即为书脊图像中的图书册数;本发明方法实现简单,可完全由计算机完成,大大降低了清点图书的工作量和劳动强度。
Description
技术领域
本发明属于图书馆管理技术领域,具体涉及一种基于书脊图像特征和空域滤波的自动图书清点方法。
背景技术
图书指标作为高等教育统计指标体系中的一项基础内容,也是高校基本办学条件的重要组成部分,能够客观地反映学校的办学实力和水平,对扩大学校办学规模、争取更多的经费投入具有重要的参考价值。
图书清点是图书馆对现有财产的自我盘点,是对图书数量的真实反映,是图书统计指标中的基础数据之一。图书清点目的在于确定图书馆现有的图书财产,使财产登记簿与库藏量相一致,全面清点对图书馆的采编、典藏及借阅等各部门的工作是一次全面的检查。另外图书馆中图书丢失现象时有发生,作为管理者必须通过清点来摸清第一手资料,才能有针对性地采取措施。
因此,图书清点工作对于图书馆的日常管理是非常必要的,但是传统工作方式耗时又费力,清点方法相对单一。RFID技术的引进,为图书清点工作起到一定作用,但存在RFID标签信号不稳定、RFID系统与图书馆业务系统之间的整合不完善、使用RFID标签成本颇高等问题,因此当前国内使用RFID标签的图书馆很较少,而且即使是采用了RFID技术的图书馆,绝大多数也只是部分图书使用了RFID标签,而其他技术比如盘点机等运用到清点中依然比较复杂。
数字图像处理技术结合计算机的高效工作效率性能,能够大幅提高常见重复性劳动的效率。针对书库内的架上图书均是按照一定规律整齐摆放,而且书脊向外,书脊上有书名、出版社等印刷文字的特征,可以通过对书脊图像的处理来完成对图书的清点。因此,我们可将图像处理技术引入到图书清点的方法中,可以利用Hough变换实现对书脊图像上文字信息和竖直排放角度的检测,并利用投影和空滤滤波技术实现对图书的自动计数,该计数算法的核心是Hough变换。Hough变换最早由P.V.C.Hough在上世纪六十年代提出,并经Duda和P.E.Hart二人推广而获得广泛应用,是Radon变换的一个特例。Hough变换是图像处理和计算机视觉中的一种重要方法,在图像特征提取、形状识别等应用领域效果明显,应用广泛。因此,用Hough变换实现对书脊图像上的直线检测,完全具备理论和技术上的可行性。
发明内容
本发明的目的是克服现有技术中图书馆庞大的图书数量使得工作人员在做图书实际数量清点时不得不付出大量的人力和时间的问题。
为此,本发明提供了一种基于书脊图像特征和空域滤波的自动图书清点方法,包括如下步骤:
(1)采集书库内的书脊图像,确保图像内只含有一排图书,并使书脊在竖直方向上占满整个图像,并记图像高度为XM像素,宽度为YM像素;
(2)检测书脊图像中的边缘和直线:对采集到书脊图像进行边缘检测,并将结果进行二值化;将二值化的图像通过Hough变换检测其中的直线,获取图书的排列方向倾角,沿着该方向的垂直方向对检测到的所有边缘像素点进行投影,获得边缘投影波形图;
(3)对边缘投影波形图进行低通滤波,得到平滑过的波形图;
(4)对图书进行计数统计:对步骤(3)中得到的平滑过的波形图,检测其中的波峰的个数,波峰的个数即为书脊图像中的图书册数。
上述步骤(2)中的边缘投影波形图按如下步骤获得:
(a)以二值化的边缘图的左下角为原点,建立直角x-y坐标系,并将边缘图置于坐标系的第一象限;
(b)利用Hough变换检测二值化的边缘图中的直线,并将检测出长度大于阈值TX的K条直线的参数构成集合L={(ρ1,θ1)...(ρK,θK)},其中ρi为原点到第i条直线的距离,θi为第i条直线法线x轴正方向的夹角;
(c)对位于两条参数分别(ρn,θn)和(ρm,θm)的相邻直线之间的图书的排列方向倾角定义为对于位于参数为(ρq,θq)的某直线与图像四个边界之间的图书的排列方向倾角定义为θq;
(d)将所有位于处于边缘上的像素点按照与相应图书排列方向垂直的方向进行投影,统计像素点个数,依次排列得到边缘投影波形图。
为了滤除步骤(3)中边缘投影波形图的尖峰毛刺,采用系数为[1/16,1/16,1/8,1/2,1/8,1/16,1/16]的空域滤波器进行滤波。
上述步骤(4)中的波峰按照如下方式确定:
对平滑过的边缘投影波形图中波形上任一点n,若其波形幅值p[n]对所有参数k满足:
p[n]≥p[n-k]
其中k是[-5,+5]之间的任一整数,则波形上在点n处存在一个波峰。
本发明的有益效果:本发明提供的这种基于书脊图像特征和空域滤波的自动图书统计方法,其步骤包括:(1)采集书库内的书脊图像;(2)检测书脊图像中的边缘和直线:对采集到书脊图像进行边缘检测,并将结果进行二值化;将二值化的图像通过Hough变换检测其中的直线,获取图书的排列方向倾角,沿着该方向的垂直方向对检测到的所有边缘像素点进行投影,获得边缘投影波形图;(3)对边缘投影波形图进行低通滤波,得到平滑过的波形图;(4)对图书进行计数清点:检测平滑波形图中的波峰的个数,波峰的个数即为书脊图像中的图书册数。本发明克服了现有技术中图书馆庞大的图书数量使得工作人员在做图书实际数量统计时不得不付出大量的人力和时间的问题,本发明实现简单,可完全由计算机完成,大大降低了清点图书的工作量和劳动强度;实验结果表明,本发明方法的清点准确率接近100%。
以下将结合附图对本发明做进一步详细说明。
附图说明
图1是本发明步骤的流程图;
图2是Hough变换示意图;
图3是三幅实验用的书脊图像;
图4是样本图的Hough变换直线检测结果与书脊文字信息;
图5是图4(a)的投影波形图;
图6是空域滤波后的书脊文字投影波形图;
图7是检测出的书脊文字投影波形的波峰。
具体实施方式
如图1所示,本发明包括如下步骤:
(1)采集书库内的书脊图像,确保图像内只含有一排图书,并尽量使书脊在竖直方向上占满整个图像,并记图像高度为XM像素,宽度为YM像素;此步骤中,考虑到外部环境的不同情况,通过调整外部光照和相机参数设置,保证能够获取清晰的架上图书的书脊图像。
(2)检测书脊图像中的边缘和直线:对采集到书脊图像进行边缘检测,并将结果进行二值化;将二值化的图像通过Hough变换检测其中的直线,获取图书的排列方向倾角,沿着该方向的垂直方向对检测到的所有边缘像素点进行投影,获得边缘投影波形图。
本步骤中的边缘投影波形图按如下步骤获得:
(a)以二值化的边缘图的左下角为原点,建立直角x-y坐标系,并将边缘图置于坐标系的第一象限;
(b)利用Hough变换检测二值化的边缘图中的直线,并将检测出长度大于阈值TX的K条直线的参数构成集合L={(ρ1,θ1)...(ρK,θK)},其中ρi为原点到第i条直线的距离,θi为第i条直线法线x轴正方向的夹角;
(c)对位于两条参数分别(ρn,θn)和(ρm,θm)的相邻直线之间的图书的排列方向倾角定义为对于位于参数为(ρq,θq)的某直线与图像四个边界之间的图书的排列方向倾角定义为θq;
(d)将所有位于处于边缘上的像素点按照与相应图书排列方向垂直的方向进行投影,统计像素点个数,依次排列得到边缘投影波形图。
(3)对边缘投影波形图进行低通滤波,得到平滑过的波形图;为了滤除步骤(2)中得到的投影波形图的尖峰毛刺,采用系数为[1/16,1/16,1/8,1/2,1/8,1/16,1/16]的空域滤波器进行滤波。
(4)对图书进行计数清点:对步骤(3)中得到的平滑过的波形图,检测其中的波峰的个数,波峰的个数即为书脊图像中的图书册数。
本步骤中的波峰按照如下方式确定:
对平滑过的边缘投影波形图中波形上任一点n,若其波形幅值p[n]对所有参数k满足:
p[n]≥p[n-k]
其中k是[-5,+5]之间的任一整数,则波形上在点n处存在一个波峰。
步骤(2)中的Hough变换的基本思想是利用点-线的对偶性,即数字图像空间中共线的点对应在参数空间里相交的线,同时在参数空间中交于同一个点的所有直线在图像空间里都有共线的点。在图像空间的x-y坐标系中,所有处于某条直线上的点(x,y)的坐标都满足以下直线方程:
其中ρ为原点到直线上的距离,θ为直线的法线与横轴的夹角,一般取θ∈[0,π]。显然,图像空间中的每条直线对应着一个唯一的(ρ,θ)组合。而同时式(1)又可以改写为:
ρ=xcosθ+ysinθ(2)式(2)即为直线方程(1)的Hough变换,其中(ρ,θ)构成的空间又称为Hough参数空间。上式表明对任意图像空间中任意给定的一个点,比如图2(a)中A点(xA,yA),则对应着ρ-θ坐标系中的一个正弦曲线:
ρ=xAcosθ+yAsinθ(3)
图2给出了一个Hough变换的示意图。图2(a)为图像空间,图2(b)为Hough参数空间;图2(a)中的五个共线点对应着图2(b)中的五条正弦曲线。由于五个点共线,因此五条正弦曲线的交点(ρ0,θ0)即对应着图像空间中的特定直线。
显然,图像空间中某条直线越长则其上的点越多,相应地Hough变换后在参数空间经过某个特定点的正弦曲线越多。在Hough变换的作用下,图像空间中的直线检测问题被转化成参数空间中经过某点曲线的累加统计,检测的难度大大降低。利用Hough变换在图像中检测直线的基本策略就是:采用投票机制在一个累加器中给出经过该点的曲线总数,按照实现设定的阈值取出若干局部极大值,则这些极大值就对应于图像空间中较明显的直线。这种方法最大的优势是抗噪声能力强,同时可以避免直线间断带来的影响。
Hough变换的具体实现方法为:
在实际工程应用中,Hough变换处理的图像是二值化的边缘图,并且一般按如图2(a)所示方式以图像左下角为原点建立直接坐标系,Hough变换可由以下步骤实现:
1)极坐标下的参数空间划分成量化成M×N个单元,其中ρ被M等分,θ被N等分,并且ρ的取值范围是θ的取值范围是0~π;
2)给参数空间中的划分出的每个单元分配一个累加器Q(i,j),0≤i≤M-1,0≤j≤N-1,并把各累加器的初始值置为零;
3)任取出二值化的边缘图中的一点坐标带入式(2),计算出各个量化的θ值对应的ρ值;
4)依据3)中计算出的θ值和ρ值,将相对应的累加器Q(ρ,θ)加1;
5)当所有处于边缘上的点都经过步骤3)和4)遍历后,累加器数值若大于给定的阈值,则认为检测出了参数为该单元所对应θ值和ρ值的直线。
需要说明的是,在最后统计累加器数值时,阈值的选择需要依据实际需要设定,若想检测较长的直线则需较大阈值,若是想检测细小的线条结构则需较小阈值。上述Hough变换可同时实现对多条直线的检测。
本发明方法的实验结果
为了验证本发明的有效性,我们随机选取了书库中的一组书脊图像作为测试,所有实验均在WinXpsp3操作系统下的Matlab2010a编程实现。
图3中给出了三幅实际拍摄的书库的书脊图像。在拍摄时,为了更有代表性,图像在普通光照和焦距下拍摄,其中图3(b)与图3(a)内容部分相同,但焦距不同。上述图像如为彩色图像,则先转化为灰色图像,并进行边缘提取和Hough变换后,可以检测出图中较为显著的若干较长直线,如图4中白色线条所示。书脊上的字符和著者以及出版社等文字信息会被体现成为较短的直线集合。需要说明的是,白色线条并不是用来进行计数统计,他们只是用来确定图书竖直方向的倾角。
将书脊图像中被标记为文字信息的像素点向与书脊走向(即图4中白色直线走向)垂直的方向进行投影,并统计其数量,得到书脊文字投影波形图。这里给出图4(a)的投影波形图如图5所示。
由图5可知,波形图中存在有很多尖锐的毛刺,这些是往往处于书脊字符的边缘位置,也有一些是噪声造成的误检结果,因此对图4中的信号需要进行空域滤波,在此采用的空滤滤波器的系数是[1/16,1/16,1/8,1/2,1/8,1/16,1/16],该滤波器能有效去除毛刺并保留主要波形。使用该滤波器滤波后的书脊文字投影波形如图6所示。
滤波后的书脊文字投影波形能够很好地表征出书脊的分布情况,由于书脊文字一般在水平方向上连续分布而且由中心向两边减少,因此滤波后的投影波形中的波峰个数就是图书的册数。按照下式:
将检测出的波峰的位置和幅度用*表示,得到图7。从图7可知,波峰数为40,这与样本图中的图书册数相同。
按照上述算法,我们对各样本的书脊图像进行数目清点实验,时间结果归纳如表1所示。
表1本算法的图书册数检测准确率
由表1可知对于书脊不完整的图像,比如图3(b)中左上角位置所显示的一册图书,本方法容易漏检,降低了整体准确率。而这一点可以通过调整图像拍摄角度和位置的方法进行避免。若配合专用的照明和高质量成像设备,本算法的检测准确率能有更好保证。
本文提出的算法结合了数字图像处理中的Hough变换和空域滤波技术,以拍摄到的书库中在架图书的书脊图像为基础,给出了一种自动的图书册数清点的算法。实验结果表明,本算法具有超过98.5%的准确率,在理想情况下甚至能达到100%,并且算法简单高效,易于实施,相较于人工清点,工作量大为降低。在图书馆图书清点工作中,本算法具有较强实用价值。
本实施例没有详细叙述的部分属本行业的公知的常用手段,这里不一一叙述。以上例举仅仅是对本发明的举例说明,并不构成对本发明的保护范围的限制,凡是与本发明相同或相似的设计均属于本发明的保护范围之内。
Claims (3)
1.基于书脊图像特征和空域滤波的自动图书清点方法,其特征是:包括如下步骤:
(1)采集书库内的书脊图像,确保图像内只含有一排图书,并使书脊在竖直方向上占满整个图像,并记图像高度为XM像素,宽度为YM像素;
(2)检测书脊图像中的边缘和直线:对采集到书脊图像进行边缘检测,并将结果进行二值化;将二值化的图像通过Hough变换检测其中的直线,获取图书的排列方向倾角,沿着该方向的垂直方向对检测到的所有边缘像素点进行投影,获得边缘投影波形图;
(3)对边缘投影波形图进行滤波,得到平滑过的边缘投影波形图;
(4)对图书进行计数清点:对步骤(3)中得到的平滑过的边缘投影波形图,检测波形中波峰的个数,波峰的个数即为图像中包含图书的册数。
2.如权利要求1所述的基于书脊图像特征和空域滤波的自动图书清点方法,其特征是:为了滤除步骤(3)中边缘投影波形图的尖峰毛刺,采用系数为[1/16,1/16,1/8,1/2,1/8,1/16,1/16]的空域滤波器进行平滑。
3.如权利要求1所述的基于书脊图像特征和空域滤波的自动图书清点方法,其特征是:步骤(4)中的波峰按照如下方式确定:
对平滑过的边缘投影波形图中波形上任一点n,若其波形幅值p[n]对所有参数k满足:
p[n]≥p[n-k]
其中k是[-5,+5]之间的任一整数,则波形上在点n处存在一个波峰。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410383904.7A CN104182934B (zh) | 2014-08-06 | 2014-08-06 | 基于书脊图像特征和空域滤波的自动图书清点方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410383904.7A CN104182934B (zh) | 2014-08-06 | 2014-08-06 | 基于书脊图像特征和空域滤波的自动图书清点方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104182934A CN104182934A (zh) | 2014-12-03 |
CN104182934B true CN104182934B (zh) | 2016-05-04 |
Family
ID=51963953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410383904.7A Active CN104182934B (zh) | 2014-08-06 | 2014-08-06 | 基于书脊图像特征和空域滤波的自动图书清点方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104182934B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846354B (zh) * | 2017-01-23 | 2019-07-23 | 中国人民解放军海军航空大学 | 一种基于图像分割和随机hough变换的架上图书清点方法 |
CN109120845B (zh) * | 2018-07-18 | 2021-05-28 | 广东数相智能科技有限公司 | 一种多焦距图像拍摄方法、电子设备、存储介质 |
CN111402281B (zh) * | 2020-03-12 | 2023-11-10 | 上海合合信息科技股份有限公司 | 一种书籍边缘检测方法及装置 |
CN111368856B (zh) * | 2020-03-16 | 2023-07-11 | 广东技术师范大学 | 一种基于视觉的图书盘点系统的书脊提取方法及装置 |
CN113642406B (zh) * | 2021-07-14 | 2023-01-31 | 广州市玄武无线科技股份有限公司 | 密集悬挂纸片的清点系统、方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002157274A (ja) * | 2000-08-09 | 2002-05-31 | Mitsubishi Heavy Ind Ltd | 電子ファイル装置とそのシステム作成方法及び書類データの選択方法 |
JP2011130266A (ja) * | 2009-12-18 | 2011-06-30 | Oki Data Corp | 画像読取装置及び画像読取システム |
CN103295034A (zh) * | 2013-04-30 | 2013-09-11 | 中南大学 | 一种基于dsp的嵌入式图书乱架清点系统及方法 |
-
2014
- 2014-08-06 CN CN201410383904.7A patent/CN104182934B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002157274A (ja) * | 2000-08-09 | 2002-05-31 | Mitsubishi Heavy Ind Ltd | 電子ファイル装置とそのシステム作成方法及び書類データの選択方法 |
JP2011130266A (ja) * | 2009-12-18 | 2011-06-30 | Oki Data Corp | 画像読取装置及び画像読取システム |
CN103295034A (zh) * | 2013-04-30 | 2013-09-11 | 中南大学 | 一种基于dsp的嵌入式图书乱架清点系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104182934A (zh) | 2014-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104182934B (zh) | 基于书脊图像特征和空域滤波的自动图书清点方法 | |
CN108921166A (zh) | 基于深度神经网络的医疗票据类文本检测识别方法及系统 | |
CN103759758B (zh) | 一种基于机械角度和刻度识别的汽车仪表指针的位置检测方法 | |
CN105224665A (zh) | 一种错题管理方法及系统 | |
CN109447076A (zh) | 一种用于车辆年检的车辆vin码识别检测方法 | |
CN109214002A (zh) | 一种文本对比方法、装置及其计算机存储介质 | |
CN107818322A (zh) | 一种用于车辆年检的车辆vin码篡改检测系统及方法 | |
CN105184292A (zh) | 自然场景图像中手写体数学公式结构分析与识别方法 | |
CN107506720A (zh) | 板书处理方法、装置、设备和计算机可读存储介质 | |
CN107133571A (zh) | 一种将纸质发票自动生成财务报表的系统及方法 | |
CN103530645B (zh) | 基于局部二值模式和Zernike矩的纹理图像分类方法及系统 | |
CN109242856A (zh) | 一种纸质作业电子化批阅方法及装置 | |
CN102324038A (zh) | 一种基于数字图像的植物种类识别方法 | |
CN105787522A (zh) | 基于手写笔迹的书写态度评价方法及系统 | |
CN103926254A (zh) | 一种用于pcb板缺陷检测的统计系统及方法 | |
CN103776482A (zh) | 无标尺线指针式仪表刻度的图像检测方法 | |
CN110427853B (zh) | 一种智能票据信息提取处理的方法 | |
CN106408510A (zh) | 一种获取人脸图像的美颜蒙版的方法及系统 | |
CN110334709A (zh) | 基于端到端多任务深度学习的车牌检测方法 | |
CN103116892A (zh) | 两个相交相同圆及公切线求解摄像机内参数 | |
CN110634223A (zh) | 票据校验方法及装置 | |
CN107578438A (zh) | 圆识别方法、装置及电子设备 | |
He et al. | A linear tessellation model to identify spatial pattern in urban street networks | |
CN113159014A (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN106846354A (zh) | 一种基于图像分割和随机hough变换的架上图书清点方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |