CN117788860A

CN117788860A - 一种基于图像识别的图书封面污损智能检测方法

Info

Publication number: CN117788860A
Application number: CN202311774227.7A
Authority: CN
Inventors: 马立玲; 王琛淏; 汪首坤; 王军政; 李静; 沈伟; 赵江波
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2023-12-21
Filing date: 2023-12-21
Publication date: 2024-03-29

Abstract

本发明提供一种基于图像识别的图书封面污损智能检测方法，综合利用多种图像处理技术及智能方法，将采集到的待检测书籍封面图像与无污损的参考书籍封面图像进行匹配对比，检测待测书籍封面是否存在污损并检测污损的位置、大小和形状，为自动借还系统实现污损识别提供了一个高效的技术参考方案；由此可见，本发明是采用一种非接触式的图像检测与分析，检测图书封面中是否存在污损以及污损的位置、大小和形状，从而规范图书借阅者行为，间接加强纸质图书的保护作用。

Description

一种基于图像识别的图书封面污损智能检测方法

技术领域

本发明属于计算机视觉技术领域，尤其涉及一种基于图像识别的图书封面污损智能检测方法。

背景技术

图书污损是当今图书馆普遍存在的问题，主要存在污渍、折角、开裂、笔画等形式，严重影响图书使用寿命。而目前对于图书污损问题，图书馆自动借还系统无法进行有效识别，因此急需高效的图书污损识别方法，在还书时识别图书是否存在污损，以保证图书完整性。

针对图书污损问题，人工检测费时费力，因此多种自动检测方法被提出。现有的书籍污损检测方法，有的通过对比图书借还前后重量变化，有的通过装置内部机械结构对书籍进行逐页翻阋检测，还有通过非接触式传感器，获取书籍侧围的边缘线条和图像信息，从而检测书籍发泡、形变及侧围缺陷，但存在检测精度低、易对书籍造成二次伤害、可识别污损类别有限等问题。

基于图像识别的图书污损识别方法，具有非接触、效率高、精度高等优点，而且易与图书馆现有自动借还系统结合。但在机器视觉领域中，图书污损检测并未形成完整的方法体系，相关表面缺陷检测方法主要集中于工业领域，以金属、木材、布匹、PCB电路板等为研究对象，利用传统图像识别方法和深度学习方法进行表面缺陷的分类、定位和分割。

发明内容

为解决自动还书系统无法识别图书污损的问题，本发明提供一种基于图像识别的图书封面污损智能检测方法，可以自动检测还书时是否存在污损，并能够检测污损的位置、大小和形状，对污渍、折角、裂痕等常见污损形式具有极高的检测效率，无需人工监督判别，节省人力同时提高借还书管理效率。

一种基于图像识别的图书封面污损智能检测方法，包括以下步骤：

S1：利用SIFT特征匹配方法，将待还书籍封面图像A和无污损的参考封面图像B进行图像匹配，在图像A上获取与图像B的四个参考角点相对应的四个角点；

S2：采用梯度下降法修正获取的四个角点的位置，并获取修正后的四个角点的位置到四个参考角点之间的透视变换矩阵；

S3：按照透视变换矩阵对图像A进行透视变换，得到与图像B更匹配的图像A*；

S4：获取图像A*与图像B之间的差异图像；

S5：利用训练好的网络模型Mask R-CNN提取差异图像中的差异区域，实现污损的位置、大小和形状的自动检测。

进一步地，在图像A上获取与图像B的四个参考角点相对应的四个角点具体为：

S11：应用经典SIFT特征检测方法，分别对图像B和图像A依次进行尺度空间构造、局部极值检测、关键点方向计算和关键点描述子计算的操作，获得两幅图像每个像素点对应的128维关键点描述子；

S12：应用KNN特征匹配对步骤S11中图像B的关键点描述子和图像A的关键点描述子进行相似度匹配，获得具有相似特征的n对特征点对；

S13：通过RANSAC算法对步骤S12中匹配成功的n对特征点对进行单应性匹配，获得图像B和图像A之间的单应性矩阵，并根据所述单应性矩阵对图像B上选定的四个参考角点进行单应性变换，在图像A上获得与四个参考角点对应的四个角点。

进一步地，采用梯度下降法修正获取的四个角点的位置具体为：

S21：将在图像A上获取的四个角点所包含的行列信息表示为一个八维向量x；

S22：计算八维向量x所表示的图像A中的四个角点以及图像B的四个参考角点之间的初始透视变换矩阵，并按照初始变换矩阵对图像A进行透视变换，将透视变换后的图像A与图像B的均方误差作为损失函数，且损失函数为关于八维向量x的函数，记为L＝f(x)；

S23：将八维向量x中的八个值依次增加一个扰动值d＝0.1，然后依次获取增加扰动值的新的八维向量对应的损失函数梯度分量，最后将获得的八个损失函数梯度分量整合成八维损失函数梯度ΔL＝[ΔL₁ ΔL₂ … ΔL₈]，其中，各个新的八维向量对应的损失函数梯度分量的获取方法为：

将八维向量x中第i个值增加扰动值d后形成的新的八维向量记为按照步骤S22获取该八维向量/>对应的损失函数分量然后按照一阶差分的方式获取损失函数梯度分量/>

S24：根据损失函数梯度ΔL构建SGD-M优化器如下：

x_t+1＝x_t-α·m_t

m_t＝β·m_t-1+(1-β)·ΔL

其中，x_t+1为第t+1次迭代的八维向量，x_t为第t次迭代的八维向量，且x_t的初始值为步骤S21中的八维向量x，α为学习率，m_t为第t次迭代的辅助变量，β为动量系数，m_t-1第t-1次迭代的辅助变量；

每执行一次SGD-M优化器中的迭代，均判断||x_t+1-x_t||是否小于设定阈值或者迭代次数是否超过设定上限，若其中一个判断结果为是，则得到最终的八维向量，完成图像A上获取的四个角点的修正；若判断结果均为否，则进入SGD-M优化器中的下一次迭代，直到得到最终的八维向量。

进一步地，获取图像A*与图像B之间的差异图像具体为：

S41：按照如下方法获取图像A*与图像B在各个色彩通道上的局部对比度相似度c(x，y)：

S41a：分别计算图像A*的局部均值μ_x与图像B的局部均值μ_y；

S41b：根据局部均值μ_x计算图像A*的局部加权方差σ_x以及根据局部均值μ_y计算图像B的局部加权方差σ_y如下：

其中，w_i(·)²为标准差σ＝1.5的圆对称高斯函数，i＝1，2，...，N，N为图像A*或图像B上的像素点个数，x_i为图像A*上第i个像素点的像素值，y_i为图像B上第i个像素点的像素值；

S41c：根据局部加权方差σ_x和局部加权方差σ_y计算图像A*与图像B之间的局部对比度相似度c(x，y)：

其中，C为设定常数；

S42：将图像A*与图像B在各个色彩通道上的局部对比度相似度c(x，y)线性映射到颜色代码区间[0，255]，得到图像A*与图像B之间的差异图像。

进一步地，所述网络模型Mask R-CNN的训练方法为：

S51：准备多个待测书籍封面图像，并获取各待测书籍封面图像对应的差异图像，同时利用图像掩膜标注出各待测书籍封面图像的污损区域，其中，一个待测书籍封面图像对应的差异图像及其用掩膜标注出的污损区域组成一条训练样本，所有训练样本组成污损数据集；

S52：以污损数据集中各条训练样本中的待测书籍封面图像对应的差异图像作为Mask R-CNN网络模型的输入，掩膜标注出的各待测书籍封面图像的污损区域作为Mask R-CNN网络模型的理论输出，以Mask R-CNN网络模型的理论输出和Mask R-CNN网络模型在各条训练样本下对应的实际输出构建损失函数，判断损失函数是否满足要求，若判断结果为是，则得到最终的网络模型Mask R-CNN；若判断结果为否，利用损失函数进行反向传播，调整Mask R-CNN网络模型的模型参数，将污损数据集中的各条训练样本重新作为模型参数调整后的Mask R-CNN网络模型的输入，直到训练达到设定迭代次数或者判断结果为是。

进一步地，一种基于图像识别的图书封面污损智能检测方法，还包括以下步骤：

在原有自动借还系统基础上，添加一个分辨率500*500的摄像头以及一个补光灯，以获取书籍封面；

收集各种书籍封面无污损时的图像信息，并加入检索数据库；

在借阋者还书时，自动借还系统通过摄像头获取书籍封面图像，并通过射频识别技术获取该书籍的基本信息，从检索数据库中检索到该书无污损时的封面图像。

有益效果：

1、本发明提供一种基于图像识别的图书封面污损智能检测方法，综合利用多种图像处理技术及智能方法，将采集到的待检测书籍封面图像与无污损的参考书籍封面图像进行匹配对比，检测待测书籍封面是否存在污损并检测污损的位置、大小和形状，为自动借还系统实现污损识别提供了一个高效的技术参考方案；由此可见，本发明是采用一种非接触式的图像检测与分析，检测图书封面中是否存在污损以及污损的位置、大小和形状，从而规范图书借阋者行为，间接加强纸质图书的保护作用。

2、本发明提供一种基于图像识别的图书封面污损智能检测方法，采用梯度下降法修正获取的四个角点的位置，并获取修正后的四个角点的位置到四个参考角点之间的透视变换矩阵，以使变换后的待还书籍封面图像与无污损参考图像的均方误差最小，提高图书封面污损智能检测的正确率。

3、本发明提供一种基于图像识别的图书封面污损智能检测方法，使用机器学习优化的特征匹配算法进行高精度图像匹配，并通过分析图像局部对比度差异特征构建分类卷积神经网络进行污损判别，在自动借还系统获取待还书籍封面图像并调取其对应的无污损时的参考图像后，算法可以自动检测待还书籍封面是否存在污损并检测污损的位置、大小和形状，对污渍、折角、裂痕等常见污损形式具有极高的检测效率，无需人工监督判别，节省人力同时提高借还书管理效率，克服了传统方法中检测精度低、易对书籍造成损伤或检测区域不全面的缺陷，为图书自动借还系统实现污损识别提供了一个可行的技术参考方案。

4、本发明提供一种基于图像识别的图书封面污损智能检测方法，基于特征匹配和机器学习优化进行图像匹配，同时还基于局部对比度差异特征和卷积神经网络进行目标检测，能够检测污损的位置、大小和形状，对污渍、折角、裂痕等常见污损形式具有极高的检测效率，无需人工监督判别，节省人力同时提高借还书管理效率。

附图说明

图1为污损识别整体流程图；

图2为梯度下降匹配精度优化流程图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

需要说明的是，在原有自动借还系统基础上，添加一个分辨率500*500的摄像头以及一个补光灯，以获取书籍封面；此外，还需要图书馆收集各种书籍封面无污损时的图像信息，并加入检索数据库；在借阋者还书时，自动借还系统通过摄像头获取书籍封面图像，并通过射频识别技术获取该书籍的基本信息，从检索数据库中检索到该书无污损时的封面图像。

在获取书籍还书时的封面图像和无污损的参考图像后，基于一种基于图像识别的图书封面污损智能检测方法进行污损检测，如图1所示，包括以下步骤：

S1：利用SIFT特征匹配方法，将待还书籍封面图像A和无污损的参考封面图像B进行图像匹配，在图像A上获取与图像B的四个参考角点相对应的四个角点，具体包括以下步骤：

S12：应用KNN特征匹配对步骤S11中图像B的关键点描述子和图像A的关键点描述子进行相似度匹配，获得具有相似特征的n对特征点对；其中，本发明可以使用深度为2的KDTree搜索算法提高匹配搜索效率；

S13：通过RANSAC算法对步骤S12中匹配成功的n对特征点对进行单应性匹配，将最大允许重投影错误阈值设为5.0，获得图像B和图像A之间的单应性矩阵，并根据所述单应性矩阵对图像B上选定的四个参考角点进行单应性变换，在图像A上获得与四个参考角点对应的四个角点。

S2：采用梯度下降法修正获取的四个角点的位置，并获取修正后的四个角点的位置到四个参考角点之间的透视变换矩阵，以使变换后的待还书籍封面图像与无污损参考图像的均方误差最小；

如图2所示，采用梯度下降法修正获取的四个角点的位置具体为：

S24：根据损失函数梯度ΔL构建SGD-M优化器如下：

x_t+1＝x_t-α·m_t

m_t＝β·m_t-1+(1-β)·ΔL

其中，x_t+1为第t+1次迭代的八维向量，x_t为第t次迭代的八维向量，且x_t的初始值为步骤S21中的八维向量x，α为学习率，α＝0.3，m_t为第t次迭代的辅助变量，β为动量系数，β＝0.9，m_t-1第t-1次迭代的辅助变量；

每执行一次SGD-M优化器中的迭代，均判断||x_t+1-x_t||是否小于设定阈值或者迭代次数是否超过设定上限500次，若其中一个判断结果为是，则得到最终的八维向量，完成图像A上获取的四个角点的修正；若判断结果均为否，则进入SGD-M优化器中的下一次迭代，直到得到最终的八维向量。

S3：按照透视变换矩阵对图像A进行透视变换，得到与图像B匹配精度更高且尺寸相同的图像A*；

S4：获取图像A*与图像B之间的差异图像，具体为：

S41a：分别计算图像A*的局部均值μ_x与图像B的局部均值μ_y，局部圆形窗口直径为12.5个像素；

其中，w_i(·)²为标准差σ＝1.5的圆对称高斯函数，i＝1，2，...，N，N为图像A*或图像B上的像素点个数，x_i为图像A*上第i个像素点的像素值，y_i为图像B上第i个像素点的像素值；需要说明的是，本发明将局部加权方差σ_x和σ_y分别视为图像A*和图像B的局部对比度

其中，C为设定常数，取常数C＝0.03，计算结果c(x，y)反映了图像A*和图像B的局部差异，c(x，y)取值范围为(0，1]，值越大，代表差异越小，反之越大；

S42：将图像A*与图像B在各个色彩通道上的局部对比度相似度c(x，y)线性映射到颜色代码区间[0，255]，得到与图像A*和图像B尺寸相同的图像，即为图像A*与图像B之间的差异图像。

在detectron2框架下构建的网络模型Mask R-CNN的训练方法为：

S52：以污损数据集中各条训练样本中的待测书籍封面图像对应的差异图像作为Mask R-CNN网络模型的输入，掩膜标注出的各待测书籍封面图像的污损区域作为Mask R-CNN网络模型的理论输出，以Mask R-CNN网络模型的理论输出和Mask R-CNN网络模型在各条训练样本下对应的实际输出构建损失函数，判断损失函数是否满足要求，若判断结果为是，则得到最终的网络模型MaskR-CNN；若判断结果为否，利用损失函数进行反向传播，调整Mask R-CNN网络模型的模型参数，将污损数据集中的各条训练样本重新作为模型参数调整后的Mask R-CNN网络模型的输入，直到训练达到设定迭代次数或者判断结果为是。

由此可见，本发明提供了一种基于图像识别技术的图书污损智能检测方法，为图书自动借还系统实现污损识别提供了一个可行的技术参考方案；目前尚未有基于图书封面污损的机器视觉缺陷检测方法，而传统的方法，或检测精度低效果差，或易对书籍造成损伤，或检测区域不全面；本发明的方法中使用机器学习优化的特征匹配算法进行高精度图像匹配，并通过分析图像局部对比度差异特征构建分类卷积神经网络进行污损判别，在自动借还系统获取还书时书籍封面图像并调取其无污损时的参考图像后，算法可以自动检测还书时是否存在污损并检测污损的位置、大小和形状，对污渍、折角、裂痕等常见污损形式具有极高的检测效率，无需人工监督判别，节省人力同时提高借还书管理效率。

当然，本发明还可有其他多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当然可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种基于图像识别的图书封面污损智能检测方法，其特征在于，包括以下步骤：

S4：获取图像A*与图像B之间的差异图像；

2.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法，其特征在于，在图像A上获取与图像B的四个参考角点相对应的四个角点具体为：

3.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法，其特征在于，采用梯度下降法修正获取的四个角点的位置具体为：

S23：将八维向量x中的八个值依次增加一个扰动值d＝0.1，然后依次获取增加扰动值的新的八维向量对应的损失函数梯度分量，最后将获得的八个损失函数梯度分量整合成八维损失函数梯度ΔL＝[ΔL₁ ΔL₂…ΔL₈]，其中，各个新的八维向量对应的损失函数梯度分量的获取方法为：

S24：根据损失函数梯度ΔL构建SGD-M优化器如下：

x_t+1＝x_t-α·m_t

m_t＝β·m_t-1+(1-β)·ΔL

4.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法，其特征在于，获取图像A*与图像B之间的差异图像具体为：

S41：按照如下方法获取图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y)：

S41a：分别计算图像A*的局部均值μ_x与图像B的局部均值μ_y；

其中，w_i(·)²为标准差σ＝1.5的圆对称高斯函数，i＝1,2,…,N，N为图像A*或图像B上的像素点个数，x_i为图像A*上第i个像素点的像素值，y_i为图像B上第i个像素点的像素值；

S41c：根据局部加权方差σ_x和局部加权方差σ_y计算图像A*与图像B之间的局部对比度相似度c(x,y)：

其中，C为设定常数；

S42：将图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y)线性映射到颜色代码区间[0,255]，得到图像A*与图像B之间的差异图像。

5.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法，其特征在于，所述网络模型Mask R-CNN的训练方法为：

S52：以污损数据集中各条训练样本中的待测书籍封面图像对应的差异图像作为MaskR-CNN网络模型的输入，掩膜标注出的各待测书籍封面图像的污损区域作为Mask R-CNN网络模型的理论输出，以Mask R-CNN网络模型的理论输出和Mask R-CNN网络模型在各条训练样本下对应的实际输出构建损失函数，判断损失函数是否满足要求，若判断结果为是，则得到最终的网络模型Mask R-CNN；若判断结果为否，利用损失函数进行反向传播，调整MaskR-CNN网络模型的模型参数，将污损数据集中的各条训练样本重新作为模型参数调整后的Mask R-CNN网络模型的输入，直到训练达到设定迭代次数或者判断结果为是。

6.如权利要求1～5任一权利要求所述的一种基于图像识别的图书封面污损智能检测方法，其特征在于，还包括以下步骤：

在借阅者还书时，自动借还系统通过摄像头获取书籍封面图像，并通过射频识别技术获取该书籍的基本信息，从检索数据库中检索到该书无污损时的封面图像。