CN117788860A - 一种基于图像识别的图书封面污损智能检测方法 - Google Patents
一种基于图像识别的图书封面污损智能检测方法 Download PDFInfo
- Publication number
- CN117788860A CN117788860A CN202311774227.7A CN202311774227A CN117788860A CN 117788860 A CN117788860 A CN 117788860A CN 202311774227 A CN202311774227 A CN 202311774227A CN 117788860 A CN117788860 A CN 117788860A
- Authority
- CN
- China
- Prior art keywords
- image
- book cover
- corner points
- offset
- mask
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000011109 contamination Methods 0.000 claims abstract description 12
- 238000005516 engineering process Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 42
- 239000013598 vector Substances 0.000 claims description 42
- 230000009466 transformation Effects 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 238000005728 strengthening Methods 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 21
- 230000007547 defect Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000005187 foaming Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明提供一种基于图像识别的图书封面污损智能检测方法,综合利用多种图像处理技术及智能方法,将采集到的待检测书籍封面图像与无污损的参考书籍封面图像进行匹配对比,检测待测书籍封面是否存在污损并检测污损的位置、大小和形状,为自动借还系统实现污损识别提供了一个高效的技术参考方案;由此可见,本发明是采用一种非接触式的图像检测与分析,检测图书封面中是否存在污损以及污损的位置、大小和形状,从而规范图书借阅者行为,间接加强纸质图书的保护作用。
Description
技术领域
本发明属于计算机视觉技术领域,尤其涉及一种基于图像识别的图书封面污损智能检测方法。
背景技术
图书污损是当今图书馆普遍存在的问题,主要存在污渍、折角、开裂、笔画等形式,严重影响图书使用寿命。而目前对于图书污损问题,图书馆自动借还系统无法进行有效识别,因此急需高效的图书污损识别方法,在还书时识别图书是否存在污损,以保证图书完整性。
针对图书污损问题,人工检测费时费力,因此多种自动检测方法被提出。现有的书籍污损检测方法,有的通过对比图书借还前后重量变化,有的通过装置内部机械结构对书籍进行逐页翻阋检测,还有通过非接触式传感器,获取书籍侧围的边缘线条和图像信息,从而检测书籍发泡、形变及侧围缺陷,但存在检测精度低、易对书籍造成二次伤害、可识别污损类别有限等问题。
基于图像识别的图书污损识别方法,具有非接触、效率高、精度高等优点,而且易与图书馆现有自动借还系统结合。但在机器视觉领域中,图书污损检测并未形成完整的方法体系,相关表面缺陷检测方法主要集中于工业领域,以金属、木材、布匹、PCB电路板等为研究对象,利用传统图像识别方法和深度学习方法进行表面缺陷的分类、定位和分割。
发明内容
为解决自动还书系统无法识别图书污损的问题,本发明提供一种基于图像识别的图书封面污损智能检测方法,可以自动检测还书时是否存在污损,并能够检测污损的位置、大小和形状,对污渍、折角、裂痕等常见污损形式具有极高的检测效率,无需人工监督判别,节省人力同时提高借还书管理效率。
一种基于图像识别的图书封面污损智能检测方法,包括以下步骤:
S1:利用SIFT特征匹配方法,将待还书籍封面图像A和无污损的参考封面图像B进行图像匹配,在图像A上获取与图像B的四个参考角点相对应的四个角点;
S2:采用梯度下降法修正获取的四个角点的位置,并获取修正后的四个角点的位置到四个参考角点之间的透视变换矩阵;
S3:按照透视变换矩阵对图像A进行透视变换,得到与图像B更匹配的图像A*;
S4:获取图像A*与图像B之间的差异图像;
S5:利用训练好的网络模型Mask R-CNN提取差异图像中的差异区域,实现污损的位置、大小和形状的自动检测。
进一步地,在图像A上获取与图像B的四个参考角点相对应的四个角点具体为:
S11:应用经典SIFT特征检测方法,分别对图像B和图像A依次进行尺度空间构造、局部极值检测、关键点方向计算和关键点描述子计算的操作,获得两幅图像每个像素点对应的128维关键点描述子;
S12:应用KNN特征匹配对步骤S11中图像B的关键点描述子和图像A的关键点描述子进行相似度匹配,获得具有相似特征的n对特征点对;
S13:通过RANSAC算法对步骤S12中匹配成功的n对特征点对进行单应性匹配,获得图像B和图像A之间的单应性矩阵,并根据所述单应性矩阵对图像B上选定的四个参考角点进行单应性变换,在图像A上获得与四个参考角点对应的四个角点。
进一步地,采用梯度下降法修正获取的四个角点的位置具体为:
S21:将在图像A上获取的四个角点所包含的行列信息表示为一个八维向量x;
S22:计算八维向量x所表示的图像A中的四个角点以及图像B的四个参考角点之间的初始透视变换矩阵,并按照初始变换矩阵对图像A进行透视变换,将透视变换后的图像A与图像B的均方误差作为损失函数,且损失函数为关于八维向量x的函数,记为L=f(x);
S23:将八维向量x中的八个值依次增加一个扰动值d=0.1,然后依次获取增加扰动值的新的八维向量对应的损失函数梯度分量,最后将获得的八个损失函数梯度分量整合成八维损失函数梯度ΔL=[ΔL1 ΔL2 … ΔL8],其中,各个新的八维向量对应的损失函数梯度分量的获取方法为:
将八维向量x中第i个值增加扰动值d后形成的新的八维向量记为按照步骤S22获取该八维向量/>对应的损失函数分量然后按照一阶差分的方式获取损失函数梯度分量/>
S24:根据损失函数梯度ΔL构建SGD-M优化器如下:
xt+1=xt-α·mt
mt=β·mt-1+(1-β)·ΔL
其中,xt+1为第t+1次迭代的八维向量,xt为第t次迭代的八维向量,且xt的初始值为步骤S21中的八维向量x,α为学习率,mt为第t次迭代的辅助变量,β为动量系数,mt-1第t-1次迭代的辅助变量;
每执行一次SGD-M优化器中的迭代,均判断||xt+1-xt||是否小于设定阈值或者迭代次数是否超过设定上限,若其中一个判断结果为是,则得到最终的八维向量,完成图像A上获取的四个角点的修正;若判断结果均为否,则进入SGD-M优化器中的下一次迭代,直到得到最终的八维向量。
进一步地,获取图像A*与图像B之间的差异图像具体为:
S41:按照如下方法获取图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y):
S41a:分别计算图像A*的局部均值μx与图像B的局部均值μy;
S41b:根据局部均值μx计算图像A*的局部加权方差σx以及根据局部均值μy计算图像B的局部加权方差σy如下:
其中,wi(·)2为标准差σ=1.5的圆对称高斯函数,i=1,2,...,N,N为图像A*或图像B上的像素点个数,xi为图像A*上第i个像素点的像素值,yi为图像B上第i个像素点的像素值;
S41c:根据局部加权方差σx和局部加权方差σy计算图像A*与图像B之间的局部对比度相似度c(x,y):
其中,C为设定常数;
S42:将图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y)线性映射到颜色代码区间[0,255],得到图像A*与图像B之间的差异图像。
进一步地,所述网络模型Mask R-CNN的训练方法为:
S51:准备多个待测书籍封面图像,并获取各待测书籍封面图像对应的差异图像,同时利用图像掩膜标注出各待测书籍封面图像的污损区域,其中,一个待测书籍封面图像对应的差异图像及其用掩膜标注出的污损区域组成一条训练样本,所有训练样本组成污损数据集;
S52:以污损数据集中各条训练样本中的待测书籍封面图像对应的差异图像作为Mask R-CNN网络模型的输入,掩膜标注出的各待测书籍封面图像的污损区域作为Mask R-CNN网络模型的理论输出,以Mask R-CNN网络模型的理论输出和Mask R-CNN网络模型在各条训练样本下对应的实际输出构建损失函数,判断损失函数是否满足要求,若判断结果为是,则得到最终的网络模型Mask R-CNN;若判断结果为否,利用损失函数进行反向传播,调整Mask R-CNN网络模型的模型参数,将污损数据集中的各条训练样本重新作为模型参数调整后的Mask R-CNN网络模型的输入,直到训练达到设定迭代次数或者判断结果为是。
进一步地,一种基于图像识别的图书封面污损智能检测方法,还包括以下步骤:
在原有自动借还系统基础上,添加一个分辨率500*500的摄像头以及一个补光灯,以获取书籍封面;
收集各种书籍封面无污损时的图像信息,并加入检索数据库;
在借阋者还书时,自动借还系统通过摄像头获取书籍封面图像,并通过射频识别技术获取该书籍的基本信息,从检索数据库中检索到该书无污损时的封面图像。
有益效果:
1、本发明提供一种基于图像识别的图书封面污损智能检测方法,综合利用多种图像处理技术及智能方法,将采集到的待检测书籍封面图像与无污损的参考书籍封面图像进行匹配对比,检测待测书籍封面是否存在污损并检测污损的位置、大小和形状,为自动借还系统实现污损识别提供了一个高效的技术参考方案;由此可见,本发明是采用一种非接触式的图像检测与分析,检测图书封面中是否存在污损以及污损的位置、大小和形状,从而规范图书借阋者行为,间接加强纸质图书的保护作用。
2、本发明提供一种基于图像识别的图书封面污损智能检测方法,采用梯度下降法修正获取的四个角点的位置,并获取修正后的四个角点的位置到四个参考角点之间的透视变换矩阵,以使变换后的待还书籍封面图像与无污损参考图像的均方误差最小,提高图书封面污损智能检测的正确率。
3、本发明提供一种基于图像识别的图书封面污损智能检测方法,使用机器学习优化的特征匹配算法进行高精度图像匹配,并通过分析图像局部对比度差异特征构建分类卷积神经网络进行污损判别,在自动借还系统获取待还书籍封面图像并调取其对应的无污损时的参考图像后,算法可以自动检测待还书籍封面是否存在污损并检测污损的位置、大小和形状,对污渍、折角、裂痕等常见污损形式具有极高的检测效率,无需人工监督判别,节省人力同时提高借还书管理效率,克服了传统方法中检测精度低、易对书籍造成损伤或检测区域不全面的缺陷,为图书自动借还系统实现污损识别提供了一个可行的技术参考方案。
4、本发明提供一种基于图像识别的图书封面污损智能检测方法,基于特征匹配和机器学习优化进行图像匹配,同时还基于局部对比度差异特征和卷积神经网络进行目标检测,能够检测污损的位置、大小和形状,对污渍、折角、裂痕等常见污损形式具有极高的检测效率,无需人工监督判别,节省人力同时提高借还书管理效率。
附图说明
图1为污损识别整体流程图;
图2为梯度下降匹配精度优化流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
需要说明的是,在原有自动借还系统基础上,添加一个分辨率500*500的摄像头以及一个补光灯,以获取书籍封面;此外,还需要图书馆收集各种书籍封面无污损时的图像信息,并加入检索数据库;在借阋者还书时,自动借还系统通过摄像头获取书籍封面图像,并通过射频识别技术获取该书籍的基本信息,从检索数据库中检索到该书无污损时的封面图像。
在获取书籍还书时的封面图像和无污损的参考图像后,基于一种基于图像识别的图书封面污损智能检测方法进行污损检测,如图1所示,包括以下步骤:
S1:利用SIFT特征匹配方法,将待还书籍封面图像A和无污损的参考封面图像B进行图像匹配,在图像A上获取与图像B的四个参考角点相对应的四个角点,具体包括以下步骤:
S11:应用经典SIFT特征检测方法,分别对图像B和图像A依次进行尺度空间构造、局部极值检测、关键点方向计算和关键点描述子计算的操作,获得两幅图像每个像素点对应的128维关键点描述子;
S12:应用KNN特征匹配对步骤S11中图像B的关键点描述子和图像A的关键点描述子进行相似度匹配,获得具有相似特征的n对特征点对;其中,本发明可以使用深度为2的KDTree搜索算法提高匹配搜索效率;
S13:通过RANSAC算法对步骤S12中匹配成功的n对特征点对进行单应性匹配,将最大允许重投影错误阈值设为5.0,获得图像B和图像A之间的单应性矩阵,并根据所述单应性矩阵对图像B上选定的四个参考角点进行单应性变换,在图像A上获得与四个参考角点对应的四个角点。
S2:采用梯度下降法修正获取的四个角点的位置,并获取修正后的四个角点的位置到四个参考角点之间的透视变换矩阵,以使变换后的待还书籍封面图像与无污损参考图像的均方误差最小;
如图2所示,采用梯度下降法修正获取的四个角点的位置具体为:
S21:将在图像A上获取的四个角点所包含的行列信息表示为一个八维向量x;
S22:计算八维向量x所表示的图像A中的四个角点以及图像B的四个参考角点之间的初始透视变换矩阵,并按照初始变换矩阵对图像A进行透视变换,将透视变换后的图像A与图像B的均方误差作为损失函数,且损失函数为关于八维向量x的函数,记为L=f(x);
S23:将八维向量x中的八个值依次增加一个扰动值d=0.1,然后依次获取增加扰动值的新的八维向量对应的损失函数梯度分量,最后将获得的八个损失函数梯度分量整合成八维损失函数梯度ΔL=[ΔL1 ΔL2 … ΔL8],其中,各个新的八维向量对应的损失函数梯度分量的获取方法为:
将八维向量x中第i个值增加扰动值d后形成的新的八维向量记为按照步骤S22获取该八维向量/>对应的损失函数分量然后按照一阶差分的方式获取损失函数梯度分量/>
S24:根据损失函数梯度ΔL构建SGD-M优化器如下:
xt+1=xt-α·mt
mt=β·mt-1+(1-β)·ΔL
其中,xt+1为第t+1次迭代的八维向量,xt为第t次迭代的八维向量,且xt的初始值为步骤S21中的八维向量x,α为学习率,α=0.3,mt为第t次迭代的辅助变量,β为动量系数,β=0.9,mt-1第t-1次迭代的辅助变量;
每执行一次SGD-M优化器中的迭代,均判断||xt+1-xt||是否小于设定阈值或者迭代次数是否超过设定上限500次,若其中一个判断结果为是,则得到最终的八维向量,完成图像A上获取的四个角点的修正;若判断结果均为否,则进入SGD-M优化器中的下一次迭代,直到得到最终的八维向量。
S3:按照透视变换矩阵对图像A进行透视变换,得到与图像B匹配精度更高且尺寸相同的图像A*;
S4:获取图像A*与图像B之间的差异图像,具体为:
S41:按照如下方法获取图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y):
S41a:分别计算图像A*的局部均值μx与图像B的局部均值μy,局部圆形窗口直径为12.5个像素;
S41b:根据局部均值μx计算图像A*的局部加权方差σx以及根据局部均值μy计算图像B的局部加权方差σy如下:
其中,wi(·)2为标准差σ=1.5的圆对称高斯函数,i=1,2,...,N,N为图像A*或图像B上的像素点个数,xi为图像A*上第i个像素点的像素值,yi为图像B上第i个像素点的像素值;需要说明的是,本发明将局部加权方差σx和σy分别视为图像A*和图像B的局部对比度
S41c:根据局部加权方差σx和局部加权方差σy计算图像A*与图像B之间的局部对比度相似度c(x,y):
其中,C为设定常数,取常数C=0.03,计算结果c(x,y)反映了图像A*和图像B的局部差异,c(x,y)取值范围为(0,1],值越大,代表差异越小,反之越大;
S42:将图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y)线性映射到颜色代码区间[0,255],得到与图像A*和图像B尺寸相同的图像,即为图像A*与图像B之间的差异图像。
S5:利用训练好的网络模型Mask R-CNN提取差异图像中的差异区域,实现污损的位置、大小和形状的自动检测。
在detectron2框架下构建的网络模型Mask R-CNN的训练方法为:
S51:准备多个待测书籍封面图像,并获取各待测书籍封面图像对应的差异图像,同时利用图像掩膜标注出各待测书籍封面图像的污损区域,其中,一个待测书籍封面图像对应的差异图像及其用掩膜标注出的污损区域组成一条训练样本,所有训练样本组成污损数据集;
S52:以污损数据集中各条训练样本中的待测书籍封面图像对应的差异图像作为Mask R-CNN网络模型的输入,掩膜标注出的各待测书籍封面图像的污损区域作为Mask R-CNN网络模型的理论输出,以Mask R-CNN网络模型的理论输出和Mask R-CNN网络模型在各条训练样本下对应的实际输出构建损失函数,判断损失函数是否满足要求,若判断结果为是,则得到最终的网络模型MaskR-CNN;若判断结果为否,利用损失函数进行反向传播,调整Mask R-CNN网络模型的模型参数,将污损数据集中的各条训练样本重新作为模型参数调整后的Mask R-CNN网络模型的输入,直到训练达到设定迭代次数或者判断结果为是。
由此可见,本发明提供了一种基于图像识别技术的图书污损智能检测方法,为图书自动借还系统实现污损识别提供了一个可行的技术参考方案;目前尚未有基于图书封面污损的机器视觉缺陷检测方法,而传统的方法,或检测精度低效果差,或易对书籍造成损伤,或检测区域不全面;本发明的方法中使用机器学习优化的特征匹配算法进行高精度图像匹配,并通过分析图像局部对比度差异特征构建分类卷积神经网络进行污损判别,在自动借还系统获取还书时书籍封面图像并调取其无污损时的参考图像后,算法可以自动检测还书时是否存在污损并检测污损的位置、大小和形状,对污渍、折角、裂痕等常见污损形式具有极高的检测效率,无需人工监督判别,节省人力同时提高借还书管理效率。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当然可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (6)
1.一种基于图像识别的图书封面污损智能检测方法,其特征在于,包括以下步骤:
S1:利用SIFT特征匹配方法,将待还书籍封面图像A和无污损的参考封面图像B进行图像匹配,在图像A上获取与图像B的四个参考角点相对应的四个角点;
S2:采用梯度下降法修正获取的四个角点的位置,并获取修正后的四个角点的位置到四个参考角点之间的透视变换矩阵;
S3:按照透视变换矩阵对图像A进行透视变换,得到与图像B更匹配的图像A*;
S4:获取图像A*与图像B之间的差异图像;
S5:利用训练好的网络模型Mask R-CNN提取差异图像中的差异区域,实现污损的位置、大小和形状的自动检测。
2.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法,其特征在于,在图像A上获取与图像B的四个参考角点相对应的四个角点具体为:
S11:应用经典SIFT特征检测方法,分别对图像B和图像A依次进行尺度空间构造、局部极值检测、关键点方向计算和关键点描述子计算的操作,获得两幅图像每个像素点对应的128维关键点描述子;
S12:应用KNN特征匹配对步骤S11中图像B的关键点描述子和图像A的关键点描述子进行相似度匹配,获得具有相似特征的n对特征点对;
S13:通过RANSAC算法对步骤S12中匹配成功的n对特征点对进行单应性匹配,获得图像B和图像A之间的单应性矩阵,并根据所述单应性矩阵对图像B上选定的四个参考角点进行单应性变换,在图像A上获得与四个参考角点对应的四个角点。
3.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法,其特征在于,采用梯度下降法修正获取的四个角点的位置具体为:
S21:将在图像A上获取的四个角点所包含的行列信息表示为一个八维向量x;
S22:计算八维向量x所表示的图像A中的四个角点以及图像B的四个参考角点之间的初始透视变换矩阵,并按照初始变换矩阵对图像A进行透视变换,将透视变换后的图像A与图像B的均方误差作为损失函数,且损失函数为关于八维向量x的函数,记为L=f(x);
S23:将八维向量x中的八个值依次增加一个扰动值d=0.1,然后依次获取增加扰动值的新的八维向量对应的损失函数梯度分量,最后将获得的八个损失函数梯度分量整合成八维损失函数梯度ΔL=[ΔL1 ΔL2…ΔL8],其中,各个新的八维向量对应的损失函数梯度分量的获取方法为:
将八维向量x中第i个值增加扰动值d后形成的新的八维向量记为按照步骤S22获取该八维向量/>对应的损失函数分量然后按照一阶差分的方式获取损失函数梯度分量/>
S24:根据损失函数梯度ΔL构建SGD-M优化器如下:
xt+1=xt-α·mt
mt=β·mt-1+(1-β)·ΔL
其中,xt+1为第t+1次迭代的八维向量,xt为第t次迭代的八维向量,且xt的初始值为步骤S21中的八维向量x,α为学习率,mt为第t次迭代的辅助变量,β为动量系数,mt-1第t-1次迭代的辅助变量;
每执行一次SGD-M优化器中的迭代,均判断||xt+1-xt||是否小于设定阈值或者迭代次数是否超过设定上限,若其中一个判断结果为是,则得到最终的八维向量,完成图像A上获取的四个角点的修正;若判断结果均为否,则进入SGD-M优化器中的下一次迭代,直到得到最终的八维向量。
4.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法,其特征在于,获取图像A*与图像B之间的差异图像具体为:
S41:按照如下方法获取图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y):
S41a:分别计算图像A*的局部均值μx与图像B的局部均值μy;
S41b:根据局部均值μx计算图像A*的局部加权方差σx以及根据局部均值μy计算图像B的局部加权方差σy如下:
其中,wi(·)2为标准差σ=1.5的圆对称高斯函数,i=1,2,…,N,N为图像A*或图像B上的像素点个数,xi为图像A*上第i个像素点的像素值,yi为图像B上第i个像素点的像素值;
S41c:根据局部加权方差σx和局部加权方差σy计算图像A*与图像B之间的局部对比度相似度c(x,y):
其中,C为设定常数;
S42:将图像A*与图像B在各个色彩通道上的局部对比度相似度c(x,y)线性映射到颜色代码区间[0,255],得到图像A*与图像B之间的差异图像。
5.如权利要求1所述的一种基于图像识别的图书封面污损智能检测方法,其特征在于,所述网络模型Mask R-CNN的训练方法为:
S51:准备多个待测书籍封面图像,并获取各待测书籍封面图像对应的差异图像,同时利用图像掩膜标注出各待测书籍封面图像的污损区域,其中,一个待测书籍封面图像对应的差异图像及其用掩膜标注出的污损区域组成一条训练样本,所有训练样本组成污损数据集;
S52:以污损数据集中各条训练样本中的待测书籍封面图像对应的差异图像作为MaskR-CNN网络模型的输入,掩膜标注出的各待测书籍封面图像的污损区域作为Mask R-CNN网络模型的理论输出,以Mask R-CNN网络模型的理论输出和Mask R-CNN网络模型在各条训练样本下对应的实际输出构建损失函数,判断损失函数是否满足要求,若判断结果为是,则得到最终的网络模型Mask R-CNN;若判断结果为否,利用损失函数进行反向传播,调整MaskR-CNN网络模型的模型参数,将污损数据集中的各条训练样本重新作为模型参数调整后的Mask R-CNN网络模型的输入,直到训练达到设定迭代次数或者判断结果为是。
6.如权利要求1~5任一权利要求所述的一种基于图像识别的图书封面污损智能检测方法,其特征在于,还包括以下步骤:
在原有自动借还系统基础上,添加一个分辨率500*500的摄像头以及一个补光灯,以获取书籍封面;
收集各种书籍封面无污损时的图像信息,并加入检索数据库;
在借阅者还书时,自动借还系统通过摄像头获取书籍封面图像,并通过射频识别技术获取该书籍的基本信息,从检索数据库中检索到该书无污损时的封面图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311774227.7A CN117788860A (zh) | 2023-12-21 | 2023-12-21 | 一种基于图像识别的图书封面污损智能检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311774227.7A CN117788860A (zh) | 2023-12-21 | 2023-12-21 | 一种基于图像识别的图书封面污损智能检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117788860A true CN117788860A (zh) | 2024-03-29 |
Family
ID=90382551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311774227.7A Pending CN117788860A (zh) | 2023-12-21 | 2023-12-21 | 一种基于图像识别的图书封面污损智能检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117788860A (zh) |
-
2023
- 2023-12-21 CN CN202311774227.7A patent/CN117788860A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740606B (zh) | 一种图像识别方法及装置 | |
CN109784342B (zh) | 一种基于深度学习模型的ocr识别方法及终端 | |
CN106203539B (zh) | 识别集装箱箱号的方法和装置 | |
CN108021890B (zh) | 一种基于plsa和bow的高分遥感影像港口检测方法 | |
CN112215216B (zh) | 一种图像识别结果的字符串模糊匹配系统及方法 | |
CN112419260A (zh) | 一种pcb文字区域缺陷检测方法 | |
CN111539330A (zh) | 一种基于双svm多分类器的变电站数显仪表识别方法 | |
CN109325407B (zh) | 基于f-ssd网络滤波的光学遥感视频目标检测方法 | |
CN109190625A (zh) | 一种大角度透视变形的集装箱箱号识别方法 | |
CN112307919A (zh) | 一种基于改进YOLOv3的单证图像中数字信息区域识别方法 | |
CN115019103A (zh) | 基于坐标注意力群组优化的小样本目标检测方法 | |
CN104751475A (zh) | 一种面向静态图像对象识别的特征点优选匹配方法 | |
CN111563896A (zh) | 一种用于接触网异常检测的图像处理方法 | |
CN114387592B (zh) | 一种复杂背景下字符定位和识别方法 | |
CN111626145A (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
CN114863129A (zh) | 仪表数值分析方法、装置、设备及存储介质 | |
CN112926463B (zh) | 一种目标检测方法和装置 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN108960005B (zh) | 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统 | |
CN111507177B (zh) | 一种用于计量周转柜的识别方法及装置 | |
CN117218672A (zh) | 一种基于深度学习的病案文字识别方法及系统 | |
CN112418210B (zh) | 一种杆塔巡检信息智能分类方法 | |
CN112215266A (zh) | 一种基于小样本学习的x光图像违禁物品检测方法 | |
CN109829511B (zh) | 基于纹理分类的下视红外图像中云层区域检测方法 | |
CN111414917A (zh) | 一种低像素密度文本的识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |