CN116758547B - 一种纸介质碳化方法、系统及存储介质 - Google Patents
一种纸介质碳化方法、系统及存储介质 Download PDFInfo
- Publication number
- CN116758547B CN116758547B CN202310766381.3A CN202310766381A CN116758547B CN 116758547 B CN116758547 B CN 116758547B CN 202310766381 A CN202310766381 A CN 202310766381A CN 116758547 B CN116758547 B CN 116758547B
- Authority
- CN
- China
- Prior art keywords
- paper
- module
- image
- feature extraction
- destroying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003763 carbonization Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000001514 detection method Methods 0.000 claims abstract description 106
- 238000012549 training Methods 0.000 claims abstract description 11
- 230000006378 damage Effects 0.000 claims abstract description 6
- 238000012163 sequencing technique Methods 0.000 claims abstract description 5
- 238000000605 extraction Methods 0.000 claims description 41
- 230000007246 mechanism Effects 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000007667 floating Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 2
- 238000010000 carbonizing Methods 0.000 claims 1
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000001373 regressive effect Effects 0.000 description 5
- 239000000428 dust Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000001094 effect on targets Effects 0.000 description 1
- 230000005686 electrostatic field Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002341 toxic gas Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000009834 vaporization Methods 0.000 description 1
- 230000008016 vaporization Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1918—Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种纸介质碳化方法、系统及存储介质,涉及纸介质碳化领域,该方法包括构建纸张图像目标检测数据集;利用纸张图像目标检测数据集训练纸张检测模型;根据训练后的纸张检测模型确定纸张图像的纸张检测结果;根据纸张检测结果和纸张图像,采用多模态排序模型确定销毁序列;所述多模态排序模型包括:CNN模块和RNN模块;根据销毁序列进行销毁本发明能够提高纸介质碳化的效率。
Description
技术领域
本发明涉及纸介质碳化领域,特别是涉及一种纸介质碳化方法、系统及存储介质。
背景技术
纸介质碳化技术是设备利用高功率密度激光束照射纸张,使纸张很快被加热至汽化温度形成孔洞,完成对纸张的碳化过程,从而高效快速地销毁,达到完全无法通过微型碎片进行拼接识别的目的。过程中汽化物质的尘粒与负离子结合带上负电后,趋向阳极表面放电而沉积,最后经过活性炭滤芯吸附气体物质,从而达到环保要求。汽化的纸张所产生烟尘及气体经过高压静电场时被电分离的方法而沉积至除尘袋中。该新型载体销毁设备操作简单、安全可靠、快速高效,符合一级销毁标准技术要求,销毁过程中不产生烟火,粉尘和有毒气体,销毁残留物可符合环境保护要求可直接丢弃。
目前的碳化技术,不能精准的检测到纸张中文字,对其进行精准的碳化。这样存在遗漏的可能性,为了杜绝这种情况的发生,需要一种智能化的手段解决这个问题。基于深度学习的目标检测算法具有自动提取目标关键特征的优势,可为纸张信息检测提供有效的技术途径。现有算法多采用特征金字塔对经典目标检测网络进行改进,该技术可使特征图在包含丰富语义信息的同时保持较高的分辨率,从而提升神经网络的特征提取能力。这种方法对不同尺寸下的目标,尤其是小目标,具有良好的检测效果,但对纸张图像中文字、图像、表格等多变的特殊目标而言,检测准确性还有待提升。因此,探索一种智能感知的纸介质碳化方法具有重要的研究意义。
发明内容
本发明的目的是提供一种纸介质碳化方法、系统及存储介质,能够提高纸介质碳化的效率。
为实现上述目的,本发明提供了如下方案:
一种纸介质碳化方法,包括:
构建纸张图像目标检测数据集;所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注;
基于Yolov8s骨干网络构建纸张检测模型;所述纸张检测模型包括:卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块;C2F模块为部分卷积,用于对设定数目的输入通道进行空间特征提取;所述小目标检测结构用于检测尺寸小于设定规格的目标图像;
利用纸张图像目标检测数据集训练纸张检测模型;
根据训练后的纸张检测模型确定纸张图像的纸张检测结果;
根据纸张检测结果和纸张图像,采用多模态排序模型确定销毁序列;所述多模态排序模型包括:CNN模块和RNN模块;
根据销毁序列进行销毁。
可选地,所述构建纸张图像目标检测数据集,具体包括:
利用相机对多种文件进行拍摄采集,保存格式为JPEG,得到纸张图像;
采用Labelme软件对纸张图像进行图像标注,在每张纸张图像中标注目标区域;
对标注后的纸张图像进行数量增强;所述数据增强包括:水平翻转和多角度旋转;
将数据增强后的纸张图像转换为yolov8格式的目标检测数据集,得到纸张图像目标检测数据集。
可选地,所述纸张检测模型的分类损失VFL(p,q)为:
其中,q为纸张图像的类别标签概率,γ为权重因子,pγ为缩放损失系数,p为纸张图像的类别标签预测概率。
可选地,所述纸张检测模型的回归损失为:
其中,ρ2(b,bgt)为预测框b和真实框bgt的中心点的欧式距离,c为同时包含预测框b和真实框bgt的最小闭包区域的对角线距离,v为衡量长宽比一致性的参数,α为权重系数,为第i个纸张图像的全局最小解,/>为第i+1个纸张图像的全局最小解,y为标签,yi和yi+1为浮点值y的左右整数值,/>为GIoU的损失,为回归损失,计算目标的边界框。
可选地,所述CNN模块以ResNet18作为特征提取模块;所述RNN模块以及LSTM作为特征提取模块。
一种纸介质碳化系统,包括:
数据集构建模块,用于构建纸张图像目标检测数据集;所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注;
纸张检测模型构建模块,用于基于Yolov8s骨干网络构建纸张检测模型;所述纸张检测模型包括:卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块;C2F模块为部分卷积,用于对设定数目的输入通道进行空间特征提取;所述小目标检测结构用于检测尺寸小于设定规格的目标图像;
纸张检测模型训练模块,用于利用纸张图像目标检测数据集训练纸张检测模型;
纸张检测结果确定模块,用于根据训练后的纸张检测模型确定纸张图像的纸张检测结果;
销毁序列确定模块,用于根据纸张检测结果和纸张图像,采用多模态排序模型确定销毁序列;所述多模态排序模型包括:CNN模块和RNN模块;
销毁模块,用于根据销毁序列进行销毁。
一种存储介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现所述的方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明所提供的一种纸介质碳化方法、系统及存储介质,通过稀疏注意机制提高主干网络的表征能力,进一步提高小目标检测精度;通过小目标检测结构用于小目标的计算,防止小目标被遗漏;C2F模块使用部分卷积替换普通卷积,参数量更小,速度更快,准确性更高;加入多模态排序模型,得到最优的销魂序列。本发明将目标检测技术应用在纸介质碳化技术上,使得纸介质碳化处理更加高效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种纸介质碳化方法流程示意图;
图2为纸张图像目标检测数据集构建示意图;
图3为纸张检测模型结构示意图;
图4为多模态排序模型结构图;
图5为本发明所提供的一种纸介质碳化方法整体流程图;
图6为SPPF模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种纸介质碳化方法、系统及存储介质,能够提高纸介质碳化的效率。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明所提供的一种纸介质碳化方法,包括:
S101,构建纸张图像目标检测数据集;所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注。
S101具体包括:
利用相机对多种文件进行拍摄采集,保存格式为JPEG,得到纸张图像。
采用Labelme软件对纸张图像进行图像标注,在每张纸张图像中标注目标区域,获得每张纸张图像对应的标注文件(JSON格式)。
对标注后的纸张图像进行数量增强;所述数据增强包括:水平翻转和多角度旋转。多角度旋转包括:90度旋转、180度旋转以及270度旋转。
将数据增强后的纸张图像转换为yolov8格式的目标检测数据集,得到纸张图像目标检测数据集;其中,训练集、验证集、测试接的划分比例为7:2:1。
S102,基于Yolov8s骨干网络构建纸张检测模型;所述纸张检测模型包括:卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制(BiLevelRoutingAttention,BRA)、小目标检测结构以及C2F模块;C2F模块为部分卷积,用于对设定数目的输入通道进行空间特征提取;所述小目标检测结构用于检测尺寸小于设定规格的目标图像。
BRA将注意力的计算分成两个阶段,第一个阶段先进行粗粒度的注意力机制并控制稀疏性;第二阶段基于第一个阶段的稀疏注意力得到的结果进行细粒度注意力机制计算得到细粒度的注意力结果。
将C2F模块嵌入Yolov8s的卷积模块之后,降低网络的参数,提高网络的运行速度和准确率。部分卷积简单地对部分输入通道应用常规变换以进行空间特征提取,并保持其余通道不变。对于连续或常规的内存访问,认为第一个或最后一个连续cp通道是整个特征映射的代表,用于计算。在不损失通用性的情况下,认为输入和输出特征图具有相同的通道数。部分卷积的浮点运算次数等于其中,h代表特征图的高度,w代表特征图的宽度,k代表当前卷及和的大小。当部分卷积cp和普通卷积的c比/>时,部分卷积的FLOPs仅为普通Conv的/>且PConv具有较小的内存访问量,即:c代表普通卷积的数量。cp代表部分卷积的数量。
为了解决小目标难以识别的问题问题,在YoloV8的基础上增加了专门用于识别小目标的分支结构。如图3所示,本发明输入纸张图像640×640为例,展示网络结构的设计过程:
首先,将图像经过conv1、conv2、conv3、conv4、conv5得到特征图尺寸依次为320×320×64、160×160×128、80×80×256、40×40×512、20×20×512。
conv1-5,代表卷积模块,每个卷积模块由卷积层、BN层和激活函数组成,将各卷积块的输出特征图分别表示为C_1、C_2、C_3、C_4、C_5。
将C_2、C_3、C_4、C_5依次输入到特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4模块中。由于特征图尺寸没有发生变化,所以经过特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4之后对应的图片尺寸为160×160×128、80×80×256、40×40×512、20×20×512。
BRA是一种动态的、查询感知的稀疏注意机制。BRA是在粗区域级别过滤掉大多数不相关的键-值对,以便只保留一小部分路由区域。然后,在这些路由区域的联合中应用细粒度的令牌对令牌注意力。通过引入BRA可以提高对小目标的检测能力,但是如果加入的数量太多会造成推理速度减慢,参数量增大。所以,将BRA放在特征提取模块C2F_2、特征提取模块C2F_3和SPPF(如图6所示)的后面,如图3所示。由于经过BRA不会对特征图的尺寸做改变,所以输出的特征图依然是160×160×128、80×80×256、40×40×512、20×20×512。将这些特征输入到网络的最后一层。
如图3所示,对这四个特征图分别进行如下相同操作,此处以特征提取模块C2F_3为例:为了得到更多的特征信息,首先,将特征提取模块C2F_4经过SPPF再经过BRA,然后,再做上采样,将特征变为40×40×512。接下来,与特征提取模块C2F_3后面的BRA做特征融合,将得到新的特征。将新的特征分为两条分支,一条分支继续上采样得到80×80×256的特征,输入到C2F模块中得到更深层次的特征,然后将这个特征经过3×3,步长为2的卷积得到新的特征与另一条分支在做融合,得到最终的融合特征图,将其命名为D_3。
经过上面的操作依次得到特征图D_1、D_2、D_3、D_4尺寸依次为160×160×128、80×80×256、40×40×512、20×20×512。
小目标通常是指尺寸小于32×32的目标图片,由于纸张中的文字远离低于这个尺寸,所以需要在更大的特征图上解决小目标检测的问题。例如:在640×640的图像中,目标区域是10×10的大小,在160×160的特征特上是2.5×2.5的区域。在80×80的特征图只有1.25×1.25区域,在后面的特征图上像素小于1,已经不存在了,所以使用160×160的特征图更具有优势,能够更好的检测到小目标。
网络的最后一层采用双头设计,这两个头采用一样的设计,由3×3的卷积、3×3的卷积、1×1的卷积构成,第一个头后面链接回归loss计算物体的位置信息,第二个头后面链接分类loss,计算当前特征的类别。
所述纸张检测模型的分类损失VFL(p,q)为:
其中,q为纸张图像的类别标签概率,γ为权重因子,pγ为缩放损失系数,p为纸张图像的类别标签预测概率。VFL通过pγ来缩放损失,只会降低负样本(q=0)的损失贡献,不会降低正样本(q>0)的损失贡献。正样本时候q为预测边界框和真实边界框的交并比,负样本时候q=0,就是普通的二分类交叉熵损失,只不过多了一个自适应交并比加权,用于突出主样本。而为负样本时候就是标准的焦点损失了。
所述纸张检测模型的回归损失为
其中,ρ2(b,bgt)为预测框b和真实框bgt的中心点的欧式距离,c为同时包含预测框b和真实框bgt的最小闭包区域的对角线距离,v为衡量长宽比一致性的参数,α为权重系数,为第i个纸张图像的全局最小解,/>为第i+1个纸张图像的全局最小解,y为标签,yi和yi+1为浮点值y的左右整数值,/>为GIoU的损失,为回归损失,计算目标的边界框。
回归损失保证估计的回归目标无限接近对应的标签y’即这也确保了它作为损失函数的正确性。
将得到的特征图输入网络的最后一层,然后分别输出回归的特征和分类的特征,然后分别输入到分类loss和回归loss,分别计算分类loss和回归loss,然后将其加权求和,得到最终的loss。
S103,利用纸张图像目标检测数据集训练纸张检测模型。
S104,根据训练后的纸张检测模型确定纸张图像的纸张检测结果。
S105,根据纸张检测结果和纸张图像,采用多模态排序模型确定销毁序列;如图4所示,所述多模态排序模型包括:CNN模块和RNN模块;所述CNN模块以ResNet18作为特征提取模块;所述RNN模块以及LSTM作为特征提取模块,然后将二者的输出做拼接,再通过全连接层,得到最终的销毁序列。
具体的,将纸张的图像Resize成224×224大小的图像输入到ResNet18中,将检测框信息输入到LSTM中,然后将二者的输出结果做拼接(ConCat),得到图像的特征和检测框的特征,然后再经过全连接,得到最终的销毁序列。
S106,根据销毁序列进行销毁。
如图5所示,启动激光器,摧毁检测到的目标。
对应上述方法,本发明还提供一种纸介质碳化系统,包括:
数据集构建模块,用于构建纸张图像目标检测数据集;所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注。
纸张检测模型构建模块,用于基于Yolov8s骨干网络构建纸张检测模型;所述纸张检测模型包括:卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块;C2F模块为部分卷积,用于对设定数目的输入通道进行空间特征提取;所述小目标检测结构用于检测尺寸小于设定规格的目标图像。
纸张检测模型训练模块,用于利用纸张图像目标检测数据集训练纸张检测模型。
纸张检测结果确定模块,用于根据训练后的纸张检测模型确定纸张图像的纸张检测结果。
销毁序列确定模块,用于根据纸张检测结果和纸张图像,采用多模态排序模型确定销毁序列;所述多模态排序模型包括:CNN模块和RNN模块。
销毁模块,用于根据销毁序列进行销毁。
为了执行上述实施例对应的方法,以实现相应的功能和技术效果一种存储介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现所述的方法。
基于上述描述,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的计算机存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种纸介质碳化方法,其特征在于,包括:
构建纸张图像目标检测数据集;所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注;图像标注包括:文字、图像以及表格;
基于Yolov8s骨干网络构建纸张检测模型;所述纸张检测模型包括:卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块;C2F模块为部分卷积,用于对设定数目的输入通道进行空间特征提取;所述小目标检测结构用于检测尺寸小于设定规格的目标图像;
利用纸张图像目标检测数据集训练纸张检测模型;
根据训练后的纸张检测模型确定纸张图像的纸张检测结果;
根据纸张检测结果和纸张图像,采用多模态排序模型确定销毁序列;所述多模态排序模型包括:CNN模块和RNN模块;
根据销毁序列进行销毁;销毁方式为通过激光进行精准碳化。
2.根据权利要求1所述的一种纸介质碳化方法,其特征在于,所述构建纸张图像目标检测数据集,具体包括:
利用相机对多种文件进行拍摄采集,保存格式为JPEG,得到纸张图像;
采用Labelme软件对纸张图像进行图像标注,在每张纸张图像中标注目标区域;
对标注后的纸张图像进行数量增强;所述数据增强包括:水平翻转和多角度旋转;
将数据增强后的纸张图像转换为yolov8格式的目标检测数据集,得到纸张图像目标检测数据集。
3.根据权利要求1所述的一种纸介质碳化方法,其特征在于,所述纸张检测模型的分类损失VFL(p,q)为:
其中,q为纸张图像的类别标签概率,γ为权重因子,pγ为缩放损失系数,p为纸张图像的类别标签预测概率。
4.根据权利要求1所述的一种纸介质碳化方法,其特征在于,所述纸张检测模型的回归损失为
其中,ρ2(b,bgt)为预测框b和真实框bgt的中心点的欧式距离,c为同时包含预测框b和真实框bgt的最小闭包区域的对角线距离,v为衡量长宽比一致性的参数,α为权重系数,为第i个纸张图像的全局最小解,/>为第i+1个纸张图像的全局最小解,y为标签,yi和yi+1为浮点值y的左右整数值,/>为GIoU的损失,为回归损失,计算目标的边界框。
5.根据权利要求1所述的一种纸介质碳化方法,其特征在于,所述CNN模块以ResNet18作为特征提取模块;所述RNN模块以及LSTM作为特征提取模块。
6.一种纸介质碳化系统,其特征在于,包括:
数据集构建模块,用于构建纸张图像目标检测数据集;所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注;图像标注包括:文字、图像以及表格;
纸张检测模型构建模块,用于基于Yolov8s骨干网络构建纸张检测模型;所述纸张检测模型包括:卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块;C2F模块为部分卷积,用于对设定数目的输入通道进行空间特征提取;所述小目标检测结构用于检测尺寸小于设定规格的目标图像;
纸张检测模型训练模块,用于利用纸张图像目标检测数据集训练纸张检测模型;
纸张检测结果确定模块,用于根据训练后的纸张检测模型确定纸张图像的纸张检测结果;
销毁序列确定模块,用于根据纸张检测结果和纸张图像,采用多模态排序模型确定销毁序列;所述多模态排序模型包括:CNN模块和RNN模块;
销毁模块,用于根据销毁序列进行销毁;销毁方式为通过激光进行精准碳化。
7.一种存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310766381.3A CN116758547B (zh) | 2023-06-27 | 2023-06-27 | 一种纸介质碳化方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310766381.3A CN116758547B (zh) | 2023-06-27 | 2023-06-27 | 一种纸介质碳化方法、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116758547A CN116758547A (zh) | 2023-09-15 |
CN116758547B true CN116758547B (zh) | 2024-03-12 |
Family
ID=87947622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310766381.3A Active CN116758547B (zh) | 2023-06-27 | 2023-06-27 | 一种纸介质碳化方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116758547B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117173542B (zh) * | 2023-10-26 | 2024-05-28 | 山东易图信息技术有限公司 | 一种基于yolov8模型的水上漂浮物检测优化方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020164282A1 (zh) * | 2019-02-14 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于yolo的图像目标识别方法、装置、电子设备和存储介质 |
WO2020238054A1 (zh) * | 2019-05-30 | 2020-12-03 | 平安科技(深圳)有限公司 | Pdf文档中图表的定位方法、装置及计算机设备 |
CN112815340A (zh) * | 2021-03-07 | 2021-05-18 | 上海穗杉实业股份有限公司 | 一种销毁纸质涉密文件的方法及装置 |
CN113435424A (zh) * | 2021-08-27 | 2021-09-24 | 北京中超伟业信息安全技术股份有限公司 | 一种保密介质销毁颗粒度的识别方法和系统 |
CN115082942A (zh) * | 2022-05-12 | 2022-09-20 | 吉林省吉林祥云信息技术有限公司 | 一种基于YOLO v5的文档图像流程图识别方法、设备及介质 |
-
2023
- 2023-06-27 CN CN202310766381.3A patent/CN116758547B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020164282A1 (zh) * | 2019-02-14 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于yolo的图像目标识别方法、装置、电子设备和存储介质 |
WO2020238054A1 (zh) * | 2019-05-30 | 2020-12-03 | 平安科技(深圳)有限公司 | Pdf文档中图表的定位方法、装置及计算机设备 |
CN112815340A (zh) * | 2021-03-07 | 2021-05-18 | 上海穗杉实业股份有限公司 | 一种销毁纸质涉密文件的方法及装置 |
CN113435424A (zh) * | 2021-08-27 | 2021-09-24 | 北京中超伟业信息安全技术股份有限公司 | 一种保密介质销毁颗粒度的识别方法和系统 |
CN115082942A (zh) * | 2022-05-12 | 2022-09-20 | 吉林省吉林祥云信息技术有限公司 | 一种基于YOLO v5的文档图像流程图识别方法、设备及介质 |
Non-Patent Citations (2)
Title |
---|
复杂版面文档图像内容提取关键算法研究;刘智成;《中国优秀硕士学位论文全文数据库 信息科技辑》(第1期);I138-2431 * |
多特征融合的文档图像版面分析;应自炉 等;《中国图象图形学报》;第25卷(第02期);第311-320 * |
Also Published As
Publication number | Publication date |
---|---|
CN116758547A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ye et al. | TextFuseNet: Scene Text Detection with Richer Fused Features. | |
CN110189255B (zh) | 基于两级检测的人脸检测方法 | |
CN110956126B (zh) | 一种联合超分辨率重建的小目标检测方法 | |
CN116758547B (zh) | 一种纸介质碳化方法、系统及存储介质 | |
CN112329702B (zh) | 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质 | |
Zeng et al. | LEARD-Net: Semantic segmentation for large-scale point cloud scene | |
Khaw et al. | High‐density impulse noise detection and removal using deep convolutional neural network with particle swarm optimisation | |
Xiang et al. | License plate detection based on fully convolutional networks | |
Rahman et al. | Enhancement of convolutional neural network for urban environment parking space classification | |
Wang et al. | Multi-scale dense and attention mechanism for image semantic segmentation based on improved DeepLabv3+ | |
CN112580656A (zh) | 一种端到端的文本检测方法、系统、终端及存储介质 | |
CN116229073A (zh) | 一种基于改进型ERFNet网络的遥感图像分割方法及装置 | |
CN116580285A (zh) | 铁路绝缘子夜间目标识别检测方法 | |
CN114782762B (zh) | 一种垃圾图像检测方法以及小区垃圾站 | |
CN116665153A (zh) | 一种基于改进型Deeplabv3+网络模型的道路场景分割方法 | |
CN116665009A (zh) | 一种基于多尺度ssd网络的管道漏磁图像检测方法 | |
CN116704308A (zh) | 一种基于改进YOLOv2的电力安全标志牌检测方法 | |
Qu et al. | Method of feature pyramid and attention enhancement network for pavement crack detection | |
CN111556018B (zh) | 一种基于cnn的网络入侵检测方法及电子装置 | |
CN114332493A (zh) | 一种跨维度交互式显著检测模型及其检测方法 | |
Bahrami et al. | Image concept detection in imbalanced datasets with ensemble of convolutional neural networks | |
Zhu et al. | Multi-size object detection assisting fault diagnosis of power systems based on improved cascaded faster R-CNNs | |
Bai et al. | Countr: An end-to-end transformer approach for crowd counting and density estimation | |
CN113469199A (zh) | 一种基于深度学习的快速高效图像边缘检测方法 | |
Wei et al. | Multi-scale Defect Detection Network for Tire Visual Inspection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |