CN116758547B

CN116758547B - 一种纸介质碳化方法、系统及存储介质

Info

Publication number: CN116758547B
Application number: CN202310766381.3A
Authority: CN
Inventors: 罗远哲; 刘瑞景; 张艺腾; 陈思杰; 陆立军; 闫鹿博; 姜传利; 吴鹏; 李玉琼
Original assignee: Beijing China Super Industry Information Security Technology Ltd By Share Ltd
Current assignee: Beijing China Super Industry Information Security Technology Ltd By Share Ltd
Priority date: 2023-06-27
Filing date: 2023-06-27
Publication date: 2024-03-12
Anticipated expiration: 2043-06-27
Also published as: CN116758547A

Abstract

本发明公开一种纸介质碳化方法、系统及存储介质，涉及纸介质碳化领域，该方法包括构建纸张图像目标检测数据集；利用纸张图像目标检测数据集训练纸张检测模型；根据训练后的纸张检测模型确定纸张图像的纸张检测结果；根据纸张检测结果和纸张图像，采用多模态排序模型确定销毁序列；所述多模态排序模型包括：CNN模块和RNN模块；根据销毁序列进行销毁本发明能够提高纸介质碳化的效率。

Description

一种纸介质碳化方法、系统及存储介质

技术领域

本发明涉及纸介质碳化领域，特别是涉及一种纸介质碳化方法、系统及存储介质。

背景技术

纸介质碳化技术是设备利用高功率密度激光束照射纸张，使纸张很快被加热至汽化温度形成孔洞，完成对纸张的碳化过程，从而高效快速地销毁，达到完全无法通过微型碎片进行拼接识别的目的。过程中汽化物质的尘粒与负离子结合带上负电后，趋向阳极表面放电而沉积，最后经过活性炭滤芯吸附气体物质，从而达到环保要求。汽化的纸张所产生烟尘及气体经过高压静电场时被电分离的方法而沉积至除尘袋中。该新型载体销毁设备操作简单、安全可靠、快速高效，符合一级销毁标准技术要求，销毁过程中不产生烟火，粉尘和有毒气体，销毁残留物可符合环境保护要求可直接丢弃。

目前的碳化技术，不能精准的检测到纸张中文字，对其进行精准的碳化。这样存在遗漏的可能性，为了杜绝这种情况的发生，需要一种智能化的手段解决这个问题。基于深度学习的目标检测算法具有自动提取目标关键特征的优势，可为纸张信息检测提供有效的技术途径。现有算法多采用特征金字塔对经典目标检测网络进行改进，该技术可使特征图在包含丰富语义信息的同时保持较高的分辨率，从而提升神经网络的特征提取能力。这种方法对不同尺寸下的目标，尤其是小目标，具有良好的检测效果，但对纸张图像中文字、图像、表格等多变的特殊目标而言，检测准确性还有待提升。因此，探索一种智能感知的纸介质碳化方法具有重要的研究意义。

发明内容

本发明的目的是提供一种纸介质碳化方法、系统及存储介质，能够提高纸介质碳化的效率。

为实现上述目的，本发明提供了如下方案：

一种纸介质碳化方法，包括：

构建纸张图像目标检测数据集；所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注；

基于Yolov8s骨干网络构建纸张检测模型；所述纸张检测模型包括：卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块；C2F模块为部分卷积，用于对设定数目的输入通道进行空间特征提取；所述小目标检测结构用于检测尺寸小于设定规格的目标图像；

利用纸张图像目标检测数据集训练纸张检测模型；

根据训练后的纸张检测模型确定纸张图像的纸张检测结果；

根据纸张检测结果和纸张图像，采用多模态排序模型确定销毁序列；所述多模态排序模型包括：CNN模块和RNN模块；

根据销毁序列进行销毁。

可选地，所述构建纸张图像目标检测数据集，具体包括：

利用相机对多种文件进行拍摄采集，保存格式为JPEG，得到纸张图像；

采用Labelme软件对纸张图像进行图像标注，在每张纸张图像中标注目标区域；

对标注后的纸张图像进行数量增强；所述数据增强包括：水平翻转和多角度旋转；

将数据增强后的纸张图像转换为yolov8格式的目标检测数据集，得到纸张图像目标检测数据集。

可选地，所述纸张检测模型的分类损失VFL(p，q)为：

其中，q为纸张图像的类别标签概率，γ为权重因子，p^γ为缩放损失系数，p为纸张图像的类别标签预测概率。

可选地，所述纸张检测模型的回归损失为：

其中，ρ²(b，b^gt)为预测框b和真实框b^gt的中心点的欧式距离，c为同时包含预测框b和真实框b^gt的最小闭包区域的对角线距离，v为衡量长宽比一致性的参数，α为权重系数，为第i个纸张图像的全局最小解，/>为第i+1个纸张图像的全局最小解，y为标签，y_i和y_i+1为浮点值y的左右整数值，/>为GIoU的损失，为回归损失，计算目标的边界框。

可选地，所述CNN模块以ResNet18作为特征提取模块；所述RNN模块以及LSTM作为特征提取模块。

一种纸介质碳化系统，包括：

数据集构建模块，用于构建纸张图像目标检测数据集；所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注；

纸张检测模型构建模块，用于基于Yolov8s骨干网络构建纸张检测模型；所述纸张检测模型包括：卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块；C2F模块为部分卷积，用于对设定数目的输入通道进行空间特征提取；所述小目标检测结构用于检测尺寸小于设定规格的目标图像；

纸张检测模型训练模块，用于利用纸张图像目标检测数据集训练纸张检测模型；

纸张检测结果确定模块，用于根据训练后的纸张检测模型确定纸张图像的纸张检测结果；

销毁序列确定模块，用于根据纸张检测结果和纸张图像，采用多模态排序模型确定销毁序列；所述多模态排序模型包括：CNN模块和RNN模块；

销毁模块，用于根据销毁序列进行销毁。

一种存储介质，其上存储有计算机程序指令，当所述计算机程序指令被处理器执行时实现所述的方法。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明所提供的一种纸介质碳化方法、系统及存储介质，通过稀疏注意机制提高主干网络的表征能力，进一步提高小目标检测精度；通过小目标检测结构用于小目标的计算，防止小目标被遗漏；C2F模块使用部分卷积替换普通卷积，参数量更小，速度更快，准确性更高；加入多模态排序模型，得到最优的销魂序列。本发明将目标检测技术应用在纸介质碳化技术上，使得纸介质碳化处理更加高效。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明所提供的一种纸介质碳化方法流程示意图；

图2为纸张图像目标检测数据集构建示意图；

图3为纸张检测模型结构示意图；

图4为多模态排序模型结构图；

图5为本发明所提供的一种纸介质碳化方法整体流程图；

图6为SPPF模块示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本发明所提供的一种纸介质碳化方法，包括：

S101，构建纸张图像目标检测数据集；所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注。

S101具体包括：

利用相机对多种文件进行拍摄采集，保存格式为JPEG，得到纸张图像。

采用Labelme软件对纸张图像进行图像标注，在每张纸张图像中标注目标区域，获得每张纸张图像对应的标注文件(JSON格式)。

对标注后的纸张图像进行数量增强；所述数据增强包括：水平翻转和多角度旋转。多角度旋转包括：90度旋转、180度旋转以及270度旋转。

将数据增强后的纸张图像转换为yolov8格式的目标检测数据集，得到纸张图像目标检测数据集；其中，训练集、验证集、测试接的划分比例为7:2:1。

S102，基于Yolov8s骨干网络构建纸张检测模型；所述纸张检测模型包括：卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制(BiLevelRoutingAttention，BRA)、小目标检测结构以及C2F模块；C2F模块为部分卷积，用于对设定数目的输入通道进行空间特征提取；所述小目标检测结构用于检测尺寸小于设定规格的目标图像。

BRA将注意力的计算分成两个阶段，第一个阶段先进行粗粒度的注意力机制并控制稀疏性；第二阶段基于第一个阶段的稀疏注意力得到的结果进行细粒度注意力机制计算得到细粒度的注意力结果。

将C2F模块嵌入Yolov8s的卷积模块之后，降低网络的参数，提高网络的运行速度和准确率。部分卷积简单地对部分输入通道应用常规变换以进行空间特征提取，并保持其余通道不变。对于连续或常规的内存访问，认为第一个或最后一个连续cp通道是整个特征映射的代表，用于计算。在不损失通用性的情况下，认为输入和输出特征图具有相同的通道数。部分卷积的浮点运算次数等于其中，h代表特征图的高度，w代表特征图的宽度，k代表当前卷及和的大小。当部分卷积cp和普通卷积的c比/>时，部分卷积的FLOPs仅为普通Conv的/>且PConv具有较小的内存访问量，即：c代表普通卷积的数量。c_p代表部分卷积的数量。

为了解决小目标难以识别的问题问题，在YoloV8的基础上增加了专门用于识别小目标的分支结构。如图3所示，本发明输入纸张图像640×640为例，展示网络结构的设计过程：

首先，将图像经过conv1、conv2、conv3、conv4、conv5得到特征图尺寸依次为320×320×64、160×160×128、80×80×256、40×40×512、20×20×512。

conv1-5，代表卷积模块，每个卷积模块由卷积层、BN层和激活函数组成，将各卷积块的输出特征图分别表示为C_1、C_2、C_3、C_4、C_5。

将C_2、C_3、C_4、C_5依次输入到特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4模块中。由于特征图尺寸没有发生变化，所以经过特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4之后对应的图片尺寸为160×160×128、80×80×256、40×40×512、20×20×512。

BRA是一种动态的、查询感知的稀疏注意机制。BRA是在粗区域级别过滤掉大多数不相关的键-值对，以便只保留一小部分路由区域。然后，在这些路由区域的联合中应用细粒度的令牌对令牌注意力。通过引入BRA可以提高对小目标的检测能力，但是如果加入的数量太多会造成推理速度减慢，参数量增大。所以，将BRA放在特征提取模块C2F_2、特征提取模块C2F_3和SPPF(如图6所示)的后面，如图3所示。由于经过BRA不会对特征图的尺寸做改变，所以输出的特征图依然是160×160×128、80×80×256、40×40×512、20×20×512。将这些特征输入到网络的最后一层。

如图3所示，对这四个特征图分别进行如下相同操作，此处以特征提取模块C2F_3为例：为了得到更多的特征信息，首先，将特征提取模块C2F_4经过SPPF再经过BRA，然后，再做上采样，将特征变为40×40×512。接下来，与特征提取模块C2F_3后面的BRA做特征融合，将得到新的特征。将新的特征分为两条分支，一条分支继续上采样得到80×80×256的特征，输入到C2F模块中得到更深层次的特征，然后将这个特征经过3×3，步长为2的卷积得到新的特征与另一条分支在做融合，得到最终的融合特征图，将其命名为D_3。

经过上面的操作依次得到特征图D_1、D_2、D_3、D_4尺寸依次为160×160×128、80×80×256、40×40×512、20×20×512。

小目标通常是指尺寸小于32×32的目标图片，由于纸张中的文字远离低于这个尺寸，所以需要在更大的特征图上解决小目标检测的问题。例如：在640×640的图像中，目标区域是10×10的大小，在160×160的特征特上是2.5×2.5的区域。在80×80的特征图只有1.25×1.25区域，在后面的特征图上像素小于1，已经不存在了，所以使用160×160的特征图更具有优势，能够更好的检测到小目标。

网络的最后一层采用双头设计，这两个头采用一样的设计，由3×3的卷积、3×3的卷积、1×1的卷积构成，第一个头后面链接回归loss计算物体的位置信息，第二个头后面链接分类loss，计算当前特征的类别。

所述纸张检测模型的分类损失VFL(p，q)为：

其中，q为纸张图像的类别标签概率，γ为权重因子，pγ为缩放损失系数，p为纸张图像的类别标签预测概率。VFL通过p^γ来缩放损失，只会降低负样本(q＝0)的损失贡献，不会降低正样本(q＞0)的损失贡献。正样本时候q为预测边界框和真实边界框的交并比，负样本时候q＝0，就是普通的二分类交叉熵损失，只不过多了一个自适应交并比加权，用于突出主样本。而为负样本时候就是标准的焦点损失了。

所述纸张检测模型的回归损失为

回归损失保证估计的回归目标无限接近对应的标签y’即这也确保了它作为损失函数的正确性。

将得到的特征图输入网络的最后一层，然后分别输出回归的特征和分类的特征，然后分别输入到分类loss和回归loss，分别计算分类loss和回归loss，然后将其加权求和，得到最终的loss。

S103，利用纸张图像目标检测数据集训练纸张检测模型。

S104，根据训练后的纸张检测模型确定纸张图像的纸张检测结果。

S105，根据纸张检测结果和纸张图像，采用多模态排序模型确定销毁序列；如图4所示，所述多模态排序模型包括：CNN模块和RNN模块；所述CNN模块以ResNet18作为特征提取模块；所述RNN模块以及LSTM作为特征提取模块，然后将二者的输出做拼接，再通过全连接层，得到最终的销毁序列。

具体的，将纸张的图像Resize成224×224大小的图像输入到ResNet18中，将检测框信息输入到LSTM中，然后将二者的输出结果做拼接(ConCat)，得到图像的特征和检测框的特征，然后再经过全连接，得到最终的销毁序列。

S106，根据销毁序列进行销毁。

如图5所示，启动激光器，摧毁检测到的目标。

对应上述方法，本发明还提供一种纸介质碳化系统，包括：

数据集构建模块，用于构建纸张图像目标检测数据集；所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注。

纸张检测模型构建模块，用于基于Yolov8s骨干网络构建纸张检测模型；所述纸张检测模型包括：卷积层conv1、卷积层conv2、卷积层conv3、卷积层conv4、卷积层conv5、特征提取模块C2F_1、特征提取模块C2F_2、特征提取模块C2F_3、特征提取模块C2F_4、稀疏注意机制、小目标检测结构以及C2F模块；C2F模块为部分卷积，用于对设定数目的输入通道进行空间特征提取；所述小目标检测结构用于检测尺寸小于设定规格的目标图像。

纸张检测模型训练模块，用于利用纸张图像目标检测数据集训练纸张检测模型。

纸张检测结果确定模块，用于根据训练后的纸张检测模型确定纸张图像的纸张检测结果。

销毁序列确定模块，用于根据纸张检测结果和纸张图像，采用多模态排序模型确定销毁序列；所述多模态排序模型包括：CNN模块和RNN模块。

销毁模块，用于根据销毁序列进行销毁。

为了执行上述实施例对应的方法，以实现相应的功能和技术效果一种存储介质，其上存储有计算机程序指令，当所述计算机程序指令被处理器执行时实现所述的方法。

基于上述描述，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的计算机存储介质包括：U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种纸介质碳化方法，其特征在于，包括：

构建纸张图像目标检测数据集；所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注；图像标注包括：文字、图像以及表格；

利用纸张图像目标检测数据集训练纸张检测模型；

根据训练后的纸张检测模型确定纸张图像的纸张检测结果；

根据销毁序列进行销毁；销毁方式为通过激光进行精准碳化。

2.根据权利要求1所述的一种纸介质碳化方法，其特征在于，所述构建纸张图像目标检测数据集，具体包括：

3.根据权利要求1所述的一种纸介质碳化方法，其特征在于，所述纸张检测模型的分类损失VFL(p，q)为：

4.根据权利要求1所述的一种纸介质碳化方法，其特征在于，所述纸张检测模型的回归损失为

5.根据权利要求1所述的一种纸介质碳化方法，其特征在于，所述CNN模块以ResNet18作为特征提取模块；所述RNN模块以及LSTM作为特征提取模块。

6.一种纸介质碳化系统，其特征在于，包括：

数据集构建模块，用于构建纸张图像目标检测数据集；所述纸张图像目标检测数据集包括纸张图像以及对应的图像标注；图像标注包括：文字、图像以及表格；

销毁模块，用于根据销毁序列进行销毁；销毁方式为通过激光进行精准碳化。

7.一种存储介质，其上存储有计算机程序指令，其特征在于，当所述计算机程序指令被处理器执行时实现如权利要求1-5中任一项所述的方法。