CN117992927A

CN117992927A - 一种基于控制噪声扩散网络的目标检测方法

Info

Publication number: CN117992927A
Application number: CN202410405242.2A
Authority: CN
Inventors: 宋彦; 张勇东
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2024-04-07
Filing date: 2024-04-07
Publication date: 2024-05-07

Abstract

本发明涉及目标检测技术领域，公开了一种基于控制噪声扩散网络的目标检测方法，对输入信息进行目标检测，得到目标检测结果，包括：对数据集中的输入信息进行预处理，得到一系列无关信息，将无关信息记作输入信息的噪声信号；对数据集中的所有输入信息重复上述过程，得到噪声信号总集合；对噪声信号总集合进行随机采样，得到噪声信号；将噪声信号转换成噪声表征；对各噪声表征进行线性加权和归一化操作，得到综合噪声信号；利用目标检测网络提取输入信息的关键信息；将与无关信息相链接的综合噪声信号以及关键信息作为扩散网络的输入，计算得到强化的数字化表征；通过综合考虑噪声和目标检测，提高了模型在感兴趣目标物体的识别和定位能力。

Description

一种基于控制噪声扩散网络的目标检测方法

技术领域

本发明涉及目标检测技术领域，具体涉及一种基于控制噪声扩散网络的目标检测方法。

背景技术

目标检测任务的目标是在图像或视频中识别和定位一个或多个感兴趣的目标物体。

现有方法往往引入多尺度信息和金字塔结构，以便在不同尺度上检测目标；或者利用预训练模型参数进行迁移学习，通过在大规模数据上进行预训练，产生高质量特征，提高模型的泛化能力。

但是现有的方法忽略了数据中“噪声”的影响，这里的“噪声”指的是模型统计意义上的噪声，而非图像中的噪声干扰，使得模型对下游任务的表现还有待进一步提升；这里的下游任务指的是目标检测之后的其他任务，例如目标检测之后的机器人动作预测任务等。

发明内容

为解决上述技术问题，本发明提供一种基于控制噪声扩散网络的目标检测方法，使用扩散模型来控制目标检测网络生成特征中的噪声，从而得到优质的数字化表征，应对下游任务。

为解决上述技术问题，本发明采用如下技术方案：

一种基于控制噪声扩散网络的目标检测方法，对给定的输入信息进行目标检测，得到强化的数字化表征/>；/>能够表征目标的边界，得到/>即得到目标检测结果，具体包括以下步骤：

步骤一，对数据集中的某个输入信息进行预处理，得到一系列无关信息/>，其中/>表示输入信息的维度，/>表示各无关信息的向量维度，输入信息/>包括CT影像簇、报告、病人基本信息；将无关信息记作输入信息/>的噪声信号/>；

步骤二，对数据集中的所有输入信息重复步骤一，得到噪声信号总集合；

步骤三，对进行随机采样，得到/>个噪声信号/>；然后使用一个嵌入层矩阵W将/>个噪声信号转换成噪声表征：

其中，表示第/>个噪声信号，/>表示/>对应的噪声表征；

步骤四，对各噪声表征进行线性加权和归一化操作，得到综合噪声信号：

；

其中表示归一化操作；

步骤五，利用目标检测网络提取输入信息的关键信息/>：

；

其中表示目标检测网络，/>，/>表示关键信息中的关键信息向量个数，/>表示关键信息/>中的第/>个关键信息向量；

步骤六，将与无关信息相链接的综合噪声信号，以及关键信息/>作为扩散网络的输入，计算得到强化的数字化表征/>，即得到目标检测结果。

进一步地，步骤六具体包括以下步骤：

S61，基于标准的去噪扩散概率模型以及综合噪声信号对关键信息/>进行降质处理，得到扩散网络的输入/>：

；

其中为去噪扩散概率模型标准采样过程的超参数；

S62，将输入到扩散网络/>，从扩散网络的/>个不同网络层中抽取出一系列不同粒度的表征：

；

其中代表从扩散网络的/>个不同网络层中抽取出的/>个表征；

S63，通过上采样操作对在特征空间中进行上采样对齐，得到；/>表示/>的上采样结果；

S64，应用特征聚合网络处理各个上采样结果的集合/>，得到强化的数字化表征/>：

；

其中表示串联操作。

与现有技术相比，本发明的有益技术效果是：

1.本发明引入了扩散模型，通过对模型统计意义上的噪声进行噪声控制，有效减少了在目标检测网络生成特征中的噪声影响，提高生成特征的质量，从而增强模型在下游任务中的性能表现。

2.本发明不仅关注噪声的控制，还与目标检测机制结合，使得生成的数字化特征更加适用于目标检测任务，通过综合考虑噪声和目标检测，提高了模型在感兴趣目标物体的识别和定位能力。

附图说明

图1为本发明所采用的模型的结构示意图。

具体实施方式

下面结合附图对本发明的一种优选实施方式作详细的说明。

本发明所采用的模型结构如图1所示，任务是在给定输入信息（输入信息/>包括原始CT影像簇、报告、病人基本信息），得到强化的高质量数字化表征/>。对于该任务，本发明首先通过噪声控制对模型的统计意义上的噪声进行控制，然后在该噪声的指导下利用扩散网络对目标检测提取的特征进行降噪处理，最后，提升生成的数字化表征的质量。

CT（Computed Tomography），即电子计算机断层扫描。

本发明中的目标检测方法，具体包括以下步骤：

步骤一，对数据集中的某个输入信息进行预处理，得到一系列无关信息/>，其中，/>表示输入信息的维度，/>表示各无关信息的向量维度，输入信息/>包括CT影像簇、报告、病人基本信息；将无关信息记作输入信息/>的噪声信号/>。

步骤二，对数据集中的所有输入信息重复步骤一，得到噪声信号总集合。

；

其中，表示第/>个噪声信号，/>表示/>对应的噪声表征。

；

其中表示归一化操作。

步骤五，利用目标检测网络提取输入信息的关键信息/>：

；

其中表示目标检测网络，本实施例中，目标检测网络采用Mask R-CNN网络，，/>表示关键信息中的关键信息向量个数，/>表示关键信息/>中的第/>个关键信息向量。

步骤六具体包括以下步骤：

S61，先基于标准的去噪扩散概率模型(Denoising Diffusion ProbabilisticModels，DDPM)以及综合噪声信号对关键信息/>进行降质处理，得到扩散网络的输入/>：

；

其中为去噪扩散概率模型标准采样过程的超参数。

；

其中，代表从扩散网络的/>个不同网络层中抽取出的/>个表征。本实施例中，扩散网络采用标准的高斯扩散网络。

S63，通过上采样操作对在特征空间中进行上采样对齐，得到；/>表示/>的上采样结果。

；

其中表示串联操作。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内，不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立技术方案，说明书的这种叙述方式仅仅是为了清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种基于控制噪声扩散网络的目标检测方法，对给定的输入信息进行目标检测，得到强化的数字化表征/>；/>能够表征目标的边界，得到/>即得到目标检测结果，具体包括以下步骤：

步骤一，对数据集中的某个输入信息进行预处理，得到一系列无关信息/>，其中表示输入信息的维度，/>表示各无关信息的向量维度，输入信息/>包括CT影像簇、报告、病人基本信息；将无关信息记作输入信息/>的噪声信号/>；

；

其中，表示第/>个噪声信号，/>表示/>对应的噪声表征；

；

其中表示归一化操作；

步骤五，利用目标检测网络提取输入信息的关键信息/>：

；

其中表示目标检测网络，/>，/>表示关键信息中的关键信息向量个数，表示关键信息/>中的第/>个关键信息向量；

2.根据权利要求1所述的基于控制噪声扩散网络的目标检测方法，其特征在于，步骤六具体包括以下步骤：

；

其中为去噪扩散概率模型标准采样过程的超参数；

；

其中代表从扩散网络的/>个不同网络层中抽取出的/>个表征；

S63，通过上采样操作对在特征空间中进行上采样对齐，得到/>；/>表示/>的上采样结果；

；

其中表示串联操作。