CN115082837B

CN115082837B - 对pet瓶进行灌装纯净水的流速控制系统及其控制方法

Info

Publication number: CN115082837B
Application number: CN202210889647.9A
Authority: CN
Inventors: 倪柏雯; 倪荣国
Original assignee: Xinyi Xinnan Environmental Protection Industry Technology Research Institute Co Ltd
Current assignee: Xinyi Xinnan Environmental Protection Industry Technology Research Institute Co Ltd
Priority date: 2022-07-27
Filing date: 2022-07-27
Publication date: 2023-07-04
Anticipated expiration: 2042-07-27
Also published as: CN115082837A

Abstract

本申请涉及智能灌装控制的领域，其具体地公开了一种对PET瓶进行灌装纯净水的流速控制系统及其控制方法，其通过深度学习的卷积神经网络模型作为特征提取器，结合灌装过程的监控视频和灌装过程的声音变化来智能地调整计量设备的流速，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。这样，能够在智能控制方法的作用下使得对于PET瓶灌装纯净水的灌装效率和灌装效果都能够得以保证。

Description

对PET瓶进行灌装纯净水的流速控制系统及其控制方法

技术领域

本发明涉及智能灌装控制的领域，且更为具体地，涉及一种对PET瓶进行灌装纯净水的流速控制系统及其控制方法。

背景技术

在对PET瓶灌装纯净水进行灌装时，如何控制计量设备的纯净水流出速度是关键。在邻近灌装结束时，如果没有提前降低流速或者关闭流速，会导致部分流体溢出；如果灌装结束得过早，则可能最终瓶内的流体总量不满足预设标准。

因此，期待一种对PET瓶进行灌装纯净水的流速控制方案，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种对PET瓶进行灌装纯净水的流速控制系统及其控制方法，其通过人工智能的控制方法，利用深度学习的卷积神经网络模型作为特征提取器，结合灌装过程的监控视频和灌装过程的声音变化来智能地调整计量设备的流速，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。这样，能够在智能控制方法的作用下使得对于PET瓶灌装纯净水的灌装效率和灌装效果都能够得以保证。

根据本申请的一个方面，提供了一种对PET瓶进行灌装纯净水的流速控制系统，其包括：灌装过程数据采集模块，用于获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号；灌装视频编码模块，用于将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图；灌装音效编码模块，用于将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图；投影模块，用于将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量；融合模块，用于融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量；以及流速控制结果生成模块，用于将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。

在上述对PET瓶进行灌装纯净水的流速控制系统中，所述灌装视频编码模块，包括：相邻帧提取单元，用于从所述灌装监控视频提取相邻的第一帧和第二帧；第一图像局部特征提取模块，用于将所述第一帧和所述第二帧分别通过所述第一卷积神经网络的第一卷积层和第二卷积层以得到对应于所述第一帧的第一帧特征图和对应于所述第二帧的第二帧特征图；时间注意力模块，用于将所述第一帧特征图与所述第二帧特征图进行按位置点乘后通过Softmax激活函数以得到时间注意力图；第二图像局部特征提取模块，用于将所述第一帧通过所述第一卷积神经网络的第三卷积层以得到局部特征图；时间注意力施加模块，用于将所述局部特征图与所述时间注意力图进行按位置点乘以得到所述灌装跟踪特征图。

在上述对PET瓶进行灌装纯净水的流速控制系统中，所述灌装音效编码模块，进一步用于：所述第二卷积神经网络的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行均值池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第二卷积神经网络的最后一层的输出为所述音效特征图，所述第二卷积神经网络的第一层的输入为所述声音信号的波形图。

在上述对PET瓶进行灌装纯净水的流速控制系统中，所述投影模块，进一步用于对所述灌装跟踪特征图和所述音效特征图分别进行沿通道维度的全局均值池化以得到所述灌装跟踪特征向量和所述音效特征向量。

在上述对PET瓶进行灌装纯净水的流速控制系统中，所述融合模块，包括：向量整合单元，用于计算所述灌装跟踪特征向量和所述音效特征向量的按位置加和以得到整合特征向量；对数化单元，用于对所述整合特征向量进行对数运算以得到对数整合特征向量，其中，所述对所述整合特征向量进行对数运算表示计算所述整合特征向量中各个位置的特征值的对数函数值；全场景单应关联单元，用于计算所述灌装跟踪特征向量的转置向量与所述音效特征向量之间的向量乘积以得到全场景单应关联矩阵；深度感知单元，用于计算全场景单应关联矩阵的Frobenius范数作为所述全场景单应关联矩阵的深度感知值；单应性表征单元，用于计算所述灌装跟踪特征向量和所述音效特征向量之间的差分特征向量的一范数作为单应性表征值；融合单元，用于以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量。

在上述对PET瓶进行灌装纯净水的流速控制系统中，所述融合单元，进一步用于：以所述单应性表征值作为权重值和所述深度感知值作为偏置以如下公式来对所述对数整合特征向量进行处理以得到所述分类特征向量；其中，所述公式为：

其中

表示所述跟踪特征图，/>

表示所述音效特征图，/>

表示所述分类特征向量，

表示向量的一范数，且/>

表示矩阵的Frobenius范数，/>

和/>

分别表示按位置减法和加法，且/>

表示按位置点乘。

在上述对PET瓶进行灌装纯净水的流速控制系统中，所述流速控制结果生成模块，进一步用于：使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果，其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到

为偏置向量，/>

为所述分类特征向量。

根据本申请的另一方面，一种对PET瓶进行灌装纯净水的流速控制方法，其包括：获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号；将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图；将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图；将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量；融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量；以及将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。

在上述对PET瓶进行灌装纯净水的流速控制方法中，将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图，包括：从所述灌装监控视频提取相邻的第一帧和第二帧；将所述第一帧和所述第二帧分别通过所述第一卷积神经网络的第一卷积层和第二卷积层以得到对应于所述第一帧的第一帧特征图和对应于所述第二帧的第二帧特征图；将所述第一帧特征图与所述第二帧特征图进行按位置点乘后通过Softmax激活函数以得到时间注意力图；将所述第一帧通过所述第一卷积神经网络的第三卷积层以得到局部特征图；将所述局部特征图与所述时间注意力图进行按位置点乘以得到所述灌装跟踪特征图。

在上述对PET瓶进行灌装纯净水的流速控制方法中，将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图，包括：所述第二卷积神经网络的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行均值池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第二卷积神经网络的最后一层的输出为所述音效特征图，所述第二卷积神经网络的第一层的输入为所述声音信号的波形图。

在上述对PET瓶进行灌装纯净水的流速控制方法中，将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量，包括：对所述灌装跟踪特征图和所述音效特征图分别进行沿通道维度的全局均值池化以得到所述灌装跟踪特征向量和所述音效特征向量。

在上述对PET瓶进行灌装纯净水的流速控制方法中，融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量，包括：计算所述灌装跟踪特征向量和所述音效特征向量的按位置加和以得到整合特征向量；对所述整合特征向量进行对数运算以得到对数整合特征向量，其中，所述对所述整合特征向量进行对数运算表示计算所述整合特征向量中各个位置的特征值的对数函数值；计算所述灌装跟踪特征向量的转置向量与所述音效特征向量之间的向量乘积以得到全场景单应关联矩阵；计算全场景单应关联矩阵的Frobenius范数作为所述全场景单应关联矩阵的深度感知值；计算所述灌装跟踪特征向量和所述音效特征向量之间的差分特征向量的一范数作为单应性表征值；以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量。

在上述对PET瓶进行灌装纯净水的流速控制方法中，以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量，包括：以所述单应性表征值作为权重值和所述深度感知值作为偏置以如下公式来对所述对数整合特征向量进行处理以得到所述分类特征向量；其中，所述公式为：

其中

表示所述跟踪特征图，/>

表示所述音效特征图，/>

表示所述分类特征向量，/>

表示向量的一范数，且/>

表示矩阵的Frobenius范数，/>

和/>

分别表示按位置减法和加法，且/>

表示按位置点乘。

在上述对PET瓶进行灌装纯净水的流速控制方法中，将所述分类特征向量通过分类器以得到分类结果，包括：使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果，其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到/>

为偏置向量，/>

为所述分类特征向量。

与现有技术相比，本申请提供的对PET瓶进行灌装纯净水的流速控制系统及其控制方法，其通过人工智能的控制方法，利用深度学习的卷积神经网络模型作为特征提取器，结合灌装过程的监控视频和灌装过程的声音变化来智能地调整计量设备的流速，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。这样，能够在智能控制方法的作用下使得对于PET瓶灌装纯净水的灌装效率和灌装效果都能够得以保证。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的对PET瓶进行灌装纯净水的流速控制系统的框图。

图2为根据本申请实施例的对PET瓶进行灌装纯净水的流速控制系统中灌装视频编码模块的框图。

图3为根据本申请实施例的对PET瓶进行灌装纯净水的流速控制系统中融合模块的框图。

图4为根据本申请实施例的对PET瓶进行灌装纯净水的流速控制方法的流程图。

图5为根据本申请实施例的对PET瓶进行灌装纯净水的流速控制方法的架构示意图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

场景概述

如前所述，在对PET瓶灌装纯净水进行灌装时，如何控制计量设备的纯净水流出速度是关键。应可以理解，在邻近灌装结束时，如果没有提前降低流速或者关闭流速，会导致部分流体溢出；如果灌装结束得过早，则可能最终瓶内的流体总量不满足预设标准。

因此，期待一种用于计量设备的计量方法，也就是，流量控制方法来对灌装阀门进行智能控制，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。

目前，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外，深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域，也展现出了接近甚至超越人类的水平。

深度学习以及神经网络的发展为对PET瓶进行灌装纯净水的流速控制提供了新的解决思路和方案。

相应地，本申请发明人发现在对PET瓶灌装纯净水进行灌装中，若想对于计量设备的纯净水流出速度进行智能控制来确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求，就需要实时动态地对于PET瓶进行灌装纯净水的灌装过程进行监测，而这可以依靠相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频来实现。并且，考虑到监控视频可能会存在遮挡，又可能会受到环境的影响等问题，因此使用单一的监控方式来对于ET瓶进行灌装纯净水的灌装过程进行实时监测是不准确的，为了能够更为准确地对于灌装过程进行监测并动态地控制，进一步加入灌装过程中的声音信号来辅助进行监控。也就是，应可以理解，随着对于PET瓶进行纯净水灌装的不断进行，声音的信号是不断发生变化的，因此，在本申请的技术方案中，采用所述声音信号来辅助进行对于PET瓶进行灌装纯净水的灌装过程的实时动态监测，能够提高判断的准确性。也就是，结合灌装过程的监控视频和灌装过程的声音变化来调整计量设备的流速，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。

具体地，在本申请的技术方案中，首先，通过相机采集对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集所述灌装过程中的声音信号。然后，将所述灌装监控视频通过用于在隐含关联特征提取方面具有优异表现的卷积神经网络模型来进行特征提取，但是，考虑到在所述灌装监控视频中，所述视频中的各个图像帧在时间维度上具有着特殊的动态关联信息，因此，为了挖掘出其在时序上的隐含动态关联特征，在本申请的技术方案中，使用使用时间注意力机制的第一卷积神经网络来对所述灌装监控视频进行特征提取，以得到灌装跟踪特征图。

进一步地，对于所述灌装过程中的声音信号，将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络中进行特征提取，以提取出所述声音信号的波形图的局部高维隐含特征，从而得到音效特征图。

应可以理解，考虑到对于所述跟踪特征图和所述音效特征图，由于其特征分布在高维特征空间内的深度分布特征，在特征融合时可能由于分布错位而影响融合效果。在本申请的技术方案中，由于两者的特征分布都具有沿着时间方向的预定维度，因此在进行特征融合时，可以基于预定维度的场景流来进行特征图的深度对齐融合。具体地，首先将所述跟踪特征图和所述音效特征图投影为特征向量

和/>

，在本申请实施例中，可以对所述灌装跟踪特征图和所述音效特征图分别进行沿通道维度的全局均值池化来进行特征图的降维处理，以得到所述灌装跟踪特征向量和所述音效特征向量。然后计算融合向量：

其中

表示所述跟踪特征图，/>

表示所述音效特征图，/>

表示所述分类特征向量，/>

表示向量的一范数，且/>

表示矩阵的Frobenius范数，/>

和/>

分别表示按位置减法和加法，且/>

表示按位置点乘。

也就是，将差分向量的一范数作为深度场景流的单应性表征，来对向量的信息融合表达进行约束，并叠加作为向量之间的全场景单应关联矩阵的深度感知，从而充分利用预定维度下的场景流的深度单应性表达，来在可能存在特征分布错位的基础上实现特征之间的稠密深度融合，进而提高分类的准确性。

进一步再将融合得到的分类特征向量通过分类器进行分类处理，以获得用于表示当前时间点是否需关闭灌装阀门的分类结果。

基于此，本申请提出了一种对PET瓶进行灌装纯净水的流速控制系统，其包括：灌装过程数据采集模块，用于获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号；灌装视频编码模块，用于将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图；灌装音效编码模块，用于将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图；投影模块，用于将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量；融合模块，用于融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量；以及，流速控制结果生成模块，用于将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性系统

图1图示了根据本申请实施例的对PET瓶进行灌装纯净水的流速控制系统的框图。如图1所示，根据本申请实施例的对PET瓶进行灌装纯净水的流速控制系统 200，包括：灌装过程数据采集模块 210，用于获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号；灌装视频编码模块 220，用于将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图；灌装音效编码模块 230，用于将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图；投影模块 240，用于将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量；融合模块 250，用于融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量；以及，流速控制结果生成模块 260，用于将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。

具体地，在本申请实施例中，所述灌装过程数据采集模块 210和所述灌装视频编码模块 220，用于获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号，并将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图。如前所述，考虑到在对PET瓶灌装纯净水进行灌装中，若想对于计量设备的纯净水流出速度进行智能控制来确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求，就需要实时动态地对于PET瓶进行灌装纯净水的灌装过程进行监测，而这可以依靠相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频来实现。

并且，考虑到在实际的监控过程中，监控视频可能会存在遮挡，又可能会受到环境的影响等问题，因此使用单一的监控方式来对于ET瓶进行灌装纯净水的灌装过程进行实时监测是不准确的，为了能够更为准确地对于灌装过程进行监测并动态地控制，进一步加入灌装过程中的声音信号来辅助进行监控。也就是，应可以理解，随着对于PET瓶进行纯净水灌装的不断进行，声音的信号是不断发生变化的，因此，在本申请的技术方案中，采用所述声音信号来辅助进行对于PET瓶进行灌装纯净水的灌装过程的实时动态监测，能够提高判断的准确性。也就是，结合灌装过程的监控视频和灌装过程的声音变化来调整计量设备的流速，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。

更具体地，在本申请的实施例中，所述灌装视频编码模块，包括：首先，从所述灌装监控视频提取相邻的第一帧和第二帧。接着，将所述第一帧和所述第二帧分别通过所述第一卷积神经网络的第一卷积层和第二卷积层以得到对应于所述第一帧的第一帧特征图和对应于所述第二帧的第二帧特征图。然后，将所述第一帧特征图与所述第二帧特征图进行按位置点乘后通过Softmax激活函数以得到时间注意力图。接着，将所述第一帧通过所述第一卷积神经网络的第三卷积层以得到局部特征图。最后，将所述局部特征图与所述时间注意力图进行按位置点乘以得到所述灌装跟踪特征图。应可以理解，在通过时间注意力模块获得的所述跟踪特征图上，可以结合当前的所述第一帧和先前的所述第二帧中的时域信息，来强化所述第一帧中的对象区域的特征，从而能够有效地提取所述第一帧图像中灌装过程的实时动态特征。

图2图示了根据本申请实施例的对PET瓶进行灌装纯净水的流速控制中灌装视频编码模块的框图。如图2所示，所述灌装视频编码模块 220，包括：相邻帧提取单元 221，用于从所述灌装监控视频提取相邻的第一帧和第二帧；第一图像局部特征提取模块 222，用于将所述第一帧和所述第二帧分别通过所述第一卷积神经网络的第一卷积层和第二卷积层以得到对应于所述第一帧的第一帧特征图和对应于所述第二帧的第二帧特征图；时间注意力模块 223，用于将所述第一帧特征图与所述第二帧特征图进行按位置点乘后通过Softmax激活函数以得到时间注意力图；第二图像局部特征提取模块 224，用于将所述第一帧通过所述第一卷积神经网络的第三卷积层以得到局部特征图；时间注意力施加模块225，用于将所述局部特征图与所述时间注意力图进行按位置点乘以得到所述灌装跟踪特征图。

具体地，在本申请实施例中，所述灌装音效编码模块 230，用于将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图。也就是，在本申请的技术方案中，对于所述灌装过程中的声音信号，将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络中进行特征提取，以提取出所述声音信号的波形图的局部高维隐含特征，从而得到音效特征图。

更具体地，在本申请的实施例中，所述灌装音效编码模块，进一步用于：所述第二卷积神经网络的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行均值池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第二卷积神经网络的最后一层的输出为所述音效特征图，所述第二卷积神经网络的第一层的输入为所述声音信号的波形图。

具体地，在本申请实施例中，所述投影模块 240和所述融合模块 250，用于将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量，并融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量。应可以理解，考虑到对于所述跟踪特征图和所述音效特征图，由于其特征分布在高维特征空间内的深度分布特征，在特征融合时可能由于分布错位而影响融合效果。并且在本申请的技术方案中，由于两者的特征分布都具有沿着时间方向的预定维度，因此在进行特征融合时，可以基于预定维度的场景流来进行特征图的深度对齐融合。具体地，在本申请的技术方案中，首先将所述跟踪特征图和所述音效特征图投影为特征向量

和/>

，相应地，在一个具体示例中，可以对所述灌装跟踪特征图和所述音效特征图分别进行沿通道维度的全局均值池化来进行特征图的降维处理，以得到所述灌装跟踪特征向量和所述音效特征向量。也就是，将差分向量的一范数作为深度场景流的单应性表征，来对向量的信息融合表达进行约束，并叠加作为向量之间的全场景单应关联矩阵的深度感知，从而充分利用预定维度下的场景流的深度单应性表达，来在可能存在特征分布错位的基础上实现特征之间的稠密深度融合，进而提高分类的准确性。

更具体地，在本申请实施例中，所述融合模块，包括：首先，计算所述灌装跟踪特征向量和所述音效特征向量的按位置加和以得到整合特征向量。接着，对所述整合特征向量进行对数运算以得到对数整合特征向量，其中，所述对所述整合特征向量进行对数运算表示计算所述整合特征向量中各个位置的特征值的对数函数值。然后，计算所述灌装跟踪特征向量的转置向量与所述音效特征向量之间的向量乘积以得到全场景单应关联矩阵。接着，计算全场景单应关联矩阵的Frobenius范数作为所述全场景单应关联矩阵的深度感知值。然后，计算所述灌装跟踪特征向量和所述音效特征向量之间的差分特征向量的一范数作为单应性表征值。最后，以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量。相应地，在一个具体示例中，以所述单应性表征值作为权重值和所述深度感知值作为偏置以如下公式来对所述对数整合特征向量进行处理以得到所述分类特征向量；其中，所述公式为：

其中

表示所述跟踪特征图，/>

表示所述音效特征图，/>

表示所述分类特征向量，

表示向量的一范数，且/>

表示矩阵的Frobenius范数，/>

和/>

分别表示按位置减法和加法，且/>

表示按位置点乘。

图3图示了根据本申请实施例的对PET瓶进行灌装纯净水的流速控制中融合模块的框图。如图3所示，所述融合模块 250，包括：向量整合单元 251，用于计算所述灌装跟踪特征向量和所述音效特征向量的按位置加和以得到整合特征向量；对数化单元 252，用于对所述整合特征向量进行对数运算以得到对数整合特征向量，其中，所述对所述整合特征向量进行对数运算表示计算所述整合特征向量中各个位置的特征值的对数函数值；全场景单应关联单元 253，用于计算所述灌装跟踪特征向量的转置向量与所述音效特征向量之间的向量乘积以得到全场景单应关联矩阵；深度感知单元 254，用于计算全场景单应关联矩阵的Frobenius范数作为所述全场景单应关联矩阵的深度感知值；单应性表征单元 255，用于计算所述灌装跟踪特征向量和所述音效特征向量之间的差分特征向量的一范数作为单应性表征值；融合单元 256，用于以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量。

具体地，在本申请实施例中，所述流速控制结果生成模块 260，用于将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。也就是，进一步再将融合得到的分类特征向量通过分类器进行分类处理，以获得用于表示当前时间点是否需关闭灌装阀门的分类结果。

相应地，在一个具体示例中，所述流速控制结果生成模块，包括：使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果，其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到/>

为偏置向量，/>

为所述分类特征向量。

综上，基于本申请实施例的所述对PET瓶进行灌装纯净水的流速控制系统 200被阐明，其通过人工智能的控制方法，利用深度学习的卷积神经网络模型作为特征提取器，结合灌装过程的监控视频和灌装过程的声音变化来智能地调整计量设备的流速，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。这样，能够在智能控制方法的作用下使得对于PET瓶灌装纯净水的灌装效率和灌装效果都能够得以保证。

如上所述，根据本申请实施例的对PET瓶进行灌装纯净水的流速控制系统 200可以实现在各种终端设备中，例如对PET瓶进行灌装纯净水的流速控制算法的服务器等。在一个示例中，根据本申请实施例的对PET瓶进行灌装纯净水的流速控制系统 200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该对PET瓶进行灌装纯净水的流速控制系统 200可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该对PET瓶进行灌装纯净水的流速控制系统 200同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该对PET瓶进行灌装纯净水的流速控制系统 200与该终端设备也可以是分立的设备，并且该对PET瓶进行灌装纯净水的流速控制系统 200可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

示例性方法

图4图示了对PET瓶进行灌装纯净水的流速控制方法的流程图。如图4所示，根据本申请实施例的对PET瓶进行灌装纯净水的流速控制方法，包括步骤：S110，获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号；S120，将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图；S130，将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图；S140，将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量；S150，融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量；以及，S160，将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。

图5图示了根据本申请实施例的对PET瓶进行灌装纯净水的流速控制方法的架构示意图。如图5所示，在所述对PET瓶进行灌装纯净水的流速控制方法的网络架构中，首先，将获得的所述灌装监控视频（例如，如图5中所示意的P1）通过使用时间注意力机制的第一卷积神经网络（例如，如图5中所示意的CNN1）以得到灌装跟踪特征图（例如，如图5中所示意的F1）；接着，将获得的所述声音信号的波形图（例如，如图5中所示意的P2）通过作为特征提取器的第二卷积神经网络（例如，如图5中所示意的CNN2）以得到音效特征图（例如，如图5中所示意的F2）；然后，将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量（例如，如图5中所示意的VF1）和音效特征向量（例如，如图5中所示意的VF2）；接着，融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量（例如，如图5中所示意的VF）；以及，最后，将所述分类特征向量通过分类器（例如，如图5中所示意的圈S）以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。

更具体地，在步骤S110和步骤S120中，获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号，并将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图。应可以理解，考虑到在对PET瓶灌装纯净水进行灌装中，若想对于计量设备的纯净水流出速度进行智能控制来确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求，就需要实时动态地对于PET瓶进行灌装纯净水的灌装过程进行监测，而这可以依靠相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频来实现。

更具体地，在步骤S130中，将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图，并将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量。也就是，在本申请的技术方案中，对于所述灌装过程中的声音信号，将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络中进行特征提取，以提取出所述声音信号的波形图的局部高维隐含特征，从而得到音效特征图。

更具体地，在步骤S140和步骤S150中，将所述灌装跟踪特征图和所述音效特征图投影为特征向量以得到灌装跟踪特征向量和音效特征向量，并融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量。应可以理解，考虑到对于所述跟踪特征图和所述音效特征图，由于其特征分布在高维特征空间内的深度分布特征，在特征融合时可能由于分布错位而影响融合效果。并且在本申请的技术方案中，由于两者的特征分布都具有沿着时间方向的预定维度，因此在进行特征融合时，可以基于预定维度的场景流来进行特征图的深度对齐融合。具体地，在本申请的技术方案中，首先将所述跟踪特征图和所述音效特征图投影为特征向量

和/>

更具体地，在步骤S160中，将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门。也就是，进一步再将融合得到的分类特征向量通过分类器进行分类处理，以获得用于表示当前时间点是否需关闭灌装阀门的分类结果。

综上，基于本申请实施例的所述对PET瓶进行灌装纯净水的流速控制方法被阐明，其通过人工智能的控制方法，利用深度学习的卷积神经网络模型作为特征提取器，结合灌装过程的监控视频和灌装过程的声音变化来智能地调整计量设备的流速，以确保流体不溢出且最终灌入PET瓶内的流量总量满足预设要求。这样，能够在智能控制方法的作用下使得对于PET瓶灌装纯净水的灌装效率和灌装效果都能够得以保证。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种对PET瓶进行灌装纯净水的流速控制系统，其特征在于，包括：灌装过程数据采集模块，用于获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号；灌装视频编码模块，用于将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图；灌装音效编码模块，用于将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图；投影模块，用于将所述灌装跟踪特征图和所述音效特征图分别投影为特征向量以得到灌装跟踪特征向量和音效特征向量；融合模块，用于融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量；流速控制结果生成模块，用于将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门；

其中，所述融合模块，包括：向量整合单元，用于计算所述灌装跟踪特征向量和所述音效特征向量的按位置加和以得到整合特征向量；对数化单元，用于对所述整合特征向量进行对数运算以得到对数整合特征向量，其中，所述对所述整合特征向量进行对数运算表示计算所述整合特征向量中各个位置的特征值的对数函数值；全场景单应关联单元，用于计算所述灌装跟踪特征向量的转置向量与所述音效特征向量之间的向量乘积以得到全场景单应关联矩阵；深度感知单元，用于计算全场景单应关联矩阵的Frobenius范数作为所述全场景单应关联矩阵的深度感知值；单应性表征单元，用于计算所述灌装跟踪特征向量和所述音效特征向量之间的差分特征向量的一范数作为单应性表征值；融合单元，用于以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量；

其中，所述融合单元，进一步用于：以所述单应性表征值作为权重值和所述深度感知值作为偏置以如下公式来对所述对数整合特征向量进行处理以得到所述分类特征向量；其中，所述公式为：

,

其中

表示所述灌装跟踪特征向量，/>

表示所述音效特征向量，/>

表示所述分类特征向量，/>

表示向量的一范数，且/>

表示矩阵的Frobenius范数，/>

和/>

分别表示按位置减法和加法，且/>

表示按位置点乘；

在上述公式中，将所述灌装跟踪特征向量和所述音效特征向量之间的差分特征向量作为深度场景流的单应性表征，来对所述灌装跟踪特征向量和所述音效特征向量的信息融合表达进行约束，并叠加作为所述灌装跟踪特征向量和所述音效特征向量之间的全场景单应关联矩阵的深度感知，从而充分利用预定维度下的场景流的深度单应性表达，来在可能存在特征分布错位的基础上实现特征之间的稠密深度融合。

2.根据权利要求1所述的对PET瓶进行灌装纯净水的流速控制系统，其特征在于，所述灌装视频编码模块，包括：相邻帧提取单元，用于从所述灌装监控视频提取相邻的第一帧和第二帧；第一图像局部特征提取模块，用于将所述第一帧和所述第二帧分别通过所述第一卷积神经网络的第一卷积层和第二卷积层以得到对应于所述第一帧的第一帧特征图和对应于所述第二帧的第二帧特征图；时间注意力模块，用于将所述第一帧特征图与所述第二帧特征图进行按位置点乘后通过Softmax激活函数以得到时间注意力图；第二图像局部特征提取模块，用于将所述第一帧通过所述第一卷积神经网络的第三卷积层以得到局部特征图；时间注意力施加模块，用于将所述局部特征图与所述时间注意力图进行按位置点乘以得到所述灌装跟踪特征图。

3.根据权利要求2所述的对PET瓶进行灌装纯净水的流速控制系统，其特征在于，所述灌装音效编码模块，进一步用于：所述第二卷积神经网络的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行均值池化处理以得到池化特征图；以及对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第二卷积神经网络的最后一层的输出为所述音效特征图，所述第二卷积神经网络的第一层的输入为所述声音信号的波形图。

4.根据权利要求3所述的对PET瓶进行灌装纯净水的流速控制系统，其特征在于，所述投影模块，进一步用于对所述灌装跟踪特征图和所述音效特征图分别进行沿通道维度的全局均值池化以得到所述灌装跟踪特征向量和所述音效特征向量。

5.根据权利要求4所述的对PET瓶进行灌装纯净水的流速控制系统，其特征在于，所述流速控制结果生成模块，进一步用于：使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果，其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到/>

为偏置向量，/>

为所述分类特征向量。

6.一种对PET瓶进行灌装纯净水的流速控制方法，其特征在于，包括：

获取由相机采集的对PET瓶进行灌装纯净水的灌装过程的灌装监控视频和由声音传感器采集的所述灌装过程中的声音信号；将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图；将所述声音信号的波形图通过作为特征提取器的第二卷积神经网络以得到音效特征图；将所述灌装跟踪特征图和所述音效特征图分别投影为特征向量以得到灌装跟踪特征向量和音效特征向量；融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量；以及将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示当前时间点是否需关闭灌装阀门；

其中，所述融合所述灌装跟踪特征向量和所述音效特征向量以得到分类特征向量，包括：计算所述灌装跟踪特征向量和所述音效特征向量的按位置加和以得到整合特征向量；对所述整合特征向量进行对数运算以得到对数整合特征向量，其中，所述对所述整合特征向量进行对数运算表示计算所述整合特征向量中各个位置的特征值的对数函数值；计算所述灌装跟踪特征向量的转置向量与所述音效特征向量之间的向量乘积以得到全场景单应关联矩阵；计算全场景单应关联矩阵的Frobenius范数作为所述全场景单应关联矩阵的深度感知值；计算所述灌装跟踪特征向量和所述音效特征向量之间的差分特征向量的一范数作为单应性表征值；以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量；

其中，所述以所述单应性表征值作为权重值和所述深度感知值作为偏置来对所述对数整合特征向量进行处理以得到所述分类特征向量，包括：以所述单应性表征值作为权重值和所述深度感知值作为偏置以如下公式来对所述对数整合特征向量进行处理以得到所述分类特征向量；其中，所述公式为：

,

其中

表示所述灌装跟踪特征向，/>

表示所述音效特征向量，/>

表示所述分类特征向量，/>

表示向量的一范数，且/>

表示矩阵的Frobenius范数，/>

和/>

分别表示按位置减法和加法，且/>

表示按位置点乘；

7.根据权利要求6所述的对PET瓶进行灌装纯净水的流速控制方法，其特征在于，所述将所述灌装监控视频通过使用时间注意力机制的第一卷积神经网络以得到灌装跟踪特征图，包括：从所述灌装监控视频提取相邻的第一帧和第二帧；将所述第一帧和所述第二帧分别通过所述第一卷积神经网络的第一卷积层和第二卷积层以得到对应于所述第一帧的第一帧特征图和对应于所述第二帧的第二帧特征图；将所述第一帧特征图与所述第二帧特征图进行按位置点乘后通过Softmax激活函数以得到时间注意力图；将所述第一帧通过所述第一卷积神经网络的第三卷积层以得到局部特征图；将所述局部特征图与所述时间注意力图进行按位置点乘以得到所述灌装跟踪特征图。