CN116945258A - 模切机控制系统及其方法 - Google Patents
模切机控制系统及其方法 Download PDFInfo
- Publication number
- CN116945258A CN116945258A CN202310971093.1A CN202310971093A CN116945258A CN 116945258 A CN116945258 A CN 116945258A CN 202310971093 A CN202310971093 A CN 202310971093A CN 116945258 A CN116945258 A CN 116945258A
- Authority
- CN
- China
- Prior art keywords
- feature
- convolution
- product
- layer
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000005520 cutting process Methods 0.000 title claims abstract description 141
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims description 256
- 238000005553 drilling Methods 0.000 claims description 81
- 238000012545 processing Methods 0.000 claims description 81
- 238000000605 extraction Methods 0.000 claims description 68
- 230000000903 blocking effect Effects 0.000 claims description 31
- 238000013527 convolutional neural network Methods 0.000 claims description 28
- 230000036961 partial effect Effects 0.000 claims description 28
- 238000003062 neural network model Methods 0.000 claims description 19
- 238000011176 pooling Methods 0.000 claims description 14
- 230000003247 decreasing effect Effects 0.000 claims description 13
- 230000035515 penetration Effects 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 10
- 238000004519 manufacturing process Methods 0.000 abstract description 8
- 230000008901 benefit Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 229910000831 Steel Inorganic materials 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 239000010959 steel Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004049 embossing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000011087 paperboard Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B26—HAND CUTTING TOOLS; CUTTING; SEVERING
- B26D—CUTTING; DETAILS COMMON TO MACHINES FOR PERFORATING, PUNCHING, CUTTING-OUT, STAMPING-OUT OR SEVERING
- B26D5/00—Arrangements for operating and controlling machines or devices for cutting, cutting-out, stamping-out, punching, perforating, or severing by means other than cutting
- B26D5/005—Computer numerical control means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B26—HAND CUTTING TOOLS; CUTTING; SEVERING
- B26F—PERFORATING; PUNCHING; CUTTING-OUT; STAMPING-OUT; SEVERING BY MEANS OTHER THAN CUTTING
- B26F1/00—Perforating; Punching; Cutting-out; Stamping-out; Apparatus therefor
- B26F1/38—Cutting-out; Stamping-out
- B26F1/40—Cutting-out; Stamping-out using a press, e.g. of the ram type
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0014—Image feed-back for automatic industrial control, e.g. robot with camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Mechanical Engineering (AREA)
- Evolutionary Biology (AREA)
- Forests & Forestry (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biodiversity & Conservation Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Robotics (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及智能控制领域,其具体地公开了一种模切机控制系统及其方法,其采用基于深度神经网络模型的人工智能技术,获取待切割产品图像和电机转速,分别通过VIT模模型、多尺度特征提取结果和卷积神经网络模块提取出特征,以得到用于表示当前时间点的模切机电机转速应增大或减小的分类结果。这样,构建模切机控制方案,可以实现自动化调整模切机电机转速的目的,以优化切割效果和提高生产效率。
Description
技术领域
本申请涉及智能控制领域,且更为具体地,涉及一种模切机控制系统及其方法。
背景技术
模切机的工作原理是利用模切刀、钢刀、五金模具、钢线,通过压印版施加一定的压力,将印品或纸板轧切成一定形状。转速的大小是模切机在工作过程中重要的一个控制环节,不同产品转速大小不同。如果转速过大,高速旋转的刀具可能无法完全切割材料,导致切割边缘不光滑或产生毛刺;还会导致材料受损甚至缩短设备的使用寿命。但转速过小,会导致切割速度变慢,影响生产效率。但由于现有的技术很难精准地控制电机转速的大小。
因此,期待一种优化的模切机控制方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种模切机控制系统及其方法,其采用基于深度神经网络模型的人工智能技术,获取待切割产品图像和电机转速,分别通过VIT模模型、多尺度特征提取结果和卷积神经网络模块提取出特征,以得到用于表示当前时间点的模切机电机转速应增大或减小的分类结果。这样,构建模切机控制方案,可以实现自动化调整模切机电机转速的目的,以优化切割效果和提高生产效率。
根据本申请的一个方面,提供了一种模切机控制系统,其包括:
数据获取模块,用于获取待切割产品图像和电机转速;
钻速特征提取模块,用于将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量;
图像分块模块,用于将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列;
切割产品序列提取模块,用于将所述切割产品局部图像块的序列通过包含嵌入层的Vi T模型以得到切割产品特征向量的序列;
切割产品全局提取模块,用于将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图;
多尺度特征提取模块,用于将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核;
关联特征模块,用于构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量;
分类结果模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
在上述模切机控制系统中,所述所述钻速特征提取模块,包括:第一尺度钻速特征提取单元,用于使用所述卷积神经网络模型的第一卷积分支的各层在层的正向传递中分别对输入数据进行基于第一卷积核的一维卷积处理、池化处理和激活处理以由所述第一卷积分支的最后一层输出第一尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;第二尺度钻速特征提取单元,用于使用所述卷积神经网络模型的第二卷积分支的各层在层的正向传递中分别对输入数据进行基于第二卷积核的一维卷积处理、池化处理和激活处理以由所述第二卷积分支的最后一层输出第二尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;以及,钻速特征融合单元,用于融合所述第一尺度钻速特征向量和所述第二尺度钻速特征向量以得到所述钻速特征向量,其中,所述卷积神经网络模型是一维卷积神经网络模型。
在上述模切机控制系统中,所述切割产品序列提取模块,包括:嵌入编码单元,用于使用所述包含嵌入层的ViT模型的嵌入层分别对所述切割产品局部图像块的序列中各个图像块进行嵌入编码以得到图像块嵌入向量的序列;以及,转换单元,用于将所述图像块嵌入向量的序列输入所述包含嵌入层的Vi T模型的转换器模块以得到所述切割产品特征向量的序列。
在上述模切机控制系统中,所述嵌入编码单元,用于:将所述切割产品局部图像块的序列中的各个图像块分别展开为一维像素输入向量以得到多个一维像素输入向量;以及,使用所述包含嵌入层的ViT模型的嵌入层对所述多个一维像素输入向量中各个一维像素输入向量进行全连接编码以得到所述图像块嵌入向量的序列。
在上述模切机控制系统中,所述多尺度特征提取模块,包括:第一尺度提取单元,用于将所述切割产品全局特征图输入所述包含第一卷积层和第二卷积层的多尺度特征提取结构的第一卷积层以得到第一尺度卷积特征图,其中,所述第一卷积层具有第一长度的第一二维卷积核;第二尺度提取单元,用于将所述切割产品全局特征图输入所述包含第一卷积层和第二卷积层的多尺度特征提取结构的第二卷积层以得到第二尺度卷积特征图,其中,所述第二卷积层具有第二长度的第二二维卷积核,所述第一长度不同于所述第二长度;级联单元,用于将所述第一尺度卷积特征图和所述第二尺度卷积特征图进行级联以得到所述级联特征图;以及,池化单元,用于对所述级联特征图进行基于特征矩阵的池化处理以得到所述切割产品特征向量。
在上述模切机控制系统中,所述分类结果模块,包括:所述分类结果模块,包括:全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
根据本申请的另一方面,提供了一种模切机控制方法,其包括:
获取待切割产品图像和电机转速;
将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量;
将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列;
将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列;
将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图;
将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核;
构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量;
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
与现有技术相比,本申请提供的一种模切机控制系统及其方法,其采用基于深度神经网络模型的人工智能技术,获取待切割产品图像和电机转速,分别通过VIT模模型、多尺度特征提取结果和卷积神经网络模块提取出特征,以得到用于表示当前时间点的模切机电机转速应增大或减小的分类结果。这样,构建模切机控制方案,可以实现自动化调整模切机电机转速的目的,以优化切割效果和提高生产效率。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的模切机控制系统的框图。
图2为根据本申请实施例的模切机控制系统的架构示意图。
图3为根据本申请实施例的模切机控制系统中多尺度特征提取模块的框图。
图4为根据本申请实施例的模切机控制方法的流程图。
图5为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上所述,在模切机工作过程中,转速是一个重要的控制参数。不同的模切产品转速大小不同,转速过大会导致刀具无法完全切割,产生毛刺,道具受损;转速过小导致加工时间增加,影响生产效率。但由于现有的技术中很难精准地控制电机转速的大小,从而降低模切的效率。因此,期待一种优化的模切机控制方案。
针对上述技术问题,本申请的申请人通过获取待切割产品图像和电机转速,分别通过VIT模模型、多尺度特征提取结果和卷积神经网络模块提取出特征,以得到用于表示当前时间点的模切机电机转速应增大或减小的分类结果。
相应地,在本申请的技术方案中,考虑到获取待切割产品图像的目的是通过图像处理和分析技术,识别出产品的形状、尺寸和位置信息。这些信息可以用于确定切割路径和刀具的移动轨迹,从而实现精确的切割操作。图像处理还可以用于检测产品表面的缺陷或标记,以便进行质量控制或标记识别。具体地,获取电机转速的目的是根据切割要求和产品特性,调整电机的转速以实现最佳的切割效果。不同的产品材料和切割方式可能需要不同的转速,过高或过低的转速都可能导致切割质量下降或产生其他问题。通过获取电机转速并进行调整,可以优化切割质量、提高生产效率和延长设备寿命。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
具体地,在本申请的技术方案中,首先,获取待切割产品图像和电机转速。考虑到将电机转速排列为向量的好处是可以将时间序列的转速数据转化为计算机能够处理的数据结构。向量中的每个元素代表了不同时刻的电机转速值,通过对这些转速值进行排列,可以保留了时间序列的顺序关系。通过卷积神经网络模型对电机转速向量进行处理,可以提取出转速数据中的特征信息。卷积神经网络在处理序列数据时具有良好的特征提取能力,可以识别出转速的变化模式、周期性和趋势等特征。因此,将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量。
接着,考虑到对于大尺寸的待切割产品图像,直接对整个图像进行处理可能会导致计算量过大,处理速度变慢。通过将图像分割成多个块,可以将计算任务分散到每个块上进行,并行处理,提高计算效率。具体地,待切割产品图像可能包含不同的区域,如背景、物体边缘、细节等。通过图像分块处理,可以将不同区域的图像块分开,更精确地分析每个区域的特征,从而更好地理解和处理待切割产品图像。图像分块处理可以帮助我们提取局部特征。不同的图像块可能具有不同的颜色、形状等特征,通过对每个块进行分析,可以更准确地捕捉到局部特征信息。这有助于对待切割产品图像进行更细致的理解和判断。通过图像分块处理,可以根据不同的切割需求,灵活地调整每个图像块的大小。对于需要更精细切割的区域,可以选择较小的图像块进行处理,而对于不需要特别精细切割的区域,可以选择较大的图像块进行处理,以提高处理效率。因此,将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列,可以区分不同区域,提取局部特征,并适应不同尺寸的切割需求,从而更好地处理和分析待切割产品图像。
进一步地,考虑到ViT模型是一种基于Transformer的图像分类模型,能够将图像转换为对应的特征向量。通过将切割产品局部图像块输入ViT模型,可以提取出图像块的高级语义特征,这些特征可以更好地表示图像块的内容和结构。具体地,通过ViT模型得到的特征向量具有固定的维度,这使得不同大小的图像块都可以被转换为相同长度的特征向量序列。这种维度一致性方便了后续的处理和分析,例如可以将特征向量序列输入到其他模型或算法中进行进一步的分类、聚类或判别。还能够捕捉图像块之间的上下文信息。这意味着通过ViT模型得到的特征向量序列可以保留图像块之间的关联性和语义信息,有助于更准确地表示切割产品的整体特征。因此,将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列,从而实现对切割产品的特征提取、维度一致性和上下文信息的保留。
然后,考虑到图像分块处理将切割产品的局部图像块转换为特征向量序列,按照其在原始图像中的位置排列为特征图,可以保留切割产品的空间信息。这意味着特征图中的每个位置对应着原始图像中的特定位置,从而可以反映出切割产品在不同区域的特征差异和分布情况。具体地,将切割产品特征向量序列按照图像分块的位置排列为特征图,可以将局部特征整合为全局特征。通过观察切割产品全局特征图,可以更好地理解切割产品的整体特征、结构和形状。这有助于进一步的分析和决策,例如判断切割产品的质量、进行分类或进行后续的图像处理操作。因此,将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图,可以保留空间信息、整合全局特征,并方便后续处理和分析。
接着,考虑到通过多尺度特征结构提取切割产品的全局特征图,可以获得更丰富和多样化的特征信息。这是因为不同尺度的卷积核可以捕捉到不同大小和形状的特征。在切割产品中,可能存在各种不同大小的细节和结构,使用多尺度特征结构可以更好地捕捉到这些细节和结构的特征。第一卷积层和第二卷积层使用具有不同尺度的二维卷积核,可以在不同的感受野范围内提取特征。较小尺度的卷积核可以更好地捕捉到细小的特征,如纹理和边缘信息,而较大尺度的卷积核可以更好地捕捉到更大的结构特征,如形状和轮廓信息。通过结合不同尺度的特征提取,可以得到更全面和准确的切割产品特征向量。因此,将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核。
然后,融合所述切割产品特征向量和所述钻速特征向量以得到分类特征向量。考虑到切割产品特征向量包含了切割产品的形状、轮廓等特征信息,可以反映切割产品的外观和结构。而钻速特征向量则是描述电机的转速特征,可以反映切割过程中的运动状态和切割效率。通过融合切割产品特征向量和钻速特征向量,可以将静态和动态信息结合起来,得到更全面的分类特征向量。这样的特征向量不仅包含了切割产品的外观和结构特征,还包含了与切割过程相关的动态特征,使得分类模型能够更好地区分不同类别的切割产品。进一步地,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
特别地,所述切割产品特征向量和所述钻速特征向量来自不同的输入源,它们分别表示了不同的信息,通过融合两者的信息,可以极大提升分类特征向量的信息量,从而提升分类的准确性,但考虑到所述切割产品特征向量和所述钻速特征向量是分别由不同的输入源进行了不同的编码才得到的。两个特征向量的维度和分布可能不完全一致,简单的加权和操作可能无法充分利用二者的共同性和差异性。并且按位置加权是一种简单的方式,通过对两个特征向量的对应位置进行加权求和,得到分类特征向量。然而,这种方法可能会导致信息的丢失。因此,通过构造切割产品特征向量和钻速特征向量的关联特征域表示,可以将模型引入更高维度的关联空间。在这个空间中,可以学习到更复杂的关联关系,更好地表达和区分不同的类别。
具体地,构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量,包括:计算所述切割产品特征向量和所述钻速特征向量之间的夹角;基于所述夹角,将所述切割产品特征向量和所述钻速特征向量划分为多个第一子特征向量和多个第二子特征向量;分别计算各组对应的所述第一子特征向量和所述第二子特征向量之间的特征子集关联特征矩阵以得到多个特征子集关联特征矩阵;将所述多个特征子集关联特征矩阵沿着通道维度聚合为特征张量后通过基于卷积层的关联特征提取器以得到所述分类特征向量。
利用所述切割产品特征向量和所述钻速特征向量的特征集的全局信息和局部信息并利用卷积核的关联特征过滤来捕捉所述切割产品特征向量和钻速特征向量之间的跨模态域关联特征表达,其能够能够适应不同的数据分布和结构,自适应地调整关联特征域的维度和数量,增加数据表示的多样性和灵活性,从而提高数据分析和分类的准确性和鲁棒性。
基于此,本申请提供了一种模切机控制系统,其包括:数据获取模块,用于获取待切割产品图像和电机转速;钻速特征提取模块,用于将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量;图像分块模块,用于将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列;切割产品序列提取模块,用于将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列;切割产品全局提取模块,用于将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图;多尺度特征提取模块,用于将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核;关联特征模块,用于构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量;以及,分类结果模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1为根据本申请实施例的模切机控制系统的框图。如图1所示,根据本申请实施例的模切机控制系统100,包括:数据获取模块110,用于获取待切割产品图像和电机转速;钻速特征提取模块120,用于将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量;图像分块模块130,用于将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列;切割产品序列提取模块140,用于将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列;切割产品全局提取模块150,用于将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图;多尺度特征提取模块160,用于将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核;关联特征模块170,用于构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量;以及,分类结果模块180,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
图2为根据本申请实施例的模切机控制系统的架构示意图。如图2所示,首先,获取待切割产品图像和电机转速。接着,将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量。同时,将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列。然后,将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列。接着,将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图。然后,将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核。接着,构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量。最后,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
在本申请实施例中,所述数据获取模块110,用于获取待切割产品图像和电机转速。考虑到获取待切割产品图像的目的是通过图像处理和分析技术,识别出产品的形状、尺寸和位置信息。这些信息可以用于确定切割路径和刀具的移动轨迹,从而实现精确的切割操作。图像处理还可以用于检测产品表面的缺陷或标记,以便进行质量控制或标记识别。具体地,获取电机转速的目的是根据切割要求和产品特性,调整电机的转速以实现最佳的切割效果。不同的产品材料和切割方式可能需要不同的转速,过高或过低的转速都可能导致切割质量下降或产生其他问题。通过获取电机转速并进行调整,可以优化切割质量、提高生产效率和延长设备寿命。
在本申请实施例中,所述钻速特征提取模块120,用于将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量。考虑到将电机转速排列为向量的好处是可以将时间序列的转速数据转化为计算机能够处理的数据结构。向量中的每个元素代表了不同时刻的电机转速值,通过对这些转速值进行排列,可以保留了时间序列的顺序关系。通过卷积神经网络模型对电机转速向量进行处理,可以提取出转速数据中的特征信息。卷积神经网络在处理序列数据时具有良好的特征提取能力,可以识别出转速的变化模式、周期性和趋势等特征。因此,将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量。
具体地,在本申请实施例中,所述钻速特征提取模块,包括:第一尺度钻速特征提取单元,用于使用所述卷积神经网络模型的第一卷积分支的各层在层的正向传递中分别对输入数据进行基于第一卷积核的一维卷积处理、池化处理和激活处理以由所述第一卷积分支的最后一层输出第一尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;第二尺度钻速特征提取单元,用于使用所述卷积神经网络模型的第二卷积分支的各层在层的正向传递中分别对输入数据进行基于第二卷积核的一维卷积处理、池化处理和激活处理以由所述第二卷积分支的最后一层输出第二尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;以及,钻速特征融合单元,用于融合所述第一尺度钻速特征向量和所述第二尺度钻速特征向量以得到所述钻速特征向量,其中,所述卷积神经网络模型是一维卷积神经网络模型。
在本申请实施例中,所述图像分块模块130,用于将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列。考虑到对于大尺寸的待切割产品图像,直接对整个图像进行处理可能会导致计算量过大,处理速度变慢。通过将图像分割成多个块,可以将计算任务分散到每个块上进行,并行处理,提高计算效率。具体地,待切割产品图像可能包含不同的区域,如背景、物体边缘、细节等。通过图像分块处理,可以将不同区域的图像块分开,更精确地分析每个区域的特征,从而更好地理解和处理待切割产品图像。图像分块处理可以帮助我们提取局部特征。不同的图像块可能具有不同的颜色、形状等特征,通过对每个块进行分析,可以更准确地捕捉到局部特征信息。这有助于对待切割产品图像进行更细致的理解和判断。通过图像分块处理,可以根据不同的切割需求,灵活地调整每个图像块的大小。对于需要更精细切割的区域,可以选择较小的图像块进行处理,而对于不需要特别精细切割的区域,可以选择较大的图像块进行处理,以提高处理效率。因此,将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列,可以区分不同区域,提取局部特征,并适应不同尺寸的切割需求,从而更好地处理和分析待切割产品图像。
在本申请实施例中,所述切割产品序列提取模块140,用于将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列。考虑到ViT模型是一种基于Transformer的图像分类模型,能够将图像转换为对应的特征向量。通过将切割产品局部图像块输入ViT模型,可以提取出图像块的高级语义特征,这些特征可以更好地表示图像块的内容和结构。具体地,通过ViT模型得到的特征向量具有固定的维度,这使得不同大小的图像块都可以被转换为相同长度的特征向量序列。这种维度一致性方便了后续的处理和分析,例如可以将特征向量序列输入到其他模型或算法中进行进一步的分类、聚类或判别。还能够捕捉图像块之间的上下文信息。这意味着通过ViT模型得到的特征向量序列可以保留图像块之间的关联性和语义信息,有助于更准确地表示切割产品的整体特征。因此,将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列,从而实现对切割产品的特征提取、维度一致性和上下文信息的保留。
具体地,在本申请实施例中,所述切割产品序列提取模块,包括:嵌入编码单元,用于使用所述包含嵌入层的ViT模型的嵌入层分别对所述切割产品局部图像块的序列中各个图像块进行嵌入编码以得到图像块嵌入向量的序列;以及,转换单元,用于将所述图像块嵌入向量的序列输入所述包含嵌入层的ViT模型的转换器模块以得到所述切割产品特征向量的序列。
更具体地,在本申请实施例中,所述嵌入编码单元,用于:将所述切割产品局部图像块的序列中的各个图像块分别展开为一维像素输入向量以得到多个一维像素输入向量;以及,使用所述包含嵌入层的ViT模型的嵌入层对所述多个一维像素输入向量中各个一维像素输入向量进行全连接编码以得到所述图像块嵌入向量的序列。
在本申请实施例中,所述切割产品全局提取模块150,用于将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图。考虑到图像分块处理将切割产品的局部图像块转换为特征向量序列,按照其在原始图像中的位置排列为特征图,可以保留切割产品的空间信息。这意味着特征图中的每个位置对应着原始图像中的特定位置,从而可以反映出切割产品在不同区域的特征差异和分布情况。具体地,将切割产品特征向量序列按照图像分块的位置排列为特征图,可以将局部特征整合为全局特征。通过观察切割产品全局特征图,可以更好地理解切割产品的整体特征、结构和形状。这有助于进一步的分析和决策,例如判断切割产品的质量、进行分类或进行后续的图像处理操作。因此,将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图,可以保留空间信息、整合全局特征,并方便后续处理和分析。
在本申请实施例中,所述多尺度特征提取模块160,用于将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核。考虑到通过多尺度特征结构提取切割产品的全局特征图,可以获得更丰富和多样化的特征信息。这是因为不同尺度的卷积核可以捕捉到不同大小和形状的特征。在切割产品中,可能存在各种不同大小的细节和结构,使用多尺度特征结构可以更好地捕捉到这些细节和结构的特征。第一卷积层和第二卷积层使用具有不同尺度的二维卷积核,可以在不同的感受野范围内提取特征。较小尺度的卷积核可以更好地捕捉到细小的特征,如纹理和边缘信息,而较大尺度的卷积核可以更好地捕捉到更大的结构特征,如形状和轮廓信息。通过结合不同尺度的特征提取,可以得到更全面和准确的切割产品特征向量。
图3为根据本申请实施例的模切机控制系统中多尺度特征提取模块的框图。具体地,在本申请实施例中,如图3所示,所述多尺度特征提取模块160,包括:第一尺度提取单元161,用于将所述切割产品全局特征图输入所述包含第一卷积层和第二卷积层的多尺度特征提取结构的第一卷积层以得到第一尺度卷积特征图,其中,所述第一卷积层具有第一长度的第一二维卷积核;第二尺度提取单元162,用于将所述切割产品全局特征图输入所述包含第一卷积层和第二卷积层的多尺度特征提取结构的第二卷积层以得到第二尺度卷积特征图,其中,所述第二卷积层具有第二长度的第二二维卷积核,所述第一长度不同于所述第二长度;级联单元163,用于将所述第一尺度卷积特征图和所述第二尺度卷积特征图进行级联以得到所述级联特征图;以及,池化单元164,用于对所述级联特征图进行基于特征矩阵的池化处理以得到所述切割产品特征向量。
在本申请实施例中,所述关联特征模块170,用于构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量。
特别地,所述切割产品特征向量和所述钻速特征向量来自不同的输入源,它们分别表示了不同的信息,通过融合两者的信息,可以极大提升分类特征向量的信息量,从而提升分类的准确性,但考虑到所述切割产品特征向量和所述钻速特征向量是分别由不同的输入源进行了不同的编码才得到的。两个特征向量的维度和分布可能不完全一致,简单的加权和操作可能无法充分利用二者的共同性和差异性。并且按位置加权是一种简单的方式,通过对两个特征向量的对应位置进行加权求和,得到分类特征向量。然而,这种方法可能会导致信息的丢失。因此,通过构造切割产品特征向量和钻速特征向量的关联特征域表示,可以将模型引入更高维度的关联空间。在这个空间中,可以学习到更复杂的关联关系,更好地表达和区分不同的类别。
具体地,在本申请实施例中,所述关联特征模块,包括:夹角计算单元,用于计算所述切割产品特征向量和所述钻速特征向量之间的夹角;向量划分单元,用于基于所述夹角,将所述切割产品特征向量和所述钻速特征向量划分为多个第一子特征向量和多个第二子特征向量;特征子集关联单元,用于分别计算各组对应的所述第一子特征向量和所述第二子特征向量之间的特征子集关联特征矩阵以得到多个特征子集关联特征矩阵;以及,通道聚合单元,用于将所述多个特征子集关联特征矩阵沿着通道维度聚合为特征张量后通过基于卷积层的关联特征提取器以得到所述分类特征向量。
利用所述切割产品特征向量和所述钻速特征向量的特征集的全局信息和局部信息并利用卷积核的关联特征过滤来捕捉所述切割产品特征向量和钻速特征向量之间的跨模态域关联特征表达,其能够能够适应不同的数据分布和结构,自适应地调整关联特征域的维度和数量,增加数据表示的多样性和灵活性,从而提高数据分析和分类的准确性和鲁棒性。
在本申请实施例中,所述分类结果模块180,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
具体地,在本申请实施例中,所述分类结果模块,包括:全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
综上,基于本申请实施例的模切机控制系统100被阐明,其采用基于深度神经网络模型的人工智能技术,获取待切割产品图像和电机转速,分别通过VIT模模型、多尺度特征提取结果和卷积神经网络模块提取出特征,以得到用于表示当前时间点的模切机电机转速应增大或减小的分类结果。这样,构建模切机控制方案,可以实现自动化调整模切机电机转速的目的,以优化切割效果和提高生产效率。
示例性方法
图4为根据本申请实施例的模切机控制方法的流程图。如图4所示,根据本申请实施例的模切机控制方法,包括:S110,获取待切割产品图像和电机转速;S120,将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量;S130,将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列;S140,将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列;S150,将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图;S160,将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核;S170,构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量;以及,S180,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
这里,本领域技术人员可以理解,上述模切机控制方法中的各个步骤的具体操作已经在上面参考图1到图3的模切机控制系统的描述中得到了详细介绍,并因此,将省略其重复描述。
示例性电子设备
下面,参考图5来描述根据本申请实施例的电子设备。图5为根据本申请实施例的电子设备的框图。如图5所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理模块(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理模块,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的模切机控制系统及其方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如待切割产品图像和电机转速等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的模切机控制方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的模切机控制方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种模切机控制系统,其特征在于,包括:
数据获取模块,用于获取待切割产品图像和电机转速;
钻速特征提取模块,用于将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量;
图像分块模块,用于将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列;
切割产品序列提取模块,用于将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列;
切割产品全局提取模块,用于将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图;
多尺度特征提取模块,用于将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核;
关联特征模块,用于构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量;
分类结果模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
2.根据权利要求1所述的模切机控制系统,其特征在于,所述钻速特征提取模块,包括:
第一尺度钻速特征提取单元,用于使用所述卷积神经网络模型的第一卷积分支的各层在层的正向传递中分别对输入数据进行基于第一卷积核的一维卷积处理、池化处理和激活处理以由所述第一卷积分支的最后一层输出第一尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;
第二尺度钻速特征提取单元,用于使用所述卷积神经网络模型的第二卷积分支的各层在层的正向传递中分别对输入数据进行基于第二卷积核的一维卷积处理、池化处理和激活处理以由所述第二卷积分支的最后一层输出第二尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;
钻速特征融合单元,用于融合所述第一尺度钻速特征向量和所述第二尺度钻速特征向量以得到所述钻速特征向量,其中,所述卷积神经网络模型是一维卷积神经网络模型。
3.根据权利要求2所述的模切机控制系统,其特征在于,所述切割产品序列提取模块,包括:
嵌入编码单元,用于使用所述包含嵌入层的ViT模型的嵌入层分别对所述切割产品局部图像块的序列中各个图像块进行嵌入编码以得到图像块嵌入向量的序列;
转换单元,用于将所述图像块嵌入向量的序列输入所述包含嵌入层的ViT模型的转换器模块以得到所述切割产品特征向量的序列。
4.根据权利要求3所述的模切机控制系统,其特征在于,所述嵌入编码单元,用于:
将所述切割产品局部图像块的序列中的各个图像块分别展开为一维像素输入向量以得到多个一维像素输入向量;
使用所述包含嵌入层的ViT模型的嵌入层对所述多个一维像素输入向量中各个一维像素输入向量进行全连接编码以得到所述图像块嵌入向量的序列。
5.根据权利要求4所述的模切机控制系统,其特征在于,所述多尺度特征提取模块,包括:
第一尺度提取单元,用于将所述切割产品全局特征图输入所述包含第一卷积层和第二卷积层的多尺度特征提取结构的第一卷积层以得到第一尺度卷积特征图,其中,所述第一卷积层具有第一长度的第一二维卷积核;
第二尺度提取单元,用于将所述切割产品全局特征图输入所述包含第一卷积层和第二卷积层的多尺度特征提取结构的第二卷积层以得到第二尺度卷积特征图,其中,所述第二卷积层具有第二长度的第二二维卷积核,所述第一长度不同于所述第二长度;
级联单元,用于将所述第一尺度卷积特征图和所述第二尺度卷积特征图进行级联以得到所述级联特征图;
池化单元,用于对所述级联特征图进行基于特征矩阵的池化处理以得到所述切割产品特征向量。
6.根据权利要求5所述的模切机控制系统,其特征在于,所述关联特征模块,包括:
夹角计算单元,用于计算所述切割产品特征向量和所述钻速特征向量之间的夹角;
向量划分单元,用于基于所述夹角,将所述切割产品特征向量和所述钻速特征向量划分为多个第一子特征向量和多个第二子特征向量;
特征子集关联单元,用于分别计算各组对应的所述第一子特征向量和所述第二子特征向量之间的特征子集关联特征矩阵以得到多个特征子集关联特征矩阵;
通道聚合单元,用于将所述多个特征子集关联特征矩阵沿着通道维度聚合为特征张量后通过基于卷积层的关联特征提取器以得到所述分类特征向量。
7.根据权利要求6所述的模切机控制系统,其特征在于,所述分类结果模块,包括:
全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;
分类结果单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
8.一种模切机控制方法,其特征在于,包括:
获取待切割产品图像和电机转速;
将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量;
将所述待切割产品图像进行图像分块处理以得到切割产品局部图像块的序列;
将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列;
将所述切割产品特征向量的序列按照所述图像分块处理的位置排列为切割产品全局特征图;
将所述切割产品全局特征图通过包含第一卷积层和第二卷积层的多尺度特征提取结构以得到切割产品特征向量,其中,所述第一卷积层和所述第二卷积层分别使用具有不同尺度的二维卷积核;
构造所述切割产品特征向量和所述钻速特征向量的关联特征域表示以得到分类特征向量;
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前时间点的模切机电机转速应增大或减小。
9.根据权利要求8所述的模切机控制方法,其特征在于,将所述电机转速排列为钻速输入向量后通过卷积神经网络模型以得到钻速特征向量,包括:
使用所述卷积神经网络模型的第一卷积分支的各层在层的正向传递中分别对输入数据进行基于第一卷积核的一维卷积处理、池化处理和激活处理以由所述第一卷积分支的最后一层输出第一尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;
使用所述卷积神经网络模型的第二卷积分支的各层在层的正向传递中分别对输入数据进行基于第二卷积核的一维卷积处理、池化处理和激活处理以由所述第二卷积分支的最后一层输出第二尺度钻速特征向量,其中,所述卷积神经网络模型的第一层的输入为所述钻速输入向量;
融合所述第一尺度钻速特征向量和所述第二尺度钻速特征向量以得到所述钻速特征向量,其中,所述卷积神经网络模型是一维卷积神经网络模型。
10.根据权利要求9所述的模切机控制方法,其特征在于,将所述切割产品局部图像块的序列通过包含嵌入层的ViT模型以得到切割产品特征向量的序列,包括:
使用所述包含嵌入层的ViT模型的嵌入层分别对所述切割产品局部图像块的序列中各个图像块进行嵌入编码以得到图像块嵌入向量的序列;以及
将所述图像块嵌入向量的序列输入所述包含嵌入层的ViT模型的转换器模块以得到所述切割产品特征向量的序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310971093.1A CN116945258A (zh) | 2023-09-14 | 2023-09-14 | 模切机控制系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310971093.1A CN116945258A (zh) | 2023-09-14 | 2023-09-14 | 模切机控制系统及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116945258A true CN116945258A (zh) | 2023-10-27 |
Family
ID=88449154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310971093.1A Withdrawn CN116945258A (zh) | 2023-09-14 | 2023-09-14 | 模切机控制系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116945258A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117252926A (zh) * | 2023-11-20 | 2023-12-19 | 南昌工控机器人有限公司 | 基于视觉定位的手机壳辅料智能装配控制系统 |
-
2023
- 2023-09-14 CN CN202310971093.1A patent/CN116945258A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117252926A (zh) * | 2023-11-20 | 2023-12-19 | 南昌工控机器人有限公司 | 基于视觉定位的手机壳辅料智能装配控制系统 |
CN117252926B (zh) * | 2023-11-20 | 2024-02-02 | 南昌工控机器人有限公司 | 基于视觉定位的手机壳辅料智能装配控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105518668B (zh) | 基于内容的图像检索 | |
Hoang Ngan Le et al. | Robust hand detection and classification in vehicles and in the wild | |
Schwartz et al. | Visual material traits: Recognizing per-pixel material context | |
Marchant et al. | Automated analysis of foraminifera fossil records by image classification using a convolutional neural network | |
CN109685065B (zh) | 试卷内容自动分类的版面分析方法、系统 | |
Kumar et al. | Content based fine-grained image retrieval using convolutional neural network | |
Zhang et al. | Automatic discrimination of text and non-text natural images | |
CN116945258A (zh) | 模切机控制系统及其方法 | |
CN113673607A (zh) | 图像标注模型的训练及图像标注的方法及装置 | |
CN114882599A (zh) | 基于双分支神经网络的离线手写签名分割系统和方法 | |
CN111881906A (zh) | 一种基于注意力机制图像检索的logo识别方法 | |
CN114358279A (zh) | 图像识别网络模型剪枝方法、装置、设备及存储介质 | |
CN106980878B (zh) | 三维模型几何风格的确定方法及装置 | |
CN117011274A (zh) | 自动化玻璃瓶检测系统及其方法 | |
CN116994049A (zh) | 全自动针织横机及其方法 | |
CN113408651B (zh) | 基于局部判别性增强的无监督三维物体分类方法 | |
Jose et al. | Genus and species-level classification of wrasse fishes using multidomain features and extreme learning machine classifier | |
Tong et al. | Robust facial expression recognition based on local tri-directional coding pattern | |
Shishkin et al. | Implementation of yolov5 for detection and classification of microplastics and microorganisms in marine environment | |
Das et al. | Object Detection on Scene Images: A Novel Approach | |
Martin Sagayam et al. | Application of pseudo 2-D hidden Markov model for hand gesture recognition | |
Bhanbhro et al. | Symbol Detection in a Multi-class Dataset Based on Single Line Diagrams using Deep Learning Models | |
MAHURKAR et al. | Novel Outline Tracing Techniques for Leaf Species Identification from Shrouded Leaves | |
CN112949634B (zh) | 一种铁路接触网鸟窝检测方法 | |
Malik et al. | Research Article A Performance Comparison of Classification Algorithms for Rose Plants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20231027 |
|
WW01 | Invention patent application withdrawn after publication |