CN116486404A - 基于卷积神经网络的针状焦显微图检测的方法和装置 - Google Patents
基于卷积神经网络的针状焦显微图检测的方法和装置 Download PDFInfo
- Publication number
- CN116486404A CN116486404A CN202310748555.3A CN202310748555A CN116486404A CN 116486404 A CN116486404 A CN 116486404A CN 202310748555 A CN202310748555 A CN 202310748555A CN 116486404 A CN116486404 A CN 116486404A
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- convolutional neural
- needle coke
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011331 needle coke Substances 0.000 title claims abstract description 75
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 68
- 238000001514 detection method Methods 0.000 title claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000007781 pre-processing Methods 0.000 claims abstract description 20
- 239000000835 fiber Substances 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims 1
- 239000000463 material Substances 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 239000013078 crystal Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 229910002804 graphite Inorganic materials 0.000 description 4
- 239000010439 graphite Substances 0.000 description 4
- 239000012535 impurity Substances 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000005087 graphitization Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000003723 Smelting Methods 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 229910003481 amorphous carbon Inorganic materials 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 239000006229 carbon black Substances 0.000 description 1
- 239000011335 coal coke Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000002006 petroleum coke Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种基于卷积神经网络的针状焦显微图检测的方法和装置,所述方法包括:获取待识别图像,并对所述待识别图像进行预处理,将预处理后的待识别图像划分为多个截图,将所有截图输入预先训练的分类预测模型,即可得到每张截图的分类结果;其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。由于针状焦的显微结构对其性能有重要影响,本发明通过卷积神经网络可有效解决针状焦的显微结构分类问题,本发明能够通过预先训练的分类预测模型准确识别针状焦孔洞,从而提升针状焦材料性能,降低了针状焦孔洞对针状焦的性能造成的负面影响。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于卷积神经网络的针状焦显微图检测的方法和装置。
背景技术
针状焦(Needle Coke)是一种高质量的石油焦或煤焦,具有独特的针状结构。针状焦主要用于制造石墨电极,这些电极在钢铁冶炼和铝生产等领域具有广泛的应用。由于针状焦可以提高电极的热稳定性和导电性能,针状焦的晶体结构在制造石墨电极时具有重要意义,针状焦的显微结构对其性能有重要影响,因此对其显微结构进行分类具有实际意义。然而,在针状焦的生产过程中,可能会出现孔洞。这些孔洞可能是由原材料中的杂质、生产过程中的气体生成或其他因素导致的。针状焦孔洞的存在可能对其性能产生负面影响,例如降低石墨电极的强度、耐磨性和导电性能。
因此,提供一种基于卷积神经网络的针状焦显微图检测的方法和装置,以期能够对针状焦孔洞进行识别定位,以降低针状焦孔洞对针状焦的性能造成的负面影响,就成为本领域技术人员亟待解决的问题。
发明内容
为此,本发明实施例提供一种基于卷积神经网络的针状焦显微图检测的方法和装置,以期能够对针状焦孔洞进行识别定位,以降低针状焦孔洞对针状焦的性能造成的负面影响。
为了实现上述目的,本发明实施例提供如下技术方案:
本发明提供了一种基于卷积神经网络的针状焦显微图检测的方法,所述方法包括:
获取待识别图像,并对所述待识别图像进行预处理;
将预处理后的待识别图像划分为多个截图;
将所有截图输入预先训练的分类预测模型,以得到每张截图的分类结果;
其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。
在一些实施例中,得到每张截图的分类结果,之后还包括:
计算每种分类结果的生成概率,并将所述分类结果以概率的形式输出。
在一些实施例中,计算每种分类结果的生成概率,之后还包括:
分别统计每张截图中目标结构的个数;
其中,所述目标结构包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者。
在一些实施例中,得到每张截图的分类结果,之后还包括:
在所述分类结果为存在孔洞的情况下,确定所述分类结果对应的截图在所述待识别图像中的坐标位置,以实现孔洞定位。
在一些实施例中,基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练,得到所述分类预测模型,具体包括:
获取显微图片样本,根据预先设定的标签类别,在每张所述显微图片样本上打标签,所述标签类别包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者;
对带有标签的所述显微图片样本进行数据预处理,利用预处理后的所述显微图片样本构成数据集;
将所述数据集划分为训练集和验证集;
根据预先设定的训练参数,将所述训练集输入预先搭建的卷积神经网络进行训练,以得到所述分类预测模型。
在一些实施例中,根据预先设定的训练参数,将所述训练集输入预先搭建的卷积神经网络进行训练,以得到所述分类预测模型,之后还包括:
利用所述验证集对所述分类预测模型进行预设指标的评估;
其中,所述预设指标包括准确率、召回率和精确率中的至少一者。
在一些实施例中,预先搭建的卷积神经网络的网络结构包括:
卷积层,所述卷积层用于提取图像的局部特征,以得到特征图;
池化层,所述池化层用于降低所述特征图的空间维度;
全连接层,所述全连接层用于将多维特征向量转换为一维,将卷积层和输出层连接起来;
输出层,所述输出层用于输出分类预测结果。
本发明还提供了一种基于卷积神经网络的针状焦显微图检测的装置,所述装置包括:
图像采集单元,用于获取待识别图像,并对所述待识别图像进行预处理;
图像处理单元,用于将预处理后的待识别图像划分为多个截图;
结果生成单元,用于将所有截图输入预先训练的分类预测模型,以得到每张截图的分类结果;
其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。
本发明还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述方法的步骤。
本发明还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
本发明所提供的基于卷积神经网络的针状焦显微图检测的方法,通过获取待识别图像,并对所述待识别图像进行预处理,将预处理后的待识别图像划分为多个截图,将所有截图输入预先训练的分类预测模型,即可得到每张截图的分类结果;其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。由于针状焦的显微结构对其性能有重要影响,本发明通过卷积神经网络可有效解决针状焦的显微结构分类问题,对针状焦广泛应用具有实际意义,针状焦孔洞的存在可能对其性能产生负面影响,本发明能够通过预先训练的分类预测模型准确识别针状焦孔洞,从而提升针状焦材料性能,降低了针状焦孔洞对针状焦的性能造成的负面影响。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
图1为本发明所提供的基于卷积神经网络的针状焦显微图检测的方法的流程图之一;
图2为本发明所提供的针状焦显微图检测的方法的产品图像示意图之一;
图3为本发明所提供的基于卷积神经网络的针状焦显微图检测的方法的流程图之二;
图4为本发明所提供的基于卷积神经网络的针状焦显微图检测的方法的流程图之三;
图5为本发明所提供的针状焦显微图检测的方法的产品图像示意图之二;
图6为本发明所提供的针状焦显微图检测的方法的产品图像示意图之三;
图7为本发明所提供的针状焦显微图检测的方法的产品图像示意图之四;
图8为本发明所提供的基于卷积神经网络的针状焦显微图检测的方法的流程图之四;
图9为本发明所提供的基于卷积神经网络的针状焦显微图检测的方法的流程图之五;
图10为本发明所提供的基于卷积神经网络的针状焦显微图检测的装置的结构框图;
图11为本发明所提供的一种计算机设备的结构框图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的基于卷积神经网络的针状焦显微图检测的方法的流程图之一。
在一种具体实施方式中,本发明提供的基于卷积神经网络的针状焦显微图检测的方法包括以下步骤:
S110:获取待识别图像,并对所述待识别图像进行预处理;将待预测图片输入后,可进行灰度化、二值化预处理。
S120:将预处理后的待识别图像划分为多个截图;如图2所示,将待预测图片按一定比例列出网格、取点,并按照该交点向外拓展n个像素位,形成一张张以交点为对称中心的n×n的正方形截图,在输入图片进入模型之前给出网格的行列间距及交点拓展像素位,形成多个截图。
S130:将所有截图输入预先训练的分类预测模型,以得到每张截图的分类结果;其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。
模型提取时,将上述训练好的CNN模型进行提取,形成图像分类模型组件,搭建图像分类推理工作流,包括读取图片组件、图片预处理组件、图像分类模型等组件,对新输入图像进行分类预测。
在一些使用场景中,可以以表格或者文件的形式输出所有的分类结果,为了降低输出数据量,为得到分类结果后的操作提供便利性,可以通过概率的形式体现和输出分类结果。如图3所示,在以概率输出时,得到每张截图的分类结果,之后还包括:
S310:计算每种分类结果的生成概率,并将所述分类结果以概率的形式输出;
S320:分别统计每张截图中目标结构的个数;
其中,所述目标结构包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者。
在步骤S130中,得到每张截图的分类结果,之后还包括:
在所述分类结果为存在孔洞的情况下,确定所述分类结果对应的截图在所述待识别图像中的坐标位置,以实现孔洞定位。也就是说,当判断出待识别图像中存在孔洞时,则进一步定位孔洞的位置。
在一些实施例中,如图4所示,基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练,得到所述分类预测模型,具体包括以下步骤:
S410:获取显微图片样本,根据预先设定的标签类别,在每张所述显微图片样本上打标签,所述标签类别包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者。如图5所示,收集针状焦镶嵌、小片、大片、短纤维、细纤维、粗纤维、孔洞等七类图片,并打好标签,数据量不足部分可在图片预处理进行数据增强处理。
针状焦的显微结构图通常可以分为以下几类:
1.完整的针状结构:这种结构中,针状晶体排列紧密,形状规则,间距均匀。这种结构通常表明针状焦具有良好的石墨化性能和较高的热稳定性。
2.不完整的针状结构:这种结构中,针状晶体较短且不规则,可能存在断裂或变形。这种结构表明针状焦的石墨化性能可能较差。
3.杂质和夹杂物:这些结构中,针状晶体周围可能存在杂质和夹杂物,如非晶态炭黑、灰分等。这些杂质和夹杂物可能对针状焦的性能产生负面影响。
4.层状结构:这种结构中,针状晶体呈现明显的层状排列。这种结构可能表明针状焦在热处理过程中经历了不同程度的石墨化。
根据特征尺寸,针状焦典型显微结构图更加细致的分为镶嵌、小片、大片、短纤维、细纤维、粗纤维六类,如表1所示:
表1
。
在这六类中之外还存在一种结构,那就是针状焦孔洞。针状焦孔洞是指在针状焦结构中存在的微小空隙或空穴,因此,本发明所提供的标签包括镶嵌、小片、大片、短纤维、细纤维、粗纤维和孔洞7种标签。
S420:对带有标签的所述显微图片样本进行数据预处理,利用预处理后的所述显微图片样本构成数据集。
具体地,在进行数据预处理时,包括以下预处理维度:
1.调整图像大小:将输入图像调整为网络所需的尺寸。
2.归一化:将像素值缩放到一个较小的范围。
3.数据增强:通过对图像进行旋转、翻转、剪切等操作,增加训练样本的多样性,提高模型的泛化能力。
4.图像灰度化,如图6所示,图像灰度处理是将彩色图像转换为灰度图像的过程,有助于降低图像处理任务的复杂性,因为它减少了计算量和内存需求。在计算机视觉和图像处理中,灰度处理通常是预处理的第一步,可以为后续的图像操作(如边缘检测、轮廓提取、特征提取等)提供一个简化的图像表示。
5.图像二值化,如图7所示,图像二值化是一种将灰度图像转换为二值图像的过程,可以根据颜色和灰度值的差异,使用二值化的方法将物体边界从背景中分离出来,从而达到分离的效果。
S430:将所述数据集划分为训练集和验证集;
S440:根据预先设定的训练参数,将所述训练集输入预先搭建的卷积神经网络进行训练,以得到所述分类预测模型。
在训练卷积神经网络时,通过读取图片组件读取针状焦图片数据集,做预处理后可以进行数据集划分,再调节以下搭建的神经网络参数就可以运行训练工作流了。定义损失函数用于衡量网络预测与实际标签之间的差异,如交叉熵损失(Cross-Entropy Loss)。选择优化器adam用于更新网络权重。设定训练参数学习率设为0.01,根据硬件限制设置batch_size为64。进行训练,将预处理后的数据输入到CNN中,计算损失,根据梯度更新权重。
S450:利用所述验证集对所述分类预测模型进行预设指标的评估;其中,所述预设指标包括准确率、召回率和精确率中的至少一者。
在进行验证时,使用训练过程中未见过的数据集(验证集)评估模型性能,调整超参数以提高模型泛化能力。利用使用准确率(Accuracy)、召回率(Recall)、精确率(Precision)等指标评估模型在测试集上的性能。
在步骤S440中,预先搭建的卷积神经网络的网络结构包括:
卷积层,所述卷积层用于提取图像的局部特征,以得到特征图;卷积层中的神经元与输入图像的一个局部区域相连,并共享权重。激活函数:引入非线性,如ReLU(RectifiedLinear Unit)、Leaky ReLU等。
池化层,所述池化层用于降低所述特征图的空间维度,以减少计算量;
全连接层,所述全连接层用于将多维特征向量转换为一维,将卷积层和输出层连接起来;
输出层,所述输出层用于输出分类预测结果,例如可以使用Softmax函数,将网络输出转换为概率分布,表示图像属于每个类别的概率。
从原理上来讲,卷积神经网络(Convolutional Neural Networks,CNNs)能够实现图像分类的原因主要归功于它们的特殊架构和学习能力。CNNs专门针对图像处理任务进行了设计和优化,具有以下优势:
1.在卷积层中,神经元仅与输入图像的局部区域连接。这有助于捕捉图像中的局部信息,如边缘、纹理等。
2.CNN中的卷积核在整个输入图像上滑动,共享权重。这大大减少了模型的参数数量,降低了计算复杂性和过拟合的风险。
3.CNN通常包含多个卷积和池化层,形成一个深层次的网络结构,有助于区分不同类别的对象。
4.CNN中的激活函数(如ReLU、Leaky ReLU等)为网络引入了非线性,使得CNN能够学习和表示复杂的图像特征。
5.CNN是一个端到端的学习系统,可以直接从原始像素值学习到高级特征表示,这消除了手动设计特征提取算法的需求,简化了图像分类流程。在图像预处理中,本发明采用的是OpenCV(开源计算机视觉库),OpenCV提供了丰富的图像处理功能,如图像灰度化、滤波、阈值处理等,这些功能都可以用于预处理图像。
在上述具体实施方式中,如图8所示,可以将分类预测模型的整体工作以组件的形式搭建深度学习建模工作流,首先,本发明是搭建深度学习CNN分类训练工作流,包含了读取图片文件、划分数据集测试集、卷积层、激活层、Max池化层、Flatten层、Dense层、模型训练、模型评估等组件,可以快速实现图像识别模型的建立,为后续图像分类识别做准备。其次,如图9所示,本发明可通过上述训练完成的分类预测模型进行推理预测,包含了读取图片文件、图片预处理、图像分类模型等组件,可以有效解决针状焦的显微结构分类问题以及识别针状焦孔洞、定位任务。
在上述具体实施方式中,本发明所提供的基于卷积神经网络的针状焦显微图检测的方法,通过获取待识别图像,并对所述待识别图像进行预处理,将预处理后的待识别图像划分为多个截图,将所有截图输入预先训练的分类预测模型,即可得到每张截图的分类结果;其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。由于针状焦的显微结构对其性能有重要影响,本发明通过卷积神经网络可有效解决针状焦的显微结构分类问题,对针状焦广泛应用具有实际意义,针状焦孔洞的存在可能对其性能产生负面影响,本发明能够通过预先训练的分类预测模型准确识别针状焦孔洞,从而提升针状焦材料性能,降低了针状焦孔洞对针状焦的性能造成的负面影响。
除了上述方法,本发明还提供了一种基于卷积神经网络的针状焦显微图检测的装置,如图10所示,所述装置包括:
图像采集单元1010,用于获取待识别图像,并对所述待识别图像进行预处理;
图像处理单元1020,用于将预处理后的待识别图像划分为多个截图;
结果生成单元1030,用于将所有截图输入预先训练的分类预测模型,以得到每张截图的分类结果;
其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。
在一些实施例中,得到每张截图的分类结果,之后还包括:
计算每种分类结果的生成概率,并将所述分类结果以概率的形式输出。
在一些实施例中,计算每种分类结果的生成概率,之后还包括:
分别统计每张截图中目标结构的个数;
其中,所述目标结构包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者。
在一些实施例中,得到每张截图的分类结果,之后还包括:
在所述分类结果为存在孔洞的情况下,确定所述分类结果对应的截图在所述待识别图像中的坐标位置,以实现孔洞定位。
在一些实施例中,基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练,得到所述分类预测模型,具体包括:
获取显微图片样本,根据预先设定的标签类别,在每张所述显微图片样本上打标签,所述标签类别包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者;
对带有标签的所述显微图片样本进行数据预处理,利用预处理后的所述显微图片样本构成数据集;
将所述数据集划分为训练集和验证集;
根据预先设定的训练参数,将所述训练集输入预先搭建的卷积神经网络进行训练,以得到所述分类预测模型。
在一些实施例中,根据预先设定的训练参数,将所述训练集输入预先搭建的卷积神经网络进行训练,以得到所述分类预测模型,之后还包括:
利用所述验证集对所述分类预测模型进行预设指标的评估;
其中,所述预设指标包括准确率、召回率和精确率中的至少一者。
在一些实施例中,预先搭建的卷积神经网络的网络结构包括:
卷积层,所述卷积层用于提取图像的局部特征,以得到特征图;
池化层,所述池化层用于降低所述特征图的空间维度;
全连接层,所述全连接层用于将多维特征向量转换为一维,将卷积层和输出层连接起来;
输出层,所述输出层用于输出分类预测结果。
在上述具体实施方式中,本发明所提供的基于卷积神经网络的针状焦显微图检测的装置,通过获取待识别图像,并对所述待识别图像进行预处理,将预处理后的待识别图像划分为多个截图,将所有截图输入预先训练的分类预测模型,即可得到每张截图的分类结果;其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。由于针状焦的显微结构对其性能有重要影响,本发明通过卷积神经网络可有效解决针状焦的显微结构分类问题,对针状焦广泛应用具有实际意义,针状焦孔洞的存在可能对其性能产生负面影响,本发明能够通过预先训练的分类预测模型准确识别针状焦孔洞,从而提升针状焦材料性能,降低了针状焦孔洞对针状焦的性能造成的负面影响。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和模型预测。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的模型预测用于存储静态信息和动态信息数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述方法实施例中的步骤。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
与上述实施例相对应的,本发明实施例还提供了一种计算机存储介质,该计算机存储介质中包含一个或多个程序指令。其中,所述一个或多个程序指令用于被执行如上所述的方法。
本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述方法。
在本发明实施例中,处理器可以是一种集成电路芯片,具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息,结合其硬件完成上述方法的步骤。
存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
其中,非易失性存储器可以是只读存储器(Read-Only Memory,简称ROM)、可编程只读存储器(Programmable ROM,简称PROM)、可擦除可编程只读存储器(Erasable PROM,简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM,简称EEPROM)或闪存。
易失性存储器可以是随机存取存储器(Random Access Memory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,简称SRAM)、动态随机存取存储器(Dynamic RAM,简称DRAM)、同步动态随机存取存储器(Synchronous DRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,简称DDRSDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,简称ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,简称SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,简称DRRAM)。
本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时,可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.一种基于卷积神经网络的针状焦显微图检测的方法,其特征在于,所述方法包括:
获取待识别图像,并对所述待识别图像进行预处理;
将预处理后的待识别图像划分为多个截图;
将所有截图输入预先训练的分类预测模型,以得到每张截图的分类结果;
其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。
2.根据权利要求1所述的基于卷积神经网络的针状焦显微图检测的方法,其特征在于,得到每张截图的分类结果,之后还包括:
计算每种分类结果的生成概率,并将所述分类结果以概率的形式输出。
3.根据权利要求2所述的基于卷积神经网络的针状焦显微图检测的方法,其特征在于,计算每种分类结果的生成概率,之后还包括:
分别统计每张截图中目标结构的个数;
其中,所述目标结构包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者。
4.根据权利要求1所述的基于卷积神经网络的针状焦显微图检测的方法,其特征在于,得到每张截图的分类结果,之后还包括:
在所述分类结果为存在孔洞的情况下,确定所述分类结果对应的截图在所述待识别图像中的坐标位置,以实现孔洞定位。
5.根据权利要求1-4任一项所述的基于卷积神经网络的针状焦显微图检测的方法,其特征在于,基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练,得到所述分类预测模型,具体包括:
获取显微图片样本,根据预先设定的标签类别,在每张所述显微图片样本上打标签,所述标签类别包括镶嵌、大片、小片、短纤维、细纤维、粗纤维和孔洞中的至少一者;
对带有标签的所述显微图片样本进行数据预处理,利用预处理后的所述显微图片样本构成数据集;
将所述数据集划分为训练集和验证集;
根据预先设定的训练参数,将所述训练集输入预先搭建的卷积神经网络进行训练,以得到所述分类预测模型。
6.根据权利要求5所述的基于卷积神经网络的针状焦显微图检测的方法,其特征在于,根据预先设定的训练参数,将所述训练集输入预先搭建的卷积神经网络进行训练,以得到所述分类预测模型,之后还包括:
利用所述验证集对所述分类预测模型进行预设指标的评估;
其中,所述预设指标包括准确率、召回率和精确率中的至少一者。
7.根据权利要求5所述的基于卷积神经网络的针状焦显微图检测的方法,其特征在于,预先搭建的卷积神经网络的网络结构包括:
卷积层,所述卷积层用于提取图像的局部特征,以得到特征图;
池化层,所述池化层用于降低所述特征图的空间维度;
全连接层,所述全连接层用于将多维特征向量转换为一维,将卷积层和输出层连接起来;
输出层,所述输出层用于输出分类预测结果。
8.一种基于卷积神经网络的针状焦显微图检测的装置,其特征在于,所述装置包括:
图像采集单元,用于获取待识别图像,并对所述待识别图像进行预处理;
图像处理单元,用于将预处理后的待识别图像划分为多个截图;
结果生成单元,用于将所有截图输入预先训练的分类预测模型,以得到每张截图的分类结果;
其中,所述分类预测模型是基于卷积神经网络,利用显微图片样本和每个样本对应的标签进行训练得到的。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748555.3A CN116486404B (zh) | 2023-06-25 | 2023-06-25 | 基于卷积神经网络的针状焦显微图检测的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310748555.3A CN116486404B (zh) | 2023-06-25 | 2023-06-25 | 基于卷积神经网络的针状焦显微图检测的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116486404A true CN116486404A (zh) | 2023-07-25 |
CN116486404B CN116486404B (zh) | 2023-09-26 |
Family
ID=87223610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310748555.3A Active CN116486404B (zh) | 2023-06-25 | 2023-06-25 | 基于卷积神经网络的针状焦显微图检测的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116486404B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447243A (zh) * | 2018-10-10 | 2019-03-08 | 深圳增强现实技术有限公司 | 基于深度学习的沥青质量检测方法、系统及电子设备 |
CN111783645A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 文字识别的方法、装置、电子设备及计算机可读存储介质 |
CN114117954A (zh) * | 2021-11-08 | 2022-03-01 | 北京工业大学 | 一种反应器内部三维反应场动态实时可视化方法 |
CN115115085A (zh) * | 2022-03-31 | 2022-09-27 | 北京旭阳数字科技有限公司 | 一种优化炼焦配煤的方法、优化炼焦配煤的系统及配煤优化管理系统 |
CN115908903A (zh) * | 2022-11-02 | 2023-04-04 | 宁夏计算机软件与技术服务有限公司 | 碳电极质量检测与分类智能终端 |
CN116188906A (zh) * | 2023-02-15 | 2023-05-30 | 支付宝(杭州)信息技术有限公司 | 一种识别弹窗图像中关闭标识的方法、装置、设备及介质 |
-
2023
- 2023-06-25 CN CN202310748555.3A patent/CN116486404B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447243A (zh) * | 2018-10-10 | 2019-03-08 | 深圳增强现实技术有限公司 | 基于深度学习的沥青质量检测方法、系统及电子设备 |
CN111783645A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 文字识别的方法、装置、电子设备及计算机可读存储介质 |
CN114117954A (zh) * | 2021-11-08 | 2022-03-01 | 北京工业大学 | 一种反应器内部三维反应场动态实时可视化方法 |
CN115115085A (zh) * | 2022-03-31 | 2022-09-27 | 北京旭阳数字科技有限公司 | 一种优化炼焦配煤的方法、优化炼焦配煤的系统及配煤优化管理系统 |
CN115908903A (zh) * | 2022-11-02 | 2023-04-04 | 宁夏计算机软件与技术服务有限公司 | 碳电极质量检测与分类智能终端 |
CN116188906A (zh) * | 2023-02-15 | 2023-05-30 | 支付宝(杭州)信息技术有限公司 | 一种识别弹窗图像中关闭标识的方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116486404B (zh) | 2023-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110119753B (zh) | 一种重构纹理识别岩性的方法 | |
CN114897779B (zh) | 基于融合注意力的宫颈细胞学图像异常区域定位方法及装置 | |
CN110929577A (zh) | 一种基于YOLOv3的轻量级框架改进的目标识别方法 | |
Zhang et al. | An efficient lightweight convolutional neural network for industrial surface defect detection | |
CN108520215B (zh) | 基于多尺度联合特征编码器的单样本人脸识别方法 | |
CN113034483B (zh) | 基于深度迁移学习的烟支缺陷检测方法 | |
CN110390347A (zh) | 针对深度神经网络的条件引导式对抗生成测试方法与系统 | |
CN107194414A (zh) | 一种基于局部敏感哈希的svm快速增量学习算法 | |
Jin et al. | End Image Defect Detection of Float Glass Based on Faster Region-Based Convolutional Neural Network. | |
Liu et al. | Image classification method on class imbalance datasets using multi-scale CNN and two-stage transfer learning | |
Xu et al. | Multiple guidance network for industrial product surface inspection with one labeled target sample | |
CN113436115A (zh) | 一种基于深度无监督学习的图像阴影检测方法 | |
CN116486404B (zh) | 基于卷积神经网络的针状焦显微图检测的方法和装置 | |
CN116704208B (zh) | 基于特征关系的局部可解释方法 | |
CN117011274A (zh) | 自动化玻璃瓶检测系统及其方法 | |
CN110659724A (zh) | 一种基于目标尺度范围的目标检测卷积神经网络构建方法 | |
CN115294392B (zh) | 基于生成网络模型的可见光遥感图像云去除方法及系统 | |
Yang et al. | Classification of industrial surface defects based on neural architecture search | |
Zhang et al. | Transcending the limit of local window: Advanced super-resolution transformer with adaptive token dictionary | |
CN112215351A (zh) | 增强的多尺度卷积神经网络软测量方法 | |
Zhang et al. | Research on steel surface defect detection based on YOLOv5 | |
Li et al. | DRA-ODM: a faster and more accurate deep recurrent attention dynamic model for object detection | |
Wang et al. | Swin-Transformer-YOLOv5 for lightweight hot-rolled steel strips surface defect detection algorithm | |
Alshawabkeh et al. | Automated Pavement Crack Detection Using Deep Feature Selection and Whale Optimization Algorithm. | |
Sari et al. | The Involvement of Local Binary Pattern to Improve the Accuracy of Multi Support Vector-Based Javanese Handwriting Character Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |