CN107463899B - 识别风力发电机部件的边缘的方法及装置 - Google Patents
识别风力发电机部件的边缘的方法及装置 Download PDFInfo
- Publication number
- CN107463899B CN107463899B CN201710655881.4A CN201710655881A CN107463899B CN 107463899 B CN107463899 B CN 107463899B CN 201710655881 A CN201710655881 A CN 201710655881A CN 107463899 B CN107463899 B CN 107463899B
- Authority
- CN
- China
- Prior art keywords
- convolutional layer
- convolutional
- layer
- output
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 45
- 238000003475 lamination Methods 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 241000208340 Araliaceae Species 0.000 claims 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 2
- 235000008434 ginseng Nutrition 0.000 claims 2
- 238000011176 pooling Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 238000010248 power generation Methods 0.000 description 6
- 208000027418 Wounds and injury Diseases 0.000 description 4
- 239000002537 cosmetic Substances 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 208000014674 injury Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/176—Urban or other man-made structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
提供一种识别风力发电机部件的边缘的方法及装置。所述方法包括:获取包括待识别部件的图像;将获取的图像输入到基于样本集训练得到的卷积神经网络模型,来获得用于指示待识别部件的边缘的图像,其中,所述卷积神经网络模型包括N个卷积阶段,第k个卷积阶段包括Mk个卷积层,N为大于1的整数,k为大于0小于等于N的整数,Mk为大于1的整数,其中,所述卷积神经网络模型的输入层连接到第一卷积阶段,从第一卷积阶段开始,每个卷积阶段通过池化层连接到下一卷积阶段,并且,N个卷积阶段所包括的所有卷积层还通过特定网络结构连接到输出层。根据所述方法及装置,能够快捷、准确地从图像中识别出风力发电机部件的边缘。
Description
技术领域
本发明总体说来涉及风力发电领域,更具体地讲,涉及一种识别风力发电机部件的边缘的方法及装置。
背景技术
风力发电机所处的环境复杂多变,在森林、草原、沙漠、戈壁、丘陵、沿海、海上等多种地理环境下都有风力发电机的身影。在各种地貌条件下的风力发电机往往会有各种程度的外观损伤而影响发电量。
图像识别技术对于风机发电机的外观损伤的识别具有优势,其能够快速、准确地识别风机发电机的叶片结冰、裂纹、开裂、污损等种种外观损伤。但由于风力发电机所处的地理环境复杂多变,采集的风力发电机部件的图像中的背景噪声容易导致外观损伤识别失败。例如,对于风力发电机叶片结冰的识别,拍摄的叶片图像中的背景噪声(例如,天空中的云层、光斑等)与叶片结冰的特征存在一定的相似性,容易被误识别为结冰而导致识别错误;对于叶片裂纹的识别,拍摄的叶片图像中的背景噪声(例如,树木、岩石、远处的风力发电机等)与叶片裂纹的特征存在一定的相似性,容易被误识别为叶片裂纹而导致识别错误。
因此,需要一种能够准确从图像中识别出风机发电机部件的边缘的方法,以便于从图像中将风机发电机部件单独识别出来,减少图像中的背景噪声对风机发电机部件的外观损伤识别的影响。
发明内容
本发明的示例性实施例在于提供一种识别风力发电机部件的边缘的方法及装置,其能够快捷、准确地从图像中识别出风力发电机部件的边缘。
根据本发明的示例性实施例,提供一种识别风力发电机部件的边缘的方法,其特征在于,所述方法包括:获取包括待识别部件的图像;将获取的图像输入到基于样本集训练得到的卷积神经网络模型,来获得用于指示待识别部件的边缘的图像,其中,所述卷积神经网络模型包括N个卷积阶段,第k个卷积阶段包括Mk个卷积层,N为大于1的整数,k为大于0小于等于N的整数,Mk为大于1的整数,其中,所述卷积神经网络模型的输入层连接到第一卷积阶段,从第一卷积阶段开始,每个卷积阶段通过池化层连接到下一卷积阶段,并且,N个卷积阶段所包括的所有卷积层还通过特定网络结构连接到输出层。
可选地,所述特定网络结构包括:多个第一类型的卷积层、多个第二类型的卷积层、一个第三类型的卷积层、多个反卷积层、一个级联层,其中,当k等于1时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为所述级联层的输入;当k大于1小于等于N时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为一个反卷积层的输入,所述一个反卷积层的输出作为所述级联层的输入;所述级联层的输出融合后作为所述第三类型的卷积层的输入,所述第三类型的卷积层的输出作为输出层的输入。
可选地,所述第一类型的卷积层是卷积核的大小为1×1且具有预定深度的卷积层,所述第二类型的卷积层是卷积核的大小为1×1且深度为1的卷积层,所述第三类型的卷积层是卷积核的大小为1×1且深度为1的卷积层。
可选地,所述多个反卷积层用于使向所述级联层输入的特征图的大小相同。
可选地,N个卷积阶段所包括的所有卷积层的卷积核的大小相同,并且,第k个卷积阶段所包括的卷积层的深度大于或等于第k-1个卷积阶段所包括的卷积层的深度。
可选地,所述卷积神经网络模型是基于样本集通过反向传播方法训练得到的,其中,反向传播方法所使用的损失函数如下式:
其中,用于计算对应于第k卷积阶段,像素点i相对于像素标签的损耗,用于计算对应于融合阶段,像素点i相对于像素标签的损耗,W指示所述卷积神经网络模型需要训练的所有参数,|I|指示图像中像素的数量,K=N。
可选地,
其中,Xi和yi分别指示像素点i的边缘概率的激活值和边缘概率的真值,Y+和Y-分别指示图像中正样本的个数和负样本的个数,超参数λ用于平衡正样本的个数和负样本的个数,P(Xi;W)为激活函数,0<η<1。
根据本发明的另一示例性实施例,提供一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被配置为使计算机的处理器执行上述识别风力发电机部件的边缘的方法。
根据本发明的另一示例性实施例,提供一种计算机,其特征在于,所述计算机包括上述计算机可读存储介质。
根据本发明的另一示例性实施例,提供一种识别风力发电机部件的边缘的装置,其特征在于,所述装置包括:获取单元,获取包括待识别部件的图像;识别单元,将获取的图像输入到基于样本集训练得到的卷积神经网络模型,来获得用于指示待识别部件的边缘的图像,其中,所述卷积神经网络模型包括N个卷积阶段,第k个卷积阶段包括Mk个卷积层,N为大于1的整数,k为大于0小于等于N的整数,Mk为大于1的整数,其中,所述卷积神经网络模型的输入层连接到第一卷积阶段,从第一卷积阶段开始,每个卷积阶段通过池化层连接到下一卷积阶段,并且,N个卷积阶段所包括的所有卷积层还通过特定网络结构连接到输出层。
可选地,所述特定网络结构包括:多个第一类型的卷积层、多个第二类型的卷积层、一个第三类型的卷积层、多个反卷积层、一个级联层,其中,当k等于1时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为所述级联层的输入;当k大于1小于等于N时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为一个反卷积层的输入,所述一个反卷积层的输出作为所述级联层的输入;所述级联层的输出融合后作为所述第三类型的卷积层的输入,所述第三类型的卷积层的输出作为输出层的输入。
可选地,所述第一类型的卷积层是卷积核的大小为1×1且具有预定深度的卷积层,所述第二类型的卷积层是卷积核的大小为1×1且深度为1的卷积层,所述第三类型的卷积层是卷积核的大小为1×1且深度为1的卷积层。
可选地,所述多个反卷积层用于使向所述级联层输入的特征图的大小相同。
可选地,N个卷积阶段所包括的所有卷积层的卷积核的大小相同,并且,第k个卷积阶段所包括的卷积层的深度大于或等于第k-1个卷积阶段所包括的卷积层的深度。
可选地,所述卷积神经网络模型是基于样本集通过反向传播方法训练得到的,其中,反向传播方法所使用的损失函数如下式:
其中,用于计算对应于第k卷积阶段,像素点i相对于像素标签的损耗,用于计算对应于融合阶段,像素点i相对于像素标签的损耗,W指示所述卷积神经网络模型需要训练的所有参数,|I|指示图像中像素的数量,K=N。
可选地,
其中,Xi和yi分别指示像素点i的边缘概率的激活值和边缘概率的真值,Y+和Y-分别指示图像中正样本的个数和负样本的个数,超参数λ用于平衡正样本的个数和负样本的个数,P(Xi;W)为激活函数,0<η<1。
在根据本发明示例性实施例的识别风力发电机部件的边缘的方法及装置中,利用所有卷积阶段所包括的所有卷积层输出的图像信息来确定待识别部件的边缘,丰富且多尺度的图像信息能够提高识别部件边缘的准确度。
将在接下来的描述中部分阐述本发明总体构思另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本发明总体构思的实施而得知。
附图说明
通过下面结合示例性地示出实施例的附图进行的描述,本发明示例性实施例的上述和其他目的和特点将会变得更加清楚,其中:
图1示出根据本发明示例性实施例的识别风力发电机部件的边缘的方法的流程图;
图2示出根据本发明示例性实施例的卷积神经网络模型的示例;
图3示出根据本发明示例性实施例的卷积神经网络模型的另一示例;
图4示出根据本发明示例性实施例的用于指示待识别部件的边缘的图像的示例;
图5示出根据本发明示例性实施例的卷积神经网络模型的另一示例;
图6示出根据本发明示例性实施例的识别风力发电机部件的边缘的装置的框图。
具体实施方式
现将详细参照本发明的实施例,所述实施例的示例在附图中示出,其中,相同的标号始终指的是相同的部件。以下将通过参照附图来说明所述实施例,以便解释本发明。
图1示出根据本发明示例性实施例的识别风力发电机部件的边缘的方法的流程图。
参照图1,在步骤S10,获取包括待识别部件的图像。
作为示例,待识别部件可以是各种需要从图像中识别出边缘的风力发电机部件。例如,待识别部件可以是风力发电机的叶片等。
作为示例,包括待识别部件的图像可以是通过摄像头拍摄的风力发电机的待识别部件的图像。
在步骤S20,将获取的图像输入到基于样本集训练得到的卷积神经网络模型,来获得用于指示待识别部件的边缘的图像。这里,所述卷积神经网络模型包括N个卷积阶段,第k个卷积阶段包括Mk个卷积层,N为大于1的整数,k为大于0小于等于N的整数,Mk为大于1的整数,其中,所述卷积神经网络模型的输入层连接到第一卷积阶段,从第一卷积阶段开始,每个卷积阶段通过池化层连接到下一卷积阶段,并且,N个卷积阶段所包括的所有卷积层还通过特定网络结构连接到输出层。从而,能够利用所有卷积阶段所包括的所有卷积层输出的图像信息来确定待识别部件的边缘,丰富且多尺度的图像信息能够提高识别部件边缘的准确度。
具体说来,每个卷积阶段所包括的所有卷积层在顺序连接的同时,还通过对应的网络结构连接到输出层。以第一卷积阶段为例,第一卷积阶段包括M1个卷积层,输入层连接到第一卷积阶段(以下,称为stage1)的第一卷积层,stage1的第一卷积层再连接到stage1的第二卷积层,直至依次连接到stage1的第M1卷积层,stage1的第M1卷积层通过池化层连接到stage2的第一卷积层,同时,stage1的M1个卷积层还通过对应的网络结构连接到输出层。
图2示出根据本发明示例性实施例的卷积神经网络模型的示例。参照图2,所述特定网络结构可包括:多个第一类型的卷积层、多个第二类型的卷积层、一个第三类型的卷积层、多个反卷积层(deconv)、一个级联层(concat)。作为示例,所述第一类型的卷积层可以是卷积核的大小为1×1且具有预定深度的卷积层。作为示例,所述第二类型的卷积层可以是卷积核的大小为1×1且深度为1的卷积层。作为示例,所述第三类型的卷积层可以是卷积核的大小为1×1且深度为1的卷积层。
具体地,当k等于1(即,针对stage1)时,第k个卷积阶段所包括的Mk个卷积层的输出以一一对应的方式分别作为Mk个第一类型的卷积层的输入(即,stage1的一个卷积层还连接到一个第一类型的卷积层),所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为所述级联层的输入;
当k大于1小于等于N时(即,针对除stage1之外的所有stage),第k个卷积阶段所包括的Mk个卷积层的输出以一一对应的方式分别作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为一个反卷积层的输入,所述一个反卷积层的输出作为所述级联层的输入;
所述级联层的输出融合(fusion)后作为所述第三类型的卷积层的输入,所述第三类型的卷积层的输出作为输出层的输入。
作为示例,所述多个反卷积层可用于使向所述级联层输入的特征图的大小相同。换言之,每个反卷积层输出的特征图与stage1的卷积层输出的特征图的大小相同。即,每个反卷积层将输入其的特征图的大小调整为stage1的卷积层输出的特征图的大小。
作为示例,N个卷积阶段所包括的所有卷积层的卷积核的大小可相同(例如,卷积核的大小均为3×3)。
由于越靠后执行的卷积阶段所包括的卷积层能够提取到越深层的图像信息,作为示例,可使越靠后执行的卷积阶段所包括的卷积层的深度越大,即,第k个卷积阶段所包括的卷积层的深度可大于或等于第k-1个卷积阶段所包括的卷积层的深度,从而能够提取更丰富、深层的图像信息用于识别部件边缘,以提高识别准确度。例如,5个卷积阶段所包括的卷积层的深度依次可以是64、128、256、512以及512。
图3示出根据本发明示例性实施例的卷积神经网络模型的另一示例。如图3所示,根据本发明示例性实施例的卷积神经网络模型可包括5个卷积阶段(即,N=5),stage1可包括2个卷积核的大小为3×3且深度为64的卷积层(3×3-64conv),stage2可包括2个卷积核的大小为3×3且深度为128的卷积层(3×3-128conv),stage3可包括3个卷积核的大小为3×3且深度为256的卷积层(3×3-256conv),stage4可包括3个卷积核的大小为3×3且深度为512的卷积层(3×3-512conv),stage5可包括3个卷积核的大小为3×3且深度为512的卷积层(3×3-512conv),两个卷积阶段之间可通过一个2×2的池化层(2×2pool)相连,第一类型的卷积层可以是卷积核的大小为1×1且深度为21的卷积层(1×1-21conv),第二类型的卷积层可以是卷积核的大小为1×1且深度为1的卷积层(1×1-1conv),第三类型的卷积层可以是卷积核的大小为1×1且深度为1的卷积层(1×1-1conv),输出层的激活函数可以是sigmoid函数。
应该理解,所述卷积神经网络模型的输入层包含用于描述包括待识别部件的图像的像素的多个输入神经元,所述卷积神经网络模型的输出层包含用于描述用于指示待识别部件的边缘的图像的像素的多个输出神经元。所述卷积神经网络模型输出的用于指示待识别部件的边缘的图像可以是边缘概率图,如图4所示,一像素为待识别部件的边缘的概率越大,该像素的灰度值越大。
此外,作为示例,在将获取的图像输入到所述卷积神经网络模型之前,也可先对获取的图像进行适合的预处理,然后再将处理后的图像输入到所述卷积神经网络模型。
作为示例,所述卷积神经网络模型可以是基于样本集通过反向传播方法训练得到的,其中,反向传播方法所使用的损失函数如式(1)所示:
其中,用于计算对应于第k卷积阶段,像素点i相对于像素标签的损耗,用于计算对应于融合阶段,像素点i相对于像素标签的损耗,W指示所述卷积神经网络模型需要训练的所有参数,|I|指示图像中像素的数量,K=N。
具体说来,如图5所示,在训练所述卷积神经网络模型时,当k等于1(即,针对stage1)时,第k个卷积阶段所包括的Mk个卷积层的输出以一一对应的方式分别作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出在作为所述级联层的输入的同时,还作为的输入;
当k大于1小于等于N时(即,针对除stage1之外的所有stage),第k个卷积阶段所包括的Mk个卷积层的输出以一一对应的方式分别作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为一个反卷积层的输入,所述一个反卷积层的输出在作为所述级联层的输入的同时,还作为的输入;
所述级联层的输出融合(fusion)后作为所述第三类型的卷积层的输入,所述第三类型的卷积层的输出作为的输入。
根据本发明的示例性实施例,基于各个阶段的像素点i相对于像素标签的损耗,能够更好地训练所述卷积神经网络模型的参数。
作为示例,和可为相同的loss函数,如式(2)所示:
其中,Xi和yi分别指示像素点i的边缘概率的激活值和边缘概率的真值,Y+和Y-分别指示图像中正样本的个数和负样本的个数,超参数λ用于平衡正样本的个数和负样本的个数,P(Xi;W)为激活函数,0<η<1。像素点i的边缘概率的激活值即针对像素点i的输出值,像素点i的边缘概率的真值即针对像素点i标记的值。作为示例,P(Xi;W)可以是sigmoid函数。
边缘数据集通常由多个注释者使用他们关于对象和对象部分的存在的知识来标记。虽然人类在认知上有所不同,但是对于同一图像,注释者标记的边缘具有很高的一致性。对于每个样本图像,平均所有的真值以产生从0到1的边缘概率图(即,像素点i的边缘概率的真值)。这里,0表示没有注释者在该像素处标记,而1表示所有注释者在该像素处标记。边缘概率高于η的像素作为正样本,边缘概率等于0的像素作为负样本,边缘概率大于0小于等于η的像素可能是有争议的边缘点,因此,无论将其作为正样本或负样本都可能会混淆网络,所以忽略这个类别的像素。
图6示出根据本发明示例性实施例的识别风力发电机部件的边缘的装置的框图。
如图6所示,根据本发明示例性实施例的识别风力发电机部件的边缘的装置包括:获取单元10和识别单元20。
获取单元10用于获取包括待识别部件的图像。
识别单元20用于将获取的图像输入到基于样本集训练得到的卷积神经网络模型,来获得用于指示待识别部件的边缘的图像。这里,所述卷积神经网络模型包括N个卷积阶段,第k个卷积阶段包括Mk个卷积层,N为大于1的整数,k为大于0小于等于N的整数,Mk为大于1的整数,其中,所述卷积神经网络模型的输入层连接到第一卷积阶段,从第一卷积阶段开始,每个卷积阶段通过池化层连接到下一卷积阶段,并且,N个卷积阶段所包括的所有卷积层还通过特定网络结构连接到输出层。
作为示例,所述特定网络结构可包括:多个第一类型的卷积层、多个第二类型的卷积层、一个第三类型的卷积层、多个反卷积层、一个级联层,其中:
当k等于1时,第k个卷积阶段所包括的Mk个卷积层的输出以一一对应的方式分别作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为所述级联层的输入;
当k大于1小于等于N时,第k个卷积阶段所包括的Mk个卷积层的输出以一一对应的方式分别作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为一个反卷积层的输入,所述一个反卷积层的输出作为所述级联层的输入;
所述级联层的输出融合后作为所述第三类型的卷积层的输入,所述第三类型的卷积层的输出作为输出层的输入。
作为示例,所述第一类型的卷积层可以是卷积核的大小为1×1且具有预定深度的卷积层,所述第二类型的卷积层可以是卷积核的大小为1×1且深度为1的卷积层,所述第三类型的卷积层可以是卷积核的大小为1×1且深度为1的卷积层。
作为示例,所述多个反卷积层可用于使向所述级联层输入的特征图的大小相同。
作为示例,N个卷积阶段所包括的所有卷积层的卷积核的大小可相同,并且,越靠后执行的卷积阶段所包括的卷积层的深度可越大,即,第k个卷积阶段所包括的卷积层的深度可大于或等于第k-1个卷积阶段所包括的卷积层的深度。
作为示例,所述卷积神经网络模型可以是基于样本集通过反向传播方法训练得到的,其中,反向传播方法所使用的损失函数如式(1)所示。
应该理解,根据本发明示例性实施例的识别风力发电机部件的边缘的装置的具体实现方式可参照结合图1-5描述的相关具体实现方式来实现,在此不再赘述。
作为示例,根据本发明示例性实施例的计算机可读存储介质存储有计算机程序,所述计算机程序可被配置为使计算机的处理器执行如结合图1描述的任一识别风力发电机部件的边缘的方法。
作为示例,根据本发明示例性实施例的计算机可包括上述计算机可读存储介质。
根据本发明示例性实施例的识别风力发电机部件的边缘的方法及装置,利用所有卷积阶段所包括的所有卷积层输出的图像信息来确定待识别部件的边缘,丰富且多尺度的图像信息能够提高识别部件边缘的准确度。
此外,应该理解,根据本发明示例性实施例的识别风力发电机部件的边缘的装置中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个单元所执行的处理,可以例如使用现场可编程门阵列(FPGA)或专用集成电路(ASIC)来实现各个单元。
此外,根据本发明示例性实施例的识别风力发电机部件的边缘的方法可以被实现为计算机可读记录介质中的计算机代码。本领域技术人员可以根据对上述方法的描述来实现所述计算机代码。当所述计算机代码在计算机中被执行时实现本发明的上述方法。
虽然已表示和描述了本发明的一些示例性实施例,但本领域技术人员应该理解,在不脱离由权利要求及其等同物限定其范围的本发明的原理和精神的情况下,可以对这些实施例进行修改。
Claims (16)
1.一种识别风力发电机部件的边缘的方法,其特征在于,所述方法包括:
获取包括待识别部件的图像;
将获取的图像输入到基于样本集训练得到的卷积神经网络模型,来获得用于指示待识别部件的边缘的图像,
其中,所述卷积神经网络模型包括N个卷积阶段,第k个卷积阶段包括Mk个卷积层,N为大于1的整数,k为大于0小于等于N的整数,Mk为大于1的整数,
其中,所述卷积神经网络模型的输入层连接到第一卷积阶段,从第一卷积阶段开始,每个卷积阶段通过池化层连接到下一卷积阶段,并且,N个卷积阶段所包括的所有卷积层还通过特定网络结构连接到输出层,以使每个卷积阶段所包括的所有卷积层在顺序连接的同时,还通过对应的网络结构连接到输出层,从而输出层还能够利用N个卷积阶段所包括的所有卷积层输出的信息。
2.根据权利要求1所述的方法,其特征在于,所述特定网络结构包括:多个第一类型的卷积层、多个第二类型的卷积层、一个第三类型的卷积层、多个反卷积层、一个级联层,
其中,当k等于1时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为所述级联层的输入;
当k大于1小于等于N时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为一个反卷积层的输入,所述一个反卷积层的输出作为所述级联层的输入;
所述级联层的输出融合后作为所述第三类型的卷积层的输入,所述第三类型的卷积层的输出作为输出层的输入。
3.根据权利要求2所述的方法,其特征在于,所述第一类型的卷积层是卷积核的大小为1×1且具有预定深度的卷积层,所述第二类型的卷积层是卷积核的大小为1×1且深度为1的卷积层,所述第三类型的卷积层是卷积核的大小为1×1且深度为1的卷积层。
4.根据权利要求2所述的方法,其特征在于,所述多个反卷积层用于使向所述级联层输入的特征图的大小相同。
5.根据权利要求1或2所述的方法,其特征在于,N个卷积阶段所包括的所有卷积层的卷积核的大小相同,并且,第k个卷积阶段所包括的卷积层的深度大于或等于第k-1个卷积阶段所包括的卷积层的深度。
6.根据权利要求2所述的方法,其特征在于,所述卷积神经网络模型是基于样本集通过反向传播方法训练得到的,其中,反向传播方法所使用的损失函数如下式:
其中,用于计算对应于第k卷积阶段,像素点i相对于像素标签的损耗,用于计算对应于融合阶段,像素点i相对于像素标签的损耗,W指示所述卷积神经网络模型需要训练的所有参数,|I|指示图像中像素的数量,K=N。
7.根据权利要求6所述的方法,其特征在于,其中,
其中,Xi和yi分别指示像素点i的边缘概率的激活值和边缘概率的真值,Y+和Y-分别指示图像中正样本的个数和负样本的个数,超参数λ用于平衡正样本的个数和负样本的个数,P(Xi;W)为激活函数,0<η<1。
8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被配置为使计算机的处理器执行如权利要求1-7之中任意一项所述的识别风力发电机部件的边缘的方法。
9.一种计算机,其特征在于,所述计算机包括如权利要求8所述的计算机可读存储介质。
10.一种识别风力发电机部件的边缘的装置,其特征在于,所述装置包括:
获取单元,获取包括待识别部件的图像;
识别单元,将获取的图像输入到基于样本集训练得到的卷积神经网络模型,来获得用于指示待识别部件的边缘的图像,
其中,所述卷积神经网络模型包括N个卷积阶段,第k个卷积阶段包括Mk个卷积层,N为大于1的整数,k为大于0小于等于N的整数,Mk为大于1的整数,
其中,所述卷积神经网络模型的输入层连接到第一卷积阶段,从第一卷积阶段开始,每个卷积阶段通过池化层连接到下一卷积阶段,并且,N个卷积阶段所包括的所有卷积层还通过特定网络结构连接到输出层,以使每个卷积阶段所包括的所有卷积层在顺序连接的同时,还通过对应的网络结构连接到输出层,从而输出层还能够利用N个卷积阶段所包括的所有卷积层输出的信息。
11.根据权利要求10所述的装置,其特征在于,所述特定网络结构包括:多个第一类型的卷积层、多个第二类型的卷积层、一个第三类型的卷积层、多个反卷积层、一个级联层,
其中,当k等于1时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为所述级联层的输入;
当k大于1小于等于N时,第k个卷积阶段所包括的Mk个卷积层的输出作为Mk个第一类型的卷积层的输入,所述Mk个第一类型的卷积层的输出累计后作为一个第二类型的卷积层的输入,所述一个第二类型的卷积层的输出作为一个反卷积层的输入,所述一个反卷积层的输出作为所述级联层的输入;
所述级联层的输出融合后作为所述第三类型的卷积层的输入,所述第三类型的卷积层的输出作为输出层的输入。
12.根据权利要求11所述的装置,其特征在于,所述第一类型的卷积层是卷积核的大小为1×1且具有预定深度的卷积层,所述第二类型的卷积层是卷积核的大小为1×1且深度为1的卷积层,所述第三类型的卷积层是卷积核的大小为1×1且深度为1的卷积层。
13.根据权利要求11所述的装置,其特征在于,所述多个反卷积层用于使向所述级联层输入的特征图的大小相同。
14.根据权利要求10或11所述的装置,其特征在于,N个卷积阶段所包括的所有卷积层的卷积核的大小相同,并且,第k个卷积阶段所包括的卷积层的深度大于或等于第k-1个卷积阶段所包括的卷积层的深度。
15.根据权利要求11所述的装置,其特征在于,所述卷积神经网络模型是基于样本集通过反向传播方法训练得到的,其中,反向传播方法所使用的损失函数如下式:
其中,用于计算对应于第k卷积阶段,像素点i相对于像素标签的损耗,用于计算对应于融合阶段,像素点i相对于像素标签的损耗,W指示所述卷积神经网络模型需要训练的所有参数,|I|指示图像中像素的数量,K=N。
16.根据权利要求15所述的装置,其特征在于,其中,
其中,Xi和yi分别指示像素点i的边缘概率的激活值和边缘概率的真值,Y+和Y-分别指示图像中正样本的个数和负样本的个数,超参数λ用于平衡正样本的个数和负样本的个数,P(Xi;W)为激活函数,0<η<1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710655881.4A CN107463899B (zh) | 2017-08-03 | 2017-08-03 | 识别风力发电机部件的边缘的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710655881.4A CN107463899B (zh) | 2017-08-03 | 2017-08-03 | 识别风力发电机部件的边缘的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107463899A CN107463899A (zh) | 2017-12-12 |
CN107463899B true CN107463899B (zh) | 2019-01-29 |
Family
ID=60548434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710655881.4A Active CN107463899B (zh) | 2017-08-03 | 2017-08-03 | 识别风力发电机部件的边缘的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107463899B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348319B (zh) * | 2019-06-18 | 2021-05-04 | 武汉大学 | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787439B (zh) * | 2016-02-04 | 2019-04-05 | 广州新节奏智能科技股份有限公司 | 一种基于卷积神经网络的深度图像人体关节定位方法 |
CN106228177A (zh) * | 2016-06-30 | 2016-12-14 | 浙江大学 | 基于卷积神经网络的日常生活物体图像识别方法 |
CN106203499A (zh) * | 2016-07-07 | 2016-12-07 | 青岛大学 | 一种基于深度cnn的安全带检测方法 |
CN106874956B (zh) * | 2017-02-27 | 2018-10-23 | 陕西师范大学 | 图像分类卷积神经网络结构的构建方法 |
-
2017
- 2017-08-03 CN CN201710655881.4A patent/CN107463899B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107463899A (zh) | 2017-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Concealed object detection for activate millimeter wave image | |
CN109325395A (zh) | 图像的识别方法、卷积神经网络模型的训练方法及装置 | |
CN105809146B (zh) | 一种图像场景识别方法和装置 | |
CN110245709A (zh) | 基于深度学习和自注意力的3d点云数据语义分割方法 | |
CN106383912B (zh) | 一种图片检索方法和装置 | |
CN109657716A (zh) | 一种基于深度学习的车辆外观损伤识别方法 | |
CN113989662B (zh) | 一种基于自监督机制的遥感图像细粒度目标识别方法 | |
CN108960330A (zh) | 基于快速区域卷积神经网络的遥感图像语义生成方法 | |
CN111339935B (zh) | 一种基于可解释cnn图像分类模型的光学遥感图片分类方法 | |
CN110245711A (zh) | 基于角度旋转生成网络的sar目标识别方法 | |
CN107092883A (zh) | 物体识别追踪方法 | |
CN105320764B (zh) | 一种基于增量慢特征的3d模型检索方法及其检索装置 | |
CN109426773A (zh) | 一种道路识别方法和装置 | |
CN105608690A (zh) | 一种基于图论和半监督学习相结合的图像分割方法 | |
CN108805149A (zh) | 一种视觉同步定位与地图构建的回环检测方法及装置 | |
CN108764310A (zh) | 基于多尺度多特征深度森林的sar目标识别方法 | |
CN111652835A (zh) | 基于深度学习与聚类的输电线路绝缘子缺失的检测方法 | |
CN110263790A (zh) | 一种基于卷积神经网络的电厂电表字符定位和识别方法 | |
CN111881716A (zh) | 一种基于多视角生成对抗网络的行人重识别方法 | |
Wang et al. | Study on the method of transmission line foreign body detection based on deep learning | |
CN110119455A (zh) | 一种基于卷积深度置信网络的图像分类检索方法 | |
CN108363962B (zh) | 一种基于多层次特征深度学习的人脸检测方法及系统 | |
CN112905828A (zh) | 一种结合显著特征的图像检索器、数据库及检索方法 | |
Yu et al. | Exemplar-based recursive instance segmentation with application to plant image analysis | |
CN104504391B (zh) | 一种基于稀疏特征和马尔科夫随机场的高光谱图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |