CN109409392A - 图片识别的方法及装置 - Google Patents
图片识别的方法及装置 Download PDFInfo
- Publication number
- CN109409392A CN109409392A CN201710713933.9A CN201710713933A CN109409392A CN 109409392 A CN109409392 A CN 109409392A CN 201710713933 A CN201710713933 A CN 201710713933A CN 109409392 A CN109409392 A CN 109409392A
- Authority
- CN
- China
- Prior art keywords
- information
- image data
- sample
- insect pest
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/188—Vegetation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种图片识别的方法及装置,其中所述方法包括:获取待识别对象的目标图像数据;采用第一神经网络对所述目标图像数据进行特征提取,获得至少两种特征编码信息;采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息。本发明实施例通过对目标图像数据进行特征提取以及自然语言解码,得到目标图像数据的特征描述信息,丰富了待识别对象的特征表示,使得提取的特征更加全面,提高了对象识别的准确率以及识别的效率。
Description
技术领域
本发明涉及图片处理技术领域,特别是涉及一种图片识别的方法、一种图片识别的装置、一种图片识别系统以及一种计算机可读存储介质。
背景技术
随着信息技术的发展,计算机自动识别技术应用在社会生活的各个方面,如语音识别、数字识别、指纹和人脸识别等。现有的计算机自动识别技术中,一般都是针对待识别对象进行单一特征提取,并将提取的特征与对样本库进行训练得到的特征进行对比,得到识别结果。
例如,当计算机自动识别技术应用于农业中,对农作物的虫害进行识别时,往往只能识别农作物中一个虫害种类,识别准确率比较低,从而可能导致病虫害的快速扩散或者用药错误对农作物造成严重的减产,造成严重的经济损失。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种图片识别的方法和相应的一种图片识别的装置、一种图片识别系统以及一种计算机可读存储介质。
为了解决上述问题,本发明实施例公开了一种图片识别的方法,所述方法包括:
获取待识别对象的目标图像数据;
采用第一神经网络对所述目标图像数据进行特征提取,获得至少两种特征编码信息;
采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息。
优选地,所述获取待识别对象的目标图像数据的步骤包括:
采集待识别对象的源图像数据;
对所述源图像数据进行预处理,得到目标图像数据。
优选地,所述预处理至少包括如下处理的一种或多种:
剪裁处理;
缩放处理;
归一化处理。
优选地,所述特征编码信息为采用独热向量编码的特征信息,所述采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息的步骤包括:
采用第二神经网络对所述至少两种特征编码信息进行解码,得到对应的至少两种特征信息;
将所述至少两种特征信息组织成特征描述信息。
优选地,在所述采用第一神经网络对所述目标图像数据进行特征提取,获得特征编码信息的步骤之前,还包括:
确定第一神经网络以及第二神经网络。
优选地,所述第一神经网络包括卷积神经网络,所述第二神经网络包括时间序列神经网络;
所述确定第一神经网络以及第二神经网络的步骤包括:
获取样本数据,所述样本数据包括样本图像数据以及预先在所述样本图像数据中标注的样本特征描述信息;
将所述样本图像数据进行预处理,获得样本图像集合;
对所述样本特征描述信息进行分词处理,生成样本词典,其中,所述样本词典中的每个分词采用独热向量表示;
将所述样本图像集合以及所述样本词典输入卷积神经网络,得到多种样本特征编码信息;
将所述多种样本特征编码信息输入时间序列神经网络,以指定损失函数为训练目标,对所述时间序列神经网络以及所述卷积神经网络进行训练。
优选地,所述待识别对象包括农作物,所述特征信息包括但不限于:所述农作物所处的地理位置、所述农作物的名称、虫害信息、虫害位置;所述特征描述信息包括所述农作物的虫害描述信息。
优选地,所述方法还包括:
展示所述虫害描述信息。
优选地,所述方法还包括:
基于所述虫害描述信息,生成农药配方信息。
优选地,所述方法还包括:
展示所述农药配方信息;
和/或
基于所述农药配方信息和所述特征信息,生成喷洒任务。
优选地,所述方法还包括:
将所述喷洒任务发送至无人机中,由所述无人机执行对应的喷洒作业。
优选地,所述方法还包括:
将所述虫害描述信息、所述农药配方信息和所述特征信息发送至指定终端,由该终端展示所述虫害描述信息、生成喷洒任务以及控制无人机执行所述喷洒任务。
本发明实施例还公开了一种图片识别的装置,所述装置包括:
目标图像数据获取模块,用于获取待识别对象的目标图像数据;
特征提取模块,用于采用第一神经网络对所述目标图像数据进行特征提取,获得至少两种特征编码信息;
特征描述信息获取模块,用于采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息。
优选地,所述目标图像数据获取模块包括:
源图像数据采集子模块,用于采集待识别对象的源图像数据;
第一预处理子模块,用于对所述源图像数据进行预处理,得到目标图像数据。
优选地,所述预处理至少包括如下处理的一种或多种:
剪裁处理;
缩放处理;
归一化处理。
优选地,所述特征编码信息为采用独热向量编码的特征信息,所述特征描述信息获取模块包括:
解码子模块,用于采用第二神经网络对所述至少两种特征编码信息进行解码,得到对应的至少两种特征信息;
特征描述信息组织子模块,用于将所述至少两种特征信息组织成特征描述信息。
优选地,所述装置还包括:
神经网络确定模块,用于确定第一神经网络以及第二神经网络。
优选地,所述第一神经网络包括卷积神经网络,所述第二神经网络包括时间序列神经网络;
所述神经网络确定模块包括:
样本数据获取子模块,用于获取样本数据,所述样本数据包括样本图像数据以及预先在所述样本图像数据中标注的样本特征描述信息;
第二预处理子模块,用于将所述样本图像数据进行预处理,获得样本图像集合;
词典生成子模块,用于对所述样本特征描述信息进行分词处理,生成样本词典,其中,所述样本词典中的每个分词采用独热向量表示;
卷积处理子模块,用于将所述样本图像集合以及所述样本词典输入卷积神经网络,得到多种样本特征编码信息;
时间序列处理子模块,用于将所述多种样本特征编码信息输入时间序列神经网络,以指定损失函数为训练目标,对所述时间序列神经网络以及所述卷积神经网络进行训练。
优选地,所述待识别对象包括农作物,所述特征信息包括但不限于:所述农作物所处的地理位置、所述农作物的名称、虫害信息、虫害位置;所述特征描述信息包括所述农作物的虫害描述信息。
优选地,所述装置还包括:
虫害描述信息展示模块,用于展示所述虫害描述信息。
优选地,所述装置还包括:
农药配方信息生成模块,用于基于所述虫害描述信息,生成农药配方信息。
优选地,所述装置还包括:
农药配方信息展示模块,用于展示所述农药配方信息;
和/或,
任务生成模块,用于基于所述农药配方信息和所述特征信息,生成喷洒任务。
优选地,所述装置还包括:
喷洒任务发送模块,用于将所述喷洒任务发送至无人机中,由所述无人机执行对应的喷洒作业。
优选地,所述装置还包括:
信息发送模块,用于将所述虫害描述信息、所述农药配方信息和所述特征信息发送至指定终端,由该终端展示所述虫害描述信息、生成喷洒任务以及控制无人机执行所述喷洒任务。
本发明实施例还公开了一种图片识别系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,结合卷积神经网络以及时间序列神经网络,对目标图像数据进行特征提取以及自然语言解码,得到目标图像数据的特征描述信息,丰富了待识别对象的特征表示,使得提取的特征更加全面,提高了对象识别的准确率以及识别的效率。
附图说明
图1是本发明的一种图片识别的方法实施例的步骤流程图;
图2是本发明的神经网络训练示意图;
图3是本发明的一种图片识别的装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种图片识别的方法实施例的步骤流程图,可以包括如下步骤:
步骤101,获取待识别对象的目标图像数据;
作为一种示例,待识别对象可以为无人机作业的对象,例如,针对农用无人机而言,该待识别对象可以包括水稻、果树、棉花、辣椒等农作物。
在本发明实施例的一种优选实施例中,步骤101可以包括如下子步骤:
子步骤S11,采集待识别对象的源图像数据;
在具体实现中,可以采用任一图像采集设备采集待识别对象的源图像数据。
例如,针对农作物而言,可以采用测绘无人机中的摄像机来采集农作物的源图像数据,也可以采用监控摄像头实时监测农田状况,获取该摄像头采集的源图像数据。
子步骤S12,对所述源图像数据进行预处理,得到目标图像数据。
得到源图像数据以后,可以对源图像数据进行预处理。
在本发明实施例的一种优选实施例中,预处理至少可以包括如下处理的一种或多种:剪裁处理、缩放处理、归一化处理,等等。
具体的,可以首先对该源图像数据进行中心裁剪,然后将裁剪后的图像数据缩放到指定大小,再针对图像的像素值进行最大值归一化处理,得到目标图像数据。
例如,可以对源图像数据进行85%的中心裁剪,然后将裁剪后的图像数据缩放到299*299*3的RGB图像,然后再对图像的像素做最大值归一化处理,得到目标图像数据。
步骤102,采用第一神经网络对所述目标图像数据进行特征提取,获得至少两种特征编码信息;
步骤103,采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息。
在本发明实施例中,至少可以采用第一神经网络以及第二神经网络对目标图像数据进行处理,从而实现对目标图像数据的识别,获得目标图像数据的特征描述信息。
具体的,该第一神经网络可以用作一个编码器,对目标图像数据进行特征提取,以对目标图像数据进行识别和检测,第二神经网络可以用作一个解码器,用于对编码后的信息进行自然语言解码。
作为一种示例,该第一神经网络可以包括卷积神经网络,例如,CNN(Convolutional Neural Network,卷积神经网络);该第二神经网络可以包括时间序列神经网络,例如,LSTM(Long Short-Term Memory,长短期记忆网络)。
在本发明实施例中,可以首先将目标图像数据输入第一神经网络,由第一神经网络对目标图像数据进行特征提取,获得至少两种特征信息,并对该至少两种特征信息进行编码,获得对应的特征编码信息。
在一种实施方式中,可以采用one-hot(独热)编码的方式对特征信息进行编码,得到该特征信息对应的one-hot向量。其中,one-hot编码又称为有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器,并且在任意时候,其中只有一位有效。
例如,自然状态码为:000,001,010,011,100,101;
独热编码为:000001,000010,000100,001000,010000,10000。
也就是说,对于每个特征,如果它有M个可能值,那么经过独热编码以后,就变成了M个二元特征,并且,这些特征互斥,每次只有一个激活,因此,数据就会变得稀疏。
第一神经网络的输出可以作为第二神经网络的输入,第一神经网络输出至少两种特征编码信息以后,可以将该至少两种特征编码信息输入第二神经网络,第二神经网络对该至少两种特征编码信息进行自然语言解码,得到该目标图像数据的特征描述信息。
在本发明实施例的一种优选实施例中,步骤103可以包括如下子步骤:
采用第二神经网络对所述至少两种特征编码信息进行解码,得到对应的至少两种特征信息;将所述至少两种特征信息组织成特征描述信息。
具体的,在本发明实施例中,解码器第二神经网络可以对特征编码进行解码,获得对应的特征信息,随后,可以确定该解码后的特征信息之间的关联关系,并将该多个特征信息连接成一个特征描述信息。
例如,当输入的目标图像数据为农作物的图像数据时,第一神经网络识别出的特征信息可以包括但不限于:该农作物所处的地理位置、该农作物的名称、虫害信息、虫害位置等,则第二神经网络中可以输出该农作物的虫害描述信息,如该虫害描述信息可以为:新疆xx地区的棉花的叶子长了蚜虫。
当本发明实施例用于农作物的虫害识别时,可以大大降低自动识别系统的复杂度,更加方便的用于农业自动化生产,也可以给农业生产者提供准确的技术支持和服务。
例如,可以应用在下述的农业服务场景:
一种场景是:展示所述虫害描述信息。具体的,得到虫害描述信息以后,可以直接在当前终端中展现该虫害描述信息。
或者,还可以将所述虫害描述信息发送至指定终端,由所述终端展示所述虫害描述信息。具体的,除了可以在本地终端中展现虫害描述信息以外,还可以将该虫害描述信息发送至其他的指定终端中,例如,发送至地面站或者操作人员的手机中,由该指定终端展示虫害描述信息,以及时将最新的虫害信息告知操作人员,避免虫害的进一步扩散。
另一种场景是:基于所述虫害描述信息,生成农药配方信息;展示所述农药配方信息。
具体的,得到虫害描述信息以后,本发明实施例还可以基于该虫害描述信息,自动生成农药配方信息,并在当前终端中展现该农药配方信息。
除了可以在本地终端中展现农药配方信息以外,还可以将该农药配方信息发送至其他的指定终端中,例如,发送至地面站或者操作人员的手机中,由该指定终端展示农药配方信息,以指导操作人员进行药物喷洒,大大降低操作人员用药不当造成的损失,并避免虫害的进一步扩散。
另一种场景是:基于所述农药配方信息和所述特征信息,生成喷洒任务;将所述喷洒任务发送至无人机中,由所述无人机执行对应的喷洒作业。
具体的,得到农药配方信息以后,本发明实施例还可以基于该农药配方信息以及特征信息,自动生成喷洒任务,并在当前终端中展现该喷洒任务。
除了可以在本地终端中展现喷洒任务以外,还可以将该喷洒任务发送至其他的指定终端中,例如,将喷洒任务发送至无人机中,由无人机执行对应的喷洒作业。或者,将喷洒任务发送至地面站或者操作人员的手机中,由该指定终端展现喷洒任务,以指导操作人员进行药物喷洒,大大降低操作人员用药不当造成的损失,并避免虫害的进一步扩散,自动化程度较高。
在具体实现中,还可以将虫害描述信息、农药配方信息和特征信息发送至指定终端,由该终端展示所述虫害描述信息、生成喷洒任务以及控制无人机执行所述喷洒任务。
需要说明的是,本发明实施例可以由服务器执行,服务器可以接收图像采集设备发送的源图像数据,并对源图像数据进行预处理,得到目标图像数据。服务器还可以对第一神经网络以及第二神经网络进行训练,然后使用第一神经网络以及第二神经网络对目标图像数据进行特征提取以及特征描述,生成特征描述信息。
或者,本发明实施例还可以由客户端执行,由客户端获取图像采集设备发送的源图像数据,并对源图像数据进行预处理,以及,从服务器中获取第一神经网络以及第二神经网络,使用第一神经网络以及第二神经网络对目标图像数据进行特征提取以及特征描述,生成特征描述信息。
在本发明实施例中,参考图2的神经网络训练示意图所示,第一神经网络以及第二神经网络可以采用如下方式训练得到:
步骤201,获取样本数据,所述样本数据包括样本图像数据以及预先在所述样本图像数据中标注的样本特征描述信息;
在具体实现中,可以通过任一图像采集设备,如测绘无人机、监控摄像头等采集大量的样本图像数据,并人为针对每张样本图像数据,标注样本特征描述信息。例如,某张样本图像数据为农作物棉花,从该图像数据可以得知棉花的叶子上长了蚜虫,此时,可以标注样本特征描述信息为:棉花的叶子长了蚜虫。
步骤202,将所述样本图像数据进行预处理,获得样本图像集合;
对样本图像数据进行标注以后,还可以对该样本图像数据进行预处理,获得样本图像集合,预处理的方式可以参考上述子步骤S12的描述。
步骤203,对所述样本特征描述信息进行分词处理,生成样本词典,其中,所述样本词典中的每个分词采用独热向量表示;
在本发明实施例中,对于样本特征描述信息,可以对其进行分词处理,并根据每个样本特征描述信息的分词结果,创建词典,然后将词典中每个词处理成one-hot向量。
在实际中,使用计算机对自然语言进行处理时,需要将自然语言处理成机器能够识别的符号,加上在机器学习过程中,需要将其进行数值化。而词是自然语言理解与处理的基础,因此可以对词进行数值化,词向量(WordRepresentation,Word embeding)是一种可行又有效的方法。词向量是指使用一个指定长度的实数向量v来表示一个词,例如,使用One-hot vector表示分词,即根据分词的数量|V|生成一个|V|*1的向量,当某一位为一的时候其他位都为零,然后这个向量就代表一个单词。
步骤204,将所述样本图像集合以及所述样本词典输入卷积神经网络,得到多种样本特征编码信息;
在具体实现中,得到样本图像集合以及样本词典以后可以将其作为CNN网络的输入。
在一种实施方式中,为了加速训练过程、提高识别的准确度,CNN神经网络的初始化参数可以为预训练好的模型参数。其中,该预训练好的模型参数可以采用如下方式确定:对预设的测试集进行模型训练得到一训练概率,当训练集输入同样的模型时输出的概率与该训练概率的差异在预设范围内,则表示该模型预训练好,对应的模型参数即为预训练好模型参数。
将样本图像集合以及样本词典输入CNN以后,输出样本特征编码信息xt-1。
具体的,当t为初始时刻时,例如,t=0时,x-1=CNN(I);
其中,I表示预处理后的样本图像数据。
当t不为初始时刻时,xt=WeSt,t∈{1...N}
其中,We为训练的参数;St为在时间t的分词的one-hot向量。
步骤205,将所述多种样本特征编码信息输入时间序列神经网络,以指定损失函数为训练目标,对所述时间序列神经网络以及所述卷积神经网络进行训练。
xt-1作为LSTM网络的输入,可以输出在下一时刻每个分词出现的概率pt+1,即:
pt+1=LSTM(xt-1),t∈{0...N-1}
得到分词的pt+1以后,可以结合该分词的one-hot向量St,确定损失函数L(I,S)。
在具体实现中,损失函数可以表示为最大似然函数对数的负值,即:
根据损失函数,可以求解整个模型,即求解卷积神经网络以及时间序列神经网络。
在本发明实施例中,结合卷积神经网络以及时间序列神经网络,对目标图像数据进行特征提取以及自然语言解码,得到目标图像数据的特征描述信息,丰富了待识别对象的特征表示,使得提取的特征更加全面,提高了对象识别的准确率以及识别的效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明的一种图片识别的装置实施例的结构框图,可以包括如下模块:
目标图像数据获取模块301,用于获取待识别对象的目标图像数据;
特征提取模块302,用于采用第一神经网络对所述目标图像数据进行特征提取,获得至少两种特征编码信息;
特征描述信息获取模块303,用于采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息。
在本发明实施例的一种优选实施例中,所述目标图像数据获取模块301可以包括如下子模块:
源图像数据采集子模块,用于采集待识别对象的源图像数据;
第一预处理子模块,用于对所述源图像数据进行预处理,得到目标图像数据。
在本发明实施例的一种优选实施例中,所述预处理至少包括如下处理的一种或多种:
剪裁处理;
缩放处理;
归一化处理。
在本发明实施例的一种优选实施例中,所述特征编码信息为采用独热向量编码的特征信息,所述特征描述信息获取模块包括:
解码子模块,用于采用第二神经网络对所述至少两种特征编码信息进行解码,得到对应的至少两种特征信息;
特征描述信息组织子模块,用于将所述至少两种特征信息组织成特征描述信息。
在本发明实施例的一种优选实施例中,所述装置还可以包括如下模块:
神经网络确定模块,用于确定第一神经网络以及第二神经网络。
在本发明实施例的一种优选实施例中,所述第一神经网络包括卷积神经网络,所述第二神经网络包括时间序列神经网络;
所述神经网络确定模块包括:
样本数据获取子模块,用于获取样本数据,所述样本数据包括样本图像数据以及预先在所述样本图像数据中标注的样本特征描述信息;
第二预处理子模块,用于将所述样本图像数据进行预处理,获得样本图像集合;
词典生成子模块,用于对所述样本特征描述信息进行分词处理,生成样本词典,其中,所述样本词典中的每个分词采用独热向量表示;
卷积处理子模块,用于将所述样本图像集合以及所述样本词典输入卷积神经网络,得到多种样本特征编码信息;
时间序列处理子模块,用于将所述多种样本特征编码信息输入时间序列神经网络,以指定损失函数为训练目标,对所述时间序列神经网络以及所述卷积神经网络进行训练。
在本发明实施例的一种优选实施例中,所述待识别对象包括农作物,所述特征信息包括但不限于:所述农作物所处的地理位置、所述农作物的名称、虫害信息、虫害位置;所述特征描述信息包括所述农作物的虫害描述信息。
在本发明实施例的一种优选实施例中,所述装置还可以包括如下模块:
虫害描述信息展示模块,用于展示所述虫害描述信息。
在本发明实施例的一种优选实施例中,所述装置还可以包括如下模块:
农药配方信息生成模块,用于基于所述虫害描述信息,生成农药配方信息。在本发明实施例的一种优选实施例中,还可以包括如下模块:
农药配方信息展示模块,用于展示所述农药配方信息;
和/或,任务生成模块,用于基于所述农药配方信息和所述特征信息,生成喷洒任务。
在本发明实施例的一种优选实施例中,所述装置还可以包括如下模块:
喷洒任务发送模块,用于将所述喷洒任务发送至无人机中,由所述无人机执行对应的喷洒作业。
在本发明实施例的一种优选实施例中,所述装置还可以包括如下模块:
信息发送模块,用于将所述虫害描述信息、所述农药配方信息和所述特征信息发送至指定终端,由该终端展示所述虫害描述信息、生成喷洒任务以及控制无人机执行所述喷洒任务。
对于图3的装置实施例而言,由于其与上述的方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
另外,本发明实施例还公开了一种图片识别系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例所述方法的步骤。
另外,本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所述方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种图片识别的方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (26)
1.一种图片识别的方法,其特征在于,所述方法包括:
获取待识别对象的目标图像数据;
采用第一神经网络对所述目标图像数据进行特征提取,获得至少两种特征编码信息;
采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别对象的目标图像数据的步骤包括:
采集待识别对象的源图像数据;
对所述源图像数据进行预处理,得到目标图像数据。
3.根据权利要求2所述的方法,其特征在于,所述预处理至少包括如下处理的一种或多种:
剪裁处理;
缩放处理;
归一化处理。
4.根据权利要求1所述的方法,其特征在于,所述特征编码信息为采用独热向量编码的特征信息,所述采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息的步骤包括:
采用第二神经网络对所述至少两种特征编码信息进行解码,得到对应的至少两种特征信息;
将所述至少两种特征信息组织成特征描述信息。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述采用第一神经网络对所述目标图像数据进行特征提取,获得特征编码信息的步骤之前,还包括:
确定第一神经网络以及第二神经网络。
6.根据权利要求5所述的方法,其特征在于,所述第一神经网络包括卷积神经网络,所述第二神经网络包括时间序列神经网络;
所述确定第一神经网络以及第二神经网络的步骤包括:
获取样本数据,所述样本数据包括样本图像数据以及预先在所述样本图像数据中标注的样本特征描述信息;
将所述样本图像数据进行预处理,获得样本图像集合;
对所述样本特征描述信息进行分词处理,生成样本词典,其中,所述样本词典中的每个分词采用独热向量表示;
将所述样本图像集合以及所述样本词典输入卷积神经网络,得到多种样本特征编码信息;
将所述多种样本特征编码信息输入时间序列神经网络,以指定损失函数为训练目标,对所述时间序列神经网络以及所述卷积神经网络进行训练。
7.根据权利要求4所述的方法,其特征在于,所述待识别对象包括农作物,所述特征信息包括但不限于:所述农作物所处的地理位置、所述农作物的名称、虫害信息、虫害位置;所述特征描述信息包括所述农作物的虫害描述信息。
8.根据权利要求7所述的方法,其特征在于,还包括:
展示所述虫害描述信息。
9.根据权利要求7或8所述的方法,其特征在于,还包括:
基于所述虫害描述信息,生成农药配方信息。
10.根据权利要求9所述的方法,其特征在于,还包括:
展示所述农药配方信息;
和/或
基于所述农药配方信息和所述特征信息,生成喷洒任务。
11.根据权利要求10所述的方法,其特征在于,还包括:
将所述喷洒任务发送至无人机中,由所述无人机执行对应的喷洒作业。
12.根据权利要求9所述的方法,其特征在于,还包括:
将所述虫害描述信息、所述农药配方信息和所述特征信息发送至指定终端,由该终端展示所述虫害描述信息、生成喷洒任务以及控制无人机执行所述喷洒任务。
13.一种图片识别的装置,其特征在于,所述装置包括:
目标图像数据获取模块,用于获取待识别对象的目标图像数据;
特征提取模块,用于采用第一神经网络对所述目标图像数据进行特征提取,获得至少两种特征编码信息;
特征描述信息获取模块,用于采用第二神经网络对所述至少两种特征编码信息进行解码,获得所述目标图像数据的特征描述信息。
14.根据权利要求13所述的装置,其特征在于,所述目标图像数据获取模块包括:
源图像数据采集子模块,用于采集待识别对象的源图像数据;
第一预处理子模块,用于对所述源图像数据进行预处理,得到目标图像数据。
15.根据权利要求14所述的装置,其特征在于,所述预处理至少包括如下处理的一种或多种:
剪裁处理;
缩放处理;
归一化处理。
16.根据权利要求13所述的装置,其特征在于,所述特征编码信息为采用独热向量编码的特征信息,所述特征描述信息获取模块包括:
解码子模块,用于采用第二神经网络对所述至少两种特征编码信息进行解码,得到对应的至少两种特征信息;
特征描述信息组织子模块,用于将所述至少两种特征信息组织成特征描述信息。
17.根据权利要求13-16任一项所述的装置,其特征在于,还包括:
神经网络确定模块,用于确定第一神经网络以及第二神经网络。
18.根据权利要求17所述的装置,其特征在于,所述第一神经网络包括卷积神经网络,所述第二神经网络包括时间序列神经网络;
所述神经网络确定模块包括:
样本数据获取子模块,用于获取样本数据,所述样本数据包括样本图像数据以及预先在所述样本图像数据中标注的样本特征描述信息;
第二预处理子模块,用于将所述样本图像数据进行预处理,获得样本图像集合;
词典生成子模块,用于对所述样本特征描述信息进行分词处理,生成样本词典,其中,所述样本词典中的每个分词采用独热向量表示;
卷积处理子模块,用于将所述样本图像集合以及所述样本词典输入卷积神经网络,得到多种样本特征编码信息;
时间序列处理子模块,用于将所述多种样本特征编码信息输入时间序列神经网络,以指定损失函数为训练目标,对所述时间序列神经网络以及所述卷积神经网络进行训练。
19.根据权利要求16所述的装置,其特征在于,所述待识别对象包括农作物,所述特征信息包括但不限于:所述农作物所处的地理位置、所述农作物的名称、虫害信息、虫害位置;所述特征描述信息包括所述农作物的虫害描述信息。
20.根据权利要求19所述的装置,其特征在于,还包括:
虫害描述信息展示模块,用于展示所述虫害描述信息。
21.根据权利要求19或20所述的装置,其特征在于,还包括:
农药配方信息生成模块,用于基于所述虫害描述信息,生成农药配方信息。
22.根据权利要求21所述的装置,其特征在于,还包括:
农药配方信息展示模块,用于展示所述农药配方信息;
和/或,
任务生成模块,用于基于所述农药配方信息和所述特征信息,生成喷洒任务。
23.根据权利要求22所述的装置,其特征在于,还包括:
喷洒任务发送模块,用于将所述喷洒任务发送至无人机中,由所述无人机执行对应的喷洒作业。
24.根据权利要求21所述的装置,其特征在于,还包括:
信息发送模块,用于将所述虫害描述信息、所述农药配方信息和所述特征信息发送至指定终端,由该终端展示所述虫害描述信息、生成喷洒任务以及控制无人机执行所述喷洒任务。
25.一种图片识别系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至12任一项所述方法的步骤。
26.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至12任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710713933.9A CN109409392A (zh) | 2017-08-18 | 2017-08-18 | 图片识别的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710713933.9A CN109409392A (zh) | 2017-08-18 | 2017-08-18 | 图片识别的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109409392A true CN109409392A (zh) | 2019-03-01 |
Family
ID=65463194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710713933.9A Pending CN109409392A (zh) | 2017-08-18 | 2017-08-18 | 图片识别的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409392A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110178605A (zh) * | 2019-06-28 | 2019-08-30 | 重庆文理学院 | 一种针对猕猴桃叶片病害的精准农药自动喷洒系统 |
CN113920426A (zh) * | 2021-09-17 | 2022-01-11 | 山东浪潮科学研究院有限公司 | 基于cnn和lstm的智能病虫害识别方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654129A (zh) * | 2015-12-30 | 2016-06-08 | 成都数联铭品科技有限公司 | 一种光学文字序列识别方法 |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
CN106846306A (zh) * | 2017-01-13 | 2017-06-13 | 重庆邮电大学 | 一种超声图像自动描述方法和系统 |
-
2017
- 2017-08-18 CN CN201710713933.9A patent/CN109409392A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654129A (zh) * | 2015-12-30 | 2016-06-08 | 成都数联铭品科技有限公司 | 一种光学文字序列识别方法 |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
CN106846306A (zh) * | 2017-01-13 | 2017-06-13 | 重庆邮电大学 | 一种超声图像自动描述方法和系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110178605A (zh) * | 2019-06-28 | 2019-08-30 | 重庆文理学院 | 一种针对猕猴桃叶片病害的精准农药自动喷洒系统 |
CN113920426A (zh) * | 2021-09-17 | 2022-01-11 | 山东浪潮科学研究院有限公司 | 基于cnn和lstm的智能病虫害识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107622252B (zh) | 信息生成方法和装置 | |
US20200082199A1 (en) | Method and apparatus for inspecting burrs of electrode slice | |
CN108416323A (zh) | 用于识别人脸的方法和装置 | |
CN108986169A (zh) | 用于处理图像的方法和装置 | |
CN109583389B (zh) | 绘本识别方法及装置 | |
CN109670065A (zh) | 基于图像识别的问答处理方法、装置、设备和存储介质 | |
CN109919209A (zh) | 一种领域自适应深度学习方法及可读存储介质 | |
CN111143617A (zh) | 一种图片或视频文本描述自动生成方法及系统 | |
CN109472193A (zh) | 人脸检测方法及装置 | |
CN109409392A (zh) | 图片识别的方法及装置 | |
CN115331150A (zh) | 图像识别方法、装置、电子设备、存储介质 | |
CN114419667A (zh) | 基于迁移学习的人物检测方法和系统 | |
CN113033677A (zh) | 视频分类方法、装置、电子设备和存储介质 | |
CN108921138B (zh) | 用于生成信息的方法和装置 | |
CN113837965A (zh) | 图像清晰度识别方法、装置、电子设备及存储介质 | |
CN114266952A (zh) | 基于深监督的实时语义分割方法 | |
CN114302157A (zh) | 属性标签识别、代播事件检测方法及其装置、设备、介质 | |
CN114463197A (zh) | 一种用于电力设备的文本识别方法及设备 | |
CN116361502B (zh) | 一种图像检索方法、装置、计算机设备及存储介质 | |
CN111914068B (zh) | 试题知识点的提取方法 | |
CN113420763A (zh) | 文本图像处理方法、装置、电子设备及可读存储介质 | |
CN115690566B (zh) | 一种基于深度迁移聚类学习的深海动物新物种识别方法 | |
CN116993978A (zh) | 小样本分割方法、系统、可读存储介质及计算机设备 | |
WO2020098121A1 (zh) | 快速模型的训练方法、装置、计算机设备及存储介质 | |
CN114882334A (zh) | 用于生成预训练模型的方法、模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190301 |