CN110458079A - 一种基于fpga和卷积神经网络的图像采集与目标识别方法 - Google Patents
一种基于fpga和卷积神经网络的图像采集与目标识别方法 Download PDFInfo
- Publication number
- CN110458079A CN110458079A CN201910717714.7A CN201910717714A CN110458079A CN 110458079 A CN110458079 A CN 110458079A CN 201910717714 A CN201910717714 A CN 201910717714A CN 110458079 A CN110458079 A CN 110458079A
- Authority
- CN
- China
- Prior art keywords
- image
- convolutional neural
- neural networks
- model
- networks model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种基于FPGA和卷积神经网络的图像采集与目标识别方法,它属于图像处理技术领域。本发明解决了现有方法对图像中目标识别的准确率低的问题。本发明将采集的图像分为训练集和测试集两部分,利用训练集对卷积神经网络模型进行训练,利用测试集对训练好的卷积神经网络模型进行测试,通过不断的循环训练,最终获得训练好的卷积神经网络模型。再利用训练好的卷积神经网络模型对待测图像进行处理,根据模型的输出判断待测图像中是否包含目标。采用本发明方法获得的训练好的卷积神经网络模型,可以将图像中目标识别的准确率提升至96%以上。本发明可以应用于图像处理技术领域。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种基于FPGA和卷积神经网络的图像采集与目标识别方法。
背景技术
目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。随着技术的发展,出现了基于机器视觉的目标识别等方法。虽然,现有的图像识别技术在图像目标识别方面已经取得了一定的成就,但是,现有方法对图像中目标识别的准确率较低。
发明内容
本发明的目的是为了解决现有方法对图像中目标识别的准确率低的问题,而提出了一种基于FPGA和卷积神经网络的图像采集与目标识别方法。
本发明为解决上述技术问题采取的技术方案是:
一种基于FPGA和卷积神经网络的图像采集与目标识别方法,所述方法具体包括以下步骤:
步骤一、利用图像传感器对包含目标的区域进行图像采集;
步骤二、将采集的图像输入给存储器进行存储;
步骤三、利用FPGA控制器从存储器中读取出图像信息,并对读取出的图像信息进行处理,获得处理后图像;
步骤四、对步骤三获得的处理后图像中的目标进行标注,获得标注后的图像;将标注后图像分为训练集图像和测试集图像两部分;
步骤五、将训练集图像输入卷积神经网络模型,利用训练集图像对卷积神经网络模型进行训练,直至损失函数值不再减小或达到设置的最大迭代次数时停止训练,获得训练好的卷积神经网络模型;
步骤六、利用测试集图像对训练好的卷积神经网络模型进行测试,若卷积神经网络模型输出的对测试集的识别准确率大于等于95%,则将训练好的卷积神经网络模型作为最终的卷积神经网络模型用于待测图像的识别;
若卷积神经网络模型输出的对测试集的识别准确率小于95%,则调整卷积神经网络模型的模型参数,重复执行步骤五和步骤六的过程,直至卷积神经网络模型输出的对测试集的识别准确率大于等于95%,获得最终的卷积神经网络模型;
步骤七、对于待测图像,采用步骤二至步骤四的方法对图像进行预处理,获得预处理后的图像,再将预处理后的图像输入步骤六获得的最终卷积神经网络模型,根据最终卷积神经网络模型的输出结果判断待测图像中是否包含目标。
本发明的有益效果是:本发明的一种基于FPGA和卷积神经网络的图像采集与目标识别方法,本发明将采集的图像分为训练集和测试集两部分,利用训练集对卷积神经网络模型进行训练,利用测试集对训练好的卷积神经网络模型进行测试,通过不断的循环训练,最终获得训练好的卷积神经网络模型。再利用训练好的卷积神经网络模型对待测图像进行处理,根据模型的输出判断待测图像中是否包含目标。采用本发明方法获得的训练好的卷积神经网络模型,可以将图像中目标识别的准确率提升至96%以上。
附图说明
图1是本发明的一种基于FPGA和卷积神经网络的图像采集与目标识别方法的流程图。
具体实施方式
具体实施方式一:如图1所示,本实施方式所述的一种基于FPGA和卷积神经网络的图像采集与目标识别方法,该方法包括以下步骤:
步骤一、利用图像传感器对包含目标的区域进行图像采集;
步骤二、将采集的图像输入给存储器进行存储;
步骤三、利用FPGA控制器从存储器中读取出图像信息,并对读取出的图像信息进行处理,获得处理后图像;
步骤四、对步骤三获得的处理后图像中的目标进行标注,获得标注后的图像;将标注后图像分为训练集图像和测试集图像两部分;
步骤五、将训练集图像输入卷积神经网络模型,利用训练集图像对卷积神经网络模型进行训练,直至损失函数值不再减小或达到设置的最大迭代次数时停止训练,获得训练好的卷积神经网络模型;
步骤六、利用测试集图像对训练好的卷积神经网络模型进行测试,若卷积神经网络模型输出的对测试集的识别准确率大于等于95%,则将训练好的卷积神经网络模型作为最终的卷积神经网络模型用于待测图像的识别;
若卷积神经网络模型输出的对测试集的识别准确率小于95%,则调整卷积神经网络模型的模型参数,重复执行步骤五和步骤六的过程,直至卷积神经网络模型输出的对测试集的识别准确率大于等于95%,获得最终的卷积神经网络模型;
步骤七、对于待测图像,采用步骤二至步骤四的方法对图像进行预处理,获得预处理后的图像,再将预处理后的图像输入步骤六获得的最终卷积神经网络模型,根据最终卷积神经网络模型的输出结果判断待测图像中是否包含目标。
本实施方式中的FPGA控制器包括采样控制单元、存储器控制单元和滤波单元:
所述采样控制单元与图像传感器相连接,用于采集图像传感器发出的图像信息;
所述存储器控制单元与存储器相连接,用于控制存储器的工作状态,并从存储器中读取图像信息;
所述滤波单元用于对读取出的图像信息进行滤波处理。
本发明中采用的损失函数的具体形式为:
对于一张图像中的任意一个像素点,该像素点的损失值CE(p,y)为:
CE(p,y)=-log(pt)
其中:y代表该像素点的真实类别,p代表该像素点预测为类别y的概率;
将一张图像中的全部像素点的损失值做和,得到总损失值,在训练过程中,当总损失值不再减小时,获得训练好的卷积神经网络模型。
而且,通过本发明的步骤一至步骤三的图像采集和处理过程,可以大大加快图像的采集和处理速度,提高图像中目标识别的效率。
本发明可以应用于电力系统图像中是否包含某种元器件的检测。
具体实施方式二:本实施方式与具体实施方式一不同的是:所述利用FPGA控制器从存储器中读取出图像信息,并对读取出的图像信息进行处理,获得处理后图像;其具体过程为:
利用FPGA控制器从存储器中读取出图像信息,并对读取出的图像信息进行滤波处理,获得滤波处理后图像。
具体实施方式三:本实施方式与具体实施方式二不同的是:所述步骤四中对步骤三获得的处理后图像中的目标进行标注,获得标注后的图像,其中:标注后的图像分为包含目标的图像与不包含目标的图像两类。
其中:图像中目标区域的类别被标注为1,非目标区域的类别被标注为0。
具体实施方式四:本实施方式与具体实施方式三不同的是:所述最大迭代次数的取值为15000次。
本实施方式的目的是确保获得的卷积神经网络模型的预测准确率。
具体实施方式五:本实施方式与具体实施方式四不同的是:所述卷积神经网络模型为CNN分类模型。
具体实施方式六:本实施方式与具体实施方式一、二、三、四或五不同的是:所述步骤六中调整卷积神经网络模型的模型参数,是指调整学习率和dropout参数的值。
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。
Claims (6)
1.一种基于FPGA和卷积神经网络的图像采集与目标识别方法,其特征在于,所述方法具体包括以下步骤:
步骤一、利用图像传感器对包含目标的区域进行图像采集;
步骤二、将采集的图像输入给存储器进行存储;
步骤三、利用FPGA控制器从存储器中读取出图像信息,并对读取出的图像信息进行处理,获得处理后图像;
步骤四、对步骤三获得的处理后图像中的目标进行标注,获得标注后的图像;将标注后图像分为训练集图像和测试集图像两部分;
步骤五、将训练集图像输入卷积神经网络模型,利用训练集图像对卷积神经网络模型进行训练,直至损失函数值不再减小或达到设置的最大迭代次数时停止训练,获得训练好的卷积神经网络模型;
步骤六、利用测试集图像对训练好的卷积神经网络模型进行测试,若卷积神经网络模型输出的对测试集的识别准确率大于等于95%,则将训练好的卷积神经网络模型作为最终的卷积神经网络模型用于待测图像的识别;
若卷积神经网络模型输出的对测试集的识别准确率小于95%,则调整卷积神经网络模型的模型参数,重复执行步骤五和步骤六的过程,直至卷积神经网络模型输出的对测试集的识别准确率大于等于95%,获得最终的卷积神经网络模型;
步骤七、对于待测图像,采用步骤二至步骤四的方法对图像进行预处理,获得预处理后的图像,再将预处理后的图像输入步骤六获得的最终卷积神经网络模型,根据最终卷积神经网络模型的输出结果判断待测图像中是否包含目标。
2.根据权利要求1所述的一种基于FPGA和卷积神经网络的图像采集与目标识别方法,其特征在于,所述利用FPGA控制器从存储器中读取出图像信息,并对读取出的图像信息进行处理,获得处理后图像;其具体过程为:
利用FPGA控制器从存储器中读取出图像信息,并对读取出的图像信息进行滤波处理,获得滤波处理后图像。
3.根据权利要求2所述的一种基于FPGA和卷积神经网络的图像采集与目标识别方法,其特征在于,所述步骤四中对步骤三获得的处理后图像中的目标进行标注,获得标注后的图像,其中:标注后的图像分为包含目标的图像与不包含目标的图像两类。
4.根据权利要求3所述的一种基于FPGA和卷积神经网络的图像采集与目标识别方法,其特征在于,所述最大迭代次数的取值为15000次。
5.根据权利要求4所述的一种基于FPGA和卷积神经网络的图像采集与目标识别方法,其特征在于,所述卷积神经网络模型为CNN分类模型。
6.根据权利要求1至5中任意一项权利要求所述的一种基于FPGA和卷积神经网络的图像采集与目标识别方法,其特征在于,所述步骤六中调整卷积神经网络模型的模型参数,是指调整学习率和dropout参数的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910717714.7A CN110458079A (zh) | 2019-08-05 | 2019-08-05 | 一种基于fpga和卷积神经网络的图像采集与目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910717714.7A CN110458079A (zh) | 2019-08-05 | 2019-08-05 | 一种基于fpga和卷积神经网络的图像采集与目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110458079A true CN110458079A (zh) | 2019-11-15 |
Family
ID=68484912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910717714.7A Pending CN110458079A (zh) | 2019-08-05 | 2019-08-05 | 一种基于fpga和卷积神经网络的图像采集与目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110458079A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111796180A (zh) * | 2020-06-23 | 2020-10-20 | 广西电网有限责任公司电力科学研究院 | 一种高压开关机械故障的自动识别方法及装置 |
CN112926368A (zh) * | 2019-12-06 | 2021-06-08 | 北京京东乾石科技有限公司 | 一种识别障碍物的方法和装置 |
CN113688887A (zh) * | 2021-08-13 | 2021-11-23 | 百度在线网络技术(北京)有限公司 | 图像识别模型的训练与图像识别方法、装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009525A (zh) * | 2017-12-25 | 2018-05-08 | 北京航空航天大学 | 一种基于卷积神经网络的无人机对地特定目标识别方法 |
CN108229379A (zh) * | 2017-12-29 | 2018-06-29 | 广东欧珀移动通信有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN108304807A (zh) * | 2018-02-02 | 2018-07-20 | 北京华纵科技有限公司 | 一种基于fpga平台和深度学习的轨道异物检测方法及系统 |
CN108830195A (zh) * | 2018-05-31 | 2018-11-16 | 西安电子科技大学 | 基于现场可编程门阵列fpga的图像分类方法 |
CN109447071A (zh) * | 2018-11-01 | 2019-03-08 | 博微太赫兹信息科技有限公司 | 一种基于fpga和深度学习的毫米波成像危险物品检测方法 |
-
2019
- 2019-08-05 CN CN201910717714.7A patent/CN110458079A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009525A (zh) * | 2017-12-25 | 2018-05-08 | 北京航空航天大学 | 一种基于卷积神经网络的无人机对地特定目标识别方法 |
CN108229379A (zh) * | 2017-12-29 | 2018-06-29 | 广东欧珀移动通信有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN108304807A (zh) * | 2018-02-02 | 2018-07-20 | 北京华纵科技有限公司 | 一种基于fpga平台和深度学习的轨道异物检测方法及系统 |
CN108830195A (zh) * | 2018-05-31 | 2018-11-16 | 西安电子科技大学 | 基于现场可编程门阵列fpga的图像分类方法 |
CN109447071A (zh) * | 2018-11-01 | 2019-03-08 | 博微太赫兹信息科技有限公司 | 一种基于fpga和深度学习的毫米波成像危险物品检测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926368A (zh) * | 2019-12-06 | 2021-06-08 | 北京京东乾石科技有限公司 | 一种识别障碍物的方法和装置 |
CN112926368B (zh) * | 2019-12-06 | 2024-01-16 | 北京京东乾石科技有限公司 | 一种识别障碍物的方法和装置 |
CN111796180A (zh) * | 2020-06-23 | 2020-10-20 | 广西电网有限责任公司电力科学研究院 | 一种高压开关机械故障的自动识别方法及装置 |
CN113688887A (zh) * | 2021-08-13 | 2021-11-23 | 百度在线网络技术(北京)有限公司 | 图像识别模型的训练与图像识别方法、装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543606B (zh) | 一种加入注意力机制的人脸识别方法 | |
Budiharto et al. | Fast object detection for quadcopter drone using deep learning | |
Chen et al. | Underwater image enhancement based on deep learning and image formation model | |
CN110458079A (zh) | 一种基于fpga和卷积神经网络的图像采集与目标识别方法 | |
CN108985252B (zh) | 改进的脉冲深度神经网络的图像分类方法 | |
CN108875821A (zh) | 分类模型的训练方法和装置、移动终端、可读存储介质 | |
CN108197569A (zh) | 障碍物识别方法、装置、计算机存储介质和电子设备 | |
CN111444917A (zh) | 车牌字符识别方法、装置、电子设备和存储介质 | |
CN111199217B (zh) | 一种基于卷积神经网络的交通标志识别方法和系统 | |
CN110956082B (zh) | 基于深度学习的人脸关键点检测方法和检测系统 | |
CN110175615B (zh) | 模型训练方法、域自适应的视觉位置识别方法及装置 | |
Wang | Research towards yolo-series algorithms: Comparison and analysis of object detection models for real-time UAV applications | |
CN111640101A (zh) | 基于Ghost卷积特征融合神经网络实时车流量检测系统及方法 | |
CN105046197A (zh) | 基于聚类的多模板行人检测方法 | |
CN111488901B (zh) | 在cnn中从多个模块内的输入图像提取特征的方法及装置 | |
CN106991428A (zh) | 基于自适应池化模型的害虫图像识别方法 | |
CN109961013A (zh) | 车道线的识别方法、装置、设备及计算机可读存储介质 | |
CN106919902A (zh) | 一种基于cnn的车辆识别和轨迹追踪方法 | |
CN106529441B (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
CN115880558A (zh) | 农事行为检测方法、装置、电子设备及存储介质 | |
EP3671635B1 (en) | Curvilinear object segmentation with noise priors | |
Dong et al. | A vision-based method for improving the safety of self-driving | |
CN115115973A (zh) | 一种基于多感受野与深度特征的弱小目标检测方法 | |
CN110390381A (zh) | 利用卷积神经网络来处理数据序列的装置和方法 | |
Liu et al. | Implementation System of Human Eye Tracking Algorithm Based on FPGA. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |