CN109766999A - 一种优化多要素识别类别混淆的方法 - Google Patents
一种优化多要素识别类别混淆的方法 Download PDFInfo
- Publication number
- CN109766999A CN109766999A CN201910038724.8A CN201910038724A CN109766999A CN 109766999 A CN109766999 A CN 109766999A CN 201910038724 A CN201910038724 A CN 201910038724A CN 109766999 A CN109766999 A CN 109766999A
- Authority
- CN
- China
- Prior art keywords
- convolutional layer
- receptive field
- neural network
- element identification
- optimizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明涉及一种优化多要素识别类别混淆的方法,该方法是神经网络在通过卷积层提取图像特征时,扩大所述卷积层的感受野。通过扩大卷积层的感受野,使得特征提取的区域越大,提取到的特征越多,要素识别越不容易混淆,继而可以优化要素识别类别混淆的问题。
Description
技术领域
本发明涉及图像识别技术领域,特别涉及一种优化多要素识别类别混淆的方法。
背景技术
近年来,随着深度学习的逐渐发展,卷积神经网络在计算机视觉领域得到了广泛的应用,包括目标检测、图象语义分割等方面。例如,路面要素识别。路面要素包括车道线、车辆、道路以及其他物体,其中车道线又分为多种类别的车道线,包括但不限于车道线虚线、车道线实线、公交车道线等。在现有的路面要素识别技术中,是将所有的线全部划为一类,即车道线,然而这样划分方式相对比较粗略,例如不能将普通车道线与公交车道线相区分,导致无法为例如无人驾驶应用提供准确的导航引导。如果要将道路线要素进行准确的划分,那么将会导致要素类别很多,容易导致分类混淆,因为神经网络去预测物体所属分类时,加入分类数目是n类,神经网络会给出属于每个分类的概率,所有分类的概率加起来是1,因此分类越多,混淆的概率越大。
发明内容
本发明的目的在于改善现有技术中所存在的多要素识别时类别容易混淆的不足,提供一种优化多要素识别类别混淆的方法及装置。
为了实现上述发明目的,本发明实施例提供了一种优化多要素识别类别混淆的方法,该方法是:神经网络在通过卷积层提取图像特征时,扩大所述卷积层的感受野。
作为一种实施方式,神经网络通过增大输入层的输入图像尺寸的方式扩大卷积层的感受野。
作为另一种实施方式,神经网络通过增加卷积层的卷积核的大小的方式扩大卷积层的感受野。
作为另一种实施方式,神经网络通过采用空洞卷积的方式扩大卷积层的感受野。
与现有技术相比,本发明方法通过扩大卷积层的感受野,使得特征提取的区域越大,提取到的特征越多,要素识别越不容易混淆,继而可以优化要素识别类别混淆的问题,为进行更准确地要素识别提供技术支持。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例中提供了一种优化多要素识别类别混淆的方法,该方法是神经网络在通过卷积层提取图像特征时,扩大所述卷积层的感受野,为神经网络的卷积层提供更大范围的图片作为特征提取的来源。
扩大所述卷积层的感受野的实施方式可以有多种,例如神经网络通过增大输入层的输入图像尺寸的方式扩大卷积层的感受野;又例如,神经网络通过增加卷积层的卷积核的大小的方式扩大卷积层的感受野;又或者,神经网络通过采用空洞卷积(或称为扩展卷积,或扩张卷积)的方式扩大卷积层的感受野。当然地,不同的实施方式也可以同时采用,以进一步增大卷积层的感受野。
通过扩大卷积核的方式扩大卷积层的感受野时,例如可以将卷积核扩大到 3,甚至扩大到5或者7。理论上卷积核越大越好,卷积核越大,代表卷积提取到的特征越多,一个像素代表原图多个像素提取到的信息。但是卷积核越大,计算量就越大,为了兼顾计算量与感受野,即在保障感受野足够大(要素识别不混淆)的同时降低运算量,可以通过多个相对较小卷积核实现一个较大卷积核,例如将一个7*7的卷积,换成3个3*3的卷积。
通过增大输入层的输入图像尺寸的方式扩大卷积层的感受野时,例如可以设定输入图像尺寸的高*宽为400*400~600*600。输入图像尺寸大小是越大越好,输入图像越大,上采样时就会越精确。例如原始图像大小是1000*1000,若输入图像大小是200*200,那么上采样时,从200*200上采样到1000*1000,那么一个像素就相当于了5个像素,但如果输入图像是400*400,往回上采样时一个像素就相当于2.5个像素,因此提取到的特征数据来更精确。
识别类别混淆问题是由于神经网络感受野范围内的信息较为匮乏,这种情况在离镜头越近的区域,影响越明显。因为对于相同大小的感受野,离镜头越近,感受野范围内的信息越匮乏,可能仅剩下路面以及很少的车道线,无法准确预测识别该车道线的正确语义。通过本发明方法神经网络可以提取到更丰富的上下文信息,继而可以更加准确的预测识别得到正确的类别。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种优化多要素识别类别混淆的方法,其特征在于,神经网络在通过卷积层提取图像特征时,扩大所述卷积层的感受野。
2.根据权利要求1所述的方法,其特征在于,神经网络通过增大输入层的输入图像尺寸的方式扩大卷积层的感受野。
3.根据权利要求1所述的方法,其特征在于,神经网络通过增加卷积层的卷积核的大小的方式扩大卷积层的感受野。
4.根据权利要求1所述的方法,其特征在于,神经网络通过采用空洞卷积的方式扩大卷积层的感受野。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910038724.8A CN109766999A (zh) | 2019-01-16 | 2019-01-16 | 一种优化多要素识别类别混淆的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910038724.8A CN109766999A (zh) | 2019-01-16 | 2019-01-16 | 一种优化多要素识别类别混淆的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109766999A true CN109766999A (zh) | 2019-05-17 |
Family
ID=66454015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910038724.8A Pending CN109766999A (zh) | 2019-01-16 | 2019-01-16 | 一种优化多要素识别类别混淆的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109766999A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110533022A (zh) * | 2019-06-11 | 2019-12-03 | 广州海昇教育科技有限责任公司 | 一种目标检测方法、系统、装置及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120023051A1 (en) * | 2010-07-22 | 2012-01-26 | Ramin Pishehvar | Signal coding with adaptive neural network |
CN107341548A (zh) * | 2017-06-26 | 2017-11-10 | 北京深度奇点科技有限公司 | 一种数据处理方法、装置及电子设备 |
CN108805284A (zh) * | 2018-05-23 | 2018-11-13 | 哈尔滨工业大学深圳研究生院 | 一种卷积神经网络感受野量化的方法及其应用 |
CN109145730A (zh) * | 2018-07-13 | 2019-01-04 | 安徽大学 | 一种遥感影像中矿区自动语义分割方法 |
CN109214406A (zh) * | 2018-05-16 | 2019-01-15 | 长沙理工大学 | 基于D-MobileNet神经网络图像分类方法 |
-
2019
- 2019-01-16 CN CN201910038724.8A patent/CN109766999A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120023051A1 (en) * | 2010-07-22 | 2012-01-26 | Ramin Pishehvar | Signal coding with adaptive neural network |
CN107341548A (zh) * | 2017-06-26 | 2017-11-10 | 北京深度奇点科技有限公司 | 一种数据处理方法、装置及电子设备 |
CN109214406A (zh) * | 2018-05-16 | 2019-01-15 | 长沙理工大学 | 基于D-MobileNet神经网络图像分类方法 |
CN108805284A (zh) * | 2018-05-23 | 2018-11-13 | 哈尔滨工业大学深圳研究生院 | 一种卷积神经网络感受野量化的方法及其应用 |
CN109145730A (zh) * | 2018-07-13 | 2019-01-04 | 安徽大学 | 一种遥感影像中矿区自动语义分割方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110533022A (zh) * | 2019-06-11 | 2019-12-03 | 广州海昇教育科技有限责任公司 | 一种目标检测方法、系统、装置及存储介质 |
CN110533022B (zh) * | 2019-06-11 | 2023-12-19 | 广州海昇教育科技有限责任公司 | 一种目标检测方法、系统、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108549893B (zh) | 一种任意形状的场景文本端到端识别方法 | |
US11232318B2 (en) | Methods and apparatuses for vehicle appearance feature recognition, methods and apparatuses for vehicle retrieval, storage medium, and electronic devices | |
KR102140340B1 (ko) | 컨볼루션 뉴럴 네트워크를 통해 이미지 위변조를 탐지하는 시스템 및 이를 이용하여 무보정 탐지 서비스를 제공하는 방법 | |
CN108960266B (zh) | 图像目标检测方法及装置 | |
CN110276342B (zh) | 车牌辨识方法以及其系统 | |
US9569855B2 (en) | Apparatus and method for extracting object of interest from image using image matting based on global contrast | |
CN110598788B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN112528976B (zh) | 文本检测模型的生成方法和文本检测方法 | |
Avramović et al. | Neural-network-based traffic sign detection and recognition in high-definition images using region focusing and parallelization | |
CN112997190B (zh) | 车牌识别方法、装置及电子设备 | |
US8965115B1 (en) | Adaptive multi-modal detection and fusion in videos via classification-based-learning | |
CN111461039B (zh) | 基于多尺度特征融合的地标识别方法 | |
CN114359851A (zh) | 无人驾驶目标检测方法、装置、设备及介质 | |
US8836812B2 (en) | Image processing device, image processing method, and image processing program | |
US11132576B2 (en) | Text recognition method and apparatus, electronic device, and storage medium | |
CN110491132A (zh) | 基于视频帧图片分析的车辆违停检测方法及装置 | |
CN112287983B (zh) | 一种基于深度学习的遥感图像目标提取系统和方法 | |
CN111127516A (zh) | 无搜索框的目标检测和跟踪方法及系统 | |
CN110008900A (zh) | 一种由区域到目标的可见光遥感图像候选目标提取方法 | |
EP2447884A1 (en) | Method for detecting and recognising an object in an image, and an apparatus and a computer program therefor | |
CN110738238A (zh) | 一种证件信息的分类定位方法及装置 | |
CN110991447A (zh) | 基于深度学习的列车车号精确定位与识别方法 | |
Asgarian Dehkordi et al. | Vehicle type recognition based on dimension estimation and bag of word classification | |
Liang et al. | Car detection and classification using cascade model | |
CN107170004B (zh) | 一种无人车单目视觉定位中对匹配矩阵的图像匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190517 |
|
RJ01 | Rejection of invention patent application after publication |