CN112598013A - 基于神经网络的计算机视觉处理方法 - Google Patents
基于神经网络的计算机视觉处理方法 Download PDFInfo
- Publication number
- CN112598013A CN112598013A CN202011611741.5A CN202011611741A CN112598013A CN 112598013 A CN112598013 A CN 112598013A CN 202011611741 A CN202011611741 A CN 202011611741A CN 112598013 A CN112598013 A CN 112598013A
- Authority
- CN
- China
- Prior art keywords
- video data
- neural network
- gray
- lbp
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 17
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000003062 neural network model Methods 0.000 claims abstract description 21
- 238000010606 normalization Methods 0.000 claims abstract description 15
- 230000000007 visual effect Effects 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000013507 mapping Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005286 illumination Methods 0.000 abstract description 13
- 230000008447 perception Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及计算机视觉技术领域,公开了基于神经网络的计算机视觉处理方法,将获取的视频数据进行灰度处理,转化成单帧灰度图像,将灰度图像归一化处理后,采用LBP算法获得LBP纹理特征;以LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型,对后续的视频数据进行识别、处理。本发明通过对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。
Description
技术领域
本发明涉及计算机视觉技术领域,具体涉及基于神经网络的计算机视觉处理方法。
背景技术
人工智能的完整闭环包括感知、认知、推理再反馈到感知的过程,其中视觉在我们的感知系统中占据大部分的感知过程。计算机视觉(Computer Vision)是指用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解。这意味着计算机视觉技术的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。因此不仅需要使机器能感知三维环境中物体的几何信息,如形状、位置、姿态、运动情况等,而且能对它们进行描述、存储、识别与理解。而计算机视觉与人类或动物的视觉是不同的:它是在通过机器对物体进行感知后,借助于几何、物理和学习技术来构筑算法模型,用统计的方法来处理数据。
由于机器在对物体感知时,同一物体在不同时间、不同光照下采集到的图像在灰度分布上可能存在着很大的差异,图像的灰度分布很不集中,这些将直接影响到后续的特征提取和识别,因此要对手背静脉图像进行灰度归一化就是容易受到光照变化或阴影的影响。因此,在进行图像处理过程中,通常会对RGB进行归一化,以便消除其对部分光照的影响。
发明内容
基于以上问题,本发明提供基于神经网络的计算机视觉处理方法,本发明通过对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。
为实现上述技术效果,本发采用了以下技术方案:
一种基于神经网络的计算机视觉处理方法,包括如下步骤:
S1、获取计算机视觉视频数据,然后将视频数据进行灰度处理,转化成单帧灰度图像;
S2、对各单帧的灰度图像进行归一化处理,并将归一化处理后的每帧灰度图像转化成灰度矩阵;
S3、以灰度矩阵中的每一个像素点为中心点,采用LBP算法对归一化后的图像进行特征提取,获得灰度图像的LBP纹理特征;
S4、根据先验知识对视觉视频数据添加类别标签,然后通过将每一帧灰度图像的LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型;
S5、利用BP神经网络模型对后续的视频数据进行识别、处理。
进一步地,步骤S2中的灰度图像归一化处理公式为:
式中,I(i,j)和N(i,j)分别表示原图像的灰度值、变换后图像的灰度值,min和max分别表示原图像的最小灰度值、最大灰度值。
进一步地,步骤S3中LBP算法的具体方法为:
A1、将中心点对应的灰度值与相邻的8个像素点的灰度值进行比较,若周围像素的灰度值大于中心像素的灰度值,则该像素点的位置被标记为1,否则为0;
A2、对于该中心点像素3*3邻域内的8个点经比较产生的8位二进制数,即得到该窗口中心灰度元素点的LBP值;
A3、将得到的窗口中心像素点的LBP值赋给该中心点,然后计算每个中心点的直方图,最后将得到的每中心点的统计直方图进行连接,得到灰度图像的LBP纹理特征。
进一步地,步骤S5中对后续视频数据处理后,将后续视频数据再按S1-S3的步骤获得的后续视频数据的LBP纹理特征作为输入对BP神经网络模型进行在线更新训练,获得更新后的BP神经网络模型。
与现有技术相比,本发明的有益效果是:
1.本发明通过对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。
2.本发明利用后续视频数据对构建的BP神经网络模型进行在线更新训练,实时获得更新后的BP神经网络模型,使计算机视觉的识别、处理效果更精确。
附图说明
图1为实施例中基于神经网络的计算机视觉处理方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例:
参见图1,一种基于神经网络的计算机视觉处理方法,包括如下步骤:
S1、获取计算机视觉视频数据,然后将视频数据进行灰度处理,转化成单帧灰度图像;
S2、对各单帧的灰度图像进行归一化处理,并将归一化处理后的每帧灰度图像转化成灰度矩阵;本实施例中的灰度图像归一化处理公式为:
式中,I(i,j)和N(i,j)分别表示原图像的灰度值、变换后图像的灰度值,min和max分别表示原图像的最小灰度值、最大灰度值。通过该方法将图像扩展到256个灰度级,规避了由于采集图像时的光照等因素的影响导致图像的灰度级集中在一个或者几个灰度级区段的问题,从而消除不同光照对图像的影响。
S3、以灰度矩阵中的每一个像素点为中心点,采用LBP算法对归一化后的图像进行特征提取,获得灰度图像的LBP纹理特征;本实施例中LBP算法的具体方法为:
A1、将中心点对应的灰度值与相邻的8个像素点的灰度值进行比较,若周围像素的灰度值大于中心像素的灰度值,则该像素点的位置被标记为1,否则为0;
A2、对于该中心点像素3*3邻域内的8个点经比较产生的8位二进制数,即得到该窗口中心灰度元素点的LBP值;
A3、将得到的窗口中心像素点的LBP值赋给该中心点,然后计算每个中心点的直方图,最后将得到的每中心点的统计直方图进行连接,得到灰度图像的LBP纹理特征。
S4、根据先验知识对视觉视频数据添加类别标签,然后通过将每一帧灰度图像的LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型;
S5、利用BP神经网络模型对后续的视频数据进行识别、处理。
在本实施例中,根据先验知识获取视觉图像的类别标签,视觉图像转化成灰度图像后,对灰度图像进行进行归一化处理,通过LBP特征提取算法灰度图像中的纹理特征;在将LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型,利用训练得到的BP神经网络模型对对后续的视频数据进行识别、处理;因本实施例中对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。
步骤S5中对后续视频数据处理后,将后续视频数据再按S1-S3的步骤获得的后续视频数据的LBP纹理特征作为输入对BP神经网络模型进行在线更新训练,获得更新后的BP神经网络模型。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (4)
1.基于神经网络的计算机视觉处理方法,其特征在于,包括如下步骤:
S1、获取计算机视觉视频数据,然后将视频数据进行灰度处理,转化成单帧灰度图像;
S2、对各单帧的灰度图像进行归一化处理,并将归一化处理后的每帧灰度图像转化成灰度矩阵;
S3、以灰度矩阵中的每一个像素点为中心点,采用LBP算法对归一化后的图像进行特征提取,获得灰度图像的LBP纹理特征;
S4、根据先验知识对视觉视频数据添加类别标签,然后通过将每一帧灰度图像的LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型;
S5、利用BP神经网络模型对后续的视频数据进行识别、处理。
2.根据权利要求1所述的基于神经网络的计算机视觉处理方法,其特征在于:步骤S2中的灰度图像归一化处理公式为:
式中,I(i,j)和N(i,j)分别表示原图像的灰度值、变换后图像的灰度值,min和max分别表示原图像的最小灰度值、最大灰度值。
3.根据权利要求2所述的基于神经网络的计算机视觉处理方法,其特征在于:步骤S3中LBP算法的具体方法为:
A1、将中心点对应的灰度值与相邻的8个像素点的灰度值进行比较,若周围像素的灰度值大于中心像素的灰度值,则该像素点的位置被标记为1,否则为0;
A2、对于该中心点像素3*3邻域内的8个点经比较产生的8位二进制数,即得到该窗口中心灰度元素点的LBP值;
A3、将得到的窗口中心像素点的LBP值赋给该中心点,然后计算每个中心点的直方图,最后将得到的每中心点的统计直方图进行连接,得到灰度图像的LBP纹理特征。
4.根据权利要求1-3任意一项所述的基于神经网络的计算机视觉处理方法,其特征在于,步骤S5中对后续视频数据处理后,将后续视频数据再按S1-S3的步骤获得的后续视频数据的LBP纹理特征作为输入对BP神经网络模型进行在线更新训练,获得更新后的BP神经网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011611741.5A CN112598013A (zh) | 2020-12-30 | 2020-12-30 | 基于神经网络的计算机视觉处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011611741.5A CN112598013A (zh) | 2020-12-30 | 2020-12-30 | 基于神经网络的计算机视觉处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112598013A true CN112598013A (zh) | 2021-04-02 |
Family
ID=75206204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011611741.5A Pending CN112598013A (zh) | 2020-12-30 | 2020-12-30 | 基于神经网络的计算机视觉处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112598013A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114429618A (zh) * | 2022-01-06 | 2022-05-03 | 电子科技大学 | 一种基于改进AlexNet网络模型的拥堵识别方法 |
CN115019159A (zh) * | 2022-08-09 | 2022-09-06 | 济宁安泰矿山设备制造有限公司 | 一种泵轴承故障快速识别方法 |
CN118380158A (zh) * | 2024-04-18 | 2024-07-23 | 重庆市铂而斐细胞生物技术有限公司 | 矽肺动物模型间充质干细胞实验数据分析方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490194A (zh) * | 2019-07-24 | 2019-11-22 | 广东工业大学 | 一种自适应权值的多特征分块融合交通标志的识别方法 |
-
2020
- 2020-12-30 CN CN202011611741.5A patent/CN112598013A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490194A (zh) * | 2019-07-24 | 2019-11-22 | 广东工业大学 | 一种自适应权值的多特征分块融合交通标志的识别方法 |
Non-Patent Citations (1)
Title |
---|
徐镇: "基于LBP和CNN的人脸识别算法研究", 《中国学位论文全文数据库》, pages 3 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114429618A (zh) * | 2022-01-06 | 2022-05-03 | 电子科技大学 | 一种基于改进AlexNet网络模型的拥堵识别方法 |
CN115019159A (zh) * | 2022-08-09 | 2022-09-06 | 济宁安泰矿山设备制造有限公司 | 一种泵轴承故障快速识别方法 |
CN115019159B (zh) * | 2022-08-09 | 2022-10-25 | 济宁安泰矿山设备制造有限公司 | 一种泵轴承故障快速识别方法 |
CN118380158A (zh) * | 2024-04-18 | 2024-07-23 | 重庆市铂而斐细胞生物技术有限公司 | 矽肺动物模型间充质干细胞实验数据分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109255364B (zh) | 一种基于深度卷积生成对抗网络的场景识别方法 | |
CN108256562B (zh) | 基于弱监督时空级联神经网络的显著目标检测方法及系统 | |
US10019655B2 (en) | Deep-learning network architecture for object detection | |
CN112598013A (zh) | 基于神经网络的计算机视觉处理方法 | |
US10445602B2 (en) | Apparatus and method for recognizing traffic signs | |
CN109002755B (zh) | 基于人脸图像的年龄估计模型构建方法及估计方法 | |
CN111862119A (zh) | 基于Mask-RCNN的语义信息提取方法 | |
CN111191583A (zh) | 基于卷积神经网络的空间目标识别系统及方法 | |
CN112085024A (zh) | 一种罐表面字符识别方法 | |
CN110222572A (zh) | 跟踪方法、装置、电子设备及存储介质 | |
CN113435335B (zh) | 微观表情识别方法、装置、电子设备及存储介质 | |
CN116843581B (zh) | 一种多场景图的图像增强方法、系统、设备和存储介质 | |
CN112541491A (zh) | 基于图像字符区域感知的端到端文本检测及识别方法 | |
CN113269182A (zh) | 一种基于变体transformer对小区域敏感的目标果实检测方法及系统 | |
CN115527072A (zh) | 一种基于稀疏空间感知与元学习的芯片表面缺陷检测方法 | |
CN114626476A (zh) | 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置 | |
CN110610131B (zh) | 人脸运动单元的检测方法、装置、电子设备及存储介质 | |
CN107274425B (zh) | 一种基于脉冲耦合神经网络的彩色图像分割方法及装置 | |
CN115984930A (zh) | 微表情识别方法、装置、微表情识别模型的训练方法 | |
CN110197721B (zh) | 基于深度学习的肌腱状况评估方法、装置及存储介质 | |
CN113223037B (zh) | 一种面向大规模数据的无监督语义分割方法及系统 | |
CN117437691A (zh) | 一种基于轻量化网络的实时多人异常行为识别方法及系统 | |
CN111553437A (zh) | 一种基于神经网络图像分类方法 | |
CN114255203B (zh) | 一种鱼苗数量估计方法及系统 | |
CN114419529A (zh) | 一种基于分布空间对齐的跨模态行人再识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210402 |
|
RJ01 | Rejection of invention patent application after publication |