CN112598013A - 基于神经网络的计算机视觉处理方法 - Google Patents

基于神经网络的计算机视觉处理方法 Download PDF

Info

Publication number
CN112598013A
CN112598013A CN202011611741.5A CN202011611741A CN112598013A CN 112598013 A CN112598013 A CN 112598013A CN 202011611741 A CN202011611741 A CN 202011611741A CN 112598013 A CN112598013 A CN 112598013A
Authority
CN
China
Prior art keywords
video data
neural network
gray
lbp
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011611741.5A
Other languages
English (en)
Inventor
陶剑文
何颂颂
但雨芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Polytechnic
Original Assignee
Ningbo Polytechnic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Polytechnic filed Critical Ningbo Polytechnic
Priority to CN202011611741.5A priority Critical patent/CN112598013A/zh
Publication of CN112598013A publication Critical patent/CN112598013A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及计算机视觉技术领域,公开了基于神经网络的计算机视觉处理方法,将获取的视频数据进行灰度处理,转化成单帧灰度图像,将灰度图像归一化处理后,采用LBP算法获得LBP纹理特征;以LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型,对后续的视频数据进行识别、处理。本发明通过对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。

Description

基于神经网络的计算机视觉处理方法
技术领域
本发明涉及计算机视觉技术领域,具体涉及基于神经网络的计算机视觉处理方法。
背景技术
人工智能的完整闭环包括感知、认知、推理再反馈到感知的过程,其中视觉在我们的感知系统中占据大部分的感知过程。计算机视觉(Computer Vision)是指用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解。这意味着计算机视觉技术的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。因此不仅需要使机器能感知三维环境中物体的几何信息,如形状、位置、姿态、运动情况等,而且能对它们进行描述、存储、识别与理解。而计算机视觉与人类或动物的视觉是不同的:它是在通过机器对物体进行感知后,借助于几何、物理和学习技术来构筑算法模型,用统计的方法来处理数据。
由于机器在对物体感知时,同一物体在不同时间、不同光照下采集到的图像在灰度分布上可能存在着很大的差异,图像的灰度分布很不集中,这些将直接影响到后续的特征提取和识别,因此要对手背静脉图像进行灰度归一化就是容易受到光照变化或阴影的影响。因此,在进行图像处理过程中,通常会对RGB进行归一化,以便消除其对部分光照的影响。
发明内容
基于以上问题,本发明提供基于神经网络的计算机视觉处理方法,本发明通过对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。
为实现上述技术效果,本发采用了以下技术方案:
一种基于神经网络的计算机视觉处理方法,包括如下步骤:
S1、获取计算机视觉视频数据,然后将视频数据进行灰度处理,转化成单帧灰度图像;
S2、对各单帧的灰度图像进行归一化处理,并将归一化处理后的每帧灰度图像转化成灰度矩阵;
S3、以灰度矩阵中的每一个像素点为中心点,采用LBP算法对归一化后的图像进行特征提取,获得灰度图像的LBP纹理特征;
S4、根据先验知识对视觉视频数据添加类别标签,然后通过将每一帧灰度图像的LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型;
S5、利用BP神经网络模型对后续的视频数据进行识别、处理。
进一步地,步骤S2中的灰度图像归一化处理公式为:
式中,I(i,j)和N(i,j)分别表示原图像的灰度值、变换后图像的灰度值,min和max分别表示原图像的最小灰度值、最大灰度值。
进一步地,步骤S3中LBP算法的具体方法为:
A1、将中心点对应的灰度值与相邻的8个像素点的灰度值进行比较,若周围像素的灰度值大于中心像素的灰度值,则该像素点的位置被标记为1,否则为0;
A2、对于该中心点像素3*3邻域内的8个点经比较产生的8位二进制数,即得到该窗口中心灰度元素点的LBP值;
A3、将得到的窗口中心像素点的LBP值赋给该中心点,然后计算每个中心点的直方图,最后将得到的每中心点的统计直方图进行连接,得到灰度图像的LBP纹理特征。
进一步地,步骤S5中对后续视频数据处理后,将后续视频数据再按S1-S3的步骤获得的后续视频数据的LBP纹理特征作为输入对BP神经网络模型进行在线更新训练,获得更新后的BP神经网络模型。
与现有技术相比,本发明的有益效果是:
1.本发明通过对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。
2.本发明利用后续视频数据对构建的BP神经网络模型进行在线更新训练,实时获得更新后的BP神经网络模型,使计算机视觉的识别、处理效果更精确。
附图说明
图1为实施例中基于神经网络的计算机视觉处理方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例:
参见图1,一种基于神经网络的计算机视觉处理方法,包括如下步骤:
S1、获取计算机视觉视频数据,然后将视频数据进行灰度处理,转化成单帧灰度图像;
S2、对各单帧的灰度图像进行归一化处理,并将归一化处理后的每帧灰度图像转化成灰度矩阵;本实施例中的灰度图像归一化处理公式为:
式中,I(i,j)和N(i,j)分别表示原图像的灰度值、变换后图像的灰度值,min和max分别表示原图像的最小灰度值、最大灰度值。通过该方法将图像扩展到256个灰度级,规避了由于采集图像时的光照等因素的影响导致图像的灰度级集中在一个或者几个灰度级区段的问题,从而消除不同光照对图像的影响。
S3、以灰度矩阵中的每一个像素点为中心点,采用LBP算法对归一化后的图像进行特征提取,获得灰度图像的LBP纹理特征;本实施例中LBP算法的具体方法为:
A1、将中心点对应的灰度值与相邻的8个像素点的灰度值进行比较,若周围像素的灰度值大于中心像素的灰度值,则该像素点的位置被标记为1,否则为0;
A2、对于该中心点像素3*3邻域内的8个点经比较产生的8位二进制数,即得到该窗口中心灰度元素点的LBP值;
A3、将得到的窗口中心像素点的LBP值赋给该中心点,然后计算每个中心点的直方图,最后将得到的每中心点的统计直方图进行连接,得到灰度图像的LBP纹理特征。
S4、根据先验知识对视觉视频数据添加类别标签,然后通过将每一帧灰度图像的LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型;
S5、利用BP神经网络模型对后续的视频数据进行识别、处理。
在本实施例中,根据先验知识获取视觉图像的类别标签,视觉图像转化成灰度图像后,对灰度图像进行进行归一化处理,通过LBP特征提取算法灰度图像中的纹理特征;在将LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型,利用训练得到的BP神经网络模型对对后续的视频数据进行识别、处理;因本实施例中对灰度图像进行了归一化处理,可以规避同一物体在不同时间、不同光照下采集到的图像在灰度分布差异大、不集中的问题,消除光照的影响对视频数据的影响,提高对图像纹理特征提取和识别精度,为建立精准的BP神经网络模型提供数据基础。
步骤S5中对后续视频数据处理后,将后续视频数据再按S1-S3的步骤获得的后续视频数据的LBP纹理特征作为输入对BP神经网络模型进行在线更新训练,获得更新后的BP神经网络模型。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (4)

1.基于神经网络的计算机视觉处理方法,其特征在于,包括如下步骤:
S1、获取计算机视觉视频数据,然后将视频数据进行灰度处理,转化成单帧灰度图像;
S2、对各单帧的灰度图像进行归一化处理,并将归一化处理后的每帧灰度图像转化成灰度矩阵;
S3、以灰度矩阵中的每一个像素点为中心点,采用LBP算法对归一化后的图像进行特征提取,获得灰度图像的LBP纹理特征;
S4、根据先验知识对视觉视频数据添加类别标签,然后通过将每一帧灰度图像的LBP纹理特征作为输入,视觉视频数据的类别标签作为输出,建立LBP纹理特征与类别标签的映射关系,对BP神经网络进行训练,获得视频数据的BP神经网络模型;
S5、利用BP神经网络模型对后续的视频数据进行识别、处理。
2.根据权利要求1所述的基于神经网络的计算机视觉处理方法,其特征在于:步骤S2中的灰度图像归一化处理公式为:
式中,I(i,j)和N(i,j)分别表示原图像的灰度值、变换后图像的灰度值,min和max分别表示原图像的最小灰度值、最大灰度值。
3.根据权利要求2所述的基于神经网络的计算机视觉处理方法,其特征在于:步骤S3中LBP算法的具体方法为:
A1、将中心点对应的灰度值与相邻的8个像素点的灰度值进行比较,若周围像素的灰度值大于中心像素的灰度值,则该像素点的位置被标记为1,否则为0;
A2、对于该中心点像素3*3邻域内的8个点经比较产生的8位二进制数,即得到该窗口中心灰度元素点的LBP值;
A3、将得到的窗口中心像素点的LBP值赋给该中心点,然后计算每个中心点的直方图,最后将得到的每中心点的统计直方图进行连接,得到灰度图像的LBP纹理特征。
4.根据权利要求1-3任意一项所述的基于神经网络的计算机视觉处理方法,其特征在于,步骤S5中对后续视频数据处理后,将后续视频数据再按S1-S3的步骤获得的后续视频数据的LBP纹理特征作为输入对BP神经网络模型进行在线更新训练,获得更新后的BP神经网络模型。
CN202011611741.5A 2020-12-30 2020-12-30 基于神经网络的计算机视觉处理方法 Pending CN112598013A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011611741.5A CN112598013A (zh) 2020-12-30 2020-12-30 基于神经网络的计算机视觉处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011611741.5A CN112598013A (zh) 2020-12-30 2020-12-30 基于神经网络的计算机视觉处理方法

Publications (1)

Publication Number Publication Date
CN112598013A true CN112598013A (zh) 2021-04-02

Family

ID=75206204

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011611741.5A Pending CN112598013A (zh) 2020-12-30 2020-12-30 基于神经网络的计算机视觉处理方法

Country Status (1)

Country Link
CN (1) CN112598013A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114429618A (zh) * 2022-01-06 2022-05-03 电子科技大学 一种基于改进AlexNet网络模型的拥堵识别方法
CN115019159A (zh) * 2022-08-09 2022-09-06 济宁安泰矿山设备制造有限公司 一种泵轴承故障快速识别方法
CN118380158A (zh) * 2024-04-18 2024-07-23 重庆市铂而斐细胞生物技术有限公司 矽肺动物模型间充质干细胞实验数据分析方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490194A (zh) * 2019-07-24 2019-11-22 广东工业大学 一种自适应权值的多特征分块融合交通标志的识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490194A (zh) * 2019-07-24 2019-11-22 广东工业大学 一种自适应权值的多特征分块融合交通标志的识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐镇: "基于LBP和CNN的人脸识别算法研究", 《中国学位论文全文数据库》, pages 3 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114429618A (zh) * 2022-01-06 2022-05-03 电子科技大学 一种基于改进AlexNet网络模型的拥堵识别方法
CN115019159A (zh) * 2022-08-09 2022-09-06 济宁安泰矿山设备制造有限公司 一种泵轴承故障快速识别方法
CN115019159B (zh) * 2022-08-09 2022-10-25 济宁安泰矿山设备制造有限公司 一种泵轴承故障快速识别方法
CN118380158A (zh) * 2024-04-18 2024-07-23 重庆市铂而斐细胞生物技术有限公司 矽肺动物模型间充质干细胞实验数据分析方法及系统

Similar Documents

Publication Publication Date Title
CN109255364B (zh) 一种基于深度卷积生成对抗网络的场景识别方法
CN108256562B (zh) 基于弱监督时空级联神经网络的显著目标检测方法及系统
US10019655B2 (en) Deep-learning network architecture for object detection
CN112598013A (zh) 基于神经网络的计算机视觉处理方法
US10445602B2 (en) Apparatus and method for recognizing traffic signs
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN111862119A (zh) 基于Mask-RCNN的语义信息提取方法
CN111191583A (zh) 基于卷积神经网络的空间目标识别系统及方法
CN112085024A (zh) 一种罐表面字符识别方法
CN110222572A (zh) 跟踪方法、装置、电子设备及存储介质
CN113435335B (zh) 微观表情识别方法、装置、电子设备及存储介质
CN116843581B (zh) 一种多场景图的图像增强方法、系统、设备和存储介质
CN112541491A (zh) 基于图像字符区域感知的端到端文本检测及识别方法
CN113269182A (zh) 一种基于变体transformer对小区域敏感的目标果实检测方法及系统
CN115527072A (zh) 一种基于稀疏空间感知与元学习的芯片表面缺陷检测方法
CN114626476A (zh) 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置
CN110610131B (zh) 人脸运动单元的检测方法、装置、电子设备及存储介质
CN107274425B (zh) 一种基于脉冲耦合神经网络的彩色图像分割方法及装置
CN115984930A (zh) 微表情识别方法、装置、微表情识别模型的训练方法
CN110197721B (zh) 基于深度学习的肌腱状况评估方法、装置及存储介质
CN113223037B (zh) 一种面向大规模数据的无监督语义分割方法及系统
CN117437691A (zh) 一种基于轻量化网络的实时多人异常行为识别方法及系统
CN111553437A (zh) 一种基于神经网络图像分类方法
CN114255203B (zh) 一种鱼苗数量估计方法及系统
CN114419529A (zh) 一种基于分布空间对齐的跨模态行人再识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210402

RJ01 Rejection of invention patent application after publication