CN116168348A - 基于图像处理的安全监控方法、系统及存储介质 - Google Patents
基于图像处理的安全监控方法、系统及存储介质 Download PDFInfo
- Publication number
- CN116168348A CN116168348A CN202310433057.XA CN202310433057A CN116168348A CN 116168348 A CN116168348 A CN 116168348A CN 202310433057 A CN202310433057 A CN 202310433057A CN 116168348 A CN116168348 A CN 116168348A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- feature map
- image
- elevator
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 298
- 238000012545 processing Methods 0.000 title claims abstract description 119
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 230000000391 smoking effect Effects 0.000 claims abstract description 43
- 239000000779 smoke Substances 0.000 claims description 35
- 238000013527 convolutional neural network Methods 0.000 claims description 31
- 238000003062 neural network model Methods 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 19
- 238000010586 diagram Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 230000002787 reinforcement Effects 0.000 claims description 7
- 238000005728 strengthening Methods 0.000 claims description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 2
- 230000006399 behavior Effects 0.000 abstract description 20
- 238000005516 engineering process Methods 0.000 abstract description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 238000010191 image analysis Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 19
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000005180 public health Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000012295 chemical reaction liquid Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Alarm Systems (AREA)
Abstract
一种基于图像处理的安全监控方法、系统及存储介质,其获取由摄像头采集的电梯内监控图像;通过基于人工智能的图像分析和处理技术对电梯内监控图像进行处理,以对电梯内吸烟行为进行自动检测,并在检测到有人在电梯内吸烟时及时发出警示信号,提示乘客禁止吸烟。
Description
技术领域
本申请涉及图像识别技术领域,并且更具体地,涉及一种基于图像处理的安全监控方法、系统及存储介质。
背景技术
近年来,为了保障电梯安全,在电梯中安装了监控摄像头。摄像头能够采集电梯内人员的图像信息,通过对摄像头获取的图像进行处理,为电梯内人员进行抽烟监控提供了技术支持。
图像处理技术已日渐成熟,如申请号为201611146898.9的中国专利公开了一种图像识别协处理器、图像识别系统及方法,包括:第一数据获取模块,用于获取数据类型为单精度浮点型的原始待处理图像数据;第一转换模块,用于将原始待处理图像数据的数据类型由单精度浮点型转换成整型,得到转换后的待处理图像数据;数据处理模块,用于利用预设的图像识别算法,对转换后的待处理图像数据进行相应的计算处理,得到数据类型为整型的初始图像识别结果;第二转换模块,用于将初始图像识别结果的数据类型由整型转换成单精度浮点型,得到最终的图像识别结果,该技术方案有利于提高图像识别效果。
再者,如申请号为201710429700.6的中国专利公开了一种图像识别方法及装置,该方法包括获取定点化机制,定点化机制用于将浮点数进行定点化处理,得到定点数,定点化机制中携带定点数的数值属性;在通过已训练好的深度神经网络对待识别图像进行识别时,利用定点化机制对第一属性数据进行定点化处理,第一属性数据包括:第一输出数据和/或深度神经网络中各层的权重,第一输出数据包括:深度神经网络在进行识别时输入层的输出数据和中间层的输出数据;基于定点化处理之后的第一属性数据确定深度神经网络中输出层输出的第一结果,并根据第一结果确定待识别图像的种类。该发明缓解了现有的图像识别方法在进行图像识别时效率低、功耗高的技术问题。
但是类似上述的图像识别和处理技术应用到电梯内采集的图像识别出抽烟图像时,由于电梯内的监控摄像头有可能拍摄到电梯门、墙壁、地面等背景信息,并且这些信息对于后续的特征提取和分类会产生干扰,因此需要对图像识别和处理技术进行进行一步改进。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于图像处理的安全监控方法、系统及存储介质,其获取由摄像头采集的电梯内监控图像;通过基于人工智能的图像分析和处理技术对电梯内监控图像进行处理,以对电梯内吸烟行为进行自动检测,并在检测到有人在电梯内吸烟时及时发出警示信号,提示乘客禁止吸烟。
第一方面,提供了一种基于图像处理的安全监控方法,其包括:
获取由摄像头采集的电梯内监控图像;
将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像;
将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图;
将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图;
融合所述浅层特征图和所述深层特征图以得到监控特征图;
对所述监控特征图进行特征值一致性强化以得到优化监控特征图;
将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及
基于所述分类结果,产生提示信号。
在上述基于图像处理的安全监控方法中,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像,包括:对所述电梯内监控图像进行图像裁剪以得到裁剪后监控图像;对所述裁剪后监控图像进行灰度化处理以得到灰度裁剪后监控图像;和,对所述灰度裁剪后监控图像进行直方图均衡化以得到所述预处理后电梯内监控图像。
在上述基于图像处理的安全监控方法中,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图,包括:使用所述作为浅层特征提取器的第一卷积神经网络模型的各层在层的正向传递中分别对所述预处理后电梯内监控图像进行卷积处理、池化处理和非线性激活处理以从所述第一卷积神经网络模型的浅层提取所述浅层特征图。
在上述基于图像处理的安全监控方法中,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图,包括:使用所述作为深层特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对所述浅层特征图进行卷积处理、池化处理和非线性激活处理以从所述第二卷积神经网络模型的深层提取所述深层特征图。
在上述基于图像处理的安全监控方法中,融合所述浅层特征图和所述深层特征图以得到监控特征图,包括:以如下融合公式来融合所述浅层特征图和所述深层特征图以得到监控特征图;其中,所述融合公式为:
在上述基于图像处理的安全监控方法中,对所述监控特征图进行特征值一致性强化以得到优化监控特征图,包括:以如下优化公式对所述监控特征图进行特征值一致性强化以得到优化监控特征图;其中,所述优化公式为:
在上述基于图像处理的安全监控方法中,将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾,包括:将所述优化监控特征图按照行向量或列向量展开为分类特征向量;使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
第二方面,提供了一种基于图像处理的安全监控系统,其包括:
图像获取模块,用于获取由摄像头采集的电梯内监控图像;
预处理模块,用于将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像;
浅层提取模块,用于将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图;
深层提取模块,用于将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图;
融合模块,用于融合所述浅层特征图和所述深层特征图以得到监控特征图;
优化模块,用于对所述监控特征图进行特征值一致性强化以得到优化监控特征图;
烟雾监控结果生成模块,用于将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及
提示信号生成模块,用于基于所述分类结果,产生提示信号。
在上述基于图像处理的安全监控系统中,所述预处理模块,包括:图像裁剪单元,用于对所述电梯内监控图像进行图像裁剪以得到裁剪后监控图像;灰度化处理单元,用于对所述裁剪后监控图像进行灰度化处理以得到灰度裁剪后监控图像;和,直方图均衡化单元,用于对所述灰度裁剪后监控图像进行直方图均衡化以得到所述预处理后电梯内监控图像。
第三方面,提供了一种存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行所述的基于图像处理的安全监控方法。
与现有技术相比,本申请提供的基于图像处理的安全监控方法、系统及存储介质,其获取由摄像头采集的电梯内监控图像;通过基于人工智能的图像分析和处理技术对电梯内监控图像进行处理,以对电梯内吸烟行为进行自动检测,并在检测到有人在电梯内吸烟时及时发出警示信号,提示乘客禁止吸烟。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例的基于图像处理的安全监控方法的场景示意图。
图2为根据本申请实施例的基于图像处理的安全监控方法的流程图。
图3为根据本申请实施例的基于图像处理的安全监控方法的架构示意图。
图4为根据本申请实施例的基于图像处理的安全监控方法中步骤120的子步骤的流程图。
图5为根据本申请实施例的基于图像处理的安全监控方法中步骤170的子步骤的流程图。
图6为根据本申请实施例的基于图像处理的安全监控系统的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
基于上述技术需求,本申请的技术构思为:通过基于人工智能的图像分析和处理技术对由摄像头采集的电梯内监控图像进行处理,以对电梯内吸烟行为的自动检测,并在检测到有人在电梯内吸烟时及时发出警示信号,提示乘客禁止吸烟。
具体地,在本申请的技术方案中,首先获取由摄像头采集的电梯内监控图像。本领域普通技术人员应知晓,电梯通常会安装摄像头进行监控,而通过所述摄像头就可以实时获取电梯内部的图像,并将其传输到监控控制中心或者云端服务器等地方进行处理。相应地,在本申请的技术方案中,可通过由摄像头采集的电梯内监控图像对其中的人员行为进行分析和识别,从而实现对电梯内抽烟行为的自动监控。应可以理解,所述摄像头还可以更好地保障电梯内乘客的安全,例如预防不良行为、紧急情况等等。
接着,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像。在本申请的技术方案中,所述预处理包括图像裁剪、灰度化以及直方图均衡化。这里,由于电梯内的监控摄像头有可能拍摄到电梯门、墙壁、地面等背景信息,并且这些信息对于后续的特征提取和分类会产生干扰,因此需要将图像进行裁剪,只保留电梯内部分区域的图像,以提高处理效率和准确性。灰度化意味着将彩色图像转化为灰度图像,应可以理解,将彩色图像转换为灰度图像可以减少图像的数据量,从而加快数据处理速度,同时,灰度图像中每个像素只有一个通道,去除了彩色图像中每个像素的 RGB 三个通道,更易于处理。直方图均衡化是一种常用的图像增强技术,通过重新分配图像的像素值来增强图像的视觉效果。在电梯内的监控图像中,由于光线、曝光等因素影响,有些区域的图像可能存在过亮或者过暗的情况,这可能会影响后续的图像特征提取和分类。因此,采用直方图均衡化技术可以增强图像对比度,提高图像的质量和可靠性。
进而,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图。本领域普通技术人员应知晓,在深度学习领域中,卷积神经网络模型被广泛应用于图像分类、目标检测、人脸识别等问题中。所述卷积神经网络模型可以自动从原始图像中学习特征,并将其表示为多个卷积层、池化层等构成的网络结构。其中,卷积层用于提取局部特征,而池化层则用于下采样和特征压缩,以减少模型参数和计算量。
相应地,在本申请的技术方案中,使用所述第一卷积神经网络模型来提取浅层特征。具体地,通过将预处理后的电梯内监控图像输入到第一卷积神经网络模型中,可以提取出不同分辨率的特征图,这些特征图包含了关于吸烟行为的相关信息,例如烟雾的密度、形状和位置等。
继而,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图。特别地,在本申请的技术方案中,所述浅层特征虽然包含了关于吸烟行为的有用信息,但并不能够完全捕捉到烟雾的位置、形状、大小等细节特征,因此需要进一步提取深层特征。具体地,将所述浅层特征图作为深层特征提取器的输入,可以在其基础上通过更深的卷积层和池化层进行特征提取,从而获得更加丰富和准确的特征表示。这些深层特征可以更好地表示烟雾的形态和分布,从而实现对吸烟行为的更加精细和准确的检测。
在得到所述浅层特征图和所述深层特征图后,融合所述浅层特征图和所述深层特征图以得到监控特征图。如上所述,浅层特征通常包含低级别的视觉特征,例如边缘、纹理等,而深层特征则包含更高级别的语义信息,例如物体部位、形状、结构等。因此,将这两种特征进行融合可以充分利用它们的优势,提高特征表示的丰富程度和分类精度。
特别地,为了充分利用所述电梯内监控图像由卷积神经网络模型提取出的浅层和深层图像语义特征,优选地通过沿通道维度直接级联所述浅层特征图和所述深层特征图来得到所述监控特征图。进而,将所述监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾。也就是,使用分类器来确定所述监控特征图所属的类概率标签,所述类概率标签,包括:电梯内存在因抽烟而产生的烟雾(第一标签),以及,电梯内不存在因抽烟而产生的烟雾(第二标签)。继而,基于所述分类结果,产生提示信号,也就是,如果分类结果为存在吸烟行为,则可以向乘客发出警示信号,提醒他们禁止吸烟,进一步保障公众健康和安全。
这里,在融合所述浅层特征图和所述深层特征图得到所述监控特征图时,为了充分利用所述电梯内监控图像由卷积神经网络模型提取出的浅层和深层图像语义特征,优选地通过沿通道维度直接级联所述浅层特征图和所述深层特征图来得到所述监控特征图。但是,在所述监控特征图的特征集合简单地合并所述浅层特征图和所述深层特征图各自的特征集合的情况下,所述监控特征图的特征集合的各个特征值之间的一致性会较低,这会影响所述监控特征图通过分类器进行分类回归时的收敛效果,降低模型的训练速度和得到的分类结果的准确性。
这里,通过所述监控特征图表征的流形曲面的基于邻域点的切平面有向距离归一化,可以使用所述监控特征图/>的高维特征集合的统计特性,对于其每个特征值构建基于统计邻域的局部线性切空间,并通过在所述局部线性切空间内选择切向量的最大几何度量来对特征值进行有向化,并基于定向向量的内积式距离表达来对所述监控特征图/>的流形表示的曲面上的点进行局部非欧几何性质的归一化表达,从而通过高维特征表达的流形曲面的几何校正的方式提升所述监控特征图/>的各个特征值之间的表达一致性。这样,再将优化后的所述监控特征图通过分类器,就可以提升分类回归时的收敛效果,加快模型的训练速度并提高得到的分类结果的准确性。
图1为根据本申请实施例的基于图像处理的安全监控方法的场景示意图。如图1所示,在该应用场景中,首先,获取由摄像头采集的电梯内监控图像(例如,如图1中所示意的C);然后,将获取的电梯内监控图像输入至部署有基于图像处理的安全监控算法的服务器(例如,如图1中所示意的S)中,其中所述服务器能够基于图像处理的安全监控算法对所述电梯内监控图像进行处理,以生成用于表示电梯内是否存在因抽烟而产生的烟雾的分类结果,基于所述分类结果,产生提示信号。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
在本申请的一个实施例中,图2为根据本申请实施例的基于图像处理的安全监控方法的流程图。如图2所示,根据本申请实施例的基于图像处理的安全监控方法100,包括:110,获取由摄像头采集的电梯内监控图像;120,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像;130,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图;140,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图;150,融合所述浅层特征图和所述深层特征图以得到监控特征图;160,对所述监控特征图进行特征值一致性强化以得到优化监控特征图;170,将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及,180,基于所述分类结果,产生提示信号。
图3为根据本申请实施例的基于图像处理的安全监控方法的架构示意图。如图3所示,在该网络架构中,首先,获取由摄像头采集的电梯内监控图像;然后,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像;接着,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图;然后,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图;接着,融合所述浅层特征图和所述深层特征图以得到监控特征图;然后,对所述监控特征图进行特征值一致性强化以得到优化监控特征图;接着,将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及,最后,基于所述分类结果,产生提示信号。
具体地,在步骤110中,获取由摄像头采集的电梯内监控图像。基于上述技术需求,本申请的技术构思为:通过基于人工智能的图像分析和处理技术对由摄像头采集的电梯内监控图像进行处理,以对电梯内吸烟行为的自动检测,并在检测到有人在电梯内吸烟时及时发出警示信号,提示乘客禁止吸烟。
具体地,在本申请的技术方案中,首先获取由摄像头采集的电梯内监控图像。本领域普通技术人员应知晓,电梯通常会安装摄像头进行监控,而通过所述摄像头就可以实时获取电梯内部的图像,并将其传输到监控控制中心或者云端服务器等地方进行处理。相应地,在本申请的技术方案中,可通过由摄像头采集的电梯内监控图像对其中的人员行为进行分析和识别,从而实现对电梯内抽烟行为的自动监控。应可以理解,所述摄像头还可以更好地保障电梯内乘客的安全,例如预防不良行为、紧急情况等等。
具体地,在步骤120中,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像。接着,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像。在本申请的技术方案中,所述预处理包括图像裁剪、灰度化以及直方图均衡化。这里,由于电梯内的监控摄像头有可能拍摄到电梯门、墙壁、地面等背景信息,并且这些信息对于后续的特征提取和分类会产生干扰,因此需要将图像进行裁剪,只保留电梯内部分区域的图像,以提高处理效率和准确性。
灰度化意味着将彩色图像转化为灰度图像,应可以理解,将彩色图像转换为灰度图像可以减少图像的数据量,从而加快数据处理速度,同时,灰度图像中每个像素只有一个通道,去除了彩色图像中每个像素的 RGB 三个通道,更易于处理。直方图均衡化是一种常用的图像增强技术,通过重新分配图像的像素值来增强图像的视觉效果。在电梯内的监控图像中,由于光线、曝光等因素影响,有些区域的图像可能存在过亮或者过暗的情况,这可能会影响后续的图像特征提取和分类。因此,采用直方图均衡化技术可以增强图像对比度,提高图像的质量和可靠性。
图4为根据本申请实施例的基于图像处理的安全监控方法中步骤120的子步骤的流程图,如图4所示,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像,包括:121,对所述电梯内监控图像进行图像裁剪以得到裁剪后监控图像;122,对所述裁剪后监控图像进行灰度化处理以得到灰度裁剪后监控图像;和,123,对所述灰度裁剪后监控图像进行直方图均衡化以得到所述预处理后电梯内监控图像。
具体地,在步骤130中,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图。进而,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图。本领域普通技术人员应知晓,在深度学习领域中,卷积神经网络模型被广泛应用于图像分类、目标检测、人脸识别等问题中。所述卷积神经网络模型可以自动从原始图像中学习特征,并将其表示为多个卷积层、池化层等构成的网络结构。其中,卷积层用于提取局部特征,而池化层则用于下采样和特征压缩,以减少模型参数和计算量。
相应地,在本申请的技术方案中,使用所述第一卷积神经网络模型来提取浅层特征。具体地,通过将预处理后的电梯内监控图像输入到第一卷积神经网络模型中,可以提取出不同分辨率的特征图,这些特征图包含了关于吸烟行为的相关信息,例如烟雾的密度、形状和位置等。
其中,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图,包括:使用所述作为浅层特征提取器的第一卷积神经网络模型的各层在层的正向传递中分别对所述预处理后电梯内监控图像进行卷积处理、池化处理和非线性激活处理以从所述第一卷积神经网络模型的浅层提取所述浅层特征图。
卷积神经网络(Convolutional Neural Network,CNN)是一种人工神经网络,在图像识别等领域有着广泛的应用。卷积神经网络可以包括输入层、隐藏层和输出层,其中,隐藏层可以包括卷积层、池化(pooling)层、激活层和全连接层等,上一层根据输入的数据进行相应的运算,将运算结果输出给下一层,输入的初始数据经过多层的运算之后得到一个最终的结果。
卷积神经网络模型利用卷积核作为特征过滤因子在图像局部特征提取方面具有非常优异的性能表现,且相较于传统的基于统计或者基于特征工程的图像特征提取算法,所述卷积神经网络模型具有更强的特征提取泛化能力和拟合能力。
具体地,在步骤140中,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图。继而,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图。特别地,在本申请的技术方案中,所述浅层特征虽然包含了关于吸烟行为的有用信息,但并不能够完全捕捉到烟雾的位置、形状、大小等细节特征,因此需要进一步提取深层特征。具体地,将所述浅层特征图作为深层特征提取器的输入,可以在其基础上通过更深的卷积层和池化层进行特征提取,从而获得更加丰富和准确的特征表示。这些深层特征可以更好地表示烟雾的形态和分布,从而实现对吸烟行为的更加精细和准确的检测。
其中,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图,包括:使用所述作为深层特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对所述浅层特征图进行卷积处理、池化处理和非线性激活处理以从所述第二卷积神经网络模型的深层提取所述深层特征图。
应可以理解,相较于标准卷积神经网络模型,根据本申请的所述卷积神经网络模型能够保留所述各个反应监控关键帧的反应液状态的浅层特征和深层特征,以不仅使得特征信息更为丰富,且不同深度的特征能得以保留,以提高对于所述反应状态监测的精准度。同时,深度神经网络的结构往往比较复杂,需要大量的样本数据来训练和调整,而深度网络的训练时间较长,容易过拟合。因此,在神经网络模型的设计中,通常采用浅层网络和深层网络的结合,通过深浅特征融合,可以在一定程度上降低网络的复杂度和过拟合的风险,同时提高模型的特征提取能力和泛化能力。
具体地,在步骤150中,融合所述浅层特征图和所述深层特征图以得到监控特征图。在得到所述浅层特征图和所述深层特征图后,融合所述浅层特征图和所述深层特征图以得到监控特征图。如上所述,浅层特征通常包含低级别的视觉特征,例如边缘、纹理等,而深层特征则包含更高级别的语义信息,例如物体部位、形状、结构等。因此,将这两种特征进行融合可以充分利用它们的优势,提高特征表示的丰富程度和分类精度。
其中,融合所述浅层特征图和所述深层特征图以得到监控特征图,包括:以如下融合公式来融合所述浅层特征图和所述深层特征图以得到监控特征图;其中,所述融合公式为:
具体地,在步骤160中,对所述监控特征图进行特征值一致性强化以得到优化监控特征图。这里,在融合所述浅层特征图和所述深层特征图得到所述监控特征图时,为了充分利用所述电梯内监控图像由卷积神经网络模型提取出的浅层和深层图像语义特征,优选地通过沿通道维度直接级联所述浅层特征图和所述深层特征图来得到所述监控特征图。但是,在所述监控特征图的特征集合简单地合并所述浅层特征图和所述深层特征图各自的特征集合的情况下,所述监控特征图的特征集合的各个特征值之间的一致性会较低,这会影响所述监控特征图通过分类器进行分类回归时的收敛效果,降低模型的训练速度和得到的分类结果的准确性。
因此,本申请的申请人对于所述监控特征图,例如记为进行特征流形曲面的基于邻域点的切平面有向距离归一化,具体表示为:以如下优化公式对所述监控特征图进行特征值一致性强化以得到优化监控特征图;其中,所述优化公式为:
这里,通过所述监控特征图表征的流形曲面的基于邻域点的切平面有向距离归一化,可以使用所述监控特征图/>的高维特征集合的统计特性,对于其每个特征值构建基于统计邻域的局部线性切空间,并通过在所述局部线性切空间内选择切向量的最大几何度量来对特征值进行有向化,并基于定向向量的内积式距离表达来对所述监控特征图/>的流形表示的曲面上的点进行局部非欧几何性质的归一化表达,从而通过高维特征表达的流形曲面的几何校正的方式提升所述监控特征图/>的各个特征值之间的表达一致性。这样,再将优化后的所述监控特征图通过分类器,就可以提升分类回归时的收敛效果,加快模型的训练速度并提高得到的分类结果的准确性。
具体地,在步骤170和步骤180中,将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及,基于所述分类结果,产生提示信号。特别地,为了充分利用所述电梯内监控图像由卷积神经网络模型提取出的浅层和深层图像语义特征,优选地通过沿通道维度直接级联所述浅层特征图和所述深层特征图来得到所述监控特征图。进而,将所述监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾。
也就是,使用分类器来确定所述监控特征图所属的类概率标签,所述类概率标签,包括:电梯内存在因抽烟而产生的烟雾(第一标签),以及,电梯内不存在因抽烟而产生的烟雾(第二标签)。继而,基于所述分类结果,产生提示信号,也就是,如果分类结果为存在吸烟行为,则可以向乘客发出警示信号,提醒他们禁止吸烟,进一步保障公众健康和安全。
值得注意的是,这里的所述第一标签和所述第二标签并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“电梯内是否存在因抽烟而产生的烟雾”这个概念,其只是有两个分类标签,其输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,电梯内是否存在因抽烟而产生的烟雾的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“电梯内是否存在因抽烟而产生的烟雾”的语言文本意义。
图5为根据本申请实施例的基于图像处理的安全监控方法中步骤170的子步骤的流程图,如图5所示,将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾,包括:171,将所述优化监控特征图按照行向量或列向量展开为分类特征向量;172,使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,173,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
在本申请一具体示例中,使用所述分类器以如下公式对所述优化监控特征图进行处理以得到所述分类结果;其中,所述公式为:
综上,基于本申请实施例的基于图像处理的安全监控方法100被阐明,其获取由摄像头采集的电梯内监控图像;通过基于人工智能的图像分析和处理技术对电梯内监控图像进行处理,以对电梯内吸烟行为进行自动检测,并在检测到有人在电梯内吸烟时及时发出警示信号,提示乘客禁止吸烟。
在本申请的一个实施例中,图6为根据本申请实施例的基于图像处理的安全监控系统的框图。如图6所示,根据本申请实施例的基于图像处理的安全监控系统200,包括:图像获取模块210,用于获取由摄像头采集的电梯内监控图像;预处理模块220,用于将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像;浅层提取模块230,用于将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图;深层提取模块240,用于将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图;融合模块250,用于融合所述浅层特征图和所述深层特征图以得到监控特征图;优化模块260,用于对所述监控特征图进行特征值一致性强化以得到优化监控特征图;烟雾监控结果生成模块270,用于将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及,提示信号生成模块280,用于基于所述分类结果,产生提示信号。
在一个具体示例中,在上述基于图像处理的安全监控系统中,所述预处理模块,包括:图像裁剪单元,用于对所述电梯内监控图像进行图像裁剪以得到裁剪后监控图像;灰度化处理单元,用于对所述裁剪后监控图像进行灰度化处理以得到灰度裁剪后监控图像;和,直方图均衡化单元,用于对所述灰度裁剪后监控图像进行直方图均衡化以得到所述预处理后电梯内监控图像。
在一个具体示例中,在上述基于图像处理的安全监控系统中,所述浅层提取模块,用于:使用所述作为浅层特征提取器的第一卷积神经网络模型的各层在层的正向传递中分别对所述预处理后电梯内监控图像进行卷积处理、池化处理和非线性激活处理以从所述第一卷积神经网络模型的浅层提取所述浅层特征图。
在一个具体示例中,在上述基于图像处理的安全监控系统中,所述深层提取模块,用于:使用所述作为深层特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对所述浅层特征图进行卷积处理、池化处理和非线性激活处理以从所述第二卷积神经网络模型的深层提取所述深层特征图。
在一个具体示例中,在上述基于图像处理的安全监控系统中,所述融合模块,用于:以如下融合公式来融合所述浅层特征图和所述深层特征图以得到监控特征图;其中,所述融合公式为:
在一个具体示例中,在上述基于图像处理的安全监控系统中,所述优化模块,用于:以如下优化公式对所述监控特征图进行特征值一致性强化以得到优化监控特征图;其中,所述优化公式为:
在一个具体示例中,在上述基于图像处理的安全监控系统中,所述烟雾监控结果生成模块,包括:展开单元,用于将所述优化监控特征图按照行向量或列向量展开为分类特征向量;编码单元,用于使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果单元,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
这里,本领域技术人员可以理解,上述基于图像处理的安全监控系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图5的基于图像处理的安全监控方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于图像处理的安全监控系统200可以实现在各种终端设备中,例如用于基于图像处理的安全监控的服务器等。在一个示例中,根据本申请实施例的基于图像处理的安全监控系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于图像处理的安全监控系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于图像处理的安全监控系统200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于图像处理的安全监控系统200与该终端设备也可以是分立的设备,并且基于图像处理的安全监控系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
除了上述方法和设备以外,本申请的实施例还提供了一种存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如前所述的基于图像处理的安全监控方法。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书中描述的根据本申请各种实施例的基于图像处理的安全监控方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本申请的一个实施例中,还提供了一种根据本申请实施例的电子设备。电子设备包括一个或多个处理器和存储器。处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。存储器可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于图像处理的安全监控方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如监控信息等各种内容。
在一个示例中,电子设备还可以包括:输入装置和输出装置,这些组件通过总线系统和/或其他形式的连接机构互连。该输出装置可以向外部输出各种信息,包括所述待存储的检测项图像数据的图像质量等。该输出装置可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
应可以理解,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本申请实施例的方法、系统、和计算机程序产品的流程图和/或框图来描述的。应理解可由计算机程序指令实现流程图和/或框图中的每一流程和/或方框、以及流程图和/或框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的步骤。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种基于图像处理的安全监控方法,其特征在于,包括:
获取由摄像头采集的电梯内监控图像;
将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像;
将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图;
将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图;
融合所述浅层特征图和所述深层特征图以得到监控特征图;
对所述监控特征图进行特征值一致性强化以得到优化监控特征图;
将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及
基于所述分类结果,产生提示信号。
2.根据权利要求1所述的基于图像处理的安全监控方法,其特征在于,将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像,包括:
对所述电梯内监控图像进行图像裁剪以得到裁剪后监控图像;
对所述裁剪后监控图像进行灰度化处理以得到灰度裁剪后监控图像;和
对所述灰度裁剪后监控图像进行直方图均衡化以得到所述预处理后电梯内监控图像。
3.根据权利要求2所述的基于图像处理的安全监控方法,其特征在于,将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图,包括:使用所述作为浅层特征提取器的第一卷积神经网络模型的各层在层的正向传递中分别对所述预处理后电梯内监控图像进行卷积处理、池化处理和非线性激活处理以从所述第一卷积神经网络模型的浅层提取所述浅层特征图。
4.根据权利要求3所述的基于图像处理的安全监控方法,其特征在于,将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图,包括:使用所述作为深层特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对所述浅层特征图进行卷积处理、池化处理和非线性激活处理以从所述第二卷积神经网络模型的深层提取所述深层特征图。
7.根据权利要求6所述的基于图像处理的安全监控方法,其特征在于,将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾,包括:
将所述优化监控特征图按照行向量或列向量展开为分类特征向量;
使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及
将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
8.一种基于图像处理的安全监控系统,其特征在于,包括:
图像获取模块,用于获取由摄像头采集的电梯内监控图像;
预处理模块,用于将所述电梯内监控图像进行预处理以得到预处理后电梯内监控图像;
浅层提取模块,用于将所述预处理后电梯内监控图像通过作为浅层特征提取器的第一卷积神经网络模型以得到浅层特征图;
深层提取模块,用于将所述浅层特征图通过作为深层特征提取器的第二卷积神经网络模型以得到深层特征图;
融合模块,用于融合所述浅层特征图和所述深层特征图以得到监控特征图;
优化模块,用于对所述监控特征图进行特征值一致性强化以得到优化监控特征图;
烟雾监控结果生成模块,用于将所述优化监控特征图通过分类器以得到分类结果,分类结果用于表示电梯内是否存在因抽烟而产生的烟雾;以及
提示信号生成模块,用于基于所述分类结果,产生提示信号。
9.根据权利要求8所述的基于图像处理的安全监控系统,其特征在于,所述预处理模块,包括:
图像裁剪单元,用于对所述电梯内监控图像进行图像裁剪以得到裁剪后监控图像;
灰度化处理单元,用于对所述裁剪后监控图像进行灰度化处理以得到灰度裁剪后监控图像;和
直方图均衡化单元,用于对所述灰度裁剪后监控图像进行直方图均衡化以得到所述预处理后电梯内监控图像。
10.一种存储介质,其特征在于,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至7任一所述的基于图像处理的安全监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310433057.XA CN116168348B (zh) | 2023-04-21 | 2023-04-21 | 基于图像处理的安全监控方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310433057.XA CN116168348B (zh) | 2023-04-21 | 2023-04-21 | 基于图像处理的安全监控方法、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116168348A true CN116168348A (zh) | 2023-05-26 |
CN116168348B CN116168348B (zh) | 2024-01-30 |
Family
ID=86422232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310433057.XA Active CN116168348B (zh) | 2023-04-21 | 2023-04-21 | 基于图像处理的安全监控方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116168348B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116471129A (zh) * | 2023-06-20 | 2023-07-21 | 深圳市美力高集团有限公司 | 一种基于大数据分析的安防监控数据安全存储系统及方法 |
CN116944818A (zh) * | 2023-06-21 | 2023-10-27 | 台州必拓汽车配件股份有限公司 | 新能源汽车转轴的智能加工方法及其系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180365794A1 (en) * | 2017-06-15 | 2018-12-20 | Samsung Electronics Co., Ltd. | Image processing apparatus and method using multi-channel feature map |
CN112069940A (zh) * | 2020-08-24 | 2020-12-11 | 武汉大学 | 一种基于分阶段特征学习的跨域行人重识别方法 |
CN112528059A (zh) * | 2021-02-08 | 2021-03-19 | 南京理工大学 | 基于深度学习的交通目标图像检索方法、装置及可读介质 |
CN112733814A (zh) * | 2021-03-30 | 2021-04-30 | 上海闪马智能科技有限公司 | 一种基于深度学习的行人徘徊滞留检测方法、系统及介质 |
CN112950586A (zh) * | 2021-03-02 | 2021-06-11 | 攀钢集团攀枝花钢铁研究院有限公司 | 一种lf炉钢渣红外识别方法和系统 |
CN113077388A (zh) * | 2021-04-25 | 2021-07-06 | 中国人民解放军国防科技大学 | 一种数据增广的深度半监督超限学习图像分类方法及系统 |
CN113327279A (zh) * | 2021-08-04 | 2021-08-31 | 腾讯科技(深圳)有限公司 | 一种点云数据处理方法、装置、计算机设备及存储介质 |
CN114885119A (zh) * | 2022-03-29 | 2022-08-09 | 西北大学 | 一种基于计算机视觉的智能监控报警系统及方法 |
CN115393176A (zh) * | 2022-07-12 | 2022-11-25 | 浙江工业大学 | 一种人像卡通化方法、系统及电子设备 |
CN115601299A (zh) * | 2022-09-06 | 2023-01-13 | 嘉兴市第一医院(Cn) | 基于图像的肝硬化状态智能评估系统及其方法 |
CN115861969A (zh) * | 2022-12-16 | 2023-03-28 | 绍兴岩帜科技有限公司 | 基于人工智能的智能驾驶视觉系统及其方法 |
-
2023
- 2023-04-21 CN CN202310433057.XA patent/CN116168348B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180365794A1 (en) * | 2017-06-15 | 2018-12-20 | Samsung Electronics Co., Ltd. | Image processing apparatus and method using multi-channel feature map |
CN112069940A (zh) * | 2020-08-24 | 2020-12-11 | 武汉大学 | 一种基于分阶段特征学习的跨域行人重识别方法 |
CN112528059A (zh) * | 2021-02-08 | 2021-03-19 | 南京理工大学 | 基于深度学习的交通目标图像检索方法、装置及可读介质 |
CN112950586A (zh) * | 2021-03-02 | 2021-06-11 | 攀钢集团攀枝花钢铁研究院有限公司 | 一种lf炉钢渣红外识别方法和系统 |
CN112733814A (zh) * | 2021-03-30 | 2021-04-30 | 上海闪马智能科技有限公司 | 一种基于深度学习的行人徘徊滞留检测方法、系统及介质 |
CN113077388A (zh) * | 2021-04-25 | 2021-07-06 | 中国人民解放军国防科技大学 | 一种数据增广的深度半监督超限学习图像分类方法及系统 |
CN113327279A (zh) * | 2021-08-04 | 2021-08-31 | 腾讯科技(深圳)有限公司 | 一种点云数据处理方法、装置、计算机设备及存储介质 |
CN114885119A (zh) * | 2022-03-29 | 2022-08-09 | 西北大学 | 一种基于计算机视觉的智能监控报警系统及方法 |
CN115393176A (zh) * | 2022-07-12 | 2022-11-25 | 浙江工业大学 | 一种人像卡通化方法、系统及电子设备 |
CN115601299A (zh) * | 2022-09-06 | 2023-01-13 | 嘉兴市第一医院(Cn) | 基于图像的肝硬化状态智能评估系统及其方法 |
CN115861969A (zh) * | 2022-12-16 | 2023-03-28 | 绍兴岩帜科技有限公司 | 基于人工智能的智能驾驶视觉系统及其方法 |
Non-Patent Citations (3)
Title |
---|
WAN-YU DENG 等: "Domain adaption via feature selection on explicit feature map", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》, vol. 30, no. 4, pages 1180 - 1190, XP011715112, DOI: 10.1109/TNNLS.2018.2863240 * |
任逍航: "基于深度学习的自然场景图像的中文字检测和识别算法研究", 《中国博士学位论文全文数据库》, no. 8, pages 138 - 107 * |
张秀英 等: "面向对象分类的特征空间优化", 《遥感学报》, vol. 13, no. 4, pages 664 - 669 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116471129A (zh) * | 2023-06-20 | 2023-07-21 | 深圳市美力高集团有限公司 | 一种基于大数据分析的安防监控数据安全存储系统及方法 |
CN116944818A (zh) * | 2023-06-21 | 2023-10-27 | 台州必拓汽车配件股份有限公司 | 新能源汽车转轴的智能加工方法及其系统 |
CN116944818B (zh) * | 2023-06-21 | 2024-05-24 | 台州必拓汽车配件股份有限公司 | 新能源汽车转轴的智能加工方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116168348B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116168348B (zh) | 基于图像处理的安全监控方法、系统及存储介质 | |
Frizzi et al. | Convolutional neural network for video fire and smoke detection | |
JP4429370B2 (ja) | ポーズによるヒト検出 | |
CN109902662B (zh) | 一种行人重识别方法、系统、装置和存储介质 | |
CN113435424B (zh) | 一种保密介质销毁颗粒度的识别方法和系统 | |
CN116844217B (zh) | 用于生成人脸数据的图像处理系统及方法 | |
CN117202430B (zh) | 用于智慧灯杆的节能控制方法及系统 | |
CN116542610B (zh) | 一种非接触式柜内资产自动盘点装置、方法和存储介质 | |
Jindal et al. | Sign Language Detection using Convolutional Neural Network (CNN) | |
CN116994049A (zh) | 全自动针织横机及其方法 | |
CN116863406A (zh) | 一种基于人工智能的智能报警安防系统及其方法 | |
CN115830701A (zh) | 一种基于小样本学习的人员违规行为预测方法 | |
Hasan et al. | Smoke detection from different environmental conditions using faster r-cnn approach based on deep neural network | |
CN114220145A (zh) | 人脸检测模型生成方法和装置、伪造人脸检测方法和装置 | |
Zhou | Lip print recognition algorithm based on convolutional network | |
Venkateswarlu et al. | AI-based Gender Identification using Facial Features | |
CN116933041B (zh) | 力传感器编号校对系统及方法 | |
CN116524416B (zh) | 医疗实验用动物血清提取设备 | |
CN116636660B (zh) | 一种电子烟烟油信息处理方法、系统及电子烟 | |
CN114937273B (zh) | 字迹识别鉴定方法及装置 | |
CN117127005B (zh) | 在线淬火的水冷控制系统及其方法 | |
Salunke et al. | Sign Language Recognition System Using Customized Convolution Neural Network | |
Abass et al. | Currency Recognition Using EAST for Text Detection and Tesseract OCR for Text Recognition | |
CN117079208A (zh) | 水泥厂智能管控系统及其方法 | |
Teng et al. | Research on visualisation algorithm of handwritten digital image recognition based on deep neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |