CN117351420A - 一种智能开关门检测方法 - Google Patents

一种智能开关门检测方法 Download PDF

Info

Publication number
CN117351420A
CN117351420A CN202311349500.1A CN202311349500A CN117351420A CN 117351420 A CN117351420 A CN 117351420A CN 202311349500 A CN202311349500 A CN 202311349500A CN 117351420 A CN117351420 A CN 117351420A
Authority
CN
China
Prior art keywords
door opening
closing detection
target
detection method
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311349500.1A
Other languages
English (en)
Other versions
CN117351420B (zh
Inventor
李德军
陆建军
王青朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Sixingda Information Technology Co ltd
Original Assignee
Jiangsu Sixingda Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Sixingda Information Technology Co ltd filed Critical Jiangsu Sixingda Information Technology Co ltd
Priority to CN202311349500.1A priority Critical patent/CN117351420B/zh
Publication of CN117351420A publication Critical patent/CN117351420A/zh
Application granted granted Critical
Publication of CN117351420B publication Critical patent/CN117351420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/16Image acquisition using multiple overlapping images; Image stitching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Power-Operated Mechanisms For Wings (AREA)

Abstract

本发明公开了一种智能开关门检测方法,包括以下步骤:步骤一:输入检测的图像并在网络中共提取三个特征层,其大小分别为13×13,26×26,52×52,这三个特征层用于与上采样后的其他特征层进行拼接或预测输出;步骤二:最底层的特征层13×13,在进行卷积处理后,分别用于预测输出,或经过卷积和上采样与26×26的特征图进行拼接,然后经过拼接后的特征图同样在进行卷积处理之后,用于预测输出以及通过卷积和上采样实现与52×52特征层的拼接。本发明能够监测门的状态,支持分布在不同的位置的八路摄像头对门的状态进行监测,能够对于关键事件进行保存30s视频,能够满足用户的需求进行个性化阈值设定。

Description

一种智能开关门检测方法
技术领域
本发明涉及开关门检测的技术领域,尤其涉及一种智能开关门检测方法。
背景技术
智能开关门检测系统是部署在边缘计算网关装置,主要功能:开关门检测。Resnet作为卷积神经网络的一个重要模型在各个领域被广泛应用,也因此衍生了各个改进模型。一般来说,理论上随着神经网络的层数不断增加,其特征提取的能力以及准确度也会不断提高,但实际上,对由单纯的卷积神经网络构成的深度网络来说,较多层数的网络的收敛表现反而会不如较少层数的网络。当网络的层数高达一定程度时,其准确率将会到达阈值,此时再添加新的网络层往往会带来相反的效果。
为了解决这个问题,Resnet提出了残差结构,本文对Yolov3的优化的主要体现在对残差结构进行改进,加入Mixup中的Beta函数,其能够更有效的获得图片特征,提高目标检测的准确度。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有智能开关门检测方法存在的问题,提出了本发明。
因此,本发明目的是提供一种智能开关门检测方法,其本发明能够监测门的状态,支持分布在不同的位置的八路摄像头对门的状态进行监测,能够对于关键事件进行保存30s视频,能够满足用户的需求进行个性化阈值设定。
为解决上述技术问题,本发明提供如下技术方案:一种智能开关门检测方法,包括以下步骤:
步骤一:输入检测的图像并在网络中共提取三个特征层,其大小分别为13×13,26×26,52×52,这三个特征层用于与上采样后的其他特征层进行拼接或预测输出;
步骤二:最底层的特征层13×13,在进行卷积处理后,分别用于预测输出,或经过卷积和上采样与26×26的特征图进行拼接,然后经过拼接后的特征图同样在进行卷积处理之后,用于预测输出以及通过卷积和上采样实现与52×52特征层的拼接,对该拼接后的特征层进行卷积处理之后进行预测输出;
步骤三:在网络模型的最后一层,融合三个预测输出,采用开关门检测模型算法实现对检测准确度进行提升并得到最终的检测结果。
作为本发明所述智能开关门检测方法的一种优选方案,其中:所述步骤一种的网络采用特征提取网络:Darknet53,该特征提取网络含有53个卷积层。
作为本发明所述智能开关门检测方法的一种优选方案,其中:所述步骤三中的开关门检测模型算法中每个单元格输出3个结果,每个结果对应一个先验框,目标检测框的结果需要结合先验框并通过计算得出目标边界框的坐标。
作为本发明所述智能开关门检测方法的一种优选方案,其中:所述开关门检测模型算法公式如下:
bx=σ(tx)+cx
by=σ(ty)+cy
其中,cx和cy为先验框的中心在该特征图中的坐标,pw和ph为先验框的宽和高,(tx,ty)预测边界框中心偏移量,(bx,by)为宽高缩放比为最终预测的目标边界框的在特征图中的中心坐标,bw,bh为最终预测的目标边界框的宽和高;σ(x)函数代表sigmoid函数用于预测偏移量缩放至0到1之间。
作为本发明所述智能开关门检测方法的一种优选方案,其中:所述目标检测公式计算后结合置信度与非极大值抑制对预测目标框进行筛选;完成目标边界框预测之后,在原始图像中会出现一个目标拥有多个预测框,此时先通过置信度判断该目标框中是否存在目标物体,然后通过目标框的位置坐标和置信度进行非极大值抑制,通过交并比IoU筛选出最终的目标边界框。
作为本发明所述智能开关门检测方法的一种优选方案,其中:所述函数算法中加入Beta函数,能够更有效的获得图片特征,提高目标检测的准确度,具体包括:
G(x)=σF(x)+(1-σ)x
其中σ代表Beta函数。
作为本发明所述智能开关门检测方法的一种优选方案,其中:所述智能开关门检测方法运用了开关门检测系统,其包括host层和device层,所述host层采用八核处理器芯片,所述Device层内设置有加速模块并集成处理器,在端侧实现图像识别、图像分类。
作为本发明所述智能开关门检测方法的一种优选方案,其中:所述开关门检测系统首先通过opencv拉取视频流进行处理,之后通过socket将图片发送到device层种的加速模块,加速模块接收图片并将图片输入到开关门检测模型,最后将检测结果通过socket发送到host层。
本发明的有益效果:本发明能够监测门的状态,支持分布在不同的位置的八路摄像头对门的状态进行监测,能够对于关键事件进行保存30s视频,能够满足用户的需求进行个性化阈值设定。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明智能开关门检测方法的方法步骤结构示意图。
图2为本发明智能开关门检测方法的残差函数示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
再其次,本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
参照图1-图2,提供了一种智能开关门检测方法,其特征在于,包括以下步骤:
步骤一:输入检测的图像并在网络中共提取三个特征层,其大小分别为13×13,26×26,52×52,这三个特征层用于与上采样后的其他特征层进行拼接或预测输出;
步骤二:最底层的特征层13×13,在进行卷积处理后,分别用于预测输出,或经过卷积和上采样与26×26的特征图进行拼接,然后经过拼接后的特征图同样在进行卷积处理之后,用于预测输出以及通过卷积和上采样实现与52×52特征层的拼接,对该拼接后的特征层进行卷积处理之后进行预测输出;
步骤三:在网络模型的最后一层,融合三个预测输出,采用开关门检测模型算法实现对检测准确度进行提升并得到最终的检测结果。
其中,所述步骤一种的网络采用特征提取网络:Darknet53,该特征提取网络含有53个卷积层;
其中,所述步骤三中的开关门检测模型算法中每个单元格输出3个结果,每个结果对应一个先验框,目标检测框的结果需要结合先验框并通过计算得出目标边界框的坐标,具体的,所述开关门检测模型算法公式如下:
bx=σ(tx)+cx
by=σ(ty)+cy
其中,cx和cy为先验框的中心在该特征图中的坐标,pw和ph为先验框的宽和高,(tx,ty)预测边界框中心偏移量,(bx,by)为宽高缩放比为最终预测的目标边界框的在特征图中的中心坐标,bw,bh为最终预测的目标边界框的宽和高;σ(x)函数代表sigmoid函数用于预测偏移量缩放至0到1之间,进一步的,所述目标检测公式计算后结合置信度与非极大值抑制对预测目标框进行筛选;完成目标边界框预测之后,在原始图像中会出现一个目标拥有多个预测框,此时先通过置信度判断该目标框中是否存在目标物体,然后通过目标框的位置坐标和置信度进行非极大值抑制,通过交并比IoU筛选出最终的目标边界框
其中,所述函数算法中加入Beta函数,能够更有效的获得图片特征,提高目标检测的准确度,具体包括:
G(x)=σF(x)+(1-σ)x
其中σ代表Beta函数。
其中,所述智能开关门检测方法运用了开关门检测系统,其包括host层和device层,所述host层采用八核处理器芯片,所述Device层内设置有加速模块并集成处理器,在端侧实现图像识别、图像分类,所述开关门检测系统首先通过opencv拉取视频流进行处理,之后通过socket将图片发送到device层种的加速模块,加速模块接收图片并将图片输入到开关门检测模型,最后将检测结果通过socket发送到host层。
具体的,本发明是基于华为Atlas芯片的智能开关门检测系统实现分为两个部分:host、device。host使用Rk3588芯片,首先通过opencv拉取视频流进行处理,之后通过socket将图片发送到device华为Atlas200AI加速模块,华为Atlas200AI加速模块接收图片,将图片输入到开关门检测模型,最后将检测结果通过socket发送到host侧。
进一步的,host侧:
RK3588是新一代国产旗舰高性能64位八核处理器,采用8nm工艺,具有高算力、低功耗、超强多媒体、丰富数据接口等特点。
1.内置3DGPU,兼容OpenGLES1.1/2.0/3.2、OpenCL2.2和Vulkan1.2。带有MMU的特殊2D硬件引擎将最大限度地提高显示性能,并提供非常平稳的操作。
2.可支持32路1080P解码,内置多种功能强大的嵌入式硬件引擎,支持8K@60fps的H.265和VP9解码器、8K@30fps的H.264解码器和4K@60fps的AV1解码器;支持8K30fps的H.264和H.265编码器,高质量JPEG编码器/解码器,专门的图像预处理器和后处理器。
3.内置的NPU算力最高可达6.0TOPs,三核结构,算力灵活分配。高算力NPU可支持INT4/INT8/INT16/FP16混合运算,其强大的兼容性,可以轻松转换基于TensorFlow/MXNet/PyTorch/Caffe等一系列框架的网络模型。
瑞芯微RK3588采用8nmLP工艺,基于四核Cortex-A76,四核Cortex-A55大小核CPU结构的64bit超高性能处理器,主频高达2.4GHz,性能强劲的RK3588可为各类AI应用场景带来极其优异的性能表现,和RK3399相比CPU性能提升了3倍;2D硬件引擎将最大限度地提高显示性能。
device侧:Device侧使用Atlas200AI加速模块
Atlas200AI加速模块集成了昇腾310AI处理器,可以在端侧实现图像识别、图像分类等,广泛用于智能摄像机、机器人、无人机等端侧AI场景。半张信用卡大小即可提供22TOPSINT8算力,支持20路高清视频实时分析(1080P25FPS)支持毫瓦级休眠、毫秒级唤醒,典型功耗仅5.5W,使能边缘AI应用。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种智能开关门检测方法,其特征在于,包括以下步骤:
步骤一:输入检测的图像并在网络中共提取三个特征层,其大小分别为13×13,26×26,52×52,这三个特征层用于与上采样后的其他特征层进行拼接或预测输出;
步骤二:最底层的特征层13×13,在进行卷积处理后,分别用于预测输出,或经过卷积和上采样与26×26的特征图进行拼接,然后经过拼接后的特征图同样在进行卷积处理之后,用于预测输出以及通过卷积和上采样实现与52×52特征层的拼接,对该拼接后的特征层进行卷积处理之后进行预测输出;
步骤三:在网络模型的最后一层,融合三个预测输出,采用开关门检测模型算法实现对检测准确度进行提升并得到最终的检测结果。
2.根据权利要求1所述的智能开关门检测方法,其特征在于:所述步骤一种的网络采用特征提取网络:Darknet53,该特征提取网络含有53个卷积层。
3.根据权利要求2所述的智能开关门检测方法,其特征在于:所述步骤三中的开关门检测模型算法中每个单元格输出3个结果,每个结果对应一个先验框,目标检测框的结果需要结合先验框并通过计算得出目标边界框的坐标。
4.根据权利要求3所述的智能开关门检测方法,其特征在于:所述开关门检测模型算法公式如下:
bx=σ(tx)+cx
by=σ(ty)+cy
其中,cx和cy为先验框的中心在该特征图中的坐标,pw和ph为先验框的宽和高,(tx,ty)预测边界框中心偏移量,(bx,by)为宽高缩放比为最终预测的目标边界框的在特征图中的中心坐标,bw,bh为最终预测的目标边界框的宽和高;σ(x)函数代表sigmoid函数用于预测偏移量缩放至0到1之间。
5.根据权利要求4所述的智能开关门检测方法,其特征在于:所述目标检测公式计算后结合置信度与非极大值抑制对预测目标框进行筛选;完成目标边界框预测之后,在原始图像中会出现一个目标拥有多个预测框,此时先通过置信度判断该目标框中是否存在目标物体,然后通过目标框的位置坐标和置信度进行非极大值抑制,通过交并比IoU筛选出最终的目标边界框。
6.根据权利要求5所述的智能开关门检测方法,其特征在于:所述函数算法中加入Beta函数,能够更有效的获得图片特征,提高目标检测的准确度,具体包括:
G(x)=σF(x)+(1-σ)x
其中σ代表Beta函数。
7.根据权利要求1所述的智能开关门检测方法,其特征在于:所述智能开关门检测方法运用了开关门检测系统,其包括host层和device层,所述host层采用八核处理器芯片,所述Device层内设置有加速模块并集成处理器,在端侧实现图像识别、图像分类。
8.根据权利要求7所述的智能开关门检测方法,其特征在于:所述开关门检测系统首先通过opencv拉取视频流进行处理,之后通过socket将图片发送到device层种的加速模块,加速模块接收图片并将图片输入到开关门检测模型,最后将检测结果通过socket发送到host层。
CN202311349500.1A 2023-10-18 2023-10-18 一种智能开关门检测方法 Active CN117351420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311349500.1A CN117351420B (zh) 2023-10-18 2023-10-18 一种智能开关门检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311349500.1A CN117351420B (zh) 2023-10-18 2023-10-18 一种智能开关门检测方法

Publications (2)

Publication Number Publication Date
CN117351420A true CN117351420A (zh) 2024-01-05
CN117351420B CN117351420B (zh) 2024-06-04

Family

ID=89359114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311349500.1A Active CN117351420B (zh) 2023-10-18 2023-10-18 一种智能开关门检测方法

Country Status (1)

Country Link
CN (1) CN117351420B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263692A (zh) * 2019-06-13 2019-09-20 北京数智源科技有限公司 大场景下集装箱开关门状态识别方法
CN110728200A (zh) * 2019-09-23 2020-01-24 武汉大学 一种基于深度学习的实时行人检测方法及系统
WO2020177432A1 (zh) * 2019-03-07 2020-09-10 中国科学院自动化研究所 基于目标检测网络的多标签物体检测方法、系统、装置
CN111882053A (zh) * 2019-11-25 2020-11-03 华南理工大学 一种基于拼接卷积的神经网络模型压缩方法
CN112308827A (zh) * 2020-10-23 2021-02-02 复旦大学 基于深度卷积神经网络的毛囊检测方法
CN113298181A (zh) * 2021-06-16 2021-08-24 合肥工业大学智能制造技术研究院 基于密集连接的Yolov3网络的井下管道异常目标识别方法及系统
CN114092998A (zh) * 2021-11-09 2022-02-25 杭州电子科技大学信息工程学院 一种基于卷积神经网络的佩戴口罩人脸识别检测方法
CN114417993A (zh) * 2022-01-18 2022-04-29 北京航空航天大学 一种基于深度卷积神经网络和图像分割的划痕检测方法
CN114648054A (zh) * 2021-12-30 2022-06-21 中国人民公安大学 一种基于yolov4改进算法的人群异常行为检测方法
CN115761401A (zh) * 2022-11-09 2023-03-07 杭州像素元科技有限公司 一种基于卷积神经网络的高速公路小目标检测方法及装置
WO2023174098A1 (zh) * 2022-03-14 2023-09-21 百果园技术(新加坡)有限公司 一种实时手势检测方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020177432A1 (zh) * 2019-03-07 2020-09-10 中国科学院自动化研究所 基于目标检测网络的多标签物体检测方法、系统、装置
CN110263692A (zh) * 2019-06-13 2019-09-20 北京数智源科技有限公司 大场景下集装箱开关门状态识别方法
CN110728200A (zh) * 2019-09-23 2020-01-24 武汉大学 一种基于深度学习的实时行人检测方法及系统
CN111882053A (zh) * 2019-11-25 2020-11-03 华南理工大学 一种基于拼接卷积的神经网络模型压缩方法
CN112308827A (zh) * 2020-10-23 2021-02-02 复旦大学 基于深度卷积神经网络的毛囊检测方法
CN113298181A (zh) * 2021-06-16 2021-08-24 合肥工业大学智能制造技术研究院 基于密集连接的Yolov3网络的井下管道异常目标识别方法及系统
CN114092998A (zh) * 2021-11-09 2022-02-25 杭州电子科技大学信息工程学院 一种基于卷积神经网络的佩戴口罩人脸识别检测方法
CN114648054A (zh) * 2021-12-30 2022-06-21 中国人民公安大学 一种基于yolov4改进算法的人群异常行为检测方法
CN114417993A (zh) * 2022-01-18 2022-04-29 北京航空航天大学 一种基于深度卷积神经网络和图像分割的划痕检测方法
WO2023174098A1 (zh) * 2022-03-14 2023-09-21 百果园技术(新加坡)有限公司 一种实时手势检测方法及装置
CN115761401A (zh) * 2022-11-09 2023-03-07 杭州像素元科技有限公司 一种基于卷积神经网络的高速公路小目标检测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
严娟;方志军;高永彬;: "结合混合域注意力与空洞卷积的3维目标检测", 中国图象图形学报, no. 06, 16 June 2020 (2020-06-16) *
李德军;赵文杰: "基于影像融合技术的合成孔径雷达(SAR)图像目标识别方法的探讨", 影像技术, no. 5, 15 December 2007 (2007-12-15) *

Also Published As

Publication number Publication date
CN117351420B (zh) 2024-06-04

Similar Documents

Publication Publication Date Title
CN111210443B (zh) 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
Yin et al. Recurrent convolutional network for video-based smoke detection
US20210090217A1 (en) Video coding for machine (vcm) based system and method for video super resolution (sr)
WO2007126525A3 (en) Video segmentation using statistical pixel modeling
CN108347612B (zh) 一种基于视觉注意机制的监控视频压缩与重构方法
CN103067702B (zh) 一种用于具有静止画面视频的视频浓缩方法
Kryjak et al. Real-time moving object detection for video surveillance system in FPGA
CN114187275A (zh) 一种基于多阶段和多尺度注意力融合网络及图像去雨方法
CN112241939A (zh) 一种基于多尺度和非局部的轻量去雨方法
CN113076902B (zh) 一种多任务融合的人物细粒度分割系统和方法
CN111027440A (zh) 一种基于神经网络的人群异常行为检测装置和检测方法
CN110677624A (zh) 基于深度学习的面向监控视频的前景和背景并行压缩方法
CN117351420B (zh) 一种智能开关门检测方法
Li et al. Gaussian-based codebook model for video background subtraction
Xue et al. Multi‐scale pedestrian detection with global–local attention and multi‐scale receptive field context
Lin et al. Airborne moving vehicle detection for urban traffic surveillance
CN116824630A (zh) 一种轻量化红外图像行人目标检测方法
Tezuka et al. A precise and stable foreground segmentation using fine-to-coarse approach in transform domain
Cheng et al. Dense-acssd for end-to-end traffic scenes recognition
CN116189027A (zh) 基于多层特征融合的Faster R-cnn上下文机制优化方法
Zhang et al. Research on rainy day traffic sign recognition algorithm based on PMRNet
Jagdale et al. High definition surveillance system using motion detection method based on FPGA DE-II 70 board
US20050047665A1 (en) Method for segmenting moving object of compressed moving image
An et al. Research review of object detection algorithms in vehicle detection
CN112200840A (zh) 一种可见光和红外图像组合中的运动物体检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 210000 building d17, Zidong International Creative Park, No. 2, Zidong Road, Maqun street, Qixia District, Nanjing, Jiangsu Province

Applicant after: Jiangsu Sixingda Information Technology Co.,Ltd.

Address before: 210049 building d17, Zidong International Creative Park, No.2, Zidong Road, Maqun street, Qixia District, Nanjing City, Jiangsu Province

Applicant before: Jiangsu sixingda Information Technology Co.,Ltd.

Country or region before: China

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant