CN116456184B - 一种调整摄像头安装点位的方法、装置、设备及存储介质 - Google Patents
一种调整摄像头安装点位的方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116456184B CN116456184B CN202310725920.9A CN202310725920A CN116456184B CN 116456184 B CN116456184 B CN 116456184B CN 202310725920 A CN202310725920 A CN 202310725920A CN 116456184 B CN116456184 B CN 116456184B
- Authority
- CN
- China
- Prior art keywords
- picture data
- camera
- subset
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 95
- 238000001514 detection method Methods 0.000 claims abstract description 83
- 238000012795 verification Methods 0.000 claims abstract description 43
- 238000012360 testing method Methods 0.000 claims abstract description 31
- 238000009434 installation Methods 0.000 claims abstract description 17
- 230000004927 fusion Effects 0.000 claims description 21
- 238000005286 illumination Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 5
- 238000011176 pooling Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Studio Devices (AREA)
Abstract
本申请公开了一种调整摄像头安装点位的方法、装置、设备及存储介质,该方法包括:获取摄像头在预设安装点位所拍摄的图片数据;对所述图片数据进行分类,得到多个类型的图片数据集,各所述图片数据集包含测试子集、训练子集和验证子集;采用各所述训练子集和各所述验证子集对相应的模型进行训练,得到相应的检测模型;将多个所述检测模型进行加权融合,得到摄像头选点模型;将各所述测试子集输入到所述摄像头选点模型中,对所述摄像头的安装点位进行调整。通过对摄像头安装点位进行优化,使得在不影响摄像头成本的前提之下,提升其所拍摄的视频或图片的质量。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种调整摄像头安装点位的方法、装置、设备及存储介质。
背景技术
在售楼处渠道风控系统中,抓拍摄像头拍摄的视频与图片是后续的渠道风险判定、佣金结算重要的判定依据,如果获得的图片或者视频的质量不高会严重影响后续的判断。所以,有必要提高获取到的图片或者视频的质量。
相关技术中,在固定安装点位通过选取性能更高的摄像头来获取高质量的图片或者视频。然而,图片或者视频的质量有所提升的同时,也提高了摄像头的成本。
发明内容
基于上述问题,本申请提供了一种调整摄像头安装点位的方法、装置、设备及存储介质,在保证摄像头成本的前提之下提高图片或者视频的质量。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供一种调整摄像头安装点位的方法,所述方法包括:
获取摄像头在预设安装点位所拍摄的图片数据;
对所述图片数据进行分类,得到多个类型的图片数据集;各所述图片数据集包含测试子集、训练子集和验证子集;
采用各所述训练子集和各所述验证子集对相应的模型进行训练,得到相应的检测模型;
将多个所述检测模型进行加权融合,得到摄像头选点模型;
将各所述测试子集输入到所述摄像头选点模型中,对所述摄像头的所述安装点位进行调整。
可选地,所述图片数据集包括光照数据集、拍摄距离数据集、清晰度数据集、偏转角度数据集以及目标位置数据集;所述检测模型包括光照检测模型、拍摄距离检测模型、清晰度检测模型、偏转角检测模型以及目标位置检测模型。
可选地,所述采用各所述训练子集和各所述验证子集对相应的模型进行训练,得到相应的检测模型,具体包括:
各所述检测模型前向传播时,将各所述训练子集和各所述验证子集分批次输入到相应的模型中进行处理,得到对应的预测参数;
通过对应的损失函数计算各所述预测参数相较于对应的实际参数的损失值;
各所述检测模型反向传播时,基于预设方法降低所述损失值直至所述损失值小于预设阈值,得到相应的检测模型。
可选地,所述将多个所述检测模型进行加权融合,得到摄像头选点模型,具体包括:
获得各所述检测模型的输出参数;所述输出参数至少包括所述摄像头的移动方向、所述摄像头的移动距离以及所述摄像头的焦距中的任意两项;
根据各所述检测模型的所述输出参数,将多个所述检测模型进行加权融合,得到摄像头选点模型。
可选地,所述对所述图片数据进行分类,得到多个类型的图片数据集,具体包括:
对所述图片数据进行分类,得到多个类型的预备图片数据集;
对各所述预备图片数据集进行数据增强处理,得到对应的图片数据集;所述图片数据集中的正向图片数据与反向图片数据均衡;其中,所述正向图片数据指示所述图片数据的质量参数大于或等于预设阈值,所述反向图片数据指示所述图片数据的质量参数小于预设阈值。
可选地,所述获取摄像头在预设安装点位所拍摄的图片数据之后,所述方法还包括:
对所述图片数据进行预处理,所述预处理包括对所述图片数据进行剪切、缩放以及归一化操作中的至少一项。
第二方面,本申请实施例提供一种调整摄像头安装点位的装置,所述装置包括:获得模块、分类模块、训练模块、融合模块以及调整模块;
所述获得模块,用于获取摄像头在预设安装点位所拍摄的图片数据;
所述分类模块,用于对所述图片数据进行分类,得到多个类型的图片数据集,各所述图片数据集包含测试子集、训练子集和验证子集;
所述训练模块,用于采用各所述训练子集和各所述验证子集对相应的模型进行训练,得到相应的检测模型;
所述融合模块,用于将多个所述检测模型进行加权融合,得到摄像头选点模型;
所述调整模块,用于将各所述测试子集输入到所述摄像头选点模型中,对所述摄像头的所述安装点位进行调整。
可选地,所述图片数据集包括光照数据集、拍摄距离数据集、清晰度数据集、偏转角度数据集以及目标位置数据集;所述检测模型包括光照检测模型、拍摄距离检测模型、清晰度检测模型、偏转角检测模型以及目标位置检测模型。
可选地,所述训练模块,具体用于:
各所述检测模型前向传播时,将各所述训练子集和各所述验证子集分批次输入到相应的模型中进行处理,得到对应的预测参数;
通过对应的损失函数计算各所述预测参数相较于对应的实际参数的损失值;
各所述检测模型反向传播时,基于预设方法降低所述损失值直至所述损失值小于预设阈值,得到相应的检测模型。
可选地,所述融合模块,具体用于:
获得各所述检测模型的输出参数;所述输出参数至少包括所述摄像头的移动方向、所述摄像头的移动距离以及所述摄像头的焦距中的任意两项;
根据各所述检测模型的所述输出参数,将多个所述检测模型进行加权融合,得到摄像头选点模型。
可选地,所述分类模块,具体用于:
对所述图片数据进行分类,得到多个类型的预备图片数据集;
对各所述预备图片数据集进行数据增强处理,得到对应的图片数据集;所述图片数据集中的正向图片数据与反向图片数据均衡;其中,所述正向图片数据指示所述图片数据的质量参数大于或等于预设阈值,所述反向图片数据指示所述图片数据的质量参数小于预设阈值。
可选地,所述装置还包括:预处理模块;
对所述图片数据进行预处理,所述预处理包括对所述图片数据进行剪切、缩放以及归一化操作中的至少一项。
第三方面,本申请实施例提供一种计算机设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面任一项所述的调整摄像头安装点位的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如第一方面任一项所述的调整摄像头安装点位的方法。
本申请所提供的一种获取摄像头安装点位的方法,该方法包括:获取摄像头在预设安装点位所拍摄的图片数据;对图片数据进行分类,得到多个类型的图片数据集,各图片数据集包含测试子集、训练子集和验证子集;采用各训练子集和各验证子集对各图像训练集所对应的模型进行训练,得到对应的检测模型;将多个检测模型进行加权融合,得到摄像头选点模型;将各测试子集输入到摄像头选点模型中,对所述摄像头的所述安装点位进行调整。
相较于现有技术,本申请具有以下有益效果:
第一、本申请通过对摄像头安装点位进行优化,使得在不影响摄像头成本的前提之下,提升了其所拍摄的视频或图片的质量;
第二、相较于通过独立模型而言,本申请通过多模型的融合得到摄像头选点模型,并根据摄像头选点模型得到摄像头的安装点位,使得获得更优的摄像头安装点位,进而提升摄像头所拍摄的视频或图片的质量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种调整摄像头安装点位的方法的流程图;
图2为本申请实施例提供的一种检测模型的示意图;
图3为本申请实施例提供的另一种调整摄像头安装点位的方法的流程图;
图4为本申请实施例提供的一种模型融合的示意图;
图5为本申请实施例提供的一种调整摄像头安装点位的装置的结构示意图;
图6为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
正如前文描述,目前想要获得高质量的视频或图片都是通过设备升级来加以实现的,比如使用像素更高的摄像头。但是,通过设备升级的方式会提高摄像头的成本。
针对上述技术问题,本申请提供一种调整摄像头安装点位的方法,通过优化摄像头安装点位提升图片或视频的质量。该方法包括:获取摄像头在预设安装点位所拍摄的图片数据;对图片数据进行分类,得到多个类型的图片数据集,各图片数据集包含测试子集、训练子集和验证子集;采用各训练子集和各验证子集对各图像训练集所对应的模型进行训练,得到对应的检测模型;将多个检测模型进行加权融合,得到摄像头选点模型;将各测试子集输入到摄像头选点模型中,对所述摄像头的所述安装点位进行调整。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,该图为本申请实施例提供的一种调整摄像头安装点位的方法的流程图。
如图1所示,该方法包括:
S101:获取摄像头在预设安装点位所拍摄的图片数据。
其中,
摄像头可以是具有照相功能的摄像头,即可以直接获得图片数据;摄像头还可以是不具备照相功能的摄像头,即先获得视频数据,然后再将视频数据逐帧转换为图片数据;摄像头所处的场景可以是售楼处、银行以及各种需要进行摄像头安装的场景。本申请实施例中不对具体的场景进行相应的限制。
预设安装点位可以根据用户的实际需要进行设定。
需要注意的是,本实施中所获取到的图片数据是在相关部分允许的前提条件下所获取到的图片数据。
S102:对图片数据进行分类,得到多个类型的图片数据集,各图片数据集包含测试子集、训练子集和验证子集。
作为示例,图片数据集包括光照数据集、拍摄距离数据集、清晰度数据集、偏转角度数据集以及目标位置数据集。
具体地,根据图片的光照、拍摄距离、图片的清晰度、偏转角度以及目标位置这五大因素,将图片数据分成五个数据集,分别为光照数据集、拍摄距离数据集、清晰度数据集、偏转角度数据集以及目标位置数据集。需要注意的是,“目标位置”可以是待监测目标所处的位置,例如,在使用场景为售楼处的渠道风控系统时,“目标位置”可以是客户出现在图片中的位置。
其中,光照数据集分为第一测试子集、第一训练子集和第一验证子集;拍摄距离数据集分为第二测试子集、第二训练子集和第二验证子集;清晰度数据集分为第三测试子集、第三训练子集和第三验证子集;偏转角度数据集分为第四测试子集、第四训练子集和第四验证子集;目标位置数据集分为第五测试子集、第五训练子集和第五验证子集。
在一可选的实施方式中,训练子集、测试子集与验证子集的比例为8:1:1。
S103:采用各训练子集和各验证子集对相应的模型进行训练,得到相应的检测模型。
当图片数据集包括光照数据集、拍摄距离数据集、清晰度数据集、偏转角度数据集以及目标位置数据集的时候,检测模型可以包括光照检测模型 (Light ConvolutionalNeural Network,LCNN)、距离检测模型(Distance Convolutional Neural Network,DCNN)、清晰度检测模型(Definition Convolutional Neural Network,DECNN)、偏转角检测模型(Angle Convolutional Neural Network,ACNN)以及位置检测模型(PositionConvolutional Neural Network,PCNN)。
其中,LCNN采用第一训练子集以及第一验证子集进行训练;DCNN采用第二训练子集以及第二验证子集进行训练;DECNN采用第三训练子集以及第三验证子集训练得到;ACNN采用第四训练子集以及第四验证子集训练得到;PCNN采用第五训练子集以及第五验证子集得到。
S104:将多个检测模型进行加权融合,得到摄像头选点模型。
具体地,将LCNN、DCNN、DECNN、ACNN以及PCNN进行加权融合,得到摄像头选点模型(Convolution Neural Network for Camera Point Selection,CNNCPS)。需要注意的是,各模型的权重可根据用户的需求进行适当的调整,本申请实施例不对各模型的权重进行限制。
S105:将各测试子集输入到摄像头选点模型中,对摄像头的安装点位进行调整。
具体地,将第一测试子集、第二测试子集、第三测试子集、第四测试子集以及第五测试子集作为CNNCPS的输入,得到摄像头的移动方向、摄像头的移动距离以及摄像头的焦距,根据摄像头的移动方法、摄像头的移动距离以及摄像头的焦距对摄像头的安装点位进行调整。
本申请实施例通过对摄像头安装点位进行优化,使得在不影响摄像头成本的前提之下,提升了其所拍摄的视频或图片的质量;除此之外,本申请通过多模型的融合得到摄像头选点模型,并根据摄像头选点模型得到摄像头的安装点位,使得获得更优的摄像头安装点位,进而提升摄像头所拍摄的视频或图片的质量。
参见图2,该图为本申请实施例提供的另一种调整摄像头安装点位的方法的流程图。
如图2所示,该方法包括:
S201:获取摄像头在预设安装点位所拍摄的图片数据。
S202:对图片数据进行预处理。
作为示例,预处理包括但不限于图片数据进行剪切、缩放以及归一化等操作。其中,归一化可以是对图像进行了一系列标准的处理变换,使之变换为一固定标准形式的过程,该标准图像称作归一化图像。
通过对图片数据进行预处理,可以提升后续图片的质量,进而提升摄像头选点的准确性。
S203:对各所述预备图片数据集进行数据增强处理。
由于图片数据中有一部分的图片将被用于模型训练的过程中,因此除了会使用到正向数据之外,还需要使用负向数据。其中,在本实施例中正线数据指的是图片质量高于预设阈值的数据,负向数据指的是图片质量低于预设阈值的数据。
作为示例,基于图像光照处理技术改变光照数据集中图像数据的光照强度,得到正向负向数据均衡的光照数据集;基于图像缩放处理技术改变距离数据集中图像数据的拍摄距离远近,得到正向负向数据均衡的拍摄距离数据集;基于图像处理技术改变清晰度数据集中图像数据的清晰度和遮挡因素,得到正向负向数据均衡的清晰度数据集;对偏转角数据集中的图像数据进行90°、180°、270°偏转,得到正向负向数据均衡的偏转角数据集;基于图像处理技术改变位置数据集中图像数据的人物位置信息,得到正向负向数据均衡的目标位置数据集。
通过采用正向负向数据均衡的数据集来对相应的模型进行训练,可以改善模型的输出准确性。
S204:对图片数据进行分类,得到多个类型的图片数据集,各图片数据集包含测试子集、训练子集和验证子集。
S205:采用各训练子集和各验证子集对相应的模型进行训练,得到相应的检测模型。
作为示例,LCNN模型的结构及训练过程如下:
如图3所示,LCNN具有十层结构,包括五层卷积层、两层池化层以及三层全连接层,C代表卷积层、P代表池化层、Fc代表全连接层;左边输入层数据的维度是3*218*218,即图像通道数目为3,尺寸大小为218*218;C1卷积层采用4*4的卷积核,其步长为1,图像初始填充尺寸为3,采用的是零填充方法;C2、C3、C4、C5层采用3*3的卷积核,步长为1,填图像充为尺寸大小为1,同样采用零填充策略;池化层采用最大池化Maxpool策略;激活函数采用RELU函数,激活函数公式如下所示:
其中,五层卷积层用于光照数据集的特征提取任务;两层池化层进行全局特征的提取,使得模型获取的特征更为丰富;三层全连接层用于学习特征与目标的关系,输出层输出摄像头移动方向和距离的预测结果。
通过第一训练子集以及第一验证子集对LCNN进行训练的具体步骤如下:
第一步,在模型前向传播的时,将训练集和验证集分批次输入到模型当中,依次经过卷积层提取特征、激活函数加入非线性特征、池化层提取全局特征、全连接层进行分类获得预测结果;
第二步,通过损失函数计算各所述预测参数和实际参数之间的损失值;
第三步,各所述检测模型反向传播时,基于预设优化策略降低所述损失值直至所述损失值小于预设阈值,得到对应的LCNN模型。
作为示例,DCNN模型的结构及训练过程如下:
DCNN模型具有九层结构,包括四层卷积层、两层池化层以及三层全连接层。卷积层全都采用3*3、步长为1的卷积核,学习率设置为0.0001,训练代数设置为4。输出层的输出为摄像头移动方向、摄像头的移动距离以及摄像头的焦距的预测结果。
可以理解的是,DCNN模型的训练过程同LCNN模型的训练过程是一致的,区别仅仅在于DCNN模型的训练采用的是第二训练子集以及第二验证子集,此处不再进行赘述。
作为示例,DECNN模型的结构及训练过程如下:
DECNN模型具有九层结构,包括四层卷积层、两层池化层以及三层全连接层。前两层采用的是5*5、步长为1的卷积核;后两层采用的是4*4、步长为1的卷积核,学习率设置为0.0001,训练代数设置为4。输出层的输出为摄像头移动方向、摄像头的移动距离以及摄像头的焦距的预测结果。
可以理解的是,DECNN模型的训练过程同LCNN模型的训练过程是一致的,区别仅仅在于DECNN模型的训练采用的第三训练子集以及第三验证子集,此处不再进行赘述。
作为示例,ACNN模型的结构及训练过程如下:
ACNN模型具有12层结构,包括六层卷积层、三层池化层以及三层全连接层。其中,第一层卷积层采用5*5的卷积核,其步长为1,图像初始填充尺寸为3,采用的是零填充方法;第二、三层采用4*4的卷积核,步长为1,填图像充为尺寸大小为1,采用零填充策略;第四、五层采用3*3的卷积核,步长为1,填图像充为尺寸大小为1,同样采用零填充策略;池化层采用平均池化Maxpool策略;激活函数采用RELU函数。训练过程中设置学习率为0.001,批尺寸为128,训练代数为7,采用的优化策略是Adam策略,损失函数采用交叉熵损失函数(CrossEntropyLoss)。输出层的输出为摄像头移动方向和摄像头的焦距的预测结果。
可以理解的是,ACNN模型的训练过程同LCNN模型的训练过程是一致的,区别仅仅在于ACNN模型的训练采用的是第四训练子集以及第四验证子集,此处不再进行赘述。
作为示例,PCNN模型的结构及训练过程如下:
PCNN模型具有11层结构,包括五层卷积层、三层池化层以及三层全连接层。其中,卷积层全部采用3*3、步长为1的卷积核,训练过程中设置学习率为0.001,训练代数设置为5。输出层的输出为摄像头移动方向和摄像头焦距的预测结果。
可以理解的是,PCNN模型的训练过程同LCNN模型的训练过程是一致的,区别仅仅在于PCNN模型的训练采用的是第五训练子集以及第五验证子集,此处不再进行赘述。
S206:将多个检测模型进行加权融合,得到摄像头选点模型。
具体地,将LCNN、DCNN、DECNN、ACNN以及PCNN进行加权融合,得到摄像头选点模型(Convolution Neural Network for Camera Point Selection,CNNCPS)。
作为示例,LCNN模型的输出为摄像头移动方向和摄像头移动距离;DCNN模型的输出为摄像头移动方向、摄像头的移动距离以及摄像头的焦距;DECNN模型的输出为摄像头移动方向、摄像头的移动距离以及摄像头的焦距;ACNN模型的输出为摄像头的移动方向以及摄像头的焦距;PCNN模型的输出为摄像头的移动方向以及摄像头的焦距,其融合示例图如图4所示。
S207:将各测试子集输入到摄像头选点模型中,对摄像头的安装点位进行调整。
参见图5,该图为本申请实施例提供的一种调整摄像头安装点位的装置的结构示意图。
如图5所示,该装置包括:获得模块501、分类模块502、训练模块503、融合模块504以及调整模块505;
获得模块501,用于获取摄像头在预设安装点位所拍摄的图片数据;
分类模块502,用于对图片数据进行分类,得到多个类型的图片数据集,各图片数据集包含测试子集、训练子集和验证子集;
训练模块503,用于采用各训练子集和各验证子集对相应的模型进行训练,得到相应的检测模型;
融合模块504,用于将多个检测模型进行加权融合,得到摄像头选点模型;
调整模块505,用于将各测试子集输入到摄像头选点模型中,对摄像头的安装点位进行调整。
可选地,图片数据集包括光照数据集、拍摄距离数据集、清晰度数据集、偏转角度数据集以及目标位置数据集;检测模型包括光照检测模型、拍摄距离检测模型、清晰度检测模型、偏转角检测模型以及目标位置检测模型。
可选地,训练模块503,具体用于:
各检测模型前向传播时,将各所述训练子集和各验证子集分批次输入到相应的模型中进行处理,得到各预测参数;
通过损失函数计算各预测参数相较于各实际参数的损失值;
各检测模型反向传播时,基于预设方法降低损失值直至损失值小于预设阈值,得到对应的检测模型。
可选地,融合模块504,具体用于:
获得各检测模块的输出参数;输出参数至少包括摄像头的移动方向、摄像头的移动距离以及摄像头的焦距;
根据各检测模块的输出参数,将多个检测模型进行加权融合,得到摄像头选点模型。
可选地,分类模块502,具体用于:
对图片数据进行分类,得到多个类型的预备图片数据集;
对各预备图片数据集进行数据增强处理,得到对应的图片数据集;图片数据集中的正向图片数据与反向图片数据均衡;其中,正向图片数据指示图片数据的质量参数大于或等于预设阈值,反向图片数据指示图片数据的质量参数小于预设阈值。
可选地,装置还包括:预处理模块;
预处理模块,具体用于对图片数据进行预处理,预处理包括岁图片数据进行剪切、缩放以及归一化的操作。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请实施例所述的调整摄像头安装点位的方法。
在实际应用中,所述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
如图6所示,本申请实施例提供的一种计算机设备的结构示意图。图6显示的计算机设备12,计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图6中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例提供的调整摄像头安装点位的方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元提示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种调整摄像头安装点位的方法,其特征在于,所述方法包括:
获取摄像头在预设安装点位所拍摄的图片数据;
对所述图片数据进行分类,得到多个类型的图片数据集;各所述图片数据集包含测试子集、训练子集和验证子集;
采用各所述训练子集和各所述验证子集对相应的模型进行训练,得到相应的检测模型;
将多个所述检测模型进行加权融合,得到摄像头选点模型;
将各所述测试子集输入到所述摄像头选点模型中,对所述摄像头的安装点位进行调整。
2.根据权利要求1所述的方法,其特征在于,所述图片数据集包括光照数据集、拍摄距离数据集、清晰度数据集、偏转角度数据集以及目标位置数据集;所述检测模型包括光照检测模型、拍摄距离检测模型、清晰度检测模型、偏转角检测模型以及目标位置检测模型。
3.根据权利要求1所述的方法,其特征在于,所述采用各所述训练子集和各所述验证子集对相应的模型进行训练,得到相应的检测模型,具体包括:
各所述检测模型前向传播时,将各所述训练子集和各所述验证子集分批次输入到相应的模型中进行处理,得到相应的预测参数;
通过相应的损失函数计算各所述预测参数相较于对应的实际参数的损失值;
各所述检测模型反向传播时,基于预设方法降低所述损失值直至所述损失值小于预设阈值,得到相应的检测模型。
4.根据权利要求1所述的方法,其特征在于,所述将多个所述检测模型进行加权融合,得到摄像头选点模型,具体包括:
获得各所述检测模型的输出参数;所述输出参数至少包括所述摄像头的移动方向、所述摄像头的移动距离以及所述摄像头的焦距中的任意两项;
根据各所述检测模型的所述输出参数,将多个所述检测模型进行加权融合,得到摄像头选点模型。
5.根据权利要求1所述的方法,其特征在于,所述对所述图片数据进行分类,得到多个类型的图片数据集,具体包括:
对所述图片数据进行分类,得到多个类型的预备图片数据集;
对各所述预备图片数据集进行数据增强处理,得到对应的图片数据集;所述图片数据集中的正向图片数据与反向图片数据均衡;其中,所述正向图片数据指示所述图片数据的质量参数大于或等于预设阈值,所述反向图片数据指示所述图片数据的质量参数小于预设阈值。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述获取摄像头在预设安装点位所拍摄的图片数据之后,所述方法还包括:
对所述图片数据进行预处理,所述预处理包括对所述图片数据进行剪切、缩放以及归一化操作中的至少一项。
7.一种调整摄像头安装点位的装置,其特征在于,所述装置包括:获得模块、分类模块、训练模块、融合模块以及调整模块;
所述获得模块,用于获取摄像头在预设安装点位所拍摄的图片数据;
所述分类模块,用于对所述图片数据进行分类,得到多个类型的图片数据集;各所述图片数据集包含测试子集、训练子集和验证子集;
所述训练模块,用于采用各所述训练子集和各所述验证子集对相应的模型进行训练,得到相应的检测模型;
所述融合模块,用于将多个所述检测模型进行加权融合,得到摄像头选点模型;
所述调整模块,用于将各所述测试子集输入到所述摄像头选点模型中,对所述摄像头的安装点位进行调整。
8.根据权利要求7所述的装置,其特征在于,所述训练模块,具体用于:
各所述检测模型前向传播时,将各所述训练子集和各所述验证子集分批次输入到相应的模型中进行处理,得到相应的预测参数;
通过相应的损失函数计算各所述预测参数相较于对应的实际参数的损失值;
各所述检测模型反向传播时,基于预设方法降低所述损失值直至所述损失值小于预设阈值,得到相应的检测模型。
9.一种计算机设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至6任一项所述的调整摄像头安装点位的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如权利要求1至6任一项所述的调整摄像头安装点位的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310725920.9A CN116456184B (zh) | 2023-06-19 | 2023-06-19 | 一种调整摄像头安装点位的方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310725920.9A CN116456184B (zh) | 2023-06-19 | 2023-06-19 | 一种调整摄像头安装点位的方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116456184A CN116456184A (zh) | 2023-07-18 |
CN116456184B true CN116456184B (zh) | 2023-09-08 |
Family
ID=87120586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310725920.9A Active CN116456184B (zh) | 2023-06-19 | 2023-06-19 | 一种调整摄像头安装点位的方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116456184B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472240A (zh) * | 2018-11-12 | 2019-03-15 | 北京影谱科技股份有限公司 | 人脸识别多模型自适应特征融合增强方法和装置 |
CN109522580A (zh) * | 2018-03-20 | 2019-03-26 | 广东电网有限责任公司清远供电局 | 一种基于变电站区域重要程度的监控摄像头布点方法 |
CN114155474A (zh) * | 2021-12-12 | 2022-03-08 | 菅政 | 基于视频语义分割算法的损伤识别技术 |
WO2022188379A1 (zh) * | 2021-03-12 | 2022-09-15 | 国网智能科技股份有限公司 | 服务于电力机器人的人工智能系统及方法 |
CN115661747A (zh) * | 2022-10-24 | 2023-01-31 | 山东交通学院 | 一种基于计算机视觉的仓储货物数量估算方法 |
CN116012568A (zh) * | 2023-01-04 | 2023-04-25 | 东南大学 | 一种通过拍照心电图获取心电节律信息的系统 |
WO2023095460A1 (en) * | 2021-11-25 | 2023-06-01 | Mitsubishi Electric Corporation | System and method for automated transfer learning with domain disentanglement |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230162023A1 (en) * | 2021-11-25 | 2023-05-25 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Automated Transfer Learning with Domain Disentanglement |
-
2023
- 2023-06-19 CN CN202310725920.9A patent/CN116456184B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522580A (zh) * | 2018-03-20 | 2019-03-26 | 广东电网有限责任公司清远供电局 | 一种基于变电站区域重要程度的监控摄像头布点方法 |
CN109472240A (zh) * | 2018-11-12 | 2019-03-15 | 北京影谱科技股份有限公司 | 人脸识别多模型自适应特征融合增强方法和装置 |
WO2022188379A1 (zh) * | 2021-03-12 | 2022-09-15 | 国网智能科技股份有限公司 | 服务于电力机器人的人工智能系统及方法 |
WO2023095460A1 (en) * | 2021-11-25 | 2023-06-01 | Mitsubishi Electric Corporation | System and method for automated transfer learning with domain disentanglement |
CN114155474A (zh) * | 2021-12-12 | 2022-03-08 | 菅政 | 基于视频语义分割算法的损伤识别技术 |
CN115661747A (zh) * | 2022-10-24 | 2023-01-31 | 山东交通学院 | 一种基于计算机视觉的仓储货物数量估算方法 |
CN116012568A (zh) * | 2023-01-04 | 2023-04-25 | 东南大学 | 一种通过拍照心电图获取心电节律信息的系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116456184A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898168B (zh) | 用于目标检测的卷积神经网络模型的压缩方法和系统 | |
CN108710885B (zh) | 目标对象的检测方法和装置 | |
EP3758359A1 (en) | Focusing method and device, electronic device and computer-readable storage medium | |
WO2021164731A1 (zh) | 图像增强方法以及图像增强装置 | |
US20220335583A1 (en) | Image processing method, apparatus, and system | |
WO2021063341A1 (zh) | 图像增强方法以及装置 | |
EP4137991A1 (en) | Pedestrian re-identification method and device | |
CN111950723A (zh) | 神经网络模型训练方法、图像处理方法、装置及终端设备 | |
CN110706262B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN109409241A (zh) | 视频核验方法、装置、设备及可读存储介质 | |
CN111741228B (zh) | 一种全景图像的曝光调整方法及装置 | |
CN111951192A (zh) | 一种拍摄图像的处理方法及拍摄设备 | |
CN111797733A (zh) | 一种基于图像的行为识别方法、装置、设备和存储介质 | |
CN115100552A (zh) | 一种无人机遥感图像实时语义分割方法、介质以及设备 | |
CN112001300B (zh) | 基于按位置交叉熵的楼宇监控方法、装置和电子设备 | |
CN116456184B (zh) | 一种调整摄像头安装点位的方法、装置、设备及存储介质 | |
CN113239883A (zh) | 分类模型的训练方法、装置、电子设备以及存储介质 | |
CN110855957A (zh) | 图像处理方法及装置、存储介质和电子设备 | |
CN112132015A (zh) | 违规驾驶姿势的检测方法、装置、介质和电子设备 | |
CN115861891B (zh) | 视频目标检测方法、装置、设备及介质 | |
CN114255177B (zh) | 成像中的曝光控制方法、装置、设备及存储介质 | |
WO2023102724A1 (zh) | 图像的处理方法和系统 | |
CN111062479B (zh) | 基于神经网络的模型快速升级方法及装置 | |
CN113762017B (zh) | 一种动作识别方法、装置、设备及存储介质 | |
CN114066841A (zh) | 一种天空检测方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |