CN116580326A - 一种航空环境安全风险防控检测及预警系统 - Google Patents
一种航空环境安全风险防控检测及预警系统 Download PDFInfo
- Publication number
- CN116580326A CN116580326A CN202310744009.2A CN202310744009A CN116580326A CN 116580326 A CN116580326 A CN 116580326A CN 202310744009 A CN202310744009 A CN 202310744009A CN 116580326 A CN116580326 A CN 116580326A
- Authority
- CN
- China
- Prior art keywords
- image
- sub
- images
- aerial
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 35
- 230000002265 prevention Effects 0.000 title claims abstract description 31
- 239000013598 vector Substances 0.000 claims abstract description 80
- 238000000605 extraction Methods 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000004458 analytical method Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000000007 visual effect Effects 0.000 claims abstract description 24
- 230000008569 process Effects 0.000 claims abstract description 23
- 238000003709 image segmentation Methods 0.000 claims abstract description 16
- 238000002372 labelling Methods 0.000 claims abstract description 10
- 238000005457 optimization Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000011156 evaluation Methods 0.000 claims description 23
- 239000011159 matrix material Substances 0.000 claims description 22
- 230000007613 environmental effect Effects 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000004927 fusion Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 8
- 230000010076 replication Effects 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 238000012937 correction Methods 0.000 abstract description 3
- 230000009466 transformation Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 206010000372 Accident at work Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/17—Terrestrial scenes taken from planes or by drones
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
- G05D1/106—Change initiated in response to external conditions, e.g. avoidance of elevated terrain or of no-fly zones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
- G06F18/256—Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/72—Data preparation, e.g. statistical preprocessing of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/96—Management of image or video recognition tasks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Remote Sensing (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Automation & Control Theory (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及安全风险防控的技术领域,揭露了一种航空环境安全风险防控检测及预警系统,所述方法包括:对航空图像进行图像分割得到多个子图像,对子图像进行航空目标文本标注;基于多尺度航空图像特征提取模型得到子图像的多尺度视觉特征;基于跨模态航空图像增强分析模型得到子图像的文本分类向量;构建模态融合的航空图像识别模型,以子图像的识别结果为输出。本发明通过利用多尺度航空图像特征提取模型提取得到不同尺度下子图像的特征表示,将图像特征以及文本分类向量进行融合识别,得到子图像的识别结果并进行风险预警,在参数优化过程中对原始梯度采用结合梯度步长的校正处理,减小梯度的变换幅度,降低参数不稳定性,进而降低参数更新噪声。
Description
技术领域
本发明涉及安全风险防控的技术领域,尤其涉及航空环境安全风险防控检测及预警系统。
背景技术
随着近些年航空技术和无人机巡航技术的快速发展,航空图像中的微型目标检测任务作为航空领域中最具挑战的任务之一,航空环境的安全检测是保证航空安全的重要手段,随着航空影像数据质量的提升,该图像数据的检测面临着以下两个问题:(1)图像的空间分辨率不断提高,图像中的目标数据也越来越多,图像场景结构越来越复杂,对密集型微型目标检测较为困难;(2) 图像中不同比例尺度的目标样本具有不同的纹理特征,且待检测目标通常以任意方向显示,对微型飞行目标的准确识别存在困难。针对该问题,本发明提出一种环境安全风险防控检测及预警系统,通过多模态协同方式实现航空环境安全风险防控。
发明内容
有鉴于此,本发明提供一种航空环境安全风险防控检测方法,目的在于:1)基于无人机飞行高度与地面采样距离参数的映射关系,通过调整无人机的飞行高度,得到不同比例尺度下的航空图像,实现多比例尺度图像下的环境物体检测,并基于航空图像中的实体最大直径,过滤掉较小的环境物体,节约计算资源,得到仅包含唯一实体的子图像,并基于子图像的形状以及颜色进行航空目标文本标注,利用多尺度航空图像特征提取模型提取得到不同尺度下子图像的特征表示,并利用跨模态航空图像增强分析模型将航空目标文本转换为词向量表示,结合子图像计算得到词向量表示的置信度,进而基于置信度将词向量表示转换为子图像的文本分类向量,实现图像特征与文本的初步接触融合;2)通过构建模态融合的航空图像识别模型,将图像特征以及文本分类向量进行融合,得到子图像的识别结果,并在模型训练过程中,采用多模型协同训练的方式,并在参数优化过程中对原始梯度采用结合梯度步长的校正处理,减小梯度的变换幅度,避免参数优化过程中的不稳定性,进而降低参数更新噪声,有效保证最终参数求解结果的准确性。
为实现上述目的,本发明提供的一种环境安全风险防控检测方法,包括以下步骤:
S1:采集航空图像,对航空图像进行图像分割得到包含唯一实体的多个子图像,对子图像进行航空目标文本标注;
S2:构建多尺度航空图像特征提取模型,将包含唯一实体的子图像输入到模型中,得到子图像的多尺度视觉特征;
S3:根据多尺度视觉特征计算得到子图像的目标分类评估值;
S4:构建跨模态航空图像增强分析模型,将子图像的航空目标文本输入到模型中,得到子图像的文本分类向量;
S5:构建模态融合的航空图像识别模型,所述航空图像识别模型以子图像的目标分类评估值和文本分类向量为输入,以子图像的识别结果为输出。
作为本发明的进一步改进方法:
可选地,所述S1步骤中采集航空图像并对所采集航空图像进行图像分割,包括:
利用无人机内置相机采集航空图像,所设置无人机的航高为H,在飞行方向上相邻图像的重叠比例为5%,相邻航线间所采集图像的重叠比例为0,相机焦距为,将无人机飞行方向作为水平方向,计算得到地面采样距离参数:
;
;
其中:
表示水平方向的地面采样距离, />表示竖直方向的地面采样距离,单位为米/像素;在本发明实施例中,地面采样距离表示无人机内置相机所拍摄图像中一个像素所代表的地面距离大小;
分别为相机横向的像元大小以及纵向的像元大小,将/>设置为6.5mm,设置为4.9mm;在本发明实施例中,相机横向方向即为无人机飞行方向;
分别为相机横向的图像分辨率和纵向的图像分辨率,将/>设置为1920,设置为1080,单位为像素;
对所采集航空图像进行图像分割,其中图像分割流程为:
S11:对所采集航空图像进行灰度化处理,其中灰度化处理公式为:
;
其中:
表示航空图像中像素的/>灰度值,/>表示像素在RGB颜色通道的颜色值;像素/>表示航空图像中第i行第j列的像素;
S12:计算得到航空图像中像素的梯度/>和梯度方向/>:
;
;
将梯度高于预设置阈值的像素标记为候选边缘像素;
将候选边缘像素的梯度绝对值与沿正负梯度方向最邻近像素的梯度绝对值进行比较,若候选边缘像素的梯度绝对值为极大值,则将候选边缘像素标记为边缘像素;
S13:对于航空图像中的任意孤立的边缘像素,以该边缘像素为起点,沿正负梯度方向遍历得到最邻近的孤立的边缘像素进行连接,将连接后的边缘像素作为新的起点,重复当前遍历连接步骤,直到得到闭环的实体边缘,其中起点与连接点的距离小于预设置的距离阈值;
S14:重复步骤S13,得到若干实体边缘,实体边缘内部的图像即为实体图像,并删除无法形成闭环实体边缘的边缘像素;
S15:遍历得到实体图像中像素坐标欧式距离相差最大的一组像素点,计算得到实体图像中的最大实体直径/>:
;
;
S16:若大于预设置的实体直径阈值,表示该实体有效可观测,则沿着实体边缘分割该实体图像作为航空图像的子图像,否则表示该实体过小,不为有效可观测的实体;重复步骤S15至S16,得到若干子图像。
可选地,所述S1步骤中对子图像进行航空目标文本标注,包括:
对子图像进行航空目标文本标注,所述航空目标文本标注为对分割出的子图像进行简要文本描述,描述内容为子图像中的实体形状以及颜色。在本发明实施例中,通过以固定形状的模板对子图像边缘进行匹配,最相似模板的形状即为实体形状描述,颜色描述即为子图像整体的色相、纯度以及明度描述。
可选地,所述S2步骤中构建多尺度航空图像特征提取模型,包括:
构建多尺度航空图像特征提取模型,所述多尺度航空图像特征提取模型包括输入层、多尺度特征提取层以及特征转换层,其中输入层用于接收包含唯一实体的子图像并进行卷积处理,多尺度特征提取层用于对卷积处理后的特征进行多尺度处理,得到不同尺度下的图像特征,特征转换层用于基于大尺度下的图像特征对小尺度下的图像特征进行转换增强处理,输出得到子图像的多尺度特征;
其中多尺度特征提取层包含多个特征提取单元,多尺度特征提取层的结构为:
;
其中:
表示第n个特征提取单元,N表示多尺度特征提取层中特征提取单元的总数;
基于多尺度航空图像特征提取模型的多尺度特征提取流程为:
S21:输入层接收包含唯一实体的子图像,并对利用卷积层对子图像/>进行卷积处理,得到对应的卷积特征/>,将卷积特征/>输入到多尺度特征提取层中,其中子图像/>对应的航空目标文本为/>,卷积层中卷积核的大小为/>像素;
S22:特征提取单元接收/>所提取的特征/>,其中/>对应输入层,利用最大池化层对特征图/>进行2倍的下采样处理,并利用特征映射模块对下采样结果/>进行映射处理:
;
其中:
表示利用卷积核大小为/>像素的卷积层进行卷积处理,表示激活函数;
得到特征提取单元所提取的特征/>,对特征/>进行复制操作,复制结果即为尺度下的子图像特征/>;
将特征输入到特征提取单元/>中;
S23:重复步骤S22,得到N+1个尺度下的子图像特征:,将N+1个尺度下的子图像特征输入到特征转换层:
S24:特征转换层计算得到任意两个尺度下子图像特征的相似性:,其中/>表示/>之间的相似性,相似性计算方法为余弦相似度算法;计算得到任意尺度下子图像特征的权重:
;
其中:
表示子图像特征/>的权重;
e表示自然常数;
S25:选取权重低于0.2的子图像特征,并遍历与所选取子图像特征相似性最高且尺度更高的特征/>,进行如下特征转换处理:
;
其中:
表示矩阵相乘处理;将特征转换后的特征作为子图像的多尺度特征,即为子图像的多尺度视觉特征。
可选地,所述S3步骤中计算得到子图像的目标分类评估值,包括:
根据子图像的多尺度视觉特征,计算得到子图像的目标分类评估值,其中目标分类评估值的计算公式为:
;
其中:
T表示转置;
表示图像分类类别权重矩阵;
表示子图像的多尺度视觉特征/>,对应N+1个尺度下的子图像特征;
为子图像/>的目标分类评估值,对应M行的矩阵向量,其中第m行结果表示子图像/>为第m类识别结果的目标评估分数。在本发明实施例中,子图像的识别结果类别包括行人、楼房、车辆、楼房事故风险、车辆事故风险、工业事故风险等。
可选地,所述S4步骤中构建跨模态航空图像增强分析模型,包括:
构建跨模态航空图像增强分析模型,其中跨模态航空图像增强分析模型的输入为子图像的航空目标文本,输出为子图像的文本分类向量,基于文本分类向量对图像特征进行增强识别;
将子图像的航空目标文本/>输入到跨模态航空图像增强分析模型中,得到子图像的文本分类向量,基于跨模态航空图像增强分析模型的文本分类向量获取流程为:
S41:利用one-hot方法将航空目标文本中的词转换为词向量,航空目标文本的词向量表示形式为:
;
其中:
表示航空目标文本/>的词向量表示,/>表示航空目标文本/>中第h个词的表示结果,/>表示航空目标文本/>中的总词数;
S42: 按航空目标文本描述内容对词向量表示U进行分割,得到描述实体形状的词向量表示,描述实体颜色的词向量表示/>;
S43:计算得到词向量表示的置信度:
;
;
其中:
表示L1范数;
表示词向量表示/>的置信度,/>表示词向量表示/>的置信度;
S44:基于置信度确定航空目标文本的文本分类向量:
;
其中:
表示航空目标文本/>的文本分类向量。
可选地,所述S5步骤中构建模态融合的航空图像识别模型,包括:
构建模态融合的航空图像识别模型,所述航空图像识别模型以子图像的目标分类评估值和文本分类向量为输入,以子图像的识别结果为输出,子图像识别的公式为:
;
其中:
T表示转置;
表示图像分类类别权重矩阵;
表示文本分类类别权重矩阵;
为子图像/>的识别结果,对应M行的矩阵向量,其中第m行结果表示子图像/>为第m类识别结果的评估分数,/>表示选取评估分数最高的识别结果作为输出。
可选地,所述航空图像识别模型的训练流程为:
S51:获取S张包含唯一实体的航空图像子图像,并对每张子图像进行识别结果标注,构成训练集,其中/>表示训练集中的第s张子图像,/>表示/>的真实识别结果;
S52:构建航空图像识别模型的训练目标函数:
;
其中:
表示待训练优化的参数,/>表示多尺度航空图像特征提取模型中卷积层的参数,包括权重参数和偏置参数;
表示将/>输入到基于参数/>的模型中,模型输出的识别结果;在本发明实施例中,模型输出的识别结果与真实识别结果均为编码表示;
S53:初始化,并令当前算法迭代次数为d,d的初始值为0,并初始化/>为单位矩阵;
S54:计算得到第d次迭代训练目标函数的梯度:,若则终止算法迭代,将/>作为训练得到的模型参数,并基于模型参数/>分别构建多尺度航空图像特征提取模型、跨模态航空图像增强分析模型以及航空图像识别模型;
S55:计算得到第d+1次迭代的迭代梯度步长:
;
;
其中:
,/>;
S56:更新待优化求解参数:
;
其中:
表示第d+1次迭代的迭代步长;
并基于迭代梯度步长更新迭代步长:
;
;
令,返回步骤S54。
可选地,所述S5步骤中基于航空图像识别模型进行子图像识别,包括:
基于航空图像识别模型进行子图像识别,其中识别流程为:
将子图像的多尺度视觉特征以及文本分类分量输入到航空图像识别模型中,模型输出子图像的识别结果,通过综合航空图像所有子图像的识别结果,若检测到事故风险类型的识别结果,则表示航空图像所对应的区域存在安全风险,并进行预警处理。
为了解决上述问题,本发明提供一种环境安全风险防控检测及预警系统,所述系统包括:
航空图像采集装置,用于采集航空图像,对航空图像进行图像分割得到包含唯一实体的多个子图像,对子图像进行航空目标文本标注;
特征提取装置,用于基于多尺度航空图像特征提取模型提取得到子图像的多尺度视觉特征,基于跨模态航空图像增强分析模型提取得到子图像的文本分类向量;
风险预警模块,用于基于航空图像识别模型得到子图像的识别结果,若检测到事故风险类型的识别结果则进行风险预警。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;
通信接口,实现电子设备通信;及处理器,执行所述存储器中存储的指令以实现上述所述的环境安全风险防控检测方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的环境安全风险防控检测方法。
相对于现有技术,本发明提出一种环境安全风险防控检测方法,该技术具有以下优势:
首先,本方案提出一种模态融合的图像识别方法,构建多尺度航空图像特征提取模型,所述多尺度航空图像特征提取模型包括输入层、多尺度特征提取层以及特征转换层,其中输入层用于接收包含唯一实体的子图像并进行卷积处理,多尺度特征提取层用于对卷积处理后的特征进行多尺度处理,得到不同尺度下的图像特征,特征转换层用于基于大尺度下的图像特征对小尺度下的图像特征进行转换增强处理,输出得到子图像的多尺度特征;并构建跨模态航空图像增强分析模型,其中跨模态航空图像增强分析模型的输入为子图像的航空目标文本,输出为子图像的文本分类向量,基于文本分类向量对图像特征进行增强识别。本方案基于无人机飞行高度与地面采样距离参数的映射关系,通过调整无人机的飞行高度,得到不同比例尺度下的航空图像,实现多比例尺度图像下的环境物体检测,并基于航空图像中的实体最大直径,过滤掉较小的环境物体,节约计算资源,得到仅包含唯一实体的子图像,并基于子图像的形状以及颜色进行航空目标文本标注,利用多尺度航空图像特征提取模型提取得到不同尺度下子图像的特征表示,并利用跨模态航空图像增强分析模型将航空目标文本转换为词向量表示,结合子图像计算得到词向量表示的置信度,进而基于置信度将词向量表示转换为子图像的文本分类向量,实现图像特征与文本的初步接触融合。
同时,本方案提出一种多模型协同的模型训练方式,获取S张包含唯一实体的航空图像子图像,并对每张子图像进行识别结果标注,构成训练集,其中/>表示训练集中的第s张子图像,/>表示/>的真实识别结果;构建航空图像识别模型的训练目标函数:
;
其中:表示待训练优化的参数,/>表示多尺度航空图像特征提取模型中卷积层的参数,包括权重参数和偏置参数;/>表示将/>输入到基于参数/>的模型中,模型输出的识别结果;初始化/>,并令当前算法迭代次数为d,d的初始值为0,并初始化/>为单位矩阵;计算得到第d次迭代训练目标函数的梯度:/>,若则终止算法迭代,将/>作为训练得到的模型参数,并基于模型参数/>分别构建多尺度航空图像特征提取模型、跨模态航空图像增强分析模型以及航空图像识别模型;计算得到第d+1次迭代的迭代梯度步长/>:
;
;
其中:,/>;更新待优化求解参数:
;
其中:表示第d+1次迭代的迭代步长;并基于迭代梯度步长更新迭代步长:
;
;
令,返回梯度计算步骤。将子图像的多尺度视觉特征以及文本分类分量输入到航空图像识别模型中,模型输出子图像的识别结果,通过综合航空图像所有子图像的识别结果,若检测到事故风险类型的识别结果,则表示航空图像所对应的区域存在安全风险,并进行预警处理。通过构建模态融合的航空图像识别模型,将图像特征以及文本分类向量进行融合,得到子图像的识别结果,并在模型训练过程中,采用多模型协同训练的方式,并在参数优化过程中对原始梯度采用结合梯度步长的校正处理,减小梯度的变换幅度,避免参数优化过程中的不稳定性,进而降低参数更新噪声,有效保证最终参数求解结果的准确性。
附图说明
图1为本发明一实施例提供的航空环境安全风险防控检测方法的流程示意图;
图2为本发明一实施例提供的航空环境安全风险防控检测及预警系统的功能模块图;
图3为本发明一实施例提供的实现航空环境安全风险防控检测方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种航空环境安全风险防控检测方法。所述环境安全风险防控检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述环境安全风险防控检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
实施例1
S1:采集航空图像,对航空图像进行图像分割得到包含唯一实体的多个子图像,对子图像进行航空目标文本标注。
所述S1步骤中采集航空图像并对所采集航空图像进行图像分割,包括:
利用无人机内置相机采集航空图像,所设置无人机的航高为H,在飞行方向上相邻图像的重叠比例为5%,相邻航线间所采集图像的重叠比例为0,相机焦距为,将无人机飞行方向作为水平方向,计算得到地面采样距离参数:
;
;
其中:
表示水平方向的地面采样距离,/>表示竖直方向的地面采样距离,单位为米/像素;
分别为相机横向的像元大小以及纵向的像元大小,将/>设置为6.5mm,设置为4.9mm;
分别为相机横向的图像分辨率和纵向的图像分辨率,将/>设置为1920,设置为1080,单位为像素;
对所采集航空图像进行图像分割,其中图像分割流程为:
S11:对所采集航空图像进行灰度化处理,其中灰度化处理公式为:
;
其中:
表示航空图像中像素/>的灰度值,/>表示像素在RGB颜色通道的颜色值;像素/>表示航空图像中第i行第j列的像素;
S12:计算得到航空图像中像素的梯度/>和梯度方向/>:
;
;
将梯度高于预设置阈值的像素标记为候选边缘像素;
将候选边缘像素的梯度绝对值与沿正负梯度方向最邻近像素的梯度绝对值进行比较,若候选边缘像素的梯度绝对值为极大值,则将候选边缘像素标记为边缘像素;
S13:对于航空图像中的任意孤立的边缘像素,以该边缘像素为起点,沿正负梯度方向遍历得到最邻近的孤立的边缘像素进行连接,将连接后的边缘像素作为新的起点,重复当前遍历连接步骤,直到得到闭环的实体边缘,其中起点与连接点的距离小于预设置的距离阈值;
S14:重复步骤S13,得到若干实体边缘,实体边缘内部的图像即为实体图像,并删除无法形成闭环实体边缘的边缘像素;
S15:遍历得到实体图像中像素坐标欧式距离相差最大的一组像素点,计算得到实体图像中的最大实体直径/>:
;
;
S16:若大于预设置的实体直径阈值,表示该实体有效可观测,则沿着实体边缘分割该实体图像作为航空图像的子图像,否则表示该实体过小,不为有效可观测的实体;重复步骤S15至S16,得到若干子图像。
所述S1步骤中对子图像进行航空目标文本标注,包括:
对子图像进行航空目标文本标注,所述航空目标文本标注为对分割出的子图像进行简要文本描述,描述内容为子图像中的实体形状以及颜色。在本发明实施例中,通过以固定形状的模板对子图像边缘进行匹配,最相似模板的形状即为实体形状描述,颜色描述即为子图像整体的色相、纯度以及明度描述。
S2:构建多尺度航空图像特征提取模型,将包含唯一实体的子图像输入到模型中,得到子图像的多尺度视觉特征。
所述S2步骤中构建多尺度航空图像特征提取模型,包括:
构建多尺度航空图像特征提取模型,所述多尺度航空图像特征提取模型包括输入层、多尺度特征提取层以及特征转换层,其中输入层用于接收包含唯一实体的子图像并进行卷积处理,多尺度特征提取层用于对卷积处理后的特征进行多尺度处理,得到不同尺度下的图像特征,特征转换层用于基于大尺度下的图像特征对小尺度下的图像特征进行转换增强处理,输出得到子图像的多尺度特征;
其中多尺度特征提取层包含多个特征提取单元,多尺度特征提取层的结构为:
;
其中:
表示第n个特征提取单元,N表示多尺度特征提取层中特征提取单元的总数;
基于多尺度航空图像特征提取模型的多尺度特征提取流程为:
S21:输入层接收包含唯一实体的子图像,并对利用卷积层对子图像/>进行卷积处理,得到对应的卷积特征/>,将卷积特征/>输入到多尺度特征提取层中,其中子图像/>对应的航空目标文本为/>,卷积层中卷积核的大小为/>像素;
S22:特征提取单元接收/>所提取的特征/>,其中/>对应输入层,利用最大池化层对特征图/>进行2倍的下采样处理,并利用特征映射模块对下采样结果/>进行映射处理:
;
其中:
表示利用卷积核大小为/>像素的卷积层进行卷积处理,表示激活函数;
得到特征提取单元所提取的特征/>,对特征/>进行复制操作,复制结果即为尺度下的子图像特征/>;
将特征输入到特征提取单元/>中;
S23:重复步骤S22,得到N+1个尺度下的子图像特征:,将N+1个尺度下的子图像特征输入到特征转换层:
S24:特征转换层计算得到任意两个尺度下子图像特征的相似性:,其中/>表示/>之间的相似性,相似性计算方法为余弦相似度算法;计算得到任意尺度下子图像特征的权重:
;
其中:
表示子图像特征/>的权重;
e表示自然常数;
S25:选取权重低于0.2的子图像特征,并遍历与所选取子图像特征相似性最高且尺度更高的特征/>,进行如下特征转换处理:
;
其中:
表示矩阵相乘处理;将特征转换后的特征作为子图像的多尺度特征,即为子图像的多尺度视觉特征。
S3:根据多尺度视觉特征计算得到子图像的目标分类评估值。
所述S3步骤中计算得到子图像的目标分类评估值,包括:
根据子图像的多尺度视觉特征,计算得到子图像的目标分类评估值,其中目标分类评估值的计算公式为:
;
其中:
T表示转置;
表示图像分类类别权重矩阵;
表示子图像的多尺度视觉特征/>,对应N+1个尺度下的子图像特征;
为子图像/>的目标分类评估值,对应M行的矩阵向量,其中第m行结果表示子图像/>为第m类识别结果的目标评估分数。
S4:构建跨模态航空图像增强分析模型,将子图像的航空目标文本输入到模型中,得到子图像的文本分类向量。
所述S4步骤中构建跨模态航空图像增强分析模型,包括:
构建跨模态航空图像增强分析模型,其中跨模态航空图像增强分析模型的输入为子图像的航空目标文本,输出为子图像的文本分类向量,基于文本分类向量对图像特征进行增强识别;
将子图像的航空目标文本/>输入到跨模态航空图像增强分析模型中,得到子图像的文本分类向量,基于跨模态航空图像增强分析模型的文本分类向量获取流程为:
S41:利用one-hot方法将航空目标文本中的词转换为词向量,航空目标文本的词向量表示形式为:
;
其中:
表示航空目标文本/>的词向量表示,/>表示航空目标文本/>中第h个词的表示结果,/>表示航空目标文本/>中的总词数;
S42: 按航空目标文本描述内容对词向量表示U进行分割,得到描述实体形状的词向量表示,描述实体颜色的词向量表示/>;
S43:计算得到词向量表示的置信度:
;
;
其中:
表示L1范数;
表示词向量表示/>的置信度,/>表示词向量表示/>的置信度;
S44:基于置信度确定航空目标文本的文本分类向量:
;
其中:
表示航空目标文本/>的文本分类向量。
S5:构建模态融合的航空图像识别模型,所述航空图像识别模型以子图像的目标分类评估值和文本分类向量为输入,以子图像的识别结果为输出。
所述S5步骤中构建模态融合的航空图像识别模型,包括:
构建模态融合的航空图像识别模型,所述航空图像识别模型以子图像的目标分类评估值和文本分类向量为输入,以子图像的识别结果为输出,子图像识别的公式为:
;
其中:
T表示转置;
表示图像分类类别权重矩阵;
表示文本分类类别权重矩阵;
为子图像/>的识别结果,对应M行的矩阵向量,其中第m行结果表示子图像/>为第m类识别结果的评估分数,/>表示选取评估分数最高的识别结果作为输出。
所述航空图像识别模型的训练流程为:
S51:获取S张包含唯一实体的航空图像子图像,并对每张子图像进行识别结果标注,构成训练集,其中/>表示训练集中的第s张子图像,/>表示/>的真实识别结果;
S52:构建航空图像识别模型的训练目标函数:
;
其中:
表示待训练优化的参数,/>表示多尺度航空图像特征提取模型中卷积层的参数,包括权重参数和偏置参数;
表示将/>输入到基于参数/>的模型中,模型输出的识别结果;在本发明实施例中,模型输出的识别结果与真实识别结果均为编码表示;
S53:初始化,并令当前算法迭代次数为d,d的初始值为0,并初始化/>为单位矩阵;
S54:计算得到第d次迭代训练目标函数的梯度:,若则终止算法迭代,将/>作为训练得到的模型参数,并基于模型参数/>分别构建多尺度航空图像特征提取模型、跨模态航空图像增强分析模型以及航空图像识别模型;
S55:计算得到第d+1次迭代的迭代梯度步长:
;
;
其中:
,/>;
S56:更新待优化求解参数:
;
其中:
表示第d+1次迭代的迭代步长;
并基于迭代梯度步长更新迭代步长:
;
;
令,返回步骤S54。
所述S5步骤中基于航空图像识别模型进行子图像识别,包括:
基于航空图像识别模型进行子图像识别,其中识别流程为:
将子图像的多尺度视觉特征以及文本分类分量输入到航空图像识别模型中,模型输出子图像的识别结果,通过综合航空图像所有子图像的识别结果,若检测到事故风险类型的识别结果,则表示航空图像所对应的区域存在安全风险,并进行预警处理。
实施例2
如图2所示,是本发明一实施例提供的环境安全风险防控检测及预警系统的功能模块图,其可以实现实施例1中的环境安全风险防控检测方法。
本发明所述环境安全风险防控检测及预警系统100可以安装于电子设备中。根据实现的功能,所述环境安全风险防控检测及预警系统可以包括航空图像采集装置101、特征提取装置102及风险预警模块103。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
航空图像采集装置101,用于采集航空图像,对航空图像进行图像分割得到包含唯一实体的多个子图像,对子图像进行航空目标文本标注;
特征提取装置102,用于基于多尺度航空图像特征提取模型提取得到子图像的多尺度视觉特征,基于跨模态航空图像增强分析模型提取得到子图像的文本分类向量;
风险预警模块103,用于基于航空图像识别模型得到子图像的识别结果,若检测到事故风险类型的识别结果则进行风险预警。
详细地,本发明实施例中所述环境安全风险防控检测及预警系统100中的所述各模块在使用时采用与上述的图1中所述的环境安全风险防控检测方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
实施例3
如图3所示,是本发明一实施例提供的实现环境安全风险防控检测方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信接口13和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(用于实现环境安全风险防控检测及预警的程序12等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述通信接口13可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接,并实现电子设备内部组件之间的连接通信。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种航空环境安全风险防控检测方法,其特征在于,所述方法包括:
S1:采集航空图像,对航空图像进行图像分割得到包含唯一实体的多个子图像,对子图像进行航空目标文本标注;
S2:构建多尺度航空图像特征提取模型,将包含唯一实体的子图像输入到模型中,得到子图像的多尺度视觉特征;
S3:根据多尺度视觉特征计算得到子图像的目标分类评估值;
S4:构建跨模态航空图像增强分析模型,将子图像的航空目标文本输入到模型中,得到子图像的文本分类向量;
S5:构建模态融合的航空图像识别模型,所述航空图像识别模型以子图像的目标分类评估值和文本分类向量为输入,以子图像的识别结果为输出。
2.如权利要求1所述的一种航空环境安全风险防控检测方法,其特征在于,所述S1步骤中采集航空图像并对所采集航空图像进行图像分割,包括:
利用无人机内置相机采集航空图像,所设置无人机的航高为H,在飞行方向上相邻图像的重叠比例为5%,相邻航线间所采集图像的重叠比例为0,相机焦距为,将无人机飞行方向作为水平方向,计算得到地面采样距离参数:
;
;
其中:
表示水平方向的地面采样距离,/>表示竖直方向的地面采样距离,单位为米/像素;
分别为相机横向的像元大小以及纵向的像元大小,将/>设置为6.5mm,/>设置为4.9mm;
分别为相机横向的图像分辨率和纵向的图像分辨率,将/>设置为1920,/>设置为1080,单位为像素;
对所采集航空图像进行图像分割,其中图像分割流程为:
S11:对所采集航空图像进行灰度化处理,其中灰度化处理公式为:
;
其中:
表示航空图像中像素/>的灰度值,/>表示像素/>在RGB颜色通道的颜色值;像素/>表示航空图像中第i行第j列的像素;
S12:计算得到航空图像中像素的梯度/>和梯度方向/>:
;
;
将梯度高于预设置阈值的像素标记为候选边缘像素;
将候选边缘像素的梯度绝对值与沿正负梯度方向最邻近像素的梯度绝对值进行比较,若候选边缘像素的梯度绝对值为极大值,则将候选边缘像素标记为边缘像素;
S13:对于航空图像中的任意孤立的边缘像素,以该边缘像素为起点,沿正负梯度方向遍历得到最邻近的孤立的边缘像素进行连接,将连接后的边缘像素作为新的起点,重复当前遍历连接步骤,直到得到闭环的实体边缘,其中起点与连接点的距离小于预设置的距离阈值;
S14:重复步骤S13,得到若干实体边缘,实体边缘内部的图像即为实体图像,并删除无法形成闭环实体边缘的边缘像素;
S15:遍历得到实体图像中像素坐标欧式距离相差最大的一组像素点,计算得到实体图像中的最大实体直径/>:
;
;
S16:若大于预设置的实体直径阈值,表示该实体有效可观测,则沿着实体边缘分割该实体图像作为航空图像的子图像,否则表示该实体过小,不为有效可观测的实体;重复步骤S15至S16,得到若干子图像。
3.如权利要求2所述的一种航空环境安全风险防控检测方法,其特征在于,所述S1步骤中对子图像进行航空目标文本标注,包括:
对子图像进行航空目标文本标注,所述航空目标文本标注为对分割出的子图像进行简要文本描述,描述内容为子图像中的实体形状以及颜色。
4.如权利要求1所述的一种航空环境安全风险防控检测方法,其特征在于,所述S2步骤中构建多尺度航空图像特征提取模型,包括:
构建多尺度航空图像特征提取模型,所述多尺度航空图像特征提取模型包括输入层、多尺度特征提取层以及特征转换层,其中输入层用于接收包含唯一实体的子图像并进行卷积处理,多尺度特征提取层用于对卷积处理后的特征进行多尺度处理,得到不同尺度下的图像特征,特征转换层用于基于大尺度下的图像特征对小尺度下的图像特征进行转换增强处理,输出得到子图像的多尺度特征;
其中多尺度特征提取层包含多个特征提取单元,多尺度特征提取层的结构为:
;
其中:
表示第n个特征提取单元,N表示多尺度特征提取层中特征提取单元的总数;
基于多尺度航空图像特征提取模型的多尺度特征提取流程为:
S21:输入层接收包含唯一实体的子图像,并对利用卷积层对子图像/>进行卷积处理,得到对应的卷积特征/>,将卷积特征/>输入到多尺度特征提取层中,其中子图像/>对应的航空目标文本为/>,卷积层中卷积核的大小为/>像素;
S22:特征提取单元接收/>所提取的特征/>,其中/>对应输入层,利用最大池化层对特征图/>进行2倍的下采样处理,并利用特征映射模块对下采样结果/>进行映射处理:
;
其中:
表示利用卷积核大小为/>像素的卷积层进行卷积处理,/>表示激活函数;
得到特征提取单元所提取的特征/>,对特征/>进行复制操作,复制结果即为/>尺度下的子图像特征/>;
将特征输入到特征提取单元/>中;
S23:重复步骤S22,得到N+1个尺度下的子图像特征:,将N+1个尺度下的子图像特征输入到特征转换层:
S24:特征转换层计算得到任意两个尺度下子图像特征的相似性:,其中/>表示/>之间的相似性,相似性计算方法为余弦相似度算法;计算得到任意尺度下子图像特征的权重:
;
其中:
表示子图像特征/>的权重;
e表示自然常数;
S25:选取权重低于0.2的子图像特征,并遍历与所选取子图像特征相似性最高且尺度更高的特征/>,进行如下特征转换处理:
;
其中:
表示矩阵相乘处理;将特征转换后的特征作为子图像的多尺度特征,即为子图像的多尺度视觉特征。
5.如权利要求4所述的一种航空环境安全风险防控检测方法,其特征在于,所述S3步骤中计算得到子图像的目标分类评估值,包括:
根据子图像的多尺度视觉特征,计算得到子图像的目标分类评估值,其中目标分类评估值的计算公式为:
;
其中:
T表示转置;
表示图像分类类别权重矩阵;
表示子图像的多尺度视觉特征/>,对应N+1个尺度下的子图像特征;
为子图像/>的目标分类评估值,对应M行的矩阵向量,其中第m行结果表示子图像/>为第m类识别结果的目标评估分数。
6.如权利要求1所述的一种航空环境安全风险防控检测方法,其特征在于,所述S4步骤中构建跨模态航空图像增强分析模型,包括:
构建跨模态航空图像增强分析模型,其中跨模态航空图像增强分析模型的输入为子图像的航空目标文本,输出为子图像的文本分类向量,基于文本分类向量对图像特征进行增强识别;
将子图像的航空目标文本/>输入到跨模态航空图像增强分析模型中,得到子图像的文本分类向量,基于跨模态航空图像增强分析模型的文本分类向量获取流程为:
S41:利用one-hot方法将航空目标文本中的词转换为词向量,航空目标文本/>的词向量表示形式为:
;
其中:
表示航空目标文本/>的词向量表示,/>表示航空目标文本/>中第h个词的表示结果,/>表示航空目标文本/>中的总词数;
S42: 按航空目标文本描述内容对词向量表示U进行分割,得到描述实体形状的词向量表示,描述实体颜色的词向量表示/>;
S43:计算得到词向量表示的置信度:
;
;
其中:
表示L1范数;
表示词向量表示/>的置信度,/>表示词向量表示/>的置信度;
S44:基于置信度确定航空目标文本的文本分类向量:
;
其中:
表示航空目标文本/>的文本分类向量。
7.如权利要求6所述的一种航空环境安全风险防控检测方法,其特征在于,所述S5步骤中构建模态融合的航空图像识别模型,包括:
构建模态融合的航空图像识别模型,所述航空图像识别模型以子图像的目标分类评估值和文本分类向量为输入,以子图像的识别结果为输出,子图像识别的公式为:
;
其中:
T表示转置;
表示图像分类类别权重矩阵;
表示文本分类类别权重矩阵;
为子图像/>的识别结果,对应M行的矩阵向量,其中第m行结果表示子图像/>为第m类识别结果的评估分数,/>表示选取评估分数最高的识别结果作为输出。
8.如权利要求7所述的一种航空环境安全风险防控检测方法,其特征在于,所述航空图像识别模型的训练流程为:
S51:获取S张包含唯一实体的航空图像子图像,并对每张子图像进行识别结果标注,构成训练集,其中/>表示训练集中的第s张子图像,表示/>的真实识别结果;
S52:构建航空图像识别模型的训练目标函数:
;
其中:
表示待训练优化的参数,/>表示多尺度航空图像特征提取模型中卷积层的参数,包括权重参数和偏置参数;
表示将/>输入到基于参数/>的模型中,模型输出的识别结果;
S53:初始化,并令当前算法迭代次数为d,d的初始值为0,并初始化/>为单位矩阵;
S54:计算得到第d次迭代训练目标函数的梯度:,若/>则终止算法迭代,将/>作为训练得到的模型参数,并基于模型参数/>分别构建多尺度航空图像特征提取模型、跨模态航空图像增强分析模型以及航空图像识别模型;
S55:计算得到第d+1次迭代的迭代梯度步长:
;
;
其中:
,/>;
S56:更新待优化求解参数:
;
其中:
表示第d+1次迭代的迭代步长;
并基于迭代梯度步长更新迭代步长:
;
;
令,返回步骤S54。
9.如权利要求8所述的一种航空环境安全风险防控检测方法,其特征在于,所述S5步骤中基于航空图像识别模型进行子图像识别,包括:
基于训练得到的航空图像识别模型进行子图像识别,其中识别流程为:
将子图像的多尺度视觉特征以及文本分类分量输入到航空图像识别模型中,模型输出子图像的识别结果,通过综合航空图像所有子图像的识别结果,若检测到事故风险类型的识别结果,则表示航空图像所对应的区域存在安全风险,并进行预警处理。
10.一种航空环境安全风险防控检测及预警系统,其特征在于,所述系统包括:
航空图像采集装置,用于采集航空图像,对航空图像进行图像分割得到包含唯一实体的多个子图像,对子图像进行航空目标文本标注;
特征提取装置,用于基于多尺度航空图像特征提取模型提取得到子图像的多尺度视觉特征,基于跨模态航空图像增强分析模型提取得到子图像的文本分类向量;
风险预警模块,用于基于航空图像识别模型得到子图像的识别结果,若检测到事故风险类型的识别结果则进行风险预警,以实现一种如权利要求1-9任一项所述的环境安全风险防控检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310744009.2A CN116580326A (zh) | 2023-06-25 | 2023-06-25 | 一种航空环境安全风险防控检测及预警系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310744009.2A CN116580326A (zh) | 2023-06-25 | 2023-06-25 | 一种航空环境安全风险防控检测及预警系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116580326A true CN116580326A (zh) | 2023-08-11 |
Family
ID=87537950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310744009.2A Withdrawn CN116580326A (zh) | 2023-06-25 | 2023-06-25 | 一种航空环境安全风险防控检测及预警系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116580326A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117115175A (zh) * | 2023-10-25 | 2023-11-24 | 天津东泉石油技术开发有限公司 | 一种溢油在线监测预警方法与系统 |
-
2023
- 2023-06-25 CN CN202310744009.2A patent/CN116580326A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117115175A (zh) * | 2023-10-25 | 2023-11-24 | 天津东泉石油技术开发有限公司 | 一种溢油在线监测预警方法与系统 |
CN117115175B (zh) * | 2023-10-25 | 2024-01-09 | 天津东泉石油技术开发有限公司 | 一种溢油在线监测预警方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112465748B (zh) | 基于神经网络的裂缝识别方法、装置、设备及存储介质 | |
CN107944450B (zh) | 一种车牌识别方法及装置 | |
US10445602B2 (en) | Apparatus and method for recognizing traffic signs | |
CN110246181B (zh) | 基于锚点的姿态估计模型训练方法、姿态估计方法和系统 | |
CN111461213B (zh) | 一种目标检测模型的训练方法、目标快速检测方法 | |
CN113255557B (zh) | 一种基于深度学习的视频人群情绪分析方法及系统 | |
US20230041943A1 (en) | Method for automatically producing map data, and related apparatus | |
CN116051953A (zh) | 基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法 | |
CN113490947A (zh) | 检测模型训练方法、装置、检测模型使用方法及存储介质 | |
CN108229494B (zh) | 网络训练方法、处理方法、装置、存储介质和电子设备 | |
CN116580326A (zh) | 一种航空环境安全风险防控检测及预警系统 | |
CN106846399B (zh) | 一种获取图像的视觉重心的方法及装置 | |
CN116704324A (zh) | 基于水下图像的目标检测方法、系统、设备以及存储介质 | |
US20220164577A1 (en) | Object detection method, object detection apparatus, and non-transitory computer-readable storage medium storing computer program | |
CN117831042A (zh) | 遥感影像目标检测与分割方法、装置、设备和存储介质 | |
CN111476144B (zh) | 行人属性识别模型确定方法、装置及计算机可读存储介质 | |
CN117689887A (zh) | 基于点云分割的工件抓取方法、装置、设备及存储介质 | |
CN114926753B (zh) | 一种海量图像条件下的快速目标场景信息提取方法 | |
JP5407723B2 (ja) | 認識装置、認識方法及びプログラム | |
US20220245829A1 (en) | Movement status learning apparatus, movement status recognition apparatus, model learning method, movement status recognition method and program | |
CN113537397A (zh) | 基于多尺度特征融合的目标检测与图像清晰联合学习方法 | |
CN114170431A (zh) | 一种基于边缘特征的复杂场景车架号识别方法及设备 | |
CN112036244A (zh) | 一种基于神经网络的人体姿态估计方法 | |
CN112232272A (zh) | 一种激光与视觉图像传感器融合的行人识别方法 | |
CN114882298B (zh) | 一种对抗互补学习模型的优化方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230811 |
|
WW01 | Invention patent application withdrawn after publication |