CN116523300A - 复杂电力作业场景安全风险解译方法 - Google Patents

复杂电力作业场景安全风险解译方法 Download PDF

Info

Publication number
CN116523300A
CN116523300A CN202310390245.9A CN202310390245A CN116523300A CN 116523300 A CN116523300 A CN 116523300A CN 202310390245 A CN202310390245 A CN 202310390245A CN 116523300 A CN116523300 A CN 116523300A
Authority
CN
China
Prior art keywords
electric power
power operation
model
operation scene
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310390245.9A
Other languages
English (en)
Inventor
马富齐
李微
贾嵘
刘永文
王嘉勋
刘恒
穆睿昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202310390245.9A priority Critical patent/CN116523300A/zh
Publication of CN116523300A publication Critical patent/CN116523300A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Operations Research (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Image Analysis (AREA)

Abstract

本发明复杂电力作业场景安全风险解译方法,建立基于注意力机制的编码器‑解码器图像描述模型,将电力作业场景图像信息直接转化为文字信息,模型采用残差网络ResNet‑101作为编码器提取图像特征,LSTM用来读取编码后的图像并生成文本描述,引入注意力机制,对图像中多个目标区域给予不同的权重,以增强图像区域和单词的相关性,获取更多的图像语义细节,生成复杂电力作业场景下的针对性语言描述,引入文本语义相似度分析,对生成文本和标准电力安全作业规程的语义相似度进行计算,相似度高于阈值,判定为规范操作;反之,则判定为违章行为。本方法结合计算机视觉和自然语言处理,可实现电力作业安全风险的存在性判别与智慧解译。

Description

复杂电力作业场景安全风险解译方法
技术领域
本发明属于电力生产安全风险防控技术领域,具体涉及复杂电力作业场景安全风险解译方法。
背景技术
随着电力系统的规模不断扩大,系统运行过程中安全事故频繁发生,造成了重大损失。电力作业场景的复杂性和工人的违章行为是引发安全事故的主要原因,因此,实现复杂电力作业场景下电力违章行为的智能检测对电力生产安全风险防控有重要意义。目前,已有研究多聚焦于利用目标检测或语义分割等实现简单作业场景下常规违章操作的识别,例如未佩戴安全帽、绝缘手套等,然而电力工程具有较强的系统性和动态性,且工人与工器具等交互关系复杂,仅仅采用基础计算机视觉方法无法满足电力工业实际生产需求。
发明内容
本发明的目的是提供复杂电力作业场景安全风险解译方法,能够应用于复杂场景中,实现作业场景的精细化描述及安全风险辨识,契合电力作业场景图像智能化处理的需求。
本发明所采用的技术方案是,复杂电力作业场景安全风险解译方法,具体按照以下步骤实施:
步骤1、利用成像设备获取电力作业现场的图片I;
步骤2、建立基于注意力机制的编码器-解码器模型,利用COCO数据集对模型进行预训练;
步骤3、制作针对电力作业场景的专用图像描述数据集;利用专用图像描述数据集对预训练得到的模型进行微调;
步骤4、向微调后的模型中输入电力作业现场的图片I,通过模型分析计算得到图像中作业场景对应的语言描述Y;
步骤5、建立标准电力安全作业规程语料库,利用Sentence-BERT模型计算语言描述Y和标准电力安全作业规程语料库文本的语义相似度;
步骤6、提取语义相似度最高的文本,其内容为规程中规定的该场景下的规范操作,将计算得到的语义相似度与阈值进行比较,相似度高于阈值,判定为规范操作;反之,则判定为违章行为。
本发明的特点还在于:
步骤2中基于注意力机制的编码器-解码器模型,编码器部分把输入图片I转化为D维特征a,解码部分把D维特征a变成目标语言Y。
其中,D=2048为特征向量的维度,L=32×32描述图像的不同区域,是K词汇表的大小,C为生成语言描述的长度。
步骤2具体过程为:
步骤2.1、编码器由预训练的残差网络ResNet-101构成,删除ResNet-101网络中的线性层和池化层,直接从卷积层中提取D维特征a,编码只进行一次,解码是逐个单词进行的,所有以下网络变量均带有下标t;
步骤2.2、将D维特征a输入注意力机制获取上下文向量zt,zt是原有特征向量a的加权和,权重为
维度为L=1024,记录原有特征向量a每个像素位置获得的关注度;
步骤2.3、利用LSTM网络模拟记忆关系,包括内部隐状态ht、输入it、遗忘ft、存储ct、输出ot、候选gt。输入it、遗忘ft和输出ot用来控制其他状态的强度,都通过隐状态ht-1,以及当前上下文向量zt获得,候选gt描述进入存储的信息,生成方式相同,存储ct是LSTM的核心,由前一词的存储ct-1和当前候选gt加权得到,遗忘门ft控制前一词存储,输入门it控制本次候选;
ct=ft⊙ct-1+it⊙gt
隐状态ht由存储ct经过变化得到,强度由输出门ot控制:
ht=ot⊙tanh(ct)
步骤2.4、当前隐变量ht通过全连网络生成当前单词yt,基于注意力机制的编码器-解码器模型搭建完成;
步骤2.5、利用COCO数据集,使用自适应学习率通过随机梯度下降对基于注意力机制的编码器-解码器模型进行预训练。
步骤3具体过程为:
步骤3.1、收集电力作业现场的图片,对图片进行随机裁剪、翻转、旋转、随机增强操作,形成电力作业场景的专用图像数据集;
步骤3.2、为电力作业场景的专用图像数据集添加对应的描述文本,每张图片对应5句描述文本,描述文本以json文件格式存储,电力作业场景专用图像描述数据集制作完成,将数据集按照8:2的比例分为训练集和测试集;
步骤3.3、利用电力作业场景专用图像描述数据集对预训练模型进行微调。
步骤5具体过程为:
步骤5.1、建立标准电力安全作业规程语料库,语料库内容为《电力安全工作规程》中规定的规范操作相关条目;
步骤5.2、利用Sentence-BERT模型计算生成文本Y和标准电力安全作业规程语料库文本的语义相似度,Sentence-BERT有两个一样的BERT模型,把句子1输入第一个BERT模型,把句子2输入第二个BERT模型,获取两个句子对应的向量表示u和v,最后通过余弦相似计算两个向量的相似度:
S=cos(u,v)。
步骤6中阈值取值为0.85。
本发明的有益效果是:
本发明复杂电力作业场景安全风险解译方法,借助高层场景语义理解任务图像描述,将电力作业场景图像信息直接转化为文字信息,模型通过注意机制对图像中多个目标区域给予不同的权重,使生成的文字描述更具有针对性,同时引入文本语义相似度分析,通过对比图像对应的文字信息与标准电力安全作业规程语义相似度判定该场景下是否存在违章行为。本发明方法可以应用在复杂场景中,实现作业场景的精细化描述及安全风险辨识,契合电力作业场景图像智能化处理的需求。
附图说明
图1是本发明复杂电力作业场景安全风险解译方法流程图;
图2为本发明中基于注意力机制的编码器-解码器图像描述模型框架图;
图3为本发明中基于注意力机制的编码器-解码器图像描述方法流程图;
图4为本发明实施例中输入图像描述模型的作业现场图片I;
图5为本发明实施例中图像描述模型输出的结果图片;
图6为本发明实施例中文本语义相似度分析模型输出的结果图片。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明复杂电力作业场景安全风险解译方法,如图1所示,具体按照以下步骤实施:
步骤1、利用成像设备获取电力作业现场的图片I;
步骤2、建立基于注意力机制的编码器-解码器模型,如图2所示,编码器部分把输入图片I转化为D维特征a,解码部分把D维特征a变成目标语言Y。
其中,D=2048为特征向量的维度,L=32×32描述图像的不同区域,是K词汇表的大小,C为生成语言描述的长度。如图3所示,具体过程为:
步骤2.1、编码器由预训练的残差网络ResNet-101构成,由于本模型并非用于分类任务,因此删除ResNet-101网络中的线性层和池化层,模型可以直接从卷积层中提取D维特征a,编码只进行一次,解码是逐个单词进行的,所有以下网络变量均带有下标t;
步骤2.2、将D维特征a输入注意力机制获取上下文向量zt,zt是原有特征向量a的加权和,权重为
维度为L=1024,记录原有特征向量a每个像素位置获得的关注度。
权重αt由前一步系统隐变量ht-1经过若干全连接层获得,编码et-1用于存储前一步的信息,第一步权重α0完全由图像特征a决定。系统的隐变量ht在下一步获得。
步骤2.3、利用LSTM网络模拟记忆关系包括内部隐状态ht、输入it、遗忘ft、存储ct、输出ot、候选gt;输入it、遗忘ft和输出ot用来控制其他状态的强度,都通过隐状态ht-1,以及当前上下文向量zt获得,候选gt描述进入存储的信息,生成方式相同;存储ct是LSTM的核心,由前一词的存储ct-1和当前候选gt加权得到,遗忘门ft控制前一词存储,输入门it控制本次候选;
ct=ft⊙ct-1+it⊙gt
隐状态ht由存储ct经过变化得到,强度由输出门ot控制:
ht=ot⊙tanh(ct);
步骤2.4、当前隐变量ht通过全连网络生成当前单词yt,基于注意力机制的编码器-解码器模型搭建完成;
步骤2.5、利用COCO数据集,使用自适应学习率通过随机梯度下降对基于注意力机制的编码器-解码器模型进行预训练。
步骤3、制作针对电力作业场景的专用图像描述数据集,包括图片数据以及对图像中作业场景的语言描述。图片数据为jpg格式,描述文本以json文件格式存储。将数据集按照8:2的比例分为训练集和测试集,通过训练集对步骤2中的预训练模型进行微调;具体过程为:
步骤3.1、收集电力作业现场图片,收集电力作业现场的图片,对图片进行随机裁剪、翻转、旋转、随机增强操作,梳理几种典型作业场景,形成电力作业场景的专用图像数据集;
步骤3.2、为电力作业场景的专用图像数据集添加对应的描述文本,每张图片对应5句描述文本,描述文本以json文件格式存储,电力作业场景专用图像描述数据集制作完成,将数据集按照8:2的比例分为训练集和测试集;
步骤3.3、利用电力作业场景专用图像描述数据集对预训练模型进行微调。
在测试集上对模型进行测试,对模型生成的描述语句进行评估,输入电力作业现场的图像I,通过模型分析计算得到图像中作业场景对应的语言描述Y,具体过程为:
在测试集上对模型进行测试,对模型生成的描述语句进行评估,评估指标为BLUE,它可以用于评估一组自然语言处理任务生成的文本,完全匹配的得分为1.0,完全不匹配的得分为0.0。在NLTK中,允许用户显式指定不同的N-grams的权重以便来计算BLEU的值,累积的BLEU则指为各个gram的加权平均,加权策略如下表所示。例如,BLEU-4是计算从1-gram到4-gram的累积分数,加权策略为1-gram、2-gram、3-gram和4-gram的权重各占25%。
1-gram 2-gram 3-gram 4-gram
BLEU-1 1 0 0 0
BLEU-2 0.5 0.5 0 0
BLEU-3 0.3 0.3 0.3 0
BLEU-4 0.25 0.25 0.25 0.25
步骤4、向微调后的模型中输入电力作业现场的图片I,通过模型分析计算得到图像中作业场景对应的语言描述Y;
步骤5、建立标准电力安全作业规程语料库,利用Sentence-BERT模型计算语言描述Y和标准电力安全作业规程语料库文本的语义相似度;具体过程为:
步骤5.1、建立标准电力安全作业规程语料库,语料库内容为《电力安全工作规程》中规定的规范操作相关条目;例如:Workers should wear insulating gloves whenpulling disconnectors and circuit breakers.(拉合隔离开关和断路器时,应佩戴绝缘手套)。
步骤5.2、利用Sentence-BERT模型计算生成文本Y和标准电力安全作业规程语料库文本的语义相似度,Sentence-BERT有两个一样的BERT模型,把句子1输入第一个BERT模型,把句子2输入第二个BERT模型,获取两个句子对应的向量表示u和v,最后通过余弦相似计算两个向量的相似度:
S=cos(u,v)。
步骤6、提取语义相似度最高的文本,其内容为规程中规定的该场景下的规范操作,将计算得到的语义相似度与阈值进行比较,相似度高于阈值,判定为规范操作;反之,则判定为违章行为。
阈值取值为0.85。
实施例:
下面以“跨越安全围栏场景”为例,阐述本方法的实施过程及结果。
首先建立电力作业场景图像描述模型,完成对模型的训练、微调及测试;然后输入一张施工现场图片,如图4所示,模型输出图片对应的语言描述以及计算过程中每一步注意力机制重点关注的区域,如图5所示。可见,对于图4,模型给出的描述为“A man iscrossing a security fence.”(一个人正在跨越安全围栏),最后将生成的描述输入训练好的Sentence-BERT模型,模型输出图片对应的描述与标准电力安全作业规程语料库中条目文本的相似度,如图6所示,其中相似度最高的条目为“Workers are not allowed tocross the security fence.”(工作人员不得跨越安全围栏),其文本语义相似度为0.6063,该相似度得分低于0.85,因此,可判定图片中存在违章行为。除此之外,我们还在多个作业场景下对本方法进行了测试,均取得了有效的结果,具体作业场景及对应的违章行为如表1所示。
表1
从表1和图5、图6中可以看出,本方法可应用于多种复杂作业场景,实现作业场景的精细化描述及安全风险辨识,契合电力作业场景图像智能化处理的需求。
通过上述方式,本发明复杂电力作业场景安全风险解译方法,借助高层场景语义理解任务图像描述,将电力作业场景图像信息直接转化为文字信息,同时引入文本语义相似度分析,通过对比图像对应的文字信息与标准电力安全作业规程语义相似度判定该场景下是否存在违章行为。本方法可以应用在复杂场景中,实现作业场景的精细化描述及安全风险辨识,契合电力作业场景图像智能化处理的需求。

Claims (6)

1.复杂电力作业场景安全风险解译方法,其特征在于,具体按照以下步骤实施:
步骤1、利用成像设备获取电力作业现场的图片I;
步骤2、建立基于注意力机制的编码器-解码器模型,利用COCO数据集对模型进行预训练;
步骤3、制作针对电力作业场景的专用图像描述数据集;利用专用图像描述数据集对预训练得到的模型进行微调;
步骤4、向微调后的模型中输入电力作业现场的图片I,通过模型分析计算得到图像中作业场景对应的语言描述Y;
步骤5、建立标准电力安全作业规程语料库,利用Sentence-BERT模型计算语言描述Y和标准电力安全作业规程语料库文本的语义相似度;
步骤6、提取语义相似度最高的文本,其内容为规程中规定的该场景下的规范操作,将计算得到的语义相似度与阈值进行比较,相似度高于阈值,判定为规范操作;反之,则判定为违章行为。
2.根据权利要求1所述复杂电力作业场景安全风险解译方法,其特征在于,步骤2中所述基于注意力机制的编码器-解码器模型:
编码器部分把输入图片I转化为D维特征a,解码部分把D维特征a变成目标语言Y,D=2048为特征向量的维度,L=32×32描述图像的不同区域,是K词汇表的大小,C为生成语言描述的长度。
3.根据权利要求2所述复杂电力作业场景安全风险解译方法,其特征在于,步骤2具体过程为:
步骤2.1、编码器由预训练的残差网络ResNet-101构成,删除ResNet-101网络中的线性层和池化层,直接从卷积层中提取D维特征a,编码只进行一次,解码是逐个单词进行的,所有以下网络变量均带有下标t;
步骤2.2、将D维特征a输入注意力机制获取上下文向量zt,zt是原有特征向量a的加权和,权重为
维度为L=1024,记录原有特征向量a每个像素位置获得的关注度;
步骤2.3、利用LSTM网络模拟记忆关系包括内部隐状态ht、输入it、遗忘ft、存储ct、输出ot、候选gt;输入it、遗忘ft和输出ot用来控制其他状态的强度,都通过隐状态ht-1,以及当前上下文向量zt获得,候选gt描述进入存储的信息,生成方式相同,存储ct是LSTM的核心,由前一词的存储ct-1和当前候选gt加权得到,遗忘门ft控制前一词存储,输入门it控制本次候选;
ct=ft⊙ct-1+it⊙gt
隐状态ht由存储ct经过变化得到,强度由输出门ot控制:
ht=ot⊙tanh(ct);
步骤2.4、当前隐变量ht通过全连网络生成当前单词yt,基于注意力机制的编码器-解码器模型搭建完成;
步骤2.5、利用COCO数据集,使用自适应学习率通过随机梯度下降对基于注意力机制的编码器-解码器模型进行预训练。
4.根据权利要求1所述复杂电力作业场景安全风险解译方法,其特征在于,步骤3具体过程为:
步骤3.1、收集电力作业现场图片,对图片进行随机裁剪、翻转、旋转、随机增强操作,形成电力作业场景的专用图像数据集;
步骤3.2、为电力作业场景的专用图像数据集添加对应的描述文本,每张图片对应5句描述文本,描述文本以json文件格式存储,电力作业场景专用图像描述数据集制作完成,将数据集按照8:2的比例分为训练集和测试集;
步骤3.3、利用电力作业场景专用图像描述数据集对预训练模型进行微调。
5.根据权利要求1所述复杂电力作业场景安全风险解译方法,其特征在于,步骤5具体过程为:
步骤5.1、建立标准电力安全作业规程语料库,语料库内容为《电力安全工作规程》中规定的规范操作相关条目;
步骤5.2、利用Sentence-BERT模型计算生成文本Y和标准电力安全作业规程语料库文本的语义相似度,所述Sentence-BERT有两个一样的BERT模型,把句子1输入第一个BERT模型,把句子2输入第二个BERT模型,获取两个句子对应的向量表示u和v,最后通过余弦相似计算两个向量的相似度:
S=cos(u,v)。
6.根据权利要求1所述复杂电力作业场景安全风险解译方法,其特征在于,步骤6中所述阈值取值为0.85。
CN202310390245.9A 2023-04-12 2023-04-12 复杂电力作业场景安全风险解译方法 Pending CN116523300A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310390245.9A CN116523300A (zh) 2023-04-12 2023-04-12 复杂电力作业场景安全风险解译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310390245.9A CN116523300A (zh) 2023-04-12 2023-04-12 复杂电力作业场景安全风险解译方法

Publications (1)

Publication Number Publication Date
CN116523300A true CN116523300A (zh) 2023-08-01

Family

ID=87395067

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310390245.9A Pending CN116523300A (zh) 2023-04-12 2023-04-12 复杂电力作业场景安全风险解译方法

Country Status (1)

Country Link
CN (1) CN116523300A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094592A (zh) * 2023-08-21 2023-11-21 武汉市万睿数字运营有限公司 一种基于多维检测的工单自动验收方法、装置及相关介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119701A (zh) * 2019-04-30 2019-08-13 东莞恒创智能科技有限公司 基于视觉关系检测的煤矿综采工作面不安全行为识别方法
CN113569932A (zh) * 2021-07-18 2021-10-29 湖北工业大学 一种基于文本层级结构的图像描述生成方法
KR20230046491A (ko) * 2021-09-30 2023-04-06 대우조선해양 주식회사 딥러닝 언어모델과 자연어 처리기술을 이용한 프로젝트 스펙정보 분석 및 리스크 예측 방법과 시스템, 및 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119701A (zh) * 2019-04-30 2019-08-13 东莞恒创智能科技有限公司 基于视觉关系检测的煤矿综采工作面不安全行为识别方法
CN113569932A (zh) * 2021-07-18 2021-10-29 湖北工业大学 一种基于文本层级结构的图像描述生成方法
KR20230046491A (ko) * 2021-09-30 2023-04-06 대우조선해양 주식회사 딥러닝 언어모델과 자연어 처리기술을 이용한 프로젝트 스펙정보 분석 및 리스크 예측 방법과 시스템, 및 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄友文等: "融合卷积注意力机制的图像描述生成模型", 《计算机应用》, pages 23 - 27 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094592A (zh) * 2023-08-21 2023-11-21 武汉市万睿数字运营有限公司 一种基于多维检测的工单自动验收方法、装置及相关介质

Similar Documents

Publication Publication Date Title
Mahmood et al. WHITE STAG model: Wise human interaction tracking and estimation (WHITE) using spatio-temporal and angular-geometric (STAG) descriptors
CN110458282B (zh) 一种融合多角度多模态的图像描述生成方法及系统
CN108804530B (zh) 对图像的区域加字幕
CN109165563B (zh) 行人再识别方法和装置、电子设备、存储介质、程序产品
Ko et al. Sign language recognition with recurrent neural network using human keypoint detection
CN113327279B (zh) 一种点云数据处理方法、装置、计算机设备及存储介质
CN114092707A (zh) 一种图像文本视觉问答方法、系统及存储介质
Banerjee et al. Comparison of pretrained embeddings to identify hate speech in Indian code-mixed text
Kishore et al. Video audio interface for recognizing gestures of indian sign
CN110175248B (zh) 一种基于深度学习和哈希编码的人脸图像检索方法和装置
CN116523300A (zh) 复杂电力作业场景安全风险解译方法
CN114169002A (zh) 一种关键点差分隐私驱动的人脸图像隐私保护方法
CN111274786A (zh) 一种自动量刑的方法和系统
Yugopuspito et al. Mobile sign language recognition for bahasa indonesia using convolutional neural network
CN114186080A (zh) 基于语义共享的深度跨模态检索方法及系统
CN110930469B (zh) 一种基于过渡空间映射的文本生成图像方法和系统
CN117668292A (zh) 一种跨模态敏感信息识别方法
CN114332288B (zh) 基于短语驱动生成对抗网络的文本生成图像的方法及网络
Rui et al. Data Reconstruction based on supervised deep auto-encoder
Kalliatakis et al. DisplaceNet: Recognising displaced people from images by exploiting dominance level
CN114120050A (zh) 地表生态数据提取方法及装置、设备和存储介质
Htwe et al. Building annotated image dataset for Myanmar text to image synthesis
Tan et al. Sentiment analysis of chinese short text based on multiple features
CN116758402B (zh) 图像人物关系识别方法、系统、设备及存储介质
JP4852086B2 (ja) パターン認識装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination