CN114693942A - 一种仪器仪表智能运维的多模态故障理解及辅助标注方法 - Google Patents

一种仪器仪表智能运维的多模态故障理解及辅助标注方法 Download PDF

Info

Publication number
CN114693942A
CN114693942A CN202210336240.3A CN202210336240A CN114693942A CN 114693942 A CN114693942 A CN 114693942A CN 202210336240 A CN202210336240 A CN 202210336240A CN 114693942 A CN114693942 A CN 114693942A
Authority
CN
China
Prior art keywords
image
audio
data
text
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210336240.3A
Other languages
English (en)
Inventor
张可
柴毅
蒲华祥
邱可玥
王嘉璐
钱亚林
宋倩倩
安翼尧
李希晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202210336240.3A priority Critical patent/CN114693942A/zh
Publication of CN114693942A publication Critical patent/CN114693942A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Mathematics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种仪器仪表智能运维的多模态故障理解及辅助标注方法,步骤为:采集仪器仪表故障时反馈的图像、声音和文本数据,分别对采集的图像、音频和文本数据进行预处理,对预处理后的图像数据、音频数据、文本数据进行特征提取,采用基于多模态量子启发神经网络对提取的图像、音频、文本特征进行融合;利用提取的图像、音频、文本特征对多模态量子启发神经网络模型进行训练;将训练好的模型加载到仪器仪表智能运维平台后端,将多模态故障数据传入API,经过模型推理,返回标注集合;本发明通过多模态量子启发深度网络模型对图像、语音、文本特征进行融合,通过融合编码特征对仪器仪表的故障进行理解,并对故障反馈信息进行自动标注,实用性强。

Description

一种仪器仪表智能运维的多模态故障理解及辅助标注方法
技术领域
本发明涉及仪器仪表智能运维技术领域,特别是一种仪器仪表智能运维的多模态故障理解及辅助标注方法。
背景技术
随着人工智能技术的蓬勃发展,传统工业逐步向智能化、无人化转型,大幅度提高了社会生产力及生产效率。仪器仪表是保障工厂安全可靠运行的基础性设施,但随着工厂规模的不断扩大,大规模的仪器仪表设备被投入生产线,然而,对大量的仪器仪表设备维护是一项重要且具有挑战性的任务,幸运的是,人工智能技术的快速发展为仪器仪表的智能运维带来了新机。
纵观目前仪器仪表智能运维平台架构,对于来自边缘端的故障反馈信息处理还没有高效的处理方法,鉴于运维平台终端接受到的反馈信息具有多模态特性,如图像、语音和文本等,且所接受的故障反馈信息来自不同的仪器仪表或设备,目前大多采取人工分类的处理方式进行标注分流,显然这将耗费大量的人力成本。
发明内容
本发明的目的就是提供一种仪器仪表智能运维的多模态故障理解及辅助标注方法。
本发明的目的是通过这样的技术方案实现的,具体步骤如下:
1)数据采集:采集仪器仪表故障时反馈的图像、声音和文本数据,并组织成字典{'image':[img1,img2,…],'voice':[v1,v2,…],'text':[t1,t2,…]},其中:image、voice、text分别为图像、音频和文本三种模态;
2)数据预处理:分别对步骤1)中采集的图像、音频和文本数据进行预处理,得到预处理后的图像、音频和文本数据;
3)特征提取:采用基于PatchConvNet模型对步骤2)中预处理后的图像数据进行图像特征提取,采用基于一维扩张卷积预对步骤2)中处理后的音频数据进行音频特征提取,采用基于GRU单元的双向循环网络对步骤2-3)中预处理后的文本进行文本特征提取;
4)构建模型:采用基于多模态量子启发神经网络对步骤3)中提取的图像特征、音频特征和文本特征进行融合,得到融合编码特征;
5)模型训练:使用自编码训练与多任务训练的方式对图像、音频、文本特征的提取模型进行训练,利用步骤3)提取的图像、音频、文本特征对多模态量子启发神经网络模型进行训练;
6)辅助标注:将训练好的三种模态数据的特征提取网络模型以及多模态量子启发深度网络模型加载到仪器仪表智能运维平台后端,将仪器仪表多模态故障数据传入API,经过模型推理,返回标注集合,实现辅助标注。
进一步,步骤2)中数据预处理的具体步骤为:
2-1)对步骤1)中采集的图像数据进行自适应裁剪和方形填充,然后对图像进行缩放归一化,保持图像比例不变,最后对列表中的图像进行去重过滤;
2-2)采用基于启发式双重优化PCD算法对步骤1)中采集的音频数据进行降噪,对降噪后的音频片段进行中心裁剪或者对称填充;
2-3)基于完备专业性词向量空间对步骤1)中采集的文本数据进行关键词提取,并将关键词转换成向量形式,得到关键词向量矩阵。
进一步,步骤3)中特征提取的具体步骤为:
3-1)图像特征提取:将图像数据输入PatchConvNet模型中,采用循环前向传播,再对输出进行平均融合,得到维度为512的图像特征:
Figure BDA0003574411940000021
式中,images为图像数据,N1为单个样本中图像数据片段的数量;
3-2)音频特征提取:采用基于一维扩张卷积预对步骤2)中处理后的音频数据进行音频特征提取,然后对输出进行平均融合,得到音频特征:
Figure BDA0003574411940000022
式中,voices为音频数据,N2为单个样本中音频数据片段的数量;
3-3)文本特征提取:采用基于GRU单元的双向循环网络对步骤2)中得到的关键词向量进行特征提取,并截取最后一个时间步的输出作为后续特征:
Figure BDA0003574411940000023
式中,texts为关键词向量,N3为单个样本中关键词向量的数量。
进一步,步骤4)中构建模型的具体步骤为:
4-1)将三种模态的特征向量输入多模态量子启发神经网络的全联接层:
Figure BDA0003574411940000024
式中,
Figure BDA0003574411940000031
分别表示图像特征向量、音频特征向量和文本特征向量;
将三种模态的特征投向量影到一个d维的空间中:
aj,tj,vj=transform(uj)
其中,transform表示线性投影变换;
将各个模态的纯态进行融合:
ρj=λa|aj><aj|+λt|tj><tj|+λv|vj><vj|
式中,λatv分别表示三种模态;
4-2)通过类量子循环神经网络QRNN网络模型对三种模态的特征矩阵进行融合,将密度矩阵序列
Figure BDA0003574411940000032
输入QRNN网络模型中,通过隐藏态的密度矩阵ρh表示序列的信息,则时间步的迭代计算过程为:
Figure BDA0003574411940000033
Figure BDA0003574411940000034
式中,更新函数f(·)是参数化的酉矩阵Ux,Uh和实值λ;Ux,Uh,
Figure BDA0003574411940000035
均是定义在希尔伯特空间的酉矩阵且满足UUH=I2,
Figure BDA0003574411940000036
I为单位矩阵,t为虚拟时间变量,ρt为t时刻的密度矩阵,
Figure BDA0003574411940000037
表示t-1时刻的隐态密度矩阵。
所述密度矩阵通过
Figure BDA0003574411940000038
其中|φj><φj|表示基态。
所述QRNN网络模型的输出为整个序列的d维状态
Figure BDA0003574411940000039
即三种模态的融合特征矩阵;
4-3)通过一个全局的可观测量来测量每个完整序列的状态,通过相互正交的特征状态构建一个d维的酉矩阵M即概率分布矩阵,用于表示状态坍缩到相应特征态的可能性;
4-4)通过步骤4-3)测量得到一个d维的概率分布,将d维的概率分布向量通过一层全联接层计算得到相应标签的预测概率,进一步得到分类标签:
ei=argmax(σ)k
Figure BDA00035744119400000310
式中,x为上一个神经节点输出,
Figure BDA00035744119400000311
为全联接层参数矩阵,sj为第j个节点输出,σ函数返回类别概率,k表示输出维度,ei为概率最大的类别。
进一步,步骤5)中模型训练的具体步骤为:
5-1)使用自编码训练与多任务训练的方式对图像、音频、文本特征的提取模型进行训练;
5-2)利用静态特征
Figure BDA0003574411940000041
完成多模态量子启发神经网络模型的启发式搜索过程,保存最优的酉矩阵,再使用Adam算法训练模型的全连接层权重参数,得到训练好的多模态量子启发深度网络模型。
进一步,步骤6)中辅助标注的具体步骤为:
6-1)将训练好的三种模态数据的特征提取网络模型以及多模态量子启发深度网络模型加载到仪器仪表智能运维平台后端;
6-2)检查输入的仪器仪表多模态故障数据是否符合格式要求:
{'image':[img1,img2,…],'voice':[v1,v2,…],'text':[t1,t2,…]},
若格式正确则执行步骤6-3),若格式不正确则先将仪器仪表多模态故障数据处理成满足的格式要求再执行步骤6-3);
6-3)对仪器仪表多模态故障数据进行数据预处理,然后将处理完成的多模态故障数据传入运维平台的API,经过模型推理,返回标注集合,完成辅助标注。
由于采用了上述技术方案,本发明具有如下的优点:
1、本发明通过多模态量子启发深度网络模型对图像、语音、文本特征进行融合,通过融合编码特征对仪器仪表的故障进行理解,并对故障反馈信息进行自动标注和分流实用性强。
2、本发明的多模态量子启发深度网络模型利用量子计算提升神经计算的信息处理能力,将人工神经网络与量子理论结合起来会更好地模拟人脑的信息处理过程,对多模态信息融合的准确度更高。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。
附图说明
本发明的附图说明如下。
图1为本发明的流程图。
图2为本发明用于图像特征提取的PatchConvNet模型图。
图3为本发明用于音频特征提取的一维扩张卷积模型图。
图4为本发明用于特征融合的多模态量子启发神经网络模型图。
图5为本发明多模态量子启发神经网络模型的模态融合过程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1所示的一种仪器仪表智能运维的多模态故障理解及辅助标注方法,具体步骤如下:
1)数据采集:采集仪器仪表故障时反馈的图像、声音和文本数据,并组织成字典{'image':[img1,img2,…],'voice':[v1,v2,…],'text':[t1,t2,…]},其中:image、voice、text分别为图像、音频和文本三种模态;
在本发明实例中,三种模态数据所对应的VALUE均由列表形式组织,三个列表的长度并不是对齐的,最小长度值为0;所述图像列表是由通过多角度多距离采集到的现场故障设备图像组成的图像集合,存在图像尺寸不一致、目标对象偏离中心、边缘冗余的特点;所述声音列表是由采集到的故障设备异常音频片段所构成的集合,存在强噪声、音频片段时长不一致的特点;文本列表是由现场检测人员对故障现象进行主观文字描述所构成的集合,存在文本不规范、逻辑不清楚、专业性表述不足的特点。
2)数据预处理:分别对步骤1)中采集的图像、音频和文本数据进行预处理,得到预处理后的图像、音频和文本数据;具体步骤为:
2-1)对步骤1)中采集的图像数据进行自适应裁剪和方形填充,然后对图像进行缩放归一化,保持图像比例不变,最后对列表中的图像进行去重过滤;具体步骤为:
2-1-1)采用自适应裁剪算法去除步骤1)中采集的图像数据的边缘冗余:
将原图像转化成灰度图:
gray=(R*19595+G*38469+B*7472)>>16
式中,R、G、B分别代表原图三个通道的像素矩阵;
基于自适应局部阈值的方法对灰度图进行二值化,得到二值化图像矩阵:
IF:f(x,y)>T,gray(x,y)=255;Else:gray(x,y)=0
式中,T为全局阈值,f(x,y)是图像坐标(x,y)的像素值;
根据二值化图像矩阵搜索目标边界向量[bup,bdown,bleft,bright],再根据所得边界向量对原图像进行裁剪,裁剪后的图像形状为:
shape(gray)=(bdown-bup,bright-bleft);
2-1-2)以步骤2-1-1)中裁剪后图像的长边为参照,对短边进行对称式填充,得到对象居中的正方形图像:
IF:w>h,shape(gray)=(w,w);Else:shape(gray)=(h,h)
式中,w、h分别表示图像的宽度和高度;
2-1-3)将步骤2-1-2)中填充后图像进行缩放至标准尺寸,并将像素值归一化到[0,1]区间:
Figure BDA0003574411940000061
式中,xi表示像素点的值;
2-1-4)遍历经过以上处理后的图像列表,计算两两余弦相似度,根据设定相似度阈值T',对余弦相似度大于相似度阈值T'的一组样本仅保留其一:
Figure BDA0003574411940000062
式中,A、B分别表示一对图像的像素矩阵。
2-2)采用基于启发式双重优化PCD算法对步骤1)中采集的音频数据进行降噪,对降噪后的音频片段进行中心裁剪或者对称填充;具体步骤为:
2-2-1)通过差分进化算法对PCD算法参数进行迭代优化,然后基于最优参数集合对音频数据进行降噪优化,其优化的目标函数为:
Figure BDA0003574411940000063
式中,
Figure BDA0003574411940000064
为对数似然项,用于描述干净音频信号x与含噪声音频信号y之间的关系;ρ(x)表示未知干净音频信号x的先验信号;
2-2-2)对降噪后的音频列表逐一裁剪和填充,使得列表中的音频信号长度一致,处理后的音频可表示为x=[x1,x2,...,xm,pm+1,...,pn],其中m为有效音频长度,n为标准长度,p为填充值。
2-3)基于完备专业性词向量空间对步骤1)中采集的文本数据进行关键词提取,并将关键词转换成向量形式,得到关键词向量矩阵。
在本发明实例中,完备专业性词库包含所有投入使用的仪器仪表名称以及型号,并利用词库训练Word2Vector模型并保存,得到完备专业性词向量空间[v1,v2,v3,…,vN],其中,N代表词向量空间大小即所有专业性词的数量,每一个向量对应一个专业性词,则第i个词表示为vi=[vi1,...,vid],其中d代表词向量维度;所述词向量矩阵SHAPE为L*D,L表示该样本中所提取到的关键词数量,D表示每一个关键词的向量维度。
3)特征提取:采用基于PatchConvNet模型对步骤2)中预处理后的图像数据进行图像特征提取,采用基于一维扩张卷积预对步骤2)中处理后的音频数据进行音频特征提取,采用基于GRU单元的双向循环网络对步骤2-3)中预处理后的文本进行文本特征提取;具体步骤为:
3-1)图像特征提取:所述单个图像样本数据中包含多个图像:
shape(images)=(N,C,W,H)
式中,N为单个样本中图像的数量,C,W,H分别为图像通道数、图像宽度和图像高度;
将图像数据输入PatchConvNet模型中,采用循环前向传播,再对输出进行平均融合,得到维度为512的图像特征:
Figure BDA0003574411940000071
式中,images为图像数据,N1为单个样本中图像数据片段的数量;
在本发明实例中,如图2所示,所述PatchConvNet模型包括一个用于将图像像素进行分割,并映射成一组向量卷积网络,所述卷积网络的输出端连接有由N个堆叠的残差卷积层、squeeze-And-excitation层、1*1的卷积层依次连接组件的主干模块,所述N个堆叠的残差卷积层的每个层均有一个归一化、1*1的卷积、3*3的卷积用来做空间处理。所述主干模块的输出端预处理后的向量通过类似Transformer的交叉注意力层(cross attentionlayer)的方式进行融合,注意力层中的每个权重值取决于预测patch与可训练向量(CLS)之间的相似度,然后将产生的d维向量添加到CLS向量中,并经过一个前馈网络处理。
3-2)音频特征提取:采用基于一维扩张卷积预对步骤2)中处理后的音频数据进行音频特征提取,然后对输出进行平均融合,得到音频特征:
Figure BDA0003574411940000072
式中,voices为音频数据,N2为单个样本中音频数据片段的数量。
在本发明实例中,对于一维音频序列输入x∈Rn和滤波器f:{0,…,k-1}→R,音频序列元素s的扩张卷积运算F为:
Figure BDA0003574411940000073
式中,d是扩张因子,k是滤波器大小,s-d·i为过去的方向,当d取值大于1时,可使顶层的输出表示更大范围的输入,从而有效扩展了一维卷积的感受野。
3-3)文本特征提取:采用基于GRU单元的双向循环网络对步骤2)中得到的关键词向量进行特征提取,并截取最后一个时间步的输出作为后续特征:
Figure BDA0003574411940000081
式中,texts为关键词向量,N3为单个样本中关键词向量的数量。
4)构建模型:采用基于多模态量子启发神经网络对步骤3)中提取的图像特征、音频特征和文本特征进行融合,得到融合编码特征;具体步骤为:
4-1)将三种模态的特征向量输入多模态量子启发神经网络的全联接层:
Figure BDA0003574411940000082
式中,
Figure BDA0003574411940000083
分别表示图像特征向量、音频特征向量和文本特征向量;
将三种模态的特征投向量影到一个d维的空间中:
aj,tj,vj=transform(uj)
其中,transform表示线性投影变换;
将各个模态的纯态进行融合:
ρj=λa|aj><aj|+λt|tj><tj|+λv|vj><vj|
式中,λatv分别表示三种模态;
4-2)通过类量子循环神经网络QRNN网络模型对三种模态的特征矩阵进行融合,将密度矩阵序列
Figure BDA0003574411940000084
输入QRNN网络模型中,通过隐藏态的密度矩阵ρh表示序列的信息,则时间步的迭代计算过程为:
Figure BDA0003574411940000085
Figure BDA00035744119400000810
式中,更新函数f(·)是参数化的酉矩阵Ux,Uh和实值λ;Ux,Uh,
Figure BDA0003574411940000086
均是定义在希尔伯特空间的酉矩阵且满足UUH=I2,
Figure BDA0003574411940000087
I为单位矩阵,t为虚拟时间变量,ρt为t时刻的密度矩阵,
Figure BDA0003574411940000088
表示t-1时刻的隐态密度矩阵。
所述密度矩阵通过
Figure BDA0003574411940000089
其中|φj><φj|表示基态。
所述QRNN网络模型的输出为整个序列的d维状态
Figure BDA0003574411940000091
即三种模态的融合特征矩阵;
4-3)通过一个全局的可观测量来测量每个完整序列的状态,通过相互正交的特征状态构建一个d维的酉矩阵M即概率分布矩阵,用于表示状态坍缩到相应特征态的可能性;
4-4)通过步骤4-3)测量得到一个d维的概率分布,将d维的概率分布向量通过一层全联接层计算得到相应标签的预测概率,进一步得到分类标签:
ei=argmax(σ)k
Figure BDA0003574411940000092
式中,x为上一个神经节点输出,
Figure BDA0003574411940000093
为全联接层参数矩阵,sj为第j个节点输出,σ函数返回类别概率,k表示输出维度,ei为概率最大的类别。
在本发明实例中,启发式搜索过程中,为了在整个训练过程中满足酉约束,采用黎曼方法来更新酉矩阵:
Figure BDA0003574411940000094
Figure BDA0003574411940000095
式中,G是梯度,lr是学习率,I为单位矩阵,L为代价损失,X为状态矩阵。
5)模型训练:使用自编码训练与多任务训练的方式对图像、音频、文本特征的提取模型进行训练,利用步骤3)提取的图像、音频、文本特征对多模态量子启发神经网络模型进行训练;具体步骤为:
5-1)使用自编码训练与多任务训练的方式对图像、音频、文本特征的提取模型进行训练,将特征提取网络视为Encoder,并参考Encoder的结构建立辅助训练Decoder:
Figure BDA0003574411940000096
Figure BDA0003574411940000097
Figure BDA0003574411940000098
使用Adam优化算法对三种模态的特征提取网络进行训练;
使用多任务训练的方式对特征提取网络进行训练,在特征提取网络增加任务适配层,所述分类任务的最后一层为分类器层,输出表示为p(y|x)=softmax(f),f表示输出层特征,维度等于分类类别数。
5-2)利用静态特征
Figure BDA0003574411940000101
完成多模态量子启发神经网络模型的启发式搜索过程,保存最优的酉矩阵,再使用Adam算法训练模型的全连接层权重参数,得到训练好的多模态量子启发深度网络模型。
6)辅助标注:将训练好的三种模态数据的特征提取网络模型以及多模态量子启发深度网络模型加载到仪器仪表智能运维平台后端,将仪器仪表多模态故障数据传入API,经过模型推理,返回标注集合,实现辅助标注,具体步骤为:
6-1)将训练好的三种模态数据的特征提取网络模型以及多模态量子启发深度网络模型加载到仪器仪表智能运维平台后端;
6-2)检查输入的仪器仪表多模态故障数据是否符合格式要求:
{'image':[img1,img2,…],'voice':[v1,v2,…],'text':[t1,t2,…]},
若格式正确则执行步骤6-3),若格式不正确则先将仪器仪表多模态故障数据处理成满足的格式要求再执行步骤6-3);
6-3)对仪器仪表多模态故障数据进行数据预处理,然后将处理完成的多模态故障数据传入运维平台的API,经过模型推理,返回标注集合,完成辅助标注。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (6)

1.一种仪器仪表智能运维的多模态故障理解及辅助标注方法,其特征在于,具体步骤如下:
1)数据采集:采集仪器仪表故障时反馈的图像、声音和文本数据,并组织成字典{'image':[img1,img2,…],'voice':[v1,v2,…],'text':[t1,t2,…]},其中:image、voice、text分别为图像、音频和文本三种模态;
2)数据预处理:分别对步骤1)中采集的图像、音频和文本数据进行预处理,得到预处理后的图像、音频和文本数据;
3)特征提取:采用基于PatchConvNet模型对步骤2)中预处理后的图像数据进行图像特征提取,采用基于一维扩张卷积预对步骤2)中处理后的音频数据进行音频特征提取,采用基于GRU单元的双向循环网络对步骤2-3)中预处理后的文本进行文本特征提取;
4)构建模型:采用基于多模态量子启发神经网络对步骤3)中提取的图像特征、音频特征和文本特征进行融合,得到融合编码特征;
5)模型训练:使用自编码训练与多任务训练的方式对图像、音频、文本特征的提取模型进行训练,利用步骤3)提取的图像、音频、文本特征对多模态量子启发神经网络模型进行训练;
6)辅助标注:将训练好的三种模态数据的特征提取网络模型以及多模态量子启发深度网络模型加载到仪器仪表智能运维平台后端,将仪器仪表多模态故障数据传入API,经过模型推理,返回标注集合,实现辅助标注。
2.如权利要求1所述的一种仪器仪表智能运维的多模态故障理解及辅助标注方法,其特征在于,步骤2)中数据预处理的具体步骤为:
2-1)对步骤1)中采集的图像数据进行自适应裁剪和方形填充,然后对图像进行缩放归一化,保持图像比例不变,最后对列表中的图像进行去重过滤;
2-2)采用基于启发式双重优化PCD算法对步骤1)中采集的音频数据进行降噪,对降噪后的音频片段进行中心裁剪或者对称填充;
2-3)基于完备专业性词向量空间对步骤1)中采集的文本数据进行关键词提取,并将关键词转换成向量形式,得到关键词向量矩阵。
3.如权利要求2所述的一种仪器仪表智能运维的多模态故障理解及辅助标注方法,其特征在于,步骤3)中特征提取的具体步骤为:
3-1)图像特征提取:将图像数据输入PatchConvNet模型中,采用循环前向传播,再对输出进行平均融合,得到维度为512的图像特征:
Figure FDA0003574411930000021
式中,images为图像数据,N1为单个样本中图像数据片段的数量;
3-2)音频特征提取:采用基于一维扩张卷积预对步骤2)中处理后的音频数据进行音频特征提取,然后对输出进行平均融合,得到音频特征:
Figure FDA0003574411930000022
式中,voices为音频数据,N2为单个样本中音频数据片段的数量;
3-3)文本特征提取:采用基于GRU单元的双向循环网络对步骤2)中得到的关键词向量进行特征提取,并截取最后一个时间步的输出作为后续特征:
Figure FDA0003574411930000023
式中,texts为关键词向量,N3为单个样本中关键词向量的数量。
4.如权利要求3所述的一种仪器仪表智能运维的多模态故障理解及辅助标注方法,其特征在于,步骤4)中构建模型的具体步骤为:
4-1)将三种模态的特征向量输入多模态量子启发神经网络的全联接层:
Figure FDA0003574411930000024
式中,
Figure FDA0003574411930000025
分别表示图像特征向量、音频特征向量和文本特征向量;
将三种模态的特征投向量影到一个d维的空间中:
aj,tj,vj=transform(uj)
其中,transform表示线性投影变换;
将各个模态的纯态进行融合:
pj=λa|aj><aj|+λt|tj><tj|+λv|vj><vj|
式中,aj,tj,vj分别表示音频、文本和视觉三种模态,λatv为融合系数,均为非负值且和为1;
4-2)通过类量子循环神经网络QRNN网络模型对三种模态的特征矩阵进行融合,将密度矩阵序列
Figure FDA0003574411930000026
输入QRNN网络模型中,通过隐藏态的密度矩阵ρh表示序列的信息,则时间步的迭代计算过程为:
Figure FDA0003574411930000031
Figure FDA0003574411930000032
式中,更新函数f(·)是参数化的酉矩阵Ux,Uh和实值λ;Ux,Uh,
Figure FDA0003574411930000033
均是定义在希尔伯特空间的酉矩阵且满足
Figure FDA0003574411930000034
I为单位矩阵,t为虚拟时间变量,ρt为t时刻的密度矩阵,
Figure FDA0003574411930000035
表示t-1时刻的隐态密度矩阵;
所述密度矩阵通过
Figure FDA0003574411930000036
其中|φj><φj|表示基态;
所述QRNN网络模型的输出为整个序列的d维状态
Figure FDA0003574411930000037
即三种模态的融合特征矩阵;
4-3)通过一个全局的可观测量来测量每个完整序列的状态,通过相互正交的特征状态构建一个d维的酉矩阵M即概率分布矩阵,用于表示状态坍缩到相应特征态的可能性;
4-4)通过步骤4-3)测量得到一个d维的概率分布,将d维的概率分布向量通过一层全联接层计算得到相应标签的预测概率,进一步得到分类标签:
ei=argmax(σ)k
Figure FDA0003574411930000038
式中,x为上一个神经节点输出,
Figure FDA0003574411930000039
为全联接层参数矩阵,sj为第j个节点输出,σ函数返回类别概率,k表示输出维度,ei为概率最大的类别。
5.如权利要求4所述的一种仪器仪表智能运维的多模态故障理解及辅助标注方法,其特征在于,步骤5)中模型训练的具体步骤为:
5-1)使用自编码训练与多任务训练的方式对图像、音频、文本特征的提取模型进行训练;
5-2)利用静态特征
Figure FDA00035744119300000310
完成多模态量子启发神经网络模型的启发式搜索过程,保存最优的酉矩阵,再使用Adam算法训练模型的全连接层权重参数,得到训练好的多模态量子启发深度网络模型。
6.如权利要求5所述的一种仪器仪表智能运维的多模态故障理解及辅助标注方法,其特征在于,步骤6)中辅助标注的具体步骤为:
6-1)将训练好的三种模态数据的特征提取网络模型以及多模态量子启发深度网络模型加载到仪器仪表智能运维平台后端;
6-2)检查输入的仪器仪表多模态故障数据是否符合格式要求:
{'image':[img1,img2,…],'voice':[v1,v2,…],'text':[t1,t2,…]},
若格式正确则执行步骤6-3),若格式不正确则先将仪器仪表多模态故障数据处理成满足的格式要求再执行步骤6-3);
6-3)对仪器仪表多模态故障数据进行数据预处理,然后将处理完成的多模态故障数据传入运维平台的API,经过模型推理,返回标注集合,完成辅助标注。
CN202210336240.3A 2022-03-31 2022-03-31 一种仪器仪表智能运维的多模态故障理解及辅助标注方法 Pending CN114693942A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210336240.3A CN114693942A (zh) 2022-03-31 2022-03-31 一种仪器仪表智能运维的多模态故障理解及辅助标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210336240.3A CN114693942A (zh) 2022-03-31 2022-03-31 一种仪器仪表智能运维的多模态故障理解及辅助标注方法

Publications (1)

Publication Number Publication Date
CN114693942A true CN114693942A (zh) 2022-07-01

Family

ID=82141597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210336240.3A Pending CN114693942A (zh) 2022-03-31 2022-03-31 一种仪器仪表智能运维的多模态故障理解及辅助标注方法

Country Status (1)

Country Link
CN (1) CN114693942A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114992063A (zh) * 2022-05-06 2022-09-02 国能信控互联技术有限公司 一种自动化风机叶片故障检测方法及系统
CN115424108A (zh) * 2022-11-08 2022-12-02 四川大学 一种基于视听融合感知的认知功能障碍评测方法
CN116576917A (zh) * 2023-05-17 2023-08-11 四川博思德信息技术有限公司 一种设备运行数据的采集方法及装置
CN116912353A (zh) * 2023-09-13 2023-10-20 上海蜜度信息技术有限公司 多任务图像处理方法、系统、存储介质及电子设备
CN117669753A (zh) * 2024-01-31 2024-03-08 北京航空航天大学杭州创新研究院 量子模型训练方法、多模态数据处理方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114992063A (zh) * 2022-05-06 2022-09-02 国能信控互联技术有限公司 一种自动化风机叶片故障检测方法及系统
CN115424108A (zh) * 2022-11-08 2022-12-02 四川大学 一种基于视听融合感知的认知功能障碍评测方法
CN115424108B (zh) * 2022-11-08 2023-03-28 四川大学 一种基于视听融合感知的认知功能障碍评测方法
CN116576917A (zh) * 2023-05-17 2023-08-11 四川博思德信息技术有限公司 一种设备运行数据的采集方法及装置
CN116912353A (zh) * 2023-09-13 2023-10-20 上海蜜度信息技术有限公司 多任务图像处理方法、系统、存储介质及电子设备
CN116912353B (zh) * 2023-09-13 2023-12-19 上海蜜度信息技术有限公司 多任务图像处理方法、系统、存储介质及电子设备
CN117669753A (zh) * 2024-01-31 2024-03-08 北京航空航天大学杭州创新研究院 量子模型训练方法、多模态数据处理方法及装置
CN117669753B (zh) * 2024-01-31 2024-04-16 北京航空航天大学杭州创新研究院 量子模型训练方法、多模态数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN114693942A (zh) 一种仪器仪表智能运维的多模态故障理解及辅助标注方法
CN107526785B (zh) 文本分类方法及装置
CN114120102A (zh) 边界优化的遥感图像语义分割方法、装置、设备及介质
CN110569901A (zh) 一种基于通道选择的对抗消除弱监督目标检测方法
CN112949647B (zh) 三维场景描述方法、装置、电子设备和存储介质
CN113657560B (zh) 基于节点分类的弱监督图像语义分割方法及系统
CN108629367A (zh) 一种基于深度网络增强服装属性识别精度的方法
CN109165743A (zh) 一种基于深度压缩自编码器的半监督网络表示学习算法
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
CN114926469A (zh) 语义分割模型训练方法、语义分割方法、存储介质及终端
CN112149612A (zh) 一种基于深度神经网络的海洋生物识别系统及识别方法
CN111582506A (zh) 基于全局和局部标记关系的偏多标记学习方法
CN114065769B (zh) 情感原因对抽取模型的训练方法、装置、设备及介质
CN114998360A (zh) 一种基于SUnet算法的脂肪细胞祖细胞分割方法
CN114596464A (zh) 多特征交互的无监督目标检测方法、系统、电子设备和可读存储介质
CN115797795B (zh) 基于强化学习的遥感影像问答式检索系统及方法
CN114936327B (zh) 元素识别模型的获取方法、装置、计算机设备和存储介质
CN114462526B (zh) 一种分类模型训练方法、装置、计算机设备及存储介质
CN116110005A (zh) 一种人群行为属性的计数方法、系统及产品
CN115599392A (zh) 一种代码处理的方法、装置、介质及电子设备
CN115861713A (zh) 一种基于多任务学习的颈动脉斑块超声图像处理方法
CN115344794A (zh) 一种基于知识图谱语义嵌入的旅游景点推荐方法
CN113837062A (zh) 一种分类方法、装置、存储介质及电子设备
CN111882441A (zh) 一种基于理财产品推荐场景的用户预测解释Treeshap方法
Saxena et al. An Optimized Technique for Plant Identification Through Deep Residual Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination