CN115205972A - 一种基于深度学习的六步洗手评估方法及装置 - Google Patents

一种基于深度学习的六步洗手评估方法及装置 Download PDF

Info

Publication number
CN115205972A
CN115205972A CN202210819707.XA CN202210819707A CN115205972A CN 115205972 A CN115205972 A CN 115205972A CN 202210819707 A CN202210819707 A CN 202210819707A CN 115205972 A CN115205972 A CN 115205972A
Authority
CN
China
Prior art keywords
hand washing
prediction
video
layer
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210819707.XA
Other languages
English (en)
Inventor
李成龙
朱启文
刘图彪
汤进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN202210819707.XA priority Critical patent/CN115205972A/zh
Publication of CN115205972A publication Critical patent/CN115205972A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的六步洗手评估方法及装置,所述方法包括:对洗手视频进行帧分解以及光流提取后进行特征编码得到特征图;将经过特征编码的特征图送入第一预测网络得到第一预测结果;将第一预测结果输入多个级联的第二预测网络得到洗手步骤分割结果;将获得的洗手步骤分割结果与原始特征结合得到属于每一步骤的特征,将每一步骤的特征送入其对应的关键动作打分器中进行打分;得到每一步骤的分数后,将每一步骤的分数相加得到总得分,总得分与预设的标准得分进行比较得出评估结果;本发明的优点在于:评估结果较为准确。

Description

一种基于深度学习的六步洗手评估方法及装置
技术领域
本发明涉及图像识别领域,更具体涉及一种基于深度学习的六步洗手评估方法及装置。
背景技术
2005年,世界卫生组织将10月15日定为“世界洗手日”。但遗憾的是,生活中能洗好手的人并不多,相当一部分人并没有养成良好的洗手习惯。传染性病毒患者喷出的飞沫不仅会扩散到空气中还会粘在手上,存活很长时间。如果他们再次用手接触其他人或其他东西,他们将有很大的可能性感染其他人。所以手是这些病毒传播疾病的重要媒介。研究表明,科学洗手可以减少20%的患病风险。因此,对洗手过程有一个正确的评估是非常重要的。通过评估,医务人员可以纠正自己的洗手行为,以尽可能降低疾病传播的风险。
目前的六步洗手法评估方法多是使用额外的传感器来对六步洗手法的准确性进行评估,这导致了额外的成本。近年来,评估行动质量的动作评估引起了广泛关注。它在现实世界的许多领域都有重要的应用,比如体育和医疗。以往的动作评估模型往往直接对一个视频进行评估,计算出一个分数,例如中国专利公开号CN112906453A,公开的智能识别并实时反馈的洗手监测系统。然而,这些方法会忽略长动作中的许多细节,而长动作通常涉及几个短步骤,因此降低了长动作评估的性能。世界卫生组织(世卫组织)规定的六步洗手法是一个标准的长行动,包括六个步骤。六步洗手法评估任务中有两个主要问题。首先,每个视频包含六个步骤中的一些或全部,因此现有的动作评估模型无法知道哪些帧属于哪个步骤,这给准确评估整个视频带来了很大的挑战。第二,在每个步骤中,有几个关键的动作来决定质量,因此,并不是所有的行动对六步洗手法评估都是有用的,无用的动作容易对评估结果造成干扰,导致评估不够准确。
发明内容
本发明所要解决的技术问题在于现有技术六步洗手评估的方法准确性不高的问题。
本发明通过以下技术手段实现解决上述技术问题的:一种基于深度学习的六步洗手评估方法,所述方法包括:
步骤一:对洗手视频进行帧分解以及光流提取后进行特征编码得到特征图;
步骤二:将经过特征编码的特征图送入第一预测网络得到第一预测结果,第一阶段的预测网络包括顺次连接的一个降维卷积层,一个空洞残差层,以及一个预测卷积层;
步骤三:将第一预测结果输入多个级联的第二预测网络得到更加准确的洗手步骤分割结果,所述第二预测网络相比第一预测网络,在其降维卷积层之前加入了线性Transformer;
步骤四:将获得的洗手步骤分割结果与原始特征结合得到属于每一步骤的特征,将每一步骤的特征送入其对应的关键动作打分器中进行打分;
步骤五:得到每一步骤的分数后,将每一步骤的分数相加得到总得分,总得分与预设的标准得分进行比较得出评估结果。
本发明不是对整个视频进行处理,而是对洗手视频进行帧分解以及光流提取后进行特征编码得到特征图,后续对特征图进行进一步处理,不会忽略长动作中的许多细节,提高了洗手动作评估的性能,并且提取特征图的方式只关注几个关键的动作,并不是关注视频中所有的动作,避免无用的动作容易对评估结果造成干扰,提高评估的准确性。其次,将经过特征编码的特征图送入第一预测网络得到一个初步的第一预测结果,然后将第一预测结果输入多个级联的第二预测网络得到洗手步骤分割结果,从而能够知道哪些帧属于哪个步骤,有利于准确评估整个视频。
进一步地,所述步骤一包括:
对洗手视频进行帧分解以及光流提取并送入预训练好的I3D网络中的特征提取模块进行特征提取得到1024维的RGB数据和光流数据,之后将这两个数据特征进行连接,得到2048维的特征图。
更进一步地,所述步骤二包括:
降维卷积层用于将输入的2048维度特征图降至256维度特征,空洞残差层包括空洞卷积和残差链接,用于在特征上建立帧之间的关系,预测卷积层用于预测最终的分类结果。
更进一步地,所述步骤三包括:
将第一预测结果输入第二预测网络,经过线性Transformer进行帧间关系的进一步建模,利用Transformer的自注意力模块来建模帧间的全局关系,然后经过降维卷积层、空洞残差层和预测卷积层进行进一步的修正,最后获得最终的洗手步骤分割结果。
更进一步地,所述步骤四包括:
关键动作打分器包括一个全局平均池化层,2个全连接层和2个Sigmoid层,全局平均池化层输出分别连接一个全连接层,2个全连接层的输出各连接一个Sigmoid层,每一步骤的特征输入全局平均池化层,全局平均池化层和2个全连接层用于对所获得的每一步骤的特征进行降维,Sigmoid层用来对每一步骤降维后的特征进行打分。
本发明还提供一种基于深度学习的六步洗手法评估装置,包括;
视频采集单元,用于采集洗手人员的洗手过程视频;
存储器,用于存储视频采集单元拍摄到的洗手过程视频;
数据读取单元,用于在检测到存储器中存在未被评估的洗手过程视频时,从存储器中读取洗手人员的洗手过程视频并送入处理器中;
处理器,用于执行上述六步洗手法评估方法。
进一步地,所述视频采集单元设置于洗手池上,还用于当有洗手人员在该洗手池上洗手时,拍摄洗手人员的洗手过程视频,当洗手人员结束洗手过程后,将拍摄到的洗手过程的视频传输到存储器中进行存储。
进一步地,所述评估装置还包括显示单元,用于显示处理器返回的评估结果。
本发明的优点在于:本发明不是对整个视频进行处理,而是对洗手视频进行帧分解以及光流提取后进行特征编码得到特征图,后续对特征图进行进一步处理,不会忽略长动作中的许多细节,提高了洗手动作评估的性能,并且提取特征图的方式只关注几个关键的动作,并不是关注视频中所有的动作,避免无用的动作容易对评估结果造成干扰,提高评估的准确性。其次,将经过特征编码的特征图送入第一预测网络得到一个初步的第一预测结果,然后将第一预测结果输入多个级联的第二预测网络得到洗手步骤分割结果,从而能够知道哪些帧属于哪个步骤,有利于准确评估整个视频。
附图说明
图1为本发明实施例所提供的一种基于深度学习的六步洗手评估方法的网络模型示意图;
图2为本发明实施例所提供的一种基于深度学习的六步洗手评估方法的洗手步骤分解示意图;
图3为本发明实施例所提供的一种基于深度学习的六步洗手评估方法中视频采集单元与洗手台以及洗手人员位置示意图;
图4为本发明实施例所提供的一种基于深度学习的六步洗手评估方法与现有技术方法评估结果对比;
图5为本发明实施例所提供的一种基于深度学习的六步洗手法评估装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1和图2所示,一种基于深度学习的六步洗手评估方法,所述方法包括:
步骤一:视频特征编码是指对原始视频进行压缩,以获得能够反映视频信息的特征表示。现有的动作分割网络通常只使用RGB特征进行后续预测。在此基础上,本发明进一步提取视频的光流数据,光流法是运动分析的一种重要方法。因此,对洗手视频进行帧分解以及光流提取并送入预训练好的I3D网络中的特征提取模块进行特征提取得到1024维的RGB数据和光流数据,之后将这两个数据特征进行连接,得到2048维的特征图;其中,洗手视频是通过具有录像功能的视频采集单元采集的,如图3所示,该视频采集单元安装在洗手池上并且要求可以不受遮挡拍摄到洗手人员的洗手视频。要求洗手人员正面面对洗手池,以便获取洗手人员的一段六步洗手法视频;当有洗手人员需要进行六步洗手法评估时,启动视频采集单元,开始录像。当洗手人员结束洗手过程后,视频采集单元会将拍摄到的洗手过程的视频传输到存储器中进行存储,以便后续的读取与浏览。
步骤二:将经过特征编码的特征图送入第一预测网络得到第一预测结果,第一阶段的预测网络包括顺次连接的一个大小2048*256,核大小为1的降维卷积层,四个大小256*256,空洞率分别为2,4,8,16,核大小为3的空洞残差层,以及一个大小256*7的预测卷积层;降维卷积层用于将输入的2048维度特征图降至256维度特征,以减少计算量并压缩特征,空洞残差层包括空洞卷积和残差链接,用于在特征上建立帧之间的关系,预测卷积层用于预测最终的分类结果。总的流程为首先通过使用空洞卷积对特征进行信息压缩,并通过压缩后的特征得到第一阶段的粗略的预测结果。
步骤三:将第一预测结果输入多个级联的第二预测网络得到洗手步骤分割结果,所述第二预测网络相比第一预测网络,在其降维卷积层之前加入了线性Transformer;具体流程为首先压缩后的第一预测结果经过线性Transformer进行帧间关系的进一步建模,利用Transformer的自注意力模块来建模帧间的全局关系。其中注意力机制公式为:
Attention(Q,K,V)=φ(Q)φ(K)TV
其中,Attention()为注意力函数,注意力层的输入向量分别是Query向量(Q),Key向量(K)和Value向量(V),φ(·)=elu(·)+1。注意力操作通过度量Q和每个K之间的相似性来选择相关信息,输出向量则是由相似度得分的value加权和得到。其中自注意力中Q,K,V是同一个特征对应的向量。在经过线性Transformer后,同样经过降维卷积层、空洞残差层和预测卷积层进行进一步的修正,同样的修正会进行4次,最后获得最终的步骤分割结果。
步骤四:将获得的洗手步骤分割结果与原始特征结合得到属于每一步骤的特征,将每一步骤的特征送入其对应的关键动作打分器中进行打分;关键动作打分器由若干个结构相同参数不共享的分支构成,每个分支主要包括2个大小为2048*256,256*1第一全连接层、第二全连接层和一个具有可学习参数的Sigmoid层,全局平均池化层输出送入若干个分支,每个分支顺次连接第一全连接层、第二全连接层以及可学习Sigmoid层。每一步骤的特征输入其对应的关键动作打分器中的全局平均池化层,全局平均池化层和2个全连接层(第一全连接层和第二全连接层)用于对所获得的对应步骤的特征进行关键动作提取,每个分支对应不同的关键动作,可学习Sigmoid层用来对每一步骤的关键动作的特征进行打分。由于关键动作的完成度决定着每一步骤的完成质量,因此,通过关键动作来对每一洗手步骤进行评估会更加准确。
步骤五:得到每一步骤的分数后,将每一步骤的分数相加得到六步洗手法视频的总得分,总得分与预设的标准得分进行比较得出评估结果。由于是对于每个短的步骤进行评估后的加和,所以准确率远远大于直接对整个视频进行评估。
如图4所示,在六步洗手法数据集上验证了本发明提供的方法的有效性,与现有的方法相比,本发明的方法在步骤分割的评价指标:准确率,编辑距离,F1分数,以及动作评估的指标斯皮尔曼秩相关系数和相关L2距离上都达到了最佳效果。
通过以上技术方案,本发明不是对整个视频进行处理,而是对洗手视频进行帧分解以及光流提取后进行特征编码得到特征图,后续对特征图进行进一步处理,不会忽略长动作中的许多细节,提高了洗手动作评估的性能,并且提取特征图的方式只关注几个关键的动作,并不是关注视频中所有的动作,避免无用的动作容易对评估结果造成干扰,提高评估的准确性。其次,将经过特征编码的特征图送入第一预测网络得到一个初步的第一预测结果,然后将第一预测结果输入多个级联的第二预测网络得到洗手步骤分割结果,从而能够知道哪些帧属于哪个步骤,有利于准确评估整个视频。
实施例2
如图5所示,与本发明实施例1相对应的,本发明实施例2还提供一种基于深度学习的六步洗手法评估装置,包括;
视频采集单元,用于采集洗手人员的洗手过程视频;
存储器,用于存储视频采集单元拍摄到的洗手过程视频;
数据读取单元,用于在检测到存储器中存在未被评估的洗手过程视频时,从存储器中读取洗手人员的洗手过程视频并送入处理器中;
处理器,用于执行实施例1的六步洗手法评估方法。
具体的,所述视频采集单元设置于洗手池上,还用于当有洗手人员在该洗手池上洗手时,拍摄洗手人员的洗手过程视频,当洗手人员结束洗手过程后,将拍摄到的洗手过程的视频传输到存储器中进行存储。
具体的,所述评估装置还包括显示单元,用于显示处理器返回的评估结果。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种基于深度学习的六步洗手评估方法,其特征在于,所述方法包括:
步骤一:对洗手视频进行帧分解以及光流提取后进行特征编码得到特征图;
步骤二:将经过特征编码的特征图送入第一预测网络得到第一预测结果,第一阶段的预测网络包括顺次连接的一个降维卷积层,一个空洞残差层,以及一个预测卷积层;
步骤三:将第一预测结果输入多个级联的第二预测网络得到洗手步骤分割结果,所述第二预测网络相比第一预测网络,在其降维卷积层之前加入了线性Transformer;
步骤四:将获得的洗手步骤分割结果与原始特征结合得到属于每一步骤的特征,将每一步骤的特征送入其对应的关键动作打分器中进行打分;
步骤五:得到每一步骤的分数后,将每一步骤的分数相加得到总得分,总得分与预设的标准得分进行比较得出评估结果。
2.根据权利要求1所述的一种基于深度学习的六步洗手评估方法,其特征在于,所述步骤一包括:
对洗手视频进行帧分解以及光流提取并送入预训练好的I3D网络中的特征提取模块进行特征提取得到1024维的RGB数据和光流数据,之后将这两个数据特征进行连接,得到2048维的特征图。
3.根据权利要求2所述的一种基于深度学习的六步洗手评估方法,其特征在于,所述步骤二包括:
降维卷积层用于将输入的2048维度特征图降至256维度特征,空洞残差层包括空洞卷积和残差链接,用于在特征上建立帧之间的关系,预测卷积层用于预测最终的分类结果。
4.根据权利要求3所述的一种基于深度学习的六步洗手评估方法,其特征在于,所述步骤三包括:
将第一预测结果输入第二预测网络,经过线性Transformer进行帧间关系的进一步建模,利用Transformer的自注意力模块来建模帧间的全局关系,然后经过降维卷积层、空洞残差层和预测卷积层进行进一步的修正,最后获得最终的洗手步骤分割结果。
5.根据权利要求4所述的一种基于深度学习的六步洗手评估方法,其特征在于,所述步骤四包括:
关键动作打分器包括一个全局平均池化层,2个全连接层和2个Sigmoid层,全局平均池化层输出分别连接一个全连接层,2个全连接层的输出各连接一个Sigmoid层,每一步骤的特征输入全局平均池化层,全局平均池化层和2个全连接层用于对所获得的每一步骤的特征进行降维,Sigmoid层用来对每一步骤降维后的特征进行打分。
6.一种基于深度学习的六步洗手法评估装置,其特征在于,包括;
视频采集单元,用于采集洗手人员的洗手过程视频;
存储器,用于存储视频采集单元拍摄到的洗手过程视频;
数据读取单元,用于在检测到存储器中存在未被评估的洗手过程视频时,从存储器中读取洗手人员的洗手过程视频并送入处理器中;
处理器,用于执行权利要求1-5任一项所述的六步洗手法评估方法。
7.根据权利要求6所述的一种基于深度学习的六步洗手法评估装置,其特征在于,所述视频采集单元设置于洗手池上,还用于当有洗手人员在该洗手池上洗手时,拍摄洗手人员的洗手过程视频,当洗手人员结束洗手过程后,将拍摄到的洗手过程的视频传输到存储器中进行存储。
8.根据权利要求6所述的一种基于深度学习的六步洗手法评估装置,其特征在于,还包括显示单元,用于显示处理器返回的评估结果。
CN202210819707.XA 2022-07-13 2022-07-13 一种基于深度学习的六步洗手评估方法及装置 Pending CN115205972A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210819707.XA CN115205972A (zh) 2022-07-13 2022-07-13 一种基于深度学习的六步洗手评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210819707.XA CN115205972A (zh) 2022-07-13 2022-07-13 一种基于深度学习的六步洗手评估方法及装置

Publications (1)

Publication Number Publication Date
CN115205972A true CN115205972A (zh) 2022-10-18

Family

ID=83580278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210819707.XA Pending CN115205972A (zh) 2022-07-13 2022-07-13 一种基于深度学习的六步洗手评估方法及装置

Country Status (1)

Country Link
CN (1) CN115205972A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116485729A (zh) * 2023-04-03 2023-07-25 兰州大学 基于transformer的多级桥梁缺陷检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116485729A (zh) * 2023-04-03 2023-07-25 兰州大学 基于transformer的多级桥梁缺陷检测方法
CN116485729B (zh) * 2023-04-03 2024-01-12 兰州大学 基于transformer的多级桥梁缺陷检测方法

Similar Documents

Publication Publication Date Title
CN112232164B (zh) 一种视频分类方法和装置
CN110933518B (zh) 一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法
CN107770517A (zh) 基于图像失真类型的全参考图像质量评价方法
CN109117774B (zh) 一种基于稀疏编码的多视角视频异常检测方法
CN113033587B (zh) 图像识别结果评估方法、装置、电子设备及存储介质
CN114445420B (zh) 编解码结构结合注意力机制的图像分割模型及其训练方法
CN114140831B (zh) 人体姿态估计方法、装置、电子设备及存储介质
CN110390340A (zh) 特征编码模型、视觉关系检测模型的训练方法及检测方法
CN114550946A (zh) 医疗数据处理方法、装置及存储介质
CN112883227B (zh) 一种基于多尺度时序特征的视频摘要生成方法和装置
WO2021120007A1 (zh) 一种基于红外图像序列的睡眠质量评估系统和方法
CN113569758B (zh) 基于动作三元组引导的时序动作定位方法、系统、设备及介质
CN111738074B (zh) 基于弱监督学习的行人属性识别方法、系统及装置
CN113011399A (zh) 基于生成协同判别网络的视频异常事件检测方法及系统
CN112464760A (zh) 一种目标识别模型的训练方法和装置
CN114220143A (zh) 一种佩戴口罩的人脸识别方法
WO2021179198A1 (zh) 图像特征可视化方法、图像特征可视化装置及电子设备
CN114821299A (zh) 一种遥感图像变化检测方法
CN115205972A (zh) 一种基于深度学习的六步洗手评估方法及装置
CN115620304A (zh) 文本识别模型的训练方法、文本识别方法及相关装置
CN115221941A (zh) 认知障碍检测方法及相关装置、电子设备和存储介质
CN115954019B (zh) 一种融合自注意力和卷积操作的环境噪声识别方法及系统
CN117237685A (zh) 一种基于多模态深度聚类的机械设备故障诊断方法
CN116310562A (zh) 一种基于近邻搜索的盲图像质量评价方法、系统
CN115713708A (zh) 一种基于Transformer的模仿人眼特性的视频质量评价方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination