CN113255789A - 基于对抗网络和多被试脑电信号的视频质量评价方法 - Google Patents

基于对抗网络和多被试脑电信号的视频质量评价方法 Download PDF

Info

Publication number
CN113255789A
CN113255789A CN202110603651.XA CN202110603651A CN113255789A CN 113255789 A CN113255789 A CN 113255789A CN 202110603651 A CN202110603651 A CN 202110603651A CN 113255789 A CN113255789 A CN 113255789A
Authority
CN
China
Prior art keywords
distortion
tested
electroencephalogram
video quality
quality evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110603651.XA
Other languages
English (en)
Other versions
CN113255789B (zh
Inventor
何立火
徐海鹏
蔡虹霞
孙羽晟
柯俊杰
廖乙霖
钟斌
陈欣雷
高新波
路文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202110603651.XA priority Critical patent/CN113255789B/zh
Publication of CN113255789A publication Critical patent/CN113255789A/zh
Application granted granted Critical
Publication of CN113255789B publication Critical patent/CN113255789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明提出了一种基于对抗网络和多被试脑电信号的视频质量评价方法,实现步骤为:(1)获取训练样本集、测试样本集和标注样本集;(2)构建多被试对抗网络模型;(3)对多被试对抗网络模型进行迭代训练;(4)获取视频质量评价结果。本发明构建的多被试对抗网络模型中,通过被试域判别器与特征提取器构成的对抗网络,提取了源被试脑电数据与目标被试脑电数据的不变特征,解决了脑电信号视频质量评价模型只适用于单一数据源的问题,提高了视频质量评价精度。

Description

基于对抗网络和多被试脑电信号的视频质量评价方法
技术领域
本发明属于视频处理技术领域,涉及一种视频质量评价方法,更进一步涉及一种基于对抗网络和多被试脑电信号的视频质量评价方法。
背景技术
近年来,基于脑电信号的视频质量评价方法受到越来越多的关注。相关研究表明,脑电信号与视频质量存在特定的联系,通过分析脑电信号可以得到与视频质量相关的特定成分。目前,用于视频质量评价的脑电技术通过头表电极直接获取脑电信号以反映神经电位活动,是一种既简单又安全可靠的方法。该方法既克服了客观方法无法充分反映主观感知质量的缺点,又克服了主观方法耗时长、成本高的缺点,对获取真实的视频感知质量具有重要的理论意义和实用价值。
例如,申请公布号为CN111510710A,名称为“基于脑电信号和时空失真的视频质量评价方法”的专利申请,公开了一种基于脑电信号和时空失真的视频质量评价方法。该方法实现步骤为:(1)生成模拟水面波动视频;(2)生成时空失真视频;(3)采集连续脑电信号和主观评价;(4)计算主观评价检测率;(5)对脑电信号进行分段;(6)对分段后的脑电信号进行分类;(7)计算脑电信号分类准确率;(8)评价时空失真视频质量。该方法虽然具有视频质量评价结果与人类主观评价更加一致,评价结果更加准确的优点,但是其存在的不足之处是,数据利用效率较低,无法有效的利用多被试的脑电信号特征,导致最终视频质量评价结果受到数据量不足的影响。
授权公告号为CN106412571B,名称为“一种基于梯度相似性标准差的视频质量评价法”的专利申请,公开了一种基于梯度相似性标准差的视频质量评价方法。该方法实现步骤为:(1)通过参考视频当前帧与前两帧的帧差以及失真视频当前帧与前两帧的帧差来计算视频帧差的梯度相似度矩阵,并以此来模拟视觉系统的时域变化;(2)计算参考帧与失真帧的梯度相似度矩阵来获取当前帧的空域失真程度;(3)根据当前帧的时域失真程度及空域失真程度计算视频序列的质量。该方法虽然具有对于视频的时域失真和空域失真均能够较好的评价性能的优点。但是其存在的不足之处是,视频质量评价过程与人脱离,所构建的失真程度算法不能代表人类接收并感知视频的过程,评价的结果不能很好的符合主观评价结果。
发明内容
本发明的目的是针对上述现有技术的不足,提出了一种基于对抗网络和多被试脑电信号的视频质量评价方法。用于解决现有视频质量评价方法中不能很好的符合主观评价结果,主观数据利用效率较低的问题。
为实现上述目的,本发明采取的技术方案包括如下步骤:
(1)获取训练样本集、测试样本集和标注样本集:
(1a)以K-1个失真等级对一段时长为c的视频Vf进行失真处理,并将Vf作为未失真视频与失真处理得到的K-1个失真视频进行组合,得到混合视频集合V={V1,V2...Vk...VK},其中,1<K<10,0<c<5s,Vk表示第k个视频;
(1b)采集M个被试人员观看每个视频Vk的脑电信号,得到脑电信号集合X={X1,X2...,Xm...,XM},其中,5<M<30,Xm表示所采集的第m个被试人员观看视频V的脑电信号向量,
Figure BDA0003093675840000021
Figure BDA0003093675840000022
表示所采集的第m个被试人员观看视频Vk的脑电信号;
(1c)将从脑电信号集合X中随机选取的一个脑电信号向量作为目标被试脑电数据E,将剩余的M-1个脑电信号向量作为源被试脑电数据F,对脑电信号集合X中的每个脑电信号进行标注,得到标注样本集
Figure BDA0003093675840000023
其中,
Figure BDA0003093675840000024
表示脑电信号集合X中第q个脑电信号及其标签,
Figure BDA0003093675840000025
表示
Figure BDA0003093675840000026
来自于目标被试脑电数据E,
Figure BDA0003093675840000027
表示
Figure BDA0003093675840000028
来自于源被试脑电数据F;
(1d)将半数以上目标被试脑电数据E中每个失真等级所对应的脑电信号以及源被试脑电数据F中每个失真等级所对应的脑电信号作为训练数据集,将其余目标被试脑电数据E中每个失真等级所对应的脑电信号作为测试数据集;
(1e)对训练数据集和测试数据集中的每个脑电信号进行标注,并将训练数据集中的每个脑电信号及其标签组合成训练样本集
Figure BDA0003093675840000029
将测试数据集中的每个脑电信号及其标签组合成测试样本集
Figure BDA0003093675840000031
其中,
Figure BDA0003093675840000032
表示训练样本集中第n个脑电信号及其标签,
Figure BDA0003093675840000033
表示未失真,
Figure BDA0003093675840000034
表示失真,
Figure BDA0003093675840000035
表示测试样本集中第o个脑电信号及其标签,
Figure BDA0003093675840000036
表示未失真,
Figure BDA0003093675840000037
表示失真;
(2)构建基于多被试对抗网络的视频质量评价模型G:
(2a)构建包括多被试对抗网络和失真分类器Gy的视频质量评价模型G,其中,多被试对抗网络包括公共特征提取器Gf以及与其级联的被试域判别器Gd,公共特征提取器Gf包括时域卷积层、空域卷积层、多个分离卷积层、多个BN层和多个池化层,被试域判别器Gd包括多个全连接层,失真分类器Gy包括多个全连接层;
(2b)定义被试域判别器Gd、失真分类器Gy和公共特征提取器Gf的损失函数
Figure BDA0003093675840000038
Figure BDA0003093675840000039
Figure BDA00030936758400000310
Figure BDA00030936758400000311
Figure BDA00030936758400000312
其中,L表示损失函数NLL Loss,θf、θy、θd分别表示公共特征提取器Gf、失真分类器Gy、被试域判别器Gd的权重和偏差参数,di表示二值变量,di=0表示
Figure BDA00030936758400000313
来自目标被试脑电数据E,di=1表示
Figure BDA00030936758400000314
来自源被试脑电数据F;
(3)对视频质量评价模型G进行迭代训练:
(3a)初始化迭代次数为t,最大迭代次数为T,T≥200,当前视频质量评价模型为Gt,并令t=1,Gt=G;
(3b)固定被试域判别器Gd,将训练样本集中的每个训练样本
Figure BDA00030936758400000315
作为视频质量评价模型G的输入,公共特征提取器Gf
Figure BDA00030936758400000316
进行时空特征提取,失真分类器Gy对Gf所提取的时空特征
Figure BDA0003093675840000041
进行局部信息整合,得到
Figure BDA0003093675840000042
的失真预测结果
Figure BDA0003093675840000043
(3c)采用损失函数
Figure BDA0003093675840000044
并通过
Figure BDA0003093675840000045
计算Gt的损失值Lt,再采用反向传播方法并通过Lt计算Gf和Gy的卷积核参数ωt、各全连接层结点之间的连接参数θt的梯度,然后采用梯度下降算法通过Gf和Gy的卷积核参数ωt、各全连接层结点之间的连接参数θt的梯度对Gf和Gy的参数ωt、θt进行更新,得到更新后的Gt1
(3d)固定公共特征提取器Gf和失真分类器Gy,将训练样本集中的每个训练样本
Figure BDA0003093675840000046
作为视频质量评价模型Gt1的输入,公共特征提取器Gf
Figure BDA0003093675840000047
进行时空特征提取,被试域判别器Gd对Gf所提取的时空特征
Figure BDA0003093675840000048
进行局部信息整合,得到
Figure BDA0003093675840000049
的判别结果
Figure BDA00030936758400000410
表示
Figure BDA00030936758400000411
来自目标被试脑电数据E,
Figure BDA00030936758400000412
表示
Figure BDA00030936758400000413
来自源被试脑电数据F;
(3e)采用损失函数
Figure BDA00030936758400000414
并通过
Figure BDA00030936758400000415
计算Gt1的损失值Lt1,再采用反向传播方法并通过Lt1计算Gd各全连接层结点之间的连接参数θt1的梯度,然后采用梯度下降算法通过Gd的各全连接层结点之间的连接参数θt1的梯度对Gd的参数θt1进行更新,得到更新后的Gt2
(3f)判断t=T是否成立,若是,得到训练好的视频质量评价模型G*,否则,令t=t+1,并执行步骤(3b);
(4)获取视频质量评价结果:
将测试样本集中的每个测试样本
Figure BDA00030936758400000416
作为训练好的视频质量评价模型G*的输入进行失真预测,得到
Figure BDA00030936758400000417
的预测结果
Figure BDA00030936758400000418
表示
Figure BDA00030936758400000419
为未失真,
Figure BDA00030936758400000420
表示
Figure BDA00030936758400000421
为未失真。
本发明与现有技术相比较,具有以下优点:
第一,本发明在对视频质量评价模型进行训练以及获取视频质量评价结果的过程中,在多被试对抗网络的作用下,公共特征提取器提取了源被试脑电数据与目标被试脑电数据的不变特征,避免了以往脑电信号视频质量评价模型只适用于单一数据源的缺点,提高了脑电信号的利用效率,缓解了视频评价结果受到数据量不足的影响,提升了视频质量评价精度。
第二,由于在本发明构建的视频质量评价模型中对多个被试的脑电信息进行了公共特征提取,避免了以往视频质量评价模型无法真实反映人类主观感受的问题,评价的结果能更好地符合主观评价结果。
附图说明
图1是本发明的实现流程图。
图2是本发明实施例所构建的多被试对抗网络模型的结构示意图。
具体实施方式
下面结合附图和具体实施例,对本发明作进一步的描述。
参照附图1,本发明包括如下步骤。
步骤1)获取训练样本集、测试样本集和标注样本集:
(1a)以K-1个失真等级对一段时长为c的视频Vf进行失真处理,并将Vf作为未失真视频与失真处理得到的K-1个失真视频进行组合,得到混合视频集合V={V1,V2...Vk...VK},其中,1<K<10,0<c<5s,Vk表示第k个视频,本实施例中,K=5,c=4;
(1b)采集M个被试人员观看每个视频Vk的脑电信号,得到脑电信号集合X={X1,X2...,Xm...,XM},其中,5<M<30,Xm表示所采集的第m个被试人员观看视频V的脑电信号向量,
Figure BDA0003093675840000051
表示所采集的第m个被试人员观看视频Vk的脑电信号,本实施例中,M=9,具体操作流程为:混合视频集合V包含4个失真视频,一个未失真视频,每位被试观看每个视频60次,因此,每位被试共有300个脑电样本,其中60个脑电样本对应视频未失真,240个脑电样本对应视频失真。每位被试每次观看对应一段固定时长为1s的脑电信号,采用电极为64通道数,采样频率为1000Hz,则每个脑电样本包含1000个采样点;
(1c)基于深度学习对包含视频质量信息的脑电数据进行分类,在利用多被试脑电样本训练模型时,通常会遭遇负迁移的影响,即相比于单被试所训练的模型来讲,数据的增加并不会提升模型的性能,反而会导致分类性能下降。因此,构建目标被试脑电数据和源被试脑电数据,利用对抗训练最小化两个被试域特征分布之间的差异。
因此,将从脑电信号集合X中随机选取的一个脑电信号向量作为目标被试脑电数据E,将剩余的M-1个脑电信号向量作为源被试脑电数据F,对脑电信号集合X中的每个脑电信号进行标注,得到标注样本集
Figure BDA0003093675840000061
其中,
Figure BDA0003093675840000062
表示脑电信号集合X中第q个脑电信号及其标签,
Figure BDA0003093675840000063
表示
Figure BDA0003093675840000064
来自于目标被试脑电数据E,
Figure BDA0003093675840000065
表示
Figure BDA0003093675840000066
来自于源被试脑电数据F;
(1d)将半数以上目标被试脑电数据E中每个失真等级所对应的脑电信号以及源被试脑电数据F中每个失真等级所对应的脑电信号作为训练数据集,将其余目标被试脑电数据E中每个失真等级所对应的脑电信号作为测试数据集;
(1e)对训练数据集和测试数据集中的每个脑电信号进行标注,并将训练数据集中的每个脑电信号及其标签组合成训练样本集
Figure BDA0003093675840000067
将测试数据集中的每个脑电信号及其标签组合成测试样本集
Figure BDA0003093675840000068
其中,
Figure BDA0003093675840000069
表示训练样本集中第n个脑电信号及其标签,
Figure BDA00030936758400000610
表示未失真,
Figure BDA00030936758400000611
表示失真,
Figure BDA00030936758400000612
表示测试样本集中第o个脑电信号及其标签,
Figure BDA00030936758400000613
表示未失真,
Figure BDA00030936758400000614
表示失真。
步骤2)构建基于多被试对抗网络的视频质量评价模型G:
(2a)构建包括多被试对抗网络和失真分类器Gy的视频质量评价模型G,其中,多被试对抗网络包括公共特征提取器Gf以及与其级联的被试域判别器Gd,G的输入为C×T的脑电样本,其中,C代表采集脑电时所用的电极数量,T表示固定长度的脑电样本所包含的采样点数。本实施例是本所构建的多被试对抗网络模型的结构如图2,其中:共特征提取器Gf包括的时域卷积层的个数为1,用于提取脑电信号在时间维度上的特征,时域卷积核尺寸为1×64,卷积核个数为8,步长为1,同时采用零填充来保持输入输出的特征尺度不发生变化。空域卷积层的个数为1,用于提取脑电信号在空间维度上的特征(空间上64个通道代表64个电极,与质量感知相关的大脑皮层活跃区域对应),卷积核尺寸为C×1,卷积核个数为16,采用Depthwise卷积操作,每2个卷积核分组作用于一个特征图以减少参数量。分离卷积层的个数为3,该结构与常规卷积操作类似,可用于提取特征,但参数量与运算成本相对较低。卷积层后采用线性整流单元(ReLU)作为激活函数。BN层的个数为5,池化层的个数为4。该公共特征提取器Gf的具体结构为:第一时域卷积层→第一BN层→第一空域卷积层→第二BN层→第一池化层→第一分离卷积层→第三BN层→第二池化层→第二分离卷积层→第四BN层→第三池化层→第三分离卷积层→第五BN层→第四池化层;
被试域判别器Gd包括3个全连接层;
失真分类器Gy包括1个全连接层;
(2b)即使对于不同的被试,由视频失真所引起的与视频质量相关的脑电成分是稳定的,因此,可以通过公共特征提取器,将多个被试数据映射至同一特征表示空间。按照常理来讲,可以在源被试脑电数据上通过一般的机器学习方法训练得到分类模型。然而,由于源被试脑电数据与目标试脑电数据的分布差异,所得分类模型无法直接移植到目标被试域。因此,需要学习源被试脑电数据与目标试脑电数据之间的不变特征。这对于特征提取器来讲相当于背负了两重任务。一方面,要求特征提取器所学得的特征具有关于视频质量的判别信息,有助于训练失真分类器,使之对样本对应的失真状态尽可能正确地预测;另一方面,该特征需足以迷惑被试域判别器使之不能正确分类。如此,特征提取器与被试域判别器之间便构成了一个对抗网络框架。公共特征提取器要解决的问题在于学习一个公共的特征表示空间,使得源被试脑电数据F所学得的分类模型也适用于目标被试脑电数据E的特征,即学习两者之间的域不变特征。被试域判别器的目的在于区分脑电样本来自于源被试脑电数据或目标试脑电数据。
(2c)定义被试域判别器Gd、失真分类器Gy和公共特征提取器Gf的损失函数
Figure BDA0003093675840000071
Figure BDA0003093675840000072
Figure BDA0003093675840000073
Figure BDA0003093675840000081
Figure BDA0003093675840000082
其中,L表示损失函数NLL Loss,θf、θy、θd分别表示公共特征提取器Gf、失真分类器Gy、被试域判别器Gd的权重和偏差参数,di表示二值变量,di=0表示
Figure BDA0003093675840000083
来自目标被试脑电数据E,di=1表示
Figure BDA0003093675840000084
来自源被试脑电数据F;
步骤3)对多被试对抗网络模型G进行迭代训练:
迭代训练过程在Pytorch平台上实现,通过NVIDIA TITAN XP GPU训练。模型G训练过程采用了ADAM优化器,将正则化系数设为5e-4以抑制过拟合,初始学习率设为2×10e-3,每迭代50次后学习率下降为上一阶段的1/10,共迭代200次。
(3a)由于所采用的脑电样本存在数据分布不均衡的问题,因此在实际实施时将(2c)中失真分类器Gy的损失函数
Figure BDA0003093675840000085
修改如下:
Figure BDA0003093675840000086
(3b)初始化迭代次数为t,最大迭代次数为T,T≥200,当前多被试对抗网络模型为Gt,并令t=1,Gt=G;
(3c)固定被试域判别器Gd,将训练样本集中的每个训练样本
Figure BDA0003093675840000087
作为多被试对抗网络模型G的输入,公共特征提取器Gf
Figure BDA0003093675840000088
进行时空特征提取,失真分类器Gy对Gf所提取的时空特征
Figure BDA0003093675840000089
进行局部信息整合,得到
Figure BDA00030936758400000810
的失真预测结果
Figure BDA00030936758400000811
(3d)采用损失函数
Figure BDA00030936758400000812
并通过
Figure BDA00030936758400000813
计算Gt的损失值Lt,再采用反向传播方法并通过Lt计算Gf和Gy的卷积核参数ωt、各全连接层结点之间的连接参数θt的梯度,然后采用梯度下降算法通过Gf和Gy的卷积核参数ωt、各全连接层结点之间的连接参数θt的梯度对Gf和Gy的参数ωt、θt进行更新,得到更新后的Gt1
(3e)固定公共特征提取器Gf和失真分类器Gy,将训练样本集中的每个训练样本
Figure BDA0003093675840000091
作为多被试对抗网络模型Gt1的输入,公共特征提取器Gf
Figure BDA0003093675840000092
进行时空特征提取,被试域判别器Gd对Gf所提取的时空特征
Figure BDA0003093675840000093
进行局部信息整合,得到
Figure BDA0003093675840000094
的判别结果
Figure BDA0003093675840000095
表示
Figure BDA0003093675840000096
来自目标被试脑电数据E,
Figure BDA0003093675840000097
表示
Figure BDA0003093675840000098
来自源被试脑电数据F;
(3f)采用损失函数
Figure BDA0003093675840000099
并通过
Figure BDA00030936758400000910
计算Gt1的损失值Lt1,再采用反向传播方法并通过Lt1计算Gd各全连接层结点之间的连接参数θt1的梯度,然后采用梯度下降算法通过Gd的各全连接层结点之间的连接参数θt1的梯度对Gd的参数θt1进行更新,得到更新后的Gt2
(3g)判断t=T是否成立,若是,得到训练好的多被试对抗网络模型G*,否则,令t=t+1,并执行步骤(3c);
步骤4)获取视频质量评价结果:
将测试样本集中的每个测试样本
Figure BDA00030936758400000911
作为训练好的多被试对抗网络模型G*的输入进行失真预测,得到
Figure BDA00030936758400000912
的预测结果
Figure BDA00030936758400000913
表示
Figure BDA00030936758400000914
为未失真,
Figure BDA00030936758400000915
表示
Figure BDA00030936758400000916
为未失真,最终视频质量评价精度如表一所示:
表一
S1 S2 S3 S4 S5 S6 S7 S8 S9 Avg
0.843 0.721 0.916 0.756 0.841 0.797 0.865 0.882 0.932 0.839
其中,Avg表示9个受试者的平均视频质量评价精度。

Claims (4)

1.一种基于对抗网络和多被试脑电信号的视频质量评价方法,其特征在于,包括如下步骤:
(1)获取训练样本集、测试样本集和标注样本集:
(1a)以K-1个失真等级对一段时长为c的视频Vf进行失真处理,并将Vf作为未失真视频与失真处理得到的K-1个失真视频进行组合,得到混合视频集合V={V1,V2...Vk...VK},其中,1<K<10,0<c<5s,Vk表示第k个视频;
(1b)采集M个被试人员观看每个视频Vk的脑电信号,得到脑电信号集合X={X1,X2...,Xm...,XM},其中,5<M<30,Xm表示所采集的第m个被试人员观看视频V的脑电信号向量,
Figure FDA0003093675830000011
Figure FDA0003093675830000012
表示所采集的第m个被试人员观看视频Vk的脑电信号;
(1c)将从脑电信号集合X中随机选取的一个脑电信号向量作为目标被试脑电数据E,将剩余的M-1个脑电信号向量作为源被试脑电数据F,对脑电信号集合X中的每个脑电信号进行标注,得到标注样本集
Figure FDA0003093675830000013
其中,
Figure FDA0003093675830000014
表示脑电信号集合X中第q个脑电信号及其标签,
Figure FDA0003093675830000015
表示
Figure FDA0003093675830000016
来自于目标被试脑电数据E,
Figure FDA0003093675830000017
表示
Figure FDA0003093675830000018
来自于源被试脑电数据F;
(1d)将半数以上目标被试脑电数据E中每个失真等级所对应的脑电信号以及源被试脑电数据F中每个失真等级所对应的脑电信号作为训练数据集,将其余目标被试脑电数据E中每个失真等级所对应的脑电信号作为测试数据集;
(1e)对训练数据集和测试数据集中的每个脑电信号进行标注,并将训练数据集中的每个脑电信号及其标签组合成训练样本集
Figure FDA0003093675830000019
将测试数据集中的每个脑电信号及其标签组合成测试样本集
Figure FDA00030936758300000110
其中,
Figure FDA00030936758300000111
表示训练样本集中第n个脑电信号及其标签,
Figure FDA00030936758300000112
表示未失真,
Figure FDA00030936758300000113
表示失真,
Figure FDA00030936758300000114
表示测试样本集中第o个脑电信号及其标签,
Figure FDA00030936758300000115
表示未失真,
Figure FDA0003093675830000021
表示失真;
(2)构建基于多被试对抗网络的视频质量评价模型G:
(2a)构建包括多被试对抗网络和失真分类器Gy的视频质量评价模型G,其中,多被试对抗网络包括公共特征提取器Gf以及与其级联的被试域判别器Gd,公共特征提取器Gf包括时域卷积层、空域卷积层、多个分离卷积层、多个BN层和多个池化层,被试域判别器Gd包括多个全连接层,失真分类器Gy包括多个全连接层;
(2b)定义被试域判别器Gd、失真分类器Gy和公共特征提取器Gf的损失函数
Figure FDA0003093675830000022
Figure FDA0003093675830000023
Figure FDA0003093675830000024
Figure FDA0003093675830000025
Figure FDA0003093675830000026
其中,L表示损失函数NLL Loss,θf、θy、θd分别表示公共特征提取器Gf、失真分类器Gy、被试域判别器Gd的权重和偏差参数,di表示二值变量,di=0表示
Figure FDA0003093675830000027
来自目标被试脑电数据E,di=1表示
Figure FDA0003093675830000028
来自源被试脑电数据F;
(3)对视频质量评价模型G进行迭代训练:
(3a)初始化迭代次数为t,最大迭代次数为T,T≥200,当前视频质量评价模型为Gt,并令t=1,Gt=G;
(3b)固定被试域判别器Gd,将训练样本集中的每个训练样本
Figure FDA0003093675830000029
作为视频质量评价模型G的输入,公共特征提取器Gf
Figure FDA00030936758300000210
进行时空特征提取,失真分类器Gy对Gf所提取的时空特征
Figure FDA00030936758300000211
进行局部信息整合,得到
Figure FDA00030936758300000212
的失真预测结果
Figure FDA00030936758300000213
(3c)采用损失函数
Figure FDA0003093675830000031
并通过
Figure FDA0003093675830000032
计算Gt的损失值Lt,再采用反向传播方法并通过Lt计算Gf和Gy的卷积核参数ωt、各全连接层结点之间的连接参数θt的梯度,然后采用梯度下降算法通过Gf和Gy的卷积核参数ωt、各全连接层结点之间的连接参数θt的梯度对Gf和Gy的参数ωt、θt进行更新,得到更新后的Gt1
(3d)固定公共特征提取器Gf和失真分类器Gy,将训练样本集中的每个训练样本
Figure FDA0003093675830000033
作为视频质量评价模型Gt1的输入,公共特征提取器Gf
Figure FDA0003093675830000034
进行时空特征提取,被试域判别器Gd对Gf所提取的时空特征
Figure FDA0003093675830000035
进行局部信息整合,得到
Figure FDA0003093675830000036
的判别结果
Figure FDA0003093675830000037
Figure FDA0003093675830000038
表示
Figure FDA0003093675830000039
来自目标被试脑电数据E,
Figure FDA00030936758300000310
表示
Figure FDA00030936758300000311
来自源被试脑电数据F;
(3e)采用损失函数
Figure FDA00030936758300000312
并通过
Figure FDA00030936758300000313
计算Gt1的损失值Lt1,再采用反向传播方法并通过Lt1计算Gd各全连接层结点之间的连接参数θt1的梯度,然后采用梯度下降算法通过Gd的各全连接层结点之间的连接参数θt1的梯度对Gd的参数θt1进行更新,得到更新后的Gt2
(3f)判断t=T是否成立,若是,得到训练好的视频质量评价模型G*,否则,令t=t+1,并执行步骤(3b);
(4)获取视频质量评价结果:
将测试样本集中的每个测试样本
Figure FDA00030936758300000314
作为训练好的视频质量评价模型G*的输入进行失真预测,得到
Figure FDA00030936758300000315
的预测结果
Figure FDA00030936758300000316
Figure FDA00030936758300000317
表示
Figure FDA00030936758300000318
为未失真,
Figure FDA00030936758300000319
表示
Figure FDA00030936758300000320
为未失真。
2.根据权利要求1所述的基于对抗网络和多被试脑电信号的视频质量评价方法,其特征在于,步骤(1a)所述的以K-1个失真等级对一段时长为c的视频Vf进行失真处理,实现步骤为:
(1a1)从t时刻起,对帧率为d的视频Vf进行分帧,得到分帧后的图像集T={T1,T2...Tl...TL},其中,Tl表示第l幅图像,0<t<c,L=(t-c)×d;
(1a2)以每个失真等级b对图像集中的每幅图像进行失真处理,得到失真图像集
Figure FDA0003093675830000041
则K-1个失真等级对应的失真图像集为TC={T1,T2...Tb...TK-1};
(1a3)将每个失真图像集Tb与从Tb对应的t时刻前未处理的视频进行组合,得到K-1个失真视频。
3.根据权利要求1所述的基于对抗网络和多被试脑电信号的视频质量评价方法,其特征在于,步骤(2)所述的构建视频质量评价模型G,其中:
公共特征提取器Gf包括的分离卷积层的个数为3,BN层的个数为5,池化层的个数为4,该公共特征提取器Gf的具体结构为:第一时域卷积层→第一BN层→第一空域卷积层→第二BN层→第一池化层→第一分离卷积层→第三BN层→第二池化层→第二分离卷积层→第四BN层→第三池化层→第三分离卷积层→第五BN层→第四池化层;
被试域判别器Gd包括3个全连接层;
失真分类器Gy包括1个全连接层。
4.根据权利要求1所述的基于对抗网络和多被试脑电信号的视频质量评价方法,其特征在于,步骤(3c)所述的采用梯度下降算法通过Gf和Gy的卷积核参数ωt、各全连接层结点之间的连接参数θt的梯度对Gf和Gy的参数ωt、θt进行更新,更新公式为:
Figure FDA0003093675830000042
Figure FDA0003093675830000043
其中η表示学习步长,0.01≤η≤0.02,ωt+1和θt+1分别表示ωt和θt更新后的结果,
Figure FDA0003093675830000051
表示偏导计算。
CN202110603651.XA 2021-05-31 2021-05-31 基于对抗网络和多被试脑电信号的视频质量评价方法 Active CN113255789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110603651.XA CN113255789B (zh) 2021-05-31 2021-05-31 基于对抗网络和多被试脑电信号的视频质量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110603651.XA CN113255789B (zh) 2021-05-31 2021-05-31 基于对抗网络和多被试脑电信号的视频质量评价方法

Publications (2)

Publication Number Publication Date
CN113255789A true CN113255789A (zh) 2021-08-13
CN113255789B CN113255789B (zh) 2023-01-24

Family

ID=77185476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110603651.XA Active CN113255789B (zh) 2021-05-31 2021-05-31 基于对抗网络和多被试脑电信号的视频质量评价方法

Country Status (1)

Country Link
CN (1) CN113255789B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022617A (zh) * 2022-05-30 2022-09-06 西安电子科技大学 基于脑电信号和时空多尺度联合网络的视频质量评价方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106412571A (zh) * 2016-10-12 2017-02-15 天津大学 一种基于梯度相似性标准差的视频质量评价方法
CN107590445A (zh) * 2017-08-25 2018-01-16 西安电子科技大学 基于脑电信号的美学图像质量评价方法
CN107609492A (zh) * 2017-08-25 2018-01-19 西安电子科技大学 基于脑电信号的失真图像质量感知评价方法
US10075710B2 (en) * 2011-11-24 2018-09-11 Thomson Licensing Video quality measurement
CN109862350A (zh) * 2019-02-27 2019-06-07 江南大学 基于时空域特征提取的无参考视频质量评价方法
CN110097103A (zh) * 2019-04-22 2019-08-06 西安电子科技大学 基于生成对抗网络的半监督图像分类方法
CN110097528A (zh) * 2019-04-11 2019-08-06 江南大学 一种基于联合卷积自编码网络的图像融合方法
CN110279415A (zh) * 2019-07-01 2019-09-27 西安电子科技大学 基于脑电信号的图像失真阈值系数估计方法
CN111182292A (zh) * 2020-01-05 2020-05-19 西安电子科技大学 无参考视频质量评估方法、系统、视频接收器、智能终端
CN111369548A (zh) * 2020-03-10 2020-07-03 江南大学 一种基于生成对抗网络的无参考视频质量评价方法及装置
CN111510710A (zh) * 2020-04-27 2020-08-07 西安电子科技大学 基于脑电信号和时空失真的视频质量评价方法
CN111832516A (zh) * 2020-07-22 2020-10-27 西安电子科技大学 基于无监督视频表示学习的视频行为识别方法
CN112004078A (zh) * 2020-08-20 2020-11-27 厦门大学 基于生成对抗网络的虚拟现实视频质量评价方法及系统
CN112052893A (zh) * 2020-09-01 2020-12-08 西安电子科技大学 基于生成对抗网络的半监督图像分类方法
CN112203083A (zh) * 2020-09-30 2021-01-08 清华大学 一种视频数据的质量等级确定方法和装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10075710B2 (en) * 2011-11-24 2018-09-11 Thomson Licensing Video quality measurement
CN106412571A (zh) * 2016-10-12 2017-02-15 天津大学 一种基于梯度相似性标准差的视频质量评价方法
CN107590445A (zh) * 2017-08-25 2018-01-16 西安电子科技大学 基于脑电信号的美学图像质量评价方法
CN107609492A (zh) * 2017-08-25 2018-01-19 西安电子科技大学 基于脑电信号的失真图像质量感知评价方法
CN109862350A (zh) * 2019-02-27 2019-06-07 江南大学 基于时空域特征提取的无参考视频质量评价方法
CN110097528A (zh) * 2019-04-11 2019-08-06 江南大学 一种基于联合卷积自编码网络的图像融合方法
CN110097103A (zh) * 2019-04-22 2019-08-06 西安电子科技大学 基于生成对抗网络的半监督图像分类方法
CN110279415A (zh) * 2019-07-01 2019-09-27 西安电子科技大学 基于脑电信号的图像失真阈值系数估计方法
CN111182292A (zh) * 2020-01-05 2020-05-19 西安电子科技大学 无参考视频质量评估方法、系统、视频接收器、智能终端
CN111369548A (zh) * 2020-03-10 2020-07-03 江南大学 一种基于生成对抗网络的无参考视频质量评价方法及装置
CN111510710A (zh) * 2020-04-27 2020-08-07 西安电子科技大学 基于脑电信号和时空失真的视频质量评价方法
CN111832516A (zh) * 2020-07-22 2020-10-27 西安电子科技大学 基于无监督视频表示学习的视频行为识别方法
CN112004078A (zh) * 2020-08-20 2020-11-27 厦门大学 基于生成对抗网络的虚拟现实视频质量评价方法及系统
CN112052893A (zh) * 2020-09-01 2020-12-08 西安电子科技大学 基于生成对抗网络的半监督图像分类方法
CN112203083A (zh) * 2020-09-30 2021-01-08 清华大学 一种视频数据的质量等级确定方法和装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
KWAN-YEE LIN 等: "Hallucinated-IQA: No-Reference Image Quality Assessment via Adversarial Learning", 《2018 IEEE/CVF》 *
TIANYAN WU 等: "Influence of significant target on image quality assessment via EEG", 《2019 ISPACS》 *
YONGCHUN ZHU 等: "Aligning Domain-Specific Distribution and Classifier for Cross-Domain Classification from Multiple Sources", 《PROCEEDINGS OF THE AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *
YU ZHANG 等: "Objective Video Quality Assessment Combining Transfer Learning With CNN", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
武天妍: "基于脑电信号的视觉感知特性与影像质量评价", 《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)》 *
高方远 等: "基于深度网络和视觉特性的无参考图像质量评价方法", 《南京师大学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022617A (zh) * 2022-05-30 2022-09-06 西安电子科技大学 基于脑电信号和时空多尺度联合网络的视频质量评价方法
CN115022617B (zh) * 2022-05-30 2024-04-19 西安电子科技大学 基于脑电信号和时空多尺度联合网络的视频质量评价方法

Also Published As

Publication number Publication date
CN113255789B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
CN109165692B (zh) 一种基于弱监督学习的用户性格预测装置及方法
CN108959895B (zh) 一种基于卷积神经网络的脑电信号eeg身份识别方法
CN108960182A (zh) 一种基于深度学习的p300事件相关电位分类识别方法
CN111832416A (zh) 一种基于增强卷积神经网络的运动想象脑电信号识别方法
CN112450947B (zh) 一种针对情绪唤醒度的动态脑网络分析方法
CN109171753B (zh) 一种基于深度自编码神经网络的脑电信号eeg身份识别方法
CN112036467A (zh) 基于多尺度注意力神经网络的异常心音识别方法及装置
CN111090764A (zh) 基于多任务学习和图卷积神经网络的影像分类方法及装置
CN112932505A (zh) 一种基于时频能量的符号传递熵及脑网络特征计算方法
CN113069117A (zh) 一种基于时间卷积神经网络的脑电情绪识别方法及系统
CN111783887B (zh) 基于fMRI小世界脑网络计算机分类测谎识别方法
CN115919330A (zh) 基于多层次se注意力和图卷积的eeg情绪状态分类方法
CN113255789B (zh) 基于对抗网络和多被试脑电信号的视频质量评价方法
CN111568412A (zh) 一种利用脑电信号重建视觉图像的方法及装置
CN113729735B (zh) 基于多域自适应图卷积神经网络的情感脑电特征表示方法
CN113052800B (zh) 一种阿尔茨海默症影像分析方法与装置
CN113076878B (zh) 基于注意力机制卷积网络结构的体质辨识方法
CN111428601B (zh) 一种基于ms-cnn的p300信号识别方法、装置及存储介质
CN113143247A (zh) 一种大脑功能超网络的构建方法
CN111402212B (zh) 一种海员脑功能网络动态连接活动模式的提取方法
CN108846407B (zh) 基于独立成分高序不确定脑网络的磁共振影像分类方法
CN116340825A (zh) 一种基于迁移学习的跨被试rsvp脑电信号的分类方法
CN116596046A (zh) 一种利用脑电信号和视觉特征进行图像重构的方法
CN115761216A (zh) 一种孤独症脑部核磁共振图像识别方法
CN115022617A (zh) 基于脑电信号和时空多尺度联合网络的视频质量评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant