CN113610212A - 一种多模态传感器数据的合成方法、装置及存储介质 - Google Patents
一种多模态传感器数据的合成方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113610212A CN113610212A CN202110758363.1A CN202110758363A CN113610212A CN 113610212 A CN113610212 A CN 113610212A CN 202110758363 A CN202110758363 A CN 202110758363A CN 113610212 A CN113610212 A CN 113610212A
- Authority
- CN
- China
- Prior art keywords
- sensor data
- eigenvector
- data
- vector
- weight vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001308 synthesis method Methods 0.000 title description 5
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000006399 behavior Effects 0.000 claims abstract description 36
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 26
- 239000013598 vector Substances 0.000 claims description 150
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 9
- 230000017105 transposition Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 12
- 238000013135 deep learning Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 15
- 230000009471 action Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 210000000707 wrist Anatomy 0.000 description 2
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明公开了一种多模态传感器数据的合成方法、装置及存储介质,本发明将包含有加速度计数据、陀螺仪数据以及磁力计数据中的至少两种的原始多模态传感器数据输入至语义编码器中,得到第一本征向量,将原始多模态传感器数据映射至本征向量空间以充分反应多模态传感器数据的本征特征;根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器,并进一步根据行为类别标签生成第二本征向量,训练后的生成器所生成的第二本征向量能够充分反映原始多模态传感器数据的时空关联性;将所述第二本征向量输入语义解码器,得到合成多模态传感器数据,提高了合成数据的多样性且强化了合成数据的应用效果,本发明可广泛应用于深度学习技术领域。
Description
技术领域
本发明涉及深度学习技术领域,尤其是一种多模态传感器数据的合成方法、装置及存储介质。
背景技术
近年来随着深度学习技术的发展,目前已经越来越受研究人员的关注,被广泛应用于其他各个领域,如视频合成、音乐合成、文本生成、自然语言合成、异常检测等。近年来在传感器数据合成领域也开始得到推广和应用,通过深度学习技术来学习传感器数据潜在的数据分布,然后通过生成器根据学习的结果合成带标签的传感器数据,从而在很大程度上避免数据采集带来的巨大工作量以及标注数据的成本。
而目前,现有的基于生成对抗网络的传感器数据合成方法主要关注一种传感器数据的合成任务,并不能够同时挖掘多个传感器数据之间的模态关联性,也不能充分挖掘和利用多模态传感器数据之间本征时空关系,通常通过递归神经网络、卷积神经网络以及全连接神经网络的组合来构建生成对抗网络框架来简单地学习单个或多个传感器数据中潜在的时序关系,这会导致所训练的生成对抗网络框架并不能充分学习多模态传感器数据中潜在的各类特征,弱化了合成的多模态传感器数据的能力。
发明内容
有鉴于此,为了解决上述技术问题,本发明的目的是提供一种多模态传感器数据的合成方法、装置及存储介质,以提高合成数据的多样性以及强化应用效果。
本发明采用的技术方案是:
一种多模态传感器数据的合成方法,包括:
获取原始多模态传感器数据;所述原始多模态传感器数据包括加速度计数据、陀螺仪数据以及磁力计数据中的至少两种,所述原始多模态传感器数据具有行为类别标签;
将所述原始多模态传感器数据输入语义编码器,得到第一本征向量;
根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器;
根据所述训练后的生成器以及所述行为类别标签生成第二本征向量;
将所述第二本征向量输入语义解码器,得到合成多模态传感器数据。
进一步,所述语义编码器具有注意力机制,所述将所述原始多模态传感器数据输入语义编码器,得到第一本征向量,包括:
将所述原始多模态传感器数据输入语义编码器,通过所述注意力机制确定所述原始多模态传感器数据的注意力权重向量,并根据所述注意力权重向量计算得到第一本征向量。
进一步,所述通过所述注意力机制确定所述原始多模态传感器数据的注意力权重向量,并根据所述注意力权重向量计算得到第一本征向量,包括:
根据所述原始多模态传感器数据与第一权重矩阵的乘积,确定查询向量;
根据所述原始多模态传感器数据与第二权重矩阵的乘积,确定键值向量;
根据所述原始多模态传感器数据与第三权重矩阵的乘积,确定价值向量;
根据所述查询向量与所述键值向量,确定所述注意力权重向量;
根据所述注意力权重向量以及所述价值向量,计算得到所述第一本征向量。
进一步,所述语义编码器包括输入层和本征向量表征层,所述语义编码器通过以下步骤训练所得:
将所述原始多模态传感器数据输入所述输入层,并基于第一约束条件对初始语义编码器进行训练;所述第一约束条件为所述原始多模态传感器数据与第一初始权重向量的乘积等于类别向量,类别向量基于所述行为类别标签进行编码而成,所述第一初始权重向量为所述输入层到所述本征向量表征层的权重向量;
在训练的过程中对所述第一初始权重向量进行更新,得到更新后的第一权重向量;
根据所述第一权重向量,得到所述语义编码器。
进一步,所述语义解码器包括映射表征层和数据输出层,所述语义解码器通过以下步骤训练所得:
将所述本征向量表征层的输出输入至所述映射表征层,并基于第二约束条件对初始语义解码器进行训练;所述第二约束条件为类别向量等于第二初始权重向量与所述数据输出层所输出的输出数据的乘积,所述第二初始权重向量为所述映射表征层到所述数据输出层的权重向量;
在训练的过程中对所述第二初始权重向量进行更新,得到更新后的第二权重向量;所述第二权重向量与所述第一权重向量满足对称转置关系,所述第二权重向量使得所述输出数据与所述原始多模态传感器数据之间的差异满足预设条件;
根据所述第二权重向量,得到所述语义解码器。
进一步,所述生成对抗网络还包括判别器,根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器,包括:
获取类别向量和随机噪声;类别向量基于所述行为类别标签进行编码而成;
根据所述类别向量和随机噪声,通过生成器生成合成本征向量;
将所述第一本征向量以及合成本征向量所述输入至所述判别器对判别器进行训练,并在训练过程中更新所述判别器的模型参数;
根据更新后的模型参数进行生成器的训练,得到训练后的生成器。
进一步,所述根据所述训练后的生成器以及所述行为类别标签生成第二本征向量,包括:
对所述行为类别标签进行编码得到类别向量;
根据所述类别向量,通过所述训练后的生成器生成第二本征向量。
本发明还提供一种多模态传感器数据的合成装置,包括:
获取模块,用于获取原始多模态传感器数据;所述原始多模态传感器数据包括加速度计数据、陀螺仪数据以及磁力计数据中的至少两种,所述原始多模态传感器数据具有行为类别标签;
第一处理模块,用于将所述原始多模态传感器数据输入语义编码器,得到第一本征向量;
训练模块,用于根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器;
第二处理模块,用于根据所述训练后的生成器以及所述行为类别标签生成第二本征向量;
第三处理模块,用于将所述第二本征向量输入语义解码器,得到合成多模态传感器数据。
本发明还提供一种装置,包括处理器以及存储器;
所述存储器存储有程序;
所述处理器执行所述程序以实现所述方法。
本发明还提供一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行时实现所述方法。
本发明的有益效果是:将包含有加速度计数据、陀螺仪数据以及磁力计数据中的至少两种的原始多模态传感器数据输入至语义编码器中,得到第一本征向量,将原始多模态传感器数据映射至本征向量空间以充分反应多模态传感器数据的本征特征;根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器,并进一步根据行为类别标签生成第二本征向量,训练后的生成器所生成的第二本征向量能够充分反映原始多模态传感器数据的时空关联性;将所述第二本征向量输入语义解码器,得到合成多模态传感器数据,提高了合成数据的多样性且强化了合成数据的应用效果。
附图说明
图1为本发明多模态传感器数据的合成方法的步骤流程示意图;
图2为本发明具体实施例多模态表征向量的生成步骤示意图;
图3为本发明具体实施例生成对抗网络的示意图;
图4为本发明具体实施例语义编码器和语义解码器的示意图;
图5为本发明具体实施例合成方法的合成框架示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
如图1所示,本发明实施例提供一种多模态传感器数据的合成方法,包括步骤S100-S500:
S100、获取原始多模态传感器数据。
本发明实施例中,原始多模态传感器数据包括加速度计数据、陀螺仪数据以及磁力计数据中的至少两种,具体地包括加速度计数据、陀螺仪数据以及磁力计数据。可选地,将加速度计、陀螺仪和磁力计等传感器佩戴于受试者的身上,包括但不限于手腕部位,作出各种动作,例如:(1)走路摆臂;(2)手掌翻转;(3)手臂平移;(4)手臂垂直移动;(5)手臂平举;(6)摆臂;(7)曲臂;(8)指鼻;(9)坐;(10)站;(11)走;(12)跑等,从而通过不同传感器收集到加速度计数据、陀螺仪数据以及磁力计数据。需要说明的是,根据不同的动作给收集到加速度计数据、陀螺仪数据以及磁力计数据添加不用的行为类别标签,行为类别标签即表示每种动作,每种动作下均具有对应的加速度计数据、陀螺仪数据以及磁力计数据。由上可知,传感器设置于同一部位,因此行为类别标签下,即同一动作下的加速度计数据、陀螺仪数据以及磁力计数据之间是存在时空关联性的(例如时空一致性及各个维度数据之间的空间一致性),需要分析多模态传感器数据之间的潜在关系,进而后续生成符合其时空关联性的合成多模态传感器数据,若每种传感器的数据单独分析和合成,最终生成的数据违背了其存在的关联关系,生成的数据会失去应用价值。
S200、将原始多模态传感器数据输入语义编码器,得到第一本征向量。
可选地,语义编码器具有注意力机制,可以通过注意力机制来学习原始多模态传感器数据之间的重要性及关联性,充分利用不同模态传感器数据自身的时序特性、多轴间的空间特征以及多个模态之间的时空关联特性等,从而更好地分析原始多模态传感器数据潜在的数据分布特性,第一本征向量很好地反映原始多模态传感器数据的本征特征。具体地,潜在的数据分布特性是加速度计数据、陀螺仪数据以及磁力计数据之间的内在相关影响和相互作用及对外呈现出的一致性,从而使最终合成的合成多模态传感器数据更加真实逼真且具有多样性,具有真正意义上的应用价值。
具体地,步骤S200包括步骤S210:
S210、将原始多模态传感器数据输入语义编码器,通过注意力机制确定原始多模态传感器数据的注意力权重向量,并根据注意力权重向量计算得到第一本征向量。
本发明实施例中,将包含加速度计数据、陀螺仪数据以及磁力计数据的原始多模态传感器数据一起输入至语义编码器中,通过注意力机制来学习原始多模态传感器数据之间的重要性及关联性从而确定原始多模态传感器数据的注意力权重向量,然后利用注意力权重向量能够计算得到第一本征向量。
可选地,如图2所示,通过一维卷积神经网络分别构建查询卷积层、键值卷积层和价值卷积层,分别进行查询卷积、键值卷积和价值卷积,得到查询向量Q、键值向量K、价值向量V,根据查询向量Q和键值向量K通过Softmax激活函数计算获得注意力权重向量,再结合价值向量V向得到多模态表征向量,即第一本征向量。具体地,步骤S210包括步骤S211-S215,其中步骤S211-S213不限定执行顺序:
现有的研究方案中,仅能通过生成对抗网络来学习和合成较短时间长度的传感器数据,如几十个样本点或几百个样本点的传感器时间序列样本,对于几千个样本点的长时间传感器时间序列的学习效果并不好,而在现实应用场景下,较短时间长度的传感器序列样本往往不能完全表征出某一具体的感知对象的实际状态,如不能覆盖完成一个手势动作的时间周期,这就会降低了所合成数据的实际应用效果和价值。针对上述缺点,本发明实施例通过引入自注意力机制一方面使语义编码器增强多个模态中的重要信息,抑制无效或冗余信息,并且学习多模态传感器数据之间全局、长时序依赖关系,具体地,全局是指卷积网络能够提升原始多模态传感器数据的高层的表征向量;长时序是指采用注意力机制构建的模型能够学习更长的时间序列,比如采用LSTM或GRU的传感器GANs能学习一段时间长度为140个样本点的时间序列,而本发明实施例的方法使用了注意力机制构建的功能模块,能够仅通过卷积网络,使用更优的训练参数学习序列长度为400多模态传感器数据。
S211、根据原始多模态传感器数据与第一权重矩阵的乘积,确定查询向量。
具体地,计算查询向量Q的公式为:
Q=WqX
其中,X为原始多模态传感器数据,Wq为第一权重矩阵。
S212、根据原始多模态传感器数据与第二权重矩阵的乘积,确定键值向量。
具体地,计算键值向量K的公式为:
K=WkX
其中,X为原始多模态传感器数据,Wk为第二权重矩阵。
S213、根据原始多模态传感器数据与第三权重矩阵的乘积,确定价值向量。
具体地,计算价值向量V的公式为:
V=WvX
其中,X为原始多模态传感器数据,Wv为第三权重矩阵。
S214、根据查询向量与键值向量,确定注意力权重向量。
αj,i=QTK
其中,注意力权重向量表示合成第i个区域时模型对第j个位置的关注程度,K为键值向量,Q为查询向量,T为转置,αj,i为表示乘积,i表示区域,j表示位置,N表示每个训练批次的样本大小。可选地,利用Softmax激活函数计算获得注意力权重向量用于表示各个模态数据(即加速度计数据、陀螺仪数据以及磁力计数据)对输出的第一本征向量的贡献能力的大小。
S215、根据注意力权重向量以及价值向量,计算得到第一本征向量。
具体地,计算第一本征向量的公式为:
其中,Oj为第一本征向量,T为转置,Vi为第i个价值向量。
S300、根据第一本征向量对生成对抗网络进行训练,得到训练后的生成器。
具体地,生成对抗网络还包括判别器,生成器用于学习原始多模态传感器数据的潜在分布特性,从而能够具备不断合成逼真数据的能力,而判别器则用于甄别输入的数据的真假,两者之间存在生成对抗且共生关系,其生成器的性能提升的动力来自判别器反向传播的梯度信息,而判别器的能力提升受到生成器合成数据的逼真程度的影响。本发明实施例中,生成器和判别器是通过一维卷积、二维卷积和三维卷积构建而成,并通过设置不同的卷积核、步长等参数,使得生成对抗网络框架具有多尺度的时空学习能力,而不需要通过递归神经网络(以LSTM为代表)构建,通过多尺度多维度的卷积网络构建就能够对原始多模态传感器数据内部的多轴数据以及多模态传感器数据之间的时空特性进行有效学习和利用。
如图3所示,具体地,步骤S300包括步骤S310-S340:
S310、获取类别向量和随机噪声。
本发明实施例中,类别向量基于行为类别标签进行编码而成,为编码后得到的控制向量。需要说明的是,随机噪声可以为各种类似或者近似于加速度计数据、陀螺仪数据以及磁力计数据的数据,或者通过某种函数所生成的数据等等,不作具体限定。
S320、根据类别向量和随机噪声,通过生成器生成合成本征向量。
具体地,将类别向量以及随机噪声输入至生成器中,通过生成器生成合成本征向量。需要说明的是,合成本征向量通过类别向量控制合成而得到的向量。
S330、将第一本征向量以及合成本征向量输入至判别器对判别器进行训练,并在训练过程中更新判别器的模型参数。
具体地,将合成本征向量以及真实本征向量(即第一本征向量)输入至判别器对判别器进行训练,判别器会输出1或0,1代表真,0代表假,从而根据输出的结果结合损失函数计算损失,然后在训练过程中不断地对判别器的模型参数进行更新,例如更新至计算的损失小于损失阈值。
S340、根据更新后的模型参数进行生成器的训练,得到训练后的生成器。
具体地,利用更新的模型参数作为反向传播的梯度信息对生成器进行训练,对生成器中的模型参数进行更新,从而得到训练后的生成器。可选地,判别器的模型参数以及生成器中的模型参数可以为丰富数据库的参数(enrich data)、数据泛化处理的参数(feature normalization and scaling)和BN处理的参数(batch normalization);训练过程与训练相关的参数包括但不限于训练动量、学习率、衰减函数、权值初始化和正则化相关方法;网络相关参数包括但不限于分类器的选择参数、神经元数量、过滤器数量和网络层数。需要说明的是,判别器和生成器的训练可以同步进行,判别器和生成器存在对抗且共生关系,能够相互影响。
S400、根据训练后的生成器以及行为类别标签生成第二本征向量。
具体地,步骤S400包括步骤S410-S420:
S410、对行为类别标签进行编码得到类别向量。
S420、根据类别向量,通过训练后的生成器生成第二本征向量。
具体地,根据原始多模态传感器数据中的类别向量控制训练后的生成器生成第二本征向量。需要说明的是,第二本征向量与第一本征向量类似,其能够反映原始多模态传感器数据之间的重要性及关联性,能够反映原始多模态传感器数据潜在的数据分布特性,具体地为是加速度计数据、陀螺仪数据以及磁力计数据之间的内在相关影响和相互作用及对外呈现出的一致性。
S500、将第二本征向量输入语义解码器,得到合成多模态传感器数据。
本发明实施例中,如步骤S420所描述第二本征向量具有多模态传感器数据的关联性、能够反映原始多模态传感器数据潜在的数据分布特性以及一致性,因此将第二本征向量输入至语义解码器最终得到的合成多模态传感器数据与多模态传感器数据类似,一方面包含行为类别标签,另一方面满足数据多样性,具有更强真实性以及具有更加实际的应用效果,能够更充分有效地利用多模态传感器数据中潜在的重要信息属性和特征。
如图4所示,本发明实施例中,语义编码器包括输入层501和本征向量表征层502,本发明实施例的方法还包括语义编码器的训练步骤S610-S630:
S610、将原始多模态传感器数据输入输入层,并基于第一约束条件对初始语义编码器进行训练。
具体地,第一约束条件为原始多模态传感器数据与第一初始权重向量的乘积等于类别向量,即WX=S,X为原始多模态传感器数据(即原始传感器数据),W为第一初始权重向量,S为类别向量,或者称作类别向量条件。需要说明的是,类别向量S基于行为类别标签进行编码而成,第一初始权重向量W为输入层501到本征向量表征层502的权重向量,本征向量表征层502用于输出本征向量,而通过第一约束条件的设置会使得本征向量具有行为类别语义。本发明实施例中,将原始多模态传感器数据输入输入层501,并基于上述第一约束条件对初始语义编码器进行训练。
S620、在训练的过程中对第一初始权重向量进行更新,得到更新后的第一权重向量。
具体地,在训练的过程中对语义编码器的模型参数进行调整更新,其中包括对第一初始权重向量进行更新,本发明实施例中语义编码器的目标函数为:
其中,W为第一初始权重向量,为第二初始权重向量,X为原始多模态传感器数据(即原始传感器数据),为输出数据(即复原传感器数据),F为Frobenius norm(F-范数,弗罗宾尼斯范数)是一种矩阵范数,通常记为(i表示矩阵的行标,j表示矩阵的列标,ai,j表示矩阵A中的元素,AH表示矩阵A的共轭转置矩阵,tr表示矩阵的迹),min表示同时训练优化参数W,使得X和尽可能逼近一致。
为了便于优化求解,将语义约束条件(即第一约束条件)嵌入目标函数,从而使语义编码器能够更高地学习不同行为类别特征:
其中,λ为常用参数,可以根据需要进行取值。根据目标函数进行第一初始权重向量的更新,得到更新后的第一初始权重向量,即得到更新后的第一权重向量。
S630、根据第一权重向量,得到语义编码器。
具体地,将更新后的第一权重向量代入至目标函数中,确定训练后得到的目标函数,从而确定具有训练后得到的目标函数的语义编码器。
如图4所示本发明实施例中,语义解码器包括映射表征层503和数据输出层504,本发明实施例的方法还包括语义解码器的训练步骤S710-S730:
S710、将本征向量表征层的输出输入至映射表征层,并基于第二约束条件对初始语义解码器进行训练。
S720、在训练的过程中对第二初始权重向量进行更新,得到更新后的第二权重向量。
具体地,第二权重向量与第一权重向量满足对称转置关系,同需要说明的是,语义编码器和语义解码器的训练过程可以一起进行,在训练的过程中对第二初始权重向量进行更新,对第二初始权重向量进行调整,得到更新后的第二权重向量,而更新后的第二权重向量使得输出数据与原始多模态传感器数据之间的差异满足预设条件,预设条件包括但不限于使得输出数据与原始多模态传感器数据之间的差异小于差异阈值。
S730、根据第二权重向量,得到语义解码器。
具体地,类似于语义编码器,语义解码器同样具有基于第二初始权重向量确定的目标函数,其构建方式可以参照步骤S610-S630不再赘述,将更新后的第二权重向量代入即可以确定语义解码器。
对本发明实施例的多模态传感器数据的合成方法进行详细说明,包括以下步骤S801-S807:
S801、训练数据采集。
具体地,训练数据采集基于实验室模拟环境建立的行为识别数据采集研究平台,采集过程包含的数据信息有:1)三轴加速度传感器数据;2)三轴陀螺仪数据;3)三轴磁力计数据。采取数据时,测试人员被要求做指定的行为动作,加速度、陀螺仪和磁力计等传感器被穿戴在受试者的手腕部位,指定的动作和手势主要包括:(1)走路摆臂;(2)手掌翻转;(3)手臂平移;(4)手臂垂直移动;(5)手臂平举;(6)摆臂;(7)曲臂;(8)指鼻;(9)坐;(10)站;(11)走;(12)跑,训练数据包括不同行为类别的标签。需要说明的是,训练数据相当于原始传感器数据、原始多模态传感器数据。
S802、数据预处理。
具体地,训练数据采集后,需要对原始传感器数据进行数据预处理工作,包括但不限于插值、滤波及归一化等操作,对于一些存在缺失数据的传感器数据要对数据进行删减或补齐操作,同时要对数据进行切分操作,将其转换成所需要的数据维度。
S803、模型训练。
具体地,经过数据预处理后,可以直接利用这些切分好的传感器数据进行端到端的训练,首先通过自编码器将原始传感器数据转换为本征向量,然后将这些本征向量作为训练数据基于卷积网络的生成对抗网络的学习对象和目标,其中生成对抗网络的训练参照步骤S610-S630、S710-S730,在生成对抗网络完成训练后,利用训练好的生成器根据指定的条件(例如类别向量)输入合成目标行为的第一本征向量,然后再利用训练好的解码器将这些合成的第一本征向量映射会真实传感器数据空间,从而最终达到充足数量和多样性的行为识别的传感器数据,即合成多模态传感器数据。
如图5所示,为本发明实施例的多模态传感器数据的合成方法的合成框架示意图,将原始传感器数据输入至编码器,得到本征向量并结合条件向量(即类别向量输入至判别器进行0/1的输出进行真假判断,从而通过反向传递训练生成器,生成器结合条件向量与输入噪声(未图示)生成本征向量,输入至解码器,从而得到合成传感器数据。
S804、模型判断。
具体地,为了验证通过本发明实施例所合成的多模态传感器数据的逼真程度,可以分别绘制同一种行为类别的真实数据和合成的数据,然后通过视觉图灵测试评估合成数据的效果及多样性,主要对比评测真实传感器和合成传感器时序图的变化趋势、幅值范围、噪声程度等视觉特性。同时为了定量评估合成数据的质量,本发明实施例可以使用欧式距离、余弦距离等多种距离评估指标评价同一种类别的合成多模态传感器数据与训练数据之间的距离。
综上,本发明实施例的多模态传感器数据的合成方法包括但不限于以下优点:1)基于多尺度的时空卷积设计生成对抗网络的模型,使得模型能够更充分地学习传感器数据自身以及传感器数据之间的时空特性,有效地利用了多模态传感器数据之间的相关性、冗余性和互补性等多方面的优势;2)通过语义编码器将原始传感器数据映射到本征向量空间,提取传感器数据中最具代表性的特征作为生成对抗网络学习的目标数据,避免了无效特征以及传感器数据内在噪声对训练生成对抗网络的不利影响,从而提高生成器学习潜在数据分布的效果。
本发明还提供一种多模态传感器数据的合成装置,包括:
获取模块,用于获取原始多模态传感器数据;原始多模态传感器数据包括加速度计数据、陀螺仪数据以及磁力计数据中的至少两种,原始多模态传感器数据具有行为类别标签;
第一处理模块,用于将原始多模态传感器数据输入语义编码器,得到第一本征向量;
训练模块,用于根据第一本征向量对生成对抗网络进行训练,得到训练后的生成器;
第二处理模块,用于根据训练后的生成器以及行为类别标签生成第二本征向量;
第三处理模块,用于将第二本征向量输入语义解码器,得到合成多模态传感器数据。
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
本发明实施例还提供了一种模态数据的合成装置,该设备包括处理器以及存储器;
存储器用于存储程序;
处理器用于执行程序实现本发明实施例的多模态传感器数据的合成方法。本发明实施例的装置可以实现多模态传感器数据的合成的功能。该装置可以为包括手机、平板电脑、个人数字助理(Personal Digital Assistant,简称PDA)、销售终端(Point of Sales,简称POS)、车载电脑等任意智能终端。
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有程序,该程序被处理器执行完成如前述发明实施例的多模态传感器数据的合成方法。
本发明实施例还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述发明实施例的多模态传感器数据的合成方法。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种多模态传感器数据的合成方法,其特征在于,包括以下步骤:
获取原始多模态传感器数据;所述原始多模态传感器数据包括加速度计数据、陀螺仪数据以及磁力计数据中的至少两种,所述原始多模态传感器数据具有行为类别标签;
将所述原始多模态传感器数据输入语义编码器,得到第一本征向量;
根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器;
根据所述训练后的生成器以及所述行为类别标签生成第二本征向量;
将所述第二本征向量输入语义解码器,得到合成多模态传感器数据。
2.根据权利要求1所述多模态传感器数据的合成方法,其特征在于:所述语义编码器具有注意力机制,所述将所述原始多模态传感器数据输入语义编码器,得到第一本征向量,包括:
将所述原始多模态传感器数据输入语义编码器,通过所述注意力机制确定所述原始多模态传感器数据的注意力权重向量,并根据所述注意力权重向量计算得到第一本征向量。
3.根据权利要求2所述多模态传感器数据的合成方法,其特征在于:所述通过所述注意力机制确定所述原始多模态传感器数据的注意力权重向量,并根据所述注意力权重向量计算得到第一本征向量,包括:
根据所述原始多模态传感器数据与第一权重矩阵的乘积,确定查询向量;
根据所述原始多模态传感器数据与第二权重矩阵的乘积,确定键值向量;
根据所述原始多模态传感器数据与第三权重矩阵的乘积,确定价值向量;
根据所述查询向量与所述键值向量,确定所述注意力权重向量;
根据所述注意力权重向量以及所述价值向量,计算得到所述第一本征向量。
4.根据权利要求1所述多模态传感器数据的合成方法,其特征在于:所述语义编码器包括输入层和本征向量表征层,所述语义编码器通过以下步骤训练所得:
将所述原始多模态传感器数据输入所述输入层,并基于第一约束条件对初始语义编码器进行训练;所述第一约束条件为所述原始多模态传感器数据与第一初始权重向量的乘积等于类别向量,类别向量基于所述行为类别标签进行编码而成,所述第一初始权重向量为所述输入层到所述本征向量表征层的权重向量;
在训练的过程中对所述第一初始权重向量进行更新,得到更新后的第一权重向量;
根据所述第一权重向量,得到所述语义编码器。
5.根据权利要求4所述多模态传感器数据的合成方法,其特征在于:所述语义解码器包括映射表征层和数据输出层,所述语义解码器通过以下步骤训练所得:
将所述本征向量表征层的输出输入至所述映射表征层,并基于第二约束条件对初始语义解码器进行训练;所述第二约束条件为类别向量等于第二初始权重向量与所述数据输出层所输出的输出数据的乘积,所述第二初始权重向量为所述映射表征层到所述数据输出层的权重向量;
在训练的过程中对所述第二初始权重向量进行更新,得到更新后的第二权重向量;所述第二权重向量与所述第一权重向量满足对称转置关系,所述第二权重向量使得所述输出数据与所述原始多模态传感器数据之间的差异满足预设条件;
根据所述第二权重向量,得到所述语义解码器。
6.根据权利要求1所述多模态传感器数据的合成方法,其特征在于:所述生成对抗网络还包括判别器,根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器,包括:
获取类别向量和随机噪声;类别向量基于所述行为类别标签进行编码而成;
根据所述类别向量和随机噪声,通过生成器生成合成本征向量;
将所述第一本征向量以及合成本征向量所述输入至所述判别器对判别器进行训练,并在训练过程中更新所述判别器的模型参数;
根据更新后的模型参数进行生成器的训练,得到训练后的生成器。
7.根据权利要求1所述多模态传感器数据的合成方法,其特征在于:所述根据所述训练后的生成器以及所述行为类别标签生成第二本征向量,包括:
对所述行为类别标签进行编码得到类别向量;
根据所述类别向量,通过所述训练后的生成器生成第二本征向量。
8.一种多模态传感器数据的合成装置,其特征在于,包括:
获取模块,用于获取原始多模态传感器数据;所述原始多模态传感器数据包括加速度计数据、陀螺仪数据以及磁力计数据中的至少两种,所述原始多模态传感器数据具有行为类别标签;
第一处理模块,用于将所述原始多模态传感器数据输入语义编码器,得到第一本征向量;
训练模块,用于根据所述第一本征向量对生成对抗网络进行训练,得到训练后的生成器;
第二处理模块,用于根据所述训练后的生成器以及所述行为类别标签生成第二本征向量;
第三处理模块,用于将所述第二本征向量输入语义解码器,得到合成多模态传感器数据。
9.一种多模态传感器数据的合成装置,其特征在于,包括处理器以及存储器;
所述存储器存储有程序;
所述处理器执行所述程序以实现如权利要求1-7中任一项所述方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行时实现如权利要求1-7中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110758363.1A CN113610212B (zh) | 2021-07-05 | 2021-07-05 | 一种多模态传感器数据的合成方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110758363.1A CN113610212B (zh) | 2021-07-05 | 2021-07-05 | 一种多模态传感器数据的合成方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113610212A true CN113610212A (zh) | 2021-11-05 |
CN113610212B CN113610212B (zh) | 2024-03-05 |
Family
ID=78304014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110758363.1A Active CN113610212B (zh) | 2021-07-05 | 2021-07-05 | 一种多模态传感器数据的合成方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610212B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254739A (zh) * | 2021-12-21 | 2022-03-29 | 南方电网数字电网研究院有限公司 | 多模态电力传感器的数据处理方法、装置和计算机设备 |
CN115470799A (zh) * | 2022-11-03 | 2022-12-13 | 电子科技大学 | 一种用于网络边缘设备的文本传输和语义理解一体化方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108520503A (zh) * | 2018-04-13 | 2018-09-11 | 湘潭大学 | 一种基于自编码器和生成对抗网络修复人脸缺损图像的方法 |
GB201911724D0 (en) * | 2019-08-15 | 2019-10-02 | Vision Semantics Ltd | Text based image search |
CN110544239A (zh) * | 2019-08-19 | 2019-12-06 | 中山大学 | 基于条件生成对抗网络的多模态mri转换方法、系统及介质 |
CN111832570A (zh) * | 2020-07-02 | 2020-10-27 | 北京工业大学 | 一种图像语义分割模型训练方法及系统 |
WO2020228376A1 (zh) * | 2019-05-16 | 2020-11-19 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
CN112069397A (zh) * | 2020-08-21 | 2020-12-11 | 三峡大学 | 自注意力机制与生成对抗网络相结合的谣言检测方法 |
CN112364894A (zh) * | 2020-10-23 | 2021-02-12 | 天津大学 | 一种基于元学习的对抗网络的零样本图像分类方法 |
CN112733444A (zh) * | 2020-12-30 | 2021-04-30 | 浙江大学 | 基于CycleGAN神经网络的多步长时间序列预测方法 |
-
2021
- 2021-07-05 CN CN202110758363.1A patent/CN113610212B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108520503A (zh) * | 2018-04-13 | 2018-09-11 | 湘潭大学 | 一种基于自编码器和生成对抗网络修复人脸缺损图像的方法 |
WO2020228376A1 (zh) * | 2019-05-16 | 2020-11-19 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
GB201911724D0 (en) * | 2019-08-15 | 2019-10-02 | Vision Semantics Ltd | Text based image search |
CN110544239A (zh) * | 2019-08-19 | 2019-12-06 | 中山大学 | 基于条件生成对抗网络的多模态mri转换方法、系统及介质 |
CN111832570A (zh) * | 2020-07-02 | 2020-10-27 | 北京工业大学 | 一种图像语义分割模型训练方法及系统 |
CN112069397A (zh) * | 2020-08-21 | 2020-12-11 | 三峡大学 | 自注意力机制与生成对抗网络相结合的谣言检测方法 |
CN112364894A (zh) * | 2020-10-23 | 2021-02-12 | 天津大学 | 一种基于元学习的对抗网络的零样本图像分类方法 |
CN112733444A (zh) * | 2020-12-30 | 2021-04-30 | 浙江大学 | 基于CycleGAN神经网络的多步长时间序列预测方法 |
Non-Patent Citations (5)
Title |
---|
ELYOR KODIROV等: "Semantic Autoencoder for Zero-Shot Learning", 《PROCEEDINGS OF THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》, pages 3174 - 3183 * |
HAN ZHANG等: "Self-Attention Generative Adversarial Networks", 《PROCEEDINGS OF THE 36TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING》, pages 7354 - 7363 * |
JEFF DONAHUE等: "Adversarial Feature Learning", 《ARXIV》, pages 1 - 18 * |
叶晨等: "生成式对抗网络的应用综述", 《同济大学学报(自然科学版)》, vol. 48, no. 04, pages 591 - 601 * |
张逸涵: "基于生成对抗网络的图像生成方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 06, pages 138 - 496 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254739A (zh) * | 2021-12-21 | 2022-03-29 | 南方电网数字电网研究院有限公司 | 多模态电力传感器的数据处理方法、装置和计算机设备 |
CN115470799A (zh) * | 2022-11-03 | 2022-12-13 | 电子科技大学 | 一种用于网络边缘设备的文本传输和语义理解一体化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113610212B (zh) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9111375B2 (en) | Evaluation of three-dimensional scenes using two-dimensional representations | |
Endo et al. | Classifying spatial trajectories using representation learning | |
Xie et al. | Generative VoxelNet: Learning energy-based models for 3D shape synthesis and analysis | |
CN111784845B (zh) | 基于人工智能的虚拟试穿方法、装置、服务器及存储介质 | |
Xiao et al. | A deep learning method for complex human activity recognition using virtual wearable sensors | |
KR20190056940A (ko) | 멀티모달 데이터 학습 방법 및 장치 | |
CN113610212B (zh) | 一种多模态传感器数据的合成方法、装置及存储介质 | |
CN104063721B (zh) | 一种基于语义特征自动学习与筛选的人类行为识别方法 | |
KR102637133B1 (ko) | 온-디바이스 활동 인식 | |
Zhang | Application of human motion recognition utilizing deep learning and smart wearable device in sports | |
CN111091010A (zh) | 相似度确定、网络训练、查找方法及装置和存储介质 | |
CN113177559A (zh) | 结合广度和密集卷积神经网络的图像识别方法、系统、设备及介质 | |
Xu et al. | A long term memory recognition framework on multi-complexity motion gestures | |
Mousas et al. | Learning motion features for example-based finger motion estimation for virtual characters | |
Kwolek et al. | Recognition of JSL fingerspelling using deep convolutional neural networks | |
Kniaz et al. | Adversarial dataset augmentation using reinforcement learning and 3d modeling | |
Ghosh et al. | Deep learning-based multi-view 3D-human action recognition using skeleton and depth data | |
Xie et al. | Cross-correlation conditional restricted Boltzmann machines for modeling motion style | |
Coskun | Human pose estimation with CNNs and LSTMs | |
CN114254739A (zh) | 多模态电力传感器的数据处理方法、装置和计算机设备 | |
CN115033700A (zh) | 基于相互学习网络的跨领域情感分析方法、装置以及设备 | |
CN113869189A (zh) | 人体行为识别方法、系统、设备及介质 | |
Wang | Deeply-learned and spatial–temporal feature engineering for human action understanding | |
Wang et al. | A novel multi-scale and sparsity auto-encoder for classification | |
Stougiannis | Landmark and monument recognition with Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |