CN110580055B - 动作轨迹识别方法及移动终端 - Google Patents
动作轨迹识别方法及移动终端 Download PDFInfo
- Publication number
- CN110580055B CN110580055B CN201910854849.8A CN201910854849A CN110580055B CN 110580055 B CN110580055 B CN 110580055B CN 201910854849 A CN201910854849 A CN 201910854849A CN 110580055 B CN110580055 B CN 110580055B
- Authority
- CN
- China
- Prior art keywords
- vector
- loss function
- mobile terminal
- calculating
- gradient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009471 action Effects 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims abstract description 160
- 239000011159 matrix material Substances 0.000 claims abstract description 88
- 230000001133 acceleration Effects 0.000 claims abstract description 68
- 230000004913 activation Effects 0.000 claims abstract description 44
- 230000008569 process Effects 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 116
- 210000002569 neuron Anatomy 0.000 claims description 44
- 230000000875 corresponding effect Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001454 recorded image Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种动作轨迹识别方法及移动终端,该方法包括:通过训练好的识别模型识别加速度向量对应的动作轨迹类别,识别模型的训练过程包括:将各加速度样本向量与识别模型中的权值矩阵进行加权运算得到加权向量,将加权向量通过激活函数进行激活运算后得到输出类别;根据输出类别及该加速度样本向量对应的真实动作轨迹类别确定损失函数,判断损失函数是否满足结束训练条件;若损失函数不满足结束训练条件,计算损失函数的梯度,根据梯度调整权值矩阵的值,迭代上述训练过程中所有步骤直至损失函数满足结束训练条件后得到训练好的识别模型。本发明的技术方案通过训练的识别模型确定加速度向量对应的动作轨迹类别,识别速度快,误检率低。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种动作轨迹识别方法及移动终端。
背景技术
当前无人机领域中,通常都是通过遥控器来控制的,该通过遥控器控制的方式增加了的硬件成本,且功能比较单一,因此,现有的通过移动终端中APP触发不同的功能按键来控制无人机的方案变得越来越常见,例如通过拍照或录像,通过图像识别方式识别拍照或录像中的特定目标,通过特定姿势来控制无人机。
然而,该种图像识别的方式比较复杂和繁琐,即使通过检测图像中特定目标来触发,也会存在一定的误检率,而且,如果拍照或录像的图像中检测不到特定目标,则无法控制无人机飞行。
发明内容
鉴于上述问题,本发明实施例的目的在于提供一种动作轨迹识别方法及移动终端,以解决现有技术的不足。
根据本发明的一个实施方式,提供一种动作轨迹识别方法,应用于移动终端,所述移动终端包括加速度传感器,所述加速度传感器用于采集动作轨迹的加速度向量,该方法包括:
通过训练好的识别模型来识别所述加速度向量对应的动作轨迹类别,其中,所述识别模型的训练过程包括:
将各加速度样本向量与所述识别模型中的权值矩阵进行加权运算得到加权向量,并将所述加权向量通过激活函数进行激活运算后得到输出类别;
根据所述输出类别及该加速度样本向量对应的真实动作轨迹类别确定损失函数;
判断所述损失函数是否满足结束训练条件;
若所述损失函数不满足结束训练条件,计算所述损失函数的梯度,并根据所述梯度调整所述权值矩阵的值,迭代上述训练过程中所有步骤直至所述损失函数满足结束训练条件后得到训练好的识别模型。
在上述的动作轨迹识别方法中,所述识别模型包括输入层、隐藏层及输出层,根据所述隐藏层中神经元的数量在所述输入层和所述隐藏层之间设置第一权值矩阵,及在所述隐藏层和所述输出层之间设置第二权值矩阵;
所述将各加速度样本向量与所述识别模型中的权值矩阵进行加权运算得到加权向量,并将所述加权向量通过激活函数进行激活运算后得到输出类别包括:
将各加速度样本向量分别作为输入层向量,针对每一输入层向量,将所述输入层向量与所述第一权值矩阵进行加权运算得到第一加权向量,将所述第一加权向量通过第一激活函数进行激活运算后得到隐藏层向量;
将所述隐藏层向量与所述第二权值矩阵进行加权运算得到第二加权向量,将所述第二加权向量通过第二激活函数进行激活运算后得到输出层向量,根据所述输出层向量确定输出类别。
在上述的动作轨迹识别方法中,所述第一激活函数与所述第二激活函数相同。
在上述的动作轨迹识别方法中,所述计算所述损失函数的梯度,根据所述梯度调整所述权值矩阵的值包括:
根据所述损失函数对所述第一加权向量的偏导数计算第一参量,根据所述第一加权向量对所述第一权值矩阵的偏导数计算第二参量;
根据所述损失函数对所述第二加权向量的偏导数计算第三参量,根据所述第二加权向量对所述第二权值矩阵的偏导数计算第四参量;
根据所述第一参量及所述第二参量计算第一梯度,根据所述第一梯度及预定的学习速率计算第一调整矩阵,以根据所述第一调整矩阵调整所述第一权值矩阵的值;
根据所述第三参量及所述第四参量计算第二梯度,根据所述第二梯度及所述学习速率计算第二调整矩阵,以根据所述第二调整矩阵调整所述第二权值矩阵的值。
在上述的动作轨迹识别方法中,通过以下公式计算所述第一调整矩阵:
在上述的动作轨迹识别方法中,通过以下公式计算所述第二调整矩阵:
在上述的动作轨迹识别方法中,所述结束训练条件包括所述损失函数收敛或者迭代次数达到预设次数。
根据本发明的另一个实施方式,提供一种动作轨迹识别装置,应用于移动终端,所述移动终端包括加速度传感器,所述加速度传感器用于采集动作轨迹的加速度向量,该装置包括:
识别模块,用于通过训练好的识别模型来识别所述加速度向量对应的动作轨迹类别,其中,所述识别模型的训练过程包括:
计算模块,用于将各加速度样本向量与所述识别模型中的权值矩阵进行加权运算得到加权向量,并将所述加权向量通过激活函数进行激活运算后得到输出类别;
确定模块,用于根据所述输出类别及该加速度样本向量对应的真实动作轨迹类别确定损失函数;
判断模块,用于判断所述损失函数是否满足结束训练条件;
调整模块,用于在所述损失函数不满足结束训练条件时,计算所述损失函数的梯度,并根据所述梯度调整所述权值矩阵的值,迭代所述计算模块、所述确定模块、所述判断模块及所述调整模块中的所有内容直至所述损失函数满足结束训练条件后得到训练好的识别模型。
根据本发明的再一个实施方式,提供一种移动终端,所述移动终端包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端执行上述的动作轨迹识别方法。
在上述的移动终端中,所述移动终端根据识别的动作轨迹类别控制对应无人机执行相应动作。
根据本发明的又一个实施方式,提供一种计算机可读存储介质,所述计算机可读存储介质中存储有上述的移动终端中所使用的所述计算机程序。
本公开的实施例提供的技术方案可以包括如下有益效果:
本发明中一种动作轨迹识别方法及移动终端,通过移动终端中自带的加速度传感器采集加速度向量,根据训练好的识别模型来识别加速度向量对应的动作轨迹类别,加速度向量获取方式简单,并且识别模型识别精度高,算法复杂度低。在该识别模型的训练过程中,将加速度样本向量通过加权及激活运算后得到该识别模型的输出类别,并将该输出类别与该加速度样本向量的真实类别计算损失函数,并在损失函数不满足结束训练条件时,根据损失函数的梯度调整识别模型中权值矩阵的值直到损失函数满足结束训练条件后得到训练好的识别模型,训练简单且训练好的识别模型识别精度高。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对本发明保护范围的限定。在各个附图中,类似的构成部分采用类似的编号。
图1示出了本发明第一实施例提供的一种动作轨迹识别方法的流程示意图;
图2示出了本发明第一实施例提供的一种识别模型的结构示意图;
图3示出了本发明第二实施例提供的一种动作轨迹识别装置的结构示意图。
主要元件符号说明:
200-动作轨迹识别装置;210-计算模块;220-确定模块;230-判断模块;240-调整模块;250-识别模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在下文中,可在本发明的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本发明的各种实施例中被清楚地限定。
实施例1
图1示出了本发明第一实施例提供的一种动作轨迹识别方法的流程示意图。
该动作轨迹识别方法应用于移动终端,所述移动终端包括加速度传感器,所述加速度传感器用于采集动作轨迹的加速度向量。
当前绝大部分的移动终端中都带有加速度传感器,加速度传感器是一种能感受加速度并将加速度转换成信号的传感器。因此本实施例中,用户可手持移动终端执行预先设定好的动作,比如手持移动终端画“O”型、画“8”型、画“V”型、翻转及摇一摇等,可利用移动终端中自带的加速度传感器采集所述动作轨迹的加速度向量。
例如,通常加速度传感器按照固定的频率(比如30Hz)读取并保存该移动终端的加速度信号,缓存成信号序列acc[i][j],其中,i=0,1,2,j=0,1,2,…29,将所述信号序列acc[i][j]转换成加速度向量X=(x1,x2,x3,…xn)T,n=90。
该动作轨迹识别方法包括以下步骤:
在步骤S110中,将各加速度样本向量与所述识别模型中的权值矩阵进行加权运算得到加权向量,并将所述加权向量通过激活函数进行激活运算后得到输出类别。
具体地,预先为各动作轨迹设置标签,比如,将“O”型动作轨迹的标签设置为0,将“8”型动作轨迹的标签设置为1,将“V”型动作轨迹的标签设置为2,翻转的动作轨迹的标签设置为3,等等。
将加速度传感器采集到的一个动作轨迹的加速度向量及该加速度向量对应的真实动作轨迹的标签作为一组加速度样本向量。
可通过多组加速度样本向量对识别模型进行训练。该多组可以为1000组,2000组等。
进一步地,所述识别模型包括输入层、隐藏层及输出层,根据所述隐藏层中神经元的数量在所述输入层和所述隐藏层之间设置第一权值矩阵,及在所述隐藏层和所述输出层之间设置第二权值矩阵。
所述将各加速度样本向量与所述识别模型中的权值矩阵进行加权运算得到加权向量,并将所述加权向量通过激活函数进行激活运算后得到输出类别包括:
将各加速度样本向量分别作为输入层向量,针对每一输入层向量,将所述输入层向量与所述第一权值矩阵进行加权运算得到第一加权向量,将所述第一加权向量通过第一激活函数进行激活运算后得到隐藏层向量;将所述隐藏层向量与所述第二权值矩阵进行加权运算得到第二加权向量,将所述第二加权向量通过第二激活函数进行激活运算后得到输出层向量,根据所述输出层向量确定输出类别。
具体地,如图2所示,所述识别模型包括三层:输入层、隐藏层及输出层,其中,所述隐藏层包括多个神经元。
具体地,输入层的节点(图2中输入层的圆圈)的数量根据加速度向量中元素的个数而定,输出层向量即加速度向量,即X=(x1,x2,x3,…,xn),比如,在加速度向量X中元素的个数为90时,所述输入层中节点的个数n=90。
隐藏层中节点也可以称为神经元(即图2中隐藏层的圆圈)的个数可以为至少一个。隐藏层向量为yj=(y1,y2,y3,…,ym),m为隐藏层中神经元的个数。神经元的具体数值可根据动作轨迹识别方法的精度、训练复杂度及损失函数的收敛速度而定,本实施例中,所述神经元的个数为15,那么,隐藏层向量yj中m=15。
输出层中节点(即图2中输出层的圆圈)的个数可根据动作轨迹的类别的数目而定,输出层向量为ok=(o1,o2,o3,…ol),l为输出层中动作轨迹的类别标签的数量。比如,在本实施例中,若移动终端执行的动作包括7种(比如O”型、“8”型、“V”型、“C”型、翻转、摇一摇、前进及后退),那么移动终端采集的各加速度向量对应的动作轨迹类别包括7类,输出层中节点的数目则为7,每一节点对应有一个动作轨迹类别的标签,那么,输出层向量ok中l=7。
为了实现识别模型的识别能力,在输入层与隐藏层之间设置有第一权值矩阵,该第一权值矩阵的维度与输入层中节点的数目及隐藏层中神经元的数目有关,比如,在加速度向量中包括90个元素,隐藏层中包括15个神经元时,将该加速度向量作为输入层向量,输入层中每一节点均对应一元素,那么,该第一权值矩阵Vij的维度为i=1,2,3,…,90,j=1,2,3,…,15。
第一权值矩阵Vij可通过下述矩阵进行描述:
其中,元素v1,1表示输入层向量(即加速度样本向量X)中第一个元素x1与隐藏层中第一个神经元y1之间的权值;元素v1,2表示输入层向量中第一个元素x1与隐藏层中第二个神经元y2之间的权值;元素v1,3表示输入层向量中第一个元素x1与隐藏层中第三个神经元y3之间的权值;元素v1,15表示输入层向量中第一个元素x1与隐藏层中第十五个神经元y15之间的权值;元素v2,1表示输入层向量中第二个元素x2与隐藏层中第一个神经元y1之间的权值;元素v2,2表示输入层向量中第二个元素x2与隐藏层中第二个神经元y2之间的权值;元素v2,15表示输入层向量中第二个元素x2与隐藏层中第十五个神经元y15之间的权值;元素v90,1表示输入层向量中第九十个元素x90与隐藏层中第一个神经元y1之间的权值;元素v90,2表示输入层向量中第九十个元素x90与隐藏层中第二个神经元y2之间的权值;元素v90,15表示输入层向量中第九十个元素x90与隐藏层中第十五个神经元y15之间的权值,等等。
在隐藏层与输出层之间设有第二权值矩阵,所述第二权值矩阵的维度与隐藏层中神经元的数目及输出层中动作轨迹类别的数目相关。比如,在隐藏层中包括15个神经元,输出层包括7各动作轨迹类别时,第二权值矩阵Wjk的维度为j=1,2,3,…,15,k=1,2,3,…,7。
第二权值矩阵Wjk可通过下述矩阵进行描述:
其中,元素w1,1表示隐藏层中第一个神经元y1与输出层第一个动作轨迹类别的标签o1之间的权值;元素w1,2表示隐藏层中第一个神经元y1与输出层第二个动作轨迹类别的标签o2之间的权值;元素w1,3表示隐藏层中第一个神经元y1与输出层第三个动作轨迹类别的标签o3之间的权值;元素w1,7表示隐藏层中第一个神经元y1与输出层第七个动作轨迹类别的标签o7之间的权值;元素w2,1表示隐藏层中第二个神经元y2与输出层第一个动作轨迹类别的标签o1之间的权值;元素w2,2表示隐藏层中第二个神经元y2与输出层第二个动作轨迹类别的标签o2之间的权值;元素w2,3表示隐藏层中第二个神经元y2与输出层第三个动作轨迹类别的标签o3之间的权值;元素w2,7表示隐藏层中第二个神经元y2与输出层第七个动作轨迹类别的标签o7之间的权值;元素w15,1表示隐藏层中第十五个神经元y15与输出层第一个动作轨迹类别的标签o1之间的权值;元素w15,2表示隐藏层中第十五个神经元y15与输出层第二个动作轨迹类别的标签o2之间的权值;元素w15,3表示隐藏层中第十五个神经元y15与输出层第三个动作轨迹类别的标签o3之间的权值;元素w15,7表示隐藏层中第十五个神经元y15与输出层第七个动作轨迹类别的标签o7之间的权值,等等。
将加速度样本向量作为输入层向量,针对每一输入层向量,均执行下述操作:
将输入层向量中各元素值与第一权值矩阵中各元素值进行加权运算得到第一加权向量,具体地,第一加权向量可通过下式进行计算:
其中,netj为第一加权向量,j=1,2,3,…,m,m为隐藏层中神经元的个数,xi为输入层向量中第i个元素,n为输入层向量中元素的个数,vij为第一权值矩阵中的第i行第j列的元素,表示输入层向量中第i个元素和隐藏层中第j个神经元之间的权值。
将第一加权向量通过第一激活函数进行激活运算后得到隐藏层向量,具体地,所述隐藏层向量可通过下式进行计算:
yj=f(netj)
其中,yj为隐藏层向量,f()为第一激活函数,netj为第一加权向量。
为了具有更好的识别性能,通常使识别模型具有非线性拟合的能力。而实现非线性拟合的根本在于激活函数,激活函数为神经元提供了非线性因素,使识别模型可以逼近任何非线性函数。所述激活函数可以包括Sigmoid函数、tanh函数及ReLU函数等。
本实施例中,所述第一激活函数可以选择Sigmoid函数,Sigmoid函数取值范围为(0,1),它可以将一个实数映射到(0,1)的区间做二分类的效果比较好。在一些其他的实施例中,所述第一激活函数还可以选择tanh函数及ReLU函数等。
所述Sigmoid函数的表达式f(z)如下:
将隐藏层向量中各元素与第二权值矩阵中各元素进行加权运算得到第二加权向量,所述第二加权向量可通过如下公式计算:
其中,netk为第二加权向量,k=1,2,3,…,l,l为输出层中动作轨迹的类别标签的数量,wjk为第二权值矩阵中的第j行第k列的元素,表示隐藏层中第j个神经元与输出层中第k个动作轨迹的类别标签之间的权值,yj为隐藏层向量。
将第二加权向量中各元素通过第二激活函数后进行激活运算后得到输出层向量,所述输出层向量可通过下式进行计算:
ok=f(netk)
其中,ok为输出层向量,f()为第二激活函数,netk为第二加权向量。
本实施例中,所述第二激活函数可以和第一激活函数相同。在一些其他的实施例中,所述第二激活函数还可以和第一激活函数不同。
本实施例中,所述第二激活函数可以选择Sigmoid函数。在一些其他的实施例中,所述第二激活函数还可以选择tanh函数及ReLU函数等。
在步骤S120中,根据所述输出类别及该加速度样本向量对应的真实动作轨迹类别确定损失函数。
本实施例中,所述损失函数可以为平方误差函数。在一些其他的实施例中,所述损失函数还可以为指数损失函数、绝对值损失函数等。
所述损失函数可以通过下式表示:
其中,E为损失函数,dk为输入的加速度样本向量对应的真实动作轨迹类别,ok为输出层向量。
在步骤S130中,判断损失函数是否满足结束训练条件。
判断损失函数是否满足结束训练条件,若损失函数满足结束训练条件,前进至步骤S150;若损失函数不满足结束训练条件,前进至步骤S140。
进一步地,所述结束训练条件包括:所述损失函数收敛(也可以视为识别模型的识别精度达到预定精度阈值)或者迭代次数达到预设次数。
在步骤S140中,计算所述损失函数的梯度,并根据所述梯度调整所述权值矩阵的值。
进一步地,在损失函数不满足结束训练条件时,所述“计算所述损失函数的梯度,并根据所述梯度调整所述权值矩阵的值”包括:
根据所述损失函数对所述第一加权向量的偏导数计算第一参量,根据所述第一加权向量对所述第一权值矩阵的偏导数计算第二参量;根据所述损失函数对所述第二加权向量的偏导数计算第三参量,根据所述第二加权向量对所述第二权值矩阵的偏导数计算第四参量;根据所述第一参量及所述第二参量计算第一梯度,根据所述第一梯度及预定的学习速率计算第一调整矩阵,以根据所述第一调整矩阵调整所述第一权值矩阵的值;根据所述第三参量及所述第四参量计算第二梯度,根据所述第二梯度及所述学习速率计算第二调整矩阵,以根据所述第二调整矩阵调整所述第二权值矩阵的值。
具体地,通过下式计算第一参量:
通过下式计算第二参量:
进一步地,通过以下公式计算所述第一调整矩阵:
通过下式计算第三参量:
通过下式计算第四参量:
进一步地,通过以下公式计算所述第二调整矩阵:
损失函数E对隐藏层向量yj求偏导得到:
且在第一损失函数及第二损失函数均为Sigmoid函数时,f'(z)=f(z)[1-f(z)],将上述公式代入到第一参量和第三参量中得到:
再将上述第一参量和第三参量的公式带入到第一调整矩阵和第二调整矩阵中得到:
根据第一调整矩阵调整所述第一权值矩阵的值,及根据所述第二调整矩阵调整所述第二权值矩阵的值,并在调整第一权值矩阵的值及第二权值矩阵的值之后,继续返回至步骤S110继续执行训练过程中的所有操作直至损失函数满足结束训练条件结束执行。
在步骤S150中,通过训练好的识别模型来识别所述加速度向量对应的动作轨迹类别。
具体地,识别模型训练完成后,即可通过该识别模型来识别采集的加速度向量对应的动作轨迹类别。
实施例2
图3示出了本发明第二实施例提供的一种动作轨迹识别装置的结构示意图。
该动作轨迹识别装置200应用于移动终端,所述移动终端包括加速度传感器,所述加速度传感器用于采集动作轨迹的加速度向量。
所述动作轨迹识别装置200包括计算模块210、确定模块220、判断模块230、调整模块240及识别模块250。
计算模块210,用于将各加速度样本向量与所述识别模型中的权值矩阵进行加权运算得到加权向量,并将所述加权向量通过激活函数进行激活运算后得到输出类别。
确定模块220,用于根据所述输出类别及该加速度样本向量对应的真实动作轨迹类别确定损失函数。
判断模块230,用于判断所述损失函数是否满足结束训练条件。
调整模块240,用于在所述损失函数不满足结束训练条件时,计算所述损失函数的梯度,并根据所述梯度调整所述权值矩阵的值,迭代所述计算模块210、所述确定模块220、所述判断模块230及所述调整模块240中的所有内容直至所述损失函数满足结束训练条件后得到训练好的识别模型。
识别模块250,用于通过训练好的识别模型来识别所述加速度向量对应的动作轨迹类别。
本发明另一实施例还提供了一种移动终端,该移动终端可以包括智能电话、平板电脑等。
所述移动终端包括存储器及处理器,存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述处理器用于运行所述存储器中所存储的计算机程序以使所述移动终端执行上述的实施例中的动作轨迹识别方法或动作轨迹识别装置中各模块的功能。
可选的,处理器可包括一个或多个处理单元;优选的,处理器可集成应用处理器,应用处理器主要处理操作系统、用户界面和应用程序等。处理器可以集成调制解调处理器,调制解调处理器也可以不集成到处理器中。
另外,该移动终端还可以包括:射频(Radio Frequency,RF)电路、输入单元、显示单元、拍摄单元、音频电路、无线保真(wireless fidelity,WiFi)模块以及电源等部件。输入单元可以包括触控面板并且可以包括其他输入设备,显示单元可以包括显示面板。
射频电路用于接收和发送无线信号,射频电路具体可由射频接收电路和射频发送电路两部分组成,射频电路主要包括天线、无线开关、接收滤波、频率合成器、高频放大、接收本振、混频、中频、发射本振、功放控制、功放等。
输入单元可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,输入单元可包括触控面板以及其他输入设备。触控面板,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器,并能接收处理器发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板。除了触控面板,输入单元还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元可用于显示由用户输入的信息或提供给用户的信息以及移动终端的各种菜单、界面,如游戏界面。显示单元可包括显示面板。可选的,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。进一步的,触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类型,随后处理器根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然触控面板与显示面板是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板与显示面板集成而实现手机的输入和输出功能。
拍摄单元用于采集成像范围内的图像信息。具体地,所述拍摄单元可为摄像头,所述摄像头可包括感光器件,所述感光器件可包括但不仅限于CCD(Charge Coupled Device,电荷耦合器件图像传感器)及CMOS(Complementary Metal-Oxide Semiconductor,互补性氧化金属半导体)。感光器件将光线变化信息转化为电荷,将转化的电荷通过模数变换转换成数字信号,数字信号经过压缩以后由拍摄单元内部的闪速存储器或内置硬盘卡保存,因而可以将保存的数字信号传输给处理器,处理器根据需求或指令对数字信号进行处理(比如显示图像、修改图像等)。
音频电路可提供用户与移动终端之间的音频接口。
WiFi属于短距离无线传输技术,移动终端通过无线保真模块(下述WiFi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。可以理解的是,WiFi模块并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
电源可以通过电源管理系统与处理器逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
本领域技术人员可以理解,上述的移动终端结构并不构成对移动终端的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
进一步地,在上述的移动终端中,所述移动终端根据识别的动作轨迹类别控制对应无人机执行相应动作。
具体地,所述移动终端中存储有动作轨迹类别和动作之间的对应关系。所述对应关系可以通过下述的表格进行描述。
上表中,动作轨迹类别C1对应的动作为A1,动作轨迹类别C2对应的动作为A2,动作轨迹类别C3对应的动作为A3,等等。
在移动终端识别到动作轨迹类别后,以该动作轨迹类别为索引查找所述动作轨迹类别和动作之间的对应关系确定该动作轨迹类别对应的动作,并控制所述无人机执行该动作轨迹类别对应的动作。
比如,在识别到加速度向量对应的动作轨迹的类别为翻转后,可控制无人机执行翻转相关动作,在识别到加速度向量对应的动作轨迹的类别为“8”型后,可控制无人机执行画“8”字的相关动作,等等。
进一步地,所述移动终端在确定该动作轨迹类别对应的动作后,还可以将包含该动作的控制信号发送至无人机控制端,无人机控制端根据所述控制信号控制无人机执行相应动作。
本发明再一实施例还提供了一种计算机可读存储介质,用于储存上述移动终端中使用的所述计算机程序。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种动作轨迹识别方法,其特征在于,应用于移动终端,所述移动终端包括加速度传感器,所述加速度传感器用于采集动作轨迹的加速度向量,该方法包括:
通过训练好的识别模型来识别所述加速度向量对应的动作轨迹类别,其中,所述识别模型包括输入层、隐藏层及输出层,根据所述隐藏层中神经元的数量在所述输入层和所述隐藏层之间设置第一权值矩阵,及在所述隐藏层和所述输出层之间设置第二权值矩阵,所述识别模型的训练过程包括:
将各加速度样本向量分别作为输入层向量,针对每一输入层向量,将所述输入层向量与所述第一权值矩阵进行加权运算得到第一加权向量,将所述第一加权向量通过第一激活函数进行激活运算后得到隐藏层向量;
将所述隐藏层向量与所述第二权值矩阵进行加权运算得到第二加权向量,将所述第二加权向量通过第二激活函数进行激活运算后得到输出层向量,根据所述输出层向量确定输出类别;
根据所述输出类别及该加速度样本向量对应的真实动作轨迹类别确定损失函数;
判断所述损失函数是否满足结束训练条件;
若所述损失函数不满足结束训练条件,计算所述损失函数的梯度,并根据所述梯度调整所述权值矩阵的值,迭代上述训练过程中所有步骤直至所述损失函数满足结束训练条件后得到训练好的识别模型;
根据所述损失函数对所述第一加权向量的偏导数计算第一参量,根据所述第一加权向量对所述第一权值矩阵的偏导数计算第二参量;
根据所述损失函数对所述第二加权向量的偏导数计算第三参量,根据所述第二加权向量对所述第二权值矩阵的偏导数计算第四参量;
根据所述第一参量及所述第二参量计算第一梯度,根据所述第一梯度及预定的学习速率计算第一调整矩阵,以根据所述第一调整矩阵调整所述第一权值矩阵的值;
根据所述第三参量及所述第四参量计算第二梯度,根据所述第二梯度及所述学习速率计算第二调整矩阵,以根据所述第二调整矩阵调整所述第二权值矩阵的值;
通过以下公式计算所述第一调整矩阵:
通过以下公式计算所述第二调整矩阵:
2.根据权利要求1所述的动作轨迹识别方法,其特征在于,所述第一激活函数与所述第二激活函数相同。
3.根据权利要求1所述的动作轨迹识别方法,其特征在于,所述结束训练条件包括所述损失函数收敛或者迭代次数达到预设次数。
4.一种移动终端,其特征在于,所述移动终端包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端执行权利要求1-2任一项所述的动作轨迹识别方法。
5.根据权利要求4所述的移动终端,其特征在于,所述移动终端根据识别的动作轨迹类别控制对应无人机执行相应动作。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有权利要求4或5所述的移动终端中所使用的所述计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910854849.8A CN110580055B (zh) | 2019-09-10 | 2019-09-10 | 动作轨迹识别方法及移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910854849.8A CN110580055B (zh) | 2019-09-10 | 2019-09-10 | 动作轨迹识别方法及移动终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110580055A CN110580055A (zh) | 2019-12-17 |
CN110580055B true CN110580055B (zh) | 2023-02-10 |
Family
ID=68813006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910854849.8A Active CN110580055B (zh) | 2019-09-10 | 2019-09-10 | 动作轨迹识别方法及移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110580055B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101427B (zh) * | 2020-08-26 | 2021-07-06 | 南方科技大学 | 交通模式识别方法、设备及存储介质 |
CN112711054B (zh) * | 2021-03-24 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 一种对象行为检测方法、装置、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6249606B1 (en) * | 1998-02-19 | 2001-06-19 | Mindmaker, Inc. | Method and system for gesture category recognition and training using a feature vector |
CN107491089A (zh) * | 2017-08-24 | 2017-12-19 | 深圳市高巨创新科技开发有限公司 | 一种无人机控制方法 |
CN108393892A (zh) * | 2018-03-05 | 2018-08-14 | 厦门大学 | 一种机器人前馈力矩补偿方法 |
-
2019
- 2019-09-10 CN CN201910854849.8A patent/CN110580055B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6249606B1 (en) * | 1998-02-19 | 2001-06-19 | Mindmaker, Inc. | Method and system for gesture category recognition and training using a feature vector |
CN107491089A (zh) * | 2017-08-24 | 2017-12-19 | 深圳市高巨创新科技开发有限公司 | 一种无人机控制方法 |
CN108393892A (zh) * | 2018-03-05 | 2018-08-14 | 厦门大学 | 一种机器人前馈力矩补偿方法 |
Non-Patent Citations (3)
Title |
---|
一种基于多传感器数据融合的移动主体运行轨迹捕捉机制;毕朝国等;《计算机科学》;20151115;第42卷(第11A期);第544-549页 * |
基于LSTM的智能手机运动轨迹识别研究;张乐;《中国优秀硕士学位论文全文数据库信息科技辑》;20180815;第20-35页 * |
针对深度学习模型的优化问题研究;郑书新;《中国优秀博士学位论文全文数据库信息科技辑》;20190815;第17-21,30-35,45-49,55-57页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110580055A (zh) | 2019-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009052B (zh) | 一种图像识别的方法、图像识别模型训练的方法及装置 | |
CN110321965B (zh) | 物体重识别模型的训练方法、物体重识别的方法及装置 | |
CN106055962B (zh) | 一种解锁控制方法及移动终端 | |
CN113762252B (zh) | 无人机智能跟随目标确定方法、无人机和遥控器 | |
CN109785368B (zh) | 一种目标跟踪方法和装置 | |
CN108230232B (zh) | 一种图像处理的方法以及相关装置 | |
CN109213732B (zh) | 一种改善相册分类的方法、移动终端及计算机可读存储介质 | |
US20170192500A1 (en) | Method and electronic device for controlling terminal according to eye action | |
CN111813532B (zh) | 一种基于多任务机器学习模型的图像管理方法及装置 | |
CN108616448B (zh) | 一种信息分享的路径推荐方法及移动终端 | |
CN109005336B (zh) | 一种图像拍摄方法及终端设备 | |
CN108289057B (zh) | 视频编辑方法、装置及智能移动终端 | |
CN110580055B (zh) | 动作轨迹识别方法及移动终端 | |
CN107368182B (zh) | 手势检测网络训练、手势检测、手势控制方法及装置 | |
CN109495616B (zh) | 一种拍照方法及终端设备 | |
CN110263216B (zh) | 一种视频分类的方法、视频分类模型训练的方法及装置 | |
CN109063558A (zh) | 一种图像分类处理方法、移动终端及计算机可读存储介质 | |
CN111125523A (zh) | 搜索方法、装置、终端设备及存储介质 | |
CN105426961B (zh) | 利用智能手环和智能手机捕捉使用者意图的方法 | |
CN111797302A (zh) | 模型处理方法、装置、存储介质及电子设备 | |
CN110083742B (zh) | 一种视频查询方法和装置 | |
CN116486463B (zh) | 图像处理方法、相关装置及存储介质 | |
CN111265881B (zh) | 一种模型训练方法、内容生成方法以及相关装置 | |
CN115291786A (zh) | 一种基于机器学习的误触判断方法、装置和存储介质 | |
CN112015973A (zh) | 一种异构网络的关系推理方法及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |