CN109993188A - 数据标签识别方法、行为识别方法及装置 - Google Patents
数据标签识别方法、行为识别方法及装置 Download PDFInfo
- Publication number
- CN109993188A CN109993188A CN201810000868.XA CN201810000868A CN109993188A CN 109993188 A CN109993188 A CN 109993188A CN 201810000868 A CN201810000868 A CN 201810000868A CN 109993188 A CN109993188 A CN 109993188A
- Authority
- CN
- China
- Prior art keywords
- behavior
- data
- label
- unlabeled
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000000694 effects Effects 0.000 title abstract description 7
- 239000013598 vector Substances 0.000 claims abstract description 97
- 230000006399 behavior Effects 0.000 claims description 560
- 238000012545 processing Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 230000003542 behavioural effect Effects 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 13
- 238000007635 classification algorithm Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 239000002904 solvent Substances 0.000 claims description 6
- 239000013589 supplement Substances 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 12
- 238000012549 training Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000084978 Rena Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种数据标签识别方法、行为识别方法及装置,其方法包括:获取有标签数据、第一无标签数据和第二无标签数据;根据有标签数据,确定分类集及各分类集的类别中心点;根据分类集,确定第一无标签数据的预测标签;根据各分类集的类别中心点,确定第一无标签数据的中心点距离向量;根据预测标签和中心点距离向量,确定第二无标签数据的标签。本发明将已拥有识别能力的采集装置的识别能力迁移给新增加的无识别能力的采集装置,在识别能力迁移到一定程度时,新增加的采集装置可作为具有识别能力的采集装置的有效补充,从而保证在动态环境下准确地标定无标签数据。
Description
技术领域
本发明涉及数据分类领域,尤其涉及一种数据标签识别方法、行为识别方法及装置。
背景技术
数据分类技术在过去几十年里称为机器学习和计算机视觉中十分流行的研究课题。近年来,一些基于采集数据的分类系统,例如:图像识别系统、行为识别系统、分类统计系统等,已经投入使用并产生了巨大的社会、经济效益。数据分类方法有集合特征识别、基于特征点识别、神经网络识别和支持向量机识别等。在实际应用中,无标签数据容易采集的到,但是有标签数据相对稀缺,若通过人工来标定无标签数据费时费力,因此基于学习的数据分类方法具有更高的实用价值与现实意义。在众多学习算法中,标签传播方法因其具有简单、快速、扩展性强和性能稳定的优点而因其人们的广泛关注。但是现有的标签传播方法中,仅能基于有标签数据对同一数据域中的无标签数据进行标定,而无法实现不同数据域中的无标签数据的标定,不适用动态环境。
以人体行为识别为例,人体行为识别是一种通过获取和分析人体行为相关数据,判断人体行为状态的技术。通过获知人体基础行为活动,该技术能够为运动追踪、驾驶行为检测、健康监测、老年人监护、辅助工业制造、人机交互、增强现实、室内定位及导航、个人特征识别、城市化计算等众多领域的研究和应用提供人体相关信息,具有重要的应用价值和研究意义。传统的人体行为识别技术主要基于图像信息进行,通过对行为相关的图像序列进行分析,判断行为类别,但存在计算复杂、训练时间长、易受背景及光线等外部因素影响、图像采集设备功耗高等问题。随着各种类型的传感器不断发展,可穿戴设备能够采集人体运动的相关加速度角度等信息,同时兼具了便携性好、功耗低等优势,但基于可穿戴设备的行为识别的方案中,因基于固定数量和位置的传感器数据进行人体行为识别,无法在动态环境下得到理想的识别正确率。
发明内容
本发明提供一种数据标签识别方法、行为识别方法及装置,解决了现有技术中基于有限的标签数据无法在动态环境下准确地标定无标签数据的问题。
本发明的实施例提供一种数据标签识别方法,包括:
获取有标签数据、第一无标签数据和第二无标签数据;其中,有标签数据和第一无标签数据对应于同一采集装置,第一无标签数据和第二无标签数据是同一时刻不同采集装置采集的;
根据有标签数据,确定分类集及各分类集的类别中心点;
根据分类集,确定第一无标签数据的预测标签;
根据各分类集的类别中心点,确定第一无标签数据的中心点距离向量;
根据预测标签和中心点距离向量,确定第二无标签数据的标签。
本发明实施例还提供了一种数据标签识别装置,包括:
第一获取模块,用于获取有标签数据、第一无标签数据和第二无标签数据;其中,有标签数据和第一无标签数据对应于同一采集装置,第一无标签数据和第二无标签数据是同一时刻不同采集装置采集的;
第一处理模块,用于根据有标签数据,确定分类集及各分类集的类别中心点;
第二处理模块,用于根据分类集,确定第一无标签数据的预测标签;
根据各分类集的类别中心点,确定第一无标签数据的中心点距离向量;
第三处理模块,用于根据预测标签和中心点距离向量,确定第二无标签数据的标签。
本发明实施例还提供了一种行为识别方法,应用于第一传感器,包括:
获取有标签行为数据和第一无标签行为数据;
根据有标签行为数据,确定行为分类集及各行为分类集的行为类别中心点;
根据行为分类集,确定第一无标签行为数据的预测行为标签;
根据各行为分类集的行为类别中心点,确定第一无标签行为数据的行为中心点距离向量;
将预测行为标签和行为中心点距离向量,发送至第二传感器。
本发明实施例还提供了一种行为识别装置,应用于第一传感器,包括:
第二获取模块,用于获取有标签行为数据和第一无标签行为数据;
第一计算模块,用于根据有标签行为数据,确定行为分类集并确定各行为分类集的行为类别中心点;
第二计算模块,用于根据行为分类集,确定第一无标签行为数据的预测行为标签;以及根据各行为分类集的行为类别中心点,确定第一无标签行为数据的行为中心点距离向量;
发送模块,用于将预测行为标签和行为中心点距离向量,发送至第二传感器。
本发明实施例还提供了一种行为识别方法,应用于第二传感器,包括:
接收第一传感器发送的第一无标签数据的预测行为标签和行为中心点距离向量;其中,预测行为标签和行为中心点距离向量为第一传感器根据有标签行为数据确定的;
获取第二无标签行为数据;其中,第二无标签行为数据为第一传感器采集第一无标签数据时第二传感器采集的;
根据预测行为标签和行为中心点距离向量,确定第二无标签行为数据的行为标签。
本发明实施例还提供了一种行为识别装置,应用于第二传感器,包括:
接收模块,用于接收第一传感器发送的第一无标签数据的预测行为标签和行为中心点距离向量;其中,预测行为标签和行为中心点距离向量为第一传感器根据有标签行为数据确定的;
采集模块,用于获取第二无标签行为数据;其中,第二无标签行为数据为第一传感器采集第一无标签数据时第二传感器采集的;
第三计算模块,用于根据预测行为标签和行为中心点距离向量,确定第二无标签行为数据的行为标签。
本发明实施例还提供了一种电子设备,包括:处理器;与处理器相连接的存储器,以及与处理器相连接的收发机;其中,处理器用于调用并执行存储器中所存储的程序和数据,实现上述的数据标签识别方法,或者实现上述的行为识别方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的数据标签识别方法,或者实现上述的行为识别方法的步骤。
本发明的上述技术方案的有益效果是:存储有有标签数据的采集装置基于已有的有标签数据对新采集的第一无标签数据进行预测,得到预测标签,并根据第一无标签数据距离各个分类集的类别中心点的距离,确定第一无标签数据的中心点距离向量。对于未存储有标签数据的新增采集装置,可利用上述采集装置确定的第一无标签数据的预测标签和中心点距离向量,确定自身采集的第二无标签数据的标签。这样将已拥有识别能力的采集装置的识别能力迁移给新增加的无识别能力的采集装置,在识别能力迁移到一定程度时,新增加的采集装置可作为具有识别能力的采集装置的有效补充,从而保证在动态环境下准确地标定无标签数据,即新增的已学习到识别能力的采集装置可替代原拥有识别能力的采集装置,此外新增的已学习到识别能力的采集装置和原拥有识别能力的采集装置可同时工作,以提高识别精度。
附图说明
图1表示本发明实施例的数据标签识别方法的流程示意图;
图2表示本发明实施例的数据标签识别系统的模块结构示意图;
图3表示本发明实施例第一传感器侧的行为识别方法的流程示意图;
图4表示本发明实施例第一传感器侧的行为识别装置的模块结构示意图;
图5表示本发明实施例第二传感器侧的行为识别方法的流程示意图;
图6表示本发明实施例第二传感器侧的行为识别装置的模块结构示意图;
图7表示本发明实施例中的电子设备框图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本发明的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本发明的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
另外,本文中术语“系统”和“网络”在本文中常可互换使用。
在本申请所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
如图1所示,本发明的实施例提供了一种数据标签识别方法,具体包括以下步骤:
步骤11:获取有标签数据、第一无标签数据和第二无标签数据。
其中,有标签数据和第一无标签数据对应于同一采集装置,第一无标签数据和第二无标签数据是同一时刻不同采集装置采集的,也就是说,第一无标签数据和有标签数据在同一数据域内或同一采集装置采集的关系;第一无标签数据和第二无标签数据是不同数据域或不同采集装置同步对应的关系。具体地,有标签数据和第一无标签数据对应的采集装置是具有标签识别能力的,也就是说,存储有有标签数据的采集装置是具备标签识别能力的。而采集第二无标签数据的采集装置是不具备标签识别能力的,也就是说未存储有标签数据的采集装置不具备标签识别能力,如标签识别系统中新增加的采集装置。其中,这里所说的有标签数据、第一无标签数据和第二无标签数据所对应的数据领域并不做限定,所有需要进行标签分类的领域均可适用,例如:医疗领域、交通领域、行为统计领域、生产测试领域等。
步骤12:根据有标签数据,确定分类集及各分类集的类别中心点。
根据有标签数据训练分类器,即根据有标签数据训练对应的机器学习识别模型,得到不同的分类集,或称为不同的类别。还可进一步根据有标签数据计算各分类集的均值作为类别中心点。
步骤13:根据分类集确定第一无标签数据的预测标签;以及根据各分类集的类别中心点,确定第一无标签数据的中心点距离向量。
利用步骤12训练得到的分类器,根据分类集及各分类集的类别中心点,对新采集到的第一无标签数据进行分类并计算其到至少一个分类集的类别中心点的中心点距离向量。
步骤14:根据预测标签和中心点距离向量,确定第二无标签数据的标签。
步骤14为标签识别能力的迁移过程,根据具备标签识别能力的采集装置确定的新采集的无标签数据的预测标签和中心点距离向量,确定自身新采集的第二无标签数据的标签。
具体地,步骤12中,根据有标签数据确定各分类集的类别中心的步骤为:通过以下公式,确定各分类集的类别中心;
其中,μn表示第n类分类集的类别中心,Cn表示第n类分类集中的有标签数据集合,具有M个有标签数据,Xm表示时刻n采集到的有标签数据,Xm为Cn中的M个元素之一,M为正整数。
进一步地,步骤13包括:采用预设分类算法,根据分类集确定第一无标签数据的预测标签;采用预设学习算法,根据各分类集的类别中心点计算第一无标签数据的中心点距离向量。
具体地,采用预设分类算法,根据分类集确定第一无标签数据的预测标签的步骤包括:通过以下公式,确定第一无标签数据与各分类集中的有标签数据的欧氏距离d(Xi,Xm);
根据欧式距离,选择P个距离最近的有标签数据作为第一无标签数据的近邻数据,其中P为正整数;
将近邻数据所属分类集出现次数最多的分类集的标签确定为第一无标签数据的预测标签;
其中,Xi表示在时刻i采集到的K维的第一无标签数据,其中Xi={xi1,xi2,xi3,…xik…,xiK},Xm表示时刻m采集到的K维的有标签数据,其中Xm={xm1,xm2,xm3,…xmk…,xmK},d(Xi,Xm)表示Xi与Xm的欧氏距离,xik表示Xi中的第k维数据,xmk表示Xm中的第k维数据。
进一步地,采用预设学习算法,根据各分类集的类别中心点计算第一无标签数据的中心点距离向量的步骤包括:计算第一无标签数据与各分类集的类别中心点的欧式距离;根据Q个距离最近的分类集及对应的类别中心点,生成第一无标签数据距离各分类集的2Q维的中心点距离向量。其中,Q可以是自定义设置的,数值范围在0到2N之间,其中N为分类集的个数。中心点距离向量的格式为:{距离最近的分类集编号,距离最近的分类集的中心点距离,距离第二近的分类集编号,距离第二近的分类集的中心点距离,…},且每条无标签数据对应一个中心点距离向量。
下面本发明实施例将进一步介绍步骤14的标签识别能力的迁移过程,具体地步骤14包括:根据中心点距离向量,对第二无标签数据进行扩维;根据扩维后的无标签数据,构建第二无标签数据的相似图;通过相似图优化预测标签,得到第二无标签数据的标签。
具体地,根据扩维后的无标签数据,构建第二无标签数据的相似图的步骤包括:
通过计算Yi与Yf的相似度ηif;
通过计算Yi与Yf的边权值eif;
根据相似度和边权值,确定第二无标签数据的相似图;
其中,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签数据,σ表示高斯核宽度。相似图由两部分组成,分别是顶点和边,顶点为扩维后的第二无标签数据,边为连接两个节点的带权边。
进一步地,通过相似图优化预测标签,得到第二无标签数据的标签的步骤包括:
通过以下公式,对预测标签进行优化得到第二无标签数据的标签;
其中,表示第t+1次迭代时扩维后的第二无标签数据Yi的标签,表示第t次迭代时扩维后的第二无标签数据Yf的标签,表示第t次迭代时第二无标签数据Yi的标签,Yi和Yf分别表示在时刻i和f采集到的经过扩维后第二无标签数据,α表示可调整参数,α∈[0,1],ωif表示标准化后Yi和Yf的边权值;具体地,
其中,eif表示Yi与Yf的边权值,V表示相似图的节点集合,eiv表示相似图中节点i与v之间的边权值。
这样,本发明实施例的数据标签识别方法中,存储有有标签数据的采集装置基于已有的有标签数据对新采集的第一无标签数据进行预测,得到预测标签,并根据第一无标签数据距离各个分类集的类别中心点的距离,确定第一无标签数据的中心点距离向量。对于未存储有标签数据的新增采集装置,可利用上述采集装置确定的第一无标签数据的预测标签和中心点距离向量,确定自身采集的第二无标签数据的标签。这样将已拥有识别能力的采集装置的识别能力迁移给新增加的无识别能力的采集装置,在识别能力迁移到一定程度时,新增加的采集装置可作为具有识别能力的采集装置的有效补充,从而保证在动态环境下准确地标定无标签数据,即新增的已学习到识别能力的采集装置可替代原拥有识别能力的采集装置,此外新增的已学习到识别能力的采集装置和原拥有识别能力的采集装置可同时工作,以提高识别精度。
以上实施例就本发明的数据标签识别方法做出介绍,下面本实施例将结合附图对其对应的系统做进一步说明。
具体地,如图2所示,本发明实施例的数据标签识别系统200,包括:
第一获取模块210,用于获取有标签数据、第一无标签数据和第二无标签数据;其中,有标签数据和第一无标签数据对应于同一采集装置,第一无标签数据和第二无标签数据是同一时刻不同采集装置采集的;
第一处理模块220,用于根据有标签数据,确定分类集及各分类集的类别中心点;
第二处理模块230,用于根据分类集确定第一无标签数据的预测标签;以及根据各分类集的类别中心点,确定第一无标签数据的中心点距离向量;
第三处理模块240,用于根据预测标签和中心点距离向量,确定第二无标签数据的标签。
其中,第一处理模块220包括:
第一处理子模块,用于通过以下公式,确定各分类集的类别中心;
其中,μn表示第n类分类集的类别中心,Cn表示第n类分类集中的有标签数据集合,Xm表示时刻m采集到的有标签数据,Xm为Cn中的M个元素之一,M为正整数。
其中,第二处理模块230包括:
第一确定子模块,用于采用预设分类算法,根据分类集确定第一无标签数据的预测标签;
第二处理子模块,用于采用预设学习算法,根据各分类集的类别中心点计算第一无标签数据的中心点距离向量。
其中,第一确定子模块包括:
第一确定单元,用于通过以下公式,确定第一无标签数据与各分类集中的有标签数据的欧氏距离d(Xi,Xm);
第二确定单元,用于根据欧式距离,选择P个距离最近的有标签数据作为第一无标签数据的近邻数据,其中P为正整数;
第三确定单元,用于将近邻数据所属分类集出现次数最多的分类集的标签确定为第一无标签数据的预测标签;
其中,Xi表示在时刻i采集到的K维的第一无标签数据,Xm表示时刻m采集到的K维的有标签数据,d(Xi,Xm)表示Xi与Xm的欧氏距离,xik表示Xi中的第k维数据,xmk表示Xm中的第k维数据。
其中,第二处理子模块包括:
计算单元,用于计算第一无标签数据与各分类集的类别中心点的欧式距离;
生成单元,用于根据Q个距离最近的分类集及对应的类别中心点,生成第一无标签数据的2Q维的中心点距离向量。
其中,第三处理模块240包括:
扩维子模块,用于根据中心点距离向量,对第二无标签数据进行扩维;
构建子模块,用于根据扩维后的无标签数据,构建第二无标签数据的相似图;
优化子模块,用于通过相似图优化预测标签,得到第二无标签数据的标签。
其中,构建子模块包括:
计算相似度单元,用于通过计算Yi与Yf的相似度ηif;
计算边权值单元,用于
通过计算Yi与Yf的边权值eif;
第四确定单元,用于根据相似度和边权值,确定第二无标签数据的相似图;
其中,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签数据,σ表示高斯核宽度。
其中,优化子模块包括:
优化单元,用于通过以下公式,对预测标签进行优化得到第二无标签数据的标签;
其中,表示第t+1次迭代时扩维后的第二无标签数据Yi的标签,表示第t次迭代时扩维后的第二无标签数据Yf的标签,表示第t次迭代时所述第二无标签数据Yi的标签,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签数据,α表示可调整参数,α∈[0,1],ωif表示标准化后Yi和Yf的边权值;具体地,
其中,eif表示Yi与Yf的边权值,V表示相似图的节点集合,eiv表示相似图中节点i与v之间的边权值。
本发明的数据标签识别系统实施例是与上述数据标签识别方法的实施例对应的,上述方法实施例中的所有实现手段均适用于该系统的实施例中,也能达到相同的技术效果。该系统中,存储有有标签数据的采集装置基于已有的有标签数据对新采集的第一无标签数据进行预测,得到预测标签,并根据第一无标签数据距离各个分类集的类别中心点的距离,确定第一无标签数据的中心点距离向量。对于未存储有标签数据的新增采集装置,可利用上述采集装置确定的第一无标签数据的预测标签和中心点距离向量,确定自身采集的第二无标签数据的标签。这样将已拥有识别能力的采集装置的识别能力迁移给新增加的无识别能力的采集装置,在识别能力迁移到一定程度时,新增加的采集装置可作为具有识别能力的采集装置的有效补充,从而保证在动态环境下准确地标定无标签数据。
以上介绍了本发明实施例的数据标签识别方法及系统,下面本发明实施例将结合具体应用场景作进一步说明,以上介绍了本发明实施例的数据标签识别方法及系统可应用于医疗、交通、行为统计、生产测试等领域,下面本实施例仅以行为识别为例进行说明。
具体地,本发明实施例还提供了一种行为识别方法,应用于第一传感器,如图3所示,具体包括以下步骤:
步骤31:获取有标签行为数据和第一无标签行为数据。
这里第一传感器为具有行为识别能力的可穿戴设备的一种,其他具有行为识别能力的可穿戴设备亦可适用于本发明实施例的各种示例。其中,将已有的拥有有标签数据的传感器称为“教师传感器”,将新加入的传感器称为“学生传感器”。教师传感器和学生传感器同时佩戴于人体不同部位,并且两个传感器在同一时间片段产生的行为特征数据可以通过时间戳对应。其中,在同一时间片段产生的行为特征数据可以通过时间戳对应是指:“教师传感器”和“学生传感器”通过时间属性对获取的无标签行为数据进行对应,同一个时间戳能够对应一条第一无标签行为数据和一条第二无标签行为数据。
步骤32:根据有标签行为数据,确定行为分类集及各行为分类集的行为类别中心点。
这里指的是,教师传感器基于有标签行为数据训练行为分类器,以得到不同的行为分类集,并进一步根据有标签行为数据确定各个行为分类集的行为类别中心,具体地,教师传感器可根据有标签行为数据计算各行为分类集的均值作为行为类别中心点。
步骤33:根据行为分类集确定第一无标签行为数据的预测行为标签;以及根据各行为分类集的行为类别中心点确定第一无标签行为数据的行为中心点距离向量。
利用步骤32训练得到的行为分类器,根据行为分类集及各行为分类集的行为类别中心点,对新采集到的第一无标签行为数据进行分类,并计算第一无标签行为数据与至少一个行为分类集的行为类别中心的中心点距离向量。
步骤34:将预测行为标签和行为中心点距离向量,发送至第二传感器。
这里步骤34为行为识别能力的迁移过程,具备行为识别能力的教师传感器确定的新采集的第一无标签行为数据的预测行为标签和行为中心点距离向量发送至不具备行为识别能力的学生传感器,以使学生传感器确定自身新采集的第二无标签行为数据的行为标签,完成行为识别能力的迁移。
具体地,步骤33中教师传感器根据已有的有标签行为数据训练行为分类器,其中分类算法使用机器学习算法,如k近邻(kNN,k-Nearest Neighbor)、k均值(k-Means)、决策树(DT,Decision Tree)、支持向量机(SVM,Surport Vector Machine)等。
进一步地,行为类别中心点定义为行为分类集中具有代表性的数据,一个行为分类集有且仅有一个行为类别中心点。对有N个类别的有标签行为数据集D={C1,C2,C3,…Cn…,CN},其中Cn为第n类分类集中的有标签数据集合,Cn={X1,X2,X3,…Xm…,XM},其中Xm为教师传感器在时刻m采集到的有标签行为数据,其中Xm={xm1,xm2,xm3,…xmk…,xmK}。步骤32可以选择多种方法计算行为类别中心点。由于存在有标签行为数据,因此在各行为分类集确定的情况下,可选取同一行为分类集中数据的均值作为行为类别中心点,也可利用现有算法如CFSFDP(Clustering by fast search and find of density peaks)等计算数据的密度中心作为行为类别中心点。具体地,步骤32中教师传感器计算各行为分类集的均值作为行为类别中心点具体为:通过以下公式,确定各行为分类集的行为类别中心;
其中,μn表示第n类行为分类集的行为类别中心,Cn表示第n类行为分类集中的有标签行为数据集合,Xm表示在时刻m采集到的有标签行为数据,Xm为Cn中的M个元素之一,M为正整数。
进一步地,教师传感器还会对新获取的无标签行为数据进行分类并计算其相应的中心点距离向量。步骤33包括:采用预设分类算法,根据行为分类集确定第一无标签行为数据的预测行为标签;采用预设学习算法,根据各行为分类集的行为类别中心点计算第一无标签行为数据的行为中心点距离向量。
根据有标签行为数据训练对应的机器学习识别模型时,已有多种成熟的适用算法,如k近邻、k均值、决策树、支持向量机等。其中应用较广泛且原理简单的是k近邻分类算法。具体地采用预设分类算法,根据行为分类集及各行为分类集的行为类别中心点确定第一无标签行为数据的预测行为标签的步骤,包括:
通过以下公式,确定第一无标签行为数据与各行为分类集中的有标签行为数据的欧氏距离d(Xi,Xm);
根据欧式距离,选择P个距离最近的有标签行为数据作为第一无标签行为数据的近邻行为数据,其中P为正整数;
将近邻行为数据所属行为分类集出现次数最多的行为分类集的行为标签确定为第一无标签行为数据的预测行为标签;
其中,Xi表示在时刻i采集到的K维的第一无标签行为数据,Xm表示时刻m采集到的K维的有标签行为数据,d(Xi,Xm)表示Xi与Xm的欧氏距离,xik表示Xi中的第k维数据,xmk表示Xm中的第k维数据。
其中,初始化近邻参数P,获取有标签行为数据集D={C1,C2,C3,…Cn…,CN},新采集的第一无标签行为数据Xi={xi1,xi2,xi3,…xik…,xiK}。对任一个Xm∈D,计算Xi和Xm之间的欧式距离。在计算得到多个欧氏距离d(Xi,Xm)中选择P个距离最近的有标签行为数据作为第一无标签行为数据的近邻数据;确定P个近邻数据所在行为分类集的出现频率,将P个近邻数据中出现频率最高的行为分类集的类别作为第一无标签行为数据的预测标签。
进一步地,采用预设学习算法,根据行为分类集及各行为分类集的类别中心点计算第一无标签行为数据距离各行为分类集的行为中心点距离向量的步骤包括:计算第一无标签行为数据与各行为分类集的类别中心点的欧式距离;根据Q个距离最近的行为分类集及对应的行为类别中心点,生成第一无标签行为数据的2Q维的行为中心距离向量。
具体地,当教师传感器佩戴一段时间后,教师传感器数据域产生了一定长度的第一无标签行为数据的集合。为了将教师传感器的行为识别能力传递给学生传感器。教师传感器中基于隐含信息,如不同行为分类集之间的关联关系、行为数据之间的关联关系等,根据有标签行为数据计算各分类集的均值作为行为类别中心点,然后获取新采集的第一无标签行为数据的集合,对集合中的每一个第一无标签行为数据进行如下操作:计算第一无标签行为数据Xi与各行为分类集的类别中心点的欧式距离,得到对应的距离集合{di1,di2,di3,…din…,diN},其中,din表示第一无标签行为数据Xi与第n类行为分类集的行为类别中心点的欧式距离;选取Q个距离最近的行为分类集及对应的行为类别中心点,生成第一无标签行为数据距离各行为分类集的2Q维的行为中心距离向量{c1,di1,c2,…cn,din…,CQ,diQ}。其中,值得指出的是cn为第n类的行为分类集编号或索引号。
本发明实施例的行为识别方法中,存储有有标签行为数据的教师传感器基于已有的有标签行为数据对新采集的第一无标签行为数据进行预测,得到预测行为标签,并根据第一无标签行为数据距离各个行为分类集的行为类别中心点的距离,确定第一无标签行为数据的行为中心点距离向量,并将确定的第一无标签行为数据的预测行为标签和行为中心点距离向量发送至未存储有标签行为数据的学生传感器,将已拥有行为识别能力的教师传感器的识别能力迁移给新增加的无行为识别能力的学生传感器,从而保证在动态环境下准确地标定无标签行为数据,即新增的已学习到识别能力的学生传感器可替代原拥有识别能力的教师传感器,此外学生传感器和教师传感器可同时工作,以提高识别精度。
以上实施例就本发明第一传感器侧的行为识别方法做出介绍,下面本实施例将结合附图对其对应的装置做进一步说明。
具体地,如图4所示,本发明实施例的行为识别装置,应用于第一传感器400,包括:
第二获取模块410,用于获取有标签行为数据和第一无标签行为数据;
第一计算模块420,用于根据有标签行为数据,确定行为分类集及各行为分类集的行为类别中心点;
第二计算模块430,用于根据行为分类集确定第一无标签行为数据的预测行为标签;以及根据各行为分类集的行为类别中心点,确定第一无标签行为数据的行为中心点距离向量;
发送模块440,用于将预测行为标签和行为中心点距离向量,发送至第二传感器。
其中,第一计算模块420包括:
第一计算子模块,用于通过以下公式,确定各行为分类集的行为类别中心;
其中,μn表示第n类行为分类集的行为类别中心,Cn表示第n类行为分类集中的有标签行为数据集合,Xm表示在时刻m采集到的有标签行为数据,Xm为Cn中的M个元素之一,M为正整数。
其中,第二计算模块430包括:
第二计算子模块,用于采用预设分类算法,根据行为分类集确定第一无标签行为数据的预测行为标签;
第三计算子模块,用于采用预设学习算法,根据各行为分类集的行为类别中心点计算第一无标签行为数据的行为中心点距离向量。
其中,第二计算子模块包括:
第一计算单元,用于通过以下公式,确定第一无标签行为数据与各行为分类集中的有标签行为数据的欧氏距离d(Xi,Xm);
第一处理单元,用于根据欧式距离,选择P个距离最近的有标签行为数据作为第一无标签行为数据的近邻行为数据,其中P为正整数;
第二处理单元,用于将近邻行为数据所属行为分类集出现次数最多的行为分类集的行为标签确定为第一无标签行为数据的预测行为标签;
其中,Xi表示在时刻i采集到的K维的第一无标签行为数据,Xm表示时刻m采集到的K维的有标签行为数据,d(Xi,Xm)表示Xi与Xm的欧氏距离,xik表示Xi中的第k维数据,xmk表示Xm中的第k维数据。
其中第三计算子模块包括:
第二计算单元,用于计算第一无标签行为数据与各行为分类集的类别中心点的欧式距离;
第三处理单元,用于根据Q个距离最近的行为分类集及对应的行为类别中心点,生成第一无标签行为数据的2Q维的行为中心距离向量。
本发明的行为识别装置实施例是与上述行为识别方法的实施例对应的,上述方法实施例中的所有实现手段均适用于该装置的实施例中,也能达到相同的技术效果。
以上从第一传感器侧介绍了本发明实施例的行为识别方法及装置,下面本实施将进一步结合附图和应用场景对第二传感器侧的行为识别方法作进一步介绍。
具体地,本发明实施例还提供了一种行为识别方法,应用于第二传感器,如图5所示,具体包括以下步骤:
步骤51:接收第一传感器发送的第一无标签数据的预测行为标签和行为中心点距离向量。
这里第一传感器为具有行为识别能力的可穿戴设备的一种,其他具有行为识别能力的可穿戴设备亦可适用于本发明实施例的各种示例,第一传感器又称为教师传感器。第二传感器为不具有行为识别能力的可穿戴设备的一种,将新加入的传感器称为学生传感器。教师传感器和学生传感器同时佩戴于人体不同部位,并且两个传感器在同一时间片段产生的行为特征数据可以通过时间戳对应。由于第一传感器具有行为识别能力,因此可根据其自身存储的有标签行为数据确定新采集的第一无标签行为数据的预测行为标签和行为中心点距离向量。
步骤52:获取第二无标签行为数据。
其中,第二无标签行为数据为第一传感器采集第一无标签数据时第二传感器采集的,即在同一时间片段产生的行为特征数据可以通过时间戳对应是指:“教师传感器”和“学生传感器”通过时间属性对获取的无标签行为数据进行对应,同一个时间戳能够对应一条第一无标签行为数据和一条第二无标签行为数据。
步骤53:根据预测行为标签和行为中心点距离向量,确定第二无标签行为数据的行为标签。
步骤53为学生传感器的标签识别能力建立过程,根据具备行为识别能力的教师传感器确定的新采集的第一无标签行为数据的预测行为标签和行为中心点距离向量,确定自身新采集的第二无标签行为数据的行为标签。
具体地,学生传感器将行为中心点距离向量和预测行为标签与第二无标签行为数据相对应,并应用行为中心点距离向量扩充数据。步骤53包括:根据行为中心点距离向量,对第二无标签行为数据进行扩维;根据扩维后的无标签行为数据,构建第二无标签行为数据的行为相似图;通过行为相似图优化预测行为标签,得到第二无标签行为数据的行为标签。
具体地,根据行为中心点距离向量,对第二无标签行为数据进行扩维的步骤中,学生传感器获取到长度为2Q的行为中心点距离向量后,根据时间戳确定此向量对应的第二无标签行为数据,然后对原始的第二无标签行为数据进行扩维。具体扩维方法为将长度为2Q的行为中心点距离向量附加于W维的第二无标签行为数据之后,形成为2Q+W维的新数据。假设行为中心距离向量为{c1,di1,c2,…cn,din…,cQ,diQ},第二无标签行为数据Yi={y1,y2,y3,…yw…,yW},那么扩维后的无标签行为数据为{y1,y2,y3,…yw…,yW,c1,di1,c2,…cn,din…,cQ,diQ}。
进一步地,学生传感器在得到扩维后的无标签数据后,利用该扩维后的数据进行预测性为标签的优化,并利用优化后的预测行为标签训练新的行为分类器,即训练新的行为识别模型,模型建立后学生传感器也就具备了行为识别能力了。具体地,学生传感器根据扩维后的无标签行为数据建立相似图,其中,相似图是一个带权无向图,该图中的每个顶点表示一个扩维后的第二无标签行为数据,每条边表示这两个第二无标签行为数据之间的相似度。具体地,根据扩维后的无标签行为数据,构建第二无标签行为数据的行为相似图的步骤,包括:
通过计算Yi与Yf的相似度ηif;
通过计算Yi与Yf的边权值eif;
根据相似度和边权值,确定第二无标签行为数据的行为相似图;
其中,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签行为数据,σ表示高斯核宽度。由于第二传感器基于扩维后的无标签行为数据进行的行为相似图的构建,因此建立的行为相似图具有较高的准确性。
在确定扩维后的第二无标签行为数据的行为相似图后,利用该行为相似图进行预测行为标签的优化,优化过程类似标签传播(LP,Label Propagation)算法,第t+1次迭代时第二无标签行为数据Yi的行为标签可通过以下公式计算得到:
通过以下公式,对预测行为标签进行优化得到第二无标签行为数据的行为标签;
其中,表示第t+1次迭代时扩维后的第二无标签行为数据Yi的行为标签,表示第t次迭代时扩维后的第二无标签行为数据Yf的行为标签,表示第t次迭代时所述第二无标签行为数据Yi的行为标签,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签行为数据,α表示可调整参数,α∈[0,1],ωif表示标准化后Yi和Yf的边权值;具体地,
其中,eif表示Yi与Yf的边权值,V表示行为相似图的节点集合,eiv表示行为相似图中节点i与v之间的边权值。
学生传感器利用优化后的预测行为标签训练新的行为识别模型,训练行为识别模型已有多种成熟的适用算法,如k近邻、k均值、决策树、支持向量机、等,模型建立后新加入的学生传感器也获得了行为识别能力。
这样,本发明实施例的行为识别方法中,未存储有标签行为数据的第二传感器可利用存储有有标签行为数据的第一传感器确定的第一无标签行为数据的预测行为标签和行为中心点距离向量,确定自身采集的第二无标签行为数据的标签。这样将已拥有识别能力的第一传感器的行为识别能力迁移给新增加的无识别能力的第二传感器上,在识别能力迁移到一定程度时,第二传感器可作为具有行为识别能力的第一传感器的有效补充,从而保证在动态环境下准确地标定无标签行为数据,即新增的已学习到识别能力的学生传感器可替代原拥有识别能力的教师传感器,此外学生传感器和教师传感器可同时工作,以提高识别精度。
以上实施例就本发明的数据标签识别方法做出介绍,下面本实施例将结合附图对其对应的系统做进一步说明。
具体地,如图6所示,本发明实施例的行为识别装置,应用于第二传感器600,包括:
接收模块610,用于接收第一传感器发送的第一无标签数据的预测行为标签和行为中心点距离向量;其中,预测行为标签和行为中心点距离向量为第一传感器根据有标签行为数据确定的;
采集模块620,用于获取第二无标签行为数据;其中,第二无标签行为数据为第一传感器采集第一无标签数据时第二传感器采集的;
第三计算模块630,用于根据预测行为标签和行为中心点距离向量,确定第二无标签行为数据的行为标签。
其中,第三计算模块630包括:
第一扩维子模块,用于根据行为中心点距离向量,对第二无标签行为数据进行扩维;
第一构建子模块,用于根据扩维后的无标签行为数据,构建第二无标签行为数据的行为相似图;
第一优化子模块,用于通过行为相似图优化预测行为标签,得到第二无标签行为数据的行为标签。
其中,第一构建子模块包括:
第三计算单元,用于通过计算Yi与Yf的相似度ηif;
第四计算单元,用于
通过计算Yi与Yf的边权值eif;
第五计算单元,用于根据相似度和边权值,确定第二无标签行为数据的行为相似图;
其中,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签行为数据,σ表示高斯核宽度。
其中,第一优化子模块包括:
第一优化单元,用于通过以下公式,对预测行为标签进行优化得到第二无标签行为数据的行为标签;
其中,表示第t+1次迭代时扩维后的第二无标签行为数据Yi的行为标签,表示第t次迭代时扩维后的第二无标签行为数据Yf的行为标签,表示第t次迭代时所述第二无标签行为数据Yi的行为标签,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签行为数据,α表示可调整参数,α∈[0,1],ωif表示标准化后Yi和Yf的边权值;具体地,
其中,其中,eif表示Yi与Yf的边权值,V表示行为相似图的节点集合,eiv表示行为相似图中节点i与v之间的边权值。
本发明的行为识别装置实施例是与上述行为识别方法的实施例对应的,上述方法实施例中的所有实现手段均适用于该装置的实施例中,也能达到相同的技术效果。
为了更好的实现上述目的,如图7所示,本发明的实施例还提供了一种电子设备,该电子设备包括:处理器700;通过总线接口与所述处理器700相连接的存储器720,以及通过总线接口与处理器700相连接的收发机710;所述存储器720用于存储所述处理器在执行操作时所使用的程序和数据;通过所述收发机710发送数据信息;当处理器700调用并执行所述存储器720中所存储的程序和数据时,实现如下的功能:
处理器700用于读取存储器720中的程序,执行下列过程:获取有标签数据、第一无标签数据和第二无标签数据;根据有标签数据,确定分类集及各分类集的类别中心点;根据分类集,确定第一无标签数据的预测标签;根据各分类集的类别中心点,确定第一无标签数据的中心点距离向量;根据预测标签和中心点距离向量,确定第二无标签数据的标签。
收发机710,用于在处理器700的控制下接收和发送数据。
其中,在图7中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器700代表的一个或多个处理器和存储器720代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机710可以是多个元件,即包括发送机和收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器700负责管理总线架构和通常的处理,存储器720可以存储处理器700在执行操作时所使用的数据。
本领域技术人员可以理解,实现上述实施例的全部或者部分步骤可以通过硬件来完成,也可以通过计算机程序来指示相关的硬件来完成,所述计算机程序包括执行上述方法的部分或者全部步骤的指令;且该计算机程序可以存储于一可读存储介质中,存储介质可以是任何形式的存储介质。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据标签识别方法实施例,或者行为识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (22)
1.一种数据标签识别方法,其特征在于,包括:
获取有标签数据、第一无标签数据和第二无标签数据;其中,所述有标签数据和所述第一无标签数据对应于同一采集装置,所述第一无标签数据和所述第二无标签数据是同一时刻不同采集装置采集的;
根据所述有标签数据,确定分类集及各分类集的类别中心点;
根据所述分类集,确定所述第一无标签数据的预测标签;
根据各分类集的类别中心点,确定所述第一无标签数据的中心点距离向量;
根据所述预测标签和所述中心点距离向量,确定所述第二无标签数据的标签。
2.根据权利要求1所述的数据标签识别方法,其特征在于,所述根据所述有标签数据,确定分类集及各分类集的类别中心点的步骤中,根据所述有标签数据确定各分类集的类别中心的步骤为:
通过以下公式,确定各分类集的类别中心;
其中,μn表示第n类分类集的类别中心,Cn表示第n类分类集中的有标签数据集合,Xm表示时刻m采集到的有标签数据,Xm为Cn中的M个元素之一,M为正整数。
3.根据权利要求1所述的数据标签识别方法,其特征在于,所述根据所述分类集,确定所述第一无标签数据的预测标签的步骤,包括:
采用预设分类算法,根据所述分类集确定所述第一无标签数据的预测标签;
所述根据各分类集的类别中心点,确定所述第一无标签数据的中心点距离向量的步骤,包括:
采用预设学习算法,根据各分类集的类别中心点计算所述第一无标签数据的中心点距离向量。
4.根据权利要求3所述的数据标签识别方法,其特征在于,所述采用预设分类算法,根据所述分类集确定所述第一无标签数据的预测标签的步骤,包括:
通过以下公式,确定所述第一无标签数据与各分类集中的有标签数据的欧氏距离d(Xi,Xm);
根据所述欧式距离,选择P个距离最近的有标签数据作为所述第一无标签数据的近邻数据,其中P为正整数;
将所述近邻数据所属分类集出现次数最多的分类集的标签确定为所述第一无标签数据的预测标签;
其中,Xi表示在时刻i采集到的K维的第一无标签数据,Xm表示时刻m采集到的K维的有标签数据,d(Xi,Xm)表示Xi与Xm的欧氏距离,xik表示Xi中的第k维数据,xmk表示Xm中的第k维数据。
5.根据权利要求3所述的数据标签识别方法,其特征在于,所述采用预设学习算法,根据各分类集的类别中心点计算所述第一无标签数据的中心点距离向量的步骤,包括:
计算所述第一无标签数据与各分类集的类别中心点的欧式距离;
根据Q个距离最近的分类集及对应的类别中心点,生成所述第一无标签数据的2Q维的中心点距离向量。
6.根据权利要求1所述的数据标签识别方法,其特征在于,所述根据所述预测标签和所述中心点距离向量,确定所述第二无标签数据的标签的步骤,包括:
根据所述中心点距离向量,对所述第二无标签数据进行扩维;
根据扩维后的无标签数据,构建所述第二无标签数据的相似图;
通过所述相似图优化所述预测标签,得到所述第二无标签数据的标签。
7.根据权利要求6所述的数据标签识别方法,其特征在于,所述根据扩维后的无标签数据,构建所述第二无标签数据的相似图的步骤,包括:
通过计算Yi与Yf的相似度ηif;
通过计算Yi与Yf的边权值eif;
根据所述相似度和所述边权值,确定所述第二无标签数据的相似图;
其中,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签数据,σ表示高斯核宽度。
8.根据权利要求6所述的数据标签识别方法,其特征在于,所述通过所述相似图优化所述预测标签,得到所述第二无标签数据的标签的步骤,包括:
通过以下公式,对预测标签进行优化得到所述第二无标签数据的标签;
其中,表示第t+1次迭代时扩维后的第二无标签数据Yi的标签,表示第t次迭代时扩维后的第二无标签数据Yf的标签,表示第t次迭代时所述第二无标签数据Yi的标签,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签数据,α表示可调整参数,α∈[0,1],ωif表示标准化后Yi和Yf的边权值;具体地,
其中,eif表示Yi与Yf的边权值,V表示相似图的节点集合,eiv表示相似图中节点i与v之间的边权值。
9.一种数据标签识别系统,其特征在于,包括:
第一获取模块,用于获取有标签数据、第一无标签数据和第二无标签数据;其中,所述有标签数据和所述第一无标签数据对应于同一采集装置,所述第一无标签数据和所述第二无标签数据是同一时刻不同采集装置采集的;
第一处理模块,用于根据所述有标签数据,确定分类集及各分类集的类别中心点;
第二处理模块,用于根据所述分类集,确定所述第一无标签数据的预测标签;以及,根据各分类集的类别中心点,确定所述第一无标签数据的中心点距离向量;
第三处理模块,用于根据所述预测标签和所述中心点距离向量,确定所述第二无标签数据的标签。
10.一种行为识别方法,应用于第一传感器,其特征在于,包括:
获取有标签行为数据和第一无标签行为数据;
根据所述有标签行为数据,确定行为分类集及各行为分类集的行为类别中心点;
根据所述行为分类集确定所述第一无标签行为数据的预测行为标签,以及根据各行为分类集的行为类别中心点,确定所述第一无标签行为数据距离的行为中心点距离向量;
将所述预测行为标签和所述行为中心点距离向量,发送至第二传感器。
11.根据权利要求10所述的行为识别方法,其特征在于,所述根据所述有标签行为数据,确定行为分类集及各行为分类集的行为类别中心点的步骤中,根据所述有标签行为数据,确定各行为分类集的行为类别中心点的步骤为:
通过以下公式,确定各行为分类集的行为类别中心;
其中,μn表示第n类行为分类集的行为类别中心,Cn表示第n类行为分类集中的有标签行为数据集合,Xm表示在时刻m采集到的有标签行为数据,Xm为Cn中的M个元素之一,M为正整数。
12.根据权利要求10所述的行为识别方法,其特征在于,所述根据所述行为分类集,确定所述第一无标签行为数据的预测行为标签的步骤,包括:
采用预设分类算法,根据所述行为分类集确定所述第一无标签行为数据的预测行为标签;
所述根据各行为分类集的行为类别中心点,确定所述第一无标签行为数据的行为中心点距离向量的步骤,包括:
采用预设学习算法,根据各行为分类集的行为类别中心点计算所述第一无标签行为数据的行为中心点距离向量。
13.根据权利要求12所述的行为识别方法,其特征在于,所述采用预设分类算法,根据所述行为分类集确定所述第一无标签行为数据的预测行为标签的步骤,包括:
通过以下公式,确定所述第一无标签行为数据与各行为分类集中的有标签行为数据的欧氏距离d(Xi,Xm);
根据所述欧式距离,选择P个距离最近的有标签行为数据作为所述第一无标签行为数据的近邻行为数据,其中P为正整数;
将所述近邻行为数据所属行为分类集出现次数最多的行为分类集的行为标签确定为所述第一无标签行为数据的预测行为标签;
其中,Xi表示在时刻i采集到的K维的第一无标签行为数据,Xm表示时刻m采集到的K维的有标签行为数据,d(Xi,Xm)表示Xi与Xm的欧氏距离,xik表示Xi中的第k维数据,xmk表示Xm中的第k维数据。
14.根据权利要求12所述的行为识别方法,其特征在于,所述采用预设学习算法,根据各行为分类集的类别中心点计算所述第一无标签行为数据的行为中心点距离向量的步骤,包括:
计算所述第一无标签行为数据与各行为分类集的类别中心点的欧式距离;
根据Q个距离最近的行为分类集及对应的行为类别中心点,生成所述第一无标签行为数据的2Q维的行为中心距离向量。
15.一种行为识别装置,应用于第一传感器,其特征在于,包括:
第二获取模块,用于获取有标签行为数据和第一无标签行为数据;
第一计算模块,用于根据所述有标签行为数据,确定行为分类集及各行为分类集的行为类别中心点;
第二计算模块,用于根据所述行为分类集确定所述第一无标签行为数据的预测行为标签;以及根据各行为分类集的行为类别中心点,确定所述第一无标签行为数据的行为中心点距离向量;
发送模块,用于将所述预测行为标签和所述行为中心点距离向量,发送至第二传感器。
16.一种行为识别方法,应用于第二传感器,其特征在于,包括:
接收第一传感器发送的第一无标签数据的预测行为标签和行为中心点距离向量;其中,所述预测行为标签和行为中心点距离向量为第一传感器根据有标签行为数据确定的;
获取第二无标签行为数据;其中,所述第二无标签行为数据为所述第一传感器采集所述第一无标签数据时所述第二传感器采集的;
根据所述预测行为标签和所述行为中心点距离向量,确定所述第二无标签行为数据的行为标签。
17.根据权利要求16所述的行为识别方法,其特征在于,所述根据所述预测行为标签和所述行为中心点距离向量,确定所述第二无标签行为数据的行为标签的步骤,包括:
根据所述行为中心点距离向量,对所述第二无标签行为数据进行扩维;
根据扩维后的无标签行为数据,构建所述第二无标签行为数据的行为相似图;
通过所述行为相似图优化所述预测行为标签,得到所述第二无标签行为数据的行为标签。
18.根据权利要求17所述的行为识别方法,其特征在于,所述根据扩维后的无标签行为数据,构建所述第二无标签行为数据的行为相似图的步骤,包括:
通过计算Yi与Yf的相似度ηif;
通过计算Yi与Yf的边权值eif;
根据所述相似度和所述边权值,确定所述第二无标签行为数据的行为相似图;
其中,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签行为数据,σ表示高斯核宽度。
19.根据权利要求17所述的行为识别方法,其特征在于,所述通过所述行为相似图优化所述预测行为标签,得到所述第二无标签行为数据的行为标签的步骤,包括:
通过以下公式,对预测行为标签进行优化得到所述第二无标签行为数据的行为标签;
其中,表示第t+1次迭代时扩维后的第二无标签行为数据Yi的行为标签,表示第t次迭代时扩维后的第二无标签行为数据Yf的行为标签,表示第t次迭代时所述第二无标签行为数据Yi的行为标签,Yi和Yf分别表示在时刻i和f采集到的并经过扩维后的第二无标签行为数据,α表示可调整参数,α∈[0,1],ωif表示标准化后Yi和Yf的边权值;具体地,
其中,eif表示Yi与Yf的边权值,V表示行为相似图的节点集合,eiv表示行为相似图中节点i与v之间的边权值。
20.一种行为识别装置,应用于第二传感器,其特征在于,包括:
接收模块,用于接收第一传感器发送的第一无标签数据的预测行为标签和行为中心点距离向量;其中,所述预测行为标签和行为中心点距离向量为第一传感器根据有标签行为数据确定的;
采集模块,用于获取第二无标签行为数据;其中,所述第二无标签行为数据为所述第一传感器采集所述第一无标签数据时所述第二传感器采集的;
第三计算模块,用于根据所述预测行为标签和所述行为中心点距离向量,确定所述第二无标签行为数据的行为标签。
21.一种电子设备,其特征在于,包括:处理器;与所述处理器相连接的存储器,以及与处理器相连接的收发机;其中,所述处理器用于调用并执行所述存储器中所存储的程序和数据,实现如权利要求1至8任一项所述的数据标签识别方法,或者实现如权利要求10至14、16至19任一项所述的行为识别方法的步骤。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的数据标签识别方法,或者实现如权利要求10至14、16至19任一项所述的行为识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810000868.XA CN109993188B (zh) | 2018-01-02 | 2018-01-02 | 数据标签识别方法、行为识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810000868.XA CN109993188B (zh) | 2018-01-02 | 2018-01-02 | 数据标签识别方法、行为识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109993188A true CN109993188A (zh) | 2019-07-09 |
CN109993188B CN109993188B (zh) | 2021-01-15 |
Family
ID=67128796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810000868.XA Active CN109993188B (zh) | 2018-01-02 | 2018-01-02 | 数据标签识别方法、行为识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993188B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472576A (zh) * | 2019-08-15 | 2019-11-19 | 西安邮电大学 | 一种实现移动人体行为识别的方法及装置 |
CN110796262A (zh) * | 2019-09-26 | 2020-02-14 | 北京淇瑀信息科技有限公司 | 机器学习模型的测试数据优化方法、装置及电子设备 |
CN112370765A (zh) * | 2020-01-21 | 2021-02-19 | 鲁姆文化传媒(上海)有限公司 | 一种人工智能健康监控管理平台 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103944887A (zh) * | 2014-03-24 | 2014-07-23 | 西安电子科技大学 | 基于隐条件随机场的入侵事件检测方法 |
CN104794489A (zh) * | 2015-04-23 | 2015-07-22 | 苏州大学 | 一种基于深度标签预测的诱导式图像分类方法及系统 |
US9427160B2 (en) * | 2013-03-04 | 2016-08-30 | Hello Inc. | Wearable device with overlapping ends coupled by magnets positioned in the wearable device by an undercut |
CN106529604A (zh) * | 2016-11-24 | 2017-03-22 | 苏州大学 | 一种自适应的图像标签鲁棒预测方法及系统 |
CN106911591A (zh) * | 2017-03-09 | 2017-06-30 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 网络流量的分类方法和系统 |
US9767349B1 (en) * | 2016-05-09 | 2017-09-19 | Xerox Corporation | Learning emotional states using personalized calibration tasks |
EP2592420B1 (en) * | 2011-11-10 | 2017-09-20 | InfanDx AG | Method and use of metabolic compounds for diagnosing stroke |
-
2018
- 2018-01-02 CN CN201810000868.XA patent/CN109993188B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2592420B1 (en) * | 2011-11-10 | 2017-09-20 | InfanDx AG | Method and use of metabolic compounds for diagnosing stroke |
US9427160B2 (en) * | 2013-03-04 | 2016-08-30 | Hello Inc. | Wearable device with overlapping ends coupled by magnets positioned in the wearable device by an undercut |
CN103944887A (zh) * | 2014-03-24 | 2014-07-23 | 西安电子科技大学 | 基于隐条件随机场的入侵事件检测方法 |
CN104794489A (zh) * | 2015-04-23 | 2015-07-22 | 苏州大学 | 一种基于深度标签预测的诱导式图像分类方法及系统 |
US9767349B1 (en) * | 2016-05-09 | 2017-09-19 | Xerox Corporation | Learning emotional states using personalized calibration tasks |
CN106529604A (zh) * | 2016-11-24 | 2017-03-22 | 苏州大学 | 一种自适应的图像标签鲁棒预测方法及系统 |
CN106911591A (zh) * | 2017-03-09 | 2017-06-30 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 网络流量的分类方法和系统 |
Non-Patent Citations (4)
Title |
---|
AARTI SATHYANARAYANA ET AL.: "《Sleep Quality Prediction From Wearable Data Using Deep Learning》", 《JMIR MHEALTH UHEALTH》 * |
E. WEBSTER: "《Predicting cognitive states from wearable recordings of autonomic function》", 《IBM JOURNAL OF RESEARCH AND DEVELOPMENT》 * |
张磊 等: "《跨媒体语义共享子空间学习研究进展》", 《计算机学报》 * |
董立岩 等: "《基于半监督学习的朴素贝叶斯分类新算法》", 《吉林大学学报(工学版)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472576A (zh) * | 2019-08-15 | 2019-11-19 | 西安邮电大学 | 一种实现移动人体行为识别的方法及装置 |
CN110796262A (zh) * | 2019-09-26 | 2020-02-14 | 北京淇瑀信息科技有限公司 | 机器学习模型的测试数据优化方法、装置及电子设备 |
CN110796262B (zh) * | 2019-09-26 | 2023-09-29 | 北京淇瑀信息科技有限公司 | 机器学习模型的测试数据优化方法、装置及电子设备 |
CN112370765A (zh) * | 2020-01-21 | 2021-02-19 | 鲁姆文化传媒(上海)有限公司 | 一种人工智能健康监控管理平台 |
Also Published As
Publication number | Publication date |
---|---|
CN109993188B (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Delving deep into label smoothing | |
US20230052865A1 (en) | Molecular graph representation learning method based on contrastive learning | |
Yu et al. | Fast action detection via discriminative random forest voting and top-k subvolume search | |
Filtjens et al. | Skeleton-based action segmentation with multi-stage spatial-temporal graph convolutional neural networks | |
CN103927394B (zh) | 一种基于svm的多标签主动学习分类方法及系统 | |
CN109858390A (zh) | 基于端到端时空图学习神经网络的人体骨架的行为识别方法 | |
CN113537040B (zh) | 一种基于半监督学习的时序行为检测方法及系统 | |
Imani et al. | Semihd: Semi-supervised learning using hyperdimensional computing | |
CN109993188B (zh) | 数据标签识别方法、行为识别方法及装置 | |
Rozado et al. | Extending the bioinspired hierarchical temporal memory paradigm for sign language recognition | |
Wang et al. | Dynamic texture video classification using extreme learning machine | |
An et al. | Pedestrian re-identification algorithm based on visual attention-positive sample generation network deep learning model | |
Wang et al. | A novel multiface recognition method with short training time and lightweight based on ABASNet and H-softmax | |
Du et al. | Convolutional neural network-based data anomaly detection considering class imbalance with limited data | |
Bourouis et al. | Bayesian frameworks for traffic scenes monitoring via view-based 3D cars models recognition | |
Cui et al. | DOPNet: Dense Object Prediction Network for Multi-Class Object Counting and Localization in Remote Sensing Images | |
Rozado et al. | Optimizing hierarchical temporal memory for multivariable time series | |
CN116630753A (zh) | 一种基于对比学习的多尺度小样本目标检测方法 | |
CN109522954A (zh) | 异构信息网络链接预测装置 | |
Karthika et al. | Addressing the false positives in pedestrian detection | |
Xu | Research on Multi-Labels Image Classification Based on Self-Supervised Model | |
Bravo-Rocca et al. | TADIL: Task-Agnostic Domain-Incremental Learning through Task-ID Inference using Transformer Nearest-Centroid Embeddings | |
Yu et al. | Supervised multiple timescale recurrent neuron network model for human action classification | |
CN116959035B (zh) | 一种基于步态的身份识别方法、装置、芯片及终端 | |
Vinay Kumar et al. | Machine Learning-Based Human Activity Recognition Using Smartphones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |