CN109272023B - 一种物联网迁移学习方法和系统 - Google Patents

一种物联网迁移学习方法和系统 Download PDF

Info

Publication number
CN109272023B
CN109272023B CN201810981425.3A CN201810981425A CN109272023B CN 109272023 B CN109272023 B CN 109272023B CN 201810981425 A CN201810981425 A CN 201810981425A CN 109272023 B CN109272023 B CN 109272023B
Authority
CN
China
Prior art keywords
sample
learner
data
label
teacher
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810981425.3A
Other languages
English (en)
Other versions
CN109272023A (zh
Inventor
王念
崔莉
赵泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN201810981425.3A priority Critical patent/CN109272023B/zh
Publication of CN109272023A publication Critical patent/CN109272023A/zh
Application granted granted Critical
Publication of CN109272023B publication Critical patent/CN109272023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及物联网迁移学习方法和系统,包括:在教授者和学习者感知节点同时部署的情况下,通过教授者实时识别与传输半标签的方式辅助学习者进行当前样本的标记工作,利用半标签的性质查找到在学习者数据集合中可以区分但教授者分类器无法区分的模式以及对应的样本所组成的群组。使用半监督的方式寻求人工辅助标记,系统将在学习者数据集中为每个优势能力样本根据其初始状态的半标签向量值、周围样本的半标签值和拥有半监督标记的最相近典型样本的标记值进行半标签的修改,为每个样本赋予该样本半标签向量中最高分量所对应的标签值,从而获得修饰过标签的样本集,以训练学习者模式识别模型,从而实现模式识别能力从教授者到学习者的迁移。

Description

一种物联网迁移学习方法和系统
技术领域
本发明属于机器学习及迁移学习领域,尤其涉及一种物联网迁移学习方法和系统。
背景技术
在现实世界的物联网系统中,现有结构的物联网节点种类及数量经常无法满足相应场景及系统目标的需求,故而需要加入新的感知节点来丰富物联网系统的感知能力。当加入了新的感知节点后,系统往往需要大量带标签的训练和测试数据来为新加入的节点建立机器学习模型,但标记大量的训练及测试数据是一项时间开销大、人工标注成本大的工作。故而将已有感知节点的模式识别能力迁移到新加入的感知节点是一项很有意义的工作。其中模式可例如:1.运动识别模式场景(该例中可以是多个加速度计传感器的运动识别能力的迁移);2.火情模式场景(该例中可以是一个烟雾传感器作为教授者,一个温度传感器作为学习者,将火灾识别作为模式识别的目标);3.活物识别场景(该例中可以是一个压电传感器作为教授者,一个红外人体传感器作为学习者,将活物存在模式作为模式识别的目标)。
当前的物联网感知节点中,往往由于其本身存储空间限制以及商业保密等原因,无法在节点中存储全部用于训练模型的数据集,也不允许第三方设备访问其内部数据及模型。针对此类物联网场景中的物端节点能力迁移,Calatroni等人提出了Teacher/Learner架构,并提出了Naive和System-Supervised两种迁移学习方法。这两种方法中都将新加入的感知节点当作学习者(Learner),将结构中原本存在的感知节点当作教授者(Teacher)。Naive方法将教授者的模型直接传递给学习者,故而需要两者拥有相同的特征空间和类似的部署位置。但在实际的物联网系统中很难满足该前提,因为系统往往需要加入一个与已有节点传感类型不同,且位置有差异的新感知节点来识别之前混淆的各种模式。System-Supervised方法通过传递标签(label)的方式来实时标记学习者的数据集,从而将教授者的模式识别能力部分迁移到学习者节点。但在System-Supervised方法中,对于教授者无法识别的混淆模式,在迁移之后的学习者数据集中也仍旧无法分辨清晰,因为教授者传递过来的标签中混淆模式的标签本身无法分清。为将教授者识别能力中的混淆模式显式表现出来,Rokni等提出了Plug-n-learn方法,在该方法中提出了半标签(semi-label)的概念。半标签即教授者在判断出当前的模式后,根据本身训练集的经验,将本身对于预测为该类的模式中真实标签为其他若干类别的概率同步发送至学习者节点,从而能够给学习者修改的依据与可能。Plug-learn方法中,教授者传感器和学习者传感器同时采集一段时间,并通过同步将教授者的半标签传递给学习者的方法为学习者的数据进行标记,然后在学习者数据集合聚类建立偶图,并通过匈牙利最优指派算法为每个聚类群组和其内样本赋予标签。Plug-n-learn方法中,教授者混淆模式的数据对于学习者来说仍旧无法识别,因为对于被教授者混淆模式的样本来说,它们对应的在学习者样本空间中的样本们自身分布可以分开,但聚类后该簇的半标签值趋同,无法从半标签中使用分配算法计算出该簇最优的标签属性值。所以在Plug-n-Learn方法中学习者无法突破教授者的识别天花板,且无法解决教授者节点偶尔误判优势能力样本的问题。同年,Rokni提出了SSCL方法,该方法属于物端模型迁移,其要求系统中有多个教授者,并设置评估函数来评估学习者与若干教授者的相似度,从而选取最相近的模型进行传输与迁移。SSCL方法仅适用于学习者与教授者的特征空间完全一致,并且有类似空间摆放和物理性质的教授节点存在的场景。为解决Plug-n-learn方法中教授者节点偶尔误识别导致迁移精度下降的问题,Rokni提出了SDVL方法,它可以适应学习者传感器位置动态变化的场景。SDVL方法同样通过教授者传递半标签的方法来为学习者进行辅助标记,并通过迭代传播的方式最小化半标签中各分量的误差。相对于System-Supervised和Plug-n-Learn方法,它能够修正教授者偶尔误识别的样本,但仍旧无法识别教授者混淆的模式。
在现实的物联网场景中,加入新的感知节点往往是因为当前物联网系统中的传感器资源无法满足系统要求,即由于当前传感系统的感知能力限制,系统无法准确识别某些模式。所以加入新的感知节点是为了丰富传感系统的感知能力,期望新加入的节点能够对之前系统的某些混淆模式进行区分。但上述的已有物联网迁移学习研究方法均无法使学习者在教授者混淆的模式识别能力上超越教授者,故而导致加入新感知节点后系统识别能力仍无法实质提升的问题。
发明内容
针对以上物联网迁移学习方法无法使学习者(Learner)感知节点识别教授者(Teacher)感知节点的混淆模式的问题。本发明基于半标签传递方法及半监督方法提出了一种物联网物端迁移学习方法和系统,可在不访问教授者训练数据集及模型的情况下将教授者的模式识别能力迁移到学习者感知节点,自动发现学习者相对于教授者的优势能力,并通过半监督的方式具体化学习者的优势能力并据此修饰学习者的数据集,从而在学习者的训练数据集中教授者混淆模式所对应的样本能够分开并且正确标注,故而建立在其上的分类模型对优势能力模式拥有良好的区分能力。
具体来说,本发明公开了一种物联网迁移学习方法,其中包括:
步骤1、将物联网中已有的感知节点作为教授者,并将新加入该物联网的感知节点作为学习者,其中该教授者拥有模式识别模型,该教授者和该学习者同时进行数据采集和特征提取;
步骤2、该教授者根据该模式识别模型对其采集的当前数据进行模式识别,得到当前数据的分类结果,根据该教授者采集的历史数据,得到将该分类结果对应的半标签向量,该教授者将该半标签向量传递给该学习者,该学习者将该半标签向量与其采集的当前数据进行关联,得到样本数据并将其存储至学习者数据集合;
步骤3、该学习者根据该学习者数据集合内样本数据的分布,将该学习者数据集合分成多个样本群组,并得到其中可被该学习者区分但无法被该教授者区分的样本群组,作为优势能力群组;
步骤4、人工标记该优势能力群组内典型样本的标签值,在该学习者数据集合内对每个样本数据根据其所在群组内的典型样本的人工标记的标签值、样本数据初始的半标签值和周围样本数据的半标签值进行传播,利用迭代的方式修饰每个样本数据的半标签值;
步骤5、对该优势能力群组中每个样本数据,将该样本数据修饰后的半标签向量中最大分量所对应的标签值作为其最终修饰后的标签值;
步骤6、利用修饰过标签值的样本数据,训练得到该学习者的模式识别模型。
该物联网迁移学习方法,其中在执行该步骤3之前还包括:判断该学习者数据集合存储的数据量是否已经足够建立该学习者的模式识别模型,若是,则执行该步骤3,否则执行该步骤1继续积累数据。
该物联网迁移学习方法,其中该典型样本为该优势能力群组聚类中心点。
该物联网迁移学习方法,其中该步骤4包括:人工手动标记每个典型样本的权重,并为每个样本群组中的除典型样本以外的样本数据分配权重,以迭代得到每个样本数据的半标签值。
该物联网迁移学习方法,其中该步骤4还包括:
Figure BDA0001778647400000041
的方式迭代自己的半标签,其中
Figure BDA0001778647400000042
为样本数据xi在第t次迭代时的半标签值,SLi是xi初始状态的半标签值,ωj为和xi属于同一个优势能力群组的样本数据xj的权重,Cij∈(0,1)为xi和xj的高斯核距离占xi和同一优势能力群组内所有样本数据距离之和的比例。
本发明还公开了一种物联网迁移学习系统,其中包括:
数据采集模块,用于将物联网中已有的感知节点作为教授者,并将新加入该物联网的感知节点作为学习者,其中该教授者拥有模式识别模型,该教授者和该学习者同时进行数据采集和特征提取;
数据存储模块,用于使该教授者根据该模式识别模型对其采集的当前数据进行模式识别,得到当前数据的分类结果,根据该教授者采集的历史数据,得到将该分类结果对应的半标签向量,该教授者将该半标签向量传递给该学习者,该学习者将该半标签向量与其采集的当前数据进行关联,得到样本数据并将其存储至学习者数据集合;
学习者数据集合划分模块,用于根据该学习者数据集合内样本数据的分布,将该学习者数据集合分成多个样本群组,并得到其中可被该学习者区分但无法被该教授者区分的样本群组,作为优势能力群组;
人工标记模块,人工标记该优势能力群组内典型样本的标签值,在该学习者数据集合内对每个样本数据根据其所在群组内的典型样本的人工标记的标签值、样本数据初始的半标签值和周围样本数据的半标签值进行传播,利用迭代的方式修饰每个样本数据的半标签值;
标签值修饰模块,用于对该优势能力群组中每个样本数据,将该样本数据修饰后的半标签向量中最大分量所对应的标签值作为其最终修饰后的标签值;
分类模型建立模块,用于利用修饰过标签值的样本数据,训练得到该学习者的模式识别模型。
该物联网迁移学习系统,其中在调用该学习者数据集合划分模块之前还包括:调用判断模块,用于判断该学习者数据集合存储的数据量是否已经足够建立该学习者的模式识别模型,若是,则调用该学习者数据集合划分模块,否则调用该数据采集模块继续积累数据。
该物联网迁移学习系统,其中该典型样本为该优势能力群组聚类中心点。
该物联网迁移学习系统,其中该人工标记模块包括:人工手动标记每个典型样本的权重,并为每个样本群组中的除典型样本以外的样本数据分配权重,以迭代得到每个样本数据的半标签值。
该物联网迁移学习系统,其中该人工标记模块还包括:
Figure BDA0001778647400000051
的方式迭代自己的半标签,其中
Figure BDA0001778647400000052
为样本数据xi在第t次迭代时的半标签值,SLi是xi初始状态的半标签值,ωj为和xi属于同一个优势能力群组的样本数据xj的权重,Cij∈(0,1)为xi和xj的高斯核距离占xi和同一优势能力群组内所有样本数据距离之和的比例。
与现有技术相比,本发明具有如下技术优势:
通过半标签和样本在学习者数据集合中的分布发现学习者感知节点的优势能力群组及样本,并提取其中的代表性样本要求标注,减少人工标注成本;
通过半监督方式标记典型样本,并通过迭代传播的方式修饰学习者感知节点数据集中样本的半标签,从而使其在优势能力模式上拥有超越教授节点的分类精度。
本发明的核心思想是在教授者和学习者感知节点同时部署的情况下,通过教授者实时识别与传输半标签的方式辅助学习者进行当前样本的标记工作。学习者在积攒了大量带有半标签标注的样本后在该数据集特征空间上进行优势能力群组及样本的查找,利用半标签的性质查找到在学习者数据集合中可以区分但教授者分类器无法区分的模式以及对应的样本所组成的群组。在明确优势能力群组及样本后,系统需要使用半监督的方式寻求人工辅助标记,为了减少人工标记的代价,系统提取每个优势能力群组的典型样本并要求人工标记。在获取人工标记的结果后,系统将在学习者数据集中为每个优势能力样本根据其初始状态的半标签向量值、周围样本的半标签值和拥有半监督标记的最相近典型样本的标记值进行半标签的修改,从而使每个样本半标签向量中真实标签的分量值升高,同时降低其他标签的分量值。在经过半标签的修饰后,系统将为每个样本赋予该样本半标签向量中最高分量所对应的标签值,从而获得修饰过标签的样本集。系统最终根据修饰过标签的样本集训练学习者模式识别模型,从而实现模式识别能力从教授者到学习者感知节点的迁移。
附图说明
图1为物联网迁移学习方法系统结构图;
图2为物联网迁移学习方法系统流程图;
图3为实施例系统结构;
图4为实施例流程图。
具体实施方式
本发明的核心内容在于物联网物端迁移的场景中,自动寻找并发现学习者特征域中相对于教授者感知节点的优势能力样本群组,并将它们进一步划分入若干优势能力群组,通过半监督的方式标记其中各优势能力群组的代表性样本,并据此对所有学习者样本数据集进行半标签的修饰,从而使学习者能够具体化其优势能力样本,进而在其优势能力的样本标签上拥有高于教授者识别能力的标记精度。通过此方法训练得到的学习者模式识别模型即可拥有区分教授者感知节点混淆模式的能力。
教授者节点的模式识别能力有限,对于样本集中的部分模式无法正确识别,会出现过拟合到数量较多的某种模式的问题,或出现对所混淆的模式子集产生类似随机猜测的问题。这使得在仅依赖已有物联网感知节点的当前系统中存在无法正确分辨所有类别的问题,故而系统通常需要加入新的感知节点,即学习者感知节点,来对教授者节点不能正确分类的全部或部分模式进行感知并期望新加入的感知节点能够区分教授者所混淆的模式。
学习者节点自身仅具有采集原始信号和提取特征的能力,学习者节点内没有模式识别模型,故而无法对当前的模式进行预测和判别。在系统中,学习者和教授者是同时运行的。
为了训练得到学习者的模式识别模型,教授者将自身对于当前模式分类结果所对应的半标签向量传递给学习者。其中分类结果即教授者分类器预测的当前样本的模式类型,半标签是根据教授者训练集中的历史数据,当某样本被分类为当前分类结果时,其真实标签为其他所有类别的概率。
学习者在采集自身数据的同时获取了当前样本的半标签数据,从而将该带半标签的样本保存在本地的带半标签的学习者数据集中。当学习者拥有足够的带半标签的学习者数据集后,可对其进行半标签和标签的修饰。
学习者收集的带半标签的数据集中包含了大量样本,但他们标记的精度受制于教授者,若使用该数据集直接进行模型的建立,则学习者精度将小于等于教授者精度。学习者由于其传感类型的特点以及其佩戴位置等特点,拥有区分训练者全部或部分混淆模式的能力,我们希望学习者在这些模式上能够拥有优于教授者精度的分类能力。故而需要在训练学习者模型(模式识别模型)之前修饰学习者数据集的半标签以及标签,以期达到更高的精度。
在修饰的过程中,系统计算并寻找学习者样本集中的优势能力样本,即教授者无法区分但学习者可以区分的样本集合。这些新样本集合利用自身的标签及半标签无法正确标记,需要人工辅助进行半监督的标记。为减少人工标注的工作量,系统将自动寻找优势能力群组中的典型样本并请求人工对其进行标注。
在获取人工标注的典型样本之后,系统将在学习者样本集合特征空间内综合某样本自身初始半标签值、周围类似模式样本的半标签值以及人工标注的典型样本标签值来对集合中各样本进行传播,迭代修饰每个样本集合中样本的标签。其中“人工标注的典型样本的标签值”是指,人手工对典型样本进行标记,该标记的值就为标签值,被标记的样本是该优势能力群组的典型样本。如:人手工对优势能力群组x中的样本a进行标记,标记为‘走路’类别,则‘走路’标签则为该样本的标签值,该标签值是该典型样本所属的模式种类。
经过迭代传播修饰后,系统为学习者数据集的每个样本赋予半标签中最高分量所对应的标签。最终系统可根据该修正过标签的数据集为学习者训练分类器,由于学习者训练集合中优势能力样本的标签经过半监督的纠正,故而该分类器在优势能力模式的识别上拥有高于教授者的精度。
具体来说,本发明提出一种拥有优势能力发现机制的半监督物联网迁移学习方法:
步骤1.将教授者和学习者节点同时部署在场景所监测的场景中,其中教授者拥有模式识别模型,而学习者无模式识别能力,二者同时开始数据采集和特征提取。其中,特征提取目的是将样本的原始信号值转化为机器可以运算的值。若不进行特征提取,则原始信号难以被机器学习模型利用。
步骤2.教授者利用自身传感器进行数据采集和特征提取,并利用自身拥有的分类模型对当前采集的数据进行模式识别,得到当前样本的分类结果,并计算该标签所对应的半标签向量,将当前的半标签向量发送给学习者感知节点,学习者接收到该半标签后将其与当前的数据进行时间对齐并存储,该时间对齐操作也叫半标签和数据的关联操作。步骤3.判断学习者的本地保存数据是否已经足够建立分类模型,此时出现两种情况:
情况1.已经充足,则进入步骤4进行进一步数据处理;
情况2.还未充足,则返回步骤1继续积累数据。
步骤4.当学习者积累了足够的带半标签的数据集后,可将样本根据其在学习者数据集合内的分布分成若干个拥有相近模式的群组,并寻找其中可被学习者区分但无法被教授者区分的样本群组,并称之为优势能力群组。特征空间是指特征向量所组成的n维空间,n为特征向量的维度,某样本可以理解为其在对应的特征空间中的一个数据点。特征空间的形成:特征空间在特征维度和每一维数据类型定义后便自动生成,无需额外操作。
步骤5.在各优势能力群组内寻找每个群组的典型代表点,并要求人工标记。典型代表点在本发明中是指优势能力群组的聚类中心点,该聚类中心点是所有该聚类中样本的平均模式,具有代表性和典型性。需要注意的是“点”即为一个样本,代表点等于代表样本或代表数据。优势能力群组是由很多样本组成的一个群组,该群组中有很多样本,即包含若干样本点,文中表述的每个节点或点或样本点都是一个样本数据。
步骤6.获得人工标记后,系统在学习者数据集合内对每个节点根据其初始的半标签值和周围节点的半标签值进行传播,利用迭代的方式修饰每个样本的半标签值。其中初始的半标签值是从教授者那里获得的。由于是在特征空间中进行聚类操作,所以分出来的群组中所有样本的模式是类似的,故而某群组的中心样本和周围样本拥有类似的分布模式。该模式是指每个样本的分布的相似性,比如两个走路的加速度计样本的相似性很高,它们在特征空间中的分布就会很近,但走路和跑步的加速度计样本的相似性很低,分布就会很远,聚类后走路的所有样本会在一个群组内,而走路和跑步的样本会在不同的群组内。此处“周围”是和距离相关的,距离是指特征空间中的距离。
步骤7.对各优势能力群组中的每个样本,系统将该样本半标签向量中的最大分量所对应的标签值作为其修饰后的标签,并据此更新数据集中样本的标签。
步骤8.学习者利用修饰过标签的数据集进行学习者感知节点模式识别模型的训练,由于经过以上步骤的训练集样本标签修饰,学习者感知节点在优势能力模式上的分类精度高于教授者节点,故而在据此训练出的学习者分类模型中这些优势能力的分类精度要高于教授者节点。
图1是本发明应用系统的结构图,该图为一个完整的物联网迁移学习系统,其中101为教授者感知节点的数据采集单元,其通过自身所载传感器对环境信息进行采集从而得到原始信号,原始数据被送入102单元进行进一步处理。102为特征提取单元,它可根据教授者感知节点内置的数据处理及特征提取算法为原始数据提取若干特征,形成当前环境数据的特征样本,该特征样本被送入103单元进行模式识别。103为模式识别单元,它可以利用内置的模式识别模型对读入的特征样本进行分类,得到当前特征样本的教授者识别标签,并将结果送入104单元生成半标签。104是半标签生成单元,该节点可以根据教授者训练集中的误识别经验得到当前标签所对应的半标签向量,并将其送入105。105是半标签数据传输单元,可以通过Wi-Fi、蓝牙或有线等方式对半标签数据进行传输。106为学习者的原始数据流,该数据流是通过学习者所载传感器对环境信息采集进而形成的原始数据流,学习者的原始数据流被送入107单元进行特征提取。107是学习者的特征提取单元,它可以根据学习者内置的数据处理和特征提取算法为原始数据集提取若干特征,形成学习者对于当前环境数据的特征样本,107单元提取出的特征种类和维度可以与102单元相同,也可以不同。108使半标签获取与数据关联单元,它可综合107单元传入的当前环境的数据样本以及105单元传入的当前环境的半标签数据标注,从而组合形成带半标签标注的当前环境数据样本,并保存到109单元中从而形成带半标签的学习者数据集。当109单元中的样本足够多时,系统将汇总后的带标签的学习者数据集送入110单元进行优势能力群组的寻找,110单元是优势能力群组及样本发现单元,可以根据学习者数据集合中样本的分布以及样本的半标签标记情况寻找到优势能力样本及群组,优势能力群组是指教授者无法识别但学习者可以区分的样本所组成的群组。在寻找到优势能力群组后,数据被送入111单元对各优势能力群组中的典型样本进行选择并要求人工对其进行半监督标记,在本步骤中寻找典型样本的好处是能够最小化人工标注的工作量,并有效对所有优势能力模式进行标记。含有半监督标记的样本集被送入112半标签修饰单元,在该单元中系统将根据每个样本的初始半标签分布、周围类似节点的半标签分布以及半监督标记的最相近模式的标记值对每个样本的半标签值进行修饰,从而使每个样本半标签中真实标记所对应分量的值增大并减小其他分量的值;在112单元的传播方法中,系统考虑半监督标记的样本值是因为该典型样本是经过人工监督标记的,可以看作拥有正确的标签,考虑周围相似点的半标签向量值是因为需要使类似模式的样本拥有类似的标签,而考虑该样本的初始化半标签是为了将教授者的决策结果纳入考量。113为标签赋予单元,其可根据经过修饰的每个样本的半标签值对每个样本的标签进行赋予更新。114单元是修饰过标签的数据集保存单元。115是学习者的模式识别模型训练单元,它可根据114单元中的带标签的数据集训练属于学习者的模式识别模型。
图2是本发明应用系统的流程图,其中从步骤301开始,教授者和学习者节点同时开始自身传感器原始数据采集,并同时开始特征提取工作。在步骤302中教授者节点利用自身的模式识别模型对当前样本进行分类,并根据分类的结果进行半标签的生成,半标签是一个与标签数量相等长度的向量,包含了教授者在训练集中当将某样本分类为当前标签时其真实标签为其他所有类别的概率,在半标签产生后教授者将其传递给学习者节点。学习者接收到来自教授者的当前样本的半标签向量,并将其和学习者采集到的当前样本进行关联。在步骤303中系统判断学习者采集到的数据量是否充足,若不充足则返回步骤301继续积累样本,若充足则进入步骤304对数据集在特征域上进行群组的划分,即将具有类似空间分布和物理意义的样本划分为一组。而后在步骤305中,系统对所有小群组进行遍历,计算它们的平均半标签值,选取其中具有类似平均半标签的群组作为新能力群组,并提取每个新能力群组中的典型样本。在步骤306中系统要求人工手动标记每个典型样本的标签,并为每个样本分配权重,而后在步骤307中遍历所有新能力群组中的样本,并对其半标签进行迭代式修正,以保证每个新能力群组中的样本可以在保留自身原始半标签特点的情况下,根据周围所有样本的半标签值进行趋同化修饰,周围样本中人工半监督标记的典型样本的权重最高。在步骤308中系统为每个样本选取其修饰后的半标签中最高分量对应的标签值作为修饰后的标签值并汇总成最终的修饰过标签的数据集,并基于修饰过标签的数据集建立分类模型。执行步骤如下:
步骤301.将教授者和学习者节点同时部署在场景所监测的场景中,其中教授者拥有模式识别模型,而学习者无模式识别能力,二者同时开始数据采集和特征提取。
步骤302.教授者对于当前采集到的样本进行模式识别,得出分类结果,并根据自身训练集中分类为当前分类结果的样本真实标签的概率得到当前样本的半标签值,之后将该数据发送给学习者节点,学习者在收到该半标签后将其与本身采集到的数据进行关联并存储。
步骤303.判断:数据集中的样本量已经足够,达到用户设定的样本需求值,此时出现两种情况:
情况1.样本量还未充足,则返回步骤301继续积攒数据。
情况2.样本量已经充足,则进入步骤304进行后续的数据处理。
步骤304.将学习者数据集中的样本根据其在特征空间内的分布分为若干个拥有相近模式的小群组。
步骤305.计算每个小群组的平均半标签值,并寻找两个或多个具有高于相似度阈值的小群组,将它们称作新能力小群组,其中相似度阈值由用户指定,并在每个新能力小群组中选取该小群组的代表性样本。
步骤306:对每个新能力小群组的代表性样本进行人工半监督标记,并对人工半监督标记样本分配以较高的权重,给予其他样本较低权重。
步骤307:用迭代传播的方式对每个新能力小群组中的样本的半标签值进行修饰,迭代时考虑样本自身初始的半标签值、周围样本的半标签值以及半监督标记的样本的半标签值;迭代直到相邻两次的迭代中每个新能力群组中的样本的半标签值均不变为止。
步骤308:对每个样本集中的样本分配标签,为每个样本分配修饰后的半标签向量中最大分量所对应的标签值作为其修饰后的标签,并根据修饰标签后的数据集训练学习者分类模型。
图3是本发明的一个具体实施例,本实施例释一个可以对运动识别进行识别的可穿戴物联网系统。
在该图3的物联网系统各种,包含两部分:一部分是作为教授者感知节点的智能鞋子202,它佩戴在用户的脚上;另一部分是作为学习者感知节点的智能手表201,它佩戴在用户的手腕部。在该物联网系统中,202智能鞋子节点拥有模式识别能力,可根据当前采集到的自身传感信息进行运动识别;201智能手表节点中没有模式识别模型,需要用本发明的物联网迁移学习方法来将202教授者节点的运动识别能力迁移过来。
值得注意的是,对于涉及上肢的运动,如举哑铃、吃饭、写字和打字等,202智能鞋子节点将无法对其进行有效识别,因为该种运动仅涉及上肢的动作,佩戴在脚部的智能鞋子节点对于这些类运动无法有效区分,换句话说,这些仅涉及上肢的运动模式对于智能鞋子节点来说是混淆的模式。这些仅涉及上肢的运动对于201智能手表学习者节点是可以区分的,因为它们在手部的运动上有较大的差异。我们希望201智能手表节点能够在学习到智能鞋子对于下肢运动识别能力的同时发挥其长处,识别智能鞋子无法区分但智能手表可以识别的上肢运动。201和202两部分可通过无线蓝牙进行数据传递。
202智能鞋子感知节点包括101、102、103、104和105五个部分,其中101为数据采集单元,即智能鞋子可采集自身内置的传感器数据,感知当前环境得到原始信号,并将其送入102单元进行进一步处理。102单元是特征提取单元,可对原始信号进行数据预处理以及特征提取操作,从而得到当前原始信号所对应的特征,形成一个无标签的样本并送入103单元进行模式识别。103是模式识别单元,该单元可以利用智能鞋子的模式识别模型对当前特征样本进行分类,将得到分类结果送入104单元计算半标签。104单元是半标签生成单元,本单元可以根据输入的模式识别结果以及智能鞋子训练集中的误分类经验生成当前样本的半标签向量,并送入105单元进行数据传输。105单元是半标签传输单元,该单元可以将接收到的当前样本的半标签通过无线或有线的方式传递给201智能手表感知节点的108单元进行样本数据与半标签的关联。
201智能手表感知节点包括13个部分,其中106为数据采集单元,即智能手表感知节点可以采集自身内部的传感器数据,感知当前环境从而得到原始信号,并送入107单元进行后续处理。107单元是特征提取单元,可对原始信号进行数据预处理以及特征提取操作,从而得到当前原始信号所对应的特征,形成一个无标签的样本并送入108单元。108单元是半标签接收与数据关联单元,本单元可以接收来自107单元计算出的无标签样本以及105单元传来的半标签向量,将两者关联成为带半标签的数据并存入109单元。109是带半标签的数据集单元,存储所有智能手表的带半标签的数据集。当109中数据充足时,系统进入110单元,该单元为优势能力群组及样本发现单元,该单元可根据数据集中样本的特征分布及半标签寻找到智能手表相对于智能鞋子的优势能力群组和样本,该单元可分成203和204两部分,其中203为数据集特征域聚类分组单元,可将数据集按照其特征域分布聚类成若干小群组,每个小群组内的样本具有类似的模式和物理意义;204为优势能力群组及样本发现单元,其可计算每个小群组的平均半标签,并遍历寻找平均半标签向量相似度高于阈值的两个或多个小群组,并将它们作为优势能力小群组,其中的阈值由用户设定。111为优势能力群组样本半监督标注单元,它包括205和206两个部分,其中205为优势能力群组典型样本提取单元,它能够提取每个优势能力群组的代表性样本点,如小群组的聚类中心点;206为典型样本半监督标记单元,它可以获取人工手动输入的代表性点的标记值。112为半标签修饰单元,它包括207和208两个部分,其中207为样本权重分配单元,可以为每个数据集中的样本点分配一个迭代传播中的权重,权重越大代表它在迭代中对于周围点的影响越大,因此,系统会分配给人工标记的代表性点更大的权重,而给其他未经半监督标记的样本点以较低的权重,这里的权重可以由用户设定;其中208为半标签迭代传播单元,该单元可以为数据集中的每个节点根据其初始状态的半标签值、周围节点半标签值进行半标签的修正,其中周围节点半标签的影响根据其权重以及与当前节点的距离而有所差异,本单元是一个迭代传播的过程,迭代传播能够防止样本群组偏向人工半监督赋予的标签出现过拟合现象。在经过半标签的迭代传播修饰后,数据集进入113节点。113节点是标签赋予单元,可以为每个样本赋予一个修饰后的标签,该标签是当前样本修饰后的半标签向量中最大分量所代表的标签值,经过标签赋予后数据被送入114进行存储。114是修饰过标签的数据集,里面包括了所有智能手表节点的原始数据集,其中智能手表节点的优势能力样本标签都已经被修饰。115是模式识别模型训练单元,可以根据114数据集建立模式识别模型,由于114数据集已经经过标签的修饰,其中优势能力群组和样本的标签已经被修饰过,故而建立在它上面的分类器对于智能手环的优势能力模式具有良好的分类精度。
在本发明的实施例中,智能鞋子和智能手表节点同时部署在用户的身上,经过时钟同步后二者可同时对当前场景的运动进行识别。智能鞋子通过101数据采集单元采集本身的加速度计信号以及压力传感器信号,并通过102对两种信号进行数据预处理以及特征提取,从而得到一个特征样本。特征样本传入103,103单元可以利用自身的模式识别模型对特征样本进行模式识别,从而得到智能鞋子对于当前环境信息的判别结果,比如当前结果为“走”。104为半标签生成单元,可根据智能鞋子的判别结果生成半标签,半标签中包含了智能鞋子在训练集中将某样本判别为该类别时真实的标签为其他所有标签的概率,比如当前“走”的半标签为sli=(0.1,0.2,0.2,0.5),它代表为在训练集合中当分类器将当前模式判别成“走”时,真实标签是“站”、“坐”、“吃”、“走”的概率分别是10%,20%,20%和50%,即半标签中包含了智能鞋子在训练集中的犯错的概率。在生成半标签后,105模块将当前的半标签发送给智能手表节点。在本实施例中一共有“站”、“坐”、“吃”、“走”四类标签,由于智能鞋子的佩戴位置限制,导致其无法分辨出“站”、“坐”和“吃”三个类别,因为在这三个运动中,用户的脚都会处于静止状态,放置角度也类似,且不会产生明显的运动差异。故而我们加入智能手表节点来辅助识别这三个混淆的模式,且希望通过智能鞋子将模式识别能力迁移过来,并用本发明的方法实现对“站”、“坐”和“吃”三种模式的识别。
在时钟同步后,智能手表节点通过106数据采集单元采集本身的加速度计信号,并通过107单元对信号进行数据预处理以及特征提取,从而得到一个智能手表的特征样本。特征样本传入108单元后,108单元将同步接收107传入的特征样本以及105同时发送过来的半标签数据,将它们合并成为带标签的特征数据,并存储在109数据集合中。
为了寻找到智能手表相对于智能鞋子的优势能力,即找到智能鞋子无法分清但智能手表可以分清的样本集合,203单元在109的数据集中进行聚类操作,将数据集中的所有样本根据其在智能手表特征空间中的分布特性聚类成为若干个小群组,即聚类产生的每个小群组内样本均具有类似的特征和物理意义。在各小群组中,由于智能手环在“站”、“坐”、“吃”的运动中具有较大的运动差异,如站姿一般手臂放在腿侧,坐姿手臂一般弯曲,而吃饭时手臂一般会端起且有幅度较大但不太规律的运动,所以这些动作的样本在智能手表特征空间中的分布具有同类聚拢,异类彼此独立的特点,故而在经过203的聚类操作后,相同运动模式的样本会聚拢成为一个小群组,而不同模式的群组之间是独立的。
聚类后的小群组信息被送入204单元进行优势能力群组的发现,在204单元中,系统将计算每个小群组的平均半标签值,平均半标签为该小群组内所有样本半标签值的算术平均值,然后在所有小群组中寻找平均半标签值的余弦相似度高于相似度阈值的两个或多个小群组,将它们标记为优势能力群组。通过204单元发现的优势能力群组间拥有类似的半标签,拥有类似的半标签代表他们在智能鞋子节点中无法被分开,而属于不同的小群组代表他们可以在智能手表节点中被分开。所以此时我们就可以将之前智能鞋子无法分辨的“站”、“坐”、“吃”三种运动模式所对应的样本在智能手表的特征空间中寻找出来。
在找到优势能力群组后,系统进入205单元,该单元可以提取每个优势能力群组中的典型样本,即聚类的中心点,后在206单元中要求用户对其进行手工半监督标记。得到手工标记的样本点的半标签中的相应标签值=1,其他标签分量=0.当用户完成对所有典型样本的标记后,系统在207样本权重分配单元中为每个样本分配一个权重,其中半监督标记的节点拥有较高的权重,这个权重值可以由用户设定,其他样本拥有较低的权重,权重越高则在后续的传播过程中该节点对于周围节点半标签值的影响越大,权重越小则传播中对周围节点半标签的影响越小。
在为每个样本分配了一个权重后,系统在208单元中使用迭代的方式修饰每个优势能力群组中样本的半标签,即对于每个优势能力群组中的样本xi,系统将以
Figure BDA0001778647400000161
的方式迭代自己的半标签,其中
Figure BDA0001778647400000162
为样本xi在第t次迭代时的半标签值,SLi是xi初始状态的半标签值,ωj为和xi属于同一个优势能力群组的样本xj的权重,Cij∈(0,1)为xi和xj的高斯核距离占xi和同一优势能力群组内所有样本距离之和的比例,若xi和xj的距离较近,则Cij较高,若xi和xj的距离较远,则Cij较低,xi和xj的高斯核距离的计算公式为
Figure BDA0001778647400000163
Figure BDA0001778647400000164
其中σ也是由用户制定的,σ过大会使两个空间分布较远的样本间的高斯距离过小,σ过小会使两个空间分布较近的样本间的高斯距离过大。经过迭代,同优势能力群组中的样本能够根据自己原始状态的半标签值、周围样本的半标签值,尤其是拥有较大权重的半监督标记的样本的半标签值来修改自身的半标签值。为了能让距离更近的样本拥有更高的影响,我们设置了Cij距离权重,为了能够加强半监督样本的影响,我们设置了ωj权重来凸显半监督标记样本的高可信度和高影响力。208单元的半标签修饰是使用迭代的方式进行的,系统会在每个样本的半标签值迭代前后无变化的情况下停止迭代。经过208的迭代式半标签修饰,在一个优势能力群组中的样本们会受到半监督标记样本的影响,从而使自己的半标签中对应的分量增加。但是该传播方法不会使优势能力群组中的样本过拟合到半监督标记的标签值上,传播方法会考虑到每个样本的初始状态和空间分布,位于边界区的具有较少本类特征且初始状态中本类标签分量小的样本在迭代修饰后其半标签仍能保存自身特性,不至于过拟合的使半监督标记的标签分量值过高,从而避免数据集过度修饰的问题。
在半标签迭代修饰后,数据被送入113单元进行标签赋予,系统将为每个样本分配一个修饰后的标签,该标签为当前样本修饰过的半标签中最高分量代表的标签。如样本xk修饰后的半标签值为(0.05,0.05,0.1,0.8),则113单元将以0.8对应的“走”标签作为其修饰后的标签。当系统对所有样本进行了标签赋予后,将修饰后的样本放入114单元。最终系统根据114中修饰过标签的数据集进行模式识别模型的训练,从而为智能手表训练一个模式识别模型,该分类器可以识别智能鞋子无法识别的“站”、“坐”和“吃”三个模式。
图4是本实施例的系统流程,下面是本实施例的执行过程:
步骤401:智能鞋子和智能手表同时采集自身的传感器,得到原始传感数据和并且提取特征得到当前的特征样本。
步骤402:智能鞋子节点对自身采集到的当前样本进行模式识别,得到当前运动的分类,并根据自身训练集中分类为当前结果的样本真实标签的概率得到当前样本的半标签值,之后智能鞋子将当前样本的半标签值发送给智能手表节点,智能手表节点收到半标签后将其与当前样本进行关联并存储。
步骤403:判断:数据集中的样本量已经足够,达到用户设定的样本需求值,此时出现两种情况:
情况1.样本量还未充足,则返回步骤401继续积攒数据。
情况2.样本量已经充足,则进入步骤404进行后续的数据处理。
步骤404:将智能手表数据集中的样本根据其在特征空间内的分布聚类成为若干个拥有相近模式的小群组。
步骤405:计算每个小群组的平均半标签值,并寻找两个或多个具有高于相似度阈值slt的小群组,将它们称作新能力小群组,其中相似度阈值slt由用户指定,并在每个新能力小群组中选取该小群组的代表性样本,即该群组的聚类中心点。
步骤406:对每个新能力小群组的代表性样本进行人工半监督标记,并对人工半监督标记样本分配以较高的权重N,给予其他样本较低权重1,其中N由用户指定。
步骤407:用迭代传播的方式对每个新能力小群组中的样本的半标签值进行修饰,修饰时使用
Figure BDA0001778647400000171
的规则,迭代直到相邻两次的迭代中每个新能力群组中的样本的半标签值均不变为止。
步骤408:对每个样本集中的样本分配标签,为每个样本分配修饰后的半标签向量中最大分量所对应的标签值作为其修饰后的标签,并根据修饰标签后的数据集训练智能手表的运动分类模型。
以下为与上述方法实施例对应的系统实施例,本实施方式可与上述实施方式互相配合实施。上述实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在上述实施方式中。
本发明还公开了一种物联网迁移学习系统,其中包括:
数据采集模块,用于将物联网中已有的感知节点作为教授者,并将新加入该物联网的感知节点作为学习者,其中该教授者拥有模式识别模型,该教授者和该学习者同时进行数据采集和特征提取;相当于图1中模块101、102、106、107。
数据存储模块,用于使该教授者根据该模式识别模型对其采集的当前数据进行模式识别,得到当前数据的分类结果,根据该教授者采集的历史数据,得到将该分类结果对应的半标签向量,该教授者将当前数据对应的半标签向量传递给该学习者,该学习者将该半标签向量与其采集的当前数据进行关联,得到样本数据并将其存储至学习者数据集合;相当于图1中模块103、104、105、108、109。
学习者数据集合划分模块,用于根据该学习者数据集合内样本数据的分布,将该学习者数据集合划分成多个样本群组,并寻找其中可被该学习者区分但无法被该教授者区分的样本群组,作为优势能力群组;相当于图1中模块110。
人工标记模块,人工标记该优势能力群组内典型样本的标签值,在该学习者数据集合内对每个样本数据根据其所在群组内人工标记的标签值、该样本初始的半标签值和周围样本数据的半标签值进行传播,利用迭代的方式修饰每个样本数据的半标签值;相当于图1中模块111、112。
标签值修饰模块,用于对该优势能力群组中每个样本数据,将该样本数据修饰后的半标签向量中最大分量所对应的标签值作为其最终修饰后的标签值;相当于图1中模块113。
分类模型建立模块,用于利用修饰过标签值的样本数据,训练得到该学习者的模式识别模型。相当于图1中模块114、115。
该物联网迁移学习系统,其中在调用该学习者数据集合划分模块之前还包括:调用判断模块,用于判断该学习者数据集合存储的数据量是否已经足够建立该学习者的模式识别模型,若是,则调用该学习者数据集合划分模块,否则调用该数据采集模块继续积累数据。
该物联网迁移学习系统,其中该典型样本为该优势能力群组聚类中心点。
该物联网迁移学习系统,其中该人工标记模块包括:人工手动标记每个典型样本的权重,并为每个样本群组中的除典型样本以外的样本数据分配权重,以迭代得到每个样本数据的半标签值。
该物联网迁移学习系统,其中该人工标记模块还包括:
Figure BDA0001778647400000181
的方式迭代自己的半标签,其中
Figure BDA0001778647400000182
为样本数据xi在第t次迭代时的半标签值,SLi是xi初始状态的半标签值,ωj为和xi属于同一个优势能力群组的样本数据xj的权重,Cij∈(0,1)为xi和xj的高斯核距离占xi和同一优势能力群组内所有样本数据距离之和的比例。

Claims (10)

1.一种物联网迁移学习方法,其特征在于,包括:
步骤1、将物联网中已有的感知节点作为教授者,并将新加入该物联网的感知节点作为学习者,其中该教授者拥有模式识别模型,该教授者和该学习者同时进行数据采集和特征提取;
步骤2、该教授者根据该模式识别模型对其采集的当前数据进行模式识别,得到当前数据的分类结果,根据该教授者采集的历史数据,得到将该分类结果对应的半标签向量,该教授者将该半标签向量传递给该学习者,该学习者将该半标签向量与其采集的当前数据进行关联,得到样本数据并将其存储至学习者数据集合;
步骤3、该学习者根据该学习者数据集合内样本数据的分布,将该学习者数据集合分成多个样本群组,并得到其中可被该学习者区分但无法被该教授者区分的样本群组,作为优势能力群组;
步骤4、人工标记该优势能力群组内典型样本的标签值,在该学习者数据集合内对每个样本数据根据其所在群组内的典型样本的人工标记的标签值、样本数据初始的半标签值和周围样本数据的半标签值进行传播,利用迭代的方式修饰每个样本数据的半标签值;
步骤5、对该优势能力群组中每个样本数据,将该样本数据修饰后的半标签向量中最大分量所对应的标签值作为其最终修饰后的标签值;
步骤6、利用修饰过标签值的样本数据,训练得到该学习者的模式识别模型;
其中步骤3包括:
计算每个样本群组的平均半标签,并遍历寻找平均半标签向量相似度高于阈值的两个或多个样本群组作为优势能力群组。
2.如权利要求1所述的物联网迁移学习方法,其特征在于,在执行该步骤3之前还包括:判断该学习者数据集合存储的数据量是否已经足够建立该学习者的模式识别模型,若是,则执行该步骤3,否则执行该步骤1继续积累数据。
3.如权利要求1所述的物联网迁移学习方法,其特征在于,该典型样本为该优势能力群组聚类中心点。
4.如权利要求1所述的物联网迁移学习方法,其特征在于,该步骤4包括:人工手动标记每个典型样本的权重,并为每个样本群组中的除典型样本以外的样本数据分配权重,以迭代得到每个样本数据的半标签值。
5.如权利要求4所述的物联网迁移学习方法,其特征在于,该步骤4还包括:
Figure FDA0002636143180000021
的方式迭代自己的半标签,其中
Figure FDA0002636143180000022
为样本数据xi在第t次迭代时的半标签值,SLi是xi初始状态的半标签值,ωj为和xi属于同一个优势能力群组的样本数据xj的权重,Cij∈(0,1)为xi和xj的高斯核距离占xi和同一优势能力群组内所有样本数据距离之和的比例。
6.一种物联网迁移学习系统,其特征在于,包括:
数据采集模块,用于将物联网中已有的感知节点作为教授者,并将新加入该物联网的感知节点作为学习者,其中该教授者拥有模式识别模型,该教授者和该学习者同时进行数据采集和特征提取;
数据存储模块,用于使该教授者根据该模式识别模型对其采集的当前数据进行模式识别,得到当前数据的分类结果,根据该教授者采集的历史数据,得到将该分类结果对应的半标签向量,该教授者将该半标签向量传递给该学习者,该学习者将该半标签向量与其采集的当前数据进行关联,得到样本数据并将其存储至学习者数据集合;
学习者数据集合划分模块,用于根据该学习者数据集合内样本数据的分布,将该学习者数据集合分成多个样本群组,并得到其中可被该学习者区分但无法被该教授者区分的样本群组,作为优势能力群组;
人工标记模块,人工标记该优势能力群组内典型样本的标签值,在该学习者数据集合内对每个样本数据根据所在群组内的典型样本的人工标记的标签值、样本数据初始的半标签值和周围样本数据的半标签值进行传播,利用迭代的方式修饰每个样本数据的半标签值;
标签值修饰模块,用于对该优势能力群组中每个样本数据,将该样本数据修饰后的半标签向量中最大分量所对应的标签值作为其最终修饰后的标签值;
分类模型建立模块,用于利用修饰过标签值的样本数据,训练得到该学习者的模式识别模型;
其中学习者数据集合划分模块包括:
计算每个样本群组的平均半标签,并遍历寻找平均半标签向量相似度高于阈值的两个或多个样本群组作为优势能力群组。
7.如权利要求6所述的物联网迁移学习系统,其特征在于,在调用该学习者数据集合划分模块之前还包括:调用判断模块,用于判断该学习者数据集合存储的数据量是否已经足够建立该学习者的模式识别模型,若是,则调用该学习者数据集合划分模块,否则调用该数据采集模块继续积累数据。
8.如权利要求6所述的物联网迁移学习系统,其特征在于,该典型样本为该优势能力群组聚类中心点。
9.如权利要求6所述的物联网迁移学习系统,其特征在于,该人工标记模块包括:人工手动标记每个典型样本的权重,并为每个样本群组中的除典型样本以外的样本数据分配权重,以迭代得到每个样本数据的半标签值。
10.如权利要求9所述的物联网迁移学习系统,其特征在于,该人工标记模块还包括:
Figure FDA0002636143180000031
的方式迭代自己的半标签,其中
Figure FDA0002636143180000032
为样本数据xi在第t次迭代时的半标签值,SLi是xi初始状态的半标签值,ωj为和xi属于同一个优势能力群组的样本数据xj的权重,Cij∈(0,1)为xi和xj的高斯核距离占xi和同一优势能力群组内所有样本数据距离之和的比例。
CN201810981425.3A 2018-08-27 2018-08-27 一种物联网迁移学习方法和系统 Active CN109272023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810981425.3A CN109272023B (zh) 2018-08-27 2018-08-27 一种物联网迁移学习方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810981425.3A CN109272023B (zh) 2018-08-27 2018-08-27 一种物联网迁移学习方法和系统

Publications (2)

Publication Number Publication Date
CN109272023A CN109272023A (zh) 2019-01-25
CN109272023B true CN109272023B (zh) 2021-04-27

Family

ID=65154548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810981425.3A Active CN109272023B (zh) 2018-08-27 2018-08-27 一种物联网迁移学习方法和系统

Country Status (1)

Country Link
CN (1) CN109272023B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113344119A (zh) * 2021-06-28 2021-09-03 南京邮电大学 工业物联网复杂环境下的小样本烟雾监测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295697A (zh) * 2016-08-10 2017-01-04 广东工业大学 一种基于半监督的迁移学习分类方法
WO2017055878A1 (en) * 2015-10-02 2017-04-06 Tractable Ltd. Semi-automatic labelling of datasets
CN107316049A (zh) * 2017-05-05 2017-11-03 华南理工大学 一种基于半监督自训练的迁移学习分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599922B (zh) * 2016-12-16 2021-08-24 中国科学院计算技术研究所 用于大规模数据标定的迁移学习方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017055878A1 (en) * 2015-10-02 2017-04-06 Tractable Ltd. Semi-automatic labelling of datasets
CN106295697A (zh) * 2016-08-10 2017-01-04 广东工业大学 一种基于半监督的迁移学习分类方法
CN107316049A (zh) * 2017-05-05 2017-11-03 华南理工大学 一种基于半监督自训练的迁移学习分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于主动学习的高光谱海冰图像分类;任静;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170215;全文 *

Also Published As

Publication number Publication date
CN109272023A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
Williams et al. Optimizing the use of biologgers for movement ecology research
Sun et al. Sequential human activity recognition based on deep convolutional network and extreme learning machine using wearable sensors
US11443557B2 (en) Monitoring and analyzing body language with machine learning, using artificial intelligence systems for improving interaction between humans, and humans and robots
He et al. Visual informatics tools for supporting large-scale collaborative wildlife monitoring with citizen scientists
Asim et al. Context-aware human activity recognition (CAHAR) in-the-Wild using smartphone accelerometer
CN110457999B (zh) 一种基于深度学习和svm的动物姿态行为估计与心情识别方法
US9639746B2 (en) Systems and methods of detecting body movements using globally generated multi-dimensional gesture data
CN104680046B (zh) 一种用户活动识别方法及装置
CN104915351B (zh) 图片排序方法及终端
CN110168530A (zh) 电子设备和操作该电子设备的方法
CN108683724A (zh) 一种智能儿童安全及步态健康监护系统
KR102517513B1 (ko) 인공지능 기반 수목 데이터 관리 시스템 및 수목 데이터 관리 방법
KR102045741B1 (ko) 반려동물 건강관리데이터 제공장치, 방법 및 프로그램
US11216766B2 (en) System and method for generalized skill assessment using activity data
KR20120132281A (ko) 골프 스윙 분석을 위한 신체 부위별 위치 추적 장치 및 방법
AU2020200338B2 (en) Image searching apparatus, classifier training method, and program
CN111434118B (zh) 用户感兴趣信息生成的装置和方法
Javeed et al. Body-worn hybrid-sensors based motion patterns detection via bag-of-features and Fuzzy logic optimization
CN112052746A (zh) 目标检测方法、装置、电子设备和可读存储介质
KR102331126B1 (ko) 연상 메모리와 결합된 모션 감지 장치를 이용해서 움직임을 식별하기 위한 시스템 및 방법
CN110909565B (zh) 图像识别和行人再识别方法及装置,电子和存储设备
JP2022511221A (ja) 画像処理方法、画像処理装置、プロセッサ、電子機器、記憶媒体及びコンピュータプログラム
EP2804130A1 (en) Identifications of individuals using multiple skeleton recording devices
CN110532838A (zh) 对象检测装置和方法及存储介质
CN109272023B (zh) 一种物联网迁移学习方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant