CN117496585A - 一种人体活动识别方法、系统及相关设备 - Google Patents

一种人体活动识别方法、系统及相关设备 Download PDF

Info

Publication number
CN117496585A
CN117496585A CN202210870433.7A CN202210870433A CN117496585A CN 117496585 A CN117496585 A CN 117496585A CN 202210870433 A CN202210870433 A CN 202210870433A CN 117496585 A CN117496585 A CN 117496585A
Authority
CN
China
Prior art keywords
data
activity recognition
human activity
feature
recognition model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210870433.7A
Other languages
English (en)
Inventor
李惠康
李世军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202210870433.7A priority Critical patent/CN117496585A/zh
Publication of CN117496585A publication Critical patent/CN117496585A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Biophysics (AREA)
  • Psychiatry (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Social Psychology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

一种人体活动识别方法、系统及相关设备。在该方法中,客户端可以获取到用户所处区域中的多个终端设备发送的多种类型的人体活动识别信号数据,客户端可以基于多种类型的人体活动识别信号数据进行人体活动识别,并得到人体活动识别结果。实施本申请提供的技术方案,可以提高人体活动识别的准确率,且无需单独部署用于人体活动识别的终端设备或传感器。

Description

一种人体活动识别方法、系统及相关设备
技术领域
本申请涉及终端及通信技术领域,尤其涉及一种人体活动识别方法、系统及相关设备。
背景技术
人体活动识别(human activity recognition,HAR)技术是从一系列有关人体活动和环境状况的观测数据中识别出用户当前所进行的一个或多个活动。人体活动识别技术在智能家居、安全监控、影音娱乐、人机交互、体育锻炼、日常监护、医疗健康等众多领域具有广泛的应用前景。
但是,当前的人体活动识别技术不能高效精准地识别出用户当前正在进行的活动。由此,如何高效精准地对用户进行人体活动识别,是亟待解决的问题。
发明内容
本申请提供了一种人体活动识别方法、系统及相关设备,实施本申请实施例提供的人体活动识别方法,终端设备可以更为高效精准地对目标用户进行人体活动识别。
第一方面,本申请提供了一种人体活动识别系统,该人体活动识别系统包括第一设备、第二设备、第三设备以及第四设备,第一设备与第三设备建立有通信连接,第二设备与第三设备建立有通信连接,第三设备与第四设备建立有通信连接;
第一设备用于向所述第三设备发送第一数据,第一设备与第一目标用户的距离小于第一阈值;
第二设备用于向第三设备发送第二数据,第二数据的数据类型与第一数据的数据类型不相同,第二设备与第一目标用户的距离小于第二阈值;
第四设备用于向所述第三设备发送第一人体活动识别模型;
第三设备用于接收第一数据和第二数据,以及第四设备发送的第一人体活动识别模型;
第三设备用于,基于第一数据、第二数据和第一人体活动识别模型,确定出第一目标用户所进行的人体活动。
在一种可能的实现方式中,第一阈值可以是第一设备能够发送或者接收第一数据的最大距离值。第二阈值可以是第二设备能够发送或接收第一数据的最大距离值。
这样,通过第一方面中提供的人体活动识别系统,用户可以通过目标用户所处区域中的多个设备采集不同类型的数据进行人体活动识别,这样,无需用户专门部署传感器或者用于人体活动识别的设备,使得人体活动识别更为便捷,且节约用户成本。另外,通过多种类型的数据进行人体活动识别,可以提高人体活动识别的准确率。这样,不会因为一种数据在传输的过程衰减、多径或者噪声干扰而导致人体活动识别结果不准确。
结合第一方面,在一种可能的实现方式中,第三设备用于:对第一数据和第二数据进行去噪处理,得到第三数据和第四数据,第一数据包括第一残差分量和多个第一模式子函数,第三数据包括第一残差分量和多个第一模型子函数中在有效频率上的k1个第一模式子函数,第二数据包括第二残差分量和多个第二模式子函数,第四数据包括第二残差分量和多个第二模式子函数中在有效频率上的k2个第二模式子函数,第三数据中的噪声信息少于第一数据中的噪声信息,第四数据中的噪声信息少于第二数据中的噪声信息;基于第三数据和第四数据,以及第一人体活动识别模型,确定出第一目标用户所进行的人体活动。
这样,可以减少数据中的噪声信息,保留数据中与人体活动识别相关的部分,提高人体活动识别的准确率。
结合第一方面,在一种可能的实现方式中,第三设备用于:将第三数据输入到第一特征提取模型,得到第三数据对应的第一特征,将第四数据输入到第二特征提取模型,得到第四数据对应的第二特征;将第一特征和第二特征进行融合,得到第三特征;将第三特征输入到第一人体活动识别模型,得到所第一目标用户所进行的人体活动。
这样,根据多种类型的数据的融合特征进行人体活动识别,可以提高人体活动识别的准确率。
结合第一方面,在一种可能的实现方式中,第三设备用于:确定第一特征在特定维度不同模式的第一质量评分和第二特征在特定维度不同模式的第二质量评分;基于第一质量评分将不同模式的第一特征进行加权累加,得到第三特征,基于第二质量评分将不同模式的第二特征进行加权累加,得到第四特征;确定第三特征的第三质量评分和第四特征的第四质量评分;基于第三质量评分和第四质量评分将第三特征和第四特征进行加权累加,得到第五特征;将第五特征输入到第一人体识别模型,得到第一目标用户所进行的人体活动。
这样,基于数据的质量评分确定数据对应的特征在融合特征中所占的权重,可以提高人体活动识别的准确率。
结合第一方面,在一种可能的实现方式中,第三设备用于:基于获取到的训练数据对第一人体活动识别模型进行训练,得到第二人体活动识别模型,第二人体活动识别模型的识别准确率高于第一人体活动识别模型的识别准确率将第五特征输入到第二人体活动识别模型,得到第一目标用户所进行的人体活动。
其中,训练数据包括用户的历史数据,该历史数据可以包括历史采集的人体活动识别信号数据,以及该人体活动识别信号数据对应的真实的目标用户的人体活动。该历史数据也可以包括历史采集的人体活动识别信号数据,以及基于该信号数据创建的合成人体活动识别信号数据。
这样,根据第三设备中的训练数据训练从第四设备获取到的人体活动识别模型,得到更为精准的人体活动识别模型,可以提高人体活动识别的准确率。
结合第一方面,在一种可能的实现方式中,人体活动识别系统还包括第五设备,第五设备与第三设备建立有通信连接;
所述第五设备用于向所述第三设备发送第五数据,其中,所述第五数据的数据类型与所述第一数据的数据类型、所述第二数据的数据类型不相同,所述第五设备与所述目标用户的距离小于所述第三阈值;
第四设备用于向第三设备发送第三人体活动识别模型,第三人体活动识别模型的输入数据为第一数据、第二数据和第五数据对应的特征融合后的特征,输出数据为人体活动识别结果;
第三设备用于接收第一数据、第二数据和第五数据,以及第三人体活动识别模型;
第三设备用于,基于第一数据、第二数据、第五数据和第三人体活动识别模型,确定出第一目标用户所进行的人体活动。
可以理解的是,第三阈值可以是第五设备能够发送或接收第五数据的最大距离值。
这样,第三设备可以基于数据的种类获取到不同的人体活动识别模型进行人体活动识别。
结合第一方面,在一种可能的实现方式中,第三设备还用于:确定第五设备与目标用户的距离大于第三阈值;查询提供第五数据的、且与第一目标用户的距离小于第三阈值的第六设备,第六设备与第三设备建立有通信连接;通知第六设备向第三设备发送采集到的第五数据。
这样,第三设备可以基于第一目标用户周围的设备动态的选择能够提供用于人体活动识别的数据的设备。这样,不会因为某个设备突然不能提供数据而导致无法进行人体活动识别。
可选地,结合第一方面,在一种可能的实现方式中,人体活动识别系统还包括网络中心节点设备,第三设备、第一设备、第二设备、第五设备以及第六设备均与网络中心节点设备建立通信连接,第三设备用于确定第五设备与目标设备的距离大于第三距离,向网络中心节点设备查询提供第五数据、且与第一目标用户的距离小于第三距离的第六设备;网络中心节点设备通知第六设备与第三设备建立通信连接;第三设备用于通知第六设备向所述第三设备发送采集的第五数据。
这样,第三设备可以通过网络中心节点设备获知到组网中的其他设备的动态,例如,其他设备的上线、下线,以便于第三设备可以及时调整人体活动识别系统中用于采集数据的设备。
结合第一方面,在一种可能的实现方式中,人体活动识别系统还包括第七设备、第八设备、第九设备,第七设备与第四设备建立有通信连接,第八设备与第七设备建立有通信连接,第九设备与第七设备建立有通信连接;
第八设备用于向第七设备发送第八数据,第八设备与第二目标用户的距离小于第四阈值;
第九设备用于向第七设备发送第九数据,第九数据的数据类型与第八数据的数据类型不相同,第九设备与第二目标用户的距离小于第五阈值;
第四设备用于向第七设备发送第四人体活动识别模型,第四人体活动识别模型与第一人体活动识别模型不相同;
第七设备用于接收第八数据和第九数据,以及第四人体活动识别模型;
第七设备用于,基于第八数据、第九数据和第四人体活动识别模型,确定出第二目标用户所进行的人体活动。
其中,第四设备可以是服务器或云服务器。其中,第四阈值可以是第八设备能够发送或接收第八数据的最大距离值。第五阈值可以是第九设备能够发送或接收第九数据的最大距离值。
这样,可以基于不同的用户需求,可以从服务器或云服务器中下载到不同的人体活动识别模型,满足用户个性化的需求。
其中,第一数据、第二数据、第五数据、第八数据、第九数据可以包括无线信号数据以及声音信号数据等等人体活动识别信号数据。
第二方面,提供一种人体活动识别方法,该方法可以包括:第三设备接收到第一设备发送的第一数据和第二设备发送的第二数据,以及第四设备发送的第一人体活动识别模型,其中,第一设备与第三设备建立有通信连接,第二设备与第三设备建立有通信连接,第三设备与第四设备建立有通信连接,第一数据的数据类型与第二数据的数据类型不相同,第一设备与第一目标用户的距离小于第一阈值,第二设备与第一目标用户的距离小于第二阈值;第三设备基于第一数据、第二数据和第一人体活动识别模型,确定出第一目标用户所进行的人体活动。
在一种可能的实现方式中,第一阈值可以是第一设备能够发送或者接收第一数据的最大距离值。第二阈值可以是第二设备能够发送或接收第一数据的最大距离值。
这样,通过第二方面中提供的人体活动识别方法,用户可以通过目标用户所处区域中的多个设备采集不同类型的数据进行人体活动识别,这样,无需用户专门部署传感器或者用于人体活动识别的设备,使得人体活动识别更为便捷,且节约用户成本。另外,通过多种类型的数据进行人体活动识别,可以提高人体活动识别的准确率。这样,不会因为一种数据在传输的过程衰减、多径或者噪声干扰而导致人体活动识别结果不准确。
结合第二方面,在一种可能的实现方式中,第三设备基于第一数据、第二数据和第一人体活动识别模型,确定出第一目标用户所进行的人体活动,包括:第三设备对第一数据和第二数据进行去噪处理,得到第三数据和第四数据,第一数据包括第一残差分量和多个第一模式子函数,第三数据包括第一残差分量和多个第一模型子函数中在有效频率上的k1个第一模式子函数,第二数据包括第二残差分量和多个第二模式子函数,第四数据包括第二残差分量和多个第二模式子函数中在有效频率上的k2个第二模式子函数,第三数据中的噪声信息少于第一数据中的噪声信息,第四数据中的噪声信息少于第二数据中的噪声信息;第三设备基于第三数据和第四数据,以及第一人体活动识别模型,确定出第一目标用户所进行的人体活动。
这样,可以减少数据中的噪声信息,保留数据中与人体活动识别相关的部分,提高人体活动识别的准确率。
结合第二方面,在一种可能的实现方式中,第三设备基于第三数据和第四数据,以及述第一人体活动识别模型,确定出第一目标用户所进行的人体活动,包括:
第三设备将第三数据输入到第一特征提取模型,得到第三数据对应的第一特征,将第四数据输入到第二特征提取模型,得到第四数据对应的第二特征;
第三设备将第一特征和第二特征进行融合,得到第三特征;
第三设备将第三特征输入到第一人体活动识别模型,得到第一目标用户所进行的人体活动。
这样,根据多种类型的数据的融合特征进行人体活动识别,可以提高人体活动识别的准确率。
结合第二方面,在一种可能的实现方式中,第三设备将第一特征和第二特征进行融合,得到第三特征,包括:
第三设备第一特征在特定维度不同模式的第一质量评分和第二特征在特定维度不同模式的第二质量评分;第三设备基于第一质量评分将不同模式的第一特征进行加权累加,得到第三特征,基于第二质量评分将不同模式的第二特征进行加权累加,得到第四特征;第三设备确定第三特征的第三质量评分和第四特征的第四质量评分;第三设备基于第三质量评分和第四质量评分将第三特征和第四特征进行加权累加,得到第五特征;第三设备将第五特征输入到第一人体识别模型,得到第一目标用户所进行的人体活动。这样,基于数据的质量评分确定数据对应的特征在融合特征中所占的权重,可以提高人体活动识别的准确率。
结合第二方面,在一种可能的实现方式中,第三设备将第三特征输入到第一人体活动识别模型,得到第一目标用户所进行的人体活动,包括:第三设备基于获取到的训练数据对第一人体活动识别模型进行训练,得到第二人体活动识别模型,第二人体活动识别模型的识别准确率高于第一人体活动识别模型的识别准确率;第三设备将所述第五特征输入到第二人体活动识别模型,得到第一目标用户所进行的人体活动。
其中,训练数据包括用户的历史数据,该历史数据可以包括历史采集的人体活动识别信号数据,以及该人体活动识别信号数据对应的真实的目标用户的人体活动。该历史数据也可以包括历史采集的人体活动信号数据,以及基于该信号数据创建的合成人体活动识别信号数据。
这样,根据第三设备中的训练数据训练从第四设备获取到的人体活动识别模型,得到更为精准的人体活动识别模型,可以提高人体活动识别的准确率。
结合第二方面,在一种可能的实现方式中,第三设备接收到第一设备发送的第一数据、第二设备发送的第二数据和第五设备发送的第五数据,以及第四设备发送的第三人体活动识别模型,其中,第五设备与第三设备建立有通信连接,第五数据的数据类型与第一数据的数据类型、第二数据的数据类型不相同,第五设备与目标用户的距离小于第三阈值;第三设备基于第一数据、第二数据、第五数据和第三人体活动识别模型,确定出第一目标用户所进行的人体活动。
可以理解的是,第三阈值可以是第五设备能够发送或接收第五数据的最大距离值。
这样,第三设备可以基于数据的种类获取到不同的人体活动识别模型进行人体活动识别。
结合第二方面,在一种可能的实现方式中,第三设备确定第五设备与第一目标用户的距离大于第三阈值,查询提供第五数据的、且与目标用户的距离小于第三阈值的第六设备,第六设备与第三设备建立有通信连接;第三设备通知第六设备向第三设备发送采集到的第五数据。
这样,第三设备可以基于第一目标用户周围的设备动态的选择能够提供用于人体活动识别的数据的设备。这样,不会因为某个设备突然不能提供数据而导致无法进行人体活动识别。
可选地,结合第二方面,在一种可能的实现方式中,第三设备通过网络中心节点设备确定第五设备与目标设备的距离大于第三距离,向网络中心节点设备查询提供第五数据、且与第一目标用户的距离小于第三距离的第六设备;网络中心节点设备通知第六设备与第三设备建立通信连接;第三设备用于通知第六设备向所述第三设备发送采集的第五数据,其中,第三设备、第一设备、第二设备、第五设备以及第六设备均与网络中心节点设备建立通信连接。
其中,第一数据、第二数据、第五数据可以包括无线信号数据以及声音信号数据等等人体活动识别信号数据。
第三方面,本申请提供了一种终端设备,包括一个或多个处理器、一个或多个存储器和收发器。收发器、该一个或多个存储器与一个或多个处理器耦合,一个或多个存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,当一个或多个处理器执行计算机指令时,使得终端设备执行上述第二方面中任一项可能的实现方式中的方法。
第四方面,本申请提供了一种计算机存储介质,包括计算机指令,当计算机指令在计算机上运行时,使得计算机执行上述第二方面任一项可能的实现方式中的方法。
第五方面,本申请提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述第二方面任一项可能的实现方式中的方法。
第六方面,本申请提供了一种芯片或芯片系统,应用于终端设备,包括处理电路和接口电路,接口电路用于接收代码指令并传输至所述处理电路,处理电路用于运行所述代码指令以执行上述第二方面任一项可能的实现方式中的方法。
附图说明
图1是本申请实施例提供的摄像采集设备示意图;
图2A是本申请实施例提供的摄像采集设备采集到的图像序列中的一种图像示意图;
图2B是本申请实施例提供的摄像采集设备采集到的图像序列中的另一种图像示意图;
图2C是本申请实施例提供的摄像采集设备采集到的图像序列中的又一种图像示意图;
图3是本申请实施例提供的基于传感器数据的人体活动识别场景示意图;
图4是本申请实施例提供的一种人体活动识别系统架构图;
图5是本申请实施例提供的一种人体活动识别的具体实现步骤示意图;
图6是本申请实施例提供的一种人体活动识别方法流程示意图;
图7A是本申请实施例提供的用户界面示意图;
图7B是本申请实施例提供的用户界面示意图;
图7C是本申请实施例提供的多种类型的信号数据通过不同特征提取模型进行特征提取与融合,得到全局特征的示意图;
图7D是本申请实施例提供的一种对抗学习模型架构示意图;
图8是本申请实施例提供的多种客户端从服务端获取不同的人体活动识别模型的场景示意图;
图9是本申请实施例提供的一种人体活动识别场景示意图;
图10是本申请实施例提供的又一种人体活动识别场景示意图;
图11是本申请实施例提供的终端设备的结构示意图;
图12是本申请实施例提供的一种装置的结构示意图。
具体实施方式
本申请以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括复数表达形式,除非其上下文中明确地有相反指示。还应当理解,本申请中使用的术语“和/或”是指并包含一个或多个所列出项目的任何或所有可能组合。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
人体活动识别可以反映出用户的人体活动状态与生理信息,可以为人们的日常生活和工作提供各种便捷的服务。例如,在医疗健康领域中,由于一些疾病与人体的某些运动或功能变化有关(例如,帕金森病、创伤复苏等与人体活动有关)。人体活动识别能够认知病人特定的动作规律(包括运动轨迹、动作幅度及动作频率),为疾病康复提供指导。
此外,人体活动识别能够挖掘人体正常状态的模式和规律。当人体状态出现异常时,通过人体活动识别可以捕捉到人体的异常状态,这样,可以及时采取相应措施预防疾病发生。在体育锻炼领域,人体活动识别能够追踪用户的运动时间、强度与当前身体机能,为用户提供健康方面的报告与建议,制定适当的锻炼计划。在智能家居领域,用户可以通过手势或动作直接控制智能终端,同时智能终端可以通过行为特征对用户进行识别,进而为不同用户匹配不同的工作模式,提升产品体验和生活质量。
在一些可行的实施例中,提供一种基于视频或图像进行人体活动识别的方法。具体地,用户可以通过摄像采集设备(例如,摄像头,照相机等等)采集场景中的视频或图像序列,然后通过终端设备(例如,手机、电脑、平板等等)分析并识别所采集的视频或图像序列中的人体行为。示例性地,用户可以通过图1中的摄像头101、以及摄像头102持续的采集场景中的视频或图像序列。示例性地,摄像采集设备采集到的图像序列可以如图2A-图2C所示。图2A为摄像采集设备采集到的图像序列中的一张图像。图2B为摄像采集设备采集到的图像序列中的另一张图像。图2C为摄像采集设备采集到的图像序列中的又一张图像。终端设备可以获取到摄像采集设备采集到的图像序列,并识别出图像序列中的人体行为。
但是,由于场景中部署的摄像采集设备数量有限,位置固定,并不能采集到场景中每个位置处的人体图像。并且,在图像采集过程中,光线、摄像采集设备的视角与安装位置、以及场景中的障碍物遮挡等,都会对最后的人体活动识别结果的有效性和准确性造成影响。
另外,通过摄像采集设备采集场景中的图像序列进行人体活动识别,摄像采集设备采集到的图像序列可能会泄露用户所处环境、身份特征、生活状况等等个人隐私信息。
在一些可行的实施例中,提供一种基于传感器数据的人体活动识别。示例性地,如图3所示,用户可以携带可穿戴传感器301、可穿戴传感器302、可穿戴传感器303以及可穿戴传感器304。可穿戴传感器301、可穿戴传感器302、可穿戴传感器303、以及可穿戴传感器304可以是一个独立的传感器(例如,加速度传感器、陀螺仪传感器、气压传感器等等),也可以是嵌入在可穿戴设备(例如,手表、手机、耳机、手环等)中的传感器。可穿戴设备可以通过可穿戴传感器采集到的数据,识别出用户的人体活动。
但是,通过可穿戴传感器采集的数据进行人体活动识别,用户需要携带多个可穿戴传感器,这样,会对用户正常的出行活动造成不便。并且,可穿戴传感器只能反映放置该可穿戴传感器的身体部位的活动情况,例如,放置在用户腿部的加速度传感器无法感知用户的手部运动,这样,无法准确地识别用户的人体活动。
在一些可行的实施例中,提供一种基于射频信号的人体识别方法,该方法可以包括:终端设备可以接收经用户人体反射后的人体活动识别信号(例如,Wi-Fi信号、毫米波信号、超声波信号等等),并确定接收到的人体活动识别信号的模式和特征;然后基于人体活动识别信号的特征检测用户的人体活动。但是,单一设备产生的人体活动识别信号会由于信号衰减、噪声和多径干扰等因素,使得终端设备基于该人体活动识别信号得到人体活动识别结果的准确率受到影响。
为了提高人体活动识别的准确率,并且用户无需携带大量的便携式传感器、以及在人体活动识别时,不泄露用户个人隐私信息,本申请实施例提供了一种人体活动识别系统。示例性地,如图4所示,本申请实施例提供的人体活动识别系统40可以包括一个或多个服务端400、多个客户端、以及多个终端设备。其中:
一个或多个服务端400可以与多个客户端建立有通信连接。多个客户端可以与多个终端设备建立有通信连接。具体地,如图4所示,服务端400可以与客户端401、客户端402、客户端403均建立有通信连接。客户端401可以与手机404、音箱405、路由器406建立有通信连接。客户端402可以与平板407、麦克风408、路由器409建立有通信连接。客户端403可以与电脑410、智能电灯411、路由器412建立有通信连接。本申请实施例中设备之间建立通信的连接方式包括但不限于:无线保真(wireless fidelity,Wi-Fi)、蓝牙、分布式软总线等等。例如,客户端401可以通过Wi-Fi、蓝牙或分布式软总线等任一种方式分别与手机404、音箱405以及路由器406建立通信连接。本申请实施例对设备之间具体建立通信连接的方式不作限定。
服务端400可以是服务器(也可以称为传统物理服务器)、云服务器等等。本申请实施例对此不作限定。
服务端400可以包括模型下发模块4000、模型汇聚模块4001、参数接收模块4002以及加密&解密模块4003等等。模型下发模块4000可以用于向多个客户端发送模型(例如,特征提取模型,人体活动识别模型等等)。模型汇聚模块4001可以用于将多个模型汇聚成一个模型。例如,可以将多个客户端上传的模型1,模型2,模型3汇聚成模型0。模型1的输入可以是数据1,输出是人体活动识别结果。模型2的输入是数据2,输出是人体活动识别结果。模型3的输入可以是数据3,输出是人体活动识别结果。模型0的输入可以是数据1、数据2和数据3,输出是人体活动识别结果。模型汇聚模块4001还可以用于将多个客户端发送的模型参数进行聚合,更新服务端400中存储的全局模型。参数接收模块4002用于接收多个客户端发送的模型参数。加密&解密模块4003可以用于对服务端与客户端的交互信息进行加密或者解密。例如,加密&解密模块4003可以对发送给客户端的数据进行加密,对收到客户端发送的数据进行解密。
可以理解的是,服务端400可以包括更多或更少的功能模块,本申请实施例对服务端400中包含的功能模块不作限定。
多个客户端中可以包括客户端401、客户端402以及客户端403。本申请以人体活动识别系统40中包含3个客户端为例进行说明,可以理解的是,本申请实施例中的人体活动识别系统40可以包含更多或更少的客户端,本申请实施例对人体活动识别系统40中包含的客户端的数量不作限定。
客户端401中可以包括性能监测模块4010、自动调参模块4011、边缘计算引擎模块4012。其中,性能监测模块4010可以用于监测客户端401中的模型(例如,人体活动识别模型)的性能。自动调参模块4011用于调整客户端401中的模型的参数,例如,调整人体活动识别模型的参数、以及调整模型训练和更新过程中产生或涉及的参数。边缘计算引擎模块4012用于计算模型参数、对获取到的数据提取特征、以及基于提取到的特征得到人体活动识别结果等等。可以理解的是,本申请实施例中客户端401可以包含更多或更少的功能模块,本申请实施例对此不作限定。
客户端402中可以包括性能监测模块4020、自动调参模块4021、边缘计算引擎模块4022。其中,性能监测模块4020可以用于检测客户端402中的模型(例如,人体活动识别模型)的性能。自动调参模块4021用于调整客户端402中的模型的参数,例如,调整人体活动识别模型的参数、以及调整模型训练和更新过程中产生或涉及的参数。边缘计算引擎模块4022用于计算模型参数、对获取到的数据提取特征、以及基于提取到的特征得到人体活动识别结果等等。可以理解的是,本申请实施例中客户端402可以包含更多或更少的功能模块,本申请实施例对此不作限定。
客户端403中可以包括性能监测模块4030、自动调参模块4031、边缘计算引擎模块4032。其中,性能监测模块4030可以用于监测客户端403中的模型(例如,人体活动识别模型)的性能。自动调参模块4031用于调整客户端403中的模型的参数,例如,调整人体活动识别模型的参数、以及调整模型训练和更新过程中产生或涉及的参数。边缘计算引擎模块4032用于计算模型参数、对获取到的数据提取特征、以及基于提取到的特征得到人体活动识别结果等等。可以理解的是,本申请实施例中客户端403可以包含更多或更少的功能模块,本申请实施例对此不作限定。
多个终端设可以包括手机404、音箱405、路由器406、平板407、麦克风408、路由器409、电脑410、智能电灯411、路由器412。可以理解的是,本申请实施例以人体活动识别系统40中包括手机404、音箱405、路由器406、平板407、麦克风408、路由器409、电脑410、智能电灯411、路由器412等多个终端为例进行说明。本申请实施例中的人体活动识别系统40中可以包括更多或更少的终端设备,本申请实施例对人体活动识别系统中包含的终端设备的数量以及类型不作限定。
需要说明的是,多个终端设备是用户所在的场所中已存在的终端的设备。例如,用户的家庭住宅中存在的终端设备、或者用户的办公场所中已存在的终端设备。
手机404可以将采集的数据发送给客户端401,也可以接收到客户端401发送的控制指令。例如,手机404可以将采集的加速度数据、无线射频信号、声波信号等等人体活动识别信号上传给客户端401,客户端401可以基于手机404上传的加速度数据、以及无线信号、声波信号等等人体活动识别信号进行人体活动识别,并得到人体活动识别结果。客户端401可以向手机404发送采集加速度数据、无线信号、声波信号等人体活动识别信号的指令。
在一些实施例中,手机404可以是客户端401。可以理解的是,在一些场景中,当多个终端设备建立有通信连接,组建成人体活动识别系统时,多个终端设备中设备能力(例如,计算能力、存储能力、通信能力、电量、是否连接电源等等)最强的终端设备可以作为客户端。
客户端401也可以是除手机404之外的具备计算能力、存储能力、通信能力以及电量充足的终端设备,例如,手机、笔记本电脑、台式电脑、平板、智慧屏等等,本申请实施例对此不作限定。
音箱405可以向其他终端设备发送声音信号,以及向客户端401发送声波信号,也可以基于客户端401下发的指令,向客户端发送声波信号。
可选地,在一些实施例中,音箱405可以与手机404建立有通信连接。音箱405可以通过手机404向客户端401发送声波信号。
可选地,在另一些实施例中,音箱405可以发送声波信号。手机404接收到音箱405发送的声波信号、以及经用户反射后的声波信号。手机404可以将接收到的音箱405发送的声波信号、以及经用户反射后的声波信号发送给客户端401。
路由器406可以向客户端401发送无线射频信号(例如,Wi-Fi信号、蓝牙信号、超宽带(ultrawideband,UWB)信号等等),可以接收客户端发送的指令,并基于该指令向客户端401发送无线射频信号。
在一些实施例中,路由器406可以发送无线射频信号(例如,Wi-Fi信号、蓝牙信号、超宽带(ultrawideband,UWB)信号等等)。手机404可以接收到路由器406发射的无线射频信号、以及经用户反射后的无线射频信号。手机404可以将接收到的路由器406发射的无线射频信号、以及经用户反射后的无线射频信号发送给客户端401。
在一些实施例中,客户端401可以将手机404发送的加速度数据、以及音箱405发送的声波信号、路由器406发送的无线射频信号进行数据处理后,输入到人体活动识别模型中,得到用户的人体活动识别结果。具体地,可以参考下文中的描述,此处先不赘述。
可以理解的是,本申请实施例中提供的人体活动识别方法中,客户端可以利用终端设备之间发送和接收的一些无线射频信号、声波信号里提取和估算的属性信息进行人体活动识别。例如,无线射频信号、声波信号等人体活动识别信号里提取和估算的属性信息可以包括由接收到的Wi-Fi数据包里估算实时的无线保真信道状态信息(wireless fidelitychannel state information,Wi-Fi CSI),由接收到的声波信号里估算的声波的频移,由接收到的光信号里估算光子载波脉冲幅度和相位。客户端可以对无线射频信号、声波信号等人体活动识别信号里提取和估算的属性信息进行预处理、去噪和特征提取等。本申请实施例对从无线射频信号、声波信号等人体活动识别信号里提取和估算的属性信息的种类不作限定。
平板407可以将采集的数据(例如,加速度数据,无线信号数据(例如,Wi-Fi CSI、光信号等等)、声波信号等人体活动识别信号)发送给客户端402。客户端402可以基于平板407发送的数据进行人体活动识别。平板407也可以接收到客户端402发送的控制指令,该控制指令可以用于指示平板407采集数据的采集频率和数据的传输速度等等。
在一些实施例中,平板407可以是客户端402。可以理解的是,平板407、麦克风408以及路由器409等多个设备中设备能力最强的终端设备可以作为客户端402。
客户端402可以是除平板407之外的具备计算能力、存储能力、通信能力以及电量充足(即电池电量高于预设阈值)的终端设备,例如,手机、笔记本电脑、台式电脑、平板、智慧屏等等,本申请实施例对此不作限定。
麦克风408可以向客户端402发送声波信号,也可以基于客户端402下发的指令,向客户端发送声波信号。
可选地,在一些实施例中,麦克风408可以与平板407建立有通信连接。麦克风408可以通过平板407向客户端发送声波信号。
可选地,在一些实施例中,麦克风408可以发送声波信号。平板407可以接收到麦克风408发送的声波信号、以及经用户反射后的声波信号。平板407可以将接收到的麦克风408发送的声波信号、以及经用户反射后的声波信号发送给客户端402。
路由器409可以向客户端402发送无线射频信号(例如,Wi-Fi信号、蓝牙信号、UWB信号等等),可以接收客户端发送的指令,并基于该指令向客户端402发送无线射频信号。
在一些实施例中,路由器409可以发送无线射频信号。平板407可以接收到路由器409发射的无线射频信号、以及经用户反射后的无线射频信号。平板407可以将接收到的路由器409发射的无线射频信号、以及经用户反射后的无线射频信号发送给客户端402。
在一些实施例中,客户端402可以将平板407发送的加速度数据、无线信号数据,以及麦克风408发送的声波信号、以及路由器409发送的无线射频信号进行数据处理后,输入到人体活动识别模型中,得到用户的人体活动识别结果。具体可以参考下文中的描述,此处不再赘述。
电脑410可以将采集的数据(例如,加速度数据,无线信号数据(例如,Wi-Fi CSI、光信号等等)、声波信号等人体活动识别信号)发送给客户端403。客户端403可以基于电脑410发送的数据进行人体活动识别。电脑410也可以接收到客户端403发送的控制指令,该控制指令可以用于指示电脑410采集数据的采集频率和数据的传输速度等等。
可选地,在一些实施例中,电脑410可以连接一个或多个光电二极管模块、一个或多个光敏二极管等用于接收并探测光信号的模块。
在一些实施例中,电脑410可以是客户端403。可以理解的是,电脑410、智能电灯411、路由器412等多个终端设备中设备能力最强的终端设备可以作为客户端403。
客户端403也可以是除电脑410之外的具备计算能力、存储能力以及电量充足(即电池电量高于预设阈值)的终端设备,例如,手机、笔记本电脑、台式电脑、平板等等,本申请实施例对此不作限定。
智能电灯411可以向客户端403发送光信号,也可以基于客户端403下发的指令,向客户端发送光信号。
可选地,在一些实施例中,智能电灯411可以与电脑410建立有通信连接。智能电灯408可以通过电脑410向客户端403发送光强度、环境亮度或者光信道信息。
可选地,在另一些实施例中,智能电灯411可以发送光信号。电脑410可以接收到智能电灯411发送的光信号、以及经用户反射后的光信号。电脑410可以基于接收到的智能电灯411发送的光信号、以及经用户发射后的光信号检测出光强度、环境亮度或光信道信息。电脑401可以将光强度、环境亮度或光信道信息发送给客户端403。
路由器412可以向客户端403发送无线射频信号(例如,例如,Wi-Fi信号、蓝牙信号、UWB信号等等),可以接收客户端发送的指令,并基于该指令向客户端403发送Wi-FiCSI。
在一些实施例中,路由器412可以发送无线射频信号。电脑410可以接收到路由器412发射的无线射频信号、以及经用户反射后的无线射频信号。电脑410可以将接收到的路由器412发射的无线射频信号、以及经用户反射后的无线射频信号,并从无线射频信号,例如Wi-Fi信号中提取出Wi-Fi CSI,然后,将该Wi-Fi CSI发送给客户端403。
在一些实施例中,客户端403可以将电脑410发送的加速度数据、以及智能电灯411发送的光信号、路由器412发送的无线射频信号进行数据处理后,输入到人体活动识别模型中,得到用户的人体活动识别结果。具体地,可以参考下文中的描述,此处先不赘述。
可以理解的是,客户端401中可以存储有人体活动识别模型10。该人体活动识别模型10的输入数据可以为手机404采集的加速度数据、无线射频信号数据、音箱405发送的声波信号、以及路由器406发送的无线射频信号数据中提取的一个或多个属性信息。这里,各个终端设备采集的数据的属性信息可以包括但不限于加速度变化频率、信号强度、信号到达时间、信号频移、光信道信息、信道状态等等。该人体活动识别模型10的输出可以是用户的人体活动识别结果,例如,用户在跳舞、行走、拖地、举哑铃、在写字、坐着、擦桌子、跑步等等。该人体活动识别模型10可以是客户端401从服务端400中下载得到的,也可以是客户端401基于从服务端400中下载的人体活动识别模型11训练得到。
可选地,该人体活动识别模型10也可以是由客户端401基于客户端401中存储的历史数据训练得到。该历史数据中包括人体活动识别模型10的输入数据以及输入数据对应的合成数据。该历史数据还可以包括人体活动识别模型10的输入数据以及输入数据对应的实际的人体活动识别结果。
可选地,客户端401也可以将训练得到人体活动识别模型10上传至服务端400。
可以理解的是,客户端402中可以存储有人体活动识别模型20。该人体活动识别模型20的输入数据可以为平板407采集的加速度数据、无线信号数据、麦克风408发送的声波信号、路由器409发送的无线信号数据。该人体活动识别模型20的输出可以是用户的人体活动识别结果,例如,用户在跳舞、行走、拖地、举哑铃、在写字、坐着、擦桌子、跑步等等。该人体活动识别模型20可以是客户端401从服务端400中下载得到的,也可以是客户端401基于从服务端400中下载的人体活动识别模型22训练得到。
可选地,该人体活动识别模型20也可以是由客户端402基于客户端402中存储的历史数据训练得到。该历史数据中包括人体活动识别模型20的输入数据以及输入数据对应的输出数据。
可选地,客户端402也可以将训练得到人体活动识别模型20上传至服务端400。
可以理解的是,客户端403中可以存储有人体活动识别模型30。该人体活动识别模型30的输入数据可以为电脑410采集的加速度数据、无线射频信号数据、智能电灯发送的光信号、以及路由器412发送的无线射频信号数据中提取出的一个或多个属性信息。这里,各个终端设备采集的数据的属性信息可以包括但不限于加速度变化频率、信号强度、信号到达时间、信号频移、光信道信息、信道状态等等。该人体活动识别模型30的输出可以是用户的人体活动识别结果,例如,用户在跳舞、行走、拖地、举哑铃等等。该人体活动识别模型30可以是客户端403从服务端400中下载得到的,也可以是客户端403基于从服务端400中下载的人体活动识别模型30训练得到。
可选地,该人体活动识别模型30也可以是由客户端403基于客户端403中存储的历史数据训练得到。该历史数据中包括人体活动识别模型30的输入数据以及输入数据对应的合成数据。该历史数据还可以包括人体活动识别模型10的输入数据以及输入数据对应的实际的人体活动识别结果。
可选地,客户端403也可以将训练得到人体活动识别模型30上传至服务端400。
服务端400也可以基于多个客户端上传的数据训练得到人体活动识别模型,也可以基于多个客户端上传的人体活动识别模型,整合得到新的人体活动识别模型。服务端400也可以接收到多个客户端上传的参数,并基于多个客户端上传的参数更新服务端400中的人体活动识别模型。
可选地,客户端401可以基于人体活动识别性能(如准确率)、多个终端设备采集的数据质量、通信情况以及多个终端的运行状态,实时切换向客户端401提供数据的终端设备,以及动态调整终端设备的采集频率和采集数量。
可选地,客户端402可以基于人体活动识别性能、多个终端设备采集的数据质量以及多个终端的设备状况,实时切换向客户端402提供数据的终端设备,以及动态调整终端设备的采集频率和采集数量。
可选地,客户端403可以基于人体活动识别性能、多个终端设备采集的数据质量以及多个终端的设备状况,实时切换向客户端403提供数据的终端设备,以及动态调整终端设备的采集频率和采集数量。
在本申请实施例提供的人体活动识别系统中,部署在用户所处区域周围的各个终端设备(例如,智能手机、平板、智慧屏、音箱、路由器、智能电灯、光电二极管等等)可以发送和接收无线射频信号、声波信号以及光信号。多个终端设备可以周期性地采集数据,并将采集到的数据发送具有较多存储资源和计算资源的客户端,例如家庭存储中心、全屋智能主机、电脑等等。客户端可以从服务端获取到初始化的人体活动识别模型、或者人体活动识别模型的参数。客户端可以利用多个终端设备采集的数据、以及初始化的人体活动识别模型进行训练,得到更新后的人体活动识别模型以及人体活动识别模型的相关参数。客户端可以将该相关参数上传到服务端。服务端可以接收到多个客户端上传的相关参数,并聚合多个客户端上传的相关参数后,利用该相关参数更新初始化的人体活动识别模型。服务端可以将更新后的人体活动识别模型的相关参数发送给所有客户端。这样,重复迭代多次,直至人体活动识别模型收敛。此外,客户端中的功能模块,例如性能检测模块以及自动调参模块可以优化人体识别模型在不同应用场景和区域中的识别性能。另外,基于多个终端设备的运行状态、数据采集质量以及人体活动识别需求,客户端可以向多个终端设备发送控制消息,通过该控制消息选择切换采集数据的终端设备、唤醒终端设备、与终端设备建立连接、调整多个终端设备的采样频率以及数据处理的方式等等。
通过本申请实施例提供的人体活动识别系统,用户可以通过用户所在的场景中的已存在的多个终端设备提供的多种形式的数据(例如,路由器和平板的Wi-FiCSI数据,扬声器和麦克风的声音频移数据、以及电灯的光线强度和亮度等等)进行人体活动识别。这样,可以利用多种类型的数据进行人体活动识别,可以提法人体活动识别的准确率。并且,也无需重新部署一些终端设备用来进行人体活动识别。用户也不需要携带多种传感器就能实现人体活动识别。这样,也可以提高用户体验。
下面将阐述客户端基于多个终端设备采集的数据进行人体活动识别的具体过程。
如图5所示,图5示例性地示出了客户端基于多个终端设备采集的数据进行人体活动识别的具体过程。图5中以客户端为电脑为例,多个终端设备为智能电灯、路由器、扬声器为例进行说明。
如图5所示,人体活动识别可以包括数据采集、数据预处理、特征提取、人体活动识别等步骤。其中:
数据采集即为多个终端设备(例如,图5中示出的智能电灯502、路由器503、扬声器504)进行信号交互,以及信号接收端从接收到的信号中检测和估算相关的指标/属性数据(如CSI、RSSI、到达时间、频移、脉冲位置等)并将估算的指标/属性数据发送给客户端(即图5中示出的电脑501)。
如图5所示,电脑501可以获取信号S1’,信号S2’,以及信号S3’。其中,该信号S1’由智能电灯502发送的信号S1(例如,光信号)经人体反射后得到。该信号S2’由路由器503发送的信号S2(例如,Wi-Fi信号)经人体反射后得到。该信号S3’由扬声器504发送的信号S3(例如,声音信号或声波信号)经人体反射后得到。
基于接收到的多种类型信号,电脑501检测和估算相关的指标/属性数据,如CSI、RSSI、到达时间、频移、脉冲位置等。示例性地,电脑501对信号S1’进行检测后得到指标/属性数据S11’,电脑501对信号S2’进行检测后得到指标/属性数据S22’,电脑501对信号S3’进行检测后得到指标/属性数据S33’。
这里,当客户端位于终端设备的信号覆盖范围内时,也可以由终端设备直接发送通信信号给客户端。
另外,对于光信号的采集和检测,除了利用经人体反射的光信号,还可以利用人体的遮挡对光线亮度和强度的变化作为一种采集的光信号数据。
电脑501可以对获取到的数据进行数据预处理,例如,电脑501对获取到的数据进行去噪,转换,分割以及分发中的一项或多项。示例性地,电脑501对信号S1’进行数据预处理后的可以得到信号S11。电脑501对信号S2’进行数据预处理后可以得到信号S22。电脑501对信号S3’进行数据预处理后可以得到信号S33。关于电脑501具体如何对获取到的数据进行数据预处理可以参考下文中的描述,此处先不赘述。
电脑501可以对预处理后的数据进行特征提取。具体地,如图5所示,电脑501可以将信号S11输入到特征提取模型1中。该特征提取模型1对信号S11进行特征提取后,输出特征F1。电脑501可以将信号S22输入到特征提取模型2中。该特征提取模型2对信号S22进行特征提取后,输出特征F2。电脑501可以将信号S33输入到特征提取模型3中。该特征提取模型3对信号S33进行特征提取后,输出特征F3。
可选地,电脑501可以将提取出的多个特征进行融合,得到融合后的特征。示例性地,如图5所示,电脑501可以将特征F1、特征F2以及特征F3进行特征融合,得到融合后的特征F0。
电脑501可以基于提取到的特征进行人体活动识别。示例性地,如图5所示,电脑501可以将提取到的特征(例如特征F0)输入到人体活动识别模型中,得到人体活动识别结果,例如,跳舞、跑步、举哑铃等等人体活动识别结果。
可以理解的是,图5中示出的电脑501可以是图4中示出的客户端401,也可以是客户端402,还可以是客户端403。电脑501中的特征提取模型1,特征提取模型2以及特征提取模型3可以是从图4中示出的服务端400中下载的。电脑501中的人体活动识别模型也可以是从图4中示出的服务端400中下载的。
基于上述人体活动识别系统40以及人体活动识别具体过程的介绍,下面将结合附图介绍本申请实施例提供的一种人体活动识别方法。
图6示例性地示出了本申请实施例提供的一种人体活动识别方法流程图。如图6所示,本申请实施例提供的人体活动识别方法包括如下步骤:
S601a、终端设备600与终端设备603建立通信连接。
S601b、终端设备601与终端设备603建立通信连接。
S601c、终端设备602与终端设备603建立通信连接。
S601d、服务器604与终端设备603建立通信连接。
终端设备603可以分别与终端设备600、终端设备601、终端设备602、服务器604建立通信连接。终端设备603可以通过Wi-Fi、蓝牙、分布式软总线等等网络连接方式中任一种与终端设备600、终端设备601、终端设备602以及服务器604建立通信连接。可以理解的是,本申请实施例对终端设备603与终端设备600、终端设备601、终端设备602、服务器604建立通信连接的具体方式不作限定。
可以理解的是,终端设备600、终端设备601、终端设备602也可以与信号覆盖范围内的其他终端设备(如终端设备600’,终端设备601’,终端设备603’等等)进行通信,以给其他终端设备发送信号数据,或接收其他终端设备发送的信号数据。
可以理解的是,本申请实施例中,服务器604可以是传统物理服务器或云服务器。终端设备603可以是具有良好计算能力和存储能力的终端设备,例如,家庭网络中心设备、家庭存储中心设备、全屋智能主机设备、电脑、智慧屏、手机等等。终端设备600、终端设备601、终端设备602可以是能够发出或接收人体活动识别信号数据的设备,例如,发出声波信号数据的扬声器、发出光信号数据的智能电灯、发出Wi-Fi信号数据的路由器、接收声波信号数据的麦克风、接收光信号数据的光电二极管模块、接收Wi-Fi信号数据的平板等等。可以理解的是,本申请实施例对终端设备600、终端设备601、终端设备602、终端设备603以及服务器604具体的设备类型不作限定。
在本申请实施例中,终端设备600、终端设备601以及终端设备602能够产生不同种类的人体活动识别信号数据。
示例性地,终端设备603可以是上述图4中的客户端401、客户端402、客户端403中的任一个。服务器604可以是上述图4中的服务端400。终端设备600、终端设备601、终端设备602可以分别是上述图4中的手机404、音箱405、路由器406;或者可以是分别是上述图4中的平板407、麦克风408、路由器409;或者可以分别是上述图4中的电脑410、智能电灯411、路由器412。可以理解的是,本申请实施例对终端设备603与终端设备600、终端设备601、终端设备602以及服务器604建立通信连接的先后顺序不作限定。即本申请实施例对上述步骤S601a、步骤S601b、步骤S601c、步骤S601d的执行顺序不作限定。
可选地,终端设备603具有发现能够建立通信连接的终端设备的能力,例如,终端设备603可以发现所处场所中与终端设备603登录相同账号的终端设备,并与该终端设备建立通信连接。
可选地,用户可以在终端设备603中选定需要向终端设备603发送数据的设备,以及发送数据的类型,频率和数量等等。用户还可以在终端设备603中设置人体活动识别结果的类型(或称为类别)。例如,用户可以在终端设备603中设置人体活动识别结果的类型包括走路,跑步,跳跃,站立。用户还可以在终端设备603中设置人体活动识别结果的类型包括跳舞、练瑜伽、拳击、举杠铃等等。可以理解的是,本申请实施例对用户设置的人体活动识别结果的类型不作限制。
具体地,终端设备603中安装有人体活动识别APP(或控件)。用户可以通过终端设备603中的人体活动识别APP选择发现连接一个或多个终端设备来采集数据。用户还可以在人体活动识别APP的用户界面中对已连接的用于采集数据的终端设备进行设置,例如,设置该终端设备发送或接收数据的频率,或者设置该终端设备断开连接。用户还可以在该人体活动识别APP的用户界面中设置人体活动识别类别,以及每个人体活动识别类别对应的识别准确率需求等等。终端设备603还可以将用户设置的相关信息发送给多个终端设备和服务器。从而使得服务器可以给终端设备603发送合适的人体活动识别模型,以及使得终端设备调整采集数据的频率等等。
示例性地,以终端设备603是手机700为例进行阐述说明。图7A示例性地示出了手机700的用户界面701。如图7A所示,该用户界面701可以包括状态栏702、日历指示符703、天气指示符704、具有常用应用程序图标的托盘707、以及其他应用程序图标705。其中:
状态栏702可以包括:移动通信信号的一个或多个信号强度指示符、运营商名称(例如“中国移动”)、Wi-Fi信号的一个或多个信号强度指示符,电池状态指示符、时间指示符。
用户界面701还可包括页面指示符706。其他应用程序图标可分布在多个页面,页面指示符706可用于指示用户当前查看的是哪一个页面中的应用程序。用户可以左右滑动其他应用程序图标的区域,来查看其他页面中的应用程序图标。
如图7A所示,用户可以点击其他应用程序图标705中的人体活动识别应用程序的图标,响应于该用户操作,手机700可以显示用户界面708。
图7B示例性地示出了手机700的用户界面708。如图7B所示,该用户界面708可以包括设置栏709、设置栏710以及设置栏711。其中:
如图7B所示,设置栏709可以用于设置本机的登录账号、本机的名称等相关信息。
如图7B所示,设置栏710可以用于设置手机700所在的人体活动识别系统中用于数据采集的设备。例如,用户可以在该设置栏710中选择连接一个或多个可采集数据(或者称为提供人体活动识别相关数据的终端设备)。用户还可以在该设置栏710中设置已连接的数据采集设备的采集参数,例如,采集数据的频率。用户还可以将已连接的数据采集设备断开连接。
如图7B所示,设置栏711可以用于设置人体活动识别类别,例如,工作、学习、生活、娱乐、体育等等类别。用户可以在该设置栏711中删除已设置的人体活动识别类别,例如,用户可以通过控件711e删除已设置的人体活动识别类别“工作”。
可选地,用户还可以在该用户界面708中设置每种类别的人体活动识别的准确率需求。例如,如图7B所示,用户可以通过控件711a将类别为“工作”的人体活动识别准确率需求设置为“高”。用户可以通过控件711b将类别为“工作”的人体活动识别准确率需求设置为“中”。用户可以通过控件711c将类别为“工作”的人体活动识别准确率需求设置为“低”。
如图7B所示,用户可以通过控件711d新增更多类别。
可以理解的是,上述图7A、图7B示出的用户界面仅为示例。本申请实施例涉及的人体活动识别APP的用户界面中可以包含更多或更少的界面元素,本申请实施例对此不作限定。
在本申请实施例中,终端设备600可以称为第一设备,终端设备601可以称为第二设备。终端设备602可以称为第五设备,终端设备603可以称为第三设备,服务器604可以称为第四设备。
S602a、终端设备600向终端设备603发送数据data1。
S602b、终端设备601向终端设备603发送数据data2。
S602c、终端设备602向终端设备603发送数据data3。
S602d、服务器604向终端设备603发送特征提取模型A、特征提取模型B、特征提取模型C、人体活动识别模型M1。
终端设备603可以接收到终端设备600发送的数据data1,可以接收到终端设备601发送的数据data2,以及可以接收到终端设备602发送的数据data3。数据data1的数据类型、数据data2的数据类型、以及数据data3的数据类型均不相同。即数据data1的数据类型与数据data2的数据类型不相同。数据data1的数据类型与数据data3的数据类型不相同。数据data2与数据data3的数据类型也不相同。数据data1的数据类型为第一类型。数据data2的数据类型为第二类型,数据data3的数据类型为第三类型。第一类型与第二类型、第三类型均不相同。
示例性地,数据data1可以是Wi-Fi信号数据。数据data2可以是超声波信号数据。数据data3可以是可见光信号数据。
可以理解的是,本申请实施例对数据data1、数据data2以及数据data3具体是何种类型的数据不作限定。
在本申请实施例中,数据data1可以称为第一数据,数据data2可以称为第二数据,data3可以称为第五数据。人体活动识别模型M1可以称为第一人体活动识别模型。
可以理解的是,用户所处区域的终端设备(例如,终端设备600、终端设备601、终端设备602)发送的人体活动识别信号数据(如Wi-Fi信号数据、超声波信号数据、可见光信号数据等等)在被用户人体反射后会被相应的接收设备(例如,终端设备603)收到。在用户进行活动的过程中,一些终端设备在持续地发送人体活动识别信号数据,相应的接收设备也可以持续地接收人体活动识别信号数据。终端设备600、终端设备601、终端设备602可以持续地向终端设备603发送人体活动识别信号数据。终端设备600、终端设备601、终端设备602向终端设备603的人体活动识别信号数据可以是终端设备600、终端设备601、终端设备602从其他终端设备采集到的,也可以是终端设备600、终端设备601、终端设备602中产生的数据,本申请实施例对此不作限定。
可以理解的是,以终端设备600发送的数据data1为例进行阐述说明。终端设备600发送的数据data1可以是终端设备600从其他终端采集到的数据,也可以是终端设备600中产生的数据,本申请实施例对此不作限定。例如,若终端设备601可以发射Wi-Fi信号,终端设备603可以接收到Wi-Fi信号。终端设备601发送的每一个数据包可以占用30个子载波,而每个子载波可能对应不同的CSI值。当终端设备603采用1000Hz的采样频率时,终端设备603一秒钟可以收集到30*1000=30000个CSI值。那么终端设备601向终端设备603发送的数据data1可以是Wi-Fi数据包。又例如,终端设备600可以是手机,终端设备603可以是家庭存储中心设备。用户的手机可以接收到用户所处区域中路由器发送的Wi-Fi数据包,用户的手机可以从接收到的Wi-Fi数据包中获取多个CSI值。然后,手机可以将获取到的CSI值发送给家庭存储中心设备。
终端设备603还可以接收到服务器604发送的特征提取模型A、特征提取模型B、特征提取模型C、人体活动识别模型M1。
特征提取模型A的输入可以是第一类型的数据,输出可以是第一类型的数据的特征。特征提取模型B的输入可以是第二类型的数据,输出可以是第二类型的数据的特征。特征提取模型C的输入可以是第三类型的数据,输出可以是第三类型的数据的特征。人体活动识别模型M1的输入可以是第一类型的数据的特征,第二类型的数据的特征,以及第三类型的数据的特征,输出可以是第一类型的数据的特征,第二类型的数据的特征,以及第三类型的数据的特征共同表征的用户进行的人体活动。
可选地,服务器604可以向终端设备603发送特征提取模型D和人体活动识别模型M2。该特征提取模型D的输入可以是第一类型的数据,第二类型的数据,以及第三类型的数据,输出可以是特征FD。该特征FD可以用于表征第一类型的数据的特征和第二类型的数据的特征以及第三类型的数据的特征。人体活动识别模型M2的输入可以是特征FD,输出可以是特征FD表征的用户进行的人体活动。
S603、终端设备603对数据data1进行预处理得到数据data11,对数据data2进行预处理得到数据data22,对数据data3进行预处理得到数据data33。
终端设备603可以将接收的数据data1进行滤波降噪处理和时频域转换操作,然后将连续的信号分割成不重叠的片段,最后得到data11。终端设备603可以将接收的数据data2进行滤波降噪处理和时频域转换操作,然后将连续的信号分割成不重叠的片段,最后得到data22。终端设备603可以将接收的数据data3进行滤波降噪处理和时频域转换操作,然后将连续的信号分割成不重叠的片段,最后得到data33。
由于无线传输固有特性(例如,信号散射、环境衰弱、多径等)、终端设备中通信硬件(例如,通信硬件不稳定的发射功率及频率)和环境电磁信号的影响,终端设备603获取到的原始人体活动识别信号数据(例如,数据data1、数据data2、数据data3)中含有干扰和噪声信息。终端设备603需要滤掉原始人体活动识别信号数据中的干扰和噪声信息等与人体活动识别无关的部分。
在一些可行的实现方式中,终端设备603可以使用固定截断频率的去噪方法,例如,低通滤波和带通滤波方法。
可选地,在另一些可行的实现方式中,终端设备603可以使用基于数据驱动模式的去噪方法,即基于原始人体活动识别信号数据本身特征动态过滤收集数据中的不相关部分。例如,以原始人体活动识别信号数据为CSI数据为例进行阐述。
终端设备603可以将获取到的每个Wi-Fi子载波上的CSI数据Ai(t)分解为一系列模式子函数MSFn(t)和残差分量r(t):
上述公式(1)中,Ai(t)表示每个Wi-Fi子载波上的CSI数据,r(t)为每个Wi-Fi子载波上的CSI数据的残差分量,表示每个Wi-Fi子载波上的CSI数据的多个模式子函数。
为了保留CSI数据中与人体活动相关的部分,终端设备603可以选取CSI数据的多个模式子函数中的部分模式子函数,得到去噪后的CSI数据。具体如下公式所示:
上述公式(2)中,表示选取原始CSI数据中有效频率上最后的k个模式子函数后的CSI数据,即为去噪后的CSI数据,1kσ。
对于去噪后的人体活动识别信号数据,终端设备603可以采用特定时间长度的滑动窗口或预设幅度阈值对该去噪后的人体活动识别信号数据进行分割,得到预处理后的人体活动识别信号数据。其中,预处理后的人体活动识别信号数据可以包含多组样本数据,预处理分割后的每个窗口内的信号数据对应一组样本数据。
S604、终端设备603将数据11输入到特征提取模型A,得到特征F11;将数据22输入到特征提取模型B,得到特征F22;将数据data33输入到特征提取模型C,得到特征F33。
终端设备603可以对预处理后的人体活动识别信号数据进行特征提取,得到人体活动识别信号数据对应的特征。
在一种可能的实现方式中,终端设备603可以利用不同的特征提取模型对不同类型的数据进行特征提取,得到每个类型的数据对应的特征。示例性地,终端设备603可以将数据11输入到特征提取模型A,得到特征F11;将数据22输入到特征提取模型B,得到特征F22;将数据data33输入到特征提取模型C,得到特征F33。
可选地,在一种可能的实现方式中,终端设备603可以通过相同或不同特征提取模型对不同类型的数据进行特征提取,得到全局特征。示例性地,多类型数据的特征提取模型可以包括两个模块,单特征表示模块以及分层加权组合模块。其中,当利用不同的特征提取模型对不同类型的数据进行特征提取时,单特征表示模块用于生成每种类型的数据在各个子信道上的特征向量。分层加权组合模块用于将每种类型的数据在各个子信道上的特征向量组合成一个综合特征向量。分层加权组合模块将进一步组合每种类型数据的综合特征向量,生成一个全局的特征向量。当通过一个特征提取模型对不同类型的数据进行特征提取时,特征表示模块用于生成每种类型的数据在所有子信道上的一个综合特征向量。分层加权组合模块用于组合每种类型数据的综合特征向量,生成一个全局的特征向量。
示例性地,图7C示例性地示出了本申请实施例提供的多种类型的信号数据通过不同特征提取模型进行特征提取与融合,得到全局特征的示意图。如图7C所示,数据S1可以通过特征提取模型CNN1进行特征提取,得到多个维度上的特征向量H1。然后,特征提取模型可以从多个维度上的特征向量H1中提取出各个子信道上的质量评分,例如质量评分q1。然后分层加权组合模块可以基于各个子信道上的特征向量对应的质量评分进行加权累加,将数据S1在各个子信道上的特征向量组合成一个综合特征向量X1
同样地,如图7C所示,数据S2可以通过特征提取模型CNN2进行特征提取,得到多个维度上的特征向量H2。然后,特征提取模型可以从多个维度上的特征向量H2中提取出各个子信道上的质量评分,例如质量评分q2。然后分层加权组合模块可以基于各个子信道上的特征向量对应的质量评分进行加权累加,将数据S2在各个子信道上的特征向量组合成一个综合特征向量X2
同样地,如图7C所示,数据SN可以通过特征提取模型CNNN进行特征提取,得到多个维度上的特征向量HN。然后,特征提取模型可以从多个维度上的特征向量HN中提取出各个子信道上的质量评分,例如质量评分qN。然后分层加权组合模块可以基于各个子信道上的特征向量对应的质量评分进行加权累加,将数据SN在各个子信道上的特征向量组合成一个综合特征向量XN
然后,分层加权组合模块可以组合每种类型数据的综合特征向量,生成一个全局的特征向量。示例性地,如图7C所示,分层加权组合模块可以基于综合特征向量X1、综合特征向量X2、…、综合特征向量XN分别对应的质量评分,将综合特征向量X1、综合特征向量X2、…、综合特征向量XN进行加权累加,得到全局的特征向量V。
最后,终端设备603可以将全局的特征向量V输入到人体活动识别模型中,得到人体活动识别结果。
示例性地,终端设备603可以将数据data11、数据data22以及数据data33输入到特征提取模块D中,得到全局的特征向量FD。全局的特征向量FD可以作为人体活动识别模型的输入,从而完成对人体活动识别模型的训练和用户活动类型的识别。
每一种类型的人体活动识别信号数据可能具有多个维度(例如,时间维度、信道维度和特征维度)的信息。为了将每一种类型的人体活动识别信号数据映射成相同大小的特征向量,终端设备603可以使用不同参数的卷积神经网络模型提取各种类型的人体活动识别信号数据的特征。例如,终端设备603接收到N种不同类型的人体活动识别信号数据{S1,S2,…,Si,…,SN},其中,第i种类型的人体活动识别信号数据Si包含了Ci个子信道信息。表示第i种类型的人体活动识别信号数据中在第j个信道上的信息(例如,幅值和相位等信息),可以按照如下公式得到其隐式特征向量:
在上述公式(3)中,为/>的隐式特征向量,/>为一个m维向量。为应用于第i种类型的数据的每个子信道的多层卷积神经网络。θi为卷积神经网络对应的参数向量。
基于上述公式(3),第i种类型的数据的特征矩阵可以为:
上述公式(4)中,Hi表示第i种类型的数据的特征矩阵。
由于人体活动识别信号数据的种类,协议配置,发送数据的终端设备中通信硬件质量、以及发送数据的终端设备与目标用户距离及角度、环境噪声等因素的影响,导致不同类型的人体活动识别信号数据可能包含不同数量的信息,同一种类型的人体活动识别信号数据在不同信道也可能包含不同数量的信息。因此,终端设备603中特征提取模型中的分层加权组合模块需要对不同类型的人体活动识别信号数据以及不同信道信息质量进行评估,基于评估结果将同一种人体活动识别信号数据不同信道信息的特征以及不同类型的人体活动识别信号数据的特征赋予权重后再累加。
对于第i种类型的数据的特征矩阵Hi,其在第j个信道上的信息质量评分可以按照如下公式计算:
上述公式(5)中,为特征矩阵Hi在第j个信道上的信息质量评分。/>为针对第i种类型的数据学习的参数。
终端设备603可以基于上述公式(5)计算出每一种类型的人体活动识别信号数据在所有信道上的信息质量评分。然后,终端设备603可以得到每一种类型的人体活动识别信号数据的质量评分向量(又可以称为权值向量)终端设备603可以基于每种类型的人体活动识别信号数据的特征向量和权值向量,通过累加各信道数据质量评分与对应信道数据特征向量的乘积,可以得到每种类型的人体活动识别信号数据的最终特征向量:
上述公式(6)中,Xi即表示每种类型的人体活动识别信号数据的最终特征向量。
终端设备603可以将所有类型的人体活动识别信号数据的特征向量进行叠加,可以得到一个对应所有类型的人体活动识别信号数据的特征矩阵X∈RN×m。然后,终端设备603可以基于每种类型的人体活动识别信号数据的质量评分,得到所有类型的人体活动识别信号数据对应的一个全局特征向量。
每种类型的人体活动识别信号数据的质量评分方法与一种类型的人体活动识别信号数据在单个信道上的质量评分方法相似。终端设备603可以按照如下公式得到每一种类型的人体活动识别信号数据的质量评分值:
Qi=aiXi+bi (7)
上述公式(7)中,Qi为第i个视图整体数据信息的质量评分,ai∈R1×mi∈R1×1为学习参数。
然后,终端设备603可以计算出所有类型的人体活动识别信号数据对应的一个全局特征向量V∈Rm×1
这样,终端设备603可以基于上述公式得到所有类型的人体活动识别信号数据对应的一个全局特征向量V。示例性地,全局特征向量V可以是上述特征FD的特征向量。
S605、终端设备603将特征F11、特征F22、特征F33输入到人体活动识别模型M1中,得到人体活动识别结果。
终端设备603可以将特征F11、特征F22、特征F33输入到人体活动识别模型M1中,得到用户的人体活动识别结果,例如,用户在行走,用户在跳舞,用户在写字等等。
可选地,终端设备603还可以对特征F11、特征F22、特征F33进行加权累加,得到一个全局特征(例如上文中描述的特征FD、或者全局特征向量V)。然后,终端设备603将全局特征输入到人体活动识别模型M1中,得到用户的人体活动识别结果。
在一些场景中,为了提高系统实时性和对用户的隐私保护,采用终端设备和物理服务器/云服务器协同实现人体活动识别模型在终端设备侧和物理服务器/云服务器侧的联合训练和分布式校准。鉴于终端设备侧能够采集到的训练数据量有限、以及计算资源受限,可以由多个终端设备负责采集训练数据,在物理服务器/云服务器中进行人体活动识别模型的更新和维护。例如,服务器604可以将人体识别模型(例如,全连接的前馈神经网络)和初始化的人体识别模型参数发送给终端设备603。在每一轮迭代训练过程中,终端设备603可以使用收集并存储在终端设备603本地的人体活动识别信号数据,以及人体活动识别信号数据对应的用户人体活动结果进行人体活动识别模型的训练和校准。即:
上述公式(9)中,为用于人体活动识别的前馈神经网络模型,/>是模型参数集,/>是对一个样本数据的预测活动类别概率分布,T是人体活动分类类别的数目。
在训练人体活动识别模型时,人体活动识别模型的输入数据可以包括带人体活动类别标签和不带人体活动类别标签的数据。人体活动识别模型的输出包括对带人体活动类别标签和不带人体活动类别标签的人体活动识别结果预测概率。终端设备603可以通过最小化带人体活动类别标签的输入数据的人体活动识别结果预测概率与其实际人体活动识别结果之间的差异来提高人体活动识别模型对人体活动识别结果预测的准确性。例如,最小化交叉熵损失函数:
上述公式(10)中,nl为带人体活动类别标签训练样本的数目,和/>分别为第i个样本数据对应的实际人体活动类别和预测人体活动类别。当带标签数据样本量有限时,融合不带标签的数据有助于提高识别模型的预测性能。对于不带标签的数据,可以按如下方式计算活动类别预测的交叉熵损失函数:
上述公式(11)中,nu为不带活动类别标签的样本数目,为第i个不带标签样本数据的预测活动类别。终端设备603可以通过最小化公式(11)中的交叉熵,可以提高对不带标签数据活动类别预测的置信度。
终端设备603可以在计算并校准训练模型参数后,将用户同意的模型参数上传到服务器604。服务器604可以聚合所有终端设备上传的模型参数,更新服务器604中全局模型。服务器604可以将更新后人体活动识别模型以及参数发送给所有终端设备(包括终端设备603)。经过服务器和终端设备之间重复多轮的迭代训练,终端设备603可以获得一个收敛的人体活动识别模型,即比初始的人体活动识别模型的准确率更高且更加稳定的人体活动识别模型。终端设备603可以基于本地训练和校准得到最终的人体活动识别模型,然后,将提取到的特征输入到最终的人体活动识别模型中,得到用户的人体活动识别结果。
一方面,由于用户人体活动识别应用场景的多样性,不同区域的终端设备生成人体活动识别信号数据的方式通常存在差异(如家庭A和家庭B的人体活动识别信号数据)。在实际应用中,不同区域的人体活动识别信号数据在数据量、特征分布、活动标签分布和时间维度等方面普遍存在偏差。另一方面,由于不同客户端(例如,终端设备603)在计算、存储能力和网络通讯质量等方面往往也存在差异,从而使得不同终端设备在全局模型聚合和更新过程中的参与程度不同。由于数据分布和系统资源的差异性,对所有客户端简单地应用共享的全局模型可能会导致次优的识别性能。为此,客户端集成了多种功能模块,包括性能检测模块和自动调参模块(具体可以参见图4中的描述)。其中,性能检测模块可以通过引入统计算法实时估算出客户端当前识别模型的性能指标,如损失函数值和收敛时间等。基于此,自动调参模块可以动态调整模型参数,以更好地适应本地采集数据的特征分布和资源使用情况。例如,通过对比回归分析模型在学习速率和本地更新步长不同设置值下的损失函数值,可以搜索到一种优化的超参数设置。
这样,通过本申请实施例提供的一种人体活动识别方法,可以利用用户所处场所以及所处区域中已有的不同形态的终端设备采集多种类型的人体活动识别信号数据。然后,终端设备可以通过多种类型的人体活动识别信号数据识别出用户正在进行的人体活动。并且,无需用户部署或携带专门硬件装置,保证用户人体活动识别的准确性和便捷性。
在数据预处理过程中,本申请实施例中使用基于数据驱动模式的去噪方法动态过滤采集数据中与活动信号无关的部分,在保证数据有效性的情况下可以更加灵活地适应不同人体活动识别信号数据和人体活动的内在特征。同时在数据特征提取过程中,使用基于卷积神经网络的深度学习模型从预处理后的人体活动识别信号数据中提取出各类人体活动识别信号数据在不同维度上的信号特征。在维持每种类型的人体活动识别信号数据独特性的前提下,消除了每种类型的输入数据的维度不等性。此外,本申请实施例还可以通过使用分层加权组合模块量化不同种类的人体活动识别信号数据和不同信道上数据信息质量的差异,并赋予不同权重,从而可以更加高效地整合所有类型的人体活动识别信号数据以及每种人体活动识别信号数据在所有信道上的数据信息。在用户活动类型识别中,本申请实施例采用端云协同(即终端设备和服务器协同)机制,完成识别模型在终端设备和服务器的联合训练和分布式校准,可以提高对用户活动识别的实时性和安全性。同时,针对终端设备获取到的数据分布和系统资源的差异性,终端设备还可以集成多种功能模块(如性能监测模块和自动调参模块),以优化服务器下发的全局模型在不同应用场景和区域的识别性能。
另外,在一些场景中,为了提高模型训练的有效性,通常需要用户在人体活动识别信号覆盖区域的多个不同位置上执行相关的行为活动并采集对应的人体活动识别信号数据作为训练数据。而人体活动识别信号的传播容易受到周围环境(如物品摆放、人员走动、以及终端设备部署等等)的影响,使得采集到训练数据中含有与环境相关的特征。为了,本申请实施例可以在特征提取模型和人体活动识别模型的基础上,引入一个域判别器来识别出与训练数据中的人体活动识别信号数据关联的目标用户和周围环境(可以称为域标签)。为了学习到人体活动识别信号数据在不同环境中的共有特征,可以在特征提取器和域判别器之间进行对抗博弈训练,从而优化特征提取模型及人体活动识别模型的参数。
示例性地,图7D示出了对抗学习模型架构图。如图7D所示,域判别器的输入为特征提取模型输出的全局特征向量V和人体活动识别模型输出的人体活动识别结果的级联,具体,可以用如下公式所示:
上述公式(12)中,为级联操作符,Ω∈R(m+T)×1为生成的域表示向量。
域判别器可以使用前馈神经网络实现,通过如下形式得到域表示向量Ω对应的域标签分布:
上述公式(13)中,表示用于域判别的神经网络模型,/>是模型参数集,是对一个域表示向量的域标签预测概率分布,D是域标签类别的数目。
域判别器通过最小化对域特征向量的预测标签结果与真实域标签之间的差异以最大化域标签类别的预测准确率。例如,最小化域标签预测的交叉熵损失函数:
上述公式(14)中,n=nl+nu表示带标签和不带标签数据样本的总数目。
为了在优化活动识别准确率的同时学习到采集数据中与环境无关的特征,需要最小化活动类别预测损失函数并最大化域标签预测损失函数,即最小化活动类别预测与域标签预测损失函数之间的偏差。例如,最小化活动类别预测与域标签预测交叉熵损失函数的差值:
上述公式(15)中,为活动类别预测的输入数据带标签时的交叉熵,具体可以参考上述公式(10)。Lu为活动类别预测的输入数据不带标签时的交叉熵,具体可以参考上述公式(11)。域标签预测交叉熵/>的计算如公式(14)所示。通过最小化公式(15)中损失函数,以更新特征提取模型、域判别器和活动识别模型的参数。
这样,引入一个域判别器以识别出与活动数据关联的目标用户和周围环境,即域标签。同时,在特征提取模型和域判别器之间进行对抗博弈的训练,可以去除与特定用户和特定环境关联的信号特征,并保留与环境无关的共有特征。通过域判别器和人体活动识别模型基于共同的多种类型的人体活动识别信号数据进行域标签类别判别和人体活动识别两个任务的联合学习,找到多种类型的人体活动识别信号数据中与环境无关的共有特征,有助于改善模型的识别性能与泛化能力,进而提高基于多种类型的人体活动识别信号数据的人体活动识别模型在不同场景(如更换人体活动识别信号数据采集终端设备的部署位置和在训练未覆盖区域进行活动)中的识别准确率。
可以理解的是,在一些人体活动识别的实际应用场景(例如,智能家居和影音娱乐)中,不同的目标用户在不同阶段对人体活动识别需求可能具有差异性。例如,用户需要增加或修改待识别的人体活动类别,在保证识别率的情况下减少提供数据的终端设备数量和终端设备负载。为此,本申请实施例提供基于端云协同的多模型联合训练和校准机制,支持不同的目标用户进行模型个性化定制,可以为不同的用户提供不同的人体活动识别算法和模型。
示例性地,图8示例性地示出了多个客户端从服务端获取不同的人体活动识别模型的场景示意图。如图8所示,服务端800中的模型库8002可以存储有多种不同的人体活动识别模型。例如,模型1、模型2、模型3、……、模型n。服务端800中的模型选择器8001可以基于客户端的存储资源、计算资源、实时负载和用户的人体活动识别需求,为客户端推荐和提供个性化的人体活动识别模型以及数据生成器。服务端800为客户端提供的人体活动识别模型可以是模型库8002中存在的模型,或者是存在的多个模型组合成的模型。例如,客户端1从服务端800获取到的人体活动识别模型可以是模型1。客户端2从服务端800获取到的人体活动识别模型可以是模型2和模型3组合后的模型。客户端3从服务端800获取到的人体活动识别模型可以是模型3和模型n组合后的模型。客户端n从服务端800获取到的人体活动识别模型可以是模型n和模型1组合后的模型。
相应地,多个客户端在接收到服务端800发送的人体活动识别模型和生成器后,可以利用本地数据生成尽可能接近真实信号数据及人体活动类别标签的训练数据,并进行人体活动识别模型的训练和校准。在客户端对人体活动识别模型进行训练的过程中,可以利用不断更新参数的生成器提供具有多样性的训练数据,从而可以基于多样性的训练数据训练得到具备较强泛化能力的人体活动识别模型。
另外,服务端800可以基于多个客户端上传的人体活动识别模型参数、生成器参数和部分训练数据,更新服务端800中的人体活动识别模型和生成器。这样,可以更好地适应当前用户的人体活动识别需求,为用户推荐更有效的人体活动识别模型和生成器。
这样,基于端云协同的多模型联合训练和校准机制,可以满足用户对模型个性化以及差异化的人体活动识别需求。
可以理解的是,在本申请实施例中,为了提高人体活动识别系统对网络动态性(例如,该系统中终端设备的加入(或者称为上线)或者退出(或者称为下线))的适应能力,可以利用软总线分布式基础服务(例如,发现、认证、连接、组网和数据流转等)实现不同终端设备之间的互联协同与数据融合。同时,还可以自适应调整人体活动识别系统各模块和流程的实现方式及参数设置。例如,为了保证采集的人体活动识别信号数据的有效性,并降低采集设备的功耗,人体活动识别系统可以基于软总线上下线通知,在人体活动识别系统中网络拓扑连接发生变动时,实时切换进行数据采集的终端设备,并根据设备运行状态动态调整人体活动识别信号数据的采集频率和采集数量。例如,图9中示出的家庭中的存储中心900给手机903发送采样频率调整指令。为了减少网络通信负担,人体活动识别系统可以基于软总线通道管理和自组网框架,将数据预处理以及特征提取等任务自适应地分发给人体活动识别系统中的终端设备节点。例如,图9中示出的手机903可以将接收的路由器902发送的Wi-Fi数据,发送给智慧屏901,然后,智慧屏901对接收到的Wi-Fi数据进行数据预处理和特征提起。音箱904和麦克风905可以通过软总线连接,并由音箱904将音频数据发送给存储中心900。
为了提高人体活动识别系统的整体性能,本申请实施例中涉及到的人体活动识别系统可以基于人体活动识别系统中各个终端设备的设备能力(例如,存储资源、计算资源、电量等等)以及网络通信质量,将特征提取、人体活动识别模型和/或特征提取模型的训练、以及人体活动识别等模块灵活部署在不同的终端设备。
示例性地,如图10所示,用户的终端设备,例如智慧屏1001、电脑1002、平板1003以及手机1004均可以接收到云服务器1000发送的初始化模型参数,并执行本地训练,更新本地模型以及将模型参数发送给建立有通信连接的各个终端设备,以及能够进行人体活动识别。用户可以根据人体活动识别需求将特征提取、人体活动识别模型和/或特征提取模型的训练、以及人体活动识别等模块灵活部署在智慧屏1001、电脑1002、平板1003以及手机1004任一个或多个终端设备中。
这样,人体活动识别系统可以利用软总线分布式资源管理,根据用户需求和数据分布为用户推荐训练模型和执行设备。
下面介绍本申请实施例提供的示例性终端设备1100。
图11是本申请实施例提供的终端设备1100的结构示意图。
下面以终端设备1100为例对实施例进行具体说明。应该理解的是,终端设备1100可以具有比图中所示的更多的或者更少的部件,可以组合两个或多个的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
终端设备1100可以包括:处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对终端设备1100的具体限定。在本申请另一些实施例中,终端设备1100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是终端设备1100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现终端设备1100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现终端设备1100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现终端设备1100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
SIM接口可以被用于与SIM卡接口195通信,实现传送数据到SIM卡或读取SIM卡中数据的功能。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端设备1100充电,也可以用于终端设备1100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端设备1100的结构限定。在本申请另一些实施例中,终端设备1100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。
终端设备1100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。终端设备1100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在终端设备1100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在终端设备1100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,终端设备1100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得终端设备1100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
终端设备1100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,终端设备1100可以包括1个或N个显示屏194,N为大于1的正整数。
终端设备1100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,颜色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,终端设备1100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当终端设备1100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。终端设备1100可以支持一种或多种视频编解码器。这样,终端设备1100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现终端设备1100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备1100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行终端设备1100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用(比如人脸识别功能,指纹识别功能、移动支付功能等)等。存储数据区可存储终端设备1100使用过程中所创建的数据(比如人脸信息模板数据,指纹信息模板等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universalflash storage,UFS)等。
终端设备1100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端设备1100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端设备1100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。终端设备1100可以设置至少一个麦克风170C。在另一些实施例中,终端设备1100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,终端设备1100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。终端设备1100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,终端设备1100根据压力传感器180A检测所述触摸操作强度。终端设备1100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定终端设备1100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定终端设备1100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测终端设备1100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消终端设备1100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,终端设备1100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。终端设备1100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当终端设备1100是翻盖机时,终端设备1100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测终端设备1100在各个方向上(一般为三轴)加速度的大小。当终端设备1100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。终端设备1100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,终端设备1100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。终端设备1100通过发光二极管向外发射红外光。终端设备1100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定终端设备1100附近有物体。当检测到不充分的反射光时,终端设备1100可以确定终端设备1100附近没有物体。终端设备1100可以利用接近光传感器180G检测用户手持终端设备1100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。终端设备1100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测终端设备1100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。终端设备1100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,终端设备1100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,终端设备1100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,终端设备1100对电池142加热,以避免低温导致终端设备1100异常关机。在其他一些实施例中,当温度低于又一阈值时,终端设备1100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于终端设备1100的表面,与显示屏194所处的位置不同。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备1100可以接收按键输入,产生与终端设备1100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和终端设备1100的接触和分离。终端设备1100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。终端设备1100通过SIM卡和网络交互,实现通话以及数据通信等功能。
在一些示例中,上述终端设备1100可以是上文中的客户端401、客户端402、以及客户端403。终端设备1100还可以是上文中的手机404。
可选地,上述终端设备1100可以是上文中的终端设备600、终端设备601、终端设备602以及终端设备603。
在一个示例中,图12示出了本申请实施例提供一种装置1200的示意性框图。该装置1200可以包括:处理器1201和收发器/收发管脚1202以及存储器1203。
装置1200的各个组建通过总线1204耦合在一起,其中,总线1204除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图中将各种总线都称为总线1204。
可选地,该装置1200可以是上文中的服务端400。装置1200中的处理器1201可以用于训练人体活动识别模型,基于多个终端设备发送的模型参数更新人体活动识别模型。存储器1203可以用于存储一种或多种人体识别模型。收发器/收发管脚1202可以用于向多个终端设备发送初始人体活动识别模型,或者初始的人体活动识别模型参数,或者接收多个终端设备发送的人体活动识别模型参数,或者接收多个终端设备发送的训练数据。
可选地,该装置1200可以是上文中的客户端401、或客户端402、或客户端403。装置1200中的处理器1201可以用于训练接收到的初始的人体活动识别模型,或者基于初始的人体活动识别模型参数、以及获取到的训练数据,训练出符合用户需求的人体活动识别模型。处理器1201还可以用于对获取到的数据进行数据预处理、特征提取以及进行人体活动识别。存储器1203可以用于存储接收到的初始的人体活动识别模型、以及基于初始的人体活动识别模型训练得到的人体活动识别模型。存储器1203还可以用于存储接收到的初始的人体活动识别模型参数、以及更新后的人体活动识别模型参数、或则基于初始的人体活动识别模型参数训练得到的人体活动识别模型。收发器/收发管脚1202可以用于接收服务器/云服务器发送的初始的人体活动识别模型或初始的人体活动识别模型参数。收发器/收发管脚1202还可以用于向服务器/云服务器发送更新后的人体活动识别模型参数或更新后的人体活动识别模型。
可选地,装置1200还可以是用于提供数据的终端设备,例如,图4中示出的手机404、音箱405、路由器406、平板407、麦克风408等等、以及图6中示出的终端设备600、终端设备601、终端设备602。处理器1201可以获取用于人体活动识别的数据、或者可以基于接收到的采集频率调整采集数据的频率。存储器1203可以用于存储采集到的用于人体活动识别的数据。收发器/收发管脚1202可以用于接收客户端发送的采集数据的指令,以及采集数据的频率和数量。收发器/收发管脚1202还可以用于向客户端发送采集到的用于人体活动识别的数据。
本实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机指令,当该计算机指令在终端设备上运行时,使得终端设备执行上述相关方法步骤实现上述实施例中的一种人体活动识别方法。
本实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的一种人体活动识别方法。
另外,本申请的实施例还提供一种装置,这个装置具体可以是芯片,组件或模块,该装置可包括相连的处理器和存储器;其中,存储器用于存储计算机执行指令,当装置运行时,处理器可执行存储器存储的计算机执行指令,以使芯片执行上述各方法实施例中的一种人体活动识别方法。
其中,本实施例提供的终端设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
上述实施例中所用,根据上下文,术语“当…时”可以被解释为意思是“如果…”或“在…后”或“响应于确定…”或“响应于检测到…”。类似地,根据上下文,短语“在确定…时”或“如果检测到(所陈述的条件或事件)”可以被解释为意思是“如果确定…”或“响应于确定…”或“在检测到(所陈述的条件或事件)时”或“响应于检测到(所陈述的条件或事件)”。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘)等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。

Claims (19)

1.一种人体活动识别系统,所述人体活动识别系统包括第一设备、第二设备、第三设备以及第四设备,所述第一设备与所述第三设备建立有通信连接,所述第二设备与所述第三设备建立有通信连接,所述第三设备与所述第四设备建立有通信连接;
所述第一设备用于向所述第三设备发送第一数据,所述第一设备与第一目标用户的距离小于第一阈值;
所述第二设备用于向所述第三设备发送第二数据,所述第二数据的数据类型与所述第一数据的数据类型不相同,所述第二设备与所述第一目标用户的距离小于第二阈值;
所述第四设备用于向所述第三设备发送第一人体活动识别模型;
所述第三设备用于接收所述第一数据和所述第二数据,以及所述第一人体活动识别模型;
所述第三设备用于,基于所述第一数据、所述第二数据和所述第一人体活动识别模型,确定出所述第一目标用户所进行的人体活动。
2.根据权利要求1所述的系统,其特征在于,所述第三设备用于:
对所述第一数据和所述第二数据进行去噪处理,得到第三数据和第四数据,所述第一数据包括第一残差分量和多个第一模式子函数,所述第三数据包括所述第一残差分量和所述多个第一模型子函数中在有效频率上的k1个第一模式子函数,所述第二数据包括第二残差分量和多个第二模式子函数,所述第四数据包括所述第二残差分量和所述多个第二模式子函数中在有效频率上的k2个第二模式子函数,所述第三数据中的噪声信息少于所述第一数据中的噪声信息,所述第四数据中的噪声信息少于所述第二数据中的噪声信息;
基于所述第三数据和所述第四数据,以及所述第一人体活动识别模型,确定出所述第一目标用户所进行的人体活动。
3.根据权利要求2所述的系统,其特征在于,所述第三设备用于:
将所述第三数据输入第一特征提取模型,得到所述第三数据对应的第一特征,将所述第四数据输入到第二特征提取模型,得到所述第四数据对应的第二特征;
将所述第一特征和所述第二特征进行融合,得到第三特征;
将所述第三特征输入到所述第一人体活动识别模型,得到所述第一目标用户所进行的人体活动。
4.根据权利要求3所述的系统,其特征在于,所述第三设备用于:
确定所述第一特征在特定维度不同模式的第一质量评分和所述第二特征在特定维度不同模式的第二质量评分;
基于所述第一质量评分将不同模式的所述第一特征进行加权累加,得到第三特征,基于所述第二质量评分将不同模式的所述第二特征进行加权累加,得到所述第四特征;
确定所述第三特征的第三质量评分和所述第四特征的第四质量评分;
基于所述第三质量评分和所述第四质量评分将所述第三特征和所述第四特征进行加权累加,得到第五特征;
将所述第五特征输入到所述第一人体活动识别模型,得到所述第一目标用户所进行的人体活动。
5.根据权利要求4所述的系统,其特征在于,所述第三设备用于:
基于获取到的训练数据对所述第一人体活动识别模型进行训练,得到第二人体活动识别模型,所述第二人体活动识别模型的识别准确率高于所述第一人体活动识别模型的识别准确率;
将所述第五特征输入到所述第二人体活动识别模型,得到所述第一目标用户所进行的人体活动。
6.根据权利要求1-5任一项所述的系统,其特征在于,所述人体活动识别系统还包括第五设备,所述第五设备与所述第三设备建立有通信连接;
所述第五设备用于向所述第三设备发送第五数据,其中,所述第五数据的数据类型与所述第一数据的数据类型、所述第二数据的数据类型不相同,所述第五设备与所述目标用户的距离小于所述第三阈值;
所述第四设备用于向所述第三设备发送第三人体活动识别模型,所述第三人体活动识别模型的输入数据为所述第一数据、所述第二数据和所述第五数据对应的特征融合后的特征,输出数据为人体活动识别结果;
所述第三设备用于接收所述第一数据、所述第二数据和所述第五数据,以及所述第三人体活动识别模型;
所述第三设备用于,基于所述第一数据、所述第二数据、所述第五数据和所述第三人体活动识别模型,确定出所述第一目标用户所进行的人体活动。
7.根据权利要求6所述的系统,其特征在于,所述第三设备还用于:
确定所述第五设备与所述目标用户的距离大于所述第三阈值;
查询提供所述第五数据的、且与所述第一目标用户的距离小于所述第三阈值的第六设备,所述第六设备与所述第三设备建立有通信连接;
通知所述第六设备向所述第三设备发送采集到的所述第五数据。
8.根据权利要求1-5任一项所述的系统,其特征在于,所述人体活动识别系统还包括第七设备、第八设备、第九设备,所述第七设备与所述第四设备建立有通信连接,所述第八设备与所述第七设备建立有通信连接,所述第九设备与所述第七设备建立有通信连接;
所述第八设备用于向所述第七设备发送第八数据,所述第八设备与第二目标用户的距离小于所述第四阈值;
所述第九设备用于向所述第七设备发送第九数据,所述第九数据的数据类型与所述第八数据的数据类型不相同,所述第九设备与第二目标用户的距离小于所述第五阈值;
所述第四设备用于向所述第七设备发送第四人体活动识别模型,所述第四人体活动识别模型与所述第一人体活动识别模型不相同;
所述第七设备用于接收所述第八数据和所述第九数据,以及所述第四人体活动识别模型;
所述第七设备用于,基于所述第八数据、所述第九数据和所述第四人体活动识别模型,确定出所述第二目标用户所进行的人体活动。
9.一种人体活动识别方法,其特征在于,所述方法包括:
第三设备接收到第一设备发送的第一数据和第二设备发送的第二数据,以及第四设备发送的第一人体活动识别模型,其中,所述第一设备与所述第三设备建立有通信连接,所述第二设备与所述第三设备建立有通信连接,所述第三设备与所述第四设备建立有通信连接,所述第一数据的数据类型与所述第二数据的数据类型不相同,所述第一设备与第一目标用户的距离小于第一阈值,所述第二设备与所述第一目标用户的距离小于第二距离;
所述第三设备基于所述第一数据、所述第二数据和所述第一人体活动识别模型,确定出所述第一目标用户所进行的人体活动。
10.根据权利要求9所述的方法,其特征在于,所述第三设备基于所述第一数据、所述第二数据和所述第一人体活动识别模型,确定出所述第一目标用户所进行的人体活动,包括:
所述第三设备对所述第一数据和所述第二数据进行去噪处理,得到第三数据和第四数据,所述第一数据包括第一残差分量和多个第一模式子函数,所述第三数据包括所述第一残差分量和所述多个第一模型子函数中在有效频率上的k1个第一模式子函数,所述第二数据包括第二残差分量和多个第二模式子函数,所述第四数据包括所述第二残差分量和所述多个第二模式子函数中在有效频率上的k2个第二模式子函数,所述第三数据中的噪声信息少于所述第一数据中的噪声信息,所述第四数据中的噪声信息少于所述第二数据中的噪声信息;
所述第三设备基于所述第三数据和所述第四数据,以及所述第一人体活动识别模型,确定出所述第一目标用户所进行的人体活动。
11.根据权利要求10所述的方法,其特征在于,所述第三设备基于所述第三数据和所述第四数据,以及所述第一人体活动识别模型,确定出所述第一目标用户所进行的人体活动,包括:
所述第三设备将所述第三数据输入到第一特征提取模型,得到所述第三数据对应的第一特征,将所述第四数据输入到第二特征提取模型,得到所述第四数据对应的第二特征;
所述第三设备将所述第一特征和所述第二特征进行融合,得到第三特征;
所述第三设备将所述第三特征输入到所述第一人体活动识别模型,得到所述第一目标用户所进行的人体活动。
12.根据权利要求11所述的方法,其特征在于,所述第三设备将所述第一特征和所述第二特征进行融合,得到第三特征,包括:
确定所述第一特征在特定维度不同模式的第一质量评分和所述第二特征在特定维度不同模式的第二质量评分;
基于所述第一质量评分将不同模式的所述第一特征进行加权累加,得到第三特征,基于所述第二质量评分将不同模式的所述第二特征进行加权累加,得到所述第四特征;
确定所述第三特征的第三质量评分和所述第四特征的第四质量评分;
基于所述第三质量评分和所述第四质量评分将所述第三特征和所述第四特征进行加权累加,得到第五特征;
将所述第五特征输入到所述第一人体活动识别模型,得到所述第一目标用户所进行的人体活动。
13.根据权利要求12所述的方法,其特征在于,所述第三设备将所述第三特征输入到所述第一人体活动识别模型,得到所述第一目标用户所进行的人体活动,包括:
所述第三设备基于获取到的训练数据对所述第一人体活动识别模型进行训练,得到第二人体活动识别模型,所述第二人体活动识别模型的识别准确率高于所述第一人体活动识别模型的识别准确率;
所述第三设备将所述第五特征输入到所述第二人体活动识别模型,得到所述第一目标用户所进行的人体活动。
14.根据权利要求9-13任一项所述的方法,其特征在于,所述方法包括:
所述第三设备接收到所述第一设备发送的第一数据、所述第二设备发送的第二数据和第五设备发送的第五数据,以及所述第四设备发送的第三人体活动识别模型,其中,所述第五设备与所述第三设备建立有通信连接,所述第五数据的数据类型与所述第一数据的数据类型、所述第二数据的数据类型不相同,所述第五设备与所述第一目标用户的距离小于所述第三阈值;
所述第三设备基于所述第一数据、所述第二数据、所述第五数据和所述第三人体活动识别模型,确定出所述第一目标用户所进行的人体活动。
15.根据权利要求14所述的方法,其特征在于,所述方法还包括:
所述第三设备确定所述第五设备与所述目标用户的距离大于所述第三阈值,查询提供所述第五数据的、且与所述目标用户的距离小于所述第三阈值的第六设备,所述第六设备与所述第三设备建立有通信连接;
所述第三设备通知所述第六设备向所述第三设备发送采集到的所述第五数据。
16.一种终端设备,其特征在于,包括一个或多个处理器、一个或多个存储器和收发器;其中,所述收发器、所述一个或多个存储器与所述一个或多个处理器耦合,所述一个或多个存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当一个或多个处理器在执行所述计算机指令时,使得所述终端设备执行如权利要求9-15任一项所述的方法。
17.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如权利要求9-15任一项所述的方法。
18.一种芯片或芯片系统,应用于终端设备,其特征在于,包括处理电路和接口电路,所述接口电路用于接收代码指令并传输至所述处理电路,所述处理电路用于运行所述代码指令以执行如权利要求9-15任一项所述的方法。
19.一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如权利要求9-15任一项所述的方法。
CN202210870433.7A 2022-07-22 2022-07-22 一种人体活动识别方法、系统及相关设备 Pending CN117496585A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210870433.7A CN117496585A (zh) 2022-07-22 2022-07-22 一种人体活动识别方法、系统及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210870433.7A CN117496585A (zh) 2022-07-22 2022-07-22 一种人体活动识别方法、系统及相关设备

Publications (1)

Publication Number Publication Date
CN117496585A true CN117496585A (zh) 2024-02-02

Family

ID=89675006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210870433.7A Pending CN117496585A (zh) 2022-07-22 2022-07-22 一种人体活动识别方法、系统及相关设备

Country Status (1)

Country Link
CN (1) CN117496585A (zh)

Similar Documents

Publication Publication Date Title
CN111132234B (zh) 一种数据传输方法及对应的终端
CN110730114B (zh) 一种网络配置信息的配置方法及设备
CN113705823A (zh) 基于联邦学习的模型训练方法和电子设备
CN112312366B (zh) 一种通过nfc标签实现功能的方法、电子设备及系统
CN112651510B (zh) 模型更新方法、工作节点及模型更新系统
WO2021000923A1 (zh) 一种路由器配置方法、终端及路由器
US20230230343A1 (en) Image Processing Method, Electronic Device, Image Processing System, and Chip System
WO2020220180A1 (zh) 媒体内容推荐方法及设备
EP4307692A1 (en) Method and system for adjusting volume, and electronic device
CN115701032A (zh) 设备控制方法、电子设备及存储介质
CN113838478B (zh) 异常事件检测方法、装置和电子设备
CN113572798B (zh) 设备控制方法、系统、设备和存储介质
CN114444705A (zh) 模型更新方法及装置
CN109285563B (zh) 在线翻译过程中的语音数据处理方法及装置
WO2022214004A1 (zh) 一种目标用户确定方法、电子设备和计算机可读存储介质
CN114157412B (zh) 信息验证的方法、电子设备及计算机可读存储介质
US11977946B2 (en) Method for automatically activating NFC application and terminal
CN114915359B (zh) 选择信道的方法、装置、电子设备和可读存储介质
CN117496585A (zh) 一种人体活动识别方法、系统及相关设备
CN113436635B (zh) 分布式麦克风阵列的自校准方法、装置和电子设备
CN115393676A (zh) 手势控制优化方法、装置、终端和存储介质
CN115734323B (zh) 功耗优化方法和装置
CN115580541B (zh) 信息同步方法及电子设备
WO2021189418A1 (zh) 服务提供方法及装置
CN114691066A (zh) 一种应用的显示方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination