CN107688827A - 一种基于用户日常行为特征的用户身份属性预测方法 - Google Patents
一种基于用户日常行为特征的用户身份属性预测方法 Download PDFInfo
- Publication number
- CN107688827A CN107688827A CN201710737016.4A CN201710737016A CN107688827A CN 107688827 A CN107688827 A CN 107688827A CN 201710737016 A CN201710737016 A CN 201710737016A CN 107688827 A CN107688827 A CN 107688827A
- Authority
- CN
- China
- Prior art keywords
- user
- identity attribute
- behavior
- characteristic vector
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明公开了一种基于用户日常行为特征的用户身份属性预测方法,包括以下步骤:1)根据采集到的用户行为数据构建行为数据集;2)定义用户的身份属性,然后将用户的身份属性划分为若干区间;3)对观测周期T内得到的用户数据集中的用户行为数据进行划分,得若干用户行为数据块,再根据步骤2)划分得到的区间对各用户行为数据块进行标记;4)提取各用户行为数据块的用户行为特征向量,然后根据所有用户行为数据块的用户行为特征向量构建身份属性特征向量训练集;5)构建身份属性模型;6)将待测用户的特征向量输入至身份属性模型中,得用户的身份属性,完成基于用户日常行为特征的用户身份属性预测,该方法能够实现用户身份属性的预测。
Description
技术领域
本发明涉及一种用户身份属性预测方法,具体涉及一种基于用户日常行为特征的用户身份属性预测方法。
背景技术
人类正大步迈进信息-物理融合的世界(Cyber-Physical World)。这个世界中不仅有机器,人也是其中关键的一环。从Cyber维度对人进行感知和理解,也正成为一个重要的研究方向。通过用户操作智能信息系统(计算机),智能终端(手机,平板等)的交互行为、各类可穿戴设备感知到的佩戴者行为及生理数据为对象,感知分析系统用户的操作、行为方式,推断用户的行为意图,预测用户属性,更加全面的了解用户,为用户提供更准确和方便的服务。通过对用户属性的准确感知,对于帮助我们深层次理解用户起到支撑作用,在用户推荐,健康状况监测,生活习惯分析等实际应用方面具有重要的价值。
近年来,研究人员提出基于生物特征检测用户的信息或身份属性,他们根据人脸,指纹,虹膜,掌纹等生理特征对用户的性别,年龄,种族等信息进行预测,但是此类方法需要使用特定的生物信息采集设备,如摄像头,指纹传感器等,不适用于现有的计算网络环境。目前还没有可以在现有的计算网络环境中大规模应用的用于分析预测用户身份属性的技术或方法。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供了一种基于用户日常行为特征的用户身份属性预测方法,该方法能够实现用户身份属性的预测。
为达到上述目的,本发明所述的基于用户日常行为特征的用户身份属性预测方法包括以下步骤:
1)采集用户日常行为动作过程中的用户行为数据,再根据采集到的用户行为数据构建行为数据集;
2)定义用户的身份属性,然后将用户的身份属性划分为若干区间;
3)对观测周期T内得到的用户数据集中的用户行为数据进行划分,得若干用户行为数据块,再根据步骤2)划分得到的区间对各用户行为数据块进行标记,其中,一个用户行为数据块对应一个区间;
4)提取各用户行为数据块的用户行为特征向量,然后根据所有用户行为数据块的用户行为特征向量构建身份属性特征向量训练集;
5)将身份属性特征向量训练集作为训练样本,再将身份属性特征向量训练集对应的身份属性作为训练样本的标签,然后根据所述训练样本及训练样本的标签构建身份属性模型;
6)获取待测用户的特征向量,然后将待测用户的特征向量输入至身份属性模型中,得用户的身份属性,完成基于用户日常行为特征的用户身份属性预测。
用户的身份属性包括用户的性别、身高、体重、年龄、身体健康状况、右手使用习惯、左手使用习惯、身份、活动量或职业。
通过便携式检测设备采集用户日常行为动作过程中的用户行为数据,所述便携式检测设备包括加速度传感器、陀螺仪传感器、体温传感器或心跳传感器。
行为数据集为{用户行为事件类型,数据类型,时间戳},其中,用户行为事件类型包括走路、跑步、上下楼、骑自行车、开车及打球中的一种或多种,数据类型为加速度传感器、陀螺仪传感器、体温传感器或心跳传感器采集到的数据。
加速度传感器及陀螺仪传感器对应的用户行为数据块的用户行为特征向量为用户数据块的均值、最大值、最小值、周期、众数、幅值、方差、偏态或均方根误差。
体温传感器及心跳传感器对应的用户行为数据块的用户行为特征向量为用户数据块的均值或方差。
用户日常行为动作包括走路、跑步、上楼梯、下楼梯、骑自行车、开车及打球中的一种或几种。
本发明具有以下有益效果:
本发明所述的基于用户日常行为特征的用户身份属性预测方法在具体操作时,采集用户日常行为动作过程中的用户行为数据,然后根据采集得到的用户行为数据构建行为数据集,再将行为数据集划分为若干用户行为数据块,并构建各用户行为数据块与身份属性区间的对应关系,并以该对应关系构建身份属性模型,需要说明的是,本发明以用户日常行为特征为基础构建身份属性模型,针对性较强,另外,采集的数据为用户日常行为动作,因此持续性较好,并且不会干扰用户的正常行为,具有较高的广泛性、安全性及适用性;另外,本发明通过获取待测用户的特征向量,然后将待测用户的特征向量输入至身份属性模型中,即可得到用户的身份属性,操作较为简单、方便,预测的精度较高。
具体实施方式
下面结合实施例对本发明做进一步详细描述:
本发明所述的基于用户日常行为特征的用户身份属性预测方法包括以下步骤:
1)采集用户日常行为动作过程中的用户行为数据,再根据采集到的用户行为数据构建行为数据集;
2)定义用户的身份属性,然后将用户的身份属性划分为若干区间;
3)对观测周期T内得到的用户数据集中的用户行为数据进行划分,得若干用户行为数据块,再根据步骤2)划分得到的区间对各用户行为数据块进行标记,其中,一个用户行为数据块对应一个区间;
4)提取各用户行为数据块的用户行为特征向量,然后根据所有用户行为数据块的用户行为特征向量构建身份属性特征向量训练集;
5)将身份属性特征向量训练集作为训练样本,再将身份属性特征向量训练集对应的身份属性作为训练样本的标签,然后根据所述训练样本及训练样本的标签构建身份属性模型;
6)获取待测用户的特征向量,然后将待测用户的特征向量输入至身份属性模型中,得用户的身份属性,完成基于用户日常行为特征的用户身份属性预测。
用户的身份属性包括用户的性别、身高、体重、年龄、身体健康状况、右手使用习惯、左手使用习惯、身份、活动量或职业。
通过便携式检测设备采集用户日常行为动作过程中的用户行为数据,所述便携式检测设备包括加速度传感器、陀螺仪传感器、体温传感器或心跳传感器。
行为数据集为{用户行为事件类型,数据类型,时间戳},其中,用户行为事件类型包括走路、跑步、上下楼、骑自行车、开车及打球中的一种或多种,数据类型为加速度传感器、陀螺仪传感器、体温传感器或心跳传感器采集到的数据。
加速度传感器及陀螺仪传感器对应的用户行为数据块的用户行为特征向量为用户数据块的均值、最大值、最小值、周期、众数、幅值、方差、偏态或均方根误差。
体温传感器及心跳传感器对应的用户行为数据块的用户行为特征向量为用户数据块的均值或方差。
用户日常行为动作包括走路、跑步、上楼梯、下楼梯、骑自行车、开车及打球中的一种或几种。
实施例一
本实施例中的用户身份属性为用户的性别,本实施例的具体操作过程为:
1)将性别属性划分为2类:第一类为男性用户;第二类为女性用户;
2)采集用户日常走路的数据,以固定观测时间长度T为周期对记录的行为数据进行划分,形成多个时间长度为T的用户行为数据块,并根据用户的性别属性对各用户行为数据块进行标记;
3)生成性别属性的特征训练集,具体的,针对每个标记的用户行为数据块,提取并标记用户行为特征向量,将不同用户行为数据块中的用户行为特征向量组合在一起,得带有性别属性标记的特征向量训练集;
4)对带有性别属性标记的特征向量训练集中的每个用户行为特征向量进行特征选择,如公式1所示,计算每个用户行为特征向量x与用户属性y之间的相关性,再将计算的结果作为特征选择的依据。
其中,xij为第i个样本的第j个特征,yi为第i个样本的标签,M为用户特征向量的总数,N为样本个数。
本实施例共有56个对象,通过查询相关系数表得到,在0.05的显著性水平下,相关系数大于0.26的特征为显著相关,因此挑选相关系数大于0.26的特征作为选择的特征向量。
5)以性别属性对应的特征向量训练集作为训练样本,同时身份属性特征向量训练集的性别标记作为训练样本的标签,根据训练样本及训练样本的标签构建身份属性模型;
6)用户在运动过程中,获取待测用户的用户行为数据,然后从时间长度为T的用户行为数据中提取性别属性对应的特征向量,然后将待测用户的特征向量输入到身份属性模型中,实现对用户性别的判断,结果如表1及表2所示:
表1
表2
全部传感器是指包含加速度传感器、陀螺仪传感器、体温传感器或心率传感器。
如表1的实验结果所示,本发明能够准确地对用户的性别属性进行预测;利用用户日常走路的数据对用户的性别属性信息进行预测,准确率为97.6%(1-2.40%)。表2给出了不同的传感器数据对用户性别属性的预测结果。结果表明联合不同设备,不同类型的传感器数据得到更好的性别属性预测结果,该结果验证了本发明的可行性。
Claims (7)
1.一种基于用户日常行为特征的用户身份属性预测方法,其特征在于,包括以下步骤:
1)采集用户日常行为动作过程中的用户行为数据,再根据采集到的用户行为数据构建行为数据集;
2)定义用户的身份属性,然后将用户的身份属性划分为若干区间;
3)对观测周期T内得到的用户数据集中的用户行为数据进行划分,得若干用户行为数据块,再根据步骤2)划分得到的区间对各用户行为数据块进行标记,其中,一个用户行为数据块对应一个区间;
4)提取各用户行为数据块的用户行为特征向量,然后根据所有用户行为数据块的用户行为特征向量构建身份属性特征向量训练集;
5)将身份属性特征向量训练集作为训练样本,再将身份属性特征向量训练集对应的身份属性作为训练样本的标签,然后根据所述训练样本及训练样本的标签构建身份属性模型;
6)获取待测用户的特征向量,然后将待测用户的特征向量输入至身份属性模型中,得用户的身份属性,完成基于用户日常行为特征的用户身份属性预测。
2.根据权利要求1所述的基于用户日常行为特征的用户身份属性预测方法,其特征在于,用户的身份属性包括用户的性别、身高、体重、年龄、身体健康状况、右手使用习惯、左手使用习惯、身份、活动量或职业。
3.根据权利要求1所述的基于用户日常行为特征的用户身份属性预测方法,其特征在于,通过便携式检测设备采集用户日常行为动作过程中的用户行为数据,所述便携式检测设备包括加速度传感器、陀螺仪传感器、体温传感器或心跳传感器。
4.根据权利要求3所述的基于用户日常行为特征的用户身份属性预测方法,其特征在于,行为数据集为{用户行为事件类型,数据类型,时间戳},其中,用户行为事件类型包括走路、跑步、上下楼、骑自行车、开车及打球中的一种或多种,数据类型为加速度传感器、陀螺仪传感器、体温传感器或心跳传感器采集到的数据。
5.根据权利要求4所述的基于用户日常行为特征的用户身份属性预测方法,其特征在于,加速度传感器及陀螺仪传感器对应的用户行为数据块的用户行为特征向量为用户数据块的均值、最大值、最小值、周期、众数、幅值、方差、偏态或均方根误差。
6.根据权利要求4所述的基于用户日常行为特征的用户身份属性预测方法,其特征在于,体温传感器及心跳传感器对应的用户行为数据块的用户行为特征向量为用户数据块的均值或方差。
7.根据权利要求1所述的基于用户日常行为特征的用户身份属性预测方法,其特征在于,用户日常行为动作包括走路、跑步、上楼梯、下楼梯、骑自行车、开车及打球中的一种或几种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710737016.4A CN107688827A (zh) | 2017-08-24 | 2017-08-24 | 一种基于用户日常行为特征的用户身份属性预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710737016.4A CN107688827A (zh) | 2017-08-24 | 2017-08-24 | 一种基于用户日常行为特征的用户身份属性预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107688827A true CN107688827A (zh) | 2018-02-13 |
Family
ID=61154996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710737016.4A Pending CN107688827A (zh) | 2017-08-24 | 2017-08-24 | 一种基于用户日常行为特征的用户身份属性预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107688827A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110766A (zh) * | 2019-04-23 | 2019-08-09 | 西安交通大学 | 一种基于运动规划控制特征的在线性格分析方法及装置 |
CN110147464A (zh) * | 2019-04-12 | 2019-08-20 | 北京三快在线科技有限公司 | 视频推荐方法、装置、电子设备及可读存储介质 |
CN110457364A (zh) * | 2019-07-10 | 2019-11-15 | 平安科技(深圳)有限公司 | 用户信息视图生成的方法及装置 |
CN112836904A (zh) * | 2021-04-07 | 2021-05-25 | 复旦大学附属中山医院 | 基于人脸特征点的身体质量指数预测方法 |
CN113569111A (zh) * | 2021-09-24 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 对象属性识别方法、装置、存储介质及计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2348674A1 (en) * | 2008-03-31 | 2011-07-27 | Hitachi Ltd. | User interface providing information system topology presentation |
CN103530540A (zh) * | 2013-09-27 | 2014-01-22 | 西安交通大学 | 基于人机交互行为特征的用户身份属性检测方法 |
CN103970271A (zh) * | 2014-04-04 | 2014-08-06 | 浙江大学 | 融合运动和生理传感数据的日常活动识别方法 |
CN107016346A (zh) * | 2017-03-09 | 2017-08-04 | 中国科学院计算技术研究所 | 步态身份识别方法及系统 |
CN107015647A (zh) * | 2017-03-28 | 2017-08-04 | 广州中国科学院软件应用技术研究所 | 基于智能手机姿态行为大数据的用户性别识别方法 |
-
2017
- 2017-08-24 CN CN201710737016.4A patent/CN107688827A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2348674A1 (en) * | 2008-03-31 | 2011-07-27 | Hitachi Ltd. | User interface providing information system topology presentation |
CN103530540A (zh) * | 2013-09-27 | 2014-01-22 | 西安交通大学 | 基于人机交互行为特征的用户身份属性检测方法 |
CN103970271A (zh) * | 2014-04-04 | 2014-08-06 | 浙江大学 | 融合运动和生理传感数据的日常活动识别方法 |
CN107016346A (zh) * | 2017-03-09 | 2017-08-04 | 中国科学院计算技术研究所 | 步态身份识别方法及系统 |
CN107015647A (zh) * | 2017-03-28 | 2017-08-04 | 广州中国科学院软件应用技术研究所 | 基于智能手机姿态行为大数据的用户性别识别方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147464A (zh) * | 2019-04-12 | 2019-08-20 | 北京三快在线科技有限公司 | 视频推荐方法、装置、电子设备及可读存储介质 |
CN110110766A (zh) * | 2019-04-23 | 2019-08-09 | 西安交通大学 | 一种基于运动规划控制特征的在线性格分析方法及装置 |
CN110457364A (zh) * | 2019-07-10 | 2019-11-15 | 平安科技(深圳)有限公司 | 用户信息视图生成的方法及装置 |
WO2021004329A1 (zh) * | 2019-07-10 | 2021-01-14 | 平安科技(深圳)有限公司 | 用户信息视图生成的方法及装置 |
CN110457364B (zh) * | 2019-07-10 | 2024-05-14 | 平安科技(深圳)有限公司 | 用户信息视图生成的方法及装置 |
CN112836904A (zh) * | 2021-04-07 | 2021-05-25 | 复旦大学附属中山医院 | 基于人脸特征点的身体质量指数预测方法 |
CN113569111A (zh) * | 2021-09-24 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 对象属性识别方法、装置、存储介质及计算机设备 |
CN113569111B (zh) * | 2021-09-24 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 对象属性识别方法、装置、存储介质及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107688827A (zh) | 一种基于用户日常行为特征的用户身份属性预测方法 | |
Demrozi et al. | Human activity recognition using inertial, physiological and environmental sensors: A comprehensive survey | |
CN104146712B (zh) | 穿戴式足底压力检测设备及足底压力检测和姿态预测方法 | |
Yang et al. | Lifelogging data validation model for internet of things enabled personalized healthcare | |
CN108244744B (zh) | 一种运动状态识别的方法、鞋底及鞋 | |
CN105561567B (zh) | 一种计步及运动状态评估装置 | |
Chiang et al. | Pattern analysis in daily physical activity data for personal health management | |
CN106096662A (zh) | 基于加速度传感器的人体运动状态识别 | |
Majumder et al. | A multi-sensor approach for fall risk prediction and prevention in elderly | |
CN104269025B (zh) | 面向户外摔倒监测的穿戴式单节点特征及位置选取方法 | |
KR20190105867A (ko) | 족저압 변화 및 보행 패턴 분석을 위한 장치 및 방법 | |
CN109567812B (zh) | 基于智能鞋垫的步态分析系统 | |
CN107205661A (zh) | 使用来自多个设备的数据进行能量消耗计算 | |
CN109979595A (zh) | 一种基于足底压力检测的支持向量机足踝外伤康复评估结果的分类方法 | |
CN108717548B (zh) | 一种面向传感器动态增加的行为识别模型更新方法及系统 | |
Rowlands et al. | Cloud based activity monitoring system for health and sport | |
Jin | A review of AI Technologies for Wearable Devices | |
Baldominos et al. | Feature selection for physical activity recognition using genetic algorithms | |
CN106422258A (zh) | 一种太极拳步法学习和评分方法 | |
CN113768471A (zh) | 一种基于步态分析的帕金森疾病辅助诊断系统 | |
Majumder et al. | A wireless IoT system towards gait detection in stroke patients | |
CN115147768B (zh) | 一种跌倒风险评估方法及系统 | |
CN107329965A (zh) | 用于使活动跟踪设备与计算设备数据同步的方法、系统和设备 | |
Manap et al. | Parkinsonian gait motor impairment detection using decision tree | |
Memiş et al. | Detection of basic human physical activities with indoor–outdoor information using sigma-based features and deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180213 |
|
RJ01 | Rejection of invention patent application after publication |