CN107015647A - 基于智能手机姿态行为大数据的用户性别识别方法 - Google Patents

基于智能手机姿态行为大数据的用户性别识别方法 Download PDF

Info

Publication number
CN107015647A
CN107015647A CN201710192894.2A CN201710192894A CN107015647A CN 107015647 A CN107015647 A CN 107015647A CN 201710192894 A CN201710192894 A CN 201710192894A CN 107015647 A CN107015647 A CN 107015647A
Authority
CN
China
Prior art keywords
data
user
motion state
mobile phone
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710192894.2A
Other languages
English (en)
Inventor
罗海飙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Institute of Software Application Technology Guangzhou GZIS
Original Assignee
Guangzhou Institute of Software Application Technology Guangzhou GZIS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Institute of Software Application Technology Guangzhou GZIS filed Critical Guangzhou Institute of Software Application Technology Guangzhou GZIS
Priority to CN201710192894.2A priority Critical patent/CN107015647A/zh
Publication of CN107015647A publication Critical patent/CN107015647A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种基于智能手机姿态行为大数据的用户性别识别方法,包括如下步骤:使用智能手机操作系统提供的API,记录智能手机一段时间内加速传感器、陀螺传感器和方向传感器返回的数据;通过加速传感器和陀螺传感器返回的数据采用算法得到智能手机用户的运动状态,对运动状态进行分类,记录每个运动状态下的加速传感器、陀螺传感器和方向传感器的数据;对各传感器的数据进行处理,得到每个运动状态下的特征值组;将每个运动状态下的特征值组放到大数据分类算法模型中,用训练好的数据预测用户的性别;将各传感器的结果加权平均得到最终的用户的性别。本发明能对智能手机用户的性别进行准确的识别,准确度更高。

Description

基于智能手机姿态行为大数据的用户性别识别方法
技术领域
本发明涉及大数据技术领域,具体涉及一种基于智能手机姿态行为大数据的用户性别识别方法。
背景技术
随着移动互联网的高速发展,智能手机的用户画像或者说是用户标签对于在庞大的移动互联网用户群体中对精准人群进行品牌营销尤为关键。用户画像是将用户信息标签化,即企业通过收集与分析用户的消费习惯、生活习惯和社会属性等主要信息的数据后,抽象出用户的商业全貌。移动互联网企业可以通过用户画像寻找匹配人群,精准推送营销广告或服务信息,最终实现个性化营销与服务推送。
经过20多年的发展,随着技术的进步,手机无论从造型还是功能都发生了翻天覆地的变化,已经不再是一个简单的通信工具,而是具有多样化的功能。在这种情况下,各种传感器在IPhone、IPad、Android系统和其它系统的智能手机中得到广泛应用。其中,加速度/运动传感器、陀螺仪可通过感知设备的加速度/重力和运动状态,从而得到当前设备的姿态。
针对用户的画像研判,当前已经有了一些研究工作,主要集中在用户的网络日志和搜索内容上。对网络日志的书写习惯和用语习惯、以及用户的搜索内容,通过基于文本的分类方法、统计分析和关联预测方法,建立搜索内容、用语习惯等与用户基本属性之间的联系,从而预测用户的性别、年龄、职业等用户画像属性。
但是,对于智能手机,其浏览器一般没有Cookie,用户的网络日志难以获取。用户的搜索一般只能由搜索引擎公司获得,第三方公司无法得到。因此,在手机上要获取用户信息,建立用户画像是比较困难的。因此一些新的方法被提出。例如专利《一种基于智能手机加速度传感器的用户基础属性预测方法》提出通过收集用户智能手机的流量数据,例如APP流量的精确使用情况,包括APP的名字、使用时间和流量等特征数据,再通过SVM模型对这些数据进行分析,建立用户分类预测模型。但是该方法的准确性不是很高。
发明内容
针对上述问题,本发明的目的在于提供一种基于智能手机姿态行为大数据的用户性别识别方法,实现通过用户使用智能手机的姿态行为的不同精确识别智能手机用户性别的方法。
本发明通过以下技术手段解决上述问题:
一种基于智能手机姿态行为大数据的用户性别识别方法,包括如下步骤:
S1、使用智能手机操作系统提供的API,记录智能手机一段时间内加速传感器、陀螺传感器和方向传感器返回的数据;
S2、通过加速传感器和陀螺传感器返回的数据采用算法得到智能手机用户的运动状态,对运动状态进行分类,记录每个运动状态下的加速传感器、陀螺传感器和方向传感器的数据;
S3、对加速传感器的数据进行处理,得到每个运动状态下的加速特征值组;
S4、将每个运动状态下的加速特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的加速特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S5、对陀螺传感器的数据进行处理,得到每个运动状态下的角速度特征值组;
S6、将每个运动状态下的角速度特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的角速度特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S7、对方向传感器的数据进行处理,得到每个运动状态下的方向特征值组;
S8、将每个运动状态下的方向特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的方向特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S9、将步骤S4、步骤S6和步骤S8结果加权平均得到最终的用户的性别。
进一步地,步骤S3-S4、步骤S5-S6和步骤S7-S8是同时进行的。
进一步地,所述运动状态包括走路、跑步、上楼、下楼、乘坐交通工具、坐和静止。
进一步地,步骤S2中,采用Android官方API文档和IPhone官方API文档中叙述的算法得到智能手机用户的运动状态。
进一步地,步骤S7具体包括如下步骤:
S71、方向传感器数据记录三个维度数据:智能手机绕着Z轴旋转的角度、智能手机绕着X轴旋转的角度和智能手机绕着Y轴旋转的角度;
S72、对每个运动状态下的方向传感器数据按时间顺序进行统计,将突然上升或突然下降超过一定阀值的数据记录为一个峰值;
S73、对相邻两个峰值之间的数据计算数据的平均值、最大值、最小值和标准差;
S74、所有数据的平均值、最大值、最小值和标准差按时间顺序组成用户的每个运动状态下的方向特征值组。
进一步地,S72中,所述阀值设为90°。
进一步地,所述大数据分类算法模型为SVM、AdaBoost或LDA。
本发明通过用户使用智能手机的姿态行为的不同,通过大数据方法统计大量人群的使用习惯,能对智能手机用户的性别进行准确的识别,准确度更高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于智能手机姿态行为大数据的用户性别识别方法的步骤图;
图2是本发明基于智能手机姿态行为大数据的用户性别识别方法的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1、图2所示,本发明提供一种基于智能手机姿态行为大数据的用户性别识别方法,包括如下步骤:
S1、使用智能手机操作系统提供的API,记录智能手机一段时间内加速传感器、陀螺传感器和方向传感器返回的数据;
S2、通过加速传感器和陀螺传感器返回的数据采用算法得到智能手机用户的运动状态,相关算法在Android官方API文档和IPhone官方API文档中都有叙述,对运动状态进行分类,运动状态包括走路、跑步、上楼、下楼、乘坐交通工具、坐和静止,记录每个运动状态下的加速传感器、陀螺传感器和方向传感器的数据;
S3、对加速传感器的数据进行处理,得到每个运动状态下的加速特征值组;
S4、将每个运动状态下的加速特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的加速特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别,大数据分类算法模型为SVM(Support VectorMachine)、AdaBoost或LDA(Linear Discriminant Analysis);
S5、对陀螺传感器的数据进行处理,得到每个运动状态下的角速度特征值组;
S6、将每个运动状态下的角速度特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的角速度特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S7、对方向传感器的数据进行处理,得到每个运动状态下的方向特征值组;
具体包括如下步骤:
S71、方向传感器数据记录三个维度数据:智能手机绕着Z轴旋转的角度、智能手机绕着X轴旋转的角度和智能手机绕着Y轴旋转的角度;
S72、对每个运动状态下的方向传感器数据按时间顺序进行统计,将突然上升或突然下降超过一定阀值(例如90°)的数据记录为一个峰值;
S73、对相邻两个峰值之间的数据计算数据的平均值、最大值、最小值和标准差;
S74、所有数据的平均值、最大值、最小值和标准差按时间顺序组成用户的每个运动状态下的方向特征值组。
S8、将每个运动状态下的方向特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的方向特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S9、将步骤S4、步骤S6和步骤S8结果加权平均得到最终的用户的性别。
其中,步骤S3-S4、步骤S5-S6和步骤S7-S8是同时进行的。
由于男女携带智能手机的习惯不同,导致手机的姿态不同。例如在走路时男子多将手机放在裤袋内,女子多将手机放在手提包中。裤袋中的手机一般接近竖立的角度,手提包中的手机一般接近侧卧的角度。在坐下时,男女的手机姿态都有可能是侧卧角度;但裤袋中的手机会因为腿的小幅度运动而运动,手提包中的手机会一直静止不动。上下楼和乘坐交通工具时裤袋中的手机运动方向与手提包中的手机有着显著差异。
由于现代智能手机内部都配置了手机重力感应技术,利用压电效应,测量内部一片重物重力正交两个方向的分力大小,来判定水平方向,从而能够感受手机在变换姿势时,重心的变化。智能手机内部的三轴陀螺仪测量手机的三维方向,能更精确地检测手机的三维方向变化。加速度传感器能感知手机在三维方向的加速度。这些传感器可以用来测量手机的运动状态和姿态。
本发明通过用户使用智能手机的姿态行为的不同,通过大数据方法统计大量人群的使用习惯,能对智能手机用户的性别进行准确的识别,准确度更高。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (7)

1.一种基于智能手机姿态行为大数据的用户性别识别方法,其特征在于,包括如下步骤:
S1、使用智能手机操作系统提供的API,记录智能手机一段时间内加速传感器、陀螺传感器和方向传感器返回的数据;
S2、通过加速传感器和陀螺传感器返回的数据采用算法得到智能手机用户的运动状态,对运动状态进行分类,记录每个运动状态下的加速传感器、陀螺传感器和方向传感器的数据;
S3、对加速传感器的数据进行处理,得到每个运动状态下的加速特征值组;
S4、将每个运动状态下的加速特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的加速特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S5、对陀螺传感器的数据进行处理,得到每个运动状态下的角速度特征值组;
S6、将每个运动状态下的角速度特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的角速度特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S7、对方向传感器的数据进行处理,得到每个运动状态下的方向特征值组;
S8、将每个运动状态下的方向特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的方向特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S9、将步骤S4、步骤S6和步骤S8结果加权平均得到最终的用户的性别。
2.根据权利要求1所述的基于智能手机姿态行为大数据的用户性别识别方法,其特征在于,步骤S3-S4、步骤S5-S6和步骤S7-S8是同时进行的。
3.根据权利要求1所述的基于智能手机姿态行为大数据的用户性别识别方法,其特征在于,所述运动状态包括走路、跑步、上楼、下楼、乘坐交通工具、坐和静止。
4.根据权利要求1所述的基于智能手机姿态行为大数据的用户性别识别方法,其特征在于,步骤S2中,采用Android官方API文档和IPhone官方API文档中叙述的算法得到智能手机用户的运动状态。
5.根据权利要求1所述的基于智能手机姿态行为大数据的用户性别识别方法,其特征在于,步骤S7具体包括如下步骤:
S71、方向传感器数据记录三个维度数据:智能手机绕着Z轴旋转的角度、智能手机绕着X轴旋转的角度和智能手机绕着Y轴旋转的角度;
S72、对每个运动状态下的方向传感器数据按时间顺序进行统计,将突然上升或突然下降超过一定阀值的数据记录为一个峰值;
S73、对相邻两个峰值之间的数据计算数据的平均值、最大值、最小值和标准差;
S74、所有数据的平均值、最大值、最小值和标准差按时间顺序组成用户的每个运动状态下的方向特征值组。
6.根据权利要求5所述的基于智能手机姿态行为大数据的用户性别识别方法,其特征在于,S72中,所述阀值设为90°。
7.根据权利要求1所述的基于智能手机姿态行为大数据的用户性别识别方法,其特征在于,所述大数据分类算法模型为SVM、AdaBoost或LDA。
CN201710192894.2A 2017-03-28 2017-03-28 基于智能手机姿态行为大数据的用户性别识别方法 Pending CN107015647A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710192894.2A CN107015647A (zh) 2017-03-28 2017-03-28 基于智能手机姿态行为大数据的用户性别识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710192894.2A CN107015647A (zh) 2017-03-28 2017-03-28 基于智能手机姿态行为大数据的用户性别识别方法

Publications (1)

Publication Number Publication Date
CN107015647A true CN107015647A (zh) 2017-08-04

Family

ID=59445875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710192894.2A Pending CN107015647A (zh) 2017-03-28 2017-03-28 基于智能手机姿态行为大数据的用户性别识别方法

Country Status (1)

Country Link
CN (1) CN107015647A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688827A (zh) * 2017-08-24 2018-02-13 西安交通大学 一种基于用户日常行为特征的用户身份属性预测方法
CN108596241A (zh) * 2018-04-20 2018-09-28 西北工业大学 一种基于多维感知数据的用户性别快速分类方法
CN108920682A (zh) * 2018-07-11 2018-11-30 厦门盈趣科技股份有限公司 基于机器学习和用户画像技术的社交用户推荐方法及装置
CN109118282A (zh) * 2018-08-08 2019-01-01 福建百悦信息科技有限公司 一种双模互感智能空间用户画像管理方法及终端

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137213A1 (en) * 2009-11-30 2011-06-09 University College Dublin, National University Of Ireland, Dublin Method and system for therapeutic exergaming
US20120268373A1 (en) * 2011-04-21 2012-10-25 Samsung Electronics Co., Ltd. Method for recognizing user's gesture in electronic device
CN103434512A (zh) * 2013-09-18 2013-12-11 武汉理工大学 基于智能手机的横向驾驶状态检测系统与方法
CN104601817A (zh) * 2015-01-20 2015-05-06 电子科技大学 一种基于智能手机加速度传感器的用户基础属性预测方法
CN104636504A (zh) * 2015-03-10 2015-05-20 飞狐信息技术(天津)有限公司 一种识别用户性别的方法及系统
CN105249664A (zh) * 2015-11-04 2016-01-20 英华达(南京)科技有限公司 背包及其使用方法
CN106210269A (zh) * 2016-06-22 2016-12-07 南京航空航天大学 一种基于智能手机的人体动作识别系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110137213A1 (en) * 2009-11-30 2011-06-09 University College Dublin, National University Of Ireland, Dublin Method and system for therapeutic exergaming
US20120268373A1 (en) * 2011-04-21 2012-10-25 Samsung Electronics Co., Ltd. Method for recognizing user's gesture in electronic device
CN103434512A (zh) * 2013-09-18 2013-12-11 武汉理工大学 基于智能手机的横向驾驶状态检测系统与方法
CN104601817A (zh) * 2015-01-20 2015-05-06 电子科技大学 一种基于智能手机加速度传感器的用户基础属性预测方法
CN104636504A (zh) * 2015-03-10 2015-05-20 飞狐信息技术(天津)有限公司 一种识别用户性别的方法及系统
CN105249664A (zh) * 2015-11-04 2016-01-20 英华达(南京)科技有限公司 背包及其使用方法
CN106210269A (zh) * 2016-06-22 2016-12-07 南京航空航天大学 一种基于智能手机的人体动作识别系统及方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688827A (zh) * 2017-08-24 2018-02-13 西安交通大学 一种基于用户日常行为特征的用户身份属性预测方法
CN108596241A (zh) * 2018-04-20 2018-09-28 西北工业大学 一种基于多维感知数据的用户性别快速分类方法
CN108596241B (zh) * 2018-04-20 2022-05-13 西北工业大学 一种基于多维感知数据的用户性别快速分类方法
CN108920682A (zh) * 2018-07-11 2018-11-30 厦门盈趣科技股份有限公司 基于机器学习和用户画像技术的社交用户推荐方法及装置
CN108920682B (zh) * 2018-07-11 2021-08-31 厦门盈趣科技股份有限公司 基于机器学习和用户画像技术的社交用户推荐方法及装置
CN109118282A (zh) * 2018-08-08 2019-01-01 福建百悦信息科技有限公司 一种双模互感智能空间用户画像管理方法及终端

Similar Documents

Publication Publication Date Title
CN107391760B (zh) 用户兴趣识别方法、装置及计算机可读存储介质
CN102985897B (zh) 高效姿势处理
CN107704495B (zh) 主题分类器的训练方法、装置及计算机可读存储介质
KR101830767B1 (ko) 사용자의 감정 인식 장치 및 방법
CN108804512A (zh) 文本分类模型的生成装置、方法及计算机可读存储介质
CN108875781A (zh) 一种标签分类方法、装置、电子设备及存储介质
CN103488666B (zh) 信息处理设备和方法、电子装置以及计算机可读存储介质
CN107015647A (zh) 基于智能手机姿态行为大数据的用户性别识别方法
CN107592839A (zh) 细粒度分类
CN107908619A (zh) 基于舆情监控的处理方法、装置、终端及计算机存储介质
CN106651973B (zh) 图像结构化方法及装置
CN111241842B (zh) 文本的分析方法、装置和系统
CN104423945B (zh) 一种信息处理方法及电子设备
CN109063558A (zh) 一种图像分类处理方法、移动终端及计算机可读存储介质
CN110580489B (zh) 一种数据对象的分类系统、方法以及设备
CN110674875A (zh) 一种基于深度混合模型的行人运动模式识别方法
CN107590478A (zh) 一种基于深度学习的年龄估计方法
CN110209810A (zh) 相似文本识别方法以及装置
CN110457677A (zh) 实体关系识别方法及装置、存储介质、计算机设备
CN104601817A (zh) 一种基于智能手机加速度传感器的用户基础属性预测方法
CN111797861A (zh) 信息处理方法、装置、存储介质及电子设备
CN108701140A (zh) 从图像生成结构化查询
Shan et al. Deep analysis for smartphone-based human activity recognition
US11727710B2 (en) Weakly supervised semantic parsing
CN108052960A (zh) 识别终端握持状态的方法、模型训练方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination