CN107403019A - 一种基于移动数据的车主身份识别方法 - Google Patents
一种基于移动数据的车主身份识别方法 Download PDFInfo
- Publication number
- CN107403019A CN107403019A CN201710695091.9A CN201710695091A CN107403019A CN 107403019 A CN107403019 A CN 107403019A CN 201710695091 A CN201710695091 A CN 201710695091A CN 107403019 A CN107403019 A CN 107403019A
- Authority
- CN
- China
- Prior art keywords
- dimension
- car owner
- class
- mrow
- apps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims description 30
- 239000012141 concentrate Substances 0.000 claims description 9
- 230000003993 interaction Effects 0.000 claims description 5
- 230000002452 interceptive effect Effects 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000009423 ventilation Methods 0.000 abstract 1
- 230000007246 mechanism Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于移动数据的车主身份识别方法,根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率,如果用户为车主身份的总概率大于第一阈值,则判断用户为车主身份;本发明充分利用现有移动数据,建立相应的车主类信息维表,不需要额外的设备支持,从海量数据中实现的车主身份识别,并给出用户可能为车主的概率;该方法成果可应用于行业精准营销等领域,实现不同身份的个性化推荐服务。
Description
技术领域
本发明涉及移动用户画像以及计算机应用技术,特别是涉及一种基于移动数据的车主身份识别方法。
用户画像是指根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。
背景技术
随着我国经济社会持续快速发展,群众购车刚性需求旺盛,汽车保有量持续呈快速增长趋势。据统计,截至2016年底,全国机动车保有量达2.9亿辆,其中汽车1.94亿辆,机动车驾驶人3.6亿人,而汽车驾驶人超过3.1亿人。一方面,汽车服务行业如车险、汽车保养等需要聚焦车主群体从而开展业务推广;另一方面,车主通常意味着较高收入人群,锁定此类群体可谓商机无限。而目前仅有少部分机构能够掌握车主信息,对于未掌握车主信息而又有此方面需求的机构来说具有相当大的困扰,如果通过技术手段能够进行车主身份的自动识别就能够打通这些机构与车主之间交互的壁垒,于是车主身份的自动识别就成为了一个亟需解决的技术问题。
发明内容
为了解决以上问题,本发明提出了一种基于用户移动数据的车主身份识别方法;本发明是通过以下技术方案来实现的:
一种基于移动数据的车主身份识别方法,根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率,如果用户为车主身份的总概率大于第一阈值,则判断用户为车主身份。
进一步的,根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率;
进一步的,根据公式,计算用户为车主身份的总概率P为:
PV表示语音维度概率,PS表示短信维度概率,PApp表示车主类Apps维度概率;WV1表示语音维度第一权重,WS1表示短信维度第一权重,WApp1表示车主类 Apps维度第一权重,WS1+WV1+WApp1=1。
进一步的,所述语音维度概率PV包括:
其中,TYPE_ID表示设置语音端口号,v1表示包括车险专线及违章咨询电话;v2表示包括全国高速公路报警救援电话;v3表示包括车险、汽车品牌4s 店电话;CMC表示用户与各端口的交互次数,CMS表示各语音端口该段时间内总的交互次数,PN表示一段时间内与语音维度表中端口号TYPE_ID有过交互的用户人数,weightv表示端口号TYPE_ID为v2时对车主身份判定的确定度。
进一步的,短信维度概率PS包括:
其中,TYPE_ID表示设置短信端口号,s1表示包括违章短信发布平台、交巡警平台及ETC专用端口;s2表示包括交通服务热线;weights表示端口号 TYPE_ID为s2对车主身份判定的确定度。
进一步的,车主类Apps维度概率PApp包括:
PApp=weightapp,Fre>3
Fre表示使用相应App的次数,其中,weightapp的设置包括:
将车主类Apps分为n类,通过设定不同的权重将n类车主类Apps分类, w1,w2,...wn为根据所述车主类Apps分类后对车主身份判定的确定度。
进一步的,语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps 维度第一权重WApp1采用以下方式获得:
根据各维度对车主身份识别的贡献度,设定短信、语音、车主APP维度的初始权重及初始阈值,包括,短信维度第二权重WS2,语音维度第二权重WV2,车主类Apps维度第二权重WApp2,第二阈值Pt2,其中,WS2+WV2+WApp2=1;
采用交叉验证来调整各维度权重,得到语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps维度第一权重WApp1;
进一步的,交叉验证具体包括:
将语音维度中与语音端口号v1有交互的用户构建为第一测试集,将第一测试集中与短信端口号有交互的用户构建为第一验证集,将第一测试集中包含车主类Apps的用户构建为第二验证集;
将短信维度中与短信端口号s1有交互的用户构建为第二测试集,将第二测试集中与语音端口号有交互的用户构建为第三验证集,将第二测试集中包含车主类Apps的用户构建为第四验证集;
把第一验证集占第一测试集的大小叫做第一占比,把第二验证集占第一测试集的大小叫做第二占比,第三验证集占第二测试集的大小叫做第三占比,把第四验证集占第二测试集的大小叫做第四占比;
计算第一验证集中与短信端口号交互的频次叫做第一频次;
计算第二验证集中车主类Apps的频次叫做第二频次;
计算第三验证集中与语音端口号交互的频次叫做第三频次;
计算第四验证集中车主类Apps的频次叫做第四频次;
比较第一占比和第二占比的大小,若第一占比大于第二占比,则增大短信维度第二权重WS2得到短信维度第一权重WS1,同时减小车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;若第三占比小于第四占比,则减小语音维度第二权重WV2得到语音维度第一权重WV1,同时增大车主类Apps 维度第二权重WApp2得到车主类Apps维度第一权重WApp1;
比较第一频次与第二频次大小,若第一频次大于第二频次,则增大则增大短信维度第二权重WS2得到短信维度第一权重WS1,同时减小车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;若第三频次小于第二频次,则减小语音维度第二权重WV2得到语音维度第一权重WV1,同时增大车主类Apps 维度第二权重WApp2得到车主类Apps维度第一权重WApp1。
进一步的,第一阈值Pt根据所要求的车主身份识别率动态确定。
附图说明
图1为基于移动数据的车主身份识别方法流程图;
图2为计算用户为车主的概率流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明根据用户画像来确定用户是否具有车主身份。用户画像指根据用户社会属性、消费行为等信息抽象出的一个标签化的用户模型。
下面结合附图与具体实施例对本发明作进一步说明:
一种基于移动数据的车主身份识别方法,一种基于移动数据的车主身份识别方法,如图1所示,根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率,如果用户为车主身份的总概率大于第一阈值,则判断用户为车主身份。
进一步的,语音维度概率为PV、短信维度概率为PS、以及车主类Apps维度概率为PApp;
进一步的,语音维度第一权重为WV1、短信维度第一权重为WS1、车主类Apps 维度第一权重为WApp1。
优选的,如图2所示,根据如下公式,计算用户为车主的概率P:
当语音维度概率PV和短信维度概率PS以及车主类Apps维度概率PApp中任一的值为1时,则判断该用户为车主,否则,用户为车主的概率P就为 WS1×PS+WV1×PV+WApp1×PApp。
进一步的,语音维度概率PV是根据如下获得:
获取用户的语音信息,建立语音维度表,设置语音端口号TYPE_ID加以区分用户收到的不同语音信息来源;
其中,所述语音来源包括三类号码,设置端口号TYPE_ID为v1、v2、v3,以区分所述三类号码:
v1:包括车险专线及违章咨询电话;
v2:包括全国高速公路报警救援电话;
v3:包括车险、汽车品牌4s店电话;
其中,根据需求语音来源需求,用户语音维度表设计如表1:
表1语音维度表
识别一段时间内与语音维度表中端口号TYPE_ID有过交互的用户,并统计用户与各端口的交互次数CMC,各语音端口该段时间内总的交互次数CMS,交互人数PN,weightv为自定义设置的值;
可选的,weightv的值根据经验人为设定的,与端口号TYPE_ID为v2有过交互的用户,如全国高速公路报警救援电话,拨打了此电话的用户为车主的可能性较大,weightv设置为0.8。
语音维度概率PV表示为:
进一步的,短信维度概率PS是根据如下获得:
获取手机用户的短信信息,建立短信维度表,设置端口号TYPE_ID加以区分用户收到的不同短信来源;
其中,所述短信来源包括两类号码,设置短信端口号TYPE_ID为s1、s2,以区分所述两类号码:
s1:包括违章短信发布平台、交巡警平台,ETC专用端口;收到过此类号码发出的短信的用户即可直接判定为车主;
s2:包括交通服务热线;收到过此类号码发出的短信的用户则给出较大的权值;
表2短信维度表
识别一段时间内与短信维度表中端口号TYPE_ID有过交互的用户,PS是通过短信维度表判断用户为车主的概率,其中当短信维度端口号TYPE_ID为s1 时,判断用户为车主,当短信维度端口号TYPE_ID为s2时,短信维度概率为 weights,其中,weights为自定义设置的值;
可选的,weightv的值根据经验人为设定的,与短信维度端口号TYPE_ID为 s2有过交互的用户,如交通服务热线短信,收到了此短信的用户为车主的可能性较大,weightv设置为0.7。
短信维度概率PS表示为:
作为一种补充方式,进一步的,可将短信维度表和语音维度表合并,如表3 所示:
表3语音短信维度表
进一步的,车主类Apps维度概率PApp根据如下获得:
获取用户使用的车主类Apps的上网数据,建立车主类Apps维度表,将车主类Apps分为n类,识别出使用过车主类Apps的用户,并统计其使用相应App 的次数Fre;
获取用户使用的车主类Apps的上网数据,建立车主类Apps维度表,识别出使用过车主类Apps的用户,并统计其使用相应App的次数Fre,PApp为通过车主类Apps维度判断用户为车主的概率:
PApp=weightapp,Fre>3
进一步的,将车主类Apps分为n类,通过设定不同的权重将n类车主类 Apps分类;
其中,将车主类Apps定义为:聚焦汽车消费领域,致力于为车主提供违章查询、洗车、保养、导航等汽车生活服务的Apps。
调研目前各应用市场出现的车主Apps,进行初步分类,主要分为:违章查询类、汽车服务类、停车类、洗车类、车载自动诊断系统ODB类、加油类、二手车类、汽车资讯类、司机版APP类。按照每类APP在识别车主用户时的可信度设置不同的权值。
收集目前各应用市场用户量较大、活跃度较高的车主Apps,进行抓包分析,建立车主Apps信息维表。
其中,根据需求,车主Apps信息维表设计如表4:
表4车主Apps信息维表
进一步的,通过设置w1,w2,...,wn来区分不同权重的车主类App判断用户为车主的概率;将w1,w2,...,wn分别对应违章查询类、汽车服务类、停车类、洗车类、车载自动诊断系统ODB类、加油类、二手车类、汽车资讯类、司机版APP 类等;
识别出使用过车主类Apps的用户,并统计其使用相应App的次数Fre, weightapp通过自定义设置获取,PApp为通过车主类Apps维度判断用户为车主的概率:
统计使用相应App的次数Fre,其中,weightapp的设置包括:将车主类Apps 分为n类,通过设定不同的权重将n类车主类Apps分类,第1类车主类Apps 到第n类车主类Apps对车主身份判定的确定度依次表示为w1,w2,...,wn, w1,w2,...wn均为自定义设置的值,其中:
可选的,将n设定为9,其中n类车主类Apps分别对应违章查询类、汽车服务类、停车类、洗车类、车载自动诊断系统ODB类、加油类、二手车类、汽车资讯类、司机版APP类,表示为w1,w2,...,w9,例如,可以分别设定值为0.6, 0.4,0.4,0.6,0.4,0.5,0.6,0.4,0.5。
进一步的,根据各维度对车主身份识别的贡献度,设定短信、语音、车主 APP维度的初始权重及初始阈值,其中,包括短信维度第二权重为WS2,语音维度第二权重为WV2,车主类Apps维度第二权重为WApp2,第二阈值Pt2, WS2+WV2+WApp2=1。
优选的,统计真实车主数据集中各维度的用户数的占比,如短信维度占0.1、语音维度占0.2,车主类Apps维度占0.1,归一化处理后则有短信维度第二权重设置为WS2=0.25,语音维度第二权重设置为为WV2=0.5,车主类Apps维度第二权重设置为WApp2=0.25。
进一步的,初始阈值也即第二阈值Pt2根据期望识别的车主数,由人为设定,可选的,将第二阈值Pt2设定到0.8到1.0之间的任一个数。
优选的,采用交叉验证来调整各维度权重,得到语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps维度第一权重WApp1,WS1+WV1+WApp1=1,以及第一阈值Pt。
进一步的,作为一种可选方式:
将语音维度中与语音端口号v1有交互的用户构建为第一测试集,将第一测试集中与短信端口号有交互的用户构建为第一验证集,将第一测试集中包含车主类Apps的用户构建为第二验证集;
将短信维度中与短信端口号s1有交互的用户构建为第二测试集,将第二测试集中与语音端口号有交互的用户构建为第三验证集,将第二测试集中包含车主类Apps的用户构建为第四验证集;
把第一验证集占第一测试集的大小叫做第一占比,把第二验证集占第一测试集的大小叫做第二占比,第三验证集占第二测试集的大小叫做第三占比,把第四验证集占第二测试集的大小叫做第四占比;例如,第一占比为:
统计第一验证集中与短信端口号交互的频次,把该频次叫做第一频次;
统计第二验证集中车主类Apps的频次,把该频次叫做第二频次;
统计第三验证集中与语音端口号交互的频次,把该频次叫做第三频次;
统计第四验证集中车主类Apps的频次,把该频次叫做第四频次。
作为一种可选方式,比较第一占比和第二占比的大小,若第一占比大于第二占比,则将短信维度第二权重WS2加上一个固定的数值a得到短信维度第一权重WS1,同时将车主类Apps维度第二权重WApp2减去一个固定的数值a得到车主类Apps维度第一权重WApp1;可选的,这个数值a为第一占比减去第二占比后的绝对值;
若第一占比小于第二占比,则将短信维度第二权重WS2减去一个固定的数值 a得到短信维度第一权重WS1,同时将车主类Apps维度第二权重WApp2加上一个固定的数值a得到车主类Apps维度第一权重WApp1;
同理,若第三占比小于第四占比,则将语音维度第二权重WV2加上b得到语音维度第一权重WV1,同时将车主类Apps维度第二权重WApp2减去b得到车主类 Apps维度第一权重WApp1;若第三占比大于第四占比,则将语音维度第二权重WV2减去b得到语音维度第一权重WV1,同时将车主类Apps维度第二权重WApp2加上 b得到车主类Apps维度第一权重WApp1,b为第三占比减去第四占比后的绝对值。
作为另一种可选方式,对比第一占比和第二占比,将短信维度第一权重WS1和车主类Apps维度第一权重WApp1按照第一占比:第二占比的比例分配权重;对比第三占比和第四占比,将语音维度第一权重WV1和车主类Apps维度第一权重 WApp1按照第三占比:第四占比的比例分配权重。
作为另一种可选方式,比较第一频次与第二频次大小,若第一频次大于第二频次,可选的,第一频次比第二频次每多一个频次,则将短信维度第二权重WS2增加一个固定数值c得到短信维度第一权重WS1,同时将车主类App的权重WApp2减少一个固定数值c得到车主类Apps维度第一权重WApp1;可选的,c可以取第一频次与第二频次之和的倒数。
若第三频次小于第四频次,则减小语音维度第二权重WV2得到语音维度第一权重WV1,同时增大车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1。
作为一种补充方式,进一步的,综合上述占比及频次调整各维度权重,其中,可将比较占比来调整第一权重的权值与比较频次来调整第一权重的权值取平均值,例如,比较将第一占比和第二占比得到的短信维度第一权重WS1,和比较第一频次和第二频次得到短信维度第一权重WS1取平均值得到最终确定的短信维度第一权重WS1;确定第一阈值Pt及语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps维度第一权重WApp1;
优选的,第一阈值Pt根据所要求的车主身份识别率动态确定,车主身份识别率是算得用户为车主的概率分布,第一阈值Pt是结合设备精度要求进行人为确定。
本发明以上实施例对本发明的目的、技术方案和优点进行了进一步详细说明,所应理解的是,以上所举实施方式或者实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内此外,术语“第一”、“第二”、“第三”、“第四”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量,由此,限定有“第一”、“第二”、“第三”、“第四”的特征可以明示或者隐含地包括至少一个该特征,不能理解为对本发明的限制。
Claims (8)
1.一种基于移动数据的车主身份识别方法,其特征在于,包括:
根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率,如果用户为车主身份的总概率大于第一阈值,则判断用户为车主身份。
2.根据权利要求1所述的基于移动数据的车主身份识别方法,其特征在于,根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率包括:
根据公式,计算用户为车主身份的总概率P为:
PV表示语音维度概率,PS表示短信维度概率,PApp表示车主类Apps维度概率;WV1表示语音维度第一权重,WS1表示短信维度第一权重,WApp1表示车主类Apps维度第一权重,WS1+WV1+WApp1=1。
3.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,所述语音维度概率PV包括:
<mrow>
<msub>
<mi>P</mi>
<mi>V</mi>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>Y</mi>
<mi>P</mi>
<mi>E</mi>
<mo>_</mo>
<mi>I</mi>
<mi>D</mi>
<mo>=</mo>
<mi>v</mi>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>w</mi>
<mi>e</mi>
<mi>i</mi>
<mi>g</mi>
<mi>h</mi>
<mi>t</mi>
<mi>v</mi>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>Y</mi>
<mi>P</mi>
<mi>E</mi>
<mo>_</mo>
<mi>I</mi>
<mi>D</mi>
<mo>=</mo>
<mi>v</mi>
<mn>2</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>CM</mi>
<mi>C</mi>
</msub>
<mo>&times;</mo>
<mfrac>
<mrow>
<msub>
<mi>CM</mi>
<mi>S</mi>
</msub>
</mrow>
<mrow>
<mi>P</mi>
<mi>N</mi>
</mrow>
</mfrac>
<mo>&times;</mo>
<mi>w</mi>
<mi>e</mi>
<mi>i</mi>
<mi>g</mi>
<mi>h</mi>
<mi>t</mi>
<mi>v</mi>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>Y</mi>
<mi>P</mi>
<mi>E</mi>
<mo>_</mo>
<mi>I</mi>
<mi>D</mi>
<mo>=</mo>
<mi>v</mi>
<mn>3</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,TYPE_ID表示设置语音端口号,v1表示包括车险专线及违章咨询电话;v2表示包括全国高速公路报警救援电话;v3表示包括车险、汽车品牌4s店电话;CMC表示用户与各端口的交互次数,CMS表示各语音端口一段时间内总的交互次数,PN表示一段时间内与语音维度表中端口号TYPE_ID有过交互的用户人数,weightv表示端口号TYPE_ID为v2对车主身份判定的确定度。
4.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,所述短信维度概率PS包括:
<mrow>
<msub>
<mi>P</mi>
<mi>S</mi>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>Y</mi>
<mi>P</mi>
<mi>E</mi>
<mo>_</mo>
<mi>I</mi>
<mi>D</mi>
<mo>=</mo>
<mi>s</mi>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>w</mi>
<mi>e</mi>
<mi>i</mi>
<mi>g</mi>
<mi>h</mi>
<mi>t</mi>
<mi>s</mi>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>Y</mi>
<mi>P</mi>
<mi>E</mi>
<mo>_</mo>
<mi>I</mi>
<mi>D</mi>
<mo>=</mo>
<mi>s</mi>
<mn>2</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,TYPE_ID表示设置短信端口号,s1表示包括违章短信发布平台、交巡警平台及ETC专用端口;s2表示包括交通服务热线;weights表示端口号TYPE_ID为s2对车主身份判定的确定度。
5.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,所述车主类Apps维度概率PApp包括:
PApp=weightapp,Fre>3
其中,Fre表示使用相应App的次数,weightapp的设置包括:
将车主类Apps分为n类,通过设定不同的权重将n类车主类Apps分类,第1类车主类Apps到第n类车主类Apps对车主身份判定的确定度依次表示为w1,w2,...,wn。
6.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps维度第一权重WApp1采用以下方式获得:
根据各维度对车主身份识别的贡献度,设定短信、语音、车主APP维度的初始权重及初始阈值,包括,短信维度第二权重WS2,语音维度第二权重WV2,车主类Apps维度第二权重WApp2,其中,WS2+WV2+WApp2=1;
采用交叉验证来调整各维度权重,得到语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps维度第一权重WApp1。
7.根据权利要求6所述的基于移动数据的车主身份识别方法,其特征在于,所述交叉验证具体包括:
将语音维度中与语音端口号v1有交互的用户构建为第一测试集,将第一测试集中与短信端口号有交互的用户构建为第一验证集,将第一测试集中包含车主类Apps的用户构建为第二验证集;
将短信维度中与短信端口号s1有交互的用户构建为第二测试集,将第二测试集中与语音端口号有交互的用户构建为第三验证集,将第二测试集中包含车主类Apps的用户构建为第四验证集;
把第一验证集占第一测试集的大小叫做第一占比,把第二验证集占第一测试集的大小叫做第二占比,第三验证集占第二测试集的大小叫做第三占比,把第四验证集占第二测试集的大小叫做第四占比;
计算第一验证集中与短信端口号交互的频次叫做第一频次;
计算第二验证集中车主类Apps的频次叫做第二频次;
计算第三验证集中与语音端口号交互的频次叫做第三频次;
计算第四验证集中车主类Apps的频次叫做第四频次;
比较第一占比和第二占比的大小,若第一占比大于第二占比,则增大短信维度第二权重WS2得到短信维度第一权重WS1,同时减小车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;若第三占比小于第四占比,则减小语音维度第二权重WV2得到语音维度第一权重WV1,同时增大车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;
比较第一频次与第二频次大小,若第一频次大于第二频次,则增大则增大短信维度第二权重WS2得到短信维度第一权重WS1,同时减小车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;若第三频次小于第二频次,则减小语音维度第二权重WV2得到语音维度第一权重WV1,同时增大车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1。
8.根据权利要求1所述的基于移动数据的车主身份识别方法,其特征在于,所述第一阈值Pt根据所要求的车主身份识别率动态确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710695091.9A CN107403019B (zh) | 2017-08-15 | 2017-08-15 | 一种基于移动数据的车主身份识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710695091.9A CN107403019B (zh) | 2017-08-15 | 2017-08-15 | 一种基于移动数据的车主身份识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107403019A true CN107403019A (zh) | 2017-11-28 |
CN107403019B CN107403019B (zh) | 2020-08-18 |
Family
ID=60398045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710695091.9A Active CN107403019B (zh) | 2017-08-15 | 2017-08-15 | 一种基于移动数据的车主身份识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107403019B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858974A (zh) * | 2019-02-18 | 2019-06-07 | 重庆邮电大学 | 已购车用户识别模型构建方法及识别方法 |
CN110879881A (zh) * | 2019-11-15 | 2020-03-13 | 重庆邮电大学 | 基于特征组分层和半监督随机森林的鼠标轨迹识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1978455A3 (en) * | 2003-09-23 | 2009-04-01 | Amazon.Com, Inc. | Personalised searchable library with highlighting capabilities and access to electronic images of text based on user ownership of corresponding physical text |
CN102118706A (zh) * | 2010-12-14 | 2011-07-06 | 北京星源无限传媒科技有限公司 | 一种基于手机广告用户细分的手机广告投放方法 |
CN102355664A (zh) * | 2011-08-09 | 2012-02-15 | 郑毅 | 一种基于用户的社交网络对用户身份进行识别与匹配的方法 |
CN105489021A (zh) * | 2015-12-31 | 2016-04-13 | 百度在线网络技术(北京)有限公司 | 一种基于用户行为数据的车主身份识别方法及装置 |
CN105761093A (zh) * | 2014-12-17 | 2016-07-13 | 华为技术有限公司 | 一种基于知识空间的行为结果评估方法以及装置 |
CN106056137A (zh) * | 2016-05-25 | 2016-10-26 | 南京大学 | 一种基于数据挖掘多分类算法的电信集团业务推荐方法 |
-
2017
- 2017-08-15 CN CN201710695091.9A patent/CN107403019B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1978455A3 (en) * | 2003-09-23 | 2009-04-01 | Amazon.Com, Inc. | Personalised searchable library with highlighting capabilities and access to electronic images of text based on user ownership of corresponding physical text |
CN102118706A (zh) * | 2010-12-14 | 2011-07-06 | 北京星源无限传媒科技有限公司 | 一种基于手机广告用户细分的手机广告投放方法 |
CN102355664A (zh) * | 2011-08-09 | 2012-02-15 | 郑毅 | 一种基于用户的社交网络对用户身份进行识别与匹配的方法 |
CN105761093A (zh) * | 2014-12-17 | 2016-07-13 | 华为技术有限公司 | 一种基于知识空间的行为结果评估方法以及装置 |
CN105489021A (zh) * | 2015-12-31 | 2016-04-13 | 百度在线网络技术(北京)有限公司 | 一种基于用户行为数据的车主身份识别方法及装置 |
CN106056137A (zh) * | 2016-05-25 | 2016-10-26 | 南京大学 | 一种基于数据挖掘多分类算法的电信集团业务推荐方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858974A (zh) * | 2019-02-18 | 2019-06-07 | 重庆邮电大学 | 已购车用户识别模型构建方法及识别方法 |
CN110879881A (zh) * | 2019-11-15 | 2020-03-13 | 重庆邮电大学 | 基于特征组分层和半监督随机森林的鼠标轨迹识别方法 |
CN110879881B (zh) * | 2019-11-15 | 2022-06-10 | 重庆邮电大学 | 基于特征组分层和半监督随机森林的鼠标轨迹识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107403019B (zh) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106384273B (zh) | 恶意刷单检测系统及方法 | |
US20220327533A1 (en) | Method and system for electronic communication | |
Goodman et al. | Using cellular telephones in vehicles: Safe or unsafe? | |
CN111160740A (zh) | 一种网约车风险控制系统及控制方法 | |
CN109829621A (zh) | 一种网约车派单方法及装置 | |
CN107392330B (zh) | 一种共享无人驾驶车还车时车况验证系统及方法 | |
CN107038610B (zh) | 一种无人驾驶出租车的乘客信任度评价方法 | |
EP3211925A1 (en) | Smart reminding method, system and apparatus | |
US20130073347A1 (en) | Vehicular citation management method and system | |
US20090233631A1 (en) | System for reporting incidents using a text message | |
US20050086099A1 (en) | Method for control of parked vehicles | |
CN104123834A (zh) | 出租车叫车管理结算系统与方法 | |
CN108259680B (zh) | 诈骗电话识别方法、装置以及用于识别诈骗电话的服务器 | |
CN108596653A (zh) | 一种优惠券异常使用检测系统、方法、设备及存储介质 | |
CN111553701A (zh) | 一种基于会话的风险交易确定方法和装置 | |
CN107403019A (zh) | 一种基于移动数据的车主身份识别方法 | |
JP2005157410A5 (zh) | ||
KR101246109B1 (ko) | 스마트 폰을 이용한 운전자 평가 관리 시스템 및 평가 방법 | |
CN107454275B (zh) | 一种报警信息的处理方法及其系统 | |
CN104731489B (zh) | 一种适用于转屏应用的隐私保护方法 | |
US20130013198A1 (en) | Navigation System Creating A Route Based On Certain Criteria Along The Route | |
CN108376429A (zh) | 停车场管理方法、停车场管理装置以及可读存储介质 | |
CN116011800A (zh) | 一种交通事件预警的方法及设备 | |
US20190272570A1 (en) | Method, device, and apparatus for generating a differential electronic blue invoice, and readable storage medium | |
JP5964223B2 (ja) | クレジットカード事前登録によるタクシー料金のカードレス決済システム及び該カードレス決済システム用のプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |