CN111163425A - 基于lbs轨迹的身份识别方法、电子装置及可读存储介质 - Google Patents

基于lbs轨迹的身份识别方法、电子装置及可读存储介质 Download PDF

Info

Publication number
CN111163425A
CN111163425A CN202010002176.6A CN202010002176A CN111163425A CN 111163425 A CN111163425 A CN 111163425A CN 202010002176 A CN202010002176 A CN 202010002176A CN 111163425 A CN111163425 A CN 111163425A
Authority
CN
China
Prior art keywords
sequence
sub
value
user
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010002176.6A
Other languages
English (en)
Other versions
CN111163425B (zh
Inventor
唐隆伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN202010002176.6A priority Critical patent/CN111163425B/zh
Publication of CN111163425A publication Critical patent/CN111163425A/zh
Application granted granted Critical
Publication of CN111163425B publication Critical patent/CN111163425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/60Context-dependent security
    • H04W12/69Identity-dependent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/22Traffic simulation tools or models

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Image Analysis (AREA)
  • Navigation (AREA)

Abstract

本发明涉及智能决策技术领域,揭露了一种基于LBS轨迹的身份识别方法,该方法包括:对预设用户群中每个用户的第一行程执行第一、第二处理,得到每个用户对应的第一特征因子集群,将第一特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型,对指定用户的第二行程执行第一、第二处理,得到指定用户的第二特征因子集群,将第二特征因子集群输入指定用户对应的身份识别模型,得到指定用户的身份识别结果。本发明还提出一种电子装置以及一种计算机可读存储介质。本发明可以提高用户身份识别的效率及准确度。

Description

基于LBS轨迹的身份识别方法、电子装置及可读存储介质
技术领域
本发明涉及智能决策技术领域,尤其涉及一种基于LBS轨迹的身份识别方法、电子装置及可读存储介质。
背景技术
基于位置的服务(Location Based Services,LBS),是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。LBS被广泛应用于多种行业,例如,交通服务、救援服务、基于位置的商品推荐服务、信息搜索服务等。
当前,利用LBS轨迹来判断用户的出行方式时,通常根据出行速度或者出行线路可判断出用户是否在乘坐火车、高铁、飞机,或者公交、步行,但是对于用户是在开车或者坐车的场景,因为两种情况下的出行轨迹和出行速度是一致的,而无法进行区分,这种情况下,通常还需要引入视频设备,采集人脸特征进行身份识别,处理流程长,效率低,且采集人脸特征时,容易受到光线、天气的影响,使得识别准确度不高。因此,亟需一种基于LBS轨迹的身份识别方法,以提高身份识别的效率及准确度。
发明内容
鉴于以上内容,有必要提供一种基于LBS轨迹的身份识别方法,旨在提高身份识别的效率及准确度。
本发明提供的基于LBS轨迹的身份识别方法,包括:
第一处理步骤:获取预设用户群中每个用户在第一预设时间段内的第一行程,对所述第一行程执行第一处理,得到所述每个用户对应的第一子行程集合;
第二处理步骤:对所述第一子行程集合中每个子行程执行第二处理,得到每个用户对应的第一特征因子集群;
训练步骤:将所述每个用户对应的特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型;
识别步骤:响应所述预设用户群中某一指定用户在第二预设时间段内的身份识别请求,获取所述指定用户在所述第二预设时间段内的第二行程,对所述第二行程执行所述第一处理、第二处理,得到所述指定用户对应的第二特征因子集群,将所述第二特征因子集群输入所述指定用户对应的身份识别模型,得到所述指定用户的身份识别结果。
可选的,所述第一行程、第二行程包括多个GPS点信息,所述对所述第一行程进行第一处理包括:
按照第一规则将所述第一行程划分为多个第三行程,所述第一规则为将每个第三行程的GPS点数量控制在预设阈值区间内;
按照第二规则将每个第三行程划分为多个第四行程,将第四行程的集合作为第一子行程集合,所述第二规则为:所述每个第三行程是按照第一预设数值的长度、第二预设数值的步长划分为多个第四行程。
可选的,所述GPS点信息包括地理位置点的经纬度、速度、角度、高度及时间戳,所述对所述第一子行程集合中每个子行程执行第二处理包括:
获取所述第一子行程集合中每个子行程对应的速度序列、角度序列、高度序列、经纬度序列;
采用最小二项式拟合曲线得到所述每个子行程对应的速度序列相对于角度序列的截距特征值;
计算所述每个子行程对应的速度序列的一阶值序列及二阶值序列、角度序列的一阶值序列及二阶值序列、高度序列的一阶值序列及二阶值序列;
计算所述每个子行程对应的卷积特征值;
获取所述每个子行程对应的最大值集、最小值集、均值集及标准差集;
计算所述每个子行程对应的加速度的自相关系数特征值;
计算所述每个子行程对应的频域特征集;
将所述每个子行程对应的速度序列、速度序列的一阶值序列及二阶值序列、角度序列、角度序列的一阶值序列及二阶值序列、高度序列、高度序列的一阶值序列及二阶值序列、经纬度序列、截距特征值、卷积特征值、加速度的自相关系数特征值、最大值集、最小值集、均值集、标准差集、频域特征集的集合作为所述每个子行程对应的特征因子集,将所述每个子行程对应的特征因子集的集合作为第一特征因子集群。
可选的,所述计算所述每个子行程对应的卷积特征值包括:
将所述每个子行程对应的速度序列与角度序列进行卷积,得到第一卷积序列,将所述第一卷积序列中数据的平均值作为第一卷积值;
将所述每个子行程对应的速度序列与高度序列进行卷积,得到第二卷积序列,将所述第二卷积序列中数据的平均值作为第二卷积值;
将所述每个子行程对应的速度序列的一阶值序列与角度序列的一阶值序列进行卷积,得到第三卷积序列,将所述第三卷积序列中数据的平均值作为第三卷积值;
将所述每个子行程对应的速度序列的一阶值序列与高度序列的一阶值序列进行卷积,得到第四卷积序列,将所述第四卷积序列中数据的平均值作为第四卷积值;
将所述每个子行程对应的速度序列的二阶值序列与角度序列的二阶值序列进行卷积,得到第五卷积序列,将所述第五卷积序列中数据的平均值作为第五卷积值;
将所述每个子行程对应的速度序列的二阶值序列与高度序列的二阶值序列进行卷积,得到第六卷积序列,将所述第六卷积序列中数据的平均值作为第六卷积值;
将所述每个子行程对应的第一、第二、第三、第四、第五及第六卷积值的平均值作为所述每个子行程的卷积特征值。
可选的,所述指定用户对应的身份识别模型的训练过程包括:
每隔第三预设时间,获取所述指定用户在所述第三预设时间段内的第三行程,对所述第三行程执行所述第一处理、第二处理,得到所述指定用户对应的第三特征因子集群;
将所述第三特征因子集群输入一个随机森林模型,得到所述指定用户对应的初始随机森林模型;
将第一预设数量的所述指定用户对应的初始随机森林模型的集合作为所述指定用户对应的初始随机森林模型集合;
获取所述指定用户的更新的第三行程,对所述更新的第三行程执行所述第一处理、第二处理,得到所述指定用户对应的更新的第三特征因子集群;
将所述更新的第三特征因子集群作为正样本,将所述预设用户群中其他用户的第一特征因子集群作为负样本,将所述正样本、负样本输入一个随机森林模型,得到所述指定用户对应的更新的随机森林模型;
将所述更新的随机森林模型加入所述指定用户对应的初始随机森林模型集合,得到所述指定用户对应的更新的随机森林模型集合;
将所述正样本、负样本输入所述更新的随机森林模型集合进行训练,淘汰所述更新的随机森林模型集合中准确度最低的随机森林模型,并根据最小化准确度损失函数来调整所述更新的随机森林模型集合中剩余随机森林模型的权重参数,得到所述指定用户对应的身份识别模型。
可选的,所述第二处理步骤还包括:
若所述第一子行程集合中某一子行程对应的速度序列中有一个速度大于第一速度阈值,或者所述速度序列中所有速度皆小于第二速度阈值,则从所述第一子行程集合中剔除所述子行程。
可选的,所述第二处理步骤还包括:
若所述第一子行程集合中某一子行程对应的经纬度序列中超过第二预设数量的经纬度与公交线路经纬度库中某条线路的公交站点对应的经纬度匹配,且所述经纬度序列中匹配的经纬度对应的GPS点信息中速度为0,则从所述第一子行程集合中剔除所述子行程。
此外,为实现上述目的,本发明还提供一种电子装置,该电子装置包括:存储器、处理器,所述存储器中存储有可在所述处理器上运行的身份识别程序,所述身份识别程序被所述处理器执行时实现如上所述的基于LBS轨迹的身份识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有身份识别程序,所述身份识别程序可被一个或者多个处理器执行,以实现上述基于LBS轨迹的身份识别方法的步骤。
相较现有技术,本发明通过对预设用户群中每个用户的第一行程执行第一处理、第二处理,得到每个用户对应的第一特征因子集群,将每个用户对应的第一特征因子集群输入随机森林模型集合中训练,得到每个用户对应的身份识别模型,使得模型与对应的用户的相关性更强,识别准确度会更高,同时执行第一处理对第一行程进行拆分时,利用第二规则(按照第一预设数值的长度、第二预设数值的步长)进行拆分,可便于后续充分提取每个子行程的特征,且使得数据量适中,不影响计算;然后,每隔第三预设时间,对模型进行优化迭代,淘汰随机森林模型集合中准确度最低的随机森林模型,同时调整随机森林模型集合中剩余随机森林模型的权重参数,使得模型的识别准确度更高;最后,对指定用户进行身份识别时,仅需将所述指定用户的第二特征因子集群输入所述指定用户对应的身份识别模型,即可得到所述指定用户的身份识别结果,故而本发明提高了身份识别的效率及准确度。
附图说明
图1为本发明电子装置一实施例的示意图;
图2为图1中的身份识别程序一实施例的程序模块图;
图3为本发明基于LBS轨迹的身份识别方法一实施例的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
如图1所示,为本发明电子装置1一实施例的示意图。电子装置1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,电子装置1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有身份识别程序10,所述身份识别程序10可被所述处理器12执行。图1仅示出了具有组件11-13以及身份识别程序10的电子装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对电子装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子装置1的内部存储单元,例如该电子装置1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件,例如存储本发明一实施例中的身份识别程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行身份识别程序10等。
网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述电子装置1与客户端(图中未画出)之间建立通信连接。
可选的,所述电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
在本发明的一实施例中,所述身份识别程序10被所述处理器12执行时实现如下第一处理步骤、第二处理步骤、训练步骤及识别步骤。
第一处理步骤:获取预设用户群中每个用户在第一预设时间段内的第一行程,对所述第一行程执行第一处理,得到所述每个用户对应的第一子行程集合。
本实施例中,所述第一行程、第二行程包括多个GPS点信息,所述对所述第一行程执行第一处理包括:
A1、按照第一规则将所述第一行程划分为多个第三行程;
A2、按照第二规则将每个第三行程划分为多个第四行程,将第四行程的集合作为第一子行程集合。
所述第一规则为:将每个第三行程的GPS点数量控制在预设阈值区间内。
本实施例中,所述预设阈值区间为360~3600,用以保证采集的GPS点数量足够,同时数据量不影响计算。
所述第二规则为:所述每个第三行程是按照第一预设数值的长度、第二预设数值的步长划分为多个第四行程。
本实施例中,采用256的长度、64的步长对第三行程进行划分。若划分后,最后一个第四行程的GPS点数量低于预设阈值区间的下限,则删除最后一个第四行程。
例如,若第1个第三行程包括361个GPS点,则第1个第四行程包括第1个~第256个GPS点的信息,第2个第四行程包括第65个~321个GPS点的信息。本实施例采用256的长度、64的步长来循环计算是为了充分提取一段行程中各个阶段的特征。
第二处理步骤:对所述第一子行程集合中每个子行程执行第二处理,得到每个用户对应的第一特征因子集群。
所述GPS点信息包括地理位置点的经纬度、速度、角度、高度及时间戳,所述对所述第一子行程集合中每个子行程执行第二处理包括:
B1、获取所述第一子行程集合中每个子行程对应的速度序列、角度序列、高度序列、经纬度序列。
本实施例中是以1秒为单位来采集GPS点信息的。
经纬度序列中的数据为各个子行程中的每个GPS点的经纬度值放大预设数量的倍数(例如,100倍)后得到的值。
B2、采用最小二项式拟合曲线得到所述每个子行程对应的速度序列相对于角度序列的截距特征值。
所述二项式的计算公式为:y=kx+b,其中,x代表角度序列,y代表速度序列,k为斜率特征,b为截距特征,曲线拟合时求k、b的值。本实施例中,仅提取b的值作为特征因子。
B3、计算所述每个子行程对应的速度序列的一阶值序列及二阶值序列、角度序列的一阶值序列及二阶值序列、高度序列的一阶值序列及二阶值序列。
本实施例通过python diff函数来计算速度序列、角度序列、高度序列的一阶值序列及二阶值序列。速度序列的一阶值序列为加速度序列,速度的二阶值序列为加加速度序列,通过计算速度序列、角度序列、高度序列的一阶值序列、二阶值序列可得到速度、角度、高度的多个特征。
B4、计算所述每个子行程对应的卷积特征值。
本实施例中,所述计算所述每个子行程对应的卷积特征值包括:
将所述每个子行程对应的速度序列与角度序列进行卷积,得到第一卷积序列,将所述第一卷积序列中数据的平均值作为第一卷积值;
将所述每个子行程对应的速度序列与高度序列进行卷积,得到第二卷积序列,将所述第二卷积序列中数据的平均值作为第二卷积值;
将所述每个子行程对应的速度序列的一阶值序列与角度序列的一阶值序列进行卷积,得到第三卷积序列,将所述第三卷积序列中数据的平均值作为第三卷积值;
将所述每个子行程对应的速度序列的一阶值序列与高度序列的一阶值序列进行卷积,得到第四卷积序列,将所述第四卷积序列中数据的平均值作为第四卷积值;
将所述每个子行程对应的速度序列的二阶值序列与角度序列的二阶值序列进行卷积,得到第五卷积序列,将所述第五卷积序列中数据的平均值作为第五卷积值;
将所述每个子行程对应的速度序列的二阶值序列与高度序列的二阶值序列进行卷积,得到第六卷积序列,将所述第六卷积序列中数据的平均值作为第六卷积值;
将所述每个子行程对应的第一、第二、第三、第四、第五及第六卷积值的平均值作为所述每个子行程的卷积特征值。
B5、获取所述每个子行程对应的最大值集、最小值集、均值集及标准差集。
最大值集包括速度序列、速度序列的一阶值序列、速度序列的二阶值序列、角度序列、角度序列的一阶值序列、角度序列的二阶值序列、高度序列、高度序列的一阶值序列、高度序列的二阶值序列、经纬度序列共10个序列中每个序列的数据最大值。
所述最小值集、均值集及标准差集的获取过程与最大值集的获取过程类似。
B6、计算所述每个子行程对应的加速度的自相关系数特征值。
本实施例采用stattools.acf函数计算加速度的自相关系数特征值。
B7、计算所述每个子行程对应的频域特征集。
所述频域特征集包括速度序列、速度序列的一阶值序列、速度序列的二阶值序列、角度序列、角度序列的一阶值序列、角度序列的二阶值序列、高度序列、高度序列的一阶值序列、高度序列的二阶值序列共9个序列中每个序列对应的频域特征。
以速度序列为例,其对应的频域特征的计算过程为:
对速度序列进行傅里叶变换,得到速度序列对应的频域信号序列;
用小波分析法提取所述频域信号序列的频域特征。
采用傅里叶变换,可将时域信号转变为频域信号,时域信号与频域信号是模拟信号的两个观察面。时域信号是把信号以时间轴为坐标进行表征;频域信号是把信号变为以频率轴为坐标进行表征。一般来说,时域的表征较为形象与直观,然而频域信号分析问题时则更为简练,剖析问题时更为深刻和方便。
然而,傅里叶变换得到的频域信号为静止的频域信号,无法反应出频域信号随着时间变化的趋势,故而引入了小波分析法。小波分析是一种信号的时间-频率分析方法,具有多分辨率分析的特点,在时域和频域都具有表征信号局部特征的能力,是一种窗口大小固定不变,但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。
B8、将所述每个子行程对应的速度序列、速度序列的一阶值序列及二阶值序列、角度序列、角度序列的一阶值序列及二阶值序列、高度序列、高度序列的一阶值序列及二阶值序列、经纬度序列、截距特征值、卷积特征值、加速度的自相关系数特征值、最大值集、最小值集、均值集、标准差集、频域特征集的集合作为所述每个子行程对应的特征因子集,将所述每个子行程对应的特征因子集的集合作为第一特征因子集群。
训练步骤:将所述每个用户对应的特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型。
所述随机森林模型集合包括预设数量(例如,50)的随机森林模型。
本实施例中,每个用户对应一个随机森林模型集合,用森林再连成森林的形式来共同对用户身份进行识别。
所述指定用户对应的身份识别模型的训练过程包括:
每隔第三预设时间(例如,每周),获取所述指定用户在所述第三预设时间段内的第三行程,对所述第三行程执行所述第一处理、第二处理,得到所述指定用户对应的第三特征因子集群;
将所述第三特征因子集群输入一个随机森林模型,得到所述指定用户对应的初始随机森林模型;
将第一预设数量的所述指定用户对应的初始随机森林模型的集合作为所述指定用户对应的初始随机森林模型集合;
获取所述指定用户的更新的第三行程,对所述更新的第三行程执行所述第一处理、第二处理,得到所述指定用户对应的更新的第三特征因子集群;
将所述更新的第三特征因子集群作为正样本,将所述预设用户群中其他用户的第一特征因子集群作为负样本,将所述正样本、负样本输入一个随机森林模型,得到所述指定用户对应的更新的随机森林模型;
将所述更新的随机森林模型加入所述指定用户对应的初始随机森林模型集合,得到所述指定用户对应的更新的随机森林模型集合;
将所述正样本、负样本输入所述更新的随机森林模型集合进行训练,淘汰所述更新的随机森林模型集合中准确度最低的随机森林模型,并根据最小化准确度损失函数来调整所述更新的随机森林模型集合中剩余随机森林模型的权重参数,得到所述指定用户对应的身份识别模型。
所述准确度损失函数的计算公式为:
Figure BDA0002353873450000101
其中,loss(qi,pi)为随机森林模型集合中第i个随机森林模型的准确度损失率,qi为随机森林模型集合中第i个随机森林模型的预测概率值,pi为随机森林模型集合中第i个随机森林模型的真实概率值,c为随机森林模型集合中随机森林模型的总数量。
识别步骤:响应所述预设用户群中某一指定用户在第二预设时间段内的身份识别请求,获取所述指定用户在所述第二预设时间段内的第二行程,对所述第二行程执行所述第一处理、第二处理,得到所述指定用户对应的第二特征因子集群,将所述第二特征因子集群输入所述指定用户对应的身份识别模型,得到所述指定用户的身份识别结果。
本实施例中,用户的身份识别结果为乘客或者司机。
在本发明的另一个实施例中,所述第二处理步骤还包括:
若所述第一子行程集合中某一子行程对应的速度序列中有一个速度大于第一速度阈值(例如,200KM/h),或者所述速度序列中所有速度皆小于第二速度阈值(例如,25KM/h),则从所述第一子行程集合中剔除所述子行程。
本实施例中,若速度序列中有一个速度大于第一速度阈值,可判断用户在乘坐飞机或高铁等高速工具。若速度序列中所有速度皆小于第二速度阈值,可判断用户未出行或者采用的是步行、自行车出行等低速出行方式。
在本发明的另一个实施例中,所述第二处理步骤还包括:
若所述第一子行程集合中某一子行程对应的经纬度序列中超过第二预设数量的经纬度与公交线路经纬度库中某条线路的公交站点对应的经纬度匹配,且所述经纬度序列中匹配的经纬度对应的GPS点信息中速度为0,则从所述第一子行程集合中剔除所述子行程。
本步骤的目的是剔除公交出行的行程。
本实施例基于LBS轨迹来对用户身份进行识别,先剔除子行程集合中高速(飞机、高铁等)、低速(步行、自行车等)出行方式,再通过匹配公交站点的经纬度信息来剔除公交出行方式,仅保留汽车出行的子行程,对于汽车出行时,用户是乘客还是司机,通过将汽车出行的子行程对应的特征因子集群输入该用户对应的身份识别模型,得到该用户的身份识别结果(乘客或者司机)。
由上述实施例可知,本发明提出的电子装置1,首先,通过对预设用户群中每个用户的第一行程执行第一处理、第二处理,得到每个用户对应的第一特征因子集群,将每个用户对应的第一特征因子集群输入随机森林模型集合中训练,得到每个用户对应的身份识别模型,使得模型与对应的用户的相关性更强,识别准确度会更高,同时执行第一处理对第一行程进行拆分时,利用第二规则(按照第一预设数值的长度、第二预设数值的步长)进行拆分,可便于后续充分提取每个子行程的特征,且使得数据量适中,不影响计算;然后,每隔第三预设时间,对模型进行优化迭代,淘汰随机森林模型集合中准确度最低的随机森林模型,同时调整随机森林模型集合中剩余随机森林模型的权重参数,使得模型的识别准确度更高;最后,对指定用户进行身份识别时,仅需将所述指定用户的第二特征因子集群输入所述指定用户对应的身份识别模型,即可得到所述指定用户的身份识别结果,故而本发明提高了身份识别的效率及准确度。
在其他实施例中,身份识别程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述身份识别程序10在电子装置1中的执行过程。
如图2所示,为图1中的身份识别程序10一实施例的程序模块图。
在本发明的一个实施例中,身份识别程序10包括第一处理模块110、第二处理模块120、训练模块130及识别模块140,示例性地:
所述第一处理模块110,用于获取预设用户群中每个用户在第一预设时间段内的第一行程,对所述第一行程执行第一处理,得到所述每个用户对应的第一子行程集合;
所述第二处理模块120,用于对所述第一子行程集合中每个子行程执行第二处理,得到每个用户对应的第一特征因子集群;
所述训练模块130,用于将所述每个用户对应的特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型;
所述识别模块140,用于响应所述预设用户群中某一指定用户在第二预设时间段内的身份识别请求,获取所述指定用户在所述第二预设时间段内的第二行程,对所述第二行程执行所述第一处理、第二处理,得到所述指定用户对应的第二特征因子集群,将所述第二特征因子集群输入所述指定用户对应的身份识别模型,得到所述指定用户的身份识别结果。
上述第一处理模块110、第二处理模块120、训练模块130及识别模块140等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
如图3所示,为本发明基于LBS轨迹的身份识别方法一实施例的流程图,该基于LBS轨迹的身份识别方法包括步骤S1-S4。
S1、获取预设用户群中每个用户在第一预设时间段内的第一行程,对所述第一行程执行第一处理,得到所述每个用户对应的第一子行程集合。
本实施例中,所述第一行程、第二行程包括多个GPS点信息,所述对所述第一行程执行第一处理包括:
A1、按照第一规则将所述第一行程划分为多个第三行程;
A2、按照第二规则将每个第三行程划分为多个第四行程,将第四行程的集合作为第一子行程集合。
所述第一规则为:将每个第三行程的GPS点数量控制在预设阈值区间内。
本实施例中,所述预设阈值区间为360~3600,用以保证采集的GPS点数量足够,同时数据量不影响计算。
所述第二规则为:所述每个第三行程是按照第一预设数值的长度、第二预设数值的步长划分为多个第四行程。
本实施例中,采用256的长度、64的步长对第三行程进行划分。若划分后,最后一个第四行程的GPS点数量低于预设阈值区间的下限,则删除最后一个第四行程。
例如,若第1个第三行程包括361个GPS点,则第1个第四行程包括第1个~第256个GPS点的信息,第2个第四行程包括第65个~321个GPS点的信息。本实施例采用256的长度、64的步长来循环计算是为了充分提取一段行程中各个阶段的特征。
S2、对所述第一子行程集合中每个子行程执行第二处理,得到每个用户对应的第一特征因子集群。
所述GPS点信息包括地理位置点的经纬度、速度、角度、高度及时间戳,所述对所述第一子行程集合中每个子行程执行第二处理包括:
B1、获取所述第一子行程集合中每个子行程对应的速度序列、角度序列、高度序列、经纬度序列。
本实施例中是以1秒为单位来采集GPS点信息的。
经纬度序列中的数据为各个子行程中的每个GPS点的经纬度值放大预设数量的倍数(例如,100倍)后得到的值。
B2、采用最小二项式拟合曲线得到所述每个子行程对应的速度序列相对于角度序列的截距特征值。
所述二项式的计算公式为:y=kx+b,其中,x代表角度序列,y代表速度序列,k为斜率特征,b为截距特征,曲线拟合时求k、b的值。本实施例中,仅提取b的值作为特征因子。
B3、计算所述每个子行程对应的速度序列的一阶值序列及二阶值序列、角度序列的一阶值序列及二阶值序列、高度序列的一阶值序列及二阶值序列。
本实施例通过python diff函数来计算速度序列、角度序列、高度序列的一阶值序列及二阶值序列。速度序列的一阶值序列为加速度序列,速度的二阶值序列为加加速度序列,通过计算速度序列、角度序列、高度序列的一阶值序列、二阶值序列可得到速度、角度、高度的多个特征。
B4、计算所述每个子行程对应的卷积特征值。
本实施例中,所述计算所述每个子行程对应的卷积特征值包括:
将所述每个子行程对应的速度序列与角度序列进行卷积,得到第一卷积序列,将所述第一卷积序列中数据的平均值作为第一卷积值;
将所述每个子行程对应的速度序列与高度序列进行卷积,得到第二卷积序列,将所述第二卷积序列中数据的平均值作为第二卷积值;
将所述每个子行程对应的速度序列的一阶值序列与角度序列的一阶值序列进行卷积,得到第三卷积序列,将所述第三卷积序列中数据的平均值作为第三卷积值;
将所述每个子行程对应的速度序列的一阶值序列与高度序列的一阶值序列进行卷积,得到第四卷积序列,将所述第四卷积序列中数据的平均值作为第四卷积值;
将所述每个子行程对应的速度序列的二阶值序列与角度序列的二阶值序列进行卷积,得到第五卷积序列,将所述第五卷积序列中数据的平均值作为第五卷积值;
将所述每个子行程对应的速度序列的二阶值序列与高度序列的二阶值序列进行卷积,得到第六卷积序列,将所述第六卷积序列中数据的平均值作为第六卷积值;
将所述每个子行程对应的第一、第二、第三、第四、第五及第六卷积值的平均值作为所述每个子行程的卷积特征值。
B5、获取所述每个子行程对应的最大值集、最小值集、均值集及标准差集。
最大值集包括速度序列、速度序列的一阶值序列、速度序列的二阶值序列、角度序列、角度序列的一阶值序列、角度序列的二阶值序列、高度序列、高度序列的一阶值序列、高度序列的二阶值序列、经纬度序列共10个序列中每个序列的数据最大值。
所述最小值集、均值集及标准差集的获取过程与最大值集的获取过程类似。
B6、计算所述每个子行程对应的加速度的自相关系数特征值。
本实施例采用stattools.acf函数计算加速度的自相关系数特征值。
B7、计算所述每个子行程对应的频域特征集。
所述频域特征集包括速度序列、速度序列的一阶值序列、速度序列的二阶值序列、角度序列、角度序列的一阶值序列、角度序列的二阶值序列、高度序列、高度序列的一阶值序列、高度序列的二阶值序列共9个序列中每个序列对应的频域特征。
以速度序列为例,其对应的频域特征的计算过程为:
对速度序列进行傅里叶变换,得到速度序列对应的频域信号序列;
用小波分析法提取所述频域信号序列的频域特征。
采用傅里叶变换,可将时域信号转变为频域信号,时域信号与频域信号是模拟信号的两个观察面。时域信号是把信号以时间轴为坐标进行表征;频域信号是把信号变为以频率轴为坐标进行表征。一般来说,时域的表征较为形象与直观,然而频域信号分析问题时则更为简练,剖析问题时更为深刻和方便。
然而,傅里叶变换得到的频域信号为静止的频域信号,无法反应出频域信号随着时间变化的趋势,故而引入了小波分析法。小波分析是一种信号的时间-频率分析方法,具有多分辨率分析的特点,在时域和频域都具有表征信号局部特征的能力,是一种窗口大小固定不变,但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。
B8、将所述每个子行程对应的速度序列、速度序列的一阶值序列及二阶值序列、角度序列、角度序列的一阶值序列及二阶值序列、高度序列、高度序列的一阶值序列及二阶值序列、经纬度序列、截距特征值、卷积特征值、加速度的自相关系数特征值、最大值集、最小值集、均值集、标准差集、频域特征集的集合作为所述每个子行程对应的特征因子集,将所述每个子行程对应的特征因子集的集合作为第一特征因子集群。
S3、将所述每个用户对应的特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型。
所述随机森林模型集合包括预设数量(例如,50)的随机森林模型。
本实施例中,每个用户对应一个随机森林模型集合,用森林再连成森林的形式来共同对用户身份进行识别。
所述指定用户对应的身份识别模型的训练过程包括:
每隔第三预设时间(例如,每周),获取所述指定用户在所述第三预设时间段内的第三行程,对所述第三行程执行所述第一处理、第二处理,得到所述指定用户对应的第三特征因子集群;
将所述第三特征因子集群输入一个随机森林模型,得到所述指定用户对应的初始随机森林模型;
将第一预设数量的所述指定用户对应的初始随机森林模型的集合作为所述指定用户对应的初始随机森林模型集合;
获取所述指定用户的更新的第三行程,对所述更新的第三行程执行所述第一处理、第二处理,得到所述指定用户对应的更新的第三特征因子集群;
将所述更新的第三特征因子集群作为正样本,将所述预设用户群中其他用户的第一特征因子集群作为负样本,将所述正样本、负样本输入一个随机森林模型,得到所述指定用户对应的更新的随机森林模型;
将所述更新的随机森林模型加入所述指定用户对应的初始随机森林模型集合,得到所述指定用户对应的更新的随机森林模型集合;
将所述正样本、负样本输入所述更新的随机森林模型集合进行训练,淘汰所述更新的随机森林模型集合中准确度最低的随机森林模型,并根据最小化准确度损失函数来调整所述更新的随机森林模型集合中剩余随机森林模型的权重参数,得到所述指定用户对应的身份识别模型。
所述准确度损失函数的计算公式为:
Figure BDA0002353873450000161
其中,loss(qi,pi)为随机森林模型集合中第i个随机森林模型的准确度损失率,qi为随机森林模型集合中第i个随机森林模型的预测概率值,pi为随机森林模型集合中第i个随机森林模型的真实概率值,c为随机森林模型集合中随机森林模型的总数量。
S4、响应所述预设用户群中某一指定用户在第二预设时间段内的身份识别请求,获取所述指定用户在所述第二预设时间段内的第二行程,对所述第二行程执行所述第一处理、第二处理,得到所述指定用户对应的第二特征因子集群,将所述第二特征因子集群输入所述指定用户对应的身份识别模型,得到所述指定用户的身份识别结果。
本实施例中,用户的身份识别结果为乘客或者司机。
在本发明的另一个实施例中,所述步骤S2还包括:
若所述第一子行程集合中某一子行程对应的速度序列中有一个速度大于第一速度阈值(例如,200KM/h),或者所述速度序列中所有速度皆小于第二速度阈值(例如,25KM/h),则从所述第一子行程集合中剔除所述子行程。
本实施例中,若速度序列中有一个速度大于第一速度阈值,可判断用户在乘坐飞机或高铁等高速工具。若速度序列中所有速度皆小于第二速度阈值,可判断用户未出行或者采用的是步行、自行车出行等低速出行方式。
在本发明的另一个实施例中,所述步骤S2还包括:
若所述第一子行程集合中某一子行程对应的经纬度序列中超过第二预设数量的经纬度与公交线路经纬度库中某条线路的公交站点对应的经纬度匹配,且所述经纬度序列中匹配的经纬度对应的GPS点信息中速度为0,则从所述第一子行程集合中剔除所述子行程。
本步骤的目的是剔除公交出行的行程。
本实施例基于LBS轨迹来对用户身份进行识别,先剔除子行程集合中高速(飞机、高铁等)、低速(步行、自行车等)出行方式,再通过匹配公交站点的经纬度信息来剔除公交出行方式,仅保留汽车出行的子行程,对于汽车出行时,用户是乘客还是司机,通过将汽车出行的子行程对应的特征因子集群输入该用户对应的身份识别模型,得到该用户的身份识别结果(乘客或者司机)。
由上述实施例可知,本发明提出的基于LBS轨迹的身份识别方法,首先,通过对预设用户群中每个用户的第一行程执行第一处理、第二处理,得到每个用户对应的第一特征因子集群,将每个用户对应的第一特征因子集群输入随机森林模型集合中训练,得到每个用户对应的身份识别模型,使得模型与对应的用户的相关性更强,识别准确度会更高,同时执行第一处理对第一行程进行拆分时,利用第二规则(按照第一预设数值的长度、第二预设数值的步长)进行拆分,可便于后续充分提取每个子行程的特征,且使得数据量适中,不影响计算;然后,每隔第三预设时间,对模型进行优化迭代,淘汰随机森林模型集合中准确度最低的随机森林模型,同时调整随机森林模型集合中剩余随机森林模型的权重参数,使得模型的识别准确度更高;最后,对指定用户进行身份识别时,仅需将所述指定用户的第二特征因子集群输入所述指定用户对应的身份识别模型,即可得到所述指定用户的身份识别结果,故而本发明提高了身份识别的效率及准确度。
此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等中的任意一种或者几种的任意组合。计算机可读存储介质中包括身份识别程序10,所述身份识别程序10被处理器执行时实现如下操作:
获取预设用户群中每个用户在第一预设时间段内的第一行程,对所述第一行程执行第一处理,得到所述每个用户对应的第一子行程集合;
对所述第一子行程集合中每个子行程执行第二处理,得到每个用户对应的第一特征因子集群;
将所述每个用户对应的特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型;
响应所述预设用户群中某一指定用户在第二预设时间段内的身份识别请求,获取所述指定用户在所述第二预设时间段内的第二行程,对所述第二行程执行所述第一处理、第二处理,得到所述指定用户对应的第二特征因子集群,将所述第二特征因子集群输入所述指定用户对应的身份识别模型,得到所述指定用户的身份识别结果。
本发明之计算机可读存储介质的具体实施方式与上述基于LBS轨迹的身份识别方法以及电子装置1的具体实施方式大致相同,在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于LBS轨迹的身份识别方法,应用于电子装置,其特征在于,所述方法包括:
第一处理步骤:获取预设用户群中每个用户在第一预设时间段内的第一行程,对所述第一行程执行第一处理,得到所述每个用户对应的第一子行程集合;
第二处理步骤:对所述第一子行程集合中每个子行程执行第二处理,得到每个用户对应的第一特征因子集群;
训练步骤:将所述每个用户对应的特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型;
识别步骤:响应所述预设用户群中某一指定用户在第二预设时间段内的身份识别请求,获取所述指定用户在所述第二预设时间段内的第二行程,对所述第二行程执行所述第一处理、第二处理,得到所述指定用户对应的第二特征因子集群,将所述第二特征因子集群输入所述指定用户对应的身份识别模型,得到所述指定用户的身份识别结果。
2.如权利要求1所述的基于LBS轨迹的身份识别方法,其特征在于,所述第一行程、第二行程包括多个GPS点信息,所述对所述第一行程执行第一处理包括:
按照第一规则将所述第一行程划分为多个第三行程,所述第一规则为将每个第三行程的GPS点数量控制在预设阈值区间内;
按照第二规则将每个第三行程划分为多个第四行程,将第四行程的集合作为第一子行程集合,所述第二规则为:所述每个第三行程是按照第一预设数值的长度、第二预设数值的步长划分为多个第四行程。
3.如权利要求2所述的基于LBS轨迹的身份识别方法,其特征在于,所述GPS点信息包括地理位置点的经纬度、速度、角度、高度及时间戳,所述对所述第一子行程集合中每个子行程执行第二处理包括:
获取所述第一子行程集合中每个子行程对应的速度序列、角度序列、高度序列、经纬度序列;
采用最小二项式拟合曲线得到所述每个子行程对应的速度序列相对于角度序列的截距特征值;
计算所述每个子行程对应的速度序列的一阶值序列及二阶值序列、角度序列的一阶值序列及二阶值序列、高度序列的一阶值序列及二阶值序列;
计算所述每个子行程对应的卷积特征值;
获取所述每个子行程对应的最大值集、最小值集、均值集及标准差集;
计算所述每个子行程对应的加速度的自相关系数特征值;
计算所述每个子行程对应的频域特征集;
将所述每个子行程对应的速度序列、速度序列的一阶值序列及二阶值序列、角度序列、角度序列的一阶值序列及二阶值序列、高度序列、高度序列的一阶值序列及二阶值序列、经纬度序列、截距特征值、卷积特征值、加速度的自相关系数特征值、最大值集、最小值集、均值集、标准差集、频域特征集的集合作为所述每个子行程对应的特征因子集,将所述每个子行程对应的特征因子集的集合作为第一特征因子集群。
4.如权利要求3所述的基于LBS轨迹的身份识别方法,其特征在于,所述计算所述每个子行程对应的卷积特征值包括:
将所述每个子行程对应的速度序列与角度序列进行卷积,得到第一卷积序列,将所述第一卷积序列中数据的平均值作为第一卷积值;
将所述每个子行程对应的速度序列与高度序列进行卷积,得到第二卷积序列,将所述第二卷积序列中数据的平均值作为第二卷积值;
将所述每个子行程对应的速度序列的一阶值序列与角度序列的一阶值序列进行卷积,得到第三卷积序列,将所述第三卷积序列中数据的平均值作为第三卷积值;
将所述每个子行程对应的速度序列的一阶值序列与高度序列的一阶值序列进行卷积,得到第四卷积序列,将所述第四卷积序列中数据的平均值作为第四卷积值;
将所述每个子行程对应的速度序列的二阶值序列与角度序列的二阶值序列进行卷积,得到第五卷积序列,将所述第五卷积序列中数据的平均值作为第五卷积值;
将所述每个子行程对应的速度序列的二阶值序列与高度序列的二阶值序列进行卷积,得到第六卷积序列,将所述第六卷积序列中数据的平均值作为第六卷积值;
将所述每个子行程对应的第一、第二、第三、第四、第五及第六卷积值的平均值作为所述每个子行程的卷积特征值。
5.如权利要求3所述的基于LBS轨迹的身份识别方法,其特征在于,所述指定用户对应的身份识别模型的训练过程包括:
每隔第三预设时间,获取所述指定用户在所述第三预设时间段内的第三行程,对所述第三行程执行所述第一处理、第二处理,得到所述指定用户对应的第三特征因子集群;
将所述第三特征因子集群输入一个随机森林模型,得到所述指定用户对应的初始随机森林模型;
将第一预设数量的所述指定用户对应的初始随机森林模型的集合作为所述指定用户对应的初始随机森林模型集合;
获取所述指定用户的更新的第三行程,对所述更新的第三行程执行所述第一处理、第二处理,得到所述指定用户对应的更新的第三特征因子集群;
将所述更新的第三特征因子集群作为正样本,将所述预设用户群中其他用户的第一特征因子集群作为负样本,将所述正样本、负样本输入一个随机森林模型,得到所述指定用户对应的更新的随机森林模型;
将所述更新的随机森林模型加入所述指定用户对应的初始随机森林模型集合,得到所述指定用户对应的更新的随机森林模型集合;
将所述正样本、负样本输入所述更新的随机森林模型集合进行训练,淘汰所述更新的随机森林模型集合中准确度最低的随机森林模型,并根据最小化准确度损失函数来调整所述更新的随机森林模型集合中剩余随机森林模型的权重参数,得到所述指定用户对应的身份识别模型。
6.如权利要求3至5任一项所述的基于LBS轨迹的身份识别方法,其特征在于,所述第二处理步骤还包括:
若所述第一子行程集合中某一子行程对应的速度序列中有一个速度大于第一速度阈值,或者所述速度序列中所有速度皆小于第二速度阈值,则从所述第一子行程集合中剔除所述子行程。
7.如权利要求3至5任一项所述的基于LBS轨迹的身份识别方法,其特征在于,所述第二处理步骤还包括:
若所述第一子行程集合中某一子行程对应的经纬度序列中超过第二预设数量的经纬度与公交线路经纬度库中某条线路的公交站点对应的经纬度匹配,且所述经纬度序列中匹配的经纬度对应的GPS点信息中速度为0,则从所述第一子行程集合中剔除所述子行程。
8.一种电子装置,其特征在于,该电子装置包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的身份识别程序,所述身份识别程序被所述处理器执行时实现如下步骤:
第一处理步骤:获取预设用户群中每个用户在第一预设时间段内的第一行程,对所述第一行程执行第一处理,得到所述每个用户对应的第一子行程集合;
第二处理步骤:对所述第一子行程集合中每个子行程执行第二处理,得到每个用户对应的第一特征因子集群;
训练步骤:将所述每个用户对应的特征因子集群输入随机森林模型集合中进行训练,得到每个用户对应的身份识别模型;
识别步骤:响应所述预设用户群中某一指定用户在第二预设时间段内的身份识别请求,获取所述指定用户在所述第二预设时间段内的第二行程,对所述第二行程执行所述第一处理、第二处理,得到所述指定用户对应的第二特征因子集群,将所述第二特征因子集群输入所述指定用户对应的身份识别模型,得到所述指定用户的身份识别结果。
9.如权利要求8所述的电子装置,其特征在于,所述身份识别程序被所述处理器执行时还实现如权利要求2至7任一项所述的基于LBS轨迹的身份识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有身份识别程序,所述身份识别程序可被一个或者多个处理器执行,以实现如权利要求1至7任一项所述的基于LBS轨迹的身份识别方法的步骤。
CN202010002176.6A 2020-01-02 2020-01-02 基于lbs轨迹的身份识别方法、电子装置及可读存储介质 Active CN111163425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010002176.6A CN111163425B (zh) 2020-01-02 2020-01-02 基于lbs轨迹的身份识别方法、电子装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010002176.6A CN111163425B (zh) 2020-01-02 2020-01-02 基于lbs轨迹的身份识别方法、电子装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN111163425A true CN111163425A (zh) 2020-05-15
CN111163425B CN111163425B (zh) 2020-09-18

Family

ID=70561155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010002176.6A Active CN111163425B (zh) 2020-01-02 2020-01-02 基于lbs轨迹的身份识别方法、电子装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN111163425B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112423224A (zh) * 2020-11-19 2021-02-26 杭州云深科技有限公司 基于wifi特征数据的居住地类型识别方法、电子设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156650A (zh) * 2014-08-08 2014-11-19 浙江大学 一种基于手部运动的用户身份识别方法
CN105447504A (zh) * 2015-11-06 2016-03-30 中国科学院计算技术研究所 一种交通模式行为识别方法及相应的识别模型构建方法
CN107784597A (zh) * 2017-09-19 2018-03-09 平安科技(深圳)有限公司 出行方式识别方法、装置、终端设备及存储介质
CN108229355A (zh) * 2017-12-22 2018-06-29 北京市商汤科技开发有限公司 行为识别方法和装置、电子设备、计算机存储介质、程序
CN108229567A (zh) * 2018-01-09 2018-06-29 北京荣之联科技股份有限公司 驾驶员身份识别方法及装置
WO2018120123A1 (en) * 2016-12-30 2018-07-05 Microsoft Technology Licensing, Llc Goal navigation
CN109145982A (zh) * 2018-08-17 2019-01-04 上海汽车集团股份有限公司 驾驶员的身份识别方法及装置、存储介质、终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156650A (zh) * 2014-08-08 2014-11-19 浙江大学 一种基于手部运动的用户身份识别方法
CN105447504A (zh) * 2015-11-06 2016-03-30 中国科学院计算技术研究所 一种交通模式行为识别方法及相应的识别模型构建方法
WO2018120123A1 (en) * 2016-12-30 2018-07-05 Microsoft Technology Licensing, Llc Goal navigation
CN107784597A (zh) * 2017-09-19 2018-03-09 平安科技(深圳)有限公司 出行方式识别方法、装置、终端设备及存储介质
CN108229355A (zh) * 2017-12-22 2018-06-29 北京市商汤科技开发有限公司 行为识别方法和装置、电子设备、计算机存储介质、程序
CN108229567A (zh) * 2018-01-09 2018-06-29 北京荣之联科技股份有限公司 驾驶员身份识别方法及装置
CN109145982A (zh) * 2018-08-17 2019-01-04 上海汽车集团股份有限公司 驾驶员的身份识别方法及装置、存储介质、终端

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112423224A (zh) * 2020-11-19 2021-02-26 杭州云深科技有限公司 基于wifi特征数据的居住地类型识别方法、电子设备和介质
CN112423224B (zh) * 2020-11-19 2022-07-01 杭州云深科技有限公司 基于wifi特征数据的居住地类型识别方法、电子设备和介质

Also Published As

Publication number Publication date
CN111163425B (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
CA3061281C (en) Verifying sensor data using embeddings
CN112069276B (zh) 地址编码方法、装置、计算机设备及计算机可读存储介质
CN104090970A (zh) 兴趣点的展现方法及装置
WO2018141368A1 (en) System and method for detecting and classifying recurrent stops of a vehicle fleet
CN104599002B (zh) 预测订单价值的方法及设备
CN112509317B (zh) 基于机器学习算法的公交实时到站预测方法、装置和设备
CN114970705B (zh) 基于多传感数据的行驶状态分析方法、装置、设备及介质
CN110533094B (zh) 一种用于驾驶员的评价方法和系统
CN108286973B (zh) 一种行驶数据校验方法及装置、及混合导航系统
CN111163425B (zh) 基于lbs轨迹的身份识别方法、电子装置及可读存储介质
CN116959265A (zh) 交通信息提示方法、装置、电子设备和可读存储介质
CN108827329B (zh) 城市导航方法、系统、设备及存储介质
CN114220191B (zh) 行车状态识别方法、装置、计算机设备及可读存储介质
CN115675528A (zh) 基于相似场景挖掘的自动驾驶方法和车辆
CN115164932A (zh) 车辆行驶距离确定方法、装置、计算机设备及存储介质
CN109711363B (zh) 车辆定位方法、装置、设备和存储介质
CN106781470B (zh) 城市道路的运行速度的处理方法及装置
CN110717386A (zh) 涉事对象追踪方法及装置、电子设备和非暂态存储介质
CN111582962B (zh) 一种服务状态识别方法及装置
CN118014382A (zh) 一种车辆运营状态判定方法、装置、设备及存储介质
CN114693777A (zh) 交通标志的空间位置确定方法、装置及电子设备
CN112749631A (zh) 基于图像识别的数据处理方法、装置、电子设备和介质
CN116631218A (zh) 停车场信息推荐方法、装置、计算机设备及存储介质
CN115238011A (zh) 校验对象的定位结果的方法、装置、设备、介质和产品
CN114492609A (zh) 识别颠簸路段的方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant