CN111159583A - 用户行为分析方法、装置、设备及存储介质 - Google Patents
用户行为分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111159583A CN111159583A CN201911407950.5A CN201911407950A CN111159583A CN 111159583 A CN111159583 A CN 111159583A CN 201911407950 A CN201911407950 A CN 201911407950A CN 111159583 A CN111159583 A CN 111159583A
- Authority
- CN
- China
- Prior art keywords
- user
- acquisition
- poi
- distribution
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pure & Applied Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请提供一种用户行为分析方法、装置、设备及存储介质。该方法包括:确定用户的多个停驻点;确定各个停驻点周围的兴趣点POI,并建立多个POI类别,每个POI类别包括:类型相同的POI;获取用户在各个POI类别上的出行行为;根据多个POI类别和用户在各个POI类别上的出行行为,确定用户关于POI类别变量和行为变量的联合概率分布。本申请的方法,确定了用户关于POI类别变量和行为变量的联合概率分布,提供了用户的行为分布情况。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种用户行为分析方法、装置、设备及存储介质。
背景技术
用户根据不同的需要,会有不同的出行行为,例如老师需要去学校上班、学生需要去学校上学、家长需要去学校接送孩子等,根据用户的历史的出行行为预测用户的出行行为对城市规划、交通管理和基于位置的服务有重要意义。准确的用户出行行为预测不仅能为人们的日常生活提供便利的服务如路径推荐、事务提醒等,还可以帮助服务提供商进行正确的客户定位,也可以对交通管理和城市规划提供更好的支持。
现有技术实现用户出行行为预测主要是利用主题模型实现的,即首先采集用户在不同时间上的停驻点,得到用户对应的停驻点集合,将用户对应停驻点集合输入至主题模型,得到用户对应的兴趣点(Point of Interest,POI)类别分布。
然而现有技术只能提供用户对应的POI类别分布,无法给出用户的行为分布情况。
发明内容
本申请提供一种用户行为分析方法、装置、设备及存储介质,以提供用户的行为分布情况。
第一方面,本申请提供一种用户行为分析方法,包括:确定用户的多个停驻点;确定各个停驻点周围的兴趣点POI,并建立多个POI类别,每个POI类别包括:类型相同的POI;获取用户在各个POI类别上的出行行为;根据多个POI类别和用户在各个POI类别上的出行行为,确定用户关于POI类别变量和行为变量的联合概率分布。其中,本申请提供的是一种用户行为分析方法,相对于将所有用户的停驻点一起输入主题模型进行训练的方法,本申请结合不同用户的历史出行行为,确定不同用户关于POI类别变量和行为变量的联合概率分布,以提供了用户的行为分布情况。
可选的,确定用户的多个停驻点之前,还包括:采集用户通过终端设备与其他设备之间传输的多个信令数据;获取多个信令数据各自对应的采集时间和采集地点;根据多个信令数据各自对应的采集时间和采集地点,确定各个采集地点对应的采集时间段;相应的,确定用户的多个停驻点,包括:根据各个采集地点对应的采集时间段,确定用户的多个停驻点。通过该方法可以有效的确定停驻点。
可选的,根据多个信令数据各自对应的采集时间和采集地点,确定各个采集地点对应的采集时间段,包括:针对每个采集地点,确定采集地点上的最小采集时间和最大采集时间,以得到采集地点对应的采集时间段。
可选的,根据各个采集地点对应的采集时间段,确定用户的多个停驻点,包括:在各个采集地点中删除采集时间段小于预设时间段的采集地点,以得到用户的多个停驻点,从而剔除采集地点中用户驻留时间短的地点,筛选出更符合用户出行习惯的用户行为,进一步提高了预测结果的准确性。
可选的,通过如下公式确定联合概率分布:
其中,Ck,i表示第k个用户对应的第i个POI类别,当i是一个变量,用户为第k个用户时,Ck,i表示POI类别变量,zk,i表示第k个用户在第i个POI类别上的出行行为,当i是一个变量,用户为第k个用户时,zk,i表示行为变量,α、β分别是超参数,Uk表示第k个用户,P(φt|β)表示从以β为参数的迪利克雷分布中,采样出第t个出行行为的多项式分布的概率,φt为第t个出行行为的多项式分布,多项式分布是第t个出行行为到POI类别上的分布情况,其中t=1,…T,T是所有出行行为的个数,P(θk|α)表示从以α为参数的迪利克雷分布中,采样出属于第k个用户的出行行为的分布的概率,θk表示第k个用户的出行行为的分布,P(zk,t,i|θk,Uk)表示在给定用户Uk和分布θk的情况下,采样出出行行为zk,t,i的概率,zk,t,i表示第k个用户在第i个POI类别上的第t个出行行为,P(Ck,i|zk,t,i,φt)表示在给定zk,t,i和φt下,采样出Ck,i的概率。
第二方面,本申请提供一种用户行为分析装置,包括:第一确定模块、处理模块、第一获取模块和第二确定模块,第一确定模块用于确定用户的多个停驻点;处理模块用于确定各个停驻点周围的兴趣点POI,并建立多个POI类别,每个POI类别包括:类型相同的POI;第一获取模块用于获取用户在各个POI类别上的出行行为;第二确定模块用于根据多个POI类别和用户在各个POI类别上的出行行为,确定用户关于POI类别变量和行为变量的联合概率分布。
可选的,还包括:采集模块、第二获取模块和第三确定模块,采集模块用于采集用户通过终端设备与其他设备之间传输的多个信令数据;第二获取模块用于获取多个信令数据各自对应的采集时间和采集地点;第三确定模块用于根据多个信令数据各自对应的采集时间和采集地点,确定各个采集地点对应的采集时间段;相应的,第一确定模块具体用于根据各个采集地点对应的采集时间段,确定用户的多个停驻点。
可选的,第三确定模块具体用于针对每个采集地点,确定采集地点上的最小采集时间和最大采集时间,以得到采集地点对应的采集时间段。
可选的,第一确定模块具体用于在各个采集地点中删除采集时间段小于预设时间段的采集地点,以得到用户的多个停驻点。
第三方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当计算机执行指令被处理器执行时用于实现如第一方面或第一方面的可选方式所述的用户行为分析方法。
第四方面,本申请实施例提供一种计算机程序产品,包括计算机执行指令,当计算机执行指令被处理器执行时用于实现如第一方面或第一方面的可选方式所述的用户行为分析方法。
本申请提供的一种用户行为分析方法、装置、设备及存储介质,通过获取用户的停驻点、停驻点周围的POI类别以及用户在各个POI类别上的用户行为信息,确定用户关于POI类别变量和行为变量的联合概率分布,以提供用户的行为分布情况。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本申请提供的一种用户行为分析方法的流程示意图;
图2为本申请提供的一种用户行为分析设备的界面示意图;
图3为本申请提供的另一种用户行为分析方法的流程示意图;
图4为本申请提供的用户行为分析装置的结构示意图;
图5为本申请提供的用户行为分析设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本申请所涉及的名词进行解释:
POI:包括四方面信息,名称、类别、坐标、分类,全面的POI讯息是丰富导航地图的必备资讯,及时的POI兴趣点能提醒用户路况的分支及周边建筑的详尽信息,也能在方便导航中查到你所需要的各个地方,选择最为便捷和通畅的道路来进行路径规划。
信令:在网络中传输的用来专门控制电路的信号。
联合概率分布:联合分布函数是指多维分布函数,随机向量的分布函数。
本申请实施例提供的用户行为分析设备,可以实现与其他设备之间的数据传输,用以获取用户的历史出行行为数据,从而对用户的出行行为进行预测,并且可以将预测结果与其他设备实现共享,从而能为人们的日常生活提供便利的服务如路径推荐、事务提醒等,还可以帮助服务提供商进行正确的客户定位,也可以对交通管理和城市规划提供更好的支持。
可选的,本申请中的用户行为分析设备可以是个人电脑(Personal Computer,PC)、手机、车载终端等设备,本申请对此不做限制。
如上所述,现有技术实现用户出行行为预测主要是利用主题模型实现的,即首先采集用户在不同时间上的停驻点,得到用户对应的停驻点集合,将用户对应停驻点集合输入至主题模型,得到用户对应的兴趣点类别分布,然而现有技术只能提供用户对应的POI类别分布,无法给出用户的行为分布情况。本申请提供了一种用户行为分析方法、装置、设备及存储介质,本申请的主旨思想是:用户行为分析设备结合用户历史出行行为,通过获取用户的停驻点、停驻点周围的POI类别以及用户在各个类别上的用户出行行为信息,确定该用户关于POI类别变量和行为变量的联合概率分布。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请提供的一种用户行为分析方法的流程示意图。该方法由用户行为分析设备的部分或者全部执行,所谓用户行为分析设备的部分可以指用户行为分析设备中的处理器。下面以用户行为分析设备为执行主体对用户行为分析方法进行说明。如图1所示,该方法包括如下步骤:
步骤S101:用户行为分析设备确定用户的多个停驻点。
步骤S102:用户行为分析设备确定各个停驻点周围的兴趣点POI,并建立多个POI类别。
步骤S103:用户行为分析设备获取用户在各个POI类别上的出行行为。
步骤S104:用户行为分析设备根据多个POI类别和用户在各个POI类别上的出行行为,确定用户关于POI类别变量和行为变量的联合概率分布。
针对步骤S101进行如下说明:
可选的,用户行为分析设备可以是用户随身携带的移动终端设备或者是用户的车载终端设备等移动设备,那么用户分析设备自身可以实时获取用户的位置以及其他信息,从而确定用户的多个停驻点。
可选的,用户行为分析设备也可以是个人电脑或者是后台服务器等固定设备,用户行为分析设备通过接收其他移动设备的信息确定停驻点,该信息包括但不限于用户的历史出行位置信息。
针对步骤S102和步骤S103进行如下说明:
POI是一个地理信息系统的重要资讯,包含了名称、类别、坐标、分类四个方面的信息,示范性的,例如青英餐厅的POI信息,包含其名称青英餐厅、类别家常菜、坐标经度116.093226,纬度40.004965以及分类美食类四个信息,又例如荷塘味道的POI信息,包含其名称荷塘味道、类别私房菜、坐标经度116.347512091,纬度40.4150550647以及分类美食类四个信息,用户行为分析设备可以根据POI的坐标信息,确定停驻点周围的兴趣点POI,通过POI的分类等信息可以挖掘用户的出行行为,方便对用户出行行为在地图上做标记。
例如:图2为本申请提供的一种用户行为分析设备的界面图,如图2所示,界面上显示了某地的地图,地图上包含很多个POI,示范性的,标记了A和B两个POI,A为某学校的POI,其POI信息包含其名称北京科技大学外国语学院、类别大学、坐标经纬度以及分类学校类四个信息,B为某医院的POI,其POI信息包含其名称北京大学第六医院、类别三甲医院、坐标经纬度以及分类医院类四个信息。
可选的,用户行为分析设备建立多个POI类别,每个POI类别包括:类型相同的POI,其中,该POI类别可以是POI二级类别,比如:某个POI的类别是学校,另一个POI的类别是医院。或者,该POI类别是POI三级类别,比如:某个POI类别是A学校,另一个POI的类别是B医院。其中,三级类别的划分粒度细于二级类比的划分。
其中,用户在每个POI上具有对应的出行行为,比如:用户去某医院的出现行为是看病,去某学校的出行行为是上班。
可选的,用户行为分析设备可以通过获取用户的某些特征判断出用户的出行行为,例如可以是根据用户在某个POI类比中各个POI上的驻留时间长短或者驻留时间段判断其行为,也可以根据用户的年龄等特征判断其行为,也可以将多个特征结合到一起判断用户的出行行为;可选的,用户行为分析设备也可以直接获取用户的出行行为,或者直接接收其他终端设备统计到的用户行为,本申请对此不作具体限制。
针对步骤S104进行如下说明:
可选的,用户行为分析设备确定用户关于POI类别变量和行为变量的联合概率分布可以采用作者主题模型来建立,用户出行主题模型相应的联合概率分布可表示如下:
其中,Ck,i表示第k个用户对应的第i个POI类别,当i是一个变量,用户为第k个用户时,Ck,i表示POI类别变量,zk,i表示第k个用户在第i个POI类别上的出行行为,当i是一个变量,用户为第k个用户时,zk,i表示行为变量,α、β分别是超参数,Uk表示第k个用户,P(φt|β)表示从以β为参数的迪利克雷分布中,采样出第t个出行行为的多项式分布的概率,φt为第t个出行行为的多项式分布,多项式分布是第t个出行行为到POI类别上的分布情况,其中t=1,…T,T是所有出行行为的个数,P(θk|α)表示从以α为参数的迪利克雷分布中,采样出属于第k个用户的出行行为的分布的概率,θk表示第k个用户的出行行为的分布,P(zk,t,i|θk,Uk)表示在给定用户Uk和分布θk的情况下,采样出出行行为zk,ti的概率,zk,ti表示第k个用户在第i个POI类别上的第t个出行行为,P(Ck,i|zk,t,i,φt)表示在给定zk,t,i和φt下,采样出Ck,i的概率。
其中,上述Ck,i和zk,i是通过步骤S101-步骤S103获得的POI类别变量和行为变量。α、β分别是模型的超参数,这两个超参数是在计算之前预先随机设置的参数值,狄利克雷分布是指多项式分布的分布,对于给定的α和β,可以通过P(θk|α)和P(φt|β)分别求得第k个用户的出行行为的分布的概率以及第t个出行行为的多项式分布的概率。上述的POI类别可以是某时间段内的POI类别,比如某一天的POI类别或者多天的POI类别,或者是某一天白天的POI类别或者多天白天的POI类别,本申请对此不做限制。
可选的,用户分析设备可以通过吉布斯算法采样方法确定P(zk,t,i|θk,Uk),具体如下:
其中wi表示第i个POI在去重后的POI类别集合中的编号,zk,t,-i表示第k个用户在除第i个POI类别之外的其他POI类别上的第t个出行行为,w-i表示去重后的POI类别集合中去除第i个POI类别之后的其他POI类别的编号集合,表示去重后的POI类别集合中第m个POI类别上出现第t个出行行为的次数,V是去重后的POI类别集合中POI类别的个数,表示第k个用户出现第t个出行行为的次数。其中,j′从1到T,m从1到V。
当wi从1取值V时,即将所有的POI类比遍历完之后,即可得到上述的用户的出行行为zk,t,i。
本实施例用户行为分析设备通过确定用户的停驻点、停驻点周围的POI以及用户在各个POI类别上的用户行为信息,结合用户的出行行为特征,确定了用户关于POI类别变量和行为变量的联合概率分布,以提供用户的行为分布情况。
图3为本申请提供的另一种用户行为分析方法的流程示意图,图3是在图1所述实施例的基础上,进一步的,在步骤S101之前,还包括:
步骤S100a:用户行为分析设备采集用户通过终端设备与其他设备之间传输的多个信令数据。
步骤S100b:用户行为分析设备获取多个信令数据各自对应的采集时间和采集地点。
步骤S100c:用户行为分析设备根据多个信令数据各自对应的采集时间和采集地点,确定各个采集地点对应的采集时间段。
相应的,步骤S101包括:
步骤S101a:用户行为分析设备根据各个采集地点对应的采集时间段,确定用户的多个停驻点。
下面针对步骤S100a至S100c进行如下说明:
信令数据是用户行为分析设备与发射基站或者其他设备之间的通信数据,只要具有通信功能的用户行为分析设备开机并接入网络,信令数据就开始产生了,不管用户在用户行为分析设备上进行何种通讯行为,用户行为分析设备都会与基站发送通信关系,由于通信基站的位置时固定且已知的,基站的位置信息就反映了用户的位置,因此用户行为分析设备的信令数据字段中始终带有用户的时间和位置等信息。
由于设备通信过程中信令数据样本量大、数据客观、全面、采样不会有明显的倾向性,且信令数据具有较强的时空持续性,可以观测到用户出行的整个过程,这是任何其他数据无法比拟的,因此本实施例通过信令数据生成用户出行行为的观测样本,预测结果更加准确。
可选的,用户行为分析设备内部可以安装全球定位系统(Global PositioningSystem,GPS),实时获取用户准确的地理位置、及精确的时间信息。
用户行为分析设备获取到信令数据后需要对数据进行处理从而获得精准且有代表性的采样数据,获得主题模型的样本。
可选的,一种处理信令数据的方式是:获取各个采集地点及对应的采集时间,确定一个预设时间起始点和终止点,例如预设时间起始点为8:00,预设时间终止点为20:00,获取在预设时间起始点和预设时间终止点范围之间的采集时间对应的采集地点,获取到的采集地点即为采样样本需要的用户停驻点。获取一定时间范围内的采集地点,从而可以对用户不同时间段的出行行为进行预测,提高预测结果的准确性。
针对上述预设时间起始点和预设时间终止点,可以根据具体情况做不同调整,本申请不做具体限制。
可选的,一种处理信令数据的方式是:获取各个采集地点及对应的采集时间,在一定时间阈值内,例如24小时之内,统计同一采集地点的采集时间,合并所有对应的时间,只保留最大时间和最小时间,分别表示用户到此地区的开始时间和结束时间,tstart表示开始时间,tend表示结束时间,设置一个时间段阈值参数Δ,如果tend-tstart<Δ,则去掉该采集地点及其对应的采集时间,因而过滤掉了用户驻留时间短的停驻点,余下的数据即采样样本需要的用户停驻点,提高了预测结果的准确性。
针对上述时间阈值和时间段阈值参数Δ,可以根据具体情况设置,本申请对此不作具体限制。
获取的信令数据中的采集地点一般为经纬度坐标,而且获取到的大量信令数据是无序的,合并同一采集地点的所有时间需要将采集地点的经度和纬度一一对比,耗费时间,可选的,为了便于快速的合并相同的采集地点和对应的采集时间,用geohash算法计算经纬度的地理区域编码gi=Geohash(pi),pi表示采集地点的经纬度坐标,gi表示采集地点的字符串,对于一个用经纬度坐标表示的采集地点,用geohash算法表示的步骤是:首先将经纬度变成二进制,比如这样一个点(39.923201,116.390705),纬度的范围是(-90,90),其中间值为0,对于纬度39.923201,在区间(0,90)中,因此得到一个1;(0,90)区间的中间值为45度,纬度39.923201小于45,因此得到一个0,依次计算下去,即可得到纬度的二进制表示,同理得到经度的二进制表示。第2步,就是将经纬度合并,经度占偶数位,纬度占奇数位。第3步,按照Base32编码表进行编码。运用geohash算法比直接用经纬度的表示方法高效很多,可以将二维的经纬度数据转换成一个字符串,便于用户出行分析设备对采集地点进行处理。
本实施例提供了获取用户的多个停驻点的方法,通过获取用户的信令数据对应的采集地点和采集时间,确定用户出行的多个停驻点,由于用户的信令数据存在于用户出行分析设备的每一个通信过程中,因此能够更准确有效的提供用户的行为分布情况。
图4为本申请一实施例提供的用户行为分析装置的结构示意图,如图4所示,本实施例的装置包括:
第一确定模块401,用于确定用户的多个停驻点。
处理模块402,用于确定各个停驻点周围的兴趣点POI,并建立多个POI类别。
第一获取模块403,用于获取用户在各个POI类别上的出行行为。
第二确定模块404,用于根据多个POI类别和用户在各个POI类别上的出行行为,确定用户关于POI类别变量和行为变量的联合概率分布。
可选的,还包括:
采集模块405,用于采集用户通过终端设备与其他设备之间传输的多个信令数据。
第二获取模块406,用于获取多个信令数据各自对应的采集时间和采集地。
第三确定模块407,用于根据多个信令数据各自对应的采集时间和采集地点,确定各个采集地点对应的采集时间段。
相应的,第一确定模块401具体用于根据各个采集地点对应的采集时间段,确定用户的多个停驻点。
可选的,第三确定模块407具体用于针对每个采集地点,确定采集地点上的最小采集时间和最大采集时间,以得到采集地点对应的采集时间段。
可选的,第一确定模块401具体用于在各个采集地点中删除采集时间段小于预设时间段的采集地点,以得到用户的多个停驻点。
本申请实施例的字体静默安装装置,可以用于执行本申请上述各方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
图5为本申请提供的用户行为分析设备的结构示意图。如图5所示,该用户行为分析设备包括:处理器51和存储器52。
所述存储器52存储计算机执行指令。
所述处理器51执行所述存储器52存储的计算机执行指令,使得所述处理器52执行上述的用户行为分析方法。
可选地,该用户行为分析设备还包括:收发器53,用于与其他网络设备或者终端设备实现通信。
本申请实施例的用户行为分析设备,可以用于执行本申请上述各方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述任一所述的用户行为分析方法。
本申请实施例还提供一种计算机程序产品,该程序产品包括计算机执行指令,计算机执行指令被处理器执行时用于实现上述任一所述的用户行为分析方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。
Claims (12)
1.一种用户行为分析方法,其特征在于,包括:
确定用户的多个停驻点;
确定各个所述停驻点周围的兴趣点POI,并建立多个POI类别,每个所述POI类别包括:类型相同的POI;
获取所述用户在各个所述POI类别上的出行行为;
根据所述多个POI类别和所述用户在各个所述POI类别上的出行行为,确定所述用户关于POI类别变量和行为变量的联合概率分布。
2.根据权利要求1所述的方法,其特征在于,所述确定用户的多个停驻点之前,还包括:
采集所述用户通过终端设备与其他设备之间传输的多个信令数据;
获取所述多个信令数据各自对应的采集时间和采集地点;
根据所述多个信令数据各自对应的采集时间和采集地点,确定各个所述采集地点对应的采集时间段;
相应的,所述确定用户的多个停驻点,包括:
根据各个所述采集地点对应的采集时间段,确定用户的多个停驻点。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个信令数据各自对应的采集时间和采集地点,确定各个所述采集地点对应的采集时间段,包括:
针对每个所述采集地点,确定所述采集地点上的最小采集时间和最大采集时间,以得到所述采集地点对应的采集时间段。
4.根据权利要求2或3所述的方法,其特征在于,所述根据各个所述采集地点对应的采集时间段,确定用户的多个停驻点,包括:
在各个所述采集地点中删除采集时间段小于预设时间段的采集地点,以得到所述用户的多个停驻点。
5.根据权利要求1-3任一项所述的方法,其特征在于,通过如下公式确定所述联合概率分布:
其中,Ck,i表示第k个用户对应的第i个POI类别,当i是一个变量,所述用户为第k个用户时,Ck,i表示所述POI类别变量,zk,i表示所述第k个用户在所述第i个POI类别上的出行行为,当i是一个变量,所述用户为第k个用户时,zk,i表示所述行为变量,α、β分别是超参数,Uk表示所述第k个用户,P(φt|β)表示从以β为参数的迪利克雷分布中,采样出第t个出行行为的多项式分布的概率,φt为第t个出行行为的多项式分布,所述多项式分布是第t个出行行为到POI类别上的分布情况,其中t=1,…T,T是所有出行行为的个数,P(θk|α)表示从以α为参数的迪利克雷分布中,采样出属于所述第k个用户的出行行为的分布的概率,θk表示所述第k个用户的出行行为的分布,P(zk,t,i|θk,Uk)表示在给定所述用户Uk和所述分布θk的情况下,采样出出行行为zk,t,i的概率,zk,t,i表示所述第k个用户在所述第i个POI类别上的第t个出行行为,P(Ck,i|zk,t,i,φt)表示在给定所述zk,t,i和所述φt下,采样出所述Ck,i的概率。
6.一种用户行为分析装置,其特征在于,包括:
第一确定模块,用于确定用户的多个停驻点;
处理模块,用于确定各个所述停驻点周围的兴趣点POI,并建立多个POI类别,每个所述POI类别包括:类型相同的POI;
第一获取模块,用于获取所述用户在各个所述POI类别上的出行行为;
第二确定模块,用于根据所述多个POI类别和所述用户在各个所述POI类别上的出行行为,确定所述用户关于POI类别变量和行为变量的联合概率分布。
7.根据权利要求6所述的装置,其特征在于,还包括:
采集模块,用于采集所述用户通过终端设备与其他设备之间传输的多个信令数据;
第二获取模块,用于获取所述多个信令数据各自对应的采集时间和采集地点;
第三确定模块,用于根据所述多个信令数据各自对应的采集时间和采集地点,确定各个所述采集地点对应的采集时间段;
相应的,所述第一确定模块具体用于根据各个所述采集地点对应的采集时间段,确定用户的多个停驻点。
8.根据权利要求7所述的装置,其特征在于,所述第三确定模块具体用于:
针对每个所述采集地点,确定所述采集地点上的最小采集时间和最大采集时间,以得到所述采集地点对应的采集时间段。
9.根据权利要求7或8所述的装置,其特征在于,所述第一确定模块具体用于:
在各个所述采集地点中删除采集时间段小于预设时间段的采集地点,以得到所述用户的多个停驻点。
10.根据权利要求6-8任一项所述的装置,其特征在于,所述第二确定模块通过如下公式确定所述联合概率分布:
其中,Ck,i表示第k个用户对应的第i个POI类别,当i是一个变量,所述用户为第k个用户时,Ck,i表示所述POI类别变量,zk,i表示所述第k个用户在所述第i个POI类别上的出行行为,当i是一个变量,所述用户为第k个用户时,zk,i表示所述行为变量,α、β分别是超参数,Uk表示所述第k个用户,P(φt|β)表示从以β为参数的迪利克雷分布中,采样出第t个出行行为的多项式分布的概率,φt为第t个出行行为的多项式分布,所述多项式分布是第t个出行行为到POI类别上的分布情况,其中t=1,…T,T是所有出行行为的个数,P(θk|α)表示从以α为参数的迪利克雷分布中,采样出属于所述第k个用户的出行行为的分布的概率,θk表示所述第k个用户的出行行为的分布,P(zk,t,i|θk,Uk)表示在给定所述用户Uk和所述分布θk的情况下,采样出出行行为zk,ti的概率,zk,ti表示所述第k个用户在所述第i个POI类别上的第t个出行行为,P(Ck,i|zk,t,i,φt)表示在给定所述zk,t,i和所述φt下,采样出所述Ck,i的概率。
11.一种用户行为分析设备,包括:存储器和处理器;
所述存储器用于存储计算机指令;所述处理器用于运行所述存储器存储的所述计算机指令,以实现权利要求1至5任一项所述的用户行为分析方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至5任一项所述的用户行为分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911407950.5A CN111159583B (zh) | 2019-12-31 | 2019-12-31 | 用户行为分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911407950.5A CN111159583B (zh) | 2019-12-31 | 2019-12-31 | 用户行为分析方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111159583A true CN111159583A (zh) | 2020-05-15 |
CN111159583B CN111159583B (zh) | 2023-08-04 |
Family
ID=70559693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911407950.5A Active CN111159583B (zh) | 2019-12-31 | 2019-12-31 | 用户行为分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159583B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112560910A (zh) * | 2020-12-02 | 2021-03-26 | 中国联合网络通信集团有限公司 | 用户分类方法和装置 |
CN112836121A (zh) * | 2021-01-28 | 2021-05-25 | 北京市城市规划设计研究院 | 一种出行目的识别方法及系统 |
CN114626340A (zh) * | 2022-03-17 | 2022-06-14 | 智慧足迹数据科技有限公司 | 基于手机信令的行为特征提取方法及相关装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636354A (zh) * | 2013-11-07 | 2015-05-20 | 华为技术有限公司 | 一种位置兴趣点聚类方法和相关装置 |
CN106777169A (zh) * | 2016-12-21 | 2017-05-31 | 北京车网互联科技有限公司 | 一种基于车联网数据的用户出行喜好分析方法 |
WO2017193666A1 (en) * | 2016-05-10 | 2017-11-16 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for recommending personalized content |
US20180049001A1 (en) * | 2016-08-10 | 2018-02-15 | Yandex Europe Ag | Method of and server for processing wireless device sensor data to generate an entity vector associated with a physical location |
US20180348011A1 (en) * | 2017-06-02 | 2018-12-06 | Apple Inc. | Venues Map Application And System Providing A Venue Directory |
CN109726336A (zh) * | 2018-12-21 | 2019-05-07 | 长安大学 | 一种结合出行兴趣与社交偏好的poi推荐方法 |
US10311119B1 (en) * | 2015-08-21 | 2019-06-04 | Google Llc | Determining location-based contextual hashtags |
CN109977322A (zh) * | 2019-03-05 | 2019-07-05 | 百度在线网络技术(北京)有限公司 | 出行方式推荐方法、装置、计算机设备和可读存储介质 |
CN110267206A (zh) * | 2019-05-21 | 2019-09-20 | 中国联合网络通信集团有限公司 | 用户位置预测方法及装置 |
CN110442662A (zh) * | 2019-07-08 | 2019-11-12 | 清华大学 | 一种确定用户属性信息的方法以及信息推送方法 |
US10484817B1 (en) * | 2018-09-04 | 2019-11-19 | Verizon Patent And Licensing Inc. | Methods and systems for surfacing a user-customized segment within a geospatial navigation application |
-
2019
- 2019-12-31 CN CN201911407950.5A patent/CN111159583B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636354A (zh) * | 2013-11-07 | 2015-05-20 | 华为技术有限公司 | 一种位置兴趣点聚类方法和相关装置 |
US10311119B1 (en) * | 2015-08-21 | 2019-06-04 | Google Llc | Determining location-based contextual hashtags |
WO2017193666A1 (en) * | 2016-05-10 | 2017-11-16 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for recommending personalized content |
US20180049001A1 (en) * | 2016-08-10 | 2018-02-15 | Yandex Europe Ag | Method of and server for processing wireless device sensor data to generate an entity vector associated with a physical location |
CN106777169A (zh) * | 2016-12-21 | 2017-05-31 | 北京车网互联科技有限公司 | 一种基于车联网数据的用户出行喜好分析方法 |
US20180348011A1 (en) * | 2017-06-02 | 2018-12-06 | Apple Inc. | Venues Map Application And System Providing A Venue Directory |
US10484817B1 (en) * | 2018-09-04 | 2019-11-19 | Verizon Patent And Licensing Inc. | Methods and systems for surfacing a user-customized segment within a geospatial navigation application |
CN109726336A (zh) * | 2018-12-21 | 2019-05-07 | 长安大学 | 一种结合出行兴趣与社交偏好的poi推荐方法 |
CN109977322A (zh) * | 2019-03-05 | 2019-07-05 | 百度在线网络技术(北京)有限公司 | 出行方式推荐方法、装置、计算机设备和可读存储介质 |
CN110267206A (zh) * | 2019-05-21 | 2019-09-20 | 中国联合网络通信集团有限公司 | 用户位置预测方法及装置 |
CN110442662A (zh) * | 2019-07-08 | 2019-11-12 | 清华大学 | 一种确定用户属性信息的方法以及信息推送方法 |
Non-Patent Citations (2)
Title |
---|
李;郑继亭;师丹琳;: "出行者行为建模技术研究", no. 07 * |
蒋云良;董墨萱;范婧;高少文;刘勇;马新强;: "基于POI数据的城市功能区识别方法研究", no. 04 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112560910A (zh) * | 2020-12-02 | 2021-03-26 | 中国联合网络通信集团有限公司 | 用户分类方法和装置 |
CN112560910B (zh) * | 2020-12-02 | 2024-03-01 | 中国联合网络通信集团有限公司 | 用户分类方法和装置 |
CN112836121A (zh) * | 2021-01-28 | 2021-05-25 | 北京市城市规划设计研究院 | 一种出行目的识别方法及系统 |
CN114626340A (zh) * | 2022-03-17 | 2022-06-14 | 智慧足迹数据科技有限公司 | 基于手机信令的行为特征提取方法及相关装置 |
CN114626340B (zh) * | 2022-03-17 | 2023-02-03 | 智慧足迹数据科技有限公司 | 基于手机信令的行为特征提取方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111159583B (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110869926B (zh) | 基于语义状态的传感器跟踪和更新 | |
KR101982159B1 (ko) | 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법 | |
Chung et al. | A trip reconstruction tool for GPS-based personal travel surveys | |
KR102121361B1 (ko) | 사용자가 위치되는 지리적 위치의 유형을 식별하기 위한 방법 및 디바이스 | |
CN111159583B (zh) | 用户行为分析方法、装置、设备及存储介质 | |
CN111212383B (zh) | 区域常住人口数量的确定方法、装置、服务器和介质 | |
CN109359170B (zh) | 用于生成信息的方法和装置 | |
KR101365993B1 (ko) | 데이터처리방법, 데이터처리장치, 데이터수집방법, 및 정보제공방법 | |
CN110008414B (zh) | 地理信息点的确定方法和装置 | |
JP7175783B2 (ja) | 所定圏における滞在圏人口を推定するプログラム、装置及び方法 | |
JP4950508B2 (ja) | 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム | |
CN107430631B (zh) | 从位置报告确定语义地点名称 | |
CN111291071B (zh) | 数据处理方法、装置及电子设备 | |
Chow et al. | Geographic disparity of positional errors and matching rate of residential addresses among geocoding solutions | |
Stipancic et al. | Measuring and visualizing space–time congestion patterns in an urban road network using large-scale smartphone-collected GPS data | |
CN115017400A (zh) | 一种应用app推荐方法及电子设备 | |
WO2021164131A1 (zh) | 地图展示方法、系统、计算机设备和存储介质 | |
JP2014203191A (ja) | 情報提供システム、情報要求端末、情報処理システム、制御方法及びプログラム | |
US10341617B2 (en) | Public safety camera identification and monitoring system and method | |
CN107291784B (zh) | 地理围栏类别的获取方法、装置及业务设备 | |
EP4002763A1 (en) | Method, apparatus, and computer program product for identifying privacy risks in datasets | |
Mahmud et al. | State of mobile crowdsourcing applications: A review | |
CN110674208A (zh) | 用于确定用户的职住地信息的方法和装置 | |
US10506201B2 (en) | Public safety camera identification and monitoring system and method | |
CN110895543A (zh) | 人口迁徙跟踪展示方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |