CN110990714A

CN110990714A - 一种用户行为意图预测方法和装置

Info

Publication number: CN110990714A
Application number: CN201911061264.7A
Authority: CN
Inventors: 韩玉辉; 程新洲; 成晨; 王天翼; 张晴晴; 张涛; 高洁; 张恒
Original assignee: China United Network Communications Group Co Ltd
Current assignee: China United Network Communications Group Co Ltd
Priority date: 2019-11-01
Filing date: 2019-11-01
Publication date: 2020-04-10
Anticipated expiration: 2039-11-01
Also published as: CN110990714B

Abstract

本发明实施例提供一种用户行为意图预测方法和装置，涉及数据处理领域，能够准确预测用户的行为意图。该方法包括：获取多个样本用户的行为信息和行为意图；获取待预测用户的行为信息；确定多个样本用户中的目标样本用户；将目标样本用户的行为意图确定为待预测用户的行为意图。本发明应用于数据处理。

Description

一种用户行为意图预测方法和装置

技术领域

本发明涉及数据分析领域，尤其涉及一种用户行为意图预测方法和装置。

背景技术

用户行为意图预测目前已广泛应用，当前的用户行为意图预测一般集中在某一特定的场景中，使用该特定场景下的数据。比如，利用用户行为信息关键词与意图类别之间的对应关系，确定用户的意图，该方案聚焦在用户行为信息关键词这一场景；再比如，利用用户间通讯工具输入的文本内容进行语义分析，确定用户意图，该方案主要基于用户通信过程中的文本内容信息这一场景。但是由于单一场景下用户行为数据的种类有限，因此会造成用户行为意图的预测准确性不高的问题。

发明内容

本发明的实施例提供一种用户行为意图预测方法和装置，能够准确的预测用户的行为。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，提供一种用户行为意图预测方法，包括：

获取多个样本用户的行为信息和行为意图；行为信息至少包括：出行方式、关注信息、年龄段和出行目的地；行为意图至少为以下任一种：旅行、医院就医、休闲购物、日常工作和体育运动；

获取待预测用户的行为信息；

确定多个样本用户中的目标样本用户；目标样本用户的行为信息与待预测用户的行为信息差异最小；

将目标样本用户的行为意图确定为待预测用户的行为意图。

相较现有技术中，根据单一场景预测用户行为意图的方法，本发明技术方案提供了一种多场景情况下预测用户行为意图的方法。以样本用户的行为信息做参照，找到样本用户中与待预测用户行为最相似的目标样本用户，将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性，因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对，本方案的预测结果的准确性得到了显著提升。

第二方面，提供一种用户行为意图预测装置，包括：第一获取获取单元、第二获取单元和确定单元；

第一获取单元，用于获取多个样本用户的行为信息和行为意图；行为信息至少包括：出行方式、关注信息、年龄段和出行目的地；行为意图至少为以下任一种：旅行、医院就医、休闲购物、日常工作和体育运动；

第二获取单元，用于获取待预测用户的行为信息；

确定单元，用于确定多个样本用户中的目标样本用户；目标样本用户的行为信息与待预测用户的行为信息差异最小；

确定单元，还用于将第一获取单元获取的目标样本用户的行为意图确定为待预测用户的行为意图。

第三方面，提供一种用户行为意图预测装置，包括存储器、处理器、总线和通信接口；存储器用于存储计算机执行指令，处理器与存储器通过总线连接；当用户行为意图预测装置运行时，处理器执行存储器存储的计算机执行指令，以使用户行为意图预测装置执行如第一方面提供的用户行为意图预测方法。

本发明实施例提供的用户行为意图预测方法和装置，该方法包括：获取多个样本用户的行为信息和行为意图；获取待预测用户的行为信息；确定多个样本用户中的目标样本用户；将目标样本用户的行为意图确定为待预测用户的行为意图。本发明技术方案以样本用户的行为信息做参照，找到样本用户中与待预测用户行为最相似的目标样本用户，将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性，因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对，本方案用户行为意图的预测结果的准确性得到了显著提升。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种用户行为意图预测方法的流程示意图；

图2为本发明实施例提供的另一种用户行为意图预测方法的流程示意图；

图3为本发明实施例提供的一种获取待预测用户的出行方式的流程图；

图4为本发明实施例提供的一种获取待预测用户的关注信息的流程图；

图5为本发明实施例提供的一种确定待预测用户的年龄段的流程图；

图6为本发明实施例提供的一种确定待预测用户的出行目的地的流程图；

图7为本发明实施例提供的一种确定多个样本用户中的目标样本用户的流程图；

图8为本发明实施例提供的一种用户行为意图预测装置的结构示意图；

图9为本发明实施例提供的另一种用户行为意图预测装置的结构示意图；

图10为本发明实施例提供的另一种用户行为意图预测装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

还需要说明的是，本发明实施例中，“的(英文：of)”，“相应的(英文：corresponding，relevant)”和“对应的(英文：corresponding)”有时可以混用，应当指出的是，在不强调其区别时，其所要表达的含义是一致的。

为了便于清楚描述本发明实施例的技术方案，在本发明的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。

目前预测用户行为意图的技术方案主要集中在某一特定场景，用于预测的原始数据的种类有限。比如，根据用户的搜索关键字来推测用户的行为意图，这一方案仅仅考虑了关键字这一个场景，而影响用户行为意图预测的因素还有用户的年龄、出行的方式等等其他不同的场景。而通信运营商具有用户通信行为的全量数据，因此可利用这些丰富的全量数据构建多场景下的用户行为意图预测方法。

参照图1所示，本发明实施例提供一种用户行为意图的预测方法，包括：

S101、获取多个样本用户的行为信息和行为意图。

其中，行为信息至少包括：出行方式、关注信息、年龄段和出行目的地。出行方式可以为私家车、步行和公交等；关注信息为用户通过互联网或者移动终端浏览的信息；出行目的地包括学校、商场和医院等场所。

行为意图至少为以下任一种：旅行、医院就医、休闲购物、日常工作和体育运动。其中，当行为意图为旅行时，表示待预测用户在去旅行的途中；当行为意图为医院就医时，表示用户将要去医院看病；当行为意图为休闲购物时，表示用户将要去商场购物；当行为意图为日常工作时，表示用户将要去公司上班；当行为意图为体育运动时，表示用户将要锻炼身体。需要说明的是，在实际中，用户的行为意图不限于上述已列出的几种行为意图。

运营商处存储有用户的历史行为数据，样本用户的行为信息和行为意图可以从运营商的数据库中获取。

S102、获取待预测用户的行为信息。

由于待预测用户的行为信息还不是历史信息，因此不能在数据库中直接获取到。因此，需要根据样本用户的行为信息比对出待预测用户的行为信息，具体可以以下方法获得待预测用户的行为信息：

示例性的，一种可能的实施例中，如图2所示，S102具体包括S1021-S1022。

S1021、获取待预测用户的出行方式和关注信息。

示例性的，一种可能的实施例中，如图3所示,获取待预测用户的出行方式具体包括S301-S304。

S301、获取待预测用户的活动链。

其中，活动链是运营商系统中实时更新的数据，活动链记载了每个时间点下待预测用户的坐标信息，即每个时间点下用户终端所处位置的经纬度。

S302、根据待预测用户的活动链，确定待预测用户的出行距离和出行时间。

示例性的，根据两个时间点间的间隔确定用户的出行时间，根据该出行时间内用户坐标信息的变化确定用户的出行距离。

S303、根据待预测用户的出行距离和出行时间，确定待预测用户的移动速率。

示例性的，假设用户的出行时间是0.5个小时，在该出行时间内，该用户出行的距离为5公里，则该用户的移动速率为10公里/小时。

S304、根据待预测用户的移动速率确定待预测用户的出行方式。

示例性的，由于每种出行方式都对应有不同的速率范围，因此可以根据用户的移动速率来确定用户选择的出行方式。如表1所示，本发明实施例示例性的举出了几种出行方式及各种出行方式对应的速率(S)的范围。需要说明的是，在实际应用中，出行方式不限于表1中所列举的内容。

表1

示例性的，一种可能的实施例中，如图4所示，获取待预测用户的关注信息具体包括S401-S404。需要说明的是，获取待预测用户的关注信息实际上是获取待预测用户在最近的某个时间段内关注的信息，该时间段的长短可根据实际情况确定。

S401、判断待预测用户使用的应用程序是否与第一关注信息相关。

在一种可能的实施方式中，可以判断用户在近2个小时内使用的应用程序是否与第一关注信息相关。

若待预测用户使用的应用程序与第一关注信息相关，执行S4021；若待预测用户使用的应用程序不与第一关注信息相关，则执行S4022。

S4021、将第一权重增加第一数值，以生成第二权重。

S4022、确定第二权重与第一权重相等。

其中第一关注信息为用户感兴趣或者想要了解的信息，示例性的，

表1列出了几个关注信息。其中，当关注信息为旅行时，表示用户在关注旅行方面的信息；当关注信息为医院就医时，表示用户在浏览医院和医疗方面的信息；当关注信息为休闲购物时，表示用户在关注购物方面的信息；当关注信息为体育运动时，表示用户在关注体育运动方面的信息。需要说明的是，在实际应用中，关注信息不限于表2中所列举的内容。

序号	关注信息
		1	旅行
2	医院就医
		3	休闲购物
4	日常工作
		5	体育运动

表2

示例性的，以判断待预测用户使用的应用程序是否与“医院就医”相关为例，可通过待预测用户使用的应用程序的类别标识是否为治疗服务，来确定该应用程序与“医院就医”相关，若待预测用户使用的应用程序的类别标识是治疗服务，则该应用程序与“医院就医”相关，将第一权重增加第一数值，得到第二权重。

其中，第一权重为一个初始的赋值，可以为任何数值。

S403、判断待预测用户使用应用程序浏览的内容是否与第一关注信息相关。

在一种可能的实施方式中，可以判断用户在近2个小时内使用上述应用程序浏览的内容是否与第一关注信息相关。

若待预测用户使用上述应用程序浏览的内容与第一关注信息相关，执行S4041；若待预测用户使用上述应用程序浏览的内容不与第一关注信息相关，则执行S4042。

S4041、将第二权重增加第二数值，以生成第三权重。

S4042、确定第三权重与第二权重相等。

示例性的，以判断待预测用户使用该应用程序浏览的内容是否与“医院就医”相关为例，可通过语义分析技术分析浏览内容以判断其是否与“医院就医”相关。若相关，则将第二权重增加第二数值，得到第三权重。

S405、判断待预测用户在应用程序的搜索内容是否与第一关注信息相关。

在一种可能的实施方式中，可以判断用户在近2个小时内在上述应用程序内搜索的内容是否与第一关注信息相关。

若待预测用户在上述应用程序的搜索内容与第一关注信息相关，则执行S4061；若待预测用户在上述应用程序的搜索内容不与第一关注信息相关，则执行S4062。

S4061、将第三权重增加第三数值，以生成第四权重。

S4062、确定第四权重与第三权重相等。

示例性的，以判断待预测用户在该应用程序的搜索内容是否与“医院就医”相关为例，可提取搜索内容中的关键词利用语义分析技术判断其是否与“医院就医”相关。若相关，则将第三权重增加第三数值，得到第四权重。

其中，第一数值、第二数值和第三数值的大小可依上述三个因素，即应用程序是否与第一关注信息相关、应用程序浏览的内容是否与第一关注信息相关和在应用程序的搜索内容是否与第一关注信息相关对确定关注信息的影响程度不同而确定不同的值。示例性的，若应用程序是否与第一关注信息相关这一判断条件对关注信息的确定影响较大，则可将第一数值定义一个较大的数值。第一数值、第二数值和第三数值的大小可以相同，也可以不同。

S407、判断第四权重是否大于等于预设阈值。

若第四权重大于等于预设阈值，则执行S4081；若第四权重小于预设阈值，则执行S4082。

S4081、确定第一关注信息为待预测用户的关注信息。

具体的，若第四权重大于等于预设阈值，则确定“医院就医”为待预测用户的关注信息。

S4082、判断第二关注信息是否为待预测信息。

其中，第二关注信息为除第一关注信息之外的其他关注信息。具体的，若第四权重小于预设阈值，则将上述步骤中的“医院就医”变更为其他关注信息进行遍历判断，直到出现能够使第四权重大于等于预设阈值的关注信息，然后将该关注信息确定为待预测用户的关注信息。

S1022、根据待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。

示例性的，一种可能的实施例中，如图5所示，根据待预测用户的出行方式和关注信息确定待预测用户的年龄段，具体包括S501-S506。

S501、获取样本用户及待预测用户的兴趣点。

其中，兴趣点为POI，point of interest，在地理信息系统中POI可以是一栋房子、一个商铺或一个公交站。本发明实施例中的POI用于表示用户在行程中驻留的地点。

S502、将样本用户的出行方式、关注信息和兴趣点及待预测用户的出行方式、关注信息和兴趣点赋值。

其中，出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应。

如表3所示，示例性的列出了几个兴趣点：

表3

示例性的，将表1中的每种出行方式赋值，将表2中的每种关注信息赋值，将表3中的每种兴趣点赋值。

S503、将样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到样本用户的年龄段的第一量化值。

示例性的，将每种出行方式、关注信息和兴趣点按照表1、表2和表3中的序号赋值。假设样本用户的出行方式为公交，赋值为2，关注信息为休闲购物，赋值为3，兴趣点为银行，赋值为4，若出行方式权重为0.2，关注信息权重为0.3，兴趣点权重为0.5，最终得到的加权平均值为3.3，则样本用户的年龄段的第一量化值即为3.3。其中，不同行为信息的权重依照该行为信息对最后确定年龄段的影响程度设定。示例性的，若关注信息对确定用户年龄段有较大影响，则可以给关注信息设定一个较高的权重。根据实际情况，各个行为信息所占的权重可以相同，也可以不同。

S504、将样本用户的年龄段与第一量化值对应。

其中，样本用户的年龄段可根据用户在系统中预留的身份信息中的年龄信息获得。将样本用户的年龄段与年龄段的量化值对应。需要说明的是，虽然用户在运营商处预留有年龄信息，但是现实中存在电话卡实际使用人与登记人不符的情况。在样本用户中，由于样本众多，因此可以忽略该种异常情况对年龄段与年龄段的量化值的对应关系的影响。但是在针对具体的某个待预测用户时，需要准确的确定待预测用户的年龄，此时需要考虑电话卡实际使用人与登记人不符的情况，因此，本发明实施例采用计算推测的方式来确定待预测用户的年龄，而不直接采用待预测用户在系统中预留的年龄。

S505、将待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到待预测用户的年龄段的第二量化值。

示例性的，可参照上述S503获取样本用户的年龄段的第一量化值的方法。

S506、将第一量化值与第二量化值相同的样本用户的年龄段，确定为待预测用户的年龄段。

需要说明的是，若存在多个第一量化值与第二量化值相同的样本用户，则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段；

若存在多个第一量化值与第二量化值相同，且关注信息的赋值与待预测用户的关注信息也相同的样本用户，则将兴趣点的赋值与待预测用户的兴趣点的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段；

若存在多个第一量化值与第二量化值相同，且关注信息的赋值与待预测用户的关注信息的赋值相同，兴趣点的赋值与待预测用户的兴趣点的赋值也相同的样本用户，则将出行方式的赋值与待预测用户的出行方式的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段。

需要说明的是，当存在多个第三量化值与第四量化值相同的样本用户时，之所以按关注信息赋值相同、兴趣点赋值相同和出行方式赋值相同这一顺序去确定最接近的样本用户，是因为考虑到不同的行为信息对最终结果的影响程度不同。在实际应用中，若兴趣点对最终结果影响较大，出行方式次之，关注信息影响最小，则可以先判断样本用户兴趣点的赋值是否与待预测用户兴趣点的赋值相同，若相同则再判断样本用户的出行方式的赋值是否与待预测用户的出行方式的赋值相同，若相同则再判断样本用户的关注信息的赋值是否与待预测用户的关注信息的赋值相同。

示例性的，一种可能的实施例中，如图6所示，根据待预测用户的出行方式和关注信息确定待预测用户的出行目的地，具体包括S601-S606。

S601、获取样本用户及待预测用户的兴趣点。

S602、将样本用户的出行方式、关注信息和兴趣点及待预测用户的出行方式、关注信息和兴趣点赋值。

S603、将样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到样本用户的出行目的地的第三量化值。

示例性的，假设样本用户的出行方式为地铁，赋值为3，关注信息为日常工作，赋值为4，兴趣点为早餐店，赋值为6，若出行方式的权重为0.3，关注信息的权重为0.6，兴趣点的权重为0.1，最终得到的加权平均值为3.9，则样本用户的出行目的地的第三量化值即为3.9。其中，不同行为信息的权重依照该行为信息对最后确定出行目的地的影响程度设定。示例性的，若出行方式对确定出行目的地有较大影响，则可以给出行方式设定一个较高的权重。根据实际情况，各个行为信息所占的权重可以相同，也可以不同。

S604、将样本用户的出行目的地与第三量化值对应。

示例性的，若上述样本用户的出行目的地为学校，则将学校与出行目的地的量化值3.9对应。

S605、将待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到待预测用户的出行目的地的第四量化值。

示例性的，具体计算过程可参照S503。

S606、将第三量化值与第四量化值相同的样本用户的出行目的地，确定为待预测用户的出行目的地。

需要说明的是，若存在多个第三量化值与第四量化值相同的样本用户，则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地；

若存在多个第三量化值与第四量化值相同，且关注信息的赋值与待预测用户的关注信息也相同的样本用户，则将兴趣点的赋值与待预测用户的兴趣点的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地；

若存在多个第三量化值与第四量化值相同，且关注信息的赋值与待预测用户的关注信息的赋值相同，兴趣点的赋值与待预测用户的兴趣点的赋值也相同的样本用户，则将出行方式的赋值与待预测用户的出行方式的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地。

需要说明的是，当存在多个第三量化值与第四量化值相同的样本用户时，之所以按关注信息赋值相同、兴趣点赋值相同和出行方式赋值相同这一顺序去确定最接近的样本用户，是因为考虑到不同的行为信息对最终结果的影响程度不同。在实际应用中，若出行方式对最终结果影响较大，关注信息次之，兴趣点影响最小，则可以先判断样本用户出行方式的赋值是否与待预测用户出行方式的赋值相同，若相同则再判断样本用户的关注信息的赋值是否与待预测用户的关注信息的赋值相同，若相同则再判断样本用户的兴趣点的赋值是否与待预测用户的兴趣点的赋值相同。S103、确定多个样本用户中的目标样本用户。

其中，目标样本用户的行为信息与待预测用户的行为信息差异最小。

示例性的，一种可能的实施例中，如图7所示，S103具体包括S701-S704。

S701、为样本用户的每种行为信息和待预测用户的每种行为信息赋值。

其中，每种行为信息的赋值均与其各自具体内容对应；相同的行为信息赋予相同的值，不同的行为信息赋予不同的值。赋值的大小可根据实际情况设定，以方便计算为原则。

S702、计算待预测用户的任一种行为信息与样本用户的任一种行为信息的赋值之间的差值的绝对值。

表4示例性的列出了一个样本用户与待预测用户行为信息的赋值的对比信息。

	出行方式	关注信息	年龄段	出行目的地
					样本用户A	2	3	2	5
样本用户B	1	1	2	3
					待预测用户	2	3	4	1

表4

根据上表，样本用户A与待预测用户的出行方式之间的差值的绝对值为0，关注信息之间的差值的绝对值为0，年龄段之间的差值的绝对值为2，出行目的地的差值的绝对值为4。样本用户B与待预测用户的出行方式之间的差值的绝对值为1，关注信息之间的差值的绝对值为2，年龄段之间的差值的绝对值为2，出行目的地的差值的绝对值为2。

S703、将待预测用户的每一种行为信息对应的绝对值的和确定为待预测用户与样本用户的差异值。

示例性的，根据表4可知，待预测用户与样本用户A之间每一种行为信息对应的绝对值的和为6，即待预测用户与样本用户的差异值为6。待预测用户与样本用户A之间每一种行为信息对应的绝对值的和为7，即待预测用户与样本用户的差异值为7。

S704、将与待预测用户的差异值最小的样本用户确定为目标样本用户。

具体的，依次计算每个样本用户与待预测用户的差异值，直到找到与待预测用户的差异值为0的样本用户为止，将该样本用户的行为意图确定为待预测用户的行为意图。若没有与待预测用户的差异值为0的样本用户，则将与待预测用户的差异值最小的样本用户的行为意图确定为待预测用户的行为意图。示例性的，样本用户A与待预测用户的差异值为6，样本用户B与待预测用户的差异值为7，则将样本用户A确定为目标样本用户。

需要说明的是，在一种可能的情况中，样本用户与待预测用户的差异值都很大，即使将样本用户中与待预测用户的差异值最小的样本用户确定为目标样本用户也没有意义。因此，可设定一个阈值，当样本用户与待预测用户的差异值大于该阈值时，则将该样本用户删除。此时将会出现没有任何一个样本用户的行为与待预测用户相似的情况。

S104、将目标样本用户的行为意图确定为待预测用户的行为意图。

本发明实施例提供一种用户行为意图预测方法，包括：获取多个样本用户的行为信息和行为意图；获取待预测用户的行为信息；确定多个样本用户中的目标样本用户；将目标样本用户的行为意图确定为待预测用户的行为意图。本发明技术方案以样本用户的行为信息做参照，找到样本用户中与待预测用户行为最相似的目标样本用户，将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性，因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对，本方案用户行为意图的预测结果的准确性得到了显著提升。

参照图8所示，本发明实施例还提供一种用户行为意图预测装置80，包括第一获取单元81、第二获取单元82和确定单元83

第一获取单元81，用于获取多个样本用户的行为信息和行为意图；行为信息至少包括：出行方式、关注信息、年龄段和出行目的地；行为意图至少为以下任一种：旅行、医院就医、休闲购物、日常工作和体育运动；

第二获取单元82，用于获取待预测用户的行为信息；

确定单元83，用于确定多个样本用户中的目标样本用户；目标样本用户的行为信息与待预测用户的行为信息差异最小；

确定单元83，还用于将第一获取单元81获取的目标样本用户的行为意图确定为待预测用户的行为意图。

可选的，如图9所示，第二获取单元82包括获取子单元821和处理子单元822；

其中，获取子单元821用于获取待预测用户的出行方式和关注信息；

处理子单元822用于根据待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。

可选的，获取子单元821具体用于：

获取待预测用户的活动链，活动链记载了每个时间点下待预测用户的坐标信息；

根据待预测用户的活动链，确定待预测用户的出行距离和出行时间；

根据待预测用户的出行距离和出行时间，确定待预测用户的移动速率；

根据待预测用户的移动速率确定待预测用户的出行方式。

可选的，获取子单元821具体用于：

判断待预测用户使用的应用程序是否与第一关注信息相关，若是，则将第一权重增加第一数值，以生成第二权重；

判断待预测用户使用应用程序浏览的内容是否与第一关注信息相关，若是，则将第二权重增加第二数值，以生成第三权重；

判断待预测用户在应用程序的搜索内容是否与第一关注信息相关，若是，则将第三权重增加第三数值，以生成第四权重；

第四权重大于等于预设阈值，则确定第一关注信息为待预测用户的关注信息。

可选的，第一获取单元81还用于获取样本用户的兴趣点，其中兴趣点为用户在行程中驻留的地点；

获取子单元821还用于获取样本用户及待预测用户的兴趣点，兴趣点为用户在行程中驻留的地点；

处理子单元822还用于将第一获取单元81获取的样本用户的出行方式、关注信息和兴趣点及获取子单元821获取的待预测用户的出行方式、关注信息和兴趣点赋值，出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应；

处理子单元822还用于将第一获取单元81获取的样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到样本用户的年龄段的第一量化值；

处理子单元822还用于将第一获取单元81获取的样本用户的年龄段与第一量化值对应；

处理子单元822还用于将获取子单元821获取的待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到待预测用户的年龄段的第二量化值；

处理子单元822还用于将第一量化值与第二量化值相同的样本用户的年龄段，确定为待预测用户的年龄段。

可选的，处理子单元822具体用于：

若存在多个第一量化值与第二量化值相同的样本用户，则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段；

可选的，第一获取单元81还用于获取样本用户的兴趣点，兴趣点为用户在行程中驻留的地点；

获取子单元821还用于获取待预测用户的兴趣点；

处理子单元822还用于将第一获取单元获取的样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到样本用户的出行目的地的第三量化值；

处理子单元822还用于将获取子单元821获取的样本用户的出行目的地与第三量化值对应；

处理子单元822还用于将获取子单元821获取的待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到待预测用户的出行目的地的第四量化值；

处理子单元822还用于将第三量化值与第四量化值相同的样本用户的出行目的地，确定为待预测用户的出行目的地。

可选的，处理子单元822具体用于：

若存在多个第三量化值与第四量化值相同的样本用户，则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地；

可选的，确定单元83具体用于：

为第一获取单元81获取的样本用户的每种行为信息和第二获取单元82获取的待预测用户的每种行为信息赋值；每种行为信息的赋值均与其各自具体内容对应；

计算第二获取单元82获取的待预测用户的任一种行为信息与第一获取单元81获取的样本用户的任一种行为信息的赋值之间的差值的绝对值；

将第二获取单元82获取的待预测用户的每一种行为信息对应的绝对值的和确定为待预测用户与样本用户的差异值；

将与待预测用户的差异值最小的样本用户确定为目标样本用户。

本发明实施例提供一种用户行为意图预测装置，包括第一获取单元、第二获取单元和确定单元。其中，第一获取单元，用于获取多个样本用户的行为信息和行为意图；第二获取单元，用于获取待预测用户的行为信息；确定单元，用于确定多个样本用户中的目标样本用户；确定单元，还用于将第一获取单元获取的目标样本用户的行为意图确定为待预测用户的行为意图。本发明技术方案以样本用户的行为信息做参照，找到样本用户中与待预测用户行为最相似的目标样本用户，将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性，因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对，本方案用户行为意图的预测结果的准确性得到了显著提升。

参照图10所示，本发明实施例还提供一种用户行为意图预测装置，包括存储器101、处理器102、总线103和通信接口104；存储器101用于存储计算机执行指令，处理器102与存储器101通过总线103连接；当用户行为意图预测装置运行时，处理器102执行存储器101存储的计算机执行指令，以使用户行为意图预测装置执行如上述实施例提供的用户行为意图预测方法。

在具体的实现中，作为一种实施例，处理器102(102-1和102-2)可以包括一个或多个CPU，例如图10中所示的CPU0和CPU1。且作为一种实施例，用户行为意图预测装置可以包括多个处理器102，例如图10中所示的处理器102-1和处理器102-2。这些处理器102中的每一个CPU可以是一个单核处理器(single-CPU)，也可以是一个多核处理器(multi-CPU)。这里的处理器102可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

存储器101可以是只读存储器101(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(randomaccess memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、只读光盘(compactdisc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器101可以是独立存在，通过总线103与处理器102相连接。存储器101也可以和处理器102集成在一起。

在具体的实现中，存储器101，用于存储本申请中的数据和执行本申请的软件程序对应的计算机执行指令。处理器102可以通过运行或执行存储在存储器101内的软件程序，以及调用存储在存储器101内的数据，用户行为意图预测装置的各种功能。

通信接口104，使用任何收发器一类的装置，用于与其他设备或通信网络通信，如控制系统、无线接入网(radio access network，RAN)，无线局域网(wireless local areanetworks，WLAN)等。通信接口104可以包括接收单元实现接收功能，以及发送单元实现发送功能。

总线103，可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(peripheral component interconnect，PCI)总线或扩展工业标准体系结构(extended industry standard architecture，EISA)总线等。该总线103可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

本发明实施例还提供一种计算机存储介质，计算机存储介质包括计算机执行指令，当计算机执行指令在计算机上运行时，使得计算机执行如上述实施例提供的用户行为意图预测方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是一个物理单元或多个物理单元，即可以位于一个地方，或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种用户行为意图预测方法，其特征在于，包括：

获取多个样本用户的行为信息和行为意图；所述行为信息至少包括：出行方式、关注信息、年龄段和出行目的地；所述行为意图至少为以下任一种：旅行、医院就医、休闲购物、日常工作和体育运动；

获取待预测用户的行为信息；

确定所述多个样本用户中的目标样本用户；所述目标样本用户的行为信息与所述待预测用户的行为信息差异最小；

将目标样本用户的行为意图确定为所述待预测用户的行为意图。

2.根据权利要求1所述的用户行为意图预测方法，其特征在于，所述获取待预测用户的行为信息包括：

获取待预测用户的出行方式和关注信息；

根据待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。

3.根据权利要求2所述的用户行为意图预测方法，其特征在于，获取待预测用户的出行方式，包括：

获取所述待预测用户的活动链，所述活动链记载了每个时间点下所述待预测用户的坐标信息；

根据所述待预测用户的活动链，确定所述待预测用户的出行距离和出行时间；

根据所述待预测用户的出行距离和出行时间，确定所述待预测用户的移动速率；

根据所述待预测用户的所述移动速率确定所述待预测用户的出行方式。

4.根据权利要求2所述的用户行为意图预测方法，其特征在于，获取待预测用户的关注信息，包括：

判断所述待预测用户使用的应用程序是否与第一关注信息相关，若是，则将第一权重增加第一数值，以生成第二权重；

判断所述待预测用户使用所述应用程序浏览的内容是否与所述第一关注信息相关，若是，则将所述第二权重增加第二数值，以生成第三权重；

判断所述待预测用户在所述应用程序的搜索内容是否与所述第一关注信息相关，若是，则将所述第三权重增加第三数值，以生成第四权重；

所述第四权重大于等于预设阈值，则确定所述第一关注信息为所述待预测用户的关注信息。

5.根据权利要求2所述的用户行为意图预测方法，其特征在于，根据待预测用户的出行方式和关注信息确定待预测用户的年龄段，包括：

获取所述样本用户及所述待预测用户的兴趣点，所述兴趣点为用户在行程中驻留的地点；

将所述样本用户的出行方式、关注信息和兴趣点及所述待预测用户的出行方式、关注信息和兴趣点赋值；所述出行方式、所述关注信息和所述兴趣点的赋值均与其各自具体内容对应；

将所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述样本用户的年龄段的第一量化值；

将所述样本用户的年龄段与所述第一量化值对应；

将所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述待预测用户的年龄段的第二量化值；

将所述第一量化值与所述第二量化值相同的样本用户的年龄段，确定为所述待预测用户的年龄段。

6.根据权利要求5所述的用户行为意图预测方法，其特征在于，

若存在多个所述第一量化值与所述第二量化值相同的样本用户，则将关注信息的赋值与所述待预测用户的关注信息的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段；

若存在多个所述第一量化值与所述第二量化值相同，且关注信息的赋值与所述待预测用户的关注信息也相同的样本用户，则将兴趣点的赋值与所述待预测用户的兴趣点的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段；

若存在多个所述第一量化值与所述第二量化值相同，且关注信息的赋值与所述待预测用户的关注信息的赋值相同，兴趣点的赋值与所述待预测用户的兴趣点的赋值也相同的样本用户，则将出行方式的赋值与所述待预测用户的出行方式的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段。

7.根据权利要求2所述的用户行为意图预测方法，其特征在于，根据待预测用户的出行方式和关注信息确定待预测用户的出行目的地，包括：

将所述样本用户的出行方式、关注信息和兴趣点及所述待预测用户的出行方式、关注信息和兴趣点赋值；出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应；

将所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述样本用户的出行目的地的第三量化值；

将所述样本用户的出行目的地与所述第三量化值对应；

将所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述待预测用户的出行目的地的第四量化值；

将所述第三量化值与所述第四量化值相同的样本用户的出行目的地，确定为所述待预测用户的出行目的地。

8.根据权利要求7所述的用户行为意图预测方法，其特征在于，

若存在多个所述第三量化值与所述第四量化值相同的样本用户，则将关注信息的赋值与所述待预测用户的关注信息的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地；

若存在多个所述第三量化值与所述第四量化值相同，且关注信息的赋值与所述待预测用户的关注信息也相同的样本用户，则将兴趣点的赋值与所述待预测用户的兴趣点的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地；

若存在多个所述第三量化值与所述第四量化值相同，且关注信息的赋值与所述待预测用户的关注信息的赋值相同，兴趣点的赋值与所述待预测用户的兴趣点的赋值也相同的样本用户，则将出行方式的赋值与所述待预测用户的出行方式的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地。

9.根据权利要求1所述的用户行为意图预测方法，其特征在于，所述确定所述多个样本用户中的目标样本用户包括：

为所述样本用户的每种行为信息和待预测用户的每种行为信息赋值；每种行为信息的赋值均与其各自具体内容对应；

计算所述待预测用户的任一种行为信息与所述样本用户的所述任一种行为信息的赋值之间的差值的绝对值；

将所述待预测用户的每一种行为信息对应的绝对值的和确定为所述待预测用户与所述样本用户的差异值；

将与所述待预测用户的差异值最小的样本用户确定为目标样本用户。

10.一种用户行为意图预测装置，其特征在于，所述装置包括：第一获取单元、第二获取单元和确定单元；

所述第一获取单元，用于获取多个样本用户的行为信息和行为意图；所述行为信息至少包括：出行方式、关注信息、年龄段和出行目的地；所述行为意图至少为以下任一种：旅行、医院就医、休闲购物、日常工作和体育运动；

所述第二获取单元，用于获取待预测用户的行为信息；

所述确定单元，用于确定所述多个样本用户中的目标样本用户；所述目标样本用户的行为信息与所述待预测用户的行为信息差异最小；

所述确定单元，还用于将所述第一获取单元获取的目标样本用户的行为意图确定为所述待预测用户的行为意图。

11.根据权利要求10所述的用户行为意图预测装置，其特征在于，所述第二获取单元包括：获取子单元和处理子单元；

所述获取子单元用于获取待预测用户的出行方式和关注信息；

所述处理子单元用于根据所述获取子单元获取的待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。

12.根据权利要求11所述的用户行为意图预测装置，其特征在于，所述获取子单元具体用于：

13.根据权利要求11所述的用户行为意图预测装置，其特征在于，所述获取子单元具体用于：

14.根据权利要求11所述的用户行为意图预测装置，其特征在于，

所述第一获取单元还用于获取所述样本用户的兴趣点，所述兴趣点为用户在行程中驻留的地点；

所述获取子单元还用于获取所述待预测用户的兴趣点；

所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点及所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点赋值，所述出行方式、所述关注信息和所述兴趣点的赋值均与其各自具体内容对应；

所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述样本用户的年龄段的第一量化值；

所述处理子单元还用于将所述第一获取单元获取的所述样本用户的年龄段与所述第一量化值对应；

所述处理子单元还用于将所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述待预测用户的年龄段的第二量化值；

所述处理子单元还用于将所述第一量化值与所述第二量化值相同的样本用户的年龄段，确定为所述待预测用户的年龄段。

15.根据权利要求14所述的用户行为意图预测装置，其特征在于，所述处理子单元具体用于：

16.根据权利要求11所述的用户行为意图预测装置，其特征在于，

所述获取子单元还用于获取所述待预测用户的兴趣点；

所述处理子单元还用于将第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点及所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点赋值，出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应；

所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述样本用户的出行目的地的第三量化值；

所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行目的地与所述第三量化值对应；

所述处理子单元还用于将所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值，得到所述待预测用户的出行目的地的第四量化值；

所述处理子单元还用于将所述第三量化值与所述第四量化值相同的样本用户的出行目的地，确定为所述待预测用户的出行目的地。

17.根据权利要求16所述的用户行为意图预测装置，其特征在于，所述处理子单元具体用于：

18.根据权利要求10所述的用户行为意图预测装置，其特征在于，所述确定单元具体用于：

为第一获取单元获取的所述样本用户的每种行为信息和第二获取单元获取的待预测用户的每种行为信息赋值；每种行为信息的赋值均与其各自具体内容对应；

计算所述第二获取单元获取的所述待预测用户的任一种行为信息与所述第一获取单元获取的所述样本用户的所述任一种行为信息的赋值之间的差值的绝对值；

将所述第二获取单元获取的所述待预测用户的每一种行为信息对应的绝对值的和确定为所述待预测用户与所述样本用户的差异值；

19.一种用户行为意图预测装置，其特征在于，包括：处理器、收发器和存储器；其中，存储器用于存储一个或多个程序，所述一个或多个程序包括计算机执行指令，当所述用户行为意图预测装置运行时，处理器执行所述存储器存储的所述计算机执行指令，以使所述用户行为意图预测装置执行权利要求1-9任一项所述的用户行为意图预测方法。