CN110990714A - 一种用户行为意图预测方法和装置 - Google Patents

一种用户行为意图预测方法和装置 Download PDF

Info

Publication number
CN110990714A
CN110990714A CN201911061264.7A CN201911061264A CN110990714A CN 110990714 A CN110990714 A CN 110990714A CN 201911061264 A CN201911061264 A CN 201911061264A CN 110990714 A CN110990714 A CN 110990714A
Authority
CN
China
Prior art keywords
user
predicted
sample
assignment
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911061264.7A
Other languages
English (en)
Other versions
CN110990714B (zh
Inventor
韩玉辉
程新洲
成晨
王天翼
张晴晴
张涛
高洁
张恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201911061264.7A priority Critical patent/CN110990714B/zh
Publication of CN110990714A publication Critical patent/CN110990714A/zh
Application granted granted Critical
Publication of CN110990714B publication Critical patent/CN110990714B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种用户行为意图预测方法和装置,涉及数据处理领域,能够准确预测用户的行为意图。该方法包括:获取多个样本用户的行为信息和行为意图;获取待预测用户的行为信息;确定多个样本用户中的目标样本用户;将目标样本用户的行为意图确定为待预测用户的行为意图。本发明应用于数据处理。

Description

一种用户行为意图预测方法和装置
技术领域
本发明涉及数据分析领域,尤其涉及一种用户行为意图预测方法和装置。
背景技术
用户行为意图预测目前已广泛应用,当前的用户行为意图预测一般集中在某一特定的场景中,使用该特定场景下的数据。比如,利用用户行为信息关键词与意图类别之间的对应关系,确定用户的意图,该方案聚焦在用户行为信息关键词这一场景;再比如,利用用户间通讯工具输入的文本内容进行语义分析,确定用户意图,该方案主要基于用户通信过程中的文本内容信息这一场景。但是由于单一场景下用户行为数据的种类有限,因此会造成用户行为意图的预测准确性不高的问题。
发明内容
本发明的实施例提供一种用户行为意图预测方法和装置,能够准确的预测用户的行为。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种用户行为意图预测方法,包括:
获取多个样本用户的行为信息和行为意图;行为信息至少包括:出行方式、关注信息、年龄段和出行目的地;行为意图至少为以下任一种:旅行、医院就医、休闲购物、日常工作和体育运动;
获取待预测用户的行为信息;
确定多个样本用户中的目标样本用户;目标样本用户的行为信息与待预测用户的行为信息差异最小;
将目标样本用户的行为意图确定为待预测用户的行为意图。
相较现有技术中,根据单一场景预测用户行为意图的方法,本发明技术方案提供了一种多场景情况下预测用户行为意图的方法。以样本用户的行为信息做参照,找到样本用户中与待预测用户行为最相似的目标样本用户,将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性,因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对,本方案的预测结果的准确性得到了显著提升。
第二方面,提供一种用户行为意图预测装置,包括:第一获取获取单元、第二获取单元和确定单元;
第一获取单元,用于获取多个样本用户的行为信息和行为意图;行为信息至少包括:出行方式、关注信息、年龄段和出行目的地;行为意图至少为以下任一种:旅行、医院就医、休闲购物、日常工作和体育运动;
第二获取单元,用于获取待预测用户的行为信息;
确定单元,用于确定多个样本用户中的目标样本用户;目标样本用户的行为信息与待预测用户的行为信息差异最小;
确定单元,还用于将第一获取单元获取的目标样本用户的行为意图确定为待预测用户的行为意图。
第三方面,提供一种用户行为意图预测装置,包括存储器、处理器、总线和通信接口;存储器用于存储计算机执行指令,处理器与存储器通过总线连接;当用户行为意图预测装置运行时,处理器执行存储器存储的计算机执行指令,以使用户行为意图预测装置执行如第一方面提供的用户行为意图预测方法。
本发明实施例提供的用户行为意图预测方法和装置,该方法包括:获取多个样本用户的行为信息和行为意图;获取待预测用户的行为信息;确定多个样本用户中的目标样本用户;将目标样本用户的行为意图确定为待预测用户的行为意图。本发明技术方案以样本用户的行为信息做参照,找到样本用户中与待预测用户行为最相似的目标样本用户,将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性,因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对,本方案用户行为意图的预测结果的准确性得到了显著提升。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种用户行为意图预测方法的流程示意图;
图2为本发明实施例提供的另一种用户行为意图预测方法的流程示意图;
图3为本发明实施例提供的一种获取待预测用户的出行方式的流程图;
图4为本发明实施例提供的一种获取待预测用户的关注信息的流程图;
图5为本发明实施例提供的一种确定待预测用户的年龄段的流程图;
图6为本发明实施例提供的一种确定待预测用户的出行目的地的流程图;
图7为本发明实施例提供的一种确定多个样本用户中的目标样本用户的流程图;
图8为本发明实施例提供的一种用户行为意图预测装置的结构示意图;
图9为本发明实施例提供的另一种用户行为意图预测装置的结构示意图;
图10为本发明实施例提供的另一种用户行为意图预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
还需要说明的是,本发明实施例中,“的(英文:of)”,“相应的(英文:corresponding,relevant)”和“对应的(英文:corresponding)”有时可以混用,应当指出的是,在不强调其区别时,其所要表达的含义是一致的。
为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
目前预测用户行为意图的技术方案主要集中在某一特定场景,用于预测的原始数据的种类有限。比如,根据用户的搜索关键字来推测用户的行为意图,这一方案仅仅考虑了关键字这一个场景,而影响用户行为意图预测的因素还有用户的年龄、出行的方式等等其他不同的场景。而通信运营商具有用户通信行为的全量数据,因此可利用这些丰富的全量数据构建多场景下的用户行为意图预测方法。
参照图1所示,本发明实施例提供一种用户行为意图的预测方法,包括:
S101、获取多个样本用户的行为信息和行为意图。
其中,行为信息至少包括:出行方式、关注信息、年龄段和出行目的地。出行方式可以为私家车、步行和公交等;关注信息为用户通过互联网或者移动终端浏览的信息;出行目的地包括学校、商场和医院等场所。
行为意图至少为以下任一种:旅行、医院就医、休闲购物、日常工作和体育运动。其中,当行为意图为旅行时,表示待预测用户在去旅行的途中;当行为意图为医院就医时,表示用户将要去医院看病;当行为意图为休闲购物时,表示用户将要去商场购物;当行为意图为日常工作时,表示用户将要去公司上班;当行为意图为体育运动时,表示用户将要锻炼身体。需要说明的是,在实际中,用户的行为意图不限于上述已列出的几种行为意图。
运营商处存储有用户的历史行为数据,样本用户的行为信息和行为意图可以从运营商的数据库中获取。
S102、获取待预测用户的行为信息。
由于待预测用户的行为信息还不是历史信息,因此不能在数据库中直接获取到。因此,需要根据样本用户的行为信息比对出待预测用户的行为信息,具体可以以下方法获得待预测用户的行为信息:
示例性的,一种可能的实施例中,如图2所示,S102具体包括S1021-S1022。
S1021、获取待预测用户的出行方式和关注信息。
示例性的,一种可能的实施例中,如图3所示,获取待预测用户的出行方式具体包括S301-S304。
S301、获取待预测用户的活动链。
其中,活动链是运营商系统中实时更新的数据,活动链记载了每个时间点下待预测用户的坐标信息,即每个时间点下用户终端所处位置的经纬度。
S302、根据待预测用户的活动链,确定待预测用户的出行距离和出行时间。
示例性的,根据两个时间点间的间隔确定用户的出行时间,根据该出行时间内用户坐标信息的变化确定用户的出行距离。
S303、根据待预测用户的出行距离和出行时间,确定待预测用户的移动速率。
示例性的,假设用户的出行时间是0.5个小时,在该出行时间内,该用户出行的距离为5公里,则该用户的移动速率为10公里/小时。
S304、根据待预测用户的移动速率确定待预测用户的出行方式。
示例性的,由于每种出行方式都对应有不同的速率范围,因此可以根据用户的移动速率来确定用户选择的出行方式。如表1所示,本发明实施例示例性的举出了几种出行方式及各种出行方式对应的速率(S)的范围。需要说明的是,在实际应用中,出行方式不限于表1中所列举的内容。
Figure BDA0002258015610000051
Figure BDA0002258015610000061
表1
示例性的,一种可能的实施例中,如图4所示,获取待预测用户的关注信息具体包括S401-S404。需要说明的是,获取待预测用户的关注信息实际上是获取待预测用户在最近的某个时间段内关注的信息,该时间段的长短可根据实际情况确定。
S401、判断待预测用户使用的应用程序是否与第一关注信息相关。
在一种可能的实施方式中,可以判断用户在近2个小时内使用的应用程序是否与第一关注信息相关。
若待预测用户使用的应用程序与第一关注信息相关,执行S4021;若待预测用户使用的应用程序不与第一关注信息相关,则执行S4022。
S4021、将第一权重增加第一数值,以生成第二权重。
S4022、确定第二权重与第一权重相等。
其中第一关注信息为用户感兴趣或者想要了解的信息,示例性的,
表1列出了几个关注信息。其中,当关注信息为旅行时,表示用户在关注旅行方面的信息;当关注信息为医院就医时,表示用户在浏览医院和医疗方面的信息;当关注信息为休闲购物时,表示用户在关注购物方面的信息;当关注信息为体育运动时,表示用户在关注体育运动方面的信息。需要说明的是,在实际应用中,关注信息不限于表2中所列举的内容。
序号 关注信息
1 旅行
2 医院就医
3 休闲购物
4 日常工作
5 体育运动
表2
示例性的,以判断待预测用户使用的应用程序是否与“医院就医”相关为例,可通过待预测用户使用的应用程序的类别标识是否为治疗服务,来确定该应用程序与“医院就医”相关,若待预测用户使用的应用程序的类别标识是治疗服务,则该应用程序与“医院就医”相关,将第一权重增加第一数值,得到第二权重。
其中,第一权重为一个初始的赋值,可以为任何数值。
S403、判断待预测用户使用应用程序浏览的内容是否与第一关注信息相关。
在一种可能的实施方式中,可以判断用户在近2个小时内使用上述应用程序浏览的内容是否与第一关注信息相关。
若待预测用户使用上述应用程序浏览的内容与第一关注信息相关,执行S4041;若待预测用户使用上述应用程序浏览的内容不与第一关注信息相关,则执行S4042。
S4041、将第二权重增加第二数值,以生成第三权重。
S4042、确定第三权重与第二权重相等。
示例性的,以判断待预测用户使用该应用程序浏览的内容是否与“医院就医”相关为例,可通过语义分析技术分析浏览内容以判断其是否与“医院就医”相关。若相关,则将第二权重增加第二数值,得到第三权重。
S405、判断待预测用户在应用程序的搜索内容是否与第一关注信息相关。
在一种可能的实施方式中,可以判断用户在近2个小时内在上述应用程序内搜索的内容是否与第一关注信息相关。
若待预测用户在上述应用程序的搜索内容与第一关注信息相关,则执行S4061;若待预测用户在上述应用程序的搜索内容不与第一关注信息相关,则执行S4062。
S4061、将第三权重增加第三数值,以生成第四权重。
S4062、确定第四权重与第三权重相等。
示例性的,以判断待预测用户在该应用程序的搜索内容是否与“医院就医”相关为例,可提取搜索内容中的关键词利用语义分析技术判断其是否与“医院就医”相关。若相关,则将第三权重增加第三数值,得到第四权重。
其中,第一数值、第二数值和第三数值的大小可依上述三个因素,即应用程序是否与第一关注信息相关、应用程序浏览的内容是否与第一关注信息相关和在应用程序的搜索内容是否与第一关注信息相关对确定关注信息的影响程度不同而确定不同的值。示例性的,若应用程序是否与第一关注信息相关这一判断条件对关注信息的确定影响较大,则可将第一数值定义一个较大的数值。第一数值、第二数值和第三数值的大小可以相同,也可以不同。
S407、判断第四权重是否大于等于预设阈值。
若第四权重大于等于预设阈值,则执行S4081;若第四权重小于预设阈值,则执行S4082。
S4081、确定第一关注信息为待预测用户的关注信息。
具体的,若第四权重大于等于预设阈值,则确定“医院就医”为待预测用户的关注信息。
S4082、判断第二关注信息是否为待预测信息。
其中,第二关注信息为除第一关注信息之外的其他关注信息。具体的,若第四权重小于预设阈值,则将上述步骤中的“医院就医”变更为其他关注信息进行遍历判断,直到出现能够使第四权重大于等于预设阈值的关注信息,然后将该关注信息确定为待预测用户的关注信息。
S1022、根据待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。
示例性的,一种可能的实施例中,如图5所示,根据待预测用户的出行方式和关注信息确定待预测用户的年龄段,具体包括S501-S506。
S501、获取样本用户及待预测用户的兴趣点。
其中,兴趣点为POI,point of interest,在地理信息系统中POI可以是一栋房子、一个商铺或一个公交站。本发明实施例中的POI用于表示用户在行程中驻留的地点。
S502、将样本用户的出行方式、关注信息和兴趣点及待预测用户的出行方式、关注信息和兴趣点赋值。
其中,出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应。
如表3所示,示例性的列出了几个兴趣点:
Figure BDA0002258015610000081
Figure BDA0002258015610000091
表3
示例性的,将表1中的每种出行方式赋值,将表2中的每种关注信息赋值,将表3中的每种兴趣点赋值。
S503、将样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到样本用户的年龄段的第一量化值。
示例性的,将每种出行方式、关注信息和兴趣点按照表1、表2和表3中的序号赋值。假设样本用户的出行方式为公交,赋值为2,关注信息为休闲购物,赋值为3,兴趣点为银行,赋值为4,若出行方式权重为0.2,关注信息权重为0.3,兴趣点权重为0.5,最终得到的加权平均值为3.3,则样本用户的年龄段的第一量化值即为3.3。其中,不同行为信息的权重依照该行为信息对最后确定年龄段的影响程度设定。示例性的,若关注信息对确定用户年龄段有较大影响,则可以给关注信息设定一个较高的权重。根据实际情况,各个行为信息所占的权重可以相同,也可以不同。
S504、将样本用户的年龄段与第一量化值对应。
其中,样本用户的年龄段可根据用户在系统中预留的身份信息中的年龄信息获得。将样本用户的年龄段与年龄段的量化值对应。需要说明的是,虽然用户在运营商处预留有年龄信息,但是现实中存在电话卡实际使用人与登记人不符的情况。在样本用户中,由于样本众多,因此可以忽略该种异常情况对年龄段与年龄段的量化值的对应关系的影响。但是在针对具体的某个待预测用户时,需要准确的确定待预测用户的年龄,此时需要考虑电话卡实际使用人与登记人不符的情况,因此,本发明实施例采用计算推测的方式来确定待预测用户的年龄,而不直接采用待预测用户在系统中预留的年龄。
S505、将待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到待预测用户的年龄段的第二量化值。
示例性的,可参照上述S503获取样本用户的年龄段的第一量化值的方法。
S506、将第一量化值与第二量化值相同的样本用户的年龄段,确定为待预测用户的年龄段。
需要说明的是,若存在多个第一量化值与第二量化值相同的样本用户,则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段;
若存在多个第一量化值与第二量化值相同,且关注信息的赋值与待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与待预测用户的兴趣点的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段;
若存在多个第一量化值与第二量化值相同,且关注信息的赋值与待预测用户的关注信息的赋值相同,兴趣点的赋值与待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与待预测用户的出行方式的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段。
需要说明的是,当存在多个第三量化值与第四量化值相同的样本用户时,之所以按关注信息赋值相同、兴趣点赋值相同和出行方式赋值相同这一顺序去确定最接近的样本用户,是因为考虑到不同的行为信息对最终结果的影响程度不同。在实际应用中,若兴趣点对最终结果影响较大,出行方式次之,关注信息影响最小,则可以先判断样本用户兴趣点的赋值是否与待预测用户兴趣点的赋值相同,若相同则再判断样本用户的出行方式的赋值是否与待预测用户的出行方式的赋值相同,若相同则再判断样本用户的关注信息的赋值是否与待预测用户的关注信息的赋值相同。
示例性的,一种可能的实施例中,如图6所示,根据待预测用户的出行方式和关注信息确定待预测用户的出行目的地,具体包括S601-S606。
S601、获取样本用户及待预测用户的兴趣点。
S602、将样本用户的出行方式、关注信息和兴趣点及待预测用户的出行方式、关注信息和兴趣点赋值。
其中,出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应。
S603、将样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到样本用户的出行目的地的第三量化值。
示例性的,假设样本用户的出行方式为地铁,赋值为3,关注信息为日常工作,赋值为4,兴趣点为早餐店,赋值为6,若出行方式的权重为0.3,关注信息的权重为0.6,兴趣点的权重为0.1,最终得到的加权平均值为3.9,则样本用户的出行目的地的第三量化值即为3.9。其中,不同行为信息的权重依照该行为信息对最后确定出行目的地的影响程度设定。示例性的,若出行方式对确定出行目的地有较大影响,则可以给出行方式设定一个较高的权重。根据实际情况,各个行为信息所占的权重可以相同,也可以不同。
S604、将样本用户的出行目的地与第三量化值对应。
示例性的,若上述样本用户的出行目的地为学校,则将学校与出行目的地的量化值3.9对应。
S605、将待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到待预测用户的出行目的地的第四量化值。
示例性的,具体计算过程可参照S503。
S606、将第三量化值与第四量化值相同的样本用户的出行目的地,确定为待预测用户的出行目的地。
需要说明的是,若存在多个第三量化值与第四量化值相同的样本用户,则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地;
若存在多个第三量化值与第四量化值相同,且关注信息的赋值与待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与待预测用户的兴趣点的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地;
若存在多个第三量化值与第四量化值相同,且关注信息的赋值与待预测用户的关注信息的赋值相同,兴趣点的赋值与待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与待预测用户的出行方式的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地。
需要说明的是,当存在多个第三量化值与第四量化值相同的样本用户时,之所以按关注信息赋值相同、兴趣点赋值相同和出行方式赋值相同这一顺序去确定最接近的样本用户,是因为考虑到不同的行为信息对最终结果的影响程度不同。在实际应用中,若出行方式对最终结果影响较大,关注信息次之,兴趣点影响最小,则可以先判断样本用户出行方式的赋值是否与待预测用户出行方式的赋值相同,若相同则再判断样本用户的关注信息的赋值是否与待预测用户的关注信息的赋值相同,若相同则再判断样本用户的兴趣点的赋值是否与待预测用户的兴趣点的赋值相同。S103、确定多个样本用户中的目标样本用户。
其中,目标样本用户的行为信息与待预测用户的行为信息差异最小。
示例性的,一种可能的实施例中,如图7所示,S103具体包括S701-S704。
S701、为样本用户的每种行为信息和待预测用户的每种行为信息赋值。
其中,每种行为信息的赋值均与其各自具体内容对应;相同的行为信息赋予相同的值,不同的行为信息赋予不同的值。赋值的大小可根据实际情况设定,以方便计算为原则。
S702、计算待预测用户的任一种行为信息与样本用户的任一种行为信息的赋值之间的差值的绝对值。
表4示例性的列出了一个样本用户与待预测用户行为信息的赋值的对比信息。
出行方式 关注信息 年龄段 出行目的地
样本用户A 2 3 2 5
样本用户B 1 1 2 3
待预测用户 2 3 4 1
表4
根据上表,样本用户A与待预测用户的出行方式之间的差值的绝对值为0,关注信息之间的差值的绝对值为0,年龄段之间的差值的绝对值为2,出行目的地的差值的绝对值为4。样本用户B与待预测用户的出行方式之间的差值的绝对值为1,关注信息之间的差值的绝对值为2,年龄段之间的差值的绝对值为2,出行目的地的差值的绝对值为2。
S703、将待预测用户的每一种行为信息对应的绝对值的和确定为待预测用户与样本用户的差异值。
示例性的,根据表4可知,待预测用户与样本用户A之间每一种行为信息对应的绝对值的和为6,即待预测用户与样本用户的差异值为6。待预测用户与样本用户A之间每一种行为信息对应的绝对值的和为7,即待预测用户与样本用户的差异值为7。
S704、将与待预测用户的差异值最小的样本用户确定为目标样本用户。
具体的,依次计算每个样本用户与待预测用户的差异值,直到找到与待预测用户的差异值为0的样本用户为止,将该样本用户的行为意图确定为待预测用户的行为意图。若没有与待预测用户的差异值为0的样本用户,则将与待预测用户的差异值最小的样本用户的行为意图确定为待预测用户的行为意图。示例性的,样本用户A与待预测用户的差异值为6,样本用户B与待预测用户的差异值为7,则将样本用户A确定为目标样本用户。
需要说明的是,在一种可能的情况中,样本用户与待预测用户的差异值都很大,即使将样本用户中与待预测用户的差异值最小的样本用户确定为目标样本用户也没有意义。因此,可设定一个阈值,当样本用户与待预测用户的差异值大于该阈值时,则将该样本用户删除。此时将会出现没有任何一个样本用户的行为与待预测用户相似的情况。
S104、将目标样本用户的行为意图确定为待预测用户的行为意图。
本发明实施例提供一种用户行为意图预测方法,包括:获取多个样本用户的行为信息和行为意图;获取待预测用户的行为信息;确定多个样本用户中的目标样本用户;将目标样本用户的行为意图确定为待预测用户的行为意图。本发明技术方案以样本用户的行为信息做参照,找到样本用户中与待预测用户行为最相似的目标样本用户,将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性,因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对,本方案用户行为意图的预测结果的准确性得到了显著提升。
参照图8所示,本发明实施例还提供一种用户行为意图预测装置80,包括第一获取单元81、第二获取单元82和确定单元83
第一获取单元81,用于获取多个样本用户的行为信息和行为意图;行为信息至少包括:出行方式、关注信息、年龄段和出行目的地;行为意图至少为以下任一种:旅行、医院就医、休闲购物、日常工作和体育运动;
第二获取单元82,用于获取待预测用户的行为信息;
确定单元83,用于确定多个样本用户中的目标样本用户;目标样本用户的行为信息与待预测用户的行为信息差异最小;
确定单元83,还用于将第一获取单元81获取的目标样本用户的行为意图确定为待预测用户的行为意图。
可选的,如图9所示,第二获取单元82包括获取子单元821和处理子单元822;
其中,获取子单元821用于获取待预测用户的出行方式和关注信息;
处理子单元822用于根据待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。
可选的,获取子单元821具体用于:
获取待预测用户的活动链,活动链记载了每个时间点下待预测用户的坐标信息;
根据待预测用户的活动链,确定待预测用户的出行距离和出行时间;
根据待预测用户的出行距离和出行时间,确定待预测用户的移动速率;
根据待预测用户的移动速率确定待预测用户的出行方式。
可选的,获取子单元821具体用于:
判断待预测用户使用的应用程序是否与第一关注信息相关,若是,则将第一权重增加第一数值,以生成第二权重;
判断待预测用户使用应用程序浏览的内容是否与第一关注信息相关,若是,则将第二权重增加第二数值,以生成第三权重;
判断待预测用户在应用程序的搜索内容是否与第一关注信息相关,若是,则将第三权重增加第三数值,以生成第四权重;
第四权重大于等于预设阈值,则确定第一关注信息为待预测用户的关注信息。
可选的,第一获取单元81还用于获取样本用户的兴趣点,其中兴趣点为用户在行程中驻留的地点;
获取子单元821还用于获取样本用户及待预测用户的兴趣点,兴趣点为用户在行程中驻留的地点;
处理子单元822还用于将第一获取单元81获取的样本用户的出行方式、关注信息和兴趣点及获取子单元821获取的待预测用户的出行方式、关注信息和兴趣点赋值,出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应;
处理子单元822还用于将第一获取单元81获取的样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到样本用户的年龄段的第一量化值;
处理子单元822还用于将第一获取单元81获取的样本用户的年龄段与第一量化值对应;
处理子单元822还用于将获取子单元821获取的待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到待预测用户的年龄段的第二量化值;
处理子单元822还用于将第一量化值与第二量化值相同的样本用户的年龄段,确定为待预测用户的年龄段。
可选的,处理子单元822具体用于:
若存在多个第一量化值与第二量化值相同的样本用户,则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段;
若存在多个第一量化值与第二量化值相同,且关注信息的赋值与待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与待预测用户的兴趣点的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段;
若存在多个第一量化值与第二量化值相同,且关注信息的赋值与待预测用户的关注信息的赋值相同,兴趣点的赋值与待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与待预测用户的出行方式的赋值最接近的样本用户的年龄段确定为待预测用户的年龄段。
可选的,第一获取单元81还用于获取样本用户的兴趣点,兴趣点为用户在行程中驻留的地点;
获取子单元821还用于获取待预测用户的兴趣点;
处理子单元822还用于将第一获取单元81获取的样本用户的出行方式、关注信息和兴趣点及获取子单元821获取的待预测用户的出行方式、关注信息和兴趣点赋值,出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应;
处理子单元822还用于将第一获取单元获取的样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到样本用户的出行目的地的第三量化值;
处理子单元822还用于将获取子单元821获取的样本用户的出行目的地与第三量化值对应;
处理子单元822还用于将获取子单元821获取的待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到待预测用户的出行目的地的第四量化值;
处理子单元822还用于将第三量化值与第四量化值相同的样本用户的出行目的地,确定为待预测用户的出行目的地。
可选的,处理子单元822具体用于:
若存在多个第三量化值与第四量化值相同的样本用户,则将关注信息的赋值与待预测用户的关注信息的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地;
若存在多个第三量化值与第四量化值相同,且关注信息的赋值与待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与待预测用户的兴趣点的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地;
若存在多个第三量化值与第四量化值相同,且关注信息的赋值与待预测用户的关注信息的赋值相同,兴趣点的赋值与待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与待预测用户的出行方式的赋值最接近的样本用户的出行目的地确定为待预测用户的出行目的地。
可选的,确定单元83具体用于:
为第一获取单元81获取的样本用户的每种行为信息和第二获取单元82获取的待预测用户的每种行为信息赋值;每种行为信息的赋值均与其各自具体内容对应;
计算第二获取单元82获取的待预测用户的任一种行为信息与第一获取单元81获取的样本用户的任一种行为信息的赋值之间的差值的绝对值;
将第二获取单元82获取的待预测用户的每一种行为信息对应的绝对值的和确定为待预测用户与样本用户的差异值;
将与待预测用户的差异值最小的样本用户确定为目标样本用户。
本发明实施例提供一种用户行为意图预测装置,包括第一获取单元、第二获取单元和确定单元。其中,第一获取单元,用于获取多个样本用户的行为信息和行为意图;第二获取单元,用于获取待预测用户的行为信息;确定单元,用于确定多个样本用户中的目标样本用户;确定单元,还用于将第一获取单元获取的目标样本用户的行为意图确定为待预测用户的行为意图。本发明技术方案以样本用户的行为信息做参照,找到样本用户中与待预测用户行为最相似的目标样本用户,将目标样本用户的行为意图推断为待预测用户的行为意图。本方案从多个场景综合分析了待预测用户与样本用户间行为的相似性,因而目标样本用户的行为意图能够非常贴近的反映出待预测用户的行为意图。相比于单场景的行为比对,本方案用户行为意图的预测结果的准确性得到了显著提升。
参照图10所示,本发明实施例还提供一种用户行为意图预测装置,包括存储器101、处理器102、总线103和通信接口104;存储器101用于存储计算机执行指令,处理器102与存储器101通过总线103连接;当用户行为意图预测装置运行时,处理器102执行存储器101存储的计算机执行指令,以使用户行为意图预测装置执行如上述实施例提供的用户行为意图预测方法。
在具体的实现中,作为一种实施例,处理器102(102-1和102-2)可以包括一个或多个CPU,例如图10中所示的CPU0和CPU1。且作为一种实施例,用户行为意图预测装置可以包括多个处理器102,例如图10中所示的处理器102-1和处理器102-2。这些处理器102中的每一个CPU可以是一个单核处理器(single-CPU),也可以是一个多核处理器(multi-CPU)。这里的处理器102可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
存储器101可以是只读存储器101(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(randomaccess memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器101可以是独立存在,通过总线103与处理器102相连接。存储器101也可以和处理器102集成在一起。
在具体的实现中,存储器101,用于存储本申请中的数据和执行本申请的软件程序对应的计算机执行指令。处理器102可以通过运行或执行存储在存储器101内的软件程序,以及调用存储在存储器101内的数据,用户行为意图预测装置的各种功能。
通信接口104,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如控制系统、无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks,WLAN)等。通信接口104可以包括接收单元实现接收功能,以及发送单元实现发送功能。
总线103,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(peripheral component interconnect,PCI)总线或扩展工业标准体系结构(extended industry standard architecture,EISA)总线等。该总线103可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本发明实施例还提供一种计算机存储介质,计算机存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行如上述实施例提供的用户行为意图预测方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (19)

1.一种用户行为意图预测方法,其特征在于,包括:
获取多个样本用户的行为信息和行为意图;所述行为信息至少包括:出行方式、关注信息、年龄段和出行目的地;所述行为意图至少为以下任一种:旅行、医院就医、休闲购物、日常工作和体育运动;
获取待预测用户的行为信息;
确定所述多个样本用户中的目标样本用户;所述目标样本用户的行为信息与所述待预测用户的行为信息差异最小;
将目标样本用户的行为意图确定为所述待预测用户的行为意图。
2.根据权利要求1所述的用户行为意图预测方法,其特征在于,所述获取待预测用户的行为信息包括:
获取待预测用户的出行方式和关注信息;
根据待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。
3.根据权利要求2所述的用户行为意图预测方法,其特征在于,获取待预测用户的出行方式,包括:
获取所述待预测用户的活动链,所述活动链记载了每个时间点下所述待预测用户的坐标信息;
根据所述待预测用户的活动链,确定所述待预测用户的出行距离和出行时间;
根据所述待预测用户的出行距离和出行时间,确定所述待预测用户的移动速率;
根据所述待预测用户的所述移动速率确定所述待预测用户的出行方式。
4.根据权利要求2所述的用户行为意图预测方法,其特征在于,获取待预测用户的关注信息,包括:
判断所述待预测用户使用的应用程序是否与第一关注信息相关,若是,则将第一权重增加第一数值,以生成第二权重;
判断所述待预测用户使用所述应用程序浏览的内容是否与所述第一关注信息相关,若是,则将所述第二权重增加第二数值,以生成第三权重;
判断所述待预测用户在所述应用程序的搜索内容是否与所述第一关注信息相关,若是,则将所述第三权重增加第三数值,以生成第四权重;
所述第四权重大于等于预设阈值,则确定所述第一关注信息为所述待预测用户的关注信息。
5.根据权利要求2所述的用户行为意图预测方法,其特征在于,根据待预测用户的出行方式和关注信息确定待预测用户的年龄段,包括:
获取所述样本用户及所述待预测用户的兴趣点,所述兴趣点为用户在行程中驻留的地点;
将所述样本用户的出行方式、关注信息和兴趣点及所述待预测用户的出行方式、关注信息和兴趣点赋值;所述出行方式、所述关注信息和所述兴趣点的赋值均与其各自具体内容对应;
将所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述样本用户的年龄段的第一量化值;
将所述样本用户的年龄段与所述第一量化值对应;
将所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述待预测用户的年龄段的第二量化值;
将所述第一量化值与所述第二量化值相同的样本用户的年龄段,确定为所述待预测用户的年龄段。
6.根据权利要求5所述的用户行为意图预测方法,其特征在于,
若存在多个所述第一量化值与所述第二量化值相同的样本用户,则将关注信息的赋值与所述待预测用户的关注信息的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段;
若存在多个所述第一量化值与所述第二量化值相同,且关注信息的赋值与所述待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与所述待预测用户的兴趣点的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段;
若存在多个所述第一量化值与所述第二量化值相同,且关注信息的赋值与所述待预测用户的关注信息的赋值相同,兴趣点的赋值与所述待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与所述待预测用户的出行方式的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段。
7.根据权利要求2所述的用户行为意图预测方法,其特征在于,根据待预测用户的出行方式和关注信息确定待预测用户的出行目的地,包括:
获取所述样本用户及所述待预测用户的兴趣点,所述兴趣点为用户在行程中驻留的地点;
将所述样本用户的出行方式、关注信息和兴趣点及所述待预测用户的出行方式、关注信息和兴趣点赋值;出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应;
将所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述样本用户的出行目的地的第三量化值;
将所述样本用户的出行目的地与所述第三量化值对应;
将所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述待预测用户的出行目的地的第四量化值;
将所述第三量化值与所述第四量化值相同的样本用户的出行目的地,确定为所述待预测用户的出行目的地。
8.根据权利要求7所述的用户行为意图预测方法,其特征在于,
若存在多个所述第三量化值与所述第四量化值相同的样本用户,则将关注信息的赋值与所述待预测用户的关注信息的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地;
若存在多个所述第三量化值与所述第四量化值相同,且关注信息的赋值与所述待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与所述待预测用户的兴趣点的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地;
若存在多个所述第三量化值与所述第四量化值相同,且关注信息的赋值与所述待预测用户的关注信息的赋值相同,兴趣点的赋值与所述待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与所述待预测用户的出行方式的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地。
9.根据权利要求1所述的用户行为意图预测方法,其特征在于,所述确定所述多个样本用户中的目标样本用户包括:
为所述样本用户的每种行为信息和待预测用户的每种行为信息赋值;每种行为信息的赋值均与其各自具体内容对应;
计算所述待预测用户的任一种行为信息与所述样本用户的所述任一种行为信息的赋值之间的差值的绝对值;
将所述待预测用户的每一种行为信息对应的绝对值的和确定为所述待预测用户与所述样本用户的差异值;
将与所述待预测用户的差异值最小的样本用户确定为目标样本用户。
10.一种用户行为意图预测装置,其特征在于,所述装置包括:第一获取单元、第二获取单元和确定单元;
所述第一获取单元,用于获取多个样本用户的行为信息和行为意图;所述行为信息至少包括:出行方式、关注信息、年龄段和出行目的地;所述行为意图至少为以下任一种:旅行、医院就医、休闲购物、日常工作和体育运动;
所述第二获取单元,用于获取待预测用户的行为信息;
所述确定单元,用于确定所述多个样本用户中的目标样本用户;所述目标样本用户的行为信息与所述待预测用户的行为信息差异最小;
所述确定单元,还用于将所述第一获取单元获取的目标样本用户的行为意图确定为所述待预测用户的行为意图。
11.根据权利要求10所述的用户行为意图预测装置,其特征在于,所述第二获取单元包括:获取子单元和处理子单元;
所述获取子单元用于获取待预测用户的出行方式和关注信息;
所述处理子单元用于根据所述获取子单元获取的待预测用户的出行方式和关注信息确定待预测用户的年龄段和出行目的地。
12.根据权利要求11所述的用户行为意图预测装置,其特征在于,所述获取子单元具体用于:
获取所述待预测用户的活动链,所述活动链记载了每个时间点下所述待预测用户的坐标信息;
根据所述待预测用户的活动链,确定所述待预测用户的出行距离和出行时间;
根据所述待预测用户的出行距离和出行时间,确定所述待预测用户的移动速率;
根据所述待预测用户的所述移动速率确定所述待预测用户的出行方式。
13.根据权利要求11所述的用户行为意图预测装置,其特征在于,所述获取子单元具体用于:
判断所述待预测用户使用的应用程序是否与第一关注信息相关,若是,则将第一权重增加第一数值,以生成第二权重;
判断所述待预测用户使用所述应用程序浏览的内容是否与所述第一关注信息相关,若是,则将所述第二权重增加第二数值,以生成第三权重;
判断所述待预测用户在所述应用程序的搜索内容是否与所述第一关注信息相关,若是,则将所述第三权重增加第三数值,以生成第四权重;
所述第四权重大于等于预设阈值,则确定所述第一关注信息为所述待预测用户的关注信息。
14.根据权利要求11所述的用户行为意图预测装置,其特征在于,
所述第一获取单元还用于获取所述样本用户的兴趣点,所述兴趣点为用户在行程中驻留的地点;
所述获取子单元还用于获取所述待预测用户的兴趣点;
所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点及所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点赋值,所述出行方式、所述关注信息和所述兴趣点的赋值均与其各自具体内容对应;
所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述样本用户的年龄段的第一量化值;
所述处理子单元还用于将所述第一获取单元获取的所述样本用户的年龄段与所述第一量化值对应;
所述处理子单元还用于将所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述待预测用户的年龄段的第二量化值;
所述处理子单元还用于将所述第一量化值与所述第二量化值相同的样本用户的年龄段,确定为所述待预测用户的年龄段。
15.根据权利要求14所述的用户行为意图预测装置,其特征在于,所述处理子单元具体用于:
若存在多个所述第一量化值与所述第二量化值相同的样本用户,则将关注信息的赋值与所述待预测用户的关注信息的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段;
若存在多个所述第一量化值与所述第二量化值相同,且关注信息的赋值与所述待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与所述待预测用户的兴趣点的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段;
若存在多个所述第一量化值与所述第二量化值相同,且关注信息的赋值与所述待预测用户的关注信息的赋值相同,兴趣点的赋值与所述待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与所述待预测用户的出行方式的赋值最接近的样本用户的年龄段确定为所述待预测用户的年龄段。
16.根据权利要求11所述的用户行为意图预测装置,其特征在于,
所述第一获取单元还用于获取所述样本用户的兴趣点,所述兴趣点为用户在行程中驻留的地点;
所述获取子单元还用于获取所述待预测用户的兴趣点;
所述处理子单元还用于将第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点及所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点赋值,出行方式、关注信息和兴趣点的赋值均与其各自具体内容对应;
所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述样本用户的出行目的地的第三量化值;
所述处理子单元还用于将所述第一获取单元获取的所述样本用户的出行目的地与所述第三量化值对应;
所述处理子单元还用于将所述获取子单元获取的所述待预测用户的出行方式、关注信息和兴趣点的赋值求加权平均值,得到所述待预测用户的出行目的地的第四量化值;
所述处理子单元还用于将所述第三量化值与所述第四量化值相同的样本用户的出行目的地,确定为所述待预测用户的出行目的地。
17.根据权利要求16所述的用户行为意图预测装置,其特征在于,所述处理子单元具体用于:
若存在多个所述第三量化值与所述第四量化值相同的样本用户,则将关注信息的赋值与所述待预测用户的关注信息的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地;
若存在多个所述第三量化值与所述第四量化值相同,且关注信息的赋值与所述待预测用户的关注信息也相同的样本用户,则将兴趣点的赋值与所述待预测用户的兴趣点的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地;
若存在多个所述第三量化值与所述第四量化值相同,且关注信息的赋值与所述待预测用户的关注信息的赋值相同,兴趣点的赋值与所述待预测用户的兴趣点的赋值也相同的样本用户,则将出行方式的赋值与所述待预测用户的出行方式的赋值最接近的样本用户的出行目的地确定为所述待预测用户的出行目的地。
18.根据权利要求10所述的用户行为意图预测装置,其特征在于,所述确定单元具体用于:
为第一获取单元获取的所述样本用户的每种行为信息和第二获取单元获取的待预测用户的每种行为信息赋值;每种行为信息的赋值均与其各自具体内容对应;
计算所述第二获取单元获取的所述待预测用户的任一种行为信息与所述第一获取单元获取的所述样本用户的所述任一种行为信息的赋值之间的差值的绝对值;
将所述第二获取单元获取的所述待预测用户的每一种行为信息对应的绝对值的和确定为所述待预测用户与所述样本用户的差异值;
将与所述待预测用户的差异值最小的样本用户确定为目标样本用户。
19.一种用户行为意图预测装置,其特征在于,包括:处理器、收发器和存储器;其中,存储器用于存储一个或多个程序,所述一个或多个程序包括计算机执行指令,当所述用户行为意图预测装置运行时,处理器执行所述存储器存储的所述计算机执行指令,以使所述用户行为意图预测装置执行权利要求1-9任一项所述的用户行为意图预测方法。
CN201911061264.7A 2019-11-01 2019-11-01 一种用户行为意图预测方法和装置 Active CN110990714B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911061264.7A CN110990714B (zh) 2019-11-01 2019-11-01 一种用户行为意图预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911061264.7A CN110990714B (zh) 2019-11-01 2019-11-01 一种用户行为意图预测方法和装置

Publications (2)

Publication Number Publication Date
CN110990714A true CN110990714A (zh) 2020-04-10
CN110990714B CN110990714B (zh) 2023-05-23

Family

ID=70082983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911061264.7A Active CN110990714B (zh) 2019-11-01 2019-11-01 一种用户行为意图预测方法和装置

Country Status (1)

Country Link
CN (1) CN110990714B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966193A (zh) * 2021-03-05 2021-06-15 北京百度网讯科技有限公司 出行意图推断方法、模型训练方法、相关装置及电子设备
CN113946757A (zh) * 2021-12-21 2022-01-18 深圳市活力天汇科技股份有限公司 一种识别用户出行目的的方法、装置及可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100257019A1 (en) * 2009-04-02 2010-10-07 Microsoft Corporation Associating user-defined descriptions with objects
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置
CN106875066A (zh) * 2017-02-28 2017-06-20 百度在线网络技术(北京)有限公司 用车出行行为的预测方法、装置、服务器以及存储介质
CN107993085A (zh) * 2017-10-19 2018-05-04 阿里巴巴集团控股有限公司 模型训练方法、基于模型的用户行为预测方法及装置
CN108268617A (zh) * 2018-01-05 2018-07-10 阿里巴巴集团控股有限公司 用户意图确定方法及装置
CN109146280A (zh) * 2018-08-14 2019-01-04 北京三快在线科技有限公司 一种推送信息的方法、装置及系统
CN109543190A (zh) * 2018-11-29 2019-03-29 北京羽扇智信息科技有限公司 一种意图识别方法、装置、设备及存储介质
CN110084630A (zh) * 2019-03-05 2019-08-02 浙江工业大学之江学院 基于梯度提升决策树的用户旅游出行意向及类型预测方法
US20190266622A1 (en) * 2018-02-27 2019-08-29 Thinkcx Technologies, Inc. System and method for measuring and predicting user behavior indicating satisfaction and churn probability
CN110400169A (zh) * 2019-07-02 2019-11-01 阿里巴巴集团控股有限公司 一种信息推送方法、装置及设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100257019A1 (en) * 2009-04-02 2010-10-07 Microsoft Corporation Associating user-defined descriptions with objects
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置
CN106875066A (zh) * 2017-02-28 2017-06-20 百度在线网络技术(北京)有限公司 用车出行行为的预测方法、装置、服务器以及存储介质
CN107993085A (zh) * 2017-10-19 2018-05-04 阿里巴巴集团控股有限公司 模型训练方法、基于模型的用户行为预测方法及装置
CN108268617A (zh) * 2018-01-05 2018-07-10 阿里巴巴集团控股有限公司 用户意图确定方法及装置
US20190266622A1 (en) * 2018-02-27 2019-08-29 Thinkcx Technologies, Inc. System and method for measuring and predicting user behavior indicating satisfaction and churn probability
CN109146280A (zh) * 2018-08-14 2019-01-04 北京三快在线科技有限公司 一种推送信息的方法、装置及系统
CN109543190A (zh) * 2018-11-29 2019-03-29 北京羽扇智信息科技有限公司 一种意图识别方法、装置、设备及存储介质
CN110084630A (zh) * 2019-03-05 2019-08-02 浙江工业大学之江学院 基于梯度提升决策树的用户旅游出行意向及类型预测方法
CN110400169A (zh) * 2019-07-02 2019-11-01 阿里巴巴集团控股有限公司 一种信息推送方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙亮;于雷;黄文卿;王凯;: "改进加权D-S证据理论在目标意图预测中的应用" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966193A (zh) * 2021-03-05 2021-06-15 北京百度网讯科技有限公司 出行意图推断方法、模型训练方法、相关装置及电子设备
CN112966193B (zh) * 2021-03-05 2023-07-25 北京百度网讯科技有限公司 出行意图推断方法、模型训练方法、相关装置及电子设备
CN113946757A (zh) * 2021-12-21 2022-01-18 深圳市活力天汇科技股份有限公司 一种识别用户出行目的的方法、装置及可读存储介质

Also Published As

Publication number Publication date
CN110990714B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
JP6575335B2 (ja) ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム
CN107798557B (zh) 电子装置、基于lbs数据的服务场所推荐方法及存储介质
JP2016177764A (ja) 施設推定方法、デバイス及びプログラム
JP6725718B2 (ja) 位置基盤情報探索方法およびコンピュータ装置
CN106537384A (zh) 使用指示用户位置的数据的逆向ip数据库
JP5221630B2 (ja) サーバ、情報管理方法、情報管理プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
KR20190016481A (ko) 클러스터링 기술을 사용하여 무선 네트워크 액세스 포인트 모델 생성
CN111159563B (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN111949890A (zh) 基于医学领域的数据推荐方法、设备、服务器及存储介质
CN111954175B (zh) 一种兴趣点到访判别方法和相关装置
US9158790B2 (en) Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
JP5034279B2 (ja) 属性推定プログラムおよび属性情報提供システム
JP2018508885A (ja) 情報プッシュ方法及び装置
CN110990714B (zh) 一种用户行为意图预测方法和装置
CN116108150A (zh) 一种智能问答方法、装置、系统及电子设备
CN110674208B (zh) 用于确定用户的职住地信息的方法和装置
CN104615620A (zh) 地图搜索类型识别方法及装置、地图搜索方法及系统
CN111831686A (zh) 排序模型的优化方法、装置、系统、电子设备及存储介质
KR101233902B1 (ko) 서버, 사전 생성 방법, 및 사전 생성 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체
CN112559876A (zh) 地图搜索结果的展现方法、装置、设备及存储介质
CN111698332A (zh) 业务对象的分配方法、装置、设备及存储介质
KR20200114379A (ko) 특허 기반 사회관계망 제공 시스템 및 방법
CN111263421A (zh) 无线网络的匹配方法、装置、电子设备及存储介质
CN110245231A (zh) 一种针对乱码的训练样本特征提取方法、装置及设备
CN110245146B (zh) 一种用户识别的方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant