CN110659920B - 一种业务对象的推荐方法和装置 - Google Patents

一种业务对象的推荐方法和装置 Download PDF

Info

Publication number
CN110659920B
CN110659920B CN201810690060.9A CN201810690060A CN110659920B CN 110659920 B CN110659920 B CN 110659920B CN 201810690060 A CN201810690060 A CN 201810690060A CN 110659920 B CN110659920 B CN 110659920B
Authority
CN
China
Prior art keywords
data
destination
user
characteristic data
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810690060.9A
Other languages
English (en)
Other versions
CN110659920A (zh
Inventor
张精瑞
姜志
孙凯
陈祖龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810690060.9A priority Critical patent/CN110659920B/zh
Publication of CN110659920A publication Critical patent/CN110659920A/zh
Application granted granted Critical
Publication of CN110659920B publication Critical patent/CN110659920B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种业务对象的推荐方法和装置,所述方法包括:获取用户历史日志数据、用户数据和目的地数据;从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据;采用所述训练特征数据训练预设偏好预估模型;根据所述训练后的偏好预估模型推荐业务对象。应用本申请实施例,对于采集的数据进行处理得到有效的训练特征数据对模型进行训练,提高了模型的性能,从而提高了数据推荐的准确率。

Description

一种业务对象的推荐方法和装置
技术领域
本申请涉及数据处理技术领域,特别是涉及一种业务对象的推荐方法和一种业务对象的推荐装置。
背景技术
近些年,随着电子商务的迅猛发展,电商广告也同时发展起来,由于电商广告是电商平台的主要营收手段,故电商广告的准确推荐非常重要。
以旅游产品的电商广告为例。如果在为用户推荐旅游产品的广告时,如果将旅行目的地五花八门的度假产品一次性展现给用户,不仅很难命中用户的浏览期望和购买需求,在体验上也很可能会产生负向效果。因而如何在稀疏的用户行为下准确描绘用户的需求,很大程度上决定了推荐任务的性能上限。这其中,用户对目的地的偏好度是一个预测用户需求至关重要的特征。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种业务对象的推荐方法和相应的一种业务对象的推荐装置。
为了解决上述问题,本申请公开了一种业务对象的推荐方法,包括:
获取用户历史日志数据、用户数据和目的地数据;
从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据;
采用所述训练特征数据训练预设偏好预估模型;
根据所述训练后的偏好预估模型推荐业务对象。
优选地,所述从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据,包括:
从所述用户数据中获取用户标签特征数据;
从所述用户历史日志数据中获取用户针对目的地的行为数据;
从所述目的地数据中获取目的地特征数据;
将所述用户标签特征数据、目的地特征数据和行为数据作为训练特征数据。
优选地,所述从所述目的地数据中获取目的地特征数据,包括:
从所述目的地数据中提取目的地地理位置;
根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据;
分别获取所述聚合目的地数据中目的地特征数据;所述目的地特征数据包括目的地统计类特征数据和目的地标签类特征数据。
优选地,所述根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据,包括:
按照预设映射数据库确定所述目的地地理位置对应的映射目的地地理位置;
将映射目的地地理位置相同的目的地数据进行聚合,得到聚合目的地数据。
优选地,所述分别获取所述聚合目的地数据中目的地特征数据之后,还包括:
计算各个聚合目的地数据下目的地统计类特征数据的均值;
根据所述均值确定所述聚合目的地数据的主要目的地统计类特征数据。
优选地,所述分别获取所述聚合目的地数据中目的地特征数据之后,还包括:
统计各个聚合目的地数据下目的地标签类特征数据的数量;
根据所述数量确定所述聚合目的地数据的主要目的地标签类特征数据。
优选地,所述偏好预估模型包括Wide模型和Deep模型,所述采用所述训练特征数据训练预设偏好预估模型,包括:
采用用户标签特征数据、目的地标签类特征数据和行为数据训练wide模型;
采用用户标签特征数据、目的地统计类特征数据和目的地标签类特征数据训练deep模型;
合并所述训练后的wide模型和deep模型得到训练后的偏好预估模型。
优选地,在所述采用所述训练特征数据训练预设偏好预估模型之前,还包括:
将所述用户标签特征数据和目的地标签类特征数据映射为向量数据。
优选地,所述根据所述训练后的偏好预估模型推荐业务对象,包括:
构建用户目的地集合;所述用户目的地集合包括目标用户和目标目的地;
获取所述目标用户的目标用户标签特征数据,以及获取所述目标目的地的目标目的地标签类特征数据;
将所述目标用户标签特征数据和目的地标签类特征数据输入训练后的偏好预估模型中,得到目标用户对目标目的地的用户偏好度;
根据所述用户偏好度从所述目标目的地筛选出推荐目的地;
根据所述推荐目的地查找到匹配的业务对象;
为所述目标用户推荐所述业务对象。
优选地,还包括:
获取目标用户的用户历史日志数据;
根据所述用户历史日志数据确定所述目标用户的偏好目的地;
根据所述偏好目的地查找到匹配的业务对象;
为所述目标用户推荐所述业务对象。
优选地,所述业务对象包括旅游产品。
本发明实施例还公开了一种业务对象的推荐装置,包括:
训练数据获取模块,用于获取用户历史日志数据、用户数据和目的地数据;
训练特征数据获取模块,用于从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据
偏好预估模型训练模块,用于采用所述训练特征数据训练预设偏好预估模型;
业务对象推荐模块,用于根据所述训练后的偏好预估模型推荐业务对象。
优选地,所述训练特征数据获取模块包括:
用户标签特征数据获取子模块,用于从所述用户数据中获取用户标签特征数据;
行为数据获取子模块,用于从所述用户历史日志数据中获取用户针对目的地的行为数据;
目的地特征数据获取子模块,用于从所述目的地数据中获取目的地特征数据;
模型训练子模块,用于将所述用户标签特征数据、目的地特征数据和行为数据作为训练特征数据。
优选地,所述目的地特征数据获取子模块,包括:
地理位置提取单元,用于从所述目的地数据中提取目的地地理位置;
目的地数据聚合单元,用于根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据;
目的地特征数据获取单元,用于分别获取所述聚合目的地数据中目的地特征数据;所述目的地特征数据包括目的地统计类特征数据和目的地标签类特征数据。
优选地,所述目的地数据聚合单元,包括:
目的地映射子单元,用于按照预设映射数据库确定所述目的地地理位置对应的映射目的地地理位置;
目的地数据聚合子单元,用于将映射目的地地理位置相同的目的地数据进行聚合,得到聚合目的地数据。
优选地,还包括:
均值计算单元,用于计算各个聚合目的地数据下目的地统计类特征数据的均值;
主要连续类数据确定单元,用于根据所述均值确定所述聚合目的地数据的主要目的地统计类特征数据。
优选地,还包括:
数量统计单元,用于统计各个聚合目的地数据下目的地标签类特征数据的数量;
主要标签类数据确定单元,用于根据所述数量确定所述聚合目的地数据的主要目的地标签类特征数据。
优选地,所述偏好预估模型包括Wide模型和Deep模型,所述偏好预估模型训练模块包括:
第一模型训练子模块,用于采用用户标签特征数据、目的地标签类特征数据和行为数据训练wide模型;
第二模型训练子模块,用于采用用户标签特征数据、目的地统计类特征数据和目的地标签类特征数据训练deep模型;
模型合并子模块,用于合并所述训练后的wide模型和deep模型得到训练后的偏好预估模型。
优选地,还包括:
数据转换子模块,用于将所述用户标签特征数据和目的地标签类特征数据映射为向量数据。
优选地,所述业务对象推荐模块包括:
集合构建子模块,用于构建用户目的地集合;所述用户目的地集合包括目标用户和目标目的地;
特征数据获取子模块,用于获取所述目标用户的目标用户标签特征数据,以及获取所述目标目的地的目标目的地标签类特征数据;
用户偏好度得到子模块,用于将所述目标用户标签特征数据和目的地标签类特征数据输入训练后的偏好预估模型中,得到目标用户对目标目的地的用户偏好度;
推荐目的地筛选子模块,用于根据所述用户偏好度从所述目标目的地筛选出推荐目的地;
业务对象匹配子模块,用于根据所述推荐目的地查找到匹配的业务对象;
业务对象推荐子模块,用于为所述目标用户推荐所述业务对象。
优选地,还包括:
目标历史日志数据获取模块,用于获取目标用户的用户历史日志数据;
偏好目的地确定模块,用于根据所述用户历史日志数据确定所述目标用户的偏好目的地;
业务对象匹配模块,用于根据所述偏好目的地查找到匹配的业务对象;
业务对象推荐模块,用于为所述目标用户推荐所述业务对象。
本申请还公开了一种装置,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如上述的方法。
本申请还公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如上述的方法。
本申请实施例包括以下优点:
本申请实施例中,采集用户历史日志数据、用户数据和目的地数据,并从中提取出有效的训练特征数据训练偏好预估模型,随后可以基于训练好的偏好预估模型为用户推荐业务对象。应用本申请实施例,对于采集的数据进行处理得到有效的训练特征数据对模型进行训练,提高了模型的性能,从而提高了数据推荐的准确率。
附图说明
图1是本申请的一种业务对象的推荐方法实施例1的步骤流程图;
图2是本申请的一种业务对象的推荐方法实施例2的步骤流程图;
图3是本申请的一种业务对象的推荐架构示意图;
图4是本申请的一种业务对象的推荐装置实施例的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
用户对目的地的偏好度,在旅游推荐场景中是一个有效先验知识,可以对候选集进行更好的截断和筛选。在偏本地服务的当地玩乐等短途和本地场景中,用户的LBS(Location Based Services,位置服务)信息可以有效地描绘目的地偏好,以用户地理位置为中心,可以对需求在距离上做衰减和截断,在此基础上,推荐算法可以更多的去关注场景信息去描绘用户的选品需求。而在度假等大多数产品的推荐场景中,距离维度由于便利的交通网络被压缩,用户选品不再考虑或者很少考虑距离因素,在这个时候,对目的地的偏好度的计算准确性,便显得至关重要。
传统用户目的地长期偏好计算模型中,多采取比较朴素的统计方法。用户对度假产品的浏览、点击、加购和购买行为都赋予一定的权重,在一定的时间段内对所有的用户行为进行加权,然后在目的地维度进行聚合,可以简单快速的得到一个分数。这个分数一定程度上可以表征用户对产生过行为的目的地的偏好度,但思想比较朴素,准确性有限。更重要的一个问题是,基于用户历史行为的数据统计,仅产生了用户对目的地的记忆作用,对于用户没有产生过行为的目的地,很难得到一个准确地分数,也就知晓用户对于目的地的偏好度。
针对上述问题,本申请实施例的核心构思之一在于,采集用户历史日志数据、用户数据和目的地数据,并从用户历史日志数据、用户数据和目的地数据中提取出有效数据作为训练特征数据,输入到偏好预估模型进行训练,然后再基于训练好的偏好预估模型来计算用户对于目的地的偏好度,从而更好地为用户推荐。
参照图1,示出了本申请的一种业务对象的推荐方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤101,获取用户历史日志数据、用户数据和目的地数据。
需要说明的是,本申请实施例中的业务对象可以包括不同业务领域的具体事物,比如产品或产品相应的广告等等。为使本领域技术人员更好地理解本申请实施例,在本说明书中,主要采用旅游产品作为业务对象的一种示例进行说明。
在具体实现中,训练本申请实施例的偏好度预估模型,首先需要采集用户历史日志数据、用户数据和目的地数据等数据作为原始的训练数据。当然,在实际中可以采用历史日志数据和目的地数据作为训练数据,也可以在上述训练数据的基础上添加其他数据作为训练数据,本申请实施例对此无需加以限制。
其中,用户历史日志数据包括用户对目的地的行为数据,比如点击/不点击该包含该目的地的旅游产品的行为,用户数据是用于表征用户的特征数据,主要为用户的标签(ID)特征数据,比如用户账号、年龄、性别、职业、消费水平和常住地等等,目的地数据是用于表征旅游产品的特征数据,包括标签类特征数据和统计类特征数据,标签类特征数据为离散数据,比如类目、出发地和目的地等等,统计类特征数据为连续数据,比如产品价格、销量、评价等等。
步骤102,从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据。
在本申请实施例中,对于采集的用户历史日志数据、用户数据和目的地数据等数据,还将进一步从中挖掘出有效的训练特征数据对于偏好预估模型进行训练,从而提高模型的准确率。
步骤103,采用所述训练特征数据训练预设偏好预估模型。
当挖掘出有效的训练特征数据时,采用训练特征数据对于本申请实施例的偏好预估模型进行训练。本申请实施例中的偏好预估模型为Wide&Deep模型,Wide&deep模型是一类用于分类和回归的模型,核心思想是结合Wide模型的记忆能力(memorization)和Deep模型的泛化能力(generalization),在训练过程中同时优化两个模型的参数,从而达到整体模型的预测能力最优。
Wide模型是线性模型,输入特征可以是连续特征,也可以是稀疏的离散特征,离散特征之间进行交叉后可以构成更高维的离散特征。线性模型训练中通过L1正则化,能够很快收敛到有效的特征组合中。Deep模型是DNN模型,每个特征对应一个低维的实数向量,称为特征的embedding。Wide&Deep模型整个模型的输出是线性模型输出与DNN模型输出的叠加。
步骤104,根据所述训练后的偏好预估模型推荐业务对象。
本申请实施例完成对于偏好预估模型的训练后,可以构建目标数据,输入到偏好预估模型进行预测,然后基于预测结果为用户推荐旅游产品。
本申请实施例中,采集用户历史日志数据、用户数据和目的地数据,并从中提取出有效的训练特征数据训练偏好预估模型,随后可以基于训练好的偏好预估模型为用户推荐业务对象。应用本申请实施例,对于采集的数据进行处理得到有效的训练特征数据对模型进行训练,提高了模型的性能,从而提高了数据推荐的准确率。
参照图2,示出了本申请的一种业务对象的推荐方法实施例2的步骤流程图,具体可以包括如下步骤:
步骤201,获取用户历史日志数据、用户数据和目的地数据。
本申请实施例在数据准备方面,主要采集了用户历史日志数据、用户数据和目的地数据,作为原始的模型训练数据,这些数据需要做进一步处理以从中提取到有效数据,从而提高模型训练的准确性。
在用户历史日志数据中,需要进行去重等埋点日志常规清洗。这样能够解决一个产品映射多个目的地问题。因为将不同目的地拆分后,用户一次点击被拆分成不同的点击,然而这些点击并没有有单目的地映射产品的点击目的倾向性强,大量拆分后,这些数据对真实分布产生了干扰。另一方面单产品对多目的地的映射,点击记录中用户的目的地选取意图并不明确。因此在后续的处理中也对这样的记录做了进一步清洗。
步骤202,从所述用户数据中获取用户标签特征数据。
在本申请实施例中,将从用户数据中提取出用户标签特征数据,具体地,用户标签特征数据包括用户账号、年龄、性别、职业、消费水平和常住地等等。
步骤203,从所述用户历史日志数据中获取用户针对目的地的行为数据。
在本申请实施例中,用户历史日志数据中获取到用户针对目的地的行为数据,具体到实际,行为数据是用户对于旅游产品的点击/不点击行为。
步骤204,从所述目的地数据中获取目的地特征数据。
在本申请实施例中,从目的地数据中获取到目的地特征数据,其中,目的地特征数据包括统计类特征数据和标签类特征数据。
在本申请的一种优选实施例中,所述步骤204可以包括如下子步骤:
子步骤S11,从所述目的地数据中提取目的地地理位置。
目的地数据中包括目的地的地理位置。在实际应用中,地理位置相近的目的地具在航旅业务中具有相似的旅行意义,比如,京东、大阪等日本旅游城市,在航旅业务中大多为一条出行路线。故而在本申请实施例中基于地理位置对于目的地数据进行聚合,可以增加每个目的地的数据丰富度。
子步骤S12,根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据。
在本申请的一种优选实施例中,所述子步骤S12可以包括如下子步骤:
子步骤S121,所述根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据,包括:
子步骤S122,按照预设映射数据库确定所述目的地地理位置对应的映射目的地地理位置;
子步骤S123,将映射目的地地理位置相同的目的地数据进行聚合,得到聚合目的地数据。
在具体实现中,丰富航旅业务经验的运营人员可以预先做好目的地的映射数据库,然后可以将目的地输入到映射数据库进行查找,从而确定为相同目的地的目的地数据,并进一步将确定为相同目的地的目的地数据进行聚合,得到聚合目的地数据。这样,在一个目的地下的画像数据将更加丰富。
子步骤S13,分别获取所述聚合目的地数据中目的地特征数据;所述目的地特征数据包括目的地统计类特征数据和目的地标签类特征数据。
本申请实施例进行目的地映射,一方面是减少目的地标签的数量,因为如果目的地粒度太细,将导致模型还是在更多地在关注用户对产品的点击率预估。并且在推荐场景中,由于不同产品在地理位置维度具有一定的相似性,比如京都和大阪大概率在一条旅游线路,对其进行聚合形成一个更高一层的目的地标签日本,用户的数据将变得更加的丰富,并且目的地偏好度计算并不会产生很大损失。
在具体实现中,通过地理位置对产品进行聚合后,目的地的特征选取具有一定的困难。在先的用户在产品粒度的预估问题中,只需要使用产品的画像信息,包括了形如类目、出发地、目的地的标签类特征和销量等大量的统计类连续特征。而将产品根据地理位置进行聚合为更高一层的目的地标签,选取哪些特征来表征目的地的属性,是一个非常困难但又至关重要的问题。
在本申请的一种优选实施例中,针对统计类特征数据选取方式为:
计算各个聚合目的地数据下目的地统计类特征数据的均值;
根据所述均值确定所述聚合目的地数据的主要目的地统计类特征数据。
在实际应用中,计算统计类特征数据的均值,这样对数据有一个大致的定位,最后可以根据均值筛选出具有代表性的数据作为主要特征,用于后续训练偏好度预估模型。除此之外,还可以通过计算该聚合目的地数据的百分占比,来确定数据的分布,并进一步筛选出主要特征。
在本申请的一种优选实施例中,针对标签类特征数据选取方式为:
统计各个聚合目的地数据下目的地标签类特征数据的数量;
根据所述数量确定所述聚合目的地数据的主要目的地标签类特征数据。
对于标签类特征的聚合,因为标签类特征无法像统计类数据有数学上的描述,相比于统计类特征更加困难一些。在这里,标签类特征的数量分布进行了统计,并根据数量选取了头部标签类特征。比如,选取该目的地下产品聚合后的前几名类目,来代表该目的地的最终类目,而其他类目便舍去。
比如聚合目的地为东南亚地区,将东南亚地区下各目的地的类目统计之后,“海岛游”标签是东南亚地区下出现最多的,取其作为该目的地的类目首要标签类特征,同理得次要特征等。
当然,在实施本申请实施例中,也还可以通过其他方式对于聚合后的目的地数据进行处理,从而筛选出有效特征数据用以表征目的地的属性,本申请实施例对此无需加以限制。
步骤205,将所述用户标签特征数据、目的地特征数据和行为数据作为训练特征数据。
在对于原始采集的用户历史日志数据、用户数据和目的地数据进行处理得到用户标签特征数据、目的地特征数据和行为数据后,将这些数据作为用于训练偏好预估模型的训练数据。
步骤206,采用所述训练特征数据训练预设偏好预估模型。
在本申请的一种优选实施例中,所述偏好预估模型包括Wide模型和Deep模型,所述步骤206可以包括如下子步骤:
子步骤S21,采用用户标签特征数据、目的地标签类特征数据和行为数据训练wide模型;
子步骤S22,采用用户标签特征数据、目的地统计类特征数据和目的地标签类特征数据训练deep模型;
子步骤S23,合并所述训练后的wide模型和deep模型得到训练后的偏好预估模型。
本申请实施例的偏好度预估模型,Wide&Deep模型将Wide模型与Deep模型进行联合训练,保证记忆能力与泛化能力的均衡。Wide模型为LR模型逻辑回归(LogisticRegression,LR)模型,需要添加特征变换来保证模型的相关能力。Deep模型为DNN模型,对稀疏以及未知的特征组合做低维嵌入保证模型的泛化能力。训练过程中,采用JointTraining(合练),将相应特征数据输入到Wide模型和Deep模型中,同时训练Wide模型和Deep模型,优化的参数包括两个模型各自的参数。
步骤207,根据所述训练后的偏好预估模型推荐业务对象。
当完成对于偏好预估模型后,可以构建输入数据,输入到偏好预估模型进行用户对于目的地的偏好的打分,并根据打分来确定为用户推荐的旅游产品。
在本申请的一种优选实施例中,所述步骤207可以包括如下子步骤:
子步骤S31,构建用户目的地集合;所述用户目的地集合包括目标用户和目标目的地;
子步骤S32,获取所述目标用户的目标用户标签特征数据,以及获取所述目标目的地的目标目的地标签类特征数据;
子步骤S33,将所述目标用户标签特征数据和目的地标签类特征数据输入训练后的偏好预估模型中,得到目标用户对目标目的地的用户偏好度;
子步骤S34,根据所述用户偏好度从所述目标目的地筛选出推荐目的地;
子步骤S35,根据所述推荐目的地查找到匹配的业务对象;
子步骤S36,为所述目标用户推荐所述业务对象。
在为用户推荐旅游产品时,构建用户目的地集合,也可以称为用户目的地对,在用户目的地集合中包括通过将用户与目的地进行笛卡儿积得到预测集索引,将用户目的地集合中相关的特征数据输入到训练好的偏好预估模型,得到用户对于该目的地的偏好度的打分。随后,可以根据该打分确定是否为用户推荐包括该目的地的旅游产品。
在实际中由于用户量巨大,用户并非全是活跃用户,且目的地粒度依旧较细,需要预测的数据实在是太多,在这种情况下,选取了头部用户和热门目的地构建用户目的地集合。其中,头部用户可以是指经常登录的用户或者VIP用户,热门目的地则可以是指较多人前往或者注目的旅游地点。
本申请实施例中,采集训练数据,并从中提取出有效的训练特征数据训练偏好预估模型,随后可以构建包括目标用户和目标目的地的用户目的地集合,根据训练好的偏好预估模型确定目标用户对于目标目的地的偏好度,从而根据目标用户对于目标目的地的偏好度为用户推荐业务对象。应用本申请实施例,对于采集的数据进行处理得到有效的训练特征数据对模型进行训练,提高了模型的性能,从而提高了为目标用户进行数据推荐的准确率。即使目标用户以前没有关于目标目的地的访问记录,也可以基于偏好预估模型确定目标用户对于目标目的地的偏好度来为用户推荐。
参照图3,所示为本申请的一种业务对象的推荐架构示意图,本申请实现用户目的地偏好预估的过程包括:
1、获取用户的用户历史日志数据(Behavior Log);
2、从所述用户历史日志数据中提取行为数据(User Behavior);
3、获取用户数据(User Profile);
4、获取目的地数据(Dest Profile);其中目的地数据为从旅游产品(ItemProfile)获取;
5、从用户历史日志数据、用户数据和目的地数据中提取出有效的训练特征数据,具体包括有用户(User_id)、目的地(Dest_id)、行为数据(action)、用户的离散特征数据(user_cat)、目的地的离散特征数据(dest_cat)、目的地的连续特征数据(Dest_con)
6、将训练特征数据输入特征生成器(feature generator)进行特征转换;因为在线机器学习中,将需要将原始训练特征数据生成为机器学习模型可以接受的标准格式的可用特征。
7、将进行特征转换的训练特征数据输入到Wide&Deep模型进行训练(Train);
8、构建用户目的地集合(Predict_set),并将用户目的地集合输入训练后的Wide&Deep模型,得到针对用户的目的地的打分,最后可以根据打分来推荐具有相应目的地的旅游产品。
本申请实施例通过Wide&Deep模型,将用户的标签类特征与目的地标签类特征在Wide模型进行记忆学习,并且将其向量化后的特征在Deep模型中进行进行泛化学习,有效解决线性模型的泛化能力较差的问题,在离线训练中,Wide&Deep模型训练的CTR(Click-Through-Rate,点击率)预估模型无论在训练数据还是在测试数据中准确率均高于传统模型,更远远比传统统计算法的性能优秀。本申请实施例的偏好预估模型具有更强的拟合和泛化能力。
在本申请的一种优选实施例中,所述方法还可以包括如下步骤:
获取目标用户的用户历史日志数据;
根据所述用户历史日志数据确定所述目标用户的偏好目的地;
根据所述偏好目的地查找到匹配的业务对象;
为所述目标用户推荐所述业务对象。
在推荐旅游产品时,用户本身的行为数据也是需要考虑的,可以获取当前用户的用户历史日志数据,并从中提取出行为数据,如果用户针对某个目的地存在对应的行为数据,则可以无需使用预设偏好预估模型对用户的偏好目的地进行预测,而是可以直接基于用户的行为数据确定用户对于目的地的偏好,并基于此对于用户推荐相应的旅游产品。采用用户的历史日志数据作为基础召回,提升点击率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图4,示出了本申请的一种业务对象的推荐装置实施例的结构框图,具体可以包括如下模块:
训练数据获取模块301,用于获取用户历史日志数据、用户数据和目的地数据;
训练特征数据获取模块302,用于从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据;
偏好预估模型训练模块303,用于采用所述训练特征数据训练预设偏好预估模型;
业务对象推荐模块304,用于根据所述训练后的偏好预估模型推荐业务对象。
在本申请的一种优选实施例中,所述训练特征数据获取模块302可以包括:
用户标签特征数据获取子模块,用于从所述用户数据中获取用户标签特征数据;
行为数据获取子模块,用于从所述用户历史日志数据中获取用户针对目的地的行为数据;
目的地特征数据获取子模块,用于从所述目的地数据中获取目的地特征数据;
模型训练子模块,用于将所述用户标签特征数据、目的地特征数据和行为数据作为训练特征数据。
在本申请的一种优选实施例中,所述目的地特征数据获取子模块,可以包括:
地理位置提取单元,用于从所述目的地数据中提取目的地地理位置;
目的地数据聚合单元,用于根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据;
目的地特征数据获取单元,用于分别获取所述聚合目的地数据中目的地特征数据;所述目的地特征数据包括目的地统计类特征数据和目的地标签类特征数据。
在本申请的一种优选实施例中,所述目的地数据聚合单元,可以包括:
目的地映射子单元,用于按照预设映射数据库确定所述目的地地理位置对应的映射目的地地理位置;
目的地数据聚合子单元,用于将映射目的地地理位置相同的目的地数据进行聚合,得到聚合目的地数据。
在本申请的一种优选实施例中,所述装置还可以包括:
均值计算单元,用于计算各个聚合目的地数据下目的地统计类特征数据的均值;
主要连续类数据确定单元,用于根据所述均值确定所述聚合目的地数据的主要目的地统计类特征数据。
在本申请的一种优选实施例中,所述装置还可以包括:
数量统计单元,用于统计各个聚合目的地数据下目的地标签类特征数据的数量;
主要标签类数据确定单元,用于根据所述数量确定所述聚合目的地数据的主要目的地标签类特征数据。
在本申请的一种优选实施例中,所述偏好预估模型包括Wide模型和Deep模型,所述偏好预估模型训练模块303可以包括:
第一模型训练子模块,用于采用用户标签特征数据、目的地标签类特征数据和行为数据训练wide模型;
第二模型训练子模块,用于采用用户标签特征数据、目的地统计类特征数据和目的地标签类特征数据训练deep模型;
模型合并子模块,用于合并所述训练后的wide模型和deep模型得到训练后的偏好预估模型。
在本申请的一种优选实施例中,还可以包括:
数据转换子模块,用于将所述用户标签特征数据和目的地标签类特征数据映射为向量数据。
在本申请的一种优选实施例中,所述业务对象推荐模块304包括:
集合构建子模块,用于构建用户目的地集合;所述用户目的地集合包括目标用户和目标目的地;
特征数据获取子模块,用于获取所述目标用户的目标用户标签特征数据,以及获取所述目标目的地的目标目的地标签类特征数据;
用户偏好度得到子模块,用于将所述目标用户标签特征数据和目的地标签类特征数据输入训练后的偏好预估模型中,得到目标用户对目标目的地的用户偏好度;
推荐目的地筛选子模块,用于根据所述用户偏好度从所述目标目的地筛选出推荐目的地;
业务对象匹配子模块,用于根据所述推荐目的地查找到匹配的业务对象;
业务对象推荐子模块,用于为所述目标用户推荐所述业务对象。
在本申请的一种优选实施例中,所述装置还可以包括:
目标历史日志数据获取模块,用于获取目标用户的用户历史日志数据;
偏好目的地确定模块,用于根据所述用户历史日志数据确定所述目标用户的偏好目的地;
业务对象匹配模块,用于根据所述偏好目的地查找到匹配的业务对象;
业务对象推荐模块,用于为所述目标用户推荐所述业务对象。
在本申请的一种优选实施例中,所述业务对象包括旅游产品。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例还提供了一种装置,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行本申请实施例所述的方法。
本申请实施例还提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行本申请实施例所述的方法。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitory media),如调制的数据信号和载波。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种业务对象的推荐方法和相应的一种业务对象的推荐装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种业务对象的推荐方法,其特征在于,包括:
获取用户历史日志数据、用户数据和目的地数据;
从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据;
采用所述训练特征数据训练预设偏好预估模型;
根据所述训练后的偏好预估模型推荐业务对象;
其中,所述从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据,包括:
从所述用户数据中获取用户标签特征数据;
从所述用户历史日志数据中获取用户针对目的地的行为数据;其中,所述行为数据为所述用户的点击或不点击行为;
从所述目的地数据中获取目的地特征数据;
将所述用户标签特征数据、目的地特征数据和行为数据作为训练特征数据。
2.根据权利要求1所述的方法,其特征在于,所述从所述目的地数据中获取目的地特征数据,包括:
从所述目的地数据中提取目的地地理位置;
根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据;
分别获取所述聚合目的地数据中目的地特征数据;所述目的地特征数据包括目的地统计类特征数据和目的地标签类特征数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目的地地理位置对所述目的地数据进行聚合,得到聚合目的地数据,包括:
按照预设映射数据库确定所述目的地地理位置对应的映射目的地地理位置;
将映射目的地地理位置相同的目的地数据进行聚合,得到聚合目的地数据。
4.根据权利要求2所述的方法,其特征在于,所述分别获取所述聚合目的地数据中目的地特征数据之后,还包括:
计算各个聚合目的地数据下目的地统计类特征数据的均值;
根据所述均值确定所述聚合目的地数据的主要目的地统计类特征数据。
5.根据权利要求2所述的方法,其特征在于,所述分别获取所述聚合目的地数据中目的地特征数据之后,还包括:
统计各个聚合目的地数据下目的地标签类特征数据的数量;
根据所述数量确定所述聚合目的地数据的主要目的地标签类特征数据。
6.根据权利要求1或2或3或4或5所述的方法,其特征在于,所述偏好预估模型包括Wide模型和Deep模型,所述采用所述训练特征数据训练预设偏好预估模型,包括:
采用用户标签特征数据、目的地标签类特征数据和行为数据训练wide模型;
采用用户标签特征数据、目的地统计类特征数据和目的地标签类特征数据训练deep模型;
合并所述训练后的wide模型和deep模型得到训练后的偏好预估模型。
7.根据权利要求6所述的方法,其特征在于,在所述采用所述训练特征数据训练预设偏好预估模型之前,还包括:
将所述用户标签特征数据和目的地标签类特征数据映射为向量数据。
8.根据权利要求1所述的方法,其特征在于,所述根据所述训练后的偏好预估模型推荐业务对象,包括:
构建用户目的地集合;所述用户目的地集合包括目标用户和目标目的地;
获取所述目标用户的目标用户标签特征数据,以及获取所述目标目的地的目标目的地标签类特征数据;
将所述目标用户标签特征数据和目的地标签类特征数据输入训练后的偏好预估模型中,得到目标用户对目标目的地的用户偏好度;
根据所述用户偏好度从所述目标目的地筛选出推荐目的地;
根据所述推荐目的地查找到匹配的业务对象;
为所述目标用户推荐所述业务对象。
9.根据权利要求1所述的方法,其特征在于,还包括:
获取目标用户的用户历史日志数据;
根据所述用户历史日志数据确定所述目标用户的偏好目的地;
根据所述偏好目的地查找到匹配的业务对象;
为所述目标用户推荐所述业务对象。
10.根据权利要求1所述的方法,其特征在于,所述业务对象包括旅游产品。
11.一种业务对象的推荐装置,其特征在于,包括:
训练数据获取模块,用于获取用户历史日志数据、用户数据和目的地数据;
训练特征数据获取模块,用于从所述用户历史日志数据、用户数据和目的地数据中获取训练特征数据
偏好预估模型训练模块,用于采用所述训练特征数据训练预设偏好预估模型;
业务对象推荐模块,用于根据所述训练后的偏好预估模型推荐业务对象;
其中,所述训练特征数据获取模块,包括:
用户标签特征数据获取子模块,用于从所述用户数据中获取用户标签特征数据;
行为数据获取子模块,用于从所述用户历史日志数据中获取用户针对目的地的行为数据;其中,所述行为数据为所述用户的点击或不点击行为;
目的地特征数据获取子模块,用于从所述目的地数据中获取目的地特征数据;
模型训练子模块,用于将所述用户标签特征数据、目的地特征数据和行为数据作为训练特征数据。
CN201810690060.9A 2018-06-28 2018-06-28 一种业务对象的推荐方法和装置 Active CN110659920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810690060.9A CN110659920B (zh) 2018-06-28 2018-06-28 一种业务对象的推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810690060.9A CN110659920B (zh) 2018-06-28 2018-06-28 一种业务对象的推荐方法和装置

Publications (2)

Publication Number Publication Date
CN110659920A CN110659920A (zh) 2020-01-07
CN110659920B true CN110659920B (zh) 2023-04-18

Family

ID=69026495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810690060.9A Active CN110659920B (zh) 2018-06-28 2018-06-28 一种业务对象的推荐方法和装置

Country Status (1)

Country Link
CN (1) CN110659920B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312542B (zh) * 2020-02-26 2023-12-22 阿里巴巴集团控股有限公司 一种对象推荐模型的处理方法、装置以及电子设备
CN113592198B (zh) * 2021-08-24 2023-09-26 腾讯科技(深圳)有限公司 需求参考信息的确定方法、服务器及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912702A (zh) * 2016-04-26 2016-08-31 南京酷派软件技术有限公司 位置推荐方法及系统
CN107885796A (zh) * 2017-10-27 2018-04-06 阿里巴巴集团控股有限公司 信息推荐方法及装置、设备
CN107992530A (zh) * 2017-11-14 2018-05-04 北京三快在线科技有限公司 信息推荐方法及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9303997B2 (en) * 2013-03-15 2016-04-05 Apple Inc. Prediction engine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912702A (zh) * 2016-04-26 2016-08-31 南京酷派软件技术有限公司 位置推荐方法及系统
CN107885796A (zh) * 2017-10-27 2018-04-06 阿里巴巴集团控股有限公司 信息推荐方法及装置、设备
CN107992530A (zh) * 2017-11-14 2018-05-04 北京三快在线科技有限公司 信息推荐方法及电子设备

Also Published As

Publication number Publication date
CN110659920A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
Miah et al. A big data analytics method for tourist behaviour analysis
CN106570722B (zh) 一种智能推荐系统及智能推荐方法
KR101871747B1 (ko) 유사성향 기반 사용자-관광상품 추천 방법 및 시스템
JP5248915B2 (ja) Gps追跡及び周知な近傍目的地からのユーザの行動趣向の学習
CN110413877A (zh) 一种资源推荐方法、装置及电子设备
JP2019508766A (ja) 地理的エリアのヒートマップを生成するシステム、方法、およびデバイス
US20150363700A1 (en) Discovering Functional Groups of an Area
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
Pan et al. Monitoring and forecasting tourist activities with big data
CN112131480B (zh) 基于多层异质属性网络表征学习的个性化商品推荐方法及系统
KR102340463B1 (ko) 샘플 가중치 설정방법 및 장치, 전자 기기
CN106776928B (zh) 基于内存计算框架、融合社交及时空数据的位置推荐方法
Wang Personalized recommendation framework design for online tourism: know you better than yourself
Pahari et al. An online review-based hotel selection process using intuitionistic fuzzy TOPSIS method
Miah et al. A location analytics method for the utilisation of geotagged photos in travel marketing decision-making
CN110659920B (zh) 一种业务对象的推荐方法和装置
Barua et al. Modeling household online shopping demand in the US: a machine learning approach and comparative investigation between 2009 and 2017
Lieske et al. Assessing geographical representativeness of crowdsourced urban mobility data: An empirical investigation of Australian bicycling
CN117435819A (zh) 时空动态感知的兴趣点推荐方法、系统和存储介质
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
Zhou et al. Learning with self-attention for rental market spatial dynamics in the Atlanta metropolitan area
CN114595323B (zh) 画像构建、推荐、模型训练方法、装置、设备及存储介质
Xu et al. [Retracted] Tourist Attraction Recommendation Method and Data Management Based on Big Data Analysis
CN111369315A (zh) 资源对象推荐方法及装置,数据预测模型训练方法及装置
CN113111251A (zh) 项目推荐方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant