CN109816134B - 收货地址预测方法、装置以及存储介质 - Google Patents

收货地址预测方法、装置以及存储介质 Download PDF

Info

Publication number
CN109816134B
CN109816134B CN201711173110.8A CN201711173110A CN109816134B CN 109816134 B CN109816134 B CN 109816134B CN 201711173110 A CN201711173110 A CN 201711173110A CN 109816134 B CN109816134 B CN 109816134B
Authority
CN
China
Prior art keywords
address
information
user
determining
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711173110.8A
Other languages
English (en)
Other versions
CN109816134A (zh
Inventor
朱德伟
李树前
李伟奇
稂顾
孙健生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201711173110.8A priority Critical patent/CN109816134B/zh
Publication of CN109816134A publication Critical patent/CN109816134A/zh
Application granted granted Critical
Publication of CN109816134B publication Critical patent/CN109816134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种收货地址预测方法、装置以及存储介质,涉及电子商务技术领域,其中的方法包括:根据用户画像数据、商品购买历史信息以及收货地址所属的地址类别构造地址信息训练样本;利用地址信息训练样本进行训练,获得收货地址预测模型;接收到用户订单,基于收货地址预测模型预测与用户订单对应的收货地址信息,并推荐给用户。本发明的收货地址预测方法、装置以及存储介质,能够使用户获得更加满足需求的收货地址,减少用户下单时的输入量和工作量,并能满足用户的个性化需求,提高了用户体验;并且,基于GBDT算法训练模型,能够有效提升模型对地址类别的预测准确率,提升处理效率。

Description

收货地址预测方法、装置以及存储介质
技术领域
本发明涉及电子商务技术领域,尤其涉及一种收货地址预测方法、装置以及存储介质。
背景技术
近年来,互联网的发展便利了人们的生活。随着科技的发展和人们生活水平的提高,电子商务得到了迅速发展,越来越多的人们都习惯在网上来购买需要的商品,便利了人们的生活。随着智能手机的普及,使用手机购物的用户越来越多。通过智能手机中安装的电商App进行浏览商品、加入购物车、下单、支付、填写收货地址等步骤,如果用户设置有多个收货地址,则可以优先推荐或者设置默认的收货地址。目前,通常是通过GPS或者IP定位得到用户的当前位置,然后将用户的当前位置和用户设置的多个收货地址进行匹配,选择距离用户的当前位置最近的收货地址进行推荐。但是,当前的收货地址推荐方法容易对用户使用造成不便,例如,如果用户在公司下单购买生鲜,通过GPS定位用户的当前位置为公司,则推荐给用户的收货地址是公司地址,但由于白天要上班,对于生鲜等货物,用户通常需要在家里进行收货,用户需要选择家庭地址替换推荐的收货地址。
发明内容
有鉴于此,本发明要解决的一个技术问题是提供一种收货地址预测方法、装置以及存储介质。
根据本发明的一个方面,提供一种收货地址预测方法,包括:获取用户画像数据以及用户的商品购买历史信息;确定用户的收货地址信息所属的地址类别;根据所述用户画像数据、所述商品购买历史信息以及收货地址所属的地址类别构造地址信息训练样本;利用所述地址信息训练样本进行训练,获得收货地址预测模型;接收到用户订单,基于所述收货地址预测模型预测与所述用户订单对应的收货地址信息,并推荐给用户。
可选地,所述利用所述地址信息训练样本进行训练、获得收货地址预测模型包括:采用迭代决策树GBDT算法对所述地址信息训练样本数据进行训练,获得由多个决策树组成的所述收货地址预测模型。
可选地,所述基于所述收货地址预测模型预测与所述用户订单对应的收货地址信息包括:获取与所述用户订单相对应的商品购买信息,将所述商品购买信息输入所述收货地址预测模型;其中,所述商品购买信息包括:用户画像信息、商品信息、收货时间;将每个决策树基于所述商品购买信息的计算结果进行累加处理,确定地址类别;从用户注册的收货地址信息中选取与此地址类别相匹配的收货地址信息作为与所述用户订单对应的收货地址信息。
可选地,所述获取用户画像数据以及用户的商品购买历史信息包括:获取用户注册信息,从所述用户注册信息中提取用户画像数据,其中,所述用户画像数据包括:年龄、性别、注册地址;获取用户的商品购买信息,基于所述商品购买信息生成所述商品购买历史信息,其中,所述商品购买历史信息包括:商品信息、收货时间和实际收货地址。
可选地,所述确定用户的收货地址信息所属的地址类别包括:对所述收货地址信息进行语义识别处理,确定所述收货地址信息的初始分类以及初始分值;获取用户的网络访问历史信息以及与收货地址相关的标注信息,基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值;当所述收货地址信息的分类分值达到预设的分值阈值时,则确定所述收货地址信息所属的地址类别为所述初始分类,其中,所述分类分值为所述初始分值与所述加分值之和。
可选地,所述对所述收货地址信息进行语义识别处理、确定所述收货地址信息的初始分类以及初始分值包括:对所述收货地址信息进行分词处理,获取所述收货地址的分词集合;判断所述分词集合中的分词是否符合预设的地址类别判断规则,如果是,则确定所述收货地址信息的初始分类以及初始分值。
可选地,所述基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值包括:基于所述网络访问历史信息提取用户的网络访问特征;判断用户的网络访问特征是否与所述初始分类对应的网络访问判决规则相匹配,如果是,确定与所述初始分类对应的加分值;其中,所述网络访问特征包括:上网时间、上网频率、访问目的地址。
可选地,所述基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值包括:基于所述收货地址确定判决地理区域,确定位于所述判决地理区域内并被标注为所述初始分类的其它收货地址的数量;判断所述数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
可选地,所述基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值包括:基于所述商品购买历史信息确定用户购买与所述初始分类相匹配的商品数量;判断商品数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
可选地,所述地址类别包括:家庭地址类别、公司地址类别、学校地址类别。
根据本发明的另一方面,提供一种收货地址预测装置,包括:信息获取模块,用于获取用户画像数据以及用户的商品购买历史信息;地址类别识别模块,用于确定用户的收货地址信息所属的地址类别;训练样本构造模块,用于根据所述用户画像数据、所述商品购买历史信息以及收货地址所属的地址类别构造地址信息训练样本;预测模型生成模块,用于利用所述地址信息训练样本进行训练,获得收货地址预测模型;地址预测模块,用于接收用户订单,基于所述收货地址预测模型预测与所述用户订单对应的收货地址信息,并推荐给用户。
可选地,所述预测模型生成模块,用于采用迭代决策树GBDT算法对所述地址信息训练样本数据进行训练,获得由多个决策树组成的所述收货地址预测模型。
可选地,所述地址预测模块,用于获取与所述用户订单相对应的商品购买信息,将所述商品购买信息输入所述收货地址预测模型;将每个决策树基于所述商品购买信息的计算结果进行累加处理,确定地址类别;从用户注册的收货地址信息中选取与此地址类别相匹配的收货地址信息作为与所述用户订单对应的收货地址信息;其中,所述商品购买信息包括:用户画像信息、商品信息、收货时间。
可选地,所述信息获取模块,用于获取用户注册信息,从所述用户注册信息中提取用户画像数据,其中,所述用户画像数据包括:年龄、性别、注册地址;获取用户的商品购买信息,基于所述商品购买信息生成所述商品购买历史信息,其中,所述商品购买历史信息包括:商品信息、收货时间和实际收货地址。
可选地,所述地址类别识别模块,包括:初始分类单元,用于对所述收货地址信息进行语义识别处理,确定所述收货地址信息的初始分类以及初始分值;加分确定单元,用于获取用户的网络访问历史信息以及与收货地址相关的标注信息,基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值;类别确定单元,用于当所述收货地址信息的分类分值达到预设的分值阈值时,则确定所述收货地址信息所属的地址类别为所述初始分类,其中,所述分类分值为所述初始分值与所述加分值之和。
可选地,所述初始分类单元,用于对所述收货地址信息进行分词处理,获取所述收货地址的分词集合;判断所述分词集合中的分词是否符合预设的地址类别判断规则,如果是,则确定所述收货地址信息的初始分类以及初始分值。
可选地,所述加分确定单元,用于基于所述网络访问历史信息提取用户的网络访问特征;判断用户的网络访问特征是否与所述初始分类对应的网络访问判决规则相匹配,如果是,确定与所述初始分类对应的加分值;其中,所述网络访问特征包括:上网时间、上网频率、访问目的地址。
可选地,所述加分确定单元,用于基于所述收货地址确定判决地理区域,确定位于所述判决地理区域内并被标注为所述初始分类的其它收货地址的数量;判断所述数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
可选地,所述加分确定单元,用于基于所述商品购买历史信息确定用户购买与所述初始分类相匹配的商品数量;判断商品数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
根据本发明的又一方面,提供一种收货地址预测装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的收货地址预测方法。
根据本发明的再一方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如上所述的收货地址预测方法。
本发明的收货地址预测方法、装置以及存储介质,根据用户画像数据、商品购买历史信息以及收货地址所属的地址类别构造训练样本进行训练,获得收货地址预测模型,基于收货地址预测模型预测与用户订单对应的收货地址信息并推荐给用户,能够使用户获得更加满足需求的收货地址,减少用户下单时的输入量和工作量,并能满足用户的个性化需求,提高了用户体验;并且,基于GBDT算法训练模型,能够有效提升模型对地址类别的预测准确率,提升处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明的收货地址预测方法的一个实施例的流程示意图;
图2为根据本发明的收货地址预测方法的一个实施例的进行地址识别的流程示意图;
图3为根据本发明的收货地址预测装置的一个实施例的模块示意图;
图4为根据本发明的收货地址预测装置的一个实施例中的地址类别识别模块的模块示意图;
图5为根据本发明的收货地址预测装置的另一个实施例的模块示意图。
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下面结合各个图和实施例对本发明的技术方案进行多方面的描述。
图1为根据本发明的收货地址预测方法的一个实施例的流程示意图,如图1所示:
步骤101,获取用户画像数据以及用户的商品购买历史信息。
可以通过多种方法获取用户画像数据、用户的商品购买历史信息。例如,获取用户注册信息,从用户注册信息中提取用户画像数据,用户画像数据包括:年龄、性别、注册地址等。获取用户的商品购买信息,基于商品购买信息生成商品购买历史信息,商品购买历史信息包括:商品信息、收货时间和实际收货地址等,商品信息包括:商品名称、数量、类型、ID等。
步骤102,确定用户的收货地址信息所属的地址类别。
可以对用户在注册信息中设置的收货地址信息以及在历史交易中的实际收货地址信息进行识别,确定所属的地址类别,地址类别包括:家庭地址类别、公司地址类别、学校地址类别等。地址类别确定后,可以对收货地址信息标注相应的地址类别标签。
步骤103,根据用户画像数据、商品购买历史信息以及收货地址所属的地址类别构造地址信息训练样本。
步骤104,利用地址信息训练样本进行训练,获得收货地址预测模型。
步骤105,接收到用户订单,基于收货地址预测模型预测与用户订单对应的收货地址信息,并推荐给用户。
在一个实施例中,收货地址预测模型可以有多种。例如,获取用户的年龄、性别、注册地址、购买的商品类型、收货时间、实际收货地址、实际收货地址所属的地址类别等作为特征,建立地址信息训练样本。采用迭代决策树GBDT算法对地址信息训练样本数据进行训练,获得由多个决策树组成的收货地址预测模型,收货地址预测模型为GBDT分类模型。
GBDT(Gradient Boosting Decision Tree)又叫MART(Multiple AdditiveRegression Tree),是一种迭代的决策树算法,采用了Boost思想。决策树作为一种预测模型,是在上一层决策得到的结果的基础上,进行下一层决策,包括决策点、状态结点、结果结点等参数。GBDT算法由多棵决策树组成,所有决策树的结论累加起来做最终答案。GBDT与传统的Boost的区别是,每一次的计算是为了减少上一次的残差,为消除残差,在残差减少的梯度方向上建立一个新的模型。因此在GBDT中,每个新的模型的建立是为了使得之前模型的残差往梯度方向减少。
可以根据收货地址预测模型预测用户订单的收货地址,并进行推荐。获取与用户订单相对应的商品购买信息,商品购买信息包括:用户画像信息、商品信息、收货时间等。将商品购买信息输入收货地址预测模型,即GBDT分类模型,输出收货地址的类别,例如收货地址为公司地址、家庭地址、学校地址等。
获取用户的年龄、性别、注册地址、购买的商品类型、收货时间等作为特征输入模型,将每个决策树基于特征的计算结果进行累加处理,可预测排在第一位的收货地址的地址类别,确定地址类别标签。从用户注册的收货地址信息中选取与此地址类别相匹配的收货地址信息作为与用户订单对应的收货地址信息,并推荐给用户。GBDT分类模型的训练以及基于GBDT分类模型输出地址类别结果可以采用现有技术中的多种方法。
图2为根据本发明的收货地址预测方法的一个实施例的进行地址识别的流程示意图,如图2所示:
步骤201,对收货地址信息进行语义识别处理,确定收货地址信息的初始分类以及初始分值。
例如,对收货地址信息进行分词处理,获取收货地址的分词集合,可以采用多种分词方法。判断分词集合中的分词是否符合预设的地址类别判断规则,如果是,则确定收货地址信息的初始分类以及初始分值。
例如,对收货地址信息进行分词处理,得到的分词集合中的分词包含有“小区”、“xx栋xx单元”等字符。地址类别判断规则中包括家庭地址判断规则,家庭地址判断规则包括:当确定地址信息中具有“小区”、“栋”、“单元”、等关键词时,则确定为家庭地址类别。基于家庭地址判断规则确定收货地址信息的初始分类为家庭地址类别,基于预设的规则确定初始分值为1分。
或者,对收货地址信息进行分词处理,得到的分词集合中的分词包含有“公司”等字符。地址类别判断规则中包括公司地址判断规则,公司地址判断规则包括:当确定地址信息中具有“公司”等关键词时,则确定为公司地址类别。基于公司地址判断规则确定收货地址信息的初始分类为公司地址类别,基于预设的规则确定初始分值为1分。
步骤202,获取用户的网络访问历史信息以及与收货地址相关的标注信息,基于网络访问历史信息、商品购买历史信息以及标注信息确定与初始分类对应的加分值。可以有多种方法确定与初始分类对应的加分值。
在一个实施例中,基于网络访问历史信息提取用户的网络访问特征,判断用户的网络访问特征是否与初始分类对应的网络访问判决规则相匹配,如果是,确定与初始分类对应的加分值,网络访问特征包括:上网时间、上网频率、访问目的地址等。
例如,确定一个用户的收货地址的初始分类为家庭地址类别。获取用户的网络访问历史信息,确定用户浏览购物App的时间数据。与家庭地址分类对应的家庭网络访问判决规则包括:在一个月内,在这个收货地址附近并且在夜间10点到早晨9点的时间段内浏览购物App的天数大于20天。如果用户浏览购物App的时间数据与家庭网络访问判决规则相匹配,则确定此用户与初始分类对应的加分值为1分。
确定一个用户的收货地址的初始分类为公司地址类别。获取用户的网络访问历史信息,确定用户浏览购物App的时间数据。与公司地址分类对应的公司网络访问判决规则包括:在这个收货地址附近,在周一到周五的早晨10点到下午6点之间的时间段内浏览购物App的天数大于4天。如果用户浏览购物App的时间数据与公司网络访问判决规则相匹配,则确定此用户与初始分类对应的加分值为1分。
基于收货地址确定判决地理区域,确定位于判决地理区域内并被标注为初始分类的其它收货地址的数量,判断数量是否大于预设的数量阈值,如果是,则确定与初始分类对应的加分值。
例如,确定一个用户的收货地址的初始分类为公司地址类别,以此收货地址为中心、50米为半径确定判决地理区域。如果有5个位于此判决地理区域内并被其它用户手动标注为公司地址类别的其它收货地址,预设的数量阈值为3个,则确定此用户与初始分类对应的加分值为1分。
确定一个用户的收货地址的初始分类为家庭地址类别。以此收货地址为中心、50米为半径确定判决地理区域。如果有2个位于此判决地理区域内并被其它用户手动标注为家庭地址类别的其它收货地址,小于预设的数量阈值3个,则确定此用户与初始分类对应的加分值为0分,即不加分。
基于商品购买历史信息确定用户购买与初始分类相匹配的商品数量,判断商品数量是否大于预设的数量阈值,如果是,则确定与初始分类对应的加分值。
例如,确定一个用户的收货地址的初始分类为家庭地址类别,并且确定此用户在1个月内购买的与家庭地址类别相匹配的特征商品的数量为10个,大于预设的数量阈值8个,则确定此用户与初始分类对应的加分值为1分。与家庭地址类别相匹配的特征商品可以为水果、米、面、油等。
确定一个用户的收货地址的初始分类为学校地址类别,并且确定此用户在1个月内购买的与学校地址类别相匹配的特征商品的数量为12个,大于预设的数量阈值8个,则确定此用户与初始分类对应的加分值为1分。与学校地址类别相匹配的特征商品可以为笔记本、教科书、学习参考书等。
步骤203,分类分值为初始分值与加分值之和,当收货地址信息的分类分值达到预设的分值阈值时,则确定收货地址信息所属的地址类别为初始分类。
例如,确定一个用户的收货地址的初始分类为学校地址类别,初始分值为1分,确定此用户与初始分类对应的加分值为2分。当分值阈值为2分时,则确定收货地址信息所属的地址类别为初始分类,即学校地址类别。
上述实施例提供的收货地址预测方法,使用户获得更加满足需求的收货地址,满足用户的个性化需求;基于GBDT算法训练模型,能够有效提升模型对地址类别的预测准确率,提升处理效率。
在一个实施例中,如图3所示,本发明提供一种收货地址预测装置30,包括:信息获取模块31、地址类别识别模块32、训练样本构造模块33、预测模型生成模块34和地址预测模块35。信息获取模块31获取用户画像数据以及用户的商品购买历史信息。地址类别识别模块32确定用户的收货地址信息所属的地址类别。
训练样本构造模块33根据用户画像数据、商品购买历史信息以及收货地址所属的地址类别构造地址信息训练样本。预测模型生成模块34利用地址信息训练样本进行训练,获得收货地址预测模型。地址预测模块35接收用户订单,基于收货地址预测模型预测与用户订单对应的收货地址信息,并推荐给用户。
在一个实施例中,信息获取模块31获取用户注册信息,从用户注册信息中提取用户画像数据,用户画像数据包括:年龄、性别、注册地址等。信息获取模块31获取用户的商品购买信息,基于商品购买信息生成商品购买历史信息,商品购买历史信息包括:商品信息、收货时间和实际收货地址等。
预测模型生成模块34采用迭代决策树GBDT算法对地址信息训练样本数据进行训练,获得由多个决策树组成的收货地址预测模型。地址预测模块35获取与用户订单相对应的商品购买信息,将商品购买信息输入收货地址预测模型,将每个决策树基于商品购买信息的计算结果进行累加处理,确定地址类别。商品购买信息包括:用户画像信息、商品信息、收货时间等。地址预测模块35从用户注册的收货地址信息中选取与此地址类别相匹配的收货地址信息作为与用户订单对应的收货地址信息。
如图4所示,地址类别识别模块32包括:初始分类单元321、加分确定单元322和类别确定单元323。初始分类单元321对收货地址信息进行语义识别处理,确定收货地址信息的初始分类以及初始分值。加分确定单元322获取用户的网络访问历史信息以及与收货地址相关的标注信息,基于网络访问历史信息、商品购买历史信息以及标注信息确定与初始分类对应的加分值。分类分值为初始分值与加分值之和,类别确定单元323当收货地址信息的分类分值达到预设的分值阈值时,则确定收货地址信息所属的地址类别为初始分类。
初始分类单元321对收货地址信息进行分词处理,获取收货地址的分词集合,判断分词集合中的分词是否符合预设的地址类别判断规则,如果是,则确定收货地址信息的初始分类以及初始分值。
例如,加分确定单元321基于网络访问历史信息提取用户的网络访问特征,判断用户的网络访问特征是否与初始分类对应的网络访问判决规则相匹配,如果是,确定与初始分类对应的加分值。网络访问特征包括:上网时间、上网频率、访问目的地址等。
或者,加分确定单元321基于收货地址确定判决地理区域,确定位于判决地理区域内并被标注为初始分类的其它收货地址的数量,判断数量是否大于预设的数量阈值,如果是,则确定与初始分类对应的加分值。
或者,加分确定单元321基于商品购买历史信息确定用户购买与初始分类相匹配的商品数量,判断商品数量是否大于预设的数量阈值,如果是,则确定与初始分类对应的加分值。
图5为根据本发明的收货地址预测装置的另一个实施例的模块示意图。如图5所示,该装置可包括存储器51、处理器52、通信接口53以及总线54。存储器51用于存储指令,处理器52耦合到存储器51,处理器52被配置为基于存储器51存储的指令执行实现上述的收货地址预测方法。
存储器51可以为高速RAM存储器、非易失性存储器(non-volatile memory)等,存储器51也可以是存储器阵列。存储器51还可能被分块,并且块可按一定的规则组合成虚拟卷。处理器52可以为中央处理器CPU,或专用集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明的收货地址预测方法的一个或多个集成电路。
在一个实施例中,本发明提供一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上任一个实施例中的收货地址预测方法。
上述实施例提供的收货地址预测方法、装置以及存储介质,能够使用户获得更加满足需求的收货地址,减少用户下单时的输入量和工作量,并能满足用户的个性化需求,提高了用户体验;并且,基于GBDT算法训练模型,能够有效提升模型对地址类别的预测准确率,提升处理效率。
可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (19)

1.一种收货地址预测方法,其特征在于,包括:
获取用户画像数据以及用户的商品购买历史信息;
确定用户的收货地址信息所属的地址类别,包括:
对所述收货地址信息进行语义识别处理,确定所述收货地址信息的初始分类以及初始分值;获取用户的网络访问历史信息以及与收货地址相关的标注信息,基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值;当所述收货地址信息的分类分值达到预设的分值阈值时,则确定所述收货地址信息所属的地址类别为所述初始分类,所述分类分值为所述初始分值与所述加分值之和;
根据所述用户画像数据、所述商品购买历史信息以及收货地址所属的地址类别构造地址信息训练样本;
利用所述地址信息训练样本进行训练,获得收货地址预测模型;
接收到用户订单,基于所述收货地址预测模型预测与所述用户订单对应的收货地址信息,并推荐给用户;
其中,所述收货地址预测模型由多个决策树组成;获取与所述用户订单相对应的商品购买信息,将所述商品购买信息输入所述收货地址预测模型;将每个决策树基于所述商品购买信息的计算结果进行累加处理,确定地址类别;从用户注册的收货地址信息中选取与此地址类别相匹配的收货地址信息作为与所述用户订单对应的收货地址信息。
2.如权利要求1所述的方法,其特征在于,所述利用所述地址信息训练样本进行训练、获得收货地址预测模型包括:
采用迭代决策树GBDT算法对所述地址信息训练样本数据进行训练,获得由多个决策树组成的所述收货地址预测模型。
3.如权利要求2所述的方法,其特征在于,
所述商品购买信息包括:用户画像信息、商品信息、收货时间。
4.如权利要求1所述的方法,其特征在于,所述获取用户画像数据以及用户的商品购买历史信息包括:
获取用户注册信息,从所述用户注册信息中提取用户画像数据,其中,所述用户画像数据包括:年龄、性别、注册地址;
获取用户的商品购买信息,基于所述商品购买信息生成所述商品购买历史信息,其中,所述商品购买历史信息包括:商品信息、收货时间和实际收货地址。
5.如权利要求1所述的方法,其特征在于,所述对所述收货地址信息进行语义识别处理、确定所述收货地址信息的初始分类以及初始分值包括:
对所述收货地址信息进行分词处理,获取所述收货地址的分词集合;
判断所述分词集合中的分词是否符合预设的地址类别判断规则,如果是,则确定所述收货地址信息的初始分类以及初始分值。
6.如权利要求1所述的方法,其特征在于,所述基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值包括:
基于所述网络访问历史信息提取用户的网络访问特征;
判断用户的网络访问特征是否与所述初始分类对应的网络访问判决规则相匹配,如果是,确定与所述初始分类对应的加分值;
其中,所述网络访问特征包括:上网时间、上网频率、访问目的地址。
7.如权利要求1所述的方法,其特征在于,所述基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值包括:
基于所述收货地址确定判决地理区域,确定位于所述判决地理区域内并被标注为所述初始分类的其它收货地址的数量;
判断所述数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
8.如权利要求1所述的方法,其特征在于,所述基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值包括:
基于所述商品购买历史信息确定用户购买与所述初始分类相匹配的商品数量;
判断商品数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
9.如权利要求1所述的方法,其特征在于,
所述地址类别包括:家庭地址类别、公司地址类别、学校地址类别。
10.一种收货地址预测装置,其特征在于,包括:
信息获取模块,用于获取用户画像数据以及用户的商品购买历史信息;
地址类别识别模块,用于确定用户的收货地址信息所属的地址类别;
其中,所述地址类别识别模块,包括:
初始分类单元,用于对所述收货地址信息进行语义识别处理,确定所述收货地址信息的初始分类以及初始分值;
加分确定单元,用于获取用户的网络访问历史信息以及与收货地址相关的标注信息,基于所述网络访问历史信息、所述商品购买历史信息以及标注信息确定与所述初始分类对应的加分值;
类别确定单元,用于当所述收货地址信息的分类分值达到预设的分值阈值时,则确定所述收货地址信息所属的地址类别为所述初始分类,所述分类分值为所述初始分值与所述加分值之和;
训练样本构造模块,用于根据所述用户画像数据、所述商品购买历史信息以及收货地址所属的地址类别构造地址信息训练样本;
预测模型生成模块,用于利用所述地址信息训练样本进行训练,获得收货地址预测模型;
地址预测模块,用于接收用户订单,基于所述收货地址预测模型预测与所述用户订单对应的收货地址信息,并推荐给用户;
其中,所述收货地址预测模型由多个决策树组成;所述地址预测模块,用于获取与所述用户订单相对应的商品购买信息,将所述商品购买信息输入所述收货地址预测模型;将每个决策树基于所述商品购买信息的计算结果进行累加处理,确定地址类别;从用户注册的收货地址信息中选取与此地址类别相匹配的收货地址信息作为与所述用户订单对应的收货地址信息。
11.如权利要求10所述的装置,其特征在于,
所述预测模型生成模块,用于采用迭代决策树GBDT算法对所述地址信息训练样本数据进行训练,获得由多个决策树组成的所述收货地址预测模型。
12.如权利要求11所述的装置,其特征在于,
所述商品购买信息包括:用户画像信息、商品信息、收货时间。
13.如权利要求10所述的装置,其特征在于,
所述信息获取模块,用于获取用户注册信息,从所述用户注册信息中提取用户画像数据,其中,所述用户画像数据包括:年龄、性别、注册地址;获取用户的商品购买信息,基于所述商品购买信息生成所述商品购买历史信息,其中,所述商品购买历史信息包括:商品信息、收货时间和实际收货地址。
14.如权利要求10所述的装置,其特征在于,
所述初始分类单元,用于对所述收货地址信息进行分词处理,获取所述收货地址的分词集合;判断所述分词集合中的分词是否符合预设的地址类别判断规则,如果是,则确定所述收货地址信息的初始分类以及初始分值。
15.如权利要求10所述的装置,其特征在于,
所述加分确定单元,用于基于所述网络访问历史信息提取用户的网络访问特征;判断用户的网络访问特征是否与所述初始分类对应的网络访问判决规则相匹配,如果是,确定与所述初始分类对应的加分值;其中,所述网络访问特征包括:上网时间、上网频率、访问目的地址。
16.如权利要求10所述的装置,其特征在于,
所述加分确定单元,用于基于所述收货地址确定判决地理区域,确定位于所述判决地理区域内并被标注为所述初始分类的其它收货地址的数量;判断所述数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
17.如权利要求10所述的装置,其特征在于,
所述加分确定单元,用于基于所述商品购买历史信息确定用户购买与所述初始分类相匹配的商品数量;判断商品数量是否大于预设的数量阈值,如果是,则确定与所述初始分类对应的加分值。
18.一种收货地址预测装置,其特征在于,包括:
存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至9中任一项所述的收货地址预测方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如权利要求1至9中任一项所述的收货地址预测方法。
CN201711173110.8A 2017-11-22 2017-11-22 收货地址预测方法、装置以及存储介质 Active CN109816134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711173110.8A CN109816134B (zh) 2017-11-22 2017-11-22 收货地址预测方法、装置以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711173110.8A CN109816134B (zh) 2017-11-22 2017-11-22 收货地址预测方法、装置以及存储介质

Publications (2)

Publication Number Publication Date
CN109816134A CN109816134A (zh) 2019-05-28
CN109816134B true CN109816134B (zh) 2021-07-20

Family

ID=66601207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711173110.8A Active CN109816134B (zh) 2017-11-22 2017-11-22 收货地址预测方法、装置以及存储介质

Country Status (1)

Country Link
CN (1) CN109816134B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651686B (zh) * 2019-09-24 2021-02-26 北京嘀嘀无限科技发展有限公司 一种测试处理方法、装置、电子设备及存储介质
CN112579876A (zh) * 2019-09-30 2021-03-30 北京京东尚科信息技术有限公司 基于用户兴趣的信息推送方法、装置、系统及存储介质
CN112651536A (zh) * 2019-10-10 2021-04-13 北京京东振世信息技术有限公司 确定配送地址的方法和装置
CN110991951A (zh) * 2019-11-20 2020-04-10 徐峰 一种基于大数据的快递方法及快递平台
CN113362124A (zh) * 2020-03-06 2021-09-07 北京沃东天骏信息技术有限公司 订单处理方法、装置、设备及计算机可读存储介质
CN111428933B (zh) * 2020-03-30 2022-10-04 江苏满运软件科技有限公司 物流地址推荐方法、系统、设备及存储介质
CN111967808B (zh) * 2020-04-30 2023-11-24 上海寻梦信息技术有限公司 确定物流对象收货方式的方法、装置、电子设备及存储介质
CN112529666B (zh) * 2020-12-18 2023-08-15 中国联合网络通信集团有限公司 商品推荐方法、系统、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701498A (zh) * 2015-12-31 2016-06-22 腾讯科技(深圳)有限公司 一种用户分类方法及服务器
CN105760526A (zh) * 2016-03-01 2016-07-13 网易(杭州)网络有限公司 一种新闻分类的方法和装置
CN107067293A (zh) * 2017-03-07 2017-08-18 北京三快在线科技有限公司 商家分类方法、装置及电子设备
CN107292566A (zh) * 2017-06-29 2017-10-24 北京五八信息技术有限公司 一种支付订单收货地址优化方法、终端及计算机存储介质
CN107330741A (zh) * 2017-07-07 2017-11-07 北京京东尚科信息技术有限公司 分品类电子券使用预测方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279868B (zh) * 2013-05-22 2016-08-17 兰亭集势有限公司 一种自动识别欺诈订单的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701498A (zh) * 2015-12-31 2016-06-22 腾讯科技(深圳)有限公司 一种用户分类方法及服务器
CN105760526A (zh) * 2016-03-01 2016-07-13 网易(杭州)网络有限公司 一种新闻分类的方法和装置
CN107067293A (zh) * 2017-03-07 2017-08-18 北京三快在线科技有限公司 商家分类方法、装置及电子设备
CN107292566A (zh) * 2017-06-29 2017-10-24 北京五八信息技术有限公司 一种支付订单收货地址优化方法、终端及计算机存储介质
CN107330741A (zh) * 2017-07-07 2017-11-07 北京京东尚科信息技术有限公司 分品类电子券使用预测方法、装置及电子设备

Also Published As

Publication number Publication date
CN109816134A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN109816134B (zh) 收货地址预测方法、装置以及存储介质
US11978106B2 (en) Method and non-transitory, computer-readable storage medium for deep learning model based product matching using multi modal data
CN109992646B (zh) 文本标签的提取方法和装置
WO2020001106A1 (zh) 分类模型的训练方法、店铺分类的方法及装置
CN108984675B (zh) 基于评价的数据查询方法和装置
CN109582876B (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN106776897B (zh) 一种用户画像标签确定方法及装置
CN111784455A (zh) 一种物品推荐方法及推荐设备
CN106557480B (zh) 查询改写的实现方法及装置
CN111080398A (zh) 商品推荐方法、装置、计算机设备和存储介质
JP2016522523A (ja) 情報を推薦するための方法およびシステム
CN110827112B (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
CN108596695B (zh) 实体推送方法及系统
CN109118316B (zh) 线上店铺真实性的识别方法和装置
CN112001754A (zh) 用户画像生成方法、装置、设备及计算机可读介质
CN107341173A (zh) 一种信息处理方法及装置
CN112801425B (zh) 信息点击率的确定方法、装置、计算机设备和存储介质
CN113570413A (zh) 广告关键词的生成方法、装置、存储介质及电子设备
CN111967924A (zh) 商品推荐方法、商品推荐装置、计算机设备和介质
KR101784559B1 (ko) 사용자의 소비 패턴/관심사 분석 방법 및 장치
CN111582932A (zh) 场景间信息推送方法、装置、计算机设备及存储介质
CN115147130A (zh) 问题预测方法、设备、存储介质及程序产品
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN114078037A (zh) 基于标签向量化的商品推荐方法及装置
CN112288510A (zh) 物品推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant