CN110910199B - 项目信息的排序方法、装置、计算机设备及存储介质 - Google Patents
项目信息的排序方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110910199B CN110910199B CN201910985155.8A CN201910985155A CN110910199B CN 110910199 B CN110910199 B CN 110910199B CN 201910985155 A CN201910985155 A CN 201910985155A CN 110910199 B CN110910199 B CN 110910199B
- Authority
- CN
- China
- Prior art keywords
- information
- user
- target user
- behavior
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 230000006399 behavior Effects 0.000 claims description 106
- 238000010586 diagram Methods 0.000 description 6
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000007175 bidirectional communication Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000010985 leather Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0639—Item locations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种项目信息的排序方法、装置、计算机设备及存储介质,包括下述步骤:获取目标用户的行为信息数据;将所述行为信息数据输入到预设的特征提取模型中,根据特征提取模型的中间结果确定所述目标用户的行为特征向量;获取所述行为特征向量,结合预设的项目数据与所述目标用户的用户画像,通过数据处理以得到各项目类别的预估值,并根据所述预估值确定项目序列,其中,所述预估值为根据所述行为特征向量、项目数据与用户画像通过计算得到的用于反映各项目类型与所述目标用户的匹配程度的数值。利用特征提取模型输出的行为特征向量进行预估值的计算,根据预估值进行项目排序,有效提高项目序列和用户信息的关联度。
Description
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种项目信息的排序方法、装置、计算机设备及存储介质。
背景技术
在大多数非搜索电商场景下,用户并不会实时表达目前的兴趣偏好。因此通过设计模型来捕获用户的兴趣,是提升CTR预估效果的关键。深度学习在CTR预估领域已经有了广泛的应用,常见的算法比如Wide&Deep,DeepFM等。这些方法一般的思路是:通过Embedding层,将高维离散特征转换为固定长度的连续特征,然后通过多个全联接层,最后通过一个sigmoid函数转化为0-1值,代表点击的概率。即SparseFeatures->EmbeddingVector->MLPs->Sigmoid->Output.通过神经网络可以拟合高阶的非线性关系,同时减少了人工特征的工作量。
研究者们通过观察收集到的线上数据,发现了用户行为数据中有两个很重要的特性:Diversity:用户在浏览电商网站的过程中显示出的兴趣是十分多样性的。Localactivation:由于用户兴趣的多样性,只有部分历史数据会影响到当次推荐的物品是否被点击,而不是所有的历史记录。针对上面提到的用户行为中存在的两种特性,推出了深度兴趣网路DIN。
另一方面,在内容推荐系统里,一个常用的方法是通过理解内容(挖掘内容属性)去挖掘用户的兴趣点来构建推荐模型。从大多数业务的效果来看,这样的模型是有效的,也就是说用户行为与内容是相关的。而相关性是对称的,这意味着如果可以从内容属性去理解用户行为,预测用户行为,那么也可以通过理解用户行为去理解内容,预测内容属性。因此推出了Item2Vec模型。
不过,实践发现,Item2Vec模型通过加和平均物品embeddings的方式表征用户偏好的方式没有考虑到用户历史点击序列的时序属性。Item2Vec模型仅考虑了用户行为序列信息,用户和物品的画像信息没有纳入模型,直接影响的推荐效果。而DIN的物品embedding的聚类效果不理想,从而直接影响了物品关联度的计算效果。
发明内容
本发明实施例能够提供一种有效提高商品排序和用户信息之间的关联度的项目信息的排序方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种项目信息的排序方法,包括以下步骤:
获取目标用户的行为信息数据;
将所述行为信息数据输入到预设的特征提取模型中,根据特征提取模型的中间结果确定所述目标用户的行为特征向量;
获取所述行为特征向量,结合预设的项目数据与所述目标用户的用户画像,通过数据处理以得到各项目类别的预估值,并根据所述预估值确定项目序列,其中,所述预估值为根据所述行为特征向量、项目数据与用户画像通过计算得到的用于反映各项目类型与所述目标用户的匹配程度的数值。
可选地,所述获取目标用户的行为信息数据的步骤之前,包括以下步骤:
获取目标用户的操作信息,其中,所述操作信息为指定时间范围内用户的操作行为;
根据所述操作信息确定所述操作行为对应的商品信息;
根据所述操作信息和所述商品信息生成所述行为信息数据。
可选地,所述获取所述行为特征向量,结合预设的项目数据与所述目标用户的用户画像,通过数据处理以得到各项目类别的预估值的步骤之前,还包括构建用户画像的步骤,所述构建用户画像的步骤,包括以下步骤:
获取目标用户的特征标签;
根据所述特征标签构建所述目标用户的用户画像。
可选地,所述特征标签包括用户的基础特征,所述获取目标用户的特征标签的步骤之前,包括下述步骤:
获取目标用户的基本信息;
根据所述基本信息提取目标用户的基础特征。
可选地,所述特征标签包括目标用户的兴趣特征,所述获取目标用户的特征标签的步骤之前,包括下述步骤:
根据所述操作信息确定目标用户操作行为对应的操作分值;
根据所述操作分值计算各商品类别的兴趣值,其中,所述兴趣值为指定时间范围内该商品类别对应的操作分值之和;
根据所述兴趣值确定目标用户的兴趣特征。
可选地,所述特征标签包括目标用户的消费特征,所述获取目标用户的特征标签的步骤之前,包括下述步骤:
获取目标用户的消费记录信息;
根据所述消费记录信息确定目标用户的消费特征。
可选地,所述特征提取模型为Item2Vec模型。
为解决上述技术问题,本发明实施例还提供一种项目信息的排序装置,包括:
获取模块,用于获取目标用户的行为信息数据;
处理模块,用于将所述行为信息数据输入到预设的特征提取模型中,根据特征提取模型的中间结果确定所述目标用户的行为特征向量;
执行模块,用于获取所述行为特征向量,结合预设的项目数据与所述目标用户的用户画像,通过数据处理以得到各项目类别的预估值,并根据所述预估值确定项目序列,其中,所述预估值为根据所述行为特征向量、项目数据与用户画像通过计算得到的用于反映各项目类型与所述目标用户的匹配程度的数值。
可选地,所述项目信息的排序装置,还包括:
第一获取子模块,用于获取目标用户的操作信息,其中,所述操作信息为指定时间范围内用户的操作行为;
第一处理子模块,用于根据所述操作信息确定所述操作行为对应的商品信息;
第二处理子模块,用于根据所述操作信息和所述商品信息生成所述行为信息数据。
可选地,所述项目信息的排序装置,还包括:
第二获取子模块,用于获取目标用户的特征标签;
第一构建子模块,用于根据所述特征标签构建所述目标用户的用户画像。
可选地,所述项目信息的排序装置,还包括:
第三获取子模块,用于获取目标用户的基本信息;
第一提取子模块,用于根据所述基本信息提取目标用户的基础特征。
可选地,所述项目信息的排序装置,还包括:
第三处理子模块,用于根据所述操作信息确定目标用户操作行为对应的操作分值;
第一计算子模块,用于根据所述操作分值计算各商品类别的兴趣值,其中,所述兴趣值为指定时间范围内该商品类别对应的操作分值之和;
第四处理子模块,用于根据所述兴趣值确定目标用户的兴趣特征。
可选地,所述项目信息的排序装置,还包括:
第四处理子模块,用于获取目标用户的消费记录信息;
第五处理子模块,用于根据所述消费记录信息确定目标用户的消费特征。
可选地,所述特征提取模型为Item2Vec模型。
为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述项目信息的排序方法的步骤。
为解决上述技术问题,本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述项目信息的排序方法的步骤。
本发明实施例的有益效果是:在深度兴趣网络模型训练预测的时候冻结其中对于用户特征的提取步骤,通过特征提取模型对目标用户的行为信息数据进行处理得到行为特征向量,深度兴趣网络模型直接利用得到的行为特征向量进行信息处理,有效提高深度兴趣网络模型的训练效率。根据用户的行为特征对各商品种类进行CTR预估,生成对应的预估值,然后以预估值为依据进行商品排序,可以有效提高商品序列和用户信息的关联度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例项目信息的排序方法的基本流程示意图;
图2为本发明实施例生成目标用户行为信息数据的流程示意图;
图3为本发明实施例构建用户画像输入到深度兴趣网络模型的流程示意图;
图4为本发明实施例获取目标用户基础特征的流程示意图;
图5为本发明实施例获取目标用户兴趣特征的流程示意图;
图6为本发明实施例获取目标用户消费特征的流程示意图;
图7为本发明实施例项目信息的排序装置的基本结构框图;
图8为本发明实施例计算机设备基本结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunicationsService,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(PersonalDigitalAssistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(GlobalPositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(MobileInternetDevice,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
具体地请参阅图1,图1为本实施例项目信息的排序方法的基本流程示意图。
如图1所示,一种项目信息的排序方法,包括以下步骤:
S1100、获取目标用户的行为信息数据;
在用户使用APP或者平台的过程中采集到用户的行为信息数据,行为信息数据包括用户的操作和每次操作对应的商品信息。具体地,在采集到用户的每一条信息之后根据采集的时间为用户行为信息数据赋予时间特征,例如某个时间使用了某个功能,某个时间点击了某个商品等等。建立用户信息库,以时间为依据对用户的行为信息数据进行排序。在统计用户的行为信息数据时,用户操作可以包括点击、购买、收藏和分享等等,但不限于此。同时,提取出用户操作所对应的商品信息,商品信息可以通过标签的方式进行划分,商标标签的依据可以是商品的类别、属性或者领域等等,如衣服、美妆、游戏、美食等等,但不限于此,标签的设定可以根据实际用户场景的不同进行调整,如需要对偏好信息进行更加准确的定位时,将标签设置为更加精确细化的类别,例如将衣服划分为上衣、裤子、裙子、外套等等多个类别,甚至进行再进一步的细化,将裤子划分为牛仔裤、布裤、皮裤等等。
需要对用户进行行为特征提取时,获取到用户一定时间范围内的行为信息数据,例如近半年,时间范围的设定可以根据实际用户需求的不同而进行调整,例如需要降低性能压力,提高特征提取速度时,可以减少时间范围,当需要对用户进行全面的特征提取,形成更加真实的用户特征时,可以增加时间范围。
S1200、将所述行为信息数据输入到预设的特征提取模型中,根据特征提取模型的中间结果确定所述目标用户的行为特征向量;
将获取得到的行为信息数据输入到特征提取模型中,本实施例中特征提取模型为根据输入的信息进行特征提取以生成对应特征向量的神经网络模型,例如Item2Vec模型。以Item2Vec模型为例,将行为信息数据输入到模型当中,获取模型的中间结果,即embeddings,作为目标用户的行为特征向量。
S1300、获取所述行为特征向量,结合预设的项目数据与所述目标用户的用户画像,通过数据处理以得到各项目类别的预估值,并根据所述预估值确定项目序列,其中,所述预估值为根据所述行为特征向量、项目数据与用户画像通过计算得到的用于反映各项目类型与所述目标用户的匹配程度的数值;
在将行为特征向量输入到DIN(DeepInterestNetwork,深度兴趣网络)模型之前,首先获取到目标用户的用户画像,以及平台或APP的商品项目信息,商品项目信息包括商品的分类、价格、应用场景等多种属性,但不限于此,以标签的形式设定商品信息,例如某一件衣服的特征包括分类-衣服,价格-500元,应用场景-日常。在训练DIN模型时,冻结对于特征向量的学习,直接利用Item2Vec的所输出的特征向量,即用户行为特征向量,从而实现Item2Vec&DIN的模型嵌套和迁移学习。具体地,在获取到用户的行为特征向量之后,将特征向量作为DIN模型参数之一,然后结合用户画像以及平台中的商品项目特征,输入到DIN模型中,获取得到DIN模型输出的CTR(Click-Through-Rate,点击通过率)预估值,以CTR预估值为依据对平台中的商品数据进行数据处理,数据处理的方式可以是排序,例如对商品数据进行排序,取其中CTR预估值最高的一定量(例如20件,但不限于此)商品作为推荐商品,从而确定商品项目序列,按照商品项目序列将推荐商品展示给用户。
如图2所示,步骤S1100之前还包括以下步骤:
S1010、获取目标用户的操作信息,其中,所述操作信息为指定时间范围内用户的操作行为;
在用户使用APP或者平台的过程中采集用户的操作,在采集到用户的每一条操作信息之后根据采集的时间为用户行为信息数据赋予时间特征,例如某个时间点击了某个商品等等。建立用户信息库,以时间为依据对用户的行为信息数据进行排序。在统计用户的行为信息数据时,用户操作行为可以包括点击、购买、收藏和分享等等,但不限于此。操作信息为用户一定时间范围内用户的操作行为,例如近半年,时间范围的设定可以根据实际用户需求的不同而进行调整,例如需要降低性能压力,提高特征提取速度时,可以减少时间范围,当需要对用户进行全面的特征提取,形成更加真实的用户特征时,可以增加时间范围。
S1020、根据所述操作信息确定所述操作行为对应的商品信息;
在获取到用户的操作信息之后,提取出用户每一项操作行为所对应的商品信息,例如点击操作所对应的商品信息,或分享操作对应的商品信息等等。商品信息可以通过标签的方式进行表示,商标标签的划分依据可以是商品的类别、属性或者领域等等,如衣服、美妆、游戏、美食等等,但不限于此,标签的设定可以根据实际用户场景的不同进行调整,如需要对偏好信息进行更加准确的定位时,将标签设置为更加精确细化的类别,例如将衣服划分为上衣、裤子、裙子、外套等等多个类别,甚至进行再进一步的细化,将裤子划分为牛仔裤、布裤、皮裤等等。每一件商品的商品信息可以包括多个标签,例如类别标签为衣服,价格标签为100元以下,年龄标签为20-25岁,即该商品的标签包括“衣服,100元以下,20-25岁”。
S1030、根据所述操作信息和所述商品信息生成所述行为信息数据;
在获取到操作信息与对应的商品信息之后,生成目标用户的行为信息数据,行为信息数据为每一条操作信息与商品信息相互对应,例如“点击-A商品”或“收藏-B商品”等。在一些实施方式中,将操作行为对应的商品信息细化为对应的商品标签,例如点击过A商品,A商品的标签为“衣服”和“100元以下”,得到的行为信息数据为“点击-衣服”和“点击-100元以下”。通过上述方法将指定时间范围内的操作行为和商品信息一一对应起来,统计得到所有对应关系的集合作为目标用户的行为信息数据。
利用用户的操作信息和对应的商品信息生成用户的行为信息数据,用于提取用户的行为特征,使用户的行为特征可以有效地反映出用户的兴趣偏好,同时,行为特征提取的范围为近期一定时间范围,使提取出的用户特征可以更加贴合用户当前的实际情况。
如图3所示,步骤S1300之前还包括以下步骤:
S1210、获取目标用户的特征标签;
通过用户信息和用户的行为提取目标用户的特征,从而生成对应的特征标签。具体地,用户特征可以为一个多个标签,将用户特征划分为多个大的类别,例如基本特征、兴趣特征、消费特征等,每个类别中可以划分多个小类别,例如基本特征中包含性别、年龄、城市、教育水平、职业等,兴趣特征中包含兴趣爱好、品牌偏好、内容偏好、产品偏好等,消费特征中包括消费频率、收入情况、消费平台偏好等。用户特征可以绑定用户账号、关联社交号或登录设备等,在需要构建用户画像时,从系统中获取当前用户的特征标签。
S1220、根据所述特征标签构建所述目标用户的用户画像;
在获取到用户的特征标签之后,根据用户所有特征标签的集体构建用户画像,作为输入深度兴趣网络模型的参数之一。
如图4所示,步骤S1210之前还包括下述步骤:
S1201、获取目标用户的基本信息;
用户信息可以包括用户注册时所填写的信息,以及用户关联其他平台账号中所包含的信息等等,在需要进行用户画像的构建时,获取用户的基本信息。
S1202、根据所述基本信息提取目标用户的基础特征;
基本特征包含性别、年龄、城市、教育水平、职业等,但不限于此。基本特征可以从用户信息中直接提取,并作为用户的固有属性,属于较为稳定的特征,在提取到用户的基本特征之后可以在较长一段时间之内不用维护和更新,因此,可以从用户注册时所填写的信息中直接获得,并存储于用户相关数据中。在一些实施例中,由于存在用户的信息填写率不高的问题,在这种情况下,通过用户已有的基础信息,结合用户行为特征向量,在数据库中查找符合用户已有的基础信息,且用户行为特征向量距离最小的一个用户的信息,用于弥补用户未填写的基础特征,从而形成完整的用户基础特征。
通过用户的基本信息提取得到用户的基础特征,使得用户特征标签的获取更加方便快捷,节省了提取用户特征标签的时间。
如图5所示,步骤S1210之前还包括下述步骤:
S1203、根据所述操作信息确定目标用户操作行为对应的操作分值;
获取用户在商品浏览过程中的操作信息,根据操作信息以及所对应的商品类别,判断用户的兴趣偏好。将操作分为多种操作行为,例如点击、购买、分享和收藏等,每个操作行为设置不同的分值,操作分值为该操作对应的商品类别的得分,例如对A商品进行操作时,点击为1分、购买为4分、收藏和分享为2分等,将分数赋予A商品对应的商品类别,例如A商品的商品类别为“衣服”和“日常”,即点击A商品后,商品种类“衣服”与“日常”分别获得1分的操作分值。S1204、根据所述操作分值计算各商品类别的兴趣值,其中,所述兴趣值为指定时间范围内该商品类别对应的操作分值之和;
获取指定时间范围内(例如近三个月,但不限于此)用户的所有操作分值,并计算每一个商品类别对应的操作分值之和,例如用户对于B商品类别的商品在指定时间范围内进行过五次操作,每一次操作的得分分别为1分,2分,1分,4分,2分,即B商品类别最终的兴趣值为1+2+1+4+2=10分。通过上述方法计算得到用户在该时间范围内所涉及的所有商品类别的兴趣值。
S1205、根据所述兴趣值确定目标用户的兴趣特征;
在获取到商品类别的兴趣值之后,以兴趣值为依据对商品类别进行排序,取其中兴趣值最高的一定量(例如5个)商品类别作为目标用户的兴趣特征。
通过设置操作分值,不同的操作行为在商品类别上产生的兴趣值具有差异性,以兴趣值为依据确定用户的兴趣特征,可以更好地反映用户的兴趣偏好,从而使用户画像更加真实。
如图6所示,步骤S1210之前还包括下述步骤:
S1206、获取目标用户的消费记录信息;
获取目标用户一段时间内(例如近三个月,但不限于此)的消费记录,消费记录可以是该平台上的购买记录,也可以是其他关联平台上的消费记录,例如用户某个时间在某个平台购买了某样产品。
S1207、根据所述消费记录信息确定目标用户的消费特征;
消费特征包括用户的消费水平、消费频率等,但不限于此。消费水平即用户的消费金额预估值,通过用户对于不同产品的消费金额,取对应的均值作为用户的消费金额预估值,消费水平的分类可以使用区间段的模式,将消费水平划分为多个区间,根据用户的消费金额预估值选择对应的区间作为用户的消费水平特征,例如将消费水平划分为0-1000元,1000-2000元,2000元以上三个区间,当用户的消费金额预估值为500元时,确定用户的消费水平特征为0-1000元。消费水平的划分可以根据实际应用需求进行调整,例如需要对用户进行更细致的区分时,可以缩小每个区间之间的跨度,如每500元为一个区间。消费频率为用户在指定的时间周期内对于目标产品类别的消费次数,指定的时间周期可以根据实际应用场景的不同的进行调整,例如一周或一个月,统计得到用户在多个时间周期内消费次数的均值,作为用户的消费频率,例如用户对于类别为衣服的商品每个月消费两笔,即用户对于衣服分类的商品的消费频率为2次/月。
将提取得到的消费水平和消费频率的特征信息作为目标用户的消费特征,例如消费水平对应的特征为0-1000元,消费频率对应的特征为2次/月。
通过用户消费记录提取用户的消费特征,可以有效反应用户的消费能力,从而为后续进行的商品排序推荐提供更加可靠的依据,提高商品推荐的有效性。
在本发明实施例中,特征提取模型为Item2Vec模型。
为解决上述技术问题,本发明实施例还提供一种项目信息的排序装置。具体请参阅图7,图7为本实施项目信息的排序装置的基本结构框图。
如图7所示,项目信息的排序装置,包括:获取模块2100、处理模块2200和执行模块2300。其中,获取模块用于获取目标用户的行为信息数据;处理模块用于将所述行为信息数据输入到预设的特征提取模型中,根据特征提取模型的中间结果确定所述目标用户的行为特征向量;执行模块用于获取所述行为特征向量,结合预设的项目数据与所述目标用户的用户画像,通过数据处理以得到各项目类别的预估值,并根据所述预估值确定项目序列,其中,所述预估值为根据所述行为特征向量、项目数据与用户画像通过计算得到的用于反映各项目类型与所述目标用户的匹配程度的数值。
在深度兴趣网络模型训练预测的时候冻结其中对于用户特征的提取步骤,通过特征提取模型对目标用户的行为信息数据进行处理得到行为特征向量,深度兴趣网络模型直接利用得到的行为特征向量进行信息处理,有效提高深度兴趣网络模型的训练效率。根据用户的行为特征对各商品种类进行CTR预估,生成对应的预估值,然后以预估值为依据进行商品排序,可以有效提高商品序列和用户信息的关联度。
在一些实施方式中,项目信息的排序装置还包括:第一获取子模块、第一处理子模块、第二处理子模块。其中第一获取子模块用于获取目标用户的操作信息,其中,所述操作信息为指定时间范围内用户的操作行为;第一处理子模块用于根据所述操作信息确定所述操作行为对应的商品信息;第二处理子模块用于根据所述操作信息和所述商品信息生成所述行为信息数据。
在一些实施方式中,项目信息的排序装置还包括:第二获取子模块、第一构建子模块。其中,第二获取子模块用于获取目标用户的特征标签;第一构建子模块用于根据所述特征标签构建所述目标用户的用户画像。
在一些实施方式中,项目信息的排序装置还包括:第三获取子模块、第一提取子模块。其中,第三获取子模块用于获取目标用户的基本信息;第一提取子模块用于根据所述基本信息提取目标用户的基础特征。
在一些实施方式中,项目信息的排序装置还包括:第三处理子模块、第一计算子模块、第四处理子模块。其中,第三处理子模块用于根据所述操作信息确定目标用户操作行为对应的操作分值;第一计算子模块用于根据所述操作分值计算各商品类别的兴趣值,其中,所述兴趣值为指定时间范围内该商品类别对应的操作分值之和;第四处理子模块用于根据所述兴趣值确定目标用户的兴趣特征。
在一些实施方式中,项目信息的排序装置还包括:第四处理子模块、第五处理子模块。其中,第四处理子模块用于获取目标用户的消费记录信息;第五处理子模块用于根据所述消费记录信息确定目标用户的消费特征。
为解决上述技术问题,本发明实施例还提供一种计算机设备。具体请参阅图8,图8为本实施例计算机设备基本结构框图。
如图8所示,计算机设备的内部结构示意图。如图8所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种项目信息的排序方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种项目信息的排序方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图7中获取模块2100、处理模块2200和执行模块2300的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有项目信息的排序装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述项目信息的排序方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)等非易失性存储介质,或随机存储记忆体(RandomAccessMemory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种项目信息的排序方法,其特征在于,包括以下步骤:
获取目标用户的行为信息数据;
将所述行为信息数据输入到预设的特征提取模型中,根据特征提取模型的中间结果确定所述目标用户的行为特征向量;
通过深度兴趣网络模型,基于所述行为特征向量、预设的项目数据与所述目标用户的用户画像进行点击通过率的预估,得到各项目类别的预估值,并根据所述预估值确定项目序列,其中,所述预估值为根据所述行为特征向量、项目数据与用户画像通过计算得到的用于反映各项目类型与所述目标用户的匹配程度的数值;
其中,在训练所述深度兴趣网络模型时,冻结其对特征向量的学习,直接采用基于所述特征提取模型所得的行为特征向量。
2.如权利要求1所述的项目信息的排序方法,其特征在于,所述获取目标用户的行为信息数据的步骤之前,包括以下步骤:
获取目标用户的操作信息,其中,所述操作信息为指定时间范围内用户的操作行为;
根据所述操作信息确定所述操作行为对应的商品信息;
根据所述操作信息和所述商品信息生成所述行为信息数据。
3.如权利要求2所述的项目信息的排序方法,其特征在于,所述基于所述行为特征向量,结合预设的项目数据与所述目标用户的用户画像进行点击通过率的预估,得到各项目类别的预估值的步骤之前,还包括构建用户画像的步骤,所述构建用户画像的步骤,包括以下步骤:
获取目标用户的特征标签;
根据所述特征标签构建所述目标用户的用户画像。
4.如权利要求3所述的项目信息的排序方法,其特征在于,所述特征标签包括用户的基础特征,所述获取目标用户的特征标签的步骤之前,包括下述步骤:
获取目标用户的基本信息;
根据所述基本信息提取目标用户的基础特征。
5.如权利要求3所述的项目信息的排序方法,其特征在于,所述特征标签包括目标用户的兴趣特征,所述获取目标用户的特征标签的步骤之前,包括下述步骤:
根据所述操作信息确定目标用户操作行为对应的操作分值;
根据所述操作分值计算各商品类别的兴趣值,其中,所述兴趣值为指定时间范围内该商品类别对应的操作分值之和;
根据所述兴趣值确定目标用户的兴趣特征。
6.如权利要求3所述的项目信息的排序方法,其特征在于,所述特征标签包括目标用户的消费特征,所述获取目标用户的特征标签的步骤之前,包括下述步骤:
获取目标用户的消费记录信息;
根据所述消费记录信息确定目标用户的消费特征。
7.如权利要求1-6任一项所述的项目信息的排序方法,其特征在于,所述特征提取模型为Item2Vec模型。
8.一种项目信息的排序装置,其特征在于,包括:
获取模块,用于获取目标用户的行为信息数据;
处理模块,用于将所述行为信息数据输入到预设的特征提取模型中,根据特征提取模型的中间结果确定所述目标用户的行为特征向量;
执行模块,用于通过深度兴趣网络模型,基于所述行为特征向量、结合预设的项目数据与所述目标用户的用户画像进行点击通过率的预估,得到各项目类别的预估值,并根据所述预估值确定项目序列,其中,所述预估值为根据所述行为特征向量、项目数据与用户画像通过计算得到的用于反映各项目类型与所述目标用户的匹配程度的数值;
其中,在训练所述深度兴趣网络模型时,冻结其对特征向量的学习,直接采用基于所述特征提取模型所得的行为特征向量。
9.一种计算机设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述权利要求1-7任意一项所述的项目信息的排序方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种项目信息的排序方法,所述方法包括上述权利要求1-7任意一项所述的项目信息的排序方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910985155.8A CN110910199B (zh) | 2019-10-16 | 2019-10-16 | 项目信息的排序方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910985155.8A CN110910199B (zh) | 2019-10-16 | 2019-10-16 | 项目信息的排序方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110910199A CN110910199A (zh) | 2020-03-24 |
CN110910199B true CN110910199B (zh) | 2024-05-28 |
Family
ID=69815267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910985155.8A Active CN110910199B (zh) | 2019-10-16 | 2019-10-16 | 项目信息的排序方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110910199B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111475721B (zh) * | 2020-03-31 | 2023-12-29 | 百度在线网络技术(北京)有限公司 | 信息推送方法、装置、设备及存储介质 |
JP7204903B2 (ja) | 2020-03-31 | 2023-01-16 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 情報プッシュ方法、装置、機器及び記憶媒体 |
CN111652280B (zh) * | 2020-04-30 | 2023-10-27 | 中国平安财产保险股份有限公司 | 基于行为的目标物数据分析方法、装置及存储介质 |
CN111966935B (zh) * | 2020-07-22 | 2023-12-12 | 招联消费金融有限公司 | 信息预加载方法、装置、计算机设备和存储介质 |
CN112001754A (zh) * | 2020-08-21 | 2020-11-27 | 上海风秩科技有限公司 | 用户画像生成方法、装置、设备及计算机可读介质 |
CN111967914A (zh) * | 2020-08-26 | 2020-11-20 | 珠海格力电器股份有限公司 | 基于用户画像的推荐方法、装置、计算机设备和存储介质 |
CN112069404A (zh) * | 2020-08-31 | 2020-12-11 | 深圳市卡牛科技有限公司 | 一种商品信息的展示方法、装置、设备和存储介质 |
CN113781079A (zh) * | 2020-10-13 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 用于训练模型的方法和装置 |
CN112559099B (zh) * | 2020-12-04 | 2024-02-27 | 北京国家新能源汽车技术创新中心有限公司 | 基于用户行为的远程图像显示方法、装置、系统及存储介质 |
CN112434184B (zh) * | 2020-12-15 | 2022-03-01 | 四川长虹电器股份有限公司 | 基于历史影视海报的深度兴趣网络的排序方法 |
CN112633977A (zh) * | 2020-12-22 | 2021-04-09 | 苏州斐波那契信息技术有限公司 | 一种基于用户行为的评分方法、装置计算机设备及存储介质 |
CN114282982A (zh) * | 2022-01-11 | 2022-04-05 | 平安科技(深圳)有限公司 | 商品推荐方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108182621A (zh) * | 2017-12-07 | 2018-06-19 | 合肥美的智能科技有限公司 | 商品推荐方法及商品推荐装置、设备和存储介质 |
CN108960975A (zh) * | 2018-06-15 | 2018-12-07 | 广州麦优网络科技有限公司 | 基于用户画像的个性化精准营销方法、服务器及存储介质 |
CN110276495A (zh) * | 2019-06-26 | 2019-09-24 | 东莞市盟大塑化科技有限公司 | 基于人工智能的商品订购方法、装置、计算机和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975472A (zh) * | 2015-12-09 | 2016-09-28 | 乐视网信息技术(北京)股份有限公司 | 一种推荐方法和装置 |
-
2019
- 2019-10-16 CN CN201910985155.8A patent/CN110910199B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108182621A (zh) * | 2017-12-07 | 2018-06-19 | 合肥美的智能科技有限公司 | 商品推荐方法及商品推荐装置、设备和存储介质 |
CN108960975A (zh) * | 2018-06-15 | 2018-12-07 | 广州麦优网络科技有限公司 | 基于用户画像的个性化精准营销方法、服务器及存储介质 |
CN110276495A (zh) * | 2019-06-26 | 2019-09-24 | 东莞市盟大塑化科技有限公司 | 基于人工智能的商品订购方法、装置、计算机和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110910199A (zh) | 2020-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110910199B (zh) | 项目信息的排序方法、装置、计算机设备及存储介质 | |
CN108876526B (zh) | 商品推荐方法、装置和计算机可读存储介质 | |
CN110569432B (zh) | 商品序列计算方法、装置、计算机设备及存储介质 | |
CN109582876B (zh) | 旅游行业用户画像构造方法、装置和计算机设备 | |
CN108648049A (zh) | 一种基于用户行为区别建模的序列推荐方法 | |
CN108629665A (zh) | 一种个性化商品推荐方法和系统 | |
CN109741112A (zh) | 一种基于移动大数据的用户购买意向预测方法 | |
CN110555753A (zh) | 基于推荐的排序控制方法、装置、计算机设备及存储介质 | |
CN111652648A (zh) | 智能生成个性化组合促销方案的方法及具有该方法的系统 | |
CN113837794B (zh) | 基于时空图卷积网络的连锁零售门店销售预测方法 | |
CN114663197A (zh) | 商品推荐方法及其装置、设备、介质、产品 | |
CN113761393B (zh) | 商品协同推荐方法及其装置、设备、介质、产品 | |
CN114371946B (zh) | 基于云计算和大数据的信息推送方法及信息推送服务器 | |
CN113946754A (zh) | 基于用户画像的权益推荐方法、装置、设备及存储介质 | |
CN113379449B (zh) | 多媒体资源召回方法、装置、电子设备以及存储介质 | |
CN112541806A (zh) | 一种基于异质信息网络的推荐方法及装置 | |
CN111967924A (zh) | 商品推荐方法、商品推荐装置、计算机设备和介质 | |
CN115545832A (zh) | 商品搜索推荐方法及其装置、设备、介质 | |
CN105809465A (zh) | 一种信息处理方法及装置 | |
CN114637920A (zh) | 对象推荐方法以及装置 | |
CN112464106B (zh) | 对象推荐方法及装置 | |
CN112269943B (zh) | 一种信息推荐系统及方法 | |
Tran et al. | Combining social relations and interaction data in Recommender System with Graph Convolution Collaborative Filtering | |
CN116823410A (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN114841760B (zh) | 一种基于受众行为特征分析的广告推荐管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |