CN110490686A - 一种基于时间感知的商品评分模型构建、推荐方法及系统 - Google Patents
一种基于时间感知的商品评分模型构建、推荐方法及系统 Download PDFInfo
- Publication number
- CN110490686A CN110490686A CN201910609155.8A CN201910609155A CN110490686A CN 110490686 A CN110490686 A CN 110490686A CN 201910609155 A CN201910609155 A CN 201910609155A CN 110490686 A CN110490686 A CN 110490686A
- Authority
- CN
- China
- Prior art keywords
- commodity
- user
- layer
- information
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于时间感知的商品评分模型构建、推荐方法及系统,在模型的第一阶段利用卷积神经网络超强的特征挖掘能力学习用户、商品以及评级信息的高维特征向量,本发明在此阶段还引入对项目评级预测关键的评级时间特征;在模型的第二阶段,通过卷积神经网络学习的高维特征向量训练随机森林回归模型,来预测用户对项目的评级,从而根据预测的评级进行推荐;能够同时对各种形式的数据利用并进行推荐,提高了评分模型评分的准确率,从而提高了推荐方法的准确性。
Description
技术领域
本发明涉及商品推荐方法,具体涉及一种基于时间感知的商品评分模型构建、推荐方法及系统。
背景技术
近年来,随着科学技术的发展,很多业务已经从线下发展到线上,线上产生的数据呈爆炸性增长。面对网络上海量的数据,用户如何从其中快速地选择出符合自己兴趣的项目,是用户面临的主要问题,也是推荐方法的主要挑战。
随着深度学习技术在自然语言处理和图像/视频处理领域的成功应用,基于深度学习技术的商品评分模型构建方法以及推荐方法也逐渐成为一种趋势。与传统的商品评分模型构建方法相比,结合深度学习的商品评分模型构建方法能够更好地提取特征,具有处理形式多样的海量数据的优势,到目前已经有多种深度学习技术被用于推荐方法,比如卷积神经网络、循环神经网络、多层感知机技术、深度语义相似模型、受限的玻尔兹曼机等。然而,这些深度学习推荐方法并不是完美的,还存在许多悬而未决的问题,例如如何解决冷启动问题,如何充分利用文本信息,如何将传统方法与深度学习技术无缝结合以及如何使得评分更加准确,从而使得推荐更符合实际情况等问题。
尽管现有技术已经提出各种技术来提高商品评分模型的准确性,从而提高推荐方法的性能,但是还是存在很多问题,不能完全地理解用户和项目,以至于影响商品评分模型的整体性能,比如提出的很多与卷积神经网络相关的推荐算法忽略了用户对项目的评级时间,与循环神经网络相关的商品评分模型没有将数据中的文本信息充分利用,大多数推荐方法存在冷启动、稀疏性和扩展性的问题,深度学习技术推荐结果难以解释等。
发明内容
本发明的目的在于提供一种基于时间感知的商品评分模型构建、推荐方法及系统,用以解决现有技术中的商品评分模型构建方法不能完全地理解用户和项目,使得商品评分模型的评分准确率不高,从而影响了推荐方法的准确性的问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于时间感知的商品评分模型构建方法,按照以下步骤执行:
步骤1、获取评价信息集,所述的评价信息集包括多个评价信息,所述的评价信息包括用户信息、商品信息、用户文本、商品文本以及用户对商品的评价时间;
获取用户对商品的评分,获得评分值,获得标签集;
步骤2、将所述的评价信息集作为输入,将所述的标签集作为输出,训练网络;
所述的网络包括依次串联的输入层、特征提取层、特征融合层、预测结果层以及结果输出层;
所述的输入层包括5个并行的输入模块,分别用于输入用户信息、商品信息、用户文本、商品文本以及评价时间,其中用于输入评价时间的输入模块中包括时间衰减函数;
所述的特征提取层包括5个并行的特征提取模块,分别是用户信息特征提取模块、商品信息特征提取模块、用户文本特征提取模块、商品文本特征提取模块以及评价时间特征提取模块;
其中用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的结构相同,均为神经网络;
用户文本特征提取模块以及商品文本特征提取模块的结构相同,均为文本卷积神经网络;
所述的特征融合层为全连接层;
所述的预测结果层为随机森林回归器;
获得商品评分模型。
进一步地,所述的用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的神经网络包括依次设置的嵌入层以及全连接层。
进一步地,所述的用户文本特征提取模块以及商品文本特征提取模块的文本卷积神经网络包括依次连接的嵌入层、卷积层、池化层以及输出层。
进一步地,所述的特征融合层中的全连接层的激活函数为Relu激活函数。
一种基于时间感知的商品推荐方法,用于获得商品推荐序列,按照以下方法执行:
步骤A、获得用户的用户信息以及用户文本;
获得每个商品的商品信息以及商品文本;
获得用户对每个商品的评价时间;
步骤B、将每个商品的商品信息、商品文本以及用户对每个商品的评价时间和用户的用户信息以及用户文本进行集合,获得每个商品的评价信息;
步骤C、将每个商品的评价信息输入至所述的基于时间感知的商品评分模型构建方法获得的商品评分模型中,获得每个商品的评分值;
步骤D、将每个商品的评分值从大到小进行排列,获得商品推荐序列。
一种基于时间感知的商品评分模型构建系统,包括数据获得装置以及模型构建装置;
所述的数据获得装置用于获取评价信息集,所述的评价信息集包括多个评价信息,所述的输入信息包括用户信息、商品信息、用户文本、商品文本以及用户对商品的评价时间;
获取用户对商品的评分,获得评分值,获得标签集;
所述的模型构建装置用于将所述的评价信息集作为输入,将所述的标签集作为输出,训练网络;
所述的网络包括依次串联的输入层、特征提取层、特征融合层、预测结果层以及结果输出层;
所述的输入层包括5个并行的输入模块,分别用于输入用户信息、商品信息、用户文本、商品文本以及评价时间,其中用于输入评价时间的输入模块中包括时间衰减函数;
所述的特征提取层包括5个并行的特征提取模块,分别是用户信息特征提取模块、商品信息特征提取模块、用户文本特征提取模块、商品文本特征提取模块以及评价时间特征提取模块;
其中用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的结构相同,均为神经网络;
用户文本特征提取模块以及商品文本特征提取模块的结构相同,均为文本卷积神经网络;
所述的特征融合层为全连接层;
所述的预测结果层为随机森林回归器;
获得商品评分模型。
进一步地,所述的用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的神经网络包括依次设置的嵌入层以及全连接层。
进一步地,所述的用户文本特征提取模块以及商品文本特征提取模块的文本卷积神经网络包括依次连接的嵌入层、卷积层、池化层以及输出层。
进一步地,所述的特征融合层中的全连接层的激活函数为Relu激活函数。
一种基于时间感知的商品推荐系统,包括信息获取装置、信息集合装置、打分装置以及排序装置;
所述的信息获取装置用于获得用户的用户信息以及用户文本;
获得每个商品的商品信息以及商品文本;
获得用户对每个商品的评价时间;
所述的信息集合装置用于将每个商品的商品信息、商品文本以及用户对每个商品的评价时间和用户的用户信息以及用户文本进行集合,获得每个商品的评价信息;
所述的打分装置用于将每个商品的评价信息输入至所述的基于时间感知的商品评分模型构建系统获得的商品评分模型中,获得每个商品的评分值;
所述的排序装置用于将每个商品的评分值从大到小进行排列,获得商品推荐序列。
本发明与现有技术相比具有以下技术效果:
1、本发明提供的一种基于时间感知的商品评分模型构建、推荐方法及系统基于卷积神经网络和随机森林回归,构建了一个融合时间信息、文本信息和其他用户项目结构化信息的评分模型,能够同时对各种形式的数据利用并进行推荐,提高了评分模型评分的准确率,从而提高了推荐方法的准确性;
2、本发明提供的一种基于时间感知的商品评分模型构建、推荐方法及系统在卷积神经网络中引入时间上下文信息,让推荐与用户对项目的评级时间紧密结合,提高了评分模型评分的准确率,从而提高了推荐方法的准确性;
3、本发明提供的一种基于时间感知的商品评分模型构建、推荐方法及系统采用随机森林回归模型预测项目评级,改善网络预测仅限于线性分割的缺点,提高评级预测的性能;同时还让预测结果更具有可解释性。
附图说明
图1为本发明提供的商品评分模型内部结构图。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。以便本领域的技术人员更好的理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
以下对本发明涉及的定义或概念内涵做以说明:
随机森林回归器是一种常用的机器学习回归方法,在预测方面性能优秀,所以经常用来做预测。随机森林回归器的实现大部分语言都有现成的程序包可以调用,本发明在实验中用的是python3.6版本里头的sklearn机器学习包,随机森林回归器用的话RandomForestRegressor,若使用其他语言,也可以用相应的程序包代替。
在本发明的实施例中,商品可以是具体存在的实体物品,也可以是一些虚拟物品,例如电影、电子期刊等。用户对商品的评分信息包含了用户对商品的评价。例如,用户观看一部电影后,根据对该部电影的喜爱程度,给出一个电影评分。
实施例一
本发明提供的一种基于时间感知的商品评分模型构建方法,如图1所示,在模型的第一阶段利用卷积神经网络超强的特征挖掘能力学习用户、商品以及评分信息的高维特征向量,本发明在此阶段还引入对商品评分预测关键的评分时间特征;在模型的第二阶段,通过卷积神经网络学习的高维特征向量训练随机森林回归器,来预测用户对商品的评分,从而根据预测的评分进行推荐。
按照以下步骤执行:
步骤1、获取评价信息集,所述的评价信息集包括多个评价信息,所述的输入信息包括用户信息、商品信息、用户文本、商品文本以及用户对商品的评价时间;
获取用户对商品的评分,获得评分值,获得标签集;
在本实施例中,操作人员可以通过系统提供的相关界面,输入收集到的用户对多个商品的评分信息,用户信息、商品信息、用户文本、商品文本以及用户对商品的评价时间;其中用户信息是能够标识用户的结构化信息,商品信息是能够标识商品的结构化信息,用户文本是对用户属性或其偏好进行描述的文本信息,商品文本是对商品属性或其内容进行描述的文本,用户对商品的评价时间是用户对已交互的商品进行打分的时间。
在本实施例中,一条评分信息就是一个用户对一个商品的评分信息,包括用户信息、商品信息,用户文本、商品文本以及这个用户对这个商品的评分时间,这条评分信息对应了一个评分值,即这个用户对这个商品的评分值。将多条评分信息进行集合,获得评价信息集,将这多条评分信息对应的评分值进行集合,获得标签集。
以电影推荐为例,用户信息包括用户ID,用户性别、用户年龄段,用户职业等,商品信息包括电影ID、电影题材等,用户文本包括用户标签、用户对商品的评论等,商品文本包括电影名称、电影内容的描述等,用户对商品的评价时间表示用户对电影进行打分的时间。比如公开的Movielens-1M数据集中有一条用户的数据是[5::M::25::20::55455],其中5表示用户ID,M表示用户性别是男,25表示用户年龄在25-34之间,20表示用户职业代码是20(Movielens数据集中职业代码20表示作家),55455表示用户所在地区的邮政编码。有一条商品的数据是[215::Before Sunrise(1995)::Drama|Romance],其中215表示电影的ID,Before Sunrise是电影名称,1995是电影的发布年份,Drama|Romance表示该部电影属于剧情和爱情类型。有一条评分数据[5::215::3::978245422],表示用户5对电影215的评分是3分,评分的时间戳是978245422,转换成北京时间也就是2000/12/31 14:50:22。
步骤2、将所述的评价信息集作为输入,将所述的标签集作为输出,训练网络;
所述的网络包括依次串联的输入层、特征提取层、特征融合层、预测结果层以及结果输出层;
所述的输入层包括5个并行的输入模块,分别用于输入用户信息、商品信息、用户文本、商品文本以及评价时间,其中用于输入评价时间的输入模块中包括时间衰减函数;
所述的特征提取层包括5个并行的特征提取模块,分别是用户信息特征提取模块、商品信息特征提取模块、用户文本特征提取模块、商品文本特征提取模块以及评价时间特征提取模块;
其中用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的结构相同,均为神经网络;
用户文本特征提取模块以及商品文本特征提取模块的结构相同,均为文本卷积神经网络;
所述的特征融合层为全连接层;
所述的预测结果层为随机森林回归器;
获得商品评分模型。
本实施例中提供的模型由五个部分构成:(1)输入部分:将用户和项目的信息以及评级时间作为输入,用户和项目的信息包括能够表示用户和项目的基本信息(例如,用户的性别,项目的类别等),也包括与用户和项目相关的文本信息(例如,项目的内容信息等);(2)特征学习部分:针对不同的特征,分别采用不同的方法进行学习。对于用户和项目的基本信息,将其转换成向量,之后通过嵌入层映射到稠密向量;对于用户和项目相关的文本信息,则通过文本卷积网络进行处理;对于评级时间特征,首先通过时间衰减函数进行处理,再通过网络层进行学习;(3)特征融合部分:此部分融合来自各种函数处理的特征,以实现更好的特征表示,在本实施例中主要是通过全连接层连接的方式将特征进行融合,之后通过Relu激活函数来获得更复杂的效果;(4)预测模型部分:这一部分是本发明预测评级的核心,选择随机森林回归模型进行预测;(5)输出部分:输出经过模型预测的用户对项目的评级结果。
在本实施例中基于卷积神经网络和随机森林回归,构建了一个融合时间信息、文本信息和其他用户项目结构化信息的评分模型,能够同时对各种形式的数据利用并进行推荐,提高了评分模型评分的准确率,从而提高了推荐方法的准确性。
在本实施例中考虑用户的兴趣随时间的变化,假设用户的兴趣随着时间衰减,时间离得越近,其行为越能反映用户近期的兴趣。又由于针对用户的推荐是基于当前时间的,所以用户近期的兴趣对推荐起更大的作用。基于此,本发明提出的方法用时间衰减函数表示用户兴趣随着时间的衰减:
其中,t为当前推荐时间,tij为用户i对项目j的评级时间,α为时间衰减因子。当时间衰减因子α=0时,T(t,tij)=1,也就是不考虑时间因素。从式I可以看出,当|t-tij|越大,即距当前推荐时间t越远,T(t,tij)则越小,反之,T(t,tij)则越大,所以T(t,tij)可以反映用户兴趣随时间的衰减。
在本实施例中将时间信息通过时间衰减函数的处理后输入网络,通过网络学习评级时间的特征向量,最终与用户向量和项目向量进行融合,从而获得与评级时间相关的高维特征向量。
本实施例在卷积神经网络中引入时间上下文信息,让推荐与用户对项目的评级时间紧密结合,提高了评分模型评分的准确率,从而提高了推荐方法的准确性。
可选地,所述的用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的卷积神经网络包括依次设置的嵌入层以及全连接层。
在本实施例中,由于用户信息、商品信息以及评价时间都是非文本数据,因此通过嵌入层和全连接层提取特征。
其中,嵌入层中将一个特征嵌入到另一个维度空间,只需要一个从X到Rn的线性映射:
f:X→Rn 式II
其中,X表示某个特征,f是将特征映射到n维分布向量的线性映射函数。卷积神经网络使用这种表示技术来分析文本数据和非文本数据。在嵌入层,特征被表示为嵌入矩阵以提取信息。
全连接层的节点与网络上一层的所有节点相连,作用是对前面提取的特征加权求和进行综合,其输出是网络上一层每个节点乘以权重系数W再加上偏置b。其中,a1,a2,a3,…,am是全连接层的输入,x1,x2,x3,…,xn-1,xn是全连接层的输出,可表示成如下矩阵形式:
其中,W表示全连接层的权重,a表示全连接层的输入,b表示全连接层的偏置,x表示全连接层的输出。
可选地,所述的用户文本特征提取模块以及商品文本特征提取模块的文本卷积神经网络包括依次连接的嵌入层、卷积层、池化层以及输出层。
在本实施例中,由于用户文本以及商品文本都是文本,因此采用卷积神经网络学习文本特征,在文本卷积神经网络中,为了提取文本的语义信息,首先将每个文本表示为一系列嵌入,其中文本可以是句子,段落和评论等。假设d表示包含n个单词的文本,通过嵌入层将每个单词映射到嵌入向量,可以得到:
其中,每个向量表示第i个单词的向量,以嵌入向量的形式表示文本,可以维持每个单词在文本中的顺序,从而展示一定的语义信息。一个由m个文本段组成的文档D可以表示为:
D=[d1,d2,d3,…,dm] 式V
在卷积层,主要来提取文本更突出的上下文特征,每个神经元在一个大小为ws的单词窗口上使用一个卷积核,通过卷积运算产生新的特征。卷积运算可用如下公式表示:
其中,di∈D表示第i个单词嵌入向量,Gi∈Rws×l表示第i个卷积核,l表示单词向量的大小,bi是偏置项,f是一个非线性激活函数,在卷积神经网络中,常用的非线性激活函数有sigmoid、tanh和整流线型单元Relu等,本发明选择Relu激活函数,这种激活函数可以避免梯度消失的问题。
卷积运算之后,每个卷积核将产生n-ws+1的特征映射c=[c1,c2,c3,…,cn-ws+1],在池化层,对某个卷积核Gi,在本实施例中将最大池操作应用到相应的特征映射上,并将特征的最大值作为新的特征,从而捕获了最突出的特征。
pi=max{c1,c2,c3,…,cn-ws+1} 式VII
由于一个卷积核可以提取一个特征,所以在本实施例中将多个卷积核提取的各个特征进行连接输出,最后合并成综合的特征向量。
P={p1,p2,p3,…,pt} 式VIII
其中,t为卷积层中卷积核的数量。
可选地,所述的特征融合层中的全连接层的激活函数为Relu激活函数。
在本实施例中,将经过预处理的特征(包括用户基本信息嵌入、项目基本信息嵌入以及评级时间嵌入等)通过全连接层的处理映射到同一个维度;将各个经过处理,已经映射到同一维度的特征采用连接的方式进行融合,获得更全面的特征表示;采用Relu激活函数对融合特征进行激活,以获得更复杂的效果。
在本实施例中,将学习的综合特征作为随机森林回归器的输入,利用训练集训练模型,不断调整模型参数,使用模型预测性能达到最优;
经过卷积神经网络的学习,已获得用户和项目与时间相关的综合特征表示,接下来的任务是评级预测,评级预测可转化为回归问题。可以继续利用网络来预测评级,网络预测的本质是逻辑回归,逻辑回归是一种广义的线性回归模型,但已存在的评级数据明显是非线性的,在本实施例中采取随机森林回归模型作为整体模型的预测部分,主要有以下四个原因:(1)从网络中学习的综合特征之间可能存在潜在的相关性,但这些相关性没法准确地确定,所以需要预测算法对特征之间多重共线性不敏感。随机森林回归算法对特征之间的相关性不敏感,也不用进行特征选择,非常适合本发明。(2)随机森林回归算法对数据要求不严格,线性数据和非线性数据都能达到好的预测效果,适用于推荐系统中的非线性离散数据;(3)随机森林回归算法可以计算所有特征的重要性,有助于提高评级预测的准确性;(4)随机森林回归算法更接近人的思维方式,产生的预测结果更具有可解释性,同时随机森林还有抗过拟合的能力。
本发明提供的基于卷积神经网络和随机森林回归的时间感知评分模型构建方法与现有经典的方法得出的结果相比,其均方误差对比结果如表1所示,均方误差值越小方法的预测性能越好。从表1可以看出,本发明提出的基于卷积神经网络和随机森林回归的时间感知评级预测方法在Movielens的公开的三个数据集上都是最优的,证明了本发明提出的基于卷积神经网络和随机森林回归的时间感知评级预测方法在推荐系统中的评级预测问题上具有更好的预测性能。
表1本发明提供的评分模型构建方法与其他经典方法的性能对比
实施例二
一种基于时间感知的商品推荐方法,用于获得商品推荐序列,按照以下方法执行:
步骤A、获得用户的用户信息以及用户文本;
获得每个商品的商品信息以及商品文本;
获得用户对每个商品的评价时间;
步骤B、将每个商品的商品信息、商品文本以及用户对每个商品的评价时间和用户的用户信息以及用户文本进行集合,获得每个商品的评价信息;
步骤C、将每个商品的评价信息输入至实施例一中基于时间感知的商品评分模型构建方法获得的商品评分模型中,获得每个商品的评分值;
步骤D、将每个商品的评分值从大到小进行排列,获得商品推荐序列。
在本实施例中,用户对每个商品评分为[1:1.4212,2:1.2003,3:1.6987,4:1.5432],按照数值从大到小进行排序,获得[3:1.6987,4:1.5432,1:1.4212,2:1.2003],其对应的用户的商品推荐序列为[3,4,1,2]。
实施例三
一种基于时间感知的商品评分模型构建系统,包括数据获得装置以及模型构建装置;
所述的数据获得装置用于获取评价信息集,所述的评价信息集包括多个评价信息,所述的输入信息包括用户信息、商品信息、用户文本、商品文本以及用户对商品的评价时间;
获取用户对商品的评分,获得评分值,获得标签集;
所述的模型构建装置用于将所述的评价信息集作为输入,将所述的标签集作为输出,训练网络;
所述的网络包括依次串联的输入层、特征提取层、特征融合层、预测结果层以及结果输出层;
所述的输入层包括5个并行的输入模块,分别用于输入用户信息、商品信息、用户文本、商品文本以及评价时间,其中用于输入用户对商品评价时间的输入模块中包括时间衰减函数;
所述的特征提取层包括5个并行的特征提取模块,分别是用户信息特征提取模块、商品信息特征提取模块、用户文本特征提取模块、商品文本特征提取模块以及评价时间特征提取模块;
其中用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的结构相同,均为神经网络;
用户文本特征提取模块以及商品文本特征提取模块的结构相同,均为文本卷积神经网络;
所述的特征融合层为全连接层;
所述的预测结果层为随机森林回归器;
获得商品评分模型。
可选地,所述的用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的卷积神经网络包括依次设置的嵌入层以及全连接层。
可选地,所述的用户文本特征提取模块以及商品文本特征提取模块的文本卷积神经网络包括依次连接的嵌入层、卷积层、池化层以及输出层。
可选地,所述的特征融合层中的全连接层的激活函数为Relu激活函数。
在本实施例中,商品评分模型构建系统可以部署在本地服务器也可以是远程云服务器。
实施例四
一种基于时间感知的商品推荐系统,包括信息获取装置、信息集合装置、打分装置以及排序装置;
所述的信息获取装置用于获得用户的用户信息以及用户文本;
获得每个商品的商品信息以及商品文本;
获得用户对每个商品的评价时间;
所述的信息集合装置用于将每个商品的商品信息、商品文本以及用户对每个商品的评价时间和用户的用户信息以及用户文本进行集合,获得每个商品的评价信息;
所述的打分装置用于将每个商品的评价信息输入至实施例三中的基于时间感知的商品评分模型构建系统获得的商品评分模型中,获得每个商品的评分值;
所述的排序装置用于将每个商品的评分值从大到小进行排列,获得商品推荐序列。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
Claims (10)
1.一种基于时间感知的商品评分模型构建方法,其特征在于,按照以下步骤执行:
步骤1、获取评价信息集,所述的评价信息集包括多个评价信息,所述的评价信息包括用户信息、商品信息、用户文本、商品文本以及用户对商品的评价时间;
获取用户对商品的评分,获得评分值,获得标签集;
步骤2、将所述的评价信息集作为输入,将所述的标签集作为输出,训练网络;
所述的网络包括依次串联的输入层、特征提取层、特征融合层、预测结果层以及结果输出层;
所述的输入层包括5个并行的输入模块,分别用于输入用户信息、商品信息、用户文本、商品文本以及评价时间,其中用于输入评价时间的输入模块中包括时间衰减函数;
所述的特征提取层包括5个并行的特征提取模块,分别是用户信息特征提取模块、商品信息特征提取模块、用户文本特征提取模块、商品文本特征提取模块以及评价时间特征提取模块;
其中用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的结构相同,均为神经网络;
用户文本特征提取模块以及商品文本特征提取模块的结构相同,均为文本卷积神经网络;
所述的特征融合层为全连接层;
所述的预测结果层为随机森林回归器;
获得商品评分模型。
2.如权利要求1所述的基于时间感知的商品评分模型构建方法,其特征在于,所述的用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的神经网络包括依次设置的嵌入层以及全连接层。
3.如权利要求1所述的基于时间感知的商品评分模型构建方法,其特征在于,所述的用户文本特征提取模块以及商品文本特征提取模块的文本卷积神经网络包括依次连接的嵌入层、卷积层、池化层以及输出层。
4.如权利要求1所述的基于时间感知的商品评分模型构建方法,其特征在于,所述的特征融合层中的全连接层的激活函数为Relu激活函数。
5.一种基于时间感知的商品推荐方法,用于获得商品推荐序列,其特征在于,按照以下方法执行:
步骤A、获得用户的用户信息以及用户文本;
获得每个商品的商品信息以及商品文本;
获得用户对每个商品的评价时间;
步骤B、将每个商品的商品信息、商品文本以及用户对每个商品的评价时间和用户的用户信息以及用户文本进行集合,获得每个商品的评价信息;
步骤C、将每个商品的评价信息输入至权利要求1-4任一项权利要求所述的基于时间感知的商品评分模型构建方法获得的商品评分模型中,获得每个商品的评分值;
步骤D、将每个商品的评分值从大到小进行排列,获得商品推荐序列。
6.一种基于时间感知的商品评分模型构建系统,其特征在于,包括数据获得装置以及模型构建装置;
所述的数据获得装置用于获取评价信息集,所述的评价信息集包括多个评价信息,所述的输入信息包括用户信息、商品信息、用户文本、商品文本以及用户对商品的评价时间;
获取用户对商品的评分,获得评分值,获得标签集;
所述的模型构建装置用于将所述的评价信息集作为输入,将所述的标签集作为输出,训练网络;
所述的网络包括依次串联的输入层、特征提取层、特征融合层、预测结果层以及结果输出层;
所述的输入层包括5个并行的输入模块,分别用于输入用户信息、商品信息、用户文本、商品文本以及评价时间,其中用于输入评价时间的输入模块中包括时间衰减函数;
所述的特征提取层包括5个并行的特征提取模块,分别是用户信息特征提取模块、商品信息特征提取模块、用户文本特征提取模块、商品文本特征提取模块以及评价时间特征提取模块;
其中用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的结构相同,均为神经网络;
用户文本特征提取模块以及商品文本特征提取模块的结构相同,均为文本卷积神经网络;
所述的特征融合层为全连接层;
所述的预测结果层为随机森林回归器;
获得商品评分模型。
7.如权利要求6所述的基于时间感知的商品评分模型构建系统,其特征在于,所述的用户信息特征提取模块、商品信息特征提取模块以及评价时间特征提取模块的神经网络包括依次设置的嵌入层以及全连接层。
8.如权利要求7所述的基于时间感知的商品评分模型构建系统,其特征在于,所述的用户文本特征提取模块以及商品文本特征提取模块的文本卷积神经网络包括依次连接的嵌入层、卷积层、池化层以及输出层。
9.如权利要求7所述的基于时间感知的商品评分模型构建系统,其特征在于,所述的特征融合层中的全连接层的激活函数为Relu激活函数。
10.一种基于时间感知的商品推荐系统,其特征在于,包括信息获取装置、信息集合装置、打分装置以及排序装置;
所述的信息获取装置用于获得用户的用户信息以及用户文本;
获得每个商品的商品信息以及商品文本;
获得用户对每个商品的评价时间;
所述的信息集合装置用于将每个商品的商品信息、商品文本以及用户对每个商品的评价时间和用户的用户信息以及用户文本进行集合,获得每个商品的评价信息;
所述的打分装置用于将每个商品的评价信息输入至权利要求6-9任一项权利要求所述的基于时间感知的商品评分模型构建系统获得的商品评分模型中,获得每个商品的评分值;
所述的排序装置用于将每个商品的评分值从大到小进行排列,获得商品推荐序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910609155.8A CN110490686A (zh) | 2019-07-08 | 2019-07-08 | 一种基于时间感知的商品评分模型构建、推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910609155.8A CN110490686A (zh) | 2019-07-08 | 2019-07-08 | 一种基于时间感知的商品评分模型构建、推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110490686A true CN110490686A (zh) | 2019-11-22 |
Family
ID=68546724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910609155.8A Pending CN110490686A (zh) | 2019-07-08 | 2019-07-08 | 一种基于时间感知的商品评分模型构建、推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490686A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178986A (zh) * | 2020-02-18 | 2020-05-19 | 电子科技大学 | 用户-商品偏好的预测方法及系统 |
CN111651672A (zh) * | 2020-05-27 | 2020-09-11 | 福建博思软件股份有限公司 | 一种基于深度学习的分时段用户活动推荐方法及装置 |
CN111768389A (zh) * | 2020-07-01 | 2020-10-13 | 武汉楚精灵医疗科技有限公司 | 基于卷积神经网络和随机森林的消化道操作自动计时方法 |
CN112364663A (zh) * | 2020-11-16 | 2021-02-12 | 上海优扬新媒信息技术有限公司 | 用户特征的识别方法、装置、设备以及存储介质 |
CN112484776A (zh) * | 2020-11-18 | 2021-03-12 | 成都信息工程大学 | 静止卫星逐小时近地面大气细颗粒物估算方法 |
CN112818248A (zh) * | 2021-02-26 | 2021-05-18 | 西北大学 | 一种基于情感的物品推荐模型构建、推荐方法及系统 |
CN117788105A (zh) * | 2023-12-25 | 2024-03-29 | 公安县谦合广告装饰有限公司 | 一种基于互联网的电商在线直播方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056427A (zh) * | 2016-05-25 | 2016-10-26 | 中南大学 | 一种基于Spark的大数据混合模型的移动推荐方法 |
US9813512B2 (en) * | 2015-04-20 | 2017-11-07 | Agverdict, Inc. | Systems and methods for efficiently generating a geospatial data map for use in agricultural operations |
CN109064294A (zh) * | 2018-08-21 | 2018-12-21 | 重庆大学 | 一种融合时间因素、文本特征和相关性的药品推荐方法 |
CN109739986A (zh) * | 2018-12-28 | 2019-05-10 | 合肥工业大学 | 一种基于深度集成学习的投诉短文本分类方法 |
CN109977299A (zh) * | 2019-02-21 | 2019-07-05 | 西北大学 | 一种融合项目热度和专家系数的推荐算法 |
-
2019
- 2019-07-08 CN CN201910609155.8A patent/CN110490686A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9813512B2 (en) * | 2015-04-20 | 2017-11-07 | Agverdict, Inc. | Systems and methods for efficiently generating a geospatial data map for use in agricultural operations |
CN106056427A (zh) * | 2016-05-25 | 2016-10-26 | 中南大学 | 一种基于Spark的大数据混合模型的移动推荐方法 |
CN109064294A (zh) * | 2018-08-21 | 2018-12-21 | 重庆大学 | 一种融合时间因素、文本特征和相关性的药品推荐方法 |
CN109739986A (zh) * | 2018-12-28 | 2019-05-10 | 合肥工业大学 | 一种基于深度集成学习的投诉短文本分类方法 |
CN109977299A (zh) * | 2019-02-21 | 2019-07-05 | 西北大学 | 一种融合项目热度和专家系数的推荐算法 |
Non-Patent Citations (2)
Title |
---|
ALIEXIE2869: "基于卷积神经网络CNN的电影推荐系统", 《HTTPS://BLOG.CSDN.NET/ALIEXIE2869/ARTICLE/DETAILS/101141112》 * |
康琦,吴启迪著: "《机器学习中的不平衡分类方法》", 31 October 2017 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178986A (zh) * | 2020-02-18 | 2020-05-19 | 电子科技大学 | 用户-商品偏好的预测方法及系统 |
CN111178986B (zh) * | 2020-02-18 | 2023-04-07 | 电子科技大学 | 用户-商品偏好的预测方法及系统 |
CN111651672A (zh) * | 2020-05-27 | 2020-09-11 | 福建博思软件股份有限公司 | 一种基于深度学习的分时段用户活动推荐方法及装置 |
CN111768389A (zh) * | 2020-07-01 | 2020-10-13 | 武汉楚精灵医疗科技有限公司 | 基于卷积神经网络和随机森林的消化道操作自动计时方法 |
CN112364663A (zh) * | 2020-11-16 | 2021-02-12 | 上海优扬新媒信息技术有限公司 | 用户特征的识别方法、装置、设备以及存储介质 |
CN112364663B (zh) * | 2020-11-16 | 2023-05-26 | 度小满科技(北京)有限公司 | 用户特征的识别方法、装置、设备以及存储介质 |
CN112484776A (zh) * | 2020-11-18 | 2021-03-12 | 成都信息工程大学 | 静止卫星逐小时近地面大气细颗粒物估算方法 |
CN112818248A (zh) * | 2021-02-26 | 2021-05-18 | 西北大学 | 一种基于情感的物品推荐模型构建、推荐方法及系统 |
CN112818248B (zh) * | 2021-02-26 | 2023-04-18 | 西北大学 | 一种基于情感的物品推荐模型构建、推荐方法及系统 |
CN117788105A (zh) * | 2023-12-25 | 2024-03-29 | 公安县谦合广告装饰有限公司 | 一种基于互联网的电商在线直播方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490686A (zh) | 一种基于时间感知的商品评分模型构建、推荐方法及系统 | |
CN105069102B (zh) | 信息推送方法和装置 | |
US20220198516A1 (en) | Data recommendation method and apparatus, computer device, and storage medium | |
CN103324665B (zh) | 一种基于微博的热点信息提取的方法和装置 | |
JP2022508163A (ja) | ユーザタグ生成方法並びにその、装置、コンピュータプログラム及びコンピュータ機器 | |
CN109983455A (zh) | 在在线社交网络上多样化媒体搜索结果 | |
CN108073568A (zh) | 关键词提取方法和装置 | |
CN106062730A (zh) | 用于主动构成内容以便在连续社交通信中使用的系统和方法 | |
CN106294758A (zh) | 基于用户认知度变化的协同推荐方法 | |
CN107357793A (zh) | 信息推荐方法和装置 | |
CN105426514A (zh) | 个性化的移动应用app推荐方法 | |
CN106844632A (zh) | 基于改进支持向量机的产品评论情感分类方法及装置 | |
CN102930048B (zh) | 使用参考和视觉数据的语义自动发现的数据丰富 | |
CN110263822A (zh) | 一种基于多任务学习方式的图像情感分析方法 | |
Yang et al. | A decision method for online purchases considering dynamic information preference based on sentiment orientation classification and discrete DIFWA operators | |
CN107077640A (zh) | 经由经验归属来分析、资格化和摄取非结构化数据源的系统和处理 | |
Tayal et al. | Personalized ranking of products using aspect-based sentiment analysis and Plithogenic sets | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN104008204A (zh) | 一种动态的多维情境感知电影推荐系统及其实现方法 | |
CN114328798B (zh) | 搜索文本的处理方法、装置、设备、存储介质和程序产品 | |
Shen et al. | Diversified query generation guided by knowledge graph | |
Prakash et al. | Did You Know?-Mining Interesting Trivia for Entities from Wikipedia. | |
JP5302614B2 (ja) | 施設関連情報の検索データベース形成方法および施設関連情報検索システム | |
KR101007056B1 (ko) | 연관 태그에 기반한 태그 클러스터링 장치 및 그 방법 | |
Hiniker et al. | Toward the operationalization of visual metaphor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191122 |