CN113688167A - 基于深度兴趣网络的深度兴趣捕获模型构建方法及装置 - Google Patents
基于深度兴趣网络的深度兴趣捕获模型构建方法及装置 Download PDFInfo
- Publication number
- CN113688167A CN113688167A CN202110961484.6A CN202110961484A CN113688167A CN 113688167 A CN113688167 A CN 113688167A CN 202110961484 A CN202110961484 A CN 202110961484A CN 113688167 A CN113688167 A CN 113688167A
- Authority
- CN
- China
- Prior art keywords
- deep interest
- user
- capture model
- deep
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims description 14
- 238000012549 training Methods 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 45
- 239000013598 vector Substances 0.000 claims description 40
- 230000006399 behavior Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 14
- 239000000463 material Substances 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000004075 alteration Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000000790 scattering method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种深度兴趣捕获模型构建方法、介质、设备及装置,其中方法包括:获取用户信息和用户的历史点击数据,并生成训练数据;训练得到深度兴趣捕获模型。本发明通过获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;接着,根据所述训练数据进行模型训练,以得到深度兴趣捕获模型。可以基于该深度兴趣捕获模型准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
Description
本申请是申请日为2021年1月15日、名称为“基于深度兴趣网络的专题推荐方法及装置”、申请号为“2021100548410”的分案申请。
技术领域
本发明涉及深度学习技术领域,特别涉及一种基于深度学习网络的深度兴趣捕获模型构建方法、一种计算机可读存储介质、一种计算机设备以及一种基于深度兴趣网络的深度兴趣捕获模型构建装置。
背景技术
相关技术中,在需要为用户推荐相应的专题时,多采用画像的方式;即言,首先,基于规则统计出用户对于不同专题的偏好得分;然后,将用户最偏好的类目下的专题进行优先展示,以完成专题的推荐;然而,这种方式对于专题对应的标签依赖性强,为了提高专题推荐的准确性,必然需要耗费大量的人力物力来建立高质量的标签。
发明内容
本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的一个目的在于提出一种基于深度兴趣网络的深度兴趣捕获模型构建方法,能够在无需建立专题对应的标签的前提下,可以基于该深度兴趣捕获模型准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
为达到上述目的,本发明第一方面实施例提出了一种基于深度兴趣网络的深度兴趣捕获模型构建方法,包括以下步骤:获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;
根据所述训练数据进行模型训练,以得到深度兴趣捕获模型。
根据本发明实施例的基于深度兴趣网络的深度兴趣捕获模型构建方法,首先,获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;接着,根据所述训练数据进行模型训练,以得到深度兴趣捕获模型。可以基于该深度兴趣捕获模型准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
为达到上述目的,本发明第二方面实施例提出了一种计算机可读存储介质,其上存储有基于深度兴趣网络的深度兴趣捕获模型构建程序,该基于深度兴趣网络的专题推荐程序被处理器执行时实现上述的深度兴趣捕获模型构建方法。
为达到上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述的基于深度兴趣网络的深度兴趣捕获模型构建方法。
为达到上述目的,本发明第四方面实施例提出了一种基于深度兴趣网络的深度兴趣捕获模型构建装置,包括:获取模块,所述获取模块用于获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;训练模块,所述训练模块用于根据所述训练数据进行模型训练,以得到深度兴趣捕获模型。
根据本发明实施例的基于深度兴趣网络的深度兴趣捕获模型构建装置,通过获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;接着,根据所述训练数据进行模型训练,以得到深度兴趣捕获模型。可以基于该深度兴趣捕获模型准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
附图说明
图1为根据本发明实施例的基于深度兴趣网络的专题推荐方法的流程示意图;
图2为根据本发明实施例的深度兴趣捕获模型的结构示意图;
图3为根据本发明实施例的基于深度兴趣网络的专题推荐装置的方框示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
相关技术中,对专题进行推荐时,对于专题对应的标签依赖性强,为了提高专题推荐的准确性,必然需要耗费大量的人力物力来建立高质量的标签;根据本发明实施例的基于深度兴趣网络的专题推荐方法,首先,获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;接着,根据所述训练数据进行模型训练,以得到深度兴趣捕获模型;然后,获取物品对应的物品信息,并将所述物品信息输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的物品向量,以及根据每个物品对应的物品向量计算专题向量;接着,获取用户的待分析点击数据,并将所述待分析点击数据输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的用户向量;然后,根据所述用户向量和所述专题向量进行相似性检索,并根据检索结果确定专题推荐列表,以及将所述专题推荐列表推送给该用户;从而实现在无需建立专题对应的标签的前提下,准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
图1为根据本发明实施例的基于深度兴趣网络的专题推荐方法的流程示意图,如图1 所示,该基于深度兴趣网络的专题推荐方法包括以下步骤:
S101,获取用户信息和用户的历史点击数据,并根据用户信息和历史点击数据生成训练数据。
其中,用户的历史点击数据的选择方式可以有多种。
作为一种示例,用户的历史点击数据包括用户的曝光日志和点击行为日志,其中,曝光日志中记录了某个物品对某个用户当天是否曝光,而点击行为日志记载了用户的点击行为对应的信息。
作为另一种示例,用户的历史点击数据包括用户每次历史点击行为对应的物品信息、时间信息和各历史点击行为之间的排序信息。即言,该用户的历史点击数据中仅包含了用户点击行为所对应的信息,而不包含曝光信息;需要说明的是,在实际场景中,由于不同页面具有不同的深度,使得不同深度的页面点击率差异较大,访问深度越深的页面往往点击率越高;因此,为了避免不同深度的页面造成点击率的差异这一影响,该历史点击数据中不包含曝光信息。
其中,训练数据的设置方式可以有多种。
作为一种示例,训练数据包括离散型特征、连续型特征和序列特征;其中,离散型特征包括时间信息、用户属性信息和物品分类信息,连续型特征包括用户历史点击物品分类统计信息,序列特征包括用户历史点击行为对应的物品信息序列。具体地,离散型特征包括日期信息(例如,星期几、是否是工作日、是否为工作时段等)、物品ID、物品分类ID 和物品属性ID等,需要说明的是,根据离散型特征分类较少的特性,可以通过ONE-HOT进行编码处理;连续型特征包括用户历史对不同属性的点击次数,该类特征可以不经过处理,而直接输入连续型的值;序列特征包括用户历史点击物品ID序列、历史点击分类ID序列。
在一些实施例中,训练数据还包括样本时间特征,其中,根据用户信息和历史点击数据生成训练数据,包括:根据用户信息和历史点击数据生成训练样本,并计算训练样本与当前时间之间的时间差值,以及判断该时间差值是否大于预设的时间阈值,以便将判断结果作为样本时间特征。
可以理解,由于训练数据中包含时间信息,即上下文特征包括星期几、是否是工作日等,在模型的训练过程中,及时将训练样本进行充分打散,也会使得训练过程不够稳定;此时,由于时间因素的影响,样本会对模型产生很大的影响,样本距离测试日期越近,其所起到的作用越大;因此,增加了样本时间特征,以保证模型训练过程中的稳定性。
在一些实施例中,根据用户信息和历史点击数据生成训练数据,包括:
统计每个物品对应的被点击次数,并根据统计结果确定每个物品对应的负样本选取概率,以及根据每个物品对应的负样本选取概率进行负样本的随机选择。可以理解,在训练过程中需要进行负样本的选取,以顺利进行模型的训练。其中,负样本的选取方式可以有多种。例如,直接以随机的方式在正样本中选取预设个数的负样本;优选地,可以通过上述方式进行每个物品对应的点击次数的统计,以确定该物品被选为负样本的概率;从而,使得越热门的物品被选为负样本的概率越大,使得最终训练得到的模型的准确率更高。
在一些实施例中,为了避免softmax函数计算量过大的问题,将序列特征设置为二分类的形式;即言,当输入的物品ID为用户下一次点击的物品ID时,则标签为1,否则为0。具体地,假设用户点击的物品序列为[1,2,3,4,5,6],则序列特征构造如表1所示:
表1
S102,根据训练数据进行模型训练,以得到深度兴趣捕获模型。
为了便于理解,以图2为例,图2为本发明一实施例的深度兴趣捕获模型的结构示意图;如图2所示,在该实施例中,将序列特征、离散型特征和连续型特征进行拼接,拼接后通过BatchNormalization层,然后输入到多层全连接层,每层全连接层后会接BatchNormalization层和Dice激活函数,最终得到用户向量。
在一些实施例中,模型训练时,采用Adagrad优化器,初始学习率为0.1,学习率每50000步衰减到原来的1/2,Batch size为128。并且为了使模型训练更稳定,在Embedding层和DNN层都会加L2正则化参数,将正则损失一起加入到损失函数中进行优化。
S103,获取物品对应的物品信息,并将物品信息输入到深度兴趣捕获模型,以通过深度兴趣捕获模型输出对应的物品向量,以及根据每个物品对应的物品向量计算专题向量。
可以理解,每个专题都会包含不同个数的物品,而专题是同一分类物品的集合;例如,专题为体育,则该专题对应的物品可以包括:足球、篮球、游泳等。其中,根据每个物品对应的物品向量计算专题向量的方式可以有多种;例如,在得到物品向量之后,对该专题下所有物品的物品向量进行平均池化,以将池化结果作为该专题的专题向量。
S104,获取用户的待分析点击数据,并将待分析点击数据输入到深度兴趣捕获模型,以通过深度兴趣捕获模型输出对应的用户向量。
S105,根据用户向量和专题向量进行相似性检索,并根据检索结果确定专题推荐列表,以及将专题推荐列表推送给该用户。
在一些实施例中,根据检索结果确定专题推荐列表,包括:根据kmeas聚类算法对专题进行聚类,以生成多个专题类别;根据检索结果生成待推荐专题列表,并根据多个专题类别和滑窗打散法对待推荐专题列表进行打散处理,以生成最终专题推荐列表。
可以理解,在根据检索结果生成待推荐专题列表之后,该待推荐专题列表中,可能存在同一窗口下出现多个同一类别的专题,这将给用户带来不好的体验;因此,为了保障用户体验,通过滑窗打散法和专题的聚类结果对待推荐专题列表进行打散处理,以使得同一窗口下专题的类别不同,以确定最终专题推荐列表。
具体地,如表2所示:
表2
如表2所示,假如用户001得到的专题排序为1|2|3|4|5|6|7|8|9,专题所属类别序列为A|A|A|B|C|B|B|D|D。假设滑动窗口的大小为3,表示相邻3个位置放置的专题类别不重复。则:
第一步,第一个滑窗内的类别为A,A,A,位置索引从0开始计数,则需要将第1和第2位置的列表进行打散处理,从第3个位置往后遍历,第一个不同类别为B,则将第1个位置的A和第3个位置的B进行交换,则专题类别序列变为A|B|A|A|C|B|B|D|D,然后将专题 id序列第1和第3位置进行交换。
第二步,第一个滑窗内的类别变为A,B,A,则第2个位置需要处理,从第4个位置开始往后遍历,第一个不同类目为第4个位置的C,所以将位置2和位置4进行交换,则专题类目id序列变为A|B|C|A|A|B|B|D|D,专题Id序列为1|4|5|2|3|6|7|8|9。
第三步,第二个滑窗内的类别序列为B,C,A,则不需要处理,窗口继续向前滑动,第三个窗口为C,A,A,则第4个位置的A需要处理,和位置5进行交换,专题类目ID序列变成 A|B|C|A|B|A|B|D|D想,专题id序列变成1|4|5|2|6|3|7|8|9,以此类推,直到序列完成或者已打散长度达到阈值。
综上所述,根据本发明实施例的基于深度兴趣网络的专题推荐方法,首先,获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;接着,根据所述训练数据进行模型训练,以得到深度兴趣捕获模型;然后,获取物品对应的物品信息,并将所述物品信息输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的物品向量,以及根据每个物品对应的物品向量计算专题向量;接着,获取用户的待分析点击数据,并将所述待分析点击数据输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的用户向量;然后,根据所述用户向量和所述专题向量进行相似性检索,并根据检索结果确定专题推荐列表,以及将所述专题推荐列表推送给该用户;从而实现在无需建立专题对应的标签的前提下,准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
为了实现上述实施例,本发明实施例提出了一种计算机可读存储介质,其上存储有基于深度兴趣网络的专题推荐程序,该基于深度兴趣网络的专题推荐程序被处理器执行时实现如上述的基于深度兴趣网络的专题推荐方法。
根据本发明实施例的计算机可读存储介质,通过存储基于深度兴趣网络的专题推荐程序,以使得处理器在执行该基于深度兴趣网络的专题推荐程序时,实现如上述的基于深度兴趣网络的专题推荐方法,从而实现在无需建立专题对应的标签的前提下,准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
为了实现上述实施例,本发明实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述的基于深度兴趣网络的专题推荐方法。
根据本发明实施例的计算机设备,通过存储器对基于深度兴趣网络的专题推荐程序进行存储,以使得处理器在执行该基于深度兴趣网络的专题推荐程序时,实现如上述的基于深度兴趣网络的专题推荐方法,从而实现在无需建立专题对应的标签的前提下,准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
为了实现上述实施例,本发明实施例提出了一种基于深度兴趣网络的专题推荐装置,如图3所示,该基于深度兴趣网络的专题推荐装置包括:获取模块10、训练模块20、兴趣捕获模块30和推荐模块40。
其中,获取模块10用于获取用户信息和用户的历史点击数据,并根据用户信息和历史点击数据生成训练数据;
训练模块20用于根据训练数据进行模型训练,以得到深度兴趣捕获模型;
兴趣捕获模块30用于获取物品对应的物品信息,并将物品信息输入到深度兴趣捕获模型,以通过深度兴趣捕获模型输出对应的物品向量,以及根据每个物品对应的物品向量计算专题向量;
兴趣捕获模块30还用于获取用户的待分析点击数据,并将待分析点击数据输入到深度兴趣捕获模型,以通过深度兴趣捕获模型输出对应的用户向量;
推荐模块40用于根据用户向量和专题向量进行相似性检索,并根据检索结果确定专题推荐列表,以及将专题推荐列表推送给该用户。
在一些实施例中,用户的历史点击数据包括用户每次历史点击行为对应的物品信息、时间信息和各历史点击行为之间的排序信息。
需要说明的是,上述关于图1中基于深度兴趣网络的专题推荐方法的描述同样适用于该基于深度兴趣网络的专题推荐装置,在此不做赘述。
综上所述,根据本发明实施例的基于深度兴趣网络的专题推荐装置,通过设置获取模块用于获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;训练模块用于根据所述训练数据进行模型训练,以得到深度兴趣捕获模型;兴趣捕获模块用于获取物品对应的物品信息,并将所述物品信息输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的物品向量,以及根据每个物品对应的物品向量计算专题向量;兴趣捕获模块还用于获取用户的待分析点击数据,并将所述待分析点击数据输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的用户向量;推荐模块用于根据所述用户向量和所述专题向量进行相似性检索,并根据检索结果确定专题推荐列表,以及将所述专题推荐列表推送给该用户;从而实现在无需建立专题对应的标签的前提下,准确地对用户进行专题推荐,降低专题推荐过程中所需耗费的人力和物力。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种深度兴趣捕获模型构建方法,其特征在于,包括以下步骤:
获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;
根据所述训练数据进行模型训练,以得到深度兴趣捕获模型。
2.如权利要求1所述的深度兴趣捕获模型构建方法,其特征在于,所述深度兴趣捕获模型构建方法进一步包括:
获取物品对应的物品信息,并将所述物品信息输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的物品向量,以及根据每个物品对应的物品向量计算专题向量;
获取用户的待分析点击数据,并将所述待分析点击数据输入到所述深度兴趣捕获模型,以通过所述深度兴趣捕获模型输出对应的用户向量。
3.如权利要求1所述的深度兴趣捕获模型构建方法,其特征在于,所述用户的历史点击数据包括用户每次历史点击行为对应的物品信息、时间信息和各历史点击行为之间的排序信息;或所述用户的历史点击数据包括用户的曝光日志和点击行为日志,所述曝光日志中记录了某个物品对某个用户当天是否曝光,而所述点击行为日志记载了用户的点击行为对应的信息。
4.如权利要求1所述的深度兴趣捕获模型构建方法,其特征在于,所述训练数据包括离散型特征、连续型特征和序列特征;
其中,所述离散型特征包括时间信息、用户属性信息和物品分类信息,所述连续型特征包括用户历史点击物品分类统计信息,所述序列特征包括用户历史点击行为对应的物品信息序列。
5.如权利要求4所述的深度兴趣捕获模型构建方法,其特征在于,所述深度兴趣捕获模型包括:
BatchNormalization层,其用于将所述序列特征、所述离散型特征和所述连续型特征进行拼接;以及
多层全连接层,每层全连接层后接BatchNormalization层和Dice激活函数。
6.如权利要求5所述的深度兴趣捕获模型构建方法,其特征在于,所述深度兴趣捕获模型包括:3层所述全连接层。
7.一种计算机可读存储介质,其特征在于,其上存储有基于深度兴趣网络的深度兴趣捕获模型构建程序,该基于深度兴趣网络的专题推荐程序被处理器执行时实现如权利要求1-6中任一项所述的深度兴趣捕获模型构建方法。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-6中任一项所述的深度兴趣捕获模型构建方法。
9.一种基于深度兴趣网络的深度兴趣捕获模型构建装置,其特征在于,包括:
获取模块,所述获取模块用于获取用户信息和用户的历史点击数据,并根据所述用户信息和所述历史点击数据生成训练数据;
训练模块,所述训练模块用于根据所述训练数据进行模型训练,以得到深度兴趣捕获模型。
10.如权利要求9所述基于深度兴趣网络的深度兴趣捕获模型构建装置,其特征在于,所述深度兴趣捕获模型包括:
BatchNormalization层,其用于将序列特征、离散型特征和连续型特征进行拼接;以及
多层全连接层,每层全连接层后接BatchNormalization层和Dice激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110961484.6A CN113688167A (zh) | 2021-01-15 | 2021-01-15 | 基于深度兴趣网络的深度兴趣捕获模型构建方法及装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110054841.0A CN112800097A (zh) | 2021-01-15 | 2021-01-15 | 基于深度兴趣网络的专题推荐方法及装置 |
CN202110961484.6A CN113688167A (zh) | 2021-01-15 | 2021-01-15 | 基于深度兴趣网络的深度兴趣捕获模型构建方法及装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110054841.0A Division CN112800097A (zh) | 2021-01-15 | 2021-01-15 | 基于深度兴趣网络的专题推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113688167A true CN113688167A (zh) | 2021-11-23 |
Family
ID=75809601
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110054841.0A Pending CN112800097A (zh) | 2021-01-15 | 2021-01-15 | 基于深度兴趣网络的专题推荐方法及装置 |
CN202110961484.6A Pending CN113688167A (zh) | 2021-01-15 | 2021-01-15 | 基于深度兴趣网络的深度兴趣捕获模型构建方法及装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110054841.0A Pending CN112800097A (zh) | 2021-01-15 | 2021-01-15 | 基于深度兴趣网络的专题推荐方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN112800097A (zh) |
WO (1) | WO2022151649A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114187036A (zh) * | 2021-11-30 | 2022-03-15 | 深圳市喂车科技有限公司 | 一种基于行为特征识别的互联网广告智能推荐管理系统 |
CN114567811A (zh) * | 2022-02-28 | 2022-05-31 | 广州欢聊网络科技有限公司 | 用于声音排序的多模态模型训练方法、系统及相关设备 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800097A (zh) * | 2021-01-15 | 2021-05-14 | 稿定(厦门)科技有限公司 | 基于深度兴趣网络的专题推荐方法及装置 |
CN113657975B (zh) * | 2021-09-03 | 2024-03-26 | 西安稻叶山供应链管理有限公司 | 一种基于互联网电商直播平台的营销方法及系统 |
CN114119142A (zh) * | 2021-11-11 | 2022-03-01 | 北京沃东天骏信息技术有限公司 | 信息推荐方法、装置和系统 |
CN114218476B (zh) * | 2021-11-12 | 2022-10-04 | 深圳前海鹏影数字软件运营有限公司 | 一种内容推荐方法、装置及终端设备 |
CN115587261B (zh) * | 2022-12-09 | 2023-04-07 | 思创数码科技股份有限公司 | 政务资源目录推荐方法及系统 |
CN115828107B (zh) * | 2023-01-09 | 2023-05-05 | 深圳市云积分科技有限公司 | 基于离线环境的模型训练方法及装置 |
CN115952359A (zh) * | 2023-03-10 | 2023-04-11 | 特斯联科技集团有限公司 | 推荐系统召回方法及装置、电子设备、存储介质 |
CN116385048B (zh) * | 2023-06-06 | 2023-08-22 | 山东政信大数据科技有限责任公司 | 一种农产品智慧营销方法和系统 |
CN116521908B (zh) * | 2023-06-28 | 2024-01-09 | 图林科技(深圳)有限公司 | 一种基于人工智能的多媒体内容个性化推荐方法 |
CN117493677B (zh) * | 2023-11-10 | 2024-05-28 | 成达文化科技(广州)有限公司 | 一种基于用户画像的个性化搜索信息推荐系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160170996A1 (en) * | 2014-08-21 | 2016-06-16 | Affectomatics Ltd. | Crowd-based scores for experiences from measurements of affective response |
CN110162700A (zh) * | 2019-04-23 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 信息推荐及模型的训练方法、装置、设备以及存储介质 |
CN111368210A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置以及电子设备 |
CN111737578A (zh) * | 2020-06-22 | 2020-10-02 | 陕西师范大学 | 一种推荐方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10404813B2 (en) * | 2016-09-14 | 2019-09-03 | Oath Inc. | Baseline interest profile for recommendations using a geographic location |
CN108182621A (zh) * | 2017-12-07 | 2018-06-19 | 合肥美的智能科技有限公司 | 商品推荐方法及商品推荐装置、设备和存储介质 |
CN111767459A (zh) * | 2019-10-16 | 2020-10-13 | 北京京东尚科信息技术有限公司 | 物品推荐的方法和装置 |
CN111046285B (zh) * | 2019-12-11 | 2023-04-25 | 拉扎斯网络科技(上海)有限公司 | 一种推荐排序确定方法、装置、服务器及存储介质 |
CN111125521A (zh) * | 2019-12-13 | 2020-05-08 | 上海喜马拉雅科技有限公司 | 一种信息推荐方法、装置、设备及存储介质 |
CN111310056B (zh) * | 2020-03-11 | 2023-04-14 | 深圳市雅阅科技有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN111651669A (zh) * | 2020-05-20 | 2020-09-11 | 拉扎斯网络科技(上海)有限公司 | 信息推荐方法、装置、电子设备和计算机可读存储介质 |
CN112800097A (zh) * | 2021-01-15 | 2021-05-14 | 稿定(厦门)科技有限公司 | 基于深度兴趣网络的专题推荐方法及装置 |
-
2021
- 2021-01-15 CN CN202110054841.0A patent/CN112800097A/zh active Pending
- 2021-01-15 CN CN202110961484.6A patent/CN113688167A/zh active Pending
- 2021-06-11 WO PCT/CN2021/099766 patent/WO2022151649A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160170996A1 (en) * | 2014-08-21 | 2016-06-16 | Affectomatics Ltd. | Crowd-based scores for experiences from measurements of affective response |
CN110162700A (zh) * | 2019-04-23 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 信息推荐及模型的训练方法、装置、设备以及存储介质 |
CN111368210A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置以及电子设备 |
CN111737578A (zh) * | 2020-06-22 | 2020-10-02 | 陕西师范大学 | 一种推荐方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114187036A (zh) * | 2021-11-30 | 2022-03-15 | 深圳市喂车科技有限公司 | 一种基于行为特征识别的互联网广告智能推荐管理系统 |
CN114187036B (zh) * | 2021-11-30 | 2022-10-11 | 深圳市喂车科技有限公司 | 一种基于行为特征识别的互联网广告智能推荐管理系统 |
CN114567811A (zh) * | 2022-02-28 | 2022-05-31 | 广州欢聊网络科技有限公司 | 用于声音排序的多模态模型训练方法、系统及相关设备 |
CN114567811B (zh) * | 2022-02-28 | 2024-02-09 | 广州欢聊网络科技有限公司 | 用于声音排序的多模态模型训练方法、系统及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2022151649A1 (zh) | 2022-07-21 |
CN112800097A (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113688167A (zh) | 基于深度兴趣网络的深度兴趣捕获模型构建方法及装置 | |
CN110149540B (zh) | 多媒体资源的推荐处理方法、装置、终端及可读介质 | |
CN109740048B (zh) | 一种课程推荐方法及装置 | |
CN106503025B (zh) | 一种应用推荐方法和系统 | |
CN108921221A (zh) | 用户特征的生成方法、装置、设备及存储介质 | |
CN110321291A (zh) | 测试案例智能提取系统及方法 | |
CN111126495B (zh) | 模型训练方法、信息预测方法、装置、存储介质及设备 | |
CN108780654A (zh) | 生成用于视频的移动缩略图 | |
CN110737859A (zh) | 一种up主匹配方法及装置 | |
CN110765348B (zh) | 一种热词的推荐方法、装置、电子设备及存储介质 | |
CN111783712A (zh) | 一种视频处理方法、装置、设备及介质 | |
CN107391577B (zh) | 一种基于表示向量的作品标签推荐方法和系统 | |
Vonikakis et al. | A probabilistic approach to people-centric photo selection and sequencing | |
CN112163614A (zh) | 一种主播分类方法、装置、电子设备及存储介质 | |
CN110458600A (zh) | 画像模型训练方法、装置、计算机设备及存储介质 | |
CN111061954A (zh) | 搜索结果排序方法、装置及存储介质 | |
Carlier et al. | Assessment of crowdsourcing and gamification loss in user-assisted object segmentation | |
CN111581435A (zh) | 一种视频封面图像生成方法、装置、电子设备及存储介质 | |
CN109308332A (zh) | 一种目标用户获取方法、装置和服务器 | |
CN108595526A (zh) | 资源推荐方法及装置 | |
CN111639485A (zh) | 基于文本相似性的课程推荐方法及相关设备 | |
CN111985616B (zh) | 一种图像特征提取方法、图像检索方法、装置及设备 | |
CN116501979A (zh) | 信息推荐方法、装置、计算机设备及计算机可读存储介质 | |
CN105138574A (zh) | 用于推荐旅游休闲出行地的基于人机交互的混合推荐系统 | |
CN111143688B (zh) | 一种基于移动新闻客户端的评估方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211123 |