WO2021189583A1

WO2021189583A1 - 基于受限玻尔兹曼机驱动的交互式个性化搜索方法

Info

Publication number: WO2021189583A1
Application number: PCT/CN2020/086202
Authority: WO
Inventors: 暴琳; 田雨波; 张贞凯; 王敏; 马国军; 邓小乔
Original assignee: 江苏科技大学
Priority date: 2020-03-25
Filing date: 2020-04-22
Publication date: 2021-09-30
Also published as: CN111339428B; KR20210120977A; KR102600697B1; CN111339428A

Abstract

一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法，包括：1、获取用户u的历史评价数据，包括用户u已评价的所有项目、对每个项目的评分和评价文本，并将评价文本进行向量化；2、将评分大于预设评分阈值的项目组成优势项目集合Du，并构建样本集；3、构建基于RBM的用户偏好特征提取模型；4、构建用户偏好概率模型；5、生成N个新项目并设置类别标签；6、在搜索空间中选取与N个新项目类别标签向量相似度最高的N个项目，构成待推荐项目集合Su；7、计算Su中每个项目的适应值；8、选择Su中适应值最大的前TOPN个项目作为搜索结果。该方法能够有效引导用户进行个性化搜索的方向，尽快帮助用户搜索到用户满意解，从而提高个性化搜索算法的综合性能。

Description

基于受限玻尔兹曼机驱动的交互式个性化搜索方法

技术领域

本发明属于数据挖掘技术领域，具体涉及一种交互式个性化搜索方法。

背景技术

随着大数据、云计算等技术的迅猛发展，信息呈现爆炸式增长，各类互联网应用中聚集了大量用户生成内容，给用户带来新信息的同时，也增加了用户筛选有效信息并最终做出决策的难度。个性化搜索作为连接用户与信息的桥梁，能够引导用户进行快速搜索，尽可能帮助用户从海量信息中快速筛选出与用户兴趣相符的内容，有效缓解信息过载。

用户生成内容中包含来自诸多用户提供的信息，包括用户行为数据、用户信息、项目信息等，这些多源异构数据从不同角度反映了用户的兴趣偏好，充分利用这些信息，可有效提高个性化搜索的质量。由于用户生成内容具有的数据稀疏性、不完整性、动态性等复杂特性，因此，处理融合多源异构用户生成内容数据的个性化搜索问题得难度更大。交互式进化计算有效利用用户对优化问题的主观评价和决策，将人类智能评价信息与传统进化优化算法相结合，是解决融合多源异构数据个性化搜索问题的有效途径。

申请号为201410202346.X的中国专利公开了一种用于心理学图书个性化快速搜索的交互式进化优化方法，指导用户快速寻找满意图书，该方法利用用户的搜索记录和群体共性搜索信息来建立用户偏好模型，没有充分挖掘用户历史数据中隐含的偏好特征。申请号为201910151051.7的中国专利公开了一种个性化商品推荐方法，该方法根据对用户的分类来进行商品推荐，只能体现出不同类用户之间的个性差别，而无法体现具体用户的个性化。申请号为201910431441.X的中国专利公开了一种基于交互数据聚类的个性化推荐方法及系统，其中的个性化推荐方法通过对用户聚类，得到相似用户的兴趣点，从而对用户进行个性化推荐，同样体现的是同类用户的偏好。

发明内容

发明目的：针对现有技术中存在的问题，本发明公开了一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法，该方法能够引导当前用户进行个性化搜索。

技术方案：本发明采用如下技术方案：

基于受限玻尔兹曼机驱动的交互式个性化搜索方法，包括：

(1)获取用户u的历史评价数据，所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本，并将评价文本进行向量化；

(2)将评分大于预设评分阈值的项目组成优势项目集合D _u，构成样本集

其中x _i∈D _u，

为项目x _i的类别标签向量，长度为类别总数n ₁；

为用户u对项目x _i的评价文本向量化表示，长度为n ₂；i＝1,2,…,|D _u|，|D _u|表示D _u中的项目数目；

(3)构建基于RBM的用户偏好特征提取模型，所述用户偏好特征提取模型用于根据优势项目集合D _u提取用户的偏好特征；

(4)构建用户偏好概率模型，所述用户偏好概率模型用于表示用户对每个类别项目的偏好概率；

(5)设定种群大小N，采用分布估计算法生成N个新项目并设置每个项目的类别标签；

(6)在搜索空间中选取分别与N个新项目类别标签向量

相似度最高的N个项目，构成待推荐项目集合S ^u；

(7)计算待推荐项目集合S ^u中每个项目的适应值：

(7.1)估计用户u对S ^u中每个项目的个性化偏好评分

其中，E _θ(x|u ^*)为与当前用户u相似度大于阈值的用户u ^*对项目x的评价能量函数；max(E _θ)和min(E _θ)分别为待推荐项目集合S ^u的所有项目中获得的能量函数的最大和最小值；

(7.2)计算S ^u中每个项目的适应值：

其中σ(x)＝1/(1+exp(-x))是归一化函数；

(8)选择S ^u中适应值最大的前TOP _N个项目作为搜索结果。

有益效果：本发明公开的交互式个性化搜索方法充分利用用户生成内容的多源异构数据，包括用户评分、文本标签、文本评论等信息，构建反映用户偏好特征的用户偏好特征提取模型，基于此模型，构建用户偏好概率模型，通过构建的模型，生成包含用户偏好的新项目，选择其中最能匹配用户偏好的项目作为搜索结果。该方法能够更好地解决多源异构复杂数据环境下的用户个性化搜索问题，能够有效引导用户进行个性化搜索的方向，尽快帮助用户搜索到用户满意解，从而提高个性化搜索算法的综合性能。

附图说明

图1为本发明公开的交互式个性化搜索方法的流程图；

图2为基于受限玻尔兹曼机的用户偏好模型的结构图。

具体实施方式

下面结合附图和具体实施方式，进一步阐明本发明。

如图1所示，本发明公开了一种基于受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)驱动的交互式个性化搜索方法，包括：

步骤1、获取用户u的历史评价数据，所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本，并将评价文本进行向量化；

本实施例中对评价文本进行向量化的步骤为：首先去除文本中的标点符号、停用词，其次采用文献：Le Q,Mikolov T.Distributed representations of sentences and documents[C]//International conference on machine learning.2014:1188-1196中的doc2vec文本向量化表示模型，将用户的评价文本进行向量化。

步骤2、将评分大于预设评分阈值的项目组成优势项目集合D _u；

构建样本集

其中x _i∈D _u，

为项目x _i的类别标签向量，长度为类别总数n ₁；

中每个元素

为二值变量；

表示项目x _i具有第j类标签，j＝1,2,…,n ₁；值得注意的是，本发明中不同类别之间并不是互斥的，一个项目可以同时存在多个类别标签为1。比如，对于书籍搜索，即项目为书籍的情况，一本书可能有多个类别标签，如《张居正传》，可以同时有人物传记、中国历史这几个标签，那么对应的类别标签就为1；对于影视搜索，即项目为影视作品的情况，一个影视作品也可能有多个类别标签，如《三国演义》可以同时有电视剧、历史这几个类别标签，同样地，对应的类别标签为1。

步骤3、构建基于RBM的用户偏好特征提取模型，如图2所示，用户偏好特征提取模型包括第一可见层v ₁、第二可见层v ₂、隐藏层h；所述第一可见层有n ₁个可见单元，每个可见单元为二值变量；第二可见层有n ₂个可见单元，每个可见单元为实数；所述隐藏层有m个隐单元，每个隐单元为实数；所述用户偏好特征提取模型的参数为θ＝{w ¹,a ¹,w ²,a ²,b}，其中，w ¹、w ²分别表示第一可见层中可见单元与隐藏层中隐单元、第二可见层中可见单元与隐藏层中隐单元之间的连接权重；a ¹、a ²分别为第一可见层中可见单元、第二可见层中可见单元的偏置；b为隐藏层中隐单元的偏置；隐藏层中隐单元个数m为类别总数n ₁的0.8-1.2倍，本实施例中，设置

为向上取整运算。

将样本集中每个样本的

和

输入到用户偏好特征提取模型的第一可见层和第二可见层，采用对比散度学习算法对所述模型进行训练，优化模型参数θ，得到训练好的用户偏好特征提取模型，其中隐单元的状态表征了当前用户u的偏好特征。

步骤4、基于训练好的用户偏好特征提取模型，构建用户偏好概率模型：

其中p(c _j＝1)表示用户u偏好的项目具有第j类标签项目的概率，计算步骤为：

(4.1)估计用户偏好具有第j类标签项目的绝对概率：

其中

为项目x _i的第j个类别标签c _j＝1的边际分布，

为项目x _i的第j个类别标签c _j＝0的边际分布，φ为S _RBM中所有样本的平均边际分布；

其中

为向量

的第j个元素，

为第i个样本中项目的类别标签向量

在第l个隐单元的能量值，其计算式为：

例如，项目有2个类别标签，即n ₁＝2，有3个样本，i＝1,2,3，类别标签向量分别为：C ₁＝(1,1)、C ₂＝(1,0)、C ₃＝(0,1)；

则计算

时，需要计算

和

计算

时，只考虑c ₁＝1的样本，即第一个、第二个样本，

计算

时，只考虑c ₁＝0的样本，即第三个样本，

(4.2)对用户偏好具有第j类标签项目的绝对概率进行归一化：

得到的P _u(x)即为用户u的用户偏好概率模型；p(c _j＝1)值越大，则用户越偏好具有第j类标签的项目；

步骤5、设定种群大小N，采用分布估计算法(Estimation of Distribution Algorithms，EDA)生成N个新项目，新项目的类别标签向量

的设置步骤如下：

(5.1)令n＝1；

(5.2)生成[0,1]之间的随机数z；如果z≤p(c _j＝1)，则第n个新项目的类别标签向量

的第j个元素为1，否则为0；

(5.3)令n加一，重复步骤(5.2)，直至n>N；

需要说明的是，此时这N个新项目只确定了类别标签向量，具体项目内容还未确定；

步骤6、在搜索空间中选取分别与N个新项目类别标签向量

相似度最高的N个项目，构成待推荐项目集合S ^u；本实施例中，采用欧氏距离作为相似度的计算，即两向量之间的欧欧氏距离越小，二者相似度越高；

此时，N个新项目的内容确定了，下面步骤对其做进一步的筛选；

步骤7、计算待推荐项目集合S ^u中每个项目的适应值：

(7.1)估计用户u对S ^u中每个项目的个性化偏好评分

其中，E _θ(x|u ^*)为与当前用户u相似度大于阈值的用户u ^*对项目x的评价能量函数，其计算式为：

其中c _j为x类别标签向量中第j个元素；t _k为用户u ^*对x的评价文本向量化的第k个元素；

为用户偏好特征提取模型中第一可见层中可见单元的偏置a ¹的第j个元素；

为用户偏好特征提取模型中第二可见层中可见单元的偏置a ²的第k个元素；b _l为用户偏好特征提取模型中隐藏层中隐单元的偏置b的第l个元素；

为第一可见层中第j个可见单元与隐藏层中第l个隐单元之间的连接权重，

为第二可见层中第k个可见单元与隐藏层中第l个隐单元之间的连接权重；

从E _θ(x|u ^*)的计算式可以看出，项目x能量函数的大小与用户对其的评价文本有关，因此本步骤需要选择与当前用户u相似的用户，当前用户u和所有用户中任一用户u′(u′≠u)的相似度Sim(u,u′)计算式为：

其中I _u,u′表示用户u和u′均已评分的项目集合；R _ux'为用户u对I _u,u′中的项目x′的评分，R _u′x'为用户u′对x′的评分；

为用户u对已被u评价的所有项目的平均评分；

为用户u′对已被u′评价的所有项目的平均评分。

max(E _θ)和min(E _θ)分别为待推荐项目集合S ^u的所有项目中获得的能量函数的最大和最小值；

(7.2)计算S ^u中每个项目的适应值：

为了充分利用用户的个性和用户所在的群体，本实施例中适应值包括用户u的个性化评价，以及与用户u相似的用户的群体评价，具体计算步骤为：

(7.2.1)在所有用户中选择与用户u相似度最高的前K个用户，构成用户u的邻居用户集S _nb，计算S _nb对S ^u中项目x的权重平均评分：

其中R _u′x为S _nb中的用户u′对S ^u中项目x的评分；如果用户u′对项目x没有评分，则R _u′x＝0；

(7.2.2)S ^u中项目x的适应值为：

其中α是用来调整社交知识对于个体预测评分贡献度的系数，如果不考虑群体评价，将α设为1即可。σ(x)＝1/(1+exp(-x))是归一化函数；

步骤8、选择S ^u中适应值最大的前TOP _N个项目作为搜索结果。

由于用户兴趣偏好的多样性和动态演化特性，在交互式个性化搜索过程的早期阶段，优势项目集合中所含当前用户的偏好信息不够充分，利用训练的基于RBM的用户偏好特征提取模型所提取的用户的偏好特征较粗略。同时，用户对项目的认知和偏好具有主观性、模糊性、渐进性和不确定性，在用户进行个性化搜索过程中随着环境变化、信息量增加等因素的影响，用户需求和兴趣偏好逐渐清晰甚至有可能发生变化。因此，为了获得准确且动态变化的用户偏好特征，随着用户交互式搜索过程的推进和用户行为动态演变，根据当前用户最近的评价数据，再次训练融合了多源异构数据的基于受限玻尔兹曼机的用户偏好特征提取模型，动态更新提取的用户偏好特征，同时，更新用户偏好概率模型，及时跟踪当前用户的偏好，有效引导交互式个性化搜索过程的前进方向，保证用户顺利完成个性化搜索。

Claims

基于受限玻尔兹曼机驱动的交互式个性化搜索方法，其特征在于，包括：

(1)获取用户u的历史评价数据，所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本，并将评价文本进行向量化；

(2)将评分大于预设评分阈值的项目组成优势项目集合D _u，构成样本集
其中x _i∈D _u，
为项目x _i的类别标签向量，长度为类别总数n ₁；
为用户u对项目x _i的评价文本向量化表示，长度为n ₂；i＝1,2,…,|D _u|，|D _u|表示D _u中的项目数目；

(3)构建基于RBM的用户偏好特征提取模型，所述用户偏好特征提取模型用于根据优势项目集合D _u提取用户的偏好特征；

(4)构建用户偏好概率模型，所述用户偏好概率模型用于表示用户对每个类别项目的偏好概率；

(5)设定种群大小N，采用分布估计算法生成N个新项目并设置每个项目的类别标签；

(6)在搜索空间中选取分别与N个新项目类别标签向量
相似度最高的N个项目，构成待推荐项目集合S ^u；

(7)计算待推荐项目集合S ^u中每个项目的适应值：

(7.1)估计用户u对S ^u中每个项目的个性化偏好评分

其中，E _θ(x|u ^*)为与当前用户u相似度大于阈值的用户u ^*对项目x的评价能量函数；max(E _θ)和min(E _θ)分别为待推荐项目集合S ^u的所有项目中获得的能量函数的最大和最小值；

(7.2)计算S ^u中每个项目的适应值：

其中σ(x)＝1/(1+exp(-x))是归一化函数；

(8)选择S ^u中适应值最大的前TOP _N个项目作为搜索结果。
根据权利要求1所述的交互式个性化搜索方法，其特征在于，所述用户偏好特征提取模型包括第一可见层、第二可见层、隐藏层；所述第一可见层有n ₁个可见单元，每个可见单元为二值变量；第二可见层有n ₂个可见单元，每个可见单元为实数；所述隐藏层有m个隐单元，每个隐单元为实数；所述用户偏好特征提取模型的参数为θ＝{w ¹,a ¹,w ²,a ²,b}，其中，w ¹、w ²分别表示第一可见层中可见单元与隐藏层中隐单元、第二可见层中可见单元与隐藏层中隐单元之间的连接权重；a ¹、a ²分别为第一可见层中可见单元、第二可见层中可见单元的偏置；b为隐藏层中隐单元的偏置；

将样本集中每个样本的
和
输入到用户偏好特征提取模型的第一可见层和第二可见层，采用对比散度学习算法对所述模型进行训练，优化模型参数θ，得到训练好的用户偏好特征提取模型。
根据权利要求2所述的交互式个性化搜索方法，其特征在于，所述用户偏好概率模型为：

其中p(c _j＝1)表示用户u偏好的项目具有第j类标签项目的概率。
根据权利要求3所述的交互式个性化搜索方法，其特征在于，p(c _j＝1)的计算步骤为：

(4.1)估计用户偏好具有第j类标签项目的绝对概率：

其中
为项目x _i的第j个类别标签c _j＝1的边际分布，
为项目x _i的第j个类别标签c _j＝0的边际分布，φ为S _RBM中所有样本的平均边际分布；

其中
为向量
的第j个元素，
为第i个样本中项目的类别标签向量
在第l个隐单元的能量值，其计算式为：

(4.2)对用户偏好具有第j类标签项目的绝对概率进行归一化：

得到P _u(x)即为用户u的用户偏好概率模型。
根据权利要求2所述的交互式个性化搜索方法，其特征在于，用户u ^*对项目x的评价能量函数E _θ(x|u ^*)的计算式为：

其中c _j为x类别标签向量中第j个元素；t _k为用户u ^*对x的评价文本向量化的第k个元素；
为用户偏好特征提取模型中第一可见层中可见单元的偏置a ¹的第j个元素；
为用户偏好特征提取模型中第二可见层中可见单元的偏置a ²的第k个元素；b _l为用户偏好特征提取模型中隐藏层中隐单元的偏置b的第l个元素；
为第一可见层中第j个可见单元与隐藏层中第l个隐单元之间的连接权重，
为第二可见层中第k个可见单元与隐藏层中第l个隐单元之间的连接权重。
根据权利要求1所述的交互式个性化搜索方法，其特征在于，所述步骤(5)中新项目的类别标签向量
的设置步骤如下：

(5.1)令n＝1；

(5.2)生成[0,1]之间的随机数z；如果z≤p(c _j＝1)，则第n个新项目的类别标签向量
的第j个元素为1，否则为0；

(5.3)令n加一，重复步骤(5.2)，直至n>N。
根据权利要求1所述的交互式个性化搜索方法，其特征在于，所述步骤(7.2)中每个项目的适应值还包括群组估计评分，具体计算步骤为：

(7.2.1)在所有用户中选择与用户u相似度最高的前K个用户，构成用户u的邻居用户集S _nb，计算S _nb对S ^u中项目x的权重平均评分：

其中R _u′x为S _nb中的用户u′对S ^u中项目x的评分；如果用户u′对项目x没有评分，则R _u′x＝0；

(7.2.2)S ^u中项目x的适应值为：

其中α是用来调整社交知识对于个体预测评分贡献度的系数。
根据权利要求2所述的交互式个性化搜索方法，其特征在于，所述隐藏层中隐单元个数m为类别总数n ₁的0.8-1.2倍。
根据权利要求1所述的交互式个性化搜索方法，其特征在于，对于与用户u存在共同评分项目的用户u′，u′≠u,u和u′的相似度Sim(u,u′)为：

其中I _u,u′表示用户u和u′均评分的项目集合；R _ux'为用户u对I _u,u′中的项目x′的评分，R _u′x'为用户u′对x′的评分；
为用户u对已评价的所有项目的平均评分；
为用户u′对已评价的所有项目的平均评分。