CN111339428B - 基于受限玻尔兹曼机驱动的交互式个性化搜索方法 - Google Patents

基于受限玻尔兹曼机驱动的交互式个性化搜索方法 Download PDF

Info

Publication number
CN111339428B
CN111339428B CN202010216557.4A CN202010216557A CN111339428B CN 111339428 B CN111339428 B CN 111339428B CN 202010216557 A CN202010216557 A CN 202010216557A CN 111339428 B CN111339428 B CN 111339428B
Authority
CN
China
Prior art keywords
user
item
items
visible
hidden
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010216557.4A
Other languages
English (en)
Other versions
CN111339428A (zh
Inventor
暴琳
张贞凯
王敏
马国军
邓小乔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Mengxiang Technology Co ltd
Shenzhen Dragon Totem Technology Achievement Transformation Co ltd
Original Assignee
Jiangsu University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University of Science and Technology filed Critical Jiangsu University of Science and Technology
Priority to CN202010216557.4A priority Critical patent/CN111339428B/zh
Priority to PCT/CN2020/086202 priority patent/WO2021189583A1/zh
Priority to KR1020217011962A priority patent/KR102600697B1/ko
Publication of CN111339428A publication Critical patent/CN111339428A/zh
Application granted granted Critical
Publication of CN111339428B publication Critical patent/CN111339428B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/58Random or pseudo-random number generators
    • G06F7/588Random number generators, i.e. based on natural stochastic processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法,包括:1、获取用户u的历史评价数据,包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;2、将评分大于预设评分阈值的项目组成优势项目集合Du,并构建样本集;3、构建基于RBM的用户偏好特征提取模型;4、构建用户偏好概率模型;5、生成N个新项目并设置类别标签;6、在搜索空间中选取与N个新项目类别标签向量相似度最高的N个项目,构成待推荐项目集合Su;7、计算Su中每个项目的适应值;8、选择Su中适应值最大的前TOPN个项目作为搜索结果。该方法能够有效引导用户进行个性化搜索的方向,尽快帮助用户搜索到用户满意解,从而提高个性化搜索算法的综合性能。

Description

基于受限玻尔兹曼机驱动的交互式个性化搜索方法
技术领域
本发明属于数据挖掘技术领域,具体涉及一种交互式个性化搜索方法。
背景技术
随着大数据、云计算等技术的迅猛发展,信息呈现爆炸式增长,各类互联网应用中聚集了大量用户生成内容,给用户带来新信息的同时,也增加了用户筛选有效信息并最终做出决策的难度。个性化搜索作为连接用户与信息的桥梁,能够引导用户进行快速搜索,尽可能帮助用户从海量信息中快速筛选出与用户兴趣相符的内容,有效缓解信息过载。
用户生成内容中包含来自诸多用户提供的信息,包括用户行为数据、用户信息、项目信息等,这些多源异构数据从不同角度反映了用户的兴趣偏好,充分利用这些信息,可有效提高个性化搜索的质量。由于用户生成内容具有的数据稀疏性、不完整性、动态性等复杂特性,因此,处理融合多源异构用户生成内容数据的个性化搜索问题得难度更大。交互式进化计算有效利用用户对优化问题的主观评价和决策,将人类智能评价信息与传统进化优化算法相结合,是解决融合多源异构数据个性化搜索问题的有效途径。
申请号为201410202346.X的中国专利公开了一种用于心理学图书个性化快速搜索的交互式进化优化方法,指导用户快速寻找满意图书,该方法利用用户的搜索记录和群体共性搜索信息来建立用户偏好模型,没有充分挖掘用户历史数据中隐含的偏好特征。申请号为201910151051.7的中国专利公开了一种个性化商品推荐方法,该方法根据对用户的分类来进行商品推荐,只能体现出不同类用户之间的个性差别,而无法体现具体用户的个性化。申请号为201910431441.X的中国专利公开了一种基于交互数据聚类的个性化推荐方法及系统,其中的个性化推荐方法通过对用户聚类,得到相似用户的兴趣点,从而对用户进行个性化推荐,同样体现的是同类用户的偏好。
发明内容
发明目的:针对现有技术中存在的问题,本发明公开了一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法,该方法能够引导当前用户进行个性化搜索。
技术方案:本发明采用如下技术方案:
基于受限玻尔兹曼机驱动的交互式个性化搜索方法,包括:
(1)获取用户u的历史评价数据,所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;
(2)将评分大于预设评分阈值的项目组成优势项目集合Du,构成样本集
Figure BDA0002424678830000021
其中xi∈Du
Figure BDA0002424678830000022
为项目xi的类别标签向量,长度为类别总数n1
Figure BDA0002424678830000023
为用户u对项目xi的评价文本向量化表示,长度为n2;i=1,2,…,|Du|,|Du|表示Du中的项目数目;
(3)构建基于RBM的用户偏好特征提取模型,所述用户偏好特征提取模型用于根据优势项目集合Du提取用户的偏好特征;
(4)构建用户偏好概率模型,所述用户偏好概率模型用于表示用户对每个类别项目的偏好概率;
(5)设定种群大小N,采用分布估计算法生成N个新项目并设置每个项目的类别标签;
(6)在搜索空间中选取分别与N个新项目类别标签向量
Figure BDA0002424678830000024
相似度最高的N个项目,构成待推荐项目集合Su
(7)计算待推荐项目集合Su中每个项目的适应值:
(7.1)估计用户u对Su中每个项目的个性化偏好评分
Figure BDA0002424678830000025
Figure BDA0002424678830000026
其中,Eθ(x|u*)为与当前用户u相似度大于阈值的用户u*对项目x的评价能量函数;max(Eθ)和min(Eθ)分别为待推荐项目集合Su的所有项目中获得的能量函数的最大和最小值;
(7.2)计算Su中每个项目的适应值:
Figure BDA0002424678830000027
其中σ(x)=1/(1+exp(-x))是归一化函数;
(8)选择Su中适应值最大的前TOPN个项目作为搜索结果。
有益效果:本发明公开的交互式个性化搜索方法充分利用用户生成内容的多源异构数据,包括用户评分、文本标签、文本评论等信息,构建反映用户偏好特征的用户偏好特征提取模型,基于此模型,构建用户偏好概率模型,通过构建的模型,生成包含用户偏好的新项目,选择其中最能匹配用户偏好的项目作为搜索结果。该方法能够更好地解决多源异构复杂数据环境下的用户个性化搜索问题,能够有效引导用户进行个性化搜索的方向,尽快帮助用户搜索到用户满意解,从而提高个性化搜索算法的综合性能。
附图说明
图1为本发明公开的交互式个性化搜索方法的流程图;
图2为基于受限玻尔兹曼机的用户偏好模型的结构图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明。
如图1所示,本发明公开了一种基于受限玻尔兹曼机(Restricted BoltzmannMachine,RBM)驱动的交互式个性化搜索方法,包括:
步骤1、获取用户u的历史评价数据,所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;
本实施例中对评价文本进行向量化的步骤为:首先去除文本中的标点符号、停用词,其次采用文献:Le Q,Mikolov T.Distributed representations of sentences anddocuments[C]//International conference on machine learning.2014:1188-1196中的doc2vec文本向量化表示模型,将用户的评价文本进行向量化。
步骤2、将评分大于预设评分阈值的项目组成优势项目集合Du
构建样本集
Figure BDA0002424678830000031
其中xi∈Du
Figure BDA0002424678830000032
为项目xi的类别标签向量,长度为类别总数n1
Figure BDA0002424678830000033
中每个元素
Figure BDA0002424678830000034
为二值变量;
Figure BDA0002424678830000035
表示项目xi具有第j类标签,j=1,2,…,n1;值得注意的是,本发明中不同类别之间并不是互斥的,一个项目可以同时存在多个类别标签为1。比如,对于书籍搜索,即项目为书籍的情况,一本书可能有多个类别标签,如《张居正传》,可以同时有人物传记、中国历史这几个标签,那么对应的类别标签就为1;对于影视搜索,即项目为影视作品的情况,一个影视作品也可能有多个类别标签,如《三国演义》可以同时有电视剧、历史这几个类别标签,同样地,对应的类别标签为1。
Figure BDA0002424678830000041
为用户u对项目xi的评价文本向量化表示,长度为n2;i=1,2,…,|Du|,|Du表示Du中的项目数目;
步骤3、构建基于RBM的用户偏好特征提取模型,如图2所示,用户偏好特征提取模型包括第一可见层v1、第二可见层v2、隐藏层h;所述第一可见层有n1个可见单元,每个可见单元为二值变量;第二可见层有n2个可见单元,每个可见单元为实数;所述隐藏层有m个隐单元,每个隐单元为实数;所述用户偏好特征提取模型的参数为θ={w1,a1,w2,a2,b},其中,w1、w2分别表示第一可见层中可见单元与隐藏层中隐单元、第二可见层中可见单元与隐藏层中隐单元之间的连接权重;a1、a2分别为第一可见层中可见单元、第二可见层中可见单元的偏置;b为隐藏层中隐单元的偏置;隐藏层中隐单元个数m为类别总数n1的0.8-1.2倍,本实施例中,设置
Figure BDA0002424678830000042
Figure BDA0002424678830000043
为向上取整运算。
将样本集中每个样本的
Figure BDA0002424678830000044
Figure BDA0002424678830000045
输入到用户偏好特征提取模型的第一可见层和第二可见层,采用对比散度学习算法对所述模型进行训练,优化模型参数θ,得到训练好的用户偏好特征提取模型,其中隐单元的状态表征了当前用户u的偏好特征。
步骤4、基于训练好的用户偏好特征提取模型,构建用户偏好概率模型:
Figure BDA0002424678830000046
其中p(cj=1)表示用户u偏好的项目具有第j类标签项目的概率,计算步骤为:
(4.1)估计用户偏好具有第j类标签项目的绝对概率:
Figure BDA0002424678830000047
其中
Figure BDA0002424678830000051
为项目xi的第j个类别标签cj=1的边际分布,
Figure BDA0002424678830000052
为项目xi的第j个类别标签cj=0的边际分布,φ为SRBM中所有样本的平均边际分布;
Figure BDA0002424678830000053
Figure BDA0002424678830000054
Figure BDA0002424678830000055
Figure BDA0002424678830000056
其中
Figure BDA0002424678830000057
为向量
Figure BDA0002424678830000058
的第j个元素,
Figure BDA0002424678830000059
为第i个样本中项目的类别标签向量
Figure BDA00024246788300000510
在第l个隐单元的能量值,其计算式为:
Figure BDA00024246788300000511
例如,项目有2个类别标签,即n1=2,有3个样本,i=1,2,3,类别标签向量分别为:C1=(1,1)、C2=(1,0)、C3=(0,1);
则计算
Figure BDA00024246788300000512
时,需要计算
Figure BDA00024246788300000513
Figure BDA00024246788300000514
计算
Figure BDA00024246788300000515
时,只考虑c1=1的样本,即第一个、第二个样本,
Figure BDA00024246788300000516
计算
Figure BDA00024246788300000517
时,只考虑c1=0的样本,即第三个样本,
Figure BDA00024246788300000518
(4.2)对用户偏好具有第j类标签项目的绝对概率进行归一化:
Figure BDA00024246788300000519
得到的Pu(x)即为用户u的用户偏好概率模型;p(cj=1)值越大,则用户越偏好具有第j类标签的项目;
步骤5、设定种群大小N,采用分布估计算法(Estimation of DistributionAlgorithms,EDA)生成N个新项目,新项目的类别标签向量
Figure BDA0002424678830000061
的设置步骤如下:
(5.1)令n=1;
(5.2)生成[0,1]之间的随机数z;如果z≤p(cj=1),则第n个新项目的类别标签向量
Figure BDA0002424678830000062
的第j个元素为1,否则为0;
(5.3)令n加一,重复步骤(5.2),直至n>N;
需要说明的是,此时这N个新项目只确定了类别标签向量,具体项目内容还未确定;
步骤6、在搜索空间中选取分别与N个新项目类别标签向量
Figure BDA0002424678830000063
相似度最高的N个项目,构成待推荐项目集合Su;本实施例中,采用欧氏距离作为相似度的计算,即两向量之间的欧欧氏距离越小,二者相似度越高;
此时,N个新项目的内容确定了,下面步骤对其做进一步的筛选;
步骤7、计算待推荐项目集合Su中每个项目的适应值:
(7.1)估计用户u对Su中每个项目的个性化偏好评分
Figure BDA0002424678830000064
Figure BDA0002424678830000065
其中,Eθ(x|u*)为与当前用户u相似度大于阈值的用户u*对项目x的评价能量函数,其计算式为:
Figure BDA0002424678830000066
其中cj为x类别标签向量中第j个元素;tk为用户u*对x的评价文本向量化的第k个元素;
Figure BDA0002424678830000067
为用户偏好特征提取模型中第一可见层中可见单元的偏置a1的第j个元素;
Figure BDA0002424678830000068
为用户偏好特征提取模型中第二可见层中可见单元的偏置a2的第k个元素;bl为用户偏好特征提取模型中隐藏层中隐单元的偏置b的第l个元素;
Figure BDA0002424678830000069
为第一可见层中第j个可见单元与隐藏层中第l个隐单元之间的连接权重,
Figure BDA00024246788300000610
为第二可见层中第k个可见单元与隐藏层中第l个隐单元之间的连接权重;
从Eθ(x|u*)的计算式可以看出,项目x能量函数的大小与用户对其的评价文本有关,因此本步骤需要选择与当前用户u相似的用户,当前用户u和所有用户中任一用户u′(u′≠u)的相似度Sim(u,u′)计算式为:
Figure BDA0002424678830000071
其中Iu,u′表示用户u和u′均已评分的项目集合;Rux'为用户u对Iu,u′中的项目x′的评分,Ru′x'为用户u′对x′的评分;
Figure BDA0002424678830000072
为用户u对已被u评价的所有项目的平均评分;
Figure BDA0002424678830000073
为用户u′对已被u′评价的所有项目的平均评分。
max(Eθ)和min(Eθ)分别为待推荐项目集合Su的所有项目中获得的能量函数的最大和最小值;
(7.2)计算Su中每个项目的适应值:
为了充分利用用户的个性和用户所在的群体,本实施例中适应值包括用户u的个性化评价,以及与用户u相似的用户的群体评价,具体计算步骤为:
(7.2.1)在所有用户中选择与用户u相似度最高的前K个用户,构成用户u的邻居用户集Snb,计算Snb对Su中项目x的权重平均评分:
Figure BDA0002424678830000074
其中Ru′x为Snb中的用户u′对Su中项目x的评分;如果用户u′对项目x没有评分,则Ru′x=0;
(7.2.2)Su中项目x的适应值为:
Figure BDA0002424678830000075
其中α是用来调整社交知识对于个体预测评分贡献度的系数,如果不考虑群体评价,将α设为1即可。σ(x)=1/(1+exp(-x))是归一化函数;
步骤8、选择Su中适应值最大的前TOPN个项目作为搜索结果。
由于用户兴趣偏好的多样性和动态演化特性,在交互式个性化搜索过程的早期阶段,优势项目集合中所含当前用户的偏好信息不够充分,利用训练的基于RBM的用户偏好特征提取模型所提取的用户的偏好特征较粗略。同时,用户对项目的认知和偏好具有主观性、模糊性、渐进性和不确定性,在用户进行个性化搜索过程中随着环境变化、信息量增加等因素的影响,用户需求和兴趣偏好逐渐清晰甚至有可能发生变化。因此,为了获得准确且动态变化的用户偏好特征,随着用户交互式搜索过程的推进和用户行为动态演变,根据当前用户最近的评价数据,再次训练融合了多源异构数据的基于受限玻尔兹曼机的用户偏好特征提取模型,动态更新提取的用户偏好特征,同时,更新用户偏好概率模型,及时跟踪当前用户的偏好,有效引导交互式个性化搜索过程的前进方向,保证用户顺利完成个性化搜索。

Claims (5)

1.基于受限玻尔兹曼机驱动的交互式个性化搜索方法,其特征在于,包括:
(1)获取用户u的历史评价数据,所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;
(2)将评分大于预设评分阈值的项目组成优势项目集合Du,构成样本集
Figure FDA0002883575410000011
其中xi∈Du
Figure FDA0002883575410000012
为项目xi的类别标签向量,长度为类别总数n1
Figure FDA0002883575410000013
为用户u对项目xi的评价文本向量化表示,长度为n2;i=1,2,…,|Du|,|Du|表示Du中的项目数目;
(3)构建基于受限玻尔兹曼机的用户偏好特征提取模型,所述用户偏好特征提取模型用于根据优势项目集合Du提取用户的偏好特征;
(4)构建用户偏好概率模型,所述用户偏好概率模型用于表示用户对每个类别项目的偏好概率;
(5)设定种群大小N,采用分布估计算法生成N个新项目并设置每个项目的类别标签;
(6)在搜索空间中选取分别与N个新项目类别标签向量
Figure FDA0002883575410000014
相似度最高的N个项目,构成待推荐项目集合Su
(7)计算待推荐项目集合Su中每个项目的适应值:
(7.1)估计用户u对Su中每个项目的个性化偏好评分
Figure FDA0002883575410000015
Figure FDA0002883575410000016
其中,Eθ(x|u*)为与当前用户u相似度大于阈值的用户u*对项目x的评价能量函数;max(Eθ)和min(Eθ)分别为待推荐项目集合Su的所有项目中获得的能量函数的最大和最小值;
(7.2)计算Su中每个项目的适应值:
Figure FDA0002883575410000017
其中σ(x)=1/(1+exp(-x))是归一化函数;
(8)选择Su中适应值最大的前TOPN个项目作为搜索结果;
所述用户偏好特征提取模型包括第一可见层、第二可见层、隐藏层;所述第一可见层有n1个可见单元,每个可见单元为二值变量;第二可见层有n2个可见单元,每个可见单元为实数;所述隐藏层有m个隐单元,每个隐单元为实数;所述用户偏好特征提取模型的参数为θ={w1,a1,w2,a2,b},其中,w1、w2分别表示第一可见层中可见单元与隐藏层中隐单元、第二可见层中可见单元与隐藏层中隐单元之间的连接权重;a1、a2分别为第一可见层中可见单元、第二可见层中可见单元的偏置;b为隐藏层中隐单元的偏置;
将样本集中每个样本的
Figure FDA0002883575410000021
Figure FDA0002883575410000022
输入到用户偏好特征提取模型的第一可见层和第二可见层,采用对比散度学习算法对所述模型进行训练,优化模型参数θ,得到训练好的用户偏好特征提取模型;
所述用户偏好概率模型为:
Figure FDA0002883575410000023
其中p(cj=1)表示用户u偏好的项目具有第j类标签项目的概率;
用户u*对项目x的评价能量函数Eθ(x|u*)的计算式为:
Figure FDA0002883575410000024
其中cj为x类别标签向量中第j个元素;tk为用户u*对x的评价文本向量化的第k个元素;
Figure FDA0002883575410000025
为用户偏好特征提取模型中第一可见层中可见单元的偏置a1的第j个元素;
Figure FDA0002883575410000026
为用户偏好特征提取模型中第二可见层中可见单元的偏置a2的第k个元素;bl为用户偏好特征提取模型中隐藏层中隐单元的偏置b的第l个元素;
Figure FDA0002883575410000027
为第一可见层中第j个可见单元与隐藏层中第l个隐单元之间的连接权重,
Figure FDA0002883575410000028
为第二可见层中第k个可见单元与隐藏层中第l个隐单元之间的连接权重;
所述步骤(5)中新项目的类别标签向量
Figure FDA0002883575410000029
的设置步骤如下:
(5.1)令n=1;
(5.2)生成[0,1]之间的随机数z;如果z≤p(cj=1),则第n个新项目的类别标签向量
Figure FDA0002883575410000031
的第j个元素为1,否则为0;
(5.3)令n加一,重复步骤(5.2),直至n>N;
随着用户交互式搜索过程的推进和用户行为动态演变,根据当前用户最近的评价数据,再次训练融合了多源异构数据的基于受限玻尔兹曼机的用户偏好特征提取模型,动态更新提取的用户偏好特征,同时,更新用户偏好概率模型。
2.根据权利要求1所述的交互式个性化搜索方法,其特征在于,p(cj=1)的计算步骤为:
(4.1)估计用户偏好具有第j类标签项目的绝对概率:
Figure FDA0002883575410000032
其中
Figure FDA0002883575410000033
为项目xi的第j个类别标签cj=1的边际分布,
Figure FDA0002883575410000034
为项目xi的第j个类别标签cj=0的边际分布,φ为SRBM中所有样本的平均边际分布;
Figure FDA0002883575410000035
Figure FDA0002883575410000036
Figure FDA0002883575410000037
其中
Figure FDA0002883575410000038
为向量
Figure FDA0002883575410000039
的第j个元素,
Figure FDA00028835754100000310
为第i个样本中项目的类别标签向量
Figure FDA00028835754100000311
在第l个隐单元的能量值,其计算式为:
Figure FDA00028835754100000312
(4.2)对用户偏好具有第j类标签项目的绝对概率进行归一化:
Figure FDA00028835754100000313
得到Pu(x)即为用户u的用户偏好概率模型。
3.根据权利要求1所述的交互式个性化搜索方法,其特征在于,所述步骤(7.2)中每个项目的适应值还包括群组估计评分,具体计算步骤为:
(7.2.1)在所有用户中选择与用户u相似度最高的前K个用户,构成用户u的邻居用户集Snb,计算Snb对Su中项目x的权重平均评分:
Figure FDA0002883575410000041
其中Ru′x为Snb中的用户u′对Su中项目x的评分;如果用户u′对项目x没有评分,则Ru′x=0;
(7.2.2)Su中项目x的适应值为:
Figure FDA0002883575410000042
其中α是用来调整社交知识对于个体预测评分贡献度的系数。
4.根据权利要求1所述的交互式个性化搜索方法,其特征在于,所述隐藏层中隐单元个数m为类别总数n1的0.8-1.2倍。
5.根据权利要求1所述的交互式个性化搜索方法,其特征在于,对于与用户u存在共同评分项目的用户u′,u′≠u,u和u′的相似度Sim(u,u′)为:
Figure FDA0002883575410000043
其中Iu,u′表示用户u和u′均评分的项目集合;Rux'为用户u对Iu,u′中的项目x′的评分,Ru′x'为用户u′对x′的评分;
Figure FDA0002883575410000044
为用户u对已评价的所有项目的平均评分;
Figure FDA0002883575410000045
为用户u′对已评价的所有项目的平均评分。
CN202010216557.4A 2020-03-25 2020-03-25 基于受限玻尔兹曼机驱动的交互式个性化搜索方法 Expired - Fee Related CN111339428B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010216557.4A CN111339428B (zh) 2020-03-25 2020-03-25 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
PCT/CN2020/086202 WO2021189583A1 (zh) 2020-03-25 2020-04-22 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
KR1020217011962A KR102600697B1 (ko) 2020-03-25 2020-04-22 제한적 볼츠만 머신 구동 기반의 인터랙티브 맞춤형 검색 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010216557.4A CN111339428B (zh) 2020-03-25 2020-03-25 基于受限玻尔兹曼机驱动的交互式个性化搜索方法

Publications (2)

Publication Number Publication Date
CN111339428A CN111339428A (zh) 2020-06-26
CN111339428B true CN111339428B (zh) 2021-02-26

Family

ID=71186157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010216557.4A Expired - Fee Related CN111339428B (zh) 2020-03-25 2020-03-25 基于受限玻尔兹曼机驱动的交互式个性化搜索方法

Country Status (3)

Country Link
KR (1) KR102600697B1 (zh)
CN (1) CN111339428B (zh)
WO (1) WO2021189583A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127737B (zh) * 2021-04-14 2021-09-14 江苏科技大学 融合注意力机制的个性化搜索方法和搜索系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302873A (zh) * 2015-10-08 2016-02-03 北京航空航天大学 一种基于条件受限波尔兹曼机的协同过滤优化方法
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统
CN106202519A (zh) * 2016-07-22 2016-12-07 桂林电子科技大学 一种结合用户评论内容和评分的项目推荐方法
CN106777359A (zh) * 2017-01-18 2017-05-31 安徽农业大学 一种基于受限玻尔兹曼机的文本业务推荐方法
CN106951434A (zh) * 2017-02-06 2017-07-14 广东神马搜索科技有限公司 一种用于搜索引擎的搜索方法、装置及可编程设备
CN107133321A (zh) * 2017-05-04 2017-09-05 广东神马搜索科技有限公司 页面的搜索特性的分析方法和分析装置
CN107944049A (zh) * 2017-12-19 2018-04-20 北京工业大学 一种基于深度学习的电影推荐方法
CN108256093A (zh) * 2018-01-29 2018-07-06 华南理工大学 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法
CN109147807A (zh) * 2018-06-05 2019-01-04 安克创新科技股份有限公司 一种基于深度学习的音域平衡方法、装置及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324690A (zh) * 2013-06-03 2013-09-25 焦点科技股份有限公司 基于因子化条件受限玻尔兹曼机的混合推荐方法
US9910930B2 (en) * 2014-12-31 2018-03-06 TCL Research America Inc. Scalable user intent mining using a multimodal restricted boltzmann machine
US11050656B2 (en) * 2018-05-10 2021-06-29 Dell Products L.P. System and method to learn and prescribe network path for SDN
CN108846479A (zh) * 2018-07-13 2018-11-20 河海大学 基于rbm模型的推荐方法、rbm模型的训练方法及装置
CN110162706B (zh) 2019-05-22 2021-10-26 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105302873A (zh) * 2015-10-08 2016-02-03 北京航空航天大学 一种基于条件受限波尔兹曼机的协同过滤优化方法
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统
CN106202519A (zh) * 2016-07-22 2016-12-07 桂林电子科技大学 一种结合用户评论内容和评分的项目推荐方法
CN106777359A (zh) * 2017-01-18 2017-05-31 安徽农业大学 一种基于受限玻尔兹曼机的文本业务推荐方法
CN106951434A (zh) * 2017-02-06 2017-07-14 广东神马搜索科技有限公司 一种用于搜索引擎的搜索方法、装置及可编程设备
CN107133321A (zh) * 2017-05-04 2017-09-05 广东神马搜索科技有限公司 页面的搜索特性的分析方法和分析装置
CN107944049A (zh) * 2017-12-19 2018-04-20 北京工业大学 一种基于深度学习的电影推荐方法
CN108256093A (zh) * 2018-01-29 2018-07-06 华南理工大学 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法
CN109147807A (zh) * 2018-06-05 2019-01-04 安克创新科技股份有限公司 一种基于深度学习的音域平衡方法、装置及系统

Also Published As

Publication number Publication date
WO2021189583A1 (zh) 2021-09-30
KR20210120977A (ko) 2021-10-07
KR102600697B1 (ko) 2023-11-10
CN111339428A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
US11816888B2 (en) Accurate tag relevance prediction for image search
CN110162593B (zh) 一种搜索结果处理、相似度模型训练方法及装置
US10235623B2 (en) Accurate tag relevance prediction for image search
CN108363804B (zh) 基于用户聚类的局部模型加权融合Top-N电影推荐方法
CN107368614B (zh) 基于深度学习的图像检索方法及装置
CN105608477B (zh) 一种人物画像与职位匹配的方法及系统
CN112991017A (zh) 基于用户评论解析的标签体系精准推荐方法
US20200372025A1 (en) Answer selection using a compare-aggregate model with language model and condensed similarity information from latent clustering
CN113127737B (zh) 融合注意力机制的个性化搜索方法和搜索系统
CN114693397A (zh) 一种基于注意力神经网络的多视角多模态商品推荐方法
Bouguila A model-based approach for discrete data clustering and feature weighting using MAP and stochastic complexity
CN111966888B (zh) 融合外部数据的基于方面类别的可解释性推荐方法及系统
CN110008365B (zh) 一种图像处理方法、装置、设备及可读存储介质
CN112749330A (zh) 信息推送方法、装置、计算机设备和存储介质
CN111881283A (zh) 一种业务关键词库创建方法、智能聊天引导方法及装置
CN112084307A (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN111339428B (zh) 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
Mir et al. Online fake review detection using supervised machine learning and BERT model
CN112215629A (zh) 基于构造对抗样本的多目标广告生成系统及其方法
CN112613451A (zh) 一种跨模态文本图片检索模型的建模方法
CN111583363A (zh) 一种图文新闻的视觉自动生成方法及系统
Johnson et al. Improved Image Annotation and Labelling through Multi-Label Boosting.
CN114741471A (zh) 一种基于文本挖掘与多视角融合的个性化混合推荐方法
Trivedi et al. Analysing user sentiment of Indian movie reviews: A probabilistic committee selection model
CN108763203B (zh) 影评情感分析中使用特征词集将影评以特征向量表示的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200626

Assignee: Center for technology transfer Jiangsu University of Science and Technology

Assignor: JIANGSU University OF SCIENCE AND TECHNOLOGY

Contract record no.: X2021980006173

Denomination of invention: Interactive personalized search method driven by restricted Boltzmann machine

Granted publication date: 20210226

License type: Common License

Record date: 20210714

EC01 Cancellation of recordation of patent licensing contract

Assignee: Center for technology transfer Jiangsu University of Science and Technology

Assignor: JIANGSU University OF SCIENCE AND TECHNOLOGY

Contract record no.: X2021980006173

Date of cancellation: 20210826

EC01 Cancellation of recordation of patent licensing contract
TR01 Transfer of patent right

Effective date of registration: 20221228

Address after: 570,100 Starfish Base, Floor 12, Starfish Homeland, No. 18, Jinxing Road, Longhua District, Haikou, Hainan

Patentee after: Hainan Mengxiang Technology Co.,Ltd.

Address before: Room 2202, 22 / F, Wantong building, No. 3002, Sungang East Road, Sungang street, Luohu District, Shenzhen City, Guangdong Province

Patentee before: Shenzhen dragon totem technology achievement transformation Co.,Ltd.

Effective date of registration: 20221228

Address after: Room 2202, 22 / F, Wantong building, No. 3002, Sungang East Road, Sungang street, Luohu District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen dragon totem technology achievement transformation Co.,Ltd.

Address before: 212003, No. 2, Mengxi Road, Zhenjiang, Jiangsu

Patentee before: JIANGSU University OF SCIENCE AND TECHNOLOGY

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210226

CF01 Termination of patent right due to non-payment of annual fee