CN113127737B - 融合注意力机制的个性化搜索方法和搜索系统 - Google Patents

融合注意力机制的个性化搜索方法和搜索系统 Download PDF

Info

Publication number
CN113127737B
CN113127737B CN202110399302.0A CN202110399302A CN113127737B CN 113127737 B CN113127737 B CN 113127737B CN 202110399302 A CN202110399302 A CN 202110399302A CN 113127737 B CN113127737 B CN 113127737B
Authority
CN
China
Prior art keywords
user
item
visible
layer
user preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110399302.0A
Other languages
English (en)
Other versions
CN113127737A (zh
Inventor
暴琳
宋英磊
晋春
盖志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University of Science and Technology
Original Assignee
Jiangsu University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University of Science and Technology filed Critical Jiangsu University of Science and Technology
Priority to CN202110399302.0A priority Critical patent/CN113127737B/zh
Publication of CN113127737A publication Critical patent/CN113127737A/zh
Application granted granted Critical
Publication of CN113127737B publication Critical patent/CN113127737B/zh
Priority to PCT/CN2022/083375 priority patent/WO2022218139A1/zh
Priority to JP2022578858A priority patent/JP7393060B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明公开了一种融合注意力机制的个性化搜索方法和搜索系统,其中搜索方法包括:1、收集并获取用户在互联网信息媒体中生成的大量用户生成内容,进行向量化表示;2、构建优势项目群体;3、构建并训练融合注意力机制的用户偏好感知模型,该模型基于DBN,由三层RBM组成;4、构建基于用户偏好的分布估计概率模型;5、设定种群大小N,采用基于用户偏好的分布估计概率模型,生成N个新个体;6、在搜索空间中选择与N个新个体相似度最高的N个项目,构成待推荐项目集合Su;7、计算Su中各项目的适应值;8、选择Su中适应值最高的前TopN个项目作为搜索结果,进行个性化推荐。该方法考虑了不同决策分量对于用户偏好的影响力不同,能够帮助用户更有效地进行个性化搜索。

Description

融合注意力机制的个性化搜索方法和搜索系统
技术领域
本发明属于数据挖掘技术领域,具体涉及一种个性化搜索方法和搜索系统。
背景技术
随着大数据、云计算、物联网等技术的迅猛发展,互联网规模和用户数量急剧增加,用户已经成为数据的主动创造者,聚集了大量多源异构用户生成内容,各类信息错综复杂并呈现爆炸式增长。用户生成内容包含海量多源异构且动态演化的复杂数据,具有来源与结构多样化、稀疏性、多模态、不完整性、传播社会性等特点,蕴含着丰富的有价值信息和巨大的挖掘潜力,也是各类互联网平台和移动应用商家获取信息、提升业绩与服务的重要来源,成为一类典型的大数据环境。然而,这些复杂多源异构用户生成内容给用户带来新资讯的同时,也增加了用户筛选、甄别和处理信息并最终做出决策的难度,即带来了“信息过载”问题。个性化搜索和推荐算法作为连接用户与信息的桥梁,能够充分利用海量多源异构用户生成数据,根据用户潜在需求与认知偏好预测用户行为和发展动态,尽可能帮助用户从海量信息中筛选出与用户需求和兴趣偏好相符的内容,有效缓解“信息过载”,提升用户的使用体验和网站平台的商业利益。
面向用户生成内容的个性化搜索任务,其本质是在多源异构用户生成数据构成的动态演化空间中搜寻满足用户需求及个性化偏好的优化目标,即一类动态定性指标优化问题。由于这类复杂定性指标优化问题,不仅其目标函数和性能指标不能用数学函数准确描述,甚至其优化问题的决策变量也不再是简单的结构化数据,往往具有较大的主观性、模糊性、不确定性及不一致性,需要用户依据经验知识和兴趣偏好对于待搜索项目进行定性分析、评价和决策,从而难以建立具体精确的数学模型进行描述。近年来提出的融入人类智能评价的交互式协同进化计算,将用户主观认知经验、智能评价决策与传统进化计算相结合,是处理上述复杂个性化搜索定性指标优化问题的有效途径。
申请号为CN2020102165574的中国专利公开了一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法,其中用户兴趣偏好模型的构建未考虑描述不同项目属性决策变量对于用户偏好影响力不同,而对于所用项目的决策变量采用了相同权重,不能够充分体现各决策变量对于用户偏好的影响,从而难以构建更加精确的用户偏好模型,进一步影响用户进行个性化搜索的效果。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种融合注意力机制的个性化搜索方法和搜索系统,其中搜索方法考虑了不同决策分量对用户偏好的影响力不同,能够帮助用户更有效地进行个性化搜索。
技术方案:本发明一方面公开了一种融合注意力机制的个性化搜索方法,包括:
步骤1、收集并获取用户生成内容,所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分;将文本评论进行向量化,项目图像进行特征提取,获取特征向量;
步骤2、将用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目组成含用户偏好的优势项目群体D;D中的项目构成集合S,S={(u,xi,Ci,Ti,Gi)},其中xi∈D,Ci为项目xi的类别标签向量,Ti为用户对项目xi文本评论的向量化表示,Gi为项目xi的图像特征向量化表示,i=1,2,…,|D|,|D|表示D中的项目数量;
步骤3、构建融合注意力机制的用户偏好感知模型,所述模型基于深度置信网络,由三层受限玻尔兹曼机组成,其中第一层受限玻尔兹曼机的可见层包括第一组可见单元v1、第二组可见单元v2和第三组可见单元v3,隐藏层为h1;h1作为可见层,与隐藏层h2构成第二层RBM;h2作为可见层,与隐藏层h3构成第三层RBM;所述融合注意力机制的用户偏好感知模型的参数为θ={θ123}={w1,a1,b1,w2,a2,b2,w3,a3,b3};
利用优势项目群体D,采用对比散度学习算法对融合注意力机制的用户偏好感知模型中的第一层RBM进行训练,获得其模型参数θ1={w1,a1,b1};
第一层RBM模型训练完成后,当给定隐单元状态时,各可见单元的激活状态条件独立,某项目xi的向量表示[Ci,Ti,Gi]输入可见层,其第一组、第二组和第三组可见单元的激活概率分别为:
Figure BDA0003019786170000031
Figure BDA0003019786170000032
Figure BDA0003019786170000033
其中,a1,j、a1,k和a1,l分别表示第一组、第二组和第三组可见单元偏置。
计算各类多源异构数据的信息熵,项目类别标签的信息熵为:
Figure BDA0003019786170000034
文本评论向量的信息熵为:
Figure BDA0003019786170000035
项目图像特征向量的信息熵为:
Figure BDA0003019786170000036
其中cij表示项目xi的类别标签向量Ci的第j个元素,p(cij)表示RBM1中对应于项目类别标签向量表示的第j个元素的可见单元激活概率;
tik表示用户u对项目xi文本评论向量化表示Ti的第k个元素,p(tik)表示RBM1中对应于用户文本评论向量表示的第k个元素的可见单元激活概率;
gil表示,p(gil)表示项目xi的图像特征向量化表示Gi的第l个元素,p(gil)表示RBM1中对应于项目图像特征向量表示的第l个元素的可见单元激活概率;
其次,计算各类信息熵占总信息熵的比例作为权重因子:
Figure BDA0003019786170000037
其中H(xi)=H(Ci)+H(Ti)+H(Gi);
将向量Ci、Ti、Gi组合构成项目xi的决策向量Ψi输入v1、v2、v3中各可见单元时,隐藏层h1中各隐单元的激活状态条件独立,第m1个隐单元的激活概率为:
Figure BDA0003019786170000041
其中,m1=1,2,…,M1
Figure BDA0003019786170000042
为h1中第m1个隐单元的偏置;v1j为RMB1第一组可见单元v1中第j个可见单元的状态;v2k为RMB1第二组可见单元v2中第k个可见单元的状态;v3lRMB1第三组可见单元v3中第l个可见单元的状态;
Figure BDA0003019786170000043
为w1中的元素值,表示RBM1中第n个可见单元与第m1个隐单元之间的连接权重,n=1,2,…,Φ;
Figure BDA0003019786170000044
表示隐层h1中第m1个隐单元的状态;σ(x)=1/(1+exp(-x))是sigmoid激活函数;
RBM1训练完成后,根据式(9)获取项目xi对应的各隐单元的状态,进而获得用户对于优势项目群体D中各项目的各决策分量的偏好程度,即可见层单元激活概率,作为注意力权重系数atn(xi):
Figure BDA0003019786170000045
其中
Figure BDA0003019786170000046
表示Ψi作为RBM1可见层各可见单元状态时,隐藏层h1中第m1个隐单元的状态;atn(xi)表示项目xi各决策分量ψin的注意力权重;
将注意力权重系数atn(xi)作为项目xi各决策分量的权重系数,对优势项目群体D中项目xi进行基于注意力机制的编码,编码后表示为xati
xati=Ψi+atn(xi)×Ψi (12)
将xati输入预训练后的RBM1,得到可见单元激活概率VRBM1(xati):
Figure BDA0003019786170000051
其中xatn′为xati的第n′个元素;
由RBM1可见单元激活概率VRBM1(xati)进行自注意力机制运算,动态学习项目个体的用户偏好注意力权重向量A(xati):
A(xati)=softmax(a(VRBM1(xati),w1)) (14)
其中,softmax()函数保证所有权重系数之和为1;函数a(VRBM1(xati),w1)衡量了项目xi相对于用户偏好特征的注意力权重系数,计算如下:
a(VRBM1(xati),w1)=VRBM1(xati)·(w1)T (15)
结合用户偏好注意力权重向量A(xati)和项目xi的原始决策向量Ci,Ti,Gi,生成融合注意力机制的项目决策向量:
xi′=A(xati)×Ψi (16)
利用融合注意力机制的项目决策向量xi′构成训练集,对DBN中的RBM1、RBM2、RBM3模型进行逐层训练,训练完成后获得融合注意力机制的基于DBN的用户偏好感知模型及其优化模型参数θ;
步骤4、根据已训练好的融合注意力机制的基于DBN的用户偏好感知模型及其模型参数,建立构建基于用户偏好的分布估计概率模型P(x):
P(x)=[P(ψ1),P(ψ2),…,P(ψn),…,P(ψΦ)] (17)
其中(ψ12,…,ψn,…,ψΦ)为项目x的原始决策向量,P(ψn)表示用户偏好的项目第n个决策分量的概率;
步骤5、设定种群大小N,利用基于用户偏好的分布估计概率模型P(x),采用分布估计算法生成N个新个体,每个个体为一个项目;第v个新个体的类别标签向量
Figure BDA0003019786170000052
的设置步骤如下:
(5.1)令v=1;
(5.2)生成[0,1]之间的随机数z;如果z≤P(ψj=1),则第v个新个体的类别标签向量
Figure BDA0003019786170000061
的第j个元素为1,否则为0;
(5.3)令v加一,重复步骤(5.2),直至v>N;
步骤6、在搜索空间中选择与N个新个体类别标签向量
Figure BDA0003019786170000062
相似度最高的N个项目,构成待推荐项目集合Su
步骤7、计算待推荐项目集合Su中各项目的适应值
Figure BDA0003019786170000063
Figure BDA0003019786170000064
其中,
Figure BDA0003019786170000065
Figure BDA0003019786170000066
分别表示待推荐项目集合Su中项目能量函数的最大值和最小值;Fθ1(x*,h1)为项目x*的能量函数,x*∈Su,其计算如下:
Figure BDA0003019786170000067
其中
Figure BDA0003019786170000068
为项目x*的第n个决策分量;
步骤8、选择Su中适应值最高的前TopN个项目作为搜索结果,TopN<N;
随着用户交互式搜索过程的推进和用户行为动态演变,根据当前用户最近的评价数据,更新优势项目群体D,再次训练融合注意力机制的用户偏好感知模型,动态更新提取的用户偏好特征,同时,更新基于用户偏好的分布估计概率模型P(x)。
另一方面,本发明还公开了实现上述个性化搜索方法的搜索系统,包括:
用户生成内容获取模块,用于收集并获取用户u生成内容,所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分;将文本评论进行向量化,项目图像进行特征提取,获取特征向量;
优势项目群体构建模块,用于将用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目组成含用户偏好的优势项目群体D;
用户偏好感知模型构建与训练模块,用于构建并训练融合注意力机制的用户偏好感知模型;所述模型基于深度置信网络,由三层受限玻尔兹曼机组成,其中第一层受限玻尔兹曼机的可见层包括第一组可见单元v1、第二组可见单元v2和第三组可见单元v3,隐藏层为h1;h1作为可见层,与隐藏层h2构成第二层受限玻尔兹曼机;h2作为可见层,与隐藏层h3构成第三层受限玻尔兹曼机;所述融合注意力机制的用户偏好感知模型的参数为θ={θ123}={w1,a1,b1,w2,a2,b2,w3,a3,b3};
基于用户偏好的分布估计概率模型构建模块,用于根据已训练好的融合注意力机制的基于深度置信网络的用户偏好感知模型及其模型参数,建立构建基于用户偏好的分布估计概率模型P(x):
P(x)=[P(ψ1),P(ψ2),…,P(ψn),…,P(ψΦ)] (17)
其中(ψ12,…,ψn,…,ψΦ)为项目x的原始决策向量,P(ψn)表示用户对于项目的第n个决策分量的偏好概率;
种群生成模块,用于利用基于用户偏好的分布估计概率模型P(x),采用分布估计算法生成N个新个体,每个个体为一个项目,并设置每个新个体的类别标签向量,N为预设的种群大小;
待推荐项目集合构建模块,用于在搜索空间中选择与N个新个体类别标签向量
Figure BDA0003019786170000071
相似度最高的N个项目,构成待推荐项目集合Su
适应值计算模块,用于计算待推荐项目集合Su中各项目的适应值;
搜索结果选择模块,用于选择Su中适应值最高的前TopN个项目作为搜索结果,TopN<N。
有益效果:本发明公开的个性化搜索方法充分利用多源异构用户生成内容,包括用户评分、项目类别标签、用户文本评论、评价信任度和项目图像信息,构建融合注意力机制的用户偏好感知模型,基于此用户偏好感知模型,构建基于用户偏好的分布估计概率模型,生成含用户偏好的新的可行解项目,选择适应值最高的多个项目作为最终搜索结果。该方法能够很好地处理大数据环境下面向多源异构用户生成内容的个性化搜索任务,有效引导用户进行个性化搜索,尽快帮助用户搜索到满意解,提高个性化搜索算法的综合性能。
附图说明
图1为本发明公开融合注意力机制的个性化搜索方法的流程图;
图2为融合注意力机制的用户偏好感知模型的结构示意图;
图3为融合注意力机制的个性化搜索系统的组成示意图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明。
如图1所示,本发明公开了一种融合注意力机制的个性化搜索方法,包括:
步骤1、收集并获取用户生成内容,所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分;将文本评论进行向量化,项目图像进行特征提取,获取特征向量;
本实施例中对于文本评论向量化表示的步骤为:去除文本评论中的停用词和标点符号等,进行数据预处理;采用文献:Devlin J,Chang M W,Lee K,et al.BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding[J].arXiv:1810.04805v2[cs.CL]24May 2019.中的BERT模型,将用户文本评论进行向量化表示。
对项目图像提取特征是利用文献:Krizhevsky A,SutskeverI,Hinton G E.ImageNet classification with deep convolutional neural networks.In:Proceedings ofthe 25th International Conference on Neural Information ProcessingSystems.Lake Tahoe,Nevada,USA:Curran Associates Inc.,2012.1097-1105.中的AlexNet模型,将项目图像进行特征提取及向量化表示。
其他用户对用户u所做评价的有用性评断,是指其他用户对于当前用户u就某一项目的评价信息做出对其有用的评断,如果认为有用就标注1,否则标注0,统计所有其他用户对当前用户u就某一项目的评价信息的评断,标注为1的总数即为其他用户对用户u所做评价的有用性评价得分。例如,当前用户u就项目x做出了评价,用户A和用户B对该评价做了有用性评断,该评断反映了当前用户对项目x评价的可信度,通过统计所有其他用户对当前用户u就项目x评价的有用性评断,可以过滤无效评价或者虚假评论。
其他用户对用户u所做评价的有用性评价得分与用户u评价项目的总数的比值,为用户u对项目评价的信任度。
步骤2、构建用户偏好的优势项目群体D;
用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目是用户偏好的项目。由于用户的具有模糊性、不确定性和动态变化的特性,本实施例在已有的用户偏好项目群体中引入一定的随机性,以增加用户的选择范围,使得用户的选择不要过于局限于当前偏好信息的范围内,适应实际情况下的环境和用户偏好的动态变化性。由此,将评分大于预设评分阈值且信任度大于预设信任度阈值的项目,以及在搜索空间随机采样的多个新项目,组成优势项目群体D。优势项目群体D中加入的新项目可能包含用户偏好,也可能不包含用户偏好,是随机的,其增加了项目群体的多样性。新项目在优势项目群体D中的占比不超过30%,本实施例中,新项目占优势项目群体D中项目总数的10%。
由于新项目是在搜索空间随机采样的,当前用户u可能对其作出了评价,也可能没有评价。如果当前用户u对新项目没有评价,则采用当前用户u的相似用户u′对该新项目的文本评论作为用户u对该新项目的评价;如果用户u的多个相似用户均对该新项目作出评价,则选择其中与用户u相似度最大的用户的评价。如果当前用户u的相似用户均没有对该新项目作出评价,用户u对该新项目的评价采用随机赋值的方式。
用户u的相似用户为与用户u存在共同评分项目,且相似度大于预设的相似度阈值的用户。对于与用户u存在共同评分项目的用户u′,u′≠u,u和u′的相似度Sim(u,u′)为:
Figure BDA0003019786170000091
其中Iu,u′表示用户u和u′均评分的项目集合;Rux'为用户u对Iu,u′中的项目x′的评分,Ru′x'为用户u′对x′的评分;
Figure BDA0003019786170000092
为用户u对已评价的所有项目的平均评分;
Figure BDA0003019786170000093
为用户u′对已评价的所有项目的平均评分。
优势项目群体D构成集合S,S={(u,xi,Ci,Ti,Gi)},其中xi∈D,Ci为项目xi的类别标签向量,长度为类别总数n1;Ci中每个元素cij为二值变量;cij=1表示项目xi具有第j类标签,j=1,2,…,n1;且不同类别标签之间非互斥,一个项目可以同时存在多个类别标签。Ti为用户对项目xi文本评论的向量化表示,长度为n2;Gi为项目xi的图像特征向量化表示,长度为n3;i=1,2,…,|D|,|D|表示D中的项目数量。
向量Ci、Ti、Gi组合为一个长度为Φ的向量Ψi,构成项目xi的原始决策向量,其每一个元素ψin为项目xi的决策分量,Φ=n1+n2+n3,n=1,2,…,Φ。
步骤3、构建融合注意力机制的用户偏好感知模型,如图2所示,该模型基于深度置信网络(Deep Belief Network,DBN),该模型由三层受限玻尔兹曼机(RestrictedBoltzmann Machine,RBM)组成,其中第一层受限玻尔兹曼机RBM1的可见层包括第一组可见单元v1、第二组可见单元v2和第三组可见单元v3,隐藏层为h1;其中第一组可见单元v1有n1个单元,各单元为二值变量;第二组和第三组可见单元v2和v3分别有n2和n3个单元,各单元均为实数变量;h1作为可见层,与隐藏层h2构成第二层受限玻尔兹曼机RBM2;h2作为可见层,与隐藏层h3构成第三层受限玻尔兹曼机RBM3。h1、h2、h3分别有M1、M2和M3个隐单元,各隐单元均为实数变量;对于各RBM,隐单元数目选取为可见单元总数的0.8-1.2倍,本实施例中,设置为0.8倍。由此,h1中隐单元的数目M1为:
Figure BDA0003019786170000101
Φ=n1+n2+n3
Figure BDA0003019786170000102
为向上取整运算;h2中隐单元的数目M2为:
Figure BDA0003019786170000103
h3中隐单元的数目M3为:
Figure BDA0003019786170000104
融合注意力机制的用户偏好感知模型的参数为θ={θ123}={w1,a1,b1,w2,a2,b2,w3,a3,b3},其中,{w1,a1,b1}、{w2,a2,b2}和{w3,a3,b3}分别表示RBM1、RBM2、RBM3的模型参数,wτ表示第τ层RBM可见单元与隐单元之间的连接权重;aτ和bτ分别表示第τ层RBM可见单元和隐单元的偏置;τ∈{1,2,3}。
利用优势项目群体D,采用对比散度学习算法对融合注意力机制的用户偏好感知模型中的第一层受限玻尔兹曼机RBM1进行训练,获得其模型参数θ1={w1,a1,b1}。此步骤中只对RBM1进行训练,可以认为是对RBM1的预训练,后续步骤中会对RBM1、RBM2、RBM3再次逐层进行训练。项目xi的决策向量Ψi是由Ci、Ti、Gi组合而成,而Ci、Ti、Gi包含的用户偏好信息不同,如类别标签向量Ci的长度n1通常小于项目的图像特征向量化表示Gi的长度n3;如果对项目的决策向量中每个分量平等对待,将导致包含信息量较多的数据淹没含偏好信息较少的数据,而这类含偏好信息较少的数据对于构建用户偏好感知模型是有益补充,不容忽视。因而,本发明考虑结合各数据类型表示的信息熵,利用权重调整各类多源异构数据输入到用户偏好感知模型可见层神经单元的分量,保证各类型数据都能够对于用户偏好感知模型的构建产生有效贡献。
第一层RBM模型训练完成后,当给定隐单元状态时,各可见单元的激活状态条件独立,某项目xi的向量表示[Ci,Ti,Gi]输入可见层,其第一组、第二组和第三组可见单元的激活概率分别为:
Figure BDA0003019786170000111
Figure BDA0003019786170000112
Figure BDA0003019786170000113
其中,a1,j、a1,k和a1,l分别表示第一组、第二组和第三组可见单元偏置,a1,j,a1,k,a1,l组合为a1,j=1,2,…,n1,k=1,2,…,n2,l=1,2,…,n3
根据信息熵公式:
Figure BDA0003019786170000114
计算各类多源异构数据的信息熵,
项目类别标签的信息熵为:
Figure BDA0003019786170000121
文本评论向量的信息熵为:
Figure BDA0003019786170000122
项目图像特征向量的信息熵为:
Figure BDA0003019786170000123
其中cij表示项目xi的类别标签向量Ci的第j个元素,p(cij)表示RBM1中对应于项目类别标签向量表示的第j个元素的可见单元激活概率;
tik表示用户u对项目xi文本评论向量化表示Ti的第k个元素,p(tik)表示RBM1中对应于用户文本评论向量表示的第k个元素的可见单元激活概率;
gil表示,p(gil)表示项目xi的图像特征向量化表示Gi的第l个元素,p(gil)表示RBM1中对应于项目图像特征向量表示的第l个元素的可见单元激活概率;
其次,进一步计算各类信息熵占总信息熵的比例作为权重因子:
Figure BDA0003019786170000124
其中H(xi)=H(Ci)+H(Ti)+H(Gi);
当给定可见单元状态时,即将向量Ci、Ti、Gi组合而构成项目xi的决策向量Ψi输入v1、v2、v3中各可见单元时,隐藏层h1中各隐单元的激活状态条件独立,第m1个隐单元的激活概率为:
Figure BDA0003019786170000125
其中,m1=1,2,…,M1
Figure BDA0003019786170000126
为h1中第m1个隐单元的偏置;v1j为RMB1第一组可见单元v1中第j个可见单元的状态,即Ci第j个元素的值;v2k为RMB1第二组可见单元v2中第k个可见单元的状态,即Τi第k个元素的值;v3lRMB1第三组可见单元v3中第l个可见单元的状态,即Gi第l个元素的值;
Figure BDA0003019786170000131
为w1中的元素值,表示RBM1中第n个可见单元与第m1个隐单元之间的连接权重,n=1,2,…,Φ;
Figure BDA0003019786170000132
表示隐层h1中第m1个隐单元的状态;σ(x)=1/(1+exp(-x))是sigmoid激活函数。
当给定隐单元状态时,各可见单元的激活状态亦条件独立,第n个可见单元的激活概率为:
Figure BDA0003019786170000133
其中a1,n表示可见层中第n个可见单元的偏置。
RBM1训练完成后,根据式(5)可获取项目xi对应的各隐单元的状态,进而可获得用户对于优势项目群体D中各项目的各决策分量的偏好程度,即可见层单元激活概率,作为注意力权重系数atn(xi):
Figure BDA0003019786170000134
其中
Figure BDA0003019786170000135
表示Ψi作为RBM1可见层各可见单元状态时,隐藏层h1中第m1个隐单元的状态;atn(xi)表示项目xi各决策分量ψin的注意力权重,体现了自适应的特性。
将注意力权重系数atn(xi)作为项目xi各决策分量的权重系数,对优势项目群体D中项目xi进行基于注意力机制的编码,编码后表示为xati
xati=Ψi+atn(xi)×Ψi (12)
其中i=1,2,…,|D|;
将xati输入预训练后的RBM1,得到可见单元激活概率VRBM1(xati):
Figure BDA0003019786170000141
其中xatn′为xati的第n′个元素。
式(9)实际是将隐单元激活概率和可见单元激活概率进行了嵌套,即:
Figure BDA0003019786170000142
Figure BDA0003019786170000143
利用获得的RBM1模型中可见单元激活概率VRBM1(xati)和文献:Li J,Wang Y,Mcauley J.Time Interval Aware Self-Attention for SequentialRecommendation.In:WSDM'20:The Thirteenth ACM International Conference on WebSearch and Data Mining.ACM,2020.中所提自注意力机制,由RBM1可见单元激活概率VRBM1(xati)进行自注意力机制运算,动态学习项目个体的用户偏好注意力权重向量A(xati):
A(xati)=softmax(a(VRBM1(xati),w1)) (14)
其中,softmax()函数保证所有权重系数之和为1。函数a(VRBM1(xati),w1)衡量了项目xi相对于用户偏好特征的注意力权重系数,计算如下:
a(VRBM1(xati),w1)=VRBM1(xati)·(w1)T (15)
结合用户偏好注意力权重向量A(xati)和项目xi的原始决策向量Ci,Ti,Gi,生成融合注意力机制的项目决策向量:
xi′=A(xati)×Ψi (16)
利用融合注意力机制的项目决策向量xi′构成训练集,对DBN中的RBM1、RBM2、RBM3模型进行逐层训练,首先训练RBM1,得到参数{w1,a1,b1};将b1传递进RBM2中的a2,在此基础上训练RBM2,获得优化参数{w2,a2,b2};将b2传递进RBM3中的a3,在此基础上训练RBM3,获得优化参数{w3,a3,b3};从而使得DBN网络中的三层RBM模型相互影响、相互关联,形成一个网络整体。训练完成后获得融合注意力机制的基于DBN的用户偏好感知模型及其优化模型参数θ。
此处的DBN的模型训练方法是一种改进的基于注意力机制的DBN模型训练方法,目的是为了更好的利用自适应权重信息抽取用户偏好特征,将注意力集中于重要的特征,更贴切的表达实际应用场景中各项目不同类型的属性决策分量对于用户偏好特征的影响,更加精细的表达用户偏好特征。
步骤4、根据已训练好的融合注意力机制的基于DBN的用户偏好感知模型及其模型参数,建立构建基于用户偏好的分布估计概率模型P(x):
P(x)=[P(ψ1),P(ψ2),…,P(ψn),…,P(ψΦ)] (17)
其中(ψ12,…,ψn,…,ψΦ)为项目x的原始决策向量,P(ψn)表示用户对于项目的第n个决策分量的偏好概率,其计算如下:
首先根据优势项目群体D计算基于用户偏好的概率分布模型p(x):
Figure BDA0003019786170000151
p(x)为Φ维向量,其第n个元素p(ψn)为用户偏好项目第n个决策分量的激活概率;对p(ψn)进行下界约束,约束后的值为用户偏好的项目第n个决策分量的概率P(ψn),即:
Figure BDA0003019786170000152
ε为预设的下界阈值,本实施例中ε=0.1,即对于根据式(18)计算出的激活概率小于0.1的决策分量,将其激活概率值设为0.1;该约束考虑了决策分量激活概率较小时,以一定概率值随机采样该决策分量,以增强生成种群的多样性,防止进化优化算法过早收敛而错失最优解。
步骤5、设定种群大小N,利用基于用户偏好的分布估计概率模型P(x),采用分布估计算法(Estimation of Distribution Algorithms,EDA)生成N个新个体,每个个体为一个项目;第v个新个体的类别标签向量
Figure BDA0003019786170000153
的设置步骤如下:
(5.1)令v=1;
(5.2)生成[0,1]之间的随机数z;如果z≤P(ψj=1),则第v个新个体的类别标签向量
Figure BDA0003019786170000161
的第j个元素为1,否则为0;
(5.3)令v加一,重复步骤(5.2),直至v>N;
步骤6、在搜索空间中选择与N个新个体类别标签向量
Figure BDA0003019786170000162
相似度最高的N个项目,构成待推荐项目集合Su;本实施例中,采用欧氏距离作为相似度计算,即两向量之间的欧氏距离越小,二者相似度越高;
步骤7、计算待推荐项目集合Su中各项目的适应值:
本发明中,采用基于能量函数来计算项目的适应值,对待推荐项目集合Su中的项目x*,其适应值
Figure BDA0003019786170000163
的计算如下:
Figure BDA0003019786170000164
其中,
Figure BDA0003019786170000165
Figure BDA0003019786170000166
分别表示待推荐项目集合Su中项目能量函数的最大值和最小值;
Figure BDA0003019786170000167
为项目x*的能量函数(x*∈Su),其计算如下:
Figure BDA0003019786170000168
其中a1,n表示RBM1可见层中第n个可见单元的偏置,
Figure BDA0003019786170000169
为项目x*的第n个决策分量,
Figure BDA00030197861700001610
为h1中第m1个隐单元的偏置,
Figure BDA00030197861700001611
为w1中的元素值,表示RBM1中第n个可见单元与第m1个隐单元之间的连接权重。
步骤8、选择Su中适应值最高的前TopN个项目作为搜索结果,TopN<N。
由于多源异构用户生成内容的动态演化特性和用户兴趣偏好的不确定性,在个性化进化搜索过程的早期阶段,优势项目群体D中包含的用户偏好信息不够充足,因而基于此训练的用户偏好感知模型抽取的用户偏好特征较粗略。随着用户交互式搜索过程的推进和用户行为动态演变,根据当前用户最近的评价数据,更新优势项目群体D,再次训练融合注意力机制的用户偏好感知模型,动态更新提取的用户偏好特征,及时跟踪用户偏好变化;同时,更新基于用户偏好的分布估计概率模型P(x),有效引导个性化进化搜索的前进方向,帮助用户尽快搜寻到用户满意解,顺利完成复杂环境下个性化搜索任务。
本实施例还公开了实现上述个性化搜索方法的融合注意力机制的个性化搜索系统,如图3所示,包括:
用户生成内容获取模块1,用于收集并获取用户u生成内容,所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分;将文本评论进行向量化,项目图像进行特征提取,获取特征向量;
优势项目群体构建模块2,用于将用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目组成含用户偏好的优势项目群体D;
用户偏好感知模型构建与训练模块3,用于根据步骤3构建并训练融合注意力机制的用户偏好感知模型;所述模型基于深度置信网络,由三层受限玻尔兹曼机组成,其中第一层受限玻尔兹曼机的可见层包括第一组可见单元v1、第二组可见单元v2和第三组可见单元v3,隐藏层为h1;h1作为可见层,与隐藏层h2构成第二层受限玻尔兹曼机;h2作为可见层,与隐藏层h3构成第三层受限玻尔兹曼机;所述融合注意力机制的用户偏好感知模型的参数为θ={θ123}={w1,a1,b1,w2,a2,b2,w3,a3,b3};
基于用户偏好的分布估计概率模型构建模块4,用于根据已训练好的融合注意力机制的基于深度置信网络的用户偏好感知模型及其模型参数,建立构建基于用户偏好的分布估计概率模型P(x):
P(x)=[P(ψ1),P(ψ2),…,P(ψn),…,P(ψΦ)] (17)
其中(ψ12,…,ψn,…,ψΦ)为项目x的原始决策向量,P(ψn)表示用户对于项目的第n个决策分量的偏好概率;
种群生成模块5,用于利用基于用户偏好的分布估计概率模型P(x),采用分布估计算法生成N个新个体,每个个体为一个项目,并设置每个新个体的类别标签向量,N为预设的种群大小;
待推荐项目集合构建模块6,用于在搜索空间中选择与N个新个体类别标签向量
Figure BDA0003019786170000181
相似度最高的N个项目,构成待推荐项目集合Su
适应值计算模块7,用于根据步骤7计算待推荐项目集合Su中各项目的适应值;
搜索结果选择模块8,用于选择Su中适应值最高的前TopN个项目作为搜索结果,TopN<N。

Claims (10)

1.融合注意力机制的个性化搜索方法,其特征在于,包括:
步骤1、收集并获取用户u生成内容,所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分;将文本评论进行向量化,项目图像进行特征提取,获取特征向量;
步骤2、将用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目组成含用户偏好的优势项目群体D;D中的项目构成集合S,S={(u,xi,Ci,Ti,Gi)},其中xi∈D,Ci为项目xi的类别标签向量,Ti为用户对项目xi文本评论的向量化表示,Gi为项目xi的图像特征向量化表示,i=1,2,…,|D|,|D|表示D中的项目数量;
步骤3、构建融合注意力机制的用户偏好感知模型,所述模型基于深度置信网络,由三层受限玻尔兹曼机组成,其中第一层受限玻尔兹曼机的可见层包括第一组可见单元v1、第二组可见单元v2和第三组可见单元v3,隐藏层为h1;h1作为可见层,与隐藏层h2构成第二层受限玻尔兹曼机;h2作为可见层,与隐藏层h3构成第三层受限玻尔兹曼机;所述融合注意力机制的用户偏好感知模型的参数为θ={θ123}={w1,a1,b1,w2,a2,b2,w3,a3,b3};
利用优势项目群体D,采用对比散度学习算法对融合注意力机制的用户偏好感知模型中的第一层受限玻尔兹曼机进行训练,获得其模型参数θ1={w1,a1,b1};
第一层RBM模型训练完成后,当给定隐单元状态时,各可见单元的激活状态条件独立,某项目xi的向量表示[Ci,Ti,Gi]输入可见层,其第一组、第二组和第三组可见单元的激活概率分别为:
Figure FDA0003019786160000011
Figure FDA0003019786160000012
Figure FDA0003019786160000013
其中,a1,j、a1,k和a1,l分别表示第一组、第二组和第三组可见单元偏置;
计算各类多源异构数据的信息熵,项目类别标签的信息熵为:
Figure FDA0003019786160000021
文本评论向量的信息熵为:
Figure FDA0003019786160000022
项目图像特征向量的信息熵为:
Figure FDA0003019786160000023
其中cij表示项目xi的类别标签向量Ci的第j个元素,p(cij)表示RBM1中对应于项目类别标签向量表示的第j个元素的可见单元激活概率;
tik表示用户u对项目xi文本评论向量化表示Ti的第k个元素,p(tik)表示RBM1中对应于用户文本评论向量表示的第k个元素的可见单元激活概率;
gil表示,p(gil)表示项目xi的图像特征向量化表示Gi的第l个元素,p(gil)表示RBM1中对应于项目图像特征向量表示的第l个元素的可见单元激活概率;
其次,计算各类信息熵占总信息熵的比例作为权重因子:
Figure FDA0003019786160000024
其中H(xi)=H(Ci)+H(Ti)+H(Gi);
将向量Ci、Ti、Gi组合构成项目xi的决策向量Ψi输入v1、v2、v3中各可见单元时,隐藏层h1中各隐单元的激活状态条件独立,第m1个隐单元的激活概率为:
Figure FDA0003019786160000025
其中,m1=1,2,…,M1
Figure FDA0003019786160000026
为h1中第m1个隐单元的偏置;v1j为RMB1第一组可见单元v1中第j个可见单元的状态;v2k为RMB1第二组可见单元v2中第k个可见单元的状态;v3lRMB1第三组可见单元v3中第l个可见单元的状态;
Figure FDA0003019786160000031
为w1中的元素值,表示RBM1中第n个可见单元与第m1个隐单元之间的连接权重,n=1,2,…,Φ;
Figure FDA0003019786160000032
表示隐层h1中第m1个隐单元的状态;σ(x)=1/(1+exp(-x))是sigmoid激活函数;
RBM1训练完成后,根据式(9)获取项目xi对应的各隐单元的状态,进而获得用户对于优势项目群体D中各项目的各决策分量的偏好程度,即可见层单元激活概率,作为注意力权重系数atn(xi):
Figure FDA0003019786160000033
其中
Figure FDA0003019786160000034
表示Ψi作为RBM1可见层各可见单元状态时,隐藏层h1中第m1个隐单元的状态;atn(xi)表示项目xi各决策分量ψin的注意力权重;
将注意力权重系数atn(xi)作为项目xi各决策分量的权重系数,对优势项目群体D中项目xi进行基于注意力机制的编码,编码后表示为xati
xati=Ψi+atn(xi)×Ψi (12)
将xati输入预训练后的RBM1,得到可见单元激活概率VRBM1(xati):
Figure FDA0003019786160000035
其中xatn′为xati的第n′个元素;
由RBM1可见单元激活概率VRBM1(xati)进行自注意力机制运算,动态学习项目个体的用户偏好注意力权重向量A(xati):
A(xati)=softmax(a(VRBM1(xati),w1)) (14)
其中,softmax()函数保证所有权重系数之和为1;函数a(VRBM1(xati),w1)衡量了项目xi相对于用户偏好特征的注意力权重系数,计算如下:
a(VRBM1(xati),w1)=VRBM1(xati)·(w1)T (15)
结合用户偏好注意力权重向量A(xati)和项目xi的原始决策向量Ci,Ti,Gi,生成融合注意力机制的项目决策向量:
xi′=A(xati)×Ψi (16)
利用融合注意力机制的项目决策向量xi′构成训练集,对DBN中的RBM1、RBM2、RBM3模型进行逐层训练,训练完成后获得融合注意力机制的基于深度置信网络的用户偏好感知模型及其优化模型参数θ;
步骤4、根据已训练好的融合注意力机制的基于深度置信网络的用户偏好感知模型及其模型参数,建立构建基于用户偏好的分布估计概率模型P(x):
P(x)=[P(ψ1),P(ψ2),…,P(ψn),…,P(ψΦ)] (17)
其中(ψ12,…,ψn,…,ψΦ)为项目x的原始决策向量,P(ψn)表示用户对于项目的第n个决策分量的偏好概率;
步骤5、设定种群大小N,利用基于用户偏好的分布估计概率模型P(x),采用分布估计算法生成N个新个体,每个个体为一个项目;第v个新个体的类别标签向量
Figure FDA0003019786160000041
的设置步骤如下:
(5.1)令v=1;
(5.2)生成[0,1]之间的随机数z;如果z≤P(ψj=1),则第v个新个体的类别标签向量
Figure FDA0003019786160000042
的第j个元素为1,否则为0;
(5.3)令v加一,重复步骤(5.2),直至v>N;
步骤6、在搜索空间中选择与N个新个体类别标签向量
Figure FDA0003019786160000043
相似度最高的N个项目,构成待推荐项目集合Su
步骤7、计算待推荐项目集合Su中各项目的适应值
Figure FDA0003019786160000044
Figure FDA0003019786160000045
其中,
Figure FDA0003019786160000051
Figure FDA0003019786160000052
分别表示待推荐项目集合Su中项目能量函数的最大值和最小值;
Figure FDA0003019786160000053
为项目x*的能量函数,x*∈Su,其计算如下:
Figure FDA0003019786160000054
其中
Figure FDA0003019786160000055
为项目x*的第n个决策分量;
步骤8、选择Su中适应值最高的前TopN个项目作为搜索结果,TopN<N;
随着用户交互式搜索过程的推进和用户行为动态演变,根据当前用户最近的评价数据,更新优势项目群体D,再次训练融合注意力机制的用户偏好感知模型,动态更新提取的用户偏好特征,同时,更新基于用户偏好的分布估计概率模型P(x)。
2.根据权利要求1所述的融合注意力机制的个性化搜索方法,其特征在于,所述优势项目群体D中还包括占比为η的新项目,所述新项目通过在搜索空间随机采样得到。
3.根据权利要求2所述的融合注意力机制的个性化搜索方法,其特征在于,如果当前用户u对新项目没有评价,则采用当前用户u的相似用户u′对该新项目的文本评论作为用户u对该新项目的评价;如果用户u的多个相似用户均对该新项目作出评价,则选择其中与用户u相似度最大的用户的评价;如果当前用户u的相似用户均没有对该新项目作出评价,用户u对该新项目的评价采用随机赋值的方式。
4.根据权利要求3所述的融合注意力机制的个性化搜索方法,其特征在于,用户u的相似用户为与用户u存在共同评分项目,且相似度大于预设的相似度阈值的用户;对于与用户u存在共同评分项目的用户u′,u′≠u,u和u′的相似度Sim(u,u′)为:
Figure FDA0003019786160000056
其中Iu,u′表示用户u和u′均评分的项目集合;Rux'为用户u对Iu,u′中的项目x′的评分,Ru′x'为用户u′对x′的评分;
Figure FDA0003019786160000057
为用户u对已评价的所有项目的平均评分;
Figure FDA0003019786160000061
为用户u′对已评价的所有项目的平均评分。
5.根据权利要求1所述的融合注意力机制的个性化搜索方法,其特征在于,所述对DBN中的RBM1、RBM2、RBM3模型进行逐层训练,具体为:
首先训练RBM1,得到参数{w1,a1,b1};将b1传递进RBM2中的a2,在此基础上训练RBM2,获得优化参数{w2,a2,b2};将b2传递进RBM3中的a3,在此基础上训练RBM3,获得优化参数{w3,a3,b3}。
6.根据权利要求1所述的融合注意力机制的个性化搜索方法,其特征在于,所述用户偏好的项目第n个决策分量的概率P(ψn)的计算为:
首先根据优势项目群体D计算基于用户偏好的概率分布模型p(x):
Figure FDA0003019786160000062
p(x)为Φ维向量,其第n个元素p(ψn)为用户偏好项目第n个决策分量的激活概率;对p(ψn)进行下界约束,约束后的值为用户偏好的项目第n个决策分量的概率P(ψn),即:
Figure FDA0003019786160000063
ε为预设的下界阈值。
7.根据权利要求1所述的融合注意力机制的个性化搜索方法,其特征在于,所述三层受限玻尔兹曼机中,每一层受限玻尔兹曼机中隐藏层隐单元数目为可见层中可见单元数目的0.8-1.2倍。
8.根据权利要求2所述的融合注意力机制的个性化搜索方法,其特征在于,新项目在优势项目群体D中的占比η<30%。
9.根据权利要求1所述的融合注意力机制的个性化搜索方法,其特征在于,所述步骤6采用欧氏距离作为相似度计算,即两向量之间的欧氏距离越小,二者相似度越高。
10.融合注意力机制的个性化搜索系统,其特征在于,包括:
用户生成内容获取模块,用于收集并获取用户u生成内容,所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分;将文本评论进行向量化,项目图像进行特征提取,获取特征向量;
优势项目群体构建模块,用于将用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目组成含用户偏好的优势项目群体D;
用户偏好感知模型构建与训练模块,用于构建并训练融合注意力机制的用户偏好感知模型;所述模型基于深度置信网络,由三层受限玻尔兹曼机组成,其中第一层受限玻尔兹曼机的可见层包括第一组可见单元v1、第二组可见单元v2和第三组可见单元v3,隐藏层为h1;h1作为可见层,与隐藏层h2构成第二层受限玻尔兹曼机;h2作为可见层,与隐藏层h3构成第三层受限玻尔兹曼机;所述融合注意力机制的用户偏好感知模型的参数为θ={θ123}={w1,a1,b1,w2,a2,b2,w3,a3,b3};
基于用户偏好的分布估计概率模型构建模块,用于根据已训练好的融合注意力机制的基于深度置信网络的用户偏好感知模型及其模型参数,建立构建基于用户偏好的分布估计概率模型P(x):
P(x)=[P(ψ1),P(ψ2),…,P(ψn),…,P(ψΦ)] (17)
其中(ψ12,…,ψn,…,ψΦ)为项目x的原始决策向量,P(ψn)表示用户对于项目的第n个决策分量的偏好概率;
种群生成模块,用于利用基于用户偏好的分布估计概率模型P(x),采用分布估计算法生成N个新个体,每个个体为一个项目,并设置每个新个体的类别标签向量,N为预设的种群大小;
待推荐项目集合构建模块,用于在搜索空间中选择与N个新个体类别标签向量
Figure FDA0003019786160000071
相似度最高的N个项目,构成待推荐项目集合Su
适应值计算模块,用于计算待推荐项目集合Su中各项目的适应值;
搜索结果选择模块,用于选择Su中适应值最高的前TopN个项目作为搜索结果,TopN<N。
CN202110399302.0A 2021-04-14 2021-04-14 融合注意力机制的个性化搜索方法和搜索系统 Active CN113127737B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110399302.0A CN113127737B (zh) 2021-04-14 2021-04-14 融合注意力机制的个性化搜索方法和搜索系统
PCT/CN2022/083375 WO2022218139A1 (zh) 2021-04-14 2022-03-28 融合注意力机制的个性化搜索方法和搜索系统
JP2022578858A JP7393060B2 (ja) 2021-04-14 2022-03-28 注意メカニズムを融合したパーソナライズド検索方法及び検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110399302.0A CN113127737B (zh) 2021-04-14 2021-04-14 融合注意力机制的个性化搜索方法和搜索系统

Publications (2)

Publication Number Publication Date
CN113127737A CN113127737A (zh) 2021-07-16
CN113127737B true CN113127737B (zh) 2021-09-14

Family

ID=76776325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110399302.0A Active CN113127737B (zh) 2021-04-14 2021-04-14 融合注意力机制的个性化搜索方法和搜索系统

Country Status (3)

Country Link
JP (1) JP7393060B2 (zh)
CN (1) CN113127737B (zh)
WO (1) WO2022218139A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127737B (zh) * 2021-04-14 2021-09-14 江苏科技大学 融合注意力机制的个性化搜索方法和搜索系统
CN113987261B (zh) * 2021-11-08 2023-07-18 烟台大学 一种基于动态信任感知的视频推荐方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339428A (zh) * 2020-03-25 2020-06-26 江苏科技大学 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
CN112328900A (zh) * 2020-11-27 2021-02-05 北京工业大学 一种融合评分矩阵和评论文本的深度学习推荐方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
US7693827B2 (en) 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
CN111291261B (zh) * 2020-01-21 2023-05-26 江西财经大学 融合标签和注意力机制的跨领域推荐方法及其实现系统
CN113127737B (zh) * 2021-04-14 2021-09-14 江苏科技大学 融合注意力机制的个性化搜索方法和搜索系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339428A (zh) * 2020-03-25 2020-06-26 江苏科技大学 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
CN112328900A (zh) * 2020-11-27 2021-02-05 北京工业大学 一种融合评分矩阵和评论文本的深度学习推荐方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
Enhanced Interactive Estimation of Distribution Algorithms with Attention Mechanism and Restricted Boltzmann Machine;Lin Bao 等;《2020 IEEE Congress on Evolutionary Computation (CEC)》;20200903;1-9 *
Restricted Boltzmann Machine-driven Interactive Estimation of Distribution Algorithm for personalized search;LinBao 等;《Knowledge-Based Systems》;20200720;第200卷;1-11 *
基于RBM的深度神经网络算法研究;张健;《中国博士学位论文全文数据库 (信息科技辑)》;20210131(第01期);I140-75 *
基于受限玻尔兹曼机的电力信息系统多源日志综合特征提取;刘冬兰 等;《计算机系统应用》;20201111;第29卷(第11期);210-217 *
基于深度学习的个性化物品推荐研究;吴国栋;《中国博士学位论文全文数据库 (信息科技辑)》;20210131(第01期);I138-326 *
基于深度学习的推荐系统研究综述;黄立威 等;《计算机学报》;20180731;第41卷(第7期);1619-1644 *
融合注意力机制的增强受限玻尔兹曼机驱动的交互式分布估计算法;暴琳 等;《自动化学报》;20210506;1-14 *
面向含用户生成内容个性化搜索的交互式分布估计算法研究;暴琳;《中国博士学位论文全文数据库 (信息科技辑)》;20210731(第07期);I138-20 *

Also Published As

Publication number Publication date
JP7393060B2 (ja) 2023-12-06
CN113127737A (zh) 2021-07-16
WO2022218139A1 (zh) 2022-10-20
JP2023530370A (ja) 2023-07-14

Similar Documents

Publication Publication Date Title
CN109299396B (zh) 融合注意力模型的卷积神经网络协同过滤推荐方法及系统
Han et al. A survey on metaheuristic optimization for random single-hidden layer feedforward neural network
CN108363753B (zh) 评论文本情感分类模型训练与情感分类方法、装置及设备
CN109086658B (zh) 一种基于生成对抗网络的传感器数据生成方法与系统
CN110046656B (zh) 基于深度学习的多模态场景识别方法
CN111563164B (zh) 一种基于图神经网络的特定目标情感分类方法
CN107943784B (zh) 基于生成对抗网络的关系抽取方法
CN111368074A (zh) 一种基于网络结构和文本信息的链路预测方法
CN110263257B (zh) 基于深度学习处理多源异构数据的推荐方法
CN107683469A (zh) 一种基于深度学习的产品分类方法及装置
CN112328900A (zh) 一种融合评分矩阵和评论文本的深度学习推荐方法
CN113127737B (zh) 融合注意力机制的个性化搜索方法和搜索系统
CN111127146A (zh) 基于卷积神经网络与降噪自编码器的信息推荐方法及系统
CN110287323A (zh) 一种面向目标的情感分类方法
CN111292195A (zh) 风险账户的识别方法及装置
CN114693397A (zh) 一种基于注意力神经网络的多视角多模态商品推荐方法
CN113378706B (zh) 一种辅助儿童观察植物和学习生物多样性的绘画系统
Sadr et al. Convolutional neural network equipped with attention mechanism and transfer learning for enhancing performance of sentiment analysis
CN115994224A (zh) 基于预训练语言模型的钓鱼url检测方法及系统
CN115270752A (zh) 一种基于多层次对比学习的模板句评估方法
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
CN112364236A (zh) 目标对象推荐系统、方法、装置、数据处理方法及装置
CN112560440A (zh) 一种基于深度学习的面向方面级情感分析的句法依赖方法
CN116485948A (zh) 一种基于推荐算法和扩散模型的文本生成图像方法和系统
CN113268657B (zh) 基于评论和物品描述的深度学习推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant