CN116108246A - 考虑用户偏好一致性的语义非对称相似性推荐系统 - Google Patents

考虑用户偏好一致性的语义非对称相似性推荐系统 Download PDF

Info

Publication number
CN116108246A
CN116108246A CN202211555099.2A CN202211555099A CN116108246A CN 116108246 A CN116108246 A CN 116108246A CN 202211555099 A CN202211555099 A CN 202211555099A CN 116108246 A CN116108246 A CN 116108246A
Authority
CN
China
Prior art keywords
similarity
user
item
items
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211555099.2A
Other languages
English (en)
Inventor
邓江洲
高炜煌
王永
陆聪
唐仁泰
郭琦
胡良涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202211555099.2A priority Critical patent/CN116108246A/zh
Publication of CN116108246A publication Critical patent/CN116108246A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种考虑用户偏好一致性的语义非对称相似性推荐系统,属于推荐技术领域。包括:获取和清洗数据信息;转化评分为模糊语言术语;获取对目标项目i有过评分行为的用户集合Ui;借助概率语言术语集理论,计算项目间的语义相似性;获取用户对项目i和j的偏好信息;利用巴氏系数方法计算项目间的用户偏好一致性;利用用户一致性结果去调整语义相似性;获取项目i和j的共同评价项数量和目标项目i的用户评价数量,利用Sigmoid函数来计算项目间的非对称关系;利用项目间的非对称关系来打破加权后的语义相似性的对称性;利用评分预测方法计算出目标用户u在未评分项目上的预测值;对预测集合排序,并将预测值最高的前n个项目推送给目标用户u。

Description

考虑用户偏好一致性的语义非对称相似性推荐系统
技术领域
本发明涉及推荐技术领域,特别涉及一种考虑用户偏好一致性的语义非对称相似性推荐系统。
背景技术
决策作为人们日常生活中各方面都涉及的重要活动,通常是根据相应的决策标准来对备选方案进行排序或者选择最感兴趣的方案的过程。然而,随着复杂性的增加,这使得个人根据自身经验做出既可靠又满意决定的频率随之降低。推荐系统的兴起,使得它能从超载信息中尽可能选择出最合适的产品或服务来支持在线用户的决策。一个有效的推荐系统可以极大地用户满意度和购买体验,同时增强他们对平台的黏性,从而增加平台的影响力。协同过滤目前是推荐系统中使用最为广泛的技术之一,其基本思想是利用“群体智慧”对系统中的大量信息进行过滤筛选,以产生一系列目标用户可能感兴趣的项目推荐。其中,相似性计算方法是推荐环节中最为重要的一环,其相似性结果的好坏将直接影响到最近邻居的选择,从而影响到评分预测与推荐结果。因此,如何设计一个可靠的相似性方法来提高推荐系统的性能就显得尤为重要。
目前,大多数相似性计算方法主要利用用户评分信息来进行后续推荐,而未从语言信息的角度来衡量项目间的相似性。在实际决策过程中,因获取特定和精准的定量信息的成本很高,人们通常更倾向于用语言定性的表达他们的意见或偏好。语言信息能充分反映用户在决策过程中对特定项目的偏好程度。因此,从定性的角度来评估项目间的相似性就十分有必要。
发明人在进行推荐系统中的相似性计算方法和邻居选择方法研究时,发现现有的基于项目相似性推荐方法只使用了用户评分数据来衡量项目间的相似性,且忽略了项目间的用户偏好一致性,同时在邻居筛选时也未考虑项目间的交互作用的问题,这会使得相似性计算结果不准确和邻居筛选不合适,从而导致预测结果不佳。
发明内容
针对上述问题,本发明提出一种考虑用户偏好一致性的语义非对称相似性推荐系统,包括:
数据采集及准备模块,用于对用户数据进行获取和清洗,以得到系统所需要的信息。
评分转换模块,用于转换用户评分信息为模糊语义信息以形成模糊语义矩阵S。
语义相似性计算模块,借助概率语言术语集相关定义,用于计算两两项目间的语义相似性。
用户一致性计算模块,用于获取用户对项目的积极和消极偏好,并利用巴氏系数从概率分布的角度去计算项目间的用户偏好一致性。
非对称关系计算模块,用于获取两项目间的共同评分用户项和目标项目的评分数量,并利用Sigmoid函数计算两两项目间的非对称相似性。
相似性整合模块,用于整合上述两种或三种相似性计算模块的结果。
邻居搜索模块,用于以三个相似性整合的结果为目标项目i寻找k个最近邻居项目集Cneii
评分预测获取模块,用于计算目标用户u在未评分项目i上的预测评分值。
推荐结果获取模块,用于为目标用户u找到前n个预测评分值最大的项目集合进行个性化推荐。
本发明所述的相似性推荐系统,所述评分转换模块,用于通过语言术语集S={sα|α=0,1,...,τ}将用户-项目评分矩阵R中各数值转化为语言术语集中所对应的术语sα
本发明所述的相似性推荐系统,所述语义相似性计算模块,用于通过概率语言术语集相关定义计算获取两两项目间的语义相似性,具体包括:
(1)概率语言术语集构建模块,用于构建目标项目i的概率语言术语集。
Figure BDA0003982983710000021
其中
Figure BDA0003982983710000022
表示为语言术语I(r)及其相应的概率
Figure BDA0003982983710000023
Figure BDA0003982983710000024
M为推荐系统中所有用户数量,#ri为项目i被打分为r的用户数量,rmax是评分区间的最大值。根据
Figure BDA0003982983710000025
的值,对语言术语集中元素进行降序处理,得到重排序后的项目i的概率语言术语集
Figure BDA0003982983710000026
重复操作,可构建所有项目的概率语言术语集。
(2)语义偏差获取模块,用于计算两两项目间概率语言术语集的偏差程度。
Figure BDA0003982983710000027
其中k表示概率语言术语集中元素的重排序位置,ri为项目i的语言术语sr的下标,
Figure BDA0003982983710000028
为在
Figure BDA0003982983710000029
中语言术语的数量。
(3)语义相似性获取模块,用于计算基于概率语言术语集的项目间语义相似性
Figure BDA00039829837100000210
本发明所述的相似性推荐系统,所述用户一致性计算模块,用于通过巴氏系数方法计算获取两两项目间的用户偏好一致性,具体包括:
(1)用户偏好获取模块,用于获取用户对项目的评价偏好信息。以评分区间为1-5为例,计算用户对目标项目i的积极与消极偏好,公式如下:
Figure BDA00039829837100000211
其中m为项目i被用户评价的次数,I(rk)为用户对项目i打分值为r的数量,rui为用户u对项目i的评分值。
(2)用户一致性获取模块,用于通过巴氏系数方法计算获得两两项目间的用户偏好一致性结果,公式如下:
Figure BDA00039829837100000212
其中t表示积极P或消极N的用户偏好,pi,t为用户对项目i某种偏好t的概率,计算如下:
Figure BDA00039829837100000213
本发明所述的相似性推荐系统,所述非对称关系计算模块,用于获取共同评分项数量和目标项目评分数量,并通过Sigmoid函数计算获取两两项目间的非对称相似性,具体包括:
目标项目i与项目j的非对称相似性
Figure BDA00039829837100000214
其中U(i,j)表示为既对项目i又对项目j已评分的用户集合,即共同评分项;Ui表示所有对项目i有过评价的用户集合。
本发明所述的相似性推荐系统,所述相似性整合模块,用于整合以上两种或三种相似性计算模块的结果,具体包括:
(1)第一个相似性整合模块,用于获取考虑用户偏好一致性的语义相似性sim(i,j)PLTS-BCIT=sim(i,j)PLTS·sim(i,j)BCIT。该相似性结果用于评分预测获取模块。
(2)第二个相似性整合模块,用于获取考虑用户一致性的非对称语义相似性sim(i,j)PLTS-BCIT-AR=sim(i,j)PLTS-BCIT×sim(i,j)AR。该相似性结果用于邻居搜索模块。
本发明所述的相似性推荐系统,所述邻居搜索模块,用于为目标项目i找到最佳的最近邻居项目集合
Figure BDA0003982983710000031
具体包括:
(1)相似性排序模块,用于对第二个相似性整合模块所获取的结果进行降序排序,以得到目标项目i与其它项目的关联程度排序。
(2)邻居获取模块,用于获取目标项目i的最近邻居集合;其中包括设定系统所选取的最近邻居数量k,再从相似性排序模块中获取到与目标项目i相似程度最高的前k(为正整数)项目,以形成目标项目i的k个最近邻居项目集合
Figure BDA0003982983710000032
本发明所述的相似性推荐系统,所述评分预测获取模块,用于通过评分预测方法计算获取目标用户u在未评分项目i上的预测评分值,计算公式如下:
Figure BDA0003982983710000033
其中
Figure BDA0003982983710000034
为项目i的平均评分值,ruj为用户u在项目j上的评分值,
Figure BDA0003982983710000035
为目标项目i的最近邻居集合。
本发明所述的相似性推荐系统,所述推荐结果获取模块,用于获取目标用户u的推荐列表;其中包括设定系统为目标用户所推荐的项目数量n,再从评分预测获取模块中获取到目标用户u在未评分项目上的预测评分集合,并将该集合内的预测评分值由大到小排序;选取前n个预测值最大的项目推荐给目标用户u,以形成目标用户u的个性化推荐列表。
本发明提出的相似性推荐方法及系统,既从定性又从定量的角度衡量了项目间的相似性,同时考虑了项目间的用户偏好一致性和项目间的非对称关系,这对提高相似性计算结果的准确性与可靠性以及在邻居筛选阶段为目标项目找到最佳邻居项目有着十分积极作用,从而进一步加强推荐系统的预测和推荐能力。
附图说明
图1是本发明的方法过程示意图;
图2是本发明的系统框架图;
图3是本发明在两个数据集下不同最近邻居集数量下的MAE值变化情况;
图4是本发明在两个数据集下不同最近邻居集数量下的F1值变化情况。
具体实施方式
为了使用本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明提出的一种考虑用户偏好一致性的语义非对称相似性推荐方法及系统进行详细说明。应当理解,此处所描述的具体实施方法仅仅用以解释本发明,并不用于限定本发明,本技术领域的普通技术人员在本发明的示值范围内所做出的变化、改动、添加修改或替换,其均应涵盖在本发明的权利要求范围之中。
图1是本发明的相似性推荐方法的过程示意图。从图1可以看出,本发明提出的相似性推荐方法,包括从数据库中获取和清理数据信息,以获得标准化的数据格式;对获取的评分信息进行转化,得到相对应的模糊语言术语;借助概率语言术语集相关定义,计算出项目间的语义相似性;从获取的标准化数据中,统计出用户对项目的偏好特征,再利用巴氏系统方法计算出项目间用户偏好一致性;从获取的标准化数据中,统计出共同评分项和目标项目被评次数,利用Sigmoid函数计算出项目间的非对称关系;将获得的用户一致性结果整合到到语义相似性上,得到加权后的语义相似性;将获得的加权后的语义相似性结果与项目间非对称关系整合在一起,根据整合后的值,筛选出目标项目的最近邻居集合;将获得的最近邻居集合和加权后的语义相似性结果作为输入,利用评分预测方法计算出目标用户在未评分项目上的预测评分值;对获取的预测评分集合进行排序,产生一系列目标用户最可能感兴趣的项目进行推送。
图2是本发明的相似性推荐系统的框架图。从图2可以看出,本发明提出的相似性推荐方法和系统,包括数据采集及准备模块、评分转化模块、语义相似性计算模块、用户一致性计算模块、非对称关系计算模块、相似性整合模块(含第一和第二相似性整合子模块)、邻居搜索模块(含相似性排序模块和邻居获取模块)、评分预测获取模块和推荐结果获取模块。所述数据采集及准备模块用于从数据库中提取数据,并对数据进行清洗和预处理等操作,将其处理为所述评分转化模块所需要的格式;所述评分转化模块用于将所述数据采集及准备模块提供的评分信息转化为模糊语言信息;所述语义相似性计算模块根据所述评分转化模块获取的数据信息来计算项目间的语义相似性;所述用户一致性计算模块根据所述数据采集及准备模块获取的数据信息来计算项目间用户偏好一致性;所述的非对称关系计算模块根据所述数据采集及准备模块获取的数据信息来计算项目间的非对称结果。所述相似性整合模块根据所述的三个计算模块获取的结果进行整合,其中第一相似性整合模块用于整合所述的语义相似性模块与用户一致性模块的结果,第二相似性整合模块用于整合所述的三个计算模块的结果;所述邻居搜索模块根据第二相似性整合模块获取的结果,先使用其中相似性排序模块对获取结果进行内部排序,再通过邻居获取模块来生成最近邻居集合;所述评分预测获取模块根据所述第一相似性整合模块获取的结果与所述邻居搜索模块获取的最近邻居集合进行项目评分预测;所述推荐结果获取模块根据所述评分预测获取模块得到的项目评分预测集合,对其进行内部排序,并将排名靠前的项目推荐给目标用户。
进一步地,以下述情况为例子进行说明:
假设有M个用户U={u1,u2,...,uM}和N个项目I={i1,i2,...,iN},用户-项目评分矩阵用[R]M×N表示;rui表示用户在项目i上的评分值,U(i,j)表示为既对项目i又对项目j有过评分行为的用户集合,即共同评分项;Ui表示所有对项目i有过评价的用户集合。
首先通过数据采集及准备模块对系统数据进行获取和清洗,得到假设中的各变量。整个所提相似性推荐系统的具体实施步骤如下所示:
S1:数据采集及准备模块从数据库中获取所需的数据信息,包括用户ID、项目ID和评分信息;
S2:评分转化模块把用户评分信息转为模糊语义信息;
语言术语集是语言决策的基础,决策者通常使用该术语集来表达他们对特定项目的意见或偏好。语言术语集是有限且有序的,其表达式如下:
S={sαα=0,1,...,τ}
其中,sα表示某个语言术语的可能性值,s0和sτ分别表示语言术语的下限和上限,τ表示为正整数。常见的语言术语集合有:
S={s0=none,s1=very low,s2=low,s3=medium,s4=high,s5=very high,s6=perfect}
若以推荐系统中评分区间1-5分为例,则需要移除两个语言术语s0和s6,使得R中各评分数值转化为S集合中相对应的语言术语。
S3:语义相似性计算模块根据转化得到的语言术语信息,借助概率语言数据集相关定义,计算出项目间的语义相似性;
首先,构建目标项目i的概率语言术语集,公式如下:
Figure BDA0003982983710000041
其中,
Figure BDA0003982983710000042
表示为语言术语I(r)及其相应的概率
Figure BDA0003982983710000043
Figure BDA0003982983710000044
M为推荐系统中所有用户数量,#ri为项目i被打分为r的用户数量,rmax是评分区间的最大值。根据
Figure BDA0003982983710000045
的值,对语言术语集中元素进行降序处理,得到重排序后的项目i的概率语言术语集
Figure BDA0003982983710000046
其次,计算项目间概率语言术语集的偏差程度,计算公式如下:
Figure BDA0003982983710000047
其中,k表示概率语言术语集中元素的重排序位置,ri为项目i的语言术语sr的下标,
Figure BDA0003982983710000048
为在
Figure BDA0003982983710000051
中语言术语的数量。
最后,计算基于概率语言术语集的项目间语义相似性,公式如下:
Figure BDA0003982983710000052
其中,e-x为指数函数,其相似性图像为类似遗忘曲线,能更好地区分两个偏差程度较小的项目。
S4:用户一致性计算模块根据获取的评分信息,利用巴氏系数方法来计算项目间用户偏好一致性;
语义相似性计算模块只考虑了项目间的语义相似性,而忽略了用户对项目的评分偏好(积极或消极),这会导致不准确的相似性结果。该模块首先要评估用户对目标项目i的积极和消极偏好,公式如下:
Figure BDA0003982983710000053
其中,m为项目i被用户评价的次数,I(rk)为用户对项目i评分为r的数量。
然后,采用巴氏系数方法从概率分布的角度来度量项目间用户偏好一致性,公式如下:
Figure BDA0003982983710000054
其中,t表示积极P或消极N的用户偏好,pi,t为用户对项目i某种偏好t的概率,计算如下:
Figure BDA0003982983710000055
S5:非对称关系计算模块根据获取的评分信息,首先统计出共同评分项数量|U(i,j)|和目标项目i被评分次数|Ui|,再利用Sigmoid函数计算出目标项目i和项目j的非对称相似性,公式如下:
Figure BDA0003982983710000056
与传统的对称相似性方法相比,非对称相似性方法强调了项目间的相互影响,以及共同评分项的重要性,这对后续为目标项目筛选合适邻居起着至关重要的作用。
S6:相似性整合模块对上述S3、S4和S5中得到的各相似性结果进行有效整合;
其中包括第一个相似性整合模块,用来整合S3和S4的结果,以提高相似性计算结果的准确性和可靠性。
sim(i,j)PLTS-BCIT=sim(i,j)PLTS·sim(i,j)BCIT
第二个相似性整合模块,用来整合S3、S4和S5的结果,以打破项目间相似性结果的对称性,从而为目标项目找到更加合适的最近邻居项目集合。
sim(i,j)PLTS-BCIT-AR=sim(i,j)PLTS-BCIT×sim(i,j)AR
S7:邻居搜索模块根据第二个相似性整合模块所获取的相似性结果,先使用相似性排序模块对其结果进行内部从大到小排序,得到目标项目i与其它项目的关联程度排序;再根据系统设定的最近邻居数量k(为正整数),从相似性排序模块中获取到与目标项目i相似程度最高的前k个项目,以形成目标项目i的k个最近邻居项目集合Cneii
S8:评分预测获取模块根据第一个相似性整合模块所得到的相似性结果与邻居搜索模块所找到的最近邻居项目集合,可计算出目标用户u在未评分项目i上的预测值pui,公式如下:
Figure BDA0003982983710000057
其中,
Figure BDA0003982983710000058
为项目i的平均评分值。
S9:推荐结果获取模块根据S8所计算的一系列预测评分项目集合,以及系统设定的推荐项目数量n,先对预测集合内的评分值从大到小排序,再选取前n个预测值最大的项目推荐给目标用户u,以形成目标用户u的个性化推荐列表。
图2-3分别度量了提出的方法在两个方面的指标表现,两个度量分别是:平均绝对误差(MAE)和F1值。它们的计算方式及度量内容如下所示:
平均绝对误差:在本发明中衡量的是推荐方法的预测准确性,用来检验方法的预测值与真实值之间的偏差,可以更好地反映预测值误差的实际情况。平均绝对误差越小说明方法有更好的预测能力。其计算方法如下:
Figure BDA0003982983710000061
其中,m表示为系统中被测试的用户数量,n表示为被预测的项目数量;rui和pui分别用户u在项目i上的真实评分值与预测评分值。
F1值:是由精确率(Precision)和召回率(Recall)组合而成的指标,用于评估推荐系统准确率的综合性能。其中精确率在本发明中度量的是推荐给用户的项目列表中用户真正喜欢的项目比例;而召回率是在本发明中度量的是推荐给用户的项目列表中用户真正喜欢的项目个数占用户所有喜欢项目个数的比例。它们的计算公式如下:
Figure BDA0003982983710000062
Figure BDA0003982983710000063
Figure BDA0003982983710000064
其中,Iar和Ipr分别表示真实推荐和预测推荐的项目数量。

Claims (9)

1.一种考虑用户偏好一致性的语义非对称相似性推荐系统,其特征在于,包括:
数据采集及准备模块,用于对用户数据进行获取和清洗,以得到系统所需要的标准化数据信息;
评分转换模块,用于转换用户评分信息为模糊语义信息以形成模糊语义矩阵S;
语义相似性计算模块,借助概率语言术语集相关定义,用于计算两两项目间的语义相似性;
用户一致性计算模块,用于获取用户对项目的积极和消极偏好,并利用巴氏系数从概率分布的角度去计算项目间的用户偏好一致性;
非对称关系计算模块,用于获取两项目间的共同评分用户项和目标项目的评分数量,并计算两两项目间的非对称相似性;
相似性整合模块,用于整合上述两种或三种相似性计算模块的相似性结果;
邻居搜索模块,用于以三个相似性整合的结果为目标项目i寻找k个最近邻居项目集
Figure FDA0003982983700000011
评分预测获取模块,用于计算目标用户u在未评分项目i上的预测评分值;
推荐结果获取模块,用于为目标用户u找到前n个预测评分值最大的项目集合进行个性化推荐。
2.如权利要求1所述的相似性推荐系统,其特征在于,所述评分转换模块,用于通过语言术语集S={sα|α=0,1,...,τ}将用户-项目评分矩阵R中各数值转化为语言术语集中所对应的术语sα
3.如权利要求1所述的相似性推荐系统,其特征在于,所述语义相似性计算模块,用于通过概率语言术语集相关定义计算获取两两项目间的语义相似性,具体包括:
(1)概率语言术语集构建模块,用于构建目标项目i的概率语言术语集。
Figure FDA0003982983700000012
其中
Figure FDA0003982983700000013
表示为语言术语I(r)及其相应的概率
Figure FDA0003982983700000014
Figure FDA0003982983700000015
M为推荐系统中所有用户数量,#ri为项目i被打分为r的用户数量,rmax是评分区间的最大值。根据
Figure FDA0003982983700000016
的值,对语言术语集中元素进行降序处理,得到重排序后的项目i的概率语言术语集
Figure FDA0003982983700000017
重复操作,可构建所有项目的概率语言术语集。
(2)语义偏差获取模块,用于计算两两项目间概率语言术语集的偏差程度。
Figure FDA0003982983700000018
其中k表示概率语言术语集中元素的重排序位置,ri为项目i的语言术语sr的下标,
Figure FDA0003982983700000019
为在
Figure FDA00039829837000000110
中语言术语的数量。
(3)语义相似性获取模块,用于计算基于概率语言术语集的项目间语义相似性
Figure FDA00039829837000000111
4.如权利要求1所述的相似性推荐系统,其特征在于,所述用户一致性计算模块,用于通过巴氏系数方法计算获取两两项目间的用户偏好一致性,具体包括:
(1)用户偏好获取模块,用于获取用户对项目的评价偏好信息。以评分区间为1-5为例,计算用户对目标项目i的积极与消极偏好,公式如下:
Figure FDA00039829837000000112
其中m为项目i被用户评价的次数,I(rk)为用户对项目i打分值为r的数量,rui为用户u对项目i的评分值。
(2)用户一致性获取模块,用于通过巴氏系数方法计算获得两两项目间的用户偏好一致性结果,公式如下:
Figure FDA00039829837000000113
其中t表示积极P或消极N的用户偏好,pi,t为用户对项目i某种偏好t的概率,计算如下:
Figure FDA0003982983700000021
5.如权利要求1所述的相似性推荐系统,其特征在于,所述非对称关系计算模块,用于获取共同评分项数量和目标项目评分数量,并通过Sigmoid函数计算获取两两项目间的非对称相似性,具体包括:
目标项目i与项目j的非对称相似性
Figure FDA0003982983700000022
其中U(i,j)表示为既对项目i又对项目j已评分的用户集合,即共同评分项;Ui表示所有对项目i有过评价的用户集合。
6.如权利要求1所述的相似性推荐系统,其特征在于,所述相似性整合模块,用于整合以上两种或三种相似性计算模块的结果,具体包括:
(1)第一个相似性整合模块,用于获取考虑用户偏好一致性的语义相似性sim(i,j)PLTS-BCIT=sim(i,j)PLTS·sim(i,j)BCIT。该相似性结果用于评分预测获取模块。
(2)第二个相似性整合模块,用于获取考虑用户一致性的非对称语义相似性sim(i,j)PLTS-BCIT-AR=sim(i,j)PLTS-BCIT×sim(i,j)AR。该相似性结果用于邻居搜索模块。
7.如权利要求1所述的相似性推荐系统,其特征在于,所述邻居搜索模块,用于为目标项目i找到最佳的最近邻居项目集合
Figure FDA0003982983700000023
具体包括:
(1)相似性排序模块,用于对第二个相似性整合模块所获取的结果进行降序排序,以得到目标项目i与其它项目的关联程度排序。
(2)邻居获取模块,用于获取目标项目i的最近邻居集合;其中包括设定系统所选取的最近邻居数量k(为正整数),再从相似性排序模块中获取到与目标项目i相似程度最高的前k个项目,以形成目标项目i的k个最近邻居项目集合
Figure FDA0003982983700000024
8.如权利要求1所述的相似性推荐系统,其特征在于,所述评分预测获取模块,用于通过评分预测方法计算获取目标用户u在未评分项目i上的预测评分值,计算公式如下:
Figure FDA0003982983700000025
其中
Figure FDA0003982983700000026
为项目i的平均评分值,ruj为用户u在项目j上的评分值,
Figure FDA0003982983700000027
为目标项目i的最近邻居集合。
9.如权利要求1所述的相似性推荐系统,其特征在于,所述推荐结果获取模块,用于获取目标用户u的推荐列表;其中包括设定系统为目标用户所推荐的项目数量n,再从评分预测获取模块中获取到目标用户u在未评分项目上的预测评分集合,并将该集合内的预测评分值由大到小排序;选取前n个预测值最大的项目推荐给目标用户u,以形成目标用户u的个性化推荐列表。
CN202211555099.2A 2022-12-06 2022-12-06 考虑用户偏好一致性的语义非对称相似性推荐系统 Pending CN116108246A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211555099.2A CN116108246A (zh) 2022-12-06 2022-12-06 考虑用户偏好一致性的语义非对称相似性推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211555099.2A CN116108246A (zh) 2022-12-06 2022-12-06 考虑用户偏好一致性的语义非对称相似性推荐系统

Publications (1)

Publication Number Publication Date
CN116108246A true CN116108246A (zh) 2023-05-12

Family

ID=86260608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211555099.2A Pending CN116108246A (zh) 2022-12-06 2022-12-06 考虑用户偏好一致性的语义非对称相似性推荐系统

Country Status (1)

Country Link
CN (1) CN116108246A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116932923A (zh) * 2023-09-19 2023-10-24 江西财经大学 一种结合行为特征与三角协作度量的项目推荐方法
CN117251643A (zh) * 2023-08-29 2023-12-19 海南大学 基于协同过滤和概率语言术语集的新闻推荐方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117251643A (zh) * 2023-08-29 2023-12-19 海南大学 基于协同过滤和概率语言术语集的新闻推荐方法及系统
CN117251643B (zh) * 2023-08-29 2024-05-07 海南大学 基于协同过滤和概率语言术语集的新闻推荐方法及系统
CN116932923A (zh) * 2023-09-19 2023-10-24 江西财经大学 一种结合行为特征与三角协作度量的项目推荐方法
CN116932923B (zh) * 2023-09-19 2023-12-08 江西财经大学 一种结合行为特征与三角协作度量的项目推荐方法

Similar Documents

Publication Publication Date Title
CN116108246A (zh) 考虑用户偏好一致性的语义非对称相似性推荐系统
Düğenci A new distance measure for interval valued intuitionistic fuzzy sets and its application to group decision making problems with incomplete weights information
KR101579376B1 (ko) 주관성 분석을 이용한 사용자 분류와 그에 따른 개인화된 장소 추천 시스템 및 방법
WO2019223552A1 (zh) 文章推荐方法、装置、计算机设备及存储介质
JP2011065504A (ja) ユーザの選好関係についての予測モデルを生成する選好予測サーバ及びその方法
CN113284623B (zh) 基于用户能力的个性化认知训练任务推荐算法及系统
Wang et al. The recommendation method for hotel selection under traveller preference characteristics: A cloud-based multi-criteria group decision support model
CN107545075B (zh) 一种基于在线评论和情境感知的餐馆推荐方法
CN109063171B (zh) 基于语义的资源匹配方法
CN111324807A (zh) 基于信任度的协同过滤推荐方法
CN115712780A (zh) 一种基于云计算和大数据的信息推送方法及装置
CN112468853A (zh) 电视资源推荐方法、装置、计算机设备及存储介质
CN115809376A (zh) 一种基于教学大数据的智能推荐方法
CN107688647A (zh) 一种基于协同过滤的学习复习题库推荐方法
CN108415928A (zh) 一种基于加权混合k-最近邻算法的图书推荐方法与系统
Kumar et al. A novel fuzzy rough sets theory based cf recommendation system
CN112464106B (zh) 对象推荐方法及装置
CN111259223B (zh) 基于情感分析模型的新闻推荐和文本分类方法
Ishanka et al. User emotion and personality in context-aware travel destination recommendation
KR101775268B1 (ko) 지문과 장문을 이용한 진로적성검사시스템 및 방법
CN112417280A (zh) 一种基于虚拟现实主持人体系的推荐方法和系统
CN115964570B (zh) 基于QoS多时段变化特征预测的云服务推荐方法及装置
CN110825965A (zh) 一种基于信任机制和时间加权的改进协同过滤推荐方法
CN108960954B (zh) 一种基于用户群行为反馈的内容推荐方法及推荐系统
WO2020111329A1 (ko) 유사 사용자 매칭을 이용한 자동 답변 방법 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination