CN104715399B - 一种评分预测方法与系统 - Google Patents

一种评分预测方法与系统 Download PDF

Info

Publication number
CN104715399B
CN104715399B CN201510165907.8A CN201510165907A CN104715399B CN 104715399 B CN104715399 B CN 104715399B CN 201510165907 A CN201510165907 A CN 201510165907A CN 104715399 B CN104715399 B CN 104715399B
Authority
CN
China
Prior art keywords
user
article
theme
comment
characteristic value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510165907.8A
Other languages
English (en)
Other versions
CN104715399A (zh
Inventor
陈文亮
马春平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201510165907.8A priority Critical patent/CN104715399B/zh
Publication of CN104715399A publication Critical patent/CN104715399A/zh
Application granted granted Critical
Publication of CN104715399B publication Critical patent/CN104715399B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种评分预测方法与系统,获取历史评论数据,使用基于词向量的方法构建主题词分布表,根据主题词分布表计算指定的第一用户对第一物品的评论特征表示,同时获取历史评分数据,计算指定的第一用户对第一物品的修正平均分作为特征之一,与主题特征一起作为线性回归模型的特征,计算出各个特征的权重和误差偏置,针对需要预测的第二用户对第二物品的评分,首先计算出第二用户对第二物品的评论特征表示和修正平均分,结合主题权重和误差偏置获得第二用户对第二物品的评分。利用词向量方法构建主题词表,根据评论内容预测评分同时从用户角度以及物品角度进行考虑,并加之协同过滤算法得到组合推荐模型,使预测结果更加准确全面。

Description

一种评分预测方法与系统
技术领域
本发明涉及推荐系统领域,特别是涉及一种评分预测方法与系统。
背景技术
推荐系统是根据用户的历史行为和兴趣特点,为用户推荐其感兴趣的信息或商品的系统。推荐系统一般通过评分预测来实现,即将预测评分高的商品推荐给用户。
传统的推荐算法包括基于内容的推荐和协同过滤。基于内容的推荐是挖掘物品的描述性特征,然后根据用户的选择向用户推荐相似特征的物品,比如用户买了某品牌的衣服,则向他推荐该品牌的裤子。协同过滤是根据用户的历史行为,如对餐馆的评分行为,对商品的浏览行为等向用户推荐商品,一般分为基于用户的协同过滤和基于物品的协同过滤。基于用户的协同过滤通过计算用户相似度向相似用户推荐某商品;基于物品的协同过滤通过计算物品相似度向用户推荐与其购买过的商品相似的商品。
但是上述传统的推荐算法均存在一定的局限性。基于内容的推荐算法过于依赖用户和物品的描述性的特征,无法利用用户的反馈信息。协同过滤算法以用户的历史行为为依据推测用户对物品的喜好,没有深层次挖掘用户或者物品的特征,例如,两个用户均对一家餐馆打出5分满分,但是评价角度可能不同,一个人认为菜肴美味,另一个觉得服务周到。
目前出现了一些算法可以根据用户对物品的评论预测用户对物品的评分,但无法同时考虑评论信息中的用户角度和物品角度。
发明内容
有鉴于此,本发明的主要目的在于提供一种评分预测方法与系统,可以根据历史评论综合用户角度与物品角度更准确地预测评分。
为实现上述目的,本发明提供了一种评分预测方法,包括:
获取历史评分数据,利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分、预设用户范围中除第一用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第一用户对第一物品的修正平均分;
获取历史评论数据,计算第一用户对第一物品的评论的多个预设主题的特征值,根据所述特征值得到第一用户对第一物品的评论的特征表示;
根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、修正平均分的权重以及误差偏置;
确定要进行评分预测的第二用户以及第二物品;
利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分、预设用户范围中除第二用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第二用户对第二物品的修正平均分;
计算第二用户对第二物品的评论的各主题的特征值,根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值;
根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示;
根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分;
其中,计算特征值包括:
将所述历史评论数据中的词表示为词向量;
根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;
根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
优选地,根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示包括:
将第二用户指定主题的特征值进行归一化,第二物品同一指定主题的特征值进行归一化;
两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表示;
将第二用户对第二物品各主题的特征表示均归一化,得到第二用户对第二物品的模拟评论特征表示。
优选地,根据所述词向量得到与各主题相似的对应的预设数目的目标代表词包括:
找出各主题下有代表性的词;
将各主题对应的词向量依据与主题以及主题对应的有代表性的词的余弦相似度从高到低排序;
去除无关词后取排序后的前预设数目的词向量得到各主题对应的预设数目的目标代表词。
优选地,根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值包括:
确定各主题对应的各目标代表词与主题的余弦相似度;
将对应同一主题的预设数目的各目标代表词的余弦相似度累加得到所述指定用户对所述指定物品的各主题的特征值。
本发明还提供了一种评分预测系统,包括:
评分获取模块,用于获取历史评分数据;
第一修正平均分获取模块,用于利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分、预设用户范围中除第一用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第一用户对第一物品的修正平均分;
评论获取模块,用于获取历史评论数据;
特征值获取模块,用于计算指定用户对指定物品的各主题特征值;
第一特征表示获取模块,用于根据特征值得到第一用户对第一物品的评论的特征表示;
中间值确定模块,用于根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、修正平均分的权重以及误差偏置;
预测确定模块,用于确定要进行评分预测的第二用户以及第二物品;
第二修正平均分获取模块,用于利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分、预设用户范围中除第二用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第二用户对第二物品的修正平均分;
预测特征值获取模块,用于根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值;
第二特征表示获取模块,用于根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示;
评分预测模块,用于根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分;
其中,所述特征值获取模块包括:
词向量获取子模块,用于将所述历史评论数据中的词表示为词向量;
代表词获取子模块,用于根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;
特征值子模块,用于根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
优选地,所述第二特征表示获取模块包括:
第一归一化子模块,用于将第二用户指定主题的特征值进行归一化,第二物品同一指定主题的特征值进行归一化;
点积子模块,用于两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表示;
第二归一化子模块,用于将第二用户对第二物品各主题的特征表示均归一化,得到第二用户对第二物品的模拟评论特征表示。
应用本发明提供的评分预测方法与系统,获取历史评分数据以及历史评论数据,根据历史评分数据和评论数据计算指定的第一用户对第一物品的修正平均分以及第一用户对第一物品的特征表示,将计算出的修正平均分作为线性回归模型特征之一,利用准确性更高的多种算法的组合计算出预设的评论中各主题对于评分的权重、修正平均分的权重和误差偏置,最后利用各主题的权重与误差偏置,以及历史评论和评分中指定的需要预测的第二用户对第二物品的模拟评论特征表示和第二用户对第二物品的修正平均分计算出第二用户对第二物品的预测评分,利用词向量方法的余弦相似度取与主题词相似的目标代表词,并过滤无关词,根据评论内容预测评分同时从用户角度以及物品角度进行考虑,并加之协同过滤算法得到组合推荐模型预测新的评分,使预测结果更加准确全面,从而在后续根据历史评论向用户进行相似推荐时获得更好的用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明一种评分预测方法的流程图;
图2为本发明一种评分预测方法的详细流程图;
图3为本发明一种评分预测系统的结构示意图;
图4为本发明一种评分预测系统的详细结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种评分预测方法,如图1所示,为本发明评分预测方法一具体实施例的流程图,包括:
步骤S101:获取历史评分数据,利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分、预设用户范围中除第一用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第一用户对第一物品的修正平均分;
首先获取已知的历史评分数据,即用户已经评论过的物品的评分,根据协同过滤算法中的一种Bias From Mean,设第一用户为u,第一物品为i,计算u对i的修正平均分βui,计算公式如下:
其中Zi表示购买过物品i的用户中除第一用户u以外的其他所有用户,表示用户j对所有物品的评分的平均分,rji表示用户j对物品i的评分,即可计算出第一用户u对对第一物品i的修正平均分βui
步骤S102:获取历史评论数据,计算第一用户对第一物品的评论的多个预设主题的特征值,根据所述特征值得到第一用户对第一物品的评论的特征表示;
根据历史平均数据计算用户u对物品i的评论数据中多个预设主题的特征值,具体方法如图2流程图所示,包括:
步骤S201:将所述历史评论数据中的词表示为词向量;
步骤S202:根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;
具体步骤为:找出各主题下有代表性的词;将各主题对应的词向量依据与主题以及主题对应的有代表性的词的余弦相似度从高到低排序;去除无关词后取排序后的前预设数目的词向量得到各主题对应的预设数目的目标代表词。
如:从得到的评论数据的中确定了6个主题,分别为实物、服务、价格、环境、酒水和路程,寻找这6个主题及各主题下2个有代表的词,依据这些词的词向量计算与主题及代表词的余弦相似度,根据余弦相似度值由高到低分别找出这3个词的前20个相近词作为这6个主题的主题词,即6个主题分别有60个主题词,过滤无关词,将剩余词按相似度排序,取各自主题的前20个作为主题的目标代表词,如表1所示为基于词向量的主题分布示意图。
表1
步骤S203:根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值;
θuik表示用户u对物品i的评论第k个特征值。特征值的计算方式如下:
其中n是各个主题下主题词的个数,若评论中包含该主题词,则θuikt是各个主题词对应的值,反之,θuikt为0。根据不同的主题分析方法,θuikt的值略有不同,本实施例基于词向量分析评论,θuikt的值为主题词与对应主题的余弦相似度。
依照上面的详细步骤计算出用户u对物品i的评论的多个预设主题的特征值后,根据所述特征值得到用户u对物品i的评论的特征表示:
用户u对物品i的评论用Cui表示,评论Cui的特征表示为θui
θui=[θui1ui2……θuiK]
其中K是预设的主题的个数。
步骤S103:根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、修正平均分的权重以及误差偏置;
将上述Bias From Mean的预测结果βui作为线性回归模型的特征之一,新的计算公式如下:
rui=WTθui+Wββui
已知用户u对物品i的评论的特征表示θui、用户u对物品i的修正平均分βui以及用户u对物品i的评分rui,根据上式可计算出各主题权重W、修正平均分的权重Wβ以及误差偏置ε,上述两值作为评分预测的中间值。
步骤S104:确定要进行评分预测的第二用户以及第二物品;
在评分预测阶段,无法预知用户的评论,假设需要预测用户v对物品j的评分,需要用到用户v的历史评论以及物品j的历史评论。
步骤S105:利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分、预设用户范围中除第二用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第二用户对第二物品的修正平均分;
同步骤S101,计算第二用户对第二物品的修正平均分βvj
步骤S106:计算第二用户对第二物品的评论的各主题的特征值,根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值;
依据图2步骤计算用户v对物品j的评论的各主题的特征值,并根据特征值以及用户v评论合集Cv、物品j评论合集Cj计算用户v各主题的特征值以及物品j各主题的特征值:
进行归一化:
pvk表示用户v第k维特征,qjk表示物品j第k维特征。
步骤S107:根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示;
用户v第k维特征pvk与物品j第k维特征qjk点积,并归一化得到用户v对物品j的模拟评论特征表示
θ′vjk=pvkqjk
步骤S108:根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分;
已知用户v对物品j的模拟评论特征表示各主题的权重W以及误差偏置ε依据下式计算出用户v对物品j的预测评分
应用本实施例提供的评分预测方法,获取历史评分数据以及历史评论数据,根据历史评分数据和评论数据计算指定的用户u对物品i的修正平均分βui以及用户u对物品i的特征表示θui,将计算出的修正平均分βui作为线性回归模型特征之一,利用准确性更高的多种算法的组合rui=WTθui+Wββui+ε计算出预设的评论中各主题对于评分的权重W、修正平均分的权重Wβ和误差偏置ε,最后利用各主题的权重W、修正平均分的权重Wβ与误差偏置ε,以及历史评论和评分中指定的需要预测的用户v对物品j的模拟评论特征表示用户v对物品j的修正平均分βvj计算出用户v对物品j的评分计算公式为利用词向量方法的余弦相似度取与主题词相似的目标代表词,并过滤无关词,根据评论内容预测评分同时从用户角度以及物品角度进行考虑,并加之协同过滤算法得到组合推荐模型预测新的评分,使预测结果更加准确全面,从而在后续根据历史评论向用户进行相似推荐时获得更好的用户体验。
本发明还提供了一种评分预测系统,如图3所示,为本发明评分预测系统的结构示意图包括:
评分获取模块101,用于获取历史评分数据;
第一修正平均分获取模块102,用于利用协同过滤算法根据第一用户对所有物品的评分平均分与预设用户范围中除第一用户以外其他各用户对第一物品的评分得到第一用户对第一物品的修正平均分;
评论获取模块103,用于获取历史评论数据;
特征值获取模块104,用于计算指定用户对指定物品的各主题特征值;
第一特征表示获取模块105,用于根据特征值得到第一用户对第一物品的评论的特征表示;
中间值确定模块106,用于根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、修正平均分的权重以及误差偏置;
预测确定模块107,用于确定要进行评分预测的第二用户以及第二物品;
第二修正平均分获取模块108,用于利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分、预设用户范围中除第二用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第二用户对第二物品的修正平均分;
预测特征值获取模块109,用于根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值;
第二特征表示获取模块110,用于根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示;
评分预测模块111,用于根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分;
如图4所示,其中,所述特征值获取模块104包括:
词向量获取子模块201,用于将所述历史评论数据中的词表示为词向量;
代表词获取子模块202,用于根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;
特征值子模块203,用于根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
应用本实施例提供的评分预测系统,获取历史评分数据以及历史评论数据,根据历史评分数据和评论数据计算指定的第一用户对第一物品的修正平均分以及第一用户对第一物品的特征表示,将计算出的修正平均分作为线性回归模型特征之一,利用准确性更高的多种算法的组合计算出预设的评论中各主题对于评分的权重、修正平均分的权重和误差偏置,最后利用各主题的权重与误差偏置,以及历史评论和评分中指定的需要预测的第二用户对第二物品的模拟评论特征表示和第二用户对第二物品的修正平均分计算出第二用户对第二物品的预测评分,利用词向量方法的余弦相似度取与主题词相似的目标代表词,并过滤无关词,根据评论内容预测评分同时从用户角度以及物品角度进行考虑,并加之协同过滤算法得到组合推荐模型预测新的评分,使预测结果更加准确全面,从而在后续根据历史评论向用户进行相似推荐时获得更好的用户体验。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的方法与系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (6)

1.一种评分预测方法,其特征在于,包括:
获取历史评分数据,利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分、预设用户范围中除第一用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第一用户对第一物品的修正平均分;
获取历史评论数据,计算第一用户对第一物品的评论的多个预设主题的特征值,根据所述特征值得到第一用户对第一物品的评论的特征表示;
根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、修正平均分的权重以及误差偏置;
确定要进行评分预测的第二用户以及第二物品;
利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分、预设用户范围中除第二用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第二用户对第二物品的修正平均分;
计算第二用户对第二物品的评论的各主题的特征值,根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值;
根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示;
根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分;
其中,计算特征值包括:
将所述历史评论数据中的词表示为词向量;
根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;
根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
2.根据权利要求1所述的评分预测方法,其特征在于,根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示包括:
将第二用户指定主题的特征值进行归一化,第二物品同一指定主题的特征值进行归一化;
两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表示;
将第二用户对第二物品各主题的特征表示均归一化,得到第二用户对第二物品的模拟评论特征表示。
3.根据权利要求2所述的评分预测方法,其特征在于,根据所述词向量得到与各主题相似的对应的预设数目的目标代表词包括:
找出各主题下有代表性的词;
将各主题对应的词向量依据与主题以及主题对应的有代表性的词的余弦相似度从高到低排序;
去除无关词后取排序后的前预设数目的词向量得到各主题对应的预设数目的目标代表词。
4.根据权利要求3所述的评分预测方法,其特征在于,根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值包括:
确定各主题对应的各目标代表词与主题的余弦相似度;
将对应同一主题的预设数目的各目标代表词的余弦相似度累加得到所述指定用户对所述指定物品的各主题的特征值。
5.一种评分预测系统,其特征在于,包括:
评分获取模块,用于获取历史评分数据;
第一修正平均分获取模块,用于利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分、预设用户范围中除第一用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第一用户对第一物品的修正平均分;
评论获取模块,用于获取历史评论数据;
特征值获取模块,用于计算指定用户对指定物品的各主题特征值;
第一特征表示获取模块,用于根据特征值得到第一用户对第一物品的评论的特征表示;
中间值确定模块,用于根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、修正平均分的权重以及误差偏置;
预测确定模块,用于确定要进行评分预测的第二用户以及第二物品;
第二修正平均分获取模块,用于利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分、预设用户范围中除第二用户以外其他各用户对预设物品范围中所有物品评分的平均分得到第二用户对第二物品的修正平均分;
预测特征值获取模块,用于根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值;
第二特征表示获取模块,用于根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示;
评分预测模块,用于根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分;
其中,所述特征值获取模块包括:
词向量获取子模块,用于将所述历史评论数据中的词表示为词向量;
代表词获取子模块,用于根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;
特征值子模块,用于根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
6.根据权利要求5所述的评分预测系统,其特征在于,所述第二特征表示获取模块包括:
第一归一化子模块,用于将第二用户指定主题的特征值进行归一化,第二物品同一指定主题的特征值进行归一化;
点积子模块,用于两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表示;
第二归一化子模块,用于将第二用户对第二物品各主题的特征表示均归一化,得到第二用户对第二物品的模拟评论特征表示。
CN201510165907.8A 2015-04-09 2015-04-09 一种评分预测方法与系统 Active CN104715399B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510165907.8A CN104715399B (zh) 2015-04-09 2015-04-09 一种评分预测方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510165907.8A CN104715399B (zh) 2015-04-09 2015-04-09 一种评分预测方法与系统

Publications (2)

Publication Number Publication Date
CN104715399A CN104715399A (zh) 2015-06-17
CN104715399B true CN104715399B (zh) 2018-03-02

Family

ID=53414698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510165907.8A Active CN104715399B (zh) 2015-04-09 2015-04-09 一种评分预测方法与系统

Country Status (1)

Country Link
CN (1) CN104715399B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104966219B (zh) * 2015-07-21 2020-12-22 武汉Tcl集团工业研究院有限公司 一种基于词频加权技术的个性化协同过滤推荐方法及系统
CN105824878A (zh) * 2016-03-08 2016-08-03 上海大学 基于支持向量机回归模型的产品推荐方法
CN109242534B (zh) * 2018-08-07 2021-12-28 桂林电子科技大学 一种基于用户评论动态分析的用户评分预测方法
CN110110230A (zh) * 2019-04-26 2019-08-09 华南理工大学 一种基于用户评分与评论的推荐方法
CN111563787A (zh) * 2020-03-19 2020-08-21 天津大学 一种基于用户评论和评分的推荐系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004287934A (ja) * 2003-03-24 2004-10-14 Alpha Systems:Kk 情報提供システムおよびコンテキスト情報抽出方法
CN102541920A (zh) * 2010-12-24 2012-07-04 华东师范大学 联合基于用户和项目的协同过滤提高准确度的方法及装置
CN103500228A (zh) * 2013-10-23 2014-01-08 苏州大学 一种协同过滤推荐算法中改进的相似性度量方法
CN104111925A (zh) * 2013-04-16 2014-10-22 中国移动通信集团公司 项目推荐方法和装置
CN104182518A (zh) * 2014-08-25 2014-12-03 苏州大学 一种协同过滤推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004287934A (ja) * 2003-03-24 2004-10-14 Alpha Systems:Kk 情報提供システムおよびコンテキスト情報抽出方法
CN102541920A (zh) * 2010-12-24 2012-07-04 华东师范大学 联合基于用户和项目的协同过滤提高准确度的方法及装置
CN104111925A (zh) * 2013-04-16 2014-10-22 中国移动通信集团公司 项目推荐方法和装置
CN103500228A (zh) * 2013-10-23 2014-01-08 苏州大学 一种协同过滤推荐算法中改进的相似性度量方法
CN104182518A (zh) * 2014-08-25 2014-12-03 苏州大学 一种协同过滤推荐方法及装置

Also Published As

Publication number Publication date
CN104715399A (zh) 2015-06-17

Similar Documents

Publication Publication Date Title
CN104715399B (zh) 一种评分预测方法与系统
Banaeian et al. Green supplier selection using fuzzy group decision making methods: A case study from the agri-food industry
CN106600372A (zh) 一种基于用户行为的商品推荐方法及系统
CN106021562B (zh) 用于电商平台的基于主题相关的推荐方法
CN107909433A (zh) 一种基于大数据移动电子商务的商品推荐方法
CN103632290B (zh) 一种基于推荐概率融合的混合推荐方法
CN104615631B (zh) 一种信息推荐的方法及装置
CN103136683A (zh) 计算产品参考价格的方法、装置及产品搜索方法、系统
CN105786838A (zh) 一种信息匹配处理方法和装置
Özköse et al. Bibliometric analysis and mapping of management information systems field
CN103559622A (zh) 基于特征的协同过滤推荐方法
CN105205188A (zh) 采购物料供应商的推荐方法及推荐装置
Badriyah et al. A hybrid recommendation system for E-commerce based on product description and user profile
Wan et al. Possibility method for triangular intuitionistic fuzzy multi-attribute group decision making with incomplete weight information
CN107274242A (zh) 一种基于关联分析算法的商品推荐方法
CN104166732B (zh) 一种基于全局评分信息的项目协同过滤推荐方法
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
CN107203530A (zh) 信息推荐方法
CN107463645A (zh) 基于用户属性评分导向的个性化推荐系统及其推荐方法
CN104899246A (zh) 基于模糊机制用户评分邻域信息的协同过滤推荐方法
CN105138690A (zh) 确定关键词的方法和装置
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN111159549A (zh) 一种信息推荐方法及系统
CN106600357A (zh) 基于电子商务商品标题的商品搭配方法
CN108009194A (zh) 一种图书推送方法、电子设备、存储介质及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Chen Wenliang

Inventor after: Ma Chunping

Inventor after: Zhang Min

Inventor before: Chen Wenliang

Inventor before: Ma Chunping