CN104850603A - 电影评分预测方法 - Google Patents
电影评分预测方法 Download PDFInfo
- Publication number
- CN104850603A CN104850603A CN201510221394.8A CN201510221394A CN104850603A CN 104850603 A CN104850603 A CN 104850603A CN 201510221394 A CN201510221394 A CN 201510221394A CN 104850603 A CN104850603 A CN 104850603A
- Authority
- CN
- China
- Prior art keywords
- user
- film
- scoring
- model
- impression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明是一个在线电影评分预测方法,可以对电影评分进行预测。模型中考虑了三个因素,分别是:用户评分习惯、初始印象和影片质量。通过利用参数估计和假设检验对电影评分和用户评分进行分布实证,利用概率密度函数对用户评分习惯和初始印象因素进行描述,使本模型可以脱离以前研究的假设,具有重要意义,获得了良好的实验结果。通过实验发现,模型的预测结果可以达到45%~68%的精度,在浏览数为70时,效果最好可以达到68%的预测精度。本模型适用于在线点评系统等领域。
Description
所属技术领域
本发明涉及在线评分系统,是基于在线评分系统的电影评分预测方法。
背景技术
这几年互联网的快速发展,人们越来越喜欢在网上购物。随着国内电影在线点评系统的快速发展、兴起,电影在线评论已成为电影消费者重要的信息来源、评价中心和分享平台。通过挖掘评分数据,可以分析用户的兴趣爱好,购买意图,以及影响用户购买行为的因素。这些研究内容对商家来说是十分有意义和价值的。
发明内容
本发明提出了一个新的适用于电影评分的预测方法。首先对电影初始印象、用户评分习惯、电影质量进行了数学描述,然后给出了影响力因子的计算方法,最后给出了评分影响力模型中均值μ和方差σ的表达式:通过实验验证,本方法的预测效果最好可以达到68%的预测精度。
本发明的核心思想是通过数据分析,利用参数估计和假设检验对电影评分和用户评分进行分布实证得到其分布,进而用数学表达式进行刻画。该思想使得可以脱离以前研究的假设,具有重要意义,获得了良好的预测精度。
本发明的有益效果是,研究消费者之间的影响力模型,可以使得我们更加了解用户在“比较选择”阶段的心理过程,了解在线评论对电影销售的影响因素,以便可以通过管理评论或者设计评论显示方式尽可能地提高在线购票量。
附图说明
下面结合附图对本发明进行进一步说明。
图1评分过程模型。
图2评分预测方法流程。
图3某部电影评分预测结果。
具体实施方式
由图1所示,在进行评分时,在评分过程中有两个阶段:观看电影之前和观看电影之后。在观看之前这个阶段,用户会进行信息采集,即浏览以前用户的评论,在浏览完之后,用户会对这部电影产生一个初始印象。在观看之后这个阶段,用户会对电影产生一个体验感受,这个体验感受的好坏是由影片质量(Q)确定的,即如果影片质量很好,那么用户的体验感受会很好,反之则不好。本发明说的影片质量只包括与演员演技、剧情、视觉效果等相关的因素,不包括与电影院硬件配置相关的因素。在初始印象和实际体验之间会存在一定的差距,这个差距的大小由用户的评分习惯决定。如果用户喜欢给好评,在实际体验比预期的印象好的情况下,用户会给更高的评分;在实际体验比预期印象差的情况下,用户也会给出稍微偏好的评分;如果用户喜欢给差评,即使在实际体验比预期印象好,其给出的评分也不会很高,当然实际体验比预期差时,评分会很差。在观影前后和用户评分习惯的驱使下,用户最终会给出一个评分。
图2中,相应的说明有:
(1)初始印象。用户通过浏览评论产生,本发明通过实验实证,利用正态分布进行刻画,分布的参
数根据数据动态产生。用表示。
(2)评分习惯。每个用户都有自己的习惯,对于评分也是一样。评分习惯对用户最后的评分有直接影响,是评分的主观因素。本发明通过实验,发现利用正态分布进行刻画效果最好,其参数是固定值,用 和作为用户评分习惯概率密度函数(f(x))的参数。
(3)电影质量。电影质量是电影本身的因素,电影质量的好坏影响用户的观影效果,最后影响用户的评分,是评分的客观因素。其值为当前电影的平均分,用Q表示。
(4)评分预测方法。计算用户在初始印象、评分习惯、电影质量的综合影响力作用下的评分是本发明的核心内容。用户评分习惯可以用正态分布刻画,所以这里也将采用这个结论,认为个体给出的评分是一个正态分布的样本点。这里给出评分预测的概率密度函数表达式为:
同样,μ为均值,σ为方差。它们的计算表达式为:
其中为初始印象中的均值,为初始印象中的方差,ε为影响力因子,其表达式为:
ε=-c·f(Q)·e (2-3)
这里f(x)为评分习惯的概率密度函数,Q为电影质量(其大小为电影的平均分),f(Q)表示用户在观看电影后对的电影的感受。e为舆论熵,反映高分和低分对用户造成的影响。c为评分分制,这里取c=5。影响力因子ε,用于描述用户在观影前后,用户评价与电影质量对用户产生的影响作用,该影响会促使用户产生新的印象,进而给出评价分数。影响力因子ε的取值大小反映了关于前后初始印象与电影质量的差异性程度。
舆论熵e表达式为:
函数E(X)的表达式为:
其中,v+等于社交网络中正向观点的平均值,v-等于社交网络中负向观点的平均值。在5分制的评分标准中,4*表示较好,5*表示很好,3*表示一般,2*表示较差,1*表示很差。这里,v+就等于评论分值为4*和5*的数目之和,v-就等于评论分值为1*和2*的数目之和。
在运行时,对每个个体进行建模。首先模拟用户的初始印象产生,通过从数据库读取m条评分数据,利用正态参数估计得到参数的估计值作为初始印象。把数据库中当前电影的评分作为电影质量。然后根 据评论数据计算影响因子ε,进而得到评分影响力模型的参数μ和σ。得到了这两个参数就可以计算用户会给出1*、2*、3*、4*、5*的概率,并将这些概率映射为0到1的区间,然后产生一个随机数r,r落入那个分数对应的区间,则这个分数就作为用户的评分。
图3,为某部电影的预测结果,可以看出效果还不错。
Claims (2)
1.用户在观影前后,用户评价与电影质量对用户产生的影响作用,该影响会促使用户产生新的印象,进而给出评价分数。为了描述影响作用的大小,其特征是:提出了影响力因子的概念和计算方法。
2.基于在线电影评分数据对电影初始印象、用户评分习惯、电影质量进行了数学描述,其特征是:提出了一个新的适用于电影评分的预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510221394.8A CN104850603A (zh) | 2015-05-04 | 2015-05-04 | 电影评分预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510221394.8A CN104850603A (zh) | 2015-05-04 | 2015-05-04 | 电影评分预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104850603A true CN104850603A (zh) | 2015-08-19 |
Family
ID=53850248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510221394.8A Pending CN104850603A (zh) | 2015-05-04 | 2015-05-04 | 电影评分预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104850603A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106055657A (zh) * | 2016-06-03 | 2016-10-26 | 北京网智天元科技股份有限公司 | 用于特定人群的观影指数评价系统 |
CN111104552A (zh) * | 2019-12-24 | 2020-05-05 | 浙江大学 | 一种基于电影结构化信息和简介预测电影评分类别的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996143A (zh) * | 2014-05-12 | 2014-08-20 | 华东师范大学 | 一种基于隐式偏见和好友兴趣的电影评分预测方法 |
CN104008204A (zh) * | 2014-06-17 | 2014-08-27 | 南京大学 | 一种动态的多维情境感知电影推荐系统及其实现方法 |
-
2015
- 2015-05-04 CN CN201510221394.8A patent/CN104850603A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996143A (zh) * | 2014-05-12 | 2014-08-20 | 华东师范大学 | 一种基于隐式偏见和好友兴趣的电影评分预测方法 |
CN104008204A (zh) * | 2014-06-17 | 2014-08-27 | 南京大学 | 一种动态的多维情境感知电影推荐系统及其实现方法 |
Non-Patent Citations (1)
Title |
---|
黄飞虎等: ""基于信息熵的社交网络观点演化模型"", 《物理学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106055657A (zh) * | 2016-06-03 | 2016-10-26 | 北京网智天元科技股份有限公司 | 用于特定人群的观影指数评价系统 |
CN106055657B (zh) * | 2016-06-03 | 2019-10-01 | 网智天元科技集团股份有限公司 | 用于特定人群的观影指数评价系统 |
CN111104552A (zh) * | 2019-12-24 | 2020-05-05 | 浙江大学 | 一种基于电影结构化信息和简介预测电影评分类别的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fu et al. | How experiential consumption moderates the effects of souvenir authenticity on behavioral intention through perceived value | |
Boley et al. | Empowerment and resident attitudes toward tourism: Strengthening the theoretical foundation through a Weberian lens | |
Wilson et al. | Modeling reflective higher-order constructs using three approaches with PLS path modeling: a Monte Carlo comparison | |
JP5827416B2 (ja) | ユーザ質問の処理方法及び処理システム | |
CN105630946B (zh) | 一种基于大数据的领域交叉推荐方法及装置 | |
Chakravarty et al. | A gravity model approach to Indo-ASEAN trade-fluctuations and swings | |
CN103678388B (zh) | 在线音乐推荐方法及装置 | |
CN106126613A (zh) | 一种跑题作文确定方法及装置 | |
CN106469177A (zh) | 基于结构方程模型的互联网电影用户满意度分析方法及系统 | |
Santoso et al. | Social media factors and teen gadget addiction factors in Indonesia | |
CN104346389A (zh) | 口语考试半开放题型的评分方法及系统 | |
Santos | An attendance behavior model at sports events: comparison and constrast of two models | |
Ary et al. | The use of momentary time sampling to assess both frequency and duration of behavior | |
CN104850603A (zh) | 电影评分预测方法 | |
Çevrimkaya et al. | The mediating role of memorable tourism experience on tourist behavior: A perspective on organized tours | |
Ehret | Kolmogorov complexity of morphs and constructions in English | |
Lu et al. | Application of grey relational analysis for evaluating road traffic safety measures: advanced driver assistance systems against infrastructure redesign | |
CN106708939A (zh) | 一种对目标人物进行评分及推送的方法、装置、系统 | |
KR101291502B1 (ko) | 온라인 게임 고객 충성도 분석 시스템 및 분석 방법 | |
Park et al. | The influence of perceived risk on participation motivation and re-participation intention in marine sports | |
Saga et al. | Improvement of factor model with text information based on factor model construction process | |
Santi et al. | The role of experiential marketing on customer loyalty with customer satisfaction as a moderating variable in Bora Hot Spring Sigi, Central Sulawesi, Indonesia | |
CN110598960A (zh) | 一种实体级情感评估方法及装置 | |
Das et al. | Using the Gini index to measure the inequality in infrastructure services provided within an urban region | |
Lei | The empirical analysis of effecting online banking information security products customer satisfaction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150819 |
|
RJ01 | Rejection of invention patent application after publication |