CN111460819A - 基于细粒度情感分析的个性化评论文本推荐系统及推荐方法 - Google Patents
基于细粒度情感分析的个性化评论文本推荐系统及推荐方法 Download PDFInfo
- Publication number
- CN111460819A CN111460819A CN202010245004.1A CN202010245004A CN111460819A CN 111460819 A CN111460819 A CN 111460819A CN 202010245004 A CN202010245004 A CN 202010245004A CN 111460819 A CN111460819 A CN 111460819A
- Authority
- CN
- China
- Prior art keywords
- user
- commodity
- target
- emotion
- comment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于细粒度情感分类的个性化评论文本推荐系统,其包括关联商品构建模组、关联用户构建模组、方面、短语提取模组、情感分析模组、用户方面情感相似度计算模组、用户相似度计算模组、帮助性分数计算模组及个性化评论推荐模组。所述关联商品构建模组构建关联商品集合。所述关联用户构建模组构建关联用户集合。所述方面、短语提取模组提取商品评论文本中的商品方面词及短语。所述情感分析模组计算用户的方面情感分数。所述用户方面情感相似度计算模组计算用户之间的方面情感相似度。所述用户相似度计算模组获得相似用户。所述帮助性分数计算模组计算相似用户的评论文本的帮助性分数并对应推荐评论文本给目标用户。同时,本发明还提供一种采用所述推荐系统的推荐方法。
Description
技术领域
本发明涉及评论文本自动推荐技术领域,特别的,涉及一种基于细粒度情感分类分析的个性化评论文本推荐系统及推荐方法。
背景技术
随着互联网技术的爆发式发展,社会化网络已经成为当今信息传播、信息交流的主要平台,人与人之间的互动和联系越来越依赖于社交网络。在线购物平台是社会化网络的一种,如亚马逊、淘宝及京东等。
当用户于在线购物平台购物时,其需要使用在线购物平台的用户对在售商品销量、喜好、质量等做出评价,将自身的体验感受以信息评论文本发布方式更新,且更新速度异常快捷,造成在线购物平台产生巨大冗余信息,给用户甄别感兴趣的评论文本造成困扰。
同时,用户进行购物之前,会参考已经购买用户的评论,并作为购买决策的判断依据。
为了方便目标用户在海量信息评论文本中找到自己感兴趣的信息,需要借助智能系统实现,以帮助用户从海量评论文本中找到感兴趣的评论文本。社会化网络推荐系统的研究能够拓展社会网络中用户评论文本信息的推荐精度和推荐范围,完成主动精准推送,帮助用户快速找到感兴趣的评论文本信息。
然而,在社会化网络推荐系统中,如何利用社会网络结构和文本信息构建推荐系统框架是业界研究的难题。以在线销售平台为例,用户如何在评论中通过推荐系统快速精准接收到感兴趣的评论文本,现有技术中有不同的解决方案。
现有技术一揭示一种在电商网站上推荐高质量、具有代表性的评论文本方法如图1所示,其包括如下步骤:
步骤S11,提取关键词:从在售商品的评论文本中提取包含商品属性特征的关键字,并将上述关键词进行同义词合并;
步骤S12,预测商品评论的质量分数:使用动态神经网络检测在售商品的评论文本的质量分数,预测商品评论文本的质量分数;
步骤S13,根据步骤S11提取的关键词结果和步骤S12中的预测商品评论的质量分数结果,筛选topK条有着较高质量且涵盖商品各个方面特性的评论;
步骤S14,用户根据步骤S13中的topK条评论文本作为判断依据选择目标商品的购买与否。
在现有技术一的评论文本推荐方法中,因为目标商品自身具有多种商品属性特征,且每个用户对目标商品属性特征的要求不一样,而推荐的topK条评论文本是面向所有用户的,而不是个性化地针对某个用户的兴趣要求推荐的评论文本,也就是说,针对不同的用户,其得到的推荐评论文本结果是一致的,例如用户一关注商品的属性a,而用户二关注商品的属性b,当针对上述用户一和用户二推荐同样的商品评论文本时,对用户一及用户二做出购买决策容易造成误导。
现有技术二揭示一种基于社交大数据作个性化评论文本排名的系统如图2所示,所述基于社交大数据作个性化评论文本排名的系统20包括离线处理模块21和在线推荐模块23。
所述离线处理模块21对推荐评论文本信息进行处理过程包括依次设置的方面总结步骤和用户向量生成步骤。
请参阅图3,是图2所示基于社交大数据作个性化评论文本排名的系统的离线处理模块的处理流程示意图。所述方面总结步骤旨在从评论文本中提取特征以及特征的极性权重,具体包括如下步骤:
步骤S211,对评论文本中的每个单词作词性标注,其中评论文本中的名词作为潜在的特征词,副词或形容词作为情感词,并计算情感词的具体情感分数;
步骤S212,根据步骤S211中的特征词与情感词的距离进行映射,并把该情感分数应用于特征词;
步骤S213,计算评论文本中每个特征词的情感总分;
所述用户向量生成步骤是针对每个用户和一系列该用户已经评价过的商品,把这些信息表示成用户向量U={r1,r2,…,ri,…,rn},其中n为自然数。如果用户没有评论过商品pi,则ri=0;如果用户评论过商品pi,则每个元素ri由以下三种方式构成:ri等于用户对商品pi的总体评分、用户评论商品pi的各个方面的情感总和及用户评论商品pi的各个方面的加权总和。
步骤S214,针对创建的用户向量,应用基于用户的协同过滤机制发现相似用户。
所述在线推荐模块是指当目标用户搜索某个目标商品时,系统计算目标用户与其他用户的相似度,然后按用户相似度降序的方式给目标用户推荐相似用户的评论,至此实现用户对感兴趣的评论文本和用户的快速过滤。
然而,在上述现有技术二中,所述基于社交大数据作个性化评论文本排名的系统是基于用户对商品的总体评分,或者是用户对商品各个方面情感分数的总和来生成的用户向量的,以总体评分或商品各个方面情感分数的总和构成的用户向量只能从整体角度反映用户对目标商品的偏好,不能从更细的粒度层次反映用户对某个商品某个方面的具体偏好,因此这就使得计算用户相似度的粒度分类较粗,推荐的相似用户在商品方面的偏好差异较大,不能满足个性化需求,同样引起对用户的误导。
综上可见,现有技术一中的评论文本推荐方式是基于非个性化的推荐评论文本实现,非个性化的推荐方式给所有用户推荐相同的评论列表,没有考虑到用户的偏好,对用户做选择决策可能产生误导。
当然,现有技术也有针对个性化推荐方式实现的评论文本推荐方法,但是其主要是从评论的整体级别预测评论帮助性分数,然后根据帮助性分数作评论推荐;或者是以粗粒度分类的方式计算用户相似度,如现有技术二所述,然后推荐相似用户的评论。但是,上述两种个性化的推荐方式都没有关注目标用户对目标商品在商品方面级别情感偏好。
鉴于此,有必要提供一种针对个性化评论文本的推荐系统,从评论中分析目标用户的方面偏好,探索用户与物品的交互,进而衡量用户相似度,以帮助用户针对个性评论文本的选择决策和提高选择精准度,减少误导。
发明内容
本发明目的在于提供一种分析目标用户的方面偏好,探索用户与物品的交互,进而衡量用户相似度,以帮助用户针对个性评论文本的选择决策和提高选择精准度,减少误导的基于细粒度情感分类的个性化评论文本推荐系统。
同时,还提供一种采用上述基于细粒度情感分类的个性化评论文本推荐系统的推荐方法。
一种基于细粒度情感分类的个性化评论文本推荐系统,用于目标用户通过所述基于细粒度情感分类的个性化评论文本推荐系统制定购买目标商品决策,包括关联商品构建模组、关联用户构建模组、方面、短语提取模组、情感分析模组、用户方面情感相似度计算模组、用户相似度计算模组、帮助性分数计算模组及个性化评论推荐模组,所述关联商品构建模组计算所述目标用户已经评论过的商品与所述目标商品之间的关联度,并获得与所述目标商品相关联的关联商品集合,所述关联商品集合包括多个关联商品;在所述关联商品构建模组获得的关联商品集合中,所述关联用户构建模组基于共同评论关系构建与所述目标用户相关联的关联用户集合,所述关联用户集合包括多个关联用户;所述方面、短语提取模组对所述关联商品和所述目标商品的评论文本集合进行方面分析,获取方面词和短语;所述情感分析模组接收来自所述方面、短语提取模组所提取的方面词和短语,并分别对应计算所述目标用户和所述关联用户的方面情感分数;所述用户方面情感相似度计算模组接收所述关联商品、所述关联用户及所述目标用户的方面情感分数,并计算所述目标用户与每一关联用户对于关联商品pi(i为自然数)的方面情感相似度;所述用户相似度计算模组基于所述关联商品pi(i为自然数)与所述目标商品之间的关联度、所述目标用户与每一关联用户对于关联商品pi的方面情感相似度计算所述目标用户与每一关联用户之间的总体相似度,获得相似用户;所述帮助性分数计算模组基于所述总体相似度、相似用户的评论文本中包含的方面词数量计算相似用户的评论文本的帮助性分数;所述个性化评论推荐模组基于相似用户的评论文本的帮助性分数对应推荐相似用户的评论文本给目标用户。
进一步的,设定目标商品为pt,目标用户评论过的商品为pi,n为所述关联商品中节点的数量,wxy是共同买过商品x和商品y的用户数量,W(pt,pi)是所有可能会同时购买目标商品pt和目标用户评论过的商品pi用户数量,R(pt,pi)表示目标商品pt和目标用户评论过的商品pi之间的关联度,则:
进一步的,设定x和y为所述关联商品中的两个不同目标商品节点,N(x)和N(y)为x和y的邻接商品集合,wxy为共同购买过x和y的用户数量,wxz、wzy与wxy的含义相同,W(x,y)为所有可能会同时购买商品x和y的用户数量,则:
W(x,y)=wxy+∑z∈N(x)∩N(y)wxz+wzy。
进一步的,所述方面、短语提取模组对所述关联商品和目标商品的评论文本进行分词和词性标注处理,计算所述评论文本中的名词与商品的标准方面名词的语义相似度,当所述语义相似度大于设定的阈值时,将该名词作为方面名词提取出来,否则,放弃提取。
进一步的,当所述评论文本中的名词作为方面名词提取出来时,用标准方面名词替代,并作为中心词,截取所述中心词在内的前后五个词作为短语。
进一步的,所述情感分析模组提取的短语中包含形容词、副词或动词,则用情感词典计算这些词性的情感值,并将该情感值作为方面的情感分数;若短语中不包含形容词、副词或动词,则方面的情感分数为中性。
进一步的,设定为所述目标用户ut和关联用户uj对关联商品pi的方面情感相似度,为关联商品pi的标准方面集合,为目标用户ut对方面a的情感评分,为关联用户uj对方面a的情感评分,如果ut,uj共同评论过pi,则:
进一步的,当计算用户相似度时,取关联商品与目标商品之间的关联度作为用户情感相似度的置信权重,并把它们两者看作用户与商品的交互信息,具体计算方式如下:
S(ut,uj)指目标用户ut与关联用户uj的相似度,n指目标用户ut与关联用户uj共同评论过的商品数量,R(pt,pi)指目标商品pt与关联商品pi的商品之间的关联度,指目标用户ut与关联用户uj对关联商品pi的情感相似度。
一种基于细粒度情感分类的个性化评论文本推荐系统的推荐方法,包括如下步骤:
计算所述目标用户已经评论过的商品与所述目标商品之间的关联度,获得与所述目标商品相关联的关联商品集合,其中所述关联商品集合包括多个关联商品;
在所述关联商品集合中,基于共同评论关系构建与所述目标用户相关联的关联用户集合,其中所述关联用户集合包括多个关联用户;对关联商品集合中的所有商品评论文本进行分词和词性标注处理,提取获得方面词和短语;
分别对应计算所述目标用户和所述关联用户的方面情感分数,获得所述目标用户与每一关联用户对于关联商品pi(i为自然数)的方面情感相似度;
基于所述关联商品pi(i为自然数)与所述目标商品之间的关联度、所述目标用户与每一关联用户对于关联商品pi的方面情感相似度计算所述目标用户与每一关联用户之间的总体相似度,获得相似用户;
基于所述总体相似度、相似用户的评论文本中包含的方面词数量计算相似用户的评论文本的帮助性分数;及
基于相似用户的评论文本的帮助性分数对应推荐相似用户的评论文本给目标用户,至此,完成向所述目标用户推荐个性化评论文本。
进一步的,所述评论文本的帮助性分数计算方式如下:
其中,H(ut,uj)是指相似用户uj的评论对于目标用户ut购物的帮助性大小,S(ut,uj)指目标用户ut与用户uj的相似度,l代表商品标准方面词字典的长度,指相似用户uj对目标商品pt的评论文本中包含的方面数量。与相关技术相比,本发明通过设置所述关联商品构建模组、关联用户构建模组、方面、短语提取模组、情感分析模组对应计算评论方面的情感分数、用户方面情感相似度计算模组对应计算用户方面情感相似度、用户相似度计算模组及个性化评论推荐模组,其中所述关联商品构建模组在构建关联商品时,基于所述目标用户对自己已经评论过的其他商品结合其他用户评论过的所述目标商品构建所述关联商品。所述用户相似度计算模组综合所述关联商品及关联用户情感相似度更准确地选择相似用户,所述个性化评论推荐模组综合用户相似度模组的计算结果以及相似用户评论中包含的方面词数量计算评论的帮助性分数,并按照帮助性分数选择性选取评论文本对目标用户进行评论文本推荐,使得目标用户能够在众多的评论文本中,快速浏览到真正对其购买所述目标商品具有帮助性的评论文本,使目标用户能更好地了解目标商品的特性,从而更快地做出购买决策。
附图说明
图1是一种现有技术揭示一种电商网站推荐评论文本方法流程示意图;
图2是另一种现有技术揭示基于社交大数据作个性化评论文本排名的系统框图;
图3是图2所示基于社交大数据作个性化评论文本排名系统的离线处理模块的处理流程示意图;
图4是本发明揭示一种基于细粒度情感分类的个性化评论文本推荐系统的框架结构示意图;及
图5是图4所示基于细粒度情感分类的个性化评论文本推荐系统的推荐方法流程示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图4,是本发明一种基于细粒度情感分类的个性化评论文本推荐系统的框架结构示意图。所述基于细粒度情感分类的个性化评论文本推荐系统30旨在满足目标用户购买目标商品时,以关联商品的评论文本作为推荐基础,分析所述目标用户基于所述关联商品的评论文本的方面情感相似度以及用户的总体相似度,找到所述目标用户的相似用户,并根据所述相似用户的相似度以及相似用户评论文本中包含的方面词数量来决定评论的帮助性分数,在帮助性分数的基础上给所述目标用户推荐具有帮助性的评论文本,供决策购买所述目标商品。
所谓目标用户是指意欲购买某种在售商品的用户,也就是说,该目标用户并未购买目标商品,但是其计划购买目标商品,同时,目标用户有购买过目标商品之外的其他商品的体验,并对目标商品之外的其他商品的购买体验做出过评论文本。
定义用户集合为User(下简称“U”),包括目标用户和其他用户。
定义目标用户为targetuser(下简称“ut”),所述目标用户ut对自己曾经购买的目标商品之外的其他商品做出过评论文本。
定义所述目标用户ut之外的其他用户为其他用户uj,所述其他用户是对所述目标商品和目标商品的关联商品曾经做出购买行为并做出过评论文本的用户。
所谓目标商品是指所述目标用户意欲购买的在售商品,所述目标商品已经获得所述目标用户之外的其他用户的评论文本。设定在售商品集合为Product(下简称“P”),目标商品为target product(下简称“pt”)。
所谓关联商品集合是指被相同的用户同时购买过并对购买行为做过评论文本的商品集合,包括目标用户已经做过评价文本的其他商品集合put,其中put中的商品是候选的关联商品,以及其他用户已经做过评价文本的目标商品pt,定义目标商品pt的关联商品集合中的关联商品为pi,其中关联商品为pi可能包括目标用户购买过的其他商品put,但是不包括目标商品pt,也就是说,所述关联商品pi是针对集合put中的商品通过计算与目标商品pt的商品相关性之后才确定的是否是关联商品pi,因此put中的商品不一定全部是关联商品pi。当其他用户在购买所述目标商品pt时,根据所述其他用户的购买体验对所述目标商品pt的关联商品集合中的关联商品pi进行评论,其中i为自然系数;当所述目标用户对其他商品购买时,根据所述目标用户对其他商品,即所述目标商品的候选关联商品的购买体验对其他商品pi进行评论,其中i为自然系数。上述所有评论行为对应的评论文本合并获得评论文本集合Market(下简称“M”),所述评论文本集合Market中的某一关联商品pi评论文本集合为Market pi(下简称“Mpi”),其中i为自然系数。
设定所述目标商品pt的关联商品集合中的关联商品pi已经被多个用户uj做出多种个性化评论文本mk,其中mk∈Mpi,i,k为自然数,所述评论文本用于评价商品pi的各种不同商品属性特征,且每一不同用户对于商品pi的属性特征评论分别是基于用户自身个性化认知做出的。
所谓细粒度情感分类分析是基于属性或方面(Aspect)的情感分析的分析粒度更“细”。设定商品ps(s为自然数,商品ps为任一商品,可以是目标商品,也可以是目标商品的某个关联商品)的标准方面集合为Aspect ps(以下简称),商品ps的标准方面集合的某个标准方面为aspect(以下简称“a”)。
当所述目标用户采用所述基于细粒度情感分类的个性化评论文本推荐系统30购买所述目标商品时,首先,所述目标用户ut对关联商品pi的评论文本以及其他用户uj对关联商品pi的评论文本分别进行方面情感分析,以便分析目标用户与其他用户对同一关联商品pi的评论文本中包含的方面情感,从而计算所述目标用户ut与其他用户uj针对同一商品pi的方面情感相似度。
其次,基于目标商品pt与关联商品pi的商品相关性和目标用户ut与其他用户uj的方面情感相似度,计算目标用户ut与其他用户uj的总体相似度。
最后,根据目标用户ut与其他用户uj的用户相似度以及其他用户uj对目标商品pt的评论文本包含的方面词数量,来计算用户uj对目标商品pt的评论帮助性分数。所述基于细粒度情感分类的个性化评论文本推荐系统30推荐帮助性得分靠前的评论文本给所述目标用户ut。
表一
所述基于细粒度情感分类的个性化评论文本推荐系统30包括关联商品构建模组31、关联用户构建模组33、方面、短语提取模组35、情感分析模组36、用户方面情感相似度计算模组37、用户相似度计算模组38、帮助性分数计算模组39及个性化评论推荐模组40。
所述关联商品构建模组31基于商品集合P中的商品的共同购买关系构建关联商品,当购买两个商品x和y的相同用户数量越多,则两个商品的相关性越大;反之,则两个商品的相关性越小。所述关联商品构建模组31在构建所述目标商品的关联商品pi(i为自然数)时,以同时购买过所述目标商品和其他商品的共同用户数量为连接所述目标商品pt和目标用户购买过的其他商品put节点的边上权重。所述关联用户构建模组33基于用户集合U及关联商品构建模组31构建的关联商品pi结果构建关联用户。所述方面、短语提取模组35对目标商品pt的评论文本及关联商品pi(i=1,2,..n,关联商品可能有多个,并且每个pi可能有多条评论文本)的用户评论文本集合进行方面分析,获取方面词和短语。所述情感分析模组36接收来自所述方面、短语提取模组35的方面词和短语,并基于所述关联商品pi的用户评论文本对应分析方面的情感分数。所述用户方面情感相似度计算模组37接收所述关联商品构建模组31得到的关联商品pi、所述关联用户构建模组33得到的关联用户集合以及接收方面情感分析模组36得到的方面情感分数,对所述目标用户及关联用户构建用户向量,计算用户针对关联商品pi(i为自然数)的方面情感相似度;所述用户相似度计算模组38接收来自所述关联商品构建模组31的商品关联度结果、所述用户方面情感相似度计算模组37计算用户总体相似度,获得相似用户。所述帮助性分数计算模组39基于所述方面、短语提取模组35的方面词和短语、所述总体相似度、相似用户的评论文本中包含的方面词数量计算相似用户的评论文本的帮助性分数。所述个性化评论推荐模组40根据相似用户的评论文本的帮助性分数对应推荐相似用户的评论文本给目标用户。所述关联商品构建模组31是针对商品集合P内,所述目标商品pt与目标用户ut评论过的商品pi(i=1,2,…n)为节点构建商品关联图。采用所述关联商品构建模组31构建关联商品的计算方法如下:
其中,R(pt,pi)代表目标商品pt和其他商品pi的关联度,n为商品关联图中节点的数量,wxy是共同买过商品x和商品y的用户数量,W(pt,pi)指所有可能会同时购买目标商品pt和其他商品pi用户数量,W(pt,pi)的公式表示如下:
其中,x和y为商品关联图中的两个不同目标商品节点,N(x)和N(y)分别代表x和y的邻接商品集合,wxy为共同购买过x和y的用户数量,wxz和wzy与wxy的含义相同,因此W(x,y)为所有可能会同时购买商品x和y的用户数量,所谓同时购买商品x和y的用户数量,包括直接和间接购买x和y的用户数量。
所述关联用户构建模组33是接收关联商品构建模组31的结果,获取目标商品的相关联商品之后,筛选出同时买过所述目标商品及它的相关联商品的用户作为关联用户。
所述方面、短语提取模组35是参照Flipkart网站上的商品方面,定义任一商品ps(s=1,2,...n)的标准方面集合为建立商品ps的方面名词a,其中所述标准方面集合是由商品ps的多个标准方面a组成。对目标商品pt的评论文本以及关联商品pi的评论文本集合中的评论文本mk进行分词和词性标注处理,分别计算目标商品pt的评论文本及关联商品pi的评论文本mk中的名词与商品的标准方面集合中的方面a的语义相似度。当所述语义相似度大于设定的阈值时,将该名词作为方面名词提取出来,并用标准方面a替代,将该方面作为中心词,截取中心词在内的前后五个词作为短语;当所述语义相似度小于设定的阈值时,则放弃提取。
所述情感分析模组36对所述方面、短语提取模组35提取的中心词、短语进行分析,并通过情感词典计算确定情感分数。当提取的短语中包含形容词、副词或动词,则用情感词典计算这些词性的情感值,并将该情感值作为方面的情感分数;若短语中不包含形容词、副词或动词,则方面的情感分数为中性。
所述用户方面情感相似度计算模组37是基于关联商品构建模组31获得的关联商品pi、所述关联用户构建模组33获得的关联用户集合和情感分析模组36得到的方面情感分数,构建用户向量,计算用户针对关联商品pi(i为自然数)的方面情感相似度。如果ut,uj共同评论过pi,则所述用户方面情感相似度的计算方法如下:
所述用户相似度计算模组38在计算用户相似度时,取商品关联度作为用户方面情感相似度的置信权重,并把它们两者看作用户与商品的交互信息,具体计算方式如下:
其中,S(ut,uj)指目标用户ut与用户uj的相似度,n指目标用户ut与用户uj共同评论过的商品数量,R(pt,pi)指目标商品pt与其他关联商品pi的商品相关性,指目标用户ut与用户uj对于关联商品pi方面情感相似度。
所述帮助性分数计算模组39基于所述用户相似度计算模组38的计算结果及相似用户的评论文本中所包含的方面数量计算相似用户的评论文本的帮助性分数。其中所述评论文本的帮助性分数的计算方式如下:
其中,H(ut,uj)是指相似用户uj的评论对于目标用户ut购物的帮助性大小,S(ut,uj)指目标用户ut与用户uj的相似度,l代表商品标准方面词字典的长度,指相似用户uj对目标商品pt的评论中包含的方面数量。
所述个性化评论推荐模组40根据所述评论帮助性分数推荐得分靠前的评论给目标用户。
在本发明所述基于细粒度情感分类的个性化评论文本推荐系统30中,设置关联商品构建模组31、关联用户构建模组33,所述关联用户构建模组33基于商品集合P及关联商品构建模组31得到目标用户的关联用户集合,方面、短语提取模组35、情感分析模组36对应计算评论文本情感分数,并作为所述用户方面情感相似度计算模组37、用户相似度计算模组38、个性化评论推荐模组39计算的考量因素。所述用户方面情感相似度计算模组37,接收关联商品构建模组31得到的关联商品pi(i为自然数)、关联用户构建模组33得到关联用户集合以及接收方面情感分析模组36得到的方面情感分数,对目标用户及候选的相似用户构建用户向量,计算用户针对关联商品pi(i为自然数)的方面情感相似度。所述用户相似度计算模组38接收来自所述关联商品构建模组33商品关联度结果、所述用户方面情感相似度计算模组37计算用户总体相似度。所述帮助性分数计算模组39根据所述用户相似度计算模组37的用户相似度计算结果以及相似用户评论中包含的方面词数量,计算相似用户评论的帮助性分数。所述个性化评论推荐模组40按照帮助性分数推荐相似用户的评论文本给目标用户,使得用户可以根据自己的兴趣准确接收符合自己偏好的用户评论文本,帮助目标用户决策购买目标商品。
相较于现有技术,本发明的所述基于细粒度情感分类的个性化评论文本推荐系统30中不仅仅向用户提供共性的评论文本,而是结合用户的方面情感分类针对性提供更加相似或者感兴趣的评论文本,作为目标用户个性化购买的判断支持,有利于做出正确的购买策略。
再请参阅图5,是图4所示基于细粒度情感分类的个性化评论文本推荐系统的推荐方法流程示意图。采用所述基于细粒度情感分类的个性化评论文本推荐系统30向目标用户推荐相似度高的个性化评论文本的方法包括如下步骤:
步骤S31,提供商品集合P、已经作出评论的用户集合U、针对商品的评论文本集合M;
其中,在本发明中,设定所述目标商品为pt,目标用户为ut,进行方面词、短语提取及方面情感分析的关联商品pi的评论文本mk,其中k,i均为自然数。同时,参照Flipkart网站上的商品方面,定义商品pi(i=1,2,…n)的标准方面集合设定评论文本中的商品标准方面为a,其中
步骤S32,提供关联商品构建模组31,计算所述目标用户已经评论过的其他商品与所述目标商品之间的关联度,获得与所述目标商品相关联的关联商品集合,其中所述关联商品集合包括多个关联商品;
在该步骤中,所述关联商品包括目标用户已经做出过评论的其他商品,还包括其他用户做出过评论的目标商品。
步骤S33,提供关联用户构建模组33,在步骤S32获得的所述关联商品集合中,基于共同评论关系构建与所述目标用户相关联的关联用户集合,其中所述关联用户集合包括多个关联用户;
步骤S34,提供方面、短语提取模组35对所述关联商品集合中的所有关联商品及目标商品的评论文本进行分词和词性标注处理,提取获得方面词和短语;
在该步骤中,对评论文本中的名词与标准方面词一一进行语义相似度计算,当评论文本中的名词与标准方面的语义相似度取得最大值且大于设定阈值,将该名词作为方面词提取出来,并用标准方面a替代;将该方面词作为中心词,截取中心词在内的前后五个词作为短语。
步骤S35,提供情感分析模组36对步骤S34中所述方面、短语提取模组35提取的中心词、短语进行分析,获得方面的情感分数;
步骤S36,提供用户方面情感相似度计算模组37接收来自所述关联商品构建模组31得到的关联商品pi(i为自然数)、所述关联用户构建模组33得到的关联用户以及接收所述情感分析模组36得到的方面情感分数,对目标用户及关联用户,构建用户向量,并计算所述目标用户与每一关联用户对于关联商品pi(i为自然数)的方面情感相似度;
步骤S37,提供用户相似度计算模组38,并基于所述步骤S36得到的用户方面情感相似度和步骤S33的所述商品相关度来计算用户相似度;
步骤S38,提供帮助性分数计算模组39,并根据所述步骤S37的所述用户相似度计算模组38的计算结果,还根据相似用户的评论文本中所包含的方面数量计算获得评论文本的帮助性分数,其中,所述评论文本的帮助性分数计算方式如下:
其中,H(ut,uj)是指相似用户uj的评论对于目标用户ut购物的帮助性大小,S(ut,uj)指目标用户ut与用户uj的相似度,l代表商品标准方面词字典的长度,指相似用户uj对目标商品pt的评论中包含的方面数量;
步骤S39,提供个性化评论推荐模组40,根据评论文本的帮助性分数推荐topk条评论文本至目标用户;
至此,完成向目标用户推荐个性化评论文本。
在上述推荐方法中,所述个性化评论推荐模组40是通过综合考虑所述用户相似度计算模组38和相似用户评论文本中包含的方面词数量,计算评论的帮助性分数,获得满足目标用户的较高帮助性分数的用户评论,从而满足用户的个性化推荐需求,便于目标用户决策购买,减少误导。
相较于现有技术,本专利提出一个基于用户方面情感相似度的个性化评论推荐方法,给目标用户推荐对其购物具有帮助性的评论。主要通过分析目标用户已经购买过的商品与目标商品的相关性,以及用户的方面情感相似度来计算用户相似度,然后从评论的方面级别重新定义相似用户的评论对于目标用户购物的帮助性,最后在推荐top-k条评论时,具有较高帮助性分数的评论被优先推荐给目标用户。
因此,本发明的推荐评论文本中,能够在众多的评论文本中,选择出真正对目标用户购物具有帮助性的评论进行推荐,使目标用户能更好地了解目标商品的特性,从而更快地做出购买决策。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于细粒度情感分类的个性化评论文本推荐系统,用于目标用户通过所述基于细粒度情感分类的个性化评论文本推荐系统制定购买目标商品决策,其特征在于,包括:
关联商品构建模组,其计算所述目标用户已经评论过的商品与所述目标商品之间的关联度,并获得与所述目标商品相关联的关联商品集合,所述关联商品集合包括多个关联商品;
关联用户构建模组,在所述关联商品构建模组获得的关联商品集合中,基于共同评论关系构建与所述目标用户相关联的关联用户集合,所述关联用户集合包括多个关联用户;
方面、短语提取模组,对所述关联商品和所述目标商品的评论文本集合进行方面分析,获取方面词和短语;
情感分析模组,接收来自所述方面、短语提取模组所提取的方面词和短语,并分别对应计算所述目标用户和所述关联用户的方面情感分数;
用户方面情感相似度计算模组,接收所述关联商品、所述关联用户及所述目标用户及关联用户的方面情感分数,并计算所述目标用户与每一关联用户对于关联商品的方面情感相似度;
用户相似度计算模组,基于所述关联商品与所述目标商品之间的关联度、所述目标用户与每一关联用户对于关联商品的方面情感相似度计算所述目标用户与每一关联用户之间的总体相似度,获得相似用户;
帮助性分数计算模组,基于所述总体相似度、相似用户的评论文本中包含的方面词数量计算相似用户的评论文本的帮助性分数;及
个性化评论推荐模组,基于相似用户的评论文本的帮助性分数对应推荐相似用户的评论文本给目标用户。
3.根据权利要求2所述基于细粒度情感分类的个性化评论文本推荐系统,其特征在于,设定x和y为所述关联商品中的两个不同商品节点,N(x)和N(y)为x和y的邻接商品集合,wxy为共同购买过x和y的用户数量,wxz、wzy与wxy的含义相同,W(x,y)为所有可能会同时购买商品x和y的用户数量,则:
W(x,y)=wxy+∑z∈N(x)∩N(y)wxz+wzy。
4.根据权利要求1所述基于细粒度情感分类的个性化评论文本推荐系统,其特征在于,所述方面、短语提取模组对所述关联商品和目标商品的评论文本进行分词和词性标注处理,计算所述评论文本中的名词与商品的标准方面名词的语义相似度,当所述语义相似度大于设定的阈值时,将该名词作为方面名词提取出来,否则,放弃提取。
5.根据权利要求4所述基于细粒度情感分类的个性化评论文本推荐系统,其特征在于,当所述评论文本中的名词作为方面名词提取出来时,用标准方面名词替代,并作为中心词,截取所述中心词在内的前后五个词作为短语。
6.根据权利要求5所述的基于细粒度情感分类的个性化评论文本推荐系统,其特征在于,所述情感分析模组提取的短语中包含形容词、副词或动词,则用情感词典计算这些词性的情感值,并将该情感值作为方面的情感分数;若短语中不包含形容词、副词或动词,则方面的情感分数为中性。
9.一种采用如权利要求1所述的基于细粒度情感分类的个性化评论文本推荐系统的推荐方法,其特征在于,包括如下步骤:
计算所述目标用户已经评论过的商品与所述目标商品之间的关联度,获得与所述目标商品相关联的关联商品集合,其中所述关联商品集合包括多个关联商品;
在所述关联商品集合中,基于共同评论关系构建与所述目标用户相关联的关联用户集合,其中所述关联用户集合包括多个关联用户;
对关联商品集合中的所有商品的评论文本进行分词和词性标注处理,提取获得方面词和短语;
对所述方面、短语提取模组提取的中心词、短语进行分析,获得方面的情感分数;
接收来自所述关联商品构建模组得到的关联商品、所述关联用户构建模组得到的关联用户以及接收所述情感分析模组得到的方面情感分数,对目标用户及关联用户构建用户向量,并计算目标用户与每一关联用户对于关联商品的方面情感相似度;
基于所述关联商品与所述目标商品之间的关联度、所述目标用户与每一关联用户对于关联商品的方面情感相似度的方面情感相似度计算用户相似度;
根据所述步骤S37的所述用户相似度计算模组38的计算结果,还根据相似用户的评论文本中所包含的方面数量计算获得评论文本的帮助性分数;及
基于相似用户的评论文本的帮助性分数对应推荐相似用户的评论文本给目标用户;
至此,完成向所述目标用户推荐个性化评论文本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010245004.1A CN111460819B (zh) | 2020-03-31 | 2020-03-31 | 基于细粒度情感分析的个性化评论文本推荐系统及推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010245004.1A CN111460819B (zh) | 2020-03-31 | 2020-03-31 | 基于细粒度情感分析的个性化评论文本推荐系统及推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111460819A true CN111460819A (zh) | 2020-07-28 |
CN111460819B CN111460819B (zh) | 2023-06-20 |
Family
ID=71683488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010245004.1A Active CN111460819B (zh) | 2020-03-31 | 2020-03-31 | 基于细粒度情感分析的个性化评论文本推荐系统及推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111460819B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347254A (zh) * | 2020-11-05 | 2021-02-09 | 中国平安人寿保险股份有限公司 | 新闻文本的分类方法、装置、计算机设备和存储介质 |
CN112991017A (zh) * | 2021-03-26 | 2021-06-18 | 刘秀萍 | 基于用户评论解析的标签体系精准推荐方法 |
CN113177170A (zh) * | 2021-04-12 | 2021-07-27 | 维沃移动通信有限公司 | 评论展示方法、装置及电子设备 |
CN113538106A (zh) * | 2021-07-26 | 2021-10-22 | 王彬 | 基于评论整合挖掘的商品精细化推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515828B1 (en) * | 2012-05-29 | 2013-08-20 | Google Inc. | Providing product recommendations through keyword extraction from negative reviews |
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及系统 |
CN105787055A (zh) * | 2016-02-26 | 2016-07-20 | 合网络技术(北京)有限公司 | 信息推荐方法及装置 |
CN109360058A (zh) * | 2018-10-12 | 2019-02-19 | 平安科技(深圳)有限公司 | 基于信任网络的推送方法、装置、计算机设备及存储介质 |
-
2020
- 2020-03-31 CN CN202010245004.1A patent/CN111460819B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515828B1 (en) * | 2012-05-29 | 2013-08-20 | Google Inc. | Providing product recommendations through keyword extraction from negative reviews |
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及系统 |
CN105787055A (zh) * | 2016-02-26 | 2016-07-20 | 合网络技术(北京)有限公司 | 信息推荐方法及装置 |
CN109360058A (zh) * | 2018-10-12 | 2019-02-19 | 平安科技(深圳)有限公司 | 基于信任网络的推送方法、装置、计算机设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
HUANG CHUNLI,JIANG WENJUN: "《Aspect-based personalized review ranking》" * |
张帆;: "电商评论中细粒度主题情感混合模型建构" * |
胡新明;夏火松;: "在线评论中用户商品属性偏好识别方法研究" * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347254A (zh) * | 2020-11-05 | 2021-02-09 | 中国平安人寿保险股份有限公司 | 新闻文本的分类方法、装置、计算机设备和存储介质 |
CN112347254B (zh) * | 2020-11-05 | 2024-02-13 | 中国平安人寿保险股份有限公司 | 新闻文本的分类方法、装置、计算机设备和存储介质 |
CN112991017A (zh) * | 2021-03-26 | 2021-06-18 | 刘秀萍 | 基于用户评论解析的标签体系精准推荐方法 |
CN113177170A (zh) * | 2021-04-12 | 2021-07-27 | 维沃移动通信有限公司 | 评论展示方法、装置及电子设备 |
CN113538106A (zh) * | 2021-07-26 | 2021-10-22 | 王彬 | 基于评论整合挖掘的商品精细化推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111460819B (zh) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959603B (zh) | 基于深度神经网络的个性化推荐系统及方法 | |
Riaz et al. | Opinion mining on large scale data using sentiment analysis and k-means clustering | |
CN107577759B (zh) | 用户评论自动推荐方法 | |
CN111460819B (zh) | 基于细粒度情感分析的个性化评论文本推荐系统及推荐方法 | |
JP4622589B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
CN112991017A (zh) | 基于用户评论解析的标签体系精准推荐方法 | |
CN112348629A (zh) | 一种商品信息推送方法和装置 | |
WO2015160415A2 (en) | Systems and methods for visual sentiment analysis | |
JP5318034B2 (ja) | 情報提供装置、情報提供方法、及び情報提供プログラム | |
CN110060132B (zh) | 基于细粒度数据的可解释商品推荐方法 | |
CN110706028A (zh) | 基于属性特征的商品评价情感分析系统 | |
CN111966888A (zh) | 融合外部数据的基于方面类别的可解释性推荐方法及系统 | |
CN110110220B (zh) | 融合社交网络和用户评价的推荐模型 | |
Flory et al. | A new web personalization decision-support artifact for utility-sensitive customer review analysis | |
Khatun et al. | A Machine Learning Approach for Sentiment Analysis of Book Reviews in Bangla Language | |
KR101074820B1 (ko) | 인터넷을 활용한 추천 검색 시스템 및 그 방법 | |
CN111815410B (zh) | 基于选择性邻域信息的商品推荐方法 | |
CN110851694A (zh) | 基于用户记忆网络和树形结构的深度模型的个性化推荐系统 | |
Ren et al. | Resource recommendation algorithm based on text semantics and sentiment analysis | |
CN109885748A (zh) | 基于语意特征的优化推荐方法 | |
CN113538106A (zh) | 基于评论整合挖掘的商品精细化推荐方法 | |
CN113869803A (zh) | 企业敏感信息风险评估方法、系统和存储介质 | |
Ghanwat et al. | Improved personalized recommendation system with better user experience | |
Bhanushali et al. | Movie Recommendation System | |
Truong et al. | Product recommendation system using opinion mining on Vietnamese reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |