CN110060132B - 基于细粒度数据的可解释商品推荐方法 - Google Patents

基于细粒度数据的可解释商品推荐方法 Download PDF

Info

Publication number
CN110060132B
CN110060132B CN201910333300.4A CN201910333300A CN110060132B CN 110060132 B CN110060132 B CN 110060132B CN 201910333300 A CN201910333300 A CN 201910333300A CN 110060132 B CN110060132 B CN 110060132B
Authority
CN
China
Prior art keywords
commodity
recommendation
user
chain
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910333300.4A
Other languages
English (en)
Other versions
CN110060132A (zh
Inventor
王英
马涪元
王鑫
孙玉东
陈文祺
肖旻昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201910333300.4A priority Critical patent/CN110060132B/zh
Publication of CN110060132A publication Critical patent/CN110060132A/zh
Application granted granted Critical
Publication of CN110060132B publication Critical patent/CN110060132B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于细粒度数据的可解释商品推荐方法,旨在克服现有技术存在的对商品评论内容利用不足、可解释性较弱以及没有充分利用用户在评论中展现出的情感倾向对产生推荐商品的作用等问题,该方法的步骤为:1.由数据处理模块获取用户对商品评论的细粒度数据;2.由推荐链建立模块根据细粒度数据对目标用户生成对待推荐商品的推荐链;3.由推荐生成模块根据推荐链实现对推荐序列的解释。

Description

基于细粒度数据的可解释商品推荐方法
技术领域
本发明涉及一种商品推荐领域的可解释推荐方法,更确切地说,本发明涉及一种基于细粒度数据的可解释商品推荐方法。
背景技术
推荐系统作为一中信息过滤的方法已经被广泛使用,其为用户提供更人性化服务的同时也为商家带来了可观的经济效益。推荐系统的可解释性定义为解释推荐系统的工作原理,使得系统具有透明性,能够让用户了解系统何时出错(可测性)、帮助用户做出快速优质的决策(有效性)、影响或说服用户选择产品(说服性)以及提高用户对推荐产品的接受度(满意性)。
目前,实现可解释性推荐主要有四种类型方法:一种基于主题的可解释推荐,通过分析并结合文本的内容主题获取推荐结果和解释;一种基于图的可解释推荐,根据用户与用户,用户与商品,商品与商品之间的链接关系构建图结构对用户和产品进行更加直观的建模表示;一种基于矩阵分解的可解释推荐,通过将矩阵分解的子矩阵与用户和商品的特征矩阵进行拟合获取推荐的解释;一种基于深度学习的可解释推荐,结合CNN,RNN和注意力机制等根据网络结构寻找对推荐结果产生较大影响力的输入进而产生解释。
虽然,针对可解释性推荐已有一定的研究工作,但仍有许多方面值得探索,主要体现在:
1.对数据利用不充分,没有完全挖掘并利用用户在商品评论中体现出的多种信息
用户对商品的评论中会体现出用户在意的商品方面,对方面使用的动词以及描述词则表达出对方面的情感倾向,多数算法在考虑推荐时没有利用这方面的内容。
2.在产生解释时缺少对用户对商品的情感因素的关注
用户对商品方面的情感,其喜欢或不满的具体内容是产生个性化推荐的重要依据,但目前对这方面内容进行利用的算法比较有限。
发明内容
本发明所要解决的技术问题是利用现有技术缺乏关注的细粒度用户数据、用户对商品发明的情感倾向等内容,提出一种基于细粒度数据的可解释商品推荐方法。
为达到上述目标,本发明是采用如下技术方案实现的:
1.所述的基于细粒度数据的可解释商品推荐方法,包括如下步骤:
(1)由数据处理模块获取用户对商品评论的细粒度数据:
1)对用户的评论文本进行预处理,去除文本中的无关表达,纠正不规范的单词拼写以及将缩写还原;
2)利用Stanford的句法分析工具对评论文本进行句法分析产生句法分析树;
3)通过句法分析树对评论文本的句子进行统一规范化表示;
4)从统一规范化表示的句子中提取关键信息建立细粒度数据;
5)通过1)2)3)4)步的结果将数据集表示为:
ReviewData={{(aspect,feature,sentiment),...}ij}
其中,aspect表示评论中提及的商品方面,feature表示对方面的描述词,sentiment表示用户通过该描述词对商品方面表达的情感倾向。{(aspect,feature,sentiment),...}ij用户i对商品j评论中出现的一个或多个(商品方面,方面描述词,情感倾向)三元组集合。
6)根据5)的结果建立用户和商品表示:
Ui={itemj:{(aspect,feature,sentiment),...}ij|itemj∈items_i}
其中,Ui表示用户i,itemj表示用户i评价过的商品j,items_i表示用户评价过的商品集合,{(aspect,feature,sentiment),...}ij表示用户i对商品j的评论中提取的一个或多个(商品方面,方面描述词,情感倾向)三元组集合。即,用户i由其评价过的商品内容按商品进行组织
Ij={aspect:{(feature,sentiment,frequency),...},...|aspect,feature,sentiment∈{(aspect,feature,sentiment),...}ij}
其中,Ij是商品j在商品数据集I中的表示,{(aspect,feature,sentiment),...}ij是所有评价过商品j的用户i对商品j的评论三元组内容,frequency是该方面描述词在对应方面中出现的频率。即,商品j由所有对其进行评价的用户的评论内容组成。
(2)由推荐链建立模块根据细粒度数据对目标用户生成对待推荐商品的推荐链:
1)根据目标用户的评价商品对待推荐商品构建推荐链;
2)对构建完成的推荐链进行排序产生推荐序列。
(3)由推荐生成模块根据推荐链实现对推荐序列的解释。
技术方案中所述的通过句法分析树对评论文本的句子进行统一规范化表示,步骤如下:
1)确定统一规范化表达格式:{[形容词,主语(名词/代词)],[[副词,谓语(动词)],形容词],[形容词,宾语(名词/代词)]};
2)递归下降处理句法分析树,将在树中遇到的不同成分进行对应的处理,句子(S)的主要构成成分为名词词组(NP)和动词词组(VP),在句子(S)结构中遇到名词词组时,根据其内部主要构成:名词(NN)、形容词(JJ)、代词(PRP),将名词和代词放入主语位置,内部若有形容词则放在主语前的形容词位置;在句子中遇到动词词组时,根据其内部的主要构成:动词(VB)、名词词组(NP)、副词短语(ADVP)和形容词短语(ADJP),将动词放入统一规范化表达中的谓语部分,若有副词短语或形容词短语则将其内部包含的副词或形容词放在对应的副词形容词部分,在动词词组中遇到名词词组则依然按照其主要构成获取名词/代词和形容词成分,不过在动词词组中出现时作为宾语需要将名词/代词放在宾语位置,形容词放在宾语前的形容词位置,经过以上处理,将每一个句子都进行统一规范化表示。
技术方案中所述的从统一规范化表示的句子中提取关键信息建立细粒度数据,步骤如下:
1)从统一规范化表示中获取动词;
2)从统一规范化表示中分别将主语和宾语与其前面的形容词进行组合,形成(形容词,名词)组合,若主语或宾语部分为空则使用商品类别写入组合名词部分,若形容词为空则不进行保留;
3)从统一规范化表示中获取动词前后的副词与形容词部分,若不为空则将主语宾语取出与形容词和副词建立(形容词,名词)组合;
4)将1)中的动词与2)3)中的所有(形容词,名词)组合进行拼接形成(动词,形容词,名词)组合;
5)根据情感词典将4)中(动词,形容词,名词)组合内的动词和形容词进行情感分析,得到该组合的情感倾向,将名词,形容词,情感倾向保留为(aspect,feature,sentiment)三元组。
技术方案中所述的根据目标用户的评价商品对待推荐商品构建推荐链,步骤如下:
1)选择目标用户Ui和待推荐商品Ij
2)依次根据组成Ui的商品计算待推荐商品Ij的预测满意度,用户Ui对待推荐商品Ij的预测满意度(predict_satisfaction)计算方式如下:
Figure BDA0002038337240000051
其中,itemi表示用户评价过的商品,itemj表示待推荐商品,ai为itemi的方面,aj为itemj的方面,fm为描述ai的方面描述词,fn为描述aj的方面描述词,
Figure BDA0002038337240000052
为商品方面描述词fn在方面aj的描述词中的频率占比,
Figure BDA0002038337240000053
为用户方面描述词fm在方面ai的描述词中的出现频率,sim(ai,aj)表示方面ai和aj间的相似度,sim(fm,fn)表示方面描述词fm和fn间的相似度,sentidifi(f1,f2)的计算方式如下:
Figure BDA0002038337240000054
其中,senti(f1)表示用户在方面描述词f1上的情感倾向;
3)选择组成Ui的商品中令待推荐商品的预测满意度最高的商品itemk,选择itemk在商品数据I中的表示Ik,若通过其计算的预测满意度大于阈值,则将其加入推荐链,并称其为前驱商品,否则,推荐链建立完成;
4)依次根据组成Ui的且不在推荐链中的商品计算前驱商品Ik的预测满意度,选择其中令前驱商品的预测满意度最高的商品itemm,选择itemm在商品数据I中的表示Im,若通过其计算的预测满意度大于阈值,则将其加入推荐链,并将其作为新的前驱商品,重复4),否则,推荐链建立完成。
技术方案中所述的对构建完成的推荐链进行排序产生推荐序列,步骤如下:
1)根据以下公式依次对由所有待推荐商品建立的多个推荐链的得分进行计算:
Figure BDA0002038337240000061
其中,i是待推荐商品,C是通过带推荐商品建立的推荐链;
2)根据1)计算的得分对目标用户i的所有推荐链进行排序,选择得分最高的加入推荐序列;
3)根据以下公式对未加入推荐序列的商品进行得分计算:
Figure BDA0002038337240000062
其中,C*是推荐序列中的推荐链
4)选择得分最高的链加入推荐序列,重复3)直至推荐序列中有满足要求数量的推荐链。
技术方案中所述的由推荐生成模块根据推荐链实现对推荐序列的解释,步骤如下:
对一个推荐链,选择生成该推荐链待推荐商品Ij,根据推荐链中每一个商品计算用户对Ij的预测满意度,在计算过程中,选择令
Figure BDA0002038337240000063
大于设定的阈值的fn和对应的aj作为推荐的可解释性依据。
与现有技术相比本发明的有益效果是:
1.本发明所述的一种基于细粒度数据的可解释商品推荐方法给出了对评论文本进行统一规范化表示并抽取关键信息的方法。对评论文本生成的句法树,分析其结构规律,根据尽可能多地保留形成细粒度数据的关键信息——方面,方面描述词和情感倾向的内容的原则,将所有对关键信息具有表示潜力的内容进行保留将句子用一种统一规范化结构表示,并从该统一规范化结构中将细粒度三元组进行提取。相较于传统方法从词性和词间距等因素出发去获取细粒度数据,本方法对评论文本信息的保留更加准确、完整和丰富。
2.本发明所述的一种基于细粒度数据的可解释商品推荐方法充分利用了用户评论中提取的细粒度数据,通过用户在以往评价商品中体现的对商品方面的喜好实现对待推荐商品满意程度的预测,提高了推荐解释的说服力和可理解性。传统推荐算法缺乏对细粒度特征的使用,普遍使用用户对商品的评分信息进行预测,利用用户或商品间相似性等隐性特征进行推荐或解释。而本发明提出的基于细粒度数据的可解释商品推荐方法则立足于用户在具体商品中展现出的对商品方面的喜好对用户进行精准和可解释的推荐。
综上所述,本发明是根据用户在评论中展现出的对商品方面的细粒度情感对用户实现个性化的可解释推荐,以细粒度数据的解释性为基础设计推荐算法进行对目标用户的推荐从而完成对用户的推荐和推荐解释。
附图说明
图1是实施本发明所述的基于细粒度数据的可解释商品推荐方法的计算机程序的各组成模块的功能、连接关系示意图。
图2是本发明所述的基于细粒度数据的可解释商品推荐方法的流程框图。
图3是本发明所述的基于细粒度数据的可解释商品推荐方法中由数据处理模块实现处理用户评论数据并提取关键信息获得细粒度数据的流程框图。
图4是本发明所述的基于细粒度数据的可解释商品推荐方法中由推荐链建立模块实现根据用户和商品表示构建推荐连的流程框图。
图5是本发明所述的基于细粒度数据的可解释商品推荐方法中由推荐生成模块实现向用户生成推荐和推荐解释的流程框图。
具体实施方式
下面结合附图对本发明做详细的阐述:
本发明所述的基于细粒度数据的可解释商品推荐方法所要解决的问题是从目前技术缺乏关注的细粒度数据入手,提出将评论文本通过句法分析树进行统一规范化表示并从中抽取关键信息获取细粒度数据的方法,提出根据细粒度数据中商品的方面以及用户的情感倾向对用户进行个性化推荐与解释的方法,提高了推荐的准确率和推荐结果的可解释性。
参阅图1,为实现基于细粒度数据的可解释商品推荐方法这一目的自行编制了计算机程序,其包括有三个功能模块,即包括由数据处理模块、推荐链建立模块、推荐生成模块,各个模块功能如下:
1.数据处理模块
所述的数据处理模块包含对用户的评论文本进行预处理、句法分析产生句法分析树、通过句法分析树对评论文本的句子进行统一规范化表示、从统一规范化表示的句子中提取关键信息建立细粒度数据、通过细粒度数据构建用户和商品表示五个过程。细粒度数据包含用户在评论中提及的商品方面,对方面的描述词以及通过描述词体现的情感倾向,首先对文本进行处理获得句法树,通过对语法树的分析对文本进行统一结构化表达,再从统一结构化表达中提取细粒度数据,最后组织为适当的形式对用户和商品进行表示。
(1)用户的评论文本的预处理:
自然语言的表达十分灵活,用户在评论中会使用一些如全部大写,多加标点等方式对自己进行表达,有时也会出现用词的拼写错误,所以对评论的数据集,首先进行预处理去除文本中的无关表达,纠正不规范的单词拼写以及将缩写还原,以方便接下来的处理。
(2)生成句法分析树
利用Stanford的句法分析工具对评论文本进行句法分析产生句法分析树。
(3)通过句法分析树对评论文本的句子进行统一规范化表示
句法分析树是对句子进行分析后的结果表示,包含组成句子的各个结构和结构的成分名称,通过对这些结构规律进行分析,结合提取关键信息的目标,将句子结构中对关键信息具有表达潜能的因素进行保留并形成一个统一规范的结构。
(4)从统一规范化表示的句子中提取关键信息建立细粒度数据
统一规范化结构已经很好地将句子中的关键信息进行格式化的存储,在此基础上将其中对应的关键信息进行抽取整合即可得到需要的细粒度数据。
(5)根据细粒度数据对用户和商品进行表示
用细粒度数据对用户和商品进行表示是后续操作的基础,基于算法需要,将用户用其评价过的商品进行组织,其评价过的每一个商品由用户在对商品评论中提及的一个或多个(方面,方面描述词,情感倾向)三元组表示,这样表示出用户对以往商品中具体方面的喜好可以方便地根据任一商品对新商品的喜好程度进行预测;商品则利用所有评价过它的用户在评论中提及的所有(方面,方面描述词,情感倾向)三元组集合表示,通过将大众对该商品的具体评价整合,能较客观地在一个方面和描述词上就体现出该商品的具体的口碑。
2.推荐链生成模块
所述的推荐链生成模块是在数据处理模块的基础上进行的,负责根据用户和商品的表示,通过细粒度数据集中商品方面和描述词的相似度结合用户情感倾向对用户的待推荐商品构建推荐链。
(1)根据用户和商品在细粒度数据下的表示对目标用户的待推荐商品建立推荐链,利用组成用户的商品计算待推荐商品的预测满意度,选择令预测满意度最高的商品,则该商品相对于其他商品对待预测商品有较强的契合度,为了扩充建立的推荐链的多样性和覆盖面,避免总使用同一个商品选择加入链中的商品,将该商品作为前驱商品对剩下的组成用户的商品利用预测满意度进行选择,新选择的商品又作为新的前驱商品,如此可以尽可能使得链中商品保持着足够相关性的同时又不会局限在待推荐商品表现出的方面上,使得链更具多样性。
(2)对建立完成的推荐链,根据链中所有商品计算的对待推荐商品的预测满意度的平均值作为标准对推荐链进行排序,如此选择可令推荐出的商品最符合用户的喜好,同时计算时考虑了已选择的推荐链中商品的影响,并对推荐链中含有已推荐链中商品的项做了惩罚使得推荐结果更多样,交叉更小,最后根据降序排列的推荐链生成推荐序列。
3.推荐生成模块
所述的推荐生成模块负责根据在推荐链建立模块中生成的推荐链序列项用户进行推荐和推荐解释,根据推荐链的排名依次向用户推荐生成推荐链的待推荐商品,并根据推荐链中的用户评价商品,利用本发明中计算预测满意度的方法选择最能令用户满意的方面和方面描述词作为推荐解释,提高推荐效果的同时实现推荐的可解释性。
参阅图2,本发明所述的基于细粒度数据的可解释商品推荐方法的步骤如下:
(1)参阅图3,由数据处理模块实现处理用户评论数据并提取关键信息获得细粒度数据,步骤如下:
1)对用户的评论文本进行预处理,去除文本中的无关表达,纠正不规范的单词拼写以及将缩写还原;
2)利用Stanford的句法分析工具对评论文本进行句法分析产生句法分析树;
3)通过句法分析树对评论文本的句子进行统一规范化表示:
①递归下降处理句法分析树,对句子(S)结构中的名词词组,根据其内部主要构成:名词(NN)、形容词(JJ)、代词(PRP),将名词和代词放入主语位置,内部若有形容词则放在主语前的形容词位置;
②对句子中的动词词组,根据其内部的主要构成:动词(VB)、名词词组(NP)、副词短语(ADVP)和形容词短语(ADJP),将动词放入统一规范化表达中的谓语部分,若有副词短语或形容词短语则将其内部包含的副词或形容词放在对应的副词形容词部分,在动词词组中遇到名词词组则依然按照其主要构成获取名词/代词和形容词成分,不过在动词词组中出现时作为宾语需要将名词/代词放在宾语位置,形容词放在宾语前的形容词位置;
③将主语部分与谓语宾语结合形成统一规范化结构表示;
4)从统一规范化表示的句子中提取关键信息建立细粒度数据:
①获取谓语部分的动词;
②分别将主语和宾语与其前面的形容词进行组合,形成(形容词,名词)组合,若主语或宾语部分为空则使用商品类别写入组合名词部分,若形容词为空则不进行保留;
③获取谓语中动词前后的副词与形容词部分,若不为空则将主语宾语取出与形容词和副词建立(形容词,名词)组合;
④将的动词与所有(形容词,名词)组合进行拼接形成(动词,形容词,名词)组合,并根据动词和形容词在词典中的情感极性获取用户的情感倾向,用(形容词,名词,情感倾向)建立(方面,方面描述词,情感倾向)三元组。
5)利用细粒度数据建立用户和商品表示:
Ui={itemj:{(aspect,feature,sentiment),...}ij|itemj∈items_i}
其中,Ui表示用户i,itemj表示用户i评价过的商品j,items_i表示用户评价过的商品集合,{(aspect,feature,sentiment),...}ij表示用户i对商品j的评论中提取的一个或多个(商品方面,方面描述词,情感倾向)三元组集合。
Ij={aspect:{(feature,sentiment,frequency),...},...|aspect,feature,sentiment∈{(aspect,feature,sentiment),...}ij}
其中,Ij是商品j在商品数据集I中的表示,{(aspect,feature,sentiment),...}ij是所有评价过商品j的用户i对商品j的评论三元组内容,frequency是该方面描述词在对应方面中出现的频率。
句法分析是分析句子结构的重要工具,在本发明中对数据处理的效果有着直接的影响,本发明采用Stand Ford大学提供的自然语言工具,该工具具有分词,词性标注,句法分析等功能,在自然语言处理领域得到广泛的应用。
(2)参阅图4,在实现了数据处理,根据步骤(1)中获得的用户商品的细粒度表示,对目标用户的待推荐商品构建推荐链,由所述的推荐链建立模块实现对目标用户的待推荐商品构建推荐链的步骤如下:
1)对确定的目标用户,将其所有未接触过的商品作为待推荐商品,逐个对其建立推荐链:
①根据组成目标用户的商品依次计算待推荐商品的预测满意度,其计算公式如下:
Figure BDA0002038337240000121
其中,itemi表示用户评价过的商品,itemj表示待推荐商品,ai为itemi的方面,aj为itemj的方面,fm为描述ai的方面描述词,fn为描述aj的方面描述词,
Figure BDA0002038337240000122
为商品方面描述词fn在方面aj的描述词中的频率占比,
Figure BDA0002038337240000123
为用户方面描述词fm在方面ai的描述词中的出现频率,sim(ai,aj)表示方面ai和aj间的相似度,sim(fm,fn)表示方面描述词fm和fn间的相似度,sentidifi(f1,f2)的计算方式如下:
Figure BDA0002038337240000131
其中,senti(f1)表示用户在方面描述词f1上的情感倾向;
②选择令待推荐商品的预测满意度最高的商品,判断其算出的预测满意度是否大于设定的阈值,若大于阈值则进行步骤③,否则推荐链建立完成;
③将步骤②或步骤④中选择的商品加入推荐链,并从商品表示中选择其对应的内容作为前驱商品,根据组成用户且不在链中的商品计算前驱商品的预测满意度;
④选择令前驱商品的预测满意度最高的商品,判断其算出的预测满意度是否大于设定的阈值,若大于阈值则进行步骤③,否则推荐链建立完成;
2)对目标用户的所有推荐链进行排序选择:
①根据以下公式计算每个推荐链的得分:
Figure BDA0002038337240000132
其中,i是待推荐商品,C是通过带推荐商品建立的推荐链;
②根据步骤①中计算的得分选择得分最高的链加入推荐序列
③根据以下公式再次计算未加入推荐序列的各个推荐链得分:
Figure BDA0002038337240000133
其中,C*是推荐序列中的推荐链
④根据③的计算结果选择得分最高的推荐链加入推荐序列,重复③直到推荐序列中有满足要求的推荐链数目
(3)参阅图5,根据步骤(2)即推荐链建立模块中生成的推荐序列,通过计算预测满意度的方法从推荐序列中推荐链对应的待推荐商品在商品表示中的(方面,方面描述词,情感倾向)三元组选择有说服力的(方面,方面描述词)组合作为推荐解释的步骤如下:
1)将推荐序列中推荐链对应的待推荐项目推送给用户;
2)依次根据推荐链中的各个商品在用户表示下的(方面,方面描述词,情感倾向)组成对待推荐商品计算预测满意度,将计算中的
Figure BDA0002038337240000141
的值作为对方面描述和对应方面的选择标准,若该值与其对应方面的相似度的乘积大于阈值则将待推荐商品的该方面描述词fm和对应的方面作为推荐解释。

Claims (1)

1.一种基于细粒度数据的可解释商品推荐方法,其特征在于:
(1)所述的基于细粒度数据的可解释商品推荐方法,包括如下步骤:
1)由数据处理模块获取用户对商品评论的细粒度数据:
①对用户的评论文本进行预处理,去除文本中的无关表达,纠正不规范的单词拼写以及将缩写还原;
②利用Stanford的句法分析工具对评论文本进行句法分析产生句法分析树;
③通过句法分析树对评论文本的句子进行统一规范化表示;
④从统一规范化表示的句子中提取关键信息建立细粒度数据;
⑤基于步骤①②③④的结果,将数据集表示为:
ReviewData={{(aspect,feature,sentiment),...}ij}
其中,aspect表示评论中提及的商品方面,feature表示对方面的描述词,sentiment表示用户通过该描述词对商品方面表达的情感倾向;{(aspect,feature,sentiment),...}ij用户i对商品j评论中出现的一个或多个(商品方面,方面描述词,情感倾向)三元组集合;
⑥根据⑤的结果建立用户和商品表示:
Ui={iteml:{(aspect,feature,sentiment),...}il|iteml∈items_i}
其中,Ui表示用户i,iteml表示用户i评价过的商品l,items_i表示用户评价过的商品集合,{(aspect,feature,sentiment),...}il表示用户i对商品l的评论中提取的一个或多个(商品方面,方面描述词,情感倾向)三元组集合;即,用户i由其评价过的商品内容按商品进行组织
Ij={aspect:{(feature,sentiment,frequency),...},...|aspect,feature,sentiment∈{(aspect,feature,sentiment),...}ij}
其中,Ij是商品j在商品数据集I中的表示,{(aspect,feature,sentiment),...}ij是所有评价过商品j的用户i对商品j的评论三元组内容,frequency是该方面描述词在对应方面中出现的频率;即,商品j由所有对其进行评价的用户的评论内容组成;
2)由推荐链建立模块根据细粒度数据对目标用户生成对待推荐商品的推荐链:
①根据目标用户的评价商品对待推荐商品构建推荐链;
②对构建完成的推荐链进行排序产生推荐序列;
3)由推荐生成模块根据推荐链实现对推荐序列的解释;
(2)所述的从统一规范化表示的句子中提取关键信息建立细粒度数据包括如下步骤:
1)从统一规范化表示中获取动词;
2)从统一规范化表示中分别将主语和宾语与其前面的形容词进行组合,形成(形容词,名词)组合,若主语或宾语部分为空则使用商品类别写入组合名词部分,若形容词为空则不进行保留;
3)从统一规范化表示中获取动词前后的副词与形容词部分,若不为空则将主语宾语取出与形容词和副词建立(形容词,名词)组合;
4)将1)中的动词与2)3)中的所有(形容词,名词)组合进行拼接形成(动词,形容词,名词)组合;
5)根据情感词典将4)中(动词,形容词,名词)组合内的动词和形容词进行情感分析,得到该组合的情感倾向,将名词,形容词,情感倾向保留为(aspect,feature,sentiment)三元组;
(3)所述的根据目标用户的评价商品对待推荐商品构建推荐链包括如下步骤:
1)选择目标用户Ui和待推荐商品Ij
2)依次根据组成Ui的商品计算待推荐商品Ij的预测满意度,用户Ui对待推荐商品Ij的预测满意度(predict_satisfaction)计算方式如下:
Figure FDA0003204137410000031
其中,itemi表示用户评价过的商品,itemj表示待推荐商品,ai为itemi的方面,aj为itemj的方面,fm为描述ai的方面描述词,fn为描述aj的方面描述词,wfn为商品方面描述词fn在方面aj的描述词中的频率占比,ffm为用户方面描述词fm在方面ai的描述词中的出现频率,sim(ai,aj)表示方面ai和aj间的相似度,sim(fm,fn)表示方面描述词fm和fn间的相似度,sentidifi(f1,f2)的计算方式如下:
Figure FDA0003204137410000032
其中,senti(f1)表示用户在来自用户评价过的商品的方面描述词f1上的情感倾向,senti(f2)表示商品在来自待推荐商品的方面描述词f2上的情感倾向;
3)选择组成Ui的商品中令待推荐商品的预测满意度最高的商品itemk,选择itemk在商品数据I中的表示Ik,若通过其计算的预测满意度大于阈值,则将其加入推荐链,并称其为前驱商品,否则,推荐链建立完成;
4)依次根据组成Ui的且不在推荐链中的商品计算前驱商品Ik的预测满意度,选择其中令前驱商品的预测满意度最高的商品itemm,选择itemm在商品数据I中的表示Im,若通过其计算的预测满意度大于阈值,则将其加入推荐链,并将其作为新的前驱商品,重复4),否则,推荐链建立完成;
(4)所述的对构建完成的推荐链进行排序产生推荐序列包括如下步骤:
1)根据以下公式依次对由所有待推荐商品建立的多个推荐链的得分进行计算:
Figure FDA0003204137410000041
其中,i是待推荐商品,C是通过带推荐商品建立的推荐链;
2)根据1)计算的得分对目标用户i的所有推荐链进行排序,选择得分最高的加入推荐序列;
3)根据以下公式对未加入推荐序列的商品进行得分计算:
Figure FDA0003204137410000042
其中,C*是推荐序列中的推荐链
4)选择得分最高的链加入推荐序列,重复3)直至推荐序列中有满足要求数量的推荐链;
(4)所述的对构建完成的推荐链进行排序产生推荐序列包括如下步骤:
1)依次根据推荐链中的各个商品在用户表示下的(方面,方面描述词,情感倾向)组成对待推荐商品计算预测满意度,将计算中的(sim(fm,fn)*sentidifi(fm,fn)*wfn*ffm)的值作为对方面描述和对应方面的选择标准,若该值与其对应方面的相似度的乘积大于阈值则将待推荐商品的该方面描述词fm和对应的方面作为推荐解释。
CN201910333300.4A 2019-04-24 2019-04-24 基于细粒度数据的可解释商品推荐方法 Expired - Fee Related CN110060132B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910333300.4A CN110060132B (zh) 2019-04-24 2019-04-24 基于细粒度数据的可解释商品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910333300.4A CN110060132B (zh) 2019-04-24 2019-04-24 基于细粒度数据的可解释商品推荐方法

Publications (2)

Publication Number Publication Date
CN110060132A CN110060132A (zh) 2019-07-26
CN110060132B true CN110060132B (zh) 2021-09-24

Family

ID=67320513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910333300.4A Expired - Fee Related CN110060132B (zh) 2019-04-24 2019-04-24 基于细粒度数据的可解释商品推荐方法

Country Status (1)

Country Link
CN (1) CN110060132B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111260437B (zh) * 2020-01-14 2023-07-11 北京邮电大学 一种基于商品方面级情感挖掘和模糊决策的产品推荐方法
CN113158045B (zh) * 2021-04-20 2022-11-01 中国科学院深圳先进技术研究院 一种基于图神经网络推理的可解释推荐方法
CN113127604B (zh) * 2021-05-10 2022-10-04 齐鲁工业大学 基于评论文本的细粒度物品推荐方法及系统
CN113297391B (zh) * 2021-05-28 2022-06-03 湖南大学 个性化推荐解释文本的生成方法、装置、系统及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901230A (zh) * 2009-05-31 2010-12-01 国际商业机器公司 信息检索方法和用户评论处理方法及其系统
CN107038609A (zh) * 2017-04-24 2017-08-11 广州华企联信息科技有限公司 一种基于深度学习的商品推荐方法及系统
CN107944911A (zh) * 2017-11-18 2018-04-20 电子科技大学 一种基于文本分析的推荐系统的推荐方法
CN108491377A (zh) * 2018-03-06 2018-09-04 中国计量大学 一种基于多维度信息融合的电商产品综合评分方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130218914A1 (en) * 2012-02-20 2013-08-22 Xerox Corporation System and method for providing recommendations based on information extracted from reviewers' comments

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901230A (zh) * 2009-05-31 2010-12-01 国际商业机器公司 信息检索方法和用户评论处理方法及其系统
CN107038609A (zh) * 2017-04-24 2017-08-11 广州华企联信息科技有限公司 一种基于深度学习的商品推荐方法及系统
CN107944911A (zh) * 2017-11-18 2018-04-20 电子科技大学 一种基于文本分析的推荐系统的推荐方法
CN108491377A (zh) * 2018-03-06 2018-09-04 中国计量大学 一种基于多维度信息融合的电商产品综合评分方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An Improved Computational Linguistic Approach for Fine一Grained Sentiment Analysis of Textual Reviews;Seelam Lavanya*, Dr. K. A. Abdul Nazeert;《20181nternational Conference on Computing, Power and Communication Technologies (GUCON)》;20180929;全文 *
基于微博的细粒度情感分析;敦欣卉、张云秋、杨恺西;《数据分析与知识发现》;20170731;全文 *

Also Published As

Publication number Publication date
CN110060132A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
CN110060132B (zh) 基于细粒度数据的可解释商品推荐方法
CN108363790B (zh) 用于对评论进行评估的方法、装置、设备和存储介质
KR102020756B1 (ko) 머신러닝을 이용한 리뷰 분석 방법
CN111680159B (zh) 数据处理方法、装置及电子设备
CN104794154B (zh) 基于文本挖掘的医疗器械o2o服务质量评价模型
Sadhasivam et al. Sentiment analysis of Amazon products using ensemble machine learning algorithm
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
CN114255096A (zh) 数据需求匹配方法和装置、电子设备、存储介质
Phan et al. A method for detecting and analyzing the sentiment of tweets containing fuzzy sentiment phrases
CN111966888A (zh) 融合外部数据的基于方面类别的可解释性推荐方法及系统
Samah et al. The best malaysian airline companies visualization through bilingual twitter sentiment analysis: a machine learning classification
CN111563361A (zh) 文本标签的提取方法及装置、存储介质
Gurin Methods for Automatic Sentiment Detection
CN117235253A (zh) 一种基于自然语言处理技术的卡车用户隐性需求挖掘方法
CN114741471A (zh) 一种基于文本挖掘与多视角融合的个性化混合推荐方法
Palliyali et al. Comparative Study of Extractive Text Summarization Techniques
Nugraha et al. Chatbot-Based Movie Recommender System Using POS Tagging
Dziczkowski et al. RRSS-rating reviews support system purpose built for movies recommendation
CN109298796B (zh) 一种词联想方法及装置
Ferilli et al. Sentiment analysis as a text categorization task: a study on feature and algorithm selection for Italian language
Siddiqui Sarcasm detection from Twitter database using text mining algorithms
Ali et al. Online reviews & ratings inter-contradiction based product’s quality-prediction through hybrid neural network
Sahu et al. An Emotion based Sentiment Analysis on Twitter Dataset
Wambsganss et al. Using Deep Learning for Extracting User-Generated Knowledge from Web Communities.
Kovaliuk et al. Method of Cross-Language Aspect-Oriented Analysis of Statements Using Categorization Model of Machine Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Wang Ying

Inventor after: Ma Fuyuan

Inventor after: Wang Xin

Inventor after: Sun Yudong

Inventor after: Chen Wenqi

Inventor after: Xiao minhao

Inventor before: Ma Fuyuan

Inventor before: Wang Ying

Inventor before: Wang Xin

Inventor before: Sun Yudong

Inventor before: Chen Wenqi

Inventor before: Xiao minhao

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210924

CF01 Termination of patent right due to non-payment of annual fee