CN106384245B - 产品特征分析方法和系统 - Google Patents

产品特征分析方法和系统 Download PDF

Info

Publication number
CN106384245B
CN106384245B CN201610805032.8A CN201610805032A CN106384245B CN 106384245 B CN106384245 B CN 106384245B CN 201610805032 A CN201610805032 A CN 201610805032A CN 106384245 B CN106384245 B CN 106384245B
Authority
CN
China
Prior art keywords
product feature
product
feature
comment
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610805032.8A
Other languages
English (en)
Other versions
CN106384245A (zh
Inventor
张强
彭张林
王安宁
陆效农
倪鑫
杨善林
任明仑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201610805032.8A priority Critical patent/CN106384245B/zh
Publication of CN106384245A publication Critical patent/CN106384245A/zh
Application granted granted Critical
Publication of CN106384245B publication Critical patent/CN106384245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明一种产品特征分析方法和系统,该方法包括:通过词性分析从多个用户针对产品的评论中提取多个产品特征;对提取的产品特征进行识别,以确定积极情绪的产品特征和消极情绪的产品特征;针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度;并根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论;针对每一个产品特征,根据包含该产品特征的积极评论的个数确定该产品特征对应的满意程度;根据各个产品特征对应的满意程度生成对应的分析结果并输出。本发明能够对用户对一个产品特征的满意程度进行分析并输出,能够极大的提高对产品特征的挖掘和分析的效率。

Description

产品特征分析方法和系统
技术领域
本发明涉及人工智能技术领域,具体涉及一种产品特征分析方法和系统。
背景技术
随着web2.0技术的快速发展,越来越多的人开始使用微博、论坛等社交媒体分享自己的购物体验以及对产品的观点。研究表明,77%的客户在购买之前会浏览产品的社交评论信息,此外,相比个人推荐, 75%的客户更加相信在线社交评论。这些在线社交评论对人们的购买过程产生了深刻影响,成为了企业重要的信息资源,可以帮助企业分析客户的观点以及发现客户的偏好,实现对客户的反馈信息的整合,从而驱动新产品的创新设计策略。但是,由于社交评论数据量大,且评论内容具有随意性,从社交评论中挖掘客户核心关注的产品关键特征十分复杂。
发明内容
(一)解决的技术问题
本发明的一个目的在于提供一种可以自动的挖掘和分析产品特征的方案。
(二)技术方案
为达到上述目的,本发明的第一个方面提供了一种产品特征分析方法,包括:
通过词性分析从多个用户针对产品的评论中提取多个产品特征;
对提取的产品特征进行识别,以确定积极情绪的产品特征和消极情绪的产品特征;
针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度;并根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论;
针对每一个产品特征,根据包含该产品特征的积极评论的个数确定该产品特征对应的满意程度;
根据各个产品特征对应的满意程度生成对应的分析结果并输出。
在一些实施例中,所述通过词性分析从多个用户针对产品的评论中进行产品特征提取,包括:
通过词性标注方法对多个用户针对产品的评论进行词性分析,从其中提取产品特征。
在一些实施例中,所述针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度,包括:
根据该产品特征对应的修饰词以及预设的修饰词与情感强度的对应关系确定用户对该产品特征的情感强度;根据关于该产品特征的描述的内容的长度以及用户对该产品特征的情感强度确定用户对该产品特征的重视程度。
在一些实施例中,针对每一个用户的评论,根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论,包括:
在各个积极情绪的产品特征对应的重视程度的和大于各个消极情绪的产品特征对应的重视程度的和时,判定该评论为积极评论,否则,判定为消极评论。
在一些实施例中,所述根据各个产品特征对应的满意程度生成对应的分析结果并输出,包括:
将各个产品特征与其对应的满意程度通过可视化图表显示。
第二方面,本发明提供了一种产品特征分析系统,包括:
提取模块,用于通过词性分析从多个用户针对产品的评论中提取多个产品特征;
识别模块,用于对提取的产品特征进行识别,以确定积极情绪的产品特征和消极情绪的产品特征;
倾向判定模块,用于针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度;并根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论;
满意评价模块,用于针对每一个产品特征,根据包含该产品特征的积极评论的个数确定该产品特征对应的满意程度;
输出模块,用于根据各个产品特征对应的满意程度生成对应的分析结果并输出。
在一些实施例中,所述提取模块用于通过词性分析从多个用户针对产品的评论中进行产品特征提取,包括:
通过词性标注方法对多个用户针对产品的评论进行词性分析,从其中提取产品特征。
在一些实施例中,所述倾向判定模块用于针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度,包括:
根据该产品特征对应的修饰词以及预设的修饰词与情感强度的对应关系确定用户对该产品特征的情感强度;根据关于该产品特征的描述的内容的长度以及用户对该产品特征的情感强度确定用户对该产品特征的重视程度。
在一些实施例中,所述倾向判定模块针对用于每一个用户的评论,根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论,包括:
在各个积极情绪的产品特征对应的重视程度的和大于各个消极情绪的产品特征对应的重视程度的和时,判定该评论为积极评论,否则,判定为消极评论。
在一些实施例中,所述输出模块用于根据各个产品特征对应的满意程度生成对应的分析结果并输出,包括:
将各个产品特征与其对应的满意程度通过可视化图表显示。
(三)有益效果
本发明提供的产品特征分析方法和系统,能够对用户对一个产品特征的满意程度进行分析并输出,能够极大的提高对产品特征的挖掘和分析的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供产品特征分析方法的流程示意图;
图2为本发明一实施例提供的产品特征分析方法的流程示意图;
图3为利用本发明提供的产品特征分析方法输出的分析结果的一种示意图;
图4为本发明一实施例提供的产品特征分析系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一方面,本发明一实施例提供了一种产品特征分析方法,该方法可以通过调用就计算机设备执行,参见图1,该方法可以具体包括:
步骤S1,通过词性分析从多个用户针对产品的评论中提取多个产品特征。
步骤S2,对提取的产品特征进行识别,以确定积极情绪的产品特征和消极情绪的产品特征;
步骤S3,针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度;并根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论;
步骤S4,针对每一个产品特征,根据包含该产品特征的积极评论的个数确定该产品特征对应的满意程度;
步骤S5,根据各个产品特征对应的满意程度生成对应的分析结果并输出。
本发明实施例中,能够通过计算机设备对用户对一个产品特征的满意程度进行分析并输出,能够极大的提高对产品特征的挖掘和分析的效率。
在具体实施时,上述方法中,在步骤S1之前,还可以利用爬虫技术从社交或者购物网站中收集关于待分析的产品的评论,得到评论集。当然在具体实施时,步骤S1中的各个评论也可以由用户自动导入。
在一些实施例中,步骤S1可以按照如下方式实施:通过词性标注 (POS)方法对多个用户针对产品的评论进行词性分析,从其中提取产品特征。这样的方式较为简单,易于实现,当然在具体实施时,在另外一些实施例中,也可以通过其他方式实现。
在一些实施例中,在步骤S2中,可以利用预设的情绪词库确定产品特征与情绪的对应关系,以识别出积极情绪的产品特征和消极情绪的产品特征。这样的方式实现起来较为简单,当然在实际应用中,也可以通过其他的方式,比如利用其他的智能算法进行判断。
在一些实施例中,步骤S3中的,所述针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度,可以具体包括如下步骤:
根据该产品特征对应的修饰词以及预设的修饰词与情感强度的对应关系确定用户对该产品特征的情感强度;根据关于该产品特征的描述的内容的长度以及用户对该产品特征的情感强度确定用户对该产品特征的重视程度。
在具体实施时,步骤S3中的针对每一个用户的评论,根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论,可以具体包括:
在各个积极情绪的产品特征对应的重视程度的和大于各个消极情绪的产品特征对应的重视程度的和时,判定该评论为积极评论,否则,判定为消极评论。
在一些实施例中,步骤S5中的可以具体包括:
将各个产品特征与其对应的满意程度通过可视化图表显示。
这样能够使得用户比较直观的观察各个产品特征以及各个产品特征对应的满意度。
另外在具体实施时,还可以根据各个产品特征对应的满意度对各个产品特征进行分类,比如可以将满意度高于一个阈值的产品特征作为吸引性特征;将满意度低于另一个阈值的产品特征作为不满意性特征;将满意度在两个阈值之间的产品特征作为不一致性特征。并将分类的结果输出。
下面结合附图对本发明提供的另一种实施例进行更为详细的说明。本发明实施例提供的一种产品特征分析方法,可以应用于企业产品或服务开发创新设计过程。从社交媒体中爬取相关产品的评论数据,进行产品关键特征的分析。其过程如图2所示,具体步骤如下:
(1)通过POS词性分析进行产品特征提取。产品特征一般是一些名词或名词短语,通过关联规则分析,挖掘出频繁项集,从而得出产品特征的候选集。再构建一般通用名词集合,对产品特征的候选集进行筛选。
(2)确定产品特征的情感倾向以及重视程度。每条评论可能会涉及到多个产品特征,而其情感倾向并不一致。利用语句的语法结构,确定产品特征的观点词。若该观点词在积极情感词库中,则该特征fi为积极产品特征,值大小记为1;若该观点词在消极情感词库中,则该特征fi为消极产品特征,值大小记为1.根据情感词前后的副词,可以判断其情感强度。若为加强型情感副词,例如“非常”、“极其”等,情感强度为5;若为微弱情感副词,例如“有点”、“稍微”等,情感强度为1;若无情感副词或为一般情感副词,例如“可以”、“差不多”等,情感强度为3。再结合产品特征描述内容的长短,量化用户对产品特征的重视程度
(3)综合判断用户的总体情感倾向。计算积极情绪的产品特征得分,即公式以及消极情绪的产品特征得分,即公式如果积极情绪的产品特征打分总和大于消极情绪的产品特征打分,则判定为情感倾向为积极,否则判定为消极。若判定为积极,则积极情绪的产品特征是导致用户满意的原因;若判定为消极,则消极情绪的产品特征是导致用户不满意的原因。
(4)计算每个产品特征的关注度和满意度。产品特征fi的关注度等于关注该产品特征的用户数除以总用户数,即公式其中Ni为评论提及fi产品特征的用户,N为发表产品评论的总人数。产品特征的满意度等于该产品特征导致用户满意的人数除以提及该产品特征导的总人数,即公式
其中Si为因产品特征fi而满意的用户数,Ni为评论提及产品特征fi的用户数。
(5)产品关键特征的自动识别和分类。我们将产品关键特征分为三类:吸引性特征、不满意性特征和不一致性特征。吸引性特征是吸引客户购买的产品特征;不满意特征是指导致客户不满意的产品特征;不一致特征是指客户的态度不一致的产品特征。首先根据产品特征的关注度筛选得出产品关键特征的候选集,即关注度满足:Ci≥C0,C0为给定值。再基于产品特征的关注度和满意度,计算产品特征的信息增益,IMGain=Ci·[Info(N)-Info(fi)]。其中p1为总体满意度,p2=1-p1p1为特征fi满意度, p2=1-p1
根据产品特征的信息增益,识别产品关键特征的类型。
(a)吸引性特征的识别。
满意度Sai远大于1/2,说明产品特征的整体情感倾向是偏向积极的。此外,还需要满足:IMGain≥IM0,IM0是给定值。IMGain值越大,说明该产品特征越重要,是吸引用户购买的关键原因。
(b)不满意特征的识别。
满意度Sai远小于1/2,说明产品特征的整体情感倾向是偏向消极的。此外,还需要满足:IMGain≥IM0,IM0是给定值。IMGain值越大,说明该产品特征越重要,是导致用户对产品不满意的关键原因。
(c)不一致特征的识别。
满意度Sai≈1/2,说明用户对产品特征的态度是不一致的,存在观点分歧。此外,还需满足:IMGain≤IM0,IM0是给定值。IMGain值越小,态度的不一致性越强,导致用户态度不一致性主要原因有两点:第一是由于用户的个性化需求不一样;第二是由于产品特征的属性差异,有的属性做得好,赢得用户关注和喜欢,而有的属性做得不好,导致用户产生抱怨。
下面结合具体的场景,对本发明实施例提出提供的产品特征分析方法进行说明,下面给出了对一款汽车产品的产品特征进行分析的过程:具体步骤如下:
(1)从汽车之家上利用爬虫程序进行爬取奇瑞瑞虎5产品的社交评论数据,构成产品社交评论集合,得到社交评论语句3500条。
(2)将上述3500语句进行中文分词,利用词性标注提取产品特征56个,并计算每条语句产品特征的情感和重视程度,从而将非结构化的文本数据转化成结构化数据。
(3)对每个产品特征进行关注度、满意度以及信息增益的计算,识别出产品关键特征15个,并进行分类,如图3所示。
(4)分析结果的可视化展示,将自动识别的产品关键特征挖掘结果以一种清晰易懂的可视化图表向用户展示,如图3所示。
基于相同的构思,本发明的第二方面提供了一种产品特征分析系统,参见图4,该系统包括:
提取模块41,用于通过词性分析从多个用户针对产品的评论中提取多个产品特征;
识别模块42,用于对提取的产品特征进行识别,以确定积极情绪的产品特征和消极情绪的产品特征;
倾向判定模块43,用于针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度;并根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论;
满意评价模块44,用于针对每一个产品特征,根据包含该产品特征的积极评论的个数确定该产品特征对应的满意程度;
输出模块45,用于根据各个产品特征对应的满意程度生成对应的分析结果并输出。
在一些实施例中,提取模块41用于通过词性分析从多个用户针对产品的评论中进行产品特征提取,包括:
通过词性标注方法对多个用户针对产品的评论进行词性分析,从其中提取产品特征。
在一些实施例中,倾向判定模块43用于针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度,包括:
根据该产品特征对应的修饰词以及预设的修饰词与情感强度的对应关系确定用户对该产品特征的情感强度;根据关于该产品特征的描述的内容的长度以及用户对该产品特征的情感强度确定用户对该产品特征的重视程度。
在一些实施例中,所述倾向判定模块43用于针对每一个用户的评论,根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论,包括:
在各个积极情绪的产品特征对应的重视程度的和大于各个消极情绪的产品特征对应的重视程度的和时,判定该评论为积极评论,否则,判定为消极评论。
在一些实施例中,输出模块45用于根据各个产品特征对应的满意程度生成对应的分析结果并输出,包括:
将各个产品特征与其对应的满意程度通过可视化图表显示。
不难理解的是,由于上述的第二方面介绍的产品特征分析系统为可以执行本发明实施例中的产品特征分析方法的系统,故而基于本发明实施例中所介绍的产品特征分析的方法,本领域所属技术人员能够了解本实施例的产品特征分析系统的具体实施方式以及其各种变化形式,所以在此对于该产品特征分析系统如何实现本发明实施例中的产品特征分析方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中产品特征分析的方法所采用的系统,都属于本申请所欲保护的范围。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种产品特征分析方法,其特征在于,包括:
通过词性分析从多个用户针对产品的评论中提取多个产品特征;
对提取的产品特征进行识别,以确定积极情绪的产品特征和消极情绪的产品特征;
针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度;并根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论;包括:
在各个积极情绪的产品特征对应的重视程度的和大于各个消极情绪的产品特征对应的重视程度的和时,判定该评论为积极评论,否则,判定为消极评论;
针对每一个产品特征,根据包含该产品特征的积极评论的个数确定该产品特征对应的满意程度;
根据各个产品特征对应的满意程度生成对应的分析结果并输出;
其中,所述根据各个产品特征对应的满意程度生成对应的分析结果并输出,包括:
将各个产品特征与其对应的满意程度通过可视化图表显示;
还包括:
基于产品特征的关注度和满意度,计算产品特征的信息增益;
计算产品特征的信息增益的表达式为:
IMGain=Ci·[Info(N)-Info(fi)];
其中:Ci表示产品特征fi的关注度,Ni为评论提及产品特征fi的用户数,N为发表产品评论的总人数;
该式中p1为总体满意度,p2=1-p1
该式中p1为特征fi满意度,p2=1-p1
根据产品特征的信息增益,识别产品关键特征的类型,所述产品关键特征分为三类:吸引性特征、不满意性特征和不一致性特征;吸引性特征是吸引客户购买的产品特征;不满意特征是指导致客户不满意的产品特征;不一致特征是指客户的态度不一致的产品特征。
2.根据权利要求1所述的方法,其特征在于,所述通过词性分析从多个用户针对产品的评论中进行产品特征提取,包括:
通过词性标注方法对多个用户针对产品的评论进行词性分析,从其中提取产品特征。
3.根据权利要求1所述的方法,其特征在于,所述针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度,包括:
根据该产品特征对应的修饰词以及预设的修饰词与情感强度的对应关系确定用户对该产品特征的情感强度;根据关于该产品特征的描述的内容的长度以及用户对该产品特征的情感强度确定用户对该产品特征的重视程度。
4.一种产品特征分析系统,其特征在于,包括:
提取模块,用于通过词性分析从多个用户针对产品的评论中提取多个产品特征;
识别模块,用于对提取的产品特征进行识别,以确定积极情绪的产品特征和消极情绪的产品特征;
倾向判定模块,用于针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度;并根据其中包含的积极情绪的产品特征和消极情绪的产品特征以及用户对每一个产品特征的重视程度确定该评论是否为积极评论;包括:
在各个积极情绪的产品特征对应的重视程度的和大于各个消极情绪的产品特征对应的重视程度的和时,判定该评论为积极评论,否则,判定为消极评论;
满意评价模块,用于针对每一个产品特征,根据包含该产品特征的积极评论的个数确定该产品特征对应的满意程度;
输出模块,用于根据各个产品特征对应的满意程度生成对应的分析结果并输出;包括:
将各个产品特征与其对应的满意程度通过可视化图表显示;
还包括:
基于产品特征的关注度和满意度,计算产品特征的信息增益;
计算产品特征的信息增益的表达式为:
IMGain=Ci·[Info(N)-Info(fi)];
其中:Ci表示产品特征的关注度,Ni为评论提及产品特征fi的用户数,N为发表产品评论的总人数;
该式中p1为总体满意度,p2=1-p1
该式中p1为特征fi满意度,p2=1-p1
根据产品特征的信息增益,识别产品关键特征的类型,所述产品关键特征分为三类:吸引性特征、不满意性特征和不一致性特征;吸引性特征是吸引客户购买的产品特征;不满意特征是指导致客户不满意的产品特征;不一致特征是指客户的态度不一致的产品特征。
5.根据权利要求4所述的系统,其特征在于,所述提取模块用于通过词性分析从多个用户针对产品的评论中进行产品特征提取,包括:
通过词性标注方法对多个用户针对产品的评论进行词性分析,从其中提取产品特征。
6.根据权利要求4所述的系统,其特征在于,所述倾向判定模块用于针对每一个用户的评论,获取用户对其中每一个产品特征的重视程度,包括:
根据该产品特征对应的修饰词以及预设的修饰词与情感强度的对应关系确定用户对该产品特征的情感强度;根据关于该产品特征的描述的内容的长度以及用户对该产品特征的情感强度确定用户对该产品特征的重视程度。
CN201610805032.8A 2016-09-06 2016-09-06 产品特征分析方法和系统 Active CN106384245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610805032.8A CN106384245B (zh) 2016-09-06 2016-09-06 产品特征分析方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610805032.8A CN106384245B (zh) 2016-09-06 2016-09-06 产品特征分析方法和系统

Publications (2)

Publication Number Publication Date
CN106384245A CN106384245A (zh) 2017-02-08
CN106384245B true CN106384245B (zh) 2018-06-19

Family

ID=57939582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610805032.8A Active CN106384245B (zh) 2016-09-06 2016-09-06 产品特征分析方法和系统

Country Status (1)

Country Link
CN (1) CN106384245B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273351A (zh) * 2017-05-31 2017-10-20 温州市鹿城区中津先进科技研究院 一种基于大数据观点挖掘的产品特征提取方法
CN107908753B (zh) * 2017-11-20 2020-04-21 合肥工业大学 基于社交媒体评论数据的客户需求挖掘方法及装置
CN108874874A (zh) * 2018-04-27 2018-11-23 合肥工业大学 产品市场定位方法和系统、存储介质
CN111523914B (zh) * 2019-01-17 2023-05-02 阿里巴巴集团控股有限公司 用户满意度的评测方法、装置、系统和数据显示平台
CN110070148B (zh) * 2019-03-15 2021-06-29 北京木业邦科技有限公司 一种林业产品特征分析方法、装置及计算机可读介质
TWI749908B (zh) * 2020-11-25 2021-12-11 英業達股份有限公司 基於社群資訊追蹤及預測產品品質的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901230A (zh) * 2009-05-31 2010-12-01 国际商业机器公司 信息检索方法和用户评论处理方法及其系统
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN103679462B (zh) * 2012-08-31 2019-01-15 阿里巴巴集团控股有限公司 一种评论数据处理方法和装置、一种搜索方法和系统
CN102929860B (zh) * 2012-10-12 2015-05-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法

Also Published As

Publication number Publication date
CN106384245A (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN106384245B (zh) 产品特征分析方法和系统
Rana et al. Comparative analysis of sentiment orientation using SVM and Naive Bayes techniques
CN104484815B (zh) 基于模糊本体面向产品方面的情感分析方法及系统
Ahmad et al. Analyzing the performance of SVM for polarity detection with different datasets
Karduni et al. Vulnerable to misinformation? Verifi!
Halibas et al. Application of text classification and clustering of Twitter data for business analytics
CN109145216A (zh) 网络舆情监控方法、装置及存储介质
Herzig et al. Predicting customer satisfaction in customer support conversations in social media using affective features
JP6301966B2 (ja) データ分析システム、データ分析方法、データ分析のためのプログラム、及び、このプログラムの記録媒体
JP2013178754A (ja) ソーシャルメディアデータ分析システム及び方法
EP3513371A1 (en) System and method for human personality diagnostics based on computer perception of observable behavioral manifestations of an individual
Heck et al. Horizontal traceability for just‐in‐time requirements: the case for open source feature requests
Chumwatana Using sentiment analysis technique for analyzing Thai customer satisfaction from social media
Ramamoorthy et al. Memotion 2: Dataset on sentiment and emotion analysis of memes
Ziora The sentiment analysis as a tool of business analytics in contemporary organizations
Wint et al. Deep learning based sentiment classification in social network services datasets
CN107688594B (zh) 基于社交信息的风险事件的识别系统及方法
Bhatia et al. Strategies for mining opinions: A survey
Cho et al. Double privacy layer architecture for big data framework
Chafale et al. Sentiment analysis on product reviews using Plutchik’s wheel of emotions with fuzzy logic
Yin et al. Research of integrated algorithm establishment of a spam detection system
Punde et al. Fake product review monitoring & removal and sentiment analysis of genuine reviews
Badgaiyya et al. An application of sentiment analysis based on hybrid database of movie ratings
Tsapatsoulis et al. Cyberbullies in Twitter: A focused review
Padmavathy et al. Sentiment Mining from Online Patient Experience using Latent Dirichlet Allocation Method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant