CN110717654A - 基于用户评论的产品质量评价方法和系统 - Google Patents
基于用户评论的产品质量评价方法和系统 Download PDFInfo
- Publication number
- CN110717654A CN110717654A CN201910876516.5A CN201910876516A CN110717654A CN 110717654 A CN110717654 A CN 110717654A CN 201910876516 A CN201910876516 A CN 201910876516A CN 110717654 A CN110717654 A CN 110717654A
- Authority
- CN
- China
- Prior art keywords
- evaluation
- data
- index
- words
- comment data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本发明提供一种基于用户评论的产品质量评价方法和系统,涉及数据处理领域。包括以下步骤:获取用户对产品的评论数据和产品数据;对评论数据预处理,得到历史评论数据,基于产品数据获取初始评价指标;基于历史评论数据和初始评价指标获取指标种子词,基于历史评论数据获取词向量;基于词向量和指标种子词获取评价指标,基于词向量和预先构建的BLSTM‑CRFs模型获取评价数据;将评价指标和评价数据相匹配,对匹配后的评价数据进行打分;基于证据推理方法对打分结果进行处理,得到评价等级信度分布;将评价等级信度分布转换为效用值;基于效用值获取产品质量的评价。本发明可以准确得到产品的质量评价。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于用户评论的产品质量评价方法和系统。
背景技术
产品质量评价是指包括产品设计、制造、使用等生命周期全过程的一切质量评价活动。随着经济的发展和人民生活水平的提高,消费者对产品的需求已逐渐由数量向质量转变,消费者对产品质量的关注度越来越高。因此产品的质量评价是至关重要的一个环节。
现有技术的产品质量评价方法一般为:通过问卷调查、企业调研等渠道获取产品使用阶段的质量评价数据,再通过构建指标体系并结合层次分析法、模糊综合评价方法等多准则评估方法对产品质量进行评价。
本申请的发明人发现,现有技术在获取评价数据时没有充分考虑到消费者这一因素,导致数据来源不够广泛,因此现有技术提供的产品质量评价方法存在评价结果不准确的缺点。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于用户评论的产品质量评价方法和系统,解决了现有技术无法准确评价产品质量的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明解决其技术问题所提供的一种基于用户评论的产品质量评价方法,所述评价方法由计算机执行,包括以下步骤:
获取产品数据和用户对产品的评论数据;
对所述评论数据预处理,得到历史评论数据;基于所述产品数据获取初始评价指标;
基于所述历史评论数据和所述初始评价指标获取指标种子词;基于所述历史评论数据获取词向量;
基于所述词向量和所述指标种子词获取评价指标;基于所述词向量和预先构建的BLSTM-CRFs模型获取评价数据;
将所述评价指标和所述评价数据相匹配,对匹配后的评价数据进行打分;
基于证据推理方法对打分结果进行处理,得到评价等级信度分布;
将所述评价等级信度分布转换为效用值;
基于所述效用值获取产品质量的评价。
优选的,对所述评论数据预处理,包括:
删除重复评论、未填写有效内容的评论和字符长度低于预设值的评论;
将所述评论数据中文字的繁体形式转化为简体;
对所述评论数据进行分句、分词和去停用词。
优选的,所述指标种子词的获取方法包括:
对所述历史评论数据进行词性标注;提取高频名词和动词,并过滤掉频数低于预设值的名词、动词和与质量属性无关的单字词;将最终得到的词和所述初始评价指标进行匹配,得到所述初始评价指标对应的指标种子词。
优选的,所述词向量的获取方法包括:
基于预训练的word2vec模型对所述历史评论数据进行处理,得到预设维度的词向量。
优选的,所述评价指标的获取方法包括:
S4011、基于所述词向量对所述指标种子词进行向量化处理,获取所述历史评论数据中所有词语和向量化后的指标种子词的相关度,选取相关度最大的前a个词对指标种子词进行扩展,并去除重复词,得到扩展种子词;
S4012、基于KNN对所述扩展种子词进行处理,得到产品质量属性词;
S4013、计算所述产品质量属性词在所述历史评论数据中出现的频数,过滤掉频数低于预设值的产品质量属性词对应的初始评价指标,得到评价指标。
优选的,所述评价数据的获取方法包括:
基于预先构建的BLSTM-CRFs模型和所述词向量对所述历史评论数据进行处理,抽取所述产品质量属性词对应的程度词和情感词,将所述程度词和所述情感词保存为文本形式,得到评价数据;
所述预先构建的BLSTM-CRFs模型的获取方法为:
基于TensorFlow工具构建BLSTM-CRFs模型;基于BIO标准模式对所述历史评论数据进行标注,得到数据集;随机打乱数据集顺序,对数据集进行预设次数的训练,选取准确度最高的模型作为预先构建的BLSTM-CRFs模型。
优选的,所述基于证据推理方法对打分结果进行处理,包括以下步骤:
S601、预先设置所述评价指标的评价等级;
S602、将所述打分结果转换为对应评价指标的评价等级上的信度;
S603、对所述评价指标赋予权重,基于所述信度和所述权重获取所述评价指标的基本概率分配;
S604、基于证据推理方法,结合所述基本概率分配,融合所述评价数据,得到评价等级信度分布。
优选的,步骤S604具体包括:
选用证据推理方法中的ER algorithm对所述评价数据进行融合,融合公式为:
mn,I(k+1)=KI(k+1)(mn,I(k)mn,k+1+mn,I(k)mH,k+1+mH,I(k)mn,k+1)n=1,2,…,N
mH,I(k+1)=KI(k+1)mH,I(k)mH,k+1
其中:
mn,I(k)表示前k个指标融合后分配到等级Hn的概率;
mH,I(k)表示前k个指标融合后分配到全集H的概率;
N表示评价等级的数量,L表示评价指标的数量,
K表示归一化系数;
将得到的mn,I(L)重新转为评价等级上的信度分布:
其中:
βn表示L个指标合成后评价到等级Hn的信度;
最终得到评价等级信度分布为:
S(y)={(Hn,βn),n=1,2,...,N}
其中:
Hn表示评价等级。
优选的,所述效用值的获取方法为:
其中:
u(Hn)表示评价等级Hn的效用值。
本发明解决其技术问题所提供的一种基于用户评论的产品质量评价系统,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
获取产品数据和用户对产品的评论数据;
对所述评论数据预处理,得到历史评论数据;基于所述产品数据获取初始评价指标;
基于所述历史评论数据和所述初始评价指标获取指标种子词;基于所述历史评论数据获取词向量;
基于所述词向量和所述指标种子词获取评价指标;基于所述词向量和预先构建的BLSTM-CRFs模型获取评价数据;
将所述评价指标和所述评价数据相匹配,对匹配后的评价数据进行打分;
基于证据推理方法对打分结果进行处理,得到评价等级信度分布;
将所述评价等级信度分布转换为效用值;
基于所述效用值获取产品质量的评价。
(三)有益效果
本发明提供了一种基于用户评论的产品质量评价方法和系统。与现有技术相比,具备以下有益效果:
本发明通过获取用户对产品的评论数据和产品数据;对评论数据预处理,得到历史评论数据,基于产品数据获取初始评价指标;基于历史评论数据和初始评价指标获取指标种子词,基于历史评论数据获取词向量;基于词向量和指标种子词获取评价指标,基于词向量和预先构建的BLSTM-CRFs模型获取评价数据;将评价指标和评价数据相匹配,对匹配后的评价数据进行打分;基于证据推理方法对打分结果进行处理,得到评价等级信度分布;将评价等级信度分布转换为效用值;基于效用值获取产品质量的评价。本发明将用户对产品的评价与产品质量指标相匹配,得到评价指标下的具体意见,能够追溯产品质量的问题所在,使得产品质量的评价结果准确。企业通过评价结果可以有针对性的改进产品设计、调整销售策略和服务等,从而提高企业的利润。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于用户评论的产品质量评价方法的整体流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于用户评论的产品质量评价方法和系统,解决了现有技术无法准确评价产品质量的技术问题,实现产品质量的准确评价。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例通过获取用户对产品的评论数据和产品数据;对评论数据预处理,得到历史评论数据,基于产品数据获取初始评价指标;基于历史评论数据和初始评价指标获取指标种子词,基于历史评论数据获取词向量;基于词向量和指标种子词获取评价指标,基于词向量和预先构建的BLSTM-CRFs模型获取评价数据;将评价指标和评价数据相匹配,对匹配后的评价数据进行打分;基于证据推理方法对打分结果进行处理,得到评价等级信度分布;将评价等级信度分布转换为效用值;基于效用值获取产品质量的评价。本发明实施例将用户对产品的评价与产品质量指标相匹配,得到评价指标下的具体意见,能够追溯产品质量的问题所在,使得产品质量的评价结果准确。企业通过评价结果可以有针对性的改进产品设计、调整销售策略和服务等,从而提高企业的利润。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本发明实施例提供了一种基于用户评论的产品质量评价方法,该方法由计算机执行,如图1所示,包括以下步骤:
S1、获取产品数据和用户对产品的评论数据;
S2、对上述评论数据预处理,得到历史评论数据;基于上述产品数据获取初始评价指标;
S3、基于上述历史评论数据和上述初始评价指标获取指标种子词;基于上述历史评论数据获取词向量;
S4、基于上述词向量和上述指标种子词获取评价指标;基于上述词向量和预先构建的BLSTM-CRFs模型获取评价数据;
S5、将上述评价指标和上述评价数据相匹配,对匹配后的评价数据进行打分;
S6、基于证据推理方法对打分结果进行处理,得到评价等级信度分布;
S7、将上述评价等级信度分布转换为效用值;
S8、基于上述效用值获取产品质量的评价。
本发明实施例通过获取用户对产品的评论数据和产品数据;对评论数据预处理,得到历史评论数据,基于产品数据获取初始评价指标;基于历史评论数据和初始评价指标获取指标种子词,基于历史评论数据获取词向量;基于词向量和指标种子词获取评价指标,基于词向量和预先构建的BLSTM-CRFs模型获取评价数据;将评价指标和评价数据相匹配,对匹配后的评价数据进行打分;基于证据推理方法对打分结果进行处理,得到评价等级信度分布;将评价等级信度分布转换为效用值;基于效用值获取产品质量的评价。本发明实施例将用户对产品的评价与产品质量指标相匹配,得到评价指标下的具体意见,能够追溯产品质量的问题所在,使得产品质量的评价结果准确。企业通过评价结果可以有针对性的改进产品设计、调整销售策略和服务等,从而提高企业的利润。
下面对各步骤进行具体分析。
在步骤S1中,获取产品数据和用户对产品的评论数据。
具体的,使用python等工具编写动态爬虫程序,并从电商平台上爬取商品评论数据,并将数据保存为文本,得到用户对产品的评论数据。同时获取待评价产品的特点等,得到产品数据。
在步骤S2中,对上述评论数据预处理,得到历史评论数据;基于上述产品数据获取初始评价指标。
具体的,预处理方法包括:
(1)删除重复评论、未填写有效内容的评论和字符长度低于预设值的评论。本发明实施例中预设值为3。
(2)将评论数据中文字的繁体形式转化为简体。
(3)对评论数据进行分句处理、分词处理和去停用词处理。
在本发明实施例中,根据上述产品数据,结合产品质量理论、产品质量标准和规范、产品质检指标及其他相关文献和专家得到产品质量的初始评价指标。
具体的,在本发明实施例中以空调产品为例,根据Kotler的产品质量理论,产品本身质量评价指标可以分为产品核心质量和产品形式质量,根据空调产品特点,将核心质量划分为性能、节能性和舒适性,其中舒适性包括噪音大小、是否有异味等,形式质量划分为外观、包装、材料。根据服务环节的不同,将服务质量分为咨询服务、物流服务、安装服务、保养服务。
在步骤S3中,基于上述历史评论数据和上述初始评价指标获取指标种子词;基于上述历史评论数据获取词向量。
具体的,包括以下步骤:
S301、在本发明实施例中,采用哈工大LPT工具进行处理。对历史评论数据进行词性标注;提取高频名词和动词,并过滤掉频数低于预设值的名词、动词和与质量属性无关的单字词,具体的,过滤掉了频数低于5的名词和动词;将最终得到的词和初始评价指标进行匹配,得到初始评价指标对应的指标种子词。
具体的,性能指标种子词包括:性能、开关机、风速、制热、制冷、制暖;舒适性指标种子词包括:声音、噪音、异响、气味、异味;节能性指标种子词包括:节能、省电、耗能、费电。
S302、基于预训练的word2vec模型对历史评论数据进行处理,得到预设维度的词向量。
具体的,使用word2Vec工具包将历史评论数据训练成词向量,向量维度设置为200;最小训练词频设置为5,词频小于5次的词丢弃。
在步骤S4中,基于上述词向量和上述指标种子词获取评价指标;基于上述词向量和预先构建的BLSTM-CRFs模型获取评价数据。
具体的,包括以下步骤:
S401、获取评价指标。具体的:
S4011、基于上述词向量对指标种子词进行向量化处理,获取历史评论数据中所有词语和向量化后的指标种子词的相关度,选取相关度最大的前a个词对指标种子词进行扩展,并去除重复词,得到扩展种子词。具体的,在本发明实施例中选取与指标种子词相关度最大的前15个词进行后续处理。
S4012、基于KNN分类方法对扩展种子词进行处理,得到产品质量属性词。
具体的,将扩展后种子词划分到产品质量各指标下,处理方法为:
(1)计算扩展种子词与已知类别种子词间的距离;具体的,已知类别种子词为步骤S301中匹配好的种子词;
(2)按照距离从小到大对种子词排序;
(3)选取前k(k=17)个距离最小的种子词;
(4)计算这k个词的权重;
(5)确定扩展后词语的类别。
其中:x0为待分类种子词,{x01,x02,…,x0k}为距离x0最小的前K个已知类别种子词,δ(li,j)为kronecker函数。
S4013、计算产品质量属性词在历史评论数据中出现的频数,过滤掉频数低于预设值的产品质量属性词对应的初始评价指标,得到评价指标。
具体的,本发明实施例中预设值为0.5%。
S402、获取评价数据。
评价数据的获取方法为:
基于预先构建的BLSTM-CRFs模型和上述词向量对上述历史评论数据进行处理,抽取产品质量属性词对应的程度词和情感词,将程度词和情感词保存为文本形式,得到评价数据。
在本发明实施例中,对历史评论数据进行标注时选取其中n条历史评论数据进行标注处理,具体的,可以选择600条历史评论数据进行标注。当历史评论数据很多时也可以根据需要适当增加标注的数量。
具体的,预先构建的BLSTM-CRFs模型的获取方法如下:
先使用TensorFlow工具构建BLSTM-CRFs模型,具体的,构建模型时的词向量维度设为200,学习率设为0.05,各个权重矩阵以[-1,1]上的均匀分布随机初始化;基于BIO标准模式对历史评论数据进行标注,得到数据集;随机打乱数据集顺序,对数据集进行预设次数的训练,选取准确度最高的模型作为预先构建的BLSTM-CRFs模型。
历史评论数据按照BIO模式标注n条,将标注后数据集分为三部分,60%作为模型训练集,20%作为参数选择集,最后20%作为结果测试集。为防止过拟合,采用随机打乱数据集顺序的方式进行了多轮训练,并验证测试集上的F值,选择准确率最高的模型。
在步骤S5中,将上述评价指标和上述评价数据相匹配,对匹配后的评价数据进行打分。
具体的,本发明实施例设定从所有评价数据中抽取出C条<属性词,程度词,情感词>对,第k个产品质量指标下有Ck条;将每个指标的属性词对应评价数据汇总,得到各指标的评价数据集合。
邀请CN个专家,对每个指标的属性词集合采用n级评价量表形式打分,其中,针对提取的每个属性词的每个评价词(即程度词+情感词组合)打分,分值是1-5,1表示非常差的程度,5代表非常好的程度,并将打分结果汇总。
在步骤S6中,基于证据推理方法对打分结果进行处理,得到评价等级信度分布。
具体的,包括以下步骤:
S601、预先设置评价指标的评价等级。
本发明实施例设定某个产品有L个产品质量评价指标{e1,e2,…ek,…,el},对每个指标下的评价词集合的情感倾向按照1-N等级评分,评价等级记为:H={H1,H2,…,HN},Hn表示第n个评价等级,通常Hn+1优于Hn。
S602、将打分结果转换为对应评价指标的评价等级上的信度。
其中:
βn,k为第k个产品质量指标的评价分数为n的信度,且
Ck为第k个产品质量指标下<属性词,程度词,情感词>评价意见组合的条数;
A(ek)为第k个指标下属性词个数;
bi,j为第i个属性词的第j个评价词的个数;
CN为专家数。
S603、对评价指标赋予权重,基于信度和权重获取评价指标的基本概率分配。
需要说明的是,消费者关注度高的产品质量指标更影响满意度,故根据各指标下的属性词频数之和占比确定权重。
第k个指标的权重为:
其中:
C为从所有评论中抽取的<属性词,程度词,情感词>评价意见组合条数;
Ck为第k个指标下评价意见组合条数(注:C,Ck中包括重复评价意见)。
每个指标上的评价等级的信度分布表示为:
S(ek)={(Hn,βn,k),n=1,2,…,N}k=1,2,…L
指标权重乘以信度得到各指标在评价等级上的基本概率分配:
mn,k=wkβn,k,n=1,2,…,N,mH,k=1-wk
其中:
mn,k表示第k个指标评价为等级n的概率;
mH,k表示第k个指标评价为全集H的概率。
S604、基于证据推理方法,结合基本概率分配,融合评价数据,得到评价等级信度分布。
具体的,选用证据推理方法中的ERalgorithm对所述评价数据进行融合,融合公式为:
mn,I(k+1)=KI(k+1)(mn,I(k)mn,k+1+mn,I(k)mH,k+1+mH,I(k)mn,k+1)n=1,2,…,N
mH,I(k+1)=KI(k+1)mH,I(k)mH,k+1
其中:
mn,I(k)表示前k个指标融合后分配到等级Hn的概率;
mH,I(k)表示前k个指标融合后分配到全集H的概率;
N表示评价等级的数量,L表示评价指标的数量,
K表示归一化系数。
将得到的mn,I(L)重新转为评价等级上的信度分布:
其中:
βn表示L个指标合成后评价到等级Hn的信度。
最终得到评价等级信度分布为:
S(y)={(Hn,βn),n=1,2,...,N}
其中:
Hn表示评价等级。
在步骤S7中,将上述评价等级信度分布转换为效用值。
具体的,给每个评价等级设置效用值u(Hn),n=1,2,...,N
其中:0≤u(Hn)≤1,n=1,2,...,N,且如果Hn+1优于Hn,则u(Hn+1)>u(Hn)。
效用值的获取方法为:
其中:
u(Hn)表示评价等级Hn的效用值。
在步骤S8中,基于上述效用值获取产品质量的评价。
具体的,在本发明实施例中,将产品效用划分为三个等级,效用值为[0-0.5)的属于质量不合格产品,效用值为[0.5-0.8)的属于质量合格产品,效用值为[0.8-1]的是质量优良产品。
选取多个品牌的同一类型同一价位的产品,并结合产品的实际销量,分析影响产品效用值和实际销量的可能因素。
本发明实施例还提供了一种基于用户评论的产品质量评价系统,上述系统包括计算机,上述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,上述至少一个存储单元中存储有至少一条指令,上述至少一条指令由上述至少一个处理单元加载并执行以实现以下步骤:
S1、获取产品数据和用户对产品的评论数据;
S2、对上述评论数据预处理,得到历史评论数据;基于上述产品数据获取初始评价指标;
S3、基于上述历史评论数据和上述初始评价指标获取指标种子词;基于上述历史评论数据获取词向量;
S4、基于上述词向量和上述指标种子词获取评价指标;基于上述词向量和预先构建的BLSTM-CRFs模型获取评价数据;
S5、将上述评价指标和上述评价数据相匹配,对匹配后的评价数据进行打分;
S6、基于证据推理方法对打分结果进行处理,得到评价等级信度分布;
S7、将上述评价等级信度分布转换为效用值;
S8、基于上述效用值获取产品质量的评价。
可理解的是,本发明实施例提供的上述评价系统与上述评价方法相对应,其有关内容的解释、举例、有益效果等部分可以参考基于用户评论的产品质量评价方法中的相应内容,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
1、本发明实施例通过获取用户对产品的评论数据和产品数据;对评论数据预处理,得到历史评论数据,基于产品数据获取初始评价指标;基于历史评论数据和初始评价指标获取指标种子词,基于历史评论数据获取词向量;基于词向量和指标种子词获取评价指标,基于词向量和预先构建的BLSTM-CRFs模型获取评价数据;将评价指标和评价数据相匹配,对匹配后的评价数据进行打分;基于证据推理方法对打分结果进行处理,得到评价等级信度分布;将评价等级信度分布转换为效用值;基于效用值获取产品质量的评价。本发明实施例将用户对产品的评价与产品质量指标相匹配,得到评价指标下的具体意见,能够追溯产品质量的问题所在,使得产品质量的评价结果准确。企业通过评价结果可以有针对性的改进产品设计、调整销售策略和服务等,从而提高企业的利润。
2、本发明实施例根据属性词的频数占比确定指标权重,并引入证据推理规则融合各指标数据。证据推理规则能有效融合评价数据,得到综合评价结果,为多产品间决策提供有用的信息。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于用户评论的产品质量评价方法,其特征在于,所述评价方法由计算机执行,包括以下步骤:
获取产品数据和用户对产品的评论数据;
对所述评论数据预处理,得到历史评论数据;基于所述产品数据获取初始评价指标;
基于所述历史评论数据和所述初始评价指标获取指标种子词;基于所述历史评论数据获取词向量;
基于所述词向量和所述指标种子词获取评价指标;基于所述词向量和预先构建的BLSTM-CRFs模型获取评价数据;
将所述评价指标和所述评价数据相匹配,对匹配后的评价数据进行打分;
基于证据推理方法对打分结果进行处理,得到评价等级信度分布;
将所述评价等级信度分布转换为效用值;
基于所述效用值获取产品质量的评价。
2.如权利要求1所述的评价方法,其特征在于,对所述评论数据预处理,包括:
删除重复评论、未填写有效内容的评论和字符长度低于预设值的评论;
将所述评论数据中文字的繁体形式转化为简体;
对所述评论数据进行分句、分词和去停用词。
3.如权利要求1所述的评价方法,其特征在于,所述指标种子词的获取方法包括:
对所述历史评论数据进行词性标注;提取高频名词和动词,并过滤掉频数低于预设值的名词、动词和与质量属性无关的单字词;将最终得到的词和所述初始评价指标进行匹配,得到所述初始评价指标对应的指标种子词。
4.如权利要求1所述的评价方法,其特征在于,所述词向量的获取方法包括:
基于预训练的word2vec模型对所述历史评论数据进行处理,得到预设维度的词向量。
5.如权利要求3所述的评价方法,其特征在于,所述评价指标的获取方法包括:
S4011、基于所述词向量对所述指标种子词进行向量化处理,获取所述历史评论数据中所有词语和向量化后的指标种子词的相关度,选取相关度最大的前a个词对指标种子词进行扩展,并去除重复词,得到扩展种子词;
S4012、基于KNN对所述扩展种子词进行处理,得到产品质量属性词;
S4013、计算所述产品质量属性词在所述历史评论数据中出现的频数,过滤掉频数低于预设值的产品质量属性词对应的初始评价指标,得到评价指标。
6.如权利要求5所述的评价方法,其特征在于,所述评价数据的获取方法包括:
基于预先构建的BLSTM-CRFs模型和所述词向量对所述历史评论数据进行处理,抽取所述产品质量属性词对应的程度词和情感词,将所述程度词和所述情感词保存为文本形式,得到评价数据;
所述预先构建的BLSTM-CRFs模型的获取方法为:
基于TensorFlow工具构建BLSTM-CRFs模型;基于BIO标准模式对所述历史评论数据进行标注,得到数据集;随机打乱数据集顺序,对数据集进行预设次数的训练,选取准确度最高的模型作为预先构建的BLSTM-CRFs模型。
7.如权利要求1所述的评价方法,其特征在于,所述基于证据推理方法对打分结果进行处理,包括以下步骤:
S601、预先设置所述评价指标的评价等级;
S602、将所述打分结果转换为对应评价指标的评价等级上的信度;
S603、对所述评价指标赋予权重,基于所述信度和所述权重获取所述评价指标的基本概率分配;
S604、基于证据推理方法,结合所述基本概率分配,融合所述评价数据,得到评价等级信度分布。
8.如权利要求7所述的评价方法,其特征在于,步骤S604具体包括:
选用证据推理方法中的ER algorithm对所述评价数据进行融合,融合公式为:
mn,I(k+1)=KI(k+1)(mn,I(k)mn,k+1+mn,I(k)mH,k+1+mH,I(k)mn,k+1)n=1,2,…,N
mH,I(k+1)=KI(k+1)mH,I(k)mH,k+1
其中:
mn,I(k)表示前k个指标融合后分配到等级Hn的概率;
mH,I(k)表示前k个指标融合后分配到全集H的概率;
N表示评价等级的数量,L表示评价指标的数量,
K表示归一化系数;
将得到的mn,I(L)重新转为评价等级上的信度分布:
其中:
βn表示L个指标合成后评价到等级Hn的信度;
最终得到评价等级信度分布为:
S(y)={(Hn,βn),n=1,2,...,N}
其中:
Hn表示评价等级。
10.一种基于用户评论的产品质量评价系统,其特征在于,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
获取产品数据和用户对产品的评论数据;
对所述评论数据预处理,得到历史评论数据;基于所述产品数据获取初始评价指标;
基于所述历史评论数据和所述初始评价指标获取指标种子词;基于所述历史评论数据获取词向量;
基于所述词向量和所述指标种子词获取评价指标;基于所述词向量和预先构建的BLSTM-CRFs模型获取评价数据;
将所述评价指标和所述评价数据相匹配,对匹配后的评价数据进行打分;
基于证据推理方法对打分结果进行处理,得到评价等级信度分布;
将所述评价等级信度分布转换为效用值;
基于所述效用值获取产品质量的评价。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910876516.5A CN110717654B (zh) | 2019-09-17 | 2019-09-17 | 基于用户评论的产品质量评价方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910876516.5A CN110717654B (zh) | 2019-09-17 | 2019-09-17 | 基于用户评论的产品质量评价方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110717654A true CN110717654A (zh) | 2020-01-21 |
CN110717654B CN110717654B (zh) | 2022-05-06 |
Family
ID=69210537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910876516.5A Active CN110717654B (zh) | 2019-09-17 | 2019-09-17 | 基于用户评论的产品质量评价方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110717654B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881671A (zh) * | 2020-09-27 | 2020-11-03 | 华南师范大学 | 一种属性词提取方法 |
CN111985793A (zh) * | 2020-07-31 | 2020-11-24 | 安徽工程大学 | 一种学生网上评教方法 |
CN112418646A (zh) * | 2020-11-18 | 2021-02-26 | 广州小鹏自动驾驶科技有限公司 | 一种车辆舒适性评价方法、装置和可读存储介质 |
CN112581036A (zh) * | 2020-09-30 | 2021-03-30 | 南京视察者智能科技有限公司 | 一种大数据案件评价模型的设计方法、人才评价方法、人才库构建及推荐方法 |
CN113204484A (zh) * | 2021-04-30 | 2021-08-03 | 中国航天系统科学与工程研究院 | 一种面向软件生命周期的装备软件测试性设计方法 |
CN116957140A (zh) * | 2023-06-29 | 2023-10-27 | 易方达基金管理有限公司 | 一种基于nlp因子的股票预测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469282A (zh) * | 2015-12-01 | 2016-04-06 | 成都知数科技有限公司 | 基于文本评论的线上品牌评估方法 |
US20170249311A1 (en) * | 2016-02-26 | 2017-08-31 | Yahoo! Inc. | Quality-based scoring and inhibiting of user-generated content |
CN107133214A (zh) * | 2017-05-05 | 2017-09-05 | 中国计量大学 | 一种基于评论信息的产品需求偏好特征挖掘及其质量评估方法 |
CN110175325A (zh) * | 2019-04-26 | 2019-08-27 | 南京邮电大学 | 基于词向量和句法特征的评论分析方法及可视化交互界面 |
-
2019
- 2019-09-17 CN CN201910876516.5A patent/CN110717654B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469282A (zh) * | 2015-12-01 | 2016-04-06 | 成都知数科技有限公司 | 基于文本评论的线上品牌评估方法 |
US20170249311A1 (en) * | 2016-02-26 | 2017-08-31 | Yahoo! Inc. | Quality-based scoring and inhibiting of user-generated content |
CN107133214A (zh) * | 2017-05-05 | 2017-09-05 | 中国计量大学 | 一种基于评论信息的产品需求偏好特征挖掘及其质量评估方法 |
CN110175325A (zh) * | 2019-04-26 | 2019-08-27 | 南京邮电大学 | 基于词向量和句法特征的评论分析方法及可视化交互界面 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985793A (zh) * | 2020-07-31 | 2020-11-24 | 安徽工程大学 | 一种学生网上评教方法 |
CN111881671A (zh) * | 2020-09-27 | 2020-11-03 | 华南师范大学 | 一种属性词提取方法 |
CN111881671B (zh) * | 2020-09-27 | 2020-12-29 | 华南师范大学 | 一种属性词提取方法 |
CN112581036A (zh) * | 2020-09-30 | 2021-03-30 | 南京视察者智能科技有限公司 | 一种大数据案件评价模型的设计方法、人才评价方法、人才库构建及推荐方法 |
CN112581036B (zh) * | 2020-09-30 | 2021-09-24 | 南京视察者智能科技有限公司 | 一种大数据案件评价模型的设计方法、人才评价方法、人才库构建及推荐方法 |
CN112418646A (zh) * | 2020-11-18 | 2021-02-26 | 广州小鹏自动驾驶科技有限公司 | 一种车辆舒适性评价方法、装置和可读存储介质 |
CN113204484A (zh) * | 2021-04-30 | 2021-08-03 | 中国航天系统科学与工程研究院 | 一种面向软件生命周期的装备软件测试性设计方法 |
CN113204484B (zh) * | 2021-04-30 | 2023-11-14 | 中国航天系统科学与工程研究院 | 一种面向软件生命周期的装备软件测试性设计方法 |
CN116957140A (zh) * | 2023-06-29 | 2023-10-27 | 易方达基金管理有限公司 | 一种基于nlp因子的股票预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110717654B (zh) | 2022-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717654B (zh) | 基于用户评论的产品质量评价方法和系统 | |
Olczyk | A systematic retrieval of international competitiveness literature: a bibliometric study | |
CN106919619A (zh) | 一种商品聚类方法、装置及电子设备 | |
CN107315738A (zh) | 一种文本信息的创新度评估方法 | |
Liu et al. | Riding the tide of sentiment change: sentiment analysis with evolving online reviews | |
Duan et al. | Semi-supervised learning with generative model for sentiment classification of stock messages | |
CN108733748A (zh) | 一种基于商品评论舆情的跨境产品质量风险模糊预测方法 | |
CN108596637B (zh) | 一种电商服务问题自动发现系统 | |
Zhang et al. | Joint monitoring of post-sales online review processes based on a distribution-free EWMA scheme | |
CN115310722A (zh) | 一种基于数据统计的农产品价格预测方法 | |
Yennimar et al. | Comparison of Machine Learning Classification Algorithms in Sentiment Analysis Product Review of North Padang Lawas Regency | |
Hadju et al. | Sentiment analysis of indonesian e-commerce product reviews using support vector machine based term frequency inverse document frequency | |
Darena et al. | Machine learning-based analysis of the association between online texts and stock price movements | |
Zhang et al. | Can sentiment analysis help mimic decision-making process of loan granting? A novel credit risk evaluation approach using GMKL model | |
CN115828914A (zh) | 一种考虑用户属性偏好的满意度评估方法 | |
CN116128544A (zh) | 一种电力营销异常营业数据的主动稽核方法和系统 | |
Zhang et al. | Domain knowledge based personalized recommendation model and its application in cross-selling | |
CN111274404B (zh) | 一种基于人机协同的小样本实体多领域分类方法 | |
CN115048503A (zh) | 一种基于内容分析的用户偏好标签设计方法 | |
CN113807092A (zh) | 一种基于lda主题模型的卷烟品牌在线评论分析方法 | |
Zhang et al. | Extending associative classifier to detect helpful online reviews with uncertain classes | |
Chebil et al. | Clustering social media data for marketing strategies: Literature review using topic modelling techniques | |
Seo et al. | Measuring News Sentiment of Korea Using Transformer | |
CN117436446B (zh) | 基于弱监督的农业社会化销售服务用户评价数据分析方法 | |
CN116304058B (zh) | 企业负面信息的识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |