CN105279148A - 一种app软件用户评论一致性判断方法 - Google Patents

一种app软件用户评论一致性判断方法 Download PDF

Info

Publication number
CN105279148A
CN105279148A CN201510673488.9A CN201510673488A CN105279148A CN 105279148 A CN105279148 A CN 105279148A CN 201510673488 A CN201510673488 A CN 201510673488A CN 105279148 A CN105279148 A CN 105279148A
Authority
CN
China
Prior art keywords
app software
word
comment
value
judge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510673488.9A
Other languages
English (en)
Other versions
CN105279148B (zh
Inventor
姜瑛
冉猛
向祺鑫
丁家满
汪海涛
刘英莉
李凌宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201510673488.9A priority Critical patent/CN105279148B/zh
Publication of CN105279148A publication Critical patent/CN105279148A/zh
Application granted granted Critical
Publication of CN105279148B publication Critical patent/CN105279148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种APP软件用户评论一致性判断方法,属于APP软件用户评价领域。本发明首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。本发明定义并提取APP软件特征情感词对集,有助于更准确的判断用户评论信息与评分星级的一致性;将用户对APP软件的情感倾向程度划分成与评分星级对应的5个等级,以判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件;通过判断APP软件用户评论的一致性,有助于用户评价APP软件的质量。

Description

一种APP软件用户评论一致性判断方法
技术领域
本发明涉及一种APP软件用户评论一致性判断方法,属于APP软件用户评价领域。
背景技术
用户评论信息分析方法在商品领域日趋成熟,多数研究主要使用ICTCLAS作为用户评论信息数据处理的工具,最后通过自然语言处理等方法来对用户评论信息进行分析。例如,朱征宇等人提出一种改进《知网》的词汇语义相似度计算方法;尹洪波等人提出当否定副词与程度副词共现时,句法语义可以相互推衍的规则;扈中凯等人通过对特征词和情感词同时提取,并建立用户兴趣偏好模型,结合用户历史评分数据来改善传统协同过滤推荐算法的推荐准确性;林钦和等人通过基于《HowNet》词典的程度语料库,设置6种类别的程度副词,并定义5种极性参数来计算用户对产品的不同态度。上述研究针对商品的用户评论信息进行挖掘和分析,将用户的情感倾向分为了正面、反面、中性三个方面。
目前,面对海量的移动应用,大多数用户在选择APP软件之前会查看APP软件信息和用户评论。用户评论包括用户给APP软件所打的评分星级(通常为5个等级),以及描述使用APP软件后的评论信息。用户的评论信息往往隐含了用户对APP软件的喜好程度及对软件特定属性的关注程度等潜在信息。然而,由于网络评论的自由性和随意性,导致评论信息与所给的评分星级不一致,或者评论信息与APP软件信息不一致。这给用户评价APP软件的质量带来了困难,因此如何判断APP软件的用户评论是否一致成为需要解决的问题。
本发明提出通过提取用户评论信息中的APP软件特征情感词对集,量化用户对APP软件特征情感倾向程度,并将量化后的综合评分划分成5个等级等方法来判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件。
发明内容
针对上述问题,本发明提供了一种APP软件用户评论一致性判断方法,以用于帮助用户选择所需的APP软件。
本发明的技术方案是:一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《HowNet》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
其中,情感词的正面、反面、中性根据《HowNet》词典匹配。
本发明的工作原理是:
一种APP软件用户评论一致性判断方法,包括:
提取APP软件特征情感词对集,用于对用户评论信息中的非结构化数据进行相应的数据处理并提取APP软件特征情感词对集;
判断用户评论信息与APP软件信息的一致性,用于判断用户评论信息中APP软件特征情感词对集中的特征是否与当前APP软件信息特征一致;
判断用户评论信息与评分星级的一致性,用于判断用户评论信息中用户对APP软件特征的情感倾向程度综合评分是否与用户对APP软件所给的评分星级一致。
本发明使用ICTCLAS2015作为数据处理的工具,进行用户评论信息的分词及词性标注;基于扈中凯等人对特征词、情感词同时提取的方法,本发明对特征词、副词、情感词进行同时提取,即提取APP软件特征情感词对集F。
所述U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1,相似度计算使用的是朱征宇等人提出的改进《知网》的词汇语义相似度计算方法,计算公式如下:
Sim(W1,W2)=max(Sim(C1i,C2j))
其中:i=1,2,...,n,j=1,2,...,m,Sim(W1,W2)为词汇W1与W2之间的相似度值,Sim(C1i,C2j)为概念C1i与C2j之间的概念相似度值。
APP软件用户评论是一种典型的网络评论,用户往往会使用许多网络情感词语。目前,词典不能识别这部分网络情感词,但这些词语又能表达用户对APP软件一个或多个特征的态度,从而对APP软件用户评论一致性的判断造成影响。因此,本发明建立了自定义网络情感词语库,如:TMD/n_newword、狗屎/n_newword、神器/n_newword、牛逼/n_newword等,并对这部分情感词进行权重极性的定义。这类词语大多表现为用户对APP软件的一个或多个特征持非常强烈的态度。
本发明基于《HowNet》词典的程度语料库,将林钦和等人的6种类别程度副词中极性参数相同的类别进行合并,最终分为5种不同极性参数的类别,如表1所示。
表1程度副词分类及极性参数表
对于否定副词的处理,本发明首先设置否定副词的极性参数为-0.5,由于否定副词和程度副词共现语序情况可分为两种:1)程度副词在否定副词之前,是对否定副词所否定程度的确定,否定程度是逐渐递增的,例如:“画面不好”和“画面很不好”;2)否定副词在程度副词之前,是对某个程度的否定,作用是把原来的程度降低,例如:“画面不非常好”和“画面相对好”,这两个例句表达的情感倾向程度大体相同。这种情况根据尹洪波等人提出的在语义上能够相互推衍的,基于以上规则,根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x);根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x)。
所述将综合评分F(O)划分成对应的5个等级的划分过程:由上述过程可以计算出综合评分F(O)的取值范围是[-1.6,+1.6],因为从表2中可以看出极性参数的最大值是1.6,正面、反面情感词的极性分别为+1、-1,且本专利中的否定副词极性参数为-0.5。所以5星中最大取值为1.6*1=1.6;4星的最大取值为1,最小值为-1*(-0.5)=0.5,即5星的取值区间为(1,1.6],4星的取值区间为[0.5,1]。用户综合评分划分区间如表2所示。
表2用户综合评分划分区间
本发明的有益效果是:
(1)本发明定义并提取APP软件特征情感词对集,有助于更准确的判断用户评论信息与评分星级的一致性;
(2)本发明将用户对APP软件的情感倾向程度划分成与评分星级对应的5个等级,以判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件;
(3)本发明通过判断APP软件用户评论的一致性,有助于用户评价APP软件的质量。
附图说明
图1是本发明的流程图。
具体实施方式
实施例1:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《HowNet》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
实施例2:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《HowNet》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
实施例3:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
实施例4:如图1所示,
APP软件用户评论如表3所示,
表3
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,如“下载”、“画面”等;Wa为修饰特征Wh的情感词,表达了用户对APP软件特征的主观感受,如“麻烦”、“流畅”等;Wd为修饰情感词Wa的副词,表达了用户对特征情感的程度,如“很”、“非常”等。
本发明使用ICTCLAS2015作为数据处理的工具,进行用户评论信息的分词及词性标注;基于扈中凯等人对特征词、情感词同时提取的方法,本发明对特征词、副词、情感词进行同时提取,即提取APP软件特征情感词对集F。本实施例中对用户评论信息分词之后为:“呵呵/o交换机/n”,提取特征情感词对集:F={f1}。
Step2、设置x=1;
f1=(交换机/n,null,null)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为“交换机”,执行步骤Step5;
Step5、判断Wh是否属于集合U:本实施例中Wh不属于该APP软件信息特征集合U={QQ/n,软件/n,帮助/vn,彩铃/n,超过/v,充/v,触/v,传输/vn,创新/vi,打造/v,电脑/n,动态/n,反馈/v,方便/v,分享/v,服务/vn,感动/v,个性/n,功能/n,沟通/v,购/vg,过程/n,好友/n,互联网/n,话费/n,获知/v,进入/v,空间/n,联系/v,聊天/vi,留住/v,满足/v,名片/n,气泡/n,全民/n,热线/n,人/n,设置/v,生活/vn,时间/n,使用/v,视频/n,收发/v,收款/vn,手机/n,体验/vn,停/vi,通话/vi,文件/n,问题/n,无限/vi,相见/vi,想念/v,消息/n,需/v,选/v,一应俱全/v,移动/vn,用户/n,游戏/n,娱乐/vn,语音/n,遇到/v,支付/v,中心/n,主题/n,转账/vn,装扮/v},因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.05;由于amax<α,阈值α=0.1,因此,将f1的情感倾向程度得分F(1)赋值为0,x=2,执行Step3:2>1,执行执行Step6;
Step6、判断是否存在F(x)!=0:本实施例中不存在F(x)!=0,因此输出“APP软件用户评论不一致”。
实施例5:如图1所示,APP软件用户评论如表4所示,
表4
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中特征情感词对集:F={f1,f2},f1=(null,null,(好/a用/v)),f2=(迅雷/nz,null,好/a);
Step2、设置x=1;
f1=(null,null,(好/a用/v))。
Step3、判断x是否小于或等于u:本实施例中1<=2,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好用”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为空,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)(其中,情感词的正面、反面、中性根据《HowNet》词典匹配,从而确定F(a)的取值)计算出F(1)的评分:F(1)=1*1*1=1,x=2,执行Step3:2<=2,执行步骤Step4;
判断fx中的Wh是否为空:本实施例f2中Wh为“迅雷”,判断Wh是否属于集合U:本实施例中Wh不属于该APP软件信息特征集合U={百度/nz,视频/n,想/v,看/v,有/v,观看/v,离线/vn,视频/n,享受/v,片/n,APP/n,够/v,电影/n,播/v,剧/n,动漫/vn,节目/n,应有尽有/v,搜索/vn,个性化/vn,推荐/vn能/v,找到/v,装/v,采用/v,独有/v,移动/vn,云/n,播放/v,内核/n,技术/n,播放/v,加载/v,速度/n},因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.08;由于amax<α,阈值α=0.1,因此,将f2的情感倾向程度得分F(2)赋值为0,x=3,执行Step3:3>2,执行执行Step7;
Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=1,根据公式计算出综合评分F(O)=1/1=1,最后根据表2得出量化后的评分星级为4星,但用户给出的评分星级是5星。因此,输出“APP软件用户评论不一致”。
实施例6:如图1所示,APP软件用户评论如表5所示,
表5
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中对用户评论信息分词之后为:“TMD/n_newword不/d好/a!/wt”,提取特征情感词对集:F={f1},f1=(null,不/d,(TMD/n_newword好/a))。
Step2、设置x=1;
f1=(null,不/d,(TMD/n_newword好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“TMD/n_newword好”,属于自定义网络情感词,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算出F(1)的评分:F(1)=1*(-1.6)=-1.6,x=2,执行Step3:2>1,执行步骤Step6;
Step6、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.6,根据公式计算出综合评分F(O)=-1.6/1=-1.6;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是1星。因此,输出“APP软件用户评论一致”。
实施例7:如图1所示,APP软件用户评论如表6所示,
表6
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中对用户评论信息分词之后为:“SB/n_newword软件/n”,提取特征情感词对集:F={f1},f1=(软件/n,null,SB/n_newword))。
Step2、设置x=1;
f1=(软件/n,null,SB/n_newword)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为“软件”,执行步骤Step5;
Step5、判断Wh是否属于集合U:本实施例Wh为“软件”属于U,执行步骤Step6;
Step6、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“SB”,属于自定义网络情感词,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算出F(1)的评分:F(1)=1*(-1.6)=-1.6,x=2,执行Step3:2>1,执行步骤Step7;
Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.6,根据公式计算出综合评分F(O)=-1.6/1=-1.6;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是1星。因此,输出“APP软件用户评论一致”。
实施例8:如图1所示,APP软件用户评论如表7所示,
表7
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中特征情感词对集:F={f1},f1=(安/v,很/d,慢/a);
Step2、设置x=1;
f1=(安/v,很/d,慢/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为“安”,执行步骤Step5;
Step5、判断Wh是否属于集合U:本实施例Wh为“安”不属于U,因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.6;由于amax>α,阈值α=0.1,执行步骤Step6;
Step6、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“慢”,不属于自定义网络情感词,执行Step7;
Step7、判断Wd是否为空:本实施例中Wd为“很”,执行步骤Step8;
Step8、判断fx是否含否定副词:本实施例中不含否定副词如,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)计算出F(1)的评分:F(1)=-1*1.4=-1.4,x=2,执行Step3:2>1,执行步骤Step9;
Step9、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.4,根据公式计算出综合评分F(O)=-1.4/1=-1.4;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是4星。因此,输出“APP软件用户评论不一致”。
实施例9:如图1所示,APP软件用户评论如表8所示,
表8
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取的特征情感词对集:F={f1},f1=(null,null,好/a);
Step2、设置x=1;
f1=(null,null,好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为空,则与《HowNet》词典匹配,并根据并根据公式F(x)=F(a)*F(d)*F(n)计算出F(1)的评分:F(1)=1*1*1=1,i=2,执行Step3:2>1,执行步骤Step7;
Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=1,根据公式计算出综合评分F(O)=1/1=1;最后根据表2得出量化后的评分星级为4星,用户给出的评分星级是4星。因此,输出“APP软件用户评论一致”。
实施例10:如图1所示,APP软件用户评论如表9所示,
表9
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取特征情感词对集:F={f1},f1=(null,(不/d太/d),好/a);
Step2、设置x=1;
f1=(null,(不/d太/d),好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为“不太”,执行Step7;
Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
Step8、判断fx是否含程度副词:本实施例中含有程度副词“太”,执行Step9;
Step9、判断fx是否属于DNP形式:本实施例不属于DNP形式,则根据公式F(x)=0.6*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(1):F(1)=0.6*1.4*1=0.84,x=2,执行Step3:2>1,执行步骤Step10;
Step10、判断是否存在F(x)!=0:本实施例中存在F(1)=0.84,根据公式计算出综合评分F(O)=0.84/1=0.84;最后根据表2得出量化后的评分星级为4星,用户给出的评分星级是5星。因此,输出“APP软件用户评论不一致”。
实施例11:如图1所示,APP软件用户评论如表10所示,
表10
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取特征情感词对集:F={f1},f1=(null,(有点/d不/d),好/a);
Step2、设置x=1;
f1=(null,(有点/d不/d),好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为“有点不”,执行Step7;
Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
Step8、判断fx是否含程度副词:本实施例中含有程度副词“有点”,执行Step9;
Step9、判断fx是否属于DNP形式:本实施例属于DNP形式,则根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(1):F(1)=(-0.5)*0.8*1=-0.4,x=2,执行Step3:2>1,执行步骤Step10;
Step10、判断是否存在F(x)!=0:本实施例中存在F(x)=-0.4,根据公式计算出综合评分F(O)=-0.4/1=-0.4;最后根据表2得出量化后的评分星级为2星,用户给出的评分星级是1星。因此,输出“APP软件用户评论不一致”。
实施例12:如图1所示,APP软件用户评论如表11所示,
表11
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取特征情感词对集:F={f1},f1=(null,不/d,好/a);
Step2、设置x=1;
f1=(null,不/d,好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为“不”,执行Step7;
Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
Step8、判断fx是否含程度副词:本实施例中不含程度副词,则与《HowNet》词典匹配,并根据公式F(x)=-0.5*F(a)计算出F(1)的评分:F(1)=(-0.5)*1=-0.5,x=2,执行Step3:2>1,执行步骤Step9;
Step9、判断是否存在F(x)!=0:本实施例中存在F(1)=-0.5,根据公式计算出综合评分F(O)=-0.5/1=-0.5;最后根据表2得出量化后的评分星级为2星,用户给出的评分星级是4星。因此,输出“APP软件用户评论不一致”。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (4)

1.一种APP软件用户评论一致性判断方法,其特征在于:
首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
2.根据权利要求1所述的APP软件用户评论一致性判断方法,其特征在于:所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《HowNet》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《HowNet》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
3.根据权利要求2所述的APP软件用户评论一致性判断方法,其特征在于:所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
4.根据权利要求2所述的APP软件用户评论一致性判断方法,其特征在于:所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
CN201510673488.9A 2015-10-19 2015-10-19 一种app软件用户评论一致性判断方法 Active CN105279148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510673488.9A CN105279148B (zh) 2015-10-19 2015-10-19 一种app软件用户评论一致性判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510673488.9A CN105279148B (zh) 2015-10-19 2015-10-19 一种app软件用户评论一致性判断方法

Publications (2)

Publication Number Publication Date
CN105279148A true CN105279148A (zh) 2016-01-27
CN105279148B CN105279148B (zh) 2018-05-11

Family

ID=55148177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510673488.9A Active CN105279148B (zh) 2015-10-19 2015-10-19 一种app软件用户评论一致性判断方法

Country Status (1)

Country Link
CN (1) CN105279148B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204103A (zh) * 2016-06-24 2016-12-07 有米科技股份有限公司 一种移动广告平台寻找相似用户的方法
CN106296282A (zh) * 2016-08-08 2017-01-04 南京大学 一种基于用户评论和历史评分的网购产品评估方法
CN107180021A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 一种数据处理方法、系统及其服务器
CN107993126A (zh) * 2017-11-30 2018-05-04 武汉理工大学 一种基于挖掘评论修正用户评分的改进协同过滤方法
CN108920512A (zh) * 2018-05-31 2018-11-30 江苏乙生态农业科技有限公司 一种基于游戏软件场景的推荐方法
CN109918708A (zh) * 2019-01-21 2019-06-21 昆明理工大学 一种基于异质集成学习的材料性能预测模型构建方法
CN110659828A (zh) * 2019-09-23 2020-01-07 上海海事大学 一种基于评论数据的软件特征评价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782898A (zh) * 2010-03-25 2010-07-21 中国科学院计算技术研究所 一种情感词倾向性的分析方法
US20110209043A1 (en) * 2010-02-21 2011-08-25 International Business Machines Corporation Method and apparatus for tagging a document
CN103440235A (zh) * 2013-08-20 2013-12-11 中国科学院自动化研究所 一种基于认知结构模型的文本情感类型识别方法及装置
CN104331451A (zh) * 2014-10-30 2015-02-04 南京大学 一种基于主题的网络用户评论的推荐度评分方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110209043A1 (en) * 2010-02-21 2011-08-25 International Business Machines Corporation Method and apparatus for tagging a document
CN101782898A (zh) * 2010-03-25 2010-07-21 中国科学院计算技术研究所 一种情感词倾向性的分析方法
CN103440235A (zh) * 2013-08-20 2013-12-11 中国科学院自动化研究所 一种基于认知结构模型的文本情感类型识别方法及装置
CN104331451A (zh) * 2014-10-30 2015-02-04 南京大学 一种基于主题的网络用户评论的推荐度评分方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MARK HARMAN等: "App store mining and analysis: MSR for app stores", 《2012 9TH IEEE WORKING CONFERENCE ON MINING SOFTWARE REPOSITORIES (MSR)》 *
刘洋等: "在线评论对应用软件及平台定价策略的影响", 《系统工程学报》 *
姚天昉等: "汉语语句主题语义倾向分析方法的研究", 《中文信息学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180021A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 一种数据处理方法、系统及其服务器
CN106204103A (zh) * 2016-06-24 2016-12-07 有米科技股份有限公司 一种移动广告平台寻找相似用户的方法
CN106296282A (zh) * 2016-08-08 2017-01-04 南京大学 一种基于用户评论和历史评分的网购产品评估方法
CN107993126A (zh) * 2017-11-30 2018-05-04 武汉理工大学 一种基于挖掘评论修正用户评分的改进协同过滤方法
CN108920512A (zh) * 2018-05-31 2018-11-30 江苏乙生态农业科技有限公司 一种基于游戏软件场景的推荐方法
CN108920512B (zh) * 2018-05-31 2021-12-28 江苏一乙生态农业科技有限公司 一种基于游戏软件场景的推荐方法
CN109918708A (zh) * 2019-01-21 2019-06-21 昆明理工大学 一种基于异质集成学习的材料性能预测模型构建方法
CN109918708B (zh) * 2019-01-21 2022-07-26 昆明理工大学 一种基于异质集成学习的材料性能预测模型构建方法
CN110659828A (zh) * 2019-09-23 2020-01-07 上海海事大学 一种基于评论数据的软件特征评价方法
CN110659828B (zh) * 2019-09-23 2022-03-08 上海海事大学 一种基于评论数据的软件特征评价方法

Also Published As

Publication number Publication date
CN105279148B (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
CN105279148A (zh) 一种app软件用户评论一致性判断方法
CN103365867B (zh) 一种对用户评价进行情感分析的方法和装置
CN108984530A (zh) 一种网络敏感内容的检测方法及检测系统
CN103294800B (zh) 一种信息推送方法及装置
CN104778173B (zh) 目标用户确定方法、装置及设备
CN111767403B (zh) 一种文本分类方法和装置
CN103577989B (zh) 一种基于产品识别的信息分类方法及信息分类系统
CN108595519A (zh) 热点事件分类方法、装置及存储介质
CN112104642B (zh) 一种异常账号确定方法和相关装置
CN111460221B (zh) 评论信息处理方法、装置及电子设备
CN107944911B (zh) 一种基于文本分析的推荐系统的推荐方法
CN103399916A (zh) 基于产品特征的互联网评论观点挖掘方法及系统
CN103617230A (zh) 一种基于微博的广告推荐方法及系统
CN102929860B (zh) 一种基于上下文语境的中文分句情感极性判别方法
CN107133282B (zh) 一种改进的基于双向传播的评价对象识别方法
Petz et al. On text preprocessing for opinion mining outside of laboratory environments
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN107301200A (zh) 一种基于情感倾向分析的文章评估方法和系统
CN106339368A (zh) 文本情感倾向的获取方法及装置
CN105740382A (zh) 一种对短评论文本进行方面分类方法
CN110457711A (zh) 一种基于主题词的社交媒体事件主题识别方法
CN110706028A (zh) 基于属性特征的商品评价情感分析系统
CN106919551A (zh) 一种情感词极性的分析方法、装置及设备
CN111405360A (zh) 视频处理方法、装置、电子设备和存储介质
CN108460049A (zh) 一种确定信息类别的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant