CN105279148B - 一种app软件用户评论一致性判断方法 - Google Patents
一种app软件用户评论一致性判断方法 Download PDFInfo
- Publication number
- CN105279148B CN105279148B CN201510673488.9A CN201510673488A CN105279148B CN 105279148 B CN105279148 B CN 105279148B CN 201510673488 A CN201510673488 A CN 201510673488A CN 105279148 B CN105279148 B CN 105279148B
- Authority
- CN
- China
- Prior art keywords
- app software
- comment
- word
- emotion
- app
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种APP软件用户评论一致性判断方法,属于APP软件用户评价领域。本发明首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。本发明定义并提取APP软件特征情感词对集,有助于更准确的判断用户评论信息与评分星级的一致性;将用户对APP软件的情感倾向程度划分成与评分星级对应的5个等级,以判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件;通过判断APP软件用户评论的一致性,有助于用户评价APP软件的质量。
Description
技术领域
本发明涉及一种APP软件用户评论一致性判断方法,属于APP软件用户评价领域。
背景技术
用户评论信息分析方法在商品领域日趋成熟,多数研究主要使用ICTCLAS作为用户评论信息数据处理的工具,最后通过自然语言处理等方法来对用户评论信息进行分析。例如,朱征宇等人提出一种改进《知网》的词汇语义相似度计算方法;尹洪波等人提出当否定副词与程度副词共现时,句法语义可以相互推衍的规则;扈中凯等人通过对特征词和情感词同时提取,并建立用户兴趣偏好模型,结合用户历史评分数据来改善传统协同过滤推荐算法的推荐准确性;林钦和等人通过基于《How Net》词典的程度语料库,设置6种类别的程度副词,并定义5种极性参数来计算用户对产品的不同态度。上述研究针对商品的用户评论信息进行挖掘和分析,将用户的情感倾向分为了正面、反面、中性三个方面。
目前,面对海量的移动应用,大多数用户在选择APP软件之前会查看APP软件信息和用户评论。用户评论包括用户给APP软件所打的评分星级(通常为5个等级),以及描述使用APP软件后的评论信息。用户的评论信息往往隐含了用户对APP软件的喜好程度及对软件特定属性的关注程度等潜在信息。然而,由于网络评论的自由性和随意性,导致评论信息与所给的评分星级不一致,或者评论信息与APP软件信息不一致。这给用户评价APP软件的质量带来了困难,因此如何判断APP软件的用户评论是否一致成为需要解决的问题。
本发明提出通过提取用户评论信息中的APP软件特征情感词对集,量化用户对APP软件特征情感倾向程度,并将量化后的综合评分划分成5个等级等方法来判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件。
发明内容
针对上述问题,本发明提供了一种APP软件用户评论一致性判断方法,以用于帮助用户选择所需的APP软件。
本发明的技术方案是:一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
其中,情感词的正面、反面、中性根据《How Net》词典匹配。
本发明的工作原理是:
一种APP软件用户评论一致性判断方法,包括:
提取APP软件特征情感词对集,用于对用户评论信息中的非结构化数据进行相应的数据处理并提取APP软件特征情感词对集;
判断用户评论信息与APP软件信息的一致性,用于判断用户评论信息中APP软件特征情感词对集中的特征是否与当前APP软件信息特征一致;
判断用户评论信息与评分星级的一致性,用于判断用户评论信息中用户对APP软件特征的情感倾向程度综合评分是否与用户对APP软件所给的评分星级一致。
本发明使用ICTCLAS 2015作为数据处理的工具,进行用户评论信息的分词及词性标注;基于扈中凯等人对特征词、情感词同时提取的方法,本发明对特征词、副词、情感词进行同时提取,即提取APP软件特征情感词对集F。
所述U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1,相似度计算使用的是朱征宇等人提出的改进《知网》的词汇语义相似度计算方法,计算公式如下:
Sim(W1,W2)=max(Sim(C1i,C2j))
其中:i=1,2,...,n,j=1,2,...,m,Sim(W1,W2)为词汇W1与W2之间的相似度值,Sim(C1i,C2j)为概念C1i与C2j之间的概念相似度值。
APP软件用户评论是一种典型的网络评论,用户往往会使用许多网络情感词语。目前,词典不能识别这部分网络情感词,但这些词语又能表达用户对APP软件一个或多个特征的态度,从而对APP软件用户评论一致性的判断造成影响。因此,本发明建立了自定义网络情感词语库,如:TMD/n_newword、狗屎/n_newword、神器/n_newword、牛逼/n_newword等,并对这部分情感词进行权重极性的定义。这类词语大多表现为用户对APP软件的一个或多个特征持非常强烈的态度。
本发明基于《How Net》词典的程度语料库,将林钦和等人的6种类别程度副词中极性参数相同的类别进行合并,最终分为5种不同极性参数的类别,如表1所示。
表1程度副词分类及极性参数表
对于否定副词的处理,本发明首先设置否定副词的极性参数为-0.5,由于否定副词和程度副词共现语序情况可分为两种:1)程度副词在否定副词之前,是对否定副词所否定程度的确定,否定程度是逐渐递增的,例如:“画面不好”和“画面很不好”;2)否定副词在程度副词之前,是对某个程度的否定,作用是把原来的程度降低,例如:“画面不非常好”和“画面相对好”,这两个例句表达的情感倾向程度大体相同。这种情况根据尹洪波等人提出的在语义上能够相互推衍的,基于以上规则,根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x);根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x)。
所述将综合评分F(O)划分成对应的5个等级的划分过程:由上述过程可以计算出综合评分F(O)的取值范围是[-1.6,+1.6],因为从表2中可以看出极性参数的最大值是1.6,正面、反面情感词的极性分别为+1、-1,且本专利中的否定副词极性参数为-0.5。所以5星中最大取值为1.6*1=1.6;4星的最大取值为1,最小值为-1*(-0.5)=0.5,即5星的取值区间为(1,1.6],4星的取值区间为[0.5,1]。用户综合评分划分区间如表2所示。
表2用户综合评分划分区间
本发明的有益效果是:
(1)本发明定义并提取APP软件特征情感词对集,有助于更准确的判断用户评论信息与评分星级的一致性;
(2)本发明将用户对APP软件的情感倾向程度划分成与评分星级对应的5个等级,以判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件;
(3)本发明通过判断APP软件用户评论的一致性,有助于用户评价APP软件的质量。
附图说明
图1是本发明的流程图。
具体实施方式
实施例1:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
实施例2:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
实施例3:如图1所示,一种APP软件用户评论一致性判断方法,首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致。
实施例4:如图1所示,
APP软件用户评论如表3所示,
表3
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)(x=1,2,...,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,如“下载”、“画面”等;Wa为修饰特征Wh的情感词,表达了用户对APP软件特征的主观感受,如“麻烦”、“流畅”等;Wd为修饰情感词Wa的副词,表达了用户对特征情感的程度,如“很”、“非常”等。
本发明使用ICTCLAS 2015作为数据处理的工具,进行用户评论信息的分词及词性标注;基于扈中凯等人对特征词、情感词同时提取的方法,本发明对特征词、副词、情感词进行同时提取,即提取APP软件特征情感词对集F。本实施例中对用户评论信息分词之后为:“呵呵/o交换机/n”,提取特征情感词对集:F={f1}。
Step2、设置x=1;
f1=(交换机/n,null,null)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为“交换机”,执行步骤Step5;
Step5、判断Wh是否属于集合U:本实施例中Wh不属于该APP软件信息特征集合U={QQ/n,软件/n,帮助/vn,彩铃/n,超过/v,充/v,触/v,传输/vn,创新/vi,打造/v,电脑/n,动态/n,反馈/v,方便/v,分享/v,服务/vn,感动/v,个性/n,功能/n,沟通/v,购/vg,过程/n,好友/n,互联网/n,话费/n,获知/v,进入/v,空间/n,联系/v,聊天/vi,留住/v,满足/v,名片/n,气泡/n,全民/n,热线/n,人/n,设置/v,生活/vn,时间/n,使用/v,视频/n,收发/v,收款/vn,手机/n,体验/vn,停/vi,通话/vi,文件/n,问题/n,无限/vi,相见/vi,想念/v,消息/n,需/v,选/v,一应俱全/v,移动/vn,用户/n,游戏/n,娱乐/vn,语音/n,遇到/v,支付/v,中心/n,主题/n,转账/vn,装扮/v},因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.05;由于amax<α,阈值α=0.1,因此,将f1的情感倾向程度得分F(1)赋值为0,x=2,执行Step3:2>1,执行执行Step6;
Step6、判断是否存在F(x)!=0:本实施例中不存在F(x)!=0,因此输出“APP软件用户评论不一致”。
实施例5:如图1所示,APP软件用户评论如表4所示,
表4
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中特征情感词对集:F={f1,f2},f1=(null,null,(好/a用/v)),f2=(迅雷/nz,null,好/a);
Step2、设置x=1;
f1=(null,null,(好/a用/v))。
Step3、判断x是否小于或等于u:本实施例中1<=2,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好用”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为空,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)(其中,情感词的正面、反面、中性根据《How Net》词典匹配,从而确定F(a)的取值)计算出F(1)的评分:F(1)=1*1*1=1,x=2,执行Step3:2<=2,执行步骤Step4;
判断fx中的Wh是否为空:本实施例f2中Wh为“迅雷”,判断Wh是否属于集合U:本实施例中Wh不属于该APP软件信息特征集合U={百度/nz,视频/n,想/v,看/v,有/v,观看/v,离线/vn,视频/n,享受/v,片/n,APP/n,够/v,电影/n,播/v,剧/n,动漫/vn,节目/n,应有尽有/v,搜索/vn,个性化/vn,推荐/vn能/v,找到/v,装/v,采用/v,独有/v,移动/vn,云/n,播放/v,内核/n,技术/n,播放/v,加载/v,速度/n},因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.08;由于amax<α,阈值α=0.1,因此,将f2的情感倾向程度得分F(2)赋值为0,x=3,执行Step3:3>2,执行执行Step7;
Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=1,根据公式计算出综合评分F(O)=1/1=1,最后根据表2得出量化后的评分星级为4星,但用户给出的评分星级是5星。因此,输出“APP软件用户评论不一致”。
实施例6:如图1所示,APP软件用户评论如表5所示,
表5
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中对用户评论信息分词之后为:“TMD/n_newword不/d好/a!/wt”,提取特征情感词对集:F={f1},f1=(null,不/d,(TMD/n_newword好/a))。
Step2、设置x=1;
f1=(null,不/d,(TMD/n_newword好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“TMD/n_newword好”,属于自定义网络情感词,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算出F(1)的评分:F(1)=1*(-1.6)=-1.6,x=2,执行Step3:2>1,执行步骤Step6;
Step6、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.6,根据公式计算出综合评分F(O)=-1.6/1=-1.6;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是1星。因此,输出“APP软件用户评论一致”。
实施例7:如图1所示,APP软件用户评论如表6所示,
表6
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中对用户评论信息分词之后为:“SB/n_newword软件/n”,提取特征情感词对集:F={f1},f1=(软件/n,null,SB/n_newword))。
Step2、设置x=1;
f1=(软件/n,null,SB/n_newword)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为“软件”,执行步骤Step5;
Step5、判断Wh是否属于集合U:本实施例Wh为“软件”属于U,执行步骤Step6;
Step6、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“SB”,属于自定义网络情感词,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算出F(1)的评分:F(1)=1*(-1.6)=-1.6,x=2,执行Step3:2>1,执行步骤Step7;
Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.6,根据公式计算出综合评分F(O)=-1.6/1=-1.6;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是1星。因此,输出“APP软件用户评论一致”。
实施例8:如图1所示,APP软件用户评论如表7所示,
表7
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中特征情感词对集:F={f1},f1=(安/v,很/d,慢/a);
Step2、设置x=1;
f1=(安/v,很/d,慢/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为“安”,执行步骤Step5;
Step5、判断Wh是否属于集合U:本实施例Wh为“安”不属于U,因此,根据公式:Sim(W1,W2)=max(Sim(C1i,C2j))计算出Wh与U中每个特征词的相似度a,最后得出相似度a中的最大值amax=0.6;由于amax>α,阈值α=0.1,执行步骤Step6;
Step6、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“慢”,不属于自定义网络情感词,执行Step7;
Step7、判断Wd是否为空:本实施例中Wd为“很”,执行步骤Step8;
Step8、判断fx是否含否定副词:本实施例中不含否定副词如,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算出F(1)的评分:F(1)=-1*1.4=-1.4,x=2,执行Step3:2>1,执行步骤Step9;
Step9、判断是否存在F(x)!=0:本实施例中存在F(1)=-1.4,根据公式计算出综合评分F(O)=-1.4/1=-1.4;最后根据表2得出量化后的评分星级为1星,用户给出的评分星级是4星。因此,输出“APP软件用户评论不一致”。
实施例9:如图1所示,APP软件用户评论如表8所示,
表8
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取的特征情感词对集:F={f1},f1=(null,null,好/a);
Step2、设置x=1;
f1=(null,null,好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为空,则与《How Net》词典匹配,并根据并根据公式F(x)=F(a)*F(d)*F(n)计算出F(1)的评分:F(1)=1*1*1=1,i=2,执行Step3:2>1,执行步骤Step7;
Step7、判断是否存在F(x)!=0:本实施例中存在F(1)=1,根据公式计算出综合评分F(O)=1/1=1;最后根据表2得出量化后的评分星级为4星,用户给出的评分星级是4星。因此,输出“APP软件用户评论一致”。
实施例10:如图1所示,APP软件用户评论如表9所示,
表9
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取特征情感词对集:F={f1},f1=(null,(不/d太/d),好/a);
Step2、设置x=1;
f1=(null,(不/d太/d),好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为“不太”,执行Step7;
Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
Step8、判断fx是否含程度副词:本实施例中含有程度副词“太”,执行Step9;
Step9、判断fx是否属于DNP形式:本实施例不属于DNP形式,则根据公式F(x)=0.6*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(1):F(1)=0.6*1.4*1=0.84,x=2,执行Step3:2>1,执行步骤Step10;
Step10、判断是否存在F(x)!=0:本实施例中存在F(1)=0.84,根据公式计算出综合评分F(O)=0.84/1=0.84;最后根据表2得出量化后的评分星级为4星,用户给出的评分星级是5星。因此,输出“APP软件用户评论不一致”。
实施例11:如图1所示,APP软件用户评论如表10所示,
表10
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取特征情感词对集:F={f1},f1=(null,(有点/d不/d),好/a);
Step2、设置x=1;
f1=(null,(有点/d不/d),好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为“有点不”,执行Step7;
Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
Step8、判断fx是否含程度副词:本实施例中含有程度副词“有点”,执行Step9;
Step9、判断fx是否属于DNP形式:本实施例属于DNP形式,则根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(1):F(1)=(-0.5)*0.8*1=-0.4,x=2,执行Step3:2>1,执行步骤Step10;
Step10、判断是否存在F(x)!=0:本实施例中存在F(x)=-0.4,根据公式计算出综合评分F(O)=-0.4/1=-0.4;最后根据表2得出量化后的评分星级为2星,用户给出的评分星级是1星。因此,输出“APP软件用户评论不一致”。
实施例12:如图1所示,APP软件用户评论如表11所示,
表11
所述APP软件用户评论一致性判断方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx}:
本实施例中提取特征情感词对集:F={f1},f1=(null,不/d,好/a);
Step2、设置x=1;
f1=(null,不/d,好/a)。
Step3、判断x是否小于或等于u:本实施例中1<=1,执行步骤Step4;
Step4、判断fx中的Wh是否为空:本实施例Wh为空,执行步骤Step5;
Step5、判断fx中的Wa是否为自定义网络情感词:本实施例中Wa为“好”,不属于自定义网络情感词,执行Step6;
Step6、判断Wd是否为空:本实施例中Wd为“不”,执行Step7;
Step7、判断fx是否含否定副词:本实施例中含否定副词“不”,执行Step8;
Step8、判断fx是否含程度副词:本实施例中不含程度副词,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算出F(1)的评分:F(1)=(-0.5)*1=-0.5,x=2,执行Step3:2>1,执行步骤Step9;
Step9、判断是否存在F(x)!=0:本实施例中存在F(1)=-0.5,根据公式计算出综合评分F(O)=-0.5/1=-0.5;最后根据表2得出量化后的评分星级为2星,用户给出的评分星级是4星。因此,输出“APP软件用户评论不一致”。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (3)
1.一种APP软件用户评论一致性判断方法,其特征在于:
首先提取APP软件特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一致;
所述方法的具体步骤如下:
Step1、提取APP软件特征情感词对集F={f1,f2,...,fx};其中fx=(Wh,Wd,Wa)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词, x=1,2,...,u;
Step2、设置x=1;
Step3、判断x是否小于或等于u:如果是,则执行步骤Step4;否则,执行步骤Step11;
Step4、判断fx中的Wh是否为空:如果是,则执行步骤Step6;否则,执行步骤Step5;
Step5、判断Wh是否属于集合U:如果是,则执行步骤Step6;否则,计算Wh与集合U中每个词或词组的相似度a:如果amax>=α,则执行步骤Step6,否则,将fx的情感倾向程度得分F(x)赋值为0,x++,执行Step3;
Step6、判断fx中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词库匹配,并根据公式F(x)=F(d)*F(z)计算F(x),x++,执行Step3;否则,执行Step7;
Step7、判断Wd是否为空:如果是,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)*F(n)计算F(x),x++,执行Step3;否则,执行Step8;
Step8、判断fx是否含否定副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=F(a)*F(d)计算F(x),x++,执行Step3;否则,执行Step9;
Step9、判断fx是否含程度副词:如果不含,则与《How Net》词典匹配,并根据公式F(x)=-0.5*F(a)计算F(x),x++,执行Step3;否则,执行Step10;
Step10、判断fx是否属于DNP形式:如果不属于,则与《How Net》词典匹配,并根据公式F(x)=0.6*F(d)*F(a)计算否定副词在程度副词之前的情感倾向程度得分F(x),x++,执行Step3;否则,根据公式F(x)=-0.5*F(d)*F(a)计算程度副词在否定副词之前的情感倾向程度得分F(x),x++,执行Step3;
Step11、判断是否存在F(x)!=0:
如果存在F(x)!=0,则根据公式计算出用户对该APP软件每条评论的综合评分F(O),再根据用户给APP软件所打的5个评分星级将综合评分F(O)划分成对应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出“APP软件用户评论一致”,否则输出“APP软件用户评论不一致”;
如果不存在F(x)!=0,则输出“APP软件用户评论不一致”;
式中,U表示APP软件信息中特征集合,amax表示相似度a的最大值,α表示阈值且α=0.1;F(x)表示用户评论中对第x个特征评论的情感倾向程度得分,t表示APP软件特征情感词对集F中F(x)!=0的个数;F(d)为程度副词的极性参数:若存在程度副词,F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1;F(n)为否定副词的极性参数:若存在否定副词,F(n)取值为-0.5,若不存在否定副词,F(n)取值为1;F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a)取值为-1,如果情感词为中性,F(a)的取值为0.1;F(z)表示自定义网络情感词语库中情感词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1.6,如果自定义网络情感词语库中情感词为反面,F(z)取值为-1.6。
2.根据权利要求1所述的APP软件用户评论一致性判断方法,其特征在于:所述程度副词极性参数类别分别五类:第一类,F(d)取值为1.6;第二类,F(d)取值为1.4;第三类,F(d)取值为1.2;第四类,F(d)取值为0.8;第五类,F(d)取值为0.6。
3.根据权利要求1所述的APP软件用户评论一致性判断方法,其特征在于:所述5个评分星级对应的F(O)取值区间:5星,取值区间为(1,1.6];4星,取值区间为[0.5,1];3星,取值区间为(-0.5,0.5);2星,取值区间为[-1,-0.5];1星,取值区间为[-1.6,-1)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510673488.9A CN105279148B (zh) | 2015-10-19 | 2015-10-19 | 一种app软件用户评论一致性判断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510673488.9A CN105279148B (zh) | 2015-10-19 | 2015-10-19 | 一种app软件用户评论一致性判断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105279148A CN105279148A (zh) | 2016-01-27 |
CN105279148B true CN105279148B (zh) | 2018-05-11 |
Family
ID=55148177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510673488.9A Active CN105279148B (zh) | 2015-10-19 | 2015-10-19 | 一种app软件用户评论一致性判断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105279148B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180021A (zh) * | 2016-03-09 | 2017-09-19 | 北京京东尚科信息技术有限公司 | 一种数据处理方法、系统及其服务器 |
CN106204103B (zh) * | 2016-06-24 | 2018-08-10 | 有米科技股份有限公司 | 一种移动广告平台寻找相似用户的方法 |
CN106296282A (zh) * | 2016-08-08 | 2017-01-04 | 南京大学 | 一种基于用户评论和历史评分的网购产品评估方法 |
CN107993126B (zh) * | 2017-11-30 | 2021-08-03 | 武汉理工大学 | 一种基于挖掘评论修正用户评分的改进协同过滤方法 |
CN108920512B (zh) * | 2018-05-31 | 2021-12-28 | 江苏一乙生态农业科技有限公司 | 一种基于游戏软件场景的推荐方法 |
CN109918708B (zh) * | 2019-01-21 | 2022-07-26 | 昆明理工大学 | 一种基于异质集成学习的材料性能预测模型构建方法 |
CN110659828B (zh) * | 2019-09-23 | 2022-03-08 | 上海海事大学 | 一种基于评论数据的软件特征评价方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101782898A (zh) * | 2010-03-25 | 2010-07-21 | 中国科学院计算技术研究所 | 一种情感词倾向性的分析方法 |
CN103440235A (zh) * | 2013-08-20 | 2013-12-11 | 中国科学院自动化研究所 | 一种基于认知结构模型的文本情感类型识别方法及装置 |
CN104331451A (zh) * | 2014-10-30 | 2015-02-04 | 南京大学 | 一种基于主题的网络用户评论的推荐度评分方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163187B (zh) * | 2010-02-21 | 2014-11-26 | 国际商业机器公司 | 文档标记方法和装置 |
-
2015
- 2015-10-19 CN CN201510673488.9A patent/CN105279148B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101782898A (zh) * | 2010-03-25 | 2010-07-21 | 中国科学院计算技术研究所 | 一种情感词倾向性的分析方法 |
CN103440235A (zh) * | 2013-08-20 | 2013-12-11 | 中国科学院自动化研究所 | 一种基于认知结构模型的文本情感类型识别方法及装置 |
CN104331451A (zh) * | 2014-10-30 | 2015-02-04 | 南京大学 | 一种基于主题的网络用户评论的推荐度评分方法 |
Non-Patent Citations (3)
Title |
---|
App store mining and analysis: MSR for app stores;Mark Harman等;《2012 9th IEEE Working Conference on Mining Software Repositories (MSR)》;20120603;第108-111页 * |
在线评论对应用软件及平台定价策略的影响;刘洋等;《系统工程学报》;20140831;第29卷(第4期);第560-570页 * |
汉语语句主题语义倾向分析方法的研究;姚天昉等;《中文信息学报》;20070930;第21卷(第5期);第73-79页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105279148A (zh) | 2016-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105279148B (zh) | 一种app软件用户评论一致性判断方法 | |
CN103365867B (zh) | 一种对用户评价进行情感分析的方法和装置 | |
CN107944911B (zh) | 一种基于文本分析的推荐系统的推荐方法 | |
CN111767403B (zh) | 一种文本分类方法和装置 | |
CN108984530A (zh) | 一种网络敏感内容的检测方法及检测系统 | |
CN103617230B (zh) | 一种基于微博的广告推荐方法及系统 | |
CN111460221B (zh) | 评论信息处理方法、装置及电子设备 | |
CN107203953A (zh) | 一种基于互联网、表情识别和语音识别的教学系统及其实现方法 | |
CN113259780B (zh) | 全息多维音视频播放进度条生成、显示和控制播放方法 | |
CN111723784B (zh) | 一种风险视频识别方法、装置和电子设备 | |
CN103970806B (zh) | 一种建立歌词感情分类模型的方法及装置 | |
CN102929860B (zh) | 一种基于上下文语境的中文分句情感极性判别方法 | |
CN106022878A (zh) | 基于社区评论情感倾向性分析的手游排行榜构建方法 | |
CN113610680A (zh) | 一种基于ai的交互式阅读材料个性化推荐方法及系统 | |
CN111597446A (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN106777040A (zh) | 一种基于情感极性感知算法的跨媒体微博舆情分析方法 | |
CN108733652A (zh) | 基于机器学习的影评情感倾向性分析的测试方法 | |
Yu et al. | Mining insights from esports game reviews with an aspect-based sentiment analysis framework | |
CN117556802B (zh) | 一种基于大语言模型的用户画像方法、装置、设备及介质 | |
CN108664842B (zh) | 一种唇动识别模型的构建方法及系统 | |
CN113617036A (zh) | 游戏中对话处理方法、装置、设备及存储介质 | |
CN108717450A (zh) | 影评情感倾向性分析算法 | |
Wang | The Impact of Animation and Film English Education Environment on Students' Psychological Health | |
CN108804416A (zh) | 基于机器学习的影评情感倾向性分析的训练方法 | |
CN115525161A (zh) | 词条获取方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |