CN109753651A - 一种针对体现用户意图的app软件用户评论挖掘方法 - Google Patents
一种针对体现用户意图的app软件用户评论挖掘方法 Download PDFInfo
- Publication number
- CN109753651A CN109753651A CN201811531666.4A CN201811531666A CN109753651A CN 109753651 A CN109753651 A CN 109753651A CN 201811531666 A CN201811531666 A CN 201811531666A CN 109753651 A CN109753651 A CN 109753651A
- Authority
- CN
- China
- Prior art keywords
- seed
- comment
- word
- speech
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000011156 evaluation Methods 0.000 claims abstract description 38
- 238000005065 mining Methods 0.000 claims abstract description 17
- 230000000694 effects Effects 0.000 claims abstract description 15
- 239000000284 extract Substances 0.000 claims description 44
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 230000008451 emotion Effects 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000009412 basement excavation Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 241000070183 Scirpus cyperinus Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种针对体现用户意图的APP软件用户评论挖掘方法,属于APP软件用户意图分析领域。本发明首先定义评价对象和评价观点的抽取规则,在抽取用户评论的评价对象和评价观点的基础上初始化评论种子,应用评论种子挖掘与之相同或相似的体现相同用户意图类别的用户评论;然后通过能愿动词、软件简介和情感分析挖掘出与评论种子匹配失败的用户评论中的体现用户意图的用户评论,并构建候选评论模式库;最后,针对每次循环挖掘过程中构建的候选评论模式库抽取具有代表性的新评论种子,用于下一次的循环挖掘,实现体现用户意图的用户评论的循环挖掘,直到体现用户意图的用户评论的挖掘效果收敛。
Description
技术领域
本发明涉及一种针对体现用户意图的APP软件用户评论挖掘方法,属于APP软件用户意图分析领域。
背景技术
随着智能终端的广泛应用,APP软件发展迅速。APP软件的特点是开发周期短,更新速度快,同类别产品竞争激烈。在日益激烈的市场竞争中,用户驱动的软件演化更具有实际意义。APP软件的在线用户评论凭借覆盖用户广泛、内容丰富、时效性强等优势,成为软件的用户意图获取的重要资源。例如,Grano等人为了根据软件维护和进化类别对用户评论进行分类,将用户意图主要划分为信息给予、信息搜索、特征请求和问题发现这4个类别;Guzman等人将APP软件用户评论划分为缺陷报告、功能优点、功能缺点、用户请求、表扬、抱怨和使用场景这7个类别;崔建苓等人基于用户评论对潜在软件需求类型分类汇总,如改进需求(待改进特征)、新增需求(建议意见)和缺陷修改需求(系统异常)。基于APP软件的用户评论挖掘可以帮助获取有价值的用户意图信息,分析用户在使用软件的过程中的使用感受及用户所关注的软件特征,并帮助软件开发者站在用户的视角有目的的维护和改进软件,最终辅助软件开发者提高软件产品的竞争力。如何针对用户评论数据规模大、更新快等特点,准确高效地获取有建设性的APP软件用户意图,充分挖掘软件用户评论中的有价值的信息是当前亟需解决的问题。
发明内容
针对现有技术存在的不足,本发明提供了一种针对体现用户意图的APP软件用户评论挖掘方法。
本发明的技术方案是:一种针对体现用户意图的APP软件用户评论挖掘方法,所述方法的具体步骤如下:Step1、初始化数据:评论种子库中有s个评论种子seed,评论库中有c条分词后的用户评论comment,time=1,m=1;其中,time表示循环次数,m表示参与循环挖掘的第m条用户评论,seed=<seed1,…,seedi,…,seeds>,1≤i≤s;seedi=<seed_wordi1+…+seed_wordij+…+seed_wordip,seed_speechi1+…+seed_speechij+…+seed_speechip,weighti1+…+weightij+…+weightip,seed_disi,seed_intention_typei>,1≤j≤p,seed_wordij代表评论种子seedi中的第j个词,seed_speechij代表评论种子seedi中第j个词的词性,weightij代表评论种子seedi中的第j个词或其词性对应的权重,使用公式(1)计算weightij,p代表评论种子seedi中划分的词/词性的数量,seed_disi为评论种子seedi的距离,其值为评价对象和评价观点之间可扩展的最大距离和p之和,seed_intention_typei表示评论种子seedi体现的用户意图类别,用户意图被分为如下3类:软件满足的需求,软件存在的问题,软件未达到的期望;式(1)中,numObjectOpinion代表该评论种子的评价对象和评价观点的总个数,评价对象就是观点持有者表达情感的目标实体,通常由一个或多个单词组成,评价观点指的是能够表达用户自身观点的带有情感倾向的词语,是判定用户对评价对象情感的根本依据;Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:如果是,则取出一条未与评论种子匹配成功的用户评论commentm,抽取commentm的评论模式modem,接着执行Step3;否则,执行Step7;其中,评论模式modem=<mode_wordm1+…+mode_wordmn+…+mode_wordmq,mode_speechm1+…+mode_speechmn+…+mode_speechmq,mode_weightm1+…+mode_weightmn+…+mode_weightmq,mode_intention_typem>,1≤n≤q;mode_wordmn代表用户评论commentm中的第n个词,mode_speechmn代表用户评论commentm中第n个词的词性,mode_weightmn代表用户评论commentm中第n个词或其词性对应的权重,使用公式(1)计算mode_weightmn,q代表用户评论commentm中划分的词/词性的数量,mode_intention_typem代表用户评论commentm体现的用户意图类别,此时未对评论commentm进行用户意图类别判断,其值为unknown;Step3、应用评论种子判断commentm是否体现用户意图:判断用户评论commentm是否与评论种子seedg匹配:如果是,mode_intention_typem=seed_intention_typei,则执行Step6;否则,执行Step4;其中,1≤g≤s;Step4、应用能愿动词判断commentm是否体现用户意图:Step4.1、判断用户评论commentm是否包含能愿动词:如果是,则执行Step4.2;否则,执行Step5;Step4.2、mode_intention_typem=软件未达到的期望,执行Step4.3;Step4.3、modem进入候选评论模式库,执行Step6;Step5、应用软件简介和情感分析判断commentm是否体现用户意图:Step5.1、提取commentm对应的APP软件appNamem的APP软件简介中的名词和动词系列的相关词作为软件特征词,构建软件特征词集合F={f1,…,fx,…,fy}(1≤x≤y),执行Step5.2;Step5.2、判断commentm是否包含特征词fx:如果包含,则执行Step5.3;否则,执行Step5.6;Step5.3、抽取commentm的评价观点opinionm,计算opinionm的情感值sentiment_valuem,执行Step5.4;Step5.4、判断sentiment_valuem是否大于或等于0:如果是,则mode_intention_typem=软件满足的需求,commentm体现用户意图,执行Step5.5;否则,则mode_intention_typem=软件存在的问题,commentm体现用户意图,执行Step5.5;Step5.5、modem进入候选评论模式库,执行Step6;Step5.6、mode_intention_typem=null,commentm不体现用户意图,执行Step6;Step6、给出commentm判断结果:<commentm,mode_intention_typem>,m++,执行Step2;Step7、应用候选评论模式抽取新评论种子,执行Step8;Step8、判断体现用户意图的用户评论挖掘效果是否收敛:
针对第time次循环,计算新评论种子seedi'中的评价对象和评价观点的词及词性组合与已有评论种子seedi中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_simi'i,统计组合文本相似度大于等于0.1的新评论种子数numNewSeedtime',当numNewSeedtime'与该次循环产生新评论种子总数numNewSeedtime相同时,体现用户意图的用户评论挖掘效果收敛,体现用户意图的用户评论挖掘结束;否则,体现用户意图的用户评论挖掘效果未收敛,进行下一次循环挖掘,time++,m=1,执行Step2;其中,i'指代新评论种子的标号。
所述Step3的具体步骤如下:
Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:如果是,则提取一个未与commentm匹配过的评论种子seedi,执行Step3.3;否则,执行Step3.8;Step3.3、将commentm的词“mode_wordm1+…+mode_wordmn+…+mode_wordmq”与seedi的词“seed_wordi1+…+seed_wordij+…+seed_wordip”进行匹配,计算commentm与seedi的词匹配值word_matchmi:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seedi的全部词匹配标记word_flagij为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:如果是,则执行Step3.3.3;否则,执行Step3.3.6;Step3.3.3、初始化n=MAX{0,pos_word中最大值}+1,MAX表示计算集合中元素的最大值,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:如果是,则执行Step3.3.5;否则,j++,执行Step3.3.2;Step3.3.5、判断seed_wordij是否和mode_wordmn相同:如果是,则记录位置n到pos_word中,word_flagij为1,j++,执行Step3.3.2;否则,n++,执行Step3.3.4;Step3.3.6、使用公式(2)计算词匹配值word_matchmi:执行Step3.4;Step3.4、将commentm的词性“mode_speechm1+…+mode_speechmn+…+mode_speechmq”与seedi的词性“seed_speechi1+…+seed_speechij+…+seed_speechip”进行匹配,计算commentm与seedi的词性匹配值speech_matchmi:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seedi的全部词性匹配标记speech_flagij为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:如果是,则执行Step3.4.3;否则,执行Step3.4.6;Step3.4.3、初始化n=MAX{1,pos_word中第一个值,pos_speech中最大值+1},执行Step3.4.4;Step3.4.4、判断n是否小于等与q:如果是,则执行Step3.4.5;否则,j++,执行Step3.4.2;Step3.4.5、判断seed_speechij是否和mode_speechmn相同:如果是,则记录位置n到pos_speech中,speech_flagij为1,j++,执行Step3.4.2;否则,n++,执行Step3.4.4;Step3.4.6、使用公式(3)计算词性匹配值speech_matchmi:执行Step3.5;Step3.5、计算commentm与seedi的综合匹配值both_matchmi:Step3.5.1、使用公式(4)计算commentm和seedi匹配成功的词之间的最大距离dis_wordmi:dis_wordmi=MAX{pos_word}-MIN{pos_word}(4);式(4)中,MIN表示计算集合中元素的最小值;执行Step3.5.2;Step3.5.2、使用公式(5)计算commentm和seedi匹配成功的词性之间的最大距离dis_speechmi:dis_speechmi=MAX{pos_speech}-MIN{pos_speech}(5);执行Step3.5.3;Step3.5.3、使用公式(6)计算commentm和seedi的综合匹配值both_matchmi:
执行Step3.6;Step3.6、判断both_matchmi是否等于1:如果是,则mode_intention_typem=seed_intention_typei,commentm与seedi匹配成功,执行Step6;否则,执行Step3.7;Step3.7、i++,执行Step3.2;Step3.8、用户评论commentm需要与所有评论种子依次进行匹配,最后抽取其与第g个评论种子的最大综合匹配值both_matchmg判断是否匹配成功,抽取最大综合匹配值如公式(7)所示:both_matchmg=MAX{both_matchm1,…,both_matchmg,…,both_matchms}(1≤g≤s)(7),执行Step3.9;Step3.9、判断both_matchmg是否大于0.5:如果是,则mode_intention_typem=seed_intention_typei,commentm与seedg匹配成功,执行Step6;否则,commentm与评论种子匹配失败,执行Step4。
所述Step7的具体步骤如下:
Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:如果是,则执行Step7.4;否则,执行Step7.2;Step7.2、抽取一条未计算文本相似度的评论模式modem,执行Step7.3;Step7.3、使用公式(8)计算modem与该用户意图类别中所有其他评论模式modem'的词文本相似度modeWord_simmm':modeWord_simmm'=1-dis_wordmm'/max(len_wordm,len_wordm')(8)其中,modeWord_simmm'表示modem和modem'的词文本相似度,dis_wordmm'表示modem和modem'的词组合之间的距离,len_wordm和len_wordm'分别为两个词组合中字符的长度;使用公式(9)计算modem和modem'词性文本相似度modeSpeech_simmm':modeSpeech_simmm'=1-dis_speechmm'/max(len_speechm,len_speechm')(9)其中,modeSpeech_simmm'表示modem和modem'的词性文本相似度,dis_speechmm'表示modem和modem'的词性组合之间的距离,len_speechm和len_speechm'分别为两个词性组合中字符的长度;使用公式(10)计算modem和modem'的综合文本相似度modeBoth_simmm':modeBoth_simmm'=0.5*modeWord_simmm'+0.5*modeSpeech_simmm'(10)使用公式(11)计算modem和modem'的词文本相似度之和sum_modeWord_simm:sum_modeWord_simm=SUM{modeWord_simmm'}(m'!=m)(11)式(11)中,SUM表示计算集合中元素之和;执行Step7.1;Step7.4、得到至多3个分别代表不同用户意图类别的词文本相似度之和最大的评论模式:modemaxk(1≤k≤3);抽取modemaxk的评论种子seedmaxk,seedmaxk={seed_wordmaxk1+…+seed_wordmaxkj+…+seed_wordmaxkp,seed_speechmaxk1+…+seed_speechmaxkj+…+seed_speechmaxkp,weightmaxk1+…+weightmaxkj+…+weight maxkp,newseed_dismaxk,seed_intention_typemaxk};其中,newseed_dismaxk为评论模式modemaxk中词性为名词n、动词v、否定副词d和形容词a的词的数量,seed_intention_typemaxk为评论commentnewk体现的用户意图类别,执行Step7.5;Step7.5、更新seedmaxk距离属性:Step7.5.1、判断seedmaxk中不为空的评论种子的距离是否全部完成更新:如果是,则执行Step7.5.6;否则,执行Step7.5.2;Step7.5.2、抽取一个不为空的距离未完成更新的评论种子seedmaxk,选取与评论种子seedmaxk的评论模式modemaxk的综合文本相似度大于0.35的所有评论模式modemaxk',执行Step7.5.3;Step7.5.3、计算全部评论模式modemaxk'的关键词距离dismaxk':其中,关键词为评论模式中词性为名词n、动词v、否定副词d和形容词a的词,关键词距离指的是评论模式中词性为名词n、动词v、否定副词d和形容词a的词的数量;执行Step7.5.4;Step7.5.4、使用公式(12)获取与modemaxk综合文本相似度大于0.35的所有评论模式modemaxk'的dismaxk'中的最大值new_seed_dismaxk:new_seed_dismaxk=MAX{disnewk'}(12)执行Step7.5.5;Step7.5.5、判断new_seed_dismaxk是否大于seedmaxk的距离:如果是,则将seedmaxk的距离更新为new_seed_dismaxk,执行Step7.5.1;否则,执行Step7.5.1;Step7.5.6、将seedmaxk中不为空的评论种子更新至评论种子库。
本发明的有益效果是:
(1)本发明定义评价对象和评价观点的抽取规则、评论模式和和评论种子,将用户评论与评论种子进行匹配,有助于从大量的APP软件用户评论中挖掘出体现用户意图的评论;(2)本发明通过能愿动词、软件简介和情感分析,从与评论种子匹配失败的评论中挖掘体现不同用户意图类别的用户评论,并构建候选评论模式库;(3)本发明通过基于候选评论模式库抽取新的评论种子,有助于进一步挖掘体现用户意图的用户评论。综上,本发明助于从大量的APP软件用户评论中挖掘出体现用户意图的用户评论;有助于获取APP软件用户评论中体现不同用户意图类别的信息;有助于分析APP软件的用户使用情况。
附图说明
图1是本发明的流程图;
图2是图1中步骤Step3的具体流程图;
图3是图2中步骤Step3.3计算词匹配值word_matchmi的具体流程图;
图4是图2中步骤Step3.4计算词性匹配值speech_matchmi的具体流程图;
图5是图1中步骤Step4的具体流程图;
图6是图1中步骤Step5的具体流程图;
图7图1中步骤Step7的具体流程图;
图8图7中步骤Step7.5的具体流程图。
具体实施方式
实施例1:如图1-8所示,一种针对体现用户意图的APP软件用户评论挖掘方法,首先定义评价对象和评价观点的抽取规则,在抽取用户评论的评价对象和评价观点的基础上初始化评论种子,应用评论种子挖掘与之相同或相似的体现相同用户意图类别的用户评论;然后通过能愿动词、软件简介和情感分析挖掘出与评论种子匹配失败的用户评论中的体现用户意图的用户评论,并构建候选评论模式库;最后,针对每次循环挖掘过程中构建的候选评论模式库抽取具有代表性的新评论种子,用于下一次的循环挖掘,实现体现用户意图的用户评论的循环挖掘,直到体现用户意图的用户评论的挖掘效果收敛。
进一步地,可以设置所述方法的具体步骤如下:
Step1、初始化数据:评论种子库中有s个评论种子seed,评论库中有c条分词后的用户评论comment,time=1,m=1;
其中,time表示循环次数,m表示参与循环挖掘的第m条用户评论,seed=<seed1,…,seedi,…,seeds>,1≤i≤s;seedi=<seed_wordi1+…+seed_wordij+…+seed_wordip,seed_speechi1+…+seed_speechij+…+seed_speechip,weighti1+…+weightij+…+weightip,seed_disi,seed_intention_typei>,1≤j≤p,seed_wordij代表评论种子seedi中的第j个词,seed_speechij代表评论种子seedi中第j个词的词性,weightij代表评论种子seedi中的第j个词或其词性对应的权重,使用公式(1)计算weightij,p代表评论种子seedi中划分的词/词性的数量,seed_disi为评论种子seedi的距离,其值为评价对象和评价观点之间可扩展的最大距离和p之和,seed_intention_typei表示评论种子seedi体现的用户意图类别,用户意图被分为如下3类:软件满足的需求,软件存在的问题,软件未达到的期望;
(1)软件满足的需求:描述了用户在实际使用软件的过程中,软件的某些特征或软件整体使用户具有较好的使用体验。(2)软件存在的问题:描述了用户在实际使用软件的过程中,软件存在的问题,例如崩溃、错误或性能问题。(3)软件未达到的期望:表达了用户希望达到的功能(例如其他同类别软件提供的功能),分享如何通过添加或更改特性来改进未来版本软件的想法。
式(1)中,numObjectOpinion代表该评论种子的评价对象和评价观点的总个数,评价对象就是观点持有者表达情感的目标实体,通常由一个或多个单词组成,评价观点指的是能够表达用户自身观点的带有情感倾向的词语,是判定用户对评价对象情感的根本依据;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:如果是,则取出一条未与评论种子匹配成功的用户评论commentm,抽取commentm的评论模式modem,接着执行Step3;否则,执行Step7;其中,评论模式modem=<mode_wordm1+…+mode_wordmn+…+mode_wordmq,mode_speechm1+…+mode_speechmn+…+mode_speechmq,mode_weightm1+…+mode_weightmn+…+mode_weightmq,mode_intention_typem>,1≤n≤q;mode_wordmn代表用户评论commentm中的第n个词,mode_speechmn代表用户评论commentm中第n个词的词性,mode_weightmn代表用户评论commentm中第n个词或其词性对应的权重,使用公式(1)计算mode_weightmn,q代表用户评论commentm中划分的词/词性的数量,mode_intention_typem代表用户评论commentm体现的用户意图类别,此时未对评论commentm进行用户意图类别判断,其值为unknown;
Step3、应用评论种子判断commentm是否体现用户意图:判断用户评论commentm是否与评论种子seedg匹配:如果是,mode_intention_typem=seed_intention_typei,则执行Step6;否则,执行Step4;其中,1≤g≤s;
Step4、应用能愿动词判断commentm是否体现用户意图:
Step4.1、判断用户评论commentm是否包含能愿动词:如果是,则执行Step4.2;否则,执行Step5;
其中,本发明专利使用的用于判断用户评论是否体现用户意图的能愿动词如下:“应该、应当、须得、必得、乐意、愿、愿意、情愿、想、想要、要、要想、希望、企图、好意思、乐得、高兴、乐于、敢于、勇于、甘于、苦于、懒得、便于、有助于、难于、易于、善于、适于、宜于”。
Step4.2、mode_intention_typem=软件未达到的期望,执行Step4.3;
Step4.3、modem进入候选评论模式库,执行Step6;
Step5、应用软件简介和情感分析判断commentm是否体现用户意图:
Step5.1、提取commentm对应的APP软件appNamem的APP软件简介中的名词和动词系列的相关词作为软件特征词,构建软件特征词集合F={f1,…,fx,…,fy}(1≤x≤y),执行Step5.2;
Step5.2、判断commentm是否包含特征词fx:如果包含,则执行Step5.3;否则,执行Step5.6;
Step5.3、抽取commentm的评价观点opinionm,计算opinionm的情感值sentiment_valuem,执行Step5.4;
Step5.4、判断sentiment_valuem是否大于或等于0:如果是,则mode_intention_typem=软件满足的需求,commentm体现用户意图,执行Step5.5;否则,则mode_intention_typem=软件存在的问题,commentm体现用户意图,执行Step5.5;
Step5.5、modem进入候选评论模式库,执行Step6;
Step5.6、mode_intention_typem=null,commentm不体现用户意图,执行Step6;
Step6、给出commentm判断结果:<commentm,mode_intention_typem>,m++,执行Step2;
Step7、应用候选评论模式抽取新评论种子,执行Step8;
Step8、判断体现用户意图的用户评论挖掘效果是否收敛:
针对第time次循环,计算新评论种子seedi'中的评价对象和评价观点的词及词性组合与已有评论种子seedi中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_simi'i,统计组合文本相似度大于等于0.1的新评论种子数numNewSeedtime',当numNewSeedtime'与该次循环产生新评论种子总数numNewSeedtime相同时,体现用户意图的用户评论挖掘效果收敛,体现用户意图的用户评论挖掘结束;否则,体现用户意图的用户评论挖掘效果未收敛,进行下一次循环挖掘,time++,m=1,执行Step2;其中,i'指代新评论种子的标号。
实施例2:如图1-8所示,一种针对体现用户意图的APP软件用户评论挖掘方法,具体步骤如下:
Step1、初始化数据:评论种子库中有1个(s=1)评论种子seed,评论库中有6条(c=6)分词后的用户评论comment,time=1,m=1;其中用户评论如表1所示:
表1 APP软件用户评论表
在评论种子库中初始化一条评论种子seed1:seed1=<不错+软件,a+n,0.5+0.5,5,软件满足的需求>;初始化评论种子时,评价对象和评价观点抽取规则如下:评价对象就是观点持有者表达情感的目标实体,通常由一个或多个单词组成。主要针对名词、动词、及其组合形式建立评价对象词性组合规则以抽取评价对象,抽取规则如表2所示:
表2评价对象抽取规则
其中,v表示动词、vi表示不及物动词、vn表示动名词、a表示形容词、n表示名词。
评价观点指的是能够表达用户自身观点的带有情感倾向的词语,是判定用户对评价对象情感的根本依据。针对形容词、动词、否定副词及其组合形式建立评价观点词性规则以抽取评价观点,抽取规则如表3所示:
表3评价观点抽取规则
其中,an表示名形词,al表示形容词性惯用语、vg动词性语素、ag形容词性语素、ng名词性语素、y表示语气词。
表3涉及否定副词的概念,本发明专利使用的否定副词如下:“不、非、匪、弗、否、靡、蔑、莫、末、蒯、微、未、无、毋、勿、别、没、休、白、空、徒、枉”。针对评价对象和评价观点定义了不同的词性组合的优先级,在使用不同抽取规则进行评价对象和评价观点的抽取过程中,通过优先级体现词性组合的优先程度,优先级越高,词性组合的优先程度越高。
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:1<6,取出一条与未与评论种子匹配成功的用户评论comment1,抽取comment1的评论模式mode1=<非常+不错+软件,d+a+n,0.0+0.5+0.5,unknown>,执行Step3;Step3、应用评论种子判断comment1是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1=1,提取一个未与comment1匹配过的评论种子seed1,执行Step3.3;Step3.3、将comment1的词“mode_word11+mode_word12+mode_word13”与seed1的词“seed_word11+seed_word12”进行匹配,计算comment1与seed1的词匹配值word_match11:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed1的全部词匹配标记word_flag1j(1<=j<=2)为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<3,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word11:“非常”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<3,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word12:“不错”相同,记录位置2到pos_word中,word_flag11为1,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2=2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,2}+1=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3=3,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word13:“软件”相同,记录位置3到pos_word中,word_flag12为1,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3>2,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match11:word_match11=word_flag11*weight11+word_flag12*weight12=1*0.5+1*0.5=1执行Step3.4;Step3.4、将comment1的词性“mode_speech11+mode_speech12+mode_speech13”与seed1的词性“seed_speech11+seed_speech12”进行匹配,计算comment1与seed1的词性匹配值speech_match11:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed1的全部词性匹配标记speech_flag1j(1<=j<=2)为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<2,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,2,1}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<3,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech12:“a”相同,记录位置2到pos_speech中,speech_flag11为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2=2,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,2,3}=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3=3,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech13:“n”相同,记录位置3到pos_speech中,speech_flag12为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3>2,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match11:speech_match11=speech_flag11*weight11+speech_flag12*weight12=1*0.5+1*0.5=1;执行Step3.5;Step3.5、计算comment1与seed1的综合匹配值both_match11:Step3.5.1、使用公式(4)计算comment1和seed1匹配成功的词之间的最大距离dis_word11:dis_word11=MAX{2,3}-MIN{2,3}=3-2=1;执行Step3.5.2;Step3.5.2、使用公式(5)计算comment1和seed1匹配成功的词性之间的最大距离dis_speech11:dis_speech11=MAX{2,3}-MIN{2,3}=3-2=1;执行Step3.5.3;Step3.5.3、使用公式(6)计算comment1和seed1的综合匹配值both_match11:both_match11=0.5*1+0.5*1=1;执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match11=1,mode_intention_type1=软件满足的需求,comment1与seed1匹配成功,执行Step6;Step6、给出comment1判断结果:<comment1,软件满足的需求>,m=2,执行Step2;第1条评论判断完毕,m=2,从第2条评论开始执行,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:2<6,取出一条与未与评论种子匹配成功的用户评论comment2,抽取comment2的评论模式mode2=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,unknown>,执行Step3;Step3、应用评论种子判断comment2是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1=1,提取一个未与comment2匹配过的评论种子seed1,执行Step3.3;Step3.3、将comment2的词“mode_word21+mode_word22+mode_word23+mode_word24”与与seed1的词“seed_word11+seed_word12”进行匹配,计算comment2与seed1的词匹配值word_match21:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed1的全部词匹配标记word_flag1j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word21:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word22:“能”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word23:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4=4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word24:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5>4,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2=2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<4,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word21:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<4,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word22:“能”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<4,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word23:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4=4,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word24:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5>4,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3>2,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match21:word_match21=word_flag11*weight11+word_flag12*weight12=0*0.5+0*0.5=0;执行Step3.4;Step3.4、将comment2的词性“mode_speech21+mode_speech22+mode_speech23+mode_speech24”与seed1的词性“seed_speech11+seed_speech12”进行匹配,计算comment2与seed1的词性匹配值speech_match21:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed1的全部词性匹配标记speech_flag1j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech21:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech22:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech23:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4=4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech24:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5>4,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2=2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<4,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech21:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<4,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech22:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<4,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech23:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4=4,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech24:“n”相同,记录位置4到pos_speech中,speech_flag12为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3>2,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match21:speech_match21=speech_flag11*weight11+speech_flag12*weight12=0*0.5+1*0.5=0.5;执行Step3.5;Step3.5、计算comment2与seed1的综合匹配值both_match21:Step3.5.1、使用公式(4)计算comment2和seed1匹配成功的词之间的最大距离dis_word21:dis_word21=MAX{}-MIN{}=0;执行Step3.5.2;Step3.5.2、使用公式(5)计算comment2和seed1匹配成功的词性之间的最大距离dis_speech21:dis_speech21=MAX{4}-MIN{4}=4-4=0;执行Step3.5.3;Step3.5.3、使用公式(6)计算comment2和seed1的综合匹配值both_match21:both_match21=0.5*0+0.5*0.5=0.25;执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match21=0.25;执行Step3.7;Step3.7、i=2;执行Step3.2;Step3.2、判断i是否小于等于s:2>1;执行Step3.8;Step3.8、用户评论comment2与所有评论种子依次进行匹配,使用公式(7)获取comment2与seedg的最大综合匹配值both_match2g:both_match21=MAX{0.25}=0.25(g=1),执行Step3.9;Step3.9、判断both_match2g是否大于0.5:0.25<0.5,comment2与评论种子匹配失败,执行Step4;Step4、应用能愿动词判断comment2是否体现用户意图:Step4.1、判断用户评论comment2是否包含能愿动词:用户评论comment2包含能愿动词“希望”,执行Step4.2;Step4.2、mode_intention_type2=软件未达到的期望,执行Step4.3;Step4.3、mode2进入候选评论模式库,执行Step6;Step6、给出comment2判断结果:<comment2,软件未达到的期望>,m=3,执行Step2;第2条评论判断完毕,m=3,从第3条评论开始执行,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:3<6,取出一条与未与评论种子匹配成功的用户评论comment3,抽取comment3的评论模式mode3=<希望+添加+抢+红包+功能,v+v+v+n+n,0.25+0.25+0.0+0.25+0.25,unknown>,执行Step3;Step3、应用评论种子判断comment3是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1=1,提取一个未与comment3匹配过的评论种子seed1,执行Step3.3;Step3.3、将comment3的词“mode_word31+mode_word32+mode_word33+mode_word34+mode_word35”与与seed1的词“seed_word11+seed_word12”进行匹配,计算comment3与seed1的词匹配值word_match31:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed1的全部词匹配标记word_flag1j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2=2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3>2,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match31:word_match31=word_flag11*weight11+word_flag12*weight12=0*0.5+0*0.5=0,执行Step3.4;Step3.4、将comment3的词性“mode_speech31+mode_speech32+mode_speech33+mode_speech34+mode_speech35”与seed1的词性“seed_speech11+seed_speech12”进行匹配,计算comment3与seed1的词性匹配值speech_match31:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed1的全部词性匹配标记speech_flag1j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech31:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech34:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech35:“n”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2=2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech31:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech34:“n”相同,记录位置4到pos_speech中,speech_flag12为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3>2,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match31:speech_match31=speech_flag11*weight11+speech_flag12*weight12=0*0.5+1*0.5=0.5,执行Step3.5;Step3.5、计算comment3与seed1的综合匹配值both_match31:Step3.5.1、使用公式(4)计算comment3和seed1匹配成功的词之间的最大距离dis_word31:dis_word31=MAX{}-MIN{}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment3和seed1匹配成功的词性之间的最大距离dis_speech31:dis_speech31=MAX{4}-MIN{4}=4-4=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment3和seed1的综合匹配值both_match31:both_match31=0.5*0+0.5*0.5=0.25,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match31=0.25,执行Step3.7;Step3.7、i=2,执行Step3.2;Step3.2、判断i是否小于等于s:2>1,执行Step3.8;Step3.8、用户评论comment3与所有评论种子依次进行匹配,使用公式(7)获取comment3与seedg的最大综合匹配值both_match3g:both_match31=MAX{0.25}=0.25(g=1),执行Step3.9;Step3.9、判断both_match3g是否大于0.5:0.25<0.5,comment3与评论种子匹配失败,执行Step4;Step4、应用能愿动词判断comment3是否体现用户意图:Step4.1、判断用户评论comment3是否包含能愿动词:用户评论comment3包含能愿动词“希望”,执行Step4.2;Step4.2、mode_intention_type3=软件未达到的期望,执行Step4.3;Step4.3、mode3进入候选评论模式库,执行Step6;Step6、给出comment3判断结果:<comment3,软件未达到的期望>,m=4,执行Step2;第3条评论判断完毕,m=4,从第4条评论开始执行,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:4<6,取出一条与未与评论种子匹配成功的用户评论comment4,抽取comment4的评论模式mode4=<期待+表情+符号+能+更新,v+n+n+v+v,0+0.25+0.25+0.25+0.25,unknown>,执行Step3;Step3、应用评论种子判断comment4是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1=1,提取一个未与comment4匹配过的评论种子seed1,执行Step3.3;Step3.3、将comment4的词“mode_word41+mode_word42+mode_word43+mode_word44+mode_word45”与与seed1的词“seed_word11+seed_word12”进行匹配,计算comment4与seed1的词匹配值word_match41:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed1的全部词匹配标记word_flag1j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2=2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3>2,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match41:word_match41=word_flag11*weight11+word_flag12*weight12=0*0.5+0*0.5=0,执行Step3.4;Step3.4、将comment4的词性“mode_speech41+mode_speech42+mode_speech43+mode_speech44+mode_speech45”与seed1的词性“seed_speech11+seed_speech12”进行匹配,计算comment4与seed1的词性匹配值speech_match41:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed1的全部词性匹配标记speech_flag1j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech41:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech44:“v”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech45:“v”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2=2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech41:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech12:“n”和mode_speech42:“n”相同,记录位置2到pos_speech中,speech_flag12为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3>2,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match41:speech_match41=speech_flag11*weight11+speech_flag12*weight12=0*0.5+1*0.5=0.5,执行Step3.5;Step3.5、计算comment4与seed1的综合匹配值both_match41:Step3.5.1、使用公式(4)计算comment4和seed1匹配成功的词之间的最大距离dis_word41:dis_word41=MAX{}-MIN{}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment4和seed1匹配成功的词性之间的最大距离dis_speech41:dis_speech41=MAX{2}-MIN{2}=2-2=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment4和seed1的综合匹配值both_match41:both_match41=0.5*0+0.5*0.5=0.25,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match41=0.25,执行Step3.7;Step3.7、i=2,执行Step3.2;Step3.2、判断i是否小于等于s:2>1,执行Step3.8;Step3.8、用户评论comment4与所有评论种子依次进行匹配,使用公式(7)获取comment4与seedg的最大综合匹配值both_match4g:both_match41=MAX{0.25}=0.25(g=1),执行Step3.9;Step3.9、判断both_match4g是否大于0.5:0.25<0.5,comment4与评论种子匹配失败,执行Step4;Step4、应用能愿动词判断comment4是否体现用户意图:Step4.1、判断用户评论comment4是否包含能愿动词:用户评论comment4包含能愿动词“期待”,执行Step4.2;Step4.2、mode_intention_type4=软件未达到的期望,执行Step4.3;Step4.3、mode4进入候选评论模式库,执行Step6;Step6、给出comment4判断结果:<comment4,软件未达到的期望>,m=5,执行Step2;第4条评论判断完毕,m=5,从第5条评论开始执行,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:5<6,取出一条与未与评论种子匹配成功的用户评论comment5,抽取comment5的评论模式mode5=<服务+非常+好,v+d+a,0.5+0.0+0.5,unknown>,执行Step3;Step3、应用评论种子判断comment5是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1=1,提取一个未与comment5匹配过的评论种子seed1,执行Step3.3;Step3.3、将comment5的词“mode_word51+mode_word52+mode_word53”与与seed1的词“seed_word11+seed_word12”进行匹配,计算comment5与seed1的词匹配值word_match51:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed1的全部词匹配标记word_flag1j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<3,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word51:“服务”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<3,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word52:“非常”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3=3,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word53:“好”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4>3,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2=2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<3,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word51:“服务”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<3,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word52:“非常”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3=3,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word53:“好”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4>3,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3>2,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match51:word_match51=word_flag11*weight11+word_flag12*weight12=0*0.5+0*0.5=0,执行Step3.4;Step3.4、将comment5的词性“mode_speech51+mode_speech52+mode_speech53”与seed1的词性“seed_speech11+seed_speech12”进行匹配,计算comment5与seed1的词性匹配值speech_match51:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed1的全部词性匹配标记speech_flag1j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<3,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech51:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<3,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech52:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<3,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech53:“a”相同,记录位置3到pos_speech中,speech_flag11为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2=2,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,4}=4,执行Step3.4.4;Step3.4.4、判断n是否小于等于q:4>3,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3>2,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match51:speech_match51=speech_flag11*weight11+speech_flag12*weight12=1*0.5+0*0.5=0.5,执行Step3.5;Step3.5、计算comment5与seed1的综合匹配值both_match51:Step3.5.1、使用公式(4)计算comment5和seed1匹配成功的词之间的最大距离dis_word51:dis_word51=MAX{}-MIN{}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment5和seed1匹配成功的词性之间的最大距离dis_speech51:dis_speech51=MAX{3}-MIN{3}=2-2=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment5和seed1的综合匹配值both_match51:both_match51=0.5*0+0.5*0.5=0.25,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match51=0.25,执行Step3.7;Step3.7、i=2,执行Step3.2;Step3.2、判断i是否小于等于s:2>1,执行Step3.8;Step3.8、用户评论comment5与所有评论种子依次进行匹配,使用公式(7)获取comment5与seedg的最大综合匹配值both_match5g:both_match51=MAX{0.25}=0.25(g=1),执行Step3.9;Step3.9、判断both_match5g是否大于0.5:0.25<0.5,comment5与评论种子匹配失败,执行Step4;Step4、应用能愿动词判断comment5是否体现用户意图:Step4.1、判断用户评论comment5是否包含能愿动词:用户评论comment5不包含能愿动词,执行Step5;Step5、应用软件简介和情感分析判断comment5是否体现用户意图:Step5.1、提取提取提取comment5对应的APP软件“中华万年历”的APP软件简介“中华万年历,让时光充满乐趣!功能全,体积小;速度快,口碑好;免费提供云服务,无限空间用到老。超过2亿华人的共同选择,全球用户数量领先的跨平台日历APP!”中的名词和动词系列的相关词作为软件特征词,构建软件特征词集合F={中华,万年历,让,时光,充满,乐趣,功能,体积,速度,口碑,免费,提供,云,服务,空间,到,超过,华人,选择,全球,用户,数量,领先,跨,平台,日历},执行Step5.2;Step5.2、判断comment5是否包含特征词fx:comment5包含特征词“服务”,执行Step5.3;Step5.3、抽取comment5的评价观点opinion5:“好/a”,计算opinion5的情感值sentiment_value5=0.88,执行Step5.4;Step5.4、判断sentiment_value5是否大于或等于0:0.88>0,mode_intention_type5=软件满足的需求,comment5体现用户意图,执行Step5.5;Step5.5、mode5进入候选评论模式库,执行Step6;Step6、给出comment5判断结果:<comment5,软件满足的需求>,m=6,执行Step2;第5条评论判断完毕,m=6,从第6条评论开始执行,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:6=6,取出一条与未与评论种子匹配成功的用户评论comment6,抽取comment6的评论模式mode6=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,unknown>,执行Step3;Step3、应用评论种子判断comment6是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1=1,提取一个未与comment6匹配过的评论种子seed1,执行Step3.3;Step3.3、将comment6的词“mode_word61+mode_word62+mode_word63+mode_word64”与与seed1的词“seed_word11+seed_word12”进行匹配,计算comment6与seed1的词匹配值word_match61:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed1的全部词匹配标记word_flag1j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word61:“这个”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word62:“应用”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word63:“太”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4=4,执行Step3.3.5;Step3.3.5、seed_word11:“不错”和mode_word64:“差”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5>4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2=2,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<4,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word61:“这个”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<4,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word62:“应用”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<4,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word63:“太”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4=4,j=3,执行Step3.3.5;Step3.3.5、seed_word12:“软件”和mode_word64:“差”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5>4,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3>2,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match61:word_match61=word_flag11*weight11+word_flag12*weight12=0*0.5+0*0.5=0,执行Step3.4;Step3.4、将comment6的词性“mode_speech61+mode_speech62+mode_speech63+mode_speech64”与seed1的词性“seed_speech11+seed_speech12”进行匹配,计算comment6与seed1的词性匹配值speech_match61:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed1的全部词性匹配标记speech_flag1j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<2,则执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech61:“rz”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech62:“vn”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech63:“vn”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4=4,执行Step3.4.5;Step3.4.5、seed_speech11:“a”和mode_speech64:“a”相同,记录位置4到pos_speech中,speech_flag11为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2=2,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,5}=5,执行Step3.4.4;Step3.4.4、判断n是否小于等于q:5>4,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3>2,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match61:speech_match61=speech_flag11*weight11+speech_flag12*weight12=1*0.5+0*0.5=0.5,执行Step3.5;Step3.5、计算comment6与seed1的综合匹配值both_match61:Step3.5.1、使用公式(4)计算comment6和seed1匹配成功的词之间的最大距离dis_word61:dis_word51=MAX{}-MIN{}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment6和seed1匹配成功的词性之间的最大距离dis_speech61:dis_speech61=MAX{4}-MIN{4}=4-4=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment6和seed1的综合匹配值both_match61:both_match61=0.5*0+0.5*0.5=0.25,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match61=0.25,执行Step3.7;Step3.6、i=2,执行Step3.2;Step3.2、判断i是否小于等于s:2>1,执行Step3.8;Step3.8、用户评论comment6与所有评论种子依次进行匹配,使用公式(7)获取comment6与seedg的最大综合匹配值both_match6g:both_match61=MAX{0.25}=0.25(g=1),执行Step3.9;Step3.9、判断both_match6g是否大于0.5:0.25<0.5,comment6与评论种子匹配失败,执行Step4;Step4、应用能愿动词判断comment6是否体现用户意图:Step4.1、判断用户评论comment6是否包含能愿动词:用户评论comment6不包含能愿动词,执行Step5;Step5、应用软件简介和情感分析判断comment6是否体现用户意图:Step5.1、提取提取comment6对应的APP软件“4399游戏盒”的APP软件简介“手机游戏,尽在4399游戏盒!4399游戏盒是4399官方权威打造的一款精品手机游戏平台,集游戏推荐、攻略、礼包、论坛、社交于一体。具有用户免费体验、好友互动交流、游戏圈讨论求助、展示个人风采等诸多特点,您可随时随地一键安装,十万海量游戏经由资深玩家强力推荐、精彩的游戏视频解说、高玩的游戏攻略评测,人气爆棚的游戏社区,让玩家畅游其中,百玩不厌!更新内容:1.技术哥哥优化好,应用启动快不少2.预约游戏领礼包,还能抢鲜下载玩3.小视频专区上线,搞笑视频刷不停4.游戏详情看直播,已支持更多游戏5.搞事报上线,到广场看盒子大事件6.游戏详情展示更新日期与提供商”中的名词和动词系列的相关词作为软件特征词,构建软件特征词集合F={盒,官方,权威,打造,精品,手机,平台,集,论坛,社交,一体,具有,用户,免费,体验,好友,互动,交流,讨论,求助,个人,风采,特点,可,键,安装,海量,强力,推荐,解说,攻,评测,人气,爆,棚,社区,让,畅游,厌/,内容,技术,哥哥,优化,应用,启动,预约,领,礼,包,能,抢,下载,玩,专区,笑,视频,停,直播,支持,游戏,搞,事,报,线,到,广场,看,盒子,事件,游戏,详情,展示,更新,日期,提供,商},执行Step5.2;Step5.2、判断comment6是否包含特征词fx:comment6包含特征词“应用”,执行Step5.3;Step5.3、抽取comment6的评价观点opinion6:“差/a”,计算opinion6的情感值sentiment_value6=-0.88,执行Step5.4;Step5.4、判断sentiment_value6是否大于或等于0:-0.88<0,mode_intention_type6=软件存在的问题,comment6体现用户意图,执行Step5.5;Step5.5、mode6进入候选评论模式库,执行Step6;Step6、给出comment6判断结果:<comment6,软件存在的问题>,m=7,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:7>6,执行Step7;此时,候选候选评论模式有以下5条评论模式:
mode2=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,软件未达到的期望>
mode3=<希望+添加+抢+红包+功能,v+v+v+n+n,0.25+0.25+0.0+0.25+0.25,软件未达到的期望>
mode4=<期待+表情+符号+能+更新,v+n+n+v+v,0+0.25+0.25+0.25+0.25,软件未达到的期望>
mode5=<服务+非常+好,v+d+a,0.5+0.0+0.5,软件满足的需求>;
mode6=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,软件存在的问题>;
Step7、应用候选评论模式抽取新评论种子:Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:候选评论模式库中所有评论模式文本相似度是没有计算完毕,执行Step7.2;Step7.2、抽取一条未计算文本相似度的评论模式mode2,执行Step7.3;Step7.3、使用公式(8)计算mode2与该用户意图类别中所有其他评论模式mode2'的词文本相似度modeWord_sim22':modeWord_sim23=0.56;modeWord_sim24=0.10;使用公式(9)计算mode2和mode2'词性文本相似度modeSpeech_sim22':modeSpeech_sim23=0.78;modeSpeech_sim24=0.50;使用公式(10)计算mode2和mode2'的综合文本相似度modeBoth_sim22':modeBoth_sim23=0.5*0.56+0.78*1=0.67;modeBoth_sim24=0.5*0.1+0.5*0.50=0.30;使用公式(11)计算mode2和mode2'的词文本相似度之和sum_modeWord_sim2:sum_modeWord_sim2=SUM{modeWord_sim23,modeWord_sim24}=SUM{0.56,0.10}=0.66,执行Step7.1;Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:候选评论模式库中所有评论模式文本相似度是没有计算完毕,执行Step7.2;Step7.2、抽取一条未计算文本相似度的评论模式mode3,执行Step7.3;Step7.3、使用公式(8)计算mode3与该用户意图类别中所有其他评论模式mode3'的词文本相似度modeWord_sim33':modeWord_sim32=0.56;modeWord_sim34=0.00;使用公式(9)计算mode3和mode3'词性文本相似度modeSpeech_sim33':modeSpeech_sim32=0.78;modeSpeech_sim34=0.50;使用公式(10)计算mode3和mode3'的综合文本相似度modeBoth_sim33':modeBoth_sim32=0.5*0.56+0.5*0.78=0.67;modeBoth_sim34=0.5*0.00+0.5*0.50=0.25;使用公式(11)计算mode3和mode3'的词文本相似度之和sum_modeWord_sim3:sum_modeWord_sim3=SUM{modeWord_sim32,modeWord_sim34}=SUM{0.56,0.00}=0.56,执行Step7.1;Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:候选评论模式库中所有评论模式文本相似度是没有计算完毕,执行Step7.2;Step7.2、抽取一条未计算文本相似度的评论模式mode4,执行Step7.3;Step7.3、使用公式(8)计算mode4与该用户意图类别中所有其他评论模式mode4'的词文本相似度modeWord_sim44':modeWord_sim42=0.10;modeWord_sim43=0.00;使用公式(9)计算mode4和mode4'词性文本相似度modeSpeech_sim44':modeSpeech_sim42=0.50;modeSpeech_sim43=0.50;使用公式(10)计算mode4和mode4'的综合文本相似度modeBoth_sim44':modeBoth_sim42=0.5*0.10+0.5*0.50=0.30;modeBoth_sim43=0.5*0.00+0.5*0.50=0.25;使用公式(11)计算mode4和mode4'的词文本相似度之和sum_modeWord_sim4:sum_modeWord_sim4=SUM{modeWord_sim42,modeWord_sim43}=SUM{0.10,0.00}=0.10,执行Step7.1;Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:候选评论模式库中所有评论模式文本相似度是没有计算完毕,执行Step7.2;Step7.2、抽取一条未计算文本相似度的评论模式mode5,执行Step7.3;Step7.3、由于该用户意图类别中只有一条评论模式,所以mode5与该用户意图类别中所有其他评论模式mode5'的词文本相似度modeWord_sim55'=0;词性文本相似度modeSpeech_sim55'=0;综合文本相似度modeBoth_sim55'=0;词文本相似度之和sum_modeWord_sim5=0;执行Step7.1;Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:候选评论模式库中所有评论模式文本相似度是没有计算完毕,执行Step7.2;Step7.2、抽取一条未计算文本相似度的评论模式mode6,执行Step7.3;Step7.3、由于该用户意图类别中只有一条评论模式,所以mode6与该用户意图类别中所有其他评论模式mode6'的词文本相似度modeWord_sim66'=0;词性文本相似度modeSpeech_sim66'=0;综合文本相似度modeBoth_sim66'=0;词文本相似度之和sum_modeWord_sim6=0;执行Step7.1;Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:候选评论模式库中所有评论模式文本相似度是计算完毕,执行Step7.4;Step7.4、得到至多3个分别代表不同用户意图类别的词文本相似度之和最大的评论模式:modemax1=mode2=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,软件未达到的期望>;modemax2=mode5=<服务+非常+好,v+d+a,0.5+0.0+0.5,软件满足的需求>;modemax3=mode6=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,软件存在的问题>;抽取modemax1的评论种子seedmax1=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,4,软件未达到的期望>;抽取modemax2的评论种子seedmax2=<服务+非常+好,v+d+a,0.5+0.0+0.5,3,软件满足的需求>;抽取modemax3的评论种子seedmax3=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,3,软件存在的问题>;执行Step7.5;Step7.5、更新seedmaxk距离属性:Step7.5.1、判断seedmaxk中不为空的评论种子的距离是否全部完成更新:seedmaxk中不为空的评论种子的距离没有全部完成更新,执行Step7.5.2;Step7.5.2、抽取一个不为空的距离未完成更新的评论种子seedmax1,选取与评论种子seedmax1的评论模式modemax1的综合文本相似度大于0.35的所有评论模式:mode3=<希望+添加+抢+红包+功能,v+v+v+n+n,0.25+0.25+0.0+0.25+0.25,软件未达到的期望>,执行Step7.5.3;Step7.5.3、计算全部评论模式modemax1'的关键词距离dismax1':mode3的关键词距离:dismax1'=5,执行Step7.5.4;Step7.5.4、使用公式(12)获取与modemax1综合文本相似度大于0.35的所有评论模式modemax1'的disnewk'dismax1'中的最大值new_seed_dismax1:new_seed_dismax1=MAX{5}=5,执行Step7.5.5;Step7.5.5、判断new_seed_dismax1是否大于seedmax1的距离:seedmax1=5>seedmax1=4,将seedmax1的距离更新为new_seed_dismax1,执行Step7.5.1;Step7.5.1、判断seedmaxk中不为空的评论种子的距离是否全部完成更新:seedmaxk中不为空的评论种子的距离没有全部完成更新,执行Step7.5.2;Step7.5.2、抽取一个不为空的距离未完成更新的评论种子seedmax2,选取与评论种子seedmax2的评论模式modemax2的综合文本相似度大于0.35的所有评论模式:null,执行Step7.5.3;Step7.5.3、计算全部评论模式modemax2'的关键词距离dismax2':null,执行Step7.5.4;Step7.5.4、使用公式(12)获取与modemax2综合文本相似度大于0.35的所有评论模式modemax2'的disnewk'dismax2'中的最大值new_seed_dismax2:new_seed_dismax2=MAX{}=null,执行Step7.5.5;Step7.5.5、判断new_seed_dismax2是否大于seedmax2的距离:new_seed_dismax2不大于seedmax2的距离,执行Step7.5.1;Step7.5.1、判断seedmaxk中不为空的评论种子的距离是否全部完成更新:seedmaxk中不为空的评论种子的距离没有全部完成更新,执行Step7.5.2;Step7.5.2、抽取一个不为空的距离未完成更新的评论种子seedmax3,选取与评论种子seedmax3的评论模式modemax3的综合文本相似度大于0.35的所有评论模式:null,执行Step7.5.3;Step7.5.3、计算全部评论模式modemax3'的关键词距离dismax3':null,执行Step7.5.4;Step7.5.4、使用公式(12)获取与modemax3综合文本相似度大于0.35的所有评论模式modemax3'的disnewk'dismax3'中的最大值new_seed_dismax3:new_seed_dismax3=MAX{}=null,执行Step7.5.5;Step7.5.5、判断new_seed_dismax3是否大于seedmax3的距离:new_seed_dismax3不大于seedmax3的距离,执行Step7.5.1;Step7.5.1、判断seedmaxk中不为空的评论种子的距离是否全部完成更新:seedmaxk中不为空的评论种子的距离全部完成更新,执行Step7.5.6;Step7.5.6、将seedmaxk中不为空的评论种子:seedmax1=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,5,软件未达到的期望>;seedmax2=<服务+非常+好,v+d+a,0.5+0.0+0.5,3,软件满足的需求>;seedmax3=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,3,软件存在的问题>;更新至评论种子库。此时,评论种子库中有4个评论种子seed:seed1=<不错+软件,a+n,0.5+0.5,5,软件满足的需求>;seed2=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,5,软件未达到的期望>;seed3=<服务+非常+好,v+d+a,0.5+0.0+0.5,3,软件满足的需求>;seed4=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,3,软件存在的问题>;执行Step8;Step8、判断体现用户意图的用户评论挖掘效果是否收敛:针对第1次循环,本实施例中根据(Levenshtein V I.Binary codes capable of correctingdele-tions,insertions,and reversals[C]//Soviet physics doklady.1966,10(8):707-710.)文献中相似度公式,计算新评论种子seed2中的评价对象和评价观点的词及词性组合与已有评论种子seed1中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_sim21=0.1;计算新评论种子seed3中的评价对象和评价观点的词及词性组合与已有评论种子seed1中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_sim31=0.1;计算新评论种子seed4中的评价对象和评价观点的词及词性组合与已有评论种子seed1中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_sim41=0.1;统计组合文本相似度大于等于0.1的新评论种子数numNewSeed1’=1,numNewSeed1’与该次循环产生新评论种子总数numNewSeed1=3不相同,体现用户意图的用户评论挖掘效果未收敛,进行下一次循环挖掘,time=2,m=1,执行Step2;
此时,用户评论库中有用户评论comment1与评论种子seed1匹配成功;
Step2、判断m是否小于等于c:1<6,取出一条与未与评论种子匹配成功的用户评论comment2,抽取comment2的评论模式mode2=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,软件未达到的期望>,执行Step3;Step3、应用评论种子判断comment2是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1<4,提取一个未与comment2匹配过的评论种子seed2,执行Step3.3;Step3.3、将comment2的词“mode_word21+mode_word22+mode_word23+mode_word24”与与seed2的词“seed_word21+seed_word22+seed_word23+seed_word24”进行匹配,计算comment2与seed2的词匹配值word_match22:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed2的全部词匹配标记word_flag2j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<4,执行Step3.3.5;Step3.3.5、seed_word21:“希望”和mode_word21:“希望”相同,记录位置1到pos_word中,word_flag21为1,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,1}+1=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<4,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word22:“能”相同,记录位置2到pos_word中,word_flag22为1,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,2}+1=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<4,执行Step3.3.5;Step3.3.5、seed_word23:“抢”和mode_word23:“抢”相同,记录位置3到pos_word中,word_flag23为1,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4=4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,3}+1=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4=4,执行Step3.3.5;Step3.3.5、seed_word24:“红包”和mode_word24:“红包”相同,记录位置4到pos_word中,word_flag24为1,j=5,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:5>4,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match22:word_match22=word_flag21*weight21+word_flag22*weight22+word_flag23*weight23+word_flag24*weight24=1*0.25+1*0.25+1*0.25+1*0.25=1,执行Step3.4;Step3.4、将comment2的词性“mode_speech21+mode_speech22+mode_speech23+mode_speech24”与seed2的词性“seed_speech21+seed_speech2 2+seed_speech23+seed_speech24”进行匹配,计算comment2与seed2的词性匹配值speech_match22:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed2的全部词性匹配标记speech_flag2j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<4,执行Step3.4.5;Step3.4.5、seed_speech21:“v”和mode_speech21:“v”相同,记录位置1到pos_speech中,speech_flag21为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<4,执行Step3.4.5;Step3.4.5、seed_speech22:“v”和mode_speech22:“v”相同,记录位置2到pos_speech中,speech_flag22为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,3}=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<4,执行Step3.4.5;Step3.4.5、seed_speech23:“v”和mode_speech23:“v”相同,记录位置3到pos_speech中,speech_flag23为1,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4=4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,4}=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4=4,执行Step3.4.5;Step3.4.5、seed_speech24:“n”和mode_speech24:“n”相同,记录位置4到pos_speech中,speech_flag24为1,j=5,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:5>4,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match22:speech_match31=speech_flag21*weight21+speech_flag22*weight22+speech_flag23*weight23+speech_flag24*weight24=1*0.25+1*0.25+1*0.25+1*0.25=1,执行Step3.5;Step3.5、计算comment2与seed2的综合匹配值both_match22:Step3.5.1、使用公式(4)计算comment2和seed2匹配成功的词之间的最大距离dis_word22:dis_word22=MAX{1,2,3,4}-MIN{1,2,3,4}=3,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment2和seed2匹配成功的词性之间的最大距离dis_speech22:dis_speech22=MAX{1,2,3,4}-MIN{1,2,3,4}=3,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment2和seed2的综合匹配值both_match22:both_match22=0.5*1+0.5*1=0.5,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match22=1,mode_intention_type2=软件未达到的期望,comment2与seed2匹配成功,执行Step6;Step6、给出comment2判断结果:<comment2,软件未达到的期望>,m=3,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:3<6,取出一条与未与评论种子匹配成功的用户评论comment3,抽取comment3的评论模式mode3=<希望+添加+抢+红包+功能,v+v+v+n+n,0.25+0.25+0.0+0.25+0.25,软件未达到的期望>,执行Step3;Step3、应用评论种子判断comment3是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1<4,提取一个未与comment3匹配过的评论种子seed2,执行Step3.3;Step3.3、将comment3的词“mode_word31+mode_word32+mode_word33+mode_word34+mode_word35”与seed2的词“seed_word21+seed_word22+seed_word23+seed_word24”进行匹配,计算comment3与seed2的词匹配值word_match32:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed2的全部词匹配标记word_flag2j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word21:“希望”和mode_word31:“希望”相同,记录位置1到pos_word中,word_flag21为1,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,1}+1=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,1}+1=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word23:“抢”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word23:“抢”和mode_word33:“抢”相同,记录位置3到pos_word中,word_flag23为1,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4=4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,3}+1=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word24:“红包”和mode_word34:“红包”相同,记录位置4到pos_word中,word_flag24为1,j=5,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:5>4,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match32:word_match32=word_flag21*weight21+word_flag22*weight22+word_flag23*weight23+word_flag24*weight24=1*0.25+0*0.25+1*0.25+1*0.25=0.75,执行Step3.4;Step3.4、将comment3的词性“mode_speech31+mode_speech32+mode_speech33+mode_speech34+mode_speech35”与seed2的词性“seed_speech21+seed_speech22+seed_speech23+seed_speech24”进行匹配,计算comment3与seed2的词性匹配值speech_match32:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed2的全部词性匹配标记speech_flag2j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech21:“v”和mode_speech31:“v”相同,记录位置1到pos_speech中,speech_flag21为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech22:“v”和mode_speech32:“v”相同,记录位置2到pos_speech中,speech_flag22为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,3}=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech23:“v”和mode_speech33:“v”相同,记录位置3到pos_speech中,speech_flag23为1,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4=4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,4}=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech24:“n”和mode_speech34:“n”相同,记录位置4到pos_speech中,speech_flag24为1,j=5,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:5>4,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match32:speech_match32=speech_flag21*weight21+speech_flag22*weight22+speech_flag23*weight23+speech_flag24*weight24=1*0.25+1*0.25+1*0.25+1*0.25=1,执行Step3.5;Step3.5、计算comment3与seed2的综合匹配值both_match32:Step3.5.1、使用公式(4)计算comment3和seed2匹配成功的词之间的最大距离dis_word32:dis_word32=MAX{1,3,4}-MIN{1,3,4}=3,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment3和seed2匹配成功的词性之间的最大距离dis_speech32:dis_speech32=MAX{1,2,3,4}-MIN{1,2,3,4}=3,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment3和seed2的综合匹配值both_match32:both_match32=0.5*0.75+0.5*1=0.875,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match32=0.875,执行Step3.7;Step3.7、i=3,执行Step3.2;Step3.2、判断i是否小于等于s:3<4,提取一个未与comment3匹配过的评论种子seed3,执行Step3.3;Step3.3、将comment3的词“mode_word31+mode_word32+mode_word33+mode_word34+mode_word35”与seed3的词“seed_word31+seed_word32+seed_word33”进行匹配,计算comment3与seed3的词匹配值word_match33:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed3的全部词匹配标记word_flag3j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3=3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4>3,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match33:word_match33=word_flag31*weight31+word_flag32*weight32+word_flag33*weight33=0*0.5+0*0+0*0.5=0,执行Step3.4;Step3.4、将comment3的词性“mode_speech31+mode_speech32+mode_speech33+mode_speech34+mode_speech35”与seed3的词性“seed_speech31+seed_speech32+seed_speech33”进行匹配,计算comment3与seed3的词性匹配值speech_match33:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed3的全部词性匹配标记speech_flag3j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech31:“v”和mode_speech31:“v”相同,记录位置1到pos_speech中,speech_flag31为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech34:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech35:“n”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3=3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech34:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech35:“n”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4>3,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match33:speech_match33=speech_flag31*weight31+speech_flag32*weight32+speech_flag33*weight33=1*0.5+0*0+0*0.5=0.5,执行Step3.5;Step3.5、计算comment3与seed3的综合匹配值both_match33:Step3.5.1、使用公式(4)计算comment3和seed3匹配成功的词之间的最大距离dis_word33:dis_word33=MAX{}-MIN{}=0执行Step3.5.2;Step3.5.2、使用公式(5)计算comment3和seed3匹配成功的词性之间的最大距离dis_speech33:dis_speech33=MAX{1}-MIN{1}=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment3和seed3的综合匹配值both_match33:both_match33=0.5*0+0.5*0.5=0.25,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match33=0.25,执行Step3.7;Step3.7、i=4,执行Step3.2;Step3.2、判断i是否小于等于s:4=4,提取一个未与comment3匹配过的评论种子seed4,执行Step3.3;Step3.3、将comment3的词“mode_word31+mode_word32+mode_word33+mode_word34+mode_word35”与seed4的词“seed_word41+seed_word42+seed_word43+seed_word44”进行匹配,计算comment3与seed4的词匹配值word_match34:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed3的全部词匹配标记word_flag4j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4=4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word31:“希望”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word32:“添加”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word33:“抢”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word34:“红包”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word35:“功能”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=5,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:5>4,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match34:word_match34=word_flag41*weight41+word_flag42*weight42+word_flag43*weight43+word_flag44*weight44=0*0+0*0.5+0*0+0*0.5=0,执行Step3.4;Step3.4、将comment3的词性“mode_speech31+mode_speech32+mode_speech33+mode_speech34+mode_speech35”与seed4的词性“seed_speech41+seed_speech42+seed_speech43+seed_speech44”进行匹配,计算comment3与seed4的词性匹配值speech_match34:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed4的全部词性匹配标记speech_flag4j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech31:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech34:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech35:“n”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech31:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech34:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech35:“n”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech31:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech34:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech35:“n”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4=4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech31:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech32:“v”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech33:“v”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech34:“n”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech35:“n”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=5,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:5>4,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match34:speech_match34=speech_flag41*weight41+speech_flag42*weight42+speech_flag43*weight43+speech_flag44*weight44=0*0+0*0.5+0*0+0*0.5=0,执行Step3.5;Step3.5、计算comment3与seed4的综合匹配值both_match34:Step3.5.1、使用公式(4)计算comment3和seed4匹配成功的词之间的最大距离dis_word34:dis_word34=MAX{}-MIN{}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment3和seed4匹配成功的词性之间的最大距离dis_speech34:dis_speech34=MAX{}-MIN{}=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment3和seed4的综合匹配值both_match34:both_match34=0.5*0+0.5*0=0,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match34=0,执行Step3.7;Step3.7、i=5,执行Step3.2;Step3.2、判断i是否小于等于s:5>4,执行Step3.8;Step3.8、用户评论comment3与所有评论种子依次进行匹配,使用公式(7)获取comment3与seedg的最大综合匹配值both_matchmg:both_match32=MAX{both_match32,both_match33,both_match34}=MAX{0.875,0.25,0}=0.875(g=2),执行Step3.9;Step3.9、判断both_matchmg是否大于0.5:0.875>0.5,则mode_intention_type3=seed_intention_type2,comment3与seed2匹配成功,执行Step6;Step6、给出comment3判断结果:<comment3,软件未达到的期望>,m=4,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:4<6,取出一条与未与评论种子匹配成功的用户评论comment4,抽取comment4的评论模式mode4=<期待+表情+符号+能+更新,v+n+n+v+v,0+0.25+0.25+0.25+0.25,软件未达到的期望>,执行Step3;Step3、应用评论种子判断comment4是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1=1,提取一个未与comment4匹配过的评论种子seed2,执行Step3.3;Step3.3、将comment4的词“mode_word41+mode_word42+mode_word43+mode_word44+mode_word45”与seed2的词“seed_word21+seed_word22+seed_word23+seed_word24”进行匹配,计算comment4与seed2的词匹配值word_match42:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed2的全部词匹配标记word_flag2j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word21:“希望”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word21:“希望”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word21:“希望”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word21:“希望”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word21:“希望”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word22:“能”和mode_word44:“能”相同,记录位置4到pos_word中,word_flag22为4,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,4}+1=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word23:“抢”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4=4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,4}+1=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word23:“红包”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=5,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:5>4,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match42:word_match42=word_flag21*weight21+word_flag22*weight22+word_flag23*weight23+word_flag24*weight24=0*0.25+1*0.25+0*0.25+0*0.25=0.25,执行Step3.4;Step3.4、将comment4的词性“mode_speech41+mode_speech42+mode_speech43+mode_speech44+mode_speech45”与seed2的词性“seed_speech21+seed_speech22+seed_speech23+seed_speech24”进行匹配,计算comment4与seed2的词性匹配值speech_match42:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed2的全部词性匹配标记speech_flag2j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech21:“v”和mode_speech41:“v”相同,记录位置1到pos_speech中,speech_flag21为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech22:“v”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech22:“v”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech22:“v”和mode_speech44:“v”相同,记录位置4到pos_speech中,speech_flag22为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,5}=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech23:“v”和mode_speech45:“v”相同,记录位置5到pos_speech中,speech_flag23为1,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4=4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,6}=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4=4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,6}=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=5,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:5>4,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match42:speech_match42=speech_flag21*weight21+speech_flag22*weight22+speech_flag23*weight23+speech_flag24*weight24=1*0.25+1*0.25+1*0.25+0*0.25=0.75,执行Step3.5;Step3.5、计算comment4与seed2的综合匹配值both_match42:Step3.5.1、使用公式(4)计算comment4和seed2匹配成功的词之间的最大距离dis_word42:dis_word42=MAX{2}-MIN{2}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment4和seed2匹配成功的词性之间的最大距离dis_speech42:dis_speech42=MAX{1,4,5}-MIN{1,4,5}=4,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment4和seed2的综合匹配值both_match42:both_match42=0.5*0.25+0.5*0.75=0.5,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match4=0.5,执行Step3.7;Step3.7、i=3,执行Step3.2;Step3.2、判断i是否小于等于s:3<4,提取一个未与comment4配过的评论种子seed3,执行Step3.3;Step3.3、将comment4词“mode_word41+mode_word42+mode_word43+mode_word44+mode_word45”与seed3的词“seed_word31+seed_word32+seed_word33”进行匹配,计算comment4与seed3的词匹配值word_match43:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed3的全部词匹配标记word_flag3j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3=3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4>3,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match43:word_match43=word_flag31*weight31+word_flag32*weight32+word_flag33*weight43=0*0.5+0*0+0*0.5=0,执行Step3.4;Step3.4、将comment4的词性“mode_speech41+mode_speech42+mode_speech43+mode_speech44+mode_speech45”与seed3的词性“seed_speech31+seed_speech32+seed_speech33”进行匹配,计算comment4与seed3的词性匹配值speech_match43:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed3的全部词性匹配标记speech_flag3j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech31:“v”和mode_speech41:“v”相同,记录位置1到pos_speech中,speech_flag31为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech44:“v”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech45:“v”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3=3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech44:“v”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech45:“v”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4>3,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match43:speech_match43=speech_flag31*weight31+speech_flag32*weight32+speech_flag33*weight33=1*0.5+0*0+0*0.5=0.5,执行Step3.5;Step3.5、计算comment4与seed3的综合匹配值both_match43:Step3.5.1、使用公式(4)计算comment4和seed3匹配成功的词之间的最大距离dis_word43:dis_word43=MAX{}-MIN{}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment4和seed3匹配成功的词性之间的最大距离dis_speech43:dis_speech43=MAX{1}-MIN{1}=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment4和seed3的综合匹配值both_match43:both_match43=0.5*0+0.5*0.5=0.25,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match43=0.25,执行Step3.7;Step3.7、i=4,执行Step3.2;Step3.2、判断i是否小于等于s:4=4,提取一个未与comment4匹配过的评论种子seed4,执行Step3.3;Step3.3、将comment4的词“mode_word41+mode_word42+mode_word43+mode_word44+mode_word45”与seed4的词“seed_word41+seed_word42+seed_word43+seed_word44”进行匹配,计算comment4与seed4的词匹配值word_match44:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed4的全部词匹配标记word_flag4j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word42:“应用”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word43:“太”和mode_word45:“跟新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4=4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word41:“期待”不相同,n=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word42:“表情”不相同,n=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word43:“符号”不相同,n=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4<5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word44:“能”不相同,n=5,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:5=5,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word45:“更新”不相同,n=6,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:6>5,j=5,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:5>4,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match44:word_match44=word_flag41*weight41+word_flag42*weight42+word_flag43*weight43+word_flag44*weight44=0*0+0*0.5+0*0+0*0.5=0,执行Step3.4;Step3.4、将comment4的词性“mode_speech41+mode_speech42+mode_speech43+mode_speech44+mode_speech45”与seed4的词性“seed_speech41+seed_speech42+seed_speech43+seed_speech44”进行匹配,计算comment4与seed4的词性匹配值speech_match44:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed4的全部词性匹配标记speech_flag4j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech41:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech44:“v”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech45:“v”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech41:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech44:“v”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech45:“v”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech41:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech44:“v”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech45:“v”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4=4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech41:“v”不相同,n=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech42:“n”不相同,n=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech43:“n”不相同,n=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4<5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech44:“v”不相同,n=5,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:5=5,执行Step3.4.5;Step3.4.5、seed_speech44:“a”和mode_speech45:“v”不相同,n=6,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:6>5,j=5,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:5>4,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match44:speech_match44=speech_flag41*weight41+speech_flag42*weight42+speech_flag43*weight43+speech_flag44*weight44=0*0+0*0.5+0*0+0*0.5=0,执行Step3.5;Step3.5、计算comment4与seed4的综合匹配值both_match44:Step3.5.1、使用公式(4)计算comment4和seed4匹配成功的词之间的最大距离dis_word44:dis_word44=MAX{}-MIN{}=0,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment4和seed4匹配成功的词性之间的最大距离dis_speech44:dis_speech44=MAX{}-MIN{}=0,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment4和seed4的综合匹配值both_match44:both_match44=0.5*0+0.5*0=0,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match44=0,执行Step3.7;Step3.7、i=5,执行Step3.2;Step3.2、判断i是否小于等于s:5>4,执行Step3.8;Step3.8、用户评论comment4与所有评论种子依次进行匹配,使用公式(7)获取comment4与seedg的最大综合匹配值both_match4g:both_match42=MAX{0.5}=0.5(g=2),执行Step3.9;Step3.9、判断both_match4g是否大于0.5:0.5=0.5,comment4与评论种子匹配失败,执行Step4;Step4、应用能愿动词判断comment4是否体现用户意图:Step4.1、判断用户评论comment4是否包含能愿动词:用户评论comment4包含能愿动词“期待”,执行Step4.2;Step4.2、mode_intention_type4=软件未达到的期望,执行Step4.3;Step4.3、mode4进入候选评论模式库,执行Step6;Step6、给出comment4判断结果:<comment4,软件未达到的期望>,m=5,执行Step2;第4条评论判断完毕,m=5,从第5条评论开始执行,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:5<6,取出一条与未与评论种子匹配成功的用户评论comment5,抽取comment5的评论模式mode5=<服务+非常+好,v+d+a,0.5+0.0+0.5,unknown>,执行Step3;Step3、应用评论种子判断comment5是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1<4,提取一个未与comment5匹配过的评论种子seed3,执行Step3.3;Step3.3、将comment5的词“mode_word51+mode_word52+mode_word53”与seed3的词“seed_word31+seed_word32+seed_word33”进行匹配,计算comment5与seed3的词匹配值word_match53:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed3的全部词匹配标记word_flag3j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<3,执行Step3.3.5;Step3.3.5、seed_word31:“服务”和mode_word51:“服务”相同,记录位置1到pos_word中,word_flag31为1,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,1}+1=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<3,执行Step3.3.5;Step3.3.5、seed_word32:“非常”和mode_word52:“非常”相同,记录位置2到pos_word中,word_flag32为1,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3=3,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,2}+1=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3=3,执行Step3.3.5;Step3.3.5、seed_word33:“好”和mode_word53:“好”相同,记录位置3到pos_word中,word_flag33为1,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4>3,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match53:word_match53=word_flag31*weight31+word_flag32*weight32+word_flag33*weight33=1*0.5+1*0+1*0.5=1,执行Step3.4;Step3.4、将comment5的词性“mode_speech51+mode_speech52+mode_speech53”与seed3的词性“seed_speech31+seed_speech32+seed_speech33”进行匹配,计算comment5与seed3的词性匹配值speech_match53:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed3的全部词性匹配标记speech_flag3j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<3,执行Step3.4.5;Step3.4.5、seed_speech31:“v”和mode_speech51:“v”相同,记录位置1到pos_speech中,speech_flag31为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<3,执行Step3.4.5;Step3.4.5、seed_speech32:“d”和mode_speech52:“d”相同,记录位置2到pos_speech中,speech_flag32为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3=3,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,3}=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3=3,执行Step3.4.5;Step3.4.5、seed_speech33:“a”和mode_speech53:“a”相同,记录位置3到pos_speech中,speech_flag33为1,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4>3,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match53:speech_match53=speech_flag31*weight31+speech_flag32*weight32+speech_flag33*weight33=1*0.5+1*0.25+1*0.25+1*0.25=1,执行Step3.5;Step3.5、计算comment5与seed3的综合匹配值both_match53:Step3.5.1、使用公式(4)计算comment5和seed3匹配成功的词之间的最大距离dis_word53:dis_word53=MAX{1,2,3}-MIN{1,2,3}=2,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment5和seed3匹配成功的词性之间的最大距离dis_speech53:dis_speech53=MAX{1,2,3}-MIN{1,2,3}=2,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment5和seed3的综合匹配值both_match53:both_match53=0.5*1+0.5*1=1,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match53=1,mode_intention_type5=软件满足的需求,comment5与seed3匹配成功,执行Step6;Step6、给出comment5判断结果:<comment5,软件满足的需求>,m=6,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:6=6,取出一条与未与评论种子匹配成功的用户评论comment6,抽取comment6的评论模式mode6=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,软件存在的问题>,执行Step3;Step3、应用评论种子判断comment6是否体现用户意图:Step3.1、初始化数据:i=1,执行Step3.2;Step3.2、判断i是否小于等于s:1<4,提取一个未与comment6匹配过的评论种子seed4,执行Step3.3;Step3.3、将comment6的词“mode_word61+mode_word62+mode_word63+mode_word64”与seed4的词“seed_word41+seed_word42+seed_word43+seed_word44”进行匹配,计算comment6与seed4的词匹配值word_match64:Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seed3的全部词匹配标记word_flag6j为0,j=1,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:1<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0}+1=1,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:1<4,执行Step3.3.5;Step3.3.5、seed_word41:“这个”和mode_word61:“这个”相同,记录位置1到pos_word中,word_flag41为1,j=2,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:2<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,1}+1=2,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:2<4,执行Step3.3.5;Step3.3.5、seed_word42:“软件”和mode_word62:“软件”相同,记录位置2到pos_word中,word_flag42为1,j=3,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:3<4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,2}+1=3,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:3<4,执行Step3.3.5;Step3.3.5、seed_word43:“很”和mode_word63:“很”相同,记录位置3到pos_word中,word_flag43为1,j=4,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:4=4,执行Step3.3.3;Step3.3.3、初始化n=MAX{0,3}+1=4,执行Step3.3.4;Step3.3.4、判断n是否小于等于q:4=4,执行Step3.3.5;Step3.3.5、seed_word44:“差”和mode_word64:“差”相同,记录位置4到pos_word中,word_flag44为1,j=5,执行Step3.3.2;Step3.3.2、判断j是否小于等于p:5>4,执行Step3.3.6;Step3.3.6、使用公式(2)计算词匹配值word_match64:word_match64=word_flag41*weight41+word_flag42*weight42+word_flag43*weight43+word_flag44*weight44=1*0+1*0.5+1*0+1*0.5=1,执行Step3.4;Step3.4、将comment6的词性“mode_speech61+mode_speech62+mode_speech63+mode_speech64”与seed4的词性“seed_speech41+seed_speech42+seed_speech43+seed_speech44”进行匹配,计算comment6与seed4的词性匹配值speech_match64:Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seed4的全部词性匹配标记speech_flag4j为0,j=1,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:1<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,1}=1,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:1<4,执行Step3.4.5;Step3.4.5、seed_speech41:“rz”和mode_speech61:“rz”相同,记录位置1到pos_speech中,speech_flag41为1,j=2,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:2<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,2}=2,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:2<4,执行Step3.4.5;Step3.4.5、seed_speech42:“vn”和mode_speech62:“vn”相同,记录位置2到pos_speech中,speech_flag42为1,j=3,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:3<4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,3}=3,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:3<4,执行Step3.4.5;Step3.4.5、seed_speech43:“d”和mode_speech63:“d”相同,记录位置3到pos_speech中,speech_flag43为1,j=4,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:4=4,执行Step3.4.3;Step3.4.3、初始化n=MAX{1,1,4}=4,执行Step3.4.4;Step3.4.4、判断n是否小于等与q:4=4,执行Step3.4.5;Step3.4.5、seed_speech43:“a”和mode_speech64:“a”相同,记录位置4到pos_speech中,speech_flag44为1,j=5,执行Step3.4.2;Step3.4.2、判断j是否小于等于p:5>4,执行Step3.4.6;Step3.4.6、使用公式(3)计算词性匹配值speech_match64:speech_match64=speech_flag41*weight41+speech_flag42*weight42+speech_flag43*weight43+speech_flag44*weight44=1*0+1*0.5+1*0+1*0.5=1,执行Step3.5;Step3.5、计算comment6与seed4的综合匹配值both_match64:Step3.5.1、使用公式(4)计算comment6和seed4匹配成功的词之间的最大距离dis_word64:dis_word64=MAX{1,2,3,4}-MIN{1,2,3,4}=3,执行Step3.5.2;Step3.5.2、使用公式(5)计算comment6和seed4匹配成功的词性之间的最大距离dis_speech64:dis_speech64=MAX{1,2,3,4}-MIN{1,2,3,4}=3,执行Step3.5.3;Step3.5.3、使用公式(6)计算comment6和seed4的综合匹配值both_match64:both_match64=0.5*1+0.5*1=1,执行Step3.6;Step3.6、判断both_matchmi是否等于1:both_match64=1,mode_intention_type6=软件存在的问题,comment6与seed4匹配成功,执行Step6;Step6、给出comment6判断结果:<comment6,软件存在的问题>,m=7,执行Step2;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:7>6,执行Step7;此时,候选候选评论模式只有1条评论模式:mode4=<期待+表情+符号+能+更新,v+n+n+v+v,0+0.25+0.25+0.25+0.25,软件未达到的期望>;Step7、应用候选评论模式抽取新评论种子:由于候选候选评论模式只有1条评论模式mode4,因此mode4抽取对应的评论种子seedmax1=<期待+表情+符号+能+更新,v+n+n+v+v,0+0.25+0.25+0.25+0.25,5,软件未达到的期望>进入评论种子库;此时,评论种子库中有5个评论种子seed:seed1=<不错+软件,a+n,0.5+0.5,5,软件满足的需求>;seed2=<希望+能+抢+红包,v+v+v+n,0.25+0.25+0.25+0.25,5,软件未达到的期望>;seed3=<服务+非常+好,v+d+a,0.5+0.0+0.5,3,软件满足的需求>;seed4=<这个+应用+太+差,rz+vn+d+a,0.0+0.5+0.0+0.5,3,软件存在的问题>;seed5=<期待+表情+符号+能+更新,v+n+n+v+v,0+0.25+0.25+0.25+0.25,5,软件未达到的期望>;执行Step8;Step8、判断体现用户意图的用户评论挖掘效果是否收敛:针对第2次循环,本实施例中根据(Levenshtein V I.Binary codes capable of correcting dele-tions,insertions,and reversals[C]//Soviet physics doklady.1966,10(8):707-710.)文献中相似度公式,计算新评论种子seed5中的评价对象和评价观点的词及词性组合与已有评论种子seed1中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_sim51=0.1;统计组合文本相似度大于等于0.1的新评论种子数numNewSeed2’=1,numNewSeed2’与该次循环产生新评论种子总数numNewSeed2=1相同,体现用户意图的用户评论挖掘效果收敛,体现用户意图的用户评论挖掘结束;
此时,用户评论库中有用户评论comment1与评论种子seed1匹配成功,用户评论comment2与评论种子seed2匹配成功,用户评论comment3与评论种子seed2匹配成功,用户评论comment5与评论种子seed3匹配成功,用户评论comment6与评论种子seed4匹配成功;
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (3)
1.一种针对体现用户意图的APP软件用户评论挖掘方法,其特征在于:所述方法的具体步骤如下:
Step1、初始化数据:评论种子库中有s个评论种子seed,评论库中有c条分词后的用户评论comment,time=1,m=1;
其中,time表示循环次数,m表示参与循环挖掘的第m条用户评论,seed=<seed1,…,seedi,…,seeds>,1≤i≤s;seedi=<seed_wordi1+…+seed_wordij+…+seed_wordip,seed_speechi1+…+seed_speechij+…+seed_speechip,weighti1+…+weightij+…+weightip,seed_disi,seed_intention_typei>,1≤j≤p,seed_wordij代表评论种子seedi中的第j个词,seed_speechij代表评论种子seedi中第j个词的词性,weightij代表评论种子seedi中的第j个词或其词性对应的权重,使用公式(1)计算weightij,p代表评论种子seedi中划分的词/词性的数量,seed_disi为评论种子seedi的距离,其值为评价对象和评价观点之间可扩展的最大距离和p之和,seed_intention_typei表示评论种子seedi体现的用户意图类别,用户意图被分为如下3类:软件满足的需求,软件存在的问题,软件未达到的期望;
式(1)中,numObjectOpinion代表该评论种子的评价对象和评价观点的总个数,评价对象就是观点持有者表达情感的目标实体,通常由一个或多个单词组成,评价观点指的是能够表达用户自身观点的带有情感倾向的词语,是判定用户对评价对象情感的根本依据;
Step2、判断评论库中是否存在待挖掘的用户评论:判断m是否小于等于c:如果是,则取出一条未与评论种子匹配成功的用户评论commentm,抽取commentm的评论模式modem,接着执行Step3;否则,执行Step7;
其中,评论模式modem=<mode_wordm1+…+mode_wordmn+…+mode_wordmq,mode_speechm1+…+mode_speechmn+…+mode_speechmq,mode_weightm1+…+mode_weightmn+…+mode_weightmq,mode_intention_typem>,1≤n≤q;mode_wordmn代表用户评论commentm中的第n个词,mode_speechmn代表用户评论commentm中第n个词的词性,mode_weightmn代表用户评论commentm中第n个词或其词性对应的权重,使用公式(1)计算mode_weightmn,q代表用户评论commentm中划分的词/词性的数量,mode_intention_typem代表用户评论commentm体现的用户意图类别,此时未对评论commentm进行用户意图类别判断,其值为unknown;
Step3、应用评论种子判断commentm是否体现用户意图:判断用户评论commentm是否与评论种子seedg匹配:如果是,mode_intention_typem=seed_intention_typei,则执行Step6;否则,执行Step4;其中,1≤g≤s;
Step4、应用能愿动词判断commentm是否体现用户意图:
Step4.1、判断用户评论commentm是否包含能愿动词:如果是,则执行Step4.2;否则,执行Step5;
Step4.2、mode_intention_typem=软件未达到的期望,执行Step4.3;
Step4.3、modem进入候选评论模式库,执行Step6;
Step5、应用软件简介和情感分析判断commentm是否体现用户意图:
Step5.1、提取commentm对应的APP软件appNamem的APP软件简介中的名词和动词系列的相关词作为软件特征词,构建软件特征词集合F={f1,…,fx,…,fy}(1≤x≤y),执行Step5.2;
Step5.2、判断commentm是否包含特征词fx:如果包含,则执行Step5.3;否则,执行Step5.6;
Step5.3、抽取commentm的评价观点opinionm,计算opinionm的情感值sentiment_valuem,执行Step5.4;
Step5.4、判断sentiment_valuem是否大于或等于0:如果是,则mode_intention_typem=软件满足的需求,commentm体现用户意图,执行Step5.5;否则,则mode_intention_typem=软件存在的问题,commentm体现用户意图,执行Step5.5;
Step5.5、modem进入候选评论模式库,执行Step6;
Step5.6、mode_intention_typem=null,commentm不体现用户意图,执行Step6;
Step6、给出commentm判断结果:<commentm,mode_intention_typem>,m++,执行Step2;
Step7、应用候选评论模式抽取新评论种子,执行Step8;
Step8、判断体现用户意图的用户评论挖掘效果是否收敛:
针对第time次循环,计算新评论种子seedi'中的评价对象和评价观点的词及词性组合与已有评论种子seedi中的评价对象和评价观点的词及词性组合之间的组合文本相似度seed_simi'i,统计组合文本相似度大于等于0.1的新评论种子数numNewSeedtime',当numNewSeedtime'与该次循环产生新评论种子总数numNewSeedtime相同时,体现用户意图的用户评论挖掘效果收敛,体现用户意图的用户评论挖掘结束;否则,体现用户意图的用户评论挖掘效果未收敛,进行下一次循环挖掘,time++,m=1,执行Step2;其中,i'指代新评论种子的标号。
2.根据权利要求1所述的一种针对体现用户意图的APP软件用户评论挖掘方法,其特征在于:所述Step3的具体步骤如下:
Step3.1、初始化数据:i=1,执行Step3.2;
Step3.2、判断i是否小于等于s:如果是,则提取一个未与commentm匹配过的评论种子seedi,执行Step3.3;否则,执行Step3.8;
Step3.3、将commentm的词“mode_wordm1+…+mode_wordmn+…+mode_wordmq”与seedi的词“seed_wordi1+…+seed_wordij+…+seed_wordip”进行匹配,计算commentm与seedi的词匹配值word_matchmi:
Step3.3.1、初始化数据:词匹配成功位置集合pos_word为空,seedi的全部词匹配标记word_flagij为0,j=1,执行Step3.3.2;
Step3.3.2、判断j是否小于等于p:如果是,则执行Step3.3.3;否则,执行Step3.3.6;
Step3.3.3、初始化n=MAX{0,pos_word中最大值}+1,MAX表示计算集合中元素的最大值,执行Step3.3.4;
Step3.3.4、判断n是否小于等于q:如果是,则执行Step3.3.5;否则,j++,执行Step3.3.2;
Step3.3.5、判断seed_wordij是否和mode_wordmn相同:如果是,则记录位置n到pos_word中,word_flagij为1,j++,执行Step3.3.2;否则,n++,执行Step3.3.4;
Step3.3.6、使用公式(2)计算词匹配值word_matchmi:
执行Step3.4;
Step3.4、将commentm的词性“mode_speechm1+…+mode_speechmn+…+mode_speechmq”与seedi的词性“seed_speechi1+…+seed_speechij+…+seed_speechip”进行匹配,计算commentm与seedi的词性匹配值speech_matchmi:
Step3.4.1、初始化数据:词匹配成功位置集合pos_speech为空,seedi的全部词性匹配标记speech_flagij为0,j=1,执行Step3.4.2;
Step3.4.2、判断j是否小于等于p:如果是,则执行Step3.4.3;否则,执行Step3.4.6;
Step3.4.3、初始化n=MAX{1,pos_word中第一个值,pos_speech中最大值+1},执行Step3.4.4;
Step3.4.4、判断n是否小于等与q:如果是,则执行Step3.4.5;否则,j++,执行Step3.4.2;
Step3.4.5、判断seed_speechij是否和mode_speechmn相同:如果是,则记录位置n到pos_speech中,speech_flagij为1,j++,执行Step3.4.2;否则,n++,执行Step3.4.4;
Step3.4.6、使用公式(3)计算词性匹配值speech_matchmi:
执行Step3.5;
Step3.5、计算commentm与seedi的综合匹配值both_matchmi:
Step3.5.1、使用公式(4)计算commentm和seedi匹配成功的词之间的最大距离dis_wordmi:
dis_wordmi=MAX{pos_word}-MIN{pos_word}(4)
式(4)中,MIN表示计算集合中元素的最小值;
执行Step3.5.2;
Step3.5.2、使用公式(5)计算commentm和seedi匹配成功的词性之间的最大距离dis_speechmi:
dis_speechmi=MAX{pos_speech}-MIN{pos_speech}(5)
执行Step3.5.3;
Step3.5.3、使用公式(6)计算commentm和seedi的综合匹配值both_matchmi:
执行Step3.6;
Step3.6、判断both_matchmi是否等于1:如果是,则mode_intention_typem=seed_intention_typei,commentm与seedi匹配成功,执行Step6;否则,执行Step3.7;
Step3.7、i++,执行Step3.2;
Step3.8、用户评论commentm需要与所有评论种子依次进行匹配,最后抽取其与第g个评论种子的最大综合匹配值both_matchmg判断是否匹配成功,抽取最大综合匹配值如公式(7)所示:
both_matchmg=MAX{both_matchm1,…,both_matchmg,…,both_matchms}(1≤g≤s) (7)
执行Step3.9;
Step3.9、判断both_matchmg是否大于0.5:如果是,则mode_intention_typem=seed_intention_typei,commentm与seedg匹配成功,执行Step6;否则,commentm与评论种子匹配失败,执行Step4。
3.根据权利要1所述的一种针对体现用户意图的APP软件用户评论挖掘方法,其特征在于:所述Step7的具体步骤如下:
Step7.1、判断候选评论模式库中所有评论模式文本相似度是否计算完毕:如果是,则执行Step7.4;否则,执行Step7.2;
Step7.2、抽取一条未计算文本相似度的评论模式modem,执行Step7.3;
Step7.3、使用公式(8)计算modem与该用户意图类别中所有其他评论模式modem'的词文本相似度modeWord_simmm':
modeWord_simmm'=1-dis_wordmm'/max(len_wordm,len_wordm')(8)
其中,modeWord_simmm'表示modem和modem'的词文本相似度,dis_wordmm'表示modem和modem'的词组合之间的距离,len_wordm和len_wordm'分别为两个词组合中字符的长度;
使用公式(9)计算modem和modem'词性文本相似度modeSpeech_simmm':
modeSpeech_simmm'=1-dis_speechmm'/max(len_speechm,len_speechm')(9)
其中,modeSpeech_simmm'表示modem和modem'的词性文本相似度,dis_speechmm'表示modem和modem'的词性组合之间的距离,len_speechm和len_speechm'分别为两个词性组合中字符的长度;
使用公式(10)计算modem和modem'的综合文本相似度modeBoth_simmm':
modeBoth_simmm'=0.5*modeWord_simmm'+0.5*modeSpeech_simmm'(10)
使用公式(11)计算modem和modem'的词文本相似度之和sum_modeWord_simm:
sum_modeWord_simm=SUM{modeWord_simmm'}(m'!=m)(11)
式(11)中,SUM表示计算集合中元素之和;
执行Step7.1;
Step7.4、得到至多3个分别代表不同用户意图类别的词文本相似度之和最大的评论模式:modemaxk(1≤k≤3);抽取modemaxk的评论种子seedmaxk,seedmaxk={seed_wordmaxk1+…+seed_wordmaxkj+…+seed_wordmaxkp,seed_speechmaxk1+…+seed_speechmaxkj+…+seed_speechmaxkp,weightmaxk1+…+weightmaxkj+…+weightmaxkp,newseed_dismaxk,seed_intention_typemaxk};
其中,newseed_dismaxk为评论模式modemaxk中词性为名词n、动词v、否定副词d和形容词a的词的数量,seed_intention_typemaxk为评论commentnewk体现的用户意图类别,
执行Step7.5;
Step7.5、更新seedmaxk距离属性:
Step7.5.1、判断seedmaxk中不为空的评论种子的距离是否全部完成更新:如果是,则执行Step7.5.6;否则,执行Step7.5.2;
Step7.5.2、抽取一个不为空的距离未完成更新的评论种子seedmaxk,选取与评论种子seedmaxk的评论模式modemaxk的综合文本相似度大于0.35的所有评论模式modemaxk',执行Step7.5.3;
Step7.5.3、计算全部评论模式modemaxk'的关键词距离dismaxk':
其中,关键词为评论模式中词性为名词n、动词v、否定副词d和形容词a的词,关键词距离指的是评论模式中词性为名词n、动词v、否定副词d和形容词a的词的数量;
执行Step7.5.4;
Step7.5.4、使用公式(12)获取与modemaxk综合文本相似度大于0.35的所有评论模式modemaxk'的dismaxk'中的最大值new_seed_dismaxk:
new_seed_dismaxk=MAX{disnewk'}(12)
执行Step7.5.5;
Step7.5.5、判断new_seed_dismaxk是否大于seedmaxk的距离:如果是,则将seedmaxk的距离更新为new_seed_dismaxk,执行Step7.5.1;否则,执行Step7.5.1;
Step7.5.6、将seedmaxk中不为空的评论种子更新至评论种子库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811531666.4A CN109753651B (zh) | 2018-12-14 | 2018-12-14 | 一种针对体现用户意图的app软件用户评论挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811531666.4A CN109753651B (zh) | 2018-12-14 | 2018-12-14 | 一种针对体现用户意图的app软件用户评论挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109753651A true CN109753651A (zh) | 2019-05-14 |
CN109753651B CN109753651B (zh) | 2022-05-17 |
Family
ID=66403711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811531666.4A Active CN109753651B (zh) | 2018-12-14 | 2018-12-14 | 一种针对体现用户意图的app软件用户评论挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109753651B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750238A (zh) * | 2019-09-20 | 2020-02-04 | 阿里巴巴集团控股有限公司 | 确定产品需求的方法及装置和电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003281124A (ja) * | 2002-03-26 | 2003-10-03 | Fujitsu Ltd | コメント記録プログラム |
US20050154690A1 (en) * | 2002-02-04 | 2005-07-14 | Celestar Lexico-Sciences, Inc | Document knowledge management apparatus and method |
CN105224640A (zh) * | 2015-09-25 | 2016-01-06 | 杭州朗和科技有限公司 | 一种提取观点的方法和设备 |
CN106227720A (zh) * | 2016-08-01 | 2016-12-14 | 昆明理工大学 | 一种app软件用户评论模式识别方法 |
CN107025216A (zh) * | 2015-09-09 | 2017-08-08 | Uberple有限公司 | 句子提取方法及系统 |
CN107577759A (zh) * | 2017-09-01 | 2018-01-12 | 安徽广播电视大学 | 用户评论自动推荐方法 |
CN107885768A (zh) * | 2017-09-27 | 2018-04-06 | 昆明理工大学 | 一种针对app软件使用质量的用户评论挖掘方法 |
CN107943909A (zh) * | 2017-11-17 | 2018-04-20 | 合肥工业大学 | 基于评论数据的用户需求趋势挖掘方法及装置、存储介质 |
CN108492118A (zh) * | 2018-04-03 | 2018-09-04 | 电子科技大学 | 汽车售后服务质量评价回访文本数据的两阶段抽取方法 |
CN108885617A (zh) * | 2016-03-23 | 2018-11-23 | 株式会社野村综合研究所 | 语句解析系统以及程序 |
-
2018
- 2018-12-14 CN CN201811531666.4A patent/CN109753651B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050154690A1 (en) * | 2002-02-04 | 2005-07-14 | Celestar Lexico-Sciences, Inc | Document knowledge management apparatus and method |
JP2003281124A (ja) * | 2002-03-26 | 2003-10-03 | Fujitsu Ltd | コメント記録プログラム |
CN107025216A (zh) * | 2015-09-09 | 2017-08-08 | Uberple有限公司 | 句子提取方法及系统 |
CN105224640A (zh) * | 2015-09-25 | 2016-01-06 | 杭州朗和科技有限公司 | 一种提取观点的方法和设备 |
CN108885617A (zh) * | 2016-03-23 | 2018-11-23 | 株式会社野村综合研究所 | 语句解析系统以及程序 |
CN106227720A (zh) * | 2016-08-01 | 2016-12-14 | 昆明理工大学 | 一种app软件用户评论模式识别方法 |
CN107577759A (zh) * | 2017-09-01 | 2018-01-12 | 安徽广播电视大学 | 用户评论自动推荐方法 |
CN107885768A (zh) * | 2017-09-27 | 2018-04-06 | 昆明理工大学 | 一种针对app软件使用质量的用户评论挖掘方法 |
CN107943909A (zh) * | 2017-11-17 | 2018-04-20 | 合肥工业大学 | 基于评论数据的用户需求趋势挖掘方法及装置、存储介质 |
CN108492118A (zh) * | 2018-04-03 | 2018-09-04 | 电子科技大学 | 汽车售后服务质量评价回访文本数据的两阶段抽取方法 |
Non-Patent Citations (3)
Title |
---|
MENG RAN等: "method of consistency judgement for app software" user comment", 《ICYCSEE 2016: SOCIAL COMPUTING》 * |
姜巍等: "面向用户需求获取的在线评论有用性分析", 《计算机学报》 * |
陆军等: "基于全局用户意图的评论自动估价方法研究", 《中文信息学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750238A (zh) * | 2019-09-20 | 2020-02-04 | 阿里巴巴集团控股有限公司 | 确定产品需求的方法及装置和电子设备 |
CN110750238B (zh) * | 2019-09-20 | 2023-10-03 | 创新先进技术有限公司 | 确定产品需求的方法及装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109753651B (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104076944B (zh) | 一种聊天表情输入的方法和装置 | |
Rizzo et al. | Making Sense of Microposts (# Microposts2015) Named Entity rEcognition and Linking (NEEL) Challenge. | |
CN108920622A (zh) | 一种意图识别的训练方法、训练装置和识别装置 | |
CN109960786A (zh) | 基于融合策略的中文词语相似度计算方法 | |
CN104462063B (zh) | 基于语义位置模型的位置信息结构化提取方法及系统 | |
CN103885983B (zh) | 一种旅游线路的确定方法、优化方法以及装置 | |
CN107004408A (zh) | 用于基于将语义知识图的至少一部分转换为概率状态图来确定口语对话中的用户意图的方法和系统 | |
CN108509534A (zh) | 基于深度学习的个性化音乐推荐系统及其实现方法 | |
CN106663117A (zh) | 构造支持提供探索性建议的图 | |
CN101556574A (zh) | 基于用户意愿的计算机智能起名 | |
CN110009430A (zh) | 作弊用户检测方法、电子设备及计算机可读存储介质 | |
CN107832295B (zh) | 阅读机器人的标题选择方法及系统 | |
CN108472546A (zh) | 用于管理多玩家游戏会话的方法和系统 | |
CN106886561A (zh) | 基于时间关联交互融合的网络社区帖子影响排序方法 | |
CN110287336A (zh) | 一种面向旅游景点推荐的游客画像构建方法 | |
CN107341171A (zh) | 提取数据(基因)特征模板方法与应用模板的方法和系统 | |
CN104731923A (zh) | 互联网商品评论挖掘本体词库的构建方法 | |
Mallya et al. | Recurrent models for situation recognition | |
CN106202053A (zh) | 一种社交关系驱动的微博主题情感分析方法 | |
CN109522416A (zh) | 一种金融风险控制知识图谱的构建方法 | |
CN109165040A (zh) | 一种基于随机森林模型的代码抄袭嫌疑检测的方法 | |
CN106777080A (zh) | 短摘要生成方法、数据库建立方法及人机对话方法 | |
CN109086306A (zh) | 基于混合隐马尔可夫模型的原子事件标签的提取方法 | |
CN109753651A (zh) | 一种针对体现用户意图的app软件用户评论挖掘方法 | |
CN113255346B (zh) | 一种基于图嵌入与crf知识融入的地址要素识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |