CN109783807A - 一种针对app软件缺陷的用户评论挖掘方法 - Google Patents

一种针对app软件缺陷的用户评论挖掘方法 Download PDF

Info

Publication number
CN109783807A
CN109783807A CN201811572514.9A CN201811572514A CN109783807A CN 109783807 A CN109783807 A CN 109783807A CN 201811572514 A CN201811572514 A CN 201811572514A CN 109783807 A CN109783807 A CN 109783807A
Authority
CN
China
Prior art keywords
user comment
comment
app software
defect
brief introduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811572514.9A
Other languages
English (en)
Other versions
CN109783807B (zh
Inventor
姜瑛
段文静
李凌宇
丁家满
汪海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201811572514.9A priority Critical patent/CN109783807B/zh
Publication of CN109783807A publication Critical patent/CN109783807A/zh
Application granted granted Critical
Publication of CN109783807B publication Critical patent/CN109783807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种针对APP软件缺陷的用户评论挖掘方法,本发明方法为:Step1、提取出与APP软件简介相关及不相关的用户评论;Step2、将与APP软件简介相关的含有缺陷的用户评论归类为功能性缺陷用户评论;Step3、将与APP软件简介不相关的含有缺陷的用户评论进行分类:如果与APP软件简介不相关的用户评论含有缺陷特征词集合中元素,则依据该元素对应的缺陷类型对用户评论进行分类;否则标记为其他缺陷类。本发明有助于从大量的APP软件用户评论中挖掘出含有APP软件缺陷的用户评论,有助于分析用户在使用APP软件时发现的软件缺陷及其类别。

Description

一种针对APP软件缺陷的用户评论挖掘方法
技术领域
本发明涉及一种针对APP软件缺陷的用户评论挖掘方法,属于APP软件缺陷类型分析领域。
背景技术
当前,APP软件种类越来越多样化,向人们提供信息和服务,APP软件的质量越来越重要。高质量的软件,其缺陷应该尽可能的少。但是,软件开发是一项智力活动,势必会引入缺陷。SW-CMM将软件缺陷定义为:“系统或系统成分中能造成他们无法实现其被要求的功能的缺点。如果在执行过程中遇到缺陷,它可能导致系统的失败”。
Feldman等将数据挖掘的计算机技术应用在海量非结构化数据上,首次提出了文本挖掘的理论。用户评论与一般文本相较,具有海量、简短、低质等特点,传统的文本挖掘方法应用到用户评论这类短文本数据时,具有复杂度高,准确率低,噪声大的缺点。针对这一问题,随后的研究大多是通过外部链接或知识库来扩展词汇的语义,或者利用后缀树模型构建短语,从而改善短文本稀疏性问题。例如,利用WordNet或HowNet的概念与义原等丰富词汇信息。在用户评论的缺陷识别方面,Wenhao Zhang等人提出了一个弱点查找器专家系统,采用基于分词的方法和Hownet的相似度算法提取产品特征,对显性特征进行分类,并利用搭配选择的方法对隐性特征进行识别和分类;然后利用情感分析的方法确认句子极性,寻找产品弱点。Abraham提出基于产品缺陷识别的文本特征构建体系,以用户评论归属分论坛的属性名当做汽车评论的分类标志,得到若干二元产品评论分类器,并以汽车和电子产品为实现对象检验方法准确性。张嵩等提出互联网环境下的手机缺陷识别研究方法,其中利用支持向量机分类算法需要大量的人工标注。蒋翠清等提出了中文互联网环境下运用半监督分类算法识别汽车故障,对缺陷率在30%的汽车论坛评论使用半监督Tri-training方法大大减少了人工标记数量,但分类准确率不够高。如何从大量APP用户评论中挖掘含有APP软件缺陷的用户评论并进行分析,成为亟需解决的问题。
发明内容
本发明提供了一种针对APP软件缺陷的用户评论挖掘方法,以用于对与APP软件简介相关及不相关的用户评论进行缺陷分类。
本发明的技术方案是:一种针对APP软件缺陷的用户评论挖掘方法,所述方法的具体步骤如下:
Step1、提取出与APP软件简介相关及不相关的用户评论;
Step2、将与APP软件简介相关的含有缺陷的用户评论归类为功能性缺陷用户评论;
Step3、将与APP软件简介不相关的含有缺陷的用户评论进行分类:如果与APP软件简介不相关的用户评论含有缺陷特征词集合中元素,则依据该元素对应的缺陷类型对用户评论进行分类;否则标记为其他缺陷类。
所述Step1的具体步骤如下:
Step1.1、将APP软件简介分词后获取名词和动词放入集合IntroductionFeature{IF1,IF2,……,IFn}中,初始化:i=1;
Step1.2、获取该APP软件的num_comment条用户评论;
Step1.3、判断i是否小于等于num_comment:如果是,则执行Step1.4;否则,结束;
Step1.4、将第i条用户评论与集合IntroductionFeature中的元素进行匹配;
Step1.5、判断第i条用户评论中是否含有集合IntroductionFeature中元素:如果是,则执行Step1.6;否则,执行①;
①、获取第i条用户评论的评论对象放入用户评论对象集合EvaluationObject{EO1,EO2,……,EOm}中,执行②;其中,评论对象是指某段文本中讨论的主题,即评论中的名词;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论对象EvaluationObject{EO1,EO2,……,EOm}之间的相似度Simlaritynm,执行③;
其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有n*m个词语相似度值;
③、使用公式(1)计算第i条用户评论中m个评论对象与APP软件简介的相似度平均值Ave,执行④;
Ave=∑Simlaritynm/nm (1)
式(1)中:n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}中元素IFn和用户评论EvaluationObject{EO1,EO2,……,EOm}中元素EOm之间的相似度;
④、判断Ave值是否大于0.2:如果是,则执行Step1.6;否则,执行Step1.7;
Step1.6、标记第i条用户评论为与APP软件简介相关的用户评论,执行Step1.8;
Step1.7、标记第i条用户评论为与APP软件简介不相关的用户评论,执行Step1.8;
Step1.8、i++,执行Step1.3。
所述Step2的具体步骤如下:
Step2.1、初始化变量:j=1;
Step2.2、获取步骤1标记的与APP软件简介相关的num_recomment条用户评论;
Step2.3、判断j是否小于等于num_recomment:如果是,则执行Step2.4;否则,结束;
Step2.4、将第j条评论与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配;
判断第j条用户评论中是否含有集合DefectSentencePattern或DefectWords中元素:如果是,则执行Step2.5;否则,执行Step2.7;
Step2.5、标记第j条为功能性缺陷用户评论,执行Step2.6;
Step2.6、如果第j条用户评论含有DefectWords中的元素,则根据该元素对应的缺陷类型将第j条评论分类;否则,不做其他分类;
Step2.7、j++,执行Step2.3。
所述Step3的具体步骤如下:
Step3.1、初始化变量:k=1;
Step3.2、获取步骤1标记的与APP软件简介不相关的num_nocomment条用户评论;
Step3.3、判断k是否小于等于num_nocomment:如果是,则执行Step3.4;否则,执行Step3.8;
Step3.4、将第k条评论与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配;判断第k条用户评论中是否含有集合DefectSentencePattern或DefectWords中元素:如果是,则执行Step3.5;否则,执行Step3.7;
Step3.5、标记第k条用户评论为含有缺陷的评论,执行Step3.6;
Step3.6、根据第k条用户评论含有的DefectWords中的元素对应的缺陷类型将第k条评论分类;
Step3.7、k++,执行Step3.3;
Step3.8、将含有缺陷标记且未分类的评论标记为其他缺陷类。
所述缺陷特征词集合DefectWords为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度慢”}。
所述句型集合DefectSentencePattern为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”}。
本发明的有益效果是:
(1)本发明将用户评论与APP软件简介作对比,通过句型和缺陷词相结合的方法,有助于从大量的APP软件用户评论中挖掘出与软件缺陷相关的用户评论;
(2)本发明提出了一种针对APP用户评论的软件缺陷分类方法,有助于分析用户在使用APP软件时发现的软件缺陷及其类别。
综上,本发明有助于从大量的APP软件用户评论中挖掘出含有APP软件缺陷的用户评论,有助于分析用户在使用APP软件时发现的软件缺陷及其类别。
附图说明
图1是本发明总流程图;
图2是步骤Step1的流程图;
图3是步骤Step2的流程图;
图4是步骤Step3的流程图。
具体实施方式
实施例1:如图1-4所示,一种针对APP软件缺陷的用户评论挖掘方法,所述方法的具体步骤如下:
Step1、提取出与APP软件简介相关及不相关的用户评论;
Step2、将与APP软件简介相关的含有缺陷的用户评论归类为功能性缺陷用户评论;
Step3、将与APP软件简介不相关的含有缺陷的用户评论进行分类:如果与APP软件简介不相关的用户评论含有缺陷特征词集合中元素,则依据该元素对应的缺陷类型对用户评论进行分类;否则标记为其他缺陷类。
进一步地,可以设置所述方法具体步骤如下:
Step1、提取出与APP软件简介相关及不相关的用户评论;
表1 “QQ”的软件简介
Step1.1、将APP软件简介分词后获取名词和动词放入集合IntroductionFeature中,IntroductionFeature={“聊天”,“消息”,“好友”,“语音”,“通话”,“视频”,“想念”,“文件”,“手机”,“电脑”,“空间”,“动态”,“分享”,“生活”,“感动”,“装扮”,“胶囊”,“个性”,“厘米”,“主题”,“名片”,“彩铃”,“气泡”,“游戏中心”,“支付”,“话费”,“转账”,“内容”,“平台”},初始化数据:i=1;
Step1.2、获取表2-APP软件用户评论表中的8条用户评论;
表2 APP软件用户评论表
Step1.3、判断是否i≤num_comment,1<8,执行Step1.4;
Step1.4、匹配第1条用户评论与集合IntroductionFeature中元素;
Step1.5、“冲不了钱”中没有集合IntroductionFeature中元素,执行①;
①、获取“冲不了钱”的评论对象放入集合EvaluationObject中,EvaluationObject={“钱”},
其中,评论对象是指某段文本中讨论的主题,为用户评论中的名词n和非单字动词v,“冲不了钱”分词后为“冲/v不/d了/ule钱/n”,获取其中名词n“钱”为评论对象;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{“聊天”,“消息”,“好友”,“语音”,“通话”,“视频”,“想念”,“文件”,“手机”,“电脑”,“空间”,“动态”,“分享”,“生活”,“感动”,“装扮”,“胶囊”,“个性”,“厘米”,“主题”,“名片”,“彩铃”,“气泡”,“游戏中心”,“支付”,“话费”,“转账”,“内容”,“平台”}和评论对象EvaluationObject{“钱”}之间的相似度∑Simlaritynm=5.945;
③、使用公式(1)计算该条用户评论中m个评论对象与APP软件简介的相似度平均值Ave:
Ave=∑Simlaritynm/nm=0.205 (1)
式(1)中n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论EvaluationObject{EO1,EO2,……,EOm}之间的相似度。其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有29*1个词语相似度值;
④、判断Ave值是否大于0.2:0.205>0.2,执行Step1.6;
Step1.6、标记第1条用户评论“冲不了钱”为与APP软件简介相关的用户评论,执行Step1.8;
Step1.8、i++,i=2,执行Step1.3;
Step1.3、判断是否i≤num_comment,2<8,执行Step1.4;
Step1.4、匹配第2条用户评论与集合IntroductionFeature中元素;
Step1.5、“玩手机,都是必备的,没毛病”中含有集合IntroductionFeature中元素“手机”,执行Step1.6;
Step1.6、标记第2条用户“玩手机,都是必备的,没毛病”为与APP软件简介相关的用户评论,执行Step1.8;
Step1.8、i++,i=3,执行Step1.3;
Step1.3、判断是否i≤num_comment,3<8,执行Step1.4;
Step1.4、匹配第3条用户评论与集合IntroductionFeature中元素;
Step1.5、“内存要是少就好了,??”中没有集合IntroductionFeature中元素,执行①;
①、获取“内存要是少就好了,??”的评论对象放入集合EvaluationObject中,EvaluationObject={“内存”};
其中,评论对象是指某段文本中讨论的主题,为用户评论中的名词n和非单字动词v,“内存要是少就好了,??”分词后为“内存/n要是/c少/d就/d好/a了/y,/wd?/ww?/ww”,获取其中名词n“内存”为评论对象;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{“聊天”,“消息”,“好友”,“语音”,“通话”,“视频”,“想念”,“文件”,“手机”,“电脑”,“空间”,“动态”,“分享”,“生活”,“感动”,“装扮”,“胶囊”,“个性”,“厘米”,“主题”,“名片”,“彩铃”,“气泡”,“游戏中心”,“支付”,“话费”,“转账”,“内容”,“平台”}和用户评论EvaluationObject{“内存”}之间的相似度∑Simlaritynm=2.117;
③、使用公式(1)计算该条用户评论中1个评论对象与APP软件简介的相似度平均值Ave:
Ave=∑Simlaritynm/nm=0.073 (1)
式(1)中n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论EvaluationObject{EO1,EO2,……,EOm}之间的相似度。其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有29*1个词语相似度值;
④、判断Ave值是否大于0.2:0.073<0.2,执行Step1.7;
Step1.7、标记第3条用户评论“内存要是少就好了,??”为与APP软件简介不相关的用户评论,执行Step1.8;
Step1.8、i++,i=4,执行Step1.3;
Step1.3、判断是否i≤num_comment,4<8,执行Step1.4;
Step1.4、匹配第4条用户评论与集合IntroductionFeature中元素;
Step1.5、“改不了资料,你更新有什么用”中没有集合IntroductionFeature中元素,执行①;
①、获取“改不了资料,你更新有什么用”的评论对象放入集合EvaluationObject中,EvaluationObject={“资料”};
其中,评论对象是指某段文本中讨论的主题,为用户评论中的名词n和非单字动词v,“改不了资料,你更新有什么用”分词后为“改/v不/d了/ule资料/n,/wd你/rr更/d新/a有/vyou什么/ry用/v”,获取其中名词n“资料”为评论对象;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{“聊天”,“消息”,“好友”,“语音”,“通话”,“视频”,“想念”,“文件”,“手机”,“电脑”,“空间”,“动态”,“分享”,“生活”,“感动”,“装扮”,“胶囊”,“个性”,“厘米”,“主题”,“名片”,“彩铃”,“气泡”,“游戏中心”,“支付”,“话费”,“转账”,“内容”,“平台”}和用户评论EvaluationObject{“资料”}之间的相似度∑Simlaritynm=3.596;
③、使用公式(1)计算该条用户评论中1个评论对象与APP软件简介的相似度平均值Ave:
Ave=∑Simlaritynm/nm=0.12 (1)
式(1)中n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论EvaluationObject{EO1,EO2,……,EOm}之间的相似度。其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有29*1个词语相似度值;
④、判断Ave值是否大于0.2:0.12<0.2,执行Step1.7;
Step1.7、标记第4条用户评论“改不了资料,你更新有什么用”为与APP软件简介不相关的用户评论,执行Step1.8;
Step1.8、i++,i=5,执行Step1.3;
Step1.3、判断是否i≤num_comment,5<8,执行Step1.4;
Step1.4、匹配第5条用户评论与集合IntroductionFeature中元素;
Step1.5、“太卡了,升级还升卡了”中没有集合IntroductionFeature中元素,执行①;
①、获取“太卡了,升级还升卡了”的评论对象放入集合EvaluationObject中,EvaluationObject={“升级”,“卡”};
其中,评论对象是指某段文本中讨论的主题,为用户评论中的名词n和非单字动词v,“太卡了,升级还升卡了”分词后为“太/d卡/v了/y,/wd升级/vi还/d升/v卡/n了/y”,获取其中动词vi“升级”和名词n“卡”为评论对象;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{“聊天”,“消息”,“好友”,“语音”,“通话”,“视频”,“想念”,“文件”,“手机”,“电脑”,“空间”,“动态”,“分享”,“生活”,“感动”,“装扮”,“胶囊”,“个性”,“厘米”,“主题”,“名片”,“彩铃”,“气泡”,“游戏中心”,“支付”,“话费”,“转账”,“内容”,“平台”}和用户评论EvaluationObject{“升级”,“卡”}之间的相似度∑Simlaritynm=10.034;
③、使用公式(1)计算该条用户评论中2个评论对象与APP软件简介的相似度平均值Ave:
Ave=∑Simlaritynm/nm=0.173 (1)
式(1)中n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论EvaluationObject{EO1,EO2,……,EOm}之间的相似度。其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有29*2个词语相似度值;
④、判断Ave值是否大于0.2:0.173<0.2,执行Step1.7;
Step1.7、标记第5条用户评论“太卡了,升级还升卡了”为与APP软件简介不相关的用户评论,执行Step1.8;
Step1.8、i++,i=6,执行Step1.3;
Step1.3、判断是否i≤num_comment,6<8,执行Step1.4;
Step1.4、匹配第6条用户评论与集合IntroductionFeature中元素;
Step1.5、“为什么安装不了”中没有集合IntroductionFeature中元素,执行①;
①、获取“为什么安装不了”的评论对象放入集合EvaluationObject中,EvaluationObject={“安装”};
其中,评论对象是指某段文本中讨论的主题,为用户评论中的名词n和动词v,“为什么安装不了”分词后为“为什么/ryv安装/v不/d了/y”,获取其中非单字动词v“安装”为评论对象;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{“聊天”,“消息”,“好友”,“语音”,“通话”,“视频”,“想念”,“文件”,“手机”,“电脑”,“空间”,“动态”,“分享”,“生活”,“感动”,“装扮”,“胶囊”,“个性”,“厘米”,“主题”,“名片”,“彩铃”,“气泡”,“游戏中心”,“支付”,“话费”,“转账”,“内容”,“平台”}和用户评论EvaluationObject{“安装”}之间的相似度∑Simlaritynm=1.682;
③、使用公式(1)计算该条用户评论中1个评论对象与APP软件简介的相似度平均值Ave:
Ave=∑Simlaritynm/nm=0.058(1)
式(1)中n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论EvaluationObject{EO1,EO2,……,EOm}之间的相似度。其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有29*1个词语相似度值;
④、判断Ave值是否大于0.2:0.058<0.2,执行Step1.7;
Step1.7、标记第6条用户评论“为什么安装不了”为与APP软件简介不相关的用户评论,执行Step1.8;
Step1.8、i++,i=7,执行Step1.3;
Step1.3、判断是否i≤num_comment,7<8,执行Step1.4;
Step1.4、匹配第7条用户评论与集合IntroductionFeature中元素;
Step1.5、“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”中没有集合IntroductionFeature中元素,执行①;
①、获取“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”的评论对象放入集合EvaluationObject中,EvaluationObject={“密码”,“数”,“版本”};
其中,评论对象是指某段文本中讨论的主题,为用户评论中的名词n和非单字动词v,“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”分词后为“我/rr密码/n十九/m位/q数/n换/v了/ule这个/rz版本/n输/v不/d进去/vf,/wd差/v评/v。/wj版本/n也/d不/d兼容/vi”,获取其中名词n“密码”,名词n“数”,名词n“版本”为评论对象;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{“聊天”,“消息”,“好友”,“语音”,“通话”,“视频”,“想念”,“文件”,“手机”,“电脑”,“空间”,“动态”,“分享”,“生活”,“感动”,“装扮”,“胶囊”,“个性”,“厘米”,“主题”,“名片”,“彩铃”,“气泡”,“游戏中心”,“支付”,“话费”,“转账”,“内容”,“平台”}和用户评论EvaluationObject{“密码”,“数”,“版本”}之间的相似度∑Simlaritynm=9.657;
③、使用公式(1)计算该条用户评论中3个评论对象与APP软件简介的相似度平均值Ave:
Ave=∑Simlaritynm/nm=0.111 (1)
式(1)中n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论EvaluationObject{EO1,EO2,……,EOm}之间的相似度。其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有29*3个词语相似度值;
④、判断Ave值是否大于0.2:0.111<0.2,执行Step1.7;
Step1.7、标记第7条用户评论“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”为与APP软件简介不相关的用户评论,执行Step1.8;
Step1.8、i++,i=8,执行Step1.3;
Step1.3、判断是否i≤num_comment,8=8,执行Step1.4;
Step1.4、匹配第8条用户评论与集合IntroductionFeature中元素;
Step1.5、“这几天发消息,字数一多就闪退”中含有集合IntroductionFeature中元素“消息”,执行Step1.6;
Step1.6、标记第8条用户“这几天发消息,字数一多就闪退”为与APP软件简介相关的用户评论,执行Step1.8;
Step1.8、i++,i=9,执行Step1.3;
Step1.3、判断是否i≤num_comment,9>8,结束;
Step2、将与APP软件简介相关的含有缺陷的用户评论归类为功能性缺陷用户评论;
Step2.1、初始化变量:j=1;
Step2.2、获取与APP软件简介相关的3条用户评论;
Step2.3、判断是否j≤num_recomment:1<3;执行Step2.4;
Step2.4、将第1条用户评论“冲不了钱”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断第1条用户评论“冲不了钱”中是否含有集合DefectSentencePattern或DefectWords中元素:含有“……不了……”句型,执行Step2.5;
Step2.5、标记“冲不了钱”为功能性缺陷用户评论;
Step2.6、根据缺陷特征词表(表3)将“冲不了钱”分类;未含有缺陷特征词,不做其他分类;
表3 缺陷特征词表
Step2.7、j++,j=2执行Step2.3;
Step2.3、判断是否j≤num_recomment:2<3;执行Step2.4;
Step2.4、将第2条用户评论“玩手机,都是必备的,没毛病”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断第2条用户评论“玩手机,都是必备的,没毛病”中是否含有集合DefectSentencePattern或DefectWords中元素:未含有任何集合中元素,执行Step2.7;
Step2.7、j++,j=3执行Step2.3;
Step2.3、判断是否j≤num_recomment:3=3;执行Step2.4;
Step2.4、将第3条用户评论“这几天发消息,字数一多就闪退”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断第3条用户评论“这几天发消息,字数一多就闪退”中是否含有集合DefectSentencePattern或DefectWords中元素:含有缺陷词“闪退”,执行Step2.5;
Step2.5、标记“这几天发消息,字数一多就闪退”为功能性缺陷用户评论;
Step2.6、根据缺陷特征词表(表3)将“这几天发消息,字数一多就闪退”分类;含有“可靠性缺陷”类缺陷特征词“闪退”,标记为可靠性缺陷;
Step2.7、j++,j=4执行Step2.3;
Step2.3、判断是否j≤num_recomment:4>3;结束;
Step3、依据缺陷特征词表对与APP软件简介不相关的含有缺陷的用户评论进行分类。
Step3.1、初始化变量:k=1;
Step3.2、获取与APP软件简介相关与不相关的5条用户评论;
Step3.3、判断是否k≤num_nocomment1:1<5:执行Step3.4;
Step3.4、将第1条评论“内存要是少就好了,??”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断“内存要是少就好了,??”中是否含有集合DefectSentencePattern或DefectWords中元素:含有句型“……就好了”,含有缺陷特征词“内存”,执行Step3.5;
Step3.5、标记“内存要是少就好了,??”为含有缺陷的评论,执行Step3.6;
Step3.6、根据缺陷特征词表将“内存要是少就好了,??”分类;
“内存要是少就好了,??”中含有“资源性缺陷”类,缺陷特征词“内存”,将此评论标记为“资源性缺陷”评论。
Step3.7、k++,k=2;执行Step3.3
Step3.3、判断是否k≤num_nocomment1:2<5:执行Step3.4;
Step3.4、将第2条评论“改不了资料,你更新有什么用”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷词集合DefectWords{DW1,DW2,……,DWy}进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断“改不了资料,你更新有什么用”中是否含有集合DefectSentencePattern或DefectWords中元素:含有句型“……不了……”,执行Step3.5;
Step3.5、标记“改不了资料,你更新有什么用”为含有缺陷的评论,执行Step3.6;
Step3.6、根据缺陷特征词表将“改不了资料,你更新有什么用”分类,其中未含有缺陷特征词表中的缺陷特征词;
Step3.7、k++,k=3;执行Step3.3
Step3.3、判断是否k≤num_nocomment1:3<5:执行Step3.4;
Step3.4、将第3条评论“太卡了,升级还升卡了”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷词集合DefectWords{DW1,DW2,……,DWy}进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断“太卡了,升级还升卡了”中是否含有集合DefectSentencePattern或DefectWords中元素:含有缺陷词“卡”,执行Step3.5;
Step3.5、标记“太卡了,升级还升卡了”为含有缺陷的评论,执行Step3.6;
Step3.6、根据缺陷特征词表将“太卡了,升级还升卡了”分类;
“太卡了,升级还升卡了”中含有“有效性缺陷”类,缺陷特征词“卡”,将此评论标记为“有效性缺陷”评论;
Step3.7、k++,k=4;执行Step3.3;
Step3.3、判断是否k≤num_nocomment1:3<5:执行Step3.4;
Step3.4、将第4条评论“为什么安装不了”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷词集合DefectWords{DW1,DW2,……,DWy}进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断“为什么安装不了”中是否含有集合DefectSentencePattern或DefectWords中元素:含有“为什么……”句型,含有缺陷特征词“安装”,执行Step3.5;
Step3.5、标记“为什么安装不了”为含有缺陷的评论,执行Step3.6;
Step3.6、根据缺陷特征词表将“为什么安装不了”分类;
“为什么安装不了”中含有“安装缺陷”类,缺陷特征词“安装”,将此评论标记为“安装缺陷”评论;
Step3.7、k++,k=5;执行Step3.3;
Step3.3、判断是否k≤num_nocomment1:5=5:执行Step3.4;
Step3.4、将第5条评论“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷词集合DefectWords{DW1,DW2,……,DWy}进行匹配;
其中DefectSentencePattern句型为集合为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”};DefectWords缺陷特征词集合为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度(慢)”};速度(慢)为速度慢、速度*慢(如:速度很慢)。
判断“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”中是否含有集合DefectSentencePattern或DefectWords中元素:含有缺陷词“不兼容”,执行Step3.5;
Step3.5、标记“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”为含有缺陷的评论,执行Step3.6;
Step3.6、根据缺陷特征词表将“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”分类;
“我密码十九位数换了这个版本输不进去,差评。版本也不兼容”中含有“兼容性缺陷”类,缺陷特征词“不兼容”,将此评论标记为“兼容性缺陷”评论。
Step3.7、k++,k=6;执行Step3.3;
Step3.3、判断是否k≤num_nocomment1:6>5:执行Step3.8;
Step3.8、将含有缺陷标记且未分类的评论标记为其他缺陷类,“改不了资料,你更新有什么用”分为“其他缺陷”类。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (6)

1.一种针对APP软件缺陷的用户评论挖掘方法,其特征在于:所述方法的具体步骤如下:
Step1、提取出与APP软件简介相关及不相关的用户评论;
Step2、将与APP软件简介相关的含有缺陷的用户评论归类为功能性缺陷用户评论;
Step3、将与APP软件简介不相关的含有缺陷的用户评论进行分类:如果与APP软件简介不相关的用户评论含有缺陷特征词集合中元素,则依据该元素对应的缺陷类型对用户评论进行分类;否则标记为其他缺陷类。
2.根据权利要求1所述的针对APP软件缺陷的用户评论挖掘方法,其特征在于:所述Step1的具体步骤如下:
Step1.1、将APP软件简介分词后获取名词和动词放入集合IntroductionFeature{IF1,IF2,……,IFn}中,初始化:i=1;
Step1.2、获取该APP软件的num_comment条用户评论;
Step1.3、判断i是否小于等于num_comment:如果是,则执行Step1.4;否则,结束;
Step1.4、将第i条用户评论与集合IntroductionFeature中的元素进行匹配;
Step1.5、判断第i条用户评论中是否含有集合IntroductionFeature中元素:如果是,则执行Step1.6;否则,执行①;
①、获取第i条用户评论的评论对象放入用户评论对象集合EvaluationObject{EO1,EO2,……,EOm}中,执行②;其中,评论对象是指某段文本中讨论的主题,即评论中的名词;
②、利用知网词典Hownet计算APP软件简介IntroductionFeature{IF1,IF2,……,IFn}和用户评论对象EvaluationObject{EO1,EO2,……,EOm}之间的相似度Simlaritynm,执行③;
其中,从APP软件简介获取出的IntroductionFeature集合和EvaluationObject集合间含有n*m个词语相似度值;
③、使用公式(1)计算第i条用户评论中m个评论对象与APP软件简介的相似度平均值Ave,执行④;
Ave=∑Simlaritynm/nm (1)
式(1)中:n表示APP软件简介中名词和多字动词的个数,m表示该条用户评论中评论对象的个数,Simlaritynm表示APP软件简介IntroductionFeature{IF1,IF2,……,IFn}中元素IFn和用户评论EvaluationObject{EO1,EO2,……,EOm}中元素EOm之间的相似度;
④、判断Ave值是否大于0.2:如果是,则执行Step1.6;否则,执行Step1.7;
Step1.6、标记第i条用户评论为与APP软件简介相关的用户评论,执行Step1.8;
Step1.7、标记第i条用户评论为与APP软件简介不相关的用户评论,执行Step1.8;
Step1.8、i++,执行Step1.3。
3.根据权利要求1所述的针对APP软件缺陷的用户评论挖掘方法,其特征在于:所述Step2的具体步骤如下:
Step2.1、初始化变量:j=1;
Step2.2、获取步骤1标记的与APP软件简介相关的num_recomment条用户评论;
Step2.3、判断j是否小于等于num_recomment:如果是,则执行Step2.4;否则,结束;
Step2.4、将第j条评论与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配;
判断第j条用户评论中是否含有集合DefectSentencePattern或DefectWords中元素:如果是,则执行Step2.5;否则,执行Step2.7;
Step2.5、标记第j条为功能性缺陷用户评论,执行Step2.6;
Step2.6、如果第j条用户评论含有DefectWords中的元素,则根据该元素对应的缺陷类型将第j条评论分类;否则,不做其他分类;
Step2.7、j++,执行Step2.3。
4.根据权利要求1所述的针对APP软件缺陷的用户评论挖掘方法,其特征在于:所述Step3的具体步骤如下:
Step3.1、初始化变量:k=1;
Step3.2、获取步骤1标记的与APP软件简介不相关的num_nocomment条用户评论;
Step3.3、判断k是否小于等于num_nocomment:如果是,则执行Step3.4;否则,执行Step3.8;
Step3.4、将第k条评论与句型集合DefectSentencePattern{DSP1,DSP2,……,DSPx}中元素和缺陷特征词集合DefectWords{DW1,DW2,……,DWy}进行匹配;判断第k条用户评论中是否含有集合DefectSentencePattern或DefectWords中元素:如果是,则执行Step3.5;否则,执行Step3.7;
Step3.5、标记第k条用户评论为含有缺陷的评论,执行Step3.6;
Step3.6、根据第k条用户评论含有的DefectWords中的元素对应的缺陷类型将第k条评论分类;
Step3.7、k++,执行Step3.3;
Step3.8、将含有缺陷标记且未分类的评论标记为其他缺陷类。
5.根据权利要求1或3或4所述的针对APP软件缺陷的用户评论挖掘方法,其特征在于:所述缺陷特征词集合DefectWords为:{“安装”,“不兼容”,“不匹配”,“内存”,“耗/费电”,“耗/费流量”,“臃肿”,“存储”,“崩溃”,“闪退”,“黑屏”,“没/无响应”,“死机”,“停止运行”,“不/没经过同意”,“没/无反应”,“卡”,“速度慢”}。
6.根据权利要求3或4所述的针对APP软件缺陷的用户评论挖掘方法,其特征在于:所述句型集合DefectSentencePattern为:{“为什么……”,“不能……”,“……就好了”,“总是……”,“没有……”,“有时候……”,“只是……”,“但是……”,“连……都”,“……不了……”,“为啥……”,“怎么……”,“不可以……”,“希望……”,“建议……”,“……怎么回事”}。
CN201811572514.9A 2018-12-21 2018-12-21 一种针对app软件缺陷的用户评论挖掘方法 Active CN109783807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811572514.9A CN109783807B (zh) 2018-12-21 2018-12-21 一种针对app软件缺陷的用户评论挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811572514.9A CN109783807B (zh) 2018-12-21 2018-12-21 一种针对app软件缺陷的用户评论挖掘方法

Publications (2)

Publication Number Publication Date
CN109783807A true CN109783807A (zh) 2019-05-21
CN109783807B CN109783807B (zh) 2022-10-28

Family

ID=66498011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811572514.9A Active CN109783807B (zh) 2018-12-21 2018-12-21 一种针对app软件缺陷的用户评论挖掘方法

Country Status (1)

Country Link
CN (1) CN109783807B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659828A (zh) * 2019-09-23 2020-01-07 上海海事大学 一种基于评论数据的软件特征评价方法
CN111736804A (zh) * 2020-08-25 2020-10-02 南京大学 一种基于用户评论识别App关键功能的方法及装置
CN112417300A (zh) * 2020-12-10 2021-02-26 平安普惠企业管理有限公司 产品漏洞方案查询方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140188897A1 (en) * 2013-01-02 2014-07-03 CrowdChunk LLC CrowdChunk System, Method and Computer Program Product for Searching Summaries of Mobile Apps Reviews
CN104731946A (zh) * 2015-04-01 2015-06-24 成都金税电子技术有限公司 一种互联网信息数据挖掘方法
CN104866468A (zh) * 2015-04-08 2015-08-26 清华大学深圳研究生院 一种中文虚假顾客评论识别方法
CN105975487A (zh) * 2016-04-26 2016-09-28 昆明理工大学 一种app软件用户评论有关性判断方法
US20160328403A1 (en) * 2015-05-07 2016-11-10 TCL Research America Inc. Method and system for app search engine leveraging user reviews
CN106649260A (zh) * 2016-10-19 2017-05-10 中国计量大学 基于评论文本挖掘的产品特征结构树构建方法
CN107885768A (zh) * 2017-09-27 2018-04-06 昆明理工大学 一种针对app软件使用质量的用户评论挖掘方法
CN108717459A (zh) * 2018-05-24 2018-10-30 哈尔滨工程大学 一种面向用户评论信息的移动应用缺陷定位方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140188897A1 (en) * 2013-01-02 2014-07-03 CrowdChunk LLC CrowdChunk System, Method and Computer Program Product for Searching Summaries of Mobile Apps Reviews
CN104731946A (zh) * 2015-04-01 2015-06-24 成都金税电子技术有限公司 一种互联网信息数据挖掘方法
CN104866468A (zh) * 2015-04-08 2015-08-26 清华大学深圳研究生院 一种中文虚假顾客评论识别方法
US20160328403A1 (en) * 2015-05-07 2016-11-10 TCL Research America Inc. Method and system for app search engine leveraging user reviews
CN105975487A (zh) * 2016-04-26 2016-09-28 昆明理工大学 一种app软件用户评论有关性判断方法
CN106649260A (zh) * 2016-10-19 2017-05-10 中国计量大学 基于评论文本挖掘的产品特征结构树构建方法
CN107885768A (zh) * 2017-09-27 2018-04-06 昆明理工大学 一种针对app软件使用质量的用户评论挖掘方法
CN108717459A (zh) * 2018-05-24 2018-10-30 哈尔滨工程大学 一种面向用户评论信息的移动应用缺陷定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
向祺鑫: "基于用户评论的APP软件评价方法研究与实现", 《中国优秀博硕士论文全文数据库(硕士)信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659828A (zh) * 2019-09-23 2020-01-07 上海海事大学 一种基于评论数据的软件特征评价方法
CN110659828B (zh) * 2019-09-23 2022-03-08 上海海事大学 一种基于评论数据的软件特征评价方法
CN111736804A (zh) * 2020-08-25 2020-10-02 南京大学 一种基于用户评论识别App关键功能的方法及装置
CN111736804B (zh) * 2020-08-25 2020-12-22 南京大学 一种基于用户评论识别App关键功能的方法及装置
CN112417300A (zh) * 2020-12-10 2021-02-26 平安普惠企业管理有限公司 产品漏洞方案查询方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN109783807B (zh) 2022-10-28

Similar Documents

Publication Publication Date Title
CN106294593B (zh) 结合从句级远程监督和半监督集成学习的关系抽取方法
CN104268197B (zh) 一种行业评论数据细粒度情感分析方法
CN107656958B (zh) 一种多数据源数据的归类方法及服务器
CN110210016B (zh) 基于风格引导的双线性神经网络虚假新闻检测方法及系统
CN103577989B (zh) 一种基于产品识别的信息分类方法及信息分类系统
CN104331506A (zh) 一种面向双语微博文本的多类情感分析方法与系统
CN109783807A (zh) 一种针对app软件缺陷的用户评论挖掘方法
CN106202032A (zh) 一种面向微博短文本的情感分析方法及其系统
CN107180023A (zh) 一种文本分类方法及系统
CN103729474A (zh) 用于识别论坛用户马甲账号的方法和系统
CN102411611B (zh) 一种面向即时交互文本的事件识别与跟踪方法
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
CN101251862A (zh) 一种基于内容的问题自动分类方法及其系统
CN101980211A (zh) 一种机器学习模型及其建立方法
CN101980210A (zh) 一种标的词分类分级方法及系统
CN104462064A (zh) 一种移动终端信息通讯提示输入内容的方法和系统
CN106126502A (zh) 一种基于支持向量机的情感分类系统及方法
CN108108468A (zh) 一种基于概念和文本情感的短文本情感分析方法和装置
CN110619051A (zh) 问题语句分类方法、装置、电子设备及存储介质
CN106354818A (zh) 基于社交媒体的动态用户属性提取方法
CN107357785A (zh) 主题特征词抽取方法及系统、情感极性判断方法及系统
CN110287314A (zh) 基于无监督聚类的长文本可信度评估方法及系统
CN105224955A (zh) 基于微博大数据获取网络服务状态的方法
CN111309855A (zh) 一种文本信息的处理方法及系统
CN106569996A (zh) 一种面向中文微博的情感倾向分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant