CN102298587B - 满意度调查方法及系统 - Google Patents

满意度调查方法及系统 Download PDF

Info

Publication number
CN102298587B
CN102298587B CN201010208910.0A CN201010208910A CN102298587B CN 102298587 B CN102298587 B CN 102298587B CN 201010208910 A CN201010208910 A CN 201010208910A CN 102298587 B CN102298587 B CN 102298587B
Authority
CN
China
Prior art keywords
word
score value
combination
word combination
weights
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010208910.0A
Other languages
English (en)
Other versions
CN102298587A (zh
Inventor
刘致远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201010208910.0A priority Critical patent/CN102298587B/zh
Publication of CN102298587A publication Critical patent/CN102298587A/zh
Application granted granted Critical
Publication of CN102298587B publication Critical patent/CN102298587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供了一种满意度调查方法及系统,所述方法包括以下步骤:接收用户针对调查问题所输入的答复信息;对所述答复信息中的自然语言进行处理,包括:对答复信息中的自然语言进行分句处理,对分句后的每一个句子去掉其中的停用词后进行分词处理,得到候选词库;根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值。采用本发明提供的满意度调查方法及系统,能提高调查的准确度。

Description

满意度调查方法及系统
【技术领域】
本发明涉及互联网技术领域,尤其涉及一种满意度调查方法及系统。
【背景技术】
要了解互联网产品的好坏,需要统计用户对互联网产品的满意度。传统的调查方式有针对互联网产品开通客服电话,当用户拨打进客服电话,则自动生成满意度调查问卷供用户填写或选择。另外,还可以开设问答社区,或通过邮件、即时通讯和短信等方式下发调查问卷,这些调查问卷通常会提供许多问题供用户选择。例如,用户在电脑中卸载了某一软件后,界面会弹出调查问卷,该问卷包含了许多问题,每个问题后附带了许多选项,如:“您删除该软件的原因是:(1)影响网络速度;(2)程序会不定时的崩溃或出错;(3)我已经习惯了其他版本的同类软件;(4)界面不熟悉,不知道如何使用;(5)程序总是在自己不需要运行的时候弹出来”。同时,问卷调查中还可包含对某个属性进行打分的选项,如:“您对上述回答的评价如何?5分满意,4分基本满意,3分比较满意,2分不太满意,1分不满意”。
然而,在传统方式下,由于调查问卷是事先所设定的固定形式,其选项通常繁多复杂,过于死板,内容也只能反映大部分用户的想法。并且,用户往往会不耐烦的随意选择,且还有恶意的用户会利用自动机器人脚本进行自动的反复的回答并提交,往往会得到不真实的回答。因此传统的这种用户满意度调查方式调查的准确度不高。此外,每次需要进行新的问卷调查时,还必须精心的设计调查问卷,不利于调查的扩展。
【发明内容】
基于此,有必要提供一种能提高调查准确度的满意度调查方法。
一种满意度调查方法,包括以下步骤:接收用户针对调查问题所输入的答复信息;对所述答复信息中的自然语言进行处理,包括:对答复信息中的自然用于进行分句处理,对分句后的每一个句子去掉其中的停用词后进行分词处理,得到候选词库;根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值。
其中,对答复信息中的自然语言进行处理的步骤还可包括:按照排列组合的方式提取每个句子分词处理后的词语组合;对每个词语组合,当该词语组合不在候选词库中时,将所述词语组合加入候选词库中;对候选词库中的词语组合进行词性和语义分析,得到词语组合中赋有分值或权值的词。
所述候选词库中的词语组合中的词的赋分值和权值可以通过如下方式获得:按照预先设定的词与分值或权值的对应关系,对词语组合中的每个词赋予分值或权值。
其中,根据分值和权值计算答复信息的满意度值的步骤具体可以是:提取候选词库中的每个词语组合,获取所述词性和语义分析后得到的赋有分值或权值的词,根据所述词的分值或权值计算得到每个词语组合的分值,根据所述词语组合的分值计算得到答复信息的满意度值。
其中,根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值的步骤具体可以是:
根据所述词语组合中的词的分值或权值计算词语组合的分值,所述词语组合的分值的计算方式如下:当词语组合中既包含赋了分值的词又包含赋了权值的词时,将分值与权值相乘,得到词语组合的分值,当词语组合中包含两个以上赋了相同权值的词时,仅使用一个权值与分值相乘,当词语组合中仅包含赋了分值的词时,词语组合的分值为赋了分值的词的分值之和;
其中,每个句子的满意度值为该句子的所有词语组合的分值的平均值。
此外,还有必要提供一种能提高调查准确度的满意度调查系统。
一种满意度调查系统,包括:信息获取模块,用于接收用户针对调查问题所输入的答复信息;自然语言处理模块,对所述答复信息中的自然语言进行处理和分析,得到候选词库;统计模块,根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值;自然语言处理模块可以包括:分句模块,对答复信息中的自然语言进行分句处理;分词模块,对分句后的每一个句子去掉其中的停用词后进行分词处理。
其中,所述自然语言处理模块还可包括:候选词库生成模块,用于按照排列组合的方式提取每个句子分词处理后的词语组合,并对每个词语组合,当该词语组合不在候选词库中时,将所述词语组合加入候选词库中;词性和语义分析模块,对候选词库中的词语组合进行词性和语义分析,得到词语组合中赋有分值或权值的词。
其中,所述统计模块可以包括:赋值模块,按照预先设定的词与分值或权值的对应关系,对词语组合中的每个词赋予分值或权值。
其中,所述统计模块还可以包括:计算模块,提取候选词库中的每个词语组合,获取所述词性和语义分析后得到的赋有分值或权值的词,根据所述词的分值或权值计算得到每个词语组合的分值,根据所述词语组合的分值计算得到所述答复信息的满意度值。
其中,所述计算模块根据候选词库中的词语组合中的词的分值和权值计算答复信息的满意度值具体是:当词语组合中既包含赋分值的词又包含赋权值的词时,将分值与权值相乘,得到词语组合的分值,当词语组合中包含两个以上赋相同权值的词时,仅使用一个权值与分值相乘,当词语组合中仅包含赋分值的词时,词语组合的分值为赋分值的词的分值之和;
其中,每个句子的满意度值为该句子的词语组合的分值的平均值。
上述满意度调查方法及系统,通过对用户输入的答复信息中的自然语言进行处理,并对得到的候选词库中的词语组合中的词赋分值或权值,从而计算得到答复信息中的满意度值,无需提供事先设计好的固定的调查问卷,能够有效得到用户对互联网产品的真实反馈,从而提高了满意度调查的准确度。
【附图说明】
图1为一个实施例中满意度调查方法的流程图;
图2为一个实施例中对自然语言进行处理和分析的方法流程图;
图3为一个实施例中满意度调查系统的结构示意图;
图4为另一个实施例中满意度调查系统的结构示意图。
【具体实施方式】
如图1所示,一种满意度调查方法,包括以下步骤:
步骤S10,接收用户针对调查问题所输入的答复信息。在提供问卷调查时,通过提供调查问题和输入框,用户针对调查问题将答复信息填入输入框中。例如用户删除某一应用程序后,提供调查问题“您认为产品的使用效果如何”,用户将答复信息填写在输入框中。
步骤S20,对答复信息中的自然语言进行处理,得到候选词库。在一个实施例中,如图2所示,步骤S20的具体过程包括:
步骤S201中,对答复信息中的自然语言进行分句处理。用户提供的答复信息中会包含多个句子,以标点符号为准,对答复信息中的自然语言进行分句处理,得到答复信息的多个句子。这里的标点符号不包括引号、书名号等非停顿标点符号。
步骤S202中,对分句后的每一个句子去掉其中的停用词后进行分词处理。停用词是指如“的”、“得”、“地”等词,对分句后的每一个句子去掉停用词后,再进行分词处理。例如,对于句子“我觉得您的说法非常的不错”,去掉停用词后进行分词的结果为“我觉得您说法非常不错”。
步骤S203中,按照排列组合的方式提取每个句子分词处理后的词语组合。例如对于分词后得到的“我觉得您说法非常不错”,按照排列组合的方式提取其中的词语组合,如“我觉得”、“觉得您”、“您说法”、“说法非常”等,这里提取出的词语组合有三元词,如“我觉得”、“觉得您”,也有四元词,如“说法非常”,可根据需要进行调配。
步骤S204中,遍历每个词语组合。
步骤S205中,判断词语组合是否在候选词库中,若是,则进入步骤S207,否则进入步骤S206。
步骤S206中,将词语组合加入候选词库中。当遍历到的词语组合不在候选词库中时,则将其加入候选词库中,直至遍历完所有的候选词库,则候选词库中包含了提取出的词语组合,且每个词语组合是唯一的。
步骤S207,对候选词库中的词语组合进行词性和语义分析,得到词语组合中带分值或权值的词。对候选词库中的词语组合进行词性分析,分析出词语组合中包含的是动词、形容词或副词等。对候选词库中的词语组合进行语义分析,分析其动宾结构以及分析词语组合中是否包含多个同样的词等。对词语组合进行词性分析和语义分析后,即可以得到词语组合中赋有分值或权值的词。
步骤S30,根据候选词库中的词语组合中的词的分值和权值计算答复信息的满意度值。该实施例中,候选词库中的词语组合中的词的赋分值和权值通过如下方式获得:根据上述词性和语义分析结果,按照预先设定的词与分值或权值的对应关系,对词语组合的每个词赋予相应的分值或权值。通常,可设定对词语组合中的形容词赋分值,对词语组合中的副词和除形容词和副词之外的其他词则赋权值。预先可设定不同的形容词和副词分别应赋不同的分值和权值。如“好”预先设定其分值为10000.000分,“非”、“不”等预先设定应赋权值为-1.000,同理,“非常”、“特别”、“比较”等预先设定应附权值分别为2.000、2.000、1.500等,而“不好”则应赋分值为-10000.00分。
在一个实施例中,根据上述赋给词语组合中的词的分值或权值计算词语组分的分值,具体是,提取候选词库中的每个词语组合,获取词性和语义分析后得到的赋有分值或权值的词,根据词的分值或权值,计算得到每个词组组合的分值,根据词语组合的分值计算得到答复信息的满意度值。在一个优选的实施例中,根据词语组合中的词的分值和权值计算答复信息的满意度值的具体计算方式为:当词语组合中既包含赋了分值的词又包含赋了权值的词时,将分值与权值相乘,得到词语组合的分值。如对于词语组合“非常好”,则其分值计算为“非常”的权值与“好”的分值的乘值,即为10000.000*2=20000.000。当词语组合中包含两个以上赋了相同权值的词时,仅使用一个权值与分值相乘。如对于词语组合“非常非常好”,其分值应采用一个“非常”的权值进行计算。当词语组合中仅包含赋了分值的词时,词语组合的分值为赋了分值的词的分值之和。最后,得到每个句子的满意度值则为句子的所有词语组合的分值的平均值。计算得到每个句子的满意度值后,可将其保存在数据库中,以向量形式存放,用于满意度调查以及解决率调查中。
另外,为了防止恶意回答,对于回答字数不够的回答可以忽略,当检测具有相同回答的情况下,则仅采用一个回答进行计算,从而节省资源,提高效率。
如图3所示,一种满意度调查系统,包括信息获取模块10、自然语言处理模块20和统计模块30,其中,信息获取模块10用于接收用户针对调查问题所输入的答复信息;处理模块20用于对所述答复信息中的自然语言进行处理和分析,得到候选词库;统计模块30用于所述候选词库中的词语组合中的词的分值和权值计算所述答复信息中的满意度值。
如图4所示,在一个实施例中,自然语言处理模块20包括分句模块201、分词模块202、候选词库生成模块203和词性和语义分析模块204,其中:分句模块201用于对答复信息中的自然语言进行分句处理;分词模块202用于对分句后的每一个句子去掉其中的停用词后进行分词处理;候选词库生成模块203用于按照排列组合的方式提取每个句子分词处理后的词语组合,并对每个词语组合,当该词语组合不在候选词库中时,将所述词语组合加入候选词库中;词性分析模块204用于对候选词库中的词语组合进行词性和语义分析,得到词语组合中赋有分值或权值的词。
统计模块30包括赋值模块301和计算模块302,其中:赋值模块301用于按照预先设定的词与分值或权值的对应关系,对词语组合的每个词赋予分值或权值;计算模块302用于提取候选词库中的每个词语组合,获取词性和语义分析后得到的赋有分值或权值的词,根据词的分值或权值计算得到每个词语组合的分值,根据词语组合的分值计算得到答复信息的满意度值。在一个优选的实施例中,计算模块302计算答复信息的满意度值的计算方式如下:当词语组合中既包含赋分值的词又包含赋权值的词时,将分值与权值相乘,得到词语组合的分值,当词语组合中包含两个以上赋相同权值的词时,仅使用一个权值与分值相乘,当词语组合中仅包含赋分值的词时,词语组合的分值为赋分值的词的分值之和;计算模块302计算每个句子的满意度值为该句子的词语组合的分值的平均值。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种满意度调查方法,包括以下步骤:
接收用户针对调查问题所输入的答复信息;
对所述答复信息中的自然语言进行处理,包括:对答复信息中的自然语言进行分句处理,对分句后的每一个句子去掉其中的停用词后进行分词处理,得到候选词库;
根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值,具体是:提取候选词库中的每个词语组合,获取词性和语义分析后得到的赋有分值或权值的词,根据词的分值或权值,计算得到每个词语组合的分值,根据词语组合的分值计算得到答复信息的满意度值;其中,根据所述词语组合中的词的分值或权值计算词语组合的分值,所述词语组合的分值的计算方式如下:当词语组合中既包含赋了分值的词又包含赋了权值的词时,将分值与权值相乘,得到词语组合的分值,当词语组合中包含两个以上赋了相同权值的词时,仅使用一个权值与分值相乘,当词语组合中仅包含赋了分值的词时,词语组合的分值为赋了分值的词的分值之和;其中,每个句子的满意度值为该句子的所有词语组合的分值的平均值。
2.根据权利要求1所述的满意度调查方法,其特征在于,对答复信息中的自然语言进行处理的步骤还包括:
按照排列组合的方式提取每个句子分词处理后的词语组合;
对每个词语组合,当该词语组合不在候选词库中时,将所述词语组合加入候选词库中;
对候选词库中的词语组合进行词性和语义分析,得到词语组合中赋有分值或权值的词。
3.根据权利要求2所述的满意度调查方法,其特征在于,所述候选词库中的词语组合中的词的赋分值和权值通过如下方式获得:按照预先设定的词与分值或权值的对应关系,对词语组合中的每个词赋予分值或权值。
4.一种满意度调查系统,其特征在于,包括:
信息获取模块,用于接收用户针对调查问题所输入的答复信息;
自然语言处理模块,对所述答复信息中的自然语言进行处理和分析,得到候选词库;
统计模块,根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值,包括:计算模块,提取候选词库中的每个词语组合,获取词性和语义分析后得到的赋有分值或权值的词,根据所述词的分值或权值计算得到每个词语组合的分值,根据所述词语组合的分值计算得到所述答复信息的满意度值;所述计算模块根据候选词库中的词语组合中的词的分值和权值计算答复信息的满意度值具体是:当词语组合中既包含赋分值的词又包含赋权值的词时,将分值与权值相乘,得到词语组合的分值,当词语组合中包含两个以上赋相同权值的词时,仅使用一个权值与分值相乘,当词语组合中仅包含赋分值的词时,词语组合的分值为赋分值的词的分值之和;其中,每个句子的满意度值为该句子的词语组合的分值的平均值;
所述自然语言处理模块包括:
分句模块,对答复信息中的自然语言进行分句处理;
分词模块,对分句后的每一个句子去掉其中的停用词后进行分词处理。
5.根据权利要求4所述的满意度调查系统,其特征在于,所述自然语言处理模块还包括:
候选词库生成模块,用于按照排列组合的方式提取每个句子分词处理后的词语组合,并对每个词语组合,当该词语组合不在候选词库中时,将所述词语组合加入候选词库中;
词性和语义分析模块,对候选词库中的词语组合进行词性和语义分析,得到词语组合中赋有分值或权值的词。
6.根据权利要求5所述的满意度调查系统,其特征在于,所述统计模块包括:赋值模块,按照预先设定的词与分值或权值的对应关系,对词语组合中的每个词赋予分值或权值。
CN201010208910.0A 2010-06-24 2010-06-24 满意度调查方法及系统 Active CN102298587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010208910.0A CN102298587B (zh) 2010-06-24 2010-06-24 满意度调查方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010208910.0A CN102298587B (zh) 2010-06-24 2010-06-24 满意度调查方法及系统

Publications (2)

Publication Number Publication Date
CN102298587A CN102298587A (zh) 2011-12-28
CN102298587B true CN102298587B (zh) 2015-12-16

Family

ID=45359008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010208910.0A Active CN102298587B (zh) 2010-06-24 2010-06-24 满意度调查方法及系统

Country Status (1)

Country Link
CN (1) CN102298587B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593572B (zh) * 2013-11-25 2016-10-05 韩李宾 一种在线统计群体满意度的方法
CN104239699A (zh) * 2014-09-03 2014-12-24 韩李宾 一种在线统计群体满意度时个人权重的配权方法
CN105491090B (zh) * 2014-09-17 2019-01-01 阿里巴巴集团控股有限公司 网络数据处理方法及装置
CN105376433A (zh) * 2015-09-24 2016-03-02 深圳市车音网科技有限公司 语音自动回访装置、系统及其方法
CN105912828A (zh) * 2015-10-23 2016-08-31 乐视致新电子科技(天津)有限公司 用于ota升级的用户满意度调查和版本评级方法和装置
CN105488036A (zh) * 2015-11-23 2016-04-13 百度在线网络技术(北京)有限公司 基于人工智能机器人的翻译提供方法及装置
CN105740232A (zh) * 2016-01-28 2016-07-06 百度在线网络技术(北京)有限公司 一种自动提取反馈热点的方法和装置
CN105654250A (zh) * 2016-02-01 2016-06-08 百度在线网络技术(北京)有限公司 一种满意度自动测评的方法和装置
CN106682939A (zh) * 2016-12-27 2017-05-17 况客科技(北京)有限公司 一种投资领域标准问卷的管理方法
CN106940788B (zh) * 2017-03-07 2020-05-29 百度在线网络技术(北京)有限公司 智能评分方法及装置、计算机设备及计算机可读介质
US10394957B2 (en) 2017-09-25 2019-08-27 Microsoft Technology Licensing, Llc Signal analysis in a conversational scheduling assistant computing system
CN110069777A (zh) * 2019-04-03 2019-07-30 网宿科技股份有限公司 一种客服质量审计方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101038647A (zh) * 2006-03-14 2007-09-19 腾讯科技(深圳)有限公司 一种网络调查投票系统及实现方法
CN101114282A (zh) * 2007-07-12 2008-01-30 华为技术有限公司 一种分词处理方法及设备
CN101373486A (zh) * 2008-10-16 2009-02-25 北京航空航天大学 一种基于用户兴趣模型的个性化摘要系统
CN101727487A (zh) * 2009-12-04 2010-06-09 中国人民解放军信息工程大学 一种面向网络评论的观点主题识别方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080104023A1 (en) * 2006-10-27 2008-05-01 Dpdatasearch Systems Inc. Method and apparatus for reading documents and answering questions using material from these documents

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101038647A (zh) * 2006-03-14 2007-09-19 腾讯科技(深圳)有限公司 一种网络调查投票系统及实现方法
CN101114282A (zh) * 2007-07-12 2008-01-30 华为技术有限公司 一种分词处理方法及设备
CN101373486A (zh) * 2008-10-16 2009-02-25 北京航空航天大学 一种基于用户兴趣模型的个性化摘要系统
CN101727487A (zh) * 2009-12-04 2010-06-09 中国人民解放军信息工程大学 一种面向网络评论的观点主题识别方法和系统

Also Published As

Publication number Publication date
CN102298587A (zh) 2011-12-28

Similar Documents

Publication Publication Date Title
CN102298587B (zh) 满意度调查方法及系统
CN105608218B (zh) 智能问答知识库的建立方法、建立装置及建立系统
CN107480143B (zh) 基于上下文相关性的对话话题分割方法和系统
CN103336766B (zh) 短文本垃圾识别以及建模方法和装置
US7917355B2 (en) Word detection
US9524291B2 (en) Visual display of semantic information
Kherwa et al. An approach towards comprehensive sentimental data analysis and opinion mining
US20210406473A1 (en) System and method for building chatbot providing intelligent conversational service
CN107357777B (zh) 提取标签信息的方法和装置
CN103593412B (zh) 一种基于树形结构问题的应答方法及系统
JP2001134575A (ja) 頻出パターン検出方法およびシステム
RU2618374C1 (ru) Выявление словосочетаний в текстах на естественном языке
KR20110115543A (ko) 개체의 유사성을 계산하는 방법
CN101131706A (zh) 一种查询修正方法及系统
Singh et al. An approach towards feature specific opinion mining and sentimental analysis across e-commerce websites
CN112183078B (zh) 文本摘要确定方法和装置
CN111104423A (zh) Sql语句生成方法、装置、电子设备和存储介质
CN112163405A (zh) 问题的生成方法和装置
CN110287314A (zh) 基于无监督聚类的长文本可信度评估方法及系统
CN104346382B (zh) 使用语言查询的文本分析系统和方法
CN112989235A (zh) 基于知识库的内链构建方法、装置、设备和存储介质
CN111191469A (zh) 大规模语料清洗对齐方法及装置
JP2014219872A (ja) 発話選択装置、方法、及びプログラム、対話装置及び方法
CN113806483A (zh) 数据处理方法、装置、电子设备及计算机程序产品
CN111882224A (zh) 对消费场景进行分类的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant