CN102298587B

CN102298587B - 满意度调查方法及系统

Info

Publication number: CN102298587B
Application number: CN201010208910.0A
Authority: CN
Inventors: 刘致远
Original assignee: Shenzhen Tencent Computer Systems Co Ltd
Current assignee: Shenzhen Tencent Computer Systems Co Ltd
Priority date: 2010-06-24
Filing date: 2010-06-24
Publication date: 2015-12-16
Anticipated expiration: 2030-06-24
Also published as: CN102298587A

Abstract

本发明提供了一种满意度调查方法及系统，所述方法包括以下步骤：接收用户针对调查问题所输入的答复信息；对所述答复信息中的自然语言进行处理，包括：对答复信息中的自然语言进行分句处理，对分句后的每一个句子去掉其中的停用词后进行分词处理，得到候选词库；根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值。采用本发明提供的满意度调查方法及系统，能提高调查的准确度。

Description

满意度调查方法及系统

【技术领域】

本发明涉及互联网技术领域，尤其涉及一种满意度调查方法及系统。

【背景技术】

要了解互联网产品的好坏，需要统计用户对互联网产品的满意度。传统的调查方式有针对互联网产品开通客服电话，当用户拨打进客服电话，则自动生成满意度调查问卷供用户填写或选择。另外，还可以开设问答社区，或通过邮件、即时通讯和短信等方式下发调查问卷，这些调查问卷通常会提供许多问题供用户选择。例如，用户在电脑中卸载了某一软件后，界面会弹出调查问卷，该问卷包含了许多问题，每个问题后附带了许多选项，如：“您删除该软件的原因是：(1)影响网络速度；(2)程序会不定时的崩溃或出错；(3)我已经习惯了其他版本的同类软件；(4)界面不熟悉，不知道如何使用；(5)程序总是在自己不需要运行的时候弹出来”。同时，问卷调查中还可包含对某个属性进行打分的选项，如：“您对上述回答的评价如何？5分满意，4分基本满意，3分比较满意，2分不太满意，1分不满意”。

然而，在传统方式下，由于调查问卷是事先所设定的固定形式，其选项通常繁多复杂，过于死板，内容也只能反映大部分用户的想法。并且，用户往往会不耐烦的随意选择，且还有恶意的用户会利用自动机器人脚本进行自动的反复的回答并提交，往往会得到不真实的回答。因此传统的这种用户满意度调查方式调查的准确度不高。此外，每次需要进行新的问卷调查时，还必须精心的设计调查问卷，不利于调查的扩展。

【发明内容】

基于此，有必要提供一种能提高调查准确度的满意度调查方法。

一种满意度调查方法，包括以下步骤：接收用户针对调查问题所输入的答复信息；对所述答复信息中的自然语言进行处理，包括：对答复信息中的自然用于进行分句处理，对分句后的每一个句子去掉其中的停用词后进行分词处理，得到候选词库；根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值。

其中，对答复信息中的自然语言进行处理的步骤还可包括：按照排列组合的方式提取每个句子分词处理后的词语组合；对每个词语组合，当该词语组合不在候选词库中时，将所述词语组合加入候选词库中；对候选词库中的词语组合进行词性和语义分析，得到词语组合中赋有分值或权值的词。

所述候选词库中的词语组合中的词的赋分值和权值可以通过如下方式获得：按照预先设定的词与分值或权值的对应关系，对词语组合中的每个词赋予分值或权值。

其中，根据分值和权值计算答复信息的满意度值的步骤具体可以是：提取候选词库中的每个词语组合，获取所述词性和语义分析后得到的赋有分值或权值的词，根据所述词的分值或权值计算得到每个词语组合的分值，根据所述词语组合的分值计算得到答复信息的满意度值。

其中，根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值的步骤具体可以是：

根据所述词语组合中的词的分值或权值计算词语组合的分值，所述词语组合的分值的计算方式如下：当词语组合中既包含赋了分值的词又包含赋了权值的词时，将分值与权值相乘，得到词语组合的分值，当词语组合中包含两个以上赋了相同权值的词时，仅使用一个权值与分值相乘，当词语组合中仅包含赋了分值的词时，词语组合的分值为赋了分值的词的分值之和；

其中，每个句子的满意度值为该句子的所有词语组合的分值的平均值。

此外，还有必要提供一种能提高调查准确度的满意度调查系统。

一种满意度调查系统，包括：信息获取模块，用于接收用户针对调查问题所输入的答复信息；自然语言处理模块，对所述答复信息中的自然语言进行处理和分析，得到候选词库；统计模块，根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值；自然语言处理模块可以包括：分句模块，对答复信息中的自然语言进行分句处理；分词模块，对分句后的每一个句子去掉其中的停用词后进行分词处理。

其中，所述自然语言处理模块还可包括：候选词库生成模块，用于按照排列组合的方式提取每个句子分词处理后的词语组合，并对每个词语组合，当该词语组合不在候选词库中时，将所述词语组合加入候选词库中；词性和语义分析模块，对候选词库中的词语组合进行词性和语义分析，得到词语组合中赋有分值或权值的词。

其中，所述统计模块可以包括：赋值模块，按照预先设定的词与分值或权值的对应关系，对词语组合中的每个词赋予分值或权值。

其中，所述统计模块还可以包括：计算模块，提取候选词库中的每个词语组合，获取所述词性和语义分析后得到的赋有分值或权值的词，根据所述词的分值或权值计算得到每个词语组合的分值，根据所述词语组合的分值计算得到所述答复信息的满意度值。

其中，所述计算模块根据候选词库中的词语组合中的词的分值和权值计算答复信息的满意度值具体是：当词语组合中既包含赋分值的词又包含赋权值的词时，将分值与权值相乘，得到词语组合的分值，当词语组合中包含两个以上赋相同权值的词时，仅使用一个权值与分值相乘，当词语组合中仅包含赋分值的词时，词语组合的分值为赋分值的词的分值之和；

其中，每个句子的满意度值为该句子的词语组合的分值的平均值。

上述满意度调查方法及系统，通过对用户输入的答复信息中的自然语言进行处理，并对得到的候选词库中的词语组合中的词赋分值或权值，从而计算得到答复信息中的满意度值，无需提供事先设计好的固定的调查问卷，能够有效得到用户对互联网产品的真实反馈，从而提高了满意度调查的准确度。

【附图说明】

图1为一个实施例中满意度调查方法的流程图；

图2为一个实施例中对自然语言进行处理和分析的方法流程图；

图3为一个实施例中满意度调查系统的结构示意图；

图4为另一个实施例中满意度调查系统的结构示意图。

【具体实施方式】

如图1所示，一种满意度调查方法，包括以下步骤：

步骤S10，接收用户针对调查问题所输入的答复信息。在提供问卷调查时，通过提供调查问题和输入框，用户针对调查问题将答复信息填入输入框中。例如用户删除某一应用程序后，提供调查问题“您认为产品的使用效果如何”，用户将答复信息填写在输入框中。

步骤S20，对答复信息中的自然语言进行处理，得到候选词库。在一个实施例中，如图2所示，步骤S20的具体过程包括：

步骤S201中，对答复信息中的自然语言进行分句处理。用户提供的答复信息中会包含多个句子，以标点符号为准，对答复信息中的自然语言进行分句处理，得到答复信息的多个句子。这里的标点符号不包括引号、书名号等非停顿标点符号。

步骤S202中，对分句后的每一个句子去掉其中的停用词后进行分词处理。停用词是指如“的”、“得”、“地”等词，对分句后的每一个句子去掉停用词后，再进行分词处理。例如，对于句子“我觉得您的说法非常的不错”，去掉停用词后进行分词的结果为“我觉得您说法非常不错”。

步骤S203中，按照排列组合的方式提取每个句子分词处理后的词语组合。例如对于分词后得到的“我觉得您说法非常不错”，按照排列组合的方式提取其中的词语组合，如“我觉得”、“觉得您”、“您说法”、“说法非常”等，这里提取出的词语组合有三元词，如“我觉得”、“觉得您”，也有四元词，如“说法非常”，可根据需要进行调配。

步骤S204中，遍历每个词语组合。

步骤S205中，判断词语组合是否在候选词库中，若是，则进入步骤S207，否则进入步骤S206。

步骤S206中，将词语组合加入候选词库中。当遍历到的词语组合不在候选词库中时，则将其加入候选词库中，直至遍历完所有的候选词库，则候选词库中包含了提取出的词语组合，且每个词语组合是唯一的。

步骤S207，对候选词库中的词语组合进行词性和语义分析，得到词语组合中带分值或权值的词。对候选词库中的词语组合进行词性分析，分析出词语组合中包含的是动词、形容词或副词等。对候选词库中的词语组合进行语义分析，分析其动宾结构以及分析词语组合中是否包含多个同样的词等。对词语组合进行词性分析和语义分析后，即可以得到词语组合中赋有分值或权值的词。

步骤S30，根据候选词库中的词语组合中的词的分值和权值计算答复信息的满意度值。该实施例中，候选词库中的词语组合中的词的赋分值和权值通过如下方式获得：根据上述词性和语义分析结果，按照预先设定的词与分值或权值的对应关系，对词语组合的每个词赋予相应的分值或权值。通常，可设定对词语组合中的形容词赋分值，对词语组合中的副词和除形容词和副词之外的其他词则赋权值。预先可设定不同的形容词和副词分别应赋不同的分值和权值。如“好”预先设定其分值为10000.000分，“非”、“不”等预先设定应赋权值为-1.000，同理，“非常”、“特别”、“比较”等预先设定应附权值分别为2.000、2.000、1.500等，而“不好”则应赋分值为-10000.00分。

在一个实施例中，根据上述赋给词语组合中的词的分值或权值计算词语组分的分值，具体是，提取候选词库中的每个词语组合，获取词性和语义分析后得到的赋有分值或权值的词，根据词的分值或权值，计算得到每个词组组合的分值，根据词语组合的分值计算得到答复信息的满意度值。在一个优选的实施例中，根据词语组合中的词的分值和权值计算答复信息的满意度值的具体计算方式为：当词语组合中既包含赋了分值的词又包含赋了权值的词时，将分值与权值相乘，得到词语组合的分值。如对于词语组合“非常好”，则其分值计算为“非常”的权值与“好”的分值的乘值，即为10000.000*2＝20000.000。当词语组合中包含两个以上赋了相同权值的词时，仅使用一个权值与分值相乘。如对于词语组合“非常非常好”，其分值应采用一个“非常”的权值进行计算。当词语组合中仅包含赋了分值的词时，词语组合的分值为赋了分值的词的分值之和。最后，得到每个句子的满意度值则为句子的所有词语组合的分值的平均值。计算得到每个句子的满意度值后，可将其保存在数据库中，以向量形式存放，用于满意度调查以及解决率调查中。

另外，为了防止恶意回答，对于回答字数不够的回答可以忽略，当检测具有相同回答的情况下，则仅采用一个回答进行计算，从而节省资源，提高效率。

如图3所示，一种满意度调查系统，包括信息获取模块10、自然语言处理模块20和统计模块30，其中，信息获取模块10用于接收用户针对调查问题所输入的答复信息；处理模块20用于对所述答复信息中的自然语言进行处理和分析，得到候选词库；统计模块30用于所述候选词库中的词语组合中的词的分值和权值计算所述答复信息中的满意度值。

如图4所示，在一个实施例中，自然语言处理模块20包括分句模块201、分词模块202、候选词库生成模块203和词性和语义分析模块204，其中：分句模块201用于对答复信息中的自然语言进行分句处理；分词模块202用于对分句后的每一个句子去掉其中的停用词后进行分词处理；候选词库生成模块203用于按照排列组合的方式提取每个句子分词处理后的词语组合，并对每个词语组合，当该词语组合不在候选词库中时，将所述词语组合加入候选词库中；词性分析模块204用于对候选词库中的词语组合进行词性和语义分析，得到词语组合中赋有分值或权值的词。

统计模块30包括赋值模块301和计算模块302，其中：赋值模块301用于按照预先设定的词与分值或权值的对应关系，对词语组合的每个词赋予分值或权值；计算模块302用于提取候选词库中的每个词语组合，获取词性和语义分析后得到的赋有分值或权值的词，根据词的分值或权值计算得到每个词语组合的分值，根据词语组合的分值计算得到答复信息的满意度值。在一个优选的实施例中，计算模块302计算答复信息的满意度值的计算方式如下：当词语组合中既包含赋分值的词又包含赋权值的词时，将分值与权值相乘，得到词语组合的分值，当词语组合中包含两个以上赋相同权值的词时，仅使用一个权值与分值相乘，当词语组合中仅包含赋分值的词时，词语组合的分值为赋分值的词的分值之和；计算模块302计算每个句子的满意度值为该句子的词语组合的分值的平均值。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种满意度调查方法，包括以下步骤：

接收用户针对调查问题所输入的答复信息；

对所述答复信息中的自然语言进行处理，包括：对答复信息中的自然语言进行分句处理，对分句后的每一个句子去掉其中的停用词后进行分词处理，得到候选词库；

根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值，具体是：提取候选词库中的每个词语组合，获取词性和语义分析后得到的赋有分值或权值的词，根据词的分值或权值，计算得到每个词语组合的分值，根据词语组合的分值计算得到答复信息的满意度值；其中，根据所述词语组合中的词的分值或权值计算词语组合的分值，所述词语组合的分值的计算方式如下：当词语组合中既包含赋了分值的词又包含赋了权值的词时，将分值与权值相乘，得到词语组合的分值，当词语组合中包含两个以上赋了相同权值的词时，仅使用一个权值与分值相乘，当词语组合中仅包含赋了分值的词时，词语组合的分值为赋了分值的词的分值之和；其中，每个句子的满意度值为该句子的所有词语组合的分值的平均值。

2.根据权利要求1所述的满意度调查方法，其特征在于，对答复信息中的自然语言进行处理的步骤还包括：

按照排列组合的方式提取每个句子分词处理后的词语组合；

对每个词语组合，当该词语组合不在候选词库中时，将所述词语组合加入候选词库中；

对候选词库中的词语组合进行词性和语义分析，得到词语组合中赋有分值或权值的词。

3.根据权利要求2所述的满意度调查方法，其特征在于，所述候选词库中的词语组合中的词的赋分值和权值通过如下方式获得：按照预先设定的词与分值或权值的对应关系，对词语组合中的每个词赋予分值或权值。

4.一种满意度调查系统，其特征在于，包括：

信息获取模块，用于接收用户针对调查问题所输入的答复信息；

自然语言处理模块，对所述答复信息中的自然语言进行处理和分析，得到候选词库；

统计模块，根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值，包括：计算模块，提取候选词库中的每个词语组合，获取词性和语义分析后得到的赋有分值或权值的词，根据所述词的分值或权值计算得到每个词语组合的分值，根据所述词语组合的分值计算得到所述答复信息的满意度值；所述计算模块根据候选词库中的词语组合中的词的分值和权值计算答复信息的满意度值具体是：当词语组合中既包含赋分值的词又包含赋权值的词时，将分值与权值相乘，得到词语组合的分值，当词语组合中包含两个以上赋相同权值的词时，仅使用一个权值与分值相乘，当词语组合中仅包含赋分值的词时，词语组合的分值为赋分值的词的分值之和；其中，每个句子的满意度值为该句子的词语组合的分值的平均值；

所述自然语言处理模块包括：

分句模块，对答复信息中的自然语言进行分句处理；

分词模块，对分句后的每一个句子去掉其中的停用词后进行分词处理。

5.根据权利要求4所述的满意度调查系统，其特征在于，所述自然语言处理模块还包括：

候选词库生成模块，用于按照排列组合的方式提取每个句子分词处理后的词语组合，并对每个词语组合，当该词语组合不在候选词库中时，将所述词语组合加入候选词库中；

词性和语义分析模块，对候选词库中的词语组合进行词性和语义分析，得到词语组合中赋有分值或权值的词。

6.根据权利要求5所述的满意度调查系统，其特征在于，所述统计模块包括：赋值模块，按照预先设定的词与分值或权值的对应关系，对词语组合中的每个词赋予分值或权值。