CN109685560A

CN109685560A - 大数据处理方法、装置、介质及电子设备

Info

Publication number: CN109685560A
Application number: CN201811543877.XA
Authority: CN
Inventors: 林怀黎; 周可心
Original assignee: Taikang Insurance Group Co Ltd
Current assignee: Taikang Insurance Group Co Ltd
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2019-04-26

Abstract

本发明实施例提供了一种大数据处理方法、装置、计算机可读介质及电子设备，涉及计算机软件技术领域，所述方法包括：获取客户的调研数据，所述调研数据包括净推荐值、文本信息和语音信息；基于分词算法对所述文本信息进行解析，得到分词数据；对所述语音信息进行语音情绪分析，得到情绪指标数据；根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。本发明实施例的技术方案中，根据用户的调研数据的文本信息和语音信息获得分词以及情绪数据，并结合净推荐值和用户的基本信息得到用户回访方案以及用户体验统计信息，可以高效处理用户的调研数据。

Description

大数据处理方法、装置、介质及电子设备

技术领域

本发明涉及计算机软件技术领域，具体而言，涉及一种大数据处理方法、装置、计算机可读介质及电子设备。

背景技术

NPS(Net Promoter Score，净推荐值)是一种比较通用的衡量用户口碑的工具，它本身具有评价简单，收集方便的特点，一般就是请求客户对是否推荐给出分值，同时给出一段文本和语音描述给出相应分值的理由。

在此背景下，收集来的分值和相应的描述对用户有着重要的价值，依据此评价形成的分析对于发现用户痛点、优化相关流程以及提升客户满意度等都是很好的参考。但收集而来的客户体验描述信息为文本和语音等非结构化数据，因此对数据的处理提出来很高的挑战。

现有的净推荐值收集及管理系统对于数据的处理方式一般是形成报表或计算推荐值平均分数。具体地，可以对于用户反馈的净推荐值以及推荐原因进行处理，形成详细列表信息，供公司用户体验相关部门人员分析，该方案对分析人员的主观能力依赖较大，且存在时效较长的问题。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本发明实施例的目的在于提供一种大数据处理方法、装置、计算机可读介质及电子设备，进而至少在一定程度上克服不能高效处理调研数据的问题。

本发明的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本发明的实践而习得。

根据本发明实施例的第一方面，提供了一种大数据处理方法，包括：获取客户的调研数据，所述调研数据包括净推荐值、文本信息和语音信息；基于分词算法对所述文本信息进行解析，得到分词数据；对所述语音信息进行语音情绪分析，得到情绪指标数据；根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。

在本发明的一个实施例中，所述基于分词算法对所述文本信息进行解析，得到分词数据，包括：使用最大匹配算法对所述文本信息进行解析，得到分词数据。

在本发明的一个实施例中，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，包括：根据所述客户的基本信息获取所述客户的客户类别；根据所述分词数据获取所述客户的体验类别；根据所述净推荐值、所述客户类别、所述体验类别、所述情绪指标数据和设定的回访规则确定客户是否进入回访清单。

在本发明的一个实施例中，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：根据所述体验类别确定与所述体验类别对应的流程阶段类别；根据所述净推荐值、所述流程阶段类别以及所述分词数据生成客户体验统计数据，所述客户体验统计数据包括不同的体验类别与所述流程阶段类别对应关系。

在本发明的一个实施例中，所述回访方案还包括回访线索，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：根据进入回访清单的客户对应的体验类别以及情绪指标数据生成回访线索，所述回访线索包括回访待解决的问题。

在本发明的一个实施例中，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：根据进入回访清单的客户对应的流程阶段类别确定回访负责人。

在本发明的一个实施例中，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：

将进入回访清单的客户按照所述客户对应的净推荐值进行排序。

据本发明实施例的第二方面，提供了一种大数据处理装置，包括：获取单元，用于获取客户的调研数据，所述调研数据包括净推荐值、文本信息和语音信息；解析单元，用于基于分词算法对所述文本信息进行解析，得到分词数据；分析单元，用于对所述语音信息进行语音情绪分析，得到情绪指标数据；生成单元，用于根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。

根据本发明实施例的第三方面，提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述实施例中第一方面所述的大数据处理方法。

根据本发明实施例的第四方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中第一方面所述的大数据处理方法。

本发明实施例提供的技术方案可以包括以下有益效果：

在本发明的一些实施例所提供的技术方案中，根据用户的调研数据的文本信息和语音信息获得分词以及情绪数据，并结合净推荐值和用户的基本信息得到用户回访方案以及用户体验统计信息，可以高效处理用户的调研数据。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示意性示出了根据本发明的实施例的一种大数据处理方法的流程图；

图2示意性示出了根据本发明的实施例的另一种大数据处理方法的流程图；

图3示意性示出了根据本发明的实施例的一种客户体验统计数据；

图4示意性示出了根据本发明的实施例的另一种客户体验统计数据；

图5示意性示出了根据本发明的实施例的一种大数据处理装置的方框图；

图6示意性示出了根据本发明的实施例的生成单元的方框图；

图7示意性示出了适于用来实现本发明实施例的电子设备的计算机系统的结构图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本发明将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本发明的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本发明的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

图1示意性示出了本公开的示例性实施方式的一种大数据处理方法。参考图1，该大数据处理方法可以包括以下步骤：

步骤S102，获取客户的调研数据，调研数据包括净推荐值、文本信息和语音信息。

步骤S104，基于分词算法对文本信息进行解析，得到分词数据。

步骤S106，对语音信息进行语音情绪分析，得到情绪指标数据。

步骤S108，根据净推荐值、分词数据、情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。

客户的基本信息数据可以包括客户的姓名，年龄，客户等级，财务能力，偏好，职业等信息。

本方案根据用户反馈的调研数据的文本和语音进行分析，结合净推荐值以及用户的基本信息形成回访方案和客户体验统计数据，具有较高效的大数据处理能力。

在本公开的一个示例性实施例中，首先，收集相关的客户的调研数据以及用户的基本信息数据。其中，调研数据包括净推荐值、文本信息与语音信息的调研数据，客户的基本信息数据包括客户的姓名，年龄，客户等级，财务能力，偏好，职业等。

在收集调研数据之后，在步骤S104中，根据调研数据获取分词数据，具体为，使用基于Lucene中文分词的最大匹配算法对调研数据的文本信息进行解析，得到分词数据。

在本公开一个示例性实施例中，使用基于Lucene中文分词对调研数据的文本信息进行解析时，可以在基于Lucene的应用系统中选用机械分词算法中的最大匹配算法作为Lucene中文分词的核心算法。在另一个实施例中，可以通过自己开发的软件包实现对应的功能和模块。

Lucene是具有高效性和可扩展性的全文索引引擎工具包。Analysis包中主要包括Analyzer、TokenStream、Tokenizer、TokenFilter四个抽象类。他们各自的功能如下：Analyzer是一个抽象的基类。它的作用是把输入的文本即Reader流转换为Tokens流。TokenStream是一个抽象的基类，它是一系列Token的集合。Tokenizer继承自TokenStream类，它的输入是Reader流。TokenFilter继承自TokenStream类，它的输入是其他类型的Token流。

在这些类的基础上Lucene扩展了它们的功能，实现了复杂的分词功能。比如在Analyzer的基础上扩展了CNSimpleAnalyzer，在Tokenizer的基础上扩展了LowerCaseTokenizer。

在Lucene中加入中文分词功能，主要就是在Lucene的四个抽象基类的基础上进行功能扩展。下面以SimpleAnalyzer为例看一下它的代码：

public final class CNSimpleAnalyzer extends Analyzer{

public TokenStream tokenStream(String fieldName,Reader reader){

return new LowerCaseTokenizer(reader)；

}

这里，CNSimpleAnalyzer的作用是返回一个LowerCaseTokenizer类型的Token流。给Lucene加入中文分词功能可以仿照该过程加入自己的分词词典和算法，最后再把其包装成Lucene的TokenStream流。

其实现步骤如下：

首先，选择分词词典和停用词词典或者根据需要添加一些高频词词典等。

之后，编写分词算法，例如最大匹配法、逐词匹配法等。

之后，通过继承Tokenizer类定义自己的MyTokenizer类，其目的是把已经经过分词的文本流转换为TokenStream流。

最后，通过继承Analyzer定义自己的MyAnalyzer类，在类中实现以下方法：初始化词典、调用分词算法、通过引用MyTokenizer的一个实例转化文本流为TokenStream流，其目的是返回TokenStream流。

这样，在完成给Lucene的应用系统加入中文分词功能后，使用最大匹配算法对调研数据的文本信息进行分析，就可以得到分词数据。

根据该分词数据可以得到客户的体验类别。该体验类别可以为满意、基本满意、对理赔不满意等类别，且并不局限于此。

得到分词数据后，继续执行步骤S106，以获取情绪指标数据。

在步骤S106中对调研数据的语音信息进行语音情绪分析时，可选用的基于语音的情绪分析方法较多。

在其中的一种基于语音的情绪分析方法中，流程中使用的语音情绪分析主要是作为用户情绪判断的输入参数，其具体获取方式如以下程序所示：

GetAudioDataStatusRequest getAudioDataStatusRequest＝newGetAudioDataStatusRequest()；

getAudioDataStatusRequest.setAcceptFormat(FormatType.JSON)；

Map<String,Object>callMap＝Maps.newHashMap()；

callMap.put("appKey",*****)；

callMap.put("taskId",*****)；

callMap.put("tid",*****)；

getAudioDataStatusRequest.setJsonStr(JSON.toJSONString(callMap))；

GetAudioDataStatusResponse response＝client.getAcsResponse(getAudioDataStatusRequest)；

通过该程序所描述的技术方案，可以实现对调研数据的语音信息进行语音情绪分析，得到情绪指标数据。

这里，情绪指标数据指标可以数量的形式表示，例如，积极的正面的程序为高分，消极的负面的情绪为低分。

在得到分词数据、情绪指标数据之后，还需要获取客户的基本信息。

公司在日常的运营过程中，已经积累了很多有关用户的详细的基本信息，这里，客户的基本信息包括客户的客户类别。

客户的客户类别包括：客户的职业类别，客户的婚姻类别，客户的年龄类别，客户的学历类别，客户的职业类别，客户是否为VIP客户，客户的财务类别，客户的个人偏好等等。

之后，在步骤S108中，根据净推荐值、分词数据、情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据时，首先根据客户的基本信息获取客户的客户类别；再根据分词数据获取客户的体验类别；最后根据净推荐值、客户类别、体验类别、情绪指标数据和设定的回访规则确定客户是否进入回访清单。

客户是否进入回访清单，即表示回访方案中的需回访客户中是否包括该客户。这里，设定的回访规则可以设定为客户的职业、情绪指标数据、客户的净推荐值、客户的体验类别等数据与客户是否进入回访清单的对应关系，即根据客户的职业、情绪指标数据、客户的净推荐值、客户的体验类别等数据确定客户是否需要跟进沟通。

例如，可以设定回访规则中，具有设定客户类别的客户在净推荐值低于设定分值且语音情绪评估为低分的客户进入回访清单，具有设定客户类别的客户在净推荐值低于设定分值且对理赔不满意的客户进入回访清单。

根据上述设定的回访规则，可以进行以下判断：

职业是律师的净推荐值低于5分，且语音情绪评估为低分的用户进入回访清单。

公司的VIP客户即贵宾客户净推荐值低于6分，对理赔不满意的用户进入回访清单。

年收入高于16的客户净推荐值低于5分的，且对理赔不满意的用户进入回访清单。

最高学历为本科及以上的客户净推荐值低于6分的，且语音情绪评估为低分的用户进入回访清单。

回访方案还包括回访线索，因此，在步骤S108中，还需要根据进入回访清单的客户对应的体验类别以及情绪指标数据生成回访线索，回访线索包括回访待解决的问题。

这样，回放清单中具备了回访客户的名称，以及回访要解决的问题。客服人员可以根据回访客户的名称查询到客户的联系方式，通过回访要解决的问题确定回访的目的。

本公开的一个示例性实施例中，获取客户的调研数据如以下表1所示的内容(语音文件未示出)：

表1客户的调研数据

获取客户的基本信息包括如以下表2所述的内容：

表2客户的基本信息

在一种实施例中，基于以上基础数据的统计客户的调研数据和客户的基本信息数据，使用如图2所示的流程进行相应的处理：

如图2所示，首先，在步骤S202中，基于分词算法对文本信息进行解析；之后，在步骤S204中，判断调研数据中是否有存在语音信息，并在存在语音信息时，执行步骤S206，基于语音数据进行语音情绪分析；在步骤S208中，结合净推荐值以及客户的基本信息生成回访方案和客户体验统计数据；进而，在步骤S210中，生成回访线索和分类报告。

在本公开示例性实施例中，在步骤S108中，还需要生成客户体验统计数据，其具体步骤为：首先根据体验类别确定与体验类别对应的流程阶段类别；再根据净推荐值、流程阶段类别以及分词数据生成客户体验统计数据，客户体验统计数据包括不同的体验类别与流程阶段类别对应关系。图3示出了客户体验为正面的体验类别与流程阶段类别的对应关系，图4示出了客户体验为与负面的体验类别与流程阶段类别的对应关系。

如图3所示，不同阶段客户体验为正面的体验类别中，各个流程阶段中的体验类别的比例和数量如下：

在销售阶段，超过90％的客户的体验类别为产品好，不到10％的客户的体验类别为保费不高。客户体验为正面的体验类别且处于销售阶段的客户数量为12人。

在报案阶段，超过40％的客户体验类别为有人探望，超过50％的客户的体验类别为处理速度快。客户体验为正面的体验类别且处于报案阶段的客户数量为5人

在申请阶段，超过60％的客户体验类别为服务好，约30％的客户的体验类别为简单方便，其余的客户体验类别为业务员代办方便简单和理赔流程清晰。客户体验为正面的体验类别且处于申请阶段的客户数量为62人。该数量表明其对应的业务环节用户体验较好。

在报案阶段，超过40％的客户体验类别为有人探望，超过50％的客户的体验类别为处理速度快。客户体验为正面的体验类别且处于报案阶段的客户数量为73人。该数量表明其对应的业务环节用户体验较好。

如图4所示，不同阶段客户体验为负面的体验类别中，，各个流程阶段中的体验类别的比例和数量如下：

在销售阶段，75％的客户的体验类别为对产品理解有偏差，25％的客户的体验类别为产品吸引力低。客户体验为负面的体验类别且处于销售阶段的客户数量为4人。

在报案阶段，33％的客户体验类别为报案后未告知关键信息，33％的客户的体验类别为微信不能报案，33％的客户体验类别为报案坐席没有考虑客户处境。客户体验为负面的体验类别且处于报案阶段的客户数量为3人。

在申请阶段，约10％的客户体验类别为理赔状态不透明，约10％的客户的体验类别为业务员服务不好，其余的客户体验类别为理赔资料与流程复杂。客户体验为负面的体验类别且处于申请阶段的客户数量为13人。

在报案阶段，约60％的客户体验类别为不满理赔结论，约35％的客户的体验类别为个别情况时效慢，约10％的客户的体验类别为结果沟通不清楚。客户体验为负面的体验类别且处于报案阶段的客户数量为21人。

由此可见，采用该方案可以较好地根据用户的体验输入并结合现有用户数据标签，较快的形成必要的回访线索和对应的针对性的用户体验报表，对于公司运营分析和各种流程环节优化起到作用。

在步骤S108中，还需要根据进入回访清单的客户对应的流程阶段类别确定回访负责人。不同的进入回访清单的客户处于不同的流程阶段。可以根据客户所在不同的流程阶段确定不同的回访责任人。例如，可以设定销售阶段、报案阶段、申请阶段和决定阶段分别对应不同的回访责任人，有助于回访责任人有针对性地对客户进行回访处理。

在本公开示例性实施例中，还将进入回访清单的客户按照所述客户对应的净推荐值进行排序。这样，按照净推荐值的大小即可以优先跟进净推荐值最小的用户，以及时处理用户意见，提高用户满意度。

本发明实施例的大数据处理方法，根据用户的调研数据的文本信息和语音信息获得分词以及情绪数据，并结合净推荐值和用户的基本信息得到用户回访方案以及用户体验统计信息，可以高效处理用户的调研数据。

以下介绍本发明的装置实施例，可以用于执行本发明上述的大数据处理方法。如图5所示，根据本发明实施例提供的一种大数据处理装置300包括：

获取单元320，用于获取客户的调研数据，调研数据包括净推荐值、文本信息和语音信息。

解析单元340，用于基于分词算法对文本信息进行解析，得到分词数据；

分析单元360，用于对调研数据的语音信息进行语音情绪分析，得到情绪指标数据；

生成单元380，用于根据净推荐值、分词数据、情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。

在本公开示例性实施例中，解析单元340使用基于Lucene中文分词的最大匹配算法对调研数据的文本信息进行解析，得到分词数据。Lucene是一个成熟的开源项目，它是具有高效性和可扩展性的全文索引引擎工具包，因为解析单元340具有较高的效率。

在解析单元340对文本信息进行解析得到分词数据之后，分析单元360对调研数据中的语音信息进行语音情绪分析，以便结合客户的基本信息生成回访方案和客户体验统计数据。

分析单元360进行语音情绪分析，得到情绪指标数据。情绪指标数据指标可以数量的形式表示，例如，积极的正面的程序为高分，消极的负面的情绪为低分。

生成单元380用于生成回访方案和客户体验统计数据。如图6所示，其功能由第一获取子单元382，第二获取子单元384和第一确定子单元386实现。

具体地，第一获取子单元382，用于根据客户的基本信息获取客户的客户类别；第二获取子单元384，用于根据分词数据获取客户的体验类别；第一确定子单元386，用于根据净推荐值、客户类别、体验类别、情绪指标数据和设定的回访规则确定客户是否进入回访清单。

客户是否进入回访清单，即表示回访方案中的需回访客户中是否包括该客户。

这里，设定的回访规则可以设定为客户的职业、情绪指标数据、客户的净推荐值、客户的体验类别等数据与客户是否进入回访清单的对应关系，即根据客户的职业、情绪指标数据、客户的净推荐值、客户的体验类别等数据确定客户是否需要跟进沟通。

在本公开示例性实施例中，生成单元380还包括第二确定子单元和生成子单元。

第二确定子单元用于根据体验类别确定与体验类别对应的流程阶段类别。

生成子单元用于根据净推荐值、流程阶段类别以及分词数据生成客户体验统计数据，客户体验统计数据包括不同的体验类别与流程阶段类别对应关系。

采用该方案可以较好地根据用户的体验输入并结合现有用户数据标签，较快的形成必要的回访线索和对应的针对性的用户体验报表，对于公司运营分析和各种流程环节优化起到作用。

由于本发明的示例实施例的大数据处理装置的各个功能模块与上述大数据处理方法的示例实施例的步骤对应，因此对于本发明装置实施例中未披露的细节，请参照本发明上述的大数据处理方法的实施例。

本发明实施例的大数据处理装置根据用户的调研数据的文本信息和语音信息获得分词以及情绪数据，并结合净推荐值和用户的基本信息得到用户回访方案以及用户体验统计信息，可以高效处理用户的调研数据。

下面参考图7，其示出了适于用来实现本发明实施例的电子设备的计算机系统500的结构示意图。图7示出的电子设备的计算机系统500仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本发明的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时，执行本申请的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如上述实施例中所述的大数据处理方法。

例如，所述的电子设备可以实现如图1中所示的：步骤S102，获取客户的调研数据，所述调研数据包括净推荐值、文本信息和语音信息；S104，基于分词算法对所述文本信息进行解析，得到分词数据；S106，对所述语音信息进行语音情绪分析，得到情绪指标数据；步骤S108，根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。

又如，所述的电子设备可以实现如图2所示的各个步骤。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种大数据处理方法，其特征在于，所述方法包括：

获取客户的调研数据，所述调研数据包括净推荐值、文本信息和语音信息；

基于分词算法对所述文本信息进行解析，得到分词数据；

对所述语音信息进行语音情绪分析，得到情绪指标数据；

根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。

2.根据权利要求1所述的方法，其特征在于，所述基于分词算法对所述文本信息进行解析，得到分词数据，包括：

使用最大匹配算法对所述文本信息进行解析，得到分词数据。

3.根据权利要求1所述的方法，其特征在于，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，包括：

根据所述客户的基本信息获取所述客户的客户类别；

根据所述分词数据获取所述客户的体验类别；

根据所述净推荐值、所述客户类别、所述体验类别、所述情绪指标数据和设定的回访规则确定客户是否进入回访清单。

4.根据权利要求3所述的方法，其特征在于，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：

根据所述体验类别确定与所述体验类别对应的流程阶段类别；

根据所述净推荐值、所述流程阶段类别以及所述分词数据生成客户体验统计数据，所述客户体验统计数据包括不同的体验类别与所述流程阶段类别对应关系。

5.根据权利要求4所述的方法，其特征在于，所述回访方案还包括回访线索，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：

根据进入回访清单的客户对应的体验类别以及情绪指标数据生成回访线索，所述回访线索包括回访待解决的问题。

6.根据权利要求5所述的方法，其特征在于，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：

根据进入回访清单的客户对应的流程阶段类别确定回访负责人。

7.根据权利要求6所述的方法，其特征在于，所述根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和客户体验统计数据，还包括：

8.一种大数据处理装置，其特征在于，所述装置包括：

获取单元，用于获取客户的调研数据，所述调研数据包括净推荐值、文本信息和语音信息；

解析单元，用于基于分词算法对所述文本信息进行解析，得到分词数据；

分析单元，用于对所述语音信息进行语音情绪分析，得到情绪指标数据；

生成单元，用于根据所述净推荐值、所述分词数据、所述情绪指标数据以及客户的基本信息生成回访方案和/或客户体验统计数据。

9.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1至7中任一项所述的大数据处理方法。

10.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至7中任一项所述的大数据处理方法。