CN107016044B

CN107016044B - 一种数据可视化处理的方法及装置

Info

Publication number: CN107016044B
Application number: CN201710086843.1A
Authority: CN
Inventors: 费驰; 李思远; 解斐
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2017-02-17
Filing date: 2017-02-17
Publication date: 2020-07-24
Anticipated expiration: 2037-02-17
Also published as: CN107016044A

Abstract

本申请公开了一种数据可视化处理的方法及装置，以解决采用现有技术在进行数据处理时，由于仅能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。方法包括：获取与待处理数据属于相同类别的聚类数据，及获取所述聚类数据的上下文数据；按照预设的可视化对象生成规则，生成所述聚类数据及其上下文数据的可视化对象。

Description

一种数据可视化处理的方法及装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种数据可视化处理的方法及装置。

背景技术

目前常见的客服系统，通常由智能机器人客服和人工客服组成，其中智能机器人客服一般是由底层搜索引擎(比如，ISearch5搜索引擎)结合预先设置完成的知识库以及特定算法构成的，并通过即时通讯工具以实现对用户提问的自动回答。当用户提出一个问题时，智能机器人客服将识别该问题对应的知识点(即，用户提出问题的具体类型)，并通过搜索引擎在预先设置好的知识库中搜索出与用户提出问题的知识点对应的答案，进而将搜索到的答案返回给用户。

客服系统在进行客户服务的过程中，一般是由智能机器人客服与人工客服配合使用的，当接收到来自客户的会话消息时，一般会由客服系统中的智能机器人客服向用户提供服务。当客户认为智能机器人客服无法解决其提出的问题时，客户可以通过手动点击切换至人工客服进行服务，或者客服系统自动为客户切换为人工服务。

当出现客户将智能机器人客服切换为人工客服，或者客户在服务结束后为智能机器人客服打出差评的情况时，往往意味着智能机器人客服无法满足客户的某些需求，我们一般将上述这些情况称为“Badcase”，而“Badcase”情况往往是由于智能机器人客服对用户的某个问题的回答不正确而造成的，因此我们可以将造成“Badcase”出现的“用户提问”以及“智能机器人客服的回答”等服务质量数据称为“Badcase”数据。

为了尽可能的在实际使用中避免“Badcase”的出现，以提高客户使用智能机器人客服时的使用体验，客服系统的后台维护人员需要定期对智能机器人客服出现的“Badcase”数据进行优化。

现有技术中，为了达到对智能机器人客服出现的“Badcase”数据进行优化的目的，需要不同岗位的后台工作人员相互协助，以筛选出智能机器人客服运行过程中所产生的“Badcase”数据，并将获得的不同种类的“Badcase”数据分配给对应的工作人员进行分析处理，由于后台工作人员在处理“Badcase”数据时，往往只能对单条“Badcase”数据进行分析，而根据单条“Badcase”数据后台工作人员所能获得了“Badcase”信息也较为单一，因此可能造成得到的分析结果的准确度较低。

因而，如何避免由于只能对单条“Badcase”数据进行分析而导致分析结果准确度较低的问题，成为现有技术亟待解决的问题。

发明内容

本申请实施例提供一种数据可视化处理的方法，用以解决采用现有技术在进行数据处理时，由于仅能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。

本申请实施例还提供一种数据可视化处理的装置，用以解决采用现有技术在进行数据处理时，由于仅能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。

本申请实施例采用下述技术方案：

一种数据可视化处理的方法，包括：

获取与待处理数据满足预设聚类条件的聚类数据，及获取所述聚类数据的上下文数据；

按照预设的可视化对象生成规则，生成所述聚类数据及其上下文数据的可视化对象。

一种数据可视化处理的装置，包括：

数据获取单元，用于获取与待处理数据属于相同类别的聚类数据，及获取所述聚类数据的上下文数据；

可视化对象生成单元，用于按照预设的可视化对象生成规则，生成所述聚类数据及其上下文数据的可视化对象。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

由于在用户选择出期望处理的数据后，服务器可以根据用户选择的待处理数据，获取与待处理数据满足预设聚类条件的聚类数据，以及这些聚类数据的上下文数据，并按照预设的可视化对象生成规则，根据聚类数据以及聚类数据对应的上下文数据，生成聚类数据及其上下文数据的可视化对象，进而通过生成的可视化对象向用户展示聚类数据以及上下文数据，用户在对通过可视化对象展示的聚类数据进行分析处理时，不可以对聚类数据进行分析，还可以通过生成的可视化对象，对聚类数据的上下文数据一并进行分析，从而可以通过结合上下文，对待处理数据进行更全面的分析，以得到更准确的分析处理结果，进而避免了采用现有技术在对待处理数据进行分析时，由于只能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例提供的一种数据可视化处理的方法的具体流程示意图；

图2为本申请实施例提供的一种数据展示效果图；

图3为本申请实施例提供的一种用户与智能机器人客服的交互示意图；

图4为本申请实施了提供的一种数据处理的具体流程示意图；

图5为本申请实施了提供的一种生成聚类数据可视化对象的具体流程示意图；

图6为本申请实施了提供的一种聚类数据可视化展示的效果示意图；

图7为本申请实施例提供的一种数据可视化处理的装置的具体结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本申请各实施例提供的技术方案。

实施例1

本申请实施例提供了一种数据可视化处理的方法，用以解决采用现有技术在进行数据处理时，由于仅能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。

本申请实施例提供的数据处理方法的执行主体，可以但不限于为手机、平板电脑以及个人电脑(Personal Computer，PC)等终端设备中的至少一种。此外，该方法的执行主体，也可以是服务器，例如，智能机器人客服的服务器、购物网站的服务器、搜索网站的服务器，等等。为便于描述，下文以该方法的执行主体为用户使用的个人电脑为例，对该方法的实施方式进行介绍。可以理解，该方法的执行主体为个人电脑只是一种示例性的说明，并不应理解为对该方法的限定。

该方法的具体流程示意图如图1所示，主要包括下述步骤：

步骤11，获取与待处理数据属于相同类别的聚类数据，及获取所述聚类数据的上下文数据；

对于目前大部分网站的后台服务器而言，后台服务器会将用户每天对该网站访问而产生的访问记录(比如，包括用户打开了什么页面、查询了什么东西以及咨询了什么问题)以及网站的运行日志均会被保存在指定的数据库中，以便当网站出现故障时，后台工作人员能够通过个人电脑登录后台服务器，对服务器数据库中保存的数据进行分析，以确定网站故障的来源。

以智能机器人客服的服务器为例，智能机器人客服每天会为大量用户提供服务，用户通过文字或者语音的方式向智能机器人客服提出问题，智能机器人客服通过在预先设置的知识库查找与用户提出的问题对应的知识点，以确定与用户提问对应的回答，进而将查找到的答案发送给用户使用的终设备进行展示，以达到自动为用户回答用户提问的效果。在这种情况下，智能机器人客服的后台服务器可以对每个用户与智能机器人客服的会话记录进行保存，以便当后续出现用户差评的时候，后台工作人员可以通过查找服务器中保存的会话记录，分析出现差评的原因。同时为了便于区分不同会话，服务器在对用户与智能机器人客服的会话进行保存时，将同时生成一个用于唯一表示该会话的标识。

如图2所示，为用户通过个人电脑登录网站后台服务器以后，查看到的该服务器中保存的网站数据效果图，图2中实线框所围的区域“1”中显示有服务器中保存的网站数据，用户根据需要可以通过特定操作(比如点击操作)，在展示的数据中选出若干条数据，作为待处理数据。

一般地，在对具有相同特征的数据进行分析处理时，通常会使用相同的数据分析处理方法，因此在进行数据分析处理时，可以将具有相同特征的数据放在一起进行处理，以提高对数据分析处理的效率。基于这样的原因，当用户在终端设备上选择了待处理数据，并向服务器发送待处理数据获取请求后，服务器除了可以向用户返回待处理数据，还可以查找与待处理数据属于相同类别的聚类数据，进而将包含待处理数据在内的聚类数据一并返回给用户，后续用户可以同时对该类别的聚类数据进行处理。

这里需要说明的是，所述聚类数据一般是由具有相同特征或者相同属性的数据所组成的，且为了便于区分不同类别的聚类数据，服务器在通过数据聚类得到不同类别的聚类数据后，可以为属于相同类别的聚类数据设置相同的聚类标记。

还需要说明的是，用户可以根据需要预先设置不同种类的聚类类别，进而服务器可以根据预先设置的聚类类别对数据库中保存的数据进行聚类，以得到不同种类的聚类数据；或者也可以不需要用户预先设置聚类类别，而直接让服务器在聚类的过程中自动生成聚类类别，以完成对数据的聚类。本申请实施例对服务器采用的何种方式进行数据聚类不做具体限定。

如图3所示，为用户使用智能机器人客服进行问题咨询时，用户与智能机器人进行交互时的会话截图，其中，图中右侧深色会话框中为用户向智能机器人客服提出的问题，而左侧浅色会话框中为智能机器人客服针对用户提问而给出的回答，当用户提问结束后，该智能机器人客服的后台服务器可以对该通会话进行保存。以图3中的这通会话为例，服务器保存的该通会话中，包含了两个用户提问(即两个知识点)以及与两个提问对应的回答，其中，用户的提问“A”与答案“a”对应，用户的提问“B”与答案“b”对应。为了便于后续对一通会话中的不同提问进行区分，服务器在对会话进行保存时，会为该通会话中的每个提问设置一个对应的唯一标识，进而后续可以根据设置的唯一标识在服务器保存的数据中查询与该唯一标识对应的用户提问。

仍以智能机器人客服的后台服务器为例，服务器在对每个用户与智能机器人客服的会话记录进行保存时，将同时为每通会话中的每个提问设置一个对应的案例标识，该案例标识用于在数据库中唯一表示一个用户提问，在这种情况下，当用户通过在电脑上执行特定操作以选择待处理的用户提问后，获取与待处理的用户提问满足预设聚类条件的聚类数据具体可以包括：根据与所述待处理的用户提问对应的案例标识，查询与所述案例标识对应的聚类标记；获取所述聚类标记所对应的聚类数据。当用户通过在终端上输入特定操作选择出待处理数据后，终端可以将待处理数据所对应的案例标识发送至服务器，以使得服务器根据终端发送的案例标识确定待处理数据，进而确定待处理数据所对应的聚类标记，并根据待处理数据所对应的聚类标记，获取与该聚类标记对应的聚类数据。

通常情况下，服务器的数据库中往往保存有一定时间周期内的全部运行数据以及用户访问数据，而当服务器出现故障或者收到用户的“差评”时，往往是由于某些用户访问数据引起的。例如，以智能机器人客服为例，当智能机器人客服对用户提问的回答无法解决用户遇到的问题时，用户可能会对该次智能机器人客服的服务打上“差评”，为了避免后续再次由于同样的问题而出现用户“差评”的情况，后台工作人员需要对该条用户提问以及智能机器人客服给出的答案进行分析，进而确定是由于什么原因造成了智能机器人客服的答复与用户提问不匹配，并进行针对性的修复。在这种情况下，为了便于用户对故障数据进行分析，首先需要服务器对在数据库中保存的数据进行清洗，以筛选出需要进行分析处理的数据(如，故障数据或者智能机器人客服运行时出现的“Badcase”数据等)，并向用户展示这些数据，以便于用户从这些数据中选择数据进行处理。具体的，在执行步骤11之前，本申请实施例提供的方法还可以包括：对采集到的数据进行数据清洗，以获取其中的指定类型的数据；对获取到的所述指定类型的数据进行聚类处理，确定所述指定类型的数据所对应的聚类标记。

当服务器中出现故障数据或者“Badcase”数据时(比如出现服务器宕机或者用户差评时)，服务器会为这些故障数据或者“Badcase”数据打上特定标记，并将这些故障数据或者“Badcase”数据以及特定标记一同保存在数据库中，进而后续服务器可以根据这些特定标记，从数据库中确定出用户需要分析处理的数据。

例如，智能机器人客服在对用户的提问进行答复后，智能机器人客服一般会向用户询问“回答是否解决用户的问题”，当用户选择“是”时，则说明用户对智能机器人本次回答感到满意，而当用户选择“否”时，则意味着用户对智能机器人本次回答不满意，后续服务器在对用户与智能机器人客户的聊天记录进行保存时，还会将用户针对智能机器人客服给出的评价一并保存，后续当用户需要对“Badcase”数据进行分析时，服务器可以在保存的数据中筛选出携带有评价“否”的数据，作为“Badcase”数据，并将筛选出的这些“Badcase”数据返回给客户端进行展示，以便用户对这些“Badcase”数据进行分析。

以服务器对智能机器人客服的聊天数据进行保存为例，具体介绍在向工作人员展示需要处理的“用户提问”之前，服务器是如何收集“用户提问”数据并处理的，该过程的具体流程参见图4，主要包括以下步骤：

步骤A：智能机器人客服定期将聊天记录同步到服务器；

步骤B：服务器根据聊天记录所对应的用户评价，清洗出智能机器人客服的“Badcase”聊天数据；

步骤C：服务器通过聚类算法，对清洗出的“Badcase”聊天数据进行聚类，确定这些“Badcase”聊天数据对应的聚类标记。如关于支付的“Badcase”，对应的聚类标记可以为“绑定银行卡”、“更改支付账号”等。

通过执行上述步骤A～步骤C，服务器可以清洗出工作人员可能需要处理的“Badcase”聊天数据，并可以确定这些“Badcase”聊天数据分别对应的聚类标记。

以智能机器人客服的后台工作人员通过对“Badcase”数据进行分析，以确定产生用户差评的原因为例，采用现有技术，后台工作人员可能会根据需要对应后台服务器统计出的“Badcase”数据进行逐条分析，每条“Badcase”数据由一条“用户提问”以及智能机器人客服针对该条“用户提问”给出的答案组成，工作人员通过查看“用户提问”与智能智能机器人客服针对该条“用户提问”给出的答案是否匹配，来判断该条“Badcase”数据出现的原因。而在实际使用中，用户在于与智能机器人客服的一次交谈中，可能提出了多个问题，且这些问题之间往往存在着一定的联系，在这种情况下，在对这通会话中出现的“Badcase”数据进行分析时，如果仅仅对其中的某一条“Badcase”数据进行分析，则可能由于根据单条“Badcase”数据工作人员无法获得较全面的信息，而造成得到的分析结果准确性较差。

为了避免上述问题，本申请实施例提供的方法在获取与待处理数据属于相同类别的聚类数据后，还将获取这些聚类数据的上下文数据，在一种实施方式中，具体可以根据聚类数据中的会话标识，获取所述聚类数据的上下文数据。由于为了能够区分不同会话，服务器在对用户与智能机器人客服的会话进行保存时，将生成一个用于唯一表示该会话的会话标识，并且会为该通会话中的每个“用户提问”均打上该会话标识，则当几个聚类数据具有相同的会话标识时，可以确定这几个聚类数据属于同一通会话，即这几个聚类数据互为上下文数据。

步骤12，按照预设的可视化对象生成规则，生成所述聚类数据及其上下文数据的可视化对象。

通过执行步骤11，用户使用的终端设备获得了包括待处理数据在内的聚类数据，以及聚类数据的上下文数据，为了便于用户对这些聚类数据进行分析处理，终端设备可以按照预先设置好的可视化对象生成规则，生成用于展示这些聚类数据以及上下文数据的可视化对象，从而通过这种可视化的方式，对聚类数据及其上下文数据进行更加直观的展示。

在一种实施方式中，步骤12的具体实现方式可以包括：根据所述待处理数据对应的聚类标记，在预设的图片画布中渲染生成用于展示所述聚类标记的第一可视化对象；根据所述聚类数据，在所述第一可视化对象上渲染生成用于展示所述聚类数据的第二可视化对象；根据所述第一可视化对象在所述图片画布中的位置坐标，按照所述聚类数据与所述上下文数据在会话中的顺序，在所述图片画布中依次生成用于展示所述上下文数据的第三可视化对象。

其中，这里所说的可视化对象，可以是指各种格式的矢量图形，比如可以是JPGE格式的图形或者是GIF格式的图形等，在一种实施方式中，本申请实施例中生成的可视化对象可以以可缩放矢量图形(Scalable Vector Graphics，SVG)格式为优，SVG是一种是基于可扩展标记语言(XML)的、用于描述二维矢量图形的一种图形格式。SVG格式的图片与JPEG格式以及GIF格式的图像相比，尺寸更小，且可压缩性更强，同时SVG格式的图片是可伸缩的，SVG图片可在任何的分辨率下被高质量地打印，且SVG图像中的文本是可选的，同时也是可搜索的。基于SVG格式图片的上述优点，因此本申请实施例中生成的所述聚类数据及其上下文数据的可视化对象可以为SVG格式的图片。

以用户使用电脑登录后台服务器选择数据进行处理为例，在用户通过电脑选择了待处理的数据后，生成待处理数据的可视化对象的具体流程示意图如图5所示，主要包括以下步骤：

步骤a：电脑将用户选择的待处理数据的ID发送至后台服务器；

步骤b：后台服务器根据接收到的数据ID，查找与该数据ID对应的所有聚类标记，并确定这些聚类标记中包含的“用户提问”数据，将这些“用户提问”数据作为与用户选择的待处理数据属于相同类别的聚类数据；

步骤c：后台服务器确定这些聚类数据所包含的会话标识，并根据会话标识确定这些“用户提问”数据的上下文数据；

步骤d：后台服务器将返回查找到的聚类数据以及与聚类数据对应的上下文数据发送至用户使用的电脑；

步骤e：电脑根据接收到的待处理数据所对应的聚类标记，在预设的图片画布中渲染生成用于展示该聚类标记的图片(为了便于描述，后文称为第一图片)；

需要说明的是，电脑会根据预设的图片画布的尺寸大小，在图片画布中选择合适的位置生成用于展示该聚类标记的图片，并将该图片在图片画布中的位置坐标确定为坐标原点。

步骤f：电脑根据接收到的聚类数据，在通过执行步骤e生成的图片上方生成用于展示这些聚类数据的图片；

需要说明的是，可以采用悬浮弹出框的方式，在第一图片上生成用于展示聚类数据的图片(后称为第二图片)。例如，可以使用气泡卡片(Popver)的形式，生成用于展示聚类数据的气泡式卡片浮层。

步骤j：按照聚类数据与其上下文数据在会话中的顺序，在图片画布中依次生成用于展示所述上下文数据的图片。

需要说明的是，假设某个聚类数据在一通会话中排列在第一位，那么当生成用于展示该聚类数据的上下文数据时，将依次在用于展示该聚类数据的第二图片的右侧生成用于展示该聚类数据的下文数据的图片。

以用户待处理数据为智能机器人客服记录的“用户提问”会话为例，通过执行上述步骤a～j，展示给用户的可视化图片如图6所示，用户可以通过生成的图片，直观的看到待处理数据以及待处理数据的上下文数据，从而可以更全面的对待处理数据进行分析处理。

采用本申请实施例1提供的数据可视化处理的方法，由于在用户选择出期望处理的数据后，服务器可以根据用户选择的待处理数据，获取与待处理数据满足预设聚类条件的聚类数据，以及这些聚类数据的上下文数据，并按照预设的可视化对象生成规则，根据聚类数据以及聚类数据对应的上下文数据，生成聚类数据及其上下文数据的可视化对象，进而通过生成的可视化对象向用户展示聚类数据以及上下文数据，用户在对通过可视化对象展示的聚类数据进行分析处理时，不仅可以对聚类数据进行分析，还可以通过生成的可视化对象，对聚类数据的上下文数据一并进行分析，从而可以通过结合上下文，对待处理数据进行更全面的分析，以得到更准确的分析处理结果，进而避免了采用现有技术在对待处理数据进行分析时，由于只能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。

实施例2

本申请实施例提供了一种数据可视化处理的装置，用以解决采用现有技术在进行数据处理时，由于仅能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。该装置的具体结构示意图如图7所示，主要包括：数据获取单元21以及可视化对象生成单元22。

其中，数据获取单元21，用于获取与待处理数据属于相同类别的聚类数据，及获取所述聚类数据的上下文数据；

可视化对象生成单元22，用于按照预设的可视化对象生成规则，生成所述聚类数据及其上下文数据的可视化对象。

在一种实施方式中，数据获取单元21，具体用于：根据与所述待处理数据对应的案例标识，查询与所述案例标识对应的聚类标记；获取所述聚类标记所对应的聚类数据。

在一种实施方式中，数据获取单元21，具体用于：获取与所述聚类数据对应的会话的会话标识；根据所述会话标识，获取所述聚类数据的上下文数据。

在一种实施方式中，所述待处理数据为指定类型的数据，则在数据获取单元21获取与待处理数据满足预设聚类条件的聚类数据之前，所述装置通过数据清洗单元和数据聚类单元对数据进行清洗和聚类。

数据清洗单元，用于对采集到的数据进行数据清洗，以获取其中的指定类型的数据。数据聚类单元，用于对获取到的所述指定类型的数据进行聚类处理，确定所述指定类型的数据所对应的聚类标记。

在一种实施方式中，数据获取单元21，具体用于：获取与所述待处理数据具有相同聚类标记的服务质量数据作为所述聚类数据，其中，所述服务质量数据包括与服务质量数据对应的问句以及与所述问句匹配的知识点，根据所述知识点能够查找到预先保存的所述问句的答案。

在一种实施方式中，可视化对象生成单元22，具体用于：根据所述聚类数据对应的聚类标记，在预设的图片画布中渲染生成用于展示所述聚类标记的第一可视化对象；根据所述聚类数据，在所述第一可视化对象上渲染生成用于展示所述聚类数据的第二可视化对象；根据所述第一可视化对象在所述图片画布中的位置坐标，按照所述聚类数据与所述上下文数据在会话中的顺序，在所述图片画布中依次生成用于展示所述上下文数据的第三可视化对象。

在一种实施方式中，上述可视化对象为可缩放矢量图形。

在一种实施方式中，可视化对象生成单元22，具体用于：在所述第一可视化对象上以悬浮弹出框的方式渲染生成用于展示所述聚类数据的第二可视化对象。

采用本申请实施例2提供的数据可视化处理的装置，由于在用户选择出期望处理的数据后，服务器可以根据用户选择的待处理数据，获取与待处理数据满足预设聚类条件的聚类数据，以及这些聚类数据的上下文数据，并按照预设的可视化对象生成规则，根据聚类数据以及聚类数据对应的上下文数据，生成聚类数据及其上下文数据的可视化对象，进而通过生成的可视化对象向用户展示聚类数据以及上下文数据，用户在对通过可视化对象展示的聚类数据进行分析处理时，不仅可以对聚类数据进行分析，还可以通过生成的可视化对象，对聚类数据的上下文数据一并进行分析，从而可以通过结合上下文，对待处理数据进行更全面的分析，以得到更准确的分析处理结果，进而避免了采用现有技术在对待处理数据进行分析时，由于只能针对单条待处理数据进行分析，而造成分析结果的准确性较差的问题。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种数据可视化处理的方法，其特征在于，包括：

对采集到的数据进行数据清洗，以获取其中的指定类型的数据；对获取到的所述指定类型的数据进行聚类处理，确定所述指定类型的数据所对应的聚类标记；

根据待处理数据对应的聚类标记，获取与所述待处理数据属于相同类别的聚类数据，及，根据所述聚类数据对应的会话的会话标识，获取所述聚类数据的上下文数据；

按照预设的可视化对象生成规则，生成所述聚类数据及其上下文数据的可视化对象；

所述可视化对象生成规则包括：根据所述聚类数据对应的聚类标记，在预设的图片画布中渲染生成用于展示所述聚类标记的第一可视化对象；根据所述聚类数据，在所述第一可视化对象上渲染生成用于展示所述聚类数据的第二可视化对象；根据所述第一可视化对象在所述图片画布中的位置坐标，按照所述聚类数据与所述上下文数据在会话中的顺序，在所述图片画布中依次生成用于展示所述上下文数据的第三可视化对象。

2.如权利要求1所述的方法，其特征在于，获取与待处理数据属于相同类别的聚类数据，包括：

获取与所述待处理数据对应的案例的案例标识；

根据所述案例标识，查询与所述案例标识对应的聚类标记；

获取所述聚类标记所对应的聚类数据。

3.如权利要求1所述的方法，其特征在于，所述指定类型为服务质量类型；则所述获取与待处理数据满足预设聚类条件的聚类数据，包括：

获取与所述待处理数据具有相同聚类标记的服务质量数据作为所述聚类数据，其中，所述服务质量数据包括与服务质量数据对应的问句以及与所述问句匹配的知识点。

4.如权利要求1所述的方法，其特征在于，所述第一可视化对象、第二可视化对象和第三可视化对象为可缩放矢量图形。

5.如权利要求1所述的方法，其特征在于，在所述第一可视化对象上渲染生成用于展示所述聚类数据的第二可视化对象，包括：

在所述第一可视化对象上以悬浮弹出框的方式渲染生成用于展示所述聚类数据的第二可视化对象。

6.一种数据可视化处理的装置，其特征在于，包括：

数据清洗单元，用于对采集到的数据进行数据清洗，以获取其中的指定类型的数据；

数据聚类单元，用于对获取到的所述指定类型的数据进行聚类处理，确定所述指定类型的数据所对应的聚类标记；

数据获取单元，用于根据待处理数据对应的聚类标记，获取与所述待处理数据属于相同类别的聚类数据，及，根据所述聚类数据对应的会话的会话标识，获取所述聚类数据的上下文数据；

可视化对象生成单元，用于按照预设的可视化对象生成规则，生成所述聚类数据及其上下文数据的可视化对象；

所述可视化对象生成单元，还用于根据所述聚类数据对应的聚类标记，在预设的图片画布中渲染生成用于展示所述聚类标记的第一可视化对象；根据所述聚类数据，在所述第一可视化对象上渲染生成用于展示所述聚类数据的第二可视化对象；根据所述第一可视化对象在所述图片画布中的位置坐标，按照所述聚类数据与所述上下文数据在会话中的顺序，在所述图片画布中依次生成用于展示所述上下文数据的第三可视化对象。

7.如权利要求6所述的装置，其特征在于，

所述数据获取单元，用于获取与所述待处理数据对应的案例的案例标识；根据所述案例标识，查询与所述案例标识对应的聚类标记；获取所述聚类标记所对应的聚类数据。

8.如权利要求6所述的装置，其特征在于，所述指定类型为服务质量类型；

所述数据获取单元，用于获取与所述待处理数据具有相同聚类标记的服务质量数据作为所述聚类数据，其中，所述服务质量数据包括与服务质量数据对应的问句以及与所述问句匹配的知识点。

9.如权利要求6所述的装置，其特征在于，所述第一可视化对象、第二可视化对象和第三可视化对象为可缩放矢量图形。

10.如权利要求6所述的装置，其特征在于，

所述可视化对象生成单元，用于在所述第一可视化对象上以悬浮弹出框的方式渲染生成用于展示所述聚类数据的第二可视化对象。