CN110490667B

CN110490667B - 一种数据处理方法、装置及电子设备

Info

Publication number: CN110490667B
Application number: CN201910789387.6A
Authority: CN
Inventors: 陆爱萍; 孙艳芳; 李耕
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2019-08-26
Filing date: 2019-08-26
Publication date: 2023-07-21
Anticipated expiration: 2039-08-26
Also published as: CN110490667A

Abstract

本申请公开了一种数据处理方法、装置及电子设备，方法包括：获得与目标对象关联的至少一个描述数据；描述数据是至少一个描述者针对目标对象产生的；至少基于至少一个描述数据，获得至少一个属性，属性表征所述描述者对目标对象的情感倾向；对至少一个属性进行处理，以得到处理结果；根据预设的分类规则，确定与处理结果相对应的目标类型；其中，目标类型能表征描述者对目标对象的需求倾向。可见，本申请中通过获取描述者的描述数据，并对其能够表征描述者对目标对象的情感倾向的属性进行分析，进而得到能够表征描述者对目标对象需求倾向的类型，由此避免时长过多消耗，进而能够有效提高获取用户需求倾向的效率。

Description

一种数据处理方法、装置及电子设备

技术领域

本申请涉及数据处理技术领域，尤其涉及一种数据处理方法、装置及电子设备。

背景技术

目前，为了调查用户需求状态，通常采用回访、问卷调查等方式进行，导致获得需求状态的过程所消耗的时间较长，使得需求调查的效率较低。

因此，亟需一种能够提高获取用户需求的效率的技术方案。

发明内容

有鉴于此，本申请提供一种数据处理方法、装置及电子设备，用以提高获取用户需求的效率。

本申请提供了一种数据处理方法，包括：

获得与目标对象关联的至少一个描述数据；所述描述数据是至少一个描述者针对所述目标对象产生的；

至少基于所述至少一个描述数据，获得至少一个属性，所述属性表征所述描述者对所述目标对象的情感倾向；

对所述至少一个属性进行处理，以得到处理结果；

根据预设的分类规则，确定与所述处理结果相对应的目标类型；其中，所述目标类型能表征所述描述者对所述目标对象的需求倾向。

上述方法，可选的，所述属性具有倾向级别；

其中，所述至少基于所述至少一个描述数据，获得至少一个属性，包括：

对所述描述数据进行聚类，得到至少一个倾向聚类；

其中，所述倾向聚类的数量与所述倾向级别的级别数量相对应，所述倾向聚类中包括至少一个描述数据，所述倾向聚类中的描述数据的属性具有同一个倾向级别；

其中，所述至少对所述至少一个属性进行处理，以得到处理结果，包括：

至少基于所述倾向聚类对应的倾向级别以及所述倾向聚类中的描述数据，生成处理结果。

上述方法，可选的，所述处理结果包括目标方程的方程系数，所述目标方程为表征所述倾向级别与所述倾向级别对应的描述数据之间对应关系的方程；

其中，根据预设的分类规则，确定与所述处理结果相对应的目标类型，包括：

在预设的分类规则所对应的多个分类类型中，查找与所述方程系数相匹配的目标类型。

上述方法，可选的，根据预设的分类规则所对应的多个分类类型中，查找与所述方程系数相匹配的目标类型，包括：

根据所述方程系数，获得所述方程系数与所述倾向级别之间的对应关系曲线；

获得所述对应关系曲线分别与所述分类规则所对应的多个分类类型的曲线的相似度值；

选取最高的相似度值对应的分类类型作为目标类型。

上述方法，可选的，所述至少基于所述至少一个描述数据，获得至少一个属性，包括：

获得对应所述至少一个描述数据的至少一个属性，所述属性能表征所述描述者对目标子对象的情感倾向，所述目标子对象为所述目标对象的局部；

其中，所述目标子对象用于使得所述目标类型能表征所述描述者对所述目标对象的局部需求倾向。

上述方法，可选的，还包括：

对所述至少一个描述数据进行预处理；

其中，所述预处理包括：对所述描述数据按照所述目标对象的对象标识进行分类。

上述方法，可选的，按照所述属性的倾向级别，对所述描述数据进行聚类，得到至少一个倾向聚类，包括：

获得所述描述数据之间关于描述字符的距离矩阵；

至少基于所述距离矩阵，对所述描述数据设置二维坐标；

按照所述二维坐标，对所述描述数据进行聚类，得到至少一个倾向聚类，所述倾向聚类中的描述数据的二维坐标具有关联关系。

上述方法，可选的，还包括：

利用预设的迭代算法，对所述目标方程进行拟合度优化。

本申请还提供了一种数据处理装置，包括：

数据获得单元，用于获得与目标对象关联的至少一个描述数据；所述描述数据是至少一个描述者针对所述目标对象产生的；

属性获得单元，用于至少基于所述至少一个描述数据，获得至少一个属性，所述属性表征所述描述者对所述目标对象的情感倾向；

属性处理单元，用于对所述至少一个属性进行处理，以得到处理结果；

分类单元，用于根据预设的分类规则，确定与所述处理结果相对应的目标类型；其中，所述目标类型能表征所述描述者对所述目标对象的需求倾向。

本申请还提供了一种电子设备，包括：

存储器，用于存储应用程序和所述应用程序运行所产生的数据；

处理器，用于执行所述应用程序，以实现功能：获得与目标对象关联的至少一个描述数据；所述描述数据是至少一个描述者针对所述目标对象产生的；至少基于所述至少一个描述数据，获得至少一个属性，所述属性表征所述描述者对所述目标对象的情感倾向；对所述至少一个属性进行处理，以得到处理结果；根据预设的分类规则，确定与所述处理结果相对应的目标类型；其中，所述目标类型能表征所述描述者对所述目标对象的需求倾向。

从上述技术方案可以看出，本申请公开的一种数据处理方法、装置及电子设备，在获得至少一个描述者针对目标对象产生的描述数据之后，通过在描述数据的基础上获得能表征描述者对目标对象的情感倾向的属性，进而在对这些属性进行处理得到处理结果之后，根据预设的分类规则，确定与处理结果相对应的目标类型，而以此目标类型来表征描述者对目标对象的需求倾向。可见，本申请中通过获取描述者的描述数据，并对其能够表征描述者对目标对象的情感倾向的属性进行分析，进而得到能够表征描述者对目标对象需求倾向的类型，由此避免时长过多消耗，进而能够有效提高获取用户需求倾向的效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例一提供的一种数据处理方法的流程图；

图2为本申请实施例二提供的一种数据处理装置的结构示意图；

图3为本申请实施例三提供的一种电子设备的结构示意图；

图4为本申请实施例的应用示例图；

图5为本申请实施例中需求模型的曲线示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

如图1所示，为本申请实施例一提供的一种数据处理方法的流程图，本实施例中的方法适用于能够进行数据处理的计算机或服务器等设备中，主要用于对至少一个描述者针对一个或某多个目标对象的需求倾向进行分析。

具体的，本实施例中的方法可以包括以下步骤：

步骤101：获得与目标对象关联的至少一个描述数据。

其中，描述数据是至少一个描述者针对目标对象产生的。例如，描述数据可以包括有：描述者针对目标对象进行的文字表达、图片发布、表情包使用和分数级别标记等其中的一种或多种的描述数据。描述者通过其产生的描述数据能够表征描述者针对目标对象的表达内容及情感倾向。具体的，描述数据可以为一个，相应进行后续分析能够具有针对性；描述数据也可以为多个，相应后续分析能够具有广泛应用性，也能够使得需求倾向的分析结果更加准确。

需要说明的是，目标对象可以为描述者所关注或使用的对象，如某个实体产品如笔记本、某种虚拟服务如游戏场景或者某种应用功能如聊天应用或购物应用等对象。本实施例中旨在对描述者对这些对象的需求倾向进行分析。

具体的，本实施例中可以从各种网络平台如电商、论坛和/或自媒体上获得与目标对象关联的描述数据。

需要说明的是，本实施例中的需求倾向可以理解为：描述者对目标对象的需求状态，比如描述者对目标对象的需求属于基本刚需的状态，描述者对目标对象的需求属于期望的状态，描述者对目标对象的需求属于兴奋的状态，描述者对目标对象的需求属于反向厌恶或不喜的状态，描述者对目标对象的需求属于无差异或无感的状态，等等。

步骤102：至少基于至少一个描述数据，获得至少一个属性。

其中，属性能够表征描述者对目标对象的情感倾向。本实施例中描述数据的属性可以为描述数据中体现的情感属性，如强烈情感或淡漠情感或抵触情感等。

具体的，本实施例中可以通过描述数据中的用词内容或标点符号等按照预设的属性类型进行相似度分类，来得到对应描述数据的属性，以表征出描述者对目标对象的情感倾向；

或者，本实施例中可以通过对描述数据进行基于深度学习的语义分析来得到对应描述数据的属性，以表征出描述者对目标对象的情感倾向；

或者，本实施例中可以通过对描述数据所对应的其他信息如描述时间和/或是否追加描述等信息进行分析，以得到对应描述数据的属性，以表征描述者对目标对象的情感倾向。

需要说明的是，属性所表征的情感倾向可以理解为描述者对目标对象所提供的内容、功能或服务等情感程度，如非常喜欢、比较喜欢、一般般或不喜欢等等喜好程度。

步骤103：对至少一个属性进行处理，以得到处理结果。

其中，处理结果可以理解为对描述数据的至少一个属性进行量化后得到的结果。该处理结果能够在数值上表征出描述者对目标对象的情感倾向。具体的，处理结果能表征描述者针对目标对象的情感倾向，如处理结果中的A组数值表征客户对笔记本的非常喜欢的倾向或用户对聊天应用的不喜欢的倾向等。

具体的，本实施例中可以通过对属性中的情感倾向进行量化，以得到属性所表征的情感倾向对应的处理结果；或者，本实施例中也可以按照预设的情感强度级别对属性进行分类，以得到属性所表征的情感倾向对应的处理结果；或者，本实施例中可以对表征情感倾向的属性所对应的描述数据进行统计分析，以计算出属性所表征的情感倾向对应的处理结果，等等。

步骤104：根据预设的分类规则，确定与处理结果相对应的目标类型。

其中，目标类型能表征描述者对目标对象的需求倾向。分类规则可以为预先设置的针对需求倾向所设置的规则，该分类规则中可以设置有多个分类类型，每种分类类型分别能表征描述者对目标对象的不同的需求倾向，如：表征描述者对目标对象属于基本刚需的需求倾向的类型，表征描述者对目标对象属于期望的需求倾向的类型，表征描述者对目标对象属于兴奋的需求倾向的类型，表征描述者对目标对象属于反向厌恶或不喜的需求倾向的类型，表征描述者对目标对象属于无差异或无感的需求倾向的类型，等等。

相应的，本实施例中在得到针对属性的处理结果之后，根据分类规则中的分类类型，确定与处理结果相匹配或相对应的目标类型，以该目标类型来表征描述者对目标对象的需求倾向，例如，描述者是对目标对象较为期待的需求倾向还是无感的需求倾向等。由此，基于这些分析结果来对目标对象进行改进或者改变目标对象对应的执行策略，如销售策略等。

例如，本实施例中可以将处理结果与分类规则中的每个分类类型的类型参数进行相似度比对，来匹配出与处理结果相对应的目标类型；或者，本实施例中可以将处理结果与每个分类类型的类型参数进行求差或求比值，并对差值或比值进行判断，以差值或比值是否小于阈值的判断结果来确定处理结果相对应的目标类型，等等。

由上述方案可知，本申请实施例一提供的一种数据处理方法，在获得至少一个描述者针对目标对象产生的描述数据之后，通过在描述数据的基础上获得能表征描述者对目标对象的情感倾向的属性，进而在对这些属性进行处理得到处理结果之后，根据预设的分类规则，确定与处理结果相对应的目标类型，而以此目标类型来表征描述者对目标对象的需求倾向。可见，本实施例中通过获取描述者的描述数据，并对其能够表征描述者对目标对象的情感倾向的属性进行分析，进而得到能够表征描述者对目标对象需求倾向的类型，由此避免时长过多消耗，进而能够有效提高获取用户需求倾向的效率。

进一步的，本实施例中通过从电商、自媒体和/或论坛等方式中所获得的描述数据相对于问卷调查等方式能够具有广泛性，由此，本实施例中通过扩大用于需求倾向获取的描述数据的来源或范围，使得后续所得到的需求倾向更加准确。

需要说明的是，本实施例中进行需求倾向分析所根据的描述数据可以是一个描述者针对目标对象产生的，相应的，所得到的目标类型即表征该描述者针对目标对象的需求倾向，由此可以分析出某些特定描述者针对目标对象的需求状态；或者，本实施例中进行需求倾向分析所根据的描述数据也可以包含多个描述者针对目标对象产生的数据，相应的，所得到的目标类型即能表征这些描述者针对该目标对象的需求倾向，由此可以分析出多数描述者针对某些特定目标对象的需求状态。

具体的，本实施例中在得到描述数据之后，可以对描述数据进行预处理，例如，对描述数据按照目标对象的对象标识进行分类，在目标对象被关注的一个或多个方向(层面)上对描述数据进行筛选等。具体的，由于描述数据可能来自不同的平台或者服务器，相应的，描述数据在不同来源所对应的目标对象的名称或表述方式并不相同，如同一产品在不同的购物平台上所使用的表述词语可能不同，但确实属于同一产品的情况，此时，本实施例中为了能够进一步提高数据处理的准确率和效率，可以在进行数据处理之前，先将描述数据按照目标对象的对象标识进行归类，将属于同一个目标对象的描述数据归到同一类中，这样就可以具有针对性的对目标对象分别进行需求倾向的分析。

在一种实现方式中，描述数据的属性是具有倾向级别的，如非常强烈的倾向级别或者一般的倾向级别等。以用户对服务的喜好为例，正向或积极的倾向可以为超级喜欢或无感的倾向级别；负向或消极的倾向可以比较讨厌或普通讨厌的倾向级别。

相应的，本实施例中在基于描述数据所得到的每个属性均具有其对应的倾向级别。例如，客户对笔记本的情感倾向在超级喜欢的倾向级别，或者，游戏人员对游戏界面的情感倾向在无感的倾向级别，等等。

为此，本实施例中在步骤102中在获得属性时，具体可以通过以下方式实现：

对描述数据进行聚类，得到至少一个倾向聚类。

其中，倾向聚类的数量与倾向级别的数量相对应，也就是说，本实施例中通过对描述数据进行聚类划分，划分出的每个倾向聚类分别对应于一个倾向级别，该倾向级别即为倾向聚类中描述数据的属性的倾向级别。具体的，每个倾向聚类中包括至少一个描述数据，相应的，倾向聚类中的描述数据的属性均具有同一个倾向级别，由此得到描述数据的属性的倾向级别。也就是说，本实施例在对描述数据进行聚类后，得到的倾向聚类对应于特定的一个倾向级别，而在该倾向聚类中的每个描述数据的属性均属于该倾向聚类对应的倾向级别。

例如，倾向聚类的数量与倾向级别的数量均为五种，每个倾向聚类中的描述数据的属性均具有该倾向聚类对应的倾向级别。例如，描述者对目标对象的情感倾向包括有5种(也可以分为其他多种)倾向级别：第一、第二、第三、第四和第五级别，每种倾向级别在情感倾向程度上以此递减或递增，如最强烈、非常强烈、较强烈、普通和无感的倾向级别。以用户对服务的喜好为例，如果用户对服务为正向或积极的情感倾向，那么情感倾向具有五种倾向级别：超级喜欢、非常喜欢、比较喜欢、普通喜欢和无感五种级别；如果用户对服务为负向或消极的情感倾向，那么情感倾向具有五种倾向级别：超级讨厌、非常讨厌、比较讨厌、普通讨厌和无感五种级别。

具体的，倾向级别的总数可以预先设置为固定数量，相应的，本实施例中对描述数据进行聚类成5(或者其他数量)个聚类，每个聚类对应于一个倾向级别；或者，倾向级别的总数不预先设置，而是在本实施例中对描述数据进行聚类时，按照聚类的结果来划分倾向级别的数量。

例如，本实施例中可以按照倾向级别的总数：五，对描述数据进行分类，将描述数据按照五种倾向级别划分成五个倾向聚类：最强烈级别的聚类、非常强烈级别的聚类、较强烈级别的聚类、普通级别的聚类和无感级别的聚类，每个倾向聚类中的描述数据的属性均具有该倾向聚类对应的倾向级别；

或者，本实施例中对描述数据按照描述数据自身的描述内容进行聚类，得到6个倾向聚类：最强烈级别的聚类、非常强烈级别的聚类、特别强烈的聚类、较强烈级别的聚类、普通级别的聚类和无感级别的聚类，此时倾向级别的总数为：六，相应的，每个聚类对应于一个倾向级别，此时倾向级别的总数为：六，每个倾向聚类中的描述数据的属性均具有该倾向聚类对应的倾向级别。

具体的，步骤102可以对描述数据中字符或词段等内容之间的倾向相似度进行计算归类，由此，将描述数据聚类成至少一个倾向聚类，进而得到描述数据的属性的倾向级别；或者，步骤102可以通过基于密度的聚类算法对描述数据按照属性的倾向级别进行分类，得到至少一个倾向聚类，进而得到描述数据的属性的倾向级别；或者，步骤102也可以通过其他聚类算法实现描述数据的分类，例如，利用编辑距离算法对描述数据按照属性的倾向级别进行聚类，进而得到描述数据的属性的倾向级别，如下所示：

首先，获得描述数据之间关于描述字符的距离矩阵，这里的描述字符可以理解为描述数据中的词、词段、字符或标点符号等其中的一种或多种组合的内容，由此，对描述数据中的描述字符的距离矩阵进行计算；

之后，至少基于距离矩阵，对描述数据设置二维坐标，例如，本实施例中可以使用多维度分析MDS(multidimensional scaling)算法根据距离矩阵为描述数据中的每个描述字符设置二维坐标；

最后，按照二维坐标，对所述描述进行聚类，得到至少一个倾向聚类，其中，倾向聚类中的描述数据的二维坐标具有关联关系，例如，描述数据的二维坐标之间的距离小于一定阈值的划分成一个倾向聚类，或者，描述数据的二维坐标属于同一个特定区域的划分成一个倾向聚类，等等。具体的，本实施例中根据用户描述数据中的词段坐标进行词段的K-menas聚类，将聚类数设置为7类(可以根据需求增加或减少1到2类)，再将用户对于该需求的使用体现分为7级情感强度，即7个倾向级别，相应聚类下描述数据的属性具有相应的倾向级别。

在一种情况中，一条描述数据中可以包括一个倾向描述内容，该描述内容只描述目标对象整体或某一个维度(可以理解为目标对象中的一个子对象)上的情感倾向，如“外壳手感非常好”，此时，对倾向描述内容经过聚类后，得到描述数据的属性的倾向级别，例如，描述数据的属性在“非常强烈”的倾向级别上(针对目标对象整体或子对象的情感倾向)；

在另一种情况中，一条描述数据中可以包含有两个或更多个的倾向描述内容，每个倾向描述内容分别描述目标对象整体或目标对象中某几个维度上的情感倾向，如“外壳手感还好，桌面布局还可以，但是太卡了非常不好”，此时，对倾向描述内容经过聚类后，得到每个倾向描述内容的属性，属性具有表征描述数据的相应描述内容中描述者对目标对象的情感倾向的倾向级别，之后，在一种实现中，可以将每个倾向描述内容的属性的倾向级别均作为该描述数据的属性的倾向级别，即描述数据的属性具有多个倾向级别，或者，在另一种实现中，可以对这些倾向级别进行处理，生成一个倾向级别，作为描述数据的属性的倾向级别，如下：

在一种实现中，本实施例中可以按照倾向级别的数量大小进行比较，确定描述数据的属性的倾向级别，如：将数量占比最高的倾向级别作为描述数据的属性的倾向级别；

例如“外壳手感还好，桌面布局还可以，但是太卡了非常不好”对应的三个倾向级别：外壳的普通级别、桌面的普通级别的和内存的非常强烈的级别，经过计数比较之后，得到描述数据的表征普通级别的情感倾向的属性；

在另一种实现中，本实施例中可以按照倾向级别的数量大小，进行加权比较，确定描述数据的属性的倾向级别，如：将每个倾向级别的数量乘积预设的级别权值后的大小进行比较，将较大的乘积对应的倾向级别作为描述数据的属性的倾向级别；

例如，“笔记本外壳手感很好，桌面布局也挺好，但是太卡了不好”中对应的三个属性的倾向接：外壳的普通级别、桌面的普通级别的和内存的非常强烈的级别，，其中，外壳属性权值为0.1，桌面属性权值为0.2，内存属性权值0.5，经过加权比较后，确定描述数据的表征非常强烈的倾向级别的属性。

由此，步骤103具体可以通过以下方式实现：

至少基于倾向聚类对应的倾向级别以及倾向聚类中的描述数据，生成处理结果。

其中，本实施例中可以通过对倾向聚类对应的倾向级别以及倾向聚类中的描述数据进行统计分析，来生成处理结果；或者，可以解析对倾向级别与倾向级别下倾向聚类对应的描述数据之间的关联关系，再基于这些关联关系来生成处理结果；或者，本实施例中可以建立倾向级别与倾向级别对应的描述数据之间的对应关系的目标方程，来表征倾向级别与其对应的描述数据之间的因果关系，具体如下：

本实施例中可以以倾向级别为自变量，以描述数据为因变量，建立多元方程，如y＝a+bx，y为因变量，x为自变量，进而得到每种倾向级别下对应的方程系数，每个倾向级别分别对应一个方程系数，以这些方程系数组成对属性的处理结果。

其中，作为因变量的描述数据可以为描述数据中对文字、图片、表情包或分数标记等描述内容进行数值量化后的值。具体的，本实施例中可以直接将描述数据中的分数标记进行提取，将提取的分数作为量化后的描述数据，或者，可以通过对描述数据中的描述内容通过语义分析或图像处理等方式进行数值量化，得到量化后的描述数据。

在具体实现中，本实施例可以首先建立包含每个倾向级别作为自变量的方程，如下公式(1)：

y＝a+b₁x₁+b₂x₂+b₃x₃+...+b_nx_n 公式(1)

其中，y为量化的描述数据，a为常数，每个倾向级别x分别对应一个系数b。

相应的，在获得每个倾向级别分别对应的方程系数时，本实施例中可以将当前的倾向级别x取值为1，将其他倾向级别x取值为0，将y代入到方程中，得到当前的倾向级别对应的方程系数b。

例如，在获得b₃时，将除b₃对应的x₃取值为1，将除此之外的x₁、x₂、x₄、...、b_n均取值为0，得到y＝a+b₃，将y的值代入之后，得到b₃；在获得b_n时，将除b_n对应的x_n取值为1，将除此之外的x₁、x₂、x₃、...、b_n-1均取值为0，得到y＝a+b_n，将y的值代入之后，得到b_n，以此类推，得到b₁到b_n的方程系数。

另外，本实施例中对于某个具体的对象，有可能存在得到的描述数据存在明显的不平衡性的情况，例如>80％的用户评分都是5分，只有20％是<5分。针对数据的不平衡性，本实施例中可以利用迭代算法如加强算法中的Adboost算法等来对目标方程进行拟合度优化，使得目标方程的方程系数更加准确。

基于以上实现，本实施例中的步骤104中在确定目标类型时，具体可以通过以下方式实现：

根据预设的分类规则所对应的多个分类类型中，查找与方程系数相匹配的目标类型。

其中，本实施例中查找与方程系数相匹配的目标类型时，可以将方程系数与各个分类类型的类型参数进行相似度匹配，进而将相似度较高的类型参数所属的分类类型确定为与方程系数相匹配的目标类型；这里的类型参数可以理解为将各个分类类型转换为曲线后的曲线参数，等等；

或者，本实施例中在查找与方程系数相匹配的目标类型时，也可以通过以下方式实现：

首先，根据方程系数，获得方程系数与倾向级别之间的对应关系曲线，具体的，不同的倾向级别对应于不同的方程系数，相应的，可以以倾向级别为自变量，对倾向级别进行排序，以方程系数为因变量，构建倾向级别与方程系数之间的对应关系曲线；

之后，获得对应关系曲线分别与分类规则中的分类类型的曲线的相似度值。其中，本实施例中可以首先将分类规则中的每个分类类型转换成曲线表示，再将对应关系曲线与每个分类类型的曲线进行曲线相似度比对，得到对应关系曲线分别与每个分类类型的曲线的相似度值，相似度值表征对应关系曲线与相应分类类型的曲线的相似程度；

最后，选取最高相似度值对应的分类类型作为目标类型，也就是说，选取曲线相似度最高的分类类型作为目标类型，以该目标类型来表征描述者对目标对象的需求倾向。

在具体实现中，步骤102中所获得的属性可以是在广义上针对目标对象的整体的情感倾向的属性，也可以是针对目标对象中的某些局部的情感倾向的属性。例如，对笔记本作为一个整体产品的强烈倾向属性或无感倾向的属性，或者对笔记本中的显示器或键盘的强烈倾向属性或无感倾向属性。目标对象的局部可以理解为：目标对象中的局部零件或者方面，如笔记本上的键盘或显示，游戏应用上的运行速度或画质等。

相应的，本实施例中在步骤102中可以利用聚类等方式对描述数据进行解析，在针对目标对象的整体需求倾向的层面上，获得对应描述数据的表征描述者对目标对象整体的情感倾向的属性，其中包括属性的倾向级别，从而在这些属性的基础上得到处理结果后，根据分类规则，获得表征对目标对象整体需求倾向的目标类型；

或者，本实施例中在步骤102中可以利用聚类等方式对描述数据进行解析，在针对目标对象的局部需求倾向的层面上，获得对应描述数据的表征描述者对目标对象中某个目标子对象或某多个目标子对象的情感倾向的属性，其中包括属性的倾向级别，从而在这些属性的基础上得到处理结果后，根据分类规则，获得表征对目标对象中的局部需求倾向的目标类型。此时，目标子对象能够对表征目标对象整体需求倾向的目标类型进行细化，使得最终得到的目标类型为表征描述者针对目标对象的局部需求倾向(如目标子对象的需求倾向)的类型，由此实现需求倾向在不同维度上的细化，如通过某一个或多个产品零件的确定，在产品整体需求倾向上细化，得到用户对产品在不同产品零件上的需求倾向。

具体的，步骤102可以通过以下方式实现：

首先，对描述数据针对目标子对象进行数据筛选，将描述数据中将与目标子对象相关联的数据进行选取，而剔除描述数据中与目标子对象无关的数据，由此，能够减少数据处理的量，从而可以加快效率；

之后，对经过数据筛选的描述数据进行分析，具体可以利用聚类的方式对经过筛选的描述数据进行聚类，以得到描述数据的能表征描述者针对目标子对象的情感倾向及倾向级别的属性。

后续中，再基于这些标注有属性的描述数据上的属性，来获得处理结果(如方程系数)并确定目标类型，此时目标类型表征描述者对目标对象的局部需求倾向，也就是说，此时的目标类型为能表征描述者对目标子对象的需求倾向的类型，可见，目标子对象的确定能够使得目标类型进行细化，细化到能够表征描述者对目标对象的局部即目标子对象的需求倾向。

或者，步骤102也可以通过以下方式实现：

首先，对描述数据进行分析，具体可以利用聚类的方式对描述数据进行标注，以得到描述数据的能表征描述者针对目标对象的需求倾向及倾向级别的属性；

之后，对已经标注属性的描述数据进行筛选，剔除描述数据中与目标子对象无关的数据，只将描述数据中与目标子对象相关的数据进行选取，此时选取出的描述数据的属性表征描述者对目标子对象的需求倾向及倾向级别。

例如，可以先在对所有描述数据进行属性标注之后，在属性表征各种倾向级别的描述数据中筛选出与目标子对象相关的数据。

后续中，再基于筛选出的这些标注有属性的描述数据上的属性，来获得处理结果并确定目标类型，此时目标类型表征描述者对目标对象的局部需求倾向，也就是说，此时的目标类型为能表征描述者对目标子对象的需求倾向的类型，可见，目标子对象的确定能够使得目标类型进行细化，细化到能够表征描述者对目标对象的局部即目标子对象的需求倾向。

参考图2，为本申请实施例二提供的一种数据处理装置的结构示意图，该装置可以设置在能够进行数据处理的计算机或服务器等设备中，主要用于对至少一个描述者针对一个或某多个目标对象的需求倾向进行分析。

具体的，本实施例中的装置可以包括以下结构：

数据获得单元201，用于获得与目标对象关联的至少一个描述数据。

需要说明的是，目标对象可以为描述者所关注或使用的对象，如某个实体产品如笔记本，某种虚拟服务如游戏场景或者某种应用功能如聊天应用或购物应用等对象。本实施例中旨在对描述者对这些对象的需求倾向进行分析。

属性获得单元202，用于至少基于所述至少一个描述数据，获得至少一个属性。

属性处理单元203，用于对所述至少一个属性进行处理，以得到处理结果。

分类单元204，用于根据预设的分类规则，确定与所述处理结果相对应的目标类型。

其中，目标类型能表征描述者对目标对象的需求倾向。分类规则可以为预先设置的针对需求倾向所设置的规则，该分类规则中可以设置有多个分类类型，每种分类类型分别能表征描述者对目标对象的不同的需求倾向，如表征描述者对目标对象属于基本刚需的需求倾向的类型，表征描述者对目标对象属于期望的需求倾向的类型，表征描述者对目标对象属于兴奋的需求倾向的类型，表征描述者对目标对象属于反向厌恶或不喜的需求倾向的类型，表征描述者对目标对象属于无差异或无感的需求倾向的类型，等等。

由上述方案可知，本申请实施例二提供的一种数据处理装置，在获得至少一个描述者针对目标对象产生的描述数据之后，通过在描述数据的基础上获得能表征描述者对目标对象的情感倾向的属性，进而在对这些属性进行处理得到处理结果之后，根据预设的分类规则，确定与处理结果相对应的目标类型，而以此目标类型来表征描述者对目标对象的需求倾向。可见，本实施例中通过获取描述者的描述数据，并对其能够表征描述者对目标对象的情感倾向的属性进行分析，进而得到能够表征描述者对目标对象需求倾向的类型，由此避免时长过多消耗，进而能够有效提高获取用户需求倾向的效率。

在一种实现方式中，所述属性具有倾向级别；

其中，属性获得单元202具体用于：对所述描述数据进行聚类，得到至少一个倾向聚类；其中，所述倾向聚类的数量与所述倾向级别的级别数量相对应，所述倾向聚类中包括至少一个描述数据，所述倾向聚类中的描述数据的属性具有同一个倾向级别；例如，属性获得单元202获得所述描述数据之间关于描述字符的距离矩阵；至少基于所述距离矩阵，对所述描述数据设置二维坐标；按照所述二维坐标，对所述描述数据进行聚类，得到至少一个倾向聚类，所述倾向聚类中的描述数据的二维坐标具有关联关系。

相应的，属性处理单元203具体用于：至少基于所述倾向聚类对应的倾向级别以及所述倾向聚类中的描述数据，生成处理结果。

在一种实现方式中，所述处理结果包括目标方程的方程系数，所述目标方程为表征所述倾向级别与所述倾向级别对应的描述数据之间对应关系的方程；此时，分类单元204具体用于在预设的分类规则所对应的多个分类类型中，查找与所述方程系数相匹配的目标类型。

例如，分类单元204根据所述方程系数，获得所述方程系数与所述倾向级别之间的对应关系曲线；获得所述对应关系曲线分别与所述分类规则所对应的多个分类类型的曲线的相似度值；选取最高的相似度值对应的分类类型作为目标类型。

另外，属性处理单元203还用于：利用预设的迭代算法，对所述目标方程进行拟合度优化。

在一种实现方式中，属性获得单元202具体用于：获得对应所述至少一个描述数据的至少一个属性，所述属性能表征所述描述者对目标子对象的情感倾向，所述目标子对象为所述目标对象的局部；

在一种实现方式中，数据获得单元201还用于：对所述至少一个描述数据进行预处理；其中，所述预处理包括：对所述描述数据按照所述目标对象的对象标识进行分类。

需要说明的是，本实施例的装置中各功能单元的具体实现方式可以参考前文中的相应描述，此处不再赘述。

参考图3，为本申请实施例三提供的一种电子设备的结构示意图，该电子设备可以为计算机或服务器等设备。本实施例中的电子设备可以包括有：

存储器301，用于存储应用程序和所述应用程序运行所产生的数据；

处理器302，用于执行所述应用程序，以实现功能：获得与目标对象关联的至少一个描述数据；所述描述数据是至少一个描述者针对所述目标对象产生的；至少基于所述至少一个描述数据，获得至少一个属性，所述属性表征所述描述者对所述目标对象的情感倾向；对所述至少一个属性进行处理，以得到处理结果；根据预设的分类规则，确定与所述处理结果相对应的目标类型；其中，所述目标类型能表征所述描述者对所述目标对象的需求倾向。

由上述方案可知，本申请实施例三提供的一种电子设备，在获得至少一个描述者针对目标对象产生的描述数据之后，通过在描述数据的基础上获得能表征描述者对目标对象的情感倾向的属性，进而在对这些属性进行处理得到处理结果之后，根据预设的分类规则，确定与处理结果相对应的目标类型，而以此目标类型来表征描述者对目标对象的需求倾向。可见，本实施例中通过获取描述者的描述数据，并对其能够表征描述者对目标对象的情感倾向的属性进行分析，进而得到能够表征描述者对目标对象需求倾向的类型，由此避免时长过多消耗，进而能够有效提高获取用户需求倾向的效率。

在一种实现方式中，所述属性具有倾向级别；其中，处理器302在至少基于所述至少一个描述数据，获得至少一个属性时可以通过以下方式实现：

对所述描述数据进行聚类，得到至少一个倾向聚类；其中，所述倾向聚类的数量与所述倾向级别的级别数量相对应，所述倾向聚类中包括至少一个描述数据，所述倾向聚类中的描述数据的属性具有同一个倾向级别。例如，获得所述描述数据之间关于描述字符的距离矩阵；至少基于所述距离矩阵，对所述描述数据设置二维坐标；按照所述二维坐标，对所述描述数据进行聚类，得到至少一个倾向聚类，所述倾向聚类中的描述数据的二维坐标具有关联关系。

相应的，处理器302在至少对所述至少一个属性进行处理，以得到处理结果时，可以通过以下方式实现：

在一种实现方式中，所述处理结果包括目标方程的方程系数，所述目标方程为表征所述倾向级别与所述倾向级别对应的描述数据之间对应关系的方程；其中，处理器302在根据预设的分类规则，确定与所述处理结果相对应的目标类型时，可以通过以下方式实现：

在预设的分类规则所对应的多个分类类型中，查找与所述方程系数相匹配的目标类型。例如，根据所述方程系数，获得所述方程系数与所述倾向级别之间的对应关系曲线；获得所述对应关系曲线分别与所述分类规则所对应的多个分类类型的曲线的相似度值；选取最高的相似度值对应的分类类型作为目标类型。

在一种实现方式中，处理器302在至少基于所述至少一个描述数据，获得至少一个属性时，可以通过以下方式实现：

另外，处理器302还可以对所述至少一个描述数据进行预处理；其中，所述预处理包括：对所述描述数据按照所述目标对象的对象标识进行分类。

而且，处理器302还可以利用预设的迭代算法，对所述目标方程进行拟合度优化。

需要说明的是，本实施例中处理器302的具体实现方式可以参考前文中的相应描述，此处不再赘述。

以下对产品的需求倾向分析得到产品的卡诺需求模型为例，结合图4中的逻辑流程图，对本实施例中的技术方案进行举例说明，如下：

本实施例中的技术方案打破传统发放问卷的方式，取而代之收集用户的产品使用评论记录(包括来自电商，论坛，自媒体等)，结合大数据处理技术和人工智能算法，建立用户需求的情感强度与用户评分的多元线性回归模型，重点观察回归模型系数与卡诺需求曲线的相识度相似度来判断需求的类型归属。

具体的，本实施例中的方案包括有以下执行步骤：

1、明确分析对象，如选择一个产品作为目标对象，描述者：客户群；

2、从收集的客户评论数据中抽取与分析对象相关的评论记录，包括图片、文字、字符、表情包和标点符号等中的一种或多种的组合；

3、根据分析需求对数据进行清洗及整理，例如，对评论记录进行筛选和分类等；

4、明确需要进行卡诺模型需求归属的产品属性(目标对象的目标子对象)，具体的可以根据重视度高的用户需求来确定，其中，重视的体现在被用户评论提及的次数，如被用户提及超过1000次的产品属性确定可以作为依据的用户需求，进而确定产品属性，此时可以返回中3，以进行数据筛选和清理；

5、计算每种产品属性的评论词段的距离矩阵；

6、使用MDS算法，根据距离矩阵为每种词段赋予二维坐标；

7、针对每种产品属性，根据词段坐标进行词段的K-menas聚类，将聚类数设置为7类(也可以根据需要增加或减少1～2类)，将用户对于该需求的使用体现分为7级情感强度；

8、采用多元线性回归模型，建立需求情感强度(自变量)与用户评分(因变量)的回归方程，例如，以电脑类产品分析为例，建立用户情感强度(倾向级别)和用户评分之间的回归方程；例如，获得以下方程公式(2)中每级情感强度对应的方程系数b(a为常数)，此时获得7个系数；

y＝a+b_speed(1)x_speed(1)+b_speed(2)，x_speed(2)+…+b_speed(7)x_speed(7)+b_capacity(1)x_capacity(1)+b_capacity(2)x_capacity(2)+…+b_capacity(7)x_capacity(7) 公式(2)

其中，b_speed(1)为第一级别在speed产品属性下对应的系数，b_capacity(1)为x_capacity(1)级别在capacity产品属性下对应的系数，b_speed(2)为第二级别在speed产品属性下对应的系数，b_capacity(2)为第二级别在capacity产品属性下对应的系数，以此类推，y为评价分数。需要说明的是，针对某个产品属性的评分，在方程中与该产品属性的评分无关的其他情感强度x取值为0，也就是说，在方程中只留下与该评分相关情感强度对应的多项式并对多项式中的x取1，其他多项式都舍去，进而将评分代入到方程中得到相应的系数b。

9、由回归模型最终获得对应每个产品属性的7个系数，对7个系数进行排序后绘图，纵坐标为方程系数，横坐标为系数的排行序号(情感强度级别的序号)，观察散点图及趋势线，与Kano曲线(卡诺需求模型的曲线，如图5中所示的各模型曲线：魅力需求曲线、反向需求曲线、无差异需求曲线、期望需求曲线和必备需求曲线)进行对比。

10、根据对比结果，判断每种产品属性下用户对产品的需求类型。

需要说明的是，对于某个具体的产品，有可能得到的数据存在明显的不平衡性(例如>80％的用户评分都是5分，只有20％是<5分)。针对数据的不平衡性，可以考虑引入加强算法(最常用的Adboost算法)来优化方程的拟合度；

其中，对于如上步骤5、6、7中对情感强度的获取过程，除了采用编辑距离算法外，还可以采用其它能够实现描述数据聚类得到倾向级别的聚类算法。

可见，本实施例中的技术方案具有如下几个方面优势：1.由于记录来自开放的平台，因此数据产生成本低；2.较传统的问卷调查方式数据样本多，可靠性更好；3.分析周期短，只需明确分析对象和分析范围后对数据进行选取和运算操作即可，不需要设计问卷，发放问卷，等待反馈等漫长的环节；4.灵活度高，适应多产品多需求多用户群的分析。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种数据处理方法，包括：

基于所述至少一个描述数据，获得至少一个属性，所述属性表征所述描述者对所述目标对象的情感倾向；

对所述至少一个属性进行处理，以得到处理结果；所述处理结果能够在数值上表征出描述者对目标对象的情感倾向；所述处理结果包括目标方程的方程系数，所述目标方程为表征倾向级别与所述倾向级别对应的描述数据之间对应关系的方程；

获得所述对应关系曲线分别与分类规则所对应的多个分类类型的曲线的相似度值；

选取最高的相似度值对应的分类类型作为目标类型；其中，所述目标类型能表征所述描述者对所述目标对象的需求倾向；

其中，所述属性具有倾向级别；

其中，所述基于所述至少一个描述数据，获得至少一个属性，包括：

对所述描述数据进行聚类，得到至少一个倾向聚类；

其中，所述对所述至少一个属性进行处理，以得到处理结果，包括：

2.根据权利要求1所述的方法，所述基于所述至少一个描述数据，获得至少一个属性，包括：

3.根据权利要求1所述的方法，还包括：

对所述至少一个描述数据进行预处理；

4.根据权利要求1所述的方法，按照所述属性的倾向级别，对所述描述数据进行聚类，得到至少一个倾向聚类，包括：

获得所述描述数据之间关于描述字符的距离矩阵；

基于所述距离矩阵，对所述描述数据设置二维坐标；

5.根据权利要求1所述的方法，还包括：

利用预设的迭代算法，对所述目标方程进行拟合度优化。

6.一种数据处理装置，包括：

属性获得单元，用于基于所述至少一个描述数据，获得至少一个属性，所述属性表征所述描述者对所述目标对象的情感倾向；

属性处理单元，用于对所述至少一个属性进行处理，以得到处理结果；所述处理结果能够在数值上表征出描述者对目标对象的情感倾向；所述处理结果包括目标方程的方程系数，所述目标方程为表征倾向级别与所述倾向级别对应的描述数据之间对应关系的方程；

分类单元，用于根据所述方程系数，获得所述方程系数与所述倾向级别之间的对应关系曲线；获得所述对应关系曲线分别与分类规则所对应的多个分类类型的曲线的相似度值；选取最高的相似度值对应的分类类型作为目标类型；其中，所述目标类型能表征所述描述者对所述目标对象的需求倾向；

其中，所述属性具有倾向级别；

对所述描述数据进行聚类，得到至少一个倾向聚类；

7.一种电子设备，包括：

处理器，用于执行所述应用程序，以实现功能：获得与目标对象关联的至少一个描述数据；所述描述数据是至少一个描述者针对所述目标对象产生的；基于所述至少一个描述数据，获得至少一个属性，所述属性表征所述描述者对所述目标对象的情感倾向；对所述至少一个属性进行处理，以得到处理结果；所述处理结果能够在数值上表征出描述者对目标对象的情感倾向；所述处理结果包括目标方程的方程系数，所述目标方程为表征倾向级别与所述倾向级别对应的描述数据之间对应关系的方程；根据所述方程系数，获得所述方程系数与所述倾向级别之间的对应关系曲线；获得所述对应关系曲线分别与分类规则所对应的多个分类类型的曲线的相似度值；选取最高的相似度值对应的分类类型作为目标类型；其中，所述目标类型能表征所述描述者对所述目标对象的需求倾向；

其中，所述属性具有倾向级别；

对所述描述数据进行聚类，得到至少一个倾向聚类；