CN112950261A - 一种用户价值的确定方法及系统 - Google Patents
一种用户价值的确定方法及系统 Download PDFInfo
- Publication number
- CN112950261A CN112950261A CN202110192510.3A CN202110192510A CN112950261A CN 112950261 A CN112950261 A CN 112950261A CN 202110192510 A CN202110192510 A CN 202110192510A CN 112950261 A CN112950261 A CN 112950261A
- Authority
- CN
- China
- Prior art keywords
- value
- user
- feature
- feature vector
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 239000013598 vector Substances 0.000 claims abstract description 135
- 238000013210 evaluation model Methods 0.000 claims abstract description 81
- 238000007781 pre-processing Methods 0.000 claims abstract description 28
- 238000011156 evaluation Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 53
- 238000003062 neural network model Methods 0.000 claims description 31
- 230000011218 segmentation Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 20
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 18
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种用户价值的确定方法及系统,该方法为:获取目标用户的常规特征和电话文本;对常规特征进行预处理得到第一特征向量,以及对电话文本进行预处理得到第二特征;将第一特征向量和第二特征输入预设的价值评估模型中进行价值评估,得到目标用户的用户价值。在本方案中,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。
Description
技术领域
本发明涉及数据分析技术领域,具体涉及一种用户价值的确定方法及系统。
背景技术
随着互联网的发展,越来越多的用户倾向于通过网络在线课程进行学习,为向用户提供更好的服务,通常需要确定用户的用户价值。
目前确定用户价值的方式为:对用户的用户特征进行分析,进而根据分析结果确定用户的用户价值。但是,用户在使用网络在线课程的过程中会产生多种类型的特征数据,仅对用户特征进行分析而忽略其它类型的特征数据,会导致确定用户价值的准确率较低。
发明内容
有鉴于此,本发明实施例提供一种用户价值的确定方法及系统,以解决现有确定用户价值的方式的准确率较低等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种用户价值的确定方法,所述方法包括:
获取目标用户的常规特征和电话文本,所述常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,所述电话文本由所述目标用户与指定人员的电话沟通录音确定得到;
对所述常规特征进行预处理得到第一特征向量,以及对所述电话文本进行预处理得到第二特征;
将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,所述用户价值指示所述目标用户购买目标产品的概率,所述价值评估模型根据样本数据训练神经网络模型得到。
优选的,所述将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,包括:
将所述第一特征向量和所述第二特征输入所述价值评估模型;
利用所述价值评估模型中的长短期记忆LSTM层对所述第二特征进行处理,得到第三特征向量;
利用所述价值评估模型的拼接层,将所述第一特征向量和所述第三特征向量进行拼接,得到组合特征向量;
通过所述价值评估模型的中间层,对所述组合特征向量进行处理,得到所述目标用户的用户价值。
优选的,所述对所述常规特征进行预处理得到第一特征向量,包括:
对所述常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。
优选的,所述对所述电话文本进行预处理得到第二特征,包括:
对所述电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果;
利用预设的词向量模型将所述分词结果映射成向量,得到第二特征。
优选的,根据样本数据训练神经网络模型得到所述价值评估模型的过程,包括:
构建神经网络模型;
利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练所述神经网络模型直至所述神经网络模型收敛,得到价值评估模型,所述真实购买结果指示所述样本用户是否购买所述目标产品。
本发明实施例第二方面公开一种用户价值的确定系统,所述系统包括:
获取单元,用于获取目标用户的常规特征和电话文本,所述常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,所述电话文本由所述目标用户与指定人员的电话沟通录音确定得到;
预处理单元,用于对所述常规特征进行预处理得到第一特征向量,以及对所述电话文本进行预处理得到第二特征;
评估单元,用于将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,所述用户价值指示所述目标用户购买目标产品的概率,所述价值评估模型根据样本数据训练神经网络模型得到。
优选的,所述评估单元包括:
输入模块,用于将所述第一特征向量和所述第二特征输入所述价值评估模型;
处理模块,用于利用所述价值评估模型中的长短期记忆LSTM层对所述第二特征进行处理,得到第三特征向量;
拼接模块,用于利用所述价值评估模型的拼接层,将所述第一特征向量和所述第三特征向量进行拼接,得到组合特征向量;
评估模块,用于通过所述价值评估模型的中间层,对所述组合特征向量进行处理,得到所述目标用户的用户价值。
优选的,用于获取第一特征向量的所述预处理单元,具体用于:对所述常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。
优选的,用于获取第二特征的所述预处理单元,具体用于:对所述电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果,利用预设的词向量模型将所述分词结果映射成向量,得到第二特征。
优选的,用于训练得到价值评估模型的所述评估单元,具体用于:构建神经网络模型,利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练所述神经网络模型直至所述神经网络模型收敛,得到价值评估模型,所述真实购买结果指示所述样本用户是否购买所述目标产品。
基于上述本发明实施例提供的一种用户价值的确定方法及系统,该方法为:获取目标用户的常规特征和电话文本;对常规特征进行预处理得到第一特征向量,以及对电话文本进行预处理得到第二特征;将第一特征向量和第二特征输入预设的价值评估模型中进行价值评估,得到目标用户的用户价值。在本方案中,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种用户价值的确定方法的流程图;
图2为本发明实施例提供的将词映射为向量的示意图;
图3为本发明实施例提供的确定目标用户的用户价值的流程图;
图4为本发明实施例提供的一种用户价值的确定方法的另一流程图;
图5为本发明实施例提供的一种用户价值的确定系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,用户在使用网络在线课程的过程中会产生多种类型的特征数据,目前仅对用户特征进行分析而忽略其它类型的特征数据,会导致确定用户价值的准确率较低。
因此,本发明实施例提供一种用户价值的确定方法及系统,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,以提高确定用户价值的准确率。
参见图1,示出了本发明实施例提供的一种用户价值的确定方法的流程图,该确定方法包括:
步骤S101:获取目标用户的常规特征和电话文本。
需要说明的是,目标用户在使用提供网络在线课程(比如少儿英语网络在线课程)的客户端时,通常会产生相应的常规特征,该常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合。
其中,属性特征为目标用户的常规标签,比如:性别、年龄和所在城市。行为特征为目标用户在客户端的行为,比如:是否点击红包和是否浏览活动页面等行为。聚合特征为对前述属性特征和行为特征进行统计得到,比如:目标用户在过程一个月内浏览活动页面的次数,目标用户在前一周点击红包的次数。
可以理解的是,对于提供网络在线课程的在线教育行业而言,除了在客户端为目标用户提供相应的服务之外,还通常会通过电话为目标用户提供相应的服务,比如通过电话推销网络在线课程,又比如通过电话询问网络在线课程的体验情况。
也就是说,目标用户除了在使用客户端的过程中产生相应的常规特征,还会在与指定人员(比如销售人员或售后人员等)的电话沟通过程中产生相应的电话沟通录音,该电话沟通录音也能用于表征用户的某些特征。
故,将目标用户与指定人员的电话沟通录音转换成相应的电话文本。
在具体实现步骤S101的过程中,从客户端中获取目标用户的常规特征,以及获取目标用户与指定人员的电话沟通录音对应的电话文本。
步骤S102:对常规特征进行预处理得到第一特征向量,以及对电话文本进行预处理得到第二特征。
需要说明的是,在利用预设的价值评估模型处理目标用户的常规特征和电话文本之前,需对该常规特征和电话文本进行预处理转换成相应的特征向量。
在具体实现步骤S102的过程中,可以理解的是,常规特征中可能存在非法值和异常值,比如:若目标用户的年龄里包含中文字符,该年龄所包含的中文字符为非法值,若目标用户设置的年龄为200岁,则该年龄为异常值。常规特征中的非法值和异常值都需要去除。
故,对常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到的第一特征向量,其中,x1为该第一特征向量,表示特征向量为实数,n1为常规特征经过去除非法值处理、去除异常值处理和one-hot编码处理后的特征数量。
需要说明的是,通过one-hot编码将常规特征中的指定标签转换为对应的一维数组,比如:性别这一标签通常有“男”、“女”和“未知”这三个分类,将性别编码成“性别是否为男”、“性别是否为女”和“性别是否为未知”,若是则其编码为1,若不是则编码为0。
同理,目标用户的电话文本中可能存在异常字符和/或错别字,比如电话文本中存在诸如括号、分号和星号等异常字符,在将电话沟通录音转换为电话文本的过程中,某些专有词汇(比如AI课和试听课等词汇)存在较大的概率会转换错误,故而出现影响电话文本语意的错别字,需要去除电话文本中的异常字符,以及修复电话文本中的错别字。
故,对电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到相应的分词结果,利用预设的词向量模型将分词结果映射成向量,得到第二特征。
可以理解的是,在将分词结果映射成向量的过程中,分词结果中的每个词会被映射成256维(仅举例)的向量,如图2示出的将词映射为向量的示意图(仅用于举例)。
在图2中将“家长你好我是XX”进行分词处理后得到“家长”、“你好”、“我”、“是”和“XX”五个词,利用预先训练好的词典(即词向量模型),查表得到前述五个词的向量表示。
需要说明的是,上述所利用的词向量模型可根据word2vec算法训练得到。
步骤S103:将第一特征向量和第二特征输入预设的价值评估模型中进行价值评估,得到目标用户的用户价值。
需要说明的是,用户价值指示目标用户购买目标产品(比如少儿英语在线网络课程)的概率,价值评估模型根据样本数据训练神经网络模型得到。
训练神经网络模型得到价值评估模型的过程为:
对于某一用户,如果用户购买了目标产品,则该用户的用户价值为1,如果用户没有购买目标产品,则该用户的用户价值为0,前述内容即为一个二分类预测问题,即预测用户是否购买目标产品。
在训练神经网络之前,从数据库中收集样本用户的常规特征、电话文本和真实购买结果,样本用户的真实购买结果即为用户label(只有0和1两种值),真实购买结果指示样本用户是否购买目标产品,1指示样本用户购买目标产品,0指示样本用户没有购买目标产品。
构建神经网络模型,将神经网络模型记为f(x;w),x表示特征,w为该神经网络模型的系数,设置该神经网络模型输出取值范围介于0至1的两个预测值,第一预测值指示用户购买目标产品的概率(即视为用户价值),第二预测值指示用户不购买目标产品的概率,选择如公式(1)示出的交叉熵损失函数。
利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练神经网络模型,通过随机梯度下降的调整该神经网络模型的系数w使该交叉熵损失函数尽量最小化,直至神经网络模型收敛,得到价值评估模型。
在具体实现步骤S103的过程中,将第一特征向量和第二特征输入价值评估模型中进行价值评估,得到目标用户的用户价值。可以理解的是,由上述内容可知,价值评估模型会输出第一预测值(用户购买目标产品的概率)和第二预测值(用户不购买目标产品的概率),选择第一预测值作为目标用户的用户价值,第一预测值的数值越大,即表示目标用户的用户价值越大。
在本发明实施例中,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。
上述本发明实施例图1步骤S103中涉及的利用价值评估模型确定用户价值的过程,参见图3,示出了本发明实施例提供的确定目标用户的用户价值的流程图,包括以下步骤:
步骤S301:将第一特征向量和第二特征输入价值评估模型。
在具体实现步骤S301的过程中,分别将第一特征向量和第二特征输入价值评估模型的输入层中。
步骤S302:利用价值评估模型中的长短期记忆(Long Short-Term Memory,LSTM)层对第二特征进行处理,得到第三特征向量。
在具体实现步骤S302的过程中,将第一特征向量和第二特征输入价值评估模型的输入层之后,利用价值评估模型中的LSTM层将第二特征处理成一个高维的第三特征向量。
步骤S303:利用价值评估模型的拼接层,将第一特征向量和第三特征向量进行拼接,得到组合特征向量。
在具体实现步骤S303的过程中,通过价值评估模型的拼接层,将第一特征向量和第三特征向量进行拼接,得到相应维度的组合特征向量。
比如:假设第一特征向量为2048维的向量,第三特征向量为1024维的向量,则利用拼接层将第一特征向量和第三特征向量进行拼接,得到3072维的组合特征向量。
步骤S304:通过价值评估模型的中间层,对组合特征向量进行处理,得到目标用户的用户价值。
在具体实现步骤S304的过程中,将组合特征向量输入价值评估模型的中间层进行神经网络运算,得到第一预测值和第二预测值,将第一预测值作为目标用户的用户价值。
中间层进行神经网络运算的过程为:假设输入中间层的向量为该向量即为的矩阵,则价值评估模型给定一组参数经过矩阵乘法得到的结果再经过一个激活函数即可得到中间层的某个神经元的激活状态,中间层有多少个神经元就进行多少次前述的运算过程,经过多层运算后通过价值评估模型的输出层输出第一预测值和第二预测值,选择第一预测值作为目标用户的用户价值。
为更好解释说明上述本发明实施例图1和图3所涉及的内容,通过图4示出的一种用户价值的确定方法的另一流程图进行举例说明。
在图4中,分别对目标用户的常规特征和电话文本进行预处理,得到第一特征向量和第二特征,常规特征包括:属性特征、行为特征和聚合特征。
通过价值评估模型的第一输入层将第一特征向量输入值价值评估模型的拼接层,通过价值评估模型的第二输入层将第二特征输入价值评估模型的LSTM层,利用LSTM层对该第二特征进行处理得到第三特征向量,并将第三特征向量输入价值评估模型的拼接层。
利用价值评估模型的拼接层将第一特征向量和第三特征向量拼接成组合特征向量,将该组合特征向量输入价值评估模型的中间层进行神经网络运算,得到第一预测值和第二预测值,并通过价值评估模型的输出层输出该第一预测值和第二预测值,将第一预测值作为目标用户的用户价值。
在本发明实施例中,将第一特征向量和第二特征输入价值评估模型,利用LSTM层对第二特征进行处理得到第三特征向量,再利用拼接层组合第一特征向量和第三特征向量得到组合特征向量,最后利用中间层对组合特征向量进行神经网络运算得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。
与上述本发明实施例提供的一种用户价值的确定方法相对应,参见图5,本发明实施例还提供了一种用户价值的确定系统的结构框图,该确定系统包括:获取单元501、预处理单元502和评估单元503;
获取单元501,用于获取目标用户的常规特征和电话文本,常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,电话文本由目标用户与指定人员的电话沟通录音确定得到。
预处理单元502,用于对常规特征进行预处理得到第一特征向量,以及对电话文本进行预处理得到第二特征。
在具体实现中,用于获取第一特征向量的预处理单元502,具体用于:对常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。
在具体实现中,用于获取第二特征的预处理单元502,具体用于:对电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果,利用预设的词向量模型将分词结果映射成向量,得到第二特征。
评估单元503,用于将第一特征向量和第二特征输入预设的价值评估模型中进行价值评估,得到目标用户的用户价值,用户价值指示目标用户购买目标产品的概率,价值评估模型根据样本数据训练神经网络模型得到。
在具体实现中,用于训练得到价值评估模型的评估单元503,具体用于:构建神经网络模型,利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练神经网络模型直至神经网络模型收敛,得到价值评估模型,真实购买结果指示样本用户是否购买所述目标产品。
在本发明实施例中,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。
优选的,结合图5示出的内容,评估单元503包括输入模块、处理模块、拼接模块和评估模块,各个模块的执行原理如下:
输入模块,用于将第一特征向量和第二特征输入价值评估模型。
处理模块,用于利用价值评估模型中的LSTM层对第二特征进行处理,得到第三特征向量。
拼接模块,用于利用价值评估模型的拼接层,将第一特征向量和第三特征向量进行拼接,得到组合特征向量。
评估模块,用于通过价值评估模型的中间层,对组合特征向量进行处理,得到目标用户的用户价值。
在本发明实施例中,将第一特征向量和第二特征输入价值评估模型,利用LSTM层对第二特征进行处理得到第三特征向量,再利用拼接层组合第一特征向量和第三特征向量得到组合特征向量,最后利用中间层对组合特征向量进行神经网络运算得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。
综上所述,本发明实施例提供一种用户价值的确定方法及系统,分别对目标用户的常规特征和电话文本进行预处理得到第一特征向量和第二特征,并将第一特征向量和第二特征输入价值评估模型进行评估,得到目标用户的用户价值,利用目标用户的多种类型的特征数据,结合价值评估模型确定用户价值,提高确定用户价值的准确率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种用户价值的确定方法,其特征在于,所述方法包括:
获取目标用户的常规特征和电话文本,所述常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,所述电话文本由所述目标用户与指定人员的电话沟通录音确定得到;
对所述常规特征进行预处理得到第一特征向量,以及对所述电话文本进行预处理得到第二特征;
将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,所述用户价值指示所述目标用户购买目标产品的概率,所述价值评估模型根据样本数据训练神经网络模型得到。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,包括:
将所述第一特征向量和所述第二特征输入所述价值评估模型;
利用所述价值评估模型中的长短期记忆LSTM层对所述第二特征进行处理,得到第三特征向量;
利用所述价值评估模型的拼接层,将所述第一特征向量和所述第三特征向量进行拼接,得到组合特征向量;
通过所述价值评估模型的中间层,对所述组合特征向量进行处理,得到所述目标用户的用户价值。
3.根据权利要求1所述的方法,其特征在于,所述对所述常规特征进行预处理得到第一特征向量,包括:
对所述常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。
4.根据权利要求1所述的方法,其特征在于,所述对所述电话文本进行预处理得到第二特征,包括:
对所述电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果;
利用预设的词向量模型将所述分词结果映射成向量,得到第二特征。
5.根据权利要求1所述的方法,其特征在于,根据样本数据训练神经网络模型得到所述价值评估模型的过程,包括:
构建神经网络模型;
利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练所述神经网络模型直至所述神经网络模型收敛,得到价值评估模型,所述真实购买结果指示所述样本用户是否购买所述目标产品。
6.一种用户价值的确定系统,其特征在于,所述系统包括:
获取单元,用于获取目标用户的常规特征和电话文本,所述常规特征包括:属性特征、行为特征和聚合特征中的一种或任意组合,所述电话文本由所述目标用户与指定人员的电话沟通录音确定得到;
预处理单元,用于对所述常规特征进行预处理得到第一特征向量,以及对所述电话文本进行预处理得到第二特征;
评估单元,用于将所述第一特征向量和所述第二特征输入预设的价值评估模型中进行价值评估,得到所述目标用户的用户价值,所述用户价值指示所述目标用户购买目标产品的概率,所述价值评估模型根据样本数据训练神经网络模型得到。
7.根据权利要求6所述的系统,其特征在于,所述评估单元包括:
输入模块,用于将所述第一特征向量和所述第二特征输入所述价值评估模型;
处理模块,用于利用所述价值评估模型中的长短期记忆LSTM层对所述第二特征进行处理,得到第三特征向量;
拼接模块,用于利用所述价值评估模型的拼接层,将所述第一特征向量和所述第三特征向量进行拼接,得到组合特征向量;
评估模块,用于通过所述价值评估模型的中间层,对所述组合特征向量进行处理,得到所述目标用户的用户价值。
8.根据权利要求6所述的系统,其特征在于,用于获取第一特征向量的所述预处理单元,具体用于:对所述常规特征进行去除非法值处理、去除异常值处理和one-hot编码处理,得到第一特征向量。
9.根据权利要求6所述的系统,其特征在于,用于获取第二特征的所述预处理单元,具体用于:对所述电话文本依次进行去除异常字符处理、修复错别字处理和分词处理,得到分词结果,利用预设的词向量模型将所述分词结果映射成向量,得到第二特征。
10.根据权利要求6所述的系统,其特征在于,用于训练得到价值评估模型的所述评估单元,具体用于:构建神经网络模型,利用样本用户对应的常规特征、电话文本和真实购买结果,结合交叉熵损失函数训练所述神经网络模型直至所述神经网络模型收敛,得到价值评估模型,所述真实购买结果指示所述样本用户是否购买所述目标产品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110192510.3A CN112950261A (zh) | 2021-02-20 | 2021-02-20 | 一种用户价值的确定方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110192510.3A CN112950261A (zh) | 2021-02-20 | 2021-02-20 | 一种用户价值的确定方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112950261A true CN112950261A (zh) | 2021-06-11 |
Family
ID=76244729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110192510.3A Pending CN112950261A (zh) | 2021-02-20 | 2021-02-20 | 一种用户价值的确定方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112950261A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688343A (zh) * | 2024-02-04 | 2024-03-12 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688967A (zh) * | 2017-08-24 | 2018-02-13 | 平安科技(深圳)有限公司 | 客户购买意向的预测方法及终端设备 |
CN111047347A (zh) * | 2019-11-07 | 2020-04-21 | 中通服建设有限公司 | 用户价值评估方法、装置、计算机设备和存储介质 |
CN111523976A (zh) * | 2020-04-23 | 2020-08-11 | 京东数字科技控股有限公司 | 商品推荐方法、装置、电子设备及存储介质 |
US20200274970A1 (en) * | 2019-02-26 | 2020-08-27 | Cigna Taiwan Life Assurance Co. Ltd. | Automated systems and methods for natural language processing with speaker intention inference |
CN112036173A (zh) * | 2020-11-09 | 2020-12-04 | 北京读我科技有限公司 | 一种电销文本的处理方法和系统 |
CN112308387A (zh) * | 2020-10-20 | 2021-02-02 | 深圳思为科技有限公司 | 客户意向度评估方法与装置、云服务器 |
-
2021
- 2021-02-20 CN CN202110192510.3A patent/CN112950261A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688967A (zh) * | 2017-08-24 | 2018-02-13 | 平安科技(深圳)有限公司 | 客户购买意向的预测方法及终端设备 |
US20200274970A1 (en) * | 2019-02-26 | 2020-08-27 | Cigna Taiwan Life Assurance Co. Ltd. | Automated systems and methods for natural language processing with speaker intention inference |
CN111047347A (zh) * | 2019-11-07 | 2020-04-21 | 中通服建设有限公司 | 用户价值评估方法、装置、计算机设备和存储介质 |
CN111523976A (zh) * | 2020-04-23 | 2020-08-11 | 京东数字科技控股有限公司 | 商品推荐方法、装置、电子设备及存储介质 |
CN112308387A (zh) * | 2020-10-20 | 2021-02-02 | 深圳思为科技有限公司 | 客户意向度评估方法与装置、云服务器 |
CN112036173A (zh) * | 2020-11-09 | 2020-12-04 | 北京读我科技有限公司 | 一种电销文本的处理方法和系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688343A (zh) * | 2024-02-04 | 2024-03-12 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
CN117688343B (zh) * | 2024-02-04 | 2024-05-03 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377740B (zh) | 情感极性分析方法、装置、电子设备及存储介质 | |
CN110728541A (zh) | 信息流媒体广告创意推荐方法及装置 | |
CN105095444A (zh) | 信息获取方法和装置 | |
WO2022095376A1 (zh) | 方面级别情感分类方法、装置、设备及可读存储介质 | |
CN106682387A (zh) | 用于输出信息的方法和装置 | |
CN111522916A (zh) | 一种语音服务质量检测方法、模型训练方法及装置 | |
CN112905739A (zh) | 虚假评论检测模型训练方法、检测方法及电子设备 | |
CN114818729A (zh) | 一种训练语义识别模型、查找语句的方法、装置及介质 | |
CN109189922B (zh) | 评论评估模型的训练方法和装置 | |
CN112749556B (zh) | 多语言模型的训练方法和装置、存储介质和电子设备 | |
CN113987167A (zh) | 基于依赖感知图卷积网络的方面级情感分类方法及系统 | |
CN116663566A (zh) | 一种基于商品评价的方面级情感分析方法及系统 | |
CN111767720B (zh) | 一种标题生成方法、计算机及可读存储介质 | |
CN112132075B (zh) | 图文内容处理方法及介质 | |
CN112950261A (zh) | 一种用户价值的确定方法及系统 | |
CN112199500A (zh) | 针对评论的情感倾向识别方法、装置及电子设备 | |
CN116703509A (zh) | 一种针对直播营销商品质量感知分析的网购助手构建方法 | |
CN115718889A (zh) | 针对公司简介的行业分类方法及装置 | |
Purba et al. | A hybrid convolutional long short-term memory (CNN-LSTM) based natural language processing (NLP) model for sentiment analysis of customer product reviews in Bangla | |
CN113392190B (zh) | 一种文本识别方法、相关设备及装置 | |
CN111566665B (zh) | 在自然语言处理中应用图像编码识别的装置和方法 | |
KR20220118703A (ko) | 머신러닝 기반 온라인 쇼핑 리뷰 감정 예측 시스템 및 방법 | |
CN114358579A (zh) | 评阅方法、评阅装置、电子设备以及计算机可读存储介质 | |
CN109740162B (zh) | 文本表示方法、装置及介质 | |
CN115017321A (zh) | 一种知识点预测方法、装置、存储介质以及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |