CN109376759A - 用户信息分类方法、装置、计算机设备和存储介质 - Google Patents

用户信息分类方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109376759A
CN109376759A CN201811052973.4A CN201811052973A CN109376759A CN 109376759 A CN109376759 A CN 109376759A CN 201811052973 A CN201811052973 A CN 201811052973A CN 109376759 A CN109376759 A CN 109376759A
Authority
CN
China
Prior art keywords
decision
result
user information
information
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811052973.4A
Other languages
English (en)
Inventor
马静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811052973.4A priority Critical patent/CN109376759A/zh
Publication of CN109376759A publication Critical patent/CN109376759A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及计算机技术领域,特别是涉及基于机器学习的一种用户信息分类方法、装置、计算机设备和存储介质。所述方法包括:接收用户终端发送的业务请求,业务请求中携带了用户信息;对用户信息进行聚类分析,得到聚类结果;根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果;获取数据分析模型,利用数据分析模型对决策结果进行验证;验证通过后,对业务请求添加与决策结果对应的类别标签;利用类别标签生成与业务请求对应的推荐信息,并将推荐信息发送至用户终端。采用本方法能够基于大数据分析有效提高用户信息分类的准确率。

Description

用户信息分类方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及基于机器学习的一种用户信息分类方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的迅速发展,互联网技术在医疗方面的应用也越来越广泛,也给人们带来了很大的便利。目前就已经出现了很多智能辅助系统、用户自动分类系统等,利用这些智能系统能够有效地自动根据用户输入的用户信息对用户进行分类,从而能够进一步有效地处理各种业务。
然而传统的方式中,用户通过用户终端输入用户信息后,通过获取预先建立的用户信息的特与用户对应的类别之间的关系进行匹配,或者利用神经网络分类模型根据用户输入的用户信息进行分类。然而传统的方式中,只是根据用户输入的信息直接进行匹配或分类,而通常用户输入的信息并不完善,或者并不能根据用户输入的用户信息对用户进行准确地有针对性的分类,进而导致用户信息分类的准确性较低。因此,如何有效提高用户信息分类的准确率成为目前需要解决的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高用户信息的分类准确率的用户信息分类方法、装置、计算机设备和存储介质。
一种用户信息分类方法,包括:
接收用户终端发送的业务请求,所述业务请求携带用户信息;
对所述用户信息进行聚类分析,得到聚类结果;
根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
获取数据分析模型,利用所述数据分析模型对所述决策结果进行验证;
验证通过后,对所述业务请求添加与所述决策结果对应的类别标签;
利用所述类别标签生成与所述业务请求对应的推荐信息,并将所述推荐信息发送至所述用户终端。
在其中一个实施例中,所述根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果,包括:
根据所述用户信息按照决策树的节点顺序进行遍历;
当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将所述提示问题发送至所述用户终端;
接收所述用户终端发送的答案信息;
根据所述用户信息和所述答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
在其中一个实施例中,所述根据所述聚类结果获取决策模型之前,还包括:
获取多个数据库中的多个业务数据,所述业务数据包括对应的业务属性和业务类别;
对多个业务数据训练的业务属性和业务类别之间的关联关系;
利用训练后的业务属性和业务类别之间的关联关系构建决策树;
利用所述决策树生成决策模型。
在其中一个实施例中,所述方法还包括:
获取多个更新业务数据,所述更新业务数据包括对应的业务属性和业务类别;
利用所述更新业务数据对应的业务属性和业务类别之间的关联关系对所述决策模型进行优化。
在其中一个实施例中,所述方法还包括:
获取与所述用户对应的历史信息;
获取决策模型,将所述用户信息和所述历史信息输入至所述决策模型中进行决策,得到对应的决策结果。
在其中一个实施例中,所述方法还包括:
根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
根据所述决策结果获取与所述决策结果对应的消耗品;
将所述消耗品推送至所述用户终端。
一种用户信息分类装置,包括:
接收模块,用于接收用户终端发送的业务请求,所述业务请求携带了用户信息;
聚类模块,用于对所述用户信息进行聚类分析,得到聚类结果;
决策模块,用于根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
验证模块,用于获取数据分析模型,利用所述数据分析模型对所述决策结果进行验证;
分类模块,用于验证通过后,对所述业务请求添加与所述决策结果对应的类别标签;
推送模块,用于利用所述类别标签生成与所述用户对应的推荐信息,并将所述推荐信息发送至所述用户终端。
在其中一个实施例中,所述决策模块还用于根据所述用户信息按照决策树的节点顺序进行遍历;当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将所述提示问题发送至所述用户终端;接收所述用户终端发送的答案信息;根据所述用户信息和所述答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收用户终端发送的业务请求,所述业务请求中携带了用户信息;
对所述用户信息进行聚类分析,得到聚类结果;
根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
获取数据分析模型,利用所述数据分析模型对所述决策结果进行验证;
验证通过后,对所述业务请求添加与所述决策结果对应的类别标签;
利用所述类别标签生成与所述业务请求对应的推荐信息,并将所述推荐信息发送至所述用户终端。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收用户终端发送的业务请求,所述业务请求中携带了用户信息;
对所述用户信息进行聚类分析,得到聚类结果;
根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
获取数据分析模型,利用所述数据分析模型对所述决策结果进行验证;
验证通过后,对所述业务请求添加与所述决策结果对应的类别标签;
利用所述类别标签生成与所述业务请求对应的推荐信息,并将所述推荐信息发送至所述用户终端。
上述用户信息分类方法、装置、计算机设备和存储介质,服务器接收用户终端发送的业务请求后,对业务请求中携带的用户信息进行聚类分析,得到聚类结果。服务器根据聚类结果获取对应的决策模型,并将用户信息输入至所述决策模型中进行决策,得到对应的决策结果。通过利用决策模型对用户信息进行决策,由此能够有效地得到准确率较高的决策结果。服务器进一步获取数据分析模型,利用数据分析模型对决策结果进行验证;验证通过后,则对业务请求添加与决策结果对应的类别标签,并利用类别标签生成与业务请求对应的推荐信息,并将推荐信息发送至用户终端。通过利用决策模型对用户信息进行决策后,再利用数据分析模型进一步对决策结果进行分析和验证,从而有效地提高了用户信息分类的准确率。
附图说明
图1为一个实施例中用户信息分类方法的应用场景图;
图2为一个实施例中用户信息分类方法的流程示意图;
图3为一个实施例中对用户信息进行决策的步骤的流程示意图;
图4为一个实施例中推送消耗品的步骤的流程示意图;
图5为一个实施例中用户信息分类装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的用户信息分类方法,可以应用于如图1所示的应用环境中。其中,用户终端102通过网络与服务器104通过网络进行通信。其中,用户终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。多个用户终端102可以获取用户输入的用户信息,并利用用户信息生成业务请求后,向服务器104发送业务请求,服务器接收到多个用户终端发送的对应的业务请求后,对业务请求中的用户信息进行聚类分析,得到聚类结果。服务器根据聚类结果获取对应的决策模型,并将用户信息输入至决策模型中进行决策,得到对应的决策结果。通过利用决策模型对用户信息进行决策,由此能够有效地得到准确率较高的决策结果。服务器进一步获取数据分析模型,利用数据分析模型对决策结果进行验证;验证通过后,则对业务请求添加与决策结果对应的类别标签,并利用类别标签生成与业务请求对应的推荐信息,并将推荐信息发送至用户终端。通过利用决策模型对用户信息进行决策后,再利用数据分析模型进一步对决策结果进行分析和验证,从而有效地提高了用户信息分类的准确率。
在一个实施例中,如图2所示,提供了一种用户信息分类方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤202,接收用户终端发送的业务请求,业务请求中携带了用户信息。
终端可以向服务器发送不同类型的业务请求,以使得服务器岁终端发送的业务请求进行处理。其中,业务请求可以是基于处理各种业务所需的业务请求,例如,业务请求可以是疾病分类请求等。
步骤204,对用户信息进行聚类分析,得到聚类结果。
服务器接收用户终端发送的业务请求后,对业务请求中的用户信息进行聚类分析。具体地,服务器提取出用户信息对应的特征变量,对特征变量进行聚类,具体地,可以采用k-means(k-均值算法)聚类的方法,其中,k的值可以是2。通过对特征变量进行多次聚类后得到多个聚类结果。首先从特征变量中任意选择两个变量作为初始聚类中心点,计算出每个特征变量与聚类中心点之间的相似度,相似度也可以代表每个特征变量与聚类中心点之间的距离,可以采用均方差函数进行计算。根据每个特征变量与聚类中心点的相似度,分别将特征变量分配到与聚类中心点最相似的聚类中,得到多个聚类结果。
具体地,在所有特征变量中随机选取k个特征变量作为聚类中心点,k是预设的聚类数,为μ12,…μk∈Rn。计算公式可为:
c(i)=arg min||x(i)j||2
其中,c(i)代表特征变量与k个类中距离最近的类,i表示每个特征变量;argmin(·)表示使目标函数取最小值时的变量值的参数;x(i)表示特征变量集,μj表示每一个聚类的聚类中心点,j表示每一个聚类数。
对于每一个类j重新计算该类的聚类中心点,求出每个特征变量到聚类中心点的距离平方和,具体的公式可以为:
其中,J(c,μ)表示每个特征变量到聚类中心点的距离平方和,m表示特征变量的数量,i表示每个特征变量;x(i)表示特征变量集;μc(i)表示表示特征变量的聚类中心点。
通过K-means的算法将J调整到最小。假设当前J没有达到最小值,则可以固定每个类的质心μj,调整每个样例的所属的类别c(i),让J函数递减。同样,固定c(i),调整每个类的质心μj也可以使J减小。这两个过程就是内循环中使J单调
递减的过程。当J递减到最小时,μ和c也同时收敛,使得聚类中心点不变或者变化很小,从而能够对特征变量进行准确地分类,得到聚类结果。
步骤206,根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果。
服务器对业务请求中的用户信息进行聚类分析,从而得到聚类结果。服务器进一步根据得到的聚类结果获取对应的决策模型。不同的聚类结果可以有对应不同的决策模型。服务器获取与聚类结果对应的决策模型后,将用户信息输入至获取的决策模型中进行决策。具体地,服务器将用户信息对应的特征变量输入至决策模型中,进而决策模型对用户信息对应的特征变量进行决策分类,从而能够得到对应的决策结果。其中,决策模型也可以是预设的分类器模型,通过利用决策模型从而对用户信息进行分类。
步骤208,获取数据分析模型,利用数据分析模型对决策结果进行验证。
服务器利用决策模型对用户信息进行决策得到对应的决策结果后,进一步获取数据分析模型。数据分析模型是通过获取大量的业务数据进行分析后建立的数据分析模型,数据分析模型中包括了多种用户信息与决策结果之间对应关系的概率。进而服务器利用数据分析模型对得到的决策结果进行验证。
步骤210,验证通过后,对业务请求添加与决策结果对应的类别标签。
服务器利用数据分析模型对得到的决策结果进行验证,通过数据分析模型可以得到用户信息与决策结果之间对应关系的概率值。当得到的概率值达到预设概率值时,则表示验证通过。验证通过后,服务器则对业务请求添加与决策结果对应的类别标签。
步骤212,利用类别标签生成与业务请求对应的推荐信息,并将推荐信息发送至用户终端。
服务器对业务请求添加与决策结果对应的类别标签后,就利用类别标签生成与业务请求对应的推荐信息。其中,推荐信息可以是与业务请求相关的推荐信息,也可以是服务器对业务请求进行处理后的反馈信息。服务器并将推荐信息返回至对应的用户终端。
例如,用户终端发送的业务请求可以是疾病分类请求,服务器用户终端发送的用户信息后,根据用户信息中的基本信息和业务信息对用户信息进行聚类分析,得到聚类结果。由此可以根据用户信息得到对应的疾病领域对应的聚类结果。服务器进一步根据聚类结果获取对应的决策模型,并将业务信息输入至所述决策模型中进行决策,得到对应的决策结果,由此能够有效地决策出该用户信息所对应的疾病类别的决策结果。服务器进一步获取数据分析模型,利用数据分析模型对决策结果进行验证;验证通过后,则对业务请求添加与决策结果对应的类别标签,例如疾病类别对应的疾病类别标签。服务器并利用类别标签生成与用户对应的推荐信息,例如,可以根据决策出的疾病类别生成与该疾病类别相关的推荐信息,并将推荐信息发送至用户终端。
上述用户信息分类方法中,服务器接收用户终端发送的用户信息后,根据用户信息中的基本信息和业务信息对用户信息进行聚类分析,得到聚类结果。服务器根据聚类结果获取对应的决策模型,并将业务信息输入至决策模型中进行决策,得到对应的决策结果。通过利用决策模型对用户信息进行决策,由此能够有效地得到准确率较高的决策结果。服务器进一步获取数据分析模型,利用数据分析模型对决策结果进行验证;验证通过后,则对业务请求添加与决策结果对应的类别标签,并利用类别标签生成与用户对应的推荐信息,并将推荐信息发送至用户终端。通过利用决策模型对用户信息进行决策后,再利用数据分析模型进一步对决策结果进行分析和验证,从而有效地提高了用户信息分类的准确率。
在一个实施例中,如图3所示,根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果的步骤包括:
步骤302,根据用户信息按照决策树的节点顺序进行遍历。
步骤304,当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将提示问题发送至用户终端。
服务器服对业务请求中的用户信息进行聚类分析,从而得到聚类结果。服务器进一步根据得到的聚类结果获取对应的决策模型。具体地,服务器获取决策模型,决策模型中包括对应的决策树,决策树中包括多个节点。服务器根据决策模型中决策树的的节点顺序进行遍历。
当存在不匹配的节点时,表示用户输入的信息不够完善,无法匹配出比较准确完善的决策结果。服务器进一步根据不匹配节点生成对应的提示问题,并将提示问题发送至用户终端。
步骤306,接收用户终端发送的答案信息。
步骤308,根据用户信息和答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
服务器将提示问题发送至用户终端后,以使得用户终端根据提示问题进一步输入答案信息,并上传至服务器。服务器接收用户终端再次发送的答案信息后,进一步根据用户信息和答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。通过对对不完善的用户信息进行针对性的补充,并进行决策分类,由此能够有效地提高用户信息的分类准确性。
在一个实施例中,根据聚类结果获取决策模型之前,还包括:获取多个数据库中的多个业务数据,业务数据包括对应的业务属性和业务类别;对多个业务数据训练的业务属性和业务类别之间的关联关系;利用训练后的业务属性和业务类别之间的关联关系构建决策树;利用决策树生成决策模型。
服务器在获取决策模型对用户信息进行处理之前,需要预先建立决策模型。具体地,服务器可以利用互联网爬虫技术从各个平台的数据库中获取大量的业务数据。其中,业务数据可以是多个用户已经办理过的对应的业务的业务数据,业务数据中包括了对应的业务属性和业务类别,每个业务数据中的业务属性和业务类别存在关联关系。
服务器利用获取的大量的业务数据训练出业务属性和业务类别之间的关联关系,并利用训练后的业务属性和业务类别之间的关联关系构建决策树,由此可以利用决策树生成决策模型。通过对获取的大量业务数据进行训练,由此能够有效地得到准确率较高的决策模型。
在一个实施例中,该方法还包括:获取多个更新业务数据,更新业务数据包括对应的业务属性和业务类别;利用更新业务数据对应的业务属性和业务类别之间的关联关系对决策模型进行优化。
随着各种因素的变化,决策模型也需要随着各种因素的变化和时间的推移进行调整,以提高模型的稳定性。
具体地,服务器接收到用户终端发送的业务请求后,可以从数据库中获取预设时间段内多个用户对应的更新业务数据。预设时间可以是一年,也可以是半年,一个季度或一个月等。更新业务数据可以是多个用户在预设时间段内办理过的更新业务数据。更新业务数据包括对应的业务属性和业务类别。服务器将每个用户对应的更新业务数据作为一个样本,将每个更新业务数据中的特征变量作为一个维度。服务器进一步对每个维度的样本进行聚类分析。服务器可以采用聚类分析算法,例如K-means算法,将每个特征变量作为数据对象依次对多个样本进行迭代计算,计算出每个维度对应的聚类结果。例如,服务器可以获取更新业务数据中的业务属性和业务类别等维度的特征变量,对多个样本进行聚类分析,分析出业务数据对应的业务属性和业务类别之间的关联关系。由此服务器可以利用聚类结果对决策模型的参数进行优化更新,进而可以利用更新业务数据对应的业务属性和业务类别之间的关联关系对决策模型进行优化
服务器进一步通过对更新业务数据进行聚类分析,以对决策模型进行优化,可以有效地保证决策模型的稳定新,进而能够有效提高利用决策模型对用户信息进行分类的准确性。
在一个实施例中,该方法还包括:获取与用户对应的历史信息;获取决策模型,将用户信息和历史信息输入至决策模型中进行决策,得到对应的决策结果。
服务器接收用户终端发送的用户信息,根据用户信息中的基本信息和业务信息对用户信息进行聚类分析,得到聚类结果后。服务器进一步获取与用户对应的历史信息,并获取决策模型,将用户信息和历史信息输入至决策模型中进行决策。具体地,服务器将用户信息和历史信息根据决策模型中决策树的的节点顺序进行遍历,得到对应的决策结果。通过获取该用户对应的历史信息和当前输入的用户信息进行决策,由此能够有效地提高对用户信息进行分类的准确性。
在一个实施例中,该方法还包括推送消耗品的步骤:如图4所示推送消耗品的步骤具体包括:
步骤402,根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果。
服务器接收用户终端发送的用户信息后,根据用户信息中的基本信息和业务信息对用户信息进行聚类分析,得到聚类结果。服务器根据聚类结果获取对应的决策模型,并将业务信息输入至决策模型中进行决策,得到对应的决策结果。通过利用决策模型对用户信息进行决策,由此能够有效地得到准确率较高的决策结果。
步骤404,根据决策结果获取与决策结果对应的消耗品。
步骤406,将消耗品推送至用户终端。
服务器通过利用决策模型对用户信息进行决策,得到对应的决策结果后,可以根据决策结果获取与决策结果对应的消耗品,并将消耗品推送至用户终端。其中,消耗品可以是各种产品、或产品的链接等。例如,当该业务请求为疾病分类请求时,根据用户信息决出出该用户对应的疾病类别的决策结果后,就可根据疾病类别获取与该疾病类别对应的药品,并将药品推送给用户终端。通过利用决策结果向用户终端推送对应的消耗品,可以有效便捷地位用户提供便利,有效提高了业务请求的处理效率。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种用户信息分类装置,包括:接收模块502、聚类模块504、决策模块506、验证模块508、分类模块510和推送模块512,其中:
接收模块502,用于接收用户终端发送的业务请求,业务请求中携带了用户信息。
聚类模块504,用于对用户信息进行聚类分析,得到聚类结果。
决策模块506,用于根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果。
验证模块508,用于获取数据分析模型,利用数据分析模型对决策结果进行验证。
分类模块510,用于验证通过后,对业务请求添加与决策结果对应的类别标签。
推送模块512,用于利用类别标签生成与业务请求对应的推荐信息,并将推荐信息发送至用户终端。
在一个实施例中,决策模块506还用于根据用户信息按照决策树的节点顺序进行遍历;当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将提示问题发送至用户终端;接收用户终端发送的答案信息;根据用户信息和答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
在一个实施例中,该装置还包括决策模型构建模块,用于获取多个数据库中的多个业务数据,业务数据包括对应的业务属性和业务类别;对多个业务数据训练的业务属性和业务类别之间的关联关系;利用训练后的业务属性和业务类别之间的关联关系构建决策树;利用决策树生成决策模型。
在一个实施例中,该装置还包括决策模型优化模块,用于获取多个更新业务数据,更新业务数据包括对应的业务属性和业务类别;利用更新业务数据对应的业务属性和业务类别之间的关联关系对决策模型进行优化。
在一个实施例中,决策模块506还用于获取与用户对应的历史信息;获取决策模型,将用户信息和历史信息输入至决策模型中进行决策,得到对应的决策结果。
在一个实施例中,推送模块512还用于根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果;根据决策结果获取与决策结果对应的消耗品;将消耗品推送至用户终端。
关于用户信息分类装置的具体限定可以参见上文中对于用户信息分类方法的限定,在此不再赘述。上述用户信息分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户信息、业务信息和消耗品信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户信息分类方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
接收用户终端发送的业务请求,业务请求中携带了用户信息;
对用户信息进行聚类分析,得到聚类结果;
根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果;
获取数据分析模型,利用数据分析模型对决策结果进行验证;
验证通过后,对业务请求添加与决策结果对应的类别标签;
利用类别标签生成与业务请求对应的推荐信息,并将推荐信息发送至用户终端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据用户信息按照决策树的节点顺序进行遍历;当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将提示问题发送至用户终端;接收用户终端发送的答案信息;根据用户信息和答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多个数据库中的多个业务数据,业务数据包括对应的业务属性和业务类别;对多个业务数据训练的业务属性和业务类别之间的关联关系;利用训练后的业务属性和业务类别之间的关联关系构建决策树;利用决策树生成决策模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多个更新业务数据,更新业务数据包括对应的业务属性和业务类别;利用更新业务数据对应的业务属性和业务类别之间的关联关系对决策模型进行优化。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取与用户对应的历史信息;获取决策模型,将用户信息和历史信息输入至决策模型中进行决策,得到对应的决策结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果;根据决策结果获取与决策结果对应的消耗品;将消耗品推送至用户终端。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
接收用户终端发送的业务请求,业务请求中携带了用户信息;
对用户信息进行聚类分析,得到聚类结果;
根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果;
获取数据分析模型,利用数据分析模型对决策结果进行验证;
验证通过后,对业务请求添加与决策结果对应的类别标签;
利用类别标签生成与业务请求对应的推荐信息,并将推荐信息发送至用户终端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据用户信息按照决策树的节点顺序进行遍历;当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将提示问题发送至用户终端;接收用户终端发送的答案信息;根据用户信息和答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个数据库中的多个业务数据,业务数据包括对应的业务属性和业务类别;对多个业务数据训练的业务属性和业务类别之间的关联关系;利用训练后的业务属性和业务类别之间的关联关系构建决策树;利用决策树生成决策模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个更新业务数据,更新业务数据包括对应的业务属性和业务类别;利用更新业务数据对应的业务属性和业务类别之间的关联关系对决策模型进行优化。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取与用户对应的历史信息;获取决策模型,将用户信息和历史信息输入至决策模型中进行决策,得到对应的决策结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据聚类结果获取决策模型,将用户信息输入至决策模型中进行决策,得到对应的决策结果;根据决策结果获取与决策结果对应的消耗品;将消耗品推送至用户终端。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种用户信息分类方法,包括:
接收用户终端发送的业务请求,所述业务请求中携带了用户信息;
对所述用户信息进行聚类分析,得到聚类结果;
根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
获取数据分析模型,利用所述数据分析模型对所述决策结果进行验证;
验证通过后,对所述业务请求添加与所述决策结果对应的类别标签;
利用所述类别标签生成与所述业务请求对应的推荐信息,并将所述推荐信息发送至所述用户终端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果的步骤包括:
根据所述用户信息按照决策树的节点顺序进行遍历;
当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将所述提示问题发送至所述用户终端;
接收所述用户终端发送的答案信息;
根据所述用户信息和所述答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述聚类结果获取决策模型之前,还包括:
获取多个数据库中的多个业务数据,所述业务数据包括对应的业务属性和业务类别;
对多个业务数据训练的业务属性和业务类别之间的关联关系;
利用训练后的业务属性和业务类别之间的关联关系构建决策树;
利用所述决策树生成决策模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取多个更新业务数据,所述更新业务数据包括对应的业务属性和业务类别;
利用所述更新业务数据对应的业务属性和业务类别之间的关联关系对所述决策模型进行优化。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述方法还包括:
获取与所述用户对应的历史信息;
获取决策模型,将所述用户信息和所述历史信息输入至所述决策模型中进行决策,得到对应的决策结果。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
根据所述决策结果获取与所述决策结果对应的消耗品;
将所述消耗品推送至所述用户终端。
7.一种用户信息分类装置,包括:
接收模块,用于接收用户终端发送的业务请求,所述业务请求中携带了用户信息;
聚类模块,用于对所述用户信息进行聚类分析,得到聚类结果;
决策模块,用于根据所述聚类结果获取决策模型,将所述用户信息输入至所述决策模型中进行决策,得到对应的决策结果;
验证模块,用于获取数据分析模型,利用所述数据分析模型对所述决策结果进行验证;
分类模块,用于验证通过后,对所述业务请求添加与所述决策结果对应的类别标签;
推送模块,用于利用所述类别标签生成与所述业务请求对应的推荐信息,并将所述推荐信息发送至所述用户终端。
8.根据权利要求7所述的装置,其特征在于,所述决策模块还用于根据所述用户信息按照决策树的节点顺序进行遍历;当存在不匹配的节点时,根据不匹配节点生成对应的提示问题,并将所述提示问题发送至所述用户终端;接收所述用户终端发送的答案信息;根据所述用户信息和所述答案信息继续按照决策树的节点顺序进行遍历,直到得到对应的决策结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201811052973.4A 2018-09-10 2018-09-10 用户信息分类方法、装置、计算机设备和存储介质 Pending CN109376759A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811052973.4A CN109376759A (zh) 2018-09-10 2018-09-10 用户信息分类方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811052973.4A CN109376759A (zh) 2018-09-10 2018-09-10 用户信息分类方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109376759A true CN109376759A (zh) 2019-02-22

Family

ID=65404899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811052973.4A Pending CN109376759A (zh) 2018-09-10 2018-09-10 用户信息分类方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109376759A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097451A (zh) * 2019-04-01 2019-08-06 中国银联股份有限公司 一种银行业务的监控方法及装置
CN110197055A (zh) * 2019-05-31 2019-09-03 北京三快在线科技有限公司 管理信息的方法、装置、设备及存储介质
CN110348672A (zh) * 2019-05-24 2019-10-18 深圳壹账通智能科技有限公司 业务决策方法、装置、计算设备和计算机可读存储介质
CN110648052A (zh) * 2019-09-02 2020-01-03 浙江大搜车软件技术有限公司 风控决策方法、装置、计算机设备和存储介质
CN110766269A (zh) * 2019-09-02 2020-02-07 平安科技(深圳)有限公司 一种任务分配方法、装置、可读存储介质及终端设备
CN110767224A (zh) * 2019-10-15 2020-02-07 上海云从企业发展有限公司 一种基于特征权级的业务管理方法、系统、设备和介质
CN110765327A (zh) * 2019-09-05 2020-02-07 深圳壹账通智能科技有限公司 数据分析方法、装置、计算机装置及存储介质
CN111047336A (zh) * 2019-12-24 2020-04-21 太平金融科技服务(上海)有限公司 用户标签推送、用户标签展示方法、装置和计算机设备
CN111222919A (zh) * 2020-01-08 2020-06-02 上海钧正网络科技有限公司 业务数据的推送方法、装置、计算机设备和存储介质
CN111523604A (zh) * 2020-04-27 2020-08-11 中国银行股份有限公司 一种用户分类的方法和相关装置
CN111611322A (zh) * 2019-02-25 2020-09-01 京东数字科技控股有限公司 一种用户信息关联的方法及系统
CN111612499A (zh) * 2020-04-03 2020-09-01 浙江口碑网络技术有限公司 信息的推送方法及装置、存储介质、终端
CN112307087A (zh) * 2020-11-02 2021-02-02 平安科技(深圳)有限公司 基于决策树的业务数据投被关系匹配方法和装置
CN112395500A (zh) * 2020-11-17 2021-02-23 平安科技(深圳)有限公司 内容数据推荐方法、装置、计算机设备及存储介质
CN112508074A (zh) * 2020-11-30 2021-03-16 深圳市飞泉云数据服务有限公司 可视化展示方法、系统及可读存储介质
CN112529074A (zh) * 2020-12-09 2021-03-19 平安科技(深圳)有限公司 一种业务信息处理方法及相关设备
CN112561479A (zh) * 2020-12-16 2021-03-26 中国平安人寿保险股份有限公司 基于智能决策的企业增员的方法、装置及计算机设备
CN113037840A (zh) * 2021-03-08 2021-06-25 中国联合网络通信集团有限公司 通信数据传输方法、通信终端和通信平台
CN114386502A (zh) * 2022-01-07 2022-04-22 北京点众科技股份有限公司 对快应用的用户进行聚类分析的方法、设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104486096A (zh) * 2014-11-21 2015-04-01 河南中烟工业有限责任公司 基于工业以太网故障诊断方法中决策树的推理方法
CN107563429A (zh) * 2017-07-27 2018-01-09 国家计算机网络与信息安全管理中心 一种网络用户群体的分类方法及装置
CN107577771A (zh) * 2017-09-07 2018-01-12 北京海融兴通信息安全技术有限公司 一种大数据挖掘系统
CN107658001A (zh) * 2017-10-10 2018-02-02 丁木(北京)技术有限公司 一种家庭用油健康管理方法和系统
CN108334894A (zh) * 2017-12-29 2018-07-27 泰豪科技股份有限公司 基于无监督机器学习的变压器油温异常识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104486096A (zh) * 2014-11-21 2015-04-01 河南中烟工业有限责任公司 基于工业以太网故障诊断方法中决策树的推理方法
CN107563429A (zh) * 2017-07-27 2018-01-09 国家计算机网络与信息安全管理中心 一种网络用户群体的分类方法及装置
CN107577771A (zh) * 2017-09-07 2018-01-12 北京海融兴通信息安全技术有限公司 一种大数据挖掘系统
CN107658001A (zh) * 2017-10-10 2018-02-02 丁木(北京)技术有限公司 一种家庭用油健康管理方法和系统
CN108334894A (zh) * 2017-12-29 2018-07-27 泰豪科技股份有限公司 基于无监督机器学习的变压器油温异常识别方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611322B (zh) * 2019-02-25 2024-04-09 京东科技控股股份有限公司 一种用户信息关联的方法及系统
CN111611322A (zh) * 2019-02-25 2020-09-01 京东数字科技控股有限公司 一种用户信息关联的方法及系统
CN110097451A (zh) * 2019-04-01 2019-08-06 中国银联股份有限公司 一种银行业务的监控方法及装置
CN110097451B (zh) * 2019-04-01 2023-10-03 中国银联股份有限公司 一种银行业务的监控方法及装置
CN110348672A (zh) * 2019-05-24 2019-10-18 深圳壹账通智能科技有限公司 业务决策方法、装置、计算设备和计算机可读存储介质
CN110197055B (zh) * 2019-05-31 2023-09-01 北京三快在线科技有限公司 管理信息的方法、装置、设备及存储介质
CN110197055A (zh) * 2019-05-31 2019-09-03 北京三快在线科技有限公司 管理信息的方法、装置、设备及存储介质
CN110648052A (zh) * 2019-09-02 2020-01-03 浙江大搜车软件技术有限公司 风控决策方法、装置、计算机设备和存储介质
CN110766269A (zh) * 2019-09-02 2020-02-07 平安科技(深圳)有限公司 一种任务分配方法、装置、可读存储介质及终端设备
CN110765327A (zh) * 2019-09-05 2020-02-07 深圳壹账通智能科技有限公司 数据分析方法、装置、计算机装置及存储介质
CN110767224A (zh) * 2019-10-15 2020-02-07 上海云从企业发展有限公司 一种基于特征权级的业务管理方法、系统、设备和介质
CN111047336A (zh) * 2019-12-24 2020-04-21 太平金融科技服务(上海)有限公司 用户标签推送、用户标签展示方法、装置和计算机设备
CN111222919A (zh) * 2020-01-08 2020-06-02 上海钧正网络科技有限公司 业务数据的推送方法、装置、计算机设备和存储介质
CN111222919B (zh) * 2020-01-08 2023-12-15 上海钧正网络科技有限公司 业务数据的推送方法、装置、计算机设备和存储介质
CN111612499B (zh) * 2020-04-03 2023-07-28 浙江口碑网络技术有限公司 信息的推送方法及装置、存储介质、终端
CN111612499A (zh) * 2020-04-03 2020-09-01 浙江口碑网络技术有限公司 信息的推送方法及装置、存储介质、终端
CN111523604A (zh) * 2020-04-27 2020-08-11 中国银行股份有限公司 一种用户分类的方法和相关装置
CN112307087B (zh) * 2020-11-02 2024-03-05 平安科技(深圳)有限公司 基于决策树的业务数据投被关系匹配方法和装置
CN112307087A (zh) * 2020-11-02 2021-02-02 平安科技(深圳)有限公司 基于决策树的业务数据投被关系匹配方法和装置
CN112395500A (zh) * 2020-11-17 2021-02-23 平安科技(深圳)有限公司 内容数据推荐方法、装置、计算机设备及存储介质
CN112395500B (zh) * 2020-11-17 2023-09-05 平安科技(深圳)有限公司 内容数据推荐方法、装置、计算机设备及存储介质
CN112508074A (zh) * 2020-11-30 2021-03-16 深圳市飞泉云数据服务有限公司 可视化展示方法、系统及可读存储介质
CN112508074B (zh) * 2020-11-30 2024-05-14 深圳市飞泉云数据服务有限公司 可视化展示方法、系统及可读存储介质
CN112529074B (zh) * 2020-12-09 2024-04-26 平安科技(深圳)有限公司 一种业务信息处理方法及相关设备
CN112529074A (zh) * 2020-12-09 2021-03-19 平安科技(深圳)有限公司 一种业务信息处理方法及相关设备
CN112561479A (zh) * 2020-12-16 2021-03-26 中国平安人寿保险股份有限公司 基于智能决策的企业增员的方法、装置及计算机设备
CN112561479B (zh) * 2020-12-16 2023-09-19 中国平安人寿保险股份有限公司 基于智能决策的企业增员的方法、装置及计算机设备
CN113037840A (zh) * 2021-03-08 2021-06-25 中国联合网络通信集团有限公司 通信数据传输方法、通信终端和通信平台
CN113037840B (zh) * 2021-03-08 2022-06-10 中国联合网络通信集团有限公司 通信数据传输方法、通信终端和通信平台
CN114386502A (zh) * 2022-01-07 2022-04-22 北京点众科技股份有限公司 对快应用的用户进行聚类分析的方法、设备以及存储介质

Similar Documents

Publication Publication Date Title
CN109376759A (zh) 用户信息分类方法、装置、计算机设备和存储介质
Priyanka et al. Decision tree classifier: a detailed survey
CN109241903B (zh) 样本数据清洗方法、装置、计算机设备及存储介质
US11568315B2 (en) Systems and methods for learning user representations for open vocabulary data sets
CN110060144B (zh) 额度模型训练方法、额度评估方法、装置、设备及介质
Bezerra et al. An evolving approach to data streams clustering based on typicality and eccentricity data analytics
US10062037B2 (en) Self-assembling learning system and apparatus
Zhou et al. Flexible clustered multi-task learning by learning representative tasks
US20060184482A1 (en) Adaptive decision process
WO2021203854A1 (zh) 用户分类方法、装置、计算机设备和存储介质
WO2020133398A1 (zh) 应用推荐方法、装置、服务器和计算机可读存储介质
US20210248449A1 (en) Recommender system using bayesian graph convolution networks
US20220253722A1 (en) Recommendation system with adaptive thresholds for neighborhood selection
CN110516558B (zh) 样本数据获取方法、装置、计算机设备及存储介质
CN113157863A (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN112784168B (zh) 信息推送模型训练方法以及装置、信息推送方法以及装置
CN113536097A (zh) 基于自动特征分组的推荐方法及装置
CN109767290A (zh) 产品推送方法、装置、计算机设备和存储介质
CN115619448A (zh) 用户流失预测方法、装置、计算机设备及存储介质
Liu et al. Deep learning and collaborative filtering-based methods for students’ performance prediction and course recommendation
Zhao et al. User retention-oriented recommendation with decision transformer
CN112732880A (zh) 用户画像生成方法、装置、计算机设备及存储介质
CN111324687A (zh) 知识库中数据处理方法、装置、计算机设备和存储介质
US20210365763A1 (en) Systems using hash keys to preserve privacy across multiple tasks
US20220253688A1 (en) Recommendation system with adaptive weighted baysian personalized ranking loss

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination