CN106897282B - 一种用户群的分类方法和设备 - Google Patents

一种用户群的分类方法和设备 Download PDF

Info

Publication number
CN106897282B
CN106897282B CN201510955046.3A CN201510955046A CN106897282B CN 106897282 B CN106897282 B CN 106897282B CN 201510955046 A CN201510955046 A CN 201510955046A CN 106897282 B CN106897282 B CN 106897282B
Authority
CN
China
Prior art keywords
user
set service
probability value
information
service scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510955046.3A
Other languages
English (en)
Other versions
CN106897282A (zh
Inventor
席炎
王晓光
李文鹏
赵科科
隋宛辰
闫俊杰
曾海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510955046.3A priority Critical patent/CN106897282B/zh
Publication of CN106897282A publication Critical patent/CN106897282A/zh
Application granted granted Critical
Publication of CN106897282B publication Critical patent/CN106897282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种用户群的分类方法和设备,包括:获取至少两个不同用户的用户信息,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的一种或者多种;根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,所述设定业务场景至少对应一个用户群;在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群中,有效改善了现有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群分类的精确度。

Description

一种用户群的分类方法和设备
技术领域
本申请涉及互联网信息处理技术领域,尤其涉及一种用户群的分类方法和设备。
背景技术
“互联网+”是创新2.0下的互联网发展的新业态,是知识社会创新2.0推动下的互联网形态演进及其催生的经济社会发展新形态。“互联网+”是互联网思维的进一步实践成果,它代表一种先进的生产力,推动经济形态不断的发生演变,从而带动社会经济实体的生命力,为改革、创新、发展提供广阔的网络平台。在“互联网+”这种大环境下,互联网金融等金融创新行业得以蓬勃发展。信用消费市场也随着互联网金融行业的发展应运而生。
为了保证信用消费市场的良性发展,个人征信系统(又称为消费者信用信息系统)也随之出现,个人征信系统通过搜集的个人信用信息(例如:个人基本信息、信用交易信息、特殊交易、特别记录、客户本人声明等各类信息)确定消费者(以下称之为用户)的信用度,这样,信用消费市场可以利用不同用户的信用度为用户提供不同的服务。
经研究发现,在确定用户的信用度时,首先,可以将不同的用户进行划分,即将不同的用户进行分群;其次,基于得到的不同用户群,为属于同一个用户群的用户确定信用度。那么,如何精确地将不同的用户进行分群成为一个需要解决的重要问题。
发明内容
有鉴于此,本申请实施例提供了一种用户群的分类方法和设备,用于解决现有技术中如何精确地将不同的用户进行分群的问题。
一种用户群的分类方法,包括:
获取至少两个不同用户的用户信息,其中,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,其中,所述设定业务场景至少对应一个用户群;
在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中。
一种用户群的分类方法,包括:
获取在设定业务场景下待处理的用户产生的用户信息,其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值;
将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。
一种用户群的分类设备,包括:
获取单元,用于获取至少两个不同用户的用户信息,其中,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
确定单元,用于根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,其中,所述设定业务场景至少对应一个用户群;
分类单元,用于在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中。
一种用户群的分类设备,包括:
获取单元,用于获取在设定业务场景下待处理的用户产生的用户信息,其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
确定单元,用于根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值;
分类单元,用于将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。
本申请有益效果如下:
本申请实施例获取至少两个不同用户的用户信息,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,所述设定业务场景至少对应一个用户群;在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群中。这样,本申请实施例在确定用户所属的用户群时,基于多分类模型,利用比较全面的用户信息,进而能够计算得到一个相对准确的确定用户属于哪一个用户群的概率值,有效改善了现有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群分类的精确度,为后续能够精确地确定用户的信用度奠定基础,同时也能够降低后续信用消费市场的消费风险。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种用户群的分类方法的流程示意图;
图2为本申请实施例提供的一种用户群的分类方法的流程示意图;
图3为本申请实施例提供的一种用户群的分类设备的结构示意图;
图4为本申请实施例提供的一种用户群的分类设备的结构示意图。
具体实施方式
为了实现本申请的目的,本申请实施例提供了一种用户群的分类方法和设备,获取至少两个不同用户的用户信息,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,所述设定业务场景至少对应一个用户群;在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群中。这样,本申请实施例在确定用户所属的用户群时,基于多分类模型,利用比较全面的用户信息,进而能够计算得到一个相对准确的确定用户属于哪一个用户群的概率值,有效改善了现有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群分类的精确度,为后续能够精确地确定用户的信用度奠定基础,同时也能够降低后续信用消费市场的消费风险。
需要说明的是,本申请实施例中所记载的基于设定业务场景的多分类模型可以是基于设定业务场景的多分类逻辑回归算法得到的,例如:有序多分类逻辑回归算法,和/或无序多分类逻辑回归算法;也可以是基于其他分类算法得到的,这里不做具体限定。
下面结合说明书附图对本申请各个实施例作进一步地详细描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种用户群的分类方法的流程示意图。所述方法可以如下所示。
步骤101:获取至少两个不同用户的用户信息。
其中,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息以及所述用户的行为偏好信息。
在步骤101中,在获取用户信息阶段,可以是基于不同业务场景,从服务器中获取与业务场景相关的用户信息,也可以是不限于业务场景,从服务器中获取已有的用户信息,还可以是基于用户产生的用户行为数据,从服务器中获取与用户行为数据相关联的用户信息,这里不做限定。
本申请实施例中记载的用户信息可以包含用户的基本信息,所谓用户的基本信息可以包括年龄、性别、出生地、学历、所从事的职业等,用户的基本信息可以基于用户在不同互联网平台上的注册信息确定;也可以包含用户的信用信息,这里的信用信息可以包含用户的信用度、用户所借资源以及逾期未还资源的信息等;也可以包含用户的的社会化关系信息,这里的社会化关系信息可以包含与所述用户建立社会化关系的其他用户的用户信息,或者与所述用户建立社会化关系的其他用户的信用信息等;还可以包含用户的行为偏好信息,这里的用户的行为偏好信息可以根据用户的行为数据确定。
例如:获取到的用户A的用户信息,其中,用户信息中包含用户A的基本信息:用户A的姓名XXX、年龄23、出生地北京、学历本科、当期职业学生等;用户A的信用信息:用户A的信用度良好、当前用户A所具备的信用额度与其经济能力相当;用户A的社会化关系信息:与用户A建立社会化关系的其他用户属于大学生的居多;用户A的行为偏好信息:网上购买电子产品居多,消费能力较同等年龄的人强。
步骤102:根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
其中,所述设定业务场景至少对应一个用户群。
在步骤102中,本申请实施例中所记载的基于设定业务场景的多分类逻辑回归算法可以是指基于设定业务场景不同,所确定的多分类逻辑回归算法中的变量不同,例如:对于校园类业务,所设置的变量可以基于所处的学习阶段不同,例如可以包含一年级的学生、二年级的学生、三年级的学生等,也可以包含小学生、中学生、大学生、研究生等;对于大众化的业务,所设置的变量可以基于职业的不同,例如可以包含工人、农民、学生、公务员等等。
这样针对获取的不同用户的用户信息,可以按照设定业务场景所述设置的变量,利用多分类逻辑回归算法,计算得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
在实际应用中,多分类逻辑回归算法包含有序多分类逻辑回归算法和无序多分类逻辑回归算法,有序多分类逻辑回归算法是在二分类逻辑回归算法基础之上发展的一种算法,通过将设定变量的k种情形划分为两类,利用二分类逻辑回归模型拟合得到有序多分类逻辑回归模型;无序多分类逻辑回归算法则是首先定义因变量的参考值,其次,利用不同自变量对应的因变量与参考值相比建立变换模型,并利用变换模型确定用户的概率值的算法。
本申请实施例中记载的有序多分类逻辑回归算法可以是以现有有序多分类逻辑算法的基础,结合互联网平台中多样性的用户信息,通过训练的方式得到的;无序多分类逻辑回归算法可以是以现有无序多分类逻辑算法的基础,结合互联网平台中多样性的用户信息,通过训练的方式得到的,这里不做限定。
需要说明的是,本申请实施例利用多分类逻辑回归算法,将不同用户的用户信息进行量化,利用量化结果计算得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
这里计算得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,说明每一个用户只能被划分至一个用户群中,不可能同时被划分至两个或者多个用户群中,至于将会被划分至哪个用户群中,需要根据步骤103中所记载的方式确定。
具体地,根据所述至少两个不同用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
例如:将不同用户的用户信息输入基于设定业务场景的有序多分类逻辑回归算法模型中,使得基于设定业务场景的有序多分类逻辑回归算法模型可以根据输入的用户信息,确定该用户属于所述设定业务场景的其中一个用户群的概率值。
或者,
根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
例如:将不同用户的用户信息输入基于设定业务场景的无序多分类逻辑回归算法模型中,使得基于设定业务场景的无序多分类逻辑回归算法模型可以根据输入的用户信息,确定该用户属于所述设定业务场景的其中一个用户群的概率值。
或者,
针对所述至少两个不同用户中每一个用户,分别执行以下操作:
根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率值;
根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率值;
比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为所述用户属于所述设定业务场景的其中一个用户群的概率值。
这里需要说明的是,基于一种业务场景,可以为该业务场景训练一个有序多分类逻辑回归模型和一个无序多分类逻辑回归模型,这样,将一个用户的用户信息分别输入基于设定业务场景的有序多分类逻辑回归算法模型和基于设定业务场景的无序多分类逻辑回归算法模型中,由基于设定业务场景的有序多分类逻辑回归算法模型根据该用户的用户信息确定所述用户属于所述设定业务场景的其中一个用户群的第一概率值;由基于设定业务场景的无序多分类逻辑回归算法模型根据该用户的用户信息确定所述用户属于所述设定业务场景的其中一个用户群的第二概率值,从得到的第一概率值和第二概率值中选择其中一个概率值作为确定用户属于哪个用户群的概率值。
步骤103:在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中。
在步骤103中,将得到的每一个所述用户的概率值进行排序;根据所述设定业务场景所划分用户群的个数,将所述至少两个不同用户进行划分,得到所述设定业务场景的用户群中包含的用户。
需要说明的是,每一个用户群中所包含用户的个数不限,可以相同,也可以不相同。
这里进行划分可以采用平均划分的方式,也可以采用加权划分的方式,这里不做限定。
在得到所述设定业务场景的不同用户群中包含的用户时,根据每一个用户群中包含的用户的概率值,还可以确定该用户群的概率值的取值范围,这样,对于后续新出现的用户,可以通过概率值的取值范围,快速确定用户所属的用户群。
或者,还可以根据每一个用户群中包含的用户的概率值,确定该用户群的设定阈值。
可选地,如果预先确定所述设定业务场景所划分用户群的个数以及每一个用户群的设定阈值,则可以针对所述至少两个不同用户中每一个用户的概率值,分别执行以下操作:
将所述用户的概率值与所述设定业务场景的不同用户群对应的设定阈值进行比较;
当所述用户的概率值与所述设定业务场景的不同用户群对应的设定阈值之间的差值小于设定数值时,将所述用户划分至所述设定业务场景中所述设定阈值对应的用户群中。
需要说明的是,本申请实施例可以用来作为训练用户群的方法,通过从互联网平台中获取大量的用户信息,利用本申请实施例的方案训练不同业务场景下的用户群分类模型,为后续快速确定用户所属的用户群奠定基础。
通过本申请实施例提供的技术方案,获取至少两个不同用户的用户信息,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,所述设定业务场景至少对应一个用户群;在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群中。这样,本申请实施例在确定用户所属的用户群时,基于多分类模型,利用比较全面的用户信息,进而能够计算得到一个相对准确的确定用户属于哪一个用户群的概率值,有效改善了现有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群分类的精确度,为后续能够精确地确定用户的信用度奠定基础,同时也能够降低后续信用消费市场的消费风险。
图2为本申请实施例提供的一种用户群的分类方法的流程示意图。所述方法可以如下所示。
步骤201:获取在设定业务场景下待处理的用户产生的用户信息。
其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种。
在步骤201中,在获取用户信息阶段,可以是基于不同业务场景,从服务器中获取与业务场景相关的用户信息,也可以是不限于业务场景,从服务器中获取已有的用户信息,还可以是基于用户产生的用户行为数据,从服务器中获取与用户行为数据相关联的用户信息,这里不做限定。
本申请实施例中记载的用户信息可以包含用户的基本信息,所谓用户的基本信息可以包括年龄、性别、出生地、学历、所从事的职业等,用户的基本信息可以基于用户在不同互联网平台上的注册信息确定;也可以包含用户的信用信息,这里的信用信息可以包含用户的信用度、用户所借资源以及逾期未还资源的信息等;也可以包含用户的的社会化关系信息,这里的社会化关系信息可以包含与所述用户建立社会化关系的其他用户的用户信息,或者与所述用户建立社会化关系的其他用户的信用信息等;还可以包含用户的行为偏好信息,这里的用户的行为偏好信息可以根据用户的行为数据确定。
步骤202:根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值。
这里步骤202的实现方式与本申请上述实施例中步骤102中的实现方式相同,这里不做具体描述。
步骤203:将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。
在步骤203中,确定所述设定业务场景中包含的用户群的设定阈值,分别将所述概率值与确定的每一个设定阈值进行比较,选择比较结果最小所使用的设定阈值对应的用户群作为所述用户所属所述设定业务场景的用户群。
图3为本申请实施例提供的一种用户群的分类设备的结构示意图。所述分类设备包括:获取单元31、确定单元32和分类单元33,其中:
获取单元31,用于获取至少两个不同用户的用户信息,其中,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
确定单元32,用于根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,其中,所述设定业务场景至少对应一个用户群;
分类单元33,用于在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中。
在本申请的另一个实施例中,所述确定单元32根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
在本申请的另一个实施例中,所述确定单元32根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
在本申请的另一个实施例中,所述确定单元32根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于设定业务场景的其中一个用户群的概率值,包括:
针对所述至少两个不同用户中每一个用户,分别执行以下操作:
根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率值;
根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率值;
比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为所述用户属于所述设定业务场景的其中一个用户群的概率值。
在本申请的另一个实施例中,所述分类单元33根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中,包括:
将得到的每一个所述用户的概率值进行排序;
根据所述设定业务场景所划分用户群的个数,将所述至少两个不同用户进行划分,得到所述设定业务场景的用户群中包含的用户。
需要说明的是,本申请实施例提供的分类设备可以通过软件方式实现,也可以通过硬件方式实现,这里不做限定。本申请实施例提供的分类设备在确定用户所属的用户群时,基于多分类模型,利用比较全面的用户信息,进而能够计算得到一个相对准确的确定用户属于哪一个用户群的概率值,有效改善了现有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群分类的精确度,为后续能够精确地确定用户的信用度奠定基础,同时也能够降低后续信用消费市场的消费风险。
图4为本申请实施例提供的一种用户群的分类设备的结构示意图。所述分类设备包括:获取单元41、确定单元42和分类单元43,其中:
获取单元41,用于获取在设定业务场景下待处理的用户产生的用户信息,其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
确定单元42,用于根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值;
分类单元43,用于将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (12)

1.一种用户群的分类方法,其特征在于,包括:
获取至少两个不同用户的用户信息,其中,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,其中,所述设定业务场景至少对应一个用户群,所述多分类模型用于基于所述设定业务场景所设置的变量,利用多分类逻辑回归算法,计算每一个所述用户属于所述设定业务场景中的其中一个用户群的概率值;
在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中。
2.如权利要求1所述的分类方法,其特征在于,根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
3.如权利要求1所述的分类方法,其特征在于,根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
4.如权利要求1所述的分类方法,其特征在于,根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于设定业务场景的其中一个用户群的概率值,包括:
针对所述至少两个不同用户中每一个用户,分别执行以下操作:
根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率值;
根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率值;
比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为所述用户属于所述设定业务场景的其中一个用户群的概率值。
5.如权利要求1至4任一项所述的分类方法,其特征在于,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中,包括:
将得到的每一个所述用户的概率值进行排序;
根据所述设定业务场景所划分用户群的个数,将所述至少两个不同用户进行划分,得到所述设定业务场景的用户群中包含的用户。
6.一种用户群的分类方法,其特征在于,包括:
获取在设定业务场景下待处理的用户产生的用户信息,其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值,所述多分类模型用于基于所述设定业务场景所设置的变量,利用多分类逻辑回归算法,计算每一个所述用户属于所述设定业务场景中的其中一个用户群的概率值;
将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。
7.一种用户群的分类设备,其特征在于,包括:
获取单元,用于获取至少两个不同用户的用户信息,其中,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
确定单元,用于根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,其中,所述设定业务场景至少对应一个用户群,所述多分类模型用于基于所述设定业务场景所设置的变量,利用多分类逻辑回归算法,计算每一个所述用户属于所述设定业务场景中的其中一个用户群的概率值;
分类单元,用于在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群中。
8.如权利要求7所述的分类设备,其特征在于,所述确定单元根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
9.如权利要求7所述的分类设备,其特征在于,所述确定单元根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值。
10.如权利要求7所述的分类设备,其特征在于,所述确定单元根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于设定业务场景的其中一个用户群的概率值,包括:
针对所述至少两个不同用户中每一个用户,分别执行以下操作:
根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率值;
根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率值;
比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为所述用户属于所述设定业务场景的其中一个用户群的概率值。
11.如权利要求7至10任一项所述的分类设备,其特征在于,所述分类单元根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中,包括:
将得到的每一个所述用户的概率值进行排序;
根据所述设定业务场景所划分用户群的个数,将所述至少两个不同用户进行划分,得到所述设定业务场景的用户群中包含的用户。
12.一种用户群的分类设备,其特征在于,包括:
获取单元,用于获取在设定业务场景下待处理的用户产生的用户信息,其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
确定单元,用于根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值,所述多分类模型用于基于所述设定业务场景所设置的变量,利用多分类逻辑回归算法,计算每一个所述用户属于所述设定业务场景中的其中一个用户群的概率值;
分类单元,用于将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。
CN201510955046.3A 2015-12-17 2015-12-17 一种用户群的分类方法和设备 Active CN106897282B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510955046.3A CN106897282B (zh) 2015-12-17 2015-12-17 一种用户群的分类方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510955046.3A CN106897282B (zh) 2015-12-17 2015-12-17 一种用户群的分类方法和设备

Publications (2)

Publication Number Publication Date
CN106897282A CN106897282A (zh) 2017-06-27
CN106897282B true CN106897282B (zh) 2020-06-05

Family

ID=59189207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510955046.3A Active CN106897282B (zh) 2015-12-17 2015-12-17 一种用户群的分类方法和设备

Country Status (1)

Country Link
CN (1) CN106897282B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009926A (zh) * 2017-12-07 2018-05-08 上海点融信息科技有限责任公司 用于用户分类的方法、信息处理装置及可读存储介质
CN110197055B (zh) * 2019-05-31 2023-09-01 北京三快在线科技有限公司 管理信息的方法、装置、设备及存储介质
CN112182322A (zh) * 2020-09-30 2021-01-05 平安科技(深圳)有限公司 数据分类方法、系统、计算机设备与计算机可读存储介质
CN112330473A (zh) * 2020-11-17 2021-02-05 中国平安人寿保险股份有限公司 一种数据推荐方法、设备、终端及存储介质
CN113688326B (zh) * 2021-10-26 2022-02-08 腾讯科技(深圳)有限公司 推荐方法、装置、设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103603A (zh) * 2009-12-18 2011-06-22 百度在线网络技术(北京)有限公司 用户行为数据分析方法和装置
CN104735169A (zh) * 2015-04-17 2015-06-24 天天艾米(北京)网络科技有限公司 一种居住社区群发现方法
CN104765873A (zh) * 2015-04-24 2015-07-08 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置
CN105022754A (zh) * 2014-04-29 2015-11-04 腾讯科技(深圳)有限公司 基于社交网络的对象分类方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103603A (zh) * 2009-12-18 2011-06-22 百度在线网络技术(北京)有限公司 用户行为数据分析方法和装置
CN105022754A (zh) * 2014-04-29 2015-11-04 腾讯科技(深圳)有限公司 基于社交网络的对象分类方法及装置
CN104735169A (zh) * 2015-04-17 2015-06-24 天天艾米(北京)网络科技有限公司 一种居住社区群发现方法
CN104765873A (zh) * 2015-04-24 2015-07-08 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置

Also Published As

Publication number Publication date
CN106897282A (zh) 2017-06-27

Similar Documents

Publication Publication Date Title
CN106897282B (zh) 一种用户群的分类方法和设备
CN105677831B (zh) 一种确定推荐商户的方法及装置
CN106651542B (zh) 一种物品推荐的方法及装置
CN108537567B (zh) 一种目标用户群体的确定方法和装置
WO2019037202A1 (zh) 目标客户的识别方法、装置、电子设备及介质
CN112153426B (zh) 一种内容账号管理方法、装置、计算机设备及存储介质
CN111275491A (zh) 一种数据处理方法及装置
CN111967971B (zh) 银行客户数据处理方法及装置
CN108074016B (zh) 基于位置社交网络的用户关系强度预测方法、装置及设备
WO2017143773A1 (zh) 一种众包学习方法及装置
CN111126347B (zh) 人眼状态识别方法、装置、终端及可读存储介质
CN114359563B (zh) 模型训练方法、装置、计算机设备和存储介质
CN107230090B (zh) 一种净推荐值nps分类方法及装置
CN110458600A (zh) 画像模型训练方法、装置、计算机设备及存储介质
CN111144215A (zh) 图像处理方法、装置、电子设备及存储介质
CN110472664A (zh) 一种基于深度学习的证件图片识别方法、装置及设备
CN110008880B (zh) 一种模型压缩方法及装置
CN110428278A (zh) 确定资源份额的方法及装置
CN111984842B (zh) 银行客户数据处理方法及装置
CN106301880B (zh) 一种确定网络关系稳定度、互联网业务推荐方法和设备
CN114637917A (zh) 基于人工智能的资讯头条推荐方法及装置
CN112801053A (zh) 视频数据处理方法、装置
CN113704623A (zh) 一种数据推荐方法、装置、设备及存储介质
CN113457167A (zh) 用户分类网络的训练方法、用户分类方法及装置
CN111325351A (zh) 一种确定联邦学习参与方的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant