CN111815436A - 一种信贷对象的分类方法、装置、终端及存储介质 - Google Patents
一种信贷对象的分类方法、装置、终端及存储介质 Download PDFInfo
- Publication number
- CN111815436A CN111815436A CN202010675614.5A CN202010675614A CN111815436A CN 111815436 A CN111815436 A CN 111815436A CN 202010675614 A CN202010675614 A CN 202010675614A CN 111815436 A CN111815436 A CN 111815436A
- Authority
- CN
- China
- Prior art keywords
- data
- information data
- credit
- credit object
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013145 classification model Methods 0.000 claims abstract description 29
- 238000009434 installation Methods 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 235000021185 dessert Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000013410 fast food Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种信贷对象的分类方法、装置、服务器及终端存储介质。该方法包括:获取信贷对象终端的信息数据,确定所述信息数据的数据特征;将所述信息数据的数据特征输入预先建立的二分类模型,以使所述二分类模型输出对信贷对象进行分类。能够筛选出符合规定的信贷对象,便于金融机构判断用户群体,既快捷又节省人力。
Description
技术领域
本发明实施例涉及大数据分类技术,尤其涉及一种信贷对象的分类方法、装置、终端及存储介质。
背景技术
近年来,金融监管明确指出,对于不具有某些特殊群体贷款资质的金融机构,不准许向该群体发放贷款或信用卡等金融服务。
目前,对于金融机构来说,在获取客户阶段,如果从庞大基数的用户群体中,区分出不符合规定的贷款资质的某一群体,靠人为具体查询每个用户的信息非常不现实,这给金融机构提出了很大的挑战,既不方便判断用户群体又浪费时间和人力。
发明内容
有鉴于此,本发明实施例提供了一种信贷对象的分类方法、装置、终端及存储介质,能够筛选出符合规定的信贷对象,便于金融机构判断用户群体,既快捷又节省人力。
第一方面,本发明实施例提供了一种信贷对象的分类方法,包括:
获取信贷对象终端的信息数据,确定所述信息数据的数据特征;
将所述信息数据的数据特征输入预先建立的二分类模型,以使所述二分类模型输出对信贷对象进行分类的结果。
可选的,所述信息数据,包括下述至少一项:地理位置信息数据、安装应用信息数据、网络状态信息数据、通讯信息数据。
可选的,当所述信息数据为地理位置信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
采集信贷对象终端的经纬度信息,从所述经纬度信息中确定活跃经纬度信息;
基于预存储的经纬度-兴趣点对应关系,确定与所述活跃经纬度信息对应的兴趣点信息,并根据所述兴趣点信息设置地理位置特征值。
可选的,当所述信息数据为安装应用信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,还包括:
确定所述信贷对象对于所述终端的安装应用的统计特征以及所述安装应用的类目数据;
基于所述统计特征和所述类目数据,确定所述安装应用的特征变量。
可选的,当所述信息数据为网络状态信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,还包括:
获取所述信贷对象终端的网络活跃时间;或者
获取所述信贷对象终端的网络连接人数;或者
获取所述信贷对象终端的网络名称。
可选的,当所述信息数据为通讯信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,还包括:
获取所述信贷对象终端的接收短信数据,确定为预设标签对应的所述接收短信数据的数据特征;或者,
获取所述信贷对象终端的通讯录数据,确定为联系人信息对应的所述通讯录数据的数据特征。
进一步的,所述二分类模型应用于对信贷对象是否为学生进行分类。
第二方面,本发明实施例还提供了一种信贷对象的分类装置,包括:
数据特征确定模块,用于获取信贷对象终端的信息数据,确定所述信息数据的数据特征;
分类模块,用于将所述信息数据的数据特征输入预先建立的二分类模型,以使所述二分类模型输出对信贷对象进行分类的结果。
第三方面,本发明实施例还提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请任意实施例提供的信贷对象的分类方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任意实施例提供的信贷对象的分类方法。
本发明实施例提供的一种信贷对象的分类方法、装置、终端及存储介质,通过获取信贷对象终端的信息数据,确定信息数据的数据特征;然后将获取的信息数据的数据特征输入预先建立的二分类模型,使用二分类模型对信贷对象进行分类并输出分类结果,能够筛选出符合规定的信贷对象,便于金融机构判断用户群体,既快捷又节省人力。
附图说明
图1是本发明实施例一提供的一种信贷对象的分类方法的流程示意图;
图2是本发明实施例二提供的一种信贷对象的分类装置的结构框图;
图3是本发明实施例三提供的一种终端的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
实施例一
图1是本发明实施例一提供的一种信贷对象的分类方法的流程示意图,本实施例可适用于金融机构筛选贷款客户群体的情况。该方法可以由本发明实施例提供的信贷对象的分类装置来执行,且分类装置可配置于本发明实施例提供的终端中,例如可配置于计算机设备中,或者集成于可进行大数据运算的设备中,在此不做具体限制。
如图1所示,信贷对象的分类方法,具体包括如下步骤:
S110、获取信贷对象终端的信息数据,确定信息数据的数据特征。
信贷对象终端为可以安装金融机构应用(Application,APP)的所有设备,示例性的可以是手机,也可以是平板电脑等,本发明实施例对信贷对象终端不作限制。信息数据可以是安装该金融机构的APP的用户在终端的一些信息数据,该金融机构的APP通过抓取用户终端的不同信息数据,确定这些信息数据包含的具体数据特征。
用户在首次使用金融机构的终端应用时,首先需要注册,注册时需要填写一些用户基础信息,示例性的,用户基础信息可以是用户年龄、或者婚姻状况、或者联系方式、或者身份证签发至今年限等,示例性的,身份证签发年限可以是要求用户自己输入的,也可以是用户上传身份证照片,该金融机构的终端应用通过身份证照片自动获取的,本发明实施例对获取用户身份证签发至今年限的方法不作具体限制。
可选的,信息数据,包括下述至少一项:地理位置信息数据、安装应用信息数据、网络状态信息数据、通讯信息数据。
地理位置信息数据可以是经过全球定位系统(Global Positioning System,GPS)在用户终端定位的经常活跃的位置信息,也可以是网购商品或者定外卖常用的收货地址,也可以是用户的居住地址,还可以是用导航应用生成的“兴趣点”(Point of Interest,POI)数据。示例性的,导航应用可以是高德地图,从高德地图上获取用户所在城市的POI数据,在用户终端下载高德地图APP,并注册登录,然后添加关键字(Key)名称为POI,选择用户所在城市,示例性的选择用户所在城市为广东省汕头市,再选择需要获取的具体分类关键字,示例性的分类关键字如学校,然后就可以自动生成广东省汕头市所有学校的POI数据,包括学校名称、地址、所在地址的经度和纬度信息等。
安装应用信息数据可以是用户安装的某一类App的个数,示例性的如教育类App个数,办公类App个数,也可以是金融类App个数,还可以是社交类App个数等。还可以是用以表征该用户群体安装某一个App的兴趣倾向,示例性的,该兴趣倾向可以是该App在该用户群体的安装的普遍性等。
网络状态信息数据是指用户终端连接网络情况的信息数据,示例性的网络状态信息数据可以是用户以什么方式联网的,还可以是该用户所连网络的其他用户连接情况等。
通讯信息数据包括用户终端的短信数据或通讯录信息数据。
数据特征是指上述不同的信息数据包含的具体特征,可以从上述信息数据直接得到对应的数据特征,也可以通过对信息数据进行分析处理或/和统计等方式得到数据特征,本发明实施例对数据特征获取方式不做限制。
不同的信息数据获取方式,丰富了信息数据的数据特征。
可选的,当所述信息数据为地理位置信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
采集信贷对象终端的经纬度信息,从所述经纬度信息中确定活跃经纬度信息;
基于预存储的经纬度-兴趣点对应关系,确定与所述活跃经纬度信息对应的兴趣点信息,并根据所述兴趣点信息设置地理位置特征值。
信贷对象终端的经纬度信息为信贷对象安装的该金融机构的App从信贷对象终端获取一些定位数据,然后利用某一导航App将获取的这些位置的经度和纬度信息提取出来,并将获取的定位位置进行排序,选择出常用的前几个活跃地点,并获取活跃地点的经度和纬度信息。预存储的经纬度-兴趣点也就是服务器预先存储的某一城市的一些地址的经度和纬度信息和这些地址对应的POI数据。将信贷对象终端的活跃地点的经纬度与预存储的经纬度-兴趣点进行匹配,通过经纬度信息来确定活跃地点的地理位置特征值,也就是该活跃地点是什么地方。
金融机构预先与导航App已达成合作,示例性的,导航App为高德地图。用户安装该金融机构的应用App之后,注册并登录,预存储的经纬度-兴趣点对应关系可以是该金融机构的App通过高德地图获取用户所在城市的POI数据,该POI数据可以是对不同行业的不同级别的分类,示例性的,一级行业分类为美食,二级行业可以分为中餐厅、外国餐厅小吃快餐店、甜品店、咖啡厅、酒吧等;也可以是根据某一地址的经纬度确定的该地址所在住户的类型,示例性的,如通过经度39.93418和纬度116.106589确定了名为某某集团有限公司,那么该地址的POI数据就为公司或/企业。信贷对象的经纬度信息包括信贷对象在终端行为时终端的经纬度信息,示例性的,可以是用户在终端注册-登录-浏览某一App的常用地址,通过对用户注册-登录-浏览不同App时的位置信息进行统计,得出最常用地址的前三名,既TOP1-TOP3活跃地点,通过导航应用获取TOP1-TOP3活跃地点分别对应的经纬度信息,分别将活跃地点对应的经纬度信息与上述采集的POI数据进行匹配,对应得到用户活跃地POI信息,通过该POI数据信息判断用户TOP1-TOP3活跃地是否符合某一用户常在位置的特征,示例性的,可以是TOP1-TOP3活跃地是否为学校,将是学校的特征值设置为1,而非学校的特征值设置为0。
通过确定用户终端的经纬度与对应POI,可以获取用户地理位置类数据的数据特征。
可选的,当所述信息数据为安装应用信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
确定所述信贷对象对于所述终端的安装应用的统计特征以及所述安装应用的类目数据;
基于所述统计特征和所述类目数据,确定所述安装应用的特征变量。
所述统计特征包括服务器通过获取多个注册用户的安装App列表,计算得出不同App在某一用户群体中的群体分数,来表征该App专属于某一用户群体/另一用户群体的排序或概率大小,某一App某一用户群体分数=该用户群体中安装该App比例/另一用户群体中安装该App比例。示例性的,该用户群体为学生,另一用户群体为白领,则App学生分数=学生用户中安装该app比例/白领用户中安装该App比例,示例性的,APP名称为网易云课堂,假设学生用户中安装该App比例为68.54%,白领用户中安装该App比例为14.11%,网易云课堂的学生分数为68.54%/4.11%=16.6902%。示例性的,可以通过用户终端的App列表,计算出用户安装的所有App的学生分数,确定最大(max)App学生分数或者所有App的平均(mean)学生分数。
所述统计特征还包括通过利用终端安装的不同App计算得出某一App对于某一群体用户的TF-IDF值,TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,TF意思是用词频(Term Frequency),表征某一App对于某一群体用户的代表性,TF=安装某App的某一用户群体数/所有该用户群体用户数;IDF意思是逆文本频率指数(Inverse Document Frequency),表征某一群体用户对于某一App安装的普遍性,IDF=Log(所有用户数/安装某App的用户数),TF-IDF=TF*IDF。示例性的,假设某一群体用户为学生,某App为网易云课堂,假设所有学生用户数为60000,安装网易云课堂的学生用户数为41123,则TF=41123/60000=68.54%,所有用户数为260000,安装网易云课堂的用户数为49336,则IDF=Log(260000/49336)=72.18%,TF-IDF=TF*IDF=68.54%*72018%=0.4947,表示网易云课堂的学生TF-IDF为0.4947。示例性的,可以通过用户终端的App列表,计算出用户安装的所有App的学生TF-IDF值,确定最大(max)学生TF-IDF值或者平均(mean)学生TF-IDF值。
所述安装应用的类目数据是指服务器通过用户安装该金融机构的App获取用户终端应用市场的App类别数据,将获取到的用户终端的App列表中的App的package_name与服务器存储的所有App的package_name进行匹配,其中,package_name是App的唯一ID,匹配成功后获取到package_name对应的app_name。示例性的,服务器从用户终端获取到了App的package_name为“com.tencent.wework”,通过将“com.tencent.wework”与服务器中所有App的“com.tencent.wework”进行匹配,确定了该App的app_name为“微信”和/或“企业微信”和/或“微信企业版”,则判断该App为社交类App,其中,app_name会因为下载渠道、版本更新、数据采集等因素影响导致结果不唯一。
通过将从用户终端获取的App列表进行上述判断,得到了获取的用户安装App列表App的app_name,通过App的app_name判断该App属于哪一类App,既安装的App的特征变量,该特征变量可以是App类别的变量和变量名。示例性的,如果用户为学生,那么变量可以是client_uid、app_tf_idf、app_stu_score、total_app_cnt、is_edu_cnt或者is_sport_cnt等,对应的变量名分别可以是学生姓名、学生分数、学生TF-IDF值、学生的终端安装的App总个数、教育类App的个数或者体育类App的个数等。
通过确定信贷对象终端应用的统计特征可以得到用户安装应用的信息数据。
可选的,当所述信息数据为网络状态信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
获取所述信贷对象终端的网络活跃时间;或者
获取所述信贷对象终端的网络连接人数;或者
获取所述信贷对象终端的网络名称。
服务器获取用户的终端设备登录时的网络状态,用户的网络状态可以是以什么方式登录设备的,示例性的,网络状态可以是Wifi,用户设备登录的时间可以按天数或/时间段进行统计,示例性的,时间段可以是周一到周五,也可以是周六到周日,然后根据用户设备登录的时间筛选出用户Wifi状态活跃的时间,示例性的,Wifi活跃时间是否为工作日或周末,也可以是白天或晚上,本发明实施例对用户网络活跃时间不做具体限制。通过不同的Wifi活跃时间可以表征不同用户群里在使用Wifi时间上的差异,示例性的,如果用户为学生和/或白领,那么学生的Wifi活跃时间相对来说工作日和/或白天都会存在,而白领的Wifi活跃时间相对来说主要集中在周末和/或晚上。还可以统计用户网络连接的使用人数,来识别是否多人使用或/和小范围使用等场景。还可以获取网络的名称,通过网络名称的关键字,标记用户群体。示例性的,Wifi名称中含有“公司”、“工厂”、“企业”等关键词的标记为白领Wifi;Wifi名称中含有“学校”、“大学”、“edu”等关键词的标记为学生Wifi。
可选的,当所述信息数据为通讯信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
获取所述信贷对象终端的接收短信数据,确定为预设标签对应的所述接收短信数据的数据特征;或者,
获取所述信贷对象终端的通讯录数据,确定为联系人信息对应的所述通讯录数据的数据特征。
用户终端的信息数据包括用户的接收短信数据和通讯录数据。接收短信数据的预设标签为用户接收到的短信所属的类别,也可以是某一特定功能的短信,示例性的,预设标签可以是银行的短信,也可以是网贷机构的短信等,还可以是用于通知用户工资到账的工资短信,本发明实施例对用户接收到的短信数据的预设标签不作具体限制。获取用户接收到的短信中的信息价值,来表征不同的用户群里的差异性,统计符合不同预设标签的短息的数量,得到某一预设标签对应的短信数据的数据特征,该数据特征可以是短信数据的统计特征,短信数据的数据特征可以包括个人短信量、运营商短信量、银行短信量、网贷短信量、金融短信量以及快递短信量等,本发明实施例对短信数据的数据特征不作限制。示例性的,用户群体为学生和/或白领,则学生群体没有工资短信而白领群体有,同样地,信用卡账单或公积金等短信类目是白领群体特有的,学生群里的金融或理财相关的短信量也相对较少。
用户终端的通讯录信息数据可以是通讯录里的联系人信息,联系人信息可以是联系人姓名,通讯录数据的数据特征可以是联系人姓名包含的能够识别某一群体的特定文字,示例性的,用户群体为学生和/或白领,那么学生的联系人列表里姓名为某某老师的可能存在或较多,而白领的联系人列表中关于包含“老师”的联系人相对没有或较少。联系人信息还可以是联系人的邮箱,示例性的,邮箱中包含“edu”的联系人可能是老师或学校工作人员。
通过确定信贷对象终端的短信特征和通讯录特征,得到用户通讯信息数据。
S120、将信息数据的数据特征输入预先建立的二分类模型,以使二分类模型输出对信贷对象进行分类的结果。
首先通过采用客服电话、与其他App合作、与拥有稳定数据源的公司进行战略合作等方式获取少量某一用户群体的标注数据,本发明对于标注数据的获取方式不作限制。然后将按步骤S110采集的某一用户群体的信贷对象的信息数据提取数据特征,然后建立二分类模型进行分类识别。
二分类模型是指通过对输入数据进行分析运算,输出“是”或“否”两种结果的分类模型,示例性的,二分类模型可以是逻辑回归模型,也可以是单层感知机,还可以是支持向量机(SVM),本发明实施例对二分类模型不作具体限制。二分类模型的分类过程,示例性的,可以是经过参数设置、二分类模型训练以及二分类模型预测得出分类结果,不同的二分类模型分类过程可能有所不同,本发明实施例对二分类模型分类过程不作限制。将步骤S110得到的根据信贷对象的信息数据确定的数据特征输入二分类模型,进过分析运算根据输出结果判断信贷对象是否是某一类用户群体,示例性的,如果是某一类用户群体,则二分类模型输出可以是大于“0”的整数,如果不符合某一类用户群体,则输出结果可以是“0”,本发明实施例对二分类模型输出结果不作限制。
可选的,所述二分类模型应用于对信贷对象是否为学生进行分类。
二分类模型可以应用于判断信贷对象是否为学生,将经过步骤S110确定的学生的信息数据的数据特征输入二分类模型,如果经过判断,二分类模型输出为大于“0”的整数,该可以确定该信贷对象是学生,如果二分类模型输出为“0”,该可以确定该信贷对象不是学生。
本发明实施例提供的一种信贷对象的分类方法,通过获取信贷对象终端的信息数据,确定信息数据的数据特征;然后将获取的信息数据的数据特征输入预先建立的二分类模型,使用二分类模型对信贷对象进行分类并输出分类结果,能够筛选出符合规定的信贷对象,便于金融机构判断用户群体,既快捷又节省人力。
实施例二
图2是本发明实施例二提供的一种信贷对象的分类装置的结构框图,本本实施例可适用于金融机构筛选贷款客户群体的情况。应用该信贷对象的分类装置可以实现本发明任一实施例所提供的信贷对象的分类方法。如图2所示,信贷对象的分类装置,包括:
数据特征确定模块210,用于获取信贷对象终端的信息数据,确定信息数据的数据特征;
分类模块220,用于将信息数据的数据特征输入预先建立的二分类模型,以使二分类模型输出对信贷对象进行分类的结果。
可选的,数据特征确定模块的信息数据,包括下述至少一项:地理位置信息数据、安装应用信息数据、网络状态信息数据、通讯信息数据。
可选的,数据特征确定模块中当所述信息数据为地理位置信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
采集信贷对象终端的经纬度信息,从所述经纬度信息中确定活跃经纬度信息;
基于预存储的经纬度-兴趣点对应关系,确定与所述活跃经纬度信息对应的兴趣点信息,并根据所述兴趣点信息设置地理位置特征值。
可选的,数据特征确定模块中当所述信息数据为安装应用信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
确定所述信贷对象对于所述终端的安装应用的统计特征以及所述安装应用的类目数据;
基于所述统计特征和所述类目数据,确定所述安装应用的特征变量。
可选的,数据特征确定模块中当所述信息数据为网络状态信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
获取所述信贷对象终端的网络活跃时间;或者,
获取所述信贷对象终端的网络连接人数;或者,
获取所述信贷对象终端的网络名称。
可选的,数据特征确定模块中当所述信息数据为通讯信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
获取所述信贷对象终端的接收短信数据,确定为预设标签对应的所述接收短信数据的数据特征;或者,
获取所述信贷对象终端的通讯录数据,确定为联系人信息对应的所述通讯录数据的数据特征。
可选的,分类模块可以应用于所述二分类模型应用于对信贷对象是否为学生进行分类。
本发明实施例所提供的信贷对象的分类装置可执行本发明任一实施例所提供的信贷对象的分类方法,具备执行方法相应的功能模块和有益效果。未详尽描述的技术细节,可参见本发明任一实施例所提供的信贷对象的分类方法。
实施例三
图3是本发明实施例三提供的一种终端的结构示意图。图3示出了适于用来实现本发明任一实施方式的示例性终端12的框图。图3显示的终端12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备12典型的是安装应用的手终端。
如图3所示,终端12以通用计算设备的形式表现。终端12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储器28,连接不同组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
终端12典型地包括多种计算机可读介质。这些介质可以是任何能够被终端12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机装置可读介质,例如随机存取存储器(Random Access Memory,RAM)30和/或高速缓存存储器32。终端12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品40,该程序产品40具有一组程序模块42,这些程序模块被配置以执行本发明各实施例的功能。程序产品40,可以存储在例如存储器28中,这样的程序模块42包括但不限于一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
终端12也可以与一个或多个外部设备14(例如键盘、鼠标、摄像头等和显示器)通信,还可与一个或者多个使得用户能与该终端12交互的设备通信,和/或与使得该终端12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,终端12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与终端12的其它模块通信。应当明白,尽管图中未示出,可以结合终端12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(RedundantArrays of Independent Disks,RAID)装置、磁带驱动器以及数据备份存储装置等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的信贷对象的分类方法,该方法包括:
获取信贷对象终端的信息数据,确定所述信息数据的数据特征;
将所述信息数据的数据特征输入预先建立的二分类模型,以使所述二分类模型输出对信贷对象进行分类
当然,本领域技术人员可以理解,处理器还可以实现本发明任一实施例所提供的信贷对象的分类方法。
实施例四
本发明实施例四还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请任意实施例提供的信贷对象的分类方法,该方法包括:
获取信贷对象终端的信息数据,确定所述信息数据的数据特征;
将所述信息数据的数据特征输入预先建立的二分类模型,以使所述二分类模型输出对信贷对象进行分类
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上的方法指令,还可以执行本发明任一实施例所提供的信贷对象的分类方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的装置、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括,但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明指令的计算机程序代码,程序设计语言包括面向对象的程序设计语言诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种信贷对象的分类方法,其特征在于,应用于服务器,包括:
获取信贷对象终端的信息数据,确定所述信息数据的数据特征;
将所述信息数据的数据特征输入预先建立的二分类模型,以使所述二分类模型输出对信贷对象进行分类的结果。
2.根据权利要求1所述的方法,其特征在于,所述信息数据,包括下述至少一项:地理位置信息数据、安装应用信息数据、网络状态信息数据、通讯信息数据。
3.根据权利要求2所述的方法,其特征在于,当所述信息数据为地理位置信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
采集信贷对象终端的经纬度信息,从所述经纬度信息中确定活跃经纬度信息;
基于预存储的经纬度-兴趣点对应关系,确定与所述活跃经纬度信息对应的兴趣点信息,并根据所述兴趣点信息设置地理位置特征值。
4.根据权利要求2所述的方法,其特征在于,当所述信息数据为安装应用信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
确定所述信贷对象对于所述终端的安装应用的统计特征以及所述安装应用的类目数据;
基于所述统计特征和所述类目数据,确定所述安装应用的特征变量。
5.根据权利要求2所述的方法,其特征在于,当所述信息数据为网络状态信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
获取所述信贷对象终端的网络活跃时间;或者,
获取所述信贷对象终端的网络连接人数;或者,
获取所述信贷对象终端的网络名称。
6.根据权利要求2所述的方法,其特征在于,当所述信息数据为通讯信息数据时,所述获取信贷对象终端的信息数据,确定所述信息数据的数据特征,包括:
获取所述信贷对象终端的接收短信数据,确定为预设标签对应的所述接收短信数据的数据特征;或者,
获取所述信贷对象终端的通讯录数据,确定为联系人信息对应的所述通讯录数据的数据特征。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述二分类模型应用于对信贷对象是否为学生进行分类。
8.一种信贷对象的分类装置,其特征在于,包括:
数据特征确定模块,用于获取信贷对象终端的信息数据,确定所述信息数据的数据特征;
分类模块,用于将所述信息数据的数据特征输入预先建立的二分类模型,以使所述二分类模型输出对信贷对象进行分类的结果。
9.一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的信贷对象的分类方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的信贷对象的分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010675614.5A CN111815436A (zh) | 2020-07-14 | 2020-07-14 | 一种信贷对象的分类方法、装置、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010675614.5A CN111815436A (zh) | 2020-07-14 | 2020-07-14 | 一种信贷对象的分类方法、装置、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111815436A true CN111815436A (zh) | 2020-10-23 |
Family
ID=72864716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010675614.5A Pending CN111815436A (zh) | 2020-07-14 | 2020-07-14 | 一种信贷对象的分类方法、装置、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111815436A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816520A (zh) * | 2019-01-28 | 2019-05-28 | 北京三快在线科技有限公司 | 职业属性预测方法、装置、设备及存储介质 |
CN110648222A (zh) * | 2019-09-25 | 2020-01-03 | 杭州谱数梦信息技术有限公司 | 一种基于运营商数据识别大学生网贷风险的分析方法与系统 |
-
2020
- 2020-07-14 CN CN202010675614.5A patent/CN111815436A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816520A (zh) * | 2019-01-28 | 2019-05-28 | 北京三快在线科技有限公司 | 职业属性预测方法、装置、设备及存储介质 |
CN110648222A (zh) * | 2019-09-25 | 2020-01-03 | 杭州谱数梦信息技术有限公司 | 一种基于运营商数据识别大学生网贷风险的分析方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8856229B2 (en) | System and method for social networking | |
US20190005439A1 (en) | Identification of inaccurate addresses for package deliveries | |
US20180089283A1 (en) | Method and system for providing domain-specific incremental search results with a customer self-service system for a financial management system | |
US10931619B2 (en) | Alert modification based on social media activity | |
CN110135901A (zh) | 一种企业用户画像构建方法、系统、介质和电子设备 | |
CN108268573B (zh) | 用于推送信息的方法和装置 | |
US9218568B2 (en) | Disambiguating data using contextual and historical information | |
US10902445B2 (en) | Location evaluation | |
CN108182253B (zh) | 用于生成信息的方法和装置 | |
CN106575395A (zh) | 包含来自各种数据源的数据的实体解析 | |
CN110119415B (zh) | 基于渠道投放的数据分析方法、系统、介质和电子设备 | |
CN110798567A (zh) | 短信分类显示方法及装置、存储介质、电子设备 | |
CN113610230A (zh) | 训练方法、预测方法、装置、计算机系统及存储介质 | |
Lansley et al. | Challenges to representing the population from new forms of consumer data | |
CN106384255B (zh) | 一种创建信息码推广信息的方法和装置 | |
CN113868538A (zh) | 信息处理方法、装置、设备及介质 | |
CN110851582A (zh) | 文本处理方法及系统、计算机系统和计算机可读存储介质 | |
CN111815436A (zh) | 一种信贷对象的分类方法、装置、终端及存储介质 | |
Giczi et al. | Official Statistics and Big Data | |
US11138615B1 (en) | Location-based place attribute prediction | |
US10248983B1 (en) | Customized item descriptions based on skill level | |
CN111126120B (zh) | 城市区域分类方法、装置、设备和介质 | |
CN113742614A (zh) | 生成、显示推荐信息的方法、电子设备及存储介质 | |
CN110648222A (zh) | 一种基于运营商数据识别大学生网贷风险的分析方法与系统 | |
CN113112308B (zh) | 设备标注方法、系统和定向信息推送的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |