CN112016797B - 基于knn的资源配额调整方法、装置和电子设备 - Google Patents
基于knn的资源配额调整方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112016797B CN112016797B CN202010683200.7A CN202010683200A CN112016797B CN 112016797 B CN112016797 B CN 112016797B CN 202010683200 A CN202010683200 A CN 202010683200A CN 112016797 B CN112016797 B CN 112016797B
- Authority
- CN
- China
- Prior art keywords
- resource quota
- interval
- user
- knn
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013468 resource allocation Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 101150077112 amt1 gene Proteins 0.000 description 1
- 101150029609 amt2 gene Proteins 0.000 description 1
- 101150082675 amt3 gene Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Technology Law (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于KNN的资源配额调整方法、装置和电子设备,其中方法包括包括:获取历史用户的资源配额及对应的用户特征作为样本;将所述资源配额划分为不同的资源配额区间,并对每个资源配额区间设置对应的标签;根据所述样本,利用KNN算法计算待调整用户的资源配额。本发明通过对多个历史客户的资源配额作为样本划分不同资源配额区间,并对每个区间做标记,当有客户需要调整资源配额时,利用KNN算法将当前客户的用户特征与样本中的用户特征进行相似度比较,最后得到当前客户的最新资源配额从而进行调整,本发明可使用机器学习智能化对批量客户同时进行资源配额调整,处理速度大大提升,减少人力资源消耗,提高了工作效率。
Description
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种基于KNN的资源配额调整方法、装置、电子设备及计算机可读介质。
背景技术
在基于互联网的应用技术中,常常需要在不同的参与方之前进行资源的交换。这里所称的资源是指任何可被利用的物质、信息、金钱、时间等。信息资源包括计算资源和各种类型的数据资源。数据资源包括各个领域中的各种专用数据。在分配资源的过程中,往往需要为不同的用户分配不同的资源配额,所谓资源配额是指该用户在特定时间内可以获得的最高资源额。
与金钱相关的资源通常也称为金融资源,随着互联网及电子设备的发展,很多金融业务可以通过安装支持该金融业务的APP应用来实现,用户通过APP来申请金融资源。
在互联网金融场景中,通常客户在申请资源分配成功后,会有一个资源配额,但是该资源配额并不是一成不变的。基于风险和收益的双重考量,会根据客户的资质、资源归还行为、履约历史等信息,对客户进行资源配额的调整,在满足客户资金需求,提高客户体验的前提下,实现效益最大化。然而,目前的资源配额调整主要基于规则筛选,调整幅度也是基于历史经验给出,并不能及时、精准的给到客户一个满意的资源配额,切需要针对每个客户分别进行资源配额调整,费时费力。
发明内容
为了解决如何智能化准确、高效地批量调整资源配额的问题,本发明提供了一种基于KNN的资源配额调整方法、装置和电子设备。
本发明的一方面提供一种资源配额调整方法,包括:
获取历史用户的资源配额及对应的用户特征作为样本;
将所述资源配额划分为不同的资源配额区间,并对每个资源配额区间设置对应的标签;
根据所述样本,利用KNN算法计算待调整用户的资源配额。
根据本发明的优选实施方式,将所述资源配额划分为不同的资源配额区间,并对每个资源配额区间设置对应的标签,进一步包括:
根据历史用户的数量及资源配额的阈值将所述历史用户的资源配额划分为多个资源配额区间;
计算每个资源配额区间的平均资源配额;
对每个资源配额区间设置对应的标签。
根据本发明的优选实施方式,所述根据历史用户的数量及资源配额的阈值将所述历史用户的资源配额划分为多个资源配额区间,进一步包括:
利用等频分箱原则将所述历史用户的资源配额划分为不同的资源配额区间,每个资源配额区间对应的历史用户数量相近。
根据本发明的优选实施方式,所述根据所述样本及KNN算法计算待调整用户的资源配额,进一步包括:
将所述待调整用户的用户特征与所述样本中的用户特征利用KNN算法进行相似度比较;
从所述资源配额区间中提取用户特征相似度较高的预设数量的相似特征;
根据每个资源配额区间的平均资源配额及所述相似数据中每个资源配额区间所占的数量输出待调整用户的最新资源配额。
根据本发明的优选实施方式,所述从所述资源配额区间中选出用户特征相似度较高的预设数量的相似特征,进一步包括:
根据得到的相似度数值对所述资源配额区间内的样本进行排序;
获取排序后相似度数值较高的预设数量的相似特征,并对每个相似特征设置对应资源配额区间的标签。
根据本发明的优选实施方式,所述根据每个资源配额区间的平均资源配额及所述相似数据中每个资源配额区间所占的数量确定待调整用户的最新资源配额,进一步包括:
根据所述预设数量的相似特征中每个资源配额区间的标签数量,对每个资源配额区间的平均资源配额进行加权平均,得到待调整用户的最新资源配额。
根据本发明的优选实施方式,所述将所述待调整用户的用户特征输入所述KNN资源配额模型,与所述历史用户的用户特征进行相似度比较,进一步包括:
利用欧式距离或曼哈顿距离进行相似度比较。
根据本发明的优选实施方式,所述方法还包括:
将调整后的用户的资源配额划分到对应的资源配额区间内;
设置所述资源配额区间的更新周期对所述资源配额区间进行更新。
本发明的第二方面提供一种资源配额调整装置,包括:
样本获取模块,用于获取历史用户的资源配额及对应的用户特征作为样本;
资源配额拆分模块,用于将所述资源配额划分为不同的资源配额区间,并对每个资源配额区间设置对应的标签;
资源配额调整模块,用于根据所述样本,利用KNN算法计算待调整用户的资源配额。
根据本发明的优选实施方式,所述资源配额拆分模块进一步包括:
区间划分单元,用于根据历史用户的数量及资源配额的阈值将所述历史用户的资源配额划分为多个资源配额区间;
平均配额计算单元,用于计算每个资源配额区间的平均资源配额;
标签设置单元,用于对每个资源配额区间设置对应的标签。
根据本发明的优选实施方式,所述区间划分单元还用于:
利用等频分箱原则将所述历史用户的资源配额划分为不同的资源配额区间,每个资源配额区间对应的历史用户数量相近。
根据本发明的优选实施方式,所述资源配额调整模块进一步包括:
相似度比较单元,用于将所述待调整用户的用户特征与所述样本中的用户特征利用KNN算法进行相似度比较;
相似特征提取单元,用于从所述资源配额区间中提取用户特征相似度较高的预设数量的相似特征;
资源配额调整单元,用于根据每个资源配额区间的平均资源配额及所述相似数据中每个资源配额区间所占的数量输出待调整用户的最新资源配额。
根据本发明的优选实施方式,所述相似特征提取单元进一步包括:
相似度排序单元,用于根据得到的相似度数值对所述资源配额区间内的样本进行排序;
标签绑定单元,用于获取排序后相似度数值较高的预设数量的相似特征,并对每个相似特征设置对应资源配额区间的标签。
根据本发明的优选实施方式,所述资源配额调整单元还用于:
根据所述预设数量的相似特征中每个资源配额区间的标签数量,对每个资源配额区间的平均资源配额进行加权平均,得到待调整用户的最新资源配额。
根据本发明的优选实施方式,所述相似度比较单元还用于:
利用欧式距离或曼哈顿距离进行相似度比较。
根据本发明的优选实施方式,所述装置还包括:
资源配额分类模块,用于将调整后的用户的资源配额划分到对应的资源配额区间内;
区间更新模块,用于设置所述资源配额区间的更新周期对所述资源配额区间进行更新。
本发明的第三方面提供一种电子设备,其中,该电子设备包括:处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行任一项所述的方法。
本发明的第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现任一项所述的方法。
本发明的技术方案,具有如下有益效果:
本发明通过对多个历史客户的资源配额作为样本划分不同资源配额区间,并对每个区间做标记,当有客户需要调整资源配额时,利用KNN算法将当前客户的用户特征与样本中的用户特征进行相似度比较,最后得到当前客户的最新资源配额从而进行调整,本发明可使用机器学习智能化对批量客户同时进行资源配额调整,处理速度大大提升,减少人力资源消耗,提高了工作效率。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明的一种资源配额调整方法流程示意图;
图2是本发明的一种资源配额调整装置架构示意图;
图3是本发明的一种信息推送电子设备结构框架示意图;
图4是本发明的计算机可读存储介质示意图。
具体实施方式
现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。
在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。
术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
本发明中,资源是指任何可被利用的物质、信息、时间,信息资源包括计算资源和各种类型的数据资源。数据资源包括各个领域中的各种专用数据。本发明的创新之处在于如何使用服务器和客户端之间的信息交互技术来使资源分配的过程更加自动化、高效和减小人力成本。由此,从本质上来说,本发明可以应用于各类资源的分配,包括实体的货物、水、电,以及有意义的资料等。但是,为了方便起见,本发明中以金融数据资源为例进行说明资源分配的实施,但本领域技术人员应当理解,本发明亦可以用于其他资源的分配。
图1是本发明的一种资源配额调整方法流程示意图,如图1所示,该方法包括:
S101、获取历史用户的资源配额及对应的用户特征作为样本。
具体来说,金融机构可以从历史用户中筛选出一批信用评分较高的用户,获取这些用户的资源配额,也就是授信额度,并获取每个历史用户的用户特征,将这些用户的资源配额及用户特征作为样本数据。由于影响授信的用户特征较多,包括用户的年龄、学历、地区、职业及收入状况等,且随着时间的变化每个特征的权重会随之变化,所以在选择样本用户时尽量选用距今时间较短的,例如,可以从近半年内的授信用户中筛选出信用评分排名前1万个用户用作样本用户。
另外,在选择样本用户时,尽量选择资源配额不同的历史用户,这样可以使样本更充实和完整。
S102、将所述资源配额划分为不同的资源配额区间,并对每个资源配额区间设置对应的标签。
具体来说,可以将上述实施例中选取的1万个样本用户进行分群,根据他们当前的最新资源配额分成多个区间,例如表1所示:
资源配额区间 | 平均资源配额 | 标签 |
[5000,10000) | amt1 | group1 |
[10000,20000) | amt2 | group2 |
[20000,50000) | amt3 | group3 |
[50000,100000) | amt4 | group4 |
表1资源配额区间分配表
由表1可知,1万个样本用户中资源配额最低的不小于5000元,最高的小于10万元,资源配额区间的划分有多种分配方式,本发明实施例中运用的等频分箱原则,将每个区间的样本用户数量划分为近似2500人,最终划分成5000~10000元、10000~20000元、20000~50000元、50000~100000元四个区间范围,首先计算出每个资源配额区间内的历史用户的平均资源配额值amt,并对每个资源配额区间设置不同的标签,本实施例按照资源配额由少到多的顺序依次设置标签group1~group4,相应的平均资源配额值为amt1~amt4。
上述资源配额区间的划分过程均由服务器完成,无需人工过多的介入,避免了人为操作带来的误差,同时提高了资源配额区间的划分效率。
S103、根据所述样本,利用KNN算法计算待调整用户的资源配额。
具体来说,KNN算法的基本思想是:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。在KNN中,通过计算对象间距离来作为各个对象之间的非相似性指标,距离越大越不相似,反之,距离越近越相似。在本发明的实施例中,距离的计算逻辑选择欧式距离或曼哈顿距离/>
在本发明的实施例中,取K的值为20,将新的待调整用户的用户特征与样本中的用户特征进行比较,利用KNN算法比较他们之间的相似度,这里可以选用训练好的KNN模型来完成相似度比较过程,将待调整用户的用户特征分别与资源配额区间内1万个样本的用户特征进行相似度比较,得到特征间的距离值。
在得到特征间的距离值后,KNN模型转化为该用户与每个样本用户的相似度评分并输出,此时对1万个样本用户的相似度评分由高到低进行排序,排名越靠前的说明与待调整用户的用户特征相似度越高,丛排序后的相似度评分中选取前20个作为K取值所需的数据。最后分别获取这20个数据所在的资源配额区间及对应的标签,并对这20个数据设置所在资源配额区间的标签,例如,分别对这20个数据设置标签后,后续确定资源配额时统计得到这20个数据中在group1区间的有5个,在group2区间的有8个,在group3区间的有4个,在group4区间的有3个,根据KNN算法可得出该待调整用户的资源配额在group2区间,也就是10000~20000元间。
为了提升用户体验的同时进一步降低授信风险,需要精确计算出每个用户的资源配额,上述实施例中已经计算得到了每个资源配额区间的平均资源配额,根据20个数据中每个资源配额区间所占数量的比例,对每个资源配额区间的平均资源配额进行加权平均,最后可以得到该用户精确的资源配额,具体公式为:
其中,amtnew为该用户新的资源配额,a、b、c、d分别是20个数据中四个资源配额区间中的数据所占的数量,然后根据该用户历史的资源配额进行动态调整。
在后续过程中可以将本次调整的用户资源配额级对应的用户特征作为样本,并且定期更新资源配额区间的数值和人数,确保样本的准确性和时效性。
上述实施例中的方法通过对多个历史客户的资源配额作为样本划分不同资源配额区间,并对每个区间做标记,当有客户需要调整资源配额时,利用KNN算法将当前客户的用户特征与样本中的用户特征进行相似度比较,最后当前客户的最新资源配额从而进行调整,本发明可使用机器学习智能化对批量客户同时进行资源配额调整,处理速度大大提升,减少人力资源消耗,提高了工作效率。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
图2是本发明的一种资源配额调整装置架构示意图。如图2所示,该装置200包括:
样本获取模块201,用于获取历史用户的资源配额及对应的用户特征作为样本;
资源配额拆分模块202,用于将所述资源配额划分为不同的资源配额区间,并对每个资源配额区间设置对应的标签;
资源配额调整模块203,用于根据所述样本,利用KNN算法计算待调整用户的资源配额。
具体来说,样本获取模块201从历史用户中筛选出一批信用评分较高的用户,获取这些用户的资源配额,也就是授信额度,并获取每个历史用户的用户特征,例如,可以从近半年内的授信用户中筛选出信用评分排名前1万个用户用作样本用户,随后资源配额拆分模块202将这些样本用户划分不同资源配额区间,并对每个区间做标记,当有客户需要调整资源配额时,资源配额调整模块203利用KNN算法将当前客户的用户特征与样本中的用户特征进行相似度比较,提取资源配额区间中相似度较高的K个样本,并检测这K个样本中出自哪个资源配额区间的数量最多,就将当前客户的资源配额分配到那个资源配额区间,最后根据每个资源配额区间的平均资源配额和K个样本中每个区间所占的比例进行加权平均得到最终的资源配额。
根据本发明的优选实施方式,所述资源配额拆分模块进一步包括:
区间划分单元,用于根据历史用户的数量及资源配额的阈值将所述历史用户的资源配额划分为多个资源配额区间;
平均配额计算单元,用于计算每个资源配额区间的平均资源配额;
标签设置单元,用于对每个资源配额区间设置对应的标签。
根据本发明的优选实施方式,所述区间划分单元还用于:
利用等频分箱原则将所述历史用户的资源配额划分为不同的资源配额区间,每个资源配额区间对应的历史用户数量相同。
根据本发明的优选实施方式,所述资源配额调整模块进一步包括:
相似度比较单元,用于将所述待调整用户的用户特征与所述样本中的用户特征利用KNN算法进行相似度比较;
相似特征提取单元,用于从所述资源配额区间中提取用户特征相似度较高的预设数量的相似特征;
资源配额调整单元,用于根据每个资源配额区间的平均资源配额及所述相似数据中每个资源配额区间所占的数量输出待调整用户的最新资源配额。
根据本发明的优选实施方式,所述相似特征提取单元进一步包括:
相似度排序单元,用于根据得到的相似度数值对所述资源配额区间内的样本进行排序;
标签绑定单元,用于获取排序后相似度数值较高的预设数量的相似特征,并对每个相似特征设置对应资源配额区间的标签。
根据本发明的优选实施方式,所述资源配额调整单元还用于:
根据所述预设数量的相似特征中每个资源配额区间的标签数量,对每个资源配额区间的平均资源配额进行加权平均,得到待调整用户的最新资源配额。
根据本发明的优选实施方式,所述相似度比较单元还用于:
利用欧式距离或曼哈顿距离进行相似度比较。
根据本发明的优选实施方式,所述装置还包括:
资源配额分类模块,用于将调整后的用户的资源配额划分到对应的资源配额区间内;
区间更新模块,用于设置所述资源配额区间的更新周期对所述资源配额区间进行更新。
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图3是本发明的一种信息推送电子设备结构框架示意图;下面参照图3来描述根据本发明该实施例的电子设备400。图3显示的电子设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:至少一个处理单元410、至少一个存储单元420、连接不同系统组件(包括存储单元420和处理单元410)的总线430、显示单元440等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元410执行,使得所述处理单元410执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元410可以执行如图1所示的步骤。
所述存储单元420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202,还可以进一步包括只读存储单元(ROM)4203。
所述存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备400也可以与一个或多个外部设备500(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口450进行。并且,电子设备400还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器460可以通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:获取历史用户的资源配额及对应的用户特征作为样本;将所述资源配额划分为不同的资源配额区间,并对每个资源配额区间设置对应的标签;根据所述样本,利用KNN算法计算待调整用户的资源配额。
图4是本发明的计算机可读存储介质示意图,所述计算机程序可以存储于一个或多个计算机可读介质上,如图4所示。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种基于KNN的资源配额调整方法,其特征在于,包括:
获取历史用户的资源配额及对应的用户特征作为样本;
利用等频分箱原则将所述历史用户的资源配额划分为不同的资源配额区间,每个资源配额区间对应的历史用户数量相近;计算每个资源配额区间的平均资源配额;对每个资源配额区间设置对应的标签;
将待调整用户的用户特征与所述样本中的用户特征利用KNN算法进行相似度比较;
从所述资源配额区间中提取用户特征相似度大于阈值的预设数量的相似特征;
根据每个资源配额区间的平均资源配额及所述相似特征中每个资源配额区间所占的数量输出待调整用户的最新资源配额。
2.根据权利要求1所述的基于KNN的资源配额调整方法,其特征在于,所述从所述资源配额区间中选出用户特征相似度较大于阈值的预设数量的相似特征,进一步包括:
根据得到的相似度数值对所述资源配额区间内的样本进行排序;
获取排序后相似度数值大于阈值的预设数量的相似特征,并对每个相似特征设置对应资源配额区间的标签。
3.根据权利要求1所述的基于KNN的资源配额调整方法,其特征在于,所述根据每个资源配额区间的平均资源配额及所述相似特征中每个资源配额区间所占的数量输出待调整用户的最新资源配额,进一步包括:
根据所述预设数量的相似特征中每个资源配额区间的标签数量,对每个资源配额区间的平均资源配额进行加权平均,得到待调整用户的最新资源配额。
4.根据权利要求1所述的基于KNN的资源配额调整方法,其特征在于,所述将所述待调整用户的用户特征与所述样本中的用户特征利用KNN算法进行相似度比较,进一步包括:
利用欧式距离或曼哈顿距离进行相似度比较。
5.根据权利要求3所述的基于KNN的资源配额调整方法,其特征在于,所述方法还包括:
将调整后的用户的资源配额划分到对应的资源配额区间内;
设置所述资源配额区间的更新周期对所述资源配额区间进行更新。
6.一种基于KNN的资源配额调整装置,其特征在于,包括:
样本获取模块,用于获取历史用户的资源配额及对应的用户特征作为样本;
资源配额拆分模块,用于用于利用等频分箱原则将所述历史用户的资源配额划分为不同的资源配额区间,每个资源配额区间对应的历史用户数量相近;计算每个资源配额区间的平均资源配额;对每个资源配额区间设置对应的标签。;
资源配额调整模块,用于将待调整用户的用户特征与所述样本中的用户特征利用KNN算法进行相似度比较;从所述资源配额区间中提取用户特征相似度大于阈值的预设数量的相似特征;根据每个资源配额区间的平均资源配额及所述相似特征中每个资源配额区间所占的数量输出待调整用户的最新资源配额。
7.根据权利要求6所述的基于KNN的资源配额调整装置,其特征在于,所述相似特征提取单元进一步包括:
相似度排序单元,用于根据得到的相似度数值对所述资源配额区间内的样本进行排序;
标签绑定单元,用于获取排序后相似度数值大于阈值的预设数量的相似特征,并对每个相似特征设置对应资源配额区间的标签。
8.根据权利要求6所述的基于KNN的资源配额调整装置,其特征在于,所述资源配额调整单元还用于:
根据所述预设数量的相似特征中每个资源配额区间的标签数量,对每个资源配额区间的平均资源配额进行加权平均,得到待调整用户的最新资源配额。
9.根据权利要求6所述的基于KNN的资源配额调整装置,其特征在于,所述相似度比较单元还用于:
利用欧式距离或曼哈顿距离进行相似度比较。
10.根据权利要求8所述的基于KNN的资源配额调整装置,其特征在于,所述装置还包括:
资源配额分类模块,用于将调整后的用户的资源配额划分到对应的资源配额区间内;
区间更新模块,用于设置所述资源配额区间的更新周期对所述资源配额区间进行更新。
11.一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-5中任一项所述的方法。
12.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010683200.7A CN112016797B (zh) | 2020-07-15 | 2020-07-15 | 基于knn的资源配额调整方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010683200.7A CN112016797B (zh) | 2020-07-15 | 2020-07-15 | 基于knn的资源配额调整方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112016797A CN112016797A (zh) | 2020-12-01 |
CN112016797B true CN112016797B (zh) | 2024-03-01 |
Family
ID=73498718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010683200.7A Active CN112016797B (zh) | 2020-07-15 | 2020-07-15 | 基于knn的资源配额调整方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112016797B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112700319A (zh) * | 2020-12-16 | 2021-04-23 | 中国建设银行股份有限公司 | 基于政务数据的企业授信额度确定方法及装置 |
CN112950003A (zh) * | 2021-02-07 | 2021-06-11 | 北京淇瑀信息科技有限公司 | 用户资源配额调整方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389501A (zh) * | 2018-09-29 | 2019-02-26 | 智器云南京信息科技有限公司 | 一种计算设备、计算系统 |
CN109685649A (zh) * | 2018-12-28 | 2019-04-26 | 上海点融信息科技有限责任公司 | 基于人工智能确定授信额度的方法、装置及存储介质 |
CN111327655A (zh) * | 2018-12-14 | 2020-06-23 | 中移(杭州)信息技术有限公司 | 多租户容器资源配额预测方法、装置及电子设备 |
-
2020
- 2020-07-15 CN CN202010683200.7A patent/CN112016797B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389501A (zh) * | 2018-09-29 | 2019-02-26 | 智器云南京信息科技有限公司 | 一种计算设备、计算系统 |
CN111327655A (zh) * | 2018-12-14 | 2020-06-23 | 中移(杭州)信息技术有限公司 | 多租户容器资源配额预测方法、装置及电子设备 |
CN109685649A (zh) * | 2018-12-28 | 2019-04-26 | 上海点融信息科技有限责任公司 | 基于人工智能确定授信额度的方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
唐建华.《管道漏磁内检测数据预处理方法》.东北大学出版社,2019,第114页. * |
Also Published As
Publication number | Publication date |
---|---|
CN112016797A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110807527B (zh) | 一种基于客群筛选的额度调整方法、装置和电子设备 | |
WO2021174944A1 (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
CN103970604A (zh) | 基于MapReduce架构实现图处理的方法和装置 | |
CN112016797B (zh) | 基于knn的资源配额调整方法、装置和电子设备 | |
CN112016794B (zh) | 资源配额管理方法、装置和电子设备 | |
CN112036515A (zh) | 基于smote算法的过采样方法、装置和电子设备 | |
CN107392259B (zh) | 构建不均衡样本分类模型的方法和装置 | |
CN112017042A (zh) | 基于tweedie分布的资源配额确定方法、装置和电子设备 | |
CN112508580A (zh) | 基于拒绝推断方法的模型构建方法、装置和电子设备 | |
CN111598677A (zh) | 一种资源配额确定方法、装置和电子设备 | |
CN110909222A (zh) | 基于聚类的用户画像建立方法、装置、介质及电子设备 | |
CN112015562A (zh) | 基于迁移学习的资源分配方法、装置及电子设备 | |
CN111179055B (zh) | 授信额度调整方法、装置和电子设备 | |
CN111582645B (zh) | 基于因子分解机的app风险评估方法、装置和电子设备 | |
CN110807653A (zh) | 一种筛选用户的方法、装置和电子设备 | |
CN111598360A (zh) | 服务策略确定方法、装置及电子设备 | |
CN114091570A (zh) | 业务处理系统方法、装置和电子设备 | |
CN111582649B (zh) | 基于用户app独热编码的风险评估方法、装置和电子设备 | |
CN110503117A (zh) | 数据聚类的方法和装置 | |
CN111915115A (zh) | 执行策略设置方法和装置 | |
CN113298120B (zh) | 基于融合模型的用户风险预测方法、系统和计算机设备 | |
CN112527851B (zh) | 用户特征数据筛选方法、装置及电子设备 | |
CN114067149A (zh) | 互联网服务提供方法、装置和计算机设备 | |
CN112906723A (zh) | 一种特征选择的方法和装置 | |
CN114219053B (zh) | 用户位置信息处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |