CN112434065A - 一种基于银行流水区间数据的预测处理方法 - Google Patents
一种基于银行流水区间数据的预测处理方法 Download PDFInfo
- Publication number
- CN112434065A CN112434065A CN202011311755.5A CN202011311755A CN112434065A CN 112434065 A CN112434065 A CN 112434065A CN 202011311755 A CN202011311755 A CN 202011311755A CN 112434065 A CN112434065 A CN 112434065A
- Authority
- CN
- China
- Prior art keywords
- amount
- interval
- weighted
- credit
- maximum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 25
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 19
- 230000007306 turnover Effects 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 4
- 101100391182 Dictyostelium discoideum forI gene Proteins 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000002354 daily effect Effects 0.000 description 27
- 238000013461 design Methods 0.000 description 4
- 230000003203 everyday effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24568—Data stream processing; Continuous queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及信贷风控技术领域,具体的讲是一种基于银行流水区间数据的预测处理方法,包括如下步骤:步骤1,区间特征预处理模块提取流水信息中的数据特征,获得四个加权数据特征,并发送给预测处理模块;步骤2,预测处理模块对数据特征进行分析处理,获得预估年进账及授信额度预测值;步骤3,预测处理模块将加权数据特征、申请额度、预估年进账、营业额、授信额度预测值发送给结果反馈模块;步骤4,结果反馈模块生成预测结果。与现有技术相比,能够提供一种智能预测处理银行流水的方法,能够有效的根据客户流水信息进行预警,披露风险,同时分析客户进账金额、每日余额与授信额度之间的关系。
Description
技术领域
本发明涉及信贷风控技术领域,具体的讲是一种基于银行流水区间数据的预测处理方法。
背景技术
在信贷业务中,个人或者企业的流水信息是衡量客户贷款资质的一个重要参考对象。目前,对银行流水的审核评估工作主要依赖于审批官的经验与决策,并且银行流水条目众多,审批极易引起疲劳,计算效率极低,甚至审批官也会因为工作失误,放过坏客户造成风险损失;同时,银行流水中交易金额的跨度很大,原本由全部流水月度进账来计算均值,但是大额的交易往往在数据分析过程中造成权重偏差,会对客户带来误判,有些客户在提交业务时,会登记自己的营业额,但是该营业额的真实性无从考证,因此也需要对度量进行比较。
因此设计一种基于银行流水区间数据的预测处理方法是十分有必要的。
发明内容
本发明突破了现有技术的难题,设计了一种基于银行流水区间数据的预测处理方法。
为了达到上述目的,本发明设计了一种基于银行流水区间数据的预测处理方法,包括如下步骤:
步骤1,区间特征预处理模块提取流水信息中的数据特征,获得四个加权数据特征,并发送给预测处理模块;
步骤2,预测处理模块对数据特征进行分析处理,获得预估年进账及授信额度预测值;
步骤3,预测处理模块将加权数据特征、申请额度、预估年进账、营业额、授信额度预测值发送给结果反馈模块;
步骤4,结果反馈模块生成预测结果。
所述步骤1中数据特征的计算步骤如下:
步骤11:将流水信息的进账金额分为若干个区间,计算每个区间的进账笔数,计算每个区间进账笔数的占比,然后获取在每个区间内,进账金额的最大值与进账金额的最小值,计算最大加权进账金额WImax=,最小加权进账金额WImin=;
步骤12:将流水信息中的每日余额分为若干个区间,计算余额在每个区间的天数,得到每个区间进账笔数的占比,然后获取在每个区间内,每日余额的最大值,与每日余额的最小值,计算最大加权每日余额WBmax=,最小加权每日余额WBmin=;
步骤2中预估年进账及授信额度预测值的计算步骤如下:
其中的,,,是模型系数,首先将最大加权进账金额、最小加权进账金额、最大加权每日余额及最小加权每日余额的单位统一为万元,对统一后的WImax,WImin进行开方变换得到,,对进行自然对数变换得到,然后对大量样本进行机器学习训练后得到模型系数,,,。
区间特征预处理模块包括处理进账金额子模块与处理每日余额子模块。
预测处理模块包括预估年进账子模块与申请额度预测子模块。
结果反馈模块包括区间分析结果子模块,预估反馈子模块,额度预测结果子模块;
区间分析结果子模块,可将计算出来的最大加权进账金额与加权最大每日余额和流水信息中的申请授信额度进行比较,若加权最大余额<加权最大进账<申请授信额度,则表示申请授信额度过高,若加权最大进账<加权最大余额<申请授信额度,则表示申请授信额度过高;
预估反馈子模块,可以将预估年进账金额与营业额进行比较,若营业额>预估年进账金额的一定百分比135%,则与记录差别较大,若营业额<预估年进账金额的一定百分比65%,则与记录差别较大;
额度预测结果子模块,可按照区间分割的结果,标注申请授信额度所在区间以及授信额度预测值所在区间,得到授信额度预测值所在区间与申请授信额度所在区间的关系后进行综合评估,输出结果。
流水信息中的数据特征包括进账金额、每日余额、申请授信额度、银行流水信息。
本发明与现有技术相比,能够提供一种智能预测处理银行流水的方法,能够有效的根据客户流水信息进行预警,披露风险,同时分析客户进账金额、每日余额与授信额度之间的关系。
附图说明
图1为本发明的流程图。
图2为本发明预估年进账的计算表格图。
具体实施方式
本发明设计了一种基于银行流水区间数据的预测处理方法,包括如下步骤:
步骤1,区间特征预处理模块提取流水信息中的数据特征,获得四个加权数据特征,处理后发送给预测处理模块;区间特征预处理模块包括处理进账金额子模块与处理每日余额子模块。
步骤2,预测处理模块对数据特征进行分析处理,获得预估年进账及授信额度预测值;预测处理模块包括预估年进账子模块与申请额度预测子模块。
步骤3,预测处理模块将预估年进账及授信额度预测值发送给结果反馈模块;
步骤4,结果反馈模块生成预测结果。
步骤1中的数据特征的处理步骤如下:
步骤11:将流水信息的进账金额分为若干个区间,计算每个区间的进账笔数,计算每个区间进账笔数的占比,然后获取在每个区间内,进账金额的最大值与进账金额的最小值,定义最大加权进账金额和最小加权进账金额,用以衡量客户流水账户资质,最大加权进账金额WImax=,最小加权进账金额WImin=
步骤12:将流水信息中的每日余额分为若干个区间,计算余额在每个区间的天数,得到每个区间进账笔数的占比,然后获取在每个区间内,每日余额的最大值,与每日余额的最小值,最大加权每日余额WBmax=,最小加权每日余额WBmin=;
步骤2中预估年进账及授信额度预测值的计算步骤如下:
计算每个月的最小加权进账金额与最大加权进账金额,
步骤22:将最大加权进账金额、最小加权进账金额、最大加权每日余额及最小加权每日余额输入非线性多元回归模型,得到授信额度预测值=;其中,,,是模型系数,计算方法如下:将最大加权进账金额、最小加权进账金额、最大加权每日余额及最小加权每日余额的单位统一为万元,对统一后的WImax,WImin进行开方变换得到,,对进行自然对数变换得到,对大量样本进行机器学习训练后得到模型系数,,,。
结果反馈模块包括区间分析结果子模块,预估反馈子模块,额度预测结果子模块;
区间分析结果子模块,可将计算出来的最大加权进账金额与加权最大每日余额和流水信息中的申请授信额度进行比较,若加权最大余额<加权最大进账<申请授信额度,则表示申请授信额度过高,可提示客户流水快进快出,难以留存,建议降额或分期;若加权最大进账<加权最大余额<申请授信额度,则表示申请授信额度过高,可提示客户流水资金调动能力较弱,建议降额或分期。
预估反馈子模块,可以将预估年进账金额与营业额进行比较,若营业额>预估年进账金额的135%,则与记录差别较大,可能存在以下情况:流水收集不全,建议补充流水或是营业额夸大,建议交叉检验;若营业额<预估年进账金额的65%,则与记录差别较大,可能存在以下情况:有其他对外投资收入或是有隐形负债。
额度预测结果子模块,可按照区间分割的结果,标注申请授信额度所在区间以及授信额度预测值所在区间,得到授信额度预测值所在区间与申请授信额度所在区间的关系后进行综合评估,输出结果。
流水信息中的数据特征包括进账金额、每日余额、申请授信额度、银行流水信息。
实施例1:
步骤1:获取客户所提供的流水信息、申请金额为50万、提供近一年营业额为500万;对流水文件的金额列、余额列、时间列进行提取;对金额列筛选进账,记作进账金额;对余额列根据时间提取出每日最后留存余额,记作每日余额。
步骤11:对进账金额进行划分bins=[0,1e4,5e4,10e4,20e4,30e4,50e4,100e4,200e4,300e4,500e4,1000e4 ];
步骤12:每日余额与步骤11采取一致的划分;计算进账金额最大值、进账金额最小值、每日余额最大值、每日余额最小值,如下表所示:
计算余额区间笔数占比、进账区间笔数占比,如下表所示:
得到WImax=131996,WImin=65634,WBmax=95383,WBmin=167755;
将特征数据发送到下一模块。
步骤21:首先计算影响因子,对全部余额进行区间划分,计算划分节点左右两区间的最值之比,如下表所示:
步骤3:在接收以上数据之后,根据条件输出不同的提示语。
加权最大每日余额(95383)<加权最大进账金额(131996)<申请金额(500000);提示A:申请授信额度过高;客户流水快进快出,难以留存,建议降额或分期。
提示C:客户申请金额为40万元,本次建议授信额度为28万元。
Claims (7)
1.一种基于银行流水区间数据的预测处理方法,其特征在于,包括如下步骤:
步骤1,区间特征预处理模块提取流水信息中的数据特征,获得四个加权数据特征,处理后发送给预测处理模块;
步骤2,预测处理模块对数据特征进行分析处理,获得预估年进账及授信额度预测值;
步骤3,预测处理模块将加权数据特征、申请额度、预估年进账、营业额、授信额度预测值发送给结果反馈模块;
步骤4,结果反馈模块生成预测结果。
2.所述步骤1中的数据特征的处理步骤如下:
步骤11:将流水信息的进账金额分为若干个区间,计算每个区间的进账笔数,计算每个区间进账笔数的占比,然后获取在每个区间内,进账金额的最大值与进账金额的最小值,计算最大加权进账金额WImax=,最小加权进账金额WImin=;
步骤12:将流水信息中的每日余额分为若干个区间,计算余额在每个区间的天数,得到每个区间进账笔数的占比,然后获取在每个区间内,每日余额的最大值,与每日余额的最小值,计算最大加权每日余额WBmax=,最小加权每日余额WBmin=;
所述步骤2中预估年进账及授信额度预测值的计算步骤如下:
4.根据权利要求1所述的一种基于银行流水区间数据的预测处理方法,其特征在于:所述的区间特征预处理模块包括处理进账金额子模块与处理每日余额子模块。
5.根据权利要求1所述的一种基于银行流水区间数据的预测处理方法,其特征在于:所述的预测处理模块包括预估年进账子模块与申请额度预测子模块。
6.根据权利要求1所述的一种基于银行流水区间数据的预测处理方法,其特征在于:所述的结果反馈模块包括区间分析结果子模块、预估反馈子模块和额度预测结果子模块;
区间分析结果子模块,可将计算出来的最大加权进账金额与加权最大每日余额和流水信息中的申请授信额度进行比较,若加权最大余额<加权最大进账<申请授信额度,则表示申请授信额度过高,若加权最大进账<加权最大余额<申请授信额度,则表示申请授信额度过高;
预估反馈子模块,可以将预估年进账金额与营业额进行比较,若营业额>预估年进账金额的135%,则与记录差别较大,若营业额<预估年进账金额的一定百分比65%,则与记录差别较大;
额度预测结果子模块,可按照区间分割的结果,标注申请授信额度所在区间以及授信额度预测值所在区间,得到授信额度预测值所在区间与申请授信额度所在区间的关系后进行综合评估,输出结果。
7.根据权利要求1所述的一种基于银行流水区间数据的预测处理方法,其特征在于:所述的流水信息中的数据特征包括进账金额、每日余额、申请授信额度、银行流水信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011311755.5A CN112434065A (zh) | 2020-11-20 | 2020-11-20 | 一种基于银行流水区间数据的预测处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011311755.5A CN112434065A (zh) | 2020-11-20 | 2020-11-20 | 一种基于银行流水区间数据的预测处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112434065A true CN112434065A (zh) | 2021-03-02 |
Family
ID=74693264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011311755.5A Pending CN112434065A (zh) | 2020-11-20 | 2020-11-20 | 一种基于银行流水区间数据的预测处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112434065A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956273A (zh) * | 2019-11-07 | 2020-04-03 | 中信银行股份有限公司 | 融合多种机器学习模型的征信评分方法及系统 |
CN111738843A (zh) * | 2020-06-29 | 2020-10-02 | 金电联行(北京)信息技术有限公司 | 一种使用流水数据的量化风险评价系统和方法 |
US20200349641A1 (en) * | 2019-05-03 | 2020-11-05 | Mo Tecnologias, Llc | System and method for determining credit and issuing a business loan using tokens and machine learning |
-
2020
- 2020-11-20 CN CN202011311755.5A patent/CN112434065A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200349641A1 (en) * | 2019-05-03 | 2020-11-05 | Mo Tecnologias, Llc | System and method for determining credit and issuing a business loan using tokens and machine learning |
CN110956273A (zh) * | 2019-11-07 | 2020-04-03 | 中信银行股份有限公司 | 融合多种机器学习模型的征信评分方法及系统 |
CN111738843A (zh) * | 2020-06-29 | 2020-10-02 | 金电联行(北京)信息技术有限公司 | 一种使用流水数据的量化风险评价系统和方法 |
Non-Patent Citations (3)
Title |
---|
LUCA ANZILLI ET AL.: "Credit risk profiling using a new evaluation of interval-valued fuzzy sets based on alpha-cuts", 《2017 IEEE INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS (FUZZ-IEEE)》 * |
李响: "商业银行对小微企业授信额度测算模型研究", 《中国优秀博硕士学位论文全文数据库(硕士) 经济与管理科学辑》 * |
赵梦: "DZ银行基于RAROC模型的企业授信额度研究", 《中国优秀博硕士学位论文全文数据库(硕士) 经济与管理科学辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Amiram et al. | Financial statement errors: Evidence from the distributional properties of financial statement numbers | |
CN111062801A (zh) | 一种综合式评估企业授信额度分析系统及方法 | |
CN112102073A (zh) | 信贷风险控制方法及系统、电子设备及可读存储介质 | |
CN112613977A (zh) | 一种基于政务数据的个人信用贷款准入授信方法及系统 | |
Majdina et al. | The determinant factors of efficiency on Islamic banking and conventional banking in Indonesia | |
CN111598682A (zh) | 一种针对企业的信用风险评估方法及系统 | |
CN112700321A (zh) | 基于用户行为数据的多规则反欺诈预测方法及系统 | |
CN111784487A (zh) | 一种基于动态财资流的中小企业超短期信用评价方法 | |
CN114140013A (zh) | 一种基于xgboost的评分卡生成方法、装置及设备 | |
Agustian et al. | Analysis Of Common Size On BSI (Bank Syariah Indonesia) In 2020-2021 | |
Muhammad et al. | The determinants of potential failure of islamic peer-to-peer lending: perceptions of stakeholders in Indonesia | |
de Rassenfosse | On the price elasticity of demand for trademarks | |
CN112037006A (zh) | 小微企业的信用风险识别方法及装置 | |
Barbosa et al. | Credit supply shocks and human capital: Evidence from a change in accounting norms | |
CN110930258B (zh) | 一种应收账款融资变现规模预测方法及系统 | |
Pham et al. | Innovation and bank efficiency in Vietnam and Pakistan | |
CN112434065A (zh) | 一种基于银行流水区间数据的预测处理方法 | |
Leitner-Hanetseder | Quality and determinants of risk reporting-Evidence from Germany and Austria | |
CN113421154B (zh) | 基于控制图的信贷风险评估方法及系统 | |
CN107657528A (zh) | 一种结合风险管理的商业保理管理系统 | |
CN114693428A (zh) | 数据确定方法、装置、计算机可读存储介质及电子设备 | |
KR101187099B1 (ko) | 대용량처리전용 데이터베이스를 이용한 국제회계기준 금융상품 회계처리시스템 | |
Romer et al. | Brookings Papers on Economic Activity: Fall 2011 | |
Rahayu et al. | The Impact Of Psak 72 Implementation On Financial Performance In The Pandemic Time Covid-19 (Empirical Study On Real Estate Companies Registered In Indonesia Stock Exchange) | |
CN113313572B (zh) | 一种基于公积金点贷客户的模型识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210302 |
|
RJ01 | Rejection of invention patent application after publication |