CN112488865A - 基于金融时间节点的金融风险预测方法、装置和电子设备 - Google Patents
基于金融时间节点的金融风险预测方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112488865A CN112488865A CN202110166441.9A CN202110166441A CN112488865A CN 112488865 A CN112488865 A CN 112488865A CN 202110166441 A CN202110166441 A CN 202110166441A CN 112488865 A CN112488865 A CN 112488865A
- Authority
- CN
- China
- Prior art keywords
- resource
- sub
- user
- financial
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Technology Law (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了一种基于金融时间节点的金融风险预测方法、装置和电子设备。该方法包括:根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集,所述历史用户为具有资源配额且具有资源使用行为的历史用户,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点;建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型;根据匹配规则,判断与当前用户相匹配的子预测模型;使用所匹配的子预测模型,对所述当前用户进行金融风险预测。本发明能够从金融时间节点等的时间维度、交易维度、数据维度等多维度提取用户数据,能够更精确地实现用户群的细分类。
Description
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种基于金融时间节点的金融风险预测方法、装置和电子设备。
背景技术
风险预测是对风险的量化,是风险管理的关键性技术。目前一般通过建模的方式进行风险预测,在模型的建立过程中,主要有数据抽取、特征生成、特征选取、算法模型生成和合理性评估等步骤。
在现有技术中,金融风险预测主要的目的是如何区分出好客户和坏客户,评估用户的风险情况,以降低信用风险,并实现利润最大化。此外,随着数据的来源渠道越来越丰富,可以作为风险特征变量的数据也越来越多。但是,例如用户数据及其他相关数据等很多数据在使用时并未考虑时间因素引起的变化,由此,在使用上述数据进行模型计算时,导致模型计算值不够准确,甚至对于一些用户的风险评估的准确性较低。由此,在模型精度提高或模型优化、数据提取等方面仍存在很大改进空间。
因此,有必要提供一种新的金融风险预测方法,以进一步提高模型精度,并更精确地预测不同用户的风险情况。
发明内容
为了更精确地预测不同用户群中各用户的风险情况,提高预测模型的精度,降低金融服务机构的金融风险损失。本发明从金融时间节点等的时间维度、交易维度、用户资源使用表现数据类型及数量等多维度进行更有效的数据提取,以进一步细分用户群,并建立与不同用户群相对应的子预测模型,以实现对不同时间分段内的用户群进行预测。
本发明提供了一种基于金融时间节点的金融风险预测方法,包括:根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集,所述历史用户为具有资源配额且具有资源使用行为的历史用户,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点;建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型;根据匹配规则,判断与当前用户相匹配的子预测模型;使用所匹配的子预测模型,对所述当前用户进行金融风险预测。
优选地,包括:设定匹配规则,所述匹配规则包括在距资源配额授予节点的特定时间段内发生资源使用行为的次数、第一次资源使用行为的发生时间、第二次资源使用行为的发生时间。
优选地,所述匹配规则还包括第一匹配规则、第二匹配规则和第三匹配规则,其中,该第一匹配规则为判断当前用户是否在距资源配额授予节点的特定时间段内发生了一次资源使用行为;该第二匹配规则判断当前用户是否在距资源配额授予节点的特定时间段内发生了两次资源使用行为且第二次资源使用行为的发生时间在自第一次资源使用行为的发生时间起特定时间段内;该第三匹配规则为判断当前用户在距资源配额授予节点的特定时间段内发生资源使用的次数是否超过特定次数。
优选地,还包括:在当前用户的用户数据命中第一匹配规则时,则该当前用户为第一类用户;在当前用户的用户数据命中第二匹配规则时,则该当前用户为第二类用户;在当前用户的用户数据同时命中第二匹配规则和第三匹配规则时,则该当前用户为第三类用户。
优选地,还包括:提取规则包括时间参数、事件参数、根据时间参数和/或事件参数提取,所述时间参数包括自资源配额授予节点起特定时间段内、自资源配额授予节点起到第一次资源使用行为的发生时间的时间段内、自第一次资源使用行为的发生时间起特定时间段内;所述事件参数包括判断是否为新用户、有无逾期数据、有无违约数据、有无催收数据、是否有多头用户;通过所述提取规则,提取用户的时间特征数据和事件特征数据。
优选地,还包括:获取当前用户的用户数据,使用所述提取规则,提取该当前用户的时间特征数据、事件特征数据;使用匹配规则,确定该当前用户所对应的子预测模型,并使用所确定的子预测模型,输入当前用户的时间特征数据和事件特征数据,计算所述当前用户的金融预测值。
优选地,还包括:设定评价指标,通过计算所述评价指标,对各子预测模型进行模型参数调整,所述评价指标包括ROC指标、AUC指标。
此外,本发明还提供了一种基于金融时间节点的金融风险预测装置,包括:数据处理模块,根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集,所述历史用户为具有资源配额且具有资源使用行为的历史用户,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点;模型建立模块,用于建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型;判断模块,根据匹配规则,判断与当前用户相匹配的子预测模型;预测模块,使用所匹配的子预测模型,对所述当前用户进行金融风险预测。
优选地,包括设定模块,所述设定模块用于设定匹配规则,所述匹配规则包括在距资源配额授予节点的特定时间段内发生资源使用行为的次数、第一次资源使用行为的发生时间、第二次资源使用行为的发生时间。
优选地,所述匹配规则还包括第一匹配规则、第二匹配规则和第三匹配规则,其中,该第一匹配规则为判断当前用户是否在距资源配额授予节点的特定时间段内发生了一次资源使用行为;该第二匹配规则判断当前用户是否在距资源配额授予节点的特定时间段内发生了两次资源使用行为且第二次资源使用行为的发生时间在自第一次资源使用行为的发生时间起特定时间段内;该第三匹配规则为判断当前用户在距资源配额授予节点的特定时间段内发生资源使用的次数是否超过特定次数。
优选地,还包括确定模块,所述确定模块用于确定当前用户所属的用户类别;在当前用户的用户数据命中第一匹配规则时,则该当前用户为第一类用户;在当前用户的用户数据命中第二匹配规则时,则该当前用户为第二类用户;在当前用户的用户数据同时命中第二匹配规则和第三匹配规则时,则该当前用户为第三类用户。
优选地,还包括:提取规则包括时间参数、事件参数、根据时间参数和/或事件参数提取,所述时间参数包括自资源配额授予节点起特定时间段内、自资源配额授予节点起到第一次资源使用行为的发生时间的时间段内、自第一次资源使用行为的发生时间起特定时间段内;所述事件参数包括判断是否为新用户、有无逾期数据、有无违约数据、有无催收数据、是否有多头用户;通过所述提取规则,提取用户的时间特征数据和事件特征数据。
优选地,还包括:获取当前用户的用户数据,使用所述提取规则,提取该当前用户的时间特征数据、事件特征数据;使用匹配规则,确定该当前用户所对应的子预测模型,并使用所确定的子预测模型,输入当前用户的时间特征数据和事件特征数据,计算所述当前用户的金融预测值。
优选地,还包括:设定评价指标,通过计算所述评价指标,对各子预测模型进行模型参数调整,所述评价指标包括ROC指标、AUC指标。
此外,本发明还提供了一种电子设备,其中,该电子设备包括:处理器;以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行本发明所述的基于金融时间节点的金融风险预测方法。
此外,本发明还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现本发明所述的基于金融时间节点的金融风险预测方法。
有益效果
与现有技术相比,本发明能够从金融时间节点等的时间维度、交易维度、数据维度(特别是用户资源使用表现数据类型及同一类型用户资源使用表现数据数量)等多维度提取用户数据,能够更精确地实现用户群的细分类;通过使用评价指标,选定测试数据集对各子预测模型进行评价,能够进一步优化模型参数,并能够提高模型精度;建立与不同用户群相对应的子预测模型,能够更精确地预测用户的风险情况,提高了各子预测模型的预测精度,还降低了金融服务机构的金融风险损失。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明的实施例1的基于金融时间节点的金融风险预测方法的一示例的流程图。
图2是本发明的实施例1的基于金融时间节点的金融风险预测方法的另一示例的流程图。
图3是本发明的实施例1的基于金融时间节点的金融风险预测方法的又一示例的流程图。
图4是本发明的实施例2的基于金融时间节点的金融风险预测装置的一示例的示意图。
图5是本发明的实施例2的基于金融时间节点的金融风险预测装置的另一示例的示意图。
图6是本发明的实施例2的基于金融时间节点的金融风险预测装置的又一示例的示意图。
图7是根据本发明的一种电子设备的示例性实施例的结构框图。
图8是根据本发明的计算机可读介质的示例性实施例的结构框图。
具体实施方式
现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。
在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。
术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
鉴于上述问题,本发明提出了一种基于金融时间节点的金融风险预测方法。该方法通过从金融时间节点等的时间维度、交易维度、数据维度(特别是用户资源使用表现数据类型及同一类型用户资源使用表现数据数量)等多维度提取用户数据,以进一步细分用户群,并建立与不同用户群相对应的子预测模型,以预测用户的风险情况,提高了各子预测模型的预测精度,还降低了金融服务机构的金融风险损失。以下将详细描述本发明方法的具体过程。
需要说明的是,本发明中,资源是指任何可被利用的物质、信息、时间,信息资源包括计算资源和各种类型的数据资源。数据资源包括各个领域中的各种专用数据。本发明的创新之处在于如何使用服务器和客户端之间的信息交互技术来使资源分配的过程更加自动化、高效和减小人力成本。由此,从本质上来说,本发明可以应用于各类资源分配与归还时的风险预测,不仅限于金融资源,包括实体的货物、水、电,以及有意义的资料等。但是,为了方便起见,本发明中以金融数据资源为例进行说明资源分配的实施,但本领域技术人员应当理解,本发明亦可以用于其他资源的风险预测。
实施例1
下面,将参照图1至图3描述本发明的基于金融时间节点的金融风险预测方法的实施例。
图1为本发明的基于金融时间节点的金融风险预测方法的一示例的流程图。如图1所示,该方法包括如下步骤。
步骤S101,根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集,所述历史用户为具有资源配额且具有资源使用行为的历史用户,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点。
步骤S102,建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型。
步骤S103,根据匹配规则,判断与当前用户相匹配的子预测模型。
步骤S104,使用所匹配的子预测模型,对所述当前用户进行金融风险预测。
首先,在步骤S101中,根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集。
在本示例中,在用户对金融服务产品或金融理财产品进行资源使用的应用场景中,例如从金融机构、第三方支付机构等相关数据库,获取上述应用场景下的用户数据。
具体地,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点。
例如,根据历史用户在资源使用节点的提取规则,提取用户的时间特征数据和事件特征数据。
如图2所示,还包括确定根据与各金融时间节点相对应的提取规则的步骤S201。
在步骤S201中,确定与各金融时间节点相对应的提取规则。
具体地,例如,确定与资源使用节点相对应的提取规则,该提取规则包括时间参数、事件参数、根据时间参数和/或事件参数提取。
进一步地,所述时间参数包括自资源配额授予节点起特定时间段内、自资源配额授予节点起到第一次资源使用行为的发生时间的时间段内、自第一次资源使用行为的发生时间起特定时间段内。例如,自第一次资源使用行为的发生时间起30天~120天内。
更进一步地,所述事件参数包括判断是否为新用户、有无逾期数据、有无违约数据、有无催收数据、是否有多头用户。
在本示例中,根据时间参数和时间参数,提取历史用户的时间特征数据和事件特征数据,以建立与资源使用节点相对应的多个子训练数据集。
需要说明的是,在该示例中,所述历史用户为具有资源配额且具有资源使用行为的历史用户。
优选地,以与步骤S201的提取方式相同的方式进行数据提取,但是其中时间参数和事件参数会根据金融时间节点的变化而相应变化,例如,与资源归还节点相对应的时间参数和事件参数,该时间参数包括自各资源归还节点起向前推算一段时间的特定时间,该事件参数包括是否在各资源归还点或之前完成了资源归还、有无催收数据。
由此,能够根据根据金融时间节点的变化、表现数据的变化更有效提取用户数据,并根据所提取的用户数据建立子训练数据集,以用于训练模型,由此提高模型精度。
进一步地,根据对应的时间参数和事件参数,提取历史用户的时间特征数据和事件特征数据,以建立与资源归还节点或资源授予节点的多个子训练数据集。
例如,多个子训练数据集包括与资源使用节点相关的历史用户的时间特征数据、事件特征数据、在特定时间段内用户资源使用行为数据、逾期概率和/违约概率,其中,该特定时间段包括自资源配额授予节点起特定时间段内、自资源配额授予节点起到第一次资源使用行为的发生时间的时间段内、自第一次资源使用行为的发生时间起特定时间段内等。
再例如,多个子训练数据集包括与资源归还节点相关的历史用户的时间特征数据、事件特征数据、在特定时间段内用户资源使用行为数据、逾期概率和/违约概率,其中,该特定时间段包括自资源使用节点起向前推一段时间的时间段、自资源配额授予节点起到当前资源使用节点之间的时间。
需要说明的是,上述仅作为优选示例进行说明,不能理解成对本发明的限制。在其他示例中,子训练数据集还可以包括用户特征数据,该用户特征数据还可以包括用户基本信息数据、社交行为数据等。例如用户年龄、性别、职业、月收入/年收入等。
需要说明的是,上述仅作为优选示例进行说明,不能理解成对本发明的限制。
接下来,在步骤S102中,建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型。
在本示例中,先基于资源配额授予节点、资源使用节点和资源归还节点,将样本数据分成三段,即在资源配额授予节点之间的样本数据,在资源配额授予节点与资源使用节点之间的样本数据,资源使用次数大于特定次数且达到资源归还特定期数的样本数据。
进一步地,还包括根据上述三段的样本数据,分别定义正样本和负样本,标签为0,1,其中,1表示用户的逾期概率(或违约概率)为Y以上的样本,0表示用户的逾期概率(或违约概率)为小于Y的样本,其中,在各分段中的Y值不同。通常,用户的逾期概率(或违约概率)越低,贷款回收本金的情况越好,资金的使用效率越好,资产的风险程度就越低,反之亦然。
因此,通过给定样本标签值Y,将用户分为目标用户和非目标用户,能够实现对用户群的分类,并从金融时间节点等的时间维度、交易维度、数据维度(特别是用户资源使用表现数据类型及同一类型用户资源使用表现数据数量)等多维度提取用户数据,能够更精确地实现用户群的细分类。
具体地,使用具有标签值Y的样本数据,建立与金融时间节点相对应的多个子训练数据集。
进一步地,根据样本数据及其数量和金融时间节点的影响因素,使用例如逻辑回归算法、Xgboost算法、TextCNN算法、随机森林算法中一个和多个算法组合方式,建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型。
需要说明的是,上述仅作为优选的示例进行说明,不能理解成对本发明的限制。此外,具体使用的算法可以根据采样数据和/或业务需求进行确定。
优选地,还包括使用评价指标对模型进行评价的步骤。
具体地,设定评价指标,通过计算所述评价指标,对各子预测模型进行模型参数调整,所述评价指标包括ROC指标、AUC指标。
进一步地,还包括建立与各子训练数据集相对应的测试数据集,以用于模型参数调整。
因此,通过使用评价指标,选定测试数据集对各子预测模型进行评价,能够进一步优化模型参数,并能够提高模型精度。
需要说明的是,上述仅作为优选示例进行说明,不能理解成对本发明的限制。
接下来,在步骤S103中,根据匹配规则,判断与当前用户相匹配的子预测模型。
具体地,根据不同应用场景,例如根据资源使用的应用场景,设定与资源使用节点相对应的匹配规则,以用于判断与当前用户所适配的子预测模型。
优选地,通过在资源配额授予节点、资源使用节点、资源归还节点等金融时间节点的时间维度上,在相邻时间节点之间的时间维度上以及在距金融时间节点向前推或向后推一段时间的特定时间或特定时间段内的时间维度上有无表现特征数据、表现特征数据的类型和数量、以及同一类型表现特征数据的类型和数量等,设定匹配规则,进一步地细分用户群,并得到与各用户群相匹配的子预测模型。
在本示例中,所述匹配规则包括第一匹配规则、第二匹配规则和第三匹配规则,其中,该第一匹配规则为判断当前用户是否在距资源配额授予节点的特定时间段内发生了一次资源使用行为;该第二匹配规则判断当前用户是否在距资源配额授予节点的特定时间段内发生了两次资源使用行为且第二次资源使用行为的发生时间在自第一次资源使用行为的发生时间起特定时间段内;该第三匹配规则为判断当前用户在距资源配额授予节点的特定时间段内发生资源使用的次数是否超过特定次数。
如图3所示,还包括确定当前用户所属的用户类别的步骤S301。
在步骤S301中,确定当前用户所属的用户类别,并基于所确定的用户类别,确定与当前用户所适配的子预测模型。
在本示例中,获取当前用户的用户数据,使用步骤S101中确定的提取规则,提取该当前用户的时间特征数据、事件特征数据,并使用所述匹配规则,对所提取的时间特征数据、事件特征数据进行匹配判断。
具体地,在当前用户的用户数据命中第一匹配规则时,则该当前用户为第一类用户;在当前用户的用户数据命中第二匹配规则时,则该当前用户为第二类用户;在当前用户的用户数据同时命中第二匹配规则和第三匹配规则时,则该当前用户为第三类用户。
需要说明的是,在本示例中,第一类用户、第二类用户和第三类用户是指从与在资源配额授予节点与资源使用节点之间的样本数据相对应的用户群、与资源使用次数大于特定次数且达到资源归还特定期数的样本数据相对应的用户群中,进一步细分的用户群。
进一步地,根据所确定的用户类别,确定该当前用户所对应的子预测模型。
由此,能够从金融时间节点等的时间维度、交易维度、数据维度(特别是用户资源使用表现数据类型及同一类型用户资源使用表现数据数量)等多维度提取用户数据,并能够更准确地将用户划分成不同子用户群,实现了更精确的用户群细分。
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。
接下来,在步骤S104中,使用所匹配的子预测模型,对所述当前用户进行金融风险预测。
具体地,使用步骤S103或S301所确定的当前用户所对应的子预测模型(即所匹配的子预测模型),并使用所确定的子预测模型,输入当前用户的时间特征数据和事件特征数据,计算所述当前用户的金融预测值。
优选地,根据所计算的金融预测值,判断所述当前用户的风险状态,由此,针对不同用户采取相应的风险策略。
具体地,所述金融预测值是0~1之间的一个数值。
例如,所述风险策略包括对用户进行禁止或限制资源请求、冻结剩余资源、增加资源请求、增加资源配额等。
由此,通过建立与不同用户群相对应的子预测模型,能够更精确地预测用户的风险情况,提高了各子预测模型的预测精度,还降低了金融服务机构的金融风险损失。
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
与现有技术相比,本发明能够从金融时间节点等的时间维度、交易维度、数据维度(特别是用户资源使用表现数据类型及同一类型用户资源使用表现数据数量)等多维度提取用户数据,能够更精确地实现用户群的细分类;通过使用评价指标,选定测试数据集对各子预测模型进行评价,能够进一步优化模型参数,并能够提高模型精度;建立与不同用户群相对应的子预测模型,能够更精确地预测用户的风险情况,提高了各子预测模型的预测精度,还降低了金融服务机构的金融风险损失。
实施例2
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
参照图4、图5和图6,本发明还提供了一种基于金融时间节点的金融风险预测装置400,该金融风险预测装置400包括:数据处理模块401,根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集,所述历史用户为具有资源配额且具有资源使用行为的历史用户,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点;模型建立模块402,用于建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型;判断模块403,根据匹配规则,判断与当前用户相匹配的子预测模型;预测模块403,使用所匹配的子预测模型,对所述当前用户进行金融风险预测。
如图5所示,包括设定模块501,所述设定模块501用于设定匹配规则,所述匹配规则包括在距资源配额授予节点的特定时间段内发生资源使用行为的次数、第一次资源使用行为的发生时间、第二次资源使用行为的发生时间。
优选地,所述匹配规则还包括第一匹配规则、第二匹配规则和第三匹配规则,其中,该第一匹配规则为判断当前用户是否在距资源配额授予节点的特定时间段内发生了一次资源使用行为;该第二匹配规则判断当前用户是否在距资源配额授予节点的特定时间段内发生了两次资源使用行为且第二次资源使用行为的发生时间在自第一次资源使用行为的发生时间起特定时间段内;该第三匹配规则为判断当前用户在距资源配额授予节点的特定时间段内发生资源使用的次数是否超过特定次数。
如图6所示,还包括确定模块601,所述确定模块601用于确定当前用户所属的用户类别;在当前用户的用户数据命中第一匹配规则时,则该当前用户为第一类用户;在当前用户的用户数据命中第二匹配规则时,则该当前用户为第二类用户;在当前用户的用户数据同时命中第二匹配规则和第三匹配规则时,则该当前用户为第三类用户。
优选地,还包括:提取规则包括时间参数、事件参数、根据时间参数和/或事件参数提取,所述时间参数包括自资源配额授予节点起特定时间段内、自资源配额授予节点起到第一次资源使用行为的发生时间的时间段内、自第一次资源使用行为的发生时间起特定时间段内;所述事件参数包括判断是否为新用户、有无逾期数据、有无违约数据、有无催收数据、是否有多头用户;通过所述提取规则,提取用户的时间特征数据和事件特征数据。
在本示例中,还包括:获取当前用户的用户数据,使用所述提取规则,提取该当前用户的时间特征数据、事件特征数据;使用匹配规则,确定该当前用户所对应的子预测模型,并使用所确定的子预测模型,输入当前用户的时间特征数据和事件特征数据,计算所述当前用户的金融预测值。
进一步地,还包括:设定评价指标,通过计算所述评价指标,对各子预测模型进行模型参数调整,所述评价指标包括ROC指标、AUC指标。
需要说明的是,在实施例2中,省略了与实施例1相同的部分的说明。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
与现有技术相比,本发明能够从金融时间节点等的时间维度、交易维度、数据维度(特别是用户资源使用表现数据类型及同一类型用户资源使用表现数据数量)等多维度提取用户数据,能够更精确地实现用户群的细分类;通过使用评价指标,选定测试数据集对各子预测模型进行评价,能够进一步优化模型参数,并能够提高模型精度;建立与不同用户群相对应的子预测模型,能够更精确地预测用户的风险情况,提高了各子预测模型的预测精度,还降低了金融服务机构的金融风险损失。
实施例3
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图7是根据本发明的一种电子设备的示例性实施例的结构框图。下面参照图7来描述根据本发明该实施例的的电子设备200。图7显示的电子设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述电子设备的处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图1所示的步骤。
所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。
所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法。
如图8所示,所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于金融时间节点的金融风险预测方法,其特征在于,包括:
根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集,所述历史用户为具有资源配额且具有资源使用行为的历史用户,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点;
建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型;
根据匹配规则,判断与当前用户相匹配的子预测模型;
使用所匹配的子预测模型,对所述当前用户进行金融风险预测。
2.根据权利要求1所述的金融风险预测方法,其特征在于,包括:
设定匹配规则,所述匹配规则包括在距资源配额授予节点的特定时间段内发生资源使用行为的次数、第一次资源使用行为的发生时间、第二次资源使用行为的发生时间。
3.根据权利要求2所述的金融风险预测方法,其特征在于,所述匹配规则还包括第一匹配规则、第二匹配规则和第三匹配规则,其中,
该第一匹配规则为判断当前用户是否在距资源配额授予节点的特定时间段内发生了一次资源使用行为;
该第二匹配规则判断当前用户是否在距资源配额授予节点的特定时间段内发生了两次资源使用行为且第二次资源使用行为的发生时间在自第一次资源使用行为的发生时间起特定时间段内;
该第三匹配规则为判断当前用户在距资源配额授予节点的特定时间段内发生资源使用的次数是否超过特定次数。
4.根据权利要求3所述的金融风险预测方法,其特征在于,还包括:
在当前用户的用户数据命中第一匹配规则时,则该当前用户为第一类用户;
在当前用户的用户数据命中第二匹配规则时,则该当前用户为第二类用户;
在当前用户的用户数据同时命中第二匹配规则和第三匹配规则时,则该当前用户为第三类用户。
5.根据权利要求1或4所述的金融风险预测方法,其特征在于,还包括:
提取规则包括时间参数、事件参数、根据时间参数和/或事件参数提取,所述时间参数包括自资源配额授予节点起特定时间段内、自资源配额授予节点起到第一次资源使用行为的发生时间的时间段内、自第一次资源使用行为的发生时间起特定时间段内;所述事件参数包括判断是否为新用户、有无逾期数据、有无违约数据、有无催收数据、是否有多头用户;
通过所述提取规则,提取用户的时间特征数据和事件特征数据。
6.根据权利要求5所述的金融风险预测方法,其特征在于,还包括:
获取当前用户的用户数据,使用所述提取规则,提取该当前用户的时间特征数据、事件特征数据;
使用匹配规则,确定该当前用户所对应的子预测模型,并使用所确定的子预测模型,输入当前用户的时间特征数据和事件特征数据,计算所述当前用户的金融预测值。
7.根据权利要求1所述的金融风险预测方法,其特征在于,还包括:
设定评价指标,通过计算所述评价指标,对各子预测模型进行模型参数调整,所述评价指标包括ROC指标、AUC指标。
8.一种基于金融时间节点的金融风险预测装置,其特征在于,包括:
数据处理模块,根据基于历史用户在金融时间节点的提取规则建立多个子训练数据集,所述历史用户为具有资源配额且具有资源使用行为的历史用户,所述金融时间节点包括资源配额授予节点、资源使用节点和资源归还节点;
模型建立模块,用于建立与各子训练数据集相对应的多个子预测模型,并使用相应子训练数据集训练对应子预测模型;
判断模块,根据匹配规则,判断与当前用户相匹配的子预测模型;
预测模块,使用所匹配的子预测模型,对所述当前用户进行金融风险预测。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的基于金融时间节点的金融风险预测方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的基于金融时间节点的金融风险预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110166441.9A CN112488865A (zh) | 2021-02-05 | 2021-02-05 | 基于金融时间节点的金融风险预测方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110166441.9A CN112488865A (zh) | 2021-02-05 | 2021-02-05 | 基于金融时间节点的金融风险预测方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112488865A true CN112488865A (zh) | 2021-03-12 |
Family
ID=74912454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110166441.9A Pending CN112488865A (zh) | 2021-02-05 | 2021-02-05 | 基于金融时间节点的金融风险预测方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112488865A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570114A (zh) * | 2021-07-02 | 2021-10-29 | 上海淇玥信息技术有限公司 | 一种资源服务智能匹配方法、系统和计算机设备 |
CN113592160A (zh) * | 2021-07-13 | 2021-11-02 | 北京淇瑀信息科技有限公司 | 基于融合处理的用户设备的失联风险预测方法、系统和计算机设备 |
-
2021
- 2021-02-05 CN CN202110166441.9A patent/CN112488865A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570114A (zh) * | 2021-07-02 | 2021-10-29 | 上海淇玥信息技术有限公司 | 一种资源服务智能匹配方法、系统和计算机设备 |
CN113592160A (zh) * | 2021-07-13 | 2021-11-02 | 北京淇瑀信息科技有限公司 | 基于融合处理的用户设备的失联风险预测方法、系统和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112270545A (zh) | 基于迁移样本筛选的金融风险预测方法、装置和电子设备 | |
CN110349009B (zh) | 一种多头借贷违约预测方法、装置和电子设备 | |
CN112508695A (zh) | 基于市场风险的金融风险预测方法、装置和电子设备 | |
CN112508723B (zh) | 基于自动择优建模的金融风险预测方法、装置和电子设备 | |
CN112508580A (zh) | 基于拒绝推断方法的模型构建方法、装置和电子设备 | |
CN112507628B (zh) | 基于深度双向语言模型的风险预测方法、装置和电子设备 | |
CN110706096A (zh) | 基于捞回用户管理授信额度的方法、装置和电子设备 | |
CN111967954A (zh) | 一种资源归还增比确定方法、装置和电子设备 | |
CN112015562A (zh) | 基于迁移学习的资源分配方法、装置及电子设备 | |
CN111967543A (zh) | 用户资源配额确定方法、装置及电子设备 | |
CN111598677A (zh) | 一种资源配额确定方法、装置和电子设备 | |
CN112488865A (zh) | 基于金融时间节点的金融风险预测方法、装置和电子设备 | |
CN112017042A (zh) | 基于tweedie分布的资源配额确定方法、装置和电子设备 | |
CN111597343B (zh) | 一种基于app的智能化用户职业判断方法、装置和电子设备 | |
CN112015977A (zh) | 一种定制信息推送方法、装置和电子设备 | |
CN112348659A (zh) | 用户风险识别策略的分配方法、装置及电子设备 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN111353872A (zh) | 一种基于金融表现值的授信处理的方法、装置和电子设备 | |
CN110689425A (zh) | 基于收益进行额度定价的方法、装置和电子设备 | |
CN110675250A (zh) | 一种基于用户营销评分的信贷额度管理的方法、装置和电子设备 | |
CN111582649B (zh) | 基于用户app独热编码的风险评估方法、装置和电子设备 | |
CN110782128B (zh) | 一种用户职业标签生成方法、装置和电子设备 | |
CN112508690A (zh) | 一种基于联合分布适配的风险评估方法、装置和电子设备 | |
CN113298120B (zh) | 基于融合模型的用户风险预测方法、系统和计算机设备 | |
CN111626528A (zh) | 一种基于贝塞尔曲线的资源配额确定方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |