CN118052558A - 基于人工智能的风控模型决策方法及系统 - Google Patents
基于人工智能的风控模型决策方法及系统 Download PDFInfo
- Publication number
- CN118052558A CN118052558A CN202410445891.5A CN202410445891A CN118052558A CN 118052558 A CN118052558 A CN 118052558A CN 202410445891 A CN202410445891 A CN 202410445891A CN 118052558 A CN118052558 A CN 118052558A
- Authority
- CN
- China
- Prior art keywords
- abnormal
- data
- model
- transaction
- wind control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 35
- 230000002159 abnormal effect Effects 0.000 claims abstract description 473
- 238000003066 decision tree Methods 0.000 claims abstract description 72
- 238000012545 processing Methods 0.000 claims abstract description 42
- 238000012937 correction Methods 0.000 claims abstract description 41
- 238000010276 construction Methods 0.000 claims abstract description 23
- 230000010354 integration Effects 0.000 claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims description 66
- 230000008859 change Effects 0.000 claims description 55
- 230000008569 process Effects 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000007477 logistic regression Methods 0.000 claims description 17
- 238000012216 screening Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 16
- 230000000007 visual effect Effects 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000013508 migration Methods 0.000 claims description 11
- 230000005012 migration Effects 0.000 claims description 11
- 238000001228 spectrum Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 19
- 238000001514 detection method Methods 0.000 description 9
- 238000007726 management method Methods 0.000 description 7
- 230000005856 abnormality Effects 0.000 description 6
- 238000012502 risk assessment Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000010419 fine particle Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012954 risk control Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000002547 anomalous effect Effects 0.000 description 2
- 238000012550 audit Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及风控技术领域,尤其涉及一种基于人工智能的风控模型决策方法及系统。所述方法包括以下步骤:对交易记录数据进行长短时记忆网络模型构建,得到异常记忆网络模型;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,获取标记阈值反馈数据;对标记阈值反馈数据进行动态因子模型构建,获取异常因子修正模型;对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,获取局部决策树模型集;对局部决策树模型集进行模型集成,得到风控决策模型。本发明能够实现高效的、可解释的交易欺诈风控决策。
Description
技术领域
本发明涉及风控技术领域,尤其涉及一种基于人工智能的风控模型决策方法及系统。
背景技术
基于人工智能的风控技术是金融风险控制领域的重要技术之一,越来越广泛地应用于风险评估、信用评分和反欺诈等场景,然而,随着金融行业与互联网相结合的趋势愈加明显,基于人工智能的风控模型决策技术的优势和劣势也愈加明显起来,在交易欺诈等交易场景中,现有的基于人工智能的风控模型存在着模型解释性差、可迁移性差等问题,极大的影响了决策依据的透明性和检测异常交易的模型迭代性能。
发明内容
基于此,本发明有必要提供一种基于人工智能的风控模型决策方法,以解决至少一个上述技术问题。
为实现上述目的,一种基于人工智能的风控模型决策方法,包括以下步骤:
步骤S1:获取交易记录数据;对交易记录数据进行细粒度缩放处理,从而获取异常细粒度数据;对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型;
步骤S2:获取用户实时交易数据;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据;
步骤S3:对标记阈值反馈数据进行动态因子模型构建,从而获取异常因子修正模型;
步骤S4:对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,从而获取局部决策树模型集;对局部决策树模型集进行模型集成,从而得到风控决策模型;对风控决策模型进行风控决策参数调整,并记录至风控系统中。
本发明首先通过获取交易记录数据,可以对历史的交易行为进行分析和挖掘,从中发现交易的规律和特征,为后续的风控模型提供数据基础。通过对交易记录数据进行细粒度缩放处理,可以将交易数据划分为不同的时间尺度和空间范围,从而提高数据的敏感性和区分度,更容易发现异常的交易行为。通过对异常细粒度数据进行长短时记忆网络模型构建,可以利用深度学习的方法,对异常交易数据进行序列建模,从而捕捉交易数据的时序特征和动态变化,为风控模型提供异常的时序记忆能力。通过获取用户实时交易数据,可以对用户的当前的交易行为进行实时监测和评估,从中发现潜在的风险和问题,为后续的风控模型提供数据输入。通过基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,可以利用异常记忆网络模型的输出,对用户实时交易数据进行风险评估和分类,从而得到不同阈值等级的交易数据,提高风控模型的风险识别的精确性。通过对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,可以利用交易异常反馈的信息,为后续进行模型迭代提供保障,从而得到更准确和有效的风控决策。通过对标记阈值反馈数据进行动态因子模型构建,可以利用统计学的方法,对标记阈值反馈数据进行因子分析,从中提取影响交易异常的主要因子,从而提高减少模型的过拟合错误。通过获取异常因子修正模型,可以利用异常因子修正模型的输出,对异常记忆网络模型进行修正和补充,从而得到更全面和综合的风控模型。通过对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,可以利用机器学习的方法,对异常记忆网络模型以及异常因子修正模型的输出进行决策树分割,从而得到不同的局部决策树模型,为风控模型提供局部决策的可解释性。通过对局部决策树模型集进行模型集成,可以利用模型集成的方法,对局部决策树模型集进行加权和融合,从而得到更稳定和可靠的风控决策模型,为风控模型提供模型集成能力。通过对风控决策模型进行风控决策参数调整,并记录至风控系统中,可以利用风控决策模型的输出,对风控系统进行风控决策参数的更新和保存,从而实现风控系统的实时响应和持续优化。
优选地,本发明还提供了一种基于人工智能的风控模型决策系统,用于执行如上所述的基于人工智能的风控模型决策方法,该基于人工智能的风控模型决策系统包括:
记忆模型构建模块,用于获取交易记录数据;对交易记录数据进行细粒度缩放处理,从而获取异常细粒度数据;对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型;
异常反馈标记模块,用于获取用户实时交易数据;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据;
异常因子修正模块,用于对标记阈值反馈数据进行动态因子模型构建,从而获取异常因子修正模型;
局部决策树构建模块,用于对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,从而获取局部决策树模型集;对局部决策树模型集进行模型集成,从而得到风控决策模型;对风控决策模型进行风控决策参数调整,并记录至风控系统中。
综上所述,本发明提供了一种基于人工智能的风控模型决策系统,该基于人工智能的风控模型决策系统由记忆模型构建模块、异常反馈标记模块、异常因子修正模块、以及局部决策树构建模块组成,能够实现本发明所述任意一种基于人工智能的风控模型决策方法,系统内部结构互相协作,通过采用历史交易数据进行长短时记忆网络模型的构建,增加了交易在时间尺度上的可参考依据,通过异常反馈机制来快速、高效地迭代新的模型,并通过局部决策树的异常识别决策的可解释能力,提高了风控模型决策的透明性,从而简化了基于人工智能的风控模型决策系统的操作流程。
附图说明
通过阅读参照以下附图所作的对非限制性实施所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明所述基于人工智能的风控模型决策方法的步骤流程示意图;
图2为图1中步骤S1的详细步骤流程示意图;
图3为图2中步骤S14的详细步骤流程示意图。
具体实施方式
下面结合附图对本发明专利的技术方法进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器方法和/或微控制器方法中实现这些功能实体。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
为实现上述目的,请参阅图1至图3,本发明提供了一种基于人工智能的风控模型决策方法,所述方法包括以下步骤:
步骤S1:获取交易记录数据;对交易记录数据进行细粒度缩放处理,从而获取异常细粒度数据;对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型;
步骤S2:获取用户实时交易数据;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据;
步骤S3:对标记阈值反馈数据进行动态因子模型构建,从而获取异常因子修正模型;
步骤S4:对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,从而获取局部决策树模型集;对局部决策树模型集进行模型集成,从而得到风控决策模型;对风控决策模型进行风控决策参数调整,并记录至风控系统中。
本发明实施例中,请参考图1所示,为本发明所述基于人工智能的风控模型决策方法的步骤流程示意图,在本实例中,所述基于人工智能的风控模型决策方法的步骤包括:
步骤S1:获取交易记录数据;对交易记录数据进行细粒度缩放处理,从而获取异常细粒度数据;对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型;
本发明实施例通过从可靠的数据源获取交易记录数据,包括交易金额、交易时间等相关信息,数据源可以是系统提供的API接口等,对获取的交易记录数据进行细粒度缩放处理,将交易金额等数值特征归一化到合适的范围,将更细粒度化的特征提取出来并进行特征缩放,以保证特征的数量和低噪,使用长短时记忆(LSTM)网络模型对异常细粒度数据进行建模。LSTM是一种适用于序列数据建模的深度学习模型,它能够捕捉到序列数据中的时序依赖关系。
步骤S2:获取用户实时交易数据;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据;
本发明实施例通过获取用户的实时交易数据,包括交易金额、交易时间等信息。这些数据可以通过接入交易系统或者第三方支付平台等方式获取。基于预先构建的异常记忆网络模型,对用户实时交易数据进行阈值等级标记。根据模型学习到的异常模式和规律,将每笔交易标记为不同的阈值等级,也可以根据专家领域知识动态的调整模型参数,以达到阈值等级符合实际生产情况的异常检测要求,如,可以将异常的等级分为低风险、中风险、高风险和无风险等,而每个风险等级的结果均由异常记忆网络模型通过计算所有用户在过去的交易行为的特征得出。对标记阈值交易数据进行交易异常反馈处理,识别出异常交易,如涉及可疑金额、异常交易时间等。同时,将异常交易信息发送给风控系统进行记录和进一步的处理,风控系统接收到反馈后可以及时对异常交易进行拦截和审核,并将该交易的人工审核结果保存至系统的数据库中,为后续更新迭代新的优化模型提供数据基础。在数据库收集得到了足够多的被模型标记为异常的交易或人工主动干预模型更新之后,则对系统发起异常反馈记录请求,从而获取标记阈值反馈数据。
步骤S3:对标记阈值反馈数据进行动态因子模型构建,从而获取异常因子修正模型;
本发明实施例通过使用标记阈值反馈数据,包括异常交易信息和反馈结果,作为训练数据集,基于这些训练数据,构建动态因子模型。动态因子模型是一种能够根据实时数据动态调整的模型,它可以捕捉到交易数据中的变化和趋势,通过训练动态因子模型,得到异常因子修正模型。该模型可以根据实时交易数据中的动态因子,对异常交易进行修正和调整。
步骤S4:对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,从而获取局部决策树模型集;对局部决策树模型集进行模型集成,从而得到风控决策模型;对风控决策模型进行风控决策参数调整,并记录至风控系统中。
本发明实施例通过使用异常记忆网络模型和异常因子修正模型,分别构建局部决策树,根据异常记忆网络模型和异常因子修正模型的输出结果,对局部决策树进行构建和训练。这些决策树将根据不同的特征和条件进行分支判断,从而得到细粒度的风险评估结果。构建多个局部决策树,形成局部决策树模型集。通过引入多个决策树,可以综合考虑不同的特征和条件,对局部决策树模型集进行模型集成,可以采用投票、加权平均等方式,综合多个决策树的结果,得到最终的风控决策模型。对风控决策模型进行风控决策参数调整,可以根据实际需求和业务场景,对模型的阈值、权重等参数进行调整,以满足不同的风险控制要求,这一步可选,将调整后的风控决策参数记录至风控系统中,以便实时应用和监控。这样可以确保风控模型的持续性和灵活性,在实际应用中进行风险决策和风险管理。
本发明首先通过获取交易记录数据,可以对历史的交易行为进行分析和挖掘,从中发现交易的规律和特征,为后续的风控模型提供数据基础。通过对交易记录数据进行细粒度缩放处理,可以将交易数据划分为不同的时间尺度和空间范围,从而提高数据的敏感性和区分度,更容易发现异常的交易行为。通过对异常细粒度数据进行长短时记忆网络模型构建,可以利用深度学习的方法,对异常交易数据进行序列建模,从而捕捉交易数据的时序特征和动态变化,为风控模型提供异常的时序记忆能力。通过获取用户实时交易数据,可以对用户的当前的交易行为进行实时监测和评估,从中发现潜在的风险和问题,为后续的风控模型提供数据输入。通过基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,可以利用异常记忆网络模型的输出,对用户实时交易数据进行风险评估和分类,从而得到不同阈值等级的交易数据,提高风控模型的风险识别的精确性。通过对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,可以利用交易异常反馈的信息,为后续进行模型迭代提供保障,从而得到更准确和有效的风控决策。通过对标记阈值反馈数据进行动态因子模型构建,可以利用统计学的方法,对标记阈值反馈数据进行因子分析,从中提取影响交易异常的主要因子,从而提高减少模型的过拟合错误。通过获取异常因子修正模型,可以利用异常因子修正模型的输出,对异常记忆网络模型进行修正和补充,从而得到更全面和综合的风控模型。通过对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,可以利用机器学习的方法,对异常记忆网络模型以及异常因子修正模型的输出进行决策树分割,从而得到不同的局部决策树模型,为风控模型提供局部决策的可解释性。通过对局部决策树模型集进行模型集成,可以利用模型集成的方法,对局部决策树模型集进行加权和融合,从而得到更稳定和可靠的风控决策模型,为风控模型提供模型集成能力。通过对风控决策模型进行风控决策参数调整,并记录至风控系统中,可以利用风控决策模型的输出,对风控系统进行风控决策参数的更新和保存,从而实现风控系统的实时响应和持续优化。
作为本发明的一个实施例,参考图2所示,为图1中步骤S1的详细步骤流程示意图,在本实施例中步骤S1包括以下步骤:
步骤S11:获取交易记录数据;
步骤S12:对交易记录数据进行异常特征聚类,从而获取异常聚类数据;
步骤S13:根据异常聚类数据对交易记录数据进行数据集划分,从而获取无异常数据集、异常数据集以及实际异常比例数据集;
步骤S14:对无异常数据集、异常数据集以及实际异常比例数据集进行细粒度缩放处理,从而获取异常细粒度数据;
步骤S15:对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型。
本发明实施例通过获取交易记录数据,确保获取的交易记录数据的完整性和准确性,通过数据清洗和预处理等方法进行数据质量的检查和修正。对交易记录数据进行异常特征聚类,使用聚类算法,如K-means、DBSCAN等,对交易记录数据进行异常特征聚类,在聚类过程中,将异常交易记录划分到独立的聚类簇中,形成异常聚类数据集。根据异常聚类数据对交易记录数据进行数据集划分,根据异常聚类数据的结果,将交易记录数据划分为无异常数据集和异常数据集,无异常数据集只包含正常的交易记录,而异常数据集只包含被聚类为异常的交易记录,可以根据实际异常比例,从异常数据集中抽取一定比例的样本,形成实际异常比例数据集,以便后续模型评估和调整。对无异常数据集、异常数据集以及实际异常比例数据集中的交易金额等数值特征进行细粒度缩放处理,对异常细粒度数据进行长短时记忆网络模型构建,异常记忆网络模型可以通过学习异常交易数据中的特征和模式,提供对未知异常的识别和预测能力。
本发明首先通过收集大量的交易记录数据,包括交易时间、金额等信息。通过获取交易记录数据,可以建立一个全面的数据库,为后续的风控模型构建提供丰富的数据基础;利用异常特征聚类的方法对交易记录数据进行分析和处理,可以将异常交易从正常交易中区分出来,并形成异常聚类数据,从而能够识别出潜在的风险交易,为后续的风控决策提供准确的异常数据。通过根据异常聚类数据进行数据集划分,可以将交易记录数据划分为无异常数据集、异常数据集和实际异常比例数据集,从而能够针对不同类型的数据进行不同的处理和分析,从而更好地了解风险情况和异常比例。通过对无异常数据集、异常数据集和实际异常比例数据集进行细粒度缩放处理,可以将数据统一到一个合适的尺度上,从而能够消除数据之间的差异,使得不同数据集之间可以进行有效的比较和分析,得到更准确的异常细粒度数据。通过对异常细粒度数据进行长短时记忆网络模型的构建,可以建立一个能够捕捉时间序列关系的模型,从而能够学习和记忆异常交易的模式和规律,从而能够更准确地进行风险预测和决策。
作为本发明的一个实施例,参考图3所示,为图2中步骤S14的详细步骤流程示意图,在本实施例中步骤S14包括以下步骤:
步骤S141:对实际异常比例数据集进行时序异常变化分析,从而获取时序异常变化数据,其中时序异常变化分析包括交易金额特征分析、交易频率特征分析以及交易身份特征分析,其中交易身份特征分析包括历史信用等级分析、历史交易金额特征分析以及历史交易频率特征分析;
步骤S142:对时序异常变化数据进行异常趋势的三维模型构建,从而获取异常趋势三维模型;
步骤S143:基于异常趋势三维模型对无异常数据集以及异常数据集进行细粒度缩放处理,从而获取异常细粒度数据。
本发明实施例通过对实际异常比例数据集中的交易金额特征进行时序分析,包括统计每个时间段内的交易金额总和、平均值、方差、最大值、最小值等指标,并观察其变化趋势和异常情况,对实际异常比例数据集中的交易频率特征进行时序分析,包括统计每个时间段内的交易数量、交易频率、交易间隔等指标,并观察其变化趋势和异常情况,对实际异常比例数据集中的交易身份特征进行时序分析,包括历史信用等级分析(如信用评分的变化)、历史交易金额特征分析(如每个交易身份的交易金额统计指标)以及历史交易频率特征分析(如每个交易身份的交易频率统计指标),并观察其变化趋势和异常情况。将时序异常变化数据进行三维建模,其中横轴表示交易金额特征相关的异常趋势特征,纵轴表示交易频率特征相关的异常趋势特征,第三个维度表示交易身份特征相关的异常趋势特征。可以使用可视化工具或统计分析方法,将时序异常变化数据映射到一个三维坐标系中,形成异常趋势的三维模型。基于异常趋势三维模型,将无异常数据集和异常数据集中的交易金额特征和交易频率特征进行细粒度缩放处理。
本发明首先通过对实际异常比例数据集进行时序异常变化分析,可以探索交易数据在时间上的变化趋势,从而揭示潜在的异常行为,具体地,交易频率特征分析可以揭示交易频率在时间上的变化趋势。通过分析交易的频繁程度、交易次数的增减趋势,可以发现异常的交易频率模式,例如异常高频交易或异常低频交易。这可以帮助识别出异常活动,例如刷卡行为或异常的交易行为。交易身份特征分析涉及对交易参与者的历史信息进行分析。通过历史信用等级分析,可以评估交易参与者的信用状况,以便更好地识别潜在的高风险交易。历史交易金额特征分析和历史交易频率特征分析可以揭示交易参与者在过去的交易中的行为模式和习惯。这些信息可以用于与当前交易进行比较,以检测出异常的交易身份或异常的交易行为。通过对时序异常变化数据进行异常趋势的三维模型构建,可以将异常变化在三个维度上进行描述,即与交易金额相关的重要的异常趋势特征、与交易频率相关的重要的异常趋势特征以及与交易用户相关的重要的异常趋势特征,其中时间维度直接在趋势特征中体现,不在三维模型中直接体现。这种三维模型可以提供更全面的视角来理解异常交易的变化趋势。通过可视化异常趋势,可以更容易地发现异常交易的模式、周期性或趋势,基于异常趋势三维模型的细粒度缩放处理可以将无异常数据集和异常数据集调整到相同的尺度上,以便进行后续的分析和处理,即能够消除不同数据集之间的差异,使得它们可以进行有效的比较和分析。获取到异常细粒度数据后,可以更准确地描述和识别异常交易行为,为风控决策提供更有利的信息。
优选地,步骤S142包括以下步骤:
步骤S1421:对时序异常变化数据进行时间滑窗的非线性时序聚类,从而得到时序聚类变化数据;
步骤S1422:利用线性逻辑回归算法对时序聚类变化数据进行多维度合并,从而得到三维度合并回归模型;
步骤S1423:基于三维度合并回归模型得到三维度合并相关系数;
步骤S1424:根据三维度合并相关系数对时序聚类变化数据进行异常趋势的三维模型构建,从而获取异常趋势三维模型。
本发明实施例通过将时序异常变化数据进行时间滑窗操作,将数据分割为多个时间窗口,每个窗口包含一段时间内的异常变化数据,使用非线性时序聚类算法,如DBSCAN、OPTICS等,对每个时间窗口中的异常变化数据进行聚类分析,非线性时序聚类算法可以根据异常变化数据的相似性将其聚集在一起,形成时序聚类变化数据,每个聚类簇代表一种异常趋势模式,对时序聚类变化数据中的每个聚类簇,提取多个特征维度,主要包括交易金额相关特征维度、交易频率相关特征维度、交易身份相关特征维度,使用线性逻辑回归算法对每个聚类簇的多维度特征进行合并,构建回归模型,以预测该聚类簇的异常趋势,多维度合并回归模型可以通过考虑不同特征之间的关联性,提供更准确的异常趋势预测能力,基于三维度合并回归模型,计算三维特征中与其异常趋势相关的各个特征维度之间的相关系数,(不包括交易金额、交易频率、交易身份特征之间的异常趋势特征的相关性分析,如交易用户的历史信用分数的变化特征以及交易金额的波动规律的变化特征),通过计算三维度合并相关系数,可以进一步分析不同特征对异常趋势的贡献程度,基于三维度合并相关系数,对时序聚类变化数据进行加权处理,根据不同特征的贡献程度赋予不同权重,将加权后的时序聚类变化数据映射到一个三维坐标系中,其中坐标轴分别表示交易金额特征、交易频率特征和交易身份特征。
本发明首先通过对时序异常变化数据进行时间滑窗的非线性时序聚类,可以将连续的时间序列数据分割成不同的窗口,并将相似的窗口聚类在一起。这种非线性时序聚类可以帮助识别出具有相似变化模式的异常数据集合。利用线性逻辑回归算法对时序聚类变化数据进行多维度合并,可以将不同维度的数据进行整合和组合。通过线性逻辑回归算法,可以建立一个回归模型,将多个维度的异常变化数据进行综合分析,将多个维度的信息融合在一起,将多个特征维度融合为主要的三个重要维度,减少后续的特征噪音以及训练模型的计算量。基于三维度合并回归模型,可以计算出三维度合并相关系数。这些相关系数能够量化不同维度之间的关联程度,从而揭示异常趋势的复杂性和多样性。根据三维度合并相关系数,可以对时序聚类变化数据进行异常趋势的三维模型构建,以更好地理解异常趋势的演变和变化规律。
优选地,步骤S1422中的线性逻辑回归算法如下所示:
;
式中,表示逻辑回归模型的对数似然函数,/>表示时序聚类变化数据的聚类序列的个数,/>表示第/>个聚类序列的标签值,/>表示线性逻辑回归的权重向量,/>是每个聚类序列的窗口连续时间点的个数,/>表示第/>个聚类序列中第/>个时间点的特征向量,/>表示线性逻辑回归的偏置项。
本发明构造了一种对时序聚类变化数据更适应的对数似然函数公式,该函数用于衡量模型的拟合程度。通过最大化对数似然函数,可以优化模型参数,使其更好地拟合训练数据。最大化对数似然函数对应于最小化误差,从而提高模型的准确性。聚类序列个数表示时序聚类变化数据中聚类序列的个数,较大的聚类序列个数可以提供更多的样本信息,有助于模型训练和泛化能力的提升。/>表示第/>个聚类序列的标签值,标签值是逻辑回归模型训练的目标,它提供了样本的类别信息,有助于模型学习样本的分类规律,/>表示线性逻辑回归的权重向量,用于线性组合特征向量以进行分类,权重向量决定了各个特征对分类结果的贡献程度,通过优化权重向量可以提高模型的分类准确性。/>表示每个聚类序列的窗口连续时间点的个数。窗口的选择可以影响模型对时序数据的建模能力。较大的窗口可以提供更多的时序信息,有助于捕捉异常趋势的特征。/>表示第/>个聚类序列中第/>个时间点的特征向量。特征向量包含了描述时序数据的各个特征,通过对特征向量进行线性组合,模型可以学习特征与分类结果之间的关系。该公式结合了逻辑回归模型的对数似然函数和线性组合的形式,通过最大化对数似然函数来优化权重向量和偏置项,从而实现对时序聚类变化数据的分类。这种结构使得模型能够从特征向量中学习到对分类结果有影响的因素,并进行合理的线性组合,从而提高模型的分类准确性。需要注意的是,该公式可以更适应本发明所述场景中的逻辑回归模型的构建,但也可以不使用该公式去构建该逻辑回归模型,也可以使用常规的似然法或梯度下降算法等进行计算。
优选地,步骤S143包括以下步骤:
步骤S1431:基于异常趋势三维模型对无异常数据集以及异常数据集进行交易金额波动分析,从而获取金额波动分析数据;基于异常趋势三维模型对无异常数据集以及异常数据集进行交易频率波动分析,从而获取交易波动分析数据;
步骤S1432:对金额波动分析数据以及交易波动分析数据进行峰值趋势配对,从而获取趋势配对交易数据;
步骤S1433:基于异常趋势三维模型对趋势配对交易数据进行交易趋势变化时间的时间戳提取,从而获取异常交易时间戳数据;
步骤S1434:基于异常趋势三维模型并根据异常交易时间戳数据对无异常数据集以及异常数据集进行多维特征集提取,从而获取无异常特征数据集以及异常交易特征数据集;
步骤S1435:对无异常特征数据集以及异常交易特征数据集进行相似性筛选,从而获取相似筛选数据;
步骤S1436:根据相似筛选数据对异常交易特征数据集进行重要特征过滤,从而得到交易重要异常数据;
步骤S1437:对交易重要异常数据进行细粒度缩放处理,从而获取异常细粒度数据。
本发明实施例通过利用异常趋势三维模型,将无异常数据集和异常数据集映射到三维坐标系中,对映射后的数据集进行交易金额波动分析,通过计算每个数据点在交易金额维度上的波动程度,得到金额波动分析数据,同样地,对映射后的数据集进行交易频率波动分析,计算每个数据点在交易频率维度上的波动程度,得到交易波动分析数据,对金额波动分析数据和交易波动分析数据进行峰值检测,找出其中的波动峰值点,根据异常趋势三维模型,将峰值点映射到三维坐标系中,获取其在交易金额、交易频率和交易身份特征上的数值,根据这些数值进行趋势配对,将具有相似趋势的波动峰值点进行配对,得到趋势配对交易数据。对趋势配对交易数据中的每个配对进行异常趋势分析,基于异常趋势三维模型,提取每个配对的交易趋势变化时间,即异常交易的时间戳数据。基于异常趋势三维模型,将无异常数据集和异常数据集映射到三维坐标系中,根据异常交易时间戳数据,将无异常数据集中与异常交易时间戳相匹配的数据点提取出来,形成无异常特征数据集。同样地,将异常数据集中与异常交易时间戳相匹配的数据点提取出来,形成异常交易特征数据集,对无异常特征数据集和异常交易特征数据集中的每个数据点,计算它们之间的相似性,可以使用各种相似性度量方法,如欧氏距离、余弦相似度等,来衡量数据点之间的相似程度,根据相似性的阈值,筛选出相似度高于阈值的数据点,形成相似筛选数据。对相似筛选数据中的异常交易特征数据集进行特征选择或特征重要性评估,可以使用特征选择算法,如卡方检验、信息增益等,来确定每个特征的重要性,而其中的重要特征选择的目标是根据无异常特征数据集以及异常交易特征数据集的相似性特征决定的,无异常特征中的异常特征如果与异常交易特征数据集的异常特征具有较强的相似性,则该特征不能直接作为异常交易特征数据集的异常特征判断标准或给该异常特征进行降级处理(即交易的风险判断中,虽然模型检测出该交易具有该特征,但可能不会给更高级的异常等级,最后具体的异常等级划分是根据模型对交易的特征风险趋势来综合判断的)。对交易重要异常数据进行细粒度缩放处理,从而获取异常细粒度数据,将其值映射到一个特定的范围内,可以使用最小-最大缩放或标准化方法,此时才进行细粒度特征提取并缩放的原因是为了减少其他冗余特征所带来的计算量过高的问题。
本发明首先通过分析交易金额的波动情况,可以了解交易金额的变化幅度和趋势,进一步揭示可能存在的异常情况。类似地,通过分析交易频率的波动情况,可以了解交易的变化频率和趋势,有助于发现异常交易行为。通过对金额波动分析数据和交易波动分析数据进行峰值趋势配对,可以识别出具有相似波动趋势的交易数据。这种趋势配对可以帮助发现异常交易中存在的特定模式或趋势,进一步提高异常交易的识别准确性。通过获取趋势配对交易数据,可以更好地理解异常交易的波动特征和规律。基于异常趋势三维模型,可以提取趋势配对交易数据中的交易趋势变化时间。这些时间戳提供了异常交易发生的具体时间信息,有助于进一步分析和定位异常交易行为。通过获取异常交易时间戳数据,可以精确记录和跟踪异常交易的时间发生情况。基于异常趋势三维模型和异常交易时间戳数据,可以对无异常数据集和异常数据集进行多维特征集提取。这些特征集提取操作可以根据异常交易的时间戳和其他相关特征,提取出更具有区分性的特征,用于区分正常交易和异常交易。通过获取无异常特征数据集和异常交易特征数据集,可以为后续的异常交易识别和分类提供有价值的特征信息。对无异常特征数据集和异常交易特征数据集进行相似性筛选,可以筛选出具有相似特征模式的数据。这种相似性筛选有助于发现异常交易之间的共同特征,提高异常交易的聚类准确性。通过获取相似筛选数据,可以更好地理解异常交易之间的关联性和相似性。通过根据相似筛选数据对异常交易特征数据集进行重要特征过滤,可以筛选出对异常交易识别和分类最具有重要性的特征。这个步骤有助于简化异常交易特征数据集,减少冗余信息,并提取出最具区分性的特征。通过获取交易重要异常数据,可以更准确地识别和分析异常交易行为。对交易重要异常数据进行细粒度缩放处理,可以对数据进行进一步的处理和调整,使其适应更细粒度的分析和处理需求。这个步骤可以根据具体情况对交易数据进行缩放、归一化或标准化等操作,以便更好地进行后续的异常交易分析和处理。通过获取异常细粒度数据,可以提供更详细和精确的异常交易信息,进一步支持风控决策和异常交易管理。
优选地,步骤S2包括以下步骤:
步骤S21:获取用户实时交易数据;
步骤S22:基于异常记忆网络模型对用户实时交易数据进行异常趋势阈值评估,从而获取异常阈值评估数据;
步骤S23:根据异常阈值评估数据对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据,并记录至风控系统中;
步骤S24:通过风控系统对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据。
本发明实施例通过获取用户实时交易数据,例如银行交易系统、支付平台等,以获取用户实时交易数据,使用适当的数据采集方法,例如API调用、数据流接收等,从数据源中获取实时交易数据。基于异常记忆网络模型对用户实时交易数据进行异常趋势阈值评估,将用户实时交易数据输入已训练好的模型,评估其是否超出正常趋势阈值,从而获取异常阈值评估数据。基于异常阈值评估数据,设定不同的阈值等级,例如高风险、中风险和低风险等级,将用户实时交易数据与阈值进行比较,根据超出阈值的程度和风险等级,对交易数据进行标记,将标记后的阈值交易数据记录至风控系统中,以便后续的交易异常反馈处理和记录。设计风控系统的处理逻辑和规则,用于检测和处理标记阈值交易数据中的异常情况,对标记阈值交易数据进行异常检测和分析,例如检测欺诈交易、异常交易行为等,根据异常检测结果,对异常交易进行相应的反馈处理,例如拒绝交易、触发风险警报等,同时,将异常反馈记录请求发送给风控系统,以更新异常反馈记录,用于后续的风险分析和改进。
本发明首先系统会获取用户的实时交易数据,这些数据包括交易金额、交易时间、交易对象等信息。通过获取实时交易数据,系统可以及时监控用户的交易行为,并进行后续的异常检测和处理。通过异常记忆网络模型,系统可以对用户的实时交易数据进行异常趋势阈值评估。该模型会基于历史数据和已知的异常模式,对当前的交易数据进行分析和比对,以确定异常交易的阈值。通过获取异常阈值评估数据,系统可以识别出潜在的异常交易行为。根据异常阈值评估数据,系统会对用户的实时交易数据进行阈值等级标记。这些标记可以根据异常交易的程度和风险等级,将交易数据分为不同的阈值等级。标记后的阈值交易数据将被记录至风控系统中,以备后续的风险管理和处理。通过风控系统对标记阈值交易数据进行交易异常反馈处理,系统会对异常交易进行进一步的分析和处理,例如触发警报、冻结账户、进行人工审核等。同时,系统还会向风控系统发送异常反馈记录请求,以便记录和更新异常交易的相关信息。通过获取标记阈值反馈数据,系统可以及时了解和处理异常交易情况,提高风险管理的效果。
优选地,步骤S3包括以下步骤:
步骤S31:对标记阈值反馈数据进行异常识别程度的数据集拆分,从而获取识别正确数据集以及识别错误数据集;
步骤S32:对识别正确数据集进行异常数据集筛选,从而获取第一异常数据集;对识别错误数据集进行异常数据集拆分,从而获取第二异常数据集以及无异常识别错误数据集;
步骤S33:根据第一异常数据集以及第二异常数据集对风控系统进行用户近期交易记录请求,从而获取第一交易记录数据以及第二交易记录数据;
步骤S34:对第一交易记录数据以及第二交易记录数据进行异常细粒度提取,从而获取第一细粒度数据以及第二细粒度数据;
步骤S35:对第一细粒度数据以及第二细粒度数据进行频率曲线转换,从而获取第一频率曲线数据以及第二频率曲线数据;
步骤S36:对第二细粒度数据进行异常识别程度的权重计算,从而获取异常错误识别权重;
步骤S37:根据异常错误识别权重对第二频率曲线数据进行峰值加权,从而获取第二细粒度加权数据;
步骤S38:对第一频率曲线数据以及第二细粒度加权数据进行傅里叶变换,从而得到异常细粒度频谱数据;
步骤S39:对异常细粒度频谱数据进行峰值偏差图转换,从而得到异常峰值偏差数据;
步骤S310:对异常峰值偏差数据以及无异常识别错误数据集进行动态因子模型构建,从而获取异常因子修正模型。
本发明实施例通过将标记阈值反馈数据集分为两个子数据集:识别正确数据集和识别错误数据集,对标记阈值反馈数据进行识别程度评估,即根据风控系统在人工审核后给出的风险评判,系统自动对结果进行纠正并把结果打包输入给已经预构建好的异常记忆网络模型进行评估,模型根据已经预设好的评估标注对数据集的交易识别进行评估,根据识别结果,将数据集拆分为识别正确数据集和识别错误数据集,对识别正确数据集进行异常数据集筛选,从而获取第一异常数据集;对识别错误数据集进行异常数据集拆分,从而获取第二异常数据集以及无异常识别错误数据集。根据第一异常数据集和第二异常数据集中的用户身份信息或交易标识,向风控系统发送请求,获取用户近期的交易记录数据。对第一交易记录数据和第二交易记录数据进行详细的数据预处理,包括数据清洗、特征提取等,根据异常细粒度的定义和需求,提取与异常相关的细粒度特征,形成第一细粒度数据和第二细粒度数据。对第一细粒度数据以及第二细粒度数据进行频率曲线转换,从而获取第一频率曲线数据以及第二频率曲线数据,对第二细粒度数据进行异常识别程度的权重计算,对第二细粒度数据进行异常识别程度的评估,根据异常识别结果,计算异常错误识别权重,用于后续的数据处理和修正。根据异常错误识别权重,对第二频率曲线数据进行加权处理,强调或削弱其中异常的峰值部分,对第一频率曲线数据和第二细粒度加权数据进行傅里叶变换,将其转换到频域,得到异常细粒度频谱数据,表示异常在频率上的分布情况。异常细粒度频谱数据进行峰值偏差图转换,根据异常细粒度频谱数据,计算每个频率上的峰值偏差,即异常与正常的差异程度与模型误判的差异程度的差值。对异常峰值偏差数据以及无异常识别错误数据集进行动态因子模型构建,可以是基于统计学或机器学习的模型,用于捕捉异常因子和修正异常识别错误,从而得到动态因子模型。
本发明首先通过对标记阈值反馈数据进行拆分,以区分识别正确和识别错误的数据集,对识别正确的数据集进行筛选,以获得第一异常数据集。同时,对识别错误的数据集进行拆分,分为第二异常数据集和无异常识别错误的数据集。这样可以进一步细分异常数据,为后续的分析和处理提供更准确的数据集,根据第一异常数据集以及第二异常数据集对风控系统进行用户近期交易记录请求,可以获取第一异常数据集和第二异常数据集所对应的用户近期交易记录数据。这些交易记录数据包括用户的交易时间、交易金额、交易对象等信息。对第一交易记录数据以及第二交易记录数据进行异常细粒度提取,这些数据包含了更具体的异常信息,有助于后续的分析和处理。通过对第一细粒度数据和第二细粒度数据进行频率曲线转换,系统可以得到第一频率曲线数据和第二频率曲线数据。这些频率曲线数据展示了异常交易在不同频率上的分布情况,有助于进一步分析异常交易的特征和模式。对第二细粒度数据进行异常识别程度的权重计算。通过计算每个数据点的异常识别程度权重,系统可以得到异常错误识别权重,用于后续的数据处理和模型构建。对第二频率曲线数据进行峰值加权处理。通过加权处理,系统可以得到第二细粒度加权数据,这些数据反映了异常交易在不同频率上的重要性,有助于进一步分析和建模。对第一频率曲线数据和第二细粒度加权数据进行傅里叶变换可以将它们转换为频谱数据。这些异常细粒度频谱数据展示了异常交易在频率域上的分布情况,有助于进一步分析异常交易的频域特征。对异常细粒度频谱数据进行峰值偏差图转换,从而得到异常峰值偏差数据。这些数据反映了异常交易在频谱上的峰值和偏差情况,有助于进一步分析和检测异常交易的波动性。对异常峰值偏差数据和无异常识别错误数据集进行动态因子模型构建,可以获取异常因子修正模型。该模型利用异常数据和正常数据的差异,帮助系统更精确地识别和修正异常交易,提高风险管理的准确性和效果。
优选地,步骤S4包括以下步骤:
步骤S41:对异常记忆网络模型进行对抗模型迁移,从而获取对抗模型;
步骤S42:对异常因子修正模型进行生成模型迁移,从而获取生成模型;
步骤S43:对对抗模型以及生成模型进行生成对抗训练,从而获取生成对抗网络模型;
步骤S44:对生成对抗网络模型进行局部性样本生成的决策解释,从而得到局部性决策解释数据;
步骤S45:对局部性决策解释数据进行局部特征梯度分析,从而得到局部梯度数据;
步骤S46:对局部梯度分析数据进行局部决策树构建,从而获取局部决策树模型集;
步骤S47:基于局部决策树模型集进行可视化树路径结构构建,从而获取可视化风险树模型;
步骤S48:对局部决策树模型集进行模型集成,从而得到风控决策模型;
步骤S49:基于可视化风险树模型对风控决策模型进行风控决策参数调整,并记录至风控系统中。
本发明实施例通过使用异常记忆网络模型作为基础模型,使用对抗训练的方法进行模型迁移,即引入对抗样本生成器,该生成器能够生成对抗样本,用于迫使模型更好地识别异常情况。使用异常因子修正模型作为基础模型,进行生成模型迁移,以获取生成模型。生成模型的目标是能够生成与异常数据相似的样本,以模拟真实的异常情况。将对抗模型和生成模型结合,进行生成对抗训练,生成对抗训练的目标是使生成器生成的样本更接近真实数据,同时使判别器更准确地区分真实数据和生成数据,最终得到生成对抗网络模型。使用生成对抗网络模型对具体样本进行局部性样本生成,并对其中的部分样本通过生成器生成局部性样本,对生成的局部性样本进行决策解释,分析生成对抗网络模型在该样本上的决策过程和依据,得到局部性决策解释数据,此处进行的样本分析越多,得到的决策依据的统计数据越清晰。对局部性决策解释数据进行局部特征梯度分析,通过计算模型在局部性样本上的梯度,分析模型对各个特征的敏感度和重要性。对局部梯度分析数据进行局部决策树构建,将局部梯度数据作为输入,构建决策树模型,以解释模型在局部性样本上的决策过程,针对不同的局部性样本,可以构建多个局部决策树模型。对局部决策树模型集进行可视化树路径结构构建,遍历每个局部决策树模型,提取树的路径结构和节点信息,根据树的路径结构和节点信息,构建可视化风险树模型,以直观展示决策过程和风险因素,可以使用图形库或可视化工具对可视化风险树模型进行展示和交互,以提高模型迭代、决策依据的可解释性,并通过决策的依据特征参数更好的记录下下次模型进行对抗训练迭代时的特征参数数据分布,以提高模型的迁移效率。对局部决策树模型集进行模型集成,可以采用投票、加权平均等集成方法,将各个局部决策树模型的决策结果进行综合,得到风控决策模型,该模型能够综合考虑各个局部决策树模型的判断和预测能力。基于可视化风险树模型对风控决策模型进行风控决策参数调整,根据可视化风险树模型的展示结果和决策路径,对模型的阈值、权重等参数进行调整,以优化决策准确性和风险控制能力,这一步可选,将调整后的风控决策参数记录至风控系统中。
本发明首先通过对异常记忆网络模型进行对抗模型迁移。对抗模型的目标是通过引入对抗性样本来提高模型的鲁棒性和泛化能力。通过对异常记忆网络模型进行对抗模型迁移,系统可以获取更具鲁棒性的对抗模型,用于后续的异常交易检测和风险管理。对异常因子修正模型进行生成模型迁移。生成模型的目标是通过学习数据的分布特征来生成新的样本数据。通过对异常因子修正模型进行生成模型迁移,系统可以获取生成模型,用于生成新的异常样本数据,以进一步丰富异常交易数据集,提高模型的鲁棒性和泛化能力。将对抗模型和生成模型进行生成对抗训练。生成对抗训练是一种通过对抗性优化的方式,让生成模型和对抗模型相互竞争和协作,以提高模型的质量和性能。通过训练过程,系统可以获取生成对抗网络模型,该模型结合了对抗模型和生成模型的优势,用于更准确地生成和检测异常交易数据。对生成对抗网络模型进行局部性样本生成的决策解释。通过解释生成对抗网络模型在生成异常样本时的决策过程,系统可以获得局部性决策解释数据。这些数据提供了关于模型在不同决策情况下的特征和权重信息,有助于进一步分析和理解异常样本的生成过程。对局部性决策解释数据进行局部特征梯度分析。通过分析局部决策解释数据中的特征梯度,系统可以获取局部梯度数据。这些数据提供了有关模型在特定决策点上对输入特征的敏感性和贡献度的信息,有助于进一步理解模型的决策规则和异常检测过程。利用局部梯度分析数据进行局部决策树的构建。通过构建局部决策树模型,系统可以将异常样本的决策过程可视化,并生成一个局部决策树模型集。这些局部决策树模型提供了模型在不同决策路径上的解释和解析,有助于进一步理解异常交易的检测和判定原因。基于局部决策树模型集进行可视化树路径结构构建。通过将局部决策树模型集的决策路径可视化,系统可以生成可视化风险树模型。可视化风险树模型提供了一种直观的方式来理解模型的决策过程和异常交易的风险因素。它能够帮助分析人员更好地理解模型的判定依据和风险评估结果。对局部决策树模型集进行模型集成。通过将局部决策树模型集合并并综合其决策结果,系统可以得到一个综合的风控决策模型。该风控决策模型结合了不同局部决策树模型的优势,可以更全面地评估异常交易的风险,并做出相应的决策和控制措施。基于可视化风险树模型对风控决策模型进行风控决策参数调整。通过分析可视化风险树模型的结构和决策路径,系统可以针对具体的风险因素和决策需求进行参数调整,以优化风控决策模型的性能和准确度。调整后的参数将被记录至风控系统中,以供实际应用和风险管理使用。
优选地,本发明还提供了一种基于人工智能的风控模型决策系统,用于执行如上所述的基于人工智能的风控模型决策方法,该基于人工智能的风控模型决策系统包括:
记忆模型构建模块,用于获取交易记录数据;对交易记录数据进行细粒度缩放处理,从而获取异常细粒度数据;对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型;
异常反馈标记模块,用于获取用户实时交易数据;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据;
异常因子修正模块,用于对标记阈值反馈数据进行动态因子模型构建,从而获取异常因子修正模型;
局部决策树构建模块,用于对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,从而获取局部决策树模型集;对局部决策树模型集进行模型集成,从而得到风控决策模型;对风控决策模型进行风控决策参数调整,并记录至风控系统中。
综上所述,本发明提供了一种基于人工智能的风控模型决策系统,该基于人工智能的风控模型决策系统由记忆模型构建模块、异常反馈标记模块、异常因子修正模块、以及局部决策树构建模块组成,能够实现本发明所述任意一种基于人工智能的风控模型决策方法,系统内部结构互相协作,通过采用历史交易数据进行长短时记忆网络模型的构建,增加了交易在时间尺度上的可参考依据,通过异常反馈机制来快速、高效地迭代新的模型,并通过局部决策树的异常识别决策的可解释能力,提高了风控模型决策的透明性,从而简化了基于人工智能的风控模型决策系统的操作流程。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于人工智能的风控模型决策方法,其特征在于,包括以下步骤:
步骤S1:获取交易记录数据;对交易记录数据进行细粒度缩放处理,从而获取异常细粒度数据;对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型;
步骤S2:获取用户实时交易数据;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据;
步骤S3:对标记阈值反馈数据进行动态因子模型构建,从而获取异常因子修正模型;
步骤S4:对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,从而获取局部决策树模型集;对局部决策树模型集进行模型集成,从而得到风控决策模型;对风控决策模型进行风控决策参数调整,并记录至风控系统中。
2.根据权利要求1所述的基于人工智能的风控模型决策方法,其特征在于,步骤S1包括以下步骤:
步骤S11:获取交易记录数据;
步骤S12:对交易记录数据进行异常特征聚类,从而获取异常聚类数据;
步骤S13:根据异常聚类数据对交易记录数据进行数据集划分,从而获取无异常数据集、异常数据集以及实际异常比例数据集;
步骤S14:对无异常数据集、异常数据集以及实际异常比例数据集进行细粒度缩放处理,从而获取异常细粒度数据;
步骤S15:对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型。
3.根据权利要求2所述的基于人工智能的风控模型决策方法,其特征在于,步骤S14包括以下步骤:
步骤S141:对实际异常比例数据集进行时序异常变化分析,从而获取时序异常变化数据,其中时序异常变化分析包括交易金额特征分析、交易频率特征分析以及交易身份特征分析,其中交易身份特征分析包括历史信用等级分析、历史交易金额特征分析以及历史交易频率特征分析;
步骤S142:对时序异常变化数据进行异常趋势的三维模型构建,从而获取异常趋势三维模型;
步骤S143:基于异常趋势三维模型对无异常数据集以及异常数据集进行细粒度缩放处理,从而获取异常细粒度数据。
4.根据权利要求3所述的基于人工智能的风控模型决策方法,其特征在于,步骤S142包括以下步骤:
步骤S1421:对时序异常变化数据进行时间滑窗的非线性时序聚类,从而得到时序聚类变化数据;
步骤S1422:利用线性逻辑回归算法对时序聚类变化数据进行多维度合并,从而得到三维度合并回归模型;
步骤S1423:基于三维度合并回归模型得到三维度合并相关系数;
步骤S1424:根据三维度合并相关系数对时序聚类变化数据进行异常趋势的三维模型构建,从而获取异常趋势三维模型。
5.根据权利要求4所述的基于人工智能的风控模型决策方法,其特征在于,步骤S1422中的线性逻辑回归算法如下所示:
;
式中,表示逻辑回归模型的对数似然函数,/>表示时序聚类变化数据的聚类序列的个数,/>表示第/>个聚类序列的标签值,/>表示线性逻辑回归的权重向量,/>是每个聚类序列的窗口连续时间点的个数,/>表示第/>个聚类序列中第/>个时间点的特征向量,/>表示线性逻辑回归的偏置项。
6.根据权利要求3所述的基于人工智能的风控模型决策方法,其特征在于,步骤S143包括以下步骤:
步骤S1431:基于异常趋势三维模型对无异常数据集以及异常数据集进行交易金额波动分析,从而获取金额波动分析数据;基于异常趋势三维模型对无异常数据集以及异常数据集进行交易频率波动分析,从而获取交易波动分析数据;
步骤S1432:对金额波动分析数据以及交易波动分析数据进行峰值趋势配对,从而获取趋势配对交易数据;
步骤S1433:基于异常趋势三维模型对趋势配对交易数据进行交易趋势变化时间的时间戳提取,从而获取异常交易时间戳数据;
步骤S1434:基于异常趋势三维模型并根据异常交易时间戳数据对无异常数据集以及异常数据集进行多维特征集提取,从而获取无异常特征数据集以及异常交易特征数据集;
步骤S1435:对无异常特征数据集以及异常交易特征数据集进行相似性筛选,从而获取相似筛选数据;
步骤S1436:根据相似筛选数据对异常交易特征数据集进行重要特征过滤,从而得到交易重要异常数据;
步骤S1437:对交易重要异常数据进行细粒度缩放处理,从而获取异常细粒度数据。
7.根据权利要求1所述的基于人工智能的风控模型决策方法,其特征在于,步骤S2包括以下步骤:
步骤S21:获取用户实时交易数据;
步骤S22:基于异常记忆网络模型对用户实时交易数据进行异常趋势阈值评估,从而获取异常阈值评估数据;
步骤S23:根据异常阈值评估数据对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据,并记录至风控系统中;
步骤S24:通过风控系统对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据。
8.根据权利要求1所述的基于人工智能的风控模型决策方法,其特征在于,步骤S3包括以下步骤:
步骤S31:对标记阈值反馈数据进行异常识别程度的数据集拆分,从而获取识别正确数据集以及识别错误数据集;
步骤S32:对识别正确数据集进行异常数据集筛选,从而获取第一异常数据集;对识别错误数据集进行异常数据集拆分,从而获取第二异常数据集以及无异常识别错误数据集;
步骤S33:根据第一异常数据集以及第二异常数据集对风控系统进行用户近期交易记录请求,从而获取第一交易记录数据以及第二交易记录数据;
步骤S34:对第一交易记录数据以及第二交易记录数据进行异常细粒度提取,从而获取第一细粒度数据以及第二细粒度数据;
步骤S35:对第一细粒度数据以及第二细粒度数据进行频率曲线转换,从而获取第一频率曲线数据以及第二频率曲线数据;
步骤S36:对第二细粒度数据进行异常识别程度的权重计算,从而获取异常错误识别权重;
步骤S37:根据异常错误识别权重对第二频率曲线数据进行峰值加权,从而获取第二细粒度加权数据;
步骤S38:对第一频率曲线数据以及第二细粒度加权数据进行傅里叶变换,从而得到异常细粒度频谱数据;
步骤S39:对异常细粒度频谱数据进行峰值偏差图转换,从而得到异常峰值偏差数据;
步骤S310:对异常峰值偏差数据以及无异常识别错误数据集进行动态因子模型构建,从而获取异常因子修正模型。
9.根据权利要求1所述的基于人工智能的风控模型决策方法,其特征在于,步骤S4包括以下步骤:
步骤S41:对异常记忆网络模型进行对抗模型迁移,从而获取对抗模型;
步骤S42:对异常因子修正模型进行生成模型迁移,从而获取生成模型;
步骤S43:对对抗模型以及生成模型进行生成对抗训练,从而获取生成对抗网络模型;
步骤S44:对生成对抗网络模型进行局部性样本生成的决策解释,从而得到局部性决策解释数据;
步骤S45:对局部性决策解释数据进行局部特征梯度分析,从而得到局部梯度数据;
步骤S46:对局部梯度分析数据进行局部决策树构建,从而获取局部决策树模型集;
步骤S47:基于局部决策树模型集进行可视化树路径结构构建,从而获取可视化风险树模型;
步骤S48:对局部决策树模型集进行模型集成,从而得到风控决策模型;
步骤S49:基于可视化风险树模型对风控决策模型进行风控决策参数调整,并记录至风控系统中。
10.一种基于人工智能的风控模型决策系统,其特征在于,用于执行如权利要求1所述的基于人工智能的风控模型决策方法,该基于人工智能的风控模型决策系统包括:
记忆模型构建模块,用于获取交易记录数据;对交易记录数据进行细粒度缩放处理,从而获取异常细粒度数据;对异常细粒度数据进行长短时记忆网络模型构建,从而得到异常记忆网络模型;
异常反馈标记模块,用于获取用户实时交易数据;基于异常记忆网络模型对用户实时交易数据进行阈值等级标记,从而得到标记阈值交易数据;对标记阈值交易数据进行交易异常反馈处理,并对风控系统进行异常反馈记录请求,从而获取标记阈值反馈数据;
异常因子修正模块,用于对标记阈值反馈数据进行动态因子模型构建,从而获取异常因子修正模型;
局部决策树构建模块,用于对异常记忆网络模型以及异常因子修正模型进行局部决策树构建,从而获取局部决策树模型集;对局部决策树模型集进行模型集成,从而得到风控决策模型;对风控决策模型进行风控决策参数调整,并记录至风控系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410445891.5A CN118052558B (zh) | 2024-04-15 | 2024-04-15 | 基于人工智能的风控模型决策方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410445891.5A CN118052558B (zh) | 2024-04-15 | 2024-04-15 | 基于人工智能的风控模型决策方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118052558A true CN118052558A (zh) | 2024-05-17 |
CN118052558B CN118052558B (zh) | 2024-06-14 |
Family
ID=91050317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410445891.5A Active CN118052558B (zh) | 2024-04-15 | 2024-04-15 | 基于人工智能的风控模型决策方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118052558B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118568641A (zh) * | 2024-07-30 | 2024-08-30 | 晨达(广州)网络科技有限公司 | 财务交易异常检测系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110361778A (zh) * | 2019-07-04 | 2019-10-22 | 华北电力大学 | 一种基于生成对抗网络的地震数据重建方法 |
US20190377825A1 (en) * | 2018-06-06 | 2019-12-12 | Microsoft Technology Licensing Llc | Taxonomy enrichment using ensemble classifiers |
CN114065653A (zh) * | 2022-01-17 | 2022-02-18 | 南方电网数字电网研究院有限公司 | 电力负荷预测模型的构建方法与电力负荷预测方法 |
US20220172050A1 (en) * | 2020-11-16 | 2022-06-02 | UMNAI Limited | Method for an explainable autoencoder and an explainable generative adversarial network |
CN116703555A (zh) * | 2022-12-02 | 2023-09-05 | 中国建设银行股份有限公司 | 一种预警方法、装置、电子设备及计算机可读介质 |
US20240028744A1 (en) * | 2022-07-21 | 2024-01-25 | University Of Chinese Academy Of Sciences | Dynamic network risk predicting method based on a graph neural network |
CN117455497A (zh) * | 2023-11-12 | 2024-01-26 | 北京营加品牌管理有限公司 | 一种交易风险检测方法及装置 |
CN117635616A (zh) * | 2024-01-26 | 2024-03-01 | 江西科技学院 | 用于医学检查结果互认的影像诊断系统 |
CN117670066A (zh) * | 2024-01-31 | 2024-03-08 | 深圳市拜特科技股份有限公司 | 基于智能决策的司库管理方法、系统、设备及存储介质 |
-
2024
- 2024-04-15 CN CN202410445891.5A patent/CN118052558B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190377825A1 (en) * | 2018-06-06 | 2019-12-12 | Microsoft Technology Licensing Llc | Taxonomy enrichment using ensemble classifiers |
CN110361778A (zh) * | 2019-07-04 | 2019-10-22 | 华北电力大学 | 一种基于生成对抗网络的地震数据重建方法 |
US20220172050A1 (en) * | 2020-11-16 | 2022-06-02 | UMNAI Limited | Method for an explainable autoencoder and an explainable generative adversarial network |
CN114065653A (zh) * | 2022-01-17 | 2022-02-18 | 南方电网数字电网研究院有限公司 | 电力负荷预测模型的构建方法与电力负荷预测方法 |
US20240028744A1 (en) * | 2022-07-21 | 2024-01-25 | University Of Chinese Academy Of Sciences | Dynamic network risk predicting method based on a graph neural network |
CN116703555A (zh) * | 2022-12-02 | 2023-09-05 | 中国建设银行股份有限公司 | 一种预警方法、装置、电子设备及计算机可读介质 |
CN117455497A (zh) * | 2023-11-12 | 2024-01-26 | 北京营加品牌管理有限公司 | 一种交易风险检测方法及装置 |
CN117635616A (zh) * | 2024-01-26 | 2024-03-01 | 江西科技学院 | 用于医学检查结果互认的影像诊断系统 |
CN117670066A (zh) * | 2024-01-31 | 2024-03-08 | 深圳市拜特科技股份有限公司 | 基于智能决策的司库管理方法、系统、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118568641A (zh) * | 2024-07-30 | 2024-08-30 | 晨达(广州)网络科技有限公司 | 财务交易异常检测系统 |
CN118568641B (zh) * | 2024-07-30 | 2024-10-18 | 晨达(广州)网络科技有限公司 | 财务交易异常检测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN118052558B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3680639B1 (en) | Abnormality model learning device, method, and program | |
CN118052558B (zh) | 基于人工智能的风控模型决策方法及系统 | |
CN112132233A (zh) | 一种基于有效影响因子的服刑人员危险行为预测方法及系统 | |
US20230085991A1 (en) | Anomaly detection and filtering of time-series data | |
CN116361059B (zh) | 一种银行业务异常根因诊断方法及诊断系统 | |
CN116433333B (zh) | 基于机器学习的数字商品交易风险防控方法及装置 | |
US20210397956A1 (en) | Activity level measurement using deep learning and machine learning | |
CN116861331A (zh) | 一种融合专家模型决策的数据识别方法及系统 | |
CN116823496A (zh) | 基于人工智能的智能保险风险评估和定价系统 | |
CN111833175A (zh) | 基于knn算法的互联网金融平台申请欺诈行为检测方法 | |
CN118413406A (zh) | 基于智能网络入侵检测系统及方法 | |
Sönmez et al. | Anomaly detection using data mining methods in it systems: a decision support application | |
CN111612531B (zh) | 一种点击欺诈的检测方法及系统 | |
Miró-Nicolau et al. | A comprehensive study on fidelity metrics for XAI | |
CN117670359A (zh) | 异常交易数据的识别方法、装置、存储介质及电子设备 | |
CN112613871A (zh) | 基于大数据和区块链的支付方式推荐方法及云计算服务器 | |
Ikeda et al. | New feature engineering framework for deep learning in financial fraud detection | |
Johnpaul et al. | Representational primitives using trend based global features for time series classification | |
CN114202020A (zh) | 直推式支持向量机的落水洞检测方法、系统、终端及介质 | |
CN117539920B (zh) | 基于房产交易多维度数据的数据查询方法及系统 | |
CN117649209B (zh) | 企业营收稽核方法、系统、设备及存储介质 | |
Pavasant et al. | Spatio-temporal change detection with Granger causality based cluster sequence mining | |
US20240193608A1 (en) | Computerized-method and computerized-system for identifying fraud transactions in transactions classified as legit transactions by a classification machine learning model | |
Hanni | Correlation-based Anomaly Detection in Time Series | |
CN118484329A (zh) | 一种基于信息系统集成服务展示的集成分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |