CN117893214A - 应用ai的大数据风控处理方法及系统 - Google Patents
应用ai的大数据风控处理方法及系统 Download PDFInfo
- Publication number
- CN117893214A CN117893214A CN202410065283.1A CN202410065283A CN117893214A CN 117893214 A CN117893214 A CN 117893214A CN 202410065283 A CN202410065283 A CN 202410065283A CN 117893214 A CN117893214 A CN 117893214A
- Authority
- CN
- China
- Prior art keywords
- risk
- data
- content
- wind control
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 230000006399 behavior Effects 0.000 claims abstract description 194
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 48
- 238000012549 training Methods 0.000 claims description 4
- 238000012098 association analyses Methods 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 3
- 238000012546 transfer Methods 0.000 description 7
- 230000008685 targeting Effects 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种应用AI的大数据风控处理方法及系统,通过获取和处理风控匹配样本序列和候选风险行为数据,实现了对金融平台行为数据的精确匹配和风险预测。通过引入图卷积提取和内容语义提取技术,深度解析了候选风险行为数据,有效生成了图网络数据和内容理解特征,进一步提升了风控预测的准确性。同时,通过因子配对要求和目标配对要求的设定,使得风控预测过程更具针对性和灵活性,能够满足不同参考风控类别的特定需求。根据内容理解特征和目标风控类别,最终确定的风控预测信息能够全面反映候选风险行为的风险状况。由此,有效地解决了传统风控预测方法在准确性、全面性和适应性上的不足。
Description
技术领域
本申请涉及互联网金融技术领域,具体而言,涉及一种应用AI的大数据风控处理方法及系统。
背景技术
随着金融科技的发展,金融平台的行为数据越来越复杂,传统的风险识别方法已经无法满足需求。因此,如何有效地识别金融平台行为数据中的风险,成为了一个亟待解决的问题。
在现有的风险控制技术中,对风险行为的预测主要基于固定模式的数据分析,例如:统计分析、时间序列分析等。这些方法虽然能够在一定程度上识别和预测风险行为,但其局限性也较为明显。首先,传统的数据分析方法通常依赖于人工设定的阈值或规则,其预测结果易受个体差异和环境变化的影响,难以适应复杂多变的金融环境。其次,这些方法往往无法准确捕捉和理解金融平台行为数据中的深层信息,如行为关联、行为趋势等,因此,其预测结果的准确性和全面性还有待提高。
发明内容
有鉴于此,本申请的目的在于提供一种应用AI的大数据风控处理方法及系统。
依据本申请的第一方面,提供一种应用AI的大数据风控处理方法,所述方法包括:
获取风控匹配样本序列和候选风险行为数据;所述风控匹配样本序列包括多个参考风控类别、以及各所述参考风控类别分别对应的因子配对要求;所述因子配对要求,用于表示匹配所述参考风控类别的金融平台行为数据需符合的要求,所述候选风险行为数据为用户行为大数据中提取到的风险行为数据;
依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行图卷积提取,生成所述候选风险行为数据的图网络数据;
从各所述因子配对要求中,确定与所述图网络数据配对的目标配对要求;
基于所述图网络数据,对代表所述目标配对要求的风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征;
依据各所述参考风控类别中与所述目标配对要求对应的目标风控类别、以及所述内容理解特征,确定所述候选风险行为数据的风控预测信息。
在第一方面的一种可能的实施方式中,所述候选风险行为数据与对应的风险关注页面存在映射关系;
所述依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行图卷积提取,生成所述候选风险行为数据的图网络数据,包括:
依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险行为特征;
依据所述候选风险行为数据映射的风险关注页面,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险关注内容特征;
融合所述风险行为特征和所述风险关注内容特征后进行图卷积处理,确定所述候选风险行为数据的图网络数据。
在第一方面的一种可能的实施方式中,所述依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险行为特征,包括:
将所述候选风险行为数据拆分成多个风险行为节点;
依据各所述风险行为节点中各自包含的风险知识块,分别对各所述风险行为节点进行特征提取,生成各所述风险行为节点分别对应的节点特征;
确定包括各所述节点特征的风险行为特征。
在第一方面的一种可能的实施方式中,所述融合所述风险行为特征和所述风险关注内容特征后进行图卷积处理,确定所述候选风险行为数据的图网络数据,包括:
将所述风险关注内容特征分别与各所述节点特征进行关联性分析,从各所述风险行为节点中确定所述风险关注内容特征的关联风险行为节点;
依据所述关联风险行为节点的数量、以及所述关联风险行为节点的节点特征进行图卷积处理,确定所述候选风险行为数据的图网络数据。
在第一方面的一种可能的实施方式中,所述从各所述因子配对要求中,确定与所述图网络数据配对的目标配对要求,包括:
获取各所述因子配对要求分别对应的配对字段;
将所述图网络数据与各所述配对字段分别进行匹配,确定与所述图网络数据匹配度最大的目标字段;
将所述目标字段的对应因子配对要求,输出为与所述图网络数据配对的目标配对要求。
在第一方面的一种可能的实施方式中,所述基于所述图网络数据,对代表所述目标配对要求的风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征,包括:
从代表所述目标配对要求的风险指向内容中,确定与所述图网络数据所表达特征匹配的候选风险指向内容;
对所述候选风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征。
在第一方面的一种可能的实施方式中,所述对所述候选风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征,包括:
对所述候选风险指向内容进行风险指向关系提取,生成多个风险指向链;
基于各所述风险指向链各自代表的字段在所述候选风险指向内容中的特征关系,依次对所述候选风险指向内容进行特征选择,确定所述候选风险指向内容的路径矢量;所述路径矢量包括所述候选风险指向内容中首个字段的前向矢量和末个字段的后向矢量中的至少一项;
融合所述候选风险指向内容、以及对所述路径矢量进行特征还原得到的风险路径信息,将融合得到的风险指向内容输出为所述候选风险行为数据与所述目标配对要求的内容理解特征。
在第一方面的一种可能的实施方式中,所述路径矢量包括所述候选风险指向内容中末个字段的后向矢量;
所述基于各所述风险指向链各自代表的字段在所述候选风险指向内容中的特征关系,依次对所述候选风险指向内容进行特征选择,确定所述候选风险指向内容的路径矢量,包括:
对应于各所述风险指向链,将所述风险指向链所代表字段在所述候选风险指向内容中的后向特征关系,输出为所述风险指向链对应的选择特征;
基于各所述风险指向链各自对应的选择特征,分别对所述候选风险指向内容进行特征选择,生成各所述风险指向链分别对应的后向矢量;除末个风险指向链之外的各所述风险指向链分别对应的后向矢量所代表的第一路径特征,与所述风险指向链所代表字段在所述候选风险指向内容中的第二路径特征符合风险指向内容匹配要求;
从各所述后向矢量中,确定所述候选风险指向内容中末个字段的后向矢量。
在第一方面的一种可能的实施方式中,所述方法包括:
获取模板风控匹配样本序列、以及标注了先验风控识别数据的模板风险行为数据;所述模板风控匹配样本序列包括多个样例先验风控识别数据分别对应的模板因子配对要求;
从各所述模板因子配对要求中,确定与所述先验风控识别数据配对的样本配对要求;
确定所述模板风险行为数据与所述样本配对要求的内容理解特征;
依据所述模板风险行为数据和所述样本配对要求确定网络学习数据,并依据所述内容理解特征和所述先验风控识别数据确定网络结果数据,输出待训练数据集合;
基于包括多个模板风险行为数据各自对应的待训练数据集合对神经网络模型进行训练,生成对应的目标风控识别网络。
依据本申请的第二方面,提供一种大数据风控系统,所述大数据风控系统包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行指令,所述处理器在执行所述机器可执行指令时,该大数据风控系统实现前述的应用AI的大数据风控处理方法。
依据本申请的第三方面,提供提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,当所述计算机可执行指令被执行时,实现前述的应用AI的大数据风控处理方法。
依据上述任意一个方面,本申请的技术效果在于:
通过获取风控匹配样本序列和候选风险行为数据,并使用图卷积提取候选风险行为数据的图网络数据,能够更好地捕捉金融平台行为数据中的复杂关系。此外,通过对代表目标配对要求的风险指向内容进行内容语义提取,该方法能够生成更加精确的内容理解特征。最后,通过结合目标配对要求对应的目标风控类别和内容理解特征,该方法能够更加准确地预测候选风险行为数据的风控信息。由此,相对于现有的风险识别方法具有更高的准确性和更好的鲁棒性。
也就是说,本申请通过获取和处理风控匹配样本序列和候选风险行为数据,实现了对金融平台行为数据的精确匹配和风险预测。通过引入图卷积提取和内容语义提取技术,深度解析了候选风险行为数据,有效生成了图网络数据和内容理解特征,进一步提升了风控预测的准确性。同时,通过因子配对要求和目标配对要求的设定,使得风控预测过程更具针对性和灵活性,能够满足不同参考风控类别的特定需求。根据内容理解特征和目标风控类别,最终确定的风控预测信息能够全面反映候选风险行为的风险状况。由此,有效地解决了传统风控预测方法在准确性、全面性和适应性上的不足。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以依据这些附图获得其它相关的附图。
图1本申请实施例所提供的应用AI的大数据风控处理方法的流程示意图;
图2示出了本申请实施例所提供的用于实现上述的应用AI的大数据风控处理方法的大数据风控系统的组件结构示意图。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其它特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
图1示出了本申请实施例提供的应用AI的大数据风控处理方法及系统的流程示意图,应当理解,在其它实施例中,本实施例的应用AI的大数据风控处理方法其中部分步骤的顺序可以依据实际需要相互共享,或者其中的部分步骤也可以省略或维持。该应用AI的大数据风控处理方法的详细步骤包括:
步骤S110,获取风控匹配样本序列和候选风险行为数据。所述风控匹配样本序列包括多个参考风控类别、以及各所述参考风控类别分别对应的因子配对要求。所述因子配对要求,用于表示匹配所述参考风控类别的金融平台行为数据需符合的要求,所述候选风险行为数据为用户行为大数据中提取到的风险行为数据。
例如,可以从金融平台收集大量的用户行为大数据,然后对这些用户行为大数据进行预处理,得到候选风险行为数据。也即,候选风险行为数据是从用户行为大数据中提取出来的,可能存在风险的行为数据。例如,一个用户在短时间内进行了多笔大额转账,这些转账行为对应的行为过程数据就可以被视为候选风险行为数据。
同时,还需要根据历史风控数据,构建一个风控匹配样本序列,该风控匹配样本序列包括多个参考风控类别(如欺诈行为、逾期还款等)以及每个参考风控类别对应的因子配对要求(如交易金额大于1000元、交易时间位于晚上8点至凌晨2点等)。
示例性的,风控匹配样本序列是指用于训练风控模型的样本集合,其中包括多个参考风控类别以及每个参考风控类别对应的因子配对要求。
参考风控类别是指金融平台上的各种风险类型,例如欺诈行为、逾期还款、高风险账户等。因子配对要求是指用于描述匹配参考风控类别的金融平台行为数据所需满足的条件,例如交易金额大于1000元、交易时间位于晚上8点至凌晨2点等。再例如,"信用卡欺诈"可能是一个参考风控类别,而对应的因子配对要求可能包括"用户在短时间内进行大额消费"、"用户在不同地点进行频繁交易"等。
举例说明:假设某金融平台需要识别的风险类型有欺诈行为和逾期还款。对于欺诈行为,可能需要满足以下条件:交易金额大于1000元、交易时间位于晚上8点至凌晨2点、交易地点为国外。而对于逾期还款,该平台可能需要满足以下条件:借款金额大于5000元、借款期限超过3个月、借款人信用评分低于600分。这些条件就是因子配对要求,它们可以帮助模型更好地识别不同的风险类型。
步骤S120,依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行图卷积提取,生成所述候选风险行为数据的图网络数据。
例如,可以使用图卷积神经网络(GCN)对候选风险行为数据进行特征提取。首先,需要将候选风险行为数据转换为图结构数据,其中节点表示用户行为特征,边表示用户行为特征之间的关系。然后,可以通过GCN网络对图结构数据进行卷积操作,提取出图网络数据。
其中,所述风险知识块是候选风险行为数据中包含的,与风险相关的信息片段。例如,在转账行为中,转账金额、转账频率、转账时间等都可以被视为风险知识块。
步骤S130,从各所述因子配对要求中,确定与所述图网络数据配对的目标配对要求。
例如,可以根据图网络数据中提取出的特征,与风控匹配样本序列中的因子配对要求进行匹配。如果图网络数据中提取出的特征满足某个因子配对要求,则将该因子配对要求作为目标配对要求。
步骤S140,基于所述图网络数据,对代表所述目标配对要求的风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征。
例如,可以使用自然语言处理技术(如BERT模型)对目标配对要求进行语义理解,提取出其中的风险指向内容。然后,大数据风控系统可以将风险指向内容与图网络数据相结合,生成内容理解特征。
步骤S150,依据各所述参考风控类别中与所述目标配对要求对应的目标风控类别、以及所述内容理解特征,确定所述候选风险行为数据的风控预测信息。
例如,可以根据目标配对要求,确定候选风险行为数据可能属于哪个参考风控类别。然后,可以将内容理解特征与目标风控类别相结合,通过机器学习模型(如逻辑回归模型)进行风险评估,生成风控预测信息。
基于以上步骤,通过获取风控匹配样本序列和候选风险行为数据,并使用图卷积提取候选风险行为数据的图网络数据,能够更好地捕捉金融平台行为数据中的复杂关系。此外,通过对代表目标配对要求的风险指向内容进行内容语义提取,该方法能够生成更加精确的内容理解特征。最后,通过结合目标配对要求对应的目标风控类别和内容理解特征,该方法能够更加准确地预测候选风险行为数据的风控信息。由此,相对于现有的风险识别方法具有更高的准确性和更好的鲁棒性。
也就是说,本申请通过获取和处理风控匹配样本序列和候选风险行为数据,实现了对金融平台行为数据的精确匹配和风险预测。通过引入图卷积提取和内容语义提取技术,深度解析了候选风险行为数据,有效生成了图网络数据和内容理解特征,进一步提升了风控预测的准确性。同时,通过因子配对要求和目标配对要求的设定,使得风控预测过程更具针对性和灵活性,能够满足不同参考风控类别的特定需求。根据内容理解特征和目标风控类别,最终确定的风控预测信息能够全面反映候选风险行为的风险状况。由此,有效地解决了传统风控预测方法在准确性、全面性和适应性上的不足。
在一种可能的实施方式中,所述候选风险行为数据与对应的风险关注页面存在映射关系。
步骤S120可以包括:
步骤S121,依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险行为特征。
步骤S122,依据所述候选风险行为数据映射的风险关注页面,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险关注内容特征。
步骤S123,融合所述风险行为特征和所述风险关注内容特征后进行图卷积处理,确定所述候选风险行为数据的图网络数据。
例如,大数据风控系统首先需要确定哪些用户行为可能涉及欺诈行为,例如异常交易、异常提现等。然后,大数据风控系统需要将这些行为与相应的风险关注页面进行映射,例如将异常交易映射到交易风险关注页面,将异常提现映射到提现风险关注页面。
然后,大数据风控系统需要从候选风险行为数据中提取风险知识块,例如交易金额、交易时间、交易地点等。然后,大数据风控系统使用图卷积算法对这些风险知识块进行提取,生成候选风险行为数据的图网络数据。
在此基础上,大数据风控系统需要从候选风险行为数据中提取风险行为特征,例如交易金额、交易时间、交易地点等。这些特征可以帮助模型更好地识别欺诈行为。
接着,大数据风控系统需要从候选风险行为数据映射的风险关注页面中提取风险关注内容特征,例如风险提示、风险详情等,可以帮助模型更好地理解欺诈行为的具体内容。
最后,大数据风控系统需要将风险行为特征和风险关注内容特征进行融合,然后使用图卷积算法对融合后的特征进行处理,生成候选风险行为数据的图网络数据。这样,大数据风控系统就可以更准确地识别用户的欺诈行为。
在一种可能的实施方式中,步骤S121可以包括:
步骤S1211,将所述候选风险行为数据拆分成多个风险行为节点。
步骤S1212,依据各所述风险行为节点中各自包含的风险知识块,分别对各所述风险行为节点进行特征提取,生成各所述风险行为节点分别对应的节点特征。
步骤S1213,确定包括各所述节点特征的风险行为特征。
例如,大数据风控系统需要将候选风险行为数据拆分成多个风险行为节点,例如将一笔交易拆分成交易金额、交易时间、交易地点等多个节点。
然后,需要从每个风险行为节点中提取风险知识块,例如从交易金额节点中提取交易金额,从交易时间节点中提取交易时间等。然后,大数据风控系统需要使用特征提取算法对这些风险知识块进行特征提取,生成每个风险行为节点对应的节点特征。
在此基础上,需要将每个风险行为节点的节点特征进行融合,生成风险行为特征。例如,大数据风控系统可以将交易金额、交易时间、交易地点等节点特征进行融合,生成交易风险行为特征。这样,大数据风控系统就可以更准确地识别用户的欺诈行为。
在一种可能的实施方式中,步骤S123可以包括:
步骤S1231,将所述风险关注内容特征分别与各所述节点特征进行关联性分析,从各所述风险行为节点中确定所述风险关注内容特征的关联风险行为节点。
步骤S1232,依据所述关联风险行为节点的数量、以及所述关联风险行为节点的节点特征进行图卷积处理,确定所述候选风险行为数据的图网络数据。
例如,大数据风控系统需要将风险关注内容特征与各所述节点特征进行关联性分析,例如将交易金额节点与交易时间节点进行关联性分析。如果发现交易金额节点与交易时间节点之间存在关联性,那么大数据风控系统就可以确定交易时间节点为关联风险行为节点。
然后,需要根据所述关联风险行为节点的数量和节点特征进行图卷积处理,生成候选风险行为数据的图网络数据。例如,大数据风控系统可以使用卷积神经网络(CNN)对关联风险行为节点进行图卷积处理,生成候选风险行为数据的图网络数据。这样,大数据风控系统就可以更准确地识别用户的欺诈行为。
在一种可能的实施方式中,步骤S130可以包括:
步骤S131,获取各所述因子配对要求分别对应的配对字段。
步骤S132,将所述图网络数据与各所述配对字段分别进行匹配,确定与所述图网络数据匹配度最大的目标字段。
步骤S133,将所述目标字段的对应因子配对要求,输出为与所述图网络数据配对的目标配对要求。
例如,大数据风控系统需要从数据库中获取各个因子配对要求对应的配对字段,例如交易金额、交易时间、交易地点等。
然后,需要将图网络数据与各个配对字段进行匹配,例如将交易金额与交易时间进行匹配。大数据风控系统可以根据匹配度来确定与图网络数据匹配度最大的目标字段,例如交易金额与交易时间的匹配度最高。
最后,大数据风控系统需要将目标字段的对应因子配对要求输出为与图网络数据配对的目标配对要求。例如,如果交易金额与交易时间的匹配度最高,那么大数据风控系统就可以将交易金额对应的因子配对要求输出为与图网络数据配对的目标配对要求。这样,大数据风控系统就可以更准确地识别用户的欺诈行为。
在一种可能的实施方式中,步骤S140可以包括:
步骤S141,从代表所述目标配对要求的风险指向内容中,确定与所述图网络数据所表达特征匹配的候选风险指向内容。
步骤S142,对所述候选风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征。
例如,大数据风控系统需要从数据库中获取代表所述目标配对要求的风险指向内容,例如交易金额、交易时间、交易地点等。然后,大数据风控系统需要确定与所述图网络数据所表达特征匹配的候选风险指向内容,例如交易金额与交易时间的匹配度最高。
在此基础上,大数据风控系统需要对候选风险指向内容进行内容语义提取,例如将交易金额与交易时间的匹配度最高的内容提取出来。然后,大数据风控系统需要生成所述候选风险行为数据与所述目标配对要求的内容理解特征,例如交易金额与交易时间的匹配度最高的内容理解特征。
这样,大数据风控系统就可以更准确地识别用户的欺诈行为,并采取相应的措施来防止欺诈行为的发生。
在一种可能的实施方式中,步骤S142可以包括:
步骤S1421,对所述候选风险指向内容进行风险指向关系提取,生成多个风险指向链。
步骤S1422,基于各所述风险指向链各自代表的字段在所述候选风险指向内容中的特征关系,依次对所述候选风险指向内容进行特征选择,确定所述候选风险指向内容的路径矢量。所述路径矢量包括所述候选风险指向内容中首个字段的前向矢量和末个字段的后向矢量中的至少一项。
步骤S1423,融合所述候选风险指向内容、以及对所述路径矢量进行特征还原得到的风险路径信息,将融合得到的风险指向内容输出为所述候选风险行为数据与所述目标配对要求的内容理解特征。
例如,大数据风控系统需要从数据库中获取代表所述目标配对要求的风险指向内容,例如交易金额、交易时间、交易地点等。然后,需要确定与所述图网络数据所表达特征匹配的候选风险指向内容,例如交易金额与交易时间的匹配度最高。接着,需要对候选风险指向内容进行风险指向关系提取,生成多个风险指向链,例如交易金额与交易时间之间的风险指向链。
在此基础上可以确定所述候选风险指向内容的路径矢量,例如将交易金额与交易时间之间的风险指向链中的字段的前向矢量和后向矢量进行融合,得到路径矢量。
在一种可能的实施方式中,所述路径矢量包括所述候选风险指向内容中末个字段的后向矢量。
所述步骤S1422包括:对应于各所述风险指向链,将所述风险指向链所代表字段在所述候选风险指向内容中的后向特征关系,输出为所述风险指向链对应的选择特征。基于各所述风险指向链各自对应的选择特征,分别对所述候选风险指向内容进行特征选择,生成各所述风险指向链分别对应的后向矢量。除末个风险指向链之外的各所述风险指向链分别对应的后向矢量所代表的第一路径特征,与所述风险指向链所代表字段在所述候选风险指向内容中的第二路径特征符合风险指向内容匹配要求。各所述后向矢量中,确定所述候选风险指向内容中末个字段的后向矢量。
例如,需要确定所述候选风险指向内容中末个字段的后向矢量,例如交易金额与交易时间之间的风险指向链中的字段的后向矢量。
然后,对应于各所述风险指向链,将所述风险指向链所代表字段在所述候选风险指向内容中的后向特征关系,输出为所述风险指向链对应的选择特征,例如交易金额与交易时间之间的风险指向链中的字段的后向特征关系。
在此基础上,需要基于各所述风险指向链各自对应的选择特征,分别对所述候选风险指向内容进行特征选择,生成各所述风险指向链分别对应的后向矢量,例如交易金额与交易时间之间的风险指向链中的字段的后向矢量。同时,大数据风控系统需要确保除末个风险指向链之外的各所述风险指向链分别对应的后向矢量所代表的第一路径特征,与所述风险指向链所代表字段在所述候选风险指向内容中的第二路径特征符合风险指向内容匹配要求,例如交易金额与交易时间之间的风险指向链中的字段的后向矢量所代表的第一路径特征,与所述风险指向链所代表字段在所述候选风险指向内容中的第二路径特征符合风险指向内容匹配要求。
由此,从各所述后向矢量中,确定所述候选风险指向内容中末个字段的后向矢量,例如交易金额与交易时间之间的风险指向链中的字段的后向矢量。这样,大数据风控系统就可以更准确地识别用户的欺诈行为,并采取相应的措施来防止欺诈行为的发生。
在一种可能的实施方式中,所述方法包括:
步骤S101,获取模板风控匹配样本序列、以及标注了先验风控识别数据的模板风险行为数据。所述模板风控匹配样本序列包括多个样例先验风控识别数据分别对应的模板因子配对要求。
步骤S102,从各所述模板因子配对要求中,确定与所述先验风控识别数据配对的样本配对要求。
步骤S103,确定所述模板风险行为数据与所述样本配对要求的内容理解特征。
步骤S104,依据所述模板风险行为数据和所述样本配对要求确定网络学习数据,并依据所述内容理解特征和所述先验风控识别数据确定网络结果数据,输出待训练数据集合。
步骤S105,基于包括多个模板风险行为数据各自对应的待训练数据集合对神经网络模型进行训练,生成对应的目标风控识别网络。
图2本申请实施例中提供了一种大数据风控系统100,包括处理器1001和存储器1003及存储在存储器1003上的程序代码,该处理器1001执行上述程序代码以实现应用AI的大数据风控处理方法的步骤。
图2所示的大数据风控系统100包括:处理器1001和存储器1003。其中,处理器1001和存储器1003相连,如通过总线1002相连。可选地,大数据风控系统100还可以包括收发器1004,收发器1004可以用于该大数据风控系统与其它大数据风控系统之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际调度中收发器1004不限于一个,该大数据风控系统100的结构并不构成对本申请实施例的限定。
处理器1001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(ApplicationSpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其它可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器1001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线1002可包括一通路,在上述组件之间传送信息。总线1002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线1002可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其它类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其它类型的动态存储设备,也可以是EEPROM(ElectricallyErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(CompactDiscRead Only Memory,只读光盘)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其它磁存储设备、或者能够用于携带或存储程序代码并能够由计算机读取的任何其它介质,在此不做限定。
存储器1003用于存储执行本申请实施例的程序代码,并由处理器1001来控制执行。处理器1001用于执行存储器1003中存储的程序代码,以实现前述方法实施例所示的步骤。
其中,大数据风控系统包括但不限于:诸如移动电话、笔记本电脑、PAD等等移动终端以及诸如数字TV、台式计算机等等固定终端。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有程序代码,程序代码被处理器执行时可实现前述方法实施例的步骤及相应内容。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其它的顺序执行。此外,各流程图中的部分或全部步骤依据实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以基于需求灵活配置,本申请实施例对此不限制。
以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用依据本申请技术思想的其它类似实施手段,同样属于本申请实施例的保护范畴。
Claims (10)
1.一种应用AI的大数据风控处理方法,其特征在于,所述方法包括:
获取风控匹配样本序列和候选风险行为数据;所述风控匹配样本序列包括多个参考风控类别、以及各所述参考风控类别分别对应的因子配对要求;所述因子配对要求,用于表示匹配所述参考风控类别的金融平台行为数据需符合的要求,所述候选风险行为数据为用户行为大数据中提取到的风险行为数据;
依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行图卷积提取,生成所述候选风险行为数据的图网络数据;
从各所述因子配对要求中,确定与所述图网络数据配对的目标配对要求;
基于所述图网络数据,对代表所述目标配对要求的风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征;
依据各所述参考风控类别中与所述目标配对要求对应的目标风控类别、以及所述内容理解特征,确定所述候选风险行为数据的风控预测信息。
2.根据权利要求1所述的应用AI的大数据风控处理方法,其特征在于,所述候选风险行为数据与对应的风险关注页面存在映射关系;
所述依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行图卷积提取,生成所述候选风险行为数据的图网络数据,包括:
依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险行为特征;
依据所述候选风险行为数据映射的风险关注页面,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险关注内容特征;
融合所述风险行为特征和所述风险关注内容特征后进行图卷积处理,确定所述候选风险行为数据的图网络数据。
3.根据权利要求2所述的应用AI的大数据风控处理方法,其特征在于,所述依据所述候选风险行为数据包含的风险知识块,对所述候选风险行为数据进行特征提取,生成所述候选风险行为数据的风险行为特征,包括:
将所述候选风险行为数据拆分成多个风险行为节点;
依据各所述风险行为节点中各自包含的风险知识块,分别对各所述风险行为节点进行特征提取,生成各所述风险行为节点分别对应的节点特征;
确定包括各所述节点特征的风险行为特征。
4.根据权利要求3所述的应用AI的大数据风控处理方法,其特征在于,所述融合所述风险行为特征和所述风险关注内容特征后进行图卷积处理,确定所述候选风险行为数据的图网络数据,包括:
将所述风险关注内容特征分别与各所述节点特征进行关联性分析,从各所述风险行为节点中确定所述风险关注内容特征的关联风险行为节点;
依据所述关联风险行为节点的数量、以及所述关联风险行为节点的节点特征进行图卷积处理,确定所述候选风险行为数据的图网络数据。
5.根据权利要求1所述的应用AI的大数据风控处理方法,其特征在于,所述从各所述因子配对要求中,确定与所述图网络数据配对的目标配对要求,包括:
获取各所述因子配对要求分别对应的配对字段;
将所述图网络数据与各所述配对字段分别进行匹配,确定与所述图网络数据匹配度最大的目标字段;
将所述目标字段的对应因子配对要求,输出为与所述图网络数据配对的目标配对要求。
6.根据权利要求1-5中任意一项所述的应用AI的大数据风控处理方法,其特征在于,所述基于所述图网络数据,对代表所述目标配对要求的风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征,包括:
从代表所述目标配对要求的风险指向内容中,确定与所述图网络数据所表达特征匹配的候选风险指向内容;
对所述候选风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征。
7.根据权利要求6所述的应用AI的大数据风控处理方法,其特征在于,所述对所述候选风险指向内容进行内容语义提取,生成所述候选风险行为数据与所述目标配对要求的内容理解特征,包括:
对所述候选风险指向内容进行风险指向关系提取,生成多个风险指向链;
基于各所述风险指向链各自代表的字段在所述候选风险指向内容中的特征关系,依次对所述候选风险指向内容进行特征选择,确定所述候选风险指向内容的路径矢量;所述路径矢量包括所述候选风险指向内容中首个字段的前向矢量和末个字段的后向矢量中的至少一项;
融合所述候选风险指向内容、以及对所述路径矢量进行特征还原得到的风险路径信息,将融合得到的风险指向内容输出为所述候选风险行为数据与所述目标配对要求的内容理解特征。
8.根据权利要求7所述的应用AI的大数据风控处理方法,其特征在于,所述路径矢量包括所述候选风险指向内容中末个字段的后向矢量;
所述基于各所述风险指向链各自代表的字段在所述候选风险指向内容中的特征关系,依次对所述候选风险指向内容进行特征选择,确定所述候选风险指向内容的路径矢量,包括:
对应于各所述风险指向链,将所述风险指向链所代表字段在所述候选风险指向内容中的后向特征关系,输出为所述风险指向链对应的选择特征;
基于各所述风险指向链各自对应的选择特征,分别对所述候选风险指向内容进行特征选择,生成各所述风险指向链分别对应的后向矢量;除末个风险指向链之外的各所述风险指向链分别对应的后向矢量所代表的第一路径特征,与所述风险指向链所代表字段在所述候选风险指向内容中的第二路径特征符合风险指向内容匹配要求;
从各所述后向矢量中,确定所述候选风险指向内容中末个字段的后向矢量。
9.根据权利要求1所述的应用AI的大数据风控处理方法,其特征在于,所述方法包括:
获取模板风控匹配样本序列、以及标注了先验风控识别数据的模板风险行为数据;所述模板风控匹配样本序列包括多个样例先验风控识别数据分别对应的模板因子配对要求;
从各所述模板因子配对要求中,确定与所述先验风控识别数据配对的样本配对要求;
确定所述模板风险行为数据与所述样本配对要求的内容理解特征;
依据所述模板风险行为数据和所述样本配对要求确定网络学习数据,并依据所述内容理解特征和所述先验风控识别数据确定网络结果数据,输出待训练数据集合;
基于包括多个模板风险行为数据各自对应的待训练数据集合对神经网络模型进行训练,生成对应的目标风控识别网络。
10.一种大数据风控系统,其特征在于,包括处理器以及计算机可读存储介质,所述计算机可读存储介质存储有机器可执行指令,所述机器可执行指令被处理器执行时实现权利要求1-9中任意一项所述的应用AI的大数据风控处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410065283.1A CN117893214A (zh) | 2024-01-16 | 2024-01-16 | 应用ai的大数据风控处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410065283.1A CN117893214A (zh) | 2024-01-16 | 2024-01-16 | 应用ai的大数据风控处理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117893214A true CN117893214A (zh) | 2024-04-16 |
Family
ID=90650268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410065283.1A Pending CN117893214A (zh) | 2024-01-16 | 2024-01-16 | 应用ai的大数据风控处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117893214A (zh) |
-
2024
- 2024-01-16 CN CN202410065283.1A patent/CN117893214A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263821B (zh) | 交易特征生成模型的训练、交易特征的生成方法和装置 | |
CN111275491A (zh) | 一种数据处理方法及装置 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN110046806B (zh) | 用于客服派单的方法、装置和计算设备 | |
CN113516480A (zh) | 一种支付风险识别方法、装置及设备 | |
CN111932273B (zh) | 一种交易风险识别方法、装置、设备及介质 | |
CN111639690A (zh) | 基于关系图谱学习的欺诈分析方法、系统、介质及设备 | |
CN113657896A (zh) | 一种基于图神经网络的区块链交易拓扑图分析方法和装置 | |
CN112966113A (zh) | 一种数据的风险防控方法、装置及设备 | |
CN109783381B (zh) | 一种测试数据生成方法、装置及系统 | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
CN112950347B (zh) | 资源数据处理的优化方法及装置、存储介质、终端 | |
CN113379528A (zh) | 风控模型建立方法、装置和风险控制方法 | |
CN112632254A (zh) | 对话状态确定方法、终端设备及存储介质 | |
CN111784506A (zh) | 逾期风险控制方法、设备及可读存储介质 | |
CN116739795A (zh) | 基于知识图谱的保险风险评估方法、装置和电子设备 | |
CN116186223A (zh) | 一种金融文本处理方法、装置、设备和存储介质 | |
CN117893214A (zh) | 应用ai的大数据风控处理方法及系统 | |
CN111738358B (zh) | 一种数据识别方法、装置、设备和可读介质 | |
CN111859985B (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN114707990B (zh) | 一种用户行为模式的识别方法和装置 | |
CN115953248B (zh) | 基于沙普利可加性解释的风控方法、装置、设备及介质 | |
CN116484230B (zh) | 识别异常业务数据的方法及ai数字人的训练方法 | |
CN113706174A (zh) | 基于机器学习算法的违约预测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |