CN117726452A - 金融智能大数据分析与风险管理系统 - Google Patents
金融智能大数据分析与风险管理系统 Download PDFInfo
- Publication number
- CN117726452A CN117726452A CN202311742045.1A CN202311742045A CN117726452A CN 117726452 A CN117726452 A CN 117726452A CN 202311742045 A CN202311742045 A CN 202311742045A CN 117726452 A CN117726452 A CN 117726452A
- Authority
- CN
- China
- Prior art keywords
- risk
- financial
- user
- family
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000011156 evaluation Methods 0.000 claims description 60
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 238000010586 diagram Methods 0.000 claims description 16
- 239000003086 colorant Substances 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012800 visualization Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 230000003862 health status Effects 0.000 claims description 6
- 230000010365 information processing Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract 1
- 230000006399 behavior Effects 0.000 description 17
- 238000012502 risk assessment Methods 0.000 description 9
- 230000002411 adverse Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了金融智能大数据分析与风险管理系统,涉及风险数据处理技术领域,该系统通过采用第一目标结构和第二目标结构,系统能够在建立个体用户与其家庭之间的关系网模型的基础上,实现对金融风险的全面评估。构建历史数据集C和风险模型,系统深度挖掘历史金融数据,提取多维度的金融风险信息。系统在金融交易记录和共同账户的基础上,构建了目标用户与直系家庭成员的个体关系,形成关系网模型。这有助于深入了解用户与家庭成员之间的关系模式,促进更细致清晰地呈现出个体之间的关系。引入风险类型标识和匹配成功项的个数,使得第一风险系数Fx1还考虑了其家庭成员的金融风险。这种多因素的考虑有助于更精准地定位可能的风险源。
Description
技术领域
本发明涉及风险数据处理技术领域,具体为金融智能大数据分析与风险管理系统。
背景技术
金融风险是指金融市场和金融机构所面临的可能导致财务损失或不良后果的不确定性因素。这种不确定性可能源于多方面的因素,其中一些潜在影响金融市场、金融机构以及个体投资者的财务健康,给金融行业带来了重要挑战。
在传统的金融风险管理中,通常只关注个体用户的金融活动,而忽视了用户与其家庭之间的关系。不考虑家庭维度的风险评估,可能导致对于家庭整体的风险盲区,错失对整个家庭的风险控制机会。此外,对于历史数据的利用也较为有限,仅仅依赖于个体用户的过往行为,缺乏信息化的处理历史数据,导致缺乏对未来风险的预测。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了金融智能大数据分析与风险管理系统,以解决背景技术提到的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:金融智能大数据分析与风险管理系统,包括采集模块、风险数据库、用户关系网模型构建模块、分析模块和评估模块;
所述采集模块用于采集若干个目标用户的信息数据和交易数据,确定为第一目标结构;并采集与所述用户目标相对应的家庭数据,作为第二目标结构;
所述第一目标结构包括用户属性、人群分割变量和个人交易变量;所述第二目标结构包括家庭人数属性和家庭风控变量;
所述风险数据库用于获取若干个目标用户历史金融数据,建立历史数据集C,并依据历史数据集C中提取若干个金融风险信息以及风险信息处理时长,建立风险模型并训练,获取风险项集D;依据风险项集D,建立若干个风险类型标识,所述风险类型标识包括欺诈风险、信息真实性风险、关联交易风险和套现风险;
所述用户关系网模型构建模块与风险数据库相连接,并依据若干个目标用户的历史金融数据、第一目标结构和第二目标结构,构建目标用户与家庭成员的关系网模型;并由分析模块将第一目标结构和第二目标结构进行分析提取第一风险特征,并依据第一风险特征匹配金融风险数据库中风险类型标识,依据匹配结果,结合第一目标结构和第二目标结构,计算获得第一风险系数Fx1;
所述评估模块将第一风险系数Fx1与第一风险阈值Q1进行对比,获得第一评估结果。
优选的,所述风险数据库包括历史数据采集单元、特征提取单元、风险数据单元和关联频繁项集单元;所述历史数据采集单元用于采集获取若干个目标用户的历史金融数据,建立历史数据集C;
所述特征提取单元用于从历史数据集A中提取若干个金融风险信息,并提取每个金融风险信息的频率、持续时间和发生的季节,作为第一输入变量,并将金融风险信息处理时长作为第二输入变量,输入风险模型中,以训练模型,获取风险项集D;
所述风险数据单元用于基于大数据技术,基于风险项集D,建立若干个风险类型标识,并存储在风险参照数据库中;风险类型标识包括:欺诈风险、信息真实性风险、关联交易风险和套现风险;
所述关联频繁项集单元用于依据用户的第一目标结构和第二目标结构,与风险参照数据库中的若干个风险类型标识进行匹配,获得匹配结果,并匹配每个风险类型标识的频率值M。
优选的,所述第一目标结构包括用户属性、人群分割变量和个人交易变量;
用户属性包括年龄、性别、家庭地址、联系信息、婚姻状况和教育水平;
人群分割变量包括用户的年收入范围、职业、家庭规模;
人交易变量包括个人交易历史交易记录、消费模式、交易频率、持有金融资产信息;
所述第二目标结构包括家庭人数属性和家庭风控变量;
家庭人数属性包括家庭成员的数量、家庭成员的年龄分布、家庭成员的职业分布;
家庭风控变量包括共同账户、家庭总支出、年储蓄水平、家庭成员的教育水平、家庭的负债情况、家庭成员的健康状况和社交网络数据;还包括第一直系亲属家庭成员的姓名、年龄、职业、收入、健康状况、财务状况和家庭地址信息。
优选的,所述第一风险系数Fx1由以下公式生成;
式中,Lx′表示为第一风险特征匹配金融风险数据库中,风险类型标识的匹配成功项的个数,A表示用户A,B表示用户A其他家庭成员,JTA表示为用户A历史匹配风险类型项数量,JTB表示用户A其他家庭成员匹配风险类型表示项数量,M表示风险项目量发生的频率;,TAi表示为用户A第i个风险类型项目量的处理时间;TBi示为用户A其他家庭成员第i个风险类型项目量的处理时间。
优选的,所述用户关系网模型构建模块包括关系网模型构建单元和关联单元,所述关系网模型构建单元用于基于金融交易记录和共同账户,构建目标用户与直系家庭成员的个体关系,并构建关系网模型;
关联单元用于分析金融交易记录中的资金流向,确定家庭成员之间的财务关系,包括共同账户和资金转移,形成第一用户关联信息;识别目标胡勇与家庭成员之间的共享金融资源,包括共同投资和共同贷款,形成第二用户关联信息。
优选的,所述用户关系网模型构建模块还包括关系权重计算单元和网络图分析单元;
所述关系权重计算单元依据第一用户关联信息和第二用户关联信息,提取交易频率、交易金额和账户通向数据,计算目标用户与每个家庭成员之间的关系权重;并依据时间因素,对历史数据进行时间窗口划分,反应关系变化;
所述网络图分析单元用于利用关系权重构建目标用户与家庭成员之间的网络节点图,节点标识个体,边标识个体之间的关系,标记边的粗细颜色,以标识关系的强弱性;并分析网络节点图的关系强度和结构,根据风险数据库的风险类型,设置风险指标。
优选的,还包括关联成员风险模块,所述关联成员风险模块用于计算第二风险系数Fx2;
第二风险系数Fx2的获取方式为:提取第二目标结构中,家庭风控变量的社交网络数据,通过大数据分析技术,采集目标用户在社交媒体每周的发布次数,好友的数量和社交关系的持续时间;并分析获得社交关系稳定得分Sjwd,社交活动频繁得分Sjhd和社交质量得分Gxdf;
并采集目标用户在社交媒体上的行为模式,包括负面言论和敏感信息分享数据,计算获得行为因子P;
所述行为因子P通过以下公式生成:
P=FMZB+MGZB;
式中,FMZB表示为负面言论次数,MGZB表示为敏感信息分享次数。
所述第二风险系数Fx2由以下公式生成:
Fx2=P*(w1*Sjwd+w2*Sjhd+w3*Gxdf);
其中,P表示行为因子,w1、w2和w3分别是社交关系稳定得分Sjwd,社交活动频繁得分Sjhd和社交质量得分Gxdf的比例系数,且0.25≤w1≤0.45,0.15≤w2≤0.35,0.40≤w3≤0.55,且0.80≤F1+F2+F3≤1.35。
优选的,所述评估模块包括第一评估单元和第二评估单元;
所述第一评估单元用于第一风险系数Fx1与第一阈值Q1进行比较,如果第一风险系数Fx1小于第一阈值Q1,则表示第一风险在接受范围内,获得第一评估结果为“风险低”或“正常”;获得第一合格标记;
如果第一风险系数Fx1大于或等于第一阈值Q1,则表示第一风险超过了阈值,获得第一评估结果为“风险高”或“异常”,并获得第一异常标记;
所述第二评估单元用于将第二风险系数Fx2与第二阈值Q2进行比较,所述第一评估单元用于第二风险系数Fx2与第二阈值Q2进行比较,如果第二风险系数Fx2与第二阈值Q2进行比较,则表示第二风险在接受范围内,获得第二评估结果为“风险低”或“正常”,并获得第二合格标记;
如果第二风险系数Fx2大于或等于第二阈值Q2,则表示第二风险超过了阈值,获得第二评估结果为“风险高”或“异常”,并获得第二异常标记。
优选的,还包括标记单元,所述标记单元用于在关系网模型中,使用可视化工具或库,包括NetworkX或D3.js,将标记后的关系网模型进行可视化为每个目标用户和其家庭成员添加节点;每个节点使用不同的颜色或形状表示其对应的评估结果标记,设置第一合格标记和第二合格标记为绿色表示;
第一异常标记和第二异常标记为红色;
并在关系网中的边缘或连接线上添加标记,以表示与每个节点关联的具体评估结果;通过在边缘上添加标签,标签记载具体第一风险系数Fx1和第二风险系数Fx2的值。
优选的,还包括优先级模块,所述优先级模块用于为每个被评估的目标用户或家庭成员生成一个优先级顺序,根据其标记和评估结果来确定;
将为第一异常标记和第二异常标记的用户,依据第一风险系数Fx1和第二风险系数Fx2,由大至小进行排序,获得风险优先级处理名单,并发出风险警报,通知工作人员了解风险优先级处理名单的风险情况;并定期更新风险优先级处理名单。
(三)有益效果
本发明提供了金融智能大数据分析与风险管理系统。具备以下有益效果:
(1)该金融智能大数据分析与风险管理系统,采用第一目标结构和第二目标结构,系统能够在个体用户与其家庭之间建立关系网模型,实现对金融风险的全面评估。不仅关注个体用户的金融活动,还考虑家庭维度的风险因素,提高了评估的全面性和准确性。利用风险数据库构建历史数据集C,并建立风险模型,系统能够深度挖掘历史金融数据,提取多维度的金融风险信息。这有助于更好地理解用户和家庭的金融行为模式,为未来的风险预测提供更为准确的基础。引入第二目标结构中的家庭人数属性和家庭风控变量,系统可以对整个家庭的金融状况进行评估。这使得金融机构可以更全面地了解家庭整体的风险,从而采取有针对性的措施,降低家庭整体的金融风险。通过分析模块提取第一风险特征,结合金融风险数据库中的风险类型标识,系统可以智能化地计算第一风险系数Fx1。这个系数综合考虑了用户和家庭的多个维度信息,为风险评估提供更为精准的指标。评估模块将第一风险系数Fx1与第一风险阈值Q1进行对比,获得第一评估结果。这有助于金融机构及时了解用户和家庭的风险状况,迅速采取必要的风险管理措施,提高了风险管理的及时性和有效性。
(2)该金融智能大数据分析与风险管理系统,通过引入风险类型标识和匹配成功项的个数,这使得第一风险系数Fx1不仅仅反映了个体用户的风险,还考虑了其家庭成员的金融风险。公式中分别表示用户A和用户A其他家庭成员匹配风险类型的数量,能够区分不同家庭成员在金融风险中的贡献。这样的细分有助于更精准地定位可能的风险源。公式中的M表示风险项目发生的频率,这是对历史数据的统计,有助于识别哪些风险更为频繁发生。这样的考虑能够更全面地评估风险的实际影响程度。第一风险系数Fx1通过同时考虑个体用户和家庭成员,系统更全面地了解整个家庭的风险情况,提高了风险评估的精度和实用性。
(3)该金融智能大数据分析与风险管理系统,通过用户关系网模型构建模块,基于金融交易记录和共同账户,构建目标用户与直系家庭成员的个体关系,并构建关系网模型;
并分析形成第一关联信息和第二关联信息,并构建目标用户与家庭成员之间的网络节点图,促进更只管清晰呈现出个题之间的关系和标识,促进理解和分析。并分析网络节点图的关系强度和结构,根据风险数据库的风险类型,设置风险指标。这使系统能够深入了解用户与家庭成员之间的关系模式,包括关系的稳定性、层次结构等方面的特征。根据风险数据库的风险类型,系统可以在网络图中设置相应的风险指标。这有助于将风险因素直观地映射到关系图中,提高风险管理的可视化和实时性。
(4)该金融智能大数据分析与风险管理系统,使用可视化工具,将评估结果标记添加到关系网模型中,使得整个风险情况一目了然。不同颜色和形状的节点直观地表示了每个目标用户及其家庭成员的风险评估结果。这种可视化方式有助于用户更快速地理解复杂的风险网络。不同颜色的节点和边缘标签清晰地表示了不同的评估结果,如第一合格标记和第二合格标记为绿色,第一异常标记和第二异常标记为红色。这样的清晰标记有助于降低用户理解和解释评估结果的难度。
附图说明
图1为金融智能大数据分析与风险管理系统框图流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
金融风险是指金融市场和金融机构所面临的可能导致财务损失或不良后果的不确定性因素。这种不确定性可能源于多方面的因素,其中一些潜在影响金融市场、金融机构以及个体投资者的财务健康,给金融行业带来了重要挑战。
在传统的金融风险管理中,通常只关注个体用户的金融活动,而忽视了用户与其家庭之间的关系。不考虑家庭维度的风险评估,可能导致对于家庭整体的风险盲区,错失对整个家庭的风险控制机会。此外,对于历史数据的利用也较为有限,仅仅依赖于个体用户的过往行为,缺乏信息化的处理历史数据,导致缺乏对未来风险的预测。
实施例1
金融智能大数据分析与风险管理系统,请参照图1,包括采集模块、风险数据库、用户关系网模型构建模块、分析模块和评估模块;
所述采集模块用于采集若干个目标用户的信息数据和交易数据,确定为第一目标结构;并采集与所述用户目标相对应的家庭数据,作为第二目标结构;
所述第一目标结构包括用户属性、人群分割变量和个人交易变量;所述第二目标结构包括家庭人数属性和家庭风控变量;
所述风险数据库用于获取若干个目标用户历史金融数据,建立历史数据集C,并依据历史数据集C中提取若干个金融风险信息以及风险信息处理时长,建立风险模型并训练,获取风险项集D;依据风险项集D,建立若干个风险类型标识,所述风险类型标识包括欺诈风险、信息真实性风险、关联交易风险和套现风险;所述风险数据库包括历史数据采集单元、特征提取单元、风险数据单元和关联频繁项集单元;所述历史数据采集单元用于采集获取若干个目标用户的历史金融数据,建立历史数据集C;
所述特征提取单元用于从历史数据集A中提取若干个金融风险信息,并提取每个金融风险信息的频率、持续时间和发生的季节,作为第一输入变量,并将金融风险信息处理时长作为第二输入变量,输入风险模型中,以训练模型,获取风险项集D;
所述风险数据单元用于基于大数据技术,基于风险项集D,建立若干个风险类型标识,并存储在风险参照数据库中;风险类型标识包括:欺诈风险、信息真实性风险、关联交易风险和套现风险;
所述关联频繁项集单元用于依据用户的第一目标结构和第二目标结构,与风险参照数据库中的若干个风险类型标识进行匹配,获得匹配结果,并匹配每个风险类型标识的频率值M。
所述用户关系网模型构建模块与风险数据库相连接,并依据若干个目标用户的历史金融数据、第一目标结构和第二目标结构,构建目标用户与家庭成员的关系网模型;并由分析模块将第一目标结构和第二目标结构进行分析提取第一风险特征,并依据第一风险特征匹配金融风险数据库中风险类型标识,依据匹配结果,结合第一目标结构和第二目标结构,计算获得第一风险系数Fx1;
所述评估模块将第一风险系数Fx1与第一风险阈值Q1进行对比,获得第一评估结果。
本实施例中,采用第一目标结构和第二目标结构,系统能够在个体用户与其家庭之间建立关系网模型,实现对金融风险的全面评估。不仅关注个体用户的金融活动,还考虑家庭维度的风险因素,提高了评估的全面性和准确性。利用风险数据库构建历史数据集C,并建立风险模型,系统能够深度挖掘历史金融数据,提取多维度的金融风险信息。这有助于更好地理解用户和家庭的金融行为模式,为未来的风险预测提供更为准确的基础。引入第二目标结构中的家庭人数属性和家庭风控变量,系统可以对整个家庭的金融状况进行评估。这使得金融机构可以更全面地了解家庭整体的风险,从而采取有针对性的措施,降低家庭整体的金融风险。通过分析模块提取第一风险特征,结合金融风险数据库中的风险类型标识,系统可以智能化地计算第一风险系数Fx1。这个系数综合考虑了用户和家庭的多个维度信息,为风险评估提供更为精准的指标。评估模块将第一风险系数Fx1与第一风险阈值Q1进行对比,获得第一评估结果。这有助于金融机构及时了解用户和家庭的风险状况,迅速采取必要的风险管理措施,提高了风险管理的及时性和有效性。
实施例2
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,所述第一目标结构包括用户属性、人群分割变量和个人交易变量;
用户属性包括年龄、性别、家庭地址、联系信息、婚姻状况和教育水平;
人群分割变量包括用户的年收入范围、职业、家庭规模;
人交易变量包括个人交易历史交易记录、消费模式、交易频率、持有金融资产信息;系统可以深度挖掘个体用户的金融行为。这有助于更好地理解用户的交易习惯和风险行为,为定制化的风险管理提供支持。
所述第二目标结构包括家庭人数属性和家庭风控变量;
家庭人数属性包括家庭成员的数量、家庭成员的年龄分布、家庭成员的职业分布;
家庭风控变量包括共同账户、家庭总支出、年储蓄水平、家庭成员的教育水平、家庭的负债情况、家庭成员的健康状况和社交网络数据;这有助于家庭整体风险的评估和管理。还包括第一直系亲属家庭成员的姓名、年龄、职业、收入、健康状况、财务状况和家庭地址信息。
本实施例中,将第一目标结构和第二目标结构结合,系统能够全面分析个体用户和其所属家庭的综合情况。这有助于更全面地理解整个家庭的金融状况和风险特征,提高了风险评估的综合性。
实施例3
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,所述第一风险系数Fx1由以下公式生成;
式中,Lx′表示为第一风险特征匹配金融风险数据库中,风险类型标识的匹配成功项的个数,A表示用户A,B表示用户A其他家庭成员,JTA表示为用户A历史匹配风险类型项数量,JTB表示用户A其他家庭成员匹配风险类型表示项数量,M表示风险项目量发生的频率;,TAi表示为用户A第i个风险类型项目量的处理时间;TBi示为用户A其他家庭成员第i个风险类型项目量的处理时间。
假设对于目标用户A和其家庭成员B,成功匹配的风险类型标识为:
欺诈风险:匹配成功项数=2匹配成功项数=2
信息真实性风险:匹配成功项数=1匹配成功项数=1
关联交易风险:匹配成功项数=3匹配成功项数=3
套现风险:匹配成功项数=1匹配成功项数=1
其他参数可以根据具体数据进行设定。将这些值代入公式,计算第一风险系数Fx1。
本实施例中,通过引入风险类型标识和匹配成功项的个数,公式综合考虑了用户A及其家庭成员在历史数据中匹配到的多种风险类型。这使得第一风险系数Fx1不仅仅反映了个体用户的风险,还考虑了其家庭成员的金融风险。公式中分别表示用户A和用户A其他家庭成员匹配风险类型的数量,能够区分不同家庭成员在金融风险中的贡献。这样的细分有助于更精准地定位可能的风险源。公式中的M表示风险项目发生的频率,这是对历史数据的统计,有助于识别哪些风险更为频繁发生。这样的考虑能够更全面地评估风险的实际影响程度。
考虑了用户A和其家庭成员每个风险类型项目的处理时间。这使得系统不仅了解风险的发生频率,还能够评估风险事件的处理效率。对于风险项目的快速有效处理有助于减小潜在损失。家庭维度的整合,公式中的A和B的综合运用使得第一风险系数更具家庭维度。通过同时考虑个体用户和家庭成员,系统更全面地了解整个家庭的风险情况,提高了风险评估的精度和实用性。
实施例4
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,所述用户关系网模型构建模块包括关系网模型构建单元和关联单元,所述关系网模型构建单元用于基于金融交易记录和共同账户,构建目标用户与直系家庭成员的个体关系,并构建关系网模型;
关联单元用于分析金融交易记录中的资金流向,确定家庭成员之间的财务关系,包括共同账户和资金转移,形成第一用户关联信息;识别目标胡勇与家庭成员之间的共享金融资源,包括共同投资和共同贷款,形成第二用户关联信息。
本实施例中,关联单元不仅仅分析财务关系,还能够识别共享金融资源,如共同投资和共同贷款,形成第一和第二用户关联信息。这使得系统能够更全面地了解家庭成员之间的金融合作和共享情况。
实施例5
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,所述用户关系网模型构建模块还包括关系权重计算单元和网络图分析单元;
所述关系权重计算单元依据第一用户关联信息和第二用户关联信息,提取交易频率、交易金额和账户通向数据,计算目标用户与每个家庭成员之间的关系权重;这有助于量化关系的密切程度,提供更为具体的度量标准。
并依据时间因素,对历史数据进行时间窗口划分,反应关系变化;这有助于捕捉关系在不同时间段内的演变,使系统更灵活地适应不同时期的关系特征。
所述网络图分析单元用于利用关系权重构建目标用户与家庭成员之间的网络节点图,节点标识个体,边标识个体之间的关系,标记边的粗细颜色,以标识关系的强弱性;通过节点和边的标识,系统可以清晰地呈现出个体之间的关系。这种图形化的表达方式便于理解和分析。
并分析网络节点图的关系强度和结构,根据风险数据库的风险类型,设置风险指标。这使系统能够深入了解用户与家庭成员之间的关系模式,包括关系的稳定性、层次结构等方面的特征。根据风险数据库的风险类型,系统可以在网络图中设置相应的风险指标。这有助于将风险因素直观地映射到关系图中,提高风险管理的可视化和实时性。
实施例6
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,还包括关联成员风险模块,所述关联成员风险模块用于计算第二风险系数Fx2;
第二风险系数Fx2的获取方式为:提取第二目标结构中,家庭风控变量的社交网络数据,通过大数据分析技术,采集目标用户在社交媒体每周的发布次数,好友的数量和社交关系的持续时间;并分析获得社交关系稳定得分Sjwd,社交活动频繁得分Sjhd和社交质量得分Gxdf;
并采集目标用户在社交媒体上的行为模式,包括负面言论和敏感信息分享数据,计算获得行为因子P;
所述行为因子P通过以下公式生成:
P=FMZB+MGZB;
式中,FMZB表示为负面言论次数,MGZB表示为敏感信息分享次数。
所述第二风险系数Fx2由以下公式生成:
Fx2=P*(w1*Sjwd+w2*Sjhd+w3*Gxdf);
其中,P表示行为因子,w1、w2和w3分别是社交关系稳定得分Sjwd,社交活动频繁得分Sjhd和社交质量得分Gxdf的比例系数,且0.25≤w1≤0.45,0.15≤w2≤0.35,0.40≤w3≤0.55,且0.80≤F1+F2+F3≤1.35。
具体数据示例:假设家庭由家庭成员A,社交关系稳定得分Sjwd_A:每周发布次数WeeklyPosts_A=5;
好友数量FriendsCount_A=300;
社交关系持续时间DurationOfRelationship_A=3年;
Sjwd_A=(WeeklyPosts_A+(FriendsCount_A/100)+(DurationOfRelationship_A/2))/3;
Sjwd_A=(5+(300/100)+(3)/2)/3;Sjwd_A=(5+3+1.5)/3;Sjwd_A=9.5/3;Sjwd_A=3.167。社交活动频繁得分Sjhd_A:每周发布次数WeeklyPosts_A=5;Sjhd_A=WeeklyPosts_A/10;Sjhd_A=5/10;Sjhd_A=0.5;社交质量得分Gxdf_A:好友数量FriendsCount_A=300;社交关系持续时间DurationOfRelationship_A=3年;
Gxdf_A=(FriendsCount_A/100)+(DurationOfRelationship_A/2);Gxdf_A=(300/100)+(3/2);
Gxdf_A=3+1.5;Gxdf_A=4.5;
并将其他具体数值代入公式计算获得第二风险系数Fx2;通过关联成员风险模块,系统结合社交网络数据,包括目标用户在社交媒体上的发布次数、好友数量、社交关系持续时间等,对目标用户的社交活动进行综合分析。这有助于更全面地了解用户在社交网络中的活跃度和关系稳定性。提取社交网络数据后,计算得到社交关系稳定得分Sjwd。这一得分反映了用户在社交网络中的关系是否相对稳定,是社交网络维系的一个重要度量。通过分析目标用户的社交活动,系统计算获得社交活动频繁得分Sjhd。这一得分可用于评估用户在社交媒体上的活跃水平,进一步揭示用户的社交行为特征。通过综合考虑社交网络中的各项指标,系统计算获得社交质量得分Gxdf。这一得分有助于评估用户的社交网络质量,包括互动质量、关系深度等方面的特征。利用生成的行为因子P,以及社交关系稳定得分Sjwd、社交活动频繁得分Sjhd、社交质量得分Gxdf,系统通过公式计算得到第二风险系数Fx2。这一系数综合了用户的社交网络活动和行为特征,有助于全面评估用户的风险水平。
实施例7
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,所述评估模块包括第一评估单元和第二评估单元;
所述第一评估单元用于第一风险系数Fx1与第一阈值Q1进行比较,如果第一风险系数Fx1小于第一阈值Q1,则表示第一风险在接受范围内,获得第一评估结果为“风险低”或“正常”;获得第一合格标记;
如果第一风险系数Fx1大于或等于第一阈值Q1,则表示第一风险超过了阈值,获得第一评估结果为“风险高”或“异常”,并获得第一异常标记;
所述第二评估单元用于将第二风险系数Fx2与第二阈值Q2进行比较,所述第一评估单元用于第二风险系数Fx2与第二阈值Q2进行比较,如果第二风险系数Fx2与第二阈值Q2进行比较,则表示第二风险在接受范围内,获得第二评估结果为“风险低”或“正常”,并获得第二合格标记;
如果第二风险系数Fx2大于或等于第二阈值Q2,则表示第二风险超过了阈值,获得第二评估结果为“风险高”或“异常”,并获得第二异常标记。
本实施例中,设定第一和第二阈值Q1、Q2的方式,可以根据具体业务场景、风险容忍度等进行调整。这种灵活性使得系统可以根据实际需要进行定制,更好地适应各种复杂的金融和社交场景。根据第一和第二评估单元的比较结果,系统提供明确的评估结果和标记,包括“风险低”、“正常”、“风险高”、“异常”等,同时还有相应的合格标记和异常标记。这有助于工作人员更迅速、准确地理解和响应不同情况。
实施例8
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,还包括标记单元,所述标记单元用于在关系网模型中,使用可视化工具或库,包括NetworkX或D3.js,将标记后的关系网模型进行可视化为每个目标用户和其家庭成员添加节点;每个节点使用不同的颜色或形状表示其对应的评估结果标记,设置第一合格标记和第二合格标记为绿色表示;
第一异常标记和第二异常标记为红色;
并在关系网中的边缘或连接线上添加标记,以表示与每个节点关联的具体评估结果;通过在边缘上添加标签,标签记载具体第一风险系数Fx1和第二风险系数Fx2的值。
本实施例中,使用可视化工具,将评估结果标记添加到关系网模型中,使得整个风险情况一目了然。不同颜色和形状的节点直观地表示了每个目标用户及其家庭成员的风险评估结果。这种可视化方式有助于用户更快速地理解复杂的风险网络。不同颜色的节点和边缘标签清晰地表示了不同的评估结果,如第一合格标记和第二合格标记为绿色,第一异常标记和第二异常标记为红色。这样的清晰标记有助于降低用户理解和解释评估结果的难度。在边缘或连接线上添加标签,显示第一风险系数Fx1和第二风险系数Fx2的具体数值,使得用户可以直接了解每个节点的风险水平。这样的细节呈现有助于更深入地了解系统的风险计算过程和结果。通过边缘或连接线上的标记,展示每个节点之间的具体关系,包括评估结果和风险系数的数值。这样的节点关系呈现有助于用户全面理解整个风险网络的结构和相互影响。可视化工具通常支持用户交互,用户可以通过拖动、缩放等操作对关系网模型进行互动式浏览。这种交互体验有助于用户更灵活地探索风险网络,深入了解具体的风险情况。
实施例9
本实施例是在实施例1中进行的解释说明,请参照图1,具体的,还包括优先级模块,所述优先级模块用于为每个被评估的目标用户或家庭成员生成一个优先级顺序,根据其标记和评估结果来确定;
将为第一异常标记和第二异常标记的用户,依据第一风险系数Fx1和第二风险系数Fx2,由大至小进行排序,获得风险优先级处理名单,并发出风险警报,通知工作人员了解风险优先级处理名单的风险情况;并定期更新风险优先级处理名单。
本实施例中,通过优先级模块,系统能够为每个被评估的目标用户或家庭成员生成一个优先级顺序。这种系统化的排序有助于将注意力集中在最高风险的个体上,提高了管理效率。将第一异常标记和第二异常标记的用户按照风险系数由大至小进行排序,有助于优先处理那些风险较高的个体。这样的处理方式可以及时采取措施,减少潜在的风险威胁。通过发出风险警报,系统可以及时通知相关工作人员了解风险优先级处理名单中的风险情况。这种即时的通知机制有助于迅速响应风险事件,减小潜在的财务损失或不良后果。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.金融智能大数据分析与风险管理系统,其特征在于:包括采集模块、风险数据库、用户关系网模型构建模块、分析模块和评估模块;
所述采集模块用于采集若干个目标用户的信息数据和交易数据,确定为第一目标结构;并采集与所述用户目标相对应的家庭数据,作为第二目标结构;
所述第一目标结构包括用户属性、人群分割变量和个人交易变量;所述第二目标结构包括家庭人数属性和家庭风控变量;
所述风险数据库用于获取若干个目标用户历史金融数据,建立历史数据集C,并依据历史数据集C中提取若干个金融风险信息以及风险信息处理时长,建立风险模型并训练,获取风险项集D;依据风险项集D,建立若干个风险类型标识,所述风险类型标识包括欺诈风险、信息真实性风险、关联交易风险和套现风险;
所述用户关系网模型构建模块与风险数据库相连接,并依据若干个目标用户的历史金融数据、第一目标结构和第二目标结构,构建目标用户与家庭成员的关系网模型;并由分析模块将第一目标结构和第二目标结构进行分析提取第一风险特征,并依据第一风险特征匹配金融风险数据库中风险类型标识,依据匹配结果,结合第一目标结构和第二目标结构,计算获得第一风险系数Fx1;
所述评估模块将第一风险系数Fx1与第一风险阈值Q1进行对比,获得第一评估结果。
2.根据权利要求1所述的金融智能大数据分析与风险管理系统,其特征在于:所述风险数据库包括历史数据采集单元、特征提取单元、风险数据单元和关联频繁项集单元;所述历史数据采集单元用于采集获取若干个目标用户的历史金融数据,建立历史数据集C;
所述特征提取单元用于从历史数据集A中提取若干个金融风险信息,并提取每个金融风险信息的频率、持续时间和发生的季节,作为第一输入变量,并将金融风险信息处理时长作为第二输入变量,输入风险模型中,以训练模型,获取风险项集D;
所述风险数据单元用于基于大数据技术,基于风险项集D,建立若干个风险类型标识,并存储在风险参照数据库中;风险类型标识包括:欺诈风险、信息真实性风险、关联交易风险和套现风险;
所述关联频繁项集单元用于依据用户的第一目标结构和第二目标结构,与风险参照数据库中的若干个风险类型标识进行匹配,获得匹配结果,并匹配每个风险类型标识的频率值M。
3.根据权利要求1所述的金融智能大数据分析与风险管理系统,其特征在于:所述第一目标结构包括用户属性、人群分割变量和个人交易变量;
用户属性包括年龄、性别、家庭地址、联系信息、婚姻状况和教育水平;
人群分割变量包括用户的年收入范围、职业、家庭规模;
人交易变量包括个人交易历史交易记录、消费模式、交易频率、持有金融资产信息;
所述第二目标结构包括家庭人数属性和家庭风控变量;
家庭人数属性包括家庭成员的数量、家庭成员的年龄分布、家庭成员的职业分布;
家庭风控变量包括共同账户、家庭总支出、年储蓄水平、家庭成员的教育水平、家庭的负债情况、家庭成员的健康状况和社交网络数据;还包括第一直系亲属家庭成员的姓名、年龄、职业、收入、健康状况、财务状况和家庭地址信息。
4.根据权利要求1所述的金融智能大数据分析与风险管理系统,其特征在于:所述第一风险系数Fx1由以下公式生成;
式中,Lx′表示为第一风险特征匹配金融风险数据库中,风险类型标识的匹配成功项的个数,A表示用户A,B表示用户A其他家庭成员,JTA表示为用户A历史匹配风险类型项数量,JTB表示用户A其他家庭成员匹配风险类型表示项数量,M表示风险项目量发生的频率;,TAi表示为用户A第i个风险类型项目量的处理时间;TBi示为用户A其他家庭成员第i个风险类型项目量的处理时间。
5.根据权利要求1所述的金融智能大数据分析与风险管理系统,其特征在于:所述用户关系网模型构建模块包括关系网模型构建单元和关联单元,所述关系网模型构建单元用于基于金融交易记录和共同账户,构建目标用户与直系家庭成员的个体关系,并构建关系网模型;
关联单元用于分析金融交易记录中的资金流向,确定家庭成员之间的财务关系,包括共同账户和资金转移,形成第一用户关联信息;识别目标胡勇与家庭成员之间的共享金融资源,包括共同投资和共同贷款,形成第二用户关联信息。
6.根据权利要求5所述的金融智能大数据分析与风险管理系统,其特征在于:所述用户关系网模型构建模块还包括关系权重计算单元和网络图分析单元;
所述关系权重计算单元依据第一用户关联信息和第二用户关联信息,提取交易频率、交易金额和账户通向数据,计算目标用户与每个家庭成员之间的关系权重;并依据时间因素,对历史数据进行时间窗口划分,反应关系变化;
所述网络图分析单元用于利用关系权重构建目标用户与家庭成员之间的网络节点图,节点标识个体,边标识个体之间的关系,标记边的粗细颜色,以标识关系的强弱性;并分析网络节点图的关系强度和结构,根据风险数据库的风险类型,设置风险指标。
7.根据权利要求6所述的金融智能大数据分析与风险管理系统,其特征在于:还包括关联成员风险模块,所述关联成员风险模块用于计算第二风险系数Fx2;
第二风险系数Fx2的获取方式为:提取第二目标结构中,家庭风控变量的社交网络数据,通过大数据分析技术,采集目标用户在社交媒体每周的发布次数,好友的数量和社交关系的持续时间;并分析获得社交关系稳定得分Sjwd,社交活动频繁得分Sjhd和社交质量得分Gxdf;
并采集目标用户在社交媒体上的行为模式,包括负面言论和敏感信息分享数据,计算获得行为因子P;
所述行为因子P通过以下公式生成:
P=FMZB+MGZB;
式中,FMZB表示为负面言论次数,MGZB表示为敏感信息分享次数。
所述第二风险系数Fx2由以下公式生成:
Fx2=P*(w1*Sjwd+w2*Sjhd+w3*Gxdf);
其中,P表示行为因子,w1、w2和w3分别是社交关系稳定得分Sjwd,社交活动频繁得分Sjhd和社交质量得分Gxdf的比例系数,且0.25≤w1≤0.45,0.15≤w2≤0.35,0.40≤w3≤0.55,且0.80≤F1+F2+F3≤1.35。
8.根据权利要求7所述的金融智能大数据分析与风险管理系统,其特征在于:所述评估模块包括第一评估单元和第二评估单元;
所述第一评估单元用于第一风险系数Fx1与第一阈值Q1进行比较,如果第一风险系数Fx1小于第一阈值Q1,则表示第一风险在接受范围内,获得第一评估结果为“风险低”或“正常”;获得第一合格标记;
如果第一风险系数Fx1大于或等于第一阈值Q1,则表示第一风险超过了阈值,获得第一评估结果为“风险高”或“异常”,并获得第一异常标记;
所述第二评估单元用于将第二风险系数Fx2与第二阈值Q2进行比较,所述第一评估单元用于第二风险系数Fx2与第二阈值Q2进行比较,如果第二风险系数Fx2与第二阈值Q2进行比较,则表示第二风险在接受范围内,获得第二评估结果为“风险低”或“正常”,并获得第二合格标记;
如果第二风险系数Fx2大于或等于第二阈值Q2,则表示第二风险超过了阈值,获得第二评估结果为“风险高”或“异常”,并获得第二异常标记。
9.根据权利要求8所述的金融智能大数据分析与风险管理系统,其特征在于:还包括标记单元,所述标记单元用于在关系网模型中,使用可视化工具或库,包括NetworkX或D3.js,将标记后的关系网模型进行可视化为每个目标用户和其家庭成员添加节点;每个节点使用不同的颜色或形状表示其对应的评估结果标记,设置第一合格标记和第二合格标记为绿色表示;
第一异常标记和第二异常标记为红色;
并在关系网中的边缘或连接线上添加标记,以表示与每个节点关联的具体评估结果;通过在边缘上添加标签,标签记载具体第一风险系数Fx1和第二风险系数Fx2的值。
10.根据权利要求9所述的金融智能大数据分析与风险管理系统,其特征在于:还包括优先级模块,所述优先级模块用于为每个被评估的目标用户或家庭成员生成一个优先级顺序,根据其标记和评估结果来确定;
将为第一异常标记和第二异常标记的用户,依据第一风险系数Fx1和第二风险系数Fx2,由大至小进行排序,获得风险优先级处理名单,并发出风险警报,通知工作人员了解风险优先级处理名单的风险情况;并定期更新风险优先级处理名单。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311742045.1A CN117726452A (zh) | 2023-12-18 | 2023-12-18 | 金融智能大数据分析与风险管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311742045.1A CN117726452A (zh) | 2023-12-18 | 2023-12-18 | 金融智能大数据分析与风险管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117726452A true CN117726452A (zh) | 2024-03-19 |
Family
ID=90206599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311742045.1A Pending CN117726452A (zh) | 2023-12-18 | 2023-12-18 | 金融智能大数据分析与风险管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117726452A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717816A (zh) * | 2019-07-15 | 2020-01-21 | 上海氪信信息技术有限公司 | 一种基于人工智能技术的全域金融风险知识图谱构建方法 |
CN111311107A (zh) * | 2020-03-02 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于用户关系的风险评估方法、装置和计算机设备 |
CN116308824A (zh) * | 2023-03-23 | 2023-06-23 | 平安健康保险股份有限公司 | 基于知识图谱的团伙欺诈风险识别方法及相关设备 |
CN116485527A (zh) * | 2023-04-26 | 2023-07-25 | 中国工商银行股份有限公司 | 一种金融信用风险分析方法及装置 |
CN116777600A (zh) * | 2023-06-25 | 2023-09-19 | 北京万合恒安科技有限公司 | 一种基于大数据的信用评估方法 |
CN117010914A (zh) * | 2023-08-08 | 2023-11-07 | 平安银行股份有限公司 | 风险团伙的识别方法、装置、计算机设备及存储介质 |
-
2023
- 2023-12-18 CN CN202311742045.1A patent/CN117726452A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717816A (zh) * | 2019-07-15 | 2020-01-21 | 上海氪信信息技术有限公司 | 一种基于人工智能技术的全域金融风险知识图谱构建方法 |
CN111311107A (zh) * | 2020-03-02 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于用户关系的风险评估方法、装置和计算机设备 |
CN116308824A (zh) * | 2023-03-23 | 2023-06-23 | 平安健康保险股份有限公司 | 基于知识图谱的团伙欺诈风险识别方法及相关设备 |
CN116485527A (zh) * | 2023-04-26 | 2023-07-25 | 中国工商银行股份有限公司 | 一种金融信用风险分析方法及装置 |
CN116777600A (zh) * | 2023-06-25 | 2023-09-19 | 北京万合恒安科技有限公司 | 一种基于大数据的信用评估方法 |
CN117010914A (zh) * | 2023-08-08 | 2023-11-07 | 平安银行股份有限公司 | 风险团伙的识别方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110188198B (zh) | 一种基于知识图谱的反欺诈方法及装置 | |
US20200192894A1 (en) | System and method for using data incident based modeling and prediction | |
US20130211880A1 (en) | Chat categorization and agent performance modeling | |
CN109829721B (zh) | 基于异质网络表征学习的线上交易多主体行为建模方法 | |
WO2021072128A1 (en) | Systems and methods for big data analytics | |
CN113434575B (zh) | 基于数据仓库的数据归因处理方法、装置及存储介质 | |
WO2019200739A1 (zh) | 数据欺诈识别方法、装置、计算机设备和存储介质 | |
CN116823496A (zh) | 基于人工智能的智能保险风险评估和定价系统 | |
US20230052225A1 (en) | Methods and computer systems for automated event detection based on machine learning | |
CN114140036A (zh) | 基于数据分析的企业画像方法、系统和可读存储介质 | |
CN108304990B (zh) | 一种停电敏感预判方法和系统 | |
Nestorov et al. | Generating insights through data preparation, visualization, and analysis: Framework for combining clustering and data visualization techniques for low-cardinality sequential data | |
CN117829994A (zh) | 一种基于图计算的洗钱风险分析方法 | |
US20230394582A1 (en) | User interface for guiding actions for desired impact | |
CN117172908A (zh) | 基于消费账单分析的业务贷款分期决策辅助系统 | |
CN116563028A (zh) | 基于ai的报送数据校验方法、系统及存储介质 | |
CN112348220A (zh) | 一种基于企业行为模式的信用风险评估预测方法及系统 | |
CN117726452A (zh) | 金融智能大数据分析与风险管理系统 | |
Zheng et al. | Data mining algorithm in the identification of accounting fraud by smart city information technology | |
CN114529383A (zh) | 实现税务缴纳追踪和税款流失预警方法及系统 | |
Wang | Optimization of Human Resource Performance Management System Based on Improved R‐Means Clustering Algorithm | |
CN111626887A (zh) | 一种社交关系评估方法及装置 | |
Qiu | [Retracted] Effect of Improved Association Algorithm on Mining and Recognition of Audit Data | |
Payne et al. | The Convergence Dynamics of Per Capita International Tourist Arrivals | |
Amato | Applications of Early Warning Systems for Customer Segmentation of Wholesale Banking Clients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |