CN110717816A - 一种基于人工智能技术的全域金融风险知识图谱构建方法 - Google Patents

一种基于人工智能技术的全域金融风险知识图谱构建方法 Download PDF

Info

Publication number
CN110717816A
CN110717816A CN201910637072.XA CN201910637072A CN110717816A CN 110717816 A CN110717816 A CN 110717816A CN 201910637072 A CN201910637072 A CN 201910637072A CN 110717816 A CN110717816 A CN 110717816A
Authority
CN
China
Prior art keywords
risk
credit
data
network
financial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910637072.XA
Other languages
English (en)
Inventor
周春英
朱明杰
姜松涛
代俣西
蔡一鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Krypton Information Technology Co Ltd
Original Assignee
Shanghai Krypton Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Krypton Information Technology Co Ltd filed Critical Shanghai Krypton Information Technology Co Ltd
Priority to CN201910637072.XA priority Critical patent/CN110717816A/zh
Publication of CN110717816A publication Critical patent/CN110717816A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及到一种基于人工智能技术的全域金融风险知识图谱的构建方法,该方法具体包括如下步骤:构建金融机构已有全部信贷主体之间的关系网络;基于更新的关系网络提取相应的关联风险与团体欺诈风险画像特征;将具有同一用户ID的信贷主体的结构化数据,加工处理为个体维度的风险图像数据;将具有同一用户ID的信贷主体的非结构化数据,加工处理为个体维度风险画像数据;集成整合基于关系网络的关联和团伙风险画像特征和个体维度的风险画像数据,共同组成全域金融风险知识图谱。本发明的方法基于社交关系网络、自然语言处理、深度学习的金融风险知识图谱构建方法来提升金融风控能力、降低信贷风险。

Description

一种基于人工智能技术的全域金融风险知识图谱构建方法
技术领域
本发明涉及金融风控技术领域,特别是涉及一种基于人工智能技术的全域金融风险知识图谱构建方法。
背景技术
在线信贷申请金融业务中,金融机构常面临一些欺诈风险现状,个人身份欺诈风险,例如银行卡对应的手机号被改绑,冒充客服、冒充好友等非本人意愿的诈骗行为,以及返利套现、薅羊毛等欺诈行为;团伙欺诈风险,例如中介代办、黑产风险,这些都给银行业务和交易带来了极大的安全挑战。因此,面对越来越严重的在线信贷欺诈风险,各个金融机构都需要更多更全面的数据、和更先进的技术从而解决欺诈风险精准识别和管理最终降低信贷风险。
在整个在线信贷风控体系中,金融风险知识图谱(风险画像)是最核心的数据基础,支撑不论是规则、评分卡还是量化机器学习评分模型的构建和运行。但是,在线信贷业务与传统大额抵押信贷业务存在几个方面的差异,也导致在线信贷业务的风控管理技术对数据和技术的要求更高。具体差异和难点如下:
(1)在线信贷面临更严重和频发的团体欺诈、黑产、褥羊毛等风险,并且不是传统风险规则风控技术可以处理;
(2)欺诈风险模式变化快、新欺诈方法层出不穷,需要比传统风险规则方法更加复杂、难破解的技术手段例如机器学习量化模型,而全域、完整的风险知识图谱是数据基础;
(3)强征信数据例如央行征信数据覆盖率低,需要更深入的利用其它弱金融、非结构化数据,例如智能设备信息、App行为轨迹数据、客服语音数据等。而非结构化数据的加工处理需要更先进的技术,例如自然语言处理NLP和深度学习技术等来处理数据从而获得规则和评分卡、机器学习等量化模型可以使用的风险画像数据。
因此,金融风控领域急需一套更加科学合理以及成熟的基于社交关系网络、自然语言处理、深度学习的金融风险知识图谱构建方法来提升金融风控能力、降低信贷风险。
发明内容
本发明的目的是克服现有技术的不足,设计出一种全新的全域金融风险知识图谱构建方法。本发明的方法要更加科学合理和成熟,全部来基于社交关系网络、自然语言处理、深度学习的金融风险知识图谱构建方法来提升金融风控能力、降低信贷风险。
为达到上述目的,本发明所采用的技术方案是:
一种基于人工智能技术的全域金融风险知识图谱的构建方法,其特征在于,该方法具体包括如下步骤:
第一步,构建金融机构已有全部信贷主体之间的关系网络,关联关系网络依据申请资料信息重合建立;
第二步,提取被评估信贷主体ID和申请资料数据,对已构建信贷主体间的关系网络进行更新,基于更新的关系网络提取相应的关联风险与团体欺诈风险画像特征;
第三步,基于业务知识、数据领域知识和专家经验,将具有同一用户ID的信贷主体的结构化数据,加工处理为个体维度的风险图像数据;
第四步,利用深度学习技术,将具有同一用户ID的信贷主体的非结构化数据,加工处理为个体维度风险画像数据;
第五步,基于信贷主体ID集成整合基于关系网络的关联和团伙风险画像特征和个体维度的风险画像数据,共同组成全域金融风险知识图谱。
在本发明基于人工智能技术的全域金融风险知识图谱构建方法中,所述的第一步中构建金融机构已有全部信贷主体之间的关系网络的过程为:
首先,选择任一个已有信贷申请件作为网络的一个节点,信贷申请件的特定信息也作为节点,所述特定信息为单位地址和单位电话;
然后,针对所有信贷申请件,选定构建关系的定义条件,所述关系的定义条件包括两个贷款申请的手机号、家庭地址、单位地址、IP地址、联系人手机号、联系人身份证号及智能设备号任一信息相同;
最后,构建已有全部信贷申请件组成的关系网络。
在本发明基于人工智能技术的全域金融风险知识图谱构建方法中,所述第二步中基于更新后关系网络提取相应的关联风险与团体欺诈风险画像特征的具体步骤为:
首先,以信贷主体ID和特定信息新建为网络节点,所述特定信息包括单位地址和单位电话;
其次,根据关系网络的生成条件,构建该贷款申请件与已有网络节点之间的关系边,形成新的关系网络;
最后,基于更新的关系网络提取关联风险和团伙欺诈风险画像特征,局部网络风险特征和全局网络风险特征共同构成关联风险和团伙欺诈风险画像特征,所述局部网络结构特征包括有一度关联、二度关联和三度关联风险,局部网络结构特征在提取时采用图数据查询语言Cypher构建关系查询计算;特殊结构网络查询,包括四边形、六边形在内的结构提取时采取图数据查询语言Cypher构建图结构查询计算;全局网络风险提取使用社区挖掘算法-Approximate PageRank、Sweepcut来实现,识别出具有欺诈风险的群体网络。
在本发明基于人工智能技术的全域金融风险知识图谱构建方法中,两个信贷主体共用联系电话与家庭地址从而构成了四边形图结构,四边形图结构代表两个信贷主体的关系比一度关联还要紧密,欺诈风险的传播能力更强,通过计算相似四边形的风险指标,即紧密关联人的欺诈风险,表现它本身的欺诈风险。
在本发明基于人工智能技术的全域金融风险知识图谱构建方法中,所述关联和团伙欺诈风险画像特征中包括被评估贷款申请件的一度、二度及三度关联申请件的统计特征,由被评估申请件形成的特殊结构图的统计特征,其中一度、二度和三度关联风险,直接体现了信贷主体相关联其他信贷主体的风险,特殊结构图则代表特定风险表现的特征。
在本发明基于人工智能技术的全域金融风险知识图谱构建方法中,在所述第三步中,根据信贷主体ID获取相关的结构化数据,相关的结构化数据包括有央行征信、申请资料和行内资产交易数据,结合专家经验和数据处理技术,把金融风险领域可用数据加工为万维的风险画像特征,包括以下几类:(1)人行征信:申请资料与人行征信记录信息交叉比对,包括单位地址、单位名称是否一致;信用历史特征,包括逾期次数、贷款申请次数、公积金缴交状态;(2)储蓄卡交易流水:收入、支出情况,包括最近一个月收入金额、最近一个月支出金额、最近一个月支出最大类别、最近一年支出增长系数;(3)多头借贷情况,包括最近6个月申请互金贷款次数,最近6个月申请互金贷款总金额,最近1个月贷款还款次数,最近1个月贷款还款总金额数;(4)银行内资产:信贷主体的资产情况,包括最近6个月平均存款金额,最近6个月平均理财产品金额,当前是否有住房贷款,住房贷款金额。
在本发明基于人工智能技术的全域金融风险知识图谱构建方法中,所述第四步利用深度学习技术,将具有同一用户ID的信贷主体的非结构化数据,加工处理为个体维度风险画像数据,金融风险领域中可用的非结构化数据和加工方法包括:
(1)文本数据:包括客服及催收在内的电话语音转译为文本对话数据,用于风险模型构建,采用自然语言处理技术针对文本对话数据提取可用于风险建模的画像特征,所述文本对话数据处理和特征提取步骤包括:1)文本分词,把一段话切分为一组词的序列,2)无效词/停用词清理,3)经word2vector或sequence2vector词嵌入模型处理形成矩阵,4)CNN、bi-LSTM或gcn深度学习模型进行特征提取,形成信贷主体的风险画像特征;
(2)App行为数据:信贷主体在金融机构的App上的行为数据,可用于风险模型构建,需要利用深度学习模型做特征变量提取,其提取步骤包括:1)行为类别识别与归并,2)无效行为清理,3)经tf-idf、sequence2vector或auto-encoder模型做预处理形成矩阵,4)CNN、bi-LSTM或gcn深度学习模型进行特征提取,形成信贷主体的风险画像特征。
基于上述技术方案,本发明的积极有益效果:
1、本发明的一种基于人工智能技术的全域金融风险知识图谱构建方法,通过社交关系网络构建、图数据库技术、自然语言处理技术实现了金融机构已有信贷申请件组成的关系网络,并在此之上提取单一申请件的关联风险和团伙欺诈风险画像特征,从而为信贷风险评估提供了全面的数据基础,尤其是欺诈团伙和关联风险角度风险画像数据。
2、本发明的方法利用深度学习技术实现对非结构化数据的风险画像特征提取,尤其是文本数据、客服语音数据、时序数据,更全面和深入的信息价值挖掘,从而构建全域金融风险知识图谱,为信贷风险评估模型和决策提供坚实的数据基础。
3、本发明的方法利用首创的行为语言处理技术,针对信贷主体在该信贷App上留下的行为轨迹和智能设备信息,处理加工适用贷前、贷中和贷后的行为风险画像特征,从而进一步完善风险知识图谱。
附图说明
图1为本发明的基于信贷主体之间复杂关系网络提取的欺诈风险模式,包括局部网络结构风险、全局网络风险提取方法
图2为本发明信贷申请关系网络的构建方法,包括节点和边定义
图3为本发明基于专家经验和统计技术从结构化数据提取风险画像特征的方法
图4为本发明利用NLP和深度学习技术从文本对话提取风险画像特征的方法
图5利用深度学习技术从App行为数据提取风险画像特征的方法。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
本发明是一种基于人工智能技术的全域金融风险知识图谱构建方法,具体包括以下步骤:
第一步,构建金融机构已有全部信贷主体之间的关系网络,关联关系网络依据申请资料信息重合建立;
第二步,提取被评估信贷主体ID和申请资料数据,对已构建信贷主体间的关系网络进行更新,基于更新的关系网络提取相应的关联风险与团体欺诈风险画像特征;
第三步,基于业务知识、数据领域知识和专家经验,将具有同一用户ID的信贷主体的结构化数据,加工处理为个体维度的风险图像数据;
第四步,利用深度学习技术,将具有同一用户ID的信贷主体的非结构化数据,加工处理为个体维度风险画像数据;
第五步,基于信贷主体ID集成整合基于关系网络的关联和团伙风险画像特征和个体维度的风险画像数据,共同组成全域金融风险知识图谱。
在第一步中,构建金融机构已有全部信贷主体之间的关系网络,如图2所示。其具体包括流程是:首先,任一已有信贷申请件作为网络的一个节点,申请件的特定信息例如单位地址也作为节点;其次,针对所有申请件,根据构建关系(边)的条件,例如单位地址一致,构建已有全部信贷申请件组成的关系网络。作为优选地,所述同一信贷主体的各类身份原始数据包括身份证号、手机号、设备号、用户编号。
在第二步中,基于被评估信贷主体ID和申请资料数据,提取相应的关联风险与团体风险画像特征。基于更新后关系网络提取相应的关联风险与团体欺诈风险画像特征的具体步骤为:
首先,以信贷主体ID和特定信息新建为网络节点,所述特定信息包括单位地址和单位电话;
其次,根据关系网络的生成条件,构建该贷款申请件与已有网络节点之间的关系边,形成新的关系网络;
最后,基于更新的关系网络提取关联风险和团伙欺诈风险画像特征,局部网络风险特征和全局网络风险特征共同构成关联风险和团伙欺诈风险画像特征。
如图1所示,对于复杂关系网络,关联风险和团伙欺诈风险画像特征包括局部网络风险特征和全局网络风险特征。所述局部网络结构特征包括有一度关联、二度关联和三度关联风险,临近节点风险特征和群组风险征,还细分有N度关联特征、特殊风险网络结构和信息一致性检验,局部网络结构特征在提取时采用图数据查询语言Cypher构建关系查询计算;特殊结构网络查询,包括四边形、六边形在内的结构提取时采取图数据查询语言Cypher构建图结构查询计算。全局网络风险特征包括有疑似中介风险、疑似欺诈团队以及欺诈风险排序,其风险特征提取使用社区挖掘算法,例如Aproximate PageRank、Sweepcut等方式来实现,识别出具有欺诈风险的群体网络。
在第三步中,如图3所示,基于业务知识和数据领域知识、专家经验,将具有统一用户ID的信贷主体的结构化数据加工处理为个人维度的风险画像数据。,例如申请资料,央行征信数据等,加工处理为个人维度的风险画像数据。把金融风险领域可用数据加工为万维的风险画像特征,包括以下几类:(1)人行征信:申请资料与人行征信记录信息交叉比对,包括单位地址、单位名称是否一致;信用历史特征,包括逾期次数、贷款申请次数、公积金缴交状态;(2)储蓄卡交易流水:收入、支出情况,包括最近一个月收入金额、最近一个月支出金额、最近一个月支出最大类别、最近一年支出增长系数;(3)多头借贷情况,包括最近6个月申请互金贷款次数,最近6个月申请互金贷款总金额,最近1个月贷款还款次数,最近1个月贷款还款总金额数;(4)银行内资产:信贷主体的资产情况,包括最近6个月平均存款金额,最近6个月平均理财产品金额,当前是否有住房贷款,住房贷款金额。
在第四步中,如图4所示,利用深度学习技术,将具有统一用户ID的信贷主体的非结构化数据加工处理为个体维度风险画像数据。信贷主体的非结构化数据,包括文本数据、客户语音数据等,所述个体维度风险画像数据,包括基本信息、信贷历史、负债情况、资产统计、资料一致性等画像维度。在金融风险领域中,非结构化数据和加工方法包括:
(1)文本数据:包括客服及催收在内的电话语音转译为文本对话数据,用于风险模型构建,采用自然语言处理技术针对文本对话数据提取可用于风险建模的画像特征,所述文本对话数据处理和特征提取步骤包括:1)文本分词,把一段话切分为一组词的序列,2)无效词/停用词清理,3)经word2vector或sequence2vector词嵌入模型处理形成矩阵,4)CNN、bi-LSTM或gcn等深度学习模型进行特征提取,形成信贷主体的风险画像特征;
(2)App行为数据:信贷主体在金融机构的App上的行为数据,可用于风险模型构建,需要利用深度学习模型做特征变量提取,其提取步骤包括:1)行为类别识别与归并,2)无效行为清理,3)经tf-idf、sequence2vector或auto-encoder模型做预处理形成矩阵,4)CNN、bi-LSTM或gcn等深度学习模型进行特征提取,形成信贷主体的风险画像特征。
在第五步中,如图5所示,基于信贷主体ID,将前四步内容进行集成,从而整合基于关系网络的关联和团伙风险和个体维度的风险画像数据,形成全域金融风险知识图谱。
本发明是一种基于机器学习和大数据技术的信用评分构建方法,可以汇聚信贷主体的全域多维度大数据,包括移动互联网行为数据、贷款App内行为数据、信贷历史、运营商数据等,在此之上运用机器学习和大数据技术对信贷主体进行定量信用风险分析从而提升了金融风控能力和降低信贷风险。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解;依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (7)

1.一种基于人工智能技术的全域金融风险知识图谱的构建方法,其特征在于,该方法具体包括如下步骤:
第一步,构建金融机构已有全部信贷主体之间的关系网络,关联关系网络依据申请资料信息重合建立;
第二步,提取被评估信贷主体ID和申请资料数据,对已构建信贷主体间的关系网络进行更新,基于更新的关系网络提取相应的关联风险与团体欺诈风险画像特征;
第三步,基于业务知识、数据领域知识和专家经验,将具有同一用户ID的信贷主体的结构化数据,加工处理为个体维度的风险图像数据;
第四步,利用深度学习技术,将具有同一用户ID的信贷主体的非结构化数据,加工处理为个体维度风险画像数据;
第五步,基于信贷主体ID集成整合基于关系网络的关联和团伙风险画像特征和个体维度的风险画像数据,共同组成全域金融风险知识图谱。
2.根据权利要求1所述的一种基于人工智能技术的全域金融风险知识图谱构建方法,其特征在于,所述的第一步中构建金融机构已有全部信贷主体之间的关系网络的过程为:
首先,选择任一个已有信贷申请件作为网络的一个节点,信贷申请件的特定信息也作为节点,所述特定信息为单位地址和单位电话;
然后,针对所有信贷申请件,选定构建关系的定义条件,所述关系的定义条件包括两个贷款申请的手机号、家庭地址、单位地址、IP地址、联系人手机号、联系人身份证号及智能设备号任一信息相同;
最后,构建已有全部信贷申请件组成的关系网络。
3.根据权利要求1所述的一种基于人工智能技术的全域金融风险知识图谱构建方法,其特征在于,所述第二步中基于更新后关系网络提取相应的关联风险与团体欺诈风险画像特征的具体步骤为:
首先,以信贷主体ID和特定信息新建为网络节点,所述特定信息包括单位地址和单位电话;
其次,根据关系网络的生成条件,构建该贷款申请件与已有网络节点之间的关系边,形成新的关系网络;
最后,基于更新的关系网络提取关联风险和团伙欺诈风险画像特征,局部网络风险特征和全局网络风险特征共同构成关联风险和团伙欺诈风险画像特征,所述局部网络结构特征包括有一度关联、二度关联和三度关联风险,局部网络结构特征在提取时采用图数据查询语言Cypher构建关系查询计算;特殊结构网络查询,包括四边形、六边形在内的结构提取时采取图数据查询语言Cypher构建图结构查询计算;全局网络风险提取使用社区挖掘算法-Approximate PageRank、Sweepcut来实现,识别出具有欺诈风险的群体网络。
4.根据权利要求3所述的一种基于人工智能技术的全域金融风险知识图谱构建方法,其特征在于,两个信贷主体共用联系电话与家庭地址从而构成了四边形图结构,四边形图结构代表两个信贷主体的关系比一度关联还要紧密,欺诈风险的传播能力更强,通过计算相似四边形的风险指标,即紧密关联人的欺诈风险,表现它本身的欺诈风险。
5.根据权利要求3所述的一种基于人工智能技术的全域金融风险知识图谱构建方法,其特征在于,所述关联和团伙欺诈风险画像特征中包括被评估贷款申请件的一度、二度及三度关联申请件的统计特征,由被评估申请件形成的特殊结构图的统计特征,其中一度、二度和三度关联风险,直接体现了信贷主体相关联其他信贷主体的风险,特殊结构图则代表特定风险表现的特征。
6.根据权利要求1所述的一种基于人工智能技术的全域金融风险知识图谱构建方法,其特征在于,在所述第三步中,根据信贷主体ID获取相关的结构化数据,相关的结构化数据包括有央行征信、申请资料和行内资产交易数据,结合专家经验和数据处理技术,把金融风险领域可用数据加工为万维的风险画像特征,包括以下几类:(1)人行征信:申请资料与人行征信记录信息交叉比对,包括单位地址、单位名称是否一致;信用历史特征,包括逾期次数、贷款申请次数、公积金缴交状态;(2)储蓄卡交易流水:收入、支出情况,包括最近一个月收入金额、最近一个月支出金额、最近一个月支出最大类别、最近一年支出增长系数;(3)多头借贷情况,包括最近6个月申请互金贷款次数,最近6个月申请互金贷款总金额,最近1个月贷款还款次数,最近1个月贷款还款总金额数;(4)银行内资产:信贷主体的资产情况,包括最近6个月平均存款金额,最近6个月平均理财产品金额,当前是否有住房贷款,住房贷款金额。
7.根据权利要求1所述的一种基于人工智能技术的全域金融风险知识图谱构建方法,其特征在于,所述第四步利用深度学习技术,将具有同一用户ID的信贷主体的非结构化数据,加工处理为个体维度风险画像数据,金融风险领域中可用的非结构化数据和加工方法包括:
(1)文本数据:包括客服及催收在内的电话语音转译为文本对话数据,用于风险模型构建,采用自然语言处理技术针对文本对话数据提取可用于风险建模的画像特征,所述文本对话数据处理和特征提取步骤包括:1)文本分词,把一段话切分为一组词的序列,2)无效词/停用词清理,3)经word2vector或sequence2vector词嵌入模型处理形成矩阵,4)CNN、bi-LSTM或gcn深度学习模型进行特征提取,形成信贷主体的风险画像特征;
(2)App行为数据:信贷主体在金融机构的App上的行为数据,可用于风险模型构建,需要利用深度学习模型做特征变量提取,其提取步骤包括:1)行为类别识别与归并,2)无效行为清理,3)经tf-idf、sequence2vector或auto-encoder模型做预处理形成矩阵,4)CNN、bi-LSTM或gcn深度学习模型进行特征提取,形成信贷主体的风险画像特征。
CN201910637072.XA 2019-07-15 2019-07-15 一种基于人工智能技术的全域金融风险知识图谱构建方法 Pending CN110717816A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910637072.XA CN110717816A (zh) 2019-07-15 2019-07-15 一种基于人工智能技术的全域金融风险知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910637072.XA CN110717816A (zh) 2019-07-15 2019-07-15 一种基于人工智能技术的全域金融风险知识图谱构建方法

Publications (1)

Publication Number Publication Date
CN110717816A true CN110717816A (zh) 2020-01-21

Family

ID=69210158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910637072.XA Pending CN110717816A (zh) 2019-07-15 2019-07-15 一种基于人工智能技术的全域金融风险知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN110717816A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784495A (zh) * 2020-06-04 2020-10-16 江苏常熟农村商业银行股份有限公司 担保圈识别方法、装置、计算机设备和存储介质
CN111800546A (zh) * 2020-07-07 2020-10-20 中国工商银行股份有限公司 构建识别模型以及识别的方法、装置、系统和电子设备
CN111859922A (zh) * 2020-07-31 2020-10-30 上海银行股份有限公司 实体关系抽取技术在银行风控中的应用方法
CN111915426A (zh) * 2020-08-04 2020-11-10 中投国信(北京)科技发展有限公司 基于图计算及社区划分算法区分信贷用户的方法及系统
CN112330373A (zh) * 2020-11-30 2021-02-05 中国银联股份有限公司 用户行为分析方法、装置及计算机可读存储介质
CN112463981A (zh) * 2020-11-26 2021-03-09 福建正孚软件有限公司 一种基于深度学习的企业内部经营管理风险识别提取方法及系统
CN112686679A (zh) * 2020-12-31 2021-04-20 天津工业大学 一种客户关联关系智能分析系统及方法
CN112884564A (zh) * 2021-01-08 2021-06-01 四川新网银行股份有限公司 一种基于多方安全计算的实时共债风险管控系统和方法
CN113011990A (zh) * 2021-02-01 2021-06-22 深圳无域科技技术有限公司 虚拟连接网络系统及其信息获取方法
TWI736233B (zh) * 2020-04-23 2021-08-11 兆豐國際商業銀行股份有限公司 貸前調查系統以及貸前調查方法
CN113436010A (zh) * 2021-08-10 2021-09-24 四川新网银行股份有限公司 一种实时识别公积金代缴贷款诈骗的系统、方法
CN113610626A (zh) * 2021-07-26 2021-11-05 建信金融科技有限责任公司 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质
CN113704623A (zh) * 2021-08-31 2021-11-26 平安银行股份有限公司 一种数据推荐方法、装置、设备及存储介质
CN113961760A (zh) * 2021-10-26 2022-01-21 北京市科学技术情报研究所 基于区块链的信息价值图谱构建方法
CN114997558A (zh) * 2022-04-02 2022-09-02 南京视察者智能科技有限公司 一种基于用户画像的风险人员精准分析方法
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN115689720A (zh) * 2022-09-02 2023-02-03 睿智合创(北京)科技有限公司 一种基于风险归因的新增风险监控系统
CN116149885A (zh) * 2023-04-20 2023-05-23 北京神州邦邦技术服务有限公司 一种泛it服务风险预测方法及系统
CN116611903A (zh) * 2023-07-18 2023-08-18 太仓市律点信息技术有限公司 基于数字金融服务的大数据处理方法、服务器及存储介质
CN116703553A (zh) * 2023-08-07 2023-09-05 浙江鹏信信息科技股份有限公司 金融反欺诈风险监控方法、系统及可读存储介质
CN116882495A (zh) * 2023-02-27 2023-10-13 中央民族大学 一种基于动态知识图谱的前沿基因技术安全画像方法
CN117435963A (zh) * 2023-12-19 2024-01-23 百融云创科技股份有限公司 数字资产欺诈群体确定方法、装置、电子设备和存储介质
CN117726452A (zh) * 2023-12-18 2024-03-19 琥珀投资基金管理(武汉)有限公司 金融智能大数据分析与风险管理系统
CN117876104A (zh) * 2024-03-13 2024-04-12 湖南三湘银行股份有限公司 一种基于ai语言模型的智能信贷管控方法及系统
CN117876103A (zh) * 2024-03-12 2024-04-12 杭银消费金融股份有限公司 一种人行征信用户画像搭建方法及系统

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI736233B (zh) * 2020-04-23 2021-08-11 兆豐國際商業銀行股份有限公司 貸前調查系統以及貸前調查方法
CN111784495B (zh) * 2020-06-04 2021-05-04 江苏常熟农村商业银行股份有限公司 担保圈识别方法、装置、计算机设备和存储介质
CN111784495A (zh) * 2020-06-04 2020-10-16 江苏常熟农村商业银行股份有限公司 担保圈识别方法、装置、计算机设备和存储介质
CN111800546A (zh) * 2020-07-07 2020-10-20 中国工商银行股份有限公司 构建识别模型以及识别的方法、装置、系统和电子设备
CN111859922A (zh) * 2020-07-31 2020-10-30 上海银行股份有限公司 实体关系抽取技术在银行风控中的应用方法
CN111859922B (zh) * 2020-07-31 2023-12-01 上海银行股份有限公司 实体关系抽取技术在银行风控中的应用方法
CN111915426A (zh) * 2020-08-04 2020-11-10 中投国信(北京)科技发展有限公司 基于图计算及社区划分算法区分信贷用户的方法及系统
CN112463981A (zh) * 2020-11-26 2021-03-09 福建正孚软件有限公司 一种基于深度学习的企业内部经营管理风险识别提取方法及系统
CN112330373A (zh) * 2020-11-30 2021-02-05 中国银联股份有限公司 用户行为分析方法、装置及计算机可读存储介质
CN112686679A (zh) * 2020-12-31 2021-04-20 天津工业大学 一种客户关联关系智能分析系统及方法
CN112884564A (zh) * 2021-01-08 2021-06-01 四川新网银行股份有限公司 一种基于多方安全计算的实时共债风险管控系统和方法
CN113011990A (zh) * 2021-02-01 2021-06-22 深圳无域科技技术有限公司 虚拟连接网络系统及其信息获取方法
CN113610626A (zh) * 2021-07-26 2021-11-05 建信金融科技有限责任公司 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质
CN113436010A (zh) * 2021-08-10 2021-09-24 四川新网银行股份有限公司 一种实时识别公积金代缴贷款诈骗的系统、方法
CN113704623A (zh) * 2021-08-31 2021-11-26 平安银行股份有限公司 一种数据推荐方法、装置、设备及存储介质
CN113704623B (zh) * 2021-08-31 2024-04-16 平安银行股份有限公司 一种数据推荐方法、装置、设备及存储介质
CN113961760A (zh) * 2021-10-26 2022-01-21 北京市科学技术情报研究所 基于区块链的信息价值图谱构建方法
CN113961760B (zh) * 2021-10-26 2022-04-19 北京市科学技术情报研究所 基于区块链的信息价值图谱构建方法
CN114997558A (zh) * 2022-04-02 2022-09-02 南京视察者智能科技有限公司 一种基于用户画像的风险人员精准分析方法
CN115689720A (zh) * 2022-09-02 2023-02-03 睿智合创(北京)科技有限公司 一种基于风险归因的新增风险监控系统
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN116882495A (zh) * 2023-02-27 2023-10-13 中央民族大学 一种基于动态知识图谱的前沿基因技术安全画像方法
CN116882495B (zh) * 2023-02-27 2024-02-09 中央民族大学 一种基于动态知识图谱的前沿基因技术安全画像方法
CN116149885A (zh) * 2023-04-20 2023-05-23 北京神州邦邦技术服务有限公司 一种泛it服务风险预测方法及系统
CN116611903A (zh) * 2023-07-18 2023-08-18 太仓市律点信息技术有限公司 基于数字金融服务的大数据处理方法、服务器及存储介质
CN116611903B (zh) * 2023-07-18 2023-09-22 太仓市律点信息技术有限公司 基于数字金融服务的大数据处理方法、服务器及存储介质
CN116703553A (zh) * 2023-08-07 2023-09-05 浙江鹏信信息科技股份有限公司 金融反欺诈风险监控方法、系统及可读存储介质
CN116703553B (zh) * 2023-08-07 2023-12-05 浙江鹏信信息科技股份有限公司 金融反欺诈风险监控方法、系统及可读存储介质
CN117726452A (zh) * 2023-12-18 2024-03-19 琥珀投资基金管理(武汉)有限公司 金融智能大数据分析与风险管理系统
CN117435963A (zh) * 2023-12-19 2024-01-23 百融云创科技股份有限公司 数字资产欺诈群体确定方法、装置、电子设备和存储介质
CN117435963B (zh) * 2023-12-19 2024-04-12 百融云创科技股份有限公司 数字资产欺诈群体确定方法、装置、电子设备和存储介质
CN117876103A (zh) * 2024-03-12 2024-04-12 杭银消费金融股份有限公司 一种人行征信用户画像搭建方法及系统
CN117876104A (zh) * 2024-03-13 2024-04-12 湖南三湘银行股份有限公司 一种基于ai语言模型的智能信贷管控方法及系统
CN117876104B (zh) * 2024-03-13 2024-08-13 湖南三湘银行股份有限公司 一种基于ai语言模型的智能信贷管控方法及系统

Similar Documents

Publication Publication Date Title
CN110717816A (zh) 一种基于人工智能技术的全域金融风险知识图谱构建方法
WO2020119272A1 (zh) 风险识别模型训练方法、装置及服务器
CN107330785A (zh) 一种基于大数据智能风控的小额贷款系统及方法
CN106530078A (zh) 基于跨行业数据的贷款风险预警方法及系统
CN103678659A (zh) 一种基于随机森林算法的电子商务网站欺诈用户识别方法及系统
Zhan et al. A loan application fraud detection method based on knowledge graph and neural network
CN108961032A (zh) 借贷处理方法、装置以及服务器
CN110209729B (zh) 数据转移对象识别的方法及装置
CN112200656A (zh) 一种房贷的线上预审批方法、装置、介质及电子设备
CN105243591A (zh) 一种应用大数据监管互联网金融大额资金风险监测方法
TW202107382A (zh) 基於智慧互動的主動風控方法和系統
CN111708883A (zh) 一种基于机器学习和设备指纹的授信额度确定方法及装置
CN107679977A (zh) 一种基于语义分析的税务管理平台及实现方法
CN111914542A (zh) 疑似非法集资市场主体识别方法、装置、终端及存储介质
CN114782161A (zh) 识别风险用户的方法、装置、存储介质及电子装置
Xu et al. PEER-TO-PEER LOAN FRAUD DETECTION: CONSTRUCTING FEATURES FROM TRANSACTION DATA.
Kaur et al. Fin Tech Companies in India: A Study of Growth Analysis
CN115375480A (zh) 基于图神经网络的异常虚拟币钱包地址检测方法
CN114463119A (zh) 信用评估方法、装置及电子设备
CN109710628A (zh) 信息处理方法及装置、系统、计算机及可读存储介质
CN117611250A (zh) 问卷数据处理方法、装置、计算机设备和存储介质
CN116993490A (zh) 一种基于人工智能的银行场景自动处理方法及系统
CN115170130A (zh) 一种基于比特币交易分析的Tor非法用户去匿名化方法
CN110766091B (zh) 一种套路贷团伙的识别方法及系统
CN113657902A (zh) 基于图数据库的金融安全管理方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200121

RJ01 Rejection of invention patent application after publication