CN113298634A - 基于时序特征和图神经网络的用户风险预测方法及装置 - Google Patents

基于时序特征和图神经网络的用户风险预测方法及装置 Download PDF

Info

Publication number
CN113298634A
CN113298634A CN202110464067.0A CN202110464067A CN113298634A CN 113298634 A CN113298634 A CN 113298634A CN 202110464067 A CN202110464067 A CN 202110464067A CN 113298634 A CN113298634 A CN 113298634A
Authority
CN
China
Prior art keywords
node
neural network
time sequence
graph
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110464067.0A
Other languages
English (en)
Other versions
CN113298634B (zh
Inventor
王磊
宋孟楠
苏绥绥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qiyue Information Technology Co Ltd
Original Assignee
Shanghai Qiyue Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qiyue Information Technology Co Ltd filed Critical Shanghai Qiyue Information Technology Co Ltd
Priority to CN202110464067.0A priority Critical patent/CN113298634B/zh
Publication of CN113298634A publication Critical patent/CN113298634A/zh
Application granted granted Critical
Publication of CN113298634B publication Critical patent/CN113298634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于时序特征和图神经网络的用户风险预测方法及装置,所述方法包括:构建关系网络;根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;对各个邻节点进行采样,得到固定个数的邻节点的时序特征向量序列,并训练图神经网络;通过梯度下降法最小化目标函数,得到所述图神经网络参数;将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;根据所述输出结果预测该用户的逾期风险。本发明综合用户之间的社交关系、以及用户特征在各个指定时间点的均值和变化趋势,提高了对用户风险预测的准确度。

Description

基于时序特征和图神经网络的用户风险预测方法及装置
技术领域
本发明涉及计算机信息处理技术领域,具体而言,涉及一种基于时序特征和图神经网络的用户风险预测方法、装置、电子设备及计算机可读介质。
背景技术
目前对于信贷用户的风险预测主要是基于深度学习和机器学习等,通过对用户的用户信息、金融属性、征信信息和消费行为数据等进行数据挖掘而得出。不管是深度学习,还是机器学习都只输入了个体用户的信息,无法结合用户之间的社交关系进行综合分析,从而降低了用户风险预测的准确度。
发明内容
本发明旨在解决无法结合用户之间的社交关系进行综合分析,从而降低了用户风险预测的准确度的技术问题。
为了解决上述技术问题,本发明第一方面提出一种基于时序特征和图神经网络的用户风险预测方法,所述方法包括:
基于历史用户通话信息、通讯录信息和逾期行为构建关系网络;
根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;
对各个邻节点进行采样,得到固定个数的邻节点;
根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络;
配置目标函数,通过梯度下降法最小化所述目标函数,得到所述图神经网络参数;
将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;
根据所述输出结果预测该用户的逾期风险。
根据本发明一种优选实施方式,所述基于历史用户通话信息、通讯录信息和逾期行为构建关系网络包括:
以历史用户作为节点,历史用户的逾期行为作为节点标签,历史用户通话信息和通讯录信息作为边,构建关系网络。
根据本发明一种优选实施方式,所述通话信息包括:通话时长和/或在预定时间内的通话次数。
根据本发明一种优选实施方式,节点v在在N个指定时间点的特征向量序列为{xv1、xv2…xvN},则节点v的时序特征向量Xv为:
Xv=Lstm({xv1,xv2…xvN})。
根据本发明一种优选实施方式,所述根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络包括:
将节点v在第k-1层固定个数的邻节点对应的时序特征向量序列进行聚合,得到节点v在第k层的聚合向量;
其中,节点v在第k层的聚合向量为:
Figure BDA0003039139790000021
其中,σ为非线性激活函数,
Figure BDA0003039139790000022
为平均节点v的邻节点在第k-1层的聚合向量,
Figure BDA0003039139790000023
为节点v在第k-1层的时序特征向量,Wk和Bk为所述图神经网络的参数。
根据本发明一种优选实施方式,所述目标函数为:
L=∑yvlog(σ(Zvθ)+(1-yv)(1-σ(Zvθ));
其中,yv为节点v的实际概率值,即标签值,θ为转换矩阵。
为解决上述技术问题,本发明第二方面提供一种基于时序特征和图神经网络的用户风险预测装置,所述装置包括:
第一构建模块,用于基于历史用户通话信息、通讯录信息和逾期行为构建关系网络;
第二构建模块,用于根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;
采样模块,用于对各个邻节点进行采样,得到固定个数的邻节点;
训练模块,用于根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络;
计算模块,用于配置目标函数,通过梯度下降法最小化所述目标函数,得到所述图神经网络参数;
输入模块,用于将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;
预测模块,用于根据所述输出结果预测该用户的逾期风险。
根据本发明一种优选实施方式,所述第一构建模块具体用于以历史用户作为节点,历史用户的逾期行为作为节点标签,历史用户通话信息和通讯录信息作为边,构建关系网络。
根据本发明一种优选实施方式,所述通话信息包括:通话时长和/或在预定时间内的通话次数。
根据本发明一种优选实施方式,节点v在在N个指定时间点的特征向量序列为{xv1、xv2…xvN},则节点v的时序特征向量Xv为:
Xv=Lstm({xv1,xv2…xvN})。
根据本发明一种优选实施方式,所述训练模块具体用于将节点v在第k-1层固定个数的邻节点对应的时序特征向量序列进行聚合,得到节点v在第k层的聚合向量;
其中,节点v在第k层的聚合向量为:
Figure BDA0003039139790000031
其中,σ为非线性激活函数,
Figure BDA0003039139790000041
为平均节点v的邻节点在第k-1层的聚合向量,
Figure BDA0003039139790000042
为节点v在第k-1层的时序特征向量,Wk和Bk为所述图神经网络的参数。
根据本发明一种优选实施方式,所述目标函数为:
L=∑yvlog(σ(Zvθ)+(1-yv)(1-σ(Zvθ));
其中,yv为节点v的实际概率值,即标签值,θ为转换矩阵。
为解决上述技术问题,本发明第三方面提供一种电子设备,包括:
处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行上述的方法。
为解决上述技术问题,本发明第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现上述方法。
本发明根据节点在多个指定时间点的特征向量序列构建节点的时序特征向量;通过时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;根据采样得到固定个数的邻节点对应的时序特征向量序列训练图神经网络,通过图神经网络来聚合用户关系网络中邻节点的时序特征向量,综合用户之间的社交关系、以及用户特征在各个指定时间点的均值和变化趋势来预测用户风险,提高了对用户风险预测的准确度。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1a~1b是本发明一种图结构的示意图;
图2是本发明一种基于时序特征和图神经网络的用户风险预测方法的流程示意图;
图3a~3c是本发明对关系网络中各个节点进行标签化处理的示意图;
图4是本发明一种基于时序特征和图神经网络的用户风险预测装置的结构框架示意图;
图5是根据本发明的一种电子设备的示例性实施例的结构框图;
图6是本发明一种计算机可读介质实施例的示意图。
具体实施方式
现在将参考附图来更加全面地描述本发明的示例性实施例,虽然各示例性实施例能够以多种具体的方式实施,但不应理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例是为了使本发明的内容更加完整,更加便于将发明构思全面地传达给本领域的技术人员。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的结构、性能、效果或者其他特征可以以任何合适的方式结合到一个或更多其他的实施例中。
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
本发明中,图神经网络(Graph Neural Network,GNN)是一种直接在图结构上运行的神经网络。本质上,图结构中的每个节点都与一个标签相关联,每个节点v都可以用其特征x_v表示并且与已标记的标签t_v相关联。GNN在给定部分标记的图G中,利用这已标记的节点来预测未标记的节点标签。其基本思想就是基于节点的局部邻居信息对节点进行embedding。直观来讲,就是通过神经网络来聚合每个节点及其周围节点的信息。主要包含采样和聚合(Sample and aggregate),首先使用图结构中节点之间连接信息,对邻节点进行采样,然后通过多层聚合函数不断地将相邻节点的信息融合在一起。聚合一个节点的邻节点信息时,采用平均的方法,并使用神经网络作聚合操作。如图1a~1b中的图结构,第k层的目标节点A通过k-1层的节点B、C、D聚合而来,而节点B又通过k-2层的节点A和C聚合而来,节点C又通过k-2层的节点A、B、E、F聚合而来,节点D又通过k-2层的节点A聚合而来。
请参阅图2,图2是本发明提供的一种基于时序特征和图神经网络的用户风险预测方法的流程图。如图2所示,所述方法包括:
S1、基于历史用户通话信息、通讯录信息和逾期行为构建关系网络;
本发明中,关系网络可以以图1a所示的图结构表示。在计算机科学中,图是一种数据结构,由顶点和边组成。图G可以通过顶点集合V和它包含的边E来进行描述,即:G=(V,E)。其中,顶点也称为节点。根据边的方向可以将图分为有向图和无向图。
以信贷业务为例,可以以历史用户作为节点,历史用户的逾期行为作为节点标签,历史用户通话信息和通讯录信息作为边,构建关系网络。其中,所述通话信息可以包括通话时长,或者在预定时间内的通话次数,也可以同时包括通话时长和预定时间内的通话次数。以通话时长为例,将历史用户作为节点,历史用户的通信录信息及历史用户之间的通话时长作为边,构建关系图。
S2、根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;
其中,所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势。在一种示例中,所述时序特征向量可以通过Lstm聚合函数来获取。若节点v在在N个指定时间点的特征向量序列为{xv1、xv2…xvN},则节点v的时序特征向量Xv为:
Xv=Lstm({xv1,xv2…xvN})。
其中,指定时间点可以是一个具体的时刻,也可以是预定的时间区间(比如,一天、一月、一年等)。示例性的,可以将一月作为指定时间点,用户在1-8月内每月与其他用户的通话时长作为各个指定时间点的特征向量xi,则1-8内的时序特征向量X根据1-8月内用户每月与其他用户的通话时长来确定,该时序特征向量X反映用户1-8月内与其他用户通话时长的均值及变化趋势。
S3、对各个邻节点进行采样,得到固定个数的邻节点;
本实施例对邻节点的采样方式不做具体限定,可以采用随机采样的方式,也可以根据节点的权重来采样,还可以通过对关系网络中的节点进行标签化处理来采样。
在一种具体示例中,可以采用反映当前节点与各个邻节点之间通话的亲密度的注意力权重进行采样;其中,注意力权重可以将当前节点与邻节点的通话信息转换为概率来确定。对于节点u,有邻居节点集合Vu,则第i个邻居节点ui的注意力权重
Figure BDA0003039139790000071
为:
Figure BDA0003039139790000072
其中,Pui是第i个节点的通话信息。
在具体采样过程中,可以根据当前节点与各个邻节点之间的注意力权重大小对各个邻节点进行排序,根据各个邻节点的排序采集固定个数的邻节点。此外,还可以根据当前节点与各个邻节点之间的注意力权重对各个节点进行加权采样。则先遍历每个邻节点,得到每个邻节点的采样分数,根据采样分数对各个邻节点进行排序,根据各个邻节点的排序采集固定个数的邻节点。其中,所述采样分数通过以下公式确定:
Figure BDA0003039139790000081
其中,wi是每个邻节点的注意力权重,R是遍历每个邻节点时产生的0到1之间的随机数,Si是每个邻节点的采样分数。
在另一种具体示例中,通过对关系网络中的节点进行标签化处理来进行采样,具体包括以下步骤:
S31、初始化各个节点排序得到节点初始排序;
以图3a中的关系网络为例,图3a中选取节点A的一度联系人和二度联系人对应的节点B、C、D、E、F、G、H,初始化各个节点的初始排序为1。其中,一度联系人关系是指两个用户具有直接关联关系,二度联系人关系是指两个用户具有间接关联关系。
S32、根据节点初始排序和邻节点初始排序生成节点标签;
其中,所述节点标签由节点签名字符串组成,包含节点初始排序编号和所有邻节点初始排序编号,示例性的,节点初始排序编号与所有邻节点初始排序编号之间可以用逗号隔开。如图3a中,每个节点的初始排序为1,节点A有3个邻节点B、C和D,则由节点A的初始排序和邻节点B、C、D的初始排序生成节点A标签(1,111);节点B有2个邻节点A和C,则生成节点B标签(1,11);节点C有4个邻节点A、B、E、F,则生成节点C标签(1,1111);节点D有3个邻节点A、G、H,则生成节点D标签(1,111),节点E、F、G、H的节点标签依次类推。
S33、根据节点标签和邻节点标签对各个节点排序生成各个节点新标签,直至各个节点新标签固定为止。
其中,所述节点标签由节点签名字符串组成,包含节点排序编号和所有邻节点排序编号,示例性的,节点排序编号与所有邻节点排序编号之间可以用逗号隔开。具体的,先根据节点标签对各个节点排序得到节点排序编号;具体排序方式可以预先设定,比如以升序来排序,即:先比较节点排序编号大小,若节点排序编号相等,则比较邻节点排序编号,若节点排序编号与邻节点排序编号都相等,则比较邻节点个数,邻节点个数少的排在邻节点个数多的节点之前。对图3a中各个节点排序后,得到如图3b所示各个节点的排序编号。再根据节点排序编号和邻节点排序编号生成节点新标签,具体在生成节点新标签时邻节点排序编号以升序排列。则图3b中节点A有3个邻节点B、C和D,则由节点A的节点排序编号和邻节点B、C、D的节点排序编号以升序排列生成节点A新标签(3,234);节点B有2个邻节点A和C,则生成节点B新标签(2,34);节点C有4个邻节点A、B、E、F,则生成节点C新标签(4,2223);节点D有3个邻节点A、G、H,则生成节点D新标签(3,113),节点E、F、G、H的节点新标签依次类推。最终生成的节点新标签如图3c所示。
生成节点新标签后,重复图3b~3c根据节点新标签对节点进行排序得到节点排序编号,再根据节点排序编号及所有邻节点的排序编号生成节点新标签,直至各个节点的标签不再变化为止,各个节点的固定标签即代表各个节点固定排序。各个节点的排序固定后,以各个节点的排序为权重来采集固定个数的邻节点。
S4、根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络;
具体的,对于节点v,根据邻节点排序采集k-1层前N个相邻节点对应的时序特征向量序列为{h1 k-1、h2 k-1…hN k-1},N为邻节点的固定个数。则将节点v在第k-1层N个邻节点对应的时序特征向量序列{h1 k-1、h2 k-1…hN k-1}进行聚合,得到节点v在第k层的聚合向量;
其中,节点v在第k层的聚合向量为:
Figure BDA0003039139790000091
其中,σ为非线性激活函数,
Figure BDA0003039139790000101
为平均节点v的邻节点在第k-1层的聚合向量,
Figure BDA0003039139790000102
为节点v在第k-1层的时序特征向量,Wk和Bk为所述图神经网络的参数。
S5、配置目标函数,通过梯度下降法最小化所述目标函数,得到所述图神经网络参数;
本实施例中,所述目标函数为:
L=∑yvlog(σ(Zvθ)+(1-yv)(1-σ(Zvθ));
其中,yv为节点v的实际概率值,即标签值,θ为转换矩阵。
本步骤通过梯度下降法对目标函数一步步的迭代求解,得到最小化的目标函数,和图神经网络参数值,即Wk和Bk
S6、将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;
其中,待预测用户通话信息可以包括通话时长,或者在预定时间内的通话次数,也可以同时包括通话时长和预定时间内的通话次数。
S7、根据所述输出结果预测该用户的逾期风险。
其中,逾期风险可以采用具体的概率值或者分数值来表示,图神经网络可以输出用户逾期概率、也可以输出用户逾期分数。
图4是本发明一种基于时序特征和图神经网络的用户风险预测装置的架构示意图,如图4所示,所述装置包括:
第一构建模块41,用于基于历史用户通话信息、通讯录信息和逾期行为构建关系网络;
第二构建模块42,用于根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;
采样模块43,用于对各个邻节点进行采样,得到固定个数的邻节点;
训练模块44,用于根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络;
计算模块45,用于配置目标函数,通过梯度下降法最小化所述目标函数,得到所述图神经网络参数;
输入模块46,用于将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;
预测模块47,用于根据所述输出结果预测该用户的逾期风险。
在一种具体实施方式中,所述第一构建模块41具体用于以历史用户作为节点,历史用户的逾期行为作为节点标签,历史用户通话信息和通讯录信息作为边,构建关系网络。其中,所述通话信息包括:通话时长和/或在预定时间内的通话次数。
节点v在在N个指定时间点的特征向量序列为{xv1、xv2…xvN},则节点v的时序特征向量Xv为:
Xv=Lstm({xv1,xv2…xvN})。
所述训练模块44具体用于将节点v在第k-1层固定个数的邻节点对应的时序特征向量序列进行聚合,得到节点v在第k层的聚合向量;
其中,节点v在第k层的聚合向量为:
Figure BDA0003039139790000111
其中,σ为非线性激活函数,
Figure BDA0003039139790000112
为平均节点v的邻节点在第k-1层的聚合向量,
Figure BDA0003039139790000113
为节点v在第k-1层的时序特征向量,Wk和Bk为所述图神经网络的参数。
所述目标函数为:
L=∑yvlog(σ(Zvθ)+(1-yv)(1-σ(Zvθ));
其中,yv为节点v的实际概率值,即标签值,θ为转换矩阵。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的实体形式的实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图5是根据本发明的一种电子设备的示例性实施例的结构框图。图5显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,该示例性实施例的电子设备500以通用数据处理设备的形式表现。电子设备500的组件可以包括但不限于:至少一个处理单元510、至少一个存储单元520、连接不同电子设备组件(包括存储单元520和处理单元510)的总线530、显示单元540等。
其中,所述存储单元520存储有计算机可读程序,其可以是源程序或都只读程序的代码。所述程序可以被处理单元510执行,使得所述处理单元510执行本发明各种实施方式的步骤。例如,所述处理单元510可以执行如图1所示的步骤。
所述存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。所述存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作电子设备、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备300(例如键盘、显示器、网络设备、蓝牙设备等)通信,使得用户能经由这些外部设备300与该电子设备500交互,和/或使得该电子设备500能与一个或多个其它数据处理设备(例如路由器、调制解调器等等)进行通信。这种通信可以通过输入/输出(I/O)接口550进行,还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)进行。网络适配器560可以通过总线530与电子设备500的其它模块通信。应当明白,尽管图5中未示出,电子设备500中可使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID电子设备、磁带驱动器以及数据备份存储电子设备等。
图6是本发明的一个计算机可读介质实施例的示意图。如图6所示,所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的电子设备、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。当所述计算机程序被一个或多个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:基于历史用户通话信息、通讯录信息和逾期行为构建关系网络;根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;对各个邻节点进行采样,得到固定个数的邻节点;根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络;配置目标函数,通过梯度下降法最小化所述目标函数,得到所述图神经网络参数;将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;根据所述输出结果预测该用户的逾期风险。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台数据处理设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行电子设备、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语音的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语音包括面向对象的程序设计语音—诸如Java、C++等,还包括常规的过程式程序设计语音—诸如“C”语音或类似的程序设计语音。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以执行计算机程序的方法、装置、电子设备或计算机可读介质来实现。可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现本发明的一些或者全部功能。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种基于时序特征和图神经网络的用户风险预测方法,其特征在于,所述方法包括:
基于历史用户通话信息、通讯录信息和逾期行为构建关系网络;
根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;
对各个邻节点进行采样,得到固定个数的邻节点;
根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络;
配置目标函数,通过梯度下降法最小化所述目标函数,得到所述图神经网络参数;
将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;
根据所述输出结果预测该用户的逾期风险。
2.根据权利要求1所述的方法,其特征在于,所述基于历史用户通话信息、通讯录信息和逾期行为构建关系网络包括:
以历史用户作为节点,历史用户的逾期行为作为节点标签,历史用户通话信息和通讯录信息作为边,构建关系网络。
3.根据权利要求2所述的方法,其特征在于,所述通话信息包括:通话时长和/或在预定时间内的通话次数。
4.根据权利要求1所述的方法,其特征在于,节点v在在N个指定时间点的特征向量序列为{xv1、xv2…xvN},则节点v的时序特征向量Xv为:
Xv=Lstm({xv1,xv2…xvN})。
5.根据权利要求1所述的方法,其特征在于,所述根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络包括:
将节点v在第k-1层固定个数的邻节点对应的时序特征向量序列进行聚合,得到节点v在第k层的聚合向量;
其中,节点v在第k层的聚合向量为:
Figure FDA0003039139780000021
其中,σ为非线性激活函数,
Figure FDA0003039139780000022
为平均节点v的邻节点在第k-1层的聚合向量,
Figure FDA0003039139780000023
为节点v在第k-1层的时序特征向量,Wk和Bk为所述图神经网络的参数。
6.根据权利要求1所述的方法,其特征在于,所述目标函数为:
L=∑yvlog(σ(Zvθ)+(1-yv)(1-σ(Zvθ));
其中,yv为节点v的实际概率值,即标签值,θ为转换矩阵。
7.一种基于时序特征和图神经网络的用户风险预测装置,其特征在于,所述装置包括:
第一构建模块,用于基于历史用户通话信息、通讯录信息和逾期行为构建关系网络;
第二构建模块,用于根据节点在N个指定时间点的特征向量序列构建节点的时序特征向量;所述时序特征向量反映节点特征在各个指定时间点的均值和变化趋势;
采样模块,用于对各个邻节点进行采样,得到固定个数的邻节点;
训练模块,用于根据所述固定个数的邻节点对应的时序特征向量序列训练图神经网络;
计算模块,用于配置目标函数,通过梯度下降法最小化所述目标函数,得到所述图神经网络参数;
输入模块,用于将待预测用户通话信息及通讯录信息输入所述图神经网络中得到输出结果;
预测模块,用于根据所述输出结果预测该用户的逾期风险。
8.根据权利要求7所述的装置,其特征在于,所述第一构建模块具体用于以历史用户作为节点,历史用户的逾期行为作为节点标签,历史用户通话信息和通讯录信息作为边,构建关系网络。
9.根据权利要求8所述的装置,其特征在于,所述通话信息包括:通话时长和/或在预定时间内的通话次数。
10.根据权利要求7所述的装置,其特征在于,节点v在在N个指定时间点的特征向量序列为{xv1、xv2…xvN},则节点v的时序特征向量Xv为:
Xv=Lstm({xv1,xv2…xvN})。
11.根据权利要求7所述的装置,其特征在于,所述训练模块具体用于将节点v在第k-1层固定个数的邻节点对应的时序特征向量序列进行聚合,得到节点v在第k层的聚合向量;
其中,节点v在第k层的聚合向量为:
Figure FDA0003039139780000031
其中,σ为非线性激活函数,
Figure FDA0003039139780000032
为平均节点v的邻节点在第k-1层的聚合向量,
Figure FDA0003039139780000033
为节点v在第k-1层的时序特征向量,Wk和Bk为所述图神经网络的参数。
12.根据权利要求7所述的装置,其特征在于,所述目标函数为:
L=∑yvlog(σ(Zvθ)+(1-yv)(1-σ(Zvθ));
其中,yv为节点v的实际概率值,即标签值,θ为转换矩阵。
13.一种电子设备,包括:
处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行根据权利要求1-6中任一项所述的方法。
14.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现权利要求1-6中任一项所述的方法。
CN202110464067.0A 2021-04-26 2021-04-26 基于时序特征和图神经网络的用户风险预测方法及装置 Active CN113298634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110464067.0A CN113298634B (zh) 2021-04-26 2021-04-26 基于时序特征和图神经网络的用户风险预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110464067.0A CN113298634B (zh) 2021-04-26 2021-04-26 基于时序特征和图神经网络的用户风险预测方法及装置

Publications (2)

Publication Number Publication Date
CN113298634A true CN113298634A (zh) 2021-08-24
CN113298634B CN113298634B (zh) 2023-09-05

Family

ID=77320471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110464067.0A Active CN113298634B (zh) 2021-04-26 2021-04-26 基于时序特征和图神经网络的用户风险预测方法及装置

Country Status (1)

Country Link
CN (1) CN113298634B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819070A (zh) * 2022-04-12 2022-07-29 重庆康洲大数据(集团)有限公司 基于图神经网络的时序数据自适应可信采样方法
CN117113148A (zh) * 2023-08-30 2023-11-24 上海智租物联科技有限公司 基于时序图神经网络的风险识别方法、装置及存储介质
US20240028744A1 (en) * 2022-07-21 2024-01-25 University Of Chinese Academy Of Sciences Dynamic network risk predicting method based on a graph neural network

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192131A (zh) * 2019-12-12 2020-05-22 上海淇玥信息技术有限公司 金融风险预测方法、装置和电子设备
CN111222976A (zh) * 2019-12-16 2020-06-02 北京淇瑀信息科技有限公司 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN112017061A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 基于贝叶斯深度学习的金融风险预测方法、装置和电子设备
CN112508691A (zh) * 2021-02-04 2021-03-16 北京淇瑀信息科技有限公司 基于关系网标签化和图神经网络的风险预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192131A (zh) * 2019-12-12 2020-05-22 上海淇玥信息技术有限公司 金融风险预测方法、装置和电子设备
CN111222976A (zh) * 2019-12-16 2020-06-02 北京淇瑀信息科技有限公司 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN112017061A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 基于贝叶斯深度学习的金融风险预测方法、装置和电子设备
CN112508691A (zh) * 2021-02-04 2021-03-16 北京淇瑀信息科技有限公司 基于关系网标签化和图神经网络的风险预测方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819070A (zh) * 2022-04-12 2022-07-29 重庆康洲大数据(集团)有限公司 基于图神经网络的时序数据自适应可信采样方法
US20240028744A1 (en) * 2022-07-21 2024-01-25 University Of Chinese Academy Of Sciences Dynamic network risk predicting method based on a graph neural network
US11934536B2 (en) * 2022-07-21 2024-03-19 University Of Chinese Academy Of Sciences Dynamic network risk predicting method based on a graph neural network
CN117113148A (zh) * 2023-08-30 2023-11-24 上海智租物联科技有限公司 基于时序图神经网络的风险识别方法、装置及存储介质
CN117113148B (zh) * 2023-08-30 2024-05-17 上海智租物联科技有限公司 基于时序图神经网络的风险识别方法、装置及存储介质

Also Published As

Publication number Publication date
CN113298634B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN112508691B (zh) 基于关系网标签化和图神经网络的风险预测方法及装置
CN113298634A (zh) 基于时序特征和图神经网络的用户风险预测方法及装置
CN113298221B (zh) 基于逻辑回归和图神经网络的用户风险预测方法及装置
CN111066021A (zh) 使用随机文档嵌入的文本数据表示学习
US20180068221A1 (en) System and Method of Advising Human Verification of Machine-Annotated Ground Truth - High Entropy Focus
CN110995459B (zh) 异常对象识别方法、装置、介质及电子设备
CN112395487B (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
CN113906452A (zh) 利用转移学习的低资源实体解析
US10755332B2 (en) Multi-perceptual similarity detection and resolution
CN107004163A (zh) 机器学习中的错误驱动的特征构思
CN115244587A (zh) 高效基础事实注释
CN109871311A (zh) 一种推荐测试用例的方法和装置
CN113254716B (zh) 视频片段检索方法、装置、电子设备和可读存储介质
CN110796482A (zh) 用于机器学习模型的金融数据分类方法、装置及电子设备
CN111190967B (zh) 用户多维度数据处理方法、装置及电子设备
CN112347316A (zh) 基于GraphSAGE的不良嗜好行为检测方法、装置及电子设备
CN111191677A (zh) 用户特征数据生成方法、装置及电子设备
CN113283222B (zh) 自动化报表生成方法、装置、计算机设备及存储介质
CN111241273A (zh) 文本数据分类方法、装置、电子设备及计算机可读介质
CN112966743A (zh) 基于多维度注意力的图片分类方法、系统、设备及介质
WO2023130960A1 (zh) 服务资源确定方法、装置及服务资源确定系统
CN113298116A (zh) 基于注意力权重的图嵌入特征提取方法、装置及电子设备
CN111143568A (zh) 一种论文分类时的缓冲方法、装置、设备及存储介质
CN114282121A (zh) 业务节点推荐方法、系统、设备及存储介质
CN113010687B (zh) 一种习题标签预测方法、装置、存储介质以及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant