CN112541669A - 风险识别方法、系统及装置 - Google Patents
风险识别方法、系统及装置 Download PDFInfo
- Publication number
- CN112541669A CN112541669A CN202011432613.4A CN202011432613A CN112541669A CN 112541669 A CN112541669 A CN 112541669A CN 202011432613 A CN202011432613 A CN 202011432613A CN 112541669 A CN112541669 A CN 112541669A
- Authority
- CN
- China
- Prior art keywords
- network
- behavior
- vector
- representation
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 239000013598 vector Substances 0.000 claims abstract description 193
- 230000006399 behavior Effects 0.000 claims abstract description 172
- 230000004927 fusion Effects 0.000 claims abstract description 63
- 238000012512 characterization method Methods 0.000 claims abstract description 52
- 230000008569 process Effects 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 46
- 238000013528 artificial neural network Methods 0.000 claims abstract description 22
- 238000010586 diagram Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 10
- 230000003993 interaction Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000013210 evaluation model Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供一种针对用户的风险识别方法,包括:先获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;接着,将多视图数据输入风险识别系统,其中画像表征网络处理用户画像信息,得到画像表征向量;图神经网络处理对关系网络图进行图嵌入处理,得到第一用户节点的图嵌入向量;行为表征网络处理行为数据,得到行为表征向量;表征融合网络至少对画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并利用该权重进行对应向量的加权融合,得到融合表征向量;风险识别网络处理融合表征向量,得到风险识别结果。
Description
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种针对用户的风险识别方法、一种风险识别系统、一种针对用户的风险识别装置。
背景技术
目前,服务平台中常会出现一些风险事件、风险行为,相应地,为维护平台的运营安全、稳定性,从而向用户提供更好的服务,需要对这些风险事件和行为进行及时的监控和处理。然而,目前通常是将单个事件或单个行为本身作为评估对象,且评估手段较为单一,导致对于风险事件和行为的识别效果有限,且容易陷入被动防守的局面。比如说,内容平台中通常会对发布内容进行风险监测,然而,单纯进行内容监测导致风险控制的有效性有限,内容平台中的违规内容仍层出不穷。
因此,需要一种方案,可以更加有效地识别风险,从而辅助平台实现风险控制,使得平台能够稳定、可靠地提供优质服务,进而提高用户体验。
发明内容
在本说明书描述的针对用户的风险识别方法及装置中,利用新设计的风险识别系统,对特定行为背后的施行主体进行风险识别,从而大幅提升平台风控的有效性。
根据第一方面,提供一种针对用户的风险识别方法,包括:获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;将所述多视图数据输入风险识别系统,该风险识别系统中包括画像表征网络、图神经网络、行为表征网络、表征融合网络和风险识别网络;其中,所述画像表征网络处理所述用户画像信息,得到画像表征向量;所述图神经网络处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;所述行为表征网络处理所述行为数据,得到行为表征向量;所述表征融合网络,至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;所述风险识别网络处理所述融合表征向量,得到风险识别结果。
在一个实施例中,所述关系网络图中包括多个用户节点,以及节点之间存在关联关系而形成的连接边;所述关联关系包括以下中的至少一种:社交关系、设备关系、交易关系和内容交互关系。
在一个实施例中,所述特定行为包括内容发布行为或信用行为。
在一个实施例中,所述行为数据包括按时间顺序排列的行为统计特征,所述行为表征网络实现为时序网络。
在一个具体的实施例中,所述特定行为包括内容发布行为;其中,获取第一用户的多视图数据,包括:获取所述第一用户发布的多篇内容;将所述多篇内容分别输入预先训练的内容评估模型中,得到多个内容评估结果;将基于所述多个内容评估结果确定的统计特征,归入所述行为统计特征。
在一个具体的实施中,在获取所述第一用户发布的多篇内容后,所述方法还包括:按照预定时间间隔对所述多篇内容进行分组,统计各组中所包含内容的重复率,归入所述行为统计特征。
在一个实施例中,所述风险识别系统还包括表征交叉网络;所述表征交叉网络,对所述画像表征向量、图嵌入向量和行为表征向量进行交叉组合处理,得到若干交叉表征向量;其中,所述表征融合网络,对所述画像表征向量、图嵌入向量、行为表征向量和若干交叉表征向量进行处理,得到其中各个向量对应的权重。
在一个具体的实施例中,所述交叉组合处理包括向量间相加,和/或,向量间对位相乘。
在一个具体的实施例中,所述表征融合网络包括重要度打分层和softmax层;所述重要度打分层,对所述各个向量进行打分,得到多个重要度分数;所述softmax层对所述多个重要度分数进行归一化处理,得到所述各个向量对应的权重。
根据第二方面,提供一种风险识别系统,包括:输入层,用于获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;画像表征网络,用于处理所述用户画像信息,得到画像表征向量;图神经网络,用于处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;行为表征网络,用于处理所述行为数据,得到行为表征向量;表征融合网络,用于至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;风险识别网络,用于处理所述融合表征向量,得到风险识别结果。
根据第三方面,提供一种针对用户的风险识别装置,包括:数据获取单元,配置为获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;数据处理单元,配置为将所述多视图数据输入风险识别系统,该风险识别系统中包括画像表征网络、图神经网络、行为表征网络、表征融合网络和风险识别网络;其中,所述画像表征网络处理所述用户画像信息,得到画像表征向量;所述图神经网络处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;所述行为表征网络处理所述行为数据,得到行为表征向量;所述表征融合网络,至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;所述风险识别网络处理所述融合表征向量,得到风险识别结果。
根据第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所描述的方法。
根据第五方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所描述的方法。
在本说明书实施例披露的针对用户的风险识别方法及装置中,利用新设计的风险识别系统,对特定行为背后的施行主体进行风险识别,可以显著提升平台风控的有效性、可信度。并且,在风险识别系统中引入多视图学习,以及确定各个视图特征的权重,可以有效增强风险识别系统的可解释性。
附图说明
为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据一个实施例的风险识别系统的使用架构图;
图2示出根据一个实施例的针对用户的风险识别方法流程图;
图3示出根据一个实施例的风险识别系统的结构示意图;
图4示出根据一个实施例的风险识别系统的结构示意图;
图5示出根据一个实施的针对用户的风险识别装置结构图。
具体实施方式
下面结合附图,对本说明书披露的多个实施例进行描述。
如前所述,发明人发现,仅依赖单个行为进行识别的手段单一,难以有效识别风险,其容易陷入被动局面。进一步,发明人想到,由于风险事件或违规行为,主要是由不法用户实施的,例如,违规内容主要是由不正常用户发布的,平台安全某种程度而言是平台与黑灰产的正面交锋,由此提出,可以对行为背后的主体进行风险识别,从而提升行为风控、平台风控的有效性。
具体,本说明书实施例披露一种针对用户的风险识别方法,在此方法中,针对待识别的第一用户,首先,采集多视图数据,包括用户画像信息、基于用户间关联关系构建的关系网络图,以及针对特定行为的行为数据;接着,将采集的多视图数据输入风险识别系统,得到风险识别结果。图1示出根据一个实施例的风险识别系统的使用架构图,如图1所示,在风险识别系统中,画像表征网络、图神经网络和行为表征网络,分别对应处理用户画像信息、用户关系网络图和用户行为数据,得到对应的画像表征向量、图嵌入向量和行为表征向量;表征融合网络对各个视图对应的表征向量进行加权融合,得到融合表征向量;风险识别网络处理该融合表征向量,得到风险识别结果,例如,第一用户是风险用户,或者,不是风险用户。如此,通过利用丰富的多视图数据,可以实现对用户的精准风险识别,并且,在确定融合表征向量时计算得到的各个视图的权重,反映对应视图的重要性,增强了风险识别系统的可解释性。
下面,对上述风险识别方法进行展开介绍。图2示出根据一个实施例的针对用户的风险识别方法流程图,所述方法的执行主体可以为任何具有计算、处理能力的平台、装置、服务器或设备集群。如图2所示,所述方法包括以下步骤:
步骤S210,获取第一用户的多视图数据,其中包括用户画像信息,含第一用户节点的关系网络图,以及针对特定行为的行为数据;步骤S220,将上述多视图数据输入风险识别系统,该风险识别系统中包括画像表征网络、图神经网络、行为表征网络、表征融合网络和风险识别网络;其中,在步骤S221,上述画像表征网络处理上述用户画像信息,得到画像表征向量;上述图神经网络处理对上述关系网络图进行图嵌入处理,得到上述第一用户节点的图嵌入向量;上述行为表征网络处理上述行为数据,得到行为表征向量;在步骤S222,上述表征融合网络,至少对上述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;在步骤S223,上述风险识别网络处理上述融合表征向量,得到风险识别结果。
以上步骤如下:
首先,在步骤S210,获取第一用户的多视图数据。需说明,为便于区分描述,文中将待识别风险的任意一个用户称为第一用户。关于多视图数据,实际场景中,可以对第一用户进行多种不同途径或角度的信息采集或特征描述,换言之,针对第一用户获取的用户数据可以由多个特征集合表示,这些特征空间从不同是视角揭示第一用户的不同属性,其中一个特征集合或一个视角的数据,可以称为一个视图的数据。
上述多视图数据可以包括用户画像信息,或者说,用户静态特征。在一些实施例中,用户画像信息可以包括用户的性别、年龄或年龄段、职业、兴趣爱好、居住地、工作单位等。
上述多视图数据还可以包括含有第一用户节点的关系网络图,其中第一用户节点对应第一用户。在一个实施例中,关系网络图中可以包括多个用户节点,以及节点之间存在关联关系而形成的连接边,其中关联关系可以包括以下中的至少一种:社交关系、设备关系、交易关系和内容交互关系。在一个具体的实施例中,若两个用户在社交平台中互相关注,或者互为好友,则认为对应的两个用户节点之间存在社交关系。在一个具体的实施例中,若两个用户使用过同一个终端设备,则认为对应的节点之间存在设备关系。在一个具体的实施例中,若一个用户曾向另一个用户转账或发起收款,则认为二者间存在交易关系。在一个具体的实施例中,若一个用户向另外一个用户发送过内容,或者,二者互相发送过内容,则认为二者间存在内容交互关系。在一个例子中,其中内容可以是文本、链接、图片(如动态表情)、或视频等。在另一个实施例中,关系网络图中还可以包括多个设备节点,以及设备节点之间或设备节点与用户节点之间存在关联关系而形成的连接边。在一个具体的实施例中,若两个终端设备被同一个用户使用过,则认为对应的设备节点之间存在关联关系。在一个具体的实施例中,若某个终端设备被某个用户使用过,则认为对应的用户节点和设备节点之间存在关联关系。
另一方面,在一个实施例中,上述多个用户节点对应多个用户,相应地,可以将多个用户中各个用户的画像信息,作为对应用户节点的节点特征。在一个实施例中,对于上述连接边的边特征,在一个例子中,将交易次数作为交易连接边的边特征,在另一个例子中,可以将共同好友的数量,作为社交连接边的边特征。
上述多视图数据还可以包括针对特定行为的行为数据。一方面,在一个实施例中,其中特定行为可以包括:内容发布行为、营销行为、信用行为。在一个具体的实施例中,其中内容发布行为可以包括:在论坛等内容平台发表图片、文本或视频等的行为,在转账时附言的行为,在添加好友时输入验证内容的行为,在即时通讯群中发送消息的行为。在一个具体的实施例中,其中营销行为可以包括:广告推送行为、优惠券发放行为等。在一个具体的实施例中,其中信用行为可以包括:信用租借行为(如租借电子产品等)、信用消费行为(如先消费后还款等)。
另一方面,在一个实施例中,上述行为数据可以包括多个行为事件,或者该多个行为事件按时序排列而成的行为事件序列。在一个具体的实施例中,假定特定行为包括内容发布行为,相应的行为事件可以包括发布的具体内容,如文本、图片或链接等,以及行为环境数据,如发布时间、地理位置、网络地址等。在另一个实施例中,上述行为数据可以包括行为统计特征。在一个具体的实施例中,假定特定行为包括信用行为,相应的统计特征可以包括信用行为的频次、逾期次数(如逾期还款)、守约次数(如按时还款)。在一个具体的实施例中,假定特定行为包括内容发布行为,相应的统计特征可以包括内容发布频次、发布违规内容的篇数和发布合法内容的篇数。进一步,行为数据中包括的行为统计特征可以按时序排列,形成行为特征序列。在一个具体的实施例中,假定特定行为包括内容发布行为,相应地,在一个更具体的实施例中,本步骤可以包括:先获取第一用户发布的多篇内容;接着将该多篇内容分别输入预先训练的内容评估模型中,得到多个内容评估结果;再将该多个内容评估结果确定的统计特征(如单日合法内容篇数、单日违规内容篇数),归入上述行为统计特征。在另一个更具体的实施例中,本步骤还可以包括:按照预定时间间隔对该多篇内容进行分组,统计各组中所包含内容的重复率,归入上述行为统计特征。
以上,可以获取到第一用户的多视图数据。接着,在步骤S220,将上述多视图数据输入风险识别系统,该风险识别系统中至少包括画像表征网络、图神经网络、行为表征网络、表征融合网络和风险识别网络。
进一步,其中在步骤S221,上述画像表征网络处理上述用户画像信息,得到画像表征向量;上述图神经网络处理对上述关系网络图进行图嵌入处理,得到上述第一用户节点的图嵌入向量;上述行为表征网络处理上述行为数据,得到行为表征向量。在一个实施例中,上述画像表征网络可以采用深度神经网络(Deep Neural Networks,简称DNN)或卷积神经网络(Convolutional Neural Networks,简称CNN)实现。在一个实施例中,上述图神经网络可以采用图注意力网络(Graph Attention Networks,简称GAT)或图卷积网络(GraphConvolutional Networks,简称GCN)实现。
在一个实施例中,上述行为表征网络可以采用DNN网络或CNN网络实现。在另一个实施例中,上述行为数据包括按时间顺序排列的行为统计特征,相应地,上述行为表征网络可以实现为时序网络。在一个具体的实施例中,该时序网络具体可以是双向长短期时序记忆(Bi-directional Long Short-Term Memory,简称BiLSTM)网络,或者LSTM网络,或者循环神经网络(Recurrent Neural Network,简称RNN)。
由上,可以得到第一用户对应的画像表征向量、图嵌入向量和行为表征向量。接着在步骤S222,上述表征融合网络至少对该画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量。
在一个实施例中,在单视图表征向量的基础上,还可以引入交叉视图的表征,以实现更多视角的特征描述,进而提高最终预测结果的准确性。相应,如图3所示,上述风险识别系统还可以包括表征交叉网络,其对上述单视图表征向量,包括画像表征向量、表征用户关系的图嵌入向量和行为表征向量进行交叉组合处理,得到若干(即一个或多个)交叉表征向量。在一个具体的实施例中,可以对其中任意两个单视图表征向量进行交叉组合处理,和/或,对该三个单视图表征向量进行交叉组合处理。在一个具体的实施例中,交叉组合处理可以是向量的相加处理,或者,是向量的对位相乘处理。如此,可以得到表征交叉视图特征的若干交叉表征向量。
在一个实施例中,上述表征融合网络包括重要度打分层和softmax层;该重要度打分层对输入其中的各个向量进行打分,得到多个重要度分数;其中各个向量可以是上述画像表征向量、图嵌入向量和行为表征向量,以及若干交叉表征向量中的各个向量。该softmax层对所述多个重要度分数进行归一化处理,得到该各个向量对应的权重。在另一个实施例中,上述表征融合网络包括权重分配层,其对输入其中的多个视图表征向量的拼接向量进行处理,得到该多个向量所对应的多个权重。如此,可以得到各个视图表征向量对应的权重,进而对各个视图表征向量进行融合,得到融合表征向量。并且,其中各个权重反映对应视图特征的重要性,从而增强模型的可解释性。
以上可以得到融合多个视图特征的融合表征向量。然后在步骤S223,利用上述风险识别网络处理该融合表征向量,得到风险识别结果。在一个实施例中,该风险识别网络可以实现为DNN网络,或逻辑回归模型,或CNN网络等。在一个具体的实施例中,其中风险识别结果可以包括存在风险的概率,进一步,在该概率大于预设阈值的情况下,判定存在风险,反之判定不存在风险。在另一个具体的实施例中,其中风险识别结果可以是离散的风险等级,如低风险、中风险或高风险等。
以上,可以得到第一用户的风险识别结果。需说明,上述风险识别系统的使用阶段和训练阶段类似,主要区别在于,训练阶段用到的训练样本除了包括作为样本特征的多视图数据外,还包括对应的风险标签,用于确定训练损失,以对系统参数进行调整,而使用阶段,使用的是训练好的风险识别系统,风险识别系统在使用过程中参数不会发生变化。
综上,采用本说明书实施例披露的风险识别方法,利用新设计的风险识别系统,对特定行为背后的施行主体进行风险识别,可以显著提升平台风控的有效性、可信度。并且,在风险识别系统中引入多视图学习,以及确定各个视图特征的权重,可以有效增强风险识别系统的可解释性。
与上述识别方法相对应地,本说明书实施例还披露一种识别系统。图4示出根据一个实施例的风险识别系统的结构示意图,如图4所示,该系统400包括:输入层410,用于获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;画像表征网络420,用于处理所述用户画像信息,得到画像表征向量;图神经网络430,用于处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;行为表征网络440,用于处理所述行为数据,得到行为表征向量;表征融合网络450,用于至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;风险识别网络460,用于处理所述融合表征向量,得到风险识别结果。
在一个实施例中,所述关系网络图中包括多个用户节点,以及节点之间存在关联关系而形成的连接边;所述关联关系包括以下中的至少一种:社交关系、设备关系、交易关系和内容交互关系。
在一个实施例中,所述特定行为包括内容发布行为或信用行为。
在一个实施例中,所述行为数据包括按时间顺序排列的行为统计特征,所述行为表征网络实现为时序网络。
在一个实施例中,所述风险识别系统还包括表征交叉网络445;所述表征交叉网络,用于对所述画像表征向量、图嵌入向量和行为表征向量进行交叉组合处理,得到若干交叉表征向量;其中,所述表征融合网络450,具体用于对所述画像表征向量、图嵌入向量、行为表征向量和若干交叉表征向量进行处理,得到其中各个向量对应的权重。
在一个实施例中,所述表征融合网络450包括重要度打分层和softmax层;所述重要度打分层,对所述各个向量进行打分,得到多个重要度分数;所述softmax层对所述多个重要度分数进行归一化处理,得到所述各个向量对应的权重。
图5示出根据一个实施的针对用户的风险识别装置结构图,如图5所示,所述装置500包括:
数据获取单元510,配置为获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;数据处理单元520,配置为将所述多视图数据输入风险识别系统,该风险识别系统中包括画像表征网络、图神经网络、行为表征网络、表征融合网络和风险识别网络;其中,所述画像表征网络处理所述用户画像信息,得到画像表征向量;所述图神经网络处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;所述行为表征网络处理所述行为数据,得到行为表征向量;所述表征融合网络,至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;所述风险识别网络处理所述融合表征向量,得到风险识别结果。
在一个实施例中,所述特定行为包括内容发布行为或信用行为。
在一个实施例中,所述行为数据包括按时间顺序排列的行为统计特征,所述行为表征网络实现为时序网络。
在一个具体的实施例中,所述特定行为包括内容发布行为;所述数据获取单元410具体配置为:获取所述第一用户发布的多篇内容;将所述多篇内容分别输入预先训练的内容评估模型中,得到多个内容评估结果;将基于所述多个内容评估结果确定的统计特征,归入所述行为统计特征。
在一个具体的实施例中,所述数据获取单元410还配置为:按照预定时间间隔对所述多篇内容进行分组,统计各组中所包含内容的重复率,归入所述行为统计特征。
如上,根据又一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据又一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书披露的多个实施例的具体实施方式而已,并不用于限定本说明书披露的多个实施例的保护范围,凡在本说明书披露的多个实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书披露的多个实施例的保护范围之内。
Claims (18)
1.一种针对用户的风险识别方法,包括:
获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;
将所述多视图数据输入风险识别系统,该风险识别系统中包括画像表征网络、图神经网络、行为表征网络、表征融合网络和风险识别网络;其中,
所述画像表征网络处理所述用户画像信息,得到画像表征向量;所述图神经网络处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;所述行为表征网络处理所述行为数据,得到行为表征向量;
所述表征融合网络,至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;
所述风险识别网络处理所述融合表征向量,得到风险识别结果。
2.根据权利要求1所述的方法,其中,所述关系网络图中包括多个用户节点,以及节点之间存在关联关系而形成的连接边;所述关联关系包括以下中的至少一种:社交关系、设备关系、交易关系和内容交互关系。
3.根据权利要求1所述的方法,其中,所述特定行为包括内容发布行为或信用行为。
4.根据权利要求1所述的方法,其中,所述行为数据包括按时间顺序排列的行为统计特征,所述行为表征网络实现为时序网络。
5.根据权利要求4所述的方法,其中,所述特定行为包括内容发布行为;其中,获取第一用户的多视图数据,包括:
获取所述第一用户发布的多篇内容;
将所述多篇内容分别输入预先训练的内容评估模型中,得到多个内容评估结果;
将基于所述多个内容评估结果确定的统计特征,归入所述行为统计特征。
6.根据权利要求4所述的方法,其中,在获取所述第一用户发布的多篇内容后,所述方法还包括:
按照预定时间间隔对所述多篇内容进行分组,统计各组中所包含内容的重复率,归入所述行为统计特征。
7.根据权利要求1所述的方法,其中,所述风险识别系统还包括表征交叉网络;所述表征交叉网络,对所述画像表征向量、图嵌入向量和行为表征向量进行交叉组合处理,得到若干交叉表征向量;
其中,所述表征融合网络,对所述画像表征向量、图嵌入向量、行为表征向量和若干交叉表征向量进行处理,得到其中各个向量对应的权重。
8.根据权利要求7所述的方法,其中,所述交叉组合处理包括向量间相加,和/或,向量间对位相乘。
9.根据权利要求1所述的方法,其中,所述表征融合网络包括重要度打分层和softmax层;所述重要度打分层,对所述各个向量进行打分,得到多个重要度分数;所述softmax层对所述多个重要度分数进行归一化处理,得到所述各个向量对应的权重。
10.一种风险识别系统,包括:
输入层,用于获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;
画像表征网络,用于处理所述用户画像信息,得到画像表征向量;
图神经网络,用于处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;
行为表征网络,用于处理所述行为数据,得到行为表征向量;
表征融合网络,用于至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;
风险识别网络,用于处理所述融合表征向量,得到风险识别结果。
11.根据权利要求10所述的方法,其中,所述关系网络图中包括多个用户节点,以及节点之间存在关联关系而形成的连接边;所述关联关系包括以下中的至少一种:社交关系、设备关系、交易关系和内容交互关系。
12.根据权利要求10所述的方法,其中,所述特定行为包括内容发布行为或信用行为。
13.根据权利要求10所述的方法,其中,所述行为数据包括按时间顺序排列的行为统计特征,所述行为表征网络实现为时序网络。
14.根据权利要求10所述的方法,其中,所述风险识别系统还包括表征交叉网络;所述表征交叉网络,用于对所述画像表征向量、图嵌入向量和行为表征向量进行交叉组合处理,得到若干交叉表征向量;
其中,所述表征融合网络,具体用于对所述画像表征向量、图嵌入向量、行为表征向量和若干交叉表征向量进行处理,得到其中各个向量对应的权重。
15.根据权利要求10所述的方法,其中,所述表征融合网络包括重要度打分层和softmax层;所述重要度打分层,对所述各个向量进行打分,得到多个重要度分数;所述softmax层对所述多个重要度分数进行归一化处理,得到所述各个向量对应的权重。
16.一种针对用户的风险识别装置,包括:
数据获取单元,配置为获取第一用户的多视图数据,其中包括用户画像信息,含有第一用户节点的关系网络图,以及针对特定行为的行为数据;
数据处理单元,配置为将所述多视图数据输入风险识别系统,该风险识别系统中包括画像表征网络、图神经网络、行为表征网络、表征融合网络和风险识别网络;其中,
所述画像表征网络处理所述用户画像信息,得到画像表征向量;所述图神经网络处理对所述关系网络图进行图嵌入处理,得到所述第一用户节点的图嵌入向量;所述行为表征网络处理所述行为数据,得到行为表征向量;
所述表征融合网络,至少对所述画像表征向量、图嵌入向量和行为表征向量进行处理,得到其中各个向量对应的权重,并且,利用该权重进行对应向量的加权融合,得到融合表征向量;
所述风险识别网络处理所述融合表征向量,得到风险识别结果。
17.一种计算机可读存储介质,其上存储有计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。
18.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011432613.4A CN112541669A (zh) | 2020-12-10 | 2020-12-10 | 风险识别方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011432613.4A CN112541669A (zh) | 2020-12-10 | 2020-12-10 | 风险识别方法、系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112541669A true CN112541669A (zh) | 2021-03-23 |
Family
ID=75019856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011432613.4A Pending CN112541669A (zh) | 2020-12-10 | 2020-12-10 | 风险识别方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112541669A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506179A (zh) * | 2021-09-13 | 2021-10-15 | 北京大学深圳研究生院 | 数字货币交易中异常实体的检测方法、存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109903095A (zh) * | 2019-03-01 | 2019-06-18 | 上海拉扎斯信息科技有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN110009511A (zh) * | 2019-01-29 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 套利行为识别方法、套利行为识别模型训练方法及系统 |
CN110020360A (zh) * | 2017-11-09 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 用户行为特征提取的方法,系统及服务器 |
CN111818093A (zh) * | 2020-08-28 | 2020-10-23 | 支付宝(杭州)信息技术有限公司 | 用于进行风险评估的神经网络系统、方法及装置 |
-
2020
- 2020-12-10 CN CN202011432613.4A patent/CN112541669A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020360A (zh) * | 2017-11-09 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 用户行为特征提取的方法,系统及服务器 |
CN110009511A (zh) * | 2019-01-29 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 套利行为识别方法、套利行为识别模型训练方法及系统 |
CN109903095A (zh) * | 2019-03-01 | 2019-06-18 | 上海拉扎斯信息科技有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN111818093A (zh) * | 2020-08-28 | 2020-10-23 | 支付宝(杭州)信息技术有限公司 | 用于进行风险评估的神经网络系统、方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506179A (zh) * | 2021-09-13 | 2021-10-15 | 北京大学深圳研究生院 | 数字货币交易中异常实体的检测方法、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598016B (zh) | 一种多媒体信息推荐的方法、装置、设备和介质 | |
US11023823B2 (en) | Evaluating content for compliance with a content policy enforced by an online system using a machine learning model determining compliance with another content policy | |
US9959412B2 (en) | Sampling content using machine learning to identify low-quality content | |
CN111737546B (zh) | 确定实体业务属性的方法及装置 | |
US8417650B2 (en) | Event prediction in dynamic environments | |
US10846600B1 (en) | Methods, systems, and media for identifying errors in predictive models using annotators | |
US8732015B1 (en) | Social media pricing engine | |
CN103793484A (zh) | 分类信息网站中的基于机器学习的欺诈行为识别系统 | |
US20090043593A1 (en) | Event Prediction | |
CN111371767B (zh) | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 | |
US20180218287A1 (en) | Determining performance of a machine-learning model based on aggregation of finer-grain normalized performance metrics | |
CN111400754A (zh) | 保护用户隐私的用户分类系统的构建方法及装置 | |
US20230316106A1 (en) | Method and apparatus for training content recommendation model, device, and storage medium | |
CN107885754B (zh) | 基于lda模型从交易数据中提取信用变量的方法和装置 | |
CN113887214B (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
CN106294406A (zh) | 一种用于处理应用访问数据的方法与设备 | |
CN118096170A (zh) | 风险预测方法及装置、设备、存储介质和程序产品 | |
CN112541669A (zh) | 风险识别方法、系统及装置 | |
CN116362841A (zh) | 金融产品的推荐方法、装置、计算机设备及可读存储介质 | |
CN114330929A (zh) | 内容贡献度评估方法、装置、电子设备及可读存储介质 | |
CN111782926A (zh) | 用于数据交互的方法、装置、存储介质及电子设备 | |
KR102332348B1 (ko) | 다중 상태 파급 모델을 이용한 영향력 평가 방법 및 장치 | |
JP7419313B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN110955823B (zh) | 信息推荐方法、装置 | |
US20240185090A1 (en) | Assessment of artificial intelligence errors using machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210323 |
|
RJ01 | Rejection of invention patent application after publication |