CN111818093A - 用于进行风险评估的神经网络系统、方法及装置 - Google Patents
用于进行风险评估的神经网络系统、方法及装置 Download PDFInfo
- Publication number
- CN111818093A CN111818093A CN202010888435.XA CN202010888435A CN111818093A CN 111818093 A CN111818093 A CN 111818093A CN 202010888435 A CN202010888435 A CN 202010888435A CN 111818093 A CN111818093 A CN 111818093A
- Authority
- CN
- China
- Prior art keywords
- neural network
- vector
- vectors
- network model
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1416—Event detection, e.g. attack signature detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例提供一种适用于在多方隐私保护下进行风险评估的神经网络系统、方法及装置。根据该方案,首先基于第一神经网络模型中的N个子模型分别获取用户的N个属性字段各自在约定的T个时刻的字段值序列;然后,采用时间递归的方式,分别将N个字段值序列处理为N个表征向量;上述N个子模型可部署于隔离的多方之中,且上述表征向量可保护原始字段值代表的隐私数据。最后,利用第二神经网络模型,基于注意力机制,对N个表征向量进行融合,基于融合结果确定与用户相关的风险评估结果。
Description
技术领域
本说明书一个或多个实施例涉及人工智能和机器学习领域,尤其涉及利用神经网络系统进行风险评估的方法和装置。
背景技术
随着计算机网络的快速发展,网络安全问题日益突出。存在多种高风险操作行为,例如盗取账户、流量攻击、欺诈交易等等,有可能威胁网络安全或用户信息安全。出于网络安全和风险防控的考虑,在许多场景下,需要对用户风险类型、用户操作行为或操作事件等进行分析和处理,评估与用户相关的风险程度,以便进行风险防控。
为了评估与用户相关的风险度,可以基于与用户相关的某项操作行为本身的特征进行分析。进一步地,还可以更全面地考虑用户的行为序列。行为序列是用户在日常操作使用中产生的一系列点击、访问、购买等事件的发生过程,可表示为事件集合的时间序列,它蕴含了用户的细粒度习惯偏好等特点,便于更全面地分析用户的操作历史和操作模式。然而,不管是操作事件还是行为序列数据,目前在进行特征刻画时往往是基于对交易的属性冲突、变异等行为特征进行刻画。但这种方式在一定程度上容易造成风险的漏放,比如恶意使用者如果有意的避开行为的聚集,使得累计变量的聚集性描述作用降低,那么风险识别能力将大打折扣。
此外,虽然可以从不同的风险模块来刻画不同种类风险,但是这些风险刻画标签往往依赖于在案件分析时发现的属性聚集,而这一部分往往比较偏人工分析。然而,可以理解,在人工分析阶段严重依赖于人工的业务经验和效率。当业务经验不够完善的时候,人工选取的特征很可能不够全面或不够具有代表性,使得基于特征的事件分析准确性不够高。并且,人工分析存在安全性泄露的风险。一旦选取特征的方式被泄露,恶意使用者就会采取相应的规避策略,有意避开选取的特征进行其他方式的攻击。
因此,希望能有改进的方案,更为准确有效地对与用户相关的风险进行风险度分析,以便于进行风险防控。
发明内容
本说明书一个或多个实施例描述了用于进行风险评估的神经网络系统、方法及装置,可以感知不同时刻属性字段的变化,从属性字段的变化中预测风险,从而更准确地确定与用户相关的风险评估结果。
根据第一方面,提供了一种适用于在多方隐私保护下进行风险评估的神经网络系统,包括:适用于多方分布式部署的第一神经网络模型和第二神经网络模型;
所述第一神经网络模型包括对应于用户的N个属性字段的N个子模型,各个子模型用于,获取对应的属性字段在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,将所述字段值序列处理为表征向量;
第二神经网络模型用于,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。
在一个实施例中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。
在一个实施例中,所述T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;所述风险评估结果示出,所述用户为高风险用户的评估概率。
在一个实施例中,所述T个时刻包括,所述用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;所述风险评估结果示出,所述当前事件为高风险事件的评估概率。
在一个实施例中,所述N个子模型包括任意的第一子模型,其对应于第一属性字段,该第一子模型包括:
编码层,用于对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;
嵌入层,用于采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。
根据一种实施方式,所述编码层具体用于:
采用独热one-hot编码,分别将所述T个字段值编码为对应的编码向量;或者,
分别对所述T个字段值进行词嵌入,得到对应的编码向量。
根据一种实施方式,所述嵌入层包括长短期记忆LSTM或循环神经网络RNN。
在一个实施例中,所述第二神经网络模型包括:
注意力层,用于基于注意力机制,将所述N个表征向量进行融合,得到融合向量;
输出层,用于至少根据所述融合向量,确定所述风险评估结果。
根据一种实施方式,所述注意力层具体用于,利用权重分配因子,对所述N个表征向量进行加权组合,得到所述融合向量。
在一个实施例中,所述N个子模型部署在多个不同的独立计算平台,所述第二神经网络模型部署在共享服务平台。
根据第二方面,提供了一种适用于在多方隐私保护下通过神经网络系统进行风险评估的方法,所述神经网络系统包括,适用于多方分布式部署的第一神经网络模型和第二神经网络模型,所述第一神经网络模型包括N个子模型,所述方法包括:
利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应的字段值序列处理为表征向量;
利用所述第二神经网络模型,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。
在一个实施例中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。
在一个实施例中,所述T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;所述风险评估结果示出,所述用户为高风险用户的评估概率。
在一个实施例中,所述T个时刻包括,所述用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;所述风险评估结果示出,所述当前事件为高风险事件的评估概率。
在一个实施例中,所述采用时间递归的方式,分别将N个字段值序列处理为N个表征向量,包括:
针对所述N个属性字段中任意的第一属性字段,对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;
采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。
在一个实施例中,所述对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列,包括:
采用独热one-hot编码,分别将所述T个字段值编码为对应的编码向量;或者,
分别对所述T个字段值进行词嵌入,得到对应的编码向量。
在一个实施例中,所述采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量,包括:
采用长短期记忆LSTM或循环神经网络RNN处理所述向量序列中各个向量,得到所述第一属性字段对应的表征向量。
在一个实施例中,所述基于注意力机制,对N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果,包括:
基于注意力机制,将所述N个表征向量进行融合,得到融合向量;
至少根据所述融合向量,确定所述风险评估结果。
在一个实施例中,所述基于注意力机制,将所述N个表征向量进行融合,得到融合向量,包括:
利用权重分配因子,对所述N个表征向量进行加权组合,得到所述融合向量。
在一个实施例中,所述N个子模型部署在多个不同的独立计算平台,所述第二神经网络模型部署在共享服务平台。
根据第三方面,提供了一种通过神经网络系统进行风险评估的装置,所述神经网络系统包括第一神经网络模型和第二神经网络模型,所述第一神经网络模型包括N个子模型,所述装置包括:
处理单元,配置为利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应的字段值序列处理为表征向量;
确定单元,配置为利用所述第二神经网络模型,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。
根据第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第二方面的方法。
根据第五方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第二方面方法。
根据本说明书实施例提供的神经网络系统和方法,通过包括第一神经网络模型和第二神经网络模型的神经网络系统,基于第一神经网络模型中每个子模型对相应的属性字段进行处理,得到N个属性字段对应的表征向量,之后,由第二神经网络模型对N个表征向量进行融合,并基于融合结果确定与用户相关的风险评估结果。特别是,通过每个子模型对相应的属性字段进行处理,使得得到的表征向量更有利于刻画用户行为在对应属性字段方面的变化特点,提高了风险评估准确性。并且,神经网络系统适用于多方部署,特别是,上述N个子模型可部署于隔离的多方之中,且上述表征向量可保护原始字段值代表的隐私数据。从而使得,上述神经网络系统和方法适用于在多方隐私保护下进行更准确的风险评估。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的神经网络系统的结构示意图;
图3示出根据一个实施例的时刻与属性字段之间的示意性框图;
图4示出根据另一个实施例的时刻与属性字段之间的示意性框图;
图5示出根据一个实施例的风险评估的流程图;
图6示出根据一个实施例的风险评估装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。如图1所示,第一神经网络模型部署于计算平台1上,第二神经网络模型部署于计算平台2上,其中,计算平台1和计算平台2可以是同一计算平台,也可以是不同的计算平台。为了对用户行为进行风险评估,将用户的N个属性字段各自在约定的T个时刻的字段值序列<F1,F2,…,FT>,输入至预先训练的第一神经网络模型,其中,第一神经网络模型包括对应于用户的N个属性字段的N个子模型。每个子模型基于输入的字段值序列采用时间递归的方式,将字段值序列处理为表征向量,以便于感知到每个属性字段的变化。
然后,N个子模型将N个表征向量输入至第二神经网络模型。该第二神经网络模型基于注意力机制对N个表征向量进行融合,并基于融合结果确定与用户相关的风险评估结果。
如此,通过第一神经网络模型中每个子模型对相应的属性字段进行处理,得到更有利于刻画用户行为在某个属性字段方面的变化的特征向量,由此使得确定出的与用户相关的风险评估结果更加准确。
应该理解,本文中的“第一”,“第二”,仅仅是为了表述的清楚而对类似概念进行的标记和区分,并不具有其他限定作用。
下面描述以上构思的具体实现方式。
图2示出根据一个实施例的神经网络系统的结构示意图,该神经网络系统可以是一种计算系统,其上运行用于进行事件风险评估的神经网络模型。可以理解,该神经网络系统可以通过任何具有计算、处理能力的设备、装置、平台、设备集群来实现,例如图1所示的计算平台。如图2所示,神经网络系统包括,第一神经网络模型21和第二神经网络模型22,其中,第一神经网络模型21包括对应于用户的N个属性字段的N个子模型211,每个子模型211均包括编码层2111和嵌入层2112,第二神经网络模型22包括注意力层221和输出层222,这些网络层构成一个深度神经网络,用于对与用户相关的风险进行评估。
下面描述以上各个层的实现方式。
为了对与某个用户相关的风险进行评估,以该用户的N个属性字段为分析数据源,输入到神经网络系统中。简单起见,将上述用户称为第一用户。在一个例子中,N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。
由此,N个子模型211中任一子模型的编码层2111获取到对应的属性字段在约定的T个时刻的字段值序列,字段值序列可以表示为<F1,F2,…,FT>,其中包括按照时间顺序依次排列的多个字段值F1,F2,…,FT。
在一个实施例中,T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻。其中,历史时刻可以是从当前时刻向前回溯预定范围得到的时刻,其中预定范围可以是预定时间范围等。例如,如图3所示,T取值为4,属性字段包括IP地址、设备类型和地理位置,预定时间范围为相邻时刻之间间隔两个小时,当前时刻为14点,历史时刻为12点、10点和8点,此时,IP地址对应的字段值序列为(D2,D1,D1,D1),设备类型对应的字段值序列为(电脑,手机,手机,手机),地理位置对应的字段值序列为(巴黎,北京,北京,北京)。
此时,风险评估结果可以示出,第一用户为高风险用户的评估概率。例如,继续参阅图3,历史时刻中地理位置均为北京,IP地址均为D1,设备类型均为手机,而在当前时刻,地理位置为巴黎,IP地址为D2,设备类型为电脑;2个小时从北京到巴黎基本是不现实的,因此,可以推测出第一用户存在被盗号的风险,这时风险评估结果可以示出第一用户为高风险用户(例如被盗号的用户)的评估概率为90%。应理解的是,此处风险评估方式仅是示例性的,并不构成对本说明书实施例的限定。
在一个实施例中, T个时刻包括,用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻。例如,如图4所示,T取值为4,当前事件的类型为支付类事件,当前事件包括的属性字段有支付渠道、支付卡号和地理位置;选取与当前事件的类型相同的3个历史事件,其中,历史事件包括的属性字段也为支付渠道、支付卡号和地理位置;当前事件发生的时刻为14点,历史事件发生的时刻分别为12点、8点和7点;此时,支付渠道对应的字段值序列为(支付宝, 支付宝, 支付宝, 支付宝),支付卡号对应的字段值序列为(C1, C1, C1, C1),地理位置对应的字段值序列为(北京,北京,北京,北京)。
此时,风险评估结果示出,当前事件为高风险事件的评估概率。例如,继续参阅图4,当前事件和历史事件中支付渠道均为支付宝,支付卡号均为C1,地理位置均为北京,因此,可以推测出当前事件大概率与历史事件一样,这时风险评估结果可以示出当前事件为高风险事件的评估概率为5%。应理解的是,此处风险评估方式仅是示例性的,并不构成对本说明书实施例的限定。
可选地,历史事件可以是从当前事件向前回溯预定范围得到的事件,其中预定范围可以是预定时间范围,预定事件数量,等等。例如,在一个示例中,可以设定预定时间范围,比如为12h,24h等等,对于有待评估的当前事件,从当前事件的发生时刻起,向前回溯上述预定时间范围,将该预定时间范围内的事件作为历史事件。在另一个示例中,可以设定预定事件数量,比如为10件,20件等等;对于有待评估的当前事件,从当前事件向前回溯上述预定数量的事件作为历史事件。因此,历史事件的数量可能从一个到多个并不确定。工程实践中,可以通过填补(padding)的方式,确定出适宜数量的历史事件。
简单起见,如图2所示,用Xi表示属性字段。如此,第一神经网络模型21中每个属性字段对应的子模型211接收到字段值序列<F1,F2,…,FT>后,通过子模型211中的编码层2111对字段值序列<F1,F2,…,FT>中的每个字段值分别进行编码,得到T个编码向量的向量序列<A1,A2,…,AT>。
编码层2111可以采用多种编码方式进行编码。
在一个实施例中,编码层2111可以采用独热one-hot编码方式分别将T个字段值编码为对应的编码向量。One-hot编码方式适合于字段值为有限多个取值的属性字段。例如,在一个例子中,属性字段包括IP地址,而IP地址中的字段值一共有H种,那么,可以采用one-hot编码,将该项属性字段中的字段值编码为H维编码向量。
在一个实施例中,字段值中可以包含文字或词,例如,当属性字段为住址的情况下。在这样的情况下,编码层2111可以采用更为复杂的神经网络分别对T个字段值进行词嵌入,以得到对应的编码向量。可选地,编码层2111可以包括卷积神经网络CNN或循环神经网络RNN,用于对字段值中的文字部分进行词嵌入,得到对应的编码向量。词嵌入的算法可以采用各种已知或将来采用的算法,在此不做限定。
接着,嵌入层2112采用时间递归的方式,依次迭代处理经编码层2111编码后的向量序列<A1,A2,…,AT>中的各个编码向量,得到该子模型对应的属性字段所对应的表征向量。
在一个实施例中,嵌入层2112采用基于时序的神经网络,对各个向量序列中的各个编码向量进行时序处理。具体的,上述基于时序的神经网络可以是,循环神经网络RNN,或者长短期记忆神经网络LSTM。于是,可以将上述向量序列中的T个向量A1,A2,…,AT按照时间先后顺序,依次输入RNN或LSTM。RNN或LSTM神经网络于是依次迭代处理该向量序列中的T个编码向量,得到该子模型对应的属性字段所对应的表征向量f。更具体的,RNN或LSTM可以将处理完向量序列<A1,A2,…,AT>中最后一个向量AT时得到的隐含向量,作为相应的表征向量f。
如此,如图2所示,通过N个子模型对其相对应的N个属性字段进行处理,可以得到N个表征向量,即向量f1,f2…,fN。
接着,第二神经网络模型22中的注意力层221基于注意力机制,将N个表征向量<f1,f2…,fN>进行融合,得到融合向量Y。
在一个实施例中,上述融合包括利用权重分配因子,对N个表征向量<f1,f2…,fN>进行加权融合,得到融合向量Y。不同的属性字段对风险评估的帮助是不同的,因此,不同的属性字段拥有不同的权值。对于属性字段的权值,可以预先进行标定,也可以通过训练而确定。
接着,第二神经网络模型22中的输出层222至少根据融合向量Y,确定与用户相关的风险评估结果。具体地,输出层222可以对融合向量Y施加线性变换,非线性变化或施加特定函数,例如softmax函数,得到输出结果。输出的风险评估结果可以是回归结果,例如风险度打分,也可以是分类结果,例如高风险、低风险的类别预测。
在一个实施例中,输出层222为分类器,该分类器可以采用多层感知机(MLP),对融合向量Y进行进一步处理,最后施加诸如softmax的函数运算,得到风险评估结果。
由此,图2的多个网络层所构成的深度神经网络,可以基于第一神经网络模型中每个子模型对相应的属性字段进行处理,得到N个属性字段对应的表征向量,之后,由第二神经网络模型对N个表征向量进行融合,并基于融合结果确定与用户相关的风险评估结果。特别是,通过每个子模型对相应的属性字段进行处理,使得得到的表征向量更有利于刻画用户行为的特点,提高了风险评估准确性。
需要理解的是,由于第一神经网络模型中的N个子模型分别对N个不同的属性字段进行处理,因此,这N个子模型是分别具有相应模型处理方式的N个不同子模型。在一个实施例中,上述N个子模型可以具有不同的模型结构和算法,例如,一部分子模型的编码层采用one-hot编码,另一部分利用词嵌入进行编码;一部分子模型的嵌入层采用RNN神经网络,一部分子模型的嵌入层采用LSTM神经网络。即使具有相同的模型结构和算法,N个子模型的模型参数也并不相同,从而处理不同的属性字段。
由于上述N个子模型之间的独立性,上述神经网络系统可以以分布式的方式,部署在多个平台中。具体的,在一些实施例中,第一神经网络模型中的N个子模型部署在多个不同的独立计算平台,而第二神经网络模型部署在共享服务平台。例如,N个子模型中包括对应于IP地址的子模型A,其部署在可以获取用户IP地址的平台A;还包括对应于设备信息的子模型B,其部署在可以获取用户设备信息的计算平台B。而第二神经网络模型部署在共享平台C。于是,平台A利用子模型A,将IP地址序列处理为表征向量fA,平台B利用子模型B,将设备信息序列处理为表征向量fB。共享平台C汇总各个独立平台的表征向量fA和fB,综合处理后进行风险评估。
由此,属性字段可以来源于不同的独立计算平台,各个独立计算平台维护各自平台上的属性字段,并利用其上部署的子模型将属性字段的值序列处理为表征向量,发送给共享服务平台。共享服务平台综合各个独立计算平台提供的表征向量,利用第二神经网络模型确定与用户相关的风险评估结果。需要理解,由于表征向量是利用各个子模型对原始字段值序列进行处理后得到的抽象结果,因此,并不会泄露各自平台的原始用户数据。因此,以上的分布式部署方式可以实现不同计算平台的数据隔离,保护了用户隐私,提升了风险评估的安全性。
根据另一方面的实施例,还提供一种通过神经网络系统进行风险评估的方法。其中,神经网络系统为上述实施例中所描述的神经网络系统。图5示出根据一个实施例的风险评估的流程图。该方法可以由任何具有计算、处理能力的设备、装置、平台、设备集群来实现,例如图1所示的计算平台。如图5所示,该方法包括以下步骤:
在步骤51,利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应的字段值序列处理为表征向量;
在步骤52,利用第二神经网络模型,基于注意力机制,对N个子模型输出的N个表征向量进行融合,基于融合结果确定与用户相关的风险评估结果。
在一个实施例中,N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。
在一个实施例中,T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;风险评估结果示出,用户为高风险用户的评估概率。
在一个实施例中,T个时刻为,用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;风险评估结果示出,当前事件为高风险事件的评估概率。
在一个实施例中,在步骤51中采用时间递归的方式,分别将对应的字段值序列处理为表征向量,包括:
针对N个属性字段中任意的第一属性字段,对第一属性字段在T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;
采用时间递归的方式,依次迭代处理向量序列中各个编码向量,得到第一属性字段对应的表征向量。
根据一种实施方式,在步骤51中对第一属性字段在T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列,包括:
采用独热one-hot编码,分别将T个字段值编码为对应的编码向量;或者,
分别对T个字段值进行词嵌入,得到对应的编码向量。
根据一种实施方式,在步骤51中采用时间递归的方式,依次迭代处理向量序列中各个向量,得到第一属性字段对应的表征向量,包括:
采用长短期记忆LSTM或循环神经网络RNN处理向量序列中各个向量,得到第一属性字段对应的表征向量。
在一个实施例中,在步骤52中基于注意力机制,对N个表征向量进行融合,基于融合结果确定与用户相关的风险评估结果,包括:
基于注意力机制,将N个表征向量进行融合,得到融合向量;
至少根据融合向量,确定风险评估结果。
根据一种实施方式,在步骤52中基于注意力机制,将N个表征向量进行融合,得到融合向量,包括:
利用权重分配因子,对N个表征向量进行加权组合,得到融合向量。
在一个实施例中,N个子模型部署在多个不同的独立计算平台,第二神经网络模型部署在共享服务平台。
通过以上方法,可以基于第一神经网络模型中每个子模型对相应的属性字段进行处理,得到N个属性字段各自对应的表征向量,之后,由第二神经网络模型对N个表征向量进行融合,并基于融合结果确定与用户相关的风险评估结果。特别是,通过每个子模型对相应的属性字段进行处理,使得得到的表征向量更有利于刻画用户行为的特点,提高了风险评估准确性。
根据另一方面的实施例,提供了一种通过神经网络系统进行风险评估的装置,该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中,其中,神经网络系统为上述实施例中所描述的神经网络系统。图6示出根据一个实施例的风险评估装置的示意性框图。如图6所示,该装置600包括:
处理单元61,配置为利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应字段值序列处理为表征向量;
确定单元62,配置为利用第二神经网络模型,基于注意力机制,对N个子模型输出的N个表征向量进行融合,基于融合结果确定与用户相关的风险评估结果。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图5所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图5所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (23)
1.一种适用于在多方隐私保护下进行风险评估的神经网络系统,包括:适用于多方分布式部署的第一神经网络模型和第二神经网络模型;
所述第一神经网络模型包括对应于用户的N个属性字段的N个子模型,各个子模型用于,获取对应的属性字段在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,将所述字段值序列处理为表征向量;
第二神经网络模型用于,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。
2.根据权利要求1所述的系统,其中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。
3.根据权利要求1所述的系统,其中,所述T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;所述风险评估结果示出,所述用户为高风险用户的评估概率。
4.根据权利要求1所述的系统,其中,所述T个时刻包括,所述用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;所述风险评估结果示出,所述当前事件为高风险事件的评估概率。
5.根据权利要求1所述的系统,其中,所述N个子模型包括任意的第一子模型,其对应于第一属性字段,该第一子模型包括:
编码层,用于对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;
嵌入层,用于采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。
6.根据权利要求5所述的系统,其中,所述编码层具体用于:
采用独热one-hot编码,分别将所述T个字段值编码为对应的编码向量;或者,
分别对所述T个字段值进行词嵌入,得到对应的编码向量。
7.根据权利要求5所述的系统,其中,所述嵌入层包括长短期记忆LSTM或循环神经网络RNN。
8.根据权利要求1所述的系统,其中,所述第二神经网络模型包括:
注意力层,用于基于注意力机制,将所述N个表征向量进行融合,得到融合向量;
输出层,用于至少根据所述融合向量,确定所述风险评估结果。
9.根据权利要求8所述的系统,其中,所述注意力层具体用于,利用权重分配因子,对所述N个表征向量进行加权组合,得到所述融合向量。
10.根据权利要求1-9任一项所述的系统,其中,所述N个子模型部署在多个不同的独立计算平台,所述第二神经网络模型部署在共享服务平台。
11.一种适用于在多方隐私保护下通过神经网络系统进行风险评估的方法,所述神经网络系统包括,适用于多方分布式部署的第一神经网络模型和第二神经网络模型,所述第一神经网络模型包括N个子模型,所述方法包括:
利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应的字段值序列处理为表征向量;
利用所述第二神经网络模型,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。
12.根据权利要求11所述的方法,其中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。
13.根据权利要求11所述的方法,其中,所述T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;所述风险评估结果示出,所述用户为高风险用户的评估概率。
14.根据权利要求11所述的方法,其中,所述T个时刻为,所述用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;所述风险评估结果示出,所述当前事件为高风险事件的评估概率。
15.根据权利要求11所述的方法,其中,所述采用时间递归的方式,分别将对应的字段值序列处理为表征向量,包括:
针对所述N个属性字段中任意的第一属性字段,对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;
采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。
16.根据权利要求15所述的方法,其中,所述对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列,包括:
采用独热one-hot编码,分别将所述T个字段值编码为对应的编码向量;或者,
分别对所述T个字段值进行词嵌入,得到对应的编码向量。
17.根据权利要求15所述的方法,其中,所述采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量,包括:
采用长短期记忆LSTM或循环神经网络RNN处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。
18.根据权利要求11所述的方法,其中,所述基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果,包括:
基于注意力机制,将所述N个表征向量进行融合,得到融合向量;
至少根据所述融合向量,确定所述风险评估结果。
19.根据权利要求18所述的方法,其中,所述基于注意力机制,将所述N个表征向量进行融合,得到融合向量,包括:
利用权重分配因子,对所述N个表征向量进行加权组合,得到所述融合向量。
20.根据权利要求11-19任一项所述的方法,其中,所述N个子模型部署在多个不同的独立计算平台,所述第二神经网络模型部署在共享服务平台。
21.一种适用于在多方隐私保护下通过神经网络系统进行风险评估的装置,所述神经网络系统包括,适用于多方分布式部署的第一神经网络模型和第二神经网络模型,所述第一神经网络模型包括N个子模型,所述装置包括:
处理单元,配置为利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应的字段值序列处理为表征向量;
确定单元,配置为利用所述第二神经网络模型,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。
22.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求11-20中任一项的所述的方法。
23.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求11-20中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888435.XA CN111818093B (zh) | 2020-08-28 | 2020-08-28 | 用于进行风险评估的神经网络系统、方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010888435.XA CN111818093B (zh) | 2020-08-28 | 2020-08-28 | 用于进行风险评估的神经网络系统、方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111818093A true CN111818093A (zh) | 2020-10-23 |
CN111818093B CN111818093B (zh) | 2020-12-11 |
Family
ID=72859770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010888435.XA Active CN111818093B (zh) | 2020-08-28 | 2020-08-28 | 用于进行风险评估的神经网络系统、方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111818093B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380514A (zh) * | 2020-11-13 | 2021-02-19 | 支付宝(杭州)信息技术有限公司 | 生物识别安全态势预测方法、装置和电子设备 |
CN112541669A (zh) * | 2020-12-10 | 2021-03-23 | 支付宝(杭州)信息技术有限公司 | 风险识别方法、系统及装置 |
CN112801670A (zh) * | 2021-04-07 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 针对支付操作的风险评估方法及装置 |
CN113781201A (zh) * | 2021-08-19 | 2021-12-10 | 支付宝(杭州)信息技术有限公司 | 电子金融活动的风险评估方法和装置 |
CN115102873A (zh) * | 2022-08-23 | 2022-09-23 | 深圳市乙辰科技股份有限公司 | 一种基于ip地址分析的数据处理方法及系统 |
CN115831339A (zh) * | 2023-02-21 | 2023-03-21 | 四川大学华西医院 | 基于深度学习的医疗系统风险管控事前预测方法、系统 |
CN116596322A (zh) * | 2023-07-17 | 2023-08-15 | 中电建物业管理有限公司 | 一种基于大数据可视化的物业设备管理方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886243A (zh) * | 2017-11-10 | 2018-04-06 | 阿里巴巴集团控股有限公司 | 风险识别模型构建和风险识别方法、装置及设备 |
CN108460679A (zh) * | 2018-02-28 | 2018-08-28 | 电子科技大学 | 融合注意力机制的深度网络智能投资系统数据分析方法 |
US20190073608A1 (en) * | 2017-09-07 | 2019-03-07 | Koninklijke Philips N.V. | Multi-party computation system for learning a classifier |
CN110705688A (zh) * | 2019-09-05 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 对操作事件进行风险评估的神经网络系统、方法及装置 |
CN111126797A (zh) * | 2019-12-09 | 2020-05-08 | 支付宝(杭州)信息技术有限公司 | 私有数据保护的业务风险控制方法、装置、平台及系统 |
CN111160814A (zh) * | 2020-04-01 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 基于多方安全计算的用户风险评估方法、装置和系统 |
-
2020
- 2020-08-28 CN CN202010888435.XA patent/CN111818093B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190073608A1 (en) * | 2017-09-07 | 2019-03-07 | Koninklijke Philips N.V. | Multi-party computation system for learning a classifier |
CN107886243A (zh) * | 2017-11-10 | 2018-04-06 | 阿里巴巴集团控股有限公司 | 风险识别模型构建和风险识别方法、装置及设备 |
CN108460679A (zh) * | 2018-02-28 | 2018-08-28 | 电子科技大学 | 融合注意力机制的深度网络智能投资系统数据分析方法 |
CN110705688A (zh) * | 2019-09-05 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 对操作事件进行风险评估的神经网络系统、方法及装置 |
CN111126797A (zh) * | 2019-12-09 | 2020-05-08 | 支付宝(杭州)信息技术有限公司 | 私有数据保护的业务风险控制方法、装置、平台及系统 |
CN111160814A (zh) * | 2020-04-01 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 基于多方安全计算的用户风险评估方法、装置和系统 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380514A (zh) * | 2020-11-13 | 2021-02-19 | 支付宝(杭州)信息技术有限公司 | 生物识别安全态势预测方法、装置和电子设备 |
CN112380514B (zh) * | 2020-11-13 | 2022-11-22 | 支付宝(杭州)信息技术有限公司 | 生物识别安全态势预测方法、装置和电子设备 |
CN112541669A (zh) * | 2020-12-10 | 2021-03-23 | 支付宝(杭州)信息技术有限公司 | 风险识别方法、系统及装置 |
CN112801670A (zh) * | 2021-04-07 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 针对支付操作的风险评估方法及装置 |
CN112801670B (zh) * | 2021-04-07 | 2021-07-23 | 支付宝(杭州)信息技术有限公司 | 针对支付操作的风险评估方法及装置 |
CN113781201A (zh) * | 2021-08-19 | 2021-12-10 | 支付宝(杭州)信息技术有限公司 | 电子金融活动的风险评估方法和装置 |
CN115102873A (zh) * | 2022-08-23 | 2022-09-23 | 深圳市乙辰科技股份有限公司 | 一种基于ip地址分析的数据处理方法及系统 |
CN115831339A (zh) * | 2023-02-21 | 2023-03-21 | 四川大学华西医院 | 基于深度学习的医疗系统风险管控事前预测方法、系统 |
CN116596322A (zh) * | 2023-07-17 | 2023-08-15 | 中电建物业管理有限公司 | 一种基于大数据可视化的物业设备管理方法及系统 |
CN116596322B (zh) * | 2023-07-17 | 2023-10-31 | 中电建物业管理有限公司 | 一种基于大数据可视化的物业设备管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111818093B (zh) | 2020-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111818093B (zh) | 用于进行风险评估的神经网络系统、方法及装置 | |
CN111814977B (zh) | 训练事件预测模型的方法及装置 | |
CN109345260B (zh) | 一种异常操作行为的检测方法 | |
CN113159288B (zh) | 防止隐私数据泄漏的编码模型训练方法及装置 | |
CN113094758B (zh) | 一种基于梯度扰动的联邦学习数据隐私保护方法及系统 | |
EP3654610B1 (en) | Graphical structure model-based method for prevention and control of abnormal accounts, and device | |
CN111967565B (zh) | 用于进行风险评估的神经网络系统、方法及装置 | |
CN111553488B (zh) | 一种针对用户行为的风险识别模型训练方法及系统 | |
CN111737546B (zh) | 确定实体业务属性的方法及装置 | |
CN113240505B (zh) | 图数据的处理方法、装置、设备、存储介质及程序产品 | |
CN113222143B (zh) | 图神经网络训练方法、系统、计算机设备及存储介质 | |
CN112365007B (zh) | 模型参数确定方法、装置、设备及存储介质 | |
CN110705688A (zh) | 对操作事件进行风险评估的神经网络系统、方法及装置 | |
CN114548300B (zh) | 解释业务处理模型的业务处理结果的方法和装置 | |
CN112100642A (zh) | 在分布式系统中保护隐私的模型训练方法及装置 | |
CN114091684A (zh) | 增强业务结果可解释性的方法及装置 | |
Shi et al. | Network reliability analysis through survival signature and machine learning techniques | |
CN116362894A (zh) | 多目标学习方法、装置、电子设备及计算机可读存储介质 | |
CN110087230B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN111815442B (zh) | 一种链接预测的方法、装置和电子设备 | |
CN112905987B (zh) | 账号识别方法、装置、服务器及存储介质 | |
CN113377625A (zh) | 针对多方联合业务预测进行数据监控的方法及装置 | |
CN116405323B (zh) | 安全态势感知攻击预测方法、装置、设备、介质及产品 | |
CN116611069B (zh) | 针对于数字化业务软件应用的异常分析方法及ai决策系统 | |
CN112131607B (zh) | 资源数据处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40039734 Country of ref document: HK |