CN111860865B - 模型构建和分析的方法、装置、电子设备和介质 - Google Patents

模型构建和分析的方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN111860865B
CN111860865B CN202010719813.1A CN202010719813A CN111860865B CN 111860865 B CN111860865 B CN 111860865B CN 202010719813 A CN202010719813 A CN 202010719813A CN 111860865 B CN111860865 B CN 111860865B
Authority
CN
China
Prior art keywords
analysis
server
training
data
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010719813.1A
Other languages
English (en)
Other versions
CN111860865A (zh
Inventor
吕博良
程佩哲
叶红
张�诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010719813.1A priority Critical patent/CN111860865B/zh
Publication of CN111860865A publication Critical patent/CN111860865A/zh
Application granted granted Critical
Publication of CN111860865B publication Critical patent/CN111860865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2308Concurrency control
    • G06F16/2315Optimistic concurrency control
    • G06F16/2322Optimistic concurrency control using timestamps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种分析方法,包括:响应于接收到对目标对象的分析指令,确定分析时间段,分析时间段与目标对象的预定时序数据的时间戳相关;获取目标对象位于分析时间段内的第一时序数据;基于第一时序数据,得到第一时序特征集合;至少将第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果;以及将第一中间结果发送至联合平台设备,以使联合平台设备基于第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,第二机构为与第一机构联合分析的机构。本公开还提供了模型构建方法、分析装置、模型构建装置、联合分析系统、电子设备和计算机可读存储介质。

Description

模型构建和分析的方法、装置、电子设备和介质
技术领域
本公开涉及计算机技术领域,更具体地,涉及分析方法、分析装置、模型构建方法、模型构建装置、联合分析系统、电子设备和计算机可读存储介质。
背景技术
近年来,随着不同机构间联合建立分析模型的需求不断增长,联邦学习技术得到了快速发展,联邦学习能够在满足用户隐私保护、数据安全和政府法规的要求下,联合多个机构建立分析模型并应用模型进行分析。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:
通过联邦学习技术进行联合建模时,参与建模的双方无法实时进行时序数据的交互,导致无法将基于行为序列的特征纳入联邦学习模型中,仅能使用非行为序列特征建模,而在一些场景中,用户的行为序列特征作为关键因素会对模型准确度能够产生较大的影响,若不将基于行为序列的特征纳入联邦学习中会造成模型准确率低,分析结果不可信的问题。
发明内容
有鉴于此,本公开提供了分析方法、分析装置、模型构建方法、模型构建装置、联合分析系统、电子设备和计算机可读存储介质。
本公开的一个方面提供了一种分析方法,由第一机构服务器执行,包括:响应于接收到对目标对象的分析指令,确定分析时间段,所述分析时间段与所述目标对象的预定时序数据的时间戳相关;确定所述目标对象的与所述分析时间段对应的第一时序特征集合;至少将所述第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果;以及将所述第一中间结果发送至联合平台设备,以使所述联合平台设备基于所述第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,所述第二机构为与所述第一机构联合分析的机构。
根据本公开的实施例,所述方法还包括:获取所述目标对象的第一非时序数据;以及对所述第一非时序数据进行特征提取处理,得到第一非时序特征集合。所述至少将所述第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果包括:将所述第一时序特征集合和所述第一非时序特征集合输入预先建立的第一分析子模型,得到第一中间结果。
根据本公开的实施例,所述确定所述目标对象的与所述分析时间段对应的第一时序特征集合包括:获取所述目标对象位于所述分析时间段内的第一时序数据;对所述第一时序数据进行特征提取处理,得到第一初始时序特征集合;对所述第一初始时序特征集合进行表示学习处理,得到所述第一时序特征集合。
根据本公开的实施例,所述对所述第一初始时序特征集合进行表示学习处理,得到所述第一时序特征集合包括:对所述第一初始时序特征集合进行表示学习处理,得到所述第一初始时序特征集合中每个第一初始时序特征的表示向量;以及基于所述每个第一初始时序特征的表示向量,得到所述第一时序特征集合。
根据本公开的实施例,所述确定分析时间段包括:从所述联合平台设备获得所述分析时间段,其中,所述分析时间段由所述联合平台设备基于所述第一机构服务器或者所述第二机构服务器提供的预定时序数据的时间戳确定;或者从所述第二机构服务器获得所述预定时序数据的时间戳,并基于所述时间戳确定所述分析时间段。
根据本公开的实施例,所述分析时间段以所述预定时序数据的时间戳作为终止时间;所述分析时间段的起始时间与所述终止时间间隔预定时长。
根据本公开的实施例,所述第一分析子模型预先通过以下方式建立:确定所述第一机构与所述第二机构共同拥有的多个训练对象;针对所述多个训练对象中的每个训练对象执行以下操作:获得与所述训练对象对应的训练时间段,所述训练时间段与所述训练对象的预定时序数据的时间戳相关;确定与所述训练时间段对应的第一时序样本特征集合;然后,对第一初始子模型进行多次更新,得到所述第一分析子模型,在每次更新过程中:至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据;将所述第一中间数据发送至所述联合平台设备,以使所述联合平台设备基于所述第一中间数据和所述第二机构服务器发送的第二中间数据得到总结果数据;接收所述总结果数据,并基于所述总结果数据对所述第一初始子模型的参数进行更新。
根据本公开的实施例,所述分析方法用于识别被诈骗用户;所述第一机构用于提供金融服务,所述第二机构用于提供网络社交服务,所述第一时序特征集合和所述第一非时序特征集合包括与金融相关的特征;或者所述第一机构用于提供网络社交服务,所述第二机构用于提供金融服务,所述第一时序特征集合和所述第一非时序特征集合包括与网络社交相关的特征。
本公开实施例的另一方面提供了一种模型构建方法,用于第一机构服务器,包括:确定所述第一机构与参与联合建模的第二机构共同拥有的多个训练对象。针对所述多个训练对象中的每个训练对象执行以下操作:获得与所述训练对象对应的训练时间段,所述训练时间段与所述训练对象的预定时序数据的时间戳相关;确定与所述训练时间段对应的第一时序样本特征集合。对第一初始子模型进行多次更新,得到所述第一分析子模型,在每次更新过程中:至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据;将所述第一中间数据发送至所述联合平台设备,以使所述联合平台设备基于所述第一中间数据和所述第二机构服务器发送的第二中间数据得到总结果数据;接收所述总结果数据,并基于所述总结果数据对所述第一初始子模型的参数进行更新。
根据本公开的实施例,所述针对所述多个训练对象中的每个训练对象执行的操作还包括:从本地存储数据中,获取所述训练对象的第一非时序样本数据;对所述第一非时序样本数据进行特征提取处理,得到第一非时序样本特征集合。至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据包括:将所述多个训练对象的第一时序样本特征集合和第一非时序样本特征集合输入所述第一初始子模型,得到第一中间数据。
根据本公开的实施例,所述确定与所述训练时间段对应的第一时序样本特征集合包括:从本地存储数据中,获取所述训练对象位于所述训练时间段内的第一时序样本数据;对所述第一时序样本数据进行特征提取处理,得到第一初始时序样本特征集合;对所述第一初始时序样本特征集合进行表示学习处理,得到所述第一时序样本特征集合。
根据本公开的实施例,对所述第一初始时序样本特征集合进行表示学习处理,得到所述第一时序样本特征集合包括:对所述第一初始时序样本特征集合进行表示学习处理,得到所述第一初始时序样本特征集合中每个第一初始时序样本特征的表示向量;以及基于所述每个第一初始时序样本特征的表示向量,得到所述第一时序样本特征集合。
根据本公开的实施例,所述确定所述第一机构与所述第二机构共同拥有的多个训练对象包括:从本地数据中,获得第一机构拥有的第一对象集合的主键信息;将所述第一对象集合的主键信息发送至所述联合平台设备,以使所述联合平台设备基于所述第一对象集合的主键信息与第二机构服务器发送的第二对象集合的主键信息确定所述共同拥有的多个训练对象;接收来自所述联合平台设备的所述共同拥有的多个训练对象。
根据本公开的实施例,所述获得与所述训练对象对应的训练时间段包括:从所述联合平台设备获得所述训练时间段,其中,所述分析时间段由所述联合平台设备基于所述第一机构服务器或者所述第二机构服务器提供的预定时序数据的时间戳确定;或者从所述第二机构服务器获得所述预定时序数据的时间戳,并基于所述时间戳确定所述训练时间段。
根据本公开的实施例,所述训练时间段以所述预定时序数据的时间戳作为终止时间;所述训练时间段的起始时间与所述终止时间间隔预定时长。
本公开实施例的另一方面提供了一种分析方法,由联合平台设备执行,包括:接收请求发起机构发送的对目标对象的分析请求,所述请求发起机构为第一机构服务器或者第二机构服务器;基于所述分析请求,从所述第一机构服务器或者所述第二机构服务器获取所述目标对象的预定时序数据的时间戳;基于所述预定时序数据的时间戳,确定分析时间段,并将所述分析时间段发送至所述第一机构服务器和所述第二机构服务器;接收来自所述第一机构服务器的第一中间结果和来自所述第二机构服务器的第二中间结果;基于所述第一中间结果和所述第二中间结果,得到分析结果。
本公开实施例的另一方面提供了一种模型构建方法,由联合平台设备执行,包括:接收来自第一机构服务器的第一对象集合的主键信息以及来自第二机构服务器的第二对象集合的主键信息;基于所述第一对象集合的主键信息和所述第二对象集合的主键信息,确定所述第一机构与所述第二机构共同拥有的多个训练对象;从所述第一机构服务器或者所述第二机构服务器获取每个训练对象的预定时序数据的时间戳;基于所述每个训练对象的预定时序数据的时间戳,确定每个训练对象对应的训练时间段,并将所述训练时间段发送至所述第一机构服务器和所述第二机构服务器;基于来自所述第一机构服务器的第一中间数据和来自所述第二机构服务器的第二中间数据,得到总结果数据,并将所述总结果数据发送至所述第一机构的服务器和所述第二机构的服务器。
本公开实施例的另一方面提供了一种分析方法,包括:所述联合平台设备响应于接收来自所述第一机构服务器或者第二机构服务器的对目标对象的分析请求,向所述第一机构服务器和所述第二机构服务器发送分析指令;所述第一机构服务器和/或所述第二机构服务器将所述目标对象的预定时序数据的时间戳发送至所述联合平台设备;所述联合平台设备基于所述时间戳确定分析时间段,并将所述分析时间段发送至所述第一机构服务器和所述第二机构服务器;所述第一机构服务器基于所述分析时间段确定第一时序特征集合,并至少将所述第一时序特征集合输入第一分析子模型,得到第一中间结果;所述第二机构服务器基于所述分析时间段确定第二时序特征集合,并至少将所述第二时序特征集合输入第二分析子模型,得到第二中间结果;所述联合平台设备基于所述第一中间结果和所述第二中间结果得到分析结果。
本公开实施例的另一方面提供了一种分析装置,用于第一机构服务器,包括:第一获取模块,用于响应于接收到对目标对象的分析指令,确定分析时间段,所述分析时间段与所述目标对象的预定时序数据的时间戳相关;时序特征模块,用于确定所述目标对象的与所述分析时间段对应的第一时序特征集合;模型分析模块,用于至少将所述第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果;以及第一发送模块,用于将所述第一中间结果发送至联合平台设备,以使所述联合平台设备基于所述第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,所述第二机构为与所述第一机构联合分析的机构。
本公开实施例的另一方面提供了一种模型构建装置,用于第一机构服务器,包括:对象确定模块,用于确定所述第一机构与参与联合建模的第二机构共同拥有的多个训练对象;样本特征模块,用于针对所述多个训练对象中的每个训练对象执行以下操作:获得与所述训练对象对应的训练时间段,所述训练时间段与所述训练对象的预定时序数据的时间戳相关;确定与所述分析时间段对应的第一时序样本特征集合;模型更新模块,用于对第一初始子模型进行多次更新,得到所述第一分析子模型,在每次更新过程中:至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据;将所述第一中间数据发送至所述联合平台设备,以使所述联合平台设备基于所述第一中间数据和所述第二机构服务器发送的第二中间数据得到总结果数据;接收所述总结果数据,并基于所述总结果数据对所述第一初始子模型的参数进行更新。
本公开实施例的另一方面提供了一种分析装置,用于联合平台设备,包括:请求接收模块,用于接收请求发起机构发送的对目标对象的分析请求,所述请求发起机构为第一机构服务器或者第二机构服务器;时间获取模块,用于基于所述分析请求,从所述第一机构服务器或者所述第二机构服务器获取所述目标对象的预定时序数据的时间戳;时间确定模块,用于基于所述预定时序数据的时间戳,确定分析时间段,并将所述分析时间段发送至所述第一机构服务器和所述第二机构服务器;结果接收模块,用于接收来自所述第一机构服务器的第一中间结果和来自所述第二机构服务器的第二中间结果;结果分析模块,用于基于所述第一中间结果和所述第二中间结果,得到分析结果。
本公开实施例的另一方面提供了一种联合分析系统,包括:第一机构服务器;第二机构服务器;以及联合平台设备;其中,所述第一机构服务器和所述第二机构服务器用于执行上述实施例的模型构建方法和分析方法。
本公开实施例的另一方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述实施例的模型构建方法和分析方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现上述实施例的模型构建方法和分析方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现上述实施例的模型构建方法和分析方法。
根据本公开的实施例,在联合建模和联合分析过程中,通过联合方中的一方或两方拥有的某个时序数据的时间戳来确定一个时间窗口(即训练时间段或分析时间段),使联合的双方对齐训练时间窗口或分析时间窗口,然后使两方均提取位于该时间窗口中的本地时序特征,并将时序特征纳入联合模型构建或者模型分析过程中。基于这一方案,增加了联合建模双方的时序协商机制,可以帮助建模双方很好地将时序数据引入行为分析模型以解决时序分析难的问题,解决了联邦学习存在的无法对时序行为进行分析的瓶颈问题,很大程度上解决的时序输入无法参与联合建模的困境。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的可以应用分析方法和模型构建方法的示例性系统架构;
图2A、图2B和图2C示意性示出了根据本公开实施例的由第一机构服务器执行的模型构建方法的流程图;
图3示意性示出了根据本公开实施例的由第一机构服务器执行的分析方法的流程图;
图4示意性示出了根据本公开实施例的确定第一时序特征集合的流程图;
图5示意性示出了根据本公开实施例的由联合平台设备执行的分析方法的流程图;
图6示意性示出了根据本公开实施例的用于第一机构服务器的分析装置的框图;以及
图7示意性示出了根据本公开实施例的适于实现模型构建方法和分析方法的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种分析方法,包括:响应于接收到对目标对象的分析指令,确定分析时间段,其中,分析时间段与目标对象的预定时序数据的时间戳相关。获取目标对象位于分析时间段内的第一时序数据;基于第一时序数据,得到第一时序特征集合。至少将第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果。将第一中间结果发送至联合平台设备,以使联合平台设备基于第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,第二机构为与第一机构联合分析的机构。
图1示意性示出了根据本公开实施例的可以应用分析方法和模型构建方法的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括联合平台设备101、第一机构的服务器102和第二机构的服务器103。此外,还可以包括第一机构的数据库104和第二机构的数据库105。联合平台可以独立于第一机构和第二机构,例如可以部署在政府等官方机构环境中,或者也可以部署在第一机构或第二机构任何一方的可信执行环境(Trustedexecution environment,TEE)中。
第一机构的服务器102可以从第一机构的数据库104获取第一机构所存储的用户数据,并根据用户数据得到第一机构侧的本地特征。第二机构的服务器103可以从第二机构的数据库105获取第二机构所存储的用户数据,并根据用户数据得到第二机构侧的本地特征。
联合平台设备101可以在保护第一机构和第二机构数据隐私的情况下联合两方协同共建分析模型。具体地,第一机构服务器和第二机构服务器可以各自拥有一个本地子模型,联合平台设备101可以对第一机构服务器和第二机构服务器的本地子模型进行多轮更新,在每轮更新过程中:第一机构服务器和第二机构的服务器可以分别将本地的特征数据输入本地子模型中,并将子模型的中间结果均反馈给联合平台设备101,由联合平台设备101将两方的中间结果进行整合,并将整合的结果反馈给两方,两方根据联合平台设备101整合的结果进行子模型的更新。经过多轮更新后,模型可以收敛,模型训练完成,两方各自拥有的子模型构成了一个完整的分析模型,两方各自拥有的子模型均保存在本地。
当需要利用构建好的模型进行分析时,第一机构服务器和第二机构服务器可以分别提取目标对象的本地特征,并分别将目标对象的本地特征输入本地子模型中,得到中间结果,两方再将中间结果发送至联合平台机构进行整合,得到最终的分析结果。
基于以上方式,可以整合多个机构的不同特征,弥补单方特征维度的不足,而且在模型训练和模型应用过程中,不需要将一方的用户数据发送给另一方或者平台,仅反馈训练的中间结果即可,使各个机构可以将用户数据保留在本地,保护了用户数据的隐私。
应该理解,图1中的联合平台设备、第一机构服务器和数据库、以及第二机构服务器和数据库的数目仅仅是示意性的。根据实现需要,可以具有任意数目的联合平台设备、第一机构服务器和数据库、以及第二机构服务器和数据库。
本公开实施例的模型构建方法可以用于构建被诈骗用户(受害用户)识别模型,根据本公开的实施例,被诈骗用户识别模型可以联合金融机构和网络社交机构建立,金融机构例如可以是银行,网络社交机构例如可以是提供聊天软件的机构。相应地,本公开实施例的分析方法可以用于识别被诈骗用户(受害用户)。其中,第一机构可以是联合的若干个机构中的任意一个机构,例如,在金融机构和网络社交机构联合建模和分析的场景中,第一机构可以是指金融机构,也可以是指网络社交机构。第二机构为与第一机构联合建模和分析的机构,例如在金融机构和网络社交机构联合建模和分析的场景中,若第一机构为金融机构,则第二机构可以是指网络社交机构。
为了便于理解,接下来先描述构建模型的过程,然后再描述模型应用的过程。
图2A、图2B和图2C示意性示出了根据本公开实施例的由第一机构服务器执行的模型构建方法的流程图。
如图2A所示,根据本公开的实施例,在模型应用之前预先基于以下操作S210~S230建立第一机构侧的第一分析子模型和第二机构侧的第二分析子模型,第二机构为与第一机构进行联合建模的机构,以下以第一机构侧执行的操作S210~S230为例进行说明,第二机构侧执行的操作与第一机构侧相对应,因此第二机构侧也可以执行相应的操作来得到第二分析子模型。
在操作S210,确定第一机构与参与联合建模的第二机构共同拥有的多个训练对象。
根据本公开的实施例,由于第一机构和第二机构的用户群体并非完全重合,因此可以先对第一机构和第二机构的用户进行对齐,确定第一机构和第二机构的共有用户,然后利用共有的用户进行模型训练,可以保证用于建模的用户均具有两侧机构的特征。其中,本公开实施例的用户是指分析对象或分析主体,可以是指人或者账户。
根据本公开的实施例,第一机构服务器可以从本地数据中,获得第一机构拥有的第一对象集合的主键信息,并将第一对象集合的主键信息发送至联合平台设备。第二机构服务器同样可以从本地数据中,获得第二机构拥有的第二对象集合的主键信息,并将第二对象集合的主键信息发送至联合平台设备。以使联合平台设备基于第一对象集合的主键信息与第二对象集合的主键信息确定共同拥有的多个训练对象。然后,第一机构服务器和第二机构服务器可以接收来自联合平台设备确定的共同拥有的多个训练对象。
例如,可以由联合平台设备确定第一机构和第二机构的共有用户。第一机构服务器可以从第一机构的本地数据库中获取一些第一机构侧的用户作为第一用户集合并获取每个用户的主键信息,第二机构服务器可以从第二机构的本地数据库中获取一些第二机构侧的用户作为第二用户集合并获取每个用户的主键信息,然后,第一机构服务器和第二机构服务器可以分别将第一用户集合的主键信息和第二用户集合的主键信息加密后发送至联合平台机构,例如两方(第一机构和第二机构)均可以将各自的主键信息加密转化为HASH值或MD5值后发送至联合平台机构。其中,主键信息可以包括手机号、卡号、身份证号等标识信息中的至少一种,例如网络社交机构需要用户利用手机号注册、利用身份证号实名制,以及利用卡片管理功能绑定银行卡(例如钱包功能)等,银行等金融机构需要用户填写手机号、身份证号并且为用户办理银行卡,因此,在网络社交机构和金融机构联合建模的场景下,可以将手机号、卡号、身份证号中的任意一种或几种作为主键信息。
其中,第一机构选择的第一用户集合或者第二机构选择的第二用户集合可以包含具有黑白标签的用户。例如,经过金融机构的长期积累,已有一些用户被金融机构识别为受害用户,金融机构为相应用户设置了受害用户的标签,其他用户设置为非受害用户的标签。同样地,经过社交网络机构的长期积累,已有一些用户被社交网络机构识别为受害用户,第二机构为相应用户设置了受害用户的标签,其他用户设置为非受害用户的标签。根据实际需求,在模型训练过程中,可以选用第一机构的标签信息或者第二机构的标签信息进行建模。
根据本公开的实施例,联合平台设备可以接收来自第一机构服务器的第一对象集合的主键信息以及来自第二机构服务器的第二对象集合的主键信息,并基于第一对象集合的主键信息和第二对象集合的主键信息,确定第一机构与所述第二机构共同拥有的多个训练对象。
例如,第一对象集合可以是指上述的第一用户集合,第二对象集合可以是指上述的第二用户集合。联合平台设备可以根据第一对象集合的主键信息和第二对象集合的主键信息确定共有用户,例如可以根据两方发送的表征主键信息的HASH值或MD5值执行哈希碰撞等操作碰撞出主键相同的用户作为共有用户,然后将共有用户的加密的主键信息反馈给两方。
第一机构服务器和第二机构服务器接收到联合平台设备发送的共有用户的主键信息后,可以将共有用户作为训练对象进行特征提取和模型训练。
在操作S220,针对多个训练对象中的每个训练对象执行预定操作,如图2B所示,预定操作包括操作S221和操作S222。
在操作S221,获得与训练对象对应的训练时间段,训练时间段与训练对象的预定时序数据的时间戳相关。其中,获得与训练对象对应的训练时间段是指获得每个训练对象的训练时间段。
例如,在识别受害用户的场景中,受害用户可能对被诈骗人诱骗执行一系列动作,例如,加诈骗人好友、与诈骗人聊天、向诈骗人转账等,转账后诈骗人即达到了其犯罪目的。因此,转账动作可以作为建模过程中受害用户的最后一个动作,以该动作作为终点分析转账前的一段时间内的特征。在该应用场景中,操作S221的预定时序数据可以是指转账动作,先确定每个训练对象的转账动作的时间戳,然后根据时间戳确定训练时间段。
根据本公开的实施例,训练时间段以预定时序数据的时间戳作为终止时间,训练时间段的起始时间与终止时间间隔预定时长。其中,预定时长可以是一个月、一天、一小时、半小时等,可以根据实际需要设定。
例如,将预定时序数据的时间戳作为训练时间段的终止时间节点t-end,往前推预定时长Δt可以得到起始时间节点t-start,将t-start和t-end之间的时间窗口作为训练时间段。基于这一方式,可以得到每个训练对象对应的训练时间段,由于不同训练对象执行终止动作的时间可能不同,因此,不同训练对象对应的训练时间段也可能不同。
根据本公开的实施例,操作S221中的训练对象对应的训练时间段可以通过以下操作(1)或(2)获得:(1)从联合平台设备获得训练时间段,其中,分析时间段由联合平台设备基于第一机构服务器或者第二机构服务器提供的预定时序数据的时间戳确定;(2)从第二机构服务器获得预定时序数据的时间戳,并基于时间戳确定训练时间段。
在本公开的实施例中,预定时序数据的时间戳可能仅保存在一侧机构的服务器中,可能保存于第一机构服务器或者第二机构服务器,例如在识别被诈骗用户的场景中,转账动作的时间戳仅保存在金融机构侧,因此,可以使保存有预定时序数据的时间戳的一侧机构服务器将各个训练对象的时间戳发送至联合平台设备,由联合平台设备确定每个训练对象对应的训练时间段,然后再由联合平台设备将每个训练对象对应的训练时间段发送至第一机构服务器和第二机构服务器。或者,对于互相信任的两侧机构,可以使拥有预定时序数据的时间戳的一侧机构将时间戳发送至另一侧机构,使两侧机构均具有时间戳并且均可以根据时间戳确定训练时间段,在两侧机构交互数据的过程中需要对数据进行加密处理。
在本公开的另一实施例中,在应用于其他场景时,第一机构和第二机构可能均保存有预定时序数据的时间戳,这种情况下,两方可以将各自的时间戳发给联合平台设备,由联合平台设备根据其中一个时间戳确定训练时间段,或者根据两者的时间戳确定两个训练时间段。
在操作S222,确定与训练时间段对应的第一时序样本特征集合。
例如,在获得每个训练对象对应的训练时间段后,可以提取每个训练对象在对应的训练时间段内的多个时序特征,构建每个训练对象的第一时序样本特征集合。
根据本公开的实施例,可以通过以下操作(1)~(3)确定与训练时间段对应的第一时序样本特征集合:(1)从本地存储数据中,获取训练对象位于训练时间段内的第一时序样本数据;(2)对第一时序样本数据进行特征提取处理,得到第一初始时序样本特征集合;(3)对第一初始时序样本特征集合进行表示学习处理,得到第一时序样本特征集合。其中,(3)对第一初始时序样本特征集合进行表示学习处理,得到第一时序样本特征集合可以包括:对第一初始时序样本特征集合进行表示学习处理,得到第一初始时序样本特征集合中每个第一初始时序样本特征的表示向量;以及基于每个第一初始时序样本特征的表示向量,得到所述第一时序样本特征集合。
例如,对于第一机构侧,从第一机构的数据库中获取每个训练对象的时序数据,时序数据可以是指用户的操作行为序列,以训练对象A1为例,训练对象A1对应的训练时间段例如为[t1,t10],则获取第一机构侧训练对象A1在[t1,t10]这段时间段内的时序数据,即训练对象A1在这段时间内按照时间顺序依次执行的动作,对于金融机构侧,训练对象A1执行的动作可能包括:t5时刻在设备c登陆了电子账户、t6时刻查看了账户余额、t7时刻执行了交易d等。
然后,对训练对象A1的时序数据进行特征提取处理,将提取出的多个特征按照时间顺序排列组成第一初始时序样本特征集合,以此得到每个训练对象的第一初始时序样本特征集合B∈[bt1、bt2、bt3...btn]。例如,第一机构为金融机构的情况下,训练对象A1在金融机构侧的第一初始时序样本特征集合BA1可以包括表1所示的多个特征:
表1
Figure BDA0002598533340000161
接下来,对训练对象A1的第一初始时序样本特征集合进行表示学习处理,得到其中每个第一初始时序样本特征的表示向量。
例如,可以将训练对象A1与其他若干个训练对象的第一初始时序样本特征集合一同输入预先训练好的深度模型中,采用深度学习对各个训练对象的初始时序特征进行表示学习,以深度模型的参数来表示模型的输入特征,将输入的时序特征转换为由模型参数表示的特征。例如,训练对象A1~A10的初始特征集合均为一个一维矩阵,且每个一维矩阵均包括10个特征,则训练对象A1~A10的特征集合可组成一个10*10的矩阵,将该10*10的矩阵输入深度模型中,模型计算结束后,可取深度模型中激活层前的最后一个隐层的m*k维的矩阵作为各个特征的表示向量,在应用过程中,可采用类似查表的方式,例如特征a1对应该隐层第1行的k维向量,特征特征a2对应该隐层第2行的k维向量,特征特征am对应该隐层第m行的k维向量,基于以上方式,可以得到10*10的矩阵中包含的每个特征的向量化表示(也可称为表示向量)。在利用深度模型进行学习表示的过程中,无论输入深度模型的矩阵中包含多少个不同的特征,均可以得到每个特征的向量化表示,例如,训练对象A1的初始特征集合为(特征a1,特征a2,特征a3),训练对象A2的初始特征集合为(特征a1,特征a4,特征a5),将训练对象A1和训练对象A1的初始特征集合输入深度模型后,可以根据深度模型的参数得到特征a1、a2、a3、a4和a5各自的最终向量表示。特征的向量化表示可以隐含该特征与其他特征之间的时序关系,例如该特征在某一特征之后出现的概率以及在某一特征之前出现的概率。
得到了第一初始时序样本特征集合B∈[bt1、bt2、bt3...btn]中的任一特征bti的向量化表示Ωti=[ω1、ω2、ω3....ωm]之后,可以对集合中的多个特征的向量化表示求均值得到第一初始时序样本特征集合B’。例如对于训练对象A1,第一初始时序样本特征集合BA1∈[bt1、bt2、bt3、bt4、bt5、bt6],其中,特征bt1~bt6的表示向量分别为Ωt1~Ωt6,则集合BA1的向量化表示为(Ωt1t2t3t4t5t6)/6,将该集合BA1的向量化作为最终的第一初始时序样本特征集合BA1’。
基于以上方式,得到了每个训练对象在第一机构侧的第一初始时序样本特征集合。
同样地,对于第二机构侧,可以执行上述操作S222中的获取样本数据、提取特征和表示学习步骤来得到每个训练对象在第二机构侧的第二初始时序样本特征集合。不同的是,第二机构侧的特征的类型与第一机构侧有所不同,还以训练对象A1以及训练时间段[t1,t10]为例,获取第二机构侧训练对象A1在[t1,t10]这段时间段内依次执行的动作,对于网络社交机构侧,训练对象A1执行的动作可能包括在t2时刻新加了好友e、t3时刻收到了好友e发送的网络链接、t4时刻打开了好友e发送的网络链接等。训练对象A1在网络社交机构侧的第二初始时序样本特征集合可以包括表2所示的多个特征:
表2
Figure BDA0002598533340000181
在操作S230,至少基于多个训练对象的第一时序样本特征集合,对第一初始子模型进行多次更新,得到第一分析子模型,如图2C所示,在每次更新过程中执行操作S231~操作S233。
在操作S231,至少将多个训练对象的第一时序样本特征集合输入第一初始子模型,得到第一中间数据。
在操作S232,将第一中间数据发送至联合平台设备,以使联合平台设备基于第一中间数据和第二机构服务器发送的第二中间数据得到总结果数据。
在操作S233,接收总结果数据,并基于总结果数据对第一初始子模型的参数进行更新。
例如,第一机构服务器在得到各个训练对象的第一时序样本特征集合后,可以执行第一轮计算,至少将各个训练对象的第一时序样本特征集合输入第一机构侧的第一初始子模型计算得到第一中间数据。其中,第一初始子模型例如可以采用逻辑回归模型(Logistic Regression,LR)、梯度下降决策树模型(Gradient Boosting Decision Tree,GBDT)、极端梯度提升模型(eXtreme Gradient Boostin,XgBoost)、卷积神经网络模型(Convolutional Neural Networks,CNN)、循环神经网络模型(Recurrent NeuralNetwork,RNN)等模型中的一种。对于逻辑回归模型等线性模型以及神经网络模型,第一中间结果数据可以是指模型的预测值或者损失值或者梯度,以逻辑回归模型为例,若第一机构侧利用特征x1和x2进行训练,两个特征的模型权重分别为w1和w2,则预测值可以是w1*x1+w2*x2。对于决策树等非线性模型,第一中间数据例如可以是指针对第一机构侧具有的每个特征计算得到的信息增益。在第一机构服务器得到第一轮的第一中间数据后,可以将第一中间数据发送至联合平台设备。
同样地,第二机构的服务器在得到各个训练对象的第一时序样本特征集合后,可以执行第一轮计算,至少将各个训练对象的第二时序样本特征集合输入第二机构侧的第二初始子模型计算得到第二中间数据。其中,第二初始子模型与第一初始子模型的类型相同。同样地,对于逻辑回归模型等线性模型以及神经网络模型,第二中间数据可以是指将模型的预测值或者损失值或者梯度,以逻辑回归模型为例,若第二机构侧利用特征x3和x4进行训练,两个特征的模型权重分别为w3和w4,则预测值可以是w3*x3+w4*x4。对于决策树等非线性模型,第二中间数据例如可以是指针对第二机构侧具有的每个特征计算得到的信息增益。在第二机构得到第一轮的第二中间数据后,可以将第一轮的第二中间数据发送至联合平台设备。
上述内容中提到了在第一机构服务器和第二机构服务器均具有标签信息的情况下,可以选用其中一方的标签,被选定标签信息的一方,可以在向联合平台设备发送中间数据时,将标签信息同时发送至联合平台设备。
联合平台设备接收到第一轮的第一中间数据、第二中间数据以及标签信息后,可以将第一中间数据和第二中间数据进行整合得到总结果数据。其中,对于逻辑回归模型等线性模型以及神经网络模型,总结果数据例如可以是指两方的总损失或者总梯度,以逻辑回归模型为例,联合平台设备可以将两方的预测值进行加和(w1*x1+w2*x2)+(w3*x3+w4*x4),得到总预测值,然后对总预测值和总真实值(标签)进行计算,得到总损失。对于决策树等非线性模型,联合平台设备可以将两方上传的各个属性的信息增益进行比较,得出信息增益最大的属性,将该属性作为树的第一个分裂点。联合平台设备得到第一轮的总结果数据后,可以将总结果数据发送回第一机构的服务器和第二机构的服务器。
第一机构的服务器和第二机构的服务器接收到第一轮的总结果数据,可以分别利用总结果数据对第一初始子模型和第二初始子模型的参数进行第一轮更新,例如可以根据反向传播算法计算模型参数基于损失函数的偏导数,通过梯度下降迭代更新模型参数。对于决策树等模型,可以基于总结果数据计算下一节点上各个属性的信息增益。
对第一初始子模型和第二初始子模型更新完成后,进入第二轮计算过程。第一机构服务器基于各个训练对象的第一时序样本特征集合和更新后的第一初始子模型计算得到第二轮的第一中间数据,第二机构的服务器基于第一时序样本特征集合和更新后的第二初始子模型计算得到第二轮的第二中间数据。联合平台设备对第二轮的第一中间结果数据和第二中间结果数据进行整合,得到第二轮的总结果数据,并反馈给第一机构的服务器和第二机构的服务器,以使第一机构的服务器和第二机构的服务器分别对第一初始子模型和第二初始子模型的参数进行第二轮更新。以此类推,联合平台设备对相同轮次的两方中间结果数据进行整合,并反馈给第一机构服务器和第二机构服务器进行更新,直至模型训练完毕,第一机构服务器和第二机构服务器分别得到第一分析子模型和第二分析子模型。
在本公开另一实施例中,针对多个训练对象中的每个训练对象执行的操作还可以包括:从本地存储数据中,获取训练对象的第一非时序样本数据;以及对第一非时序样本数据进行特征提取处理,得到第一非时序样本特征集合。至少将多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据包括:将多个训练对象的第一时序样本特征集合和第一非时序样本特征集合输入所述第一初始子模型,得到第一中间数据。
例如,在识别被诈骗用户的应用场景中,用户的非时序特征也可以纳入模型构建中。对于金融机构,可以对每个训练对象提取如表3所示的非时序特征中的至少一种。
表3
用户画像
用户历史操作画像
用户历史交易习惯
用户资产分布
金融账户绑卡情况
金融账户历史平均交易额
金融账户日/月交易笔数
其中,用户画像可以是指用户的形象标签,可以反映用户所属的人群类型;用户历史操作画像例如可以根据用户的历史操作抽象成标签类型,例如可以包括转账多类型、开卡多类型、储蓄多类型等。
对于网络社交机构,可以对每个训练对象提取如表4所示的非时序特征中的至少一种。
表4
账户好友数量
账户好友分布(例如男女分布,加好友时间分布等)
账户注册时间
账户使用周期
账户朋友圈分布
在第一机构服务器获得每个训练对象的第一非时序样本特征集合和第一时序样本特征集合后,在每轮计算过程中可以将非时序特征连通时序特征一起输入第一初始子模型进行训练得到第一中间数据。同样地,在第二机构服务器获得每个训练对象的第二非时序样本特征集合和第二时序样本特征集合后,在每轮计算过程中可以将非时序特征连通时序特征一起输入第二初始子模型进行训练得到第二中间数据。经过多轮计算更新后,可以得到基于非时序特征和时序特征得到的第一分析子模型和第二分析子模型。
根据本公开的实施例,在联合建模过程中,通过联合建模中的一方或两方拥有的某个时序数据的时间戳来确定一个时间窗口(训练时间段),使联合建模的双方对齐训练时间窗口,然后使两方均提取位于该时间窗口中的本地时序特征,并将时序特征纳入联合模型构建过程中。基于这一方案,增加了联合建模双方的时序协商机制,可以帮助建模双方可以很好地将时序数据引入行为分析模型以解决时序分析难的问题,解决了联邦学习瓶颈问题,很大程度上解决的时序输入无法参与联合建模的困境。
根据本公开的实施例,在联合建模过程中,还可以引入非时序数据,利用两方的时序数据和非时序数据一同建模,考虑了时序和非时序特征,可以使构建的模型具有时序和非时序属性,使模型分析更为准确。
根据本公开的实施例,在得到时序特征的过程中,先对位于训练时间段内的时序数据进行特征提取得到初始时序特征,然后再对初始时序特征进行表示学习,利用深度模型的参数对各个初始时序特征进行表示。如果时序特征不经过学习表示而直接应用,需划分出多个序列对,由于用户行为的数量很多,且还要考虑行为之间的先后顺序,会造成序列对划分和训练时的数据量较大,例如,对于行为集合(a1,a2,a3),在只考虑两个动作的先后顺序情况下,会产生a1a2、a2a1、a2a3、a3a2、a1a3、a3a1、a1a1、a2a2、a3a3九维特征,而在实际应用中,行为数量远大于两个,运算较为困难,因此,本申请在提取时序特征之后又对时序特征进行了表示学习,可以将过于稀疏和冗余的初始时序特征进行简化,并且提炼得到能够更好地表达用户行为的时序特征。
根据本公开的实施例,在得到时序特征的过程中,利用深度模型得到了每个时序特征的表示向量,时序特征的向量化表示可以隐含该时序特征与其他时序特征之间的时序关系,可以使参与训练的时序特征更为准确。然后,将每个训练对象的多个时序特征的向量化表示加和平均得到每个训练对象的最终时序特征集合,可以使训练对象的时序特征集合包含每个时序特征的信息。
根据本公开的实施例,在识别被诈骗用户的场景中,联合金融机构和网络社交机构建模,可以使模型具有网络社交特征和金融特征,覆盖网络诈骗的全流程,使两方联合构建的模型具有更强的受诈骗用户识别能力。
基于以上方案构建得到分析模型(包括第一机构侧的第一分析子模型和第二机构侧的第二分析子模型)之后,可以应用分析模型对目标对象进行分析。以下就应用分析模型对目标对象进行分析的过程进行描述。
图3示意性示出了根据本公开实施例的由第一机构服务器执行的分析方法的流程图。
如图3所示,该分析方法可以包括操作S310~S340。
在操作S310,响应于接收到对目标对象的分析指令,确定分析时间段,分析时间段与目标对象的预定时序数据的时间戳相关。
例如,第一机构服务器和第二机构服务器均可以向联合平台设备发起对目标对象的分析请求,联合平台设备接收请求后,可以向所述第一机构服务器和所述第二机构服务器发送分析指令,通知第一机构服务器和第二机构服务器开始对目标对象进行模型分析。在识别被诈骗用户的应用场景中,对于金融机构侧,可以将当前正在进行转账的用户作为目标对象,将其主键信息发送至联合平台设备,向联合平台设备发起识别请求。在本公开另一实施例中,联合平台设备接收到对目标用户的分析请求后,可以先确定目标对象是否是第一机构和第二机构共有的用户,若是,则通知第一机构的服务器和第二机构的服务器针对目标用户开始模型分析。
根据本公开的实施例,操作S310中的确定分析时间段可以包括:从联合平台设备获得分析时间段,其中,分析时间段由联合平台设备基于第一机构服务器或者第二机构服务器提供的预定时序数据的时间戳确定。或者第一机构服务器可以直接从第二机构服务器获得预定时序数据的时间戳,并基于时间戳确定分析时间段。
例如,预定时序数据的时间戳可能仅保存在一侧机构的服务器中,例如转账动作的时间戳仅保存在金融机构侧,这种情况下,拥有预定时序数据时间戳的一侧机构可以将目标对象的特定时间戳发送至联合平台设备,由联合平台设备基于时间戳确定分析时间段,并将分析时间段反馈给第一机构服务器和第二机构服务器。在本公开另一实施例中,对于互相信任的两侧机构,也可以使拥有预定时序数据时间戳的一侧机构可以将目标对象的特定时间戳发送另一侧机构,使两侧机构均具有所需的目标对象的特定时间戳并且均可以根据时间戳确定分析时间段。
根据本公开的实施例,分析时间段以目标对象的预定时序数据的时间戳作为终止时间,分析时间段的起始时间与终止时间间隔预定时长。例如,在识别被诈骗用户的场景中,预定时序数据可以是指转账动作,以转账动作的时间戳作为终止时间节点t-end,往前推预定时长Δt可以得到起始时间节点t-start,将t-start和t-end之间的时间窗口作为分析时间段。
在操作S320,确定目标对象的与分析时间段对应的第一时序特征集合。
图4示意性示出了根据本公开实施例的确定第一时序特征集合的流程图。
如图4所示,根据本公开的实施例,操作S320可以包括操作S321~操作S323:
在操作S321,获取目标对象位于分析时间段内的第一时序数据。
在操作S322,对第一时序数据进行特征提取处理,得到第一初始时序特征集合。
在操作S323,对第一初始时序特征集合进行表示学习处理,得到第一时序特征集合。其中,可以通过以下步骤(1)和(2)得到第一时序特征集合:(1)对第一初始时序特征集合进行表示学习处理,得到第一初始时序特征集合中每个第一初始时序特征的表示向量;(2)基于每个第一初始时序特征的表示向量,得到第一时序特征集合。
例如,在第一机构服务器得到分析时间段之后,可以从目标对象的本地时序数据中筛选出位于该分析时间段内的时序数据,得到目标对象在这段时间内按照时间顺序依次执行的动作。然后,从筛选出的时序数据中提取出目标对象的多个时序特征作为初始时序特征,组成第一初始时序特征集合。在识别被诈骗用户的应用场景中,若第一机构为提供金融服务的金融机构,则第一机构服务器可以提取与金融相关的特征,例如用户执行的登陆电子账户、查看余额、转账交易等特征,特征类型包括但不限于表1所列的各个特征。
在得到第一初始时序特征集合之后,可以对第一初始时序特征集合中的各个初始时序特征进行表示学习处理,例如,将各个初始时序特征输入预先训练好的深度模型中,以深度模型的参数来表示目标对象的初始时序特征,将输入深度模型的时序特征转换为由模型参数表示的特征,得到每个初始时序特征的表示向量,然后将各个初始时序特征的表示向量加和平均,得到第一时序特征集合。
同样地,在第二机构服务器得到分析时间段之后,也可以参照上述操作S321~操作S323得到第二时序特征集合。其中,第二机构服务器提取的特征类型与第一机构服务器不同,例如,在识别被诈骗用户的应用场景中,若第二机构为提供网络社交服务的网络社交机构,则可以提取与网络社交相关的特征,例如用户执行的添加好友、查看好友发送的网络链接等特征,特征类型包括但不限于表2所列的各个特征。
在操作S330,至少将第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果。
在操作S340,将第一中间结果发送至联合平台设备,以使联合平台设备基于第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,第二机构为与第一机构联合分析的机构。
例如,在第一机构服务器得到第一时序特征集合之后,可以将第一时序特征集合输入预先建立的第一分析子模型中,计算得到第一中间结果,并将第一中间结果发送至联合平台设备,其中,第一中间结果可以包括第二分析子模型的预测值,以逻辑回归模型为例,若第一时序特征集合包括时序特征x1’和x2’,两个特征的模型权重分别为w1’和w2’,则预测值L1可以是w1’*x1’+w2’*x2’。
同样地,在第二机构服务器得到第二时序特征集合之后,也可以将第二时序特征集合输入预先建立的第二分析子模型中,计算得到第二中间结果,并将第二中间结果发送至联合平台设备,其中,第二中间结果可以包括第二分析子模型的预测值,以逻辑回归模型为例,若第二时序特征集合包括时序特征x3’和x4’,两个特征的模型权重分别为w3’和w4’,则预测值L2可以是w3’*x3’+w4’*x4’。
联合平台设备接收到第一中间结果和第二中间结果之后,可以将第一中间结果和第二中间结果进行整合,得到分析结果。例如,可以将L1与L2进行加和,得到总预测值,并根据总预测值确定分析结果,分析结果例如可以是受诈骗用户或者非受诈骗用户。然后,联合平台设备可以将可以将分析结果反馈给第一机构服务器和/或第二机构服务器,以使第一机构和/或第二机构根据分析结果采取相应的措施。例如,联合平台设备可以将识别结果发给金融机构侧和网络社交机构侧,对于金融机构侧,若目标对象为受诈骗用户,则金融机构可以对目标电话号码对应的账户进行冻结并进行电话回访,阻止诈骗行为的发生。
在本公开另一实施例中,分析方法还可以包括以下操作(1)和(2):(1)获取目标对象的第一非时序数据;(2)对第一非时序数据进行特征提取处理,得到第一非时序特征集合。上述的至少将第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果可以包括:将第一时序特征集合和第一非时序特征集合输入预先建立的第一分析子模型,得到第一中间结果。
例如,可以将目标对象的非时序特征也纳入分析过程中,第一机构服务器可以从本地数据中提取目标用户的多个非时序特征以组成第一非时序特征集合。在识别被诈骗用户的应用场景中,对于金融机构侧,可以提取目标对象的金融相关的多个非时序特征,可以包括但不限于表3所示各个特征。然后,第一机构服务器可以将第一非时序特征集合连同第一时序特征集合一起输入第一分析子模型,得到第一中间结果,并将第一中间结果发送至联合平台设备。
同样地,第二机构服务器也可以从本地数据中提取目标用户的多个非时序特征组成第二非时序特征集合。在识别被诈骗用户的应用场景中,对于网络社交机构侧,可以提取目标对象的网络社交相关的非时序特征,可以包括但不限于表4所示各个特征。然后,第二机构服务器可以将第二非时序特征集合连同第二时序特征集合一起输入第二分析子模型,得到第二中间结果,并将第二中间结果发送至联合平台设备。
联合平台设备可以基于第一中间结果和第二中间结果得到最终的分析结果。
根据本公开的实施例,在利用联合构建的模型进行联合分析过程中,通过联合方中的一方或两方拥有的某个时序数据的时间戳来确定一个时间窗口(分析时间段),使联合分析的双方对齐训练时间窗口,然后使两方均提取位于该时间窗口中的本地时序特征,并将时序特征纳入联合模型分析过程中。基于这一方案,增加了联合建模双方的时序协商机制,解决了联合分析过程中时序分析难的问题,解决了联邦学习瓶颈问题,很大程度上解决的时序输入无法参与联合分析的困境。
根据本公开的实施例,在联合分析过程中,还可以引入非时序数据,利用两方的时序数据和非时序数据一同分析,考虑了时序和非时序特征,使分析结果更为准确。
根据本公开的实施例,在得到时序特征的过程中,先对位于分析时间段内的时序数据进行特征提取得到初始时序特征,然后再对初始时序特征进行表示学习,利用深度模型的参数对各个初始时序特征进行表示。可以将过于稀疏和冗余的初始时序特征进行简化,并且提炼得到能够更好地表达用户行为的时序特征。
根据本公开的实施例,在识别被诈骗用户的场景中,联合金融机构和网络社交机构联合分析,可以对受诈骗用户具有较强的识别能力。
本公开实施例的另一方面还提供了一种联合平台设备执行的分析方法。
图5示意性示出了根据本公开实施例的由联合平台设备执行的分析方法的流程图。
如图5所示,该分析方法包括操作S510~操作S550。
在操作S510,接收请求发起机构发送的对目标对象的分析请求,请求发起机构为第一机构服务器或者第二机构服务器。
在操作S520,基于分析请求,从第一机构服务器或者第二机构服务器获取目标对象的预定时序数据的时间戳。
在操作S530,基于预定时序数据的时间戳,确定分析时间段,并将分析时间段发送至第一机构服务器和第二机构服务器。
在操作S540,接收来自第一机构服务器的第一中间结果和来自第二机构服务器的第二中间结果。
在操作S550,基于第一中间结果和第二中间结果,得到分析结果。
具体地,由联合平台设备执行的分析方法可以参考上述内容中对联合平台设备在分析过程中执行的相应操作的描述,在此不再赘述。
本公开实施例的另一方面还提供了一种联合平台设备执行的模型构建方法,该方法可以包括下述操作(1)~(5):
(1)接收来自第一机构服务器的第一对象集合的主键信息以及来自第二机构服务器的第二对象集合的主键信息。
(2)基于第一对象集合的主键信息和第二对象集合的主键信息,确定第一机构与第二机构共同拥有的多个训练对象。
(3)从第一机构服务器或者第二机构服务器获取每个训练对象的预定时序数据的时间戳。
(4)基于每个训练对象的预定时序数据的时间戳,确定每个训练对象对应的训练时间段,并将训练时间段发送至第一机构服务器和第二机构服务器。
(5)基于来自第一机构服务器的第一中间数据和来自第二机构服务器的第二中间数据,得到总结果数据,并将总结果数据发送至第一机构的服务器和第二机构的服务器。
具体地,由联合平台设备执行的模型构建方法可以参考上述内容中对联合平台设备在模型构建过程中执行的相应操作的描述,在此不再赘述。
本公开实施例的另一方面还提供了一种分析方法,该方法可以包括下述操作(1)~(6):
(1)联合平台设备响应于接收来自第一机构服务器或者第二机构服务器的对目标对象的分析请求,向第一机构服务器和第二机构服务器发送分析指令;
(2)第一机构服务器和/或第二机构服务器将目标对象的预定时序数据的时间戳发送至联合平台设备;
(3)联合平台设备基于时间戳确定分析时间段,并将分析时间段发送至第一机构服务器和第二机构服务器;
(4)第一机构服务器基于分析时间段确定第一时序特征集合,并至少将第一时序特征集合输入第一分析子模型,得到第一中间结果;
(5)第二机构服务器基于分析时间段确定第二时序特征集合,并至少将第二时序特征集合输入第二分析子模型,得到第二中间结果;
(6)联合平台设备基于第一中间结果和第二中间结果得到分析结果。
具体地,该分析方法可以参考上述内容中的相关描述,在此不再赘述。
本公开实施例的另一方面还提供了一种用于第一机构服务器的分析装置。
图6示意性示出了根据本公开实施例的用于第一机构服务器的分析装置的框图。
如图6所示,该分析装置600可以包括第一获取模块610、时序特征模块620、模型分析模块630和第一发送模块640。
第一获取模块610用于响应于接收到对目标对象的分析指令,确定分析时间段,分析时间段与目标对象的预定时序数据的时间戳相关。
时序特征模块620用于确定目标对象的与分析时间段对应的第一时序特征集合。
模型分析模块630用于至少将第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果。
第一发送模块640用于将第一中间结果发送至联合平台设备,以使联合平台设备基于第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,第二机构为与第一机构联合分析的机构。
本公开的实施例中用于第一机构服务器的分析装置部分与本公开的实施例中由第一机构服务器执行的分析方法部分是相对应的,用于第一机构服务器的分析装置部分的描述具体参考由第一机构服务器执行的分析方法部分,在此不再赘述。
本公开实施例的另一方面还提供了一种用于第一机构服务器的模型构建装置。该模型构建装置可以包括对象确定模块、样本特征模块和模型更新模块。
对象确定模块用于确定第一机构与参与联合建模的第二机构共同拥有的多个训练对象。
样本特征模块用于针对多个训练对象中的每个训练对象执行以下操作:获得与训练对象对应的训练时间段,训练时间段与训练对象的预定时序数据的时间戳相关;确定与分析时间段对应的第一时序样本特征集合。
模型更新模块用于对第一初始子模型进行多次更新,得到第一分析子模型,在每次更新过程中:至少将多个训练对象的第一时序样本特征集合输入第一初始子模型,得到第一中间数据;将第一中间数据发送至联合平台设备,以使联合平台设备基于第一中间数据和第二机构服务器发送的第二中间数据得到总结果数据;接收总结果数据,并基于总结果数据对第一初始子模型的参数进行更新。
本公开的实施例中用于第一机构服务器的模型构建装置部分与本公开的实施例中由第一机构服务器执行的模型构建方法部分是相对应的,用于第一机构服务器的模型构建装置部分的描述具体参考由第一机构服务器执行的模型构建方法部分,在此不再赘述。
本公开实施例的另一方面还提供了一种用于联合平台设备的分析装置。该分析装置可以包括请求接收模块、时间获取模块、时间确定模块、结果接收模块和结果分析模块。
请求接收模块用于接收请求发起机构发送的对目标对象的分析请求,请求发起机构为第一机构服务器或者第二机构服务器。
时间获取模块用于基于分析请求,从第一机构服务器或者第二机构服务器获取目标对象的预定时序数据的时间戳。
时间确定模块用于基于预定时序数据的时间戳,确定分析时间段,并将分析时间段发送至第一机构服务器和第二机构服务器。
结果接收模块用于接收来自第一机构服务器的第一中间结果和来自第二机构服务器的第二中间结果。
结果分析模块用于基于第一中间结果和第二中间结果,得到分析结果。
本公开的实施例中用于联合平台设备的分析装置部分与本公开的实施例中由联合平台设备执行的分析方法部分是相对应的,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
本公开实施例的另一方面还提供了一种联合分析系统,该联合分析系统包括第一机构服务器、第二机构服务器和联合平台设备。其中,第一机构服务器、第二机构服务器、和联合平台设备可以用于执行上述实施例中的模型构建方法和分析方法。各个设备执行的操作可以参见上述关于相应内容的描述,在此不再赘述。
本公开实施例的另一方面还提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述的模型构建方法和/或分析方法。
图7示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,根据本公开实施例的电子设备700包括处理器701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。处理器701例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器701还可以包括用于缓存用途的板载存储器。处理器701可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 703中,存储有系统700操作所需的各种程序和数据。处理器701、ROM 702以及RAM 703通过总线704彼此相连。处理器701通过执行ROM 702和/或RAM 703中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 702和RAM 703以外的一个或多个存储器中。处理器701也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统700还可以包括输入/输出(I/O)接口705,输入/输出(I/O)接口705也连接至总线704。系统700还可以包括连接至I/O接口705的以下部件中的一项或多项:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被处理器701执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 702和/或RAM 703和/或ROM 702和RAM 703以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (24)

1.一种分析方法,由第一机构服务器执行,包括:
响应于接收到对目标对象的分析指令,确定分析时间段,所述分析时间段与所述目标对象的预定时序数据的时间戳相关;
确定所述目标对象的与所述分析时间段对应的第一时序特征集合;
至少将所述第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果;以及
将所述第一中间结果发送至联合平台设备,以使所述联合平台设备基于所述第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,所述第二机构服务器为与所述第一机构服务器联合分析的机构;其中,所述第二中间结果通过所述第二机构服务器基于所述分析时间段确定第二时序特征集合,并至少将所述第二时序特征集合输入预先建立的第二分析子模型得到。
2.根据权利要求1所述的方法,其中:
所述方法还包括:
获取所述目标对象的第一非时序数据;以及
对所述第一非时序数据进行特征提取处理,得到第一非时序特征集合;
所述至少将所述第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果包括:
将所述第一时序特征集合和所述第一非时序特征集合输入预先建立的第一分析子模型,得到第一中间结果。
3.根据权利要求1或2所述的方法,其中,所述确定所述目标对象的与所述分析时间段对应的第一时序特征集合包括:
获取所述目标对象位于所述分析时间段内的第一时序数据;
对所述第一时序数据进行特征提取处理,得到第一初始时序特征集合;
对所述第一初始时序特征集合进行表示学习处理,得到所述第一时序特征集合。
4.根据权利要求3所述的方法,其中,所述对所述第一初始时序特征集合进行表示学习处理,得到所述第一时序特征集合包括:
对所述第一初始时序特征集合进行表示学习处理,得到所述第一初始时序特征集合中每个第一初始时序特征的表示向量;以及
基于所述每个第一初始时序特征的表示向量,得到所述第一时序特征集合。
5.根据权利要求1或2所述的方法,其中,所述确定分析时间段包括:
从所述联合平台设备获得所述分析时间段,其中,所述分析时间段由所述联合平台设备基于所述第一机构服务器或者所述第二机构服务器提供的预定时序数据的时间戳确定;或者
从所述第二机构服务器获得所述预定时序数据的时间戳,并基于所述时间戳确定所述分析时间段。
6.根据权利要求5所述的方法,其中:
所述分析时间段以所述预定时序数据的时间戳作为终止时间;
所述分析时间段的起始时间与所述终止时间间隔预定时长。
7.根据权利要求1所述的方法,其中,所述第一分析子模型预先通过以下方式建立:
确定所述第一机构服务器与所述第二机构服务器共同拥有的多个训练对象;
针对所述多个训练对象中的每个训练对象执行以下操作:
获得与所述训练对象对应的训练时间段,所述训练时间段与所述训练对象的预定时序数据的时间戳相关;
确定与所述训练时间段对应的第一时序样本特征集合;
对第一初始子模型进行多次更新,得到所述第一分析子模型,在每次更新过程中:
至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据;
将所述第一中间数据发送至所述联合平台设备,以使所述联合平台设备基于所述第一中间数据和所述第二机构服务器发送的第二中间数据得到总结果数据;
接收所述总结果数据,并基于所述总结果数据对所述第一初始子模型的参数进行更新。
8.根据权利要求2所述的方法,其中:
所述分析方法用于识别被诈骗用户;
所述第一机构服务器用于提供金融服务,所述第二机构服务器用于提供网络社交服务,所述第一时序特征集合和所述第一非时序特征集合包括与金融相关的特征;或者
所述第一机构服务器用于提供网络社交服务,所述第二机构服务器用于提供金融服务,所述第一时序特征集合和所述第一非时序特征集合包括与网络社交相关的特征。
9.一种模型构建方法,用于第一机构服务器,包括:
确定所述第一机构服务器与参与联合建模的第二机构服务器共同拥有的多个训练对象;
针对所述多个训练对象中的每个训练对象执行以下操作:
获得与所述训练对象对应的训练时间段,所述训练时间段与所述训练对象的预定时序数据的时间戳相关;
确定与所述训练时间段对应的第一时序样本特征集合;
对第一初始子模型进行多次更新,得到第一分析子模型,在每次更新过程中:
至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据;
将所述第一中间数据发送至联合平台设备,以使所述联合平台设备基于所述第一中间数据和所述第二机构服务器发送的第二中间数据得到总结果数据;其中,所述第二中间数据通过至少将各个训练对象的第二时序样本特征集合输入所述第二机构服务器的第二初始子模型计算得到;
接收所述总结果数据,并基于所述总结果数据对所述第一初始子模型的参数进行更新。
10.根据权利要求9所述的方法,其中:
所述针对所述多个训练对象中的每个训练对象执行的操作还包括:
从本地存储数据中,获取所述训练对象的第一非时序样本数据;
对所述第一非时序样本数据进行特征提取处理,得到第一非时序样本特征集合;
至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据包括:
将所述多个训练对象的第一时序样本特征集合和第一非时序样本特征集合输入所述第一初始子模型,得到第一中间数据。
11.根据权利要求9所述的方法,其中,所述确定与所述训练时间段对应的第一时序样本特征集合包括:
从本地存储数据中,获取所述训练对象位于所述训练时间段内的第一时序样本数据;
对所述第一时序样本数据进行特征提取处理,得到第一初始时序样本特征集合;
对所述第一初始时序样本特征集合进行表示学习处理,得到所述第一时序样本特征集合。
12.根据权利要求11所述的方法,其中,所述对所述第一初始时序样本特征集合进行表示学习处理,得到所述第一时序样本特征集合包括:
对所述第一初始时序样本特征集合进行表示学习处理,得到所述第一初始时序样本特征集合中每个第一初始时序样本特征的表示向量;以及
基于所述每个第一初始时序样本特征的表示向量,得到所述第一时序样本特征集合。
13.根据权利要求9所述的方法,其中,所述确定所述第一机构服务器与所述第二机构服务器共同拥有的多个训练对象包括:
从本地数据中,获得第一机构服务器拥有的第一对象集合的主键信息;
将所述第一对象集合的主键信息发送至所述联合平台设备,以使所述联合平台设备基于所述第一对象集合的主键信息与第二机构服务器发送的第二对象集合的主键信息确定所述共同拥有的多个训练对象;
接收来自所述联合平台设备的所述共同拥有的多个训练对象。
14.根据权利要求9所述的方法,其中,所述获得与所述训练对象对应的训练时间段包括:
从所述联合平台设备获得所述训练时间段,其中,所述训练时间段由所述联合平台设备基于所述第一机构服务器或者所述第二机构服务器提供的预定时序数据的时间戳确定;或者
从所述第二机构服务器获得所述预定时序数据的时间戳,并基于所述时间戳确定所述训练时间段。
15.根据权利要求14所述的方法,其中:
所述训练时间段以所述预定时序数据的时间戳作为终止时间;
所述训练时间段的起始时间与所述终止时间间隔预定时长。
16.一种分析方法,由联合平台设备执行,包括:
接收请求发起机构发送的对目标对象的分析请求,所述请求发起机构为第一机构服务器或者第二机构服务器;
基于所述分析请求,从所述第一机构服务器或者所述第二机构服务器获取所述目标对象的预定时序数据的时间戳;
基于所述预定时序数据的时间戳,确定分析时间段,并将所述分析时间段发送至所述第一机构服务器和所述第二机构服务器;
接收来自所述第一机构服务器的第一中间结果和来自所述第二机构服务器的第二中间结果;
基于所述第一中间结果和所述第二中间结果,得到分析结果。
17.一种模型构建方法,由联合平台设备执行,包括:
接收来自第一机构服务器的第一对象集合的主键信息以及来自第二机构服务器的第二对象集合的主键信息;
基于所述第一对象集合的主键信息和所述第二对象集合的主键信息,确定所述第一机构服务器与所述第二机构服务器共同拥有的多个训练对象;
从所述第一机构服务器或者所述第二机构服务器获取每个训练对象的预定时序数据的时间戳;
基于所述每个训练对象的预定时序数据的时间戳,确定每个训练对象对应的训练时间段,并将所述训练时间段发送至所述第一机构服务器和所述第二机构服务器;
基于来自所述第一机构服务器的第一中间数据和来自所述第二机构服务器的第二中间数据,得到总结果数据,并将所述总结果数据发送至所述第一机构服务器和所述第二机构服务器。
18.一种分析方法,包括:
联合平台设备响应于接收来自第一机构服务器或者第二机构服务器的对目标对象的分析请求,向所述第一机构服务器和所述第二机构服务器发送分析指令;
所述第一机构服务器和/或所述第二机构服务器将所述目标对象的预定时序数据的时间戳发送至所述联合平台设备;
所述联合平台设备基于所述时间戳确定分析时间段,并将所述分析时间段发送至所述第一机构服务器和所述第二机构服务器;
所述第一机构服务器基于所述分析时间段确定第一时序特征集合,并至少将所述第一时序特征集合输入第一分析子模型,得到第一中间结果;
所述第二机构服务器基于所述分析时间段确定第二时序特征集合,并至少将所述第二时序特征集合输入第二分析子模型,得到第二中间结果;
所述联合平台设备基于所述第一中间结果和所述第二中间结果得到分析结果。
19.一种分析装置,用于第一机构服务器,包括:
第一获取模块,用于响应于接收到对目标对象的分析指令,确定分析时间段,所述分析时间段与所述目标对象的预定时序数据的时间戳相关;
时序特征模块,用于确定所述目标对象的与所述分析时间段对应的第一时序特征集合;
模型分析模块,用于至少将所述第一时序特征集合输入预先建立的第一分析子模型,得到第一中间结果;以及
第一发送模块,用于将所述第一中间结果发送至联合平台设备,以使所述联合平台设备基于所述第一中间结果和来自第二机构服务器的第二中间结果得到分析结果,所述第二机构服务器为与所述第一机构服务器联合分析的机构;其中,所述第二中间结果通过所述第二机构服务器基于所述分析时间段确定第二时序特征集合,并至少将所述第二时序特征集合输入预先建立的第二分析子模型得到。
20.一种模型构建装置,用于第一机构服务器,包括:
对象确定模块,用于确定所述第一机构服务器与参与联合建模的第二机构服务器共同拥有的多个训练对象;
样本特征模块,用于针对所述多个训练对象中的每个训练对象执行以下操作:获得与所述训练对象对应的训练时间段,所述训练时间段与所述训练对象的预定时序数据的时间戳相关;确定与所述训练时间段对应的第一时序样本特征集合;
模型更新模块,用于对第一初始子模型进行多次更新,得到第一分析子模型,在每次更新过程中:至少将所述多个训练对象的第一时序样本特征集合输入所述第一初始子模型,得到第一中间数据;将所述第一中间数据发送至联合平台设备,以使所述联合平台设备基于所述第一中间数据和所述第二机构服务器发送的第二中间数据得到总结果数据;其中,所述第二中间数据通过至少将各个训练对象的第二时序样本特征集合输入所述第二机构服务器的第二初始子模型计算得到;接收所述总结果数据,并基于所述总结果数据对所述第一初始子模型的参数进行更新。
21.一种分析装置,用于联合平台设备,包括:
请求接收模块,用于接收请求发起机构发送的对目标对象的分析请求,所述请求发起机构为第一机构服务器或者第二机构服务器;
时间获取模块,用于基于所述分析请求,从所述第一机构服务器或者所述第二机构服务器获取所述目标对象的预定时序数据的时间戳;
时间确定模块,用于基于所述预定时序数据的时间戳,确定分析时间段,并将所述分析时间段发送至所述第一机构服务器和所述第二机构服务器;
结果接收模块,用于接收来自所述第一机构服务器的第一中间结果和来自所述第二机构服务器的第二中间结果;
结果分析模块,用于基于所述第一中间结果和所述第二中间结果,得到分析结果。
22.一种联合分析系统,包括:
第一机构服务器;
第二机构服务器;以及
联合平台设备;
其中,所述第一机构服务器和所述第二机构服务器用于执行权利要求1至8中任一项所述的方法。
23.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至18中任一项所述的方法。
24.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至18中任一项所述的方法。
CN202010719813.1A 2020-07-23 2020-07-23 模型构建和分析的方法、装置、电子设备和介质 Active CN111860865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010719813.1A CN111860865B (zh) 2020-07-23 2020-07-23 模型构建和分析的方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010719813.1A CN111860865B (zh) 2020-07-23 2020-07-23 模型构建和分析的方法、装置、电子设备和介质

Publications (2)

Publication Number Publication Date
CN111860865A CN111860865A (zh) 2020-10-30
CN111860865B true CN111860865B (zh) 2022-07-19

Family

ID=72950906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010719813.1A Active CN111860865B (zh) 2020-07-23 2020-07-23 模型构建和分析的方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN111860865B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434818B (zh) * 2020-11-19 2023-09-26 脸萌有限公司 模型构建方法、装置、介质及电子设备
CN112434064B (zh) * 2020-11-19 2023-09-29 脸萌有限公司 数据处理方法、装置、介质及电子设备
CN112418520B (zh) * 2020-11-22 2022-09-20 同济大学 一种基于联邦学习的信用卡交易风险预测方法
CN112579864B (zh) * 2020-12-25 2022-09-16 北京明朝万达科技股份有限公司 反诈骗处理方法和装置
CN114219545B (zh) * 2022-02-17 2022-07-05 北京京东振世信息技术有限公司 一种数据处理的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103171B (zh) * 2016-02-19 2020-09-25 阿里巴巴集团控股有限公司 机器学习模型的建模方法及装置
CN109740790A (zh) * 2018-11-28 2019-05-10 国网天津市电力公司 一种基于时序特征提取的用户用电量预测方法
CN110110229B (zh) * 2019-04-25 2021-06-04 深圳前海微众银行股份有限公司 一种信息推荐方法及装置
CN110415119B (zh) * 2019-07-30 2022-03-25 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备

Also Published As

Publication number Publication date
CN111860865A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111860865B (zh) 模型构建和分析的方法、装置、电子设备和介质
US20180365688A1 (en) Transaction execution and validation in a blockchain
CN111401558A (zh) 数据处理模型训练方法、数据处理方法、装置、电子设备
CN112799708B (zh) 联合更新业务模型的方法及系统
CN109544335B (zh) 基于区块链的交易数据处理方法、装置、设备及存储介质
CN111681091A (zh) 基于时间域信息的金融风险预测方法、装置及存储介质
US11481499B2 (en) Blockchain security system
CN113361962A (zh) 基于区块链网络识别企业风险性的方法及装置
CN112613877B (zh) 应用于区块链网络的智能合约触发方法、装置及相关设备
CN113568973B (zh) 基于区块链和联邦学习的金融征信数据共享方法及装置
CN109377347B (zh) 基于特征选择的网络信用预警方法、系统及电子设备
CN113011646A (zh) 一种数据处理方法、设备以及可读存储介质
CN110807209A (zh) 一种数据处理方法、设备及存储介质
CN112702410B (zh) 一种基于区块链网络的评估系统、方法及相关设备
CN111861737B (zh) 基于区块链的风控模型优化方法、装置和计算机设备
CN109544165B (zh) 资源转移处理方法、装置、计算机设备和存储介质
CN116432040B (zh) 基于联邦学习的模型训练方法、装置、介质以及电子设备
EP3696766A1 (en) Program, system and method for determining credit worthiness of a user
CN117422553A (zh) 区块链网络的交易处理方法、装置、设备、介质和产品
CN110598479A (zh) 一种数据处理方法、装置以及计算机可读存储介质
CN111800546B (zh) 构建识别模型以及识别的方法、装置、系统和电子设备
CN111008251A (zh) 一种数据处理方法以及设备
CN110599334A (zh) 基于区块链的奖励对象确定方法、装置、存储介质和设备
CN115167969B (zh) 基于云端的远程协同方法及装置
CN110689420A (zh) 一种诚信账单操作系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant