CN115545709A - 配资异常交易识别方法及装置 - Google Patents

配资异常交易识别方法及装置 Download PDF

Info

Publication number
CN115545709A
CN115545709A CN202211345629.0A CN202211345629A CN115545709A CN 115545709 A CN115545709 A CN 115545709A CN 202211345629 A CN202211345629 A CN 202211345629A CN 115545709 A CN115545709 A CN 115545709A
Authority
CN
China
Prior art keywords
transaction
account
sample
characteristic
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211345629.0A
Other languages
English (en)
Inventor
谭可华
叶文广
吕慧
吴佳瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyun Rongchuang Data Science & Technology Beijing Co ltd
Original Assignee
Tianyun Rongchuang Data Science & Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyun Rongchuang Data Science & Technology Beijing Co ltd filed Critical Tianyun Rongchuang Data Science & Technology Beijing Co ltd
Priority to CN202211345629.0A priority Critical patent/CN115545709A/zh
Publication of CN115545709A publication Critical patent/CN115545709A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3829Payment protocols; Details thereof insuring higher security of transaction involving key management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请提供了一种配资异常交易识别方法,涉及人工智能技术领域。该方法包括:获取至少一个待识别券商资金账户的特征集,所述特征集包含所述待识别券商资金账户在预设时间内的所有交易特征;将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表;所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型进行横向联邦学习得到的;所述训练样本集包括:正样本和负样本;所述正样本用于表示不同账户在不同时间段内的交易特征;所述负样本用于表示同一账户在不同时间段内的交易特征。采用本方法能够精准识别交易行为是否为单账户异常交易行为。

Description

配资异常交易识别方法及装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种配资异常交易识别方法、运维安全审计系统、电子设备及可读存储介质。
背景技术
配资是证券市场的专用术语,指根据账户现有资产按照一定比例提供资金从事证券交易的行为。配资是影响股市助涨助跌的一项重要因素。场外配资以线上交易为主,投资门槛低,到账速度快,杠杆倍数高,但是场外配资的方式存在较大市场风险,监管机构难以对其潜在的资金杠杆率进行监控。在监管机构和证券公司针对场外配资行为不断加强监测的形势下,配资机构利用化整为零的方式将资本输入到二级交易市场,为配资客户提供高杠杆资金,即常见的单账户配资模式。在这种模式下,配资人员将保证金打入配资公司设立的个人账户,资金方按照一定杠杆比例打入杠杆资金,供用户进行操作。该账户由配资公司和股民共同掌握,但是该账户对应的第三方银行存管账户并不会交给股民,而是到期后结算盈亏。由于这种模式下,同一实体账户上只有一个配资者进行交易。在一段时间内,这个配资账户的交易行为与正常账户的区别不大,但这种配资模式门槛低,杠杆比例高,这样无形中加大了整个市场的潜在风险。通过传统专家的经验规则识别账户配资异常较为困难。
因此,现有技术无法精准识别交易行为是否为单账户异常交易行为。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种配资异常交易识别方法,解决了传统专家经验规则无法精准识别交易行为是否为单账户异常交易行为的问题。
为了实现上述目的,本申请实施例提供技术方案如下:
第一方面,本申请的实施例提供一种配资异常交易识别方法,所述方法包括:
获取至少一个待识别券商资金账户的特征集,所述特征集包含所述待识别券商资金账户在预设时间内的所有交易特征;
将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表;所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型进行横向联邦学习得到的;所述训练样本集包括:正样本和负样本;所述正样本用于表示不同账户在不同时间段内的交易特征;所述负样本用于表示同一账户在不同时间段内的交易特征。
作为本申请实施例一种可选的实施方式,所述获取至少一个待识别券商资金账户的特征集,包括:
获取至少一个待识别券商资金账户的原始交易数据;
对至少一组原始交易数据进行特征变换,得到至少一个待识别券商资金账户的特征集。
作为本申请实施例一种可选的实施方式,所述获取至少一个待识别券商资金账户的原始交易数据,包括:
基于客户信息表、客户-资金账户对应表、客户-股东账号对应表、终端信息表、股东账户属性表、资金账户余额表、持有表、银证转账明细表、委托明细表、以及成交明细表,获取至少一个待识别券商资金账户的原始交易数据。
作为本申请实施例一种可选的实施方式,所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型进行横向联邦学习得到的,包括:
获取训练样本集;所述训练样本集包括至少一个券商资金账户的特征集;
将所述训练样本集输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型;
对所述初始推理服务预测模型进行横向联邦学习,获取目标推理服务预测模型;所述目标推理服务预测模型用于预测所述待识别券商资金账户的交易行为是否为同一用户。
作为本申请实施例一种可选的实施方式,所述将所述训练样本输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型,包括:
获取第一样本特征、第二样本特征、第三样本特征以及第四样本特征;其中,所述第一样本特征为第一账户在第一预设时间段内的交易特征,所述第二样本特征为第一账户在第二预设时间段内的交易特征,所述第三样本特征为第二账户在第一预设时间段内的交易特征;所述第四样本特征为第三账户在第二预设时间段内的交易特征;
根据所述第一样本特征和所述第二样本特征获取负样本,根据所述第三样本特征和所述第四样本特征获取正样本;
将所述正样本和所述负样本输入孪生神经网络模型,计算相似度,根据所述相似度调整所述孪生神经网络模型的权重参数,得到初始推理服务预测模型。
作为本申请实施例一种可选的实施方式,所述方法还包括:
各券商参与方将所述孪生神经网络模型与所述初始推理服务预测模型相比,获取各自对应的模型更新梯度,并将所述模型更新梯度发送给SaaS服务端;
所述SaaS服务端根据预设加密算法对各个模型更新梯度进行聚合,得到聚合结果;
根据所述聚合结果更新所述孪生神经网络模型。
作为本申请实施例一种可选的实施方式,所述方法还包括:
根据所述配资异常交易账户列表,获取至少一个待识别券商资金账户的交易情况。
第二方面,本申请实施例提供一种配资异常交易识别装置,包括:
特征集获取模块,用于获取至少一个待识别券商资金账户的特征集,所述特征集包含所述待识别券商资金账户在预设时间内的所有交易特征;
异常账户输出模块,用于将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表;所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型训练得到的;所述训练样本集包括:正样本和负样本;所述正样本用于表示不同账户在不同时间段内的交易特征;所述负样本用于表示同一账户在不同时间段内的交易特征。
作为本申请实施例一种可选的实施方式,所述特征集获取模块包括:
原始数据获取单元,用于获取至少一个待识别券商资金账户的原始交易数据;
特征变换单元,用于对至少一组原始交易数据进行特征变换,得到至少一个待识别券商资金账户的特征集。
作为本申请实施例一种可选的实施方式,所述原始数据获取单元用于:
基于客户信息表、客户-资金账户对应表、客户-股东账号对应表、终端信息表、股东账户属性表、资金账户余额表、持有表、银证转账明细表、委托明细表、以及成交明细表,获取至少一个待识别券商资金账户的原始交易数据。
作为本申请实施例一种可选的实施方式,所述装置还包括目标模型训练模块,所述目标模型训练模块包括:
样本获取单元,用于获取训练样本集;所述训练样本集包括至少一个券商资金账户的特征集;
初始模型获取单元,用于将所述训练样本集输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型;
目标模型获取单元,用于对所述初始推理服务预测模型进行横向联邦学习,获取目标推理服务预测模型;所述目标推理服务预测模型用于预测所述待识别券商资金账户的交易行为是否为同一用户。
作为本申请实施例一种可选的实施方式,所述初始模型获取单元,具体用于:
获取第一样本特征、第二样本特征、第三样本特征以及第四样本特征;其中,所述第一样本特征为第一账户在第一预设时间段内的交易特征,所述第二样本特征为第一账户在第二预设时间段内的交易特征,所述第三样本特征为第二账户在第一预设时间段内的交易特征;所述第四样本特征为第三账户在第二预设时间段内的交易特征;
根据所述第一样本特征和所述第二样本特征获取负样本,根据所述第三样本特征和所述第四样本特征获取正样本;
将所述正样本和所述负样本输入孪生神经网络模型,计算相似度,根据所述相似度调整所述孪生神经网络模型的权重参数,得到初始推理服务预测模型。
作为本申请实施例一种可选的实施方式,所述初始模型获取单元,,还用于:
各券商参与方将所述孪生神经网络模型与所述初始推理服务预测模型相比,获取各自对应的模型更新梯度,并将所述模型更新梯度发送给SaaS服务端;
所述SaaS服务端根据预设加密算法对各个模型更新梯度进行聚合,得到聚合结果;
根据所述聚合结果更新所述孪生神经网络模型。
作为本申请实施例一种可选的实施方式,所述装置还包括:
监测模块,用于根据所述配资异常交易账户列表,获取至少一个待识别券商资金账户的交易情况。
第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面或第一方面的任一实施方式所述的配资异常交易识别方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面或第一方面的任一实施方式所述的配资异常交易识别方法。
本申请提供的配资异常交易识别方法,首先获取至少一个待识别券商资金账户的特征集,然后将包含待识别券商资金账户在预设时间内的所有交易特征的特征集上传给SaaS服务端,以使SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表。由于目标推理服务预测模型是基于正样本和负样本对初始推理服务预测模型进行横向联邦学习得到的,正样本表示不同账户在不同时间段内的交易特征,负样本表示同一账户在不同时间段内的交易特征,所以将包含待识别券商资金账户在预设时间内的所有交易特征的特征集输入目标推理服务预测模型中,可以输出待识别券商资金账户的配资异常交易账户列表,根据配资异常交易账户列表能够精准识别交易行为是否为单账户异常交易行为,从而提升全行业风控合规能力。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中配资异常交易识别方法的应用场景示意图;
图2为一个实施例中配资异常交易识别方法的流程示意图;
图3为另一个实施例中配资异常交易识别方法的流程示意图;
图4为一个实施例中正负样本的生成方式的结构示意图;
图5为一个实施例中同态加密算法的原理示意图;
图6为一个实施例中配资异常交易识别装置的结构示意图;
图7为本申请实施例所述的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面将对本申请的方案进行进一步描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本申请还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本申请的一部分实施例,而不是全部的实施例。
本申请的说明书和权利要求书中的术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
在本申请实施例中,“示例性的”或者“例如”等词是用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。此外,在本申请实施例的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
本申请提供的配资异常交易识别方法,可以应用于如图1所示的应用环境中。为了提升整个行业的风险合规能力,配合监管机构进行风控合规能力的输出,将通过行业云服务模式进行设计,其中,云服务模式,可以理解为获取多家券商的数据信息,例如交易的股票数量,每支股票的单价,交易总金额等数据信息。将其转化为SaaS服务,为其他多家券商参与方提供监测服务,该配资异常交易识别方法应用于行业云SaaS服务技术架构系统中,以图1为例,该系统可以包括:SaaS服务端11、多个券商端(本实施例中以3个券商端为例示出,分别为券商端12、券商端13、券商端14),每个券商端可以部署特征工程平台、数据上传平台、监测服务平台。其中,特征工程平台用于对券商的原始交易数据进行特征转换,去除客户的交易敏感信息,同时可以作为初始推理服务预测模型的输入。数据上传平台用于将特征转换后的数据上传到SaaS服务端。监测服务平台用于接收SaaS服务端返回给各券商的配资异常交易账户列表,为各个券商提供监测服务。
在一个实施例中,如图2所示,提供一种配资异常交易识别方法,该配资异常交易识别方法包括如下步骤S21-S22:
S21、获取至少一个待识别券商资金账户的特征集。
其中,所述特征集包含所述待识别券商资金账户在预设时间内的所有交易特征。
S22、将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表。
其中,SaaS(Software as a Service,软件即服务),即通过网络提供软件服务。软件部署在云端,让用户通过因特网来使用它,即云服务提供商把系统的应用软件层作为服务租出去,消费者可以使用任何云终端设备接入计算机网络,然后通过网页浏览器或者编程接口使用云端的软件。降低租户的技术门槛,应用软件无需安装,可以直接使用软件。
在一些实施例中,上述S11(获取至少一个待识别券商资金账户的特征集)可以通过步骤A-B实现:
A、获取至少一个待识别券商资金账户的原始交易数据。
可选的,获取至少一个待识别券商资金账户的原始交易数据,可以通过如下方式实现:
基于客户信息表、客户-资金账户对应表、客户-股东账号对应表、终端信息表、股东账户属性表、资金账户余额表、持有表、银证转账明细表、委托明细表、以及成交明细表,获取至少一个待识别券商资金账户的原始交易数据。
其中,客户信息表中包括但不限于:账户号码、机构编号、客户号、客户属性、身份证前六位、出生日期、职业、教育背景等。
客户-资金账户对应表包括但不限于:客户号、营业部编号、资金账户号、是否主账户、第三方存管账号、类别、开户日期、销户日期等。
客户-股东账号对应表包括但不限于:客户号、股东帐号、开始日期、结束日期等。
终端信息表包括但不限于:客户号、合同序号、柜台系统、日期、时间、互联网协议IP地址、局域网Mac地址、硬盘序列号、国际移动设备标识IMEI、行为描述等。
股东账户属性表包括但不限于:客户号、股东账号、注销日期、开户代理机构代码、开户代理机构忘带你所在地区、开户代理机构网点代码、委托交易券数量、首次交易日、开立日期、是否开通创业板、是否开通信用账户等。
资金账户余额表包括但不限于:资金账户号、余额、市值、日期等。
持有表包括但不限于:资金账户号、股东账户号、股票代码、持有数量、日期。
银证转账明细表包括但不限于:资金账户号、客户号、成交日期、成交时间、IP地址、Mac地址、硬盘序列号、IMEI、转账方向、转账金额、银行名称等。
委托明细表包括但不限于:客户号、委托日期、委托时间、柜台系统、证券类别、交易类别、证券代码、委托数量、委托价格、委托金额、价格类型、委托方向、股东账户号、资金账户号、合同序号、委托渠道、成交状态、撤单标识等。
成交明细表包括但不限于:客户号、资金账户号、股东账户号、合同序号、柜台系统、证券类别、成交日期、成交时间、成交方向、证券代码、成交价格、成交量、成交额等。
根据上述表的信息,可以获取至少一个待识别券商资金账户的原始交易数据。
B、对至少一组原始交易数据进行特征变换,得到至少一个待识别券商资金账户的特征集。
其中,特征变换是指对原始的某个特征通过一定规则或映射得到新特征的方法。
具体的,原始交易数据经过特征变换可以得到一组新的特征,这组新的特征尽可能多的保留原始特征的信息。例如,在本实施例中,经过特征变换后,可以获取账户转账起止时间段信息、该段时间内以账户为核心聚合的反映账户交易行为的相关成交金额、交易笔数、股票支数、转入金额、转出金额等原始交易数据。另外,通过特征变换去除了客户的交易敏感信息,同时也方便作为后续人工智能建模深度学习的特征输入维度。
应该用本申请实施例,本申请提供的配资异常交易识别方法,首先获取至少一个待识别券商资金账户的特征集,然后将包含待识别券商资金账户在预设时间内的所有交易特征的特征集上传给SaaS服务端,以使SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表。由于目标推理服务预测模型是基于正样本和负样本对初始推理服务预测模型进行横向联邦学习得到的,正样本表示不同账户在不同时间段内的交易特征,负样本表示同一账户在不同时间段内的交易特征,所以将包含待识别券商资金账户在预设时间内的所有交易特征的特征集输入目标推理服务预测模型中,可以输出待识别券商资金账户的配资异常交易账户列表,根据配资异常交易账户列表能够精准识别交易行为是否为单账户异常交易行为,从而提升全行业风控合规能力。
作为本申请实施例一种可选的实施方式,参照图3所示,所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型进行横向联邦学习得到的)实现方式还可以包括如下步骤:
S31、获取训练样本集。
其中,所述训练样本集包括至少一个券商资金账户的特征集。
示例性的,一个券商参与方可以包括多个资金账户。
S32、将所述训练样本集输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型。
可选的,将所述训练样本输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型,包括但不限于以下实现方式:
a、获取第一样本特征、第二样本特征、第三样本特征以及第四样本特征。
其中,所述第一样本特征为第一账户在第一预设时间段内的交易特征,所述第二样本特征为第一账户在第二预设时间段内的交易特征,所述第三样本特征为第二账户在第一预设时间段内的交易特征;所述第四样本特征为第三账户在第二预设时间段内的交易特征。
b、根据所述第一样本特征和所述第二样本特征获取负样本,根据所述第三样本特征和所述第四样本特征获取正样本。
具体的,参照图4所示,正负样本的生成方式如图4所示,以出入金为切分点,切割时间段,分为第一预设时间段和第二预设时间段。其中出入金包含出金和入金。出金是指资金由交易账户划入银行账户的过程为出金。例如贵金属投资、股票投资等投资项目通过交易界面、网银、银行柜台进行出金。入金是指贵金属投资等投资产品开户之后将资金投入市场的过程。当待识别券商资金账户是配资账户时,下一个用户使用之前上一个账户要把资金转出,所以通过出入金把账户分成不同的时间段。
示例性的,假设第一样本特征可以是用户A在3月内的交易特征,第二样本特征可以是用户A在4月内的交易特征。第三样本特征可以是用户B在3月内的交易特征,第四样本特征可以是用户C在4月内的交易特征。也就是,负样本是由用户A在3月内的交易特征和用户A在4月内的交易特征组成的,正样本是由用户B在3月内的交易特征和用户C在4月内的交易特征组成的。经过特征构建,得到同一账户在不同时间段的特征,以及不同账户在不同时间段的特征,均为30*20的特征矩阵。其中,30表示每月最大交易天数,20表示交易的特征维度。例如,交易的特征维度可以包括:在某一段时间内的交易金额、交易股票支数、交易笔数、资金流入、资金流出、使用的设备数目等。
c、将所述正样本和所述负样本输入孪生神经网络模型,计算相似度,根据所述相似度调整所述孪生神经网络模型的权重参数,得到初始推理服务预测模型。
其中,孪生神经网络是基于两个人工神经网络建立的耦合架构,以两个样本为输入,即以正样本和负样本作为输入样本,其两个自网络各自接收一个输入,并分别将这两个输入映射到新的空间,形成样本输入在新空间中的表达,即得到其嵌入高维度空间的表征,随后通过计算两个表征的距离,以此比较两个样本的相似程度。
通过孪生神经网络结构,以某个券商资金账户的出入金为界限,拼接获取正样本和负样本,进行监督学习得到初始推理服务预测模型。该样本生成方法在一定程度上解决了异常交易账户样本数据不足的问题,并且在不同活跃程度的市场交易情况下,能够实现模型的自适应学习能力,从而达到提升模型效果的能力。该深度学习模型参数量达到数万级别,通过高维特征空间的表达,模型很好的学习到了在高维特征空间中异常交易账户样本的表达模式,进而能够很好的识别异常交易。
S33、对所述初始推理服务预测模型进行横向联邦学习,获取目标推理服务预测模型。
具体的,在配资模式识别过程中,多个券商公司之间通过采用联邦学习方式保障各机构数据安全。联邦学习通过构建一个隐私保护机器学习系统,使得拥有数据的多方能够联合训练一个或多个模型,并且任意一方的数据不会泄露给其他参与者。针对不同的数据集,联邦学习分为横向联邦学习和纵向联邦学习。横向联邦学习是指,在两个数据集的用户特征重叠较多,而用户数量重叠较少的情况下,把两个数据集按照横向切分,即按照用户维度切分,取出用户双方特征相同而用户不完全相同的那部分数据进行训练。纵向联邦学习在两个数据集的用户重叠较多而用户特征重叠较少的情况下,把数据集按照纵向切分,即按照特征维度切分,取出双方用户相同而用户特征不完全相同的那部分数据进行训练。
在本实施例中,由于不同的券商公司之间的业务相似,也就是特征相似,但是不同的券商公司之间的用户不同,也就是样本数据不同,因此,采用横向联邦学习对初始推理服务预测模型进行训练,获取目标推理服务预测模型。
示例性的,券商参与方1有100个客户,券商参与方2有不同于券商参与方1的另外200个客户,券商参与方1与券商参与方2在样本的特征维度上是对齐的。例如,交易的特征维度都是在某一段时间内的交易金额、交易股票支数、交易笔数、转入金额、转出金额、使用的设备数目等维度。
在一些实施例中,为了保证多个券商参与方的隐私数据不泄露,提升多个券商参与方本地模型的任务表现,可以通过如下方式实现:
各券商参与方将所述孪生神经网络模型与所述初始推理服务预测模型相比,获取各自对应的模型更新梯度,并将所述模型更新梯度发送给SaaS服务端。
所述SaaS服务端根据预设加密算法对各个模型更新梯度进行聚合,得到聚合结果。
其中,预设加密算法可以是同态加密算法、差分隐私算法、秘密共享算法等。
在本实施例中,以同态加密算法为例,计算加密梯度。参照图5所示,图5为同态加密算法的原理示意图。同态加密算法是指满足密文同态运算性质的加密算法,即数据经过同态加密之后,对密文进行特定的计算,得到的密文计算结果在进行对应的同态解密后的明文等同于对明文数据直接进行相同的计算。
根据所述聚合结果更新所述孪生神经网络模型。
示例性的,多个券商参与方将中间结果用同态加密算法进行加密,然后发送给SaaS服务端进行聚合,再将聚合结果返回给多个券商参与方,不仅保证了中间结果没有泄露,还完成了训练任务。通过这种方式,能够保证多个券商参与方的隐私数据不泄露,同时还能提升多个券商参与方本地模型的任务表现,打破数据孤岛。
在一些实施例中,在步骤S12(将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表)之后,还可以包括:
根据所述配资异常交易账户列表,获取至少一个待识别券商资金账户的交易情况。
示例性的,参照图1中的监测服务平台,多个券商参与方能够查看不同种类的疑似配资异常交易账户的识别结果,具有历史数据查询、统计、展示等功能。
在本公开实施例中,基于人工智能技术,综合使用联邦学习和深度学习,并通过SaaS云服务进行结果输出,对单账户配资异常交易展开识别监测。从技术角度,本方法采用孪生神经网络模型针对单账户配资交易行为进行建模识别,该神经网络通过衡量两个输入样本的相似程度进行异常交易的识别,在正样本不足的情况下能够根据出入金切分的方式获取样本数据,通过学习一段时间内的账户交易风格来判断是否为同一用户使用。通过监测券商资金账户的使用一致性,找出潜在的配资行为。本方法将深度学习技术应用到配资异常交易识别场景中,具备对数据的自适应性能,能够高效识别异常交易。同时,通过联邦学习技术,实现“数据不出门,可用不可见”,在保障数据安全情况下,最大化利用行业跨机构数据价值,充分发挥行业云的行业价值。从模式角度,该监测系统从点到面、横纵结合,将打破券商之间的数据壁垒和风控孤岛现状,将风控合规能力输出给全行业,既降低了高风控能力的技术门槛,又可快速有效提升全行业风控合规能力;监测系统输出到业务核查,既能向使用SaaS服务的机构和券商反馈,同时亦能向证监会驻地机构进行报备,形成反馈机制的闭环,从而不断提升全行业风控合规能力。
在一个实施例中,如图6所示,提供了一种配资异常交易识别装置600,包括:
特征集获取模块610,用于获取至少一个待识别券商资金账户的特征集,所述特征集包含所述待识别券商资金账户在预设时间内的所有交易特征;
异常账户输出模块620,用于将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表;所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型训练得到的;所述训练样本集包括:正样本和负样本;所述正样本用于表示不同账户在不同时间段内的交易特征;所述负样本用于表示同一账户在不同时间段内的交易特征。
作为本申请实施例一种可选的实施方式,所述特征集获取模块610包括:
原始数据获取单元,用于获取至少一个待识别券商资金账户的原始交易数据;
特征变换单元,用于对至少一组原始交易数据进行特征变换,得到至少一个待识别券商资金账户的特征集。
作为本申请实施例一种可选的实施方式,所述原始数据获取单元用于:
基于客户信息表、客户-资金账户对应表、客户-股东账号对应表、终端信息表、股东账户属性表、资金账户余额表、持有表、银证转账明细表、委托明细表、以及成交明细表,获取至少一个待识别券商资金账户的原始交易数据。
作为本申请实施例一种可选的实施方式,所述装置还包括目标模型训练模块,所述目标模型训练模块包括:
样本获取单元,用于获取训练样本集;所述训练样本集包括至少一个券商资金账户的特征集;
初始模型获取单元,用于将所述训练样本集输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型;
目标模型获取单元,用于对所述初始推理服务预测模型进行横向联邦学习,获取目标推理服务预测模型;所述目标推理服务预测模型用于预测所述待识别券商资金账户的交易行为是否为同一用户。
作为本申请实施例一种可选的实施方式,所述初始模型获取单元,具体用于:
获取第一样本特征、第二样本特征、第三样本特征以及第四样本特征;其中,所述第一样本特征为第一账户在第一预设时间段内的交易特征,所述第二样本特征为第一账户在第二预设时间段内的交易特征,所述第三样本特征为第二账户在第一预设时间段内的交易特征;所述第四样本特征为第三账户在第二预设时间段内的交易特征;
根据所述第一样本特征和所述第二样本特征获取负样本,根据所述第三样本特征和所述第四样本特征获取正样本;
将所述正样本和所述负样本输入孪生神经网络模型,计算相似度,根据所述相似度调整所述孪生神经网络模型的权重参数,得到初始推理服务预测模型。
作为本申请实施例一种可选的实施方式,所述初始模型获取单元,还用于:
各券商参与方将所述孪生神经网络模型与所述初始推理服务预测模型相比,获取各自对应的模型更新梯度,并将所述模型更新梯度发送给SaaS服务端;
所述SaaS服务端根据预设加密算法对各个模型更新梯度进行聚合,得到聚合结果;
根据所述聚合结果更新所述孪生神经网络模型。
作为本申请实施例一种可选的实施方式,所述装置还包括:
监测模块,用于根据所述配资异常交易账户列表,获取至少一个待识别券商资金账户的交易情况。
应用本申请实施例,本申请提供的配资异常交易识别装置,首先获取至少一个待识别券商资金账户的特征集,然后将包含待识别券商资金账户在预设时间内的所有交易特征的特征集上传给SaaS服务端,以使SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表。由于目标推理服务预测模型是基于正样本和负样本对初始推理服务预测模型进行横向联邦学习得到的,正样本表示不同账户在不同时间段内的交易特征,负样本表示同一账户在不同时间段内的交易特征,所以将包含待识别券商资金账户在预设时间内的所有交易特征的特征集输入目标推理服务预测模型中,可以输出待识别券商资金账户的配资异常交易账户列表,根据配资异常交易账户列表能够精准识别交易行为是否为单账户异常交易行为,从而提升全行业风控合规能力。
关于配资异常交易识别装置的具体限定可以参见上文中对于配资异常交易识别方法的限定,在此不再赘述。上述配资异常交易识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备的处理器中,也可以软件形式存储于电子设备的处理器中,以便于处理器调用执行以上各个模块对应的操作。
本申请实施例还提供了一种电子设备,图7为本申请实施例提供的电子设备的结构示意图。如图7所示,本实施例提供的电子设备包括:存储器71和处理器72,存储器71用于存储计算机程序;处理器72用于调用计算机程序时执行上述方法实施例提供的配资异常交易识别方法中任一实施例所执行的步骤。所述电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,所述电子设备的处理器用于提供计算和控制能力。所述电子设备的存储器包括非易失性存储介质、内存储器。所述非易失性存储介质存储有操作系统和计算机程序。所述内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。所述计算机程序被处理器执行时以实现一种配资异常交易识别方法。所述电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,所述电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的配资异常交易识别装置可以实现为一种计算机的形式,计算机程序可以在如图7所示的电子设备上运行。电子设备的存储器中可存储组成该电子设备的配资异常交易识别装置的各个程序模块,比如,图6中所示的特征集获取模块610、异常账户输出模块620。各个程序模块构成的计算机程序使得处理器执行本说明书描述的本申请各个实施例的电子设备的配资异常交易识别方法中的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例提供的配资异常交易识别方法。
本领域技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
处理器可以是中央判断单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储,信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。根据本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种配资异常交易识别方法,其特征在于,所述方法包括:
获取至少一个待识别券商资金账户的特征集,所述特征集包含所述待识别券商资金账户在预设时间内的所有交易特征;
将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表;所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型进行横向联邦学习得到的;所述训练样本集包括:正样本和负样本;所述正样本用于表示不同账户在不同时间段内的交易特征;所述负样本用于表示同一账户在不同时间段内的交易特征。
2.根据权利要求1所述的方法,其特征在于,所述获取至少一个待识别券商资金账户的特征集,包括:
获取至少一个待识别券商资金账户的原始交易数据;
对至少一组原始交易数据进行特征变换,得到至少一个待识别券商资金账户的特征集。
3.根据权利要求2所述的方法,其特征在于,所述获取至少一个待识别券商资金账户的原始交易数据,包括:
基于客户信息表、客户-资金账户对应表、客户-股东账号对应表、终端信息表、股东账户属性表、资金账户余额表、持有表、银证转账明细表、委托明细表、以及成交明细表,获取至少一个待识别券商资金账户的原始交易数据。
4.根据权利要求1所述的方法,其特征在于,所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型进行横向联邦学习得到的,包括:
获取训练样本集;所述训练样本集包括至少一个券商资金账户的特征集;
将所述训练样本集输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型;
对所述初始推理服务预测模型进行横向联邦学习,获取目标推理服务预测模型;所述目标推理服务预测模型用于预测所述待识别券商资金账户的交易行为是否为同一用户。
5.根据权利要求4所述的方法,其特征在于,所述将所述训练样本输入孪生神经网络模型进行训练学习,获取初始推理服务预测模型,包括:
获取第一样本特征、第二样本特征、第三样本特征以及第四样本特征;其中,所述第一样本特征为第一账户在第一预设时间段内的交易特征,所述第二样本特征为第一账户在第二预设时间段内的交易特征,所述第三样本特征为第二账户在第一预设时间段内的交易特征;所述第四样本特征为第三账户在第二预设时间段内的交易特征;
根据所述第一样本特征和所述第二样本特征获取负样本,根据所述第三样本特征和所述第四样本特征获取正样本;
将所述正样本和所述负样本输入孪生神经网络模型,计算相似度,根据所述相似度调整所述孪生神经网络模型的权重参数,得到初始推理服务预测模型。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
各券商参与方将所述孪生神经网络模型与所述初始推理服务预测模型相比,获取各自对应的模型更新梯度,并将所述模型更新梯度发送给SaaS服务端;
所述SaaS服务端根据预设加密算法对各个模型更新梯度进行聚合,得到聚合结果;
根据所述聚合结果更新所述孪生神经网络模型。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述配资异常交易账户列表,获取至少一个待识别券商资金账户的交易情况。
8.一种配资异常交易识别装置,其特征在于,所述装置包括:
特征集获取模块,用于获取至少一个待识别券商资金账户的特征集,所述特征集包含所述待识别券商资金账户在预设时间内的所有交易特征;
异常账户输出模块,用于将所述特征集上传给软件即服务SaaS服务端,以使所述SaaS服务端基于目标推理服务预测模型输出配资异常交易账户列表;所述目标推理服务预测模型是基于训练样本集对初始推理服务预测模型训练得到的;所述训练样本集包括:正样本和负样本;所述正样本用于表示不同账户在不同时间段内的交易特征;所述负样本用于表示同一账户在不同时间段内的交易特征。
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的配资异常交易识别方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,计算机程序被处理器执行时实现权利要求1至7中任一项所述的配资异常交易识别方法。
CN202211345629.0A 2022-10-31 2022-10-31 配资异常交易识别方法及装置 Pending CN115545709A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211345629.0A CN115545709A (zh) 2022-10-31 2022-10-31 配资异常交易识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211345629.0A CN115545709A (zh) 2022-10-31 2022-10-31 配资异常交易识别方法及装置

Publications (1)

Publication Number Publication Date
CN115545709A true CN115545709A (zh) 2022-12-30

Family

ID=84719580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211345629.0A Pending CN115545709A (zh) 2022-10-31 2022-10-31 配资异常交易识别方法及装置

Country Status (1)

Country Link
CN (1) CN115545709A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116129440A (zh) * 2023-04-13 2023-05-16 新兴际华集团财务有限公司 异常用户端告警方法、装置、电子设备和介质
CN116228431A (zh) * 2023-05-06 2023-06-06 天云融创数据科技(北京)有限公司 一种异常交易账户确定方法、装置及电子设备
CN116821838A (zh) * 2023-08-31 2023-09-29 浙江大学 一种隐私保护的异常交易检测方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116129440A (zh) * 2023-04-13 2023-05-16 新兴际华集团财务有限公司 异常用户端告警方法、装置、电子设备和介质
CN116228431A (zh) * 2023-05-06 2023-06-06 天云融创数据科技(北京)有限公司 一种异常交易账户确定方法、装置及电子设备
CN116821838A (zh) * 2023-08-31 2023-09-29 浙江大学 一种隐私保护的异常交易检测方法及装置
CN116821838B (zh) * 2023-08-31 2023-12-29 浙江大学 一种隐私保护的异常交易检测方法及装置

Similar Documents

Publication Publication Date Title
Giudici Fintech risk management: A research challenge for artificial intelligence in finance
US20210173711A1 (en) Integrated value chain risk-based profiling and optimization
Blemus et al. Initial crypto-asset offerings (ICOs), tokenization and corporate governance
CN115545709A (zh) 配资异常交易识别方法及装置
Martino Blockchain and banking: How technological innovations are shaping the banking industry
Li et al. Conditional superior predictive ability
US11393024B1 (en) System and method for semantic representation and execution of agreements on a distributed ledger
Parra-Arnau Optimized, direct sale of privacy in personal data marketplaces
CN111861716B (zh) 一种基于软件系统的贷中监控预警等级生成方法
Zhang et al. Framework for a blockchain-based infrastructure project financing system
Phelan et al. Beliefs and private monitoring
Chowdhury Financial accounting in the era of blockchain-a paradigm shift from double entry to triple entry system
CN115809837B (zh) 基于数字化模拟场景的金融企业管理方法、设备及介质
Dong et al. Cost index predictions for construction engineering based on LSTM neural networks
Baidhowi Sharia banking opportunities and challenges in the digital era
Chowdhury Is the Application of Blockchain Technology in Accounting Feasible? A Developing Nation Perspective
CN113674084B (zh) 基于区块链的动产质押融资方法及系统、设备、存储介质
Pimenta et al. Technological opportunities and recommendations for modernizing integrated financial management information systems in Latin America and the Caribbean
Kaur et al. Adoption Potential and Challenges of Artificial Intelligence in Banking
Xie Study on enterprise financial risk prevention and early warning system based on blockchain technology
Kaur et al. StudentCoin Price Prediction and Relation to Blockchain Education
Li et al. Distributed hyperledger technology in FinTech with artificial intelligence assisted internet of things platform
Manali Strategic benefits and challenges of mobile banking in Kenyan commercial banks
Monkiewicz et al. Regulatory and supervisory systems and financial innovations: challenges, impacts, prospects
CN111079992A (zh) 数据处理方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination