WO2020228530A1

WO2020228530A1 - 一种重复交易风险监测方法、装置及计算机可读存储介质

Info

Publication number: WO2020228530A1
Application number: PCT/CN2020/087550
Authority: WO
Inventors: 李晓刚; 郑建宾; 赵金涛; 刘红宝; 汤韬
Original assignee: 中国银联股份有限公司
Priority date: 2019-05-16
Filing date: 2020-04-28
Publication date: 2020-11-19
Also published as: CN110135856B; CN110135856A

Abstract

一种重复交易风险监测方法、装置及计算机可读存储介质，该方法包括：获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在指定时刻之前上送的历史交易报文（S101）；根据指定的报文内容，确定待测批量交易报文与历史交易报文之间的相似度指数（S102）；通过对相似度指数与预设相似度阈值进行比较，以判断待测批量交易报文是否存在重复交易风险（S103）。利用上述方法，能够对不同批次上送的批量交易报文中可能存在的部分重复交易的情况进行监测，进而能更为灵敏地提示重复交易风险，避免经济损失。

Description

一种重复交易风险监测方法、装置及计算机可读存储介质

技术领域

本发明属于交易处理技术领域，具体涉及一种重复交易风险监测方法、装置及计算机可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

在金融领域，“批转实”是一种处理批量业务的常见途径，通常是指将待处理的批量交易转化为实时交易进行处理的一种技术。例如，受理机构与银联系统之间采用批量文件方式传递交易报文，而银联系统和发卡机构之间采用联机报文方式传递交易报文。然而，由于服务器资源不足、网络环境卡顿或者服务端系统抖动等异常时，可能出现交易重复发送的问题，进而导致经济损失。

为了解决上述批量交易中发生的重复交易问题，现有技术中通常采用的方法为通过比较当前接收到的批量交易报文与之前接收到的批量交易报文之间的批次号，以初次收到的批次号为准，并将批次号重复的批量交易报文丢弃；然而，上述方案中仅仅以批次号为辨别标准，而未涉及交易的具体信息，如果重复交易在不同批次的文件中出现，则现有方案将无法识别。

发明内容

针对上述现有技术中难以对存在于不同批次的批量交易报文中的部分重复交易进行监测这一问题，提出了一种重复交易风险监测方法、装置、系统及计算机可读存储介质，利用这种方法、装置、系统及计算机可读存储介质，能够解决上述问题。

本发明提供了以下方案。

一种重复交易风险监测方法,包括：获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在指定时刻之前上送的历史交易报文；根据指定的报文内容，确定待测批量交易报文与历史交易报文之间的相似度指数，其中，指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；通过对相似度指数与预设相似度阈值进行比较，以判断待测批量交易报文是否存在重复交易风险。

在一些可能的实施方式中，获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在指定时刻之前上送的历史交易报文包括：在指定时刻接收由同一监测对象上送的待测批量交易报文；由预设时长与指定时刻确定第一时段，并提取同一监测对象在第一时段内上送的历史交易报文。

在一些可能的实施方式中，确定待测批量交易报文与历史交易报文之间的相似度指数包括：利用预设相似度算法确定待测批量交易报文与历史交易报文之间的相似度向量；利用预设评分规则，将相似度向量转化为相似度指数。

在一些可能的实施方式中，利用预设相似度算法确定待测批量交易报文与历史交易报文之间的相似度向量包括：基于待测批量交易报文与历史交易报文构建稀疏矩阵，稀疏矩阵中，每一个非零元素的取值由交易金额确定，每一个元素的行标签与列标签分别由批次号与交易账号确定；确定稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，并由m个相似度参数确定相似度向量；其中，待测批量交易报文包括：对应于第一批次号的多笔交易报文，稀疏矩阵中对应于第一批次号的行向量/或列向量作为第一稀疏向量；历史交易报文包括：分别对应于m个第二批次号的多笔交易报文，稀疏矩阵中分别对应于m个第二批次号的行向量/或列向量作为m个第二稀疏向量，m为正整数。

在一些可能的实施方式中，还包括：由#{(b _i-a)≠0}与#{(b _i+a)≠0}的比值和/或差值确定稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，其中，i＝1,2,…,m；其中，b _i表示m个第二稀疏向量中的第i个第二稀疏向量，a表示第一稀疏向量，#{(b _i-a)≠0}表示第一稀疏向量与第i个第二稀疏向量的差向量中非零元素的个数，#{(b+a)≠0}表示第一稀疏向量与第i个第二稀疏向量的和向量中非零元素的个数。

具体地：由下列公式确定稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数：

在一些可能的实施方式中，预设评分规则包括：确定m个相似度参数中的最大相似度参数作为相似度指数。

在一些可能的实施方式中，预设评分规则还包括：判断m个相似度参数中的最大相似度参数是否达到预设临界值；若最大相似度参数达到预设临界值，则确定预设临界值为相似度指数；若最大相似度参数未达到预设临界值，则基于m个预设权值参数分别对m个相似度参数进行加权处理，以得到m个加权相似度参数，并确定m个加权相似度参数中的最大加权相似度参数作为相似度指数。

在一些可能的实施方式中，指定报文内容还包括批次上送时间，方法还包括：针对m个相似度参数中的每一个相似度参数，由所对应的两个批次上送时间的差值而确定对应的预设权值参数。

在一些可能的实施方式中，还包括：由以下公式确定m个预设权值参数，并分别对m个相似度参数进行加权处理，以得到m个加权相似度参数：

其中，t _a为待测批量交易报文的批次上送时间；S _i为m个相似度参数中的第i相似度参数；t _i为对应于第i相似度参数的第i批次历史数据的批次上送时间；ω _i为m个预设权值参数中对应于第i相似度参数的第i预设权值参数；X _i为m个加权相似度参数中对应于第i相似度参数的第i加权相似度参数；T为包含t _a以及每一个t _i在内的第一时段的时长。

在一些可能的实施方式中，还包括：由同一监测对象的预设信用信息和/或预设属性信息确定m个预设权值参数。

在一些可能的实施方式中，还包括：提取同一监测对象在指定时刻之前上送的历史交易数据，并根据历史交易数据确定相似度阈值，其中，历史交易数据上送于历史交易报文之前。

在一些可能的实施方式中，历史交易数据包括：分别对应于n个第三批次号的多笔交易数据，且n个第三批次号中的每一个第三批次号均对应设有重复交易风险标签，n为大于1的正整数；以及，方法还包括：依次将对应于n个第三批次号中每一个第三批次号的多笔交易数据作为待测批次数据，并将历史交易数据中除待测批次数据之外的交易数据作为剩余批次数据；根据指定的报文内容，确定待测批次数据与剩余批次数据之间的参考相似度指数，从而获得对应于每一个第三批次号的参考相似度指数；根据对应于每一个第三批次号的参考相似度指数与重复交易风险标签建立ROC曲线，从而根据ROC曲线确定相似度阈值。

在一些可能的实施方式中，在建立ROC曲线之前，方法还包括：去除取值为0或1的参考相似度指数以及所对应的重复交易风险标签。

在一些可能的实施方式中，历史交易数据与历史交易报文的上送时间具有周期性对应关系。

在一些可能的实施方式中，还包括：在确定待测批量交易报文与历史交易报文之间的相似度指数之前，比较待测批量交易报文与历史交易报文的批次号；若存在与待测批量交易报文相比具有同一批次号的一个或多个历史交易报文，则直接判定待测批量交易报文存在重复交易风险；若不存在与待测批量交易报文相比具有同一批次号的历史交易报文，则进一步执行确定待测批量交易报文与历史交易报文之间的相似度指数。

在一些可能的实施方式中，还包括：若待测批量交易报文被判断存在重复交易风险，则向同一监测对象发送预警信息；接收同一监测对象发来的确认信息，并根据确认信息重复判断待测批量交易报文是否存在重复交易风险。

一种重复交易风险监测装置,包括：获取模块，用于获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在指定时刻之前上送的历史交易报文；相似度模块，用于根据指定的报文内容，确定待测批量交易报文与历史交易报文之间的相似度指数，其中，指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；判断模块，用于通过对相似度指数与预设相似度阈值进行比较，以判断待测批量交易报文是否存在重复交易风险。

在一些可能的实施方式中，获取模块包括：接收模块，用于在指定时刻接收由同一监测对象上送的待测批量交易报文；提取模块，用于由预设时长与指定时刻确定第一时段，并提取同一监测对象在第一时段内上送的历史交易报文。

在一些可能的实施方式中，相似度模块包括：相似度测算模块，用于利用预设相似度算法确定待测批量交易报文与历史交易报文之间的相似度向量；相似度评分模块，用于利用预设评分规则，将相似度向量转化为相似度指数。

在一些可能的实施方式中，相似度测算模块用于：基于待测批量交易报文与历史交易报文构建稀疏矩阵，稀疏矩阵中，每一个非零元素的取值由交易金额确定，每一个元素的行标签与列标签分别由批次号与交易账号确定；确定稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，并由m个相似度参数确定相似度向量；其中，待测批量交易报文包括：对应于第一批次号的多笔交易报文，稀疏矩阵中对应于第一批次号的行向量/或列向量作为第一稀疏向量；历史交易报文包括：分别对应于m个第二批次号的多笔交易报文，稀疏矩阵中分别对应于m个第二批次号的行向量/或列向量作为m个第二稀疏向量，m为正整数。

在一些可能的实施方式中，相似度测算模块进一步用于：由#{(b _i-a)≠0}与#{(b _i+a)≠0}的比值和/或差值确定稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，其中，i＝1,2,…,m；其中，b _i表示m个第二稀疏向量中的第i个第二稀疏向量，a表示第一稀疏向量，#{(b _i-a)≠0}表示第一稀疏向量与第i个第二稀疏向量的差向量中非零元素的个数，#{(b+a)≠0}表示第一稀疏向量与第i个第二稀疏向量的和向量中非零元素的个数。

在一些可能的实施方式中，相似度评分模块用于：确定m个相似度参数中的最大相似度参数作为相似度指数。

在一些可能的实施方式中，相似度评分模块用于：判断m个相似度参数中的最大相似度参数是否达到预设临界值；若最大相似度参数达到预设临界值，则确定预设临界值为相似度指数；若最大相似度参数未达到预设临界值，则基于m个预设权值参数分别对m个相似度参数进行加权处理，以得到m个加权相似度参数，并确定m个加权相似度参数中的最大加权相似度参数作为相似度指数。

在一些可能的实施方式中，指定报文内容还包括批次上送时间，相似度评分模块进一步用于：针对m个相似度参数中的每一个相似度参数，由所对应的两个批次上送时间的差值而确定对应的预设权值参数。

在一些可能的实施方式中，相似度评分模块进一步用于：由以下公式确定m个预设权值参数，并分别对m个相似度参数进行加权处理，以得到m个加权相似度参数：

在一些可能的实施方式中，相似度评分模块进一步用于：由同一监测对象的预设信用信息和/或预设属性信息确定m个预设权值参数。

在一些可能的实施方式中，还包括相似度阈值模块，具体用于：提取同一监测对象在指定时刻之前上送的历史交易数据，并根据历史交易数据确定相似度阈值，其中，历史交易数据上送于历史交易报文之前。

在一些可能的实施方式中，历史交易数据包括：分别对应于n个第三批次号的多笔交易数据，且n个第三批次号中的每一个第三批次号均对应设有重复交易风险标签，n为大于1的正整数；以及，相似度阈值模块进一步用于：依次将对应于n个第三批次号中每一个第三批次号的多笔交易数据作为待测批次数据，并将历史交易数据中除待测批次数据之外的交易数据作为剩余批次数据；根据指定的报文内容，确定待测批次数据与剩余批次数据之间的参考相似度指数，从而获得对应于每一个第三批次号的参考相似度指数；根据对应于每一个第三批次号的参考相似度指数与重复交易风险标签建立ROC曲线，从而根据ROC曲线确定相似度阈值。

在一些可能的实施方式中，在建立ROC曲线之前，相似度阈值模块进一步用于：去除取值为0或1的参考相似度指数以及所对应的重复交易风险标签。

在一些可能的实施方式中，还包括过滤模块，用于：在确定待测批量交易报文与历史交易报文之间的相似度指数之前，比较待测批量交易报文与历史交易报文的批次号；若存在与待测批量交易报文相比具有同一批次号的一个或多个历史交易报文，则直接判定待测批量交易报文存在重复交易风险；若不存在与待测批量交易报文相比具有同一批次号的历史交易报文，则进一步执行确定待测批量交易报文与历史交易报文之间的相似度指数。在一些可能的实施方式中，还包括预警模块，用于：若待测批量交易报文被判断存在重复交易风险，则向同一监测对象发送预警信息；接收同一监测对象发来的确认信息，并根据确认信息重复判断待测批量交易报文是否存在重复交易风险。

一种重复交易风险监测系统，包括如上述的监测装置以及至少一个监测对象。

一种重复交易风险监测装置，包括：一个或者多个多核处理器；存储器，用于存储一个或多个程序；当一个或多个程序被一个或者多个多核处理器执行时，使得一个或多个多核处理器实现：获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在指定时刻之前上送的历史交易报文；根据指定的报文内容，确定待测批量交易报文与历史交易报文之间的相似度指数，其中，指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；通过对相似度指数与预设相似度阈值进行比较，以判断待测批量交易报文是否存在重复交易风险。

一种计算机可读存储介质，计算机可读存储介质存储有程序，当程序被多核处理器执行时，使得多核处理器执行如上述的方法。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：本实施例中，通过计算同一监测对象在指定时刻上送的待测批量交易报文与在指定时刻之前一段时间内上送的历史交易报文之间的相似度指数，进而通过比较相似度指数与预设的相似度阈值，能够对批量交易报文中可能存在的部分重复交易的情况进行监测，能更为灵敏地提示重复交易风险，避免经济损失；进一步地，在计算相似度指数的过程中，本申请充分利用交易本身的信息提升相似度指数的可信度，利用稀疏矩阵以及稀疏向量间的差、和计算简化了相似度计算过程，利用交易上送时间制定合理的加权方案提升相似度指数的计算准确度；在相似度阈值的制定过程中，本申请通过制定合理的阈值求取方案，利用ROC曲线得到可信度较高的相似度阈值，进一步保证了重复交易风险监测的准确度。

应当理解，上述说明仅是本发明技术方案的概述，以便能够更清楚地了解本发明的技术手段，从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举例说明本发明的具体实施方式。

附图说明

通过阅读下文的示例性实施例的详细描述，本领域普通技术人员将明白本文所述的有点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的标号表示相同的部件。在附图中：

图1为根据本发明一实施例的重复交易风险监测方法的流程示意图；

图2为根据本发明另一实施例的重复交易风险监测方法的流程示意图；

图3为根据本发明实施例的ROC曲线示意图；

图4为根据本发明一实施例的重复交易风险监测装置的结构示意图；

图5为根据本发明又一实施例的重复交易风险监测装置的结构示意图；

图6为根据本发明一实施例的计算机可读存储介质的示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

在本发明中，应理解，诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在，并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。

另外还需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

图1示意性地示出了根据本发明实施方式的重复交易风险监测方法100的流程示意图,优选地但非必须地，图1所示的方法可在云端服务器、服务器集群或后台交易处理系统处执行，更具体地，图1所示的方法可由设置于银联系统中的具体模块执行。本实施例中，以云端服务器作为执行主体进行具体阐述，然而应当理解，本申请对执行主体并无具体限制。

如图1所示，该方法100包括：

步骤S101、获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在所述指定时刻之前上送的历史交易报文；

其中，同一监测对象是指实际与持卡人产生交易的商户或者终端，待测批量交易报文与历史交易报文可以是由包括贷记交易在内的多种类型交易而产生的交易报文。在同一监测对象处发生一笔交易后，并不实时地将该笔交易报文上送到云端服务器中，而是定时批量地将一段时间内产生的多笔交易报文打包上送至云端服务器中。在本实施例中，同一监测对象在指定时刻以及指定时刻之前的多个时间点处分别上送批量交易报文，其中，将该监测对象在指定时刻上送的批量交易报文指定为“待测批量交易报文”，指定时刻通常为最近时刻或当前时刻；将同一监测对象在指定时刻之前一段时间内上送的交易报文指定为“历史交易报文”，用于作为该重复交易风险分析中的背景数据。

在一些可能的实施方式中，其中步骤S101可以进一步包括：在指定时刻接收由同一监测对象上送的待测批量交易报文；由预设时长与指定时刻确定第一时段，并提取同一监测对象在第一时段内上送的历史交易报文。

例如，云端服务器在接收到待测批量交易报文之后，为判断该待测批量交易报文是否存在重复交易风险，从云端服务器的数据库中提取出该同一监测对象在之前的一天、一小时或十分钟内上送的其他批次的交易报文作为该重复交易风险分析的背景数据。应理解，存储在数据库中的交易报文可以是批量格式或非批量格式，本申请对此不作具体限制。本申请中，利用同一监测对象本身在之前一段时间内的交易报文来对当前上送的批量交易报文进行分析，可以实时地且较为准确地判断当前的批量交易报文是否具有重复交易的风险。

如图1所示，该方法100还包括：

步骤S102、根据指定的报文内容，确定待测批量交易报文与历史交易报文之间的相似度指数；

具体地，指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额。具体地，用于计算相似度指数的方法有多种，比如可以基于指定报文内容将待测批量交易报文与历史交易报文中的每一笔交易报文转换为多维特征矢量，进而基于历史交易报文训练获得深度学习模型，将待测批量交易报文输入至该深度学习模型中以输出相似度指数，又比如可以通过计算余弦距离、欧式距离等方式获取上述相似度指数，本申请对此不作具体限制。

本实施例中，进行重复交易风险分析时无需额外请求其他交易数据，上述批次号、交易卡号以及交易金额等信息均为交易本身的报文内容的。可选地，指定的报文内容还可以包括：批次上送时间、交易类别、交易币种、交易商品类型等信息，本申请对此不作具体限制。

在一些可能的实施方式中，在步骤S102之前，方法100还可以包括：比较待测批量交易报文与历史交易报文的批次号；其中，若存在与待测批量交易报文相比具有同一批次号的一个或多个历史交易报文，则直接判定待测批量交易报文存在重复交易风险；若不存在与待测批量交易报文相比具有同一批次号的历史交易报文，则进一步执行步骤S102。

在一些可能的实施方式中，如图2所示，其中步骤S102可进一步包括：

步骤S201、利用预设相似度算法确定待测批量交易报文与历史交易报文之间的相似度向量；

在一些可能的实施方式中，其中步骤S201可以进一步包括：基于待测批量交易报文与历史交易报文构建稀疏矩阵，其中每一个非零元素的取值由交易金额确定，每一个元素的行标签与列标签分别由批次号与交易账号确定；确定稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，并由m个相似度参数确定相似度向量。

具体地，待测批量交易报文包括：对应于第一批次号的多笔交易报文，稀疏矩阵中对应于第一批次号的行向量/或列向量作为第一稀疏向量；历史交易报文包括：分别对应于m个第二批次号的多笔交易报文，稀疏矩阵中分别对应于m个第二批次号的行向量/或列向量作为m个第二稀疏向量，m为正整数。

其中，每一个元素的行标签与列标签分别由批次号与交易账号确定可以是：稀疏矩阵中的每一行元素对应于同一批次号、每一列元素对应于同一交易账号；也可以是稀疏矩阵中的每一行元素对应于同一交易账号、每一列元素对应于同一批次号。

其中，对于待测批量交易报文来说，可以是同一监测对象按照预设规则生成的交易包，云端服务器在接收到待测批量交易报文后解析获得该多笔交易报文。对于任一批次的批量交易信息而言，可以理解，批次号与批次上送时间为多笔交易报文的共有信息，交易卡号与交易金额为每一笔交易报文的独有信息。

以下以批次号为行标签、以交易账号为列标签为例进行具体描述：

例如，将待测批量交易报文与历史交易报文包含的每一笔交易报文以批次号为行标签、以交易账号为列标签进行排列，从而形成如下所示的稀疏矩阵。其中，每一行元素对应于同一批次号、每一列元素对应于同一交易账号，若某一交易账号在某一批次中存在交易记录，则将对应位置的元素取值为该笔交易的交易金额，若某一交易账号在某一批次中不存在交易记录，则将对应位置的元素取值为零，由实际交易经验可以理解，在该稀疏矩阵中，每行每列可能存在一定数量的非零元素(即实际数据)，和大量的零元素(零元素没有数据，不进行存储)。

具体地，下列稀疏矩阵中，行标签N _a对应于第一批次号、行标签N ₁～N _m分别对应于m个第二批次号，列标签C ₁～C _n分别对应于上述待测批量交易报文与历史交易报文中所包含的每一笔交易报文中所涉及的每一个交易账号，V _mn为历史交易报文中，对应于第m个第二批次号以及交易账号C _n的交易金额，V _an为待测批量交易报文中对应于交易账号C _n的交易金额，并依次类推。

在该稀疏矩阵中，第一稀疏向量a，也即第一批次号a所对应的行向量为：

a＝(V _a1 V _a2 … V _an)

在该稀疏矩阵中，m个第二稀疏向量b _i，i＝1,2,…,m，也即m个第二批次号所分别对应的m个行向量为：

b _i＝(V _i1 V _i2 … V _in)，其中i＝1,2,…,m

进一步地，分别计算第一稀疏向量a与m个第二稀疏向量b _i之间的m个相似度参数S _i，其中i＝1,2,…,m，从而得到相似度向量(S ₁，S ₂，...，S _m)。通过建立上述稀疏矩阵，将待测批量交易报文与历史交易报文之间的相似度运算过程简化为更为简单的向量间相似度计算的过程。

在一些可能的实施方式中，进一步地，可以由#{(b _i-a)≠0}与#{(b _i+a)≠0}的比值和/或差值确定所述稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，其中，i＝1,2,…,m。

例如，可以由下列公式(1)确定稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数：

上述公式(1)中，b _i表示m个第二稀疏向量中的第i个第二稀疏向量；a表示第一稀疏向量，#{(b _i-a)≠0}表示第一稀疏向量与第i个第二稀疏向量的差向量中非零元素的个数，#{(b _i+a)≠0}表示第一稀疏向量与第i个第二稀疏向量的和向量中非零元素的个数；S _i表示第i个第二稀疏向量与第一稀疏向量的第i相似度参数；m为正整数，表示m个第二稀疏向量与m个相似度参数的数量。

以a＝(V _a1 V _a2 … V _an)与b ₁＝(V ₁₁ V ₁₂ … V _1n)为例进行进一步具体描述。

(b ₁-a)＝(V ₁₁-V _a1 V ₁₂-V _a2 … V _1n-V _an)；

(b ₁+a)＝(V ₁₁+V _a1 V ₁₂+V _a2 … V _1n+V _an)；

可以理解，以交易账号C _n为例，若该交易账号在N ₁与N _a两个批次号中存在重复交易的话，则V _1n-V _an＝0，且V _1n+V _an≠0。也即是说，这种重复交易的个数被统计进入了#{(b ₁+a)≠0}、却并未统计进入#{(b _i-a)≠0}。进一步地，可以推测得到，S _i的取值越大，相对应的两批交易的重复度风险就越高。

由此可以看出，上述公式(1)对重复交易风险具有较高的识别敏感度，基于简单地统计计算即可对重复交易的识别具有较好的效果，上述相似度参数S _i取值在[0,1]之间，当两批交易完全相同时，相似度参数为1，当两批交易完全不同时，相似度参数为0。

可选地，本发明还可以通过其他方式确定第一稀疏向量a与m个第二稀疏向量b _i之间的m个相似度参数，比如可以通过计算欧氏距离、余弦距离等计算方式而确定，本申请对此不作具体限定。

如图2所示，在步骤S201之后，步骤S102可进一步包括：

步骤S202：利用预设评分规则，将相似度向量转化为相似度指数。

在一些可能的实施方式中，其中步骤S202中的预设评分规则可以包括：确定m个相似度参数中的最大相似度参数作为相似度指数。

在一些可能的实施方式中，其中步骤S202中的预设评分规则还可以包括：判断m个相似度参数中的最大相似度参数是否达到预设临界值；若最大相似度参数达到预设临界值，则确定预设临界值为相似度指数；若最大相似度参数未达到预设临界值，则基于m个预设权值参数分别对m个相似度参数进行加权处理，以得到m个加权相似度参数，并确定m个加权相似度参数中的最大加权相似度参数作为相似度指数。

例如，根据上述公式(1)所获取的相似度参数S _i取值在[0,1]之间，因此可以将1作为预设临界值，进一步地，若最大相似度参数达到1，则说明存在两批交易完全相同，通常可以认为对应于该最大相似度参数的两批次交易重复。若最大相似度参数小于1，则需要进一步结合预设权值参数进行判断，该预设权值参数可以由批次上送时间等因素确定。

在一些可能的实施方式中，指定报文内容还包括批次上送时间，其中步骤S202进一步包括：针对m个相似度参数中的每一个相似度参数，由所对应的两个批次上送时间的差值而确定对应的预设权值参数。由于时间间隔较小的两批交易存在重复的概率更高，本实施例中通过采用由两批交易的批次上送时间差而确定预设权值参数，能够确定具有更高准确度的相似度指数。

例如，可以由公式(2)确定m个预设权值参数(ω ₁,ω ₂,…,ω _m)，并分别根据m个预设权值参数(ω ₁,ω ₂,…,ω _m)分别对m个相似度参数(S ₁,S ₂,…,S _m)进行加权处理，以得到m个加权相似度参数(X ₁,X ₂,…,X _m)。

其中，公式(2)为：

在上述公式(2)中，t _a为待测批量交易报文的批次上送时间；S _i为m个相似度参数中的第i相似度参数；t _i为对应于第i相似度参数的第i批次历史数据的批次上送时间；ω _i为m个预设权值参数中对应于第i相似度参数的第i预设权值参数；X _i为m个加权相似度参数中对应于第i相似度参数的第i加权相似度参数；T为第一时段的时长；m为正整数，表示m个相似度参数的个数。

在一些可能的实施方式中，还可以包括由同一监测对象的预设信用信息和/或预设属性信息确定上述m个预设权值参数。可选地，同一监测对象的预设信用信息例如是同一监测对象的银行征信评分。

如图1所示，方法100还包括：

步骤S103、对相似度指数与预设相似度阈值进行比较，以判断待测批量交易报文是否存在重复交易风险。

具体地，上述重复交易风险用于指示待测批量交易报文中存在一笔或多笔与历史交易相重复的重复交易的交易报文。

例如，对于每一次由同一监测对象上送的待测批量交易报文，都可以获取对应的相似度指数，可以将相似度指数与预设相似度阈值进行大小比较，若相似度指数超过预设相似度阈值，则判断待测批量交易报文存在重复交易风险，进一步可以采取相关预警措施，若相似度指数未超过预设相似度阈值，则判断待测批量交易报文为正常交易。

在一些可能的实施方式中，方法100还包括：提取同一监测对象在指定时刻之前上送的历史交易数据，并根据历史交易数据确定相似度阈值，其中，历史交易数据的上送于历史交易报文之前。本实施例中，基于同一监测对象的历史交易数据而获取的相似度阈值具有更高的自适应性与可靠性。可选地，本实施例也可以通过经验值以及实验值获取相似度阈值。

在一些可能的实施方式中，历史交易数据与历史交易报文的上送时间具有周期性对应关系。例如，历史交易数据与历史交易报文可以是由同一监测对象在相邻的两周或相邻的两天内的同一时段内上送的。

在一些可能的实施方式中，历史交易数据包括：分别对应于n个第三批次号的多笔交易数据，且n个第三批次号中的每一个第三批次号均对应设有重复交易风险标签，n为大于1的正整数。

进一步地，根据历史交易数据确定相似度阈值具体可以包括：

(1)依次将对应于n个第三批次号中每一个第三批次号的多笔交易数据作为待测批次数据，并将历史交易数据中除待测批次数据之外的交易数据作为剩余批次数据；

(2)根据指定的报文内容，确定待测批次数据与剩余批次数据之间的参考相似度指数，从而获得对应于每一个第三批次号的参考相似度指数；

(3)根据对应于每一个第三批次号的参考相似度指数与重复交易风险标签建立ROC曲线，从而根据ROC曲线确定相似度阈值；

例如，历史交易数据包可以划分对应于五个第三批次号的R ₁～R ₅，其中，选取R ₁作为待测批次数据，将剩余的R ₂～R ₅作为剩余批次数据，并计算得到待测批次数据与剩余批次数据之间的相似度指数作为参考相似度指数，也即对应于R ₁的参考相似度指数，具体计算过程与上文中计算待测批量交易报文与历史交易报文之间相似度指数的步骤一致或相似，本申请在此不再赘述。依次类推，可以计算出分别对应于R ₁～R ₅五个批次的参考相似度指数。

以下结合表1对步骤(3)中的建立ROC曲线进行详细说明。

表1：

上述表格中，R ₁～R ₅分别表示上述多批次交易数据中的每一个第三批次号，其中，R ₁所对应的重复交易风险标签为0(也即非重复交易)，所对应的参考相似度指数为0.3；R ₃所对应的重复交易风险标签为1(也即重复交易)，所对应的参考相似度指数为0.9，并依次类推；分别以对应于R ₁～R ₅的参考相似度指数作为预设阈值进行查准率与查全率的判断，判定为TP,FP,TN,FN四种情况，其中，若参考相似度指数≥阈值，且重复交易风险标签＝1,判定为TP；若参考相似度指数≥阈值，且重复交易风险标签＝0,判定为FP；若参考相似度指数＜阈值，且重复交易风险标签＝1,判定为FN；若参考相似度指数小于阈值，且重复交易风险标签＝0,判定为TN；进一步计算每一个阈值的真正率TPR和假正率FPR，其中，TPR＝TP/(TP+FN)，FPR＝FP/(FP+TN)。进一步，参见图3，以FPR为横轴，TPR为纵轴，根据对应于各个阈值的真正率TPR和假正率FPR，得到ROC曲线，并选取曲线最靠近左上角的点(0,1)对应的阈值0.7作为相似度阈值。

在一些可能的实施方式中，在建立ROC曲线之前，还可以包括：去除取值为0或1的参考相似度指数以及所对应的重复交易风险标签。从而可以避免阈值选取偏差。

在一些可能的实施方式中，方法100还可以包括：若待测批量交易报文被判断存在重复交易风险，则向同一监测对象发送预警信息；接收由同一监测对象发来的确认信息，并根据确认信息重复判断待测批量交易报文是否存在重复交易风险。例如，当相似度指数大于相似度阈值时，向同一监测对象反馈预警信息，若相似度指数到达预设临界值，则反馈更强的预警，从而提醒同一监测对象可能有重复交易的风险出现，避免经济损失。

本实施例中，通过计算同一监测对象在指定时刻上送的待测批量交易报文与在指定时刻之前一段时间内上送的历史交易报文之间的相似度指数，进而通过比较相似度指数与预设的相似度阈值，能够对批量交易报文中可能存在的部分重复交易的情况进行监测，能更为灵敏地提示重复交易风险，避免经济损失；进一步地，在计算相似度指数的过程中，本申请充分利用交易本身的信息提升相似度指数的可信度，利用稀疏矩阵以及稀疏向量间的差、和计算简化了相似度计算过程，利用交易上送时间制定合理的加权方案提升相似度指数的计算准确度；在相似度阈值的制定过程中，本申请通过制定合理的阈值求取方案，利用ROC曲线得到可信度较高的相似度阈值，进一步保证了重复交易风险监测的准确度。

基于相同的技术构思，本发明实施例还提供一种重复交易风险监测装置，用于执行上述任一实施例所提供的重复风险交易监测方法。图4为本发明实施例提供的一种重复交易风险监测装置结构示意图。

如图4所示，重复交易风险监测装置40包括：

获取模块401，用于获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在指定时刻之前上送的历史交易报文；

相似度模块402，用于根据指定的报文内容，确定待测批量交易报文与历史交易报文之间的相似度指数，其中，指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；

判断模块403，用于通过对相似度指数与预设相似度阈值进行比较，以判断待测批量交易报文是否存在重复交易风险。

在一些可能的实施方式中，获取模块401包括：接收模块，用于在指定时刻接收由同一监测对象上送的待测批量交易报文；提取模块，用于由预设时长与指定时刻确定第一时段，并提取同一监测对象在第一时段内上送的历史交易报文。

在一些可能的实施方式中，相似度模块402包括：相似度测算模块，用于利用预设相似度算法确定待测批量交易报文与历史交易报文之间的相似度向量；相似度评分模块，用于利用预设评分规则，将相似度向量转化为相似度指数。

在一些可能的实施方式中，装置40还包括相似度阈值模块，具体用于：提取同一监测对象在指定时刻之前上送的历史交易数据，并根据历史交易数据确定相似度阈值，其中，历史交易数据上送于历史交易报文之前。

在一些可能的实施方式中，装置40还包括过滤模块，用于在确定待测批量交易报文与历史交易报文之间的相似度指数之前，比较待测批量交易报文与历史交易报文的批次号；若存在与待测批量交易报文相比具有同一批次号的一个或多个历史交易报文，则直接判定待测批量交易报文存在重复交易风险；若不存在与待测批量交易报文相比具有同一批次号的历史交易报文，则进一步由相似度模块确定待测批量交易报文与历史交易报文之间的相似度指数。在一些可能的实施方式中，装置40还包括预警模块，用于：若待测批量交易报文被判断存在重复交易风险，则向同一监测对象发送预警信息；接收同一监测对象发来的确认信息，并根据确认信息重复判断待测批量交易报文是否存在重复交易风险。

基于相同的技术构思，本发明实施例还提供一种重复交易风险监测系统，包括如上所述的监测装置以及至少一个监测对象。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为设备、方法或计算机可读存储介质。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“设备”。

在一些可能的实施方式中，本发明的一种重复交易风险监测装置可以至少包括一个或多个处理器、以及至少一个存储器。其中，所述存储器存储有程序，当所述程序被所述处理器执行时，使得所述处理器执行如图1所示的步骤：

步骤S101：获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在指定时刻之前上送的历史交易报文；

步骤S102：根据指定的报文内容，确定待测批量交易报文与历史交易报文之间的相似度指数，其中，指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；

步骤S103：通过对相似度指数与预设相似度阈值进行比较，以判断待测批量交易报文是否存在重复交易风险。

下面参照图5来描述根据本发明的这种实施方式的重复交易风险监测装置5。图5显示的装置5仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，装置5可以以通用计算设备的形式表现，包括但不限于：至少一个处理器10、至少一个存储器20、连接不同设备组件的总线60。

总线60包括数据总线、地址总线和控制总线。

存储器20可以包括易失性存储器，例如随机存取存储器(RAM)21和/或高速缓存存储器22，还可以进一步包括只读存储器(ROM)23。

存储器20还可以包括程序模块24，这样的程序模块24包括但不限于：操作设备、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

装置5还可以与一个或多个外部设备2(例如键盘、指向设备、蓝牙设备等)通信，也可与一个或者多个其他设备进行通信。这种通信可以通过输入/输出(I/O)接口40进行，并在显示单元30上进行显示。并且，装置5还可以通过网络适配器50与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器50通过总线60与装置5中的其它模块通信。应当明白，尽管图中未示出，但可以结合装置5使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID设备、磁带驱动器以及数据备份存储设备等。

图6示出了一种计算机可读存储介质，用于执行如上所述的方法。

在一些可能的实施方式中，本发明的各个方面还可以实现为一种计算机可读存储介质的形式，其包括程序代码，当所述程序代码在被处理器执行时，所述程序代码用于使所述处理器执行上面描述的方法。

上面描述的方法包括了上面的附图中示出和未示出的多个操作和步骤，这里将不再赘述。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的设备、设备或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

如图6所示，描述了根据本发明的实施方式的计算机可读存储介质6，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的计算机可读存储介质不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行设备、设备或者器件使用或者与其结合使用。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

一种重复交易风险监测方法,其特征在于，包括：

获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在所述指定时刻之前上送的历史交易报文；

根据指定的报文内容，确定所述待测批量交易报文与所述历史交易报文之间的相似度指数，其中，所述指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；

通过对所述相似度指数与预设相似度阈值进行比较，以判断所述待测批量交易报文是否存在重复交易风险。
由权利要求1所述的方法，其特征在于，所述获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在所述指定时刻之前上送的历史交易报文包括：

在所述指定时刻接收由所述同一监测对象上送的待测批量交易报文；

由预设时长与所述指定时刻确定第一时段，并提取所述同一监测对象在所述第一时段内上送的历史交易报文。
由权利要求1所述的方法，其特征在于，确定所述待测批量交易报文与所述历史交易报文之间的相似度指数包括：

利用预设相似度算法确定所述待测批量交易报文与所述历史交易报文之间的相似度向量；

利用预设评分规则，将所述相似度向量转化为所述相似度指数。
由权利要求3所述的方法，其特征在于，所述利用预设相似度算法确定所述待测批量交易报文与所述历史交易报文之间的相似度向量包括：

基于所述待测批量交易报文与所述历史交易报文构建稀疏矩阵，所述稀疏矩阵中，每一个非零元素的取值由所述交易金额确定，每一个元素的行标签与列标签分别由所述批次号与所述交易账号确定；

确定所述稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，并由所述m个相似度参数确定所述相似度向量；

其中，所述待测批量交易报文包括：对应于第一批次号的多笔交易报文，所述稀疏矩阵中对应于所述第一批次号的行向量/或列向量作为所述第一稀疏向量；所述历史交易报文包括：分别对应于m个第二批次号的多笔交易报文，所述稀疏矩阵中分别对应于所述m个第二批次号的行向量/或列向量作为所述m个第二稀疏向量，所述m为正整数。
由权利要求4所述的方法，其特征在于，还包括：

由#{(b _i-a)≠0}与#{(b _i+a)≠0}的比值和/或差值确定所述稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，其中，i＝1,2,…,m；

其中，所述b _i表示所述m个第二稀疏向量中的第i个第二稀疏向量，所述a表示所述第一稀疏向量，所述#{(b _i-a)≠0}表示所述第一稀疏向量与所述第i个第二稀疏向量的差向量中非零元素的个数，所述#{(b+a)≠0}表示所述第一稀疏向量与所述第i个第二稀疏向量的和向量中非零元素的个数。
由权利要求4所述的方法，其特征在于，所述预设评分规则包括：

确定所述m个相似度参数中的最大相似度参数作为所述相似度指数。
由权利要求4所述的方法，其特征在于，所述预设评分规则还包括：

判断所述m个相似度参数中的最大相似度参数是否达到预设临界值；

若所述最大相似度参数达到所述预设临界值，则确定所述预设临界值为所述相似度指数；

若所述最大相似度参数未达到所述预设临界值，则基于m个预设权值参数分别对所述m个相似度参数进行加权处理，以得到m个加权相似度参数，并确定所述m个加权相似度参数中的最大加权相似度参数作为所述相似度指数。
由权利要求7所述的方法，其特征在于，所述指定报文内容还包括批次上送时间，所述方法还包括：

针对所述m个相似度参数中的每一个相似度参数，由所对应的两个批次上送时间的差值而确定对应的所述预设权值参数。
由权利要求8所述的方法，其特征在于，还包括：

由以下公式确定所述m个预设权值参数，并分别对所述m个相似度参数进行加权处理，以得到所述m个加权相似度参数：

其中，t _a为所述待测批量交易报文的批次上送时间；S _i为所述m个相似度参数中的第i相似度参数；t _i为对应于所述第i相似度参数的第i批次历史数据的批次上送时间；ω _i为所述m个预设权值参数中对应于所述第i相似度参数的第i预设权值参数；X _i为所述m个加权相似度参数中对应于所述第i相似度参数的第i加权相似度参数；T为包含所述t _a以及每一个所述t _i在内的第一时段的时长。
由权利要求7所述的方法，其特征在于，还包括：由所述同一监测对象的预设信用信息和/或预设属性信息确定所述m个预设权值参数。
由权利要求1-10中任一项所述的方法，其特征在于，还包括：

提取所述同一监测对象在所述指定时刻之前上送的历史交易数据，并根据所述历史交易数据确定所述相似度阈值，其中，所述历史交易数据上送于所述历史交易报文之前。
由权利要求11所述的方法，其特征在于，所述历史交易数据包括：分别对应于n个第三批次号的多笔交易数据，且所述n个第三批次号中的每一个第三批次号均对应设有重复交易风险标签，所述n为大于1的正整数；以及，

所述方法还包括：

依次将对应于所述n个第三批次号中每一个第三批次号的多笔交易数据作为待测批次数据，并将所述历史交易数据中除所述待测批次数据之外的交易数据作为剩余批次数据；

根据所述指定的报文内容，确定所述待测批次数据与所述剩余批次数据之间的参考相似度指数，从而获得对应于所述每一个第三批次号的参考相似度指数；

根据对应于所述每一个第三批次号的所述参考相似度指数与所述重复交易风险标签建立ROC曲线，从而根据所述ROC曲线确定所述相似度阈值。
由权利要求12所述的方法，其特征在于，在建立所述ROC曲线之前，所述方法还包括：

去除取值为0或1的参考相似度指数以及所对应的重复交易风险标签。
由权利要求11所述的方法，其特征在于，所述历史交易数据与所述历史交易报文的上送时间具有周期性对应关系。
由权利要求1所述的方法，其特征在于，还包括：

在所述确定所述待测批量交易报文与所述历史交易报文之间的相似度指数之前，比较所述待测批量交易报文与所述历史交易报文的批次号；

若存在与所述待测批量交易报文相比具有同一批次号的一个或多个历史交易报文，则直接判定所述待测批量交易报文存在重复交易风险；

若不存在与所述待测批量交易报文相比具有同一批次号的历史交易报文，则进一步执行所述确定所述待测批量交易报文与所述历史交易报文之间的相似度指数。
由权利要求1或15所述的方法，其特征在于，还包括：

若所述待测批量交易报文被判断存在重复交易风险，则向所述同一监测对象发送预警信息；

接收所述同一监测对象发来的确认信息，并根据所述确认信息重复判断所述待测批量交易报文是否存在重复交易风险。
一种重复交易风险监测装置,其特征在于，包括：

获取模块，用于获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在所述指定时刻之前上送的历史交易报文；

相似度模块，用于根据指定的报文内容，确定所述待测批量交易报文与所述历史交易报文之间的相似度指数，其中，所述指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；

判断模块，用于通过对所述相似度指数与预设相似度阈值进行比较，以判断所述待测批量交易报文是否存在重复交易风险。
由权利要求17所述的装置，其特征在于，所述获取模块包括：

接收模块，用于在所述指定时刻接收由所述同一监测对象上送的待测批量交易报文；

提取模块，用于由预设时长与所述指定时刻确定第一时段，并提取所述同一监测对象在所述第一时段内上送的历史交易报文。
由权利要求17所述的装置，其特征在于，所述相似度模块包括：

相似度测算模块，用于利用预设相似度算法确定所述待测批量交易报文与所述历史交易报文之间的相似度向量；

相似度评分模块，用于利用预设评分规则，将所述相似度向量转化为所述相似度指数。
由权利要求19所述的装置，其特征在于，所述相似度测算模块用于：

基于所述待测批量交易报文与所述历史交易报文构建稀疏矩阵，所述稀疏矩阵中，每一个非零元素的取值由所述交易金额确定，每一个元素的行标签与列标签分别由所述批次号与所述交易账号确定；

确定所述稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，并由所述m个相似度参数确定所述相似度向量；

其中，所述待测批量交易报文包括：对应于第一批次号的多笔交易报文，所述稀疏矩阵中对应于所述第一批次号的行向量/或列向量作为所述第一稀疏向量；所述历史交易报文包括：分别对应于m个第二批次号的多笔交易报文，所述稀疏矩阵中分别对应于所述m个第二批次号的行向量/或列向量作为所述m个第二稀疏向量，所述m为正整数。
由权利要求20所述的装置，其特征在于，所述相似度测算模块进一步用于：

由#{(b _i-a)≠0}与#{(b _i+a)≠0}的比值和/或差值确定所述稀疏矩阵中的第一稀疏向量与m个第二稀疏向量之间的m个相似度参数，其中，i＝1,2,…,m；

其中，所述b _i表示所述m个第二稀疏向量中的第i个第二稀疏向量，所述a表示所述第一稀疏向量，所述#{(b _i-a)≠0}表示所述第一稀疏向量与所述第i个第二稀疏向量的差向量中非零元素的个数，所述#{(b+a)≠0}表示所述第一稀疏向量与所述第i个第二稀疏向量的和向量中非零元素的个数。
由权利要求20所述的装置，其特征在于，所述相似度评分模块用于：

确定所述m个相似度参数中的最大相似度参数作为所述相似度指数。
由权利要求20所述的装置，其特征在于，所述相似度评分模块用于：

判断所述m个相似度参数中的最大相似度参数是否达到预设临界值；

若所述最大相似度参数达到所述预设临界值，则确定所述预设临界值为所述相似度指数；

若所述最大相似度参数未达到所述预设临界值，则基于m个预设权值参数分别对所述m个相似度参数进行加权处理，以得到m个加权相似度参数，并确定所述m个加权相似度参数中的最大加权相似度参数作为所述相似度指数。
由权利要求23所述的装置，其特征在于，所述指定报文内容还包括批次上送时间，所述相似度评分模块进一步用于：

针对所述m个相似度参数中的每一个相似度参数，由所对应的两个批次上送时间的差值而确定对应的所述预设权值参数。
由权利要求24所述的装置，其特征在于，所述相似度评分模块进一步用于：

由以下公式确定所述m个预设权值参数，并分别对所述m个相似度参数进行加权处理，以得到所述m个加权相似度参数：

其中，t _a为所述待测批量交易报文的批次上送时间；S _i为所述m个相似度参数中的第i相似度参数；t _i为对应于所述第i相似度参数的第i批次历史数据的批次上送时间；ω _i为所述m个预设权值参数中对应于所述第i相似度参数的第i预设权值参数；X _i为所述m个加权相似度参数中对应于所述第i相似度参数的第i加权相似度参数；T为包含所述t _a以及每一个所述t _i在内的第一时段的时长。
由权利要求23所述的装置，其特征在于，所述相似度评分模块进一步用于：由所述同一监测对象的预设信用信息和/或预设属性信息确定所述m个预设权值参数。
由权利要求17-26中任一项所述的装置，其特征在于，还包括相似度阈值模块，具体用于：

提取所述同一监测对象在所述指定时刻之前上送的历史交易数据，并根据所述历史交易数据确定所述相似度阈值，其中，所述历史交易数据的上送于所述历史交易报文之前。
由权利要求27所述的装置，其特征在于，所述历史交易数据包括：分别对应于n个第三批次号的多笔交易数据，且所述n个第三批次号中的每一个第三批次号均对应设有重复交易风险标签，所述n为大于1的正整数；以及，

所述相似度阈值模块进一步用于：

依次将对应于所述n个第三批次号中每一个第三批次号的多笔交易数据作为待测批次数据，并将所述历史交易数据中除所述待测批次数据之外的交易数据作为剩余批次数据；

根据所述指定的报文内容，确定所述待测批次数据与所述剩余批次数据之间的参考相似度指数，从而获得对应于所述每一个第三批次号的参考相似度指数；

根据对应于所述每一个第三批次号的所述参考相似度指数与所述重复交易风险标签建立ROC曲线，从而根据所述ROC曲线确定所述相似度阈值。
由权利要求28所述的装置，其特征在于，在建立所述ROC曲线之前，所述相似度阈值模块进一步用于：

去除取值为0或1的参考相似度指数以及所对应的重复交易风险标签。
由权利要求27所述的装置，其特征在于，所述历史交易数据与所述历史交易报文的上送时间具有周期性对应关系。
由权利要求17所述的装置，其特征在于，还包括过滤模块，用于：

在所述确定所述待测批量交易报文与所述历史交易报文之间的相似度指数之前，比较所述待测批量交易报文与所述历史交易报文的批次号；

若存在与所述待测批量交易报文相比具有同一批次号的一个或多个历史交易报文，则直接判定所述待测批量交易报文存在重复交易风险；

若不存在与所述待测批量交易报文相比具有同一批次号的历史交易报文，则进一步执行所述确定所述待测批量交易报文与所述历史交易报文之间的相似度指数。
由权利要求17或31所述的装置，其特征在于，还包括预警模块，用于：

若所述待测批量交易报文被判断存在重复交易风险，则向所述同一监测对象发送预警信息；

接收所述同一监测对象发来的确认信息，并根据所述确认信息重复判断所述待测批量交易报文是否存在重复交易风险。
一种重复交易风险监测系统，其特征在于，包括如权利要求17-32中任一项所述的监测装置以及至少一个监测对象。
一种重复交易风险监测装置，其特征在于，包括：

一个或者多个多核处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或者多个多核处理器执行时，使得所述一个或多个多核处理器实现：

获取由同一监测对象在指定时刻上送的待测批量交易报文，以及在所述指定时刻之前上送的历史交易报文；

根据指定的报文内容，确定所述待测批量交易报文与所述历史交易报文之间的相似度指数，其中，所述指定报文内容包括以下中的至少两种：批次号、交易账号以及交易金额；

通过对所述相似度指数与预设相似度阈值进行比较，以判断所述待测批量交易报文是否存在重复交易风险。
一种计算机可读存储介质，所述计算机可读存储介质存储有程序，当所述程序被多核处理器执行时，使得所述多核处理器执行如权利要求1-16中任一项所述的方法。