CN107146156B - 一种将交易卡号和终端标识进行匹配的方法和装置 - Google Patents

一种将交易卡号和终端标识进行匹配的方法和装置 Download PDF

Info

Publication number
CN107146156B
CN107146156B CN201710289646.XA CN201710289646A CN107146156B CN 107146156 B CN107146156 B CN 107146156B CN 201710289646 A CN201710289646 A CN 201710289646A CN 107146156 B CN107146156 B CN 107146156B
Authority
CN
China
Prior art keywords
card number
transaction card
time window
probability
information notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710289646.XA
Other languages
English (en)
Other versions
CN107146156A (zh
Inventor
王佩璐
丁峰
汤旻玮
潘颖杰
呼如生
赵萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unionpay Advisors Counselor Shanghai Co ltd
Original Assignee
Unionpay Advisors Counselor Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unionpay Advisors Counselor Shanghai Co ltd filed Critical Unionpay Advisors Counselor Shanghai Co ltd
Priority to CN201710289646.XA priority Critical patent/CN107146156B/zh
Publication of CN107146156A publication Critical patent/CN107146156A/zh
Application granted granted Critical
Publication of CN107146156B publication Critical patent/CN107146156B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Computer Security & Cryptography (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及支付技术领域,尤其一种将交易卡号和终端标识进行匹配的方法和装置,包括:获取交易数据及信息通知数据;以信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端的交易卡号概率以及第i交易卡号、j终端标识在同一时间窗口内同时出现的匹配事件概率;然后确定第i交易卡号与第j终端标识的匹配度,若该匹配度大于预先设定的阈值,则将第i交易卡号与第j终端标识进行匹配。可以看出,在将交易卡号与终端标识进行匹配的过程中,并不是仅统计交易卡号与终端标识在各个时间窗口内出现的次数,能够过滤掉高频“匹配对”带来的干扰,从而提升交易卡号与终端标识匹配的可信度。

Description

一种将交易卡号和终端标识进行匹配的方法和装置
技术领域
本发明实施例涉及支付领域,尤其涉及一种将交易卡号和终端标识进行匹配的方法和装置。
背景技术
现有技术中,在获取到交易数据、以及与交易信息相关的信息通知数据以后,例如,获取的交易数据,如下:
交易卡号1,交易时间:20161011105421
交易卡号2,交易时间:20161011105455
交易卡号3,交易时间:20161011105550
以及获取的与交易信息相关的信息通知数据,如下:
手机号码1,20161011105421
手机号码2,20161011105526
手机号码3,20161011105555
由于获取的交易数据中包括交易卡号以及交易时间,而信息通知数据中包括终端标识以及通知时间,如果想把交易数据中的交易卡号与信息通知数据中的终端标识进行匹配,现有技术是采用的方法为:获取使用交易卡号发生交易一段时间内接收到通知信息的终端标识,将该交易卡号与每个终端标识的组合作为一个匹配对,统计该匹配对出现的次数,若次数超过一定的阈值,则认为该匹配对中的交易卡号与终端标识是匹配的。
然而,在使用上述方法将交易卡号与终端标识进行匹配的过程中,由于会存在大量的交易卡号与终端标识出现频次很高,会产生大量的“匹配”对,这些“匹配”对的出现次数会超过阈值,但是其中的交易卡号与终端标识并不是匹配的,因此,降低了交易卡号与终端标识匹配的可信度。
发明内容
本发明实施例提供一种将交易卡号和终端标识进行匹配的方法和装置,用以提升交易卡号与终端标识匹配的可信度。
本发明实施例提供一种将交易卡号和终端标识进行匹配的方法,包括:
获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;
确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;
以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;
根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;
若所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值,则将所述第i交易卡号与所述第j终端标识进行匹配。
较佳的,所述确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和,包括:
以每个交易数据的交易时间为起始时间,根据预设时间窗口大小确定时间窗口,或以每个信息通知数据的通知时间为终止时间根据预设时间窗口大小,确定时间窗口;
统计每个时间窗口内所发生的信息通知事件数量Ai
统计各个时间窗口内的信息通知事件数量Ai的总和M。
较佳的,所述以时间窗口为单次统计基准,包括:
从各个时间窗口中确定第i交易卡号所属的时间窗口;
确定所述第i交易卡号所属的时间窗口内的信息通知事件数量Si
从各个时间窗口中确定第j终端标识所属的时间窗口;
确定所述第j终端标识所属的时间窗口内的交易事件数量Wj
从各个时间窗口中确定第i交易卡号和第j终端标识同时所属的时间窗口;
确定所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数Fij
较佳的,所述分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,包括:
根据下列公式(1)确定第i交易卡号的信息通知概率;
根据下列公式(2)确定第j终端标识的交易卡号概率;
根据下列公式(3)确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;
Figure GDA0002622010910000031
Figure GDA0002622010910000032
Figure GDA0002622010910000033
其中,Si为所述第i交易卡号所属的时间窗口内的信息通知事件数量,M为统计各个时间窗口内的信息通知事件数量的总和,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,Fij为所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
较佳的,所述根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度,包括:
根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,通过下列公式(4)确定所述第i交易卡号与所述第j终端标识的匹配度;
Figure GDA0002622010910000041
其中,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,PMI(i,j)为所述第i交易卡号与所述第j终端标识的匹配度。
较佳的,所述确定所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,包括:
根据获取到的交易数据,建立第一信息库,第一信息库的记录项包括:交易卡号、交易时间。
根据获取到的与交易信息相关的信息通知数据,建立第二信息库,第二信息库的记录项包括:信息通知时间、终端标识;其中,第二信息库中每个信息通知时间至少对应一个终端标识。
以所述第一信息库中的交易时间为起始时间,统计第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
根据第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij和所述信息通知事件数量Ai的总和M,确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
本发明实施例还提供一种将交易卡号和终端标识进行匹配的装置,包括:
获取模块,用于获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;
统计模块,用于确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;
处理模块,用于以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;
还用于根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;
匹配模块,用于在所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值时,将所述第i交易卡号与所述第j终端标识进行匹配。
较佳的,所述统计模块,具体用于:
以每个交易数据的交易时间为起始时间,根据预设时间窗口大小确定时间窗口,或以每个信息通知数据的通知时间为终止时间根据预设时间窗口大小,确定时间窗口;
统计每个时间窗口内所发生的信息通知事件数量Ai
统计各个时间窗口内的信息通知事件数量Ai的总和M。
较佳的,所述处理模块,具体用于:
从各个时间窗口中确定第i交易卡号所属的时间窗口;
确定所述第i交易卡号所属的时间窗口内的信息通知事件数量Si
从各个时间窗口中确定第j终端标识所属的时间窗口;
确定所述第j终端标识所属的时间窗口内的交易事件数量Wj
从各个时间窗口中确定第i交易卡号和第j终端标识同时所属的时间窗口;
确定所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数Fij
较佳的,所述处理模块,具体用于:
根据下列公式(1)确定第i交易卡号的信息通知概率;
根据下列公式(2)确定第j终端标识的交易卡号概率;
根据下列公式(3)确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;
Figure GDA0002622010910000061
Figure GDA0002622010910000062
Figure GDA0002622010910000063
其中,Si为所述第i交易卡号所属的时间窗口内的信息通知事件数量,M为统计各个时间窗口内的信息通知事件数量的总和,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,Fij为所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
较佳的,所述处理模块,具体用于:
根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,通过下列公式(4)确定所述第i交易卡号与所述第j终端标识的匹配度;
Figure GDA0002622010910000071
其中,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,PMI(i,j)为所述第i交易卡号与所述第j终端标识的匹配度。
较佳的,所述处理模块,具体用于:
根据获取到的交易数据,建立第一信息库,第一信息库的记录项包括:交易卡号、交易时间。
根据获取到的与交易信息相关的信息通知数据,建立第二信息库,第二信息库的记录项包括:信息通知时间、终端标识;其中,第二信息库中每个信息通知时间至少对应一个终端标识。
以所述第一信息库中的交易时间为起始时间,统计第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
根据第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij和所述信息通知事件数量Ai的总和M,确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
上述实施例提供的一种将交易卡号和终端标识进行匹配的方法和装置,包括:获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;若所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值,则将所述第i交易卡号与所述第j终端标识进行匹配。可以看出,本发明实施例在将交易卡号与终端标识进行匹配的过程中,并不是仅统计交易卡号与终端标识在各个时间窗口内出现的次数,而是将第i交易卡号的信息通知概率、第j终端的交易卡号概率与第i交易卡号和第j终端标识的匹配事件概率相结合,从而可以能够过滤掉高频“匹配对”带来的干扰,能得到更准确的关联匹配结果,因此,能够提升交易卡号与终端标识匹配的可信度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例提供的一种将交易卡号和终端标识进行匹配的方法流程示意图;
图2为本发明实施例提供的确定信息通知数据总和的方法流程示意图;
图3为本发明实施例提供的另一确定信息通知数据总和的方法流程示意图;
图4为本发明实施例提供的确定信息通知概率的方法流程示意图;
图5为本发明实施例提供的确定交易卡号概率的方法流程示意图;
图6为本发明实施例提供的确定匹配事件概率的方法流程示意图;
图7本发明实施例提供的获取到的交易数据及信息通知数据的示意图;
图8为本发明实施例提供的确定交易卡号和终端标识同时出现的次数的方法流程示意图;
图9为本发明实施例提供的一种将交易卡号和终端标识进行匹配的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示例性示出了本发明实施例提供的一种将交易卡号和终端标识进行匹配的方法流程示意图,如图1所示,该方法可包括:
S101、获取交易数据及信息通知数据,该信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间。
S102、确定各时间窗口并统计各时间窗口内的信息通知数据的总和。
S103、以信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及第i交易卡号、第j终端标识在同一时间窗口内同时出现的匹配事件概率;第i交易卡号为交易数据中的任一个交易卡号,第j终端标识为信息通知数据中的任一个终端标识。
其中,第i交易卡号为交易数据中的任意一个交易卡号,第j终端标识为信息通知数据的任意一个终端标识。
S104、根据第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述匹配事件概率,确定第i交易卡号与第j终端标识的匹配度。
S105、判断第i交易卡号与第j终端标识的匹配度是否大于预先设定的阈值,若是,则转至步骤S106,否则结束流程。
S106、将第i交易卡号与第j终端标识进行匹配。
可选的,在上述步骤S102中,在确定各时间窗口并统计各时间窗口内的信息通知数据的总和时,可通过图2所示的方法流程进行实现。
S201、以每个交易数据的交易时间为起始时间,根据预设时间窗口大小确定时间窗口,或以每个信息通知数据的通知时间为终止时间,根据预设时间窗口大小确定时间窗口。
S202、统计每个时间窗口内所发生的信息通知事件数量Ai
S203、统计各个时间窗口内的信息通知事件数量Ai的总和M。
为了能够提供多元化的统计方式,可选的,在上述步骤S102中,在确定各时间窗口并统计各时间窗口内的信息通知数据的总和时,还可通过图3所示的方法流程进行实现。
S301、以每个信息通知数据的通知时间为终止时间,根据预设时间窗口大小确定时间窗口。
S302、统计每个时间窗口内所发生的交易事件数量Bi
S303、统计各个时间窗口内的交易事件数量Bi的总和M。
需要说明的是,针对同一份交易数据和信息通知数据,上述两种确定各时间窗口并统计各时间窗口内的信息通知数据的总和,无论采用哪种方式,各个时间窗口内的信息通知事件数量Ai的总和与各个时间窗口内的交易事件数量Bi的总和是相同的,只不过提供了多元化的方式而已。
可选的,在上述步骤S103中,以信息通知数据的总和为概率基准,以时间窗口为单次统计基准,确定第i交易卡号的信息通知概率,可参见图4所示的方法流程。
S401、以各个时间窗口内的信息通知事件数量Ai的总和M为概率基准,以时间窗口为单次统计基准。
S402、从各个时间窗口确定第i交易卡号所属的时间窗口。
S403、确定第i交易卡号所属的时间窗口内的信息通知事件数量Si
S404、根据公式(1)确定第i交易卡号的信息通知概率。
Figure GDA0002622010910000101
Figure GDA0002622010910000102
其中,Si为第i交易卡号所属的时间窗口内的信息通知事件数量,M为统计各个时间窗口内的信息通知事件数量的总和M,p(i)为第i交易卡号的信息通知概率。
可选的,在上述步骤S103中,以信息通知数据的总和为概率基准,以时间窗口为单次统计基准,确定j终端标识的交易卡号概率,可参见图5所示的方法流程。
S501、以各个时间窗口内的信息通知事件数量Ai的总和M为概率基准,以时间窗口为单次统计基准。
S502、从各个时间窗口中确定第j终端标识所属的时间窗口。
S503、确定第j终端标识所属的时间窗口内的交易事件数量Wj
S504、根据公式(2)确定第j终端标识的交易卡号概率。
Figure GDA0002622010910000111
其中,Wj为第j终端标识所属的时间窗口内的交易事件数量,M为统计各个时间窗口内的信息通知事件数量的总和,p(j)为第j终端标识的交易卡号概率。
可选的,在上述步骤S103中,以信息通知数据的总和为概率基准,以时间窗口为单次统计基准,确定第i交易卡号、j终端标识在同一时间窗口内同时出现的匹配事件概率,可参见图6所示的方法流程。
S601、以各个时间窗口内的信息通知事件数量Ai的总和M为概率基准,以时间窗口为单次统计基准。
S602、从各个时间窗口中确定第i交易卡号和第j终端标识同时所属的时间窗口。
S603、确定第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
S604、根据公式(3)确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
Figure GDA0002622010910000112
其中,Fij为第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数,M为统计各个时间窗口内的信息通知事件数量的总和,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
在以信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率p(i)、第j终端标识的交易卡号概率p(j)以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率p(i,j)之后,通过下列公式(4)确定所述第i交易卡号与所述第j终端标识的匹配度。
Figure GDA0002622010910000121
其中,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,PMI(i,j)为所述第i交易卡号与所述第j终端标识的匹配度。
下面通过一个具体的例子,对上述的方法流程进行详细的解释说明。
在该例子中用x1、x2表示交易卡号,用y1、y2、y3表示终端标识,并假设预先确定的时间窗口为3分钟。
参见图7,交易卡号x1在10:00发生一笔交易,又由于在10:00~10:03这个时间窗口内,从信息通知数据中可获取到发生1件信息通知事件,因此,可统计得到在时间窗口10:00~10:03内所发生的信息通知事件数量为1。
同理,可统计得到在时间窗口10:06~10:09内所发生的信息通知事件数量为2;统计得到在时间窗口10:14~10:17内所发生的信息通知事件数量为1,因此,统计时间窗口10:00~10:03、时间窗口10:06~10:09、以及时间窗口10:14~10:17的信息通知事件数量的总和total_num=4。
在统计得到信息通知事件的数据总和total_num之后,针对交易卡号x1、交易卡号x2,分别统计交易卡号x1各个时间窗口内所发生的信息通知事件的数量之和occur_num(x1)以及交易卡号x2在各个时间窗口内所发生的信息通知事件的数量之和occur_num(x2)。
具体的,针对交易卡号x1,由于交易卡号x1在时间窗口10:00~10:03内所发生的信息通知事件数量为1、交易卡号x1在时间窗口10:06~10:09内所发生的信息通知事件数量为0、交易卡号x1在时间窗口10:14~10:17内所发生的信息通知事件数量为1,因此,交易卡号x1在各个时间窗口内所发生的信息通知事件的数量之和occur_num(x1)=2。
针对交易卡号x2,由于交易卡号x2在时间窗口10:00~10:03内所发生的信息通知事件数量为0、交易卡号x2在时间窗口10:06~10:09内所发生的信息通知事件数量为2、交易卡号x2在时间窗口10:14~10:17内所发生的信息通知事件数量为0,因此,交易卡号x2在各个时间窗口内所发生的信息通知事件的数量之和occur_num(x2)=2。
在得到信息通知事件数量的总和total_num=4、针对交易卡号x1统计在各个时间窗口内所发生的信息通知事件的数量之和occur_num(x1)=2、以及针对交易卡号x2统计在各个时间窗口内所发生的信息通知事件的数量之和occur_num(x2)=2之后,可根据信息通知事件数量的总和total_num=4、针对交易卡号x1统计在各个时间窗口内所发生的信息通知事件的数量之和occur_num(x1)=2,采用上述公式(1)计算得到交易卡号x1的信息通知概率p(x1);可根据信息通知事件数量的总和total_num=4以及针对交易卡号x2统计在各个时间窗口内所发生的信息通知事件的数量之和occur_num(x2)=2,采用上述公式(1)计算得到交易卡号x2的信息通知概率p(x2)。
Figure GDA0002622010910000141
Figure GDA0002622010910000142
采用与计算交易卡号的信息通知概率相似的方法,下面开始计算终端标识y1、y2、y3、y4的交易卡号概率p(y1)、p(y2)、p(y3)以及p(y4)。
针对终端标识y1,由于终端标识y1在时间窗口10:00~10:03内所发生的交易事件数量为1、终端标识y1在时间窗口10:06~10:09内所发生的交易事件数量为0、终端标识y1在时间窗口10:14~10:17内所发生的交易事件数量为1,因此,终端标识y1在各个时间窗口内所发生的交易事件的数量之和occur_num(y1)=2。
在得到信息通知事件数量的总和total_num=4以及终端标识y1在各个时间窗口内所发生的交易事件的数量之和occur_num(y1)=2之后,可根据信息通知事件数量的总和total_num=4以及终端标识y1在各个时间窗口内所发生的交易事件的数量之和occur_num(y1)=2,采用上述公式(2)计算得到终端标识y1的交易卡号概率p(y1)。
Figure GDA0002622010910000143
同理,针对终端标识y2,由于终端标识y2在时间窗口10:00~10:03内所发生的交易事件数量为0、终端标识y2在时间窗口10:06~10:09内所发生的交易事件数量为1、终端标识y2在时间窗口10:14~10:17内所发生的交易事件数量为0,因此,终端标识y2在各个时间窗口内所发生的交易事件的数量之和occur_num(y2)=1。
在得到信息通知事件数量的总和total_num=4以及终端标识y2在各个时间窗口内所发生的交易事件的数量之和occur_num(y2)=1之后,可根据信息通知事件数量的总和total_num=4以及终端标识y2在各个时间窗口内所发生的交易事件的数量之和occur_num(y2)=1,采用上述公式(2)计算得到终端标识y2的交易卡号概率p(y2)。
Figure GDA0002622010910000151
针对终端标识y3,由于终端标识y3在时间窗口10:00~10:03内所发生的交易事件数量为0、终端标识y3在时间窗口10:06~10:09内所发生的交易事件数量为1、终端标识y3在时间窗口10:14~10:17内所发生的交易事件数量为0,因此,终端标识y3在各个时间窗口内所发生的交易事件的数量之和
Figure GDA0002622010910000152
在得到信息通知事件数量的总和total_num=4以及终端标识y3在各个时间窗口内所发生的交易事件的数量之和occur_num(y3)=1之后,可根据信息通知事件数量的总和total_num=4以及终端标识y3在各个时间窗口内所发生的交易事件的数量之和occur_num(y3)=1,采用上述公式(2)计算得到终端标识y3的交易卡号概率p(y3)。
Figure GDA0002622010910000153
针对终端标识y4,由于终端标识y4在时间窗口10:00~10:03内所发生的交易事件数量为0、终端标识y4在时间窗口10:06~10:09内所发生的交易事件数量为0、终端标识y4在时间窗口10:14~10:17内所发生的交易事件数量为0,因此,终端标识y4在各个时间窗口内所发生的交易事件的数量之和occur_num(y4)=1。
在得到信息通知事件数量的总和total_num=4以及终端标识y3在各个时间窗口内所发生的交易事件的数量之和occur_num(y4)=0之后,可根据信息通知事件数量的总和total_num=4以及终端标识y4在各个时间窗口内所发生的交易事件的数量之和occur_num(y4)=0,采用上述公式(2)计算得到终端标识y4的交易卡号概率p(y4)。
Figure GDA0002622010910000161
采用与计算交易卡号的信息通知概率、终端标识的交易卡号概率相似的方法,下面开始计算交易卡号x1与终端标识y1、交易卡号x1与终端标识y2、交易卡号x1与终端标识y3、交易卡号x1与终端标识y4的匹配事件概率p(x1,y1)、p(x1,y2)、p(x1,y3)、p(x1,y4)以及计算交易卡号x2与终端标识y1、交易卡号x2与终端标识y2、交易卡号x2与终端标识y3、交易卡号x2与终端标识y4的匹配事件概率p(x2,y1)、p(x2,y2)、p(x2,y3)、p(x2,y4)。
针对交易卡号x1与终端标识y1而言,由于交易卡号x1与终端标识y1在时间窗口10:00~10:03内同时出现的次数为1,交易卡号x1与终端标识y1在时间窗口10:06~10:09内同时出现的次数为0,交易卡号x1与终端标识y1在时间窗口10:14~10:17内同时出现的次数为1,交易卡号x1与终端标识y1在各个时间窗口内同时出现的次数之和occur_num(x1,y1)=2。
在得到信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y1在各个时间窗口内同时出现的次数之和occur_num(x1,y1)=2之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y1在各个时间窗口内同时出现的次数之和occur_num(x1,y1)=2,采用上述公式(3)计算得到交易卡号x1与终端标识y1的匹配事件概率p(x1,y1)。
Figure GDA0002622010910000162
同理,针对交易卡号x1与终端标识y2而言,由于交易卡号x1与终端标识y2在时间窗口10:00~10:03内同时出现的次数为0,交易卡号x1与终端标识y2在时间窗口10:06~10:09内同时出现的次数为0,交易卡号x1与终端标识y2在时间窗口10:14~10:17内同时出现的次数为0,因此,交易卡号x1与终端标识y2在各个时间窗口内同时出现的次数之和occur_num(x1,y2)=0。
在得到信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y2在各个时间窗口内同时出现的次数之和occur_num(x1,y2)=0之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y2在各个时间窗口内同时出现的次数之和occur_num(x1,y2)=0,采用上述公式(3)计算得到交易卡号x1与终端标识y2的匹配事件概率p(x1,y2)。
Figure GDA0002622010910000171
同理,针对交易卡号x1与终端标识y3而言,由于交易卡号x1与终端标识y3在时间窗口10:00~10:03内同时出现的次数为0,交易卡号x1与终端标识y3在时间窗口10:06~10:09内同时出现的次数为0,交易卡号x1与终端标识y3在时间窗口10:14~10:17内同时出现的次数为0,因此,交易卡号x1与终端标识y3在各个时间窗口内同时出现的次数之和occur_num(x1,y3)=0。
在得到信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y3在各个时间窗口内同时出现的次数之和occur_num(x1,y3)=0之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y3在各个时间窗口内同时出现的次数之和occur_num(x1,y3)=0,采用上述公式(3)计算得到交易卡号x1与终端标识y3的匹配事件概率p(x1,y3)。
Figure GDA0002622010910000172
同理,针对交易卡号x1与终端标识y4而言,由于交易卡号x1与终端标识y4在时间窗口10:00~10:03内同时出现的次数为0,交易卡号x1与终端标识y4在时间窗口10:06~10:09内同时出现的次数为0,交易卡号x1与终端标识y4在时间窗口10:14~10:17内同时出现的次数为0,因此,交易卡号x1与终端标识y4在各个时间窗口内同时出现的次数之和occur_num(x1,y4)=0。
在得到信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y4在各个时间窗口内同时出现的次数之和occur_num(x1,y4)=0之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x1与终端标识y4在各个时间窗口内同时出现的次数之和occur_num(x1,y4)=0,采用上述公式(3)计算得到交易卡号x1与终端标识y4的匹配事件概率p(x1,y4)。
Figure GDA0002622010910000181
同理,针对交易卡号x2与终端标识y1而言,由于交易卡号x2与终端标识y1在时间窗口10:00~10:03内同时出现的次数为0,交易卡号x2与终端标识y1在时间窗口10:06~10:09内同时出现的次数为0,交易卡号x2与终端标识y1在时间窗口10:14~10:17内同时出现的次数为0,交易卡号x2与终端标识y1在各个时间窗口内同时出现的次数之和occur_num(x2,y1)=0。
在得到信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y1在各个时间窗口内同时出现的次数之和occur_num(x2,y1)=0之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y1在各个时间窗口内同时出现的次数之和occur_num(x2,y1)=0,采用上述公式(3)计算得到交易卡号x2与终端标识y1的匹配事件概率p(x2,y1)。
Figure GDA0002622010910000182
同理,针对交易卡号x2与终端标识y2而言,由于交易卡号x2与终端标识y2在时间窗口10:00~10:03内同时出现的次数为0,交易卡号x2与终端标识y2在时间窗口10:06~10:09内同时出现的次数为1,交易卡号x2与终端标识y2在时间窗口10:14~10:17内同时出现的次数为0,因此,交易卡号x2与终端标识y2在各个时间窗口内同时出现的次数之和occur_num(x2,y2)=1。
在得到信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y2在各个时间窗口内同时出现的次数之和occur_num(x2,y2)=1之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y2在各个时间窗口内同时出现的次数之和occur_num(x2,y2)=1,采用上述公式(3)计算得到交易卡号x2与终端标识y2的匹配事件概率p(x2,y2)。
Figure GDA0002622010910000191
同理,针对交易卡号x2与终端标识y3而言,由于交易卡号x2与终端标识y3在时间窗口10:00~10:03内同时出现的次数为0,交易卡号x2与终端标识y3在时间窗口10:06~10:09内同时出现的次数为1,交易卡号x2与终端标识y3在时间窗口10:14~10:17内同时出现的次数为0,因此,交易卡号x2与终端标识y3在各个时间窗口内同时出现的次数之和occur_num(x2,y3)=1。
在得到信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y3在各个时间窗口内同时出现的次数之和occur_num(x2,y3)=1之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y3在各个时间窗口内同时出现的次数之和occur_num(x2,y3)=1,采用上述公式(3)计算得到交易卡号x2与终端标识y3的匹配事件概率p(x2,y3)。
Figure GDA0002622010910000192
同理,针对交易卡号x2与终端标识y4而言,由于交易卡号x2与终端标识y4在时间窗口10:00~10:03内同时出现的次数为0,交易卡号x2与终端标识y4在时间窗口10:06~10:09内同时出现的次数为0,交易卡号x2与终端标识y4在时间窗口10:14~10:17内同时出现的次数为0,因此,交易卡号x2与终端标识y4在各个时间窗口内同时出现的次数之和occur_num(x2,y4)=0。
在得到信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y4在各个时间窗口内同时出现的次数之和occur_num(x2,y4)=0之后,可根据信息通知事件数量的总和total_num=4以及交易卡号x2与终端标识y4在各个时间窗口内同时出现的次数之和occur_num(x2,y4)=0,采用上述公式(3)计算得到交易卡号x2与终端标识y4的匹配事件概率p(x2,y4)。
Figure GDA0002622010910000201
在通过上述公式(1)计算得到
Figure GDA0002622010910000202
通过上述公式(2)计算得到
Figure GDA0002622010910000203
以及通过上述公式(3)计算得到
Figure GDA0002622010910000204
之后,下面通过上述公式(4)计算得到交易卡号x1与终端标识y1的匹配度PMI(x1,y1)。
Figure GDA0002622010910000205
在通过上述公式(1)计算得到
Figure GDA0002622010910000206
通过上述公式(2)计算得到
Figure GDA0002622010910000207
以及通过上述公式(3)计算得到
Figure GDA0002622010910000208
之后,下面通过上述公式(4)计算得到交易卡号x1与终端标识y2的匹配度PMI(x1,y2)。
Figure GDA0002622010910000209
在通过上述公式(1)计算得到
Figure GDA00026220109100002010
通过上述公式(2)计算得到
Figure GDA0002622010910000211
以及通过上述公式(3)计算得到
Figure GDA0002622010910000212
之后,下面通过上述公式(4)计算得到交易卡号x1与终端标识y3的匹配度PMI(x1,y3)。
Figure GDA0002622010910000213
在通过上述公式(1)计算得到
Figure GDA0002622010910000214
通过上述公式(2)计算得到
Figure GDA0002622010910000215
以及通过上述公式(3)计算得到
Figure GDA0002622010910000216
之后,下面通过上述公式(4)计算得到交易卡号x1与终端标识y4的匹配度PMI(x1,y4)。
Figure GDA0002622010910000217
在通过上述公式(1)计算得到
Figure GDA0002622010910000218
通过上述公式(2)计算得到
Figure GDA0002622010910000219
以及通过上述公式(3)计算得到
Figure GDA00026220109100002110
之后,下面通过上述公式(4)计算得到交易卡号x2与终端标识y1的匹配度PMI(x2,y1)。
Figure GDA00026220109100002111
在通过上述公式(1)计算得到
Figure GDA00026220109100002112
通过上述公式(2)计算得到
Figure GDA00026220109100002113
以及通过上述公式(3)计算得到
Figure GDA0002622010910000221
之后,下面通过上述公式(4)计算得到交易卡号x2与终端标识y2的匹配度PMI(x2,y2)。
Figure GDA0002622010910000222
在通过上述公式(1)计算得到
Figure GDA0002622010910000223
通过上述公式(2)计算得到
Figure GDA0002622010910000224
以及通过上述公式(3)计算得到
Figure GDA0002622010910000225
之后,下面通过上述公式(4)计算得到交易卡号x2与终端标识y3的匹配度PMI(x2,y3)。
Figure GDA0002622010910000226
在通过上述公式(1)计算得到
Figure GDA0002622010910000227
通过上述公式(2)计算得到
Figure GDA0002622010910000228
以及通过上述公式(3)计算得到
Figure GDA0002622010910000229
之后,下面通过上述公式(4)计算得到交易卡号x2与终端标识y4的匹配度PMI(x2,y4)。
Figure GDA00026220109100002210
在通过上述公式(1)、公式(2)以及公式(3)计算得到:交易卡号x1与终端标识y1的匹配度PMI(x1,y1)、交易卡号x1与终端标识y2的匹配度PMI(x1,y2)、交易卡号x1与终端标识y3的匹配度PMI(x1,y3)以及交易卡号x1与终端标识y4的匹配度PMI(x1,y4)、交易卡号x2与终端标识y1的匹配度PMI(x2,y1)、交易卡号x2与终端标识y2的匹配度PMI(x2,y2)、交易卡号x2与终端标识y3的匹配度PMI(x2,y3)以及交易卡号x2与终端标识y4的匹配度PMI(x2,y4)之后,进一步假设在该例子中预先设定的阈值为0.5。
由于交易卡号x1与终端标识y1的匹配度PMI(x1,y1)=0.69,并且0.69大于预先设定阈值为0.5,因此,将交易卡号x1与终端标识y1进行匹配,或者,确定交易卡号x1与终端标识y1是存在关联的。
同理,由于交易卡号x2与终端标识y2的匹配度PMI(x2,y2)=0.69,并且0.69大于预先设定阈值为0.5,因此,将交易卡号x2与终端标识y2进行匹配,或者,确定交易卡号x2与终端标识y2是存在关联的。
由于交易卡号x2与终端标识y3的匹配度PMI(x2,y3)=0.69,并且0.69大于预先设定阈值为0.5,因此,交易卡号x2与终端标识y3进行匹配,或者,确定交易卡号x2与终端标识y3进行匹配是存在关联的。
通过上述例子可以看出,交易卡号x1与终端标识y1的匹配度、交易卡号x2与终端标识y2的匹配度、交易卡号x2与终端标识y3的匹配度三者的匹配度相同,匹配度均为0.69,而基于图7所示的交易数据和信息通知数据的基础上,若采用现有技术,由于交易卡号x1与终端标识y1作为一个匹配对出现的次数为2,而交易卡号x2与终端标识y2作为一个匹配对出现的次数为1,以及交易卡号x2与终端标识y3作为一个匹配对出现的次数为1,因此,会认为交易卡号x1与终端标识y1作为一个匹配对的准确度优于交易卡号x2与终端标识y2作为一个匹配对和交易卡号x2与终端标识y3作为一个匹配对,但是通过本发明实施例所提供的方法,交易卡号x1与终端标识y1的匹配度、交易卡号x2与终端标识y2的匹配度、交易卡号x2与终端标识y3的匹配度三者的匹配度相同,因此,本发明实施例所记载的将交易卡号和终端标识进行匹配的方法,由于能够过滤掉高频“匹配对”带来的干扰,从而能够得到更准确的关联匹配结果,因此,能够提升交易卡号与终端标识匹配的可信度。
可选的,在计算第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij时,为了降低数据处理量,从而降低处理时长或者内存占用过大,还可通过图8所示的方法流程计算第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
S801、根据获取到的交易数据,建立第一信息库,第一信息库的记录项包括:交易卡号、交易时间。
S802、根据获取到的与交易信息相关的信息通知数据,建立第二信息库,第二信息库的记录项包括:信息通知时间、终端标识;其中,第二信息库中每个信息通知时间至少对应一个终端标识。
S803、以所述第一信息库中的交易时间为起始时间,以预选设定时间窗口为单次统计基准,统计第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
可选的,在上述步骤S801中,建立第一信息库可通过以下伪代码实现
card_data
格式:(card_id,trans_time)#(卡号id,交易发生时间)
在上述步骤S802中,建立第二信息库可通过以下伪代码实现
phone_data
格式:(phone_id,trans_time)#(手机号id,短信发送时间)
在建立第一信息库和第二信息库之后,可计算某时刻与该时刻收到短信的手机号列表的映射关系词典,具体伪代码如下:
Figure GDA0002622010910000241
Figure GDA0002622010910000251
Figure GDA0002622010910000261
Figure GDA0002622010910000271
从而采用上述伪代码统计出第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
根据以上内容可以看出,上述实施例提供的一种将交易卡号和终端标识进行匹配的方法,包括:获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;若所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值,则将所述第i交易卡号与所述第j终端标识进行匹配。可以看出,本发明实施例在将交易卡号与终端标识进行匹配的过程中,并不是仅统计交易卡号与终端标识在各个时间窗口内出现的次数,而是将第i交易卡号的信息通知概率、第j终端的交易卡号概率与第i交易卡号和第j终端标识的匹配事件概率相结合,从而可以能够过滤掉高频“匹配对”带来的干扰,能得到更准确的关联匹配结果,因此,能够提升交易卡号与终端标识匹配的可信度。
基于相同的技术构思,本发明实施例还提供一种将交易卡号和终端标识进行匹配的装置,如图9所示,该装置可包括:
获取模块901,用于获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;
统计模块902,用于确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;
处理模块903,用于以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;
还用于根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;
匹配模块904,用于在所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值时,将所述第i交易卡号与所述第j终端标识进行匹配。
较佳的,统计模块902,具体用于:
以每个交易数据的交易时间为起始时间,根据预设时间窗口大小确定时间窗口,或以每个信息通知数据的通知时间为终止时间,根据预设时间窗口大小确定时间窗口;
统计每个时间窗口内所发生的信息通知事件数量Ai
统计各个时间窗口内的信息通知事件数量Ai的总和M。
较佳的,处理模块903,具体用于:
从各个时间窗口中确定第i交易卡号所属的时间窗口;
确定所述第i交易卡号所属的时间窗口内的信息通知事件数量Si
从各个时间窗口中确定第j终端标识所属的时间窗口;
确定所述第j终端标识所属的时间窗口内的交易事件数量Wj
从各个时间窗口中确定第i交易卡号和第j终端标识同时所属的时间窗口;
确定所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数Fij
较佳的,处理模块903,具体用于:
根据下列公式(1)确定第i交易卡号的信息通知概率;
根据下列公式(2)确定第j终端标识的交易卡号概率;
根据下列公式(3)确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;
Figure GDA0002622010910000291
Figure GDA0002622010910000292
Figure GDA0002622010910000293
其中,Si为所述第i交易卡号所属的时间窗口内的信息通知事件数量,M为统计各个时间窗口内的信息通知事件数量的总和,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,Fij为所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
较佳的,处理模块903,具体用于:
根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,通过下列公式(4)确定所述第i交易卡号与所述第j终端标识的匹配度;
Figure GDA0002622010910000294
其中,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,PMI(i,j)为所述第i交易卡号与所述第j终端标识的匹配度。
较佳的,处理模块903,具体用于:
根据获取到的交易数据,建立第一信息库,第一信息库的记录项包括:交易卡号、交易时间。
根据获取到的与交易信息相关的信息通知数据,建立第二信息库,第二信息库的记录项包括:信息通知时间、终端标识;其中,第二信息库中每个信息通知时间至少对应一个终端标识。
以所述第一信息库中的交易时间为起始时间,统计第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
根据第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij和所述信息通知事件数量Ai的总和M,确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
综上,本发明实施例提供的一种将交易卡号和终端标识进行匹配的方法和装置,包括:获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;若所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值,则将所述第i交易卡号与所述第j终端标识进行匹配。可以看出,本发明实施例在将交易卡号与终端标识进行匹配的过程中,并不是仅统计交易卡号与终端标识在各个时间窗口内出现的次数,而是将第i交易卡号的信息通知概率、第j终端的交易卡号概率与第i交易卡号和第j终端标识的匹配事件概率相结合,从而可以能够过滤掉高频“匹配对”带来的干扰,能得到更准确的关联匹配结果,因此,能够提升交易卡号与终端标识匹配的可信度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种将交易卡号和终端标识进行匹配的方法,其特征在于,包括:
获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;
确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;
以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;
根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;
若所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值,则将所述第i交易卡号与所述第j终端标识进行匹配。
2.如权利要求1所述的方法,其特征在于,所述确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和,包括:
以每个交易数据的交易时间为起始时间,根据预设时间窗口大小向后选取时间窗口,或以每个信息通知数据的通知时间为终止时间,根据预设时间窗口大小向前选取时间窗口;
统计每个时间窗口内所发生的信息通知事件数量Ai
统计各个时间窗口内的信息通知事件数量Ai的总和M。
3.如权利要求2所述的方法,其特征在于,所述以时间窗口为单次统计基准,包括:
从各个时间窗口中确定第i交易卡号所属的时间窗口;
确定所述第i交易卡号所属的时间窗口内的信息通知事件数量Si
从各个时间窗口中确定第j终端标识所属的时间窗口;
确定所述第j终端标识所属的时间窗口内的交易事件数量Wj
从各个时间窗口中确定第i交易卡号和第j终端标识同时所属的时间窗口;
确定所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数Fij
4.如权利要求3所述的方法,其特征在于,所述分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,包括:
根据下列公式(1)确定第i交易卡号的信息通知概率;
根据下列公式(2)确定第j终端标识的交易卡号概率;
根据下列公式(3)确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;
公式(1)
Figure FDA0002622010900000021
公式(2)
Figure FDA0002622010900000022
公式(3)
Figure FDA0002622010900000023
其中,Si为所述第i交易卡号所属的时间窗口内的信息通知事件数量,M为统计各个时间窗口内的信息通知事件数量的总和,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,Fij为所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
5.如权利要求4所述的方法,其特征在于,所述根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度,包括:
根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,通过下列公式(4)确定所述第i交易卡号与所述第j终端标识的匹配度;
公式(4)
Figure FDA0002622010900000031
其中,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,PMI(i,j)为所述第i交易卡号与所述第j终端标识的匹配度。
6.如权利要求2所述的方法,其特征在于,所述确定所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,包括:
根据获取到的交易数据,建立第一信息库,第一信息库的记录项包括:交易卡号、交易时间;
根据获取到的与交易信息相关的信息通知数据,建立第二信息库,第二信息库的记录项包括:信息通知时间、终端标识;其中,第二信息库中每个信息通知时间至少对应一个终端标识;
以所述第一信息库中的交易时间为起始时间,统计第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
根据第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij和所述信息通知事件数量Ai的总和M,确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
7.一种将交易卡号和终端标识进行匹配的装置,其特征在于,包括:
获取模块,用于获取交易数据及信息通知数据,所述信息通知数据与交易信息相关,所述交易数据中包括交易卡号以及交易时间,所述信息通知数据中包括终端标识以及通知时间;
统计模块,用于确定各时间窗口并统计所述各时间窗口内的信息通知数据的总和;
处理模块,用于以所述信息通知数据的总和为概率基准,以时间窗口为单次统计基准,分别确定第i交易卡号的信息通知概率、第j终端标识的交易卡号概率以及所述第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;所述第i交易卡号为所述交易数据中的任一个交易卡号,所述j终端标识为所述信息通知数据中的任一个终端标识;
还用于根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,确定所述第i交易卡号与所述第j终端标识的匹配度;
匹配模块,用于在所述第i交易卡号与所述第j终端标识的匹配度大于预先设定的阈值时,将所述第i交易卡号与所述第j终端标识进行匹配。
8.如权利要求7所述的装置,其特征在于,所述统计模块,具体用于:
以每个交易数据的交易时间为起始时间,根据预设时间窗口大小向后选取时间窗口,或以每个信息通知数据的通知时间为终止时间,根据预设时间窗口大小向前选取确定时间窗口;
统计每个时间窗口内所发生的信息通知事件数量Ai
统计各个时间窗口内的信息通知事件数量Ai的总和M。
9.如权利要求8所述的装置,其特征在于,所述处理模块,具体用于:
从各个时间窗口中确定第i交易卡号所属的时间窗口;
确定所述第i交易卡号所属的时间窗口内的信息通知事件数量Si
从各个时间窗口中确定第j终端标识所属的时间窗口;
确定所述第j终端标识所属的时间窗口内的交易事件数量Wj
从各个时间窗口中确定第i交易卡号和第j终端标识同时所属的时间窗口;
确定所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数Fij
10.如权利要求9所述的装置,其特征在于,所述处理模块,具体用于:
根据下列公式(1)确定第i交易卡号的信息通知概率;
根据下列公式(2)确定第j终端标识的交易卡号概率;
根据下列公式(3)确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率;
公式(1)
Figure FDA0002622010900000051
公式(2)
Figure FDA0002622010900000052
公式(3)
Figure FDA0002622010900000053
其中,Si为所述第i交易卡号所属的时间窗口内的信息通知事件数量,M为统计各个时间窗口内的信息通知事件数量的总和,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,Fij为所述第i交易卡号和第j终端标识同时所属的时间窗口内的所述第i交易卡号与所述第j终端同时出现的次数,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
11.如权利要求10所述的装置,其特征在于,所述处理模块,具体用于:
根据所述第i交易卡号的信息通知概率、所述第j终端的交易卡号概率以及所述匹配事件概率,通过下列公式(4)确定所述第i交易卡号与所述第j终端标识的匹配度;
公式(4)
Figure FDA0002622010900000054
其中,p(i)为第i交易卡号的信息通知概率,Wj为所述第j终端标识所属的时间窗口内的交易事件数量,p(j)为第j终端标识的交易卡号概率,p(i,j)为第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率,PMI(i,j)为所述第i交易卡号与所述第j终端标识的匹配度。
12.如权利要求8所述的装置,其特征在于,所述处理模块,具体用于:
根据获取到的交易数据,建立第一信息库,第一信息库的记录项包括:交易卡号、交易时间;
根据获取到的与交易信息相关的信息通知数据,建立第二信息库,第二信息库的记录项包括:信息通知时间、终端标识;其中,第二信息库中每个信息通知时间至少对应一个终端标识;
以所述第一信息库中的交易时间为起始时间,统计第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij
根据第i交易卡号和第j终端标识同时所属的时间窗口内的第i交易卡号与第j终端同时出现的次数Fij和所述信息通知事件数量Ai的总和M,确定第i交易卡号、所述j终端标识在同一时间窗口内同时出现的匹配事件概率。
CN201710289646.XA 2017-04-27 2017-04-27 一种将交易卡号和终端标识进行匹配的方法和装置 Active CN107146156B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710289646.XA CN107146156B (zh) 2017-04-27 2017-04-27 一种将交易卡号和终端标识进行匹配的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710289646.XA CN107146156B (zh) 2017-04-27 2017-04-27 一种将交易卡号和终端标识进行匹配的方法和装置

Publications (2)

Publication Number Publication Date
CN107146156A CN107146156A (zh) 2017-09-08
CN107146156B true CN107146156B (zh) 2020-11-17

Family

ID=59775468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710289646.XA Active CN107146156B (zh) 2017-04-27 2017-04-27 一种将交易卡号和终端标识进行匹配的方法和装置

Country Status (1)

Country Link
CN (1) CN107146156B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140103019A (ko) * 2013-02-15 2014-08-25 류창화 안전결제코드를 이용한 결제 방법 및 이에 이용되는 안전결제중개서버
CN104166917A (zh) * 2014-07-31 2014-11-26 宇龙计算机通信科技(深圳)有限公司 Nfc交易事件的通知方法及系统
CN105447755A (zh) * 2014-09-01 2016-03-30 阿里巴巴集团控股有限公司 一种交易控制方法及装置
CN105654277A (zh) * 2014-12-08 2016-06-08 阿里巴巴集团控股有限公司 交易操作的识别方法及服务器
CN106527673A (zh) * 2015-09-11 2017-03-22 阿里巴巴集团控股有限公司 绑定可穿戴设备的方法和装置、电子支付方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150049299A (ko) * 2013-10-30 2015-05-08 삼성에스디에스 주식회사 전자영수증 관리 장치 및 방법
US10423937B2 (en) * 2015-07-17 2019-09-24 Mastercard International Incorporated Systems and methods for establishing message routing paths through a computer network

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140103019A (ko) * 2013-02-15 2014-08-25 류창화 안전결제코드를 이용한 결제 방법 및 이에 이용되는 안전결제중개서버
CN104166917A (zh) * 2014-07-31 2014-11-26 宇龙计算机通信科技(深圳)有限公司 Nfc交易事件的通知方法及系统
CN105447755A (zh) * 2014-09-01 2016-03-30 阿里巴巴集团控股有限公司 一种交易控制方法及装置
CN105654277A (zh) * 2014-12-08 2016-06-08 阿里巴巴集团控股有限公司 交易操作的识别方法及服务器
CN106527673A (zh) * 2015-09-11 2017-03-22 阿里巴巴集团控股有限公司 绑定可穿戴设备的方法和装置、电子支付方法和装置

Also Published As

Publication number Publication date
CN107146156A (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
CN110517097B (zh) 识别异常用户的方法、装置、设备及存储介质
CN106384273B (zh) 恶意刷单检测系统及方法
CN106548402B (zh) 资源转移监控方法及装置
CN108810116B (zh) 消息处理方法及相关产品
US20220172090A1 (en) Data identification method and apparatus, and device, and readable storage medium
CN110475124B (zh) 视频卡顿检测方法及装置
CN107025421B (zh) 指纹识别方法和装置
CN108197002B (zh) 移动设备无埋点数据统计方法、系统、终端及介质
CN101562529A (zh) 一种计费处理的方法及装置
CN107705126B (zh) 一种交易指令的处理方法及装置
CN109168138A (zh) 网内换号的识别方法、装置及设备
CN107423757B (zh) 聚类处理方法及装置
CN107146156B (zh) 一种将交易卡号和终端标识进行匹配的方法和装置
CN109299948B (zh) 一种红包发送方法、装置、可穿戴设备及存储介质
CN106294457B (zh) 网络信息推送方法及装置
CN111782684B (zh) 一种配网电子化移交信息匹配方法及装置
CN112801130B (zh) 图像聚类簇质量评估方法、系统、介质及装置
CN105491222B (zh) 终端受力提醒方法、装置及终端
CN111489148B (zh) 风险控制方法及装置、电子设备及存储介质
CN111371818B (zh) 一种数据请求的验证方法、装置及设备
WO2018149079A1 (zh) 一种评分信息匹配方法、装置、存储介质和服务器
AU2021204607B2 (en) Method and apparatus for detecting object exchange behavior, electronic device and storage medium
CN112449063B (zh) 话单稽查方法、装置、设备和介质
CN117294578B (zh) 一种通信方法、系统、计算机设备和存储介质
US20210006559A1 (en) System and method for identifying pairs of related information items

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 601, building 2, Century metropolis, 1239 Century Avenue, Pudong New Area, Shanghai

Applicant after: UNIONPAY ADVISORS COUNSELOR (SHANGHAI) Co.,Ltd.

Address before: 200122 605 International Financial Hotel, 1589 Century Avenue, Shanghai, Changtai, Pudong New Area

Applicant before: UNIONPAY ADVISORS COUNSELOR (SHANGHAI) Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant