TWI759562B - 用於識別異常交易社團的方法和裝置 - Google Patents

用於識別異常交易社團的方法和裝置 Download PDF

Info

Publication number
TWI759562B
TWI759562B TW107141049A TW107141049A TWI759562B TW I759562 B TWI759562 B TW I759562B TW 107141049 A TW107141049 A TW 107141049A TW 107141049 A TW107141049 A TW 107141049A TW I759562 B TWI759562 B TW I759562B
Authority
TW
Taiwan
Prior art keywords
transaction
community
node
edge
nodes
Prior art date
Application number
TW107141049A
Other languages
English (en)
Other versions
TW201926204A (zh
Inventor
李旭瑞
鄭建賓
趙金濤
Original Assignee
大陸商中國銀聯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商中國銀聯股份有限公司 filed Critical 大陸商中國銀聯股份有限公司
Publication of TW201926204A publication Critical patent/TW201926204A/zh
Application granted granted Critical
Publication of TWI759562B publication Critical patent/TWI759562B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本發明涉及數據處理技術,特別涉及用於識別異常交易社團方法、實施該方法的裝置以及包含實施該方法的計算機程序的計算機可讀儲存媒體。按照本發明一個方面的用於識別異常交易社團的方法包含下列步驟:構建與多個帳戶相互間的交易事件相關的網路圖,其中,所述網路圖的每個節點代表所述多個帳戶的其中一個,並且以連接兩個節點的邊來指示在與這兩個節點相關聯的帳戶之間發生了交易,其中邊的方向代表交易的方向;從所述網路圖確定為一個或多個社團;以及根據社團的交易信息確定其相應的風險度量,該風險度量用於確定該社團是否屬於異常交易社團。

Description

用於識別異常交易社團的方法和裝置
本發明涉及數據處理技術,特別涉及用於識別異常交易社團方法、實施該方法的裝置以及包含實施該方法的計算機程序的計算機可讀儲存媒體。
諸如洗錢之類的非法資金轉移由於其對國家金融體系安全和經濟秩序穩定帶來的危害,一直是政府監管的重點。隨著電子支付的興起,更加便捷的支付方式在提高交易效率和降低交易成本的同時,也給非法資金轉移提供了可乘之機。 目前主流的反洗錢(AML)系統大多是基於規則的。這類系統的缺點是監管效率較低,並且由於規則很容易被學習掌握,導致監管被規避。此外,規則系統包含較多的主觀因素,難免出現錯誤或者疏漏。再者,由於洗錢之類的資金非法轉移活動往往涉及團夥犯罪,當前的監管系統缺乏全域性的監測能力,從而難以發現大範圍內的洗錢活動。 有鑑於此,迫切需要一種能夠準確、快速地識別異常交易社團的方法和裝置。
本發明的一個目的是提供一種用於識別異常交易社團的方法,其具有處理效率高、識別準確度高等優點。 按照本發明一個方面的用於識別異常交易社團的方法包含下列步驟: 構建與多個帳戶相互間的交易事件相關的網路圖,其中,所述網路圖的每個節點代表所述多個帳戶的其中一個,並且以連接兩個節點的邊來指示在與這兩個節點相關聯的帳戶之間發生了交易,其中邊的方向代表交易的方向; 從所述網路圖確定為一個或多個社團;以及 根據社團的交易信息確定其相應的風險度量,該風險度量用於確定該社團是否屬於異常交易社團。 優選地,在上述方法中,確定社團的步驟包括: 從所述網路圖確定一個或多個連通子圖,其中,每個連通子圖內的任意兩個節點之間是連通的,並且兩個連通子圖之間無相連接的邊;以及 對連通子圖執行社團劃分操作。 優選地,在上述方法中,在執行社團劃分的步驟中,對於任一連通子圖,按照下列方式執行劃分操作: 基於節點權重和交易時序,對該連通子圖中的邊的權重進行修正;以及 以迭代方式對該連通子圖進行社團劃分直到劃分後該連通子圖的模組度不再變化為止,由此完成該連通子圖的社團劃分。 優選地,在上述方法中,節點權重依賴於邊兩端的每個節點的交易金額、交易次數和出入度總數。 優選地,在上述方法中,交易時序依賴於邊兩端的每個節點的資金平均轉入時間和資金平均轉出時間。 優選地,在上述方法中,對於兩個節點之間的邊,其對模組度的貢獻值與邊的方向相關。 優選地,在上述方法中,所述交易信息包括每個社團內的每筆交易的時間、該社團的總交易數量和總交易金額。 優選地,在上述方法中,每個社團的風險度量包括該社團的交易時間熵和整體風險因子。 本發明的還有一個目的是提供一種用於識別異常交易社團的裝置,其具有處理效率高、識別準確度高等優點。 按照本發明另一個方面的用於識別異常交易社團的裝置包含: 第一模組,用於構建與多個帳戶相互間的交易事件相關的網路圖,其中,所述網路圖的每個節點代表所述多個帳戶的其中一個,並且以連接兩個節點的邊來指示在與這兩個節點相關聯的帳戶之間發生了交易,其中邊的方向代表交易的方向; 第二模組,用於從所述網路圖確定為一個或多個社團;以及 第三模組,用於根據社團的交易信息確定其相應的風險度量,該風險度量用於確定該社團是否屬於異常交易社團。 按照本發明另一個方面的用於識別異常交易社團的裝置包含記憶體、處理器以及儲存在所述記憶體上並可在所述處理器上運行的計算機程序以執行如上所述的方法。 本發明的還有一個目的是提供一種計算機可讀儲存媒體,其上儲存計算機程序,該程序被處理器執行時實現如上所述的方法。
下面參照其中圖示了本發明示意性實施例的附圖更為全面地說明本發明。但本發明可以按不同形式來實現,而不應解讀為僅限於本文給出的各實施例。給出的上述各實施例旨在使本文的披露全面完整,以將本發明的保護範圍更為全面地傳達給本領域技術人員。 在本說明書中,諸如“包含”和“包括”之類的用語表示除了具有在說明書和申請專利範圍中有直接和明確表述的單元和步驟以外,本發明的技術方案也不排除具有未被直接或明確表述的其它單元和步驟的情形。 圖1為按照本發明一個實施例的用於識別異常交易社團的方法的流程圖。優選地但非必須地,圖1所示的方法可在雲端服務器或後臺交易處理系統處執行。 圖1所示的方法的流程開始於步驟110。在該步驟中,選取一個時間段Tm 內的多個帳戶之間的交易記錄,並構建刻畫多個帳戶相互間的交易事件的網路圖。該網路圖例如可以按照下列方式構建:網路圖的每個節點代表多個帳戶的其中一個,並且以連接兩個節點的邊來指示在與這兩個節點相關聯的帳戶之間發生了交易。在本實施例中,邊為有向邊,其方向表示交易的方向(例如在一筆交易中,該方向可以定義為從資金的轉出節點指向資金的轉入節點,但是將其定義為從資金的轉入節點指向資金的轉出節點是等價的)。此外,在本實施例中,邊具有權重。示例性地,可以將網路圖中的第i條邊的初始權重WBi 設定為:
Figure 02_image001
這裡
Figure 02_image003
Figure 02_image005
分別代表邊(也即邊兩端節點之間)的總交易金額的標準化值和總交易次數的標準化值,
Figure 02_image007
Figure 02_image009
分別為總交易金額和總交易次數所對應的係數,這兩個係數之和為1。 隨後進入步驟120,從步驟110生成的網路圖確定為一個或多個社團。有關社團確定的具體方式將在下面作詳細的描述。 接著進入步驟130,對於每個社團,根據其交易信息確定相應的風險度量,該風險度量用於確定該社團是否發生異常交易社團。有關確定風險量度的具體方式將在下面作詳細的描述。 圖2為可應用於圖1所示實施例的確定社團方法的流程圖。優選地但非必須地,圖2所示的方法可在雲端服務器或後臺交易處理系統處執行。 如圖2所示,在步驟210,從步驟110生成的網路圖確定一個或多個連通子圖。示例性地,連通子圖的確定過程為,首先濾除網路圖中的孤立節點(也即與其它節點無交易的節點),然後將整個網路圖劃分為一個或多個連通子圖(例如利用連通分量算法),使得在劃分後的每個連通子圖內,任意兩個節點之間是連通的,並且兩個連通子圖之間無相連接的邊。 隨後進入步驟220,從步驟210所確定的連通子圖中選擇一個子集。例如可以按照下列方式挑選該子集中的元素:首先選擇總節點數在中等規模的連通子圖。隨後在這些中等規模的連通子圖內統計轉出金額和/或轉出交易次數(以下又稱為“出度”)或者轉入金額和/或轉入交易次數(以下又稱為“入度”)較大的節點的數量,這些節點統稱為可疑中心節點。最後將這些中等規模的連通子圖內可疑中心節點數量較多的連通子圖選入子集內。 在步驟220中,可以將出度(入度)大於閾值的節點視為可疑中心節點,該閾值的設定方式例如可以是:生成一個連通子圖內的所有節點的出度(入度)的統計分佈圖,並且將統計分佈圖中的曲線轉折點設定為出度(入度)的閾值。在步驟220中,還可以將可疑中心節點數量大於閾值的連通子圖納入子集。 隨後進入步驟230,對子集內尚未進行社團劃分操作的連通子圖執行社團劃分操作。有關社團劃分操作的詳細描述將在下面給出。 接著進入步驟240,確定是否對於子集內的每個連通子圖都實施了社團劃分操作,如果是,則可以進入圖1的步驟130,否則返回步驟230。 需要指出的是,在圖2所示的方法中,步驟210和220是優選的步驟。也就是說,在一個實施方式中,可以直接對網路圖執行如下所述的社團劃分操作,或者對步驟210所確定的連通子圖的每一個執行社團劃分操作。 每一個連通子圖都可以視為一個具有關聯性質的交易群體。然而在這些眾多的群體中,通常僅有一小部分涉及異常交易活動(例如洗錢)。而且一些非法交易活動的執行者還會刻意地將核心異常交易結構隱藏在大量的正常交易中,這進一步增加了異常交易的發現難度。本發明的發明人經過深入研究發現,如果對一個連通子圖直接進行分析或社團劃分操作,很可能出現的結果是雖然用於衡量該連通子圖的異常交易的風險度量較低,然而實際上卻隱藏著大量的異常交易。 針對上述情況,本發明的發明人創造性地引入下列方式來挖掘隱藏的異常交易:基於節點權重和交易時序對連通子圖中的邊的權重進行修正,然後利用為有向圖專門定義的模組度,以迭代方式對邊的權重修正後的連通子圖進行社團劃分,直到劃分後該連通子圖的模組度不再變化為止,由此完成該連通子圖的社團劃分。通過上述方式可以在連通子圖內發現異常交易風險極大的社團或者多個異常交易風險較高的社團,從而大幅度提高異常交易的辨識度,並且還能夠清楚地勾勒出核心的異常交易風險結構。 圖3為可應用於圖2所示實施例的社團劃分算法的流程圖,該算法基於上述方式。圖3所示算法的操作對象為一個連通子圖,但是這僅僅是示例性的,將整個網路圖作為操作對象也是成立的。 圖3所示的流程開始於步驟310。在該步驟中,利用節點權重對一個連通子圖的每條邊的權重進行修正或優化。優選地,可以利用一個節點的交易金額、交易次數、出入度總數等交易信息來計算用於修正邊的權重的節點權重。具體計算方式例如如下式(2)所示:
Figure 02_image011
這裡,
Figure 02_image013
為節點j的節點權重
Figure 02_image015
分別表示該節點j的總交易金額的標準化值、交易次數的標準化值以及出入度總數的標準化值,
Figure 02_image017
為節點j的總交易金額、交易次數以及出入度總數的權重因子(例如每個權重因子可以都取值為1/3)。 對於第i條邊而言,假設它的起始節點或金額轉出節點為
Figure 02_image019
,目的節點或金額轉入節點為
Figure 02_image021
,則利用第i條邊的經節點權重修正後的權重WEi 變為:
Figure 02_image023
這裡,wVi_in 為初始節點的節點權重,wVi_out 為目的節點的節點權重,WBi 為由式(1)確定的第i條邊的初始權重。 對於一個連通子圖內的每條邊,都可以利用上式(2)和(3)來修正其權重,從而得到邊的權重被利用節點權重修正過的連通子圖。 隨後進入步驟320。在該步驟中,對利用節點權重修正後的連通子圖的邊的權重進一步進行交易時序修正或優化。優選地,可以採用下列方式來作進一步的修正。 首先計算每個節點的平均轉入和轉出時間。例如對於連通子圖內的任一節點A,假設有
Figure 02_image025
條邊連入該節點,這
Figure 02_image025
條邊中的第j條邊連入該節點的時間為
Figure 02_image027
,這
Figure 02_image025
條邊中的第j條邊連出該節點的時間為
Figure 02_image029
,則節點A的平均連入時間為:
Figure 02_image031
節點A的平均連出時間為:
Figure 02_image033
隨後確定與交易時序相關的權重修正係數。對於“先分散轉入後集中轉出”的情況(也即首先是多個節點向一個節點轉帳,接著由後者將彙集的金額集中轉出的交易過程),從交易時序上考察,集中轉出的那條邊應該在多次分散轉入的邊之後形成。對於“先集中轉入後分散轉出”的情況(也即首先是一個節點接收一筆款項,然後由該節點將該筆款項向多個節點轉帳,最後多個節點將各自接收的款項轉出的交易過程),從交易時序上考察,集中轉入的那條邊應該在多次分散轉出的邊之前形成。 在本實施例中,對於第i條邊的兩端的節點,根據交易的方向(即節點為交易的轉出節點還是轉入節點)定義不同的權重修正係數以用於基於交易時序的修正。具體而言,對於第i條邊的初始節點src,其對應的權重修正係數q1 按照下式確定:
Figure 02_image035
Figure 02_image037
Figure 02_image039
Figure 02_image041
這裡,
Figure 02_image043
為初始節點src的入度,
Figure 02_image045
為初始節點src的出度,
Figure 02_image047
為初始節點src的平均連入時間,其可由式(4)確定,Tsrc 為初始節點src連出第j條邊的時間,TR 為規範化因子。 由上式(6)-(9)可見,對於滿足條件
Figure 02_image049
Figure 02_image051
的邊,其修正係數
Figure 02_image053
,其他情況下
Figure 02_image055
。 類似地,對於第i條邊的目的節點dst,其對應的權重修正係數q2 按照下式確定:
Figure 02_image057
Figure 02_image059
Figure 02_image061
Figure 02_image063
這裡,
Figure 02_image065
為目的節點dst的出度,
Figure 02_image067
為目的節點dst的入度,
Figure 02_image069
為目的節點dst的平均連入時間,其可由式(5)確定,Tdst 為目的節點dst連入第j條邊的時間,TR 為規範化因子。 由上式(10)-(13)可見,對於滿足條件
Figure 02_image071
Figure 02_image073
的邊,其修正係數
Figure 02_image075
,其他情況下
Figure 02_image077
。 由此,對於第i條邊,其權重可以按照下式進行基於交易時序的修正:
Figure 02_image079
這裡,WEi 為步驟310中確定的第i條邊的利用節點權重進行修正後的權重。 接著進入步驟330,在該步驟中,對經過步驟310和320的權重修正處理後的連通子圖進行社團劃分,從而將每個節點都劃歸到相應的社團內。 如上所述,在本實施例的網路圖中,每條邊為有向邊。對於任意一條有向邊iàj,令
Figure 02_image081
Figure 02_image083
,其中
Figure 02_image085
表示指向節點i的所有邊的權重和,
Figure 02_image087
表示由節點i連出的所有邊的權重和,
Figure 02_image089
表示節點j的所有邊的權重和,
Figure 02_image091
表示節點j的所有邊的權重和。 優選地,在本實施例中可以將模組度QD 定義為:
Figure 02_image093
Figure 02_image095
這裡,如果節點i和節點j屬於同一個社團,則
Figure 02_image097
=1,否則
Figure 02_image097
=0,
Figure 02_image099
為有向網路的鄰接權重矩陣中相應的值,如果存在邊jài,則
Figure 02_image099
等於邊的權重,否則為0,
Figure 02_image101
表示社團C內的邊的權重之和(包括社團內的點和社團外的點相連的邊),m表示所有邊的權重之和,
Figure 02_image103
代表對全部社團的求和,
Figure 02_image105
表示僅對社團C內部矩陣
Figure 02_image107
的所有元素進行求和,
Figure 02_image107
具體表示如下:
Figure 02_image109
在本步驟中,優選地,可以採用與Louvain算法類似的迭代算法,利用上面定義的模組度來完成社團劃分。 圖4為可應用於圖3所示實施例的迭代算法的流程圖。 參見圖4,在步驟410中,首先執行初始化處理,將一個連通子圖中的每個節點劃歸到不同的社團中。 接著進入步驟420。在該步驟中,採用上式(15)定義的模組度,對於連通子圖中的每個節點執行迭代操作。以該連通子圖中的第i個節點為例,首先將節點i分配給它的每個鄰居節點所屬的社團,然後計算分配前與分配後的模組度變化值,從而得到與節點i相關聯的一個或多個模組度變化值。在本實施例中,模組度變化值可以按照下式確定:
Figure 02_image111
Figure 02_image113
其中
Figure 02_image115
表示節點i與社團c內部節點的連邊的權重之和。 在依照上式(18)和(19)得到到與節點i相關聯的一個或多個模組度變化值之後,如果判斷這些模組度變化值中的最大值max
Figure 02_image117
>0,則將節點i分配給與max
Figure 02_image117
對應的那個鄰居節點所屬的社團,否則使節點i保持在原社團不變。 接著進入步驟430。在該步驟中,確定所有節點歸屬社團的狀態在本次執行步驟420前後是否發生變化,如果發生變化,則返回步驟420,否則進入步驟440。 在步驟440,按照下列方式對連通子圖進行壓縮:將屬於同一社團的節點壓縮為一個新節點,社團內節點之間的邊的權重轉化為新節點的環的權重,社團間的邊權重轉化為新節點間的邊權重。 隨後進入步驟450。在該步驟中,依照上式(15)-(17)確定步驟440中生成的壓縮的連通子圖的模組度,並且隨後進入步驟460。 在步驟460,判斷步驟450中確定的模組度與本次執行步驟440之前的連通子圖的模組度之差是否小於預設的閾值,如果是,則進入步驟470,輸出當前處理的連通子圖的社團劃分結果,否則返回步驟420。 圖5為可應用於圖1所示實施例的確定社團的風險量度的方法的流程圖。為闡述方便起見,這裡的描述以確定一個社團k的風險量度的過程為例。 圖5所示的流程開始於步驟510。在該步驟中,確定時間段Tm 期間待確定風險量度的社團的平均交易時間
Figure 02_image119
。優選地,對於該社團在該段時間內的每筆交易,可以以最起始的一筆交易作為時間基準點來確定交易時間。 隨後進入步驟520。對於該社團在該段時間內的每筆交易,確定其交易時間與平均交易時間之差的絕對值
Figure 02_image121
,這裡h為交易的索引號。 接著進入步驟530,根據
Figure 02_image121
的取值將每筆交易歸類到多個區間的相應區間中,並統計每個區間內的交易次數與該社團在時間段Tm 期間的總交易次數的比率。 隨後進入步驟540,依照下式確定用於反映交易時間與異常交易之間相關性的交易時間熵HC
Figure 02_image123
這裡n為區間的總數,Pi 表示第i個區間內的交易筆數與該社團在時間段Tm 期間的總交易筆數的比率。 由式(20)可見,在一個時間段內,如果一個社團內的交易時間熵越小,則表示交易活動的時間越集中,因此交易異常的可能性越大。 接著進入步驟550,確定該社團的整體風險因子。優選地,整體風險因子
Figure 02_image125
可以利用下式確定:
Figure 02_image127
這裡
Figure 02_image129
為社團k內節點的數量的標準化值,
Figure 02_image131
為社團k在時間段Tm 期間的總交易次數的的標準化值,
Figure 02_image133
為社團k在時間段Tm 期間的總交易金額的的標準化值,
Figure 02_image135
為社團k內節點的平均度數的的標準化值,
Figure 02_image137
為社團k在時間段Tm 期間的交易時間熵的標準化值,
Figure 02_image139
為權重值,可根據實際應用設定。 由式(21)計算得到的
Figure 02_image125
越大,則表明交易異常的風險度較大。 可選地但並非必須的,對於一個網路圖或一個連通子圖內的多個社團,可以按照圖5所示方法確定的整體風險因子對它們進行從高到低的排序,其中前5%的社團被評級為I級可疑社團,介於5%~10%的社團被評級為II級可疑社團等。 在上面借助圖1-5所述的實施例中,描述了用於識別一個時間段Tm 內的異常交易社團的方法。上述實施例也可以推廣到多個時間段內異常交易社團的識別中。當需要對較長跨度的時間段內的交易活動進行監測時,考慮到社團可能的變化而將長跨度時間段分割為多個時間段來監測是有利的。 例如可以將一個較長跨度的時間段(例如一個星期、一個月或者半年等)分為n個時間段,然後在每個時間段內,分別採用上面借助圖1-5所述的實施例來識別異常交易社團。考慮到數據量較大,優選地,可以採用下述增量式方法進行社團的劃分。具體而言,在第一個時間段Ti 內完成社團劃分後保留每個節點所對應的社團標簽;隨後,在對下一時間段Ti+1 進行社團劃分時,取該時間段內的所有節點與上一時間段內的所有節點的交集,並且將交集部分的節點所對應的社團標簽作為當前時間段的相關節點的初始標簽,而將那些無社團標簽的節點初始化為自身所屬的社團,然後在此基礎上執行社團劃分操作。這種方式可以大大加快社團劃分操作的收斂速度。 圖6為按照本發明另一個實施例的用於識別異常交易社團的裝置的框圖。 圖6所示的裝置60包含記憶體610、處理器620以及儲存在記憶體610上並可在處理器620上運行的計算機程序630,其中,計算機程序630通過在處理器620上運行以可執行如上借助圖1-3所述實施例的方法。 圖7為按照本發明另一個實施例的用於識別異常交易社團的裝置的框圖。 圖7所示的裝置70包含第一模組710、第二模組720和第三模組730,其中,第一模組710用於構建與多個帳戶相互間的交易事件相關的網路圖,其中,所述網路圖的每個節點代表所述多個帳戶的其中一個,並且以連接兩個節點的邊來指示在與這兩個節點相關聯的帳戶之間發生了交易,其中邊的方向代表交易的方向;第二模組720用於從所述網路圖確定為一個或多個社團;以及第三模組730用於根據社團的交易信息確定其相應的風險度量,該風險度量用於確定該社團是否屬於異常交易社團。 按照本發明的一個方面,提供一種計算機可讀儲存媒體,其上儲存計算機程序,該程序被處理器執行時實現借助圖1-3所述實施例的方法。 與現有技術相比,本發明的上述實施例具有下列優點: 1、不依賴已有案件信息,僅從海量交易中即能主動發現高風險的非法交易團夥。 2、通過創造性地將社團發現算法與動態洗錢模式相結合,形成了對於反洗錢具有特別針對性的時序有向社團發現算法,使得能夠準確地進行洗錢意義上的社團劃分。 3、能夠對社團進行準確的異常交易風險量化評分,依照評分等級劃分形成社團洗錢風險評級,業務人員能夠根據該評級進行更加有目的性的反洗錢工作的開展。 4、通過動態分析多個時間跨度內的交易社團結構隨時間的演化,能夠確定高風險洗錢社團並分析其內在演化規律。 提供本文中提出的實施例和示例,以便最好地說明按照本技術及其特定應用的實施例,並且由此使本領域的技術人員能夠實施和使用本發明。但是,本領域的技術人員將會知道,僅為了便於說明和舉例而提供以上描述和示例。所提出的描述不是意在涵蓋本發明的各個方面或者將本發明局限於所公開的精確形式。 鑒於以上所述,本公開的範圍通過以下申請專利範圍來確定。
110‧‧‧步驟 120‧‧‧步驟 130‧‧‧步驟 210‧‧‧步驟 220‧‧‧步驟 230‧‧‧步驟 310‧‧‧步驟 320‧‧‧步驟 330‧‧‧步驟 410‧‧‧步驟 420‧‧‧步驟 430‧‧‧步驟 440‧‧‧步驟 450‧‧‧步驟 460‧‧‧步驟 470‧‧‧步驟 510‧‧‧步驟 520‧‧‧步驟 530‧‧‧步驟 540‧‧‧步驟 550‧‧‧步驟 610‧‧‧記憶體 620‧‧‧處理器 630‧‧‧計算機程序 710‧‧‧第一模組 720‧‧‧第二模組 730‧‧‧第三模組
本發明的上述和/或其它方面和優點將通過以下結合附圖的各個方面的描述變得更加清晰和更容易理解,附圖中相同或相似的單元採用相同的標號表示。附圖包括: 圖1為按照本發明一個實施例的用於識別異常交易社團的方法的流程圖。 圖2為可應用於圖1所示實施例的確定社團方法的流程圖。 圖3為可應用於圖2所示實施例的社團劃分算法的流程圖。 圖4為可應用於圖3所示實施例的迭代算法的流程圖。 圖5為可應用於圖1所示實施例的確定社團的風險量度的方法的流程圖。 圖6為按照本發明另一個實施例的用於識別異常交易社團的裝置的框圖。 圖7為按照本發明另一個實施例的用於識別異常交易社團的裝置的框圖。

Claims (9)

  1. 一種用於識別異常交易社團的方法,其特徵在於,包含由電腦裝置執行的下列步驟:選取一個時間段內的多個帳戶之間的交易記錄;基於所述交易記錄來構建與多個帳戶相互間的交易事件相關的網路圖,其中,所述網路圖的每個節點代表所述多個帳戶的其中一個,並且以連接兩個節點的邊來指示在與這兩個節點相關聯的帳戶之間發生了交易,其中邊的方向代表交易的方向;從所述網路圖確定為一個或多個社團;以及根據社團的交易信息確定其相應的風險度量,該風險度量用於確定該社團是否屬於異常交易社團;其中,確定社團的步驟包括:從所述網路圖確定一個或多個連通子圖,其中,每個連通子圖內的任意兩個節點之間是連通的,並且兩個連通子圖之間無相連接的邊;以及對連通子圖執行社團劃分操作;其中,在執行社團劃分的步驟中,對於任一連通子圖,按照下列方式執行劃分操作:基於節點權重和交易時序,對該連通子圖中的邊的權重進行修正;以及以迭代方式對該連通子圖進行社團劃分直到劃分後該連通子圖的模組度不再變化為止,由此完成該連通子圖的 社團劃分。
  2. 如請求項1所述的方法,其中,節點權重依賴於邊兩端的每個節點的交易金額、交易次數和出入度總數。
  3. 如請求項1所述的方法,其中,所述交易時序依賴於邊兩端的每個節點的資金平均轉入時間和資金平均轉出時間。
  4. 如請求項1所述的方法,其中,對於兩個節點之間的邊,其對模組度的貢獻值與邊的方向相關。
  5. 如請求項1所述的方法,其中,所述交易信息包括每個社團內的每筆交易的時間、該社團的總交易數量和總交易金額。
  6. 如請求項5所述的方法,其中,每個社團的風險度量包括該社團的交易時間熵和整體風險因子。
  7. 一種用於識別異常交易社團的裝置,包含:第一模組,用於選取一個時間段內的多個帳戶之間的交易記錄;第二模組,用於基於所述交易記錄來構建與多個帳戶相互間的交易事件相關的網路圖,其中,所述網路圖的每 個節點代表所述多個帳戶的其中一個,並且以連接兩個節點的邊來指示在與這兩個節點相關聯的帳戶之間發生了交易,其中邊的方向代表交易的方向;第三模組,用於從所述網路圖確定為一個或多個社團;以及第四模組,用於根據社團的交易信息確定其相應的風險度量,該風險度量用於確定該社團是否屬於異常交易社團;其中,確定社團的步驟包括:從所述網路圖確定一個或多個連通子圖,其中,每個連通子圖內的任意兩個節點之間是連通的,並且兩個連通子圖之間無相連接的邊;以及對連通子圖執行社團劃分操作,其中,在執行社團劃分的步驟中,對於任一連通子圖,按照下列方式執行劃分操作:基於節點權重和交易時序,對該連通子圖中的邊的權重進行修正;以及以迭代方式對該連通子圖進行社團劃分直到劃分後該連通子圖的模組度不再變化為止,由此完成該連通子圖的社團劃分。
  8. 一種用於識別異常交易社團的裝置,包含記憶體、處理器以及儲存在所述記憶體上並可在所述處理器上運行的計算機程序,其特徵在於,通過在所述處理器上運行所述 計算機程序來實現如請求項1-6中任意一項所述的方法。
  9. 一種計算機可讀儲存媒體,其上儲存計算機程序,其特徵在於,該程序被處理器執行時實現如請求項1-6中任意一項所述的方法。
TW107141049A 2017-11-23 2018-11-19 用於識別異常交易社團的方法和裝置 TWI759562B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201711182339.8 2017-11-23
CN201711182339.8 2017-11-23
CN201711182339.8A CN108228706A (zh) 2017-11-23 2017-11-23 用于识别异常交易社团的方法和装置

Publications (2)

Publication Number Publication Date
TW201926204A TW201926204A (zh) 2019-07-01
TWI759562B true TWI759562B (zh) 2022-04-01

Family

ID=62652777

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107141049A TWI759562B (zh) 2017-11-23 2018-11-19 用於識別異常交易社團的方法和裝置

Country Status (3)

Country Link
CN (1) CN108228706A (zh)
TW (1) TWI759562B (zh)
WO (1) WO2019100967A1 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228706A (zh) * 2017-11-23 2018-06-29 中国银联股份有限公司 用于识别异常交易社团的方法和装置
CN109102151B (zh) * 2018-07-03 2021-08-31 创新先进技术有限公司 一种可疑群组识别方法和装置
CN109118053B (zh) * 2018-07-17 2022-04-05 创新先进技术有限公司 一种盗卡风险交易的识别方法和装置
CN109345252A (zh) * 2018-08-24 2019-02-15 阿里巴巴集团控股有限公司 一种线上交易控制方法、装置、及计算机设备
CN109146669A (zh) * 2018-08-24 2019-01-04 阿里巴巴集团控股有限公司 异常资金调度计划的检测方法、装置及服务器
CN109947865B (zh) * 2018-09-05 2023-06-30 中国银联股份有限公司 商户分类方法及商户分类系统
CN109272323B (zh) * 2018-09-14 2022-03-04 创新先进技术有限公司 一种风险交易识别方法、装置、设备及介质
CN111046237B (zh) * 2018-10-10 2024-04-05 京东科技控股股份有限公司 用户行为数据处理方法、装置、电子设备及可读介质
CN109460664B (zh) * 2018-10-23 2022-05-03 北京三快在线科技有限公司 风险分析方法、装置、电子设备及计算机可读介质
CN109598511B (zh) * 2018-11-05 2023-06-20 创新先进技术有限公司 一种账户风险识别方法、装置及设备
CN109615521A (zh) * 2018-12-26 2019-04-12 天翼电子商务有限公司 基于营销反套利模型的反套利识别方法、系统及服务器
CN109872232A (zh) * 2019-01-04 2019-06-11 平安科技(深圳)有限公司 涉及非法所得合法化行为的账户分类方法、装置、计算机设备及存储介质
CN111754342B (zh) * 2019-03-26 2024-05-24 众安信息技术服务有限公司 一种获得区块链加密货币流通速度的方法、系统及装置
CN111951021A (zh) * 2019-05-15 2020-11-17 财付通支付科技有限公司 一种可疑社团的发现方法和装置、存储介质及计算机设备
CN110222297B (zh) * 2019-06-19 2021-07-23 武汉斗鱼网络科技有限公司 一种标签用户的识别方法以及相关设备
CN110490730B (zh) * 2019-08-21 2022-07-26 北京顶象技术有限公司 异常资金聚集行为检测方法、装置、设备及存储介质
CN110544104B (zh) * 2019-09-04 2024-01-23 北京趣拿软件科技有限公司 帐号的确定方法、装置、存储介质及电子装置
CN110705995B (zh) * 2019-10-10 2022-08-30 支付宝(杭州)信息技术有限公司 数据标签化方法和装置
CN110717758B (zh) * 2019-10-10 2021-04-13 支付宝(杭州)信息技术有限公司 异常交易识别方法和装置
CN111177477B (zh) * 2019-12-06 2023-06-20 东软集团股份有限公司 一种可疑群组的确定方法、装置及设备
CN111161063A (zh) * 2019-12-12 2020-05-15 厦门市美亚柏科信息股份有限公司 基于图计算的资金账号识别方法及计算机可读存储介质
CN112990919A (zh) * 2019-12-17 2021-06-18 中国银联股份有限公司 一种信息处理的方法及装置
CN111242763A (zh) * 2020-01-07 2020-06-05 北京明略软件系统有限公司 一种目标用户群的确定方法及装置
CN111340622A (zh) * 2020-02-21 2020-06-26 中国银联股份有限公司 一种异常交易集群的检测方法及装置
CN113313505B (zh) * 2020-02-25 2023-07-25 中国移动通信集团浙江有限公司 异常定位方法、装置及计算设备
CN111401959B (zh) * 2020-03-18 2023-09-29 多点(深圳)数字科技有限公司 风险群体的预测方法、装置、计算机设备及存储介质
CN111476662A (zh) * 2020-04-13 2020-07-31 中国工商银行股份有限公司 反洗钱识别方法及装置
CN111612041B (zh) * 2020-04-24 2023-10-13 平安直通咨询有限公司上海分公司 异常用户识别方法及装置、存储介质、电子设备
CN111612039B (zh) * 2020-04-24 2023-09-29 平安直通咨询有限公司上海分公司 异常用户识别的方法及装置、存储介质、电子设备
CN111770047B (zh) * 2020-05-07 2022-09-23 拉扎斯网络科技(上海)有限公司 异常群体的检测方法、装置及设备
CN111339376B (zh) * 2020-05-15 2020-10-27 支付宝(杭州)信息技术有限公司 用于网络节点聚类的方法以及装置
CN111740977B (zh) * 2020-06-16 2022-06-21 北京奇艺世纪科技有限公司 投票检测方法及装置、电子设备、计算机可读存储介质
CN111652718B (zh) * 2020-07-09 2023-07-28 平安银行股份有限公司 基于关系网络图的价值流向监控方法、装置、设备和介质
CN111831923A (zh) * 2020-07-14 2020-10-27 北京芯盾时代科技有限公司 识别关联的特定账户的方法、装置及存储介质
CN112052404B (zh) * 2020-09-23 2023-08-15 西安交通大学 多源异构关系网络的群体发现方法、系统、设备及介质
CN112381544B (zh) * 2020-11-16 2022-09-02 支付宝(杭州)信息技术有限公司 子图确定方法、装置和电子设备
CN112491900B (zh) * 2020-11-30 2023-04-18 中国银联股份有限公司 异常节点识别方法、装置、设备及介质
CN112989272B (zh) * 2020-12-31 2024-02-27 中科院计算技术研究所大数据研究院 一种基于局部路径的社团发现算法
CN113487427A (zh) * 2021-04-20 2021-10-08 微梦创科网络科技(中国)有限公司 一种交易风险识别方法、装置及系统
CN113393250A (zh) * 2021-06-09 2021-09-14 北京沃东天骏信息技术有限公司 一种信息处理方法及装置、存储介质
CN113554308B (zh) * 2021-07-23 2024-05-28 中信银行股份有限公司 用户社团的划分与风险用户的识别方法、装置及电子设备
CN113837874B (zh) * 2021-11-22 2022-04-12 北京芯盾时代科技有限公司 一种数据的识别方法、装置、存储介质及电子设备
CN115048436A (zh) * 2022-06-01 2022-09-13 优米互动(北京)科技有限公司 基于可视图原理的高维金融时间序列的阶段划分方法
CN116340090A (zh) * 2023-02-09 2023-06-27 中科南京软件技术研究院 基于交互序列的软件识别方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201123055A (en) * 2009-12-31 2011-07-01 Yao-Lang Guo Method of monitoring and evaluating securities trade safety.
TW201528171A (zh) * 2013-12-30 2015-07-16 China Unionpay Co Ltd 監測僞卡風險的方法和實現該方法的交易處理系統
CN105335855A (zh) * 2014-08-06 2016-02-17 阿里巴巴集团控股有限公司 一种交易风险识别方法及装置
TW201734844A (zh) * 2016-02-19 2017-10-01 Alibaba Group Services Ltd 機器學習模型的建模方法及裝置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105988998B (zh) * 2015-01-27 2021-02-26 创新先进技术有限公司 关系网络构建方法及装置
CN105931046A (zh) * 2015-12-16 2016-09-07 中国银联股份有限公司 一种可疑交易节点集合侦测方法及装置
CN108228706A (zh) * 2017-11-23 2018-06-29 中国银联股份有限公司 用于识别异常交易社团的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201123055A (en) * 2009-12-31 2011-07-01 Yao-Lang Guo Method of monitoring and evaluating securities trade safety.
TW201528171A (zh) * 2013-12-30 2015-07-16 China Unionpay Co Ltd 監測僞卡風險的方法和實現該方法的交易處理系統
CN105335855A (zh) * 2014-08-06 2016-02-17 阿里巴巴集团控股有限公司 一种交易风险识别方法及装置
TW201734844A (zh) * 2016-02-19 2017-10-01 Alibaba Group Services Ltd 機器學習模型的建模方法及裝置

Also Published As

Publication number Publication date
WO2019100967A1 (zh) 2019-05-31
TW201926204A (zh) 2019-07-01
CN108228706A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
TWI759562B (zh) 用於識別異常交易社團的方法和裝置
US11087329B2 (en) Method and apparatus of identifying a transaction risk
CN110490730B (zh) 异常资金聚集行为检测方法、装置、设备及存储介质
CN109615128A (zh) 房地产客户成交概率预测方法、装置及服务器
CN106156941A (zh) 一种用户信用评分优化方法和装置
CN108429718A (zh) 账号识别方法及装置
CN112884590A (zh) 基于机器学习算法的电网企业融资决策方法
CN103577455A (zh) 用于数据库聚集操作的数据处理方法和系统
CN106250457A (zh) 大数据平台物化视图的查询处理方法及系统
CN110796539A (zh) 一种征信评估方法及装置
Renigier-Biłozor et al. Optimization of the variables selection in the process of real estate markets rating
CN111178957B (zh) 一种用电客户电量突增预警的方法
CN113112186A (zh) 一种企业评估方法、装置及设备
CN112435034A (zh) 一种基于多网络图聚合的营销套利黑产的识别方法
Wang et al. On characterizing scale effect of Chinese mutual funds via text mining
CN106919712A (zh) 报表的数据统计方法和系统
CN109509019A (zh) 房地产项目经营状况监控应用方法、系统及云应用系统
CN111026816B (zh) 基于知识图谱的高净值客户群识别方法、装置及存储介质
Yan et al. The impact of capital market opening on stock market stability: Based on D-MST method complex network perspective
CN115271939A (zh) 资金链团伙识别方法及装置、计算设备、介质
CN113112357A (zh) 一种针对以太坊平台的交易行为追踪方法及系统
CN109460490B (zh) 社交网络中中心顶点的确定方法、装置、设备及存储介质
CN106503871A (zh) 一种基于多相似股票投票统计的股票近期预测方法
TWM568442U (zh) Golden flow grouping system
CN109919811A (zh) 基于大数据的保险代理人培养方案生成方法及相关设备