TWI728292B

TWI728292B - 可疑洗錢團夥的識別方法和識別裝置

Info

Publication number: TWI728292B
Application number: TW107146921A
Authority: TW
Inventors: 郭亞
Original assignee: 開曼群島商創新先進技術有限公司
Priority date: 2018-02-28
Filing date: 2018-12-25
Publication date: 2021-05-21
Also published as: EP3761253A4; EP3761253A1; WO2019165817A1; US20200394707A1; TW201937437A; CN108280755A

Abstract

本說明書提供一種可疑洗錢團夥的識別方法，包括：基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係；根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵；將滿足黑名單條件的類別標記為洗錢類別，將滿足白名單條件的類別標記為正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，對二分類模型進行訓練；將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型，根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。

Description

可疑洗錢團夥的識別方法和識別裝置

本說明書關於資料處理技術領域，尤其關於一種可疑洗錢團夥的識別方法和識別裝置。

隨著資訊科技的發展，網際網路技術逐漸拓展至金融領域，形成新的業務模式：網際網路金融。網際網路金融拓寬了金融服務的通道、最佳化了資金的配置、降低了交易成本、簡化了交易程式，能夠彌補傳統金融的不足，滿足用戶多樣化的需求。然而，網際網路本身具有的匿名、快速、便捷等特點，也為各種非法行為的實施提供了有利條件，網路洗錢就是其中的一種。近年來，洗錢呈現由傳統支付工具向網際網路金融轉移的趨勢，不法分子利用網路支付工具洗錢已成常態。在這樣的背景下，如何快速有效地防範洗錢風險已成為網際網路金融行業發展極待解決的問題。

有鑑於此，本說明書提供一種可疑洗錢團夥的識別方法，包括：基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係；根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵；將滿足黑名單條件的類別標記為洗錢類別，將滿足白名單條件的類別標記為正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，對二分類模型進行訓練；將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型，根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。本說明書還提供了一種可疑洗錢團夥的識別裝置，包括：資金往來關係單元，用於基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係；類別特徵生成單元，用於根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵；二分類模型訓練單元，用於將滿足黑名單條件的類別標記為洗錢類別，將滿足白名單條件的類別標記為正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，對二分類模型進行訓練；可疑團夥判定單元，用於將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型，根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。本說明書提供的一種電腦設備，包括：記憶體和處理器；所述記憶體上儲存有可由處理器運行的電腦程式；所述處理器運行所述電腦程式時，執行上述可疑洗錢團夥的識別方法所述的步驟。本說明書提供的一種電腦可讀儲存媒體，其上儲存有電腦程式，所述電腦程式被處理器運行時，執行上述可疑洗錢團夥的識別方法所述的步驟。由以上技術方案可見，本說明書的實施例中，採用帳戶間的資金往來關係將帳戶聚類為若干個類別，分別將滿足黑名單條件和白名單條件的類別標記為洗錢類別和正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料訓練二分類模型，利用訓練完成的二分類模型來識別其他類別是否是可疑洗錢團夥；本說明書的實施例能夠採用近期的資金往來記錄，基於從資金往來關係發現的帳戶之間的關聯，快速而準確的識別出高風險的可疑洗錢團夥。

本說明書的實施例提出一種新的可疑洗錢團夥的識別方法，採用帳戶間的資金往來關係來對帳戶進行聚類並提煉出每個類別的類別特徵，以已知的洗錢類別和正常類別的類別特徵作為樣本資料，訓練以類別特徵為輸入的二分類模型，利用訓練完成的二分類模型來發現其他未知類別中的可疑洗錢團夥，從而實現了基於帳戶關係的高風險可疑洗錢團夥識別，相對於基於用戶行為的單一可疑洗錢帳戶識別更為高效，並且由於採用近期資金往來記錄進行模型訓練和識別，對可疑洗錢帳戶的識別更為快速和準確。本說明書的實施例可以運行在任何具有計算和儲存能力的設備上，如手機、平板電腦、PC(Personal Computer，個人電腦)、筆記型電腦、伺服器等設備；還可以由運行在兩個或兩個以上設備的邏輯節點來實現本說明書實施例中的各項功能。本說明書的實施例中，可疑洗錢團夥的識別方法的流程如圖1所示。步驟110，基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係。本說明書的實施例中，網際網路金融服務提供者的系統以用戶採用資金帳戶進行的與資金流動相關的網路行為，來作為識別可疑洗錢團夥的資料基礎。資金帳戶可以是任何用戶能夠用來實現資金流入或流出的帳戶，例如在各種支付平臺註冊的帳戶、簽帳金融卡、信用卡、存摺等。用戶採用資金帳戶進行的各種導致資金流入或流出的每筆操作，會作為一條資金往來記錄被網際網路金融服務提供者的系統保存起來。每條資金往來記錄中包括資金流入帳戶、資金流出帳戶、以及流動的資金量等資訊。在網際網路金融服務提供者的系統的運行過程中，資金往來記錄在持續不斷的產生。可以採用預定統計條件，選擇部分或全部的資金往來記錄用來對可疑洗錢團夥進行識別。可以根據實際應用場景中網際網路金融服務提供者的業務特點、識別的準確程度和時效要求等因素，來確定預定統計條件。例如，可以將在預定時間段(如兩個月)內對某項或某些項具體業務(如轉帳、儲值和提領行為)的資金往來記錄用作識別可疑洗錢團夥的資料；再如，可以將預定時間段內超過某個臨限值的資金往來記錄用作識別可疑洗錢團夥的資料。基於資金往來記錄，可以在各個資金帳戶之間構建出資金往來關係，用來對記錄中的各個資金網路帳戶進行聚類。根據實際應用場景的業務特點、可疑洗錢團夥識別的精確度要求、採用的聚類演算法等因素，來確定構建資金往來關係的具體方式，本說明書的實施例不做限定。以下舉例說明。第一個例子：在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶，即資金流入帳戶和資金流出帳戶之間建立資金往來關係。也即，所有上述記錄中曾經發生資金往來的資金帳戶間都存在資金往來關係。第二個例子：在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係，累計上述記錄中曾經發生資金往來的任意兩個資金帳戶之間的資金往來總量，如果某兩個資金帳戶間的資金往來總量低於預定臨限值，則刪除這兩個資金帳戶間的資金往來關係。未被刪除的資金往來關係將用來對記錄中的資金帳戶採用聚類演算法進行聚類。這個例子中將關注點集中在有大額度資金流量的資金帳戶之間，可以減少資金往來關係的數量，加快聚類演算法的運行速度，並使得聚類結果更為準確。第三個例子：對一些聚類演算法，資金往來關係中的資金流向將對聚類結果產生影響。在這種情況下，兩個資金帳戶A和B之間的資金往來關係包括：由A到B的單向資金關係(即資金由資金帳戶A流向資金帳戶B)、由B到A的單向資金關係、和雙向資金關係(即資金由資金帳戶A流向資金帳戶B，也由資金帳戶B流向資金帳戶A)。可以將已建立的資金往來關係(如第一個例子或第二個例子的結果)，按照兩個資金帳戶間的資金流量標記為單向資金關係或雙向資金關係。第四個例子：在第三個例子中標記單向資金關係或雙向資金關係時，分別累計具有資金往來關係的兩個資金帳戶之間的兩個資金流向的單向總流量，當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時，將這兩個資金帳戶之間的資金往來關係標記為單向資金關係，否則認為這兩個資金帳戶之間為雙向資金關係。預定差異條件可以根據實際應用場景的需要來設定，例如可以是兩個流向的單向總流量之差的絕對值達到或超過某個第一既定值，也可以是較大的單向總流量與較小的單向總流量的比值達到或超過某個第二既定值。步驟120，根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵。所建立的資金往來關係可以描述資金帳戶之間的關聯，以資金帳戶間的為依據，採用聚類演算法可以將這些資金帳戶匯聚為若干個類別，每個類別包括若干個資金帳戶。可以採用任意的無監督聚類演算法來對資金帳戶進行聚類，本說明書的實施例不做限定，如K-Means(K均值)、DBSCAN(Density-Based Spatial Clustering of Applications with Noise，具有雜訊的基於密度的聚類方法)、LPA(Label Propagation Algorithm，標籤傳播演算法)等。對每個類別，可以採用任意的特徵抽取演算法來生成每個類別的類別特徵，本說明書的實施例同樣不做限定，如PCA(Principal Component Analysis，主成分分析)、 Network Motifs(網路模體)方法等。在一種實現方式中，採用由資金往來關係構建的網路圖來進行聚類和特徵抽取。具體而言，以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊，建立資金關係網路圖；按照資金網路關係圖，採用聚類演算法對其中的資金帳戶進行聚類；以屬於每個類別的資金帳戶為節點，以屬於該類別的資金帳戶之間的資金往來關係為邊，構建每個類別的類別子圖；對每個類別子圖分別應用特徵抽取演算法，生成每個類別子圖的特徵向量，作為每個類別的類別特徵。其中，資金網路關係圖可以是有向圖(即由單向資金關係和雙向資金關係構建的資金網路關係圖)，也可以是無向圖(即由不區分資金流向的資金往來關係構建的資金網路關係圖)。步驟130，將滿足黑名單條件的類別標記為洗錢類別，將滿足白名單條件的類別標記為正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，對二分類模型進行訓練。本說明書的實施例中，以類別特徵作為輸入構建二分類模型，二分類模型的輸出為屬於該類別的資金帳戶是可疑洗錢團夥的可能性。二分類模型可以採用任意的二分類機器學習演算法，不做限定。對聚類後得到的各個類別，基於已知的洗錢帳戶(確認有過洗錢行為或經常有洗錢行為的資金帳戶)和正常帳戶(即確認從未有過洗錢行為的資金帳戶)，可以將其中的一部分滿足黑名單條件的類別判定為洗錢類別，另一部分滿足白名單條件的類別判定為正常類別。其中，洗錢類別中的資金帳戶被認為是洗錢團夥，屬於正常類別的資金帳戶被認為是正常帳戶。黑名單條件和白名單條件可以根據實際應用場景的業務特點來設置。以黑名單條件為例，可以將類別中已知的洗錢帳戶超過某個第一數值來作為黑名單條件，可以將類別中已知的洗錢帳戶占比超過某個第二數值來來作為黑名單條件，還可以將類別中已知的洗錢帳戶占比超過某個第三數值同時類別中已知的正常帳戶占比低於某個第四數值來作為黑名單條件。以標記為洗錢類別和正常類別的類別特徵作為樣本資料，來對二分類模型進行訓練。步驟140，將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型，根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。在二分類模型訓練完成後，可以用來判定除洗錢類別和正常類別以外的其他類別(稱之為未知類別)是否為可疑洗錢團夥。具體而言，將某個未知類別的類別特徵輸入訓練完成的二分類模型，當二分類模型的輸出滿足既定的可疑條件(如超過或不足某個值)時，認為該未知類別為可疑洗錢團夥，即該類別中的資金帳戶極有可能被用來進行洗錢。此外，對聚類後得到的各個類別，還可以採用異常檢測演算法，來在所有類別中查找異常類別，如果找出明顯有異的類別，可以將找到的異常類別用於風險網路特徵的發現。風險網路特徵的發現可以採用演算法自動實現，也可以由專家人工實現。具體的異常檢測演算法不做限定，如可以使用iForest(Isolation Forest，孤立森林)演算法。可見，本說明書的實施例中，採用帳戶間的資金往來關係來對帳戶進行聚類並提煉出每個類別的類別特徵，分別將滿足黑名單條件和白名單條件的類別標記為洗錢類別和正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，訓練以類別特徵為輸入的二分類模型，利用訓練完成的二分類模型來識別其他類別是否是可疑洗錢團夥；從而實現了利用近期的資金往來記錄，基於資金帳戶關聯關係的高風險可疑洗錢團夥識別，更為快速、準確和高效。上述對本說明書特定實施例進行了描述。其它實施例在所附申請專利範圍的範圍內。在一些情況下，在申請專利範圍中記載的動作或步驟可以按照不同於實施例中的順序來執行並且仍然可以實現期望的結果。另外，在附圖中描繪的過程不一定要求顯示的特定順序或者連續順序才能實現期望的結果。在某些實施方式中，多工處理和並行處理也是可以的或者可能是有利的。在本說明書的一個應用示例中，第三方支付平臺需要防範用戶藉由轉帳、儲值和提領進行的洗錢犯罪。第三方支付平臺上保存有每個用戶在每筆轉帳、儲值和提領時的資金往來記錄，即由哪個資金帳戶(包括在第三方支付平臺註冊的帳戶、在其他網際網路支付工具上註冊的帳戶、銀行卡、信用卡等)向哪個資金帳戶流入或流出了多少資金量。第三方支付平臺利用資金往來記錄識別可疑洗錢團夥的過程如圖2所示。第三方支付平臺提取最近一個月內在本平臺註冊的所有帳戶的轉帳、儲值和提領交易的資金往來記錄，建立資金帳戶之間的資金往來關係。對兩個在上述時間段內有資金往來的資金帳戶(設為資金帳戶A和資金帳戶B)，統計由資金帳戶A向資金帳戶B流入資金的單向總流量、由資金帳戶B向資金帳戶A流入資金的單向總流量、以及資金帳戶A與B之間的資金往來總量(即兩個流向的單向總流量之和)。當資金往來總量不到2000元人民幣時，認為資金帳戶A與資金帳戶B之間沒有資金往來關係。當資金往來總量達到2000元人民幣時，如果由資金帳戶A向資金帳戶B流入資金的單向總流量與由資金帳戶B向資金帳戶A流入資金的單向總流量的比值達到或超過5，則認為兩個資金帳戶之間為由資金帳戶A向資金帳戶B流入的單向資金關係；如果由資金帳戶A向資金帳戶B流出資金的單向總流量與由資金帳戶B向資金帳戶A流出資金的單向總流量的比值達到或超過5，則認為兩個資金帳戶之間為由資金帳戶A向資金帳戶B流出的單向資金關係；否則認為兩個資金帳戶之間為雙向資金關係。在建立資金帳戶之間的單向或雙向的資金往來關係後，以資金帳戶為節點，資金往來關係為邊，繪製出資金網路關係圖。對資金網路關係圖運行無監督聚類演算法LPA，將所有資金往來記錄中關於的資金帳戶劃分為若干個類別，每個類別以一個GroupID作為標識，每個資金帳戶都對應於一個GroupID。對每個類別，以對應於該類別GroupID的所有資金帳戶為節點，以對應於該類別GroupID的資金帳戶之間的資金往來關係為邊，繪製出該類別的類別子圖。對每一個類別子圖使用Network Motifs方法抽取特徵，抽取後每個類別子圖具有一個特徵向量，來作為該類別的類別特徵。第三方支付平臺上維護有已經被判定為洗錢帳戶的若干個資金帳戶、以及已經被判定為正常帳戶的若干個資金帳戶。對每個類別，查找對應於該類別GroupID的所有資金帳戶中有多少洗錢帳戶和正常帳戶，如果洗錢帳戶占該類別所有資金帳戶的比例超過一半並且正常帳戶占該類別所有資金帳戶的比例不足一成，則將該類別標記為洗錢類別；如果洗錢帳戶占該類別所有資金帳戶的比例不足一成並且正常帳戶占該類別所有資金帳戶的比例超過一半，則將該類別標記為正常類別；否則將該類別標記為未知類別。將正常類別和洗錢類別的特徵向量作為樣本資料，訓練神經網路二分類模型。二分類模型的輸入為特徵向量，輸出為類別是洗錢類別的可能性。在二分類模型訓練完成後，將未知類別的特徵向量輸入該二分類模型，如果二分類模型的輸出超過某個既定臨限值，則將該類別判定為可疑洗錢團夥。另外，對所有類別的特徵向量應用異常檢測演算法Isolation Forest，來找出明顯異常的類別，將檢測出的異常類別提供給專家，輔助專家研究該類別中資金帳戶的特點、資金帳戶間的資金流動的特性、資金帳戶的行為特徵等，進行新的風險網路特徵發現。與上述流程實現對應，本說明書的實施例還提供了一種可疑洗錢團夥的識別裝置。該裝置可以藉由軟體實現，也可以藉由硬體或者軟硬體結合的方式實現。以軟體實現為例，作為邏輯意義上的裝置，是藉由所在設備的CPU(Central Process Unit，中央處理器)將對應的電腦程式指令讀取到內部記憶體中運行形成的。從硬體層面而言，除了圖3所示的CPU、內部記憶體以及記憶體之外，可疑洗錢團夥的識別裝置所在的設備通常還包括用於進行無線訊號收發的晶片等其他硬體，和/或用於實現網路通訊功能的板卡等其他硬體。圖4所示為本說明書實施例提供的一種可疑洗錢團夥的識別裝置，包括資金往來關係單元、類別特徵生成單元、二分類模型訓練單元和可疑團夥判定單元，其中：資金往來關係單元用於基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係；類別特徵生成單元用於根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵；二分類模型訓練單元用於將滿足黑名單條件的類別標記為洗錢類別，將滿足白名單條件的類別標記為正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，對二分類模型進行訓練；可疑團夥判定單元用於將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型，根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。可選的，所述裝置還包括：異常類別發現單元，用於對所有類別採用異常檢測演算法查找其中的異常類別，用於進行風險網路特徵的發現。一個例子中，所述類別特徵生成單元具體用於：以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊，建立資金關係網路圖；採用聚類演算法對資金關係網路中的資金帳戶進行聚類；以屬於每個類別的資金帳戶為節點，以屬於所述類別的資金帳戶之間的資金往來關係為邊，構建每個類別的類別子圖；採用特徵抽取演算法，生成每個類別子圖的特徵向量，作為每個類別的類別特徵。上述例子中，所述特徵抽取演算法包括：網路模體Network Motifs方法；所述聚類演算法包括：標籤傳播演算法LPA、或K均值K-Means演算法。可選的，所述資金往來關係單元具體用於：在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係；累計具有資金往來記錄的任意兩個資金帳戶之間的資金往來總量，當某兩個資金帳戶間的資金往來總量低於預定臨限值時，刪除所述兩個資金帳戶間的資金往來關係。一種實現方式中，所述資金往來關係包括：兩個資金帳戶間的單向資金關係和雙向資金關係。上述實現方式中，所述資金往來關係單元還用於：分別累計具有資金往來關係的任意兩個資金帳戶之間的兩個流向的單向總流量，當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時，認為所述兩個資金帳戶之間為單向資金關係，否則認為所述兩個資金帳戶之間為雙向資金關係。可選的，所述預定統計條件包括：在預定時間段內資金帳戶間的轉帳、儲值和提領行為。本說明書的實施例提供了一種電腦設備，該電腦設備包括記憶體和處理器。其中，記憶體上儲存有能夠由處理器運行的電腦程式；處理器在運行儲存的電腦程式時，執行本說明書實施例中可疑洗錢團夥的識別方法的各個步驟。對可疑洗錢團夥的識別方法的各個步驟的詳細描述請參見之前的內容，不再重複。本說明書的實施例提供了一種電腦可讀儲存媒體，該儲存媒體上儲存有電腦程式，這些電腦程式在被處理器運行時，執行本說明書實施例中可疑洗錢團夥的識別方法的各個步驟。對可疑洗錢團夥的識別方法的各個步驟的詳細描述請參見之前的內容，不再重複。以上所述僅為本說明書的較佳實施例而已，並不用以限制本發明，凡在本發明的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本發明保護的範圍之內。在一個典型的配置中，計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和內部記憶體。內部記憶體可能包括電腦可讀媒體中的非永久性記憶體，隨機存取記憶體(RAM)和/或非揮發性記憶體等形式，如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。內部記憶體是電腦可讀媒體的示例。電腦可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括，但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可抹除可程式設計唯讀記憶體(EEPROM)、快閃記憶體或其他內部記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶，磁帶磁磁片儲存或其他磁性存放裝置或任何其他非傳輸媒體，可用於儲存可以被計算設備存取的資訊。按照本文中的界定，電腦可讀媒體不包括暫存電腦可讀媒體(transitory media)，如調變的資料訊號和載波。還需要說明的是，術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要件的過程、方法、商品或者設備不僅包括那些要件，而且還包括沒有明確列出的其他要件，或者是還包括為這種過程、方法、商品或者設備所固有的要件。在沒有更多限制的情況下，由語句“包括一個……”限定的要件，並不排除在包括所述要件的過程、方法、商品或者設備中還存在另外的相同要件。本領域技術人員應明白，本說明書的實施例可提供為方法、系統或電腦程式產品。因此，本說明書的實施例可採用完全硬體實施例、完全軟體實施例或結合軟體和硬體態樣的實施例的形式。而且，本說明書的實施例可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。

110~140‧‧‧步驟

圖1是本說明書實施例中一種可疑洗錢團夥的識別方法的流程圖；圖2是本說明書應用示例中一種識別可疑洗錢團夥的過程示意圖；圖3是運行本說明書實施例的設備的一種硬體結構圖；圖4是本說明書實施例中一種可疑洗錢團夥的識別裝置的邏輯結構圖。

Claims

一種可疑洗錢團夥的識別方法，包括：藉由資金往來關係單元，基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係；藉由類別特徵生成單元，根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵；藉由二分類模型訓練單元，將滿足黑名單條件的類別標記為洗錢類別，將滿足白名單條件的類別標記為正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，對二分類模型進行訓練；藉由可疑團夥判定單元，將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型，根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥，其中，所述根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵，包括：以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊，建立資金關係網路圖；採用聚類演算法對資金關係網路中的資金帳戶進行聚類；以屬於每個類別的資金帳戶為節點，以屬於所述類別的資金帳戶之間的資金往來關係為邊，構建每個類別的類別子圖；採用特徵抽取演算法，生成每個類別子圖的特徵向量，作為每個類別的類別特徵，其中，所述特徵抽取演算法包括：網路模體Network Motifs方法；其中，所述聚類演算法包括：標籤傳播演算法LPA、或K均值K-Means演算法。
根據申請專利範圍第1項所述的方法，所述方法還包括：對所有類別採用異常檢測演算法查找其中的異常類別，用於進行風險網路特徵的發現。
根據申請專利範圍第1項所述的方法，所述基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係，包括：在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係；累計具有資金往來記錄的任意兩個資金帳戶之間的資金往來總量，當某兩個資金帳戶間的資金往來總量低於預定臨限值時，刪除所述兩個資金帳戶間的資金往來關係。
根據申請專利範圍第1項所述的方法，所述資金往來關係包括：兩個資金帳戶間的單向資金關係和雙向資金關係。
根據申請專利範圍第4項所述的方法，所述基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係，包括：分別累計具有資金往來關係的任意兩個資金帳戶之間的兩個流向的單向總流量，當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時，認為所述兩個資金帳戶之間為單向資金關係，否則認為所述兩個資金帳戶之間為雙向資金關係。
根據申請專利範圍第1項所述的方法，所述預定統計條件包括：在預定時間段內資金帳戶間的轉帳、儲值和提領行為。
一種可疑洗錢團夥的識別裝置，包括：資金往來關係單元，用於基於滿足預定統計條件的資金往來記錄，建立記錄中資金帳戶之間的資金往來關係；類別特徵生成單元，用於根據所建立的資金往來關係，對資金帳戶採用聚類演算法進行聚類，並生成每個類別的類別特徵；二分類模型訓練單元，用於將滿足黑名單條件的類別標記為洗錢類別，將滿足白名單條件的類別標記為正常類別，以洗錢類別和正常類別的類別特徵作為樣本資料，對二分類模型進行訓練；可疑團夥判定單元，用於將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型，根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥，其中，所述類別特徵生成單元具體用於：以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊，建立資金關係網路圖；採用聚類演算法對資金關係網路中的資金帳戶進行聚類；以屬於每個類別的資金帳戶為節點，以屬於所述類別的資金帳戶之間的資金往來關係為邊，構建每個類別的類別子圖；採用特徵抽取演算法，生成每個類別子圖的特徵向量，作為每個類別的類別特徵，其中，所述特徵抽取演算法包括：網路模體Network Motifs方法；其中，所述聚類演算法包括：標籤傳播演算法LPA、或K均值K-Means演算法。
根據申請專利範圍第7項所述的裝置，所述裝置還包括：異常類別發現單元，用於對所有類別採用異常檢測演算法查找其中的異常類別，用於進行風險網路特徵的發現。
根據申請專利範圍第7項所述的裝置，所述資金往來關係單元具體用於：在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係；累計具有資金往來記錄的任意兩個資金帳戶之間的資金往來總量，當某兩個資金帳戶間的資金往來總量低於預定臨限值時，刪除所述兩個資金帳戶間的資金往來關係。
根據申請專利範圍第7項所述的裝置，所述資金往來關係包括：兩個資金帳戶間的單向資金關係和雙向資金關係。
根據申請專利範圍第10項所述的裝置，所述資金往來關係單元還用於：分別累計具有資金往來關係的任意兩個資金帳戶之間的兩個流向的單向總流量，當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時，認為所述兩個資金帳戶之間為單向資金關係，否則認為所述兩個資金帳戶之間為雙向資金關係。
根據申請專利範圍第7項所述的裝置，所述預定統計條件包括：在預定時間段內資金帳戶間的轉帳、儲值和提領行為。
一種電腦設備，包括：記憶體和處理器；所述記憶體上儲存有可由處理器運行的電腦程式；所述處理器運行所述電腦程式時，執行如申請專利範圍第1至6項中任意一項所述的步驟。
一種電腦可讀儲存媒體，其上儲存有電腦程式，所述電腦程式被處理器運行時，執行如申請專利範圍第1至6項中任意一項所述的步驟。