TWI728292B - 可疑洗錢團夥的識別方法和識別裝置 - Google Patents

可疑洗錢團夥的識別方法和識別裝置 Download PDF

Info

Publication number
TWI728292B
TWI728292B TW107146921A TW107146921A TWI728292B TW I728292 B TWI728292 B TW I728292B TW 107146921 A TW107146921 A TW 107146921A TW 107146921 A TW107146921 A TW 107146921A TW I728292 B TWI728292 B TW I728292B
Authority
TW
Taiwan
Prior art keywords
fund
category
accounts
relationship
categories
Prior art date
Application number
TW107146921A
Other languages
English (en)
Other versions
TW201937437A (zh
Inventor
郭亞
Original Assignee
開曼群島商創新先進技術有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 開曼群島商創新先進技術有限公司 filed Critical 開曼群島商創新先進技術有限公司
Publication of TW201937437A publication Critical patent/TW201937437A/zh
Application granted granted Critical
Publication of TWI728292B publication Critical patent/TWI728292B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本說明書提供一種可疑洗錢團夥的識別方法,包括:基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係;根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵;將滿足黑名單條件的類別標記為洗錢類別,將滿足白名單條件的類別標記為正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,對二分類模型進行訓練;將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型,根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。

Description

可疑洗錢團夥的識別方法和識別裝置
本說明書關於資料處理技術領域,尤其關於一種可疑洗錢團夥的識別方法和識別裝置。
隨著資訊科技的發展,網際網路技術逐漸拓展至金融領域,形成新的業務模式:網際網路金融。網際網路金融拓寬了金融服務的通道、最佳化了資金的配置、降低了交易成本、簡化了交易程式,能夠彌補傳統金融的不足,滿足用戶多樣化的需求。 然而,網際網路本身具有的匿名、快速、便捷等特點,也為各種非法行為的實施提供了有利條件,網路洗錢就是其中的一種。近年來,洗錢呈現由傳統支付工具向網際網路金融轉移的趨勢,不法分子利用網路支付工具洗錢已成常態。在這樣的背景下,如何快速有效地防範洗錢風險已成為網際網路金融行業發展極待解決的問題。
有鑑於此,本說明書提供一種可疑洗錢團夥的識別方法,包括: 基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係; 根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵; 將滿足黑名單條件的類別標記為洗錢類別,將滿足白名單條件的類別標記為正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,對二分類模型進行訓練; 將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型,根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。 本說明書還提供了一種可疑洗錢團夥的識別裝置,包括: 資金往來關係單元,用於基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係; 類別特徵生成單元,用於根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵; 二分類模型訓練單元,用於將滿足黑名單條件的類別標記為洗錢類別,將滿足白名單條件的類別標記為正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,對二分類模型進行訓練; 可疑團夥判定單元,用於將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型,根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。 本說明書提供的一種電腦設備,包括:記憶體和處理器;所述記憶體上儲存有可由處理器運行的電腦程式;所述處理器運行所述電腦程式時,執行上述可疑洗錢團夥的識別方法所述的步驟。 本說明書提供的一種電腦可讀儲存媒體,其上儲存有電腦程式,所述電腦程式被處理器運行時,執行上述可疑洗錢團夥的識別方法所述的步驟。 由以上技術方案可見,本說明書的實施例中,採用帳戶間的資金往來關係將帳戶聚類為若干個類別,分別將滿足黑名單條件和白名單條件的類別標記為洗錢類別和正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料訓練二分類模型,利用訓練完成的二分類模型來識別其他類別是否是可疑洗錢團夥;本說明書的實施例能夠採用近期的資金往來記錄,基於從資金往來關係發現的帳戶之間的關聯,快速而準確的識別出高風險的可疑洗錢團夥。
本說明書的實施例提出一種新的可疑洗錢團夥的識別方法,採用帳戶間的資金往來關係來對帳戶進行聚類並提煉出每個類別的類別特徵,以已知的洗錢類別和正常類別的類別特徵作為樣本資料,訓練以類別特徵為輸入的二分類模型,利用訓練完成的二分類模型來發現其他未知類別中的可疑洗錢團夥,從而實現了基於帳戶關係的高風險可疑洗錢團夥識別,相對於基於用戶行為的單一可疑洗錢帳戶識別更為高效,並且由於採用近期資金往來記錄進行模型訓練和識別,對可疑洗錢帳戶的識別更為快速和準確。 本說明書的實施例可以運行在任何具有計算和儲存能力的設備上,如手機、平板電腦、PC(Personal Computer,個人電腦)、筆記型電腦、伺服器等設備;還可以由運行在兩個或兩個以上設備的邏輯節點來實現本說明書實施例中的各項功能。 本說明書的實施例中,可疑洗錢團夥的識別方法的流程如圖1所示。 步驟110,基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係。 本說明書的實施例中,網際網路金融服務提供者的系統以用戶採用資金帳戶進行的與資金流動相關的網路行為,來作為識別可疑洗錢團夥的資料基礎。資金帳戶可以是任何用戶能夠用來實現資金流入或流出的帳戶,例如在各種支付平臺註冊的帳戶、簽帳金融卡、信用卡、存摺等。 用戶採用資金帳戶進行的各種導致資金流入或流出的每筆操作,會作為一條資金往來記錄被網際網路金融服務提供者的系統保存起來。每條資金往來記錄中包括資金流入帳戶、資金流出帳戶、以及流動的資金量等資訊。 在網際網路金融服務提供者的系統的運行過程中,資金往來記錄在持續不斷的產生。可以採用預定統計條件,選擇部分或全部的資金往來記錄用來對可疑洗錢團夥進行識別。可以根據實際應用場景中網際網路金融服務提供者的業務特點、識別的準確程度和時效要求等因素,來確定預定統計條件。例如,可以將在預定時間段(如兩個月)內對某項或某些項具體業務(如轉帳、儲值和提領行為)的資金往來記錄用作識別可疑洗錢團夥的資料;再如,可以將預定時間段內超過某個臨限值的資金往來記錄用作識別可疑洗錢團夥的資料。 基於資金往來記錄,可以在各個資金帳戶之間構建出資金往來關係,用來對記錄中的各個資金網路帳戶進行聚類。 根據實際應用場景的業務特點、可疑洗錢團夥識別的精確度要求、採用的聚類演算法等因素,來確定構建資金往來關係的具體方式,本說明書的實施例不做限定。以下舉例說明。 第一個例子:在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶,即資金流入帳戶和資金流出帳戶之間建立資金往來關係。也即,所有上述記錄中曾經發生資金往來的資金帳戶間都存在資金往來關係。 第二個例子:在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係,累計上述記錄中曾經發生資金往來的任意兩個資金帳戶之間的資金往來總量,如果某兩個資金帳戶間的資金往來總量低於預定臨限值,則刪除這兩個資金帳戶間的資金往來關係。未被刪除的資金往來關係將用來對記錄中的資金帳戶採用聚類演算法進行聚類。這個例子中將關注點集中在有大額度資金流量的資金帳戶之間,可以減少資金往來關係的數量,加快聚類演算法的運行速度,並使得聚類結果更為準確。 第三個例子:對一些聚類演算法,資金往來關係中的資金流向將對聚類結果產生影響。在這種情況下,兩個資金帳戶A和B之間的資金往來關係包括:由A到B的單向資金關係(即資金由資金帳戶A流向資金帳戶B)、由B到A的單向資金關係、和雙向資金關係(即資金由資金帳戶A流向資金帳戶B,也由資金帳戶B流向資金帳戶A)。可以將已建立的資金往來關係(如第一個例子或第二個例子的結果),按照兩個資金帳戶間的資金流量標記為單向資金關係或雙向資金關係。 第四個例子:在第三個例子中標記單向資金關係或雙向資金關係時,分別累計具有資金往來關係的兩個資金帳戶之間的兩個資金流向的單向總流量,當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時,將這兩個資金帳戶之間的資金往來關係標記為單向資金關係,否則認為這兩個資金帳戶之間為雙向資金關係。預定差異條件可以根據實際應用場景的需要來設定,例如可以是兩個流向的單向總流量之差的絕對值達到或超過某個第一既定值,也可以是較大的單向總流量與較小的單向總流量的比值達到或超過某個第二既定值。 步驟120,根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵。 所建立的資金往來關係可以描述資金帳戶之間的關聯,以資金帳戶間的為依據,採用聚類演算法可以將這些資金帳戶匯聚為若干個類別,每個類別包括若干個資金帳戶。可以採用任意的無監督聚類演算法來對資金帳戶進行聚類,本說明書的實施例不做限定,如K-Means(K均值)、DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有雜訊的基於密度的聚類方法)、LPA(Label Propagation Algorithm,標籤傳播演算法)等。 對每個類別,可以採用任意的特徵抽取演算法來生成每個類別的類別特徵,本說明書的實施例同樣不做限定,如PCA(Principal Component Analysis,主成分分析)、 Network Motifs(網路模體)方法等。 在一種實現方式中,採用由資金往來關係構建的網路圖來進行聚類和特徵抽取。具體而言,以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊,建立資金關係網路圖;按照資金網路關係圖,採用聚類演算法對其中的資金帳戶進行聚類;以屬於每個類別的資金帳戶為節點,以屬於該類別的資金帳戶之間的資金往來關係為邊,構建每個類別的類別子圖;對每個類別子圖分別應用特徵抽取演算法,生成每個類別子圖的特徵向量,作為每個類別的類別特徵。其中,資金網路關係圖可以是有向圖(即由單向資金關係和雙向資金關係構建的資金網路關係圖),也可以是無向圖(即由不區分資金流向的資金往來關係構建的資金網路關係圖)。 步驟130,將滿足黑名單條件的類別標記為洗錢類別,將滿足白名單條件的類別標記為正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,對二分類模型進行訓練。 本說明書的實施例中,以類別特徵作為輸入構建二分類模型,二分類模型的輸出為屬於該類別的資金帳戶是可疑洗錢團夥的可能性。二分類模型可以採用任意的二分類機器學習演算法,不做限定。 對聚類後得到的各個類別,基於已知的洗錢帳戶(確認有過洗錢行為或經常有洗錢行為的資金帳戶)和正常帳戶(即確認從未有過洗錢行為的資金帳戶),可以將其中的一部分滿足黑名單條件的類別判定為洗錢類別,另一部分滿足白名單條件的類別判定為正常類別。其中,洗錢類別中的資金帳戶被認為是洗錢團夥,屬於正常類別的資金帳戶被認為是正常帳戶。 黑名單條件和白名單條件可以根據實際應用場景的業務特點來設置。以黑名單條件為例,可以將類別中已知的洗錢帳戶超過某個第一數值來作為黑名單條件,可以將類別中已知的洗錢帳戶占比超過某個第二數值來來作為黑名單條件,還可以將類別中已知的洗錢帳戶占比超過某個第三數值同時類別中已知的正常帳戶占比低於某個第四數值來作為黑名單條件。 以標記為洗錢類別和正常類別的類別特徵作為樣本資料,來對二分類模型進行訓練。 步驟140,將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型,根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。 在二分類模型訓練完成後,可以用來判定除洗錢類別和正常類別以外的其他類別(稱之為未知類別)是否為可疑洗錢團夥。具體而言,將某個未知類別的類別特徵輸入訓練完成的二分類模型,當二分類模型的輸出滿足既定的可疑條件(如超過或不足某個值)時,認為該未知類別為可疑洗錢團夥,即該類別中的資金帳戶極有可能被用來進行洗錢。 此外,對聚類後得到的各個類別,還可以採用異常檢測演算法,來在所有類別中查找異常類別,如果找出明顯有異的類別,可以將找到的異常類別用於風險網路特徵的發現。風險網路特徵的發現可以採用演算法自動實現,也可以由專家人工實現。具體的異常檢測演算法不做限定,如可以使用iForest(Isolation Forest,孤立森林)演算法。 可見,本說明書的實施例中,採用帳戶間的資金往來關係來對帳戶進行聚類並提煉出每個類別的類別特徵,分別將滿足黑名單條件和白名單條件的類別標記為洗錢類別和正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,訓練以類別特徵為輸入的二分類模型,利用訓練完成的二分類模型來識別其他類別是否是可疑洗錢團夥;從而實現了利用近期的資金往來記錄,基於資金帳戶關聯關係的高風險可疑洗錢團夥識別,更為快速、準確和高效。 上述對本說明書特定實施例進行了描述。其它實施例在所附申請專利範圍的範圍內。在一些情況下,在申請專利範圍中記載的動作或步驟可以按照不同於實施例中的順序來執行並且仍然可以實現期望的結果。另外,在附圖中描繪的過程不一定要求顯示的特定順序或者連續順序才能實現期望的結果。在某些實施方式中,多工處理和並行處理也是可以的或者可能是有利的。 在本說明書的一個應用示例中,第三方支付平臺需要防範用戶藉由轉帳、儲值和提領進行的洗錢犯罪。第三方支付平臺上保存有每個用戶在每筆轉帳、儲值和提領時的資金往來記錄,即由哪個資金帳戶(包括在第三方支付平臺註冊的帳戶、在其他網際網路支付工具上註冊的帳戶、銀行卡、信用卡等)向哪個資金帳戶流入或流出了多少資金量。 第三方支付平臺利用資金往來記錄識別可疑洗錢團夥的過程如圖2所示。 第三方支付平臺提取最近一個月內在本平臺註冊的所有帳戶的轉帳、儲值和提領交易的資金往來記錄,建立資金帳戶之間的資金往來關係。對兩個在上述時間段內有資金往來的資金帳戶(設為資金帳戶A和資金帳戶B),統計由資金帳戶A向資金帳戶B流入資金的單向總流量、由資金帳戶B向資金帳戶A流入資金的單向總流量、以及資金帳戶A與B之間的資金往來總量(即兩個流向的單向總流量之和)。當資金往來總量不到2000元人民幣時,認為資金帳戶A與資金帳戶B之間沒有資金往來關係。當資金往來總量達到2000元人民幣時,如果由資金帳戶A向資金帳戶B流入資金的單向總流量與由資金帳戶B向資金帳戶A流入資金的單向總流量的比值達到或超過5,則認為兩個資金帳戶之間為由資金帳戶A向資金帳戶B流入的單向資金關係;如果由資金帳戶A向資金帳戶B流出資金的單向總流量與由資金帳戶B向資金帳戶A流出資金的單向總流量的比值達到或超過5,則認為兩個資金帳戶之間為由資金帳戶A向資金帳戶B流出的單向資金關係;否則認為兩個資金帳戶之間為雙向資金關係。 在建立資金帳戶之間的單向或雙向的資金往來關係後,以資金帳戶為節點,資金往來關係為邊,繪製出資金網路關係圖。對資金網路關係圖運行無監督聚類演算法LPA,將所有資金往來記錄中關於的資金帳戶劃分為若干個類別,每個類別以一個GroupID作為標識,每個資金帳戶都對應於一個GroupID。 對每個類別,以對應於該類別GroupID的所有資金帳戶為節點,以對應於該類別GroupID的資金帳戶之間的資金往來關係為邊,繪製出該類別的類別子圖。對每一個類別子圖使用Network Motifs方法抽取特徵,抽取後每個類別子圖具有一個特徵向量,來作為該類別的類別特徵。 第三方支付平臺上維護有已經被判定為洗錢帳戶的若干個資金帳戶、以及已經被判定為正常帳戶的若干個資金帳戶。對每個類別,查找對應於該類別GroupID的所有資金帳戶中有多少洗錢帳戶和正常帳戶,如果洗錢帳戶占該類別所有資金帳戶的比例超過一半並且正常帳戶占該類別所有資金帳戶的比例不足一成,則將該類別標記為洗錢類別;如果洗錢帳戶占該類別所有資金帳戶的比例不足一成並且正常帳戶占該類別所有資金帳戶的比例超過一半,則將該類別標記為正常類別;否則將該類別標記為未知類別。 將正常類別和洗錢類別的特徵向量作為樣本資料,訓練神經網路二分類模型。二分類模型的輸入為特徵向量,輸出為類別是洗錢類別的可能性。 在二分類模型訓練完成後,將未知類別的特徵向量輸入該二分類模型,如果二分類模型的輸出超過某個既定臨限值,則將該類別判定為可疑洗錢團夥。 另外,對所有類別的特徵向量應用異常檢測演算法Isolation Forest,來找出明顯異常的類別,將檢測出的異常類別提供給專家,輔助專家研究該類別中資金帳戶的特點、資金帳戶間的資金流動的特性、資金帳戶的行為特徵等,進行新的風險網路特徵發現。 與上述流程實現對應,本說明書的實施例還提供了一種可疑洗錢團夥的識別裝置。該裝置可以藉由軟體實現,也可以藉由硬體或者軟硬體結合的方式實現。以軟體實現為例,作為邏輯意義上的裝置,是藉由所在設備的CPU(Central Process Unit,中央處理器)將對應的電腦程式指令讀取到內部記憶體中運行形成的。從硬體層面而言,除了圖3所示的CPU、內部記憶體以及記憶體之外,可疑洗錢團夥的識別裝置所在的設備通常還包括用於進行無線訊號收發的晶片等其他硬體,和/或用於實現網路通訊功能的板卡等其他硬體。 圖4所示為本說明書實施例提供的一種可疑洗錢團夥的識別裝置,包括資金往來關係單元、類別特徵生成單元、二分類模型訓練單元和可疑團夥判定單元,其中:資金往來關係單元用於基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係;類別特徵生成單元用於根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵;二分類模型訓練單元用於將滿足黑名單條件的類別標記為洗錢類別,將滿足白名單條件的類別標記為正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,對二分類模型進行訓練;可疑團夥判定單元用於將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型,根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥。 可選的,所述裝置還包括:異常類別發現單元,用於對所有類別採用異常檢測演算法查找其中的異常類別,用於進行風險網路特徵的發現。 一個例子中,所述類別特徵生成單元具體用於:以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊,建立資金關係網路圖;採用聚類演算法對資金關係網路中的資金帳戶進行聚類;以屬於每個類別的資金帳戶為節點,以屬於所述類別的資金帳戶之間的資金往來關係為邊,構建每個類別的類別子圖;採用特徵抽取演算法,生成每個類別子圖的特徵向量,作為每個類別的類別特徵。 上述例子中,所述特徵抽取演算法包括:網路模體Network Motifs方法;所述聚類演算法包括:標籤傳播演算法LPA、或K均值K-Means演算法。 可選的,所述資金往來關係單元具體用於:在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係;累計具有資金往來記錄的任意兩個資金帳戶之間的資金往來總量,當某兩個資金帳戶間的資金往來總量低於預定臨限值時,刪除所述兩個資金帳戶間的資金往來關係。 一種實現方式中,所述資金往來關係包括:兩個資金帳戶間的單向資金關係和雙向資金關係。 上述實現方式中,所述資金往來關係單元還用於:分別累計具有資金往來關係的任意兩個資金帳戶之間的兩個流向的單向總流量,當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時,認為所述兩個資金帳戶之間為單向資金關係,否則認為所述兩個資金帳戶之間為雙向資金關係。 可選的,所述預定統計條件包括:在預定時間段內資金帳戶間的轉帳、儲值和提領行為。 本說明書的實施例提供了一種電腦設備,該電腦設備包括記憶體和處理器。其中,記憶體上儲存有能夠由處理器運行的電腦程式;處理器在運行儲存的電腦程式時,執行本說明書實施例中可疑洗錢團夥的識別方法的各個步驟。對可疑洗錢團夥的識別方法的各個步驟的詳細描述請參見之前的內容,不再重複。 本說明書的實施例提供了一種電腦可讀儲存媒體,該儲存媒體上儲存有電腦程式,這些電腦程式在被處理器運行時,執行本說明書實施例中可疑洗錢團夥的識別方法的各個步驟。對可疑洗錢團夥的識別方法的各個步驟的詳細描述請參見之前的內容,不再重複。 以上所述僅為本說明書的較佳實施例而已,並不用以限制本發明,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明保護的範圍之內。 在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和內部記憶體。 內部記憶體可能包括電腦可讀媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非揮發性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。內部記憶體是電腦可讀媒體的示例。 電腦可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可抹除可程式設計唯讀記憶體(EEPROM)、快閃記憶體或其他內部記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁片儲存或其他磁性存放裝置或任何其他非傳輸媒體,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,電腦可讀媒體不包括暫存電腦可讀媒體(transitory media),如調變的資料訊號和載波。 還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要件的過程、方法、商品或者設備不僅包括那些要件,而且還包括沒有明確列出的其他要件,或者是還包括為這種過程、方法、商品或者設備所固有的要件。在沒有更多限制的情況下,由語句“包括一個……”限定的要件,並不排除在包括所述要件的過程、方法、商品或者設備中還存在另外的相同要件。 本領域技術人員應明白,本說明書的實施例可提供為方法、系統或電腦程式產品。因此,本說明書的實施例可採用完全硬體實施例、完全軟體實施例或結合軟體和硬體態樣的實施例的形式。而且,本說明書的實施例可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
110~140‧‧‧步驟
圖1是本說明書實施例中一種可疑洗錢團夥的識別方法的流程圖; 圖2是本說明書應用示例中一種識別可疑洗錢團夥的過程示意圖; 圖3是運行本說明書實施例的設備的一種硬體結構圖; 圖4是本說明書實施例中一種可疑洗錢團夥的識別裝置的邏輯結構圖。

Claims (14)

  1. 一種可疑洗錢團夥的識別方法,包括:藉由資金往來關係單元,基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係;藉由類別特徵生成單元,根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵;藉由二分類模型訓練單元,將滿足黑名單條件的類別標記為洗錢類別,將滿足白名單條件的類別標記為正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,對二分類模型進行訓練;藉由可疑團夥判定單元,將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型,根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團夥,其中,所述根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵,包括:以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊,建立資金關係網路圖;採用聚類演算法對資金關係網路中的資金帳戶進行聚類;以屬於每個類別的資金帳戶為節點,以屬於所述類別的資金帳戶之間的資金往來關係為邊,構建每個類別的類 別子圖;採用特徵抽取演算法,生成每個類別子圖的特徵向量,作為每個類別的類別特徵,其中,所述特徵抽取演算法包括:網路模體Network Motifs方法;其中,所述聚類演算法包括:標籤傳播演算法LPA、或K均值K-Means演算法。
  2. 根據申請專利範圍第1項所述的方法,所述方法還包括:對所有類別採用異常檢測演算法查找其中的異常類別,用於進行風險網路特徵的發現。
  3. 根據申請專利範圍第1項所述的方法,所述基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係,包括:在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係;累計具有資金往來記錄的任意兩個資金帳戶之間的資金往來總量,當某兩個資金帳戶間的資金往來總量低於預定臨限值時,刪除所述兩個資金帳戶間的資金往來關係。
  4. 根據申請專利範圍第1項所述的方法,所述資金往來關係包括:兩個資金帳戶間的單向資金關係和雙向資金關係。
  5. 根據申請專利範圍第4項所述的方法,所述基於滿足 預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係,包括:分別累計具有資金往來關係的任意兩個資金帳戶之間的兩個流向的單向總流量,當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時,認為所述兩個資金帳戶之間為單向資金關係,否則認為所述兩個資金帳戶之間為雙向資金關係。
  6. 根據申請專利範圍第1項所述的方法,所述預定統計條件包括:在預定時間段內資金帳戶間的轉帳、儲值和提領行為。
  7. 一種可疑洗錢團夥的識別裝置,包括:資金往來關係單元,用於基於滿足預定統計條件的資金往來記錄,建立記錄中資金帳戶之間的資金往來關係;類別特徵生成單元,用於根據所建立的資金往來關係,對資金帳戶採用聚類演算法進行聚類,並生成每個類別的類別特徵;二分類模型訓練單元,用於將滿足黑名單條件的類別標記為洗錢類別,將滿足白名單條件的類別標記為正常類別,以洗錢類別和正常類別的類別特徵作為樣本資料,對二分類模型進行訓練;可疑團夥判定單元,用於將除洗錢類別和正常類別以外的其他類別的類別特徵輸入訓練完成的二分類模型,根據二分類模型的輸出判斷所述其他類別是否為可疑洗錢團 夥,其中,所述類別特徵生成單元具體用於:以滿足預定統計條件的資金往來記錄中的資金帳戶為節點、以所建立的資金往來關係為邊,建立資金關係網路圖;採用聚類演算法對資金關係網路中的資金帳戶進行聚類;以屬於每個類別的資金帳戶為節點,以屬於所述類別的資金帳戶之間的資金往來關係為邊,構建每個類別的類別子圖;採用特徵抽取演算法,生成每個類別子圖的特徵向量,作為每個類別的類別特徵,其中,所述特徵抽取演算法包括:網路模體Network Motifs方法;其中,所述聚類演算法包括:標籤傳播演算法LPA、或K均值K-Means演算法。
  8. 根據申請專利範圍第7項所述的裝置,所述裝置還包括:異常類別發現單元,用於對所有類別採用異常檢測演算法查找其中的異常類別,用於進行風險網路特徵的發現。
  9. 根據申請專利範圍第7項所述的裝置,所述資金往來關係單元具體用於:在滿足預定統計條件的資金往來記錄中每條記錄的兩個資金帳戶之間建立資金往來關係;累計具有資金往來記錄的任意兩個資金帳戶之間的資金往來總量,當某兩個資金帳戶間的資金往來總量低於預定臨限值 時,刪除所述兩個資金帳戶間的資金往來關係。
  10. 根據申請專利範圍第7項所述的裝置,所述資金往來關係包括:兩個資金帳戶間的單向資金關係和雙向資金關係。
  11. 根據申請專利範圍第10項所述的裝置,所述資金往來關係單元還用於:分別累計具有資金往來關係的任意兩個資金帳戶之間的兩個流向的單向總流量,當兩個資金帳戶之間兩個流向的單向總流量滿足預定差異條件時,認為所述兩個資金帳戶之間為單向資金關係,否則認為所述兩個資金帳戶之間為雙向資金關係。
  12. 根據申請專利範圍第7項所述的裝置,所述預定統計條件包括:在預定時間段內資金帳戶間的轉帳、儲值和提領行為。
  13. 一種電腦設備,包括:記憶體和處理器;所述記憶體上儲存有可由處理器運行的電腦程式;所述處理器運行所述電腦程式時,執行如申請專利範圍第1至6項中任意一項所述的步驟。
  14. 一種電腦可讀儲存媒體,其上儲存有電腦程式,所述電腦程式被處理器運行時,執行如申請專利範圍第1至6項 中任意一項所述的步驟。
TW107146921A 2018-02-28 2018-12-25 可疑洗錢團夥的識別方法和識別裝置 TWI728292B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810164789.2A CN108280755A (zh) 2018-02-28 2018-02-28 可疑洗钱团伙的识别方法和识别装置
CN201810164789.2 2018-02-28
??201810164789.2 2018-02-28

Publications (2)

Publication Number Publication Date
TW201937437A TW201937437A (zh) 2019-09-16
TWI728292B true TWI728292B (zh) 2021-05-21

Family

ID=62808847

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107146921A TWI728292B (zh) 2018-02-28 2018-12-25 可疑洗錢團夥的識別方法和識別裝置

Country Status (5)

Country Link
US (1) US20200394707A1 (zh)
EP (1) EP3761253A4 (zh)
CN (1) CN108280755A (zh)
TW (1) TWI728292B (zh)
WO (1) WO2019165817A1 (zh)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109936525B (zh) * 2017-12-15 2020-07-31 阿里巴巴集团控股有限公司 一种基于图结构模型的异常账号防控方法、装置以及设备
CN108280755A (zh) * 2018-02-28 2018-07-13 阿里巴巴集团控股有限公司 可疑洗钱团伙的识别方法和识别装置
US11238368B2 (en) * 2018-07-02 2022-02-01 Paypal, Inc. Machine learning and security classification of user accounts
CN109146669A (zh) * 2018-08-24 2019-01-04 阿里巴巴集团控股有限公司 异常资金调度计划的检测方法、装置及服务器
CN109242515B (zh) * 2018-08-29 2021-07-23 创新先进技术有限公司 跨平台的异常账号识别方法和装置
CN109345375B (zh) * 2018-09-27 2022-02-01 中国银行股份有限公司 一种可疑洗钱行为识别方法及装置
CN109389501A (zh) * 2018-09-29 2019-02-26 智器云南京信息科技有限公司 一种计算设备、计算系统
CN109145050B (zh) * 2018-09-29 2022-04-01 智器云南京信息科技有限公司 一种计算设备
CN109377339B (zh) * 2018-10-22 2021-01-05 中信网络科技股份有限公司 一种可疑交易案例的辅助甄别方法及系统
CN109461078B (zh) * 2018-10-22 2020-09-11 中信网络科技股份有限公司 一种基于资金交易网络的异常交易识别方法及系统
CN113348480A (zh) * 2018-11-14 2021-09-03 思睿人工智能公司 用于反洗钱分析的系统和方法
CN110046634B (zh) * 2018-12-04 2021-04-27 创新先进技术有限公司 聚类结果的解释方法和装置
CN110046993A (zh) * 2018-12-15 2019-07-23 深圳壹账通智能科技有限公司 非法所得合法化行为监测方法、系统、计算机装置及介质
CN109741173B (zh) * 2018-12-27 2022-11-29 深圳前海微众银行股份有限公司 可疑洗钱团伙的识别方法、装置、设备及计算机存储介质
CN109872232A (zh) * 2019-01-04 2019-06-11 平安科技(深圳)有限公司 涉及非法所得合法化行为的账户分类方法、装置、计算机设备及存储介质
CN109615524B (zh) * 2019-01-08 2024-04-26 平安科技(深圳)有限公司 洗钱犯罪团伙的识别方法、装置、计算机设备及存储介质
CN109948704A (zh) * 2019-03-20 2019-06-28 中国银联股份有限公司 一种交易监测方法与装置
CN110263227B (zh) * 2019-05-15 2023-07-18 创新先进技术有限公司 基于图神经网络的团伙发现方法和系统
CN112241820B (zh) * 2019-07-16 2023-11-14 中国移动通信集团浙江有限公司 资金流动中关键节点的风险识别方法、装置及计算设备
CN110399564B (zh) * 2019-07-23 2022-03-25 腾讯科技(深圳)有限公司 帐号分类方法和装置、存储介质及电子装置
CN110472050A (zh) * 2019-07-24 2019-11-19 阿里巴巴集团控股有限公司 一种团伙聚类方法和装置
US20210124780A1 (en) * 2019-10-28 2021-04-29 Feedzai - Consultadoria e Inovação Tecnólogica, S.A. Graph search and visualization for fraudulent transaction analysis
CN111047426A (zh) * 2019-11-26 2020-04-21 智器云南京信息科技有限公司 一种基于资金交易的可疑账户分析方法、系统及存储介质
CN111144577B (zh) * 2019-12-26 2022-04-22 北京百度网讯科技有限公司 异构图之中节点表示的生成方法、装置和电子设备
CN111145027A (zh) * 2019-12-31 2020-05-12 众安信息技术服务有限公司 一种疑似洗钱交易识别方法及装置
IT202000001681A1 (it) * 2020-01-29 2021-07-29 Univ Degli Studi Padova Sistema e metodo per la determinazione dell’affidabilita’ delle societa’ di capitali
CN111353600B (zh) * 2020-02-20 2023-12-12 第四范式(北京)技术有限公司 一种异常行为检测方法及装置
US11328301B2 (en) * 2020-03-22 2022-05-10 Actimize Ltd. Online incremental machine learning clustering in anti-money laundering detection
US20210390629A1 (en) * 2020-06-16 2021-12-16 Amadeus S.A.S. Expense fraud detection
CN111768305A (zh) * 2020-06-24 2020-10-13 中国工商银行股份有限公司 反洗钱识别方法及装置
CN112241760A (zh) * 2020-08-25 2021-01-19 浙江大学 网络小额贷款服务中的黑中介自动挖掘方法与系统
US20220101341A1 (en) * 2020-09-30 2022-03-31 International Business Machines Corporation Entity information enrichment for company determinations
CN112463893A (zh) * 2020-11-13 2021-03-09 中科金审(北京)科技有限公司 一种网络资金的智能分析系统及方法
CN112561703B (zh) * 2020-12-23 2022-10-25 支付宝(杭州)信息技术有限公司 基于异步网络刻画和实时特征提取的局部关系网络的刻画方法、系统
CN112819175A (zh) * 2021-01-14 2021-05-18 中博信征信有限公司 非法所得合法化账户识别方法、装置、设备及存储介质
CN112884478B (zh) * 2021-01-26 2023-05-23 支付宝(中国)网络技术有限公司 一种数据处理方法、装置及设备
CN113592499B (zh) * 2021-01-29 2023-08-25 微梦创科网络科技(中国)有限公司 一种互联网洗钱对抗的方法及装置
CN112785476B (zh) * 2021-02-01 2024-05-14 浙江大华系统工程有限公司 一种用户行为识别方法及装置
CN112989135B (zh) * 2021-04-15 2023-03-24 杭州网易再顾科技有限公司 实时风险团伙的识别方法、介质、装置和计算设备
CN113590597B (zh) * 2021-07-16 2024-03-29 成都无糖信息技术有限公司 网络异常行为重点人员分析层级划分的识别方法及设备
GB2609912A (en) * 2021-08-11 2023-02-22 Vocalink Ltd Method apparatus and computer program product for constructing a set of motifs for use in detecting messages of interest
CN113706154A (zh) * 2021-08-12 2021-11-26 支付宝(杭州)信息技术有限公司 一种交易风险的检测方法、装置及设备
CN113869904B (zh) * 2021-08-16 2022-09-20 工银科技有限公司 可疑数据识别方法、装置、电子设备、介质和计算机程序
CN114066173A (zh) * 2021-10-26 2022-02-18 福建正孚软件有限公司 资金流动行为分析方法及存储介质
US20230252469A1 (en) * 2022-02-07 2023-08-10 Paypal, Inc. Graph transformation based on directed edges
US20230252491A1 (en) * 2022-02-07 2023-08-10 Paypal, Inc. Using multi-dimensional random walk traversal to detect patterns in graphs
CN114564525B (zh) * 2022-04-28 2022-07-29 支付宝(杭州)信息技术有限公司 基于用户交易数据挖掘用户意图的方法和装置
US11868865B1 (en) * 2022-11-10 2024-01-09 Fifth Third Bank Systems and methods for cash structuring activity monitoring
CN115689761B (zh) * 2023-01-03 2023-03-21 华侨大学 一种电子商务流向路径多线程并行检测方法及设备
CN116227940B (zh) * 2023-05-04 2023-07-25 深圳市迪博企业风险管理技术有限公司 一种基于资金流向图的企业资金流异常检测方法
CN116596665B (zh) * 2023-07-19 2023-10-20 建信金融科技有限责任公司 数据处理方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201642189A (zh) * 2015-03-26 2016-12-01 智慧通訊公司 用以便利匯款之系統及方法
CN106326913A (zh) * 2016-08-09 2017-01-11 中国银联股份有限公司 一种洗钱账户的确定方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030105707A1 (en) * 2001-11-30 2003-06-05 Yves Audebert Financial risk management system and method
US8726379B1 (en) * 2011-07-15 2014-05-13 Norse Corporation Systems and methods for dynamic protection from electronic attacks
US9116975B2 (en) * 2013-10-18 2015-08-25 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive simultaneous querying of multiple data stores
CN103886344B (zh) * 2014-04-14 2017-07-07 西安科技大学 一种图像型火灾火焰识别方法
CN105809448B (zh) * 2014-12-30 2020-07-31 阿里巴巴集团控股有限公司 账户交易的聚类方法及其系统
CN106156795A (zh) * 2016-07-05 2016-11-23 中国银联股份有限公司 一种可疑洗钱账户的确定方法及装置
US10515095B2 (en) * 2016-10-05 2019-12-24 International Business Machines Corporation Detecting clusters and relationships in large data sets
CN108280755A (zh) * 2018-02-28 2018-07-13 阿里巴巴集团控股有限公司 可疑洗钱团伙的识别方法和识别装置
US11620665B2 (en) * 2020-04-01 2023-04-04 Intuit Inc. Methods and systems using and constructing merchant communities based on financial transaction data
US20220198471A1 (en) * 2020-12-18 2022-06-23 Feedzai - Consultadoria E Inovação Tecnológica, S.A. Graph traversal for measurement of fraudulent nodes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201642189A (zh) * 2015-03-26 2016-12-01 智慧通訊公司 用以便利匯款之系統及方法
CN106326913A (zh) * 2016-08-09 2017-01-11 中国银联股份有限公司 一种洗钱账户的确定方法及装置

Also Published As

Publication number Publication date
EP3761253A4 (en) 2021-12-15
EP3761253A1 (en) 2021-01-06
WO2019165817A1 (zh) 2019-09-06
US20200394707A1 (en) 2020-12-17
TW201937437A (zh) 2019-09-16
CN108280755A (zh) 2018-07-13

Similar Documents

Publication Publication Date Title
TWI728292B (zh) 可疑洗錢團夥的識別方法和識別裝置
Ahmed et al. A survey of anomaly detection techniques in financial domain
CN109063966B (zh) 风险账户的识别方法和装置
TWI673666B (zh) 資料風險控制的方法及裝置
CN107679856B (zh) 基于交易的业务控制方法和装置
Hajek et al. Fraud detection in mobile payment systems using an XGBoost-based framework
US11379845B2 (en) Method and device for identifying a risk merchant
CN111932130A (zh) 业务类型识别方法及装置
US20230281479A1 (en) Object recognition method and apparatus, electronic device and storage medium
Widder et al. Identification of suspicious, unknown event patterns in an event cloud
CN113506113B (zh) 一种基于关联网络的信用卡套现团伙挖掘方法及系统
Deepa et al. Survey paper for credit card fraud detection using data mining techniques
Mohamed et al. Blockchain for tracking serial numbers in money exchanges
CN109597851B (zh) 基于关联关系的特征提取方法和装置
Sharma et al. Credit card fraud detection using machine learning algorithms
Kang Fraud Detection in Mobile Money Transactions Using Machine Learning
US11544715B2 (en) Self learning machine learning transaction scores adjustment via normalization thereof accounting for underlying transaction score bases
US20240127252A1 (en) Risk insights utility for traditional finance and decentralized finance
Vartak et al. Hidden Markov Model for credit card fraud detection
EP4310755A1 (en) Self learning machine learning transaction scores adjustment via normalization thereof
Subramanian et al. A way to explore SMS: Social Media Scams for a secure Digi-world
Jebaraj et al. An Overview of Clustering Algorithms for Credit Card Fraud Detection
GAJULA AN ADAPTIVE FRAMEWORK TO PREVENT FAKE NEWS IN SOCIAL NETWORKS USING BLOCKCHAIN TECHNOLOGY
CN114358101A (zh) 基于交易对手匹配的虚拟货币交易所名称识别方法和装置
Holubová et al. Advanced Behavioral Analyses Using Inferred Social Networks: A Vision