TW202326537A

TW202326537A - 反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質

Info

Publication number: TW202326537A
Application number: TW111137564A
Authority: TW
Inventors: 駱浩楠; 龔妙嵐; 李嘉; 周凱; 章文康
Original assignee: 大陸商中國銀聯股份有限公司
Priority date: 2021-12-29
Filing date: 2022-10-03
Publication date: 2023-07-01
Also published as: CN114298417A; WO2023124204A1

Abstract

本發明提供了反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質，該訓練方法包括：獲取訓練樣本集，訓練樣本包括多維特徵及其欺詐標籤，多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；其中，在每輪反覆運算中，反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量，將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量，將編碼向量輸入深度網路以得到風險預測結果，以及，利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。利用上述方法，能夠獲得更好的反欺詐風險評估效果。

Description

反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質

本發明屬於反欺詐領域，具體涉及一種反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質。

本部分旨在為申請專利範圍中陳述的本發明的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。

隨著電信網路的發展，即時通訊和資金交易愈加方便，同時也為欺詐分子提供可乘之機。基於案前用戶防範欺詐意識薄弱、案後追查難度大的現狀，在交易側進行防範顯得尤為重要。

然而目前，仍然面臨對欺詐交易的識別滯後且準確度不高的情況。

針對上述現有技術中存在的問題，提出了一種反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質，利用這種方法、裝置及電腦可讀存儲介質，能夠解決上述問題。

本發明提供了以下方案。

第一方面，提供一種反欺詐風險評估模型的訓練方法，包括：獲取訓練樣本集，訓練樣本包括多維特徵及其欺詐標籤，多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；其中，在每輪反覆運算中，反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量，將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量，將編碼向量輸入深度網路以得到風險預測結果，以及，利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。

在一種實施方式中，採用Transformer編碼器作為特徵學習網路，Transformer編碼器包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層。

在一種實施方式中，還包括：獲取設備風險APP的使用時序資訊，基於使用時序獲取使用者設備使用的每個風險APP和當前資金類APP的使用相關性；利用Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼，得到時序向量，將時序向量結合每個風險APP對應的使用相關性得到時序強度向量；將時序強度向量和設備風險APP特徵對應的輸入向量結合，並輸入自注意力層。

在一種實施方式中，利用Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼，還包括：其中，利用如下公式定義時序編碼規則：；；其中，為時序的時序編碼向量的第維，為時序的時序編碼向量的第維，是時序編碼向量的維度。

在一種實施方式中，方法還包括：獲取全域風險APP，並利用每個風險APP的屬性資訊獲取關聯和/或相似的其他APP以擴充全域風險APP；屬性資訊包括以下中的一種或多種：開發者資訊、名稱資訊、APP介紹信息。在一種實施方式中，獲取訓練資料集，還包括：通過埋點方式收集使用者交易行為資訊，使用者交易行為資料包括：交易地點IP、交易對手方資訊；週期性收集使用者設備的APP使用資訊，根據全域風險APP確定使用者設備使用的風險APP，得到設備風險APP特徵。

在一種實施方式中，多維特徵還包括：文本特徵，文本特徵包括交易留言資訊。

在一種實施方式中，深度網路採用機器學習中的隨機森林或XGB。在一種實施方式中，損失函數中設有交易金額權重因數。

第二方法，提供一種反欺詐風險評估方法，包括：獲取即時交易資訊，即時交易資訊包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；將即時交易資訊輸入反欺詐風險評估模型，反欺詐風險評估模型對輸入的即時交易資訊執行嵌入處理以得到輸入向量，將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量，將編碼向量輸入深度網路以得到風險預測結果；其中，反欺詐風險評估模型利用如第一方面的方法訓練得到。

在一種實施方式中，還包括：如風險預測結果符合預設條件，則基於即時交易資訊進行對應的干擾處理和/或告警處理。

在一種實施方式中，還包括：基於風險預測結果和即時交易資訊更新訓練樣本集；基於即時更新的訓練樣本集構建使用者關係圖，使用者交易關係圖以使用者為節點，以使用者之間的交易關係為邊；通過聚類演算法和/或圖注意力演算法從使用者交易關係圖中挖掘出團夥節點和/或團夥交易；基於團夥節點和/或團夥交易從訓練樣本集中識別隱藏欺詐樣本；基於回饋的隱藏欺詐樣本對風險評估預測模型進行更新訓練。

第三方面，提供一種反欺詐風險評估模型的訓練裝置，包括：獲取模組，用於獲取訓練樣本集，訓練樣本包括多維特徵及其欺詐標籤，多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；訓練模組，用於將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；其中，在每輪反覆運算中，反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量，將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量，將編碼向量輸入深度網路以得到風險預測結果，以及，利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。

第四方面，提供一種反欺詐風險評估裝置，包括：獲取模組，用於獲取即時交易資訊，即時交易資訊包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；評估模組，用於將即時交易資訊輸入反欺詐風險評估模型，反欺詐風險評估模型對輸入的即時交易資訊執行嵌入處理以得到輸入向量，將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量，將編碼向量輸入深度網路以得到風險預測結果；其中，反欺詐風險評估模型利用如第一方面的方法訓練得到。

第五方面，提供一種反欺詐風險評估模型的訓練裝置，包括：至少一個處理器；以及，與至少一個處理器通信連接的記憶體；其中，記憶體存儲有可被至少一個處理器執行的指令，指令被至少一個處理器執行，以使至少一個處理器能夠執行：如第一方面的方法。

第六方面，提供一種反欺詐風險評估裝置，包括：至少一個處理器；以及，與至少一個處理器通信連接的記憶體；其中，記憶體存儲有可被至少一個處理器執行的指令，指令被至少一個處理器執行，以使至少一個處理器能夠執行：如第二方面的方法。

第七方面，提供一種電腦可讀存儲介質，電腦可讀存儲介質存儲有程式，當程式被多核處理器執行時，使得多核處理器執行如第一方面的方法和/或如第二方面的方法。

上述實施例的優點之一，能夠獲得更好的反欺詐風險評估效果。

本發明的其他優點將配合以下的說明和附圖進行更詳細的解說。

應當理解，上述說明僅是本發明技術方案的概述，以便能夠更清楚地瞭解本發明的技術手段，從而可依照說明書的內容予以實施。為了讓本發明的上述和其它目的、特徵和優點能夠更明顯易懂，以下特舉例說明本發明的具體實施方式。

下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例，然而應當理解，可以以各種形式實現本公開而不應被這裡闡述的實施例所限制。相反，提供這些實施例是為了能夠更透徹地理解本公開，並且能夠將本公開的範圍完整的傳達給本領域技術人員。

在本申請實施例的描述中，應理解，諸如“包括”或“具有”等術語旨在指示本說明書中所公開的特徵、數位、步驟、行為、部件、部分或其組合的存在，並且不旨在排除一個或多個其他特徵、數位、步驟、行為、部件、部分或其組合存在的可能性。

除非另有說明，“/”表示或的意思，例如，A/B可以表示A或B；本文中的“和/或”僅僅是一種描述關聯物件的關聯關係，表示可以存在三種關係，例如，A和/或B，可以表示：單獨存在A，同時存在A和B，單獨存在B這三種情況。

術語“第一”、“第二”等僅用於描述目的，而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特徵的數量。由此，限定有“第一”、“第二”等的特徵可以明示或者隱含地包括一個或者更多個該特徵。在本申請實施例的描述中，除非另有說明，“多個”的含義是兩個或兩個以上。

本申請中的所有代碼都是示例性的，本領域技術人員根據所使用的程式設計語言，具體的需求和個人習慣等因素會在不脫離本申請的思想的條件下想到各種變型。

如圖1所示，圖1是本發明實施例方案涉及的硬體運行環境的結構示意圖。

需要說明的是，圖1即可為反欺詐風險評估模型的訓練設備的硬體運行環境的結構示意圖。本發明實施例的資料庫熱點行更新設備可以是PC，可攜式電腦等終端設備。

如圖1所示，該反欺詐風險評估模型的訓練設備可以包括：處理器1001，例如CPU，網路介面1004，使用者介面1003，記憶體1005，通信匯流排1002。其中，通信匯流排1002用於實現這些元件之間的連接通信。使用者介面1003可以包括顯示幕(Display)、輸入單元比如鍵盤(Keyboard)，可選用戶介面1003還可以包括標準的有線介面、無線介面。網路介面1004可選的可以包括標準的有線介面、無線介面(如WI-FI介面)。記憶體1005可以是高速RAM記憶體，也可以是穩定的記憶體(non-volatilememory)，例如磁碟記憶體。記憶體1005可選的還可以是獨立於前述處理器1001的存儲裝置。

本領域技術人員可以理解，圖1中示出的反欺詐風險評估模型的訓練設備結構並不構成對設備的限定，可以包括比圖示更多或更少的部件，或者組合某些部件，或者不同的部件佈置。

如圖1所示，作為一種電腦存儲介質的記憶體1005中可以包括作業系統、網路通信模組、使用者介面模組以及反欺詐風險評估模型的訓練程式。其中，作業系統是管理和控制反欺詐風險評估模型的訓練設備硬體和軟體資源的程式，支援資料庫熱點行更新程式以及其它軟體或程式的運行。

在圖1所示的反欺詐風險評估模型的訓練設備中，使用者介面1003主要用於接收第一終端、第二終端和監管終端發送的請求、資料等；網路介面1004主要用於連接後臺伺服器與後臺伺服器進行資料通信；而處理器1001可以用於調用記憶體1005中存儲的資料庫熱點行更新程式，並執行以下操作：

獲取訓練樣本集，訓練樣本包括多維特徵及其欺詐標籤，多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；其中，在每輪反覆運算中，反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量，將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量，將編碼向量輸入深度網路以得到風險預測結果，以及，利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。

由此，使用注意力機制融合使用者靜態特徵、使用者行為特徵和設備風險APP特徵等多維資料以進行風險預測，能夠訓練出反欺詐風險評估效果更好的模型。

圖2為根據本申請一實施例的一種反欺詐風險評估模型的訓練方法的流程示意圖，在該流程中，從設備角度而言，執行主體可以是一個或者多個電子設備，更具體地可以是的處理模組；從程式角度而言，執行主體相應地可以是搭載於這些電子設備上的程式。

參考圖1，該方法包括：

202、獲取訓練樣本集，訓練樣本包括多維特徵及其欺詐標籤，多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；

訓練樣本集包含若干黑白樣本，其中黑樣本是指欺詐標籤為“是”的訓練樣本，白樣本是指欺詐標籤為“否”的訓練樣本，每個訓練樣本由根據交易側資訊獲得。

例如，訓練樣本可以是：使用者靜態特徵（使用者A，性別，年齡，職業），使用者行為特徵（交易地點IP、交易對手方資訊），設備風險APP特徵，其中為交易APP，，等屬於使用者設備上安裝並使用的風險APP，也即在風險名單中的APP，上述，相應為相鄰兩個風險APP之間的使用間隔時間，由此可以看出用戶對於風險APP的使用習慣。）

在一些實施例中，方法還包括：獲取全域風險APP，並利用每個風險APP的屬性資訊獲取關聯和/或相似的其他APP以擴充全域風險APP；屬性資訊包括以下中的一種或多種：開發者資訊、名稱資訊、APP介紹信息。

可以理解，不斷會有新的風險APP產生，而已知的風險APP名單難以全面統計，因此可以根據現有已知的風險APP並利用諸如聚類等關聯演算法推測出未知的風險APP，進而即時擴充全域風險APP。可以理解，風險APP之間的開發者資訊、名稱資訊、APP介紹信息等屬性資訊之間可能存在關聯活相似，因此可以據此來實現擴充。

在一些實施例中，獲取訓練資料集，還包括：收集使用者靜態特徵，使用者靜態特徵包括使用者年齡性別；通過埋點方式收集使用者交易行為資訊，使用者交易行為資料包括：交易地點IP、交易對手方資訊；週期性收集使用者設備的APP使用資訊，根據全域風險APP確定使用者設備使用的風險APP，得到設備風險APP特徵。

比如，在第一時間點對用於設備資訊進行收集，發現的活動痕跡，在第二時間點發現和的使用痕跡，並可基於收集時間來估計APP的使用時間。

在一些實施例中，多維特徵還包括：文本特徵，文本特徵包括交易留言資訊。可以理解，某些欺詐交易的交易留言資訊較為特別，可通過識別其交易留言資訊來識別風險。

204、將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；

其中，在每輪反覆運算中，反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量，將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量，將編碼向量輸入深度網路以得到風險預測結果，以及，利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。

參考圖3，示出了反欺詐風險評估模型的訓練架構圖，其中反欺詐風險評估模型300包括嵌入層301，用於將輸入的訓練樣本的多維特徵轉換為向量形式，即輸入向量。特徵提取網路302，用於從輸入向量序列中提取有效特徵，該特徵提取網路基於自注意力機制構建，具體可以包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層，由此可以獲得加權融合後的編碼向量。深度網路303，用於基於該編碼向量獲得風險預測結果，該深度網路303還接收樣本的欺詐標籤，從而基於風險預測結果和欺詐標籤的誤差通過反向傳播調整該風險評估模型的參數。

在注意力機制中，每個輸入向量乘三個不同的權值矩陣得到3個向量，分別是query向量、key向量和value向量，通過相似度計算權值輸出加權匹配，為了梯度穩定對其進行歸一化，然後通過softmax啟動並點乘V，得到加權輸入向量經過attention結構之後的結果，最終接入殘差網路結構防止深度學習退化。

在本發明中針對使用者設備安裝的APP、靜態屬性等特徵進行向量化，然後分別通過注意力機制拼接得到加權求和，從而可以獲得用戶維度的風險預測結果。

在一些實施例中，採用Transformer編碼器作為特徵學習網路，Transformer編碼器包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層。

在一些實施例中，還包括：獲取設備風險APP的使用時序資訊，基於使用時序獲取使用者設備使用的每個風險APP和當前資金類APP的使用相關性；利用Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼，得到時序向量，將時序向量結合每個風險APP對應的使用相關性得到時序強度向量；將時序強度向量和設備風險APP特徵對應的輸入向量結合，並輸入自注意力層。然後通過注意力機制拼接得到加權求和，從而可以進一步獲得設備APP維度的風險預測結果。

例如，設備風險APP的使用時序資訊為：，此時，如交易APP使用前短時間內使用某一風險APP，則二者相關性較高，如交易APP使用前很長時間前使用另一風險APP，則二者相關性較低，例如，利用以下公式設置風險APP：與當前交易APP：之間的相關度：。

同時考慮到用戶的使用習慣，除了絕對時間關係，相對時間也非常重要，因此可以參考Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼。

例如，可以採用以下時序編碼規則：

；

其中，為時序的時序編碼向量的第維，為時序的時序編碼向量的第維，是時序編碼向量的維度。

根據以上公式可知t+t1時刻的時間序列向量可以由時間t線性變化得到，便於模型捕捉相對時序之間的變化。

參考圖3，嵌入層301包括輸入嵌入(inputembedding)層和時序編碼層。在輸入嵌入層，可以對訓練樣本的各個特徵進行嵌入處理，從而得到各個特徵的詞嵌入張量，張量具體可以表現為一維的向量、二維的矩陣、三維或更多維的資料等等。在時序編碼層，可以獲取各個風險APP在使用者設備的使用時序位置，進而對各個風險APP的時序生成時序張量。在得到待處理文本中每個特徵的嵌入張量和某些特徵（風險APP）的時序張量之後，可以將這些特徵的時序張量和嵌入張量進行組合，並輸入特徵提取網路。

在一些實施例中，深度網路採用機器學習中的隨機森林或XGB。

在一些實施例中，損失函數中設有交易金額權重因數。可以理解，欺詐金額普遍偏大且危害較為嚴重，因此可以基於每個訓練樣本的交易金額設置損失函數中的權重因數，使整個模型更有利於識別金額較大的欺詐交易。

基於相同的技術構思，本發明實施例還提供一種反欺詐風險評估方法。圖4為本發明實施例提供的一種反欺詐風險評估方法的流程示意圖。

如圖4所示，方法400包括：

402、獲取即時交易資訊，即時交易資訊包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種；

404、將即時交易資訊輸入反欺詐風險評估模型，對輸入的即時交易資訊執行嵌入處理以得到輸入向量，將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量，將編碼向量輸入深度網路以得到風險預測結果；其中，反欺詐風險評估模型利用如上述實施例的方法訓練得到。

參考圖5，示出了出了反欺詐風險評估模型的使用示意圖，此時，即時獲得的交易資訊輸入訓練好的反欺詐風險評估模型300，該交易資訊包括諸如使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種，嵌入層301對該交易資訊進行嵌入處理，以得到向量化資料，即輸入向量，特徵提取網路302從該輸入向量中提取出有效特徵，即編碼向量，經過訓練的深度網路對該編碼進行預測，得到風險預測結果。

在一些實施例中，還包括：如風險預測結果符合預設條件，則基於即時交易資訊進行對應的干擾處理和/或告警處理。

在一些實施例中，還包括：基於風險預測結果和即時交易資訊更新訓練樣本集；基於即時更新的訓練樣本集構建使用者關係圖，使用者交易關係圖以使用者為節點，以使用者之間的交易關係為邊；通過聚類演算法和/或圖注意力演算法從使用者交易關係圖中挖掘出團夥節點和/或團夥交易；基於團夥節點和/或團夥交易從訓練樣本集中識別隱藏欺詐樣本；基於回饋的隱藏欺詐樣本對風險評估預測模型進行更新訓練。

具體地，上述訓練樣本集可能標注並不全面、準確，基於此，可以基於已知的黑樣本通過聚類和圖演算法進一步挖掘團夥作案，也即挖掘出其中的黑樣本。

在本說明書的描述中，參考術語“一些可能的實施方式”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特點包含于本發明的至少一個實施例或示例中。在本說明書中，對上述術語的示意性表述不必須針對的是相同的實施例或示例。而且，描述的具體特徵、結構、材料或者特點可以在任一個或多個實施例或示例中以合適的方式結合。此外，在不相互矛盾的情況下，本領域技術人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特徵進行結合和組合。

此外，術語“第一”、“第二”僅用於描述目的，而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特徵的數量。由此，限定有“第一”、“第二”的特徵可以明示或者隱含地包括至少一個該特徵。在本發明的描述中，“多個”的含義是至少兩個，例如兩個，三個等，除非另有明確具體的限定。

流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為，表示包括一個或更多個用於實現特定邏輯功能或過程的步驟的可執行指令的代碼的模組、片段或部分，並且本發明的優選實施方式的範圍包括另外的實現，其中可以不按所示出或討論的順序，包括根據所涉及的功能按基本同時的方式或按相反的順序，來執行功能，這應被本發明的實施例所屬技術領域的技術人員所理解。

關於本申請實施例的方法流程圖，將某些操作描述為以一定循序執行的不同的步驟。這樣的流程圖屬於說明性的而非限制性的。可以將在本文中所描述的某些步驟分組在一起並且在單個操作中執行、可以將某些步驟分割成多個子步驟、並且可以以不同于在本文中所示出的順序來執行某些步驟。可以由任何電路結構和/或有形機制(例如，由在電腦設備上運行的軟體、硬體(例如，處理器或晶片實現的邏輯功能)等、和/或其任何組合)以任何方式來實現在流程圖中所示出的各個步驟。

基於相同的技術構思，本發明實施例還提供一種反欺詐風險評估模型的訓練裝置，用於執行上述任一實施例所提供的反欺詐風險評估模型的訓練方法。圖6為本發明實施例提供的一種反欺詐風險評估模型的訓練裝置結構示意圖。

如圖6所示，裝置600包括：

獲取模組601，用於獲取訓練樣本集，訓練樣本包括多維特徵及其欺詐標籤，多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；

訓練模組602，用於將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；

基於相同的技術構思，本發明實施例還提供一種反欺詐風險評估裝置，用於執行上述任一實施例所提供的反欺詐風險評估方法。圖7為本發明實施例提供的一種反欺詐風險評估裝置結構示意圖。

獲取模組701，用於獲取即時交易資訊，即時交易資訊包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；

評估模組702，用於將即時交易資訊輸入反欺詐風險評估模型，反欺詐風險評估模型對輸入的即時交易資訊執行嵌入處理以得到輸入向量，將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量，將編碼向量輸入深度網路以得到風險預測結果；其中，反欺詐風險評估模型利用如上述訓練方法訓練得到。

需要說明的是，本申請實施例中的裝置可以實現前述方法的實施例的各個過程，並達到相同的效果和功能，這裡不再贅述。

圖8為根據本申請一實施例的反欺詐風險評估模型的訓練裝置，用於執行圖2所示出的反欺詐風險評估模型的訓練方法，該裝置包括：至少一個處理器；以及，與至少一個處理器通信連接的記憶體；其中，記憶體存儲有可被至少一個處理器執行的指令，指令被至少一個處理器執行，以使至少一個處理器能夠執行上述實施例的方法。

圖9為根據本申請一實施例的反欺詐風險評估裝置，用於執行圖4所示出的反欺詐風險評估方法，該裝置包括：至少一個處理器；以及，與至少一個處理器通信連接的記憶體；其中，記憶體存儲有可被至少一個處理器執行的指令，指令被至少一個處理器執行，以使至少一個處理器能夠執行上述實施例的方法。

根據本申請的一些實施例，提供了反欺詐風險評估模型的訓練方法和/或反欺詐風險評估方法的非易失性電腦存儲介質，其上存儲有電腦可執行指令，該電腦可執行指令設置為在由處理器運行時執行：上述實施例的方法。

本申請中的各個實施例均採用遞進的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對於裝置、設備和電腦可讀存儲介質實施例而言，由於其基本相似於方法實施例，所以其描述進行了簡化，相關之處可參見方法實施例的部分說明即可。

本申請實施例提供的裝置、設備和電腦可讀存儲介質與方法是一一對應的，因此，裝置、設備和電腦可讀存儲介質也具有與其對應的方法類似的有益技術效果，由於上面已經對方法的有益技術效果進行了詳細說明，因此，這裡不再贅述裝置、設備和電腦可讀存儲介質的有益技術效果。

本領域內的技術人員應明白，本發明的實施例可提供為方法、系統或電腦程式產品。因此，本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且，本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用存儲介質（包括但不限於磁碟記憶體、CD-ROM、光學記憶體等）上實施的電腦程式產品的形式。

本發明是參照根據本發明實施例的方法、設備（系統）、和電腦程式產品的流程圖和／或方框圖來描述的。應理解可由電腦程式指令實現流程圖和／或方框圖中的每一流程和／或方框、以及流程圖和／或方框圖中的流程和／或方框的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可程式設計資料處理設備的處理器以產生一個機器，使得通過電腦或其他可程式設計資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和／或方框圖一個方框或多個方框中指定的功能的裝置。

這些電腦程式指令也可存儲在能引導電腦或其他可程式設計資料處理設備以特定方式工作的電腦可讀記憶體中，使得存儲在該電腦可讀記憶體中的指令產生包括指令裝置的製造品，該指令裝置實現在流程圖一個流程或多個流程和／或方框圖一個方框或多個方框中指定的功能。

這些電腦程式指令也可裝載到電腦或其他可程式設計資料處理設備上，使得在電腦或其他可程式設計設備上執行一系列操作步驟以產生電腦實現的處理，從而在電腦或其他可程式設計設備上執行的指令提供用於實現在流程圖一個流程或多個流程和／或方框圖一個方框或多個方框中指定的功能的步驟。

在一個典型的配置中，計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。

記憶體可能包括電腦可讀介質中的非永久性記憶體，隨機存取記憶體(RAM)和/或非易失性記憶體等形式，如唯讀記憶體(ROM)或快閃記憶體(flashRAM)。記憶體是電腦可讀介質的示例。

電腦可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊存儲。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的存儲介質的例子包括，但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可程式設計唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學存儲、磁盒式磁帶，磁帶磁磁片存儲或其他磁性存放裝置或任何其他非傳輸介質，可用於存儲可以被計算設備訪問的資訊。此外，儘管在附圖中以特定順序描述了本發明方法的操作，但是，這並非要求或者暗示必須按照該特定順序來執行這些操作，或是必須執行全部所示的操作才能實現期望的結果。附加地或備選地，可以省略某些步驟，將多個步驟合併為一個步驟執行，和/或將一個步驟分解為多個步驟執行。

雖然已經參考若干具體實施方式描述了本發明的精神和原理，但是應該理解，本發明並不限於所公開的具體實施方式，對各方面的劃分也不意味著這些方面中的特徵不能組合以進行受益，這種劃分僅是為了表述的方便。本發明旨在涵蓋所附申請專利範圍的精神和範圍內所包括的各種修改和等同佈置。

1001:處理器 1002:通信匯流排 1003:使用者介面 1004:網路介面 1005:記憶體 202:獲取訓練樣本集，訓練樣本包括多維特徵及其欺詐標籤，多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵； 204:將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練； 300:反欺詐風險評估模型 301:嵌入層 302:特徵提取網路 303:深度網路 400:方法 402:獲取即時交易資訊，即時交易資訊包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種； 404:將即時交易資訊輸入反欺詐風險評估模型，對輸入的即時交易資訊執行嵌入處理以得到輸入向量，將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量，將編碼向量輸入深度網路以得到風險預測結果；其中，反欺詐風險評估模型利用如上述實施例的方法訓練得到。 600:裝置 601:獲取模組 602:訓練模組 701:獲取模組 702:評估模組

[圖1]為根據本發明一實施例的反欺詐風險評估模型的訓練設備的結構示意圖； [圖2]為根據本發明一實施例的反欺詐風險評估模型的訓練方法的流程示意圖； [圖3]為根據本發明一實施例的反欺詐風險評估模型的訓練過程示意圖； [圖4]為根據本發明一實施例的反欺詐風險評估方法的流程示意圖； [圖5]為根據本發明一實施例的反欺詐風險評估模型的使用過程示意圖； [圖6]為根據本發明一實施例的反欺詐風險評估模型的訓練裝置的結構示意圖； [圖7]為根據本發明一實施例的反欺詐風險評估裝置的結構示意圖； [圖8]為根據本發明一實施例的反欺詐風險評估模型的訓練裝置的結構示意圖； [圖9]為根據本發明一實施例的反欺詐風險評估裝置的結構示意圖。

300:反欺詐風險評估模型

301:嵌入層

302:特徵提取網路

303:深度網路

Claims

一種反欺詐風險評估模型的訓練方法，包括：獲取訓練樣本集，所述訓練樣本包括多維特徵及其欺詐標籤，所述多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；將所述訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；其中，在每輪反覆運算中，所述反欺詐風險評估模型對輸入的所述多維特徵執行嵌入處理以得到輸入向量，將所述輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量，將所述編碼向量輸入深度網路以得到風險預測結果，以及，利用所述風險預測結果和所述欺詐標籤構建的損失函數更新所述風險評估模型的參數。
根據請求項1所述的方法，其中，採用Transformer編碼器作為所述特徵學習網路，所述Transformer編碼器包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層。
根據請求項2所述的方法，其中，還包括：獲取所述設備風險APP的使用時序資訊，基於所述使用時序獲取使用者設備使用的每個風險APP和當前資金類APP的使用相關性；利用所述Transformer編碼器的位置編碼機制對所述使用時序資訊進行時序編碼，得到時序向量，將所述時序向量結合每個風險APP對應的所述使用相關性得到時序強度向量；將所述時序強度向量和所述設備風險APP特徵對應的所述輸入向量結合，並輸入所述自注意力層。
根據請求項3所述的方法，其中，利用所述Transformer編碼器的位置編碼機制對所述使用時序資訊進行時序編碼，還包括：其中，利用如下公式定義時序編碼規則：其中，為時序的時序編碼向量的第維，為時序的時序編碼向量的第維，是時序編碼向量的維度。
根據請求項1-4中任一項所述的方法，其中，所述方法還包括：獲取全域風險APP，並利用每個所述風險APP的屬性資訊獲取關聯和/或相似的其他APP以擴充所述全域風險APP；所述屬性資訊包括以下中的一種或多種：開發者資訊、名稱資訊、APP介紹信息。
根據請求項1-5中任一項所述的方法，其中，獲取訓練資料集，還包括：通過埋點方式收集所述使用者交易行為資訊，所述使用者交易行為資料包括：交易地點IP、交易對手方資訊；週期性收集使用者設備的APP使用資訊，根據全域風險APP確定所述使用者設備使用的風險APP，得到所述設備風險APP特徵。
根據請求項1-6中任一項所述的方法，其中，所述多維特徵還包括：文本特徵，所述文本特徵包括交易留言資訊。
根據請求項1-7中任一項所述的方法，其中，所述深度網路採用機器學習中的隨機森林或XGB。
根據請求項1-8中任一項所述的方法，其中，所述損失函數中設有交易金額權重因數。
一種反欺詐風險評估方法，包括：獲取即時交易資訊，所述即時交易資訊包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種；將所述即時交易資訊輸入反欺詐風險評估模型，所述反欺詐風險評估模型對輸入的所述即時交易資訊執行嵌入處理以得到輸入向量，將所述輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量，將所述編碼向量輸入深度網路以得到風險預測結果；其中，所述反欺詐風險評估模型利用如請求項1-9中任一項所述的方法訓練得到。
根據請求項10所述的方法，其中，還包括：如所述風險預測結果符合預設條件，則基於所述即時交易資訊進行對應的干擾處理和/或告警處理。
根據請求項10或11所述的方法，其中，還包括：基於所述風險預測結果和所述即時交易資訊更新訓練樣本集；基於即時更新的所述訓練樣本集構建使用者關係圖，所述使用者交易關係圖以使用者為節點，以使用者之間的交易關係為邊；通過聚類演算法和/或圖注意力演算法從所述使用者交易關係圖中挖掘出團夥節點和/或團夥交易；基於所述團夥節點和/或所述團夥交易從所述訓練樣本集中識別隱藏欺詐樣本；基於回饋的所述隱藏欺詐樣本對所述風險評估預測模型進行更新訓練。
一種反欺詐風險評估模型的訓練裝置，其中，包括：獲取模組，用於獲取訓練樣本集，所述訓練樣本包括多維特徵及其欺詐標籤，所述多維特徵包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；訓練模組，用於將所述訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練；其中，在每輪反覆運算中，所述反欺詐風險評估模型對輸入的所述多維特徵執行嵌入處理以得到輸入向量，將所述輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量，將所述編碼向量輸入深度網路以得到風險預測結果，以及，利用所述風險預測結果和所述欺詐標籤構建的損失函數更新所述風險評估模型的參數。
一種反欺詐風險評估裝置，包括：獲取模組，用於獲取即時交易資訊，所述即時交易資訊包括：使用者靜態特徵、使用者行為特徵以及設備風險APP特徵；評估模組，用於將所述即時交易資訊輸入反欺詐風險評估模型，所述反欺詐風險評估模型對輸入的所述即時交易資訊執行嵌入處理以得到輸入向量，將所述輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量，將所述編碼向量輸入深度網路以得到風險預測結果；其中，所述反欺詐風險評估模型利用如請求項1-9中任一項所述的方法訓練得到。
一種反欺詐風險評估模型的訓練裝置，包括：至少一個處理器；以及，與至少一個處理器通信連接的記憶體；其中，記憶體存儲有可被至少一個處理器執行的指令，指令被至少一個處理器執行，以使至少一個處理器能夠執行：如請求項1-9中任意一項所述的方法。
一種反欺詐風險評估裝置，包括：至少一個處理器；以及，與至少一個處理器通信連接的記憶體；其中，記憶體存儲有可被至少一個處理器執行的指令，指令被至少一個處理器執行，以使至少一個處理器能夠執行：如請求項10-12中任意一項所述的方法。
一種電腦可讀存儲介質，所述電腦可讀存儲介質存儲有程式，當所述程式被多核處理器執行時，使得所述多核處理器執行如請求項1-9中任一項所述的方法，或者請求項10-12中任一項所述的方法。