TW202326537A - 反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質 - Google Patents
反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質 Download PDFInfo
- Publication number
- TW202326537A TW202326537A TW111137564A TW111137564A TW202326537A TW 202326537 A TW202326537 A TW 202326537A TW 111137564 A TW111137564 A TW 111137564A TW 111137564 A TW111137564 A TW 111137564A TW 202326537 A TW202326537 A TW 202326537A
- Authority
- TW
- Taiwan
- Prior art keywords
- fraud
- risk assessment
- risk
- app
- training
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Abstract
本發明提供了反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質,該訓練方法包括:獲取訓練樣本集,訓練樣本包括多維特徵及其欺詐標籤,多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練;其中,在每輪反覆運算中,反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量,將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將編碼向量輸入深度網路以得到風險預測結果,以及,利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。利用上述方法,能夠獲得更好的反欺詐風險評估效果。
Description
本發明屬於反欺詐領域,具體涉及一種反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質。
本部分旨在為申請專利範圍中陳述的本發明的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
隨著電信網路的發展,即時通訊和資金交易愈加方便,同時也為欺詐分子提供可乘之機。基於案前用戶防範欺詐意識薄弱、案後追查難度大的現狀,在交易側進行防範顯得尤為重要。
然而目前,仍然面臨對欺詐交易的識別滯後且準確度不高的情況。
針對上述現有技術中存在的問題,提出了一種反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質,利用這種方法、裝置及電腦可讀存儲介質,能夠解決上述問題。
本發明提供了以下方案。
第一方面,提供一種反欺詐風險評估模型的訓練方法,包括:獲取訓練樣本集,訓練樣本包括多維特徵及其欺詐標籤,多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練;其中,在每輪反覆運算中,反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量,將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將編碼向量輸入深度網路以得到風險預測結果,以及,利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。
在一種實施方式中,採用Transformer編碼器作為特徵學習網路,Transformer編碼器包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層。
在一種實施方式中,還包括:獲取設備風險APP的使用時序資訊,基於使用時序獲取使用者設備使用的每個風險APP和當前資金類APP的使用相關性;利用Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼,得到時序向量,將時序向量結合每個風險APP對應的使用相關性得到時序強度向量;將時序強度向量和設備風險APP特徵對應的輸入向量結合,並輸入自注意力層。
在一種實施方式中,利用Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼,還包括:其中,利用如下公式定義時序編碼規則:
;
;其中,
為時序
的時序編碼向量的第
維,
為時序
的時序編碼向量的第
維,
是時序編碼向量的維度。
在一種實施方式中,方法還包括:獲取全域風險APP,並利用每個風險APP的屬性資訊獲取關聯和/或相似的其他APP以擴充全域風險APP;屬性資訊包括以下中的一種或多種:開發者資訊、名稱資訊、APP介紹信息。
在一種實施方式中,獲取訓練資料集,還包括:通過埋點方式收集使用者交易行為資訊,使用者交易行為資料包括:交易地點IP、交易對手方資訊;週期性收集使用者設備的APP使用資訊,根據全域風險APP確定使用者設備使用的風險APP,得到設備風險APP特徵。
在一種實施方式中,多維特徵還包括:文本特徵,文本特徵包括交易留言資訊。
在一種實施方式中,深度網路採用機器學習中的隨機森林或XGB。
在一種實施方式中,損失函數中設有交易金額權重因數。
第二方法,提供一種反欺詐風險評估方法,包括:獲取即時交易資訊,即時交易資訊包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;將即時交易資訊輸入反欺詐風險評估模型,反欺詐風險評估模型對輸入的即時交易資訊執行嵌入處理以得到輸入向量,將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量,將編碼向量輸入深度網路以得到風險預測結果;其中,反欺詐風險評估模型利用如第一方面的方法訓練得到。
在一種實施方式中,還包括:如風險預測結果符合預設條件,則基於即時交易資訊進行對應的干擾處理和/或告警處理。
在一種實施方式中,還包括:基於風險預測結果和即時交易資訊更新訓練樣本集;基於即時更新的訓練樣本集構建使用者關係圖,使用者交易關係圖以使用者為節點,以使用者之間的交易關係為邊;通過聚類演算法和/或圖注意力演算法從使用者交易關係圖中挖掘出團夥節點和/或團夥交易;基於團夥節點和/或團夥交易從訓練樣本集中識別隱藏欺詐樣本;基於回饋的隱藏欺詐樣本對風險評估預測模型進行更新訓練。
第三方面,提供一種反欺詐風險評估模型的訓練裝置,包括:獲取模組,用於獲取訓練樣本集,訓練樣本包括多維特徵及其欺詐標籤,多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;訓練模組,用於將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練;其中,在每輪反覆運算中,反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量,將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將編碼向量輸入深度網路以得到風險預測結果,以及,利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。
第四方面,提供一種反欺詐風險評估裝置,包括:獲取模組,用於獲取即時交易資訊,即時交易資訊包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;評估模組,用於將即時交易資訊輸入反欺詐風險評估模型,反欺詐風險評估模型對輸入的即時交易資訊執行嵌入處理以得到輸入向量,將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量,將編碼向量輸入深度網路以得到風險預測結果;其中,反欺詐風險評估模型利用如第一方面的方法訓練得到。
第五方面,提供一種反欺詐風險評估模型的訓練裝置,包括:至少一個處理器;以及,與至少一個處理器通信連接的記憶體;其中,記憶體存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行:如第一方面的方法。
第六方面,提供一種反欺詐風險評估裝置,包括:至少一個處理器;以及,與至少一個處理器通信連接的記憶體;其中,記憶體存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行:如第二方面的方法。
第七方面,提供一種電腦可讀存儲介質,電腦可讀存儲介質存儲有程式,當程式被多核處理器執行時,使得多核處理器執行如第一方面的方法和/或如第二方面的方法。
上述實施例的優點之一,能夠獲得更好的反欺詐風險評估效果。
本發明的其他優點將配合以下的說明和附圖進行更詳細的解說。
應當理解,上述說明僅是本發明技術方案的概述,以便能夠更清楚地瞭解本發明的技術手段,從而可依照說明書的內容予以實施。為了讓本發明的上述和其它目的、特徵和優點能夠更明顯易懂,以下特舉例說明本發明的具體實施方式。
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這裡闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,並且能夠將本公開的範圍完整的傳達給本領域技術人員。
在本申請實施例的描述中,應理解,諸如“包括”或“具有”等術語旨在指示本說明書中所公開的特徵、數位、步驟、行為、部件、部分或其組合的存在,並且不旨在排除一個或多個其他特徵、數位、步驟、行為、部件、部分或其組合存在的可能性。
除非另有說明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”僅僅是一種描述關聯物件的關聯關係,表示可以存在三種關係,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。
術語“第一”、“第二”等僅用於描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特徵的數量。由此,限定有“第一”、“第二”等的特徵可以明示或者隱含地包括一個或者更多個該特徵。在本申請實施例的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。
本申請中的所有代碼都是示例性的,本領域技術人員根據所使用的程式設計語言,具體的需求和個人習慣等因素會在不脫離本申請的思想的條件下想到各種變型。
如圖1所示,圖1是本發明實施例方案涉及的硬體運行環境的結構示意圖。
需要說明的是,圖1即可為反欺詐風險評估模型的訓練設備的硬體運行環境的結構示意圖。本發明實施例的資料庫熱點行更新設備可以是PC,可攜式電腦等終端設備。
如圖1所示,該反欺詐風險評估模型的訓練設備可以包括:處理器1001,例如CPU,網路介面1004,使用者介面1003,記憶體1005,通信匯流排1002。其中,通信匯流排1002用於實現這些元件之間的連接通信。使用者介面1003可以包括顯示幕(Display)、輸入單元比如鍵盤(Keyboard),可選用戶介面1003還可以包括標準的有線介面、無線介面。網路介面1004可選的可以包括標準的有線介面、無線介面(如WI-FI介面)。記憶體1005可以是高速RAM記憶體,也可以是穩定的記憶體(non-volatilememory),例如磁碟記憶體。記憶體1005可選的還可以是獨立於前述處理器1001的存儲裝置。
本領域技術人員可以理解,圖1中示出的反欺詐風險評估模型的訓練設備結構並不構成對設備的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件佈置。
如圖1所示,作為一種電腦存儲介質的記憶體1005中可以包括作業系統、網路通信模組、使用者介面模組以及反欺詐風險評估模型的訓練程式。其中,作業系統是管理和控制反欺詐風險評估模型的訓練設備硬體和軟體資源的程式,支援資料庫熱點行更新程式以及其它軟體或程式的運行。
在圖1所示的反欺詐風險評估模型的訓練設備中,使用者介面1003主要用於接收第一終端、第二終端和監管終端發送的請求、資料等;網路介面1004主要用於連接後臺伺服器與後臺伺服器進行資料通信;而處理器1001可以用於調用記憶體1005中存儲的資料庫熱點行更新程式,並執行以下操作:
獲取訓練樣本集,訓練樣本包括多維特徵及其欺詐標籤,多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練;其中,在每輪反覆運算中,反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量,將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將編碼向量輸入深度網路以得到風險預測結果,以及,利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。
由此,使用注意力機制融合使用者靜態特徵、使用者行為特徵和設備風險APP特徵等多維資料以進行風險預測,能夠訓練出反欺詐風險評估效果更好的模型。
圖2為根據本申請一實施例的一種反欺詐風險評估模型的訓練方法的流程示意圖,在該流程中,從設備角度而言,執行主體可以是一個或者多個電子設備,更具體地可以是的處理模組;從程式角度而言,執行主體相應地可以是搭載於這些電子設備上的程式。
參考圖1,該方法包括:
202、獲取訓練樣本集,訓練樣本包括多維特徵及其欺詐標籤,多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;
訓練樣本集包含若干黑白樣本,其中黑樣本是指欺詐標籤為“是”的訓練樣本,白樣本是指欺詐標籤為“否”的訓練樣本,每個訓練樣本由根據交易側資訊獲得。
例如,訓練樣本可以是:使用者靜態特徵(使用者A,性別,年齡,職業),使用者行為特徵(交易地點IP、交易對手方資訊),設備風險APP特徵
,其中
為交易APP,
,
等屬於使用者設備上安裝並使用的風險APP,也即在風險名單中的APP,上述
,
相應為相鄰兩個風險APP之間的使用間隔時間,由此可以看出用戶對於風險APP的使用習慣。)
在一些實施例中,方法還包括:獲取全域風險APP,並利用每個風險APP的屬性資訊獲取關聯和/或相似的其他APP以擴充全域風險APP;屬性資訊包括以下中的一種或多種:開發者資訊、名稱資訊、APP介紹信息。
可以理解,不斷會有新的風險APP產生,而已知的風險APP名單難以全面統計,因此可以根據現有已知的風險APP並利用諸如聚類等關聯演算法推測出未知的風險APP,進而即時擴充全域風險APP。可以理解,風險APP之間的開發者資訊、名稱資訊、APP介紹信息等屬性資訊之間可能存在關聯活相似,因此可以據此來實現擴充。
在一些實施例中,獲取訓練資料集,還包括:收集使用者靜態特徵,使用者靜態特徵包括使用者年齡性別;通過埋點方式收集使用者交易行為資訊,使用者交易行為資料包括:交易地點IP、交易對手方資訊;週期性收集使用者設備的APP使用資訊,根據全域風險APP確定使用者設備使用的風險APP,得到設備風險APP特徵。
比如,在第一時間點對用於設備資訊進行收集,發現
的活動痕跡,在第二時間點發現
和
的使用痕跡,並可基於收集時間來估計APP的使用時間。
在一些實施例中,多維特徵還包括:文本特徵,文本特徵包括交易留言資訊。可以理解,某些欺詐交易的交易留言資訊較為特別,可通過識別其交易留言資訊來識別風險。
204、將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練;
其中,在每輪反覆運算中,反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量,將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將編碼向量輸入深度網路以得到風險預測結果,以及,利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。
參考圖3,示出了反欺詐風險評估模型的訓練架構圖,其中反欺詐風險評估模型300包括嵌入層301,用於將輸入的訓練樣本的多維特徵轉換為向量形式,即輸入向量。特徵提取網路302,用於從輸入向量序列中提取有效特徵,該特徵提取網路基於自注意力機制構建,具體可以包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層,由此可以獲得加權融合後的編碼向量。深度網路303,用於基於該編碼向量獲得風險預測結果,該深度網路303還接收樣本的欺詐標籤,從而基於風險預測結果和欺詐標籤的誤差通過反向傳播調整該風險評估模型的參數。
在注意力機制中,每個輸入向量乘三個不同的權值矩陣得到3個向量
,分別是query向量
、key向量
和value向量
,通過相似度計算
權值輸出加權匹配,為了梯度穩定對其進行歸一化,然後通過softmax啟動並點乘V,得到加權輸入向量經過attention結構之後的結果,最終接入殘差網路結構防止深度學習退化。
在本發明中針對使用者設備安裝的APP、靜態屬性等特徵進行向量化,然後分別通過注意力機制拼接得到加權求和,從而可以獲得用戶維度的風險預測結果。
在一些實施例中,採用Transformer編碼器作為特徵學習網路,Transformer編碼器包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層。
在一些實施例中,還包括:獲取設備風險APP的使用時序資訊,基於使用時序獲取使用者設備使用的每個風險APP和當前資金類APP的使用相關性;利用Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼,得到時序向量,將時序向量結合每個風險APP對應的使用相關性得到時序強度向量;將時序強度向量和設備風險APP特徵對應的輸入向量結合,並輸入自注意力層。然後通過注意力機制拼接得到加權求和,從而可以進一步獲得設備APP維度的風險預測結果。
例如,設備風險APP的使用時序資訊為:
,此時,如交易APP使用前短時間內使用某一風險APP,則二者相關性較高,如交易APP使用前很長時間前使用另一風險APP,則二者相關性較低,例如,利用以下公式設置風險APP:
與當前交易APP:
之間的相關度:
。
同時考慮到用戶的使用習慣,除了絕對時間關係,相對時間也非常重要,因此可以參考Transformer編碼器的位置編碼機制對使用時序資訊進行時序編碼。
例如,可以採用以下時序編碼規則:
;
;
其中,
為時序
的時序編碼向量的第
維,
為時序
的時序編碼向量的第
維,
是時序編碼向量的維度。
根據以上公式可知t+t1時刻的時間序列向量可以由時間t線性變化得到,便於模型捕捉相對時序之間的變化。
參考圖3,嵌入層301包括輸入嵌入(inputembedding)層和時序編碼層。在輸入嵌入層,可以對訓練樣本的各個特徵進行嵌入處理,從而得到各個特徵的詞嵌入張量,張量具體可以表現為一維的向量、二維的矩陣、三維或更多維的資料等等。在時序編碼層,可以獲取各個風險APP在使用者設備的使用時序位置,進而對各個風險APP的時序生成時序張量。在得到待處理文本中每個特徵的嵌入張量和某些特徵(風險APP)的時序張量之後,可以將這些特徵的時序張量和嵌入張量進行組合,並輸入特徵提取網路。
在一些實施例中,深度網路採用機器學習中的隨機森林或XGB。
在一些實施例中,損失函數中設有交易金額權重因數。可以理解,欺詐金額普遍偏大且危害較為嚴重,因此可以基於每個訓練樣本的交易金額設置損失函數中的權重因數,使整個模型更有利於識別金額較大的欺詐交易。
基於相同的技術構思,本發明實施例還提供一種反欺詐風險評估方法。圖4為本發明實施例提供的一種反欺詐風險評估方法的流程示意圖。
如圖4所示,方法400包括:
402、獲取即時交易資訊,即時交易資訊包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種;
404、將即時交易資訊輸入反欺詐風險評估模型,對輸入的即時交易資訊執行嵌入處理以得到輸入向量,將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量,將編碼向量輸入深度網路以得到風險預測結果;其中,反欺詐風險評估模型利用如上述實施例的方法訓練得到。
參考圖5,示出了出了反欺詐風險評估模型的使用示意圖,此時,即時獲得的交易資訊輸入訓練好的反欺詐風險評估模型300,該交易資訊包括諸如使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種,嵌入層301對該交易資訊進行嵌入處理,以得到向量化資料,即輸入向量,特徵提取網路302從該輸入向量中提取出有效特徵,即編碼向量,經過訓練的深度網路對該編碼進行預測,得到風險預測結果。
在一些實施例中,還包括:如風險預測結果符合預設條件,則基於即時交易資訊進行對應的干擾處理和/或告警處理。
在一些實施例中,還包括:基於風險預測結果和即時交易資訊更新訓練樣本集;基於即時更新的訓練樣本集構建使用者關係圖,使用者交易關係圖以使用者為節點,以使用者之間的交易關係為邊;通過聚類演算法和/或圖注意力演算法從使用者交易關係圖中挖掘出團夥節點和/或團夥交易;基於團夥節點和/或團夥交易從訓練樣本集中識別隱藏欺詐樣本;基於回饋的隱藏欺詐樣本對風險評估預測模型進行更新訓練。
具體地,上述訓練樣本集可能標注並不全面、準確,基於此,可以基於已知的黑樣本通過聚類和圖演算法進一步挖掘團夥作案,也即挖掘出其中的黑樣本。
在本說明書的描述中,參考術語“一些可能的實施方式”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特點包含于本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不必須針對的是相同的實施例或示例。而且,描述的具體特徵、結構、材料或者特點可以在任一個或多個實施例或示例中以合適的方式結合。此外,在不相互矛盾的情況下,本領域技術人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特徵進行結合和組合。
此外,術語“第一”、“第二”僅用於描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特徵的數量。由此,限定有“第一”、“第二”的特徵可以明示或者隱含地包括至少一個該特徵。在本發明的描述中,“多個”的含義是至少兩個,例如兩個,三個等,除非另有明確具體的限定。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用於實現特定邏輯功能或過程的步驟的可執行指令的代碼的模組、片段或部分,並且本發明的優選實施方式的範圍包括另外的實現,其中可以不按所示出或討論的順序,包括根據所涉及的功能按基本同時的方式或按相反的順序,來執行功能,這應被本發明的實施例所屬技術領域的技術人員所理解。
關於本申請實施例的方法流程圖,將某些操作描述為以一定循序執行的不同的步驟。這樣的流程圖屬於說明性的而非限制性的。可以將在本文中所描述的某些步驟分組在一起並且在單個操作中執行、可以將某些步驟分割成多個子步驟、並且可以以不同于在本文中所示出的順序來執行某些步驟。可以由任何電路結構和/或有形機制(例如,由在電腦設備上運行的軟體、硬體(例如,處理器或晶片實現的邏輯功能)等、和/或其任何組合)以任何方式來實現在流程圖中所示出的各個步驟。
基於相同的技術構思,本發明實施例還提供一種反欺詐風險評估模型的訓練裝置,用於執行上述任一實施例所提供的反欺詐風險評估模型的訓練方法。圖6為本發明實施例提供的一種反欺詐風險評估模型的訓練裝置結構示意圖。
如圖6所示,裝置600包括:
獲取模組601,用於獲取訓練樣本集,訓練樣本包括多維特徵及其欺詐標籤,多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;
訓練模組602,用於將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練;
其中,在每輪反覆運算中,反欺詐風險評估模型對輸入的多維特徵執行嵌入處理以得到輸入向量,將輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將編碼向量輸入深度網路以得到風險預測結果,以及,利用風險預測結果和欺詐標籤構建的損失函數更新風險評估模型的參數。
基於相同的技術構思,本發明實施例還提供一種反欺詐風險評估裝置,用於執行上述任一實施例所提供的反欺詐風險評估方法。圖7為本發明實施例提供的一種反欺詐風險評估裝置結構示意圖。
獲取模組701,用於獲取即時交易資訊,即時交易資訊包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;
評估模組702,用於將即時交易資訊輸入反欺詐風險評估模型,反欺詐風險評估模型對輸入的即時交易資訊執行嵌入處理以得到輸入向量,將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量,將編碼向量輸入深度網路以得到風險預測結果;其中,反欺詐風險評估模型利用如上述訓練方法訓練得到。
需要說明的是,本申請實施例中的裝置可以實現前述方法的實施例的各個過程,並達到相同的效果和功能,這裡不再贅述。
圖8為根據本申請一實施例的反欺詐風險評估模型的訓練裝置,用於執行圖2所示出的反欺詐風險評估模型的訓練方法,該裝置包括:至少一個處理器;以及,與至少一個處理器通信連接的記憶體;其中,記憶體存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行上述實施例的方法。
圖9為根據本申請一實施例的反欺詐風險評估裝置,用於執行圖4所示出的反欺詐風險評估方法,該裝置包括:至少一個處理器;以及,與至少一個處理器通信連接的記憶體;其中,記憶體存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行上述實施例的方法。
根據本申請的一些實施例,提供了反欺詐風險評估模型的訓練方法和/或反欺詐風險評估方法的非易失性電腦存儲介質,其上存儲有電腦可執行指令,該電腦可執行指令設置為在由處理器運行時執行:上述實施例的方法。
本申請中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於裝置、設備和電腦可讀存儲介質實施例而言,由於其基本相似於方法實施例,所以其描述進行了簡化,相關之處可參見方法實施例的部分說明即可。
本申請實施例提供的裝置、設備和電腦可讀存儲介質與方法是一一對應的,因此,裝置、設備和電腦可讀存儲介質也具有與其對應的方法類似的有益技術效果,由於上面已經對方法的有益技術效果進行了詳細說明,因此,這裡不再贅述裝置、設備和電腦可讀存儲介質的有益技術效果。
本領域內的技術人員應明白,本發明的實施例可提供為方法、系統或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用存儲介質(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
本發明是參照根據本發明實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可程式設計資料處理設備的處理器以產生一個機器,使得通過電腦或其他可程式設計資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些電腦程式指令也可存儲在能引導電腦或其他可程式設計資料處理設備以特定方式工作的電腦可讀記憶體中,使得存儲在該電腦可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可程式設計資料處理設備上,使得在電腦或其他可程式設計設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可程式設計設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。
記憶體可能包括電腦可讀介質中的非永久性記憶體,隨機存取記憶體(RAM)和/或非易失性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flashRAM)。記憶體是電腦可讀介質的示例。
電腦可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊存儲。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的存儲介質的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可程式設計唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學存儲、磁盒式磁帶,磁帶磁磁片存儲或其他磁性存放裝置或任何其他非傳輸介質,可用於存儲可以被計算設備訪問的資訊。此外,儘管在附圖中以特定順序描述了本發明方法的操作,但是,這並非要求或者暗示必須按照該特定順序來執行這些操作,或是必須執行全部所示的操作才能實現期望的結果。附加地或備選地,可以省略某些步驟,將多個步驟合併為一個步驟執行,和/或將一個步驟分解為多個步驟執行。
雖然已經參考若干具體實施方式描述了本發明的精神和原理,但是應該理解,本發明並不限於所公開的具體實施方式,對各方面的劃分也不意味著這些方面中的特徵不能組合以進行受益,這種劃分僅是為了表述的方便。本發明旨在涵蓋所附申請專利範圍的精神和範圍內所包括的各種修改和等同佈置。
1001:處理器
1002:通信匯流排
1003:使用者介面
1004:網路介面
1005:記憶體
202:獲取訓練樣本集,訓練樣本包括多維特徵及其欺詐標籤,多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵;
204:將訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練;
300:反欺詐風險評估模型
301:嵌入層
302:特徵提取網路
303:深度網路
400:方法
402:獲取即時交易資訊,即時交易資訊包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種;
404:將即時交易資訊輸入反欺詐風險評估模型,對輸入的即時交易資訊執行嵌入處理以得到輸入向量,將輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量,將編碼向量輸入深度網路以得到風險預測結果;其中,反欺詐風險評估模型利用如上述實施例的方法訓練得到。
600:裝置
601:獲取模組
602:訓練模組
701:獲取模組
702:評估模組
[圖1]為根據本發明一實施例的反欺詐風險評估模型的訓練設備的結構示意圖;
[圖2]為根據本發明一實施例的反欺詐風險評估模型的訓練方法的流程示意圖;
[圖3]為根據本發明一實施例的反欺詐風險評估模型的訓練過程示意圖;
[圖4]為根據本發明一實施例的反欺詐風險評估方法的流程示意圖;
[圖5]為根據本發明一實施例的反欺詐風險評估模型的使用過程示意圖;
[圖6]為根據本發明一實施例的反欺詐風險評估模型的訓練裝置的結構示意圖;
[圖7]為根據本發明一實施例的反欺詐風險評估裝置的結構示意圖;
[圖8]為根據本發明一實施例的反欺詐風險評估模型的訓練裝置的結構示意圖;
[圖9]為根據本發明一實施例的反欺詐風險評估裝置的結構示意圖。
300:反欺詐風險評估模型
301:嵌入層
302:特徵提取網路
303:深度網路
Claims (17)
- 一種反欺詐風險評估模型的訓練方法,包括: 獲取訓練樣本集,所述訓練樣本包括多維特徵及其欺詐標籤,所述多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵; 將所述訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練; 其中,在每輪反覆運算中,所述反欺詐風險評估模型對輸入的所述多維特徵執行嵌入處理以得到輸入向量,將所述輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將所述編碼向量輸入深度網路以得到風險預測結果,以及,利用所述風險預測結果和所述欺詐標籤構建的損失函數更新所述風險評估模型的參數。
- 根據請求項1所述的方法,其中,採用Transformer編碼器作為所述特徵學習網路,所述Transformer編碼器包括自注意力層、殘差及歸一化層、前饋網路層和求和及歸一化層。
- 根據請求項2所述的方法,其中,還包括: 獲取所述設備風險APP的使用時序資訊,基於所述使用時序獲取使用者設備使用的每個風險APP和當前資金類APP的使用相關性; 利用所述Transformer編碼器的位置編碼機制對所述使用時序資訊進行時序編碼,得到時序向量,將所述時序向量結合每個風險APP對應的所述使用相關性得到時序強度向量; 將所述時序強度向量和所述設備風險APP特徵對應的所述輸入向量結合,並輸入所述自注意力層。
- 根據請求項3所述的方法,其中,利用所述Transformer編碼器的位置編碼機制對所述使用時序資訊進行時序編碼,還包括: 其中,利用如下公式定義時序編碼規則: 其中, 為時序 的時序編碼向量的第 維, 為時序 的時序編碼向量的第 維, 是時序編碼向量的維度。
- 根據請求項1-4中任一項所述的方法,其中,所述方法還包括: 獲取全域風險APP,並利用每個所述風險APP的屬性資訊獲取關聯和/或相似的其他APP以擴充所述全域風險APP; 所述屬性資訊包括以下中的一種或多種:開發者資訊、名稱資訊、APP介紹信息。
- 根據請求項1-5中任一項所述的方法,其中,獲取訓練資料集,還包括: 通過埋點方式收集所述使用者交易行為資訊,所述使用者交易行為資料包括:交易地點IP、交易對手方資訊; 週期性收集使用者設備的APP使用資訊,根據全域風險APP確定所述使用者設備使用的風險APP,得到所述設備風險APP特徵。
- 根據請求項1-6中任一項所述的方法,其中,所述多維特徵還包括:文本特徵,所述文本特徵包括交易留言資訊。
- 根據請求項1-7中任一項所述的方法,其中,所述深度網路採用機器學習中的隨機森林或XGB。
- 根據請求項1-8中任一項所述的方法,其中,所述損失函數中設有交易金額權重因數。
- 一種反欺詐風險評估方法,包括: 獲取即時交易資訊,所述即時交易資訊包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵中的一種或多種; 將所述即時交易資訊輸入反欺詐風險評估模型,所述反欺詐風險評估模型對輸入的所述即時交易資訊執行嵌入處理以得到輸入向量,將所述輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量,將所述編碼向量輸入深度網路以得到風險預測結果; 其中,所述反欺詐風險評估模型利用如請求項1-9中任一項所述的方法訓練得到。
- 根據請求項10所述的方法,其中,還包括: 如所述風險預測結果符合預設條件,則基於所述即時交易資訊進行對應的干擾處理和/或告警處理。
- 根據請求項10或11所述的方法,其中,還包括: 基於所述風險預測結果和所述即時交易資訊更新訓練樣本集; 基於即時更新的所述訓練樣本集構建使用者關係圖,所述使用者交易關係圖以使用者為節點,以使用者之間的交易關係為邊; 通過聚類演算法和/或圖注意力演算法從所述使用者交易關係圖中挖掘出團夥節點和/或團夥交易; 基於所述團夥節點和/或所述團夥交易從所述訓練樣本集中識別隱藏欺詐樣本; 基於回饋的所述隱藏欺詐樣本對所述風險評估預測模型進行更新訓練。
- 一種反欺詐風險評估模型的訓練裝置,其中,包括: 獲取模組,用於獲取訓練樣本集,所述訓練樣本包括多維特徵及其欺詐標籤,所述多維特徵包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵; 訓練模組,用於將所述訓練樣本集輸入待訓練的反欺詐風險評估模型進行反覆運算訓練; 其中,在每輪反覆運算中,所述反欺詐風險評估模型對輸入的所述多維特徵執行嵌入處理以得到輸入向量,將所述輸入向量輸入基於自注意力機制構建的特徵學習網路以獲得加權融合後的編碼向量,將所述編碼向量輸入深度網路以得到風險預測結果,以及,利用所述風險預測結果和所述欺詐標籤構建的損失函數更新所述風險評估模型的參數。
- 一種反欺詐風險評估裝置,包括: 獲取模組,用於獲取即時交易資訊,所述即時交易資訊包括:使用者靜態特徵、使用者行為特徵以及設備風險APP特徵; 評估模組,用於將所述即時交易資訊輸入反欺詐風險評估模型,所述反欺詐風險評估模型對輸入的所述即時交易資訊執行嵌入處理以得到輸入向量,將所述輸入向量輸入基於注意力機制構建的特徵學習網路以獲得編碼向量,將所述編碼向量輸入深度網路以得到風險預測結果;其中,所述反欺詐風險評估模型利用如請求項1-9中任一項所述的方法訓練得到。
- 一種反欺詐風險評估模型的訓練裝置,包括: 至少一個處理器;以及,與至少一個處理器通信連接的記憶體;其中,記憶體存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行:如請求項1-9中任意一項所述的方法。
- 一種反欺詐風險評估裝置,包括: 至少一個處理器;以及,與至少一個處理器通信連接的記憶體;其中,記憶體存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行:如請求項10-12中任意一項所述的方法。
- 一種電腦可讀存儲介質,所述電腦可讀存儲介質存儲有程式,當所述程式被多核處理器執行時,使得所述多核處理器執行如請求項1-9中任一項所述的方法,或者請求項10-12中任一項所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111640205.2A CN114298417A (zh) | 2021-12-29 | 2021-12-29 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
CN202111640205.2 | 2021-12-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202326537A true TW202326537A (zh) | 2023-07-01 |
Family
ID=80972114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111137564A TW202326537A (zh) | 2021-12-29 | 2022-10-03 | 反欺詐風險評估方法、訓練方法、裝置及可讀存儲介質 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN114298417A (zh) |
TW (1) | TW202326537A (zh) |
WO (1) | WO2023124204A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114298417A (zh) * | 2021-12-29 | 2022-04-08 | 中国银联股份有限公司 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
CN114757581A (zh) * | 2022-05-18 | 2022-07-15 | 华南理工大学 | 一种金融交易风险评估方法、装置、电子设备及计算机可读介质 |
CN114936723B (zh) * | 2022-07-21 | 2023-04-14 | 中国电子科技集团公司第三十研究所 | 一种基于数据增强的社交网络用户属性预测方法及系统 |
CN116258579B (zh) * | 2023-04-28 | 2023-08-04 | 成都新希望金融信息有限公司 | 用户信用评分模型的训练方法及用户信用评分方法 |
CN116562901B (zh) * | 2023-06-25 | 2024-04-02 | 福建润楼数字科技有限公司 | 基于机器学习的反欺诈规则自动生成方法 |
CN117151851B (zh) * | 2023-09-12 | 2024-04-30 | 浪潮数字(山东)建设运营有限公司 | 基于遗传算法的银行风险预测方法、装置和电子设备 |
CN116934098A (zh) * | 2023-09-14 | 2023-10-24 | 山东省标准化研究院(Wto/Tbt山东咨询工作站) | 一种技术性贸易措施风险量化评估方法 |
CN117435918B (zh) * | 2023-12-20 | 2024-03-15 | 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) | 一种基于空间注意力网络与特征划分的电梯风险预警方法 |
CN117556224B (zh) * | 2024-01-12 | 2024-03-22 | 国网四川省电力公司电力科学研究院 | 一种电网设施抗震风险评估系统、方法及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180253737A1 (en) * | 2017-03-06 | 2018-09-06 | International Business Machines Corporation | Dynamicall Evaluating Fraud Risk |
CN109978538B (zh) * | 2017-12-28 | 2023-10-10 | 创新先进技术有限公司 | 确定欺诈用户、训练模型、识别欺诈风险的方法及装置 |
US20210374756A1 (en) * | 2020-05-29 | 2021-12-02 | Mastercard International Incorporated | Methods and systems for generating rules for unseen fraud and credit risks using artificial intelligence |
CN112348520A (zh) * | 2020-10-21 | 2021-02-09 | 上海淇玥信息技术有限公司 | 基于XGBoost的风险评估方法、装置和电子设备 |
CN112365338B (zh) * | 2020-11-11 | 2024-03-22 | 天翼安全科技有限公司 | 基于人工智能的数据欺诈检测方法、装置、终端及介质 |
CN114298417A (zh) * | 2021-12-29 | 2022-04-08 | 中国银联股份有限公司 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
-
2021
- 2021-12-29 CN CN202111640205.2A patent/CN114298417A/zh active Pending
-
2022
- 2022-09-07 WO PCT/CN2022/117419 patent/WO2023124204A1/zh unknown
- 2022-10-03 TW TW111137564A patent/TW202326537A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN114298417A (zh) | 2022-04-08 |
WO2023124204A1 (zh) | 2023-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023124204A1 (zh) | 反欺诈风险评估方法、训练方法、装置及可读存储介质 | |
Bilal et al. | Big Data in the construction industry: A review of present status, opportunities, and future trends | |
Wang et al. | LightLog: A lightweight temporal convolutional network for log anomaly detection on the edge | |
Patibandla et al. | Survey on clustering algorithms for unstructured data | |
WO2019129060A1 (zh) | 自动生成机器学习样本的特征的方法及系统 | |
JP7392668B2 (ja) | データ処理方法および電子機器 | |
WO2018204781A1 (en) | Analyzing sequence data using neural networks | |
US20190392258A1 (en) | Method and apparatus for generating information | |
Olmezogullari et al. | Representation of click-stream datasequences for learning user navigational behavior by using embeddings | |
CN110851761A (zh) | 基于区块链的侵权检测方法、装置、设备及存储介质 | |
CN114579584B (zh) | 数据表处理方法、装置、计算机设备和存储介质 | |
Lv et al. | Computational intelligence in security of digital twins big graphic data in cyber-physical systems of smart cities | |
Bing et al. | Heterogeneous graph neural networks analysis: a survey of techniques, evaluations and applications | |
Verma et al. | Comparative analysis of information extraction techniques for data mining | |
US11601339B2 (en) | Methods and systems for creating multi-dimensional baselines from network conversations using sequence prediction models | |
Geng et al. | Novel blockchain transaction provenance model with graph attention mechanism | |
CN110851608A (zh) | 基于区块链的侵权检测方法、装置、设备及存储介质 | |
CN106599122B (zh) | 一种基于垂直分解的并行频繁闭序列挖掘方法 | |
Chen et al. | TraceGra: A trace-based anomaly detection for microservice using graph deep learning | |
WO2016093839A1 (en) | Structuring of semi-structured log messages | |
US20210342247A1 (en) | Mathematical models of graphical user interfaces | |
Hung et al. | Term deposit subscription prediction using spark MLlib and ML packages | |
Atzberger et al. | Large-Scale Evaluation of Topic Models and Dimensionality Reduction Methods for 2D Text Spatialization | |
Ceritli et al. | ptype: Probabilistic type inference | |
Ahmadi et al. | Inductive and transductive link prediction for criminal network analysis |