TW201909090A

TW201909090A - 基於遷移深度學習的風險識別方法以及系統

Info

Publication number: TW201909090A
Application number: TW107122212A
Authority: TW
Inventors: 李旭瑞; 邱雪濤; 趙金濤; 胡奕
Original assignee: 大陸商中國銀聯股份有限公司
Priority date: 2017-07-18
Filing date: 2018-06-28
Publication date: 2019-03-01
Also published as: CN107679859B; TWI769271B; WO2019015461A1; CN107679859A

Abstract

本發明涉及基於遷移深度學習的交易風險識別方法以及系統。該方法包括：對所有可能特徵經過規定預處理生成向量，將向量集作為第一RBM（即受限玻爾茲曼機）的可見層輸入而由此建立一層RBM；利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行遷移加權BP調優；以及判斷BP調優後的RBM是否滿足規定條件，若滿足則不需要增加RBM層並繼續下述步驟，若不滿足規定條件，則重複進行RBM構建和遷移加權BP調優。根據本發明能夠建立更準確的判別模型並且更好地應對新興的欺詐手段。

Description

基於遷移深度學習的風險識別方法以及系統

本發明涉及電腦技術，更具體地涉及一種基於遷移深度學習的交易風險識別方法以及系統。

在利用機器學習進行欺詐風險識別的環節中，目前一般採用有監督的分類演算法訓練偵測模型。傳統的分類學習演算法需要預先進行特徵選擇和計算。而這些用於訓練模型的特徵很大一部分（尤其是那些經過統計得出的特徵）都是根據歷史欺詐資料集中總結出的規律推演出來的，這需要大量的經驗積累，並且難免疏漏。　　同時，在利用歷史交易資料進行欺詐風險識別模型訓練的時候，存在著嚴重的資料不平衡性，即帶有欺詐標籤的樣本數量遠遠小於非欺詐樣本的數量。人們總是嘗試使用多種演算法和技巧來減少資料不平衡性帶來的影響，總體的思想無非大多是基於欠採樣（大大減少使用的非欺詐交易樣本數量）和過採樣（人為地擴展欺詐交易樣本的數量）。這些方法總是無法避免地破壞了現實中交易資料的分佈特性，這種樣本失真問題會影響最終模型在現實應用中的效果。　　另一方面，隨著信用卡支付和移動支付的普及，欺詐手段也變得五花八門。先前的一些欺詐特徵可能並不適用於當前形勢，而另一部分更符合當前形勢的欺詐特徵卻還未被發現。這在一定程度上影響了風險識別的準確率，尤其是對未知欺詐手段的交易風險識別能力較差。　　可以看到在現有技術中存在以下這些弱點：　　人工選取特徵的不準確性；　　為緩解資料不平衡性帶來的樣本失真；　　對缺乏欺詐樣本的未知欺詐類型難以識別。

鑒於所述問題，本發明旨在提供一種能夠緩解人為選取特徵的複雜性並能夠更好識別新型欺詐手段的基於基於遷移深度學習的交易風險識別方法以及系統。　　本發明的基於遷移深度學習的交易風險識別方法，其特徵在於，具備下述步驟：　　RBM構建步驟，對所有可能特徵經過規定預處理，每一筆交易就會被映射成為一個向量，將向量集作為第一RBM的可見層輸入而由此建立一層RBM，其中，每一個RBM具有一個可見層和一個隱藏層；　　BP調優步驟，利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行遷移加權BP調優；　　第一判斷步驟，根據上述BP調優步驟的結果判斷是否滿足規定條件，若判斷結果為滿足規定條件則不需要增加RBM層並繼續下述第二判斷步驟，若判斷結果為不滿足規定條件，則重複進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止；以及　　第二判斷步驟，判斷是否隱藏層層數為奇數，若隱藏層層數為奇數，則停止構建RBM層並生成最終模型，若隱藏層層數為偶數否則刪除當前隱藏層並重複進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止。　　優選地，在所述RBM構建步驟中利用對比散度演算法對新增的RBM層進行訓練。　　優選地，在所述BP調優步驟中，訓練一層RBM就進行一次BP調優，每次BP調優僅對最近一層隱藏層以及次近隱藏層和最近隱藏層之間的參數調優。　　優選地，所述BP調優步驟包括下述子步驟：　　利用已知欺詐樣本進行遷移學習；　　每當訓練完一層RBM之後，對當前誤差進行BP調優以此來優化網路參數。　　優選地，在所述第一判斷步驟中，當判斷RBM的重構誤差的情況下則不需要增加RBM層並繼續所述第二判斷步驟，若判斷結果為重構誤差的情況下則重複進行上述RBM構建步驟和上述BP調優步驟直到滿足斷 RBM的重構誤差為止。　　優選地，設訓練樣本個數為N，可見層的特徵維度為，對於每個樣本(iN)，使用RBM的分佈進行一次Gibbs採樣後，根據概率轉移公式~ P(.|)以及~ P(.|)，得到經過隱藏層重構的可見層採樣，由此，所述重構誤差可以表示為。　　優選地，所述規定預處理包括：對變數進行歸一化、one-hot編碼、連續值的WOE變換中的一種。　　本發明的基於遷移深度學習的交易風險識別系統，其特徵在於，具備：　　RBM構建模組，對所有可能特徵經過規定預處理，每一筆交易就會被映射成為一個向量，將向量集作為第一RBM的可見層輸入而由此建立一層RBM，其中，每一個RBM具有一個可見層和一個隱藏層；　　BP調優模組，利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行BP調優；　　第一判斷模組，根據上述BP調優模組的結果判斷是否滿足規定條件，若判斷結果為滿足規定條件則不需要增加RBM層並繼續下述第二判斷模組執行的動作，若判斷結果為不滿足規定條件，則重複進行由上述RBM構建模組和上述BP調優模組執行的動作，直到滿足上述規定條件為止；以及　　第二判斷模組，判斷是否隱藏層層數為奇數，若隱藏層層數為奇數，則停止構建RBM層並生成最終模型，若隱藏層層數為偶數否則刪除當前隱藏層並重複進行上述RBM構建模組和BP調優模組執行的動作，直到滿足上述規定條件為止。　　優選地，所述RBM構建模組利用對比散度演算法對新增的RBM層進行訓練。　　優選地，所述BP調優模組訓練一層RBM就進行一次BP調優，每次BP調優僅對最近一層隱藏層以及次近隱藏層和最近隱藏層之間的參數調優。　　優選地，所述BP調優模組利用已知欺詐樣本進行遷移學習，並且，每當訓練完一層RBM之後，對當前誤差進行BP調優以此來優化網路參數。　　優選地，所述第一判斷模組當判斷 RBM的重構誤差的情況下則不需要增加RBM層並繼續所述第二判斷模組執行的動作，若判斷結果為重構誤差的情況下則重複進行上述RBM構建模組和上述BP調優模組執行的動作直到滿足斷RBM的重構誤差為止。　　優選地，所述第一判斷模組中，設訓練樣本個數為N，可見層的特徵維度為，對於每個樣本(iN)，使用RBM的分佈進行一次Gibbs採樣後，根據概率轉移公式~ P(.|)以及~ P(.|)，得到經過隱藏層重構的可見層採樣，由此，所述重構誤差可以表示為。　　優選地，所述RBM構建模組進行的規定預處理包括：對變數進行歸一化、one-hot編碼、連續值的WOE變換中的一種。　　本發明還提供一種電腦可讀介質，其上存儲有電腦程式，其特徵在於，該電腦程式被處理器執行時實現上述本發明的基於遷移深度學習的交易風險識別方法的步驟。　　本發明還提供一種電腦設備，包括記憶體、處理器以及存儲在記憶體上並可在處理器上運行的電腦程式，其特徵在於，所述處理器執行所述電腦程式時實現上述本發明的基於遷移深度學習的交易風險識別方法的步驟。　　根據本發明的基於遷移深度學習的交易風險識別方法以及風險識別系統，能夠更好地應對新興的未知欺詐手段，能夠建立更準確的判別。

下面介紹的是本發明的多個實施例中的一些，旨在提供對本發明的基本瞭解。並不旨在確認本發明的關鍵或決定性的要素或限定所要保護的範圍。　　首先，對於在本發明中將要提及的幾個概念進行說明。（1）受限玻爾茲曼機（Restricted Boltzmann Machine，RBM）　　RBM是一種可通過輸入資料集學習概率分佈的隨機生成神經網路。RBM是一種玻爾茲曼機的變體，但限定模型必須為二分圖。模型中包含對應輸入參數的可見單元（以下也稱為可見層）和對應訓練結果的隱藏單元（以下也稱為隱藏層），每條邊必須連接一個可見單元和一個隱單元。（2）BP演算法(即誤差反向傳播演算法) 　　BP演算法是在有導師指導下，適合於多層神經元網路的一種學習演算法，它建立在梯度下。反向傳播演算法主要由兩個環節(激勵傳播、權重更新)反復迴圈反覆運算，直到網路的對輸入的響應達到預定的目標範圍為止。（3）Gibbs採樣　　Gibbs採樣方法是指，瑪律可夫鏈蒙特卡爾理論（MCMC）中用來獲取一系列近似等於指定多維概率分佈（比如2個或者多個隨即變數的聯合概率分佈）觀察樣本的演算法。　　圖1是本發明的基於基於遷移深度學習的交易風險識別方法的主要步驟流程圖。　　RBM構建步驟S100：對所有可能特徵經過規定預處理，每一筆交易就會被映射成為一個向量，將向量集作為第一RBM的可見層輸入而由此建立一層RBM，其中，每一個RBM具有一個可見層和一個隱藏層；　　BP調優步驟S200：利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行遷移加權BP調優；　　第一判斷步驟S300（以下也稱為“重構誤差判斷步驟”）：根據上述BP調優步驟的結果判斷重構誤差是否滿足規定條件，若判斷結果為滿足規定條件則不需要增加RBM層並繼續下述第二判斷步驟，若判斷結果為不滿足規定條件，則重複進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止；以及　　第二判斷步驟（以下也稱為“隱藏層層數判斷步驟”）S400：判斷是否隱藏層層數為奇數，若隱藏層層數為奇數，則停止構建RBM層並生成最終模型，若隱藏層層數為偶數否則刪除當前隱藏層並重複進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止。　　以下，分別對於RBM構建步驟S100~第二判斷步驟S400進行詳細說明。　　首先，對於RBM構建步驟進行說明。　　為了進行風險識別，在選擇交易特徵的時候，需要對特徵進行一定程度上的預處理。首先我們可以根據先前的經驗，將一些較為重要的特徵經過各種變換之後作為備選特徵。而對於那些在交易資訊中體現但是看似可有可無的一些特徵，我們在這裡仍然將其加入備選特徵中來。這些特徵在原先的有監督分類模型中一般是不予採用的，否則不僅會大大增大模型的訓練難度，而且很有可能影響模型的準確性。然而，那些看似對結果無關的特徵很有可能在一定程度上也會影響最終結果，而那些先前認為有用的特徵卻可能起到誤導作用，至少有部分是冗餘特徵。　　在本發明中，將所有可能特徵進行規定預處理，這些規定預處理包括：例如對變數進行歸一化、one-hot編碼、連續值的WOE變換等等，由此，每一筆交易就會被映射為一個向量，將向量集作為第一個RBM的可見層輸入。　　我們首先採用多層受限玻爾茲曼機（RBM）進行模型預訓練。每一個RBM具有一個可見層，一個隱藏層，層內無連接，層與層之間全連接。　　推導一個RBM結構的方法如下：　　首先，定義可見變數V和隱藏變數H的聯合配置(joint configuration)的能量為：　　，　　RBM的參數包括{W, a, b}, W為可見單元和隱藏單元之間的邊的權重，a和b分別為可見單元和隱藏單元的偏置。這個能量的出現和可見層與隱藏層的每個節點的取值都有關係，那麼這個能量的出現的概率就是V和H的聯合概率密度：，　　採用對比散度演算法（Contrastive Divergence，CD）演算法來計算參數集{W, a, b}使得最大化。　　CD演算法使用Gibbs採樣達到逐漸逼近的目的，而並非追求收斂，因此訓練速度非常快。我們希望得到P(v)分佈下的樣本，而我們有訓練樣本，可以認為訓練樣本就是服從P(v)的。因此，就不需要從隨機的狀態開始gibbs採樣，而從訓練樣本開始，經過k次Gibbs採樣（實際中k=1往往就足夠了）後進行權值更新。　　所以，最開始可見單元的狀態被初始化成任意一個訓練樣本，並利用以下公式計算任意第j個（）隱藏層單元的二值狀態為1的概率：，　　下面開始一輪Gibbs採樣：在所有隱藏單元狀態確定了之後，根據下面公式來反向確定計算任意第i個（）可見層單元的二值狀態為1的概率，進而得到可見層的一個重構：這時，在利用上面得到的結果再次對隱藏層進行重構：這樣就完成了一輪Gibbs採樣。經過一批訓練樣本訓練RBM網路，每給定一個樣本就更新權重：，　　對於整個訓練集訓練完畢算一輪，達到指定輪數或者權重基本不變時優化停止。得到最優解的RBM權值矩陣之後，建立一個可見層和隱藏層之間的聯合分佈。然後將下層的RBM的隱藏層輸出作為上層RBM的可見層的輸入，再次單獨訓練上層的RBM。　　按此方法將多層RBM堆疊起來作為一個整體的多層RBM網路。然而，簡單的堆疊會出現一些問題，所以必須進行BP調優步驟S200。　　接著，就對於BP調優步驟進行具體說明。在BP調優步驟S200中，利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行BP調優，其中，訓練一層RBM就進行一次BP調優，每次BP調優僅對最近一層隱藏層以及次近隱藏層和最近隱藏層之間的參數調優，具體情況如下。　　對於交易風險來說，風險種類繁多，例如銀行卡刷卡交易就存在偽卡、盜刷以及套現等多種欺詐。然而，金融機構並非對所有的欺詐類型都有足夠多的欺詐標籤樣本，比如某企業擁有的10萬條欺詐交易記錄中，可能有9萬條都是套現欺詐，而其他所有的欺詐對應的欺詐樣本一共只有1萬條。更為甚者，對於那些新出來的欺詐類型完全沒有對應的欺詐樣本，傳統的手段很難應對這類問題。　　不過，對於這些欺詐行為來說，它們在底層還是具有一定的相似性，例如無論對於盜刷還是套現，異常的金額波動或者異常的交易地點等對於識別這些欺詐都是具有重要作用的。　　本發明利用這一點，通過組合這些底層特徵形成更加抽象的高層表示(屬性類別或特徵)，以發現資料的分散式特徵表示。因此可以利用原先訓練好的對應某種欺詐偵測的多層RBM網路的較低的幾層來對當前訓練集進行模型再訓練。而對於那些欺詐標籤資料相對較少的資料來說，也可以結合其他類別的欺詐標籤資料作為輔助資料進行訓練。　　假設選定好一批包含目標欺詐標籤資料：{}以及按一定規則抽取的相同數目的目標正常樣本，輔助欺詐標籤資料的資料：{}以及按一定規則抽取的相同數目的輔助正常樣本。將、、、整體作為訓練樣本作為有監督調優樣本。　　每當訓練完一層RBM網路之後，我們就可以對當前誤差進行BP（反向傳播）優化來優化網路參數。在其頂部增加一層臨時BP層。利用一個樣本p進行訓練後，網路的整體誤差函數如下：，　　其中，n是輸出層的節點數，是j節點的期望輸出，是j節點的計算輸出。對於二分類的欺詐來說，輸出層具有2個節點，節點0的數值代表樣本非欺詐的概率，節點1的數值代表樣本是欺詐的概率。對於正常的樣本，第0個節點的期望輸出是1而第一個節點的期望輸出是0。對於欺詐樣本來說，第0個節點的期望輸出是0而第一個節點的期望輸出是1。最終網路輸出的如果節點1的數值大於節點0的數值則判定該測試樣本為欺詐，反之則為正常。　　另外，是該樣本的局部誤差權重。最開始的時候，對於和中的所有樣本權重統一初始化為1/，而對於和中的所有樣本權重統一初始化為1/。一般來說，需要使用遷移演算法的場景主要是目標資料缺乏標籤樣本，所以輔助資料都會比目標資料要大，進而輔助資料的權重就會比目標資料的權重要小，這是符合我們的期望的。　　現在根據梯度下降演算法來調整隱藏層和輸出層之間的權值和輸出層的閥值，使得該誤差儘量最小。　　假設取sigmoid函數作為啟動函數，則該函數的導數為。　　現在設節點i和節點j之間的權值為，節點j的閥值為。那麼，節點j的輸出值可以由上層所有節點的輸出值、當前節點與上一層所有節點的權值和當前節點的閥值還有啟動函數來實現：，其中，，　　現在計算誤差的偏導數：，　　其中，其中是節點j的期望輸出值，。同理，可得。　　對於每一輪樣本的反覆運算，的根據梯度下降演算法可以調整參數如下：對於輸入層和隱藏層之間的權值和隱藏層的閥值調整量來說，由於中間隱藏層並不直接與樣本的輸出類別打交道，而是由下一層所有m個節點的誤差按權重累加得到的。假設是輸入層第k個節點和隱藏層第i個節點之間的權值。所以有，　　其中，。　　同理可得。根據梯度下降演算法可以調整參數如下：。　　這樣，利用整體訓練資料依照以上方法進行訓練反覆運算直至達到終止條件之後，注意這裡由於每訓練一層RBM就進行一次BP調優，因此每次BP調優只對最近一層隱藏層和BP層以及次近隱藏層和最近隱藏層之間的參數調優。由此，也能在一定程度上避免了多層誤差反向傳播過程中的梯度彌散問題。　　這時，如果下文提到的深層RBM網路的重構誤差，則將頂層的臨時BP層移除，再增加一層RBM。注意，在每訓練完一層RBM之後，還要對樣本進行一次權值更新。　　令，其中t代表第幾次更新樣本權值，它正好等於當前RBM網路的層數減1。計算現在整個網路在目標資料上的整體錯誤率：。　　其中是樣本p在當前的權重，是樣本p在網路輸出層第j個節點的期望輸出值，是實際輸出值。再令，那麼可以設置更新的樣本誤差權重如下：。　　可以發現對於錯分的輔助樣本來說，小於1，＜。這樣一來，如果一個輔助樣本被錯誤的分類了，我們認為這個樣本對於當前資料是很不同的，我們就降低這個資料所占的權重，降低這個樣本的誤差所占的比重。也就是說，既然這個樣本不符合當前的資料分佈，那麼它的誤差大小並不重要。而對於錯分的目標樣本來說，一般小於0.5，當然為避免演算法停止，如果反覆運算過程中發現整體誤差很大()，則統一將設置為0.5。這樣一來大於1，＞。當一個目標樣本被錯誤的分類之後，我們認為這個樣本是很難分類的，因此可以加大這個樣本的誤差權重，即更加重視該樣本的預測準確度。　　極端情況來說，如果對於那些新出來的欺詐類型完全沒有對應的欺詐樣本，完全沒有任何相關標注樣本，那麼利用以上方法邊可以只使用帶標籤的輔助樣本來訓練模型，反覆運算過程中會不斷減小被分錯的輔助樣本的誤差權重，最後使得跟當前目標樣本分佈最接近的輔助資料佔據主導作用，這樣得到的模型便可用於對目標測試資料進行分類。　　接著，對於多層RBM網路結構優化的情況進行說明並且同時對於重構誤差判斷步驟和隱藏層層數判斷步驟進行說明。　　一般認為，增加隱藏層數和節點數能夠降低網路誤差，但另一方面也會使網路複雜化，從而增加了網路的訓練時間和出現“過擬合”的傾向。隱藏層的節點如果設置太多起不到很好的特徵提取功能，而如果節點太少的話則可能致使重要資訊丟失。因此每一層隱藏層的節點個數和RBM的層數的選擇會影響整個模型的好壞。　　對於隱藏層的節點個數的選擇，目前的現技術中沒有一個最優的標準。對於傳統的包含輸入層、隱藏層、輸出層的3層神經網路中有一些經驗公式可以作為結構優化的參考。然而，對於包含多層網路的深度置信網路來說，層數的不確定性是的我們無法直接使用相應的公式。對此，本發明根據確保特徵向量映射到不同特徵空間時盡可能多地保留特徵資訊的原則，提出了以下優化網路結構的方法：　　假設每個樣本的初始特徵有維。首先，使用主成分分析法（PCA）對初始特徵進行預降維，處理後的維數為維，將作為深度RBM的最後一層的節點。這時，我們根據逐層降維的思想，進行隱藏層節點計算。　　圖2是表示逐層降維的示意圖。　　如圖2所示，按照的比例進行分割。計算可得，第1層隱藏層節點。該層隱藏層節點確定之後，則進行該層RBM網路訓練。　　由於直接計算損失函數困難，因此評判具體一層RBM網路的好壞一般使用重構誤差。設訓練樣本個數為N，可視層特徵維度為。對於每個樣本(iN)，使用RBM的分佈進行一次Gibbs採樣後，根據概率轉移公式~ P(.|)以及~ P(.|)，得到經過隱藏層重構的可視層採樣。　　由此，重構誤差可以表示為。　　其中，除以是為了方便統一度量。　　在本發明中，設定一個重構誤差閾值ξ，若重構誤差，則增加一層RBM（重構誤差判斷步驟）。對於新的RBM層，以上一層RBM的結點個數和PCA結點個數b為上、下底再次進行分割，以第二層RBM為例，。　　依次類推，可以計算得到第k層隱藏層的節點的通項公式：，　　其中具體每一層的值根據實踐調試經驗在範圍[,]內進行步進選擇，選擇重構誤差最小的對應的。一般建議＞0.5，步進大小step≈0.1，這樣在保證速度的同時又能實現良好的精確度。　　最後，對於隱藏層層數判斷步驟進行說明。根據大量的實驗和經驗，發明人發現隱藏層層數為奇數的網路性能在一定程度上明顯優於隱藏層層數為偶數的網路。因此，倘若在重構誤差判斷步驟中某一層發現重構誤差小於閾值，如果該層是奇數層隱藏層，則停止構建深層RBM，如果該層是偶數層隱藏層，還需刪除該層隱藏層後作為預訓練完成的深層RBM。這裡圖3表示了構建的層RBM層的示意圖。　　如圖3所示，構建了RBM1、RBM2、RBM3三層。　　如上所述，本發明的基於遷移深度學習的交易風險識別方法概括地包括下述主要內容：構建一層RBM；利用已知樣本進行遷移學習調優這一層網路參數；判斷是否還需要增加RBM層數，即若重構誤差，則在參數更新過的RBM網路之上增加一層RBM網路，然後重新疊加一層BP層，使用權值更新過的樣本對新增的RBM網路進行參數調優。依次反覆運算，直至重構誤差為止，如果需要則繼續增加一層RBM然後遷移學習調優直到滿足條件為止。　　圖4是表示本發明的基於遷移深度學習的交易風險識別方法的一個實施方式的流程示意圖。　　如圖4所示，在步驟S11判斷是否有與參考底層RBM網路，若沒有則繼續步驟S12，若有則繼續步驟S16。　　在步驟S12，設置初始特徵維度，利用PCA對初始特徵進行預降維。在步驟S13中，參考黃金分割比例計算新增隱藏層節點個數n_hk 。在步驟S14中，新增一層RBM層。在步驟S15中使用CD演算法對新增的RBM層進行無監督訓練。在步驟S16中，新增一層分類器輸出。在步驟S17中，使用帶權重樣本進行有監督訓練，並且進行BP調優。在步驟S18中，根據分類結果更新誤差權重。在步驟S19，計算RBM網路的重構誤差e_R 。在步驟S20中判斷是否重構誤差，若是則進入步驟S21，若否則進入步驟S23。在步驟S21中判斷RBM的層數是否為奇數層，若是的話，則繼續步驟S22，若否，則返回到步驟S23。在步驟S22中生成最終模型。在步驟S23中，移除當前輸出層並且繼續進行上述步驟S14。　　如上所述，根據本發明的基於遷移深度學習的交易風險識別方法能夠帶來以下技術效果：　　創造性地使用深度學習方法來自動學習金融交易資料的特徵，不僅緩解了人為選取特徵的複雜性，還能夠更好地應對新興的未知欺詐手段；　　前期RBM網路採用無監督映射，可以從海量的無標籤樣本中學習資料分佈特點，更能代表現實中交易資料，避免了人工降低資料不平衡性所帶來的負面影響，從而建立更準確的判別模型；　　在每一層RBM網路建立之後都使用BP層進行參數調優，優化後如果未達到期望效果則移除BP層後繼續疊加RBM網路。由於每層BP層只針對最近一層隱藏層和BP層以及次近隱藏層和最近隱藏層之間的參數調優，這可以避免多層誤差反向傳播過程中的梯度彌散問題；　　在BP參數調優的過程中，引入了人工智慧領域樣本遷移學習的思想，為每個樣本對誤差貢獻的能力設定了權重。這樣一來，對於那些欺詐標籤資料相對較少的資料也可以結合其他類別的欺詐標籤資料作為輔助資料進行訓練，甚至對於那些新出來的完全沒有對應的欺詐樣本的欺詐類型的偵測模型也可以借助輔助資料進行訓練了；　　在設計深度網路的過程中實現了一套確定隱藏層層數和每層隱藏層節點個數的優化演算法。該方法能夠指導性的決定深度網路的結構，減少盲目嘗試網路參數調節帶來的時間損失及不穩定性，並且能在保證資訊完備性的情況下實現良好的特徵提取效果。　　以上對於本發明的基於遷移深度學習的交易風險識別方法進行了說明，下面對於本發明的基於遷移深度學習的交易風險識別系統進行簡單說明。　　圖5是表示本發明的基於遷移深度學習的交易風險識別系統的構造圖。如圖5所示，本發明的基於遷移深度學習的交易風險識別系統具備：RBM構建模組100，對所有可能特徵經過規定預處理，每一筆交易就會被映射成為一個向量，將向量集作為第一RBM的可見層輸入而由此建立一層RBM，其中，每一個RBM具有一個可見層和一個隱藏層；BP調優模組200，利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行BP調優；第一判斷模組300，根據上述BP調優模組的結果判斷是否滿足規定條件，若判斷結果為滿足規定條件則不需要增加RBM層並繼續下述第二判斷模組執行的動作，若判斷結果為不滿足規定條件，則重複進行由上述RBM構建模組和上述BP調優模組執行的動作，直到滿足上述規定條件為止；以及第二判斷模組400，判斷是否隱藏層層數為奇數，若隱藏層層數為奇數，則停止構建RBM層並生成最終模型，若隱藏層層數為偶數否則刪除當前隱藏層並重複進行上述RBM構建模組和BP調優模組執行的動作，直到滿足上述規定條件為止。　　可選地，RBM構建模組100利用對比散度演算法對新增的RBM層進行訓練，並且述RBM構建模組100進行的規定預處理包括：對變數進行歸一化、one-hot編碼、連續值的WOE變換中的一種。　　可選地，BP調優模組200訓練一層RBM就進行一次BP調優，每次BP調優僅對最近一層隱藏層以及次近隱藏層和最近隱藏層之間的參數調優，而且，BP調優模組200利用已知欺詐樣本進行遷移學習，並且，每當訓練完一層RBM之後，對當前誤差進行BP調優以此來優化網路參數。　　可選地，當第一判斷模組300判斷RBM的重構誤差的情況下則不需要增加RBM層並繼續所述第二判斷模組執行的動作，若判斷結果為重構誤差的情況下則重複進行RBM構建模組100和BP調模組200執行的動作直到滿足重構誤差，其中，設訓練樣本個數為N，可見層的特徵維度為，對於每個樣本(iN)，使用RBM的分佈進行一次Gibbs採樣後，根據概率轉移公式~ P(.|)以及~ P(.|)，得到經過隱藏層重構的可見層採樣，由此，所述重構誤差可以表示為。　　再者，本發明提供一種電腦可讀介質，其上存儲有電腦程式，該電腦程式被處理器執行時實現上述本發明的基於遷移深度學習的交易風險識別方法的步驟。　　再者，本發明提供一種電腦設備，包括記憶體、處理器以及存儲在記憶體上並可在處理器上運行的電腦程式，所述處理器執行所述電腦程式時實現上述本發明的基於遷移深度學習的交易風險識別方法的步驟。　　作為電腦可讀介質，存在磁性記錄裝置、光碟、光磁記錄介質、半導體記憶體等。對於磁性記錄裝置，存在HDD、FD、磁帶等。對於光碟，存在DVD（Digital Versatile Disc，數位通用光碟）、DVD-RAM、CD-ROM、CD-R（Recordable，可記錄）/RW（ReWritable，可重寫）等。對於光磁記錄裝置，存在MO（Magneto Optical disk，磁光碟）等。　　以上例子主要說明了本發明的基於基於遷移深度學習的交易風險識別方法以及系統。儘管只對其中一些本發明的具體實施方式進行了描述，但是本領域普通技術人員應當瞭解，本發明可以在不偏離其主旨與範圍內以許多其他的形式實施。因此，所展示的例子與實施方式被視為示意性的而非限制性的，在不脫離如所附各權利要求所定義的本發明精神及範圍的情況下，本發明可能涵蓋各種的修改與替換。

S100~S400‧‧‧步驟

S11~S23‧‧‧步驟

100‧‧‧RBM構建模組

200‧‧‧BP調優模組

300‧‧‧第一判斷模組

400‧‧‧第二判斷模組

圖1是本發明的基於基於遷移深度學習的交易風險識別方法的主要步驟流程圖。　　圖2是表示逐層降維的示意圖。　　圖3表示了構建的層RBM層的示意圖。　　圖4是表示本發明的基於遷移深度學習的交易風險識別方法的一個實施方式的流程示意圖。　　圖5是表示本發明的基於遷移深度學習的交易風險識別系統的構造圖。

Claims

一種基於遷移深度學習的交易風險識別方法，其特徵在於，具備下述步驟：　　RBM構建步驟，對所有可能特徵經過規定預處理，每一筆交易就會被映射成為一個向量，將向量集作為第一RBM的可見層輸入而由此建立一層RBM，其中，每一個RBM具有一個可見層和一個隱藏層；　　BP調優步驟，利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行遷移加權BP調優；以及　　第一判斷步驟，根據上述BP調優步驟的結果判斷是否滿足規定條件，若判斷結果為滿足規定條件則不需要增加RBM層並繼續下述第二判斷步驟，若判斷結果為不滿足規定條件，則重複進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止。
如申請專利範圍第1項所述的基於遷移深度學習的交易風險識別方法，其中，　　在所述第一判斷步驟之後還具備：　　第二判斷步驟，判斷是否隱藏層層數為奇數，若隱藏層層數為奇數，則停止構建RBM層並生成最終模型，若隱藏層層數為偶數否則刪除當前隱藏層並重複進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止。
如申請專利範圍第1項所述的基於遷移深度學習的交易風險識別方法，其中，　　在所述RBM構建步驟中利用對比散度演算法對新增的RBM層進行訓練。
如申請專利範圍第1項所述的基於遷移深度學習的交易風險識別方法，其中，　　在所述BP調優步驟中，訓練一層RBM就進行一次BP調優，每次BP調優僅對最近一層隱藏層以及次近隱藏層和最近隱藏層之間的參數調優。
如申請專利範圍第1項所述的基於遷移深度學習的交易風險識別方法，其中，　　所述BP調優步驟包括下述子步驟：　　利用已知欺詐樣本進行遷移學習；　　每當訓練完一層RBM之後，對當前誤差進行BP調優以此來優化網路參數。
如申請專利範圍第1項所述的基於遷移深度學習的交易風險識別方法，其中，　　在所述第一判斷步驟中，當判斷RBM的重構誤差的情況下則不需要增加RBM層並繼續所述第二判斷步驟，若判斷結果為重構誤差的情況下則重複進行上述RBM構建步驟和上述BP調優步驟直到滿足斷RBM的重構誤差為止。
如申請專利範圍第5項所述的基於遷移深度學習的交易風險識別方法，其中，　　設訓練樣本個數為N，可見層的特徵維度為，對於每個樣本(iN)，使用RBM的分佈進行一次Gibbs採樣後，根據概率轉移公式~ P(.|)以及~ P(.|)，得到經過隱藏層重構的可見層採樣，由此，所述重構誤差可以表示為。
一種基於遷移深度學習的交易風險識別系統，其特徵在於，具備：　　RBM構建模組，對所有可能特徵經過規定預處理，每一筆交易就會被映射成為一個向量，將向量集作為第一RBM的可見層輸入而由此建立一層RBM，其中，每一個RBM具有一個可見層和一個隱藏層；　　BP調優模組，利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行BP調優；以及　　第一判斷模組，根據上述BP調優模組的結果判斷是否滿足規定條件，若判斷結果為滿足規定條件則不需要增加RBM層並繼續下述第二判斷模組執行的動作，若判斷結果為不滿足規定條件，則重複進行由上述RBM構建模組和上述BP調優模組執行的動作，直到滿足上述規定條件為止。
如申請專利範圍第8項所述的基於遷移深度學習的交易風險識別系統，其中，還具備：　　第二判斷模組，判斷是否隱藏層層數為奇數，若隱藏層層數為奇數，則停止構建RBM層並生成最終模型，若隱藏層層數為偶數否則刪除當前隱藏層並重複進行上述RBM構建模組和BP調優模組執行的動作，直到滿足上述規定條件為止。
如申請專利範圍第8項所述的基於遷移深度學習的交易風險識別系統，其中，　　所述RBM構建模組利用對比散度演算法對新增的RBM層進行訓練。
如申請專利範圍第8項所述的基於遷移深度學習的交易風險識別系統，其中，　　所述BP調優模組訓練一層RBM就進行一次BP調優，每次BP調優僅對最近一層隱藏層以及次近隱藏層和最近隱藏層之間的參數調優。
如申請專利範圍第8項所述的基於遷移深度學習的交易風險識別系統，其中，　　所述BP調優模組利用已知欺詐樣本進行遷移學習，並且，每當訓練完一層RBM之後，對當前誤差進行BP調優以此來優化網路參數。
如申請專利範圍第8項所述的基於遷移深度學習的交易風險識別系統，其中，　　所述第一判斷模組當判斷RBM的重構誤差的情況下則不需要增加RBM層並繼續所述第二判斷模組執行的動作，若判斷結果為重構誤差的情況下則重複進行上述RBM構建模組和上述BP調優模組執行的動作直到滿足斷RBM的重構誤差為止。
如申請專利範圍第13項所述的基於遷移深度學習的交易風險識別系統，其中，　　所述第一判斷模組中，設訓練樣本個數為N，可見層的特徵維度為，對於每個樣本(iN)，使用RBM的分佈進行一次Gibbs採樣後，根據概率轉移公式~ P(.|)以及~ P(.|)，得到經過隱藏層重構的可見層採樣，由此，所述重構誤差可以表示為。
一種電腦可讀介質，其上存儲有電腦程式，其特徵在於，該電腦程式被處理器執行時實現申請專利範圍第1~7項中任意一項所述方法的步驟。
一種電腦設備，包括記憶體、處理器以及存儲在記憶體上並可在處理器上運行的電腦程式，其特徵在於，所述處理器執行所述電腦程式時實現申請專利範圍第1~7項中任意一項所述方法的步驟。