TWI718411B

TWI718411B - 機器學習模型的訓練方法、裝置以及電子設備

Info

Publication number: TWI718411B
Application number: TW107132758A
Authority: TW
Inventors: 郭龍
Original assignee: 開曼群島商創新先進技術有限公司
Priority date: 2017-11-22
Filing date: 2018-09-18
Publication date: 2021-02-11
Also published as: CN107798390A; TW201926148A; EP3690763A1; US20200210899A1; SG11202004037TA; US10943186B2; CN107798390B; WO2019100844A1; EP3690763A4

Abstract

本說明書提供一種機器學習模型的訓練方法，包括：將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對所述負樣本分別進行風險評估得到風險評分；過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本；基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型。

Description

機器學習模型的訓練方法、裝置以及電子設備

本說明書係關於電腦應用領域，尤其關於一種機器學習模型的訓練方法、裝置以及電子設備。

在移動支付領域，出於支付安全上的考慮，支付平台通常都會在風控系統中部署透過有監督的機器學習訓練構建出的風險模型，對用戶的日常交易進行風險評分，以及時的發現用戶的異常交易。　　在訓練風險模型時，通常可以將那些發生了交易異常的交易標記為正樣本(比如用戶主動報案的帳戶盜用等)，其餘未發生交易異常的交易標記為負樣本。然後可以基於這些正樣本和負樣本進行有監督的機器學習訓練。當模型訓練完畢，後續可以使用該模型對用戶的日常交易進行風險評分，進而支付平台可以基於用戶日常交易的風險評分來進行風險決策，及時的發現用戶的異常交易。

本說明書提出一種機器學習模型的訓練方法，包括：　　將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；　　基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對所述負樣本分別進行風險評估得到風險評分；　　過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本；　　基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型。　　可選的，所述過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本，包括：　　刪除所述訓練樣本集合中所述風險評分大於預設閾值的負樣本。　　可選的，所述過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本，包括：　　將所述訓練樣本集合中所述風險評分大於預設閾值的負樣本重新標記為正樣本。　　可選的，所述基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型，包括：　　為重新標記的正樣本與所述訓練樣本集合中原有的正樣本對應的損失函數，分別配置權重值；其中，所述重新標記的正樣本對應的損失函數的權重值，小於所述原有的正樣本對應的損失函數的權重值；　　基於所述重新標記的正樣本、所述訓練樣本集合中原有的正樣本以及所述訓練樣本集合中剩餘的負樣本訓練有監督的風險模型。　　可選的，所述風險評分表徵風險發生機率；　　所述方法還包括：　　將所述風險評分大於預設閾值的負樣本重新標記為正樣本後，將所述正樣本的風險評分配置為該重新標記的負樣本對應的損失函數的權重值；以及，將原有的負樣本對應的損失函數的權重值設置為1。　　可選的，還包括：　　基於線上資料構建預測樣本；　　基於重新訓練的模型對該預測樣本進行風險評估得到風險評分。　　本說明書提出一種機器學習模型的訓練裝置，包括：　　標記模組，將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；　　評估模組，基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對所述負樣本分別進行風險評估得到風險評分；　　過濾模組，過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本；　　訓練模組，基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型。　　可選的，所述過濾模組：　　刪除所述訓練樣本集合中所述風險評分大於預設閾值的負樣本。　　可選的，所述過濾模組：　　將所述訓練樣本集合中所述風險評分大於預設閾值的負樣本重新標記為正樣本。　　可選的，所述訓練模組進一步：　　為重新標記的正樣本與所述訓練樣本集合中原有的正樣本對應的損失函數，分別配置權重值；其中，所述重新標記的正樣本對應的損失函數的權重值，小於所述原有的正樣本對應的損失函數的權重值；　　基於所述重新標記的正樣本、所述訓練樣本集合中原有的正樣本以及所述訓練樣本集合中剩餘的負樣本訓練有監督的風險模型。　　可選的，所述風險評分表徵風險發生機率；　　所述過濾模組進一步：　　將所述風險評分大於預設閾值的負樣本重新標記為正樣本後，將所述負樣本的風險評分配置為該重新標記的正樣本對應的損失函數的權重值；以及，將原有的正樣本對應的損失函數的權重值設置為1。　　可選的，所述評估模組進一步：　　基於線上資料構建預測樣本；　　基於重新訓練的模型對該預測樣本進行風險評估得到風險評分。　　本說明書還提出一種電子設備，包括：　　處理器；　　用於儲存機器可執行指令的記憶體；　　其中，透過讀取並執行所述記憶體儲存的與有監督機器學習模型的訓練的控制邏輯對應的機器可執行指令，所述處理器被促使：　　將訓練樣本集合中攜帶標籤的樣本標記為正樣本，未攜帶標籤的樣本標記為負樣本；　　基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對所述負樣本分別進行風險評估得到風險評分；　　過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本；　　基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型。　　本說明書實施例所提供的技術方案，透過將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本，基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對訓練樣本集合中的負樣本分別進行風險評估得到風險評分，然後對該訓練樣本集合中的風險評分大於預設閾值的負樣本作為疑似正樣本進行過濾處理，並基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型; 　　一方面，可以發現並過濾掉訓練樣本集合中的負樣本中的疑似正樣本，提高訓練樣本集合中正樣本和負樣本的標記準確度；另一方面，使用過濾後的訓練樣本集合中的正樣本和負樣本重新訓練模型，有助於提升訓練出的模型的性能。

這裡將詳細地對示例性實施例進行說明，其示例表示在附圖中。下面的描述涉及附圖時，除非另有表示，不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式並不代表與本申請相一致的所有實施方式。相反，它們僅是與如所附申請專利範圍中所詳述的、本申請的一些方面相一致的裝置和方法的例子。　　在本申請使用的術語是僅僅出於描述特定實施例的目的，而非旨在限制本申請。在本申請和所附申請專利範圍中所使用的單數形式的“一種”、“所述”和“該”也旨在包括多數形式，除非上下文清楚地表示其他含義。還應當理解，本文中使用的術語“和/或”是指並包含一個或多個相關聯的列出專案的任何或所有可能組合。　　應當理解，儘管在本申請可能採用術語第一、第二、第三等來描述各種資訊，但這些資訊不應限於這些術語。這些術語僅用來將同一類型的資訊彼此區分開。例如，在不脫離本申請範圍的情況下，第一資訊也可以被稱為第二資訊，類似地，第二資訊也可以被稱為第一資訊。取決於語境，如在此所使用的詞語“如果”可以被解釋成為“在……時”或“當……時”或“回應於確定”。　　在訓練有監督的機器學習模型時，由於對訓練樣本進行標記的準確度，通常直接決定訓練出的模型的準確度；因此，在模型訓練階段，如何改善訓練樣本的標記準確度，來提升訓練出的模型的準確度，將具有十分重要的意義。　　例如，以基於用戶的歷史交易資料來訓練有監督的風險模型為例，在訓練風險模型時，通常可以將那些發生了風險事件的交易(比如，用戶的交易發生財產損失後主動報案)標記為正樣本，將其餘未發生風險事件的交易標記為負樣本。而在實際應用中，通常可能會存在一些發生了風險事件但用戶未主動報案的交易，這就可能導致訓練樣本集中的負樣本中可能混入一些正樣本的情況。對於建模方而言，直接使用該訓練樣本集來訓練模型，必然會對模型的準確度造成影響。因此，建模方如何能夠及時發現並過濾掉這些負樣本中混入的疑似正樣本，則將能夠顯著的提升訓練出的模型的準確度。　　有鑑於此，本說明書針對傳統的基於pu-learning的模型訓練過程進行改進，提出一種透過將unlabel樣本(無標籤樣本)標記為正樣本(positive樣本)來訓練有監督的機器學習模型，並利用訓練完成的有監督的機器學習模型對訓練樣本集中的負樣本(negative樣本)進行風險評估的方式，發現並過濾訓練樣本集中的負樣本中的疑似正樣本，以提升訓練樣本集中的正樣本和負樣本的標記準確度的技術方案。　　在實現時，可以對預先創建一個包含若干攜帶風險標籤的樣本和不攜帶風險標籤的樣本訓練樣本集，然後將該訓練樣本集中攜帶風險標籤的樣本標記為正樣本，將該訓練樣本集中不攜帶標籤的unlabel樣本標記為負樣本，然後基於標記的正樣本和負樣本訓練有監督的機器學習模型。　　當模型訓練完成後，可以進一步基於該有監督的機器學習模型對訓練樣本集中的負樣本分別進行風險評估得到風險評分，然後篩選出訓練樣本集中上述風險評分大於預設閾值的負樣本，並將篩選出的這些負樣本作為疑似負樣本從訓練樣本集中過濾掉；　　例如，在一種實現方式中，可以將風險評分大於預設閾值的負樣本直接從訓練樣本集中刪除；或者，在另一種實現方式中，也可以將風險評分大於預設閾值的負樣本作為疑似正樣本重新標記為正樣本，並為重新標記的正樣本對應的損失函數，設置一個小於原有的正樣本對應的損失函數的權重值。　　當對訓練樣本集合中的疑似負樣本完成過濾後，可以基於過濾後的訓練樣本集合中的正樣本和負樣本重新對有監督的機器學習模型進行訓練，來構建風險模型。　　一方面，可以發現並過濾掉訓練樣本集合中的負樣本中的疑似正樣本，提高訓練樣本集合中正樣本和負樣本的標記準確度；　　另一方面，使用過濾後的訓練樣本集合中的正樣本和負樣本重新訓練模型，有助於提升訓練出的模型的性能。　　下面透過具體實施例並結合具體的應用場景對本說明書進行描述。　　請參考圖1，圖1是本說明書一實施例提供的一種有監督機器學習模型的訓練方法，執行以下步驟：　　步驟102，將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；　　步驟104，基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對所述負樣本分別進行風險評估得到風險評分；　　步驟106，過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本；　　步驟108，基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型。　　上述風險模型，具體可以包括按照有監督的機器學習方法，基於預設的訓練樣本集合中的訓練樣本訓練出的機器學習模型；其中，上述風險模型的具體類型，在本說明書中不進行特別限定，在實際應用中，可以包括任意類型的風險模型；　　例如，在一種場景中，上述風險模型，具體可以是基於用戶的歷史交易資料構建的訓練樣本集訓練出的，用於對用戶的日常交易進行風險評估的風險模型，透過該風險模型可以對用戶發起的交易進行風險評估，得到對應的交易風險評分，進而可以透過該交易風險評分來決策用戶發起的該筆交易是否存在風險。　　又如，在另一種場景中，上述訓練完成的模型，具體也可以是基於用戶的歷史交易記錄、違約記錄、還款記錄等用戶資料構建的訓練樣本集訓練出的，用於對用戶的信用進行風險評估的信用模型，透過該信用模型可以對用戶的信用進行風險評估，得到對應的信用風險評分，進而可以透過該信用風險評分來決策該用戶是否為可能會發生諸如信用違約等風險行為的高風險用戶。　　以下以上述風險模型為用於對用戶發起的交易進行風險評估的風險模型為例，對本說明書的技術方案進行詳細描述。　　需要說明的是，以上述風險模型為用於對用戶發起的交易進行風險評估的風險模型為例，僅為示例性的，在實際應用中，上述風險模型也可以是其它類型的有監督的風險模型(比如信用模型)，在本說明書中不進行特別限定。　　在本說明書中，建模方可以預先收集大量用戶的歷史交易資料，從收集到的歷史交易資料中提取出若干維度的交易特徵作為建模特徵，並基於這些建模特徵構建特徵向量作為訓練樣本，然後再基於這些訓練樣本構建出一個特徵矩陣作為訓練樣本集合。　　其中，用於構建訓練樣本的建模特徵，可以涵蓋任意形式的與用戶的交易風險相關的特徵，在本說明書中不進行特別限定；例如，可以包含諸如用戶是否在異地登錄、交易時間段、交易金額等維度的交易特徵。　　當訓練樣本集合構建完成，建模方可以基於用戶主動回饋的資訊，將該訓練樣本集合中發生了風險事件的訓練樣本分別標記對應的風險標籤。此時，剩餘的未攜帶風險標籤的訓練樣本，即為unlabel樣本。　　當建模方為訓練樣本集合中發生風險事件的訓練樣本標記了風險標籤後，可以將這些攜帶風險標籤的訓練樣本標記為正樣本，將剩餘的未攜帶風險標籤的unlabel樣本標記為負樣本，然後可以基於該訓練樣本集合中的這些正樣本和負樣本，對預設的有監督的機器學習模型進行訓練，來構建上述風險模型。　　其中，上述有監督的機器學習模型的具體類型，在本說明書中不進行特別限定；例如，上述機器學習模型具體可以是LR(Logistic Regression, 邏輯回歸)模型，或者其它的形式的有監督的機器學習模型。　　在實際應用中，有監督的機器學習模型，通常使用損失函數(Loss Function)，來描述訓練樣本和對應的樣本標籤之間的擬合誤差。在實際的模型訓練過程中，可以將訓練樣本和對應的樣本標籤作為輸入值代入損失函數中進行迭代運算，直至算法收斂，來反向求解出訓練樣本和對應的樣本標籤之間的擬合誤差最小時的模型參數的取值。即透過損失函數來訓練有監督的機器學習模型的過程，可以理解為透過損失函數來反向求解出，訓練樣本和對應的樣本標籤之間的擬合誤差最小時的最優模型參數的取值的過程。　　當求解出訓練樣本和對應的樣本標籤之間的擬合誤差最小時的模型參數的取值，模型訓練完畢。此時該訓練完成的模型，即為最終構建完成的用於對用戶的日常交易進行風險評估的風險模型。　　在本說明書中，由於在實際應用中，建模方收集到的用於構建訓練樣本的歷史交易資料中，通常可能會存在一些發生了風險事件但用戶未主動報案的交易，這就可能導致上述訓練樣本集中未攜帶風險標籤的負樣本中可能混入一些疑似的正樣本的情況；因此，為了進一步改善上述訓練樣本集中被標記出的正樣本和負樣本的準確度，當上述風險模型訓練完畢，建模方還可以透過該風險模型進一步對上述訓練樣本集中的負樣本分別進行風險評估的方式，來發現並過濾訓練樣本集中的負樣本中的疑似正樣本。　　在實現時，當上述風險模型訓練完畢，建模方可以將原有的訓練樣本集合中的負樣本分別作為預測樣本，輸入到風險模型進行風險評估，得到對應的風險評分，然後篩選出訓練樣本集合中風險評分大於預設閾值的負樣本作為疑似正樣本。　　其中，上述預設閾值的取值大小，在本說明書中不進行特別限定，本領域技術人員可以基於實際的需求進行靈活配置。　　當從訓練樣本集合中的負樣本中，篩選出風險評分大於預設閾值的負樣本後，建模方可以對這些篩選出的負樣本作為疑似正樣本進行過濾處理，以提高該訓練樣本集合中的正樣本和負樣本的標記準確度。　　其中，建模方在過濾訓練樣本集合中風險評分大於預設閾值的負樣本時，具體可以透過以下示出兩種方式來完成：　　在示出的一種實施方式中，建模方可以直接將這些風險評分大於預設閾值的負樣本從原有的訓練樣本集合中刪除，來過濾掉上述訓練樣本集合中的這些疑似正樣本。　　在示出的另一種實施方式中，也可以不採用直接刪除的方式，而是將這些風險評分大於預設閾值的負樣本重新標記成疑似正樣本，並為該疑似正樣本對應的損失函數，配置一個小於與原有的正樣本對應的損失函數的權重值。　　當然，在實際應用中，也可以不將這些負樣本重新標記成疑似正樣本，而是直接將這些負樣本重新標記成正樣本，並且為這些重新標記的正樣本的損失函數，配置一個與原有的正樣本對應的損失函數相同的權重值；比如，可以將這些重新標記的正樣本和原有的正樣本對應的損失函數的權重值統一設置為1。　　其中，在訓練有監督的機器學習模型時，通常會使用兩個不同的損失函數，來分別描述正樣本和對應的樣本標籤，以及負樣本和對應的樣本標籤之間的擬合誤差。因此，有監督的機器學習模型的目標方程式，通常可以用如下的公式進行表徵：

其中，在以上公式中：

即為最終需要訓練的機器學習模型的函數運算式，表示訓練出的模型對訓練樣本

的預測結果(即最終輸出的風險評分)。

表示與正樣本(標記為1的樣本)對應的損失函數，用於表徵模型對正樣本的預測結果

和真實標記

=1之間的誤差損失；

表示與負樣本(標記為-1的樣本)對應的損失函數，用於表徵模型對負樣本的預測結果

和真實標記

=-1之間的誤差損失。　　其中，上述損失函數

)的具體類型，在本說明書中不進行特別限定；例如，在實際應用中，可以選擇常見的log-loss函數或者hinge-loss函數。　　其中，當上述損失函數

採用log-loss函數，運算式為：

當上述損失函數

採用hinge-loss函數，運算式為：

。　　在本說明書中，由於被標記出的疑似正樣本仍然參與模型訓練，因此相當於訓練樣本集合中的訓練樣本被標記成為“正樣本”、“負樣本”和“疑似正樣本”三類；因此，在這種情況下，建模方在構建上述模型的目標方程式時，可以為以上三類訓練樣本分別構建一個損失函數，並為與正樣本對應的損失函數和與疑似正樣本對應的損失函數，分別配置一個對應的權重值，並為與該疑似正樣本對應的損失函數，配置一個小於與原有的正樣本對應的損失函數的權重值。　　在這種情況下，上述有監督的機器學習模型的目標方程式，則可以用如下的公式進行表徵：

其中，

表示為疑似正樣本對應的損失函數配置的權重值。

表示為原有的正樣本對應的損失函數配置的權重值。其中，

取值小於

；例如，在實際應用中，可以將

的取值設置為一個遠小於

的取值。　　其中，

表示與原有的正樣本(標記為1的樣本)對應的損失函數；

表示與原有的負樣本(標記為-1的樣本)對應的損失函數；

表示與疑似正樣本(標記為-2的樣本)對應的損失函數。　　其中，需要說明的是，與原有的負樣本對應的損失函數，可以配置權重值，也可以不配置權重值，在本說明書中不進行特別限定；　　例如，在一種實現方式中，也可以為與原有的負樣本對應的損失函數配置一個，與原有的正樣本對應的損失函數相同的權重值，在這種情況下，上述有監督的機器學習模型的目標方程式，則可以用如下的公式進行表徵：

其中，需要補充說明的是，以上示出的將正樣本標記為1、將負樣本標記為-1，將疑似正樣本標記為-2僅為示例性的，並不用於限定；在實際應用中，對正樣本、負樣本和疑似正樣本進行標記時所採用的標籤類型，本領域技術人員可以靈活定義。　　在本說明書中，透過為與疑似正樣本對應的損失函數配置一個較小的權重值，可以降低疑似正樣本對訓練完成的模型的輸出結果的貢獻度，從而間接的達到過濾掉訓練樣本集中的疑似正樣本的目的。　　其中，在實際應用中，為與疑似正樣本對應的損失函數配置的權重值的具體取值大小，只需要是一個小於與原有正樣本對應的損失函數配置的權重值即可，在本說明書中不進行特別限定，　　例如，在示出的一種實施方式中，由於風險模型最終輸出的風險評分，通常用於表徵風險發生機率，是一個介於0和1之間的浮點數；因此，可以將該疑似正樣本的風險評分，作為與疑似正樣本對應的損失函數的權重值，而將與原有的正樣本對應的損失函數的權重值設置為1。其中，需要說明的是，由於不同的疑似正樣本的風險評分可能不同，因此在使用損失函數對不同的疑似正樣本進行訓練時，該損失函數的權重值也將不同。　　在本說明書中，當建模方透過以上示出的實施方式，對原有的訓練樣本集合中風險評分大於預設閾值的負樣本過濾後，可以基於過濾後的訓練樣本集合中的原有正樣本、疑似正樣本和原有的負樣本重新訓練上述有監督的機器學習模型；其中，具體的訓練過程在本申請中不再贅述。　　當上述有監督的機器學習模型基於過濾後的訓練樣本集合重新訓練完成後，建模方可以在風控系統中部署該模型，並基於該模型對用戶日常的線上交易進行風險評估，為用戶日常的線上交易進行打分得到風險評分，然後基於得到的風險評分來決策該交易是否存在風險；　　例如，在實現時，風控系統可以採集用戶的線上交易資料，從該線上交易資料中提取出若干維度的交易特徵來構建預測樣本，並將該預測樣本輸入到該模型中進行風險評估，得到風險評分；然後將該風險評分與預設的風險閾值進行比較，來確定該交易是否存在風險；如果該風險評分大於該風險閾值，此時風控系統可以將該交易決策為風險交易，可以直接終止該交易，或者對該用戶身份進一步進行校驗；如果校驗通過，此時可以執行該筆交易；否則，可以終止該筆交易。　　透過以上實施例可知，在本說明書中，在訓練樣本集合中包含大量的正樣本和unlable樣本的場景下，不再採用的傳統的基於pu-learning的模型訓練過程中，從unlable樣本中篩選出可靠負樣本，然後再基於正樣本和可靠負樣本來進行有監督的機器學習的方式，而是透過將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本，基於標記的所述正樣本和負樣本訓練有監督的機器學習模型，並基於訓練完成的模型對訓練樣本集合中的負樣本分別進行風險評估得到風險評分，然後對該訓練樣本集合中的風險評分大於預設閾值的負樣本作為疑似正樣本進行過濾處理，並基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的機器學習模型；　　一方面，可以發現並過濾掉訓練樣本集合中的負樣本中的疑似正樣本，提高訓練樣本集合中正樣本和負樣本的標記準確度；　　另一方面，使用過濾後的訓練樣本集合中的正樣本和負樣本重新訓練模型，有助於提升訓練出的模型的性能。　　與上述方法實施例相對應，本說明書還提供了一種有監督機器學習模型的訓練裝置的實施例。本說明書的有監督機器學習模型的訓練裝置的實施例可以應用在電子設備上。裝置實施例可以透過軟體實現，也可以透過硬體或者軟硬體結合的方式實現。以軟體實現為例，作為一個邏輯意義上的裝置，是透過其所在電子設備的處理器將非易失性記憶體中對應的電腦程式指令讀取到記憶體中運行形成的。從硬體層面而言，如圖2所示，為本說明書的有監督機器學習模型的訓練裝置所在電子設備的一種硬體結構圖，除了圖2所示的處理器、記憶體、網路介面、以及非易失性記憶體之外，實施例中裝置所在的電子設備通常根據該電子設備的實際功能，還可以包括其他硬體，對此不再贅述。　　圖3是本說明書一示例性實施例示出的一種有監督機器學習模型的訓練裝置的框圖。　　請參考圖3，所述有監督機器學習模型的訓練裝置30可以應用在前述圖2所示的電子設備中，包括有：標記模組301、評估模組302、過濾模組303和訓練模組304；　　標記模組301，將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；　　評估模組302，基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對所述負樣本分別進行風險評估得到風險評分；　　過濾模組303，過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本；　　訓練模組304，基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型。　　在本實施例中，所述過濾模組303：　　刪除所述訓練樣本集合中所述風險評分大於預設閾值的負樣本。　　在本實施例中，所述過濾模組303：　　將所述訓練樣本集合中所述風險評分大於預設閾值的負樣本重新標記為正樣本。　　在本實施例中，所述訓練模組304進一步：　　為重新標記的正樣本與所述訓練樣本集合中原有的正樣本對應的損失函數，分別配置權重值；其中，所述重新標記的正樣本對應的損失函數的權重值，小於所述原有的正樣本對應的損失函數的權重值；　　基於所述重新標記的正樣本、所述訓練樣本集合中原有的正樣本以及所述訓練樣本集合中剩餘的負樣本訓練有監督的風險模型。　　在本實施例中，所述風險評分表徵風險發生機率；　　所述過濾模組303進一步：　　將所述風險評分大於預設閾值的負樣本重新標記為正樣本後，將所述負樣本的風險評分配置為該重新標記的正樣本對應的損失函數的權重值；以及，將原有的正樣本對應的損失函數的權重值設置為1。　　在本實施例中，所述評估模組302進一步：　　基於線上資料構建預測樣本；　　基於重新訓練的模型對該預測樣本進行風險評估得到風險評分。　　上述裝置中各個模組的功能和作用的實現過程具體詳見上述方法中對應步驟的實現過程，在此不再贅述。　　對於裝置實施例而言，由於其基本對應於方法實施例，所以相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的，其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位於一個地方，或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部模組來實現本說明書方案的目的。本領域普通技術人員在不付出創造性勞動的情況下，即可以理解並實施。　　上述實施例闡明的系統、裝置、模組或單元，具體可以由電腦晶片或實體實現，或者由具有某種功能的產品來實現。一種典型的實現設備為電腦，電腦的具體形式可以是個人電腦、膝上型電腦、蜂窩電話、相機電話、智慧型電話、個人數位助理、媒體播放機、導航設備、電子郵件收發設備、遊戲控制台、平板電腦、可穿戴設備或者這些設備中的任意幾種設備的組合。　　與上述方法實施例相對應，本說明書還提供了一種電子設備的實施例。該電子設備包括：處理器以及用於儲存機器可執行指令的記憶體；其中，處理器和記憶體通常透過內部匯流排相互連接。在其他可能的實現方式中，所述設備還可能包括外部介面，以能夠與其他設備或者部件進行通信。　　在本實施例中，透過讀取並執行所述記憶體儲存的與機器學習模型的訓練的控制邏輯對應的機器可執行指令，所述處理器被促使：　　將訓練樣本集合中攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；　　基於標記的所述正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對所述負樣本分別進行風險評估得到風險評分；　　過濾所述訓練樣本集合中所述風險評分大於預設閾值的負樣本；　　基於過濾後的所述訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型。　　在本實施例中，透過讀取並執行所述記憶體儲存的與有監督機器學習模型的訓練的控制邏輯對應的機器可執行指令，所述處理器還被促使：　　刪除所述訓練樣本集合中所述風險評分大於預設閾值的負樣本。　　在本實施例中，透過讀取並執行所述記憶體儲存的與有監督機器學習模型的訓練的控制邏輯對應的機器可執行指令，所述處理器還被促使：　　將所述訓練樣本集合中所述風險評分大於預設閾值的負樣本重新標記為正樣本；　　在本實施例中，透過讀取並執行所述記憶體儲存的與有監督機器學習模型的訓練的控制邏輯對應的機器可執行指令，所述處理器還被促使：　　為重新標記的正樣本與所述訓練樣本集合中原有的正樣本對應的損失函數，分別配置權重值；其中，所述重新標記的正樣本對應的損失函數的權重值，小於所述原有的正樣本對應的損失函數的權重值；　　基於所述重新標記的正樣本、所述訓練樣本集合中原有的正樣本以及所述訓練樣本集合中剩餘的負樣本訓練有監督的風險模型。　　在本實施例中，透過讀取並執行所述記憶體儲存的與有監督機器學習模型的訓練的控制邏輯對應的機器可執行指令，所述處理器還被促使：　　將所述風險評分大於預設閾值的負樣本重新標記為正樣本後，將所述正樣本的風險評分配置為該重新標記的負樣本對應的損失函數的權重值；以及，將原有的負樣本對應的損失函數的權重值設置為1。　　在本實施例中，透過讀取並執行所述記憶體儲存的與有監督機器學習模型的訓練的控制邏輯對應的機器可執行指令，所述處理器還被促使：　　基於線上資料構建預測樣本；　　基於重新訓練的模型對該預測樣本進行風險評估得到風險評分。　　上述裝置中各個單元的功能和作用的實現過程具體詳見上述方法中對應步驟的實現過程，在此不再贅述。　　對於裝置實施例而言，由於其基本對應於方法實施例，所以相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的，其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位於一個地方，或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部模組來實現本申請方案的目的。本領域普通技術人員在不付出創造性勞動的情況下，即可以理解並實施。　　以上所述僅為本申請的較佳實施例而已，並不用以限制本申請，凡在本申請的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本申請保護的範圍之內。

30‧‧‧機器學習模型的訓練裝置301‧‧‧標記模組302‧‧‧評估模組303‧‧‧過濾模組304‧‧‧訓練模組

圖1是本說明書一實施例示出的一種有監督機器學習模型的訓練方法的流程圖；　　圖2是本說明書一實施例提供的承載一種有監督機器學習模型裝置的電子設備所涉及的硬體結構圖；　　圖3是本說明書一實施例提供的一種有監督機器學習模型裝置的邏輯框圖。

Claims

一種用於線上交易的風險控制方法，該方法包括：採集用戶的線上交易資料，並從該線上交易資料提取若干維度的交易特徵來構建預測樣本；將該預測樣本輸入風險控制模型進行風險評估，得到風險評分；比較該風險評分是否大於預設的風險閾值；若該風險評分大於該風險閾值，則確定該線上交易為風險交易，其中，該風險控制模型透過下列步驟進行訓練：收集用戶的歷史交易資料，從該收集到的歷史交易資料中提取若干維度的交易特徵作為建模特徵，並基於該些建模特徵構建特徵向量作為訓練樣本，再基於該些訓練樣本構建一特徵矩陣作為訓練樣本集合；基於用戶主動回饋的資訊，將該訓練樣本集合中發生了風險事件的訓練樣本分別標記對應的風險標籤，將攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；基於標記的該正樣本和負樣本訓練有監督的風險控制模型，並基於訓練完成的模型對該負樣本分別進行風險評估得到風險評分；及過濾該訓練樣本集合中該風險評分大於預設閾值的負樣本；基於過濾後的該訓練樣本集合中的正樣本和負樣本重新訓練該有監督的風險控制模型以用於對用戶的線上交易進行風險評估，其中，所述過濾該訓練樣本集合中該風險評分大於預設閾值的負樣本，包括：將該訓練樣本集合中該風險評分大於預設閾值的負樣本重新標記為正樣本，以及其中，所述基於過濾後的該訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型，包括：為重新標記的正樣本與該訓練樣本集合中原有的正樣本對應的損失函數，分別配置權重值；其中，該重新標記的正樣本對應的損失函數的權重值，小於該原有的正樣本對應的損失函數的權重值；基於該重新標記的正樣本、該訓練樣本集合中原有的正樣本以及該訓練樣本集合中剩餘的負樣本訓練有監督的風險模型。
根據請求項1所述的方法，所述過濾該訓練樣本集合中該風險評分大於預設閾值的負樣本，包括：刪除該訓練樣本集合中該風險評分大於預設閾值的負樣本。
根據請求項1所述的方法，該風險評分表徵風險發生機率；該方法還包括：將該風險評分大於預設閾值的負樣本重新標記為正樣本後，將該正樣本的風險評分配置為該重新標記的負樣本對應的損失函數的權重值；以及，將原有的負樣本對應的損失函數的權重值設置為1。
根據請求項1所述的方法，還包括：基於線上交易資料構建預測樣本；基於重新訓練的模型對該預測樣本進行風險評估得到風險評分。
一種用於線上交易的風險控制裝置，該裝置包括：採集模組，採集用戶的線上交易資料，並從該線上交易資料提取若干維度的交易特徵來構建預測樣本；第一評估模組，將該預測樣本輸入風險控制模型進行風險評估，得到風險評分；確定模組，比較該風險評分是否大於預設的風險閾值；若該風險評分大於該風險閾值，則確定該線上交易為風險交易，其中，該裝置還包含下列模組，用以訓練該風險控制模型：收集模組，收集用戶的歷史交易資料，從該收集到的歷史交易資料中提取若干維度的交易特徵作為建模特徵，並基於該些建模特徵構建特徵向量作為訓練樣本，再基於該些訓練樣本構建一特徵矩陣作為訓練樣本集合；標記模組，基於用戶主動回饋的資訊，將該訓練樣本集合中發生了風險事件的訓練樣本分別標記對應的風險標籤，將攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；評估模組，基於標記的該正樣本和負樣本訓練有監督的風險控制模型，並基於訓練完成的模型對該負樣本分別進行風險評估得到風險評分；過濾模組，過濾該訓練樣本集合中該風險評分大於預設閾值的負樣本；及訓練模組，基於過濾後的該訓練樣本集合中的正樣本和負樣本重新訓練該有監督的風險控制模型以用於對用戶的線上交易進行風險評估，其中，該過濾模組將該訓練樣本集合中該風險評分大於預設閾值的負樣本重新標記為正樣本，以及其中，該訓練模組進一步：為重新標記的正樣本與該訓練樣本集合中原有的正樣本對應的損失函數，分別配置權重值；其中，該重新標記的正樣本對應的損失函數的權重值，小於該原有的正樣本對應的損失函數的權重值；基於該重新標記的正樣本、該訓練樣本集合中原有的正樣本以及該訓練樣本集合中剩餘的負樣本訓練有監督的風險模型。
根據請求項5所述的裝置，該過濾模組：刪除該訓練樣本集合中該風險評分大於預設閾值的負樣本。
根據請求項5所述的裝置，該風險評分表徵風險發生機率；該過濾模組進一步：將該風險評分大於預設閾值的負樣本重新標記為正樣本後，將該負樣本的風險評分配置為該重新標記的正樣本對應的損失函數的權重值；以及，將原有的正樣本對應的損失函數的權重值設置為1。
根據請求項5所述的裝置，該評估模組進一步：基於線上交易資料構建預測樣本；基於重新訓練的模型對該預測樣本進行風險評估得到風險評分。
一種電子設備，包括：處理器；用於儲存機器可執行指令的記憶體；其中，透過讀取並執行該記憶體儲存的機器可執行指令，該處理器被促使：採集用戶的線上交易資料，並從該線上交易資料提取若干維度的交易特徵來構建預測樣本；將該預測樣本輸入風險控制模型進行風險評估，得到風險評分；比較該風險評分是否大於預設的風險閾值；若該風險評分大於該風險閾值，則確定該線上交易為風險交易，其中，該風險控制模型透過下列步驟進行訓練：收集用戶的歷史交易資料，從該收集到的歷史交易資料中提取若干維度的交易特徵作為建模特徵，並基於該些建模特徵構建特徵向量作為訓練樣本，再基於該些訓練樣本構建一特徵矩陣作為訓練樣本集合；基於用戶主動回饋的資訊，將該訓練樣本集合中發生了風險事件的訓練樣本分別標記對應的風險標籤，將攜帶風險標籤的樣本標記為正樣本，未攜帶風險標籤的樣本標記為負樣本；基於標記的該正樣本和負樣本訓練有監督的風險模型，並基於訓練完成的模型對該負樣本分別進行風險評估得到風險評分；過濾該訓練樣本集合中該風險評分大於預設閾值的負樣本；基於過濾後的該訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型以用於對用戶的線上交易進行風險評估，其中，所述過濾該訓練樣本集合中該風險評分大於預設閾值的負樣本，包括：將該訓練樣本集合中該風險評分大於預設閾值的負樣本重新標記為正樣本，以及其中，所述基於過濾後的該訓練樣本集合中的正樣本和負樣本重新訓練有監督的風險模型，包括：為重新標記的正樣本與該訓練樣本集合中原有的正樣本對應的損失函數，分別配置權重值；其中，該重新標記的正樣本對應的損失函數的權重值，小於該原有的正樣本對應的損失函數的權重值；基於該重新標記的正樣本、該訓練樣本集合中原有的正樣本以及該訓練樣本集合中剩餘的負樣本訓練有監督的風險模型。