TWI818999B

TWI818999B - 針對新場景的預測模型訓練方法及裝置

Info

Publication number: TWI818999B
Application number: TW108119499A
Authority: TW
Inventors: 張天翼; 陳明星; 郭龍
Original assignee: 開曼群島商創新先進技術有限公司
Priority date: 2018-08-03
Filing date: 2019-06-05
Publication date: 2023-10-21
Also published as: WO2020024716A1; CN109359793A; TW202008237A; CN109359793B

Abstract

揭露了一種針對新場景的預測模型訓練方法及裝置。一種針對新場景的預測模型訓練方法，該方法包括：獲得待遷移模型的集合；從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；獲得新場景中的初始訓練樣本集；利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型。

Description

針對新場景的預測模型訓練方法及裝置

本說明書實施例涉及網際網路應用技術領域，尤其涉及一種針對新場景的預測模型訓練方法及裝置。

大數據時代可以基於積累的樣本資料，透過機器學習訓練模型，從而實現需要的決策功能。例如，在金融風險控制場景，可以將大量的交易資料作為樣本資料，透過機器學習訓練風險控制模型，從而可以使用所訓練的風險控制模型，自動對新的交易進行風險決策等。但是，在某些場景中，積累樣本資料並訓練模型，從而實現機器學習模型的部署，往往需要較長的時間，如風險控制模型的資料積累與訓練一般需要半年以上。對此，一種解決方案是，在新場景中部署使用歷史模型，該歷史模型是基於其他場景中的歷史資料所訓練，但由於各場景樣本資料間存在差異，歷史模型應用於在新場景中的效果通常較差。基於現有技術，需要更高效、更準確的針對新場景的預測模型訓練方案。

針對上述技術問題，本說明書實施例提供一種針對新場景的預測模型訓練方法及裝置，技術方案如下：一種針對新場景的預測模型訓練方法，該方法包括：獲得待遷移模型的集合，所述待遷移模型為：在舊場景部署使用、且可遷移至新場景的模型；從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本；利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型。一種針對新場景的預測模型訓練裝置，該裝置包括：待遷移模型獲取模組，用於獲得待遷移模型的集合，所述待遷移模型為：在舊場景部署使用、且可遷移至新場景的模型；標註模型選取模組，用於從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；樣本集獲取模組，用於獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本；樣本標註模組，用於利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；模型更新模組，用於利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型。本說明書實施例所提供的技術方案，可以將舊場景中部署使用的模型遷移至新場景中，並且在新場景中樣本積累時間較短，因而樣本沒有或只有少數實際標籤的情況下，透過待遷移模型進行標籤預測，從而進一步最佳化待遷移模型，使這些模型更適於在新場景中使用，為新場景提供一種更高效且更準確的預測模型訓練方案。應當理解的是，以上的一般描述和後文的細節描述僅是範例性和解釋性的，並不能限制本說明書實施例。此外，本說明書實施例中的任一實施例並不需要達到上述的全部效果。

為了使本領域技術人員更好地理解本說明書實施例中的技術方案，下面將結合本說明書實施例中的圖式，對本說明書實施例中的技術方案進行詳細地描述，顯然，所描述的實施例僅僅是本說明書的一部分實施例，而不是全部的實施例。基於本說明書中的實施例，本領域普通技術人員所獲得的所有其他實施例，都應當屬保護的範圍。本說明書實施例提供一種針對新場景的預測模型訓練方法，參見圖1所示，該方法可以包括以下步驟： S101，獲得待遷移模型的集合；由於新場景與舊場景的差異，在舊場景部署使用的各個模型，其中部分可能不適用於新場景，而部分可能適用於新場景，可以遷移至新場景，待遷移模型即為在舊場景部署使用、且可遷移至新場景的模型。本說明書不限定獲得待遷移模型的集合的具體方式。在本說明書實施例中，可以比較舊場景中各個模型輸入的特徵向量、與新場景中訓練樣本可提取的特徵向量，從而確定舊場景中各個模型是否可以遷移至新場景。具體地，首先獲得第一特徵集合，該集合中包括：預先確定的新場景訓練樣本可提取的若干特徵向量；接著針對在舊場景部署使用的任一模型：獲得第二特徵集合，該集合中包括：該模型所輸入的若干特徵向量；在該模型符合預設遷移規則的情況下，將該模型確定為待遷移模型；所述預設遷移規則包括：第一特徵集合與第二特徵集合的交集中包括的特徵向量滿足預設遷移條件。上述預設遷移條件具體可以透過多種形式，從多種角度比較第一特徵集合與第二特徵集合。例如，預設遷移條件可以為：交集中包括的特徵向量的數量不小於預設臨界值，即透過比較第一特徵集合與第二特徵集合的交集中特徵向量的數量，確定該模型是否可以遷移至新場景。如果交集中特徵向量數量較少，則該模型在新場景中表現較差的機率較高，因而可以認為該模型不可以被遷移至新場景；反之，則認為該模型可以被遷移至新場景。又例如，新場景中的某些特徵向量對於模型訓練較為重要，則可以在衡量舊場景中模型是否適合遷移到新場景時，重點考慮是否包括這些特徵向量，因此，預設遷移條件可以為：根據交集中包括的各特徵向量的預設權重計算的加權分數不小於預設臨界值。對於模型訓練較為重要的特徵向量可以預設較高的權重，且越重要預設權重越高。從而，如果交集中包括的重要特徵向量較高，則最終計算的加權分數也較高，並且可以認為該模型可以遷移至新場景。預設遷移條件也可以為其他形式，並且各遷移條件可以單獨使用，也可以搭配使用，本領域技術人員可以根據實際需求靈活地設定，本說明書對此不做具體限定。此外，預設遷移規則中也可以包括其他具體規則。新場景中所訓練的預測模型的類型，可以由研發人員預先根據經驗或演算法確定並指定，那麼，為了在比較特徵向量的基礎上，進一步地衡量舊場景中各模型，可否遷移至新場景，在獲得待遷移模型的集合時，還可以進一步地獲得預先為新場景預測模型指定的至少一個類型，並且，預設遷移規則中還可以進一步包括：預先指定的至少一個類型中包括該模型的類型。從特徵向量及模型類型兩個維度，確定舊場景中的某個模型，是否可以遷移至新場景，從而使遷移至新場景的模型可以透過進一步的訓練，更好地應用於新場景。當然，預設遷移規則中也可以包括其他維度的規則，本說明書實施例對此不做限定。當然，也可以由研發人員指定舊場景遷移至新場景的待遷移模型，並且研發人員在指定時，也可以根據經驗或演算法，透過從特徵向量、模型類型等維度，衡量各個模型是否可以遷移至新場景、以及遷移後的表現、等等。 S102，從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註； S103，獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本； S104，利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；為了便於描述，將S102至S104結合進行說明。基於有監督學習訓練樣本時，需要訓練樣本為有標籤樣本。訓練樣本通常可以透過多種方式標註標籤。例如，可以人工進行標註，且人工標註通常較為準確，但是用於模型訓練的訓練樣本資料量通常很大，人工標註效率較低；又如，部分場景中可以根據實際情況產生標籤，如信用卡風險控制場景中，當銀行核實某信用卡被盜後，該信用卡及對應交易均可以被標註為黑樣本，但這種場景中短期內可能無法獲得黑樣本標籤。本說明書實施例中，從待遷移模型的集合中選擇至少一個模型，用於對新場景中的無標籤樣本進行預測標註，從而提高標註效率、縮短標註週期。各個待遷移模型均為可遷移至新場景的模型，但具體地，由於各模型輸入的特徵向量與模型類型等存在區別，其中部分模型可以直接較好地應用於新場景，而部分模型則需要更新後才可以較好地應用於新場景，因此，可以從待遷移模型的集合中，選擇在新場景中表現較好的部分模型，用於預測標註。從所述待遷移模型的集合中選擇至少一個模型具體可以透過多種方式實現。在本說明書實施例中，可以首先獲得第三特徵集合，該集合中包括：預先指定的用於預測新場景中樣本標籤的若干特徵向量；接著獲得各待遷移模型對應的各特徵集合，其中任一特徵集合中包括：對應模型所輸入的若干特徵向量；根據預設選擇規則，從所述待遷移模型的集合中，選擇至少一個模型。與S101中確定待遷移模型類似地，在選擇用於預測標註的模型時，也可以從交集中特徵向量的數量、重要特徵向量的數量、及模型類型是否相同等維度，衡量是否選擇某個模型用於預測標註，本說明書在此不再贅述。此外，僅透過數量或加權分數是否大於預設臨界值、模型類型是否相同等硬性條件，可能會出現待遷移模型的集合中，不存在符合預設選擇規則的模型的情況，因此，還可以預設各種優先級排序條件，並根據排序結果，選擇1個或多個模型用於預測標註。如S101所述，待遷移模型可以由研發人員指定，而本步驟中從待遷移模型的集合中，選擇用於對新場景中的無標籤樣本進行預測標註的模型時，也可以由研發人員根據經驗或演算法進行選擇，在此不再贅述。新場景中的初始訓練樣本集中，可以包括需要被標註預測標籤的無標籤樣本，也可以包括已標註實際標籤的有標籤樣本(可以為白樣本和/或黑樣本)，所選擇的模型用於對無標籤樣本進行預測標註。具體可以透過多種方式添加預測標籤。在本說明書實施例中，可以預先設定不同數值與不同預測標籤的對應關係，如數值大於或小於某預設值時，對應黑樣本標籤，反之對應白樣本標籤等。對於所選擇的任一模型：將初始訓練樣本集中的無標籤樣本輸入該模型，得到輸出的預測值；對於所輸入的任一無標籤樣本：確定各模型輸出的預測值的權重；計算各預測值的加權和，並確定該加權和對應的預測標籤；為該無標籤樣本添加該預測標籤。例如，如果僅從待遷移模型的集合中，選擇了1個模型進行預測標註，則可以直接根據該模型輸出的預測值(即等於加權和)，得到對應的預測標籤。又如，如果從待遷移模型的集合中，選擇了多個模型進行預測標註，則可以預先設定各模型輸出值對應的權重，如表現更好的模型對應權重更高或更低，當然，也可以預先設定各模型權重相同，即相當於未對各模型設定權重。此外，利用所選擇的模型添加的預測標籤，還可以透過人工檢查及修正，以提高預測標籤的準確度。對於上述情況，本領域可以根據實際情況靈活地設定，本說明書不做限定。 S105，利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型。對待遷移模型進行更新時，可以僅將初始訓練樣本集中，已添加預測標籤的訓練樣本輸入待遷移模型。如果新場景中所積累的訓練樣本數量較少，還可以獲得舊場景中的訓練樣本集，該訓練樣本集中包括已添加實際標籤的有標籤樣本；將新場景中的初始樣本集與舊場景中的訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。舊場景中已經積累了大量的訓練樣本，且訓練樣本為已添加實際標籤的有標籤樣本，因此可以在新場景中所積累的訓練樣本數量較少的情況下，用於輔助新場景中對待遷移模型進行更新。當然，舊場景中的訓練樣本，並不一定完全適用於新場景的模型更新，其中可能有部分樣本與新場景中的訓練樣本相似度較高，而其他樣本的相似度較低，因此可以為新場景中的初始樣本集與舊場景中的訓練樣本集合併後的訓練樣本集中的不同訓練樣本，預設不同的權重。例如，初始樣本集中的各訓練樣本權重最高，舊場景中的訓練樣本集中，與初始樣本集中的各訓練樣本相似度較高的各訓練樣本權重次之，而相似度較低的各訓練樣本權重最低。此外，隨著時間的推移，新場景中也將積累到已添加實際標籤的有標籤樣本，從而構成最佳化訓練樣本集，可以獲得新場景中的最佳化訓練樣本集，所述最佳化訓練樣本集中包括已添加實際標籤的有標籤樣本；將已添加預測標籤的初始訓練樣本集與已添加實際標籤的最佳化訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。可以理解的是，根據新場景對預測模型的需求，各個待遷移模型可以直接應用於新場景中，並在應用的同時按照本方案進行更新，得到更適用於新場景的模型，也可以經過一段時間的更新後，再應用於新場景中，並且還可以在應用之後繼續進行更新，本說明書不做限定。下面結合一個更為具體的實例，對本說明書提供的針對新場景的預測模型訓練方法進行說明。金融風險控制領域，可以將積累的大量交易資料作為樣本資料，透過機器學習訓練風險控制模型，從而可以基於所訓練的風險控制模型，及時、準確地對新的交易進行風險決策等。但是，在新場景中建立風險控制模型時，積累訓練模型所需的大量樣本資料，往往需要較長的時間。例如，樣本資料量通常與新場景的交易量及累計時間有關，此外，樣本訓練集中需要包括一定量的黑樣本資料，而以信用卡盜卡等情況作為黑樣本資料時，由於銀行對盜卡業務處理時間較長等原因，使得短時間內無法積累到訓練所需的黑樣本資料量。針對上述問題，可以將舊場景中已有的風險控制模型，遷移到新場景中。新場景與舊場景可以為不同國家、地區的交易市場，舊場景中部署使用的風險控制模型可以包括：盜卡風險控制模型、盜帳戶風險控制模型、隱案識別模型、等等，並且這些風險控制模型可以是基於多個國家、地區的交易資料訓練得到。如圖2所示，可以預先在雲端，基於從各個舊場景中集中的資料，訓練可在新、舊場景中部署使用的多個模型。其中，盜卡風險控制模型與盜帳戶風險控制模型，分別針對盜信用卡與盜支付帳戶的情況進行風險控制，並且可以透過有監督學習訓練。隱案識別模型透過輸入針對性更強的特徵向量，用於識別銀行尚未定為案件(即，非顯案)、但具備案件特徵的交易。例如，如果同一台設備(如手機)、或同一網路環境等，同時使用多個信用卡或支付帳戶，則該設備或環境中存在批量盜卡、盜帳戶的風險較高；又例如，對於已被列為黑名單的設備、帳戶、信用卡、網路環境等，與之發生關聯的設備、帳戶、信用卡、網路環境等，存在盜卡、盜帳戶的風險也較高；在例如，進行了異常交易(如交易量、交易時間、交易地點等異常)的設備、帳戶、信用卡、網路環境等，存在盜卡、盜帳戶的風險也較高；隱案識別模型可以基於上述特徵，將對應的交易識別為黑樣本。並且，隱案識別模型可以透過無監督學習訓練，從而可以應用於尚無實際案件(標籤)的場景。當新場景中需要部署盜卡風險控制模型、盜帳戶風險控制模型及隱案識別模型時，可以以模型檔案的形式，將上述模型下發到新場景本地。並且，本地可以直接使用所部署的模型，對交易事件進行打分、進行風險決策等。雲端下發部署的模型，是透過多個國家、地區的訓練樣本訓練得到，其優點是訓練樣本全面，通用性較強，而其缺點是與透過新場景本地的資料訓練的全新模型相比，並非完全適用於新場景，因此，還需要在新場景積累一定訓練樣本後，更新這些模型。各模型部署到新場景本地並使用後，從訓練樣本積累的角度，可以分為多個階段。在第一階段中，可以認為新場景中積累時間較短，如在部署後的1週內，積累的訓練樣本較少，且各樣本均無標籤，無法進行模型的更新。因此，在第一階段中，使用雲端訓練並且未更新的各模型，對新場景中的交易進行風險控制決策。在第二階段中，如在部署後的1週至1個月之間，可以認為新場景中積累了一定量的訓練樣本，構成初始訓練樣本集，如果結合雲端下發的舊場景中的大量訓練資料，可以對各模型進行更新。但是，由於金融機構處理盜卡、盜帳戶的週期較長，此時還未積累到帶有實際標籤的有標籤樣本，因此可以透過隱案識別模型，為初始訓練樣本集添加預測樣本。此外，可以對新、舊場景中的訓練樣本設置不同的權重，例如，新場景為馬來西亞的市場，舊場景包括泰國、美國、日本等市場，其中，泰國與馬來西亞的消費水平、習慣更接近，交易資料相似度更高，而美國、日本與馬來西亞的交易資料相似度更低。因此，可以為馬來西亞本地積累的訓練樣本設置最高的權重，為來自泰國的訓練樣本設置較高的權重，而為來自美國、日本的訓練樣本設置更低的權重。從而，透過動態加權的方式，可以在新場景中資料較少的情況下，使更新訓練後的各模型更適於新場景。在第二階段中更新後的各模型，仍可以用於新場景的交易決策。在第三階段中，如在部署1個月之後，可以認為新場景中已經積累了足夠量的訓練樣本，並且積累到了帶有實際標籤的有標籤樣本，則可以進一步地更新各模型。更新所使用的訓練樣本，可以僅包括新場景中、帶有實際標籤的訓練樣本，也可以包括新場景中、帶有隱案識別模型添加的預測標籤的訓練樣本，還可以包括舊場景中的大量訓練樣本，等等。除了透過雲端預先訓練的模型及積累的資料，在新場景中部署與更新風險控制模型，新場景中所積累的資料，也可以上傳至雲端，以用於更新已有模型、訓練其他新模型，並部署到其他新場景等。可見，應用上述方案，可以將舊場景中部署使用的模型遷移至新場景中，並且在新場景中樣本積累時間較短，因而樣本沒有或只有少數實際標籤的情況下，透過待遷移模型進行標籤預測，從而進一步最佳化待遷移模型，使這些模型更適於在新場景中使用，為新場景提供一種更高效且更準確的預測模型訓練方案。相應於上述方法實施例，本說明書實施例還提供一種針對新場景的預測模型訓練裝置，參見圖3所示，該裝置可以包括：待遷移模型獲取模組110，用於獲得待遷移模型的集合，所述待遷移模型為：在舊場景部署使用、且可遷移至新場景的模型；標註模型選取模組120，用於從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；樣本集獲取模組130，用於獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本；樣本標註模組140，用於利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；模型更新模組150，用於利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型。在本說明書提供的一種具體實施方式中，所述待遷移模型獲取模組110，可以包括：待遷移特徵獲取單元111，用於獲得第一特徵集合，該集合中包括：預先確定的新場景訓練樣本可提取的若干特徵向量；針對在舊場景部署使用的任一模型：獲得第二特徵集合，該集合中包括：該模型所輸入的若干特徵向量；待遷移模型選取單元112，用於在該模型符合預設遷移規則的情況下，將該模型確定為待遷移模型；所述預設遷移規則包括：第一特徵集合與第二特徵集合的交集中包括的特徵向量滿足預設遷移條件。在本說明書提供的一種具體實施方式中，所述預設遷移條件可以包括：交集中包括的特徵向量的數量不小於預設臨界值；和/或根據交集中包括的各特徵向量的預設權重計算的加權分數不小於預設臨界值。在本說明書提供的一種具體實施方式中，所述待遷移模型獲取模組110，還可以包括：待遷移類型獲取單元113，用於獲得預先為新場景預測模型指定的至少一個類型；所述預設遷移規則，還可以包括：預先指定的至少一個類型中包括該模型的類型。在本說明書提供的一種具體實施方式中，所述標註模型選取模組120，可以包括：標註特徵獲取單元121，用於獲得第三特徵集合，該集合中包括：預先指定的用於預測新場景中樣本標籤的若干特徵向量；獲得各待遷移模型對應的各特徵集合，其中任一特徵集合中包括：對應模型所輸入的若干特徵向量；標註模型選取單元122，用於根據預設選擇規則，從所述待遷移模型的集合中，選擇至少一個模型。在本說明書提供的一種具體實施方式中，所述樣本標註模組140，可以包括：預測值確定單元141，用於對於所選擇的任一模型：將初始訓練樣本集中的無標籤樣本輸入該模型，得到輸出的預測值；預測標籤確定單元142，用於對於所輸入的任一無標籤樣本：確定各模型輸出的預測值的權重；計算各預測值的加權和，並確定該加權和對應的預測標籤；為該無標籤樣本添加該預測標籤。在本說明書提供的一種具體實施方式中，所述樣本集獲取模組130，還可以用於：獲得新場景中的最佳化訓練樣本集，所述最佳化訓練樣本集中包括已添加實際標籤的有標籤樣本；所述模型更新模組150，具體可以用於：將已添加預測標籤的初始訓練樣本集與已添加實際標籤的最佳化訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。在本說明書提供的一種具體實施方式中，所述樣本集獲取模組130，還可以用於：獲得舊場景中的訓練樣本集，該訓練樣本集中包括已添加實際標籤的有標籤樣本；所述模型更新模組150，具體可以用於：將新場景中的初始樣本集與舊場景中的訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。上述裝置中各個模組的功能和作用的實現過程具體詳見上述方法中對應步驟的實現過程，在此不再贅述。本說明書實施例還提供一種電腦設備，其至少包括儲存器、處理器及儲存在儲存器上並可在處理器上運行的電腦程式，其中，處理器執行所述程式時實現前述的針對新場景的預測模型訓練方法。該方法至少包括：獲得待遷移模型的集合，所述待遷移模型為：在舊場景部署使用、且可遷移至新場景的模型；從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本；利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型。圖4顯示了本說明書實施例所提供的一種更為具體的計算設備硬體結構示意圖，該設備可以包括：處理器1010、儲存器1020、輸入/輸出介面1030、通訊介面1040和匯流排1050。其中處理器1010、儲存器1020、輸入/輸出介面1030和通訊介面1040透過匯流排1050實現彼此之間在設備內部的通訊連接。處理器1010可以採用通用的CPU(Central Processing Unit，中央處理器)、微處理器、特殊應用積體電路(Application Specific Integrated Circuit，ASIC)、或者一個或多個積體電路等方式實現，用於執行相關程式，以實現本說明書實施例所提供的技術方案。儲存器1020可以採用ROM(Read Only Memory，唯讀記憶體)、RAM(Random Access Memory，隨機存取記憶體)、靜態儲存設備，動態儲存設備等形式實現。儲存器1020可以儲存作業系統和其他應用程式，在透過軟體或者韌體來實現本說明書實施例所提供的技術方案時，相關的程式代碼保存在儲存器1020中，並由處理器1010來呼叫執行。輸入/輸出介面1030用於連接輸入/輸出模組，以實現資訊輸入及輸出。輸入輸出/模組可以作為組件配置在設備中(圖中未顯示)，也可以外接於設備以提供相應功能。其中輸入設備可以包括鍵盤、滑鼠、觸控螢幕、麥克風、各類感測器等，輸出設備可以包括顯示器、揚聲器、振動器、指示燈等。通訊介面1040用於連接通訊模組(圖中未顯示)，以實現本設備與其他設備的通訊互動。其中通訊模組可以透過有線方式(例如USB、網線等)實現通訊，也可以透過無線方式(例如移動網路、WIFI、藍牙等)實現通訊。匯流排1050包括一通路，在設備的各個組件(例如處理器1010、儲存器1020、輸入/輸出介面1030和通訊介面1040)之間傳輸資訊。需要說明的是，儘管上述設備僅顯示了處理器1010、儲存器1020、輸入/輸出介面1030、通訊介面1040以及匯流排1050，但是在具體實施過程中，該設備還可以包括實現正常運行所必需的其他組件。此外，本領域的技術人員可以理解的是，上述設備中也可以僅包含實現本說明書實施例方案所必需的組件，而不必包含圖中所示的全部組件。本說明書實施例還提供一種電腦可讀儲存媒體，其上儲存有電腦程式，該程式被處理器執行時實現前述的針對新場景的預測模型訓練方法。該方法至少包括：獲得待遷移模型的集合，所述待遷移模型為：在舊場景部署使用、且可遷移至新場景的模型；從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本；利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型。電腦可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括，但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可抹除可程式化唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶，磁帶磁磁碟儲存或其他磁性儲存設備或任何其他非傳輸媒體，可用於儲存可以被計算設備存取的資訊。按照本文中的界定，電腦可讀媒體不包括暫存電腦可讀媒體(transitory media)，如調變的資料訊號和載波。透過以上的實施方式的描述可知，本領域的技術人員可以清楚地瞭解到本說明書實施例可借助軟體加必需的通用硬體平臺的方式來實現。基於這樣的理解，本說明書實施例的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來，該電腦軟體產品可以儲存在儲存媒體中，如ROM/RAM、磁碟、光碟等，包括若干指令用以使得一台電腦設備(可以是個人電腦，伺服器，或者網路設備等)執行本說明書實施例各個實施例或者實施例的某些部分所述的方法。上述實施例闡明的系統、裝置、模組或單元，具體可以由電腦晶片或實體實現，或者由具有某種功能的產品來實現。一種典型的實現設備為電腦，電腦的具體形式可以是個人電腦、膝上型電腦、蜂巢式電話、相機電話、智慧型手機、個人數位助理、媒體播放器、導航設備、電子郵件收發設備、遊戲控制台、平板電腦、可穿戴設備或者這些設備中的任意幾種設備的組合。本說明書中的各個實施例均採用遞進的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對於裝置實施例而言，由於其基本相似於方法實施例，所以描述得比較簡單，相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的，其中所述作為分離部件說明的模組可以是或者也可以不是實體上分開的，在實施本說明書實施例方案時可以把各模組的功能在同一個或多個軟體和/或硬體中實現。也可以根據實際的需要選擇其中的部分或者全部模組來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下，即可以理解並實施。以上所述僅是本說明書實施例的具體實施方式，應當指出，對於本技術領域的普通技術人員來說，在不脫離本說明書實施例原理的前提下，還可以做出若干改進和潤飾，這些改進和潤飾也應視為本說明書實施例的保護範圍。

S101〜S105‧‧‧步驟 110‧‧‧待遷移模型獲取模組 120‧‧‧標註模型選取模組 130‧‧‧樣本集獲取模組 140‧‧‧樣本標註模組 150‧‧‧模型更新模組 1010‧‧‧處理器 1020‧‧‧儲存器 1030‧‧‧輸入/輸出介面 1040‧‧‧通訊介面 1050‧‧‧匯流排

為了更清楚地說明本說明書實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的圖式作簡單地介紹，顯而易見地，下面描述中的圖式僅僅是本說明書實施例中記載的一些實施例，對於本領域普通技術人員來講，還可以根據這些圖式獲得其他的圖式。圖1是本說明書實施例的針對新場景的預測模型訓練方法的流程示意圖；圖2是本說明書實施例的針對新場景的風險控制模型訓練方法的流程示意圖；圖3是本說明書實施例的針對新場景的預測模型訓練裝置的結構示意圖；圖4是用於配置本說明書實施例裝置的一種設備的結構示意圖。

Claims

一種針對新場景的預測模型訓練方法，該方法包括：從雲端伺服器獲得待遷移模型的集合，所述待遷移模型為：在舊場景部署使用、且可遷移至新場景的模型；舊場景中輸入所述待遷移模型的特徵向量、與新場景中訓練樣本可提取的特徵向量的交集滿足預設遷移條件；從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本；利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型，並將新場景所積累的資料上傳雲端伺服器。
根據申請專利範圍第1項所述的方法，所述獲得待遷移模型的集合，包括：獲得第一特徵集合，該集合中包括：預先確定的新場景訓練樣本可提取的若干特徵向量；針對在舊場景部署使用的任一模型：獲得第二特徵集合，該集合中包括：該模型所輸入的若干特徵向量；在該模型符合預設遷移規則的情況下，將該模型確定為待遷移模型；所述預設遷移規則包括：第一特徵集合與第二特徵集合的交集中包括的特徵向量滿足預設遷移條件。
根據申請專利範圍第2項所述的方法，所述預設遷移條件包括：根據交集中包括的特徵向量的數量，確定該模型是否可以遷移至新場景；和/或根據交集中包括的各特徵向量的預設權重計算的加權分數，確定該模型是否可以遷移至新場景。
根據申請專利範圍第2項所述的方法，所述獲得待遷移模型的集合，還包括：獲得預先為新場景預測模型指定的至少一個類型；所述預設遷移規則，還包括：預先指定的至少一個類型中包括該模型的類型。
根據申請專利範圍第1項所述的方法，所述從所述待遷移模型的集合中選擇至少一個模型，包括：獲得第三特徵集合，該集合中包括：預先指定的用於預測新場景中樣本標籤的若干特徵向量；獲得各待遷移模型對應的各特徵集合，其中任一特徵集合中包括：對應模型所輸入的若干特徵向量；根據預設選擇規則，從所述待遷移模型的集合中，選擇至少一個模型。
根據申請專利範圍第1項所述的方法，所述利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤，包括：對於所選擇的任一模型：將初始訓練樣本集中的無標籤樣本輸入該模型，得到輸出的預測值；對於所輸入的任一無標籤樣本：確定各模型輸出的預測值的權重；計算各預測值的加權和，並確定該加權和對應的預測標籤；為該無標籤樣本添加該預測標籤。
根據申請專利範圍第1項所述的方法，所述利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，包括：獲得新場景中的最佳化訓練樣本集，所述最佳化訓練樣本集中包括已添加實際標籤的有標籤樣本；將已添加預測標籤的初始訓練樣本集與已添加實際標籤的最佳化訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。
根據申請專利範圍第1項所述的方法，所述利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，包括：獲得舊場景中的訓練樣本集，該訓練樣本集中包括已添加實際標籤的有標籤樣本；將新場景中的初始樣本集與舊場景中的訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。
一種針對新場景的預測模型訓練裝置，該裝置包括：待遷移模型獲取模組，用於從雲端伺服器獲得待遷移模型的集合，所述待遷移模型為：在舊場景部署使用、且可遷移至新場景的模型；舊場景中輸入所述待遷移模型的特徵向量、與新場景中訓練樣本可提取的特徵向量的交集滿足預設遷移條件；標註模型選取模組，用於從所述待遷移模型的集合中選擇至少一個模型，以用於對新場景中的無標籤樣本進行預測標註；樣本集獲取模組，用於獲得新場景中的初始訓練樣本集，所述初始訓練樣本集中包括無標籤樣本；樣本標註模組，用於利用所選擇的模型，為初始訓練樣本集中的無標籤樣本添加預測標籤；模型更新模組，用於利用已添加預測標籤的初始訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新，得到可適用於新場景的模型，並將新場景所積累的資料上傳雲端伺服器。
根據申請專利範圍第9項所述的裝置，所述待遷移模型獲取模組，包括：待遷移特徵獲取單元，用於獲得第一特徵集合，該集合中包括：預先確定的新場景訓練樣本可提取的若干特徵向量；針對在舊場景部署使用的任一模型：獲得第二特徵集合，該集合中包括：該模型所輸入的若干特徵向量；待遷移模型選取單元，用於在該模型符合預設遷移規則的情況下，將該模型確定為待遷移模型；所述預設遷移規則包括：第一特徵集合與第二特徵集合的交集中包括的特徵向量滿足預設遷移條件。
根據申請專利範圍第10項所述的裝置，所述預設遷移條件包括：根據交集中包括的特徵向量的數量，確定該模型是否可以遷移至新場景；和/或根據交集中包括的各特徵向量的預設權重計算的加權分數，確定該模型是否可以遷移至新場景。
根據申請專利範圍第10項所述的裝置，所述待遷移模型獲取模組，還包括：待遷移類型獲取單元，用於獲得預先為新場景預測模型指定的至少一個類型；所述預設遷移規則，還包括：預先指定的至少一個類型中包括該模型的類型。
根據申請專利範圍第9項所述的裝置，所述標註模型選取模組，包括：標註特徵獲取單元，用於獲得第三特徵集合，該集合中包括：預先指定的用於預測新場景中樣本標籤的若干特徵向量；獲得各待遷移模型對應的各特徵集合，其中任一特徵集合中包括：對應模型所輸入的若干特徵向量；標註模型選取單元，用於根據預設選擇規則，從所述待遷移模型的集合中，選擇至少一個模型。
根據申請專利範圍第9項所述的裝置，所述樣本標註模組，包括：預測值確定單元，用於對於所選擇的任一模型：將初始訓練樣本集中的無標籤樣本輸入該模型，得到輸出的預測值；預測標籤確定單元，用於對於所輸入的任一無標籤樣本：確定各模型輸出的預測值的權重；計算各預測值的加權和，並確定該加權和對應的預測標籤；為該無標籤樣本添加該預測標籤。
根據申請專利範圍第9項所述的裝置，所述樣本集獲取模組，還用於：獲得新場景中的最佳化訓練樣本集，所述最佳化訓練樣本集中包括已添加實際標籤的有標籤樣本；所述模型更新模組，具體用於：將已添加預測標籤的初始訓練樣本集與已添加實際標籤的最佳化訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。
根據申請專利範圍第9項所述的裝置，所述樣本集獲取模組，還用於：獲得舊場景中的訓練樣本集，該訓練樣本集中包括已添加實際標籤的有標籤樣本；所述模型更新模組，具體用於：將新場景中的初始樣本集與舊場景中的訓練樣本集合併，利用合併後的訓練樣本集，基於有監督學習演算法，對待遷移模型進行更新。
一種電腦設備，包括儲存器、處理器及儲存在儲存器上並可在處理器上運行的電腦程式，其中，所述處理器執行所述程式時實現如申請專利範圍第1至8項中任一項所述的方法。