TW202123124A

TW202123124A - 多方聯合進行風險識別的方法和裝置

Info

Publication number: TW202123124A
Application number: TW109115720A
Authority: TW
Inventors: 宋博文; 陳帥; 顧曦
Original assignee: 大陸商支付寶（杭州）信息技術有限公司
Priority date: 2019-12-12
Filing date: 2020-05-12
Publication date: 2021-06-16
Also published as: WO2021114820A1; CN111046425A; CN111046425B; TWI798550B

Abstract

本說明書實施例提供一種多方聯合進行風險識別的方法和裝置，方法包括：第一站點獲取與第二站點聯合訓練的安全樹模型的第一子模型；安全樹模型還具有部署於第二站點的第二子模型；獲取根據預設風險識別策略對應的樹結構得到的第三子模型；樹結構還具有部署於第二站點的第四子模型；當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；將第一特徵資料輸入第一子模型和第三子模型，分別得到第一預測分數和第三預測分數；透過多方安全計算的方式提供第一預測分數和第三預測分數，與第二站點提供的第二預測分數和第四預測分數相結合，綜合確定目標用戶是否具有第一風險。能夠防止洩露用戶的隱私資訊。

Description

多方聯合進行風險識別的方法和裝置

本說明書一個或多個實施例涉及計算機領域，尤其涉及多方聯合進行風險識別的方法和裝置。

當前，常常需要進行風險識別，對風控系統來說，透過對用戶特徵的分析，來判斷用戶行為的風險性，如盜用、欺詐、營銷作弊等風險，這些用戶特徵的基礎資料源在很大程度上依賴於用戶的隱私資訊。比如在刻畫用戶交易頻次上會設計變量：用戶在過去7天當前設備上的交易金額累計，在該變量上面，就需要用到用戶使用的設備的唯一標識（ID）這個基礎資訊，而用戶使用的設備的唯一標識就屬於用戶的隱私資訊。隨著通用資料保護條例(general data protection regulation，GDPR)的生效，用戶隱私資料所受到的管制也越來越嚴格。尤其是在國際場景，隱私資料不出域、用戶資料可用不可見等也成為越來越多機構對資料採集使用方的要求。比如，在全球支付網路(global net，GN)場景下，髮卡站和收單站分別屬於不同國家，如何做到隱私資料不出域的情況下完成對網路上交易的風險防控，是當前面臨的一個難題。因此，希望能有改進的方案，透過多方聯合進行風險識別，能夠防止洩露用戶的隱私資訊。

本說明書一個或多個實施例描述了一種多方聯合進行風險識別的方法和裝置，能夠防止洩露用戶的隱私資訊。第一態樣，提供了一種多方聯合進行風險識別的方法，所述多方包括第一站點和第二站點，所述第一站點儲存用戶的第一特徵集中的特徵資訊，所述第二站點儲存用戶的第二特徵集中的特徵資訊，所述特徵資訊涉及用戶的隱私資訊，所述方法應用於所述第一站點，包括：獲取與所述第二站點聯合訓練的安全樹模型的第一子模型；所述安全樹模型還具有部署於所述第二站點的第二子模型；獲取根據預設風險識別策略對應的樹結構得到的第三子模型；所述樹結構還具有部署於所述第二站點的第四子模型；當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；將所述第一特徵資料輸入所述第一子模型，得到第一預測分數，以及輸入所述第三子模型，得到第三預測分數；透過多方安全計算(multi-party computing，MPC)的方式提供所述第一預測分數和所述第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定所述目標用戶是否具有第一風險；其中，所述第二預測分數為所述第二站點利用所述目標用戶的第二特徵集中各項特徵的第二特徵資料和所述第二子模型得到，所述第四預測分數為所述第二站點利用所述第二特徵資料和所述第四子模型得到。在一種可能的實施方式中，所述獲取與所述第二站點聯合訓練的安全樹模型的第一子模型，包括：透過MPC方式，與所述第二站點聯合訓練所述安全樹模型，得到所述安全樹模型的第一子模型。在一種可能的實施方式中，所述獲取與所述第二站點聯合訓練的安全樹模型的第一子模型，包括：接收所述第一子模型對應的第一模型文件，所述第一模型文件是從透過聯合訓練方式得到的安全樹模型的總模型文件中分拆的文件。在一種可能的實施方式中，所述確定滿足預設風險識別條件包括：接收評估請求，所述評估請求中包括所述目標用戶的標識。在一種可能的實施方式中，所述確定滿足預設風險識別條件包括：接收批量處理請求，所述目標用戶是批量處理請求所限定的用戶集合中的任意用戶。在一種可能的實施方式中，所述MPC包括：同態加密、秘密分享之一。在一種可能的實施方式中，所述獲取與所述第二站點聯合訓練的安全樹模型的第一子模型之前，所述方法還包括：確定與所述第二站點之間的資料交互權限；及/或，確定所述第一特徵集中的特徵資訊和所述第二特徵集中的特徵資訊；及/或，確定與所述第二站點之間已達成算法共識。在一種可能的實施方式中，所述方法還包括：與所述第二站點聯合訓練時，記錄與所述第二站點之間交互的資料。在一種可能的實施方式中，所述第一風險包括有監督風險，所述有監督風險為用戶實施第一行為後能夠獲得所述第一行為對應的是否具有所述第一風險的標籤；所述特徵資訊還涉及用戶的行為資訊。在一種可能的實施方式中，所述第一風險包括無監督風險；所述無監督風險為用戶實施第二行為後不能夠獲得所述第二行為對應的是否具有所述第一風險的標籤；與所述第二站點聯合訓練安全樹模型，包括：針對所述第一風險獲取第一樣本集合，所述第一樣本集合中各樣本的標籤為人工定義的，或者基於各樣本的高危險特徵集合中的各特徵的特徵分佈確定的；利用所述第一樣本集合，與所述第二站點初步聯合訓練所述安全樹模型，並重新確定所述高危險特徵集合中包含的各特徵；利用重新確定的所述高危險特徵集合中的各特徵的特徵分佈，更新所述第一樣本集合中各樣本的標籤；基於更新後的標籤，與所述第二站點再次聯合訓練所述安全樹模型。第二態樣，提供了一種多方聯合進行風險識別的裝置，所述多方包括第一站點和第二站點，所述第一站點儲存用戶的第一特徵集中的特徵資訊，所述第二站點儲存用戶的第二特徵集中的特徵資訊，所述特徵資訊涉及用戶的隱私資訊，所述裝置應用於所述第一站點，包括：第一獲取單元，用於獲取與所述第二站點聯合訓練的安全樹模型的第一子模型；所述安全樹模型還具有部署於所述第二站點的第二子模型；第二獲取單元，用於獲取根據預設風險識別策略對應的樹結構得到的第三子模型；所述樹結構還具有部署於所述第二站點的第四子模型；第三獲取單元，用於當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；預測單元，用於將所述第三獲取單元獲取的第一特徵資料輸入所述第一獲取單元獲取的第一子模型，得到第一預測分數，以及輸入所述第二獲取單元獲取的第三子模型，得到第三預測分數；聯合單元，用於透過多方安全計算MPC的方式提供所述預測單元得到的所述第一預測分數和所述第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定所述目標用戶是否具有第一風險；其中，所述第二預測分數為所述第二站點利用所述目標用戶的第二特徵集中各項特徵的第二特徵資料和所述第二子模型得到，所述第四預測分數為所述第二站點利用所述第二特徵資料和所述第四子模型得到。第三態樣，提供了一種計算機可讀儲存媒體，其上儲存有計算機程式，當所述計算機程式在計算機中執行時，令計算機執行第一態樣的方法。第四態樣，提供了一種計算設備，包括記憶體和處理器，所述記憶體中儲存有可執行碼，所述處理器執行所述可執行碼時，實現第一態樣的方法。透過本說明書實施例提供的方法和裝置，透過多方聯合進行風險識別，對於多方中的第一站點首先獲取與第二站點聯合訓練的安全樹模型的第一子模型；所述安全樹模型還具有部署於所述第二站點的第二子模型；然後獲取根據預設風險識別策略對應的樹結構得到的第三子模型；所述樹結構還具有部署於所述第二站點的第四子模型；接著當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；再將所述第一特徵資料輸入所述第一子模型，得到第一預測分數，以及輸入所述第三子模型，得到第三預測分數；最後透過MPC的方式提供所述第一預測分數和所述第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定所述目標用戶是否具有第一風險；其中，所述第二預測分數為所述第二站點利用所述目標用戶的第二特徵集中各項特徵的第二特徵資料和所述第二子模型得到，所述第四預測分數為所述第二站點利用所述第二特徵資料和所述第四子模型得到。由上可見，本說明書實施例，透過將總的模型拆分為多個子模型，將各子模型分別部署在多方站點，從而可以結合各子模型的預測結果，綜合得到最終的風險識別結果，保證了各站點不必交互用戶的隱私資訊，能夠防止洩露用戶的隱私資訊；此外，不僅將透過訓練得到的模型拆分部署，同樣地，將預設風險識別策略也進行拆分部署，進一步防止洩露用戶的隱私資訊，並且增強了風險識別的準確性。

下面結合附圖，對本說明書提供的方案進行描述。圖1為本說明書披露的一個實施例的實施場景示意圖。該實施場景涉及多方聯合進行風險識別。參照圖1，所述多方包括第一站點11和第二站點12，所述第一站點11儲存用戶的第一特徵集中的特徵資訊，所述第二站點12儲存用戶的第二特徵集中的特徵資訊。可以理解的是，第一特徵集與第二特徵集包含的特徵資訊不同，例如，第一特徵集包含特徵1、特徵2，第二特徵集包含特徵3、特徵4和特徵5，其中，特徵資訊涉及用戶的隱私資訊，這其中尤其重要的是可以定位到用戶個人的資訊(personally identifiable information，PII)資訊，如地址、郵箱、姓名、身份ID等。本說明書實施例，基於多方安全計算(multi-party computing，MPC)的方式，由多方聯合進行風險識別。其中，涉及到策略和模型的多方部署，依賴於基於樹結構的部署形式，能夠防止洩露用戶的隱私資訊。需要說明的是，本說明書實施例，僅以兩方聯合進行風險識別為例進行說明，但實際上多方並限定為兩方，例如，可以為三方、四方或更多方聯合進行風險識別。圖2示出根據一個實施例的多方聯合進行風險識別的方法流程圖，該方法可以基於圖1所示的實施場景，所述多方包括第一站點和第二站點，所述第一站點儲存用戶的第一特徵集中的特徵資訊，所述第二站點儲存用戶的第二特徵集中的特徵資訊，所述特徵資訊涉及用戶的隱私資訊，所述方法應用於所述第一站點，可以理解的是，在多方聯合進行風險識別時，第一站點為多方中的任一方，第二站點與第一站點的處理過程類似，在此不做贅述。如圖2所示，該實施例中多方聯合進行風險識別的方法包括以下步驟：步驟21，獲取與所述第二站點聯合訓練的安全樹模型的第一子模型；所述安全樹模型還具有部署於所述第二站點的第二子模型；步驟22，獲取根據預設風險識別策略對應的樹結構得到的第三子模型；所述樹結構還具有部署於所述第二站點的第四子模型；步驟23，當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；步驟24，將所述第一特徵資料輸入所述第一子模型，得到第一預測分數，以及輸入所述第三子模型，得到第三預測分數；步驟25，透過多方安全計算MPC的方式提供所述第一預測分數和所述第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定所述目標用戶是否具有第一風險；其中，所述第二預測分數為所述第二站點利用所述目標用戶的第二特徵集中各項特徵的第二特徵資料和所述第二子模型得到，所述第四預測分數為所述第二站點利用所述第二特徵資料和所述第四子模型得到。下面描述以上各個步驟的具體執行方式。首先在步驟21，獲取與所述第二站點聯合訓練的安全樹模型的第一子模型；所述安全樹模型還具有部署於所述第二站點的第二子模型。可以理解的是，安全樹模型為一個總的模型，該模型可以拆分為第一子模型和第二子模型，第一子模型和第二子模型分別部署於第一站點和第二站點。在一個示例中，透過MPC方式，與所述第二站點聯合訓練所述安全樹模型，得到所述安全樹模型的第一子模型。可以理解的是，MPC方式即在保護資料隱私安全、資料不出域的情況下透過交換過程參數和隨機數的方式完成聯合訓練的相關計算。在另一個示例中，接收所述第一子模型對應的第一模型文件，所述第一模型文件是從透過聯合訓練方式得到的安全樹模型的總模型文件中分拆的文件。在一個示例中，在步驟21之前，所述方法還包括：確定與所述第二站點之間的資料交互權限；及/或，確定所述第一特徵集中的特徵資訊和所述第二特徵集中的特徵資訊；及/或，確定與所述第二站點之間已達成算法共識。在一個示例中，所述方法還包括：與所述第二站點聯合訓練時，記錄與所述第二站點之間交互的資料。然後在步驟22，獲取根據預設風險識別策略對應的樹結構得到的第三子模型；所述樹結構還具有部署於所述第二站點的第四子模型。可以理解的是，預設風險識別策略可以為人工定義的，例如，該預設風險識別策略為(x1＞a or x2＞b)and y3＞c，可以轉換成x1＞a and y3＞c和x2＞b and y3＞c兩棵樹，每棵樹對應一個子模型。本說明書實施例中，預設風險識別策略也被拆分為多個子模型，分別部署在多個站點，能夠防止洩露用戶的隱私資訊。接著在步驟23，當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料。可以理解的是，該預設風險識別條件即觸發條件，可以是接收到請求後觸發，也可以是定時觸發。在一個示例中，所述確定滿足預設風險識別條件包括：接收評估請求，所述評估請求中包括所述目標用戶的標識。在另一個示例中，所述確定滿足預設風險識別條件包括：接收批量處理請求，所述目標用戶是批量處理請求所限定的用戶集合中的任意用戶。再在步驟24，將所述第一特徵資料輸入所述第一子模型，得到第一預測分數，以及輸入所述第三子模型，得到第三預測分數。可以理解的是，第一特徵資料儲存於第一站點，第一子模型和第三子模型也部署在第一站點，第一特徵資料無需外傳，能夠防止洩露用戶的隱私資訊。最後在步驟25，透過多方安全計算MPC的方式提供所述第一預測分數和所述第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定所述目標用戶是否具有第一風險；其中，所述第二預測分數為所述第二站點利用所述目標用戶的第二特徵集中各項特徵的第二特徵資料和所述第二子模型得到，所述第四預測分數為所述第二站點利用所述第二特徵資料和所述第四子模型得到。可以理解的是，各方分別利用自身儲存的目標用戶的特徵資料確定相應的預測分數，再綜合多方的預測分數確定目標用戶是否具有風險，能夠防止洩露用戶的隱私資訊。在一個示例中，所述MPC包括：同態加密、秘密分享之一。在一個示例中，所述第一風險包括有監督風險，所述有監督風險為用戶實施第一行為後能夠獲得所述第一行為對應的是否具有所述第一風險的標籤；所述特徵資訊還涉及用戶的行為資訊。可以理解的是，第一行為可以為交易行為，第一風險可以為盜用風險，通常這類風險在交易行為發生後會有用戶報案，從而獲得標籤。在另一個示例中，所述第一風險包括無監督風險；所述無監督風險為用戶實施第二行為後不能夠獲得所述第二行為對應的是否具有所述第一風險的標籤；與所述第二站點聯合訓練安全樹模型，包括：針對所述第一風險獲取第一樣本集合，所述第一樣本集合中各樣本的標籤為人工定義的，或者基於各樣本的高危險特徵集合中的各特徵的特徵分佈確定的；利用所述第一樣本集合，與所述第二站點初步聯合訓練所述安全樹模型，並重新確定所述高危險特徵集合中包含的各特徵；利用重新確定的所述高危險特徵集合中的各特徵的特徵分佈，更新所述第一樣本集合中各樣本的標籤；基於更新後的標籤，與所述第二站點再次聯合訓練所述安全樹模型。可以理解的是，第二行為可以為交易行為，第一風險可以為營銷作弊風險或虛假交易風險，通常這類風險在交易行為發生後不會有用戶報案，從而不能夠獲得標籤。可以透過人工標注或特徵識別確定對應的標籤。本說明書實施例提供的方法，透過將總的模型拆分為多個子模型，將各子模型分別部署在多方站點，從而可以結合各子模型的預測結果，綜合得到最終的風險識別結果，保證了各站點不必交互用戶的隱私資訊，能夠防止洩露用戶的隱私資訊；此外，不僅將透過訓練得到的模型拆分部署，同樣地，將預設風險識別策略也進行拆分部署，進一步防止洩露用戶的隱私資訊，並且增強了風險識別的準確性。本說明書實施例中的MPC也可以稱為聯邦學習，具體地，可以採用安全樹(secureboost)的聯邦學習方案。圖3示出根據一個實施例的多方聯合進行風險識別的體系結構示意圖。參照圖3，該體系結構包括配置層、定義層和部署層。配置層主要有三部分組成：租戶管理，用於提供資料提供方和使用方的管理功能，並對租戶對資料的操作進行記錄以及全網同步；變量管理，用於提供各基礎變量的來源(來源於哪個租戶)以及基礎定義，線上資料來說對接到端上的資料實時介面，線下部分對接到端上的資料庫；算法授權，用於提供聯邦學習的算法共識部分，基於聯邦學習方案的算法分為三個步驟，第一個是離線訓練，透過隨機數以及中間參數的交互完成模型訓練；第二步是將得到的模型文件進行拆分，部署到各個端節點；第三步是在端節點上進行實時或者是離線批量預測。該運行的算法方案(如secureboost)不僅需要達到安全性的要求，同時還需要得到各個端的共識(確定瞭解算法不會外傳內部資訊)。共識後的算法需要輸入簽名，端資料智能在簽名匹配下的算法組件上面運行。定義層，用於產出算法文件，包括模型訓練得到的算法文件，以及策略定義的算法文件。部署層，用於將算法文件部署在多方，以提供預測服務。包括在線部署和離線部署。對於策略來說，是用and和or連起來的一些邏輯算子。透過對and和or的拆分即可將策略轉化成集成樹的結構從而複用模型的在線和離線部署鏈路。例如：策略(x1＞a or x2＞b)and y3＞c可以轉換成x1＞a and y3＞c和x2＞b and y3＞c兩棵樹。對每棵樹來說，邏輯成立向右走(如果還有and邏輯那麼繼續分裂否則記為葉子節點1)，邏輯不成立向左走並記為葉子節點0。兩顆不同的樹來進行加和，最終結果如果大於0那麼就是策略稽核，否則就是策略未稽核。轉化成樹結構之後可以沿用模型的部署鏈路來進行多方打分和預測。圖4示出根據一個實施例的在線部署鏈路示意圖。參照圖4，展示了多方模型的聯邦學習過程以及在線打分過程。透過隨機數和參數的交互，得到一個樹模型，經過拆分之後部署在資料域A和資料域B的預測節點上。在風控實時鏈路上，由實時打分預測請求兩邊預測節點，預測節點從實時特徵介面讀取相應特徵。預測節點在節點所有擁有的子模型上得到子結果，並匯總到預測節點得到最終打分。預測節點將最終打分回傳給諮詢方。圖5示出根據一個實施例的離線部署鏈路示意圖。參照圖5，展示了訓練好的模型在端節點部署之後的離線跑批和定時調度的鏈路。該部分鏈路需要同端資料庫打通，對資料庫內部的定時跑出的資料進行批量打分。同時該部分功能也提供一次性打分服務，來對策略和模型的效能進行評估。圖6示出根據一個實施例的策略轉換過程示意圖。參照圖6，策略轉換成樹之後，會透過拆分服務拆分成子模型，將子模型部署在各個端上來進行預測或者離線調度打分。圖7示出根據一個實施例的多方模型進化閉環示意圖。參照圖7，在聯邦學習多方建模的基礎上進一步提出了模型進化閉環的功能。在此基礎上，多方模型體系不僅能識別有標籤的監督型風險目標，同時也可以對營銷作弊、虛假交易等無監督風險進行風險識別，從而一體化覆蓋有監督風險、無監督風險的識別。首先透過人工定義的一些高風險標籤以及人工定義的高危險特徵識別到的無監督風險作為標籤來訓練有監督模型，根據有監督模型進一步對高危險特徵進行優化，此處同時可以結合人工經驗輸入調整高危險特徵的特徵分佈。優化後的高危險特徵可以進一步促進無監督風險識別的精度。透過閉環結構，可以在離線訓練或者建模階段不停的迭代優化安全樹模型。綜上，基於聯邦學習的風控體系既可以解決多方盜用風險、欺詐風險等帶標籤回傳的風險，同時也可以對無標籤回傳的比如營銷作弊、虛假交易等風險進行防控。不僅可以支持模型、同時也可以兼容策略的部署。同時提供實時預測和離線打分兩種功能。在模型端，有一套完整的模型優化流程。同時由於是去中心化體系，在中心只有管理功能，沒有任何資料儲存，該部分功能可以開放給所有接入資料共享的機構，管理機構變量以及各個機構可以使用的算法功能，對不同機構提供不同的風控服務。根據另一態樣的實施例，還提供一種多方聯合進行風險識別的裝置，所述多方包括第一站點和第二站點，所述第一站點儲存用戶的第一特徵集中的特徵資訊，所述第二站點儲存用戶的第二特徵集中的特徵資訊，所述特徵資訊涉及用戶的隱私資訊，所述裝置應用於所述第一站點，用於執行本說明書實施例提供的多方聯合進行風險識別的方法。圖8示出根據一個實施例的多方聯合進行風險識別的裝置的示意性框圖。如圖8所示，該裝置800包括：第一獲取單元81，用於獲取與所述第二站點聯合訓練的安全樹模型的第一子模型；所述安全樹模型還具有部署於所述第二站點的第二子模型；第二獲取單元82，用於獲取根據預設風險識別策略對應的樹結構得到的第三子模型；所述樹結構還具有部署於所述第二站點的第四子模型；第三獲取單元83，用於當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；預測單元84，用於將所述第三獲取單元83獲取的第一特徵資料輸入所述第一獲取單元81獲取的第一子模型，得到第一預測分數，以及輸入所述第二獲取單元82獲取的第三子模型，得到第三預測分數；聯合單元85，用於透過多方安全計算MPC的方式提供所述預測單元84得到的所述第一預測分數和所述第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定所述目標用戶是否具有第一風險；其中，所述第二預測分數為所述第二站點利用所述目標用戶的第二特徵集中各項特徵的第二特徵資料和所述第二子模型得到，所述第四預測分數為所述第二站點利用所述第二特徵資料和所述第四子模型得到。可選地，作為一個實施例，所述第一獲取單元81，具體用於透過MPC方式，與所述第二站點聯合訓練所述安全樹模型，得到所述安全樹模型的第一子模型。可選地，作為一個實施例，所述第一獲取單元81，具體用於接收所述第一子模型對應的第一模型文件，所述第一模型文件是從透過聯合訓練方式得到的安全樹模型的總模型文件中分拆的文件。可選地，作為一個實施例，所述確定滿足預設風險識別條件包括：接收評估請求，所述評估請求中包括所述目標用戶的標識。可選地，作為一個實施例，所述確定滿足預設風險識別條件包括：接收批量處理請求，所述目標用戶是批量處理請求所限定的用戶集合中的任意用戶。可選地，作為一個實施例，所述MPC包括：同態加密、秘密分享之一。可選地，作為一個實施例，所述裝置還包括：確定單元，用於在所述第一獲取單元81獲取與所述第二站點聯合訓練的安全樹模型的第一子模型之前，確定與所述第二站點之間的資料交互權限；及/或，確定所述第一特徵集中的特徵資訊和所述第二特徵集中的特徵資訊；及/或，確定與所述第二站點之間已達成算法共識。可選地，作為一個實施例，所述裝置還包括：記錄單元，用於與所述第二站點聯合訓練時，記錄與所述第二站點之間交互的資料。可選地，作為一個實施例，所述第一風險包括有監督風險，所述有監督風險為用戶實施第一行為後能夠獲得所述第一行為對應的是否具有所述第一風險的標籤；所述特徵資訊還涉及用戶的行為資訊。可選地，作為一個實施例，所述第一風險包括無監督風險；所述無監督風險為用戶實施第二行為後不能夠獲得所述第二行為對應的是否具有所述第一風險的標籤；與所述第二站點聯合訓練安全樹模型，包括：針對所述第一風險獲取第一樣本集合，所述第一樣本集合中各樣本的標籤為人工定義的，或者基於各樣本的高危險特徵集合中的各特徵的特徵分佈確定的；利用所述第一樣本集合，與所述第二站點初步聯合訓練所述安全樹模型，並重新確定所述高危險特徵集合中包含的各特徵；利用重新確定的所述高危險特徵集合中的各特徵的特徵分佈，更新所述第一樣本集合中各樣本的標籤；基於更新後的標籤，與所述第二站點再次聯合訓練所述安全樹模型。根據另一態樣的實施例，還提供一種計算機可讀儲存媒體，其上儲存有計算機程式，當所述計算機程式在計算機中執行時，令計算機執行結合圖2所描述的方法。根據再一態樣的實施例，還提供一種計算設備，包括記憶體和處理器，所述記憶體中儲存有可執行碼，所述處理器執行所述可執行碼時，實現結合圖2所描述的方法。本領域技術人員應該可以意識到，在上述一個或多個示例中，本發明所描述的功能可以用硬體、軟體、韌體或它們的任意組合來實現。當使用軟體實現時，可以將這些功能儲存在計算機可讀媒體中或者作為計算機可讀媒體上的一個或多個指令或碼進行傳輸。以上所述的具體實施方式，對本發明的目的、技術方案和有益效果進行了進一步詳細說明，所應理解的是，以上所述僅為本發明的具體實施方式而已，並不用於限定本發明的保護範圍，凡在本發明的技術方案的基礎之上，所做的任何修改、等同替換、改進等，均應包括在本發明的保護範圍之內。

800:裝置 81:第一獲取單元 82:第二獲取單元 83:第三獲取單元 84:預測單元 85:聯合單元

為了更清楚地說明本發明實施例的技術方案，下面將對實施例描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其它的附圖。 [圖1]為本說明書披露的一個實施例的實施場景示意圖； [圖2]示出根據一個實施例的多方聯合進行風險識別的方法流程圖； [圖3]示出根據一個實施例的多方聯合進行風險識別的體系結構示意圖； [圖4]示出根據一個實施例的在線部署鏈路示意圖； [圖5]示出根據一個實施例的離線部署鏈路示意圖； [圖6]示出根據一個實施例的策略轉換過程示意圖； [圖7]示出根據一個實施例的多方模型進化閉環示意圖； [圖8]示出根據一個實施例的多方聯合進行風險識別的裝置的示意性框圖。

Claims

一種多方聯合進行風險識別的方法，該多方包括第一站點和第二站點，該第一站點儲存用戶的第一特徵集中的特徵資訊，該第二站點儲存用戶的第二特徵集中的特徵資訊，該特徵資訊涉及用戶的隱私資訊，該方法應用於該第一站點，包括：獲取與該第二站點聯合訓練的安全樹模型的第一子模型；該安全樹模型還具有部署於該第二站點的第二子模型；獲取根據預設風險識別策略對應的樹結構得到的第三子模型；該樹結構還具有部署於該第二站點的第四子模型；當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；將該第一特徵資料輸入該第一子模型，得到第一預測分數，以及輸入該第三子模型，得到第三預測分數；透過多方安全計算MPC的方式提供該第一預測分數和該第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定該目標用戶是否具有第一風險；其中，該第二預測分數為該第二站點利用該目標用戶的第二特徵集中各項特徵的第二特徵資料和該第二子模型得到，該第四預測分數為該第二站點利用該第二特徵資料和該第四子模型得到。
如請求項1所述的方法，其中，所述獲取與該第二站點聯合訓練的安全樹模型的第一子模型，包括：透過MPC方式，與該第二站點聯合訓練該安全樹模型，得到該安全樹模型的第一子模型。
如請求項1所述的方法，其中，所述獲取與該第二站點聯合訓練的安全樹模型的第一子模型，包括：接收該第一子模型對應的第一模型文件，該第一模型文件是從透過聯合訓練方式得到的安全樹模型的總模型文件中分拆的文件。
如請求項1所述的方法，其中，所述確定滿足預設風險識別條件包括：接收評估請求，該評估請求中包括該目標用戶的標識。
如請求項1所述的方法，其中，所述確定滿足預設風險識別條件包括：接收批量處理請求，該目標用戶是批量處理請求所限定的用戶集合中的任意用戶。
如請求項1所述的方法，其中，該MPC包括：同態加密、秘密分享之一。
如請求項1所述的方法，其中，所述獲取與該第二站點聯合訓練的安全樹模型的第一子模型之前，該方法還包括：確定與該第二站點之間的資料交互權限；及/或，確定該第一特徵集中的特徵資訊和該第二特徵集中的特徵資訊；及/或，確定與該第二站點之間已達成算法共識。
如請求項1所述的方法，其中，該方法還包括：與該第二站點聯合訓練時，記錄與該第二站點之間交互的資料。
如請求項1所述的方法，其中，該第一風險包括有監督風險，該有監督風險為用戶實施第一行為後能夠獲得該第一行為對應的是否具有該第一風險的標籤；該特徵資訊還涉及用戶的行為資訊。
如請求項1所述的方法，其中，該第一風險包括無監督風險；該無監督風險為用戶實施第二行為後不能夠獲得該第二行為對應的是否具有該第一風險的標籤；與該第二站點聯合訓練安全樹模型，包括：針對該第一風險獲取第一樣本集合，該第一樣本集合中各樣本的標籤為人工定義的，或者基於各樣本的高危險特徵集合中的各特徵的特徵分佈確定的；利用該第一樣本集合，與該第二站點初步聯合訓練該安全樹模型，並重新確定該高危險特徵集合中包含的各特徵；利用重新確定的該高危險特徵集合中的各特徵的特徵分佈，更新該第一樣本集合中各樣本的標籤；基於更新後的標籤，與該第二站點再次聯合訓練該安全樹模型。
一種多方聯合進行風險識別的裝置，該多方包括第一站點和第二站點，該第一站點儲存用戶的第一特徵集中的特徵資訊，該第二站點儲存用戶的第二特徵集中的特徵資訊，該特徵資訊涉及用戶的隱私資訊，該裝置應用於該第一站點，包括：第一獲取單元，用於獲取與該第二站點聯合訓練的安全樹模型的第一子模型；該安全樹模型還具有部署於該第二站點的第二子模型；第二獲取單元，用於獲取根據預設風險識別策略對應的樹結構得到的第三子模型；該樹結構還具有部署於該第二站點的第四子模型；第三獲取單元，用於當確定滿足預設風險識別條件時，獲取目標用戶的第一特徵集中各項特徵的第一特徵資料；預測單元，用於將該第三獲取單元獲取的第一特徵資料輸入該第一獲取單元獲取的第一子模型，得到第一預測分數，以及輸入該第二獲取單元獲取的第三子模型，得到第三預測分數；聯合單元，用於透過多方安全計算MPC的方式提供該預測單元得到的該第一預測分數和該第三預測分數，從而與第二預測分數和第四預測分數相結合，綜合確定該目標用戶是否具有第一風險；其中，該第二預測分數為該第二站點利用該目標用戶的第二特徵集中各項特徵的第二特徵資料和該第二子模型得到，該第四預測分數為該第二站點利用該第二特徵資料和該第四子模型得到。
如請求項11所述的裝置，其中，該第一獲取單元，具體用於透過MPC方式，與該第二站點聯合訓練該安全樹模型，得到該安全樹模型的第一子模型。
如請求項11所述的裝置，其中，該第一獲取單元，具體用於接收該第一子模型對應的第一模型文件，該第一模型文件是從透過聯合訓練方式得到的安全樹模型的總模型文件中分拆的文件。
如請求項11所述的裝置，其中，所述確定滿足預設風險識別條件包括：接收評估請求，該評估請求中包括該目標用戶的標識。
如請求項11所述的裝置，其中，該確定滿足預設風險識別條件包括：接收批量處理請求，該目標用戶是批量處理請求所限定的用戶集合中的任意用戶。
如請求項11所述的裝置，其中，該MPC包括：同態加密、秘密分享之一。
如請求項11所述的裝置，其中，該裝置還包括：確定單元，用於在該第一獲取單元獲取與該第二站點聯合訓練的安全樹模型的第一子模型之前，確定與該第二站點之間的資料交互權限；及/或，確定該第一特徵集中的特徵資訊和該第二特徵集中的特徵資訊；及/或，確定與該第二站點之間已達成算法共識。
如請求項11所述的裝置，其中，該裝置還包括：記錄單元，用於與該第二站點聯合訓練時，記錄與該第二站點之間交互的資料。
如請求項11所述的裝置，其中，該第一風險包括有監督風險，該有監督風險為用戶實施第一行為後能夠獲得該第一行為對應的是否具有該第一風險的標籤；該特徵資訊還涉及用戶的行為資訊。
如請求項11所述的裝置，其中，該第一風險包括無監督風險；該無監督風險為用戶實施第二行為後不能夠獲得該第二行為對應的是否具有該第一風險的標籤；與該第二站點聯合訓練安全樹模型，包括：針對該第一風險獲取第一樣本集合，該第一樣本集合中各樣本的標籤為人工定義的，或者基於各樣本的高危險特徵集合中的各特徵的特徵分佈確定的；利用該第一樣本集合，與該第二站點初步聯合訓練該安全樹模型，並重新確定該高危險特徵集合中包含的各特徵；利用重新確定的該高危險特徵集合中的各特徵的特徵分佈，更新該第一樣本集合中各樣本的標籤；基於更新後的標籤，與該第二站點再次聯合訓練該安全樹模型。
一種計算機可讀儲存媒體，其上儲存有計算機程式，當該計算機程式在計算機中執行時，令計算機執行請求項1-10中任一項的所述的方法。
一種計算設備，包括記憶體和處理器，該記憶體中儲存有可執行碼，該處理器執行所述可執行碼時，實現請求項1-10中任一項的所述的方法。