TWI687876B

TWI687876B - 虛擬資源分配、模型建立、資料預測方法及裝置

Info

Publication number: TWI687876B
Application number: TW107117914A
Authority: TW
Inventors: 周俊; 小龍李
Original assignee: 香港商阿里巴巴集團服務有限公司
Priority date: 2017-09-27
Filing date: 2018-05-25
Publication date: 2020-03-11
Also published as: EP3617983A4; US10891161B2; US20200319927A1; WO2019062697A1; US10691494B2; EP3617983A1; CN109559214A; US20200097329A1; TW201915847A

Abstract

公開一種虛擬資源分配方法，包括：接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。

Description

虛擬資源分配、模型建立、資料預測方法及裝置

本說明書係有關電腦應用領域，尤其是一種虛擬資源分配、模型的建立、資料預測方法及裝置。

隨著網際網路技術的飛速發展，使用者的個人資料的網路化和透明化已經成為不可阻擋的大趨勢。對於一些面向使用者提供網際網路服務的服務平臺而言，可以通過採集使用者日常產生的服務資料，收集到大量的使用者資料。而這些使用者資料對於服務平臺的運營方來說，是非常珍貴的“資源”，服務平臺的運營方可以通過資料挖掘和機器學習，基於這些“資源”來構建使用者評估模型，並利用該使用者評估模型對使用者進行評估決策。　　例如，在信貸發放的場景下，可以從大量的使用者資料中提取出若干個維度的資料特徵，並基於提取出的這些特徵構建訓練樣本，通過特定的機器學習算法訓練來創建使用者風險評估模型，然後使用該使用者風險評估模型，對使用者進行風險評估，並基於風險評估結果來決策該使用者是否為風險使用者，進而決定是否需要向使用者發放貸款。

本說明書提出一種虛擬資源分配方法，包括：　　接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　可選的，所述訓練好的模型為線性模型。　　可選的，為各資料提供方分配的所述虛擬資源的數量，與各資料提供方的貢獻度成正比。　　可選的，還包括：　　接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。　　可選的，所述虛擬資源為向各資料提供方發放的使用者資料使用資金。　　可選的，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。　　本說明書還提出一種虛擬資源分配裝置，包括：　　接收模組，接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　訓練模組，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　分配模組，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　可選的，所述訓練好的模型為線性模型。　　可選的，為各資料提供方分配的所述虛擬資源的數量，與各資料提供方的貢獻度成正比。　　可選的，還包括：　　評估模組，接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。　　可選的，所述虛擬資源為向各資料提供方發放的使用者資料使用資金。　　可選的，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。　　可選的，本說明書還提出一種模型建立方法，包括：　　接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，得到訓練好的模型。　　可選的，其中，所述訓練好的模型為線性模型。　　可選的，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。　　本說明書還提出一種資料預測的方法，包括：　　接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，得到訓練好的模型；　　接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。　　本說明書還提出一種虛擬資源分配系統，包括：　　多個資料提供方服務端，向風險評估方服務端上傳若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　風險評估方服務端，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；以及，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　本說明書還提出一種電子設備，包括：　　處理器；　　用於儲存機器可執行指令的儲存器；　　其中，通過讀取並執行所述儲存器儲存的與虛擬資源分配的控制邏輯對應的機器可執行指令，所述處理器被促使：　　接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　本說明書中，多個資料提供方可以基於自己的評估模型對若干使用者分別進行評估後得到的評估結果上傳給風險評估方；而風險評估方可以將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，來訓練模型，並將訓練好的模型中的與各變量對應的係數作為各資料提供方的貢獻度，然後可以基於該貢獻度為各資料提供方分配虛擬資源：　　一方面，由於風險評估方在基於各資料提供方維護的使用者資料訓練模型時，資料提供方僅需要向風險評估方傳輸對若干使用者進行初步評估後得到的評估結果，因此對於資料提供方而言，不再需要將本地維護的原始使用者資料傳輸至風險評估方，可以顯著降低使用者隱私洩露的發生風險；　　另一方面，由於訓練好的模型中的各變量的係數能夠真實的反映各資料提供方對訓練越好的模型的貢獻度，因此基於該貢獻度向各資料提供方分配虛擬資源，能夠做到虛擬資源的合理分配。

在大資料時代，通過對大量資料進行挖掘，可以獲得各種形式的有用資訊，因此資料的重要性不言而喻。不同的機構都擁有各自的資料，但是任何一家機構的資料挖掘效果，都會受限於其自身擁有的資料數量和種類。針對該問題，一種直接的解決思路是：多家機構相互合作，將資料進行共享，從而實現更好的資料挖掘效果，實現共贏。　　然而對於資料擁有方而言，資料本身是一種具有很大價值的資產，而且出於保護隱私、防止洩露等需求，資料擁有方往往並不願意直接把資料提供出來，這種狀況導致“資料共享”在現實中很難實際運作。因此，如何在充分保證資料安全的前提下實現資料共享，已經成為行業內備受關注的問題。　　本說明書中，則旨在提出一種風險評估方方在“共享”多個資料提供方維護的使用者資料來訓練模型時，各個資料提供方不再需要將原始的使用者資料傳輸至風險評估方，就可以完成“資料共享”的技術方案。　　在實現時，各個資料提供方可以分別基於機器學習算法對其本地維護的使用者資料進行訓練，構建使用者評估模型，並使用該使用者評估模型對若干樣本使用者進行評估，然後將評估結果上傳給風險評估方。　　而風險評估方可以將各資料提供方上傳的評估結果作為訓練資料，來構建出若干訓練樣本；其中，每一條訓練樣本包含同一個使用者在各資料提供方的評估結果。例如，可以將各資料提供方上傳的對某一個使用者的評估結果分別作為建模特征，來構建一個特徵向量作為訓練樣本。　　並且，構建完成的訓練樣本可以根據使用者對業務的實際執行情況對訓練樣本標定對應的標籤；例如，在信貸發放的業務場景下，為各訓練樣本標定的標籤，具體可以是基於使用者真實的還款情況，為使用者標定的能夠指示該使用者是否為風險使用者的使用者標籤。　　最後，風險評估方可以基於構建完成的訓練樣本以及與各個訓練樣本對模型進行訓練，並將訓練好的模型中的各變量的係數作為各資料提供方對模型的貢獻度，然後基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　一方面，由於風險評估方在基於各資料提供方維護的使用者資料訓練模型時，資料提供方僅需要向風險評估方傳輸對若干使用者進行初步評估後得到的評估結果，因此對於資料提供方而言，不再需要將本地維護的原始使用者資料傳輸至風險評估方，可以顯著降低使用者隱私洩露的發生風險；　　另一方面，由於訓練好的模型中的各變量的係數能夠真實的反映各資料提供方對訓練越好的模型的貢獻度，因此基於該貢獻度向各資料提供方分配虛擬資源，能夠做到虛擬資源的合理分配。　　例如，以信貸發放的業務場景為例，上述使用者評估模型具體可以是一個用於決策使用者是否為風險使用者的使用者風險評估模型；而上述評估結果則可以是利用上述使用者風險評估模型對使用者進行風險評估後輸出的一個風險評分。　　在這種場景下，各個資料提供方可以基於自有的使用者資料構建使用者風險評估模型；當風險評估方（比如，可以是貸款的發放一方）需要共享各資料提供方的使用者資料來訓練使用者風險評估模型時，可以將各資料提供方上傳的評估結果作為訓練資料，來構建出若干訓練樣本，並基於使用者真實的還款情況，為各訓練樣本標定能夠指示該使用者是否為風險使用者的標籤，然後可以基於構建完成的訓練樣本以及與各個訓練樣本對模型進行訓練，並將訓練好的模型中的各變量的係數作為各資料提供方對模型的貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。從而，在整個過程中，各個資料提供方並不需要向風險評估方提供原始的使用者資料，就可以完成“資料共享”。　　下面通過具體實施例並結合具體的應用場景進行詳細描述。　　請參考圖1，圖1是本說明書一實施例提供的一種虛擬資源分配方法，應用於風險評估方服務端，執行以下步驟：　　步驟102，接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　步驟104，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　步驟106，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　上述資料提供方，具體可以包括與上述風險評估方具有合作關係的一方。在實際應用中，上述資料提供方和風險評估方可以分別對應不同的運營方；例如，上述建模方可以是A公司的資料運營平臺，而上述資料提供方可以是與A公司的資料運營平臺對接的諸如電商平臺、第三方銀行、快遞公司、其它金融機構、電信運營商等服務平臺。　　上述所述使用者評估模型，具體可以包括任意類型的用於對使用者進行評估的機器學習模型；　　例如，在示出的一種實施方式中，上述使用者評估模型，具體可以是基於特定的機器學習算法訓練出的使用者風險評估模型（比如，用於對使用者進行風險評估的線性邏輯回歸模型或者評分卡模型）；相應的，通過該使用者評估模型對使用者進行評估後輸出的評估結果，則可以是表徵該使用者的風險水平的風險評分；其中，在實際應用中，該風險評分通常是一個0-1之間的浮點數值（比如，上述風險評分具體可以是一個表徵使用者風險水平的概率值）；或者，上述評估結果也可以是風險評分以外其它形式的評分，比如，信用評分等。　　在本說明書中，為了降低將原始的使用者資料傳輸至風險評估方進行建模，而造成的使用者隱私洩露的風險，各個資料提供方可以不再需要將本地維護的原始使用者資料，傳輸至風險評估方，而是各自利用本地維護的原始使用者資料分別進行建模。　　在實現時，各個資料提供方的服務端可以分別在後臺收集使用者日常產生的使用者資料，從收集到的這些使用者資料中採集若干條使用者資料作為資料樣本，並基於採集到的這些資料樣本產生一個初始化的資料樣本集合。　　其中，採集到的上述資料樣本的具體數量，在本說明書中不進行特別限定，本領域技術人員可以基於實際的需求進行設置。　　上述使用者資料的具體形態，取決於具體的業務場景以及建模需求，具體可以涵蓋任意類型的，從中可以提取出用於訓練使用者評估模型的建模特征的使用者資料，在本說明書中也不進行特別限定；　　例如，在實際應用中，如果希望創建出一個用於對使用者發起的貸款申請，或者支付交易進行風險評估的評分卡模型，上述使用者資料則可以包括諸如使用者的交易資料、購物記錄、還款記錄、消費記錄、理財產品購買記錄等，能夠從中提取出用於訓練風險評估模型的建模特征的使用者資料。　　當基於採集到的資料樣本產生上述資料樣本集合後，上述資料提供方服務端還可以對該資料樣本集合中的資料樣本進行預處理。　　其中，對上述資料樣本集合中的資料樣本進行預處理，通常包括對上述資料樣本集合中的資料樣本進行資料清洗、補充缺省值、歸一化處理或者其它形式的預處理過程。通過對資料樣本集合中的資料樣本進行預處理，可以將採集到的資料樣本轉換成適宜進行模型訓練的標準化的資料樣本。　　當對上述資料樣本集合中的資料樣本預處理完成後，上述資料提供方服務端可以從上述資料樣本集合中的各資料樣本中，分別提取出若干個維度的資料特徵（即最終參與建模的建模特征）。其中，提取出的上述若干個維度的資料特徵的數量，在本說明書中不進行特別限定，本領域技術人員可以基於實際的建模需求進行選擇。　　另外，提取出的資料特徵的具體類型，在本說明書中也不進行特別限定，本領域技術人員可以基於實際的建模需求，從上述資料樣本中實際所包含的資訊中來人工選定。　　當從資料樣本中分別提取出若干個維度的資料特徵後，上述資料提供方服務端可以基於提取出的這些維度的資料特徵對應的資料特徵取值，為各資料樣本分別產生一個資料特徵向量，然後基於各資料樣本的資料特徵向量，構建出一個目標矩陣；比如，以從N條資料樣本中分別提取出M個維度的資料特徵為例，上述目標矩陣則可以是一個N*M維的矩陣。　　此時，構建出的上述目標矩陣，即最終進行模型訓練的訓練樣本集，各個資料提供方服務端，可以基於特定的機器學習算法，將上述目標矩陣作為原始的樣本訓練集進行機器學習，分別訓練出一個使用者評估模型。　　其中，需要說明的是，各個資料提供方在訓練使用者評估模型時所採用的機器學習算法，可以相同也可以不同，在本說明書中不進行特別限定。　　在本說明書中，上述機器學習模型具體可以是有監督的機器學習模型；例如，上述機器學習模型具體可以是LR（Logistic Regression，邏輯回歸）模型。　　在這種情況下，上述訓練樣本集中的每一條資料樣本，可以分別攜帶一個預先標定的樣本標籤。其中，該樣本標籤的具體形態，通常也取決於具體的業務場景以及建模需求，在本說明書中也不進行特別限定；　　例如，在實際應用中，如果希望創建出一個是否可以給使用者發放貸款的模型，那麼上述樣本標籤則具體可以是一個用於指示該使用者是否為風險使用者的使用者標籤；其中，該使用者標籤具體可以由風險評估方來標定和提供。在這種情況下，上述目標矩陣中的每一個資料特徵向量，可以分別對應一個樣本標籤。　　其中，各個資料提供方基於有監督的機器學習算法訓練使用者評估模型的具體過程，在本說明書中不再進行詳述，本領域技術人員在將本說明書記載的技術方案付諸實現時，可以參考相關技術中的記載。　　例如，以上述有監督的機器學習算法為LR算法為例，在基於LR算法訓練邏輯回歸模型時，通常可以採用損失函數（Loss Function）來評估訓練樣本和對應的樣本標籤之間的擬合誤差。在實現時，可以將訓練樣本和對應的樣本標籤作為輸入值輸入至損失函數中，並採用梯度下降法進行反復迭代計算，直至收斂，進而可以求解出模型參數（即訓練樣本中各個建模特征的最優權重值，該權重值可以表徵各個建模特征對模型輸出結果的貢獻度）的取值，然後將求解出的該模型參數的取值作為最優參數，來構建上述邏輯回歸模型。　　請參見圖2，圖2為本說明書示出的一種風險評估方基於多個資料提供方上傳的評估結果訓練模型的示意圖。　　在初始狀態下，上述風險評估方可以預先準備若干樣本使用者，並將這些樣本使用者的使用者ID通知給各個資料提供方；例如，在實現時可以將各樣本使用者的使用者ID以列表的形式下發至各個資料提供方。　　各資料提供方在收到上述若干樣本使用者的使用者ID後，可以使用自己的使用者評估模型對各樣本使用者分別進行使用者評估，然後將評估結果上傳給風險評估方,由上述風險評估方進行建模。　　當然，如果各使用者提供方發給風險評估方的評估結果中對於相同的使用者本身就具有相同的ID，那麼風險評估方無需將樣本使用者的使用者ID通知給各個資料提供方。　　可見，通過這種方式，對於各個資料提供方而言，不再需要將本地維護的原始的使用者資料“共享”給風險評估方，只需要向風險評估方“共享”一個對使用者的初步的評估結果即可。　　一方面，資料提供方“共享”給風險評估方的初步的評估結果，可以理解為對本地維護的使用者資料的一個降維；即各個資料提供方“共享”的初步的評估結果，可以看作是一個將本地維護的使用者資料，降低到維度為1的一個資料特徵。　　另一方面，由於上述初步的評估結果，是由各個資料提供方基於對本地維護的使用者資料進行機器學習建模得出的，因此將初步的評估結果“共享”給風險評估方，相當於是將基於機器學習從本地維護的使用者資料中學習分析出的資料價值，共享給風險評估方。雖然各個資料提供方沒有將原始的使用者資料“共享”給風險評估方，但通過資料價值“共享”，仍然能夠達到資料共享的目的。　　在本說明書中，風險評估方在收到各資料提供方上傳的對應於這些樣本使用者的評估結果後，可以將各資料提供方上傳的評估結果作為訓練資料，為各樣本使用者分別創建出一條對應的訓練樣本。　　此時，構建完成的每一個訓練樣本中，將包含各個資料提供方基於訓練完成上述使用者評估模型，對與該訓練樣本對應的樣本使用者進行初步的評估後，得到的評估結果。而對於每一個資料提供方的評估結果而言，將分別對應上述訓練樣本中的一個特徵變量。　　其中，上述特徵變量具體是指構成上述訓練樣本的特徵字段，在本說明書中，每一個訓練樣本中將包含若干個特徵字段，而每個特徵字段將分別對應一個資料提供方上傳的評估結果。　　當為各樣本使用者分別創建出對應的訓練樣本後，還可以基於創建的訓練樣本產生一個訓練樣本集，並基於各樣本使用者對業務的實際執行情況對訓練樣本標定對應的標籤；例如，在信貸發放的業務場景下，為各訓練樣本標定的標籤，具體可以是基於使用者真實的還款情況，為使用者標定的能夠指示該使用者是否為風險使用者的使用者標籤。在這種場景下，風險評估方可以基於各樣本使用者最終是否違約還款，對各樣本使用者標定使用者標籤；比如，假設最終向某一樣本使用者發放貸款後，該使用者出現了違約還款，那麼最終在訓練樣本集中，與該樣本使用者對應的訓練樣本將被標記一個用於指示該使用者為風險使用者的標籤。　　當為訓練樣本集中的訓練樣本分別標定了使用者標籤後，上述風險評估方服務端，可以基於構建的訓練樣本集以及與各訓練樣本對應的標籤，對預設的機器學習模型進行訓練。　　在示出的一種實施方式中，由於各資料提供方上傳的對同一個使用者的評估結果，與該使用者的使用者標籤（即最終的使用者評估結果）之間，可能會保持著一定的線性關係；　　例如，對於風險評估方而言，可以通過將各個資料提供方上傳的對同一個使用者的評估結果乘以相應的係數進行相加計算，然後將計算結果作為針對該使用者的最終評估結果。　　因此，在本實施例中，風險評估方一側訓練的機器學習模型，具體可以是線性模型；例如，在實際應用中，風險評估方一側訓練的機器學習模型，可以是線性邏輯回歸模型。　　其中，風險評估方在基於構建的訓練樣本集以及與各訓練樣本對應的標籤，對線性模型進行訓練的過程，即為將各資料提供方上傳的評估結果作為自變量，將對應使用者標籤作為因變量，代入到線性模型的表達式中進行線性擬合，求解出與各自變量對應的係數的過程，其具體的實施過程，在本說明書不再進行詳述，本領域技術人員在將本說明書中的技術方案付諸實現時，可以參考相關技術中的記載。　　在本說明書中，當風險評估方通過以上訓練過程，訓練出與訓練樣本中的各變量（即各資料提供方上傳的評估結果）對應的係數後，此時模型訓練完畢。　　當風險評估方通過使用各個資料提供方上傳的對目標使用者的初步評估結果，完成模型的訓練後，還可以基於各個資料提供方對訓練好的模型的貢獻度為各個資料提供方分配一定數額的虛擬資源；其中，為各資料提供方分配的虛擬資源的數量，可以與各個資料提供方的權重值（即係數）成正比；　　在示出的一種實施方式中，為各資料提供方分配的虛擬資源，具體可以是風險評估方向各資料提供方發放的使用者資料使用資金。在這種情況下，上述風險評估方可以基於各個資料提供方對訓練好的模型的貢獻度，對能夠向各個資料提供方發放的使用者資料使用資金，進行利益分配。　　其中，在示出的一種實現方式中，各個資料提供方對訓練好的模型的貢獻度，具體可以用訓練出的與訓練樣本中的各變量對應的系統來表徵。在這種情況下，當風險評估方通過以上示出的模型訓練過程，訓練出了與訓練樣本中的各變量對應的係數後，可以將訓練出的各變量對應的係數作為各個資料提供方的貢獻度，然後基於各變量對應的係數大小為各資料提供方進行利益分配；　　例如，風險評估方可以將各變量的係數作為對模型的貢獻度，換算出對應的分配比例，然後按照換算出的分配比例，將能夠用於向各資料提供方分配的使用者資料使用資金的總額，分別分配給各個資料提供方。在這種情況下，對模型的貢獻較高的資料提供方，將可以拿到更多的資料使用資金。通過這種方式，可以使高質量的資料提供方能夠獲益更多，從而迫使各個資料提供方能夠不斷去提高各自的資料質量。　　當然，在實際應用中，在初始狀態下，如果風險評估方無法收集到足夠的訓練樣本完成模型的訓練，那麼可以為該模型中的各變量設置一個初始的係數，並利用該初始的係數來表徵各資料提供方對模型的初始貢獻度。　　其中，上述初始貢獻度的設置策略，在本說明書中不進行特別限定，本領域技術人員在將本說明書的技術方案付諸實現時，可以基於實際的需求來進行設置；　　例如，在一種實現方式中，當風險評估方的服務端在設備冷啟動（即設備首次開機運行）時，可以採用加權平均的方式，為模型中的各變量設置一個相同的初始的係數，並基於該初始的係數作為各資料提供方的初始貢獻度，來為各資料提供方平均分配虛擬資源。　　例如，以風險評估方為各資料提供方分配的虛擬資源，為風險評估方向各資料提供方發放的使用者資料使用資金為例，在這種情況下，上述風險評估方可以基於各資料提供方的初始貢獻度，對能夠用於向各資料提供方分配的使用者資料使用資金的總額，平均分配給各個資料提供方。　　可見，通過這種方式，由於訓練好的模型中的各變量的係數能夠真實的反映各資料提供方對訓練越好的模型的貢獻度，因此基於該貢獻度向各資料提供方分配虛擬資源，能夠做到虛擬資源的合理分配。　　請繼續參見圖2，當風險評估方完成模型的訓練後，後續可以使用訓練好的模型對某一個目標使用者來進行風險評估。　　其中，上述目標使用者，具體可以包括上述風險評估方需要進行風險評估的使用者；例如，以信貸發放的業務場景為例，上述風險評估方，具體可以是貸款發放的一方；而上述目標使用者具體可以是指發起了一筆貸款申請，需要由風險評估方進行風險評估和決策是否發放貸款的使用者。　　當該多個資料提供方在收到該目標使用者的使用者ID後，可以基於該使用者ID查找已經利用自己的使用者評估模型評估完成的評估結果，然後將評估結果上傳給風險評估方。　　而風險評估方在收到各資料提供方針對該目標使用者的評估結果後，可以將各資料提供方上傳的評估結果作為訓練資料，為該目標使用者創建出一條對應的預測樣本，然後將該預測樣本輸入至訓練好的模型中進行預測計算，得到該使用者的最終的評估結果，並基於該最終的評估結果來進行相應的業務決策。　　例如，仍以信貸發放的業務場景為例，在這種場景下，上述最終的評估結果仍然可以是風險評分；風險評估方在基於該風險評分來決策是否向該使用者發放貸款時，可以通過將該風險評分與預設的風險閾值進行比較來實現；一方面，如果風險評分高於或者等於上述風險閾值，則表明上述目標使用者為風險使用者，此時可以為該使用者標定一個用於指示該使用者為風險使用者的使用者標籤，並終止該使用者發起的貸款申請。　　另一方面，如果上述風險評分低於上述風險閾值，則表明上述目標使用者為低風險使用者，可以為該使用者標定一個用於指示該使用者為低風險使用者的使用者標籤，並正常響應該使用者發起的貸款申請，向該使用者發放貸款。　　當然，為該目標使用者發放貸款後，後續還可以基於該目標使用者最終是否違約還款，對已經為該使用者標定的使用者標籤進行維護和更新；比如，假設目標使用者被標定為非風險使用者，最終向該使用者發放貸款後，如果該使用者出現違約還款，那麼可以立即對已經標定的使用者標籤進行更新，將該使用者重新標定為風險使用者。　　最後，需要補充說明的是，在本說明書中，與上述風險評估方具有合作關係的資料提供方，可以是動態變化的。　　作為資料建模方，可以支持任何一個資料提供方隨時退出“資料共享”，也可以支持任何一個資料提供方隨時加入“資料共享”。即對於風險評估方而言，可以不需要關注與其具有合作關係的資料提供方的數量以及類型，僅需要對當前與自身保持合作關係的各個資料提供方上傳的對上述目標使用者的初步的評估結果進行加權計算即可。可見，在本說明書中，上述風險評估方，可以靈活的與不同類型的資料提供方進行對接。　　通過以上各實施例可知，一方面，由於風險評估方在基於各資料提供方維護的使用者資料訓練模型時，資料提供方僅需要向風險評估方風險評估方傳輸對該使用者進行初步評估後得到的評估結果，因此對於資料提供方而言，不再需要將本地維護的原始使用者資料傳輸至風險評估方，可以顯著降低使用者隱私洩露的發生風險；　　另一方面，由於訓練好的模型中的各變量的係數能夠真實的反映各資料提供方對訓練越好的模型的貢獻度，因此基於該貢獻度向各資料提供方分配虛擬資源，能夠做到虛擬資源的合理分配。　　請參見圖3，與上述方法實施例相對應，本說明書還提供了一種模型建立方法，應用於風險評估方服務端，執行以下步驟：　　步驟302，接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　步驟304，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　步驟306，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，得到訓練好的模型。　　在本實施例中，上述訓練好的模型可以為線性模型。例如，在實際應用中，可以是線性邏輯回歸模型。上述評估模型可以為使用者風險評估模型；上述評估結果可以為風險評分(或信用評分)；上述標籤指示使用者是否為風險使用者。　　其中，以上各步驟的具體實施細節，在本實施例中不再進行贅述，本領域技術人員可以參考之前實施例的記載。　　請參見圖4，與上述方法實施例相對應，本說明書還提供了一種資料預測的方法，應用於風險評估方服務端，執行以下步驟：　　步驟402，接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　步驟404，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　步驟406，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，得到訓練好的模型；　　步驟408，接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。　　其中，以上各步驟的具體實施細節，在本實施例中不再進行贅述，本領域技術人員可以參考之前實施例的記載。與上述方法實施例相對應，本說明書還提供了一種虛擬資源分配裝置的實施例。　　本說明書的虛擬資源分配裝置的實施例可以應用在電子設備上。裝置實施例可以通過軟體實現，也可以通過硬體或者軟硬體結合的方式實現。以軟體實現為例，作為一個邏輯意義上的裝置，是通過其所在電子設備的處理器將非易失性儲存器中對應的電腦程式指令讀取到記憶體中運行形成的。從硬體層面而言，如圖5所示，為本說明書的虛擬資源分配裝置所在電子設備的一種硬體結構圖，除了圖5所示的處理器、記憶體、網路介面、以及非易失性儲存器之外，實施例中裝置所在的電子設備通常根據該電子設備的實際功能，還可以包括其他硬體，對此不再贅述。　　圖6是本說明書一示例性實施例示出的一種虛擬資源分配裝置的方塊圖。　　請參考圖6，所述虛擬資源分配裝置60可以應用在前述圖6所示的電子設備中，包括有：接收模組601、訓練模組602、分配模組603。　　其中，接收模組601，接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　訓練模組602，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　分配模組603，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　在本實施例中，所述訓練好的模型為線性模型。　　在本實施例中，為各資料提供方分配的所述虛擬資源的數量，與各資料提供方的貢獻度成正比。　　在本實施例中，所述裝置還包括：　　評估模組604（圖6中未示出），接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。　　在本實施例中，所述虛擬資源為向各資料提供方發放的使用者資料使用資金。　　在本實施例中，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。　　上述裝置中各個模組的功能和作用的實現過程具體詳見上述方法中對應步驟的實現過程，在此不再贅述。　　對於裝置實施例而言，由於其基本對應於方法實施例，所以相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的，其中所述作為分離部件說明的單元可以是或者也可以不是實體上分開的，作為單元顯示的部件可以是或者也可以不是實體單元，即可以位於一個地方，或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部模組來實現本說明書方案的目的。本領域普通技術人員在不付出進步性勞動的情況下，即可以理解並實施。　　上述實施例闡明的系統、裝置、模組或單元，具體可以由電腦晶片或實體實現，或者由具有某種功能的產品來實現。一種典型的實現設備為電腦，電腦的具體形式可以是個人電腦、膝上型電腦、蜂窩電話、相機電話、智慧電話、個人數位助理、媒體播放器、導航設備、電子郵件收發設備、遊戲控制台、平板電腦、可穿戴設備或者這些設備中的任意幾種設備的組合。　　與上述方法實施例相對應，本說明書還提供一種虛擬資源分配系統的實施例。　　該虛擬資源分配系統，可以包括多個資料提供方服務端和風險評估方服務端。　　其中，多個資料提供方服務端，向風險評估方服務端上傳若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　風險評估方服務端，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；以及，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　與上述方法實施例相對應，本說明書還提供了一種電子設備的實施例。該電子設備包括：處理器以及用於儲存機器可執行指令的儲存器；其中，處理器和儲存器通常通過內部匯流排相互連接。在其他可能的實現方式中，所述設備還可能包括外部介面，以能夠與其他設備或者部件進行通信。　　在本實施例中，通過讀取並執行所述儲存器儲存的與上述虛擬資源分配的控制邏輯對應的機器可執行指令，所述處理器被促使：　　接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；　　將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；　　基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。　　在本實施例中，所述訓練好的模型為線性模型。　　在本實施例中，為各資料提供方分配的所述虛擬資源的數量，與各資料提供方的貢獻度成正比。　　在本實施例中，通過讀取並執行所述儲存器儲存的與上述虛擬資源分配的控制邏輯對應的機器可執行指令，所述處理器被促使：　　接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。　　在本實施例中，所述虛擬資源為向各資料提供方發放的使用者資料使用資金。　　在本實施例中，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。　　本領域技術人員在考慮說明書及實踐這裡公開的發明後，將容易想到本說明書的其它實施方案。本說明書旨在涵蓋本說明書的任何變型、用途或者適應性變化，這些變型、用途或者適應性變化遵循本說明書的一般性原理並包括本說明書未公開的本技術領域中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的，本說明書的真正範圍和精神由下面的請求項指出。　　應當理解的是，本說明書並不局限於上面已經描述並在圖式中示出的精確結構，並且可以在不脫離其範圍進行各種修改和改變。本說明書的範圍僅由所附的請求項來限制。　　上述對本說明書特定實施例進行了描述。其它實施例在所附申請專利範圍的範圍內。在一些情況下，在申請專利範圍中記載的動作或步驟可以按照不同於實施例中的順序來執行並且仍然可以實現期望的結果。另外，在圖式中描繪的過程不一定要求示出的特定順序或者連續順序才能實現期望的結果。在某些實施方式中，多任務處理和並行處理也是可以的或者可能是有利的。　　以上所述僅為本申請的較佳實施例而已，並不用以限制本申請，凡在本申請的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本申請保護的範圍之內。

102‧‧‧步驟104‧‧‧步驟106‧‧‧步驟302‧‧‧步驟304‧‧‧步驟306‧‧‧步驟402‧‧‧步驟404‧‧‧步驟406‧‧‧步驟408‧‧‧步驟60‧‧‧虛擬資源分配裝置601‧‧‧接收模組602‧‧‧訓練模組603‧‧‧分配模組

圖1是本說明書一實施例示出的一種虛擬資源分配方法的流程圖；　　圖2是本說明書一實施例示出的一種風險評估方基於多個資料提供方上傳的評估結果訓練模型的示意圖；　　圖3是本說明書一實施例示出的一種模型建立方法的流程圖；　　圖4是本說明書一實施例示出的一種資料預測方法的流程圖；　　圖5是本說明書一實施例提供的承載虛擬資源分配裝置的電子設備所涉及的硬體結構圖；　　圖6是本說明書一實施例提供的所述虛擬資源分配裝置的邏輯方塊圖。

Claims

一種虛擬資源分配方法，包括：接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。
根據請求項1所述的方法，其中，所述訓練好的模型為線性模型。
根據請求項1所述的方法，其中，為各資料提供方分配的所述虛擬資源的數量，與各資料提供方的貢獻度成正比。
根據請求項1所述的方法，還包括：接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。
根據請求項3所述的方法，所述虛擬資源為向各資料提供方發放的使用者資料使用資金。
根據請求項1所述的方法，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。
一種虛擬資源分配裝置，包括：接收模組，接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；訓練模組，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；分配模組，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。
根據請求項7所述的裝置，其中，所述訓練好的模型為線性模型。
根據請求項7所述的裝置，其中，為各資料提供方分配的所述虛擬資源的數量，與各資料提供方的貢獻度成正比。
根據請求項7所述的裝置，還包括：評估模組，接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。
根據請求項9所述的裝置，所述虛擬資源為向各資料提供方發放的使用者資料使用資金。
根據請求項7所述的裝置，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。
一種模型建立方法，包括：接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，得到訓練好的模型，其中，所述評估模型為使用者風險評估模型；所述評估結果為風險評分；所述標籤指示使用者是否為風險使用者。
如請求項13所述的方法，其中，所述訓練好的模型為線性模型。
一種利用如請求項13至14中任一項建立的模型進行資料預測的方法，包括，接收多個資料提供方上傳的針對某一個使用者的評估結果，將所述評估結果輸入所述訓練好的模型中，得到該使用者的最終的評估結果。
一種虛擬資源分配系統，包括：多個資料提供方服務端，向風險評估方服務端上傳若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；風險評估方服務端，將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；以及，基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。
一種電子設備，包括：處理器；用於儲存機器可執行指令的儲存器；其中，通過讀取並執行所述儲存器儲存的與虛擬資源分配的控制邏輯對應的機器可執行指令，所述處理器被促使：接收多個資料提供方上傳的若干使用者的評估結果；其中，所述評估結果為各資料提供方基於自己的評估模型對使用者分別進行評估後得到；將各資料提供方上傳的評估結果作為訓練資料，構建出若干訓練樣本，每一條訓練樣本包含同一個使用者在所述各資料提供方的評估結果；其中，所述訓練樣本根據使用者對業務的實際執行情況被標定了標籤；基於所述若干訓練樣本以及各個訓練樣本的標籤對模型進行訓練，將訓練好的模型中的各變量的係數作為各資料提供方貢獻度，基於各資料提供方的貢獻度為各資料提供方分配虛擬資源。