風險預測和風險預測模型的訓練方法、裝置及電子設備
本發明相關於電腦軟體之技術領域,更明確而言相關於一種風險預測和風險預測模型的訓練方法、裝置及電子設備。
目前,具備完善的風險識別能力的企業在對外賦能時,往往希望能夠幫助銀行、獨立軟體發展商(ISV,Independent Software Vendors)等其他機構,準確識別使用者或商家在風險場景中的風險等級。現有的方案,往往是使用上述具備完善的風險識別能力的企業的大資料,針對其所有使用者和商家訓練得到一個風險預測模型,並將該風險預測模型針對其他機構的使用者或商家的識別結果輸出給對應的機構。
然而,上述方式在識別其他機構的使用者或商家的風險等級時,由於缺乏其他機構本身的個性化資料,可能會出現識別準確率較低的情況。因此,如何充分利用一些已有資料,訓練得到識別準確率較高的風險預測模型,仍然需要進一步的解決方案。
本說明書實施例的目的是提供一種風險預測和風險預測模型的訓練方法、裝置及電子設備,以提高風險預測模型的識別準確率。
為解決上述技術問題,本說明書實施例是這樣實現的:
第一態樣,提出了一種風險預測方法,包括:
從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與所述目標使用者的使用者標識對應的第二私有資料;
將所述第一私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
將所述第一私有資料和所述第二私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
第二態樣,提出了一種風險預測模型的訓練方法,包括:
獲取賦能機構的使用者的私有資料和目標群體使用者的私有資料,其中,所述目標群體使用者為所述賦能機構和目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料,所述賦能機構的使用者包括所述目標群體使用者;
基於所述賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型;
基於所述目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
其中,所述第一風險預測模型和所述第二風險預測模型用於聯合識別使用者的風險等級。
第三態樣,提出了一種風險預測裝置,包括:
獲取單元,從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與所述目標使用者的使用者標識對應的第二私有資料;
第一預測單元,將所述第一私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
第二預測單元,將所述第一私有資料和所述第二私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
第三預測單元,基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
第四態樣,提出了一種風險預測模型的訓練裝置,包括:
資料獲取單元,獲取賦能機構的使用者的私有資料和目標群體使用者的私有資料,其中,所述目標群體使用者為所述賦能機構和目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料,所述賦能機構的使用者包括所述目標群體使用者;
第一訓練單元,基於所述賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型;
第二訓練單元,基於所述目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
其中,所述第一風險預測模型和所述第二風險預測模型用於聯合識別使用者的風險等級。
第五態樣,提出了一種電子設備,該電子設備包括:
處理器;以及
被安排成儲存電腦可執行指令的記憶體,所述可執行指令在被執行時使所述處理器執行以下操作:
從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與所述目標使用者的使用者標識對應的第二私有資料;
將所述第一私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
將所述第一私有資料和所述第二私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
第六態樣,提出了一種電腦可讀儲存媒體,所述電腦可讀儲存媒體儲存一個或多個程式,所述一個或多個程式當被包括多個應用程式的電子設備執行時,使得所述電子設備執行以下操作:
從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與所述目標使用者的使用者標識對應的第二私有資料;
將所述第一私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
將所述第一私有資料和所述第二私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
第七態樣,提出了一種電子設備,包括:
處理器;以及
被安排成儲存電腦可執行指令的記憶體,所述可執行指令在被執行時使所述處理器執行以下操作:
獲取與目標使用者的使用者標識對應的私有資料;
將與所述目標使用者的使用者標識對應的私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
將與所述目標使用者的使用者標識對應的私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
第八態樣,提出了一種電腦可讀儲存媒體,所述電腦可讀儲存媒體儲存一個或多個程式,所述一個或多個程式當被包括多個應用程式的電子設備執行時,使得所述電子設備執行以下操作:
獲取與目標使用者的使用者標識對應的私有資料;
將與所述目標使用者的使用者標識對應的私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
將與所述目標使用者的使用者標識對應的私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
由以上本說明書實施例提供的技術方案可見,本說明書實施例方案至少具備如下一種技術效果:
本說明書提供的一種或多個實施例,能夠基於賦能機構的使用者的私有資料透過同構遷移訓練得到的第一風險預測模型,對目標使用者的風險等級進行預測;並能夠基於賦能機構和目標機構共同的目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,對目標使用者的風險等級進行二次預測,並結合這兩次預測結果來確定目標使用者的風險等級。由於充分利用了賦能機構的使用者的私有資料、以及賦能機構和目標機構共同的目標群體使用者的私有資料,訓練得到第一風險預測模型和第二風險預測模型聯合對目標使用者的風險等級進行預測,提高了風險等級的預測準確率。
為使本說明書的目的、技術方案和優點更加清楚,下面將結合本說明書具體實施例及相應的圖式對本說明書中的技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本檔一部分實施例,而不是全部的實施例。基於本檔中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本檔案保護的範圍。
以下結合圖式,詳細說明本說明書各實施例提供的技術方案。
為提高風險預測模型的識別準確率,本說明書一個或多個實施例提供一種風險預測方法,能夠基於賦能機構的使用者的私有資料透過同構遷移訓練得到的第一風險預測模型,對目標使用者的風險等級進行預測;並能夠基於賦能機構和目標機構共同的目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,對目標使用者的風險等級進行二次預測,並結合這兩次預測結果來確定目標使用者的風險等級。
由於充分利用了賦能機構的使用者的私有資料、以及賦能機構和目標機構共同的目標群體使用者的私有資料,訓練得到第一風險預測模型和第二風險預測模型聯合對目標使用者的風險等級進行預測,且第二風險預測模型在訓練時是以第一風險預測模型的擬合誤差為目標的,最後綜合第一風險預測模型和第二風險預測模型的預測結果,極大地提高了對使用者風險等級的預測準確率。
應理解,本說明書實施例提供的風險預測方法的執行主體,可以但不限於伺服器等能夠被配置為執行本說明書實施例提供的該方法裝置中的至少一種。
為便於描述,下文以該方法的執行主體為能夠執行該方法的伺服器為例,對該方法的實施方式進行介紹。可以理解,該方法的執行主體為伺服器只是一種示例性的說明,並不應理解為對該方法的限定。
圖1是本說明書的一個實施例提供的一種風險預測方法的實施流程示意圖。圖1的方法可包括:
S110,從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第二私有資料。
應理解,賦能機構與目標機構之間可以存在直接的合作關係,也可以存在間接的合作關係(即可以是透過中間機構建立的合作關係),且後文所述的第一風險預測模型和第二風險預測模型均是為目標機構服務的,而由於目標機構和賦能機構之間往往存在一些共同的使用者。在對這些使用者的風險等級進行預測時,則可以基於這些使用者的使用者標識,從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第二私有資料。
其中,第一私有資料和第二私有資料具體可包括目標使用者的交易資料資訊、目標使用者的身份資料資訊、目標使用者的帳號資料資訊、目標使用者的註冊資料資訊、目標使用者的職業、年齡、收入等等。
S120,將第一私有資料輸入到第一風險等級預測模型中,預測得到目標使用者的第一風險等級,第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的。
該第一風險等級具體可以是一個風險分值,取值範圍可以是[0, 1]。
S130,將第一私有資料和第二私有資料輸入到第二風險等級預測模型中,預測得到目標使用者的第二風險等級,第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差。
其中,目標群體使用者為賦能機構和目標機構的共同使用者,目標群體使用者的私有資料包括目標群體使用者在賦能機構中的私有資料、和目標群體使用者在目標機構中的私有資料。
需要說明的是,第二風險等級預測模型在訓練時具體可以是以第一風險等級預測模型的擬合誤差為預測目標訓練得到的。其中,第一風險等級預測模型的擬合誤差error=真實值Y-預測值Y1。
S140,基於第一風險等級和第二風險等級,預測目標使用者的風險等級。
可選地,為了更好地融合第一風險預測模型和第二風險預測模型的模型預測結果,本說明書一個或多個實施例可以透過加法模型來融合兩者的預測結果。具體地,基於第一風險等級和第二風險等級,確定目標使用者的風險等級,包括:
透過加法模型基於第一風險等級和第二風險等級,確定目標使用者的風險等級。
其中,加法模型由多個基模型相加而成,在本說明書實施例中,該加法模型由第一風險預測模型和第二風險預測模型相加而成,即預測值F(x)=f1(x)+f2(x),其中,f1(x)為第一風險預測模型的預測結果即第一風險等級,f2(x)為第二風險預測模型的預測結果即第二風險等級。具體來說,假設第一風險預測模型的預測目標是f1(x),那麼第二風險預測模型的預測目標是Y-f1(x),Y為真實值,那麼透過加法模型得到的預測值則是F(x)=f1(x)+f2(x)=Y,即預測值的範圍還是[0, 1]。
下面結合圖2所示的風險預測方法應用在一種實際場景中的示意圖,對風險預測方法的實施過程進行詳細描述,包括:
S21,基於賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型,其中,賦能機構的使用者包括一些目標機構的使用者。
應理解,為了充分利用賦能機構的使用者的私有資料,這裡所述的賦能機構的使用者的私有資料具體可以是該賦能機構的全量使用者的私有資料。
S22,從賦能機構的使用者資料庫中獲取與目標使用者的使用者ID相對應的第一私有資料,並將第一私有資料輸入到第一風險預測模型中,以透過第一風險預測模型對目標使用者的風險等級進行預測,輸出目標使用者的第一風險等級的預測值Y1。
S23,獲取第一風險預測模型的擬合誤差error,即目標使用者的真實風險等級值Y與Y1的差值error=Y-Y1。
S24,基於目標群體使用者的私有資料,並以第一風險預測模型的擬合誤差error為對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型。
其中,目標群體使用者為賦能機構和目標機構的共同使用者,目標群體使用者的私有資料包括目標群體使用者在賦能機構中的私有資料、和目標群體使用者在目標機構中的私有資料。且第二風險預測模型是以第一風險預測模型的擬合誤差error為預測目標訓練得到的。
S25,從目標機構的使用者資料庫中獲取與目標使用者的ID相對應的第二私有資料,並將S22獲取的第一私有資料和該第二私有資料輸入到第二風險預測模型中,以透過第二風險預測模型對目標使用者的風險等級進行預測,輸出目標使用者的第二風險等級的預測值Y2。
S26,基於加法模型得到目標使用者的風險等級,輸出得到目標使用者的風險等級的預測值Y1+Y2。
本說明書提供的一種或多個實施例,能夠基於賦能機構的使用者的私有資料透過同構遷移訓練得到的第一風險預測模型,對目標使用者的風險等級進行預測;並能夠基於賦能機構和目標機構共同的目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,對目標使用者的風險等級進行二次預測,並結合這兩次預測結果來確定目標使用者的風險等級。由於充分利用了賦能機構的使用者的私有資料、以及賦能機構和目標機構共同的目標群體使用者的私有資料,訓練得到第一風險預測模型和第二風險預測模型聯合對目標使用者的風險等級進行預測,提高了風險等級的預測準確率。
圖3是本說明書的一個實施例提供的一種風險預測模型的訓練方法的實施流程示意圖,包括:
S310,獲取賦能機構的使用者的私有資料和目標群體使用者的私有資料,其中,目標群體使用者為賦能機構和目標機構的共同使用者,目標群體使用者的私有資料包括目標群體使用者在賦能機構中的私有資料、和目標群體使用者在目標機構中的私有資料,賦能機構的使用者包括目標群體使用者。
其中,賦能機構期望透過在保護賦能機構本身和目標機構的私有資料的前提下,聯合使用賦能機構的使用者的私有資料和目標機構的私有資料,共同完成第一風險預測模型和第二風險預測模型的訓練。基於此,本說明書實施例採用同構遷移和縱向聯邦學習的模型訓練方式,分別訓練得到第一風險預測模型和第二風險預測模型,並將第一風險預測模型和第二風險預測模型聯合起來預測使用者的風險等級。
由於同構遷移只需使用賦能機構本身所有的使用者的私有資料,並結合賦能機構和目標機構共同的目標群體使用者在賦能機構中的私有資料,對目標機構進行了一次模型適配,得到第一風險預測模型;再透過縱向聯邦學習使用目標群體使用者在賦能機構中的私有資料和目標機構中的私有資料,訓練得到第二風險預測模型,充分利用了賦能機構所有的使用者的私有資料和目標機構可提供的目標群體使用者的私有資料,提高了風險預測的準確率。
如圖4所示,為本說明書實施例提供的透過同構遷移和縱向聯邦學習進行模型訓練的示意圖。在圖4(a)中,灰色區域為賦能機構擁有的所有使用者ID,以及對應的私有資料(即圖示的源域+目標域部分),目標域中包含的使用者的私有資料為賦能機構和目標機構的共同使用者在賦能機構中的私有資料,也就是說,目標域中包含的使用者的私有資料為賦能機構和目標機構重疊的那部分資料。
S320,基於賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型。
應理解,為了訓練得到適配於目標機構的第一風險預測模型,本說明書一個或多個實施例在透過同構遷移訓練得到第一風險預測模型時,應首先獲取賦能機構與目標機構的共同使用者即目標群體使用者在賦能機構中的私有資料。具體地,基於賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型,包括:
獲取賦能機構中目標群體使用者的私有資料;
基於賦能機構的使用者的私有資料和賦能機構中所述目標群體使用者的私有資料,透過同構遷移訓練得到第一風險預測模型。
如圖4(a)所示,為本說明書實施例提供的透過同構遷移訓練得到第一風險預測模型的示意圖,具體過程包括:
首先,用源域中包含的使用者的私有資料訓練得到神經網路類模型,具體訓練方式本說明書實施例對此不作具體限定;然後,對模型網路的每一層,計算源域中包含的使用者的私有資料在此層輸出的均值μ1和標準差σ1,以及目標域中包含的使用者的私有資料在此層輸出的均值μ2和標準差σ2;再透過訓練得到的模型對目標域中包含的使用者的私有資料進行預測,得到預測值U,再對該預測值進行統一資料分佈,得到預測值[(U-μ2)/σ2]*σ1+μ1,從而統一訓練得到的第一風險預測模型對源域和目標域中的使用者的私有資料的預測結果的範圍。
S330,基於目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差。
其中,第一風險預測模型和第二風險預測模型用於聯合識別使用者的風險等級。
應理解,為了提高風險預測模型的預測準確率,從而更好地為目標機構服務,本說明書一個或多個實施例還可透過縱向聯邦學習訓練得到第二風險預測模型。具體地,基於目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,包括:
基於第一風險預測模型對測試資料的預測值和測試資料對應的真實值,獲取第一風險預測模型的擬合誤差;
基於目標群體使用者的私有資料,透過縱向聯邦學習訓練得到第二風險預測模型,直到第二風險預測模型的預測值逼近第一風險預測模型的擬合誤差。
如圖4(b)所示,為本說明書實施例提供的透過縱向聯邦學習訓練得到第二風險預測模型的示意圖。該第二風險預測模型具體是基於賦能機構和目標機構的共同使用者,即目標群體使用者在賦能機構中的私有資料和目標群體使用者在目標機構中的私有資料,以賦能機構無法獲知或反推目標機構的資料,且目標機構無法獲知或反推賦能機構的資料的前提下,透過縱向聯邦學習訓練得到的。
本說明書提供的一種或多個實施例,能夠基於賦能機構的使用者的私有資料透過同構遷移訓練得到的第一風險預測模型,對使用者的風險等級進行預測;並能夠基於賦能機構和目標機構共同的目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,對使用者的風險等級進行二次預測,並結合這兩次預測結果來確定使用者的風險等級。由於充分利用了賦能機構的使用者的私有資料、以及賦能機構和目標機構共同的目標群體使用者的私有資料,訓練得到第一風險預測模型和第二風險預測模型聯合對使用者的風險等級進行預測,提高了風險等級的預測準確率。
圖5是本說明書的一個實施例提供的一種風險預測裝置500的結構示意圖。請參考圖5,在一種軟體實施方式中,風險預測裝置500可包括:
獲取單元501,從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與所述目標使用者的使用者標識對應的第二私有資料;
第一預測單元502,將所述第一私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
第二預測單元503,將所述第一私有資料和所述第二私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
第三預測單元504,基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
可選地,在一種實施方式中,所述第三預測單元504,用於:
透過加法模型基於所述第一風險等級和所述第二風險等級,確定所述目標使用者的風險等級。
風險預測裝置500能夠實現圖1~圖2的方法實施例的方法,具體可參考圖1~圖2所示實施例的風險預測方法,不再贅述。
圖6是本說明書的一個實施例提供的一種風險預測模型的訓練裝置600的結構示意圖。請參考圖6,在一種軟體實施方式中,風險預測模型的訓練裝置600可包括:
資料獲取單元601,獲取賦能機構的使用者的私有資料和目標群體使用者的私有資料,其中,所述目標群體使用者為所述賦能機構和目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料,所述賦能機構的使用者包括所述目標群體使用者;
第一訓練單元602,基於所述賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型;
第二訓練單元603,基於所述目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
其中,所述第一風險預測模型和所述第二風險預測模型用於聯合識別使用者的風險等級。
可選地,在一種實施方式中,所述第一訓練單元602,用於:
獲取所述賦能機構中所述目標群體使用者的私有資料;
基於所述賦能機構的使用者的私有資料和所述賦能機構中所述目標群體使用者的私有資料,透過同構遷移訓練得到所述第一風險預測模型。
可選地,在一種實施方式中,所述第二訓練單元603,用於:
基於所述第一風險預測模型對測試資料的預測值和所述測試資料對應的真實值,獲取所述第一風險預測模型的擬合誤差;
基於所述目標群體使用者的私有資料,透過縱向聯邦學習訓練得到第二風險預測模型,直到所述第二風險預測模型的預測值逼近所述第一風險預測模型的擬合誤差。
風險預測模型的訓練裝置600能夠實現圖3~圖4的方法實施例的方法,具體可參考圖3~圖4所示實施例的風險預測模型的訓練方法,不再贅述。
圖7是本說明書的一個實施例電子設備的結構示意圖。請參考圖7,在硬體層面,該電子設備包括處理器,可選地還包括內部匯流排、網路介面、記憶體。其中,記憶體可能包含內部記憶體,例如高速隨機存取記憶體(Random-Access Memory,RAM),也可能還包括非揮發性記憶體(non-volatile memory),例如至少1個磁碟記憶體等。當然,該電子設備還可能包括其他業務所需要的硬體。
處理器、網路介面和記憶體可以透過內部匯流排相互連接,該內部匯流排可以是ISA(Industry Standard Architecture,工業標準架構)匯流排、PCI(Peripheral Component Interconnect,週邊組件互連標準)匯流排或EISA(Extended Industry Standard Architecture,延伸工業標準架構)匯流排等。所述匯流排可以分為位址匯流排、資料匯流排、控制匯流排等。為便於表示,圖7中僅用一個雙向箭頭表示,但並不表示僅有一根匯流排或一種類型的匯流排。
記憶體,用於存放程式。具體地,程式可以包括程式碼,所述程式碼包括電腦操作指令。記憶體可以包括內部記憶體和非揮發性記憶體,並向處理器提供指令和資料。
處理器從非揮發性記憶體中讀取對應的電腦程式到內部記憶體中然後運行,在邏輯層面上形成風險預測裝置。處理器,執行記憶體所存放的程式,並具體用於執行以下操作:
從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與所述目標使用者的使用者標識對應的第二私有資料;
將所述第一私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
將所述第一私有資料和所述第二私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
上述如本說明書圖1~圖2所示實施例揭示的風險預測裝置執行的方法可以應用於處理器中,或者由處理器實現。處理器可能是一種積體電路晶片,具有訊號的處理能力。在實現過程中,上述方法的各步驟可以透過處理器中的硬體的整合邏輯電路或者軟體形式的指令完成。上述的處理器可以是通用處理器,包括中央處理器(Central Processing Unit,CPU)、網路處理器(Network Processor,NP)等;還可以是數位訊號處理器(Digital Signal Processor,DSP)、專用積體電路(Application Specific Integrated Circuit,ASIC)、現場可程式設計閘陣列(Field-Programmable Gate Array,FPGA)或者其他可程式設計邏輯裝置、分立閘或者電晶體邏輯裝置、分立硬體元件。可以實現或者執行本說明書實施例中的揭露的各方法、步驟及邏輯方塊圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本說明書實施例所揭露的方法的步驟可以直接體現為硬體解碼處理器執行完成,或者用解碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機記憶體,快閃記憶體、唯讀記憶體,可程式設計唯讀記憶體或者電可讀寫可程式設計記憶體、暫存器等本領域成熟的儲存媒體中。該儲存媒體位於記憶體,處理器讀取記憶體中的資訊,結合其硬體完成上述方法的步驟。
該電子設備還可執行圖1~圖2的方法,並實現風險預測裝置在圖1~圖2所示實施例的功能,本說明書實施例在此不再贅述。
本說明書實施例還提出了一種電腦可讀儲存媒體,該電腦可讀儲存媒體儲存一個或多個程式,該一個或多個程式包括指令,該指令當被包括多個應用程式的可攜式電子設備執行時,能夠使該可攜式電子設備執行圖1~圖2所示實施例的方法,並具體用於執行以下操作:
從賦能機構的使用者資料庫中獲取與目標使用者的使用者標識對應的第一私有資料、以及從目標機構的使用者資料庫中獲取與所述目標使用者的使用者標識對應的第二私有資料;
將所述第一私有資料輸入到第一風險等級預測模型中,預測得到所述目標使用者的第一風險等級,所述第一風險等級預測模型為基於賦能機構的使用者的私有資料透過同構遷移訓練得到的;
將所述第一私有資料和所述第二私有資料輸入到第二風險等級預測模型中,預測得到所述目標使用者的第二風險等級,所述第二風險等級預測模型為基於目標群體使用者的私有資料及對應的標籤、透過縱向聯邦學習訓練得到的,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
基於所述第一風險等級和所述第二風險等級,預測所述目標使用者的風險等級;
其中,所述目標群體使用者為所述賦能機構和所述目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料。
當然,除了軟體實現方式之外,本說明書的電子設備並不排除其他實現方式,比如邏輯裝置抑或軟硬體結合的方式等等,也就是說以下處理流程的執行主體並不限定於各個邏輯單元,也可以是硬體或邏輯裝置。
圖8是本說明書的一個實施例電子設備的結構示意圖。請參考圖8,在硬體層面,該電子設備包括處理器,可選地還包括內部匯流排、網路介面、記憶體。其中,記憶體可能包含內部記憶體,例如高速隨機存取記憶體(Random-Access Memory,RAM),也可能還包括非揮發性記憶體(non-volatile memory),例如至少1個磁碟記憶體等。當然,該電子設備還可能包括其他業務所需要的硬體。
處理器、網路介面和記憶體可以透過內部匯流排相互連接,該內部匯流排可以是ISA(Industry Standard Architecture,工業標準架構)匯流排、PCI(Peripheral Component Interconnect,週邊組件互連標準)匯流排或EISA(Extended Industry Standard Architecture,延伸工業標準架構)匯流排等。所述匯流排可以分為位址匯流排、資料匯流排、控制匯流排等。為便於表示,圖8中僅用一個雙向箭頭表示,但並不表示僅有一根匯流排或一種類型的匯流排。
記憶體,用於存放程式。具體地,程式可以包括程式碼,所述程式碼包括電腦操作指令。記憶體可以包括內部記憶體和非揮發性記憶體,並向處理器提供指令和資料。
處理器從非揮發性記憶體中讀取對應的電腦程式到內部記憶體中然後運行,在邏輯層面上形成風險預測模型的訓練裝置。處理器,執行記憶體所存放的程式,並具體用於執行以下操作:
獲取賦能機構的使用者的私有資料和目標群體使用者的私有資料,其中,所述目標群體使用者為所述賦能機構和目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料,所述賦能機構的使用者包括所述目標群體使用者;
基於所述賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型;
基於所述目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
其中,所述第一風險預測模型和所述第二風險預測模型用於聯合識別使用者的風險等級。
上述如本說明書圖3~圖4所示實施例揭示的風險預測模型的訓練裝置執行的方法可以應用於處理器中,或者由處理器實現。處理器可能是一種積體電路晶片,具有訊號的處理能力。在實現過程中,上述方法的各步驟可以透過處理器中的硬體的整合邏輯電路或者軟體形式的指令完成。上述的處理器可以是通用處理器,包括中央處理器(Central Processing Unit,CPU)、網路處理器(Network Processor,NP)等;還可以是數位訊號處理器(Digital Signal Processor,DSP)、專用積體電路(Application Specific Integrated Circuit,ASIC)、現場可程式設計閘陣列(Field-Programmable Gate Array,FPGA)或者其他可程式設計邏輯裝置、分立閘或者電晶體邏輯裝置、分立硬體元件。可以實現或者執行本說明書實施例中的揭露的各方法、步驟及邏輯方塊圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本說明書實施例所揭露的方法的步驟可以直接體現為硬體解碼處理器執行完成,或者用解碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機記憶體,快閃記憶體、唯讀記憶體,可程式設計唯讀記憶體或者電可讀寫可程式設計記憶體、暫存器等本領域成熟的儲存媒體中。該儲存媒體位於記憶體,處理器讀取記憶體中的資訊,結合其硬體完成上述方法的步驟。
該電子設備還可執行圖3~圖4的方法,並實現風險預測模型的訓練裝置在圖3~圖4所示實施例的功能,本說明書實施例在此不再贅述。
本說明書實施例還提出了一種電腦可讀儲存媒體,該電腦可讀儲存媒體儲存一個或多個程式,該一個或多個程式包括指令,該指令當被包括多個應用程式的可攜式電子設備執行時,能夠使該可攜式電子設備執行圖3~圖4所示實施例的方法,並具體用於執行以下操作:
獲取賦能機構的使用者的私有資料和目標群體使用者的私有資料,其中,所述目標群體使用者為所述賦能機構和目標機構的共同使用者,所述目標群體使用者的私有資料包括所述目標群體使用者在所述賦能機構中的私有資料、和所述目標群體使用者在目標機構中的私有資料,所述賦能機構的使用者包括所述目標群體使用者;
基於所述賦能機構的使用者的私有資料,透過同構遷移訓練得到第一風險預測模型;
基於所述目標群體使用者的私有資料及對應的標籤,透過縱向聯邦學習訓練得到第二風險預測模型,所述目標群體使用者的私有資料對應的標籤為目標群體使用者在第一風險預測模型對應的擬合誤差;
其中,所述第一風險預測模型和所述第二風險預測模型用於聯合識別使用者的風險等級。
上述對本說明書特定實施例進行了描述。其它實施例在所附申請專利範圍的範圍內。在一些情況下,在申請專利範圍中記載的動作或步驟可以按照不同於實施例中的順序來執行並且仍然可以實現期望的結果。另外,在圖式中描繪的過程不一定要求示出的特定順序或者連續順序才能實現期望的結果。在某些實施方式中,多工處理和並行處理也是可以的或者可能是有利的。
總之,以上所述僅為本說明書的較佳實施例而已,並非用於限定本說明書的保護範圍。凡在本說明書的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本說明書的保護範圍之內。
上述實施例闡明的系統、裝置、模組或單元,具體可以由電腦晶片或實體實現,或者由具有某種功能的產品來實現。一種典型的實現設備為電腦。具體的,電腦例如可以為個人電腦、膝上型電腦、蜂巢式電話、相機電話、智慧型電話、個人數位助理、媒體播放機、導航設備、電子郵件設備、遊戲主機、平板電腦、可穿戴設備或者這些設備中的任何設備的組合。
電腦可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變內部記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可抹除可程式設計唯讀記憶體(EEPROM)、快閃記憶體或其他內部記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存器、磁盒式磁帶,磁帶式磁碟儲存器或其他磁性儲存裝置或任何其他非傳輸媒體,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,電腦可讀媒體不包括暫態媒體(transitory media),如調變的資料訊號和載波。
還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。
本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
S110:步驟
S120:步驟
S130:步驟
S140:步驟
S21:步驟
S22:步驟
S23:步驟
S24:步驟
S25:步驟
S26:步驟
S310:步驟
S320:步驟
S330:步驟
500:風險預測裝置
501:獲取單元
502:第一預測單元
503:第二預測單元
504:第三預測單元
600:風險預測模型的訓練裝置
601:資料獲取單元
602:第一訓練單元
603:第二訓練單元
為了更清楚地說明本說明書實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本說明書中記載的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些圖式獲得其他的圖式。
[圖1]是本說明書的一個實施例提供的一種風險預測方法的實施流程示意圖。
[圖2]是本說明書的一個實施例提供的風險預測方法應用在一種實際場景中的示意圖。
[圖3]是本說明書的一個實施例提供的一種風險預測模型的訓練方法的流程示意圖。
[圖4]是本說明書的一個實施例提供的風險預測模型的訓練方法中的兩種模型的訓練過程示意圖。
[圖5]是本說明書的一個實施例提供的一種風險預測裝置的結構示意圖。
[圖6]是本說明書的一個實施例提供的一種風險預測模型的訓練裝置的結構示意圖。
[圖7]是本說明書的一個實施例提供的一種電子設備的結構示意圖。
[圖8]是本說明書的一個實施例提供的另一種電子設備的結構示意圖。