TW202044082A

TW202044082A - 基於秘密分享的安全模型預測方法和裝置

Info

Publication number: TW202044082A
Application number: TW108133838A
Authority: TW
Inventors: 林文珍; 殷山
Original assignee: 開曼群島商創新先進技術有限公司
Priority date: 2019-03-12
Filing date: 2019-09-19
Publication date: 2020-12-01
Also published as: CN110032893B; WO2020181933A1; TWI720622B; CN110032893A

Abstract

本發明提供了一種基於秘密分享的安全模型預測方法，包括：接收來自第三方的第一亂數集合；使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果；以及使用所述共享計算預測結果進行模型預測。本發明能保護各方的私有資料不洩漏，並且確保了計算的準確性。

Description

基於秘密分享的安全模型預測方法和裝置

本發明主要涉及多方資料合作，尤其涉及多方資料合作中的資料安全和模型安全。

在資料分析、資料挖掘、經濟預測等領域，模型可被用來分析、發現潛在的資料價值。但模型方所擁有的資料往往是不健全的，由此難以準確地刻畫目標。為了得到更好的模型預測結果，通常模型方會與資料方進行資料合作，結合不同的資料或特徵標籤共同完成模型計算。在多方資料合作過程中，涉及到資料安全和模型安全等問題。一方面，資料方不想輸出自己的價值資料給模型方，洩漏私有資料；另一方面，模型中包含的特徵標籤(也稱為模型係數)等資訊也是模型方的私有資料，具有重要的商業價值，因此也要保證資料合作中的模型安全問題。在現有技術中，存在三種多方資料合作的技術方案。第一種方案是資料方和模型方都將資料和模型放置在可信第三方，由第三方進行模型預測。但是其缺點是完全可信第三方難以實現，並且在資料和模型的傳輸過程中存在安全風險。第二種方案是模型方對模型係數進行同態加密，將經加密的模型部署到資料方，資料方使用私有資料進行模型預測，然後將計算結果返回模型方。但這種方案由於同態加密的計算限制，對於計算的類型有限制，並且同態加密比較複雜，計算時間較長。第三種方案是使用SGX (Software Guard Extension)硬體結合機器學習和密碼學，使用差分隱私技術對訓練好的模型作係數模糊。但使用差分隱私技術做模型係數模糊，模糊程度難以把握。對於需要得到精確計算結果的模型來說，會影響結果準確性。因此，在多方資料合作中期望一種既保護資料和模型安全、又能得到精確計算結果的秘密分享方案。

為解決上述技術問題，本發明提供了一種基於秘密分享的安全模型預測方法，包括：接收來自第三方的第一亂數集合；使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果；以及使用所述共享計算預測結果進行模型預測。可選地，所述生成共享計算預測結果包括：使用所述模型係數向量和所述第一亂數集合來生成中間模型向量；將所述中間模型向量發送給所述資料提供方並接收來自所述資料提供方的中間資料向量；使用來自所述資料提供方的所述中間資料向量和所述第一亂數集合來生成中間資料值；接收來自所述資料提供方的中間模型值；以及使用所述中間模型值和所述中間資料值來生成所述共享計算預測結果。可選地，所述共享計算預測結果是所述中間模型值和所述中間資料值的乘積。可選地，所述方法進一步包括：使用所述模型係數向量和本地儲存的附加資料向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。可選地，所述方法進一步包括：使用所述第一亂數集合、所述模型係數向量和來自第二資料提供方的向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。可選地，所述模型預測使用邏輯迴歸模型及/或線性迴歸模型。本申請的實施例還提供了一種基於秘密分享的安全模型預測方法，包括：接收來自第三方的第二亂數集合；使用所述第二亂數集合和資料向量來生成中間資料向量；將所述中間資料向量發送給資料需求方並接收來自所述資料需求方的中間模型向量；使用所述中間模型向量和所述第二亂數集合來生成中間資料值；以及將所述中間資料值提供給所述資料需求方以用於模型預測。本申請的實施例進一步提供了一種用於基於秘密分享的安全模型預測的裝置，包括：接收模組，其被配置成接收來自第三方的第一亂數集合；預測向量生成模組，其被配置成使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果；以及模型預測模組，其被配置成使用所述共享計算預測結果進行模型預測。可選地，所述接收模組被進一步配置成接收來自所述資料提供方的中間資料向量和中間模型值；所述預測向量生成模組被進一步配置成：使用所述模型係數向量和所述第一亂數集合來生成中間模型向量；使用中間資料向量和所述第一亂數集合來生成中間資料值；以及使用所述中間模型值和所述中間資料值來生成所述共享計算預測結果；所述裝置進一步包括傳送模組，其被配置成將所述中間模型向量發送給所述資料提供方。可選地，所述共享計算預測結果是所述中間模型值和所述中間資料值的乘積。可選地，所述預測向量生成模組被進一步配置成：使用所述模型係數向量和本地儲存的附加資料向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。可選地，所述預測向量生成模組被進一步配置成：使用所述第一亂數集合、所述模型係數向量和來自第二資料提供方的向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。可選地，所述模型預測使用邏輯迴歸模型及/或線性迴歸模型。本申請的實施例還提供了一種用於基於秘密分享的安全模型預測的裝置，包括：接收模組，其被配置成接收來自第三方的第二亂數集合，以及接收來自資料需求方的中間模型向量；預測向量生成模組，其被配置成使用所述第二亂數集合和資料向量來生成中間資料向量，以及使用所述中間模型向量和所述第二亂數集合來生成中間資料值；以及傳送模組，其被配置成將所述中間資料向量發送給資料需求方，以及將所述中間資料值提供給所述資料需求方以用於模型預測。本申請的實施例進一步提供了一種基於秘密分享的安全模型預測裝置，包括：處理器；以及被安排成儲存電腦可執行指令的儲存器，所述可執行指令在被執行時使所述處理器執行以下操作：接收來自第三方的第一亂數集合；使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果；以及使用所述共享計算預測結果進行模型預測。本申請的實施例進一步提供了一種基於秘密分享的安全模型預測裝置，包括：處理器；以及被安排成儲存電腦可執行指令的儲存器，所述可執行指令在被執行時使所述處理器執行以下操作：接收來自第三方的第二亂數集合；使用所述第二亂數集合和資料向量來生成中間資料向量；將所述中間資料向量發送給資料需求方並接收來自所述資料需求方的中間模型向量；使用所述中間模型向量和所述第二亂數集合來生成中間資料值；以及將所述中間資料值提供給所述資料需求方以用於模型預測。本發明提供了一種安全的去中心的模型預測方法，達到了以下技術優點： 1、資料不出各自邊界，不需要可信第三方進行資料融合，也不需要將任何一方的資料部署或引入到其他方，即可完成模型預測。 2、結合秘密分享，保護合作各方的資料隱私。使用資料拆分的方式進行各方計算，合作方不對另一方暴露自己的明文資料，只將各自拆分的不可辨識數值做計算，得到最終的精準計算結果。

為讓本發明的上述目的、特徵和優點能更明顯易懂，以下結合圖式對本發明的具體實施方式作詳細說明。在下面的描述中闡述了很多具體細節以便於充分理解本發明，但是本發明還可以採用其它不同於在此描述的其它方式來實施，因此本發明不受下面公開的具體實施例的限制。圖1是根據本發明的各方面的基於秘密分享的多方資料合作系統的架構圖。如圖1所示，本發明的基於秘密分享的多方資料合作系統包括資料需求方(也稱為模型方)、資料提供方(也稱為資料方)和第三方(公正第三方，例如，公正的司法機構或政府機關等)。資料需求方擁有模型，模型係數向量為W={ω1, ω2, ……, ωn}，資料提供方擁有資料向量X={x1, x2, …..., xn}；第三方生成一系列亂數並分別分發給資料提供方和資料需求方。資料需求方使用模型係數和其獲分配的亂數進行計算，資料提供方使用其擁有的資料和其獲分配的亂數進行計算，資料需求方和資料提供方交換計算結果進行進一步處理，隨後將結果匯總，得到模型預測結果。以下通過四個具體實施例來解說本發明的技術方案。實施例一 參照圖2，解說了根據本發明的各方面的一個資料需求方與一個資料提供方進行資料合作的一個實施例。在步驟201，第三方生成亂數集合R₁ 和R₂ 。例如，R₁ ={a, c0}，R₂ ={b, c1}，其中a和b是亂數向量，c0和c1是亂數，並且c=a×b，c=c0+c1。其中a×b是向量乘法。在步驟202，第三方將亂數集合R₁ 和R₂ 分別發送給資料需求方和資料提供方。在步驟203，資料需求方使用亂數集合R₁ 和模型係數向量W={ω₁ , ω₂ , ……, ω_n }進行計算，得到中間模型向量e。例如，e=W-a。在步驟204，資料提供方使用亂數集合R₂ 和資料向量X={x₁ , x₂ , …..., x_n }進行計算，得到中間資料向量f。例如，f=X-b。在步驟205和206，資料需求方和資料提供方交換在步驟203和204中計算得到的結果。具體而言，資料需求方可在步驟205將計算結果e發送給資料提供方，並且資料提供方在步驟206將計算結果f發送給資料需求方。注意，雖然在圖2中，步驟205在步驟206之前，但其次序可以交換，或者可以同時進行。在步驟207，資料需求方使用亂數集合R₁ 和資料提供方在步驟206中提供的中間資料向量f進行計算，得到中間資料值z0。例如，z0=a×f+c0，其中a×f是向量乘法。在步驟208，資料提供方使用亂數集合R₂ 和資料需求方在步驟205中提供的中間模型向量進行計算，得到中間模型值z1。例如，z1=e×X+c1，其中e×X是向量乘法。在步驟209，資料提供方將z1發送給資料需求方。在步驟210，資料需求方將z0和z1進行匯總，得到模型係數與資料之積W×X，其在本文也被稱為共享計算預測結果。

在步驟211，使用步驟210中得到的共享計算預測結果來進行模型預測。例如，對於邏輯迴歸(Logistic Regression)模型，計算

，其中ω、λ為模型係數，由模型方提供。x為計算所需的輸入，屬於資料提供方的私有資料。實施例二 在圖2解說的實施例中，資料需求方只提供了模型資訊。在一些情形中，資料需求方既具有模型資訊W，又具有資料資訊X’。在這種情況下，步驟201-209與圖2中解說的實施例相同，在此不再贅述。以下僅描述與圖2的過程不同的地方。在步驟210，資料需求方計算附加中間資料值z0’。 z0’=W×X’。在步驟211，資料需求方將z0、z1和z0’匯總，得到共享計算預測結果： z=z0+z1+z0’=W×X+W×X’。在步驟212，使用W×X+W×X’來進行模型預測。實施例三 以上解說了一個資料需求方與一個資料提供方進行資料合作的實施例。在一些情形中，資料需求方可能在模型預測中需要來自多個資料提供方的資料，由此資料需求方需要與多個資料提供方進行資料合作。圖3解說了一個資料需求方與兩個資料提供方(資料提供方1和資料提供方2)進行資料合作的示例。在該實施例中，資料需求方具有模型W_A ={ω_A1 , ω_A2 , ……, ω_An }和W_B ={ω_B1 , ω_B2 , ……, ω_Bn }，資料提供方1具有資料X_A ={x_A1 , x_A2 , …..., x_An }，並且資料提供方2具有資料X_B ={x_B1 , x_B2 , …..., x_Bn }。在模型預測中需要共享計算預測結果W_A ×X_A 和W_B ×X_B 。在步驟301，第三方生成第一組亂數{R₁ 、R₂ }和第二組亂數{R₁ ’、R₂ ’}，其中第一組亂數用於資料需求方與資料提供方1的資料合作，而第二組亂數用於資料需求方與資料提供方2的資料合作。具體而言，R₁ ={a, c0}，R₂ ={b, c1}，其中c=a×b，c= c0+c1；R₁ ’={a’, c0’}，R₂ ={b’, c1’}，其中a、b和a’、b’是亂數向量，c0、c1和c0’、c1’是亂數，並且c’=a’×b’，c’= c0’+c1’。請注意，a×b和a’×b’是向量乘法。在步驟302，第三方將亂數集合R₁ 和R₁ ’提供給資料需求方，將R₂ 提供給資料提供方1，將R₂ ’提供給資料提供方2。在步驟303，資料需求方計算e和e’。具體而言，e=W_A -a，e’=W_B -a’。在步驟304和305，資料提供方1和資料提供方2分別計算f=X_A -b和f’=X_B -b’。在步驟306-308，資料需求方和資料提供方1、資料提供方2交換在步驟303-305中計算得到的結果。具體而言，資料需求方在步驟306將計算結果e發送給資料提供方1，在步驟307將計算結果e’發送給資料提供方2。資料提供方1在步驟308將計算結果f發送給資料需求方，在步驟309將計算結果f’發送給資料需求方。注意，圖3中示出了步驟306-308的特定次序，但這些步驟的次序可以交換，或者可以同時進行。在步驟310，資料需求方使用亂數集合R₁ 和資料提供方1在步驟308中提供的結算結果f進行計算，得到第一中間資料值z0。例如，z0=a×f+c0。資料需求方還使用亂數集合R₁ ’和資料提供方2在步驟309中提供的結算結果f’進行計算，得到第二中間資料值z0’。例如，z0’=a’×f’+c0’。在步驟311，資料提供方1使用亂數集合R₂ 和資料需求方在步驟306中提供的計算結果e進行計算，得到第一中間模型值z1。例如，z1=e×X_A +c1。在步驟312，資料提供方2使用亂數集合R₂ ’和資料需求方在步驟307中提供的計算結果e’進行計算，得到第二中間模型值z1’。例如，z1’=e’×X_B +c1’。在步驟313和314，資料提供方1將z1發送給資料需求方，資料提供方2將z1’發送給資料需求方。在步驟315，資料需求方將z0和z1進行匯總，得到模型係數與資料之積W_A ×X，並且將z0’和z1’進行匯總，得到模型係數與資料之積W_B ×X。

在步驟316，使用步驟315和316中的結果(也稱為共享計算預測結果)來進行模型預測。在一種實施例中，模型W_A 和W_B 可以是相同的，換言之，資料需求方使用一個模型W=W_A =W_B 和來自兩個資料提供方的資料進行模型預測。請注意，圖3中按照特定次序描述了一個資料需求方和兩個資料提供方進行資料合作的過程，但是步驟的其它次序也是可能的。資料需求方和資料提供方1之間的資料合作的各步驟與資料需求方和資料提供方2之間的資料合作的各步驟是獨立的，可以分別在不同時間完成。例如，資料需求方和資料提供方1之間的資料合作的步驟可以在資料需求方和資料提供方2之間的資料合作之前或之後完成，或者兩個過程中的一些步驟可以是在時間上是交叉的。並且一些步驟可以進行拆分，例如步驟303中的計算e和e’可以分開進行。以上解說了一個資料需求方和兩個資料提供方之間的資料合作，該過程也可適用於一個資料需求方和兩個以上資料提供方之間的資料合作，其操作類似於圖3中解說的過程。請注意，雖然本發明是以邏輯迴歸模型為例進行解說，但其它模型也可適用於本發明，諸如線性迴歸模型，y=ω×x+e，等等。進一步，以上描述了兩種具體的亂數生成方法，但其它亂數生成方法也在本發明的範圍內，本領域普通技術人員能夠根據實際需要構想出合適的亂數生成方法。圖4解說了根據本發明的各方面的由資料需求方執行的基於秘密分享的資料合作方法的一個示例。參見圖4，在步驟401，接收來自第三方的第一亂數集合。該步驟可以對應於以上參照圖2描述的步驟201、202，及/或參照圖3描述的步驟301、302。在步驟402，使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果。該步驟可以對應於以上參照圖2描述的步驟203-210，及/或參照圖3描述的步驟303-315。在步驟403，使用共享計算預測結果進行模型預測。該步驟可以對應於以上參照圖2描述的步驟211，及/或參照圖3描述的步驟303-316。圖5解說了根據本發明的各方面的由資料需求方執行的基於秘密分享的資料合作方法的一個示例。參見圖5，在步驟501，接收來自第三方的第一亂數集合R₁ 。具體而言，第三方可以生成亂數集合R={a, b, c0, c1}，其中c=a×b，c=c0+c1，其中所述第一亂數集合R₁ 為{a, c0}，而R₂ ={b, c1}被提供給資料提供方。在另一示例中，第三方可以生成亂數集合R={a, b, c0, c1}，其中c=a0+a1，c=b0+b1，其中第一亂數集合R₁ ={a, c0}，而R₂ ={b, c1}可被提供給資料提供方。在步驟502，使用模型係數向量W和第一亂數集合R₁ 來生成中間模型向量e。例如，e=W-a。在步驟503，將中間模型向量e發送給資料提供方並接收來自資料提供方的中間資料向量f。在步驟504，使用中間資料向量f和所述第一亂數集合R₁ 來生成中間資料值z0。在步驟505，接收來自資料提供方的中間模型值z1。在步驟506，使用中間模型值z1和中間資料值z0來生成共享計算預測結果。在步驟507，使用共享計算預測結果進行模型預測。圖6解說了根據本發明的各方面的由資料提供方執行的基於秘密分享的資料合作的示例方法。在步驟601，接收來自第三方的第二亂數集合R₂ 。在步驟602，使用第二亂數集合R₂ 和資料向量X來生成中間資料向量f。在步驟603，將中間資料向量f發送給資料需求方並接收來自資料需求方的中間模型向量e。在步驟604，使用中間模型向量e和第二亂數集合R₂ 來生成中間資料值z1。在步驟605，將中間資料值z1提供給所述資料需求方以用於模型預測。圖7解說了根據本發明的各方面的資料需求方的方塊圖。具體而言，資料需求方(模型方)可包括接收模組701、預測向量生成模組702、模型預測模組703、傳送模組704、以及儲存器705。其中儲存器705儲存模型係數。接收模組701可被配置成接收來自第三方的第一亂數集合，接收來自所述資料提供方的中間資料向量及/或中間模型值。預測向量生成模組702可被配置成使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果。具體而言，預測向量生成模組702可被配置成使用所述模型係數向量和第一亂數集合來生成中間模型向量；使用中間資料向量和第一亂數集合來生成中間資料值；以及使用中間模型值和中間資料值來生成共享計算預測結果。預測向量生成模組702還可被配置成使用模型係數向量和第一亂數集合來生成中間模型向量；使用來自資料提供方的中間資料向量和中間模型向量來生成共享計算預測結果。模型預測模組703可被配置成使用共享計算預測結果進行模型預測。傳送模組704可被配置成將所述中間模型向量發送給所述資料提供方。圖8解說了根據本發明的各方面的資料提供方的方塊圖。具體而言，資料提供方可包括：接收模組803、預測向量生成模組802、傳送模組803以及儲存器804。其中儲存器804可儲存私有資料。接收模組801可被配置成接收來自第三方的第二亂數集合，以及接收來自資料需求方的中間模型向量。預測向量生成模組802可被配置成使用所述第二亂數集合和資料向量來生成中間資料向量，以及使用所述中間模型向量和所述第二亂數集合來生成中間資料值。傳送模組803可被配置成將所述中間資料向量發送給資料需求方，以及將所述中間資料值提供給所述資料需求方以用於模型預測。與現有技術相比，本發明具有以下優點： 1)能夠保護各方的私有資料不洩漏。各方持有的資料不出自己的計算邊界，各方在本地透過加密方式的交換，完成計算。雖然有公正第三方參與，但第三方只提供亂數的分發，不參與具體的計算過程。 2)對接成本不高。純軟體方案，除基本的伺服器等，沒有其他額外的硬體要求，不會引入其他硬體安全漏洞，可線上完成計算。 3)計算完全無損，不影響結果準確性。 4)演算法本身不受限。計算結果即時返回，可支援加、減、乘、除等四則運算，及其混合計算，不因演算法而受限制。 5)秘密分享的安全多方計算演算法，不需要保留密鑰等資訊，即可透過中間拆分、轉換、結果匯總等方式，得到最終結果。而在分發亂數的第三方公正的前提下，計算過程中的中間值無法回推出原始明文。本文結合圖式闡述的說明描述了示例配置而不代表可被實現或者落在請求項的範圍內的所有示例。本文所使用的術語“示例性”意指“用作示例、實例或解說”，而並不意指“優於”或“勝過其他示例”。本詳細描述包括具體細節以提供對所描述的技術的理解。然而，可以在沒有這些具體細節的情況下實踐這些技術。在一些實例中，眾所周知的結構和設備以方塊圖形式示出以避免模糊所描述的示例的概念。在圖式中，類似組件或特徵可具有相同的圖式標記。此外，相同類型的各個組件可透過在圖式標記後跟隨短劃線以及在類似組件之間進行區分的第二標記來加以區分。如果在說明書中僅使用第一圖式標記，則該描述可應用於具有相同的第一圖式標記的類似組件中的任何一個組件而不論第二圖式標記如何。結合本文中的公開描述的各種解說性方塊以及模組可以用設計成執行本文中描述的功能的通用處理器、DSP、ASIC、FPGA或其他可程式化邏輯元件、分離的閘或電晶體邏輯、分離的硬體組件、或其任何組合來實現或執行。通用處理器可以是微處理器，但在替換方案中，處理器可以是任何常規的處理器、控制器、微控制器、或狀態機。處理器還可被實現為計算設備的組合(例如，DSP與微處理器的組合、多個微處理器、與DSP核心協同的一個或多個微處理器，或者任何其他此類配置)。本文中所描述的功能可以在硬體、由處理器執行的軟體、韌體、或其任何組合中實現。如果在由處理器執行的軟體中實現，則各功能可以作為一條或多條指令或代碼儲存在電腦可讀媒體上或藉其進行傳送。其他示例和實現落在本公開及所附請求項的範圍內。例如，由於軟體的本質，以上描述的功能可使用由處理器執行的軟體、硬體、韌體、硬連線或其任何組合來實現。實現功能的特徵也可實體地位於各種位置，包括被分佈以使得功能的各部分在不同的實體位置處實現。另外，如本文(包括請求項中)所使用的，在項目列舉(例如，以附有諸如“中的至少一個”或“中的一個或多個”之類的措辭的項目列舉)中使用的“或”指示包含性列舉，以使得例如A、B或C中的至少一個的列舉意指A或B或C或AB或AC或BC或ABC(即，A和B和C)。同樣，如本文所使用的，短語“基於”不應被解讀為引述封閉條件集。例如，被描述為“基於條件A”的示例性步驟可基於條件A和條件B兩者而不脫離本公開的範圍。換言之，如本文所使用的，短語“基於”應當以與短語“至少部分地基於”相同的方式來解讀。電腦可讀媒體包括非瞬態電腦儲存媒體和通訊媒體兩者，其包括促成電腦程式從一地向另一地轉移的任何媒體。非瞬態儲存媒體可以是能被通用或專用電腦存取的任何可用媒體。作為示例而非限定，非瞬態電腦可讀媒體可包括RAM、ROM、電可抹除可程式化唯讀記憶體(EEPROM)、壓縮盤(CD)ROM或其他光碟儲存、磁碟儲存或其他磁儲存設備、或能被用來攜帶或儲存指令或資料結構形式的期望程式代碼手段且能被通用或專用電腦、或者通用或專用處理器存取的任何其他非瞬態媒體。任何連接也被正當地稱為電腦可讀媒體。例如，如果軟體是使用同軸電纜、光纖電纜、雙絞線、數位訂戶線(DSL)、或諸如紅外、無線電、以及微波之類的無線技術從web網站、伺服器、或其它遠端源傳送而來的，則該同軸電纜、光纖電纜、雙絞線、數位訂戶線(DSL)、或諸如紅外、無線電、以及微波之類的無線技術就被包括在媒體的定義之中。如本文所使用的盤(disk)和碟(disc)包括CD、雷射碟、光碟、數位通用碟(DVD)、軟碟和藍光碟，其中盤常常磁性地再現資料而碟用雷射來光學地再現資料。以上媒體的組合也被包括在電腦可讀媒體的範圍內。提供本文的描述是為了使得本領域技術人員能夠製作或使用本公開。對本公開的各種修改對於本領域技術人員將是顯而易見的，並且本文中定義的普適原理可被應用於其他變形而不會脫離本公開的範圍。由此，本公開並非被限定於本文所描述的示例和設計，而是應被授予與本文所公開的原理和新穎特徵相一致的最廣範圍。

201:步驟 202:步驟 203:步驟 204:步驟 205:步驟 206:步驟 207:步驟 208:步驟 209:步驟 210:步驟 211:步驟 301:步驟 302:步驟 303:步驟 304:步驟 305:步驟 306:步驟 307:步驟 308:步驟 309:步驟 310:步驟 311:步驟 312:步驟 313:步驟 314:步驟 315:步驟 316:步驟 401:步驟 402:步驟 403:步驟 501:步驟 502:步驟 503:步驟 504:步驟 505:步驟 506:步驟 507:步驟 601:步驟 602:步驟 603:步驟 604:步驟 605:步驟 701:接收模組 702:預測向量生成模組 703:模型預測模組 704:傳送模組 705:儲存器 801:接收模組 802:預測向量生成模組 803:傳送模組 804:儲存器 e:中間模型向量 e’:計算結果 f:中間資料向量 f’:計算結果 Z₁:中間模型值 Z₁’:中間模型值 R1:亂數集合 R1’:亂數集合 R2:亂數集合 R2’:亂數集合

圖1是根據本發明的各方面的基於秘密分享的多方資料合作系統的架構圖。圖2解說了根據本發明的各方面的一個資料需求方與一個資料提供方進行資料合作的示例。圖3解說了根據本發明的各方面的一個資料需求方與兩個資料提供方進行資料合作的示例。圖4解說了根據本發明的各方面的由資料需求方執行的基於秘密分享的資料合作方法。圖5解說了根據本發明的各方面的由資料需求方執行的基於秘密分享的資料合作方法。圖6解說了根據本發明的各方面的由資料提供方執行的基於秘密分享的資料合作的示例方法。圖7是根據本發明的各方面的資料需求方的方塊圖。圖8是根據本發明的各方面的資料提供方的方塊圖。

Claims

一種基於秘密分享的安全模型預測方法，包括：接收來自第三方的第一亂數集合；使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果；以及使用所述共享計算預測結果進行模型預測。
如請求項1所述的方法，其中，所述生成共享計算預測結果包括：使用所述模型係數向量和所述第一亂數集合來生成中間模型向量；將所述中間模型向量發送給所述資料提供方並接收來自所述資料提供方的中間資料向量；使用來自所述資料提供方的所述中間資料向量和所述第一亂數集合來生成中間資料值；接收來自所述資料提供方的中間模型值；以及使用所述中間模型值和所述中間資料值來生成所述共享計算預測結果，其中所述共享計算預測結果是所述中間模型值和所述經處理中間資料值的乘積。
如請求項2所述的方法，其中，進一步包括：使用所述模型係數向量和本地儲存的附加資料向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。
如請求項2所述的方法，其中，進一步包括：使用所述第一亂數集合、所述模型係數向量和來自第二資料提供方的向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。
如請求項1所述的方法，其中，所述模型預測使用邏輯迴歸模型及/或線性迴歸模型。
一種基於秘密分享的安全模型預測方法，包括：接收來自第三方的第二亂數集合；使用所述第二亂數集合和資料向量來生成中間資料向量；將所述中間資料向量發送給資料需求方並接收來自所述資料需求方的中間模型向量；使用所述中間模型向量和所述第二亂數集合來生成中間資料值；以及將所述中間資料值提供給所述資料需求方以用於模型預測。
一種用於基於秘密分享的安全模型預測的裝置，包括：接收模組，其被配置成接收來自第三方的第一亂數集合；預測向量生成模組，其被配置成使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果；以及模型預測模組，其被配置成使用所述共享計算預測結果進行模型預測。
如請求項7所述的裝置，其中，所述接收模組被進一步配置成接收來自所述資料提供方的中間資料向量和中間模型值；所述預測向量生成模組被進一步配置成：使用所述模型係數向量和所述第一亂數集合來生成中間模型向量；使用中間資料向量和所述第一亂數集合來生成中間資料值；以及使用所述中間模型值和所述中間資料值來生成所述共享計算預測結果，其中所述共享計算預測結果是所述中間模型值和所述中間資料值的乘積；所述裝置進一步包括傳送模組，其被配置成將所述中間模型向量發送給所述資料提供方。
如請求項7所述的方法，其中，所述預測向量生成模組被進一步配置成：使用所述模型係數向量和本地儲存的附加資料向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。
如請求項7所述的方法，其中，所述預測向量生成模組被進一步配置成：使用所述第一亂數集合、所述模型係數向量和來自第二資料提供方的向量來生成第二共享計算預測結果；以及使用所述共享計算預測結果和所述第二共享計算預測結果來進行模型預測。
如請求項7所述的方法，其中，所述模型預測使用邏輯迴歸模型及/或線性迴歸模型。
一種用於基於秘密分享的安全模型預測的裝置，包括：接收模組，其被配置成接收來自第三方的第二亂數集合，以及接收來自資料需求方的中間模型向量；預測向量生成模組，其被配置成使用所述第二亂數集合和資料向量來生成中間資料向量，以及使用所述中間模型向量和所述第二亂數集合來生成中間資料值；以及傳送模組，其被配置成將所述中間資料向量發送給資料需求方，以及將所述中間資料值提供給所述資料需求方以用於模型預測。
一種基於秘密分享的安全模型預測裝置，包括：處理器；以及被安排成儲存電腦可執行指令的儲存器，所述可執行指令在被執行時使所述處理器執行以下操作：接收來自第三方的第一亂數集合；使用所述第一亂數集合、模型係數向量和來自資料提供方的向量來生成共享計算預測結果；以及使用所述共享計算預測結果進行模型預測。
一種基於秘密分享的安全模型預測裝置，包括：處理器；以及被安排成儲存電腦可執行指令的儲存器，所述可執行指令在被執行時使所述處理器執行以下操作：接收來自第三方的第二亂數集合；使用所述第二亂數集合和資料向量來生成中間資料向量；將所述中間資料向量發送給資料需求方並接收來自所述資料需求方的中間模型向量；使用所述中間模型向量和所述第二亂數集合來生成中間資料值；以及將所述中間資料值提供給所述資料需求方以用於模型預測。