TWI689828B

TWI689828B - 資料統計方法和裝置

Info

Publication number: TWI689828B
Application number: TW107130573A
Authority: TW
Inventors: 王華忠
Original assignee: 香港商阿里巴巴集團服務有限公司
Priority date: 2017-10-31
Filing date: 2018-08-31
Publication date: 2020-04-01
Also published as: WO2019085656A1; CN109726363B; CN109726363A; TW201918910A

Abstract

本說明書實施例提供一種資料統計方法和裝置，其中方法包括：對應於每個資料標識生成第一參數和第二參數；若資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，第二參數是根據第一參數和第一資料計算得到；將每個資料標識以及對應的第一參數和第二參數發送至合作資料方；接收合作資料方返回的合作方計算值，所述合作方計算值是合作資料方根據選擇的第一參數或第二參數得到；由合作方計算值中去除各個第一參數的計算值，得到所需要的統計值。

Description

資料統計方法和裝置

本公開關於網路技術領域，特別關於一種資料統計方法和裝置。

大數據時代，存在非常多的資料孤島。例如，一個自然人的資料，可以分散儲存於不同的企業中，而企業與企業之間由於競爭關係和用戶隱私保護的考慮，並不是完全的互相信任，這就為涉及企業之間資料合作的統計工作造成了障礙。如何在充分保護企業核心資料隱私的前提下，既能夠利用雙方擁有的資料完成一些資料統計計算，又不會洩露企業各自的資料隱私安全，成為一個亟待解決的迫切問題。但是目前並沒有很好的解決方案。

有鑑於此，本公開提供一種資料統計方法和裝置，以在保護兩個資料擁有方的資料隱私的基礎上，實現兩方安全計算。　　具體地，本說明書一個或多個實施例是透過如下技術方案實現的：　　第一方面，提供一種資料統計方法，所述方法應用於聯合本地資料方和合作資料方的資料進行資料統計，本地資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，合作資料方具有所述資料標識對應的多個第二資料，所述方法包括：　　對應於每個資料標識，生成第一參數和第二參數；若所述資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，所述第二參數是根據第一參數和所述第一資料計算得到；　　將每個資料標識、以及對應所述資料標識的第一參數和第二參數，發送至合作資料方；　　接收合作資料方返回的合作方計算值，所述合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若所述資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；　　由所述合作方計算值中去除各個第一參數的計算值，得到所述統計值。　　第二方面，提供一種資料統計方法，所述方法用於在本地資料方與統計資料方之間進行資料統計，所述統計資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，所述本地資料方具有同一資料標識對應的第二資料；所述方法包括：　　接收所述統計資料方發送的資料標識、以及對應所述資料標識的第一參數和第二參數；其中，當所述資料標識對應的第一資料參與資料統計時，所述第二參數是根據第一參數和所述第一資料計算得到，否則，所述第二參數等於第一參數；　　若所述資料標識對應的第二資料是本地參與資料統計的資料，則選擇所述資料標識對應的第二參數；否則，選擇所述資料標識對應的第一參數；　　根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；　　將所述合作方計算值發送至所述統計資料方，以使得所述統計資料方根據所述合作方計算值去除各個第一參數的計算值，得到所述統計值。　　第三方面，提供一種資料統計裝置，所述裝置用於聯合本地資料方和合作資料方的資料進行資料統計，所述本地資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，所述合作資料方具有所述資料標識對應的多個第二資料；所述裝置包括：　　參數生成模組，用於對應於每個資料標識，生成第一參數和第二參數；若所述資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，所述第二參數是根據第一參數和所述第一資料計算得到；　　資料發送模組，用於將每個資料標識、以及對應所述資料標識的第一參數和第二參數，發送至所述合作資料方；　　資料接收模組，用於接收合作資料方返回的合作方計算值，所述合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若所述資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；　　統計處理模組，用於由所述合作方計算值中去除各個第一參數的計算值，得到所述統計值。　　第四方面，提供一種資料統計裝置，所述裝置用於在本地資料方與統計資料方之間進行資料統計，所述統計資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，所述本地資料方具有同一資料標識對應的第二資料；所述裝置包括：　　參數接收模組，用於接收所述統計資料方發送的資料標識、以及對應所述資料標識的第一參數和第二參數；其中，當所述資料標識對應的第一資料參與資料統計時，所述第二參數是根據第一參數和所述第一資料計算得到，否則，所述第二參數等於第一參數；　　參數選擇模組，用於若所述資料標識對應的第二資料是本地參與資料統計的資料，則選擇所述資料標識對應的第二參數；否則，選擇所述資料標識對應的第一參數；　　統計計算模組，用於根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；　　數值發送模組，用於將所述合作方計算值發送至所述統計資料方，以使得所述統計資料方根據所述合作方計算值去除各個第一參數的計算值，得到所述統計值。　　第五方面，提供一種資料統計設備，所述設備包括記憶體、處理器，以及儲存在記憶體上並可在處理器上運行的電腦指令，所述處理器執行指令時實現以下步驟：　　對應於每個資料標識，生成第一參數和第二參數；若所述資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，所述第二參數是根據第一參數和所述第一資料計算得到；　　將每個資料標識、以及對應所述資料標識的第一參數和第二參數，發送至合作資料方；　　接收合作資料方返回的合作方計算值，所述合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若所述資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；　　由所述合作方計算值中去除各個第一參數的計算值，得到所述統計值。　　第六方面，提供一種資料統計設備，所述設備包括記憶體、處理器，以及儲存在記憶體上並可在處理器上運行的電腦指令，所述處理器執行指令時實現以下步驟：　　接收所述統計資料方發送的資料標識、以及對應所述資料標識的第一參數和第二參數；其中，當所述資料標識對應的第一資料參與資料統計時，所述第二參數是根據第一參數和所述第一資料計算得到，否則，所述第二參數等於第一參數；　　若所述資料標識對應的第二資料是本地參與資料統計的資料，則選擇所述資料標識對應的第二參數；否則，選擇所述資料標識對應的第一參數；　　根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；　　將所述合作方計算值發送至所述統計資料方，以使得所述統計資料方根據所述合作方計算值去除各個第一參數的計算值，得到所述統計值。　　本說明書一個或多個實施例的資料統計方法和裝置，透過生成用於混淆真實資料的第一參數和第二參數，在將這些參數發送至合作資料方時，可以使得合作資料方不會知曉本端的真實資料，並且，合作資料方返回的合作方計算值也是根據合作資料方的資料過濾條件確定，而本端不會知曉合作資料方所做的資料選擇，從而實現了在保護兩個資料擁有方的資料隱私的基礎上，聯合兩方資料進行了兩方安全計算。

為了使本技術領域的人員更好地理解本說明書一個或多個實施例中的技術方案，下面將結合本說明書一個或多個實施例中的附圖，對本說明書一個或多個實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是一部分實施例，而不是全部的實施例。基於本說明書一個或多個實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例，都應當屬於本公開保護的範圍。　　在大數據時代，資料的儲存方式可以是垂直模式，即多個資料擁有方可以擁有同一個實體的不同屬性資訊，例如，同一個自然人的車險分在一個機構，該自然人的理賠金額在另一個機構。這種垂直模式的資料儲存，可能導致在進行一些資料統計計算時，會涉及到多個資料擁有方，需要多個資料擁有方合作完成一次資料統計。然而，由於不同企業之間的競爭關係或者隱私保護的考慮，不能洩露企業各自的資料秘密。　　本公開的例子中，旨在基於不同的資料擁有方的資料進行資料統計，同時又不會洩露資料擁有方各自的資料隱私，如下將以一個示例的應用場景為例，來詳細描述該方法。應用場景：　　在一個例子中，可以有兩個資料來源，分別為：資料來源A和資料來源B。假設資料來源A可以是一個資料機構，資料來源B可以是一個保險機構，這兩個資料來源可以分別儲存同一個車主的不同資訊。　　資料來源A：假設該資料來源A可以儲存每個車主的車險分，車險分可以是對車主進行精準畫像和風險分析後得到的分數，車險分的分數越高，可以表明風險越低。如表1所示，資料來源A側儲存車險分的資料結構示例如下：表1 資料來源A的資料結構

資料來源B：假設該資料來源B可以儲存每個車主的理賠資訊，例如，車主的理賠資訊可以包括理賠次數、理賠金額等。如表2所示，資料來源B側儲存的每個車主的資料結構示例如下：表2 資料來源B的資料結構

基於上述的應用場景，可以基於資料來源A和資料來源B的資料，共同完成資料統計的處理。例如，統計工作的需求可以是“統計車險分大於500分的女性用戶理賠次數的總和”，那麼，“車險分大於500分”需要依據資料來源A的資料來確定，“女性使用者、理賠次數”這些資料都儲存在資料來源B中，因此，這種統計工作需要資料來源A和資料來源B的資料配合。　　在本說明書一個或多個實施例對資料統計方法的描述中，可以將擁有統計資料的資料來源稱為統計資料方，可以將另一個資料來源稱為合作資料方。例如，在統計工作“統計車險分大於500分的女性用戶理賠次數的總和”中，“理賠次數”是統計資料，所以資料來源B是統計資料方，那麼資料來源A是合作資料方。　　統計資料方和合作資料方可以分別儲存同一個車主的不同資訊，可以將統計資料方中儲存的待參與統計的車主資訊（例如，理賠次數）稱為第一資料，將合作資料方中儲存的參與統計的車主資訊（例如，車險分）稱為第二資料。此外，資料來源A和資料來源B中都包括的身份證號idcard_no可以稱為資料標識，統計資料方方（例如，資料來源B）可以儲存該資料標識對應的第一資料，合作資料方（例如，資料來源A）可以儲存該同一資料標識對應的第二資料。　　圖1示例了一種資料統計方法的流程，可以包括：　　在步驟100中，統計資料方對應於每個資料標識，生成第一參數和第二參數。　　例如，第一參數可以是一個亂數，或者，第一參數也可以是根據一個亂數計算得到的數值，如，亂數的二分之一。　　例如，第二參數的數值可以根據資料過濾條件而確定，如果資料標識對應的第一資料滿足本地的資料過濾條件，是參與資料統計的資料，則可以根據第一參數和第一資料計算得到該第二參數。比如，可以將第一參數和第一資料進行求和統計得到第二參數。如果資料標識對應的第二資料不滿足本地的資料過濾條件，則可以設置第二參數等於第一參數。但是實際實施中，第二參數的生成方式不限制於將第一資料和第一參數求和的方式得到，也可以採用其他計算方式。　　在步驟102中，統計資料方將本地的資料標識、以及對應所述資料標識的第一參數和第二參數，發送至合作資料方。　　在步驟104中，合作資料方選擇參數，若資料標識對應的第二資料是本地參與資料統計的資料，則選擇所述資料標識對應的第二參數；否則，選擇資料標識對應的第一參數。　　例如，合作資料方在接收到統計資料方發送的資料標識、以及對應資料標識的第一參數和第二參數後，可以在本步驟進行參數的選擇，選擇的參數可以參與後續步驟106的處理。　　其中，合作資料方可以根據本地的資料過濾條件，如果一個資料標識對應的第二資料滿足過濾條件，是參與資料統計的資料，則可以選擇第二參數；否則，如果一個資料標識對應的第二資料不過濾條件，不是參與資料統計的資料，則可以選擇第一參數。　　在步驟106中，合作資料方將選擇的第一參數和第二參數進行統計計算，得到合作方計算值。例如，在所要獲取的統計值是求和統計時，可以將選擇的第一參數和第二參數進行加和；當然在其他的統計方式中，也可以將第一參數和第二參數進行對應的其他形式的計算。　　在步驟108中，合作資料方將合作方計算值發送至所述統計資料方。　　在步驟110中，統計資料方用合作方計算值去除第一參數的計算值，得到統計值。例如，可以是用合作方計算值減去各個第一參數之和。　　上述圖1的流程例子，採用了不經意傳輸協定（Oblivious transfer，OT），該OT是一種可保護隱私的雙方通信協議，能使通信雙方以一種選擇模糊化的方式傳送消息，可以使得服務的接收方以不經意的方式得到服務發送方輸入的某些消息，這樣就可以保護接受者的隱私不被發送者所知道。　　例如，在圖1的例子中，統計資料方可以將所有的資料標識和對應的第一參數、第二參數發送至合作資料方，其實統計資料方已經根據本地的資料過濾條件對第二參數設置了不同的數值，但是由合作資料方的角度來看，接收到的是所有資料標識，不會洩露統計資料方的過濾資料。再者，統計資料方透過兩個參數的方式混淆了自己的真實資料，向合作資料方傳送的第一參數和第二參數並不是真實的第一資料，也不會導致資料隱私洩露。並且，再由統計資料方的角度來看，它所接收的合作方計算值是合作資料方進行資料過濾後的選擇，但是統計資料方也無法區分合作資料方選擇了哪些資料，因此，合作資料方的資料也能夠得到隱私保護。　　基於表1所示的資料結構，假設資料來源A擁有的車險分數據如下表3，其中，idcard_no可以是車主的身份證號，score可以是該車主的車險分。表3 資料來源A的數據

基於表2所示的資料結構，假設資料來源B擁有的資料如下表4：表4 資料來源B的數據

如下基於上述表3和表4，統計車險分大於500分的女性用戶理賠次數的總和。可以看到，本次統計工作的統計資料“理賠次數”儲存在資料來源B，表4中的times這一列可以稱為“統計列”，即要對這一列的資料進行求和統計。而過濾條件中的“車險分大於500分”位於資料來源A（第二資料用於作為統計值獲取的過濾條件），過濾條件“女性”位於資料來源B，即過濾條件可以在兩個資料來源都存在。資料來源A和資料來源B進行資料合作，可以實現對理賠次數統計求和（獲取統計值）的工作。　　圖2示例了結合資料來源A和資料來源B進行求和統計的流程，可以包括：　　在步驟200中，資料來源B針對每一行資料都生成一個亂數，並根據資料過濾條件生成M0和M1。　　本步驟中，例如表4所示例的資料，理賠次數times對應的列是統計列。其中的3、7、6都是該統計列中的第一資料。　　針對每一行資料生成的一個亂數，假設對應1234567的亂數是t1，對應2345678的亂數是t2，對應3456789的亂數是t3。　　根據本地的資料過濾條件“女性使用者”，可以得到2345678和3456789這兩個idcard_no的車主符合該條件，是參與本次數據統計的第一資料；而1234567的車主不符合過濾條件，不參與資料統計。據此，假設統計列中的各個第一資料用b表示，那麼可以生成對應每個idcard_no的第一參數和第二參數。其中的第一參數可以是上述對應每個idcard_no的亂數，第二參數可以是亂數與該idcard_no對應的第一資料之和，所述第一資料可以是參與統計的b。　　如下表5的示例，對每行資料都生成一個亂數，假設對應統計列的真實值為b。對每行資料做遍歷，如果這行資料滿足自身的過濾條件，則生成M0=t，M1=t+b；如果不滿足自身的過濾條件，則生成M0=M1=t。表5 每一行資料的MO和M1

本步驟生成的M0和M1，是透過隨機值的生成來混淆真實的統計列資料，就算合作資料方接收到idcard_no對應的M0和M1，也不能知道該資料標識idcard_no對應的真實的統計列資料b是多少。例如，即使接收到資料標識2345678對應的t₂ 和t₂ +7，也不能知道真實的b的數值7。　　此外，上述分別與每個資料標識對應的亂數t₁ 、t₂ 和t₃ ，可以不同。　　在步驟202中，資料來源B將每一行資料的資料標識、以及對應所述資料標識的MO和M1，發送至資料來源A。　　在步驟204中，資料來源A根據本地的資料過濾條件，若資料標識對應的第二資料參與資料統計，則選擇M1，否則，選擇MO。　　例如，資料來源A可以根據過濾條件“車險分大於500分”，來判斷每個資料標識idcard_no對應的第二資料（表3中的score）是否大於500分。若idcard_no對應的score大於500，則選擇表5中的“t+b”，否則，若idcard_no對應的score小於500，則選擇表5中的“t”。　　舉例來說，以idcard_no是1234567為例，該資料標識對應的車險分是490，並不滿足“車險分大於500分”的過濾條件，則可以選擇表5中對應1234567的M0，即選擇t1。又例如，以idcard_no是2345678為例，在表3中，該資料標識對應的車險分是501，滿足“車險分大於500分”的過濾條件，則可以選擇表5中對應2345678的M1，即選擇t2+7。同理，對於idcard_no是3456789，將選擇t3+6。　　在步驟206中，資料來源A將選擇數做累加，得到累加值。　　例如，資料來源A可以將選擇的參數進行累加操作，得到一個累加值。比如，累加值可以是M=t1+t2+7+t3+6。該累加值即為合作方計算值。　　在步驟208中，資料來源A將累加值發送至資料來源B。　　在步驟210中，資料來源B用累加值減去M0之和，得到統計值。　　本步驟中，資料來源B接收到累加值後，把累加值減去所有的亂數MO的和，得到的就是要統計的理賠次數之和。例如，可以計算M-(t1+t2+t3)=13，即為最終的統計值，其中的M是累加值。　　本例子中，資料來源B接收到累加值後，並不能知道資料來源A側具體選擇的是M0還是M1，而只是接收到一個累加值；同樣，資料來源A也不能知道資料來源B側過濾的參與統計資料，而只是接收到兩個參數。因此，這種方式在計算過程中沒有洩露任何一方的明細資料，而且高效的完成了兩方的求和統計。　　上述圖2所示的流程，是以統計值是多個第一資料之和為例，比如求取理賠次數的總和。在其他的例子中，本說明書一個或多個實施例的資料統計方法，還可以應用於其他統計計算的場景，比如，統計值還可以是求取多個第一資料的平均值。　　以求取“車險分大於500分的女性用戶理賠次數的平均值”為例，還可以採用圖2所示的處理流程，不同的是，可以採用不同的第一參數和第二參數。比如，當一行資料不滿足自身的過濾條件，則對應資料標識生成的第一參數和第二參數可以是M0=M1=t；而當一行資料滿足自身的過濾條件，則對應資料標識生成的第一參數和第二參數可以是第一參數加上第一資料的二分之一。　　例如，以表5中資料標識2345678為例，生成的M0可以是t₂ ，生成的M1可以是“t₂ +7/2”。或者，還可以是將第一參數生成為亂數的二分之一，比如“t₂ /2”，對應的第二參數可以是“（t₂ +7）/2”。如下表6所示：表6 統計平均值時的MO和M1

待資料來源B接收到資料來源A發送的累加值M後，假設資料來源A選擇的是後兩行資料（對應資料標識2345678和3456789），仍然可以是M-(t1+t2+t3)=6.5。　　為了實現上述的方法，本說明書一個或多個實施例還提供了一種資料統計裝置，如圖3所示，該裝置可以包括：參數生成模組31、資料發送模組32、資料接收模組33和統計處理模組34。　　參數生成模組31，用於對應於每個資料標識，生成第一參數和第二參數；若所述資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，所述第二參數是根據第一參數和所述第一資料計算得到；　　資料發送模組32，用於將每個資料標識、以及對應所述資料標識的第一參數和第二參數，發送至所述合作資料方；　　資料接收模組33，用於接收合作資料方返回的合作方計算值，所述合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若所述資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；　　統計處理模組34，用於由所述合作方計算值中去除各個第一參數的計算值，得到所述統計值。　　在一個例子中，所述多個第一資料，位於本地資料來源的同一個統計列中。　　在一個例子中，參數生成模組31，在用於根據第一參數和所述第一資料計算得到第二參數時，具體是用於由所述第一參數和所述第一資料進行求和統計得到第二參數。統計處理模組34，在用於由所述合作方計算值中去除各個第一參數的計算值時，具體是用於透過累加值減去各個所述第一參數之和，所述累加值是合作資料方根據選擇的第一參數或第二參數累加得到。　　在一個例子中，參數生成模組31，在用於由第一參數和第一資料進行求和統計得到第二參數時，具體是用於：若所述資料標識對應的第一資料滿足用於確定參與統計資料的資料過濾條件，則當所述統計值是多個第一資料之和時，所述第一參數是一個亂數，所述第二參數是所述亂數與所述第一資料之和。　　在一個例子中，參數生成模組31，在用於由第一參數和第一資料進行求和統計得到第二參數時，具體是用於：若所述資料標識對應的第一資料滿足用於確定參與統計資料的資料過濾條件，則當所述統計值是多個第一資料的平均值時，所述第二參數是所述第一參數加上所述第一資料的二分之一。　　為了實現上述的方法，本說明書一個或多個實施例還提供了一種資料統計裝置，如圖4所示，該裝置可以包括：參數接收模組41、參數選擇模組42、統計計算模組43和數值發送模組44。　　參數接收模組41，用於接收所述統計資料方發送的資料標識、以及對應所述資料標識的第一參數和第二參數；其中，當所述資料標識對應的第一資料參與資料統計時，所述第二參數是根據第一參數和所述第一資料計算得到，否則，所述第二參數等於第一參數；　　參數選擇模組42，用於若所述資料標識對應的第二資料是本地參與資料統計的資料，則選擇所述資料標識對應的第二參數；否則，選擇所述資料標識對應的第一參數；　　統計計算模組43，用於根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；　　數值發送模組44，用於將所述合作方計算值發送至所述統計資料方，以使得所述統計資料方根據所述合作方計算值去除各個第一參數的計算值，得到所述統計值。　　為了描述的方便，描述以上裝置時以功能分為各種模組分別描述。當然，在實施本說明書一個或多個實施例時可以把各模組的功能在同一個或多個軟體和/或硬體中實現。　　上述方法實施例所示流程中的各個步驟，其執行順序不限制於流程圖中的順序。此外，各個步驟的描述，可以實現為軟體、硬體或者其結合的形式，例如，本領域技術人員可以將其實現為軟體代碼的形式，可以為能夠實現所述步驟對應的邏輯功能的電腦可執行指令。當其以軟體的方式實現時，所述的可執行指令可以儲存在記憶體中，並被設備中的處理器執行。　　例如，對應於上述方法，本說明書一個或多個實施例同時提供一種資料統計設備，該設備用於聯合本地資料方和合作資料方的資料進行資料統計，所述本地資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，所述合作資料方具有所述資料標識對應的多個第二資料。該設備可以包括處理器、記憶體、以及儲存在記憶體上並可在處理器上運行的電腦指令，所述處理器透過執行所述指令，用於實現如下步驟：　　對應於每個資料標識，生成第一參數和第二參數；若所述資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，所述第二參數是根據第一參數和所述第一資料計算得到；　　將每個資料標識、以及對應所述資料標識的第一參數和第二參數，發送至合作資料方；　　接收合作資料方返回的合作方計算值，所述合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若所述資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；　　由所述合作方計算值中去除各個第一參數的計算值，得到所述統計值。　　例如，對應於上述方法，本說明書一個或多個實施例還提供一種資料統計設備，該設備用於在本地資料方與統計資料方之間進行資料統計，所述統計資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，所述本地資料方具有同一資料標識對應的第二資料。該設備可以包括處理器、記憶體、以及儲存在記憶體上並可在處理器上運行的電腦指令，所述處理器透過執行所述指令，用於實現如下步驟：　　接收所述統計資料方發送的資料標識、以及對應所述資料標識的第一參數和第二參數；其中，當所述資料標識對應的第一資料參與資料統計時，所述第二參數是根據第一參數和所述第一資料計算得到，否則，所述第二參數等於第一參數；　　若所述資料標識對應的第二資料是本地參與資料統計的資料，則選擇所述資料標識對應的第二參數；否則，選擇所述資料標識對應的第一參數；　　根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；　　將所述合作方計算值發送至所述統計資料方，以使得所述統計資料方根據所述合作方計算值去除各個第一參數的計算值，得到所述統計值。　　上述實施例闡明的裝置或模組，具體可以由電腦晶片或實體實現，或者由具有某種功能的產品來實現。一種典型的實現設備為電腦，電腦的具體形式可以是個人電腦、膝上型電腦、蜂窩電話、相機電話、智慧型電話、個人數位助理、媒體播放機、導航設備、電子郵件收發設備、遊戲控制台、平板電腦、可穿戴設備或者這些設備中的任意幾種設備的組合。　　本領域內的技術人員應明白，本說明書一個或多個實施例可提供為方法、系統、或電腦程式產品。因此，本說明書一個或多個實施例可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且，本說明書一個或多個實施例可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體（包括但不限於磁碟記憶體、CD-ROM、光學記憶體等）上實施的電腦程式產品的形式。　　這些電腦程式指令也可儲存在能引導電腦或其他可程式設計資料處理設備以特定方式工作的電腦可讀記憶體中，使得儲存在該電腦可讀記憶體中的指令產生包括指令裝置的製造品，該指令裝置實現在流程圖一個流程或多個流程和／或方框圖一個方框或多個方框中指定的功能。　　這些電腦程式指令也可裝載到電腦或其他可程式設計資料處理設備上，使得在電腦或其他可程式設計設備上執行一系列操作步驟以產生電腦實現的處理，從而在電腦或其他可程式設計設備上執行的指令提供用於實現在流程圖一個流程或多個流程和／或方框圖一個方框或多個方框中指定的功能的步驟。　　還需要說明的是，術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下，由語句“包括一個……”限定的要素，並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。　　本說明書一個或多個實施例可以在由電腦執行的電腦可執行指令的一般上下文中描述，例如程式模組。一般地，程式模組包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構等等。也可以在分散式運算環境中實踐本說明書一個或多個實施例，在這些分散式運算環境中，由透過通信網路而被連接的遠端處理設備來執行任務。在分散式運算環境中，程式模組可以位於包括存放裝置在內的本地和遠端電腦儲存媒體中。　　本說明書中的各個實施例均採用遞進的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對於服務端設備實施例而言，由於其基本相似於方法實施例，所以描述的比較簡單，相關之處參見方法實施例的部分說明即可。　　上述對本說明書特定實施例進行了描述。其它實施例在所附申請專利範圍的範圍內。在一些情況下，在申請專利範圍中記載的動作或步驟可以按照不同於實施例中的順序來執行並且仍然可以實現期望的結果。另外，在附圖中描繪的過程不一定要求示出的特定順序或者連續順序才能實現期望的結果。在某些實施方式中，多工處理和並行處理也是可以的或者可能是有利的。　　以上所述僅為本說明書一個或多個實施例的較佳實施例而已，並不用以限制本公開，凡在本公開的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本公開保護的範圍之內。

31‧‧‧參數生成模組32‧‧‧資料發送模組33‧‧‧資料接收模組34‧‧‧統計處理模組41‧‧‧參數接收模組42‧‧‧參數選擇模組43‧‧‧統計計算模組44‧‧‧數值發送模組

為了更清楚地說明本說明書一個或多個實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本說明書一個或多個實施例中記載的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動性的前提下，還可以根據這些附圖獲得其他的附圖。　　圖1為本說明書一個或多個實施例提供的一種資料統計方法的流程圖；　　圖2為本說明書一個或多個實施例提供的一種資料求和統計的流程圖；　　圖3為本說明書一個或多個實施例提供的一種資料統計裝置的結構示意圖；　　圖4為本說明書一個或多個實施例提供的一種資料統計裝置的結構示意圖。

Claims

一種資料統計方法，該方法應用於聯合本地資料方和合作資料方的資料進行資料統計，本地資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，合作資料方具有該資料標識對應的多個第二資料，該方法包括：對應於每個資料標識，生成第一參數和第二參數；若該資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，該第二參數是根據第一參數和該第一資料計算得到；將每個資料標識、以及對應該資料標識的第一參數和第二參數，發送至合作資料方；接收合作資料方返回的合作方計算值，該合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若該資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；由該合作方計算值中去除各個第一參數的計算值，得到該統計值。
根據請求項1所述的方法，該第二參數是根據第一參數和該第一資料計算得到，包括：該第二參數是由該第一參數和該第一資料進行求和統計得到；該由該合作方計算值中去除各個第一參數的計算值，包括：該合作方計算值是合作資料方根據選擇的第一參數或第二參數累加得到的累加值，透過該累加值減去各個該第一參數之和。
根據請求項2所述的方法，該第二參數是由該第一參數和該第一資料進行求和統計得到，包括：若該資料標識對應的第一資料滿足用於確定參與統計資料的資料過濾條件，則當該統計值是多個第一資料之和時，該第一參數是一個亂數，該第二參數是該亂數與該第一資料之和。
根據請求項2所述的方法，該第二參數是由該第一參數和該第一資料進行求和統計得到，包括：若該資料標識對應的第一資料滿足用於確定參與統計資料的資料過濾條件，則當該統計值是多個第一資料的平均值時，該第二參數是該第一參數加上該第一資料的二分之一。
一種資料統計方法，該方法用於在本地資料方與統計資料方之間進行資料統計，該統計資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，該本地資料方具有同一資料標識對應的第二資料；該方法包括：接收該統計資料方發送的資料標識、以及對應該資料標識的第一參數和第二參數；其中，當該資料標識對應的第一資料參與資料統計時，該第二參數是根據第一參數和該第一資料計算得到，否則，該第二參數等於第一參數；若該資料標識對應的第二資料是本地參與資料統計的資料，則選擇該資料標識對應的第二參數；否則，選擇該資料標識對應的第一參數；根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；將該合作方計算值發送至該統計資料方，以使得該統計資料方根據該合作方計算值去除各個第一參數的計算值，得到該統計值。
一種資料統計裝置，該裝置用於聯合本地資料方和合作資料方的資料進行資料統計，該本地資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，該合作資料方具有該資料標識對應的多個第二資料；該裝置包括：參數生成模組，用於對應於每個資料標識，生成第一參數和第二參數；若該資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，該第二參數是根據第一參數和該第一資料計算得到；資料發送模組，用於將每個資料標識、以及對應該資料標識的第一參數和第二參數，發送至該合作資料方；資料接收模組，用於接收合作資料方返回的合作方計算值，該合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若該資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；統計處理模組，用於由該合作方計算值中去除各個第一參數的計算值，得到該統計值。
根據請求項6所述的裝置，該參數生成模組，在用於根據第一參數和該第一資料計算得到第二參數時，具體是用於由該第一參數和該第一資料進行求和統計得到第二參數；該統計處理模組，在用於由該合作方計算值中去除各個第一參數的計算值時，具體是用於透過累加值減去各個所述第一參數之和，該累加值是合作資料方根據選擇的第一參數或第二參數累加得到。
根據請求項7所述的裝置，該參數生成模組，在用於由該第一參數和該第一資料進行求和統計得到第二參數時，具體是用於：若該資料標識對應的第一資料滿足用於確定參與統計資料的資料過濾條件，則當該統計值是多個第一資料之和時，該第一參數是一個亂數，該第二參數是該亂數與該第一資料之和。
根據請求項7所述的裝置，該參數生成模組，在用於由該第一參數和該第一資料進行求和統計得到第二參數時，具體是用於：若該資料標識對應的第一資料滿足用於確定參與統計資料的資料過濾條件，則當該統計值是多個第一資料的平均值時，該第二參數是該第一參數加上該第一資料的二分之一。
一種資料統計裝置，該裝置用於在本地資料方與統計資料方之間進行資料統計，該統計資料方具有待計算統計值的多個第一資料，所述多個第一資料分別對應不同的資料標識，該本地資料方具有同一資料標識對應的第二資料；該裝置包括：參數接收模組，用於接收該統計資料方發送的資料標識、以及對應該資料標識的第一參數和第二參數；其中，當該資料標識對應的第一資料參與資料統計時，該第二參數是根據第一參數和該第一資料計算得到，否則，該第二參數等於第一參數；參數選擇模組，用於若該資料標識對應的第二資料是本地參與資料統計的資料，則選擇該資料標識對應的第二參數；否則，選擇該資料標識對應的第一參數；統計計算模組，用於根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；數值發送模組，用於將該合作方計算值發送至該統計資料方，以使得該統計資料方根據該合作方計算值去除各個第一參數的計算值，得到該統計值。
一種資料統計設備，該設備包括記憶體、處理器，以及儲存在記憶體上並可在處理器上運行的電腦指令，該處理器執行指令時實現以下步驟：對應於每個資料標識，生成第一參數和第二參數；若該資料標識對應的第一資料不參與資料統計，則第二參數等於第一參數，否則，該第二參數是根據第一參數和該第一資料計算得到；將每個資料標識、以及對應該資料標識的第一參數和第二參數，發送至合作資料方；接收合作資料方返回的合作方計算值，該合作方計算值是合作資料方根據選擇的第一參數或第二參數得到，若該資料標識對應的第二資料參與資料統計，則合作資料方選擇第二參數，否則，合作資料方選擇第一參數；由該合作方計算值中去除各個第一參數的計算值，得到統計值。
一種資料統計設備，該設備包括記憶體、處理器，以及儲存在記憶體上並可在處理器上運行的電腦指令，該處理器執行指令時實現以下步驟：接收該統計資料方發送的資料標識、以及對應該資料標識的第一參數和第二參數；其中，當該資料標識對應的第一資料參與資料統計時，該第二參數是根據第一參數和該第一資料計算得到，否則，該第二參數等於第一參數；若該資料標識對應的第二資料是本地參與資料統計的資料，則選擇該資料標識對應的第二參數；否則，選擇該資料標識對應的第一參數；根據選擇的第一參數和第二參數進行統計計算，得到合作方計算值；將該合作方計算值發送至該統計資料方，以使得該統計資料方根據該合作方計算值去除各個第一參數的計算值，得到統計值。