TW202040399A - 資料處理方法、裝置和電子設備 - Google Patents

資料處理方法、裝置和電子設備 Download PDF

Info

Publication number
TW202040399A
TW202040399A TW109100162A TW109100162A TW202040399A TW 202040399 A TW202040399 A TW 202040399A TW 109100162 A TW109100162 A TW 109100162A TW 109100162 A TW109100162 A TW 109100162A TW 202040399 A TW202040399 A TW 202040399A
Authority
TW
Taiwan
Prior art keywords
data
split
splitting
sub
input
Prior art date
Application number
TW109100162A
Other languages
English (en)
Other versions
TWI728639B (zh
Inventor
林文珍
李漓春
Original Assignee
開曼群島商創新先進技術有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 開曼群島商創新先進技術有限公司 filed Critical 開曼群島商創新先進技術有限公司
Publication of TW202040399A publication Critical patent/TW202040399A/zh
Application granted granted Critical
Publication of TWI728639B publication Critical patent/TWI728639B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephone Function (AREA)

Abstract

本說明書實施例提供一種資料處理方法、裝置和電子設備。所述方法包括:以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從所述第一設備輸入的多個子資料中選擇目標子資料,所述多個子資料基於拆分參數集合中的拆分參數得到;對選擇的目標子資料進行求和處理,得到第一求和結果;接收所述第一設備發來的第二求和結果,所述第二求和結果透過對所述拆分參數集合中的拆分參數進行求和處理得到;基於所述第一求和結果和所述第二求和結果,計算統計指標。本說明書實施例提供的資料處理方法、裝置和電子設備,可以使各個資料方在不洩漏自身擁有的資料的前提下共同完成資料指標的統計。

Description

資料處理方法、裝置和電子設備
本說明書實施例關於計算機技術領域,特別關於一種資料處理方法、裝置和電子設備。
在業務實際中,單個資料方擁有的資料並不完備,通常需要借助其它資料方的資料,共同完成一些資料指標的統計。在協作計算的過程中,往往存在資料洩漏的問題。
本說明書實施例的目的是提供一種資料處理方法、裝置和電子設備,以使各個資料方在不洩漏自身擁有的資料的前提下共同完成資料指標的統計。 為實現上述目的,本說明書中一個或多個實施例提供的技術方案如下。 根據本說明書一個或多個實施例的第一方面,提供了一種資料處理方法,應用於第一設備,包括:利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料;以所述多個子資料為輸入,與第二設備進行不經意傳輸;對所述拆分參數集合中的拆分參數進行求和處理;向所述第二設備發送求和結果。 根據本說明書一個或多個實施例的第二方面,提供了一種資料處理裝置,應用於第一設備,包括:拆分單元,用於利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料;傳輸單元,用於以所述多個子資料為輸入,與第二設備進行不經意傳輸;計算單元,用於對所述拆分參數集合中的拆分參數進行求和處理;發送單元,用於向所述第二設備發送求和結果。 根據本說明書一個或多個實施例的第三方面,提供了一種電子設備,包括:記憶體,用於儲存計算機指令;處理器,用於執行所述計算機指令以實現如第一方面所述的方法步驟。 根據本說明書一個或多個實施例的第四方面,提供了一種資料處理方法,應用於第二設備,包括:以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從所述第一設備輸入的多個子資料中選擇目標子資料,所述多個子資料基於拆分參數集合中的拆分參數得到;對選擇的目標子資料進行求和處理,得到第一求和結果;接收所述第一設備發來的第二求和結果,所述第二求和結果透過對所述拆分參數集合中的拆分參數進行求和處理得到;基於所述第一求和結果和所述第二求和結果,計算統計指標。 根據本說明書一個或多個實施例的第五方面,提供了一種資料處理裝置,應用於第二設備,包括:傳輸單元,用於以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從所述第一設備輸入的多個子資料中選擇目標子資料,所述多個子資料基於拆分參數集合中的拆分參數得到;第一計算單元,用於對選擇的目標子資料進行求和處理,得到第一求和結果;接收單元,用於接收所述第一設備發來的第二求和結果,所述第二求和結果透過對所述拆分參數集合中的拆分參數進行求和處理得到;第二計算單元,用於基於所述第一求和結果和所述第二求和結果,計算統計指標。 根據本說明書一個或多個實施例的第六方面,提供了一種電子設備,包括:記憶體,用於儲存計算機指令;處理器,用於執行所述計算機指令以實現如第四方面所述的方法步驟。 由以上本說明書實施例提供的技術方案可見,本說明書實施例中,第一設備和第二設備可以在不洩漏自身擁有的資料的前提下,進行協作計算,完成資料指標的統計。
下面將結合本說明書實施例中的圖式,對本說明書實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本說明書一部分實施例,而不是全部的實施例。基於本說明書中的實施例,本領域普通技術人員在沒有作出進步性勞動前提下所獲得的所有其他實施例,都應當屬本說明書保護的範圍。值得注意的是,本文中的“第一”、“第二”等描述,是用於區分不同的訊息、設備、模組等,不代表先後順序,也不限定“第一”和“第二”是不同的類型。 請參閱圖1。本說明書實施例提供一種資料處理系統。 在一些實施例中,所述資料處理系統可以包括第一設備。所述第一設備可以為伺服器、手機、平板電腦、或個人電腦等設備;或者,也可以為由多台設備組成的系統,例如由多個伺服器組成的伺服器集群。所述第一設備可以提供有特徵資料集合。所述特徵資料集合在所述第一設備中的儲存方式包括但不限於數組、向量、矩陣、線性表等。所述特徵資料集合可以包括至少一個特徵資料,所述特徵資料可以用於反映業務對象的特徵。例如,所述業務對象可以為使用者,所述特徵資料可以為使用者的借貸金額、或使用者繳納社保的基數等。 在一些實施例中,所述資料處理系統還可以包括第二設備。所述第二設備可以為伺服器、手機、平板電腦、或個人電腦等設備;或者,也可以為由多台設備組成的系統,例如由多個伺服器組成的伺服器集群。所述第二設備可以提供有標簽資料集合。所述標簽資料集合在所述第二設備中的儲存方式包括但不限於數組、向量、矩陣、線性表等。所述標簽資料集合可以包括至少一個標簽資料,所述標簽資料可以用於反映業務對象的類型。例如,所述業務對象可以為使用者,所述標簽資料可以用於標識使用者是否為學生、使用者是否為失信者、使用者是否繳納社保、使用者是否有借貸記錄等。所述標簽資料的取值可以為二元值。例如,所述標簽資料的取值可以取自0和1,取值0用於標識使用者為失信者,取值1使用者標識使用者不是失信者。值的注意的是,此處的0和1僅為示例,根據業務實際的需要,所述標簽資料的取值還可以為其它值。例如,所述標簽資料的取值可以取自0和-1,取值0用於標識使用者為失信者,取值-1用於標識使用者不是失信者。 在一些實施例中,單個資料方擁有的資料並不完備,需要借助其它資料方的資料,共同完成一些資料指標的統計。為了保護隱私,參與統計的各個資料方不能夠洩漏自身擁有的資料。具體在本實施例中,在不洩漏自身擁有的資料的前提下,所述第一設備和所述第二設備可以進行協作計算,完成一些資料指標的統計。例如,所述第一設備可以擁有特徵資料集合,所述特徵資料集合中的特徵資料可以為使用者的借貸金額。所述第二設備可以擁有標簽資料集合,所述標簽資料集合中的標簽資料可以用於標識使用者是否繳納社保。所述第一設備和所述第二設備可以進行協作計算,對繳納社保使用者的借貸金額之和進行統計。 為了便於統計,可以建立所述特徵資料集合中的特徵資料和所述標簽資料集合中的標簽資料之間的對應關係。具有對應關係的特徵資料和標簽資料針對的是同一業務對象。在實際應用中可以根據業務對象的標識符建立所述對應關係。具體地,所述特徵資料集合中的特徵資料和所述標簽資料集合中的標簽資料均可以對應有業務對象的標識符。如此可以將對應相同標識符的標簽資料和特徵資料之間建立對應關係。例如,所述業務對象可以為使用者,所述標識符可以為使用者的手機號或使用者的帳戶等等。在一個場景示例中,所述特徵資料集合可以表示為向量
Figure 02_image001
。所述標簽資料集合可以表示為向量
Figure 02_image003
Figure 02_image005
表示特徵資料,
Figure 02_image007
表示標簽資料,1≤inn 表示資料數量。特徵資料
Figure 02_image009
和標簽資料
Figure 02_image010
對應了相同的標識符,例如均對應某一使用者的手機號。因而特徵資料
Figure 02_image009
和標簽資料
Figure 02_image010
之間具有對應關係。當然,在實際應用中還可以採用其它方式建立特徵資料和標簽資料之間的對應關係,本說明書對此並不做具體限定。 基於所述資料處理系統,本說明書提供資料處理方法的一個實施例。請一並參閱圖2和圖3。該實施例可以包括以下步驟。 步驟S101:第一設備利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料。 在一些實施例中,所述拆分參數集合可以是由所述第一設備產生的。所述拆分參數集合在所述第一設備中的儲存方式包括但不限於數組、向量、矩陣、線性表等。所述拆分參數集合可以包括至少一個拆分參數。所述拆分參數可以為隨機數,用於對特徵資料進行拆分。 所述拆分參數集合中的拆分參數和所述特徵資料集合中的特徵資料之間可以具有對應關係,以便於利用拆分參數集合中的拆分參數對特徵資料集合中的特徵資料進行拆分。延續前面的場景示例,所述拆分參數集合可以表示為向量
Figure 02_image012
Figure 02_image014
表示拆分參數。特徵資料
Figure 02_image016
和標簽資料
Figure 02_image018
之間可以具有對應關係。 在一些實施例中,針對所述特徵資料集合中的每個特徵資料,所述第一設備可以利用所述拆分參數集合中與該特徵資料相對應的拆分參數,將該特徵資料拆分為多個子資料,例如可以將該特徵資料拆分為2、3或4個子資料。在實際應用中,所述第一設備可以將特徵資料和拆分參數進行求和處理,可以將求和結果拆分為多個子資料;從而實現利用該拆分參數將該特徵資料拆分為多個子資料。延續前面的場景示例,所述第一設備可以利用拆分參數
Figure 02_image014
將特徵資料
Figure 02_image018
拆分為子資料
Figure 02_image021
和子資料
Figure 02_image023
等2個子資料。 步驟S103:第一設備以所述多個子資料為輸入,第二設備以標簽資料集合中的標簽資料為輸入,進行不經意傳輸。 在一些實施例中,不經意傳輸(Oblivious Transfer,OT),又稱為茫然傳輸,是一種可以保護隱私的雙方通訊協議,能夠使通訊雙方以一種選擇模糊化的方式傳遞資料。發送方可以具有多個資料。經由不經意傳輸接收方能夠獲得所述多個資料中的一個或多個資料。在此過程中,發送方不知曉接收方接收的是哪些資料;而接收方不能夠獲得其所接收資料之外的其它任何資料。具體在本實施例中,第一設備可以以所述特徵資料中每個特徵資料拆分後所得到的多個子資料為輸入,第二設備可以以標簽資料集合中與該特徵資料相對應的標簽資料為輸入,進行不經意傳輸。透過不經意傳輸可以實現:第二設備從所述第一設備輸入的多個子資料中選擇目標子資料。其中,該特徵資料拆分後所得到的多個子資料可以視作第一設備在不經意傳輸過程中輸入的秘密資訊,與該特徵資料相對應的標簽資料可以視作第二設備在不經意傳輸過程中輸入的選擇資訊,這樣便可以實現第二設備選擇目標子資料。根據不經意傳輸的特性,所述第一設備並不知曉所述第二設備具體選擇哪個子資料作為目標子資料,所述第二設備也不能夠知曉除了所選擇的目標子資料以外的其它子資料。 延續前面的場景示例,以下介紹本場景示例中所述第一設備與所述第二設備進行不經意傳輸的過程。在本場景示例中,特徵資料
Figure 02_image018
拆分後所得到的子資料包括
Figure 02_image021
Figure 02_image023
。子資料
Figure 02_image021
Figure 02_image023
可以視作第一設備在不經意傳輸過程中輸入的秘密資訊。標簽資料
Figure 02_image007
可以視作第二設備在不經意傳輸過程中輸入的選擇資訊。標簽資料
Figure 02_image007
的取值可以取自0和1。透過不經意傳輸可以實現:當標簽資料
Figure 02_image007
的取值為0時,所述第二電子設備選擇子資料
Figure 02_image023
作為目標子資料;當標簽資料
Figure 02_image007
的取值為1時,所述第二電子設備選擇子資料
Figure 02_image021
作為目標子資料。此外,本領域技術人員應當能夠理解,此處的不經意傳輸過程僅為示例,在實際應用中不經意傳輸過程還可以有其它的變形或變化,這些變形或變化也在本說明書公開和保護的範圍內。請參閱圖4。不經意傳輸過程可以包括以下步驟。 步驟S1031:第一設備產生公鑰pk 和私鑰sk ;產生隨機數m 0 和隨機數m 1 。 所述公鑰pk 和所述私鑰sk 可以為具有對應關係的公私鑰對。 步驟S1032:第一設備向第二設備發送公鑰pk 隨機數m 0 和隨機數m 1 。 步驟S1033:第二設備接收隨機數m 0 和隨機數m 1 ;產生密鑰key;根據標簽資料
Figure 02_image007
的取值從隨機數m 0 和隨機數m 1 中選取隨機數;將選取的隨機數記為m b 。 當標簽資料
Figure 02_image007
的取值為0時,所述第二設備可以選取隨機數m 0 ;可以將選取的隨機數m 0 記為m b 。當標簽資料
Figure 02_image007
取值為1時,所述第二設備可以選取隨機數m 1 ;可以將選取的隨機數m 1 記為m b 。 步驟S1034:第二設備利用公鑰pk 對密鑰key進行加密;利用隨機數m b 對密鑰key的密文進行盲化處理。 所述第二設備可以利用公鑰pk 對密鑰key進行加密,得到密鑰key的密文;可以計算v =d +m b ,從而實現盲化處理。其中,v 表示盲化處理結果;d 表示密鑰key的密文。 步驟S1035:第二設備向第一設備發送盲化處理結果v 。 步驟S1036:第一設備接收盲化處理結果v ;利用隨機數m 0 和隨機數m 1 分別對盲化處理結果v 進行去盲化處理,得到v- m 0v- m 1 ;利用私鑰sk 分別對v- m 0v- m 1 進行解密,得到解密結果k ey0k ey1 。 第一設備可以計算v- m 0 ,以實現利用利用隨機數m 0 對盲化處理結果v 進行去盲化處理;可以計算v- m 1 ,以實現利用隨機數m 1 對盲化處理結果v 進行去盲化處理;可以利用私鑰skv- m 0 進行解密,得到解密結果k ey0 ;可以利用私鑰skv- m 1 進行解密,得到解密結果k ey1 。 步驟S1037:第一設備利用解密結果k ey0 加密子資料
Figure 02_image023
;利用解密結果k ey1 加密子資料
Figure 02_image021
。 步驟S1038:第一設備分別向第二設備發送子資料
Figure 02_image023
的密文和子資料
Figure 02_image021
的密文。 步驟S1039:第二設備分別接收子資料
Figure 02_image023
的密文和子資料
Figure 02_image021
的密文;嘗試利用密鑰key分別對子資料
Figure 02_image023
的密文和子資料
Figure 02_image021
的密文進行解密。 當標簽資料
Figure 02_image007
的取值為0時,m b =m 0 。因此所述第二設備可以利用密鑰key對子資料
Figure 02_image023
的密文進行成功解密,得到子資料
Figure 02_image023
;而無法利用密鑰key對子資料
Figure 02_image021
的密文進行成功解密。這樣便實現了當標簽資料
Figure 02_image007
的取值為0時,所述第二電子設備選擇子資料
Figure 02_image023
作為目標子資料。當標簽資料
Figure 02_image007
的取值為1時,m b =m 1 。因此所述第二設備可以利用密鑰key對子資料
Figure 02_image021
的密文進行成功解密,得到子資料
Figure 02_image021
;而無法利用密鑰key對子資料
Figure 02_image023
的密文進行成功解密。這樣便實現了當標簽資料
Figure 02_image007
的取值為1時,所述第二電子設備選擇子資料
Figure 02_image021
作為目標子資料。 步驟S105:第二設備對選擇的目標子資料進行求和處理,得到第一求和結果。 在一些實施例中,透過步驟S103,針對所述標簽資料集合中的每個標簽資料,所述第二設備可以選擇得到一個目標子資料。這樣所述第二設備選擇的目標子資料的數量可以與所述標簽資料集合中標簽資料的數量相同。所述第二設備可以對選擇的目標子資料進行求和處理,得到第一求和結果。 步驟S107:第一設備對所述拆分參數集合中的拆分參數進行求和處理,向所述第二設備發送求和結果。 延續前面的場景示例,所述第一設備可以計算
Figure 02_image034
。 步驟S109:第二設備接收所述第一設備發來的求和結果,作為第二求和結果。 步驟S111:第二設備基於所述第一求和結果和所述第二求和結果,計算統計指標。 在一些實施例中,所述第二設備可以對所述第一求和結果和所述第二求和結果進行求差值處理,得到統計指標。當然,此處的求差值處理僅為示例,在實際應用中所述第二設備還可以採用其它方式來計算統計指標。所述統計指標可以用於反映所述標簽資料集合中特定標簽資料所對應的特徵資料之和。所述統計指標可以作為計算參數供後續處理過程所使用。例如,在分箱場景中,所述第一設備可以根據所述統計指標並結合其它資訊一起計算分箱指標,所述分箱指標可以包括資訊價值(Information Value,IV)和證據權重(Weight of Evidence,Woe)等等。 延續前面的場景示例,由於子資料
Figure 02_image021
和子資料
Figure 02_image023
中均包含拆分參數
Figure 02_image014
,因此無論第二設備選擇子資料
Figure 02_image021
作為目標子資料,或者,選擇子資料
Figure 02_image023
作為目標子資料,目標子資料中均包含拆分參數
Figure 02_image014
。因此,透過對所述第一求和結果和所述第二求和結果進行求差值處理所獲得的統計指標,可以用於反映所述標簽資料集合中取值為1的標簽資料所對應的特徵資料之和。例如,所述特徵資料集合中的特徵資料可以為使用者的借貸金額。所述標簽資料集合中的標簽資料可以用於反映使用者是否繳納社保。標簽資料的取值0用於標識使用者沒有繳納社保;標簽資料的取值1用於標識使用者繳納社保。那麽,所述統計指標可以用於反映所有繳納社保的使用者的借貸金額之和。 本說明書實施例的資料處理方法,第一設備可以利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料。第一設備以所述多個子資料為輸入,第二設備以標簽資料集合中的標簽資料為輸入,進行不經意傳輸。所述第二設備可以對選擇的目標子資料進行求和處理,得到第一求和結果。所述第一設備可以對所述拆分參數集合中的拆分參數進行求和處理,向所述第二設備發送求和結果。所述第二設備可以接收求和結果作為第二求和結果;可以基於所述第一求和結果和所述第二求和結果,計算統計指標。這樣第一設備和第二設備可以在不洩漏自身擁有的資料的前提下,進行協作計算,完成資料指標的統計。 請參閱圖5。本說明書還提供資料處理方法的另一個實施例。該實施例以第一設備為執行主體,可以包括以下步驟。 步驟S21:利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料。 在一些實施例中,所述拆分參數集合可以是由所述第一設備產生的。所述拆分參數集合可以包括至少一個拆分參數。所述拆分參數可以為隨機數,用於對特徵資料進行拆分。所述特徵資料集合可以包括至少一個特徵資料,所述特徵資料可以用於反映業務對象的特徵。 在一些實施例中,針對所述特徵資料集合中的每個特徵資料,所述第一設備可以利用所述拆分參數集合中與該特徵資料相對應的拆分參數,將該特徵資料拆分為多個子資料,例如可以將該特徵資料拆分為2、3或4個子資料。 步驟S23:以所述多個子資料為輸入,與第二設備進行不經意傳輸。 在一些實施例中,所述第二設備可以提供有標簽資料集合。所述標簽資料集合可以包括至少一個標簽資料,所述標簽資料可以用於反映業務對象的類型。所述第一設備可以以所述多個子資料為輸入,所述第二設備可以以標簽資料集合中的標簽資料為輸入,進行不經意傳輸。具體地,所述第一設備可以以所述特徵資料中每個特徵資料拆分後所得到的多個子資料為輸入,所述第二設備可以以標簽資料集合中與該特徵資料相對應的標簽資料為輸入,進行不經意傳輸。透過不經意傳輸可以實現:第二設備從所述第一設備輸入的多個子資料中選擇目標子資料。其中,該特徵資料拆分後所得到的多個子資料可以視作第一設備在不經意傳輸過程中輸入的秘密資訊,與該特徵資料相對應的標簽資料可以視作第二設備在不經意傳輸過程中輸入的選擇資訊,這樣便可以實現第二設備選擇目標子資料。根據不經意傳輸的特性,所述第一設備並不知曉所述第二設備具體選擇哪個子資料作為目標子資料,所述第二設備也不能夠知曉除了所選擇的目標子資料以外的其它子資料。 步驟S25:對所述拆分參數集合中的拆分參數進行求和處理。 步驟S27:向所述第二設備發送求和結果。 本實施例的資料處理方法,第一設備可以利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料;可以以所述多個子資料為輸入,與第二設備進行不經意傳輸;可以對所述拆分參數集合中的拆分參數進行求和處理;可以向所述第二設備發送求和結果。這樣第一設備可以在不洩漏自身擁有的資料的前提下,向第二設備傳輸進行資料指標統計時所需的資料。 請參閱圖6。本說明書還提供資料處理方法的另一個實施例。該實施例以第二設備為執行主體,可以包括以下步驟。 步驟S31:以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從所述第一設備輸入的多個子資料中選擇目標子資料。 在一些實施例中,所述多個子資料可以基於拆分參數集合中的拆分參數得到,具體過程可以參見前面的實施例。所述第一設備可以以所述多個子資料為輸入,所述第二設備可以以標簽資料集合中的標簽資料為輸入,進行不經意傳輸。具體地,所述第一設備可以以特徵資料中每個特徵資料拆分後所得到的多個子資料為輸入,所述第二設備可以以標簽資料集合中與該特徵資料相對應的標簽資料為輸入,進行不經意傳輸。透過不經意傳輸可以實現:第二設備從所述第一設備輸入的多個子資料中選擇目標子資料。其中,該特徵資料拆分後所得到的多個子資料可以視作第一設備在不經意傳輸過程中輸入的秘密資訊,與該特徵資料相對應的標簽資料可以視作第二設備在不經意傳輸過程中輸入的選擇資訊,這樣便可以實現第二設備選擇目標子資料。根據不經意傳輸的特性,所述第一設備並不知曉所述第二設備具體選擇哪個子資料作為目標子資料,所述第二設備也不能夠知曉除了所選擇的目標子資料以外的其它子資料。 步驟S33:對選擇的目標子資料進行求和處理,得到第一求和結果。 在一些實施例中,針對所述標簽資料集合中的每個標簽資料,所述第二設備可以選擇得到一個目標子資料。這樣所述第二設備選擇的目標子資料的數量可以與所述標簽資料集合中標簽資料的數量相同。所述第二設備可以對選擇的目標子資料進行求和處理,得到第一求和結果。 步驟S35:接收所述第一設備發來的第二求和結果。 在一些實施例中,所述第一設備可以對所述拆分參數集合中的拆分參數進行求和處理;可以向所述第二設備發送求和結果。所述第二設備可以接收所述第一設備發來的求和結果,作為第二求和結果。 步驟S37:基於所述第一求和結果和所述第二求和結果,計算統計指標。 在一些實施例中,所述第二設備可以對所述第一求和結果和所述第二求和結果進行求差值處理,得到統計指標。所述統計指標可以用於反映所述標簽資料集合中特定標簽資料所對應的特徵資料之和。所述統計指標可以作為計算參數供後續處理過程所使用。例如,在分箱場景中,所述第一設備可以根據所述統計指標並結合其它資訊一起計算分箱指標,所述分箱指標可以包括資訊價值(Information Value,IV)和證據權重(Weight of Evidence,Woe)等。 本實施例的資料處理方法,第二設備可以以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從所述第一設備輸入的多個子資料中選擇目標子資料;可以對選擇的目標子資料進行求和處理,得到第一求和結果;可以接收所述第一設備發來的第二求和結果;可以基於所述第一求和結果和所述第二求和結果,計算統計指標。這樣第二設備可以在不洩漏自身擁有的資料的前提下,利用第一設備傳輸過來的資料,完成資料指標的統計。 請參閱圖7。本說明書還提供資料處理裝置的另一個實施例。該實施例可以應用於第一設備,具體可以包括以下單元。 拆分單元41,用於利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料; 傳輸單元43,用於以所述多個子資料為輸入,與第二設備進行不經意傳輸; 計算單元45,用於對所述拆分參數集合中的拆分參數進行求和處理; 發送單元47,用於向所述第二設備發送求和結果。 下面介紹本說明書電子設備的一個實施例。圖8是該實施例中一種電子設備的硬體結構示意圖。如圖8所示,所述電子設備可以包括一個或多個(圖中僅示出一個)處理器、記憶體和傳輸模組。當然,本領域普通技術人員可以理解,圖8所示的硬體結構僅為示意,其並不對上述電子設備的硬體結構造成限定。在實際中所述電子設備還可以包括比圖8所示更多或者更少的組件單元;或者,具有與圖8所示不同的配置。 所述記憶體可以包括高速隨機記憶體;或者,還可以包括非揮發性記憶體,例如一個或者多個磁性儲存裝置、快閃記憶體、或者其他非揮發性固態記憶體。當然,所述記憶體還可以包括遠程設置的網路記憶體。所述遠程設置的網路記憶體可以透過諸如網際網路、企業內部網、局域網、行動通訊網等網路連接至所述電子設備。所述記憶體可以用於儲存應用軟體的程式指令或模組,例如本說明書圖4所對應實施例的程式指令或模組。 所述處理器可以按任何適當的方式實現。例如,所述處理器可以採取例如微處理器或處理器以及儲存可由該(微)處理器執行的計算機可讀程式代碼(例如軟體或韌體)的計算機可讀媒體、邏輯閘、開關、專用積體電路(Application Specific Integrated Circuit,ASIC)、可程式化邏輯控制器和嵌入微控制器的形式等等。所述處理器可以讀取並執行所述記憶體中的程式指令或模組。 所述傳輸模組可以用於經由網路進行資料傳輸,例如經由諸如網際網路、企業內部網、局域網、行動通訊網等網路進行資料傳輸。 請參閱圖9。本說明書還提供資料處理裝置的另一個實施例。該實施例可以應用於第二設備,具體可以包括以下單元。 傳輸單元51,用於以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從所述第一設備輸入的多個子資料中選擇目標子資料,所述多個子資料基於拆分參數集合中的拆分參數得到; 第一計算單元53,用於對選擇的目標子資料進行求和處理,得到第一求和結果; 接收單元55,用於接收所述第一設備發來的第二求和結果,所述第二求和結果透過對所述拆分參數集合中的拆分參數進行求和處理得到; 第二計算單元57,用於基於所述第一求和結果和所述第二求和結果,計算統計指標。 下面介紹本說明書電子設備的一個實施例。圖8是該實施例中一種電子設備的硬體結構示意圖。如圖8所示,所述電子設備可以包括一個或多個(圖中僅示出一個)處理器、記憶體和傳輸模組。當然,本領域普通技術人員可以理解,圖8所示的硬體結構僅為示意,其並不對上述電子設備的硬體結構造成限定。在實際中所述電子設備還可以包括比圖8所示更多或者更少的組件單元;或者,具有與圖8所示不同的配置。 所述記憶體可以包括高速隨機記憶體;或者,還可以包括非揮發性記憶體,例如一個或者多個磁性儲存裝置、快閃記憶體、或者其他非揮發性固態記憶體。當然,所述記憶體還可以包括遠程設置的網路記憶體。所述遠程設置的網路記憶體可以透過諸如網際網路、企業內部網、局域網、行動通訊網等網路連接至所述電子設備。所述記憶體可以用於儲存應用軟體的程式指令或模組,例如本說明書圖5所對應實施例的程式指令或模組。 所述處理器可以按任何適當的方式實現。例如,所述處理器可以採取例如微處理器或處理器以及儲存可由該(微)處理器執行的計算機可讀程式代碼(例如軟體或韌體)的計算機可讀媒體、邏輯閘、開關、專用積體電路(Application Specific Integrated Circuit,ASIC)、可程式化邏輯控制器和嵌入微控制器的形式等等。所述處理器可以讀取並執行所述記憶體中的程式指令或模組。 所述傳輸模組可以用於經由網路進行資料傳輸,例如經由諸如網際網路、企業內部網、局域網、行動通訊網等網路進行資料傳輸。 需要說明的是,本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同或相似的部分互相參見即可,每個實施例重點說明的都是與其它實施例的不同之處。尤其,對於裝置實施例和電子設備實施例而言,由於其基本相似於資料處理方法實施例,所以描述的比較簡單,相關之處參見資料處理方法實施例的部分說明即可。 另外,可以理解的是,本領域技術人員在閱讀本說明書文件之後,可以無需進步性勞動想到將本說明書列舉的部分或全部實施例進行任意組合,這些組合也在本說明書公開和保護的範圍內。 在20世紀90年代,對於一個技術的改進可以很明顯地區分是硬體上的改進(例如,對二極體、電晶體、開關等電路結構的改進)還是軟體上的改進(對於方法流程的改進)。然而,隨著技術的發展,當今的很多方法流程的改進已經可以視為硬體電路結構的直接改進。設計人員幾乎都透過將改進的方法流程程式化到硬體電路中來得到相應的硬體電路結構。因此,不能說一個方法流程的改進就不能用硬體實體模組來實現。例如,可程式化邏輯裝置(Programmable Logic Device, PLD)(例如現場可程式化閘陣列(Field Programmable Gate Array,FPGA))就是這樣一種積體電路,其邏輯功能由使用者對裝置程式化來確定。由設計人員自行程式化來把一個數位系統“積體”在一片PLD上,而不需要請晶片製造廠商來設計和製作專用的積體電路晶片2。而且,如今,取代手工地製作積體電路晶片,這種程式化也多半改用 “邏輯編譯器(logic compiler)”軟體來實現,它與程式開發撰寫時所用的軟體編譯器相類似,而要編譯之前的原始代碼也得用特定的程式化語言來撰寫,此稱之為硬體描述語言(Hardware Description Language,HDL),而HDL 也並非僅有一種,而是有許多種,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language ) 與Verilog2。本領域技術人員也應該清楚,只需要將方法流程用上述幾種硬體描述語言稍作邏輯程式化並程式化到積體電路中,就可以很容易得到實現該邏輯方法流程的硬體電路。 上述實施例闡明的系統、裝置、模組或單元,具體可以由計算機晶片或實體實現,或者由具有某種功能的産品來實現。一種典型的實現設備為計算機。具體的,計算機例如可以為個人計算機、膝上型計算機、蜂巢式電話、相機電話、智慧型電話、個人數位助理、媒體播放器、導航設備、電子郵件設備、遊戲控制台、平板計算機、可穿戴設備或者這些設備中的任何設備的組合。 透過以上的實施方式的描述可知,本領域的技術人員可以清楚地瞭解到本說明書可借助軟體加必需的通用硬體平台的方式來實現。基於這樣的理解,本說明書的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體産品的形式體現出來,該計算機軟體産品可以儲存在儲存媒體中,如ROM/RAM、磁碟、光碟等,包括若干指令用以使得一台計算機設備(可以是個人計算機,伺服器,或者網路設備等)執行本說明書各個實施例或者實施例的某些部分所述的方法。 本說明書可用於衆多通用或專用的計算機系統環境或配置中。例如:個人計算機、伺服器計算機、手持設備或便攜式設備、平板型設備、多處理器系統、基於微處理器的系統、置頂盒、可程式化的消費電子設備、網路PC、小型計算機、大型計算機、包括以上任何系統或設備的分布式計算環境等等。 本說明書可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的例程、程式、對象、組件、資料結構等等。也可以在分布式計算環境中實踐本說明書,在這些分布式計算環境中,由透過通訊網路而被連接的遠程處理設備來執行任務。在分布式計算環境中,程式模組可以位於包括儲存設備在內的本地和遠程計算機儲存媒體中。 雖然透過實施例描繪了本說明書,本領域普通技術人員知道,本說明書有許多變形和變化而不脫離本說明書的精神,希望所附的申請專利範圍包括這些變形和變化而不脫離本說明書的精神。
S101:步驟 S103:步驟 S107:步驟 S109:步驟 S111:步驟 S1031:步驟 S1032:步驟 S1033:步驟 S1034:步驟 S1035:步驟 S1036:步驟 S1037:步驟 S1038:步驟 S1039:步驟 S105:步驟 41:拆分單元 43:傳輸單元 45:計算單元 47:發送單元 51:傳輸單元 53:第一計算單元 55:接收單元 57:第二計算單元
為了更清楚地說明本說明書實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本說明書中記載的一些實施例,對於本領域普通技術人員來講,在不付出進步性勞動性的前提下,還可以根據這些圖式獲得其他的圖式。 [圖1]為本說明書實施例一種資料處理系統的功能結構示意圖; [圖2]為本說明書實施例一種資料處理方法的流程圖; [圖3]為本說明書實施例一種不經驗傳輸方法的流程圖; [圖4]為本說明書實施例一種資料處理方法的示意圖; [圖5]為本說明書實施例一種資料處理方法的流程圖; [圖6]為本說明書實施例一種資料處理方法的流程圖; [圖7]為本說明書實施例一種資料處理裝置的功能結構示意圖; [圖8]為本說明書實施例一種電子設備的功能結構示意圖; [圖9]為本說明書實施例一種資料處理裝置的功能結構示意圖。

Claims (11)

  1. 一種資料處理方法,應用於第一設備,包括: 利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料; 以該多個子資料為輸入,與第二設備進行不經意傳輸; 對該拆分參數集合中的拆分參數進行求和處理; 向該第二設備發送求和結果。
  2. 如請求項1所述的方法,該拆分參數集合中的拆分參數和該特徵資料集合中的特徵資料之間具有對應關係; 相應地,該將特徵資料集合中的特徵資料拆分為多個子資料,包括: 針對該特徵資料集合中的每個特徵資料,利用該拆分參數集合中與該特徵資料相對應的拆分參數,將該特徵資料拆分為多個子資料。
  3. 如請求項1或2所述的方法,該拆分參數為隨機數。
  4. 一種資料處理裝置,應用於第一設備,包括: 拆分單元,用於利用拆分參數集合中的拆分參數,將特徵資料集合中的特徵資料拆分為多個子資料; 傳輸單元,以該多個子資料為輸入,與第二設備進行不經意傳輸; 計算單元,用於對該拆分參數集合中的拆分參數進行求和處理; 發送單元,用於向該第二設備發送求和結果。
  5. 一種電子設備,包括: 記憶體,用於儲存計算機指令; 處理器,用於執行該計算機指令以實現如請求項1-3中任一項該的方法步驟。
  6. 一種資料處理方法,應用於第二設備,包括: 以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從該第一設備輸入的多個子資料中選擇目標子資料,該多個子資料基於拆分參數集合中的拆分參數得到; 對選擇的目標子資料進行求和處理,得到第一求和結果; 接收該第一設備發來的第二求和結果,該第二求和結果透過對該拆分參數集合中的拆分參數進行求和處理得到; 基於該第一求和結果和該第二求和結果,計算統計指標。
  7. 如請求項6所述的方法,該統計指標用於反映該標簽資料集合中的特定標簽資料在特徵資料集合中所對應的特徵資料之和。
  8. 如請求項6所述的方法,該從該第一設備輸入的多個子資料中選擇目標子資料,包括: 針對該標簽資料集合中的每個標簽資料,以該標簽資料為輸入,與第一設備進行不經意傳輸,從該第一設備輸入的與該標簽資料相對應的多個子資料中選擇目標子資料;其中,與該標簽資料相對應的多個子資料透過對與該標簽資料相對應的特徵資料進行拆分得到。
  9. 如請求項6所述的方法,計算統計指標,包括: 對該第一求和結果和該第二求和結果進行求差值處理,得到統計指標。
  10. 一種資料處理裝置,應用於第二設備,包括: 傳輸單元,用於以標簽資料集合中的標簽資料為輸入,與第一設備進行不經意傳輸,從該第一設備輸入的多個子資料中選擇目標子資料,該多個子資料基於拆分參數集合中的拆分參數得到; 第一計算單元,用於對選擇的目標子資料進行求和處理,得到第一求和結果; 接收單元,用於接收該第一設備發來的第二求和結果,該第二求和結果透過對該拆分參數集合中的拆分參數進行求和處理得到; 第二計算單元,用於基於該第一求和結果和該第二求和結果,計算統計指標。
  11. 一種電子設備,包括: 記憶體,用於儲存計算機指令; 處理器,用於執行該計算機指令以實現如請求項6-9中任一項該的方法步驟。
TW109100162A 2019-04-19 2020-01-03 資料處理方法、裝置和電子設備 TWI728639B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910316475.4A CN110162551B (zh) 2019-04-19 2019-04-19 数据处理方法、装置和电子设备
CN201910316475.4 2019-04-19

Publications (2)

Publication Number Publication Date
TW202040399A true TW202040399A (zh) 2020-11-01
TWI728639B TWI728639B (zh) 2021-05-21

Family

ID=67639774

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109100162A TWI728639B (zh) 2019-04-19 2020-01-03 資料處理方法、裝置和電子設備

Country Status (3)

Country Link
CN (1) CN110162551B (zh)
TW (1) TWI728639B (zh)
WO (1) WO2020211485A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162551B (zh) * 2019-04-19 2020-08-14 阿里巴巴集团控股有限公司 数据处理方法、装置和电子设备
US10936605B2 (en) 2019-04-19 2021-03-02 Advanced New Technologies Co., Ltd. Providing oblivious data transfer between computing devices
CN110717186B (zh) * 2019-09-04 2023-06-23 创新先进技术有限公司 数据处理方法、装置和电子设备
CN110688670B (zh) * 2019-09-04 2023-06-23 创新先进技术有限公司 数据处理方法、装置和电子设备
CN112667608B (zh) * 2020-04-03 2022-01-25 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN112667741B (zh) * 2020-04-13 2022-07-08 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN111695675B (zh) * 2020-05-14 2024-05-07 平安科技(深圳)有限公司 联邦学习模型训练方法及相关设备
CN112134682B (zh) * 2020-09-09 2022-04-12 支付宝(杭州)信息技术有限公司 用于不经意传输ot扩展协议的数据处理方法及装置
CN112769786B (zh) * 2020-12-29 2022-11-01 杭州趣链科技有限公司 基于不经意传输规则的数据传输方法、装置和计算机设备
CN113821810B (zh) * 2021-08-26 2024-03-08 上海赢科信息技术有限公司 数据处理方法及系统、存储介质及电子设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7290150B2 (en) * 2003-06-09 2007-10-30 International Business Machines Corporation Information integration across autonomous enterprises
CN101266672A (zh) * 2007-03-14 2008-09-17 电子科技大学 一种涉及信誉值机制的基于Gradual Release的公平交换方法
CN101895530B (zh) * 2010-06-08 2012-11-21 安徽师范大学 一种基于点积协议的协议安全性量化方法及系统
US20140184803A1 (en) * 2012-12-31 2014-07-03 Microsoft Corporation Secure and Private Tracking Across Multiple Cameras
US10019709B2 (en) * 2015-06-22 2018-07-10 Bank Of America Corporation System of anonymous user creation based on oblivious transfer
US10791123B2 (en) * 2015-11-25 2020-09-29 Yaron Gvili Selectivity in privacy and verification with applications
CN107347096B (zh) * 2017-07-07 2019-09-27 安徽大学 一种基于云服务器的位置隐私保护方法
CN107451266A (zh) * 2017-07-31 2017-12-08 北京京东尚科信息技术有限公司 用于处理数据方法及其设备
CN108416221B (zh) * 2018-01-22 2021-05-14 西安电子科技大学 一种云环境中安全的相似数据拥有证明方案
CN108600159A (zh) * 2018-03-09 2018-09-28 潘科 一种工业控制系统信息安全防护系统
CN108809623B (zh) * 2018-07-10 2020-09-25 矩阵元技术(深圳)有限公司 安全多方计算方法、装置及系统
CN109255247B (zh) * 2018-08-14 2020-08-14 阿里巴巴集团控股有限公司 多方安全计算方法及装置、电子设备
CN109583224B (zh) * 2018-10-16 2023-03-31 蚂蚁金服(杭州)网络技术有限公司 一种用户隐私数据处理方法、装置、设备及系统
CN109543453B (zh) * 2018-11-30 2021-02-26 北京八分量信息科技有限公司 一种基于安全多方计算的订单信息处理方法、装置及系统
CN110162551B (zh) * 2019-04-19 2020-08-14 阿里巴巴集团控股有限公司 数据处理方法、装置和电子设备

Also Published As

Publication number Publication date
CN110162551A (zh) 2019-08-23
CN110162551B (zh) 2020-08-14
TWI728639B (zh) 2021-05-21
WO2020211485A1 (zh) 2020-10-22

Similar Documents

Publication Publication Date Title
TWI728639B (zh) 資料處理方法、裝置和電子設備
TWI684108B (zh) 資料統計方法和裝置
TWI730622B (zh) 資料處理方法、裝置和電子設備
TWI745861B (zh) 資料處理方法、裝置和電子設備
US8243983B2 (en) Graphically encoded data copy and paste
TWI740399B (zh) 資料處理方法、裝置和電子設備
TWI724809B (zh) 模型參數確定方法、裝置和電子設備
CN109214201B (zh) 一种数据共享方法、终端设备及计算机可读存储介质
CN110580409B (zh) 模型参数确定方法、装置和电子设备
CN110661618B (zh) 数据传输方法、装置和电子设备
TW202103154A (zh) 資料處理方法、裝置和電子設備
WO2021017424A1 (zh) 数据预处理方法、密文数据获取方法、装置和电子设备
CN108400868A (zh) 种子密钥的存储方法、装置及移动终端
US20230336344A1 (en) Data processing methods, apparatuses, and computer devices for privacy protection
CN111193741B (zh) 一种信息发送方法、信息获取方法、装置及设备
US11194824B2 (en) Providing oblivious data transfer between computing devices
CN110650119B (zh) 数据传输方法、装置和电子设备
CN110336669B (zh) 一种信息的加密方法、装置及电子设备
CN111046408A (zh) 判断结果处理方法、查询方法、装置、电子设备和系统
CN114726511B (zh) 数据处理方法和装置
CN112232639B (zh) 统计方法、装置和电子设备
TWI729697B (zh) 資料處理方法、裝置和電子設備
US20200186959A1 (en) Method and system for facilitating communication based on user interests and location
WO2021031828A1 (zh) 数据传输方法、装置和电子设备
WO2021027598A1 (zh) 模型参数确定方法、装置和电子设备