CN110909372A - 数据处理方法、装置、设备和介质 - Google Patents

数据处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN110909372A
CN110909372A CN201911214848.3A CN201911214848A CN110909372A CN 110909372 A CN110909372 A CN 110909372A CN 201911214848 A CN201911214848 A CN 201911214848A CN 110909372 A CN110909372 A CN 110909372A
Authority
CN
China
Prior art keywords
data
dictionary
data processing
provider
party
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911214848.3A
Other languages
English (en)
Inventor
刘昊骋
方灵鹏
李原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201911214848.3A priority Critical patent/CN110909372A/zh
Publication of CN110909372A publication Critical patent/CN110909372A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据处理方法、装置、设备和介质,涉及云计算技术领域。该方法由提供方执行,具体实现方案为:确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;根据所述数据字典对所述原始数据进行转换,得到转换数据;向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。本申请实施例数据字典中包括提供方确定的字段取值与候选数值之间的关联关系,数据字典为提供方每次发送数据前动态生成,非法机构无法进行破解,因此避免了非法机构反推得到原始数据的问题,增强了数据的安全性。

Description

数据处理方法、装置、设备和介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种云计算技术,具体涉及一种数据处理方法、装置、设备和介质。
背景技术
由于数据的不完备性,通过人工智能技术提升模型效果,往往需要融合多个机构的数据。但是,若将各机构的数据与其他机构共享,则数据的安全性难以保证,很可能造成数据泄露的问题。
目前在融合多个机构的数据进行模型训练的过程中,主要通过数据加密的方式避免数据泄露,但是存在通过数据密文解密得到数据原文的风险。并且,非法机构也可能会根据数据密文反推得到数据原文,例如,根据加密数据的占比估算各数值所对应的特定字段,以及特定字段数据的数量。
发明内容
本申请实施例提供的一种数据处理方法、装置、设备和介质,以实现提高各机构数据的安全性。
本申请实施例公开了一种数据处理方法,该方法由提供方执行,包括:
确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;
根据所述数据字典对所述原始数据进行转换,得到转换数据;
向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。
上述实施例具有如下优点或有益效果:由于数据字典中包括提供方确定的字段取值与候选数值之间的关联关系,数据字典为提供方每次发送数据前动态生成,非法机构无法进行破解,从而克服了对数据加密得到的加密数据容易被破解或反推得到原始数据的问题,实现了根据数据字典对原始数据进行转换以提高数据安全性的效果。
进一步地,单个所述字段取值所关联的候选数值数量大于数量阈值。
据此,上述实施例具有如下优点或有益效果:由于候选数值大于数量阈值,因此,字段取值所关联的候选取值可以为多个,非法机构无法确定其对应关系,难以进行根据候选取值进行反推得到与其对应的原始数据,因此提高了数据的安全性。
进一步地,根据所述数据字典对所述原始数据进行转换,包括:
针对每一原始数据,基于数据字典从该原始数据中字段取值所关联的候选数值中,为该原始数据中字段取值选择目标数值;
采用选择的目标数值替换该原始数据中的字段取值。
据此,上述实施例具有如下优点或有益效果:通过从候选数值中选择目标数值与字段取值进行对应,因此同一字段取值的目标数值可以不同,从而防止非法机构根据固定的对应关系反推出字段取值,造成原始数据泄露。
进一步地,根据所述数据字典对所述原始数据进行转换,还包括:
采用字段符号替换该原始数据中的字段标识。
据此,上述实施例具有如下优点或有益效果:由于字段标识被字段符号代替,因此,非法机构无法获知目标数值所对应的字段的含义,难以确定准确的原始数据,提高了数据的安全性。
进一步地,生成数据字典之后,还包括:对所述数据字典进行加密得到字典密文;
向第三方发送包括转换数据和数据字典信息的数据处理请求,包括:
向第三方发送包括转换数据和字典密文的数据处理请求。
据此,上述实施例具有如下优点或有益效果:通过将数据字典加密,并向第三方服务器发送转换数据和字典密文,从而保证数据传输中的安全性。
本申请实施例公开了一种数据处理方法,该方法由第三方执行,包括:
接收至少两个提供方发送的包括转换数据和数据字典信息的数据处理请求;其中,所述数据处理请求通过如下方式生成:确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;根据所述数据字典对所述原始数据进行转换,得到转换数据;
对至少两个提供方的数据进行处理,得到处理结果。
上述实施例具有如下优点或有益效果:由于接收的转换数据为根据数据字典进行转换得到的,因此能够保证接收的转换数据的安全性,并对数据进行处理,以实现对至少两个提供方的数据的融合处理。
进一步地,对至少两个提供方的数据进行处理,包括:
基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据;
对至少两个提供方的原始数据进行处理。
据此,上述实施例具有如下优点或有益效果:通过基于提供方的数据字典信息将转换信息转换为原始数据,从而保证了数据的安全性,避免数据被破解或反推得到原始数据,造成原始数据泄露。
进一步地,所述数据字典信息为字典密文;
基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据,包括:
对提供方的字典密文进行解密,得到提供方的数据字典;
基于提供方的数据字典,将从提供方获取的转换数据转换为原始数据。
据此,上述实施例具有如下优点或有益效果:通过对字典密文进行解密得到数据字典,从而使得到的数据字典更加安全可信。
进一步地,所述方法还包括:
通过web平台获取用户的数据处理指令;
若所述数据处理指令不属于所述web平台的候选指令,则拒绝所述数据处理指令。
据此,上述实施例具有如下优点或有益效果:由于第三方只根据用户选择的web平台中候选指令中的指令进行数据操作,因此避免用户非法访问数据造成数据泄露,保证了数据的安全性。
本申请实施例还公开了一种数据处理装置,配置于提供方,该装置包括:
数据字典生成模块,用于确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;
转换数据确定模块,用于根据所述数据字典对所述原始数据进行转换,得到转换数据;
数据处理请求发送模块,用于向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。
进一步地,单个所述字段取值所关联的候选数值数量大于数量阈值。
进一步地,所述转换数据确定模块,包括:
目标数值选择单元,用于针对每一原始数据,基于数据字典从该原始数据中字段取值所关联的候选数值中,为该原始数据中字段取值选择目标数值;
目标数值替换单元,用于采用选择的目标数值替换该原始数据中的字段取值。
进一步地,所述转换数据确定模块,还包括:
字段表示替换单元,用于采用字段符号替换该原始数据中的字段标识。
进一步地,生成数据字典之后,还包括:
加密模块,用于对所述数据字典进行加密得到字典密文;
所述数据处理请求发送模块具体用于:
向第三方发送包括转换数据和字典密文的数据处理请求。
本申请实施例还公开了一种数据处理装置,配置于第三方,该装置包括:
数据处理请求接收模块,用于接收至少两个提供方发送的包括转换数据和数据字典信息的数据处理请求;其中,所述数据处理请求通过如下方式生成:确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;根据所述数据字典对所述原始数据进行转换,得到转换数据;
数据处理模块,用于对至少两个提供方的数据进行处理,得到处理结果。
进一步地,所述数据处理模块,包括:
数据转换单元,用于基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据;
原始数据处理单元,用于对至少两个提供方的原始数据进行处理。
进一步地,所述数据字典信息为字典密文;
所述数据转换单元,包括:
解密子单元,用于对提供方的字典密文进行解密,得到提供方的数据字典;
转换数据转换子单元,用于基于提供方的数据字典,将从提供方获取的转换数据转换为原始数据。
进一步的,还包括:
数据处理指令获取模块,用于通过web平台获取用户的数据处理指令;
数据处理指令拒绝模块,用于若所述数据处理指令不属于所述web平台的候选指令,则拒绝所述数据处理指令。
本申请实施例还公开了一种电子设备,该设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例中任一项所述的由提供方执行的方法。
本申请实施例还公开了一种电子设备,该设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例中任一项所述的由第三方执行的方法。
本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例中任一项所述的由提供方执行的方法。
本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例中任一项所述的由第三方执行的方法。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例提供的由提供方执行的数据处理方法的流程示意图;
图2是根据本申请实施例提供的数据处理过程示意图;
图3是根据本申请实施例提供的另一种由提供方执行的数据处理方法的流程示意图;
图4是根据本申请实施例提供的由第三方执行的数据处理方法的流程示意图;
图5是根据本申请实施例提供的模型应用过程示意图;
图6是根据本申请实施例提供的配置于提供方的数据处理装置的结构示意图;
图7是根据本申请实施例提供的配置于第三方的数据处理装置的结构示意图;
图8是用来实现本申请实施例的数据处理方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请实施例提供的由提供方执行的数据处理方法的流程示意图。本实施例可适用于对至少两个提供方的数据进行处理的情况。典型地,本实施例可以适用于将至少两个提供方的原始数据进行转换,并发送至第三方进行融合处理的情况。本实施公开的数据处理方法可以由一种数据处理装置来执行,该装置可以由软件和/或硬件的方式实现,配置于提供方。参见图1,本实施例提供的由提供方执行的数据处理方法包括:
S110、确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典。
其中,原始数据为提供方所提供的数据,例如表示用户信息的结构化数据。字段用于描述数据的特征,字段取值为数据的具体特征值,候选数值可以根据实际情况确定,可以为任意实数,例如0、1、2、3、……,也可以为字母等,例如a、b、c、d……。
为了保证数据的安全性,目前的方法为对数据进行加密,但是加密数据可能会被破解,导致原始数据的泄露。因此,本申请实施例中,提供方在向第三方发送数据之前,确定原始数据中字段取值所关联的候选数值,并根据字段取值和候选数值之间的关联关系生成数据字典。由于在提供方每次发送数据之前都生成数据字典,数据字典是动态生成的,因此,非法机构难以确定数据字典中对应关系变化的规律,无法利用数据字典进行数据破解。
可选的,单个所述字段取值所关联的候选数值数量大于数量阈值。具体的,数量阈值可以根据实际情况进行设定,可以设置数量阈值为10,每个字段取值所关联的候选数值大于10个,例如,对于字段取值“男”,可以确定其关联的候选数值为“0、1、2、3、4、5、6、7、8、9、10”,对于字段取值“性别女”,可以确定其关联的候选取值为“11、12、13、14、15、16、17、18、19、20、21”。通过使字段取值关联的候选数值数量大于数量阈值,字段取值并不是关联一个候选取值,因此非法机构难以确定字段取值与候选数值之间的关联关系,无法根据候选数值反推得到字段取值,保证了原始数据的安全性。
S120、根据所述数据字典对所述原始数据进行转换,得到转换数据。
具体的,为了防止向第三方发送原始数据之后,原始数据被破解获取,需要对原始数据进行处理。在本申请实施例中,根据生成的数据字典对原始数据进行转换,得到转换数据。由于提供方在每次向第三方发送原始数据之前,都动态生成数据字典,例如,提供方第一次向第三方发送数据之前,确定的字段取值“男”关联的候选取值为“0、1、2、3、4、5、6、7、8、9、10”,提供方第二次向第三方发送数据之前,确定的字段取值“男”关联的候选取值为“a、b、c、d、e、f、g、h、i、j、k”,字段取值与候选数值的关联关系并不固定,根据动态生成的数据字典对原始数据转换得到的转换数据不唯一,因此非法机构难以确定具体的关联关系以及变化规律,无法对转换数据进行破解。
S130、向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。
具体的,向第三方发送包括转换数据和数据字典信息的数据处理请求,从而使第三方可以根据数据字典将转换数据还原为原始数据,便于对原始数据进行处理。
示例性的,如图2所示,第三方对至少两个提供方的数据进行处理可以为,基于机器学习算法对数据进行训练,得到预测模型。预测模型可以保存于第三方,用于接收提供方的数据,基于该预测模型对数据进行预测,并将预测结果返回给提供方。需要说明的是,图2中只是以提供方为两个的情况进行说明,但本申请实施例中的提供方并不限于两个,也可以是多个。
可选的,生成数据字典之后,还包括:对所述数据字典进行加密得到字典密文;向第三方发送包括转换数据和数据字典信息的数据处理请求,包括:向第三方发送包括转换数据和字典密文的数据处理请求。
示例性的,为了保证数据字典在传输过程中的安全性,在生成数据字典之后,对数据字典进行加密,得到字典密文。加密方式可以为MD5加密(Message-Digest Algorithm 5,信息-摘要算法)、SHA1加密(Secure Hash Algorithm,安全哈希算法)和对称密钥加密等方式,在本申请实施例中不作具体限定。向第三方发送包含转换数据和字典密文的数据处理请求,以由第三方解密字典密文得到数据字典,根据数据字典将转换数据还原为原始数据。
本申请实施例的技术方案,由于数据字典中包括提供方确定的字段取值与候选数值之间的关联关系,数据字典为提供方每次发送数据前动态生成,非法机构无法进行破解,从而克服了对数据加密得到的加密数据容易被破解或反推得到原始数据的问题,实现了根据数据字典对原始数据进行转换以提高数据安全性的效果。
图3是根据本申请实施例提供的另一种由提供方执行的数据处理方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图3,本实施例提供的数据处理方法包括:
S210、在确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典。
S220、针对每一原始数据,基于数据字典从该原始数据中字段取值所关联的候选数值中,为该原始数据中字段取值选择目标数值。
示例性的,为了对原始数据中的字段取值进行转换,因此基于数据字典从字段取值关联的候选数值中,选择目标数值,作为与该字段取值关联的目标数值。示例性的,字段取值“男”关联的候选数值为“0、1、2、3、4、5、6、7、8、9、10”,对于第一原始数据中的字段取值“男”,可以选择其中的任一个数值作为目标数值,例如“5”。对于第二原始数据中的字段取值“男”可以选择其中的任意数值作为目标数值,例如“8”,同一个字段取值的目标数值可以不同。由于字段取值与目标数值并不是固定的一一对应关系,因此非法机构难以确定字段取值与目标数值之间的对应关系,无法通过目标数值反推得到字段取值,从而保证了原始数据的安全性。
S230、采用选择的目标数值替换该原始数据中的字段取值。
示例性的,对于原始数据中的字段取值“男”,在向第三方发送该原始数据时,不直接发送包含字段取值“男”的数据,而是用目标数值“5”替换字段取值“男”,从而使传输的数据中隐藏了字段取值,避免原始数据的字段取值泄露,从而保证原始数据的安全性。
S240、采用字段符号替换该原始数据中的字段标识,得到转换数据。
示例性的,为了提高原始数据的安全性,在本申请实施例中,将原始数据中的字段标识进行隐藏处理,采用字段符号替换原始数据中的字段标识,从而得到转换数据。例如,用“X1”替换字段标识“性别”,从而得到的转换数据为“X1:5、12、21、17、3、9、11”。通过采用字段符号替换原始数据中的字段标识,从而避免非法机构获知原始数据传输的具体字段,导致字段标识被泄露。
S250、向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。
需要说明的是,在本申请实施例中,可以直接对字段符号以及对应的字段取值进行处理,也可以根据字段符号和字段标识的对应关系,对字段符号进行还原后得到字段标识,对字段标识以及对应的字段取值进行处理,由于在模型训练中可以选择xgboost(Extreme Gradient Boosting,极端梯度提升)算法,采用该算法进行模型训练时不需要对字段进行区分,因此字段的表示形式并不对本申请实施例中的模型训练过程存在影响。
本申请实施例,通过针对每一原始数据,基于数据字典从该原始数据中字段取值所关联的候选数值中,为该原始数据中字段取值选择目标数值,采用选择的目标数值替换该原始数据中的字段取值,使字段取值对应的目标数值不同且不固定,从而使非法机构难以确定字段取值与目标数值之间的对应关系,从而保证了原始数据的安全性,通过采用字段符号替换该原始数据中的字段标识,得到转换数据,从而避免非法机构获知原始数据传输的具体字段,导致字段标识被泄露。
图4是根据本申请实施例提供的由第三方执行的数据处理方法的流程示意图。本实施例可适用于对至少两个提供方的数据进行处理的情况。典型地,本实施例可以适用于将至少两个提供方的原始数据进行转换,并发送至第三方进行融合处理的情况。本实施公开的数据处理方法可以由一种数据处理装置来执行,该装置可以由软件和/或硬件的方式实现,配置于第三方。其中,未详尽描述的内容详见上述实施例,参见图4,本实施例提供的由第三方执行的数据处理方法包括:
S310、接收至少两个提供方发送的包括转换数据和数据字典信息的数据处理请求。
其中,所述数据处理请求通过如下方式生成:确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;根据所述数据字典对所述原始数据进行转换,得到转换数据。
示例性的,由于需要多个机构的数据进行模型训练,因此,第三方接收至少两个提供方发送的包括转换数据和数据字典的数据处理请求。为了保证原始数据的安全性,原始数据并不直接包含于数据处理请求中,而是确定原始数据字段取值关联的候选数值,根据字段取值与候选数值之间的关联关系生成数据字典,并根据数据字典对原始数据进行转换,得到转换数据,根据转换数据和数据字典生成数据处理请求,并由第三方接收数据处理请求。
S320、对至少两个提供方的数据进行处理,得到处理结果。
示例性的,第三方对至少两个提供方的数据进行处理,得到处理结果,从而实现对至少两个提供方的数据进行融合处理,以提升模型的效果。
可选的,对至少两个提供方的数据进行处理,包括:基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据;对至少两个提供方的原始数据进行处理。
示例性的,为了对提供方的原始数据进行处理,需要对接收到的转换数据转换,以得到原始数据。由于转换数据是由原始数据根据数据字典信息转换得到的,因此,第三方根据接收到的数据字典信息对转换数据进行还原,得到原始数据,并对得到的至少两个提供方提供的原始数据进行融合后处理。
可选的,所述数据字典信息为字典密文;基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据,包括:对提供方的字典密文进行解密,得到提供方的数据字典;基于提供方的数据字典,将从提供方获取的转换数据转换为原始数据。
为了提高转换数据和数据字典在传输过程中的安全性,因此,对生成的数据字典进行加密得到字典密文。第三方对字典密文进行解密,从而得到数据字典,以便根据数据字典,将数据处理请求中的转换数据还原为原始数据。
示例性的,如图5所示,在应用过程中,第三方根据至少两个提供方的数据进行模型训练后得到预测模型,第三方接收各机构发送的数据,并基于预测模型对数据进行预测,得到预测得分,将预测得分对外输出给各提供方,从而实现将全流程封装成不可编辑的组件,不产生中间数据,直接将结果返回给个提供方。图5中只是以提供方为两个的情况进行说明,但本申请实施例中的提供方并不限于两个,也可以是多个。
可选的,所述方法还包括:通过web平台获取用户的数据处理指令;若所述数据处理指令不属于所述web平台的候选指令,则拒绝所述数据处理指令。
示例性的,若用户直接访问第三方,获取其中的数据,则可能会导致第三方中各提供方的数据泄露,因此,在本申请实施例中,用户只可以通过web平台发送数据处理指令,例如,在web平台中提供候选指令,候选指令为只可以对第三方中的结果数据进行简单处理的指令,并不可以直接访问第三方中的数据,用户可以从候选指令中选择指令,并基于选择的指令触发第三方执行数据处理的操作,得到操作的结果,反馈至用户。若用户发送的数据处理指令不属于web平台中的候选指令,则第三方拒绝数据处理指令,不对数据进行操作,以保证第三方中数据的安全性,避免数据被恶意访问或窃取。
本申请实施例的技术方案,通过接收提供方发送的转换数据和数据字典信息,并根据数据字典信息将转换数据还原为原始数据,对原始数据进行处理,从而实现在保证数据安全的前提下,对多个提供方的数据进行融合处理,并通过web平台接收用户从候选指令中选择的数据处理指令,根据候选指令对数据进行处理,从而避免了用户对数据的恶意获取和操作,从而保证了第三方中数据的安全性。
图6是根据本申请实施例提供的配置于提供方的数据处理装置的结构示意图。参见图6,本申请实施例公开了一种数据处理装置400,该装置400包括:数据字典生成模块401、转换数据确定模块402和数据处理请求发送模块403。
其中,数据字典生成模块401,用于确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典。
转换数据确定模块402,用于根据所述数据字典对所述原始数据进行转换,得到转换数据。
数据处理请求发送模块403,用于向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。
进一步地,单个所述字段取值所关联的候选数值数量大于数量阈值。
进一步地,所述转换数据确定模块402,包括:
目标数值选择单元,用于针对每一原始数据,基于数据字典从该原始数据中字段取值所关联的候选数值中,为该原始数据中字段取值选择目标数值。
目标数值替换单元,用于采用选择的目标数值替换该原始数据中的字段取值。
进一步地,所述转换数据确定模块402,还包括:
字段表示替换单元,用于采用字段符号替换该原始数据中的字段标识。
进一步地,生成数据字典之后,还包括:
加密模块,用于对所述数据字典进行加密得到字典密文。
所述数据处理请求发送模块403具体用于:
向第三方发送包括转换数据和字典密文的数据处理请求。
本申请实施例所提供的数据处理装置可执行本申请任意实施例所提供的由提供方执行的数据处理方法,具备执行方法相应的功能模块和有益效果。
图7是根据本申请实施例提供的配置于第三方的数据处理装置的结构示意图。参见图7,本申请实施例公开了一种数据处理装置500,该装置500包括:数据处理请求接收模块501和数据处理模块502。
其中,数据处理请求接收模块501,用于接收至少两个提供方发送的包括转换数据和数据字典信息的数据处理请求;其中,所述数据处理请求通过如下方式生成:确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;根据所述数据字典对所述原始数据进行转换,得到转换数据。
数据处理模块502,用于数据处理模块,用于对至少两个提供方的数据进行处理,得到处理结果。
进一步地,所述数据处理模块502,包括:
数据转换单元,用于基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据。
原始数据处理单元,用于对至少两个提供方的原始数据进行处理。
进一步地,所述数据字典信息为字典密文。
所述数据转换单元,包括:
解密子单元,用于对提供方的字典密文进行解密,得到提供方的数据字典。
转换数据转换子单元,用于基于提供方的数据字典,将从提供方获取的转换数据转换为原始数据。
进一步的,还包括:
数据处理指令获取模块,用于通过web平台获取用户的数据处理指令。
数据处理指令拒绝模块,用于若所述数据处理指令不属于所述web平台的候选指令,则拒绝所述数据处理指令。
本申请实施例所提供的数据处理装置可执行本申请任意实施例所提供的由第三方执行的数据处理方法,具备执行方法相应的功能模块和有益效果。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图8所示,图8是用来实现本申请实施例的数据处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图8所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的由提供方执行的数据处理方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的由提供方执行的数据处理方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的由提供方执行的数据处理的方法对应的程序指令/模块(例如,图6所示的数据字典生成模块401、转换数据确定模块402和数据处理请求发送模块403)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的由提供方执行的数据处理方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据数据处理的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至数据处理电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
数据处理方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图8中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与数据处理的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请的实施例,本申请还提供了另一种电子设备和一种可读存储介质。
所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行由第三方执行的数据处理方法。
所述可读存储介质终存储有计算机指令,用于使计算机执行由第三方执行的数据处理方法。
另一种电子设备和一种可读存储介质的框图和具体解释见上述实施例,与执行由提供方执行的数据处理方法的电子设备和可读存储介质的具体解释相同。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (15)

1.一种数据处理方法,其特征在于,由提供方执行,所述方法包括:
确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;
根据所述数据字典对所述原始数据进行转换,得到转换数据;
向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。
2.根据权利要求1所述的方法,其特征在于,单个所述字段取值所关联的候选数值数量大于数量阈值。
3.根据权利要求1所述的方法,其特征在于,根据所述数据字典对所述原始数据进行转换,包括:
针对每一原始数据,基于数据字典从该原始数据中字段取值所关联的候选数值中,为该原始数据中字段取值选择目标数值;
采用选择的目标数值替换该原始数据中的字段取值。
4.根据权利要求3所述的方法,其特征在于,根据所述数据字典对所述原始数据进行转换,还包括:
采用字段符号替换该原始数据中的字段标识。
5.根据权利要求1所述的方法,其特征在于,生成数据字典之后,还包括:对所述数据字典进行加密得到字典密文;
向第三方发送包括转换数据和数据字典信息的数据处理请求,包括:
向第三方发送包括转换数据和字典密文的数据处理请求。
6.一种数据处理方法,其特征在于,由第三方执行,所述方法包括:
接收至少两个提供方发送的包括转换数据和数据字典信息的数据处理请求;其中,所述数据处理请求通过如下方式生成:确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;根据所述数据字典对所述原始数据进行转换,得到转换数据;
对至少两个提供方的数据进行处理,得到处理结果。
7.根据权利要求6所述的方法,其特征在于,对至少两个提供方的数据进行处理,包括:
基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据;
对至少两个提供方的原始数据进行处理。
8.根据权利要求7所述的方法,其特征在于,所述数据字典信息为字典密文;
基于提供方的数据字典信息,将从提供方获取的转换数据转换为原始数据,包括:
对提供方的字典密文进行解密,得到提供方的数据字典;
基于提供方的数据字典,将从提供方获取的转换数据转换为原始数据。
9.根据权利要求6所述的方法,其特征在于,所述方法还包括:
通过web平台获取用户的数据处理指令;
若所述数据处理指令不属于所述web平台的候选指令,则拒绝所述数据处理指令。
10.一种数据处理装置,其特征在于,配置于提供方,所述装置包括:
数据字典生成模块,用于确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;
转换数据确定模块,用于根据所述数据字典对所述原始数据进行转换,得到转换数据;
数据处理请求发送模块,用于向第三方发送包括转换数据和数据字典信息的数据处理请求,所述数据处理请求用于指示第三方对至少两个提供方的数据进行处理。
11.一种数据处理装置,其特征在于,配置于第三方,所述装置包括:
数据处理请求接收模块,用于接收至少两个提供方发送的包括转换数据和数据字典信息的数据处理请求;其中,所述数据处理请求通过如下方式生成:确定原始数据中字段取值所关联的候选数值,并根据字段取值与候选数值之间的关联关系生成数据字典;根据所述数据字典对所述原始数据进行转换,得到转换数据;
数据处理模块,用于对至少两个提供方的数据进行处理,得到处理结果。
12.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的由提供方执行的方法。
13.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求6-9中任一项所述的由第三方执行的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的由提供方执行的方法。
15.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求6-9中任一项所述的由第三方执行的方法。
CN201911214848.3A 2019-12-02 2019-12-02 数据处理方法、装置、设备和介质 Pending CN110909372A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911214848.3A CN110909372A (zh) 2019-12-02 2019-12-02 数据处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911214848.3A CN110909372A (zh) 2019-12-02 2019-12-02 数据处理方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN110909372A true CN110909372A (zh) 2020-03-24

Family

ID=69821647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911214848.3A Pending CN110909372A (zh) 2019-12-02 2019-12-02 数据处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN110909372A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112069773A (zh) * 2020-07-23 2020-12-11 北京三快在线科技有限公司 数据处理系统、方法、装置、电子设备和计算机可读介质
CN112150557A (zh) * 2020-09-14 2020-12-29 北京百度网讯科技有限公司 用于路侧感知相机数据流的众数获取方法、装置及介质
CN112800730A (zh) * 2021-01-28 2021-05-14 中国工商银行股份有限公司 报表填报方法及装置
CN113067694A (zh) * 2021-03-31 2021-07-02 支付宝(杭州)信息技术有限公司 一种通信优化的双方安全比较方法、装置以及设备
CN115118778A (zh) * 2022-06-28 2022-09-27 中国农业银行股份有限公司 一种数据处理方法、装置、设备及介质
CN115392485A (zh) * 2022-08-26 2022-11-25 上海人工智能创新中心 一种用于深度学习框架的数据处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107395620A (zh) * 2017-08-17 2017-11-24 无锡清华信息科学与技术国家实验室物联网技术中心 一种基于随机字节映射的网络传输加密解密方法
CN108734024A (zh) * 2018-05-11 2018-11-02 四川长虹电器股份有限公司 一种基于字典映射的高效数据库加密方法
CN110471908A (zh) * 2019-08-21 2019-11-19 北京百度网讯科技有限公司 一种联合建模方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107395620A (zh) * 2017-08-17 2017-11-24 无锡清华信息科学与技术国家实验室物联网技术中心 一种基于随机字节映射的网络传输加密解密方法
CN108734024A (zh) * 2018-05-11 2018-11-02 四川长虹电器股份有限公司 一种基于字典映射的高效数据库加密方法
CN110471908A (zh) * 2019-08-21 2019-11-19 北京百度网讯科技有限公司 一种联合建模方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112069773A (zh) * 2020-07-23 2020-12-11 北京三快在线科技有限公司 数据处理系统、方法、装置、电子设备和计算机可读介质
CN112150557A (zh) * 2020-09-14 2020-12-29 北京百度网讯科技有限公司 用于路侧感知相机数据流的众数获取方法、装置及介质
CN112150557B (zh) * 2020-09-14 2024-04-19 阿波罗智联(北京)科技有限公司 用于路侧感知相机数据流的众数获取方法、装置及介质
CN112800730A (zh) * 2021-01-28 2021-05-14 中国工商银行股份有限公司 报表填报方法及装置
CN113067694A (zh) * 2021-03-31 2021-07-02 支付宝(杭州)信息技术有限公司 一种通信优化的双方安全比较方法、装置以及设备
CN115118778A (zh) * 2022-06-28 2022-09-27 中国农业银行股份有限公司 一种数据处理方法、装置、设备及介质
CN115118778B (zh) * 2022-06-28 2024-06-07 中国农业银行股份有限公司 一种数据处理方法、装置、设备及介质
CN115392485A (zh) * 2022-08-26 2022-11-25 上海人工智能创新中心 一种用于深度学习框架的数据处理方法及系统
CN115392485B (zh) * 2022-08-26 2024-06-11 上海人工智能创新中心 一种用于深度学习框架的数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN110909372A (zh) 数据处理方法、装置、设备和介质
CN111683071B (zh) 区块链的隐私数据处理方法、装置、设备以及存储介质
CN111125763B (zh) 隐私数据的处理方法、装置、设备和介质
CN111131317B (zh) 一种基于区块链的数据处理方法、装置、设备和介质
CN111934872B (zh) 密钥处理方法、装置、电子设备以及存储介质
CN111310216B (zh) 区块链数据处理方法、装置、电子设备和介质
CN111565109A (zh) 一种区块链的密钥处理方法、装置、设备和介质
CN112016110B (zh) 用于存储数据的方法、装置、设备以及存储介质
CN112016632B (zh) 模型联合训练方法、装置、设备和存储介质
CN111339569A (zh) 区块链数据处理方法、装置、电子设备和介质
CN111310204A (zh) 数据处理的方法及装置
CN110610101A (zh) 一种数据存证方法、装置、设备及存储介质
CN111464297A (zh) 基于区块链的事务处理方法、装置、电子设备和介质
CN112989400A (zh) 一种隐私事务处理方法、装置、电子设备和介质
CN111193741B (zh) 一种信息发送方法、信息获取方法、装置及设备
CN114363088B (zh) 用于请求数据的方法和装置
CN111459672B (zh) 基于区块链网络的事务处理方法、装置、设备及介质
CN111400743B (zh) 基于区块链网络的事务处理方法、装置、电子设备和介质
CN110536283B (zh) 终端标识获取方法、装置、电子设备和介质
CN111371773A (zh) 一种信息发送和显示方法、装置、设备及存储介质
CN112417326A (zh) Url的转换方法和装置、电子设备和存储介质
CN111339571B (zh) 一种区块链密钥管理方法、装置、设备和存储介质
CN111371557A (zh) 区块链数据处理方法、装置、电子设备及介质
CN114996169B (zh) 设备诊断方法、装置、电子设备及存储介质
CN112995205B (zh) 基于区块链的查询方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200324

RJ01 Rejection of invention patent application after publication