CN114091090A - 一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质 - Google Patents

一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN114091090A
CN114091090A CN202010778938.1A CN202010778938A CN114091090A CN 114091090 A CN114091090 A CN 114091090A CN 202010778938 A CN202010778938 A CN 202010778938A CN 114091090 A CN114091090 A CN 114091090A
Authority
CN
China
Prior art keywords
data
model
sensor
new data
label category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010778938.1A
Other languages
English (en)
Inventor
黄信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ennew Digital Technology Co Ltd
Original Assignee
Ennew Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ennew Digital Technology Co Ltd filed Critical Ennew Digital Technology Co Ltd
Priority to CN202010778938.1A priority Critical patent/CN114091090A/zh
Priority to PCT/CN2021/101138 priority patent/WO2022028131A1/zh
Priority to JP2022520859A priority patent/JP2023535851A/ja
Publication of CN114091090A publication Critical patent/CN114091090A/zh
Priority to US17/711,048 priority patent/US20220229904A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/556Detecting local intrusion or implementing counter-measures involving covert channels, i.e. data leakage between processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y40/00IoT characterised by the purpose of the information processing
    • G16Y40/50Safety; Security of things, users, data or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/259Fusion by voting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/03Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
    • G06F2221/034Test or assess a computer or a system

Abstract

本发明适用于物联网技术领域,提供了一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质,该方法包括:获取预设物联设备的传感数据;通过传感数据对每个传感器对应的初始数据模型进行训练,获得每个传感器对应的中间数据模型,并将每个传感器对应的中间数据模型集合形成集合数据模型;通过集合数据模型和随机噪声对新数据进行处理,获取新数据对应的标签类别;根据新数据以及所述新数据的标签类别,对集合数据模型进行训练,获取数据模型。本发明提供的基于隐私保护的数据处理模型获取方法通过在多个传感器数据上构建多个模型,集成所有模型并加入噪声扰动的方法,从而解决了物联网数据隐私保护性差的技术问题。

Description

一种基于隐私保护的数据处理模型获取方法、装置、终端设备 及存储介质
技术领域
本发明属于物联网技术领域,尤其涉及一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质。
背景技术
目前,物联网已成为互联网的一个重要组成部分,全球物联网设备数量保持高速增长,在未来的物联网中由于任何个人、团体、社区、组织、对象、产品、数据、服务、进程和活动都将通过物联网相互互联,而物联网中的个人数据隐私与商业机密成为制约物联网发展的重要短板,目前关于物联网安全与隐私技术的研究和解决方案并没有起到很好的保障作用,物联网安全隐患引起越来越多的担忧。传统中心化的深度学习要求用户将数据提交到一个数据中心,然后,由云服务器统一进行训练。然而,这些数据很可能会被模型训练者滥用,推测出更多有关用户的隐私信息。
发明内容
有鉴于此,本发明实施例提供了一种基于隐私保护的数据处理模型获取方法、装置、终端设备及计算机可读存储介质,旨在解决物联网数据隐私保护性差的技术问题。
本发明实施例的第一方面,提供了一种基于隐私保护的数据处理模型获取方法,包括:
获取预设物联设备的多个传感器的传感数据;
通过所述传感器对应的传感数据对每个所述传感器对应的初始数据模型进行训练,获得每个所述传感器对应的中间数据模型,并将每个所述传感器对应的中间数据模型集合形成集合数据模型;
通过所述集合数据模型和随机噪声对新数据进行处理,获取所述新数据对应的标签类别;
根据所述新数据以及所述新数据的标签类别,对所述集合数据模型进行训练,获取数据模型。
本发明实施例的第二方面,提供了一种基于隐私保护的数据处理模型获取装置,包括:
数据采集模块,获取预设物联设备的多个传感器的传感数据;
数据集成模块,通过所述传感器对应的传感数据对每个所述传感器对应的初始数据模型进行训练,获得每个所述传感器对应的中间数据模型,并将每个所述传感器对应的中间数据模型集合形成集合数据模型;
噪声添加模块,通过所述集合数据模型和随机噪声对新数据进行处理,获取所述新数据对应的标签类别;
数据处理模块,根据所述新数据以及所述新数据的标签类别,对所述集合数据模型进行训练,获取数据模型。
本发明实施例的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述基于隐私保护的数据处理模型获取方法的步骤。
本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述基于隐私保护的数据处理模型获取方法的步骤。
本发明实施例提供的一种基于隐私保护的数据处理模型获取方法的有益效果至少在于:本发明实施例首先通过获取传感数据,用传感器数据对初始模型进行训练,获得对应的中间数据模型,集合形成集合数据模型,其次通过集合数据模型和随机噪声对新数据进行处理,获取新数据对应的标签类别,最后用新数据以及对应的标签类别,对集合数据模型进行训练,获取数据模型,使得多个参与者可以构建机器学习模型而无需共享数据。本发明在多个传感器数据上构建多个模型,集成所有模型并加入噪声扰动的方法,最终得到一个综合的结果,以此来获得比单个传感器模型更好的表现效果。通过在模型中加入噪声,引入了一定程度的不确定性,以充分掩盖任何个人用户、任何物联个体的贡献,保护了参与者隐私,从而解决了物联网数据隐私保护性差的技术问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的基于隐私保护的数据处理模型获取方法的实现流程示意图;
图2是本发明实施例提供的通过集合数据模型和随机噪声对新数据进行处理,获取新数据对应的标签类别的实现流程示意图;
图3是本发明实施例提供的根据新数据以及新数据的标签类别,对集合数据模型进行训练,获取数据模型的实现流程示意图;
图4是本发明实施例提供的基于隐私保护的数据处理模型获取方法装置的实现流程示意图;
图5是是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
第一实施例
图1是本发明在一实施例中提供的基于隐私保护的数据处理模型获取方法的实现流程示意图。
如图1所示,该数据处理模型获取方法,包括以下步骤:
步骤S10:获取预设物联设备的多个传感器的传感数据。
在本实施例中,预设物联设备的多个传感器为相同类型的传感器,预设物联设备可以是燃气轮机、电表、锅炉或其它设备。传感器包括温度传感器、烟雾传感器、心率传感器、距离传感器、光敏传感器、声敏传感器、气敏传感器、化学传感器、压敏传感器、流体传感器或者其他类型传感器。
在本实施例中,传感器数据来自于同一类型、统一型号的物联设备,比如统一型号燃气轮机、电表、锅炉或其它设备。在获取传感数据时,由于传感器故障、电压、电机故障或其它不可预知的原因,并不是每个传感器都能收集到完整的数据,在有选择的情况下,最好是多个相对完整的数据。
步骤S20:通过所述传感器对应的传感数据对每个所述传感器对应的初始数据模型进行训练,获得每个所述传感器对应的中间数据模型,并将每个所述传感器对应的中间数据模型集合形成集合数据模型。
在本实施例中,多个传感器可以采用相同的初始数据模型;或者,多个传感器采用相同类型、不同超参数的初始数据模型;或者,多个所述传感器中至少有两个传感器的初始数据模型不同。
在本实施例中,在多个传感器数据上构建多个模型,使多个参与者可以构建机器学习模型且无需共享数据,以此来获得比单个传感器模型更好的表现效果。
在本实施例中,初始数据模型包括神经网络模型、支持向量机、逻辑回归模型、决策树模型或者其他数据模型。
步骤S30:通过所述集合数据模型和随机噪声对新数据进行处理,获取所述新数据对应的标签类别。
在本实施例中,通过随机噪声对新数据进行处理,引入了一定程度的不确定性,以充分掩盖任何个人用户、任何物联个体的贡献,保护了参与者隐私。
步骤S40:根据所述新数据以及所述新数据的标签类别,对所述集合数据模型进行训练,获取数据模型。
在本实施例中,根据所述新数据以及所述新数据的标签类别,对所述集合数据模型进行训练,在保证数据安全的情况下,提升了模型的表现效果。
图2是本发明实施例提供的通过集合数据模型和随机噪声对新数据进行处理,获取新数据对应的标签类别的实现流程示意图。
在本实施例中,为了获取所述新数据对应的标签类别,步骤S30具体包括四方面:
步骤S301:将新数据分别输入至集合数据模型中的每个中间数据模型,获取每个中间数据模型输出的标签类别。
在本实施例中,新数据不属于传感器数据,且一般为不敏感数据,比如公开数据集或者其它相对不敏感的数据。
步骤S302:根据标签类别,确定每个标签类别的初始投票数量。
步骤S303:在初始投票数量的基础上引入随机噪声,获取每个标签类别的投票数量。
在本实施例中,随机噪声包括拉普拉斯噪声,拉普拉斯噪声为Lap(1/ε),ε为隐私成本,其密度函数为
Figure BDA0002619505010000081
其中,x为新数据,b为=1/ε。
优选地,标签类别的最大投票数量为:
Figure BDA0002619505010000082
其中,x为新数据;
j为标签类别;
Figure BDA0002619505010000083
为新数据x属于标签类别j的初始投票数量。
例如,有10个传感器数据集,每个数据集训练一个模型,模型1-10对输入x的输出标签为(2,3,2,1,2,3,2,4,1,2),其中标签类别为1-5,则10个模型对标签类别(1,2,3,4,5)的投票结果为
Figure BDA0002619505010000084
我们在投票结果(2,5,2,1,0)的基础上加入ε=0.1的拉普拉斯噪声,则投票结果由(2,5,2,1,0)变为(2.20,4.89,1.82,1.07,0.05),加入噪声扰动后输入x的标签类别仍为2(标签2对应的投票数量4.89最大)。
步骤S304:根据每个标签类别的投票数量,将投票数量满足预设条件的标签类别确定为所述新数据的标签类别。
图3是本发明实施例提供的根据新数据以及新数据的标签类别,对集合数据模型进行训练,获取数据模型的实现流程示意图。
如图3所示,步骤S40具体包括四方面:
步骤S401:根据预设规则,采用新数据以及新数据的标签类别,对集合数据模型进行训练。
在本实施例中,预设规则包括模型精度或者循环次数。
步骤S402:达到预设规则后,停止训练,获得目标数据模型。
步骤S403:丢弃传感器数据和集成数据模型。
步骤S404:发布目标数据模型。
在本实施例中,发布的目标模型与原始传感器数据分离,所以即使攻击者拿到发布模型的模型参数,也无法推算出原有的传感器数据,从而对我们的原始传感器数据起到保护的作用。
本发明实施例首先通过获取传感数据,用传感器数据对初始模型进行训练,获得对应的中间数据模型,集合形成集合数据模型,其次通过集合数据模型和随机噪声对新数据进行处理,获取新数据对应的标签类别,最后用新数据以及对应的标签类别,对集合数据模型进行训练,获取数据模型,使得多个参与者可以构建机器学习模型而无需共享数据。本发明在多个传感器数据上构建多个模型,集成所有模型并加入噪声扰动的方法,最终得到一个综合的结果,以此来获得比单个传感器模型更好的表现效果。通过在模型中加入噪声,引入了一定程度的不确定性,以充分掩盖任何个人用户、任何物联个体的贡献,保护了参与者隐私,从而解决了物联网数据隐私保护性差的技术问题。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
第二实施例
基于与第一实施例中方法相同的发明构思,相应的,本实施例还提供了一种基于隐私保护的数据处理模型获取装置。
如图4所示,在本实施例中,基于隐私保护的数据处理模型获取装置包括数据采集模块41、数据集成模块42、噪声添加模块43以及数据处理模块44。
其中,所述数据采集模块41,用于获取预设物联设备的多个传感器的传感数据。
所述数据集成模块42,用于通过所述传感器对应的传感数据对每个所述传感器对应的初始数据模型进行训练,获得每个所述传感器对应的中间数据模型,并将每个所述传感器对应的中间数据模型集合形成集合数据模型。
所述噪声添加模块43,用于通过所述集合数据模型和随机噪声对新数据进行处理,获取所述新数据对应的标签类别。
所述数据处理模块44,用于根据所述新数据以及所述新数据的标签类别,对所述集合数据模型进行训练,获取数据模型。
在一个实施例中,所述噪声添加模块43包括:获取数据模块,用于将新数据分别输入至集合数据模型中的每个中间数据模型,获取每个中间数据模型输出的标签类别;第一确定模块,用于根据标签类别,确定每个标签类别的初始投票数量,添加噪声子模块,用于在初始投票数量的基础上引入随机噪声,获取每个标签类别的投票数量;第二确定模块,用于根据每个标签类别的投票数量,将投票数量满足预设条件的标签类别确定为所述新数据的标签类别。
在一个实施例中,所述数据处理模块44包括:数据训练模块,用于根据预设规则,采用新数据以及新数据的标签类别,对集合数据模型进行训练;获取模型模块,用于达到预设规则后,停止训练,获得目标数据模型;丢弃模块,用于丢弃传感器数据和集成数据模型;发布模型模块,用于发布目标数据模型。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
第三实施例
上述方法和装置可以应用于例如桌上型计算机、笔记本、掌上电脑及云端服务器的终端设备中。
图5是本发明一实施例提供的终端设备的示意图。如图5所示,所述终端设备5,包括存储器51、处理器50以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52,所述处理器50执行所述计算机程序52时实现如所述物联设备的数据模拟方法的步骤。例如图4所示模块41至44的功能。
所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器50、所述存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51也可以是终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端设备所需的其它程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
具体可以如下,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端设备中的计算机可读存储介质。所述计算机可读存储介质存储有一个或者一个以上计算机程序:
计算机可读存储介质,包括所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述物联设备数据模拟方法的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于隐私保护的数据处理模型获取方法,其特征在于,包括:
获取预设物联设备的多个传感器的传感数据;
通过所述传感器对应的传感数据对每个所述传感器对应的初始数据模型进行训练,获得每个所述传感器对应的中间数据模型,并将每个所述传感器对应的中间数据模型集合形成集合数据模型;
通过所述集合数据模型和随机噪声对新数据进行处理,获取所述新数据对应的标签类别;
根据所述新数据以及所述新数据的标签类别,对所述集合数据模型进行训练,获取数据模型。
2.如权利要求1所述的基于隐私保护的数据处理模型获取方法,其特征在于,所述预设物联设备的多个传感器为相同类型的传感器,所述传感器包括温度传感器、烟雾传感器、心率传感器、距离传感器、光敏传感器、声敏传感器、气敏传感器、化学传感器、压敏传感器和流体传感器中的一种。
3.如权利要求1所述的基于隐私保护的数据处理模型获取方法,其特征在于,多个所述传感器的初始数据模型相同;
或者,多个所述传感器采用相同类型、不同超参数的初始数据模型;
或者,多个所述传感器中至少有两个传感器的初始数据模型不同。
4.如权利要求1所述的基于隐私保护的数据处理模型获取方法,其特征在于,所述初始数据模型包括神经网络模型、支持向量机、逻辑回归模型或决策树模型。
5.如权利要求1所述的基于隐私保护的数据处理模型获取方法,其特征在于,所述通过所述集合数据模型和随机噪声对新数据进行处理,获取所述新数据对应的标签类别步骤,包括:
将新数据分别输入至所述集合数据模型中的每个中间数据模型,获取每个所述中间数据模型输出的标签类别;
根据所述标签类别,确定每个所述标签类别的初始投票数量;
在所述初始投票数量的基础上引入随机噪声,获取每个所述标签类别的投票数量;
根据每个所述标签类别的投票数量,将投票数量满足预设条件的标签类别确定为所述新数据的标签类别。
6.如权利要求5所述的基于隐私保护的数据处理模型获取方法,其特征在于,所述随机噪声包括拉普拉斯噪声,所述拉普拉斯噪声为Lap(1/ε),ε为隐私成本,其密度函数为
Figure FDA0002619503000000021
其中,x为所述新数据,b为=1/ε。
7.如权利要求6所述的基于隐私保护的数据模型获取方法,其特征在于,所述标签类别的最大投票数量为:
Figure FDA0002619503000000022
其中,x为所述新数据;
j为所述标签类别;
Figure FDA0002619503000000031
为所述新数据x属于所述标签类别j的初始投票数量。
8.一种基于隐私保护的数据处理模型获取装置,其特征在于,包括:
数据采集模块,用于获取预设物联设备的多个传感器的传感数据;
数据集成模块,用于通过所述传感器对应的传感数据对每个所述传感器对应的初始数据模型进行训练,获得每个所述传感器对应的中间数据模型,并将每个所述传感器对应的中间数据模型集合形成集合数据模型;
噪声添加模块,用于通过所述集合数据模型和随机噪声对新数据进行处理,获取所述新数据对应的标签类别;
数据处理模块,用于根据所述新数据以及所述新数据的标签类别,对所述集合数据模型进行训练,获取数据模型。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于隐私保护的数据处理模型获取方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于隐私保护的数据处理模型获取方法的步骤。
CN202010778938.1A 2020-08-05 2020-08-05 一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质 Pending CN114091090A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010778938.1A CN114091090A (zh) 2020-08-05 2020-08-05 一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质
PCT/CN2021/101138 WO2022028131A1 (zh) 2020-08-05 2021-06-21 一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质
JP2022520859A JP2023535851A (ja) 2020-08-05 2021-06-21 プライバシー保護によるデータ処理モデルの取得方法、装置、ターミナル機器及び記憶媒体
US17/711,048 US20220229904A1 (en) 2020-08-05 2022-04-01 Privacy-protection-based data processing model acquisition method and apparatus, terminal device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010778938.1A CN114091090A (zh) 2020-08-05 2020-08-05 一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质

Publications (1)

Publication Number Publication Date
CN114091090A true CN114091090A (zh) 2022-02-25

Family

ID=80116837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010778938.1A Pending CN114091090A (zh) 2020-08-05 2020-08-05 一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质

Country Status (4)

Country Link
US (1) US20220229904A1 (zh)
JP (1) JP2023535851A (zh)
CN (1) CN114091090A (zh)
WO (1) WO2022028131A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086343B (zh) * 2022-06-29 2023-02-28 青岛华正信息技术股份有限公司 一种基于人工智能的物联网数据交互方法及系统
CN115795556B (zh) * 2023-01-28 2023-05-09 北京火山引擎科技有限公司 数据处理方法、装置、计算机设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8893292B2 (en) * 2012-11-14 2014-11-18 Mitsubishi Electric Research Laboratories, Inc. Privacy preserving statistical analysis for distributed databases
US10395180B2 (en) * 2015-03-24 2019-08-27 International Business Machines Corporation Privacy and modeling preserved data sharing
US11012476B2 (en) * 2018-11-20 2021-05-18 Microsoft Technology Licensing, Llc Protecting IOT devices by behavioural analysis of their file system
CN110263870B (zh) * 2019-06-26 2023-04-18 深圳市悦动天下科技有限公司 运动状态识别方法、装置、智能终端和存储介质
US11783025B2 (en) * 2020-03-12 2023-10-10 International Business Machines Corporation Training diverse and robust ensembles of artificial intelligence computer models
CN111291190B (zh) * 2020-03-23 2023-04-07 腾讯科技(深圳)有限公司 一种编码器的训练方法、信息检测的方法以及相关装置
CN111159773B (zh) * 2020-04-01 2020-11-03 支付宝(杭州)信息技术有限公司 保护数据隐私的图片分类方法及装置
US11568061B2 (en) * 2020-04-29 2023-01-31 Robert Bosch Gmbh Private model utility by minimizing expected loss under noise
CN111475855B (zh) * 2020-06-24 2020-12-25 支付宝(杭州)信息技术有限公司 实现隐私保护的数据处理方法及装置
US11847544B2 (en) * 2020-07-21 2023-12-19 International Business Machines Corporation Preventing data leakage in automated machine learning

Also Published As

Publication number Publication date
JP2023535851A (ja) 2023-08-22
US20220229904A1 (en) 2022-07-21
WO2022028131A1 (zh) 2022-02-10

Similar Documents

Publication Publication Date Title
Betzel et al. Specificity and robustness of long-distance connections in weighted, interareal connectomes
Mokhtari et al. A machine learning approach for anomaly detection in industrial control systems based on measurement data
Mortier et al. Human-data interaction: The human face of the data-driven society
CN106716958A (zh) 横向移动检测
Barletta et al. A Kohonen SOM architecture for intrusion detection on in-vehicle communication networks
Gadal et al. Machine learning-based anomaly detection using K-mean array and sequential minimal optimization
CN109635044A (zh) 住院数据异常检测方法、装置、设备及可读存储介质
CN110705585A (zh) 网络欺诈识别方法、装置、计算机装置及存储介质
CN114091090A (zh) 一种基于隐私保护的数据处理模型获取方法、装置、终端设备及存储介质
CN111090807A (zh) 一种基于知识图谱的用户识别方法及装置
Razaque et al. Avoidance of cybersecurity threats with the deployment of a web-based blockchain-enabled cybersecurity awareness system
CN109495513A (zh) 无监督的加密恶意流量检测方法、装置、设备及介质
CN109087138A (zh) 数据处理方法及系统、计算机系统和可读存储介质
de Campos Souza et al. Detection of anomalies in large-scale cyberattacks using fuzzy neural networks
Almshari et al. Detection of potentially compromised computer nodes and clusters connected on a smart grid, using power consumption data
Jiang et al. FedHGCDroid: An adaptive multi-dimensional federated learning for privacy-preserving android Malware classification
Ch et al. Distributed-ledger-based blockchain technology for reliable electronic voting system with statistical analysis
CN109117352B (zh) 服务器性能预测方法和装置
Gui et al. A delay-based machine learning model for DMA attack mitigation
Chowdhary et al. Generative Adversarial Network (GAN)-Based Autonomous Penetration Testing for Web Applications
CN112347457A (zh) 异常账户检测方法、装置、计算机设备和存储介质
Wu et al. Web user trust evaluation: a novel approach using fuzzy Petri net and behavior analysis
CN115713424A (zh) 风险评估方法、风险评估装置、设备及存储介质
Wang et al. A dynamic anomaly detection approach based on permutation entropy for predicting aging-related failures
RU2745362C1 (ru) Система и способ формирования индивидуального содержимого для пользователя сервиса

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination