CN116244748A - 基于联邦学习的交通大数据隐私保护系统 - Google Patents
基于联邦学习的交通大数据隐私保护系统 Download PDFInfo
- Publication number
- CN116244748A CN116244748A CN202310251904.0A CN202310251904A CN116244748A CN 116244748 A CN116244748 A CN 116244748A CN 202310251904 A CN202310251904 A CN 202310251904A CN 116244748 A CN116244748 A CN 116244748A
- Authority
- CN
- China
- Prior art keywords
- target
- data
- mimicry
- value
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于联邦学习的交通大数据隐私保护系统,涉及数据隐私保护技术领域,通过数据截取单元截取到标的数据组,并将标的数据组传输到数据分析单元,之后借助数据分析单元对标的数据组进行标的分析,通过标的数据组内标的数据的和最新的标的数据的时间,分析得到拟态数值组,并提取到标的数据组内的标的对象和标的数量;之后借助简态转化单元用于对标的数据组及其标的对象、标的数量和拟态数值组进行简态分析,得到所有的标的数据的n个标的部数据及其对应的标的对象;此处n为拟态数值组内拟态数值的个数;最后利用复化分析单元用于对标的对象和n个标的部数据进行复化分析,完成对数据的安全存储加密,本发明简单有效,且易于实用。
Description
技术领域
本发明属于数据隐私保护技术领域,具体是基于联邦学习的交通大数据隐私保护系统。
背景技术
公开号为CN112669650A的专利公开了一种基于ADS-B消息的隐私保护的方法、系统及存储介质,涉及航空航天领域。所述基于ADS-B消息的隐私保护的方法包括如下步骤:获取待保护的第一飞机的飞机识别码;获取所述第一飞机的干扰参数;将所述干扰参数进行航线信息处理,得到虚假的第一航线集合;对所述第一航线集合中每一第一航线,通过ADS-B系统周期广播第一ADS-B飞行参数,其中,所述第一ADS-B飞行参数包括对应的所述第一航线上的飞行信息以及所述飞机识别码。通过将多个包含飞机识别码的第二飞行信息进行广播,以使攻击者无法通过被拦截信息中的飞机识别码获取真实的飞机信息,以保护飞机的隐私。
但是,针对用户的交通大数据来说,尤其是针对交通物流供应链金融方面的大数据,如何对用户的大量数据内容进行保护和分析,避免非权限人员获取到大数据,缺乏一种有效的技术方案,基于此,现给出一种解决方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一;
为此,本发明提出了基于联邦学习的交通大数据隐私保护系统,包括:
数据截取单元用于截取到标的数据,所有的标的数据构成标的数据组,并将标的数据组传输到数据分析单元,数据分析单元接收数据截取单元传输的标的数据组,并对其进行标的分析,标的分析的基本原理为通过标的数据组内标的数据的和最新的标的数据的时间,分析得到拟态数值组;自动提取到标的数据组内的标的对象和标的数量;
数据分析单元用于将标的数据组及其标的对象、标的数量和拟态数值组传输到简态转化单元,简态转化单元用于对标的数据组及其标的对象、标的数量和拟态数值组进行简态分析,根据拟态数值组所有数值的和对标的数据进行切割,得到若干个标的分数据,再根据拟态数值组内顺序摆放的拟态数值将标的分数据组合,得到对应拟态数值组数量对应的标的部数据,得到所有的标的数据的n个标的部数据及其对应的标的对象;此处n为拟态数值组内拟态数值的个数;
简态转化单元用于将标的对象及其对应的n个标的部数据传输到复化分析单元,复化分析单元用于对标的对象和n个标的部数据进行复化分析,复化分析具体方式为:
S01:获取到所有的标的对象;
S02:将标的对象的首字符和最后一个字符融合形成身份标识,之后对所有的身份标识进行比对,当存在相同的身份标识后,获取到相同的身份标识,保留任意一个身份标识后,自动获取到其余标的对象的倒数第二个字符,并按照原始顺序摆放,得到更新后的身份标识;
S03:对更新后的身份标识进行比对,若还是存在相同的身份标识,则任意保留一个身份标识后,对其余的身份标识依次序获取到原始标的对象的倒数第三个字符,更新新的身份标识;
S04:按照步骤S03的顺序对剩余所有的身份标识进行相同处理,得到各不相同的身份标识;
S05:将身份标识与对应的n个标的部数据建立映射关系后;
S06:复化分析单元将n个标的部数据按照映射的顺序随机存储在存储端的n个存储单元内;
S07:完成复化分析;
存储端能够根据复化分析单元传输的标的部数据实时建立对应数量的存储单元,存储端依据云存储原理建立。
进一步地,标的数据即为对应用户的交通大数据。
进一步地,标的分析具体方式为:
步骤一:获取到标的数据组;
步骤二:针对性获取到标的数据组的所属对象的用户名或者ID,将其标记为标的对象,再获取到标的数据的条数,将其标记为标的数量;
步骤三:之后获取到标的数据组内获取到的最新的标的数据的时间,按照月日时分的格式获取后,得到每个时间上的数值,将其标记为时间数值组Ti,i=1、...、8;
步骤四:之后自动获取到时间数值组Ti,自动将Ti中为零的数值去除,之后比对剩余的数值,当存在相同的数值,则将顺序在后的数值自动加一,保证所有的数值各不相同;将剩余的标记为拟态数值组Ti,i=1、...、n,n≤8;
步骤五:得到标的数据组及其标的对象、标的数量和拟态数值组。
进一步地,步骤四中若数值为9,加一后自动标记为1,不为10。
进一步地,简态分析具体方式为:
S1:获取到拟态数值组Ti和标的数据组;
S2:按照拟态数值组Ti的数值,自动求取Ti的总和,将该和值标记为拟态分值;
S3:将标的数据组内所有的标的数据全部等分为对应拟态分值的数值等分,得到对应拟态分值数量数的标的分数据;
S4:之后任选一标的数据的全部标的分数据,按照顺序摆放之后;
S5:顺序摆放拟态数值组的每一个拟态数值,获取到第一个拟态数值后,获取到对应数量数的标的分数据,将其融合形成第一个标的部数据;之后获取到第二个拟态数值,获取对应数量数的标的分数据,融合后得到第二个标的部数据,依次序获取到所有拟态数值对应的数量数的标的分数据,得到对应的标的部数据,得到n个标的部数据;
S6:得到对应第一个标的数据的n个标的部数据;
S7:之后对剩余的每一个标的数据进行步骤S4-S6相同方式处理,得到每一个标的数据的n个标的部数据;
S8:得到所有的标的数据的n个标的部数据及其对应的标的对象。
进一步地,管理单元与复化分析单元通信连接,管理单元用于录入所有的预设数值。
进一步地,监控单元用于对标的对象在登录时进行用户身份验证,身份验证通过后的指定设备才能向复化分析单元传输提取信号,用于从存储端提取对应的标的部数据,并将标的部数据还原成为标的数据。
与现有技术相比,本发明的有益效果是:
本发明通过数据截取单元截取到标的数据组,并将标的数据组传输到数据分析单元,之后借助数据分析单元对标的数据组进行标的分析,通过标的数据组内标的数据的和最新的标的数据的时间,分析得到拟态数值组,并提取到标的数据组内的标的对象和标的数量;
之后借助简态转化单元用于对标的数据组及其标的对象、标的数量和拟态数值组进行简态分析,得到所有的标的数据的n个标的部数据及其对应的标的对象;此处n为拟态数值组内拟态数值的个数;最后利用复化分析单元用于对标的对象和n个标的部数据进行复化分析,完成对数据的安全存储加密,本发明简单有效,且易于实用。
附图说明
图1为本发明的系统框图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本申请提供了基于联邦学习的交通大数据隐私保护系统,包括数据截取单元、数据分析单元、简太转化单元、复化分析单元、管理单元、监控单元和存储端;
其中,数据截取单元用于截取到对应用户的交通大数据,并将其标记为标的数据,所有的标的数据构成标的数据组,并将标的数据组传输到数据分析单元,数据分析单元接收数据截取单元传输的标的数据组,并对其进行标的分析,标的分析具体方式为:
步骤一:获取到标的数据组;
步骤二:针对性获取到标的数据组的所属对象的用户名或者ID,将其标记为标的对象,再获取到标的数据的条数,将其标记为标的数量;
步骤三:之后获取到标的数据组内获取到的最新的标的数据的时间,按照月日时分的格式获取后,得到每个时间上的数值,将其标记为时间数值组Ti,i=1、...、8;具体举例为若最后一个获取到的标的数据时间为01月08日12时04分时,则对应T1-T8的数值依次为01081204;
步骤四:之后自动获取到时间数值组Ti,自动将Ti中为零的数值去除,之后比对剩余的数值,当存在相同的数值,则将顺序在后的数值自动加一,保证所有的数值各不相同,此处若数值为9,加一后自动标记为1,不为10;剩余的标记为拟态数值组Ti,i=1、...、n,n≤8;
步骤五:得到标的数据组及其标的对象、标的数量和拟态数值组;
数据分析单元用于将标的数据组及其标的对象、标的数量和拟态数值组传输到简态转化单元,简态转化单元用于对标的数据组及其标的对象、标的数量和拟态数值组进行简态分析,简态分析具体方式为:
S1:获取到拟态数值组Ti和标的数据组;
S2:按照拟态数值组Ti的数值,自动求取Ti的总和,将该和值标记为拟态分值;
S3:将标的数据组内所有的标的数据全部等分为对应拟态分值的数值等分,得到对应拟态分值数量数的标的分数据;
S4:之后任选一标的数据的全部标的分数据,按照顺序摆放之后;
S5:顺序摆放拟态数值组的每一个拟态数值,获取到第一个拟态数值后,获取到对应数量数的标的分数据,将其融合形成第一个标的部数据;之后获取到第二个拟态数值,获取对应数量数的标的分数据,融合后得到第二个标的部数据,依次序获取到所有拟态数值对应的数量数的标的分数据,得到对应的标的部数据,得到n个标的部数据;
S6:得到对应第一个标的数据的n个标的部数据;
S7:之后对剩余的每一个标的数据进行步骤S4-S6相同方式处理,得到每一个标的数据的n个标的部数据;
S8:得到所有的标的数据的n个标的部数据及其对应的标的对象;
简态转化单元用于将标的对象及其对应的n个标的部数据传输到复化分析单元,复化分析单元用于对标的对象和n个标的部数据进行复化分析,复化分析具体方式为:
S01:获取到所有的标的对象;
S02:将标的对象的首字符和最后一个字符融合形成身份标识,之后对所有的身份标识进行比对,当存在相同的身份标识后,获取到相同的身份标识,保留任意一个身份标识后,自动获取到其余标的对象的倒数第二个字符,并按照原始顺序摆放,得到更新后的身份标识;
S03:对更新后的身份标识进行比对,若还是存在相同的身份标识,则任意保留一个身份标识后,对其余的身份标识依次序获取到原始标的对象的倒数第三个字符,更新新的身份标识;
S04:按照步骤S03的顺序对剩余所有的身份标识进行相同处理,得到各不相同的身份标识;
S05:将身份标识与对应的n个标的部数据建立映射关系后;
S06:复化分析单元将n个标的部数据按照映射的顺序随机存储在存储端的n个存储单元内;
S07:完成复化分析;
存储端能够根据复化分析单元传输的标的部数据实时建立对应数量的存储单元,存储端依据云存储原理建立。
管理单元与复化分析单元通信连接,管理单元用于录入所有的预设数值;
监控单元用于对标的对象在登录时进行用户身份验证,身份验证采用现有技术,只有身份验证通过后的指定设备才能向复化分析单元传输提取信号,用于从存储端提取对应的标的部数据,并将标的部数据还原成为标的数据;
此处还原标的部数据的方式依据标的分数据的数量确定标的部数据的顺序;
上述公式中的部分数据均是去除量纲取其数值计算,公式是由采集的大量数据经过软件模拟得到最接近真实情况的一个公式;公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者通过大量数据模拟获得。
以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。
Claims (8)
1.基于联邦学习的交通大数据隐私保护系统,其特征在于,包括:
数据截取单元,用于截取到标的数据,所有的标的数据构成标的数据组;
数据分析单元,用于接收数据截取单元传输的标的数据组,并对其进行标的分析:通过标的数据组内标的数据的和最新的标的数据的时间分析得到拟态数值组;并自动提取到标的数据组内的标的对象和标的数量;
简态转化单元,用于对标的数据组及其标的对象、标的数量和拟态数值组进行简态分析,根据拟态数值组所有数值的和对标的数据进行切割,得到若干个标的分数据,再根据拟态数值组内顺序摆放的拟态数值将标的分数据组合,得到对应拟态数值组数量对应的标的部数据,得到所有的标的数据的n个标的部数据及其对应的标的对象;此处n为拟态数值组内拟态数值的个数;
简态转化单元用于将标的对象及其对应的n个标的部数据传输到复化分析单元,复化分析单元用于对标的对象和n个标的部数据进行复化分析,建立标的对象的身份标识与对应的n个标的部数据的映射关系;
存储端,根据复化分析单元传输的标的部数据实时建立对应数量的存储单元。
2.根据权利要求1所述的基于联邦学习的交通大数据隐私保护系统,其特征在于,所述复化分析具体方式为:
S01:获取到所有的标的对象;
S02:将标的对象的首字符和最后一个字符融合形成身份标识,之后对所有的身份标识进行比对,当存在相同的身份标识后,获取到相同的身份标识,保留任意一个身份标识后,自动获取到其余标的对象的倒数第二个字符,并按照原始顺序摆放,得到更新后的身份标识;
S03:对更新后的身份标识进行比对,若还是存在相同的身份标识,则任意保留一个身份标识后,对其余的身份标识依次序获取到原始标的对象的倒数第三个字符,更新新的身份标识;
S04:按照步骤S03的顺序对剩余所有的身份标识进行相同处理,得到各不相同的身份标识;
S05:将身份标识与对应的n个标的部数据建立映射关系后;
S06:复化分析单元将n个标的部数据按照映射的顺序随机存储在存储端的n个存储单元内;
S07:完成复化分析。
3.根据权利要求1所述的基于联邦学习的交通大数据隐私保护系统,其特征在于,标的数据即为对应用户的交通大数据。
4.根据权利要求1所述的基于联邦学习的交通大数据隐私保护系统,其特征在于,标的分析具体方式为:
步骤一:获取到标的数据组;
步骤二:针对性获取到标的数据组的所属对象的用户名或者ID,将其标记为标的对象,再获取到标的数据的条数,将其标记为标的数量;
步骤三:之后获取到标的数据组内获取到的最新的标的数据的时间,按照月日时分的格式获取后,得到每个时间上的数值,将其标记为时间数值组Ti,i=1、...、8;
步骤四:之后自动获取到时间数值组Ti,自动将Ti中为零的数值去除,之后比对剩余的数值,当存在相同的数值,则将顺序在后的数值自动加一,保证所有的数值各不相同;将剩余的标记为拟态数值组Ti,i=1、...、n,n≤8;
步骤五:得到标的数据组及其标的对象、标的数量和拟态数值组。
5.根据权利要求4所述的基于联邦学习的交通大数据隐私保护系统,其特征在于,步骤四中若数值为9,加一后自动标记为1。
6.根据权利要求1所述的基于联邦学习的交通大数据隐私保护系统,其特征在于,简态分析具体方式为:
S1:获取到拟态数值组Ti和标的数据组;
S2:按照拟态数值组Ti的数值,自动求取Ti的总和,将该和值标记为拟态分值;
S3:将标的数据组内所有的标的数据全部等分为对应拟态分值的数值等分,得到对应拟态分值数量数的标的分数据;
S4:之后任选一标的数据的全部标的分数据,按照顺序摆放之后;
S5:顺序摆放拟态数值组的每一个拟态数值,获取到第一个拟态数值后,获取到对应数量数的标的分数据,将其融合形成第一个标的部数据;之后获取到第二个拟态数值,获取对应数量数的标的分数据,融合后得到第二个标的部数据,依次序获取到所有拟态数值对应的数量数的标的分数据,得到对应的标的部数据,得到n个标的部数据;
S6:得到对应第一个标的数据的n个标的部数据;
S7:之后对剩余的每一个标的数据进行步骤S4-S6相同方式处理,得到每一个标的数据的n个标的部数据;
S8:得到所有的标的数据的n个标的部数据及其对应的标的对象。
7.根据权利要求1所述的基于联邦学习的交通大数据隐私保护系统,其特征在于,管理单元与复化分析单元通信连接,管理单元用于录入所有的预设数值。
8.根据权利要求1所述的基于联邦学习的交通大数据隐私保护系统,其特征在于,还包括监控单元,监控单元用于对标的对象在登录时进行用户身份验证,身份验证通过后的指定设备才能向复化分析单元传输提取信号,用于从存储端提取对应的标的部数据,并将标的部数据还原成为标的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310251904.0A CN116244748A (zh) | 2023-03-16 | 2023-03-16 | 基于联邦学习的交通大数据隐私保护系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310251904.0A CN116244748A (zh) | 2023-03-16 | 2023-03-16 | 基于联邦学习的交通大数据隐私保护系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116244748A true CN116244748A (zh) | 2023-06-09 |
Family
ID=86624074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310251904.0A Pending CN116244748A (zh) | 2023-03-16 | 2023-03-16 | 基于联邦学习的交通大数据隐私保护系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116244748A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117370417A (zh) * | 2023-10-19 | 2024-01-09 | 新天绿色能源股份有限公司 | 基于人工智能的业务大数据分析系统 |
-
2023
- 2023-03-16 CN CN202310251904.0A patent/CN116244748A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117370417A (zh) * | 2023-10-19 | 2024-01-09 | 新天绿色能源股份有限公司 | 基于人工智能的业务大数据分析系统 |
CN117370417B (zh) * | 2023-10-19 | 2024-05-17 | 新天绿色能源股份有限公司 | 基于人工智能的业务大数据分析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104102687A (zh) | 加密网络隧道内的Web业务的标识和分类的方法和系统 | |
CN110677430B (zh) | 基于网络安全设备日志数据的用户风险度评估方法和系统 | |
CN116244748A (zh) | 基于联邦学习的交通大数据隐私保护系统 | |
CN110245273B (zh) | 一种获取app业务特征库的方法及相应的装置 | |
CN108924759B (zh) | 识别移动发生器的方法、装置及系统 | |
CN110365636B (zh) | 工控蜜罐攻击数据来源的判别方法及装置 | |
CN113297623B (zh) | 基于数据库的敏感数据脱敏系统 | |
CN114783553A (zh) | 一种利用健康码数据结合测温设备的复工防疫通行系统及方法 | |
CN115174255B (zh) | 工业互联网平台数据传输安全防护系统 | |
CN104852916A (zh) | 一种基于社会工程学的网页验证码识别方法及系统 | |
CN111027520A (zh) | 一种山火火点判识方法、装置和设备 | |
CN110675252A (zh) | 风险评估方法、装置、电子设备及存储介质 | |
CN114697081B (zh) | 基于iec61850 sv报文运行态势模型的入侵检测方法和系统 | |
CN110197475A (zh) | 一种输电线路中的绝缘子自动识别系统、方法及应用 | |
CN111404768A (zh) | 一种dpi识别的实现方法及设备 | |
CN112437034B (zh) | 虚假终端检测方法和装置、存储介质及电子装置 | |
CN112732693B (zh) | 智能化物联网数据采集方法、装置、设备及存储介质 | |
CN114531302A (zh) | 数据加密方法、装置及存储介质 | |
CN114157837A (zh) | 基于视频监控云平台的安全考勤联动系统 | |
CN106612338A (zh) | 设备标识信息的处理方法和装置 | |
CN109600361B (zh) | 基于哈希算法的验证码防攻击方法、装置、电子设备及非暂态计算机可读存储介质 | |
EP3718284B1 (en) | Extending encrypted traffic analytics with traffic flow data | |
CN112528325B (zh) | 一种数据信息的安全处理方法及系统 | |
JP6342748B2 (ja) | セキュリティ設計支援装置およびセキュリティ設計支援方法 | |
CN115329378A (zh) | 一种具备加密功能的无人机空巡平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |