CN112000983A - 基于全国etc大数据的数据脱敏方法、系统、设备及介质 - Google Patents
基于全国etc大数据的数据脱敏方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN112000983A CN112000983A CN202010807278.5A CN202010807278A CN112000983A CN 112000983 A CN112000983 A CN 112000983A CN 202010807278 A CN202010807278 A CN 202010807278A CN 112000983 A CN112000983 A CN 112000983A
- Authority
- CN
- China
- Prior art keywords
- character string
- data
- desensitized
- characters
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000586 desensitisation Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000013523 data management Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002789 length control Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明属于数据管理技术领域,具体涉及一种基于全国ETC大数据的数据脱敏方法、系统、设备及介质,该方法包括:(1)获取车辆通行ETC相关的原始数据的待脱敏的字段;(2)对待脱敏的字段各字符串中的部分字符做删除处理,保留剩余字符;(3)将所有字符串的保留字符做信息合并处理,形成新字符串并检查长度;(4)对新字符串进行加密处理,形成加密字符串;(5)将加密字符串保存在数据库,并将其对应到相匹配的单次ETC收费明细记录;(6)删除步骤(1)中的待脱敏的字段。本发明实现对ETC大数据的脱敏处理,保护个人的隐私信息,避免存储用户个人信息数据而带来的法律风险。
Description
技术领域
本发明属于数据管理技术领域,具体涉及一种基于全国ETC大数据的数据脱敏方法、系统、设备及介质。
背景技术
敏感数据,又称隐私数据,常见的敏感数据有:姓名、身份证号码、地址、电话号码、银行账号、邮箱地址、所属城市、邮编、密码类(如账户查询密码、取款密码、登录密码等)、组织机构名称、营业执照号码、银行帐号、交易日期、交易金额等。
随着大数据时代的到来,大数据商业价值的挖掘,用户的精准定位,大数据中蕴藏的巨大商业价值被逐步挖掘出来,但是同时也带来了巨大的挑战–个人隐私信息的保护。个人信息与个人行为(比如位置信息、消费行为、网络访问行为)等,这些都是人的隐私,也是我们所关注的一类敏感信息,在大数据价值挖掘的基础上如何保护人的隐私信息,也将是数据脱敏必须解决的难题。
ETC大数据包含有诸多敏感字段,在应用之前必须采用安全、高效的脱敏方法保障数据安全,既保留其属性标签,又不失去数据的唯一的可辨认性,同时避免存储用户个人信息数据而带来的法律风险。
发明内容
根据以上现有技术的不足,本发明提供一种基于全国ETC大数据的数据脱敏方法、系统、设备及介质,实现对ETC大数据的脱敏处理,保护个人的隐私信息,避免存储用户个人信息数据而带来的法律风险。
本发明提供了一种基于全国ETC大数据的数据脱敏方法,该方法包括:
(1)获取车辆通行ETC相关的原始数据的待脱敏的字段;
(2)对待脱敏的字段各字符串中的部分字符做删除处理,保留剩余字符;
(3)将所有字符串的保留字符做信息合并处理,形成新字符串并检查长度;
(4)对新字符串进行加密处理,形成加密字符串;
(5)将加密字符串保存在数据库,并将其对应到相匹配的单次ETC收费明细记录;
(6)删除步骤(1)中的待脱敏的字段。
更进一步的,所述待脱敏的字段各字符串包括车牌号、ETC卡号和VIN号。所述车牌号、ETC卡号和VIN号的部分字符做删除处理,保留剩余字符具体为:车牌号保留后四位,ETC卡号保留前三位和后四位,VIN号保留前3位和后四位,形成长度为18个字节的新字符串。通过这种组合,既可以保留相关字段的部分特征,减少隐私泄露,又通过长度控制和信息截取规则在一定程度上保证了最终标识字符串的唯一性,防止信息重合。
更进一步的,所述加密处理采用的算法为SHA256算法。该算法保证了实际应用中效率和安全性之间的平衡性。
本发明还提供了一种基于全国ETC大数据的数据脱敏系统,该系统包括:
数据库,用于存储车辆通行ETC相关的原始数据及加密字符串;
扫描模块,用于扫描数据库中存储的车辆通行ETC相关的原始数据的待脱敏的字段;
处理模块:用于将待脱敏的字段各字符串中的部分字符做删除处理,保留剩余字符,再将所有字符串的保留字符做信息合并处理,形成新字符串并检查长度,最后对新字符串进行加密处理,形成加密字符串;
匹配模块:用于将加密字符串与数据库中的单次ETC收费明细记录建立匹配关系;
删除模块:用于删除车辆通行ETC相关的原始数据的待脱敏的字段。
本发明还提供了一种基于全国ETC大数据的数据脱敏设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现基于全国ETC大数据的数据脱敏方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现基于全国ETC大数据的数据脱敏方法。
本发明的优点在于:对ETC大数据实现了脱敏处理,脱敏方法安全、高效且保障数据安全,既保留其属性标签,又不失去数据的唯一的可辨认性,同时避免存储用户个人信息数据而带来的法律风险。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为基于全国ETC大数据的数据脱敏方法的流程示意图;
图2为基于全国ETC大数据的数据脱敏系统的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
在本实施例中提供了一种基于全国ETC大数据的数据脱敏方法,如图1所示,该方法包括:
(1)获取车辆通行ETC相关的原始数据的待脱敏的字段;
(2)对待脱敏的字段各字符串中的部分字符做删除处理,保留剩余字符;
(3)将所有字符串的保留字符做信息合并处理,形成新字符串并检查长度;
(4)对新字符串进行加密处理,形成加密字符串;
(5)将加密字符串保存在数据库,并将其对应到相匹配的单次ETC收费明细记录;
(6)删除步骤(1)中的待脱敏的字段。
更进一步的,所述待脱敏的字段各字符串包括车牌号、ETC卡号和VIN号。所述车牌号、ETC卡号和VIN号的部分字符做删除处理,保留剩余字符具体为:车牌号保留后四位,ETC卡号保留前三位和后四位,VIN号保留前3位和后四位。当将所有的保留字符信息合并处理时,要遵循统一的合并规则,比如按照特定的顺序,车牌号+ETC卡号+VIN号,以方便后续的信息识别,尽量不要采用随机的组合方式。
更进一步的,所述加密处理采用的算法为SHA256算法。该算法保证了实际应用中效率和安全性之间的平衡性。
在本实施例中提供了一种基于全国ETC大数据的数据脱敏系统,如图2所示,该系统包括:
数据库,用于存储车辆通行ETC相关的原始数据及加密字符串;
扫描模块,用于扫描数据库中存储的车辆通行ETC相关的原始数据的待脱敏的字段;
处理模块:用于将待脱敏的字段各字符串中的部分字符做删除处理,保留剩余字符,再将所有字符串的保留字符做信息合并处理,形成新字符串并检查长度,最后对新字符串进行加密处理,形成加密字符串;
匹配模块:用于将加密字符串与数据库中的单次ETC收费明细记录建立匹配关系;
删除模块:用于删除车辆通行ETC相关的原始数据的待脱敏的字段。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述模块分别位于多个处理器中。
另外,结合图1描述的本发明实施例的基于全国ETC大数据的数据脱敏方法可以由基于全国ETC大数据的数据脱敏设备来实现。
基于全国ETC大数据的数据脱敏设备可以包括处理器以及存储有计算机程序指令的存储器。
具体地,上述处理器可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器可在数据处理装置的内部或外部。在特定实施例中,存储器是非易失性固态存储器。在特定实施例中,存储器包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器通过读取并执行存储器中存储的计算机程序指令,以实现上述实施例中的任意一种数据脱敏平台敏感数据识别方法。
在一个示例中,基于全国ETC大数据的数据脱敏设备还可包括通信接口和总线。其中,处理器、存储器、通信接口通过总线连接并完成相互间的通信。
通信接口,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线包括硬件、软件或两者,将基于全国ETC大数据的数据脱敏设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
基于全国ETC大数据的数据脱敏设备可以基于获取到的数据,执行本发明实施例中的数据脱敏平台敏感数据识别方法,从而实现结合图1描述的基于全国ETC大数据的数据脱敏方法。
另外,结合上述实施例中的基于全国ETC大数据的数据脱敏方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于全国ETC大数据的数据脱敏方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于全国ETC大数据的数据脱敏方法,其特征在于,该方法包括:
(1)获取车辆通行ETC相关的原始数据的待脱敏的字段;
(2)对待脱敏的字段各字符串中的部分字符做删除处理,保留剩余字符;
(3)将所有字符串的保留字符做信息合并处理,形成新字符串并检查长度;
(4)对新字符串进行加密处理,形成加密字符串;
(5)将加密字符串保存在数据库,并将其对应到相匹配的单次ETC收费明细记录;
(6)删除步骤(1)中的待脱敏的字段。
2.根据权利要求1所述的一种基于全国ETC大数据的数据脱敏方法,其特征在于,所述待脱敏的字段各字符串包括车牌号、ETC卡号和VIN号。
3.根据权利要求2所述的一种基于全国ETC大数据的数据脱敏方法,其特征在于,所述车牌号、ETC卡号和VIN号的部分字符做删除处理,保留剩余字符具体为:车牌号保留后四位,ETC卡号保留前三位和后四位,VIN号保留前3位和后四位。
4.根据权利要求1所述的基于全国ETC大数据的数据脱敏方法,其特征在于,所述加密处理采用的算法为SHA256算法。
5.一种基于全国ETC大数据的数据脱敏系统,其特征在于,该系统包括:
数据库,用于存储车辆通行ETC相关的原始数据及加密字符串;
扫描模块,用于扫描数据库中存储的车辆通行ETC相关的原始数据的待脱敏的字段;
处理模块:用于将待脱敏的字段各字符串中的部分字符做删除处理,保留剩余字符,再将所有字符串的保留字符做信息合并处理,形成新字符串并检查长度,最后对新字符串进行加密处理,形成加密字符串;
匹配模块:用于将加密字符串与数据库中的单次ETC收费明细记录建立匹配关系;
删除模块:用于删除车辆通行ETC相关的原始数据的待脱敏的字段。
6.一种基于全国ETC大数据的数据脱敏设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-4中任一项所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010807278.5A CN112000983A (zh) | 2020-08-12 | 2020-08-12 | 基于全国etc大数据的数据脱敏方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010807278.5A CN112000983A (zh) | 2020-08-12 | 2020-08-12 | 基于全国etc大数据的数据脱敏方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112000983A true CN112000983A (zh) | 2020-11-27 |
Family
ID=73462469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010807278.5A Pending CN112000983A (zh) | 2020-08-12 | 2020-08-12 | 基于全国etc大数据的数据脱敏方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112000983A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120179350A1 (en) * | 2011-01-10 | 2012-07-12 | Bendix Commercial Vehicle Systems, Llc | Acc and am braking range variable based on lateral and longitudinal position of forward vehicle and curvature of road |
CN109815742A (zh) * | 2019-02-22 | 2019-05-28 | 蔷薇智慧科技有限公司 | 数据脱敏方法及装置 |
CN110349282A (zh) * | 2019-07-01 | 2019-10-18 | 深圳市道尔智控科技股份有限公司 | 一种基于射频与视频结合的混合车道车辆的识别方法 |
CN110379025A (zh) * | 2019-07-09 | 2019-10-25 | 北京速通科技有限公司 | 基于智能网联汽车的电子收费方法、系统和车联网服务平台 |
CN111400714A (zh) * | 2020-04-16 | 2020-07-10 | Oppo广东移动通信有限公司 | 病毒检测方法、装置、设备及存储介质 |
-
2020
- 2020-08-12 CN CN202010807278.5A patent/CN112000983A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120179350A1 (en) * | 2011-01-10 | 2012-07-12 | Bendix Commercial Vehicle Systems, Llc | Acc and am braking range variable based on lateral and longitudinal position of forward vehicle and curvature of road |
CN109815742A (zh) * | 2019-02-22 | 2019-05-28 | 蔷薇智慧科技有限公司 | 数据脱敏方法及装置 |
CN110349282A (zh) * | 2019-07-01 | 2019-10-18 | 深圳市道尔智控科技股份有限公司 | 一种基于射频与视频结合的混合车道车辆的识别方法 |
CN110379025A (zh) * | 2019-07-09 | 2019-10-25 | 北京速通科技有限公司 | 基于智能网联汽车的电子收费方法、系统和车联网服务平台 |
CN111400714A (zh) * | 2020-04-16 | 2020-07-10 | Oppo广东移动通信有限公司 | 病毒检测方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
陈喆: "基于高速公路MTC手机支付系统信息安全设计研究", 《中国交通信息化》 * |
马春平: "基于全国联网ETC运营数据的应用研究", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108563961B (zh) | 数据脱敏平台敏感数据识别方法、装置、设备及介质 | |
US20170308898A1 (en) | System and method of recognizing transactions as trusted | |
CN105453102A (zh) | 用于识别已泄漏的私有密钥的系统和方法 | |
CN106101451A (zh) | 短信处理方法、移动终端 | |
CN111756750B (zh) | 安全访问方法、装置、设备及存储介质 | |
CN111931047B (zh) | 基于人工智能的黑产账号检测方法及相关装置 | |
CN112685771A (zh) | 日志脱敏方法、装置、设备及存储介质 | |
CN103577233A (zh) | 一种obdii读码卡设备、设备升级系统及方法 | |
CN112398816A (zh) | 一种基于区块链的交易识别验证系统 | |
CN111259409A (zh) | 一种信息加密方法、装置、电子设备及存储介质 | |
CN113762975A (zh) | 基于流量指纹的身份识别方法、系统、设备以及存储介质 | |
CN111539732B (zh) | 生物识别支付方法、装置、网关设备及存储介质 | |
CN113051601B (zh) | 敏感数据识别方法、装置、设备和介质 | |
CN112000983A (zh) | 基于全国etc大数据的数据脱敏方法、系统、设备及介质 | |
CN112417406A (zh) | 一种数据的脱敏方法、装置、可读存储介质及电子设备 | |
CN111786992A (zh) | 会员注册和认证方法、终端设备及可读存储介质 | |
EP4334834B1 (en) | Computer-implemented method and system for checking data anonymization | |
CN110968860A (zh) | 应用账号的安全验证方法、计算机设备及计算机可读存储介质 | |
CN115361450A (zh) | 请求信息处理方法、装置、电子设备、介质和程序产品 | |
US10873575B2 (en) | Method for providing a personal identification code of a security module | |
CN108052842A (zh) | 签名数据的存储、验证方法及装置 | |
CN114638016A (zh) | 隐私信息泄露的提示方法、装置、电子设备及存储介质 | |
CN113627938B (zh) | 一种区块链的数据删除方法、装置、设备及存储介质 | |
CN114021762A (zh) | 异地婚姻登记的方法、装置、终端及存储介质 | |
CN106330821B (zh) | 一种集成电路卡的认证码获取方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201127 |
|
RJ01 | Rejection of invention patent application after publication |