CN110909001A - 一种数据种子植入及溯源追踪的方法 - Google Patents

一种数据种子植入及溯源追踪的方法 Download PDF

Info

Publication number
CN110909001A
CN110909001A CN201911143305.7A CN201911143305A CN110909001A CN 110909001 A CN110909001 A CN 110909001A CN 201911143305 A CN201911143305 A CN 201911143305A CN 110909001 A CN110909001 A CN 110909001A
Authority
CN
China
Prior art keywords
check
tracing
data
traceable
digit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911143305.7A
Other languages
English (en)
Inventor
吴鸿钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Bite Xin'an Technology Co Ltd
Original Assignee
Chengdu Bite Xin'an Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Bite Xin'an Technology Co Ltd filed Critical Chengdu Bite Xin'an Technology Co Ltd
Priority to CN201911143305.7A priority Critical patent/CN110909001A/zh
Publication of CN110909001A publication Critical patent/CN110909001A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Detection And Correction Of Errors (AREA)

Abstract

本发明公开了一种数据种子植入及溯源追踪的方法,该溯源追踪的方法包括以下步骤:获取溯源数据;将溯源数据中除校验位外的多个元素的值分别与一系数进行数学运算后求和;将求和后的数值与单位标识码相加后除一定值取余得到溯源校验码,该溯源校验码的位数与校验位位数相同;对比该溯源校验码与校验位是否相等,若相等,则根据单位标识码溯源。采用校验位和单位标识码想结合的种子植入和溯源追踪方法,不仅实现离散数据的自我验证及数据溯源的能力;且可提升溯源的工作量,节约数据存储成本,提高溯源性能。

Description

一种数据种子植入及溯源追踪的方法
技术领域
本发明涉及数据处理方法领域,更具体的说是涉及一种数据种子植入及溯源追踪的方法。
背景技术
数据溯源技术就在数据库领域得到广泛研究,其基本出发点是帮助人们确定数据仓库中各项数据的来源。现有的离散数据溯源的方案是通过数据处理算法将处理后的数据以文件的方式进行存储,并记录当前数据的使用者,溯源的时候用被溯源的数据,在记录的文件中进行查询,从而达到溯源的目的。
缺点:随着数据的处理量越来越大,数据文件的存储空间就需要不停的增加。文件容量的增大,同时也会影响溯源的性能。
发明内容
本发明为了解决上述技术问题提供一种数据种子植入及溯源追踪的方法。
本发明通过下述技术方案实现:
一种数据种子植入的方法,包括以下步骤:
获取原始数据;
确定原始数据的校验位;
将原始数据中除校验位外的多个元素的值分别与一系数进行数学运算后求和;
将求和后的数值与单位标识码相加后除一定值取余得到溯源校验码,该溯源校验码的位数与校验位位数相同;
将该溯源校验码替换原始数据中的校验位后得到最终的溯源数据。
一种数据溯源追踪的方法,包括以下步骤:
获取溯源数据;
将溯源数据中除校验位外的多个元素的值分别与一系数进行数学运算后求和;
将求和后的数值与单位标识码相加后除一定值取余得到溯源校验码,该溯源校验码的位数与校验位位数相同;
对比该溯源校验码与校验位是否相等,若相等,则根据单位标识码溯源。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明采用校验位和单位标识码想结合的种子植入和溯源追踪方法,不仅实现离散数据的自我验证及数据溯源的能力;且可提升溯源的工作量,节约数据存储成本,提高溯源性能。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。
图1为实施例2中种子植入的流程图。
图2为实施例2中数据溯源的流程图。
图3为实施例4中种子植入的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
一种数据种子植入的方法,包括以下步骤:
获取原始数据,该原始数据中的元素可以是数字,也可以是字母,或者是两个的结合。
确定原始数据的校验位,该校验位可以根据情况任意选择,可以是原始数据的前两位、后两位或任意位置的任意位数。
将原始数据中除校验位外的多个元素的值分别与一系数进行数学运算后求和;该系数可以是自己设定的值,与每个元素进行数学运算的系数可以相同,可以不同,也可以采用每个元素在数据中所处的位数,;元素的选择可以是2个、3个、4个或者全部;数学运算可以是加、减、乘、除、除以某系数取模等。
将求和后的数值与单位标识码相加后除一定值取余得到溯源校验码,该溯源校验码的位数与校验位位数相同。单位标识码与数据使用者相对应,每个数据使用者对应唯一一个单位标识码。该定值也可根据情况任意选择,可以是100、10000或者任意数值。
将该溯源校验码替换原始数据中的校验位后得到最终的溯源数据。
在数据溯源追踪时采用以下步骤:
获取溯源数据,同样,溯源数据中的元素可以是数字,也可以是字母,或者是两个的结合。
将溯源数据中除校验位外的每个元素的值分别乘以一系数后求和,此处多个元素乘以的系数与种子植入时的系数分别相等,元素的选择也与种子植入时相等,同样,数学运算也需要相同,该校验位与数据种子植入时的校验位相同。
将求和后的数值与单位标识码相加后除一定值取余得到溯源校验码,该溯源校验码的位数与校验位位数相同;
对比该溯源校验码与校验位是否相等,若相等,则根据单位标识码溯源可找到对应的数据使用者。
本方案的方法,在溯源过程中,需采用上述方法对每个单位标识码进行轮询比对,以找到正确的单位标识码。采用该数据种子植入和溯源方法,其不需要对数据及当前的数据使用者进出存储,节约了存储空间,只需要对单位标识码及其对应的数据使用者进行存储即可,在溯源时,只需找到单位标识码即可判断数据使用者,可提升溯源的工作量,节约数据存储成本,提高溯源性能。
实施例2
基于上述实施例的原理,本实施例以一组电话号码为例进行说明。
如图1所示,本实施例以手机号为15208361453、校验位为后两位53、单位标识码为26、定值为100、系数以每个元素在数据中所处的位数、元素以除除校验位外的所有元素、数学运算以乘法为例进行说明。
种子植入时:
将原始数据中除校验位外的每个元素的值单独乘以该元素所处位数后求和,即1*1+5*2+2*3+0*4+8*5+3*6+6*7+1*8+4*9=161。
将求和后的数值与单位标识码相加后除100取余得到溯源校验码,即161+26=187,187%100=87。
将该溯源校验码替换原始数据中的校验位后得到最终的溯源数据,即溯源数据为15208361487。
如图2所示,在数据溯源追踪时采用以下步骤:
将溯源数据15208361487中除校验位外的每个元素的值单独乘以该元素所处位数后求和,即1*1+5*2+2*3+0*4+8*5+3*6+6*7+1*8+4*9=161。
将求和后的数值与单位标识码相加后除100取余得到溯源校验码,即161+26=187,187%100=87。
该溯源校验码与该手机号后两位的校验位相等,则根据单位标识码26对应的数据使用者即为当前数据使用者。
若溯源时,将单位标识码25带入上述溯源方法中,其得到溯源校验码为86,其与手机后两位不相等,则判定溯源失败。
实施例3
基于上述实施例的原理,本实施例以一数字加字母为例进行说明。
本实施例以手机号为152ACFHw1b2、校验位为后两位b2、单位标识码为26、定值为100,系数以每个元素在数据中所处的位数、元素以除除校验位外的所有元素、数学运算以乘法为例进行说明。此处该数据中的字母元素可采用其ACIIS码对应的十进制值,也可根据情况或者自定其他值,在自定时,需要说明的是,各元素之间的值不能相等。本实施例以ACIIS码对应的十进制值为例。A、C、F、H、w其ACIIS码对应的十进制值分别为65、67、69、71。
种子植入时:
将原始数据中除校验位外的每个元素的值单独乘以该元素所处位数后求和,即1*1+5*2+2*3+65*4+67*5+69*6+71*7+119*8+1*9=2484。
将求和后的数值与单位标识码相加后除100取余得到溯源校验码,即2484+26=2510,2510%100=10。
将该溯源校验码替换原始数据中的校验位后得到最终的溯源数据,即溯源数据为152ACFHw110。
在数据溯源追踪时采用以下步骤:
将溯源数据152ACFHw110中除校验位外的每个元素的值单独乘以该元素所处位数后求和,即1*1+5*2+2*3+65*4+67*5+69*6+71*7+119*8+1*9=2484。
将求和后的数值与单位标识码相加后除100取余得到溯源校验码,即2484+26=2510,2510%100=10。
该溯源校验码与该溯源数据后两位的校验位相等,则根据单位标识码26对应的数据使用者即为当前数据使用者。
若溯源时,将单位标识码25带入上述溯源方法中,其得到溯源校验码为09,其与溯源数据后两位不相等,则判定溯源失败。
实施例4
本实施例同样以手机号为152ACFHw1b2、校验位为后两位b2、单位标识码为26、定值为100,系数以每个元素在数据中所处的位数、元素以除除校验位外的所有元素、数学运算以乘法为例进行说明。基于实施例3,本实施例公开另一种方法,其获得溯源校验码元素更多,包括0-9的数字元素和大小写的26个字母元素,共62个元素,将其按0-9的数字、小写的26个字母、大写的26个字母依次构成一数组,该数组中每个元素的为下标索引依次为0-61。本实施例同样以ACIIS码对应的十进制值为例。
如图3所示,种子植入时:
将原始数据中除校验位外的每个元素的值单独乘以该元素所处位数后求和,即1*1+5*2+2*3+65*4+67*5+69*6+71*7+119*8+1*9=2484。
将求和后的数值与单位标识码相加后除10000取余得到溯源校验码,即2484+26=2510,2510%10000=2510。
对余数依次按两位取整,即分别为25和10。
分别将两个整数即25和10对62取余得到25和10,并查找由数字、字母构成的数组中与该余数对应的下标,25和10对应的数组元素为p和a,将p和a作为最终的溯源校验码。
将p和a替换原始数据中的校验位后得到最终的溯源数据,即溯源数据为152ACFHw1pa。
在数据溯源追踪时采用以下步骤:
将溯源数据152ACFHw1pa中除校验位外的每个元素的值单独乘以该元素所处位数后求和,即1*1+5*2+2*3+65*4+67*5+69*6+71*7+119*8+1*9=2484。
将求和后的数值与单位标识码相加后除10000取余得到溯源校验码,即2484+26=2510,2510%10000=2510。
对余数依次按两位取整,即分别为25和10。
分别将两个整数即25和10对62取余得到25和10,并查找由数字、字母构成的数组中与该余数对应的下标,25和10对应的数组元素为p和a,将pa作为溯源校验码与数据中后两位进行比对,且两者相等,则根据单位标识码26对应的数据使用者即为当前数据使用者。
若溯源时,将单位标识码25带入上述溯源方法中,其得到溯源校验码为p9,其与溯源数据后两位不相等,则判定溯源失败。
采用该方法,其得到的溯源校验码的元素更多。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据种子植入的方法,其特征在于,包括以下步骤:
获取原始数据;
确定原始数据的校验位;
将原始数据中除校验位外的多个元素的值分别与一系数进行数学运算后求和;
将求和后的数值与单位标识码相加后除一定值取余得到溯源校验码,该溯源校验码的位数与校验位位数相同;
将该溯源校验码替换原始数据中的校验位后得到最终的溯源数据。
2.根据权利要求1所述的一种数据种子植入的方法,其特征在于,所述定值为100。
3.根据权利要求1所述的一种数据种子植入的方法,其特征在于,所述原始数据的元素包括为数字或者/和字母,所述字母的值为ACIIS码对应的十进制值。
4.根据权利要求3所述的一种数据种子植入的方法,其特征在于,该定值为10000,所述溯源校验码在除以该定值后还包括:
对余数依次按两位取整;
分别将两个整数对62取余并查找由数字、字母构成的数组中与该余数对应的下标,将该下标对应的元素作为最终的溯源校验码。
5.根据权利要求1所述的一种数据种子植入的方法,其特征在于,所述系数为每个元素所处的位数。
6.一种数据溯源追踪的方法,其特征在于,包括以下步骤:
获取溯源数据;
将溯源数据中除校验位外的多个元素的值分别与一系数进行数学运算后求和;
将求和后的数值与单位标识码相加后除一定值取余得到溯源校验码,该溯源校验码的位数与校验位位数相同;
对比该溯源校验码与校验位是否相等,若相等,则根据单位标识码溯源。
7.根据权利要求5所述的一种数据溯源追踪的方法,其特征在于,所述定值为100。
8.根据权利要求5所述的一种数据溯源追踪的方法,其特征在于,所述溯源数据中的元素包括为数字或者/和字母,所述字母的值为ACIIS码对应的十进制值。
9.根据权利要求8所述的一种数据溯源追踪的方法,其特征在于,该定值为10000,所述溯源校验码在除以该定值后还包括:
对余数依次按两位取整;
分别将两个整数对62取余并查找由数字、字母构成的数组中与该余数对应的下标,将该下标对应的元素作为最终的溯源校验码。
10.根据权利要求8所述的一种数据溯源追踪的方法,其特征在于,所述系数为每个元素所处的位数。
CN201911143305.7A 2019-11-20 2019-11-20 一种数据种子植入及溯源追踪的方法 Pending CN110909001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911143305.7A CN110909001A (zh) 2019-11-20 2019-11-20 一种数据种子植入及溯源追踪的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911143305.7A CN110909001A (zh) 2019-11-20 2019-11-20 一种数据种子植入及溯源追踪的方法

Publications (1)

Publication Number Publication Date
CN110909001A true CN110909001A (zh) 2020-03-24

Family

ID=69816648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911143305.7A Pending CN110909001A (zh) 2019-11-20 2019-11-20 一种数据种子植入及溯源追踪的方法

Country Status (1)

Country Link
CN (1) CN110909001A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579566A (zh) * 2020-12-14 2021-03-30 浪潮云信息技术股份公司 分布式id的生成方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101207386A (zh) * 2007-11-23 2008-06-25 中山大学 一种二进制低密度奇偶校验码的构造方法
CN104115126A (zh) * 2011-12-22 2014-10-22 桑迪士克科技股份有限公司 使用代数码的多阶段ecc编码
CN105160379A (zh) * 2015-08-31 2015-12-16 浪潮软件股份有限公司 一种标识码的生成方法和装置、校验方法和装置
CN107102681A (zh) * 2016-02-23 2017-08-29 蓝思科技(长沙)有限公司 一种条码中校验码的计算方法及条码的验证方法
CN108596311A (zh) * 2018-05-08 2018-09-28 亳州中药材商品交易中心有限公司 一种溯源码及其校验码的生成方法
CN109657110A (zh) * 2018-12-13 2019-04-19 上海达梦数据技术有限公司 一种数据溯源方法以及相应的数据溯源装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101207386A (zh) * 2007-11-23 2008-06-25 中山大学 一种二进制低密度奇偶校验码的构造方法
CN104115126A (zh) * 2011-12-22 2014-10-22 桑迪士克科技股份有限公司 使用代数码的多阶段ecc编码
CN105160379A (zh) * 2015-08-31 2015-12-16 浪潮软件股份有限公司 一种标识码的生成方法和装置、校验方法和装置
CN107102681A (zh) * 2016-02-23 2017-08-29 蓝思科技(长沙)有限公司 一种条码中校验码的计算方法及条码的验证方法
CN108596311A (zh) * 2018-05-08 2018-09-28 亳州中药材商品交易中心有限公司 一种溯源码及其校验码的生成方法
CN109657110A (zh) * 2018-12-13 2019-04-19 上海达梦数据技术有限公司 一种数据溯源方法以及相应的数据溯源装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579566A (zh) * 2020-12-14 2021-03-30 浪潮云信息技术股份公司 分布式id的生成方法及装置

Similar Documents

Publication Publication Date Title
US11531778B2 (en) Privacy data reporting method and apparatus, and storage medium
US9864550B2 (en) Method and apparatus of recovering and encoding for data recovery in storage system
CN107315822B (zh) 一种知识点关联的挖掘方法
CN108108436B (zh) 数据存储方法、装置、存储介质及电子设备
CN108304409B (zh) 一种基于进位的Sketch数据结构的数据频度估计方法
Liu et al. High-speed and high-ratio referential genome compression
CN109801693B (zh) 病案分组方法及装置、终端和计算机可读存储介质
CN111597054B (zh) 一种信息处理方法、系统、电子设备及存储介质
Lou et al. Evolution of $ k $-Mer Frequencies and Entropy in Duplication and Substitution Mutation Systems
CN110909001A (zh) 一种数据种子植入及溯源追踪的方法
CN107291746B (zh) 一种存储和读取数据的方法及设备
CN112486561B (zh) 基于区块链的版本回溯方法、装置及相关设备
CN113763034A (zh) 广告数据的处理方法及装置
CN110266834B (zh) 基于互联网协议地址的地区查找方法及装置
CN108376054B (zh) 一种对标识数据进行索引的处理方法及装置
CN112530522B (zh) 序列纠错方法、装置、设备和存储介质
CN112947858B (zh) 一种raid 5校验值的更新方法、装置和介质
CN108595508B (zh) 一种基于后缀数组的自适应索引构建方法及系统
CN106776257B (zh) 一种用于系统性能测试的响应时间统计方法及装置
CN104794226A (zh) 基于HBase数据库对数据的写操作方法及装置
CN113239202B (zh) 数据处理方法、装置、服务器及存储介质
CN111339093B (zh) 用户行为数据的获取方法、装置、设备及存储介质
CN114153319B (zh) 面向用户多数据场景的频繁字符串的挖掘方法
CN116089491B (zh) 基于时序数据库的检索匹配方法和装置
CN110875744B (zh) 编码方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200324

RJ01 Rejection of invention patent application after publication