CN117077181A - 一种企业信息管理数据的存储方法 - Google Patents
一种企业信息管理数据的存储方法 Download PDFInfo
- Publication number
- CN117077181A CN117077181A CN202311329710.4A CN202311329710A CN117077181A CN 117077181 A CN117077181 A CN 117077181A CN 202311329710 A CN202311329710 A CN 202311329710A CN 117077181 A CN117077181 A CN 117077181A
- Authority
- CN
- China
- Prior art keywords
- optimal
- sequence
- subsequence
- base
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000011218 segmentation Effects 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 108020004414 DNA Proteins 0.000 description 25
- 238000007726 management method Methods 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 101100272279 Beauveria bassiana Beas gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/123—DNA computing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2107—File encryption
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biotechnology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据安全存储领域,具体涉及一种企业信息管理数据的存储方法,包括:对企业数据进行转换获得明文数据;对明文数据进行DNA编码获得碱基序列,对碱基序列分层获得多个层序列,根据分段长度获得层序列的所有子序列;根据子序列计算分段长度的优先度和合适程度,根据分段长度的合适程度获得最优长度;根据目标碱基序列、运算规则以及解码规则对层序列加密,获得层序列加密后的密文序列,获得密钥1和密钥2,对密文序列进行存储。本发明通过对层序列进行自适应分段并加密,打破了企业数据的关联性和统计特性,避免攻击者通过获得部分数据去预测或者根据统计特征去获得企业的核心信息,确保存储的数据的安全性和企业的核心竞争力。
Description
技术领域
本发明涉及数据安全存储领域,具体涉及一种企业信息管理数据的存储方法。
背景技术
企业的运行往往伴随着大量的数据,例如企业的资金流动数据以及销售、采购、生产等各个方面的生产明细数据。企业数据之间具有很强的关联性,即可以通过某个时刻的数据去预测下一时刻的数据;同时,企业数据中隐藏着许多统计特征,通过对数据进行统计分析,根据数据的统计特征可以获得企业的战略决策、业务状况、未来发展方向等企业的核心信息,这些核心信息往往代表着一个企业的核心竞争力。因此,为了避免攻击者通过获得部分数据去预测或者根据统计特征去获得企业的核心信息,确保企业数据的安全和保证企业的核心竞争力,在对企业数据进行存储时,对企业数据进行加密处理后再进行存储,并且破坏企业数据的关联性和统计特性,确保存储的数据的安全性。
传统数据加密方法通常采用置乱的方法进行数据加密,通过改变数据的位置,从而破坏数据间的关联性,以达到隐藏明文数据的目的。但置乱加密仅仅只改变了数据的位置,并没有破坏数据的统计规律,攻击者可以根据加密后的数据的统计特征获得原始数据的统计特征,进而导致重要数据特征的泄露,从而导致不可挽回的损失。
发明内容
为了解决上述问题,本发明提供一种企业信息管理数据的存储方法,所述方法包括:
采集企业数据,将企业数据转换后的二进制数据记为明文数据;
根据DNA编码规则对明文数据进行DNA编码获得碱基序列,将所有碱基序列中相同位置的所有碱基组成的序列记为层序列,获得所有碱基序列的所有层序列;
对于任意一个层序列,根据分段长度从左到右对层序列进行分段,获得层序列的所有子序列,将子序列段中频率最小的碱基记为子序列的目标碱基,根据所有子序列的所有目标碱基计算分段长度的优先度;对于任意一个子序列,根据子序列中所有碱基的频率计算子序列的排列熵;根据分段长度的优先度和分段长度对应的所有子序列的排列熵计算分段长度的合适程度,根据预设范围内所有分段长度的合适程度获得最优长度;
将层序列根据最优长度进行分段获得的所有子序列记为层序列的最优子序列;获取每一个最优子序列的目标碱基,将所有最优子序列的所有目标碱基组成的序列记为目标碱基序列;
对于层序列的任意一个最优子序列,获取最优子序列的运算规则和DNA解码规则;根据最优子序列的运算规则和目标碱基获得最优子序列的所有密文碱基,根据最优子序列的DNA解码规则对最优子序列的所有密文碱基进行解码获得最优子序列的所有密文,将层序列的所有最优子序列的所有密文组成的序列记为层序列的密文序列;
将层序列的所有最优子序列的运算规则组成的序列记为密钥1,将层序列的所有最优子序列的DNA解码规则组成的序列记为密钥2;
对密文序列、密钥1以及密钥2进行存储。
进一步地,所述根据所有子序列的所有目标碱基计算分段长度的优先度的步骤包括:
将所有子序列的所有目标碱基组成的序列记为目标碱基序列,其中,/>表示分段长度/>对应的所有子序列中的/>个子序列的目标碱基,/>表示分段长度/>对应的所有子序列的数量,其中,/>表示企业数据序列中企业数据的数量,/>表示向上取整;
预设范围为,分段长度/>是根据预设范围获得的,因此,根据预设范围可以获得7个不同的分段长度/>;
对于目标碱基序列中的第个目标碱基/>,判断目标碱基/>与目标碱基序列中的第/>个目标碱基/>是否相同,如果相同,则判断结果/>,否则,判断结果/>;
将分段长度对应的目标碱基序列中所有目标碱基的判断结果的均值作为分段长度/>的优先度/>。
进一步地,所述根据分段长度的优先度和分段长度对应的所有子序列的排列熵计算分段长度的合适程度的步骤包括:
分段长度的合适程度的计算公式为:
式中,表示分段长度/>的合适程度,/>表示分段长度/>的优先度,/>表示分段长度/>对应的所有子序列中的第/>个子序列的排列熵,/>表示归一化系数,/>表示分段长度/>对应的所有子序列的数量。
进一步地,所述根据预设范围内所有分段长度的合适程度获得最优长度的步骤包括:
根据不同的分段长度获得层序列的不同长度的子序列,根据层序列的不同长度的子序列计算不同分段长度的合适程度,获取层序列的所有不同分段长度的合适程度,将最大的合适程度对应的分段长度作为层序列的最优长度。
进一步地,所述获取最优子序列的运算规则和DNA解码规则的步骤包括:
从DNA编码的4种运算规则中随机选择一个运算规则作为最优子序列的运算规则,从8种DNA编码解码规则中随机选择一种规则作为最优子序列的DNA解码规则。
进一步地,所述根据最优子序列的运算规则和目标碱基获得最优子序列的所有密文碱基的步骤包括:
对于层序列的第个最优子序列,第/>个最优子序列中的第/>个碱基进行加密后的结果记为第/>个密文碱基,根据第/>个最优子序列的运算规则对第/>个碱基和第/>个密文碱基进行运算,获得第/>个最优子序列的目标碱基,其中,第/>个碱基和第/>个密文碱基作为运算的对象,目标碱基作为运算的结果,由于第/>个碱基、运算规则以及目标碱基已知,可以获得第/>个密文碱基。
本发明实施例至少具有如下有益效果:
本发明通过最优长度对层序列进行分段获得子序列,保证不同的子序列的目标碱基不同,同时保证分段后的每个子序列中的碱基足够混乱,使不同子序列中的相同碱基的加密结果即密文不同,使最终的加密结果的统计特性与企业数据的统计特性不同,打破企业数据的关联性和统计特性,避免攻击者通过获得部分数据去预测或者根据统计特征去获得企业的核心信息,保护了企业数据的安全性和企业的核心竞争力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例提供的一种企业信息管理数据的存储方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种企业信息管理数据的存储方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种企业信息管理数据的存储方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种企业信息管理数据的存储方法的步骤流程图,该方法包括以下步骤:
步骤S001,采集企业数据,对企业数据转换为二进制数据,获得明文数据。
将企业中所有需要加密存储的数据记为企业数据,包括资金流动数据以及销售、采购、生产等各个方面的生产明细数据,且企业数据为十进制数据;将预设数量个企业数据组成的序列记为企业数据序列。
在本实施例中,预设数量为,在其他实施例中,实施人员可根据需要设置预设数量。
计算机通常处理的是二进制数据,因此通过二进制编码将采集到的十进制的企业数据转换为二进制数据,获取企业数据序列中最大的企业数据的二进制数据的长度,将作为基准长度/>,将所有企业数据转换为长度为基准长度的二进制数据,将每个企业数据对应的二进制数据记为明文数据。例如:企业数据中最大的数据为/>,则最大的数据的二进制编码的长度/>,则基准长度为/>,通过二进制编码将企业数据 64转换为二进制数据为001000000,则二进制数据为001000000为企业数据的明文数据。
步骤S002,对明文数据进行DNA编码获得碱基序列,对碱基序列进行分层获得多个层序列。
1、对明文数据进行DNA编码获得碱基序列。满足互补的DNA编码解码规则共有8种,选择规则1对明文数据进行DNA编码,获得明文数据的碱基序列,其中,规则1是将二进制分别编码为碱基/>,长度对于基准长度/>的明文数据的碱基序列的长度为/>,获得所有明文数据的所有碱基序列。
例如,对于明文数据,采用规则1进行DNA编码后获得的碱基序列分别为/>。
2、对碱基序列进行分层获得多个层序列。将所有碱基序列中相同位置的所有碱基组成的序列记为层序列,由于碱基序列的长度为,因此,通过对碱基序列进行分层获得/>个层序列。
例如,对碱基序列进行分层,获得五个层序列,分别为/>。
步骤S003,根据分段长度获得层序列的所有子序列;根据所有子序列计算分段长度的优先度;计算分段长度的合适程度,根据所有分段长度的合适程度获得最优长度。
需要说明的是,企业数据具有关联性和统计特性,为了避免攻击者通过企业数据去预测或者根据统计特征去获得企业的核心信息,确保企业数据的安全性和企业的核心竞争力,本发明的加密方法需要破坏企业数据的关联性和统计特性,以此确保存储的企业数据的安全性。
本发明的加密方法是通过运算规则对层序列的每个碱基和密文进行运算获得目标碱基,其中,运算规则、碱基以及目标碱基都是已知的,只有密文是未知,因此,运算规则、碱基以及目标碱基决定了密文。
因此,本发明对层序列进行分段获得多个子序列,只要保证每个子序列的运算规则和目标碱基不同,则对于不同子序列中的相同碱基的加密结果即密文不同,以此使最终的加密结果的统计特性与企业数据的统计特性不同,打破企业数据的统计特性,以此确保存储的企业数据的安全性。其中,由于目标碱基是子序列中频率最小的碱基,为了保证不同的子序列的目标碱基不同,在根据分段长度对层序列进行分段获得子序列时,需要保证相邻的子序列中频率最小的碱基不同;因此,在获取最优长度时,计算分段长度的合适程度时需要结合相邻的子序列的目标碱基,使根据最优长度进行分段获得的子序列中,相邻的子序列的目标碱基即频率最小的碱基不同。
同理,本发明对层序列进行分段获得多个子序列,由于同一个子序列的运算规则和目标碱基相同,因此对相同的碱基进行加密后的密文也相同,企业数据的关联性依然能够从加密后的密文中体现出来,因此,为了打破企业数据的关联性,在对层序列进行分段时,需要使相邻且相同的碱基被划分在不同的子序列中,也即是保证分段后的每个子序列中的碱基尽可能混乱;因此,在获取最优长度时,计算分段长度的合适程度时需要结合每个子序列中的碱基的混乱程度,使根据最优长度进行分段获得的子序列中碱基的混乱程度大。
在本实施例中,通过分段长度的合适程度获得每个层序列的最优长度,对于任意一个层序列,获得层序列的最优长度的步骤为:
1、分段长度的取值范围为/>,根据分段长度从左到右对层序列进行分段,获得层序列的所有子序列,每个子序列的长度为分段长度,最后长度小于分段长度的部分也算作一个子序列。
2、根据分段长度对应的所有子序列,计算分段长度的优先度。
对于分段长度对应的所有子序列,统计获取每一个子序列段中频率最小的碱基,记为子序列的目标碱基,将所有子序列的所有目标碱基组成的序列记为目标碱基序列,其中,/>表示分段长度/>对应的所有子序列中的/>个子序列的目标碱基,/>表示分段长度/>对应的所有子序列的数量,其中,/>表示企业数据序列中企业数据的数量,/>表示向上取整。
对于目标碱基序列中的第个目标碱基/>,判断目标碱基/>与目标碱基序列中的第/>个目标碱基/>是否相同,如果相同,则判断结果/>,否则,判断结果/>。
将分段长度对应的目标碱基序列中所有目标碱基的判断结果的均值作为分段长度/>的优先度/>。分段长度/>的优先度/>的值越大,说明相邻的子序列的目标碱基即频率最小的碱基不同,对于不同子序列中的相同碱基的加密结果即密文越可能不同,最终的加密结果的统计特性与企业数据的统计特性越不同,打破企业数据的统计特性,以此确保存储的企业数据的安全性。
3、计算分段长度的合适程度。
对于分段长度对应的所有子序列中的第/>个子序列,根据该子序列中所有碱基的频率计算该子序列的排列熵/>,获得分段长度/>对应的所有子序列的排列熵;子序列的排列熵越大,则子序列中的碱基的混乱程度越大。
根据分段长度的优先度/>和分段长度/>对应的所有子序列的排列熵/>获得分段长度/>的合适程度,分段长度/>的合适程度的计算公式为:
式中,表示分段长度/>的合适程度,/>表示分段长度/>的优先度,/>表示分段长度/>对应的所有子序列中的第/>个子序列的排列熵,/>表示归一化系数,/>表示分段长度/>对应的所有子序列的数量。
分段长度的优先度/>的值越大,说明相邻的子序列的目标碱基即频率最小的碱基不同,越能够打破企业数据的统计特性;分段长度/>对应的子序列的排列熵越大,则子序列中的碱基的混乱程度越大,越能够打破企业数据的关联性;因此,分段长度/>的优先度/>的值越大,且分段长度/>对应的子序列的排列熵越大,分段长度/>的合适程度越大,加密后的密文与企业数据的统计特性和关联性越不相同,加密后的加密效果越好,加密存储的企业数据的安全性越高。
4、根据所有分段长度的合适程度获得最优长度。
对于层序列,根据不同的分段长度获得层序列的不同长度的子序列,根据层序列的不同长度的子序列计算不同分段长度的合适程度;对于层序列,获得7个不同分段长度的合适程度,将最大的合适程度对应的分段长度作为层序列的最优长度,将层序列根据最优长度获得的所有子序列记为层序列的最优子序列;获取每一个最优子序列的目标碱基,将所有最优子序列的所有目标碱基组成的序列记为目标碱基序列。
本发明通过最优长度对层序列进行分段获得子序列,保证不同的子序列的目标碱基不同,同时保证分段后的每个子序列中的碱基足够混乱,使不同子序列中的相同碱基的加密结果即密文不同,使最终的加密结果的统计特性与企业数据的统计特性不同,打破企业数据的关联性和统计特性,避免攻击者通过获得部分数据去预测或者根据统计特征去获得企业的核心信息,保护了企业数据的安全性和企业的核心竞争力。
步骤S004,根据目标碱基序列、运算规则以及解码规则对层序列进行加密,获得层序列加密后的密文序列,获得密钥1和密钥2。
对层序列的第个最优子序列进行加密的具体步骤为:
1、从DNA编码的运算规则中随机选择一个运算规则作为第个最优子序列的运算规则,DNA编码的运算规则有4种,分为加法运算、减法运算、异或运算以及同或运算。
2、将第个最优子序列中的第/>个碱基进行加密后的结果记为第/>个密文碱基,根据第/>个最优子序列的运算规则对第/>个碱基和第/>个密文碱基进行运算,获得第/>个最优子序列的目标碱基,其中,第/>个碱基和第/>个密文碱基作为运算的对象,目标碱基作为运算的结果,由于第/>个碱基、运算规则以及目标碱基已知,可以获得第/>个密文碱基。
例如,最优子序列中的一个碱基为,该最优子序列的目标碱基为/>,该最优子序列的运算规则为第4种运算规则即同或运算,由于碱基/>和碱基/>通过同或运算的运算结果为碱基/>即目标碱基,因此,碱基/>为碱基/>加密后的密文碱基,即对碱基/>进行加密后的密文碱基为碱基/>。
3、从DNA编码解码规则中随机选择一种规则作为第个最优子序列的DNA解码规则,满足互补的DNA编码解码规则共有8种,分别记为规则1到规则8。对于第/>个最优子序列中的第/>个碱基加密后的密文碱基,通过第/>个最优子序列的DNA解码规则对密文碱基进行解码,将解码结果记为第/>个最优子序列中的第/>个碱基的密文,将层序列的所有最优子序列的所有碱基的所有密文组成的序列记为层序列的密文序列。
例如,最优子序列的DNA解码规则为第4种,即选择规则4对最优子序列进行DNA解码,规则4是将碱基分别解码为二进制/>,因此,对碱基/>加密后的密文碱基/>进行解码,解码后的密文为00。
4、将层序列的所有最优子序列的运算规则组成的序列记为密钥1,将层序列的所有最优子序列的DNA解码规则组成的序列记为密钥2。
5、将得到的密文序列存储到企业信息管理系统的存储器上,并将密钥1和密钥2保存到U盘等离线设备上,保证只有企业中具有一定权限的人员可以得到密钥1和密钥2,以保证企业信息管理数据的安全存储;当需要读取加密的数据时,只需将保存密钥1和密钥2的离线设备连接上企业信息管理系统的存储器进行数据解密即可。
6、对存储的密文序列进行解密过程为:根据最优长度将密文序列进行分段获得所有密文段,对于第个密文段,根据密钥2中第/>个DNA解码规则对应的DNA编码规则,对该密文段进行DNA编码获得该密文段的碱基序列,根据密钥1中第/>个运算规则,对该密文段的碱基序列中的每个碱基进行运算获得对应的明文碱基,根据规则1对明文碱基进行DNA解码获得二进制数,将所有密文段的所有二进制组成的序列记为明文序列,根据长度/>对明文序列进行分段获得所有明文子序列,将每个明文子序列转变换位十进制数,获得的所有十进制数组成的序列即为解密获得的企业数据。
综上所述,本发明通过最优长度对层序列进行分段获得子序列,保证不同的子序列的目标碱基不同,同时保证分段后的每个子序列中的碱基足够混乱,使不同子序列中的相同碱基的加密结果即密文不同,使最终的加密结果的统计特性与企业数据的统计特性不同,打破企业数据的关联性和统计特性,避免攻击者通过获得部分数据去预测或者根据统计特征去获得企业的核心信息,保护了企业数据的安全性和企业的核心竞争力。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。
Claims (6)
1.一种企业信息管理数据的存储方法,其特征在于,所述方法包括:
采集企业数据,将企业数据转换后的二进制数据记为明文数据;
根据DNA编码规则对明文数据进行DNA编码获得碱基序列,将所有碱基序列中相同位置的所有碱基组成的序列记为层序列,获得所有碱基序列的所有层序列;
对于任意一个层序列,根据分段长度从左到右对层序列进行分段,获得层序列的所有子序列,将子序列段中频率最小的碱基记为子序列的目标碱基,根据所有子序列的所有目标碱基计算分段长度的优先度;对于任意一个子序列,根据子序列中所有碱基的频率计算子序列的排列熵;根据分段长度的优先度和分段长度对应的所有子序列的排列熵计算分段长度的合适程度,根据预设范围内所有分段长度的合适程度获得最优长度;
将层序列根据最优长度进行分段获得的所有子序列记为层序列的最优子序列;获取每一个最优子序列的目标碱基,将所有最优子序列的所有目标碱基组成的序列记为目标碱基序列;
对于层序列的任意一个最优子序列,获取最优子序列的运算规则和DNA解码规则;根据最优子序列的运算规则和目标碱基获得最优子序列的所有密文碱基,根据最优子序列的DNA解码规则对最优子序列的所有密文碱基进行解码获得最优子序列的所有密文,将层序列的所有最优子序列的所有密文组成的序列记为层序列的密文序列;
将层序列的所有最优子序列的运算规则组成的序列记为密钥1,将层序列的所有最优子序列的DNA解码规则组成的序列记为密钥2;
对密文序列、密钥1以及密钥2进行存储。
2.根据权利要求1所述的一种企业信息管理数据的存储方法,其特征在于,所述根据所有子序列的所有目标碱基计算分段长度的优先度的步骤包括:
将所有子序列的所有目标碱基组成的序列记为目标碱基序列,其中,/>表示分段长度/>对应的所有子序列中的/>个子序列的目标碱基,/>表示分段长度/>对应的所有子序列的数量,其中,/>表示企业数据序列中企业数据的数量,/>表示向上取整;
预设范围为,分段长度/>是根据预设范围获得的,因此,根据预设范围可以获得7个不同的分段长度/>;
对于目标碱基序列中的第个目标碱基/>,判断目标碱基/>与目标碱基序列中的第/>个目标碱基/>是否相同,如果相同,则判断结果/>,否则,判断结果/>;
将分段长度对应的目标碱基序列中所有目标碱基的判断结果的均值作为分段长度/>的优先度/>。
3.根据权利要求2所述的一种企业信息管理数据的存储方法,其特征在于,所述根据分段长度的优先度和分段长度对应的所有子序列的排列熵计算分段长度的合适程度的步骤包括:
分段长度的合适程度的计算公式为:
式中,表示分段长度/>的合适程度,/>表示分段长度/>的优先度,/>表示分段长度/>对应的所有子序列中的第/>个子序列的排列熵,/>表示归一化系数,/>表示分段长度/>对应的所有子序列的数量。
4.根据权利要求1所述的一种企业信息管理数据的存储方法,其特征在于,所述根据预设范围内所有分段长度的合适程度获得最优长度的步骤包括:
根据不同的分段长度获得层序列的不同长度的子序列,根据层序列的不同长度的子序列计算不同分段长度的合适程度,获取层序列的所有不同分段长度的合适程度,将最大的合适程度对应的分段长度作为层序列的最优长度。
5.根据权利要求1所述的一种企业信息管理数据的存储方法,其特征在于,所述获取最优子序列的运算规则和DNA解码规则的步骤包括:
从DNA编码的4种运算规则中随机选择一个运算规则作为最优子序列的运算规则,从8种DNA编码解码规则中随机选择一种规则作为最优子序列的DNA解码规则。
6.根据权利要求3所述的一种企业信息管理数据的存储方法,其特征在于,所述根据最优子序列的运算规则和目标碱基获得最优子序列的所有密文碱基的步骤包括:
对于层序列的第个最优子序列,第/>个最优子序列中的第/>个碱基进行加密后的结果记为第/>个密文碱基,根据第/>个最优子序列的运算规则对第/>个碱基和第/>个密文碱基进行运算,获得第/>个最优子序列的目标碱基,其中,第/>个碱基和第/>个密文碱基作为运算的对象,目标碱基作为运算的结果,由于第/>个碱基、运算规则以及目标碱基已知,可以获得第/>个密文碱基。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311329710.4A CN117077181B (zh) | 2023-10-16 | 2023-10-16 | 一种企业信息管理数据的存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311329710.4A CN117077181B (zh) | 2023-10-16 | 2023-10-16 | 一种企业信息管理数据的存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117077181A true CN117077181A (zh) | 2023-11-17 |
CN117077181B CN117077181B (zh) | 2024-01-09 |
Family
ID=88706411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311329710.4A Active CN117077181B (zh) | 2023-10-16 | 2023-10-16 | 一种企业信息管理数据的存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117077181B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101183432A (zh) * | 2007-12-07 | 2008-05-21 | 上海盛锐软件技术有限公司 | 牲畜产品跟踪控制方法 |
CN102063643A (zh) * | 2010-12-13 | 2011-05-18 | 北京航空航天大学 | 一种基于dna计算的智能优化仿真方法 |
US20170185712A1 (en) * | 2014-02-06 | 2017-06-29 | Genalice B.V. | A method of storing/reconstructing a multitude of sequences in/from a data storage structure |
CN112711935A (zh) * | 2020-12-11 | 2021-04-27 | 中国科学院深圳先进技术研究院 | 编码方法、解码方法、装置及计算机可读存储介质 |
CN115514375A (zh) * | 2022-11-18 | 2022-12-23 | 江苏网进科技股份有限公司 | 一种缓存数据压缩方法 |
-
2023
- 2023-10-16 CN CN202311329710.4A patent/CN117077181B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101183432A (zh) * | 2007-12-07 | 2008-05-21 | 上海盛锐软件技术有限公司 | 牲畜产品跟踪控制方法 |
CN102063643A (zh) * | 2010-12-13 | 2011-05-18 | 北京航空航天大学 | 一种基于dna计算的智能优化仿真方法 |
US20170185712A1 (en) * | 2014-02-06 | 2017-06-29 | Genalice B.V. | A method of storing/reconstructing a multitude of sequences in/from a data storage structure |
CN112711935A (zh) * | 2020-12-11 | 2021-04-27 | 中国科学院深圳先进技术研究院 | 编码方法、解码方法、装置及计算机可读存储介质 |
CN115514375A (zh) * | 2022-11-18 | 2022-12-23 | 江苏网进科技股份有限公司 | 一种缓存数据压缩方法 |
Non-Patent Citations (2)
Title |
---|
ILAN SHOMORONY 等: "DNA-Based Storage: Models and Fundamental Limits", IEEE TRANSACTIONS ON INFORMATION THEORY, vol. 67, no. 6, XP011856204, DOI: 10.1109/TIT.2021.3058966 * |
许鹏 等: "DNA存储及其研究进展", 电子与信息学报, vol. 42, no. 6 * |
Also Published As
Publication number | Publication date |
---|---|
CN117077181B (zh) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alawida et al. | An image encryption scheme based on hybridizing digital chaos and finite state machine | |
US8284933B2 (en) | Encrypting variable-length passwords to yield fixed-length encrypted passwords | |
CN115865523B (zh) | 一种用于信息分析系统的数据加密传输方法 | |
CN115272502B (zh) | 一种基于编码转换的软件研发数据安全管理方法 | |
CN108366181A (zh) | 一种基于超混沌系统和多级置乱的图像加密方法 | |
US20180287779A1 (en) | White-box cryptography method and apparatus for preventing side channel analysis | |
CN115150201B (zh) | 一种云计算数据的远程加密传输方法 | |
CN115941189B (zh) | 一种用于文档数据的加密方法 | |
CN116582263A (zh) | 一种用于企业数字化管理平台的安防系统 | |
CN1536810A (zh) | 产生由n个数字构成的字的伪随机排列的方法 | |
Gao et al. | High-performance reversible data hiding in encrypted images with adaptive Huffman code | |
CN116071164A (zh) | 一种基于区块链管理的数字资产溯源方法 | |
CN117077181B (zh) | 一种企业信息管理数据的存储方法 | |
Singh et al. | Deep learning-based biometric image feature extraction for securing medical images through data hiding and joint encryption–compression | |
Wang et al. | [Retracted] High‐Capacity Reversible Data Hiding in Encrypted Images Based on Prediction Error Compression and Block Selection | |
Amrit et al. | Deep learning-based segmentation for medical data hiding with Galois field | |
Lee | Reversible data hiding for DNA sequence using multilevel histogram shifting | |
CN115333720B (zh) | 一种呼叫中心数据传输方法 | |
CN110957003B (zh) | 一种面向用户隐私保护的高效基因比对方法 | |
CN115190216B (zh) | 基于预测误差图的加密图像可逆数据隐藏及解密方法 | |
CN115103081B (zh) | 基于混合预测和哈夫曼编码的加密图像可逆数据隐藏方法 | |
CN115379066A (zh) | 基于自适应压缩编码的加密图像可逆数据加密解密方法 | |
Ren et al. | A novel reversible data hiding method in encrypted images using efficient parametric binary tree labeling | |
Gupta et al. | An Enhanced Security in Medical Image Encryption Based on Multi-level Chaotic DNA Diffusion | |
CN116405293B (zh) | 安全运维系统的数据加密存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |