CN116663069A - 基于数据编码的数据库安全加密方法及系统 - Google Patents
基于数据编码的数据库安全加密方法及系统 Download PDFInfo
- Publication number
- CN116663069A CN116663069A CN202310952012.3A CN202310952012A CN116663069A CN 116663069 A CN116663069 A CN 116663069A CN 202310952012 A CN202310952012 A CN 202310952012A CN 116663069 A CN116663069 A CN 116663069A
- Authority
- CN
- China
- Prior art keywords
- data
- frequency
- character
- continuous
- original data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000006835 compression Effects 0.000 claims abstract description 10
- 238000007906 compression Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 description 7
- 238000013139 quantization Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及数据处理技术领域,提出了基于数据编码的数据库安全加密方法及系统,包括:采集数据库中的地理信息数据作为原始数据;对原始数据进行LZW编码,得到第一编码结果,根据第一编码结果获取原始数据中的若干连续段,得到每个连续段的高频字符集合;根据每个连续段的高频字符集合获取若干择一序列,根据择一序列中不同字符在不同连续段中的字符频率,获取每个择一序列的优选程度,进而得到原始数据的初始列表;根据初始列表进行MTF编码,再进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。本发明旨在解决数据库中大量数据压缩后加密得到的密文能够反映部分原数据明文信息的问题。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及基于数据编码的数据库安全加密方法及系统。
背景技术
在测绘地理信息领域中,有大量的矢量及点位信息存储在数据库中,实现地理信息数据的统一管理;然而随着更新频率的加快使得数据量成倍增长,因此需要对原始数据先进行压缩,再通过对压缩后的数据进行加密,实现对数据库中地理信息数据的安全管理。
现有技术中LZW算法由于编码效果较好,通常采用LZW算法对地理信息数据进行压缩,而后利用现有加密算法实现加密,然而现有加密算法容易在密文中获取部分明文分布信息,同时LZW压缩后数据也容易从编码后数据中体现编码前数据的分布信息,因此现有方法会导致数据库中的地理信息数据的加密安全性较低;因此可以通过对LZW算法的编码结果进行分析,根据编码结果中容易被暴露的明文信息,获取MTF算法的初始列表进而重新编码,从而破坏原始数据的明文分布信息,再进行LZW压缩及加密,避免了明文分布信息的保留,提高数据库中地理信息数据的加密安全性。
发明内容
本发明提供基于数据编码的数据库安全加密方法及系统,以解决现有的数据库中大量数据压缩后加密得到的密文能够反映部分原数据明文信息的问题,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了基于数据编码的数据库安全加密方法,该方法包括以下步骤:
采集数据库中的地理信息数据作为原始数据;
根据原始数据的第一编码结果,获取原始数据的若干连续段;根据每个连续段中字符的字符频次,得到每个连续段的高频字符集合;
根据所有高频字符集合获取的若干择一序列中,每个择一序列中元素在不同连续段中的字符频率,获取每个择一序列的优选程度,将优选程度最大的择一序列作为原始数据的初始列表;
对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
进一步的,所述原始数据的若干连续段,具体的获取方法为:
根据原始数据的第一编码结果,得到第一编码结果的若干段连续区域;获取每段连续区域在原始数据对应的一段数据,将每段数据记为原始数据的一个连续段,得到原始数据的若干连续段。
进一步的,所述得到第一编码结果的若干段连续区域,包括的具体方法为:
对原始数据进行LZW编码,得到原始数据的第一编码结果,将第一编码结果中每个元素都减去相邻前一个元素得到一个差值,按照第一编码结果中元素顺序对得到的差值进行排序,得到第一编码结果的差值序列;
对差值序列中所有值为1的元素进行标记,记为差值序列中的标记元素,将标记元素连续分布的数量大于等于标记数量的部分,记为一段标记区域,对差值序列得到若干段标记区域;
获取每段标记区域在第一编码结果中对应的区域,记为第一编码结果中的连续区域。
进一步的,所述得到每个连续段的高频字符集合,包括的具体方法为:
以任意一个连续段为目标连续段,对目标连续段进行字符频次统计,根据每个字符对应的字符频次,通过OTSU多阈值分割,将目标连续段中字符划分为多个类别;
对每个类别中所有字符对应的字符频次求均值,将均值作为每个类别的类别频次,将类别频次最大的类别作为目标连续段的高频字符集合;获取每个连续段的高频字符集合。
进一步的,所述每个择一序列的优选程度,具体的获取方法为:
从每个连续段的高频字符集合中任意选择一个高频字符,将选择的所有高频字符按照对应连续段在原始数据中的顺序进行排列,得到若干择一序列;
以任意一个择一序列为目标择一序列,目标择一序列的优选程度的计算方法为:
,
其中,表示目标择一序列中元素数量,/>表示目标择一序列中出现重复的元素数量,/>表示目标择一序列中第/>个元素在对应连续段的字符频率,/>表示目标择一序列中第/>个元素在其他连续段的字符频率均值,/>表示以自然常数为底的指数函数;
所述目标择一序列中第个元素在其他连续段的字符频率均值的获取方法为:获取除第/>个元素对应连续段之外的其他连续段中,存在第/>个元素对应字符的连续段,对这些连续段中第/>个元素对应的字符在连续段中的字符频率求均值,得到/>。
第二方面,本发明另一个实施例提供了基于数据编码的数据库安全加密系统,该系统包括:
数据库采集模块,采集数据库中的地理信息数据作为原始数据;
数据处理分析模块:根据原始数据的第一编码结果,获取原始数据的若干连续段;根据每个连续段中字符的字符频次,得到每个连续段的高频字符集合;
根据所有高频字符集合获取的若干择一序列中,每个择一序列中元素在不同连续段中的字符频率,获取每个择一序列的优选程度,将优选程度最大的择一序列作为原始数据的初始列表;
数据编码加密模块,对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
本发明的有益效果是:本发明通过对测绘地理信息领域的数据库中的地理信息数据分批次进行加密存储,每批次作为一份原始数据,通过对原始数据获取初始列表,根据MTF编码得到第二编码结果,再进行LZW编码压缩及AES加密,通过初始列表的获取提高第二编码结果与原始数据的字符分布信息的差异,进而保证压缩及加密后的数据不会呈现过多原始数据的字符分布信息,提高数据库的加密安全性;其中初始列表获取过程中,首先对原始数据通过LZW编码结果进行分析,得到若干连续段,根据连续段中高频字符得到择一序列,通过对每个择一序列的元素不重复性以及元素的字符频率仅在对应连续段较高的特性进行分析,得到作为初始列表的择一序列,保证根据初始列表进行MTF编码可以最大程度破坏原始数据的字符分布信息,提高最终的加密效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的基于数据编码的数据库安全加密方法流程示意图;
图2为本发明另一个实施例所提供的基于数据编码的数据库安全加密系统结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明一个实施例所提供的基于数据编码的数据库安全加密方法流程图,该方法包括以下步骤:
步骤S001、采集数据库中的地理信息数据作为原始数据。
本实施例的目的是对数据库中的大量地理信息数据进行安全加密,因此首先需要获取数据库中的地理信息数据,由于测绘地理信息领域的地理信息数据产生频率较高,本实施例对每100条地理信息数据进行一次处理;对于任意一条地理信息数据,其中包括一次测量产生的大量矢量数据以及点位信息数据,矢量及点位信息为测绘地理信息领域的公知技术,本实施例不再赘述;而为了便于存储,各条目通常采用数字或字母形式进行表示,因此每条地理信息数据中都包含若干字符;将任意一次待处理的若干地理信息数据,作为原始数据,进行后续处理。
至此,获取到了数据库中的地理信息数据,并作为原始数据进行后续处理。
步骤S002、对原始数据进行LZW编码,得到第一编码结果,根据第一编码结果获取原始数据中的若干连续段,根据每个连续段中的字符频次,得到每个连续段的高频字符集合。
需要说明的是,对原始数据进行加密过程中,由于原始数据的数据量较大,通常采用LZW算法先进行压缩编码,再对压缩后数据进行加密;然而LZW算法得到的编码结果中连续差值为1的数值会一定程度反映原始数据中的字符分布信息,通过对编码结果进行加密,常规的加密算法同样不会过度破坏字符分布信息,进而导致最终得到的加密结果容易破解得到原始数据的字符分布信息,从而降低数据库中地理信息数据的加密安全性;因此需要根据LZW算法得到的编码结果中,连续分布的数值即连续差值为1的数值,对原始数据中的连续段进行提取,编码结果中连续分布中断,表明对应位置引用了LZW算法的字典映射;通过对连续段的提取,结合MIF编码可以使得相近字符的编码结果形成连续游程,再对MTF的编码结果进行LZW编码,提高原始数据与压缩后数据的差异,进而避免加密后数据容易破解得到原始数据的字符分布信息。
具体的,对于原始数据,首先对原始数据进行LZW编码,得到的编码结果记为原始数据的第一编码结果,其中本实施例在LZW编码过程中对原始数据中所有字符进行初始化,得到初始化的字典再进行编码,LZW算法及字典初始化均为公知技术,本实施例不再赘述;获取到第一编码结果后,第一编码结果实际为一个数值序列,数值序列中每个元素对应的是字典中的映射值,将数值序列中每个元素都减去相邻前一个元素得到一个差值,按照数值序列中元素顺序对得到的差值进行排序,得到第一编码结果的差值序列,需要说明的是,数值序列中第一个元素不参与差值计算,将数值序列中第二个元素减去第一个元素得到的差值作为差值序列的第一个元素;则得到了第一编码结果的差值序列。
进一步的,对差值序列中所有值为1的元素进行标记,记为差值序列中的标记元素,预设标记数量,本实施例标记数量采用2进行叙述,将标记元素连续分布的数量大于等于标记数量的部分,记为一段标记区域,则对差值序列得到了若干段标记区域,每段标记区域即为连续分布的标记元素;获取每段标记区域在第一编码结果中对应的区域,记为第一编码结果中的连续区域,需要说明的是,由于差值由相邻元素相减得到,获取连续区域过程中需要得到标记区域中第一个元素获取过程中减数在第一编码结果中对应的元素,则标记区域中的元素数量会比对应的连续区域中的元素数量少一个;获取到第一编码结果中的若干连续区域后,获取每段连续区域在原始数据对应的一段数据,将每段数据记为原始数据的一个连续段,则得到了原始数据的若干连续段;例如字符串abcbcabcabcd,初始映射为a=1、b=2、c=3以及d=4,则第一编码结果为[1 2 3 6 5 3 9 4],差值序列为[1 1 3 -1 -2 6 -5],则连续区域为[1 2 3],连续段为abc。
进一步需要说明的是,由于MTF的作用是使得编码结果中的相近字符聚到一块,因此若通过MTF达到编码结果中不体现明文信息的目的,只需使得MTF编码结果中每个连续段变成单字符游程,进而在LZW编码结果中,达到掩盖明文分布信息的目的;因此需要获取每个连续段的高频字符,同时尽量保证高频字符在所有连续段仅出现一次,即某个高频字符在某个连续段为高频字符,在其他连续段均不是高频字符,因此首先需要对每个连续段进行高频字符的获取,得到每个连续段的高频字符集合。
具体的,以任意一个连续段为例,对该连续段进行字符频次统计,根据每个字符对应的字符频次,通过OTSU多阈值分割,将该连续段中字符划分为多个类别,相同类别中各字符对应的字符频次差异较小,不同类别中各字符对应的字符频次差异较大,需要说明的是,多阈值分割针对不同字符进行分割,因此得到的每个类别中不会存在相同字符;对每个类别中所有字符对应的字符频次求均值,将均值作为每个类别的类别频次,将类别频次最大的类别作为该连续段的高频字符集合,即是将类别频次最大的类别中的字符作为高频字符,该类别作为高频字符集合;按照上述方法获取每个连续段的高频字符集合。
至此,根据LZW算法得到的第一编码结果,获取到了原始数据的若干连续段,并对每个连续段获取了高频字符集合,用于后续获取MTF的初始列表,从而形成连续游程来提高原始数据与压缩后数据的字符分布信息的差异。
步骤S003、根据每个连续段的高频字符集合获取若干择一序列,根据择一序列中不同字符在不同连续段中的字符频率,获取每个择一序列的优选程度,进而得到原始数据的初始列表。
需要说明的是,获取到高频字符集合后,则根据所有高频字符集合构建择一序列,择一序列即是从每个高频字符集合选择一个元素,按顺序排列形成一个择一序列,对于择一序列作为初始列表的优选程度,需要从择一序列中元素的不重复性,以及每个元素在其他连续段中的字符频率进行量化;择一序列中不重复的元素占比越大,择一序列优选程度越大;择一序列中每个元素在除对应连续段之外其他连续段中字符频率越小,择一序列的优选程度就越大;通过上述判断获取择一序列的优选程度,最终得到原始数据进行MTF编码的初始列表。
具体的,从每个连续段的高频字符集合中任意选择一个高频字符,将选择的所有高频字符按照对应连续段在原始数据中的顺序进行排列,得到一个择一序列,由于高频字符任意选择,则可以得到若干择一序列,例如第一个连续段的高频字符集合为{a b},第二个连续段的高频字符集合为{a c},第三个连续段的高频字符集合为{f g},则所有的择一序列为:[a a f]、[a a g]、[a c f]、[a c g]、[b a f]、[b a g]、[b c f]及[b c g]。
进一步的,以任意一个择一序列为例,该择一序列的优选程度的计算方法为:
,
其中,表示该择一序列中元素数量,即原始数据中连续段的数量,/>表示该择一序列中出现重复的元素数量,需要说明的是,出现重复表示在该择一序列中不止一次出现,重复的元素不一定完全相同,例如择一序列[a b a c a b],则其中a和b均为重复的元素,重复元素数量为5;/>表示该择一序列中第/>个元素在对应连续段的字符频率,/>表示该择一序列中第/>个元素在其他连续段的字符频率均值,所述第/>个元素在其他连续段的字符频率均值的获取方法为:首先获取除第/>个元素对应连续段之外的其他连续段中,存在第/>个元素对应字符的连续段,对这些连续段中第/>个元素对应的字符在连续段中的字符频率求均值,则得到了/>;/>表示以自然常数为底的指数函数,本实施例采用/>函数来呈现反比例关系及归一化处理,实施者可根据实际情况设置反比例函数及归一化函数;
首先通过不重复的元素数量的占比来反映优选程度,不重复的元素数量占比越大,择一序列的优选程度越大;再对择一序列中每个元素进行字符频率的相关量化,元素在对应连续段中为高频字符,字符频率较大,而在其他连续段中字符频率均值越小,则元素代表对应连续段的效果越好,优选程度就越大,通过对不同元素的字符频率量化得到的值求均值,作为择一序列中元素的字符频率量化部分;其中由于在其他连续段中字符频率均值可能为0,因此将字符频率均值作为分子部分,同时通过函数得到字符频率量化的最大值1,避免分母为0影响计算结果,同时保证不重复元素数量占比部分,与字符频率量化部分的值域范围均为/>,保证量纲统一,最终得到择一序列的优选程度;按照上述方法获取每个择一序列的优选程度。
进一步的,将优选程度最大的择一序列,作为原始数据的初始列表,用于后续对原始数据进行MTF编码。
至此,通过高频字符集合得到若干择一序列,根据择一序列中元素的不重复性以及字符频率,得到优选程度最大的择一序列,并作为原始数据的初始列表。
步骤S004、对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
获取到原始数据的初始列表后,根据初始列表对原始数据进行MTF编码,得到的编码结果记为第二编码结果;对第二编码结果进行LZW编码压缩,得到的结果记为压缩后数据;对压缩后数据进行AES加密,得到加密后数据,将加密后数据存储到数据库中,将初始列表作为密钥保存,则完成了数据库中地理信息数据的加密存储。
进一步的,解码过程中,通过AES算法进行解密,再通过LZW算法进行解码,再通过初始列表根据MTF算法完成解码,得到原始数据。
至此,完成了对于测绘地理信息领域数据库中地理信息数据的加密存储。
请参阅图2,其示出了本发明另一个实施例所提供的基于数据编码的数据库安全加密系统结构框图,该系统包括:
数据库采集模块101,采集数据库中的地理信息数据作为原始数据。
数据处理分析模块102:
(1)对原始数据进行LZW编码,得到第一编码结果,根据第一编码结果获取原始数据中的若干连续段,根据每个连续段中的字符频次,得到每个连续段的高频字符集合;
(2)根据每个连续段的高频字符集合获取若干择一序列,根据择一序列中不同字符在不同连续段中的字符频率,获取每个择一序列的优选程度,进而得到原始数据的初始列表。
数据编码加密模块103,对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.基于数据编码的数据库安全加密方法,其特征在于,该方法包括以下步骤:
采集数据库中的地理信息数据作为原始数据;
根据原始数据的第一编码结果,获取原始数据的若干连续段;根据每个连续段中字符的字符频次,得到每个连续段的高频字符集合;
根据所有高频字符集合获取的若干择一序列中,每个择一序列中元素在不同连续段中的字符频率,获取每个择一序列的优选程度,将优选程度最大的择一序列作为原始数据的初始列表;
对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
2.根据权利要求1所述的基于数据编码的数据库安全加密方法,其特征在于,所述原始数据的若干连续段,具体的获取方法为:
根据原始数据的第一编码结果,得到第一编码结果的若干段连续区域;获取每段连续区域在原始数据对应的一段数据,将每段数据记为原始数据的一个连续段,得到原始数据的若干连续段。
3.根据权利要求2所述的基于数据编码的数据库安全加密方法,其特征在于,所述得到第一编码结果的若干段连续区域,包括的具体方法为:
对原始数据进行LZW编码,得到原始数据的第一编码结果,将第一编码结果中每个元素都减去相邻前一个元素得到一个差值,按照第一编码结果中元素顺序对得到的差值进行排序,得到第一编码结果的差值序列;
对差值序列中所有值为1的元素进行标记,记为差值序列中的标记元素,将标记元素连续分布的数量大于等于标记数量的部分,记为一段标记区域,对差值序列得到若干段标记区域;
获取每段标记区域在第一编码结果中对应的区域,记为第一编码结果中的连续区域。
4.根据权利要求1所述的基于数据编码的数据库安全加密方法,其特征在于,所述得到每个连续段的高频字符集合,包括的具体方法为:
以任意一个连续段为目标连续段,对目标连续段进行字符频次统计,根据每个字符对应的字符频次,通过OTSU多阈值分割,将目标连续段中字符划分为多个类别;
对每个类别中所有字符对应的字符频次求均值,将均值作为每个类别的类别频次,将类别频次最大的类别作为目标连续段的高频字符集合;获取每个连续段的高频字符集合。
5.根据权利要求1所述的基于数据编码的数据库安全加密方法,其特征在于,所述每个择一序列的优选程度,具体的获取方法为:
从每个连续段的高频字符集合中任意选择一个高频字符,将选择的所有高频字符按照对应连续段在原始数据中的顺序进行排列,得到若干择一序列;
以任意一个择一序列为目标择一序列,目标择一序列的优选程度的计算方法为:
,
其中,表示目标择一序列中元素数量,/>表示目标择一序列中出现重复的元素数量,/>表示目标择一序列中第/>个元素在对应连续段的字符频率,/>表示目标择一序列中第/>个元素在其他连续段的字符频率均值,/>表示以自然常数为底的指数函数;
所述目标择一序列中第个元素在其他连续段的字符频率均值的获取方法为:获取除第个元素对应连续段之外的其他连续段中,存在第/>个元素对应字符的连续段,对这些连续段中第/>个元素对应的字符在连续段中的字符频率求均值,得到/>。
6.基于数据编码的数据库安全加密系统,其特征在于,该系统包括:
数据库采集模块,采集数据库中的地理信息数据作为原始数据;
数据处理分析模块:根据原始数据的第一编码结果,获取原始数据的若干连续段;根据每个连续段中字符的字符频次,得到每个连续段的高频字符集合;
根据所有高频字符集合获取的若干择一序列中,每个择一序列中元素在不同连续段中的字符频率,获取每个择一序列的优选程度,将优选程度最大的择一序列作为原始数据的初始列表;
数据编码加密模块,对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310952012.3A CN116663069B (zh) | 2023-08-01 | 2023-08-01 | 基于数据编码的数据库安全加密方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310952012.3A CN116663069B (zh) | 2023-08-01 | 2023-08-01 | 基于数据编码的数据库安全加密方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116663069A true CN116663069A (zh) | 2023-08-29 |
CN116663069B CN116663069B (zh) | 2023-10-03 |
Family
ID=87721023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310952012.3A Active CN116663069B (zh) | 2023-08-01 | 2023-08-01 | 基于数据编码的数据库安全加密方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116663069B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116975312A (zh) * | 2023-09-22 | 2023-10-31 | 山东五棵松电气科技有限公司 | 一种智慧校园教育数据管理系统 |
CN116975897A (zh) * | 2023-09-22 | 2023-10-31 | 青岛国信城市信息科技有限公司 | 一种智慧社区人员隐私信息安全管理系统 |
CN117150531A (zh) * | 2023-10-30 | 2023-12-01 | 深圳市研创科技有限公司 | 一种工业电脑软件数据加密保护方法 |
CN117376429A (zh) * | 2023-10-10 | 2024-01-09 | 南京邮电大学 | 一种无线传感器网络数据智能压缩方法 |
CN117953175A (zh) * | 2024-03-26 | 2024-04-30 | 湖南速子文化科技有限公司 | 一种虚拟世界数据模型的构建方法、系统、设备及介质 |
CN118016225A (zh) * | 2024-04-09 | 2024-05-10 | 山东第一医科大学附属省立医院(山东省立医院) | 一种肾移植术后电子健康记录数据智能管理方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03247167A (ja) * | 1990-02-26 | 1991-11-05 | Fujitsu Ltd | データ圧縮方式 |
JPH04145726A (ja) * | 1990-10-08 | 1992-05-19 | Fujitsu Ltd | データ圧縮及び復元方式 |
US20080098024A1 (en) * | 2005-05-20 | 2008-04-24 | Fujitsu Limited | Information retrieval apparatus, information retrieval method and computer product |
JP2012142024A (ja) * | 2007-05-24 | 2012-07-26 | Fujitsu Ltd | 情報検索プログラム、該プログラムを記録した記録媒体、および情報検索方法 |
WO2021174839A1 (zh) * | 2020-03-06 | 2021-09-10 | 平安科技(深圳)有限公司 | 数据压缩方法、装置及计算机可读存储介质 |
CN114065258A (zh) * | 2021-11-25 | 2022-02-18 | 重庆宝图科技发展有限公司 | 一种用于移动端的地理空间数据加密方法 |
CN115617814A (zh) * | 2022-11-11 | 2023-01-17 | 浙江斯奈普科技有限公司 | 一种弹道计算数据智能管理方法 |
CN116506073A (zh) * | 2023-06-26 | 2023-07-28 | 深圳市研创科技有限公司 | 一种工业计算机平台数据快速传输方法及系统 |
-
2023
- 2023-08-01 CN CN202310952012.3A patent/CN116663069B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03247167A (ja) * | 1990-02-26 | 1991-11-05 | Fujitsu Ltd | データ圧縮方式 |
JPH04145726A (ja) * | 1990-10-08 | 1992-05-19 | Fujitsu Ltd | データ圧縮及び復元方式 |
US20080098024A1 (en) * | 2005-05-20 | 2008-04-24 | Fujitsu Limited | Information retrieval apparatus, information retrieval method and computer product |
JP2012142024A (ja) * | 2007-05-24 | 2012-07-26 | Fujitsu Ltd | 情報検索プログラム、該プログラムを記録した記録媒体、および情報検索方法 |
WO2021174839A1 (zh) * | 2020-03-06 | 2021-09-10 | 平安科技(深圳)有限公司 | 数据压缩方法、装置及计算机可读存储介质 |
CN114065258A (zh) * | 2021-11-25 | 2022-02-18 | 重庆宝图科技发展有限公司 | 一种用于移动端的地理空间数据加密方法 |
CN115617814A (zh) * | 2022-11-11 | 2023-01-17 | 浙江斯奈普科技有限公司 | 一种弹道计算数据智能管理方法 |
CN116506073A (zh) * | 2023-06-26 | 2023-07-28 | 深圳市研创科技有限公司 | 一种工业计算机平台数据快速传输方法及系统 |
Non-Patent Citations (2)
Title |
---|
王强等: "集中式数据库字符型数据加密查询仿真", 计算机仿真, vol. 35, no. 7, pages 359 - 362 * |
钱宇环等: "基于数据压缩的单字替换密码破译算法", 计算机与数字工程, no. 342, pages 686 - 688 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116975312A (zh) * | 2023-09-22 | 2023-10-31 | 山东五棵松电气科技有限公司 | 一种智慧校园教育数据管理系统 |
CN116975897A (zh) * | 2023-09-22 | 2023-10-31 | 青岛国信城市信息科技有限公司 | 一种智慧社区人员隐私信息安全管理系统 |
CN116975312B (zh) * | 2023-09-22 | 2023-12-19 | 山东五棵松电气科技有限公司 | 一种智慧校园教育数据管理系统 |
CN116975897B (zh) * | 2023-09-22 | 2023-12-19 | 青岛国信城市信息科技有限公司 | 一种智慧社区人员隐私信息安全管理系统 |
CN117376429A (zh) * | 2023-10-10 | 2024-01-09 | 南京邮电大学 | 一种无线传感器网络数据智能压缩方法 |
CN117150531A (zh) * | 2023-10-30 | 2023-12-01 | 深圳市研创科技有限公司 | 一种工业电脑软件数据加密保护方法 |
CN117150531B (zh) * | 2023-10-30 | 2023-12-26 | 深圳市研创科技有限公司 | 一种工业电脑软件数据加密保护方法 |
CN117953175A (zh) * | 2024-03-26 | 2024-04-30 | 湖南速子文化科技有限公司 | 一种虚拟世界数据模型的构建方法、系统、设备及介质 |
CN117953175B (zh) * | 2024-03-26 | 2024-06-11 | 湖南速子文化科技有限公司 | 一种虚拟世界数据模型的构建方法、系统、设备及介质 |
CN118016225A (zh) * | 2024-04-09 | 2024-05-10 | 山东第一医科大学附属省立医院(山东省立医院) | 一种肾移植术后电子健康记录数据智能管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116663069B (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116663069B (zh) | 基于数据编码的数据库安全加密方法及系统 | |
Wang et al. | High capacity reversible data hiding in encrypted image based on intra-block lossless compression | |
Chang et al. | A separable reversible data hiding scheme for encrypted JPEG bitstreams | |
Wang et al. | Reversible data hiding in encrypted images with block-based adaptive MSB encoding | |
CN116226471B (zh) | 一种用于国土资源规划的数据存储方法 | |
CN115272502B (zh) | 一种基于编码转换的软件研发数据安全管理方法 | |
CN111401320B (zh) | 保护隐私的生物特征图像处理方法、装置、介质及设备 | |
CN116319110B (zh) | 针对工业多源异构时序数据的数据采集与治理方法 | |
Nasution et al. | Image steganography in securing sound file using arithmetic coding algorithm, triple data encryption standard (3DES) and modified least significant bit (MLSB) | |
CN115296862A (zh) | 一种基于数据编码的网络数据安全传输方法 | |
Hou et al. | Separable reversible data hiding for encrypted 3D mesh models based on octree subdivision and multi-MSB prediction | |
CN116996628B (zh) | 一种网络数据传输防护方法 | |
CN116861271B (zh) | 基于大数据的数据分析处理方法 | |
CN115292739B (zh) | 一种金属模具设计系统的数据管理方法 | |
CN115379066B (zh) | 基于自适应压缩编码的加密图像可逆数据加密解密方法 | |
Wu | Efficient reversible data hiding simultaneously exploiting adjacent pixels | |
CN115190216B (zh) | 基于预测误差图的加密图像可逆数据隐藏及解密方法 | |
CN116405182A (zh) | 基于递归结构和分块思想的可逆信息隐藏方法 | |
Ji et al. | Reversible Data Hiding in Encrypted Images with Adaptive Huffman Code based on Dynamic Prediction Axes | |
CN108364019B (zh) | 基于dctr特征的图像卷积外包方法 | |
Panchikkil et al. | A Machine Learning based Reversible Data Hiding Scheme in Encrypted Images using Fibonacci Transform | |
CN116737741B (zh) | 一种平台商户余额数据实时更新处理方法 | |
CN118094628B (zh) | 基于加密算法的多主体数据跨域安全交互系统 | |
CN118018331B (zh) | 一种大数据云服务的隐私保护方法及系统 | |
CN116821940B (zh) | 一种培训考核数据智能采集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |