CN113806782A - 一种基于转移矩阵的密文判定方法、系统及设备 - Google Patents

一种基于转移矩阵的密文判定方法、系统及设备 Download PDF

Info

Publication number
CN113806782A
CN113806782A CN202111155227.XA CN202111155227A CN113806782A CN 113806782 A CN113806782 A CN 113806782A CN 202111155227 A CN202111155227 A CN 202111155227A CN 113806782 A CN113806782 A CN 113806782A
Authority
CN
China
Prior art keywords
character string
judged
ciphertext
matrix
adjacent characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111155227.XA
Other languages
English (en)
Inventor
张文雪
刘洋洋
孙琦
孟维英
娄爱涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongfu Safety Technology Co Ltd
Original Assignee
Zhongfu Safety Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongfu Safety Technology Co Ltd filed Critical Zhongfu Safety Technology Co Ltd
Priority to CN202111155227.XA priority Critical patent/CN113806782A/zh
Publication of CN113806782A publication Critical patent/CN113806782A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/604Tools and structures for managing or administering access control systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提出的一种基于转移矩阵的密文判定方法、系统及设备,所述方法包括:读取待判定的字符串;为待判定的字符串构建转移矩阵;统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;若3≤X<8,则使用预设算法计算转移矩阵的转移密度系数S;若S<0.86,则待判定的字符串为明文;若S≥0.86,则待判定的字符串为明文;输出并显示字符串的判定结果。本发明能够借助转移矩阵提取字符串的特征,量化字符串包含可读信息的概率,从而满足了密文字符识别的业务需求。

Description

一种基于转移矩阵的密文判定方法、系统及设备
技术领域
本发明涉及字符识别技术领域,更具体的说是涉及一种基于转移矩阵的密文判定方法、系统及设备。
背景技术
随着信息化时代的到来,信息安全问题逐渐被人们所重视,于是产生了各种各样的加密算法来对信息进行加密。数据加密的基本过程是通过某种特殊算法改变原有信息数据,使其成为一段不可读的码文。这段不可读的码文即称为密文。
目前,国际上通用的加密方式有DES、TDES、AES、Blowfish、CAST5、SM4、RC2、IDEA、SEED等。他们中多数采用Feistel的网络结构体制对信息进行代换和移位等操作,最终输出一个信息熵较高的字符串。随着密文的广泛使用,客户对各类信息进行处理时往往需要对字符串中的密文字段进行筛选和识别。
但是现有的字符串识别算法通常采用逐个字符进行识别判断的方式,无法完整的提取出字符类型转换的概率特征,而且存在计算复杂度高、执行效率低下的缺陷,无法满足密文字符识别的业务需求。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于转移矩阵的密文判定方法、系统及设备,能够借助转移矩阵提取字符串的特征,量化字符串包含可读信息的概率,从而满足了密文字符识别的业务需求。
本发明为实现上述目的,通过以下技术方案实现:
一种基于转移矩阵的密文判定方法,包括:
读取待判定的字符串;
为待判定的字符串构建转移矩阵;
统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;
若3≤X<8,则使用预设算法计算转移矩阵的转移密度系数S;
若S<0.86,则待判定的字符串为明文;若S≥0.86,则待判定的字符串为明文;输出并显示字符串的判定结果。
进一步,所述为待判定的字符串构建转移矩阵包括:
若待判定的字符串长度为d,构建转移矩阵A,转移矩阵A内的元素可以表示为Ai,j,Ai,j的初始值为0其中i为行序号,j为列序号;
设行标签依次为:大写字母、小写字母、数字和特殊符号;列标签依次为:大写字母、小写字母、数字和特殊符号;
根据待判定的字符串中相邻字符的类型确定转移矩阵A内每个元素的值;
其中,A1,1为相邻字符均为大写字母数目、A1,2为相邻字符为大写字母、小写字母的数目,A1,3为相邻字符为大写字母、数字的数目,A1,4为相邻字符为大写字母、特殊符号的数目,A2,1为相邻字符为小写字母、大写字母数目、A2,2为相邻字符均为小写字母的数目,A2,3为相邻字符为小写字母、数字的数目,A2,4为相邻字符为小写字母、特殊符号的数目,A3,1为相邻字符为数字、大写字母数目、A3,2为相邻字符为数字、小写字母的数目,A3,3为相邻字符均为数字的数目,A2,4为相邻字符为数字、特殊符号的数目,A4,1为相邻字符为特殊符号、大写字母数目、A3,2为相邻字符为特殊符号、小写字母的数目,A3,3为相邻字符为特殊符号、数字的数目,A2,4为相邻字符均为特殊符号的数目。
进一步,所述使用预设算法计算转移矩阵的转移密度系数S包括如下步骤:
S31:根据构建转移矩阵A计算字符类型的转换频率;
S32:根据构建转移矩阵A计算字符类型的非转换频率;
S33:根据字符类型的转换频率和字符类型的非转换频率计算转移矩阵的转移密度系数S。
进一步,所述步骤S31包括:
通过以下公式计算字符类型的转换频率PSWiCh:
Figure BDA0003288258370000031
进一步,所述步骤S32包括:
根据转移矩阵A对角线元素表示相邻字符类别相同的数目,则通过以下公式计算字符类型非转换频率Pretain
Figure BDA0003288258370000032
进一步,所述步骤S33包括:
通过以下公式计算转移矩阵转移密度系数S:
Figure BDA0003288258370000033
相应的,本发明还公开了一种基于转移矩阵的密文判定系统,包括:
读取模块,用于读取待判定的字符串;
矩阵构建模块,用为待判定的字符串构建转移矩阵;
统计模块,用于统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;若3≤X<8,则将转移矩阵发送至计算模块;
计算模块,用于使用预设算法计算转移矩阵的转移密度系数S;
判断模块,用于根据转移密度系数S判断待判定的字符串为密文或明文;
输出模块,用于输出并显示字符串的判定结果。
相应的,本发明还公开了一种基于转移矩阵的密文判定设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述基于转移矩阵的密文判定方法的步骤。
对比现有技术,本发明有益效果在于:本发明提供了一种基于转移矩阵的密文判定方法、系统及设备,能够在需要大批量判定密文的场景下有效提高了判定的效率。具体来说,首先通过统计字符串内字符类型特征构造类型转移矩阵,此构造过程相当于特征工程化过程,且保留了完整的转换信息。然后基于字符串类型转移的特征,输出特定转换类型的概率和转移密度系数。根据转换信息和转移密度系数实现了字符串的密文判定。
本发明简便易用、步骤清晰、复用率高。本发明通过转移矩阵的特性能够完整的提取出字符类型转换的概率特征。本发明计算复杂度低,执行效率高。可以应用于大批量检测判定密文的场景。基于转移矩阵的密文概率检测可以帮助企业、政府、安全组织或个人快速筛选密文字段。本发明既可以满足密文判定的基本要求,还可以帮助分析人员进一步全面的统计和分析密文的特征。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明具体实施方式的方法流程图。
附图2是本发明具体实施方式的系统结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
如图1所示的一种基于转移矩阵的密文判定方法,包括:
读取待判定的字符串。
为待判定的字符串构建转移矩阵。
统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文。
若3≤X<8,则使用预设算法计算转移矩阵的转移密度系数S。
若S<0.86,则待判定的字符串为明文;若S≥0.86,则待判定的字符串为明文。
输出并显示字符串的判定结果。
本方法主要分为两个部分:字符串转移矩阵、提取并计算转移密度系数。
其中,为待判定的字符串构建转移矩阵包括:
若待判定的字符串长度为d,构建转移矩阵A,转移矩阵A内的元素可以表示为Ai,j,Ai,j的初始值为0其中i为行序号,j为列序号;设行标签依次为:大写字母、小写字母、数字和特殊符号;列标签依次为:大写字母、小写字母、数字和特殊符号。具体如下表所示:
大写字母 小写字母 数字 特殊符号
大写字母
小写字母
数字
特殊符号
转移矩阵A示意表格
根据上表,构造过程解释如下:从字符串的第1位开始,检测第1位的字符类型和第2位的字符类型。若第1位类型为大写字母,第2位也为大写字母时,对应矩阵A1,1元素+1;若第1位字符类型为大写字母,第2位为小写字母时,矩阵A1,2+1;……以此类推。
使用时,根据待判定的字符串中相邻字符的类型确定转移矩阵A内每个元素的值;其中,A1,1为相邻字符均为大写字母数目、A1,2为相邻字符为大写字母、小写字母的数目,A1,3为相邻字符为大写字母、数字的数目,A1,4为相邻字符为大写字母、特殊符号的数目,A2,1为相邻字符为小写字母、大写字母数目、A2,2为相邻字符均为小写字母的数目,A2,3为相邻字符为小写字母、数字的数目,A2,4为相邻字符为小写字母、特殊符号的数目,A3,1为相邻字符为数字、大写字母数目、A3,2为相邻字符为数字、小写字母的数目,A3,3为相邻字符均为数字的数目,A2,4为相邻字符为数字、特殊符号的数目,A4,1为相邻字符为特殊符号、大写字母数目、A3,2为相邻字符为特殊符号、小写字母的数目,A3,3为相邻字符为特殊符号、数字的数目,A2,4为相邻字符均为特殊符号的数目。
另外,使用预设算法计算转移矩阵的转移密度系数的过程具体如下:
1、根据构建转移矩阵A计算字符类型的转换频率。
通过以下公式计算字符类型的转换频率PSWiCh:
Figure BDA0003288258370000061
2、根据构建转移矩阵A计算字符类型的非转换频率。
根据转移矩阵A对角线元素表示相邻字符类别相同的数目,则通过以下公式计算字符类型非转换频率Pretain
Figure BDA0003288258370000062
3、根据字符类型的转换频率和字符类型的非转换频率计算转移矩阵的转移密度系数S。
通过以下公式计算转移矩阵转移密度系数S:
Figure BDA0003288258370000071
通过上述方法可知,通过转移矩阵可以初步判断以下情况:
(1)字符串由单一类型的字符组成,例如:由大写字母组成字符串(QWERT)、小写字母字符串(effect)、数字字符串(19980303)以及仅由特殊符号组成的字符串(@#¥%……&*)。经加密验证,出现此类字符串的概率极小(不到万分之一),可直接判定其为明文。
(2)通常字符串加密后的长度通常大于等于加密前的长度,多数为大于的情况,此处定义长度小于8的字符串均为明文。
(3)若矩阵非对角线元素远大于对角线元素,表示字符串中字符类型的转换频率极高,或者说混乱程度较高,客观上已经不具有明文的可读性,因此可直接判定为密文。
除上述情况外,则需要计算转移矩阵转移密度系数进行转移矩阵对应的字符串是否为密文的最终判定。由于转移密度系数能够表示任意字符串字符类型转换程度,经大量加密数据验证,当转移密度系数S<0.86(经验值)时,认为该字符串为明文,当是>=0.86时,认为该字符串为密文。概率密度系数较之转移概率的区分度更强,且不受字符串长度影响,对于任何长度、类型的字符串可以普适。
相应的,如图2所示,本发明还公开了一种基于转移矩阵的密文判定系统,包括:
读取模块,用于读取待判定的字符串。
矩阵构建模块,用为待判定的字符串构建转移矩阵。
统计模块,用于统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;若3≤X<8,则将转移矩阵发送至计算模块。
计算模块,用于使用预设算法计算转移矩阵的转移密度系数S。
判断模块,用于根据转移密度系数S判断待判定的字符串为密文或明文。
输出模块,用于输出并显示字符串的判定结果。
相应的,本发明还公开了一种基于转移矩阵的密文判定设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述基于转移矩阵的密文判定方法的步骤。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (8)

1.一种基于转移矩阵的密文判定方法,其特征在于,包括:
读取待判定的字符串;
为待判定的字符串构建转移矩阵;
统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;
若3≤X<8,则使用预设算法计算转移矩阵的转移密度系数S;
若S<0.86,则待判定的字符串为明文;若S≥0.86,则待判定的字符串为明文;输出并显示字符串的判定结果。
2.根据权利要求1所述的基于转移矩阵的密文判定方法,其特征在于,所述为待判定的字符串构建转移矩阵包括:
若待判定的字符串长度为d,构建转移矩阵A,转移矩阵A内的元素可以表示为Ai,j,Ai,j的初始值为0其中i为行序号,j为列序号;
设行标签依次为:大写字母、小写字母、数字和特殊符号;列标签依次为:大写字母、小写字母、数字和特殊符号;
根据待判定的字符串中相邻字符的类型确定转移矩阵A内每个元素的值;
其中,A1,1为相邻字符均为大写字母数目、A1,2为相邻字符为大写字母、小写字母的数目,A1,3为相邻字符为大写字母、数字的数目,A1,4为相邻字符为大写字母、特殊符号的数目,A2,1为相邻字符为小写字母、大写字母数目、A2,2为相邻字符均为小写字母的数目,A2,3为相邻字符为小写字母、数字的数目,A2,4为相邻字符为小写字母、特殊符号的数目,A3,1为相邻字符为数字、大写字母数目、A3,2为相邻字符为数字、小写字母的数目,A3,3为相邻字符均为数字的数目,A2,4为相邻字符为数字、特殊符号的数目,A4,1为相邻字符为特殊符号、大写字母数目、A3,2为相邻字符为特殊符号、小写字母的数目,A3,3为相邻字符为特殊符号、数字的数目,A2,4为相邻字符均为特殊符号的数目。
3.根据权利要求2所述的基于转移矩阵的密文判定方法,其特征在于,所述使用预设算法计算转移矩阵的转移密度系数S包括如下步骤:
S31:根据构建转移矩阵A计算字符类型的转换频率;
S32:根据构建转移矩阵A计算字符类型的非转换频率;
S33:根据字符类型的转换频率和字符类型的非转换频率计算转移矩阵的转移密度系数S。
4.根据权利要求3所述的基于转移矩阵的密文判定方法,其特征在于,所述步骤S31包括:
通过以下公式计算字符类型的转换频率Pswich
Figure FDA0003288258360000021
5.根据权利要求4所述的基于转移矩阵的密文判定方法,其特征在于,所述步骤S32包括:
根据转移矩阵A对角线元素表示相邻字符类别相同的数目,则通过以下公式计算字符类型非转换频率Pretain
Figure FDA0003288258360000022
6.根据权利要求5所述的基于转移矩阵的密文判定方法,其特征在于,所述步骤S33包括:
通过以下公式计算转移矩阵转移密度系数S:
Figure FDA0003288258360000023
7.一种基于转移矩阵的密文判定系统,其特征在于,包括:
读取模块,用于读取待判定的字符串;
矩阵构建模块,用为待判定的字符串构建转移矩阵;
统计模块,用于统计转移矩阵中的非0元素数目X,若X<3,则待判定的字符串为明文;若X≥8,则待判定的字符串为密文;若3≤X<8,则将转移矩阵发送至计算模块;
计算模块,用于使用预设算法计算转移矩阵的转移密度系数S;
判断模块,用于根据转移密度系数S判断待判定的字符串为密文或明文;
输出模块,用于输出并显示字符串的判定结果。
8.一种基于转移矩阵的密文判定设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项权利要求所述基于转移矩阵的密文判定方法的步骤。
CN202111155227.XA 2021-09-29 2021-09-29 一种基于转移矩阵的密文判定方法、系统及设备 Pending CN113806782A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111155227.XA CN113806782A (zh) 2021-09-29 2021-09-29 一种基于转移矩阵的密文判定方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111155227.XA CN113806782A (zh) 2021-09-29 2021-09-29 一种基于转移矩阵的密文判定方法、系统及设备

Publications (1)

Publication Number Publication Date
CN113806782A true CN113806782A (zh) 2021-12-17

Family

ID=78938905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111155227.XA Pending CN113806782A (zh) 2021-09-29 2021-09-29 一种基于转移矩阵的密文判定方法、系统及设备

Country Status (1)

Country Link
CN (1) CN113806782A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115828918A (zh) * 2022-12-09 2023-03-21 中国人民解放军国防科技大学 一种装备名称实体分辨方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115828918A (zh) * 2022-12-09 2023-03-21 中国人民解放军国防科技大学 一种装备名称实体分辨方法
CN115828918B (zh) * 2022-12-09 2024-02-02 中国人民解放军国防科技大学 一种装备名称实体分辨方法

Similar Documents

Publication Publication Date Title
US8935783B2 (en) Document classification using multiscale text fingerprints
US20220172090A1 (en) Data identification method and apparatus, and device, and readable storage medium
Sharma et al. Analysis of different text steganography techniques: A survey
CN115883109B (zh) 一种航空系统的数据压缩加密方法及系统
CN104579360B (zh) 一种数据处理的方法和设备
Dulera et al. Experimenting with the novel approaches in text steganography
CN109086600A (zh) 密码生成和认证系统
CN108255555A (zh) 一种系统语言切换方法及终端设备
Ramakrishnan et al. Text steganography: a novel character‐level embedding algorithm using font attribute
CN108418683A (zh) 一种基于汉字结构特征的无载体文本隐写方法
JP2016522931A (ja) パスワードへの攻撃を阻害すること
CN116796354B (zh) 一种用于计算机系统的信息安全增强方法
CN113806782A (zh) 一种基于转移矩阵的密文判定方法、系统及设备
Alanazi et al. Involving spaces of unicode standard within irreversible Arabic text steganography for practical implementations
CN108932434B (zh) 一种基于机器学习技术的数据加密方法及装置
Yaghobi et al. Text steganography in webometrics
CN101442671B (zh) 一种数字信息嵌入和提取的方法及装置
CN111723142A (zh) 一种数据处理方法及装置
CN109831544A (zh) 一种应用于电子邮箱地址的编码存储方法及系统
Majumder et al. A generalized model of text steganography by summary generation using frequency analysis
CN111914513A (zh) 一种rdp窗口标题文字识别的方法及装置
RU2282889C1 (ru) Способ обработки информации для обнаружения идентификационных признаков в информационных потоках
CN117540441B (zh) 一种大堂式云终端用交易数据安全存储方法
Alshayeji et al. A high‐capacity and secure least significant bit embedding approach based on word and letter frequencies
Rojali et al. Steganography algorithm multi pixel value differencing (MPVD) to increase message capacity and data security

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination