CN108418683B - 一种基于汉字结构特征的无载体文本隐写方法 - Google Patents

一种基于汉字结构特征的无载体文本隐写方法 Download PDF

Info

Publication number
CN108418683B
CN108418683B CN201810144199.3A CN201810144199A CN108418683B CN 108418683 B CN108418683 B CN 108418683B CN 201810144199 A CN201810144199 A CN 201810144199A CN 108418683 B CN108418683 B CN 108418683B
Authority
CN
China
Prior art keywords
chinese character
text
pnum
secret
character structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810144199.3A
Other languages
English (en)
Other versions
CN108418683A (zh
Inventor
王开西
于翔美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao University
Original Assignee
Qingdao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao University filed Critical Qingdao University
Priority to CN201810144199.3A priority Critical patent/CN108418683B/zh
Publication of CN108418683A publication Critical patent/CN108418683A/zh
Application granted granted Critical
Publication of CN108418683B publication Critical patent/CN108418683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/0618Block ciphers, i.e. encrypting groups of characters of a plain text message using fixed encryption transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Storage Device Security (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种基于汉字结构特征的无载体文本隐写方法,首先将汉字结构组合分类,使每种结构类型具有大致相同的使用频率,对每种汉字结构进行等长度的二进制编码;将秘密消息转为二进制串,并按照汉字结构编码长度对其分组;找到包含所有汉字结构类型的文本,构建汉字结构编码矩阵;在编码矩阵中找出各结构类型首次出现的位置计算出质数序列,和秘密信息各分组位置信息构建线性同余方程组,求解结果作为密钥与载体文本分别发送给接收者。接收者采取与发送方相同的方法构建编码矩阵和质数序列,首先求得秘密消息二进制长度,得到秘密信息二进制串,进而再获得原始秘密消息。该方法有效解决了现有文本隐写方法鲁棒性差的问题,且隐蔽性和隐藏容量都较高。

Description

一种基于汉字结构特征的无载体文本隐写方法
技术领域
本发明涉及信息隐藏技术领域中的隐写术,特别是涉及一种无载体文本隐写方法。主要用于秘密信息的传递。
背景技术
隐写术与密码学都是应用于秘密信息的传递,但与密码学的不同在于其特征在于隐藏秘密信息的存在,即将秘密信息隐藏于图像、声音和文本等载体。目前已有多种文本隐写方法,如:基于文本格式变换、基于同义词替换、基于文本生成、基于文本大数据搜索等文本隐写方法。这些隐写方法都存在一定的缺陷,如:基于格式变换的文本隐写方法主要主要通过文本中的字体大小、字间距、行间距、颜色等格式属性的微小改变来隐藏秘密信息,因而载密文本格式的修改将直接导致秘密信息的破坏,即鲁棒性较差;基于同义词替换的文本隐写可能导致某些同义词被替换后与原文的上下文语境不匹配,极易引起攻击者的怀疑;基于文本生成的文本隐写方法目前受限于自然语言处理技术,在生成较长文本时容易出现可读性差、语义异常等问题;基于文本大数据搜索的文本隐写方法存在隐藏容量相对较低、查找难度高或者嵌入成功率低等不足。综上所述,目前的文本隐写方法存在鲁棒性差,隐藏容量低等问题。
发明内容
为了克服上述方法中的不足,本发明提供一种基于汉字结构特征的新型无载体文本隐写方法。利用网络大数据环境下丰富的网络文本资源作为候选载体,通过汉字结构特征表示秘密信息,选择合适的网络文本实现秘密信息的传送。该方法有效解决了现有文本隐写方法载体鲁棒性差的问题,并且具有隐蔽性高、隐藏容量较高的优势。
本发明解决技术问题所采用的技术方案是:提供一种基于汉字结构特征的文本无载体文本隐写方法,收发双方构建共同的汉字结构编码矩阵、质数数列、共享线性同余方程组的解而实现隐写。包括将秘密消息嵌入文本过程和从文本中提取过程,其中,将秘密消息嵌入文本过程包括以下步骤:
(1)根据汉字使用频率,将汉字结构划分为2p种,使每种结构类型具有相同的使用频率,则可定义每种结构对应唯一的一个p位的二进制片段,这里p为不小于1的自然数。
(2)在发送前,收发双方可约定任意方式将秘密信息转换成二进制串Ssecret,记Ssecret的长度为Lsecret;把Lsecret的二进制值以固定长度Lheader位放在Ssecret前,连接形成完整的二进制串Smsg,则Smsg的长度Lmsg=Lheader+Lsecret。然后将Smsg按每p位进行分组,若最后分组不足p位,则补0至p位,最后得到二进制片段序列<SEG1,SEG2,…SEGPnum>,元素个数为
Figure GDA0001647780490000021
(3)选择包含上述2p种汉字结构的文本作为载体,并基于所选文本构造汉字结构矩阵,然后将汉字结构矩阵中的元素替换为其汉字结构所对应的p位二进制片段,形成汉字结构编码矩阵。
(4)依据2p种汉字结构在汉字结构编码矩阵中首次出现的位置计算出两个质数序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum)。
(5)找出SEG1,SEG2,…SEGPnum片段在汉字结构编码矩阵中的对应行号a1,a2,...,aPnum和列号b1,b2,...,bPnum,分别取ai与质数序列中的元素mi、bi与质数序列中的元素ni(这里1≤i≤Pnum)构造一元线性同余方程,形成一元线性同余方程组S1、S2,并利用中国剩余定理求解方程组,得到两个解。
(6)将求得的两个解作为密钥、载体文本分别发送给接收者。
从文本中提取过程包括以下步骤:
(1)将文本载体按与嵌入过程相同的方法转换为汉字结构编码矩阵。
(2)根据固定长度Lheader,以嵌入过程相同的方法计算出部分质数序列(m1,m2,...,mH)、(n1,n2,...,nH),这里
Figure GDA0001647780490000022
进而提取出秘密消息的长度值。
(3)按与嵌入过程相同的方法计算出与发送端相同的质数序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum)。
(4)质数序列(m1,m2,...,mPnum)中的各元素关于x1的余数和(n1,n2,...,nPnum)中的各元素关于x2的余数分别就是二进制串在汉字结构编码矩阵中的位置信息(a1,a2,...,aPnum)、(b1,b2,...,bPnum)。
(5)根据位置信息求得二进制串,去掉前面表示长度的Lheader位后进行译码得到原始秘密信息。
本发明的有益效果具体如下:
1)整个隐写过程未对文本进行修改和替换,因而不存在文本格式或语义失真问题。
2)文本中的每个汉字都可以隐藏p(bit)的秘密信息,虽然并不是文本中每个汉字都会被嵌入秘密信息,但是用来构造汉字结构矩阵的汉字可以被重复使用无数次,因此在计算机的计算能力范围内,隐藏容量可达p*Pnum比特。
附图说明
图1是本发明隐藏和提取过程的总体流程图;
图2是本发明汉字结构编码矩阵图的实施例。
具体实施方式
参见图1和图2,本发明一种基于汉字结构特征的无载体文本隐写方法的实现过程如下:
一、将秘密消息嵌入文本的过程:
(1)将汉字结构根据使用频率分为8种:“独体奇数”、“独体偶数”、“左右1:1”、“左右奇数”、“左右偶数”、“上下奇数”、“上下偶数”、“其他”,这里p=3,即每种结构代表3位二进制串,可分别是“000”、“001”、“010”、“011”、“100”、“101”、“110”、“111”。
(2)将要发送的秘密信息按照收发双方约定的方式转换成二进制形式,如:秘密消息中的汉字用机内码表示,其它字符用ASCII码表示;或者使用UniCode编码或UTF-8等其它编码;或者使用加密处理等其它方式。将二进制串的长度加在二进制串的前面,占Lheader位长度,组成完整二进制串,然后再按3位一段进行分段,若最后一段不足3位,补0凑足。
(3)选择包含前述8种汉字结构的文本,并利用文本中包含8种结构的最少的前面部分文本段来构造最小汉字结构方阵,并用8种汉字结构对应的二进制片段替换所得的汉字结构方阵中的元素将它转换为汉字结构编码方阵。
(4)分别找到8种汉字结构对应的二进制片段在前面所构造的汉字结构编码矩阵中首次出现的位置,得到它们中的最大行号fr_max和最大列号fc_max、最小行号fr_min和最小列号fc_min;然后计算k1和k2:k1=fr_max-fr_min、k2=fc_max-fc_min;接下来计算质数序列:在质数集合中分别找出不小于fr_max、fc_max的第一个质数作为m1和n1,进而分别找到两个两两互质的数来构建序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum),这里要求mi-mi-1>=k1,ni-ni-1>=k2,其中mi、ni表示质数序列中的元素。
(5)找出Smsg的各片段SEG1,SEG2,…SEGPnum在汉字结构编码矩阵的行号a1,a2,...,aPnum,将它们分别与质数序列(m1,m2,...,mPnum)中的对应元素构造一元线性同余方程,形成方程组S1,利用中国剩余定理求其解,记为x1。同理,利用Smsg的各片段SEG1,SEG2,…SEGPnum在汉字结构编码矩阵的列号b1,b2,...,bPnum分别与质数序列(n1,n2,...,nPnum)中的对应元素构造的一元线性方程并形成一元线性同余方程组S2,利用中国剩余定理求其解,记为x2
(6)将x1、x2作为密钥、载体文本分别发送给接收者。
二、从文本中提取过程:
(1)将接收到的文本按与嵌入过程相同的方法转换为汉字结构编码矩阵。
(2)按与嵌入过程相同的方法分别计算出具有H个元素的质数序列(m1,m2,...,mH)、(n1,n2,...,nH),这里
Figure GDA0001647780490000041
按照与下面步骤(4)相同的方法计算出秘密消息的长度值所占据的位置,取得这些二进制片段连接后得到秘密消息的长度值。
(3)根据秘密消息的长度,按照与嵌入过程相同的方法计算出与发送方一致的两个质数序列(m1,m2,...,mPnum)、(n1,n2,...,nPnum)。
(4)质数序列(m1、m2....mPnum)中各元素关于x1的余数即为二进制串在汉字结构编码矩阵中的位置的行号(a1,a2,...,aPnum);同理,利用(n1、n2....nPnum)中各元素和x2可求得二进制串在汉字结构编码矩阵中的位置的列号(b1,b2,...,bPnum)。
(5)根据行号和列号可对应汉字结构编码矩阵找到二进制串的各个编码段,组成完整的二进制串,去掉前面表示长度的Lheader比特后进行译码得到原始秘密信息。
本发明的工作原理说明如下:
本发明利用汉字结构特征表示二进制位“0”和“1”组成的二进制片段,即形成汉字结构特征编码,实现了秘密信息由汉字结构特征表示;秘密信息经过编码、加密等操作转换为二进制形式后,将二进制串以汉字结构特征编码长度进行分段;从网络或共享语料库中找到包含所有汉字结构类型的文本,从文本起始处选取文本中包含所有汉字结构类型的前面尽少量汉字构建最小汉字结构矩阵,根据汉字结构特征编码将最小汉字结构矩阵转换为汉字结构编码矩阵,分别在编码矩阵中找到各汉字结构类型最开始的位置和秘密信息二进制各片段的位置信息;根据各汉字结构类型的位置信息构建两个质数序列,将秘密消息二进制各片段所在位置的行号和列号分别与对应的质数序列构建同余线性方程形成方程组,并应用中国剩余定理进行计算得到两个密钥,将两个密钥和载体文本分别发送给接收者。接收者根据与嵌入过程相同的方法构造汉字结构编码矩阵和两个足够计算秘密消息长度的质数序列,然后根据密钥计算出秘密消息的长度,进而再应用同样方法得到秘密消息二进制串的位置信息,将整个秘密消息二进制串提取出来并进行译码得到秘密信息。
显然,本领域技术人员基于本发明的宗旨所做的许多修改和变化属于本发明的保护范围。
如上所述,对本发明的实施例进行了详细地说明,但是只要实质上没有脱离本发明的发明点及效果可以有很多的变形,这对本领域的技术人员来说是显而易见的,如构建的不是汉字编码矩阵,而是向量或张量,同样属于本方法的具体实现。因此,这样的变形例也全部包含在本发明的保护范围之内。

Claims (1)

1.一种基于汉字结构特征的无载体文本隐写方法,其特征在于,包括发送方将秘密消息嵌入文本过程和接收方从文本中提取过程;
所述的发送方将秘密消息嵌入文本过程包括以下步骤:
(1)根据汉字使用频率,将汉字结构划分为2p种,使每种结构类型具有相同的使用频率,并定义每种结构对应唯一的一个p位的二进制片段;
(2)将秘密信息按照与接收方商定的方式转换成二进制串Ssecret,计算该二进制串的长度Lsecret,并将该长度值的二进制值以固定长度Lheader位与二进制串Ssecret连接,构建完整的二进制串Smsg,其长度Lmsg=Lheader+Lsecret;然后将Smsg按每p位进行分组,若最后分组不足p位进行补0至p位,则得到二进制片段序列<SEG1,SEG2,…SEGPnum>,元素个数为
Figure FDA0002525328210000011
(3)选择包含上述2p种汉字结构的文本作为载体,基于所选文本构造汉字结构矩阵,然后根据汉字结构对应的p位二进制片段将汉字结构矩阵转换为汉字结构编码矩阵;
(4)依据2p种汉字结构在汉字结构编码矩阵中首次出现的位置计算出两个质数序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum);
(5)找出SEG1,SEG2,…SEGPnum片段在汉字结构编码矩阵中的对应行号a1,a2,...,aPnum和列号b1,b2,...,bPnum,分别取ai与质数序列中的元素mi、bi与质数序列中的元素ni(这里1≤i≤Pnum)构造一元线性同余方程,形成一元线性同余方程组S1、S2,并利用中国剩余定理求方程组的解为x1、x2
(6)将载体文本、密钥x1、x2发送给接收者;
所述的接收方从文本中提取过程包括以下步骤:
(1)将文本载体按与嵌入过程相同的方法转换为汉字结构编码矩阵;
(2)根据固定长度Lheader,以嵌入过程相同的方法计算出部分质数序列(m1,m2,...,mH)、(n1,n2,...,nH),这里
Figure FDA0002525328210000012
进而提取出秘密消息的长度值;
(3)按与嵌入过程相同的方法计算出与发送端相同的质数序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum);
(4)质数序列(m1,m2,...,mPnum)中的各元素关于x1的余数和(n1,n2,...,nPnum)中的各元素关于x2的余数分别就是二进制串在汉字结构编码矩阵中的位置信息(a1,a2,...,aPnum)、(b1,b2,...,bPnum);
(5)根据位置信息求得二进制串,去掉前面表示长度的Lheader位后进行译码得到原始秘密信息。
CN201810144199.3A 2018-02-12 2018-02-12 一种基于汉字结构特征的无载体文本隐写方法 Active CN108418683B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810144199.3A CN108418683B (zh) 2018-02-12 2018-02-12 一种基于汉字结构特征的无载体文本隐写方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810144199.3A CN108418683B (zh) 2018-02-12 2018-02-12 一种基于汉字结构特征的无载体文本隐写方法

Publications (2)

Publication Number Publication Date
CN108418683A CN108418683A (zh) 2018-08-17
CN108418683B true CN108418683B (zh) 2020-08-07

Family

ID=63128333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810144199.3A Active CN108418683B (zh) 2018-02-12 2018-02-12 一种基于汉字结构特征的无载体文本隐写方法

Country Status (1)

Country Link
CN (1) CN108418683B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677552B (zh) * 2019-08-30 2021-06-08 绍兴聚量数据技术有限公司 一种基于完备分组基的无载体信息隐藏方法
CN111027081B (zh) * 2019-11-28 2023-03-31 中国人民解放军战略支援部队信息工程大学 基于特征映射的文本无载体信息隐藏方法
CN111447188B (zh) * 2020-03-20 2022-03-18 青岛大学 基于语言隐写特征空间的无载体文本隐写方法
CN112000970B (zh) * 2020-08-20 2023-05-23 湖南财政经济学院 一种基于部件关联图的文本无载体隐写方法及系统
CN112989809B (zh) * 2021-04-15 2021-09-07 杭州电子科技大学 基于同义词扩展和标签传递的文本无载体信息隐藏方法
CN115134142B (zh) * 2022-06-28 2023-09-22 南京信息工程大学 一种基于文件分割的信息隐藏方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004120141A (ja) * 2002-09-25 2004-04-15 Hitachi Ltd アクセス制御システム
CN1740943A (zh) * 2004-08-27 2006-03-01 北京北大方正电子有限公司 一种文档加密方法
CN106055531A (zh) * 2016-05-17 2016-10-26 南京航空航天大学 一种利用全宋词实现文本信息隐藏的技术
CN107239713A (zh) * 2017-05-17 2017-10-10 李晓妮 一种敏感内容数据信息防护方法和系统
CN107609356A (zh) * 2017-08-09 2018-01-19 南京信息工程大学 基于标签模型的文本无载体信息隐藏方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004120141A (ja) * 2002-09-25 2004-04-15 Hitachi Ltd アクセス制御システム
CN1740943A (zh) * 2004-08-27 2006-03-01 北京北大方正电子有限公司 一种文档加密方法
CN106055531A (zh) * 2016-05-17 2016-10-26 南京航空航天大学 一种利用全宋词实现文本信息隐藏的技术
CN107239713A (zh) * 2017-05-17 2017-10-10 李晓妮 一种敏感内容数据信息防护方法和系统
CN107609356A (zh) * 2017-08-09 2018-01-19 南京信息工程大学 基于标签模型的文本无载体信息隐藏方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Coverless Information Hiding Method on the Chinese Mathmatical Expression";Xianyi Chen;《International Conference on Cloud Computing and Security》;20150105;正文第3节 *

Also Published As

Publication number Publication date
CN108418683A (zh) 2018-08-17

Similar Documents

Publication Publication Date Title
CN108418683B (zh) 一种基于汉字结构特征的无载体文本隐写方法
CN107947918B (zh) 一种基于字符特征的无载体文本隐写方法
CN109818739B (zh) 一种基于对抗网络的生成式图像隐写方法
CN105740215A (zh) 一种数据通信编码和解码方法
CN108683491B (zh) 一种基于加密和自然语言生成的信息隐藏方法
CN109711121A (zh) 基于马尔可夫模型和哈夫曼编码的文本隐写方法及装置
CN111666575B (zh) 基于词元编码的文本无载体信息隐藏方法
CN106452607B (zh) 一种传输、解析信息的方法及装置
CN115758415A (zh) 一种基于汉字部件组合的文本无载体信息隐藏方法
Kumar et al. An Email based high capacity text steganography scheme using combinatorial compression
Malik et al. A high capacity text steganography scheme based on huffman compression and color coding
KR101584127B1 (ko) 거부적 암호화 시스템 및 방법
Tutuncu et al. New approach in E-mail based text steganography
CN111447188B (zh) 基于语言隐写特征空间的无载体文本隐写方法
CN109871520A (zh) 一种适用于http内容内嵌的二进制数据编解码方法
US8077868B2 (en) Mechanism for transport-safe codings for cryptographic use
CN109818743B (zh) 一种椭圆曲线公钥文本化传递方法及系统
CN117640069A (zh) 基于马尔可夫链的多方区块链隐蔽通信生成模型
Abbasi et al. Urdu text steganography: Utilizing isolated letters
CN116192507A (zh) 一种基于深度学习的信息隐藏方法
Figueira A Survey on Semantic Steganography Systems
CN109905241B (zh) 一种椭圆曲线公钥的短汉字编码、解码方法
CN110335586B (zh) 一种信息转换方法及系统
Raphael et al. Secured crypto-stegano communication through unicode
Chaudhary et al. A capital shape alphabet encoding (CASE) based text steganography

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant