CN1812321A - 字符的图形与编码相互独立的隐藏通信方法 - Google Patents

字符的图形与编码相互独立的隐藏通信方法 Download PDF

Info

Publication number
CN1812321A
CN1812321A CN 200610020372 CN200610020372A CN1812321A CN 1812321 A CN1812321 A CN 1812321A CN 200610020372 CN200610020372 CN 200610020372 CN 200610020372 A CN200610020372 A CN 200610020372A CN 1812321 A CN1812321 A CN 1812321A
Authority
CN
China
Prior art keywords
file
character
coding
self
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610020372
Other languages
English (en)
Inventor
刘�东
周丽晖
周明天
孙明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN 200610020372 priority Critical patent/CN1812321A/zh
Publication of CN1812321A publication Critical patent/CN1812321A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Storage Device Security (AREA)

Abstract

本发明提供一种隐藏通信方法,其基本原理是改变字符图形与字符的编码在各种编码标准规范中已确定的标准映射关系,采用自定义的方法进行字符图形与字符编码的映射,从而使得电子文件显示出的字符图形与电子文件的编码分别构成显式通信信道和隐藏通信信道,这两种信道可以独立地进行通信。基于这种隐藏通信方法的文本数字水印技术有水印容量大、抗攻击性能好、水印难以被去除的优点。此外,应用该隐藏通信技术制作成的自包含字符图形和编码信息的电子文件,便于现有搜索引擎利用文件的属性进行搜索,从而增强了对这种电子文件的搜索能力。

Description

字符的图形与编码相互独立的隐藏通信方法
技术领域
本发明属于通信与信息工程领域,具体涉及到数据的隐藏通信技术、文本数字水印技术。
背景技术
当前,隐藏通信技术以及基于隐藏通信技术的数字水印技术已受到各方广泛的关注,其基本技术途径是将具有特定意义的隐藏信息(数字水印信息),隐藏在各种数字图像、声音、视频、文本数字产品中。这些带有隐藏信息(数字水印信息)的电子产品一方面可以不易被感知地正常使用,另一方面,通过特定的技术手段可以检测出嵌入在这些数字产品中的隐藏信息(数字水印信息)。隐藏通信技术以及数字水印技术已广泛应用在数字产品的版权保护、内容验证与防伪、防止非法拷贝、操作跟踪、秘密数据通信等众多领域。本发明主要涉及在文本电子文件中嵌入隐藏信息(数字水印信息)的相关技术和实施方法。
如综述文章“文本数字水印”(中文信息学报,第15卷,第5期,作者:黄华、齐春、李俊、朱伟芳)所述,现有的在文本中嵌入隐藏信息的技术集中在利用文本文件的格式信息来保存隐藏信息。例如对文本的字间距、行间距、符号的特征(包括大小、颜色、字体等)进行编码来嵌入隐藏信息,隐藏信息作为格式编码存入特定的格式文本文件中。
如文章“二值文本数字水印技术的研究与仿真”(系统仿真学报,VOL.16 No.3,2004.3,作者:王慧琴、李人厚)所述,另一种主要的在文本中嵌入隐藏信息的技术的思路是将文本文件转换为图像文件,按照图像数字水印技术提供的方法进行隐藏水印信息的加载。
中国国家专利“利用字符的字形特征携带水印信息的文本数字水印技术”(发明人:刘东,专利号:200410040853.4)提出一种“基于字符拓扑结构”的文本隐藏通信方法,其基本原理是:通过适当改变字符的拓扑结构,设计出语义上相同的字符的多种字形,并对基于字符字形拓扑结构的特征进行恰当的编码,利用这些特征编码来嵌入隐藏水印信息。
中国国家专利“以符号的冗余编码携带隐藏信息的文本数字水印技术”(发明人:刘东,专利号:200410040307.0)提出一种“基于字符冗余编码”的文本隐藏通信方法,其基本原理是:对符号的数字编码进行冗余扩展,将语义上一个字符对应一个数字编码的编码方法扩展到语义上的一个字符对应多个数字编码;然后,对这些冗余的数字编码根据其状态的不同再次进行二次数字编码,用于表示隐藏信息;最后,配合特定的载体文件显示技术,提供一种以符号的编码为载体的隐藏数据通信方法。
上述各种文本数字水印技术中的隐藏通信方法各有优缺点,本发明提供了一种新的隐藏通信方法以及相关的应用技术。
发明内容
本发明的主要目的是提供一种隐藏通信方法,其基本原理是改变字符图形与字符的编码在各种编码标准规范中已确定的标准映射关系,采用自定义的方法进行字符图形与字符编码的映射,从而使得电子文件显示出的字符图形与电子文件的编码分别构成显式通信信道和隐藏通信信道,这两种信道可以独立地进行通信。
基于这种隐藏通信方法的文本数字水印技术有水印容量大、抗攻击性能好、水印难以被去除的优点。此外,应用该隐藏通信技术制作成的自包含字符图形和编码信息的电子文件,便于现有搜索引擎利用文件的属性进行搜索,从而增强了对这种电子文件的搜索能力。
本发明包括如下紧密相关的内容:
(1)隐藏通信方法以及相关的电子文件。
(2)实现本发明的隐藏通信方法及生成相关电子文件的若干具体实现方法。
(3)两种典型的应用技术。
1.隐藏通信方法以及相关的电子文件
本发明提出一种隐藏通信方法,通过在包含字符的电子文件中添加隐藏信息进行隐藏通信。在这种电子文件中,对于相同的字符编码,其按照标准编码规范定义的内容构成隐藏信息,按照自定义的字符编码与图形的映射关系显示出的字符图形内容构成显式信息,从而在利用该电子文件显示出的字符图形进行正常通信的同时利用字符的编码进行隐藏通信。
在普通的包含字符的电子文件中,字符的编码映射到各种标准编码规范(如UNICODE,GB2312等)确定的字符图形上。本发明的核心之处在于要改变字符图形与字符的编码在各种编码标准中已确定的映射关系,通过妥当地自定义字符图形与字符编码的映射方式,从而使得电子文件同时具有显式与隐藏通信信道。字符编码按照自定义的字符编码与图形的映射关系显示出的字符图形构成显式通信信道,字符编码自身构成隐藏通信信道,其按标准编码规范定义的内容为隐藏信息。将普通的文本电子文件制作成本发明所述的电子文件,一方面仍然在显式通信信道中保留了原文件的内容,另一方面却增加了一个与显式信道相同容量的隐藏通信信道,从而可以在隐藏通信信道中保留隐藏信息。本发明也可被看作是一项文本数字水印技术,此时,初始的普通文本电子文件可以被称为原载体文件,隐藏信息被称为数字水印,同时具有显式与隐藏信道的电子文件可以被看成是加载了数字水印信息的电子文件,如无特别说明,本文中上述术语可以互相替代。此外,本文提及的文本电子文件泛指有这样特征的文件:文件中包含了以编码状态存在的字符,而不是所有字符仅以图像形式存在。
2.实现本发明隐藏通信方法及生成相关电子文件的若干具体实现方法
本发明隐藏通信方法及生成相关电子文件的方法是紧密相关的,其关键技术在于改变字符的图形和编码之间的标准映射关系,使得电子文件显示出的字符图形所表示的语义,与其对应的编码按标准编码规范所定义的语义互不相同。为了实现这一目的,本文提供两种方法:
第一种方法是:改变字体文件中字符的图形和编码之间的标准映射关系,根据电子文件显式信息的字符图形与隐藏信息的字符编码之间的对应关系,按照自定义的方式进行字符图形与编码的映射,从而产生自定义的字体文件,并用这种自定义字体文件确定的字体进行电子文件的显示。这样,文件中字符编码按自定义字体文件显示出的字符图形代表的是一种语义,按照标准编码规范表示的是另一种语义。
在当前各种格式的文本电子文件内,字符是以标准编码规范定义的编码来表示的,如UNICODE,GB2312等编码标准,而字符的图形通常是在文本电子文件外的字体文件中定义的。与此同时,字体文件中的字符图形,也称字模,被按照各种标准编码规范分配了相应的编码。由于文本电子文件中字符编码与字体文件中字符图形编码的一致性,应用程序结合文本电子文件中的字符编码和字体文件中的图形定义可以正确地显示文本电子文件,并且文件中的字符编码按照标准规范定义的语义与文件显示出的字符图形表示的语义是相同的。
本发明改变了字体文件中字符图形按标准编码规范确定的编码,按照欲显式表示的信息和欲隐藏的信息对应的字符位置顺序,自定义字体文件中字符图形的编码,使得用自定义字体文件显式出来的电子文件内容与该文件中字符编码按标准编码规范表示出的内容的语义是互不相关的,互相独立的。
第二种方法是:在自包含字符图形和字符编码信息的电子文件中,改变“字符图形与编码映射表”中字符的图形和编码之间的标准映射关系,按照自定义的方式进行字符图形与编码的映射,也可以使得文件中字符编码按“字符图形与编码映射表”显示出的字符图形代表的是一种语义,按照标准编码规范表示的是另一种语义。
所谓自包含字符图形和字符编码信息的电子文件,有如下的特性:该类电子文件中包含有足够完整的有关文件自身的字符编码信息、字符图形信息,甚至文件的格式等信息,应用程序显示、使用该类电子文件所需要的数据来自于文件本身,而独立于计算机硬件、操作系统、外部的字体文件等文件外部因素。典型的现有该类电子文件的例子如PDF格式文件、CAJ格式文件等。在这类文件中,文件的主体内容仍然是用标准的字符编码描述的,此外,文件内部还包含独立的“字符图形与编码映射表”,也称数据字典,用于描述本文件中涉及到的字符图形与编码之间的映射关系。现有技术中,“字符图形与编码映射表”中的字符图形与编码的映射关系也是按照标准规范进行的,文件中的字符编码按照标准规范定义的语义与文件显示出的字符图形表示的语义是相同的。与前述第一种方法类似,本方法中也按照自定义方式进行字符图形与编码的映射,不同的是这种映射关系的改变是在电子文件内部的“字符图形与编码映射表”中进行的,也可以使得电子文件显示出的字符图形与其对应的编码分别表示不同语义。
特别指出的是,本发明建议先按照前述第一种方法产生自定义字体文件,再生成第二种方法中所述的具有隐藏通信功能电子文件,其步骤包括:
(1)根据显式信息的字符图形与隐藏信息的字符编码之间的位置对应关系,确定字体文件中字符图形与其编码的映射关系,从而生成自定义的字体文件。
(2)利用由隐藏信息所映射的标准字符编码构成的电子文件,以及(1)中形成的自定义字体文件,生成自包含字符图形和字符编码信息的电子文件。
在本发明的具有隐藏信道的电子文件中,当存在隐藏信道中相同字符编码对应显式信道中不同字符图形的情况时,会出现编码的冲突情况。这是因为无论在标准的字体文件还是在“字符图形与编码映射表”中,对于一种字体,一个字符的编码只能对应单个的字符图形,而不能出现对应多个字符图形的情况,否则,在显示文本电子文件中字符编码映射的字符图形时,会出现映射关系混乱的情况。在本发明的电子文件中,显式信道与隐藏信道的内容互相独立,互不相关。当隐藏信道中的字符出现重复时,与之对应的显式信道中的字符很可能不一样,会出现隐藏信道中的多个相同字符编码对应显式信道中的多个不同字符图形的情况,如仍采用单个的字体来显示隐藏信道中的隐藏信息,将因字符图形与编码映射关系混乱产生编码冲突的情况。
针对上述的编码冲突,本发明提出一种解决措施:
将隐藏信道中相同字符编码用不同字体中的字符图形(或称字模)表示,并将隐藏信道中相同字符编码分别标记为相应的字体。不同的字体可以用与文本电子文件独立的多个字体文件来表示,也可在自包含字符图形和编码信息的文件的“字符图形编码映射表”中进行标识,而文本电子文件中字符编码的不同字体可用格式信息来表示。这样,通过用隐藏信道中的字体格式信息来区分那些相同的字符编码,从而避免了单一字体下的编码冲突问题。
3.两种典型的应用技术:
a.一种能防止内容被非法复制及易于进行版权声明的电子文件
本发明的隐藏通信方法适用于文本数字水印技术,文本数字水印技术的相关版权声明、防伪、秘密通信等应用均可基于本发明的方法实现。一种典型的应用方式是在本发明电子文件的显式信道中保存原电子文件的内容,将版权声明信息或者其他文件的属性信息保存在该文件隐藏信道中,用于版权保护。对于本发明的电子文件,用程序自动获取显式信道内容对应的标准字符编码较为困难,而获取隐藏信息对应的字符编码却较为简单。这样的特性有利于防止显式信道的内容被非法复制以及用隐藏信道的信息进行版权声明。
b.基于隐藏信息进行搜索的文件搜索技术
本发明另一个典型应用是用于增强对电子文件的搜索能力。将普通的文本电子文件制作成本发明的同时具有显式和隐藏信道的电子文件,可以实现按照隐藏信道中的隐藏信息内容进行文件搜索的功能。特别地,将电子文件的属性信息作为隐藏信息保存在隐藏信道中,可以实现按照文件的属性信息进行文件搜索的功能。文件属性定义了文件的特征信息,例如文件名、文件大小、编写时间、修改时间、作者、各种编号及标识号、类型、版权信息、出版商等信息,以及各种根据不同的应用自定义的文件关联信息,按照这些文件属性进行文件搜索,在一定的应用背景下有很强的实用性。
对照现有的文本隐藏通信方法与文本数字水印技术,本发明的主要特点是:
(1)本发明的隐藏通信方法使得普通的电子文件增加了与显式信道相同数据容量的隐藏通信信道,与现有文本数字水印技术中的隐藏通信方法相比,隐藏通信信道容量(或称数字水印容量)大,而且隐藏信息不会给用户造成任何视觉上的影响。
(2)本发明中,用文件隐藏信道中字符的标准编码表示隐藏信息,便于程序自动检测。相反,显式信道为字符的图形,尽管易于人的识别,却难以被程序自动获取这些字符图形对应的标准编码。这样,在本发明的电子文件的隐藏信道中加入版权信息,既可以方便地声明版权信息,又可以有效地防止显式信道中的内容被非法复制。
(3)将本发明的电子文件实现为自包含字符编码与图形信息的文件,则攻击者难以去除隐藏信息。
(4)本发明的对电子文件的增强搜索技术,在不改变现有搜索引擎的情况下,可实现按电子文件的隐藏信息进行文件搜索的功能,有利于基于电子文件属性进行文件的搜索与管理。
附图说明
图1表示了通过标准字体文件正常显示文本电子文件的原理。
图2表示了本发明用自定义字体文件显示文本电子文件的原理。
图3说明了本发明同时具有显式和隐藏信道的自包含字符图形与编码信息的电子文件的结构。
图4说明了解决相同的字符编码对应不同的字符图形造成的编码冲突的方法。
图5说明了在自包含字符图形与编码信息的电子文件中解决编码冲突的方法。
具体实施方式
下面通过举例,并参照附图,详细地描述本发明的具体实施方式。
1.隐藏通信方法、相关电子文件及实现方法的具体实施方式
如图1所示,普通的电子文本文件(100)中字符是以标准的编码形式存在的。文件(100)包含有5个字符编码“597D,96E8,77E5,65F6,8282”,它们在UNICODE编码标准规范中分别表示字符“好,雨,知,时,节”的语义,但是,在文件(100)中并不包含这些字符编码对应的字符图形信息。与此同时,在文件(100)外部的字体文件(120)中,保存有字符编码与字符图形(在字体文件中通常称为字模)按照标准编码规范确定的映射关系。例如,按照UNICODE编码标准,编码(121)对应字符图形(122)。这样,处理文件(100)的应用程序在解释文件(100)中的编码(101)时,通过查询在字体文件(120)中相应的编码(121)对应的字符图形(122),就将字符编码(101)显示为字符图形(111)。依此类推,整个文件(100)就以(110)的形式显示出来,字符图形(110)显示的语义等同于文件(100)中字符编码按照UNICODE标准定义的语义。应该注意的是,除了纯文本文件(例如TXT格式文件),通常普通文本文件中在包含字符编码的同时,还包含有描述字符字体、字符大小等文件格式的信息,如WORD,EXCEL格式文件,但显示这些文件中字符编码对应的字符图形的基本原理仍如图1所示。
如图2所示,电子文件(210)的编码“4F5C,8005,FF1A,675C,752B”按UNICODE编码标准定义的字符语义为“作者:杜甫”。字体文件(240)为类似(120)的标准的字体文件,如果用字体文件(240)显示的字符图形为(200),则等同于图1中显示字符图形的方式。但是,在字体文件(230)中,按照自定义的方式进行编码的定义。例如,字符编码“4F5C”(231)在UNICODE标准定义为“作”(242),在字体文件(230)被自定义为“好”(232)。当使用字体(230)进行文件(210)的显示时,则编码“4F5C”(231)将被显示为(221),依此类推,文件(210)将被显示为“好雨知时节”(220)。这样,文件(210)通过自定义文件(230)显示的字符图形(220)构成了该文件的显式信道,而文件(210)中的字符编码构成了隐藏信道,字符编码按UNICODE标准对应的信息(200)为隐藏信息。这两种信道中的信息互相是独立的,文件(210)字符编码显示出的图形(220)的语义不同于字符编码按照UNICODE标准定义的语义(200)。从电子文件显示出的图形来看,文件(100)与文件(210)在内容上没有任何区别,但是它们内在的编码是不同的。由此,结合字体文件(230),电子文件(210)示例了本发明的同时具有显式和隐藏通信信道的电子文件。同时,利用文件(210)的隐藏信道进行通信,也等价于提供了一种隐藏通信方法。
在实际的应用中,应根据应用中显式信道与隐藏信道中字符的位置对应关系来确定字体文件中的字符图形与编码的映射关系,从而保证两个信道通信的独立性。例如,自定义字体文件(230)中字符图形与编码的映射关系,是按照文件(210)显式信道中的字符图形“好雨知时节”(220)与隐藏信道的编码“4F5C,8005,FF1A,675C,752B”对应的位置关系确定的。
图3显示了本发明的自包含字符图形和编码信息的电子文件示例。电子文件(310)包含两部分,(311)表示文件的字符编码部分,(312)表示“字符图形与编码映射表”(也称数据字典),(312)定义了字符图形与编码的映射关系,应用程序根据(312)来显示文件(310)中的字符编码(311),与图2所示的电子文件(210)需要字体文件(230)显示字符图形的方式不同的是,应用程序不需要文件(310)以外的其他信息就可以显示字符编码对应的字符图形。与字体文件(230)一样,映射表(312)中的字符图形与编码也是按自定义的方式对应的,所以(311)据此显示为(320)。注意到,按照UNICODE编码标准,(311)对应的字符语义为(300)。这样,文件(310)具有了由字符显示出的图形(320)构成的显式信道,以及字符编码(311)构成的隐藏信道,文件编码(311)按UNICODE编码标准定义的内容为隐藏信息(300)。与图2中的文件(210)相似,自包含字符图形和编码信息的电子文件(310)也同时具有了显式信道与隐藏信道,在文件(310)的隐藏信道中通信也形成了一种隐藏通信方法,不同的是,反映字符编码与图形对应关系的映射表(312)包含在文件(310)内部。
现有技术中,已有多种文件格式的自包含字符图形和编码信息的电子文件,例如PDF格式、CAJ格式的电子文件,它们都具有如文件(310)的自包含编码信息(311)和映射表(312)的特性,应用程序可以不需要这些文件以外的信息就可以进行字符图形的显示,从而可以独立于不同硬件平台和操作系统使用。
对于产生本发明自包含字符图形和编码信息的电子文件(310)的方法,本发明推荐首先按照图2所示的方式,按照显示信息“好雨知时节”的字符图形与隐藏信息“作者:杜甫”的字符编码之间的字符位置对应关系,产生自定义文件(230)。然后,针对具体格式的自包含字符图形和编码信息的电子文件,用与该文件格式相应的现有技术提供的方法,结合仅包含字符编码的文件(210)与字体文件(230)生成(310)。例如,PDF格式的电子文件可以通过打印驱动程序Acrobat Distiller、Acrobat PDFWriter打印得到,CAJ格式的电子文件可以通过打印驱动程序CAJWriter打印得到。
值得注意的是,要检测或显示本发明的电子文件的隐藏信息是方便的。如果需要检测文件(210)隐藏信道中的文件信息,只需按标准编码规范映射该文件的字符编码,此外,利用标准字体文件(240)即可对隐藏信息进行显示,这也相当于提供了一种检测或显示文本数字水印的方式。对于文件(310),可以在与该文件相应的应用程序中复制文件(310)的字符编码形成类似(210)的文件,进而按字符标准编码规范读取或显示其隐藏信息。例如,可从PDF格式的文件中通过复制、粘贴的方法获取文件的字符编码。同时,用程序获取文件(210)、(310)显式信道内容对应的标准编码是比较困难的,因为这些显示出的字符图形(220)、(320)虽然对人的识别来说是容易的,但由于其对应的编码(311)不是字符图形(220)、(320)对应的标准编码,要让程序获得如文件(100)所示的标准编码,需要针对字符图形(220)、(320)用OCR技术进行识别,相对比较困难。
2.编码冲突解决方法的具体实施方式
本发明的电子文件中,当出现隐藏信息中相同字符编码对应显式信息中不同字符图形的情况时,会出现编码的冲突。如图4所示,电子文件(410))显式信道的文件内容为(420),隐藏信道中字符编码按照UNICODE标准对应的内容为(400)。注意到编码(411)与(413)是相同的,但它们对应的字符图形分别是(421)、(422),同时,在现有字体文件中,一个字符编码只能对应唯一的一个字符图形,这样就造成了在同一个字体文件中对字符图形(421)、(422)编码的冲突。编码(412)、(414)及其对应的字符图形也有类似的情况。本发明的解决方式是利用多个字体文件并结合隐藏信道中的格式信息来解决该问题。如图4所示,将隐藏信道中相同的编码分别在不同的字体文件中映射为不同的字符图形,相同的字符编码(431)与(441)分别在字体文件(430)、(440)中进行不同的字符图形映射,(431)映射(432),(441)映射(442)。同时,在文件(410)中用格式信息将(411)、(412)标记为字体文件①对应的字体,将(413)、(414)标记为字体文件②对应的字体。这样,通过不同的字体将相同的编码进行了区分,应用程序可以在相应的字体文件中查询字符编码对应的字符图形,从而解决了前述的编码冲突问题。
在图5中的自包含图形与编码信息的文件(520)中,显式信道的内容为(530),隐藏信道的内容为(510),也存在隐藏信道中相同的编码对应显式信道中的不同字符图形的情况。可以利用类似图4所示的方法来解决编码冲突问题,不同点在于:不同字体(5221)、(5222)表示的字符编码与图形的映射关系,反映在文件(520)内部包含的“字符图形与映射表”(522)中,而不是在文件(520)外部的字体文件中。
3.应用的具体实施方式
本发明典型的应用是将普通文件制作成如(310)、(520)所示的电子文件,在文件显式信道中保存原电子文件内容,而在隐藏信道中加入版权声明及各种文件的属性信息。如前文所述,本发明的电子文件显式信道的内容对应的标准字符编码不容易被程序自动获取,反之,隐藏信道中的字符编码却易于被程序检测或自动读取。这样,使得本发明的电子文件具有了一种独特的特性:原文件内容不易被非法复制,却很容易地显示版权声明信息及其他文件的属性信息。
本发明的另一个应用是用于增强对文件进行搜索的能力。当前,各种按照内容进行文件搜索的技术是基于被搜索文件内的字符编码进行匹配的,例如互联网上的搜索引擎Google、百度等。将本发明的电子文件(520)置于互联网上,这些搜索引擎总是依照输入的搜索关键字的标准编码与文件(520)包含的字符编码进行匹配搜索的,而且缺省地认为被搜索的文件内的字符也是按照标准编码规范编码的。然而,文件(520)内的字符编码构成了隐藏信道,其按照标准编码规范对应的信息是隐藏信息,对文件(520)的搜索实际上是按照隐藏信道中的内容(510)进行的,而不是按照显式信道中的内容(530)进行的。这样,相当于在不对现有搜索引擎做任何改变的前提下,自动提供了一种按照电子文件中的隐藏信息进行搜索的文件搜索功能。
特别的,如果将文件的属性信息置于隐藏信道中,可以获得特别的搜索效果。例如文件(520)显式信道中的内容(530)的作者为杜甫,选自《唐诗三百首》,编者为孙洙。作者与编者这两种文件属性被记录在隐藏信道(521)中。此外,增大电子文件容量,在显式信道中将整首诗补齐,则还可以在隐藏信道中加入唯一表示该文件的编码、版权声明等信息。这样,一方面可以不改变文件(520)的显式信道中的文件内容,另一方面却可以按照隐藏信道中文件的作者、编者、编码、版权声明等文件属性信息进行搜索,从而等价于增强了现有搜索引擎对文件的搜索功能。这种增强搜索功能特别有利于对具有相同属性的一组不同内容的文件进行搜索和管理。本发明建议以XML格式在文件的隐藏信道中保存文件的属性信息,便于计算机程序识别属性数据。

Claims (10)

1.隐藏通信方法,其特征是:
在电子文件中,对于相同的字符编码,其按照标准编码规范定义的内容构成隐藏信息,按照自定义的字符编码与图形的映射关系显示出的字符图形内容构成显式信息,从而在利用该电子文件显示出的字符图形进行正常通信的同时利用字符的编码进行隐藏通信。
2.包含字符的电子文件,其特征是:
电子文件同时具有显式与隐藏通信信道,字符编码按照自定义的字符编码与图形的映射关系显示出的字符图形构成显式通信信道,字符编码自身构成隐藏通信信道,其按标准编码规范定义的内容为隐藏信息。
3.如权利要求2所述的电子文件,其特征是:
该电子文件为自包含字符图形和字符编码信息的电子文件,同时具有字符编码显示出的图形构成的显式信道和字符编码自身构成的隐藏信道。
4.一种使得电子文件显示出的字符图形所表示的语义,与其对应的编码按标准编码规范所定义的语义互不相同的方法,其特征是:
改变字体文件中字符的图形和编码之间的标准映射关系,按照自定义的方式进行字符图形与编码的映射,从而产生自定义的字体文件,并用这种自定义字体文件确定的字体进行电子文件的显示。文件中字符编码按自定义字体文件显示出的字符图形代表的是一种语义,按照标准编码规范表示的是另一种语义。
5.一种使得电子文件显示出的字符图形所表示的语义,与其对应的编码按标准编码规范所定义的语义互不相同的方法,其特征是:
在自包含字符图形和字符编码信息的电子文件中,改变“字符图形与编码映射表”中字符的图形和编码之间的标准映射关系,按照自定义的方式进行字符图形与编码的映射。文件中字符编码按“字符图形与编码映射表”显示出的字符图形代表的是一种语义,按照标准编码规范表示的是另一种语义。。
6.产生如权利要求3所述的电子文件的方法,其步骤是:
(1)根据显式信息的字符图形与隐藏信息的字符编码之间的对应关系,确定字体文件中字符图形与其编码的映射关系,从而生成自定义的字体文件。
(2)利用由隐藏信息所映射的标准字符编码构成的电子文件,以及(1)中形成的自定义字体文件,生成自包含字符图形和字符编码信息的电子文件。
7.如权利要求2或3所述的电子文件中,当出现隐藏信道中相同字符编码对应显式信道中不同字符图形的情况时,一种解决编码冲突的措施,其特征是:
将隐藏信道中相同字符编码所对应的不同字符图形分别用不同的字体表示,并将隐藏信道中相同字符编码分别标记为相应的字体。
8.如权利要求2或3所述的电子文件,其特征是:
电子文件的版权声明信息或者文件的属性信息保存在该文件的隐藏信道中。
9.增强对电子文件进行搜索的能力的方法,其特征是:
将电子文件制作成如权利要求2或3所述的电子文件,从而实现按照隐藏通信信道中的隐藏信息内容进行文件搜索的功能。
10.如权利要求9所述的方法,其特征是:
将电子文件的属性信息作为隐藏信息保存在隐藏信道中,从而实现按照文件的属性信息进行文件搜索的功能。
CN 200610020372 2006-02-28 2006-02-28 字符的图形与编码相互独立的隐藏通信方法 Pending CN1812321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610020372 CN1812321A (zh) 2006-02-28 2006-02-28 字符的图形与编码相互独立的隐藏通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610020372 CN1812321A (zh) 2006-02-28 2006-02-28 字符的图形与编码相互独立的隐藏通信方法

Publications (1)

Publication Number Publication Date
CN1812321A true CN1812321A (zh) 2006-08-02

Family

ID=36845029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610020372 Pending CN1812321A (zh) 2006-02-28 2006-02-28 字符的图形与编码相互独立的隐藏通信方法

Country Status (1)

Country Link
CN (1) CN1812321A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533389A (zh) * 2009-03-24 2009-09-16 王琳 作品版权保护方法
CN102393892A (zh) * 2011-12-05 2012-03-28 西安科技大学 一种word文档版权保护的方法
CN102542212A (zh) * 2010-12-24 2012-07-04 北大方正集团有限公司 一种文本信息隐藏方法及装置
CN110704813A (zh) * 2019-10-19 2020-01-17 白杨 一种基于字符重新编码的文字防盗版系统
CN116340909A (zh) * 2023-03-31 2023-06-27 北京百度网讯科技有限公司 信息编码方法、信息追溯方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533389A (zh) * 2009-03-24 2009-09-16 王琳 作品版权保护方法
CN102542212A (zh) * 2010-12-24 2012-07-04 北大方正集团有限公司 一种文本信息隐藏方法及装置
CN102542212B (zh) * 2010-12-24 2015-04-29 北大方正集团有限公司 一种文本信息隐藏方法及装置
CN102393892A (zh) * 2011-12-05 2012-03-28 西安科技大学 一种word文档版权保护的方法
CN102393892B (zh) * 2011-12-05 2014-04-02 西安科技大学 一种word文档版权保护的方法
CN110704813A (zh) * 2019-10-19 2020-01-17 白杨 一种基于字符重新编码的文字防盗版系统
CN116340909A (zh) * 2023-03-31 2023-06-27 北京百度网讯科技有限公司 信息编码方法、信息追溯方法及装置
CN116340909B (zh) * 2023-03-31 2024-05-10 北京百度网讯科技有限公司 信息编码方法、信息追溯方法及装置

Similar Documents

Publication Publication Date Title
Alotaibi et al. Improved capacity Arabic text watermarking methods based on open word space
Shirali-Shahreza et al. A new approach to Persian/Arabic text steganography
Shirali-Shahreza et al. Arabic/Persian text steganography utilizing similar letters with different codes
Taha et al. A high capacity algorithm for information hiding in Arabic text
US7836399B2 (en) Detection of lists in vector graphics documents
CN1924925A (zh) 一种文档数字水印嵌入方法
Al-Nofaie et al. Utilizing pseudo-spaces to improve Arabic text steganography for multimedia data communications
US20020126869A1 (en) Multi-stage watermarking process and system
EP0629972A2 (en) Method and apparatus for embedding identification codes in printed documents
US20050053258A1 (en) System and method for watermarking a document
CN100550653C (zh) 一种可变长度结构化信息的编码和解码方法
Singh et al. A survey on text based steganography
CN100367274C (zh) 一种在英文文本中嵌入和提取水印的方法
Gutub et al. Utilizing diacritic marks for Arabic text steganography
AU2009226211A1 (en) Method and system for embedding covert data in a text document using space encoding
CN1812321A (zh) 字符的图形与编码相互独立的隐藏通信方法
CN103544408A (zh) 一种基于复合字体的pdf文档隐藏信息嵌入和提取方法
Stojanov et al. A new property coding in text steganography of Microsoft Word documents
Myers et al. Signal separation for nonlinear dynamical systems
Khairullah et al. Steganography in bengali unicode text
Liu et al. Multi-keywords carrier-free text steganography method based on Chinese pinyin
CN109800547B (zh) 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法
CN114741717B (zh) 基于ooxml文档的隐藏信息嵌入和提取方法
Shirali-Shahreza et al. Persian/arabic unicode text steganography
CN1599405A (zh) 以符号的冗余编码携带隐藏信息的文本数字水印技术

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication