CN100489837C - 数据加密的方法与系统 - Google Patents

数据加密的方法与系统 Download PDF

Info

Publication number
CN100489837C
CN100489837C CNB2004100003788A CN200410000378A CN100489837C CN 100489837 C CN100489837 C CN 100489837C CN B2004100003788 A CNB2004100003788 A CN B2004100003788A CN 200410000378 A CN200410000378 A CN 200410000378A CN 100489837 C CN100489837 C CN 100489837C
Authority
CN
China
Prior art keywords
mentioned
word
synonym
enciphered message
desire
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100003788A
Other languages
English (en)
Other versions
CN1641716A (zh
Inventor
蒋岳霖
张履平
陈文鋕
谢文泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute for Information Industry
Original Assignee
Institute for Information Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute for Information Industry filed Critical Institute for Information Industry
Priority to CNB2004100003788A priority Critical patent/CN100489837C/zh
Publication of CN1641716A publication Critical patent/CN1641716A/zh
Application granted granted Critical
Publication of CN100489837C publication Critical patent/CN100489837C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

一种数据加密的方法。首先,利用一中文断词方法将文章内容予以断词,并进行词性判断以标注词性。然后,产生文章的加密信息,包括将水印信息转换成位字符串,以及根据一质数产生一个二次剩余表,作为选取加密词语的判断标准。接下来,选取要进行加密的词语及其同义词,其依据相关词语筛选规则筛选不适合作为嵌入水印的词语。然后进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中。最后,完成前述步骤后即可产生嵌入水印信息的密文。

Description

数据加密的方法与系统
技术领域
本发明是有关于一种数据加密的方法与系统,且特别有关于一种水印加密的方法与系统。
背景技术
「数字水印」指的是将水印的技术运用在数字媒体中,这些数字媒体包含数字化的影像、声音及图片等。为了防止数字媒体在网络上遭人下载非法使用,可以将一些具代表性的图案(如注册商标或版权信息),利用相关的技术植入这些数字媒体中,用以证明其合法的持有者,进而保护知识产权,该具代表性的图案即所谓的「水印信息」。
当这些已经植入「数字水印」的数字媒体被非法使用时,可以利用相关技术将「数字水印」取出来,用以证明其合法的持有者是谁。目前的「数字水印」主要使用于图片的保护,图片植入水印后,与原有图片看起来并没有任何不同,但实际上却已将水印信息隐藏于图片中,因此具备了水印的保密性。
然而,目前的数字水印技术少有应用于文件的保护上。而已知应用于文件保护上的数字水印技术具有下列缺点,其一是文件可以透过光学文字辨识(OCR,Optical Character Recognition)被撷取使用,其二是剽窃者不以拷贝的方式抄袭文件,而是以文字编辑软件自行输入使用。所以,现有的数字水印技术无法有效地保护文件不被盗用。
发明内容
有鉴于此,本发明的目的在提供一种数据加密的方法与系统,以保护文章内容不被轻易盗用。
基于上述目的,本发明提供一种数据加密的方法。首先,利用一中文断词方法将文章之内容予以断词,并进行词性判断以标注词性。然后,产生文章的加密信息,包括将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串以嵌入文字内,以及任意选取一质数,并利用一个二次剩余的数学定理产生一个二次剩余表,作为选取加密词语的判断标准。
接下来,选取要进行加密的词语及其同义词,其依据相关词语筛选规则筛选不适合作为嵌入水印的词语。然后进行同义词替换。当找出适合作为嵌入水印的词语后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语的剩余对映值与欲嵌入水印的位值比较,当结果不同时即进行同义词的替换。最后,完成前述步骤后即可产生嵌入水印信息的密文。
本发明另外提供一种数据加密的系统,其包括一词语处理单元、一加密信息产生单元、一词语选取单元、一同义语替换单元以及一密文产生单元。词语处理单元利用一中文断词方法将文章的内容予以断词,并进行词性判断以标注词性。加密信息产生单元产生文章的加密信息,包括将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串以嵌入文字内,以及任意选取一质数,并利用一个二次剩余的数学定理产生一个二次剩余表,作为选取加密词语的判断标准。
接下来,词语选取单元选取要进行加密的词语及其同义词其依据相关词语筛选规则筛选不适合作为嵌入水印的词语。然后,同义语替换单元进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语的剩余对映值与欲嵌入水印的位值比较,当结果不同时即进行同义词的替换。最后,密文产生单元产生嵌入水印信息的密文。
附图说明
图1为显示本发明资料加密方法的实施步骤流程图。
图2显示本发明数据加密系统的架构示意图。
符号说明:
210~词语处理单元
220~加密信息产生单元
230~词语选取单元
240~同义语替换单元
250~密文产生单元
具体实施方式
为让本发明的上述和其它目的、特征和优点能更明显易懂,下文特举出较佳实施例,并配合附图,作详细说明如下。
本发明提供一种数据加密方法与系统。
本方法将水印植入文件中,以达到保护文件的目的。利用本发明的算法,依据所要隐藏的信息将文件中的内容加密成为语意上与原文无异的密文,其实施流程如下所述。
图1显示本发明资料加密方法的实施步骤流程图。
欲保护的文件内容根据该水印植入程序,将数字水印嵌入于文字中而成为一密文。假设一文章内容为:
『Mobile Content新的价值链中,利润的分配亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可赚取其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能赚取代收帐款的费用,在此情形下,系统业者将赚取最多的利润。』
在步骤S1中,将文章的内容予以断词,并进行词性判断以标注词性。利用一中文断词方法将文章内容予以断词及进行词类标记,其断词后的结果如下:
『。(PERIODCATEGORY)Mobile(FW)Content(FW)新(VH)的(DE)价值(Na)链(Na)中(Ng),(COMMACATEGORY),(COMMACATEGORY)利润(Na)的(DE)分配(VD)亦(D)因(Cbb)内容(Na)整合商(Na)由(P)谁(Nh)担任(VG)而(Cbb)有所(VJ)不同(VH)。(PERIODCATEGORY)。(PERIODCATEGORY)如(Cbb)由(P)系统(Na)业者(Na)扮演(VC)内容(Na)整合商(Na)/(FW)发行商(Na)的(DE)角色(Na),(COMMACATEGORY),(COMMACATEGORY)除(P)可(D)赚取(VC)其(Nep)担任(VG)内容(Na)整合商(Na)/(FW)发行商(Na)所(D)应(D)享(VJ)的(DE)利润(Na),(COMMACATEGORY),(COMMACATEGORY)因(Cbb)掌握(VC)账单(Na)系统(Na),(COMMACATEGORY),(COMMACATEGORY)亦(D)能(D)赚取(VC)代收(VC)帐款(Na)的(DE)费用(Na),(COMMACATEGORY),(COMMACATEGORY)在(P)此(Nep)情形(Na)下(Ng),(COMMACATEGORY),(COMMACATEGORY)系统(Na)业者(Na)将(D)赚取(VC)最多(VH)的(DE)利润(Na)。(PERIODCATEGORY)』
在步骤S2中,产生文章的加密信息,其分成两个部分。第一部份是将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串(Bit String)以嵌入文字内。转换成位字符串的方式可采用Unicode、ASCII、Big5等转换方式,举例来说,版权信息为『ACT』,经过位字符串转换后变为『00101』。
第二部分是任意选取一质数(假设为10007),并利用一个二次剩余(Quadratic Residue)数学定理产生一个二次剩余表(Quadratic ResidueTable),作为选取加密词语的判断标准。如表一所示,二次剩余表中记录从1到所选取质数范围内,相应每一数值的剩余对映值,其以0或1表示。有关加密词语的判断方式叙述于下文中。
 
1 2 3 4 5 6 7 8 9 10 11 12 10007
剩余对映值 1 1 1 1 0 1 0 0 1 0 1 1 0
表1
在步骤S3中,选取要进行加密的词语及其同义词。在取得上述的断词结果及二次剩余表后,依据下列规则筛选不适合作为嵌入水印的词语:(1)剔除文章中的标点符号。(2)剔除经过断词程序后,取得的词语长度为1者,即为一个中文字。(3)剔除词性为FW的词语(亦即该词语为英文)。(4)剔除没有同义词的词语。(5)词语虽具有同义词,但将该词语与其同义词依序进行其位字符串逻辑运算(包括XOR运算、AND运算、OR运算、+运算、-运算以及*运算)后,并且根据运算结果查找二次剩余表所得剩余对映值相等时,也需剔除该词语。
举例来说,一词语为『分配』,其经过位字符串转换之后所得的位字符串分别为『分:10011』和『配:10101』。根据一同义词库可取得『分配』的同义词『分发』,其经过位字符串转换之后所得位字符串分别为『分:10001』和『发:11101』。接着对两词语的位字符串进行逻辑运算,首先进行XOR运算,『分配』位经过运算后可得『分配:00110』,转换为十进制后的数字为『6』,『6』除以密钥的值『10007』所得剩余为『6』,查找二次剩余表可得剩余对映值为『分配:1』。而『分发』位经过运算后可得『分发:01100』,转换为十进制后数字为『12』,『12』除以密钥的值『10007』所得剩余为『12』,查找二次剩余表可得剩余对映值为『分发:1』。由上述运算结果可得两词语剩余对映值相同,因此接着进行AND运算,若运算结同样得到相同剩余对映值,再接着进行OR运算,以此类推,直到取得两不同剩余对映值,或者执行全部逻辑运算后仍未取得两不同的剩余对映值时,则剔除该词语。
另外,要注意的是,词语不限定在二个字,包含三个字以上的词语也可。如某一词语为『冰箱』,其同义词为『电冰箱』,同样需将『电』『冰』『箱』三个字分别转换成位字符串以进行逻辑运算。
执行词语的选取步骤后,可得到适合作为嵌入水印信息的词语、其相对应的同义词以及查找二次剩余表所得的剩余对映值,如表2所示。
 
同义词 剩余对映值:1 剩余对映值:0
分配(VD) 发给、分发 分配、发给 分发
赚取(VC) 创利、赢利、盈利、创收 盈利、创收 赚取、赢利、创利
情形(Na) 情况、状况、状态、条件 情形、状况、条件 情况、状态
表2
在步骤S4中,进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语剩余对映值与欲嵌入之水印的位值比较,当结果不同时即进行同义词的替换。
例如,以下列文章来说:
『Mobile Content新的价值链中,利润的【分配(1,0)】亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可【赚取(0,0)】其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能【赚取(0,1)】代收帐款的费用,在此【情形(1,0)】下,系统业者将【赚取(0,1)】最多的利润。』
其中,【分配(1,0)】的1表示词语『分配』的剩余对映值,而要植入的水印之位值为『0』,因两者位值不同,故要进行同义词替换。另一方面,【赚取(0,0)】的剩余对映值与要植入的水印位值皆为『0』,故不需进行同义词替换。
此外,一个词语可能有一个或以上的同义词,本方法利用下述规则来选择替换词。
首先,一个词语可能有多个同义词,在选择同义词替换时,需选择与原来词语剩余对映值不同的。其次,一个词语可能有多种词性,在选择同义词替换时,需要考虑词语在文章中的词性,以免将名词的同义词替换成动词。最后,相同词性的同义词也可能有一个或以上,此时必须利用平衡语言资料库来选择惯用(连用)性高者作为替换的同义词。
因此,以上面的例子而言,经过上述选择替换词规则后,可得结果如下:
『Mobile Content新的价值链中,利润的【分配(分发)】亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可【赚取(0,0)】其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能【赚取(盈利、创收)】代收帐款的费用,在此【情形(情况、状态)】下,系统业者将【赚取(盈利、创收)】最多的利润。』
其中,【分配(分发)】表示词语『分配』可替换之同义词为『分发』。
在步骤S5中,产生嵌入水印信息的密文。经过前述四个步骤后,将文章中可予以加密的词语进行同义词替换,加密后的密文结果(斜体字部分为水印隐藏之处)如下所示:
『Mobile Content新的价值链中,利润的「分发」亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可「赚取」其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能「盈利」代收帐款的费用,在此「状态」下,系统业者将「盈利」最多的利润。』
图2为显示本发明数据加密系统架构示意图。本系统包括一词语处理单元210、一加密信息产生单元220、一词语选取单元230、一同义语替换单元240以及一密文产生单元250。
词语处理单元210利用一中文断词方法将文章内容予以断词,并进行词性判断以标注词性。加密信息产生单元220产生文章的加密信息,其分成两个部分。第一部份是将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串以嵌入文字内。第二部分是任意选取一质数,并利用一个二次剩余数学定理产生一个二次剩余表,作为选取加密词语的判断标准。
接下来,词语选取单元230选取要进行加密的词语及其同义词。在取得上述的断词结果及二次剩余表后,依据下列规则筛选不适合作为嵌入水印的词语:(1)剔除文章中的标点符号。(2)剔除经过断词程序后,取得词语长度为1者,即为一个中文字。(3)剔除词性为FW的词语(即该词语为英文)。(4)剔除没有同义词的词语。(5)词语虽具有同义词,但将该词语与其同义词依序进行其位字符串的逻辑运算(包括XOR运算、AND运算、OR运算、+运算、-运算以及*运算)后,并且根据运算结果查找二次剩余表所得剩余对映值相等时,亦需剔除该词语。执行词语的选取步骤后,可得到适合作为嵌入水印信息的词语、其相对应的同义词。
然后,同义语替换单元240进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语剩余对映值与欲嵌入水印的位值比较,当结果不同时即进行同义词的替换。最后,密文产生单元250产生嵌入水印信息的密文。
本发明将水印信息隐藏于欲保护的文章中,即使利用光学文字辨识或打字等方法盗用,仍可被检测出来。此外,本发明亦可应用于信息隐藏及信息保护上,当在传递受保护的文件时,其中隐含的秘密信息不会被察觉。此外,保密信息若被破坏,则受到保护的数据亦会遭到毁损,因此可降低被盗用的机会。

Claims (10)

1.一种数据加密的方法,包括下列步骤:
对一文章内容予以断词,并就所取得多个词语进行词性标注;
产生上述文章加密信息以及一个二次剩余表,其中上述加密信息为一水印信息,并且将其转换成一位字符串;
根据上述二次剩余表自上述多个词语中选取要进行加密的词语及其相对应的同义词;
根据上述加密信息与上述欲加密词语的词性对上述欲加密词语进行同义词替换;以及
根据上述加密信息与上述同义词产生嵌入加密信息的密文。
2.如权利要求1所述的数据加密的方法,其中,产生上述加密信息的步骤更包括根据一质数建立上述二次剩余表,其用以选取上述加密的词语。
3.如权利要求1所述的数据加密的方法,其中,在选取上述加密词语及其相对应的同义词的步骤中,当一欲加密词语与其相应之同义词进行一逻辑运算,且参照上述二次剩余表所得计算结果相同时,则将上述欲加密词语剔除,上述逻辑运算包括异或运算、与运算、或运算、加运算、减运算以及乘运算。
4.如权利要求1所述的数据加密的方法,其中,在选取上述加密词语及其相对应的同义词的步骤中,自上述欲加密的词语中剔除文章中的标点符号、词语长度为1、词语以英文表示以及无同义词的词语,并且根据一同义词库选取上述加密词语相对应的同义词。
5.如权利要求1所述的数据加密的方法,其中,在上述进行同义词替换的步骤中,当取得一可供替换之同义词,即将上述加密信息位字符串值嵌入上述同义词中,且欲嵌入加密信息词语根据上述二次剩余表可得一剩余对映值,当欲嵌入加密信息位值与上述剩余对映值相同,则选取另一同义词以进行加密信息的嵌入,以及更可根据上述欲加密词语的词性与惯用性选取其同义词。
6.一种数据加密的系统,至少包括:
一词语处理单元,其用以对一文章的内容予以断词,并就所取得的多个词语进行词性标注;
一加密信息产生单元,耦接于上述词语处理单元,其用以产生上述文章的加密信息以及一个二次剩余表,其中上述加密信息为一水印信息,并且将其转换成一位字符串;
一词语选取单元,耦接于上述加密信息产生单元,其用以根据上述二次剩余表自上述多个词语中选取要进行加密的词语及其相对应的同义词;
一同义语替换单元,耦接于上述词语选取单元,其用以根据上述加密信息与上述欲加密词语的词性对上述欲加密词语进行同义词替换;以及
一密文产生单元,耦接于上述同义语替换单元,其用以根据上述加密信息与上述同义词产生嵌入加密信息的密文。
7.如权利要求6所述的数据加密的系统,其中,上述加密信息产生单元根据一质数建立上述二次剩余表,用以选取上述加密的词语。
8.如权利要求6所述的数据加密的系统,其中,上述词语选取单元于一欲加密词语与其相应的同义词进行一逻辑运算,且参照上述二次剩余表所得之计算结果相同时,将上述欲加密之词语剔除该词语,其中上述逻辑运算包括异或运算、与运算、或运算、加运算、减运算以及乘运算。
9.如权利要求6所述的数据加密的系统,其中,上述词语选取单元自上述欲加密的词语中剔除文章中的标点符号、词语长度为1、词语以英文表示以及无同义词的词语,并且根据一同义词库选取上述加密词语相对应的同义词。
10.如权利要求6所述的数据加密的系统,其中,上述同义词替换单元于当取得一可供替换的同义词时,即将上述加密信息位字符串值嵌入上述同义词中,根据上述二次剩余表可得上述欲嵌入加密信息词语的一剩余对映值,且当欲嵌入加密信息的位值与上述剩余对映值相同,上述同义词替换单元选取另一同义词以进行加密信息的嵌入,以及根据上述欲加密词语的词性与惯用性选取其同义词。
CNB2004100003788A 2004-01-09 2004-01-09 数据加密的方法与系统 Expired - Fee Related CN100489837C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100003788A CN100489837C (zh) 2004-01-09 2004-01-09 数据加密的方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100003788A CN100489837C (zh) 2004-01-09 2004-01-09 数据加密的方法与系统

Publications (2)

Publication Number Publication Date
CN1641716A CN1641716A (zh) 2005-07-20
CN100489837C true CN100489837C (zh) 2009-05-20

Family

ID=34866736

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100003788A Expired - Fee Related CN100489837C (zh) 2004-01-09 2004-01-09 数据加密的方法与系统

Country Status (1)

Country Link
CN (1) CN100489837C (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1757188A (zh) 2002-11-06 2006-04-05 国际商业机器公司 机密数据共享和匿名实体解析度
US8204831B2 (en) 2006-11-13 2012-06-19 International Business Machines Corporation Post-anonymous fuzzy comparisons without the use of pre-anonymization variants
CN101901325A (zh) * 2010-07-21 2010-12-01 赵步 作品版权保护法
CN102185689A (zh) * 2011-03-25 2011-09-14 桂林电子科技大学 一种具有误导功能的低冗余加密系统
US9182943B2 (en) * 2013-03-08 2015-11-10 Qualcomm Incorporated Methods and devices for prime number generation

Also Published As

Publication number Publication date
CN1641716A (zh) 2005-07-20

Similar Documents

Publication Publication Date Title
Lach et al. Fingerprinting techniques for field-programmable gate array intellectual property protection
Li et al. Tamper detection and localization for categorical data using fragile watermarks
Hong et al. An improved reversible data hiding in encrypted images using side match
Sion et al. On watermarking numeric sets
US10157270B2 (en) Methods, apparatus, and articles of manufacture to encode auxiliary data into text data and methods, apparatus, and articles of manufacture to obtain encoded data from text data
US7730037B2 (en) Fragile watermarks
CN100568152C (zh) 程序源代码保护方法和工具
Garg A novel text steganography technique based on html documents
CN107169325A (zh) 版权信息保护、确权方法、装置、系统及内容编辑设备
Sun et al. Component-based digital watermarking of Chinese texts
JP2007207051A (ja) 電子透かし埋め込み・配信方法、及び装置
CN100489837C (zh) 数据加密的方法与系统
Qu Publicly detectable watermarking for intellectual property authentication in VLSI design
CN107169911A (zh) 一种基于二维Arnold变换的图像加密方法
CN104376236B (zh) 基于伪装学的方案自适应数字水印嵌入方法及提取方法
CN109800547B (zh) 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法
KR102154897B1 (ko) 블록체인 및 핑거프린팅을 이용한 디지털 콘텐츠 관리 방법, 이를 수행하기 위한 장치 및 기록매체
CN110008663B (zh) 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法
Khadam et al. Data aggregation and privacy preserving using computational intelligence
US7817820B2 (en) Method and system for generating and using digital fingerprints for electronic documents
Saha et al. Fast robust intellectual property protection for VLSI physical design
Newbould et al. Mixed signal design watermarking for IP protection
Darwish New system to fingerprint extensible markup language documents using winnowing theory
Murugan et al. A robust watermarking technique for copyright protection for relational databases
TWI297249B (en) Method and system for data encryption

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090520

Termination date: 20200109

CF01 Termination of patent right due to non-payment of annual fee