CN1641716A - 数据加密的方法与系统 - Google Patents
数据加密的方法与系统 Download PDFInfo
- Publication number
- CN1641716A CN1641716A CNA2004100003788A CN200410000378A CN1641716A CN 1641716 A CN1641716 A CN 1641716A CN A2004100003788 A CNA2004100003788 A CN A2004100003788A CN 200410000378 A CN200410000378 A CN 200410000378A CN 1641716 A CN1641716 A CN 1641716A
- Authority
- CN
- China
- Prior art keywords
- mentioned
- word
- synonym
- enciphered message
- desire
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Storage Device Security (AREA)
Abstract
一种数据加密的方法。首先,利用一中文断词方法将文章内容予以断词,并进行词性判断以标注词性。然后,产生文章的加密信息,包括将水印信息转换成位字符串,以及根据一质数产生一个二次剩余表,作为选取加密词语的判断标准。接下来,选取要进行加密的词语及其同义词,其依据相关词语筛选规则筛选不适合作为嵌入水印的词语。然后进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中。最后,完成前述步骤后即可产生嵌入水印信息的密文。
Description
技术领域
本发明是有关于一种数据加密的方法与系统,且特别有关于一种水印加密的方法与系统。
背景技术
「数字水印」指的是将水印的技术运用在数字媒体中,这些数字媒体包含数字化的影像、声音及图片等。为了防止数字媒体在网络上遭人下载非法使用,可以将一些具代表性的图案(如注册商标或版权信息),利用相关的技术植入这些数字媒体中,用以证明其合法的持有者,进而保护知识产权,该具代表性的图案即所谓的「水印信息」。
当这些已经植入「数字水印」的数字媒体被非法使用时,可以利用相关技术将「数字水印」取出来,用以证明其合法的持有者是谁。目前的「数字水印」主要使用于图片的保护,图片植入水印后,与原有图片看起来并没有任何不同,但实际上却已将水印信息隐藏于图片中,因此具备了水印的保密性。
然而,目前的数字水印技术少有应用于文件的保护上。而已知应用于文件保护上的数字水印技术具有下列缺点,其一是文件可以透过光学文字辨识(OCR,Optical Character Recognition)被撷取使用,其二是剽窃者不以拷贝的方式抄袭文件,而是以文字编辑软件自行输入使用。所以,现有的数字水印技术无法有效地保护文件不被盗用。
发明内容
有鉴于此,本发明的目的在提供一种数据加密的方法与系统,以保护文章内容不被轻易盗用。
基于上述目的,本发明提供一种数据加密的方法。首先,利用一中文断词方法将文章之内容予以断词,并进行词性判断以标注词性。然后,产生文章的加密信息,包括将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串以嵌入文字内,以及任意选取一质数,并利用一个二次剩余的数学定理产生一个二次剩余表,作为选取加密词语的判断标准。
接下来,选取要进行加密的词语及其同义词,其依据相关词语筛选规则筛选不适合作为嵌入水印的词语。然后进行同义词替换。当找出适合作为嵌入水印的词语后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语的剩余对映值与欲嵌入水印的位值比较,当结果不同时即进行同义词的替换。最后,完成前述步骤后即可产生嵌入水印信息的密文。
本发明另外提供一种数据加密的系统,其包括一词语处理单元、一加密信息产生单元、一词语选取单元、一同义语替换单元以及一密文产生单元。词语处理单元利用一中文断词方法将文章的内容予以断词,并进行词性判断以标注词性。加密信息产生单元产生文章的加密信息,包括将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串以嵌入文字内,以及任意选取一质数,并利用一个二次剩余的数学定理产生一个二次剩余表,作为选取加密词语的判断标准。
接下来,词语选取单元选取要进行加密的词语及其同义词其依据相关词语筛选规则筛选不适合作为嵌入水印的词语。然后,同义语替换单元进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语的剩余对映值与欲嵌入水印的位值比较,当结果不同时即进行同义词的替换。最后,密文产生单元产生嵌入水印信息的密文。
附图说明
图1为显示本发明资料加密方法的实施步骤流程图。
图2显示本发明数据加密系统的架构示意图。
符号说明:
210~词语处理单元
220~加密信息产生单元
230~词语选取单元
240~同义语替换单元
250~密文产生单元
具体实施方式
为让本发明的上述和其它目的、特征和优点能更明显易懂,下文特举出较佳实施例,并配合附图,作详细说明如下。
本发明提供一种数据加密方法与系统。
本方法将水印植入文件中,以达到保护文件的目的。利用本发明的算法,依据所要隐藏的信息将文件中的内容加密成为语意上与原文无异的密文,其实施流程如下所述。
图1显示本发明资料加密方法的实施步骤流程图。
欲保护的文件内容根据该水印植入程序,将数字水印嵌入于文字中而成为一密文。假设一文章内容为:
『Mobile Content新的价值链中,利润的分配亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可赚取其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能赚取代收帐款的费用,在此情形下,系统业者将赚取最多的利润。』
在步骤S1中,将文章的内容予以断词,并进行词性判断以标注词性。利用一中文断词方法将文章内容予以断词及进行词类标记,其断词后的结果如下:
『。(PERIODCATEGORY)Mobile(FW)Content(FW)新(VH)的(DE)价值(Na)链(Na)中(Ng),(COMMACATEGORY),(COMMACATEGORY)利润(Na)的(DE)分配(VD)亦(D)因(Cbb)内容(Na)整合商(Na)由(P)谁(Nh)担任(VG)而(Cbb)有所(VJ)不同(VH)。(PERIODCATEGORY)。(PERIODCATEGORY)如(Cbb)由(P)系统(Na)业者(Na)扮演(VC)内容(Na)整合商(Na)/(FW)发行商(Na)的(DE)角色(Na),(COMMACATEGORY),(COMMACATEGORY)除(P)可(D)赚取(VC)其(Nep)担任(VG)内容(Na)整合商(Na)/(FW)发行商(Na)所(D)应(D)享(VJ)的(DE)利润(Na),(COMMACATEGORY),(COMMACATEGORY)因(Cbb)掌握(VC)账单(Na)系统(Na),(COMMACATEGORY),(COMMACATEGORY)亦(D)能(D)赚取(VC)代收(VC)帐款(Na)的(DE)费用(Na),(COMMACATEGORY),(COMMACATEGORY)在(P)此(Nep)情形(Na)下(Ng),(COMMACATEGORY),(COMMACATEGORY)系统(Na)业者(Na)将(D)赚取(VC)最多(VH)的(DE)利润(Na)。(PERIODCATEGORY)』
在步骤S2中,产生文章的加密信息,其分成两个部分。第一部份是将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串(Bit String)以嵌入文字内。转换成位字符串的方式可采用Unicode、ASCII、Big5等转换方式,举例来说,版权信息为『ACT』,经过位字符串转换后变为『00101』。
第二部分是任意选取一质数(假设为10007),并利用一个二次剩余(Quadratic Residue)数学定理产生一个二次剩余表(Quadratic ResidueTable),作为选取加密词语的判断标准。如表一所示,二次剩余表中记录从1到所选取质数范围内,相应每一数值的剩余对映值,其以0或1表示。有关加密词语的判断方式叙述于下文中。
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | ... | 10007 | |
剩余对映值 | 1 | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 1 | ... | 0 |
表1
在步骤S3中,选取要进行加密的词语及其同义词。在取得上述的断词结果及二次剩余表后,依据下列规则筛选不适合作为嵌入水印的词语:(1)剔除文章中的标点符号。(2)剔除经过断词程序后,取得的词语长度为1者,即为一个中文字。(3)剔除词性为FW的词语(亦即该词语为英文)。(4)剔除没有同义词的词语。(5)词语虽具有同义词,但将该词语与其同义词依序进行其位字符串逻辑运算(包括XOR运算、AND运算、OR运算、+运算、-运算以及*运算)后,并且根据运算结果查找二次剩余表所得剩余对映值相等时,也需剔除该词语。
举例来说,一词语为『分配』,其经过位字符串转换之后所得的位字符串分别为『分:10011』和『配:10101』。根据一同义词库可取得『分配』的同义词『分发』,其经过位字符串转换之后所得位字符串分别为『分:10001』和『发:11101』。接着对两词语的位字符串进行逻辑运算,首先进行XOR运算,『分配』位经过运算后可得『分配:00110』,转换为十进制后的数字为『6』,『6』除以密钥的值『10007』所得剩余为『6』,查找二次剩余表可得剩余对映值为『分配:1』。而『分发』位经过运算后可得『分发:01100』,转换为十进制后数字为『12』,『12』除以密钥的值『10007』所得剩余为『12』,查找二次剩余表可得剩余对映值为『分发:1』。由上述运算结果可得两词语剩余对映值相同,因此接着进行AND运算,若运算结同样得到相同剩余对映值,再接着进行OR运算,以此类推,直到取得两不同剩余对映值,或者执行全部逻辑运算后仍未取得两不同的剩余对映值时,则剔除该词语。
另外,要注意的是,词语不限定在二个字,包含三个字以上的词语也可。如某一词语为『冰箱』,其同义词为『电冰箱』,同样需将『电』『冰』『箱』三个字分别转换成位字符串以进行逻辑运算。
执行词语的选取步骤后,可得到适合作为嵌入水印信息的词语、其相对应的同义词以及查找二次剩余表所得的剩余对映值,如表2所示。
词 | 同义词 | 剩余对映值:1 | 剩余对映值:0 |
分配(VD) | 发给、分发 | 分配、发给 | 分发 |
赚取(VC) | 创利、赢利、盈利、创收 | 盈利、创收 | 赚取、赢利、创利 |
情形(Na) | 情况、状况、状态、条件 | 情形、状况、条件 | 情况、状态 |
表2
在步骤S4中,进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语剩余对映值与欲嵌入之水印的位值比较,当结果不同时即进行同义词的替换。
例如,以下列文章来说:
『Mobile Content新的价值链中,利润的【分配(1,0)】亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可【赚取(0,0)】其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能【赚取(0,1)】代收帐款的费用,在此【情形(1,0)】下,系统业者将【赚取(0,1)】最多的利润。』
其中,【分配(1,0)】的1表示词语『分配』的剩余对映值,而要植入的水印之位值为『0』,因两者位值不同,故要进行同义词替换。另一方面,【赚取(0,0)】的剩余对映值与要植入的水印位值皆为『0』,故不需进行同义词替换。
此外,一个词语可能有一个或以上的同义词,本方法利用下述规则来选择替换词。
首先,一个词语可能有多个同义词,在选择同义词替换时,需选择与原来词语剩余对映值不同的。其次,一个词语可能有多种词性,在选择同义词替换时,需要考虑词语在文章中的词性,以免将名词的同义词替换成动词。最后,相同词性的同义词也可能有一个或以上,此时必须利用平衡语言资料库来选择惯用(连用)性高者作为替换的同义词。
因此,以上面的例子而言,经过上述选择替换词规则后,可得结果如下:
『Mobile Content新的价值链中,利润的【分配(分发)】亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可【赚取(0,0)】其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能【赚取(盈利、创收)】代收帐款的费用,在此【情形(情况、状态)】下,系统业者将【赚取(盈利、创收)】最多的利润。』
其中,【分配(分发)】表示词语『分配』可替换之同义词为『分发』。
在步骤S5中,产生嵌入水印信息的密文。经过前述四个步骤后,将文章中可予以加密的词语进行同义词替换,加密后的密文结果(斜体字部分为水印隐藏之处)如下所示:
『Mobile Content新的价值链中,利润的「分发」亦因内容整合商由谁担任而有所不同。如由系统业者扮演内容整合商/发行商的角色,除可「赚取」其担任内容整合商/发行商所应享的利润,因掌握账单系统,亦能「盈利」代收帐款的费用,在此「状态」下,系统业者将「盈利」最多的利润。』
图2为显示本发明数据加密系统架构示意图。本系统包括一词语处理单元210、一加密信息产生单元220、一词语选取单元230、一同义语替换单元240以及一密文产生单元250。
词语处理单元210利用一中文断词方法将文章内容予以断词,并进行词性判断以标注词性。加密信息产生单元220产生文章的加密信息,其分成两个部分。第一部份是将要嵌入文章当中的水印信息(如版权信息)转换成对应的位字符串以嵌入文字内。第二部分是任意选取一质数,并利用一个二次剩余数学定理产生一个二次剩余表,作为选取加密词语的判断标准。
接下来,词语选取单元230选取要进行加密的词语及其同义词。在取得上述的断词结果及二次剩余表后,依据下列规则筛选不适合作为嵌入水印的词语:(1)剔除文章中的标点符号。(2)剔除经过断词程序后,取得词语长度为1者,即为一个中文字。(3)剔除词性为FW的词语(即该词语为英文)。(4)剔除没有同义词的词语。(5)词语虽具有同义词,但将该词语与其同义词依序进行其位字符串的逻辑运算(包括XOR运算、AND运算、OR运算、+运算、-运算以及*运算)后,并且根据运算结果查找二次剩余表所得剩余对映值相等时,亦需剔除该词语。执行词语的选取步骤后,可得到适合作为嵌入水印信息的词语、其相对应的同义词。
然后,同义语替换单元240进行同义词替换。当找出适合作为嵌入水印的词语之后,便可将水印的位字符串,以一个位为单位,依照顺序嵌入至选出的词语中,其嵌入的原则为将词语剩余对映值与欲嵌入水印的位值比较,当结果不同时即进行同义词的替换。最后,密文产生单元250产生嵌入水印信息的密文。
本发明将水印信息隐藏于欲保护的文章中,即使利用光学文字辨识或打字等方法盗用,仍可被检测出来。此外,本发明亦可应用于信息隐藏及信息保护上,当在传递受保护的文件时,其中隐含的秘密信息不会被察觉。此外,保密信息若被破坏,则受到保护的数据亦会遭到毁损,因此可降低被盗用的机会。
Claims (10)
1.一种数据加密的方法,包括下列步骤:
对一文章内容予以断词,并就所取得多个词语进行词性标注;
产生上述文章加密信息以及一个二次剩余表,其中上述加密信息为一水印信息,并且将其转换成一位字符串;
根据上述二次剩余表自上述多个词语中选取要进行加密的词语及其相对应的同义词;
根据上述加密信息与上述欲加密词语的词性对上述欲加密词语进行同义词替换;以及
根据上述加密信息与上述同义词产生嵌入加密信息的密文。
2.如权利要求1所述的数据加密的方法,其中,产生上述加密信息的步骤更包括根据一质数建立上述二次剩余表,其用以选取上述加密的词语。
3.如权利要求1所述的数据加密的方法,其中,在选取上述加密词语及其相对应的同义词的步骤中,当一欲加密词语与其相应之同义词进行一逻辑运算,且参照上述二次剩余表所得计算结果相同时,则自上述欲加密词语剔除,上述逻辑运算包括XOR运算、AND运算、OR运算、+运算、-运算以及*运算。
4.如权利要求1所述的数据加密的方法,其中,在选取上述加密词语及其相对应的同义词的步骤中,自上述欲加密的词语中剔除文章中的标点符号、词语长度为1、词语以英文表示以及无同义词的词语,并且根据一同义词库选取上述加密词语相对应的同义词。
5.如权利要求1所述的数据加密的方法,其中,在上述进行同义词替换的步骤中,当取得一可供替换之同义词,即将上述加密信息位字符串值嵌入上述同义词中,且欲嵌入加密信息词语根据上述二次剩余表可得一剩余对映值,当欲嵌入加密信息位值与上述剩余对映值相同,则选取另一同义词以进行加密信息的嵌入,以及更可根据上述欲加密词语的词性与惯用性选取其同义词。
6.一种数据加密的系统,至少包括:
一词语处理单元,其用以对一文章的内容予以断词,并就所取得的多个词语进行词性标注;
一加密信息产生单元,耦接于上述词语处理单元,其用以产生上述文章的加密信息以及一个二次剩余表,其中上述加密信息为一水印信息,并且将其转换成一位字符串;
一词语选取单元,耦接于上述加密信息产生单元,其用以根据上述二次剩余表自上述多个词语中选取要进行加密的词语及其相对应的同义词;
一同义语替换单元,耦接于上述词语选取单元,其用以根据上述加密信息与上述欲加密词语的词性对上述欲加密词语进行同义词替换;以及
一密文产生单元,耦接于上述同义语替换单元,其用以根据上述加密信息与上述同义词产生嵌入加密信息的密文。
7.如权利要求6所述的数据加密的系统,其中,上述加密信息产生单元根据一质数建立上述二次剩余表,用以选取上述加密的词语。
8.如权利要求6所述的数据加密的系统,其中,上述词语选取单元于一欲加密词语与其相应的同义词进行一逻辑运算,且参照上述二次剩余表所得之计算结果相同时,自上述欲加密之词语剔除该词语,其中上述逻辑运算包括XOR运算、AND运算、OR运算、+运算、-运算以及*运算。
9.如权利要求6所述的数据加密的系统,其中,上述词语选取单元自上述欲加密的词语中剔除文章中的标点符号、词语长度为1、词语以英文表示以及无同义词的词语,并且根据一同义词库选取上述加密词语相对应的同义词。
10.如权利要求6所述的数据加密的系统,其中,上述同义词替换单元于当取得一可供替换的同义词时,即将上述加密信息位字符串值嵌入上述同义词中,根据上述二次剩余表可得上述欲嵌入加密信息词语的一剩余对映值,且当欲嵌入加密信息的位值与上述剩余对映值相同,上述同义词替换单元选取另一同义词以进行加密信息的嵌入,以及根据上述欲加密词语的词性与惯用性选取其同义词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100003788A CN100489837C (zh) | 2004-01-09 | 2004-01-09 | 数据加密的方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100003788A CN100489837C (zh) | 2004-01-09 | 2004-01-09 | 数据加密的方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1641716A true CN1641716A (zh) | 2005-07-20 |
CN100489837C CN100489837C (zh) | 2009-05-20 |
Family
ID=34866736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100003788A Expired - Fee Related CN100489837C (zh) | 2004-01-09 | 2004-01-09 | 数据加密的方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100489837C (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101901325A (zh) * | 2010-07-21 | 2010-12-01 | 赵步 | 作品版权保护法 |
CN101183384B (zh) * | 2006-11-13 | 2010-12-29 | 国际商业机器公司 | 处理数据的方法和装置 |
US7900052B2 (en) | 2002-11-06 | 2011-03-01 | International Business Machines Corporation | Confidential data sharing and anonymous entity resolution |
CN102185689A (zh) * | 2011-03-25 | 2011-09-14 | 桂林电子科技大学 | 一种具有误导功能的低冗余加密系统 |
CN105027074A (zh) * | 2013-03-08 | 2015-11-04 | 高通股份有限公司 | 质数产生 |
-
2004
- 2004-01-09 CN CNB2004100003788A patent/CN100489837C/zh not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7900052B2 (en) | 2002-11-06 | 2011-03-01 | International Business Machines Corporation | Confidential data sharing and anonymous entity resolution |
CN101183384B (zh) * | 2006-11-13 | 2010-12-29 | 国际商业机器公司 | 处理数据的方法和装置 |
US8204831B2 (en) | 2006-11-13 | 2012-06-19 | International Business Machines Corporation | Post-anonymous fuzzy comparisons without the use of pre-anonymization variants |
CN101901325A (zh) * | 2010-07-21 | 2010-12-01 | 赵步 | 作品版权保护法 |
CN102185689A (zh) * | 2011-03-25 | 2011-09-14 | 桂林电子科技大学 | 一种具有误导功能的低冗余加密系统 |
CN105027074A (zh) * | 2013-03-08 | 2015-11-04 | 高通股份有限公司 | 质数产生 |
Also Published As
Publication number | Publication date |
---|---|
CN100489837C (zh) | 2009-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Tamper detection and localization for categorical data using fragile watermarks | |
US7730037B2 (en) | Fragile watermarks | |
Chen et al. | A fuzzy c-means clustering-based fragile watermarking scheme for image authentication | |
US20020150239A1 (en) | Method for personalized encryption in an un-trusted environment | |
Surekha et al. | Sensitive digital image watermarking for copyright protection | |
Chang et al. | A blind reversible robust watermarking scheme for relational databases | |
CN1641716A (zh) | 数据加密的方法与系统 | |
CN109800547B (zh) | 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法 | |
CN1758585A (zh) | 数字水印认证签章的方法 | |
CN107169914A (zh) | 一种用于图像隐写的密文信息生成方法 | |
Elbegbayan | Winnowing, a document fingerprinting algorithm | |
Sun et al. | Multiple watermarking relational databases using image | |
Shah et al. | Query preserving relational database watermarking | |
Khadam et al. | Data aggregation and privacy preserving using computational intelligence | |
US7817820B2 (en) | Method and system for generating and using digital fingerprints for electronic documents | |
Tzouramanis | A robust watermarking scheme for relational databases | |
Newbould et al. | Mixed signal design watermarking for IP protection | |
Murugan et al. | A robust watermarking technique for copyright protection for relational databases | |
Thanh et al. | Key-value based data hiding method for NoSQL database | |
Darwish | New system to fingerprint extensible markup language documents using winnowing theory | |
El_Haggar et al. | Blind watermarking technique for relational database | |
CN115134142B (zh) | 一种基于文件分割的信息隐藏方法及系统 | |
TWI297249B (en) | Method and system for data encryption | |
TamilSelvan et al. | A novel approach to watermark text documents based on Eigen values | |
Kim et al. | Protecting ownership rights of a lossless image coder through hierarchical watermarking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090520 Termination date: 20200109 |