CN101901325A - 作品版权保护法 - Google Patents

作品版权保护法 Download PDF

Info

Publication number
CN101901325A
CN101901325A CN2010102327109A CN201010232710A CN101901325A CN 101901325 A CN101901325 A CN 101901325A CN 2010102327109 A CN2010102327109 A CN 2010102327109A CN 201010232710 A CN201010232710 A CN 201010232710A CN 101901325 A CN101901325 A CN 101901325A
Authority
CN
China
Prior art keywords
copyright information
speech
works
information
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102327109A
Other languages
English (en)
Inventor
赵步
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2010102327109A priority Critical patent/CN101901325A/zh
Publication of CN101901325A publication Critical patent/CN101901325A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种中文作品版权保护方案,该方案基于同义词替换的中文信息隐藏方法。该方案包括以下步骤:1)构建同义词库;2)对需要添加的版权信息进行编码;3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征词,并将检索到的特征词及其位置记录存档。4)将检索到的词依次根据版权信息编码对应位数的数字进行替换。5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特征词及其位置,通过对比还原版权信息编码。6)根据还原的编码译码得到版权信息。本发明抗检测能力强,使得非授权者很难察觉或破解版权信息,维护了消费者和版权人的利益。

Description

作品版权保护法 
技术领域
本发明涉及一种中文作品版权保护方法,该方案基于同义词替换的中文信息隐藏方法,可以有效在作品中嵌入版权信息。 
背景技术
随着计算机和互联网技术的迅猛发展和普及,人们每天利用因特网来传输和交换大量的文本数据,这使得利用文本数据进行信息隐藏成为一种非常重要的隐秘通信渠道。为了在纯文本中嵌入隐藏信息,美国普渡大学Mikhail J.Atallah等于2000年提出了自然语言文本信息隐藏的概念。所谓自然语言文本信息隐藏,就是利用自然语言处理技术,通过改变文本中的词汇、语法或语义等属性来嵌入信息,并且尽可能的保留原文的意思。基于同义词替换的隐藏方法就是通过词汇的替换来嵌入信息。目前,国外对基于同义词替换的方法研究的很多,该研究已经逐渐成为一项公开、成熟的技术。但已有的信息隐藏技术仅仅应用于隐秘通信方面,在版权保护领域,尤其是中文版权保护的应用尚属空白。 
目前,版权保护已经成为知识产权领域的重点。网络的发展给文化的发展带来了更快捷的渠道、更广阔的空间,与此同时,在网络中知识产权更易于受到侵犯也成了一个难以避免的问题。在知识产权保护中,文学作品由于其仅仅为文字构成的特殊性,使其难以加载产权信息,给其知识产权保护带来了一定困难。现有的网络文学作品知识产权保护方法常见的是采用图片发布文学作品,同时在图片中添加各种水印来存储版权信息。然而这种手段的抗攻击性很差,尤其是该方法无法抵抗文字识别等攻击手段,攻击者可以简单的将图片还原为文本,从而剔除图片所保存的一切版权信息,因此并没有有效起到对作品的保护作用。 
发明内容
本发明需要解决的技术问题是提供一种作品版权保护方法,该方法能够将版权信息以同义词替换的方式隐藏在文字作品,很难被发现和破解。 
为解决上述问题,本发明所采取的技术方案是:一种中文作品版权保护方法,该方法包括以下步骤: 
1)构建一个同义词库。 
2)对需要添加的版权信息进行编码。 
3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征词,并将检索到的特征词及其位置记录存档。 
4)将检索到的特征词依次根据版权信息编码对应位数的数字依据某种规则进行替换。例如:对第一个词进行操作时,检查版权信息编码第一个数字,若为0,则不替换,若为1则替换,以此类推。 
5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特征词及其位置,通过对比依据规则还原版权信息编码。在前面的例子中,还原方法为:特征词位置上的词与所存词一样,则该位编码为0,反之为1。 
6)根据还原的编码译码得到版权信息。 
采用上述技术方案所产生的有益效果在于:本发明通过对版权信息进行编码,并将该编码以同义词替换的形式体现在文字作品中,使得非授权者很难发觉并破解版权信息,从而盗版作品中隐藏的版权信息基本无法被抹除,可使版权所有者易于查找盗版方,维护了消费者和版权人的利益。 
附图说明
图1是采用本发明方法储存版权信息“325”后的小说《间客》片段; 
图2是没存储版权信息的小说《间客》片段。 
具体实施方式
下面结合附图对本发明做进一步详细描述: 
本发明是为解决盗版问题提出的解决方法,其包括以下步骤: 
1)构建同义词库。 
2)对需要添加的版权信息进行编码,形成二进制字符串。 
3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征词,并将检索到的特征词及其位置记录存档。 
4)将检索到的词依次根据版权信息编码对应位数的数字进行替换,如对第一个词进行操作时,检查版权信息编码第一个数字,若为0,则不替换,若为1则替换,以此类推。发布时,将发布替换后的作品。 
5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特征词及其位置,通过对比还原版权信息编码,即特征词位置上的词与所存词一样,则该位编码为0,反之为1。 
6)根据还原的编码译码得到版权信息。 
如图2所示的小说《间客》的部分内容,采用本实用新型的方法将版权信息十进制数字“325”体现在作品中,形成图1,以追踪盗版。 
图1所示作品的制作过程如下: 
首先构建同义词库;本例中仅仅构建了一个小的仅有九对同义词的同义词库:重要人物=重要角色;羡慕=艳羡;期间=期中;美貌=貌美;听话=乖巧;清清=清澈;欢乐=快乐;自己的=自己;钓杆=鱼杆。当然,实际使用中可以构建更大的词库。 
其次将版权信息进行编码,形成一组数字字符串,数字字符串长度计为L;本例采用二进制编码方式对十进制版权信息“325”进行了编码,其转换为二进制后的数字字符串为“101000101”,数字字符串长度为9。当然为了使编码不易被破解或伪造,版权信息可以进行加密、签名等多种变换。 
之后在待嵌入版权信息的文章中进行检索,查找同义词库中存在的词汇。特别的,若查到的词汇(下面将称之为特征词汇)数量大于L,则可根据任意一种方法选择L个,比如随机选择。在本例中仅有9个特征词汇,就选取全部词汇作为特征。 
然后根据版权信息编码,以及替换规则对作品中的特征词进行替换。第i个文字使用数字字符串中第i个数字对应的替换规则进行替换,即若该数字为0,则不替换,若为1,则将对应词替换为其同义词,其中,0<i≤L。本例中第1个特征词“重要人物”对应“101000101”的第1个数字“1”,因此替换为“重要角色”。第2个特征词“羡慕”对应“101000101”的第2个数字“0”,因此不进行替换,依次类推,形成图1所示的文章。 
当版权所有者发现了盗版文章时,可以进行如下检测,同样以图1为例。版权所有者拥有文章的原始数据,并拥有特征词汇的位置信息。版权所有者将依次检查特征词汇部分对应词汇是否被替换了,并替换情况依据替换规则进行翻译。在上述替换规则中,若替换过,则该位检测编码为1,反之为0。当检测完所有特征词汇位置后,版权所有者将得到版权信息编码,在本例中,即为编码:“101000101”。 
将该编码依据编码算法进行译码,在本例中为简单的十进制-二进制转换,经过转换后即获得版权信息“325”。 

Claims (3)

1.一种作品版权保护方法,该方法包括以下步骤:
1)构建同义词库;2)对需要添加的版权信息进行编码,形成二进制字符串;3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征词,并将检索到的特征词及其位置记录存档。4)将检索到的词依次根据版权信息编码对应位数的数字依据某种规则进行替换。例如:对第一个词进行操作时,检查版权信息编码第一个数字,若为0,则不替换,若为1则替换,以此类推。5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特征词及其位置,通过对比还原版权信息编码。特征词位置上的词与所存词一样,则该位编码为0,反之为1。6)对还原的编码进行译码,得到版权信息。
2.根据权利要求1所述的作品版权保护方法,其特征在于该方法包括以下步骤:构建同义词库。
3.根据权利要求1所述的作品版权保护方法,其特征在于所述步骤5)、6)构成的版权检测方法:通过查找原始文章中特征词是否被替换,来检测版权信息。
CN2010102327109A 2010-07-21 2010-07-21 作品版权保护法 Pending CN101901325A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102327109A CN101901325A (zh) 2010-07-21 2010-07-21 作品版权保护法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102327109A CN101901325A (zh) 2010-07-21 2010-07-21 作品版权保护法

Publications (1)

Publication Number Publication Date
CN101901325A true CN101901325A (zh) 2010-12-01

Family

ID=43226853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102327109A Pending CN101901325A (zh) 2010-07-21 2010-07-21 作品版权保护法

Country Status (1)

Country Link
CN (1) CN101901325A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509042A (zh) * 2011-10-14 2012-06-20 盛乐信息技术(上海)有限公司 文字作品数字指纹库的比对方法及系统
CN103678957A (zh) * 2012-09-12 2014-03-26 上海聚力传媒技术有限公司 生成图片信息并获取身份编码信息的方法、装置和设备
CN104765858A (zh) * 2015-04-21 2015-07-08 北京航天长峰科技工业集团有限公司上海分公司 公安用同义词库的构建方法及获得的公安用同义词库
CN105183761A (zh) * 2015-07-27 2015-12-23 网易传媒科技(北京)有限公司 敏感词替换方法和装置
WO2021239114A1 (zh) * 2020-05-29 2021-12-02 支付宝(杭州)信息技术有限公司 一种对文本进行同义修改、确定文本创作者的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1641716A (zh) * 2004-01-09 2005-07-20 财团法人资讯工业策进会 数据加密的方法与系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1641716A (zh) * 2004-01-09 2005-07-20 财团法人资讯工业策进会 数据加密的方法与系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《中国优秀硕士学位论文全文数据库信息科技辑》 20081215 甘灿 基于同义词替换的自然语言文本信息隐藏技术研究 1-43 , 第12期 2 *
《计算机应用研究》 20061231 肖海青等 一种有效的脆弱型文本数字水印技术 178-180 , 第7期 2 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509042A (zh) * 2011-10-14 2012-06-20 盛乐信息技术(上海)有限公司 文字作品数字指纹库的比对方法及系统
CN103678957A (zh) * 2012-09-12 2014-03-26 上海聚力传媒技术有限公司 生成图片信息并获取身份编码信息的方法、装置和设备
CN104765858A (zh) * 2015-04-21 2015-07-08 北京航天长峰科技工业集团有限公司上海分公司 公安用同义词库的构建方法及获得的公安用同义词库
CN105183761A (zh) * 2015-07-27 2015-12-23 网易传媒科技(北京)有限公司 敏感词替换方法和装置
CN105183761B (zh) * 2015-07-27 2020-04-07 网易传媒科技(北京)有限公司 敏感词替换方法和装置
WO2021239114A1 (zh) * 2020-05-29 2021-12-02 支付宝(杭州)信息技术有限公司 一种对文本进行同义修改、确定文本创作者的方法

Similar Documents

Publication Publication Date Title
US10482222B2 (en) Methods, apparatus, and articles of manufacture to encode auxiliary data into text data and methods, apparatus, and articles of manufacture to obtain encoded data from text data
Majeed et al. A review on text steganography techniques
Yadav et al. A novel approach of bulk data hiding using text steganography
Roy et al. A novel approach to format based text steganography
CN102184243B (zh) 一种基于文本型属性的关系数据库水印嵌入方法
Hanyurwimfura et al. Text format based relational database watermarking for non-numeric data
CN103761459B (zh) 一种文档多重数字水印嵌入、提取方法及装置
CN101901325A (zh) 作品版权保护法
CN103049682A (zh) 一种基于字符间距编码的双重水印嵌入的文本水印方法
CN110414194B (zh) 一种文本水印的嵌入及提取方法
CN103544408A (zh) 一种基于复合字体的pdf文档隐藏信息嵌入和提取方法
Changder et al. Linguistic approach for text steganography through Indian text
CN104850765A (zh) 一种水印处理方法、装置及系统
CN105512523A (zh) 一种匿名化的数字水印嵌入和提取方法
Thabit et al. CSNTSteg: Color spacing normalization text steganography model to improve capacity and invisibility of hidden data
Mandal et al. A new approach of text Steganography based on mathematical model of number system
Qi et al. A secure text steganography based on synonym substitution
CN102194205A (zh) 一种基于同义词替换的文本可恢复水印方法和装置
CN101593247A (zh) 利用文字形体特征携带水印信息的文本数字水印技术
CN104376236A (zh) 基于伪装学的方案自适应数字水印嵌入方法及提取方法
CN111797369B (zh) 一种关系数据库的数字水印方法
Chaudhary et al. Text steganography based on feature coding method
CN102682248B (zh) 一种中文超短文本的水印嵌入和提取方法
Prasad et al. A new approach to Telugu text steganography
Jaiswal et al. Implementation of a new technique for web document protection using unicode

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101201