CN107330306A - 文本水印嵌入及提取方法、装置、电子设备及存储介质 - Google Patents

文本水印嵌入及提取方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN107330306A
CN107330306A CN201710509646.6A CN201710509646A CN107330306A CN 107330306 A CN107330306 A CN 107330306A CN 201710509646 A CN201710509646 A CN 201710509646A CN 107330306 A CN107330306 A CN 107330306A
Authority
CN
China
Prior art keywords
character
watermark
embedded
text
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710509646.6A
Other languages
English (en)
Other versions
CN107330306B (zh
Inventor
吴少兵
陈春筝
刘德志
李晓东
杨涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710509646.6A priority Critical patent/CN107330306B/zh
Publication of CN107330306A publication Critical patent/CN107330306A/zh
Application granted granted Critical
Publication of CN107330306B publication Critical patent/CN107330306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1063Personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Document Processing Apparatus (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种文本水印嵌入及提取方法、装置、电子设备及存储介质。该文本水印嵌入方法包括:依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。通过上述技术方案,能够在数字文本中嵌入不受文本格式和嵌入水印信息量限制,且隐蔽性和鲁棒性均较高的文本水印,从而更好地保护著作者权益。

Description

文本水印嵌入及提取方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及信息版权保护技术,尤其涉及一种文本水印嵌入及提取方法、装置、电子设备及存储介质。
背景技术
随着互联网产业的爆炸性增长,个人或者企业的论述、小说、论文及电子书籍等被大量抄袭,导致著作者的权利受到侵犯。针对这类问题,目前多是使用数字文本水印技术,在著作权人的作品中隐形标记著作权人的个人信息,以使著作权人能够追溯并行使自己的权利。
现有技术中应用较多的是基于文档结构微调的文本水印技术,即针对PDF、DOC、WPS及HTML等格式化的文档,采用诸如调整行间距、字间距、字体及文字颜色等方式来嵌入水印信息;还有一种是基于文本内容替换的文本水印技术,例如进行同近义词的替换及标点符号的替换等。
但是,上述文本水印的嵌入受限于原始文本,比如文本格式或文本长度;文本水印嵌入后会改变原始文本的排版样式,容易被察觉,隐蔽性较差;并且当文本受到文字删除或篡改等破坏性操作后,难以提取出完整的水印信息,鲁棒性较差。
发明内容
本发明提供一种文本水印嵌入及提取方法、装置、电子设备及存储介质,以实现在数字文本中嵌入不受文本格式和嵌入水印信息量限制,且隐蔽性和鲁棒性均较高的文本水印。
第一方面,本发明实施例提供了一种文本水印嵌入方法,包括:
依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;
依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;
依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
第二方面,本发明实施例还提供了一种文本水印嵌入装置,该装置包括:
嵌入水印字符序列确定模块,用于依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;
嵌入位置确定模块,用于依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;
水印信息嵌入模块,用于依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
第三方面,本发明实施例还提供了一种文本水印提取方法,包括:
依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置;
读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列;
依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
第四方面,本发明实施例还提供了一种文本水印提取装置,包括:
水印提取位置确定模块,用于依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置;
水印字符提取序列获取模块,用于读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列;
水印提取信息确定模块,用于依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
第五方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例中的任一种文本水印嵌入方法。
第六方面,本发明实施例还提供了另一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例中的任一种文本水印提取方法。
第七方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例中的任一种文本水印嵌入方法。
第八方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例中的任一种文本水印提取方法。
本发明实施例通过设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列,能够充分利用不可见字符的特性以实现更具隐蔽性地嵌入水印信息,且能够使得水印信息的嵌入不受限于文本格式。依据文本的单位字符内容、上述嵌入水印字符序列和设定函数,确定该嵌入水印字符序列在文本单位字符内容中的嵌入位置,并依据嵌入水印字符序列及嵌入位置,在文本中嵌入水印信息,能够保证水印信息嵌入的完整性和重复性,使得在文本受到文字删除或篡改等破坏性操作的情况下,仍然能够保证整篇文本中至少一个水印信息的完整性,增强了文本水印的抗攻击性和鲁棒性,从而更好地保护著作者权益。
附图说明
图1是本发明实施例一中的一种文本水印嵌入方法的流程图;
图2是本发明实施例二中的一种文本水印嵌入方法的流程图;
图3是本发明实施例中的水印信息嵌入过程的示例图;
图4是本发明实施例三中的一种文本水印嵌入方法的流程图;
图5是本发明实施例四中的一种文本水印嵌入装置的结构示意图;
图6是本发明实施例五中的一种文本水印提取方法的流程图;
图7是本发明实施例六中的一种文本水印提取装置的结构示意图;
图8是本发明实施例七中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种文本水印嵌入方法的流程图,本实施例可适用于对文本类对象进行数字水印嵌入的情况,该方法可以由文本水印嵌入装置来执行,该装置可以由软件和/或硬件来实现,通常可配置于对文本进行水印嵌入处理的设备中,如服务器或用户终端。该方法具体包括如下步骤:
S110、依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列。
其中,不可见字符指的是零宽度、感知性低的字符,其通常是在文本中不占位、不显示或者说文本使用者无法阅读到的字符,比如,不可见字符可以对应于国际编码表中的某些控制字符或通信字符。示例性地,上述不可见字符是美国信息交换标准代码表(ASCII码表)中十进制分别为30和31的字符,即记录分隔符和单元分隔符,这两个字符只是起到分隔标识作用,并不会对文本原有的样式产生任何影响,从而使得嵌入的水印不受限于文本格式,也能够保证嵌入文本的水印的隐蔽性。
设定的不可见字符的映射规则指的是预先设定的不可见字符与其他字符之间的转换规则,比如,按照预先设定的映射规则,将不可见字符转换为某种需要的信息码,例如可以是将不可见字符转换为对应的二进制码或十进制码,还可以是对应的文字信息等,当然,也可以是将某种需要的信息码转换为不可见字符等。这种映射规则能够将任何长度的原始信息转换为特定长度的字符序列,使得水印嵌入不受限于待嵌入的水印信息量。水印信息是需要嵌入文本或从文本中提取的、能够标识版权的信息,例如可以是诸如著作者姓名、单位或出版社等著作者信息,也可以是文本著作者信息对应的一个著作者标识。
具体地,按照预设的不可见字符的映射规则,将待嵌入文本的水印信息按序映射为对应的可以嵌入文本中的不可见字符,形成相应的不可见字符序列,即嵌入水印字符序列。
S120、依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置。
其中,单位字符内容指的是用于进行水印嵌入的文本中的最小内容划分单元,例如可以是文本的段落或章节等。应当注意的是,文本中的单位字符内容是进行水印嵌入的对象,其划分的合适与否会直接影响水印的抗攻击性和鲁棒性,如果划分的过小,即单位字符内容中包含的文本内容过少,那么会导致嵌入的水印过多,使得嵌入水印后的文本数据量急速增大;如果划分的过大,即单位字符内容中包含的文本内容过多,比如将整篇文本划分为很少的几个单元,那么会导致在文本受到文字删除或篡改等破坏性操作时,难以提取出完整的水印信息,降低水印的抗攻击性和鲁棒性。
设定函数是预先设定的函数式,其用于确定嵌入水印字符序列中每一个字符的嵌入位置。示例性地,该设定函数是自变量和因变量都是正整数的单调递增函数。这样可以保证水印字符嵌入位置的正序排列,而不至于使得嵌入文本的水印字符顺序混乱,导致水印检测或提取过程不能正常提取到水印信息。应当理解的是,函数的因变量跨度应当与单位字符内容相适应,至少应该保证整篇文本中多数单位字符内容中都能够嵌入至少一个完整的水印信息。
具体地,根据S110中确定的嵌入水印字符序列和设定函数,确定出嵌入水印字符序列中每一个字符对应的嵌入位置,然后再结合文本的单位字符内容,最终确定出嵌入水印字符序列嵌入的单位字符内容及其在该单位字符内容中的具体嵌入位置。
S130、依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
具体地,在确定了嵌入水印字符序列及其嵌入位置之后,就可以将嵌入水印字符序列添加到其在文本中的相应嵌入位置,从而完成水印信息在文本中的嵌入。
本发明实施例通过设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列,能够充分利用不可见字符的特性以实现更具隐蔽性地嵌入水印信息,且能够使得水印信息的嵌入不受限于文本格式。依据文本的单位字符内容、上述嵌入水印字符序列和设定函数,确定该嵌入水印字符序列在文本单位字符内容中的嵌入位置,并依据嵌入水印字符序列及嵌入位置,在文本中嵌入水印信息,能够保证水印信息嵌入的完整性和重复性,使得在文本受到文字删除或篡改等破坏性操作的情况下,仍然能够保证整篇文本中至少一个水印信息的完整性,增强了文本水印的抗攻击性和鲁棒性,从而更好地保护著作者权益。
实施例二
图2为本发明实施例二提供的一种文本水印嵌入方法的流程图,本实施例在上述实施例的基础上,对“依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列”进行了进一步优化和说明。其中,与上述实施例相同或相应的术语的解释,在本实施例中不再赘述。
下面结合图2对本发明实施例二提供的文本水印嵌入方法进行说明,本实施例的方法包括:
S210、依据著作者信息及设定映射关系库,确定所述著作者信息对应的著作者标识,作为待嵌入的水印信息。
其中,设定映射关系库指的是预先建立的著作者信息与著作者标识之间的对应关系的数据库。著作者标识可以是数字、字母及其组合的任意一种形式,其可以是一个字符,也可以是一个字符串,此处不进行限定。
具体地,在设定映射关系库中,依据著作者信息进行匹配查找,将查找到的著作者标识确定为待嵌入的水印信息,也就是说,本实施例中的水印信息是一个著作者标识。
S220、确定待嵌入的水印信息的二进制序列。
具体地,可以依据编码规则,比如自定义的编码规则或者国际通用的编码规则,将S210确定的水印信息逐字符转换为对应的二进制,获得待嵌入的水印信息对应的二进制序列。比如,按照ASCII码表,将水印信息中的每个字符转换为对应的八位二进制码,如果不足八位,则用高位补0的方式补齐八位,然后按照水印信息的字符顺序,将获得的二进制码排序,即可获得待嵌入的水印信息对应的二进制序列。
S230、依据所述二进制序列及设定的不可见字符的映射规则,确定所述水印信息对应的嵌入水印字符序列。
具体地,按照设定的不可见字符的映射规则,将S220中确定的二进制序列转换为对应的不可见字符序列,即确定出水印信息对应的嵌入水印字符序列。
示例性地,上述过程具体可以为:依据设定的不可见字符的映射规则,将S220中确定的二进制序列中的每个二进制字符映射为对应的不可见字符;将映射得到的不可见字符,按照二进制序列的字符顺序进行排序,获得水印信息对应的嵌入水印字符序列。
举例而言,如图3所示,根据设定映射关系库确定出水印信息301为十进制数字串“12”,其对应的水印信息字符302分别为“1”和“2”。按照ASCII码表,将上述每个水印信息字符302转换为对应的八位二进制码,获得水印信息对应的二进制序列303为“0000000100000010”。然后,按照设定的不可见字符的映射规则,即二进制数0对应ASCII码表中十进制数为“30”的字符,二进制数1对应ASCII码表中十进制数为“31”的字符,将二进制序列303中的每一个二进制字符映射为对应的不可见字符,并将映射得到的不可见字符,按照二进制序列303的字符顺序进行排序,即可获得水印信息301对应的嵌入水印字符序列304。
S240、依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置。
S250、依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
本实施例的技术方案,通过依据著作者信息及设定映射关系库,将著作者信息对应的著作者标识确定为待嵌入的水印信息,并依据编码规则,确定出上述待嵌入的水印信息的二进制序列,再结合设定的不可见字符的映射规则,确定出水印信息对应的嵌入水印字符序列;依据确定的嵌入水印字符序列、文本的单位字符内容和设定函数,确定嵌入水印字符序列在文本单位字符内容中的嵌入位置,并依据嵌入水印字符序列及嵌入位置,在文本中嵌入水印信息。解决了文本水印嵌入受限于原始文本的问题,达到了不受文本格式和水印信息量限制地进行文本水印嵌入的效果,能够更有效地保护著作者的权益。
实施例三
图4为本发明实施例三提供的一种文本水印嵌入方法的流程图,本实施例在上述实施例的基础上,对“依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置”进行了进一步优化和说明。其中,与上述实施例相同或相应的术语的解释,在本实施例中不再赘述。
下面结合图4对本发明实施例二提供的文本水印嵌入方法进行说明,本实施例的方法包括:
S410、依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列。
S420、依据所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置。
具体地,根据S410确定的嵌入水印字符序列,确定出设定函数的自变量,然后由设定函数确定出嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置,该字符嵌入位置是一个相对位置,而非绝对位置,其相对于水印开始嵌入的文本位置。比如,确定的某个字符嵌入位置为2,那么相对于水印开始嵌入的文本位置而言,将距离上述文本位置2个内容字符的位置确定为该字符的字符嵌入位置。
示例性地,上述过程具体可以为:依据所述嵌入水印字符序列,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符序号;依据所述字符序号和设定函数,确定每一个嵌入水印字符的字符嵌入位置。
再以图3为例进行说明,获得嵌入水印字符序列304之后,确定出该嵌入水印字符序列中每一个嵌入水印字符对应的字符序号305为“1,2,……,16”,然后以该字符序号为设定函数306(比如为y=2x)的自变量,确定出设定函数的因变量为“2,4,……,32”,该因变量即为每一个嵌入水印字符对应的字符嵌入位置307。假设以文本的第一个内容字符为水印开始嵌入的文本位置,那么嵌入水印字符序列304中每一个嵌入水印字符对应的字符嵌入位置就为第2个内容字符、第4个内容字符、……、第30个内容字符及第32个内容字符之后的位置。这样设置的好处在于,能够依据嵌入水印字符序列简单地确定出设定函数的自变量,进而快速确定出字符嵌入位置,提高水印嵌入的处理速度。当然,上述设定函数的自变量也可以不直接对应嵌入水印字符序列的字符序号,而是与字符序号有其他的对应关系。
S430、依据所述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定所述嵌入水印字符序列可嵌入的单位字符内容。
具体地,为了增强文本水印嵌入的抗攻击性和鲁棒性,本实施例对于待嵌入水印文本中符合特定条件的单位字符内容,均要进行至少一个完整的水印信息的嵌入。其中,特定条件就是根据嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数进行确定的。
示例性地,上述过程具体可以为:将所述嵌入水印字符序列中末位字符的字符嵌入位置对应的数值与所述文本中各单位字符内容的字符数进行比较;若所述字符数大于或等于所述数值的正整数倍,则确定当前单位字符内容为可嵌入水印的单位字符内容。
具体地,先确定出文本中每一个单位字符内容的字符数,然后逐个地将上述字符数与S420确定的字符嵌入位置中的最后一个字符嵌入位置对应的数值进行比较。如果当前单位字符内容的字符数大于或等于上述数值的正整数倍,那么就将该单位字符内容确定为一个可嵌入水印的单位字符内容。如此循环比较,直至确定出文本中所有满足上述比较条件的可嵌入水印的单位字符内容。比如,将单位字符内容设定为段落,那么就是要根据最后一个嵌入字符的字符嵌入位置对应的数值,找出文本中所有的段落字符数大于或等于上述数值正整数倍的段落,作为后续进行水印嵌入的对象。
这里设置为正整数倍的比较条件,是为了使得在一个单位字符内容中可以重复嵌入至少一个完整的水印信息,以保证文本水印嵌入的完整性和重复性。
S440、依据所述字符嵌入位置及可嵌入水印的单位字符内容,确定所述嵌入水印字符序列在所述文本的单位字符内容中的嵌入位置。
具体地,根据S430中确定的可嵌入水印的单位字符内容的字符数与字符嵌入位置的正整数倍关系,可以确定出嵌入水印字符序列在每一个可嵌入水印的单位字符内容中的嵌入位置,以便后续可以在每一个可嵌入水印的单位字符内容中嵌入水印信息。
比如,如果可嵌入水印的单位字符内容的字符数是字符嵌入位置的1倍,且不足2倍,那么就以该单位字符内容的文本起始位置为水印开始嵌入的文本位置,以字符嵌入位置为嵌入水印字符序列在所述文本的单位字符内容中的嵌入位置;如果可嵌入水印的单位字符内容的字符数是字符嵌入位置的2倍及以上倍数,那么就在该单位字符内容中重复嵌入上述倍数个完整的水印字符序列,其第一个完整水印字符序列的嵌入位置是以的文本起始位置为水印开始嵌入的文本位置,后续每一个完整水印字符序列的嵌入位置均以前一个完整水印字符序列中的最后一个字符嵌入位置为起始计算参照点。同样以图3中的水印信息为例,第1个完整水印字符序列的嵌入位置是第2个内容字符、第4个内容字符、……、第30个内容字符及第32个内容字符之后的位置,那么第2个完整水印字符序列的嵌入位置就是第(32+2)个内容字符、第(32+4)个内容字符、……、第(32+30)个内容字符及第(32+32)个内容字符之后的位置。以此类推,就可以确定出每一个可嵌入水印的单位字符内容中嵌入水印字符序列的嵌入位置。
S450、依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
本实施例的技术方案,通过设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;依据该嵌入水印字符序列和设定函数,确定嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置;依据上述字符嵌入位置中末位字符的字符嵌入位置及文本中各单位字符内容的字符数,确定出嵌入水印字符序列可嵌入的单位字符内容,再次结合字符嵌入位置确定嵌入水印字符序列在文本的单位字符内容中的嵌入位置,并依据嵌入水印字符序列及嵌入位置,在文本中嵌入所述水印信息。解决了文本水印嵌入隐蔽性及鲁棒性差的问题,达到了在文本中分块且重复性地插入完整的水印信息,使得文本在受到文字删除或篡改等破坏性操作的情况下,仍然能够保证整篇文本中至少一个水印信息的完整性,增强文本水印的抗攻击性和鲁棒性,从而更好地保护了著作者权益的效果。
以下是本发明实施例提供的文本水印嵌入装置的实施例,该装置与上述各实施例的文本水印嵌入方法属于同一个发明构思,在文本水印嵌入装置的实施例中未详尽描述的细节内容,可以参考上述文本水印嵌入方法的实施例。
实施例四
图5为本实施例四提供的一种文本水印嵌入装置的结构示意图,该装置具体包括:
嵌入水印字符序列确定模块520,用于依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列。
嵌入位置确定模块530,用于依据所述文本的单位字符内容、嵌入水印字符序列确定模块520确定的嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;
水印信息嵌入模块540,用于依据嵌入水印字符序列确定模块520确定的嵌入水印字符序列及嵌入位置确定模块530确定的嵌入位置,在所述文本中嵌入所述水印信息。
可选地,嵌入水印字符序列确定模块520包括:
二进制序列确定子模块521,用于确定待嵌入的水印信息的二进制序列;
嵌入水印字符序列确定子模块522,用于依据二进制序列确定子模块521确定的二进制序列及设定的不可见字符的映射规则,确定所述水印信息对应的嵌入水印字符序列。
其中,嵌入水印字符序列确定子模块522具体用于:
依据设定的不可见字符的映射规则,将二进制序列确定子模块521确定的二进制序列中的每个二进制字符映射为对应的不可见字符;
将映射得到的不可见字符,按照上述二进制序列的字符顺序进行排序,获得所述水印信息对应的嵌入水印字符序列。
可选地,在上述装置的基础上,该装置还包括:
水印信息确定模块510,用于在所述依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列之前,依据著作者信息及设定映射关系库,确定所述著作者信息对应的著作者标识,作为待嵌入的水印信息。
可选地,嵌入位置确定模块530包括:
字符嵌入位置确定子模块531,用于依据嵌入位置确定模块530确定的嵌入水印字符序列和设定函数,确定该嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置;
单位字符内容确定子模块532,用于依据上述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定该嵌入水印字符序列可嵌入的单位字符内容;
嵌入位置确定子模块533,用于依据字符嵌入位置确定子模块531确定的字符嵌入位置及单位字符内容确定子模块532确定的可嵌入水印的单位字符内容,确定嵌入水印字符序列在所述文本的单位字符内容中的嵌入位置。
其中,字符嵌入位置确定子模块531具体用于:
依据所述嵌入水印字符序列,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符序号;
依据所述字符序号和设定函数,确定每一个嵌入水印字符的字符嵌入位置。
其中,单位字符内容确定子模块532具体用于:
将所述嵌入水印字符序列中末位字符的字符嵌入位置对应的数值与所述文本中各单位字符内容的字符数进行比较;
若所述字符数大于或等于所述数值的正整数倍,则确定当前单位字符内容为可嵌入水印的单位字符内容。
可选地,在上述装置中,所述设定函数是自变量和因变量都是正整数的单调递增函数;所述不可见字符是美国信息交换标准代码中十进制为30和31的字符。
通过本发明实施例四的一种文本水印嵌入装置,解决了文本水印嵌入受限于文本格式和水印信息量,且其隐蔽性和鲁棒性均较差的问题,能够在文本中嵌入不受文本格式和嵌入的水印信息量限制,且隐蔽性和鲁棒性均较高的文本水印。
本发明实施例所提供的文本水印嵌入装置可执行本发明任意实施例所提供的文本水印嵌入方法,具备执行方法相应的功能模块和有益效果。
实施例五
图6为本发明实施例五提供的一种文本水印提取方法的流程图,本实施例可适用于在已经按照上述实施例的方法嵌入水印的文本类对象中进行数字水印提取的情况,该方法可以由文本水印提取装置来执行,该装置可以由部署在上述文本水印提取装置中的软件和/或硬件来实施。
参见图6,该方法具体包括如下步骤:
S610、依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置。
具体地,在已经嵌入水印的文本中进行水印提取的过程,与上述任一实施例的水印嵌入过程互逆。也就是说,进行水印提取时,已知嵌入水印的文本、文本中水印嵌入位置的确定规则、嵌入的水印信息及其对应的嵌入水印字符序列,那么可以按照上述信息进行水印的提取。
示例性地,上述过程可以为:依据嵌入的水印信息对应的嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置;依据所述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定所述文本中已嵌入水印的单位字符内容;依据所述字符嵌入位置及已嵌入水印的单位字符内容,确定所述嵌入水印字符序列在所述文本的单位字符内容中的水印提取位置。
具体地,该过程就是根据嵌入水印字符序列、设定函数和文本中各单位字符内容的字符数,确定出文本中已经嵌入水印的单位字符内容以及该单位字符内容中嵌入水印字符序列具体的嵌入位置,即水印提取位置。其具体解释可以参照实施例三。
S620、读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列。
具体地,在每一个已经嵌入水印的单位字符内容中,按照水印提取位置,逐个、按序读取相应位置处的字符,构成该单位字符内容中的嵌入水印字符提取序列。
S630、依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
具体地,根据设定的不可见字符的映射规则,将S620中获得的嵌入水印字符提取序列映射为水印提取信息,该水印提取信息即为从文本中提取出的、需要检验的水印信息。
示例性地,上述过程可以为:依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取二进制序列;确定所述水印提取二进制序列对应的水印提取信息。
具体地,上述获得的嵌入水印字符提取序列应该是由不可见字符构成的序列,为了便于进行水印信息的检验,需要将其转换为对应的人可识别的信息。那么按照与水印嵌入过程中相应的设定的不可见字符的映射规则,比如ASCII码表中十进制数为“30”的不可见字符对应二进制数0,ASCII码表中十进制数为“31”的不可见字符对应二进制数1,将嵌入水印字符提取序列转换为相应的二进制序列,再按照与水印嵌入过程中相应的编码规则,将上述二进制序列转换为对应的水印提取信息。
如果文本中的水印没有被破坏,那么该水印提取信息应当是著作者标识或著作者信息。对于著作者标识的水印提取信息,可以在确定了水印提取二进制序列对应的水印提取信息之后,再依据著作者信息及设定映射关系库,确定该水印提取信息对应的著作者信息。
本发明实施例通过已嵌入水印的文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定出该文本的单位字符内容中的水印提取位置,按照该水印提取位置进行嵌入水印字符的提取,获得水印字符提取序列,并按照设定的不可见字符的映射规则,获得水印字符提取序列对应的水印提取信息,能够在文本的每一个已嵌入水印的单位字符内容中进行水印信息的提取,使得在文本受到文字删除或篡改等破坏性操作的情况下,仍然可以提取出至少一个完整的水印信息,增强了文本水印的抗攻击性和鲁棒性,能够更好地保护著作者权益。
以下是本发明实施例提供的文本水印提取装置的实施例,该装置与上述各实施例的文本水印提取方法属于同一个发明构思,在文本水印提取装置的实施例中未详尽描述的细节内容,可以参考上述文本水印提取方法的实施例。
实施例六
图7为本实施例六提供的一种文本水印提取装置的结构示意图,该装置具体包括:
水印提取位置确定模块710,用于依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置。
水印字符提取序列获取模块720,用于读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列。
水印提取信息确定模块730,用于依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
可选地,水印提取位置确定模块710具体用于:
依据嵌入的水印信息对应的嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置;
依据所述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定所述文本中已嵌入水印的单位字符内容;
依据所述字符嵌入位置及已嵌入水印的单位字符内容,确定所述嵌入水印字符序列在所述文本的单位字符内容中的水印提取位置。
可选地,水印提取信息确定模块730具体用于:
依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取二进制序列;
确定所述水印提取二进制序列对应的水印提取信息。
可选地,在上述装置的基础上,该装置还包括:
著作者信息确定模块740,用于在所述确定所述水印提取二进制序列对应的水印提取信息之后,依据著作者信息及设定映射关系库,确定所述水印提取信息对应的著作者信息。
通过本发明实施例六的一种文本水印提取装置,解决了文本水印提取受限于文本格式和水印信息量,且其隐蔽性和鲁棒性均较差的问题,能够在文本中提取不受文本格式和提取的水印信息量限制,且隐蔽性和鲁棒性均较高的文本水印。
本发明实施例所提供的文本水印提取装置可执行本发明任意实施例所提供的文本水印提取方法,具备执行方法相应的功能模块和有益效果。
实施例七
图8为本发明实施例七提供的一种电子设备的结构示意图。本发明实施例提供了一种电子设备800,其包括:一个或多个处理器820;存储装置810,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器820执行,使得所述一个或多个处理器820实现本发明实施例所提供的文本水印嵌入方法,包括:
依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;
依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;
依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
当然,本领域技术人员可以理解,处理器820还可以实现本发明任意实施例所提供的文本水印嵌入方法的技术方案。
图8示出了适于用来实现本发明实施方式的示例性电子设备800的框图。图8显示的电子设备800仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:一个或者多个处理器820,存储装置810,连接不同系统组件(包括存储装置810和处理器820)的总线850。
总线850表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备800典型地包括多种计算机可读存储介质。这些介质可以是任何能够被电子设备800访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置810可以包括易失性存储器形式的计算机可读存储介质,例如随机存取存储器(RAM)811和/或高速缓存存储器812。电子设备800可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机可读存储介质。仅作为举例,存储系统813可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线850相连。存储装置810可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块815的程序/实用工具814,可以存储在例如存储装置810中,这样的程序模块815包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块815通常执行本发明所描述的实施例中的功能和/或方法。
电子设备800也可以与一个或多个外部设备860(例如键盘、指向设备、显示器870等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口830进行。并且,电子设备800还可以通过网络适配器840与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器840通过总线850与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器820通过运行存储在存储装置810中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的文本水印嵌入方法的任意实施例的技术方案。
本发明实施例还提供了另一电子设备,其包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所提供的文本水印提取方法,包括:
依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置;
读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列;
依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的文本水印提取方法的技术方案。该电子设备的硬件结构以及功能可参见实施例七的内容解释。
实施例八
本发明实施例八还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所提供的文本水印嵌入方法,包括:
依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;
依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;
依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
当然,本领域技术人员可以理解,该程序被处理器执行时还可以实现本发明任意实施例所提供的文本水印嵌入方法的技术方案。
本发明实施例计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明实施例还提供了另一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所提供的文本水印提取方法,包括:
依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置;
读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列;
依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
当然,本领域技术人员可以理解,该程序被处理器执行时还可以实现本发明任意实施例所提供的文本水印提取方法的技术方案。对存储介质的介绍可参见实施例八中的内容解释。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (20)

1.一种文本水印嵌入方法,其特征在于,包括:
依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;
依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;
依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
2.根据权利要求1所述的方法,其特征在于,所述依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列包括:
确定待嵌入的水印信息的二进制序列;
依据所述二进制序列及设定的不可见字符的映射规则,确定所述水印信息对应的嵌入水印字符序列。
3.根据权利要求2所述的方法,其特征在于,所述依据所述二进制序列和设定的不可见字符的映射规则,确定所述水印信息对应的嵌入水印字符序列包括:
依据设定的不可见字符的映射规则,将所述二进制序列中的每个二进制字符映射为对应的不可见字符;
将映射得到的不可见字符,按照所述二进制序列的字符顺序进行排序,获得所述水印信息对应的嵌入水印字符序列。
4.根据权利要求1所述的方法,其特征在于,在所述依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列之前,还包括:
依据著作者信息及设定映射关系库,确定所述著作者信息对应的著作者标识,作为待嵌入的水印信息。
5.根据权利要求1所述的方法,其特征在于,所述依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置包括:
依据所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置;
依据所述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定所述嵌入水印字符序列可嵌入的单位字符内容;
依据所述字符嵌入位置及可嵌入水印的单位字符内容,确定所述嵌入水印字符序列在所述文本的单位字符内容中的嵌入位置。
6.根据权利要求5所述的方法,其特征在于,所述依据所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置包括:
依据所述嵌入水印字符序列,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符序号;
依据所述字符序号和设定函数,确定每一个嵌入水印字符的字符嵌入位置。
7.根据权利要求5所述的方法,其特征在于,所述依据所述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定所述嵌入水印字符序列可嵌入的单位字符内容包括:
将所述嵌入水印字符序列中末位字符的字符嵌入位置对应的数值与所述文本中各单位字符内容的字符数进行比较;
若所述字符数大于或等于所述数值的正整数倍,则确定当前单位字符内容为可嵌入水印的单位字符内容。
8.根据权利要求1所述的方法,其特征在于,
所述设定函数是自变量和因变量都是正整数的单调递增函数;
所述不可见字符是美国信息交换标准代码中十进制为30和31的字符。
9.一种文本水印嵌入装置,其特征在于,包括:
嵌入水印字符序列确定模块,用于依据设定的不可见字符的映射规则,确定待嵌入的水印信息对应的嵌入水印字符序列;
嵌入位置确定模块,用于依据所述文本的单位字符内容、所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列在所述文本单位字符内容中的嵌入位置;
水印信息嵌入模块,用于依据所述嵌入水印字符序列及所述嵌入位置,在所述文本中嵌入所述水印信息。
10.根据权利要求9所述的装置,其特征在于,所述嵌入水印字符序列确定模块包括:
二进制序列确定子模块,用于确定待嵌入的水印信息的二进制序列;
嵌入水印字符序列确定子模块,用于依据所述二进制序列及设定的不可见字符的映射规则,确定所述水印信息对应的嵌入水印字符序列。
11.根据权利要求9所述的装置,其特征在于,所述嵌入位置确定模块包括:
字符嵌入位置确定子模块,用于依据所述嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置;
单位字符内容确定子模块,用于依据所述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定所述嵌入水印字符序列可嵌入的单位字符内容;
嵌入位置确定子模块,用于依据所述字符嵌入位置及可嵌入水印的单位字符内容,确定所述嵌入水印字符序列在所述文本的单位字符内容中的嵌入位置。
12.一种文本水印提取方法,其特征在于,包括:
依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置;
读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列;
依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
13.根据权利要求12所述的方法,其特征在于,所述依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置包括:
依据嵌入的水印信息对应的嵌入水印字符序列和设定函数,确定所述嵌入水印字符序列中每一个嵌入水印字符的字符嵌入位置;
依据所述嵌入水印字符序列中末位字符的字符嵌入位置及所述文本中各单位字符内容的字符数,确定所述文本中已嵌入水印的单位字符内容;
依据所述字符嵌入位置及已嵌入水印的单位字符内容,确定所述嵌入水印字符序列在所述文本的单位字符内容中的水印提取位置。
14.根据权利要求12所述的方法,其特征在于,所述依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息包括:
依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取二进制序列;
确定所述水印提取二进制序列对应的水印提取信息。
15.根据权利要求12所述的方法,其特征在于,在所述确定所述水印提取二进制序列对应的水印提取信息之后,还包括:
依据著作者信息及设定映射关系库,确定所述水印提取信息对应的著作者信息。
16.一种文本水印提取装置,其特征在于,包括:
水印提取位置确定模块,用于依据所述文本中各单位字符内容、设定函数及嵌入的水印信息对应的嵌入水印字符序列,确定所述水印信息在所述文本的单位字符内容中的水印提取位置;
水印字符提取序列获取模块,用于读取所述水印提取位置对应的字符,获得嵌入水印字符提取序列;
水印提取信息确定模块,用于依据设定的不可见字符的映射规则,确定所述嵌入水印字符提取序列对应的水印提取信息。
17.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的文本水印嵌入方法。
18.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求12-15中任一所述的文本水印提取方法。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的文本水印嵌入方法。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求12-15中任一所述的文本水印提取方法。
CN201710509646.6A 2017-06-28 2017-06-28 文本水印嵌入及提取方法、装置、电子设备及存储介质 Active CN107330306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710509646.6A CN107330306B (zh) 2017-06-28 2017-06-28 文本水印嵌入及提取方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710509646.6A CN107330306B (zh) 2017-06-28 2017-06-28 文本水印嵌入及提取方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN107330306A true CN107330306A (zh) 2017-11-07
CN107330306B CN107330306B (zh) 2020-07-28

Family

ID=60198971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710509646.6A Active CN107330306B (zh) 2017-06-28 2017-06-28 文本水印嵌入及提取方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN107330306B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522684A (zh) * 2018-11-27 2019-03-26 中国联合网络通信集团有限公司 数据处理方法、设备及存储介质
CN109740316A (zh) * 2018-12-27 2019-05-10 北京三未信安科技发展有限公司 一种动态水印嵌入、验证方法及系统和动态水印处理系统
CN109784006A (zh) * 2019-01-04 2019-05-21 平安科技(深圳)有限公司 水印嵌入和提取方法及终端设备
CN110968847A (zh) * 2019-11-27 2020-04-07 北京北信源软件股份有限公司 一种文件水印隐藏、解析方法、装置、设备及存储介质
CN111191414A (zh) * 2019-11-11 2020-05-22 苏州亿歌网络科技有限公司 一种页面水印生成方法、识别方法、装置、设备及存储介质
US11037469B2 (en) 2019-05-20 2021-06-15 Advanced New Technologies Co., Ltd. Copyright protection based on hidden copyright information
US11042612B2 (en) 2019-05-20 2021-06-22 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
US11080671B2 (en) 2019-05-20 2021-08-03 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
CN113505348A (zh) * 2021-07-22 2021-10-15 绿盟科技集团股份有限公司 一种数据的水印嵌入方法、验证方法及装置
CN113688601A (zh) * 2021-10-26 2021-11-23 北京凯睿数加科技有限公司 基于表单的水印生成方法、装置、电子设备和计算机介质
US11227351B2 (en) 2019-05-20 2022-01-18 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
WO2022123093A1 (es) * 2020-12-09 2022-06-16 Telefonica Cibersecurity Tech, S.L.U. Método y sistema para la codificación y decodificación de información en textos

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1700205A (zh) * 2005-06-24 2005-11-23 清华大学 一种在英文文本中嵌入和提取水印的方法
CN104050400A (zh) * 2014-06-27 2014-09-17 西南交通大学 一种基于控制符编码隐写的网页链接保护方法
US20150269362A1 (en) * 2003-10-08 2015-09-24 Verance Corporation Signal continuity assessment using embedded watermarks
CN105205355A (zh) * 2015-11-05 2015-12-30 南通大学 一种基于语义角色位置映射的文本水印嵌入及提取方法
CN106570356A (zh) * 2016-11-01 2017-04-19 南京理工大学 基于Unicode编码的文本水印嵌入及提取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150269362A1 (en) * 2003-10-08 2015-09-24 Verance Corporation Signal continuity assessment using embedded watermarks
CN1700205A (zh) * 2005-06-24 2005-11-23 清华大学 一种在英文文本中嵌入和提取水印的方法
CN104050400A (zh) * 2014-06-27 2014-09-17 西南交通大学 一种基于控制符编码隐写的网页链接保护方法
CN105205355A (zh) * 2015-11-05 2015-12-30 南通大学 一种基于语义角色位置映射的文本水印嵌入及提取方法
CN106570356A (zh) * 2016-11-01 2017-04-19 南京理工大学 基于Unicode编码的文本水印嵌入及提取方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522684A (zh) * 2018-11-27 2019-03-26 中国联合网络通信集团有限公司 数据处理方法、设备及存储介质
CN109522684B (zh) * 2018-11-27 2020-07-28 中国联合网络通信集团有限公司 数据处理方法、设备及存储介质
CN109740316A (zh) * 2018-12-27 2019-05-10 北京三未信安科技发展有限公司 一种动态水印嵌入、验证方法及系统和动态水印处理系统
CN109784006A (zh) * 2019-01-04 2019-05-21 平安科技(深圳)有限公司 水印嵌入和提取方法及终端设备
US11227351B2 (en) 2019-05-20 2022-01-18 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
US11409850B2 (en) 2019-05-20 2022-08-09 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
US11037469B2 (en) 2019-05-20 2021-06-15 Advanced New Technologies Co., Ltd. Copyright protection based on hidden copyright information
US11042612B2 (en) 2019-05-20 2021-06-22 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
US11056023B2 (en) 2019-05-20 2021-07-06 Advanced New Technologies Co., Ltd. Copyright protection based on hidden copyright information
US11062000B2 (en) 2019-05-20 2021-07-13 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
US11080671B2 (en) 2019-05-20 2021-08-03 Advanced New Technologies Co., Ltd. Identifying copyrighted material using embedded copyright information
CN111191414A (zh) * 2019-11-11 2020-05-22 苏州亿歌网络科技有限公司 一种页面水印生成方法、识别方法、装置、设备及存储介质
CN110968847A (zh) * 2019-11-27 2020-04-07 北京北信源软件股份有限公司 一种文件水印隐藏、解析方法、装置、设备及存储介质
WO2022123093A1 (es) * 2020-12-09 2022-06-16 Telefonica Cibersecurity Tech, S.L.U. Método y sistema para la codificación y decodificación de información en textos
CN113505348A (zh) * 2021-07-22 2021-10-15 绿盟科技集团股份有限公司 一种数据的水印嵌入方法、验证方法及装置
CN113688601A (zh) * 2021-10-26 2021-11-23 北京凯睿数加科技有限公司 基于表单的水印生成方法、装置、电子设备和计算机介质

Also Published As

Publication number Publication date
CN107330306B (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN107330306A (zh) 文本水印嵌入及提取方法、装置、电子设备及存储介质
CN110532381B (zh) 一种文本向量获取方法、装置、计算机设备及存储介质
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
CN105739981B (zh) 一种代码补全实现方法、装置和计算设备
CN107656922A (zh) 一种翻译方法、装置、终端及存储介质
CN103678269A (zh) 一种信息处理方法和装置
CN107111618B (zh) 将图像的缩略图链接到网页
CN109948518B (zh) 一种基于神经网络的pdf文档内容文本段落聚合的方法
CN110704608A (zh) 文本主题生成方法、装置和计算机设备
CN105320641B (zh) 一种文本校验方法及用户终端
WO2024066271A1 (zh) 数据库水印的嵌入方法、溯源方法、装置和电子设备
CN104750665A (zh) 文本信息的处理方法和装置
CN115455922B (zh) 表单校验方法、装置、电子设备和存储介质
CN111355709A (zh) 数据验证方法、装置、电子设备及计算机可读存储介质
CN113536782B (zh) 敏感词识别方法、装置、电子设备及存储介质
CN102253983A (zh) 一种汉语高危词识别方法和系统
CN114781359A (zh) 文本纠错方法、装置、计算机设备及存储介质
CN114707048A (zh) 敏感信息检测方法、装置、电子设备及计算机可读存储介质
KR20220068462A (ko) 지식 그래프 생성 방법 및 장치
CN105320716A (zh) 数字出版物的自动标注方法
CN111859901A (zh) 一种英文重复文本检测方法、系统、终端及存储介质
CN117078942B (zh) 上下文感知的指称图像分割方法、系统、设备及存储介质
CN111104484B (zh) 文本相似度检测方法、装置及电子设备
CN113591440B (zh) 一种文本处理方法、装置及电子设备
Tiwari et al. A novel steganographic methodology for high capacity data hiding in executable files

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant