CN114547562A - 文本水印添加及应用的方法和装置 - Google Patents

文本水印添加及应用的方法和装置 Download PDF

Info

Publication number
CN114547562A
CN114547562A CN202210106921.0A CN202210106921A CN114547562A CN 114547562 A CN114547562 A CN 114547562A CN 202210106921 A CN202210106921 A CN 202210106921A CN 114547562 A CN114547562 A CN 114547562A
Authority
CN
China
Prior art keywords
text
watermark
character
watermarking
fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210106921.0A
Other languages
English (en)
Inventor
蒋欧阳
陈美�
马钰璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Best Tone Information Service Corp Ltd
Original Assignee
Best Tone Information Service Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Best Tone Information Service Corp Ltd filed Critical Best Tone Information Service Corp Ltd
Priority to CN202210106921.0A priority Critical patent/CN114547562A/zh
Publication of CN114547562A publication Critical patent/CN114547562A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明涉及一种文本水印添加及应用的方法和装置,文本水印添加的方法,包括如下步骤:S1、预设配置规则,配置规则包括水印字符选取规则和添加水印位置的规则;S2、准备文本,接收待添加水印的原文本,进行预处理,得到和输出中间文本;S3、计算文本指纹,对中间文本采用文本指纹算法计算文本指纹,得到和输出文本指纹字符串;S4、计算文本水印选取偏移量,按照水印字符选取规则,在中间文本中选取参考字,所处参考字用于给水印字符确认做参考,输出水印字;S5、添加文本水印,按照添加水印位置的规则,将水印字添加到文本中,输出添加水印后的文本。依据本发明的方法进行文本水印添加,易于实施、易于取证,且不易被潜在侵权者发现和清除。

Description

文本水印添加及应用的方法和装置
技术领域
本发明涉及IT与软件开发领域,具体而言,涉及一种实现文本水印添加及应用的方法和装置。
背景技术
目前,对于信息文本水印添加的算法和方法已经存在。
相关现有技术:一种文本水印的嵌入及提取方法,公开号:CN110414194A,实现了一种添加不可见UTF字符的文本水印方法,存在的问题为:易于被潜在侵权者发现和剔除;一种数字文本水印嵌入及检测方法和装置,公开号:CN 110322386A,利用混沌算法,在特定文本环境下,对特定文本设定颜色差异,存在的问题为:过于复杂难以实施,并且使用条件有限,也容易被潜在侵权者发现和清除。
因此,亟需一种开发易于实施、易于取证,并不易被潜在侵权者发现和清除的对普通文本进行水印的方法。
发明内容
本发明要解决的技术问题是如何实现一种易于实施、易于取证,且不易被潜在侵权者发现和清除的普通文本水印的方法。
为解决上述技术问题,根据本发明的第一个方面,提供一种文本水印添加的方法,包括如下步骤:S1、预设配置规则,配置规则包括水印字符选取规则和添加水印位置的规则;S2、准备文本,接收待添加水印的原文本,进行预处理,得到和输出中间文本;S3、计算文本指纹,对中间文本采用文本指纹算法计算文本指纹,得到和输出文本指纹字符串;S4、计算文本水印选取偏移量,按照水印字符选取规则,在中间文本中选取参考字,所处参考字用于给水印字符确认做参考,输出水印字;S5、添加文本水印,按照添加水印位置的规则,将水印字添加到文本中,输出添加水印后的文本。
根据本发明的实施例,水印字符选取规则可包括:S41、将步骤S3中计算出的文本指纹字符串截取一段;S42、将该段字符串转化为十进制数;S43、将十进制数以中间文本长度为模取余数,得到参考字选取偏移量,确定偏移量位置对应的字符为水印字符参考字,偏移量计算式为:
S=X mod L
其中,S表示参考字选取偏移量,X指该段字符串所转化的十进制数,L为中间文本的长度,mod表示取余数。
根据本发明的实施例,上述步骤S41中文本指纹字符串截取一段的方式包括截取文本中的某N个字符,其中,N为自然数。
根据本发明的实施例,水印字符选取规则还可包括:S44、通过采用同音字字典,由参考字得到参考字的同音字,选取任意同音字为水印字;或者,S44为选取参考字作为水印字。用户可以自行选择所需的水印字选取规则,具体不受此限。
根据本发明的实施例,添加水印位置的规则可包括:S51、确定水印添加偏移量A,A取值在1到中间文本长度L之间。
根据本发明的实施例,上述S2步骤中预处理可包括:剔除源文本中所有的标点符号、空格、控制符、不可见UTF字符。
根据本发明的实施例,上述S3步骤中文本指纹算法包括:MD5、SHA-1、SHA-128、SHA-256的任一种算法。
根据本发明的第二个方面,提供一种文本水印应用的方法,包括如下步骤:文本内容输出方公示文本水印添加规则,规则包括水印算法和配置参数;当公开可访问文本内容涉及原创归属争议时,文本内容输出方按公证过的水印算法和配置参数对原文本计算,生成输出添加水印文本;将输出的添加水印文本与争议文本进行比对,从而解决争议。
根据本发明的第三个方面,提供一种文本水印添加的装置,包括:配置规则单元,用于预设配置规则,配置规则包括水印字符选取规则和添加水印位置的规则;文本预处理单元,用于准备文本,接收待添加水印的原文本,进行预处理,得到和输出中间文本;计算文本指纹单元,用于计算文本指纹,对中间文本采用文本指纹算法计算文本指纹,得到和输出文本指纹字符串;选取偏移量单元,用于计算文本水印选取偏移量,按照水印字符选取规则,在中间文本中选取参考字,所处参考字用于给水印字符确认做参考,输出水印字;添加文本水印单元,用于添加文本水印,按照添加水印位置的规则,将水印字添加到文本中,输出添加水印后的文本。
根据本发明的实施例,水印字符选取规则可包括:将计算文本指纹单元输出的文本指纹字符串截取一段,将该段字符串转化为十进制数,再将十进制数以中间文本长度为模取余数,得到参考字选取偏移量,确定偏移量位置对应的字符为水印字符参考字,偏移量计算式为:
S=X mod L
其中,S表示参考字选取偏移量,X指该段字符串所转化的十进制数,L为中间文本的长度。
根据本发明的实施例,将文本指纹字符串截取一段的方式可包括截取文本中的某N个字符,其中,N为自然数。
根据本发明的实施例,水印字符选取规则还可包括:通过采用同音字字典,由参考字得到参考字的同音字,选取任意同音字为水印字;或者,选取参考字作为水印字。用户可以自行选择所需的水印字选取规则,具体不受此限。
根据本发明的实施例,添加水印位置的规则可包括:确定水印添加偏移量A,A取值在1到中间文本长度L之间。
根据本发明的实施例,文本预处理单元的功能可包括:剔除源文本中所有的标点符号、空格、控制符、不可见UTF字符。
根据本发明的实施例,计算文本指纹单元所采用的文本指纹算法可包括:MD5、SHA-1、SHA-128、SHA-256的任一种算法。
根据本发明的第四个方面,提供一种文本水印应用的装置,包括:公示单元,文本内容输出方用于公示文本水印添加规则,规则包括水印算法和配置参数;生成单元,用于生成输出添加水印文本,当公开可访问文本内容涉及原创归属争议时,文本内容输出方按公证过的水印算法和配置参数对原文本计算,生成输出添加水印文本;比对单元,用于将输出的添加水印文本与争议文本进行比对,从而解决争议。
根据本发明的第五个方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述的文本水印添加方法。
根据本发明的第六个方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述的文本水印应用方法。
根据本发明的第七个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的文本水印添加方法。
根据本发明的第八个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的文本水印应用方法。
与现有技术相比,本发明的实施例所提供的技术方案至少可实现如下有益效果:
1.本技术专利相比其它文本水印技术,不依靠特殊字符如不可见UTF(UnicodeTransformation Format,通用转换格式)字符等,因这些特殊字符可以被侵权方采用规则自动批量去除,即使侵权情况下也不能锁定证据;只有采用本发明的方案,基于内容类似的普通文本,而且在水印点的内容上又有特别之处,可依靠事前公正过的算法和配置参数进行恢复和重现。本发明实现的技术方案,在可实施性和不易规避性上优于其它技术方案。
2.在应用时,己方(内容输出方)将上述普通文本水印添加方法及管理配置事前公证,在公开可访问文本内容涉及原创归属争议时,己方按公证过的水印算法和配置参数对原文本生成输出文本,与争议文本进行比对,从而解决争议。
3.采用本方案,可用于验证输出文本内容的原创归属,可以以API(ApplicationProgramming Interface,应用程序接口)的方式输出,通过API可将过程中对于合作方内容的留存、再输出等进行验证。
4.本发明提供一种使得文本内容的侵权行为可以得到快速识别和验证的方法,在社交平台如微信公众号文章的原创归属认定,在涉及API输出的场合,确保合作方或能力调用者对于己方的输出内容存在留存内容,以及确保再输出给第三方时符合己方要求,可以提供较强说服力的证据。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本发明的一些实施例,而非对本发明的限制。
图1是依据本发明实施例的文本水印添加方法的流程图。
图2是依据本发明实施例的文本水印添加装置的示意图。
图3是依据本发明实施例的文本水印添加举例的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。
图1是依据本发明实施例的文本水印添加方法的流程图。
如图1所示,根据本发明的第一个方面,提供一种文本水印添加的方法,包括如下步骤:S1、预设配置规则,配置规则包括水印字符选取规则和添加水印位置的规则;S2、准备文本,接收待添加水印的原文本,进行预处理,得到和输出中间文本;S3、计算文本指纹,对中间文本采用文本指纹算法计算文本指纹,得到和输出文本指纹字符串;S4、计算文本水印选取偏移量,按照水印字符选取规则,在中间文本中选取参考字,所处参考字用于给水印字符确认做参考,输出水印字;S5、添加文本水印,按照添加水印位置的规则,将水印字添加到文本中,输出添加水印后的文本。这种文本水印添加的方法易于实施、易于取证,且不易被潜在侵权者发现和清除。
根据本发明的一个或一些实施例,水印字符选取规则包括:S41、将步骤S3中计算出的文本指纹字符串截取一段;S42、将该段字符串转化为十进制数;S43、将十进制数以中间文本长度为模取余数,得到参考字选取偏移量,确定偏移量位置对应的字符为水印字符参考字,偏移量计算式为:
S=X mod L
其中,S表示参考字选取偏移量,X指该段字符串所转化的十进制数,L为中间文本的长度,mod表示取余数。从而由取余得到的偏移量,确定对应的相对参考字,用相对参考字作为水印字符生成的输入字。
根据本发明的一个或一些实施例,上述步骤S41中文本指纹字符串截取一段的方式包括截取文本中的某N个字符,其中,N为自然数。具体截取的位置可以通过用户预设或选择。
根据本发明的一个或一些实施例,水印字符选取规则还包括:S44、通过采用同音字字典,由参考字得到参考字的同音字,选取任意同音字为水印字;或者,S44为选取参考字作为水印字。用户可以自行选择所需的水印字选取规则,具体不受此限。
根据本发明的一个或一些实施例,添加水印位置的规则包括:S51、确定水印添加偏移量A,A取值在1到中间文本长度L之间。将水印字添加到文本中。
根据本发明的一个或一些实施例,上述S2步骤中预处理包括:剔除源文本中所有的标点符号、空格、控制符、不可见UTF字符等。因这些特殊字符可以被侵权方采用规则自动批量去除,剔除后以便于后继处理时锁定证据。
根据本发明的一个或一些实施例,上述S3步骤中文本指纹算法包括:MD5(SecureHash Algorithm 1,安全散列算法1,是一种密码散列函数,美国国家安全局设计,并由美国国家标准技术研究所(NIST)发布为联邦数据处理标准(FIPS))、SHA-1(Secure HashAlgorithm 1,安全散列算法1,是一种密码散列函数,美国国家安全局设计,并由美国国家标准技术研究所(NIST)发布为联邦数据处理标准(FIPS))、SHA-128、SHA-256等的任一种算法。用户可以自行选择所需指纹算法,具体不受此限。
本实施例的技术方案相比其它文本水印技术,不依靠特殊字符如不可见UTF(Unicode Transformation Format,通用转换格式)字符等,因这些特殊字符可以被侵权方采用规则自动批量去除,即使侵权情况下也不能锁定证据;只有采用本发明的方案,基于内容类似的普通文本,而且在水印点的内容上又有特别之处,可依靠事前公正过的算法和配置参数进行恢复和重现。本发明实现的技术方案,在可实施性和不易规避性上优于其它技术方案。
图2是依据本发明实施例的文本水印添加装置的示意图。
根据本发明的第二个方面,提供一种文本水印应用的方法,包括如下步骤:文本内容输出方公示文本水印添加规则,规则包括水印算法和配置参数;当公开可访问文本内容涉及原创归属争议时,文本内容输出方按公证过的水印算法和配置参数对原文本计算,生成输出添加水印文本;将输出的添加水印文本与争议文本进行比对,从而解决争议。
本实施例的技术方案在应用时,己方(内容输出方)将上述普通文本水印添加方法及管理配置事前公证,在公开可访问文本内容涉及原创归属争议时,己方按公证过的水印算法和配置参数对原文本生成输出文本,与争议文本进行比对,从而解决争议。
图3是依据本发明实施例的文本水印添加举例的示意图。
举例而言,进行文本水印添加时,首先预设文本水印的配置规则,包括水印字符选取规则和添加水印位置的规则。
如图3所示,如对原文本“《中国电信集团股份有限公司上海分公司》”,进行处理,处理后得到中间文本:“中国电信集团股份有限公司上海分公司”。
再对文本计算文本指纹,如对于中间文本“中国电信集团股份有限公司上海分公司”,例如采用MD5算法,得到文本指纹字符串“f574976f87332ee83f49480ee25fb497”。
计算文本水印选取偏移量。将上述计算出的中间文本的文本指纹字符串按照预先配置截取一段,如截取最后6个字符(具体截取的位置和长度依照事先管理配置),将截取出的字符串转换为整型数值X,如对上述“f574976f87332ee83f49480ee25fb497”中字符串截取最后6个字符,即:“5fb497”,十六进制转换为十进制,转换为整数后X=6272151;上述中间文本长度L=17;将X以中间文本长度L为模取余数,得到参考字选取偏移量,记为S,采用mod(求余函数),即S=X mod L=6272151mod 17=1。
添加文本水印。根据计算出的参考字偏移量S,在原文本上添加水印字,偏移量S的施加规则依管理配置确定,比如可以从原文本起始处施加偏移量,非普通文本(即前述剔除的所有的标点符号、空格、控制符、不可见UTF字符等)不计数,则上例中,偏移量S=1,选取的参考字为第一个普通字符串“中”;依管理配置在确定一个添加偏移量A(应在在1到L之间,如A=L/2取整=8),从参考字起始,添加偏移量A=8,在原文本参考字“中”字后,第8个字符处添加水印字;水印字可以是参考字叠加字“中”,同样的非普通文本不计数,形成输出文本“《中国电信集团股份中有限公司上海分公司》”。添加水印完成。可选的,也可采用同音字字典添加参考字的任意同音字如“钟”/“忠”/“仲”等为水印字。
根据本发明的第三个方面,提供一种文本水印添加的装置,包括:配置规则单元,用于预设配置规则,配置规则包括水印字符选取规则和添加水印位置的规则;文本预处理单元,用于准备文本,接收待添加水印的原文本,进行预处理,得到和输出中间文本;计算文本指纹单元,用于计算文本指纹,对中间文本采用文本指纹算法计算文本指纹,得到和输出文本指纹字符串;选取偏移量单元,用于计算文本水印选取偏移量,按照水印字符选取规则,在中间文本中选取参考字,所处参考字用于给水印字符确认做参考,输出水印字;添加文本水印单元,用于添加文本水印,按照添加水印位置的规则,将水印字添加到文本中,输出添加水印后的文本。
根据本发明的一个或一些实施例,水印字符选取规则包括:将计算文本指纹单元输出的文本指纹字符串截取一段,将该段字符串转化为十进制数,再将十进制数以中间文本长度为模取余数,得到参考字选取偏移量,确定偏移量位置对应的字符为水印字符参考字,偏移量计算式为:
S=X mod L
其中,S表示参考字选取偏移量,X指该段字符串所转化的十进制数,L为中间文本的长度。
根据本发明的一个或一些实施例,将文本指纹字符串截取一段的方式包括截取文本中的某N个字符,其中,N为自然数。
根据本发明的一个或一些实施例,水印字符选取规则还包括:通过采用同音字字典,由参考字得到参考字的同音字,选取任意同音字为水印字;或者,选取参考字作为水印字。用户可以自行选择所需的水印字选取规则,具体不受此限。
根据本发明的一个或一些实施例,添加水印位置的规则包括:确定水印添加偏移量A,A取值在1到中间文本长度L之间。
根据本发明的一个或一些实施例,文本预处理单元的功能包括:剔除源文本中所有的标点符号、空格、控制符、不可见UTF字符。
根据本发明的一个或一些实施例,计算文本指纹单元所采用的文本指纹算法包括:MD5、SHA-1、SHA-128、SHA-256的任一种算法。
文本水印添加的装置可以由软件和/或硬件来实施。采用本实施例的技术方案,可用于验证输出文本内容的原创归属,可以以API(Application Programming Interface,应用程序接口)的方式输出,通过API可将过程中对于合作方内容的留存、再输出等进行验证。
根据本发明的第四个方面,提供一种文本水印应用的装置,包括:公示单元,文本内容输出方用于公示文本水印添加规则,规则包括水印算法和配置参数;生成单元,用于生成输出添加水印文本,当公开可访问文本内容涉及原创归属争议时,文本内容输出方按公证过的水印算法和配置参数对原文本计算,生成输出添加水印文本;比对单元,用于将输出的添加水印文本与争议文本进行比对,从而解决争议。
本发明提供一种使得文本内容的侵权行为可以得到快速识别和验证的方法,在社交平台如微信公众号文章的原创归属认定,在涉及API输出的场合,确保合作方或能力调用者对于己方的输出内容存在留存内容,以及确保再输出给第三方时符合己方要求,可以提供较强说服力的证据。
根据本发明的第五个方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述的文本水印添加方法。
根据本发明的第六个方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述的文本水印应用方法。
电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器,存储装置,连接不同系统组件(包括存储装置和处理器)的总线。
电子设备典型地包括多种计算机可读存储介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置可以包括易失性存储器形式的计算机可读存储介质,例如随机存取存储器(RAM)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机可读存储介质。仅作为举例,存储系统可以用于读写不可移动的、非易失性磁介质。
根据本发明的第七个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的文本水印添加方法。
根据本发明的第八个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述的文本水印应用方法。
当然,本领域技术人员可以理解,该程序被处理器执行时还可以实现本发明任意实施例所提供的文本水印添加方法的技术方案。
本发明实施例计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是,但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CDROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
以上所述仅是本发明的示范性实施方式,而非用于限制本发明的保护范围,本发明的保护范围由所附的权利要求确定。

Claims (22)

1.一种文本水印添加的方法,包括如下步骤:
S1、预设配置规则,所述配置规则包括水印字符选取规则和添加水印位置的规则;
S2、准备文本,接收待添加水印的原文本,进行预处理,得到和输出中间文本;
S3、计算文本指纹,对中间文本采用文本指纹算法计算文本指纹,得到和输出文本指纹字符串;
S4、计算文本水印选取偏移量,按照所述水印字符选取规则,在所述中间文本中选取参考字,所处参考字用于给水印字符确认做参考,输出水印字;
S5、添加文本水印,按照所述添加水印位置的规则,将所述水印字添加到文本中,输出添加水印后的文本。
2.如权利要求1所述的方法,其中,所述水印字符选取规则包括:
S41、将步骤S3中计算出的文本指纹字符串截取一段;
S42、将该段字符串转化为十进制数;
S43、将所述十进制数以中间文本长度为模取余数,得到参考字选取偏移量,确定偏移量位置对应的字符为水印字符参考字,偏移量计算式为:
S=X mod L
其中,S表示参考字选取偏移量,X指该段字符串所转化的十进制数,L为中间文本的长度,mod表示取余数。
3.如权利要求2所述的方法,其中,步骤S41中文本指纹字符串截取一段的方式包括截取文本中的某N个字符,
其中,N为自然数。
4.如权利要求2所述的方法,其中,所述水印字符选取规则还包括:
S44、通过采用同音字字典,由所述参考字得到参考字的同音字,选取任意同音字为水印字。
5.如权利要求2所述的方法,其中,所述水印字符选取规则还包括:
S44、选取所述参考字作为水印字。
6.如权利要求1所述的方法,其中,所述添加水印位置的规则包括:
S51、确定水印添加偏移量A,A取值在1到中间文本长度L之间。
7.如权利要求1所述的方法,其中,S2步骤中所述预处理包括:剔除源文本中所有的标点符号、空格、控制符、不可见UTF字符。
8.如权利要求1所述的方法,其中,S3步骤中所述文本指纹算法包括:MD5、SHA-1、SHA-128、SHA-256的任一种算法。
9.一种文本水印应用的方法,包括如下步骤:
文本内容输出方公示文本水印添加规则,所述规则包括水印算法和配置参数;
当公开可访问文本内容涉及原创归属争议时,文本内容输出方按公证过的水印算法和配置参数对原文本计算,生成输出添加水印文本;
将所述输出的添加水印文本与争议文本进行比对,从而解决争议。
10.一种文本水印添加的装置,包括:
配置规则单元,用于预设配置规则,所述配置规则包括水印字符选取规则和添加水印位置的规则;
文本预处理单元,用于准备文本,接收待添加水印的原文本,进行预处理,得到和输出中间文本;
计算文本指纹单元,用于计算文本指纹,对中间文本采用文本指纹算法计算文本指纹,得到和输出文本指纹字符串;
选取偏移量单元,用于计算文本水印选取偏移量,按照所述水印字符选取规则,在所述中间文本中选取参考字,所处参考字用于给水印字符确认做参考,输出水印字;
添加文本水印单元,用于添加文本水印,按照所述添加水印位置的规则,将所述水印字添加到文本中,输出添加水印后的文本。
11.如权利要求10所述的装置,其中,所述水印字符选取规则包括:
将计算文本指纹单元输出的文本指纹字符串截取一段,将该段字符串转化为十进制数,再将所述十进制数以中间文本长度为模取余数,得到参考字选取偏移量,确定偏移量位置对应的字符为水印字符参考字,偏移量计算式为:
S=X mod L
其中,S表示参考字选取偏移量,X指该段字符串所转化的十进制数,L为中间文本的长度。
12.如权利要求11所述的装置,其中,将所述文本指纹字符串截取一段的方式包括截取文本中的某N个字符,
其中,N为自然数。
13.如权利要求11所述的装置,其中,所述水印字符选取规则还包括:
通过采用同音字字典,由所述参考字得到参考字的同音字,选取任意同音字为水印字。
14.如权利要求11所述的装置,其中,所述水印字符选取规则还包括:
选取所述参考字作为水印字。
15.如权利要求10所述的装置,其中,所述添加水印位置的规则包括:
确定水印添加偏移量A,A取值在1到中间文本长度L之间。
16.如权利要求10所述的装置,其中,文本预处理单元的功能包括:剔除源文本中所有的标点符号、空格、控制符、不可见UTF字符。
17.如权利要求10所述的装置,其中,计算文本指纹单元所采用的文本指纹算法包括:MD5、SHA-1、SHA-128、SHA-256的任一种算法。
18.一种文本水印应用的装置,包括:
公示单元,文本内容输出方用于公示文本水印添加规则,所述规则包括水印算法和配置参数;
生成单元,用于生成输出添加水印文本,当公开可访问文本内容涉及原创归属争议时,文本内容输出方按公证过的水印算法和配置参数对原文本计算,生成输出添加水印文本;
比对单元,用于将所述输出的添加水印文本与争议文本进行比对,从而解决争议。
19.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的文本水印添加方法。
20.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求9所述的文本水印应用方法。
21.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-8中任一所述的文本水印添加方法。
22.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求9所述的文本水印应用方法。
CN202210106921.0A 2022-01-28 2022-01-28 文本水印添加及应用的方法和装置 Pending CN114547562A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210106921.0A CN114547562A (zh) 2022-01-28 2022-01-28 文本水印添加及应用的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210106921.0A CN114547562A (zh) 2022-01-28 2022-01-28 文本水印添加及应用的方法和装置

Publications (1)

Publication Number Publication Date
CN114547562A true CN114547562A (zh) 2022-05-27

Family

ID=81673426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210106921.0A Pending CN114547562A (zh) 2022-01-28 2022-01-28 文本水印添加及应用的方法和装置

Country Status (1)

Country Link
CN (1) CN114547562A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116956168A (zh) * 2023-09-18 2023-10-27 云粒智慧科技有限公司 文本水印处理方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116956168A (zh) * 2023-09-18 2023-10-27 云粒智慧科技有限公司 文本水印处理方法、装置、电子设备及存储介质
CN116956168B (zh) * 2023-09-18 2024-01-02 云粒智慧科技有限公司 文本水印处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN100410833C (zh) 用于将证书链接到签名文件的方法和系统
US7251343B2 (en) Image protection
US20030028774A1 (en) Ensuring the integrity of an electronic document
US20070220260A1 (en) Protecting the integrity of electronically derivative works
Harran et al. A method for verifying integrity & authenticating digital media
CN111010490A (zh) 水印添加方法、装置、电子设备及计算机可读存储介质
US20230161886A1 (en) Distributed ledger-based digital content tracing
Kaur et al. An existential review on text watermarking techniques
Melkundi et al. A robust technique for relational database watermarking and verification
CN112434319A (zh) 一种用于电子文件的数据加密方法及装置
KR102108192B1 (ko) 워터마크 삽입 방법, 장치 및 시스템
CN114547562A (zh) 文本水印添加及应用的方法和装置
Martínez et al. On watermarking for collaborative model-driven engineering
CN110874456B (zh) 水印嵌入和水印提取方法、装置及数据处理方法
CN110929230A (zh) 作品管理方法、装置、设备以及存储介质
CN111340676A (zh) 图像水印的嵌入方法、识别方法、装置及电子设备
CN111382398B (zh) 信息处理、隐藏信息解析和嵌入的方法、装置及设备
Saini A survey on watermarking web contents for protecting copyright
CN110378133B (zh) 一种文件保护方法、装置、电子设备及存储介质
CN110378829B (zh) 信息提供和水印提取的方法、装置及设备
Lin et al. Robust digital signature for multimedia authentication
JP2021093101A (ja) 同型暗号化方法を用いて電子文書ファイルの内部に含まれた悪性コードを探知する方法
CN117473470B (zh) 动态水印生成方法及系统、水印溯源方法
CN114564704B (zh) 一种基于位隐藏的最小化失真关系型数据库水印方法
Jana et al. Voronoi Diagrams Based Digital Tattoo for Multimedia Data Protection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination