CN117113302A - 文本水印生成方法和文本验证方法 - Google Patents

文本水印生成方法和文本验证方法 Download PDF

Info

Publication number
CN117113302A
CN117113302A CN202311312018.0A CN202311312018A CN117113302A CN 117113302 A CN117113302 A CN 117113302A CN 202311312018 A CN202311312018 A CN 202311312018A CN 117113302 A CN117113302 A CN 117113302A
Authority
CN
China
Prior art keywords
text
field
watermark
information corresponding
watermark information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311312018.0A
Other languages
English (en)
Other versions
CN117113302B (zh
Inventor
刘绍腾
刘华罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202311312018.0A priority Critical patent/CN117113302B/zh
Publication of CN117113302A publication Critical patent/CN117113302A/zh
Application granted granted Critical
Publication of CN117113302B publication Critical patent/CN117113302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本申请涉及一种文本水印生成方法和文本验证方法。所述文本水印生成方法包括:获取原始文本,从原始文本中选取关键字段;确定关键字段在原始文本中出现的至少一个文本位置;根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息;基于至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息;基于关键字段对应的水印信息,生成原始文本对应的文本水印。所述文本验证方法包括:获取待验证文本,利用关键字段从待验证文本中提取待验证文本水印,通过比对待验证文本水印与文本水印,对待验证文本进行验证。采用本方法能够提高文本验证的准确度。

Description

文本水印生成方法和文本验证方法
技术领域
本申请涉及计算机技术领域,特别是涉及一种文本水印生成方法、装置、计算机设备、存储介质和计算机程序产品,以及一种文本验证方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,出现了文本验证技术,文本验证是指对文本数据是否被篡改(如插入、删除和重新排序等)进行验证。
传统技术中,可以利用嵌入文本水印的方式来对文本数据进行验证。在进行文本验证时,首先会在原始文本中任意位置处嵌入水印信息,生成包含水印信息的原始文本,再在待验证文本中相同位置处嵌入水印信息,生成包含水印信息的待验证文本,最后利用包含水印信息的原始文本对包含水印信息的待验证文本进行验证。
然而,传统方法,通常以固定方式(如固定的水印符号、水印表情等)向原始文本和待验证文本中嵌入水印信息,所嵌入的水印信息容易被破解,导致文本验证的准确度低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够支持提高文本验证的准确度的文本水印生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,以及一种能够提高文本验证的准确度的文本验证方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种文本水印生成方法。所述方法包括:
获取原始文本,从所述原始文本中选取关键字段;
确定所述关键字段在所述原始文本中出现的至少一个文本位置;
根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息;
基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息;
基于所述关键字段对应的水印信息,生成所述原始文本对应的文本水印。
第二方面,本申请还提供了一种文本水印生成装置。所述装置包括:
关键字段选取模块,用于获取原始文本,从所述原始文本中选取关键字段;
文本位置确定模块,用于确定所述关键字段在所述原始文本中出现的至少一个文本位置;
文本位置水印生成模块,用于根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息;
关键字段水印生成模块,用于基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息;
文本水印生成模块,用于基于所述关键字段对应的水印信息,生成所述原始文本对应的文本水印。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取原始文本,从所述原始文本中选取关键字段;
确定所述关键字段在所述原始文本中出现的至少一个文本位置;
根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息;
基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息;
基于所述关键字段对应的水印信息,生成所述原始文本对应的文本水印。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取原始文本,从所述原始文本中选取关键字段;
确定所述关键字段在所述原始文本中出现的至少一个文本位置;
根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息;
基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息;
基于所述关键字段对应的水印信息,生成所述原始文本对应的文本水印。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取原始文本,从所述原始文本中选取关键字段;
确定所述关键字段在所述原始文本中出现的至少一个文本位置;
根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息;
基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息;
基于所述关键字段对应的水印信息,生成所述原始文本对应的文本水印。
上述文本水印生成方法、装置、计算机设备、存储介质和计算机程序产品,通过获取原始文本,从原始文本中选取关键字段,确定关键字段在原始文本中出现的至少一个文本位置,根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息,能够利用至少一个文本位置各自的邻域内的字段实现邻域对应的水印信息的生成,进而可以利用至少一个文本位置各自的邻域对应的水印信息,实现关键字段对应的水印信息的生成,从而可以基于关键字段对应的水印信息,实现原始文本对应的文本水印的生成。整个过程,利用从原始文本中所选取的关键字段,通过分析原始文本的内容的方式来构造原始文本对应的文本水印,而不是以固定方式向原始文本中嵌入水印信息,保证了文本水印的安全性,由于文本水印不易被破解,通过该文本水印就能够实现准确文本验证,能够支持提高文本验证的准确度。
第六方面,本申请提供了一种文本验证方法。所述方法包括:
获取待验证文本以及所述待验证文本的文本标识;
获取与所述文本标识关联的注册文本水印和关键字段;其中,所述注册文本水印和所述关键字段,是对与所述文本标识关联的原始文本执行上述文本水印生成方法确定的;
采用所述文本水印生成方法,基于所述待验证文本和所述关键字段生成水印,得到待验证文本水印;
对所述待验证文本水印和所述注册文本水印进行一致性验证,获得对所述待验证文本的文本验证结果。
第七方面,本申请还提供了一种文本验证装置。所述装置包括:
文本标识获取模块,用于获取待验证文本以及所述待验证文本的文本标识;
关联信息获取模块,用于获取与所述文本标识关联的注册文本水印和关键字段;其中,所述注册文本水印和所述关键字段,是对与所述文本标识关联的原始文本执行上述文本水印生成方法确定的;
待验证文本水印生成模块,用于采用所述文本水印生成方法,基于所述待验证文本和所述关键字段生成水印,得到待验证文本水印;
水印验证模块,用于对所述待验证文本水印和所述注册文本水印进行一致性验证,获得对所述待验证文本的文本验证结果。
第八方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待验证文本以及所述待验证文本的文本标识;
获取与所述文本标识关联的注册文本水印和关键字段;其中,所述注册文本水印和所述关键字段,是对与所述文本标识关联的原始文本执行上述文本水印生成方法确定的;
采用所述文本水印生成方法,基于所述待验证文本和所述关键字段生成水印,得到待验证文本水印;
对所述待验证文本水印和所述注册文本水印进行一致性验证,获得对所述待验证文本的文本验证结果。
第九方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待验证文本以及所述待验证文本的文本标识;
获取与所述文本标识关联的注册文本水印和关键字段;其中,所述注册文本水印和所述关键字段,是对与所述文本标识关联的原始文本执行上述文本水印生成方法确定的;
采用所述文本水印生成方法,基于所述待验证文本和所述关键字段生成水印,得到待验证文本水印;
对所述待验证文本水印和所述注册文本水印进行一致性验证,获得对所述待验证文本的文本验证结果。
第十方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待验证文本以及所述待验证文本的文本标识;
获取与所述文本标识关联的注册文本水印和关键字段;其中,所述注册文本水印和所述关键字段,是对与所述文本标识关联的原始文本执行上述文本水印生成方法确定的;
采用所述文本水印生成方法,基于所述待验证文本和所述关键字段生成水印,得到待验证文本水印;
对所述待验证文本水印和所述注册文本水印进行一致性验证,获得对所述待验证文本的文本验证结果。
上述文本验证方法、装置、计算机设备、存储介质和计算机程序产品,通过获取待验证文本以及待验证文本的文本标识,能够利用文本标识实现对所关联的注册文本水印和关键字段的获取,由于注册文本水印和关键字段,是对与文本标识关联的原始文本执行文本水印生成方法确定的,因此可以利用注册文本水印和关键字段来对待验证文本与原始文本是否一致进行验证,通过采用文本水印生成方法,基于待验证文本和关键字段生成水印,能够实现对待验证文本水印的获取,进而可以通过对待验证文本水印和注册文本水印进行一致性验证,来比对待验证文本与原始文本是否一致,得到对待验证文本的文本验证结果。整个过程,由于待验证文本水印和注册文本水印都是在确定关键字段的基础上通过分析文本内容的方式生成的,而不是以固定方式嵌入的,因此,通过比对待验证文本水印和注册文本水印是否一致,能够实现对待验证文本与原始文本是否一致的准确确定,能够提高文本验证的准确度。
附图说明
图1为一个实施例中文本水印生成方法的应用环境图;
图2为一个实施例中文本水印生成方法的流程示意图;
图3为一个实施例中邻域内的字段的示意图;
图4为一个实施例中生成原始文本对应的文本水印的示意图;
图5为一个实施例中邻域对应的水印信息的示意图;
图6为另一个实施例中邻域对应的水印信息的示意图;
图7为一个实施例中字段选择提示的示意图;
图8为一个实施例中生成关键字段对应的水印信息的示意图;
图9为另一个实施例中文本水印生成方法的流程示意图;
图10为又一个实施例中文本水印生成方法的流程示意图;
图11为一个实施例中文本验证方法的应用环境图;
图12为一个实施例中文本验证方法的流程示意图;
图13为另一个实施例中文本验证方法的流程示意图;
图14为一个实施例中文本水印生成以及文本验证的示意图;
图15为一个实施例中文本水印生成装置的结构框图;
图16为一个实施例中文本验证装置的结构框图;
图17为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的文本水印生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。终端102从服务器104获取原始文本,从原始文本中选取关键字段,确定关键字段在原始文本中出现的至少一个文本位置,根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息,基于至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息,基于关键字段对应的水印信息,生成原始文本对应的文本水印。
其中,终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群或者云服务器来实现。
在一个实施例中,如图2所示,提供了一种文本水印生成方法,该方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。在本申请实施例中,以该方法应用于终端为例进行说明,包括以下步骤:
步骤202,获取原始文本,从原始文本中选取关键字段。
其中,原始文本是指没有被修改、编辑过的最初版本的文本,常被用于验证其他文本的真实性和完整性。这里的其他文本是指与原始文本归属于同一版本的、需要被验证的文本。比如,原始文本具体可以是指没有被修改、编辑过的最初版本的影视剧本,可以用于验证拍摄时的影视剧本的真实性和完整性。又比如,原始文本具体可以是指没有被修改、编辑过的最初版本的组织合同(如在签订合约时的组织合同),可以用于验证履行合约时的组织合同的真实性和完整性。
其中,关键字段是指从原始文本中选取的用于生成文本水印的字段,是生成文本水印的基础。比如,关键字段具体可以是指从原始文本中选取的用于生成文本水印的单字。又比如,关键字段具体可以是指从原始文本中选取的用于生成文本水印的词语。需要说明的是,关键字段具体是单字还是词语可按照实际应用场景进行配置。可以理解的是,当存在多个关键字段,多个关键字段可以均为单字或均为词语。
具体的,终端会先获取需要生成文本水印的原始文本,再从原始文本中选取关键字段,以便基于关键字段,生成原始文本对应的文本水印。在具体的应用中,终端可以从原始文本中选取任意字段作为关键字段,这里的任意字段可以为任意单字或任意词语。
在具体的应用中,终端还可以先对原始文本进行拆分,将原始文本拆分为多个文本字段,再统计多个文本字段各自在原始文本中的出现次数,再利用出现次数,从多个文本字段中选取关键字段。在一个具体的应用中,终端可以结合出现次数和预配置关键字段数量,从多个文本字段中选取关键字段。其中,预配置关键字段数量可按照实际应用场景进行配置。可以理解的是,预配置关键字段数量可以用N表示,则终端会从多个文本字段中选取出现次数较多的N个文本字段,作为关键字段。
在一个具体的应用中,在结合出现次数和预配置关键字段数量(N),从多个文本字段中选取关键字段时,终端可以利用出现次数,对多个文本字段进行排序,得到文本字段排序结果,再根据文本字段排序结果选择排序在前的N个文本字段作为关键字段。在一个具体的应用中,终端还可以先根据文本字段排序结果选择排序在前的(N+M)个文本字段作为候选字段,再从候选字段中随机选择N个文本字段作为关键字段。其中,M为正整数,可按照实际应用场景进行配置。
步骤204,确定关键字段在原始文本中出现的至少一个文本位置。
其中,文本位置是指关键字段在原始文本中出现的位置。比如,文本位置具体可以是指关键字段位于原始文本中的第X行第Y个。其中的X和Y均为正整数。可以理解的是,关键字段可以在原始文本中多次出现,因此,本实施例中确定的是关键字段在原始文本中出现的至少一个文本位置。
具体的,终端会根据关键字段遍历原始文本,以确定关键字段在原始文本中出现的至少一个文本位置。在具体的应用中,终端可以根据关键字段,利用预配置查找算法进行遍历,得到关键字段在原始文本中出现的至少一个文本位置。其中,预配置查找算法可按照实际应用场景进行配置,本实施例中在此处不做限定,该预配置查找算法在实现查找时所需要的参数为原始文本以及关键字段,输出为关键字段在原始文本中出现的至少一个文本位置。
步骤206,根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息。
其中,邻域是指与文本位置相邻的位置构成的一个区域,邻域的大小可按照实际应用场景进行配置。比如,邻域具体可以是指与文本位置相邻的前至少一个位置构成的区域。又比如,邻域具体可以是指与文本位置相邻的后至少一个位置构成的区域。再比如,邻域具体还可以是指与文本位置相邻的前至少一个位置和后至少一个位置构成的区域。需要说明的是,当邻域为与文本位置相邻的前至少一个位置和后至少一个位置构成的区域,邻域为去心邻域,即邻域内的字段不包括文本位置处的关键字段。
其中,邻域内的字段是指邻域内的位置处的字段。比如,当邻域为与文本位置相邻的前至少一个位置和后至少一个位置构成的区域,邻域内的字段是指与文本位置相邻的前至少一个位置处的字段和后至少一个位置处的字段。举例说明,如图3所示,假设关键字段(如图3所示为关键字段1)在原始文本中出现的一个文本位置为第一行第四个位置,且邻域为与文本位置相邻的前一个位置和后一个位置构成的区域,则邻域内的字段是指与文本位置(第一行第四个位置)相邻的前一个位置处(第一行第三个位置)的字段(如图3所示为文本字段3)和后一个位置处(第一行第五个位置)的字段(如图3所示为文本字段4)。邻域对应的水印信息是指用于指示和识别邻域内的字段的信息。比如,邻域对应的水印信息具体可以为邻域内的字段对应的笔画数、字段长度等信息。
具体的,针对至少一个文本位置中的每个文本位置,终端会根据所针对文本位置的邻域内的字段生成水印,获得所针对文本位置的邻域对应的水印信息。在具体的应用中,终端会确定所针对文本位置的邻域内的字段的特征,再基于邻域内的字段的特征生成水印,获得所针对文本位置的邻域对应的水印信息。在一个具体的应用中,字段的特征具体可以为字段对应的文本类型,针对不同文本类型的字段,可以采用不同的方式来生成水印。字段的特征具体还可以为字段对应的编码,不同字段可以采用不同编码来表征,从而可以基于字段对应的编码来生成水印。
步骤208,基于至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息。
其中,关键字段对应的水印信息是指用于指示和识别关键字段的信息。比如,关键字段对应的水印信息具体可以为拼接的至少一个文本位置各自的邻域对应的水印信息。又比如,关键字段对应的水印信息具体可以为叠加的至少一个文本位置各自的邻域对应的水印信息,此时,至少一个文本位置各自的邻域对应的水印信息均为可以叠加的正整数,该正整数具体可以为邻域内的字段的笔画数或字段长度中的一项。
具体的,终端会基于至少一个文本位置各自的邻域对应的水印信息,来生成关键字段对应的水印信息。在具体的应用中,终端可以拼接至少一个文本位置各自的邻域对应的水印信息,来生成关键字段对应的水印信息。终端也可以叠加至少一个文本位置各自的邻域对应的水印信息,来生成关键字段对应的水印信息。
步骤210,基于关键字段对应的水印信息,生成原始文本对应的文本水印。
其中,原始文本对应的文本水印是指用于指示和识别原始文本的信息。比如,原始文本对应的文本水印具体可以为用于指示和识别原始文本的数字序列。
具体的,终端会基于关键字段对应的水印信息,生成原始文本对应的文本水印。在具体的应用中,当关键字段的数量为单个,终端会直接将关键字段对应的水印信息,作为原始文本对应的文本水印。当关键字段的数量为多个,终端会通过拼接多个关键字段各自对应的水印信息的方式,来生成原始文本对应的文本水印。
在一个具体的应用中,终端可以按照多个关键字段在原始文本中的出现顺序,拼接多个关键字段各自对应的水印信息。终端也可以按照多个关键字段在原始文本中的出现次数顺序,拼接多个关键字段各自对应的水印信息。举例说明,如图4所示,假设多个关键字段为三个关键字段(关键字段A、关键字段B以及关键字段C),三个关键字段各自对应的水印信息分别为水印信息A、水印信息B、水印信息C,三个关键字段在原始文本中的出现顺序为关键字段B、关键字段A、关键字段C,三个关键字段在原始文本中的出现次数顺序为关键字段C、关键字段A、关键字段B。当按照三个关键字段在原始文本中的出现顺序,拼接三个关键字段各自对应的水印信息,所得到的原始文本对应的文本水印如图4中402所示。当按照三个关键字段在原始文本中的出现次数顺序,拼接三个关键字段各自对应的水印信息,所得到的原始文本对应的文本水印如图4中404所示。
上述文本水印生成方法,通过获取原始文本,从原始文本中选取关键字段,确定关键字段在原始文本中出现的至少一个文本位置,根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息,能够利用至少一个文本位置各自的邻域内的字段实现邻域对应的水印信息的生成,进而可以利用至少一个文本位置各自的邻域对应的水印信息,实现关键字段对应的水印信息的生成,从而可以基于关键字段对应的水印信息,实现原始文本对应的文本水印的生成。整个过程,利用从原始文本中所选取的关键字段,通过分析原始文本的内容的方式来构造原始文本对应的文本水印,而不是以固定方式向原始文本中嵌入水印信息,保证了文本水印的安全性,由于文本水印不易被破解,通过该文本水印就能够实现准确文本验证,能够支持提高文本验证的准确度。
在一个实施例中,根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息包括:
针对至少一个文本位置中的每个文本位置,确定所针对文本位置的邻域内的字段对应的文本类型;
根据邻域内的字段对应的文本类型生成水印,获得所针对文本位置的邻域对应的水印信息。
其中,字段对应的文本类型用于描述字段的文本形式。比如,字段对应的文本类型可以为中文文本。又比如,字段对应的文本类型可以为非中文文本。举例说明,非中文文本具体可以为英文、法文等。
具体的,针对至少一个文本位置中的每个文本位置,终端会确定所针对文本位置的邻域内的字段对应的文本类型,再按照邻域内的字段对应的文本类型所对应的水印生成方式来生成水印,获得所针对文本位置的领域对应的水印信息。可以理解的是,不同文本类型所对应的水印生成方式不相同。
在具体的应用中,当邻域内的字段对应的文本类型为中文文本,可以通过确定邻域内的字段对应的笔画数的方式来生成水印,当邻域内的字段对应的文本类型为非中文文本,可以通过确定邻域内的字段对应的字段长度的方式来生成水印。
在具体的应用中,为了方便终端识别和处理,所获取的原始文本可以为经过文本编码之后的文本,则在原始文本中,所针对文本位置的邻域内的字段也为编码形式,通过利用所针对文本位置的邻域内的字段的编码查询文本编码表,就可以确定所针对文本位置的邻域内的字段对应的文本类型。其中,文本编码表是预先配置的用于文本编码的表格,在文本编码表中,存储有字段和编码的对应关系。
本实施例中,针对至少一个文本位置中的每个文本位置,通过根据所针对文本位置的邻域内的字段对应的文本类型来生成水印,能够在生成水印时充分考虑邻域内的字段的特点,使得所生成的邻域对应的水印信息能够准确指示邻域内的字段,进而便于利用能够准确指示邻域内的字段的邻域对应的水印信息,实现对关键字段对应的水印信息的获取。
在一个实施例中,邻域内的字段的数量为至少一个;根据邻域内的字段对应的文本类型生成水印,获得所针对文本位置的邻域对应的水印信息包括:
根据邻域内的至少一个字段各自对应的文本类型,分别生成至少一个字段各自对应的水印信息;
基于至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。
具体的,邻域内的字段的数量为至少一个,在根据邻域内的字段对应的文本类型生成水印时,以获得所针对文本位置的邻域对应的水印信息时,终端会根据邻域内的至少一个字段各自对应的文本类型,分别生成至少一个字段各自对应的水印信息,再基于至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。需要说明的是,可以理解的是,至少一个字段各自对应的文本类型可能相同,也可能不同。
在具体的应用中,针对邻域内的至少一个字段中的每个字段,终端会按照所针对字段对应的文本类型所对应的水印生成方式,来生成所针对字段对应的水印信息。不同文本类型所对应的水印生成方式不同。
在具体的应用中,当至少一个字段的数量为单个,终端会根据邻域内的单个字段对应的文本类型,生成单个字段对应的水印信息,将单个字段对应的水印信息,作为所针对文本位置的邻域对应的水印信息。在一个具体的应用中,当至少一个字段的数量为单个,领域内的单个字段具体可以为所针对文本位置处前一个位置的字段,也可以为所针对文本位置处后一个位置的字段。
本实施例中,通过先根据邻域内的至少一个字段各自对应的文本类型,分别生成至少一个字段各自对应的水印信息,能够利用至少一个字段各自对应的水印信息,实现对所针对文本位置的邻域对应的水印信息的获取。
在一个实施例中,根据邻域内的至少一个字段各自对应的文本类型,分别生成至少一个字段各自对应的水印信息包括:
针对邻域内的至少一个字段中的每个字段,当所针对字段的文本类型为中文文本,确定所针对字段对应的笔画数;
将所针对字段对应的笔画数,作为所针对字段对应的水印信息。
其中,笔画通常是指组成汉字且不间断的各种形状的点和线,如横(一)、竖(丨)、撇(丿)、捺(㇏)、折(𠃋)等,它是构成汉字字形的最小连笔单位。本实施例中,笔画数是指组成所针对字段且不间断的各种形状的点和线的数量。
具体的,针对邻域内的至少一个字段中的每个字段,当所针对字段的文本类型为中文文本,终端会确定所针对字段对应的笔画数,将所针对字段对应的笔画数,作为所针对字段对应的水印信息。在具体的应用中,终端会基于所针对字段进行笔画数查询,以确定所针对字段对应的笔画数。在一个具体的应用中,终端可以基于所针对字段查询预配置的笔画数查询库,确定所针对字段对应的笔画数。其中,笔画数查询库可按照实际应用场景进行配置,在笔画数查询库中存储有汉字与笔画数的对应关系。
在具体的应用中,当所针对字段为单个汉字,终端会直接将所查询到的单个汉字的笔画数,作为所针对字段对应的笔画数。当所针对字段为至少两个汉字组成的词语,终端所查询到的是至少两个汉字各自的笔画数,此时,终端会叠加至少两个汉字各自的笔画数,将叠加后的笔画数,作为所针对字段对应的笔画数。
本实施例中,当所针对文本类型为中文文本,能够通过确定所针对字段对应的笔画数,实现对所针对字段对应的水印信息的获取。
在一个实施例中,方法还包括:
当所针对字段的文本类型为非中文文本,确定所针对字段对应的字段长度;
将所针对字段对应的字段长度,作为所针对字段对应的水印信息。
其中,字段长度是指组成所针对字段的字段元素的数量。比如,当所针对字段为外文单词,所针对字段对应的字段长度为组成外文单词的外文字母的数量,即外文单词的单词长度。举例说明,这里的外文单词具体可以为英语单词、法语单词等。
具体的,针对邻域内的至少一个字段中的每个字段,当所针对字段的文本类型为非中文文本,终端会确定所针对字段对应的字段长度,将所针对字段对应的字段长度,作为所针对字段对应的水印信息。在具体的应用中,终端会基于所针对字段进行字段长度查询,以确定所针对字段对应的字段长度。在一个具体的应用中,终端可以基于所针对字段查询预配置的字段长度查询库,确定所针对字段对应的字段长度。其中,字段长度数据库可按照实际应用场景进行配置,在字段长度查询库中存储有外文单词与单词长度的对应关系。
本实施例中,当所针对字段的文本类型为非中文文本,能够通过确定所针对字段对应的字段长度,实现对所针对字段对应的水印信息的获取。
在一个实施例中,基于至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息包括:
当至少一个字段的数量为多个,按照至少一个字段在原始文本中的出现顺序,拼接至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。
具体的,当至少一个字段的数量为多个,终端会按照至少一个字段在原始文本中的出现顺序,拼接至少一个字段各自对应的水印信息,以获得所针对文本位置的邻域对应的水印信息。在具体的应用中,至少一个字段可以为与所针对文本位置相邻的前至少两个位置处的字段,则终端会按照前至少两个位置处的字段在原始文本中的出现顺序,拼接至少一个字段各自对应的水印信息。至少一个字段可以为与所针对文本位置相邻的后至少两个位置处的字段,在终端会按照后至少两个位置处的字段在原始文本中的出现顺序,拼接至少一个字段各自的水印信息。
在具体的应用中,至少一个字段还可以为与所针对文本位置相邻的前至少一个位置处的字段和后至少一个位置处的字段,则终端会按照前至少一个位置处的字段和后至少一个位置处的字段在原始文本中的出现顺序(即前至少一个位置处的字段在前,后至少一个位置处的字段在后),拼接至少一个字段各自对应的水印信息。
举例说明,如图5所示,假设至少一个字段为所针对文本位置相邻的前两个位置处的字段(文本字段1、文本字段2)和后两个位置处的字段(文本字段3、文本字段4),且前两个位置处的字段和后两个位置处的字段在原始文本中的出现顺序如图5所示,则终端会按照前两个位置处的字段和后两个位置处的字段在原始文本中的出现顺序,拼接这四个字段各自对应的水印信息,所得到的所针对文本位置的邻域对应的水印信息如图5中502所示。
本实施例中,在至少一个字段的数量为多个的情况下,通过按照至少一个字段在原始文本中的出现顺序,拼接至少一个字段各自对应的水印信息,能够实现对所针对文本位置的邻域对应的水印信息的获取。
在一个实施例中,基于至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息包括:
当至少一个字段的数量为多个,且至少一个字段各自对应的水印信息为笔画数或字段长度中的一项,叠加至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。
具体的,当至少一个字段的数量为多个,且至少一个字段各自对应的水印信息为笔画数或字段长度中的一项,由于笔画数和字段长度都是正整数,因此,终端可以通过叠加至少一个字段各自对应的水印信息的方式,获得所针对文本位置的邻域对应的水印信息。
在具体的应用中,至少一个字段各自对应的水印信息可以为笔画数,则终端可以通过叠加至少一个字段各自对应的笔画数的方式,来获得所针对文本位置的邻域对应的水印信息,即邻域对应的水印信息为邻域内的至少一个字段各自对应的笔画数的总和。
在一个具体的应用中,如图6所示,假设至少一个字段为所针对文本位置相邻的前两个位置处(分别为A1和A2)的字段(如图6所示分别为“文”和“本”)和后两个位置处(分别为B1和B2)的字段)(如图6所示分别为“水”和“印”),则A1处的字段的笔画数为4,A2处的字段的笔画数为5,B1处的字段的笔画数为4,B2处的字段的笔画数为5,通过叠加至少一个字段各自对应的笔画数,所获得的所针对文本位置的邻域对应的水印信息为18。
在具体的应用中,至少一个字段各自对应的水印信息可以为字段长度,则终端可以通过叠加至少一个字段各自对应的字段长度的方式,来获得所针对文本位置的邻域对应的水印信息,即邻域对应的水印信息为邻域内的至少一个字段各自对应的字段长度的总和。
在一个具体的应用中,假设至少一个字段为所针对文本位置相邻的前两个位置处(分别为A1和A2)的字段和后两个位置处(分别为B1和B2)的字段,且A1处的字段的字段长度为6,A2处的字段的字段长度为5,B1处的字段的字段长度为7,B2处的字段的字段长度为8,则通过叠加至少一个字段各自对应的字段长度,所获得的所针对文本位置的邻域对应的水印信息为26。
本实施例中,在至少一个字段的数量为多个,且至少一个字段各自对应的水印信息为笔画数或字段长度中的一项的情况下,通过叠加至少一个字段各自对应的水印信息,能够实现对所针对文本位置的邻域对应的水印信息的获取。
在一个实施例中,从原始文本中选取关键字段包括:
对原始文本进行拆分,得到多个文本字段;
统计多个文本字段各自在原始文本中的出现次数;
基于出现次数,从多个文本字段中选取关键字段。
具体的,终端会对原始文本进行拆分,得到在原始文本中出现的多个文本字段,再通过遍历原始文本的方式,统计多个文本字段各自在原始文本中的出现次数,以便基于出现次数,从多个文本字段中选取关键字段。在具体的应用中,终端会按照预配置的字段类型,对原始文本进行拆分,得到多个文本字段。其中,预配置的字段类型可按照实际应用场景进行配置,为单字或词语中的一项。在一个具体的应用中,当预配置的字段类型为单字,终端会以单字为单位,对原始文本进行拆分,得到多个文本字段,即多个单字。当预配置的字段类型为词语,终端会对原始文本进行分词,得到多个文本字段,即多个词语。
在具体的应用中,终端可以结合出现次数和预配置关键字段数量,从多个文本字段中选取关键字段。其中,预配置关键字段数量可按照实际应用场景进行配置。可以理解的是,预配置关键字段数量可以用N表示,则终端会从多个文本字段中选取出现次数较多的N个文本字段,作为关键字段。
在一个具体的应用中,在结合出现次数和预配置关键字段数量(N),从多个文本字段中选取关键字段时,终端可以利用出现次数,对多个文本字段进行排序,得到文本字段排序结果,再根据文本字段排序结果选择排序在前的N个文本字段作为关键字段。在一个具体的应用中,终端还可以先根据文本字段排序结果选择排序在前的(N+M)个文本字段作为候选字段,再从候选字段中随机选择N个文本字段作为关键字段。其中,M为正整数,可按照实际应用场景进行配置。
本实施例中,通过对原始文本进行拆分,可以得到多个文本字段,从而可以在统计多个文本字段各自在原始文本中的出现次数的基础上,基于出现次数,从多个文本字段中选取出关键字段。
在一个实施例中,基于出现次数,从多个文本字段中选取关键字段包括:
基于出现次数,对多个文本字段进行排序,得到文本字段排序结果;
根据文本字段排序结果,生成字段选择提示;字段选择提示用于指示选择至少一个文本字段作为关键字段;
响应于基于字段选择提示反馈的字段选择操作,将字段选择操作所指示的文本字段作为关键字段。
具体的,终端会基于出现次数,对多个文本字段进行降序排序,得到文本字段排序结果,在文本字段排序结果中,出现次数最多的文本字段排在最前面,出现次数最少的文本字段排在最后面。在得到文本字段排序结果后,终端会根据文本字段排序结果,生成字段选择提示,该字段选择提示用于指示选择至少一个文本字段作为关键字段,响应于基于字段选择提示反馈的字段选择操作,终端会将字段选择操作所指示的文本字段作为关键字段,完成对关键字段的选取。
在具体的应用中,终端生成字段选择提示后,会显示字段选择提示,以指示使用终端的对象选择至少一个文本字段作为关键字段,使用终端的对象在查看到字段选择提示后,可以基于字段选择提示发起字段选择操作进行选择,终端响应于字段选择操作,会将字段选择操作所指示的文本字段作为关键字段。
在一个具体的应用中,所显示的字段选择提示可以如图7所示,包括一部分文本字段排序结果(如图7所示为文本字段1 出现15次、文本字段2 出现12次、文本字段3 出现10次、文本字段4 出现8次、文本字段5 出现5次、文本字段6 出现3次、……)、选择指示(如图7所示为“请选择关键字段”)和选择控件以及选择确认控件,使用终端的对象可以通过选择控件和确认选择控件进行选择。
本实施例中,通过基于出现次数,对多个文本字段进行排序,能够得到文本字段排序结果,进而可以根据文本字段排序结果,生成字段选择提示,以指示选择至少一个文本字段作为关键字段,从而可以响应于基于字段选择提示反馈的字段选择操作,将字段选择操作所指示的文本字段作为关键字段,整个过程,能够通过字段选择的方式实现对关键字段的选取。
在一个实施例中,基于至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息包括:
按照至少一个文本位置处的关键字段在原始文本中的出现顺序,拼接至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息。
具体的,终端会按照至少一个文本位置处的关键字段在原始文本中的出现顺序,拼接至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息。在具体的应用中,假设至少一个文本位置处(如图8所示为第一行第四个位置、第三行第五个位置以及第五行第二个位置)的关键字段在原始文本中的出现顺序如图8所示,且至少一个文本位置各自的邻域对应的水印信息分别为水印信息A、水印信息B、水印信息C,则终端通过拼接至少一个文本位置各自的邻域对应的水印信息,所生成的关键字段对应的水印信息如图8中802所示。
本实施例中,通过按照至少一个文本位置处的关键字段在原始文本中的出现顺序,拼接至少一个文本位置各自的邻域对应的水印信息,能够实现对关键字段对应的水印信息的生成。
在一个实施例中,如图9所示,通过一个流程示意图来说明本申请的文本水印生成方法,该文本水印生成方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。在本申请实施例中,以该方法应用于终端为例进行说明,具体包括以下步骤:
步骤902,获取原始文本,对原始文本进行拆分,得到多个文本字段;
步骤904,统计多个文本字段各自在原始文本中的出现次数;
步骤906,基于出现次数,对多个文本字段进行排序,得到文本字段排序结果;
步骤908,根据文本字段排序结果,生成字段选择提示;字段选择提示用于指示选择至少一个文本字段作为关键字段;
步骤910,响应于基于字段选择提示反馈的字段选择操作,将字段选择操作所指示的文本字段作为关键字段;
步骤912,确定关键字段在原始文本中出现的至少一个文本位置;
步骤914,针对至少一个文本位置中的每个文本位置,确定所针对文本位置的邻域内的至少一个字段各自对应的文本类型;
步骤916,根据邻域内的至少一个字段各自对应的文本类型,分别生成至少一个字段各自对应的水印信息;
步骤918,按照至少一个字段在原始文本中的出现顺序,拼接至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息;
步骤920,按照至少一个文本位置处的关键字段在原始文本中的出现顺序,拼接至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息;
步骤922,基于关键字段对应的水印信息,生成原始文本对应的文本水印。
其中,步骤916具体包括以下步骤:针对邻域内的至少一个字段中的每个字段,当所针对字段的文本类型为中文文本,确定所针对字段对应的笔画数,将所针对字段对应的笔画数,作为所针对字段对应的水印信息,当所针对字段的文本类型为非中文文本,确定所针对字段对应的字段长度,将所针对字段对应的字段长度,作为所针对字段对应的水印信息。
在一个实施例中,如图10所示,以邻域内的字段为与文本位置相邻的前一个位置处的字段和后一个位置处的字段为例,对本申请的文本水印生成方法进行说明,该文本水印生成方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。在本申请实施例中,以该方法应用于终端为例进行说明,具体包括以下步骤:
步骤1002:读取原始文本。
步骤1004:计算每个文本字段在原始文本中的出现次数。
具体的,文本字段可以为单字或词语中的一项。终端会先对原始文本进行拆分,得到多个文本字段,再通过对原始文本进行分析,统计多个文本字段各自在原始文本中的出现次数,这有助于从多个文本字段中选择合适的关键字段来生成文本水印。
步骤1006:根据出现次数选择关键字段。
具体的,终端可以根据多个文本字段各自在原始文本中的出现次数,来选择关键字段。举例说明,假设所选取的关键字段的数量为1,则终端会将出现次数最多的文本字段作为关键字段。需要说明的是,选择在原始文本中出现次数较多的文本字段作为关键字段,由于关键字段与原始文本的关联性强,能够使得所生成的关键字段对应的水印信息能贴合原始文本的文本内容,这有助于提高原始文本的文本水印的鲁棒性。
步骤1008:遍历关键字段在原始文本中的每次出现,以生成文本水印。
具体的,终端会确定关键字段在原始文本中出现的至少一个文本位置,针对至少一个文本位置中的每个文本位置,确定所针对文本位置相邻的前一个位置处的字段和后一个位置处的字段各自对应的文本类型,分别生成前一个位置处的字段和后一个位置处的字段各自对应的水印信息,再拼接前一个位置处的字段和后一个位置处的字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。在获得至少一个文本位置各自的邻域对应的水印信息的基础上,按照至少一个文本位置处的关键字段在原始文本中的出现顺序,拼接至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息,基于关键字段对应的水印信息,生成原始文本对应的文本水印。
在具体的应用中,针对前一个位置处的字段,当前一个位置处的字段的文本类型为非中文文本,终端会确定前一个位置处的字段的字段长度,将字段长度作为前一个位置处的字段对应的水印信息。当前一个位置处的字段的文本类型为中文文本,终端会确定前一个位置处的字段的笔画数,将笔画数作为前一个位置处的字段对应的水印信息。
在具体的应用中,针对后一个位置处的字段,当后一个位置处的字段的文本类型为非中文文本,终端会确定后一个位置处的字段的字段长度,将字段长度作为后一个位置处的字段对应的水印信息。当后一个位置处的字段的文本类型为中文文本,终端会确定后一个位置处的字段的笔画数,将笔画数作为后一个位置处的字段对应的水印信息。
在一个具体的应用中,在生成文本水印时,终端初始化有水印列表,用于按照至少一个文本位置处的关键字段在原始文本中的出现顺序,存储至少一个文本位置各自的邻域内的每个字段分别对应的水印信息,即对于每个字段来说,在字段对应的水印信息生成后,终端会将字段对应的水印信息添加至水印列表中。
在一个具体的应用中,以非中文文本为英文为例,对步骤1008中的遍历关键字段在原始文本中的每次出现进行说明,步骤1008主要包括以下步骤:
步骤一:通过查找算法查找关键字段在原始文本中的至少一个文本位置,并初始化水印列表,以存储每个字段对应的水印信息。
步骤二:循环遍历关键字段在原始文本中的每个文本位置,其中,循环遍历次数为关键字段在原始文本中出现的总次数。
具体的,假设关键字段在原始文本中出现的总次数为KWC,则终端会循环遍历KWC次,针对关键字段在原始文本中的每个文本位置,终端会先判断所针对文本位置的前一个位置处的字段的文本类型,根据前一个位置处的字段的文本类型,生成前一个位置处的字段对应的水印信息,再判断所针对文本位置的后一个位置处的字段的文本类型,根据后一个位置处的字段的文本类型,生成后一个位置处的字段对应的水印信息。
在具体的应用中,当前一个位置处的字段是英文,终端会将前一个位置处的字段的字段长度作为该字段对应的水印信息添加至水印列表中。当前一个位置处的字段是中文,终端会将前一个位置处的字段的笔画数作为该字段对应的水印信息添加至水印列表中。当后一个位置处的字段是英文,终端会将后一个位置处的字段的字段长度作为该字段对应的水印信息添加至水印列表中。当后一个位置处的字段是中文,终端会将后一个位置处的字段的笔画数作为该字段对应的水印信息添加至水印列表中。需要说明的是,通过本申请中的文本水印生成方法,所得到的原始文本的文本水印可以是一个数字序列,由关键字段在原始文本中每次出现的前一个字段和后一个字段的长度(字段长度或笔画数)组成。本申请中的文本水印生成方法,可以理解为零水印方法,即这个文本水印并没有直接嵌入到原始文本中,而是可以单独存储,以便在后续进行文本验证。此外,由于在生成原始文本的文本水印时,不会对原始文本本身造成任何改变,能够避免原始文本的文本质量、意义和价值的降低,且充分利用了原始文本的文本内容自身的特点,能够提高文本验证的准确性和鲁棒性,解决了传统方法在纯文本认证和版权保护方面的不足可以在一定程度上保护文本免受恶意篡改的影响,从而确保文本的真实性和完整性。且相较于传统方法,本申请的文本水印生成方法,支持中外文两种模式,可以被广泛应用于各种场景下的文本验证。举例说明,在影视剧拍摄场景下,本申请中的文本水印生成方法可以用于验证剧本是否被篡改。又举例说明,在组织业务场景下,本申请中的文本水印生成方法可以用于验证合同、政策文件等是否被篡改。
在一个实施例中,本申请实施例提供的文本验证方法,可以应用于如图11所示的应用环境中。其中,终端1102通过网络与服务器1104进行通信。数据存储系统可以存储服务器1104需要处理的数据。数据存储系统可以集成在服务器1104上,也可以放在云上或其他服务器上。终端1102获取待验证文本以及待验证文本的文本标识,从服务器1102获取与文本标识关联的注册文本水印和关键字段;其中,注册文本水印和关键字段,是对与文本标识关联的原始文本执行上述文本水印生成方法确定的,采用文本水印生成方法,基于待验证文本和关键字段生成水印,得到待验证文本水印,对待验证文本水印和注册文本水印进行一致性验证,获得对待验证文本的文本验证结果。
其中,终端1102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器1104可以用独立的服务器或者是多个服务器组成的服务器集群或者云服务器来实现。
在一个实施例中,如图12所示,提供了一种文本验证方法,该方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。在本申请实施例中,以该方法应用于终端为例进行说明,包括以下步骤:
步骤1202,获取待验证文本以及待验证文本的文本标识。
其中,待验证文本是指需要被验证是否被修改、编辑过的文本。比如,待验证文本具体可以是指需要被验证是否被修改、编辑过的影视剧本。举例说明,待验证文本具体可以是指需要被验证的拍摄时的影视剧本,相对应的用于验证的文本可以为最初版本的影视剧本,如最初撰写的影视剧本。又比如,待验证文本具体可以是指需要被验证的组织合同。举例说明,待验证文本具体可以是指需要被验证的履行合约时的组织合同,相对应的用于验证的文本可以为签订合约时的组织合同。文本标识是指用于唯一表征待验证文本的标识,通过文本标识可以将待验证文本与其他文本区分开来。比如,文本标识具体可以是指用于唯一表征待验证文本的字符串,可按照实际应用场景进行配置,也可以随机生成。
具体的,在进行文本验证时,终端会先获取待验证文本以及待验证文本的文本标识。
步骤1204,获取与文本标识关联的注册文本水印和关键字段;其中,注册文本水印和关键字段,是对与文本标识关联的原始文本执行上述文本水印生成方法确定的。
其中,文本标识关联的原始文本,是指与文本标识关联的没有被修改、编辑过、可以用于对待验证文本进行验证的文本。比如,文本标识关联的原始文本具体可以为最初版本的影视剧本、签订合约时的组织合同等。与文本标识关联的注册文本水印,是指通过对与文本标识关联的原始文本执行上述文本水印生成方法所生成的、用于对待验证文本进行验证的文本水印。与文本标识关联的关键字段,是指在对与文本标识关联的原始文本执行上述文本水印生成方法的过程中,选取的用于生成注册文本水印的字段,为与文本标识关联的原始文本中的至少一个文本字段。
具体的,在获取待验证文本的文本标识后,终端可以利用文本标识,来获取与文本标识关联的注册文本水印和关键字段,其中,注册文本水印和关键字段,是对文本标识关联的原始文本执行上述文本水印生成方法确定的。在具体的应用中,在对文本标识关联的原始文本执行上述文本水印生成方法后,终端会将文本标识、注册文本水印和关键字段关联存储,则在获取到待验证文本的文本标识后,可以直接获取到与文本标识关联的注册文本水印和关键字段。
步骤1206,采用文本水印生成方法,基于待验证文本和关键字段生成水印,得到待验证文本水印。
具体的,终端会基于关键字段遍历待验证文本,确定关键字段在待验证文本中出现的至少一个目标位置,再根据至少一个目标位置各自的邻域内的字段分别生成水印,获得至少一个目标位置各自的邻域对应的水印信息,基于至少一个目标位置各自的邻域对应的水印信息,生成关键字段对应的水印信息,基于关键字段对应的水印信息,生成待验证文本对应的待验证文本水印。
在具体的应用中,针对至少一个目标位置中的每个目标位置,终端会确定所针对目标位置的邻域内的字段对应的文本类型,根据邻域内的字段对应的文本类型生成水印,获得所针对目标位置的邻域对应的水印信息。在一个具体的应用中,邻域内的字段的数量至少一个,则终端会根据邻域内的至少一个字段各自对应的文本类型,分别生成至少一个字段各自对应的水印信息,再基于至少一个字段各自对应的水印信息,获得所针对目标位置的邻域对应的水印信息。在一个具体的应用中,针对邻域内的至少一个字段中的每个字段,当所针对字段的文本类型为中文文本,终端会确定所针对字段对应的笔画数,将所针对字段对应的笔画数,作为所针对字段对应的水印信息。当所针对字段的文本类型为非中文文本,确定所针对字段对应的字段长度,将所针对字段对应的字段长度,作为所针对字段对应的水印信息。
在具体的应用中,当至少一个字段的数量为多个,终端可以按照至少一个字段在待验证文本中的出现顺序,拼接至少一个字段各自对应的水印信息,来获得所针对目标位置的邻域对应的水印信息。在具体的应用中,当至少一个字段的数量为多个,且至少一个字段各自对应的水印信息为笔画数或字段长度中的一项,终端还可以通过叠加至少一个字段各自对应的水印信息的方式,来获得所针对目标位置的邻域对应的水印信息。
在具体的应用中,在生成关键字段对应的水印信息时,终端会按照至少一个目标位置处的关键字段在待验证文本中的出现顺序,来拼接至少一个目标位置各自的邻域对应的水印信息,生成关键字段对应的水印信息。
步骤1208,对待验证文本水印和注册文本水印进行一致性验证,获得对待验证文本的文本验证结果。
具体的,终端会对待验证文本水印和注册文本水印进行一致性验证,当待验证文本水印和注册文本水印一致,得到表征待验证文本未被篡改的文本验证结果,当待验证文本水印和注册文本水印不一致,得到表征待验证文本被篡改的文本验证结果。
上述文本验证方法,通过获取待验证文本以及待验证文本的文本标识,能够利用文本标识实现对所关联的注册文本水印和关键字段的获取,由于注册文本水印和关键字段,是对与文本标识关联的原始文本执行文本水印生成方法确定的,因此可以利用注册文本水印和关键字段来对待验证文本与原始文本是否一致进行验证,通过采用文本水印生成方法,基于待验证文本和关键字段生成水印,能够实现对待验证文本水印的获取,进而可以通过对待验证文本水印和注册文本水印进行一致性验证,来比对待验证文本与原始文本是否一致,得到对待验证文本的文本验证结果。整个过程,由于待验证文本水印和注册文本水印都是在确定关键字段的基础上通过分析文本内容的方式生成的,而不是以固定方式嵌入的,因此,通过比对待验证文本水印和注册文本水印是否一致,能够实现对待验证文本与原始文本是否一致的准确确定,能够提高文本验证的准确度。
在一个实施例中,如图13所示,以邻域内的字段为与文本位置相邻的前一个位置处的字段和后一个位置处的字段为例,对本申请的文本验证方法进行说明,该文本验证方法具体包括以下步骤:
步骤1302:获取待验证文本、待验证文本的文本标识、与文本标识关联的注册文本水印和关键字段;其中,注册文本水印和关键字段,是对与文本标识关联的原始文本执行上述文本水印生成方法确定的。
步骤1304:计算关键字段在待验证文本中的出现次数。
具体的,终端会对待验证文本进行分析,统计关键字段在待验证文本中的出现次数。
步骤1306:遍历关键字段在待验证文本中的每次出现,生成待验证文本水印。
具体的,终端会确定关键字段在待验证文本中出现的至少一个目标位置,针对至少一个目标位置中的每个目标位置,确定所针对目标位置相邻的前一个位置处的字段和后一个位置处的字段各自对应的文本类型,分别生成前一个位置处的字段和后一个位置处的字段各自对应的水印信息,再拼接前一个位置处的字段和后一个位置处的字段各自对应的水印信息,获得所针对目标位置的邻域对应的水印信息。在获得至少一个目标位置各自的邻域对应的水印信息的基础上,按照至少一个目标位置处的关键字段在待验证文本中的出现顺序,拼接至少一个目标位置各自的邻域对应的水印信息,生成关键字段对应的水印信息,基于关键字段对应的水印信息,生成待验证文本对应的文本水印。
在具体的应用中,针对前一个位置处的字段,当前一个位置处的字段的文本类型为非中文文本,终端会确定前一个位置处的字段的字段长度,将字段长度作为前一个位置处的字段对应的水印信息。当前一个位置处的字段的文本类型为中文文本,终端会确定前一个位置处的字段的笔画数,将笔画数作为前一个位置处的字段对应的水印信息。
在具体的应用中,针对后一个位置处的字段,当后一个位置处的字段的文本类型为非中文文本,终端会确定后一个位置处的字段的字段长度,将字段长度作为后一个位置处的字段对应的水印信息。当后一个位置处的字段的文本类型为中文文本,终端会确定后一个位置处的字段的笔画数,将笔画数作为后一个位置处的字段对应的水印信息。
在一个具体的应用中,在生成待验证文本水印时,终端初始化有水印列表,用于按照至少一个目标位置处的关键字段在待验证文本中的出现顺序,存储至少一个目标位置各自的邻域内的每个字段分别对应的水印信息,即对于每个字段来说,在字段对应的水印信息生成后,终端会将字段对应的水印信息添加至水印列表中。
步骤1308:对待验证文本水印和注册文本水印进行一致性验证。
具体的,终端会对待验证文本水印和注册文本水印进行一致性验证,当待验证文本水印和注册文本水印一致,则认为待验证文本未被篡改,得到表征待验证文本未被篡改的文本验证结果,当待验证文本水印和注册文本水印不一致,则认为待验证文本被篡改,得到表征待验证文本被篡改的文本验证结果。
发明人认为,通过本申请中的文本验证方法,从待验证文本中提取一个待验证文本水印,并将待验证文本水印与注册文本水印进行一致性验证,获得对待验证文本的文本验证结果,整个过程,由于待验证文本水印和注册文本水印都是在确定关键字段的基础上通过分析文本内容的方式生成的,而不是以固定方式嵌入的,因此,通过比对待验证文本水印和注册文本水印是否一致,能够实现对待验证文本与原始文本是否一致的准确确定,能够提高文本验证的准确度。
在一个实施例中,如图14所示,通过一个流程示意图来说明本申请中涉及的文本水印生成方法和文本验证方法。
在文本水印生成阶段,终端会获取原始文本,从原始文本中选取关键字段,确定关键字段在原始文本中出现的至少一个文本位置,根据至少一个文本位置各自的领域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息,基于至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息,基于关键字段对应的水印信息,生成原始文本对应的文本水印,将文本标识、文本水印以及关键字段关联存储。
在文本验证阶段,终端会获取待验证文本以及待验证文本的文本标识,获取与文本标识关联的注册文本水印和关联字段,采用文本水印生成方法,基于待验证文本和关键字段生成水印,得到待验证文本水印,对待验证文本水印和注册文本水印进行一致性验证,获得对待验证文本的文本验证结果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的文本水印生成方法的文本水印生成装置以及文本验证方法的文本验证装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个文本水印生成装置以及文本验证装置实施例中的具体限定可以参见上文中对于文本水印生成方法以及文本验证方法的限定,在此不再赘述。
在一个实施例中,如图15所示,提供了一种文本水印生成装置,包括:关键字段选取模块1502、文本位置确定模块1504、文本位置水印生成模块1506、关键字段水印生成模块1508和文本水印生成模块1510,其中:
关键字段选取模块1502,用于获取原始文本,从原始文本中选取关键字段;
文本位置确定模块1504,用于确定关键字段在原始文本中出现的至少一个文本位置;
文本位置水印生成模块1506,用于根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息;
关键字段水印生成模块1508,用于基于至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息;
文本水印生成模块1510,用于基于关键字段对应的水印信息,生成原始文本对应的文本水印。
上述文本水印生成装置,通过获取原始文本,从原始文本中选取关键字段,确定关键字段在原始文本中出现的至少一个文本位置,根据至少一个文本位置各自的邻域内的字段分别生成水印,获得至少一个文本位置各自的邻域对应的水印信息,能够利用至少一个文本位置各自的邻域内的字段实现邻域对应的水印信息的生成,进而可以利用至少一个文本位置各自的邻域对应的水印信息,实现关键字段对应的水印信息的生成,从而可以基于关键字段对应的水印信息,实现原始文本对应的文本水印的生成。整个过程,利用从原始文本中所选取的关键字段,通过分析原始文本的内容的方式来构造原始文本对应的文本水印,而不是以固定方式向原始文本中嵌入水印信息,保证了文本水印的安全性,由于文本水印不易被破解,通过该文本水印就能够实现准确文本验证,能够支持提高文本验证的准确度。
在一个实施例中,文本位置水印生成模块还用于针对至少一个文本位置中的每个文本位置,确定所针对文本位置的邻域内的字段对应的文本类型,根据邻域内的字段对应的文本类型生成水印,获得所针对文本位置的邻域对应的水印信息。
在一个实施例中,邻域内的字段的数量为至少一个;文本位置水印生成模块还用于根据邻域内的至少一个字段各自对应的文本类型,分别生成至少一个字段各自对应的水印信息,基于至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。
在一个实施例中,文本位置水印生成模块还用于针对邻域内的至少一个字段中的每个字段,当所针对字段的文本类型为中文文本,确定所针对字段对应的笔画数,将所针对字段对应的笔画数,作为所针对字段对应的水印信息。
在一个实施例中,文本位置水印生成模块还用于当所针对字段的文本类型为非中文文本,确定所针对字段对应的字段长度,将所针对字段对应的字段长度,作为所针对字段对应的水印信息。
在一个实施例中,文本位置水印生成模块还用于当至少一个字段的数量为多个,按照至少一个字段在原始文本中的出现顺序,拼接至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。
在一个实施例中,文本位置水印生成模块还用于当至少一个字段的数量为多个,且至少一个字段各自对应的水印信息为笔画数或字段长度中的一项,叠加至少一个字段各自对应的水印信息,获得所针对文本位置的邻域对应的水印信息。
在一个实施例中,关键字段选取模块还用于对原始文本进行拆分,得到多个文本字段,统计多个文本字段各自在原始文本中的出现次数,基于出现次数,从多个文本字段中选取关键字段。
在一个实施例中,关键字段选取模块,用于基于出现次数,对多个文本字段进行排序,得到文本字段排序结果,根据文本字段排序结果,生成字段选择提示;字段选择提示用于指示选择至少一个文本字段作为关键字段,响应于基于字段选择提示反馈的字段选择操作,将字段选择操作所指示的文本字段作为关键字段。
在一个实施例中,关键字段水印生成模块还用于按照至少一个文本位置处的关键字段在原始文本中的出现顺序,拼接至少一个文本位置各自的邻域对应的水印信息,生成关键字段对应的水印信息。
在一个实施例中,如图16所示,提供了一种文本验证装置,包括:文本标识获取模块1602、关联信息获取模块1604、待验证文本水印生成模块1606和水印验证模块1608,其中:
文本标识获取模块1602,用于获取待验证文本以及待验证文本的文本标识;
关联信息获取模块1604,用于获取与文本标识关联的注册文本水印和关键字段;其中,注册文本水印和关键字段,是对与文本标识关联的原始文本执行上述文本水印生成方法确定的;
待验证文本水印生成模块1606,用于采用文本水印生成方法,基于待验证文本和关键字段生成水印,得到待验证文本水印;
水印验证模块1608,用于对待验证文本水印和注册文本水印进行一致性验证,获得对待验证文本的文本验证结果。
上述文本验证装置,通过获取待验证文本以及待验证文本的文本标识,能够利用文本标识实现对所关联的注册文本水印和关键字段的获取,由于注册文本水印和关键字段,是对与文本标识关联的原始文本执行文本水印生成方法确定的,因此可以利用注册文本水印和关键字段来对待验证文本与原始文本是否一致进行验证,通过采用文本水印生成方法,基于待验证文本和关键字段生成水印,能够实现对待验证文本水印的获取,进而可以通过对待验证文本水印和注册文本水印进行一致性验证,来比对待验证文本与原始文本是否一致,得到对待验证文本的文本验证结果。整个过程,由于待验证文本水印和注册文本水印都是在确定关键字段的基础上通过分析文本内容的方式生成的,而不是以固定方式嵌入的,因此,通过比对待验证文本水印和注册文本水印是否一致,能够实现对待验证文本与原始文本是否一致的准确确定,能够提高文本验证的准确度。
上述文本水印生成装置以及文本验证装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,也可以是服务器,以该计算机设备是终端为例,其内部结构图可以如图17所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种文本水印生成以及文本验证方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric RandomAccess Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random AccessMemory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (15)

1.一种文本水印生成方法,其特征在于,所述方法包括:
获取原始文本,从所述原始文本中选取关键字段;
确定所述关键字段在所述原始文本中出现的至少一个文本位置;
根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息;
基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息;
基于所述关键字段对应的水印信息,生成所述原始文本对应的文本水印。
2.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息包括:
针对所述至少一个文本位置中的每个文本位置,确定所针对文本位置的邻域内的字段对应的文本类型;
根据所述邻域内的字段对应的文本类型生成水印,获得所述所针对文本位置的邻域对应的水印信息。
3.根据权利要求2所述的方法,其特征在于,所述邻域内的字段的数量为至少一个;所述根据所述邻域内的字段对应的文本类型生成水印,获得所述所针对文本位置的邻域对应的水印信息包括:
根据所述邻域内的至少一个字段各自对应的文本类型,分别生成所述至少一个字段各自对应的水印信息;
基于所述至少一个字段各自对应的水印信息,获得所述所针对文本位置的邻域对应的水印信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述邻域内的至少一个字段各自对应的文本类型,分别生成所述至少一个字段各自对应的水印信息包括:
针对所述邻域内的至少一个字段中的每个字段,当所针对字段的文本类型为中文文本,确定所述所针对字段对应的笔画数;
将所述所针对字段对应的笔画数,作为所述所针对字段对应的水印信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当所述所针对字段的文本类型为非中文文本,确定所述所针对字段对应的字段长度;
将所述所针对字段对应的字段长度,作为所述所针对字段对应的水印信息。
6.根据权利要求3所述的方法,其特征在于,所述基于所述至少一个字段各自对应的水印信息,获得所述所针对文本位置的邻域对应的水印信息包括:
当所述至少一个字段的数量为多个,按照所述至少一个字段在所述原始文本中的出现顺序,拼接所述至少一个字段各自对应的水印信息,获得所述所针对文本位置的邻域对应的水印信息。
7.根据权利要求3所述的方法,其特征在于,所述基于所述至少一个字段各自对应的水印信息,获得所述所针对文本位置的邻域对应的水印信息包括:
当所述至少一个字段的数量为多个,且所述至少一个字段各自对应的水印信息为笔画数或字段长度中的一项,叠加所述至少一个字段各自对应的水印信息,获得所述所针对文本位置的邻域对应的水印信息。
8.根据权利要求1至7任意一项所述的方法,其特征在于,所述从所述原始文本中选取关键字段包括:
对所述原始文本进行拆分,得到多个文本字段;
统计所述多个文本字段各自在所述原始文本中的出现次数;
基于所述出现次数,从所述多个文本字段中选取关键字段。
9.根据权利要求8所述的方法,其特征在于,所述基于所述出现次数,从所述多个文本字段中选取关键字段包括:
基于所述出现次数,对所述多个文本字段进行排序,得到文本字段排序结果;
根据所述文本字段排序结果,生成字段选择提示;所述字段选择提示用于指示选择至少一个文本字段作为关键字段;
响应于基于所述字段选择提示反馈的字段选择操作,将所述字段选择操作所指示的文本字段作为关键字段。
10.根据权利要求1至7任意一项所述的方法,其特征在于,所述基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息包括:
按照所述至少一个文本位置处的关键字段在所述原始文本中的出现顺序,拼接所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息。
11.一种文本验证方法,其特征在于,所述方法包括:
获取待验证文本以及所述待验证文本的文本标识;
获取与所述文本标识关联的注册文本水印和关键字段;其中,所述注册文本水印和所述关键字段,是对与所述文本标识关联的原始文本执行如权利要求1至10中任一项所述的文本水印生成方法确定的;
采用所述文本水印生成方法,基于所述待验证文本和所述关键字段生成水印,得到待验证文本水印;
对所述待验证文本水印和所述注册文本水印进行一致性验证,获得对所述待验证文本的文本验证结果。
12.一种文本水印生成装置,其特征在于,所述装置包括:
关键字段选取模块,用于获取原始文本,从所述原始文本中选取关键字段;
文本位置确定模块,用于确定所述关键字段在所述原始文本中出现的至少一个文本位置;
文本位置水印生成模块,用于根据所述至少一个文本位置各自的邻域内的字段分别生成水印,获得所述至少一个文本位置各自的邻域对应的水印信息;
关键字段水印生成模块,用于基于所述至少一个文本位置各自的邻域对应的水印信息,生成所述关键字段对应的水印信息;
文本水印生成模块,用于基于所述关键字段对应的水印信息,生成所述原始文本对应的文本水印。
13.一种文本验证方法装置,其特征在于,所述装置包括:
文本标识获取模块,用于获取待验证文本以及所述待验证文本的文本标识;
关联信息获取模块,用于获取与所述文本标识关联的注册文本水印和关键字段;其中,所述注册文本水印和所述关键字段,是对与所述文本标识关联的原始文本执行如权利要求1至10中任一项所述的文本水印生成方法确定的;
待验证文本水印生成模块,用于采用所述文本水印生成方法,基于所述待验证文本和所述关键字段生成水印,得到待验证文本水印;
水印验证模块,用于对所述待验证文本水印和所述注册文本水印进行一致性验证,获得对所述待验证文本的文本验证结果。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
CN202311312018.0A 2023-10-11 2023-10-11 文本水印生成方法和文本验证方法 Active CN117113302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311312018.0A CN117113302B (zh) 2023-10-11 2023-10-11 文本水印生成方法和文本验证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311312018.0A CN117113302B (zh) 2023-10-11 2023-10-11 文本水印生成方法和文本验证方法

Publications (2)

Publication Number Publication Date
CN117113302A true CN117113302A (zh) 2023-11-24
CN117113302B CN117113302B (zh) 2024-02-06

Family

ID=88796690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311312018.0A Active CN117113302B (zh) 2023-10-11 2023-10-11 文本水印生成方法和文本验证方法

Country Status (1)

Country Link
CN (1) CN117113302B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170329943A1 (en) * 2016-05-12 2017-11-16 Markany Inc. Method and apparatus for embedding and extracting text watermark
US20190034601A1 (en) * 2015-12-31 2019-01-31 Arthur Coleman Salting Text in Database Tables, Text Files, and Data Feeds
CN110414194A (zh) * 2019-07-02 2019-11-05 南京理工大学 一种文本水印的嵌入及提取方法
CN115082281A (zh) * 2022-07-01 2022-09-20 深圳市埃德乐科技开发有限公司 一种表单文本防伪水印生成方法、系统及计算机存储介质
CN116524287A (zh) * 2022-01-17 2023-08-01 中国人寿资产管理有限公司 水印去除模型训练样本生成方法、系统、储存介质、计算机

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190034601A1 (en) * 2015-12-31 2019-01-31 Arthur Coleman Salting Text in Database Tables, Text Files, and Data Feeds
US20170329943A1 (en) * 2016-05-12 2017-11-16 Markany Inc. Method and apparatus for embedding and extracting text watermark
CN110414194A (zh) * 2019-07-02 2019-11-05 南京理工大学 一种文本水印的嵌入及提取方法
CN116524287A (zh) * 2022-01-17 2023-08-01 中国人寿资产管理有限公司 水印去除模型训练样本生成方法、系统、储存介质、计算机
CN115082281A (zh) * 2022-07-01 2022-09-20 深圳市埃德乐科技开发有限公司 一种表单文本防伪水印生成方法、系统及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王丽娜: "文本水印嵌入算法的研究", 《中国优秀硕士学位论文全文数据库》信息科技辑, pages 138 - 84 *
王丽娜;唐向宏;张宁;程莎;: "一种基于汉字笔画的文本水印算法", 杭州电子科技大学学报, no. 03, pages 18 - 21 *

Also Published As

Publication number Publication date
CN117113302B (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
CN110245469B (zh) 网页的水印生成方法、水印解析方法、装置及存储介质
CN114020756B (zh) 遥感影像实时地图服务发布方法和装置
CN108536467B (zh) 代码的定位处理方法、装置、终端设备及存储介质
US11790476B2 (en) Method, apparatus, and program for preventing content from leaking out
CN114115844A (zh) 页面生成方法、装置、计算机设备和存储介质
CN115544183A (zh) 数据可视化方法、装置、计算机设备和存储介质
CN117093386B (zh) 页面截图方法、装置、计算机设备和存储介质
CN117113302B (zh) 文本水印生成方法和文本验证方法
CN116883563A (zh) 标注点渲染方法、装置、计算机设备、存储介质
CN116258597A (zh) 单据处理方法、装置、计算机设备和存储介质
CN115118616B (zh) 展示结果测试方法、装置、计算机设备和存储介质
CN118214692B (zh) 业务运行检测方法、装置、计算机设备、存储介质和计算机程序产品
CN115834953A (zh) 特效资源渲染方法、装置、直播系统、设备和存储介质
CN116661921A (zh) 确定金融服务系统的信息展示页面的方法、装置和设备
CN115587074A (zh) 生成特效资源文件的方法、装置、直播系统、设备和介质
CN117975473A (zh) 票据文本检测模型训练及检测方法、装置、设备和介质
CN117612192A (zh) 电子图纸信息识别方法、系统、电子设备、存储介质
CN117729296A (zh) 视频生成方法、装置、计算机设备、存储介质和程序产品
CN117933219A (zh) 文件比对方法、装置、计算机设备和存储介质
CN118153027A (zh) 验证方法、装置、计算机设备、存储介质
CN118332214A (zh) 页面异常处理方法、装置、计算机设备和存储介质
CN118245699A (zh) 页面获取方法、装置、设备、存储介质和计算机程序产品
CN118193396A (zh) 测试方法、装置、计算机设备、存储介质和程序产品
CN117081753A (zh) 口令牌替换方法、装置、计算机设备和存储介质
CN116206014A (zh) 图像预览方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40097747

Country of ref document: HK