CN113723506A - 一种对抗样本的生成方法、设备及存储介质 - Google Patents
一种对抗样本的生成方法、设备及存储介质 Download PDFInfo
- Publication number
- CN113723506A CN113723506A CN202111004317.9A CN202111004317A CN113723506A CN 113723506 A CN113723506 A CN 113723506A CN 202111004317 A CN202111004317 A CN 202111004317A CN 113723506 A CN113723506 A CN 113723506A
- Authority
- CN
- China
- Prior art keywords
- target
- sample
- adjustment parameter
- confrontation
- replaced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种对抗样本的生成方法、设备及存储介质,该方法包括:获取与原始语料的目标词向量匹配的至少一个目标调整参数组,并根据目标词向量和每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;进而根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;将各中间对抗样本分别输入至目标识别模型中,得到与原始语料的模型识别结果不一致的中间对抗样本作为原始语料的目标对抗样本。本发明实施例中的技术方案,通过获取与原始语料对应的目标调整参数组,可以自动构建与原始语料对应的替换词集,提升对抗样本的生成效率。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种对抗样本的生成方法、设备及存储介质。
背景技术
对抗样本可以提高机器学习模型的鲁棒性,通过将对抗样本加入至机器学习模型的训练过程,可以有效提升机器学习模型对于对抗样本的抵抗能力。
目前,现有的对抗样本生成算法,主要包括待替换词集构建、替换词集构建及选择和限制条件检测三个步骤。其中,替换词集构建及选择,是对抗样本生成算法的关键步骤,主要包括语义相似和外形相似两种构建方法;现有技术中,通常是选择其中一种构建方法构建替换词集;然而,当对抗样本生成的效果不佳时,需要人工修改替换词集的构建方法,导致对抗样本生成效率较低。
发明内容
本发明实施例提供一种对抗样本的生成方法、设备及存储介质,可以实现根据多个调整维度下的调整权重,自动构建与原始语料对应的替换词集,提升对抗样本的生成效率。
第一方面,本发明实施例提供了一种对抗样本的生成方法,包括:
获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;
根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;
根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;
将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
第二方面,本发明实施例还提供了一种计算机设备,包括处理器和存储器,所述存储器用于存储指令,当所述指令执行时使得所述处理器执行以下操作:
获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;
根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;
根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;
将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
第三方面,本发明实施例还提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的对抗样本的生成方法。
本发明实施例提供的技术方案,通过获取与原始语料的目标词向量匹配的目标调整参数组,并在根据目标词向量确定原始语料对应的待替换词集的基础上,针对每个目标调整参数组,生成与待替换词集匹配的多个替换词集;进而根据各替换词集,生成与原始语料对应的多个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;最终将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本,可以根据多个调整维度下的调整权重,自动构建与原始语料对应的替换词集,提升了对抗样本的生成效率。
附图说明
图1是本发明一实施例提供的一种对抗样本的生成方法的流程图;
图2是本发明另一实施例中的一种对抗样本的生成方法的流程图;
图3A是本发明另一实施例中的一种对抗样本的生成方法的流程图;
图3B是本发明另一实施例中的一种key值生成的流程示意图;
图3C是本发明另一实施例中的一种对抗样本的生成方法的流程示意图;
图3D是本发明另一实施例中的一种目标调整参数组的修正方法的流程示意图;
图3E是本发明另一实施例中的一种调整参数库的更新方法的流程示意图;
图4是本发明另一实施例中的一种对抗样本的生成装置的结构示意图;
图5是本发明另一实施例中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
本文使用的术语“原始语料”可以是自然语言处理语料库中任意选择的语料信息,也可以是经过对语音信号的自然语言理解,或者对文本信息的识别获取的语料信息,本发明实施例对此不作具体限定。
本文使用的术语“目标词向量”可以是原始语料被映射到实数生成的高纬度向量。
本文使用的术语“目标调整参数组”可以是生成对抗样本的调整参数集合,可以是多个调整维度下的调整权重。具体的,目标调整参数组可以是历史调整参数组,也可以是标准调整参数组。
本文使用的术语“待替换词集”可以是原始语料中的至少一个词语组成的词语集合。
本文使用的术语“替换词集”可以是包括与待替换词集中各待替换词语分别对应的替换词语的词语集合,替换词语可以来自于预先建立的词典或者词库,本发明实施例对此不作具体限定。
本文使用的术语“备选对抗样本”可以是采用各替换词集中的各替换词语对原始语料中的对应词语进行替换后,获取的未经过筛选的语料信息。
本文使用的术语“中间对抗样本”可以是从备选对抗样本中筛选的,与原始语料的差异度符合预设差异度条件的对抗样本。
本文使用的术语“目标识别模型”可以是任意类型的机器学习模型,具体的,可以是具有文本信息分类或者情感分析能力的机器学习模型。
本文使用的术语“目标对抗样本”可以是中间对抗样本中,与原始语料的模型识别结果不一致的对抗样本。
图1为本发明一实施例提供的一种对抗样本的生成方法的流程图,本发明实施例可适用于基于目标调整参数组,生成与原始语料对应的对抗样本的情况,该方法可以由计算机设备中的处理器来执行,并一般可集成在计算机设备中。
如图1所示,该方法具体包括如下步骤:
S110、获取与原始语料的目标词向量匹配的至少一个目标调整参数组。
其中,原始语料,为用于进行对抗样本生成的文本信息,可以是自然语言处理语料库中任意选择的语料信息,也可以是经过对语音信号的自然语言理解,或者对文本信息的识别获取的语料信息,本发明实施例对原始语料的获取方式不作具体限定。目标词向量,为将来自原始语料的单词或短语映射到实数生成的向量。
在本实施例中,基于预设的向量生成方法,执行对原始语料的向量生成操作,以获取原始语料对应的目标词向量;可选的,可以通过分词处理模型对原始语料进行分词处理,以获取分词语句,并采用预设的词向量生成算法,对分词语句进行词向量生成处理,以获取分词语句的词向量;进而根据分词语句的词向量,获取原始语料的目标词向量。其中,分词语句可以是单个词语,也可以是包括多个词语的短语。
其中,分词处理模型可以包括N元模型,N元(N-gram)模型,为假设第N个词的出现只与前面第N-1个词相关,且整个分词语句的概率就是各个分词出现概率的乘积;通过N元模型可获取对应最大可能概率的分词语句,实现对原始语料的准确分词。预设的词向量生成算法可以包括Word2Vec方法;Word2Vec,是通过对大量文本语料进行无监督方式学习而获取的神经网络模型,可以采用高维向量对原始语料进行表示。本发明实施例对根据原始语料,获取目标词向量的方式不作具体限定。通过将原始语料转化为对应的可表示语义的词向量,进而将词向量输入至识别模型,可以实现对原始语料的分类或识别。
需要说明的是,在本实施例中,本地预先存储有一定数量的调整参数组,调整参数组可以是历史调整参数组,也可以是预先设置的标准调整参数组。调整参数组中包括至少一个调整维度下的调整权重,且各调整维度的调整权重的和为1,调整权重表示各调整维度下的词语占全部待调整词语的比例;例如,调整参数组包括语义调整权重和外观调整权重,语义调整权重为P1,则对应的外观调整权重为1-P1。在本实施例中,调整维度和各调整维度对应的调整权重可以根据任务需求进行自适应设置。
还需要说明的是,调整参数组可以按照键值对(key-value)的形式进行存储;key值可以为语料词向量转换得到的字符串,可以通过特征压缩算法生成;value为与语料的语义特征对应的调整参数组,以及各调整参数组对应的排序权重,排序权重可以根据预设规则进行设置;例如,可以将按照对应调整参数组成功完成对抗样本生成的次数作为排序权重。由此,在获取到原始语料的目标词向量后,可以根据目标词向量查找匹配的调整参数组;通过采用键值对的形式对调整参数组进行存储,可以提升根据目标词向量,查找匹配目标调整参数组的速度。
本发明实施例的技术方案,通过获取与原始语料匹配的目标调整参数组,可以实现根据对抗样本生成的历史调整参数或者预设调整参数,执行对原始语料的对抗样本生成操作,可以提升对抗样本生成的效率,提升对抗样本的生成准确度。
在本实施例中,可选的,获取与原始语料的目标词向量匹配的至少一个目标调整参数组,可以包括:将目标词向量与至少一个调整参数库的标准词向量进行相似性匹配,并根据匹配结果,判断是否存在与目标词向量对应的目标调整参数库;若是,根据目标调整参数库中包括的各调整参数组的排序权重,在所述目标调整参数库中获取设定数量的目标调整参数组;否则,将预设的至少一个标准调整参数组,确定为所述目标调整参数组。
其中,调整参数库,包括与一个标准词向量对应的至少一个标准调整参数组,调整参数库与标准词向量一一对应。在本实施例中,在获取到目标词向量后,分别计算目标词向量与各调整参数库的标准词向量间的相似度,若确定目标词向量与标准词向量的相似度较高,例如,相似度大于预设相似阈值,则将对应的调整参数库确定为目标调整参数库。值的注意的是,以余弦相似度计算方法为例,其余弦值范围为[-1,1],值越接近于1,表示两个向量的方向越接近,即越相似;而越接近于-1,表示两个向量的方向越远,即越不同。故采用不同的相似度计算方法,其对应的相似度评价标准也不同。
进一步的,根据目标调整数据库中各目标调整参数组的排序权重,按照排序权重从大到小,筛选出预设数量的目标调整参数组,作为当前原始语料匹配的目标调整参数组;预设数量可以根据任务需求进行适应性设置。通过获取与目标词向量相似度较高的标准词向量的调整参数库作为目标调整参数库,可以提升当前原始语料的对抗样本生成的成功概率,进而可以提升对抗样本的获取效率。
对应的,若目标词向量与各标准词向量的相似度均较低,表示数据库中未存储有与目标词向量匹配的调整参数库;此时,获取预设的至少一个标准调整参数组,作为目标词向量对应的目标调整参数组;其中,标准调整参数组,为预先设置的一个固定初始值;以标准调整参数组的调整维度为二维为例,对应的标准调整参数组可以表示为P0=[1.0,0.0]。通过设置标准调整参数组,可以在根据目标词向量无法查找到匹配的目标调整参数库时,基于一个默认的调整参数组生成对抗样本,避免对抗样本生成的盲目进行,可以提升对抗样本的生成效率。
S120、根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集。
其中,待替换词集,为由原始语料中的至少一个词语组成的词语集合;对应的,替换词集,为待替换词集中各待替换词语分别对应的替换词语组成的词语集合。待替换词集中的待替换词语与替换词集中的替换词语一一对应。
具体的,在确定与原始语料匹配的目标调整参数组后,基于重要度排序算法或者可解释机器学习算法对目标词向量进行处理,以在原始语料中获取对语料分类影响程度较高的预设数量词语,作为待替换词语并生成待替换词集,可以提升对抗样本的生成效率。进一步的,根据各目标调整参数中各调整维度的调整权重,确定待替换词集中各调整维度对应的待替换词语的数量,进而基于预先构建的词典或词语库,获取各调整维度下的待替换词语对应的替换词语,并基于各替换词语生成替换词集;其中,替换词集与目标调整参数组一一对应。
此外,可选的,在确定待替换词集之前,针对原始语料中的各词语,在词库中预先获取对应的备选替换词语,备选替换词语可以包括各调整维度下的替换词语;进而在确定待替换词集后,在各待替换词语分别对应的备选替换词语中筛选匹配的替换词语,可以进一步提升对抗样本的生成效率。
在本实施例中,可选的,目标调整参数组可以包括语义调整权重和外观调整权重;其中,语义调整权重,是指待替换词集中语义替换词语占全部词语的比例;语义调整,表示采用与待替换词语含义相近的词语,对待替换词语进行替换;外观调整权重,是指待替换词集中外观替换词语占全部词语的比例,外观调整,表示采用与待替换词语外观相似的词语,对待替换词语进行替换。
对应的,针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集,可以包括:根据各目标调整参数组中的语义调整权重和外观调整权重,确定待替换词集中的语义待替换词语数量;根据语义待替换词语数量,在所述待替换词集中进行随机采样,以获取对应数量的语义待替换词语,以及对应的外观待替换词语;根据粒子群优化算法,获取与各语义待替换词语语音相近的语义替换词语,以及与各外观待替换词语外观相近的外观替换词语,并根据语义替换词语和外观替换词语,生成替换词集。
其中,粒子群优化算法(Particle Swarm Optimization,PSO),是一种基于群体协作的随机搜索算法,可以实现对最优解的快速查找;本实施例通过粒子群优化算法,可以提升最优语义替换词语的查找速度。
具体的,将语义调整权重与语义调整权重和外观调整权重之和的比值,作为语义待替换词语数量与待替换词语数量的比值;并根据当前比值和待替换词语的数量,确定语义待替换词语数量;进而根据语义待替换词语数量,在待替换词集中进行随机采样,获取对应数量的语义待替换词语,并将剩余的待替换词语作为外观待替换词语;最终,根据PSO算法,获取与各待替换词语分别对应的替换词语,并根据各替换词语生成替换词集。例如,目标调整参数组Z=[W语义,W外观],则语义待替换词语的比例为
此外,可选的,在本实施例中,还可以根据各目标调整参数组中的语义调整权重和外观调整权重,先确定出待替换词集中的外观待替换词语数量,进而获取与待替换词集对应的替换词集,本发明实施例对此不作具体限定。
S130、根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本。
具体的,在获取到替换词集后,采用各替换词集中的替换词语,对原始语料中的对应待替换词语进行替换,以获取与原始语料对应的备选对抗样本;备选对抗样本的数量与替换词集的数量一致。进一步的,评估各备选对抗样本与原始语料的差异度,并将差异度符合预设差异度阈值的备选对抗样本作为中间对抗样本。
在本实施例中,可选的,根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本,可以包括:
根据余弦相似度计算方法,获取各备选对抗样本的语义修改程度;并根据外观替换词语数量与备选对抗样本词语数量的比值,确定各备选对抗样本的外观修改程度;根据所述语义修改程度和所述外观修改程度,确定各备选对抗样本的差异度评分;将差异度评分小于或等于预设评分阈值的备选对抗样本,确定为中间对抗样本。
其中,余弦相似度计算方法,是一种通过计算两个向量点积空间夹角的余弦值,判断向量相似性的方法;通过余弦相似度计算方法,对原始语料的目标词向量与各备选对抗样本的备选词向量之间的语义相似度分别进行计算,进而可以用一减去当前语义相似度,以确定各备选对抗样本相对于原始语料的语义修改程度,可以实现对语义修改程度的准确确定。
需要说明的是,在获取到各备选对抗样本的语义修改程度和外观修改程度后,可以基于预设差异度计算方法,对语义修改程度和外观修改程度进行计算,以获取各备选对抗样本的差异度评分;典型的,预设差异度计算方法,可以包括将语义修改程度与语义调整权重相乘,并将外观修改程度与外观调整权重进行相乘,进而将两个乘积进行相加得到差异度评分;例如,语义修改程度为M语义,外观修改程度为M外观,语义调整权重为W语义,外观调整权重为W外观,则差异度评分可以为W语义×M语义+W外观×M外观;或者可以将语义修改程度和外观修改程度进行直接相加,以获取对应的差异度评分。本发明实施例,对根据语义修改程度和外观修改程度,获取差异度评分的方式不作具体限定。
值的注意的是,当获取中间对抗样本的数量为空时,可以返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取至少一个中间对抗样本,可以确保对中间对抗样本的获取。
S140、将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
其中,目标识别模型,为基于机器学习算法构建的文本识别模型,可以实现对输入文本的分类与识别。在本实施例中,预先将原始语料输入至目标识别模型,以获取原始语料的模型识别结果;并在获取到多个中间对抗样本后,将获取的各中间对抗样本输入至目标识别模型,以获取各中间对抗样本的模型识别结果;若中间对抗样本的模型识别结果与原始语料的模型识别结果不一致,表示对抗样本生成成功,将当前中间对抗样本确定为与原始语料对应的目标对抗样本。
在本实施例中,根据原始语料生成的对抗样本,可以用于对目标识别模型的训练,可以提升目标识别模型的鲁棒性,提升目标识别模型对输入文本的识别准确度。
本发明实施例提供的技术方案,通过获取与原始语料的目标词向量匹配的目标调整参数组,并在根据目标词向量确定原始语料对应的待替换词集的基础上,针对每个目标调整参数组,生成与待替换词集匹配的多个替换词集;进而根据各替换词集,生成与原始语料对应的多个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;最终将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本,可以根据多个调整维度下的调整权重,自动构建与原始语料对应的替换词集,提升了对抗样本的生成效率。
本发明又一实施例提供了一种对抗样本的生成方法,本实施例以上述实施例为基础,具体介绍在获取目标对抗样本后,根据目标对抗样本,对调整参数库进行更新。
图2为本发明又一实施例提供的对抗样本的生成方法的流程图,本实施例以上述技术方案为基础,提供了一种对抗样本的生成方法,该方法包括:
S210、获取与原始语料的目标词向量匹配的至少一个目标调整参数组。
其中,目标调整参数组中包括:至少一个调整维度下的调整权重。
S220、根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集。
S230、根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本。
S240、将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
在本实施例中,可选的,在将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果之后,还可以包括:若未能成功获取与原始语料对应的目标对抗样本,则返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至满足结束迭代次数条件。
需要说明的是,尽管预先获取与原始语料对应的多个目标调整参数组,并基于各目标调整参数组,执行对应的对抗样本生成操作,但仍然存在一定的对抗样本生成失败概率;故在检测到获取的目标对抗样本为空,此次对抗样本生成失败时,返回执行S220;具体的,根据各目标调整参数组,重新生成与待替换词集匹配的替换词集;并基于重新生成的替换词集,重新执行对抗样本的生成操作,直至满足结束迭代次数条件。其中,迭代次数条件可以根据任务需求进行自定义设置,例如,迭代次数条件为3次。
值的注意的是,若在迭代次数条件之内,即获取到与原始语料对应的目标对抗样本,则结束对抗样本的生成迭代操作;对应的,若满足结束迭代次数条件后,仍未获取到与原始语料对应的目标对抗样本;此时,基于当前的各目标调整参数组,无法实现对抗样本的成功生成,需要对目标调整参数组进行优化调整。
还需要说明的是,基于相同的目标调整参数组,每次生成的与待替换词集对应的替换词集存在差别,故基于相同的目标调整参数组,执行对抗样本的生成迭代操作,每次迭代可以获取不同的备选对抗样本。
在本实施例的一个可选的实施方式中,在确定满足结束迭代次数条件之后,还可以包括:通过遗传算法,对各目标调整参数组中包括的调整权重进行修正后,返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至成功确定出与原始语料对应的目标对抗样本。
其中,遗传算法,是一种借鉴生物界的进化规律演化而来的随机化搜索方法,具有优秀的全局寻优能力;通过遗传算法,对目标调整参数组中各调整维度的调整权重进行自动修正,可以实现对目标调整参数组的自动优化。
需要说明的是,在满足结束迭代次数条件后,若仍无法获取到对应的目标对抗样本,即在确定根据当前的目标调整参数组,无法成功生成与原始语料对应的目标对抗样本时,通过遗传算法,对当前各目标调整参数组中调整权重进行自动修正。进一步的,根据修正后的各目标调整参数组,重新生成与待替换词集匹配的替换词集,进而重新执行目标对抗样本的生成迭代操作,直至成功获取与原始语料对应的目标对抗样本。
S250、根据各目标对抗样本的差异度,在目标对抗样本中获取差异度最大的差异对抗样本,并确定差异对抗样本对应的目标调整参数组。
在本实施例中,在获取到与原始语料对应的多个目标对抗样本时,可确定基于当前的目标调整参数组,可成功实现对原始语料的对抗样本生成;进一步的,对原始语料与目标调整参数组的映射关系进行存储,以实现在重新获取到原始预料,或者与原始语料相似度较高的语料时,可以采用相同的目标调整参数组,执行对应的对抗样本生成操作,以提升对抗样本的生成效率。
需要说明的是,在对原始语料与目标调整参数组的映射关系进行存储时,为了降低需要存储的数据量,以及避免重复存储;可以根据各目标对抗样本对应的差异度,对各目标对抗样本进行差异度排序,以获取目标对抗样本中差异度最大的差异度对抗样本,并确定生成当前差异对抗样本时,所采用的目标调整参数组。通过在目标对抗样本中获取差异度最大的差异对抗样本,进而只对生成差异对抗样本所采用的目标调整参数组进行存储,可以降低待存储的数据量,同时可以提升根据目标调整参数组生成对抗样本的成功概率。
S260、根据目标词向量,与至少一个调整参数库的标准词向量进行一致性匹配,并根据一致性匹配结果,判断是否存在与目标词向量对应的调整参数库。
在本实施例中,在对原始语料进行存储时,由于调整参数库以键值对的形式进行存储,故首先查找与目标词向量一致的调整参数库的标准词向量,以判断是否已存储有目标词向量对应的调整参数库;若确定查找到一致的标准词向量,则可以将标准词向量对应的调整参数库,确定为目标词向量对应的调整参数库。
S270、若是,则将差异对抗样本对应的目标调整参数组,以及将根据目标调整参数组成功获取目标对抗样本的次数作为对应的排序权重,添加至目标词向量对应的调整参数库中。
其中,在确定目标词向量对应的调整参数库后,由于目标对抗样本与替换词集对应,而替换词集与调整参数组对应;故根据差异对抗样本,可确定对应的目标调整参数组;由此,将差异对抗样本对应的目标调整参数组添加至目标词向量的调整参数库中;同时,将根据目标调整参数组成功获取目标对抗样本的次数,作为目标调整参数组在调整参数库中的排序权重,添加至目标词向量的调整参数库中。
此外,可选的,在将差异对抗样本对应的目标调整参数组添加至目标词向量的调整参数库时,判断调整参数库中是否存在与目标调整参数组相同的标准调整参数组;若确定不存在,则将目标调整参数组添加至各标准调整参数组的最后,并根据排序权重,对差异调整参数库中的各调整参数组进行排序,排序权重高的顺序在前,排序权重低的顺序在后,完成对当前调整参数库的更新;而若确定存在与目标调整参数组相同的标准调整参数组,进一步判断对应的排序权重是否一致,若确定一致,则可以直接放弃对当前目标调整参数组的存储;若确定不一致,可仅对排序权重进行更新。
S280、否则,新建目标词向量对应的,包括差异对抗样本对应的目标调整参数组的调整参数库。
需要说明的是,若确定调整参数库中不存在与目标词向量对应的调整参数库,则新建目标词向量对应的调整参数库,并存储至本地;其中,调整参数库包括生成当前差异对抗样本所使用的目标调整参数组,以及根据当前目标调整参数组成功生成对抗样本的次数。
本发明实施例提供的技术方案,在根据与原始语料的目标词向量匹配的多个目标调整参数组,成功获取到与原始语料对应的目标对抗样本之后,根据各目标对抗样本的差异度,在目标对抗样本中筛选出差异度最大的差异对抗样本,并根据生成差异对抗样本所采用的目标调整参数组,执行调整参数库的更新操作,实现了对调整参数库的更新;进而后续在获取到与原始语料相同或相似度相近的语料输入时,可以使用差异对抗样本对应的目标调整参数组,进行对应的对抗样本生成,可以进一步提升对抗样本的生成效率。
本发明又一实施例提供了一种对抗样本的生成方法,本实施例以上述实施例为基础,具体介绍根据原始语料匹配的多个目标调整参数组,获取与原始语料对应的目标对抗样本,并根据目标对抗样本,进行调整参数库的更新。
图3A为本发明又一实施例提供的对抗样本的生成方法的流程图,本实施例以上述技术方案为基础,提供了一种对抗样本的生成方法,该方法包括:
S310、获取原始语料的目标词向量,执行S320。
在本实施例的一个具体实施方式中,如图3B所示,以数组的形式输入语料库Corpus=[…,“In exit interviews and surveys,the 6%shared their concerns”,“Iwish more business operated like this.these guys were all awesome.veryorganized and pro.”,“The offer of severance tipped them over the edge.”,…],并在语料库中选择原始语料C=“I wish more business operated like this.theseguys were all awesome.very organized and pro.”。
进一步的,采用Word2Vec算法,对原始语料C进行目标词向量生成操作,以获取原始语料C对应的目标词向量。需要说明的是,为了提升匹配目标调整参数组的查找速度,目标调整参数组以树状形式的哈希表进行存储,故在获取到目标词向量之后,可以基于位置敏感哈希(Location Sensitive Hash,LSH)函数,生成与目标词向量对应的key值Kc=[0,1,0,0,0,1,0,1,1,0,1,0,0,1,1,0,1,0,0,1],可以进一步提升根据目标词向量,查找匹配目标调整参数组的速度。
S320、将目标词向量与至少一个调整参数库的标准词向量进行相似性匹配,并根据匹配结果,判断是否存在与目标词向量对应的目标调整参数库。
其中,若是,执行S330;否则,执行S340。
S330、根据目标调整参数库中包括的各调整参数组的排序权重,在所述目标调整参数库中获取设定数量的目标调整参数组,执行S350。
S340、将预设的至少一个标准调整参数组,确定为所述目标调整参数组,执行S350。
S350、根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集,执行S360。
S360、根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本,执行S370。
S370、将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果。
其中,中间对抗样本的模型识别结果存在两种情况:当中间对抗样本的模型识别结果与原始语料的模型识别结果不一致时,执行S380;当中间对抗样本的模型识别结果与原始语料的模型识别结果一致时,执行S3130。
S380、将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本,执行S390。
S390、根据各目标对抗样本的差异度,在目标对抗样本中获取差异度最大的差异对抗样本,并确定差异对抗样本对应的目标调整参数组,执行S3100。
S3100、根据目标词向量,与至少一个调整参数库的标准词向量进行一致性匹配,并根据一致性匹配结果,判断是否存在与目标词向量对应的调整参数库。
其中,若是,则执行S3110;否则,执行S3120。
S3110、将差异对抗样本对应的目标调整参数组,以及将根据目标调整参数组成功获取目标对抗样本的次数作为对应的排序权重,添加至目标词向量对应的调整参数库中。
S3120、新建目标词向量对应的,包括差异对抗样本对应的目标调整参数组的调整参数库。
S3130、判断是否满足结束迭代次数条件。
其中,若是,执行S3140;否则,返回执行S350。
S3140、通过遗传算法,对各目标调整参数组中包括的调整权重进行修正,返回执行S350。
本发明实施例提供的技术方案,在根据初始的目标调整参数组,无法成功获取与原始语料对应的目标对抗样本时,重复执行多次目标对抗样本的生成操作;若在满足结束迭代次数条件时,仍无法成功获取目标对抗样本,则对目标调整参数组进行修正,以获取修正后的目标调整参数组,并基于修正后的目标调整参数组,再次执行目标对抗样本的生成操作,直至获取与原始语料对应的目标对抗样本,可以实现对目标调整参数组的自动修正与优化,进而可以确保目标对抗样本的成功获取;进一步的,根据获取的目标对抗样本,对调整参数库进行更新,可以在获取到相同或相似的原始语料时,采用匹配的目标调整参数组进行对抗样本的生成,可以提升生成对抗样本的成功概率,进而可以提升对抗样本的生成效率。
在本实施例的一个具体实施方式中,如图3C所示,在获取到原始语料的目标词向量的key值Kc后,根据Kc在调整参数库中进行匹配查找;若确定未查找到匹配的标准词向量,将预设的一个标准调整参数组,确定为目标调整参数组。以标准调整参数组包括语义调整权重和外观调整权重为例,标准调整参数组可表示为P0=[W语义,W外观]=[0.5,0.5],则目标词向量对应的目标调整参数组为GP=[P0]=[[0.5,0.5]]。
基于PSO算法,确定原始语料C对应的待替换词集GC待替换=["business","guys"],对于business,构建其对应的语义替换子集为G替换_M_business=["trade","dealing"],对应的外观替换子集为G替换_A_business=["buslness","bussines"];对于guys,构建其对应的语义替换子集为G替换_M_guys=["people","men"],对应的外观替换子集为G替换_A_guys=["goys","guy"]。
由于当前只存在一个目标调整参数组P0,则针对当前目标调整参数组,生成与待替换词集对应的替换词集;值的注意的是,若存在多个目标调整参数组,则分别根据各目标调整参数组,生成多个对应的替换词集。具体的,根据目标调整参数组,确定待替换词集中语义待替换词语的比例为则外观待替换词语的比例为1-0.5=0.5;随机选择待替换词集中的guys进行语义调整,business进行外观调整。按照均匀采样方法,从G替换_M_guys中选择people作为guys的语义替换词,从G替换_A_business中选择bussines作为business的外观替换词,可获取替换词集为GC替换=["bussines","people"]。
进一步的,根据替换词集获取原始语料C对应的备选对抗样本为A_m1=“Iwishmore bussines operated like this.these people were all awesome.very organizedand pro.”,使用Word2Vec算法,得到其词向量为Em1。通过语义修改程度和外观修改程度的加权和S=W语义×M语义+W外观×M外观,计算备选对抗样本与原始语料的差异度评分;其中,通过余弦相似度计算方法,计算得到备选对抗样本的词向量与目标词向量的语义相似度为0.8,则语义修改程度M语义=1-0.8=0.2;通过外观替换词语数量与原始语料词语数量的比值,获取外观修改程度则差异度评分Sm1=0.5×0.2+0.5×0.0625=0.13125,假设预设评分阈值为0.4,则差异度评分小于预设评分阈值,将备选对抗样本确定为中间对抗样本。
以目标识别模型执行的任务为情感分类为例,目标识别模型对原始语料的情感分类为“正面评价”;在获取到中间对抗样本后,将中间对抗样本输入至目标识别模型,若目标识别模型对中间对抗样本的情感分类为“正面评价”,则表示中间对抗样本的情感分类没有发生改变,可确定对抗样本生成失败。
此时,对抗样本生成失败次数为1,以结束迭代次数条件为3为例,失败次数小于结束迭代次数条件,如图3D所示,重新从G替换_M_guys中选择men作为guys的语义替换词,从G替换_A_business中选择buslnes作为business的外观替换词,可获取替换词集为GC替换=["buslnes","men"]。则对应的备选对抗样本为A_m2=“I wish more buslness operatedlike this.these men were all awesome.very organized and pro.”,并采用相同的差异度评分计算方法,可以获取差异度评分Sm2=0.5×0.24+0.5×0.0625=0.15125,小于预设评分阈值,将当前备选对抗样本确定为中间对抗样本。若目标识别模型对当前中间对抗样本的情感分类仍然为“正面评价”,则确定对抗样本生成再次失败,对抗样本生成失败次数为2。
由于对抗样本失败次数仍小于结束迭代次数条件,使用PSO算法重新构建待替换词集GC待替换2=["business","awesome"],对于awesome,新构建其语义替换子集G替换_M_awesome=["wonderful","excellent"],对应的外观替换子集为G替换_A_guys=["avesome","awsome"]。从G替换_A_business中抽取到bussines作为business的外观替换词,从G替换_M_awesome中抽取到wonderful作为awesome的语义替换词,获取备选对抗样本A_m3=“I wish morebussines operated like this.these people were all wonderful.very organizedand pro.”,其对应的差异度评分Sm3=0.5×0.15+0.5×0.0625=0.10625,小于预设评分阈值,将当前备选对抗样本确定为中间对抗样本。若目标识别模型对当前中间对抗样本的情感分类仍然为“正面评价”,则确定对抗样本生成再次失败,对抗样本生成失败次数为3。
此时,对抗样本生成失败次数等于结束迭代次数条件,结束基于当前目标调整参数组的对抗样本生成,并基于遗传算法对目标调整参数组中的调整权重进行修正。假设修正后的目标调整参数组为GP=[[1.0,0.0]],此时,语义待替换词语占待替换词集词语的比例为则对待替换词集中的全部待替换词语进行语音替换,从G替换_M_business中选择trade作为business的语音替换词,从G替换_M_guys中抽取到people作为guys的语义替换词,以获取备选对抗样本A_m4=“I wish more trade operated likethis.these people were all awesome.very organized and pro.”。采用相同的差异度评分计算方法,计算得到当前备选对抗样本的差异度评分为Sm4=1.0×0.10+0.0×0=0.1,小于预设评分阈值,将当前备选对抗样本确定为中间对抗样本。此外,目标识别模型对当前中间对抗样本的情感分类为“负面评价”,与原始语料的情感分类不一致,故可将当前中间对抗样本确定为目标对抗样本,也即目标对抗样本为A_m4=“I wish more tradeoperated like this.these people were all awesome.very organized and pro.”。
需要说明的是,如图3E所示,在确定目标对抗样本之后,根据原始语料的目标词向量获取对应的key值Kc=[0,1,0,0,0,1,0,1,1,0,1,0,0,1,1,0,1,0,0,1],将优化后的目标调整参数组GP和根据GP成功生成对抗样本的次数作为对应的value值,Arraye=[[1.0,0.0]],Arrayw=[1],生成对应的键值对进行存储。
图4为本发明另一实施例提供的一种对抗样本的生成装置的结构示意图。如图4所示,该装置包括:目标调整参数组获取模块410、替换词集获取模块420、中间对抗样本获取模块430和目标对抗样本获取模块440。其中,
目标调整参数组获取模块410,用于获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;
替换词集获取模块420,用于根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;
中间对抗样本获取模块430,用于根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;
目标对抗样本获取模块440,用于将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
本发明实施例提供的技术方案,通过获取与原始语料的目标词向量匹配的目标调整参数组,并在根据目标词向量确定原始语料对应的待替换词集的基础上,针对每个目标调整参数组,生成与待替换词集匹配的多个替换词集;进而根据各替换词集,生成与原始语料对应的多个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;最终将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本,可以根据多个调整维度下的调整权重,自动构建与原始语料对应的替换词集,提升了对抗样本的生成效率。
可选的,在上述技术方案的基础上,目标调整参数组获取模块410,包括:
匹配单元,用于将目标词向量与至少一个调整参数库的标准词向量进行匹配,并根据匹配结果,判断是否存在与目标词向量对应的目标调整参数库;
目标调整参数组获取单元,用于若是,根据目标调整参数库中包括的各调整参数组的排序权重,在所述目标调整参数库中获取设定数量的目标调整参数组;
否则,将预设的至少一个标准调整参数组,确定为所述目标调整参数组。
可选的,在上述技术方案的基础上,目标调整参数组包括语义调整权重和外观调整权重;
替换词集获取模块420,包括:
数量确定单元,用于根据各目标调整参数组中的语义调整权重和外观调整权重,确定待替换词集中的语义待替换词语数量;
词语获取单元,用于根据语义待替换词语数量,在所述待替换词集中进行随机采样,以获取对应数量的语义待替换词语,以及对应的外观待替换词语;
替换词集生成单元,用于根据粒子群优化算法,获取与各语义待替换词语语音相近的语义替换词语,以及与各外观待替换词语外观相近的外观替换词语,并根据语义替换词语和外观替换词语,生成替换词集。
可选的,在上述技术方案的基础上,中间对抗样本获取模块430,包括:
修改程度确定单元,用于根据余弦相似度计算方法,获取各备选对抗样本的语义修改程度;并根据外观替换词语数量与备选对抗样本词语数量的比值,确定各备选对抗样本的外观修改程度;
差异度评分确定单元,用于根据所述语义修改程度和所述外观修改程度,确定各备选对抗样本的差异度评分;
中间对抗样本确定单元,用于将差异度评分小于或等于预设评分阈值的备选对抗样本,确定为中间对抗样本。
可选的,在上述技术方案的基础上,所述对抗样本的生成装置,还包括:
差异对抗样本获取模块,用于根据各目标对抗样本的差异度,在目标对抗样本中获取差异度最大的差异对抗样本,并确定差异对抗样本对应的目标调整参数组;
一致性匹配模块,用于根据目标词向量,与至少一个调整参数库的标准词向量进行一致性匹配,并根据一致性匹配结果,判断是否存在与目标词向量对应的调整参数库;
调整参数库添加模块,用于若是,则将差异对抗样本对应的目标调整参数组,以及将根据目标调整参数组成功获取目标对抗样本的次数作为对应的排序权重,添加至目标词向量对应的调整参数库中;
调整参数库新建模块,用于否则,新建目标词向量对应的,包括差异对抗样本对应的目标调整参数组的调整参数库。
可选的,在上述技术方案的基础上,目标对抗样本获取模块440,还用于若未能成功获取与原始语料对应的目标对抗样本,则返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至满足结束迭代次数条件。
可选的,在上述技术方案的基础上,目标对抗样本获取模块440,包括:
调整权重修正单元,用于通过遗传算法,对各目标调整参数组中包括的调整权重进行修正后,返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至成功确定出与原始语料对应的目标对抗样本。
上述装置可执行本发明前述所有实施例所提供的对抗样本的生成方法,具备执行上述方法相应的功能模块和有益效果。未在本发明实施例中详尽描述的技术细节,可参见本发明前述所有实施例所提供的方法。
图5为本发明另一实施例提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括处理器510、存储器520、输入装置530和输出装置540;计算机设备中处理器510的数量可以是一个或多个,图5中以一个处理器510为例;计算机设备中的处理器510、存储器520、输入装置530和输出装置540可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器520作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明任意实施例中的一种对抗样本的生成方法对应的程序指令/模块(例如,一种对抗样本的生成装置中的目标调整参数组获取模块410、替换词集获取模块420、中间对抗样本获取模块430和目标对抗样本获取模块440)。处理器510通过运行存储在存储器520中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的一种对抗样本的生成方法。也即,该程序被处理器执行时实现:
获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;
根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;
根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;
将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
存储器520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器520可进一步包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置530可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入,可以包括键盘和鼠标等。输出装置540可包括显示屏等显示设备。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述方法。当然,本发明实施例所提供的一种计算机可读存储介质,其可以执行本发明任意实施例所提供的一种对抗样本的生成方法中的相关操作。也即,该程序被处理器执行时实现:
获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;
根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;
根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;
将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述一种对抗样本的生成装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (15)
1.一种对抗样本的生成方法,其特征在于,包括:
获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;
根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;
根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;
将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
2.根据权利要求1所述的方法,其特征在于,获取与原始语料的目标词向量匹配的至少一个目标调整参数组,包括:
将目标词向量与至少一个调整参数库的标准词向量进行相似性匹配,并根据匹配结果,判断是否存在与目标词向量对应的目标调整参数库;
若是,根据目标调整参数库中包括的各调整参数组的排序权重,在所述目标调整参数库中获取设定数量的目标调整参数组;
否则,将预设的至少一个标准调整参数组,确定为所述目标调整参数组。
3.根据权利要求1所述的方法,其特征在于,目标调整参数组包括语义调整权重和外观调整权重;
针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集,包括:
根据各目标调整参数组中的语义调整权重和外观调整权重,确定待替换词集中的语义待替换词语数量;
根据语义待替换词语数量,在所述待替换词集中进行随机采样,以获取对应数量的语义待替换词语,以及对应的外观待替换词语;
根据粒子群优化算法,获取与各语义待替换词语语音相近的语义替换词语,以及与各外观待替换词语外观相近的外观替换词语,并根据语义替换词语和外观替换词语,生成替换词集。
4.根据权利要求1所述的方法,其特征在于,根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本,包括:
根据余弦相似度计算方法,获取各备选对抗样本的语义修改程度;并根据外观替换词语数量与备选对抗样本词语数量的比值,确定各备选对抗样本的外观修改程度;
根据所述语义修改程度和所述外观修改程度,确定各备选对抗样本的差异度评分;
将差异度评分小于或等于预设评分阈值的备选对抗样本,确定为中间对抗样本。
5.根据权利要求1所述的方法,其特征在于,将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本之后,还包括:
根据各目标对抗样本的差异度,在目标对抗样本中获取差异度最大的差异对抗样本,并确定差异对抗样本对应的目标调整参数组;
根据目标词向量,与至少一个调整参数库的标准词向量进行一致性匹配,并根据一致性匹配结果,判断是否存在与目标词向量对应的调整参数库;
若是,则将差异对抗样本对应的目标调整参数组,以及将根据目标调整参数组成功获取目标对抗样本的次数作为对应的排序权重,添加至目标词向量对应的调整参数库中;
否则,新建目标词向量对应的,包括差异对抗样本对应的目标调整参数组的调整参数库。
6.根据权利要求1所述的方法,其特征在于,在将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果之后,还包括:
若未能成功获取与原始语料对应的目标对抗样本,则返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至满足结束迭代次数条件。
7.根据权利要求6所述的方法,其特征在于,在确定满足结束迭代次数条件之后,还包括:
通过遗传算法,对各目标调整参数组中包括的调整权重进行修正后,返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至成功确定出与原始语料对应的目标对抗样本。
8.一种计算机设备,包括处理器和存储器,所述存储器用于存储指令,当所述指令执行时使得所述处理器执行以下操作:
获取与原始语料的目标词向量匹配的至少一个目标调整参数组,目标调整参数组中包括:至少一个调整维度下的调整权重;
根据所述目标词向量,确定原始语料对应的待替换词集,并针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集;
根据各替换词集,生成与原始语料对应的至少一个备选对抗样本;并根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本;
将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果,并将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本。
9.根据权利要求8所述的计算机设备,其特征在于,所述处理器是设置为通过以下方式获取与原始语料的目标词向量匹配的至少一个目标调整参数组:
将目标词向量与至少一个调整参数库的标准词向量进行相似性匹配,并根据匹配结果,判断是否存在与目标词向量对应的目标调整参数库;
若是,根据目标调整参数库中包括的各调整参数组的排序权重,在所述目标调整参数库中获取设定数量的目标调整参数组;
否则,将预设的至少一个标准调整参数组,确定为所述目标调整参数组。
10.根据权利要求8所述的计算机设备,其特征在于,目标调整参数组包括语义调整权重和外观调整权重;所述处理器是设置为通过以下方式针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集:
根据各目标调整参数组中的语义调整权重和外观调整权重,确定待替换词集中的语义待替换词语数量;
根据语义待替换词语数量,在所述待替换词集中进行随机采样,以获取对应数量的语义待替换词语,以及对应的外观待替换词语;
根据粒子群优化算法,获取与各语义待替换词语语音相近的语义替换词语,以及与各外观待替换词语外观相近的外观替换词语,并根据语义替换词语和外观替换词语,生成替换词集。
11.根据权利要求8所述的计算机设备,其特征在于,所述处理器是设置为通过以下方式根据各备选对抗样本与原始语料的差异度,在各备选对抗样本中获取中间对抗样本:
根据余弦相似度计算方法,获取各备选对抗样本的语义修改程度;并根据外观替换词语数量与备选对抗样本词语数量的比值,确定各备选对抗样本的外观修改程度;
根据所述语义修改程度和所述外观修改程度,确定各备选对抗样本的差异度评分;
将差异度评分小于或等于预设评分阈值的备选对抗样本,确定为中间对抗样本。
12.根据权利要求8所述的计算机设备,其特征在于,所述处理器是设置为通过以下方式在将与原始语料的模型识别结果不一致的中间对抗样本,确定为原始语料的目标对抗样本之后,更新调整参数库:
根据各目标对抗样本的差异度,在目标对抗样本中获取差异度最大的差异对抗样本,并确定差异对抗样本对应的目标调整参数组;
根据目标词向量,与至少一个调整参数库的标准词向量进行一致性匹配,并根据一致性匹配结果,判断是否存在与目标词向量对应的调整参数库;
若是,则将差异对抗样本对应的目标调整参数组,以及将根据目标调整参数组成功获取目标对抗样本的次数作为对应的排序权重,添加至目标词向量对应的调整参数库中;
否则,新建目标词向量对应的,包括差异对抗样本对应的目标调整参数组的调整参数库。
13.根据权利要求8所述的计算机设备,其特征在于,所述处理器是设置为通过以下方式在将各中间对抗样本分别输入至目标识别模型中,得到匹配的模型识别结果之后,返回执行替换词集的生成操作:
若未能成功获取与原始语料对应的目标对抗样本,则返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至满足结束迭代次数条件。
14.根据权利要求13所述的计算机设备,其特征在于,所述处理器是设置为通过以下方式在确定满足结束迭代次数条件之后,确定目标对抗样本:
通过遗传算法,对各目标调整参数组中包括的调整权重进行修正后,返回执行针对每个目标调整参数组,生成与待替换词集匹配的至少一个替换词集操作,直至成功确定出与原始语料对应的目标对抗样本。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一所述的对抗样本的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111004317.9A CN113723506B (zh) | 2021-08-30 | 2021-08-30 | 一种对抗样本的生成方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111004317.9A CN113723506B (zh) | 2021-08-30 | 2021-08-30 | 一种对抗样本的生成方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113723506A true CN113723506A (zh) | 2021-11-30 |
CN113723506B CN113723506B (zh) | 2022-08-05 |
Family
ID=78679064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111004317.9A Active CN113723506B (zh) | 2021-08-30 | 2021-08-30 | 一种对抗样本的生成方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723506B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444476A (zh) * | 2022-01-25 | 2022-05-06 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置和计算机可读存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019221293A1 (ja) * | 2018-05-18 | 2019-11-21 | 国立大学法人東京大学 | 画像生成装置、画像生成方法及び画像生成プログラム |
CN111046176A (zh) * | 2019-11-25 | 2020-04-21 | 百度在线网络技术(北京)有限公司 | 对抗样本生成方法、装置、电子设备及存储介质 |
US20200226212A1 (en) * | 2019-01-15 | 2020-07-16 | International Business Machines Corporation | Adversarial Training Data Augmentation Data for Text Classifiers |
CN111444346A (zh) * | 2020-03-31 | 2020-07-24 | 广州大学 | 一种用于文本分类的词向量对抗样本生成方法及装置 |
CN111507093A (zh) * | 2020-04-03 | 2020-08-07 | 广州大学 | 一种基于相似字典的文本攻击方法、装置及存储介质 |
WO2020165935A1 (ja) * | 2019-02-12 | 2020-08-20 | 日本電気株式会社 | モデル構築装置、モデル構築方法、コンピュータプログラム及び記録媒体 |
CN111652267A (zh) * | 2020-04-21 | 2020-09-11 | 清华大学 | 对抗样本的生成方法、装置、电子设备及存储介质 |
CN111783443A (zh) * | 2020-06-29 | 2020-10-16 | 百度在线网络技术(北京)有限公司 | 文本扰动检测方法、扰动还原方法、扰动处理方法和装置 |
CN112364641A (zh) * | 2020-11-12 | 2021-02-12 | 北京中科闻歌科技股份有限公司 | 一种面向文本审核的中文对抗样本生成方法及装置 |
CN112836798A (zh) * | 2021-01-29 | 2021-05-25 | 华中科技大学 | 一种针对场景文字识别的非定向式白盒对抗攻击方法 |
CN112948887A (zh) * | 2021-03-29 | 2021-06-11 | 北京交通大学 | 基于对抗样本生成的社会工程学防御方法 |
-
2021
- 2021-08-30 CN CN202111004317.9A patent/CN113723506B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019221293A1 (ja) * | 2018-05-18 | 2019-11-21 | 国立大学法人東京大学 | 画像生成装置、画像生成方法及び画像生成プログラム |
US20200226212A1 (en) * | 2019-01-15 | 2020-07-16 | International Business Machines Corporation | Adversarial Training Data Augmentation Data for Text Classifiers |
WO2020165935A1 (ja) * | 2019-02-12 | 2020-08-20 | 日本電気株式会社 | モデル構築装置、モデル構築方法、コンピュータプログラム及び記録媒体 |
CN111046176A (zh) * | 2019-11-25 | 2020-04-21 | 百度在线网络技术(北京)有限公司 | 对抗样本生成方法、装置、电子设备及存储介质 |
CN111444346A (zh) * | 2020-03-31 | 2020-07-24 | 广州大学 | 一种用于文本分类的词向量对抗样本生成方法及装置 |
CN111507093A (zh) * | 2020-04-03 | 2020-08-07 | 广州大学 | 一种基于相似字典的文本攻击方法、装置及存储介质 |
CN111652267A (zh) * | 2020-04-21 | 2020-09-11 | 清华大学 | 对抗样本的生成方法、装置、电子设备及存储介质 |
CN111783443A (zh) * | 2020-06-29 | 2020-10-16 | 百度在线网络技术(北京)有限公司 | 文本扰动检测方法、扰动还原方法、扰动处理方法和装置 |
CN112364641A (zh) * | 2020-11-12 | 2021-02-12 | 北京中科闻歌科技股份有限公司 | 一种面向文本审核的中文对抗样本生成方法及装置 |
CN112836798A (zh) * | 2021-01-29 | 2021-05-25 | 华中科技大学 | 一种针对场景文字识别的非定向式白盒对抗攻击方法 |
CN112948887A (zh) * | 2021-03-29 | 2021-06-11 | 北京交通大学 | 基于对抗样本生成的社会工程学防御方法 |
Non-Patent Citations (3)
Title |
---|
MARCO TULIO RIBEIRO 等: "Semantically Equivalent Adversarial Rules for Debugging NLP Models", 《ACL2018》, 31 July 2018 (2018-07-31) * |
仝鑫 等: "面向自然语言处理的深度学习对抗样本综述", 《计算机科学》, vol. 48, no. 1, 31 January 2021 (2021-01-31) * |
徐慧萱 等: "文本对抗样本生成系统的设计与实现", 《数字技术与应用》, vol. 39, no. 1, 31 January 2021 (2021-01-31) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444476A (zh) * | 2022-01-25 | 2022-05-06 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置和计算机可读存储介质 |
CN114444476B (zh) * | 2022-01-25 | 2024-03-01 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113723506B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108287858B (zh) | 自然语言的语义提取方法及装置 | |
CN112464638B (zh) | 一种基于改进谱聚类算法的文本聚类方法 | |
CN107870901B (zh) | 从翻译源原文生成相似文的方法、记录介质、装置以及系统 | |
CN111753060A (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN111985228B (zh) | 文本关键词提取方法、装置、计算机设备和存储介质 | |
CN114492363B (zh) | 一种小样本微调方法、系统及相关装置 | |
CN110688479B (zh) | 一种用于生成式摘要的评估方法及排序网络 | |
CN112819023A (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
WO2021169423A1 (zh) | 客服录音的质检方法、装置、设备及存储介质 | |
CN110895559A (zh) | 模型训练、文本处理方法、装置以及设备 | |
JP2018055670A (ja) | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム | |
CN113723506B (zh) | 一种对抗样本的生成方法、设备及存储介质 | |
CN110991193A (zh) | 一种基于OpenKiWi的翻译矩阵模型选择系统 | |
WO2023134074A1 (zh) | 文本主题的生成方法、装置、设备及存储介质 | |
CN113158667B (zh) | 基于实体关系级别注意力机制的事件检测方法 | |
CN112613293B (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN113919424A (zh) | 文本处理模型的训练、文本处理方法、装置、设备和介质 | |
CN111898339B (zh) | 基于约束解码的古诗生成方法、装置、设备及介质 | |
CN113239683A (zh) | 中文文本纠错方法、系统及介质 | |
CN108304366B (zh) | 一种上位词检测方法及设备 | |
CN112651590B (zh) | 一种指令处理流程推荐的方法 | |
CN113780832B (zh) | 舆情文本评分方法、装置、计算机设备和存储介质 | |
CN111259117B (zh) | 短文本批量匹配方法及装置 | |
CN103744830A (zh) | 基于语义分析的excel文档中身份信息的识别方法 | |
CN110472243B (zh) | 一种中文拼写检查方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |