LU505793B1

LU505793B1 - Defensive method against interpretability camouflage samples in deep recognition neural networks

Info

Publication number: LU505793B1
Application number: LU505793A
Authority: LU
Inventors: Ming Kang; Xiangxing Tao
Original assignee: Univ Zhejiang Sience & Technology
Priority date: 2023-12-14
Filing date: 2023-12-14
Publication date: 2024-06-14

Claims

REVENDICATIONS

1. Méthode de défense contre les échantillons de camouflage interprétables par un réseau neuronal à reconnaissance en profondeur, caractérisée en ce qu'elle comprend les étapes suivantes : Étape 1, Construction du modèle : Construction d'un modèle de réseau neuronal profond pour la classification d'images ; Étape 2, Détection dans le modèle : Détection des échantillons adverses dans les images du modèle, extraction d'un modèle d'échantillons adverses efficace ; Étape 3, Prétraitement des échantillons : Prétraitement des images d'échantillons adverses dans le modèle ; Étape 4, Détection des échantillons : Comparaison et détection des échantillons adverses prétraités avec les échantillons originaux ; Étape 5, Première simulation de défense : Simulation de première défense basée sur l'expérience d'attaque ; Étape 6, Deuxième simulation de défense : Abstraction de l'attaque, dans la pratique, la méthode d'attaque est considérée comme une opération abstraite avec des contraintes de portée, et le défenseur doit seulement maintenir la précision du modèle dans la portée de l'opération abstraite pour achever la deuxième simulation de défense ; Étape 7, Vérification de l'efficacité : Déploiement du modèle de défense dans le réseau neuronal de reconnaissance en profondeur pour des attaques simulées et vérification.

2. Méthode de défense selon la revendication 1, caractérisée en ce que : le prétraitement de l'étape 3 consiste spécifiquement à comprimer les caractéristiques de l'échantillon entrant pour atténuer les perturbations, à faire des prédictions sur les échantillons avant et après compression, et à identifier les caractéristiques des échantillons adverses basées sur les différences de résultats de prédiction avant et après compression.

3. Méthode de défense selon la revendication 1, caractérisée en ce que : le prétraitement de l'étape 3 consiste spécifiquement à sélectionner les étiquettes de classification d'échantillons à protéger, à entraîner et intégrer des portes piégées correspondant aux étiquettes de protection dans le modèle, et à identifier les échantillons adverses à partir des états d'activation neuronale des échantillons entrants.

4. Méthode de défense selon la revendication 1, caractérisée en ce que : le prétraitement de l'étape 3 consiste spécifiquement en un débruitage d'entrée et un débruitage de caractéristiques, où le débruitage d'entrée consiste, lors de la phase de test du modèle, à traiter les données d'entrée pour tenter d'éliminer partiellement ou totalement les perturbations adverses, et le débruitage de caractéristiques vise à atténuer l'impact des interférences adverses sur les caractéristiques de haut niveau apprises par le DNN.

5. Méthode de défense selon la revendication 1, caractérisée en ce que : la détection comparative de l'étape 4 consiste spécifiquement à utiliser les différentes caractéristiques numériques des échantillons adverses et des échantillons originaux, à savoir la forme de la distribution de probabilités obtenue après le passage des échantillons à travers le réseau, pour détecter si l'entrée correspond à la distribution d'un échantillon normal, afin de déterminer si l'entrée a un caractère adversaire.

6. Méthode de défense selon la revendication 1, caractérisée en ce que : la détection comparative de l'étape 4 consiste spécifiquement à utiliser la sortie de la partie intermédiaire du réseau neuronal profond comme entrée du détecteur, afin de détecter les échantillons adverses.

7. Méthode de défense selon la revendication 1, caractérisée en ce que : la premiere simulation de défense de l'étape 5 consiste spécifiquement à prendre comme condition préalable la destruction des méthodes d'attaque existantes, face à des attaques nouvelles et émergentes qui sont facilement brisées.

8. Méthode de défense selon la revendication 1, caractérisée en ce que : l'expérience d'attaque de l'étape 5 consiste spécifiquement à entraîner un modèle qui est généralement entraîné avec des échantillons normaux, donc, pour rendre le modèle plus robuste, pendant la phase d'entraînement du modèle, générer principalement des échantillons adverses, les intégrer dans la phase d'entraînement pour entraîner le réseau neuronal, afin d'atteindre l'objectif de défense contre les échantillons adverses ; ajouter les échantillons adverses générés au jeu de données d'entraînement pour une augmentation de données, permettant au modèle d'apprendre sur les échantillons adverses pendant l'entraînement.