FR2956933A1 - Circuit integre protege contre une analyse par canal auxiliaire horizontale - Google Patents

Circuit integre protege contre une analyse par canal auxiliaire horizontale Download PDF

Info

Publication number
FR2956933A1
FR2956933A1 FR1000834A FR1000834A FR2956933A1 FR 2956933 A1 FR2956933 A1 FR 2956933A1 FR 1000834 A FR1000834 A FR 1000834A FR 1000834 A FR1000834 A FR 1000834A FR 2956933 A1 FR2956933 A1 FR 2956933A1
Authority
FR
France
Prior art keywords
components
integrated circuit
multiplication
random
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR1000834A
Other languages
English (en)
Inventor
Benoit Jean Feix
Georges Andre Gagnerot
Mylene Roussellet
Vincent Verneuil
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rambus Inc
Original Assignee
Inside Contactless SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inside Contactless SA filed Critical Inside Contactless SA
Priority to FR1000834A priority Critical patent/FR2956933A1/fr
Priority to EP11001428.9A priority patent/EP2365659B1/fr
Priority to EP11001491.7A priority patent/EP2363975B1/fr
Priority to CA2732444A priority patent/CA2732444C/fr
Priority to CA2732651A priority patent/CA2732651C/fr
Priority to CN2011100497307A priority patent/CN102193773A/zh
Priority to CN201110049399.9A priority patent/CN102193060B/zh
Priority to KR1020110018646A priority patent/KR20110099185A/ko
Priority to KR1020110018644A priority patent/KR101792650B1/ko
Publication of FR2956933A1 publication Critical patent/FR2956933A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/60Methods or arrangements for performing computations using a digital non-denominational number representation, i.e. number representation without radix; Computing devices using combinations of denominational and non-denominational quantity representations, e.g. using difunction pulse trains, STEELE computers, phase computers
    • G06F7/72Methods or arrangements for performing computations using a digital non-denominational number representation, i.e. number representation without radix; Computing devices using combinations of denominational and non-denominational quantity representations, e.g. using difunction pulse trains, STEELE computers, phase computers using residue arithmetic
    • G06F7/722Modular multiplication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/002Countermeasures against attacks on cryptographic mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/30Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy
    • H04L9/3006Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy underlying computational problems or public-key parameters
    • H04L9/302Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy underlying computational problems or public-key parameters involving the integer factorization problem, e.g. RSA or quadratic sieve [QS] schemes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/72Indexing scheme relating to groups G06F7/72 - G06F7/729
    • G06F2207/7219Countermeasures against side channel or fault attacks
    • G06F2207/7223Randomisation as countermeasure against side channel attacks
    • G06F2207/7233Masking, e.g. (A**e)+r mod n
    • G06F2207/7238Operand masking, i.e. message blinding, e.g. (A+r)**e mod n; k.(P+R)
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/72Indexing scheme relating to groups G06F7/72 - G06F7/729
    • G06F2207/7219Countermeasures against side channel or fault attacks
    • G06F2207/7223Randomisation as countermeasure against side channel attacks
    • G06F2207/7252Randomisation as countermeasure against side channel attacks of operation order, e.g. starting to treat the exponent at a random place, or in a randomly chosen direction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/60Methods or arrangements for performing computations using a digital non-denominational number representation, i.e. number representation without radix; Computing devices using combinations of denominational and non-denominational quantity representations, e.g. using difunction pulse trains, STEELE computers, phase computers
    • G06F7/72Methods or arrangements for performing computations using a digital non-denominational number representation, i.e. number representation without radix; Computing devices using combinations of denominational and non-denominational quantity representations, e.g. using difunction pulse trains, STEELE computers, phase computers using residue arithmetic
    • G06F7/723Modular exponentiation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Storage Device Security (AREA)

Abstract

L'invention concerne un circuit intégré (CIC2) comprenant une fonction de multiplication (SMT2) configurée pour exécuter une opération de multiplication de deux mots binaires x (a) et y (a, m) comportant une pluralité d'étapes élémentaires de multiplication de composantes xi (ai) du mot x par des composantes yj (aj, mj) du mot y. Selon l'invention, la fonction de multiplication du circuit intégré est configurée pour exécuter deux multiplications successives en modifiant de manière aléatoire ou pseudo-aléatoire l'ordre dans lequel des étapes élémentaires de multiplication des composantes xi par des composantes yj sont exécutées.

Description

CIRCUIT INTEGRE PROTEGE CONTRE UNE ANALYSE PAR CANAL AUXILIAIRE HORIZONTALE
La présente invention concerne un circuit intégré comprenant une fonction de multiplication configurée pour exécuter une opération de multiplication de deux mots binaires x et y en une pluralité d'étapes élémentaires de multiplication de composantes xi du mot x par des composantes yi du mot y.
La présente invention concerne notamment un circuit intégré comprenant une fonction de traitement d'une donnée externe dont l'exécution comprend au moins une étape de branchement conditionnel vers au moins une première étape de multiplication de mots binaires ou une seconde étape de multiplication de mots binaires, le branchement conditionnel étant fonction d'une donnée privée du circuit intégré.
La présente invention concerne notamment un procédé et un système de test d'un tel circuit intégré.
La présente invention concerne également un procédé pour protéger un circuit intégré du type précité contre une analyse par canal auxiliaire et des moyens de contre-mesure permettant à un tel circuit intégré de passer un processus de qualification ou de certification incluant un procédé de test selon l'invention.
On trouve à l'heure actuelle des processeurs sécurisés de plus en plus évolués dans les cartes à puce ou autres systèmes embarqués comme des clefs USB, des décodeurs et des consoles de jeu, et de façon générale toute plate- forme de module sécurisée appelée TPM ("Trusted Platform Module"). Ces processeurs, sous forme de circuits
intégrés, ont généralement des cœurs CISC 8 bits ("Complex Instruction Set Computer") ou des coeurs RISC ("Reduced Instruction Set Computer") de 8, 16 bit ou plus, les processeurs 32 bits étant les plus répandus aujourd'hui. Certains circuits intégrés comportent également des coprocesseurs dédiés à certains calculs cryptographiques, notamment des accélérateurs arithmétiques pour les algorithmes asymétriques tels que RSA, DSA, ECDSA, etc.
La figure 1 représente à titre d'exemple un circuit intégré CIC1 sécurisé agencé sur un support portable HD ("Handheld Device"), par exemple une carte plastique ou tout autre support. Le circuit intégré comprend un microprocesseur MPC, un circuit d'entrée/sortie IOC, des mémoires M1, M2, M3 reliées au microprocesseur par un bus de données et d'adresse et, optionnellement, un coprocesseur CP1 de calcul cryptographique ou accélérateur arithmétique, et un générateur RGEN de nombre aléatoire. La mémoire M1 est une mémoire de type RAM ("Random Access Memory") contenant des données d'application volatiles. La mémoire M2 est une mémoire non volatile, par exemple une mémoire EEPROM ou Flash, contenant des programmes application. La mémoire M3 est une mémoire morte ou mémoire ROM ("Read Only Memory") contenant le système d'exploitation du microprocesseur ("Operating System").
Le circuit d'interface de communication IOC peut être du type à contact, par exemple selon la norme ISO/IEC 7816, du type sans contact à couplage inductif, par exemple selon la norme ISO/IEC 14443A/B ou ISO/IEC 13693, du type sans contact par couplage électrique (circuit d'interface UHF), ou à la fois du type à contact et sans contact (circuit intégré dit "combi"). Le circuit d'interface I0C
représenté sur la figure à titre d'exemple est un circuit d'interface sans contact à couplage inductif équipé d'une bobine d'antenne ACl pour recevoir un champ magnétique FLD. Le champ FLD est émis par un lecteur de carte RD qui est lui-même équipé d'une bobine d'antenne AC2. Le circuit I0C comprend des moyens de réception et de décodage de données DTr émises par le lecteur RD et des moyens de codage et d'émission de données DTx fournies par le microprocesseur MPC. Il peut comprendre également Io des moyens pour extraire du champ magnétique FLD une tension Vcc d'alimentation du circuit intégré et un signal d'horloge CK.
Dans certains modes de réalisation, le circuit intégré 15 CIC1 peut être configuré pour exécuter des opérations de chiffrement, de déchiffrement ou de signature de messages m qui lui sont envoyés, au moyen d'une fonction de cryptographie basée sur l'exponentiation modulaire utilisant une clé secrète d et un module cryptographique 20 n, par exemple une fonction de cryptographie RSA.
Rappels concernant l'exponentiation modulaire
La fonction d'exponentiation modulaire a pour expression 25 mathématique :
md modulo(n),
m étant une donnée d'entrée, d un exposant et n un 30 diviseur. La fonction d'exponentiation modulaire consiste donc à calculer le reste de la division par n de m à la puissance d.
Une telle fonction est utilisée par divers algorithmes de 35 cryptographie, tels que l'algorithme RSA ("Rivest, Shamir
et Adleman"), l'algorithme DSA ("Digital Signature Algorithm"), ECDH ("Elliptic Curve Diffie Hellman"), ECDSA ("Elliptic Curve Digital Signature Algorithm"), ElGamal, etc. La donnée m est alors un message à chiffrer et l'exposant d est une clé privée.
Elle peut être implémentée au moyen de l'algorithme suivant (exponentiation modulaire selon la méthode de Barrett) : Io Algorithme d'exponentiation Entrée "m" et" n" des entiers tels que m < n "d" un exposant de v bits tel que d = (dV-1 dv-2. do) 2 15 Sortie : a = md modulo n Étape 1 : a = 1 Étape 2 : Pré-calculs de la réduction de Barrett Étape 3 : pour s allant de 1 à v faire : (Étape 3A) a = BRED(LIM(a,a),n) 20 (Etape 3B) si dv_5 1 alors BRED (LIM (a, m) , n) Étape 4 : Retourner résultat a
dans lequel le message m et le module n sont des grands 25 entiers (par exemple de 1024 bits, 2048 bits ou plus), d est l'exposant de v bits exprimé en base 2 d,-2, do), "LIM" est la fonction de multiplication de grands entiers ("Long Integer Multiplication") et "BRED" une fonction de réduction selon la méthode de Barrett 30 ("Barrett REDuction") appliquée au résultat de la multiplication LIM.
Dans un circuit intégré tel que celui représenté sur la figure 1, un tel algorithme d'exponentiation modulaire 35 peut être exécuté par le microprocesseur MP ou par le
coprocesseur CP1. Alternativement, certaines étapes de l'algorithme peuvent être exécutées par le microprocesseur tandis que d'autres sont exécutées par le coprocesseur, si celui-ci est simplement un accélérateur mathématique. Par exemple les multiplications LIM des étapes 3A et 3B peuvent être "sous-traitées" par le microprocesseur au coprocesseur, mais le calcul entier de l'exponentiation modulaire peut également être sous-traité au coprocesseur, selon les cas. io Par ailleurs, la multiplication LIM de a par a (Étape 3A) ou de a par m (Étape 3B) est généralement exécutée par le circuit intégré au moyen d'une fonction de multiplication de mots binaires x et y qui comprend une pluralité 15 d'étapes élémentaires de multiplication de composantes xi (ai) du mot x par des composantes yi (agi ou mi) du mot y, i et j étant des indices d'itération, pour obtenir des résultats intermédiaires qui sont concaténés pour former le résultat général de la multiplication. 20 Rappels concernant l'analyse par canal auxiliaire
Afin de vérifier le niveau de sécurité qu'offre un circuit intégré sécurisé destiné à être commercialisé, 25 des tests de qualification ou de certification sont prévus au stade industriel, comprenant notamment des tests de la robustesse du circuit intégré face à des analyses par canal auxiliaire ("Side Channel Analysis") visant à découvrir les données secrètes du circuit 30 intégré.
L'algorithme d'exponentiation est donc sujet à de tels contrôles. Plus particulièrement, l'analyse par canal auxiliaire de l'algorithme d'exponentiation modulaire 35 consiste en une déduction bit à bit de la valeur de
l'exposant par l'observation du "comportement" du circuit intégré lors de l'exécution de l'étape 3 de l'algorithme, à chaque itération de rang s de cette étape. Cette observation vise à déterminer si l'étape 3 considérée comprend l'étape 3A seulement ou comprend l'étape 3A suivie de l'étape 3B.
Dans le premier cas, on en déduit que le bit dV_s de l'exposant est égal à O. Dans le second cas, on en déduit que le bit d,_s est égal à 1. En procédant étape par étape, pour chaque itération de s=1 allant à s = v, on peut en déduire tous les bits dv_5 de l'exposant pour s allant de 1 à v-1. Par exemple, lors des premières itérations de l'algorithme d'exponentiation, la suite d'opérations :
LIM(a,a), LIM(a,m)
révèle que le premier bit de l'exposant est 1, tandis que 20 la suite d'opérations
LIM(a,a ) LIM(a,a)
permet de savoir que le premier bit de l'exposant est O. Pour connaître le bit suivant de l'exposant, il faut déterminer la nature des opérations suivantes. Par exemple, si ces opérations sont 30 LIM(a,a) LIM(a,m) LIM(a,a) LIM(a,m) ou LIM(a,a) LIM(a,a) LIM(a,m 25
les deux dernières opérations LIM(a,a) LIM(a,m) révèlent que le deuxième bit de l'exposant vaut 1. Inversement, dans la suite d'opérations suivantes : LIM(a,a) LIM(a,m) LIM(a,a) LIM(a,a) LIM(a,a) LIM(a,m) LIM(a,a) LIM(a,a)
la troisième opération LIM(a,a) révèle que le deuxième bit de l'exposant vaut 0 car elle est suivie de l'opération LIM(a,a) et n'est pas suivie de l'opération LIM(a,m).
Ainsi, la découverte des bits de l'exposant nécessite de lever des indéterminations sur les étapes de branchement conditionnel qu'exécute le circuit intégré en fonction de ces bits. L'observation de la consommation de courant du circuit intégré permet généralement de lever ces indéterminations.
Rappels concernant l'analyse par canal auxiliaire basée sur l'observation de la consommation de courant
Un composant électronique comprend généralement des milliers de portes logiques qui commutent différemment en fonction des opérations exécutées. Ces commutations créent des variations de consommation de courant de très courte durée, par exemple de quelques nanosecondes, qui sont mesurables. Notamment, les circuits intégrés réalisés avec la technologie CMOS comprennent des portes logiques constituées de transistor de polarisation à l'état haut PMOS ("pull-up") et de transistors de polarisation à l'état bas NMOS ("pull clown") ayant une très grande impédance d'entrée sur leur borne de contrôle de grille. Ces transistors ne consomment du courant entre leurs bornes de drain et de source que lors de leur commutation, correspondant au passage à 1 ou à o d'un nœud logique. Ainsi, la consommation de courant dépend des données manipulées par le microprocesseur et de ses différents périphériques : mémoire, données circulant sur s le bus de données ou d'adresse, accélérateur cryptographique, etc.
En particulier, l'opération de multiplication de longs entiers LIM possède une signature en consommation de 10 courant caractéristique et différente des opérations logiques ordinaires. De plus, l'opération LIM(a,a) se distingue de l'opération LIM(a,m) en ce qu'elle consiste à calculer un carré (a2) tandis que LIM(a,m) consiste à calculer le produit de a par m, ce qui peut conduire à 15 deux signatures en consommation de courant différentes.
Les procédés de test par canal auxiliaire classiques, basés sur l'observation de la consommation de courant, comprennent les procédés SPA ("Single Power Analysis"), 20 DPA ("Differential Power Analysis"), CPA ("Correlation Power Analysis") et Big Mac.
L'analyse SPA
25 Les procédés de test par analyse SPA ont été divulgués par Kocher (Réf. 1) (Les références des publications citées sont fournies en dernière page de la présente description). L'analyse SPA ne nécessite normalement que l'acquisition d'une seule courbe de consommation de 3o courant. Elle vise à obtenir de l'information sur l'activité du circuit intégré en observant la partie de la courbe de consommation correspondant à un calcul cryptographique, puisque la courbe de courant varie suivant les opérations exécutées et les données 35 manipulées.
Dans un premier temps, l'analyse SPA permet d'identifier les calculs effectués et les algorithmes implémentés par le circuit intégré. On capture d'abord une courbe générale de consommation de courant du circuit intégré au moyen d'un système de test qui mesure sa consommation de courant. Dans le cas d'un circuit intégré exécutant un calcul d'exponentiation modulaire, on peut ensuite repérer au sein de cette courbe générale de consommation so de courant des courbes de consommation correspondant à l'exécution des multiplications LIM(a,a) et LIM(a,m) à chaque itération de rang s de l'algorithme, comme illustré sur la figure 2. On distingue dans cette courbe de consommation des courbes Co, Cl, C3,.. CSD .. . 15 Chaque courbe de consommation Cs, est constituée de points de consommation mesurés avec une fréquence d'échantillonnage déterminée, pouvant être supérieure ou égale à la fréquence de l'horloge du circuit intégré. 20 Chaque courbe de consommation correspond à une "ss.eme" itération de l'étape 3 de l'algorithme d'exponentiation. La relation entre le rang s' de chaque courbe de consommation Cs, et le nombre de fois "s" où l'étape 3 de l'algorithme d'exponentiation a déjà été exécutée (y 25 compris l'exécution correspondant à la courbe Cs. considéré) est donnée par la relation :
= s + H (dV-1, d~-2 . . . . d~ s 1
3o si la courbe Cs, correspond à l'exécution de l'étape 3A, ou par la relation :
s ' s + H (dV-1, du-2 . . . . dv S-1) + 1 35 si la courbe Cs, correspond à l'exécution de l'étape 3B. La relation entre s' et s est donc fonction du poids de Hamming H (dv_1r dv_2.... dti_s_1) de la partie de l'exposant s d déjà utilisée au cours des étapes précédentes du calcul d'exponentiation. Comme le poids de Hamming représente le nombre de bits à 1 de la fraction d'exposant considérée, s' est par exemple égal à s ou à s+1 si les bits dv_1, dv_ dv_s_1 déjà utilisés de l'exposant sont tous égaux à 10 zéro. Comme autre exemple, s' est égal à 2s ou à 2s+1 si les bits dv_i, dV_2.... dv_s_1 sont tous égaux à 1.
Une analyse SPA "idéale" devrait permettre de déterminer si chaque courbe C5 est relative au calcul de la 15 multiplication LIM(a,a) ou de la multiplication LIM(a,m), par la seule observation de la forme de ces courbes, ce qui permettrait d'en déduire la valeur de chaque bit de l'exposant, suivant la méthode déductive rappelée plus haut. Toutefois, pour prévenir une telle fuite 20 d'information ("leakage"), les circuits intégrés sécurisés de dernière génération sont équipés de contre-mesures qui brouillent leur consommation de courant.
Ainsi, l'analyse SPA permet généralement d'identifier les 25 calculs effectués et les algorithmes implémentés par un circuit intégré, et de repérer, sur la courbe générale de consommation du circuit intégré, la portion de courbe relative au calcul d'exponentiation modulaire, mais ne permet pas vérifier des hypothèses sur l'opération 30 précise que le circuit intégré exécute.
Des techniques d'analyse statistique, telles que les procédés DPA ("Differential Power Analysis") ou CPA ("Correlation Power Analysis"), ont donc été développées pour identifier la nature des opérations pendant lesquelles l'exposant est manipulé.
L'analyse DPA
Divulguée par Kocher, Jaffe et Jun (Réf. 2) et très étudiée depuis, l'analyse DPA peut permettre de retrouver la clé secrète d'un algorithme de cryptographie grâce à l'acquisition de nombreuses courbes de consommation. 10 L'application de cette technique la plus étudiée jusqu'à ce jour concerne l'algorithme DES, mais cette technique s'applique aussi à d'autres algorithmes de chiffrement, déchiffrement ou signature et notamment au calcul d'exponentiation modulaire. 15 L'analyse DPA consiste en un classement statistique de courbes de consommation de courant, pour trouver l'information recherchée. Elle repose sur le postulat que la consommation d'un circuit intégré de technologie CMOS 20 varie lorsqu'un bit passe de 0 à 1 dans un registre ou sur un bus, et ne varie pas lorsqu'un bit reste égal à 0, reste à égal 1 ou passe de 1 à 0 (décharge de la capacité parasite du transistor MOS). Alternativement, il peut être considéré que la consommation d'un circuit intégré 25 de technologie CMOS varie lorsqu'un bit passe de 0 à 1 ou passe de 1 à o et ne varie pas lorsqu'un bit reste égal à 0 ou reste égal à 1. Cette seconde hypothèse permet d'utiliser les fonctions classiques "distance de Hamming" ou "poids de Hamming" pour élaborer un modèle de 30 consommation qui ne nécessite pas de connaître la structure du circuit intégré pour être applicable.
L'analyse DPA vise à amplifier cette différence de consommation grâce à un traitement statistique portant 35 sur de nombreuses courbes de consommation, visant à faire
ressortir une corrélation entre les courbes consommation mesurée et les hypothèses formulées.
Au cours de la phase d'acquisition de ces courbes de consommation, un système de test applique M messages aléatoires mo, ml, m2, ... , mr. . . mM_1 au circuit intégré, et fait en sorte que le circuit intégré calcule la transformée du message au moyen de sa fonction de cryptographie (ce qui est implicite ou nécessite l'envoi au circuit intégré d'une commande de chiffrage appropriée).
Comme illustré sur la figure 3, on collecte ainsi M courbes de consommation de courant C (mo) , C (ml) , C (m2) ... , C (mr) , ... , C (mM_l) . Chacune de ces courbes de consommation résulte des opérations que le circuit intégré exécute pour transformer le message au moyen de la fonction d'exponentiation modulaire, mais peut également résulter d'autres opérations que le circuit intégré peut exécuter en même temps.
Au sein de ces courbes de consommation, on isole, grâce à une analyse SPA, des courbes de consommation C5'(mo), Cs' (ml) , C s' (m2) ... , C5' (mr) r r Cs' (mM-1) , correspondant à des étapes d'exécution de l'algorithme d'exponentiation modulaire. Comme indiqué plus haut, chaque courbe de rang s' correspond à la "sième" exécution de l'étape 3 de l'algorithme, pour l'un des M messages, et met en jeu un bit de l'exposant d dont on cherche à déterminer la valeur.
Au cours d'une phase de traitement statistique, le système de test estime la consommation de courant théorique HW(d,_5, mr) du circuit intégré à l'étape du calcul considérée. Cette estimation de consommation est
faite pour au moins l'une des deux valeurs possibles du bit recherché ds de l'exposant. Le système de test est par exemple configuré pour estimer la consommation théorique qu'implique l'exécution de la fonction LIM(a,m), et ce pour toutes les valeurs mr du message m utilisées pendant l'acquisition. Cette consommation théorique est par exemple estimée en calculant le poids de Hamming du résultat attendu au terme de l'exécution de l'opération correspondant à l'hypothèse considérée.
Sur la base de cette estimation de consommation de courant, le système de test classe les courbes de consommation en deux groupes GO et G1 : - GO = {courbes Cs' (mr) correspondent à une faible consommation du circuit intégré à l'étape s considérée}, G1 = {courbes Cs' (mr,) qui devraient correspondre à une forte consommation du circuit intégré à l'étape s considérée}.
Le système de test calcule ensuite la différence des moyennes des courbes des groupes GO et G1, pour obtenir une courbe résultante, ou courbe différentielle statistique.
Si un pic de consommation apparaît sur la courbe différentielle statistique, à l'endroit choisi pour l'estimation de la consommation de courant, le système de test en déduit que l'hypothèse sur la valeur du bit d,_5 est exacte, l'opération exécutée par l'algorithme d'exponentiation modulaire est donc ici LIM(a,m). Si aucun pic de consommation n'apparaît, la différence des moyennes ne fait pas ressortir de différence de consommation significative (on obtient un signal assimilable à du bruit), et le système de test peut soit considérer que l'hypothèse complémentaire est vérifiée (d,_5=0, l'opération exécutée est LIM(a,a)), soit procéder d'une manière similaire pour vérifier cette hypothèse.
s L'analyse DPA présente l'inconvénient d'être complexe à mettre en oeuvre et de nécessiter la capture d'un très grand nombre de courbes de consommation de courant. De plus, il existe des contre-mesures hardwares telle que la prevision d'un balancement d'horloge ("jitter"), la lo génération de bruit de fond, etc., qui rendent souvent nécessaires la prévision d'étapes de traitement préalable du signal (recalage, synchronisation, réduction du bruit...) sur les courbes de consommation de courant dont on fait l'acquisition. Le nombre de courbes de 1s consommation de courant à acquérir pour l'obtention de résultats fiables dépend également de l'architecture du circuit intégré étudié, et peut être de l'ordre du millier à la centaine de milliers de courbes.
20 L'analyse CPA
L'analyse par corrélation dite CPA ("Correlation Power Analysis") a été divulguée par Brier, Clavier et Olivier (Réf. 3). Les auteurs proposent un modèle linéaire de 25 consommation de courant en supposant que le passage d'un bit de 1 à 0 consomme le même courant que le passage d'un bit de 0 à 1. Les auteurs proposent en outre de calculer un coefficient de corrélation entre, d'une part, les points de consommation mesurée qui forment les courbes de 30 consommation capturées et, d'autre part, une valeur estimée de consommation, calculée à partir du modèle de consommation linéaire et d'une hypothèse sur l'opération qu'exécute le circuit intégré.
Les figures 4 et 5 illustrent un exemple d'analyse CPA appliquée à l'algorithme d'exponentiation modulaire. Dans cet exemple, le système de test cherche à savoir si à la 5ième itération de l'étape 3 de l'algorithme d'exponentiation modulaire, l'opération qui est exécutée après l'opération LIM(a,a) est de nouveau l'opération LIM(a,a) (soit l'étape 3A de l'itération s+l suivante) ou l'opération LIM(a,m) (soit l'étape 3B de l'itération de rang s).
Comme représenté sur la figure 4, le système de test capture M courbes de consommation de courant CS'(mr) (Cs' (m0) , Cs' (m1) , • • • , cs (mr) r • • • , c1 (mM) ) relatives à la même itération de l'algorithme, chacune correspondant à un message mr (mo, m1...mr...mM_l) qui a été envoyé au circuit intégré. Chaque courbe CS'(mr) comprend E points de consommation de courant Wo, W1, W2, .. , Wi,.. r WE-1 formant un premier ensemble de points. Les points d'une même courbe Cs' (mr) sont associés à une estimation de la consommation de courant.
A cet effet, la consommation de courant HW est par exemple modélisée comme suit : W = kl*H(D R) + k2
"R" étant un état de référence du registre de calcul du circuit intégré, "D" étant la valeur du registre à la fin de l'opération considérée, kl étant un coefficient de proportionnalité et k2 représentant le bruit et/ou un courant consommé qui n'est pas lié à H (D © R), la fonction "H" étant la distance de Hamming entre les valeurs R et D du registre, soit le nombre de bits différents entre D et R ("O" désignant la fonction Ou Exclusif).
Selon une approche simplificatrice, la valeur de référence R du registre est choisie égale à 0, de sorte que le calcul du point de consommation de courant estimée revient à calculer le poids de Hamming (nombre de bit à 1) du résultat de l'opération considérée. Ce résultat est par exemple "a*m" pour l'hypothèse considérée. Il en découle que le point de consommation estimée HW est égal à H(a*m). L'hypothèse sur l'opération exécutée, par lo exemple LIM(a,m), est donc transformée en une estimation de consommation de courant HW calculée en appliquant ce modèle de consommation linéaire.
Comme illustré sur la figure 4, le système de test 15 regroupe ensuite les différents points Wk de consommation de courant formant chaque courbe Cs, dans des ensembles de points transversaux verticaux VEk (VE0, VE1, VE2,..., VEk,... VEE_1) qui comprennent chacun les points Wk de même rang k de chacune des courbes Cs', chaque ensemble 20 transversal vertical VEk étant repéré sur la figure par des traits pointillés verticaux contenant donc un nombre de points égal au nombre M de courbes utilisées pour l'analyse.
25 A chaque point Wk d'un ensemble transversal vertical VEk est associé un point HWk de consommation de courant estimée, qui correspond à l'estimation de consommation associée à la courbe C5,(mr) auquel le point appartient, calculée de la manière indiquée plus haut. 30 Pour chaque ensemble vertical transversal VEk, le système de test calcule ensuite un coefficient de corrélation linéaire vertical VCk entre les points Wk de l'ensemble considéré et points HWk de consommation estimée qui leur 35 sont associés. Ce coefficient de corrélation est par
exemple égal à la covariance entre l'ensemble des points de consommation mesurée Wk de l'ensemble VEk et les points de consommation estimée HWk associés à ces points de consommation mesurée, divisé par le produit des écarts type respectifs de ces deux ensembles de points. Ainsi, à chaque ensemble de points transversal vertical VEk est associé un coefficient de corrélation vertical VCk correspondant à l'hypothèse évaluée.
Io Comme illustré sur les figures 5A, 5B, le système de test obtient ainsi un ensemble de coefficients de corrélation verticale VCo, VC1i ... , VCk, ... , VCE_1) qui forme une courbe de corrélation verticale VCC1 qui infirme l'hypothèse ou qui forme une courbe de corrélation 15 verticale VCC2 qui confirme l'hypothèse. La courbe VCC2 présente un ou plusieurs pics de corrélation marqués (valeurs de la covariance normalisée proches de +1 ou - 1), indiquant ainsi que l'hypothèse sur l'opération est juste. La courbe VCC1 ne comporte pas de pic de 20 corrélation. Si la courbe de corrélation VCC2 est obtenue, le programme en déduit que le circuit intégré effectuait l'opération LIM(a,m) lorsque les courbes C5, (mo) à Cs (mM_1) ont été capturées, et en déduit donc que le bit d, de l'exposant d'exponentiation modulaire 25 vaut 1.
Le procédé Big Mac
Le procédé Big Mac a été divulgué par Colin D. Walter 30 (Réf. 4, Réf 5). Ce procédé se base sur l'atomicité de la multiplication de grands entiers, mentionnée plus haut, à savoir le fait que l'exécution d'une opération de multiplication de deux grands entiers comprend l'exécution d'une pluralité de multiplications
élémentaires xi*y3 de composantes xi et yi des opérandes x et y objet de la multiplication.
Le procédé Big Mac comprend des étapes consistant à - combiner des sous-courbes de consommation correspondant aux multiplications élémentaires xi*yj pour un xi donné fixe et pour un indice j variable, puis - calculer la valeur moyenne des points de ces sous-courbes pour obtenir une sous-courbe résultante qui reflète les propriétés de xi de manière plus marquée que les propriétés de y], - former un dictionnaire avec des sous-courbes moyennées, - par la suite, identifier au moyen du dictionnaire de nouvelles sous-courbes issues de multiplications suivantes, pour en déduire la valeur des opérandes manipulés par les opérations de multiplication suivantes.
Synthèse des procédés de test connus Comme cela vient d'être vu, les procédés DPA et CPA nécessitent l'acquisition de nombreuses courbes de consommation de courant. Bien que les procédés CPA soient plus efficaces que les procédés DPA et ne nécessitent généralement qu'une centaine ou quelques centaines de courbes de consommation contre un millier à la centaine de milliers de courbes pour les procédés DPA, le nombre de courbes à acquérir pour mettre en œuvre un procédé CPA ne peut être considéré comme négligeable.
Les procédés DPA et CPA peuvent par ailleurs être contrés par des contre-mesures consistant à masquer le message m et/ou masquer l'exposant d au moyen de mots aléatoires. On a vu en effet que l'hypothèse de consommation liée à l'opération LIM(a,m) nécessite de connaître le message m pour calculer son poids de Hamming. Un masquage du
message au moyen d'une donnée aléatoire ne permet plus d'associer une valeur de consommation estimée à une valeur de consommation mesurée, pour calculer le coefficient de pondération.
Enfin, le procédé Big Mac s'avère délicat à mettre en oeuvre et nécessite une bonne connaissance de l'architecture du circuit intégré pour élaborer un dictionnaire comprenant les modèles nécessaires à sa mise en œuvre. Les résultats obtenus ont été estimés peu satisfaisants et le procédé ne semble pas faire l'objet d'applications pratiques connues.
L'invention vise un procédé de test de circuit intégré par canal auxiliaire applicable notamment mais non exclusivement au calcul d'exponentiation modulaire, qui soit simple à mettre en œuvre et nécessite un nombre réduit de courbes de consommation de courant, ou toute autre grandeur physique représentative de l'activité du circuit intégré.
La présente invention vise également un procédé de test par canal auxiliaire applicable à un circuit intégré exécutant une opération de multiplication de deux mots binaires x et y comprenant une pluralité d'étapes élémentaires de multiplication de composantes xi par des composantes yj des mots x et y.
La présente invention vise également un procédé de test par canal auxiliaire destiné à être intégré dans un processus industriel de qualification ou de certification de circuits intégrés, pour vérifier leur robustesse à des attaques par canal auxiliaire et leur étanchéité aux fuites d'information.35 La présente invention concerne également des moyens de contre-mesure permettant à un circuit intégré d'être considéré comme apte à être utilisé, au terme d'un processus de qualification ou de certification incluant un procédé de test selon l'invention.
Plus particulièrement, des modes de réalisation de l'invention concernent un circuit intégré comprenant une fonction de multiplication configurée pour exécuter une 10 opération de multiplication d'au moins deux mots binaires x et y en une pluralité d'étapes élémentaires de multiplication de composantes xi du mot x par des composantes yj du mot y, i et j étant des variables d'itération, dans lequel la fonction de multiplication 15 est configurée pour exécuter deux multiplications successives de mots binaires x et y en modifiant de manière aléatoire ou pseudo-aléatoire l'ordre dans lequel des étapes élémentaires de multiplication des composantes xi par des composantes yj sont exécutées. 20 Selon un mode de réalisation, la fonction de multiplication est configurée pour modifier de manière aléatoire ou pseudo-aléatoire l'ordre dans lequel les composantes xi sont multipliées aux composantes yj sans 25 modifier l'ordre dans lequel les composantes yj sont multipliées aux composantes xi, ou vice-versa.
Selon un mode de réalisation, la fonction de multiplication est configurée pour modifier de manière 3o aléatoire ou pseudo-aléatoire à la fois l'ordre dans lequel les composantes xi sont multipliées aux composantes yj et l'ordre dans lequel les composantes yj sont multipliées aux composantes xi.
Selon un mode de réalisation, la fonction de multiplication comprend des moyens pour générer ou recevoir un nombre binaire aléatoire ou pseudo-aléatoire, et pour exécuter la pluralité d'étapes élémentaires de multiplication de composantes xi par des composantes yi, en ce qui concerne au moins l'une des variables d'itération i ou j, selon un ordre déterminé par le nombre binaire aléatoire ou pseudo-aléatoire.
lo Selon un mode de réalisation, la fonction de multiplication est également configurée pour randomiser au moins l'une des composantes xi ou yj au moyen d'au moins un mot aléatoire ou pseudo-aléatoire.
1s Selon un mode de réalisation, la fonction de multiplication comprend un mode de fonctionnement ordonné dans lequel les variables d'itération sont incrémentées ou décrémentées selon un ordre constant d'une multiplication de mots binaires à l'autre, et un mode de 20 fonctionnement désordonné dans lequel au moins d'une des variables d'itération est incrémentée ou décrémentée de manière aléatoire ou pseudo-aléatoire d'une multiplication de mots binaires à l'autre.
25 Selon un mode de réalisation, la fonction de multiplication est exécutée par un circuit à logique câblée cadencé par un séquenceur.
Selon un mode de réalisation, le circuit intégré comprend 30 une fonction de traitement d'une donnée externe dont l'exécution comprend au moins une étape de branchement conditionnel vers au moins une première étape de multiplication de mots binaires par la fonction de multiplication ou une seconde étape de multiplication de 35 mots binaires par la fonction de multiplication, le
branchement conditionnel étant fonction d'une donnée privée du circuit intégré.
Selon un mode de réalisation, la fonction de traitement de données est une fonction d'exponentiation modulaire, la donnée privée étant un exposant de la fonction d'exponentiation modulaire.
Selon un mode de réalisation, la fonction de traitement de données est une fonction de cryptographie incluant une fonction d'exponentiation modulaire, la donnée privée étant un exposant de la fonction d'exponentiation modulaire formant une clé privée de la fonction de cryptographie.
Des modes de réalisation de l'invention concernent également un dispositif comprenant un circuit intégré selon l'invention, agencé sur un support.
Des modes de réalisation de l'invention concernent également un procédé pour protéger contre une analyse par canal auxiliaire un circuit intégré configuré pour exécuter une opération de multiplication d'au moins deux mots binaires x et y en une pluralité d'étapes élémentaires de multiplication de composantes xi du mot x par des composantes yj du mot y, i et j étant des variables d'itération, le procédé comprenant une étape consistant à modifier de manière aléatoire ou pseudoaléatoire l'ordre dans lequel le circuit intégré exécute 3o des étapes élémentaires de multiplication des composantes xi par des composantes yj, d'une opération de multiplication de mots binaires à l'autre.
Selon un mode de réalisation, le procédé comprend une 3s étape consistant à modifier de manière aléatoire ou
pseudo-aléatoire l'ordre dans lequel le circuit intégré multiplie les composantes xi aux composantes yj, sans modifier l'ordre dans lequel les composantes yj sont multipliées aux composantes xi, ou vice-versa.
Selon un mode de réalisation, le procédé comprend une étape consistant à modifier de manière aléatoire ou pseudo-aléatoire à la fois l'ordre dans lequel le circuit intégré multiplie les composantes xi aux composantes yj et l'ordre dans lequel le circuit intégré multiplie les composantes yj aux composantes xi.
Selon un mode de réalisation, le procédé comprend les étapes consistant à générer un nombre binaire aléatoire ou pseudo-aléatoire au sein du circuit intégré, et faire exécuter par le circuit intégré la pluralité d'étapes élémentaires de multiplication de composantes xi par des composantes yi selon un ordre déterminé par le nombre binaire aléatoire ou pseudo-aléatoire, en ce qui concerne au moins l'une des variables d'itération i ou j.
Selon un mode de réalisation, le procédé comprend en outre une étape consistant à faire randomiser par le circuit intégré au moins l'une des composantes xi ou yj au moyen d'au moins un mot aléatoire ou pseudo-aléatoire.
Selon un mode de réalisation, le procédé est appliqué à la protection d'un circuit intégré comprenant une fonction de traitement d'une donnée externe dont 3o l'exécution comprend au moins une étape de branchement conditionnel vers au moins une première étape de multiplication de mots binaires ou au moins une seconde étape de multiplication de mots binaires, le branchement conditionnel étant fonction d'une donnée privée du 35 circuit intégré.
Des modes de réalisation du procédé de test selon l'invention et de contre-mesures correspondantes seront décrits dans ce qui suit à titre non limitatif, en s relation avec les dessins annexés parmi lesquels : - la figure 1 précédemment décrite représente une architecture classique de circuit intégré sécurisé, - la figure 2 précédemment décrite représente une courbe de consommation de courant du circuit intégré pendant Io l'exécution d'un calcul d'exponentiation modulaire, - la figure 3 précédemment décrite représente des courbes de consommation de courant utilisées pour conduire une analyse DPA ou CPA de type classique, - la figure 4 précédemment décrite représente plus en is détail des courbes de consommation de courant utilisées pour conduire une analyse CPA classique, - les figures 5A, 5B représentent schématiquement des courbes de corrélation fournies par une analyse CPA classique, 20 - la figure 6 représente schématiquement un circuit conçu pour exécuter un algorithme classique de multiplication, - la figure 7 représente schématiquement un exemple de réalisation d'un système de test selon l'invention, - la figure 8 représente une courbe de consommation de 25 courant comprenant des sous-courbes de consommation de courant utilisées par le système de test pour mettre en oeuvre le procédé selon l'invention, - la figure 9 est une vue plus détaillée des sous-courbes de consommation de courant et illustre une étape du 30 procédé selon l'invention, - la figure 10 est un tableau de valeurs estimées d'une grandeur physique associées à des points des sous-courbes de la figure 9,
les figures 11A, 11B représentent schématiquement deux courbes de corrélation générées par un mode de réalisation du procédé de test selon l'invention, - les figures 12A, 12B et 12C représentent respectivement deux courbes moyennées et une courbe de corrélation générées par un autre mode de réalisation du procédé de test selon l'invention, - la figure 13 représente schématiquement un circuit multiplieur conçu pour exécuter un algorithme de lo multiplication selon l'invention, et - la figure 14 représente une architecture de circuit intégré sécurisé comprenant un moyen de contre-mesure selon l'invention.
15 Caractéristiques générales du procédé de l'invention
Des modes de réalisation du procédé de test selon l'invention reposent sur un examen détaillé de la consommation de courant d'un circuit intégré pendant 20 l'exécution des étapes 3A et 3B de l'algorithme d'exponentiation, décrit plus haut, et plus particulièrement l'observation de sa consommation de courant pendant l'exécution de la multiplication LIM au cours de chacune de ces étapes 3A et 3B. 25 Le procédé selon l'invention se base sur le fait qu'en pratique, ces multiplications de grands entiers LIM(a,a) et LIM(a,m) ne sont pas faites en une seule étape en raison de la taille des mots binaire acceptés par 30 l'organe qui effectue ces multiplications. L'organe qui exécute la multiplication est par exemple l'unité arithmétique et logique du microprocesseur, un coprocesseur ou un coprocesseur accélérateur mathématique. La taille réduite de l'organe de calcul 35 nécessite de faire appel à un algorithme de calcul LIM(x,y) qui "découpe" les grands entiers x et y en composantes de plus petite taille, telles que :
x = (x1_1 xi-2.... xo) b Y= (Yz1Y12.... yo)b
xl-1, XI-2.... X0 et Ys 1, Y1-2.... yo étant les composantes des opérandes x et y en base "b", chaque composante comprenant N bits, la base b étant égale à 2N, par lo exemple b=232 pour un organe de calcul acceptant des opérandes de N=32 bits.
Ce fractionnement des opérandes en 1 parties égales fait que la multiplication comprend 12 opérations de 15 multiplications élémentaires, si la multiplication est faite selon la méthode scolaire. Le tableau 1 ci-dessous donne la relation entre la taille G des opérandes x et y, la taille N de leurs composantes xi, yj, le nombre 1 de composantes xi, y3 pour former un opérande, et le nombre 20 12 de multiplications élémentaires xi*y: que comprend l'exécution de la fonction LIM, pour quelques exemples caractéristiques d'architectures de circuits intégrés.
TABLEAU 1 Taille G des Taille N des Nombre 1 de Nombre 12 de opérandes x, composantes composantes multiplications y xi, y~ xi, y~ par élémentaires opérande xi*y~ pour (1=G/N) obtenir x*y 2048 bits 32 bits 64 4096 2048 bits 64 bits 32 1024 1536 bits 32 bits 48 2304 1536 bits 64 bits 24 576 1024 bits 32 bits 32 4096 1024 bits 64 bits 16 256 A chaque opération de multiplication élémentaire xi*yi exécutée par l'algorithme de multiplication LIM correspond ainsi une sous-courbe de consommation de courant Cij, et ces sous-courbes forment ensemble la courbe de consommation de courant de l'étape 3A ou de l'étape 3B de l'algorithme d'exponentiation.
Le procédé selon l'invention prévoit d'appliquer à de lo telles sous-courbes des étapes de traitement statistique transversal horizontal, pour vérifier une hypothèse concernant les variables objet de la multiplication, et par là vérifier une hypothèse concernant un branchement conditionnel conduisant à exécuter l'opération de 15 multiplication avec ces variables. Le procédé ne nécessite que l'acquisition d'une seule courbe de consommation, en adressant un seul message m à un circuit intégré.
20 Exemple de contexte de mise en œuvre du procédé de l'invention
Les modes de réalisation du procédé qui seront décrits dans ce qui suit visent à déterminer l'exposant 25 secret utilisé par un circuit intégré pendant un calcul d'exponentiation modulaire. Le circuit intégré est par exemple le circuit intégré classique CIC1 décrit plus haut en relation avec la figure 1. Le calcul d'exponentiation modulaire est par exemple exécuté selon 30 l'algorithme suivant, déjà décrit plus haut
Algorithme d'exponentiation Entrée : et" n" des entiers tels que m < n 35 "d" un exposant de v bits tel que d = (du-1 dv-2.... do)2
Sortie : a = md modulo n Étape 1 : a = 1 Étape 2 : Pré-calculs de la réduction de Barrett Étape 3 : pour s allant de 1 à v faire : (Etape 3A) a = BRED(LIM(a,a),n) (Etape 3B) si dt,_5 = 1 alors a BRED(LIM(a,m),n) Étape 4 : Retourner résultat a
Io Comme indiqué plus haut, la découverte de l'exposant d nécessite de déterminer si l'étape 3 de l'algorithme ne comprend que l'étape 3A ou comprend au contraire l'étape 15 3A suivi itération (s=v), le avec une de l'étape 3B. En commençant par la première de l'étape 3 (s=1) et jusqu'à la dernière procédé selon l'invention permet de déterminer, seule courbe de consommation de courant, si l'opération exécutée par le microprocesseur ou le coprocesseur est LIM(a,a) ou de type LIM(a,m) en se basant sur les sous-courbes de consommation correspondant 20 à des multiplications élémentaires intervenant dans l'exécution de la multiplication LIM.
Il sera également supposé dans ce qui suit, toujours à titre d'exemple de mise en œuvre du procédé, que 25 l'opération de multiplication LIM intervenant dans l'exécution de l'algorithme d'exponentiation modulaire est exécutée selon la méthode scolaire, soit la forme d'exécution la plus couramment utilisée de la multiplication de grands entiers, par exemple au moyen de 30 l'algorithme suivant :
Algorithme LIM - Multiplication LIM (méthode scolaire) Entrées : x = x1-2,... xo) b 35 y Y1-2.. . . yo) b Sortie : R = LIM (x, y) = x* y = (R21_1 R21_2. Ro) b Étape 1 Pour i allant de 0 à 21-1 faire Ri = 0 Étape 2 : Pour i allant de 0 à 1-1 faire : c û 0 pour j allant de 0 à 1-1 faire : u lv ù (Ri+j + xi *yj) + c Ri+J * v et c •- u Ri+1 v Étape 3 Retourner(R)
Dans lequel "1" désigne la concaténation des variables intermédiaires u et v.
Ainsi, les 12 étapes de calcul itératives faisant intervenir les composantes xi, y3 des grands entiers x, y permettent d'obtenir 21 résultats intermédiaires R21_1, R212,... . Ro de N bits chacun qui sont concaténés dans un 20 registre de sortie pour former le résultat final de la multiplication de x par y.
Pour fixer les idées, la figure 6 représente un exemple de multiplieur hardware SMT1 prévu pour effectuer la 25 multiplication LIM de deux opérandes x et y selon l'algorithme ci-dessus. L'architecture du multiplieur est l'image de l'algorithme. Le multiplieur SMT1 comprend ainsi des tampons d'entrée BX, BY recevant des opérandes x et y de G bits, un tampon de sortie BR fournissant le 30 résultat R, un multiplieur MULT à deux entrées de N bits et une sortie de 2N bits, un additionneur AD ayant une entrée de 2N bits, deux entrées de N bits et une sortie de 2N bits, un registre de sortie de 2N bits comprenant deux registres concaténés Ru et Rv de N bits chacun, pour 35 recevoir les variables intermédiaires u et v de lo 15
l'algorithme, un registre Rc pour recevoir le report de somme c de l'algorithme. Un séquenceur SM1, par exemple une machine d'états, fournit des signaux de contrôle t1, t2,..., t9, tlO,...tn de ces divers éléments, et est configuré pour exécuter l'algorithme sur réception d'une commande STM ("Start Multiplication").
Le tampon BX comprend 1 registre de N bits recevant chacun l'une des composantes xl_l, x1_2i ... , x0 de X. Le Io tampon BY comprend 1 registre de N bits recevant chacun l'une des composantes Y1-2, yo de y. Le tampon de sortie BR comprend 21 registres de N bits recevant chacun l'une des composantes R21_1, R21_2i Ro du résultat de la multiplication de x par y. Des 15 multiplexeurs MX1, MX2 contrôlés par le séquenceur SM1 permettent d'appliquer l'une des composantes xi sur une entrée du multiplieur et l'une des composantes yi sur l'autre entrée du multiplieur, celui-ci fournissant le résultat xi*yi sur 2N bits. La sortie de 2N bits du 20 multiplieur MULT est reliée à l'entrée de 2N bits de l'additionneur AD. N premiers bits de la sortie de 2N bits de l'additionneur AD sont appliqués à l'entrée du registre Ru et les N autres bits sont appliqués à l'entrée du registre Rv. La sortie du registre Rv est 25 appliquée à l'entrée de l'un des registres Ri+i du tampon BR par l'intermédiaire d'un démultiplexeur DMX contrôlé par le séquenceur SM1. La sortie de l'un des registres Ri+j du tampon BR est appliquée sur une entrée de N bits de l'additionneur par l'intermédiaire d'un multiplexeur 30 MX3 contrôlé par le séquenceur SM1. L'autre entrée de N bits de l'additionneur est reliée à la sortie du registre Rc, dont l'entrée est reliée à la sortie du registre Ru. Le séquenceur SM1 contrôle l'écriture et la lecture de ces divers registres, pour l'exécution de l'algorithme. 35
Avant l'application de la commande STM, les données à multiplier a et a ou a et m sont enregistrées dans les tampons BX et BY en tant qu'opérandes x et y, selon que l'opération à exécuter est LIM(a,a) ou LIM(a,m). Dans le premier cas, les registres xi du tampon BX reçoivent des composantes ai_l, a1_2, ... , ao de a et les registres y3 du tampon BY reçoivent ces mêmes composantes. Dans le second cas, les registres xi du tampon BX reçoivent les composantes a1_1, ai_2i ... , ao de a et les registres y3 du tampon BY reçoivent des composantes m1_1, MI-2r ..., mo de m.
Acquisition de sous-courbes de consommation de courant La figure 7 illustre un exemple de système de test de circuit intégré prévu pour mettre en oeuvre le procédé selon l'invention. Il sera supposé à titre d'exemple que le système de test est configuré pour tester le circuit intégré sans contact CIC1 de la figure 1.
Le système de test comporte un lecteur de carte à puce RD, ici un lecteur sans contact, une sonde de mesure PB reliée à un dispositif de mesure MD tel un oscilloscope numérique, pour acquérir les courbes de consommation du circuit intégré, et un moyen de calcul tel un ordinateur personnel PC. L'ordinateur est relié au dispositif de mesure et au lecteur de carte RD et met en ouvre un programme de test Ce programme de test comprend notamment un programme pour communiquer avec le circuit intégré et lui adresser des messages, un programme de traitement de signal et un programme pour mettre en oeuvre des étapes de calcul du procédé selon l'invention.
La sonde PB peut-être une sonde de courant (par exemple 35 une résistance placée sur la borne d'alimentation Vcc du circuit intégré), ou une sonde électromagnétique reliée au dispositif de mesure par un amplificateur de signal AMP. Alternativement, une sonde de courant peut être combinée à une sonde électromagnétique. L'étude des s rayonnements électromagnétiques EMA ("Electromagnetic Analysis") montre en effet qu'un rayonnement électromagnétique émis par un circuit en fonctionnement donne une information sur les commutations de bits dans le circuit intégré, à l'image de la mesure du courant 10 consommé. L'avantage d'une sonde électromagnétique est qu'elle peut être placée à proximité de la partie de circuit dont on veut analyser le fonctionnement (par exemple à proximité du coeur du microprocesseur ou du coprocesseur de calcul cryptographique). 15 Par ailleurs, dans le cas d'un circuit intégré sans contact, la sonde de courant peut être remplacée par une sonde inductive qui mesure l'absorption, par le circuit intégré, du champ magnétique émis par le lecteur. Une 20 telle sonde inductive, par exemple une bobine d'antenne, peut elle-même être combinée avec une sonde de champ électromagnétique placée à proximité des zones de circuit à étudier.
25 Ainsi, dans la présente demande, le terme "consommation de courant", utilisé dans un souci de simplification du langage, désigne toute grandeur physique mesurable dont les variations sont représentatives des commutations de données binaires au sein du circuit intégré ou au sein ou 30 de la partie du circuit intégré étudiée, la grandeur physique pouvant être mesurée aux bornes du circuit intégré ou à proximité de la partie étudiée du circuit intégré.
La fréquence d'échantillonnage de la grandeur physique doit par ailleurs être suffisamment élevée pour collecter plusieurs points par sous-courbe, par exemple de 3 à 100 points par sous-courbe en pratique, mais il peut être envisagé de collecter jusqu'à plusieurs milliers de points par sous-courbe.
Comme représenté sur la figure 8, l'analyse fine de la courbe de consommation de courant Cs lors de l'exécution de chaque itération de l'étape 3 de l'algorithme d'exponentiation fait donc apparaître des sous-courbes de consommation de courant correspondant chacune à l'exécution de l'étape 3A ou de l'étape 3B de l'algorithme LIM. L'identification du groupe de sous- courbes au sein de la courbe générale de consommation de courant est faite en faisant appel dans un premier temps à un technique classique d'analyse SPA. La première identification est faite manuellement, pendant une phase de mise au point du programme de test, les identifications suivantes peuvent être automatisées en fournissant au programme de test un point de repère temporel pour le repérage des sous-courbes.
Une fois cette première étape passée, le programme de 25 test dispose des sous-courbes suivantes :
Co,o = sous-courbe de consommation du calcul ao*ao ou ao*mo, Co,1 = sous-courbe de consommation du calcul ao*al ou ao*ml Co 1_1 = sous-courbe de consommation du calcul ao*a1_1 ou ao*m1_1
C1,o = sous-courbe de consommation du calcul al*ao ou al*mo 35 C1,1 = sous-courbe de consommation du calcul al*a1 ou al*ml 30 011_1 = sous-courbe de consommation du calcul ai*a1_1 ou ai*mi-1 Ci,o = sous-courbe de consommation du calcul ai*ao ou ai*mo Ci,l = sous-courbe de consommation du calcul ai*a1 ou ai*ml
011_1 = sous-courbe de consommation du calcul ai*a1_1 ou ai*m1_1 C1_1,o sous-courbe de consommation du calcul ai_1*ao ou a1-1*mo C1_1 1 = sous-courbe de consommation du calcul a1_1*al ou al_ 1*m1 15 C1_11_l = sous-courbe de consommation du calcul al_1*al_1 ou a1-1*ml-1
Le programme de test dispose donc de 12 sous-courbes Co,o 20 à C1_1 1_1 (Cf. tableau 1). Le programme de test applique ensuite un procédé de type DPA ou CPA à cet ensemble de sous-courbes, pour déterminer si l'opération réalisée par l'algorithme est du type ai*agi ou du type ai*m3.
25 Le procédé de test selon l'invention peut donc être qualifié "d'horizontal", par contraste avec les procédés de test classiques DPA ou CPA qui nécessitent une superposition de courbes de consommation de courant, et peuvent être qualifiés de "verticaux". 30 Mise en oeuvre du procédé au moyen d'une analyse de type CPA
La figure 9 représente partiellement les 12 sous-courbes 35 de consommation de courant Ci, j (Co,o, Co,i,... , Ci,j,...10 C1-1,1-1 } d'une courbe multiplication. relative à l'exécution d'une Les sous-courbes Cid sont utilisées pour déterminer si s l'algorithme d'exponentiation modulaire a demandé à l'algorithme de multiplication d'exécuter l'opération a*a ou l'opération a*m, ce qui va se traduire à l'échelle de l'algorithme de multiplication par l'exécution de 12 opération ai*agi ou de 12 opérations ai*mi. En effet, si l'algorithme LIM est appelé par l'étape 3A de l'algorithme d'exponentiation, les entrées de l'algorithme sont :
15 x = a = (a1-1 al-2.... ao) b y = a = (a1-1 a1-2. . . . ao) b
et l'étape 2 de l'algorithme LIM comprend alors le calcul suivant : - pour j allant de 0 à l-1 faire : u l v (Ri+i + ai*ai) + c
Si par contre l'algorithme LIM est appelé à l'étape 3B de 25 l'algorithme d'exponentiation, les entrées de l'algorithme sont
x a = (a1-1 a1-2. . . . ao) b y = m = (m1-i m1-2.... mo) b et l'étape 2 de l'algorithme LIM comprend alors le calcul suivant : 10 20 30 - pour j allant de 0 à l-1 faire : u l v (Ri+i + ai*mi) + Chaque sous-courbe est formée par P points de consommation de courant W0,i,j, Wi,i,j, W2,i,j, • . . , Wk,i,j, . . .,WP-1,i,j et forme un sous-ensemble de points. Il s sera noté que les points considérés ici sont ceux qui vont être utilisés dans le calcul de corrélation qui suit. En effet, en pratique, selon la fréquence d'échantillonnage avec laquelle les points de consommation de courant sont capturés, chaque sous-courbe Io pourrait comporter un plus grand nombre de points que ceux utilisés pour les calculs.
Le programme de test associe les points d'une même sous-courbe à au moins une hypothèse concernant is l'opération exécutée par le circuit intégré, choisie entre deux hypothèses possibles, la première étant que le circuit intégré calcule ai*agi et la deuxième que le circuit intégré calcule ai*mi.
20 Suivant les principes de l'analyse CPA rappelés plus haut, le programme de test utilise ensuite un modèle linéaire de consommation de courant pour transformer une hypothèse sur l'opération exécutée par le circuit intégré en une valeur estimée de consommation de courant 25 correspondante, ou "modèle de corrélation". Selon une approche simplificatrice, le programme de test peut être configuré pour déterminer la valeur estimée de consommation de courant en calculant le poids de Hamming (nombre de bit à 1) de la variable la plus significative 30 de l'opération considérée, ou d'une combinaison des variables les plus significatives.
On supposera à titre d'exemple que le programme de test cherche à vérifier l'hypothèse ai*mi. La valeur HWi,j de consommation de courant estimée pour cette hypothèse est alors calculée au moyen de la relation suivante :
HWi, j = H (mj)
D'autres variantes de ce modèle peuvent être prévues, par exemple :
HWi, j = H (a;.*mi )
Un modèle plus complexe peut également être utilisé, tel que :
HWi,7 = H (a*agi. + où a et p sont des coefficients de pondération à fixer en fonction du microprocesseur ou du coprocesseur qui exécute la multiplication, après une analyse de caractérisation de celui-ci. 20 Il convient par contre de noter que le modèle HWi,j = H(a;_) n'est pas utilisable pour vérifier l'hypothèse ai*mj car le terme ai est présent dans les deux hypothèses ai*agi et ai*mi et n'est donc pas un discriminant valable. 25 Il apparaîtra clairement à l'homme de l'art que tout autre modèle statistiquement valable peut être utilisé pour estimer la consommation électrique, notamment des modèles plus complexes dans lesquels la valeur du 30 registre de calcul du circuit intégré n'est pas considérée comme constante mais dépendante des opérations précédentes et de la structure du circuit.
Sur la base du modèle qui lui a été fourni, le programme 35 de test est en mesure de calculer les valeurs de 10 15 consommation estimée HWi,j puisque toutes les composantes ai de la variable a et toutes les composantes mi du message m sont connues. La valeur de la variable a est déduite des itérations précédentes pour lesquelles le s programme de test a découvert la valeur des bits de l'exposant d, ou est égale à 1 s'il s'agit de la première itération de l'algorithme d'exponentiation modulaire. La valeur de m est connue puisque le message a été généré et envoyé par le programme de test. 10 Comme illustré sur la figure 9, le programme de test définit des ensembles de points transversaux horizontaux HEk (HE0, HE1r HE2,... , HEk,... HEP_1) comprenant chacun les points Wk,i,7 de même rang k pris dans chacune des sous- 15 courbes C1,j. Chaque ensemble transversal horizontal HEk est repéré sur la figure par des traits pointillés et contient donc un nombre de points égal au nombre 12 d'opérations de multiplications élémentaires ai*mi.
20 A chaque point Wk,i,j d'un ensemble transversal horizontal HEk est associé un point HWi,j de consommation de courant estimée, correspondant à l'hypothèse sur la consommation estimée en relation avec la courbe Ci,j auquel le point appartient, et calculé de la manière indiquée plus haut. 25 Pour chaque ensemble horizontal transversal HEk, le programme de test calcule un coefficient de corrélation horizontal HCk entre les points Wk,i,j de l'ensemble considéré et les points HWi,j de consommation estimée qui 3o leur sont associés. Le coefficient de corrélation HCk est par exemple calculé au moyen de la relation suivante :
HCk = cov( Wk,i,1, HJ 6Wk,i,16,1 E (w,,i,iH ,i) û E Wk,i,i HCk =~12EW2i,i_-(E147k,i J)2 j121Hy~i-(EHWi)2 soit la covariance entre les points Wk,i,j et les points HW±,, normalisée par le produit de leurs écarts types o(Wk,i,j) et o(HWi,~), HCk étant ainsi compris entre -1 et +1.
lo Ainsi, comme le montre le tableau 2 ci-dessous, également représenté sur la figure 10, à chaque ensemble de points transversal horizontal HEk est associé un coefficient de corrélation horizontal HCk correspondant à l'hypothèse devant être vérifiée. 15 TABLEAU 2 Co, o -4 W0,0,0 HW0, o W1, 0, o HWO, 0 • • • Wk, o, o HWO, 0 - - . WP-1, o, o HWo, o CO31 -- Wo, 0,1 HW0,1 Wl, 0,1 HW0,1 - - Wk, 0,1 HWo, l • • - WP-1, 0,1 HW0, l CO3 2 ù+ W0,0,2 HWO, 2 W1,0,2 HW0, 2 • • Wk, 0, 2 HW0, 2 . WP-1, 0, 2 HW0, 2 Ci, W0, i,1 HWi, j HWi, j ... Wk, j HWi, HWi, i C1-1,1-1 W0,1-1,1-1 HW1-1,1-1 W1,1-1,1-1 HW1_1, l-1 • • • Wk,1-1,1-1 HW1-1,1-1 - - - WP-1,1-1,1-1 HWl-1,1-1 HEo? HElq • HEkÎ .. HEM-11 HCo HC1 ... HCk ... HCp_1 Comme illustré sur les figures 11A, 11B, le programme de test obtient ainsi une courbe de corrélation horizontale HCC1 qui confirme l'hypothèse étudiée, ou une courbe de 20 corrélation horizontale HCC2 qui infirme l'hypothèse, la courbe HCC1 ou HCC2 étant formée par les coefficients de corrélation HCO3 HC1i ... , HCk, .. , HCP-1. La courbe HCC1 présente un ou plusieurs pics de corrélation (valeurs 39 ou
proches de +1 ou -1) tandis que la courbe HCC2 ne présente pas de pics de corrélation.
La confirmation de l'hypothèse étudiée comprend par exemple la recherche, par le programme de test, d'au moins un pic de corrélation. La recherche de ce pic de corrélation comprend la recherche d'au moins un coefficient de corrélation dont la valeur absolue est comprise entre une valeur minimale de corrélation HCn et Io 1, la valeur minimale de corrélation étant choisie suffisamment proche de 1 pour qu'une corrélation existe.
Si l'hypothèse selon laquelle l'opération exécutée est ai*mi est confirmée. par les pics de corrélation, le 15 programme de test en déduit que le circuit intégré effectuait l'opération ai*mj lorsque les sous-courbes Cm à C1_11_1 de la courbe Cs, ont été capturées, et que le bit ds de l'exposant d'exponentiation modulaire vaut 1 (la relation entre s' et s a été indiquée plus haut). 20 Il sera noté que le fait que la courbe de corrélation HCC1 correspondant à l'hypothèse exacte ne présente pas des pics de corrélation pour chaque point de consommation mesurée, signifie que certains points de consommation ne 25 sont pas liés à l'exécution de l'opération étudiée mais sont liés à une autre activité que le circuit intégré peut conduire en même temps que l'exécution de l'algorithme.
30 Le programme de test peut par ailleurs être configuré pour analyser également l'hypothèse complémentaire, à savoir ai*agi, notamment si la première hypothèse s'avère inexacte, et ainsi rechercher au moins un pic de corrélation pour décider si cette autre hypothèse est 35 exacte ou non.
Alternativement, le programme de test peut être configuré pour considérer que l'hypothèse complémentaire est exacte si la première hypothèse n'est pas confirmée par la courbe de corrélation. Il apparaît qu'après une période de mise au point du programme de test et de recherche du meilleur estimateur de la consommation de courant, le programme de test devient fiable de sorte qu'il n'est plus nécessaire de vérifier les deux hypothèses. Io Dans une variante, l'hypothèse a*m peut également être vérifiée plusieurs fois par le programme de test en utilisant plusieurs modèles de corrélation tels que H(mj) et H (ai*mi) . 15 Dans une autre variante, la vérification que l'hypothèse a*m est exacte pour une sous-courbe Cs, de rang s' peut être faite en se référant aux points de la sous-courbe suivante Cs,+i, puisqu'en raison de la structure même de 20 l'algorithme d'exponentiation modulaire, le résultat de l'itération précédente est inclus dans la variable a de l'itération suivante. Dans ce cas, et contrairement à ce qui est indiqué plus haut, le terme ai peut être un discriminant valable pour l'estimation de la consommation 25 de courant.
Mise en oeuvre du procédé au moyen d'une technique d'analyse différentielle de type DPA
3o Les 12 sous-courbes de consommation horizontales Ci,3 peuvent également permettre de mettre en oeuvre une analyse statistique de type DPA.
L'analyse nécessite une étape d'acquisition et une étape 35 de traitement. L'étape d'acquisition ne comprend que
l'acquisition d'une seule courbe de consommation Cs', incluant les sous-courbes Il est à noter que cette acquisition pourrait, dans certains cas, être combinée avec une acquisition verticale, nécessitant l'envoi de plusieurs messages au circuit intégré. Toutefois, en raison du grand nombre de sous-courbes qu'offre le procédé selon l'invention (Cf. tableau 1 plus haut), le nombre d'acquisitions verticales demeure réduit relativement au nombre d'acquisitions verticales que Io nécessite un procédé DPA ou CPA classique.
L'étape de traitement statistique d'une courbe Cs, (Fig. 9) est conduite par le programme de test en appliquant une méthodologie DPA classique, mais en considérant les 15 sous-courbes horizontales Ci,i comme des courbes indépendantes devant être classées.
Le programme de test estime la consommation de chaque étape de calcul correspondant à chaque sous-courbe en 20 utilisant un modèle de consommation similaire à celui utilisé pour l'analyse CPA. Plus particulièrement, une fonction de tri f(ai,mi) des sous-courbes est utilisée par le programme de test, par exemple :
25 f (ai, mj) = poids de Hamming d'un ou plusieurs bits de mi, ou f(ai,mj) = poids de Hamming d'un ou plusieurs bits de ai*mi, ou f (ai, mj) = poids de Hamming d'un ou plusieurs bits de ai 30 et d'un ou plusieurs bits de m3.
Le programme classe ensuite les sous-courbes de consommation mesurée Ci,j en deux groupes GO et G1, pour l'hypothèse considérée : 35 - GO = {sous-courbes Ci,j qui devraient correspondre à une faible consommation du circuit intégré à l'étape ai*mj considérée}, - G1 = {sous-courbes Ci,j qui devraient correspondre à une s forte consommation du circuit intégré à l'étape ai*mj considérée}.
Par exemple, comme montré sur la figure 9, les sous-courbes CO30 et C1-1,1-1 représentées sur cette figure sont lo classées dans le groupe GO tandis que la sous-courbe CO31 est classée dans le groupe G1.
Le programme calcule ensuite : - une première courbe moyennée MO représentée 15 schématiquement sur la figure 12A, dont chaque point MOWk de rang k (MOW0, MOW1r... , MOWk, ... , MOWP_1) est égal la moyenne des points Wk,i,j de même rang k de toutes les sous-courbes Ci,j du groupe GO,. - une seconde courbe moyennée Ml représentée 20 schématiquement sur la figure 12B, dont chaque point MlWk de rang k (M1W0r M1W1,... , M1Wk, ... , M1WP_1) est égal la moyenne des points Wk,i,3 de même rang k de toutes les sous-courbes Ci,j du groupe G1, - une courbe différentielle statistique DM représentée 25 schématiquement sur la figure 12C, ou courbe de la différence des moyennes, dont chaque point DWk de rang k (DW0, DW1, ... , DWk, ... , DWP_1) est égal à la différence des points MOWk et M1Wk de même rang k des courbes moyennées MO et M1. 30 Si un pic ou plusieurs pics de consommation de courant apparaissent sur la courbe différentielle statistique DM, à l'endroit choisi pour l'estimation de la consommation de courant, le programme en déduit que l'hypothèse sur la 35 valeur du bit de l'exposant est exacte, l'opération
exécutée par l'algorithme d'exponentiation modulaire est donc LIM(a,m). Si aucun pic de consommation n'apparaît, le programme peut considérer que l'hypothèse complémentaire est vérifiée (d,_s=0) et que l'opération exécutée est LIM(a,a)), ou procéder d'une manière similaire pour vérifier l'hypothèse complémentaire.
La recherche d'un pic de consommation par le programme de test, qui est équivalente à la recherche d'un pic de corrélation avec la méthode précédente, comprend par exemple la recherche de points de consommation différentiels DWk de valeur supérieure ou égale à une valeur minimale de consommation DWmin Champs d'application du procédé de test selon l'invention
Il apparaîtra clairement à l'homme de l'art que le procédé selon l'invention permet de tester des circuits intégrés mettant en oeuvre diverses sortes d'algorithmes, de cryptographie ou non, d'exponentiation modulaire ou non, si de tels algorithmes comprennent un branchement conditionnel conduisant à exécuter des opérations de multiplication portant sur différentes opérandes.
Fondamentalement, le procédé de l'invention permet de tester des circuits intégrés mettant en oeuvre tout type d'algorithme de multiplication comprenant une pluralité de multiplications élémentaires xi*y3, tels que la multiplication de COMBA ou de KARATSUBA, en relation avec un algorithme de niveau supérieur faisant appel à l'algorithme de multiplication par l'intermédiaire d'un branchement conditionnel. Le procédé de l'invention s'applique également à des circuits intégrés utilisant une fonction de multiplication modulaire incluant une fonction de réduction en sus d'une fonction de
multiplication, telle que par exemple l'algorithme de Montgomery, de Quisquater, la multiplication ZDN de Sedlak, qui comprennent également une pluralité de multiplications élémentaires xi*y~. Le procédé selon l'invention permet ainsi d'évaluer des hypothèses sur le branchement conditionnel, pour en déduire une donnée secrète dont le branchement conditionnel dépend. i0 Le procédé de l'invention permet donc de réaliser des systèmes de test pour la qualification ou la certification de circuits intégrés, lesquels sont rejetés comme inaptes à conserver un secret si celui-ci est 15 révélé par le procédé selon l'invention.
Efficacité des contre-mesures classiques vis-à-vis du procédé de test selon l'invention
20 Pour que les circuits intégrés puissent passer avec succès les procédures de qualification ou de certifications connues, les concepteurs de circuits intégrés prévoient des contre-mesures dont les plus courantes sont les suivantes : 25 i) Randomisation de l'exposant d :
On remplace l'exposant d par un exposant aléatoire d' tel que d' = d+ K avec K un multiple de l'ordre du groupe multiplicatif dans lequel sont effectués les calculs. Dans le cas par 35 exemple de l'algorithme RSA, K= k*cp (n) , avec k un nombre 30 aléatoire et p la fonction d' Euler, telle que p (n) = (p-1)*(q-1), p et q des entiers tels que p*q=1.
ii) Randomisation additive du message m et du module 5 d'exponentiation n :
On transforme le message reçu m en un message m*tel que :
m *= m + rl *n modulo r2*n 10 soit m = m + u*n avec u = rl modulo r2,
r1, r2 étant des nombres aléatoires qui sont différents à 15 chaque nouveau cycle de calcul cryptographique.
iii) Randomisation multiplicative du message m : On transforme le message reçu m en un message m*tel que : 20 m*= re*m modulo m avec r un nombre aléatoire et e un exposant public.
25 Il apparaît que la contre-mesure i) est sans effet sur le procédé de test selon l'invention, et permet seulement de contrer les analyses verticales DPA et CPA. Le procédé selon l'invention ne nécessite en effet qu'une seule courbe de consommation et permet de découvrir un exposant 30 d' qui, bien qu'étant dérivé de l'exposant initial d, est utilisable en tant que clé secrète au même titre que l'exposant initial, pour exécuter l'exponentiation modulaire.
Concernant les contre-mesures ii) et iii), il apparaît également que le procédé de test selon l'invention, du fait qu'il repose sur le traitement statistique transversal horizontal d'une seule courbe de consommation liée à un seul message, au lieu d'un traitement statistique transversal vertical portant sur plusieurs courbes de consommation liées à un plusieurs messages, permet de percer de telles contre-mesures, en introduisant dans l'hypothèse des hypothèses sur la io valeur du message randomisé. Ces contre-mesures multiplient le nombre d'hypothèses à traiter et ralentissent l'exécution du procédé de l'invention mais n'empêchent pas de déterminer quelle est l'opération exécutée par le circuit intégré, à moins que le nombre 15 d'hypothèses à traiter soit trop important.
Contre-mesures appropriées
Un aspect de l'invention concerne la prévision de moyens 20 de contre-mesure permettant à un circuit intégré d'être considéré comme apte à être utilisé au cours d'un test de qualification ou de certification incluant le procédé de l'invention.
25 On propose ici de protéger un algorithme de multiplication contre une analyse horizontale selon l'invention en randomisant l'ordre d'exécution des multiplications élémentaires xi*yj. Cette randomisation comprend soit la randomisation de l'ordre de traitement 30 des xi tout en conservant l'ordre de traitement des yj pour chaque xi choisi (randomisation partielle), soit la randomisation de l'ordre de traitement des xi et de l'ordre de traitement des yi (randomisation totale).
A titre d'exemple de randomisation partielle, la séquence de multiplication suivante :
xi*y - xi*Y1 - Xi*y3 xi*Y4 devient par exemple (aléatoirement) : xi*Y15 xi*Y5 xi*Y18 xi*Yl-1
10 Si la randomisation est totale, toutes les séquences de multiplication xi*yi sont exécutées dans le désordre.
Exemple d'algorithme LIM randomisé (randomisation partielle) 15 Entrées x = (x1_1, xi 2.... xo)b Y = (Yi-1. Yi-2. - . • Yo) b Sortie : R = LIM (x, y) = x*y = (R21_1 R21_2.... Ro) b Étape 1 . 20 Calculer ou recevoir un vecteur de permutation a tel que a (al 1. al 2.. . ao) Étape 2 . Pour i allant de 0 à 21-1 faire Ri = 0 Étape 3 : 25 Pour h allant de 0 à 1-1 faire : i t- ai ; c «- 0 pour j allant de 0 à 1-1 faire : u v û (Ri+i + xi *yj) + C tant que c est différent de O, faire 30 u(v Ri+3 + c Ri+3 - v et c u j - j+l Étape 4 : Retourner(R)5
Un tel algorithme LIM randomisé peut être exécuté par logiciel ou au moyen d'un circuit hardware.
Une telle randomisation peut par ailleurs être combinée avec une technique de masquage additif ou soustractif des composantes xi, des composantes y3, ou les deux, consistant à combiner par addition ou par soustraction la composante xi et/ou la composante y3 avec un nombre aléatoire ou pseudo-aléatoire R' ou avec deux nombres io aléatoires ou pseudo-aléatoires R', R". Dans ce cas l'étape de multiplication xi*y: dans l'algorithme ci-dessus devient par exemple :
u 1 v (Ri+j + (Xi -R ' ) *yj) + c + yj * R' Autre exemple utilisant deux nombres aléatoires R' et R" u v (Ri+j + (xi-R') * (Yj-R") + c + y.*R' xi*R"+ y.*R' + 20 R'*R"
La figure 13 représente un multiplieur hardware randomisé SMT2 qui se distingue du multiplieur SMT1 décrit en relation avec la figure 6 en ce qu'il comporte un 25 séquenceur SM2 (machine d'états, séquenceur microprogrammé,...) qui est configuré pour exécuter l'algorithme de multiplication de la manière qui vient d'être décrite, en randomisant l'ordre de traitement des composantes xi ou en randomisant l'ordre de traitement 30 des composantes xi et l'ordre de traitement des composantes yi, avec optionnellement une randomisation additive ou soustractive de ces composantes.
Le vecteur de permutation a est ici un mot aléatoire RDM 35 qui est fourni au multiplieur SMT2 par un générateur de 15 mots aléatoire ou pseudo-aléatoire externe RGEN, mais pourrait aussi être généré en interne par le multiplieur SMT2. Un ou plusieurs autres mots aléatoires peuvent être fournis au multiplieur ou généré par celui-ci si l'option s de randomisation des composantes xi, yi est retenue.
Dans un mode de réalisation, le séquenceur SM2 est configuré pour offrir deux modes de fonctionnement, à savoir un mode de fonctionnement classique où il exécute 10 la multiplication de façon classique, et un mode de fonctionnement randomisé selon l'invention. Le mode de fonctionnement est sélectionné au moyen d'un signal de configuration MODE appliqué au multiplieur, comme représenté sur la figure 13, ou au moyen d'un drapeau 15 MODE programmé dans un registre de configuration du multiplieur.
La figure 14 représente un circuit intégré CIC2 agencé sur un support portatif HD tel une carte plastique, et 20 équipé d'une contre-mesure selon l'invention. Le circuit intégré comporte les même organes que le circuit intégré CIC1 décrit plus haut en relation avec la figure 1, et se distingue de celui-ci en ce que le coprocesseur CP1 est remplacé par un coprocesseur CP2 comprenant le 25 multiplieur randomisé SMT2 de la figure 13. Dans un autre mode de réalisation, le coprocesseur CP1 ne comprend que le multiplieur randomisé SMT2, et n'est prévu que pour effectuer la multiplication randomisée (accélérateur mathématique). Dans d'autres modes de réalisation, le 30 coprocesseur CPi peut comprendre des moyens d'exécution complète de la fonction d'exponentiation modulaire, y compris la multiplication randomisée, voire des moyens d'exécution complète d'une fonction de cryptographie incluant la fonction d'exponentiation modulaire. Dans 35 encore un autre mode de réalisation, la multiplication
randomisée selon l'invention est exécutée par le microprocesseur MP.
Il sera noté que dans la présente description et les revendications, le terme "aléatoire" ou "pseudoaléatoire" désigne un nombre qui n'est pas connu par l'évaluateur ou par le procédé de test et n'est pas prédictible pour la personne ne connaissant pas les secrets du circuit intégré. Est considéré notamment comme "aléatoire" ou "pseudo-aléatoire" au sens de la présente demande un nombre qui est généré par une fonction qui est déterministe (et donc non aléatoire par nature) mais qui utilise un paramètre secret pour générer ce nombre.
Références citées
(1) P. C. Kocher. Timing attacks on implementations of Diffie-Hellman, RSA, DSS, and other systems. In Neal Koblitz, editor, Advances in Cryptology - CRYPTO '96, volume 1109 of Lecture Notes in Computer Science, pages 104-113. Springer, 1996.
(2) P. C. Kocher, J. Jaffe, and B. Jun. Differential Power Analysis. In M. J. Wiener, editor, Advances in Cryptology - CRYPTO '99, volume 1666 of Lecture Notes in Computer Science, pages 388-397. Springer, 1999.
(3) E. Brier, C. Clavier, and F. Olivier. Correlation Power Analysis with a Leakage Model. In M. Joye and J-J.
Quisquater, editors, Cryptographic Hardware and Embedded Systems - CHES 2004, volume 3156 of Lecture Notes in Computer Science, pages 16{29. Springer, 2004.
(4) Colin D. Walter. Sliding Windows Succumbs to Big Mac 35 Attack. In C. K. Koç, D. Naccache, and C. Paar, editors, Cryptographic Hardware and Embedded Systems - CHES 2001, volume 2162 of Lecture Notes in Computer Science, pages 286-299. Springer, 2001
s (5) Colin D. Walter. Longer keys may facilitate side channel attacks. In Selected Areas in Cryptography, SAC 2003, volume 3006 of Lecture Notes in Computer Science, pages 42-57. Springer, 2003.

Claims (17)

  1. REVENDICATIONS1. Circuit intégré (CIC2), comprenant une fonction de multiplication (SMT2) configurée pour exécuter une opération de multiplication d'au moins deux mots binaires x (a) et y (a, m) en une pluralité d'étapes élémentaires de multiplication de composantes xi (ai) du mot x par des composantes yj (aj, mj) du mot y, i et j étant des variables d'itération, caractérisé en ce que la fonction de multiplication est configurée pour exécuter deux multiplications io successives de mots binaires x et y en modifiant de manière aléatoire ou pseudo-aléatoire l'ordre dans lequel des étapes élémentaires de multiplication des composantes xi par des composantes yj sont exécutées. 15
  2. 2. Circuit intégré selon la revendication 1, dans lequel la fonction de multiplication est configurée pour modifier de manière aléatoire ou pseudo-aléatoire l'ordre dans lequel les composantes xi sont multipliées aux composantes yj sans modifier l'ordre dans lequel les 20 composantes yj sont multipliées aux composantes xi, ou vice-versa.
  3. 3. Circuit intégré selon la revendication 1, dans lequel la fonction de multiplication est configurée pour 25 modifier de manière aléatoire ou pseudo-aléatoire à la fois l'ordre dans lequel les composantes xi sont multipliées aux composantes yj et l'ordre dans lequel les composantes yj sont multipliées aux composantes xi. 30
  4. 4. Circuit intégré selon l'une des revendications 1 à 3, dans lequel la fonction de multiplication comprend des moyens (RGEN) pour générer ou recevoir un nombre binaire aléatoire ou pseudo-aléatoire (RDM), et pour 53 exécuter la pluralité d'étapes élémentaires de multiplication de composantes xi par des composantes yi, en ce qui concerne au moins l'une des variables d'itération i ou j, selon un ordre déterminé par le nombre binaire aléatoire ou pseudo-aléatoire.
  5. 5. Circuit intégré selon l'une des revendications 1 à 4, dans lequel la fonction de multiplication est également configurée pour randomiser au moins l'une des composantes xi ou yj au moyen d'au moins un mot (R', R") aléatoire ou pseudo-aléatoire.
  6. 6. Circuit intégré selon l'une des revendications 1 à 5, dans lequel la fonction de multiplication comprend un mode de fonctionnement ordonné dans lequel les variables d'itération sont incrémentées ou décrémentées selon un ordre constant d'une multiplication de mots binaires à l'autre, et un mode de fonctionnement désordonné dans lequel au moins d'une des variables d'itération est incrémentée ou décrémentée de manière aléatoire ou pseudo-aléatoire d'une multiplication de mots binaires à l'autre.
  7. 7. Circuit intégré selon l'une des revendications 1 à 6, dans lequel la fonction de multiplication est exécutée par un circuit à logique câblée (SMT2, CP2) cadencé parun séquenceur (SM2).
  8. 8. Circuit intégré selon l'une des revendication 1 à 7, comprenant une fonction de traitement d'une donnée externe (m) dont l'exécution comprend au moins une étape de branchement conditionnel vers au moins une première étape de multiplication de mots binaires (a, a) par la fonction de multiplication (SMT2) ou une seconde étape de multiplication de mots binaires (a, m) par la fonction de multiplication (SMT2), le branchement conditionnel étant fonction d'une donnée privée du circuit intégré.
  9. 9. Circuit intégré selon la revendication 8, dans lequel la fonction de traitement de données est une fonction d'exponentiation modulaire, la donnée privée étant un exposant (d) de la fonction d'exponentiation modulaire. io
  10. 10. Circuit intégré selon la revendication 8, dans lequel la fonction de traitement de données est une fonction de cryptographie incluant une fonction d'exponentiation modulaire, la donnée privée étant un exposant de la fonction d'exponentiation modulaire 15 formant une clé privée de la fonction de cryptographie.
  11. 11. Dispositif comprenant un circuit intégré (CIC2) selon l'une des revendications 1 10 agencé sur un support (HD). 20
  12. 12. Procédé pour protéger contre une analyse par canal auxiliaire un circuit intégré (CIC2) configuré pour exécuter une opération de multiplication d'au moins deux mots binaires x (a) et y (a, m) en une pluralité d'étapes 25 élémentaires de multiplication de composantes xi (ai) du mot x par des composantes yj (aj, mj) du mot y, i et j étant des variables d'itération, caractérisé en ce qu'il comprend une étape consistant à modifier de manière aléatoire ou pseudo- 30 aléatoire l'ordre dans lequel le circuit intégré exécute des étapes élémentaires de multiplication des composantes xi par des composantes yj, d'une opération de multiplication de mots binaires à l'autre.
  13. 13. Procédé selon la revendication 12, comprenant une étape consistant à modifier de manière aléatoire ou pseudo-aléatoire l'ordre dans lequel le circuit intégré multiplie les composantes xi aux composantes yD, sans modifier l'ordre dans lequel les composantes yj sont multipliées aux composantes xi, ou vice-versa.
  14. 14. Procédé selon la revendication 12, comprenant une étape consistant à modifier de manière aléatoire ou Io pseudo-aléatoire à la fois l'ordre dans lequel le circuit intégré multiplie les composantes xi aux composantes yj et l'ordre dans lequel le circuit intégré multiplie les composantes yj aux composantes xi. 15
  15. 15. Procédé selon l'une des revendications 12 à 14, comprenant les étapes consistant à : - générer un nombre binaire aléatoire ou pseudo-aléatoire (RDM) au sein du circuit intégré, et - faire exécuter par le circuit intégré la pluralité 20 d'étapes élémentaires de multiplication de composantes xi par des composantes yi selon un ordre déterminé par le nombre binaire aléatoire ou pseudo-aléatoire, en ce qui concerne au moins l'une des variables d'itération i ou j. 25
  16. 16. Procédé selon l'une des revendications 12 à 15, comprenant en outre une étape consistant à faire randomiser par le circuit intégré au moins l'une des composantes xi ou yj au moyen d'au moins un mot (R', R") aléatoire ou pseudo-aléatoire. 30
  17. 17. Procédé selon l'une des revendication 12 à 16, appliqué à la protection d'un circuit intégré comprenant une fonction de traitement d'une donnée externe (m) dont l'exécution comprend au moins une étape de branchement 35 conditionnel vers au moins une première étape demultiplication de mots binaires (a, a) ou au moins une seconde étape de multiplication de mots binaires (a, m), le branchement conditionnel étant fonction d'une donnée privée du circuit intégré.
FR1000834A 2010-03-01 2010-03-01 Circuit integre protege contre une analyse par canal auxiliaire horizontale Withdrawn FR2956933A1 (fr)

Priority Applications (9)

Application Number Priority Date Filing Date Title
FR1000834A FR2956933A1 (fr) 2010-03-01 2010-03-01 Circuit integre protege contre une analyse par canal auxiliaire horizontale
EP11001428.9A EP2365659B1 (fr) 2010-03-01 2011-02-21 Procédé de test de la résistance d'un circuit intégré à une analyse par canal auxiliaire
EP11001491.7A EP2363975B1 (fr) 2010-03-01 2011-02-23 Circuit intégré protégé contre une analyse par canal auxiliaire horizontale
CA2732444A CA2732444C (fr) 2010-03-01 2011-02-24 Circuit integre protege contre une analyse par canal auxiliaire horizontale
CA2732651A CA2732651C (fr) 2010-03-01 2011-02-24 Procede de test de la resistance d'un circuit integre a une analyse par canal auxiliaire
CN2011100497307A CN102193773A (zh) 2010-03-01 2011-03-01 针对水平旁路分析而受到保护的集成电路
CN201110049399.9A CN102193060B (zh) 2010-03-01 2011-03-01 用于测试集成电路设备的方法和系统
KR1020110018646A KR20110099185A (ko) 2010-03-01 2011-03-02 수평 사이드 채널 분석에 대항하여 보호된 집적 회로
KR1020110018644A KR101792650B1 (ko) 2010-03-01 2011-03-02 사이드 채널 분석에 대한 집적 회로의 저항을 테스트하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1000834A FR2956933A1 (fr) 2010-03-01 2010-03-01 Circuit integre protege contre une analyse par canal auxiliaire horizontale

Publications (1)

Publication Number Publication Date
FR2956933A1 true FR2956933A1 (fr) 2011-09-02

Family

ID=42990163

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1000834A Withdrawn FR2956933A1 (fr) 2010-03-01 2010-03-01 Circuit integre protege contre une analyse par canal auxiliaire horizontale

Country Status (1)

Country Link
FR (1) FR2956933A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020099796A1 (fr) 2018-11-14 2020-05-22 Institut National Polytechnique De Toulouse Procédé et dispositif de transfert de matière en continu à contre-courant entre deux phases fluides

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002071687A1 (fr) * 2001-03-06 2002-09-12 Ericsson Inc. Cryptoaccelerateur recursif et conception recursive vhdl de circuits logiques
WO2007000702A2 (fr) * 2005-06-29 2007-01-04 Koninklijke Philips Electronics N.V. Dispositif et procede de protection de dispositif de traitement de donnees contre une attaque ou analyse

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002071687A1 (fr) * 2001-03-06 2002-09-12 Ericsson Inc. Cryptoaccelerateur recursif et conception recursive vhdl de circuits logiques
WO2007000702A2 (fr) * 2005-06-29 2007-01-04 Koninklijke Philips Electronics N.V. Dispositif et procede de protection de dispositif de traitement de donnees contre une attaque ou analyse

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FREDERIC AMIEL ET AL: "On the BRIP Algorithms Security for RSA", 13 May 2008, INFORMATION SECURITY THEORY AND PRACTICES. SMART DEVICES, CONVERGENCE AND NEXT GENERATION NETWORKS; [LECTURE NOTES IN COMPUTER SCIENCE], SPRINGER BERLIN HEIDELBERG, BERLIN, HEIDELBERG, PAGE(S) 136 - 149, ISBN: 978-3-540-79965-8, XP019089179 *
KOCHER P C ED - KOBLITZ N (ED): "TIMING ATTACKS ON IMPLEMENTATIONS OF DIFFIE-HELLMAN, RSA, DSS, AND OTHER SYSTEMS", ADVANCES IN CRYPTOLOGY - CRYPTO '96. 16TH. ANNUAL INTERNATIONAL CRYPTOLOGY CONFERENCE. SANTA BARBARA, AUG. 18 - 22, 1996. PROCEEDINGS; [PROCEEDINGS OF THE ANNUAL INTERNATIONAL CRYPTOLOGY CONFERENCE (CRYPTO)], BERLIN, SPRINGER, DE, vol. CONF. 16, 18 August 1996 (1996-08-18), pages 104 - 113, XP000626590, ISBN: 978-3-540-61512-5 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020099796A1 (fr) 2018-11-14 2020-05-22 Institut National Polytechnique De Toulouse Procédé et dispositif de transfert de matière en continu à contre-courant entre deux phases fluides

Similar Documents

Publication Publication Date Title
CA2732444C (fr) Circuit integre protege contre une analyse par canal auxiliaire horizontale
EP3208789B1 (fr) Procédé de protection d&#39;un circuit contre une analyse par canaux auxiliaires
US8457919B2 (en) Process for testing the resistance of an integrated circuit to a side channel analysis
US8572406B2 (en) Integrated circuit protected against horizontal side channel analysis
FR2971600A1 (fr) Dispositif et procede de calcul d&#39;un resultat d&#39;une multiplication scalaire
WO2013088066A1 (fr) Procede de generation de nombres premiers prouves adapte aux cartes a puce
EP2302552A1 (fr) Procédé d&#39;éxecution d&#39;un algorithme de protection d&#39;un dispositif électronique par masquage affiné et dispositif associé
EP2731006B1 (fr) Procédé de cryptographie comprenant une opération d&#39;exponentiation modulaire
EP1493078B1 (fr) Procédé cryptographique protégé contre les attaques de type à canal caché
EP1994465A1 (fr) Procede de securisation d&#39;un calcul d&#39;une exponentiation ou d&#39;une multiplication par un scalaire dans un dispositif electronique
EP1224765A1 (fr) Procede de contre-mesure dans un composant electronique mettant en oeuvre un algorithme de cryptographie a cle publique de type rsa
FR2956933A1 (fr) Circuit integre protege contre une analyse par canal auxiliaire horizontale
FR2956932A1 (fr) Procede de test de la resistance d&#39;un circuit integre a une analyse par canal auxiliaire
EP2599256B1 (fr) Procede et dispositif de randomisation d&#39;une cle secrete contre les attaques par canaux auxiliaires
FR3048086A1 (fr) Procede de test de la resistance d&#39;un circuit a une analyse par canaux auxiliaires
Lee et al. A practical collision-based power analysis on RSA prime generation and its countermeasure
WO2004017193A2 (fr) Procede de calcul universel applique a des points d&#39;une courbe elliptique
FR3048096A1 (fr) Procede de protection d&#39;un circuit contre une analyse par canaux auxiliaires
FR3048097A1 (fr) Procede de protection d&#39;un circuit contre une analyse par canaux auxiliaires
FR3053862A1 (fr) Procede de generation des parametres caracterisant un protocole cryptographique
FR2818473A1 (fr) Procedes de contre-mesure dans un composant electronique mettant en oeuvre un algorithme de cryptographie a cle publique de type rsa
FR2823327A1 (fr) Dispositif destine a realiser des calculs d&#39;exponentiation securisee et utilisation d&#39;un tel dispositif
FR2986883A1 (fr) Procede de generation securise d&#39;un nombre premier, produit programme d&#39;ordinateur et composant electronique correspondants
FR2984547A1 (fr) Procede de generation de nombres premiers prouves adapte aux cartes a puce
FR2984549A1 (fr) Procede de generation de nombres premiers prouves adapte aux cartes a puce

Legal Events

Date Code Title Description
CA Change of address

Effective date: 20140129

CD Change of name or company name

Owner name: INSIDE SECURE, FR

Effective date: 20140129

PLFP Fee payment

Year of fee payment: 7

PLFP Fee payment

Year of fee payment: 8

PLFP Fee payment

Year of fee payment: 9

PLFP Fee payment

Year of fee payment: 10

CD Change of name or company name

Owner name: VERIMATRIX, FR

Effective date: 20191119

CA Change of address

Effective date: 20191209

PLFP Fee payment

Year of fee payment: 11

TP Transmission of property

Owner name: RAMBUS INC., US

Effective date: 20200402

ST Notification of lapse

Effective date: 20211105