FR3103621A1 - Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique - Google Patents

Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique Download PDF

Info

Publication number
FR3103621A1
FR3103621A1 FR1913107A FR1913107A FR3103621A1 FR 3103621 A1 FR3103621 A1 FR 3103621A1 FR 1913107 A FR1913107 A FR 1913107A FR 1913107 A FR1913107 A FR 1913107A FR 3103621 A1 FR3103621 A1 FR 3103621A1
Authority
FR
France
Prior art keywords
variants
variant
therapeutic protein
population
immunogenic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR1913107A
Other languages
English (en)
Inventor
Youen LESPARRE
Aurore LOMET
Bernard Maillere
Hervé NOZACH
Raphael SIEROCKI
Coline SIVELLE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Commissariat a lEnergie Atomique et aux Energies Alternatives CEA
Original Assignee
Commissariat a lEnergie Atomique CEA
Commissariat a lEnergie Atomique et aux Energies Alternatives CEA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commissariat a lEnergie Atomique CEA, Commissariat a lEnergie Atomique et aux Energies Alternatives CEA filed Critical Commissariat a lEnergie Atomique CEA
Priority to FR1913107A priority Critical patent/FR3103621A1/fr
Publication of FR3103621A1 publication Critical patent/FR3103621A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Peptides Or Proteins (AREA)

Abstract

La présente invention concerne un procédé, un programme informatique et un système pour sélectionner in silico des variants d’une protéine thérapeutique donnée, lesdits variants présentant un caractère moins immunogène que cette protéine thérapeutique. La présente invention concerne également des utilisations dudit procédé. Figure pour l’abrégé : Fig. 1

Description

PROCÉDÉ ET SYSTÈME POUR SÉLECTIONNER DES VARIANTS D’UNE PROTÉINE THÉRAPEUTIQUE MOINS IMMUNOGÈNES QUE CETTE PROTÉINE THÉRAPEUTIQUE
La présente invention concerne le domaine technique général des protéines thérapeutiques et, plus particulièrement, des protéines thérapeutiques dé-immunisées.
En effet, la présente invention propose un procédé, un programme informatique et un système de dé-immunisation i.e. un procédé, un programme informatique et un système pour sélectionnerin silicodes variants d’une protéine thérapeutique donnée, lesdits variants présentant un caractère moins immunogène que cette protéine thérapeutique. La présente invention concerne également un procédé pour produire un ou plusieurs variants ainsi sélectionnés et pour produire, parmi ces derniers, ceux qui présentent une activité fonctionnelle identique ou supérieure à l’activité fonctionnelle de la protéine thérapeutique concernée.
Etat de la technique antérieure
Des thérapies biologiques impliquant des protéines thérapeutiques, comme des anticorps thérapeutiques, sont actuellement disponibles pour traiter des maladies et des désordres tels que, par exemple, le rejet de greffe, des cancers, l'arthrite, la sclérose en plaques et la maladie de Crohn. Par ailleurs, d’autres thérapies protéiques sont en cours de développement.
La conception de nouvelles protéines thérapeutiques nécessite, si besoin, leur modification afin d’éviter que, lorsqu’administrées à un patient, elles ne soient reconnues comme un élément étranger et conduisent à des réactions immunitaires chez ce dernier.
La capacité d’une protéine à déclencher des réactions immunitaires s’appelle l’immunogénicité. Elle se traduit généralement par l’apparition d’anticorps qui peuvent neutraliser l’activité thérapeutique de la protéine voire provoquer des symptômes allergiques ou auto-immuns. L’immunogénicité varie d’un individu à l’autre en fonction des molécules du Complexe Majeur d’Histocompatibilité (CMH) correspondant, chez les humains, aux antigènes des leucocytes humains ou HLA (pour «Human Leukocyte Antigen»). Il est donc nécessaire de pouvoir dé-immuniser les protéines thérapeutiques i.e. minimiser leur immunogénicité quels que soient les allèles CMH ou HLA.
Les molécules du CMH sont subdivisées en molécules du CMH de classe I (CMH I) et molécules du CMH de classe II (CMH II). Bien que la fonction générale des CMH I et CMH II soit la même i.e. présentation de l'antigène, ils diffèrent dans un certain nombre d'aspects. Les molécules CMH I s'expriment à la surface de toutes les cellules nucléées sauf les cellules germinales comme un complexe hétérodimérique entre une chaîne lourde de 46kDa (la chaîne α) et une chaîne légère de 12kDa (la β2-microglobuline ou la chaîne β2m). La chaîne α se compose de trois domaines, α1, α2 et α3; les domaines α1 et α2 sont responsables de la liaison du ligand peptidique, tandis que le domaine α3 est lié à la membrane et impliqué dans la liaison aux corécepteurs CD8. Les molécules CMH II qui s’expriment à la surface des cellules présentatrices de l’antigène (monocytes, cellules dentritiques, lymphocytes B activés et macrophages) ont la même forme globale, bien qu'elles soient constituées de deux chaînes membranaires : une chaîne α d’environ 35kDa et une chaîne β d’environ 28kDa. La chaîne α et la chaîne β présentent, toutes deux, deux domaines (α1 et α2 pour l’une, et β1 et β2 pour l'autre). Les domaines α1 et β1 forment ensemble le domaine de liaison du peptide, alors que le domaine β2 est impliqué dans la liaison aux corécepteurs CD4. Les molécules du CMH I et du CMH II sont fortement polymorphiques.
L’étude du caractère immunogène d’un peptide et, par la même, les travaux pour dé-immuniser un peptide se basent sur la bonne corrélation entre l’affinité d’un peptide pour une molécule du CMH I ou du CMH II et l’immunogénicité dudit peptide chez le vertébré auquel appartient la molécule du CMH I ou du CMH II testée.
Le brevet EP1516275[1]propose de prédire l’affinité de liaison d’un peptide pour une molécule du CMH I ou CMH II sur la base de la représentation tridimensionnelle de la molécule du CMH, de celle du peptide et de la modélisation des complexes CMH/peptide. Cette méthode fonctionnantin silicon’est pas une méthode de dé-immunisation à proprement parler mais uniquement une méthode pour prédire le caractère immunogène d’une protéine.
La demande de brevet US2012/148559[ 2 ]décrit un procédé pour identifier des protéines dé-immunisées qui présentent une immunogénicité moindre et une activité biologique égale ou supérieure, comparées aux protéines d’intérêt dont elles sont des mutants. Ce procédé met en œuvre des cellules transfectées par des vecteurs d’expression présentant une séquence nucléotidique codant la protéine mutante et une séquence nucléotidique rapporteur, le niveau d’expression de la séquence nucléotidique rapporteur servant à apprécier le niveau d’activité biologique de la protéine mutante et le caractère immunogène de cette dernière étant déterminé par titrage des anticorps dans des modèles animaux. Cette approche n’utilisant que des outilsin vitrose heurte à la très grande combinatoire du nombre de mutations possibles et aux coûts prohibitifs des expérimentationsin vitro.
Des méthodes pour dé-immuniser des protéines sont également accessibles sur le net. Ainsi, la méthode appelée «Deimmunization tool» proposée sur le site de l’IEDB (pour «Immune Epitope DataBase»)[3]vise à trouver une mutation pour chaque zone immunogène d’une protéine. Pour ce faire, la méthode découpe la protéine en sous-chaînes peptidiques de 15 acides aminés ou 15-mers et teste leur caractère immunogène. Pour chaque 15-mer détecté comme immunogène, l’algorithme cherche la meilleure mutation possible en énumérant et en testant l’ensemble des mutations possibles. La méthode utilise un ensemble complet de méthodes de prédiction de l’immunogénicité mais l’énumération simple de toutes les mutations possibles ne permet de considérer qu’une seule mutation pour chaque 15-mer.
Choiet alproposent une méthode appelée «EpiSweep»[4]qui étudie les meilleurs mutations possibles pour une protéine en utilisant un ensemble d’algorithmes de prédiction qui permettent de vérifier l’immunogénicité de la protéine mutée et sa fonctionnalité i.e. vérifier si la fonction thérapeutique n’est pas impactée par la mutation. Toutefois, cette méthode utilise des algorithmes de prédiction de l’immunogénicité qui sont obsolètes et peu performants, rendant la méthode noncompatible avec d’autres algorithmes de prédiction plus récents comme les réseaux de neurones.
Par ailleurs, la présentation «Predeep: Deep learning pour la prédiction d’épitopes réels» de Lesparreet al [5]expose, sur les diapositives 15 et 16, deux méthodes pour identifier des variants de protéines thérapeutiques mutés aléatoirement et présentant une immunogénicité moindre, utilisant comme algorithme de prédiction soit Sturniolo, soit NetMHCIIpan. Chaque méthode implique des étapes de reproduction, d’évaluation et de sélection. Toutefois, aucun détail quant aux étapes d’évaluation du pouvoir immunogène des variants et de leur comparaison n’est décrit, ni suggéré dans cette présentation.
Lesparreet al [6] enfin ont proposé une méthode pour identifier des variants de protéines thérapeutiques mutés aléatoirement et présentant une immunogénicité moindre, utilisant comme algorithme de prédiction Sturniolo. L’algorithme génétique mis en œuvre comprend des étapes de reproduction de variants, de leur évalutation puis de leur tri. La méthode de tri repose sur le calcul d’une moyenne des scores d’immunogénicité de chacun des sous-fragments glissants formant le variant par rapport aux différents allèles de gènes de CMH de classe II testés. L’utilisation d’une moyenne ne permet pas de discriminer, de façon suffisamment précise, les variants entre eux.
Les inventeurs se sont donc fixé pour but de proposer un procédé permettant de sélectionner des variants de protéines thérapeutiques dont l’immunogénicité est inférieure à celle des protéines concernées, ledit procédé ne présentant pas les inconvénients des procédés de l’art antérieur.
Présentation de l’invention
La présente invention permet de répondre au but que se sont fixé les inventeurs en proposant un procédé de sélectionin silicoqui repose, d’une part, sur l’évaluation de l’immunogénicité des cores (sous-sections) de variants d’une protéine thérapeutique donnée et, d’autre part, sur l’utilisation d’une technique particulière pour comparer les résultats de cette évaluation.
En effet, la présente invention permet d’adapter l’algorithme génétique mis en œuvre dans le procédé pour qu’il puisse répondre à la problématique de la dé-immunisation des protéines thérapeutiques. L’obtention de variants de qualité est conditionnée par le choix de la méthode d’estimation de l’immunogénicité i.e. l’algorithme de prédiction mais aussi par le classement des variants obtenus lors de l’exécution de l’algorithme génétique. De ce fait, la méthode de classement innovante mise en œuvre dans le procédé selon l’invention est basée sur les différents échanges entre les data-scientistes et les immunologues que sont les inventeurs de la présente.
Tout d’abord, le procédé selon l’invention est un procédéin silicoet ne présente donc pas les inconvénients des procédés de l’art antérieur nécessitant des étapesin vitro. A cet effet, il convient de noter que les expressions «procédéin silico» et «procédé mis en œuvre par ordinateur» sont équivalentes et utilisables de façon interchangeable dans la présente invention.
Le procédé de dé-immunisation selon l’invention se base sur un ensemble de règles ainsi que sur un algorithme génétique issu de l’optimisation combinatoire, couplé avec une méthode de prédiction de l’immunogénicité. La prédiction de l’immunogénicité s’appuie sur des méthodes matricielles ou à base de réseaux de neurones permettant de prédire l’affinité de la protéine thérapeutique et de ses variants avec le Complexe Majeur d’Histocompatibilité de classe I ou II (CMH I ou CMH II). Le choix de la méthode de prédiction appartient à l’utilisateur et le procédé selon la présente invention offre l’avantage de pouvoir utiliser différentes méthodes de prédiction.
Par ailleurs, le procédé de l’invention n’a pas de limite quant au nombre de mutations considérées. En effet, grâce à un parcours aléatoire intelligent des meilleures mutations possibles, l’algorithme mis en œuvre dans le procédé selon l’invention est capable de trouver une combinaison de deux mutations proches qui ne seraient pas intéressantes l’une sans l’autre. De plus, comme l’algorithme mis en œuvre dans le procédé selon l’invention ne parcourt pas l’ensemble des solutions, le temps nécessaire pour la dé-immunisation est considérablement réduit par rapport à une énumération exhaustive.
Le procédé de dé-immunisation selon l’invention est également facile de mise en œuvre puisque lancé à partir d’une interface graphique permettant de régler les différentes étapes et de récupérer le rapport contenant la liste des variants à la fin du calcul. Plus particulièrement, à partir d’une protéine thérapeutique donnée et d’un ensemble de paramètres, le procédé selon l’invention calcule un grand nombre de variants dé-immunisés qui sont ensuite présentés à l’utilisateur sous la forme d’un rapport. Ce rapport présente les meilleurs variants trouvés, classés selon la méthode de comparaison selon l’invention et affiche les statistiques des meilleures mutations trouvées sur les variants.
Enfin, comme illustré dans la partie expérimentale ci-après, en comparant le procédé selon l’invention avec les résultats obtenus avec la méthode appelée «Deimmunization tool»[3], le procédé selon l’invention est beaucoup plus rapide avec un temps de calcul divisé par 3 et les variants sélectionnés à l’issue du procédé selon l’invention sont moins immunogènes que ceux obtenus avec l’algorithme du site de l’IEDB.
Ainsi, la présente invention propose un procédé pour sélectionner des variants d’une protéine thérapeutique, présentant un caractère moins immunogène que ladite protéine thérapeutique, comprenant les étapes consistant à:
a) fournir une population de différents variants de ladite protéine thérapeutique, la séquence de N acides aminés de chaque variant se distinguant de la séquence de N acides aminés de ladite protéine thérapeutique par au moins un acide aminé;
b) évaluer, pour chaque variant de la population, les propriétés immunogènes vis-à-vis de Y allèle(s) de gène(s) du Complexe Majeur d’Histocompatibilité, avec Y représentant un nombre entier, supérieur ou égal à 1, ladite étape (b) consistant à:
b1) générer, pour chaque variant, l’ensemble des sous-fragments de X acides aminés consécutifs issus de la séquence de N acides aminés du variant, avec X représentant un nombre entier, supérieur ou égal à 8;
b2) attribuer, à chaque sous-fragment, pour chaque allèle considéré, au moyen d’un algorithme de prédiction, un score d’immunogénicité dans un intervalle [IMmax,IMmin] où IMminreprésente une valeur d’immunogénicité minimale et IMmaxreprésente une valeur d’immunogénicité maximale;
b3) associer, à partir de l’ensemble des scores attribués lors de l’étape b2), à chaque scoreS i , une valeurV i définie comme la fonction de répartition deS i ;
c) comparer et classer les variants en fonction de leur caractère immunogène en les comparant, deux à deux, sur la base des valeursV i obtenues à l’étape b3), sachant que, dans une recherche par valeurs croissantes, un premier variant est considéré comme moins immunogène qu’un second variant lorsque, pour la première valeurV i différente entre le premier et le second variants, le premier variant présente une valeurV i inférieure à celle du second variant;
d) sélectionner lesmvariants les moins immunogènes de la population testée;
e) itérer les étapes b) à d) jusqu’à ce que lesmvariants les moins immunogènes soient les mêmes pour W itérations successives,
une nouvelle population de variants étant utilisée à chaque itération, chaque nouvelle population consistant en une fraction η, avec 0<η<1, composée de variants choisis dans la population de l’itération précédente et une fraction (1-η) composée de nouveaux variants.
Par «protéine thérapeutique», on entend une séquence d’acides aminés, naturelle, synthétique ou recombinante, utilisée dans le traitement, l’amélioration ou la prévention d’un trouble, d’une condition ou d’une maladie chez un vertébré et notamment chez un mammifère et, en particulier, chez un humain.
La protéine thérapeutique concernée par la présente invention peut notamment être une cytokine, une chimiokine, une enzyme, une protéine de fusion, une hormone, une immunoglobuline, un anticorps, un anticorps monoclonal, un fragment d’un anticorps monoclonal présentant un site de liaison à l’antigène ou encore un fragment d’un anticorps monoclonal présentant plusieurs sites de liaison à des antigènes différents. Parmi ces fragments, on peut citer les fragments Fab, F(ab’)2, Fv, et d’autres fragments qui conservent le site de liaison à l’antigène (scFv et diabody).
Par «variant d’une protéine thérapeutique donnée», on entend une séquence d’acides aminés, avantageusement synthétique, qui dérive d’une protéine thérapeutique donnée et se distingue de la séquence en acides aminés de la protéine thérapeutique par au moins un acide aminé. En d’autres termes, la séquence en acides aminés d’un variant d’une protéine thérapeutique donnée présente au moins une mutation comparée à la séquence en acides aminés de la protéine thérapeutique. Le nombre de mutations dans la séquence en acides aminés d’un variant comparée à la séquence en acides aminés de la protéine thérapeutique peut être supérieur ou égal à 2, supérieur ou égal à 3, voire supérieur ou égal à 4. Il s’agit là d’un paramètre de dé-immunisation à renseigner lors du paramétrage de l’algorithme génétique mis en œuvre dans le cadre de la présente invention.
De fait, la protéine thérapeutique et ses variants présentent le même nombre d’acides aminés désigné N et la séquence de la protéine thérapeutique et de chacun des variants répond à la formule AA1AA2…AAN-1AAN. Il n’existe aucune contrainte quant à la taille de la protéine thérapeutique à dé-immuniser. Typiquement, N est supérieur ou égal à 15, notamment supérieur ou égal à 20.
Les expressions «variant d’une protéine thérapeutique» et «mutant d’une protéine thérapeutique» sont équivalentes et utilisables de façon interchangeable dans la présente invention.
Par «population», on entend une collection d’au moins deux variants différents. Dans le cadre de la présente invention, une population comprend typiquement un grand nombre de variants différents. Avantageusement, une population dans l’invention comprend au moins 50 variants différents ou encore au moins 100 variants différents. A noter toutefois que des populations plus petites comme plus grandes peuvent aussi être envisagées.
Lors de l’étape a), la fourniture de la population de différents variants peut être soumise à une ou plusieurs contrainte(s). Par «contrainte», on entend une condition ou un paramètre que doit satisfaire l’ensemble des variants de la population.
A titre d’exemples de contraintes, on peut citer le nombre maximum d’acides aminés mutés dans les variants par rapport à la séquence de la protéine thérapeutique, le fait de ne pas muter certains acides aminés comme les cystéines ou encore le fait qu’un ou plusieurs acides aminés dans une protéine thérapeutique donnée puisse(nt) ne pas être muté(s) car connu(s) pour participer à la fonction biologique, à la structuration et/ou à la stabilité de la protéine thérapeutique.
Lorsque la fourniture de la population de différents variants est, lors de l’étape a) soumise à des contraintes, le respect de ces contraintes est vérifié, lors de l’étape e), pour chacun des variants nouvellement fournis et éventuellement, lors de l’étape d), pour lesmvariants sélectionnés. Cette dernière vérification est optionnelle car la vérification lors de l’étape a) et lors de l’étape e) de chacune des itérations doit garantir l’absence, parmi lesmvariants sélectionnés, de variants ne respectant pas au moins une des contraintes.
Dans le procédé selon la présente invention, l’immunogénicité des sous-fragments de chacun des variants peut être testé contre un seul allèle d’un gène du CMH I ou du CMH II, contre plusieurs allèles d’un gène du CMH I ou du CMH II, contre un seul allèle de plusieurs gènes du CMH I et/ou du CMH II ou encore contre plusieurs allèles de différents gènes du CMH I et/ou du CMH II. A titre d’exemples de gènes du CMH I ou du CMH II humain contre les allèles desquels l’immunogénicité peut être testée, on peut citer HLA-A, HLA-B, HLA-C, HLA-DRB1, HLA-DRB3, HLA-DRB4, HLA-DRB5, HLA-DRA, HLA-DQB1, HLA-DPB1, HLA-DQA1 et HLA-DPA1.
Dans le procédé selon l’invention, l’étape b1) consiste à générerin silicola totalité des sous-fragments de X acides aminés consécutifs issus de la séquence de N acides aminés du variant considéré. Pour ce faire, on génère, lors de cette étape, des sous-fragments glissants parmi lesquels le premier sous-fragment présente la séquence en acides aminés AA1à AAX, le second la séquence en acides aminés AA2à AAX +1, et ainsi de suite jusqu’au dernier sous-fragment de séquence AAN - X +1à AAN.
Typiquement, le nombre d’acides aminés des sous-fragments générés à partir des variants i.e. le nombre X est fonction de la nature de l’allèle ou des allèles contre lesquels l’immunogénicité doit être testée. En particulier, lorsque le ou les allèles testés sont un ou des allèles de gène(s) du CMH I, le nombre X est un nombre entier compris entre 8 et 11 et, par exemple, le nombre X peut être 9. De même, lorsque le ou les allèles testés sont un ou des allèles de gène(s) du CMH II, le nombre X est un nombre entier compris entre 9 et 18 et, par exemple, le nombre X peut être 12 ou 15.
A l’issue de l’étape b1), si la séquence de X acides aminés d’un sous-fragment d’un variant est connue pour être nonimmunogène par rapport à un ou plusieurs allèle(s) de gène(s) de CMH testé(s), par exemple, par expérience ou dans la littérature, un score d’immunogénicité IMmin, comme, par exemple, un score de 100, par rapport à l’allèle ou aux allèles de gène(s) de CMH lui est automatiquement attribué sans utiliser l’algorithme de prédiction lors de l’étape b2).
L’homme du métier connaît plusieurs algorithmes permettant de prédire le caractère immunogène d’une séquence peptidique par rapport à un ou plusieurs allèles de gène(s) du CMH I ou du CMH II.
Ces algorithmes sont basés, pour la plupart, sur la bonne corrélation entre l’affinité d’un peptide pour une molécule du CMH I ou du CMH II et l’immunogénicité dudit peptide chez le vertébré auquel appartient la molécule du CMH I ou du CMH II testée.
Ainsi, les données de tests de liaison ont permis d’alimenter des bases de données consultables sur internet. A titre d’exemples particuliers de bases de données de liaison de peptides aux molécules du CMH I ou du CMH II, on peut citer SYFPEITHI, IEDB, MHCBN et AntiJen. Ces bases de données ont servi à générer des algorithmes pour prédire, de façon bio-informatique, la liaison d’un peptide à une molécule du CMH I ou du CMH II particulière.
A titre d’exemples particuliers d’algorithmes de prédiction utilisables lors de l’étape b2) du procédé selon l’invention, on peut citer les algorithmes SVMHC, NetMHCpan, NetMHCII, NetMHCIIpan, TEPITOPE/propred, TEPITOPEpan, SYFPEITHI et Rankpep.
SVMHC est un algorithme basé sur une classification par vecteurs de support ou SVM (pour «Support Vector Machine»)[7]. Il prédit des liants pour les molécules du CMH I ou du CMH II. Cet algorithme est accessible via http://www-bs.informatik.uni-tuebingen.de/SVMHC/[8].
NetMHCpan est un algorithme connu pour identifier et/ou prédire la liaison de peptides à toute molécule du CMH I de séquence connue à l’aide de réseaux de neurones artificiels. La méthode est entraînée sur une combinaison de plus de 180 000 données de liaison quantitatives couvrant, en 2019 (version 4.0), 172 molécules de CMH d'origine humaine (HLA-A, B, C, E), murine (H-2), bovine (BoLA), primate (Patr, Mamu, Gogo) et porcine (SLA). L’algorithme NetMHCpan est accessible sur le site http://www.cbs.dtu.dk/services/NetMHCpan/[9].
NetMHCII est un algorithme connu pour identifier et/ou prédire, de façon quantitative, la liaison de peptides à des molécules HLA de classe II donnée (HLA-DR, HLA-DQ et HLA-DP) et des allèles de CMH II murin utilisant des réseaux de neurones artificiels. La version de l’algorithme NetMHCII 2.3 a été entraînée sur 134281 couples de données d’entrée réparties sur 36 allèles HLA-DR, 27 HLA-DQ et 9 HLA-DP. L’algorithme NetMHCII existe en une version «Pan» désignée NetMHCIIpan. Alors que l’algorithme NetMHCII a autant de réseaux de neurones que d’allèles, NetMHCIIpan présente un seul réseau de neurones pour tous les allèles dont la séquence est connue. NetMHCII et NetMHCIIpan sont respectivement accessibles sur les sites http://www.cbs.dtu.dk/services/NetMHCII/[10]et http://www.cbs.dtu.dk/services/NetMHCIIpan/[11].
TEPITOPE/propred est un algorithme visant à prédire les régions liant des molécules CMH II dans des séquences antigéniques, en utilisant des matrices quantitatives dérivées de la publication de Sturnioloet al, 1999[ 12 ]. L’algorithme TEPITOPE/propred est accessible sur le site http://crdd.osdd.net/raghava/propred/[13]. Il existe également une version «pan» de l’algorithme TEPITOPE/propred. L’algorithme TEPITOPEpan étend les prédictions à des molécules CMH II qui ne sont pas présentes dans le set d’allèles d’entraînement de l’algorithme. Plus particulièrement, TEPITOPEpan étend la prédiction à 700 molécules HLA-DR mais ne réalise pas de prédiction additionnelle pour les molécules HLA-DP et HLA-DQ. L’algorithme TEPITOPEpan est accessible sur le site http://datamining-iip.fudan.edu.cn/service/TEPITOPEpan/index.html[14].
L’algorithme SYFPEITHI permet d’identifier de potentiels épitopes en cherchant des motifs particuliers et, par la même, de prédire des peptides liant les molécules CMH I ou CMH II. Cet algorithme accessible sur le site http://www.syfpeithi.de/[15]met à profit la base de données SYFPEITHI comprenant plus de 7000 séquences peptidiques connues pour lier des molécules CMH I ou CMH II de différentes origines, par exemple, des molécules CMH I ou CMH II humaines, bovines et aviaires.
L’algorithme RankPep utilise des matrices de notation spécifiques à la position ou des profils provenant d'ensembles de peptides alignés connus pour se lier à une molécule CMH I ou CMH II donnée et ce, pour prédire la liaison CMH-peptide. Cet algorithme est accessible sur le site http://imed.med.ucm.es/Tools/rankpep.html[16].
Il existe d’autres algorithmes de prédiction utilisables dans le procédé selon l’invention comme, par exemple, IEDB_ARB, IEDB_Comblib, IEDB_SMM-align, IEDB_Cons, EpicCapo, PAAQD, POPI, Propred, Multipred et EpiToolKit.
Avantageusement, l’algorithme de prédiction mis en œuvre lors de l’étape b2) du procédé selon l’invention est choisi dans le groupe constitué par NetMHCpan, NetMHCII, NetMHCIIpan, TEPITOPE/propred et TEPITOPEpan. Il est évident que le même algorithme de prédiction doit être utilisé lors de l’étape b2) de chacune des itérations mises en œuvre lors d’un même procédé de sélection.
De manière générale, les scores d’immunogénicité prennent leurs valeurs dans un intervalle [IMmax,IMmin] où IMminreprésente une valeur d’immunogénicité minimale et IMmaxreprésente une valeur d’immunogénicité maximale, sachant que plus le score d’immunogénicité est petit, plus le sous-fragment est immunogène.
A titre d’exemple, l’étape b1) consiste à attribuer, à chaque sous-fragment, pour chaque allèle considéré, au moyen d’un algorithme de prédiction, un score d’immunogénicité compris entre 0 et 100. Ainsi donc, dans cet exemple, IMmaxest 0 et IMminest 100, un tel score indiquant que le sous-fragment correspondant est nonimmunogène. Chaque score d’immunogénicité obtenu lors d’une étape b2) est un nombre entier compris entre 0 et 100.
A noter qu’il peut être nécessaire de normaliser les scores d’immunogénicité obtenus lors d’une étape b2) notamment pour tenir compte du fait que les plages de scores relatives à deux allèles différents peuvent ne pas être identiques. Les scores bruts d’immunogénicité sont transformés en percentiles qui eux sont compris entre 0 et 100. Les scores bruts ne sont pas toujours compris entre 0 et 100. Pour ce faire, on prend l’ensemble (ou 5% aléatoires suivant les méthodes) des scores mesurés disponibles dans les bases de données par allèles et, après les avoir ordonnés, on définit alors une distribution des scores qui permet de calculer les percentiles.
Les scores d’immunogénicité obtenus lors de l’étape b2) pour l’ensemble des sous-fragments d’un variant vis-à-vis d’un ou plusieurs allèle(s) de gène(s) de CMH I ou de CMH II peuvent être présentés sous forme d’une liste incrémentée à chaque nouveau score d’immunogénicité évalué, sous forme d’une liste générée une fois la normalisation des scores d’immunogénicité effectuée ou, en variante, sous forme d’une matrice, cette dernière étant générée une fois les scores d’immunogénicité pour l’ensemble des sous-fragments d’un variant obtenus et éventuellement normalisés.
Dans cette variante, le procédé selon la présente invention comprend une étape additionnelle, suite à l’étape b2) et préalablement à l’étape b3), consistant à générer, à partir des scores attribués lors de l’étape b2), une matrice de dimensionYxNdans laquelle
les colonnes C1à CNcorrespondent aux acides aminés AA1à AANdu variant,
dans le cas où Y est égal à 1, la ligne L unique correspond au seul allèle testé ou, dans le cas où Y est supérieur ou égal à 2, les lignes L1à LYcorrespondent chacune à un des Y allèles testés,
le score indiqué en position Cjsur une ligne donnée correspondant au score d’immunogénicité attribué, pour l’allèle correspondant à ladite ligne, au sous-fragment de X acides aminés dont le premier acide aminé est l’acide aminé AAjdans la séquence en acides aminés du variant.
Comme précédemment expliqué, le procédé selon l’invention est original essentiellement au niveau du classement comparatif des différents variants étudiés. Ce classement implique non seulement l’étape c) du procédé mais aussi l’étape b3).
L’homme du métier comprend que, dans le classement comparatif mis en œuvre dans la présente invention, on calcule la fonction de répartition du score d’immunogénicité pour chacun des variants et que l’on compare cette fonction de répartition pour l’ensemble des variants, deux à deux. En d’autres termes, dans une recherche par valeurs croissantes, la première valeurV i pour laquelle les fonctions de répartition relatives aux deux variants diffèrent, permet de comparer l’immunogénicité des deux variants en question, le variant correspondant à la valeur la plus faible de la fonction de répartition enV i étant estimé comme le moins immunogène des deux.
Dans l’exemple où IMmaxest égal à 0 et IMminà 100, l’étape b3) consiste, en considérant, pour un variant donné, l’ensemble des scores d’immunogénicité attribués lors de l’étape b2), à associer à chacun des scores d’immunogénicité Sicompris entre 0 et 99, une valeurV i définie comme la somme des occurrences des scores compris entre 0 etS i . En d’autres termes, si le score 0 a été attribué x0fois lors de l’étape b2), la valeurV 0 est égale à x0; si le score 1 a été attribué x1fois lors de l’étape b2), la valeurV 1 est égale à x0+ x1; si le score 2 a été attribué x2fois lors de l’étape b2), la valeurV 2 est égale à x0+ x1+ x2et ainsi de suite jusqu’au score 99. Il est évident que, lors de l’étape b3), il n’est pas nécessaire de considérer le score d’immunogénicité 100 puisque la valeurV 100 est toujours égale à NY et ne permet pas de comparer les variants entre eux.
A l’issue de l’étape b3), on obtient une liste de 100 éléments correspondant aux valeursV 0 àV 99 obtenues pour un variant donné dont l’immunogénicité a été testée à l’encontre de Y allèle(s) de gène(s) du CMH. L’étape c) consiste à comparer les variants dont l’immunogénicité a été testée à l’encontre des mêmes Y allèle(s) de gène(s) du CMH en comparant les valeursV 0 àV 99 obtenues pour ces variants, deux à deux. Pour ce faire, on considère la valeurV 0 , si elle est différente pour deux variants, celui qui présente la valeurV 0 la plus faible est considéré comme le moins immunogène des deux. Si, au contraire, la valeurV 0 est identique pour les deux variants, on considère la valeurV 1 avec application des mêmes règles que pour la valeurV 0 et ainsi de suite, jusqu’à la première valeurV i différente entre les deux variants.
Une fois les variants dont l’immunogénicité a été testée à l’encontre des mêmes Y allèle(s) de gène(s) du CMH comparés deux à deux, les variants sont triés en fonction de leur caractère immunogène, l’étape d) du procédé selon l’invention consistant à sélectionner lesmvariants les moins immunogènes. A titre d’exemples et en fonction de la population initiale, le nombre entiermpeut être 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15. Avantageusement, le nombre entiermest 10.
Le procédé de sélection selon la présente invention implique une phase de reproduction dans laquelle on fait croître la population par un facteur multiplicatif prédéterminé 1/η avec 0<η<1. Pour ce faire, une fraction η de la nouvelle population est composée de variants choisis dans la population de l’itération précédente, la fraction restante (1-η) étant composée de nouveaux variants.
Typiquement, la fraction η peut être 5%, 10%, 15%, 20%, 25%, 30%, 35% ou encore 40%. Avantageusement, la fraction η est 10% et donc la fraction (1-η) est 90%.
Dans la fraction η de variants choisis dans la population de l’itération précédente, une fraction α avec 0<α<1 est constituée par les variants les moins immunogènes tels qu’obtenus à l’issue de l’étape c) de l’itération précédente et la fraction restante (1-α) est constituée par des variants choisis aléatoirement dans la population de l’itération précédente. Il est clair que, pour que les variants compris dans la fraction ηsoient différents, il faut qu’aucun des variants choisis aléatoirement compris dans la fraction (1-α) ne soit identique à un des variants les moins immunogènes compris dans la fraction α.
Typiquement, la fraction α peut être 45%, 50%, 55%, 60%, 65%, 70%, 75% ou encore 80%. Avantageusement, la fraction α est 75% et donc la fraction (1-α) est 25%.
Pour la fraction (1-η) de la nouvelle population composée de nouveaux variants, ces derniers sont créés à partir des variants de la population mise en œuvre à l’itération précédente par mutation aléatoire et/ou par croisement. Il convient de noter que les variants dans une nouvelle population, lors d’une quelconque itération, ne sont pas forcément tous différents, contrairement aux variants de la population fournie lors de l’étape a) du procédé.
Dans le cas d’une mutation aléatoire, on remplace, dans la séquence de X acides aminés d’un variant de la population mise en œuvre à l’itération précédente, aléatoirement, un acide aminé par un autre acide aminé différent.
Dans le cas d’un croisement, on effectue un croisement entre deux variants de la population mise en œuvre à l’itération précédente i.e. les parents. Plus particulièrement, on choisit aléatoirement la position du croisement et, après cette position, les mutations entre les deux parents sont échangées, aboutissant de fait à deux nouveaux variants i.e. les enfants.
Parmi les nouveaux variants, le rapport entre les variants obtenus par croisement et les variants obtenus par mutation aléatoire peut être quelconque. Ainsi, les nouveaux variants peuvent être obtenus à 100% par croisement, à 100% par mutation aléatoire, à 90% par croisement et à 10% par mutation aléatoire, à 80% par croisement et à 20% par mutation aléatoire, à 70% par croisement et à 30% par mutation aléatoire, à 60% par croisement et à 40% par mutation aléatoire, à 50% par croisement et à 50% par mutation aléatoire, à 40% par croisement et à 60% par mutation aléatoire, à 30% par croisement et à 70% par mutation aléatoire, à 20% par croisement et à 80% par mutation aléatoire, à 10% par croisement et à 90% par mutation aléatoire
Dans un mode de réalisation particulier, les nouveaux variants sont obtenus à 30% par croisement et à 70% par mutation aléatoire.
L’étape e) du procédé selon la présente invention consiste à itérer les étapes b), c) et d) sur une nouvelle population telle que définie ci-dessus. Il est évident que la population fournie lors de l’étape a) et toute nouvelle population fournie pour une itération lors de l’étape e) présente le même nombre de variants.
Le procédé est terminé lorsque lesmvariants sélectionnés aux étapes d) de W itérations successives sont identiques. A titre d’exemples et en fonction de la population initiale, le nombre entier W peut être 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15. Avantageusement, le nombre entier W est 10.
La présente invention concerne également un programme informatique comprenant des instructions lisibles par ordinateur qui, lorsqu'elles sont exécutées par un processeur, font en sorte que l'ordinateur effectue les étapes d’un procédé pour sélectionner des variants d’une protéine thérapeutique, présentant un caractère moins immunogène que ladite protéine thérapeutique, ledit procédé étant tel que précédemment défini.
Avantageusement, le programme informatique objet de l’invention est incorporé dans un support de stockage.
La présente invention concerne aussi un système pour sélectionner des variants d’une protéine thérapeutique, présentant un caractère moins immunogène que ladite protéine thérapeutique, comprenant:
a) des moyens logiciels pour générer (ou fournir) une population de différents variants de ladite protéine thérapeutique, la séquence de N acides aminés de chaque variant se distinguant de la séquence de N acides aminés de ladite protéine thérapeutique par au moins un acide aminé;
b) des moyens logiciels pour évaluer, pour chaque variant, les propriétés immunogènes vis-à-vis de Y allèle(s) de gène(s) du Complexe Majeur d’Histocompatibilité, avec Y représentant un nombre entier, supérieur ou égal à 1 en effectuant les étapes consistant à:
b1) générer, pour chaque variant, l’ensemble des sous-fragments de X acides aminés consécutifs issus de la séquence de N acides aminés du variant, avec X représentant un nombre entier, supérieur ou égal à 8;
b2) attribuer, à chaque sous-fragment, pour chaque allèle considéré, au moyen d’un algorithme de prédiction, un score d’immunogénicité dans un intervalle [IMmax,IMmin] où IMminreprésente une valeur d’immunogénicité minimale et IMmaxreprésente une valeur d’immunogénicité maximale;
b3) associer, à partir de l’ensemble des scores attribués lors de l’étape b2), à chaque scoreS i , une valeurV i définie comme la fonction de répartition deS i ;
c) des moyens logiciels pour comparer et classer les variants en fonction de leur caractère immunogène en les comparant, deux à deux, sur la base des valeursV i obtenues à l’étape b3), sachant que, dans une recherche par valeurs croissantes, un premier variant est considéré comme moins immunogène qu’un second variant lorsque, pour la première valeurV i différente entre le premier et le second variants, le premier variant présente une valeurV i inférieure à celle du second variant;
d) des moyens logiciels pour sélectionner lesmvariants les moins immunogènes de la population testée;
e) des moyens logiciels pour itérer les étapes b) à d) jusqu’à ce que lesmvariants les moins immunogènes soient les mêmes pour W itérations successives,
une nouvelle population de variants étant utilisée à chaque itération, chaque nouvelle population consistant en une fraction η, avec 0<η<1, composée de variants choisis dans la population de l’itération précédente et une fraction (1-η) composée de nouveaux variants.
Avantageusement, le système selon la présente invention comprend en outre des moyens logiciels pour générer, à partir des scores attribués lors de ladite étape b2), une matrice de dimensionYxNdans laquelle
les colonnes C1à CNcorrespondent aux acides aminés AA1à AANdu variant,
dans le cas où Y est égal à 1, la ligne L unique correspond au seul allèle testé ou, dans le cas où Y est supérieur ou égal à 2, les lignes L1à LYcorrespondent chacune à un des Y allèles testés,
le score indiqué en position Cjsur une ligne donnée correspondant au score d’immunogénicité attribué, pour l’allèle correspondant à ladite ligne, au sous-fragment de X acides aminés dont le premier acide aminé est l’acide aminé AAjdans la séquence en acides aminés du variant.
La présente invention concerne un procédé pour produire au moins un variant d’une protéine thérapeutique présentant un caractère moins immunogène que ladite protéine thérapeutique consistant à:
sélectionner au moins un variant parmi lesmvariants obtenus à l’issue de l’étape d) de la dernière itération du procédé de sélection tel que précédemment défini et produire ledit au moins un variant ainsi sélectionné.
Une fois le procédé de sélection objet de l’invention mis en œuvre, lesmvariants les moins immunogènes sont obtenus. Il est facile, pour l’homme du métier, de produire un ou plusieurs de cesmvariants.
En effet, la séquence de N acides aminés d’un tel variant étant connue dans le procédé de sélection selon l’invention, la séquence nucléotidique la codant peut être obtenue par des techniques classiques de biologie moléculaire comme la mutagénèse dirigée à partir de la séquence nucléotidique codant la protéine thérapeutique correspondante ou de biologie synthétique.
A partir de la séquence nucléotidique codant le variant d’intérêt, il est facile de produire ce dernier, en introduisant la séquence nucléotidique dans un vecteur d’expression, comme, par exemple, un plasmide, un cosmide, un bactériophage et un virus tel qu’un baculovirus.
Un tel vecteur est notamment utile pour produire, grâce à un système acellulaire du type extrait d’Escherichia coli, lysat de germes de blé ou extrait de réticulocytes de lapin, le variant tel que sélectionné selon la présente invention. L’homme du métier connaît différentes techniques pour récupérer le variant d’intérêt à partir de tels systèmes acellulaires.
En variante, un tel vecteur d’expression peut être utilisé pour transformer un organisme hôte tel qu’une bactérie, une levure, un champignon, une cellule végétale, une cellule d’insecte ou une cellule de mammifère et exprimer, dans cet organisme hôte, un variant sélectionné selon la présente invention. Dans cette variante, l’organisme hôte est mis en culture dans un milieu de culture et dans des conditions appropriées et le variant d’intérêt est récupéré à partir du milieu de culture ou à partir de l’organisme hôte cultivé.
Une fois le variant d’intérêt produit, il est également possible de vérifier, de façon expérimentale, son immunogénicité notamment au moyen de tests cellulaires.
La présente invention concerne enfin un procédé pour produire au moins un variant d’une protéine thérapeutique présentant un caractère moins immunogène que ladite protéine thérapeutique et présentant une activité fonctionnelle supérieure ou égale à celle de ladite protéine thérapeutique consistant à
produire au moins un variant d’une protéine thérapeutique présentant un caractère moins immunogène que ladite protéine thérapeutique conformément au procédé de production tel que précédemment défini,
mesurer l’activité fonctionnelle dudit variant,
la comparer à l’activité fonctionnelle de ladite protéine thérapeutique et
sélectionner ledit variant lorsque l’activité fonctionnelle dudit variant est supérieure ou égale à l’activité de ladite protéine thérapeutique.
Par «activité fonctionnelle», on entend au moins une activité choisie dans le groupe constitué par une activité enzymatique, une activité de reconnaissance et de liaison à un antigène, une activité de transport de molécules ou d’ions, une activité de régulation d’au moins un processus cellulaire ou physiologique, une activité de résistance à un pathogène ou à une toxine, (A compléter, si nécessaire).
La mesure d’une activité fonctionnelle est également bien connue de l’homme du métier et varie en fonction de la protéine thérapeutique et du variant à tester. Dans certains cas, l’activité fonctionnelle peut être mesurée en examinant des marqueurs d'activation tels que la phosphorylation, ou la localisation d’une molécule. Les tests pour mesurer l’activité fonctionnelle sont également dépendants de la protéine thérapeutique et du variant et connus de l’homme du métier, et peuvent inclure, mais ne sont pas limités à des tests enzymatiques, des tests d'adhérence, des tests de mort cellulaire, des tests de prolifération et des tests de mobilité.
Par ailleurs, il est évident que pour comparer l’activité fonctionnelle d’un variant et celle de la protéine thérapeutique correspondante, la mesure de ces deux activités doit être réalisée lors de tests réalisés dans des conditions et modes opératoires, identiques.
D’autres caractéristiques et avantages de la présente invention apparaîtront encore à l’homme du métier à la lecture des exemples ci-dessous donnés à titre illustratif et non limitatif, en référence à la Figure unique annexée.
Brève description des figures
propose une représentation schématisée du procédé de dé-immunisation selon l’invention impliquant un algorithme génétique.
I. Procédé de dé-immunisation selon l’invention.
Tel que représenté à la Figure unique, le procédé de dé-immunisation selon l’invention est divisé en 3 étapes avec:
1. les entrées et paramètres de l’algorithme génétique
2. l’exécution de l’algorithme génétique et
3. l’arrêt de l’algorithme génétique et la production du rapport.
I.1. Les entrées et paramètres de l’algorithme génétique.
Ces entrées et paramètres correspondent aux renseignements, lors du paramétrage de l’algorithme génétique, fournis par l’utilisateur.
Entrées pour la dé-immunisation:
- La protéine thérapeutique à dé-immuniser (sans contrainte de taille);
- La méthode de prédiction de l’immunogénicité i.e. l’algorithme de prédiction mis en œuvre lors de l’étape b2) du procédé qui peut être sur le CMH I et/ou sur le CMH II;
- Un allèle ou un ensemble d’allèles.
Paramètres pour la dé-immunisation:
- L’intervalle de mutations souhaité i.e. le nombre maximum de mutations que peut présenter chacun des variants;
- Le nombre de mutants MU dans le rapport.
Paramètres facultatifs pour la dé-immunisation:
- Un ensemble de règles de mutations peut être renseigné; il s’agit là des contraintes que toute population de différents variants fournie durant le procédé doit respecter;
- Un ensemble de séquences nonimmunogènes: si, pendant son calcul, l’algorithme génétique trouve un sous-fragment nonimmunogène dans le variant, les scores de ces sous-fragments seront automatiquement considérés comme nonimmunogènes sans utilisation de la prédiction. Par exemple, si l’utilisateur travaille sur une protéine destinée aux humains, il pourra alors renseigner un ensemble de séquences humaines comme étant nonimmunogènes. Ainsi, lorsque la méthode de prédiction détecte un sous-fragment comme une séquence humaine nonimmunogène, ce sous-fragment sera automatiquement considéré comme nonimmunogène et un score de 100 lui sera attribué quel que soit le résultat de la prédiction.
I.2. L’exécution de l’algorithme génétique.
Le principe d’un algorithme génétique est de faire évoluer une population de variants (dans le cas présent, des protéines) en l’améliorant, au fur et à mesure des itérations, en fonction du critère de sélection (dans le cas présent, variants les moins immunogènes). Quand la population est stable, c’est-à-dire qu’elle ne subit pas d’amélioration significative depuis 10 itérations, alors l’algorithme s’arrête.
L’algorithme génétique se déroule en trois étapes itératives précédées d’une étape d’initiation:
1. Initia lisa tion:
Pendant la phase d’initialisation, l’algorithme construit une population de départ. Cette population est constituée de variants créés en mutant aléatoirement la séquence de la protéine thérapeutique. La population initiale est constituée de MU x 1,2 variants avec MU le nombre de variants voulus en sortie. Les variants respectent les règles de mutations s’il y en a.
2 . Reproduc tion:
La phase de reproduction fait croître la population 10 fois: 10% de cette population est composée à 75% des meilleurs variants (i.e. les variants les moins immunogènes) de la population de l’itération précédente et à 25% de variants choisis aléatoirement dans la population de l’itération précédente, les 90% restants étant composés de nouveaux variants.
Ces nouveaux variants sont créés à partir des variants de l’itération précédente en suivant deux stratégies de mutation. La première mute un de ces variants à une position aléatoire par un acide aminé aléatoire et la seconde effectue un croisement entre deux variants (parents). La position du croisement est choisie aléatoirement, après cette position, les mutations entre les deux parents sont échangées ce qui aboutit à deux nouveaux variants (enfants). La population de nouveaux variants est reproduite avec 70% de nouveaux variants issus de mutations aléatoires et 30% issus de croisements.
Si le nombre de mutations pour un nouveau variant dépasse l’intervalle de mutations souhaité, des mutations sont enlevées de façon aléatoire jusqu’à ce que la contrainte de l’intervalle de mutation soit à nouveau remplie. S’il y en a, les règles de mutations sont prises en compte durant cette étape.
3 . Evalua tion:
La phase d’évaluation calcule un score sur l’ensemble des variants de la population une fois la reproduction finie. Un variant est évalué par groupe de sous-fragments de X acides aminés. Par exemple, avec la séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1 dans le listage de séquences annexé) et une taille de sous-séquence de 9 acides aminés (X = 9), les deux premiers sous-fragments sont AIKFFCNFL (séquence SEQ ID NO: 2) et IKFFCNFLK (séquence SEQ ID NO: 3).
La taille des sous-fragments X est déterminée en fonction de la classe du CMH étudié. Pour le CMH I, l’utilisateur peut choisir X compris entre 9 et 15 et, pour le CMH II, X peut être fixé à 9.
La méthode de prédiction calcule un score d’immunogénicité pour chaque sous-fragment du variant et pour chaque allèle. Les scores sont normalisés entre 0 et 100 sachant que plus le score est petit, plus le sous-fragment est immunogène.
Si un sous-fragment est un sous-fragment de l’ensemble des séquences nonimmunogènes, un score de 100 lui est attribué. Le Tableau 1 ci-après illustre les scores de la séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1 dans le listage de séquences annexé) avec X égal à 9 et pour les allèles DRB1_0101, DRB1_0301, DRB1_0401 et DRB1_0405.
4 . Sélect ion:
L’étape de sélection trie les variants en fonction du critère tel que défini aux étapes b3) et c) du procédé selon l’invention. Une fois l’ensemble des séquences trié, on ne conserve que les 10% de la population totale qui sont utilisés lors de l’étape de reproduction.
I.3. L’arrêt de l’algorithme génétique et la production du rapport.
L’algorithme s’arrête lorsque la population n’a pas été améliorée pendant 10 itérations consécutives. Après chaque itération, les 10 meilleurs variants sont comparés avec les 10 meilleurs variants de l’itération précédente. Si aucun nouveau variant n’a été introduit dans cette liste entre les deux itérations, le compteur de stabilité est incrémenté. Lorsque celui-ci atteint 10, l’algorithme est stoppé.
Le rapport est au format tableur avec trois types de présentation:
- Variants affichés de manière compacte: ce type de présentation affiche une version compacte de l’ensemble des MU meilleurs variants,
- Variants affichés de manière détaillée: ce type de présentation affiche une version détaillée de l’ensemble des MU meilleurs variants, et
- Statistique: ce type de présentation affiche le pourcentage de mutation pour chaque position et pour chaque acide aminé parmi l’ensemble des variants avec l’intervalle de mutations souhaité.
I I . Illustration du classement comparatif mis en œuvre dans le procédé selon l’invention .
II.1. Obtention de la liste d’occurrences.
Comme déjà expliqué l’originalité du procédé selon l’’invention réside dans le classement des scores d’immunogénicité et leurs comparaisons entre différents variants d’une même protéique thérapeutique.
Les scores d’une séquence sont composés d’un tableau de percentiles, 0 étant fortement immunogène et 100 nonimmunogène. Ce tableau comporte un score pour chaque sous-séquence de X acides aminés et pour chaque allèle HLA contre lequel le caractère immunogène est étudié. Par exemple, avec la séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1) et une taille de sous-séquence de 9 acides aminés (X = 9), les deux premières sous-séquences sont AIKFFCNFL (séquence SEQ ID NO: 2) et IKFFCNFLK (séquence SEQ ID NO: 3).
Un exemple de score obtenu en utilisant TEPITOPEpan pour la sous-séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1) est présenté dans le tableau 1 ci-après. Dans ce tableau, le score de 30 pour l’allèle DRB1_0101 situé sous la lettre I correspond au score de la sous-séquence de 9 acides aminés commençant par un «I» i.e. la sous-séquence IKFFCNFLK (séquence SEQ ID NO: 3).
Pour classer les variants, on procède comme suit. Pour chaque séquence, on compte le nombre d’occurrences de scores s avec s ≤ i avec pour chaque sous-séquence de X acides aminés. On obtient la liste d’occurrences des scores de longueur 100 qui représente le nombre de scores inférieurs ou égaux à 0, 1, 2 jusqu’à 99. Le Tableau 2 illustre la liste obtenue pour la séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1) sur la base des scores du Tableau 1.
II.2. Comparaison de plusieurs séquences.
A. Séquence APKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 4).
Le Tableau 3 correspond au score obtenu pour chaque sous-séquence de 9 acides aminés de la séquence APKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 4 dans le listage de séquences annexé) et ce, pour les allèles DRB1_0101, DRB1_0301 et DRB1_0401.
Le Tableau 4 illustre la liste obtenue pour la séquence APKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 4) sur la base des scores du Tableau 3.
B. Séquence APKFDCNFDKNLFSAKFA (séquence SEQ ID NO: 5).
Le Tableau 5 correspond au score obtenu pour chaque sous-séquence de 9 acides aminés de la séquence APKFDCNFDKNLFSAKFA (séquence SEQ ID NO: 5 dans le listage de séquences annexé) et ce, pour les allèles DRB1_0101, DRB1_0301 et DRB1_0401.
Le Tableau 6 illustre la liste obtenue pour la séquence APKFDCNFDKNLFSAKFA (séquence SEQ ID NO: 5) sur la base des scores du Tableau 5.
C. Séquence APKFPCNFDKNLFSAKFA (séquence SEQ ID NO: 6).
Le Tableau 7 correspond au score obtenu pour chaque sous-séquence de 9 acides aminés de la séquence APKFPCNFDKNLFSAKFA (séquence SEQ ID NO: 6) et ce, pour les allèles DRB1_0101, DRB1_0301 et DRB1_0401.
Le Tableau 8 illustre la liste obtenue pour la séquence APKFPCNFDKNLFSAKFA (séquence SEQ ID NO: 6) sur la base des scores du Tableau 7.
D. Séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1).
Le Tableau 9 illustre la liste obtenue pour la séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1) sur la base des scores du Tableau 1 pour les allèles DRB1_0101, DRB1_0301 et DRB1_0401.
E. Conclusions.
Les listes d’occurrences des Tableaux 4, 6, 8 et 9 permettent de comparer les séquences SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 5 et SEQ ID NO: 6).
Sachant deux séquences avec, pour chacune, la liste d’occurrences de scores correspondante, on parcourt les occurrences en commençant au score 0. Si, pour les deux séquences, le nombre d’occurrences n’est pas le même, la séquence qui a le plus petit nombre d’occurrences sera considérée comme meilleure i.e. le moins immunogène et la comparaison est finie. Si les occurrences sont égales, on regarde le nombre d’occurrences du score 1 et ainsi de suite.
Sur la base de ces règles de comparaison et à partir des résultats présentés aux Tableaux 4, 6, 8 et 9, on peut définir que, vis-à-vis des allèles DRB1_0101, DRB1_0301 et DRB1_0401,
la séquence AIKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 1) est plus immunogène que la séquence APKFFCNFLKNLFSAKFA (séquence SEQ ID NO: 4), elle-même plus immunogène que la séquence APKFPCNFDKNLFSAKFA (séquence SEQ ID NO: 6), elle-même plus immunogène que la séquence APKFDCNFDKNLFSAKFA (séquence SEQ ID NO: 5). Parmi les séquences testées, la séquence APKFDCNFDKNLFSAKFA (séquence SEQ ID NO: 5) est donc la moins immunogène.
III. Comparaison des performances du procédé selon l’invention avec celui de l’algorithme disponible dur le site de l’IEDB [3].
Comme l’algorithme proposé par l’IEDB «Deimmunization tool»[3]ne permet de ne considérer qu’une seule mutation, le procédé de l’invention a été comparé dans le cadre d’une recherche de variants pour une protéine de séquence aléatoire où seule une mutation est autorisée.
Les paramètres du Tableau 10 ci-après ont été considérés:
Dans ces conditions, le temps de calcul est de 4 min pour le procédé selon l’invention et de 12 min pour l’algorithme «Deimmunization tool». La solution décrite dans l’invention est donc plus rapide: le temps de calcul est au moins divisé par trois.
De plus, les variants proposés par le procédé selon l’invention sont moins immunogènes que ceux proposés par l’algorithme «Deimmunization tool».
Références Bibliographiques
[1]Brevet EP1516275 B1 publiée le 7 mars 2007.
[2]Demande de brevet US2012/148559 A1 publiée le 14 juin 2012.
[3]http://tools.iedb.org/deimmunization
[4]Choiet al, 2017, «EpiSweep: Computationally driven reengineering of therapeutic proteins to reduce immunogenicity while maintaining function», Methods Mol Biol., vol. 1529, pages 375-398.
[5]Lesparreet al, 2018, «Predeep: Deep learning pour la prédiction d’épitopes réels», ROADEF 18.
[6]Lesparreet al, 2018, «Dé-immunisation de protéines thérapeutiques à l’aide d’un algorithme génétique», Sessions ROSa - ROADEF 2018.
[7]Dönnes & Kohlbacher, 2006, «SVMHC: a server for prediction of MHC-binding peptides», Nucleic Acids Res., vol. 34, W194–W197.
[8]http://www-bs.informatik.uni-tuebingen.de/SVMHC/
[9]http://www.cbs.dtu.dk/services/NetMHCpan/
[10]http://www.cbs.dtu.dk/services/NetMHCII/
[11]http://www.cbs.dtu.dk/services/NetMHCIIpan/
[12]Sturnioloet al, 1999, «Generation of tissue-specific and promiscuous HLA ligand databases using DNA microarrays and virtual HLA class II matrices», Nature Biotechnology, vol. 17, pages 555–561
[1 3 ]http://crdd.osdd.net/raghava/propred/
[14]http://datamining-iip.fudan.edu.cn/service/TEPITOPEpan/index.html
[15]http://www.syfpeithi.de/
[16]http://imed.med.ucm.es/Tools/rankpep.html

Claims (17)

  1. Procédé pour sélectionner des variants d’une protéine thérapeutique, présentant un caractère moins immunogène que ladite protéine thérapeutique, comprenant les étapes consistant à:
    a) fournir une population de différents variants de ladite protéine thérapeutique, la séquence de N acides aminés de chaque variant se distinguant de la séquence de N acides aminés de ladite protéine thérapeutique par au moins un acide aminé;
    b) évaluer, pour chaque variant de la population, les propriétés immunogènes vis-à-vis de Y allèle(s) de gène(s) du Complexe Majeur d’Histocompatibilité, avec Y représentant un nombre entier, supérieur ou égal à 1, ladite étape (b) consistant à:
    b1) générer, pour chaque variant, l’ensemble des sous-fragments de X acides aminés consécutifs issus de la séquence de N acides aminés du variant, avec X représentant un nombre entier, supérieur ou égal à 8;
    b2) attribuer, à chaque sous-fragment, pour chaque allèle considéré, au moyen d’un algorithme de prédiction, un score d’immunogénicité dans un intervalle [IMmax,IMmin] où IMminreprésente une valeur d’immunogénicité minimale et IMmaxreprésente une valeur d’immunogénicité maximale;
    b3) associer, à partir de l’ensemble des scores attribués lors de l’étape b2), à chaque scoreS i , une valeurV i définie comme la fonction de répartition deS i ;
    c) comparer et classer les variants en fonction de leur caractère immunogène en les comparant, deux à deux, sur la base des valeursV i obtenues à l’étape b3), sachant que, dans une recherche par valeurs croissantes, un premier variant est considéré comme moins immunogène qu’un second variant lorsque, pour la première valeurV i différente entre le premier et le second variants, le premier variant présente une valeurV i inférieure à celle du second variant;
    d) sélectionner lesmvariants les moins immunogènes de la population testée;
    e) itérer les étapes b) à d) jusqu’à ce que lesmvariants les moins immunogènes soient les mêmes pour W itérations successives,
    une nouvelle population de variants étant utilisée à chaque itération, chaque nouvelle population consistant en une fraction η, avec 0<η<1, composée de variants choisis dans la population de l’itération précédente et une fraction (1-η) composée de nouveaux variants.
  2. Procédé selon la revendication 1, caractérisé en ce que la fourniture de la population de différents variants est soumise, lors de l’étape a), à une ou plusieurs contrainte(s) et le respect de cette/ces contrainte(s) est vérifié, lors de l’étape e), pour chacun des variants nouvellement fournis et éventuellement, lors de l’étape d), pour lesmvariants sélectionnés.
  3. Procédé selon la revendication 1 ou 2, caractérisé en ce que le nombre X est un nombre entier compris entre 8 et 15 lorsque le ou les allèles testés sont un ou des allèles de gène(s) du CMH de classe I et le nombre X est 9 lorsque le ou les allèles testés sont un ou des allèles de gène(s) du CMH de classe II.
  4. Procédé selon l’une quelconque des revendications 1 à 3, caractérisé en ce que, à l’issue de ladite étape b1), si la séquence de X acides aminés d’un sous-fragment d’un variant est connue pour être nonimmunogène par rapport à un ou plusieurs allèle(s) de gène(s) de CMH testé, un score d’immunogénicité IMminpar rapport audit allèle ou auxdits allèles de gène(s) de CMH lui est automatiquement attribué sans utiliser l’algorithme de prédiction lors de ladite étape b2).
  5. Procédé selon l’une quelconque des revendications 1 à 4, caractérisé en ce que ledit algorithme de prédiction est choisi dans le groupe constitué par NetMHCpan, NetMHCII, NetMHCIIpan, TEPITOPE/propred et TEPITOPEpan.
  6. Procédé selon l’une quelconque des revendications 1 à 5, caractérisé en ce que ledit procédé comprend une étape additionnelle, suite à ladite étape b2) et préalablement à ladite étape b3), consistant à générer, à partir des scores attribués lors de ladite étape b2), une matrice de dimensionYxNdans laquelle
    les colonnes C1à CNcorrespondent aux acides aminés AA1à AANdu variant,
    dans le cas où Y est égal à 1, la ligne L unique correspond au seul allèle testé ou, dans le cas où Y est supérieur ou égal à 2, les lignes L1à LYcorrespondent chacune à un des Y allèles testés,
    le score indiqué en position Cjsur une ligne donnée correspondant au score d’immunogénicité attribué, pour l’allèle correspondant à ladite ligne, au sous-fragment de X acides aminés dont le premier acide aminé est l’acide aminé AAjdans la séquence en acides aminés du variant.
  7. Procédé selon l’une quelconque des revendications 1 à 6, caractérisé en ce que ladite fraction η est 10%.
  8. Procédé selon l’une quelconque des revendications 1 à 7, caractérisé en ce que, dans la fraction η de variants choisis dans la population de l’itération précédente, une fraction α avec 0<α<1 est constituée par les variants les moins immunogènes tels qu’obtenus à l’issue de l’étape c) de l’itération précédente et la fraction restante (1-α) est constituée par des variants choisis aléatoirement dans la population de l’itération précédente.
  9. Procédé selon la revendication 8, caractérisé en ce que ladite fraction α est 75%.
  10. Procédé selon l’une quelconque des revendications 1 à 9, caractérisé en ce que les nouveaux variants de la fraction (1-η) lors d’une itération sont créés à partir des variants de la population mise en œuvre à l’itération précédente soit par mutation aléatoire, soit par croisement.
  11. Procédé selon l’une quelconque des revendications 1 à 10, caractérisé en ce quemreprésente le nombre 10 et/ou W représente le nombre 10.
  12. Programme informatique comprenant des instructions lisibles par ordinateur qui, lorsqu'elles sont exécutées par un processeur, font en sorte que l'ordinateur effectue les étapes d’un procédé pour sélectionner des variants d’une protéine thérapeutique, présentant un caractère moins immunogène que ladite protéine thérapeutique selon l’une quelconque des revendications 1 à 11.
  13. Programme informatique selon la revendication 12, incorporé dans un support de stockage.
  14. Système pour sélectionner des variants d’une protéine thérapeutique, présentant un caractère moins immunogène que ladite protéine thérapeutique, comprenant:
    a) des moyens logiciels pour générer (ou fournir) une population de différents variants de ladite protéine thérapeutique, la séquence de N acides aminés de chaque variant se distinguant de la séquence de N acides aminés de ladite protéine thérapeutique par au moins un acide aminé;
    b) des moyens logiciels pour évaluer, pour chaque variant, les propriétés immunogènes vis-à-vis de Y allèle(s) de gène(s) du Complexe Majeur d’Histocompatibilité, avec Y représentant un nombre entier, supérieur ou égal à 1 en effectuant les étapes consistant à:
    b1) générer, pour chaque variant, l’ensemble des sous-fragments de X acides aminés consécutifs issus de la séquence de N acides aminés du variant, avec X représentant un nombre entier, supérieur ou égal à 8;
    b2) attribuer, à chaque sous-fragment, pour chaque allèle considéré, au moyen d’un algorithme de prédiction, un score d’immunogénicité dans un intervalle [IMmax,IMmin] où IMminreprésente une valeur d’immunogénicité minimale et IMmaxreprésente une valeur d’immunogénicité maximale;
    b3) associer, à partir de l’ensemble des scores attribués lors de l’étape b2), à chaque scoreS i , une valeurV i définie comme la fonction de répartition deS i ;
    c) des moyens logiciels pour comparer et classer les variants en fonction de leur caractère immunogène en les comparant, deux à deux, sur la base des valeursV i obtenues à l’étape b3), sachant que, dans une recherche par valeurs croissantes, un premier variant est considéré comme moins immunogène qu’un second variant lorsque, pour la première valeurV i différente entre le premier et le second variants, le premier variant présente une valeurV i inférieure à celle du second variant;
    d) des moyens logiciels pour sélectionner lesmvariants les moins immunogènes de la population testée;
    e) des moyens logiciels pour itérer les étapes b) à d) jusqu’à ce que lesmvariants les moins immunogènes soient les mêmes pour W itérations successives,
    une nouvelle population de variants étant utilisée à chaque itération, chaque nouvelle population consistant en une fraction η, avec 0<η<1, composée de variants choisis dans la population de l’itération précédente et une fraction (1-η) composée de nouveaux variants.
  15. Système selon la revendication 14, comprenant en outre des moyens logiciels pour générer, à partir des scores attribués lors de ladite étape b2), une matrice de dimensionYxNdans laquelle
    les colonnes C1à CNcorrespondent aux acides aminés AA1à AANdu variant,
    dans le cas où Y est égal à 1, la ligne L unique correspond au seul allèle testé ou, dans le cas où Y est supérieur ou égal à 2, les lignes L1à LYcorrespondent chacune à un des Y allèles testés,
    le score indiqué en position Cjsur une ligne donnée correspondant au score d’immunogénicité attribué, pour l’allèle correspondant à ladite ligne, au sous-fragment de X acides aminés dont le premier acide aminé est l’acide aminé AAjdans la séquence en acides aminés du variant.
  16. Procédé pour produire au moins un variant d’une protéine thérapeutique présentant un caractère moins immunogène que ladite protéine thérapeutique consistant à
    sélectionner au moins un variant parmi lesmvariants obtenus à l’issue de l’étape d) de la dernière itération du procédé selon l’une quelconque des revendications 1 à 11 et
    produire ledit au moins un variant ainsi sélectionné.
  17. Procédé pour produire au moins un variant d’une protéine thérapeutique présentant un caractère moins immunogène que ladite protéine thérapeutique et présentant une activité fonctionnelle supérieure ou égale à celle de ladite protéine thérapeutique consistant à
    produire au moins un variant d’une protéine thérapeutique présentant un caractère moins immunogène que ladite protéine thérapeutique conformément au procédé de production selon la revendication 16,
    mesurer l’activité fonctionnelle dudit variant,
    la comparer à l’activité fonctionnelle de ladite protéine thérapeutique et
    sélectionner ledit variant lorsque l’activité fonctionnelle dudit variant est supérieure ou égale à l’activité fonctionnelle de ladite protéine thérapeutique.
FR1913107A 2019-11-22 2019-11-22 Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique Withdrawn FR3103621A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1913107A FR3103621A1 (fr) 2019-11-22 2019-11-22 Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1913107A FR3103621A1 (fr) 2019-11-22 2019-11-22 Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique
FR1913107 2019-11-22

Publications (1)

Publication Number Publication Date
FR3103621A1 true FR3103621A1 (fr) 2021-05-28

Family

ID=70613841

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1913107A Withdrawn FR3103621A1 (fr) 2019-11-22 2019-11-22 Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique

Country Status (1)

Country Link
FR (1) FR3103621A1 (fr)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1516275A2 (fr) 2002-06-10 2005-03-23 AlgoNomics N.V. Procede pour predire l'affinite de liaison de complexes de peptides-cmh
US20120148559A1 (en) 2010-12-01 2012-06-14 Board Of Regents The University Of Texas System Compositions and method for deimmunization of proteins

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1516275A2 (fr) 2002-06-10 2005-03-23 AlgoNomics N.V. Procede pour predire l'affinite de liaison de complexes de peptides-cmh
EP1516275B1 (fr) 2002-06-10 2007-03-07 AlgoNomics N.V. Procede pour predire l'affinite de liaison de complexes de peptides-cmh
US20120148559A1 (en) 2010-12-01 2012-06-14 Board Of Regents The University Of Texas System Compositions and method for deimmunization of proteins

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
"Methods in Molecular Biology", vol. 1529, 3 December 2016, HUMANA PRESS, NEW YORK, NY, US, ISSN: 1064-3745, article YOONJOO CHOI ET AL: "EpiSweep: Computationally Driven Reengineering of Therapeutic Proteins to Reduce Immunogenicity While Maintaining Function", pages: 375 - 398, XP055714890, DOI: 10.1007/978-1-4939-6637-0_20 *
CHOI ET AL.: "EpiSweep: Computationally driven reengineering of the-rapeutic proteins to reduce immunogenicity while maintaining function", METHODS MOL BIOL., vol. 1529, 2017, pages 375 - 398
DONNESKOHLBACHER: "SVMHC: a server for prédiction of MHC-binding peptides", NUCLEIC ACIDS RES., vol. 34, 2006, pages W194 - W197
LESPARRE ET AL.: "Dé-immunisation de protéines thérapeutiques à l'aide d'un algorithme génétique", SESSIONS ROSA - ROADEF 2018, 2018
LESPARRE ET AL.: "Predeep : Deep learning pour la prédiction d'épitopes réels", ROADEF, 2018, pages 18
REGINA S. SALVAT ET AL: "Computationally optimized deimmunization libraries yield highly mutated enzymes with low immunogenicity and enhanced activity", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, 12 June 2017 (2017-06-12), XP055714865, ISSN: 0027-8424, DOI: 10.1073/pnas.1621233114 *
STURNIOLO ET AL.: "Génération of tissue-specific and promiscuous HLA ligand databases using DNA microarrays and virtual HLA class II matrices", NATURE BIOTECHNOLOGY, vol. 17, 1999, pages 555 - 561, XP002168815
THAMMAKORN SAETHANG ET AL: "PAAQD: Predicting immunogenicity of MHC class I binding peptides using amino acid pairwise contact potentials and quantum topological molecular similarity descriptors", JOURNAL OF IMMUNOLOGICAL METHODS., vol. 387, no. 1-2, 1 January 2013 (2013-01-01), NL, pages 293 - 302, XP055715255, ISSN: 0022-1759, DOI: 10.1016/j.jim.2012.09.016 *
WEN ZHANG ET AL: "Accurate Prediction of Immunogenic T-Cell Epitopes from Epitope Sequences Using the Genetic Algorithm-Based Ensemble Learning", PLOS ONE, vol. 10, no. 5, 1 January 2015 (2015-01-01), pages e0128194, XP055715030, DOI: 10.1371/journal.pone.0128194 *

Similar Documents

Publication Publication Date Title
Malhotra et al. Tolerance is established in polyclonal CD4+ T cells by distinct mechanisms, according to self-peptide expression patterns
Geneugelijk et al. PIRCHE-II: an algorithm to predict indirectly recognizable HLA epitopes in solid organ transplantation
CN108796055B (zh) 基于二代测序的肿瘤新生抗原检测方法、装置和存储介质
Sypek et al. HLA epitope matching in kidney transplantation: an overview for the general nephrologist
Thorsby A short history of HLA
Gartner et al. A machine learning model for ranking candidate HLA class I neoantigens based on known neoepitopes from multiple human tumor types
Suzuki et al. Reliabilities of parsimony-based and likelihood-based methods for detecting positive selection at single amino acid sites
CN108601731A (zh) 新抗原的鉴别、制造及使用
US20230349914A1 (en) Deep learning system for predicting the t cell receptor binding specificity of neoantigens
JP2021503897A5 (fr)
CN110799196B (zh) 致免疫性的癌症特异抗原决定位的排名系统
CN112699054B (zh) 一种软件测试用例有序生成方法
Ammer-Herrmenau et al. Sepsis induces long-lasting impairments in CD4+ T-cell responses despite rapid numerical recovery of T-lymphocyte populations
Thorsby On the future of HLA
KR102406699B1 (ko) 인공지능모델기반 분자동역학 빅데이터를 활용한 신생항원 면역치료정보 제공 시스템 및 방법
Mulley et al. Tissue typing for kidney transplantation for the general nephrologist
Smith et al. Identification of antigen-specific TCR sequences based on biological and statistical enrichment in unselected individuals
Digitale et al. HLA alleles B* 53: 01 and C* 06: 02 are associated with higher risk of P. falciparum parasitemia in a cohort in Uganda
Duquesnoy et al. HLAMatchmaker-defined triplet matching is not associated with better survival rates of patients with class I HLA allele mismatched hematopoietic cell transplants from unrelated donors
FR3103621A1 (fr) Procédé et système pour sélectionner des variants d’une protéine thérapeutique moins immunogènes que cette protéine thérapeutique
Falta et al. Metal-specific CD4+ T-cell responses induced by beryllium exposure in HLA-DP2 transgenic mice
McDevitt The discovery of linkage between the MHC and genetic control of the immune response
EP4004237A1 (fr) Systèmes et procédés de détermination de cellule d&#39;origine à partir de données de de détection de variant
Zahid et al. Large-scale statistical mapping of T-cell receptor β sequences to Human Leukocyte Antigens
US20210403529A1 (en) Tcr-enriched clonotype, acquisition method and use thereof

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20210528

PLFP Fee payment

Year of fee payment: 3

ST Notification of lapse

Effective date: 20230705