VARIANTS PROTEIQUES DE LA NEOCARZINOSTATINE ET DE SES HOMOLOGUES ET LEUR UTILISATION
La présente invention concerne de nouveaux variants protéiques de la néocarzinostatine et de ses homologues que sont la macromomycine, l'actinoxantine, la kédarcidine et la C-1027 protéine comme ossature protéique, leur utilisation et les méthodes pour identifier des molécules d'intérêt liant de façon spécifique ces séquences protéiques mutées.
Les protéines sont naturellement capables d' interactions moléculaires extrêmement spécifiques nécessaires à leur fonction biologique. Cette capacité résulte de leur structure tridimensionnelle, hautement organisée, qui permet le positionnement spatial des multiples interactions moléculaires entre une protéine et son ou ses partenaire (s) biologique ( s ) . Il apparaît clairement qu'une même architecture protéique a été parfois sélectionnée par l'évolution comme ossature sur laquelle des capacités de reconnaissance moléculaire diverses ont été greffées.
Un exemple spectaculaire de cette réutilisation fonctionnelle multiple d'une même base architecturale protéique est fourni par la famille des immunoglobulines et en particulier par les anticorps. Tous les anticorps ont la même architecture générale, mais chacun d'entre eux ne reconnaît spécifiquement qu'un antigène particulier. Une même base structurale peut, dans ce cas, servir d'ossature moléculaire à un potentiel de reconnaissance moléculaire apparemment illimité. Cette étonnante capacité fait des anticorps des molécules dont les utilisations thérapeutiques et analytiques sont actuellement sans
équivalent. L'obtention d'un anticorps suppose soit de passer par l'immunisation d'un animal pour la production d'une population hétérogène d'anticorps polyclonaux en quantité limitée, soit le développement lent et la production coûteuse d'un anticorps monoclonal pour chaque application envisagée.
L'expression artificielle d'une protéine dans un micro-organisme comme Escherichia coli a été envisagée comme une solution possible à ce problème. C'est une approche très généralement utilisée pour produire économiquement une protéine en quantité importante. Cette approche a été exploitée par de nombreuses équipes depuis plus de 10 ans pour produire des anticorps ou des dérivés d'anticorps. L'ensemble de ces résultats montre que, dans la très grande majorité des cas, l'expression des anticorps chez les micro-organismes est peu efficace. Les quantités obtenues sont souvent inférieures ou égales à 1 mg/1 et toujours très inférieures au taux d'expression qu'il est possible d'obtenir avec d'autres types de protéines (>100 mg/1) .
La conséquence concrète de ces limites est qu'il n'est pas possible de produire économiquement des quantités importantes d'anticorps ce qui, malgré leur potentiel illimité de reconnaissance, limite leur utilisation soit à des applications à très haute valeur ajoutée, thérapeutique par exemple, soit à des applications analytiques très peu consommatrices d'anticorps. Il n'est ainsi pas envisageable d'utiliser des anticorps pour des applications préparatives nécessitant des quantités supérieures à quelques grammes sans atteindre des coûts prohibitifs pour un grand nombre d'applications potentielles. Il y a donc un enjeu important à développer d'autres ossatures protéiques pouvant servir de support à
une capacité générale de reconnaissance moléculaire mais qui, à la différence des anticorps, peuvent être efficacement exprimées chez des bactéries. Le problème à résoudre est donc de réunir dans un même objet moléculaire le potentiel très général de reconnaissance, caractéristique des anticorps, et la facilité d'expression que l'on peut obtenir avec d'autres types de protéines. Cet objectif est atteint si l'on peut démontrer qu'il est possible de conférer à une architecture protéique, permettant une expression efficace chez les microorganismes, la capacité de reconnaître d'autres molécules, choisies au préalable même si celles-ci n'ont pas de ressemblance avec son (ou ses) partenaire (s) naturel (s) .
Plusieurs brevets récents illustrent la possibilité et l'intérêt de breveter une ossature protéique. On peut citer par exemple quelques travaux décrits récemment démontrant qu'il est possible de conférer à des protéines, comme le domaine III de la fibronectine (demande de brevet internationale No. O00/34784) ou les lipocalines (demande de brevet internationale No. WO01/04144) la capacité de fixer des partenaires préalablement choisis.
Les travaux de la Demanderesse l'ont amené à étudier la néocarzinostatine (ou NCS) et les homologues de cette protéine. La NCS est une protéine de 113 acides aminés dont la séquence en acides aminés se trouve sous la référence SEQ ID No. 1 dans la liste de séquences en annexe. Cette protéine est naturellement sécrétée par Streptomyces neocarzinostaticus et est capable de fixer avec une forte affinité un composé organique cytotoxique appelé NCS chromophore . La figure 1 présente la structure de la NCS, le site de fixation pour le chromophore étant
situé dans la crevasse composée par 2 boucles en sombre sur la figure 1.
Le chromophore est fixé dans un site formant une crevasse sur la protéine et est responsable de l'activité cytotoxique . La néocarzinostatine complexée à son chromophore a fait l'objet d'essais cliniques en chimiothérapie antitumorale chez l'homme et une forme modifiée chimiquement par le greffage d'un polymère chimique est actuellement autorisée par les autorités japonaises pour le traitement de tumeurs hépatiques. Si l'on excepte les préparations vaccinales, c'est vraisemblablement la seule protéine bactérienne ayant une utilisation thérapeutique chez l'homme. Cette protéine présente des caractéristiques extrêmement intéressantes pour les objectifs recherchés.
La première caractéristique est l'existence d'une crevasse de fixation qui enveloppe le chromophore et explique la très forte affinité de la protéine pour ce ligand (Kd -10"11 M) . Les 4 autres protéines homologues à la NCS sont la macromomycine (45,6%), l'actinoxantine (43,3%), la kédarcidine (37,9%) et la C-1027 protéine (44,25%) identifiées à partir de différentes espèces de microorganismes. Les pourcentages d'identités de séquence avec la NCS, indiqués entre parenthèse pour chaque protéine, sont élevés et montrent qu'il s'agit d'homologues relativement proches. Les séquences en acides aminés de la macromomycine, de l'actinoxantine, de la kédarcidine et de la C-1027 protéine se trouvent respectivement sous la référence SEQ ID No. 2, SEQ ID No. 3, SEQ ID No. 4 et SEQ ID No. 5 dans la liste de séquences en annexe. Les séquences ici définies pour la macromomycine, l'actinoxantine et la C-1027 protéine (respectivement SEQ ID No. 2, 3 et 5) comprennent une séquence d'exportation
présente dans la forme initialement biosynthétisée de chacune de ces protéines mais ultérieurement clivée et par conséquent absente de la forme mature naturellement sécrétée de ces protéines. La néocarzinostatine et la kédarcidine sont également synthétisée sous forme d'une protéine précurseur comprenant une pré-sequence ultérieurement clivée. La pré-séquence de ces deux dernières protéines n'est pas incluse dans les séquences ici décrites pour ces deux protéines (SEQ ID No. 1 et 4) . La présente invention s'applique de façon similaire à ces protéines, quelle que soit la convention utilisée pour numéroter la séquence (comprenant ou excluant les résidus de la séquence d'exportation ultérieurement clivée) . La structure 3D de ces 4 protéines est connue et est très proche de la structure de la NCS comme le montre la figure 2 où les structures de la NCS et de ces homologues ont été superposées. Ces 4 autres protéines nettement homologues fixent chacune un ligand particulier avec une forte affinité. Le site de fixation pour chaque ligand respectif est toujours situé dans cette crevasse de fixation et les chaînes latérales qui constituent ce site sont spécifiques de chaque protéine. Cela démontre clairement que, d'une part, une variabilité de cette région de la protéine n'est pas incompatible avec la formation de sa structure et d'autre part qu'une diversité limitée de la séquence permet l'apparition de nouvelles capacités de reconnaissances moléculaires avec une forte affinité. Ce sont exactement les qualités requises pour rendre concevable la création d'un répertoire artificiel de variants et y rechercher de nouvelles capacités d'interaction.
L'architecture de la NCS et de ses 4 homologues connus (Figure 2) est similaire à l'architecture des domaines d' immunoglobulines et en particulier elle comporte
2 boucles topologiquement équivalentes à celles qui confèrent leur spécificité de reconnaissance aux anticorps (CDR pour région déterminant la complémentarité) . Cela suggère que, comme sur les structures de type immunoglobuline , cette région de la NCS peut être compatible avec une grande variabilité et supporter de nouvelles capacités de reconnaissance. Parallèlement à la crevasse de fixation, cette deuxième zone potentielle de reconnaissance peut être exploitée pour conférer à la NCS une affinité nouvelle, par exemple pour des antigènes associés aux tumeurs. Un tel composé associe la sélectivité tissulaire liée à ses capacités de reconnaissance et la cytotoxicité naturelle du chromophore et peut ainsi permettre d'améliorer ses propriétés thérapeutiques. Enfin la Demanderesse a récemment montré que la
NCS est très efficacement produite chez E . coli (Heyd et al., « Reinvestigation of the proteolytic activity of neocarzinostatin », J. Bacteriol . , 2000 182:1812-8). La Demanderesse a construit un système d'expression permettant d'obtenir des quantités de l'ordre de 200 mg de protéines purifiées par litre de milieu de culture sans qu'il soit nécessaire d'utiliser des cultures en fermenteur à haute densité cellulaire. La protéine est directement sécrétée dans le milieu de culture et sa purification en est très simplifiée. L'efficacité de ce système d'expression est supérieure de deux ordres de grandeur aux systèmes d'expression bactériens utilisés pour produire des anticorps ou leurs dérivés tels que les fragments d'anticorps Fab ou ScFv. Ainsi, la NCS et ses homologues ont une architecture remarquablement adaptée à l'introduction d'une diversité moléculaire, source potentielle de nouvelles interactions, d'une part dans la crevasse constituant son
site naturel de fixation, et d'autre part sur les boucles équivalentes aux boucles porteuses de spécificité des anticorps. Enfin, son expression dans un système bactérien est extrêmement efficace. De plus, la Demanderesse a montré qu'il est, par exemple, possible de trouver des variants de la NCS pour lesquels 7 acides aminés (sur 113) ont été substitués, fixant spécifiquement la testostérone avec une affinité élevée alors que la protéine naturelle n'a aucune affinité pour cette molécule. Remarquablement, un tel variant ne fixe pas, dans les mêmes conditions expérimentales, un stéroïde dont la structure est proche de la testostérone. Ce résultat démontre qu'il est possible de conférer artificiellement un caractère de discrimination moléculaire à cette architecture protéique. A la différence de protéines apparentées aux anticorps, dont l'expression chez E. coli est le plus souvent très peu efficace, la NCS ou un variant artificiel fixant la testostérone peuvent être très efficacement exprimés chez E . col i dans un état fonctionnel.
L'utilisation de la NCS ou d'un de ses homologues comme ossature protéique présente un avantage supplémentaire comparé aux anticorps ou aux fragments d'anticorps. En effet, la NCS est une protéine plus petite que les anticorps ou les fragments d'anticorps de type FAB, ou encore que les fragments de type ScFv. Or, disposer d'une reconnaissance moléculaire sur un objet de taille plus réduite est intrinsèquement avantageux, d'une part, en terme de quantité pondérale de protéine nécessaire à la fixation d'une quantité fixée de partenaire moléculaire, et, d'autre part, en terme de propriétés de diffusion de la molécule dans certains tissus.
Par conséquent, l'invention concerne un variant protéique de la néocarzinostatine (NCS) ou d'un de ses homologues choisis dans le groupe constitué de la macromomycine, l'actinoxantine, la kédarcidine et la C-1027 protéine, dont la séquence en acides aminés présente une ou plusieurs mutations par rapport à la séquence protéique naturelle de la NCS ou d'un desdits homologues, ledit variant protéique étant capable de fixer spécifiquement une molécule d' intérêt autre que les ligands naturels de la néocarzinostatine ou desdits homologues.
Par molécule d'intérêt, on entend toute molécule naturelle ou synthétique, comme, par exemple et de façon non exhaustive, un composé chimique ou une protéine que la néocarzinostatine, la macromomycine, l'actinoxantine, la kédarcidine ou la C-1027 protéine ne fixent pas naturellement avec la même affinité. Par ces mutations, la NCS ou un de ses homologues acquiert la capacité de fixer une molécule d'intérêt, même si celle-ci ne présente aucune similitude avec le ligand naturel de la NCS ou d'un de ses homologues.
La séquence du variant protéique de la NCS ou d'un de ses homologues présente une ou plusieurs mutations par rapport à la séquence protéique naturelle de la NCS ou d'un de ses homologues. Par mutation, on entend une ou plusieurs substitution (s) d'acides aminés et/ou une ou plusieurs délétion(s) d'un ou plusieurs acide (s) aminé (s) et/ou une ou plusieurs insertion (s) d'un ou plusieurs acide (s) aminé (s). La substitution d'un acide aminé peut être rendue soit partiellement, soit complètement aléatoire. A une position rendue partiellement aléatoire, ne sont autorisés lors de la conception de la bibliothèque, qu'un sous-ensemble des 20 acides aminés possibles, alors que tous sont autorisés dans une position complètement
aléatoire. Par exemple, il est concevable de limiter certaines positions exclusivement à des résidus peu volumineux de sorte que le site de fixation garde une probabilité élevée de conserver une forme de crevasse dans une séquence protéique mutée de la NCS ou d'un de ses homologues. Toute technique connue de l'homme du métier pour introduire une mutation dans la séquence protéique de la NCS ou d'un de ses homologues est utilisable dans le cadre de cette invention. De façon avantageuse, la séquence en acides aminés du variant protéique de la NCS ou d'un de ses homologues contient au moins deux mutations par rapport à la séquence protéique naturelle de la NCS ou d'un de ses homologues. Les mutations sont avantageusement localisées dans la région de la crevasse dans laquelle se fixe leur ligand naturel et/ou dans la région des boucles équivalentes aux CDR des immunoglobulines . En effet, la similarité de l'organisation architecturale de la NCS et de ses homologues avec les domaines de type immunoglobuline suggère que la zone de la NCS et de ses homologues topologiquement équivalente aux boucles CDR des domaines immunoglobulines peut également servir de support d'une nouvelle capacité d'interaction. La Demanderesse a démontré qu'une substitution de la séquence dans cette région n'est pas incompatible avec la formation de la structure de la NCS.
Au niveau de la crevasse, la NCS et ses homologues ont, comme les immunoglobulines, une architecture composée de deux feuillets bêta de 3 et 4 brins. Le site de fixation pour leur ligand naturel est situé dans une crevasse composée par 2 boucles n'existant pas chez les immunoglobulines (Figure 2) , qui viennent se
replier le long du corps de la protéine. La concavité de cette poche de fixation permet le positionnement spatial de chaînes latérales tout autour de la molécule fixée dans la crevasse, ce qui explique en partie la très forte affinité que la NCS ou ses homologues manifestent vis-à-vis de leur ligand naturel respectif. Si l'on analyse la séquence des 4 protéines homologues de la NCS, on observe que ce site de fixation tolère des changements de séquence sans que l'architecture de la protéine ne soit détruite. En effet, les résidus qui sont orientés vers la crevasse sont variables au sein de cette famille, alors que l'architecture de toutes ces protéines est toujours identique. En revanche, chacune des protéines fixe, dans la crevasse, un ligand qui lui est propre, ce qui prouve que de nouvelles capacités d' interaction peuvent émerger par une diversification des résidus constituant la crevasse. Ce processus d'évolution naturelle peut en quelque sorte être artificiellement prolongé si l'on rend aléatoire les chaînes latérales qui sont orientés vers ce site, et que l'on recherche ensuite, dans une " bibliothèque " de protéines, ainsi constituée, des objets ayant des capacités d'interaction nouvelles et utiles. Il est actuellement impossible de prédire sur des bases théoriques quelle séquence générera une affinité pour une molécule d' intérêt choisie, mais on peut néanmoins identifier expérimentalement la ou le (s) séquence (s) qui fixe(nt) une molécule d'intérêt choisie.
De façon avantageuse, une mutation d'acides aminés au niveau de la crevasse de la NCS est
- soit la substitution d'un acide aminé choisi parmi les acides aminés aux positions 33, 35, 37, 39, 45,
47, 52, 78, 94, 96, 98, 101 et 102 de la séquence protéique de la NCS,
- soit l'insertion d'un ou plusieurs acide (s) aminé (s) au sein des boucles 39-45, 77-81 et 98-103 de la séquence protéique de la NCS.
La figure 3 permet de localiser les positions 33, 35, 37, 39, 45, 47, 52, 78, 94, 96, 98, 101 et 102 sur la structure de la NCS. Les acides aminés en position 37 et 47 de la séquence protéique de la NCS sont des cystéines qui dans la conformation naturelle de la NCS forment un pont disulfure. De façon inattendue, la Demanderesse a pu montrer que la mutation des résidus cystéines en position 37 et 47 dans la NCS empêchant la formation du pont disulfure n'affecte pas l'architecture de la NCS mutée. L'insertion d'un ou plusieur(s) acide(s) aminé (s) au sein des boucles 39-45, 77-81 et 98-103 permet d' introduire une certaine diversité au sein des 3 boucles qui entourent la zone de la crevasse.
De façon avantageuse, une mutation d'acides aminés au niveau de la crevasse de la macromomycine est
- soit la substitution d'un acide aminé choisi parmi les acides aminés aux positions 64, 66, 68, 70, 76, 78, 83, 109, 126, 128, 130, 132 et 134 de la séquence protéique de la macromomycine, - soit l'insertion d'un ou plusieurs acide (s) aminé (s) au sein des boucles 70-76, 108-113 et 130-135 de la séquence protéique de la macromomycine,
- soit la délétion d'un ou plusieurs acide (s) aminé (s) au sein des boucles 70-76, 108-113 et 130-135 de la séquence protéique de la macromomycine.
De façon avantageuse, une mutation d'acides aminés au niveau de la crevasse de la kédarcidine est
- soit la substitution d'un acide aminé choisi parmi les acides aminés aux positions 33, 35, 37, 39, 45, 47, 52, 77, 96, 98, 100, 103 et 104 de la séquence protéique de la kédarcidine, - soit l'insertion d'un ou plusieurs acide (s) aminé (s) au sein des boucles 39-45, 76-80 et 100-106 de la séquence protéique de la kédarcidine,
- soit la délétion d'un ou plusieurs acide (s) aminé (s) au sein des boucles 39-45, 76-80 et 100-106 de la séquence protéique de la kédarcidine.
De façon avantageuse, une mutation d'acides aminés au niveau de la crevasse de l'actinoxantine ou de la C-1027 protéine est
- soit la substitution d'un acide aminé choisi parmi les acides aminés aux positions 65, 67, 69, 71, 76,
78, 83, 109, 125, 127, 129, 131 et 132 de la séquence protéique de l'actinoxantine ou de la C-1027 protéine,
- soit l'insertion d'un ou plusieurs acide (s) aminé (s) au sein des boucles 71-76, 108-112 et 129-135 de la séquence protéique de l'actinoxantine ou de la C-1027 protéine,
- soit la délétion d'un ou plusieurs acide (s) aminé (s) au sein des boucles 71-76, 108-112 et 129-135 de la séquence protéique de l'actinoxantine ou de la C-1027 protéine.
On sait que le potentiel apparemment illimité de reconnaissance moléculaire des anticorps est due à l'organisation spatiale de 3 boucles par domaine variable nommée CDR, pour région déterminant la complémentarité. Or l'architecture de la NCS et de ses homologues est assez proche de celle des domaines d' immunoglobuline, bien que les séquences de la NCS (ou de ses homologues) et des
domaines des immunoglobulines ne montrent aucune homologie significative. En particulier, les régions qui correspondent aux CDR 1 et 3 des immunoglobulines ont leur équivalent topologique exact dans la NCS . Par conséquent et de façon avantageuse, une mutation dans la région des boucles équivalentes aux CDR des immunoglobulines dans le cas de la NCS est soit la substitution d'un acide aminé, soit l'insertion d'un ou plusieurs acide(s) aminé(s), soit la délétion d'un ou plusieurs acide (s) aminé (s) au niveau des boucles 24-32 et 98-103 de la séquence protéique de la NCS.
De la même façon, une mutation dans la région des boucles équivalentes aux CDR des immunoglobulines dans le cas de la macromomycine est soit la substitution d'un acide aminé, soit l'insertion d'un ou plusieurs acide (s) aminé (s), soit la délétion d'un ou plusieurs acide (s) aminé (s) au niveau des boucles 55-63 et 130-135 de la séquence protéique de la macromomycine.
Une mutation dans la région des boucles équivalentes aux CDR des immunoglobulines dans le cas de la kédarcidine est soit la substitution d'un acide aminé, soit l'insertion d'un ou plusieurs acide (s) aminé (s), soit la délétion d'un ou plusieurs acide (s) aminé (s) au niveau des boucles 24-32 et 100-106 de la séquence protéique de la kédarcidine.
Une mutation dans la région des boucles équivalentes aux CDR des immunoglobulines dans le cas de l'actinoxantine ou de la C-1027 protéine est soit la substitution d'un acide aminé, soit l'insertion d'un ou plusieurs acide(s) aminé(s), soit la délétion d'un ou plusieurs acide (s) aminé (s) au niveau des boucles 56-64 et 129-135 de la séquence protéique de l'actinoxantine ou de la C-1027 protéine.
L' invention concerne également toute molécule d'acide nucléique comprenant tout ou partie d'une séquence d'acide nucléique codant pour un variant protéique de la néocarzinostatine ou d'un de ses homologues choisis parmi le groupe constitué de la macromomycine, l'actinoxantine, la kédarcidine et la C-1027 protéine selon l'invention.
L'invention concerne également un vecteur comprenant au moins une molécule d'acide nucléique comme définie ci-dessus, avantageusement associée avec des séquences de contrôle adaptées et tout hôte cellulaire transformé par ledit vecteur. La préparation de ces vecteurs et la transformation d'un hôte cellulaire peuvent être réalisées par toute technique de biologie moléculaire et de génétique bien connues de l'homme du métier.
Diverses applications possibles des variants protéiques de la néocarzinostatine ou d'un de ses homologues choisis parmi le groupe constitué de la macromomycine, l'actinoxantine, la kédarcidine et la C-1027 protéine, auxquelles une capacité de fixation a été artificiellement conférée, peuvent être envisagées comme par exemple : - la détection et la séparation analytique ou préparâtive de produits naturels ou artificiels, y compris reconnaissance de stéréoisomères , ou encore ciblage d'un principe médicamenteux, par exemple vers un type cellulaire portant un antigène associé aux tumeurs, - l'analyse et la détection de micropolluants, de toxiques et/ou d'agents neurotoxiques,
la stabilisation d'activité enzymatique d'intérêt analytique et industriel dont la stabilité pourrait être utilement améliorée, et/ou la modulation des propriétés biologiques et pharmacologiques de molécules ayant un effet thérapeutique, ciblage de principe actif.
En outre, les variants protéiques de la néocarzinostatine ou d'un de ses homologues choisis parmi le groupe constitué de la macromomycine, l'actinoxantine, la kédarcidine et la C-1027 protéine, objets de la présente invention peuvent être utilisés comme :
- des réactifs d'analyse et dispositifs de détection de composés d'intérêts médicaux ou pharmaceutiques, naturels ou synthétiques, comme par exemple des réactifs d' immunoanalyse, des réactifs spécifiques utiles pour le développement et la mise en œuvre de cribles à haut débit en recherche pharmaceutique, - des additifs permettant des interactions avec une classe de molécules spécifiques dans les détergents ou décontaminants .
- et/ou des additifs visant à diminuer le contenu microbien ou viral, ou le caractère infectieux ou toxique de substances potentiellement contaminées.
Les variants protéiques de la NCS ou d'un de ses homologues choisis parmi le groupe constitué de la macromomycine, l'actinoxantine, la kédarcidine et la C-1027 protéine, objets de la présente invention peuvent être utilisés pour réaliser des puces à protéines utilisables pour la détection systématique du contenu protéique ou de composés biochimiques au sein d'extraits biologiques.
L'invention concerne également une méthode pour identifier une séquence protéique mutée de la néocarzinostatine ou d'un de ses homologues choisis parmi le groupe constitué de la macromomycine, l'actinoxantine, la kédarcidine et la C-1027 protéine capable de fixer spécifiquement une molécule d' intérêt caractériser en ce qu'elle comprend les étapes suivantes : a) la mutation de la séquence nucléique codant la séquence protéique naturelle de la néocarzinostatine ou d'un de ses homologues par mutagénese aléatoire, b) l'introduction dans un vecteur approprié de la séquence nucléique mutée à l'étape (a), c) l'introduction du vecteur obtenu à l'étape (b) dans une souche bactérienne et l'expression de la séquence protéique mutée, d) la sélection d'une séquence protéique mutée capable de fixer spécifiquement une molécule d'intérêt, e) la démonstration quantitative de l'existence d'une nouvelle capacité d'interaction pour la molécule d'intérêt sur la séquence protéique mutée.
A l'étape (a) de la présente méthode, toute technique de mutagenèse aléatoire connue de l'homme du métier peut être utilisée dans le cadre de l'invention pour introduire une ou plusieur(s) mutation (s) dans la séquence nucléique codant la séquence protéique naturelle de la néocarzinostatine ou d'un de ses homologues.
De façon avantageuse, le vecteur d'exposition utilisé à l'étape (b) de la présente méthode est un vecteur d'exposition sur bactériophage : phDiEx (pour phagemid for display and expression) . Le vecteur avantageusement utilisé (Figure 4) a pour spécificité de superposer deux types de
promoteurs (lac et T7) dans une construction adaptée au phage display. Ce vecteur permet à partir d'une seule construction l'expression de la protéine, soit à la surface d'un bactériophage filamenteux, soit à l'état isolé en quantité abondante. En effet, ce vecteur permet i) l'exposition de la protéine mutée à la surface de bactériophage par fusion avec le domaine C-terminal du gène 3 du phage M13, ii) la fusion de la protéine avec une séquence His 6 qui facilite sa purification ultérieure, iii) une expression très efficace sous contrôle d'un promoteur T7 dans des souches de E . coli (Type BL21) exprimant la T7 RNA polymerase .
D'autres techniques de sélection que l'exposition par phage (ou phage display) peuvent être utilisées dans le cadre de l'invention comme outils de sélection et en particulier le ribosome display, ou la fusion covalente entre une protéine et son ARNm.
D'autres avantages et caractéristiques de l'invention apparaîtront à la lecture de l'exemple ci -après concernant l'identification de séquences protéiques mutées de la NCS capables de lier de façon spécifique la testostérone .
L'exemple ci-dessous fait référence aux figures suivantes : la figure 5 représente l'analyse des sélections par test ELISA sur les phages enrichis à l'issue des différents tours de sélection des séquences protéiques mutées de la NCS capables de lier de façon spécifique la testostérone, la figure 6 représente les tests de compétition réalisés avec une concentration constante de testostérone biotinylée fixée et en utilisant une série de
concentrations différentes de chaque stéroide libre entrant en compétition,
1. Construction de la bibliothèque. Des méthodes de ligation de cassettes partiellement ou complètement synthétiques dans la zone appropriée de la séquence codante sont utilisées pour créer les bibliothèques, ces méthodes sont classiquement utilisées en biologie moléculaire. Pour chacune des bibliothèques la (ou les) régions codant l'ensemble des positions à rendre aléatoire est remplacée par une séquence dégénérée. L'exemple ci-dessous illustre la construction d'une bibliothèque pour laquelle 7 positions de la séquence de la NCS (position 33, 35, 37, 39, 47, 49 et 52) sont rendues aléatoires. Des adaptations portant par exemple sur le nombre, la position au sein de la séquence codante, et la séquence elle-même des cassettes dégénérées, peuvent être apportées à cette procédure si l'ensemble des positions aléatoires de la bibliothèques est distinct de l'ensemble décrit dans l'exemple ci -dessous.
a . Préparation des cassettes d' oligonucléotides avec des codons dégénérées.
Les oligonucléotides, servant à la préparation des cassettes dégénérées appelées « cassettes banquel », sont les suivants :
O1igobanque1 :
5 ' GCAGGTACOGCCTATNNKGTTN KCAGNNKGCCNNKGTCGACACC GGCGTA3' (SEQ ID N° 6 dans la liste de séquences en annexe) Oliqobanquel . rev :
5 ' GGTGACGCTCGAGNNATCCGCGGGATTMNNCGCMNNTACGCCGGTGTCGAC3 ' (SEQ ID N° 7 dans la liste de séquences en annexe)
Les codons dégénérés sont en caractères gras, les sites de restriction sont indiqués en italique, M = A ou C, N = A, C, G ou T et K = G ou T.
L'amorce « oligobanquel » contient les codons dégénérées correspondant aux positions 33, 35, 37, 39 dans la chaîne polypeptidique ; l'amorce oligobanquel . rev contient les codons dégénérés correspondant aux positions 47, 49 et 52 dans la chaîne polypeptidique. La préparation des cassettes s'effectue par hybridation de ces deux amorces (s'hybridant sur 15 bases) à grande échelle et en formant des doubles brins à l'aide de l'ADN polymérase.
Vingt réactions d'hybridation ont été mises en parallèle dans un thermocycleur (M G Biotech) , chacune contenant 16 pmol de chaque oligo, 200 μM d'un mélange des quatre nucléotides dNTP et 1,25 unités de polymérase Pfu
(Stratagene) . La réaction se déroule dans 50 μl de tampon
TRIS-Hcl 20 mM (pH 8,75), contenant 10 mM de KCl, 10 raM de
(NH4)2S04ι 2 mM de MgS04, 0,1% de Triton® X-100 et 100 μg/ml de BSA. Les conditions sont les suivantes : 5 minutes de fusion à 94°C, Gradient -0,2°C/s, 30 minutes d'hybridation à 60°C, 7 min d'extension à 72°C. Les produits de PCR sont assemblés et purifiés sur gel d'agarose avant d'être coupés par des endonucléases de restriction Kpnl et Xhol afin d'être insérés dans le vecteur phDi.ex préalablement digéré par ces mêmes enzymes de restriction. Ces sites de restrictions se situent sur le gène synthétique NCS de part et d'autre de la séquence codant la zone substituée. D'autres sites de restriction, positionnés dans les positions appropriées, peuvent être utilisés si les zones rendues aléatoires sont distinctes de la zone utilisée dans l'exemple décrit ici.
b . Ligation des cassettes .
L'insertion des cassettes banquel dans le vecteur s'effectue par ligation 16h à 16°C.
Le mélange de ligation contient 15 μg de vecteur (lOμg/ml) , 5 excès molaire de cassettes et 400 unités d'ADN T4 ligase (New England Biolabs) en 1,5 ml de tampon de ligation.
Après avoir inactivé la ligase par la chaleur (10 minutes d'incubation à 65 °C) , 1 ' ADN issu de cette réaction est dessalé avant d'être électroporé dans des bactéries électrocompétentes.
Les bactéries ainsi transformées sont incubées à 37 °C sous agitation pendant 1 heure avant d'être étalées sur milieu 2xYT solide contenant 1% m/m de glucose, 0,1 mg/ml d' ampicilline et d'être incubées 24 heures à 37°C.
Plusieurs dilutions de mélange d' électroporation sont étalées sur milieu solide 2xYT pour chaque transformation afin de calculer l'efficacité de transformation et connaître le nombre total des transformants.
Les bactéries formant des colonies sont resuspendues en 10 ml de 2xYT-glycérol 30% (par plaque) . Les bactéries ainsi resuspendues sont rassemblées pour constituer le stock « bactérien » de la bibliothèque. Elles sont aliquotées par 1 ml (~1010 bactéries vivantes) dans des micro-tubes avant d'être congelées à -80°C.
c . Préparation des phages .
Afin de préparer un stock de phage pour la sélection, approximativement 1010 cellules provenant du stock bactérien congelé de la bibliothèque ont été utilisées pour inoculer 100 ml de milieu nutritif
2xYT/glucose contenant 100 μg/ml d' ampicilline . Cette
culture est incubée sous agitation à 37°C jusqu'à l'obtention d'une densité optique à 600 nm de 0,4-0,5. À ce moment, les bactéries sont infectées par les phages auxiliaires VCSM13 à raison de 20 phages par bactérie. L'infection s'effectue pendant 30 minutes sans agitation à 37°C dans un bain-marie. Les bactéries ainsi infectées sont ensuite incubées pendant 30 minutes sous agitation à 37°C avant d'être centrifugées à 4500 g pendant 5 minutes. Les cellules se trouvant dans le culot de centrifugation sont resuspendues dans 500 ml de milieu 2xYT contenant 100 μg/ml d' ampicilline et 50 μg/ml de kanamycine (sans glucose) et sont incubées toute la nuit sous agitation à 30°C.
Après avoir séparé les bactéries par centrifugation, les particules virales contenues dans le surnageant sont précipitées par 1/5 de volume de solution PEG/NaCl ( polyéthylène glycol 8000 20 %, NaCl 2,5 M). Les phages ainsi précipités sont ensuite centrifugés à 10000 g pendant 10 minutes puis le culot est resuspendu dans 25 ml d'eau distillée. Une deuxième précipitation est effectuée en ajoutant à c (1 /5 e volume) de solution PEG/NaCl . Le mélange est ensuite centrifugé à 10000 g pendant 10 minutes puis les phages sont resuspendus en tampon PBS (phosphate buffered saline, 25 mM NaH2P04, 125 mM NaCl , pH 7,4) .
2. Sélection des phages ayant acquis de nouvelles capacités d'interaction. a. Sélection par affinité.
Divers modes de sélection et divers ligands peuvent être utilisés pour détecter des variants possédant de nouvelles propriétés d'interaction. Dans l'exemple décrit ici, la sélection est effectuée par fixation des phages sur de la testostérone biotynilée préalablement immobilisée sur support solide. Trois types de supports ont
été utilisées en alternance au cours du processus de sélection: billes magnétiques recouvertes de streptavidine (Streptavidin Magnetic Particles, Boehringer Mannheim) ,
- billes d'agarose-Avidine (SIGMA), -billes magnétiques (Dynabeads® Tosylact ivated, Dynal) recouvertes de NeutrAvidine (NeutrAvidin™ Biotin-Binding Protein, PIERCE) . Le tampon de dilution au cours du processus de sélection est le tampon TBS-T (50 mM Tris-Hcl, 150 mM NaCl, pH 7,5 et 0,5% v/v Tween 20) .
La quantité de billes préalablement saturées par le ligand biotinylé, utilisées au cours des sélections est de 100 μl (d'une suspension 10 mg/ml) pour le premier cycle, 50 μl pour le deuxième, 30 μl pour le troisième et 20 μl pour le quatrième. Les phages sont ajoutés à raison de 1012 phages par sélection lors du premier cycle de sélection et 1010 pour les cycles suivants en solution dans du TBS-T (volume total = 500 ml). L'incubation par inversion des tubes dure une heure à température ambiante. Les billes sont lavées sept fois par 800 μl de TBS-T. L'élution des phages fixés sur les billes s'effectue par 200 μl de mélange 1 : 1 de BSA 2 mg/ml et de glycine 0,2 M, pH 2,4 pendant 10 minutes d'incubation par inversion.
Après séparation des billes, le surnageant est transféré et neutralisé immédiatement par ajout de 7 μl de TRIS 2M. Les phages ainsi sélectionnés sont mis dans des bactéries par infection (30 minutes au bain marie à 37 °C) . Des bactéries XL1 Blue MRF' en phase exponentielle de croissance sont infectées par des phages à raison de 800 μl de bactéries par sélection. Les bactéries sont mises sur
milieu solide 2xYT contenant 100 μg/ml d' ampicilline et incubées toute une nuit à 37 °C. Elles sont ensuite récoltées en 3 ml de milieu 2xYT (contenant 1% de glucose, 100 μg/ml d' ampicilline et 15% de glycérol) et aliquotées par 500 μl avant d'être congelées à -80 °C.
b. Amplification des phages sélectionnés. Les bactéries récoltées en fin de chaque sélection, sont mises en culture dans 10 ml de milieu 2xYT contenant 1 % de glucose et 100 μg/ml d' ampicilline . L'incubation sous agitation à 37°C dure jusqu'à l'obtention de la mi-phase exponentielle (DO600 πra = 0,5 correspondant à 4x 108 bactéries/ml ) où elles sont infectées par des phages auxiliaires VCSM13. Les phages sont rajoutés à raison de 20 phages par bactéries, l'infection dure 30 minutes à 37 °C au bain marie suivie par une incubation de 30 minutes sous agitation à 37 °C. Les bactéries infectées sont centrifugées pendant 5 minutes à 4500 g afin de les séparer de l'excès de phages auxiliaires. Le culot bactérien est resuspendu en 50 ml de milieu 2xYT contenant 100 μg/ml d' ampicilline et 50 μg/ml de kanamycine. La culture est incubée toute la nuit sous agitation à 30°C. Les phages ainsi produits dans le surnageant de culture sont concentrés par précipitation au PEG/NaCl. Le titre de la préparation des phages est déterminé par infection des bactéries XL1 Blue MRF'
3. Caractérisation des populations et des clones sélectionnés. a. Test ELISA sur une population de phages.
Dans le but d'évaluer les résultats des sélections, à l'issue de chaque cycle de sélection, la spécificité des phages élues sont caractérisés par un test
ELISA. Les plaques sont recouvertes de la streptavidine sur laquelle la testostérone est immobilisée par la biotine.
Le tampon de dilution utilisé au cours des tests ELISA est du tampon TBS-T (TRIS 50 mM, NaCl 150 mM, 0,5% v/v Tween 20, pH 7,5) contenant 2 % m/v de BSA (bovine sérum albumine) . Les lavages sont réalisés successivement trois fois par le tampon TBS-T sans BSA.
Une plaque de microtitrage de 96 puits est préparée avec la streptavidine 10 μg/ml en tampon TBS (TRIS 50 mM, NaCl 150 mM, pH 7,5) à raison de 100 μl/puit (incubation une nuit à 4°C sans agitation), sur laquelle, après lavage, la testostérone biotinylée est immobilisée. Pour l'immobilisation, 400 μl d'une solution de 5 μM de testostérone biotinylée est utilisé par puit, l'incubation dure 30 minutes sur un agitateur à température ambiante. Les puits sont lavés, puis ils sont saturés pendant 2 heures avec 400 μl de tampon TBS-T contenant 2% m/v de BSA. Après rinçage, les phages sont rajoutés à raison de 1010 phages/puits et incubés 1 heure à température ambiante sous agitation. Après lavage, la fixation des phages ayant une spécificité vis-à-vis de la testostérone est révélée par l'addition de 100 μl d'anticorps anti-M13 gp8 de souris. L'excès de l'anticorps primaire est enlevé par lavage des puits (3 fois par TBS-T) ensuite l'anticorps secondaire, l'anti-IgG de souris conjugué à la peroxydase. Après lavage
(3 fois par TBS-T et une fois par TBS) , la révélation s'effectue par l'addition de 100 μl du substrat de la peroxydase (BM Blue soluble, Boehringer Mannheim GmbH), l'absorbance est lue à 390 nm. Tous les essais sont réalisés en double ou en triple.
Dans chaque test ELISA, des contrôles négatifs sont introduits. Les contrôles négatifs sont par exemple un puits sans testostérone immobilisés ou un puits recouvert
par de la BSA au lieu de la streptavidine ou encore un test de fixation des phages ne présentant que de la NCS sauvage (non montré). Un test d'inhibition est également effectué, pour cela des phages sont incubés avec la testostérone non biotinylée en forte concentration avant d'être ajoutés avec la testostérone sur les plaques recouvertes de testostérone fixée (Figure 5) .
Un signal positif est observé dés le troisième tour de sélection. Ce signal chute de 63% par l'inhibition compétitive par la testostérone libre. Cependant, le contrôle sans testostérone, ou sans streptavidine fixée (BSA) reste au niveau du bruit de fond. L'inhibition est de 72% sur les phages sélectionnés au 4ême tour. Les phages sélectionnés au 5eme tour donnent un signal encore plus fort dans le test que les phages des tours précédents, confirmant la sélection.
b. Isolement des clones individuels capteurs de testostérone . Des phages produits par des clones individuels du 4eme tour de sélection ont été testés individuellement par test ELISA pour la fixation de la testostérone. 28 clones ont donné une réponse positive sur les 38 clones analysés (74%) . Dans tous les cas retenus, le signal est inhibé de 65% à 95% par 50 μM de testostérone libre. De même, il n'y a pas de réponse positive en absence de testostérone sur les plaques.
c . Tests de spécificité vis-à-vis d'autres stéroides .
Les tests de compétition sont réalisés par ELISA sur les phages sélectionnés issus de clones individuels. Les plaques sont préparées de la même façon
que pour les tests précédents. La fixation des phages s'effectue en présence de dilutions successives des stéroides (testostérone, dexamethasone , œstradiol et dehydroepiandrosterone (DHEA) . la révélation se réalise par addition de 100 μl de l'anticorps anti-M13 conjugué à la peroxydase (Amersham Pharmacia Biotech) dilué au 1/5000 puis révélation par le substrat.
Les mesures du signal ELISA ont été réalisées, avec une concentration constante de testostérone biotinylée fixée et en utilisant une série de concentrations différentes de chaque steroide libre entrant en compétition. Le test de compétition par la testostérone libre à des concentrations différentes a servi de référence. Aucun phénomène de compétition n'a été observé ni par l' œstradiol, ni par la DHEA, ni par la dexamethasone (Figure 6) .
d . Caractérisât ion physico- chimique et fonctionnelle des deux variants de la NCS, capteurs de testostérone .
L'ADN des clones TES15 et TES24 est transféré dans des bactéries BLR (Novagen) , puis les protéines sont exprimées sous contrôle du promoteur et du terminateur T7 sans qu'aucun sous-clonage ne soit nécessaire. Les protéines directement présentes dans le milieu de culture à l'issue d'une culture d'au moins 48h peuvent ensuite être purifiées. Les deux variants de NCS possèdent une étiquette constituée de six résidus histidine, cette étiquette est, comme le promoteur et le terminateur T7 inclus dans la construction du vecteur. Cette étiquette présente une affinité pour les ions nickel, ce qui permet une purification rapide et facile par chromatographie d'affinité sur chelates métalliques. Dans cette étape, le
surnageant de culture est appliqué sur une résine Superflow™ Ni-NTA (QIAGEN) . Si nécessaire la protéine peut être ensuite repurifiée jusqu'à homogénéité par exemple par chromatographie sur tamis moléculaire . L'analyse d'interaction biospécifique en temps réel (BIA) sur un appareil de type Biacore a été utilisée pour caractériser les variants sélectionnés de la NCS. La méthode utilisée est de fixer de la testostérone biotinylée sur un support pré-couplé à de la streptavidine. La NCS ou les variants capteurs de testostérone sont injectés dans le flux, à une concentration et à un débit exactement connus. Le signal enregistré correspond donc à la fixation de la protéine circulante sur la testostérone immobilisée. L'immobilisation du ligand s'effectue en injectant sur la surface 25 μl de testostérone biotinylée à 5 μM en tampon TRIS (TRIS-Hcl, 50 mM, pH 7) contenant 5% d'éthanol à un débit de 5 μl/min. Pour la détermination de l'affinité, 200 μl de variant de la NCS est injecté à la surface à des concentrations comprises entre 100 nM et 400 nM (en tampon TRIS) à un débit de 40 μl/min et la réponse en équilibre est enregistrée. Après l'injection de la protéine, la surface est régénérée avec 5-10 μl de GdnHcl 5M à 40 μl/min. L'analyse des données cinétiques s'effectue par le logiciel BIAevaluation 3.1 développé par BIAcore Inc. Les sensorgrams, enregistrés lors de l'injection des mêmes échantillons sur une surface de streptavidine sans testostérone, ont servi de référence. Les résultats obtenus avec la protéine TES 15 sont présentés ci-après.
Tableau 1 : Sensorgrams et constantes cinétiques obtenues au cours des différentes expériences effectuées avec l'injection des différentes concentrations de la protéine TES15
Les analyses de fixation des variants, sélectionnés pour l'affinité pour la testostérone, montrent que les deux clones sont capables de fixer spécifiquement la testostérone immobilisée sur la surface avec une constante de dissociation de 45 nM environ. Aucune différence significative n'est constatée entre l'affinité de TES15 (KD estimé à 45,9 ± 8,3 nM) et de TES24 (KD estimé à 45,4 ± 8,2 nM) .