SÉQUENÇAGE "MULTIPLEXED ANCHOR SCANNING PARALLEL END TAG" DOMAINE DE L'INVENTION
La présente invention concerne le domaine du séquençage d'ADN et plus particulièrement le domaine de préparation de bibliothèque destinée au séquençage.
CONTEXTE DE L'INVENTION
Depuis le début des années 90, la production de séquence d'ADN a été presque exclusivement effectuée avec la technologie de séquençage basée sur la chimie Sanger. Une nouvelle génération de technologies de séquençage a été développée récemment. Les technologies de séquençage à haut débit sont aussi connues sous le nom de « séquençage d'ADN de nouvelle génération » ou technologies NGS. Ces technologies ont été implémentées dans divers produits commerciaux tels que : 454 Génome Sequencer (Roche Applied Science), Illumina Génome Analyzer (Illumina, Inc.) la plate-forme SOLiD™ (Applied Biosystems). Toutes ces plateformes sont basées sur le séquençage par la synthèse, une série d'extensions périodiques d'une molécule d'ADN à l'aide d'amorces réalisées par une polymérase ou par une ligase. Ainsi, le processus de séquençage est composé d'une alternance de cycles d'extension (ou hybridation-ligation chimique) par les enzymes et d'acquisition de données.
Les bibliothèques utilisées dans le séquençage par les technologies NGS sont habituellement préparées par fragmentation aléatoire de l'ADN suivie de ligation in vitro d'adaptateurs communs. Les substrats de séquençage sont produits par amplification avec des amorces communes par PCR puis immobilisés sur une surface solide ou un autre support. Les plateformes NGS présentent des coûts bas car elles peuvent décoder simultanément des millions de séquences distinctes déposées sur une lame à deux dimensions. En effet, tous les dispositifs de séquençage immobilisés sur les lames peuvent être traités de façon enzymatique par un seul volume de réactif et le coût de ce réactif est amorti sur l'ensemble du dispositif complet du séquençage. Afin de maximiser la capacité de séquençage dans une seule réaction et réduire ainsi le coût du séquençage par base, des méthodes de multiplexage ont été développées. Des adaptateurs à code-barres sont ligaturés à chaque bibliothèque et plusieurs bibliothèques à code- barres peuvent être mises en commun pour être séquencées dans une seule réaction. Néanmoins, la préparation de plusieurs bibliothèques nécessite du temps et de l'argent. En effet, la préparation des bibliothèques a besoin d'environ une semaine de travail.
Les plateformes de séquençage de nouvelle génération sont des plateformes à haut débit et
des coûts bas mais sont limitées par la longueur des fragments d'ADN séquencés. Une solution à cette limitation est le séquençage "paired-end tag" (PET) dans lequel des courtes étiquettes appariées sont extraites à partir des extrémités de longs fragments d'ADN et sont liées covalemment sous forme de constructions de di-tag destinées au séquençage de nouvelle génération et la cartographie contre un génome de référence (Fullwood et al 2009). La stratégie PET est la seule technique adaptée aux technologies NGS et qui permet la détection de délétion, inversion, duplication en tandem, insertion et translocation qui sont actuellement associées aux maladies humaines. En conséquence, il y a une forte demande pour des méthodes efficaces et peu coûteuses pour la préparation de bibliothèques pour les technologies de séquençage de nouvelle génération et en particulier pour la préparation de bibliothèque à code-barres PET.
RÉSUMÉ DE L'INVENTION
La présente invention, appelée "Multiplexed Anchor Scanning Parallel End Tag Sequencing" (séquençage MASPET), concerne une méthode et un kit pour préparer une bibliothèque d'acide nucléique, de préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend :
a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circulaire dans la direction 5' vers 3'
- une séquence d'intérêt à être séquencée entièrement ou partiellement
- un site inverse d'amorçage,
- un site sens d'amorçage,
séquence de code-barres spécifique à chaque ensemble de molécules d'acide nucléique, qui est placé entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et
- deux sites de restriction pour deux enzymes de restriction différentes :
- un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et
- un deuxième site de restriction pour une deuxième enzyme de restriction qui est placé entre le site inverse d'amorçage et le site sens d'amorçage ;
b) circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire ;
c) digestion desdites molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ;
d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et
e) circularisation desdites molécules clivées d'acide nucléique obtenues à partir de l'étape d) par ligation intra-moléculaire,
ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage.
Dans un premier mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code- barres placée entre le site sens d'amorçage et la séquence d'intérêt.
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en amont du site inverse d'amorçage, ladite enzyme ayant un site de clivage en amont dans la séquence d'intérêt, et caractérisé en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
Dans un mode de réalisation supplémentaire particulier, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en amont du site inverse d'amorçage et caractérisé en ce que la méthode comprend après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'; et
h) en option, la circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
Alternativement, les molécules linéaires d'acide nucléique fournies dans l'étape a)
comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'.
Dans un deuxième mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code- barres placée entre la séquence d'intérêt et le site inverse d'amorçage.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en aval du site sens d'amorçage, ladite enzyme ayant un site de restriction en aval dudit site de clivage dans la séquence d'intérêt, et caractérisé en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
Alternativement, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage ; et
h) en option, circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
Dans une autre alternative, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers 3', une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' à 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse
d'amorçage et un site sens d'amorçage.
De préférence, les molécules d'acide nucléique fournies à l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité, et la méthode comprend en outre une ou plusieurs étapes de liaison des molécules d'acide nucléique sur un support solide par l'interaction entre le premier élément d'une paire se liant par affinité attaché à ces molécules d'acide nucléique et des membres de ladite seconde paire se liant par affinité lié au support solide, en particulier avant l'étape de circularisation.
De préférence, la méthode comprend en outre l'étape de digestion des molécules d'acide nucléique circularisées avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules d'acide nucléique linéaires comprenant de l'extrémité 5' vers l'extrémité 3', un site sens d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code- barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage. Plus préférentiellement, la méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites inverse et sens d'amorçage.
De préférence, les étapes de clivage des molécules d'acide nucléique sont réalisées en utilisant une technique de clivage indépendamment de la séquence, de préférence par sonication.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site universel d'amorçage en amont ou en aval de la séquence d'intérêt.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens d'amorçage, et qui est attaché à un premier membre d'une paire se liant par affinité, de préférence un module de courbure comprenant ou consistant en la séquence sélectionnée parmi le groupe consistant en SEQ ID No. 1 et SEQ ID No. 2.
La présente invention concerne une bibliothèque d'acide nucléique obtenue à partir de la méthode décrite ci-dessus ou de n'importe quel produit intermédiaire de celle-ci.
La présente invention concerne un kit comprenant au moins une amorce sens comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celle-ci, y compris son extrémité 5'. Dans un premier mode de réalisation, le kit comprend au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de l'extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
Dans un deuxième mode de réalisation, l'au moins première amorce sens comprend en outre, à son extrémité 5', soit
- une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage, et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction
et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou
- un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
La présente invention se rapporte alternativement à un kit comprenant au moins une première amorce inverse comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3' ; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Dans un premier mode de réalisation, le kit comprend au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de
la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou du site universel d'amorçage.
Dans un deuxième mode de réalisation, l'au moins première amorce inverse comprend aussi, à son extrémité 3', soit
- une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou
- un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
De préférence, la première amorce sens ou la première amorce inverse du kit comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction et attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine. De préférence, le module de courbure comprend ou consiste en la séquence sélectionnée parmi le groupe des séquences SEQ ID No. 1 et SEQ ID No. 2. En option, le kit comprend en outre, des billes ou des supports solides soutenant le deuxième membre des paires se liant par affinité, de préférence l'avidine ou la streptavidine.
BREVE DESCRIPTION DES FIGURES
Fig. 1 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique.
FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2 : Site de Restriction 2, BC : Code-barres, SEQ : séquence d'acide nucléique.
Fig. 2 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique comprenant l'utilisation du site universel d'amorçage.
UPS : site universel d'amorçage, CM : module de courbure, FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2 : Site de Restriction 2, BC : Code-barres, SEQ :
séquence d'acide nucléique.
Fig. 3 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique incluant l'utilisation du module courbure.
UPS : site universel d'amorçage, CM : module de courbure, FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2 : Site de Restriction 2, RS3 : Site de Restriction 3, RS4 : Site de Restriction 4, BC : Code-barres, SEQ : séquence d'acide nucléique.
DESCRIPTION DÉTAILLÉE DE L'INVENTION
L'inventeur a développé une nouvelle méthode pour préparer une bibliothèque d'acide nucléique et en particulier une bibliothèque de PET, pour être séquencée avec les technologies de séquençage de nouvelle génération. Cette méthode est utile pour préparer simultanément une multitude de bibliothèques d'acide nucléique pour être séquencées, chacune de ces bibliothèques est caractérisée par une séquence spécifique de code-barres. Avec la méthode de l'invention, plusieurs bibliothèques d'acide nucléique peuvent être simultanément bar-codées et séquencées. En d'autres termes, au lieu de préparer en parallèle plusieurs bibliothèques pour être bar-codées, la méthode de l'invention permet la préparation simultanée de plusieurs bibliothèques à code-barres en réalisant l'étape de préparation d'une seule bibliothèque. L'inventeur fournit des moyens pour introduire les code-barres au début de la méthode de préparation de bibliothèque. Ainsi, le coût de séquençage est considérablement réduit.
Cependant, en plus de l'abaissement du coût et du temps, la bibliothèque de séquençage décrite ci-dessus présente en outre, d'autres avantages techniques. Un des plus grands avantages est que les bibliothèques de séquençage préparées par la méthode décrite fournissent des informations au sujet des arrangements structuraux des séquences. En effet, si un code-barres est utilisé pour une séquence d'intérêt particulière, il est possible de déduire que deux séquences (par exemple, indicatif d'un gène, d'un exon, ou analogues) sont portées par le même acide nucléique amplifié et sont donc associées. En conséquence, la méthode en tant que décrit permet la détection de translocation, délétion, inversion, duplication ou insertion.
La méthode décrite ci-dessus convient à la préparation des bibliothèques permettant le séquençage simultané d'un nombre quasi-infini de séquences de régions d'intérêt dérivées de différents échantillons (par exemple, un ensemble de gènes de différents organismes, d'un même
acide nucléique mais provenant de différents individus ou de différents acides nucléiques dérivés d'un seul individu).
La méthode permet le contrôle de la taille et de l'orientation des acides nucléiques à séquencer.
La méthode permet l'élimination ou la diminution des produits chimériques et des faux positifs résultant des ligations non spécifiques. En effet, la méthode est basée sur l'amplification et les étapes de ligation intra-moléculaires ou de circularisation, évitant de ce fait les étapes de ligation utilisées dans les méthodes de l'art antérieur et responsables des inconvénients générant des produits chimériques.
Les bibliothèques fournies par la méthode décrite ci-dessus peuvent être utilisées sur n'importe quelle plate-forme NGS, tels que : 454 Génome Séquencer (Roche Applied Science), Illumina Génome Analyzer (Illumina, Inc.) ou la plate-forme SOLiD™ (Applied Biosystems).
Définitions
Tel qu'utilisé ici, le terme « molécule d'acide nucléique » se rapporte aux polymères simple brin et double brins des monomères de nucléotide, y compris l'ADN et l'ARN, liés par des liaisons phosphodiester. La molécule d'acide nucléique peut être linéaire ou circulaire. Les molécules d'acide nucléique peuvent être des molécules d'ADN, des molécules d'ARN ou des molécules chimériques d'ADN-ARN. Elles peuvent aussi comprendre des analogues de nucléobase et de sucre. De préférence, le terme « molécule d'acide nucléique » est utilisé ici pour se rapporter à une molécule double brin linéaire ou circulaire d'ADN.
Tel qu'utilisé ici, le terme « bibliothèque d'acide nucléique » se rapporte à une pluralité de différentes molécules simple brin ou double brins d'acide nucléique, en particulier des molécules d'ADN. Ces molécules peuvent être linéaires ou circulaires. Les molécules d'acide nucléique de la bibliothèque peuvent être ou non attachées covalemment à un support solide tels que des billes et en particulier des billes ou support recouvert de streptavidine.
Les termes « en amont » et « en aval », comme utilisés ci-dessus, se rapportent à une position d'un élément discret sur une molécule d'acide nucléique par rapport à un autre élément discret. Un premier élément est en amont à un deuxième élément lorsqu'il est placé dans la direction 5' du brin codant dudit deuxième élément. Un premier élément est en aval à un deuxième élément lorsqu' il est placé dans la direction 3' du brin codant dudit deuxième élément.
Les termes « extrémité 5' » et « extrémité 3' », tel qu'utilisé ici, se rapportent à l'extrémité 3' et l'extrémité 5' du brin codant.
Tel qu'utilisé ici, le terme « adjacent » se rapporte à une position d'un élément discret sur
une molécule d'acide nucléique par rapport à un autre élément discret. Un premier élément est à côté d'un deuxième élément une fois placé à l'extrémité 5' ou à l'extrémité 3' dudit deuxième élément. Cette limite indique qu'aucun autre élément n'est présent entre le premier et le deuxième élément. En particulier, le terme « adjacent » signifie que les premiers et les deuxièmes éléments sont consécutifs (c.-à-d., il n'y a aucun nucléotide s 'intercalant) ou sont séparés par un nombre non significatif de nucléotides, de préférence moins de 20, 15, 10, 5 ou 2 nucléotides.
Tel qu'utilisé ici, le terme « amorce » se rapporte à un polynucléotide d'environ 10-200 nucléotides de longueur. L'amorce s'hybride avec la cible (ou la matrice) et fournit un point d'initiation pour la synthèse dirigée par la matrice d'un polynucléotide complémentaire à la cible catalysée par une enzyme dite polymérase telle qu'une ADN polymérase (réaction d'amplification en chaîne par la polymérase). Des réactions de PCR sont typiquement réalisées avec une paire d'amorces : une amorce sens (ou amorce amont) et une amorce inverse (ou amorce aval) qui délimite la région à amplifier.
Le terme « enzyme de restriction » ou « endonucléase de restriction » est prévu pour se rapporter à une enzyme qui identifie un site de reconnaissance spécifique (ou site de restriction) sur une molécule monocaténaire ou double brin d'acide nucléique et coupe cette molécule à un site de clivage. Tel qu'utilisé ici, le terme « site de restriction » (RS) se rapporte à une séquence spécifique de nucléotides reconnue par une enzyme de restriction. Tel qu'utilisé ici, le terme « site de clivage » (CS) se rapporte à un site dans lequel l'enzyme de restriction coupe la molécule d'acide nucléique. Les enzymes de restriction peuvent reconnaître et cliver la molécule d'acide nucléique au même site. Les enzymes de restriction peuvent aussi cliver la molécule d'acide nucléique à un site éloigné du site de reconnaissance. Selon l'enzyme de restriction, le site de clivage peut être placé en aval ou en amont du site de reconnaissance.
Tel qu'utilisé ici, le terme « ligation intra-moléculaire » se rapporte à la ligation de deux extrémités d'une molécule linéaire d'acide nucléique. Tel qu'utilisé ici, le terme « ligation intermoléculaire » se rapporte à la ligation des extrémités de deux molécules linéaires d'acide nucléique Tel qu'utilisé dans ces spécifications, le terme « environ » se rapporte à une gamme du ± 10% de la valeur spécifique. Par exemple, « environ 20 » inclut le ± 10 % de 20, et se rapporte de 18 à 22. De préférence, le terme « environ » se rapporte à une gamme de valeurs ± 5 % de la valeur spécifique.
Tel qu'utilisé ici, le terme « paire se liant par affinité » se rapporte à un système basé sur deux membres capables d'association les uns avec les autres, en covalence ou pas, de préférence non-covalente. Par exemple, le premier membre peut être la biotine et le deuxième membre peut être la streptavidine ou l'avidine. Un autre exemple d'une paire se liant par affinité est la
digoxygénine et l'anticorps anti-digoxygénine. D'autres paires se liant par affinité sont connues dans l'art et considérées avec attention ici.
Tel qu'utilisé ici, le terme « forme circularisée d'une molécule linéaire d'acide nucléique » se rapporte au produit obtenu par ligation intra-moléculaire de ladite molécule, c.-à-d. la ligation de l'extrémité 5' et de l'extrémité 3' de ladite molécule. Toutefois, ce terme n'est pas associé à la préparation réelle d'une telle forme circularisée mais est commode pour la description de la molécule d'acide nucléique linéaire.
Dans un premier aspect, la présente invention concerne une méthode pour préparer une bibliothèque d'acide nucléique, en particulier une bibliothèque d'acide nucléique à séquencer. La bibliothèque obtenue par cette méthode peut être l'ADN ou une bibliothèque d'ARN, de préférence une bibliothèque d'ADN.
La méthode de l'invention comprend (i) l'étape de fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant une séquence d'intérêt à être entièrement ou partiellement séquencée et une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique et (ii) plusieurs étapes de circularisation, de digestion et de clivage pour fournir une bibliothèque caractérisée en ce que chaque ensemble des molécules d'acide nucléique est associé à un code-barres spécifique. Chaque dispositif de séquençage fourni par cette bibliothèque comprend un fragment de la séquence d'intérêt et un code-barres qui sera séquencé simultanément avec ledit fragment. Dans un mode de réalisation préféré, la méthode comprend l'étape i) de fourniture d'une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant une séquence d'intérêt à être séquencée entièrement ou partiellement et une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique. En particulier, la méthode comprend l'étape i) de fourniture de « n » ensembles de molécules linéaires d'acide nucléique comprenant une séquence à être séquencée entièrement ou partiellement et une séquence de code-barres (spécifique à chaque ensemble des molécules d'acide nucléique), « n » étant un nombre entier entre 1 et 1000. En conséquence, différentes séquences d'intérêt « n » peuvent être simultanément séquencés, chacune est associée à une séquence distincte de code- barres. « n » est limité par la capacité des séquenceurs.
La première étape de la méthode consiste en (a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circularisée et dans la direction 5' vers 3'
- une séquence à être séquencée entièrement ou partiellement
un site inverse d'amorçage,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique, qui est placé entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et
- deux sites de reconnaissance pour deux enzymes de restriction différentes :
- un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et
- un deuxième site de restriction pour une deuxième enzyme de restriction qui est placé entre le site inverse d'amorçage et le site sens d'amorçage.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) peuvent comprendre de l'extrémité 5' vers l'extrémité 3' :
- un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt (Fig. 1 A) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt et un site inverse d'amorçage (Fig. 1B) ; ou
- une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage et un site sens d'amorçage (Fig. 1C) ; ou
- une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres (Fig. 1D) ; ou
- un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres (Fig. 1E) ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage (Fig. 1F) ; ou
- une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig. 1G) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un site sens d'amorçage et une séquence d'intérêt (Fig. 1H).
Lorsque l'on considère la molécule d'acide nucléique comprenant dans sa forme circularisée, toutes les formes linéaires mentionnées ci-dessus peuvent être récapitulées par deux formes circularisées : La Fig. II est la forme circularisée récapitulant les acides nucléiques linéaires de la Fig. 1A-D et la Fig. 1J est la forme circularisée récapitulant les acides nucléiques linéaires de la
Fig. 1E-H.
De préférence, toutes les molécules d'acide nucléique ont la même conformation ou arrangement des différents éléments, c.-à-d. une des structures présentées ci-dessus. Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) sont des molécules double brins d'ADN.
Le site inverse d'amorçage (RP) et le site sens d'amorçage (FP) sont connus et ont des séquences prédéterminées. Ces sites d'amorçage sont utilisés pour amplifier les dispositifs de séquençage en utilisant des amorces spécifiques de ces sites. Les amorces utilisées pour la réaction d'amplification peuvent être des amorces universelles de séquençage. Dans un mode de réalisation préféré, l'amorce inverse de séquençage s'hybride au site inverse d'amorçage et l'amorce sens de séquençage s'hybride au site sens d'amorçage. Ces sites d'amorçage peuvent être facilement conçus par une personne qualifiée selon la technologie de séquençage et avec les amorces universelles qui sont prévues pour être utilisées. Le site inverse d'amorçage (RP) et le site sens d'amorçage (FP) s'appellent :
PI (5'CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT3') et
P2 (5'CTGCCCCGGGTTCCTCATTCTCT3') dans le système SOLiD.
La séquence d'intérêt peut être n'importe quelle séquence d'acide nucléique d'une longueur d'environ 25 paires de bases (bp) à 15 kbp. En particulier, la limitation principale pour la longueur de la séquence d'intérêt est liée à la limitation d'amplification.
La séquence d'intérêt peut être un gène d'intérêt ou d'un segment de celui-ci, ou une région chromosomique d'intérêt. Un code-barres doit être associé à une séquence d'intérêt. Puis, une bibliothèque peut être préparée à partir de l'association d'un code-barres à une séquence d'intérêt par la méthode décrite ci-dessus, ce qui permet de fournir une bibliothèque de fragments de la séquence d'intérêt associées au même code-barres. Naturellement, comme expliqué dans l'introduction de la description détaillée, l'avantage de la présente méthode est de préparer simultanément plusieurs bibliothèques, caractérisées en ce que chaque séquence initiale d'intérêt est associée à un code-barres spécifique (et différent). Par exemple, si la méthode est appliquée au séquençage d'un gène particulier d'intérêt pour plusieurs individus ou organismes (par exemple, un oncogène tel que le gène p53), un code-barres peut être attribué à chaque individu ou organisme particulier. En conséquence, le gène peut être simultanément séquencé pour plusieurs individus ou organismes. Alternativement, si plusieurs gènes ou régions chromosomiques doivent être
séquencés pour un même individu, un code- barres peut être attribué à chaque gène particulier ou régions chromosomiques.
La séquence de code-barres est une séquence d'acide nucléique comprenant de 5 à 15bp, de 5 préférence de 5 à lObp. Cette séquence de code-barres est spécifique à chaque ensemble des molécules d'acide nucléique. De préférence, cette séquence de code-barres ne comprend aucun site de restriction. Quand on considère la forme circularisée des molécules d'acide nucléique décrites ci-dessus, le code-barres est toujours à côté de la séquence d'intérêt soit en amont de la séquence d'intérêt, et en particulier entre le site sens d'amorçage et la séquence d'intérêt (Fig. II) ; ou en aval
10 de la séquence d'intérêt, et en particulier entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1J). Lorsque l'on considère les différentes formes possibles linéaires fournies à l'étape a), ce qui signifie que la séquence de code-barres peut être placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. 1A et Fig. 1B), entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1F et Fig. 1G), en amont de la séquence d'intérêt (Fig. 1C), en aval de la séquence d'intérêt
15 (Fig. 1E), en aval du site sens d'amorçage (Fig. 1D) ou en amont du site inverse d'amorçage (Fig.
1H).
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site universel d'amorçage (UPS). Ce site universel d'amorçage comprend ou consiste en une
20 séquence d'au moins de 10 paires de bases, de préférence au moins 15 pb, de préférence au moins 20 pb. De préférence, le site universel d'amorçage se compose de 10 à 25 pb, de préférence de 15 à 20 pb. Ladite séquence possède moins de 90 % d'identité avec le génome contenant la séquence d'intérêt. De préférence, la séquence possède moins de 80 % d'identité avec le génome contenant la séquence d'intérêt, de préférence moins de 70 % d'identité et plus préférablement, moins de
25 60% d'identité. Dans un mode de réalisation particulier, le site universel d'amorçage comprend ou consiste en une séquence d'au moins 15 pb et qui possède moins de 80 % d'identité avec le génome contenant la séquence d'intérêt. Le site universel d'amorçage peut être placé en amont ou en aval de la séquence d'intérêt.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) et comprenant en outre
30 un site universel d'amorçage (UPS) qui peut comprendre, par exemple, de l'extrémité 5' vers l'extrémité 3' :
- un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (Fig. 2 A) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence
d'intérêt et un site inverse d'amorçage (Fig. 2B) ; ou
- une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2C) ; ou
- une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres (Fig. 2D) ; ou
- un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig. 2E) ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de code-barres et un site inverse d'amorçage (Fig. 2F) ; ou
- une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2G) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, et une séquence d'intérêt (Fig. 2H).
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, une séquence d'intérêt, un UPS, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2C).
Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig. 2E).
Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (Fig. 2A).
Dans un autre mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2G).
Les molécules mentionnées ci-dessus comprenant une séquence UPS sont les préférées. D'autres molécules comprenant une séquence UPS peuvent être envisagées, mais avec un arrangement moins favorable.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un module de courbure (CM) placé, sous leur forme circularisée, entre le site inverse d'amorçage et le
site sens d'amorçage. En considérant les molécules linéaires d'acide nucléique fournies dans l'étape a), le module de courbure placé entre le site inverse d'amorçage et le site sens d'amorçage ou, lorsque les sites d'amorçage sont placés à chaque extrémité de la molécule (la Fig. 1 ou 2, le B et F), est placé soit en aval du site inverse d'amorçage ou en amont du site sens d'amorçage. Le module de courbure est une séquence de nucléotide induisant une courbure dans la structure de l'hélice d'une molécule d'acide nucléique. Ce module peut être utilisé pour faciliter la circularisation des molécules d'acide nucléique, en particulier les molécules d'acide nucléique comprenant moins de 250 bp. Ce module peut comprendre ou consister en une séquence de nucléotide obtenu ou dérivé des minicercles d'ADN de kinétoplaste trouvés dans la plupart des espèces de Trypanosoma et en particulier des minicercles d'ADN de kinétoplaste de Crithidia fasciculata. Le module de courbure peut comprendre ou consiste en, une séquence sélectionnée parmi le groupe de séquences suivant : SEQ ID No. 1 et SEQ ID No.2 et une séquence ayant au moins 90 % d'identité avec les séquences SEQ ID No. 1 et SEQ ID No. 2. Dans un mode de réalisation, le module de courbure comprend ou consiste en, une séquence sélectionnée parmi le groupe de séquences SEQ ID No. 1 et SEQ ID No. 2. Dans un mode de réalisation particulier, le module de courbure comprend ou consiste en, la séquence SEQ ID No. 1. Dans un autre mode de réalisation particulier, le module de courbure comprend ou consiste en, la séquence SEQ ID No. 2. (Birkenmeyer et al 1985, Ulanovsky et al 1986, Kitchin et al 1 86). En conséquence, les molécules linéaires d'acide nucléique fournies dans l'étape a) et comprenant aussi un module de courbure peut comprendre, par exemple, de l'extrémité 5' vers l'extrémité 3' :
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt (dérivé de la Fig. 1 A arrangement) ; ou
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (dérivé de la Fig. 2A arrangement ; Fig. 3A) ; ou
- un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt et un site inverse d'amorçage (dérivé de la Fig. 1B arrangement) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 1B arrangement) ; ou
- un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt et un site inverse d'amorçage (dérivé de la Fig. 2B arrangement) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 2B) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage et un module de courbure ; ou
- une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 1C arrangement) ; ou
- une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 2C ; Fig. 3B) ; ou
- une séquence d'intérêt, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence de code-barres (dérivé de la Fig. 1D arrangement) ; ou
- une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence de code-barres (dérivé de la Fig. 2D arrangement) ; ou
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres (dérivé de la Fig. 1E arrangement) ; ou
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (dérivé de la Fig. 2E arrangement ; Fig. 3C) ; ou
- un module de courbure, un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage (dérivé de la Fig. 1F arrangement) ; ou
- un module de courbure, un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de code-barres et un site inverse d'amorçage (dérivé de la Fig. 2F arrangement) ; ou
- un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 1F arrangement) ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 2F arrangement) ; ou
- une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 1G arrangement) ; ou
- une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 2G arrangement ;
Fig. 3D) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence d'intérêt (dérivé de la Fig. 1H arrangement) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS et une séquence d'intérêt (dérivé de la Fig. 2H arrangement).
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (Fig. 3B).
Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig. 3C).
Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (Fig. 3A).
Dans un autre mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (Fig. 3D).
Les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de reconnaissance pour une première enzyme de restriction.
Le site de reconnaissance pour la première enzyme de restriction est placé, en considérant la forme circularisée des molécules d'acide nucléique, entre le code-barres et la séquence d'intérêt.
Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres à côté de la séquence d'intérêt (Fig. 1 A-C, E-G ; Fig. 2C et 2E, Fig. 3B et C), et le site de reconnaissance pour la première enzyme de restriction est placé entre la séquence de code-barres et la séquence d'intérêt.
Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres dans l'extrémité 5' et une séquence d'intérêt dans l'extrémité 3' (Fig. 1H et Fig. 2H), et le site de reconnaissance pour la première enzyme de restriction est placé en amont de la séquence de code-barres ou en aval de la séquence d'intérêt,
mais de préférence en amont de la séquence de code-barres.
Dans un mode de réalisation additionnel, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres de l'extrémité 3' et une séquence d'intérêt de l'extrémité 5' (Fig. 1D et Fig. 2D) et le site de reconnaissance pour la première enzyme de restriction est placé en aval de la séquence de code-barres ou en amont de la séquence d'intérêt, mais de préférence en aval de la séquence de code-barres.
Dans un mode de réalisation supplémentaire, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent un site universel d'amorçage (UPS) entre la séquence de code-barres et la séquence d'intérêt (Fig. 2A, 2B, 2F et 2G, Fig. 3A et 3D) et le site de reconnaissance pour la première enzyme de restriction est placé entre le site universel d'amorçage (UPS) et la séquence de code-barres ou dans ledit site universel d'amorçage (de préférence près de la séquence de code-barres).
Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une deuxième enzyme de restriction qui est placé, lorsqu'on considère la forme circularisée des molécules d'acide nucléique, entre les deux sites d'amorçage (par exemple, Fig. II et 1J). Dans un mode de réalisation particulier, les molécules d'acide nucléique comprennent aussi un module de courbure placé entre le site inverse et le sites sens d'amorçage et le deuxième site de restriction pour la deuxième enzyme de restriction est placé dans ledit module de courbure (Fig. 3A-D).
Dans un mode de réalisation très particulier, les molécules d'acide nucléique comprennent aussi un module de courbure placé entre les sites inverse et sens d'amorçage, le deuxième site de restriction pour la deuxième enzyme de restriction est placé dans ledit module de courbure et la deuxième enzyme de restriction est Pacl.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de reconnaissance pour une troisième enzyme de restriction. La troisième enzyme de restriction est une endonucléase non palindromique qui clive l'ADN à une distance définie de son site de reconnaissance.
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. II), et le site de reconnaissance pour la troisième enzyme de restriction est placé en amont du site inverse
d'amorçage. Dans ce mode de réalisation, la troisième enzyme de restriction coupe les molécules d'acide nucléique dans un site de clivage en amont à son site de reconnaissance, c.-à-d. dans la séquence d'intérêt pour la forme circularisée des molécules.
Dans un autre mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1J), et le site de reconnaissance pour la troisième enzyme de restriction est placé en aval du site sens d'amorçage. Dans ce mode de réalisation, la troisième enzyme de restriction coupe ADN (c.-à-d., une coupure double brin) dans un site de clivage en aval de son site de reconnaissance, c.-à-d. dans la séquence d'intérêt pour la forme circularisée des molécules.
Dans un mode de réalisation particulier, la troisième enzyme de restriction est choisie dans le groupe EcoP15I, Mmel, NmeAIII, Acul, Bbvl, BceAI, Bpml, BpuEI, BseRI, Bsgl, BsmFI, BtgZI, Ecil, Fokl, Hgal, I-Ceul, I-Scel, Pi-Pspl et Pi-Scel. Dans un mode de réalisation plus particulier, la troisième enzyme de restriction est choisie parmi le groupe EcoPISI, Mmel et NmeAIII. Dans un mode de réalisation préféré, la troisième enzyme de restriction est EcoP15I.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de reconnaissance pour une quatrième enzyme de restriction.
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. II), et le site de reconnaissance pour la quatrième enzyme de restriction est placé en amont du site inverse d'amorçage.
Dans un autre mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1J), et le site de reconnaissance pour la quatrième enzyme de restriction est placé en aval du site sens d'amorçage.
Les premières, deuxièmes, troisièmes et quatrièmes enzymes de restriction peuvent être choisies afin d'avoir des sites de clivage additionnels rares/occasionnels ou pas de site de clivage additionnels dans la séquence d'intérêt et dans n'importe quelle autre partie des molécules d'acide
nucléique. De préférence, les enzymes de restriction sont choisies afin d'avoir seulement un site de clivage dans les molécules d'acide nucléique.
De préférence, les premières, deuxièmes et quatrièmes enzymes de restriction coupent l'ADN (c.-à-d., coupure double brin) dans leurs sites de reconnaissance ou à une distance de ces sites inférieure à 5 nucléotides. De préférence, les premières, deuxièmes et quatrièmes enzymes de restriction coupent l'ADN dans leurs sites de reconnaissance.
Ces enzymes de restriction peuvent être choisies pour n'avoir aucun site de clivage ou une fréquence de coupure basse dans la séquence d'intérêt. La fréquence des sites d'une enzyme de restriction dans les génomes séquencés peut être facilement trouvée par une personne qualifiée sur les bases de données disponibles (comme REBASER http://rebase.neb.com). Des enzymes de restriction peuvent être choisies ainsi afin d'avoir une fréquence de coupure basse dans le génome contenant la séquence d'intérêt.
Dans un mode de réalisation particulier, la première enzyme de restriction est choisie dans le groupe Srfl, Sbfl, Ascl, Notl, BssHII, SacII, Fsel, Smal. Dans un mode de réalisation préféré, la première enzyme de restriction est choisie dans le groupe Srfl et Sbfl.
Dans un mode de réalisation particulier, la deuxième enzyme de restriction est choisie dans le groupe Pacl, Ascl, Notl, BssHII, SacII, Fsel, Smal. Dans un mode de réalisation préféré, la deuxième enzyme de restriction est Pacl.
Dans un mode de réalisation particulier, la quatrième enzyme de restriction est choisie dans le groupe Pmel, Ascl, Notl, BssHII, SacII, Fsel, Smal. Dans un mode de réalisation préféré, la quatrième enzyme de restriction est choisie dans le groupe Pmel et Ascl.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de liaison pour un premier membre d'une paire se liant par affinité. De préférence, ce site de liaison est placé dans la région de l'extrémité 5' du site inverse d'amorçage à l'extrémité 3' du site sens d'amorçage. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure placé entre les sites inverse et sens d'amorçage et le dit module de courbure comprend un site de liaison pour un premier membre d'une paire se liant par affinité.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent aussi être attachées à un premier membre d'une paire se liant par affinité. De préférence, le premier membre d'une paire se liant par affinité est attaché dans la région de l'extrémité 5' du site inverse d'amorçage à l'extrémité 3' du site sens d'amorçage. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent un module de courbure placé entre les sites inverse et sens d'amorçage
et le premier membre d'une paire se liant par affinité est fixé audit module de courbure.
La paire se liant par affinité peut être, par exemple, la digoxigénine - anticorps anti- digoxigénine ou la biotine- avidine/streptavidine. De préférence, le premier membre de la paire se liant par affinité est la biotine et le deuxième membre est la streptavidine. Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) comprennent un module de courbure comprenant une thymidine modifiée par une biotine. Comme un exemple précis, la thymidine modifiée par une biotine peut être la thymidine 12 de SEQ ID No. 1 ou la thymidine 13 de SEQ ID No. 2. Les molécules d'acide nucléique fournies dans l'étape a) de la méthode de l'invention peut être obtenue par une ou plusieurs réactions d'amplification. L'amplification peut être réalisée par n'importe quelle technique, y compris, mais sans s'y limiter, la PCR, la RT-PCR , amplification par la Q -replicase (Cahill et al, 1991 ; Chetverin et Spirin, 1995 ; Katanaev et al, 1995), la « ligase chain reaction" (LCR) (Landegren et al, 1988 ; Barany, 1991), le système autonome de réplication de séquence (Fahy et al, 1991), amplification par déplacement de brin (Walker et al, 1992), « nucleic acid sequence-based amplification" (NASBA) (Compton, 1991), « loop-mediated isothermal amplification" (Notomi et al, 2000), « rolling circle amplification" (RCA) (Blanco et al, 1989) et « hyperbranched rolling circle amplification" (HRCA) (Lizardi et al, 1998). De préférence l'amplification est par PCR ou RT-PCR. De préférence, une polymérase de haute-fidélité est utilisée et le taux d'erreur de la polymérase est moins de 10"5, de préférence moins de 10"6, et encore plus préférentiellement moins de 5.10"7. De préférence, la Platinum Taq DNA Polymérase High Fidelity (Invitrogen), la Phusion Hot Start High-Fidelity DNA Polymérase (New England BioLabs), la FastStart High Fidelity PCR System (Roche). La matrice pour cette amplification peut être une molécule d'ADN ou d'ARN. Pour l'amplification par PCR ou par RT-PCR, un ensemble d'amorces est nécessaire. Un ensemble d'amorces comprennent au moins deux amorces : une amorce sens et une amorce inverse. L'ensemble d'amorces peut être facilement conçu par une personne qualifiée selon la structure des molécules linéaires d'acide nucléique à obtenir, la séquence d'intérêt et le nombre de réactions d'amplification.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent être obtenues par une réaction d'amplification, de préférence par une réaction de RT-PCR ou de PCR. L'amorce sens pour cette réaction comprend la région des molécules linéaires d'acide nucléique fournies dans
l'étape a) qui est en amont de la séquence d'intérêt et au moins 10, de préférence 12, 15, 20 ou 25, nucléotides de l'extrémité 5' de la séquence d'intérêt. L'amorce inverse comprend la région des molécules d'acide nucléique qui est en aval de la séquence d'intérêt et au moins 10, de préférence 12, 15, 20 ou 25, nucléotides de l'extrémité 3' de la séquence d'intérêt.
Dans un mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1A, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification avec un ensemble d'amorces comprenant une amorce inverse spécifique de l'extrémité 3' de la séquence d'intérêt et d'une amorce sens comprenant de son extrémité 5' vers son extrémité 3' :
- un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En option, l'amorce sens peut comprendre à son extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation plus particulier, l'amorce sens est attachée à un premier membre d'une paire se liant par affinité. De préférence, l'amorce sens est attachée à la biotine. De préférence, l'amorce sens comprend un module de courbure attaché à la biotine.
Dans un mode de réalisation préféré, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse spécifique de l'extrémité 3' de la séquence d'intérêt et d'une amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. De préférence, l'amorce sens comprend aussi à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et, en option un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1G, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification avec un ensemble d'amorces comprenant une amorce sens à l'extrémité 5' de la séquence d'intérêt et d'une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3' :
- un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En option, l'amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation plus particulier, l'amorce inverse est attachée à un premier membre d'une paire se liant par affinité. De préférence, l'amorce inverse est attachée à la biotine. De préférence, l'amorce inverse comprend un module de courbure attaché à la biotine.
Dans un mode de réalisation préféré, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens dans l'extrémité 5' de la séquence d'intérêt et d'une amorce inverse comprenant de son extrémité 5' à l'extrémité 3' un site sens d'amorçage, un module de courbure attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. De préférence, l'amorce inverse comprend à son extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et, en option un site de reconnaissance pour le quatrième enzyme de restriction
Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1C, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenus par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et une amorce
inverse comprenant, de son extrémité 5' vers son extrémité 3':
- un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
- un site sens d'amorçage, un module de courbure en option attaché à la biotine et comprend un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En option, l'amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, entre le site de l'amorce inverse et l'extrémité 3' de la séquence d'intérêt.
Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1E, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et d'une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', :
- un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou
- un site inverse d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En option, l'amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, entre le site sens d'amorçage et l'extrémité 5' de la séquence d'intérêt. De préférence, l'amorce sens comprend un site de reconnaissance pour la troisième enzyme de restriction et un site de reconnaissance pour la quatrième enzyme de restriction.
L'homme de l'art peut facilement concevoir un ensemble approprié d'amorces pour préparer les molécules d'acide nucléique de l'étape a) par une réaction d'amplification basée sur les mêmes règles. Les différents ensembles d'amorces peuvent être préparés en changeant la séquence de code-barres pour chaque séquence d'intérêt différente et, naturellement, en adaptant la séquence
spécifique de la séquence d'intérêt ciblée.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent aussi être obtenues par plusieurs réactions d'amplification. Ces réactions d'amplification peuvent être réalisées successivement ou simultanément dans le même mélange de réaction. Si les cibles à amplifier sont très nombreuses, ces amplifications sont réalisées simultanément en utilisant la plate-forme de RainStorm, développée par RainDance Technologies (Mamanova et al, 2010), les amorces à utiliser dans ces réactions peuvent être facilement conçues par une personne qualifiée. En effet, chaque ensemble d'amorces doit contenir au moins une séquence d'amorce qui chevauche avec une autre amorce (les amorces sens chevauchant et/ou les amorces inverses chevauchant, de préférence pas toutes les deux simultanément). Les amorces chevauchant ou le chevauchement ci-dessus signifient que le chevauchement est suffisant pour amorcer l'amplification. En conséquence, le chevauchement est d'au moins 10, 15 ou 20 nucléotides. Dans un mode de réalisation préféré de la méthode, les molécules d'acide nucléique fournies dans l'étape a) ont, soit à leur extrémité 5' ou à leur l'extrémité 3', un groupe d'éléments comprenant, de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage. De préférence, elles ont un groupe d'éléments comprenant, de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure en option attaché à un premier membre d'une paire se liant par affinité, par exemple la biotine, et comprend un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage. De préférence, les réactions d'amplification peuvent utiliser au moins deux groupes différents d'amorces avec les amorces sens chevauchant dans le site sens d'amorçage ou les amorces inverses chevauchant dans le site inverse d'amorçage, selon l'endroit de ce groupe d'éléments. En particulier, quand ce groupe d'éléments est à l'extrémité 5' de la molécule d'acide nucléique fournie à l'étape a), les ensembles d'amorces incluent les amorces sens chevauchant dans le site sens d'amorçage. Alternativement, quand ce groupe d'éléments est à l'extrémité 3' de la molécule d'acide nucléique fournie à l'étape a), les ensembles d'amorces incluent les amorces inverses chevauchant dans le site inverse d'amorçage.
Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse de l'extrémité 3' de la séquence d'intérêt et
- une première amorce sens comprenant, de son extrémité 5' a son extrémité 3', le site sens d'amorçage ou une première partie de celui-ci incluant son extrémité 3', une séquence de code-
barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et du site sens d'amorçage ou d'une première partie de celui-ci incluant son extrémité 5', ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure, étant en option, attaché à un premier membre d'une paire se liant par affinité, le site sens d'amorçage ou une seconde partie de celui-ci chevauchant la première partie de celui-ci incluant son extrémité 5'.
En option, la deuxième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et
- une première amorce sens comprenant, de son extrémité 5' à son extrémité 3', un site sens d'amorçage ou d'une première partie de celui-ci incluant son extrémité 3', et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et du site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5', ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site sens d'amorçage ou une deuxième partie chevauchant la première partie incluant son extrémité 5'.
En option, la deuxième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans
l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une première partie de celui-ci incluant son extrémité 5' et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et,
- une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'; ou
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'.
En option, la deuxième amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation particulier additionnel, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce inverse comprenant, de son extrémité 5' à son extrémité 3', le site inverse d'amorçage ou une première de celui-ci incluant son extrémité 5', une séquence de code- barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et,
- une deuxième amorce inverse comprenant:
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'; ou
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site
inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'.
En option, la deuxième amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation avantageux, la méthode utilise une séquence du site universel d'amorçage (UPS). L'utilisation de l'UPS permet la conception d'amorces plus courtes spécifiques aux séquences d'intérêt, abaissant de ce fait le coût. En effet, les premières amorces préférées de la méthode incluent une séquence UPS et au moins 10 nucléotides de l'extrémité 5' ou 3' de la séquence d'intérêt. Les autres amorces ne sont pas spécifiques aux séquences d'intérêt et peuvent être utilisées en tant que produits normalisés, commodes pour préparer des kits appropriés pour réaliser les méthodes telles que décrites ici.
Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse spécifique à l'extrémité 3' de la séquence d'intérêt, et :
- une première amorce sens comprenant, de son extrémité 5' à son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage, et
- une troisième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5', ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5'.
En option, la troisième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site inverse d'amorçage et le site universel d'amorçage, ou
- de son extrémité 5' à son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage et le site universel d'amorçage.
En option, la deuxième amorce inverse peut comprendre entre le site universel d'amorçage et le site inverse d'amorçage, un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et le site universel d'amorçage, ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site
sens d'amorçage et le site universel d'amorçage.
En option, la deuxième amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé entre le site sens d'amorçage et le site universel d'amorçage.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et
- une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et un site universel d'amorçage, ou
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site inverse d'amorçage et un site universel d'amorçage.
En option la deuxième amorce inverse peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé à son extrémité 5'. Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens spécifique à l'extrémité 5' de la séquence d'intérêt, et :
- une première amorce inverse comprenant de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et - une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage, et
- une troisième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site inverse d'amorçage ou une deuxième partie de celui-ci chevauchant la première partie et incluant son extrémité 3', ou
- de son extrémité 5' à son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, et le site inverse d'amorçage ou une deuxième partie de celui-ci chevauchant la première partie et incluant son extrémité 3'.
En option la troisième amorce inverse peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé à l'extrémité 5'.
En option, après de(s) réaction(s) d'amplification, les amorces simple brin excédentaires peuvent être dégradées, par exemple, en utilisant l'exonucléase I ou tout autre nucléase spécifique de l'ADN simple brin.
Les autres étapes de la méthode peuvent être effectuées sur la pluralité des ensembles de séquences d'acide nucléique linéaire, optimisant ainsi le coût en temps et en argent dans la préparation de bibliothèque.
Dans l'étape b) de la méthode d'invention, des molécules linéaires d'acide nucléique fournies dans l'étape a) ou a') sont circularisées par ligation intra-moléculaire. En conséquence, deux types différents des molécules circularisées peuvent être obtenus, le premier type comprend la séquence entière d'intérêt et le deuxième type comprend la séquence d'intérêt déjà tronquée à l'une de ses extrémités (c.-à-d., quand l'étape a') a été réalisée). Cette ligation peut être effectuée par n'importe quelle méthode connue par une personne qualifiée. De préférence, la ligation intra- moléculaire est effectuée en utilisant une ligase d'ADN, telle que l'ADN ligase T4, dans les conditions décrites dans l'article de Collins et Weissman, 1984. Les conditions utilisées dans cette étape empêchent les ligations inter-moléculaires. La ligation inter-moléculaire peut être empêchée par exemple en utilisant la dilution appropriée (par exemple, dilution limite) ou, lorsque les molécules d'acide nucléique sont attachées à un premier membre d'une paire se liant par affinité, en liant les molécules d'acide nucléique à un support solide soutenant le premier membre d'une paire se liant par affinité.
Dans l'étape c) de la méthode de l'invention, les molécules circularisées d'acide nucléique obtenues à partir de l'étape b) sont digérées avec l'enzyme de restriction affin de fournir une forme linéarisée, de préférence par la première enzyme de restriction. Cette enzyme de restriction coupe les molécules circularisées d'acide nucléique entre le code-barres et la séquence d'intérêt. Cette digestion produit des molécules linéaires d'acide nucléique comprenant à une extrémité la séquence de code-barres et à l'autre extrémité la séquence d'intérêt. Quand un site universel d'amorçage est présent entre la séquence de code-barres et la séquence d'intérêt, la première enzyme de restriction coupe entre le site universel d'amorçage et la séquence de code-barres ou dans le site universel d'amorçage, de préférence près de l'extrémité adjacente à la séquence de code-barres.
Lorsque les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. II), la digestion avec la première enzyme de restriction fournit les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt à leur extrémité 5' et la séquence de code-barres à leurs extrémité 3'.
Lorsque les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt (Fig. 1J), la digestion avec la première enzyme de restriction fournit les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt à leur extrémité 3' et la séquence de code-barres à leur extrémité 5'.
Dans l'étape d) de la méthode de l'invention, les molécules d'acide nucléique digérées obtenues à partir de l'étape c) sont clivées dans la séquence d'intérêt. Ce clivage peut être effectué par des méthodes enzymatiques ou physiques.
Le clivage peut être effectué en utilisant une technique de clivage indépendamment de la séquence comme, par exemple, la sonication, la nébulisation, la French Press ou en utilisant le système Hydroshear® (Genomic Solutions®). De préférence, le clivage est effectué par sonication. Ce clivage produit des fragments aléatoires d'acide nucléique de tailles spécifiques. La taille des molécules fragmentées peut être choisie par une personne qualifiée selon l'utilisation prévue de la bibliothèque préparée par la méthode de l'invention. Des molécules clivées peuvent être séparées par l'électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir du gel d'électrophorèse.
Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. 1). Dans ce mode de réalisation, la digestion avec la première enzyme de restriction dans l'étape c) fournit les molécules linéaires d'acide nucléique comprenant à leur extrémité 5', l'extrémité 5' de la séquence d'intérêt. Le clivage de ces molécules d'acide nucléique fournit ainsi les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt tronquée en 5'.
Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt (Fig. 2). Dans ce mode de réalisation, la digestion avec la première enzyme de restriction dans l'étape c) fournit les molécules linéaires d'acide nucléique comprenant, à leur extrémité 3', l'extrémité 3' de la séquence d'intérêt. Le clivage de ces molécules d'acide nucléique fournit ainsi les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt tronquée en 3'.
Le clivage peut aussi être effectué en utilisant l'enzyme de restriction. Dans ce cas-ci, les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de reconnaissance pour une troisième enzyme de restriction comme décrit ci-dessus.
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprend sous leur forme circularisée, une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt et un site de reconnaissance pour la troisième enzyme de restriction entre le site inverse d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la digestion des molécules d'acide nucléique obtenues à partir de l'étape c) avec la troisième enzyme fournit des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 5'.
Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée, une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt et un site de reconnaissance pour la troisième enzyme de restriction entre le site sens d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la digestion des molécules d'acide nucléique obtenues à partir de l'étape c) avec la troisième enzyme fournit des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 3'.
Dans l'étape e) de la méthode de l'invention, les molécules clivées d'acide nucléique
obtenues à partir de l'étape d) sont circularisées par ligation intra-moléculaire. Cette ligation peut être effectuée tel que décrit ci-dessus.
Les molécules circularisées d'acide nucléique obtenues à partir de l'étape e) comprennent, dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage.
Dans un mode de réalisation, la séquence de code-barres est placée entre le site sens d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la séquence d'intérêt comprise entre lesdites molécules circularisées d'acide nucléique est tronquée en 5'.
Dans un autre mode de réalisation, la séquence de code-barres est placée entre le site inverse d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la séquence d'intérêt comprise dans lesdites molécules circularisées d'acide nucléique est tronquée en 3'. Les molécules d'acide nucléique obtenues après les étapes a), b), c), d) et e) comprennent une séquence d'intérêt tronquée en 5' ou 3' selon la position du code-barres (en amont ou en aval de la séquence d'intérêt). La méthode de l'invention peut en outre, comprendre des étapes additionnelles afin de tronquer l'autre extrémité de la séquence d'intérêt ce qui permet de fournir des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 3' et 5'.
Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent la séquence d'intérêt à l'une de son extrémité (par exemple, Fig. 1A, Fig. 1D, Fig. 1G et Fig. 1H ; Fig. 2 A, Fig. 2D, Fig. 2G et Fig. 2H ; la Fig. 3 A et 3D) et la méthode comprend en outre une étape a') de clivage des molécules d'acide nucléique, après l'étape a) et avant l'étape b), ce qui permet de fournir une séquence d'intérêt tronquée. De préférence, le clivage est effectué par l'utilisation d'une technique de clivage indépendamment de la séquence (SITC), comme la sonication. En particulier, si la séquence d'intérêt est à l'extrémité 3' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig. 1A et Fig. 1H ; Fig. 2A et Fig. 2H ; La Fig. 3A), les molécules obtenues d'acide nucléique présentent une séquence d'intérêt tronquée en 3'. Alternativement, si la séquence d'intérêt est à l'extrémité 5' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig. 1D et Fig. 1G ; Fig. 2D et Fig. 2G ; 3D), les molécules obtenues d'acide nucléique présentent une séquence d'intérêt tronquée en 5'. Les molécules clivées peuvent être séparées par électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir de gel d'électrophorèse.
Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) ne comprennent pas la séquence d'intérêt à une de son extrémité mais comprennent un site de reconnaissance pour une quatrième enzyme de restriction placé à l'extrémité de la séquence d'intérêt qui est à l'opposé de l'extrémité adjacente au code-barres. Dans ce mode de réalisation, la méthode comprend en outre après l'étape e),
f) digestion des molécules circulaires d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant l'extrémité non tronquée de la séquence d'intérêt à une de son extrémité ; g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant une séquence d'intérêt tronquée en 5'et 3'.
Les molécules clivées peuvent être séparées par électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir du gel d'électrophorèse. La méthode d'invention peut en outre, comprendre une étape h) de circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire. Cette ligation peut être effectuée tel que décrit ci-dessus.
Selon la structure des molécules d'acide nucléique fournie dans l'étape a), les molécules circulaires obtenues à partir de l'étape h) comprennent, dans la direction 5' vers 3':
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en
3' et en 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, ou
- un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction.
Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3' un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, en option un site universel d'amorçage, et une séquence
d'intérêt (Fig. 3A) (étape a) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, en option un site universel d'amorçage, et une séquence d'intérêt tronquée en 3' ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 3' et 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; et
- circularisation desdites molécules clivées d'acide nucléique par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 3' et 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un autre mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, en option un site universel d'amorçage, et une séquence d'intérêt (Fig. 3 A) (étape a) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, en option un site universel d'amorçage, et une séquence d'intérêt tronquée en 3' ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 3' et 5', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; et
- circularisation desdites molécules d'acide nucléique par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 3' et 5', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance
pour une deuxième enzyme de restriction (étape e).
Dans un autre mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et un site de reconnaissance pour une troisième enzyme de restriction (Fig. 3D) (étape a) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et un site de reconnaissance pour une troisième enzyme de restriction ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième
enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et en 3' (étape d) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 3' et 5', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e). Dans un autre mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (Fig. 3D) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, et un site de reconnaissance pour une première enzyme de restriction (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel
(étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code- barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3' (étape d) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (Fig. 3B) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un
site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ;
- circularisation desdites molécules clivées d'acide nucléique par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e),
- digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et en 3', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (Fig. 3B) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ;
- circularisation desdites molécules d'acide nucléique clivées par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction
5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e),
digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, comprenant un module de courbure, un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et, en option, un site universel d'amorçage (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et en 3', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction et une séquence de code-barres (Fig. 3C) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de
restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt tronquée en 3' (étape d) ;
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e),
- digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans
la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h). Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction et une séquence de code-barres (Fig. 3C) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt (étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, en option un site universel d'amorçage et une séquence d'intérêt tronquée en 3' (étape d) ;
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans
la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e),
- digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) sont attachées à un premier membre d'une paire se liant par affinité et la méthode comprend en outre, une ou plusieurs étapes de fixation des molécules d'acide nucléique sur un support solide par le biais d'interaction entre le premier membre d'affinité de la paire de liaison attaché auxdites molécules d'acide nucléique et les deuxièmes membres de ladite paire se liant par affinité liées au support solide. Les supports solides utiles incluent n'importe quelle surface rigide ou semi-rigide sur laquelle un membre d'une paire se liant par affinité peut être lié. Le support peut être tout matériel poreux ou non poreux insoluble dans l'eau, y compris, sans limitation, membranes, filtres, puces, billes magnétiques ou non magnétiques, et polymères. De préférence, le support solide est choisi parmi les membranes et les billes basées sur la silice. De préférence, le support solide est des billes et plus en particulier des billes de polystyrène. Ces billes peuvent avoir un diamètre de 1 à 10 micromètres. Dans un mode de réalisation particulier, les molécules d'acide nucléique
fournies dans l'étape a) sont attachées à la biotine et sont liées à un support solide, des billes de préférence magnétiques, revêtue de streptavidine. Des molécules d'acide nucléique peuvent être liées à un support solide avant qu'une étape de circularisation par ligation intra- moléculaire afin d'empêcher des événements inter-moléculaires ou avant que chaque changement de mélange de réaction afin de faciliter la récupération des molécules d'acide nucléique. La quantité du support solide peut être facilement ajustée par une personne qualifiée selon la concentration des molécules d'acide nucléique.
Dans un mode de réalisation préféré, des molécules linéaires d'acide nucléique obtenues à partir de l'étape g) sont liées à un support solide avant la circularisation de l'étape h).
Dans un autre mode de réalisation, des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) sont alors liées à un support solide.
Des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) peuvent être digérées par la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3',
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' et une séquence inverse d'amorçage, ou
- un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres et une séquence inverse d'amorçage.
Si les molécules d'acide nucléique comprennent un module de courbure comprenant le site de reconnaissance pour la deuxième enzyme de restriction, les molécules d'acide nucléique obtenues par digestion avec la deuxième enzyme de restriction comprennent à chaque extrémité, une partie du module de courbure.
De préférence, des molécules d'acide nucléique sont liées sur un support solide avant qu'elles soient digérées avec la deuxième enzyme de restriction.
Des molécules d'acide nucléique digérées avec la deuxième enzyme de restriction peuvent alors être amplifiées, par exemple par PCR ou par n'importe quelle autre méthode connue par une personne qualifiée. De préférence, les amorces utilisées pour cette amplification comprennent :
- une amorce sens s'hybridant au site sens d'amorçage, et
- une amorce inverse s'hybridant au site inverse d'amorçage.
Le produit de cette amplification peut alors être séquencé en utilisant n'importe quelle plate-forme de séquençage à haut débit.
La méthode peut en outre, comprendre une ou plusieurs étapes de réparation des extrémités des molécules clivées ou digérées d'acide nucléique. De préférence, les extrémités des molécules d'acide nucléique sont réparées après chaque étape de clivage ou de digestion et/ou chaque étape de circularisation. La réparation peut comprendre la reconstitution des extrémités et/ou phosphorylation des extrémités. La restauration et la phosphorylation peuvent être réalisées par n'importe quelle méthode connue par une personne qualifiée. Par exemple, la restauration peut être réalisée en utilisant une ADN polymérase spécifique, tel que l'ADN polymérase T4, en présence de dNTP, et la phosphorylation peut être réalisée en utilisant une kinase d'ADN, telle que le polynucléotide kinase T4, en présence d'ATP.
En option, la méthode comprend en outre, une ou plusieurs étapes de dégradation des molécules linéaires d'acide nucléique avec la DNase ATP-Dépendante qui hydrolyse sélectivement les molécules d'acide nucléique linéaires double brin. La DNase ATP-Dépendante de Plasmide- Safe™ (Epicentre) DNase ATP-Dépendante peut être choisie pour dégrader spécifiquement l'ADN linéaire. Il est particulièrement indiqué pour dégrader les molécules linéaires d'acide nucléique après une étape de circularisation, de préférence après chaque étape de circularisation.
La présente invention concerne des kits appropriés pour préparer les molécules d'acide nucléique fournies à l'étape a) de la méthode décrite ci-dessus. En particulier, lesdits kits peuvent comprendre n'importe quelle amorce sens ou inverse ou un ensemble de celles-ci tel que décrit précédemment pour préparer les molécules d'acide nucléique fournies dans l'étape a).
Le kit peut comprendre au moins une amorce sens comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'.
Par «une partie de celui-ci » est voulu dire au moins 10, 15 ou 20 nucléotides de celui-ci.
Dans un premier mode de réalisation, le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci incluant son extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une
première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins seconde amorce sens comprend, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, le kit comprend une amorce sens et plusieurs secondes amorces sens différentes par leurs séquences de code-barres et, si présent, par au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En effet, chaque seconde amorce sens est conçue pour être spécifique à une séquence d'intérêt différente. En particulier, si entre 1 et 1.000 séquences d'intérêt différentes sont considérés, 1 et 1000 secondes amorces sens différentes sont conçues, chacune contient un code-barres distinct à associer respectivement à chaque séquence d'intérêt, l'autre élément restant les mêmes (par exemple, le site sens d'amorçage ou une partie de celui-ci, le site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage).
Dans un deuxième mode de réalisation, l'au moins première amorce sens comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. Plus préférablement, l'au moins première amorce sens comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, l'au moins première amorce sens comprend en outre, à l'extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Bien que le kit peut comprendre une amorce sens , le kit comprend de préférence plusieurs premières amorces sens différent par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, les autres éléments restent les même (c.-à-d., si présent, le site inverse d'amorçage, le module de courbure, le site de reconnaissance pour la seconde enzyme de restriction, le site sens d'amorçage ou une partie de celui-ci, le site universel d'amorçage).
Selon le premier ou le deuxième mode de réalisation, le kit peut en outre, comprendre une amorce inverse comprenant au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou plusieurs amorces inverse, chacune comprend au moins 10 nucléotides de l'extrémité 3' de différente séquence d'intérêt.
Dans un troisième mode de réalisation, l'au moins première amorce sens comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un
site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce sens comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage. En conséquence, le kit peut comprendre une première amorce sens. Dans ce mode de réalisation, le kit peut en outre, comprendre une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. De préférence, le kit comprend en outre plusieurs amorces inverses, différent par leurs séquences de code-barres et par au moins les 10 nucléotides spécifique à l'extrémité 3' de la séquence d'intérêt.
Selon le premier, deuxième ou troisième mode de réalisation, le kit peut en outre, comprendre au moins une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En particulier, le kit peut en outre, comprendre plusieurs amorces sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' d'un des différentes séquences d'intérêt.
Alternativement, le kit peut comprendre au moins une première amorce inverse comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Par « une partie de celui-ci » est voulu dire au moins 10, 15 ou 20 nucléotides.
Dans un premier mode de réalisation, le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins seconde amorce inverse comprend, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 5' et chevauchant une partie du site inverse d'amorçage de
la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, le kit comprend la première amorce inverse et plusieurs secondes amorces inverses différent par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt. En effet, chaque deuxième amorce inverse est conçue pour être spécifique à une séquence d'intérêt différente. En particulier, si entre 2 et 1.000 séquences d'intérêt différentes sont considérés, 2 et 1.000 secondes amorces différentes inverse sont conçues, comprenant chacune un code-barres distinct à associer à chaque séquence d'intérêt, l'autre élément reste le même (par exemple, le site inverse d'amorçage ou une partie de celui-ci, le site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage).
Dans un deuxième mode de réalisation, l'au moins première amorce inverse comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre, à l'extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Bien que le kit puisse comprendre une première amorce inverse, le kit comprend de préférence plusieurs premières amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt, les autres éléments restant les mêmes (c.-à-d., si présent, le site inverse d'amorçage, le module de courbure, le site de reconnaissance pour la deuxième enzyme de restriction, le site sens d'amorçage ou une partie de celui-ci, le site universel d'amorçage).
Selon le premier ou deuxième mode de réalisation, le kit peut en outre, comprendre une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou plusieurs amorces sens, chacune comprend au moins 10 nucléotides de l'extrémité 5' d'une séquence d'intérêt différente.
Dans un troisième mode de réalisation, l'au moins première amorce inverse comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de
restriction et un site universel d'amorçage. En conséquence, le kit peut comprendre une première amorce inverse. Dans ce mode de réalisation, le kit peut en outre, comprendre une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. De préférence, le kit comprend en outre plusieurs amorces sens, différentes par leurs séquences de code-barres et par au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Selon le premier, deuxième ou troisième mode de réalisation, le kit peut en outre, comprendre au moins une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En particulier, le kit peut en outre, comprendre plusieurs amorces inverses comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' d'un des différentes séquences d'intérêt. Dans un mode de réalisation particulier, le kit comprend au moins une amorce sens pour chaque séquence d'intérêt à être séquencée, comprenant, de son extrémité 5' vers son extrémité 3': a) un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
b) un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou c) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou
d) un site inverse d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
En option, le kit peut aussi comprendre le(s) amorce(s) inverse(s) appropriée(s) ou associée(s). En particulier, le kit peut inclure une amorce inverse spécifique à l'extrémité 3' de la séquence d'intérêt pour les amorces sens du type a) et b) ; ou une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance
pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt pour les amorces sens du type c) et d).
Le kit peut comprendre une amorce sens et son amorce inverse associée. Cependant, de préférence, le kit comprend plusieurs amorces sens et amorces inverses associées en option, chacune conçue pour être spécifique à une séquence d'intérêt différente. Les amorces sens et inverses différentes entre elles par leur séquence de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt spécifique, les autres éléments (par exemple, le site sens d'amorçage, le site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage, le module de courbure et le site de reconnaissance pour la première enzyme de restriction restant les mêmes).
Dans un autre mode de réalisation particulier, le kit comprend au moins une amorce inverse pour chaque séquence d'intérêt à être séquencée, comprenant, de son extrémité 5' vers son extrémité 3',
a) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
b) un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou c) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
d) un site sens d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt.
En option, le kit peut aussi comprendre les amorce(s) sens appropriée(s) ou associée(s). En particulier, le kit peut inclure une amorce sens spécifique de l'extrémité 5' de la séquence d'intérêt pour les amorces inverses du type a) et b) ; ou une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt pour les amorces inverses du type c) et d).
Le kit peut comprendre une amorce inverse et son amorce sens associée. Cependant, de préférence, le kit comprend plusieurs amorces inverses et en option les amorces sens associées, chacune conçue pour être spécifique à une séquence d'intérêt différente. Les amorces sens et inverse différentes entre elles par leur séquence de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt spécifique, les autres éléments (par exemple, si présent, le site sens d'amorçage, le site de reconnaissance pour la première, deuxième, troisième et quatrième enzyme de restriction, le site inverse d'amorçage et le module de courbure restant les mêmes). Dans un mode de réalisation préféré du kit, la première amorce sens ou la première amorce inverse comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction. De préférence, le module de courbure est attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine. En particulier, le module de courbure peut être comme détaillé ci-dessous. De préférence, il comprend ou consiste en, une séquence sélectionnée parmi le groupe de séquences SEQ ID No. 1 et SEQ ID No. 2.
En plus des amorces, les kits peuvent aussi inclure les moyens appropriés permettant de réaliser l'amplification, en particulier la PCR ou la RT-PCR , tel que la polymérase et les réactifs nécessaires comprenant les tampons appropriés, les nucléotides et autres.
Les kits peuvent aussi comprendre des billes ou des supports solides soutenant les deuxièmes membres des paires se liant par affinité. Dans un mode de réalisation préféré, les avidines ou les streptavidines sont liés aux billes ou aux supports solides.
Les kits peuvent aussi comprendre une ou plusieurs des enzymes de restriction nécessaires pour appliquer la méthode, en particulier les première, seconde, troisième et quatrième enzymes de restriction. De préférence, le kit peut inclure au moins les premières et deuxièmes enzymes de restriction. En outre, le kit peut inclure la troisième enzyme de restriction. Il peut en outre, inclure la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules circulaires d'acide nucléique obtenues dans l'étape b) de la méthode peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre
- lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la revendication 1, et
- des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un premier site de restriction pour une première enzyme de restriction, ou
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage, ou
- des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un premier site de restriction pour une première enzyme de restriction.
Les produits de ligation inter-moléculaire obtenus sont représentés par les deux formes circularisées des Fig. II et Fig. 1J. Après l'étape de ligation inter-moléculaire, les molécules d'acide nucléique circularisées peuvent subir une ou plusieurs étapes de la méthode décrite ci- dessus selon la structure de leur séquences, ce qui permet d'obtenir une bibliothèque d'acide nucléique (ou de n'importe quel produit intermédiaire de celle-ci ) objet de la présente invention.
Le kit comprend en outre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique permettant de réaliser la ligation inter-moléculaire décrite dans le mode de réalisation précèdent.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement peuvent être un ensemble de gènes, ou un ensemble de régions chromosomique, ou un ensemble de génomes. Un code-barres doit être associé à chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement. Puis, une bibliothèque peut être préparée à partir de l'association d'un code-barres à chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement par la méthode de l'invention décrite ci-dessus, ce qui permet de
fournir une bibliothèque de fragments de chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement associée au même code-barres. Naturellement, comme expliqué dans l'introduction de la description détaillée, l'avantage de la présente méthode est de préparer simultanément plusieurs bibliothèques, caractérisées en ce que chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement est associée à un code-barres spécifique (et différent). Par exemple, si la méthode est appliquée au séquençage d'un génome particulier pour plusieurs organismes, un code-barres peut être attribué à chaque organisme particulier. En conséquence, les génomes peuvent être simultanément séquencés pour plusieurs organismes.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement peuvent être aussi constituées d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant des séquences nucléotidiques différentes. Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement peuvent être un ensemble de gènes ou un ensemble d'ADNc, ou un ensemble de régions chromosomiques, ou un ensemble de génomes entiers. Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement sont clivés. De préférence, le clivage est effectué par l'utilisation d'une technique de clivage indépendamment de la séquence (SITC), comme la sonication. De préférence, les extrémités des molécules d'acide nucléique sont réparées après chaque étape de clivage ou de digestion et/ou chaque étape de circulansation. La réparation peut comporter la reconstitution des extrémités et/ou la phosphorylation des extrémités. La restauration et la phosphorylation peuvent être réalisées par n'importe quelle méthode connue par une personne qualifiée. Par exemple, la restauration peut être réalisée en utilisant une ADN polymérase spécifique, tel que l'ADN polymérase T4, en présence de dNTP, et la phosphorylation peut être réalisée en utilisant une kinase d'ADN, telle que le polynucléotide kinase T4, en présence d'ATP.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement sont modifiées à leurs extrémités par la Transférase Terminale qui catalyse l'addition de nucléotides, de préférence les ddNTP, aux extrémités 3 ' de l'ADN, de préférence le ddTTP, ce qui permet d'obtenir des molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement ayant incorporées un seul résidu T à chaque extrémité 3'.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou
partiellement ayant incorporées un seul résidu T à chaque extrémité 3' sont ligaturées avec
- des molécules linéaires d'acide nucléique modifiées à leurs extrémités par la Transférase Terminale qui catalyse l'addition de nucléotides, de préférence les ddNTP, aux extrémités 3' de l'ADN, de préférence le ddATP, ce qui permet d'obtenir des molécules linéaires d'acide nucléique ayant incorporées un seul résidu A à chaque extrémité 3' et comprenant de l'extrémité 5' vers 3'
- un premier site de restriction pour une première enzyme de restriction,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage, ou
- des molécules linéaires d'acide nucléique modifiées à leurs extrémités par la Transférase Terminale qui catalyse l'addition de nucléotides, de préférence les ddNTP, aux extrémités 3' de l'ADN, de préférence le ddATP, ce qui permet d'obtenir des molécules linéaires d'acide nucléique ayant incorporées un seul résidu A à chaque extrémité 3' et comprenant de l'extrémité 5' vers 3'
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un premier site de restriction pour une première enzyme de restriction. Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement ayant incorporées un seul résidu T à chaque extrémité 3' et lesdites molécules linéaires d'acide nucléique ayant incorporées un seul résidu A à chaque extrémité 3' permettent de favoriser l'obtention des molécules circulaires d'acide nucléique par ligation inter-moléculaire. En présence de l'ADN ligase T4 et de PATP.
En particulier, si entre 1 et 1.000 ensembles de molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement ayant des séquences différentes sont considérés, 1 et 1000 ligations inter-moléculaires sont effectuées, chacune permettant d'associer un code-barres distinct respectivement à chaque ensembles de molécules linéaires d'acide nucléique à être séquencées
entièrement ou partiellement.
Les kits peuvent aussi comprendre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique nécessaires pour appliquer la méthode, en particulier la Transférase Terminale. De préférence, le kit peut inclure au moins la Transférase Terminale. Les kits peuvent aussi comprendre les ddNTP, en particulier les ddTTP et les ddATP. De préférence, le kit peut inclure au moins les ddTTP. De préférence, le kit peut inclure au moins les ddATP. Bien entendu les kits peuvent aussi comprendre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique permettant de favoriser la ligation inter-moléculaire.
Tous les dispositifs particuliers détaillés pour la méthode décrite ci-dessus peuvent aussi être envisagés pour les kits.
REFERENCES
Barany (1991) PCR Methods Appl, 1, 5-16 ;
Blanco et al. (1989) J Biol Chem, 264, 8935-8940 ;
Birkenmeyer (1985) Nucleic Acids Res, 13, 7107-71 18 ;
Cahill et al. (1991) Clin Chem, 37, 1482-1485 ;
Chetverin et Spirin (1995) Prog Nucleic Acid Res Mol Biol, 51, 225-270 ;
Collins and Weissman (1984) Proc Natl Acad Sci USA 81, 6812-6816
Compton, J. (1991) Nature, 350, 91-92 ;
Fahy et al. (1991) PCR Methods Appl, 1, 25-33 ;
Fullwood et al, Génome Res. 2009. 19 : 521-532 ;
Katanaevet al. (1995) Febs Lett, 359, 89-92 ;
Kitchin et al., (1986) J Biol Chem, 25, 11302-1 1309 ;
Landegren et al. (1988) Science, 241, 1077-1080;
Lizardi et al. (1998) Nat Genêt, 19, 225-232;
Mamanova et al., (2010) Nature Method, 7, 1 11-118;
Notomi et al. (2000) Nucleic Acids Res, 28, E63;
Ulanovsky et al. (1986) PNAS, 83, 862-866 ;
Walker et al. (1992) Nucleic Acids Res, 20, 1691-1696 ;
En résumé, ladite méthode permet de préparer une bibliothèque d'acide nucléique, de préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend:
a) - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circulansée et dans la direction 5' vers 3'
- une séquence à être séquencée entièrement ou partiellement
- un site inverse d'amorçage,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique, qui est placée entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et
- deux sites de reconnaissance pour deux enzymes de restriction différentes :
- un premier site de restriction pour une première enzyme de restriction qui est placée entre la séquence de code-barres et la séquence d'intérêt, et
- un deuxième site de restriction pour une deuxième enzyme de restriction qui est placée entre le site inverse d'amorçage et le site sens d'amorçage ;
b) circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire ;
c) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ;
d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et
e) circularisation desdites molécules d'acide nucléique clivées obtenues à partir de l'étape d) par ligation intra-moléculaire,
ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site d'amorçage inverse.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur
forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt. Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placée en amont du site inverse d'amorçage, ladite enzyme ayant un site de restriction dudit site de clivage dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) est réalisé par digestion avec ladite troisième enzyme de restriction.
Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en amont du site inverse d'amorçage et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt,
ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code- barres et une séquence d'intérêt tronquée en 3' .
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt.
La méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens
d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site d'amorçage inverse.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placée en aval du site sens d'amorçage, ladite enzyme ayant un site de restriction en aval dudit site de reconnaissance dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) est réalisé par digestion avec ladite troisième enzyme de restriction. Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placée en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt,
ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence de code-barres, un site inverse et un site sens d'amorçage.
La méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse et un site sens d'amorçage.
La méthode comprend en outre l'étape h) de circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
Les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité. La méthode comprend en outre une ou plusieurs étapes de liaison des molécules d'acide nucléique sur un support solide par l'interaction entre le premier membre de la paire se liant par affinité liée auxdites molécules d'acide nucléique et les seconds membres de la paire se liant par affinité liée au support solide, en particulier avant l'étape de circularisation. La méthode comprend en outre l'étape de liaison des molécules d'acide nucléique obtenues à partir de l'étape g) avant de réaliser l'étape h) de circularisation.
La méthode comprend en outre l'étape de digestion des molécules circularisées d'acide nucléique avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site sens d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage. La méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites d'amorçage inverse et sens.
Les étapes de clivage des molécules d'acide nucléique sont réalisées en utilisant une technique de clivage indépendamment de la séquence.
La technique de clivage indépendamment de la séquence est la sonication.
La troisième enzyme de restriction est choisie dans le groupe EcoP15I, Mmel, NmeAII, Acul, Bbvl, BceAI, Bpml, BpuEI, BseRI, Bsgl, BsmFI, BtgZI, Ecil, Fokl, Hgal, I-Ceul, I-Scel, Pi- Pspl et PI-SceI.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, une séquence d'au moins 15 paires de base qui ont moins de 80% d'identité avec le génome de la
séquence d'intérêt et qui est placé entre la séquence d'intérêt et l'élément en amont de ladite séquence d'intérêt ou entre la séquence d'intérêt et l'élément en aval de ladite séquence d'intérêt. Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens d'amorçage.
Ledit module de courbure comprend un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché au premier membre d'une paire se liant par affinité.
Ledit module de courbure comprend ou consiste en, une séquence sélectionnée parmi le groupe consistant en, les séquences SEQ ID No. 1 et SEQ ID No. 2. Les molécules linéaires d'acide nucléique fournies dans l'étape a) ont été obtenues par une ou plusieurs réactions d'amplification d'ADN.
Lesdites réactions d'amplification d'ADN sont suivies de l'étape de dégradation de l'excès des amorces simple brin.
La méthode comprend en outre l'étape de restauration et/ou de phosphorylation de chacune des extrémités des molécules d'acide nucléique après une étape de clivage et/ou avant une étape de circularisation. La méthode comprend en outre l'étape de dégradation des molécules non-circularisées d'acide nucléique avec une endonucléase spécifique des molécules linéaires d'acide nucléique après une étape de circularisation.
Les molécules d'acide nucléique obtenues à partir de l'étape h) ont une longueur de 156 bp ou une longueur de 156 bp plus un multiple de 21 bp.
Une pluralité d'ensembles de molécules linéaires d'acide nucléique est fournie dans l'étape a).
La bibliothèque d'acide nucléique obtenue à partir de la méthode.
Le kit comprend au moins une première amorce sens comprenant, de son extrémité 5' vers son extrémité 3',
- un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'.
Le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
Le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 3' et chevauchant la partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
Le kit comprend une amorce sens et plusieurs secondes amorces sens différentes par leurs séquences des code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
La première amorce sens du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce sens du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
La première amorce sens du kit comprend en outre, à l'extrémité 5', le site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
5 Le kit comprend plusieurs premières amorces sens différentes par leurs séquences de code- barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre une amorce inverse comprenant au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou plusieurs amorces inverse, chacune comprenant au moins 10 10 nucléotides de l'extrémité 3' d'une séquence d'intérêt différente.
La première amorce sens du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence 15 d'intérêt ou un site universel d'amorçage.
La première amorce sens du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage.
0
Le kit comprend une première amorce sens.
Le kit comprend en outre une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de 5 restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces inverse, différentes par leurs séquences de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. 0 Le kit comprend en outre au moins une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces sens comprenant, de son extrémité 5' vers son
extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' d'une des différentes séquences d'intérêt.
Le kit comprend au moins une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3',
- un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
Le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
Le kit comprend une première amorce inverse et plusieurs secondes amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
La première amorce inverse du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce inverse du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
La première amorce inverse du kit comprend en outre, à l'extrémité 5', le site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Le kit comprend plusieurs premières amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. Le kit comprend en outre une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou plusieurs amorces sens, chacune comprend au moins 10 nucléotides de l'extrémité 5' d'une séquence d'intérêt différente.
La première amorce inverse du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce inverse du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage.
Le kit comprend une première amorce inverse. Le kit comprend en outre une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces sens, différentes par leurs séquences de code- barres et par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre au moins une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces inverses comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' d'un des différentes séquences d'intérêt.
La première amorce sens ou la première amorce inverse du kit comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction.
Le module de courbure du kit est attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine.
Le module de courbure du kit comprend ou consiste en, une séquence sélectionnée parmi le groupe consistant en, les séquences SEQ ID No. 1 et SEQ ID No. 2. Le kit comprend en outre des billes ou des supports solides portant les seconds membres de paire se liant par affinité, de préférence l'avidine ou la streptavidine.
Le kit comprend en outre une ou plusieurs enzymes de restriction sélectionnées dans le groupe consistant en, la première, deuxième, troisième et quatrième enzymes de restrictions.
Dans un autre mode de réalisation particulier, les molécules circulaires d'acide nucléique obtenues dans l'étape b) de la méthode peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre - lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la méthode, et
- des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un premier site de restriction pour une première enzyme de restriction,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage, ou
molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un premier site de restriction pour une première enzyme de restriction.
La bibliothèque d'acide nucléique obtenue à partir de la méthode.
Le kit comprend en outre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique permettant de favoriser la ligation inter-moléculaire décrite dans le mode de réalisation précèdent.