FR2968671A1 - Sequencage maspet - Google Patents
Sequencage maspet Download PDFInfo
- Publication number
- FR2968671A1 FR2968671A1 FR1004835A FR1004835A FR2968671A1 FR 2968671 A1 FR2968671 A1 FR 2968671A1 FR 1004835 A FR1004835 A FR 1004835A FR 1004835 A FR1004835 A FR 1004835A FR 2968671 A1 FR2968671 A1 FR 2968671A1
- Authority
- FR
- France
- Prior art keywords
- site
- sequence
- nucleic acid
- priming
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 33
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 509
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 483
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 483
- 238000000034 method Methods 0.000 claims abstract description 168
- 239000007787 solid Substances 0.000 claims abstract description 37
- 230000037452 priming Effects 0.000 claims description 520
- 108091008146 restriction endonucleases Proteins 0.000 claims description 434
- 239000002773 nucleotide Substances 0.000 claims description 115
- 125000003729 nucleotide group Chemical group 0.000 claims description 115
- 238000003776 cleavage reaction Methods 0.000 claims description 57
- 230000007017 scission Effects 0.000 claims description 57
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 38
- 102000004190 Enzymes Human genes 0.000 claims description 34
- 108090000790 Enzymes Proteins 0.000 claims description 34
- 238000011144 upstream manufacturing Methods 0.000 claims description 28
- 230000029087 digestion Effects 0.000 claims description 25
- 230000000977 initiatory effect Effects 0.000 claims description 20
- 238000000527 sonication Methods 0.000 claims description 20
- 229960002685 biotin Drugs 0.000 claims description 19
- 235000020958 biotin Nutrition 0.000 claims description 19
- 239000011616 biotin Substances 0.000 claims description 19
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 claims description 14
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 5
- 238000000137 annealing Methods 0.000 claims description 4
- 239000002253 acid Substances 0.000 claims 2
- 230000003321 amplification Effects 0.000 abstract description 44
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 44
- 238000002360 preparation method Methods 0.000 abstract description 13
- 238000012165 high-throughput sequencing Methods 0.000 abstract description 4
- 230000008030 elimination Effects 0.000 abstract description 2
- 238000003379 elimination reaction Methods 0.000 abstract description 2
- 230000009467 reduction Effects 0.000 abstract description 2
- 238000006243 chemical reaction Methods 0.000 description 33
- 108020004414 DNA Proteins 0.000 description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 description 20
- 239000000203 mixture Substances 0.000 description 20
- 239000011324 bead Substances 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 10
- 238000007481 next generation sequencing Methods 0.000 description 9
- 108010090804 Streptavidin Proteins 0.000 description 8
- 238000001962 electrophoresis Methods 0.000 description 8
- 108090000623 proteins and genes Proteins 0.000 description 8
- 239000012634 fragment Substances 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical class O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 6
- 230000026731 phosphorylation Effects 0.000 description 6
- 238000006366 phosphorylation reaction Methods 0.000 description 6
- 238000003757 reverse transcription PCR Methods 0.000 description 5
- 108090001008 Avidin Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 4
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033380 Coding strand Proteins 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 238000005452 bending Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 239000003999 initiator Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 230000008093 supporting effect Effects 0.000 description 3
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 108010046914 Exodeoxyribonuclease V Proteins 0.000 description 2
- 108020003631 Kinetoplast DNA Proteins 0.000 description 2
- 101150101095 Mmp12 gene Proteins 0.000 description 2
- 101100268078 Mus musculus Zbtb24 gene Proteins 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- -1 but not limited to Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 1
- 241000222718 Crithidia fasciculata Species 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 238000007397 LAMP assay Methods 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102100040604 Myotubularin-related protein 5 Human genes 0.000 description 1
- 108050003253 Myotubularin-related protein 5 Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000223104 Trypanosoma Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002663 nebulization Methods 0.000 description 1
- 108700025694 p53 Genes Proteins 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000001447 template-directed synthesis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
La présente invention concerne une nouvelle méthode et un kit de préparation de bibliothèques d'acides nucléiques et en particulier destinées au séquençage à haut débit. Cette méthode est utile pour préparer simultanément une multitude de bibliothèques d'acide nucléique destinées au séquençage, chaque bibliothèque est caractérisée par une séquence de code-barres spécifique. En d'autres termes, au lieu de préparer en parallèle plusieurs bibliothèques qui seront barre-codées, la méthode de l'invention permet la préparation simultanée de plusieurs bibliothèques barre-codées en effectuant l'étape de préparation d'une seule bibliothèque. L'inventeur fournit des moyens pour introduire les code-barres au début de la méthode de préparation de la bibliothèque. Le coût du séquençage est donc considérablement réduit. La méthode décrite ici est adaptée à la préparation de bibliothèques permettant le séquençage simultané d'un nombre quasi-infini de séquences provenant de différents échantillons. La méthode permet le contrôle de la taille et l'orientation des acides nucléiques à être séquencés. La méthode permet l'élimination ou la diminution des produits chimères et des faux positifs résultant des ligations non-spécifiques. En effet, la méthode est basée sur des étapes d'amplification et de ligation intra-moléculaire ou de circularisation. Les bibliothèques fournies avec la méthode décrite ici peuvent être utilisées sur n'importe quelle plate-forme NGS, tels que le 454 Genome Sequencer, l'Illumina Genome Analyzer ou la plate-forme SOLiD.
Description
SÉQUENÇAGE "MULTIPLEXED ANCHOR SCANNING PARALLEL END TAG" Inventeur : Chaouki MILED DOMAINE DE L'INVENTION La présente invention concerne le domaine du séquençage l'ADN et plus particulièrement le domaine de préparation de bibliothèque destinée au séquençage CONTEXTE DE L'INVENTION Depuis le début des années 90, la production de séquence d'ADN a été presque exclusivement effectuée avec la technologie de séquençage basée sur la chimie Sanger. Une nouvelle génération de technologies de séquençage a été développée récemment. Les technologies de séquençage à haut débit sont aussi connues sous le nom de « séquençage d'ADN de nouvelle génération » ou technologies NGS. Ces technologies ont été implémentées dans divers produits commerciaux tels que : 454 Genome Sequencer (Roche Applied Science), Illumina Genome Analyzer (Illumina, Inc.) la plate-forme SOLiDTM (Applied Biosystems). Toutes ces plateformes sont basées sur le séquençage par la synthèse, une série d'extensions périodiques d'une molécule d'ADN à l'aide d'amorces réalisées par une polymérase ou par une ligase. Ainsi, le processus de séquençage est composé d'une alternance de cycles d'extension (ou hybridation-ligation chimique) par les enzymes et d'acquisition de données.
Les bibliothèques utilisées dans le séquençage par les technologies NGS sont habituellement préparées par fragmentation aléatoire de l'ADN suivie de ligation in vitro d'adaptateurs communs. Les substrats de séquençage sont produits par amplification avec des amorces communes par PCR puis immobilisés sur une surface solide ou un autre support. Les plateformes NGS présentent des coûts bas car elles peuvent décoder simultanément des millions de séquences distinctes déposées sur une lame à deux dimensions. En effet, tous les dispositifs de séquençage immobilisés sur les lames peuvent être traités de façon enzymatique par un seul volume de réactif et le coût de ce réactif est amorti sur l'ensemble du dispositif complet du séquençage. Afin de maximiser la capacité de séquençage dans une seule réaction et réduire ainsi le coût du séquençage par base, des méthodes de multiplexage ont été développées. Des adaptateurs à code-barres sont ligaturés à chaque bibliothèque et plusieurs bibliothèques à code-barres peuvent être mises en commun pour être séquencées dans une seule réaction. Néanmoins, Chaouki MILED 2 10/04835 la préparation de plusieurs bibliothèques nécessite du temps et de l'argent. En effet, la préparation des bibliothèques a besoin d'environ une semaine de travail. Les plateformes de séquençage de nouvelle génération sont des plateformes à haut débit et des coûts bas mais sont limitées par la longueur des fragments d'ADN séquencés. Une solution à cette limitation est le séquençage "paired-end tag" (PET) dans lequel des courtes étiquettes appariées sont extraites à partir des extrémités de longs fragments d'ADN et sont liées covalemment sous forme de constructions de di-tag destinées au séquençage de nouvelle génération et la cartographie contre un génome de référence (Fullwood et al 2009). La stratégie PET est la seule technique adaptée aux technologies NGS et qui permet la détection de délétion, inversion, duplication en tandem, insertion et translocation qui sont actuellement associées aux maladies humaines. En conséquence, il y a une forte demande pour des méthodes efficaces et peu coûteuses pour la préparation de bibliothèques pour les technologies de séquençage de nouvelle génération et en particulier pour la préparation de bibliothèque à code-barres PET. RÉSUMÉ DE L'INVENTION La présente invention, appelée "Multiplexed Anchor Scanning Parallel End Tag Sequencing" (séquençage MASPET), concerne une méthode et un kit pour préparer une bibliothèque d'acide nucléique, de préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend : a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide 20 nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circulaire dans la direction 5' vers 3' - une séquence d'intérêt à être séquencée entièrement ou partiellement - un site inverse d'amorçage, - un site sens d'amorçage, - une séquence de code-barres spécifique à chaque ensemble de molécules d'acide nucléique, qui est placé entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et - deux sites de restriction pour deux enzymes de restriction différentes : - un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et - un deuxième site de restriction pour une deuxième enzyme de restriction qui est placé entre le site inverse d'amorçage et le site sens 25 30 Chaouki MILED 3 10/04835 d'amorçage ; b) circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire ; c) digestion desdites molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ; d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et e) circularisation desdites molécules clivées d'acide nucléique obtenues à partir de l'étape d) par ligation intra-moléculaire, ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage.
Dans un premier mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt. Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en amont du site inverse d'amorçage, ladite enzyme ayant un site de clivage en amont dans la séquence d'intérêt, et caractérisé en ce que le clivage de l'étape d) de la méthode est réalisé par digestion avec ladite troisième enzyme de restriction. Dans un mode de réalisation supplémentaire particulier, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en amont du site inverse d'amorçage et caractérisé en ce que la méthode comprend après l'étape e) : f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'; et Chaouki MILED 4 10/04835 h) en option, la circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire. Alternativement, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'.
Dans un deuxième mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en aval du site sens d'amorçage, ladite enzyme ayant un site de restriction en aval dudit site de clivage dans la séquence d'intérêt, et caractérisé en ce que le clivage de l'étape d) de la méthode est réalisé par digestion avec ladite troisième enzyme de restriction.
Alternativement, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) : f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage ; et h) en option, circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire. Dans une autre alternative, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers 3', une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage, et la méthode comprend en outre, après Chaouki MILED 5 10/04835 l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' à 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage.
De préférence, les molécules d'acide nucléique fournies à l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité, et la méthode comprend en outre une ou plusieurs étapes de liaison des molécules d'acide nucléique sur un support solide par l'interaction entre le premier élément d'une paire se liant par affinité attaché à ces molécules d'acide nucléique et des membres de ladite seconde paire se liant par affinité lié au support solide, en particulier avant l'étape de circularisation.
De préférence, la méthode comprend en outre l'étape de digestion des molécules d'acide nucléique circularisées avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules d'acide nucléique linéaires comprenant de l'extrémité 5' vers l'extrémité 3', un site sens d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage. Plus préférentiellement, la méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites inverse et sens d'amorçage.
De préférence, les étapes de clivage des molécules d'acide nucléique sont réalisées en 25 utilisant une technique de clivage indépendamment de la séquence, de préférence par sonication.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site universel d'amorçage en amont ou en aval de la séquence d'intérêt.
30 De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens d'amorçage, et qui est attaché à un premier membre d'une paire se liant par affinité, de préférence un module de courbure comprenant ou consistant en la séquence sélectionnée parmi le groupe consistant en SEQ ID No. 1 et SEQ ID No. 2.
Chaouki MILED 6 10/04835 La présente invention concerne une bibliothèque d'acide nucléique obtenue à partir de la méthode décrite ci-dessus ou de n'importe quel produit intermédiaire de celle-ci.
La présente invention concerne un kit comprenant au moins une amorce sens comprenant, de l'extrémité 5' vers l'extrémité 3', - un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou - un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celle-ci, y compris son extrémité 5'.
Dans un premier mode de réalisation, le kit comprend au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de l'extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. Dans un deuxième mode de réalisation, l'au moins première amorce sens comprend en outre, à son extrémité 5', soit - une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage, et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou - un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. La présente invention se rapporte alternativement à un kit comprenant au moins une première amorce inverse comprenant, de l'extrémité 5' vers l'extrémité 3', - un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3' ; ou - un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Chaouki MILED 7 10/04835 Dans un premier mode de réalisation, le kit comprend au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou du site universel d'amorçage. Dans un deuxième mode de réalisation, l'au moins première amorce inverse comprend aussi, à son extrémité 3', soit - une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou - un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, la première amorce sens ou la première amorce inverse du kit comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction et attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine. De préférence, le module de courbure comprend ou consiste en la séquence sélectionnée parmi le groupe des séquences SEQ ID No. 1 et SEQ ID No. 2. En option, le kit comprend en outre, des billes ou des supports solides soutenant le deuxième membre des paires se liant par affinité, de préférence l'avidine ou la streptavidine. BREVE DESCRIPTION DES FIGURES FIGURE 1 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique.
FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2 : Site de 30 Restriction 2, BC : Code-barres, SEQ : séquence d'acide nucléique.
FIGURE 2 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique comprenant l'utilisation du site universel d'amorçage.25 Chaouki MILED 8 10/04835 UPS : site universel d'amorçage, CM : module de courbure, FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2: Site de Restriction 2, BC : Code-barres, SEQ : séquence d'acide nucléique. FIGURE 3 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique incluant l'utilisation du module courbure.
UPS : site universel d'amorçage, CM : module de courbure, FR : Amorce sens, RP : 10 Amorce inverse, RS 1 : Site de Restriction 1, RS2 : Site de Restriction 2, RS3 : Site de Restriction 3, RS4 : Site de Restriction 4, BC : Code-barres, SEQ : séquence d'acide nucléique. DESCRIPTION DÉTAILLÉE DE L'INVENTION
15 L'inventeur a développé une nouvelle méthode pour préparer une bibliothèque d'acide nucléique et en particulier une bibliothèque de PET, pour être séquencée avec les technologies de séquençage de nouvelle génération. Cette méthode est utile pour préparer simultanément une multitude de bibliothèques d'acide nucléique pour être séquencées, chacune de ces bibliothèques est caractérisée par une séquence spécifique de code-barres. Avec la méthode de l'invention, 20 plusieurs bibliothèques d'acide nucléique peuvent être simultanément bar-codées et séquencées. En d'autres termes, au lieu de préparer en parallèle plusieurs bibliothèques pour être bar-codées, la méthode de l'invention permet la préparation simultanée de plusieurs bibliothèques à code-barres en réalisant l'étape de préparation d'une seule bibliothèque. L'inventeur fournit des moyens pour introduire les code-barres au début de la méthode de préparation de bibliothèque. 25 Ainsi, le coût de séquençage est considérablement réduit. Cependant, en plus de l'abaissement du coût et du temps, la bibliothèque de séquençage décrite ci-dessus présente en outre, d'autres avantages techniques. Un des plus grands avantages est que les bibliothèques de séquençage préparées par la méthode décrite fournissent des informations au sujet des arrangements structuraux des séquences. En effet, si un code-barres est 30 utilisé pour une séquence d'intérêt particulière, il est possible de déduire que deux séquences (par exemple, indicatif d'un gène, d'un exon, ou analogues) sont portées par le même acide nucléique amplifié et sont donc associées. En conséquence, la méthode en tant que décrit permet la détection de translocation, délétion, inversion, duplication ou insertion.5 Chaouki MILED 9 10/04835 La méthode décrite ci-dessus convient à la préparation des bibliothèques permettant le séquençage simultané d'un nombre quasi-infini de séquences de régions d'intérêt dérivées de différents échantillons (par exemple, un ensemble de gènes de différents organismes, d'un même acide nucléique mais provenant de différents individus ou de différents acides nucléiques dérivés d'un seul individu). La méthode permet le contrôle de la taille et de l'orientation des acides nucléiques à séquencer. La méthode permet l'élimination ou la diminution des produits chimériques et des faux positifs résultant des ligations non spécifiques. En effet, la méthode est basée sur l'amplification et les étapes de ligation intra-moléculaires ou de circularisation, évitant de ce fait les étapes de ligation utilisées dans les méthodes de l'art antérieur et responsables des inconvénients générant des produits chimériques. Les bibliothèques fournies par la méthode décrite ci-dessus peuvent être utilisées sur n'importe quelle plate-forme NGS, tels que : 454 Genome Sequencer (Roche Applied Science), 15 Illumina Genome Analyzer (Illumina, Inc.) ou la plate-forme SOLiDTM (Applied Biosystems). Définitions Tel qu'utilisé ici, le terme « molécule d'acide nucléique » se rapporte aux polymères simple brin et double brins des monomères de nucléotide, y compris l'ADN et l'ARN, liés par des 20 liaisons phosphodiester. La molécule d'acide nucléique peut être linéaire ou circulaire. Les molécules d'acide nucléique peuvent être des molécules d'ADN, des molécules d'ARN ou des molécules chimériques d'ADN-ARN. Elles peuvent aussi comprendre des analogues de nucléobase et de sucre. De préférence, le terme « molécule d'acide nucléique » est utilisé ici pour se rapporter à une molécule double brin linéaire ou circulaire d'ADN. 25 Tel qu'utilisé ici, le terme « bibliothèque d'acide nucléique » se rapporte à une pluralité de différentes molécules simple brin ou double brins d'acide nucléique, en particulier des molécules d'ADN. Ces molécules peuvent être linéaires ou circulaires. Les molécules d'acide nucléique de la bibliothèque peuvent être ou non attachées covalemment à un support solide tels que des billes et en particulier des billes ou support recouvert de streptavidine. 30 Les termes « en amont » et « en aval », comme utilisés ci-dessus, se rapportent à une position d'un élément discret sur une molécule d'acide nucléique par rapport à un autre élément discret. Un premier élément est en amont à un deuxième élément lorsqu'il est placé dans la direction 5' du brin codant dudit deuxième élément. Un premier élément est en aval à un Chaouki MILED 10 10/04835 deuxième élément lorsqu' il est placé dans la direction 3' du brin codant dudit deuxième élément. Les termes « extrémité 5' » et « extrémité 3' », Tel qu'utilisé ici, se rapportent à l'extrémité 3' et l'extrémité 5' du brin codant. Tel qu'utilisé ici, le terme « adjacent » se rapporte à une position d'un élément discret sur une molécule d'acide nucléique par rapport à un autre élément discret. Un premier élément est à côté d'un deuxième élément une fois placé à l'extrémité 5' ou à l'extrémité 3' dudit deuxième élément. Cette limite indique qu'aucun autre élément n'est présent entre le premier et le deuxième élément. En particulier, le terme « adjacent » signifie que les premiers et les deuxièmes éléments sont consécutifs (c.-à-d., il n'y a aucun nucléotide s'intercalant) ou sont séparés par un nombre non significatif de nucléotides, de préférence moins de 20, 15, 10, 5 ou 2 nucléotides. Tel qu'utilisé ici, le terme « amorce » se rapporte à un polynucléotide d'environ 10-200 nucléotides de longueur. L'amorce s'hybride avec la cible (ou la matrice) et fournit un point d'initiation pour la synthèse dirigée par la matrice d'un polynucléotide complémentaire à la cible catalysée par une enzyme dite polymérase telle qu'une ADN polymérase (réaction d'amplification en chaine par la polymérase). Des réactions de PCR sont typiquement réalisées avec une paire d'amorces : une amorce sens (ou amorce amont) et une amorce inverse (ou amorce aval) qui délimite la région à amplifier. Le terme « enzyme de restriction » ou « endonucléase de restriction » est prévu pour se rapporter à une enzyme qui identifie un site de reconnaissance spécifique (ou site de restriction) sur une molécule monocaténaire ou double brin d'acide nucléique et coupe cette molécule à un site de clivage. Tel qu'utilisé ici, le terme « site de restriction » (RS) se rapporte à une séquence spécifique de nucléotides reconnue par une enzyme de restriction. Tel qu'utilisé ici, le terme « site de clivage » (CS) se rapporte à un site dans lequel l'enzyme de restriction coupe la molécule d'acide nucléique. Les enzymes de restriction peuvent reconnaître et cliver la molécule d'acide nucléique au même site. Les enzymes de restriction peuvent aussi cliver la molécule d'acide nucléique à un site éloigné du site de reconnaissance. Selon l'enzyme de restriction, le site de clivage peut être placé en aval ou en amont du site de reconnaissance. Tel qu'utilisé ici, le terme « ligation intra-moléculaire » se rapporte à la ligation de deux extrémités d'une molécule linéaire d'acide nucléique. Tel qu'utilisé ici, le terme «ligation inter- moléculaire » se rapporte à la ligation des extrémités de deux molécules linéaires d'acide nucléique Tel qu'utilisé dans ces spécifications, le terme « environ » se rapporte à une gamme du ± 10% de la valeur spécifique. Par exemple, « environ 20 » inclut le ± 10 % de 20, et se rapporte de 18 à 22. De préférence, le terme « environ » se rapporte à une gamme de valeurs ± 5 % de la Chaouki MILED 11 10/04835 valeur spécifique. Tel qu'utilisé ici, le terme « paire se liant par affinité » se rapporte à un système basé sur deux membres capables d'association les uns avec les autres, en covalence ou pas, de préférence non-covalente. Par exemple, le premier membre peut être la biotine et le deuxième membre peut être la streptavidine ou l'avidine. Un autre exemple d'une paire se liant par affinité est la digoxygénine et l'anticorps anti-digoxygénine. D'autres paires se liant par affinité sont connues dans l'art et considérées avec attention ici. Tel qu'utilisé ici, le terme « forme circularisée d'une molécule linéaire d'acide nucléique » se rapporte au produit obtenu par ligation intra-moléculaire de ladite molécule, c.-à-d. la ligation de l'extrémité 5' et de l'extrémité 3' de ladite molécule. Toutefois, ce terme n'est pas associé à la préparation réelle d'une telle forme circularisée mais est commode pour la description de la molécule d'acide nucléique linéaire.
Dans un premier aspect, la présente invention concerne une méthode pour préparer une bibliothèque d'acide nucléique, en particulier une bibliothèque d'acide nucléique à séquencer. La bibliothèque obtenue par cette méthode peut être l'ADN ou une bibliothèque d'ARN, de préférence une bibliothèque d'ADN. La méthode de l'invention comprend (i) l'étape de fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant une séquence d'intérêt à être entièrement ou partiellement séquencée et une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique et (ii) plusieurs étapes de circularisation, de digestion et de clivage pour fournir une bibliothèque caractérisée en ce que chaque ensemble des molécules d'acide nucléique est associé à un code-barres spécifique. Chaque dispositif de séquençage fourni par cette bibliothèque comprend un fragment de la séquence d'intérêt et un code-barres qui sera séquencé simultanément avec ledit fragment. Dans un mode de réalisation préféré, la méthode comprend l'étape i) de fourniture d'une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant une séquence d'intérêt à être séquencée entièrement ou partiellement et une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique. En particulier, la méthode comprend l'étape i) de fourniture de « n » ensembles de molécules linéaires d'acide nucléique comprenant une séquence à être séquencée entièrement ou partiellement et une séquence de code-barres (spécifique à chaque ensemble des molécules d'acide nucléique), « n » étant un nombre entier entre 1 et 1000. En conséquence, différentes séquences d'intérêt « n » peuvent être simultanément séquencés, chacune est associée à une séquence distincte de code-barres. « n » est limité par la capacité des séquenceurs.
Chaouki MILED 12 10/04835 La première étape de la méthode consiste en (a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circularisée et dans la direction 5' vers 3' - une séquence à être séquencée entièrement ou partiellement - un site inverse d'amorçage, - un site sens d'amorçage, - une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique, qui est placé entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et - deux sites de reconnaissance pour deux enzymes de restriction différentes : - un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et - un deuxième site de restriction pour une deuxième enzyme de restriction qui est placé entre le site inverse d'amorçage et le site sens d'amorçage. Les molécules linéaires d'acide nucléique fournies dans l'étape a) peuvent comprendre de 20 l'extrémité 5' vers l'extrémité 3' : - un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt (Fig la) ; ou un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt et un site inverse d'amorçage (Fig lb) ; ou 25 - une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage et un site sens d'amorçage (Fig 1 c) ; ou - une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres (Fig 1d) ; ou - un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une 30 séquence de code-barres (Fig le) ; ou - un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage (Fig 1f) ; ou - une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig 1g) ; ou Chaouki M1LED 13 10/0483 5 - une séquence de code-barres, un site inverse d'amorçage, un site sens d'amorçage et une séquence d'intérêt (Fig 1h). Lorsque l'on considère la molécule d'acide nucléique comprenant dans sa forme circularisée, toutes les formes linéaires mentionnées ci-dessus peuvent être récapitulées par deux formes circularisées : La Fig li est la forme circularisée récapitulant les acides nucléiques linéaires de la Fig la-d et la Fig 1j est la forme circularisée récapitulant les acides nucléiques linéaires de la Fig le-h. De préférence, toutes les molécules d'acide nucléique ont la même conformation ou arrangement des différents éléments, c.-à-d. une des structures présentées ci-dessus. Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) sont des molécules double brins d'ADN.
Le site inverse d'amorçage (RP) et le site sens d'amorçage (FP) sont connus et ont des séquences prédéterminées. Ces sites d'amorçage sont utilisés pour amplifier les dispositifs de séquençage en utilisant des amorces spécifiques de ces sites. Les amorces utilisées pour la réaction d'amplification peuvent être des amorces universelles de séquençage. Dans un mode de réalisation préféré, l'amorce inverse de séquençage s'hybride au site inverse d'amorçage et l'amorce sens de séquençage s'hybride au site sens d'amorçage. Ces sites d'amorçage peuvent être facilement conçus par une personne qualifiée selon la technologie de séquençage et avec les amorces universelles qui sont prévues pour être utilisées. Le site inverse d'amorçage (RP) et le site sens d'amorçage (FP) s'appellent : P1 (5'CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT3') et P2 (5'CTG000CGGGTTCCTCATTCTCT3') dans le système SOLiD.
La séquence d'intérêt peut être n'importe quelle séquence d'acide nucléique d'une longueur d'environ 25 paires de bases (bp) à 15 kbp. En particulier, la limitation principale pour la longueur de la séquence d'intérêt est liée à la limitation d'amplification.
La séquence d'intérêt peut être un gène d'intérêt ou d'un segment de celui-ci, ou une région chromosomique d'intérêt. Un code-barres doit être associé à une séquence d'intérêt. Puis, une bibliothèque peut être préparée à partir de l'association d'un code-barres à une séquence d'intérêt par la méthode décrite ci-dessus, ce qui permet de fournir une bibliothèque de fragments de la séquence d'intérêt associées au même code-barres. Naturellement, comme expliqué dans l'introduction de la description détaillée, l'avantage de la présente méthode est de préparer Chaouki MILED 14 10/04835 simultanément plusieurs bibliothèques, caractérisées en ce que chaque séquence initiale d'intérêt est associée à un code-barres spécifique (et différent). Par exemple, si la méthode est appliquée au séquençage d'un gène particulier d'intérêt pour plusieurs individus ou organismes (par exemple, un oncogène tel que le gène p53), un code-barres peut être attribué à chaque individu ou organisme particulier. En conséquence, le gène peut être simultanément séquencé pour plusieurs individus ou organismes. Alternativement, si plusieurs gènes ou régions chromosomiques doivent être séquencés pour un même individu, un code-barres peut être attribué à chaque gène particulier ou régions chromosomiques.
La séquence de code-barres est une séquence d'acide nucléique comprenant de 5 à 15bp, de préférence de 5 à 10bp. Cette séquence de code-barres est spécifique à chaque ensemble des molécules d'acide nucléique. De préférence, cette séquence de code-barres ne comprend aucun site de restriction. Quand on considère la forme circularisée des molécules d'acide nucléique décrites ci-dessus, le code-barres est toujours à côté de la séquence d'intérêt soit en amont de la séquence d'intérêt, et en particulier entre le site sens d'amorçage et la séquence d' intérêt (Fig l i) ; ou en aval de la séquence d'intérêt, et en particulier entre la séquence d'intérêt et le site inverse d'amorçage (Fig lj). Lorsque l'on considère les différentes formes possibles linéaires fournies à l'étape a), ce qui signifie que la séquence de code-barres peut être placée entre le site sens d'amorçage et la séquence d'intérêt (Fig la et Fig lb), entre la séquence d'intérêt et le site inverse d'amorçage (Fig 1f et Fig 1g), en amont de la séquence d'intérêt (Fig 1 c), en aval de la séquence d'intérêt (Fig le), en aval du site sens d'amorçage (Fig 1d) ou en amont du site inverse d'amorçage (Fig 1h).
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site universel d'amorçage (UPS). Ce site universel d'amorçage comprend ou consiste en une séquence d'au moins de 10 paires de bases, de préférence au moins 15 pb, de préférence au moins 20 pb. De préférence, le site universel d'amorçage se compose de 10 à 25 pb, de préférence de 15 à 20 pb. Ladite séquence possède moins de 90 % d'identité avec le génome contenant la séquence d'intérêt. De préférence, la séquence possède moins de 80 % d'identité avec le génome contenant la séquence d'intérêt, de préférence moins de 70 % d'identité et plus préférablement, moins de 60% d'identité. Dans un mode de réalisation particulier, le site universel d'amorçage comprend ou consiste en une séquence d'au moins 15 pb et qui possède moins de 80 % d'identité avec le génome contenant la séquence d'intérêt. Le site universel d'amorçage peut être placé en amont ou en aval de la séquence d'intérêt.
Chaouki MILED 15 10/04835 Les molécules linéaires d'acide nucléique fournies dans l'étape a) et comprenant en outre un site universel d'amorçage (UPS) qui peut comprendre, par exemple, de l'extrémité 5' vers l'extrémité 3' : - un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres, une 5 séquence UPS et une séquence d'intérêt (Fig 2a) ; ou - un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt et un site inverse d'amorçage (Fig 2b) ; ou - une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage et un site sens d'amorçage (Fig 2c) ; ou 10 - une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres (Fig 2d) ; ou - un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig 2e) ; ou - un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de 15 code-barres et un site inverse d'amorçage (Fig 2f) ; ou - une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig 2g) ; ou - une séquence de code-barres, un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, et une séquence d'intérêt (Fig 2h). 20 Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, une séquence d'intérêt, un UPS, un site inverse d'amorçage et un site sens d'amorçage (Fig 2c). Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse 25 d'amorçage, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig 2e). Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt 30 (Fig 2a). Dans un autre mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig 2g).
Chaouki MILED 16 10/04835 Les molécules mentionnées ci-dessus comprenant une séquence UPS sont les préférées. D'autres molécules comprenant une séquence UPS peuvent être envisagées, mais avec un arrangement moins favorable.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un module de courbure (CM) placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens d'amorçage. En considérant les molécules linéaires d'acide nucléique fournies dans l'étape a), le module de courbure placé entre le site inverse d'amorçage et le site sens d'amorçage ou, lorsque les sites d'amorçage sont placés à chaque extrémité de la molécule (la Fig 1 ou 2, le b et f), est placé soit en aval du site inverse d'amorçage ou en amont du site sens d'amorçage. Le module de courbure est une séquence de nucléotide induisant une courbure dans la structure de l'hélice d'une molécule d'acide nucléique. Ce module peut être utilisé pour faciliter la circularisation des molécules d'acide nucléique, en particulier les molécules d'acide nucléique comprenant moins de 250 bp. Ce module peut comprendre ou consister en une séquence de nucléotide obtenu ou dérivé des minicercles d'ADN de kinétoplaste trouvés dans la plupart des espèces de Trypanosoma et en particulier des minicercles d'ADN de kinétoplaste de Crithidia fasciculata. Le module de courbure peut comprendre ou consiste en, une séquence sélectionnée parmi le groupe de séquences suivant : SEQ ID No. 1 et SEQ ID No.2 et une séquence ayant au moins 90 % d'identité avec les séquences SEQ ID No. 1 et SEQ ID No. 2. Dans un mode de réalisation, le module de courbure comprend ou consiste en, une séquence sélectionnée parmi le groupe de séquences SEQ ID No. 1 et SEQ ID No. 2. Dans un mode de réalisation particulier, le module de courbure comprend ou consiste en, la séquence SEQ ID No. 1. Dans un autre mode de réalisation particulier, le module de courbure comprend ou consiste en, la séquence SEQ ID No. 2. (Birkenmeyer et al 1985, Ulanovsky et al 1986, Kitchin et al 1986).
En conséquence, les molécules linéaires d'acide nucléique fournies dans l'étape a) et comprenant aussi un module de courbure peut comprendre, par exemple, de l'extrémité 5' vers l'extrémité 3' : - un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt (dérivé de la Fig la arrangement) ; ou - un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (dérivé de la Fig 2a arrangement ; Fig 3a) ; ou - un module de courbure, un site sens d'amorçage, une séquence de code-barres, une Chaouki MILED 17 10/04835 séquence d'intérêt et un site inverse d'amorçage (dérivé de la Fig lb arrangement) ; ou - un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage et un module de courbure (dérivé de la Fig lb arrangement) ; ou - un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt et un site inverse d'amorçage (dérivé de la Fig 2b arrangement) ; ou - un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt, un site inverse d'amorçage et un module de courbure (dérivé de la Fig 2b) ; ou - un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt, une 10 séquence UPS, un site inverse d'amorçage et un module de courbure ; ou - une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig le arrangement) ; ou - une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig 2c ; Fig 3b) ; ou 15 - une séquence d'intérêt, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence de code-barres (dérivé de la Fig 1d arrangement) ; ou - une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence de code-barres (dérivé de la Fig 2d arrangement) ; ou 20 - un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres (dérivé de la Fig le arrangement) ; ou - un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (dérivé de la Fig 2e arrangement ; Fig 3c) ; ou 25 - un module de courbure, un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage (dérivé de la Fig 1f arrangement) ; ou - un module de courbure, un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de code-barres et un site inverse d'amorçage (dérivé de la Fig 2f arrangement) ; ou 30 - un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage ; ou - un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un module de courbure (dérivé de la Fig 1f arrangement) ; ou - un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de Chaouki M1LED 18 10/04835 code-barres, un site inverse d'amorçage et un module de courbure (dérivé de la Fig 2f arrangement) ; ou - une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig 1g arrangement) ; ou - une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig 2g arrangement ; Fig 3d) ; ou - une séquence de code-barres, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence d'intérêt (dérivé de la Fig 1h arrangement) ; ou - une séquence de code-barres, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS et une séquence d'intérêt (dérivé de la Fig 2h arrangement). Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (Fig 3b). Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig 3c).
Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (Fig 3a). Dans un autre mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (Fig 3d).
Les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de 30 reconnaissance pour une première enzyme de restriction. Le site de reconnaissance pour la première enzyme de restriction est placé, en considérant la forme circularisée des molécules d'acide nucléique, entre le code-barres et la séquence d'intérêt. Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape Chaouki MILED 19 10/04835 a) comprennent une séquence de code-barres à côté de la séquence d'intérêt (Fig la-c, e-g ; Fig 2c et 2e, Fig 3b et c), et le site de reconnaissance pour la première enzyme de restriction est placé entre la séquence de code-barres et la séquence d'intérêt. Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres dans l'extrémité 5' et une séquence d'intérêt dans l'extrémité 3' (Fig 1h et Fig 2h), et le site de reconnaissance pour la première enzyme de restriction est placé en amont de la séquence de code-barres ou en aval de la séquence d'intérêt, mais de préférence en amont de la séquence de code-barres. Dans un mode de réalisation additionnel, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres de l'extrémité 3' et une séquence d'intérêt de l'extrémité 5' (Fig 1d et Fig 2d) et le site de reconnaissance pour la première enzyme de restriction est placé en aval de la séquence de code-barres ou en amont de la séquence d'intérêt, mais de préférence en aval de la séquence de code-barres. Dans un mode de réalisation supplémentaire, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent un site universel d'amorçage (UPS) entre la séquence de code-barres et la séquence d'intérêt (Fig 2a, 2b, 2f et 2g, Fig 3a et 3d) et le site de reconnaissance pour la première enzyme de restriction est placé entre le site universel d'amorçage (UPS) et la séquence de code-barres ou dans ledit site universel d'amorçage (de préférence près de la séquence de code-barres).
Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une deuxième enzyme de restriction qui est placé, lorsqu'on considère la forme circularisée des molécules d'acide nucléique, entre les deux sites d'amorçage (par exemple, Fig li et lj). Dans un mode de réalisation particulier, les molécules d'acide nucléique comprennent aussi un module de courbure placé entre le site inverse et le sites sens d'amorçage et le deuxième site de restriction pour la deuxième enzyme de restriction est placé dans ledit module de courbure (Fig 3a-d). Dans un mode de réalisation très particulier, les molécules d'acide nucléique comprennent aussi un module de courbure placé entre les sites inverse et sens d'amorçage, le deuxième site de restriction pour la deuxième enzyme de restriction est placé dans ledit module de courbure et la deuxième enzyme de restriction est Pacl.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de reconnaissance pour une troisième enzyme de restriction. La troisième enzyme de Chaouki MILED 20 10/04835 restriction est une endonucléase non palindromique qui clive l'ADN à une distance définie de son site de reconnaissance. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig li), et le site de reconnaissance pour la troisième enzyme de restriction est placé en amont du site inverse d'amorçage. Dans ce mode de réalisation, la troisième enzyme de restriction coupe les molécules d'acide nucléique dans un site de clivage en amont à son site de reconnaissance, c.-à-d. dans la séquence d'intérêt pour la forme circularisée des molécules. Dans un autre mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage (Fig lj), et le site de reconnaissance pour la troisième enzyme de restriction est placé en aval du site sens d'amorçage. Dans ce mode de réalisation, la troisième enzyme de restriction coupe l'ADN (c.-à-d., une coupure double brin) dans un site de clivage en aval de son site de reconnaissance, c.-à-d. dans la séquence d'intérêt pour la forme circularisée des molécules. Dans un mode de réalisation particulier, la troisième enzyme de restriction est choisie dans le groupe EcoP15I, Mmel, NmeAIII, Acul, Bbvl, BceAI, Bpml, BpuEI, BseRI, Bsgl, BsmFI, BtgZI, Ecil, Fokl, Hgal, I-Ceul, I-Scel,, Pi-Pspl et Pi-Scel. Dans un mode de réalisation plus particulier, la troisième enzyme de restriction est choisie parmi le groupe EcoP15I, Mmel et NmeAIII. Dans un mode de réalisation préféré, la troisième enzyme de restriction est EcoP15I.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de reconnaissance pour une quatrième enzyme de restriction. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig li), et le site de reconnaissance pour la quatrième enzyme de restriction est placé en amont du site inverse d'amorçage. Dans un autre mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' Chaouki MILED 21 10/04835 vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage (Fig lj), et le site de reconnaissance pour la quatrième enzyme de restriction est placé en aval du site sens d'amorçage.
Les premières, deuxièmes, troisièmes et quatrièmes enzymes de restriction peuvent être choisies afin d'avoir des sites de clivage additionnels rares/occasionnels ou pas de site de clivage additionnels dans la séquence d'intérêt et dans n'importe quelle autre partie des molécules d'acide nucléique. De préférence, les enzymes de restriction sont choisies afin d'avoir seulement un site de clivage dans les molécules d'acide nucléique. De préférence, les premières, deuxièmes et quatrièmes enzymes de restriction coupent l'ADN (c.-à-d., coupure double brin) dans leurs sites de reconnaissance ou à une distance de ces sites inférieure à 5 nucléotides. De préférence, les premières, deuxièmes et quatrièmes enzymes de restriction coupent l'ADN dans leurs sites de reconnaissance.
Ces enzymes de restriction peuvent être choisies pour n'avoir aucun site de clivage ou une fréquence de coupure basse dans la séquence d'intérêt. La fréquence des sites d'une enzyme de restriction dans les génomes séquencés peut être facilement trouvée par une personne qualifiée sur les bases de données disponibles (comme REBASER http://rebase.neb.com). Des enzymes de restriction peuvent être choisies ainsi afin d'avoir une fréquence de coupure basse dans le génome contenant la séquence d'intérêt. Dans un mode de réalisation particulier, la première enzyme de restriction est choisie dans le groupe Srfl, Sbfl, Ascl, Notl, BssHII, SacIL Fsel, Smal. Dans un mode de réalisation préféré, la première enzyme de restriction est choisie dans le groupe Srfl et Sb fi Dans un mode de réalisation particulier, la deuxième enzyme de restriction est choisie 25 dans le groupe Pacl, Ascl, Notl, BssHII, SacII, Fsel, Smal. Dans un mode de réalisation préféré, la deuxième enzyme de restriction est PacL Dans un mode de réalisation particulier, la quatrième enzyme de restriction est choisie dans le groupe Pmel, Ascl, Notl, BssHII, SacII, Fsel, SmaL Dans un mode de réalisation préféré, la quatrième enzyme de restriction est choisie dans le groupe Pmel et Asl. 30 Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de liaison pour un premier membre d'une paire se liant par affinité. De préférence, ce site de liaison est placé dans la région de l'extrémité 5' du site inverse d'amorçage à l'extrémité 3' du site sens d'amorçage. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans Chaouki MILED 22 10/04835 l'étape a) comprennent en outre, un module de courbure placé entre les sites inverse et sens d'amorçage et le dit module de courbure comprend un site de liaison pour un premier membre d'une paire se liant par affinité. Les molécules d'acide nucléique fournies dans l'étape a) peuvent aussi être attachées à un premier membre d'une paire se liant par affinité. De préférence, le premier membre d'une paire se liant par affinité est attaché dans la région de l'extrémité 5' du site inverse d'amorçage à l'extrémité 3' du site sens d'amorçage. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent un module de courbure placé entre les sites inverse et sens d'amorçage et le premier membre d'une paire se liant par affinité est fixé audit module de courbure. La paire se liant par affinité peut être, par exemple, la digoxigénine - anticorps antidigoxigénine ou la biotine- avidine/streptavidine. De préférence, le premier membre de la paire se liant par affinité est la biotine et le deuxième membre est la streptavidine. Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) comprennent un module de courbure comprenant une thymidine modifiée par une biotine. Comme un exemple précis, la thymidine modifiée par une biotine peut être la thymidine 12 de SEQ ID No. 1 ou la thymidine 13 de SEQ ID No. 2.
Les molécules d'acide nucléique fournies dans l'étape a) de la méthode de l'invention peut être obtenue par une ou plusieurs réactions d'amplification. L'amplification peut être réalisée par n'importe quelle technique, y compris, mais sans s'y limiter, la PCR, la RT-PCR , amplification par la Q3-replicase (Cahill et al, 1991 ; Chetverin et Spirin, 1995 ; Katanaev et al, 1995), la « ligase chain reaction" (LCR) (Landegren et al, 1988 ; Barany, 1991), le système autonome de réplication de séquence (Fahy et al, 1991), amplification par déplacement de brin (Walker et al, 1992), « nucleic acid sequence-based amplification" (NASBA) (Compton, 1991), « loopmediated isothermal amplification" (Notomi et al, 2000), «rolling circle amplification" (RCA) (Blanco et al, 1989) et « hyperbranched rolling circle amplification" (HRCA) (Lizardi et al, 1998). De préférence l'amplification est par PCR ou RT-PCR. De préférence, une polymérase de haute-fidélité est utilisée et le taux d'erreur de la polymérase est moins de l0"5, de préférence moins de 10-6, et encore plus préférentiellement moins de 5.10-'. De préférence, la Platinum Taq DNA Polymerase High Fidelity (Invitrogen), la Phusion Hot Start High-Fidelity DNA Polymerase (New England BioLabs), la FastStart High Fidelity PCR System (Roche). La matrice pour cette amplification peut être une molécule d'ADN ou d'ARN. Pour Chaouki MILED 23 10/04835 l'amplification par PCR ou par RT-PCR, un ensemble d'amorces est nécessaire. Un ensemble d'amorces comprennent au moins deux amorces : une amorce sens et une amorce inverse. L'ensemble d'amorces peut être facilement conçu par une personne qualifiée selon la structure des molécules linéaires d'acide nucléique à obtenir, la séquence d'intérêt et le nombre de réactions d'amplification.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent être obtenues par une réaction d'amplification, de préférence par une réaction de RT-PCR ou de PCR. L'amorce sens pour cette réaction comprend la région des molécules linéaires d'acide nucléique fournies dans l'étape a) qui est en amont de la séquence d'intérêt et au moins 10, de préférence 12, 15, 20 ou 25, nucléotides de l'extrémité 5' de la séquence d'intérêt. L'amorce inverse comprend la région des molécules d'acide nucléique qui est en aval de la séquence d'intérêt et au moins 10, de préférence 12, 15, 20 ou 25, nucléotides de l'extrémité 3' de la séquence d'intérêt.
Dans un mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig la, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification avec un ensemble d'amorces comprenant une amorce inverse spécifique de l'extrémité 3' de la séquence d'intérêt et d'une amorce sens comprenant de son extrémité 5' vers son extrémité 3' : - un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou - un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En option, l'amorce sens peut comprendre à son extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation plus particulier, l'amorce sens est attachée à un premier membre d'une paire se liant par affinité. De préférence, l'amorce sens est attachée à la biotine. De préférence, l'amorce sens comprend un module de courbure attaché à la biotine. Dans un mode de réalisation préféré, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant Chaouki MILED 24 10/04835 une amorce inverse spécifique de l'extrémité 3' de la séquence d'intérêt et d'une amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. De préférence, l'amorce sens comprend aussi à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et, en option un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig 1g, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification avec un ensemble d'amorces comprenant une amorce sens à l'extrémité 5' de la séquence d'intérêt et d'une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3' : - un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou - un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En option, l'amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation plus particulier, l'amorce inverse est attachée à un premier membre d'une paire se liant par affinité. De préférence, l'amorce inverse est attachée à la biotine. De préférence, l'amorce inverse comprend un module de courbure attaché à la biotine. Dans un mode de réalisation préféré, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens dans l'extrémité 5' de la séquence d'intérêt et d'une amorce inverse comprenant de son extrémité 5' à l'extrémité 3' un site sens d'amorçage, un module de courbure attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. De Chaouki MILED 25 10/04835 préférence, l'amorce inverse comprend à son extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et, en option un site de reconnaissance pour le quatrième enzyme de restriction Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig 1c, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenus par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3': - un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou - un site sens d'amorçage, un module de courbure en option attaché à la biotine et comprend un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En option, l'amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, entre le site de l'amorce inverse et l'extrémité 3' de la séquence d'intérêt.
Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig le, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et d'une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', : - un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de 30 restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou - un site inverse d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En option, Chaouki MILED 26 10/04835 l'amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, entre le site sens d'amorçage et l'extrémité 5' de la séquence d'intérêt. De préférence, l'amorce sens comprend un site de reconnaissance pour la troisième enzyme de restriction et un site de reconnaissance pour la quatrième enzyme de restriction.
L'homme de l'art peut facilement concevoir un ensemble approprié d'amorces pour préparer les molécules d'acide nucléique de l'étape a) par une réaction d'amplification basée sur les mêmes règles. Les différents ensembles d'amorces peuvent être préparés en changeant la séquence de code-barres pour chaque séquence d'intérêt différente et, naturellement, en adaptant la séquence spécifique de la séquence d'intérêt ciblée.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent aussi être obtenues par plusieurs réactions d'amplification. Ces réactions d'amplification peuvent être réalisées successivement ou simultanément dans le même mélange de réaction. Si les cibles à amplifier sont très nombreuses, ces amplifications sont réalisées simultanément en utilisant la plate-forme de RainStorm, développée par RainDance Technologies (Mamanova et al, 2010), les amorces à utiliser dans ces réactions peuvent être facilement conçues par une personne qualifiée. En effet, chaque ensemble d'amorces doit contenir au moins une séquence d'amorce qui chevauche avec une autre amorce (les amorces sens chevauchant et/ou les amorces inverses chevauchant, de préférence pas toutes les deux simultanément). Les amorces chevauchant ou le chevauchement ci-dessus signifient que le chevauchement est suffisant pour amorcer l'amplification. En conséquence, le chevauchement est d'au moins 10, 15 ou 20 nucléotides.
Dans un mode de réalisation préféré de la méthode, les molécules d'acide nucléique fournies dans l'étape a) ont, soit à leur extrémité 5' ou à leur l'extrémité 3', un groupe d'éléments comprenant, de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage. De préférence, elles ont un groupe d'éléments comprenant, de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure en option attaché à un premier membre d'une paire se liant par affinité, par exemple la biotine, et comprend un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage. De préférence, les réactions d'amplification peuvent utiliser au moins deux groupes différents d'amorces avec les amorces sens chevauchant dans le site sens d'amorçage ou les amorces inverses chevauchant dans le site inverse Chaouki MILED 27 10/04835 d'amorçage, selon l'endroit de ce groupe d'éléments. En particulier, quand ce groupe d'éléments est à l'extrémité 5' de la molécule d'acide nucléique fournie à l'étape a), les ensembles d'amorces incluent les amorces sens chevauchant dans le site sens d'amorçage. Alternativement, quand ce groupe d'éléments est à l'extrémité 3' de la molécule d'acide nucléique fournie à l'étape a), les ensembles d'amorces incluent les amorces inverses chevauchant dans le site inverse d'amorçage. Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse de l'extrémité 3' de la séquence d'intérêt et - une première amorce sens comprenant, de son extrémité 5' a son extrémité 3', le site sens d'amorçage ou une première partie de celui-ci incluant son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et - une deuxième amorce sens comprenant : - de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de 15 reconnaissance pour la deuxième enzyme de restriction et du site sens d'amorçage ou d'une première partie de celui-ci incluant son extrémité 5', ou - de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure, étant en option, attaché à un premier membre d'une paire se liant par 20 affinité, le site sens d'amorçage ou une seconde partie de celui-ci chevauchant la première partie de celui-ci incluant son extrémité 5'. En option, la deuxième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. 25 Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et 30 - une première amorce sens comprenant, de son extrémité 5' à son extrémité 3', un site sens d'amorçage ou d'une première partie de celui-ci incluant son extrémité 3', et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et - une deuxième amorce sens comprenant : - de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de Chaouki MILED 28 10/04835 reconnaissance pour la deuxième enzyme de restriction et du site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5', ou de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site sens d'amorçage ou une deuxième partie chevauchant la première partie incluant son extrémité 5'. En option, la deuxième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la 10 quatrième enzyme de restriction. Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 15 nucléotides de l'extrémité 5' de la séquence d'intérêt, et - une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une première partie de celui-ci incluant son extrémité 5' et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et, - une deuxième amorce inverse comprenant : 20 - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'; ou - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le 25 module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'. En option, la deuxième amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la 30 quatrième enzyme de restriction. Dans un mode de réalisation particulier additionnel, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et Chaouki MILED 29 10/04835 - une première amorce inverse comprenant, de son extrémité 5' à son extrémité 3', le site inverse d'amorçage ou une première de celui-ci incluant son extrémité 5', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et, une deuxième amorce inverse comprenant: - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'; ou - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'. En option, la deuxième amorce inverse peut comprendre à l'extrémité 5' un site de 15 reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation avantageux, la méthode utilise une séquence du site universel d'amorçage (UPS). L'utilisation de l'UPS permet la conception d'amorces plus courtes 20 spécifiques aux séquences d'intérêt, abaissant de ce fait le coût. En effet, les premières amorces préférées de la méthode incluent une séquence UPS et au moins 10 nucléotides de l'extrémité 5' ou 3' de la séquence d'intérêt. Les autres amorces ne sont pas spécifiques aux séquences d'intérêt et peuvent être utilisées en tant que produits normalisés, commodes pour préparer des kits appropriés pour réaliser les méthodes telles que décrites ici. 25 Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse spécifique à l'extrémité 3' de la séquence d'intérêt, et : - une première amorce sens comprenant, de son extrémité 5' à son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et 30 - une deuxième amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage, et - une troisième amorce sens comprenant : Chaouki MILED 30 10/04835 - de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5', ou - de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5'. En option, la troisième amorce sens peut comprendre à l'extrémité 5' un site de 10 reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces 15 comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et - une première amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et 20 - une deuxième amorce inverse comprenant : - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site inverse d'amorçage et le site universel d'amorçage, ou - de son extrémité 5' à son extrémité 3', un site sens d'amorçage, un module de 25 courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage et le site universel d'amorçage. En option, la deuxième amorce inverse peut comprendre entre le site universel d'amorçage et le site inverse d'amorçage, un site de reconnaissance pour la troisième enzyme de 30 restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une Chaouki MILED 31 10/04835 séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et - une première amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et - une deuxième amorce sens comprenant : - de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et le site universel d'amorçage, ou - de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site sens d'amorçage et le site universel d'amorçage. En option, la deuxième amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de 15 restriction, placé entre le site sens d'amorçage et le site universel d'amorçage.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence 20 de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et - une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et - une deuxième amorce inverse comprenant : 25 - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et un site universel d'amorçage, ou - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le 30 module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site inverse d'amorçage et un site universel d'amorçage. En option la deuxième amorce inverse peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé à son extrémité 5'.
Chaouki MILED 32 10/04835 Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens spécifique à l'extrémité 5' de la séquence d'intérêt, et : - une première amorce inverse comprenant de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et - une deuxième amorce inverse comprenant : - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage, et - une troisième amorce inverse comprenant : - de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site inverse d'amorçage ou une deuxième partie de celui-ci chevauchant la première partie et incluant son extrémité 3', ou - de son extrémité 5' à son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, et le site inverse d'amorçage ou une deuxième partie de celui-ci chevauchant la première partie et incluant son extrémité 3'. En option la troisième amorce inverse peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé à l'extrémité 5'.
En option, après de(s) réaction(s) d'amplification, les amorces simple brin excédentaires peuvent être dégradées, par exemple, en utilisant l'exonucléase I ou tout autre nucléase spécifique de l'ADN simple brin.
Les autres étapes de la méthode peuvent être effectuées sur la pluralité des ensembles de 30 séquences d'acide nucléique linéaire, optimisant ainsi le coût en temps et en argent dans la préparation de bibliothèque.
Dans l'étape b) de la méthode d'invention, des molécules linéaires d'acide nucléique fournies dans l'étape a) ou a') sont circularisées par ligation intra-moléculaire. En conséquence, Chaouki MILED 33 10/04835 deux types différents des molécules circularisées peuvent être obtenus, le premier type comprend la séquence entière d'intérêt et le deuxième type comprend la séquence d'intérêt déjà tronquée à l'une de ses extrémités (c.-à-d., quand l'étape a') a été réalisée). Cette ligation peut être effectuée par n'importe quelle méthode connue par une personne qualifiée. De préférence, la ligation intra- moléculaire est effectuée en utilisant une ligase d'ADN, telle que l'ADN ligase T4, dans les conditions décrites dans l'article de Collins et Weissman, 1984. Les conditions utilisées dans cette étape empêchent les ligations inter-moléculaires. La ligation inter-moléculaire peut être empêchée par exemple en utilisant la dilution appropriée (par exemple, dilution limite) ou, lorsque les molécules d'acide nucléique sont attachées à un premier membre d'une paire se liant par affinité, en liant les molécules d'acide nucléique à un support solide soutenant le premier membre d'une paire se liant par affinité.
Dans l'étape c) de la méthode de l'invention, les molécules circularisées d'acide nucléique obtenues à partir de l'étape b) sont digérées avec l'enzyme de restriction affin de fournir une forme linéarisée, de préférence par la première enzyme de restriction. Cette enzyme de restriction coupe les molécules circularisées d'acide nucléique entre le code-barres et la séquence d'intérêt. Cette digestion produit des molécules linéaires d'acide nucléique comprenant à une extrémité la séquence de code-barres et à l'autre extrémité la séquence d'intérêt. Quand un site universel d'amorçage est présent entre la séquence de code-barres et la séquence d'intérêt, la première enzyme de restriction coupe entre le site universel d'amorçage et la séquence de code-barres ou dans le site universel d'amorçage, de préférence près de l'extrémité adjacente à la séquence de code-barres. Lorsque les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig li), la digestion avec la première enzyme de restriction fournit les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt à leur extrémité 5' et la séquence de code-barres à leurs extrémité 3'. Lorsque les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt (Fig 1j), la digestion avec la première enzyme de restriction fournit les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt à leur extrémité 3' et la séquence de code-barres à leur extrémité 5'.
Chaouki MILED 34 10/04835 Dans l'étape d) de la méthode de l'invention, les molécules d'acide nucléique digérées obtenues à partir de l'étape c) sont clivées dans la séquence d'intérêt. Ce clivage peut être effectué par des méthodes enzymatiques ou physiques.
Le clivage peut être effectué en utilisant une technique de clivage indépendamment de la séquence comme, par exemple, la sonication, la nébulisation, la French Press ou en utilisant le système Hydroshear® (Genomic Solutions®). De préférence, le clivage est effectué par sonication. Ce clivage produit des fragments aléatoires d'acide nucléique de tailles spécifiques. La taille des molécules fragmentées peut être choisie par une personne qualifiée selon l'utilisation prévue de la bibliothèque préparée par la méthode de l'invention. Des molécules clivées peuvent être séparées par l'électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir du gel d'électrophorèse. Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Figure 1). Dans ce mode de réalisation, la digestion avec la première enzyme de restriction dans l'étape c) fournit les molécules linéaires d'acide nucléique comprenant à leur extrémité 5', l'extrémité 5' de la séquence d'intérêt. Le clivage de ces molécules d'acide nucléique fournit ainsi les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt tronquée en 5'. Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt (Figure 2). Dans ce mode de réalisation, la digestion avec la première enzyme de restriction dans l'étape c) fournit les molécules linéaires d'acide nucléique comprenant, à leur extrémité 3', l'extrémité 3' de la séquence d'intérêt. Le clivage de ces molécules d'acide nucléique fournit ainsi les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt tronquée en 3'. Le clivage peut aussi être effectué en utilisant l'enzyme de restriction. Dans ce cas-ci, les 30 molécules d'acide nucléique fournies dans l'étape a) comprennent un site de reconnaissance pour une troisième enzyme de restriction comme décrit ci-dessus. Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprend sous leur forme circularisée, une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt et un site de reconnaissance pour la troisième Chaouki MILED 35 10/04835 enzyme de restriction entre le site inverse d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la digestion des molécules d'acide nucléique obtenues à partir de l'étape c) avec la troisième enzyme fournit des molécules d'acide nucléique comprenant une séquence d' intérêt tronquée en 5'.
Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée, une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt et un site de reconnaissance pour la troisième enzyme de restriction entre le site sens d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la digestion des molécules d'acide nucléique obtenues à partir de l'étape c) avec la troisième enzyme fournit des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 3'.
Dans l'étape e) de la méthode de l'invention, les molécules clivées d'acide nucléique obtenues à partir de l'étape d) sont circularisées par ligation intra-moléculaire. Cette ligation peut 15 être effectuée tel que décrit ci-dessus. Les molécules circularisées d'acide nucléique obtenues à partir de l'étape e) comprennent, dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse 20 d'amorçage. Dans un mode de réalisation, la séquence de code-barres est placée entre le site sens d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la séquence d'intérêt comprise entre lesdites molécules circularisées d'acide nucléique est tronquée en 5'. Dans un autre mode de réalisation, la séquence de code-barres est placée entre le site 25 inverse d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la séquence d'intérêt comprise dans lesdites molécules circularisées d'acide nucléique est tronquée en 3'.
Les molécules d'acide nucléique obtenues après les étapes a), b), c), d) et e) comprennent une séquence d'intérêt tronquée en 5' ou 3' selon la position du code-barres (en amont ou en aval 30 de la séquence d'intérêt). La méthode de l'invention peut en outre, comprendre des étapes additionnelles afm de tronquer l'autre extrémité de la séquence d'intérêt ce qui permet de fournir des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 3' et 5'. Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent la séquence d'intérêt à l'une de son extrémité (par exemple, Fig la, Fig Chaouki MILED 36 10/04835 ld, Fig 1g et Fig 1h ; Fig 2a, Fig 2d, Fig 2g et Fig 2h ; La Fig 3a et 3d) et la méthode comprend en outre une étape a') de clivage des molécules d'acide nucléique, après l'étape a) et avant l'étape b), ce qui permet de fournir une séquence d'intérêt tronquée. De préférence, le clivage est effectué par l'utilisation d'une technique de clivage indépendamment de la séquence (SITC), comme la sonication. En particulier, si la séquence d'intérêt est à l'extrémité 3' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig la et Fig 1h ; Fig 2a et Fig 2h ; La Fig 3a), les molécules obtenues d'acide nucléique présentent une séquence d'intérêt tronquée en 3'. Alternativement, si la séquence d'intérêt est à l'extrémité 5' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig 1d et Fig 1g ; Fig 2d et Fig 2g ; 3d), les molécules obtenues d'acide nucléique présentent une séquence d'intérêt tronquée en 5'. Les molécules clivées peuvent être séparées par électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir de gel d'électrophorèse.
Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) ne comprennent pas la séquence d'intérêt à une de son extrémité mais comprennent un site de reconnaissance pour une quatrième enzyme de restriction placé à l'extrémité de la séquence d'intérêt qui est à l'opposé de l'extrémité adjacente au code-barres. Dans ce mode de réalisation, la méthode comprend en outre après l'étape e), f) digestion des molécules circulaires d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant l'extrémité non tronquée de la séquence d'intérêt à une de son extrémité ; g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant une séquence d'intérêt tronquée en 5'et 3'.
Les molécules clivées peuvent être séparées par électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir du gel d'électrophorèse.
La méthode d'invention peut en outre, comprendre une étape h) de circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire. Cette 30 ligation peut être effectuée tel que décrit ci-dessus. Selon la structure des molécules d'acide nucléique fournie dans l'étape a), les molécules circulaires obtenues à partir de l'étape h) comprennent, dans la direction 5' vers 3': - un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 3' et en 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse Chaouki MILED 37 10/04835 d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, ou - un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de 5 reconnaissance pour une deuxième enzyme de restriction.
Dans un mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3' un 10 site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, en option un site universel d'amorçage, et une séquence d'intérêt (fig. 3a) (étape a) ; 15 - clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un 20 site sens d'amorçage, une séquence de code-barres, en option un site universel d'amorçage, et une séquence d'intérêt tronquée en 3' ; - circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, en option un site universel d'amorçage, 25 une séquence d'intérêt tronquée en 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de 30 l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ; Chaouki MILED 3 8 10/04835 - clivage desdites molécules d'acide nucléique digérées par la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 3' et 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; et - circularisation desdites molécules clivées d'acide nucléique par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 3' et 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un autre mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, en option un site universel d'amorçage, et une séquence d'intérêt (Fig. 3a) (étape a) ; - clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, en option un site universel d'amorçage, et une séquence d'intérêt tronquée en 3' ; - circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de Chaouki M1LED 39 10/04835 l'extrémité 5' vers 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ; - clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 3' et 5', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; et - circularisation desdites molécules d'acide nucléique par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 3' et 5', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un autre mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et un site de reconnaissance pour une troisième enzyme de restriction (fig. 3d) (étape a) ; - clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et un site de reconnaissance pour une troisième enzyme de restriction ; - circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, Chaouki MILED 40 10/04835 dans la direction 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape c) ; - clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et en 3' (étape d) ; et - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 3' et 5', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un autre mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (fig. 3d) ; - clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour Chaouki MILED 41 10/04835 une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage ; - circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, et un site de reconnaissance pour une première enzyme de restriction (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape c) ; - clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3' (étape d) ; et - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de Chaouki MILED 42 10/04835 reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (fig. 3b) (étape a) ; - circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ; - clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; - circularisation desdites molécules clivées d'acide nucléique par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e), - digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant Chaouki MILED 43 10/04835 un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape f) ; - clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' (étape g) ; et - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et en 3', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (fig. 3b) (étape a) ; circularisation desdites molécules linéaires d'acide nucléique par ligation infra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de Chaouki MILED 44 10/04835 courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ; - clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e), - digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, comprenant un module de courbure, un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et, en option, un site universel d'amorçage (étape f) ; - clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' (étape g) et - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et en 3', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h). Dans un mode de réalisation préféré, la méthode de l'invention comprend Chaouki MILED 45 10/04835 - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction et une séquence de code-barres (fig. 3c) (étape a) ; - circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt (étape c) ; - clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt tronquée en 3' (étape d) ; - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un Chaouki MILED 46 10/04835 site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e), - digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape f) ; - clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape g) ; et - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction et une séquence de code-barres (fig. 3c) (étape a) ; - circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une Chaouki MILED 47 10/04835 deuxième enzyme de restriction (étape b) ; - digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt (étape c) ; - clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, en option un site universel d'amorçage et une séquence d'intérêt tronquée en 3' (étape d) ; - circularisation desdites molécules d'acide nucléique clivées par ligation intramoléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e), - digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape f) ; - clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape g) ; et - circularisation desdites molécules d'acide nucléique clivées par ligation intra- Chaouki MILED 48 10/04835 moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) sont attachées à un premier membre d'une paire se liant par affinité et la méthode comprend en outre, une ou plusieurs étapes de fixation des molécules d'acide nucléique sur un support solide par le biais d'interaction entre le premier membre d'affinité de la paire de liaison attaché auxdites molécules d'acide nucléique et les deuxièmes membres de ladite paire se liant par affinité liées au support solide. Les supports solides utiles incluent n'importe quelle surface rigide ou semi-rigide sur laquelle un membre d'une paire se liant par affinité peut être lié. Le support peut être tout matériel poreux ou non poreux insoluble dans l'eau, y compris, sans limitation, membranes, filtres, puces, billes magnétiques ou non magnétiques, et polymères. De préférence, le support solide est choisi parmi les membranes et les billes basées sur la silice. De préférence, le support solide est des billes et plus en particulier des billes de polystyrène. Ces billes peuvent avoir un diamètre de 1 à 10 micromètres. Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont attachées à la biotine et sont liées à un support solide, des billes de préférence magnétiques, revêtue de streptavidine. Des molécules d'acide nucléique peuvent être liées à un support solide avant qu'une étape de circularisation par ligation intramoléculaire afin d'empêcher des événements inter-moléculaires ou avant que chaque changement de mélange de réaction afin de faciliter la récupération des molécules d'acide nucléique. La quantité du support solide peut être facilement ajustée par une personne qualifiée selon la concentration des molécules d'acide nucléique.
Dans un mode de réalisation préféré, des molécules linéaires d'acide nucléique obtenues à partir de l'étape g) sont liées à un support solide avant la circularisation de l'étape h). Dans un autre mode de réalisation, des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) sont alors liées à un support solide. Des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) peuvent être digérées par la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', - un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée30 Chaouki MILED 49 10/04835 en 5' et 3' et une séquence inverse d'amorçage, ou - un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres et une séquence inverse d'amorçage. Si les molécules d'acide nucléique comprennent un module de courbure comprenant le site de reconnaissance pour la deuxième enzyme de restriction, les molécules d'acide nucléique obtenues par digestion avec la deuxième enzyme de restriction comprennent à chaque extrémité, une partie du module de courbure. De préférence, des molécules d'acide nucléique sont liées sur un support solide avant qu' elles soient digérées avec la deuxième enzyme de restriction.
Des molécules d'acide nucléique digérées avec la deuxième enzyme de restriction peuvent alors être amplifiées, par exemple par PCR ou par n'importe quelle autre méthode connue par une personne qualifiée. De préférence, les amorces utilisées pour cette amplification comprennent : - une amorce sens s'hybridant au site sens d'amorçage, et - une amorce inverse s'hybridant au site inverse d'amorçage. Le produit de cette amplification peut alors être séquencé en utilisant n'importe quelle plate-forme de séquençage à haut débit.
La méthode peut en outre, comprendre une ou plusieurs étapes de réparation des extrémités des molécules clivées ou digérées d'acide nucléique. De préférence, les extrémités des molécules d'acide nucléique sont réparées après chaque étape de clivage ou de digestion et/ou chaque étape de circularisation. La réparation peut comprendre la reconstitution des extrémités et/ou phosphorylation des extrémités. La restauration et la phosphorylation peuvent être réalisées par n'importe quelle méthode connue par une personne qualifiée. Par exemple, la restauration peut être réalisée en utilisant une ADN polymérase spécifique, tel que l'ADN polymérase T4, en présence de dNTP, et la phosphorylation peut être réalisée en utilisant une kinase d'ADN, telle que le polynucléotide kinase T4, en présence d'ATP.
En option, la méthode comprend en outre, une ou plusieurs étapes de dégradation des molécules linéaires d'acide nucléique avec la DNase ATP-Dépendante qui hydrolyse sélectivement les molécules d'acide nucléique linéaires double brin. La DNase ATP-Dépendante de Plasmide-SafeTM (Epicentre) DNase ATP-Dépendante peut être choisie pour dégrader spécifiquement l'ADN linéaire. Il est particulièrement indiqué pour dégrader les molécules linéaires d'acide nucléique après une étape de circularisation, de préférence après chaque étape de Chaouki MILED 50 10/04835 circularisation.
La présente invention concerne des kits appropriés pour préparer les molécules d'acide nucléique fournies à l'étape a) de la méthode décrite ci-dessus. En particulier, lesdits kits peuvent comprendre n'importe quelle amorce sens ou inverse ou un ensemble de celles-ci tel que décrit précédemment pour préparer les molécules d'acide nucléique fournies dans l'étape a). Le kit peut comprendre au moins une amorce sens comprenant, de l'extrémité 5' vers l'extrémité 3', - un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou - un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'. Par «une partie de celui-ci » est voulu dire au moins 10, 15 ou 20 nucléotides de celui-ci.
Dans un premier mode de réalisation, le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci incluant son extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce, sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins seconde amorce sens comprend, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, le kit comprend une amorce sens et plusieurs secondes amorces sens différentes par leurs séquences de code-barres et, si présent, par au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En effet, chaque seconde amorce sens est conçue pour être spécifique à une séquence d'intérêt différente. En particulier, si entre 1 et 1.000 séquences d'intérêt différentes sont considérés, 1 et 1000 secondes amorces sens différentes sont conçues, chacune contient un code-barres distinct à associer respectivement à chaque séquence d'intérêt, l'autre élément restant les mêmes (par exemple, le site sens d'amorçage ou une partie de celui-ci, le site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage). Dans un deuxième mode de réalisation, l'au moins première amorce sens comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une Chaouki MILED 51 10/04835 première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. Plus préférablement, l'au moins première amorce sens comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, l'au moins première amorce sens comprend en outre, à l'extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Bien que le kit peut comprendre une amorce sens , le kit comprend de préférence plusieurs premières amorces sens différent par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, les autres éléments restent les même (c.-à-d., si présent, le site inverse d'amorçage, le module de courbure, le site de reconnaissance pour la seconde enzyme de restriction, le site sens d'amorçage ou une partie de celui-ci, le site universel d'amorçage). Selon le premier ou le deuxième mode de réalisation, le kit peut en outre, comprendre une amorce inverse comprenant au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou plusieurs amorces inverse, chacune comprend au moins 10 nucléotides de l'extrémité 3' de différente séquence d'intérêt. Dans un troisième mode de réalisation, l'au moins première amorce sens comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce sens comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage. En conséquence, le kit peut comprendre une première amorce sens. Dans ce mode de réalisation, le kit peut en outre, comprendre une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. De préférence, le kit comprend en outre plusieurs amorces inverses, différent par leurs séquences de code-barres et par au moins les 10 nucléotides spécifique à l'extrémité 3' de la séquence d'intérêt.
Selon le premier, deuxième ou troisième mode de réalisation, le kit peut en outre, comprendre au moins une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En particulier, le kit peut en outre, comprendre plusieurs amorces sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de Chaouki MILED 52 10/04835 l'extrémité 5' d'un des différentes séquences d'intérêt.
Alternativement, le kit peut comprendre au moins une première amorce inverse comprenant, de l'extrémité 5' vers l'extrémité 3', - un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou - un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Par « une partie de celui-ci » est voulu dire au moins 10, 15 ou 20 nucléotides. Dans un premier mode de réalisation, le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins seconde amorce inverse comprend, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 5' et chevauchant une partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, le kit comprend la première amorce inverse et plusieurs secondes amorces inverses différent par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt. En effet, chaque deuxième amorce inverse est conçue pour être spécifique à une séquence d'intérêt différente. En particulier, si entre 2 et 1.000 séquences d'intérêt différentes sont considérés, 2 et 1.000 secondes amorces différentes inverse sont conçues, comprenant chacune un code-barres distinct à associer à chaque séquence d'intérêt, l'autre élément reste le même (par exemple, le site inverse d'amorçage ou une partie de celui-ci, le site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage).
Dans un deuxième mode de réalisation, l'au moins première amorce inverse comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance Chaouki MILED 53 10/04835 pour une première enzyme de restriction et un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre, à l'extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Bien que le kit puisse comprendre une première amorce inverse, le kit comprend de préférence plusieurs premières amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt, les autres éléments restant les mêmes (c.-à-d., si présent, le site inverse d'amorçage, le module de courbure, le site de reconnaissance pour la deuxième enzyme de restriction, le site sens d'amorçage ou une partie de celui-ci, le site universel d'amorçage).
Selon le premier ou deuxième mode de réalisation, le kit peut en outre, comprendre une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou plusieurs amorces sens, chacune comprend au moins 10 nucléotides de l'extrémité 5' d'une séquence d'intérêt différente. Dans un troisième mode de réalisation, l'au moins première amorce inverse comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction et un site universel d'amorçage. En conséquence, le kit peut comprendre une première amorce inverse. Dans ce mode de réalisation, le kit peut en outre, comprendre une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. De préférence, le kit comprend en outre plusieurs amorces sens, différentes par leurs séquences de code-barres et par au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. Selon le premier, deuxième ou troisième mode de réalisation, le kit peut en outre, comprendre au moins une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En particulier, le kit peut en outre, comprendre plusieurs amorces inverses comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' d'un des différentes séquences d'intérêt. Dans un mode de réalisation particulier, le kit comprend au moins une amorce sens pour Chaouki MILED 54 10/04835 chaque séquence d'intérêt à être séquencée, comprenant, de son extrémité 5' vers son extrémité 3': a) un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de 5 reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou b) un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de 10 restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou c) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou d) un site inverse d'amorçage, un module de courbure en option attaché à la biotine et 15 comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En option, le kit peut aussi comprendre le(s) amorce(s) inverse(s) appropriée(s) ou associée(s). En particulier, le kit peut inclure une amorce inverse spécifique à l'extrémité 3' de la séquence d'intérêt pour les amorces sens du type a) et b) ; ou une amorce inverse comprenant, de 20 son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt pour les amorces sens du type c) et d). Le kit peut comprendre une amorce sens et son amorce inverse associée. Cependant, de préférence, le kit comprend plusieurs amorces sens et amorces inverses associées en option, 25 chacune conçue pour être spécifique à une séquence d'intérêt différente. Les amorces sens et inverses différentes entre elles par leur séquence de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt spécifique, les autres éléments (par exemple, le site sens d'amorçage, le site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage, le module de courbure et le site de reconnaissance pour la 30 première enzyme de restriction restant les mêmes). Dans un autre mode de réalisation particulier, le kit comprend au moins une amorce inverse pour chaque séquence d'intérêt à être séquencée, comprenant, de son extrémité 5' vers son extrémité 3', a) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de Chaouki MILED 55 10/04835 restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou b) un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou c) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou d) un site sens d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides spécifiques à l'extrémité 3' de la séquence d' intérêt.
En option, le kit peut aussi comprendre les amorce(s) sens appropriée(s) ou associée(s). En particulier, le kit peut inclure une amorce sens spécifique de l'extrémité 5' de la séquence d'intérêt pour les amorces inverses du type a) et b) ; ou une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt pour les amorces inverses du type c) et d). Le kit peut comprendre une amorce inverse et son amorce sens associée. Cependant, de préférence, le kit comprend plusieurs amorces inverses et en option les amorces sens associées, chacune conçue pour être spécifique à une séquence d'intérêt différente. Les amorces sens et inverse différentes entre elles par leur séquence de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt spécifique, les autres éléments (par exemple, si présent, le site sens d'amorçage, le site de reconnaissance pour la première, deuxième, troisième et quatrième enzyme de restriction, le site inverse d'amorçage et le module de courbure restant les mêmes).
Dans un mode de réalisation préféré du kit, la première amorce sens ou la première amorce inverse comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction. De préférence, le module de courbure est attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine. En particulier, le module de courbure peut être comme détaillé ci-dessous. De préférence, il comprend ou consiste en, une Chaouki MILED 56 10/04835 séquence sélectionnée parmi le groupe de séquences SEQ ID No. 1 et SEQ ID No. 2.
En plus des amorces, les kits peuvent aussi inclure les moyens appropriés permettant de réaliser l'amplification, en particulier la PCR ou la RT-PCR , tel que la polymérase et les réactifs 5 nécessaires comprenant les tampons appropriés, les nucléotides et autres. Les kits peuvent aussi comprendre des billes ou des supports solides soutenant les deuxièmes membres des paires se liant par affinité. Dans un mode de réalisation préféré, les avidines ou les streptavidines sont liés aux billes ou aux supports solides.
10 Les kits peuvent aussi comprendre une ou plusieurs des enzymes de restriction nécessaires pour appliquer la méthode, en particulier les première, seconde, troisième et quatrième enzymes de restriction. De préférence, le kit peut inclure au moins les premières et deuxièmes enzymes de restriction. En outre, le kit peut inclure la troisième enzyme de restriction. Il peut en outre, inclure la quatrième enzyme de restriction. 15 Tous les dispositifs particuliers détaillés pour la méthode décrite ci-dessus peuvent aussi être envisagés pour les kits.
Dans un autre mode de réalisation particulier, les molécules circulaires d'acide nucléique 20 obtenues dans l'étape b) de la méthode peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre
- lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la méthode, et 25 - des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3' - un premier site de restriction pour une première enzyme de restriction, ou - une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement, 30 - un site inverse d'amorçage, - un deuxième site de restriction pour une deuxième enzyme de restriction, - un site sens d'amorçage, ou - des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3' - un site inverse d'amorçage, Chaouki M1LED 57 10/04835 - un deuxième site de restriction pour une deuxième enzyme de restriction, - un site sens d'amorçage, - une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou 5 partiellement, - un premier site de restriction pour une première enzyme de restriction.
L'ADN à traiter peut être aussi un ensemble d'un mix de plusieurs séquences d'acide nucléique de séquences différentes. L'acide nucléique peut être un ensemble de gènes ou un 10 ensemble de ADNc, ou une région chromosomique, ou un génome entier. Ce mix d'acide nucléique est clivé. De préférence, le clivage est effectué par l'utilisation d'une technique de clivage indépendamment de la séquence (SITC), comme la sonication. De préférence, les extrémités des molécules d'acide nucléique sont réparées après chaque étape de clivage ou de digestion et/ou chaque étape de circularisation. La réparation peut comporter la reconstitution des 15 extrémités et/ou la phosphorylation des extrémités. La restauration et la phosphorylation peuvent être réalisées par n'importe quelle méthode connue par une personne qualifiée. Par exemple, la restauration peut être réalisée en utilisant une ADN polymérase spécifique, tel que l'ADN polymérase T4, en présence de dNTP, et la phosphorylation peut être réalisée en utilisant une kinase d'ADN, telle que le polynucléotide kinase T4, en présence d'ATP. L'ensemble d'un mix de 20 plusieurs séquences d'acide nucléique modifié à son extrémité en ajoutant des nucléotides aux extrémités d'ADN par la Transférase Terminale qui catalyse l'addition de nucléotides, de préférence les ddNTP, aux extrémités 3' de l'ADN, de préférence le ddTTP.
L'ensemble d'un mix de plusieurs séquences d'acide nucléique modifié à son extrémité avec 25 le ddTTP est ligaturé avec l'ADN ligase T4 en présence d'ATP avec des molécules linéaires d'acide nucléique de polynucléotide double-brin modifiées à leurs extrémités et conçu, ci-dessus.
Les molécules linéaires d'acide nucléique de polynucléotide double brin est modifié à son extrémité en ajoutant les nucléotides aux extrémités d'ADN par la Transférase Terminale qui 30 catalyse l'addition de nucléotides aux 3' terminaux de l'ADN, de préférence le ddATP.
Un code-barres doit être associé à chaque séquence de l'ensemble d'un mix de plusieurs séquences d'acide nucléique de « n » différentes séquences, « n » est située de 1 à 1000. Puis, une bibliothèque peut être préparée à partir de l'association d'un code barre à chaque séquence de Chaouki MILED 58 10/04835 l'ensemble d'un mix de plusieurs séquences d'acide nucléique par la méthode décrite ci-dessus, ce qui permet de fournir une bibliothèque de fragments de l'ensemble d'un mix de plusieurs séquences d'acide nucléique associé à un même code-barres.
Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comportent la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique à une de son extrémité (par exemple, la Fig la, la Fig 1 d, la Fig 1g et la Fig 1h) et la méthode comporte d'avantage une étape a') de clivage des molécules d'acide nucléique, après l'étape a) et avant l'étape b), en fournissant de ce fait une séquence tronquée de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique. De préférence, le clivage est effectué par l'utilisation d'une technique de clivage indépendamment de la séquence (SITC), comme la sonication. En particulier, si la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique est à l'extrémité 3' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig la et Fig 1h), les molécules d'acide nucléique obtenues présentent une séquence 3' tronquée de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique. Alternativement, si la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique est à l'extrémité 5' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig 1d et Fig 1g), les molécules d'acide nucléique obtenues sont tronquées en 5' des séquences de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique. Les molécules clivées peuvent être séparées par électrophorèse et les molécules de la taille souhaitée peuvent être purifiées sur gel d'électrophorèse.
Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) ne comportent pas la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique à l'une de son extrémité mais comportent un site de reconnaissance pour une quatrième enzyme de restriction située à l'extrémité de la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique qui est l'opposé de l'extrémité adjacente du code-barres. Dans ce mode de réalisation, la méthode comporte d'avantage après l'étape e), f) digestion des molécules circulaires d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction, ce qui permet d'obtenir des molécules linéaires d'acide nucléique comportant l'extrémité non tronquée de la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique à une de son extrémité ; g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique, ce qui Chaouki MILED 59 10/04835 permet d'obtenir des molécules linéaires d'acide nucléique comportant la séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique tronqué en 5'et 3'. Des molécules clivées peuvent être séparées par électrophorèse et des molécules de la taille souhaitée peuvent être purifiées sur gel d'électrophorèse.
La méthode d'invention peut en outre, comporter une étape h) de circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intramoléculaire. Cette ligation peut être effectuée tel que décrit ci-dessus. Selon la structure des molécules d'acide nucléique fournie dans l'étape a), les molécules 10 circulaires obtenues à partir de l'étape h) comprennent, dans la direction 5' à 3' - un site sens d'amorçage, une séquence de code-barres, une séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique tronquée en 3' et 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage et un module de courbure comportant un site de reconnaissance pour une deuxième enzyme de 15 restriction, ou - un site sens d'amorçage, une séquence de chaque séquence d'un ensemble d'un mix de séquence d'acide nucléique tronquée en 3' et 5', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comportant un site de reconnaissance pour une deuxième enzyme de restriction, ou 20 - un site sens d'amorçage, une séquence d'intérêt tronquée en 5'et 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comportant un site de reconnaissance pour une deuxième enzyme de restriction.
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) sont 25 attachées à un premier membre d'une paire se liant par affinité et la méthode comprend en outre, une ou plusieurs étapes de fixation des molécules d'acide nucléique sur un support solide par le biais d'interaction entre le premier membre d'affinité de la paire de liaison attaché auxdites molécules d'acide nucléique et les deuxièmes membres de ladite paire se liant par affinité liées au support solide. Les supports solides utiles incluent n'importe quelle surface rigide ou semi-rigide 30 sur laquelle un membre d'une paire se liant par affinité peut être lié. Le support peut être tout matériel poreux ou non poreux insoluble dans l'eau, y compris, sans limitation, membranes, filtres, puces, billes magnétiques ou non magnétiques, et polymères. De préférence, le support solide est choisi parmi les membranes et les billes basées sur la silice. De préférence, le support solide est des billes et plus en particulier des billes de polystyrène. Ces billes peuvent avoir un Chaouki MILED 60 10/04835 diamètre de 1 à 10 micromètres. Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont attachées à la biotine et sont liées à un support solide, des billes de préférence magnétiques, revêtue de streptavidine. Des molécules d'acide nucléique peuvent être liées à un support solide avant qu'une étape de circularisation par ligation infra- moléculaire afin d'empêcher des événements inter-moléculaires ou avant que chaque changement de mélange de réaction afin de faciliter la récupération des molécules d'acide nucléique. La quantité du support solide peut être facilement ajustée par une personne qualifiée selon la concentration des molécules d'acide nucléique.
Dans un mode de réalisation préféré, des molécules linéaires d'acide nucléique obtenues à partir de l'étape g) sont liées à un support solide avant la circularisation de l'étape h). Dans un autre mode de réalisation, des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) sont alors liées à un support solide.
Des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) peuvent être digérées par la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', - un site sens d'amorçage, une séquence de code-barres, des molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement tronquées en 5' et 3' et une séquence 20 inverse d'amorçage, ou - un site sens d'amorçage, des molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement tronquées en 5' et 3', une séquence de code-barres et une séquence inverse d'amorçage. Si les molécules d'acide nucléique comprennent un module de courbure comprenant le site 25 de reconnaissance pour la deuxième enzyme de restriction, les molécules d'acide nucléique obtenues par digestion avec la deuxième enzyme de restriction comprennent à chaque extrémité, une partie du module de courbure. De préférence, des molécules d'acide nucléique sont liées sur un support solide avant qu'elles soient digérées avec la deuxième enzyme de restriction. 30 Des molécules d'acide nucléique digérées avec la deuxième enzyme de restriction peuvent alors être amplifiées, par exemple par PCR ou par n'importe quelle autre méthode connue par une personne qualifiée. De préférence, les amorces utilisées pour cette amplification comprennent : - une amorce sens s'hybridant au site sens d'amorçage, et Chaouki MILED 61 10/0483 5 - une amorce inverse s'hybridant au site inverse d'amorçage. Le produit de cette amplification peut alors être séquencé en utilisant n'importe quelle plate-forme de séquençage à haut débit.
REFERENCES
Barany (1991) PCR Methods Appl, 1, 5-16 ; Blanco et al. (1989) J Biol Chem, 264, 8935-8940 ; Birkenmeyer (1985) Nucleic Acids Res, 13, 7107-7118 ; Cahill et al. (1991) Clin Chem, 37, 1482-1485 ; Chetverin et Spirin (1995) Prog Nucleic Acid Res Mol Biol, 51, 225-270 ; Collins and Weissman (1984) Proc Natl Acad Sci USA 81, 6812-6816 Compton, J. (1991) Nature, 350, 91-92 ; Fahy et al. (1991) PCR Methods Appl, 1, 25-33 ; Fullwood et al., Genome Res. 2009. 19 : 521-532 ; Katanaevet al. (1995) Febs Lett, 359, 89-92 ; Kitchin et al., (1986) J Biol Chem, 25, 11302-11309 ; Landegren et al. (1988) Science, 241, 1077-1080; Lizardi et al. (1998) Nat Genet, 19, 225-232; Mamanova et al., (2010) Nature Method, 7, 111-118; Notomi et al. (2000) Nucleic Acids Res, 28, E63; Ulanovsky et al. (1986) PNAS, 83, 862-866 ; Walker et al. (1992) Nucleic Acids Res, 20, 1691-1696 ; En résumé, ladite méthode permet de préparer une bibliothèque d'acide nucléique, de 25 préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend:
a) - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circularisée et dans la direction 5' vers 3' 30 - une séquence à être séquencée entièrement ou partiellement - un site inverse d'amorçage, - un site sens d'amorçage, - une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique, qui est placée entre le site sens d'amorçage et la 35 séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et - deux sites de reconnaissance pour deux enzymes de restriction différentes : - un premier site de restriction pour une première enzyme de Chaouki MILED C2 10/04835 restriction qui est placée entre la séquence de code-barres et la séquence d'intérêt, et - un deuxième site de restriction pour une deuxième enzyme de restriction qui est placée entre le site inverse d'amorçage et le site sens 5 d'amorçage ; b) circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire ; c) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ; 10 d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et e) circularisation desdites molécules d'acide nucléique clivées obtenues à partir de l'étape d) par ligation intra-moléculaire, ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans 15 la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site d'amorçage inverse.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur 20 forme circularisée et dans la direction 5' vers 3', une séquence d' intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, 25 un site de reconnaissance pour une troisième enzyme de restriction placée en amont du site inverse d'amorçage, ladite enzyme ayant un site de restriction dudit site de clivage dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) est réalisé par digestion avec ladite troisième enzyme de restriction.
30 Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en amont du site inverse d'amorçage et caractérisée en ce que la méthode comprend en outre après l'étape e) : f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse Chaouki MILED 63 10/04835 d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de 5 l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3' .
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une 10 séquence de code-barres et une séquence d'intérêt.
La méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site 15 inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens 20 d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site d'amorçage inverse.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placée en aval du site sens 25 d'amorçage, ladite enzyme ayant un site de restriction en aval dudit site de reconnaissance dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) est réalisé par digestion avec ladite troisième enzyme de restriction.
Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de 30 reconnaissance pour une quatrième enzyme de restriction placée en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) : f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et Chaouki MILED 64 10/04835 g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site 5 inverse d'amorçage et un site sens d'amorçage.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence de code-barres, un site inverse et un site sens d'amorçage. 10 La méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse et un site sens 15 d'amorçage.
La méthode comprend en outre l'étape h) de circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
20 Les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité.
La méthode comprend en outre une ou plusieurs étapes de liaison des molécules d'acide 25 nucléique sur un support solide par l'interaction entre le premier membre de la paire se liant par affinité liée auxdites molécules d'acide nucléique et les seconds membres de la paire se liant par affinité liée au support solide, en particulier avant l'étape de circularisation.
La méthode comprend en outre l'étape de liaison des molécules d'acide nucléique 30 obtenues à partir de l'étape g) avant de réaliser l'étape h) de circularisation.
La méthode comprend en outre l'étape de digestion des molécules circularisées d'acide nucléique avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site sens Chaouki MILED 65 10/04835 d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage.
La méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites d'amorçage inverse et sens.
Les étapes de clivage des molécules d'acide nucléique sont réalisées en utilisant une 10 technique de clivage indépendamment de la séquence.
La technique de clivage indépendamment de la séquence est la sonication.
La troisième enzyme de restriction est choisie dans le groupe EcoP15I, Mmel, NmeAII, 15 Acul, Bbvl, BceAI, Bpml, BpuEI, BseRI, Bsgl, BsmFI, BtgZI, Ecil, Fokl, Hgal, I-Ceul, I-Scel, Pi-Pspl et PI-Scel.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, une séquence d'au moins 15 paires de base qui a moins de 80% d'identité avec le génome de la 20 séquence d'intérêt et qui est placé entre la séquence d'intérêt et l'élément en amont de ladite séquence d'intérêt ou entre la séquence d'intérêt et l'élément en aval de ladite séquence d'intérêt.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse 25 d'amorçage et le site sens d'amorçage.
Ledit module de courbure comprend un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché au premier membre d'une paire se liant par affinité.
30 Ledit module de courbure comprend ou consiste en, une séquence sélectionnée parmi le groupe consistant en, les séquences SEQ ID No. 1 et SEQ ID No. 2.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) ont été obtenues par une ou plusieurs réactions d'amplification d'ADN.
Chaouki MILED 66 10/04835 Lesdites réactions d'amplification d'ADN sont suivies de l'étape de dégradation de l'excès des amorces simple brin.
La méthode comprend en outre l'étape de restauration et/ou de phosphorylation de chacune des extrémités des molécules d'acide nucléique après une étape de clivage et/ou avant une étape de circularisation.
La méthode comprend en outre l'étape de dégradation des molécules non-circularisées 10 d'acide nucléique avec une endonucléase spécifique des molécules linéaires d'acide nucléique après une étape de circularisation.
Les molécules d'acide nucléique obtenues à partir de l'étape h) ont une longueur de 156 bp ou une longueur de 156 bp plus un multiple de 21 bp.
Une pluralité d'ensembles de molécules linéaires d'acide nucléique est fournie dans l'étape La bibliothèque d'acide nucléique obtenue à partir de la méthode. 20 Le kit comprend au moins une première amorce sens comprenant, de son extrémité 5' vers son extrémité 3', - un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou 25 - un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'.
Le kit comprend en outre au moins une seconde amorce sens comprenant, de son 30 extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. 15 a).
Chaouki MILED 67 10/04835 Le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 3' et chevauchant la partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
Le kit comprend une amorce sens et plusieurs secondes amorces sens différentes par leurs séquences des code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. La première amorce sens du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
15 La première amorce sens du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
La première amorce sens du kit comprend en outre, à l'extrémité 5', le site de 20 reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Le kit comprend plusieurs premières amorces sens différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence 25 d'intérêt.
Le kit comprend en outre une amorce inverse comprenant au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou plusieurs amorces inverse, chacune comprenant au moins 10 nucléotides de l'extrémité 3' d'une séquence d'intérêt différente. La première amorce sens du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. 30 Chaouki M1LED C8 10/04835 La première amorce sens du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage. Le kit comprend une première amorce sens.
Le kit comprend en outre une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme 10 de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces inverse, différentes par leurs séquences de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
15 Le kit comprend en outre au moins une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces sens comprenant, de son extrémité 5' vers son 20 extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' d'une des différentes séquences d'intérêt.
Le kit comprend au moins une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', 25 - un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou - un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'. 30 Le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de5 Chaouki MILED 69 10/04835 restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
Le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
Le kit comprend une première amorce inverse et plusieurs secondes amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
La première amorce inverse du kit comprend en outre, à son extrémité 3', une séquence de 15 code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce inverse du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site 20 universel d'amorçage.
La première amorce inverse du kit comprend en outre, à l'extrémité 5', le site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Le kit comprend plusieurs premières amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
30 Le kit comprend en outre une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou plusieurs amorces sens, chacune comprend au moins 10 nucléotides de l'extrémité 5' d'une séquence d'intérêt différente. 25 La première amorce inverse du kit comprend en outre à son extrémité 3' un site de Chaouki MILED 70 10/04835 reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce inverse du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage.
Le kit comprend une première amorce inverse. Le kit comprend en outre une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
15 Le kit comprend en outre plusieurs amorces sens, différentes par leurs séquences de code-barres et par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre au moins une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' 20 de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces inverses comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' d'un des différentes séquences d'intérêt. La première amorce sens ou la première amorce inverse du kit comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction.
Le module de courbure du kit est attaché à un premier membre d'une paire se liant par 30 affinité, de préférence la biotine.
Le module de courbure du kit comprend ou consiste en, une séquence sélectionnée parmi le groupe consistant en, les séquences SEQ ID No. 1 et SEQ ID No. 2. 25 Chaouki MILED 71 10/04835 Le kit comprend en outre des billes ou des supports solides portant les seconds membres de paire se liant par affinité, de préférence l'avidine ou la streptavidine.
Le kit comprend en outre une ou plusieurs enzymes de restriction sélectionnées dans le 5 groupe consistant en, la première, deuxième, troisième et quatrième enzymes de restrictions.
Dans un autre mode de réalisation particulier, les molécules circulaires d'acide nucléique obtenues dans l'étape b) de la méthode peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre 10 - lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la méthode, et - des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3' - un premier site de restriction pour une première enzyme de restriction, 15 - une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement, - un site inverse d'amorçage, - un deuxième site de restriction pour une deuxième enzyme de restriction, - un site sens d'amorçage, ou - des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3' - un site inverse d'amorçage, - un deuxième site de restriction pour une deuxième enzyme de restriction, - un site sens d'amorçage, - une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement, - un premier site de restriction pour une première enzyme de restriction.
30 La bibliothèque d'acide nucléique obtenue à partir de la méthode.
Le kit comprend en outre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique permettant de favoriser la ligation inter-moléculaire décrite dans le mode de réalisation précèdent. 20 25 35 Chaouki MILED 72 10/04835
Claims (25)
- REVENDICATIONS1. Une méthode pour préparer une bibliothèque d'acide REVENDICATIONS1. Une méthode pour préparer une bibliothèque d'acide nucléique, de préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend: a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circularisée et dans la direction 5' vers 3' - une séquence à être séquencée entièrement ou partiellement - un site inverse d'amorçage, - un site sens d'amorçage, - une séquence de code-barres spécifique à chaque ensemble de molécules d'acide nucléique, qui est placée entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et - deux sites de reconnaissance pour deux enzymes de restriction différentes : - un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et - un deuxième site de restriction pour une deuxième enzyme de restriction qui est placée entre le site inverse d'amorçage et le site sens 20 d'amorçage ; b) circularisation desdites molécules linéaires d'acide nucléique par ligation intramoléculaire ; c) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ; 25 d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et e) circularisation desdites molécules d'acide nucléique clivées obtenues à partir de l'étape d) par ligation intra-moléculaire, ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans 30 la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage. Chaouki MILED 73 10/04835
- 2. La méthode selon la revendication 1, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt. 5
- 3. La méthode selon la revendication 2, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placée en amont du site inverse d'amorçage, ladite enzyme ayant un site de clivage en amont du site de reconnaissance dans la séquence d'intérêt, et 10 caractérisée en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
- 4. La méthode selon la revendication 2 ou 3, caractérisée en ce que les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une 15 quatrième enzyme de restriction placée en amont du site inverse d'amorçage et caractérisée en ce que la méthode comprend en outre après l'étape e) : f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'; et h) en option, une circularisation des molécules d'acide nucléique obtenues à partir de 25 l'étape g) par ligation intra-moléculaire.
- 5. La méthode selon la revendication 2 ou 3, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence 30 d'intérêt, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'.Chaouki MILED 74 10/04835
- 6. La méthode selon la revendication 1, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage.
- 7. La méthode selon la revendication 6, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en aval du site sens d'amorçage, ladite enzyme ayant un site de clivage en aval dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
- 8. La méthode selon la revendication 7, caractérisée en ce que les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) : f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage ; et h) en option circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) 25 par ligation intra-moléculaire.
- 9. La méthode selon la revendication 7, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens 30 d'amorçage, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage.Chaouki MILED 75 10/04835
- 10. La méthode selon l'une quelconque des revendications 1 à 9, caractérisée en ce que les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité, et la méthode comprend en outre, une ou plusieurs étapes de liaison des molécules d'acide nucléique sur un support solide par l'interaction entre le premier membre d'une paire se liant par affinité attaché auxdites molécules d'acide nucléique et les seconds membres desdites paires se liant par affinité liées au support solide, en particulier avant une étape de circularisation.
- 11. La méthode selon l'une quelconque des revendications 1 à 10, caractérisée en ce que la méthode comprend en outre l'étape de digestion des molécules d'acide nucléique circularisées avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site sens d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site d'amorçage inverse.
- 12. La méthode selon la revendication 11, caractérisée en ce que la méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées à partir desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites d'amorçage inverse et sens.
- 13. La méthode selon l'une quelconque des revendications 1 à 12, caractérisée en ce que 25 les étapes de clivage des molécules d'acide nucléique sont réalisées en utilisant une technique de clivage indépendamment de la séquence, de préférence par sonication.
- 14. La méthode selon l'une quelconque des revendications 1 à 13, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site 30 universel d'amorçage en amont ou en aval de la séquence d'intérêt.
- 15. La méthode selon l'une quelconque des revendications 1 à 14, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse d'amorçage etChaouki MILED 76 10/04835 le site sens d'amorçage, et qui est attaché au premier membre d'une paire se liant par affinité, de préférence un module de courbure comprenant, ou consistant en, une séquence sélectionnée parmi les séquences SEQ ID No. 1 et SEQ ID No. 2.
- 16. Une bibliothèque d'acide nucléique obtenue à partir de la méthode selon l'une quelconque des revendications 1 à 15.
- 17. Un kit comprenant au moins une première amorce sens permettant d'obtenir les molécules d'acide nucléique fournies à l'étape a) de la méthode selon l'une quelconque des revendications 1 à 12, ladite première amorce sens comprend, de son extrémité 5' vers son extrémité 3', - un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou - un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'.
- 18. Le kit selon la revendication 17, caractérisée en ce que le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci incluant son extrémité 3' et chevauchant la partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
- 19. Le kit selon la revendication 17, caractérisée en ce que l'au moins première amorce sens comprend en outre, à son extrémité 3', soit - une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et soit au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage, et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou - un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.Chaouki MILED 77 10/04835
- 20. Un kit comprenant au moins une première amorce inverse permettant d'obtenir les molécules d'acide nucléique fournies à l'étape a) de la méthode selon l'une quelconque des revendications 1 à 12, ladite première amorce inverse comprend, de son extrémité 5' vers son extrémité 3', - un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou - un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
- 21. Le kit selon la revendication 20, caractérisé en ce que le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
- 22. Le kit selon la revendication 20, caractérisé en ce que l'au moins première amorce 20 inverse comprend en outre, à son extrémité 3', soit - une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou 25 - un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
- 23. Le kit selon l'une quelconque des revendications 17 à 22, caractérisée en ce que la 30 première amorce sens ou la première amorce inverse comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction et, attaché à un premier membre d'une paire se liant par affinité, telle qu'une biotine, de préférence un module de courbure comprenant ou consistant en la séquence sélectionnée parmi le groupe consistant en SEQ ID No. 1 et SEQ ID No. 2.Chaouki MILED 78 10/04835
- 24. Un kit selon l'une quelconque des revendications 17 à 23, caractérisé en ce que les molécules circulaires d'acide nucléique obtenues dans l'étape b) de la revendication 1 peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre - lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la revendication 1, et - des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3' - un premier site de restriction pour une première enzyme de restriction, - une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement, - un site inverse d'amorçage, - un deuxième site de restriction pour une deuxième enzyme de restriction, - un site sens d'amorçage, ou - des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3' - un site inverse d'amorçage, - un deuxième site de restriction pour une deuxième enzyme de restriction, - un site sens d'amorçage, - une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement, - un premier site de restriction pour une première enzyme de restriction. 25
- 25. Une bibliothèque d'acide nucléique obtenue par une méthode mettant en oeuvre le kit selon l'une quelconque des revendications 17 à 24. 20
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1004835A FR2968671B1 (fr) | 2010-12-13 | 2010-12-13 | Sequencage maspet |
EP11805901.3A EP2652132A1 (fr) | 2010-12-13 | 2011-12-05 | Séquençage "multiplexed anchor scanning parallel end tag" |
US13/976,921 US20140148364A1 (en) | 2010-12-13 | 2011-12-05 | Multiplexed anchor scanning parallel end tag sequencing |
PCT/FR2011/000634 WO2012080591A1 (fr) | 2010-12-13 | 2011-12-05 | Séquençage "multiplexed anchor scanning parallel end tag" |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1004835A FR2968671B1 (fr) | 2010-12-13 | 2010-12-13 | Sequencage maspet |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2968671A1 true FR2968671A1 (fr) | 2012-06-15 |
FR2968671B1 FR2968671B1 (fr) | 2015-05-01 |
Family
ID=44546010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1004835A Expired - Fee Related FR2968671B1 (fr) | 2010-12-13 | 2010-12-13 | Sequencage maspet |
Country Status (4)
Country | Link |
---|---|
US (1) | US20140148364A1 (fr) |
EP (1) | EP2652132A1 (fr) |
FR (1) | FR2968671B1 (fr) |
WO (1) | WO2012080591A1 (fr) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013036929A1 (fr) * | 2011-09-09 | 2013-03-14 | The Board Of Trustees Of The Leland Stanford Junior | Procédés permettant d'obtenir une séquence |
US10689643B2 (en) | 2011-11-22 | 2020-06-23 | Active Motif, Inc. | Targeted transposition for use in epigenetic studies |
EP3712267A1 (fr) | 2013-05-22 | 2020-09-23 | Active Motif, Inc. | Transposition ciblée à utiliser dans les études épigénétiques |
US20180320166A1 (en) * | 2015-10-01 | 2018-11-08 | University Of Washington | Multiplex pairwise assembly of dna oligonucleotides |
KR101651817B1 (ko) * | 2015-10-28 | 2016-08-29 | 대한민국 | Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090181861A1 (en) * | 2008-01-09 | 2009-07-16 | Bin Li | Method of making a paired tag library for nucleic acid sequencing |
WO2010082815A1 (fr) * | 2009-01-13 | 2010-07-22 | Keygene N.V. | Nouvelles stratégies de séquençage du génome |
-
2010
- 2010-12-13 FR FR1004835A patent/FR2968671B1/fr not_active Expired - Fee Related
-
2011
- 2011-12-05 EP EP11805901.3A patent/EP2652132A1/fr not_active Withdrawn
- 2011-12-05 WO PCT/FR2011/000634 patent/WO2012080591A1/fr active Application Filing
- 2011-12-05 US US13/976,921 patent/US20140148364A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090181861A1 (en) * | 2008-01-09 | 2009-07-16 | Bin Li | Method of making a paired tag library for nucleic acid sequencing |
WO2010082815A1 (fr) * | 2009-01-13 | 2010-07-22 | Keygene N.V. | Nouvelles stratégies de séquençage du génome |
Non-Patent Citations (2)
Title |
---|
NG PATRICK ET AL: "Multiplex sequencing of paired-end ditags (MS-PET): a strategy for the ultra-high-throughput analysis of transcriptomes and genomes", NUCLEIC ACIDS RESEARCH, OXFORD UNIVERSITY PRESS, SURREY, GB, vol. 34, no. 12, 1 July 2006 (2006-07-01), pages E84, XP002475749, ISSN: 0305-1048 * |
WILHELM B T ET AL: "RNA-Seq-quantitative measurement of expression through massively parallel RNA-sequencing", METHODS : A COMPANION TO METHODS IN ENZYMOLOGY, ACADEMIC PRESS INC., NEW YORK, NY, US, vol. 48, no. 3, 1 July 2009 (2009-07-01), pages 249 - 257, XP026284846, ISSN: 1046-2023, [retrieved on 20090329], DOI: 10.1016/J.YMETH.2009.03.016 * |
Also Published As
Publication number | Publication date |
---|---|
FR2968671B1 (fr) | 2015-05-01 |
US20140148364A1 (en) | 2014-05-29 |
EP2652132A1 (fr) | 2013-10-23 |
WO2012080591A1 (fr) | 2012-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220162688A1 (en) | Enhanced Adaptor Ligation | |
EP3615671B1 (fr) | Compositions et procédés permettant d'améliorer l'identification d'échantillons dans des bibliothèques d'acides nucléiques indexés | |
US20240141332A1 (en) | Methods and compositions for preparing nucleic acid libraries | |
US9902994B2 (en) | Method for retaining even coverage of short insert libraries | |
EP2423325B1 (fr) | Procédé de préparation de bibliothèques de polynucléotides modèles | |
US9109222B2 (en) | Nucleic acid sample preparation methods and compositions | |
FR2968671A1 (fr) | Sequencage maspet | |
US20220162660A1 (en) | Methods and compositions for nucleic acid amplification | |
US20230257805A1 (en) | Methods for ligation-coupled-pcr | |
US11761033B2 (en) | Methods to amplify highly uniform and less error prone nucleic acid libraries | |
US20240271126A1 (en) | Oligo-modified nucleotide analogues for nucleic acid preparation | |
CN114929895A (zh) | 用于制备多核苷酸分子文库的方法 | |
KR102718574B1 (ko) | 핵산 라이브러리를 제조하기 위한 방법 및 조성물 | |
CN117062910A (zh) | 改进的文库制备方法 | |
WO2024215891A1 (fr) | Procédés de marquage d'acides nucléiques | |
FR2883885A1 (fr) | Recombinaison in vitro circulaire |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 6 |
|
ST | Notification of lapse |
Effective date: 20170831 |