EP2652132A1 - Séquençage "multiplexed anchor scanning parallel end tag" - Google Patents

Séquençage "multiplexed anchor scanning parallel end tag"

Info

Publication number
EP2652132A1
EP2652132A1 EP11805901.3A EP11805901A EP2652132A1 EP 2652132 A1 EP2652132 A1 EP 2652132A1 EP 11805901 A EP11805901 A EP 11805901A EP 2652132 A1 EP2652132 A1 EP 2652132A1
Authority
EP
European Patent Office
Prior art keywords
site
sequence
nucleic acid
priming
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP11805901.3A
Other languages
German (de)
English (en)
Inventor
Chaouki Miled
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miled Chaouki
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of EP2652132A1 publication Critical patent/EP2652132A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Definitions

  • the present invention relates to the field of DNA sequencing and more particularly to the field of library preparation for sequencing.
  • NGS Next Generation DNA Sequencing
  • 454 Genome Sequencer Roche Applied Science
  • Illumina Genome Analyzer Illumina, Inc.
  • SOLiD TM platform Applied Biosystems
  • All of these platforms are based on sequencing by synthesis, a series of periodic extensions of a DNA molecule using primers made by a polymerase or a ligase.
  • the sequencing process is composed of alternating cycles of extension (or hybridization-chemical ligation) by the enzymes and data acquisition.
  • NGS sequencing are usually prepared by random fragmentation of DNA followed by in vitro ligation of common adapters.
  • the sequencing substrates are amplified with PCR primers and immobilized on a solid surface or other support.
  • NGS platforms have low costs because they can simultaneously decode millions of distinct sequences on a two-dimensional slide. Indeed, all sequencing devices immobilized on the slides can be treated enzymatically by a single volume of reagent and the cost of this reagent is amortized over the entire complete sequencing device.
  • multiplexing methods have been developed. Barcode adapters are ligated to each library and several barcode libraries can be pooled to be sequenced in a single reaction. Nevertheless, the preparation of several libraries requires time and money. Indeed, library preparation takes about a week of work.
  • PET paired-end tag
  • the present invention relates to a method and a kit for preparing a nucleic acid library, preferably a DNA library, for sequencing, characterized in that said method comprises:
  • each nucleic acid molecule comprising in its circular form in the 5 'to 3' direction
  • step b) circularization of said linear nucleic acid molecules by intramolecular ligation; c) digesting said circularized nucleic acid molecules obtained from step b) with the first restriction enzyme;
  • the linear nucleic acid molecules provided in step a) comprise in their circularized form and in the 5 'to 3' direction, a sequence of interest, a reverse priming site, a initiation sense site and a barcode sequence placed between the priming sense site and the sequence of interest.
  • the linear nucleic acid molecules provided in step a) further comprise a recognition site for a third restriction enzyme placed upstream of the reverse priming site, said enzyme having a site. of cleavage upstream in the sequence of interest, and characterized in that the cleavage of step d) of claim 1 is carried out by digestion with said third restriction enzyme.
  • the nucleic acid molecules provided in step a) further comprise a recognition site for a fourth restriction enzyme placed upstream of the reverse priming site and characterized in that the method includes after step e):
  • step e) digesting the circularized nucleic acid molecules obtained from step e) with the fourth restriction enzyme having a cleavage site placed between the reverse priming site and the sequence of interest for said circularized molecules of the step e);
  • step f) cleaving the digested nucleic acid molecules obtained from step f) into the sequence of interest, thereby providing linear nucleic acid molecules comprising from 5 'to 3' end, a reverse boot site, a seed sense site, a barcode sequence, and a 3 'truncated interest sequence;
  • step h) optionally, circularizing the nucleic acid molecules obtained from step g) by intramolecular ligation.
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a reverse priming site, a priming sense site, a barcode sequence and a sequence of interest
  • the method further comprises, after step a) and before step b), the step of cleaving the linear nucleic acid molecules provided in step a), thereby providing linear nucleic acid molecules comprising the 'to the end 3', a reverse boot site, a seed sense site, a bar code sequence, and a 3 'truncated interest sequence.
  • the linear nucleic acid molecules provided in step a) comprise in their circularized form and in the 5 'to 3' direction, a reverse priming site, a priming sense site, a sequence of interest and a barcode sequence placed between the sequence of interest and the reverse boot site.
  • the linear nucleic acid molecules provided in step a) further comprise a recognition site for a third restriction enzyme located downstream of the priming sense site, said enzyme having a downstream restriction site.
  • the nucleic acid molecules provided in step a) further comprise a recognition site for a fourth restriction enzyme located downstream of the priming sense site, and characterized in that the method further comprises after step e):
  • step f) digesting the circularized nucleic acid molecules obtained from step e) with the fourth restriction enzyme having a cleavage site placed between the priming sense site and the sequence of interest for said circularized molecules;
  • step f) cleaving the digested nucleic acid molecules obtained from step f) into the sequence of interest, thereby providing linear nucleic acid molecules comprising from the 5 'to the 3' end, a 5 'truncated sequence of interest, a barcode sequence, a reverse boot site and a boot sense site;
  • step h) optionally, circularization of the nucleic acid molecules obtained from step g) by intra-molecular ligation.
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'to 3' end, a sequence of interest, a barcode sequence, a reverse priming site, and a sense-of-initiation site
  • the method further comprises, after step a) and before step b), the step of cleaving the linear nucleic acid molecules provided in step a), which provides linear nucleic acid molecules comprising 5 'to 3' end, 5 'truncated sequence of interest, barcode sequence, reverse site boot and a boot sense site.
  • the nucleic acid molecules provided in step a) comprise a binding site for a first member of an affinity binding pair or is attached to a first member of an affinity binding pair, and the method further comprises one or more steps of binding the nucleic acid molecules to a solid support by the interaction between the first member of an affinity binding pair attached to these nucleic acid molecules and members of said second affinity binding pair bound to the solid support, particularly before the circularization step.
  • the method further comprises the step of digesting the circularized nucleic acid molecules with the second restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'end to the end 3 ', an initiation sense site, a truncated interest sequence, a reverse priming site, and a barcode sequence which is between the initiation sense site and the sequence of interest or between the sequence of interest. interest and the reverse boot site. More preferably, the method further comprises the step of amplifying the truncated barcode sequences and truncated interest sequences of said linear nucleic acid molecules by using a pair of primers hybridizing on the reverse and sense sites. boot.
  • the cleavage steps of the nucleic acid molecules are performed using a cleavage technique regardless of the sequence, preferably by sonication.
  • the linear nucleic acid molecules provided in step a) further comprise a universal priming site upstream or downstream of the sequence of interest.
  • the linear nucleic acid molecules provided in step a) further comprise a curvature module which is placed, in their circularized form, between the reverse priming site and the priming sense site, and which is attached to a first member of an affinity binding pair, preferably a curvature module comprising or consisting of the sequence selected from the group consisting of SEQ ID No. 1 and SEQ ID No. 2.
  • the present invention relates to a nucleic acid library obtained from the method described above or from any intermediate product thereof.
  • the present invention relates to a kit comprising at least one forward primer comprising, from the 5 'end to the 3' end,
  • a reverse priming site a recognition site for a second restriction enzyme, and a priming sense site or a part thereof including its 5 'end;
  • the kit comprises at least one second sense primer comprising, from its 5 'end towards its end 3', a priming sense site or part of the 3 'end and overlapping part of the site. sense direction of the first sense primer, a bar code sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest or a universal site of boot.
  • the at least first sense primer further comprises, at its end 5 ', either
  • a barcode sequence a recognition site for a first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest or a universal priming site, and optionally, at its end 5 ', a recognition site for the third restriction enzyme
  • a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme at least 10 nucleotides of the 5 'end of the sequence of interest or a universal priming site.
  • the present invention relates alternately to a kit comprising at least a first inverse primer comprising, from the 5 'end to the 3' end,
  • a priming sense site a recognition site for a second restriction enzyme, and a reverse priming site or a part thereof including its 3 'end;
  • a priming sense site a curvature module comprising a recognition site for the second restriction enzyme, and a reverse priming site or a part thereof including its 3 'end.
  • the kit comprises at least a second reverse primer comprising, from its 5 'end towards its 3' end, a reverse priming site or part thereof including its 5 'end and overlapping the portion of the reverse boot site of the first reverse primer, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest or the universal priming site.
  • the at least first inverse primer also comprises, at its 3 'end, either
  • a barcode sequence a recognition site for a first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest or a universal priming site and optionally, at its end; a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme; or
  • a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme at least 10 nucleotides of the 3 'end of the sequence of interest or a universal priming site.
  • the first forward primer or first reverse primer of the kit comprises a curvature module comprising a recognition site for the second restriction enzyme and attached to a first member of an affinity binding pair, preferably biotin.
  • the curvature module comprises or consists of the sequence selected from the group of sequences SEQ ID No. 1 and SEQ ID No. 2.
  • the kit further comprises solid balls or supports supporting the second member. affinity binding pairs, preferably avidin or streptavidin.
  • Fig. 1 represents an embodiment of a method for preparing a nucleic acid library.
  • FR Meaning primer
  • RP Reverse primer
  • RS1 Restriction site 1
  • RS2 Restriction site 2
  • BC Barcode
  • SEQ nucleic acid sequence.
  • Fig. 2 shows an embodiment of a method for preparing a nucleic acid library comprising the use of the universal priming site.
  • UPS Universal Boot Site
  • CM Bend Module
  • FR Sense Primer
  • RP Reverse Primer
  • RS1 Restriction Site 1
  • RS2 Restriction Site 2
  • BC Barcode
  • SEQ nucleic acid sequence.
  • Fig. 3 shows an embodiment of a method for preparing a nucleic acid library including the use of the curvature module.
  • UPS Universal Boot Site
  • CM Curvature Module
  • FR Sense Primer
  • RP Reverse Primer
  • RS1 Restriction Site 1
  • RS2 Restriction Site 2
  • RS3 Restriction Site 3
  • RS4 Restriction Site 4
  • BC Barcode
  • SEQ nucleic acid sequence.
  • the inventor has developed a novel method for preparing a nucleic acid library and in particular a PET library for sequencing with next generation sequencing technologies.
  • This method is useful for simultaneously preparing a multitude of nucleic acid libraries for sequencing, each of these libraries is characterized by a specific barcode sequence.
  • several nucleic acid libraries can be simultaneously bar-coded and sequenced.
  • the method of the invention allows the simultaneous preparation of several barcode libraries by performing the step of preparing a single library.
  • the inventor provides means for introducing the barcode at the beginning of the library preparation method. Thus, the cost of sequencing is greatly reduced.
  • the sequencing library described above also has other technical advantages.
  • One of the greatest advantages is that the sequencing libraries prepared by the described method provide information about the structural arrangements of the sequences. Indeed, if a barcode is used for a particular sequence of interest, it is possible to deduce that two sequences (for example, indicative of a gene, an exon, or the like) are carried by the same acid. nucleic amplified and are therefore associated. Accordingly, the method as described allows the detection of translocation, deletion, inversion, duplication or insertion.
  • the method described above is suitable for the preparation of libraries for the simultaneous sequencing of a near-infinite number of regions of interest sequences derived from different samples (for example, a set of genes from different organisms, of the same nucleic acid but from different individuals or different nucleic acids derived from a single individual).
  • the method allows control of the size and orientation of the nucleic acids to be sequenced.
  • the method allows elimination or reduction of chimeric products and false positives resulting from non-specific ligations. Indeed, the method is based on the amplification and intra-molecular ligation or circularization steps, thereby avoiding the ligation steps used in the methods of the prior art and responsible for the disadvantages generating chimeric products.
  • the libraries provided by the method described above can be used on any NGS platform, such as: 454 Genome Sequencer (Roche Applied Science), Illumina Genome Analyzer (Illumina, Inc.) or the SOLiD platform TM (Applied Biosystems).
  • NGS platform such as: 454 Genome Sequencer (Roche Applied Science), Illumina Genome Analyzer (Illumina, Inc.) or the SOLiD platform TM (Applied Biosystems).
  • nucleic acid molecule refers to single-stranded and double-stranded polymers of nucleotide monomers, including DNA and RNA, linked by phosphodiester linkages.
  • the nucleic acid molecule may be linear or circular.
  • the nucleic acid molecules can be DNA molecules, RNA molecules or chimeric DNA-RNA molecules. They may also include nucleobase and sugar analogues.
  • nucleic acid molecule is used herein to refer to a linear or circular double-stranded DNA molecule.
  • nucleic acid library refers to a plurality of different single-stranded or double-stranded nucleic acid molecules, particularly DNA molecules. These molecules can be linear or circular.
  • the nucleic acid molecules of the library may or may not be covalently attached to a solid support such as beads and in particular streptavidin-coated beads or support.
  • upstream and downstream refer to a position of a discrete element on a nucleic acid molecule relative to another discrete element.
  • a first element is upstream to a second element when it is placed in the 5 'direction of the coding strand of said second element.
  • a first element is downstream to a second element when it is placed in the 3 'direction of the coding strand of said second element.
  • 5" and "3" end refer to the 3 'end and the 5' end of the coding strand.
  • adjacent refers to a position of a discrete element on a nucleic acid molecule relative to another discrete element. A first element is next to a second element once placed at the 5 'end or the 3' end of said second element. This limit indicates that no other element is present between the first and the second element.
  • adjacent means that the first and second elements are consecutive (i.e., there is no intervening nucleotide) or are separated by a non-significant number of nucleotides, preferably less than 20, 15, 10, 5 or 2 nucleotides.
  • primer refers to a polynucleotide of about 10-200 nucleotides in length.
  • the primer hybridizes with the target (or template) and provides an initiation point for template-directed synthesis of a polynucleotide complementary to the target catalyzed by an enzyme called polymerase such as a DNA polymerase (reaction chain amplification by polymerase).
  • PCR reactions are typically performed with a pair of primers: a sense primer (or upstream primer) and an inverse primer (or downstream primer) that delimits the region to be amplified.
  • restriction enzyme or “restriction endonuclease” is intended to refer to an enzyme that identifies a specific recognition site (or restriction site) on a single-stranded or double-stranded nucleic acid molecule and cleaves that molecule to a cleavage site.
  • RS refers to a specific nucleotide sequence recognized by a restriction enzyme.
  • cleavage site refers to a site in which the restriction enzyme cleaves the nucleic acid molecule. Restriction enzymes can recognize and cleave the nucleic acid molecule at the same site. Restriction enzymes may also cleave the nucleic acid molecule at a site remote from the recognition site. Depending on the restriction enzyme, the cleavage site may be placed downstream or upstream of the recognition site.
  • the term “intramolecular ligation” refers to the ligation of two ends of a linear molecule of nucleic acid.
  • the term “intermolecular ligation” refers to the ligation of the ends of two linear molecules of nucleic acid
  • the term “about” refers to a range of ⁇ 10% of the specific value. For example, “about 20” includes the ⁇ 10% of 20, and refers to 18 to 22. Preferably, the term “about” refers to a range of values ⁇ 5% of the specific value.
  • affinity binding pair refers to a system based on two members capable of association with each other, covalently or not, preferably non-covalently.
  • the first member may be biotin and the second member may be streptavidin or avidin.
  • Another example of an affinity binding pair is the digoxygenin and the anti-digoxigenin antibody.
  • Other affinity binding pairs are known in the art and are considered carefully here.
  • the term "circularized form of a linear molecule of nucleic acid” refers to the product obtained by intramolecular ligation of said molecule, i.e. the ligation of the 5 'end and the 3' end of said molecule. However, this term is not associated with the actual preparation of such a circularized form but is convenient for the description of the linear nucleic acid molecule.
  • the present invention relates to a method for preparing a nucleic acid library, particularly a nucleic acid library to be sequenced.
  • the library obtained by this method may be DNA or an RNA library, preferably a DNA library.
  • the method of the invention comprises (i) the step of providing a set or a plurality of sets of linear nucleic acid molecules comprising a sequence of interest to be fully or partially sequenced and a sequence of code- bars specific to each set of nucleic acid molecules and (ii) plural circularization, digestion and cleavage steps to provide a library characterized in that each set of nucleic acid molecules is associated with a specific barcode.
  • Each sequencing device provided by this library comprises a fragment of the sequence of interest and a barcode which will be sequenced simultaneously with said fragment.
  • the method comprises the step of: i) providing a plurality of sets of linear nucleic acid molecules comprising a sequence of interest to be sequenced in whole or in part and a barcode sequence specific to each set of nucleic acid molecules.
  • the method comprises the step of i) providing "n" sets of linear nucleic acid molecules comprising a sequence to be sequenced in whole or in part and a barcode sequence (specific to each set of molecules).
  • nucleic acid), "n” being an integer between 1 and 1000. Accordingly, different sequences of interest "n” can be simultaneously sequenced, each is associated with a distinct sequence of barcode. "N” is limited by the ability of the sequencers.
  • the first step of the method consists in (a) providing a set or a plurality of sets of linear nucleic acid molecules, each nucleic acid molecule comprising in its circularized form and in the 5 'to 3' direction
  • a second restriction site for a second restriction enzyme which is placed between the reverse priming site and the priming sense site.
  • the linear nucleic acid molecules provided in step a) may comprise from the 5 'end to the 3' end:
  • a reverse priming site a priming sense site, a barcode sequence and a sequence of interest (Fig. 1A); or
  • a priming sense site a barcode sequence, a sequence of interest and a reverse priming site (Fig. 1B); or
  • a sequence of interest a reverse priming site, a priming sense site and a barcode sequence (Fig. 1D); or
  • a reverse priming site a priming sense site, a sequence of interest and a barcode sequence (Fig. 1E); or
  • a priming sense site a sequence of interest, a barcode sequence and a reverse priming site (Fig. 1F); or
  • a sequence of interest a barcode sequence, a reverse priming site and a priming sense site (FIG. or
  • a barcode sequence a reverse priming site, a priming sense site, and a sequence of interest (Fig. 1H).
  • FIG. 1 It is the circularized form recapitulating the linear nucleic acids of FIG. 1A-D and FIG. 1J is the circularized form summarizing the linear nucleic acids of the Fig. 1E-H.
  • all nucleic acid molecules have the same conformation or arrangement of the different elements, i.e. one of the structures presented above.
  • the linear nucleic acid molecules provided in step a) are double-stranded DNA molecules.
  • the reverse priming site (RP) and the priming sense site (FP) are known and have predetermined sequences. These priming sites are used to amplify the sequencing devices using primers specific for these sites.
  • the primers used for the amplification reaction may be universal primers for sequencing.
  • the sequencing reverse primer hybridizes to the reverse priming site and the sequencing sense primer hybridizes to the priming sense site.
  • These priming sites can be easily designed by a skilled person based on sequencing technology and with the universal primers that are intended to be used.
  • the reverse boot site (RP) and the boot sense site (FP) are called:
  • the sequence of interest may be any nucleic acid sequence from about 25 base pairs (bp) to 15 kbp.
  • the main limitation for the length of the sequence of interest is related to the amplification limitation.
  • the sequence of interest may be a gene of interest or a segment thereof, or a chromosomal region of interest.
  • a barcode must be associated with a sequence of interest.
  • a library can be prepared from the association of a barcode with a sequence of interest by the method described above, thereby providing a library of fragments of the sequence of interest associated with the sequence of interest. same barcode.
  • the advantage of the present method is to prepare several libraries simultaneously, characterized in that each initial sequence of interest is associated with a specific (and different) barcode.
  • a barcode may be assigned to each individual or organism.
  • the gene can be sequenced simultaneously for several individuals or organisms.
  • a barcode can be assigned to each particular gene or chromosomal regions.
  • the barcode sequence is a nucleic acid sequence comprising from 5 to 15bp, preferably from 5 to 10bp. This barcode sequence is specific to each set of nucleic acid molecules. Preferably, this barcode sequence does not include any restriction site.
  • the barcode is always next to the sequence of interest either upstream of the sequence of interest, and in particular between the sense site of priming and the sequence of interest (Fig. II); or downstream
  • step a which means that the barcode sequence can be placed between the priming sense site and the sequence of interest (Fig. 1A and Fig. 1A). 1B), between the sequence of interest and the reverse priming site (Fig. 1F and Fig. 1G), upstream of the sequence of interest (Fig. 1C), downstream of the sequence of interest
  • the nucleic acid molecules provided in step a) may further comprise a universal priming site (UPS).
  • This universal boot site includes or consists of a
  • the universal priming site consists of 10 to 25 bp, preferably 15 to 20 bp.
  • Said sequence has less than 90% identity with the genome containing the sequence of interest.
  • the sequence has less than 80% identity with the genome containing the sequence of interest, preferably less than 70% identity and more preferably, less than
  • the universal priming site comprises or consists of a sequence of at least 15 bp and which has less than 80% identity with the genome containing the sequence of interest.
  • the universal boot site may be placed upstream or downstream of the sequence of interest.
  • a universal priming site which may comprise, for example, from the 5 'end to the 3' end:
  • Fig. 2A a reverse boot site, a boot sense site, a barcode sequence, a UPS sequence, and a sequence of interest (Fig. 2A); or
  • Fig. 2B a boot sense site, a barcode sequence, a UPS sequence, a sequence of interest and a reverse priming site (Fig. 2B); or
  • a barcode sequence a sequence of interest, a UPS sequence, a reverse boot site and a priming sense site (Fig. 2C); or
  • a sequence of interest a UPS sequence, a reverse boot site, a priming sense site and a barcode sequence (Fig. 2D); or
  • a seed sense site a sequence of interest, a UPS sequence, a barcode sequence, and a reverse boot site (Fig. 2F); or
  • a sequence of interest a UPS sequence, a barcode sequence, a reverse priming site and a priming sense site (Fig. 2G); or
  • a barcode sequence a reverse boot site, a boot sense site, a UPS sequence, and a sequence of interest (Fig. 2H).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a barcode sequence, a sequence of interest, a UPS , a reverse priming site and a priming sense site (Fig. 2C).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a reverse priming site, a priming sense site, a UPS sequence, a sequence of interest, and a barcode sequence (Fig. 2E).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a reverse priming site, a priming sense site, a barcode sequence, a UPS sequence, and a sequence of interest (Fig. 2A).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a sequence of interest, a UPS sequence, a code sequence -barres, a reverse priming site and a priming sense site (Fig. 2G).
  • the molecules mentioned above comprising a UPS sequence are the preferred ones.
  • Other molecules comprising a UPS sequence may be contemplated, but with a less favorable arrangement.
  • the nucleic acid molecules provided in step a) may further comprise a curvature module (CM) placed, in their circularized form, between the reverse priming site and the site sense of priming.
  • CM curvature module
  • the curvature module placed between the reverse priming site and the priming sense site or, when the priming sites are placed at each end of the the molecule (Fig. 1 or 2, B and F) is placed either downstream of the reverse priming site or upstream of the priming sense site.
  • the curvature modulus is a nucleotide sequence inducing a curvature in the helical structure of a nucleic acid molecule.
  • This module can be used to facilitate the circularization of nucleic acid molecules, particularly nucleic acid molecules comprising less than 250 bp.
  • This module may comprise or consist of a nucleotide sequence obtained or derived from the minicercles of kinetoplast DNA found in most Trypanosoma species and in particular kinetoplast DNA minicercles of Crithidia fasciculata.
  • the curvature module may comprise or consist of a sequence selected from the following group of sequences: SEQ ID No. 1 and SEQ ID No. 2 and a sequence having at least 90% identity with SEQ ID No. 1 sequences and in SEQ ID No. 2.
  • the curvature module comprises or consists of a sequence selected from the group of sequences SEQ ID No. 1 and SEQ ID No.
  • the The curvature module comprises or consists of the sequence SEQ ID No. 1.
  • the curvature module comprises or consists of the sequence SEQ ID No. 2. (Birkenmeyer et al 1985, Ulanovsky et al. 1986, Kitchin et al. Accordingly, the linear nucleic acid molecules provided in step a) and also comprising a curvature module may comprise, for example, from the 5 'end to the 3' end:
  • a reverse priming site a reverse priming site, a curvature module, a priming sense site, a barcode sequence and a sequence of interest (derived from Fig. 1 Arranged); or
  • a reverse priming site a curvature module, a priming sense site, a barcode sequence, a UPS sequence and a sequence of interest (derived from Fig. 2A arrangement; Fig. 3A); or
  • a curvature module a priming sense site, a barcode sequence, a sequence of interest and a reverse priming site (derived from Fig. 1B arrangement); or
  • a priming sense site a barcode sequence, a sequence of interest, a reverse priming site and a curvature module (derived from Fig. 1B arrangement); or
  • a curvature module a priming sense site, a barcode sequence, a UPS sequence, a sequence of interest and a reverse priming site (derived from Fig. 2B arrangement); or a boot sense site, a barcode sequence, a UPS sequence, a sequence of interest, a reverse boot site, and a curvature module (derived from Fig. 2B); or
  • a boot sense site a barcode sequence, a sequence of interest, a UPS sequence, a reverse boot site and a curvature module
  • a barcode sequence a sequence of interest, a reverse priming site, a curvature module and a priming sense site (derived from Fig. 1C arrangement); or
  • a barcode sequence a sequence of interest, a UPS sequence, a reverse boot site, a curvature module and a priming sense site (derived from Fig. 2C, Fig. 3B); or
  • a sequence of interest a reverse priming site, a curvature module, a priming sense site and a barcode sequence (derived from Fig. 1D arrangement); or
  • a sequence of interest a UPS sequence, a reverse boot site, a curvature module, a priming sense site and a barcode sequence (derived from Fig. 2D arrangement); or
  • a reverse priming site a reverse priming site, a curvature module, a priming sense site, a sequence of interest and a barcode sequence (derived from Fig. 1E arrangement); or
  • a reverse priming site a curvature module, a priming sense site, a UPS sequence, a sequence of interest, and a barcode sequence (derived from Fig. 2E arrangement; Fig. 3C); or
  • a curvature module a priming sense site, a sequence of interest, a barcode sequence and a reverse priming site (derived from Fig. 1F arrangement); or
  • a curvature module a priming sense site, a sequence of interest, a UPS sequence, a barcode sequence and a reverse priming site (derived from Fig. 2F arrangement); or
  • curvature module a boot sense site, a UPS sequence, a sequence of interest, a barcode sequence and a reverse boot site;
  • a priming sense site a sequence of interest, a barcode sequence, a reverse priming site and a curvature module (derived from Fig. 1F arrangement); or
  • a boot sense site a sequence of interest, a UPS sequence, a barcode sequence, a reverse boot site, and a curvature module (derived from Fig. 2F arrangement); or
  • a sequence of interest a barcode sequence, a reverse priming site, a curvature module and a priming sense site (derived from Fig. 1G arrangement); or
  • a sequence of interest a UPS sequence, a barcode sequence, a reverse boot site, a curvature module, and a priming sense site (derived from FIG. Fig. 3D); or
  • a barcode sequence a reverse priming site, a curvature module, a priming sense site and a sequence of interest (derived from Fig. 1H arrangement); or
  • a barcode sequence a reverse boot site, a curvature module, a priming sense site, a UPS sequence, and a sequence of interest (derived from Fig. 2H arrangement).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a barcode sequence, a sequence of interest, a sequence UPS, a reverse boot site, a bend module, and a priming sense site (Fig. 3B).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a reverse priming site, a curvature module, a site sense of initiation, a UPS sequence, a sequence of interest, and a barcode sequence (Fig. 3C).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a reverse priming site, a curvature module, a sense site. a barcode sequence, a UPS sequence, and a sequence of interest (Fig. 3A).
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a sequence of interest, a UPS sequence, a code sequence -barres, a reverse priming site, a curvature module and a priming sense site (Fig. 3D).
  • the nucleic acid molecules provided in step a) comprise a recognition site for a first restriction enzyme.
  • the recognition site for the first restriction enzyme is placed, considering the circularized form of the nucleic acid molecules, between the barcode and the sequence of interest.
  • the linear nucleic acid molecules provided in step a) comprise a barcode sequence next to the sequence of interest (Fig. 1 AC, EG, Fig. 2C and 2E, Fig. 3B and C), and the recognition site for the first restriction enzyme is placed between the barcode sequence and the sequence of interest.
  • the linear nucleic acid molecules provided in step a) comprise a barcode sequence in the 5 'end and a sequence of interest in the 3' end (Fig. 1H and Fig. 2H), and the recognition site for the first restriction enzyme is placed upstream of the barcode sequence or downstream of the sequence of interest, but preferably upstream of the barcode sequence.
  • the linear nucleic acid molecules provided in step a) comprise a 3 'end barcode sequence and a 5' end sequence of interest (Fig. 1D). and Fig. 2D) and the recognition site for the first restriction enzyme is placed downstream of the barcode sequence or upstream of the sequence of interest, but preferably downstream of the barcode sequence.
  • the linear nucleic acid molecules provided in step a) comprise a universal priming site (UPS) between the barcode sequence and the sequence of interest (Fig. 2A, 2B). , 2F and 2G, Fig. 3A and 3D) and the recognition site for the first restriction enzyme is placed between the universal priming site (UPS) and the barcode sequence or in said universal priming site ( preferably near the barcode sequence).
  • UPS universal priming site
  • the nucleic acid molecules provided in step a) further comprise a recognition site for a second restriction enzyme which is placed, when considering the circularized form of the nucleic acid molecules, between the two nucleic acid sites.
  • priming for example, Fig. II and 1J.
  • the nucleic acid molecules also comprise a modulus of curvature placed between the reverse site and the priming sense sites and the second restriction site for the second restriction enzyme is placed in said curvature module. (Fig. 3A-D).
  • the nucleic acid molecules also comprise a modulus of curvature placed between the reverse and priming sites, the second restriction site for the second restriction enzyme is placed in said curvature module and the second restriction enzyme is PacI.
  • the nucleic acid molecules provided in step a) may further comprise a recognition site for a third restriction enzyme.
  • the third restriction enzyme is a non-palindromic endonuclease that cleaves DNA at a defined distance from its recognition site.
  • the nucleic acid molecules provided in step a) comprise, when considered in their circularized form and in the 5 'to 3' direction, a sequence of interest, a reverse site of a priming sense site and a barcode sequence placed between the priming sense site and the sequence of interest (Fig. II), and the recognition site for the third restriction enzyme is placed in position. upstream of the opposite site boot.
  • the third restriction enzyme cleaves the nucleic acid molecules into a cleavage site upstream at its recognition site, i.e. in the sequence of interest for the circularized form of the molecules.
  • the nucleic acid molecules provided in step a) comprise in their circularized form and in the 5 'to 3' direction, a reverse priming site, a priming sense site, a sequence of interest and a barcode sequence placed between the sequence of interest and the reverse priming site (Fig. 1J), and the recognition site for the third restriction enzyme is placed downstream of the sense site. boot.
  • the third restriction enzyme cuts DNA (i.e., a double-strand cut) into a cleavage site downstream of its recognition site, i.e. in the sequence of interest for the circularized form of the molecules.
  • the third restriction enzyme is chosen from the group EcoP15I, Mmel, NmeAIII, Acul, Bbvl, BceAI, BpmI, BpuEI, BseRI, Bsg1, BsmFI, BtgZI, Ecil, Fok1, Hgal, I-Ceul. , I-Scel, Pi-Pspl and Pi-Scel.
  • the third restriction enzyme is selected from the group EcoPISI, Mmel and NmeAIII.
  • the third restriction enzyme is EcoP15I.
  • the nucleic acid molecules provided in step a) may further comprise a recognition site for a fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) comprise, when considered in their circularized form and in the 5 'to 3' direction, a sequence of interest, a reverse site of a priming sense site and a barcode sequence placed between the priming sense site and the sequence of interest (Fig. II), and the recognition site for the fourth restriction enzyme is placed in upstream of the reverse boot site.
  • the nucleic acid molecules provided in step a) comprise, when considered in their circularized form and in the 5 'to 3' direction, a reverse priming site, a site sense of priming, a sequence of interest and a barcode sequence placed between the sequence of interest and the reverse priming site (Fig. 1J), and the recognition site for the fourth restriction enzyme is placed downstream of the boot sense site.
  • the first, second, third, and fourth restriction enzymes may be chosen to have additional rare / occasional cleavage sites or no additional cleavage site in the sequence of interest and any other part of the cleavage molecules. 'acid nucleic.
  • the restriction enzymes are chosen to have only one cleavage site in the nucleic acid molecules.
  • the first, second and fourth restriction enzymes cut the DNA (ie, double-stranded cut) in their recognition sites or at a distance from these sites of less than 5 nucleotides.
  • the first, second, and fourth restriction enzymes cut the DNA into their recognition sites.
  • restriction enzymes may be chosen to have no cleavage site or low cutoff frequency in the sequence of interest.
  • the frequency of restriction enzyme sites in sequenced genomes can be easily found by a qualified person on available databases (such as REBASER http://rebase.neb.com). Restriction enzymes may be so chosen to have a low cutoff frequency in the genome containing the sequence of interest.
  • the first restriction enzyme is selected from the group Srf1, Sbf1, AscI, NotI, BssHII, SacII, Fsel, SmaI. In a preferred embodiment, the first restriction enzyme is selected from the group Srfl and Sbfl.
  • the second restriction enzyme is selected from the group PacI, AscI, NotI, BssHII, SacII, Fsel, SmaI. In a preferred embodiment, the second restriction enzyme is PacI.
  • the fourth restriction enzyme is selected from the group Pmel, AscI, NotI, BssHII, SacII, Fsel, SmaI. In a preferred embodiment, the fourth restriction enzyme is selected from the group Pmel and Ascl.
  • the nucleic acid molecules provided in step a) may further comprise a binding site for a first member of an affinity binding pair.
  • this binding site is placed in the region of the 5 'end of the reverse priming site at the 3' end of the priming sense site.
  • the nucleic acid molecules provided in step a) further comprise a curvature module placed between the reverse sites and the priming direction and said curvature module comprises a binding site for a first member of an affinity binding pair.
  • the nucleic acid molecules provided in step a) can also be attached to a first member of an affinity binding pair.
  • the first member of an affinity binding pair is attached in the region of the 5 'end of the reverse priming site at the 3' end of the priming sense site.
  • the nucleic acid molecules provided in step a) comprise a curvature module placed between the reverse and priming sites. and the first member of an affinity binding pair is attached to said curvature module.
  • the affinity binding pair may be, for example, digoxigenin-anti-digoxigenin antibody or biotin-avidin / streptavidin.
  • the first member of the affinity binding pair is biotin and the second member is streptavidin.
  • the nucleic acid molecules provided in step a) comprise a curvature modulus comprising a biotin-modified thymidine.
  • the biotin-modified thymidine may be thymidine 12 of SEQ ID No. 1 or thymidine 13 of SEQ ID No. 2.
  • the nucleic acid molecules provided in step a) of the method of the invention can be obtained by one or more amplification reactions.
  • Amplification can be accomplished by any technique including, but not limited to, PCR, RT-PCR, amplification by Q-replicase (Cahill et al., 1991, Chetverin and Spirin, 1995; Katanaev et al, 1995), the "ligase chain reaction” (LCR) (Landegren et al, 1988, Barany, 1991), the autonomous system of sequence replication (Fahy et al, 1991), strand displacement amplification (Walker et al., 1992), “nucleic acid sequence-based amplification” (NASBA) (Compton, 1991), “loop-mediated isothermal amplification” (Notomi et al, 2000), “rolling circle amplification” (RCA) (Blanco et al.
  • the amplification is by PCR or RT-PCR, preferably a high fidelity polymerase is used and the level of error polymerase is less than 10 "5, preferably less than 10" 6, and even more preferably less than 5.10 "7.
  • a high fidelity polymerase is used and the level of error polymerase is less than 10 "5, preferably less than 10" 6, and even more preferably less than 5.10 "7.
  • Platinum Taq High Fidelity DNA Polymerase Invitrogen
  • Phusion Hot Start High-Fidelity DNA Polymerase New England BioLabs
  • FastStart High Fidelity PCR System (Roche).
  • the template for this amplification may be a DNA or RNA molecule.
  • a set of primers For amplification by PCR or RT-PCR, a set of primers is required.
  • a set of primers comprise at least two primers: a sense primer and a reverse primer.
  • the set of primers can be easily designed by a skilled person according to the structure of the linear nucleic acid molecules to be obtained, the sequence of interest and the number of amplification reactions.
  • the nucleic acid molecules provided in step a) can be obtained by an amplification reaction, preferably by an RT-PCR or PCR reaction.
  • the sense primer for this reaction includes the region of the linear nucleic acid molecules provided in step a) which is upstream of the sequence of interest and at least 10, preferably 12, 15, 20 or 25, nucleotides of the 5 'end of the sequence of interest.
  • the reverse primer comprises the region of the nucleic acid molecules that is downstream of the sequence of interest and at least 10, preferably 12, 15, 20 or 25, nucleotides of the 3 'end of the sequence. interest.
  • the nucleic acid molecules provided in step a) are obtained by an amplification reaction with a set of primers comprising a reverse primer specific for the 3 'end of the sequence of interest and a sense primer comprising from its 5 'end to its 3' end:
  • a reverse priming site a recognition site for the second restriction enzyme, a priming sense site, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the first restriction enzyme; 5 'end of the sequence of interest; or
  • a reverse priming site comprising a recognition site for the second restriction enzyme, a priming sense site, a barcode sequence, a recognition site for the first restriction enzyme and a minus 10 nucleotides from the 5 'end of the sequence of interest.
  • the sense primer may comprise at its 5 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the sense primer is attached to a first member of an affinity binding pair.
  • the sense primer is attached to biotin.
  • the sense primer comprises a curvature module attached to the biotin.
  • the nucleic acid molecules provided in step a) are obtained by an amplification reaction using a set of primers comprising a reverse primer specific for the 3 'end. of the sequence of interest and a sense primer comprising from its 5 'end towards its 3' end, a reverse priming site, a curvature module attached to biotin and comprising a recognition site for the second enzyme of restriction, a priming sense site, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest.
  • the sense primer also comprises at the 5 'end a recognition site for the third restriction enzyme and, optionally, a recognition site for the fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) are obtained by an amplification reaction with a set of primers comprising a sense primer at the 5 'end of the sequence of interest and of an inverse primer comprising, from its 5 'end to its 3' end:
  • a priming sense site a recognition site for the second restriction enzyme, a reverse priming site, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the first restriction enzyme; 3 'end of the sequence of interest; or
  • a priming sense site comprising a recognition site for the second restriction enzyme, a reverse priming site, a barcode sequence, a recognition site for the first restriction enzyme and a minus 10 nucleotides from the 3 'end of the sequence of interest.
  • the reverse primer may comprise at the 5 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the reverse primer is attached to a first member of an affinity binding pair.
  • the reverse primer is attached to biotin.
  • the reverse primer comprises a curvature module attached to biotin.
  • the nucleic acid molecules provided in step a) are obtained by an amplification reaction using a set of primers comprising a sense primer in the 5'end of the sequence of interest and a reverse primer comprising from its 5 'end at the 3' end a sense sense site, a curvature modulus attached to the biotin and comprising a recognition site for the second restriction enzyme , a reverse priming site, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest.
  • the reverse primer comprises at its 5 'end a recognition site for the third restriction enzyme and, optionally, a recognition site for the fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) are obtained by an amplification reaction using a set of primers comprising a sense primer comprising from its end 5 'towards its 3' end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest, and a primer inverse comprising, from its 5 'end towards its end 3':
  • a priming sense site a recognition site for the second restriction enzyme, a reverse priming site and at least 10 nucleotides of the 3 'end of the sequence of interest;
  • a priming sense site an optional curvature module attached to the biotin and comprises a recognition site for the second restriction enzyme, a reverse priming site and at least 10 nucleotides of the 3 'end of the sequence of interest.
  • the sense primer may comprise a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, between the site of the reverse primer and the 3 'end of the sequence. interest.
  • the nucleic acid molecules provided in step a) are obtained by an amplification reaction using a set of primers comprising a reverse primer comprising at its end 5 'towards its 3' end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest, and a sense primer comprising from its end 5 'towards its end 3',:
  • a reverse priming site a recognition site for the second restriction enzyme, a priming sense site and at least 10 nucleotides of the 5 'end of the sequence of interest;
  • the sense primer may comprise a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, between the priming sense site and the 5 'end of the sequence. 'interest.
  • the sense primer comprises a recognition site for the third restriction enzyme and a recognition site for the fourth restriction enzyme.
  • a suitable set of primers to prepare the nucleic acid molecules of step a) by an amplification reaction based on the same rules.
  • the different sets of primers can be prepared by changing the barcode sequence for each sequence of different interest and, of course, by adapting the sequence specific to the targeted sequence of interest.
  • the nucleic acid molecules provided in step a) can also be obtained by several amplification reactions. These amplification reactions can be carried out successively or simultaneously in the same reaction mixture. If the targets to be amplified are very numerous, these amplifications are carried out simultaneously using the RainStorm platform, developed by RainDance Technologies (Mamanova et al, 2010), the primers to be used in these reactions can be easily designed by a qualified person . Indeed, each set of primers must contain at least one primer sequence that overlaps with another primer (overlapping sense primers and / or overlapping reverse primers, preferably not both simultaneously). The overlapping primers or overlap above mean that the overlap is sufficient to initiate amplification. As a result, the overlap is at least 10, 15 or 20 nucleotides.
  • the nucleic acid molecules provided in step a) have, either at their 5 'end or at their 3' end, a group of elements comprising 5 'end to the 3' end, a reverse priming site, a recognition site for the second restriction enzyme, a sense sense site.
  • they Preferably, they have a group of elements comprising, from the 5 'end to the 3' end, a reverse priming site, an optional curvature module attached to a first member of a binding pair by affinity, for example biotin, and comprises a recognition site for the second restriction enzyme, a sense sense site.
  • the amplification reactions may use at least two different groups of primers with the forward primers overlapping in the priming sense site or the reverse primers overlapping in the reverse priming site, depending on the location of this group. elements.
  • the sets of primers include the sense primers overlapping in the priming sense site.
  • the sets of primers include reverse primers overlapping in the reverse priming site.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a reverse primer of the 3 'end of the sequence of interest and
  • a first sense primer comprising, from its end 5 'to its end 3', the priming sense site or a first part thereof including its 3 'end, a code sequence; bars, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest;
  • a second sense primer comprising:
  • a reverse priming site comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of the an affinity binding pair, the priming sense site or a second portion thereof overlapping the first portion thereof including its 5 'end.
  • the second sense primer may comprise at the 5 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a reverse primer comprising its 5 'end. towards its 3 'end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3' end of the sequence of interest; and
  • a first sense primer comprising, from its 5 'end to its 3' end, a priming sense site or a first part thereof including its 3 'end, and at least 10 nucleotides of the 5' end; 'of the sequence of interest;
  • a second sense primer comprising:
  • a curvature module comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, the site of initiation or a second portion overlapping the first portion including its 5 'end.
  • the second sense primer may comprise at the 5 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a sense primer comprising from its 5 'end to its 3' end, a barcode sequence, a recognition for the first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest, and
  • a first inverse primer comprising, from its 5 'end towards its 3' end, a reverse priming site or a first part thereof including its 5 'end and at least 10 3' end nucleotides; the sequence of interest; and,
  • a second inverse primer comprising:
  • a priming sense site from its 5 'end towards its 3' end, a priming sense site, a recognition site for the second restriction enzyme, the reverse priming site or a second part overlapping the first part and including its 3 'end ;
  • curvature module comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, the reverse priming site or a second portion overlapping the first portion and including its 3 'end.
  • the second reverse primer may comprise at the 5 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a sense primer comprising at least 10 nucleotides of the 5 'end of the sequence of interest, and
  • a first inverse primer comprising, from its 5 'end to its 3' end, the reverse priming site or a first one thereof including its 5 'end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest;
  • a second inverse primer comprising:
  • a priming sense site from its 5 'end towards its 3' end, a priming sense site, a recognition site for the second restriction enzyme, the reverse priming site or a second part overlapping the first part and including its 3 'end ;
  • a curvature module comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, the site inverse boot or a second part overlapping the first part and including its end 3 '.
  • the second reverse primer may comprise at the 5 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the method uses a sequence of the universal boot site (UPS).
  • UPS universal boot site
  • the first preferred primers of the method include a UPS sequence and at least 10 nucleotides of the 5 'or 3' end of the sequence of interest.
  • the other primers are not specific to the sequences of interest and can be used as standardized products, convenient for preparing kits suitable for carrying out the methods as described herein.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a specific reverse primer at the 3 'end. of the sequence of interest, and:
  • a first sense primer comprising, from its 5 'end to its 3' end, a universal priming site and at least 10 nucleotides of the 5 'end of the sequence of interest;
  • a second sense primer comprising from its 5 'end towards its 3' end, a reverse priming site, a recognition site for the second restriction enzyme, a priming sense site, a barcode sequence, a recognition site for the first restriction enzyme and the universal priming site, and
  • a third sense primer comprising:
  • a reverse priming site comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, a priming sense site or a second portion overlapping the first portion and including its 5 'end.
  • the third sense primer may comprise at the 5 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a sense primer comprising its 5 'end. towards its 3 'end, a barcode sequence, a recognition site for the first restriction enzyme and 10 nucleotides of the 5' end of the sequence of interest, and
  • a first sense primer comprising from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 5 'end of the sequence of interest;
  • a second inverse primer comprising:
  • a priming sense site from its 5 'end to its 3' end, a priming sense site, a curvature module comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, the reverse boot site and the universal boot site.
  • the second reverse primer may comprise between the universal priming site and the reverse priming site, a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a reverse primer comprising its 5 'end. towards its 3 'end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 5' end of the sequence of interest, and
  • a first sense primer comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 3 'end of the sequence of interest;
  • a second sense primer comprising:
  • a reverse priming site from its 5 'end towards its 3' end, a reverse priming site, a recognition site for the second restriction enzyme, a priming sense site and the universal priming site, or
  • a reverse priming site comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, a site sense of boot and the universal boot site.
  • the second sense primer may comprise a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, placed between the priming sense site and the universal priming site.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising a sense primer comprising its 5 'end. towards its 3 'end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3' end of the sequence of interest, and
  • a first inverse primer comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 5 'end of the sequence of interest
  • a second inverse primer comprising:
  • a priming sense site from its 5 'end towards its 3' end, a priming sense site, a recognition site for the second restriction enzyme, a reverse priming site and a universal priming site, or
  • curvature module comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, reverse boot site, and universal boot site.
  • the second reverse primer may comprise a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, placed at its 5 'end.
  • the nucleic acid molecules provided in step a) are obtained by amplification reactions using a set of primers comprising an end-specific sense primer. 'of the sequence of interest, and:
  • a first inverse primer comprising from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 3 'end of the sequence of interest
  • a second inverse primer comprising:
  • a priming sense site from its 5 'end towards its 3' end, a priming sense site, a recognition site for the second restriction enzyme, a reverse priming site, a barcode sequence, a recognition site for the first restriction enzyme and the universal priming site, and a third inverse primer comprising:
  • a priming sense site from its 5 'end towards its 3' end, a priming sense site, a recognition site for the second restriction enzyme and the reverse priming site or a second part thereof overlapping the first part and including its 3 'end, or
  • a priming sense site from its 5 'end to its 3' end, a priming sense site, a curvature module comprising a recognition site for the second restriction enzyme, the curvature module being optionally attached to a first member of a affinity binding pair, and the reverse priming site or a second portion thereof overlapping the first portion and including its 3 'end.
  • the third reverse primer may comprise a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, placed at the 5 'end.
  • the excess single-stranded primers can be degraded, for example, using exonuclease I or any other single-stranded DNA-specific nuclease.
  • the other steps of the method can be performed on the plurality of sets of linear nucleic acid sequences, thereby optimizing the cost of time and money in the library preparation.
  • step b) of the method of the invention linear nucleic acid molecules provided in step a) or a ') are circularized by intramolecular ligation.
  • the first type comprises the entire sequence of interest and the second type comprises the sequence of interest already truncated at one of its ends (i.e. when step a ') has been performed).
  • This ligation can be performed by any method known to a skilled person.
  • intramolecular ligation is performed using a DNA ligase, such as T4 DNA ligase, under the conditions described in the Collins and Weissman article, 1984. The conditions used in this step prevent ligations. intermolecular.
  • Inter-molecular ligation can be prevented for example by using the appropriate dilution (eg, limiting dilution) or, when the nucleic acid molecules are attached to a first member of an affinity binding pair, by binding the molecules nucleic acid to a solid support supporting the first member of an affinity binding pair.
  • the circularized nucleic acid molecules obtained from step b) are digested with the restriction enzyme to provide a linearized form, preferably by the first one. restriction enzyme.
  • This restriction enzyme cleaves the circularized nucleic acid molecules between the barcode and the sequence of interest. This digestion produces linear nucleic acid molecules comprising at one end the barcode sequence and at the other end the sequence of interest.
  • the first restriction enzyme cuts between the universal priming site and the barcode sequence or in the universal site. priming, preferably near the end adjacent to the barcode sequence.
  • the digestion with the first restriction enzyme provides the linear nucleic acid molecules comprising the sequence of interest at their 5 'end and the barcode sequence at their 3' ends.
  • the digestion with the first restriction enzyme provides the linear nucleic acid molecules comprising the sequence of interest at their 3 'end and the barcode sequence at their 5' end.
  • step d) of the method of the invention the digested nucleic acid molecules obtained from step c) are cleaved in the sequence of interest. This cleavage can be performed by enzymatic or physical methods.
  • Cleavage can be performed using a sequence-independent cleavage technique such as, for example, sonication, nebulization, French Press or using the Hydroshear® system (Genomic Solutions®).
  • a sequence-independent cleavage technique such as, for example, sonication, nebulization, French Press or using the Hydroshear® system (Genomic Solutions®).
  • the cleavage is effected by sonication.
  • This cleavage produces random fragments of nucleic acid of specific sizes.
  • the size of the fragmented molecules may be chosen by a skilled person according to the intended use of the library prepared by the method of the invention.
  • Cleaved molecules can be separated by electrophoresis and molecules of the desired size can be purified from the electrophoresis gel.
  • the linear nucleic acid molecules provided in step a) comprise in their circularized form and in the direction from the 5 'end to the 3' end, a sequence of interest, a site reverse priming, a priming sense site and a barcode sequence placed between the priming sense site and the sequence of interest (Fig. 1).
  • digestion with the first restriction enzyme in step c) provides the linear nucleic acid molecules comprising at their 5 'end, the 5' end of the sequence of interest. The cleavage of these nucleic acid molecules thus provides the linear nucleic acid molecules comprising the 5 'truncated sequence of interest.
  • the linear nucleic acid molecules provided in step a) comprise in their circularized form and in the direction from the 5 'end to the 3' end, a reverse priming site, a priming sense site, a sequence of interest, and a barcode sequence placed between the reverse priming site and the sequence of interest (Fig. 2).
  • digestion with the first restriction enzyme in step c) provides the linear nucleic acid molecules comprising, at their 3 'end, the 3' end of the sequence of interest. The cleavage of these nucleic acid molecules thus provides the linear nucleic acid molecules comprising the 3 'truncated sequence of interest.
  • Cleavage can also be performed using the restriction enzyme.
  • the nucleic acid molecules provided in step a) comprise a recognition site for a third restriction enzyme as described above.
  • the linear nucleic acid molecules provided in step a) comprise in their circularized form a barcode sequence placed between the priming sense site and the sequence of interest and a site. recognition for the third restriction enzyme between the reverse priming site and the sequence of interest.
  • digestion of the nucleic acid molecules obtained from step c) with the third enzyme provides nucleic acid molecules comprising a 5 'truncated sequence of interest.
  • the linear nucleic acid molecules provided in step a) comprise in their circularized form a barcode sequence placed between the reverse priming site and the sequence of interest and a recognition site for the third restriction enzyme between the priming sense site and the sequence of interest.
  • digestion of the nucleic acid molecules obtained from step c) with the third enzyme provides nucleic acid molecules comprising a 3 'truncated sequence of interest.
  • step e) of the method of the invention the cleaved nucleic acid molecules obtained from step d) are circularized by intra-molecular ligation. This ligation can be performed as described above.
  • the circularized nucleic acid molecules obtained from step e) comprise, in the direction from the 5 'end to the 3' end, a truncated sequence of interest, a reverse priming site, a site sense of priming and a barcode sequence that is between the seed sense site and the sequence of interest or between the sequence of interest and the reverse boot site.
  • the barcode sequence is placed between the boot sense site and the sequence of interest.
  • the sequence of interest between said circularized nucleic acid molecules is truncated at 5 '.
  • the barcode sequence is placed between the reverse boot site and the sequence of interest.
  • the sequence of interest included in said circularized nucleic acid molecules is truncated to 3 '.
  • the nucleic acid molecules obtained after steps a), b), c), d) and e) comprise a sequence of interest truncated in 5 'or 3' according to the position of the bar code (upstream or downstream of the sequence of interest).
  • the method of the invention may further comprise additional steps to truncate the other end of the sequence of interest thereby providing nucleic acid molecules comprising a sequence of interest truncated at 3 'and 5'. .
  • the linear nucleic acid molecules provided in step a) comprise the sequence of interest at one of its ends (e.g., Fig. 1A, Fig. 1D, Fig. 1G, and Fig. 1A). 1H, Fig. 2A, Fig. 2D, Fig. 2G and Fig. 2H; Fig. 3A and 3D) and the method further comprises a step a ') of cleaving the nucleic acid molecules, after step a) and before step b), which makes it possible to provide a truncated sequence of interest.
  • the cleavage is performed by the use of a sequence independent cleavage technique (SITC), such as sonication.
  • SITC sequence independent cleavage technique
  • the obtained nucleic acid molecules have a 3 'truncated sequence of interest.
  • the sequence of interest is at the 5 'end of the linear nucleic acid molecules provided in step a) (e.g., Fig. 1D and Fig. 1G; Fig. 2D and Fig. 2G; 3D )
  • the obtained nucleic acid molecules have a 5 'truncated sequence of interest.
  • the cleaved molecules can be electrophoretically separated and molecules of the desired size can be purified from electrophoresis gel.
  • the linear nucleic acid molecules provided in step a) do not comprise the sequence of interest at one end but comprise a recognition site for a fourth restriction enzyme placed at the end of the sequence of interest that is opposite to the end adjacent to the barcode.
  • the method further comprises after step e),
  • step f) digesting circular nucleic acid molecules obtained from step e) with the fourth restriction enzyme, thereby providing linear nucleic acid molecules comprising the non-truncated end of the sequence of interest at one of its extremity; g) cleaving the digested nucleic acid molecules obtained from step f) into the sequence of interest, which makes it possible to provide linear nucleic acid molecules comprising a sequence of interest truncated in 5 'and 3' .
  • the cleaved molecules can be electrophoretically separated and molecules of the desired size can be purified from the electrophoresis gel.
  • the method of the invention may further comprise a step h) of circularization of the nucleic acid molecules obtained from step g) by intra-molecular ligation. This ligation can be performed as described above.
  • the circular molecules obtained from step h) comprise, in the 5 'to 3' direction:
  • a recognition site for a third restriction enzyme a recognition site for a third restriction enzyme, a reverse priming site and a curvature module comprising a recognition site for a second restriction enzyme, or
  • a priming sense site a 5 'and 3' truncated interest sequence, a barcode sequence, a reverse priming site and a curvature module comprising a recognition site for a second enzyme of restriction.
  • the method of the invention comprises
  • each nucleic acid molecule comprising from the 5 'end to the 3' end a recognition site for a third restriction enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a bar code sequence, a recognition site for a first restriction enzyme, optionally a universal boot site, and a sequence of interest (Fig. 3A) (step a);
  • linear nucleic acid molecules comprising from the 5 'end to the 3' end, a recognition site for a third restriction enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, an optional barcode sequence a universal boot site, and a 3 'truncated interest sequence;
  • circularization of said linear nucleic acid molecules by intramolecular ligation which makes it possible to provide circular molecules of nucleic acid comprising, in the 5 'to 3' direction, a barcode sequence, optionally a universal site method of initiation, a 3 'truncated interest sequence, a recognition site for a third restriction enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a site priming direction (step b);
  • step c digesting said nucleic acid circular molecules with the first restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'end to the 3' end, optionally a universal priming site , a 3 'truncated interest sequence, a recognition site for a third restriction enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense site of priming and a barcode sequence (step c);
  • step d cleaving said nucleic acid molecules digested with the third restriction enzyme, which makes it possible to provide linear nucleic acid molecules comprising from the 5 'end to the 3' end, a sequence of interest truncated in 3 and 5 ', a recognition site for a third restriction enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site and a code sequence -barres (step d); and
  • the method of the invention comprises providing a set or a plurality of sets of linear nucleic acid molecules, each nucleic acid molecule comprising from the 5 'end to the 3' end, a reverse priming site, a a curvature comprising a recognition site for a second restriction enzyme, a sense sense site, a bar code sequence, a recognition site for a first restriction enzyme, optionally a universal priming site, and a sequence of interest (Fig. 3A) (step a);
  • linear nucleic acid molecules by using a cleavage technique independently of the sequence such as sonication, which makes it possible to provide linear nucleic acid molecules comprising from the 5 'to 3' end, a reverse site method of initiation, a curvature module comprising a recognition site for a second restriction enzyme, a priming sense site, a barcode sequence, optionally a universal priming site, and a truncated interest sequence in 3 ';
  • circularization of said linear nucleic acid molecules by intramolecular ligation which makes it possible to provide circular molecules of nucleic acid comprising, in the 5 'to 3' direction, a barcode sequence, optionally a universal site method of initiation, a 3 'truncated interest sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme and a priming sense site (step b);
  • step c digesting said circular nucleic acid molecules with the first restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'to 3' end, optionally a universal priming site, a sequence 3 'truncated interest, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site and a barcode sequence (step c);
  • nucleic acid molecules by intramolecular ligation, which makes it possible to provide circular molecules of nucleic acid comprising, in the 5 'to 3' direction, a priming sense site, a barcode sequence , a sequence of interest truncated at 3 'and 5', a reverse boot site and a curvature module comprising a recognition site for a second restriction enzyme (step e).
  • the method of the invention comprises
  • each nucleic acid molecule comprising from the 5 'end to the 3' end, a sequence of interest, optionally a site universal priming method, a recognition site for a first restriction enzyme, a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense site; priming and a recognition site for a third restriction enzyme (Fig. 3D) (step a);
  • linear nucleic acid molecules comprising from the 5 'to the 3' end, a sequence of 5 'truncated interest, optionally a universal priming site, a recognition site for a first restriction enzyme, a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site and a recognition site for a third restriction enzyme;
  • circularization of said linear molecules of nucleic acid by intramolecular ligation which makes it possible to provide circular nucleic acid molecules comprising, in the 5 'to 3' direction, a barcode sequence, a reverse site of priming, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a recognition site for a third restriction enzyme, a 5 'truncated sequence of interest and, optionally, a universal boot site (step b);
  • step c digesting said nucleic acid circular molecules with the first restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'to 3' end, a barcode sequence, a reverse invert site, and priming, a curvature module comprising a recognition site for a second restriction enzyme, a priming sense site, a recognition site for a third restriction enzyme, a 5 'truncated interest sequence and, optionally a universal boot site (step c);
  • step d cleaving said digested nucleic acid molecules by digestion with the third restriction enzyme, thereby making it possible to provide linear nucleic acid molecules comprising from the 5 'end to the 3' end, a barcode sequence , a reverse boot site, a curvature module comprising a recognition site for a second restriction enzyme, a priming sense site, a recognition site for a third restriction enzyme, a 5 'and a 3' truncated sequence of interest (step d); and
  • the method of the invention comprises
  • each nucleic acid molecule comprising from the 5 'end to the 3' end, a sequence of interest, optionally a site universal priming method, a recognition site for a first restriction enzyme, a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme and a sense site.
  • priming Fig. 3D
  • linear nucleic acid molecules comprising from the 5 'to the 3' end, a sequence of 5 'truncated interest, optionally a universal priming site, a recognition site for a first restriction enzyme, a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme and a priming sense site;
  • circularization of said linear molecules of nucleic acid by intramolecular ligation which makes it possible to provide circular nucleic acid molecules comprising, in the 5 'to 3' direction, a barcode sequence, a reverse site of a bending module comprising a recognition site for a second restriction enzyme, a sense sense site, a 5 'truncated interest sequence, optionally a universal priming site, and a recognition site for a first restriction enzyme (step b);
  • step c digesting said nucleic acid circular molecules with the first restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'to 3' end, a barcode sequence, a reverse invert site, and a bending module comprising a recognition site for a second restriction enzyme, a sense of sense site, a 5 'truncated sequence of interest and, optionally, a universal priming site (step c);
  • step d cleaving said digested nucleic acid molecules using a technique independent of the sequence such as sonication, which makes it possible to provide linear nucleic acid molecules comprising from the 5 'end to the 3' end, a sequence barcode, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a 5 'and a 3' truncated interest sequence (step d); and
  • nucleic acid circular molecules comprising, in the 5 'to 3' direction, a priming sense site, a sequence of interest 5 'and 3' truncated, a barcode sequence, a reverse priming site and a curvature module comprising a recognition site for a second restriction enzyme (step e).
  • the method of the invention comprises
  • each nucleic acid molecule comprising from the 5 'end to the 3' end, a bar code sequence, a recognition for a first restriction enzyme, a sequence of interest, optionally a universal priming site, a recognition site for a third restriction enzyme and a recognition site for a fourth restriction enzyme, a reverse site of priming, a curvature module comprising a recognition site for a second restriction enzyme, and a priming sense site (Fig. 3B) (step a);
  • circularization of said linear molecules of nucleic acid by intramolecular ligation which makes it possible to provide circular molecules of nucleic acid comprising, in the 5 'to 3' direction, a barcode sequence, a recognition site for a first restriction enzyme, a sequence of interest, optionally a universal priming site, a recognition site for a third restriction enzyme and a recognition site for a fourth enzyme, a reverse priming site, a module curvature comprising a recognition site for a second restriction enzyme, and a sense sense site (step b);
  • step c digesting said circular nucleic acid molecules with the first restriction enzyme, which makes it possible to provide linear nucleic acid molecules comprising from the 5 'end to the 3' end, a sequence of interest, optionally a universal priming site, a recognition site for a third restriction enzyme and a recognition site for a fourth enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a priming sense site and a barcode sequence (step c);
  • step d cleaving said digested nucleic acid molecules by digestion with the third restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'to 3' end, a 5 'truncated sequence of interest , optionally a universal priming site, a recognition site for a third restriction enzyme and a recognition site for a fourth restriction enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site and a barcode sequence (step d);
  • circularization of said cleaved nucleic acid molecules by intramolecular ligation which makes it possible to provide circular molecules of nucleic acid comprising, in the 5 'to 3' direction, a priming sense site, a code sequence; bars, a 5 'truncated interest sequence, optionally a universal priming site, a recognition site for a third restriction enzyme and a recognition site for a fourth restriction enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme (step e),
  • step f digesting said circular nucleic acid molecules with the fourth restriction enzyme, which makes it possible to provide linear nucleic acid molecules comprising from the 5 'end to the 3' end, a reverse priming site, a a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a barcode sequence, a 5 'truncated interest sequence and, optionally, a universal priming site ( step f);
  • linear nucleic acid molecules comprising from the 5 'end to the 3' end, a reverse site of priming, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a barcode sequence, a 5 'and 3' truncated sequence of interest (step g); and
  • the method of the invention comprises
  • each nucleic acid molecule comprising from the 5 'end to the 3' end, a bar code sequence, a recognition for a first restriction enzyme, a sequence of interest, optionally a universal priming site, a recognition site for a fourth enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, and a priming sense site (Fig. 3B) (step a);
  • circularization of said linear molecules of nucleic acid by intramolecular ligation which makes it possible to provide circular molecules of nucleic acid comprising, in the 5 'to 3' direction, a barcode sequence, a recognition site for a first restriction enzyme, a sequence of interest, optionally a universal priming site, a recognition site for a fourth enzyme, a reverse priming site, a curvature module comprising a recognition site for a second enzyme restriction, and a sense-of-initiation site (step b);
  • step c digesting said circular nucleic acid molecules with the first restriction enzyme, which makes it possible to provide linear nucleic acid molecules comprising from the 5 'end to the 3' end, a sequence of interest, optionally a universal priming site, a recognition site for a fourth enzyme, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a priming sense site and a code sequence -barres (step c);
  • step e digesting said circular nucleic acid molecules with the fourth restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'end to the 3' end, a reverse priming site, comprising a a curvature module, a recognition site for a second restriction enzyme, a sense of sense site, a barcode sequence, a 5 'truncated interest sequence and, optionally, a universal priming site (step f);
  • linear nucleic acid molecules comprising from the 5 'end to the 3' end, a reverse site of priming, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a barcode sequence, a 5 'and 3' truncated sequence of interest (step g); and
  • circularization of said cleaved nucleic acid molecules by intramolecular ligation which makes it possible to provide circular nucleic acid molecules comprising, in the 5 'to 3' direction, a priming sense site, a code sequence; bars, a 5 'and 3' truncated sequence of interest, a reverse priming site and a curvature module comprising a recognition site for a second restriction enzyme (step h).
  • the method of the invention comprises
  • each nucleic acid molecule comprising from the 5 'end to the 3' end, a reverse priming site, a a curvature comprising a recognition site for a second restriction enzyme, a sense sense site, a recognition site for a third restriction enzyme and a recognition site for a fourth enzyme, optionally a universal priming site, a sequence of interest, a recognition site for a first restriction enzyme and a barcode sequence (Fig. 3C) (step a);
  • circular nucleic acid molecules comprising, in the 5 'to 3' direction, a priming sense site, a recognition site for a third restriction enzyme and a recognition site for a fourth enzyme, optionally a universal priming site, a sequence of interest, a recognition site for a first restriction enzyme, a barcode sequence, a site reverse priming and a curvature module comprising a recognition site for a second restriction enzyme (step b);
  • step c digesting said circular nucleic acid molecules with the first enzyme of restriction, thereby providing linear nucleic acid molecules comprising from the 5 'end to the 3' end, a barcode sequence, a reverse priming site, a curvature module comprising a recognition for a second restriction enzyme, a sense sense site, a recognition site for a third restriction enzyme and a recognition site for a fourth enzyme, optionally a universal priming site and a sequence of interest ( step c);
  • step d cleaving said digested nucleic acid molecules by digestion with the third restriction enzyme, thereby providing linear nucleic acid molecules comprising 5 'to 3' end, a barcode sequence, a site reverse sequence of initiation, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a recognition site for a third restriction enzyme and a recognition site for a fourth enzyme, optional a universal priming site and a 3 'truncated interest sequence (step d);
  • circularization of said cleaved nucleic acid molecules by intramolecular ligation which makes it possible to provide circular nucleic acid molecules comprising, in the 5 'to 3' direction, a priming sense site, a recognition site for a third restriction enzyme and a recognition site for a fourth enzyme, optionally a universal priming site, a 3 'truncated interest sequence, a barcode sequence, a reverse priming site and a module curvature comprising a recognition site for a second restriction enzyme (step e),
  • nucleic acid circular molecules comprising from the 5 'end to the 3' end, optionally a universal priming site , a 3 'truncated interest sequence, a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme and a sense sense site (step f );
  • linear nucleic acid molecules comprising from the 5 'end to the 3' end, a sequence of interest truncated at 5 'and 3', a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme and a sense sense site (step g); and
  • the method of the invention comprises
  • each nucleic acid molecule comprising from the 5 'end to the 3' end, a reverse priming site, a a curvature comprising a recognition site for a second restriction enzyme, a sense of sense site, a recognition site for a fourth enzyme, optionally a universal priming site, a sequence of interest, a recognition site for a first restriction enzyme and a barcode sequence (Fig. 3C) (step a);
  • circular nucleic acid molecules comprising, in the 5 'to 3' direction, a priming sense site, a recognition site for a fourth enzyme, optionally a universal priming site, a sequence of interest, a recognition site for a first restriction enzyme, a barcode sequence, a reverse priming site and a curvature module comprising a recognition site for a second restriction enzyme (step b);
  • step c digesting said nucleic acid circular molecules with the first restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'end to the 3' end, a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a recognition site for a fourth enzyme, optionally a universal priming site and a d interest (step c);
  • step d cleaving said digested nucleic acid molecules using a technique independent of the sequence such as sonication, which enables the supply of linear nucleic acid molecules comprising from the 5 'to the 3' end, a code sequence; bar, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme, a sense sense site, a recognition site for a fourth restriction enzyme, optionally a universal site of priming and a 3 'truncated interest sequence (step d);
  • nucleic acid circular molecules comprising from the 5 'end to the 3' end, optionally a universal priming site , a 3 'truncated interest sequence, a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme and a sense sense site (step f );
  • linear nucleic acid molecules comprising from the 5 'end to the 3' end, a sequence of interest truncated at 5 'and 3', a barcode sequence, a reverse priming site, a curvature module comprising a recognition site for a second restriction enzyme and a sense sense site (step g); and
  • nucleic acid circular molecules comprising, in the 5 'to 3' direction, a priming sense site, a sequence of interest 5 'and 3' truncated, a barcode sequence, a reverse priming site and a curvature module comprising a recognition site for a second restriction enzyme (step h).
  • the nucleic acid molecules provided in step a) are attached to a first member of an affinity binding pair and the method further comprises one or more steps of binding the molecules of nucleic acid on a solid support through interaction between the first affinity member of the binding pair attached to said nucleic acid molecules and the second members of said affinity-binding pair bound to the solid support.
  • Useful solid supports include any rigid or semi-rigid surface on which a member of an affinity binding pair may be bonded.
  • the carrier may be any porous or non-porous material insoluble in water, including, but not limited to, membranes, filters, chips, magnetic or non-magnetic beads, and polymers.
  • the solid support is selected from membranes and beads based on silica.
  • the solid support is beads and more particularly polystyrene beads. These beads may have a diameter of 1 to 10 micrometers.
  • the nucleic acid molecules provided in step a) are attached to biotin and bound to a solid support, preferably magnetic beads, coated with streptavidin. Nucleic acid molecules may be bound to a solid support before an intramolecular ligation circularization step to prevent inter-molecular events or before each change of reaction mixture to facilitate recovery of the molecules. of nucleic acid.
  • the amount of the solid support can be easily adjusted by a skilled person depending on the concentration of the nucleic acid molecules.
  • linear nucleic acid molecules obtained from step g) are bound to a solid support prior to circularization of step h).
  • circular nucleic acid molecules obtained from step h) are then bound to a solid support.
  • Circular nucleic acid molecules obtained from step h) can be digested by the second restriction enzyme, which makes it possible to provide linear nucleic acid molecules comprising from the 5 'end to the 3' end. '
  • a priming sense site a barcode sequence, a 5 'and 3' truncated sequence of interest and a reverse sequence of initiation, or
  • a seed sense site a 5 'and 3' truncated interest sequence, a barcode sequence and a reverse boot sequence.
  • nucleic acid molecules comprise a modulus of curvature comprising the recognition site for the second restriction enzyme
  • nucleic acid molecules obtained by digestion with the second restriction enzyme comprise at each end, a portion of the curvature module.
  • nucleic acid molecules are bound on a solid support before they are digested with the second restriction enzyme.
  • Nucleic acid molecules digested with the second restriction enzyme can then be amplified, for example by PCR or any other method known to a skilled person.
  • the primers used for this amplification comprise:
  • the product of this amplification can then be sequenced using any high throughput sequencing platform.
  • the method may further include one or more steps of repairing the ends of the cleaved or digested nucleic acid molecules.
  • the ends of the nucleic acid molecules are repaired after each cleavage or digestion step and / or each circularization step.
  • the repair may include reconstitution of the ends and / or phosphorylation of the ends. Restoration and phosphorylation can be performed by any method known to a skilled person.
  • the restoration can be carried out using a specific DNA polymerase, such as T4 DNA polymerase, in the presence of dNTPs, and phosphorylation can be achieved using a DNA kinase, such as T4 polynucleotide kinase, in presence of ATP.
  • a specific DNA polymerase such as T4 DNA polymerase
  • phosphorylation can be achieved using a DNA kinase, such as T4 polynucleotide kinase, in presence of ATP.
  • the method further comprises one or more steps of degradation of linear nucleic acid molecules with ATP-dependent DNase that selectively hydrolyzes double-stranded linear nucleic acid molecules.
  • ATP-Dependent Plasmid-Safe TM (Epicenter) ATP-Dependent DNase DNase may be chosen to specifically degrade linear DNA. It is particularly suitable for degrading the linear nucleic acid molecules after a circularization step, preferably after each annealing step.
  • kits suitable for preparing the nucleic acid molecules provided in step a) of the method described above may comprise any forward or reverse primer or set thereof as previously described to prepare the nucleic acid molecules provided in step a).
  • the kit may comprise at least one forward primer comprising, from the 5 'end to the 3' end,
  • a reverse priming site a recognition site for a second restriction enzyme, and a priming sense site or a part thereof including its 5 'end;
  • a reverse priming site comprising a recognition site for a second restriction enzyme, and a priming sense site or a part thereof including its 5 'end.
  • a part of it is meant at least 10, 15 or 20 nucleotides thereof.
  • the kit further comprises at least one second sense primer comprising, from its 5 'end towards its end 3', a priming sense site or a part thereof including its end 3 and overlapping a portion of the sense sense initiation site of the first sense primer, a bar code sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest or a universal priming site.
  • the at least second sense primer comprises, from its 5 'end towards its end 3', a priming sense site or part thereof including its 3 'end and overlapping a part of the sense site. initiating the first sense primer, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site.
  • the kit comprises a sense primer and a plurality of different sense primers by their barcode sequences and, if present, by at least 10 nucleotides of the 5 'end of the sequence of interest.
  • every second sense primer is designed to be specific to a different sequence of interest.
  • each contains a separate barcode to associate with each sequence of interest respectively, the other element remaining the same (For example, the priming sense site or a portion thereof, the recognition site for the first restriction enzyme and the universal priming site).
  • the at least first sense primer further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the end. 5 'of the sequence of interest or a universal boot site. More preferably, the at least first sense primer further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site. Preferably, the at least first sense primer further comprises, at the 5 'end, a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the kit may comprise a sense primer
  • the kit preferably comprises a plurality of different primers meaning different by their barcode sequences and, if present, by at least the 10 nucleotides of the 5 'end of the sequence of interest the other elements remain the same (ie, if present, the reverse priming site, the curvature module, the recognition site for the second restriction enzyme, the priming sense site, or part of it, the universal boot site).
  • the kit may further comprise a reverse primer comprising at least 10 nucleotides of the 3 'end of the sequence of interest or several reverse primers, each of which comprises at least 10 nucleotides of the 'end 3' of different sequence of interest.
  • the at least first sense primer further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, and at least 10 nucleotides of the 5 'end of the sequence of interest or a universal priming site.
  • the at least first sense primer further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, and a universal priming site.
  • the kit may include a first sense primer.
  • the kit may further comprise a reverse primer comprising, from its 5 'end to its 3' end, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest.
  • the kit further comprises several reverse primers, different by their barcode sequences and by at least the 10 nucleotides specific to the 3 'end of the sequence of interest.
  • the kit may further comprise at least one forward primer comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 5 'end of the sequence of interest.
  • the kit may furthermore comprise several sense primers comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 5 'end of one of the different sequences. 'interest.
  • the kit may comprise at least a first inverse primer comprising, from the 5 'end to the 3' end,
  • a priming sense site a recognition site for a second restriction enzyme, and a reverse priming site or a part thereof including its 3 'end;
  • a priming sense site a curvature module comprising a recognition site for the second restriction enzyme, and a reverse priming site or a part thereof including its 3 'end.
  • a part of it is meant at least 10, 15 or 20 nucleotides.
  • the kit further comprises at least a second reverse primer comprising, from its 5 'end towards its 3' end, a reverse priming site or part thereof including its end 5 and overlapping the reverse priming portion of the first reverse primer, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest or a universal boot site.
  • the at least one second inverse primer comprises, from its 5 'end towards its 3' end, a reverse priming site or part thereof including its 5 'end and overlapping a part of the reverse site of priming the first reverse primer, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site.
  • the kit comprises the first reverse primer and several second reverse primers different in their barcode sequences and, if present, by at least the 10 nucleotides specific to the 3 'end of the sequence of interest.
  • each second inverse primer is designed to be specific to a different sequence of interest.
  • 2 and 1,000 second different inverse primers are designed, each comprising a separate barcode to be associated with each sequence of interest, the other element remains the same (for example, the reverse priming site or a portion thereof, the recognition site for the first restriction enzyme and the universal priming site).
  • the at least first inverse primer further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the end. 3 'of the sequence of interest or a universal boot site.
  • the at least first inverse primer further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site.
  • the at least first inverse primer further comprises, at the 5 'end, a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the kit may comprise a first inverse primer
  • the kit preferably comprises a plurality of different first inverse primers by their barcode sequences and, if present, by at least the 10 nucleotides specific to the 3 'end of the sequence. interest, the other elements remaining the same (ie, if present, the reverse priming site, the curvature module, the recognition site for the second restriction enzyme, the priming sense site or part of it, the universal boot site).
  • the kit may further comprise a sense primer comprising at least 10 nucleotides of the 5 'end of the sequence of interest or several sense primers, each comprising at least 10 nucleotides of the 5 'end of a sequence of different interest.
  • the at least first inverse primer further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, and at least 10 nucleotides of the 3 'end of the sequence of interest or a universal priming site.
  • the at least first inverse primer further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth enzyme of the invention. restriction and a universal boot site.
  • the kit may include a first inverse primer.
  • the kit may further comprise a sense primer comprising, from its 5 'end to its 3' end, a barcode sequence, a recognition site for a first restriction enzyme and at least one nucleotides of the 5 'end of the sequence of interest.
  • the kit further comprises several sense primers, different by their barcode sequences and by at least 10 nucleotides of the 5 'end of the sequence of interest.
  • the kit may further comprise at least one reverse primer comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 3 'end of the sequence of interest.
  • the kit may furthermore comprise several reverse primers comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 3 'end of one of the different sequences. 'interest.
  • the kit comprises at least one forward primer for each sequence of interest to be sequenced, comprising, from its 5 'end to its 3' end: a) a reverse priming site, a recognizing for the second restriction enzyme, a sense sense site, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest; or
  • a reverse priming site comprising a recognition site for the second restriction enzyme, a sense sense site, a barcode sequence, a recognition site for the first restriction enzyme, and at least 10 nucleotides of the 3 'end of the sequence of interest; or c) a priming sense site, a recognition site for the second restriction enzyme, a reverse priming site and at least 10 nucleotides of the 5 'end of the sequence of interest; or
  • a reverse priming site an optional curvature modulus attached to the biotin and comprising a recognition site for the second restriction enzyme, a sense sense site and at least 10 nucleotides of the 5 'end of the sequence of interest.
  • the kit may also include the appropriate (s) or associated inverse primer (s).
  • the kit may include a reverse primer specific to the 3 'end of the sequence of interest for sense primers of type a) and b); or a reverse primer comprising, from its 5 'end towards its 3' end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest for type c) and d) sense primers.
  • the kit may include a sense primer and its associated reverse primer.
  • the kit comprises a plurality of sense primers and reverse primers associated optionally, each designed to be specific to a different sequence of interest.
  • the forward and reverse primers differ from one another by their barcode sequence and by at least the 10 nucleotides of the 3 'end of the sequence of specific interest, the other elements (for example, the priming sense site, the recognition site for the second restriction enzyme, the reverse priming site, the curvature modulus and the recognition site for the first restriction enzyme remaining the same).
  • the kit comprises at least one reverse primer for each sequence of interest to be sequenced, comprising, from its 5 'end to its 3' end,
  • a priming sense site a recognition site for the second restriction enzyme, a reverse priming site, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest;
  • a priming sense site a curvature modulus comprising a recognition site for the second restriction enzyme, a reverse priming site, a barcode sequence, a recognition site for the first restriction enzyme, and at least 10 nucleotides of the 3 'end of the sequence of interest; or c) a priming sense site, a recognition site for the second restriction enzyme, a reverse priming site and at least 10 nucleotides of the 3 'end of the sequence of interest; or
  • a priming sense site a priming sense site, an optional curvature modulus attached to biotin and comprising a recognition site for the second restriction enzyme, a reverse priming site and at least 10 specific nucleotides at the 3 'end of the sequence of interest.
  • the kit may also include appropriate or associated sense primer (s).
  • the kit may include a sense primer specific for the 5 'end of the sequence of interest for inverse primers of type a) and b); or a sense primer comprising, from its 5 'end towards its 3' end, a barcode sequence, a recognition site for the first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest for inverse primers of type c) and d).
  • the kit may include an inverse primer and its associated sense primer.
  • the kit comprises several reverse primers and optionally the associated sense primers, each designed to be specific to a different sequence of interest.
  • the primers sense and inverse different from each other by their barcode sequence and by at least the 10 nucleotides of the 3 'end of the sequence of specific interest, the other elements (for example, if present, the site sense of priming, the recognition site for the first, second, third and fourth restriction enzyme, the reverse priming site and the curvature module remaining the same).
  • the first forward primer or the first reverse primer comprises a curvature module comprising a recognition site for the second restriction enzyme.
  • the curvature modulus is attached to a first member of an affinity binding pair, preferably biotin.
  • the curvature module can be as detailed below.
  • it comprises or consists of a sequence selected from the group of sequences SEQ ID No. 1 and SEQ ID No. 2.
  • kits may also include appropriate means for performing the amplification, particularly PCR or RT-PCR, such as the polymerase and necessary reagents including appropriate buffers, nucleotides, and the like.
  • kits may also include solid beads or supports supporting the second members of the affinity binding pairs.
  • avidins or streptavidins are bound to solid beads or supports.
  • kits may also include one or more of the restriction enzymes needed to apply the method, particularly the first, second, third and fourth restriction enzymes.
  • the kit may include at least the first and second restriction enzymes.
  • the kit may include the third restriction enzyme. It may further include the fourth restriction enzyme.
  • the circular nucleic acid molecules obtained in step b) of the method may also be obtained alternately by inter-molecular ligation between
  • linear nucleic acid molecules to be sequenced wholly or partially provided in step a) of claim 1, and linear nucleic acid molecules comprising the 5 'to 3' end
  • linear nucleic acid molecules comprising the 5 'to 3' end
  • the inter-molecular ligation products obtained are represented by the two circularized forms of FIGS. II and FIG. 1J.
  • the circularized nucleic acid molecules can undergo one or more steps of the method described above according to the structure of their sequences, which makes it possible to obtain a nucleic acid library ( or any intermediate thereof) object of the present invention.
  • the kit further comprises one or more of the nucleic acid linear molecule modifying enzymes for performing the inter-molecular ligation described in the foregoing embodiment.
  • the linear nucleic acid molecules to be sequenced in whole or in part may be a set of genes, or a set of chromosomal regions, or a set of genomes.
  • a barcode must be associated with each of the sequences of all of said linear nucleic acid molecules to be sequenced in whole or in part.
  • a library can be prepared from the combination of a barcode with each of the sequences of all of said linear nucleic acid molecules to be sequenced in whole or in part by the method of the invention described above. above, which allows providing a library of fragments of each of the sequences of all of said linear nucleic acid molecules to be sequenced wholly or partially associated with the same barcode.
  • the advantage of the present method is to simultaneously prepare several libraries, characterized in that each of the sequences of all of said linear nucleic acid molecules to be sequenced entirely or partially is associated with a specific (and different) barcode.
  • a barcode can be assigned to each particular organism.
  • the genomes can be sequenced simultaneously for several organisms.
  • Said linear nucleic acid molecules to be sequenced in whole or in part may also consist of a set or a plurality of sets of linear nucleic acid molecules comprising different nucleotide sequences.
  • the said linear nucleic acid molecules to be sequenced in whole or in part may be a set of genes or a set of cDNAs, or a set of chromosomal regions, or a set of whole genomes.
  • Said linear nucleic acid molecules to be sequenced in whole or in part are cleaved.
  • the cleavage is performed by the use of a sequence independent cleavage technique (SITC), such as sonication.
  • SITC sequence independent cleavage technique
  • the ends of the nucleic acid molecules are repaired after each cleavage or digestion step and / or each circulansation step.
  • the repair may include the reconstitution of the ends and / or the phosphorylation of the ends.
  • Restoration and phosphorylation can be performed by any method known to a skilled person.
  • the restoration can be carried out using a specific DNA polymerase, such as T4 DNA polymerase, in the presence of dNTPs, and phosphorylation can be performed using a DNA kinase, such as T4 polynucleotide kinase, in vitro. presence of ATP.
  • Said linear nucleic acid molecules to be sequenced in whole or in part are modified at their ends by the terminal transferase which catalyzes the addition of nucleotides, preferably ddNTPs, to the 3 'ends of the DNA, preferably the ddTTP, this which makes it possible to obtain linear nucleic acid molecules to be sequenced in whole or in part having incorporated a single residue T at each 3 'end.
  • the terminal transferase which catalyzes the addition of nucleotides, preferably ddNTPs, to the 3 'ends of the DNA, preferably the ddTTP, this which makes it possible to obtain linear nucleic acid molecules to be sequenced in whole or in part having incorporated a single residue T at each 3 'end.
  • linear molecules of nucleic acid modified at their ends by the terminal transferase which catalyzes the addition of nucleotides, preferably the ddNTPs, to the 3 'ends of the DNA, preferably ddATP, which makes it possible to obtain linear nucleic acid molecules having incorporated a single residue A at each 3 'end and comprising the 5' to 3 'end
  • linear molecules of nucleic acid modified at their ends by the terminal transferase which catalyzes the addition of nucleotides, preferably the ddNTPs, to the 3 'ends of the DNA, preferably ddATP, which makes it possible to obtain linear nucleic acid molecules having incorporated a single residue A at each 3 'end and comprising the 5' to 3 'end
  • kits may also include one or more of the modification enzymes of the linear nucleic acid molecules necessary to apply the method, in particular Terminal Transferase.
  • the kit may include at least the Terminal Transferase.
  • Kits may also include ddNTPs, especially ddTTPs and ddATPs.
  • the kit may include at least the ddTTPs.
  • the kit may include at least ddATP.
  • the kits may also comprise one or more modification enzymes for the linear nucleic acid molecules making it possible to promote inter-molecular ligation.
  • said method makes it possible to prepare a nucleic acid library, preferably a DNA library, for sequencing, characterized in that said method comprises:
  • each nucleic acid molecule comprising in its circulanated form and in the 5 'to 3' direction
  • step b) digesting the circularized nucleic acid molecules obtained from step b) with the first restriction enzyme
  • the linear nucleic acid molecules provided in step a) comprise under their in the 5 'to 3' direction, a sequence of interest, a reverse priming site, a priming sense site, and a barcode sequence placed between the priming sense site and the sequencing sequence. 'interest.
  • the linear nucleic acid molecules provided in step a) further comprise a recognition site for a third restriction enzyme placed upstream of the reverse priming site, said enzyme having a restriction site of said cleavage site in the sequence of interest, and characterized in that the cleavage of step d) is carried out by digestion with said third restriction enzyme.
  • the nucleic acid molecules provided in step a) further comprise a recognition site for a fourth restriction enzyme placed upstream of the reverse priming site and characterized in that the method further comprises after the step e):
  • step e) digesting the circularized nucleic acid molecules obtained from step e) with the fourth restriction enzyme having a cleavage site placed between the reverse priming site and the sequence of interest for said circularized molecules of the step e);
  • linear nucleic acid molecules comprising 5 'to 3' end, reverse priming site, priming sense site, barcode sequence and truncated sequence of interest in 3 '.
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a reverse priming site, a priming sense site, a barcode sequence and a sequence of interest.
  • the method further comprises, after step a) and before step b), the step of cleaving the linear nucleic acid molecules provided in step a), thereby providing linear molecules of nucleic acid comprising from the 5 'end to the 3' end, a reverse priming site, a priming sense site, a barcode sequence, and a 3 'truncated interest sequence.
  • the linear nucleic acid molecules provided in step a) comprise in their circularized form and in the 5 'to 3' direction, a reverse priming site, a sense site. a sequence of interest and a barcode sequence placed between the sequence of interest and the reverse priming site.
  • the linear nucleic acid molecules provided in step a) further comprise a recognition site for a third restriction enzyme placed downstream of the priming sense site, said enzyme having a restriction site downstream of said site of initiation. recognition in the sequence of interest, and characterized in that the cleavage of step d) is carried out by digestion with said third restriction enzyme.
  • the nucleic acid molecules provided in step a) further comprise a recognition site for a fourth restriction enzyme located downstream of the priming sense site, and characterized in that the method further comprises after step e):
  • step f) digesting the circularized nucleic acid molecules obtained from step e) with the fourth restriction enzyme having a cleavage site placed between the priming sense site and the sequence of interest for said circularized molecules;
  • the linear nucleic acid molecules provided in step a) comprise from the 5 'end to the 3' end, a sequence of interest, a barcode sequence, a reverse site and a sense site. boot.
  • the method further comprises, after step a) and before step b), the step of cleaving the linear nucleic acid molecules provided in step a), thereby providing linear molecules of nucleic acid comprising a 5 'end to a 3' end, a 5 'truncated sequence of interest, a barcode sequence, a reverse site and a priming sense site.
  • the method further comprises the step h) of circularization of the nucleic acid molecules obtained from step g) by intramolecular ligation.
  • the nucleic acid molecules provided in step a) comprise a binding site for a first member of an affinity binding pair or is attached to a first member of an affinity binding pair.
  • the method further comprises one or more steps of binding nucleic acid molecules to a solid support by the interaction between the first member of the affinity binding pair bound to said nucleic acid molecules and the second members of the pair binding by affinity bound to the solid support, in particular before the circularization step.
  • the method further comprises the step of binding the nucleic acid molecules obtained from step g) prior to performing circularization step h).
  • the method further comprises the step of digesting the circularized nucleic acid molecules with the second restriction enzyme, thereby providing linear nucleic acid molecules comprising from the 5 'end to the 3' end, a priming sense site, a truncated interest sequence, a reverse priming site, and a barcode sequence which is between the priming sense site and the sequence of interest or between the sequence of interest and the reverse boot site.
  • the method further comprises the step of amplifying the truncated barcode sequences and truncated interest sequences of said linear nucleic acid molecules using a primer pair hybridizing to the reverse priming sites and sense .
  • the cleavage steps of the nucleic acid molecules are performed using a cleavage technique regardless of the sequence.
  • the third restriction enzyme is selected from the group EcoP15I, MmeI, NmeAII, Acul, BbvI, BceAI, BpmI, BpuEI, BseRI, Bsg1, BsmFI, BtgZI, Ecil, Fok1, Hgal, I-Ceul, I-SceI, PI1, Pspl and PI-SceI.
  • the linear nucleic acid molecules provided in step a) further comprise a sequence of at least 15 base pairs that have less than 80% identity with the genome of the sequence of interest and which is placed between the sequence of interest and the element upstream of said sequence of interest or between the sequence of interest and the element downstream of said sequence of interest.
  • the linear nucleic acid molecules provided in step a) further comprise a curvature module which is placed, in their circularized form, between the reverse priming site and the priming sense site.
  • the curvature module includes a binding site for a first member of an affinity binding pair or is attached to the first member of an affinity binding pair.
  • Said curvature module comprises or consists of a sequence selected from the group consisting of SEQ ID No. 1 and SEQ ID No. 2.
  • the linear nucleic acid molecules provided in step a) were obtained by one or more DNA amplification reactions.
  • Said DNA amplification reactions are followed by the step of degrading the excess of single-stranded primers.
  • the method further comprises the step of restoring and / or phosphorylating each of the ends of the nucleic acid molecules after a cleavage step and / or before a circularization step.
  • the method further comprises the step of degrading the non-circularized nucleic acid molecules with a specific endonuclease of the linear nucleic acid molecules after a circularization step.
  • the nucleic acid molecules obtained from step h) have a length of 156 bp or a length of 156 bp plus a multiple of 21 bp.
  • a plurality of sets of linear nucleic acid molecules is provided in step a).
  • the nucleic acid library obtained from the method.
  • the kit comprises at least one first sense primer comprising, from its end 5 'towards its end 3',
  • a reverse priming site a recognition site for a second restriction enzyme, and a priming sense site or a part thereof including its 5 'end;
  • a reverse priming site comprising a recognition site for the second restriction enzyme, and a priming sense site or a part thereof including its 5 'end.
  • the kit further comprises at least one second sense primer comprising, from its 5 'end towards its end 3', a priming sense site or a part thereof and overlapping a part of the site of the priming sense direction.
  • the first sense primer a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest or a universal priming site.
  • the kit further comprises at least one second sense primer comprising, from its 5 'end towards its end 3', a priming sense site or a part thereof including its 3 'end and overlapping the part of the sense site. initiating the first sense primer, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site.
  • the kit comprises a sense primer and several second sense primers by their barcode sequences and, if present, by at least the 10 nucleotides of the 5 'end of the sequence of interest.
  • the first sense primer of the kit further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 5' end of the sequence of interest. or a universal boot site.
  • the first sense primer of the kit further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site.
  • the first sense primer of the kit further comprises, at the 5 'end, the recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the kit comprises several first different sense primers by their barcode sequences and, if present, by at least the 10 nucleotides of the 5 'end of the sequence of interest.
  • the kit further comprises an inverse primer comprising at least 10 nucleotides of the 3 'end of the sequence of interest or several reverse primers, each comprising at least 10 nucleotides of the 3' end of a sequence of interest. different.
  • the first sense primer of the kit further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, and at least 10 nucleotides of the 5' end of the sequence of interest or a universal priming site.
  • the first sense primer of the kit further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, and a universal priming site.
  • the kit includes a first sense primer.
  • the kit further comprises a reverse primer comprising, from its 5 'end to its 3' end, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 3 'end. of the sequence of interest.
  • the kit further comprises several reverse primers, different by their barcode sequences and by at least the 10 nucleotides of the 3 'end of the sequence of interest.
  • the kit further comprises at least one sense primer comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 5 'end of the sequence of interest.
  • the kit further comprises several sense primers comprising from its 5 'end towards its 3 'end, a universal priming site and at least 10 nucleotides of the 5' end of one of the different sequences of interest.
  • the kit comprises at least a first inverse primer comprising, from its 5 'end to its 3' end,
  • a priming sense site a recognition site for a second restriction enzyme, and a reverse priming site or a part thereof including its 3 'end;
  • a priming sense site a curvature module comprising a recognition site for the second restriction enzyme, and a reverse priming site or a part thereof including its 3 'end.
  • the kit further comprises at least a second reverse primer comprising, from its 5 'end towards its 3' end, a reverse priming site or a part thereof including its 5 'end and overlapping the part of the site reverse priming of the first inverse primer, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 3 'end of the sequence of interest or a universal site of boot.
  • the kit further comprises at least a second reverse primer comprising, from its 5 'end towards its 3' end, a reverse priming site or a part thereof including its 5 'end and overlapping the part of the reverse site. priming the first inverse primer, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site.
  • the kit comprises a first inverse primer and several second reverse primers different in their barcode sequences and, if present, by at least the 10 nucleotides of the 3 'end of the sequence of interest.
  • the first inverse primer of the kit further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 3' end of the sequence of interest. or a universal boot site.
  • the first reverse primer of the kit further comprises, at its 3 'end, a barcode sequence, a recognition site for a first restriction enzyme and a universal priming site.
  • the first reverse primer of the kit further comprises, at the 5 'end, the recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme.
  • the kit comprises several first different inverse primers by their barcode sequences and, if present, by at least the 10 nucleotides of the 3 'end of the sequence of interest.
  • the kit further comprises a sense primer comprising at least 10 nucleotides of the 5 'end of the sequence of interest or several sense primers, each of which comprises at least 10 nucleotides of the 5' end of a sequence of different interest. .
  • the first reverse primer of the kit further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, and at least 10 nucleotides of the 3' end of the sequence of interest or a universal boot site.
  • the first reverse primer of the kit further comprises at its 3 'end a recognition site for the third restriction enzyme and / or a recognition site for the fourth restriction enzyme, and a universal priming site.
  • the kit includes a first reverse primer.
  • the kit further comprises a sense primer comprising, from its 5 'end towards its 3' end, a barcode sequence, a recognition site for a first restriction enzyme and at least 10 nucleotides of the 5 'end of the sequence of interest.
  • the kit further comprises several sense primers, different by their barcode sequences and by at least the 10 nucleotides of the 5 'end of the sequence of interest.
  • the kit further comprises at least one reverse primer comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 3 'end of the sequence of interest.
  • the kit further comprises several reverse primers comprising, from its 5 'end towards its 3' end, a universal priming site and at least 10 nucleotides of the 3 'end of one of the different sequences of interest.
  • the first sense primer or the first inverse primer of the kit comprises a curvature module comprising a recognition site for the second restriction enzyme.
  • the curvature module of the kit is attached to a first member of an affinity binding pair, preferably biotin.
  • the bending module of the kit comprises or consists of a sequence selected from the group consisting of SEQ ID No. 1 and SEQ ID No. 2.
  • the kit further comprises solid beads or supports carrying the second members of the kit. affinity binding pair, preferably avidin or streptavidin.
  • the kit further comprises one or more restriction enzymes selected from the group consisting of the first, second, third and fourth restriction enzymes.
  • the circular nucleic acid molecules obtained in step b) of the method may also be obtained alternately by inter-molecular ligation between - said linear nucleic acid molecules to be sequenced entirely or partially provided in step a) of the method, and
  • linear nucleic acid molecules comprising the 5 'to 3' end
  • the nucleic acid library obtained from the method obtained from the method.
  • the kit further comprises one or more of the nucleic acid linear molecule modification enzymes for promoting inter-molecular ligation described in the foregoing embodiment.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La présente invention concerne une nouvelle méthode et un kit de préparation de bibliothèques d'acides nucléiques et en particulier destinées au séquençage à haut débit. Cette méthode est utile pour préparer simultanément une multitude de bibliothèques d'acide nucléique destinées au séquençage, chaque bibliothèque est caractérisée par une séquence de code-barres spécifique. En d'autres termes, au lieu de préparer en parallèle plusieurs bibliothèques qui seront barre-codées, la méthode de l'invention permet la préparation simultanée de plusieurs bibliothèques barre-codées en effectuant l'étape de préparation d'une seule bibliothèque. L'inventeur fournit des moyens pour introduire les code-barres au début de la méthode de préparation de la bibliothèque. Les bibliothèques fournies avec la méthode décrite ici peuvent être utilisées sur n'importe quelle plate-forme de séquençage à haut débit, tels que le 454 Genome Sequencer, l'Illumina Genome Analyzer ou la plate-forme SOLiD.

Description

SÉQUENÇAGE "MULTIPLEXED ANCHOR SCANNING PARALLEL END TAG" DOMAINE DE L'INVENTION
La présente invention concerne le domaine du séquençage d'ADN et plus particulièrement le domaine de préparation de bibliothèque destinée au séquençage.
CONTEXTE DE L'INVENTION
Depuis le début des années 90, la production de séquence d'ADN a été presque exclusivement effectuée avec la technologie de séquençage basée sur la chimie Sanger. Une nouvelle génération de technologies de séquençage a été développée récemment. Les technologies de séquençage à haut débit sont aussi connues sous le nom de « séquençage d'ADN de nouvelle génération » ou technologies NGS. Ces technologies ont été implémentées dans divers produits commerciaux tels que : 454 Génome Sequencer (Roche Applied Science), Illumina Génome Analyzer (Illumina, Inc.) la plate-forme SOLiD™ (Applied Biosystems). Toutes ces plateformes sont basées sur le séquençage par la synthèse, une série d'extensions périodiques d'une molécule d'ADN à l'aide d'amorces réalisées par une polymérase ou par une ligase. Ainsi, le processus de séquençage est composé d'une alternance de cycles d'extension (ou hybridation-ligation chimique) par les enzymes et d'acquisition de données.
Les bibliothèques utilisées dans le séquençage par les technologies NGS sont habituellement préparées par fragmentation aléatoire de l'ADN suivie de ligation in vitro d'adaptateurs communs. Les substrats de séquençage sont produits par amplification avec des amorces communes par PCR puis immobilisés sur une surface solide ou un autre support. Les plateformes NGS présentent des coûts bas car elles peuvent décoder simultanément des millions de séquences distinctes déposées sur une lame à deux dimensions. En effet, tous les dispositifs de séquençage immobilisés sur les lames peuvent être traités de façon enzymatique par un seul volume de réactif et le coût de ce réactif est amorti sur l'ensemble du dispositif complet du séquençage. Afin de maximiser la capacité de séquençage dans une seule réaction et réduire ainsi le coût du séquençage par base, des méthodes de multiplexage ont été développées. Des adaptateurs à code-barres sont ligaturés à chaque bibliothèque et plusieurs bibliothèques à code- barres peuvent être mises en commun pour être séquencées dans une seule réaction. Néanmoins, la préparation de plusieurs bibliothèques nécessite du temps et de l'argent. En effet, la préparation des bibliothèques a besoin d'environ une semaine de travail.
Les plateformes de séquençage de nouvelle génération sont des plateformes à haut débit et des coûts bas mais sont limitées par la longueur des fragments d'ADN séquencés. Une solution à cette limitation est le séquençage "paired-end tag" (PET) dans lequel des courtes étiquettes appariées sont extraites à partir des extrémités de longs fragments d'ADN et sont liées covalemment sous forme de constructions de di-tag destinées au séquençage de nouvelle génération et la cartographie contre un génome de référence (Fullwood et al 2009). La stratégie PET est la seule technique adaptée aux technologies NGS et qui permet la détection de délétion, inversion, duplication en tandem, insertion et translocation qui sont actuellement associées aux maladies humaines. En conséquence, il y a une forte demande pour des méthodes efficaces et peu coûteuses pour la préparation de bibliothèques pour les technologies de séquençage de nouvelle génération et en particulier pour la préparation de bibliothèque à code-barres PET.
RÉSUMÉ DE L'INVENTION
La présente invention, appelée "Multiplexed Anchor Scanning Parallel End Tag Sequencing" (séquençage MASPET), concerne une méthode et un kit pour préparer une bibliothèque d'acide nucléique, de préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend :
a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circulaire dans la direction 5' vers 3'
- une séquence d'intérêt à être séquencée entièrement ou partiellement
- un site inverse d'amorçage,
- un site sens d'amorçage,
séquence de code-barres spécifique à chaque ensemble de molécules d'acide nucléique, qui est placé entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et
- deux sites de restriction pour deux enzymes de restriction différentes :
- un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et
- un deuxième site de restriction pour une deuxième enzyme de restriction qui est placé entre le site inverse d'amorçage et le site sens d'amorçage ;
b) circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire ; c) digestion desdites molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ;
d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et
e) circularisation desdites molécules clivées d'acide nucléique obtenues à partir de l'étape d) par ligation intra-moléculaire,
ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage.
Dans un premier mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code- barres placée entre le site sens d'amorçage et la séquence d'intérêt.
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en amont du site inverse d'amorçage, ladite enzyme ayant un site de clivage en amont dans la séquence d'intérêt, et caractérisé en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
Dans un mode de réalisation supplémentaire particulier, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en amont du site inverse d'amorçage et caractérisé en ce que la méthode comprend après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'; et
h) en option, la circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
Alternativement, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'.
Dans un deuxième mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code- barres placée entre la séquence d'intérêt et le site inverse d'amorçage.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en aval du site sens d'amorçage, ladite enzyme ayant un site de restriction en aval dudit site de clivage dans la séquence d'intérêt, et caractérisé en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
Alternativement, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage ; et
h) en option, circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
Dans une autre alternative, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers 3', une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' à 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage.
De préférence, les molécules d'acide nucléique fournies à l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité, et la méthode comprend en outre une ou plusieurs étapes de liaison des molécules d'acide nucléique sur un support solide par l'interaction entre le premier élément d'une paire se liant par affinité attaché à ces molécules d'acide nucléique et des membres de ladite seconde paire se liant par affinité lié au support solide, en particulier avant l'étape de circularisation.
De préférence, la méthode comprend en outre l'étape de digestion des molécules d'acide nucléique circularisées avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules d'acide nucléique linéaires comprenant de l'extrémité 5' vers l'extrémité 3', un site sens d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code- barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage. Plus préférentiellement, la méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites inverse et sens d'amorçage.
De préférence, les étapes de clivage des molécules d'acide nucléique sont réalisées en utilisant une technique de clivage indépendamment de la séquence, de préférence par sonication.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site universel d'amorçage en amont ou en aval de la séquence d'intérêt.
De préférence, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens d'amorçage, et qui est attaché à un premier membre d'une paire se liant par affinité, de préférence un module de courbure comprenant ou consistant en la séquence sélectionnée parmi le groupe consistant en SEQ ID No. 1 et SEQ ID No. 2.
La présente invention concerne une bibliothèque d'acide nucléique obtenue à partir de la méthode décrite ci-dessus ou de n'importe quel produit intermédiaire de celle-ci. La présente invention concerne un kit comprenant au moins une amorce sens comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celle-ci, y compris son extrémité 5'. Dans un premier mode de réalisation, le kit comprend au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de l'extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
Dans un deuxième mode de réalisation, l'au moins première amorce sens comprend en outre, à son extrémité 5', soit
- une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage, et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction
et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou
- un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
La présente invention se rapporte alternativement à un kit comprenant au moins une première amorce inverse comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3' ; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Dans un premier mode de réalisation, le kit comprend au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou du site universel d'amorçage.
Dans un deuxième mode de réalisation, l'au moins première amorce inverse comprend aussi, à son extrémité 3', soit
- une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou
- un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
De préférence, la première amorce sens ou la première amorce inverse du kit comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction et attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine. De préférence, le module de courbure comprend ou consiste en la séquence sélectionnée parmi le groupe des séquences SEQ ID No. 1 et SEQ ID No. 2. En option, le kit comprend en outre, des billes ou des supports solides soutenant le deuxième membre des paires se liant par affinité, de préférence l'avidine ou la streptavidine.
BREVE DESCRIPTION DES FIGURES
Fig. 1 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique.
FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2 : Site de Restriction 2, BC : Code-barres, SEQ : séquence d'acide nucléique.
Fig. 2 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique comprenant l'utilisation du site universel d'amorçage.
UPS : site universel d'amorçage, CM : module de courbure, FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2 : Site de Restriction 2, BC : Code-barres, SEQ : séquence d'acide nucléique.
Fig. 3 représente un mode de réalisation d'une méthode pour préparer une bibliothèque d'acide nucléique incluant l'utilisation du module courbure.
UPS : site universel d'amorçage, CM : module de courbure, FR : Amorce sens, RP : Amorce inverse, RS1 : Site de Restriction 1, RS2 : Site de Restriction 2, RS3 : Site de Restriction 3, RS4 : Site de Restriction 4, BC : Code-barres, SEQ : séquence d'acide nucléique.
DESCRIPTION DÉTAILLÉE DE L'INVENTION
L'inventeur a développé une nouvelle méthode pour préparer une bibliothèque d'acide nucléique et en particulier une bibliothèque de PET, pour être séquencée avec les technologies de séquençage de nouvelle génération. Cette méthode est utile pour préparer simultanément une multitude de bibliothèques d'acide nucléique pour être séquencées, chacune de ces bibliothèques est caractérisée par une séquence spécifique de code-barres. Avec la méthode de l'invention, plusieurs bibliothèques d'acide nucléique peuvent être simultanément bar-codées et séquencées. En d'autres termes, au lieu de préparer en parallèle plusieurs bibliothèques pour être bar-codées, la méthode de l'invention permet la préparation simultanée de plusieurs bibliothèques à code-barres en réalisant l'étape de préparation d'une seule bibliothèque. L'inventeur fournit des moyens pour introduire les code-barres au début de la méthode de préparation de bibliothèque. Ainsi, le coût de séquençage est considérablement réduit.
Cependant, en plus de l'abaissement du coût et du temps, la bibliothèque de séquençage décrite ci-dessus présente en outre, d'autres avantages techniques. Un des plus grands avantages est que les bibliothèques de séquençage préparées par la méthode décrite fournissent des informations au sujet des arrangements structuraux des séquences. En effet, si un code-barres est utilisé pour une séquence d'intérêt particulière, il est possible de déduire que deux séquences (par exemple, indicatif d'un gène, d'un exon, ou analogues) sont portées par le même acide nucléique amplifié et sont donc associées. En conséquence, la méthode en tant que décrit permet la détection de translocation, délétion, inversion, duplication ou insertion.
La méthode décrite ci-dessus convient à la préparation des bibliothèques permettant le séquençage simultané d'un nombre quasi-infini de séquences de régions d'intérêt dérivées de différents échantillons (par exemple, un ensemble de gènes de différents organismes, d'un même acide nucléique mais provenant de différents individus ou de différents acides nucléiques dérivés d'un seul individu).
La méthode permet le contrôle de la taille et de l'orientation des acides nucléiques à séquencer.
La méthode permet l'élimination ou la diminution des produits chimériques et des faux positifs résultant des ligations non spécifiques. En effet, la méthode est basée sur l'amplification et les étapes de ligation intra-moléculaires ou de circularisation, évitant de ce fait les étapes de ligation utilisées dans les méthodes de l'art antérieur et responsables des inconvénients générant des produits chimériques.
Les bibliothèques fournies par la méthode décrite ci-dessus peuvent être utilisées sur n'importe quelle plate-forme NGS, tels que : 454 Génome Séquencer (Roche Applied Science), Illumina Génome Analyzer (Illumina, Inc.) ou la plate-forme SOLiD™ (Applied Biosystems).
Définitions
Tel qu'utilisé ici, le terme « molécule d'acide nucléique » se rapporte aux polymères simple brin et double brins des monomères de nucléotide, y compris l'ADN et l'ARN, liés par des liaisons phosphodiester. La molécule d'acide nucléique peut être linéaire ou circulaire. Les molécules d'acide nucléique peuvent être des molécules d'ADN, des molécules d'ARN ou des molécules chimériques d'ADN-ARN. Elles peuvent aussi comprendre des analogues de nucléobase et de sucre. De préférence, le terme « molécule d'acide nucléique » est utilisé ici pour se rapporter à une molécule double brin linéaire ou circulaire d'ADN.
Tel qu'utilisé ici, le terme « bibliothèque d'acide nucléique » se rapporte à une pluralité de différentes molécules simple brin ou double brins d'acide nucléique, en particulier des molécules d'ADN. Ces molécules peuvent être linéaires ou circulaires. Les molécules d'acide nucléique de la bibliothèque peuvent être ou non attachées covalemment à un support solide tels que des billes et en particulier des billes ou support recouvert de streptavidine.
Les termes « en amont » et « en aval », comme utilisés ci-dessus, se rapportent à une position d'un élément discret sur une molécule d'acide nucléique par rapport à un autre élément discret. Un premier élément est en amont à un deuxième élément lorsqu'il est placé dans la direction 5' du brin codant dudit deuxième élément. Un premier élément est en aval à un deuxième élément lorsqu' il est placé dans la direction 3' du brin codant dudit deuxième élément.
Les termes « extrémité 5' » et « extrémité 3' », tel qu'utilisé ici, se rapportent à l'extrémité 3' et l'extrémité 5' du brin codant.
Tel qu'utilisé ici, le terme « adjacent » se rapporte à une position d'un élément discret sur une molécule d'acide nucléique par rapport à un autre élément discret. Un premier élément est à côté d'un deuxième élément une fois placé à l'extrémité 5' ou à l'extrémité 3' dudit deuxième élément. Cette limite indique qu'aucun autre élément n'est présent entre le premier et le deuxième élément. En particulier, le terme « adjacent » signifie que les premiers et les deuxièmes éléments sont consécutifs (c.-à-d., il n'y a aucun nucléotide s 'intercalant) ou sont séparés par un nombre non significatif de nucléotides, de préférence moins de 20, 15, 10, 5 ou 2 nucléotides.
Tel qu'utilisé ici, le terme « amorce » se rapporte à un polynucléotide d'environ 10-200 nucléotides de longueur. L'amorce s'hybride avec la cible (ou la matrice) et fournit un point d'initiation pour la synthèse dirigée par la matrice d'un polynucléotide complémentaire à la cible catalysée par une enzyme dite polymérase telle qu'une ADN polymérase (réaction d'amplification en chaîne par la polymérase). Des réactions de PCR sont typiquement réalisées avec une paire d'amorces : une amorce sens (ou amorce amont) et une amorce inverse (ou amorce aval) qui délimite la région à amplifier.
Le terme « enzyme de restriction » ou « endonucléase de restriction » est prévu pour se rapporter à une enzyme qui identifie un site de reconnaissance spécifique (ou site de restriction) sur une molécule monocaténaire ou double brin d'acide nucléique et coupe cette molécule à un site de clivage. Tel qu'utilisé ici, le terme « site de restriction » (RS) se rapporte à une séquence spécifique de nucléotides reconnue par une enzyme de restriction. Tel qu'utilisé ici, le terme « site de clivage » (CS) se rapporte à un site dans lequel l'enzyme de restriction coupe la molécule d'acide nucléique. Les enzymes de restriction peuvent reconnaître et cliver la molécule d'acide nucléique au même site. Les enzymes de restriction peuvent aussi cliver la molécule d'acide nucléique à un site éloigné du site de reconnaissance. Selon l'enzyme de restriction, le site de clivage peut être placé en aval ou en amont du site de reconnaissance.
Tel qu'utilisé ici, le terme « ligation intra-moléculaire » se rapporte à la ligation de deux extrémités d'une molécule linéaire d'acide nucléique. Tel qu'utilisé ici, le terme « ligation intermoléculaire » se rapporte à la ligation des extrémités de deux molécules linéaires d'acide nucléique Tel qu'utilisé dans ces spécifications, le terme « environ » se rapporte à une gamme du ± 10% de la valeur spécifique. Par exemple, « environ 20 » inclut le ± 10 % de 20, et se rapporte de 18 à 22. De préférence, le terme « environ » se rapporte à une gamme de valeurs ± 5 % de la valeur spécifique.
Tel qu'utilisé ici, le terme « paire se liant par affinité » se rapporte à un système basé sur deux membres capables d'association les uns avec les autres, en covalence ou pas, de préférence non-covalente. Par exemple, le premier membre peut être la biotine et le deuxième membre peut être la streptavidine ou l'avidine. Un autre exemple d'une paire se liant par affinité est la digoxygénine et l'anticorps anti-digoxygénine. D'autres paires se liant par affinité sont connues dans l'art et considérées avec attention ici.
Tel qu'utilisé ici, le terme « forme circularisée d'une molécule linéaire d'acide nucléique » se rapporte au produit obtenu par ligation intra-moléculaire de ladite molécule, c.-à-d. la ligation de l'extrémité 5' et de l'extrémité 3' de ladite molécule. Toutefois, ce terme n'est pas associé à la préparation réelle d'une telle forme circularisée mais est commode pour la description de la molécule d'acide nucléique linéaire.
Dans un premier aspect, la présente invention concerne une méthode pour préparer une bibliothèque d'acide nucléique, en particulier une bibliothèque d'acide nucléique à séquencer. La bibliothèque obtenue par cette méthode peut être l'ADN ou une bibliothèque d'ARN, de préférence une bibliothèque d'ADN.
La méthode de l'invention comprend (i) l'étape de fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant une séquence d'intérêt à être entièrement ou partiellement séquencée et une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique et (ii) plusieurs étapes de circularisation, de digestion et de clivage pour fournir une bibliothèque caractérisée en ce que chaque ensemble des molécules d'acide nucléique est associé à un code-barres spécifique. Chaque dispositif de séquençage fourni par cette bibliothèque comprend un fragment de la séquence d'intérêt et un code-barres qui sera séquencé simultanément avec ledit fragment. Dans un mode de réalisation préféré, la méthode comprend l'étape i) de fourniture d'une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant une séquence d'intérêt à être séquencée entièrement ou partiellement et une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique. En particulier, la méthode comprend l'étape i) de fourniture de « n » ensembles de molécules linéaires d'acide nucléique comprenant une séquence à être séquencée entièrement ou partiellement et une séquence de code-barres (spécifique à chaque ensemble des molécules d'acide nucléique), « n » étant un nombre entier entre 1 et 1000. En conséquence, différentes séquences d'intérêt « n » peuvent être simultanément séquencés, chacune est associée à une séquence distincte de code- barres. « n » est limité par la capacité des séquenceurs.
La première étape de la méthode consiste en (a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circularisée et dans la direction 5' vers 3'
- une séquence à être séquencée entièrement ou partiellement un site inverse d'amorçage,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique, qui est placé entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et
- deux sites de reconnaissance pour deux enzymes de restriction différentes :
- un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et
- un deuxième site de restriction pour une deuxième enzyme de restriction qui est placé entre le site inverse d'amorçage et le site sens d'amorçage.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) peuvent comprendre de l'extrémité 5' vers l'extrémité 3' :
- un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt (Fig. 1 A) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt et un site inverse d'amorçage (Fig. 1B) ; ou
- une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage et un site sens d'amorçage (Fig. 1C) ; ou
- une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres (Fig. 1D) ; ou
- un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres (Fig. 1E) ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage (Fig. 1F) ; ou
- une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig. 1G) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un site sens d'amorçage et une séquence d'intérêt (Fig. 1H).
Lorsque l'on considère la molécule d'acide nucléique comprenant dans sa forme circularisée, toutes les formes linéaires mentionnées ci-dessus peuvent être récapitulées par deux formes circularisées : La Fig. II est la forme circularisée récapitulant les acides nucléiques linéaires de la Fig. 1A-D et la Fig. 1J est la forme circularisée récapitulant les acides nucléiques linéaires de la Fig. 1E-H.
De préférence, toutes les molécules d'acide nucléique ont la même conformation ou arrangement des différents éléments, c.-à-d. une des structures présentées ci-dessus. Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) sont des molécules double brins d'ADN.
Le site inverse d'amorçage (RP) et le site sens d'amorçage (FP) sont connus et ont des séquences prédéterminées. Ces sites d'amorçage sont utilisés pour amplifier les dispositifs de séquençage en utilisant des amorces spécifiques de ces sites. Les amorces utilisées pour la réaction d'amplification peuvent être des amorces universelles de séquençage. Dans un mode de réalisation préféré, l'amorce inverse de séquençage s'hybride au site inverse d'amorçage et l'amorce sens de séquençage s'hybride au site sens d'amorçage. Ces sites d'amorçage peuvent être facilement conçus par une personne qualifiée selon la technologie de séquençage et avec les amorces universelles qui sont prévues pour être utilisées. Le site inverse d'amorçage (RP) et le site sens d'amorçage (FP) s'appellent :
PI (5'CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT3') et
P2 (5'CTGCCCCGGGTTCCTCATTCTCT3') dans le système SOLiD.
La séquence d'intérêt peut être n'importe quelle séquence d'acide nucléique d'une longueur d'environ 25 paires de bases (bp) à 15 kbp. En particulier, la limitation principale pour la longueur de la séquence d'intérêt est liée à la limitation d'amplification.
La séquence d'intérêt peut être un gène d'intérêt ou d'un segment de celui-ci, ou une région chromosomique d'intérêt. Un code-barres doit être associé à une séquence d'intérêt. Puis, une bibliothèque peut être préparée à partir de l'association d'un code-barres à une séquence d'intérêt par la méthode décrite ci-dessus, ce qui permet de fournir une bibliothèque de fragments de la séquence d'intérêt associées au même code-barres. Naturellement, comme expliqué dans l'introduction de la description détaillée, l'avantage de la présente méthode est de préparer simultanément plusieurs bibliothèques, caractérisées en ce que chaque séquence initiale d'intérêt est associée à un code-barres spécifique (et différent). Par exemple, si la méthode est appliquée au séquençage d'un gène particulier d'intérêt pour plusieurs individus ou organismes (par exemple, un oncogène tel que le gène p53), un code-barres peut être attribué à chaque individu ou organisme particulier. En conséquence, le gène peut être simultanément séquencé pour plusieurs individus ou organismes. Alternativement, si plusieurs gènes ou régions chromosomiques doivent être séquencés pour un même individu, un code- barres peut être attribué à chaque gène particulier ou régions chromosomiques.
La séquence de code-barres est une séquence d'acide nucléique comprenant de 5 à 15bp, de 5 préférence de 5 à lObp. Cette séquence de code-barres est spécifique à chaque ensemble des molécules d'acide nucléique. De préférence, cette séquence de code-barres ne comprend aucun site de restriction. Quand on considère la forme circularisée des molécules d'acide nucléique décrites ci-dessus, le code-barres est toujours à côté de la séquence d'intérêt soit en amont de la séquence d'intérêt, et en particulier entre le site sens d'amorçage et la séquence d'intérêt (Fig. II) ; ou en aval
10 de la séquence d'intérêt, et en particulier entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1J). Lorsque l'on considère les différentes formes possibles linéaires fournies à l'étape a), ce qui signifie que la séquence de code-barres peut être placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. 1A et Fig. 1B), entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1F et Fig. 1G), en amont de la séquence d'intérêt (Fig. 1C), en aval de la séquence d'intérêt
15 (Fig. 1E), en aval du site sens d'amorçage (Fig. 1D) ou en amont du site inverse d'amorçage (Fig.
1H).
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site universel d'amorçage (UPS). Ce site universel d'amorçage comprend ou consiste en une
20 séquence d'au moins de 10 paires de bases, de préférence au moins 15 pb, de préférence au moins 20 pb. De préférence, le site universel d'amorçage se compose de 10 à 25 pb, de préférence de 15 à 20 pb. Ladite séquence possède moins de 90 % d'identité avec le génome contenant la séquence d'intérêt. De préférence, la séquence possède moins de 80 % d'identité avec le génome contenant la séquence d'intérêt, de préférence moins de 70 % d'identité et plus préférablement, moins de
25 60% d'identité. Dans un mode de réalisation particulier, le site universel d'amorçage comprend ou consiste en une séquence d'au moins 15 pb et qui possède moins de 80 % d'identité avec le génome contenant la séquence d'intérêt. Le site universel d'amorçage peut être placé en amont ou en aval de la séquence d'intérêt.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) et comprenant en outre
30 un site universel d'amorçage (UPS) qui peut comprendre, par exemple, de l'extrémité 5' vers l'extrémité 3' :
- un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (Fig. 2 A) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt et un site inverse d'amorçage (Fig. 2B) ; ou
- une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2C) ; ou
- une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres (Fig. 2D) ; ou
- un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig. 2E) ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de code-barres et un site inverse d'amorçage (Fig. 2F) ; ou
- une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2G) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, et une séquence d'intérêt (Fig. 2H).
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, une séquence d'intérêt, un UPS, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2C).
Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig. 2E).
Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (Fig. 2A).
Dans un autre mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage (Fig. 2G).
Les molécules mentionnées ci-dessus comprenant une séquence UPS sont les préférées. D'autres molécules comprenant une séquence UPS peuvent être envisagées, mais avec un arrangement moins favorable.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un module de courbure (CM) placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens d'amorçage. En considérant les molécules linéaires d'acide nucléique fournies dans l'étape a), le module de courbure placé entre le site inverse d'amorçage et le site sens d'amorçage ou, lorsque les sites d'amorçage sont placés à chaque extrémité de la molécule (la Fig. 1 ou 2, le B et F), est placé soit en aval du site inverse d'amorçage ou en amont du site sens d'amorçage. Le module de courbure est une séquence de nucléotide induisant une courbure dans la structure de l'hélice d'une molécule d'acide nucléique. Ce module peut être utilisé pour faciliter la circularisation des molécules d'acide nucléique, en particulier les molécules d'acide nucléique comprenant moins de 250 bp. Ce module peut comprendre ou consister en une séquence de nucléotide obtenu ou dérivé des minicercles d'ADN de kinétoplaste trouvés dans la plupart des espèces de Trypanosoma et en particulier des minicercles d'ADN de kinétoplaste de Crithidia fasciculata. Le module de courbure peut comprendre ou consiste en, une séquence sélectionnée parmi le groupe de séquences suivant : SEQ ID No. 1 et SEQ ID No.2 et une séquence ayant au moins 90 % d'identité avec les séquences SEQ ID No. 1 et SEQ ID No. 2. Dans un mode de réalisation, le module de courbure comprend ou consiste en, une séquence sélectionnée parmi le groupe de séquences SEQ ID No. 1 et SEQ ID No. 2. Dans un mode de réalisation particulier, le module de courbure comprend ou consiste en, la séquence SEQ ID No. 1. Dans un autre mode de réalisation particulier, le module de courbure comprend ou consiste en, la séquence SEQ ID No. 2. (Birkenmeyer et al 1985, Ulanovsky et al 1986, Kitchin et al 1 86). En conséquence, les molécules linéaires d'acide nucléique fournies dans l'étape a) et comprenant aussi un module de courbure peut comprendre, par exemple, de l'extrémité 5' vers l'extrémité 3' :
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt (dérivé de la Fig. 1 A arrangement) ; ou
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (dérivé de la Fig. 2A arrangement ; Fig. 3A) ; ou
- un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt et un site inverse d'amorçage (dérivé de la Fig. 1B arrangement) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 1B arrangement) ; ou
- un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt et un site inverse d'amorçage (dérivé de la Fig. 2B arrangement) ; ou - un site sens d'amorçage, une séquence de code-barres, une séquence UPS, une séquence d'intérêt, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 2B) ; ou
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage et un module de courbure ; ou
- une séquence de code-barres, une séquence d'intérêt, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 1C arrangement) ; ou
- une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 2C ; Fig. 3B) ; ou
- une séquence d'intérêt, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence de code-barres (dérivé de la Fig. 1D arrangement) ; ou
- une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence de code-barres (dérivé de la Fig. 2D arrangement) ; ou
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres (dérivé de la Fig. 1E arrangement) ; ou
- un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (dérivé de la Fig. 2E arrangement ; Fig. 3C) ; ou
- un module de courbure, un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage (dérivé de la Fig. 1F arrangement) ; ou
- un module de courbure, un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de code-barres et un site inverse d'amorçage (dérivé de la Fig. 2F arrangement) ; ou
- un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt, une séquence de code-barres et un site inverse d'amorçage ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 1F arrangement) ; ou
- un site sens d'amorçage, une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage et un module de courbure (dérivé de la Fig. 2F arrangement) ; ou
- une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 1G arrangement) ; ou
- une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (dérivé de la Fig. 2G arrangement ; Fig. 3D) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage et une séquence d'intérêt (dérivé de la Fig. 1H arrangement) ; ou
- une séquence de code-barres, un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS et une séquence d'intérêt (dérivé de la Fig. 2H arrangement).
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, une séquence d'intérêt, une séquence UPS, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (Fig. 3B).
Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence UPS, une séquence d'intérêt et une séquence de code-barres (Fig. 3C).
Dans un mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure, un site sens d'amorçage, une séquence de code-barres, une séquence UPS et une séquence d'intérêt (Fig. 3A).
Dans un autre mode de réalisation préféré, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence UPS, une séquence de code-barres, un site inverse d'amorçage, un module de courbure et un site sens d'amorçage (Fig. 3D).
Les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de reconnaissance pour une première enzyme de restriction.
Le site de reconnaissance pour la première enzyme de restriction est placé, en considérant la forme circularisée des molécules d'acide nucléique, entre le code-barres et la séquence d'intérêt.
Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres à côté de la séquence d'intérêt (Fig. 1 A-C, E-G ; Fig. 2C et 2E, Fig. 3B et C), et le site de reconnaissance pour la première enzyme de restriction est placé entre la séquence de code-barres et la séquence d'intérêt.
Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres dans l'extrémité 5' et une séquence d'intérêt dans l'extrémité 3' (Fig. 1H et Fig. 2H), et le site de reconnaissance pour la première enzyme de restriction est placé en amont de la séquence de code-barres ou en aval de la séquence d'intérêt, mais de préférence en amont de la séquence de code-barres.
Dans un mode de réalisation additionnel, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent une séquence de code-barres de l'extrémité 3' et une séquence d'intérêt de l'extrémité 5' (Fig. 1D et Fig. 2D) et le site de reconnaissance pour la première enzyme de restriction est placé en aval de la séquence de code-barres ou en amont de la séquence d'intérêt, mais de préférence en aval de la séquence de code-barres.
Dans un mode de réalisation supplémentaire, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent un site universel d'amorçage (UPS) entre la séquence de code-barres et la séquence d'intérêt (Fig. 2A, 2B, 2F et 2G, Fig. 3A et 3D) et le site de reconnaissance pour la première enzyme de restriction est placé entre le site universel d'amorçage (UPS) et la séquence de code-barres ou dans ledit site universel d'amorçage (de préférence près de la séquence de code-barres).
Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une deuxième enzyme de restriction qui est placé, lorsqu'on considère la forme circularisée des molécules d'acide nucléique, entre les deux sites d'amorçage (par exemple, Fig. II et 1J). Dans un mode de réalisation particulier, les molécules d'acide nucléique comprennent aussi un module de courbure placé entre le site inverse et le sites sens d'amorçage et le deuxième site de restriction pour la deuxième enzyme de restriction est placé dans ledit module de courbure (Fig. 3A-D).
Dans un mode de réalisation très particulier, les molécules d'acide nucléique comprennent aussi un module de courbure placé entre les sites inverse et sens d'amorçage, le deuxième site de restriction pour la deuxième enzyme de restriction est placé dans ledit module de courbure et la deuxième enzyme de restriction est Pacl.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de reconnaissance pour une troisième enzyme de restriction. La troisième enzyme de restriction est une endonucléase non palindromique qui clive l'ADN à une distance définie de son site de reconnaissance.
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. II), et le site de reconnaissance pour la troisième enzyme de restriction est placé en amont du site inverse d'amorçage. Dans ce mode de réalisation, la troisième enzyme de restriction coupe les molécules d'acide nucléique dans un site de clivage en amont à son site de reconnaissance, c.-à-d. dans la séquence d'intérêt pour la forme circularisée des molécules.
Dans un autre mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1J), et le site de reconnaissance pour la troisième enzyme de restriction est placé en aval du site sens d'amorçage. Dans ce mode de réalisation, la troisième enzyme de restriction coupe ADN (c.-à-d., une coupure double brin) dans un site de clivage en aval de son site de reconnaissance, c.-à-d. dans la séquence d'intérêt pour la forme circularisée des molécules.
Dans un mode de réalisation particulier, la troisième enzyme de restriction est choisie dans le groupe EcoP15I, Mmel, NmeAIII, Acul, Bbvl, BceAI, Bpml, BpuEI, BseRI, Bsgl, BsmFI, BtgZI, Ecil, Fokl, Hgal, I-Ceul, I-Scel, Pi-Pspl et Pi-Scel. Dans un mode de réalisation plus particulier, la troisième enzyme de restriction est choisie parmi le groupe EcoPISI, Mmel et NmeAIII. Dans un mode de réalisation préféré, la troisième enzyme de restriction est EcoP15I.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de reconnaissance pour une quatrième enzyme de restriction.
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. II), et le site de reconnaissance pour la quatrième enzyme de restriction est placé en amont du site inverse d'amorçage.
Dans un autre mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent, lorsqu'elles sont considérées sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage (Fig. 1J), et le site de reconnaissance pour la quatrième enzyme de restriction est placé en aval du site sens d'amorçage.
Les premières, deuxièmes, troisièmes et quatrièmes enzymes de restriction peuvent être choisies afin d'avoir des sites de clivage additionnels rares/occasionnels ou pas de site de clivage additionnels dans la séquence d'intérêt et dans n'importe quelle autre partie des molécules d'acide nucléique. De préférence, les enzymes de restriction sont choisies afin d'avoir seulement un site de clivage dans les molécules d'acide nucléique.
De préférence, les premières, deuxièmes et quatrièmes enzymes de restriction coupent l'ADN (c.-à-d., coupure double brin) dans leurs sites de reconnaissance ou à une distance de ces sites inférieure à 5 nucléotides. De préférence, les premières, deuxièmes et quatrièmes enzymes de restriction coupent l'ADN dans leurs sites de reconnaissance.
Ces enzymes de restriction peuvent être choisies pour n'avoir aucun site de clivage ou une fréquence de coupure basse dans la séquence d'intérêt. La fréquence des sites d'une enzyme de restriction dans les génomes séquencés peut être facilement trouvée par une personne qualifiée sur les bases de données disponibles (comme REBASER http://rebase.neb.com). Des enzymes de restriction peuvent être choisies ainsi afin d'avoir une fréquence de coupure basse dans le génome contenant la séquence d'intérêt.
Dans un mode de réalisation particulier, la première enzyme de restriction est choisie dans le groupe Srfl, Sbfl, Ascl, Notl, BssHII, SacII, Fsel, Smal. Dans un mode de réalisation préféré, la première enzyme de restriction est choisie dans le groupe Srfl et Sbfl.
Dans un mode de réalisation particulier, la deuxième enzyme de restriction est choisie dans le groupe Pacl, Ascl, Notl, BssHII, SacII, Fsel, Smal. Dans un mode de réalisation préféré, la deuxième enzyme de restriction est Pacl.
Dans un mode de réalisation particulier, la quatrième enzyme de restriction est choisie dans le groupe Pmel, Ascl, Notl, BssHII, SacII, Fsel, Smal. Dans un mode de réalisation préféré, la quatrième enzyme de restriction est choisie dans le groupe Pmel et Ascl.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent en outre, comprendre un site de liaison pour un premier membre d'une paire se liant par affinité. De préférence, ce site de liaison est placé dans la région de l'extrémité 5' du site inverse d'amorçage à l'extrémité 3' du site sens d'amorçage. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure placé entre les sites inverse et sens d'amorçage et le dit module de courbure comprend un site de liaison pour un premier membre d'une paire se liant par affinité.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent aussi être attachées à un premier membre d'une paire se liant par affinité. De préférence, le premier membre d'une paire se liant par affinité est attaché dans la région de l'extrémité 5' du site inverse d'amorçage à l'extrémité 3' du site sens d'amorçage. Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) comprennent un module de courbure placé entre les sites inverse et sens d'amorçage et le premier membre d'une paire se liant par affinité est fixé audit module de courbure.
La paire se liant par affinité peut être, par exemple, la digoxigénine - anticorps anti- digoxigénine ou la biotine- avidine/streptavidine. De préférence, le premier membre de la paire se liant par affinité est la biotine et le deuxième membre est la streptavidine. Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) comprennent un module de courbure comprenant une thymidine modifiée par une biotine. Comme un exemple précis, la thymidine modifiée par une biotine peut être la thymidine 12 de SEQ ID No. 1 ou la thymidine 13 de SEQ ID No. 2. Les molécules d'acide nucléique fournies dans l'étape a) de la méthode de l'invention peut être obtenue par une ou plusieurs réactions d'amplification. L'amplification peut être réalisée par n'importe quelle technique, y compris, mais sans s'y limiter, la PCR, la RT-PCR , amplification par la Q -replicase (Cahill et al, 1991 ; Chetverin et Spirin, 1995 ; Katanaev et al, 1995), la « ligase chain reaction" (LCR) (Landegren et al, 1988 ; Barany, 1991), le système autonome de réplication de séquence (Fahy et al, 1991), amplification par déplacement de brin (Walker et al, 1992), « nucleic acid sequence-based amplification" (NASBA) (Compton, 1991), « loop-mediated isothermal amplification" (Notomi et al, 2000), « rolling circle amplification" (RCA) (Blanco et al, 1989) et « hyperbranched rolling circle amplification" (HRCA) (Lizardi et al, 1998). De préférence l'amplification est par PCR ou RT-PCR. De préférence, une polymérase de haute-fidélité est utilisée et le taux d'erreur de la polymérase est moins de 10"5, de préférence moins de 10"6, et encore plus préférentiellement moins de 5.10"7. De préférence, la Platinum Taq DNA Polymérase High Fidelity (Invitrogen), la Phusion Hot Start High-Fidelity DNA Polymérase (New England BioLabs), la FastStart High Fidelity PCR System (Roche). La matrice pour cette amplification peut être une molécule d'ADN ou d'ARN. Pour l'amplification par PCR ou par RT-PCR, un ensemble d'amorces est nécessaire. Un ensemble d'amorces comprennent au moins deux amorces : une amorce sens et une amorce inverse. L'ensemble d'amorces peut être facilement conçu par une personne qualifiée selon la structure des molécules linéaires d'acide nucléique à obtenir, la séquence d'intérêt et le nombre de réactions d'amplification.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent être obtenues par une réaction d'amplification, de préférence par une réaction de RT-PCR ou de PCR. L'amorce sens pour cette réaction comprend la région des molécules linéaires d'acide nucléique fournies dans l'étape a) qui est en amont de la séquence d'intérêt et au moins 10, de préférence 12, 15, 20 ou 25, nucléotides de l'extrémité 5' de la séquence d'intérêt. L'amorce inverse comprend la région des molécules d'acide nucléique qui est en aval de la séquence d'intérêt et au moins 10, de préférence 12, 15, 20 ou 25, nucléotides de l'extrémité 3' de la séquence d'intérêt.
Dans un mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1A, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification avec un ensemble d'amorces comprenant une amorce inverse spécifique de l'extrémité 3' de la séquence d'intérêt et d'une amorce sens comprenant de son extrémité 5' vers son extrémité 3' :
- un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En option, l'amorce sens peut comprendre à son extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation plus particulier, l'amorce sens est attachée à un premier membre d'une paire se liant par affinité. De préférence, l'amorce sens est attachée à la biotine. De préférence, l'amorce sens comprend un module de courbure attaché à la biotine.
Dans un mode de réalisation préféré, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse spécifique de l'extrémité 3' de la séquence d'intérêt et d'une amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. De préférence, l'amorce sens comprend aussi à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et, en option un site de reconnaissance pour la quatrième enzyme de restriction. Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1G, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification avec un ensemble d'amorces comprenant une amorce sens à l'extrémité 5' de la séquence d'intérêt et d'une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3' :
- un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En option, l'amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation plus particulier, l'amorce inverse est attachée à un premier membre d'une paire se liant par affinité. De préférence, l'amorce inverse est attachée à la biotine. De préférence, l'amorce inverse comprend un module de courbure attaché à la biotine.
Dans un mode de réalisation préféré, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens dans l'extrémité 5' de la séquence d'intérêt et d'une amorce inverse comprenant de son extrémité 5' à l'extrémité 3' un site sens d'amorçage, un module de courbure attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. De préférence, l'amorce inverse comprend à son extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et, en option un site de reconnaissance pour le quatrième enzyme de restriction
Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1C, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenus par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3':
- un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
- un site sens d'amorçage, un module de courbure en option attaché à la biotine et comprend un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En option, l'amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, entre le site de l'amorce inverse et l'extrémité 3' de la séquence d'intérêt.
Dans un autre mode de réalisation particulier avec des molécules d'acide nucléique avec un arrangement comme le montre la Fig. 1E, en option avec un module de courbure, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par une réaction d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et d'une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', :
- un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou
- un site inverse d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En option, l'amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, entre le site sens d'amorçage et l'extrémité 5' de la séquence d'intérêt. De préférence, l'amorce sens comprend un site de reconnaissance pour la troisième enzyme de restriction et un site de reconnaissance pour la quatrième enzyme de restriction.
L'homme de l'art peut facilement concevoir un ensemble approprié d'amorces pour préparer les molécules d'acide nucléique de l'étape a) par une réaction d'amplification basée sur les mêmes règles. Les différents ensembles d'amorces peuvent être préparés en changeant la séquence de code-barres pour chaque séquence d'intérêt différente et, naturellement, en adaptant la séquence spécifique de la séquence d'intérêt ciblée.
Les molécules d'acide nucléique fournies dans l'étape a) peuvent aussi être obtenues par plusieurs réactions d'amplification. Ces réactions d'amplification peuvent être réalisées successivement ou simultanément dans le même mélange de réaction. Si les cibles à amplifier sont très nombreuses, ces amplifications sont réalisées simultanément en utilisant la plate-forme de RainStorm, développée par RainDance Technologies (Mamanova et al, 2010), les amorces à utiliser dans ces réactions peuvent être facilement conçues par une personne qualifiée. En effet, chaque ensemble d'amorces doit contenir au moins une séquence d'amorce qui chevauche avec une autre amorce (les amorces sens chevauchant et/ou les amorces inverses chevauchant, de préférence pas toutes les deux simultanément). Les amorces chevauchant ou le chevauchement ci-dessus signifient que le chevauchement est suffisant pour amorcer l'amplification. En conséquence, le chevauchement est d'au moins 10, 15 ou 20 nucléotides. Dans un mode de réalisation préféré de la méthode, les molécules d'acide nucléique fournies dans l'étape a) ont, soit à leur extrémité 5' ou à leur l'extrémité 3', un groupe d'éléments comprenant, de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage. De préférence, elles ont un groupe d'éléments comprenant, de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure en option attaché à un premier membre d'une paire se liant par affinité, par exemple la biotine, et comprend un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage. De préférence, les réactions d'amplification peuvent utiliser au moins deux groupes différents d'amorces avec les amorces sens chevauchant dans le site sens d'amorçage ou les amorces inverses chevauchant dans le site inverse d'amorçage, selon l'endroit de ce groupe d'éléments. En particulier, quand ce groupe d'éléments est à l'extrémité 5' de la molécule d'acide nucléique fournie à l'étape a), les ensembles d'amorces incluent les amorces sens chevauchant dans le site sens d'amorçage. Alternativement, quand ce groupe d'éléments est à l'extrémité 3' de la molécule d'acide nucléique fournie à l'étape a), les ensembles d'amorces incluent les amorces inverses chevauchant dans le site inverse d'amorçage.
Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse de l'extrémité 3' de la séquence d'intérêt et
- une première amorce sens comprenant, de son extrémité 5' a son extrémité 3', le site sens d'amorçage ou une première partie de celui-ci incluant son extrémité 3', une séquence de code- barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et du site sens d'amorçage ou d'une première partie de celui-ci incluant son extrémité 5', ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure, étant en option, attaché à un premier membre d'une paire se liant par affinité, le site sens d'amorçage ou une seconde partie de celui-ci chevauchant la première partie de celui-ci incluant son extrémité 5'.
En option, la deuxième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et
- une première amorce sens comprenant, de son extrémité 5' à son extrémité 3', un site sens d'amorçage ou d'une première partie de celui-ci incluant son extrémité 3', et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et du site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5', ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site sens d'amorçage ou une deuxième partie chevauchant la première partie incluant son extrémité 5'.
En option, la deuxième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une première partie de celui-ci incluant son extrémité 5' et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et,
- une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'; ou
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'.
En option, la deuxième amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation particulier additionnel, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce inverse comprenant, de son extrémité 5' à son extrémité 3', le site inverse d'amorçage ou une première de celui-ci incluant son extrémité 5', une séquence de code- barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et,
- une deuxième amorce inverse comprenant:
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'; ou
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 3'.
En option, la deuxième amorce inverse peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un mode de réalisation avantageux, la méthode utilise une séquence du site universel d'amorçage (UPS). L'utilisation de l'UPS permet la conception d'amorces plus courtes spécifiques aux séquences d'intérêt, abaissant de ce fait le coût. En effet, les premières amorces préférées de la méthode incluent une séquence UPS et au moins 10 nucléotides de l'extrémité 5' ou 3' de la séquence d'intérêt. Les autres amorces ne sont pas spécifiques aux séquences d'intérêt et peuvent être utilisées en tant que produits normalisés, commodes pour préparer des kits appropriés pour réaliser les méthodes telles que décrites ici.
Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse spécifique à l'extrémité 3' de la séquence d'intérêt, et :
- une première amorce sens comprenant, de son extrémité 5' à son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage, et
- une troisième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5', ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site sens d'amorçage ou une deuxième partie chevauchant la première partie et incluant son extrémité 5'.
En option, la troisième amorce sens peut comprendre à l'extrémité 5' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce sens comprenant de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; et
- une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site inverse d'amorçage et le site universel d'amorçage, ou
- de son extrémité 5' à son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, le site inverse d'amorçage et le site universel d'amorçage.
En option, la deuxième amorce inverse peut comprendre entre le site universel d'amorçage et le site inverse d'amorçage, un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce inverse comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une première amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; et
- une deuxième amorce sens comprenant :
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et le site universel d'amorçage, ou
- de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site sens d'amorçage et le site universel d'amorçage.
En option, la deuxième amorce sens peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé entre le site sens d'amorçage et le site universel d'amorçage.
Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens comprenant de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et
- une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, et
- une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et un site universel d'amorçage, ou
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, un site inverse d'amorçage et un site universel d'amorçage.
En option la deuxième amorce inverse peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé à son extrémité 5'. Dans un autre mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont obtenues par des réactions d'amplification à l'aide d'un ensemble d'amorces comprenant une amorce sens spécifique à l'extrémité 5' de la séquence d'intérêt, et :
- une première amorce inverse comprenant de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt, et - une deuxième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage, et - une troisième amorce inverse comprenant :
- de son extrémité 5' vers son extrémité 3', un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction et le site inverse d'amorçage ou une deuxième partie de celui-ci chevauchant la première partie et incluant son extrémité 3', ou
- de son extrémité 5' à son extrémité 3', un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, le module de courbure étant en option attaché à un premier membre d'une paire se liant par affinité, et le site inverse d'amorçage ou une deuxième partie de celui-ci chevauchant la première partie et incluant son extrémité 3'.
En option la troisième amorce inverse peut comprendre un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, placé à l'extrémité 5'.
En option, après de(s) réaction(s) d'amplification, les amorces simple brin excédentaires peuvent être dégradées, par exemple, en utilisant l'exonucléase I ou tout autre nucléase spécifique de l'ADN simple brin.
Les autres étapes de la méthode peuvent être effectuées sur la pluralité des ensembles de séquences d'acide nucléique linéaire, optimisant ainsi le coût en temps et en argent dans la préparation de bibliothèque.
Dans l'étape b) de la méthode d'invention, des molécules linéaires d'acide nucléique fournies dans l'étape a) ou a') sont circularisées par ligation intra-moléculaire. En conséquence, deux types différents des molécules circularisées peuvent être obtenus, le premier type comprend la séquence entière d'intérêt et le deuxième type comprend la séquence d'intérêt déjà tronquée à l'une de ses extrémités (c.-à-d., quand l'étape a') a été réalisée). Cette ligation peut être effectuée par n'importe quelle méthode connue par une personne qualifiée. De préférence, la ligation intra- moléculaire est effectuée en utilisant une ligase d'ADN, telle que l'ADN ligase T4, dans les conditions décrites dans l'article de Collins et Weissman, 1984. Les conditions utilisées dans cette étape empêchent les ligations inter-moléculaires. La ligation inter-moléculaire peut être empêchée par exemple en utilisant la dilution appropriée (par exemple, dilution limite) ou, lorsque les molécules d'acide nucléique sont attachées à un premier membre d'une paire se liant par affinité, en liant les molécules d'acide nucléique à un support solide soutenant le premier membre d'une paire se liant par affinité. Dans l'étape c) de la méthode de l'invention, les molécules circularisées d'acide nucléique obtenues à partir de l'étape b) sont digérées avec l'enzyme de restriction affin de fournir une forme linéarisée, de préférence par la première enzyme de restriction. Cette enzyme de restriction coupe les molécules circularisées d'acide nucléique entre le code-barres et la séquence d'intérêt. Cette digestion produit des molécules linéaires d'acide nucléique comprenant à une extrémité la séquence de code-barres et à l'autre extrémité la séquence d'intérêt. Quand un site universel d'amorçage est présent entre la séquence de code-barres et la séquence d'intérêt, la première enzyme de restriction coupe entre le site universel d'amorçage et la séquence de code-barres ou dans le site universel d'amorçage, de préférence près de l'extrémité adjacente à la séquence de code-barres.
Lorsque les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. II), la digestion avec la première enzyme de restriction fournit les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt à leur extrémité 5' et la séquence de code-barres à leurs extrémité 3'.
Lorsque les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt (Fig. 1J), la digestion avec la première enzyme de restriction fournit les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt à leur extrémité 3' et la séquence de code-barres à leur extrémité 5'.
Dans l'étape d) de la méthode de l'invention, les molécules d'acide nucléique digérées obtenues à partir de l'étape c) sont clivées dans la séquence d'intérêt. Ce clivage peut être effectué par des méthodes enzymatiques ou physiques.
Le clivage peut être effectué en utilisant une technique de clivage indépendamment de la séquence comme, par exemple, la sonication, la nébulisation, la French Press ou en utilisant le système Hydroshear® (Genomic Solutions®). De préférence, le clivage est effectué par sonication. Ce clivage produit des fragments aléatoires d'acide nucléique de tailles spécifiques. La taille des molécules fragmentées peut être choisie par une personne qualifiée selon l'utilisation prévue de la bibliothèque préparée par la méthode de l'invention. Des molécules clivées peuvent être séparées par l'électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir du gel d'électrophorèse. Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt (Fig. 1). Dans ce mode de réalisation, la digestion avec la première enzyme de restriction dans l'étape c) fournit les molécules linéaires d'acide nucléique comprenant à leur extrémité 5', l'extrémité 5' de la séquence d'intérêt. Le clivage de ces molécules d'acide nucléique fournit ainsi les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt tronquée en 5'.
Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt (Fig. 2). Dans ce mode de réalisation, la digestion avec la première enzyme de restriction dans l'étape c) fournit les molécules linéaires d'acide nucléique comprenant, à leur extrémité 3', l'extrémité 3' de la séquence d'intérêt. Le clivage de ces molécules d'acide nucléique fournit ainsi les molécules linéaires d'acide nucléique comprenant la séquence d'intérêt tronquée en 3'.
Le clivage peut aussi être effectué en utilisant l'enzyme de restriction. Dans ce cas-ci, les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de reconnaissance pour une troisième enzyme de restriction comme décrit ci-dessus.
Dans un mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprend sous leur forme circularisée, une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt et un site de reconnaissance pour la troisième enzyme de restriction entre le site inverse d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la digestion des molécules d'acide nucléique obtenues à partir de l'étape c) avec la troisième enzyme fournit des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 5'.
Dans un autre mode de réalisation particulier, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée, une séquence de code-barres placée entre le site inverse d'amorçage et la séquence d'intérêt et un site de reconnaissance pour la troisième enzyme de restriction entre le site sens d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la digestion des molécules d'acide nucléique obtenues à partir de l'étape c) avec la troisième enzyme fournit des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 3'.
Dans l'étape e) de la méthode de l'invention, les molécules clivées d'acide nucléique obtenues à partir de l'étape d) sont circularisées par ligation intra-moléculaire. Cette ligation peut être effectuée tel que décrit ci-dessus.
Les molécules circularisées d'acide nucléique obtenues à partir de l'étape e) comprennent, dans la direction de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage.
Dans un mode de réalisation, la séquence de code-barres est placée entre le site sens d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la séquence d'intérêt comprise entre lesdites molécules circularisées d'acide nucléique est tronquée en 5'.
Dans un autre mode de réalisation, la séquence de code-barres est placée entre le site inverse d'amorçage et la séquence d'intérêt. Dans ce mode de réalisation, la séquence d'intérêt comprise dans lesdites molécules circularisées d'acide nucléique est tronquée en 3'. Les molécules d'acide nucléique obtenues après les étapes a), b), c), d) et e) comprennent une séquence d'intérêt tronquée en 5' ou 3' selon la position du code-barres (en amont ou en aval de la séquence d'intérêt). La méthode de l'invention peut en outre, comprendre des étapes additionnelles afin de tronquer l'autre extrémité de la séquence d'intérêt ce qui permet de fournir des molécules d'acide nucléique comprenant une séquence d'intérêt tronquée en 3' et 5'.
Dans un mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent la séquence d'intérêt à l'une de son extrémité (par exemple, Fig. 1A, Fig. 1D, Fig. 1G et Fig. 1H ; Fig. 2 A, Fig. 2D, Fig. 2G et Fig. 2H ; la Fig. 3 A et 3D) et la méthode comprend en outre une étape a') de clivage des molécules d'acide nucléique, après l'étape a) et avant l'étape b), ce qui permet de fournir une séquence d'intérêt tronquée. De préférence, le clivage est effectué par l'utilisation d'une technique de clivage indépendamment de la séquence (SITC), comme la sonication. En particulier, si la séquence d'intérêt est à l'extrémité 3' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig. 1A et Fig. 1H ; Fig. 2A et Fig. 2H ; La Fig. 3A), les molécules obtenues d'acide nucléique présentent une séquence d'intérêt tronquée en 3'. Alternativement, si la séquence d'intérêt est à l'extrémité 5' des molécules linéaires d'acide nucléique fournies dans l'étape a) (par exemple, Fig. 1D et Fig. 1G ; Fig. 2D et Fig. 2G ; 3D), les molécules obtenues d'acide nucléique présentent une séquence d'intérêt tronquée en 5'. Les molécules clivées peuvent être séparées par électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir de gel d'électrophorèse. Dans un autre mode de réalisation, les molécules linéaires d'acide nucléique fournies dans l'étape a) ne comprennent pas la séquence d'intérêt à une de son extrémité mais comprennent un site de reconnaissance pour une quatrième enzyme de restriction placé à l'extrémité de la séquence d'intérêt qui est à l'opposé de l'extrémité adjacente au code-barres. Dans ce mode de réalisation, la méthode comprend en outre après l'étape e),
f) digestion des molécules circulaires d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant l'extrémité non tronquée de la séquence d'intérêt à une de son extrémité ; g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant une séquence d'intérêt tronquée en 5'et 3'.
Les molécules clivées peuvent être séparées par électrophorèse et des molécules de la taille souhaitée peuvent être purifiées à partir du gel d'électrophorèse. La méthode d'invention peut en outre, comprendre une étape h) de circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire. Cette ligation peut être effectuée tel que décrit ci-dessus.
Selon la structure des molécules d'acide nucléique fournie dans l'étape a), les molécules circulaires obtenues à partir de l'étape h) comprennent, dans la direction 5' vers 3':
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en
3' et en 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, ou
- un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction.
Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3' un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, en option un site universel d'amorçage, et une séquence d'intérêt (Fig. 3A) (étape a) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, en option un site universel d'amorçage, et une séquence d'intérêt tronquée en 3' ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 3' et 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; et
- circularisation desdites molécules clivées d'acide nucléique par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 3' et 5', un site de reconnaissance pour une troisième enzyme de restriction, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un autre mode de réalisation préféré, la méthode de l'invention comprend - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, en option un site universel d'amorçage, et une séquence d'intérêt (Fig. 3 A) (étape a) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, en option un site universel d'amorçage, et une séquence d'intérêt tronquée en 3' ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 3' et 5', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ; et
- circularisation desdites molécules d'acide nucléique par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 3' et 5', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un autre mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et un site de reconnaissance pour une troisième enzyme de restriction (Fig. 3D) (étape a) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et un site de reconnaissance pour une troisième enzyme de restriction ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 5' et en 3' (étape d) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction, une séquence d'intérêt tronquée en 3' et 5', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e). Dans un autre mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (Fig. 3D) ;
- clivage desdites molécules linéaires d'acide nucléique en utilisant une technique de clivage indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, et un site de reconnaissance pour une première enzyme de restriction (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code- barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3' (étape d) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e).
Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (Fig. 3B) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ;
- circularisation desdites molécules clivées d'acide nucléique par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e),
- digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et, en option, un site d'amorçage universel (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et en 3', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h). Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (Fig. 3B) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction, une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage et une séquence de code-barres (étape d) ;
- circularisation desdites molécules d'acide nucléique clivées par ligation intra-moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction
5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5', en option un site universel d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e), digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, comprenant un module de courbure, un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et, en option, un site universel d'amorçage (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et en 3', un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction et une séquence de code-barres (Fig. 3C) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt (étape c) ;
- clivage desdites molécules d'acide nucléique digérées par digestion avec la troisième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt tronquée en 3' (étape d) ;
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une troisième enzyme de restriction et un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e),
- digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h). Dans un mode de réalisation préféré, la méthode de l'invention comprend
- fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction et une séquence de code-barres (Fig. 3C) (étape a) ;
- circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage, une séquence d'intérêt, un site de reconnaissance pour une première enzyme de restriction, une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape b) ;
- digestion desdites molécules circulaires d'acide nucléique avec la première enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme, en option un site universel d'amorçage et une séquence d'intérêt (étape c) ;
- clivage desdites molécules d'acide nucléique digérées en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, en option un site universel d'amorçage et une séquence d'intérêt tronquée en 3' (étape d) ;
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, un site de reconnaissance pour une quatrième enzyme de restriction, en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape e),
- digestion desdites molécules circulaires d'acide nucléique avec la quatrième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', en option un site universel d'amorçage, une séquence d'intérêt tronquée en 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape f) ;
- clivage dudit acide nucléique linéaire en utilisant une technique indépendamment de la séquence telle que la sonication, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres, un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction et un site sens d'amorçage (étape g) ; et
- circularisation desdites molécules d'acide nucléique clivées par ligation intra- moléculaire, ce qui permet de fournir des molécules circulaires d'acide nucléique comprenant, dans la direction 5' vers 3', un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et en 3', une séquence de code-barres, un site inverse d'amorçage et un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction (étape h).
Dans un mode de réalisation, les molécules d'acide nucléique fournies dans l'étape a) sont attachées à un premier membre d'une paire se liant par affinité et la méthode comprend en outre, une ou plusieurs étapes de fixation des molécules d'acide nucléique sur un support solide par le biais d'interaction entre le premier membre d'affinité de la paire de liaison attaché auxdites molécules d'acide nucléique et les deuxièmes membres de ladite paire se liant par affinité liées au support solide. Les supports solides utiles incluent n'importe quelle surface rigide ou semi-rigide sur laquelle un membre d'une paire se liant par affinité peut être lié. Le support peut être tout matériel poreux ou non poreux insoluble dans l'eau, y compris, sans limitation, membranes, filtres, puces, billes magnétiques ou non magnétiques, et polymères. De préférence, le support solide est choisi parmi les membranes et les billes basées sur la silice. De préférence, le support solide est des billes et plus en particulier des billes de polystyrène. Ces billes peuvent avoir un diamètre de 1 à 10 micromètres. Dans un mode de réalisation particulier, les molécules d'acide nucléique fournies dans l'étape a) sont attachées à la biotine et sont liées à un support solide, des billes de préférence magnétiques, revêtue de streptavidine. Des molécules d'acide nucléique peuvent être liées à un support solide avant qu'une étape de circularisation par ligation intra- moléculaire afin d'empêcher des événements inter-moléculaires ou avant que chaque changement de mélange de réaction afin de faciliter la récupération des molécules d'acide nucléique. La quantité du support solide peut être facilement ajustée par une personne qualifiée selon la concentration des molécules d'acide nucléique.
Dans un mode de réalisation préféré, des molécules linéaires d'acide nucléique obtenues à partir de l'étape g) sont liées à un support solide avant la circularisation de l'étape h).
Dans un autre mode de réalisation, des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) sont alors liées à un support solide.
Des molécules circulaires d'acide nucléique obtenues à partir de l'étape h) peuvent être digérées par la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3',
- un site sens d'amorçage, une séquence de code-barres, une séquence d'intérêt tronquée en 5' et 3' et une séquence inverse d'amorçage, ou
- un site sens d'amorçage, une séquence d'intérêt tronquée en 5' et 3', une séquence de code-barres et une séquence inverse d'amorçage.
Si les molécules d'acide nucléique comprennent un module de courbure comprenant le site de reconnaissance pour la deuxième enzyme de restriction, les molécules d'acide nucléique obtenues par digestion avec la deuxième enzyme de restriction comprennent à chaque extrémité, une partie du module de courbure.
De préférence, des molécules d'acide nucléique sont liées sur un support solide avant qu'elles soient digérées avec la deuxième enzyme de restriction.
Des molécules d'acide nucléique digérées avec la deuxième enzyme de restriction peuvent alors être amplifiées, par exemple par PCR ou par n'importe quelle autre méthode connue par une personne qualifiée. De préférence, les amorces utilisées pour cette amplification comprennent :
- une amorce sens s'hybridant au site sens d'amorçage, et
- une amorce inverse s'hybridant au site inverse d'amorçage.
Le produit de cette amplification peut alors être séquencé en utilisant n'importe quelle plate-forme de séquençage à haut débit. La méthode peut en outre, comprendre une ou plusieurs étapes de réparation des extrémités des molécules clivées ou digérées d'acide nucléique. De préférence, les extrémités des molécules d'acide nucléique sont réparées après chaque étape de clivage ou de digestion et/ou chaque étape de circularisation. La réparation peut comprendre la reconstitution des extrémités et/ou phosphorylation des extrémités. La restauration et la phosphorylation peuvent être réalisées par n'importe quelle méthode connue par une personne qualifiée. Par exemple, la restauration peut être réalisée en utilisant une ADN polymérase spécifique, tel que l'ADN polymérase T4, en présence de dNTP, et la phosphorylation peut être réalisée en utilisant une kinase d'ADN, telle que le polynucléotide kinase T4, en présence d'ATP.
En option, la méthode comprend en outre, une ou plusieurs étapes de dégradation des molécules linéaires d'acide nucléique avec la DNase ATP-Dépendante qui hydrolyse sélectivement les molécules d'acide nucléique linéaires double brin. La DNase ATP-Dépendante de Plasmide- Safe™ (Epicentre) DNase ATP-Dépendante peut être choisie pour dégrader spécifiquement l'ADN linéaire. Il est particulièrement indiqué pour dégrader les molécules linéaires d'acide nucléique après une étape de circularisation, de préférence après chaque étape de circularisation.
La présente invention concerne des kits appropriés pour préparer les molécules d'acide nucléique fournies à l'étape a) de la méthode décrite ci-dessus. En particulier, lesdits kits peuvent comprendre n'importe quelle amorce sens ou inverse ou un ensemble de celles-ci tel que décrit précédemment pour préparer les molécules d'acide nucléique fournies dans l'étape a).
Le kit peut comprendre au moins une amorce sens comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'.
Par «une partie de celui-ci » est voulu dire au moins 10, 15 ou 20 nucléotides de celui-ci.
Dans un premier mode de réalisation, le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci incluant son extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins seconde amorce sens comprend, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 3' et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, le kit comprend une amorce sens et plusieurs secondes amorces sens différentes par leurs séquences de code-barres et, si présent, par au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En effet, chaque seconde amorce sens est conçue pour être spécifique à une séquence d'intérêt différente. En particulier, si entre 1 et 1.000 séquences d'intérêt différentes sont considérés, 1 et 1000 secondes amorces sens différentes sont conçues, chacune contient un code-barres distinct à associer respectivement à chaque séquence d'intérêt, l'autre élément restant les mêmes (par exemple, le site sens d'amorçage ou une partie de celui-ci, le site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage).
Dans un deuxième mode de réalisation, l'au moins première amorce sens comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. Plus préférablement, l'au moins première amorce sens comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, l'au moins première amorce sens comprend en outre, à l'extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Bien que le kit peut comprendre une amorce sens , le kit comprend de préférence plusieurs premières amorces sens différent par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt, les autres éléments restent les même (c.-à-d., si présent, le site inverse d'amorçage, le module de courbure, le site de reconnaissance pour la seconde enzyme de restriction, le site sens d'amorçage ou une partie de celui-ci, le site universel d'amorçage).
Selon le premier ou le deuxième mode de réalisation, le kit peut en outre, comprendre une amorce inverse comprenant au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou plusieurs amorces inverse, chacune comprend au moins 10 nucléotides de l'extrémité 3' de différente séquence d'intérêt.
Dans un troisième mode de réalisation, l'au moins première amorce sens comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce sens comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage. En conséquence, le kit peut comprendre une première amorce sens. Dans ce mode de réalisation, le kit peut en outre, comprendre une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. De préférence, le kit comprend en outre plusieurs amorces inverses, différent par leurs séquences de code-barres et par au moins les 10 nucléotides spécifique à l'extrémité 3' de la séquence d'intérêt.
Selon le premier, deuxième ou troisième mode de réalisation, le kit peut en outre, comprendre au moins une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. En particulier, le kit peut en outre, comprendre plusieurs amorces sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' d'un des différentes séquences d'intérêt.
Alternativement, le kit peut comprendre au moins une première amorce inverse comprenant, de l'extrémité 5' vers l'extrémité 3',
- un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Par « une partie de celui-ci » est voulu dire au moins 10, 15 ou 20 nucléotides.
Dans un premier mode de réalisation, le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins seconde amorce inverse comprend, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 5' et chevauchant une partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, le kit comprend la première amorce inverse et plusieurs secondes amorces inverses différent par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt. En effet, chaque deuxième amorce inverse est conçue pour être spécifique à une séquence d'intérêt différente. En particulier, si entre 2 et 1.000 séquences d'intérêt différentes sont considérés, 2 et 1.000 secondes amorces différentes inverse sont conçues, comprenant chacune un code-barres distinct à associer à chaque séquence d'intérêt, l'autre élément reste le même (par exemple, le site inverse d'amorçage ou une partie de celui-ci, le site de reconnaissance pour la première enzyme de restriction et le site universel d'amorçage).
Dans un deuxième mode de réalisation, l'au moins première amorce inverse comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre, à l'extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction. Bien que le kit puisse comprendre une première amorce inverse, le kit comprend de préférence plusieurs premières amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt, les autres éléments restant les mêmes (c.-à-d., si présent, le site inverse d'amorçage, le module de courbure, le site de reconnaissance pour la deuxième enzyme de restriction, le site sens d'amorçage ou une partie de celui-ci, le site universel d'amorçage).
Selon le premier ou deuxième mode de réalisation, le kit peut en outre, comprendre une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou plusieurs amorces sens, chacune comprend au moins 10 nucléotides de l'extrémité 5' d'une séquence d'intérêt différente.
Dans un troisième mode de réalisation, l'au moins première amorce inverse comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage. De préférence, l'au moins première amorce inverse comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction et un site universel d'amorçage. En conséquence, le kit peut comprendre une première amorce inverse. Dans ce mode de réalisation, le kit peut en outre, comprendre une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt. De préférence, le kit comprend en outre plusieurs amorces sens, différentes par leurs séquences de code-barres et par au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Selon le premier, deuxième ou troisième mode de réalisation, le kit peut en outre, comprendre au moins une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. En particulier, le kit peut en outre, comprendre plusieurs amorces inverses comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' d'un des différentes séquences d'intérêt. Dans un mode de réalisation particulier, le kit comprend au moins une amorce sens pour chaque séquence d'intérêt à être séquencée, comprenant, de son extrémité 5' vers son extrémité 3': a) un site inverse d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
b) un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou c) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ; ou
d) un site inverse d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site sens d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
En option, le kit peut aussi comprendre le(s) amorce(s) inverse(s) appropriée(s) ou associée(s). En particulier, le kit peut inclure une amorce inverse spécifique à l'extrémité 3' de la séquence d'intérêt pour les amorces sens du type a) et b) ; ou une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt pour les amorces sens du type c) et d).
Le kit peut comprendre une amorce sens et son amorce inverse associée. Cependant, de préférence, le kit comprend plusieurs amorces sens et amorces inverses associées en option, chacune conçue pour être spécifique à une séquence d'intérêt différente. Les amorces sens et inverses différentes entre elles par leur séquence de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt spécifique, les autres éléments (par exemple, le site sens d'amorçage, le site de reconnaissance pour la deuxième enzyme de restriction, le site inverse d'amorçage, le module de courbure et le site de reconnaissance pour la première enzyme de restriction restant les mêmes).
Dans un autre mode de réalisation particulier, le kit comprend au moins une amorce inverse pour chaque séquence d'intérêt à être séquencée, comprenant, de son extrémité 5' vers son extrémité 3',
a) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
b) un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage, une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou c) un site sens d'amorçage, un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ; ou
d) un site sens d'amorçage, un module de courbure en option attaché à la biotine et comprenant un site de reconnaissance pour la deuxième enzyme de restriction, un site inverse d'amorçage et au moins 10 nucléotides spécifiques à l'extrémité 3' de la séquence d'intérêt.
En option, le kit peut aussi comprendre les amorce(s) sens appropriée(s) ou associée(s). En particulier, le kit peut inclure une amorce sens spécifique de l'extrémité 5' de la séquence d'intérêt pour les amorces inverses du type a) et b) ; ou une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour la première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt pour les amorces inverses du type c) et d). Le kit peut comprendre une amorce inverse et son amorce sens associée. Cependant, de préférence, le kit comprend plusieurs amorces inverses et en option les amorces sens associées, chacune conçue pour être spécifique à une séquence d'intérêt différente. Les amorces sens et inverse différentes entre elles par leur séquence de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt spécifique, les autres éléments (par exemple, si présent, le site sens d'amorçage, le site de reconnaissance pour la première, deuxième, troisième et quatrième enzyme de restriction, le site inverse d'amorçage et le module de courbure restant les mêmes). Dans un mode de réalisation préféré du kit, la première amorce sens ou la première amorce inverse comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction. De préférence, le module de courbure est attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine. En particulier, le module de courbure peut être comme détaillé ci-dessous. De préférence, il comprend ou consiste en, une séquence sélectionnée parmi le groupe de séquences SEQ ID No. 1 et SEQ ID No. 2.
En plus des amorces, les kits peuvent aussi inclure les moyens appropriés permettant de réaliser l'amplification, en particulier la PCR ou la RT-PCR , tel que la polymérase et les réactifs nécessaires comprenant les tampons appropriés, les nucléotides et autres.
Les kits peuvent aussi comprendre des billes ou des supports solides soutenant les deuxièmes membres des paires se liant par affinité. Dans un mode de réalisation préféré, les avidines ou les streptavidines sont liés aux billes ou aux supports solides.
Les kits peuvent aussi comprendre une ou plusieurs des enzymes de restriction nécessaires pour appliquer la méthode, en particulier les première, seconde, troisième et quatrième enzymes de restriction. De préférence, le kit peut inclure au moins les premières et deuxièmes enzymes de restriction. En outre, le kit peut inclure la troisième enzyme de restriction. Il peut en outre, inclure la quatrième enzyme de restriction.
Dans un autre mode de réalisation particulier, les molécules circulaires d'acide nucléique obtenues dans l'étape b) de la méthode peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre
- lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la revendication 1, et - des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un premier site de restriction pour une première enzyme de restriction, ou
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage, ou
- des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un premier site de restriction pour une première enzyme de restriction.
Les produits de ligation inter-moléculaire obtenus sont représentés par les deux formes circularisées des Fig. II et Fig. 1J. Après l'étape de ligation inter-moléculaire, les molécules d'acide nucléique circularisées peuvent subir une ou plusieurs étapes de la méthode décrite ci- dessus selon la structure de leur séquences, ce qui permet d'obtenir une bibliothèque d'acide nucléique (ou de n'importe quel produit intermédiaire de celle-ci ) objet de la présente invention.
Le kit comprend en outre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique permettant de réaliser la ligation inter-moléculaire décrite dans le mode de réalisation précèdent.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement peuvent être un ensemble de gènes, ou un ensemble de régions chromosomique, ou un ensemble de génomes. Un code-barres doit être associé à chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement. Puis, une bibliothèque peut être préparée à partir de l'association d'un code-barres à chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement par la méthode de l'invention décrite ci-dessus, ce qui permet de fournir une bibliothèque de fragments de chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement associée au même code-barres. Naturellement, comme expliqué dans l'introduction de la description détaillée, l'avantage de la présente méthode est de préparer simultanément plusieurs bibliothèques, caractérisées en ce que chacune des séquences de l'ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement est associée à un code-barres spécifique (et différent). Par exemple, si la méthode est appliquée au séquençage d'un génome particulier pour plusieurs organismes, un code-barres peut être attribué à chaque organisme particulier. En conséquence, les génomes peuvent être simultanément séquencés pour plusieurs organismes.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement peuvent être aussi constituées d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique comprenant des séquences nucléotidiques différentes. Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement peuvent être un ensemble de gènes ou un ensemble d'ADNc, ou un ensemble de régions chromosomiques, ou un ensemble de génomes entiers. Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement sont clivés. De préférence, le clivage est effectué par l'utilisation d'une technique de clivage indépendamment de la séquence (SITC), comme la sonication. De préférence, les extrémités des molécules d'acide nucléique sont réparées après chaque étape de clivage ou de digestion et/ou chaque étape de circulansation. La réparation peut comporter la reconstitution des extrémités et/ou la phosphorylation des extrémités. La restauration et la phosphorylation peuvent être réalisées par n'importe quelle méthode connue par une personne qualifiée. Par exemple, la restauration peut être réalisée en utilisant une ADN polymérase spécifique, tel que l'ADN polymérase T4, en présence de dNTP, et la phosphorylation peut être réalisée en utilisant une kinase d'ADN, telle que le polynucléotide kinase T4, en présence d'ATP.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement sont modifiées à leurs extrémités par la Transférase Terminale qui catalyse l'addition de nucléotides, de préférence les ddNTP, aux extrémités 3 ' de l'ADN, de préférence le ddTTP, ce qui permet d'obtenir des molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement ayant incorporées un seul résidu T à chaque extrémité 3'.
Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement ayant incorporées un seul résidu T à chaque extrémité 3' sont ligaturées avec
- des molécules linéaires d'acide nucléique modifiées à leurs extrémités par la Transférase Terminale qui catalyse l'addition de nucléotides, de préférence les ddNTP, aux extrémités 3' de l'ADN, de préférence le ddATP, ce qui permet d'obtenir des molécules linéaires d'acide nucléique ayant incorporées un seul résidu A à chaque extrémité 3' et comprenant de l'extrémité 5' vers 3'
- un premier site de restriction pour une première enzyme de restriction,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage, ou
- des molécules linéaires d'acide nucléique modifiées à leurs extrémités par la Transférase Terminale qui catalyse l'addition de nucléotides, de préférence les ddNTP, aux extrémités 3' de l'ADN, de préférence le ddATP, ce qui permet d'obtenir des molécules linéaires d'acide nucléique ayant incorporées un seul résidu A à chaque extrémité 3' et comprenant de l'extrémité 5' vers 3'
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un premier site de restriction pour une première enzyme de restriction. Lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement ayant incorporées un seul résidu T à chaque extrémité 3' et lesdites molécules linéaires d'acide nucléique ayant incorporées un seul résidu A à chaque extrémité 3' permettent de favoriser l'obtention des molécules circulaires d'acide nucléique par ligation inter-moléculaire. En présence de l'ADN ligase T4 et de PATP.
En particulier, si entre 1 et 1.000 ensembles de molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement ayant des séquences différentes sont considérés, 1 et 1000 ligations inter-moléculaires sont effectuées, chacune permettant d'associer un code-barres distinct respectivement à chaque ensembles de molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement.
Les kits peuvent aussi comprendre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique nécessaires pour appliquer la méthode, en particulier la Transférase Terminale. De préférence, le kit peut inclure au moins la Transférase Terminale. Les kits peuvent aussi comprendre les ddNTP, en particulier les ddTTP et les ddATP. De préférence, le kit peut inclure au moins les ddTTP. De préférence, le kit peut inclure au moins les ddATP. Bien entendu les kits peuvent aussi comprendre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique permettant de favoriser la ligation inter-moléculaire.
Tous les dispositifs particuliers détaillés pour la méthode décrite ci-dessus peuvent aussi être envisagés pour les kits.
REFERENCES
Barany (1991) PCR Methods Appl, 1, 5-16 ;
Blanco et al. (1989) J Biol Chem, 264, 8935-8940 ;
Birkenmeyer (1985) Nucleic Acids Res, 13, 7107-71 18 ;
Cahill et al. (1991) Clin Chem, 37, 1482-1485 ;
Chetverin et Spirin (1995) Prog Nucleic Acid Res Mol Biol, 51, 225-270 ;
Collins and Weissman (1984) Proc Natl Acad Sci USA 81, 6812-6816
Compton, J. (1991) Nature, 350, 91-92 ;
Fahy et al. (1991) PCR Methods Appl, 1, 25-33 ;
Fullwood et al, Génome Res. 2009. 19 : 521-532 ;
Katanaevet al. (1995) Febs Lett, 359, 89-92 ;
Kitchin et al., (1986) J Biol Chem, 25, 11302-1 1309 ;
Landegren et al. (1988) Science, 241, 1077-1080;
Lizardi et al. (1998) Nat Genêt, 19, 225-232;
Mamanova et al., (2010) Nature Method, 7, 1 11-118;
Notomi et al. (2000) Nucleic Acids Res, 28, E63;
Ulanovsky et al. (1986) PNAS, 83, 862-866 ;
Walker et al. (1992) Nucleic Acids Res, 20, 1691-1696 ; En résumé, ladite méthode permet de préparer une bibliothèque d'acide nucléique, de préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend:
a) - fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circulansée et dans la direction 5' vers 3'
- une séquence à être séquencée entièrement ou partiellement
- un site inverse d'amorçage,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble des molécules d'acide nucléique, qui est placée entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et
- deux sites de reconnaissance pour deux enzymes de restriction différentes :
- un premier site de restriction pour une première enzyme de restriction qui est placée entre la séquence de code-barres et la séquence d'intérêt, et
- un deuxième site de restriction pour une deuxième enzyme de restriction qui est placée entre le site inverse d'amorçage et le site sens d'amorçage ;
b) circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire ;
c) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ;
d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et
e) circularisation desdites molécules d'acide nucléique clivées obtenues à partir de l'étape d) par ligation intra-moléculaire,
ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site d'amorçage inverse.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt. Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placée en amont du site inverse d'amorçage, ladite enzyme ayant un site de restriction dudit site de clivage dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) est réalisé par digestion avec ladite troisième enzyme de restriction.
Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en amont du site inverse d'amorçage et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt,
ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code- barres et une séquence d'intérêt tronquée en 3' .
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt.
La méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site d'amorçage inverse.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placée en aval du site sens d'amorçage, ladite enzyme ayant un site de restriction en aval dudit site de reconnaissance dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) est réalisé par digestion avec ladite troisième enzyme de restriction. Les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placée en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt,
ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence de code-barres, un site inverse et un site sens d'amorçage.
La méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse et un site sens d'amorçage.
La méthode comprend en outre l'étape h) de circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire. Les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité. La méthode comprend en outre une ou plusieurs étapes de liaison des molécules d'acide nucléique sur un support solide par l'interaction entre le premier membre de la paire se liant par affinité liée auxdites molécules d'acide nucléique et les seconds membres de la paire se liant par affinité liée au support solide, en particulier avant l'étape de circularisation. La méthode comprend en outre l'étape de liaison des molécules d'acide nucléique obtenues à partir de l'étape g) avant de réaliser l'étape h) de circularisation.
La méthode comprend en outre l'étape de digestion des molécules circularisées d'acide nucléique avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site sens d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage. La méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites d'amorçage inverse et sens.
Les étapes de clivage des molécules d'acide nucléique sont réalisées en utilisant une technique de clivage indépendamment de la séquence.
La technique de clivage indépendamment de la séquence est la sonication.
La troisième enzyme de restriction est choisie dans le groupe EcoP15I, Mmel, NmeAII, Acul, Bbvl, BceAI, Bpml, BpuEI, BseRI, Bsgl, BsmFI, BtgZI, Ecil, Fokl, Hgal, I-Ceul, I-Scel, Pi- Pspl et PI-SceI.
Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, une séquence d'au moins 15 paires de base qui ont moins de 80% d'identité avec le génome de la séquence d'intérêt et qui est placé entre la séquence d'intérêt et l'élément en amont de ladite séquence d'intérêt ou entre la séquence d'intérêt et l'élément en aval de ladite séquence d'intérêt. Les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens d'amorçage.
Ledit module de courbure comprend un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché au premier membre d'une paire se liant par affinité.
Ledit module de courbure comprend ou consiste en, une séquence sélectionnée parmi le groupe consistant en, les séquences SEQ ID No. 1 et SEQ ID No. 2. Les molécules linéaires d'acide nucléique fournies dans l'étape a) ont été obtenues par une ou plusieurs réactions d'amplification d'ADN.
Lesdites réactions d'amplification d'ADN sont suivies de l'étape de dégradation de l'excès des amorces simple brin.
La méthode comprend en outre l'étape de restauration et/ou de phosphorylation de chacune des extrémités des molécules d'acide nucléique après une étape de clivage et/ou avant une étape de circularisation. La méthode comprend en outre l'étape de dégradation des molécules non-circularisées d'acide nucléique avec une endonucléase spécifique des molécules linéaires d'acide nucléique après une étape de circularisation.
Les molécules d'acide nucléique obtenues à partir de l'étape h) ont une longueur de 156 bp ou une longueur de 156 bp plus un multiple de 21 bp.
Une pluralité d'ensembles de molécules linéaires d'acide nucléique est fournie dans l'étape a). La bibliothèque d'acide nucléique obtenue à partir de la méthode.
Le kit comprend au moins une première amorce sens comprenant, de son extrémité 5' vers son extrémité 3',
- un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'.
Le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci et chevauchant une partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
Le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 3' et chevauchant la partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
Le kit comprend une amorce sens et plusieurs secondes amorces sens différentes par leurs séquences des code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
La première amorce sens du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce sens du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. La première amorce sens du kit comprend en outre, à l'extrémité 5', le site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
5 Le kit comprend plusieurs premières amorces sens différentes par leurs séquences de code- barres et, si présent, par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre une amorce inverse comprenant au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou plusieurs amorces inverse, chacune comprenant au moins 10 10 nucléotides de l'extrémité 3' d'une séquence d'intérêt différente.
La première amorce sens du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence 15 d'intérêt ou un site universel d'amorçage.
La première amorce sens du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage.
0
Le kit comprend une première amorce sens.
Le kit comprend en outre une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de 5 restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces inverse, différentes par leurs séquences de code-barres et par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. 0 Le kit comprend en outre au moins une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces sens comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 5' d'une des différentes séquences d'intérêt.
Le kit comprend au moins une première amorce inverse comprenant, de son extrémité 5' vers son extrémité 3',
- un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
Le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
Le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage.
Le kit comprend une première amorce inverse et plusieurs secondes amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt.
La première amorce inverse du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce inverse du kit comprend en outre, à son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et un site universel d'amorçage. La première amorce inverse du kit comprend en outre, à l'extrémité 5', le site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction.
Le kit comprend plusieurs premières amorces inverses différentes par leurs séquences de code-barres et, si présent, par au moins les 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. Le kit comprend en outre une amorce sens comprenant au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou plusieurs amorces sens, chacune comprend au moins 10 nucléotides de l'extrémité 5' d'une séquence d'intérêt différente.
La première amorce inverse du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
La première amorce inverse du kit comprend en outre à son extrémité 3' un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et un site universel d'amorçage.
Le kit comprend une première amorce inverse. Le kit comprend en outre une amorce sens comprenant, de son extrémité 5' vers son extrémité 3', une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre plusieurs amorces sens, différentes par leurs séquences de code- barres et par au moins les 10 nucléotides de l'extrémité 5' de la séquence d'intérêt.
Le kit comprend en outre au moins une amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt. Le kit comprend en outre plusieurs amorces inverses comprenant, de son extrémité 5' vers son extrémité 3', un site universel d'amorçage et au moins 10 nucléotides de l'extrémité 3' d'un des différentes séquences d'intérêt.
La première amorce sens ou la première amorce inverse du kit comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction.
Le module de courbure du kit est attaché à un premier membre d'une paire se liant par affinité, de préférence la biotine.
Le module de courbure du kit comprend ou consiste en, une séquence sélectionnée parmi le groupe consistant en, les séquences SEQ ID No. 1 et SEQ ID No. 2. Le kit comprend en outre des billes ou des supports solides portant les seconds membres de paire se liant par affinité, de préférence l'avidine ou la streptavidine.
Le kit comprend en outre une ou plusieurs enzymes de restriction sélectionnées dans le groupe consistant en, la première, deuxième, troisième et quatrième enzymes de restrictions.
Dans un autre mode de réalisation particulier, les molécules circulaires d'acide nucléique obtenues dans l'étape b) de la méthode peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre - lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la méthode, et
- des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un premier site de restriction pour une première enzyme de restriction,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage, ou molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un premier site de restriction pour une première enzyme de restriction.
La bibliothèque d'acide nucléique obtenue à partir de la méthode.
Le kit comprend en outre une ou plusieurs des enzymes de modification des molécules linéaires d'acide nucléique permettant de favoriser la ligation inter-moléculaire décrite dans le mode de réalisation précèdent.

Claims

71 REVENDICATIONS
1. Une méthode pour préparer une bibliothèque d'acide nucléique, de préférence une bibliothèque d'ADN, pour être séquencée, caractérisée en ce que ladite méthode comprend:
a) fourniture d'un ensemble ou une pluralité d'ensembles de molécules linéaires d'acide nucléique, chaque molécule d'acide nucléique comprenant sous sa forme circularisée et dans la direction 5' vers 3'
- une séquence à être séquencée entièrement ou partiellement
- un site inverse d'amorçage,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble de molécules d'acide nucléique, qui est placée entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage, et
- deux sites de reconnaissance pour deux enzymes de restriction différentes :
- un premier site de restriction pour une première enzyme de restriction qui est placé entre la séquence de code-barres et la séquence d'intérêt, et
- un deuxième site de restriction pour une deuxième enzyme de restriction qui est placée entre le site inverse d'amorçage et le site sens d'amorçage ;
b) circularisation desdites molécules linéaires d'acide nucléique par ligation intra- moléculaire ;
c) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape b) avec la première enzyme de restriction ;
d) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape c) dans la séquence d'intérêt ; et
e) circularisation desdites molécules d'acide nucléique clivées obtenues à partir de l'étape d) par ligation intra-moléculaire,
ce qui permet de fournir des molécules circularisées d'acide nucléique comprenant, dans la direction 5' vers 3', une séquence d'intérêt tronquée, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site inverse d'amorçage. Pcr/FR / o o o 6 3 4
WO 2012/080591 PCT/FR2011/000634
72
2. La méthode selon la revendication 1, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', une séquence d'intérêt, un site inverse d'amorçage, un site sens d'amorçage et une séquence de code-barres placée entre le site sens d'amorçage et la séquence d'intérêt.
3. La méthode selon la revendication 2, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placée en amont du site inverse d'amorçage, ladite enzyme ayant un site de clivage en amont du site de reconnaissance dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
4. La méthode selon la revendication 2 ou 3, caractérisée en ce que les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placée en amont du site inverse d'amorçage et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site inverse d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées de l'étape e) ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'; et
h) en option, une circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
5. La méthode selon la revendication 2 ou 3, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence de code-barres et une séquence d'intérêt tronquée en 3'. 73
6. La méthode selon la revendication 1, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent sous leur forme circularisée et dans la direction 5' vers 3', un site inverse d'amorçage, un site sens d'amorçage, une séquence d'intérêt et une séquence de code-barres placée entre la séquence d'intérêt et le site inverse d'amorçage.
7. La méthode selon la revendication 6, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une troisième enzyme de restriction placé en aval du site sens d'amorçage, ladite enzyme ayant un site de clivage en aval dans la séquence d'intérêt, et caractérisée en ce que le clivage de l'étape d) de la revendication 1 est réalisé par digestion avec ladite troisième enzyme de restriction.
8. La méthode selon la revendication 7, caractérisée en ce que les molécules d'acide nucléique fournies dans l'étape a) comprennent en outre, un site de reconnaissance pour une quatrième enzyme de restriction placé en aval du site sens d'amorçage, et caractérisée en ce que la méthode comprend en outre après l'étape e) :
f) digestion des molécules circularisées d'acide nucléique obtenues à partir de l'étape e) avec la quatrième enzyme de restriction ayant un site de clivage placé entre le site sens d'amorçage et la séquence d'intérêt pour lesdites molécules circularisées ; et
g) clivage des molécules d'acide nucléique digérées obtenues à partir de l'étape f) dans la séquence d'intérêt, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage ; et
h) en option circularisation des molécules d'acide nucléique obtenues à partir de l'étape g) par ligation intra-moléculaire.
9. La méthode selon la revendication 7, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt, une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage, et la méthode comprend en outre, après l'étape a) et avant l'étape b), l'étape de clivage des molécules linéaires d'acide nucléique fournies dans l'étape a), ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', une séquence d'intérêt tronquée en 5', une séquence de code-barres, un site inverse d'amorçage et un site sens d'amorçage.
WO 2012/080591 PCT/FR2011/000634
74
10. La méthode selon l'une quelconque des revendications 1 à 9, caractérisée en ce que les molécules d'acide nucléique fournies dans l'étape a) comprennent un site de liaison pour un premier membre d'une paire se liant par affinité ou est attaché à un premier membre d'une paire se liant par affinité, et la méthode comprend en outre, une ou plusieurs étapes de liaison des molécules d'acide nucléique sur un support solide par l'interaction entre le premier membre d'une paire se liant par affinité attaché auxdites molécules d'acide nucléique et les seconds membres desdites paires se liant par affinité liées au support solide, en particulier avant une étape de circularisation.
11. La méthode selon l'une quelconque des revendications 1 à 10, caractérisée en ce que la méthode comprend en outre l'étape de digestion des molécules d'acide nucléique circularisées avec la deuxième enzyme de restriction, ce qui permet de fournir des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers l'extrémité 3', un site sens d'amorçage, une séquence d'intérêt tronquée, un site inverse d'amorçage et une séquence de code-barres qui est entre le site sens d'amorçage et la séquence d'intérêt ou entre la séquence d'intérêt et le site d'amorçage inverse.
12. La méthode selon la revendication 11, caractérisée en ce que la méthode comprend en outre l'étape d'amplification des séquences de code-barres et des séquences d'intérêt tronquées à partir desdites molécules linéaires d'acide nucléique en utilisant une paire d'amorces s'hybridant sur les sites d'amorçage inverse et sens.
13. La méthode selon l'une quelconque des revendications 1 à 12, caractérisée en ce que les étapes de clivage des molécules d'acide nucléique sont réalisées en utilisant une technique de clivage indépendamment de la séquence, de préférence par sonication.
14. La méthode selon l'une quelconque des revendications 1 à 13, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un site universel d'amorçage en amont ou en aval de la séquence d'intérêt.
15. La méthode selon l'une quelconque des revendications 1 à 14, caractérisée en ce que les molécules linéaires d'acide nucléique fournies dans l'étape a) comprennent en outre, un module de courbure qui est placé, sous leur forme circularisée, entre le site inverse d'amorçage et le site sens PCJ/FR 20Π / 0 0 0 6 3 h
WO 2012/080591 PCT/FR2011/000634
75
d'amorçage, et qui est attaché au premier membre d'une paire se liant par affinité, de préférence un module de courbure comprenant, ou consistant en, une séquence sélectionnée parmi les séquences SEQ ID No. 1 et SEQ ID No. 2.
16. Une bibliothèque d'acide nucléique obtenue à partir de la méthode selon l'une quelconque des revendications 1 à 15.
17. Un kit comprenant au moins une première amorce sens permettant d'obtenir les molécules d'acide nucléique fournies à l'étape a) de la méthode selon l'une quelconque des revendications 1 à 12, ladite première amorce sens comprend, de son extrémité 5' vers son extrémité 3',
- un site inverse d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'; ou
- un site inverse d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site sens d'amorçage ou une partie de celui-ci incluant son extrémité 5'.
18. Le kit selon la revendication 17, caractérisée en ce que le kit comprend en outre au moins une seconde amorce sens comprenant, de son extrémité 5' vers son extrémité 3', un site sens d'amorçage ou d'une partie de celui-ci incluant son extrémité 3' et chevauchant la partie du site sens d'amorçage de la première amorce sens, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage.
19. Le kit selon la revendication 17, caractérisée en ce que l'au moins première amorce sens comprend en outre, à son extrémité 3', soit
- une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et soit au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage, et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou
- un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité 5' de la séquence d'intérêt ou un site universel d'amorçage. 76
20. Un kit comprenant au moins une première amorce inverse permettant d'obtenir les molécules d'acide nucléique fournies à l'étape a) de la méthode selon l'une quelconque des revendications 1 à 12, ladite première amorce inverse comprend, de son extrémité 5' vers son extrémité 3',
- un site sens d'amorçage, un site de reconnaissance pour une deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'; ou
- un site sens d'amorçage, un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction, et un site inverse d'amorçage ou une partie de celui-ci incluant son extrémité 3'.
21. Le kit selon la revendication 20, caractérisé en ce que le kit comprend en outre au moins une seconde amorce inverse comprenant, de son extrémité 5' vers son extrémité 3', un site inverse d'amorçage ou d'une partie de celui-ci incluant son extrémité 5' et chevauchant la partie du site inverse d'amorçage de la première amorce inverse, une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage.
22. Le kit selon la revendication 20, caractérisé en ce que l'au moins première amorce inverse comprend en outre, à son extrémité 3', soit
- une séquence de code-barres, un site de reconnaissance pour une première enzyme de restriction et au moins 10 nucléotides de l'extrémité 3' de la séquence d'intérêt ou un site universel d'amorçage et en option, à son extrémité 5', un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction ; ou
- un site de reconnaissance pour la troisième enzyme de restriction et/ou un site de reconnaissance pour la quatrième enzyme de restriction, et au moins 10 nucléotides de l'extrémité
3' de la séquence d'intérêt ou un site universel d'amorçage.
23. Le kit selon l'une quelconque des revendications 17 à 22, caractérisée en ce que la première amorce sens ou la première amorce inverse comprend un module de courbure comprenant un site de reconnaissance pour la deuxième enzyme de restriction et, attaché à un premier membre d'une paire se liant par affinité, telle qu'une biotine, de préférence un module de courbure comprenant ou consistant en la séquence sélectionnée parmi le groupe consistant en SEQ ID No. 1 et SEQ ID No. 2. 77
24. Un kit selon l'une quelconque des revendications 1 à 15, caractérisée en ce que les molécules circulaires d'acide nucléique obtenues dans l'étape b) de la revendication 1 peuvent en outre être obtenues alternativement par ligation inter-moléculaire entre - lesdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement fournies à l'étape a) de la revendication 1, et
- des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un premier site de restriction pour une première enzyme de restriction,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage, ou
- des molécules linéaires d'acide nucléique comprenant de l'extrémité 5' vers 3'
- un site inverse d'amorçage,
- un deuxième site de restriction pour une deuxième enzyme de restriction,
- un site sens d'amorçage,
- une séquence de code-barres spécifique à chaque ensemble desdites molécules linéaires d'acide nucléique à être séquencées entièrement ou partiellement,
- un premier site de restriction pour une première enzyme de restriction.
25. Une bibliothèque d'acide nucléique obtenue à partir de la méthode selon l'une quelconque des revendications 1 à 15 et 24.
EP11805901.3A 2010-12-13 2011-12-05 Séquençage "multiplexed anchor scanning parallel end tag" Withdrawn EP2652132A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1004835A FR2968671B1 (fr) 2010-12-13 2010-12-13 Sequencage maspet
PCT/FR2011/000634 WO2012080591A1 (fr) 2010-12-13 2011-12-05 Séquençage "multiplexed anchor scanning parallel end tag"

Publications (1)

Publication Number Publication Date
EP2652132A1 true EP2652132A1 (fr) 2013-10-23

Family

ID=44546010

Family Applications (1)

Application Number Title Priority Date Filing Date
EP11805901.3A Withdrawn EP2652132A1 (fr) 2010-12-13 2011-12-05 Séquençage "multiplexed anchor scanning parallel end tag"

Country Status (4)

Country Link
US (1) US20140148364A1 (fr)
EP (1) EP2652132A1 (fr)
FR (1) FR2968671B1 (fr)
WO (1) WO2012080591A1 (fr)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013036929A1 (fr) * 2011-09-09 2013-03-14 The Board Of Trustees Of The Leland Stanford Junior Procédés permettant d'obtenir une séquence
US10689643B2 (en) 2011-11-22 2020-06-23 Active Motif, Inc. Targeted transposition for use in epigenetic studies
EP3712267A1 (fr) 2013-05-22 2020-09-23 Active Motif, Inc. Transposition ciblée à utiliser dans les études épigénétiques
US20180320166A1 (en) * 2015-10-01 2018-11-08 University Of Washington Multiplex pairwise assembly of dna oligonucleotides
KR101651817B1 (ko) * 2015-10-28 2016-08-29 대한민국 Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509095A (ja) * 2008-01-09 2011-03-24 ライフ テクノロジーズ コーポレーション 核酸配列決定のための対をなすタグのライブラリーを製造する方法
JP2012514977A (ja) * 2009-01-13 2012-07-05 キージーン・エン・フェー 新規ゲノム配列決定戦略

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2012080591A1 *

Also Published As

Publication number Publication date
FR2968671A1 (fr) 2012-06-15
FR2968671B1 (fr) 2015-05-01
US20140148364A1 (en) 2014-05-29
WO2012080591A1 (fr) 2012-06-21

Similar Documents

Publication Publication Date Title
US20220162688A1 (en) Enhanced Adaptor Ligation
US20240141332A1 (en) Methods and compositions for preparing nucleic acid libraries
EP2423325B1 (fr) Procédé de préparation de bibliothèques de polynucléotides modèles
US9902994B2 (en) Method for retaining even coverage of short insert libraries
AU2018280131A1 (en) Single cell whole genome libraries for methylation sequencing
US9822394B2 (en) Nucleic acid sample preparation
US20090156412A1 (en) Surface-capture of target nucleic acids
EP2652132A1 (fr) Séquençage "multiplexed anchor scanning parallel end tag"
US11761033B2 (en) Methods to amplify highly uniform and less error prone nucleic acid libraries
US20240271126A1 (en) Oligo-modified nucleotide analogues for nucleic acid preparation
US20180010178A1 (en) Coupling adaptors to a target nucleic acid
CN114929895A (zh) 用于制备多核苷酸分子文库的方法
US20240240174A1 (en) Nick-ligate stlfr
CN117062910A (zh) 改进的文库制备方法
FR2883885A1 (fr) Recombinaison in vitro circulaire

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20130715

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: MILED, CHAOUKI

RIN1 Information on inventor provided before grant (corrected)

Inventor name: MILED, CHAOUKI

DAX Request for extension of the european patent (deleted)
17Q First examination report despatched

Effective date: 20150706

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20160701