WO2023052735A1 - Méthode de détection de mutations rares sur biopsie liquide - Google Patents

Méthode de détection de mutations rares sur biopsie liquide Download PDF

Info

Publication number
WO2023052735A1
WO2023052735A1 PCT/FR2022/051851 FR2022051851W WO2023052735A1 WO 2023052735 A1 WO2023052735 A1 WO 2023052735A1 FR 2022051851 W FR2022051851 W FR 2022051851W WO 2023052735 A1 WO2023052735 A1 WO 2023052735A1
Authority
WO
WIPO (PCT)
Prior art keywords
mutation
pcr
region
dna
sequence
Prior art date
Application number
PCT/FR2022/051851
Other languages
English (en)
Inventor
Dipanwita BISWAS
Original Assignee
Floating Genes
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Floating Genes filed Critical Floating Genes
Priority to EP22790339.0A priority Critical patent/EP4409034A1/fr
Publication of WO2023052735A1 publication Critical patent/WO2023052735A1/fr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Definitions

  • the present invention relates to the field of the detection of rare mutations in a biological sample. More specifically, it relates to a method for detecting rare mutations involving a first step of amplification of mutations by PCR, a second step of labeling sequences containing a mutation uniquely amplified with a unique molecular identifier (Unique Molecular identifier, UMI ), and a third step of correcting sequencing errors using UMI.
  • UMI Unique Molecular identifier
  • This method can be applied in many medical fields such as the detection of cancerous mutations at a very early stage, the detection of infectious diseases, the detection of immune diseases as well as inflammatory diseases, the detection of antibiotic resistance, the diagnosis prenatal, detection of mitochondrial DNA mutations, etc.
  • Apoptotic cells including tumor tissues, release their nucleic acids into the peripheral bloodstream and are therefore easily accessible from body fluids like blood, urine, etc. (Stroun et al. 1987).
  • the analysis of nucleic acids, proteins or metabolites derived from body fluids is called "liquid biopsy". Compared to biopsy of tissues derived from a single tumor site, the main advantage of liquid biopsy is its easy and noninvasive accessibility, its capacity for repeated sampling, and the broad coverage of tumor heterogeneity it contains ( Ilié and Hofman 2016; Gonzalez-Billalabeitia et al. 2019).
  • Circulating free DNA (cfDNA) has recently emerged as a promising biomarker and has the potential to revolutionize the detection and monitoring of cancers - diagnosis, monitoring of clonal evolution, drug resistance and response (Abbosh et al. 2017; Qin et al 2016; Tie et al 2015 and 2016).
  • Circulating tumor-derived DNA (ctDNA) can provide a broader picture of a cancer patient's mutational profile than tissue biopsy that is localized. Mutational profiling includes qualitative (nature of mutations) as well as quantitative (relative ratio of each mutation present) characterization of genes and this patient-specific profile helps in the personalization of treatment and disease monitoring.
  • ctDNA circulating tumor DNA
  • cfDNA circulating free DNA
  • ctDNA detection technologies There are a variety of ctDNA detection technologies on the market. Sequencing-based cancer detection technologies can be divided into two main categories – 1) untargeted sequencing and 2) targeted detection.
  • the first approach involves whole genome or whole exome sequencing to discover unknown point mutations or copy number variations (CNVs).
  • CNVs copy number variations
  • the advantage of untargeted sequencing is its ability to identify new changes occurring during tumor evolution without prior knowledge of tumor genes.
  • a high concentration of ctDNA is required for reliable detection of mutations and the overall sensitivity of these non-targeted sequencing techniques remains low (they cannot detect mutations greater than 5-10%) due to the low data depth.
  • low-depth or low-pass whole-genome sequencing each locus is read only once, which is insufficient to confer sufficient reliability on the data.
  • the targeted sequencing approach is highly sensitive, and mutations can be detected at an allele frequency rate of 0.01% in a rapid and cost-effective manner.
  • the quality of the analysis is superior to that obtained by non-targeted methods due to the greater depth of the sequencing data.
  • the main disadvantage of targeted sequencing is that it requires detailed information about tumor genetics.
  • Several targeted sequencing technologies have been invented over the past decades. In the "deep sequencing" approach, a target region is sequenced with very high coverage ( ⁇ 10,000x). The advantage of deep sequencing is to characterize multiple biomarkers in parallel, but its disadvantage is the extremely high depth required to detect low allele frequency, which significantly increases sequencing costs.
  • TAm-seq Gale et al. 2018
  • Capp-Seq are targeted sequencing approaches, and these technologies enrich target regions independently of wild-type or mutant sequences. Therefore, the ratio between wild type and mutant remains the same before and after the enrichment process. It does not solve the problem of early detection when the amount of ctDNA is extremely low and wild-type DNA may be 1000 times greater. Not all of the technologies previously described are of great use for early detection of cancer or screening for minimal residual disease, where the signal from ctDNAs may be masked by that of cfDNAs from healthy tissue.
  • 'COLD-PCR' Li et al. 2008 and 2009
  • ice-COLD-PCR Milbury et al. 2011
  • e-iceCOLD PCR How-Kit et al. 2013
  • COLD PCRs depend on the critical denaturation temperature (Te) below the Tm which is fixed for a certain length of DNA, they are not efficient when more than one hotspot needs to be detected in tandem.
  • Te critical denaturation temperature
  • Stuntmers can preferentially increase the enrichment of mutants over wild-type counterparts.
  • One primer can detect multiple mutations in tandem and can significantly increase mutant alleles during the PCR step, thus changing the ratio of mutant to wild type.
  • Stuntmers may be a promising tool for early cancer detection and can be coupled with high-throughput sequencing technologies.
  • mutant allele enrichment methods such as COLD-PCR, and other sequencing correction methods by labeling have been individually validated as summarized in Table 1. Only Capp-Seq/iDES combines enrichment of mutants and correction of sequencing errors.
  • NGS Next-generation sequencing
  • the inventors have created a methodology called “Enhance-seq” to generate high-reliability sequencing data by combining a mutation enrichment step with primers inspired by "Stuntmer” sequences, referred to herein as “Enhancers” sequences, followed by a sequencing error correction methodology based on the use of unique molecular identifiers (UMI). More precisely, the method of the invention is a two-step method for the detection of rare mutations - the first step is a PCR allowing the enrichment of the mutations based on the use of Enhancer sequences; these Enhancer sequences make it possible to specifically increase the number of mutated copies present in the population and at the same time to block the amplification of the wild-type sequence.
  • amplicons obtained are flanked by the sequence of a restriction site oriented at each end.
  • “Correctors” molecules containing a unique molecular identifier (UMI) are associated with each DNA molecule to correct errors generated during high-throughput sequencing (NGS).
  • the method of the invention allows the detection of a rare mutation in a biological sample, and comprises the following steps - o Step 1 - supply of a sample comprising DNA o Step 2 - selective amplification of the region containing said mutation using Mutation Enhancement PCR (MEP) comprising the following steps: a. Supply of an amplifying primer (Enhancer) for PCR comprising 3 regions:
  • amplicons containing said mutation comprising a restriction site oriented at each end, said restriction site being added, either during the PCR for enrichment of the mutation due to the fact that such a restriction site is present in said region-E of the primer, or by carrying out an additional PCR after step c. of said mutation enrichment PCR using primers containing such a restriction site.
  • Step 3 addition to each end of each amplicon of a Corrector sequence comprising a fixed sequence, a unique molecular identifier (UMI), an oriented restriction site compatible with those present at the ends of said amplicons, and possibly a specific label sample/patient, using said restriction sites o Step 4 - amplification of amplicons resulting from step 3 by PCR o Step 5 - sequencing of amplicons resulting from step 4 by NGS o Step 6 - correction of sequencing errors by software analysis using unique molecular identifiers.
  • UMI unique molecular identifier
  • the invention also relates to an enhancer primer comprising a restriction site in the E region.
  • the method for detecting rare mutations of the invention has advantages over the prior art for several reasons.
  • this method relies on the ability to selectively amplify rare mutations using mutation enhancement technology involving the use of Enhancers.
  • PCR with Enhancers offers a simple, highly sensitive and accurate way to detect rare mutations.
  • Enhancers are designed such that when used as a primer in a PCR reaction, they can suppress amplification of the wild-type sequence and preferentially allow amplification of mutant forms.
  • the design of the enhancers is based on the wild-type sequence and is not dependent on the mutation. Therefore, the same enhancer can identify multiple tandem mutations in a site containing one or more mutation hotspots, including point mutation, insertion, deletion, and rearrangements. Blocking and amplification occur with the same primers.
  • the amplicons include a restriction site oriented at each of their ends. This restriction site allows oriented binding of the Corrector sequences which will then be added to each end of the amplicon.
  • FIG. 5 illustrates a method in which UMIs are added by homopolymeric linkage (TA cloning).
  • TA cloning comprises several steps to be carried out in parallel or successively, for example: 1) T-tail, 2) A-tail, 3) Ligation.
  • As the binding reaction relies on a single base pair it cannot ensure that 100% of the amplicons containing the mutation are indeed bound, this can easily lead to DNA molecules containing rare mutations being missed Next.
  • the method is therefore not reliable because certain mutations may not be lost during the process.
  • FIG. 6 illustrates the method according to the invention based on the addition of UMI using the Golden gate method.
  • the binding of each amplicon with the adapter is effective and oriented due to the presence of a cohesive end formed of 4 bases whose pattern is different at each end.
  • Each sequence is therefore linked to a Corrector adapter to be amplified and a single copy per sequence is thus prepared.
  • the sequences can be read forwards and backwards, if more precision is desired. This method ensures that all mutated sequences are amplified and therefore allows a reliable diagnosis.
  • the method is based on the use of a unique molecular identifier (UMI) which allows correcting the sequencing error after the NGS read.
  • UMI unique molecular identifier
  • This UMI is a region of approximately -10 bp containing random sequences and is different for each molecule. When attached to an amplicon, it gives the amplicon a unique identity and helps distinguish two different DNA molecules.
  • the UMI is introduced by sense and antisense adapter molecules containing UMI sequences on both sides of the adapter molecule.
  • the labeling step is innovative, in that it relies on a Golden Gate-based UMI labeling approach to correct sequencing errors (see previously).
  • the inventors propose a labeling approach based on Golden gate technology.
  • the bond is directional.
  • the innovative approach consists in that the sense and antisense primers of the adapter molecule (here Corrector sequence) have a directionality to bind specifically with the inserter molecules and the design consists of a patient specific tag followed by a unique molecular identifier (UMI) on both sides of the adapter molecule.
  • UMI unique molecular identifier
  • this method relies on the enrichment of mutations using a first PCR (mutation enrichment PCR) followed by UMI labeling (see Figure 7).
  • the UMI labeling step makes it possible to label each sequence before amplification for sequencing so that it becomes possible to distinguish two different DNA molecules which are the product of the same PCR and to statistically analyze the result of the sequencing to correct sequencing errors by software analysis.
  • the use of UMI labeling makes it possible to rule out any false positives and therefore to significantly increase the sensitivity of the method (lower the detection limit).
  • Another advantage of this technology is that it does not require very deep sequencing because the detection is very sensitive thanks to the selective and reliable enrichment of mutations (all mutations, even very rare ones) before the step of amplicon amplification.
  • the increased sensitivity allows the result to be read using a next-generation shallow depth sequencing machine (e.g. Illumina iSeq 100) since the signal-to-noise ratio for mutants is high, whereas in prior art methods detection of rare mutations requires expensive machinery.
  • "deep sequencing" corresponds to 10,000 reads/target.
  • the method advantageously includes the use of sample or patient specific labeling so that different patient samples can be pooled and processed simultaneously in the NGS sequencing step.
  • the method is easy to implement because it is based on PCR and NGS, which are routine technologies. It can be offered in the form of a kit adapted to a particular diagnosis, which is very convenient for users.
  • Enhance-seq has advantages over COLD PCR because Enhancers can detect mutations in tandem, as shown by Huang et al. 2019.
  • Full Cold PCR cannot work with low DNA concentration and requires substantial accumulation of PCR products for mutation enrichment to occur; enrichment therefore only occurs in the later cycles of PCR.
  • the inventor's experimental results show that Enhance-seq can work with extremely low DNA concentration and exhibits 10 to 500-fold enrichment (Tables 3 and 5) depending on the initial template.
  • the method can be performed using only a small sample volume, especially a blood sample. It may be particularly appropriate if diagnosis of vulnerable patients, such as children, whose state of health does not allow several ml of blood to be taken.
  • a first object of the invention is a method for detecting a rare mutation in a biological sample, comprising the following steps - o Step 1 - supply of a sample comprising DNA o Step 2 - selective amplification of the region containing said mutation using Mutation Enhancement PCR (MEP) comprising the following steps: a. Supply of an amplification primer (Enhancer) for PCR comprising 3 regions: i. the R region which specifically recognizes and binds the wild-type sequence but cannot bind if the region contains a mutation, ii. a linker region and iii. the E-region which specifically binds to a sequence located upstream of the site of mutation; b.
  • MEP Mutation Enhancement PCR
  • a PCR comprising two hybridization steps: (i) a first hybridization at a temperature T1 which allows the binding of the R region of the primer to the wild-type sequence and (ii) a second hybridization at a temperature T2 which allows binding of the E-region of the primer; wherein T1 is at least 5°C higher than T2; vs.
  • T1 is at least 5°C higher than T2; vs.
  • the sequence containing said mutation is amplified d.
  • Step 3 addition to each end of each amplicon of a Corrector sequence comprising a fixed sequence, -, a unique molecular identifier (UMI), an oriented restriction site compatible with those present at the ends of said amplicons, and possibly a sample/patient specific tag, using said restriction sites
  • UMI unique molecular identifier
  • Step 4 - amplification of amplicons resulting from step 3 by PCR
  • Step 5 sequencing of amplicons resulting from step 4 by NGS o Step 6 - correction of sequencing errors by software analysis using unique molecular identifiers.
  • RNA e.g. mRNA
  • mRNA RNA
  • mutation corresponds to a rare genetic event with respect to a reference sequence.
  • the reference sequence can for example be the DNA sequence of a transplant recipient compared to the sequence of the graft, a first generation of a SARS-Cov 2 virus compared to an emerging variant of the virus in wastewater. It is understood that the method for detecting a rare mutation according to the invention allows the detection of one or more mutations simultaneously, in particular in a multiplexing situation.
  • a rare mutation can also result from methylation affecting DNA expression, including methylation occurring in regulatory sequences such as promoter or enhancer regions.
  • the rare mutation corresponds to the presence of a cytosine as a DNA methylation marker and the method therefore includes a step of processing the DNA sample before the DNA amplification of the step 2 to reveal the methylation site. This step can be carried out by methods known to those skilled in the art, such as bisulphite conversion or enzymatic conversion.
  • a rare mutation can correspond to a SNP, or more generally to a variant sequence.
  • a rare mutation can affect RNA, including but not limited to mRNA, but also possibly RNA if, mRNA; in this case, it can be detected by the method of the invention after conversion of mRNA into cDNA using reverse transcriptase. Accordingly, the method includes a DNA sample processing step prior to step 2 DNA amplification to convert RNA to DNA.
  • a mutation is considered "rare" when it is represented in less than 50% of the DNA of the sample analyzed.
  • the method of the invention is applied to the detection of mutations having a frequency less than or equal to 1%, in particular a frequency less than 0.1%, or less than 0.001% or less than 0.0001%.
  • the method's detection limit has been estimated to be approximately 0.00001% or less; this range of detection limits is compatible with the detection of ultra-rare mutations.
  • the method detected 10 mutant DNA molecules against a background of 10 9 wild-type molecules.
  • Step 1 of the method involves providing a sample containing DNA.
  • This sample is a biological sample or is derived from a biological sample.
  • biological sample means a sample comprising at least DNA or RNA. It can be a complex biological fluid such as blood, urine, tears or an extract of such a fluid which contains DNA or RNA.
  • the biological sample can also be prepared from a prokaryotic or eukaryotic cell, from a virus or from any other biological tissue.
  • the method of the invention is particularly relevant for the detection of rare mutations in free circulating DNA (cfDNA) in a liquid biopsy.
  • Step 2 of the method consists of selective amplification of rare mutations by mutation amplification PCR (MEP) derived from the work of Huang et al, 2019.
  • MEP mutation amplification PCR
  • an “enhancer” is a so-called “enhancer primer” containing three regions arranged from the 5' end to the 3' end in the following order - the recognition region (region-R ), the linker region and the extension region (E-region) ( Figure 1).
  • the R-region is designed to recognize a site rich in mutations (hotspot) and hybridize to the wild-type version of the sequence. In case of mutation, the binding of the R-region is compromised.
  • the E-region binds to sequences upstream of the hotspot.
  • the Tm (hybridization temperature) of the R-region is about 5 to 10°C higher than that of the E-region.
  • the linker region can be composed, for example, of a spacer region comprising from 3 carbons (“C3 spacer") to 12 carbons (“C12 spacer”), for example 3, 6, 8, 9 or 12 carbons .
  • This binding region is a non-nucleotide region capable of blocking the amplification of the sequence.
  • the Enhancer consists of 3 regions with the presence of a restriction site oriented upstream of the E-region. The sticky ends produced at the 5' end and the 3' end of the amplicon are different. This difference makes it possible to make a specific connection at each end. See Figures 2 and 3.
  • PCR with Enhancer has two annealing temperatures to facilitate linking two regions of the primers alternately. Binding of the template with the R or E region of the Enhancer primer depends on the sequence of the template, whether wild-type or mutant, and is controlled by the annealing temperatures.
  • the enhancer's R-region is designed to bind to the wild-type version of the matrix in the hotspot region. During the first hybridization, all the wild-type sequences are saturated by the binding of the activator with the R-region. In this binding configuration, PCR cannot take place. In this binding configuration, the PCR cannot proceed due to the presence of non-nucleotide structure of the binding region and therefore no product is formed.
  • the oriented restriction site may be a site recognized by a type II or type III restriction enzyme; however, it is preferred to use a type II restriction enzyme site because type II restriction enzymes allow directional insertion with greater flexibility than type III restriction enzymes.
  • a restriction site that can be used in the method according to the invention can be the site of the Bsal restriction enzyme, but other enzymes are also suitable, such as Bbsl, BsmBI, etc.
  • the 5' end and the 3' end of the adapter binding region are designed with two distinct cohesive sequences originating from the Bsal restriction site. These separate linker sequences add specificity to each end. Binding is preceded by a BsaL restriction digest
  • the 4-base cohesive end in Golden Gate technology allows for greater binding efficiency compared to a single nucleotide cohesive end as used in cloning YOUR.
  • a double-stranded consensus sequence is present in the 5' and 3' directions of the amplicon, which increases the reliability of the sequencing data.
  • LNA bases modified nucleic acids (locked nucleic acids). This is a class of high affinity RNA analogs in which the ribose ring is “locked” in the ideal conformation for Watson-Crick binding. This structure gives LNA bases increased thermal stability and allows stable hybridization with shorter hybridization sequences.
  • the LNA bases can also be used differently as described below, these embodiments being able to be combined with one another.
  • a restriction site is added by carrying out an additional PCR, after step c. mutation enrichment PCR, using primers containing an oriented restriction site.
  • the amplicon obtained is flanked by the sequence with a restriction site at each of its ends. Digestion with the restriction enzyme corresponding to the sequence of the site, allows the digestion of the DNA and reveals the cohesive ends useful for efficient binding to the Corrector sequences.
  • Corrector sense and antisense sequences are provided with the same restriction site.
  • they are digested, for example with a restriction enzyme, for example BsaL
  • a restriction enzyme for example BsaL
  • the cohesive end produced after digestion is specific for the 5' and 3' ends, which makes the binding very specific.
  • Digestion is followed by a binding reaction with T4 DNA ligase.
  • a nuclease specific for double-stranded DNA is added, either before the PCR for enriching the mutation, or after the PCR for enriching the mutation.
  • the DSN enzyme makes it possible to cut perfectly hybridized double-stranded DNA.
  • the amplification of the mutation can intensify thanks to the cleavage of the wild-type DNA upstream of the amplification.
  • This step may contribute to better multiplexing ability due to less interference from wild-type DNA.
  • the elimination of wild sequences makes it possible to reduce the background noise.
  • the wild-type sequences are cleaved and eliminated, which promotes the amplification of amplicons containing the mutations in step 4.
  • probes specific for wild-type sequences comprising LNA bases are added after addition of the Corrector sequences, as well as a DSN.
  • the method is preferably applied under multiplexing conditions, ie several mutations are searched for simultaneously using different pairs of primers in one and the same reaction. This embodiment is illustrated in Figure 10 and looks like this:
  • Step A Mutation enrichment PCR from cfDNA
  • Step B Attaching the Corrector Sequence
  • Step C Addition of probes (which may include LNA bases) for pairing with the wild-type sequence.
  • probes which may include LNA bases
  • a DSN is added to the reaction. The DSN will cut any perfectly hybridized duplex (wild-type sequence) and will not cut in case of mismatch (mutated sequences).
  • Step D Uncleaved sequences are recovered for the next amplification.
  • the method comprises the addition of probes specific for the mutations and comprising one or more LNA bases coupled to a marker (for example biotinylated probes) after amplification from step 2 and addition of Corrector sequences from step 3.
  • a marker for example biotinylated probes
  • the use of such probes allows the enrichment in mutants.
  • the method can be illustrated in Figure 11 and proceeds as follows:
  • Step A Mutation enrichment PCR is performed using cfDNA.
  • Step B Attaching the Corrector Sequence
  • Step C Binding of biotinylated LNA probes specific for each mutation. The mutants hybridize with the probe and are therefore taken up by the magnetic streptavidin beads.
  • Step 3 consists of adding a corrective sequence (Corrector) comprising a fixed sequence, a unique molecular identifier (UMI) (allowing UMI labeling) at each end of the amplicon using a restriction site.
  • Core corrective sequence
  • UMI unique molecular identifier
  • a patient or specimen specific label can be included in the Corrector sequence.
  • Such a label is specific to each sample and makes it possible to group different samples in order to process them simultaneously by NGS sequencing.
  • the "fixed sequence” is a particular sequence that is common to all amplicons.
  • the fixed sequence overlays the NGS adapters which allows the sequence to be attached to the flow cell adapter for NGS sequencing. Fixed sequences ensure uniform amplification of all sequences since the same universal primers are used for all sequences prior to NGS.
  • each Corrector molecule is composed of at least one fixed sequence, a unique molecular identifier (UMI) followed by a restriction site, for example for a type II restriction enzyme). Corrector sequences are added on either side of each amplicon molecule; the same model is therefore applied for the sense and antisense Correctors. It can be noted that, given the current developments in NGS technology, especially with regard to its reliability, it is strongly recommended to read the sequences on both the sense and antisense strands. If, in the future, the reading of the single sense strand (oriented in the 5′-3′ direction) is sufficient, the strand oriented in the 5′-3′ direction can be preferentially amplified.
  • small additional barcode sequences are associated with the mutations to remove any ambiguity as to the presence or not of a mutation, in the event of an error in the amplification or in the sequencing of the UMIs.
  • These small barcodes can be added, either at the time of the enrichment PCR due to the presence of such barcodes in the E-region, or at the same time as said oriented restriction site when the latter is added by PCR, or at step 3 due to its presence in the Corrector sequence.
  • these are nucleotide sequences consisting of 1 to 6 nucleotides, preferably 3 to 5.
  • Step 4 consists of amplifying the amplicons resulting from step 3 by PCR.
  • the analysis method of the invention makes it possible to correct sequence errors thanks to the presence of a unique molecular identifier.
  • a sense Corrector sequence (5') and an antisense Corrector sequence (3') containing a universal molecular identifier is added from a pool of unique adapters using a binding site.
  • UMI gives a unique identity to each DNA molecule.
  • all molecules are amplified by PCR with a pair of universal primers; each UMI is therefore replicated several times. Error correction is done starting with each UML sequence. If a daughter molecule has the same 50% or more mutation, it is a true mutation, otherwise it is considered a sequencing error.
  • Each UMI is read in the 5'-3' direction and in the 3'-5' direction.
  • Step 5 consists of classic NGS sequencing.
  • NGS sequencing is a high-throughput technology that allows many samples to be processed simultaneously. As a result, samples can be pooled after step 4. In preparation for reading results for each patient/sample, each patient/sample's samples are tagged using label technology. step 3 (patient label or sample label). Step 6 consists of correcting sequencing errors by software analysis using unique molecular identifiers (UMI). The complete method is shown in Figure 9.
  • UMI unique molecular identifiers
  • the present detection method allows the detection of very small amounts of specific DNA sequences in a background of excess wild-type sequences, which allows early detection (screening, diagnosis), prognosis and monitoring of diseases that can be detected by the appearance of specific genetic sequences. It allows the detection of these variants earlier than other state-of-the-art methods.
  • a second object of the invention relates to an amplifying primer (Enhancer) allowing the integration of a restriction site into the amplicon during the enrichment PCR.
  • Enhancer amplifying primer
  • Such an enhancer primer comprises 3 regions: i. the R region which specifically recognizes and binds the wild-type sequence but cannot bind if the region contains a mutation, ii. a linker region and iii. the E-region which specifically binds to a sequence located upstream of the mutation site and comprises the sequence of an oriented restriction site positioned upstream of the E-region.
  • restriction site is Bsal.
  • the enhancer primer comprises LNA bases in the R-region.
  • the amplifier primer comprises both a restriction site in the E-region and LNA bases in the R-region.
  • the method of the invention can be applied in many fields. Some applications are described below.
  • a tumor releases its genetic material into the bloodstream in the form of DNA, mRNA, small non-coding RNA, etc.
  • the retrieval of information about genetic material from a cancer patient's blood sample, from cell-free nucleic acid, is called "liquid biopsy” and has gained popularity due to its non-invasive nature, its repeatability and dynamics.
  • NGS has revolutionized the field of liquid biopsy and thus cancer detection, due to its ability to sequence hundreds of cancer hotspots in parallel and establish a patient-specific profile. This personalized genetic profile reveals the main motor mutations in order to recommend a personalized treatment.
  • the information obtained from DNA can come in two different forms. Epigenetic changes of DNA by methylation and somatic mutations of its DNA - point mutation, insertion, deletion, rearrangement, copy number change, etc. To know the cancer-causing mutations, a mutational profile can be generated by NGS-based analysis. On the other hand, cancer detection by NGS suffers from low sensitivity mainly due to the presence of a very low amount of circulating tumor DNA (ctDNA) and errors generated by the NGS machine. In stage I cancer, a 2-3 cm tumor typically releases around 10 ctDNA in 10 ml of blood (Fiala and Diamandis. 2018).
  • RNA splicing can be biomarkers for prognosis and therapy (Nilsson et al, 2016; De Fraipont, 2019). Therefore, mRNA can be reverse transcribed into DNA and Enhancers can be designed to detect any dysfunction.
  • NIPT Non-invasive prenatal test
  • the panel of Gene microdeletions "Enhance-seq” will be able to very efficiently find known genetic deletions and overcome “unreportable results" when there is not enough DNA. As the technology can work with very low copies of DNA, the test can be performed before the tenth week of pregnancy, when chemical abortion is possible.
  • Pathogens can acquire genetic variants responsible for the emergence of drug resistance, even if they are present at low frequency in the initial population. This is a serious problem in hospitals where nosocomial illnesses and sepsis cause deaths. Detecting these rare variants earlier could prevent their spread through earlier surveillance and therapeutic choices, both in the medical and veterinary market.
  • rpoB The following genes confer antibiotic resistance (in parentheses) - rpoB, rpoC (Myxopyronin), rpsL, rrs, rrl, rpsE (Amikacin, streptomycin, spectinomycin), gyrB (Coumermycin, novobiocin), dfrA (Trimethoprim), fusA (Acid fusidic), 23S rRNA (Clarithromycin, erythromycin, tylosin), gyrA, gyrB, parC, parE, grIA (Ciprofloxacin, nalidixic acid, norfloxacin), rpoB (Rifampicin) genes (Melnyk et. al. 2015). gyrA and grIA in Ciprofloxacin-resistant Staphylococcus aureus mutants (Ferrero et al. 1995).
  • Mycobacterium tuberculosis becomes drug resistant by acquiring mutations at seven loci - rpoB, pncA, katG; mabA(fabGl)-inhA, gyrA, gyrB and rrs (Flandrois et al. 2020).
  • the sequencing of their variant is possible with this method, if the wild-type sequence of the "hotspot” regions is known.
  • the receptor binding domain (RBD) of the spike protein of Covid-19 variants will find rare mutations in each wild-type hotspot, whatever the mutation. It could therefore be useful for screening emerging mutants of the Sars-CoV-2 virus. This is relevant for the medical and veterinary markets (eg H1N1, H5N1 infections).
  • Enhance-seq will be able to detect rare mutant species in our microbiome (skin, intestine, etc.) to facilitate diagnosis, prognosis or personalization of treatments.
  • Cell-free DNA is a good biomarker for organ transplant rejection (Khush et al. 2019).
  • donor-derived circulating free DNA (cfDNA) present in the recipient's blood comes from damaged cells (Martuszewski et al., 2021; Cheng et al. 2020). Circulating free DNA (cfDNA) from the graft is released into body fluids in very low amounts and must be detected from the recipient's cfDNA noise in order to detect early signs of rejection.
  • the concentration level of donor-derived cfDNA increases before any other protein biomarker (creatinine in the case of kidney transplantation).
  • Early detection of the amount of donor-derived cfDNA in the blood or urine of the organ or graft recipient can guide adequate treatment and prevent premature graft loss.
  • the single nucleotide polymorphism (SNP) profile of the donor and recipient can be established.
  • Custom Enhancers can be designed from the donor's SNP profile.
  • the 'Enhance-seq' method can be applied to detect the presence of donor DNA at a very early stage of transplantation (for example, after a few hours).
  • somatic mutation-specific Enhancers can be generated to create gene panels for known autoimmune loci.
  • the “Enhance-seq” method will be applied to discover any somatic mutation from the free DNA of cells and to establish an early diagnosis of autoimmune diseases. A personalized treatment of autoimmune diseases will therefore be possible.
  • Circulating DNA can be used as a biomarker of inflammation.
  • Genetic mutations or DNA methylation changes are linked to inflammatory bowel disease (IBD).
  • IBD inflammatory bowel disease
  • Patients with IBD are at high risk of developing gastrointestinal cancer due to the accumulation of insertion-deletion mutations (Olafsson et al. 2020). It is therefore necessary to detect this risk at an early stage.
  • the two main subtypes of HD are Crohn's disease (CD) and ulcerative colitis (UC). They are usually difficult to distinguish and better patient management requires accurate identification (Mirkov et al. 2017).
  • the 'Enhance-seq' IBD sequencing panel can allow accurate identification of the disease at an early stage.
  • AD Alzheimer's disease
  • EOAD Early onset Alzheimer's disease
  • PSEN1 or PSEN2 genes inherited from an autosomal dominant trait in a few families (Nicolas et al. 2018 ). Enhance-seq's Alzheimer's specific gene panel will be able to detect the disease at a very early stage.
  • ischemic brain injury When a person suffers from traumatic brain injury (TBI) or ischemic brain injury as a result of cardiac arrest or multiple sclerosis, brain-derived circulating DNA (cfDNA) is released, which which provides evidence of neurodegeneration (Chatterton et al. 2019). Tracing the methylation pattern to know the cerebral origin can be very useful in this case. It is possible to design specific enhancers of the methylation pattern and identify the DNA fraction that shows neuronal cell identity and in turn indicates disease severity. See figure
  • Mitochondrial DNA mutation is associated with age-related diseases and age-related macular degeneration (AMD).
  • AMD age-related macular degeneration
  • Atilano et al. (2021) performed very deep sequencing to differentiate heteroplasmic very low frequency SNPs and found 23 hotspots related to this pathology.
  • the "Enhance-seq" technology can be particularly useful in this case. Enhancers can be generated and a panel of genes can be created to enhance very low frequency SNPs in mitochondrial DNA.
  • FIG. 1 Representation of the primer used in the mutation enrichment PCR.
  • An Enhancer is composed of 3 parts - The R-region or recognition region, the E-region or amplification region and a binding region.
  • the R region is intended to bind to the hotspot of the wild-type region of the gene.
  • the first hybridization temperature allows this binding. In this case, the PCR cannot proceed due to the presence of a non-nucleotide structure of the binding region.
  • B If the hotspot region is mutated in the template gene, then binding is not efficient.
  • C In case of mutation, binding is more efficient with the E-region of the primer. In this case, the PCR proceeds because it is not stopped by the non-nucleotide structure of the binding region.
  • Figure 2 Design of Enhancers comprising a Bsal restriction site and amplification scheme allowing labeling of amplicons.
  • Figure 3 Illustration of the use of an oriented restriction site for the introduction of Corrector sequences at the ends of the amplicons.
  • FIG. 4 Principle of the addition of UMI by PCR: fate of a single molecule. Data analysis is performed by UMI clustering. To analyze the same mutations (here, L858R), the same DNA molecule will be encoded by different UMIs, so it will require higher sequencing depth due to multiple clustering. (This technique corresponds to that of the “Safe-seq” method).
  • Figure 5 Principle of the addition of UMI by “A-tailing”: fate of a single molecule.
  • the strand specificity is given by a single base. This easily leads to sequencing errors (This technique is used in the “Duplex Seq” method).
  • Figure 6 Principle of the addition of UMI by implementing the Golden gate method: fate of a single molecule.
  • Each end of a DNA is uniquely labeled and read back and forth providing sequence information for the (+) and (-) strands.
  • Each cohesive end formed by 4 bases is specific to each strand and makes it possible to identify an asymmetric mutation.
  • Figure 7 This figure illustrates the method of inserting a restriction site (binding site) by PCR after the enrichment PCR.
  • A pair of primers containing a restriction site.
  • B representation of the amplicons obtained after PCR using the pair of primers from step A.
  • C binding of the Corrector adapters to the amplicons by the Golden gate method via the restriction sites.
  • Figure 8 This figure shows how the "Enhance-seq" method will be implemented if the initial sample is a methylated DNA.
  • A the methylated DNA template will undergo bis-sulfite or enzymatic conversion or any other method of conversion that will convert any unmethylated cytosine molecule to uracil molecule.
  • Methylated cytosines on the other hand, remain in the form of cytosine.
  • the pattern of methylation protection is different in people with cancer and in those without.
  • the methylation signature can be thought of as "mutations”.
  • B DNA containing uracil is amplified by PCR to convert uracil into thymine molecule.
  • C The resulting DNA is ready to serve as a template in the "Enhance-seq" method.
  • Step 9 This figure outlines the three main steps of the "Enhance-seq” method.
  • the first two steps are part of the “Enhance-seq” method of molecular biology, and the third step is data correction by software.
  • Step 1 is Mutation Enrichment PCR (MEP) which amplifies the mutation signal present in the initial population.
  • MEP Mutation Enrichment PCR
  • step 2 the adapters or Corrector molecules are linked with the amplicons.
  • a PCR is carried out to amplify the molecules so that each UMI present in the Corrector is replicated many times.
  • step 3 the correction of sequencing errors is performed in the amplicon using the Corrector UMIs.
  • Each sequence from the MEP thus has a UMI, is once again amplified.
  • a consensus is then drawn from all the daughter sequences having the same UMI, which makes it possible to distinguish mutations from sequencing errors.
  • Figure 10 Implementation of the method under multiplexing conditions coupled with a duplex-specific nuclease (DSN).
  • Figure 11 Implementation of the method allowing the enrichment in mutants by the use of LNA bases coupled to a marker.
  • Figure 12 represents the analysis of the enrichment PCR of the mutation (on the agarose gel).
  • lane 1 only the wild-type form and in lane 2, only the mutant form of the plasmids was used as template.
  • the wild type and the mutant in the ratio 98-2 were used.
  • the expected PCR product is approximately 430 bp.
  • no amplification is observed in the expected region.
  • lanes 2 and 3 on the other hand, strong amplification was observed.
  • the following examples illustrate the implementation of the method for the detection of a 15 base pair deletion on exon 19 of the EGFR gene and the point mutation (eg, EGFR L858R on exon 21).
  • Enhancers are primers specifically designed to specifically enhance mutants, but not wild type.
  • the design of the Enhancers is inspired by the article by Huang et al. 2019 which showed a new way to design primers (called “stuntmers”) to specifically reinforce mutations in a context where wild-type DNA is very present.
  • the first step in the 'Enhance-seq' method is Mutation Amplification PCR (MEP), where mutated sequences are preferentially amplified over wild-type using Enhancers or stuntmers. The following primer sequences were used during the experiments - Mutation by deletion of exon19
  • PCR conditions Initial denaturation - 98°C for 30 seconds, denaturation - 98°C for 10 seconds, primary annealing - 70°C for 30 seconds, secondary annealing - 57°C (for exon 19), and 59°C (for exon 21) for 30 seconds. Extension - 72°C for 30 seconds. Final extension - 72°C for 2 minutes. For 35 - 45 cycles.
  • the binding sites were created by adding Bsal to each end of the amplicon.
  • Double-stranded DNA (DSN) specific nuclease treatment (optional):
  • the hybridization temperature of the R-region of the Enhancers is chosen to be around 67°C.
  • the experiment takes place according to the following steps: i) In a thermocycler, the temperature is increased to 98° C. in order to denature the DNA. ii) The sample is cooled to 67°C (first hybridization temperature of MEP), DSN is added and the reaction is incubated for 20 minutes. iii) The incubation is followed by 2 minutes of inactivation of the DSN enzyme at 95°C. iv) The sample is cooled again to the second hybridization temperature of the MEP and the PCR is carried out after adding the necessary reagents.
  • the reactions are incubated at 37°C for 40 minutes and quenched at 60°C for 10 minutes. Then, the reactions are cleaned by PCR clean up kit and eluted in lOul of elution buffer.
  • 6 bp X denotes the sample or patient label
  • 10 bp N denotes the degenerate UMI region.
  • Amplicons bound with Correctors were amplified by PCR using Q5 polymerase - PCR reaction: Q55x Master mix - 5ul; dNTPs (10mM) - 0.5ul; Universal_fwd_primer (10mM) - 1.25ul; Universal_rev_primer (10mM)- 1.25ul; Template-5ul; Water- 12ul.
  • 450 bp PCR products containing exon 19 and exon 21 were amplified from plasmids pUC57-W or M. They were then mixed at different concentrations. These amplicons then have were added with human serum (Sigma-Aldrich) to mimic the clinical condition where cell-free DNA is mixed with human serum. Amplicons were then isolated from serum.
  • Applied Biosystem's MagMAXTM Cell-Free DNA Isolation Kit was used to isolate amplicons from the serum sample. This kit is designed to isolate circulating DNA from cell-free human plasma, serum and urine samples using Dynabeads magnetic beads. Manufacturer's instructions were followed to isolate amplicons from serum. Isolated amplicons were eluted in 20 ⁇ l of elution buffer.
  • Mutation enrichment PCRs were performed for deletion mutation of Exonl9 with primer Fwd_exonl9_enhancer and Reverse_exon21 using different plasmid templates - wild type pUC57-W, mutant pUC57-M and mixture of these two in reports (98-2) to see if the effect of mutation enrichment PCR can be observed visually in the agarose gel. All matrices were used at concentrations of 10 ng/ul. After 35 cycles of MEP, the amplicons were loaded into the 2% agarose gel. The expected PCR product is approximately 430 bp for the wild-type sequence and 415 bp for the mutant form. No amplification was observed in the case of the wild type; in contrast, strong amplification bands were observed when a mutant or a mixture of wild type and mutants was used as the template (Figure 12).
  • the purpose of this experiment was to quantify the increase in mutation signal and see if multiple cycles of PCR are required to significantly increase the mutant population.
  • the wild type pUC57-W and the mutant pUC57-M plasmids were diluted to a concentration of 10 ng/ ⁇ l each and then used in two different ratios.
  • Mutation enrichment PCRs were performed using these two mixtures as initial templates. Three consecutive rounds of PCR were performed using the amplicon from the previous round as template for the next PCR. Each time, after one cycle of PCR, the product was purified and diluted to a concentration of 10 ng/ ⁇ l before proceeding to the next PCR step. The results show that a single PCR round (here 35 cycles) is sufficient to saturate the mutation and block wild-type amplification and that several additional PCR rounds do not increase the amount of mutants in the population.
  • This experiment aims to identify the detection threshold of MEP and traditional PCR in absolute numbers.
  • pUC57-W and pUC57-M were diluted to have the following concentrations per lOul- 1) 10 molecules of mutant plasmid and 10 8 molecules of wild-type plasmid (0.00001%)
  • MEP can detect the mutation at least 10 to 60 times more efficiently in hyper-dilute concentrations of mutant DNA where 10 mutant DNA molecules or less (according to Poisson statistics) are present in the background of 100 million or 1 billion wild-type DNA sequences. In the ratio of 10 to 1 billion molecules of mutant DNA compared to wild-type DNA, MEP showed amplification capacities 10 to 50 times higher depending on the nature of the mutation (point mutation or deletion). This will allow detection of extremely small amounts of mutations present in the population in shallow depth sequencing machines, which will save investment.
  • pUC57-W and pUC57-W were amplified to obtain two different 450 base pair amplicons. These wild-type and mutant amplicon DNAs were diluted to a concentration of 2ng/ml and then mixed in different ratios. Then, the amplicons were added in 500 ⁇ l of serum with the following concentrations.
  • Two plasmids, PUC57 containing either the wild type KRAS gene or the mutant KRAS gene were constructed. They were mixed so that the ratio between the mutant plasmid and the wild-type plasmid was 0.001%.
  • Enhancers were designed to preferentially amplify mutant DNA sequences over wild-type sequences. Enhancers containing LNA bases (locked nucleic acid) at the site of the mutation in the R region have been designed. They can easily differentiate the base of the wild type from that of the mutant.
  • LNA locked nucleic acid
  • One of the advantages of using LNA is the increased melting temperature of the LNA:DNA pair in the wild-type template compared to the mutant template, which allows for more efficient discrimination and amplification of the mutant matrix.
  • the primer sequences are mentioned below. Locked nucleic acids are indicated in square brackets [].
  • KRAS1 Fwd 5'-GGAGCT[G]GTG[G]CGTAGGCAAGAG-C3-
  • PCR conditions initial denaturation: 98°C for 30 seconds; denaturation: 98°C for 10 seconds; first hybridization: 76° C. for 60 seconds; second hybridization: 57° C. for 30 seconds. Extension: 72°C for 30 seconds. Final extension: 72°C for 2 minutes. For 45 cycles.
  • T4 DNA ligase buffer 2.5ul
  • Amplicon 20ng
  • Fwd_barcode lOng
  • Rev_barcode lOng
  • the reactions are incubated at 37 Q C for 1 h and quenched at 60 Q C for 10 mins.
  • the reaction products are then purified by the PCR purification kit and eluted in 20 ⁇ l of elution buffer.
  • XXXXX refers to the sample or patient barcode; NNNNNNNN denotes the degenerate UMI region.
  • the amplicons containing the Correctors were amplified with a PCR using the 2X master mix of Q5:
  • P5_fwd_primer 5'- AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC -3' (SEQ ID NO.15)
  • P7_rev_primer 5'- CAAGCAGAAGACGGCATACGAGATGTGACTGGAGTTCAGACGTGTG -3' (SEQ ID NO.16)
  • Table 8 Change in ratios of mutant genes before and after MEP.
  • the negative control containing 100% WT and no mutants shows no mutant DNA after MEP, suggesting the absence of contamination in our procedure.
  • the VAF is the mutant/wild type ratio.
  • Circulating tumor DNA profiling reveals heterogeneity of EGFR inhibitor resistance mechanisms in lung cancer patients. Nature communications, 7(1), 1-15.
  • Brain-derived circulating cell-free DNA defines the brain region and cell specific origins associated with neuronal atrophy. bioRxiv, 538827.
  • EML4-ALK fusion transcripts sequester in circulating blood platelets and enable blood-based crizotinib response monitoring in non-small-cell lung cancer.
  • Circulating tumor DNA analysis detects minimal residual disease and predicts recurrence in patients with stage II colon cancer.
  • Science translational medicine 8(346), 346ra92-346ra92.
  • Clinical chemistry 61(9), 1191-1196.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La présente invention concerne le domaine de la détection de mutations rares dans un échantillon biologique. Plus précisément, elle concerne une méthode de détection de mutations rares impliquant une première étape d'amplification des mutations par PCR, une deuxième étape d'étiquetage des séquences contenant une mutation amplifiée de manière unique avec un identifiant moléculaire unique (Unique Molecular identifier, UMI), et une troisième étape de correction des erreurs de séquençage en utilisant l'UMI. Cette méthode peut être appliquée dans de nombreux domaines médicaux tels que la détection de mutations cancéreuses à un stade très précoce, la détection de maladies infectieuses, la détection de maladies immunitaires ainsi que de maladies inflammatoires, le dépistage de la résistance aux antibiotiques, le diagnostic prénatal, la détection de mutations de l'ADN mitochondrial, etc.

Description

MÉTHODE DE DÉTECTION DE MUTATIONS RARES SUR BIOPSIE LIQUIDE
La présente invention concerne le domaine de la détection de mutations rares dans un échantillon biologique. Plus précisément, elle concerne une méthode de détection de mutations rares impliquant une première étape d'amplification des mutations par PCR, une deuxième étape d'étiquetage des séquences contenant une mutation amplifiée de manière unique avec un identifiant moléculaire unique (Unique Molecular identifier, UMI), et une troisième étape de correction des erreurs de séquençage en utilisant l'UMI. Cette méthode peut être appliquée dans de nombreux domaines médicaux tels que la détection de mutations cancéreuses à un stade très précoce, la détection de maladies infectieuses, la détection de maladies immunitaires ainsi que de maladies inflammatoires, le dépistage de la résistance aux antibiotiques, le diagnostic prénatal, la détection de mutations de l'ADN mitochondrial, etc.
DOMAINE DE L'INVENTION
Les cellules apoptotiques, y compris les tissus tumoraux, libèrent leurs acides nucléiques dans la circulation sanguine périphérique et sont donc facilement accessibles à partir des fluides corporels comme le sang, l'urine, etc. (Stroun et al. 1987). L'analyse des acides nucléiques, des protéines ou des métabolites dérivés des liquides corporels est appelée "biopsie liquide". Par rapport à la biopsie de tissus dérivés d'un seul site tumoral, le principal avantage de la biopsie liquide est son accessibilité facile et non invasive, sa capacité d'échantillonnage répété et la large couverture de l'hétérogénéité tumorale qu'elle contient (llié et Hofman 2016 ; Gonzalez-Billalabeitia et al. 2019).
L'ADN libre circulant (cfDNA) est récemment apparu comme un biomarqueur prometteur et a le potentiel de révolutionner la détection et le suivi de cancers - diagnostic, suivi de l'évolution clonale, résistance et réponse aux médicaments (Abbosh et al. 2017 ; Qin et al. 2016 ; Tie et al. 2015 et 2016). L'ADN circulant dérivé de la tumeur (ctDNA) peut fournir une image plus large du profil mutationnel d'un patient atteint de cancer que la biopsie de tissu qui est localisée. Le profil mutationnel comprend une caractérisation qualitative (nature des mutations) ainsi que quantitative (ratio relatif de chaque mutation présente) des gènes et ce profil spécifique au patient aide à la personnalisation du traitement et au suivi de la maladie. La détection de l'ADN tumoral circulant (ctDNA) dans la profusion d'ADN libre circulant (cfDNA) provenant des cellules saines est un défi en raison de leur rareté (Schwarzenbach et al. 2008 ; Forshew et al. 2012 ; Kennedy et al. 2014). Souvent, ces chiffres sont trop faibles pour être représentés en pourcentage mais sont dénombrables en chiffres absolus. Par exemple, au stade précoce du cancer, une tumeur de 2-3 cm peut libérer aussi peu que 10 molécules de ctDNA par 10ml de sang (Fiala et Diamandis 2018).
Il existe sur le marché toute une série de technologies de détection des ctDNA. Les technologies de détection du cancer basées sur le séquençage peuvent être divisées en deux catégories principales - 1) le séquençage non ciblé et 2) la détection ciblée. La première approche comprend le séquençage du génome entier ou de l'exome entier pour découvrir des mutations ponctuelles inconnues ou des variations du nombre de copies (CNV). L'avantage du séquençage non ciblé est sa capacité à identifier les nouveaux changements survenus au cours de l'évolution de la tumeur sans connaissance préalable des gènes tumoraux. Malgré cet avantage, une concentration élevée de ctDNA est nécessaire pour obtenir une détection fiable des mutations et la sensibilité globale de ces techniques de séquençage non ciblées reste faible (elles ne peuvent détecter des mutations supérieures à 5-10 %) en raison de la faible profondeur des données. Dans un séquençage du génome entier à faible profondeur ou à faible passage, chaque locus est lu une seule fois, ce qui est insuffisant pour conférer une fiabilité suffisante aux données.
D'autre part, l'approche de séquençage ciblé est très sensible, et les mutations peuvent être détectées à un taux de fréquence d'allèle de 0,01% de manière rapide et rentable. La qualité de l'analyse est supérieure à celle obtenue par des méthodes non ciblées en raison de la plus grande profondeur des données de séquençage. Le principal inconvénient du séquençage ciblé est qu'il nécessite des informations détaillées sur la génétique de la tumeur. Plusieurs technologies de séquençage ciblé ont été inventées au cours des dernières décennies. Dans l'approche du "séquençage profond", une région cible est séquencée avec une couverture très élevée (~10 OOOx). L'avantage du séquençage profond est de caractériser plusieurs biomarqueurs en parallèle, mais son inconvénient est la profondeur extrêmement élevée nécessaire pour détecter une faible fréquence allélique, ce qui augmente considérablement les coûts de séquençage. Outre le séquençage profond à grande profondeur, d'autres technologies de séquençage sont basées sur l'enrichissement des cibles (TAm-seq, Capp-seq) ou sur la génération de données de haute qualité par le marquage d'identifiants moléculaires uniques (UMI) sur chaque séquence d'ADN afin de corriger les erreurs de séquençage (Safe-seq, Duplex-seq). Il a déjà été proposé d'intégrer la méthode d'enrichissement des cibles de Capp-Seq (Newman et al. 2014) a I'UMI double brin de Duplex-seq (Schmitt et al. 2012) pour la correction des erreurs afin de créer "Capp-seq/iDES" (Diehn et al, patent WO 2016/040901 Al) qui atteint la limite de détection des mutations de 0,0025 %. TAm-seq (Gale et al. 2018) et Capp-Seq sont des approches de séquençage ciblé, et ces technologies enrichissent les régions cibles indépendamment des séquences sauvages ou mutantes. Par conséquent, le rapport entre le type sauvage et le mutant reste le même avant et après le processus d'enrichissement. Cela ne résout pas le problème de la détection précoce lorsque la quantité de ctDNA est extrêmement faible et que l'ADN de type sauvage peut être 1000 fois supérieur. Toutes les technologies décrites précédemment ne sont pas d'une grande utilité pour la détection précoce du cancer ou le dépistage d'une maladie résiduelle minime, où le signal provenant des ctDNA peut être masqué par celui des cfDNA provenant des tissus sains.
Une technique de PCR appelée 'COLD-PCR' (Li et al. 2008 et 2009) et ses variantes ice-COLD-PCR (Milbury et al. 2011) ou e-iceCOLD PCR (How-Kit et al. 2013) peuvent enrichir les allèles mutants minoritaires par rapport au type sauvage et donc changer le rapport entre type sauvage et mutant. Comme les COLD PCR dépendent de la température de dénaturation critique (Te) inférieure à la Tm qui est fixée pour une certaine longueur d'ADN, elles ne sont pas efficaces lorsque plus d'un hotspot doit être détecté en tandem. Une nouvelle stratégie de construction d'amorces a été proposée par Huang et al. 2019, où les amorces spéciales appelées "stuntmers" (ou appelées "Enhancer" dans le contexte de la présente invention) peuvent augmenter préférentiellement l'enrichissement des mutants par rapport aux homologues de type sauvage. Une amorce peut détecter plusieurs mutations en tandem et peut augmenter de manière significative les allèles mutants pendant l'étape de PCR, modifiant ainsi le rapport entre le mutant et le type sauvage. Les stuntmers peuvent constituer un outil prometteur pour la détection précoce du cancer et peuvent être couplés aux technologies de séquençage à haut débit.
Dans l'art antérieur, des méthodes d'enrichissement d'allèles mutants comme la COLD-PCR, et d'autres méthodes de correction de séquençage par étiquetage ont été validées individuellement comme le résume le tableau 1. Seule Capp-Seq/iDES combine l'enrichissement de mutants et la correction des erreurs de séquençage.
Figure imgf000005_0001
Tableau 1 - Présentation de différentes technologies de séquençage avec enrichissement des cibles ou de correction des erreurs La technique de séquençage de nouvelle génération (NGS) est le meilleur moyen d'établir un profil génétique moléculaire lié aux gènes du cancer, car elle peut fournir des résultats à la fois qualitatifs et quantitatifs. Le NGS est basé sur le séquençage en parallèle de plusieurs millions de courts morceaux d'ADN (Glenn 2011), suivi d'un assemblage de novo ou d'un alignement sur un génome de référence. La NGS présente un taux d'erreur relativement élevé (0,1 à 1 %) selon le type de plateforme utilisée, ce qui rend la détection des mutations rares très difficile. Pour surmonter cet inconvénient, plusieurs technologies ont été proposées afin d'améliorer la détection des mutations dans les ctDNA. Le tableau 2 ci-dessous présente un aperçu des technologies existantes pour améliorer la détection de de ctDNA. Certaines technologies dépendent de l'enrichissement des cibles et d'autres de la correction des erreurs NGS pour parvenir à une meilleure qualité des données.
Figure imgf000006_0001
Tableau 2 - Résumé des différentes technologies de séquençage
Le défi de la détection de mutations rares dans l'ADN libre circulant basé sur la plateforme NGS est donc difficile à relever, principalement en raison de deux facteurs - (i) la très faible quantité d'ADN tumoral circulant dans les cancers de stade précoce et (ii) le taux d'erreur élevé de la technologie NGS. Il existe donc un besoin de méthodes plus sensibles et à haut débit pour détecter et surveiller les acides nucléiques dérivés des tumeurs chez les patients atteints d'un cancer. RESUME DE L'INVENTION
Les inventeurs ont créé une méthodologie appelée "Enhance-seq" pour générer des données de séquençage de haute fiabilité en combinant une étape d'enrichissement des mutations avec des amorces inspirées des séquences « Stuntmer », appelées ici séquences "Enhancers", suivi d'une méthodologie de correction des erreurs de séquençage basée sur l'utilisation d'identifiants moléculaires uniques (UMI). Plus précisément, la méthode de l’invention est un procédé en deux étapes pour la détection de mutations rares - la première étape est une PCR permettant l’enrichissement des mutations basée sur l'utilisation de séquences Enhancers ; ces séquences Enhancers permettent d'augmenter spécifiquement le nombre de copies mutées présentes dans la population et en même temps de bloquer l'amplification de la séquence de type sauvage. Les amplicons obtenus sont flanqués par la séquence d'un site de restriction orienté à chaque extrémité. Dans la deuxième étape, les molécules correctrices "Correctors" contenant un identifiant moléculaire unique (UMI) sont associées à chaque molécule d'ADN pour corriger les erreurs générées lors du séquençage à haut débit (NGS).
La méthode de l'invention permet la détection d'une mutation rare dans un échantillon biologique, et comprend les étapes suivantes - o Étape 1 - fourniture d'un échantillon comprenant de l'ADN o Étape 2 - amplification sélective de la région contenant ladite mutation en utilisant une PCR d'enrichissement de la mutation (Mutation Enhancement PCR, MEP) comprenant les étapes suivantes : a. Fourniture d'une amorce amplificatrice (Enhancer) pour PCR comprenant 3 régions :
(i) la région R qui reconnaît et se lie spécifiquement à la séquence de type sauvage mais ne peut pas se lier si la région contient une mutation,
(ii) une région de liaison et
(iii) la région-E qui se lie spécifiquement à une séquence située en amont du site de mutation ; b. Réalisation d'une PCR comprenant deux étapes d'hybridation : (i) une première hybridation à une température Tl qui permet la liaison de la région R de l'amorce à la séquence de type sauvage et (ii) une seconde hybridation à une température T2 qui permet la liaison de la région-E de l'amorce ; dans lequel Tl est supérieure d'au moins 5°C à T2 ; c. En cas de liaison de la région E, la séquence contenant ladite mutation est amplifiée d. Obtention d'amplicons contenant ladite mutation, lesdits amplicons comprenant un site de restriction orienté à chaque extrémité, ledit site de restriction étant ajouté, soit pendant la PCR d'enrichissement de la mutation du fait qu'un tel site de restriction est présent dans ladite region-E de l'amorce, soit en réalisant une PCR additionnelle après l'étape c. de ladite PCR d’enrichissement de la mutation en utilisant des amorces contenant un tel site de restriction. o Étape 3 - ajout à chaque extrémité de chaque amplicon d’une séquence Corrector comprenant une séquence fixe, un identifiant moléculaire unique (UMI), un site de restriction orienté compatible avec ceux présents aux extrémités desdits amplicons, et éventuellement d'une étiquette spécifique de l’échantillon/du patient, en utilisant lesdits sites de restriction o Étape 4 - amplification des amplicons résultant de l’étape 3 par PCR o Étape 5 - séquençage des amplicons résultant de l'étape 4 par NGS o Étape 6 - correction des erreurs de séquençage par une analyse logicielle utilisant les identifiants moléculaires uniques.
L'invention concerne également une amorce amplificatrice comprenant un site de restriction dans la région E.
Avantages de l'invention
La méthode de détection des mutations rares de l'invention présente des avantages par rapport à l'art antérieur pour plusieurs raisons.
Tout d'abord, cette méthode repose sur la capacité d'amplifier sélectivement les mutations rares à l'aide d'une technologie d'amélioration des mutations impliquant l'utilisation d'Enhancers. La PCR avec Enhancers offre un moyen simple, très sensible et précis de détecter les mutations rares. Les Enhancer sont conçus de telle sorte que, lorsqu'ils sont utilisés comme amorce dans une réaction de PCR, ils peuvent supprimer l'amplification de la séquence de type sauvage et permettre préférentiellement l'amplification des formes mutantes. La conception des amplificateurs est basée sur la séquence de type sauvage et ne dépend pas de la mutation. Par conséquent, le même amplificateur peut identifier plusieurs mutations en tandem dans un site contenant un ou plusieurs points chauds de mutations, y compris une mutation ponctuelle, une insertion, une délétion et des réarrangements. Le blocage et l'amplification se produisent avec les mêmes amorces. Comme les mutations sont amplifiées, il est possible de retrouver les mutations rares même après le traitement en aval qui implique une perte d'ADN dans les étapes de la méthode. Cette étape d'amplification permet de multiplier au moins par 5 la fréquence des mutations rares dans l'échantillon. De plus, les amplicons comprennent un site de restriction orienté à chacune de leurs extrémités. Ce site de restriction permet une liaison orientée des séquences Corrector qui seront ensuite ajoutées à chaque extrémité de l'amplicon.
La liaison unidirectionnelle des séquences Corrector permet une amplification ciblée et efficace des séquences mutées, avec pour conséquence que la profondeur de séquençage requise est bien moindre par rapport aux méthodes de l'état de la technique (environ 3 fois moins de séquences à lire). Cet avantage est illustré aux figures 4, 5 et 6, par comparaison à des méthodes alternatives d'amplification de mutations. La figure 4 illustre une méthode dans laquelle des UMI sont ajoutés par PCR. Chaque molécule d'ADN est amplifiée plusieurs fois avec des UMI différents, ce qui conduit à devoir analyser un grand nombre de séquences du fait de la présence de plusieurs clusters pour une même molécule. Cette méthode nécessite une grande profondeur de séquençage.
La figure 5 illustre une méthode dans laquelle les UMI sont ajoutés par liaison homopolymérique (TA cloning). Le clonage TA comporte plusieurs étapes à réaliser en parallèle ou successivement, par exemple : 1) T-tail, 2) A-tail, 3) Ligation. Cela rend le protocole plus long et plus élaboré et ajoute une seule base aux extrémités de l’adaptateur/amplicon par liaisons successives. Comme la réaction de liaison repose sur une seule paire de bases, elle ne permet pas de s'assurer que 100% des amplicons contenant la mutation sont effectivement liés, cela peut facilement conduire à ce que des molécules d’ADN contenant des mutations rares manquent ensuite. La méthode n'est donc pas fiable car certaines mutations peuvent ne pas être perdues au cours du procédé.
La figure 6 illustre la méthode selon l'invention basée sur l'ajout de UMI en utilisant la méthode Golden gate. La liaison de chaque amplicon avec l'adaptateur est efficace et orientée du fait de la présence d'une extrémité cohésive formée de 4 bases dont le motif est différent à chaque extrémité. Chaque séquence est donc liée à un adapteur Corrector pour être amplifiée et une seule copie par séquence est ainsi préparée. Les séquences peuvent être lues en sens et en antisens, si l'on souhaite plus de précision. Cette méthode assure que toutes les séquences mutées sont amplifiées et permet donc un diagnostic fiable.
Deuxièmement, la méthode repose sur l’utilisation d’un identifiant moléculaire unique (UMI) qui permet de corriger l’erreur de séquençage après la lecture NGS. Cet UMI est une région d’environ - 10 pb contenant des séquences aléatoires et est différent pour chaque molécule. Lorsqu'il est attaché à un amplicon, il donne une identité unique à l'amplicon et permet de distinguer deux molécules d'ADN différentes. L'UMI est introduit par des molécules adaptatrices sens et antisens contenant des séquences UMI des deux côtés de la molécule adaptatrice.
L'étape d'étiquetage est innovant, en ce sens qu'il s'appuie sur une approche d'étiquetage UMI basée sur la Golden Gate pour corriger les erreurs de séquençage (voir précédemment). Pour la première fois, les inventeurs proposent une approche d’étiquetage basée sur la technologie Golden gate. Dans la méthode connue du Golden gate, la liaison est directionnelle. Ici, l’approche innovante consiste en ce que les amorces sens et antisens de la molécule adaptatrice (ici séquence Corrector) ont une directionnalité pour se lier spécifiquement avec les molécules d'insertion et la conception consiste en une étiquette spécifique du patient suivi d'un identifiant moléculaire unique (UMI) des deux côtés de la molécule adaptatrice. La directionnalité est conférée par la présence du site de restriction ajouté aux extrémités de l'amplicon. L'UMI permet de corriger l'erreur de séquençage après la lecture NGS.
Par rapport aux autres technologies d'étiquetage (par exemple, duplex-seq) qui sont basées sur l'extension homopolymérique A (A-tailing) suivie de la liaison, la technologie d’étiquetage basée sur la Golden Gate est plus robuste car l'extrémité cohésive formée de 4 paires de bases permet d’avoir une plus grande efficacité de liaison et des extrémités cohésives différentes aux deux extrémités permettent la spécificité de la liaison. Contrairement aux autres technologies d'étiquetage (duplex- seq) qui sont réalisées en deux étapes ou plus (A-tailing et liaison par une extrémité cohésive), cette technologie d'étiquetage mise au point par les inventeurs est réalisée en une seule étape (digestion et liaison en une seule étape) et est donc plus pratique.
Ainsi, cette méthode repose sur l’enrichissement des mutations à l’aide d’une première PCR (PCR d’enrichissement des mutations) suivie d'un étiquetage UMI (voir figure 7). L’étape d'étiquetage UMI permet de marquer chaque séquence avant l’amplification pour le séquençage de sorte qu’il devient possible de distinguer deux molécules d’ADN différentes qui sont le produit de la même PCR et d’analyser statistiquement le résultat du séquençage afin de corriger les erreurs de séquençage par une analyse logicielle. L'utilisation d'étiquetage UMI permet d’écarter tout faux positif et donc d’augmenter significativement la sensibilité de la méthode (abaisser la limite de détection).
Un autre avantage de cette technologie est qu’elle ne nécessite pas un séquençage à très grande profondeur car la détection est très sensible grâce à l’enrichissement sélectif et fiable des mutations (toutes les mutations, même très rares) avant l'étape d’amplification des amplicons. En plus de permettre la détection de très faibles quantités de mutations, l’augmentation de la sensibilité permet de lire le résultat en utilisant une machine de séquençage de nouvelle génération à faible profondeur (par exemple, Illumina iSeq 100) puisque le rapport signal/bruit pour les mutants est élevé, alors que dans les méthodes de l’art antérieur, la détection de mutations rares nécessite des machines coûteuses. En effet, le "séquençage profond" correspond à 10,000 lectures/cible. Avec la méthode de la présente invention, un maximum de 2000 lectures/cible est nécessaire, mais une bonne qualité de lecture peut être obtenue avec 1000 lectures/cible, et même avec 500, 100 et aussi bas que 50 lectures/cible. Le nombre plus faible de lectures requises pour une bonne qualité de données permettra aux utilisateurs de passer des séquenceurs haut de gamme très coûteux (environ 850000 à 1 million d'euros) à des mini-séquenceurs environ 20 fois moins chers (environ 20 000 euros). Par conséquent, des données de haute qualité peuvent être récupérées à partir d'un séquençage de faible profondeur et d'un faible investissement en capital. En conséquence, l'utilisation de cette technologie diminuera le coût global car des séquenceurs très puissants ne seront pas nécessaires et permettra aux laboratoires d'être plus efficaces et à des coûts plus abordables.
La méthode comprend avantageusement l'utilisation d'un étiquetage spécifique de l'échantillon ou du patient afin que différents échantillons de patients puissent être regroupés et traités simultanément à l'étape de séquençage NGS.
La méthode est facile à mettre en oeuvre car elle repose sur la PCR et la NGS, qui sont des technologies de routine. Elle peut être proposée sous la forme d'un kit adapté à un diagnostic particulier, ce qui est très pratique pour les utilisateurs.
La méthode "Enhance-seq" présente des avantages par rapport à la COLD PCR car les Enhancers peuvent détecter les mutations en tandem, comme le montrent Huang et al. 2019. La "Full Cold PCR" ne peut pas fonctionner avec une faible concentration d'ADN et nécessite une accumulation substantielle de produits de PCR pour que l'enrichissement des mutations se produise ; l'enrichissement ne se produit donc que dans les derniers cycles de PCR. Les résultats expérimentaux de l'inventeur montrent que Enhance-seq peut fonctionner avec une concentration d'ADN extrêmement faible et présente un enrichissement de 10 à 500 fois (tableaux 3 et 5) en fonction de la matrice initiale.
Les résultats expérimentaux confirment que la technologie "Enhance-seq" permettra de diagnostiquer des maladies plus précocement que les autres technologies de l'état de l'art, grâce à une détection plus sensible de mutations rares présentes en très faible nombre aux stades précoces de ces maladies. Comme elle permet de détecter de très faibles quantités d’ADN muté dans un échantillon complexe tel qu’une biopsie liquide (par exemple à partir de sang, d’urine, de liquide céphalorachidien, de larmes, etc.), la méthode est particulièrement utile dans le domaine de l’oncologie pour le dépistage, la détection de facteurs de risque, le diagnostic précoce, le pronostic et la personnalisation du traitement, le suivi de l’efficacité du traitement.
Grâce à sa haute sensibilité, la méthode peut être réalisée en utilisant seulement un petit volume d’échantillon, en particulier un échantillon de sang. Elle peut être particulièrement appropriée en cas de diagnostic de patients vulnérables, comme par exemple des enfants, dont l'état de santé ne permet pas de prélever plusieurs ml de sang.
DESCRIPTION DETAILLEE DE L'INVENTION
Un premier objet de l'invention est une méthode de détection d'une mutation rare dans un échantillon biologique, comprenant les étapes suivantes - o Étape 1 - fourniture d'un échantillon comprenant de l'ADN o Étape 2 - amplification sélective de la région contenant ladite mutation en utilisant une PCR d'enrichissement de la mutation (Mutation Enhancement PCR, MEP) comprenant les étapes suivantes : a. Fourniture d'une amorce amplificatrice (Enhancer) pour PCR comprenant 3 régions : i. la région R qui reconnaît et se lie spécifiquement à la séquence de type sauvage mais ne peut pas se lier si la région contient une mutation, ii. une région de liaison et iii. la région-E qui se lie spécifiquement à une séquence située en amont du site de mutation ; b. Réalisation d'une PCR comprenant deux étapes d'hybridation : (i) une première hybridation à une température Tl qui permet la liaison de la région R de l'amorce à la séquence de type sauvage et (ii) une seconde hybridation à une température T2 qui permet la liaison de la région-E de l'amorce ; dans lequel Tl est supérieure d'au moins 5°C à T2 ; c. En cas de liaison de la région E, la séquence contenant ladite mutation est amplifiée d. Obtention d'amplicons contenant ladite mutation, lesdits amplicons comprenant un site de restriction orienté à chaque extrémité, ledit site de restriction étant ajouté, soit pendant la PCR d'enrichissement de la mutation du fait qu'un tel site de restriction est présent dans ladite region-E de l'amorce, soit en réalisant une PCR additionnelle après l'étape c. de ladite PCR d’enrichissement de la mutation en utilisant des amorces contenant un tel site de restriction. o Étape 3 - ajout à chaque extrémité de chaque amplicon d’une séquence Corrector comprenant une séquence fixe, -, un identifiant moléculaire unique (UMI), un site de restriction orienté compatible avec ceux présents aux extrémités desdits amplicons, et éventuellement d'une étiquette spécifique de l’échantillon/du patient, en utilisant lesdits sites de restriction o Étape 4 - amplification des amplicons résultant de l'étape 3 par PCR o Étape 5 - séquençage des amplicons résultant de l'étape 4 par NGS o Étape 6 - correction des erreurs de séquençage par une analyse logicielle utilisant les identifiants moléculaires uniques.
Par "mutation rare", on entend toute modification génétique de l'ADN, ou de l'ARN (par exemple l'ARNm) qui est un marqueur d'une maladie ou d'un état pathologique, ou d'une prédisposition à développer une maladie ou un état pathologique, ou plus généralement un marqueur de la présence d'une molécule d'ADN rare dans un échantillon complexe. Il peut correspondre à une mutation ponctuelle, une délétion, une insertion, ou un réarrangement. Dans son sens le plus large tel qu'utilisé dans le cadre de l'invention, le terme " mutation " correspond à un événement génétique rare par rapport à une séquence de référence. La séquence de référence peut par exemple être la séquence d'ADN d'un receveur de greffe comparée à la séquence du greffon, une première génération d'un virus SARS-Cov 2 comparée à un variant émergent du virus dans les eaux usées. Il est entendu que la méthode de détection d'une mutation rare selon l'invention permet la détection d'une ou de plusieurs mutations simultanément, notamment en situation de multiplexage.
Une mutation rare peut également résulter d’une méthylation affectant l’expression de l’ADN, notamment une méthylation se produisant dans des séquences régulatrices telles que les régions promotrices ou amplificatrices. Dans ce cas, la mutation rare correspond à la présence d’une cytosine comme marqueur de la méthylation de l’ADN et la méthode comprend donc une étape de traitement de l’échantillon d’ADN avant l’amplification d’ADN de l’étape 2 afin de révéler le site de méthylation. Cette étape peut être réalisée par des méthodes connues de l’homme de l’art telles que la conversion au bisulfite ou la conversion enzymatique.
Une mutation rare peut correspondre à un SNP, ou plus généralement à une séquence variante. En outre, une mutation rare peut affecter l’ARN, incluant sans limitation l’ARNm, mais aussi éventuellement l’ARN si, l’ARNm ; dans ce cas, elle peut être détectée par la méthode de l’invention après conversion de l’ARNm en ADNc à l’aide de la transcriptase inverse. En conséquence, la méthode comprend une étape de traitement de l’échantillon d’ADN avant l’amplification d’ADN de l’étape 2 afin de convertir l’ARN en ADN.
Une mutation est considérée comme "rare" lorsqu'elle est représentée dans moins de 50% de l'ADN de l'échantillon analysé. De préférence, la méthode de l'invention est appliquée à la détection de mutations ayant une fréquence inférieure ou égale à 1%, notamment une fréquence inférieure à 0,1%, ou inférieure à 0,001% ou inférieure à 0,0001%. La limite de détection de la méthode a été évaluée à environ 0,00001% ou moins ; cette gamme de limites de détection est compatible avec la détection de mutations ultra-rares. La méthode a permis de détecter 10 molécules d'ADN mutant dans un contexte de 109 molécules de type sauvage.
L'étape 1 de la méthode consiste à fournir un échantillon contenant de l'ADN. Cet échantillon est un échantillon biologique ou est dérivé d'un échantillon biologique.
Tel qu'utilisé ici, "échantillon biologique" signifie un échantillon comprenant au moins de l'ADN ou de l'ARN. Il peut s'agir d'un fluide biologique complexe tel que le sang, l'urine, les larmes ou un extrait d'un tel fluide qui contient de l'ADN ou de l'ARN. L'échantillon biologique peut également être préparé à partir d'une cellule procaryote ou eucaryote, d'un virus ou de tout autre tissu biologique.
La méthode de l'invention est particulièrement pertinente pour la détection de mutations rares dans l'ADN circulant libre (cfDNA) dans une biopsie liquide.
L'étape 2 de la méthode consiste en une amplification sélective des mutations rares par une PCR d'amplification des mutations (MEP) dérivée des travaux de Huang et al, 2019. La technologie MEP repose sur l'utilisation d'une amorce Enhancer.
Tel qu'utilisé ici, un " enhancer " est une amorce dite « amorce d'amplificatrice » contenant trois régions disposées de l'extrémité 5' à l'extrémité 3' dans l'ordre suivant - la région de reconnaissance (region-R), la région de liaison et la région d'extension (région-E) (figure 1). La région-R est conçue pour reconnaître un site riche en mutations (point chaud) et s'hybrider à la version sauvage de la séquence. En cas de mutation, la liaison de la région-R est compromise. La région-E se lie aux séquences en amont du point chaud. La valeur Tm (température d'hybridation) de la région-R est environ 5 à 10°C plus élevée que celle de la région-E. Environ 4 à 10 bps de la séquence d'extrémité 3' de la région-E chevauchent l'extrémité 5' de la région-R. La région de liaison peut être composée, par exemple, d'une région d'espacement comprenant de 3 carbones ("C3 spacer") à 12 carbones ("C12 spacer"), par exemple 3, 6, 8, 9 ou 12 carbones. Cette région de liaison est une région non-nucléotidique capable de bloquer l'amplification de la séquence. Dans un premier mode de réalisation particulier, l'Enhancer est constitué de 3 régions avec présence d'un site de restriction orienté en amont de la région-E. Les extrémités cohésives produites à l’extrémité 5’ et à l’extrémité 3’ de l'amplicon sont différentes. Cette différence permet d’effectuer une liaison spécifique à chaque extrémité. Voir Figures 2 et 3. La PCR avec Enhancer (MEP) a deux températures d’hybridation pour faciliter la liaison de deux régions des amorces alternativement. La liaison de la matrice avec la région R ou E de l’amorce Enhancer dépend de la séquence de la matrice, qu’elle soit sauvage ou mutante, et est contrôlée par les températures d'hybridation. La région-R de l’amplificateur est conçue pour se lier à la version sauvage de la matrice dans la région du point chaud. Au cours de la première hybridation, toutes les séquences sauvages sont saturées par la liaison de l’activateur avec la région-R. Dans cette configuration de liaison, la PCR ne peut pas se faire. Dans cette configuration de liaison, la PCR ne peut pas se dérouler en raison de la présence d’une structure non- nucléotidique de la région de liaison et aucun produit n’est donc formé. D’autre part, si une version mutante est présente dans la matrice dans la région du point chaud (hotspot), la liaison avec la région- R est compromise en raison d’un mauvais appariement des paires de bases. Dans ce cas, la région-E permet la liaison avec la version mutante. La deuxième température d'hybridation permet la liaison de la région-E avec l’amont de la région du point chaud et la formation éventuelle d'un produit. La PCR avec enrichissement de mutations (MEP) entraîne le blocage de la version sauvage et l’amplification de la version mutée.
Lorsque la région-E comprend une séquence d'un site de restriction orienté, un site de restriction est directement intégré à chaque extrémité de l’amplicon obtenu à l’étape 2. Une telle construction permet de réduire le temps et le coût de la méthode. Une illustration de cette construction et de sa mise en oeuvre se trouvent aux figures 2, 3 et 7.
Le site de restriction orienté peut être un site reconnu par une enzyme de restriction de type II ou de type III ; toutefois il est préféré d'utiliser un site d'une enzyme de restriction de type II car les enzymes de restriction de type II permettent une insertion directionnelle avec une plus grande flexibilité que celle des enzymes de restriction de type III. Un site de restriction utilisable dans la méthode selon l'invention peut être le site de l’enzyme de restriction Bsal, mais d'autres enzymes sont également adaptées telles que Bbsl, BsmBI, etc.
Dans un mode de réalisation encore plus particulier de l'invention, l’extrémité 5’ et l’extrémité 3’ de la région de liaison de l’adaptateur sont conçues avec deux séquences cohésives distinctes provenant du site de restriction Bsal. Ces séquences de liaison séparées ajoutent de la spécificité à chaque extrémité. La liaison est précédée d'une digestion de restriction par BsaL L'extrémité cohésive de 4 bases dans la technologie Golden Gate permet une plus grande efficacité de liaison par rapport à un extrémité cohésive ne comportant qu'un nucléotide tel qu'utilisé dans le clonage TA. Ainsi, une séquence consensus double brin est présente dans les directions 5' et 3' de l'amplicon, ce qui augmente la fiabilité des données de séquençage.
Lorsqu'un site de restriction est ajouté dans la région-E de l'amorce, il peut être avantageux d'introduire des bases LNA dans la région-R de l'amorce. Cet ajout permet d'augmenter la Tm de la première hybridation (Tl) de sorte à ce que la différence entre Tl et T2 soit supérieure à 5°C, ce qui permet de mieux discriminer les deux conditions et d'amplifier spécifiquement les séquences portant une mutation.
Par « bases LNA », on entend des acides nucléiques modifiés (locked nucleic acids). Il s'agit d'une catégorie d’analogues d’ARN à haute affinité dans lesquels le cycle ribose est "verrouillé" dans la conformation idéale pour la liaison Watson-Crick. Cette structure confère aux bases LNA une stabilité thermique accrue et permet une hybridation stable avec des séquences d'hybridation plus courtes.
Les bases LNA peuvent également être employées différemment comme décrit ci-après, ces modes de réalisation pouvant être combinés entre eux.
Dans un second mode particulier de réalisation, un site de restriction est ajouté en réalisant une PCR additionnelle, après l'étape c. de la PCR d'enrichissement de mutation, en utilisant des amorces contenant un site de restriction orienté. A l'issue de cette étape, l'amplicon obtenu est flanqué de la séquence d'un site de restriction à chacun de ses extrémités. Une digestion avec l'enzyme de restriction correspondant à la séquence du site, permet la digestion de l'ADN et fait apparaître les extrémités cohésives utiles à une liaison efficace aux séquences Corrector.
L'ajout d'un site de restriction à chaque extrémité de l'amplicon permet d’intégrer la séquence Corrector prévue à l’étape 3.
Les séquences Corrector sens et antisens sont fournies avec le même site de restriction. Afin de préparer les extrémités des Correctors et des amplicons, ils sont digérés, par exemple par une enzyme de restriction, par exemple BsaL Grâce à l'utilisation de sites de restriction, l’extrémité cohésive produit après la digestion est spécifique des extrémités 5' et 3', ce qui rend la liaison très spécifique.
La digestion est suivie d'une réaction de liaison avec l'ADN ligase T4.
Dans un autre mode de réalisation particulier de l'invention, une nucléase spécifique de l'ADN double brin (DSN) est ajoutée, soit avant la PCR d'enrichissement de la mutation, soit après la PCR d'enrichissement de la mutation. L'enzyme DSN permet de couper les ADN double brin parfaitement hybridés.
Lorsque l’étape de MEP est accompagnée de l’ajout préalable d'une DSN, l'amplification de la mutation peut s'intensifier grâce au clivage de l’ADN de type sauvage en amont de l'amplification. Cette étape peut contribuer à une meilleure capacité de multiplexage en raison d’une moindre interférence de l’ADN de type sauvage. L'élimination des séquences sauvages permet de faire diminuer le bruit de fond.
Lorsqu'une DSN est ajoutée après l’étape de MEP, les séquences sauvages sont clivées et éliminées, ce qui favorise l'amplification d'amplicons contenant les mutations à l'étape 4. Dans ce mode de réalisation particulier de l'invention, des sondes spécifiques des séquences sauvages comprenant des bases LNA sont ajoutées après ajout des séquences Corrector, ainsi qu'une DSN. La méthode est appliquée de préférence en condition de multiplexage, à savoir que plusieurs mutations sont recherchées simultanément à l'aide de couples d'amorces différents dans une seule et même réaction. Ce mode de réalisation est illustré à la figure 10 et se présente comme suit :
Étape A : PCR d’enrichissement des mutations à partir de cfDNA
Étape B : Fixation de la séquence Corrector
Étape C : Ajout des sondes (pouvant comprendre des bases LNA) pour appariement avec la séquence de type sauvage. Lors de la liaison de la sonde, une DSN est ajoutée à la réaction. La DSN coupera tout duplex parfaitement hybridé (séquence sauvage) et ne coupera pas en cas de non-appariement (séquences mutées).
Étape D : Les séquences non clivées sont récupérées pour l'amplification suivante.
Dans un autre mode de réalisation particulier de l'invention permettant d'augmenter la proportion de mutants versus de séquences sauvages, la méthode comprend l'ajout de sondes spécifiques des mutations et comprenant une/des bases LNA couplées à un marqueur (par exemple des sondes biotinylées) après l'amplification de l'étape 2 et l'ajout de séquences Corrector de l'étape 3. L'utilisation de telles sondes permet l'enrichissement en mutants. La méthode peut être illustrée à la figure 11 et se déroule comme suit :
Étape A : Une PCR d’enrichissement de la/des mutations est effectuée à partir de cfDNA.
Étape B : Fixation de la séquence Corrector
Étape C : Fixation de sondes LNA biotinylées spécifiques de chaque mutation. Les mutants s'hybrident avec la sonde et sont donc absorbés par les billes magnétiques de streptavidine.
En utilisant une méthode mettant en oeuvre une DSN, Keraite et al. 2020, ont montré qu'ils pouvaient prédire la fréquence allélique mutationnelle (MAF) initiale de manière fiable. Par conséquent, l'association d'une DSN à la PCR d'enrichissement de mutation améliorera encore le rendement et la performance de la méthode. En effet, on s'attend à ce que la profondeur de séquençage NGS nécessaire soit plus faible et la qualité du signal plus élevée.
L'étape 3 consiste à ajouter une séquence correctrice (Corrector) comprenant une séquence fixe, un identifiant moléculaire unique (UMI) (permettant l'étiquetage UMI) à chaque extrémité de l'amplicon en utilisant un site de restriction.
Une étiquette spécifique du patient ou de l'échantillon peut être incluse dans la séquence Corrector. Une telle étiquette est spécifique à chaque échantillon et permet de regrouper différents échantillons afin de les traiter simultanément par séquençage NGS.
La "séquence fixe" est une séquence particulière qui est commune à tous les amplicons. La séquence fixe se superpose aux adaptateurs NGS qui permet de fixer la séquence à l'adaptateur de la cellule de flux pour le séquençage NGS. Les séquences fixes assurent une amplification uniforme de toutes les séquences puisque les mêmes amorces universelles sont utilisées pour toutes les séquences avant le NGS.
En effet, une fois que les matrices sont amplifiées par PCR améliorée, l'amplicon est lié avec le pool d'adaptateurs uniques appelés "Correctors" pour analyser les acides nucléiques d'un échantillon après l'étape de séquençage de nouvelle génération. Chaque molécule Corrector est composée d'au moins une séquence fixe, d'un identifiant moléculaire unique (UMI) suivi d'un site de restriction, par exemple pour une enzyme de restriction de type II) . Les séquences Corrector sont ajoutées de part et d'autre de chaque molécule d'amplicon ; le même modèle est donc appliqué pour les Correctors sens et antisens. On peut noter que, compte tenu des développements actuels de la technologie NGS, notamment en ce qui concerne sa fiabilité, il est fortement recommandé de lire les séquences à la fois sur les brins sens et antisens. Si, à l'avenir, la lecture du seul brin sens (orienté dans le sens 5'-3') est suffisante, on pourra amplifier préférentiellement le brin orienté dans le sens 5'-3'.
Dans un mode de réalisation avantageux de l'invention, des petites séquences code-barres additionnelles sont associées aux mutations pour lever toute ambiguïté sur la présence ou non d'une mutation, en cas d'erreur d'amplification ou de séquençage des UMI. Ces petits code-barres peuvent être ajoutés, soit au moment de la PCR d'enrichissement du fait de la présence de tels code-barres dans la région-E, soit en même temps que ledit site de restriction orienté lorsque celui-ci est ajouté par PCR, soit à l'étape 3 du fait de sa présence dans la séquence Corrector. De manière générale, il s'agit de séquences nucléotidiques constituées de 1 à 6 nucléotides, de préférence de 3 à 5.
L’étape 4 consiste à amplifier les amplicons résultant de l’étape 3 par PCR.
La méthode d’analyse de l’invention permet de corriger les erreurs de séquence grâce à la présence d’un identifiant moléculaire unique. À chaque extrémité de l’acide nucléique, une séquence Corrector sens (5’) et une séquence Corrector antisens (3’) contenant un identifiant moléculaire universel est ajoutée à partir d’un pool d’adaptateurs uniques à l’aide d’un site de liaison. L’UMI donne une identité unique à chaque molécule d’ADN. Après l’ajout de la séquence Corrector, toutes les molécules sont amplifiées par PCR avec une paire d’amorces universelles ; chaque UMI est donc répliqué plusieurs fois. La correction des erreurs se fait en commençant par chaque séquence UML Si une molécule fille présente la même mutation à 50% ou plus, il s'agit d'une vraie mutation, sinon elle est considérée comme une erreur de séquençage. Chaque UMI est lue dans le sens 5' -3' et dans le sens 3' -5'.
L’étape 5 consiste en un séquençage NGS classique.
Le séquençage NGS est une technologie à haut débit qui permet de traiter de nombreux échantillons simultanément. En conséquence, les échantillons peuvent être regroupés après l’étape 4. En vue de la lecture des résultats pour chaque patient/échantillon, les échantillons de chaque patient/échantillon sont marqués à l’aide d’une technologie d'étiquette à l’étape 3 (étiquette du patient ou étiquette de l’échantillon). L'étape 6 consiste à corriger les erreurs de séquençage par une analyse logicielle utilisant les identifiants moléculaires uniques (UMI). La méthode complète est illustrée à la figure 9.
La présente méthode de détection permet de détecter de très faibles quantités de séquences d'ADN spécifiques dans un fond de séquences de type sauvage en excès, ce qui permet une détection précoce (dépistage, diagnostic), un pronostic et un suivi des maladies qui peuvent être détectées par l'apparition de séquences génétiques spécifiques. Elle permet la détection de ces variants plus tôt que d'autres méthodes de l'état de l'art.
Par conséquent, elle peut être appliquée à de nombreux domaines, notamment l'oncologie, les maladies auto-immunes, le rejet de greffe, la maladie du greffon contre l'hôte (GVHD), le dépistage de variantes infectieuses et la détection de pathogènes mutants (résistance aux antibiotiques).
Un deuxième objet de l'invention concerne une amorce amplificatrice (Enhanceur) permettant l'intégration d'un site de restriction dans l'amplicon lors de la PCR d'enrichissement.
Une telle amorce amplificatrice comprend 3 régions : i. la région R qui reconnaît et se lie spécifiquement à la séquence de type sauvage mais ne peut pas se lier si la région contient une mutation, ii. une région de liaison et iii. la région-E qui se lie spécifiquement à une séquence située en amont du site de mutation et comprend la séquence d'un site de restriction orienté positionnée en amont de la région-E.
Le choix du site de restriction orienté peut être réalisé par l'homme du métier sans difficulté. Dans un mode de réalisation particulier, le site de restriction est Bsal.
Dans un autre mode de réalisation particulier, l'amorce amplificatrice comprend des bases LNA dans la région-R.
Dans un mode de réalisation encore plus particulier, l'amorce amplificatrice comprend à la fois un site de restriction dans la région-E et des bases LNA dans la région-R. Les avantages de l'utilisation d'un telle séquence amplificatrice et de ses modes de réalisation particuliers sont décrits précédemment.
Applications
La méthode de l’invention peut être appliquée dans de nombreux domaines. Certaines applications sont décrites ci-dessous.
Figure imgf000021_0001
du cancer
Une tumeur libère son matériel génétique dans la circulation sanguine sous forme d’ADN, d’ARNm, de petits ARN non codants, etc. La récupération d’informations sur le matériel génétique à partir d’un échantillon de sang d’un patient cancéreux, à partir d’acide nucléique acellulaire, est appelée "biopsie liquide" et a gagné en popularité en raison de son caractère non invasif, de sa répétabilité et de sa dynamique. Le NGS a révolutionné le domaine de la biopsie liquide et donc la détection du cancer, en raison de sa capacité à séquencer des centaines de points chauds du cancer en parallèle et à établir un profil spécifique au patient. Ce profil génétique personnalisé révèle les principales mutations motrices afin de recommander un traitement personnalisé.
L’information obtenue à partir de l’ADN peut se présenter sous deux formes différentes. Les changements épigénétiques de l’ADN par méthylation et les mutations somatiques de son ADN - mutation ponctuelle, insertion, délétion, réarrangement, changement du nombre de copies, etc. Pour connaître les mutations à l’origine du cancer, un profil mutationnel peut être généré par une analyse basée sur le NGS. D’un autre côté, la détection du cancer par NGS souffre d’une faible sensibilité principalement due à la présence d’une très faible quantité d’ADN tumoral circulant (ctDNA) et aux erreurs générées par la machine NGS. Au stade I de cancer, une tumeur de 2-3 cm libère généralement environ 10 ctDNA dans 10 ml de sang (Fiala et Diamandis. 2018). Les méthodes classiques basées sur le NGS (amplification de la cible par PCR suivie de la préparation des échantillons pour le séquençage NGS) ne sont pas adaptés pour atteindre ce seuil de détection. "Enhance-seq" présente une méthode capable de détecter cette faible quantité de mutations présentes grâce à sa limite de détection atteignant le seuil sans précédent de 10 mutants présents dans un fond de 109 séquences d'ADN de type sauvage (indiqué dans le tableau. 3 dans la section des résultats) obtenu dans une expérience synthétique. La modification du schéma de méthylation de l'ADN est une autre indication précoce de cancer. La méthylation de l'ADN se produit principalement au niveau des résidus cytosine suivis d'un résidu guanine sur leur flanc 3' et sont appelés dinucléotides cytosine-phospho- guanine (ilôts CpG) (Schultz et al. 2015). Il existe des modifications connues du profil de méthylation pour différents cancers, en particulier dans les promoteurs des gènes. Lors de la conversion au bi-sulfite ou enzymatique, les cytosines non méthylées sont converties en uracile tandis que les cytosines méthylées restent telles quelles car elles sont protégées par leurs groupes méthyles. Le séquençage de l'ADN libre circulant (cfDNA) après l'étape de conversion peut nous donner le profil de méthylation et le risque de cancer. Les cytosines méthylées peuvent être considérées comme des mutants. La méthode "Enhance-seq" peut être adaptée pour détecter la méthylation de l'ADN. Des Enhancers peuvent être conçus pour les îlots CpG. Après l'étape de conversion au bi-sulfite ou enzymatique de la cytosine, l'ADN peut être amplifié avec des amplificateurs.
En plus de l'empreinte génomique, il est essentiel de comprendre la biologie fonctionnelle des cellules pour prendre des décisions cliniques. L'ARN messager (ARNm) libéré par la tumeur (ARNt) peut refléter tout changement dans le fonctionnement des cellules. L'épissage de l'ARN, les fusions, les réarrangements, les mutations par insertion et délétion peuvent être reflétés dans l'ARNm. Les variants d'épissage de l'ARN peuvent être des biomarqueurs pour le pronostic et la thérapeutique (Nilsson et al, 2016 ; De Fraipont, 2019). Par conséquent, l'ARNm peut être transcrit de manière inverse en ADN et des Enhancers peuvent être conçus pour détecter tout dysfonctionnement.
Test prénatal non invasif (NIPT)
La détection non invasive d'anomalies génétiques chez le foetus à partir du sang de la mère enceinte lorsqu'il y a une suspicion ou un risque de maladie génétique est une autre application de la technologie "Enhance-seq". L'application la plus pertinente de la technologie "Enhance-seq" est la détection des microdélétions, par exemple -
Syndrome de Wolf-Hirschhorn (délétion terminale 4p), syndrome du Cri du chat (délétion terminale 5p), syndrome de Langer-Giedion (délétion 8p24), syndrome de Jacobsen (délétion terminale llq), syndromes de Prader-Willi et d'Angelman (délétion 15qll.2-ql3), syndrome de DiGeorge (délétion 22qll.2) etc. Actuellement, pour détecter une microdélétion, les médecins prescrivent le séquençage du génome entier (WGS) ou de l'exome entier (WES). Dans le cas d'un WGS ou d'un WES à faible passage, la profondeur de séquençage est très faible, et les données sont donc souvent peu fiables. Par conséquent, toute erreur de séquençage conduit à une amniocentèse invasive. Le panel de microdélétions génétiques "Enhance-seq" sera capable de trouver très efficacement les délétions génétiques connues et de surmonter les "résultats non déclarables" lorsqu'il n'y a pas assez d'ADN. Comme la technologie peut fonctionner avec de très faibles copies d'ADN, le test peut être effectué avant la dixième semaine de grossesse, lorsque l'avortement chimique est possible.
Dépistage de la résistance aux antimicrobiens
Les agents pathogènes peuvent acquérir des variantes génétiques responsables de l'apparition de la résistance aux médicaments, même si elles sont présentes à faible fréquence dans la population initiale. Il s'agit d'un grave problème dans les hôpitaux où les maladies nosocomiales et les septicémies provoquent des décès. Détecter ces variantes rares plus tôt pourrait empêcher leur propagation grâce à une surveillance et à des choix thérapeutiques plus précoces, tant sur le marché médical que vétérinaire. Les gènes suivants confèrent une résistance aux antibiotiques (entre parenthèses) - rpoB, rpoC (Myxopyronine), rpsL, rrs, rrl, rpsE (Amikacine, streptomycin, spectinomycine), gyrB (Coumermycine, novobiocine), dfrA (Triméthoprime), fusA (Acide fusidique), gènes ARNr 23S (Clarithromycine, érythromycine, tylosine), gyrA, gyrB, parC, parE, grIA (Ciprofloxacine, acide nalidixique, norfloxacine), rpoB (Rifampicine) (Melnyk et. al. 2015). gyrA et grIA dans les mutants de Staphylococcus aureus résistants à la Ciprofloxacine (Ferrero ét al. 1995).
Mycobacterium tuberculosis devient résistant aux médicaments en acquérant des mutations au niveau de sept loci - rpoB, pncA, katG ; mabA(fabGl)-inhA, gyrA, gyrB et rrs (Flandrois et al. 2020).
Des Enhancers uniques peuvent être conçus pour chaque gène de résistance aux antibiotiques, constituant ainsi un panel de gènes de résistance aux antibiotiques. La méthode "Enhance-seq" peut être suivie pour établir un diagnostic.
Maladies infectieuses - dépistage des variantes
La présence de très faibles quantités d'agents pathogènes dans les fluides corporels peut être détectée grâce à la technologie 'Enhance-seq' à haut débit, qui permettra le dépistage de plusieurs agents pathogènes en parallèle.
Au-delà de la simple détection d’agents pathogènes, le séquençage de leur variante est possible avec cette méthode, si la séquence de type sauvage des régions "hotspot" (point chaud) est connue. Par exemple, le domaine de liaison des récepteurs (RBD) de la protéine spike des variants de Covid-19. Cette technologie permettra de trouver des mutations rares dans chaque hotspot de type sauvage, quelle que soit la mutation. Elle pourrait donc être utile pour le dépistage des mutants émergents du virus Sars-CoV-2. Ceci est pertinent pour les marchés médicaux et vétérinaires (par exemple les infections H1N1, H5N1).
Dépistage du microbiome
Enhance-seq" sera capable de détecter des espèces mutantes rares dans notre microbiome (peau, intestin, etc.) pour faciliter le diagnostic, le pronostic ou la personnalisation de traitements.
Prédiction et surveillance du rejet des greffes d'organes
L'ADN acellulaire est un bon biomarqueur pour le rejet des greffes d'organes (Khush et al. 2019). Lors d'un rejet de greffe, l'ADN libre circulant (cfDNA) dérivé du donneur présent dans le sang du receveur provient de cellules endommagées (Martuszewski et al. , 2021 ; Cheng et al. 2020). L'ADN libre circulant (cfDNA)du greffon est libéré dans les fluides corporels en très faible quantité et doit être détecté à partir du bruit de cfDNA du receveur afin de détecter les signes précoces de rejet. Le niveau de concentration de cfDNA dérivé du donneur augmente avant tout autre biomarqueur protéique (créatinine dans le cas d'une transplantation rénale). La détection précoce de la quantité de cfDNA dérivé du donneur dans le sang ou l'urine du receveur de l'organe ou du greffon peut guider un traitement adéquat et éviter la perte prématurée du greffon.
En cas de détection d'un rejet de greffe, le profil du polymorphisme nucléotidique unique (SNP) du donneur et du receveur peut être établi. Des Enhancers personnalisés peuvent être conçus à partir du profil SNP du donneur. La méthode 'Enhance-seq' peut être appliquée pour détecter la présence de l’ADN d’un donneur à un stade très précoce de la transplantation (par exemple, après quelques heures).
Maladies auto-immunes
De plus en plus de preuves montrent que les mutations somatiques sont liées aux maladies autoimmunes (Savola et al. 2017 ; Ross, 2014). Certains gènes codant pour des protéines contiennent des répétitions en tandem simple (STR) qui sont hautement mutables tant dans les cellules germinales que somatiques. Dans les cellules somatiques, une STR mutée codant pour une protéine peut générer une nouvelle protéine, potentiellement immunogène. Ces mutations correspondent à l’auto-immunité. Dans le cas du lupus érythémateux systémique (LES) et du syndrome de Sjôgren (SJ), une séquence poly-A de 8 paires de bases est mutée au niveau somatique en une protéine mutante de 7 paires de bases (Ross, 2014). Savola et al. ont découvert de nouvelles mutations somatiques chez des patients atteints de polyarthrite rhumatoïde (PR) alors qu'ils étudiaient l'effet des mutations somatiques dans les cellules immunitaires (cellules T). Grâce à la technologie "Enhance-seq", des Enhancers spécifiques aux mutations somatiques peuvent être générés pour créer des panels de gènes pour des loci autoimmuns connus. La méthode"Enhance-seq" sera appliquée pour découvrir toute mutation somatique à partir de l'ADN libre des cellules et établir un diagnostic précoce des maladies auto-immunes. Un traitement personnalisé des maladies auto-immunes sera donc possible.
Les maladies inflammatoires -
L'ADN circulant (cfDNA) peut être utilisé comme biomarqueur de l'inflammation. Les mutations génétiques ou les changements de méthylation de l'ADN sont liés aux maladies inflammatoires chroniques de l'intestin (MICI). Les patients atteints de MICI présentent un risque élevé de développer un cancer gastro-intestinal en raison de l'accumulation de mutations par insertion-délétion (Olafsson et al. 2020). Il est donc nécessaire de détecter ce risque à un stade précoce. Les deux principaux sous- types de MH sont la maladie de Crohn (MC) et la colite ulcéreuse (CU). Il est généralement difficile de les distinguer et une meilleure prise en charge du patient nécessite une identification précise (Mirkov et al. 2017). Le panel de séquençage des MICI 'Enhance-seq' peut permettre une identification précise de la maladie à un stade précoce.
Maladies neu
Figure imgf000025_0001
Les composantes génétiques jouent un rôle dans le trouble complexe multifactoriel qu'est la maladie d'Alzheimer (MA). La maladie d'Alzheimer à début précoce (EOAD, "early onset alzheimer disease") est causée par quelques variants somatiques génétiques pathogènes dans les gènes APP, PSEN1 ou PSEN2 héritées d'un trait autosomal dominant dans quelques familles (Nicolas et al. 2018). Le panel de gènes spécifiques à la maladie d'Alzheimer de 'Enhance-seq' sera capable de détecter la maladie à un stade très précoce.
Lorsqu'une personne souffre d'un traumatisme crânien (TBI) ou d'une lésion cérébrale ischémique à la suite d'un arrêt cardiaque ou d'une sclérose en plaques, l'ADN circulant (cfDNA) dérivé du cerveau est libéré, ce qui fournit la preuve d'une neurodégénération (Chatterton et al. 2019). Le traçage du schéma de méthylation pour connaître l'origine cérébrale peut être très utile dans ce cas. Il est possible de concevoir des amplificateurs spécifiques du modèle de méthylation et d'identifier la fraction d'ADN qui montre l'identité des cellules neuronales et indique à son tour la gravité de la maladie. Voir figure
8. Détection de la mutation mitochondriale
La mutation de l'ADN mitochondrial est associée aux maladies liées à l'âge et à la dégénérescence maculaire liée à l'âge (DMLA). Atilano et al. (2021) ont effectué un séquençage à très grande profondeur pour différencier les SNP hétéroplasmiques de très basse fréquence et ont trouvé 23 points chauds liés à cette pathologie. La technologie "Enhance-seq" peut être particulièrement utile dans ce cas. Des Enhancers peuvent être générés et un panel de gènes peut être créé pour améliorer les SNP de très basse fréquence dans l'ADN mitochondrial.
BRÈVE DESCRIPTION DES FIGURES
Figure 1 - Représentation de l'amorce utilisée dans la PCR d'enrichissement de la mutation. Un Enhancer est composé de 3 parties - La région-R ou région de reconnaissance, la région-E ou région d'amplification et une région de liaison. La région R est destinée à se lier au point chaud de la région de type sauvage du gène. La première température d'hybridation permet cette liaison. Dans ce cas, la PCR ne peut pas se dérouler en raison de la présence d'une structure non nucléotidique de la région de liaison. B = Si la région du point chaud est mutée dans le gène matrice, alors la liaison n'est pas efficace. C = En cas de mutation, la liaison est plus efficace avec la région-E de l'amorce. Dans ce cas, la PCR se déroule car elle n'est pas arrêtée par la structure non nucléotidique de la région de liaison.
Figure 2 : Design des Enhancers comprenant un site de restriction Bsal et schéma d'amplification permettant l'étiquetage des amplicons.
Figure 3 : Illustration de l'utilisation d'un site de restriction orienté pour l'introduction des séquences Corrector aux extrémités des amplicons.
Figure 4 : Principe de l'ajout de UMI par PCR : devenir d'une molécule unique. L’analyse des données est effectuée par le clustering UMI. Pour analyser les mêmes mutations (ici, L858R), la même molécule d’ADN sera codée par différents UMI, il faudra donc une profondeur de séquençage plus élevée en raison du regroupement multiple. (Cette technique correspond a celle de méthode « Safe-seq »).
Figure 5 : Principe de l'ajout de UMI par « A-tailing » : devenir d'une molécule unique. La spécificité de brin est donnée par une seule base. Cela conduit facilement à des erreurs de séquençage (Cette technique est utilisée dans la méthode « Duplex Seq »). Figure 6 : Principe de l'ajout de UMI en mettant en oeuvre la méthode Golden gate : devenir d'une molécule unique. Chaque extrémité d’un ADN est marquée de façon unique et lue dans les deux sens fournissant des informations de séquence pour les brins (+) et (-). Chaque extrémité cohésive formée de 4 bases est spécifique à chaque brin et permet d'identifier une mutation asymétrique.
Figure 7 - Cette figure illustre la méthode d'insertion d'un site de restriction (site de liaison) par PCR après la PCR d'enrichissement. A = couple d'amorces contenant un site de restriction. B = représentation des amplicons obtenus après PCR à l'aide du couple d'amorces de l'étape A. C = liaison des adaptateurs Corrector aux amplicons par la méthode Golden gate via les sites de restriction.
Figure 8 - Cette figure montre comment la méthode"Enhance-seq" sera mise en oeuvre si l'échantillon initial est un ADN méthylé. A= la matrice d’ADN méthylée subira une conversion bi-sulfite ou enzymatique ou toute autre méthode de conversion qui convertira toute molécule de cytosine non méthylée en molécule d’uracile. Les cytosines méthylées, quant à elles, restent sous forme de cytosine. Le schéma de protection par méthylation est différent chez les personnes atteintes de cancer et chez celles qui ne le sont pas. La signature de la méthylation peut être considérée comme des "mutations". B = l’ADN contenant de l’uracile est amplifié par PCR pour convertir l’uracile en molécule de thymine. C = L’ADN résultant est prêt à servir de matrice dans la méthode "Enhance-seq".
Figure 9 - Cette figure présente les grandes lignes des trois principales étapes de la méthode "Enhance- seq". Les deux premières étapes font partie de la méthode "Enhance-seq" de biologie moléculaire, et la troisième étape est la correction des données par logiciel. L’étape 1 est la PCR d'enrichissement des mutations (MEP) qui amplifie le signal de mutation présent dans la population initiale. À l’étape 2, les adaptateurs ou les molécules Corrector sont liés avec les amplicons. Une PCR est effectuée pour amplifier les molécules afin que chaque UMI présente dans le Corrector soit répliqué de nombreuses fois. À l’étape 3, la correction des erreurs de séquençage est effectuée dans l’amplicon à l’aide des Corrector UMI. Chaque séquence issue de la MEP présente ainsi un UMI, est est encore une fois amplifié. Un consensus est alors tiré de toutes les séquences filles ayant le même UMI, ce qui permet de distinguer les mutations des erreurs de séquençage.
Figure 10 : Mise en oeuvre de la méthode en condition de multiplexage couplées à une nucléase spécifique au duplex (DSN). Figure 11: Mise en œuvre de la méthode permettant l'enrichissement en mutants par l'utilisation de bases LNA couplées à un marqueur.
Figure 12 : représente l’analyse de la PCR d'enrichissement de la mutation (sur le gel d’agarose). Dans la piste 1, seule la forme de type sauvage et dans la piste 2, seule la forme mutante des plasmides a été utilisée comme matrice. Dans la piste 3, le type sauvage et le mutant dans le rapport 98- 2 ont été utilisés. Le produit PCR attendu est d’environ 430 bp. Dans la piste 1, aucune amplification n’est observée dans la région attendue. Dans les pistes 2 et 3, en revanche, une forte amplification a été observée.
PARTIE EXPÉRIMENTALE
Les exemples suivants illustrent la mise en œuvre de la méthode pour la détection d'une délétion de 15 paires de bases sur l'exon 19 du gène EGFR et de la mutation ponctuelle (par exemple, EGFR L858R sur l'exon 21).
I - MATÉRIAUX ET MÉTHODES
1) La synthèse des gènes
Deux versions différentes de plasmides basés sur pUC57 ont été construites.
(i) versions de type sauvage des exons 19 et 21 du gène du récepteur du facteur de croissance épidermique humain (EGFR). Mentionnée ici comme pUC57-W.
(ii) version mutée de l’exon 19 (délétion de 15 pb) et de l’exon 21 (L858R) du même gène EGFR, mentionnée sous le nom de pUC57-M.
2) PCR d'enrichissement de la mutation (MEP) avec Enhancers
Les Enhancers sont des amorces spécialement conçues pour améliorer spécifiquement les mutants, mais pas le type sauvage. La conception des Enhancers est inspirée de l’article de Huang et al. 2019 qui a montré une nouvelle façon de concevoir des amorces (appelées "stuntmers") pour renforcer spécifiquement les mutations dans un contexte où l’ADN de type sauvage est très présent. La première étape de la méthode 'Enhance-seq' est la PCR d'amplification des mutations (MEP), où les séquences mutées sont préférentiellement amplifiées par rapport au type sauvage à l’aide d'Enhancers ou stuntmers. Les séquences d’amorces suivantes ont été utilisées lors des expériences - Mutation par délétion de I’exonl9
Fwd_Enhancer Exon_19
5’- CCCGTCGCTATCAAGGAATTAAGAGAAGCAAC-C3-TAAAATTCCCGTCGCT-3’ (SEQ ID NO.l)
Rev_Exon_19
5’-AGCAGCTGCCAGACATGAGA-3’ (SEQ ID NO.2)
Mutation ponctuelle de I’exon21 L858R
Fwd_Enhancer Exon_21
5’- GATTTTGGCTGGCCAAACTGCTGG-C3-AGCATGTCAAGATCACAGATTTT-3’ (SEQ ID NO.3)
Rev_ Exon_21
5'- GAGCTCACCCAGAATGTCTGG-3' (SEQ ID NO.4)
PCR d’enrichissement de la mutation (MEP) avec la polymérase Q5
5x tampon Q5 - 5ul, dNTPs (lOmM) - 0.5ul, Fwd_Enhancer Exon_19/21 (lOmM) - 1.25ul, Rev_Exon_19/21 (lOmM) - 1.25ul, template - variable, eau - variable.
Conditions PCR : Dénaturation initiale - 98°C pendant 30 secondes, dénaturation - 98°C pendant 10 secondes, hybridation primaire - 70°C pendant 30 secondes, hybridation secondaire - 57°C (pour l’exon 19), et 59°C (pour l’exon 21) pendant 30 secondes. Extension - 72°C pendant 30 secondes. Extension finale - 72°C pendant 2 minutes. Pour 35 - 45 cycles.
3) Ajout du site de liaison
Dans cette expérience, les sites de liaison ont été créés par l’ajout de Bsal à chaque extrémité de l’amplicon.
Ajout du site Bsal par PCR avec la polymérase Q5 -
5x tampon Q5 - 5ul, dNTPs (lOmM) - 0.5ul, Fwd_barcoding_primer (lOmM) - 1.25ul, Rev_barcoding primer (lOmM) - 1.25ul, template - lui, eau - 10.5ul.
Conditions de la PCR - Dénaturation initiale - 98°C pendant 30 secondes, dénaturation - 98°C pendant 10 secondes, hybridation - 62°C pendant 30 secondes, extension - 72°C pendant 30 secondes. Extension finale - 72°C pendant 2 minutes. Pour 30 cycles.
4) Traitement à la nucléase spécifique de l'ADN double brin (DSN) (optionnel): Dans le cas où une étape d'ajout d’une nucléase spécifique au duplex (DSN) est appliquée, la température d’hybridation de la région-R des Enhancers est choisie pour être autour de 67°C. L’expérience se déroule selon les étapes suivantes : i) Dans un thermocycleur, la température est augmentée à 98°C afin de dénaturer l’ADN. ii) L’échantillon est refroidi à 67°C (première température d’hybridation de la MEP), la DSN est ajoutée et la réaction est incubée pendant 20 minutes. iii) L’incubation est suivie de 2 minutes d’inactivation de l’enzyme DSN à 95°C. iv) L’échantillon est refroidi à nouveau à la deuxième température d’ hybridation de la MEP et la PCR est effectuée après ajout des réactifs nécessaires.
5) Préparation des extrémités et liaison des amplicons et des Correctors
La digestion de restriction des amplicons et des Correctors ainsi que la liaison se font en une seule étape par la technologie Golden gate.
Tampon ADN ligase T4 - 2.5ul, Amplicon - 2.3 ul, Fwd_corrector - 0.56ul, Rev_corrector - 0.85ul
Bsal - 0.5ul, T4 DNA ligase - 0.5ul, Eau - 16.8ul
Les réactions sont incubées à 37°C pendant 40 minutes et inactivées à 60°C pendant 10 minutes. Ensuite, les réactions sont nettoyées par PCR clean up kit et éluées dans lOul de tampon d’élution.
Ici, 6 pb X désigne l'étiquette de l’échantillon ou du patient ; 10 pb N désigne la région UMI dégénérée.
6) Amplification des amplicons liés par le Corrector
Les amplicons liés avec les Correctors ont été amplifiés par une PCR utilisant la polymérase Q5 - Réaction PCR: Q55x Master mix- 5ul ; dNTPs (lOmM)- 0.5ul ; Universal_fwd_primer (lOmM)- 1.25ul ; Universal_rev_primer (10mM)- 1.25ul ; Template- 5ul ; Eau- 12ul.
Condition de PCR : Dénaturation initiale - 98°C pendant 30 secondes, dénaturation - 98°C pendant 10 secondes, recuit - 65°C pendant 30 secondes, extension - 72°C pendant 30 secondes. Extension finale - 72°C pendant 2 minutes. Pour 30 cycles.
Universal_fwd_primer - 5’- ACACTCTTTCCCTACACGAC -3’ (SEQ ID NO.5)
Universal_rev_primer - 5’- GACTGGAGTTCAGACGTGTG -3’ (SEQ ID NO.6)
7) Expérience "spike-in"
Des produits PCR de 450 pb contenant l’exon 19 et l’exon 21 ont été amplifiés à partir des plasmides pUC57-W ou M. Ils ont ensuite été mélangés à différentes concentrations. Ces amplicons ont ensuite été ajoutés avec du sérum humain (Sigma-Aldrich) pour imiter la condition clinique où l'ADN sans cellules est mélangé avec le sérum humain. Les amplicons ont ensuite été isolés du sérum.
Isolation d'amplicons à partir de sérum humain
Le MagMAX™ Cell-Free DNA Isolation Kit d'Applied Biosystem a été utilisé pour isoler les amplicons de l'échantillon de sérum. Ce kit est conçu pour isoler l'ADN circulant à partir d'échantillons de plasma, de sérum et d'urine humains exempts de cellules, à l'aide de billes magnétiques Dynabeads. Les instructions du fabricant ont été suivies pour isoler les amplicons à partir du sérum. Les amplicons isolés ont été élus dans 20 ul de tampon d'élution.
RÉSULTATS
EXEMPLE 1 - Analyse du gel d'agarose de la PCR d'enrichissement de la mutation
Des PCR d'enrichissement de mutation (MEP) ont été réalisées pour la mutation par délétion de l'Exonl9 avec l'amorce Fwd_exonl9_enhancer et Reverse_exon21 en utilisant différents modèles plasmidiques - type sauvage pUC57-W, mutant pUC57-M et mélange de ces deux dans des rapports (98- 2) pour voir si l'effet de la PCR d'enrichissement de mutation peut être observé visuellement dans le gel d'agarose. Toutes les matrices ont été utilisées à des concentrations de 10 ng/ul. Après 35 cycles de MEP, les amplicons ont été chargés dans le gel d'agarose à 2%. Le produit PCR attendu est d'environ 430 bp pour la séquence de type sauvage et 415 bp pour la forme mutante. Aucune amplification n'a été observée dans le cas du type sauvage ; en revanche, de fortes bandes d'amplification ont été observées lorsqu'un mutant ou un mélange de type sauvage et de mutants a été utilisé comme matrice (Figure 12).
EXEMPLE 2 - Essais avec différents ratios de population de type sauvage et de mutants
Le but de cette expérience était de quantifier l'augmentation du signal de mutation et de voir si plusieurs cycles de PCR sont nécessaires pour augmenter significativement la population de mutants. Pour cela, le type sauvage pUC57-W et les plasmides mutants pUC57-M ont été dilués à une concentration de 10 ng/ul chacun et ensuite utilisés dans deux ratios différents.
Mélange de type mutant et sauvage dans un rapport de 0,2 : 99,8 (RI).
Mélange de type mutant et sauvage dans un rapport de 2 : 98 (R2). Des PCR d'enrichissement de la mutation ont été réalisées en utilisant ces deux mélanges comme matrices initiales. Trois tours consécutifs de PCR ont été effectués en utilisant l'amplicon du cycle précédent comme matrice pour la PCR suivante. Chaque fois, après un cycle de PCR, le produit a été purifié et dilué à une concentration de 10 ng/ul avant de passer à la prochaine étape de la PCR. Les résultats montrent qu'un seul tour de PCR (ici 35 cycles) est suffisant pour saturer la mutation et bloquer l'amplification du type sauvage et que plusieurs tours de PCR supplémentaires n'augmentent pas la quantité de mutants dans la population.
Pour la mutation par délétion de l'Exonl9
Figure imgf000032_0001
Tableau 3. Changement des ratios de type sauvage et mutant après chaque cycle de PCR.
Pour la mutation ponctuelle L858R de l'Exon21
Figure imgf000032_0002
Tableau 4 - Changement des ratios de type sauvage et mutant après chaque cycle de PCR.
EXEMPLE 3 - Concentrations de matrices en nombres absolus
Cette expérience vise à identifier le seuil de détection de la MEP et de la PCR traditionnelle en nombre absolu. Pour cela, pUC57-W et pUC57-M ont été diluées pour avoir les concentrations suivantes par lOul- 1) 10 molécules de plasmide mutant et 108 molécules de plasmide sauvage (0,00001%)
2) 10 molécules de plasmide mutant et 109 molécules de plasmide sauvage (0,000001%)
Des PCR traditionnelles (avec une seule température d'hybridation) ainsi que des PCR d'enrichissement de la mutation (MEP) pour mutation par délétion de l'Exonl9 et la mutation ponctuelle L858R de l'Exon 21 ont été réalisées à l'aide de ces matrices. Les amplicons ont été séquencés par séquençage NGS et l'analyse des données a révélé les résultats suivants dans le tableau 5.
Figure imgf000033_0001
Tableau 5 - Effet de la PCR traditionnelle et de la PCR MEP sur le nombre absolu de mutations présente après amplification. Les données expérimentales montrent qu'en MEP la mutation par délétion de l'exon 19 est détectée au moins 5 fois plus efficacement que la mutation ponctuelle L858R de l'exon 21. La MEP peut détecter la mutation au moins 10 à 60 fois plus efficacement dans des concentrations hyper diluées d'ADN mutant où 10 molécules d'ADN mutant ou moins (selon les statistiques de Poisson) sont présentes dans le fond de 100 millions ou 1 milliard de séquence d'ADN de type sauvage. Dans le rapport de 10 à 1 milliard de molécules d'ADN mutant par rapport à l'ADN sauvage, la MEP a montré des capacités d'amplification 10 à 50 fois plus élevées selon la nature de la mutation (mutation ponctuelle ou délétion). Cela permettra de détecter des quantités extrêmement faibles de mutations présentes dans la population dans des machines de séquençage à faible profondeur, ce qui permettra d'économiser des investissements.
EXEMPLE 4 - Expérience "spike-in" avec des amplicons dans le sérum
L'objectif de cette expérience était de voir la performance de l'ensemble de la méthode Enhance-seq sur des échantillons de sérum avec des gènes artificiels ajoutés. Dans une solution complexe comme le sérum, l'isolement de l'ADN libre circulant (cfDNA) pourrait être un goulot d'étranglement pour atteindre la même limite de détection/sensibilité que dans l'eau, comme cela a été fait précédemment dans l'expérience synthétique.
Les pUC57-W et pUC57-W ont été amplifiés pour obtenir deux amplicons différents de 450 paires de bases. Ces ADN d'amplicons de type sauvage et mutant ont été dilués à une concentration de 2ng/ml et ensuite mélangés dans différents ratios. Ensuite, les amplicons ont été ajoutés dans 500 ul de sérum avec les concentrations suivantes.
Figure imgf000034_0001
Tableau 6 - Préparation des échantillons à tester Les amplicons ont ensuite été extraits du sérum avec le kit d'isolation cfDNA MegaMax et élués dans 20 ul de tampon d'élution. Des PCR traditionnelles ou des MEP ont été réalisées pour la mutation ponctuelle L858R de l'exon 21 avec lOul de matrice.
La MEP a été exécutée pour l'exon 21 avec les composants suivants -
5x Tampon Q5 - 5 ul, dNTPs - 0,5 ul, Fwd_Enhancer Exon_21 - 1,25 ul, 21 Reverse P - 1,25 ul, Q5 polymerase - 0,25 ul, ADN matrice - 5 ul, Eau - 12 ul.
Conditions MEP
98°C pendant 30 secondes, dénaturation - 98°C pendant 10 secondes, hybridation primaire - 70°C pendant 20 secondes, hybridation secondaire - 59°C pendant 20 secondes. Extension - 72°C pendant 30 secondes. Extension finale - 72°C pendant 2 minutes. Pour 45 cycles
Figure imgf000035_0001
Tableau 7 - Effet de la PCR traditionnelle et de la MEP sur les amplicons mutés hyper-dilués isolés du sérum.
Ce résultat montre que la MEP permet d'amplifier l’ADN mutant, environ cinq fois plus efficacement que la PCR traditionnelle avec une seule température d’hybridation et une conception classique des amorces. L’efficacité du système est plus élevée lorsqu'on utilise un fragment d'ADN linéaire que sous forme de plasmide.
EXEMPLE 5 - Détection de mutants KRAS (KRAS G12D, G13S, Q22K, R68S, A146T) avec une VAF de 0,001% par multiplexage Matériel et méthodes
1. Synthèse des gènes
Deux plasmides, PUC57 contenant soit le gène KRAS de type sauvage soit le gène KRAS mutant ont été construits. Ils ont été mélangés de façon à ce que le rapport entre le plasmide mutant et le plasmide de type sauvage soit de 0,001 %.
2. PCR d'amélioration de la mutation (MEP) avec Enhancers
Des Enhancers ont été conçus pour amplifier préférentiellement les séquences d'ADN mutantes par rapport aux séquences de type sauvage. Des Enhancers contenant des bases LNA (acide nucléique verrouillé) à l'endroit de la mutation dans la région R ont été conçus. Ils peuvent facilement différencier la base du type sauvage de celle du mutant. L’un des avantages de l’utilisation de LNA est l’augmentation de la température de fusion du couple LNA:ADN dans la matrice de type sauvage par rapport à la matrice mutante, ce qui permet une discrimination et une amplification plus efficaces de la matrice mutante. Les séquences d’amorces sont mentionnées ci-dessous. Les acides nucléiques verrouillés sont indiqués entre crochets [].
KRAS G12D G13S Q22K
KRAS1 Fwd: 5'-GGAGCT[G]GTG[G]CGTAGGCAAGAG-C3-
ATGATTGGTCTCAGTATTGTGGTAGTTGGAGCT-3' (SEQ ID NO.7)
KRAS1 Rev:
5'-ATCAAAGAATGGTCCTGCACC (SEQ ID NO.8)
KRAS A146T
KRAS2 Fwd:
5'-AACAT[CAG]CAAAGACAAGACAGGTAAGTAACAC-C3-
ATGATTGGTCTCAGTATGGAATTCCTTTTATTGAAACATC-3' (SEQ ID NO.9)
KRAS2 Rev:
5'-GACATAACAGTTATGATTTTGCAGAAAACAG-3' (SEQ ID NO.10) KRAS3 R68S
KRAS3 Fwd:
5'-CAATGAG[G]GACCAGTACATGAGGACTGGGGA-C3- ATGATTGGTCTCAGTATGGAGTACAGTGCAATGA- 3' (SEQ ID NO.11)
KRAS3-Rev:
5'-CCAATTTAAACCCACCTATAATGGTGAATATCTTC-3' (SEQ ID NO.12)
3. PCR d'enrichissement
Q5 Master mix 2X : 25ul, mélange d’amorces (lOOnM) : 3ul Template : variable, eau : variable.
Conditions de la PCR : dénaturation initiale : 98°C pendant 30 secondes ; dénaturation : 98°C pendant 10 secondes ; première hybridation : 76°C pendant 60 secondes ; seconde hybridation : 57°C pendant 30 secondes. Extension : 72°C pendant 30 secondes. Extension finale : 72°C pendant 2 minutes. Pour 45 cycles.
4. Préparation des extrémités et ligation des amplicons et des Correctors
La digestion du site de restriction des amplicons et des Correctors ainsi que la liaison se font en une seule étape par la technologie Golden gate.
Tampon T4 ADN ligase : 2.5ul, Amplicon : 20ng, Fwd_barcode : lOng, Rev_barcode : lOng
Mélange d’enzymes golden gate (GG) : lui, Eau-qsp 25ul
Les réactions sont incubées à 37QC pendant lh et inactivées à 60QC pendant 10 mins. Les produits de réactions sont ensuite purifiés par le kit de purification PCR et éluées dans 20ul de tampon d’élution.
Fwd_corrector:
5' ACACTCTTTCCCTACACG ACGCTCTTCCG ATCTXXXXXXN N N N N N N N N NGTATAG AGACCATTGTAGTAGCG -3' (SEQ ID NO.13)
Rev_corrector:
5'GACTGGAGTTCAGACGTGTGCTCTTCCGATCTXXXXXXNNNNNNNNNNAGATGGAGACCTTGATGTAGC-3' (SEQ ID NO.14) Ici, XXXXXX désigne le code-barres de l'échantillon ou du patient ; NNNNNNNNNN désigne la région UMI dégénérée.
5. Amplification des amplicons et ajout des adaptateurs illumina
Les amplicons contenant les Correctors ont été amplifiés avec une PCR utilisant le master mix 2X de Q5 :
Réaction PCR- 2X Master mix : 25ul ; 0.5ul, P5_fwd_primer (500nM) : 1 ul ; P7 reverse primer (500nM) : lui ; Template : 50ng ; Eau : 12ul.
Condition de PCR : Dénaturation initiale : 98°C pendant 30 secondes, dénaturation : 98°C pendant 10 secondes, recuit : 65°C pendant 30 secondes, extension : 72°C pendant 30 secondes. Extension finale : 72°C pendant 2 minutes. Pour 10 cycles.
P5_fwd_primer: 5'- AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC -3' (SEQ ID NO.15) P7_rev_primer: 5'- CAAGCAGAAGACGGCATACGAGATGTGACTGGAGTTCAGACGTGTG -3' (SEQ ID NO.16)
Résultats
Figure imgf000038_0001
Tableau 8 : Changement des ratios de gènes mutants avant et après la MEP. Le contrôle négatif contenant 100% de WT et aucun mutant ne montre aucun ADN mutant après MEP, ce qui suggère l’absence de contamination dans notre procédure. La VAF est le ratio mutant / type sauvage. RÉFÉRENCES
1. Abbosh, C., Birkbak, N. J., Wilson, G. A., Jamal-Hanjani, M., Constantin, T., Salari, R., ... & Swanton, C. (2017). Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature, 545(7655), 446-451.
2. Atilano, S. R., Udar, N., Satalich, T. A., Udar, V., Chwa, M., & Kenney, M. C. (2021). Low frequency mitochondrial DNA heteroplasmy SNPs in blood, retina, and [RPE+ choroid] of age- related macular degeneration subjects. Pios one, 16(1), e0246114.
3. Chabon, J. J., Simmons, A. D., Lovejoy, A. F., Esfahani, M. S., Newman, A. M., Haringsma, H. J., ... & Diehn, M. (2016). Circulating tumour DNA profiling reveals heterogeneity of EGFR inhibitor resistance mechanisms in lung cancer patients. Nature communications, 7(1), 1-15.
4. Chatterton, Z., Mendelev, N., Chen, S., Raj, T., Walker, R., Carr, W., ... & Haghighi, F. (2019). Brain-derived circulating cell-free DNA defines the brain region and cell specific origins associated with neuronal atrophy. bioRxiv, 538827.
5. Cheng, A. P., Cheng, M. P., Loy, C. J., Lenz, J. S., Chen, K., Burnham P., Timblin M., Orejas J L., Silverman E., Marty F M., Ritz J, and De Vlaminck, I. (2020). BioRXiV. Cell-free DNA Profiling Informs Major Complications of Hematopoietic Cell Transplantation. bioRxiv, 2020-04.
6. Couraud, S., Vaca-Paniagua, F., Villar, S., Oliver, J., Schuster, T., Blanche, H., ... & Souquet, P. J. (2014). Noninvasive diagnosis of actionable mutations by deep sequencing of circulating free DNA in lung cancer from never-smokers- a proof-of-concept study from BioCAST/lFCT- 1002. Clinical Cancer Research, 20(17), 4613-4624.
7. De Fraipont, F., Gazzeri, S., Cho, W. C., & Eymin, B. (2019). Circular RNAs and RNA splice variants as biomarkers for prognosis and therapeutic response in the liquid biopsies of lung cancer patients. Frontiers in genetics, 10, 390.
8. Diehn, M., Alizadeh, A., Newman, A., Klass, D. M. Identification and use of circulating Nucleic acids. WO 2016/040901 AL
9. Gonzâlez-Billalabeitia, E., Conteduca, V., Wetterskog, D., Jayaram, A., & Attard, G. (2019). Circulating tumor DNA in advanced prostate cancer- transitioning from discovery to a clinically implemented test. Prostate cancer and prostatic diseases, 22(2), 195-205.
10. Ferrero, L., Cameron, B., & Crouzet, J. (1995). Analysis of gyrA and grIA mutations in stepwise- selected ciprofloxacin-resistant mutants of Staphylococcus aureus. Antimicrobial Agents and Chemotherapy, 39(7), 1554-1558.
11. Fiala, C., & Diamandis, E. P. (2018). Utility of circulating tumor DNA in cancer diagnostics with emphasis on early detection. BMC medicine, 16(1), 1-10.
12. Flandrois, J. P., Lina, G., & Dumitrescu, O. (2014). MUBII-TB-DB- a database of mutations associated with antibiotic resistance in Mycobacterium tuberculosis. BMC bioinformatics, 15(1), 1-9. Forshew, T., Murtaza, M., Parkinson, C., Gale, D., Tsui, D. W., Kaper, F., ... & Rosenfeld, N. (2012). Noninvasive identification and monitoring of cancer mutations by targeted deep sequencing of plasma DNA. Science translational medicine, 4(136), 136ra68-136ra68. Fredebohm, J., Mehnert, D. H., Lober, A. K., Holtrup, F., van Rahden, V., Angenendt, P., & Diehl, F. (2016). Detection and quantification of KIT mutations in ctDNA by plasma safe-seqS. In Circulating Nucleic Acids in Serum and Plasma-CNAPS IX (pp. 187-189). Springer, Cham. Gale, D., Lawson, A. R., Howarth, K., Madi, M., Durham, B., Smalley, S., ... & Rosenfeld, N. (2018). Development of a highly sensitive liquid biopsy platform to detect clinically-relevant cancer mutations at low allele fractions in cell-free DNA. PloS one, 13(3), e0194630. Glenn, T. C. (2011). Field guide to next-generation DNA sequencers. Molecular ecology resources, 11(5), 759-769. Gonzâlez-Billalabeitia, E., Conteduca, V., Wetterskog, D., Jayaram, A., & Attard, G. (2019). Circulating tumor DNA in advanced prostate cancer- transitioning from discovery to a clinically implemented test. Prostate cancer and prostatic diseases, 22(2), 195-205. How-Kit, A., Mazaleyrat, N., Daunay, A., Nielsen, H. M., Terris, B., & Tost, J. (2013). Sensitive Detection of KRAS Mutations Using Enhanced-ice-COLD-PCR Mutation Enrichment and Direct Sequence Identification. Human mutation, 34(11), 1568-1580. Huang, J. K., Fan, L., Wang, T. Y., & Wu, P. S. (2019). A new primer construction technique that effectively increases amplification of rare mutant templates in samples. BMC biotechnology, 19(1), 1-11. Ilié, M., & Hofman, P. (2016). Pros- Can tissue biopsy be replaced by liquid biopsy?. Translational lung cancer research, 5(4), 420. Kennedy, S. R., Schmitt, M. W., Fox, E. J., Kohrn, B. F., Salk, J. J., Ahn, E. H., ... & Loeb, L. A. (2014). Detecting ultralow-frequency mutations by Duplex Sequencing. Nature protocols, 9(11), 2586-2606. Keraite, L, Alvarez-Garcia, V., Garcia-Murillas, L, Beaney, M., Turner, N. C., Bartos, C., ... & Leslie, N. R. (2020). PIK3CA mutation enrichment and quantitation from blood and tissue. Scientific reports, 10(1), 1-12. Khush, K. K., Patel, J., Pinney, S., Kao, A., Alharethi, R., DePasquale, E., ... & Kobashigawa, J. (2019). Noninvasive detection of graft injury after heart transplant using donor-derived cell- free DNA- a prospective multicenter study. American Journal of Transplantation, 19(10), 2889-2899. Kinde, L, Wu, J., Papadopoulos, N., Kinzler, K. W., & Vogelstein, B. (2011). Detection and quantification of rare mutations with massively parallel sequencing. Proceedings of the National Academy of Sciences, 108(23), 9530-9535. Li, J., Wang, L., Mamon, H., Kulke, M. H., Berbeco, R., & Makrigiorgos, G. M. (2008). Replacing PCR with COLD-PCR enriches variant DNA sequences and redefines the sensitivity of genetic testing. Nature medicine, 14(5), 579-584. Li J, Makrigiorgos GM. COLD-PCR- a new platform for highly improved mutation detection in cancer and genetic testing. Biochem Soc Trans. 2009; 37(Pt 2)- 427-32. Martuszewski, A., Paluszkiewicz, P., Krol, M., Banasik, M., & Kepinska, M. (2021). Donor- Derived Cell-Free DNA in Kidney Transplantation as a Potential Rejection Biomarker- A Systematic Literature Review. Journal of Clinical Medicine, 10(2), 193. Melnyk, A. H., Wong, A., & Kassen, R. (2015). The fitness costs of antibiotic resistance mutations. Evolutionary applications, 8(3), 273-283. Milbury, C. A., Li, J., & Makrigiorgos, G. M. (2011). Ice-COLD-PCR enables rapid amplification and robust enrichment for low-abundance unknown DNA mutations. Nucleic acids research, 39(1), e2-e2. Mirkov, M. U., Verstockt, B., & Cleynen, I. (2017). Genetics of inflammatory bowel disease- beyond NOD2. The lancet Gastroenterology & hepatology, 2(3), 224-234. Narayan, A., Carriero, N. J., Gettinger, S. N., Kluytenaar, J., Kozak, K. R., Yock, T. L, ... & Patel, A. A. (2012). Ultrasensitive measurement of hotspot mutations in tumor DNA in blood using error-suppressed multiplexed deep sequencing. Cancer research, 72(14), 3492-3498. Newman, A. M., Bratman, S. V., To, J., Wynne, J. F., Eclov, N. C., Modlin, L. A., ... & Diehn, M. (2014). An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nature medicine, 20(5), 548-554. Newman, A. M., Lovejoy, A. F., Klass, D. M., Kurtz, D. M., Chabon, J. J., Scherer, F., ... & Alizadeh, A. A. (2016). Integrated digital error suppression for improved detection of circulating tumor DNA. Nature biotechnology, 34(5), 547-555. Nicolas, G., Acuna-Hidalgo, R., Keogh, M. J., Quenez, O., Steehouwer, M., Lelieveld, S., ... & Hoischen, A. (2018). Somatic variants in autosomal dominant genes are a rare cause of sporadic Alzheimer's disease. Alzheimer's & Dementia, 14(12), 1632-1639. Nilsson, R. J. A., Karachaliou, N., Berenguer, J., Gimenez-Capitan, A., Schellen, P., Teixido, C., ... & Wurdinger, T. (2016). Rearranged EML4-ALK fusion transcripts sequester in circulating blood platelets and enable blood-based crizotinib response monitoring in non-small-cell lung cancer. Oncotarget, 7(1), 1066. Olafsson, S., McIntyre, R. E., Coorens, T., Butler, T., Jung, H., Robinson, P. S., ... & Anderson, C. A. (2020). Somatic evolution in non-neoplastic IBD-affected colon. Cell, 182(3), 672-684. Poole, J. C., Wu, S. F., Lu, T. T., Vibat, C. R. T., Pham, A., Samuelsz, E., ... & Arnold, L. J. (2019). Analytical validation of the Target Selector ctDNA platform featuring single copy detection sensitivity for clinically actionable EGFR, BRAF, and KRAS mutations. PloS one, 14(10), e0223112. Qin, Z., Ljubimov, V. A., Zhou, C., Tong, Y., & Liang, J. (2016). Cell-free circulating tumor DNA in cancer. Chinese journal of cancer, 35(1), 1-9. Ross, K. A. (2014). Coherent somatic mutation in autoimmune disease. PloS one, 9(7), el01093. Savoia, P., Kelkka, T., Rajala, H. L, Kuuliala, A., Kuuliala, K., Eldfors, S., ... & Mustjoki, S. (2017). Somatic mutations in clonally expanded cytotoxic T lymphocytes in patients with newly diagnosed rheumatoid arthritis. Nature communications, 8(1), 1-14. Schmitt, M. W., Kennedy, S. R., Salk, J. J., Fox, E. J., Hiatt, J. B., & Loeb, L. A. (2012). Detection of ultra-rare mutations by next-generation sequencing. Proceedings of the National Academy of Sciences, 109(36), 14508-14513. Schwarzenbach, H., Stoehlmacher, J., Pantel, K., & Goekkurt, E. (2008). Detection and monitoring of cell-free DNA in blood of patients with colorectal cancer. Annals of the New York Academy of Sciences, 1137(1), 190-196. Schultz, M. D., He, Y., Whitaker, J. W., Hariharan, M., Mukamel, E. A., Leung, D., ... & Ecker, J. R. (2015). Human body epigenome maps reveal noncanonical DNA methylation variation. Nature, 523(7559), 212-216. Shagin, D. A., Rebrikov, D. V., Kozhemyako, V. B., Altshuler, I. M., Shcheglov, A. S., Zhulidov, P. A., ... & Lukyanov, S. (2002). A novel method for SNP detection using a new duplex-specific nuclease from crab hepatopancreas. Genome research, 12(12), 1935-1942. Song, C., Liu, Y., Fontana, R., Makrigiorgos, A., Mamon, H., Kulke, M. H., & Makrigiorgos, G. M. (2016). Elimination of unaltered DNA in mixed clinical samples via nuclease-assisted minorallele enrichment. Nucleic acids research, 44(19), el46-el46. Stroun, M., Anker, P., Lyautey, J., Lederrey, C., & Maurice, P. A. (1987). Isolation and characterization of DNA from the plasma of cancer patients. European Journal of Cancer and Clinical Oncology, 23(6), 707-712. Tie, J., Kinde, L, Wang, Y., Wong, H. L., Roebert, J., Christie, M., ... & Gibbs, P. (2015). Circulating tumor DNA as an early marker of therapeutic response in patients with metastatic colorectal cancer. Annals of Oncology, 26(8), 1715-1722. Tie, J., Wang, Y., Tomasetti, C., Li, L., Springer, S., Kinde, L, ... & Gibbs, P. (2016). Circulating tumor DNA analysis detects minimal residual disease and predicts recurrence in patients with stage II colon cancer. Science translational medicine, 8(346), 346ra92-346ra92. Uchida, J., Kato, K., Kukita, Y., Kumagai, T., Nishino, K., Daga, H., ... & Imamura, F. (2015). Diagnostic accuracy of noninvasive genotyping of EGFR in lung cancer patients by deep sequencing of plasma cell-free DNA. Clinical chemistry, 61(9), 1191-1196.

Claims

42 REVENDICATIONS
1. Procédé de détection d'une mutation rare dans un échantillon biologique, comprenant les étapes suivantes : o Étape 1 - fourniture d'un échantillon comprenant de l'ADN o Étape 2 - amplification sélective de la région contenant ladite mutation en utilisant une PCR d'enrichissement de la mutation (Mutation Enhancement PCR, MEP) comprenant les étapes suivantes : a. Fourniture d'une amorce amplificatrice (Enhancer) pour PCR comprenant 3 régions :
(i) la région R qui reconnaît et se lie spécifiquement à la séquence de type sauvage mais ne peut pas se lier si la région contient une mutation,
(ii) une région de liaison et
(iii) la région-E qui se lie spécifiquement à une séquence située en amont du site de mutation ; b. Réalisation d'une PCR comprenant deux étapes d'hybridation : (i) une première hybridation à une température Tl qui permet la liaison de la région R de l'amorce à la séquence de type sauvage et (ii) une seconde hybridation à une température T2 qui permet la liaison de la région-E de l'amorce ; dans lequel Tl est supérieure d'au moins 5°C à T2 ; c. En cas de liaison de la région E, la séquence contenant ladite mutation est amplifiée d. Obtention d'amplicons contenant ladite mutation, lesdits amplicons comprenant un site de restriction orienté à chaque extrémité, ledit site de restriction étant ajouté, soit pendant la PCR d'enrichissement de la mutation du fait qu'un tel site de restriction est présent dans ladite région-E de l'amorce, soit en réalisant une PCR additionnelle après l'étape c. de ladite PCR d’enrichissement de la mutation en utilisant des amorces contenant un tel site de restriction. o Étape 3 - ajout à chaque extrémité de chaque amplicon d’une séquence Corrector comprenant une séquence fixe, -, un identifiant moléculaire unique (UMI), un site de restriction orienté compatible avec ceux présents aux extrémités desdits amplicons, et éventuellement d'une étiquette spécifique de l’échantillon/du patient, en utilisant lesdits sites de restriction o Étape 4 - amplification des amplicons résultant de l’étape 3 par PCR o Étape 5 - séquençage des amplicons résultant de l’étape 4 par NGS 43 o Étape 6 - correction des erreurs de séquençage par une analyse logicielle utilisant les identifiants moléculaires uniques.
2. Procédé selon la revendication 1, caractérisé en ce qu'une nucléase spécifique de l'ADN double brin est ajoutée, soit avant la PCR d'enrichissement de la mutation, soit après la PCR d'enrichissement de la mutation.
3. Procédé selon l'une quelconque des revendications précédentes dans laquelle ladite amorce amplificatrice comprend des bases LNA soit dans la région-R.
4. Procédé selon l'une quelconque des revendications précédentes dans laquelle des code-barres sont ajoutés, soit au moment de la PCR d'enrichissement du fait de la présence de tels code- barres dans la région-E, soit en même temps que ledit site de restriction orienté lorsque celui- ci est ajouté par PCR, soit à l'étape 3 du fait de sa présence dans la séquence Corrector.
5. 4. Procédé selon l’une quelconque des revendications précédentes caractérisé en ce que ladite mutation rare peut être une mutation ponctuelle, une délétion, une insertion, ou un réarrangement.
6. Procédé selon l’une quelconque des revendications précédentes caractérisé en ce que ladite mutation rare correspond à la présence d’une cytosine comme marqueur de méthylation de l’ADN, ledit procédé comprenant une étape de traitement de l’échantillon d’ADN avant l’amplification de l’ADN de l’étape 2 afin de révéler le site de méthylation.
7. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce que ledit procédé comprend une étape de traitement de l’échantillon biologique avant l’amplification d’ADN de l’étape 2 afin de convertir l’ARN en ADN.
8. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce qu’une étiquette de patient ou une étiquette d’échantillon est présente dans ladite séquence Corrector à l’étape 3, puis les amplicons résultant de l’étape 4 sont regroupés pour un séquençage NGS.
9. Procédé selon l’une quelconque des revendications précédentes caractérisé en ce que l’échantillon biologique est une biopsie liquide. 44
10. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend l'ajout, après la PCR d'enrichissement de la mutation et l'ajout des séquences Corrector, de sondes spécifiques des séquences sauvages comprenant des bases LNA ainsi qu'une nucléase spécifique au duplex.
11. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce qu'il comprend l'ajout de sondes spécifiques des mutations comprenant une/des bases LNA couplées à un marqueur après l'amplification de l'étape 2 et l'ajout de séquences Corrector de l'étape 3.
12. Amorce amplificatrice comprenant 3 régions : a. la région R qui reconnaît et se lie spécifiquement à la séquence de type sauvage mais ne peut pas se lier si la région contient une mutation, b. une région de liaison et c. la région-E qui se lie spécifiquement à une séquence située en amont du site de mutation et comprend la séquence d'un site de restriction orienté positionné en amont de la région-E.
13. Amorce amplificatrice selon la revendication 12 dans laquelle ledit site de restriction est Bsal.
14. Amorce amplificatrice selon l'une des revendications 12 ou 13 comprenant en outre des bases LNA dans la région-R.
PCT/FR2022/051851 2021-09-30 2022-09-30 Méthode de détection de mutations rares sur biopsie liquide WO2023052735A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP22790339.0A EP4409034A1 (fr) 2021-09-30 2022-09-30 Méthode de détection de mutations rares sur biopsie liquide

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FRFR2110373 2021-09-30
FR2110373A FR3127504A1 (fr) 2021-09-30 2021-09-30 Méthode de détection de mutations rares sur biopsie liquide

Publications (1)

Publication Number Publication Date
WO2023052735A1 true WO2023052735A1 (fr) 2023-04-06

Family

ID=80787202

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2022/051851 WO2023052735A1 (fr) 2021-09-30 2022-09-30 Méthode de détection de mutations rares sur biopsie liquide

Country Status (3)

Country Link
EP (1) EP4409034A1 (fr)
FR (1) FR3127504A1 (fr)
WO (1) WO2023052735A1 (fr)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040146866A1 (en) * 2003-01-21 2004-07-29 Guoliang Fu Quantitative multiplex detection of nucleic acids
WO2016040901A1 (fr) 2014-09-12 2016-03-17 The Board Of Trustees Of The Leland Stanford Junior University Identification et utilisation d'acides nucléiques circulants
US20180371453A1 (en) * 2015-08-10 2018-12-27 Geneplus - Beijing Low-frequency mutations enrichment sequencing method for free target dna in plasma

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040146866A1 (en) * 2003-01-21 2004-07-29 Guoliang Fu Quantitative multiplex detection of nucleic acids
WO2016040901A1 (fr) 2014-09-12 2016-03-17 The Board Of Trustees Of The Leland Stanford Junior University Identification et utilisation d'acides nucléiques circulants
US20180371453A1 (en) * 2015-08-10 2018-12-27 Geneplus - Beijing Low-frequency mutations enrichment sequencing method for free target dna in plasma

Non-Patent Citations (53)

* Cited by examiner, † Cited by third party
Title
AARON M NEWMAN ET AL: "Integrated digital error suppression for improved detection of circulating tumor DNA", NATURE BIOTECHNOLOGY, vol. 34, no. 5, 28 March 2016 (2016-03-28), New York, pages 547 - 555, XP055464348, ISSN: 1087-0156, DOI: 10.1038/nbt.3520 *
ABBOSH, C.BIRKBAK, N. J.WILSON, G. A.JAMAL-HANJANI, M.CONSTANTIN, T.SALARI, R.SWANTON, C.: "Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution", NATURE, vol. 545, no. 7655, 2017, pages 446 - 451, XP055409582, DOI: 10.1038/nature22364
ATILANO, S. R.UDAR, N.SATALICH, T. A.UDAR, V.CHWA, M.KENNEY, M. C.: "Low frequency mitochondrial DNA heteroplasmy SNPs in blood, retina, and [RPE+ choroid] of age-related macular degeneration subjects", PLOS ONE, vol. 16, no. 1, 2021, pages e0246114
CHABON, J. J., SIMMONS, A. D., LOVEJOY, A. F., ESFAHANI, M. S., NEWMAN, A. M., HARINGSMA, H. J., DIEHN, M.: "Circulating tumour DNA profiling reveals heterogeneity of EGFR inhibitor résistance mechanisms in lung cancer patients", NATURE COMMUNICATIONS, vol. 7, no. 1, 2016, pages 1 - 15
CHATTERTON, Z.MENDELEV, N.CHEN, S.RAJ, T.WALKER, R.CARR, W.HAGHIGHI, F.: "Brain-derived circulating cell-free DNA defines the brain region and cell specific origins associated with neuronal atrophy", BIORXIV, 2019, pages 538827
CHENG, A. P.CHENG, M. P.LOY, C. J.LENZ, J. S.CHEN, K.BURNHAM P.TIMBLIN M.OREJAS J L.SILVERMAN E.MARTY F M.: "Cell-free DNA Profiling Informs Major Complications of Hematopoietic Cell Transplantation", BIORXIV, 2020
COURAUD, S., VACA-PANIAGUA, F., VILLAR, S., OLIVER, J., SCHUSTER, T., BLANCHE, H., SOUQUET, P. J.: "Noninvasive diagnosis of actionable mutations by deep sequencing of circulating free DNA in lung cancer from never-smokers- a proof-of-concept study from BioCAST/IFCT-1002", CLINICAL CANCER RESEARCH, vol. 20, no. 17, 2014, pages 4613 - 4624, XP055813405, DOI: 10.1158/1078-0432.CCR-13-3063
DE FRAIPONT, F.GAZZERI, S.CHO, W. C.EYMIN, B.: "Circular RNAs and RNA splice variants as biomarkers for prognosis and therapeutic response in the liquid biopsies of lung cancer patients", FRONTIERS IN GENETICS, vol. 10, 2019, pages 390
FERRERO, L.CAMERON, B.CROUZET, J.: "Analysis of gyrA and grIA mutations in stepwise-selected ciprofloxacin-resistant mutants of Staphylococcus aureus", ANTIMICROBIAL AGENTS AND CHEMOTHERAPY, vol. 39, no. 7, 1995, pages 1554 - 1558
FIALA, C.DIAMANDIS, E. P.: "Utility of circulating tumor DNA in cancer diagnostics with emphasis on early détection", BMCMEDICINE, vol. 16, no. 1, 2018, pages 1 - 10
FLANDROIS, J. P.LINA, G.DUMITRESCU, O.: "MUBII-TB-DB- a database of mutations associated with antibiotic résistance in Mycobacterium tuberculosis", BMC BIOINFORMATICS, vol. 15, no. 1, 2014, pages 1 - 9, XP021181401, DOI: 10.1186/1471-2105-15-107
FORSHEW, T., MURTAZA, M., PARKINSON, C., GALE, D., TSUI, D. W., KAPER, F., ROSENFELD, N.: "Noninvasive identification and monitoring of cancer mutations by targeted deep sequencing of plasma DNA", SCIENCE TRANSLATIONAL MEDICINE, vol. 4, no. 136, 2012, pages 136 - 136, XP055450222, DOI: 10.1126/scitranslmed.3003726
FREDEBOHM, J.MEHNERT, D. H.LOBER, A. K.HOLTRUP, F.VAN RAHDEN, V.ANGENENDT, P.DIEHL, F.: "Circulating Nucleic Acids in Serum and Plasma-CNAPS", vol. IX, 2016, SPRINGER, article "Détection and quantification of KIT mutations in ctDNA by plasma safe-seqS", pages: 187 - 189
GALE, D., LAWSON, A. R., HOWARTH, K., MADI, M., DURHAM, B., SMALLEY, S., ROSENFELD, N.: "Development of a highly sensitive liquid biopsy platform to detect clinically-relevant cancer mutations at low allele fractions in cell-free DNA", PLOS ONE, vol. 13, no. 3, 2018, pages e0194630
GLENN, T. C.: "Field guide to next-generation DNA sequencers", MOLECULAR ECOLOGY RESOURCES, vol. 11, no. 5, 2011, pages 759 - 769, XP055064385, DOI: 10.1111/j.1755-0998.2011.03024.x
GONZÂLEZ-BILLALABEITIA, E.CONTEDUCA, V.WETTERSKOG, D.JAYARAM, A.ATTARD, G.: "Circulating tumor DNA in advanced prostate cancer- transitioning from discovery to a clinically implemented test", PROSTATE CANCER AND PROSTATIC DISEASES, vol. 22, no. 2, 2019, pages 195 - 205, XP036781294, DOI: 10.1038/s41391-018-0098-x
HOW-KIT, A.MAZALEYRAT, N.DAUNAY, A.NIELSEN, H. M.TERRIS, B.TOST, J.: "Sensitive Détection of KRAS Mutations Using Enhanced-ice-COLD-PCR Mutation Enrichment and Direct Sequence Identification", HUMAN MUTATION, vol. 34, no. 11, 2013, pages 1568 - 1580
HUANG JR-KAI ET AL: "A new primer construction technique that effectively increases amplification of rare mutant templates in samples", vol. 19, no. 1, 23 August 2019 (2019-08-23), XP055928683, Retrieved from the Internet <URL:https://link.springer.com/article/10.1186/s12896-019-0555-1/fulltext.html> DOI: 10.1186/s12896-019-0555-1 *
HUANG, J. K.FAN, L.WANG, T. Y.WU, P. S.: "A new primer construction technique that effectively increases amplification of rare mutant templates in samples", BMC BIOTECHNOLOGY, vol. 19, no. 1, 2019, pages 1 - 11, XP055928683, DOI: 10.1186/s12896-019-0555-1
ILIÉ, M.HOFMAN, P.: "Pros- Can tissue biopsy be replaced by liquid biopsy?", TRANSLATIONAL LUNG CANCER RESEARCH, vol. 5, no. 4, 2016, pages 420
KENNEDY, S. R., SCHMITT, M. W., FOX, E. J., KOHRN, B. F., SALK, J. J., AHN, E. H., LOEB, L. A.: "Detecting ultralow-frequency mutations by Duplex Sequencing", NATURE PROTOCOLS, vol. 9, no. 11, 2014, pages 2586 - 2606, XP055745195, DOI: 10.1038/nprot.2014.170
KERAITE, I.ALVAREZ-GARCIA, V.GARCIA-MURILLAS, I.BEANEY, M.TURNER, N. C.BARTOS, C.LESLIE, N. R.: "PIK3CA mutation enrichment and quantitation from blood and tissue", SCIENTIFIC REPORTS, vol. 10, no. 1, 2020, pages 1 - 12, XP055914661, DOI: 10.1038/s41598-020-74086-w
KHUSH, K. K., PATEL, J., PINNEY, S., KAO, A., ALHARETHI, R., DEPASQUALE, E., KOBASHIGAWA, J.: "Noninvasive détection of graft injury after heart transplant using donor-derived cell-free DNA- a prospective multicenter study", AMERICAN JOURNAL OF TRANSPLANTATION, vol. 19, no. 10, 2019, pages 2889 - 2899
KINDE I. ET AL: "Detection and quantification of rare mutations with massively parallel sequencing", vol. 108, no. 23, 7 June 2011 (2011-06-07), pages 9530 - 9535, XP055855692, ISSN: 0027-8424, Retrieved from the Internet <URL:https://www.pnas.org/content/pnas/108/23/9530.full.pdf> DOI: 10.1073/pnas.1105422108 *
KINDE, I.WU, J.PAPADOPOULOS, N.KINZLER, K. W.VOGELSTEIN, B.: "Détection and quantification of rare mutations with massively parallel sequencing", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, vol. 108, no. 23, 2011, pages 9530 - 9535, XP055815700, DOI: 10.1073/pnas.1105422108
LI JMAKRIGIORGOS GM: "COLD-PCR- a new platform for highly improved mutation détection in cancer and genetic testing", BIOCHEM SOC TRANS., vol. 37, 2009, pages 427 - 32, XP009148613
LI, J.WANG, L.MAMON, H.KULKE, M. H.BERBECO, R.MAKRIGIORGOS, G. M.: "Replacing PCR with COLD-PCR enriches variant DNA sequences and redefines the sensitivity of genetic testing", NATURE MEDICINE, vol. 14, no. 5, 2008, pages 579 - 584, XP055001155, DOI: 10.1038/nm1708
M. W. SCHMITT ET AL: "Detection of ultra-rare mutations by next-generation sequencing: supporting Information", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, vol. 109, no. 36, 1 August 2012 (2012-08-01), pages 14508 - 14513, XP055161683, ISSN: 0027-8424, DOI: 10.1073/pnas.1208715109 *
MARTUSZEWSKI, A.PALUSZKIEWICZ, P.KRÔL, M.BANASIK, M.KEPINSKA, M.: "Donor-Derived Cell-Free DNA in Kidney Transplantation as a Potential Rejection Biomarker- A Systematic Literature Review", JOURNAL OF CLINICAL MEDICINE, vol. 10, no. 2, 2021, pages 193
MELNYK, A. H.WONG, A.KASSEN, R.: "The fitness costs of antibiotic résistance mutations", EVOLUTIONARY APPLICATIONS, vol. 8, no. 3, 2015, pages 273 - 283
MILBURY, C. A.LI, J.MAKRIGIORGOS, G. M.: "Ice-COLD-PCR enables rapid amplification and robust enrichment for low-abundance unknown DNA mutations", NUCLEIC ACIDS RESEARCH, vol. 39, no. 1, 2011, pages e2 - e2
MIRKOV, M. U.VERSTOCKT, B.CLEYNEN, I.: "Genetics of inflammatory bowel disease-beyond NOD2", THE LANCET GASTROENTEROLOGY & HEPATOLOGY, vol. 2, no. 3, 2017, pages 224 - 234
NARAYAN, A.CARRIERO, N. J.GETTINGER, S. N.KLUYTENAAR, J.KOZAK, K. R.YOCK, T. I.PATEL, A. A.: "Ultrasensitive measurement of hotspot mutations in tumor DNA in blood using error-suppressed multiplexed deep sequencing", CANCER RESEARCH, vol. 72, no. 14, 2012, pages 3492 - 3498, XP055407873, DOI: 10.1158/0008-5472.CAN-11-4037
NEWMAN, A. M., BRATMAN, S. V., TO, J., WYNNE, J. F., ECLOV, N. C., MODLIN, L. A., DIEHN, M.: "An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage", NATURE MEDICINE, vol. 20, no. 5, 2014, pages 548 - 554, XP055580741, DOI: 10.1038/nm.3519
NEWMAN, A. M.LOVEJOY, A. F.KLASS, D. M.KURTZ, D. M.CHABON, J. J.SCHERER, F.ALIZADEH, A. A.: "Integrated digital error suppression for improved détection of circulating tumor DNA", NATURE BIOTECHNOLOGY, vol. 34, no. 5, 2016, pages 547 - 555, XP055802486, DOI: 10.1038/nbt.3520
NICOLAS, G.ACUNA-HIDALGO, R.KEOGH, M. J.QUENEZ, O.STEEHOUWER, M.LELIEVELD, S.HOISCHEN, A.: "Somatic variants in autosomal dominant genes are a rare cause of sporadic Alzheimer's disease", ALZHEIMER'S & DEMENTIA, vol. 14, no. 12, 2018, pages 1632 - 1639, XP085545878, DOI: 10.1016/j.jalz.2018.06.3056
NILSSON, R. J. A.KARACHALIOU, N.BERENGUER, J.GIMENEZ-CAPITAN, A.SCHELLEN, P.TEIXIDO, C.WURDINGER, T.: "Rearranged EML4-ALK fusion transcripts sequester in circulating blood platelets and enable blood-based crizotinib response monitoring in non-small-cell lung cancer", ONCOTARGET, vol. 7, no. 1, 2016, pages 1066
OLAFSSON, S., MCLNTYRE, R. E., COORENS, T., BUTLER, T., JUNG, H., ROBINSON, P. S., ANDERSON, C.A.: "Somatic evolution in non-neoplastic IBD-affected colon", CELL, vol. 182, no. 3, 2020, pages 672 - 684, XP086239967, DOI: 10.1016/j.cell.2020.06.036
POOLE, J. C.WU, S. F.LU, T. T.VIBAT, C. R. T.PHAM, A.SAMUELSZ, E.ARNOLD, L. J.: "Analytical validation of the Target Selector ctDNA platform featuring single copy détection sensitivity for clinically actionable EGFR, BRAF, and KRAS mutations", PLOS ONE, vol. 14, no. 10, 2019, pages e0223112
QIN, Z.LJUBIMOV, V. A.ZHOU, C.TONG, Y.LIANG, J.: "Cell-free circulating tumor DNA in cancer", CHINESE JOURNAL OF CANCER, vol. 35, no. 1, 2016, pages 1 - 9, XP055618341, DOI: 10.1186/s40880-016-0092-4
QING WANG ET AL: "Targeted sequencing of both DNA strands barcoded and captured individually by RNA probes to identify genome-wide ultra-rare mutations", SCIENTIFIC REPORTS, vol. 7, no. 1, 13 June 2017 (2017-06-13), XP055551336, DOI: 10.1038/s41598-017-03448-8 *
ROSS, K. A.: "Coherent somatic mutation in autoimmune disease", PLOS ONE, vol. 9, no. 7, 2014, pages el01093
SAVOLA, P.KELKKA, T.RAJALA, H. L.KUULIALA, A.KUULIALA, K.ELDFORS, S.MUSTJOKI, S.: "Somatic mutations in clonally expanded cytotoxic T lymphocytes in patients with newly diagnosed rheumatoid arthritis", NATURE COMMUNICATIONS, vol. 8, no. 1, 2017, pages 1 - 14
SCHMITT MICHAEL W. ET AL: "Detection of ultra-rare mutations by next-generation sequencing", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, vol. 109, no. 36, 1 August 2012 (2012-08-01), pages 14508 - 14513, XP055928698, ISSN: 0027-8424, DOI: 10.1073/pnas.1208715109 *
SCHMITT, M. W.KENNEDY, S. R.SALK, J. J.FOX, E. J.HIATT, J. B.LOEB, L. A.: "Détection of ultra-rare mutations by next-generation sequencing", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, vol. 109, no. 36, 2012, pages 14508 - 14513, XP055928698, DOI: 10.1073/pnas.1208715109
SCHULTZ, M. D., HE, Y., WHITAKER, J. W., HARIHARAN, M., MUKAMEL, E. A., LEUNG, D., ECKER, J.R.: "Human body epigenome maps reveal noncanonical DNA methylation variation", NATURE, vol. 523, no. 7559, 2015, pages 212 - 216
SCHWARZENBACH, H.STOEHLMACHER, J.PANTEL, K.GOEKKURT, E.: "Détection and monitoring of cell-free DNA in blood of patients with colorectal cancer", ANNALS OF THE NEW YORK ACADEMY OF SCIENCES, vol. 1137, no. 1, 2008, pages 190 - 196, XP055176456, DOI: 10.1196/annals.1448.025
SHAGIN, D. A.REBRIKOV, D. V.KOZHEMYAKO, V. B.ALTSHULER, I. M.SHCHEGLOV, A. S.ZHULIDOV, P. A.LUKYANOV, S.: "A novel method for SNP détection using a new duplex-specific nuclease from crab hepatopancreas", GENOME RESEARCH, vol. 12, no. 12, 2002, pages 1935 - 1942, XP001140935, DOI: 10.1101/gr.547002
SONG, C., LIU, Y., FONTANA, R., MAKRIGIORGOS, A., MAMON, H., KULKE, M. H., MAKRIGIORGOS, G. M.: "Elimination of unaltered DNA in mixed clinical samples via nuclease-assisted minor-allele enrichment", NUCLEIC ACIDS RESEARCH, vol. 44, no. 19, 2016, pages e146 - e146
STROUN, M.ANKER, P.LYAUTEY, J.LEDERREY, C.MAURICE, P. A.: "Isolation and characterization of DNA from the plasma of cancer patients", EUROPEAN JOURNAL OF CANCER AND CLINICAL ONCOLOGY, vol. 23, no. 6, 1987, pages 707 - 712, XP026200933, DOI: 10.1016/0277-5379(87)90266-5
TIE, J.KINDE, I.WANG, Y.WONG, H. L.ROEBERT, J.CHRISTIE, M.GIBBS, P.: "Circulating tumor DNA as an early marker of therapeutic response in patients with metastatic colorectal cancer", ANNALS OF ONCOLOGY, vol. 26, no. 8, 2015, pages 1715 - 1722, XP055464341, DOI: 10.1093/annonc/mdv177
TIE, J.WANG, Y.TOMASETTI, C.LI, L.SPRINGER, S.KINDE, I.GIBBS, P.: "Circulating tumor DNA analysis detects minimal residual disease and predicts récurrence in patients with stage II colon cancer", SCIENCE TRANSLATIONAL MEDICINE, vol. 8, no. 346, 2016, pages 346 - 346, XP055464325, DOI: 10.1126/scitranslmed.aaf6219
UCHIDA, J.KATO, K.KUKITA, Y.KUMAGAI, T.NISHINO, K.DAGA, H.IMAMURA, F.: "Diagnostic accuracy of noninvasive genotyping of EGFR in lung cancer patients by deep sequencing of plasma cell-free DNA", CLINICAL CHEMISTRY, vol. 61, no. 9, 2015, pages 1191 - 1196

Also Published As

Publication number Publication date
EP4409034A1 (fr) 2024-08-07
FR3127504A1 (fr) 2023-03-31

Similar Documents

Publication Publication Date Title
US10533219B2 (en) Compositions and methods for identifying nucleic acid molecules
JP2022512058A (ja) ヌクレアーゼを利用したrna枯渇
JP2021176302A (ja) 腫瘍のディープシークエンシングプロファイリング
CN110392739B (zh) 检测dna突变的测序方法
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
EP0713922A1 (fr) Oligonucléotide utilisable comme amorce dans une méthode d&#39;amplification basée sur une réplication avec déplacement de brin
CA2159064A1 (fr) Oligonucleotide chimere et son utilisation dans l&#39;obtention de transcrits d&#39;un acide nucleique
JP2022120043A (ja) 単一方向デュアルプローブプライマー伸長による標的濃縮
Lin et al. Degraded RNA transcript stable regions (StaRs) as targets for enhanced forensic RNA body fluid identification
JP2021503947A (ja) 二本鎖dnaを増幅するための方法およびキット
JP2019520802A (ja) Metエキソン14欠失の検出と、関連する治療法
JP2017506500A (ja) 遺伝子アリルを同定するための方法及びプローブ
CN111154845A (zh) 借助于茎环反向多核苷酸的直接rna纳米孔测序
JP2023512522A (ja) 標的化された核酸捕捉のためのシステムおよび方法
WO2013079649A1 (fr) Procédé et kit pour la caractérisation d&#39;arn dans une composition
WO2020159608A1 (fr) Détection peu onéreuse de la variation génétique à faible fréquence
WO2023052735A1 (fr) Méthode de détection de mutations rares sur biopsie liquide
US20220220470A1 (en) Probe-capture method for tcr alpha and beta chain vdj-recovery from oligo-dt reverse transcribed rna
EP4097254A1 (fr) Procede de genotypage hla simple et rapide
WO2015001056A1 (fr) Kit et methode de detection in vitro du rhesus d
JP2005323565A (ja) 標的dna配列において一塩基変異多型の存在を検出する方法及びキット
WO2024117970A1 (fr) Procédé de détection multiplex et de quantification efficaces de modifications génétiques
EP4028548A1 (fr) Procédé de génotypage adapté au traitement d&#39;un grand nombre d&#39;échantillons, notamment en cas de polymorphisme élevé
JP2024149636A (ja) ヌクレアーゼを利用したrna枯渇
KR20240150780A (ko) 표적 핵산 포획 및 바코딩을 위한 시스템 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22790339

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2022790339

Country of ref document: EP

Effective date: 20240430