PROCEDE DE GENOTYPAGE ADAPTE AU TRAITEMENT SIMULTANE D'UN GRAND NOMBRE DEGENOTYPING PROCESS SUITABLE FOR SIMULTANEOUS PROCESSING OF A LARGE NUMBER OF
PATIENTS PATIENTS
L'invention a trait à un procédé de génotypage permettant de traiter simultanément un grand nombre de patients. Plus particulièrement, elle concerne un procédé de génotypage comportant une première étape d'amplification par PCR indexée puis une seconde étape de séquençage à haut débit, ce procédé est simple, rapide et moins coûteux que les procédés de l'état de la technique. The invention relates to a genotyping method for simultaneously treating a large number of patients. More particularly, it relates to a genotyping method comprising a first step of amplification by indexed PCR then a second step of high throughput sequencing, this method is simple, rapid and less expensive than the methods of the state of the art.
Domaine technique Technical area
Le séquençage à haut débit (aussi appelé NGS pour Next Génération Sequencing) permet d'opérer en parallèle un très grand nombre de séquences courtes. Le principe de cette technique est le suivant : les séquences à analyser sont tout d'abord préparées par ajout de séquences adaptatrices aux extrémités. Elles sont ensuite fixées sur un support solide via ces séquences adaptatrices et chaque fragment est enrichi pour former des « clusters » clonaux qui seront séquencés par la suite. À chaque cycle, l'ajout d'un nucléotide se traduit par un signal fluorescent associé à chacun des quatre nucléotides de l'ADN. Ces signaux sont ensuite analysés par un logiciel de traitement de données qui restitue le résultat de la lecture des séquences. Cette méthode est rapide et précise. High throughput sequencing (also called NGS for Next Generation Sequencing) allows a very large number of short sequences to be operated in parallel. The principle of this technique is as follows: the sequences to be analyzed are first of all prepared by adding adapter sequences to the ends. They are then fixed on a solid support via these adapter sequences and each fragment is enriched to form clonal “clusters” which will be sequenced subsequently. At each cycle, the addition of a nucleotide results in a fluorescent signal associated with each of the four nucleotides of DNA. These signals are then analyzed by a data processing software which restores the result of the reading of the sequences. This method is fast and precise.
Afin d'assurer la stabilité des duplex d'ADN hydridés lorsque la température de demi- dénaturation (Tm) est élevée, notamment en cas de multiplexage élevé, des bases LNA™ (Locked Nucleic Acid) sont ajoutées, notamment dans la méthode NGS développée par la société Fluidigm. Ces bases sont des oligonucléotides modifiés qui obéissent aux règles d'appariement des bases de Watson-Crick et forment des duplex, lesquels sont significativement plus stables que des duplex similaires formés par des oligonucléotides non modifiés. Ainsi, la sensibilité de discrimination entre des allèles ne présentant que des différences mineures, voire un seul nucléotide différent, est possible. Cette technique est particulièrement adaptée lorsque le polymorphisme est très élevé. In order to ensure the stability of the hydridated DNA duplexes when the half-denaturation temperature (Tm) is high, in particular in the event of high multiplexing, LNA ™ (Locked Nucleic Acid) bases are added, in particular in the NGS method developed. by the company Fluidigm. These bases are modified oligonucleotides which obey Watson-Crick base pairing rules and form duplexes, which are significantly more stable than similar duplexes formed by unmodified oligonucleotides. Thus, the sensitivity of discrimination between alleles exhibiting only minor differences, or even a single different nucleotide, is possible. This technique is particularly suitable when the polymorphism is very high.
Cette technologie NGS est largement utilisée en recherche, comme en diagnostic. Elle permet de séquencer des génomes entiers. Elle constitue ainsi un outil très performant et représente une aide au diagnostic de maladies génétiques et oncologiques par exemple. This NGS technology is widely used in research and diagnostics. It makes it possible to sequence entire genomes. It thus constitutes a very powerful tool and represents an aid in the diagnosis of genetic and oncological diseases for example.
Afin de permettre la lecture de séquences cibles, comme ceci est le cas pour le diagnostic, une librairie de séquences est préparée en amont du séquençage afin d'enrichir la librairie en séquences d'intérêt. Cette amplification de séquences est réalisée par réaction de polymérase en chaîne (PCR).
Comme le séquençage NGS permet de lire un grand nombre de séquences simultanément, il est intéressant de mélangerdes échantillons provenant de patients différents. Afin d'identifier les séquences provenant d'un même échantillon, celles-ci peuvent être étiquetées lors de l'étape d'amplification par l'ajout de séquences étiquettes ou « index ». La méthode de PCR indexée est connue de l'homme du métier et décrite par exemple dans l'article de Stahlberg A. et al. (Nucleic Acid Research, 2016, vol.44, No.11) In order to allow reading of target sequences, as is the case for diagnosis, a library of sequences is prepared upstream of the sequencing in order to enrich the library with sequences of interest. This sequence amplification is carried out by polymerase chain reaction (PCR). As NGS sequencing allows a large number of sequences to be read simultaneously, it is beneficial to mix samples from different patients. In order to identify the sequences originating from the same sample, these can be labeled during the amplification step by adding label or “index” sequences. The indexed PCR method is known to those skilled in the art and described for example in the article by Stahlberg A. et al. (Nucleic Acid Research, 2016, vol.44, No. 11)
Le document EP 2599877 décrit une méthode de séquençage comprenant une première étape de PCR pendant laquelle les séquences sont marquées à l'aide d'un index puis une seconde étape de séquençage de deuxième génération. Lors du séquençage, une stratégie de cisaillement incomplet de l'ADN est mise en œuvre pour augmenter l'amplitude de lecture des séquences. Document EP 2599877 describes a sequencing method comprising a first PCR step during which the sequences are marked using an index then a second second generation sequencing step. During sequencing, a strategy of incomplete DNA shearing is implemented to increase the amplitude of the reading of the sequences.
Le séquençage NGS bien que très puissant en termes de capacité de séquençage présente des inconvénients. Le principal obstacle est la durée de réalisation d'un génotypage depuis la préparation de l'échantillon jusqu'à l'obtention du résultat qui s'étale sur plusieurs jours. NGS sequencing although very powerful in terms of sequencing capacity has drawbacks. The main obstacle is the time it takes to perform genotyping from sample preparation to obtaining the result, which takes several days.
Il existe un besoin de disposer d'une méthode de séquençage précise et rapide à coût raisonnable. There is a need for an accurate and rapid sequencing method at reasonable cost.
Exposé de l'invention Disclosure of the invention
La présente invention concerne une méthode de génotypage adaptée au traitement simultané d'un grand nombre d'échantillons d'ADN provenant de patients comprenant : a. une étape d'amplification de l'ADN provenant de chaque patient par une réaction de polymérisation en chaîne (PCR) indexée, o dans laquelle les amorces spécifiques comprennent en 3' une séquence stabilisatrice comprenant entre 8 et 12 nucléotides parmi lesquels 45% à 65% sont des G ou C ; b. une étape de séquençage à haut débit de type NGS dans laquelle les amorces de séquençage ne contiennent pas de base LNA™ mais une séquence complémentaire de ladite séquence stabilisatrice. The present invention relates to a genotyping method suitable for the simultaneous processing of a large number of DNA samples from patients comprising: a. a step of amplifying the DNA from each patient by an indexed polymerase chain reaction (PCR), in which the specific primers comprise in 3 'a stabilizing sequence comprising between 8 and 12 nucleotides among which 45% to 65 % are G or C; b. a high-throughput NGS-type sequencing step in which the sequencing primers do not contain an LNA ™ base but a sequence complementary to said stabilizing sequence.
Pour stabiliser les duplex lors du séquençage, les inventeurs ont introduit des séquences d'une dizaine de nucléotides aux extrémités des amorces. Cet ajout permet de se passer des bases modifiées tout en conservant une grande fiabilité de lecture lors du séquençage. To stabilize the duplexes during sequencing, the inventors introduced sequences of around ten nucleotides at the ends of the primers. This addition makes it possible to dispense with modified bases while maintaining high reading reliability during sequencing.
La présente invention concerne également un kit de génotypage pour la mise en œuvre successive d'une PCR indexée et d'un séquençage à haut débit de type NGS, ainsi qu'un mélange réactionnel pour séquençage NGS sans utilisation de bases LNA™.
Avantages de l'invention The present invention also relates to a genotyping kit for the successive implementation of an indexed PCR and high throughput sequencing of the NGS type, as well as a reaction mixture for NGS sequencing without the use of LNA ™ bases. Advantages of the invention
La méthode de génotypage selon l'invention présente plusieurs avantages : elle est simple, rapide et peu coûteuse et permet de traiter, en simultané, une grande série d'échantillons provenant de différents patients. The genotyping method according to the invention has several advantages: it is simple, rapid and inexpensive and makes it possible to process, simultaneously, a large series of samples from different patients.
Elle combine une PCR indexée avec un système de séquençage NGS (précision, rapidité). It combines an indexed PCR with an NGS sequencing system (precision, speed).
Cette méthode est simple, elle ne nécessite pas d'autre équipement lourd autre qu'une machine PCR et un équipement destiné au séquençage NGS. Elle est proposée sous la forme d'un kit prêt à l'emploi. Ce format limite les manipulations par l'expérimentateur et donc les risques d'erreur. Il permet aussi de gagner du temps en diminuant le nombre de gestes à effectuer. This method is simple, it does not require any other heavy equipment other than a PCR machine and equipment intended for NGS sequencing. It is offered as a ready-to-use kit. This format limits the manipulations by the experimenter and therefore the risks of error. It also saves time by reducing the number of actions to be performed.
Cette méthode est rapide du fait que l'amplification et l'indexation sont réalisées en une seule et même étape. A titre d'exemple, le résultat peut être obtenu en moins de 48 heures si l'on traite jusqu'à 96 échantillons en même temps et que l'on dispose d'une seule machine PCR. On comprend que le temps de traitement dépend de l'environnement technique (nombre de machines disponibles) et du nombre d'échantillons à traiter, mais que la méthode selon l'invention sera néanmoins plus rapide que les méthodes existantes jusqu'alors. This method is fast because the amplification and indexing are carried out in one and the same step. For example, the result can be obtained in less than 48 hours if you process up to 96 samples at the same time and have a single PCR machine. It is understood that the processing time depends on the technical environment (number of machines available) and on the number of samples to be processed, but that the method according to the invention will nevertheless be faster than the methods existing until then.
Cette méthode est peu coûteuse et permet de proposer une solution de génotypage en un seul locus ou un petit nombre de loci (généralement entre 1 et 5), simple à mettre en œuvre et très fiable, accessible au plus grand nombre. Elle a vocation à être déployée dans tous les laboratoires où un génotypage est pratiqué, par exemple dans les centres de recherches, dans les centres hospitaliers, les banques de sang et les centres de transfusion sanguine où elle s'inscrit dans une démarche de maîtrise des coûts de santé publique et de productivité. This method is inexpensive and makes it possible to propose a genotyping solution in a single locus or a small number of loci (generally between 1 and 5), simple to implement and very reliable, accessible to the greatest number of people. It is intended to be deployed in all laboratories where genotyping is carried out, for example in research centers, hospitals, blood banks and blood transfusion centers where it is part of a process of controlling public health and productivity costs.
Elle permet de diagnostiquer un grand nombre de patients en même temps, ce qui est rentable à la fois en termes de temps et de coût. Dans la version actuelle de la méthode, notamment sous forme du kit, il est possible de génotyper simultanément de 2 à 384 patients. Les échantillons étant traités en plaques de 96 puits, il est préféré de traiter un multiple de 96 échantillons (96, 192, 288, 384). It allows a large number of patients to be diagnosed at the same time, which is profitable both in terms of time and cost. In the current version of the method, in particular in kit form, it is possible to simultaneously genotype from 2 to 384 patients. Since the samples are processed in 96-well plates, it is preferred to process a multiple of 96 samples (96, 192, 288, 384).
Cette méthode est particulièrement applicable au génotypage de maladies dans lesquelles un seul gène est impliqué. Il peut s'agir de diagnostiquer des maladies héréditaires dans le cadre d'un diagnostic familial, diagnostic prénuptial ou prénatal, d'une étude de suivi de chimérisme post-greffe ou de diagnostiquer une cohorte de patients atteints de cancers sur quelques mutations-clés.
DESCRIPTION DETAILLEE DE L'INVENTION This method is particularly applicable to the genotyping of diseases in which a single gene is involved. This may involve diagnosing hereditary diseases as part of a family diagnosis, prenuptial or prenatal diagnosis, a post-transplant chimerism follow-up study or diagnosing a cohort of cancer patients on a few key mutations. . DETAILED DESCRIPTION OF THE INVENTION
Un premier objet de l'invention concerne une méthode de génotypage adaptée au traitement simultané d'un grand nombre de patients comprenant : a. une étape d'amplification de l'ADN par une réaction de polymérisation en chaîne (PCR) indexée, o dans laquelle les amorces spécifiques comprennent en 3' une séquence stabilisatrice comprenant de 8 à 12 nucléotides parmi lesquels 45 à 65 % sont des G ou C ; b. une étape de séquençage à haut débit de type NGS dans laquelle les amorces de séquençage ne contiennent pas de base LNA™ mais une séquence complémentaire de ladite séquence stabilisatrice. A first object of the invention relates to a genotyping method suitable for the simultaneous treatment of a large number of patients comprising: a. a step of amplifying the DNA by an indexed polymerase chain reaction (PCR), in which the specific primers comprise at 3 ′ a stabilizing sequence comprising from 8 to 12 nucleotides among which 45 to 65% are G or VS ; b. a high-throughput NGS-type sequencing step in which the sequencing primers do not contain an LNA ™ base but a sequence complementary to said stabilizing sequence.
Par « séquence stabilisatrice » au sens de l'invention, on entend une séquence de 8 à 12 nucléotides, à savoir 8, 9, 10, 11 ou 12 nucléotides. De plus, ces séquences sont riches en G et C c'est-à-dire qu'elles contiennent entre 45% et 65% de bases G et/ou C. Un amplicon contient donc deux séquences stabilisatrices qui joueront des rôles différents pendant le séquençage : l'une s'hybridant à une amorce de séquençage et l'autre s'hybridant à une amorce de lecture. Des exemples de séquences stabilisatrices utilisables selon l'invention sont les séquences SEQ ID No.l et SEQ. ID No.2. Ces exemples sont non limitatifs car l'homme du métier saura combiner les bases pour modifier la séquence de la séquence stabilisatrice. For the purposes of the invention, the term “stabilizer sequence” means a sequence of 8 to 12 nucleotides, namely 8, 9, 10, 11 or 12 nucleotides. In addition, these sequences are rich in G and C, that is to say they contain between 45% and 65% of G and / or C bases. An amplicon therefore contains two stabilizing sequences which will play different roles during the sequencing: one hybridizing to a sequencing primer and the other hybridizing to a read primer. Examples of stabilizing sequences which can be used according to the invention are the sequences SEQ ID No. 1 and SEQ. ID No.2. These examples are non-limiting since those skilled in the art will know how to combine the bases in order to modify the sequence of the stabilizing sequence.
Dans un mode de réalisation préféré, les séquences stabilisatrices sont des séquences de 10 nucléotides. Dans un autre mode de réalisation préféré, les séquences stabilisatrices contiennent de 50% à 60% de bases G et/ou C. Par exemple, une séquence de 10 nucléotides contient 5 à 6 bases G et/ou C. In a preferred embodiment, the stabilizer sequences are sequences of 10 nucleotides. In another preferred embodiment, the stabilizer sequences contain 50% to 60% G and / or C bases. For example, a 10 nucleotide sequence contains 5 to 6 G and / or C bases.
L'étape a. d'amplification des séquences d'intérêt repose sur une technologie de PCR indexée permettant de générer simultanément les amplicons et de les marquer à l'aide d'une étiquette spécifique de l'échantillon. Elle peut être résumée comme suit : Step a. amplification of the sequences of interest is based on an indexed PCR technology making it possible to simultaneously generate the amplicons and to label them using a specific label of the sample. It can be summarized as follows:
1. Conception des couples d'amorces spécifiques des séquences alléliques à amplifier. 1. Design of the pairs of primers specific to the allelic sequences to be amplified.
2. Préparation des échantillons biologiques à analyser (normalisation de la concentration). 2. Preparation of biological samples to be analyzed (normalization of the concentration).
3. Réaction d'amplification des séquences par PCR avec ajout d'étiquettes spécifiques de l'échantillon (index) sur chaque séquence amplifiée. Cette réaction met en œuvre deux types d'amorces simultanément : o des couples d'amorces spécifiques des séquences à amplifier, ces amorces sens et antisens comprenant chacune une séquence universelle située à leur extrémité 3', caractérisées en ce que les
séquences universelles contiennent à l'extrémité 5' (entre l'amorce spécifique et la séquence universelle) une séquence stabilisatrice d'une dizaine de nucléotides (généralement entre 8 et 12 nucléotides) constituée de 45% à 65% de nucléotides G ou C; o des couples amorces sens et antisens comprenant au moins une première partie capable de s'hybrider avec les séquences universelles sens et antisens respectivement et une seconde partie comprenant une séquence pour un adaptateur nécessaire au séquençage, l'une des amorces sens ou antisens comprenant en outre un index positionné entre ces deux parties. 3. Amplification reaction of the sequences by PCR with addition of specific labels of the sample (index) on each amplified sequence. This reaction uses two types of primers simultaneously: o pairs of primers specific for the sequences to be amplified, these sense and antisense primers each comprising a universal sequence located at their 3 ′ end, characterized in that the universal sequences contain at the 5 ′ end (between the specific primer and the universal sequence) a stabilizing sequence of around ten nucleotides (generally between 8 and 12 nucleotides) consisting of 45% to 65% of G or C nucleotides; o pairs of sense and antisense primers comprising at least a first part capable of hybridizing with the universal sense and antisense sequences respectively and a second part comprising a sequence for an adapter necessary for sequencing, one of the sense or antisense primers comprising in in addition to an index positioned between these two parts.
4. Récupération, purification et quantification des produits de PCR indexés (amplicons) en vue de leur séquençage. 4. Recovery, purification and quantification of the indexed PCR products (amplicons) for their sequencing.
Dans un mode de réalisation préféré, les amorces spécifiques comprennent en outre une séquence universelle située en 3' de ladite séquence stabilisatrice. In a preferred embodiment, the specific primers further comprise a universal sequence located 3 'of said stabilizer sequence.
Par « séquence universelle » au sens de l'invention, on entend une séquence définie qui sera utilisée dans tous les amplicons. Ces séquences jouent deux rôles : d'une part, elles permettent l'hybridation des amorces d'indexation en vue de l'ajout de l'index pendant l'étape d'amplification, et d'autre part elles permettent l'amplification des séquences en vue de leur lecture pendant l'étape de séquençage. La méthode met en réalité en œuvre deux types de séquences universelles, une séquence sens et une séquence antisens de sorte à pouvoir définir l'orientation des séquences amplifiées. Des exemples de séquences universelles utilisables selon l'invention sont les séquences SEQ. ID No.3 et SEQ ID No.4. Ces exemples sont non limitatifs car l'homme du métier saura utiliser d'autres séquences en tant que séquences universelles. By “universal sequence” within the meaning of the invention, is meant a defined sequence which will be used in all the amplicons. These sequences play two roles: on the one hand, they allow the hybridization of the indexing primers with a view to adding the index during the amplification step, and on the other hand they allow the amplification of the indexing primers. sequences for reading during the sequencing step. The method actually implements two types of universal sequences, a sense sequence and an antisense sequence so as to be able to define the orientation of the amplified sequences. Examples of universal sequences which can be used according to the invention are the sequences SEQ. ID No.3 and SEQ ID No.4. These examples are non-limiting since those skilled in the art will know how to use other sequences as universal sequences.
Dans un mode de réalisation encore plus préféré, l'étape d'amplification met en outre en œuvre des couples d'amorces destinés à l'indexation (dites « amorces d'indexation ») des séquences amplifiées, lesdites amorces comprenant : a. au moins une première partie capable de s'hybrider avec les séquences universelles amplifiées grâce aux amorces spécifiques et b. une seconde partie comprenant une séquence pour un adaptateur nécessaire au séquençage, l'une des amorces sens ou antisens comprenant en outre un index positionné entre ces deux parties. In an even more preferred embodiment, the amplification step also implements pairs of primers intended for indexing (called “indexing primers”) of the amplified sequences, said primers comprising: a. at least a first part capable of hybridizing with the universal sequences amplified by virtue of the specific primers and b. a second part comprising a sequence for an adapter necessary for sequencing, one of the sense or antisense primers further comprising an index positioned between these two parts.
Par « index » au sens de l'invention, on entend une séquence utilisée en tant qu'étiquette ou code-barre. Dans le contexte d'un séquençage NGS, les index sont des séquences courtes polymorphes. Un index particulier unique est associé à chaque patient. Les échantillons provenant de différents patients, en particulier de 2 à 384 patients, étant mélangés lors du
séquençage, ces index servent à savoir à quel patient associer les séquences après analyse. Des exemples d'index utilisables selon l'invention sont les séquences SEQ ID No.5, SEQID No.6 et SEQ ID No.7. Ces exemples sont non limitatifs car l'homme du métier saura modifier ces index pour proposer une multitude de séquences uniques. By “index” within the meaning of the invention, is meant a sequence used as label or bar code. In the context of NGS sequencing, indexes are polymorphic short sequences. A unique particular index is associated with each patient. The samples from different patients, in particular from 2 to 384 patients, being mixed during the sequencing, these indexes are used to know to which patient to associate the sequences after analysis. Examples of indexes which can be used according to the invention are the sequences SEQ ID No.5, SEQID No.6 and SEQ ID No.7. These examples are non-limiting because those skilled in the art will know how to modify these indexes to provide a multitude of unique sequences.
Par « adaptateur nécessaire au séquençage » au sens de l'invention, on entend une séquence permettant la fixation des séquences sur un support en vue de leur séquençage conformément au protocole de séquençage NGS utilisé. Des exemples de séquences de fixation nécessaires pour le séquençage utilisables selon l'invention sont les séquences SEQ. ID No.8 et SEQ ID No.9. Il s'agit des adapteurs « P5 » et « P7 » proposés par la société Illumina® et adaptés au séquençage NGS. Ces exemples sont non limitatifs car l'homme du métier peut utiliser d'autres systèmes adaptateurs en fonction de la technologie NGS employée. By “adapter necessary for sequencing” within the meaning of the invention, is meant a sequence allowing the fixing of the sequences on a support with a view to their sequencing in accordance with the NGS sequencing protocol used. Examples of binding sequences necessary for the sequencing which can be used according to the invention are the sequences SEQ. ID No.8 and SEQ ID No.9. These adapters "P5" and "P7" proposed by Illumina ® company and adapted to the NGS sequencing. These examples are nonlimiting because the person skilled in the art can use other adapter systems depending on the NGS technology employed.
L'amplification des séquences d'ADN par PCR indexée permet l'obtention de produits PCR portant chacun une étiquette particulière spécifique de chaque patient. Ainsi, il est possible de regrouper et mélanger tous les produits PCR afin d'effectuer une seule réaction de séquençage. Le résultat du séquençage fournit alors deux informations par séquence : la lecture de la séquence d'intérêt et l'identification du patient auquel correspond cette séquence. The amplification of the DNA sequences by indexed PCR makes it possible to obtain PCR products each bearing a particular label specific to each patient. Thus, it is possible to pool and mix all the PCR products in order to perform a single sequencing reaction. The result of the sequencing then provides two pieces of information per sequence: the reading of the sequence of interest and the identification of the patient to whom this sequence corresponds.
Par la méthode selon l'invention, il est possible de réaliser un génotypage à un locus particulier pour 1 patient ou de préférence 2 à 384, et de manière encore plus préférée pour un multiple de 96 patients simultanément, à savoir 96, 192, 288 ou 384 patients. Il est également possible de détecter plusieurs mutations par patients (situées sur des régions distantes ou sur la même région) en utilisant plusieurs amorces simultanément dans un système d'amplification en multiplexage, donc sans diminuer le même nombre de patients traités simultanément. By the method according to the invention, it is possible to carry out genotyping at a particular locus for 1 patient or preferably 2 to 384, and even more preferably for a multiple of 96 patients simultaneously, namely 96, 192, 288 or 384 patients. It is also possible to detect several mutations per patient (located on distant regions or on the same region) by using several primers simultaneously in a multiplexing amplification system, therefore without reducing the same number of patients treated simultaneously.
La méthode de génotypage selon l'invention peut être réalisée indifféremment à partir d'ADN d'origine humaine ou animale. The genotyping method according to the invention can be carried out either from DNA of human or animal origin.
L'étape b. de séquençage repose sur une technologie de séquençage à haut débit telle que la technologie NGS développée notamment par la société Illumina®. Step b. sequencing is based on a high throughput sequencing technology such as the NGS technology developed in particular by the company Illumina ® .
Ce type de technologie impose une Tm déterminée (imposée par la technologie utilisée, en d'autres termes paramétrée par le fournisseur), ce qui implique d'intégrer des bases LNA™ dans les séquences lors de l'amplification pour que les duplex formés avec les amorces de séquençage et de lecture des index lors du séquençage soient stables. Or, l'ajout de ces bases LNA™ est coûteux et constituent des étapes supplémentaires dans la méthode. This type of technology imposes a determined Tm (imposed by the technology used, in other words parameterized by the supplier), which implies integrating LNA ™ bases in the sequences during amplification so that the duplexes formed with the primers for sequencing and reading the indexes during sequencing are stable. However, the addition of these LNA ™ bases is expensive and constitute additional steps in the method.
De manière très intéressante, les inventeurs ont démontré que des séquences d'une dizaine de nucléotides, appelées « séquences stabilisatrices » permettent de conserver un degré d'hybridation suffisant pour que le séquençage NGS se déroule correctement même lorsque
la température de demi-hybridation (Tm) est élevée. Ainsi, ils ont montré que l'effet stabilisateur des bases LNA™ peut être remplacé par l'ajout d'une séquence stabilisatrice et que cette séquence est suffisante pour le résultat du séquençage soit aussi fiable que lorsque des bases LNA™ sont utilisées. Le fait de s'affranchir de l'utilisation de bases LNA™ rend la méthode plus simple et moins coûteuse. Ainsi, la présente invention propose pour la première fois de combiner une PCR indexée avec un séquençage NGS dans une méthode simple à mettre en œuvre, et dont le coût est maîtrisé. Un kit prêt à l'emploi permet une mise en œuvre simplifiée de la méthode proposée. Very interestingly, the inventors have demonstrated that sequences of around ten nucleotides, called “stabilizing sequences” make it possible to maintain a sufficient degree of hybridization for the NGS sequencing to take place correctly even when the half-hybridization temperature (Tm) is high. Thus, they have shown that the stabilizing effect of LNA ™ bases can be replaced by the addition of a stabilizing sequence and that this sequence is sufficient for the result of the sequencing to be as reliable as when LNA ™ bases are used. The fact of dispensing with the use of LNA ™ bases makes the method simpler and less expensive. Thus, the present invention proposes for the first time to combine an indexed PCR with an NGS sequencing in a method that is simple to implement, and the cost of which is controlled. A ready-to-use kit allows a simplified implementation of the proposed method.
L'étape b. de la méthode selon l'invention est réalisée à l'aide des amorces de séquençage et de lecture d'index, dont aucune ne contient de bases LNA™ mais dont chacune contient une séquence stabilisatrice, à savoir : un couple d'amorces de séquençage s'hybridant aux séquences universelles et comprenant une séquence stabilisatrice positionnée à l'extrémité 5' ; ces amorces permettent d'amplifier les séquences d'intérêt pour le séquençage ; une amorce de lecture d'index s'hybridant à la séquence universelle juxtaposant l'index et comprenant une séquence stabilisatrice; cette amorce permet l'amplification de l'index pour identifier le patient duquel provient la séquence analysée. Step b. of the method according to the invention is carried out using the sequencing and index reading primers, none of which contains LNA ™ bases but each of which contains a stabilizing sequence, namely: a pair of sequencing primers hybridizing to the universal sequences and comprising a stabilizer sequence positioned at the 5 'end; these primers make it possible to amplify the sequences of interest for the sequencing; an index read primer hybridizing to the universal sequence juxtaposing the index and comprising a stabilizer sequence; this primer allows the amplification of the index to identify the patient from which the analyzed sequence originates.
Il est à noter que les séquences stabilisatrices des amorces de séquençage et de l'amorce de lecture d'index sont complémentaires des séquences stabilisatrices présentes sur les séquences amplifiées en vue du séquençage. En d'autres termes, ces séquences stabilisatrices ont les mêmes séquences que celles présentes dans les amorces spécifiques. It should be noted that the stabilizing sequences of the sequencing primers and of the index reading primer are complementary to the stabilizing sequences present on the sequences amplified with a view to sequencing. In other words, these stabilizing sequences have the same sequences as those present in the specific primers.
Dans un mode de réalisation particulier où l'index est positionné en 3' de la séquence à analyser, l'amorce de lecture d'index est complémentaire de la séquence universelle antisens et la séquence stabilisatrice est positionnée à son extrémité 3'. En d'autres termes, l'amorce antisens est utilisée en tant qu'amorce sens en amont de l'index. In a particular embodiment where the index is positioned at 3 ′ of the sequence to be analyzed, the index reading primer is complementary to the universal antisense sequence and the stabilizing sequence is positioned at its 3 ′ end. In other words, the reverse primer is used as a sense primer upstream of the index.
Des exemples de séquences d'amorces de séquençage utilisables selon l'invention sont les séquences SEQ. ID No.10 et SEQ ID No.11. Ces exemples sont non limitatifs car l'homme du métier peut proposer d'autres d'amorces de séquençage en fonction des séquences universelles encadrant les séquences à amplifier. Examples of sequences of sequencing primers which can be used according to the invention are the sequences SEQ. ID No.10 and SEQ ID No.11. These examples are non-limiting because a person skilled in the art can propose other sequencing primers as a function of the universal sequences flanking the sequences to be amplified.
Un second objet de l'invention concerne un kit de génotypage pour la mise en œuvre successive d'une PCR indexée et d'un séquençage à haut débit de type NGS sans utilisation de base LNA™ comprenant : une première série de contenants (de type tube PCR) comprenant chacun au moins un couple d'amorces spécifiques d'un locus d'intérêt à amplifier, ces amorces comprenant en 3' une séquence stabilisatrice comprenant de 8 à 12 nucléotides parmi
lesquels 45% à 65% sont des G ou C, la dite séquence stabilisatrice étant précédée d'une séquence universelle ; une deuxième série de contenants (de type tube PCR) comprenant chacun : o un couple d'amorces particulier permettant d'indexer chaque séquence amplifiée de manière patient-spécifique (amorces d'indexation), ces amorces comprenant au moins une première partie capable de s'hybrider avec lesdites séquences universelles amplifiées grâce aux amorces spécifiques et au moins une seconde partie comprenant une séquence pour un adaptateur nécessaire au séquençage, l'une des amorces sens ou antisens comprenant en outre un index positionné entre ces deux parties ; et o un mix d'amplification une troisième série de contenants (de type tube) comprenant un mélange réactionnel pour séquençage NGS sans base LNA™ comprenant un couple d'amorces pour le séquençage s'hybridant aux séquences universelles et une amorce pour la lecture de l'index, chacune de ces amorces comprenant une séquence s'hybridant avec une séquence stabilisatrice d'une amorce spécifique d'une amorce spécifique. A second object of the invention relates to a genotyping kit for the successive implementation of an indexed PCR and high throughput sequencing of the NGS type without the use of an LNA ™ base comprising: a first series of containers (of the NGS type. PCR tube) each comprising at least one pair of primers specific for a locus of interest to be amplified, these primers comprising in 3 'a stabilizing sequence comprising 8 to 12 nucleotides among which 45% to 65% are G or C, said stabilizing sequence being preceded by a universal sequence; a second series of containers (of PCR tube type) each comprising: hybridizing with said universal sequences amplified by virtue of the specific primers and at least a second part comprising a sequence for an adapter necessary for sequencing, one of the sense or antisense primers further comprising an index positioned between these two parts; and o an amplification mix a third series of containers (of the tube type) comprising a reaction mixture for NGS sequencing without LNA ™ base comprising a pair of primers for sequencing hybridizing to the universal sequences and a primer for the reading of the index, each of these primers comprising a sequence hybridizing with a stabilizing sequence of a specific primer of a specific primer.
Les tubes des première et deuxième séries sont utilisés pour la PCR indexée, leur nombre est donc identique. Au contraire, le mélange de la troisième série sert pour le séquençage et est le même pour toutes les réactions ; il peut être fourni dans un tube unique ou dans différents tubes, notamment autant de tubes que pour chacune des première et deuxième séries. The tubes of the first and second series are used for indexed PCR, so their number is the same. On the contrary, the mixture of the third series is used for sequencing and is the same for all reactions; it can be supplied in a single tube or in different tubes, in particular as many tubes as for each of the first and second series.
On peut associer plusieurs couples d'amorces spécifiques dans les tubes de la première série, de sorte à amplifier plusieurs mutations simultanément (multiplexage). On amplifiera ainsi 1, 2, 3, 4 et jusqu'à 5 mutations différentes à partir d'un même échantillon. Several pairs of specific primers can be associated in the tubes of the first series, so as to amplify several mutations simultaneously (multiplexing). We will thus amplify 1, 2, 3, 4 and up to 5 different mutations from the same sample.
Dans un autre mode de réalisation préféré, ce kit comprend en outre au moins un des éléments suivants : des mélanges réactionnels pour le séquençage NGS sans base LNA™, préférentiellement présentés en tubes, une notice d'utilisation. In another preferred embodiment, this kit further comprises at least one of the following elements: reaction mixtures for NGS sequencing without LNA ™ base, preferably presented in tubes, a user manual.
Par « mix d'amplification », on entend un mélange comprenant de la Taq polymérase, une solution tamponnée contenant du MgCh, des dNTPs (mélange des quatre désoxyribonucléotides : dATP (désoxy-adénine tri-phosphate), dCTP (désoxy-cytosine tri phosphate), dGTP (désoxy-guanine tri-phosphate), dTTP (désoxy-thymine tri-phosphate), une solution de DMSO et un tampon qui réduit l'adhésion des molécules sur le plastique. By “amplification mix” is meant a mixture comprising Taq polymerase, a buffered solution containing MgCh, dNTPs (mixture of the four deoxyribonucleotides: dATP (deoxy-adenine tri-phosphate), dCTP (deoxy-cytosine tri phosphate) ), dGTP (deoxy-guanine tri-phosphate), dTTP (deoxy-thymine tri-phosphate), a solution of DMSO and a buffer which reduces the adhesion of molecules to the plastic.
Dans un mode de réalisation particulier, le mélange réactionnel pour le séquençage NGS sans utilisation de base LNA™ comprend des amorces qui sont configurées comme suit :
une amorce de séquençage sens s'hybridant à la séquence universelle située en 5' de la séquence à analyser et comprenant une séquence stabilisatrice à son extrémité 5' ; une amorce de séquençage antisens s'hybridant à la séquence universelle située en 3' de la séquence à analyser et comprenant une séquence stabilisatrice à son extrémité 5' ; une amorce de lecture d'index s'hybridant à la séquence universelle juxtaposant l'index et comprenant une séquence stabilisatrice positionnée à l'une de ses extrémités. In a particular embodiment, the reaction mixture for NGS sequencing without the use of LNA ™ base comprises primers which are configured as follows: a forward sequencing primer hybridizing to the universal sequence located 5 'of the sequence to be analyzed and comprising a stabilizing sequence at its 5'end; an antisense sequencing primer hybridizing to the universal sequence located 3 'of the sequence to be analyzed and comprising a stabilizing sequence at its 5'end; an index read primer hybridizing to the universal sequence juxtaposing the index and comprising a stabilizer sequence positioned at one of its ends.
Dans un mode de réalisation encore plus particulier, l'amorce de lecture d'index est une amorce sens s'hybridant à la séquence universelle située en 3' de la séquence à analyser et comprenant une séquence stabilisatrice positionnée à son extrémité 3'. In an even more particular embodiment, the index reading primer is a forward primer hybridizing to the universal sequence located at 3 ′ of the sequence to be analyzed and comprising a stabilizing sequence positioned at its 3 ′ end.
Dans ce mélange, les deux amorces de séquençage aptes à s'hybrider aux séquences universelles situées de part et d'autre de la séquence à analyser permettent l'amplification de cette dernière tandis que l'amorce sens s'hybridant en aval de la séquence à analyser permet l'amplification de l'index pour identifier le patient duquel provient la séquence analysée. In this mixture, the two sequencing primers capable of hybridizing to the universal sequences located on either side of the sequence to be analyzed allow the amplification of the latter while the sense primer hybridizes downstream of the sequence. to be analyzed allows the amplification of the index to identify the patient from which the analyzed sequence originates.
Dans un mode de réalisation tout à fait particulier, le mélange réactionnel pour séquençage NGS sans utilisation de base LNA™ comprend : une amorce de séquençage sens de séquence SEQ ID No.10; une amorce de séquençage antisens de séquence SEQ. ID No.11; et une amorce de lecture d'index de séquence SEQ ID No. 12. In a very particular embodiment, the reaction mixture for NGS sequencing without the use of LNA ™ base comprises: a sense sequencing primer of sequence SEQ ID No.10; an antisense sequencing primer of sequence SEQ. ID No.11; and a SEQ ID No. 12 sequence index read primer.
La méthode selon l'invention, ainsi que le kit associé, sont particulièrement adaptés au génotypage d'un grand nombre de patients, en particulier de 2 à 384 patients, en une seule réaction. Toutefois les amplicons ne doivent pas être trop longs (de préférence < 500pb) et le multiplexage doit être modéré (entre 1 et 5, de préférence de 2 à 3 cibles par réaction PCR). Elle permet aux laboratoires de répondre à des questions récurrentes de génotypage en traitant simultanément un grand nombre de patients. The method according to the invention, as well as the associated kit, are particularly suitable for the genotyping of a large number of patients, in particular from 2 to 384 patients, in a single reaction. However, the amplicons should not be too long (preferably <500bp) and the multiplexing should be moderate (between 1 and 5, preferably 2 to 3 targets per PCR reaction). It allows laboratories to answer recurring genotyping questions by simultaneously treating a large number of patients.
Les différents modes de réalisation préférés décrits précédemment peuvent être combinés entre eux, deux par deux ou de manière plus étendue, jusqu'à constituer un mode de réalisation préféré combinant tous les modes préférés. The various preferred embodiments described above can be combined with one another, in pairs or in a more extensive manner, until constituting a preferred embodiment combining all the preferred embodiments.
La présente invention sera mieux comprise à la lecture des exemples qui suivent, fournis à titre d'illustration et ne devant en aucun cas être considérés comme limitant la portée de la présente invention. The present invention will be better understood on reading the examples which follow, provided by way of illustration and should in no case be considered as limiting the scope of the present invention.
BREVE DESCRIPTION DES FIGURES
Figure 1 : Représentation schématique des amorces utilisées et séquences amplifiées selon un mode de réalisation particulier de la présente invention. (A) amorces spécifiques, (B) séquences universelles et stabilisatrices, (C) Adaptateurs P5-P7 et Index, (D) amorce de séquençage Sens, (E) amorce de séquençage Anti sens, (E) amorce de lecture d'index. BRIEF DESCRIPTION OF THE FIGURES Figure 1: Schematic representation of the primers used and sequences amplified according to a particular embodiment of the present invention. (A) Specific Primers, (B) Universal and Stabilizer Sequences, (C) P5-P7 and Index Adapters, (D) Sense Sequencing Primer, (E) Antisense Sequencing Primer, (E) Index Read Primer .
Figure 2 : Représentation d'une séquence amplifiée en tant que descriptif d'un mode de réalisation particulier. Figure 2: Representation of an amplified sequence as a description of a particular embodiment.
EXEMPLE EXAMPLE
EXEMPLE 1 : Principe de la méthode de génotypage NGS sans base LIMA™ EXAMPLE 1: Principle of the NGS genotyping method without LIMA ™ base
1. Amplification des séquences d'intérêt par PCR indexée 1. Amplification of sequences of interest by indexed PCR
A partir de variants alléliques ou de mutations connus dans un système biologique défini, des séquences d'intérêt sont identifiées en vue du génotypage. From known allelic variants or mutations in a defined biological system, sequences of interest are identified for genotyping.
Des couples d'amorces spécifiques des séquences alléliques ou mutants à amplifier sont conçus et validés. Ces amorces permettront l'amplification des séquences d'intérêt. Primer pairs specific for the allelic or mutant sequences to be amplified are designed and validated. These primers will allow the amplification of the sequences of interest.
Les échantillons biologiques à analyser sont préparés en vue de la PCR, l'ADN est extrait et purifié. Cette étape de préparation est bien connue de l'homme du métier et aboutit à des échantillons présentant des concentrations en ADN normalisées. The biological samples to be analyzed are prepared for PCR, the DNA is extracted and purified. This preparation step is well known to those skilled in the art and results in samples exhibiting standardized DNA concentrations.
La réaction d'amplification proprement dite est réalisée par PCR indexée, selon un protocole classique. A cet effet, les amorces spécifiques ainsi que les amorces destinées à l'indexation et le mix d'amplification sont mélangés dans des tubes adaptés à l'équipement PCR utilisé. La réaction d'amplification se déroule en conditions standard. The actual amplification reaction is carried out by indexed PCR, according to a standard protocol. To this end, the specific primers as well as the primers intended for indexing and the amplification mix are mixed in tubes suitable for the PCR equipment used. The amplification reaction takes place under standard conditions.
Une fois amplifiées, les séquences sont récupérées, purifiées et quantifiées pour être séquencées. Once amplified, the sequences are recovered, purified and quantified in order to be sequenced.
2. Séquençage NGS 2. NGS sequencing
Le séquençage est réalisé dans un séquenceur NGS de la société Illumina. The sequencing is carried out in an NGS sequencer from the company Illumina.
Le séquençage est réalisé à l'aide du couple d'amorces de séquençage pour amplifier les séquences à analyser et de l'amorce de lecture d'index pour identifier le patient auquel se rapporte la séquence.
Tableau 1 : Récapitulatif des séquences décrites
Sequencing is carried out using the pair of sequencing primers to amplify the sequences to be analyzed and the index reading primer to identify the patient to which the sequence relates. Table 1: Summary of the sequences described