FR3051482A1 - METHOD FOR DETERMINING THE PRESENCE AND QUANTIFICATION OF AT LEAST ONE MICROORGANISM IN A BIOLOGICAL SAMPLE - Google Patents

METHOD FOR DETERMINING THE PRESENCE AND QUANTIFICATION OF AT LEAST ONE MICROORGANISM IN A BIOLOGICAL SAMPLE Download PDF

Info

Publication number
FR3051482A1
FR3051482A1 FR1654459A FR1654459A FR3051482A1 FR 3051482 A1 FR3051482 A1 FR 3051482A1 FR 1654459 A FR1654459 A FR 1654459A FR 1654459 A FR1654459 A FR 1654459A FR 3051482 A1 FR3051482 A1 FR 3051482A1
Authority
FR
France
Prior art keywords
microorganism
genome
sequences
sequencing
quantification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1654459A
Other languages
French (fr)
Other versions
FR3051482B1 (en
Inventor
Samuel Gabillard
Virginie Chesnais
Alban Ott
Emmanuel Chaplais
Eric Ginoux
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life & Soft
Original Assignee
Life & Soft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life & Soft filed Critical Life & Soft
Priority to FR1654459A priority Critical patent/FR3051482B1/en
Priority to PCT/FR2017/051204 priority patent/WO2017198956A1/en
Publication of FR3051482A1 publication Critical patent/FR3051482A1/en
Application granted granted Critical
Publication of FR3051482B1 publication Critical patent/FR3051482B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Virology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La présente invention porte sur un procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique humain comprenant des acides nucléiques totaux, comportant les étapes suivantes : - extraction des acides nucléiques totaux dudit échantillon biologique - séquençage haut débit desdits acides nucléiques totaux - traitement informatique des données de séquençage - le filtrage des séquences non humaines par alignement de séquences avec les séquences du génome de référence d'au moins un micro-organisme d'au moins un échantillon de référence - le calcul de la profondeur de séquençage du génome de référence d'au moins un micro-organisme - la détermination d'un indicateur de la quantification d'au moins un micro-organisme fonction de ladite profondeur de séquençage du génome de référence. La présente invention porte également sur un équipement et des kits pour la mise en œuvre dudit procédé, pour le diagnostic prénatal ou de cancers.The present invention relates to a method for determining the presence and quantification of at least one microorganism in a human biological sample comprising total nucleic acids, comprising the following steps: - extraction of the total nucleic acids from said biological sample - high sequencing flow rate of said total nucleic acids - computer processing of sequencing data - filtering of non-human sequences by alignment of sequences with reference genome sequences of at least one microorganism of at least one reference sample - calculation of the sequencing depth of the reference genome of at least one microorganism - the determination of an indicator of the quantification of at least one microorganism that is a function of said depth of sequencing of the reference genome. The present invention also relates to equipment and kits for the implementation of said method, for prenatal diagnosis or cancer.

Description

Procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologiqueMethod for determining the presence and quantification of at least one microorganism in a biological sample

Domaine de 1'inventionField of the invention

La présente invention se rapporte au domaine de la détection de contaminants dans un échantillon biologique par séquençage haut débit et au dosage desdits contaminants dans l'échantillon biologique.The present invention relates to the field of contaminant detection in a biological sample by high throughput sequencing and assay of said contaminants in the biological sample.

Plus particulièrement, l'invention se rapporte à la détection et à la quantification de micro-organismes, par exemple dans un échantillon biologique humain, notamment plasmatique, dont on ne connaît pas préalablement la concentration en microorganismes .More particularly, the invention relates to the detection and quantification of microorganisms, for example in a human biological sample, in particular plasma, whose concentration in microorganisms is not known beforehand.

Contexte de 1'inventionBackground of the invention

Les techniques de séquençage haut débit (également appelée technique de séquençage de nouvelle génération) présentent un intérêt tout particulier dans les études génomiques, notamment en physiopathologie. En effet, ces techniques permettent de séquencer les acides nucléiques et notamment le génome entier ou l'exome entier d'un tissu biologique ou de séquencer de manière plus ciblée un panel de gènes d'intérêt. Il est possible à partir des données génomiques séquencées d'étudier le microbiome des tissus étudiés.High throughput sequencing techniques (also called next-generation sequencing techniques) are of particular interest in genomic studies, particularly in physiopathology. Indeed, these techniques make it possible to sequence the nucleic acids and in particular the whole genome or the entire exome of a biological tissue or to more specifically sequence a panel of genes of interest. It is possible from sequenced genomic data to study the microbiome of the tissues studied.

En 2008, le NIH a initié la projet HMP (Human Microbiome Project) qui avait pour objectif de caractériser le microbiome de divers tissus biologiques humains (NIH HMP Working Group et al., 2009). Plusieurs études ont ensuite permis de mettre en évidence l'impact du micro-organisme dans diverses situations pathologiques. Ainsi il est possible d'associer la présence de certains micro-organismes dans un tissu à l'émergence d'une pathologie. Par exemple, au cours de la grossesse, de nombreuses infections (parasitaires, bactériennes, virales...) peuvent avoir des conséquences graves pour la mère et le fœtus. Parmi les plus fréquentes, on retrouve les infections par le cytomégalovirus (CMV) ou par le virus de la rubéole (Pereira et al., 2005). Le dépistage de ces infections chez la femme enceinte pourrait permettre un meilleur encadrement des grossesses à risque. De même, il a été montré dans des cas de rejet de greffe que l'identification de séquences d'origine virale pouvaient être associée à l'augmentation du risque de rejet du greffon (De Vlaminck et al., 2015). Enfin, certaines infections virales peuvent être associées à des processus oncogéniques particuliers. C'est le cas notamment du virus HPV-16 associé à l'émergence d'un cancer du col de l'utérus ou du virus de l'hépatite B pouvant entrainer l'apparition de carcinomes hépatiques (Blackadar, 2016). Dans tous les cas, le dépistage d'infections particulières, de même que la quantification de ces infections, peuvent permettre d'améliorer le diagnostic et le suivi de patients atteints de diverses pathologies.In 2008, the NIH initiated the Human Microbiome Project (HMP), which aimed to characterize the microbiome of various human biological tissues (NIH HMP Working Group et al., 2009). Several studies then made it possible to highlight the impact of the micro-organism in various pathological situations. Thus it is possible to associate the presence of certain microorganisms in a tissue to the emergence of a pathology. For example, during pregnancy, many infections (parasitic, bacterial, viral ...) can have serious consequences for the mother and the fetus. Among the most common are infections with cytomegalovirus (CMV) or rubella virus (Pereira et al., 2005). Screening for these infections in pregnant women could lead to better management of at-risk pregnancies. Similarly, it has been shown in transplant rejection cases that identification of viral-derived sequences may be associated with increased risk of graft rejection (De Vlaminck et al., 2015). Finally, some viral infections can be associated with particular oncogenic processes. This is notably the case of the HPV-16 virus associated with the emergence of a cancer of the cervix or hepatitis B virus that can lead to the appearance of hepatic carcinomas (Blackadar, 2016). In all cases, the detection of specific infections, as well as the quantification of these infections, can improve the diagnosis and monitoring of patients with various pathologies.

Etat de la techniqueState of the art

Il est connu de l'état de la technique des techniques de détection de biomarqueurs de l'état de santé d'un fœtus dans un échantillon biologique maternel.State-of-the-art techniques for detecting biomarkers of the health status of a fetus in a maternal biological sample are known.

La demande de brevet W02015/070086 décrit une méthode d'analyse du microbiome chez un sujet comprenant le séquençage haut-débit d'un échantillon du patient, l'analyse bioinformatique des données de séquençage et détermination de la présence d'une séquence microbienne.The patent application WO2015 / 070086 describes a method for analyzing the microbiome in a subject comprising high-throughput sequencing of a sample of the patient, bioinformatic analysis of the sequencing data and determination of the presence of a microbial sequence.

La demande de brevet WO2014/019275 décrit un procédé d'identification de biomarqueurs de l'état de santé fœtal à partir d'un organisme étranger tel qu'un virus, une bactérie, un champignon et un parasite, et ses utilisations pour la détermination non invasive de l'état de santé fœtal. Cette demande de brevet concerne également un système et un kit qui sont utilisés dans le procédé.Patent Application WO2014 / 019275 discloses a method of identifying biomarkers of fetal health status from a foreign organism such as a virus, bacteria, fungus and parasite, and its uses for determining non-invasive state of fetal health. This patent application also relates to a system and a kit that are used in the process.

Il existe dans l'état de la technique des procédés de détection de biomarqueurs non-invasif basés sur des techniques de détection d'ADN par PCR quantitative (Polymerase Chain Reaction) ciblant spécifiquement une séquence d'ADN ayant pour origine un micro-organisme particulier. Il existe également des techniques de détection immunologique d'une infection notamment grâce à la quantification des immunoglobulines.Non-invasive biomarker detection methods are available in the state of the art based on quantitative PCR (Polymerase Chain Reaction) DNA detection techniques specifically targeting a DNA sequence originating from a particular microorganism. . There are also techniques for immunological detection of an infection, in particular by quantifying immunoglobulins.

Il existe également dans l'état de la technique des procédés de détection de biomarqueurs qui nécessitent une étape invasive pouvant représenter des risques pour le patient. C'est le cas par exemple de l'amniocentèse, technique répandue pour prélever du liquide amniotique en vue d'établir une batterie de tests pour évaluer l'état de santé du fœtus chez la femme enceinte. Or l'amniocentèse n'est pas sans risque pour la femme enceinte et le fœtus puisqu'elle peut entraîner la perte du bébé. De même, les biopsies, par exemple pour évaluer le caractère cancérigène d'une tumeur, constituent un acte chirurgical pouvant être dangereux pour le patient. Les tests réalisés sur ces prélèvements peuvent être de différentes natures et plus ou moins sensibles.There are also in the state of the art biomarker detection methods that require an invasive step that may represent risks for the patient. This is the case, for example, with amniocentesis, a technique widely used to collect amniotic fluid in order to establish a battery of tests to evaluate the state of health of the fetus in pregnant women. However, amniocentesis is not without risk for the pregnant woman and the fetus since it can lead to the loss of the baby. Similarly, biopsies, for example to evaluate the carcinogenic nature of a tumor, constitute a surgical act that can be dangerous for the patient. The tests performed on these samples can be of different natures and more or less sensitive.

Inconvénient de l'art antérieurDisadvantage of the prior art

Les procédés de l'art antérieur et notamment de la demande WO2014/019275 permettent uniquement de déterminer la présence ou non d'un contaminant à partir des données de séquençage d'un échantillon biologique. Ces procédés ne donnent aucune information sur la concentration en contaminant dans l'échantillon. Il n'est pas non plus possible de suivre l'évolution de cette concentration dans le temps.The methods of the prior art and in particular of the application WO2014 / 019275 only make it possible to determine the presence or absence of a contaminant from the sequencing data of a biological sample. These methods give no information on the concentration of contaminant in the sample. It is also not possible to follow the evolution of this concentration over time.

Le procédé du document W02015/070086 ne comporte pas d'optimisation de la détection des micro-organismes au sein d'un sujet. En effet, un certain nombre de reads peuvent s'aligner de façon non spécifique sur le génome de référence au niveau de région génomique de basse complexité et être la source de faux positifs.The method of WO2015 / 070086 does not include an optimization of the detection of microorganisms within a subject. Indeed, a number of reads can non-specifically align with the reference genome at low genomic region level and be the source of false positives.

Ce document n'établit pas non plus préalablement une matrice de référence sur une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante. Ce document établit tout au plus une quantification relative mais pas de quantification absolue de la concentration en micro-organisme.This document also does not establish beforehand a reference matrix on a plurality of reference samples whose concentration in microorganism is known, and to record a matrix corresponding to the depth determined by said characterization, and the concentration in micro corresponding known organism. This document establishes at most a relative quantification but no absolute quantification of the concentration of microorganism.

Les autres techniques de détection non-invasives en PCR quantitative par exemple présentent généralement un seuil de détection élevé et sont généralement longues et non-exhaustives . De même les techniques immunologiques présentent le plus souvent une faible spécificité de détection des microorganismes . Ces techniques ne permettent généralement pas de dater l'infection dans le sens où un résultat positif peut résulter d'une infection antérieure.Other non-invasive quantitative PCR detection techniques, for example, generally have a high detection threshold and are generally long and non-exhaustive. Likewise, immunological techniques most often have a low specificity for detecting microorganisms. These techniques generally do not allow dating the infection in the sense that a positive result can result from a previous infection.

Les techniques de détection immunologiques d'un microorganisme peuvent également être invasives pour le patient, par exemple dans le cas de l'amniocentèse chez la femme enceinte. Ces gestes ne sont pas sans conséquences et ils peuvent représenter des risques pour le patient et/ou le fœtus. De même, le seuil de détection par ces techniques est parfois élevé ce qui ne permet pas de détecter de faibles niveaux en micro-organismes.The immunological detection techniques of a microorganism can also be invasive for the patient, for example in the case of amniocentesis in pregnant women. These actions are not without consequences and they can represent risks for the patient and / or the fetus. Similarly, the detection threshold by these techniques is sometimes high which does not detect low levels of microorganisms.

Dans tous les cas, la concentration en micro-organismes quantifiée par ces techniques n'est pas toujours très précise, ce qui ne permet pas d'adapter précisément les traitements.In all cases, the concentration of microorganisms quantified by these techniques is not always very precise, which does not allow to precisely adjust the treatments.

Il existe donc un réel besoin de détecter et de quantifier précisément plusieurs micro-organismes dans un même échantillon biologique, dont on ne connaît pas la quantité desdits micro-organismes, de façon sûre, rapide, précise, sensible et avec un seuil de quantification très bas.There is therefore a real need to accurately detect and quantify several microorganisms in the same biological sample, whose quantity of said microorganisms is not known, in a safe, fast, precise, sensitive and with a very high quantification threshold. low.

Solution apportée par l'inventionSolution provided by the invention

La présente invention se propose de remédier aux inconvénients de l'art antérieur par un procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique humain comprenant des acides nucléiques totaux, comportant les étapes suivantes : - extraction des acides nucléiques totaux dudit échantillon biologique - séquençage haut débit desdits acides nucléiques totaux - traitement informatique des données de séquençage consistant à o dénombrer le nombre total de séquences o filtrer lesdites séquences en fonction d'un score de qualité o filtrer des séquences humaines par alignement de séquences avec les séquences du génome de référence humain caractérisé en ce que lesdites étapes de traitement informatique comprennent en outre : - une étape initiale de calibration consistant à caractériser une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante - une étape de masquage de 0 à 5% des nucléotides du génome de référence d'au moins un micro-organisme par rapport aux nucléotides totaux dudit génome de référence, lesdits nucléotides masqués correspondant à des séquences de faible complexité - le filtrage des séquences d'au moins un micro-organisme par alignement de séquences non-humaines avec les séquences du génome de référence d'au moins un microorganisme d'au moins un échantillon de référence - le calcul de la profondeur de séquençage du génome de référence d'au moins un micro-organisme - la validation de l'homogénéité de la couverture du génome d'au moins un micro-organisme consistant à calculer l'écart-type de la profondeur de séquençage du génome à la référence dudit génome d'au moins un micro-organisme - la détermination d'un indicateur de la quantification d'au moins un micro-organisme fonction de ladite profondeur de séquençage du génome de référence.The present invention proposes to overcome the disadvantages of the prior art by a method for determining the presence and quantification of at least one microorganism in a human biological sample comprising total nucleic acids, comprising the following steps: extraction total nucleic acids of said biological sample - high throughput sequencing of said total nucleic acids - computer processing of the sequencing data of counting the total number of sequences or filtering said sequences according to a quality score o filtering human sequences by alignment sequences with sequences of the human reference genome characterized in that said computer processing steps further comprise: - an initial calibration step of characterizing a plurality of reference samples whose concentration in microorganism is known, and to save a matrix corresponding to the depth determined by said characterization, and the corresponding known microorganism concentration - a step of masking from 0 to 5% of the nucleotides of the reference genome of at least one microorganism relative to the total nucleotides of said reference genome, said masked nucleotides corresponding to low complexity sequences - filtering the sequences of at least one microorganism by alignment of non-human sequences with the sequences of the reference genome of at least one microorganism from minus one reference sample - the calculation of the sequencing depth of the reference genome of at least one micro-organism - the validation of the homogeneity of the genome coverage of at least one micro-organism consisting of calculating the standard deviation of the sequencing depth of the genome to the reference of said genome of at least one microorganism - the determination of a quantifying at least one microorganism that is a function of said depth of sequencing of the reference genome.

La présente invention propose un procédé de détection rapide et précis de micro-organismes présents dans des échantillons biologiques humains, permettant de mettre en évidence des dérégulations ciblées du microbiome au sein d'un tissu biologique. La présente invention permet également de quantifier de façon précise le micro-organisme dans un échantillon biologique. La présente invention permet une détection et une quantification absolue de la concentration en micro-organisme. Le procédé selon l'invention est très sensible et permet de détecter au moins un micro-organisme même si ce ou ces derniers sont faiblement présents dans l'échantillon. Le seuil de détection et de quantification du procédé de 1 ' invention est très bas. Le seuil de détection du procédé selon 1'invention est inférieur au seuil de détection des techniques communément admises telle que les tests immunologiques. Le seuil de quantification du procédé selon l'invention est inférieur au seuil de quantification des techniques communément admises telle que la PCR quantitative. La qualité des résultats obtenus par le présent procédé est accrue par rapport aux solutions de l'art antérieur. L'on comprend que l'invention permet la détection d'un ou de plusieurs micro-organismes dans un même échantillon dont on ne connaît pas préalablement la quantité desdits microorganismes. Cette quantification est absolue, notamment grâce à l'étape initiale de calibration consistant à caractériser une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante.The present invention provides a method for the rapid and accurate detection of microorganisms present in human biological samples, making it possible to demonstrate targeted deregulation of the microbiome within a biological tissue. The present invention also makes it possible to precisely quantify the microorganism in a biological sample. The present invention enables absolute detection and quantification of the microorganism concentration. The process according to the invention is very sensitive and makes it possible to detect at least one microorganism even if this or these latter are weakly present in the sample. The detection and quantification threshold of the process of the invention is very low. The detection threshold of the process according to the invention is below the detection threshold of commonly accepted techniques such as immunoassays. The quantification threshold of the process according to the invention is below the threshold of quantification of commonly accepted techniques such as quantitative PCR. The quality of the results obtained by the present method is increased compared to the solutions of the prior art. It is understood that the invention allows the detection of one or more microorganisms in the same sample of which the quantity of said microorganisms is not known beforehand. This quantification is absolute, in particular thanks to the initial calibration step of characterizing a plurality of reference samples whose concentration in microorganism is known, and to register a matrix corresponding to the depth determined by said characterization, and the corresponding known microorganism concentration.

La combinaison des étapes du procédé selon l'invention et notamment des étapes de calibration initiale, masquage, filtrage et validation de l'homogénéité de couverture permet d'obtenir des résultats reproductibles, fiables, de très bonne qualité - supérieure aux procédés de l'état de la technique.The combination of the steps of the method according to the invention and in particular the steps of initial calibration, masking, filtering and validation of the homogeneity of coverage makes it possible to obtain reproducible, reliable results of very good quality - superior to the processes of the invention. state of the art.

Avantageusement, l'étape de calcul de la profondeur de séquençage du génome de référence d'au moins un microorganisme comprend un traitement de normalisation de la profondeur par rapport au nombre total de séquences issues du séquençage.Advantageously, the step of calculating the sequencing depth of the reference genome of at least one microorganism comprises a depth normalization treatment with respect to the total number of sequences resulting from the sequencing.

Le procédé selon l'invention optimise et augmente la quantité d'informations issues des séquençages d'échantillons biologiques humains. Le procédé selon l'invention est rapide. Le procédé selon l'invention permet d'augmenter la qualité des résultats obtenus. Il permet également une quantification absolue de la concentration en micro-organisme.The method according to the invention optimizes and increases the amount of information resulting from the sequencing of human biological samples. The process according to the invention is rapid. The process according to the invention makes it possible to increase the quality of the results obtained. It also allows an absolute quantification of the concentration of microorganism.

Alternativement, le procédé selon l'invention utilise les données de séquençage d'échantillons biologiques humains prélevés à d'autres fins, par exemple aux dépistages des aneuploïdies fœtales ou de biopsies suspectées cancéreuses. Ainsi le procédé selon l'invention maximise les diagnostics possibles à partir d'échantillons biologiques.Alternatively, the method according to the invention uses the sequencing data of human biological samples taken for other purposes, for example, for the screening of fetal aneuploidies or suspected cancerous biopsies. Thus the method according to the invention maximizes possible diagnoses from biological samples.

Selon un second aspect, l'invention porte sur un équipement pour la détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique comportant un calculateur commandé par un programme d'ordinateur pour la réalisation des traitements de : - calibration initiale consistant à caractériser une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante - masquage de 0 à 5% des nucléotides du génome de référence d'au moins un micro-organisme par rapport aux nucléotides totaux dudit génome de référence, lesdits nucléotides masqués correspondant à des séquences de faible complexité - filtrage des séquences d'au moins un micro-organisme par alignement de séquences non-humaines avec les séquences d'au moins un génome de référence dudit micro-organisme d'au moins un échantillon de référence - calcul de la profondeur de séquençage dudit génome de référence - la validation de l'homogénéité de la couverture du génome d'au moins un micro-organisme consistant à calculer l'écart-type de la profondeur de séquençage du génome à la référence dudit génome d'au moins un micro-organisme - détermination d'un indicateur de concentration en microorganisme fonction de ladite profondeur de séquençage du génome de référence.According to a second aspect, the invention relates to equipment for determining the presence and quantification of at least one microorganism in a biological sample comprising a computer controlled by a computer program for carrying out treatments of: initial calibration of characterizing a plurality of reference samples whose concentration in microorganism is known, and recording a matrix corresponding to the depth determined by said characterization, and the corresponding known microorganism concentration - masking from 0 to 5% of the nucleotides of the reference genome of at least one microorganism relative to the total nucleotides of the said reference genome, the said masked nucleotides corresponding to sequences of low complexity - filtering the sequences of at least one microorganism by alignment non-human sequences with sequences of at least one reference genome e of said microorganism of at least one reference sample - calculation of the sequencing depth of said reference genome - validation of the homogeneity of the genome coverage of at least one microorganism consisting in calculating the difference -type of the sequencing depth of the genome to the reference of said genome of at least one microorganism - determination of a microorganism concentration indicator according to said sequencing depth of the reference genome.

Selon un troisième aspect, l'invention porte sur un programme d'ordinateur pour la détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique commandant la réalisation des traitements de : - calibration initiale consistant à caractériser une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante - masquage de 0 à 5% des nucléotides du génome de référence d'au moins un micro-organisme par rapport aux nucléotides totaux dudit génome de référence, lesdits nucléotides masqués correspondant à des séquences de faible complexité - filtrage des séquences d'au moins un micro-organisme par alignement de séquences non-humaines avec les séquences du génome de référence dudit micro-organisme d'au moins un échantillon de référence - calcul de la profondeur de séquençage du génome de référence - la validation de l'homogénéité de la couverture du génome d'au moins un micro-organisme consistant à calculer l'écart-type de la profondeur de séquençage du génome à la référence dudit génome d'au moins un micro-organisme - détermination d'un indicateur de concentration en microorganisme fonction de ladite profondeur de séquençage du génome de référence.According to a third aspect, the invention relates to a computer program for the determination of the presence and quantification of at least one microorganism in a biological sample controlling the realization of the treatments of: - initial calibration of characterizing a plurality of reference samples whose concentration in microorganism is known, and to record a matrix corresponding to the depth determined by said characterization, and the corresponding known microorganism concentration - 0-5% masking of the nucleotides of the genome of reference of at least one microorganism relative to the total nucleotides of said reference genome, said masked nucleotides corresponding to sequences of low complexity - filtering the sequences of at least one microorganism by alignment of non-human sequences with the sequences of the reference genome of said microorganism of at least one sample of r reference - calculating the sequencing depth of the reference genome - validating the homogeneity of the genome coverage of at least one microorganism by calculating the standard deviation of the genome sequencing depth at reference said genome of at least one microorganism - determining a microorganism concentration indicator according to said sequencing depth of the reference genome.

Selon un quatrième aspect, l'invention concerne un kit pour la détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique conformément au procédé ci-dessus comprenant : - une pluralité de tubes contenant chacun une dilution d'au moins une séquence d'ADN d'un génome de référence d'au moins un micro-organisme dans un ADN contrôle - un tube contenant de 1'ADN contrôle - la séquence nucléotidique du génome de référence d'au moins un micro-organisme dont 0 à 5% des nucléotides sont masqués, lesdits nucléotides masqués correspondant à des séquences de faible complexité. Dans un mode de réalisation, la séquence d'ADN d'un génome de référence d'au moins un micro-organisme est la séquence SEQ ID 1.According to a fourth aspect, the invention relates to a kit for determining the presence and quantification of at least one microorganism in a biological sample according to the above method comprising: - a plurality of tubes each containing a dilution of at least one DNA sequence of a reference genome of at least one microorganism in a control DNA - a control DNA containing tube - the nucleotide sequence of the reference genome of at least one microorganism of which 0 to 5% of the nucleotides are masked, said masked nucleotides corresponding to sequences of low complexity. In one embodiment, the DNA sequence of a reference genome of at least one microorganism is the sequence SEQ ID 1.

Dans un mode préféré de réalisation, l'invention porte sur l'application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique à la détermination de la concentration d'un parasite.In a preferred embodiment, the invention relates to the application of the method for determining the presence and quantification of at least one microorganism in a biological sample to the determination of the concentration of a parasite.

Dans un mode de réalisation, ledit parasite est un organisme procaryote. Ledit procaryote peut être choisi parmi les bactéries ou les archae.In one embodiment, said parasite is a prokaryotic organism. Said prokaryote may be selected from bacteria or archae.

Dans un autre mode de réalisation, ledit parasite est un virus.In another embodiment, said parasite is a virus.

Le virus peut être un virus à ADN appartenant à la famille des herpesviridae, un papillomaviridae, un parvoviridae ou tout autre famille de virus à ADN.The virus may be a DNA virus belonging to the family of herpesviridae, papillomaviridae, parvoviridae or any other family of DNA viruses.

Le virus de la famille des herpesviridae peut être un cytomégalovirus, un virus Epstein-Barr, un varicellovirus, un simplexvirus, un herpes virus de type 8 ou tout autre virus.The virus of the family Herpesviridae can be a cytomegalovirus, an Epstein-Barr virus, a varicellovirus, a simplex virus, a herpes virus type 8 or any other virus.

Dans un autre mode de réalisation, ledit parasite est un organisme eucaryote.In another embodiment, said parasite is a eukaryotic organism.

Dans un autre mode de réalisation, l'invention porte sur l'application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique pour le diagnostic prénatal caractérisé en ce que ledit parasite est un cytomégalovirus.In another embodiment, the invention relates to the application of the method for determining the presence and quantification of at least one microorganism in a biological sample for prenatal diagnosis, characterized in that said parasite is a cytomegalovirus.

Dans un autre mode de réalisation, l'invention porte sur l'application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique pour le diagnostic d'un cancer induit par le virus Epstein Barr et/ou le suivi d'un traitement anticancéreux caractérisé en ce que ledit parasite est un virus Epstein Barr.In another embodiment, the invention relates to the application of the method for determining the presence and quantification of at least one microorganism in a biological sample for the diagnosis of a cancer induced by the Epstein Barr virus and / or monitoring an anticancer treatment characterized in that said parasite is an Epstein Barr virus.

Dans un autre mode de réalisation, l'invention porte sur l'application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique pour le suivi d'une greffe caractérisé en ce que ledit parasite est un virus cytomégalovirus.In another embodiment, the invention relates to the application of the method for determining the presence and quantification of at least one microorganism in a biological sample for monitoring a graft, characterized in that said parasite is a cytomegalovirus virus.

Selon un autre aspect, l'invention porte sur un kit pour le diagnostic prénatal mettant en œuvre le procédé décrit précédemment caractérisé en ce que ladite séquence du génome de référence d'au moins un micro-organisme est un cytomégalovirus dont jusqu'à 0,06% des nucléotides sont masqués. Avantageusement, ladite séquence du génome de référence d'au moins un micro-organisme est la séquence du génome de référence d'un cytomégalovirus dont jusqu'à 0,06% des nucléotides sont masqués, cette séquence correspondant à la séquence SEQ ID 1.According to another aspect, the invention relates to a kit for prenatal diagnosis using the method described above, characterized in that said sequence of the reference genome of at least one microorganism is a cytomegalovirus of which up to 0, 06% of the nucleotides are masked. Advantageously, said reference genome sequence of at least one microorganism is the sequence of the reference genome of a cytomegalovirus of which up to 0.06% of the nucleotides are masked, this sequence corresponding to the sequence SEQ ID 1.

Selon un autre aspect, l'invention porte sur un kit pour le suivi d'une greffe mettant en œuvre le procédé décrit précédemment caractérisé en ce que ladite séquence du génome de référence d'au moins un micro-organisme est un cytomégalovirus.In another aspect, the invention relates to a kit for monitoring a graft implementing the method described above characterized in that said reference genome sequence of at least one microorganism is a cytomegalovirus.

Selon un autre aspect, l'invention porte sur un kit pour le diagnostic d'un cancer induit par le virus Epstein Barr et/ou le suivi d'un traitement anticancéreux mettant en œuvre le procédé précédemment décrit caractérisé en ce que ladite séquences du génome de référence d'au moins un micro-organisme est un virus Epstein Barr.According to another aspect, the invention relates to a kit for the diagnosis of a cancer induced by the Epstein Barr virus and / or the monitoring of an anticancer treatment implementing the method previously described, characterized in that said genome sequences reference of at least one microorganism is an Epstein Barr virus.

DescriptionDescription

La présente invention sera mieux comprise à la lumière de la description détaillée de l'invention et d'exemples non limitatifs de réalisation.The present invention will be better understood in the light of the detailed description of the invention and nonlimiting examples of embodiment.

La figure 1 présente un schéma du procédé selon l'invention.Figure 1 shows a diagram of the method according to the invention.

La figure 2 présente la répartition des bases en fonction de leur score de qualité PHRED pour un échantillon.Figure 2 shows the distribution of bases according to their PHRED quality score for a sample.

La figure 3 présente la distribution moyenne des séquences nucléotidiques issues de séquençage de génome entier.Figure 3 shows the average distribution of nucleotide sequences from whole genome sequencing.

La figure 4 présente le nombre de séquences virales alignées sur le génome de référence du CMV masqué (CMV_NS) ou classique (NC_006273).Figure 4 shows the number of viral sequences aligned on the reference genome of the masked CMV (CMV_NS) or conventional (NC_006273).

La figure 5 présente la comparaison des résultats obtenus après filtre ou non des séquences nucléotidiques humaines.Figure 5 shows the comparison of the results obtained after filter or not human nucleotide sequences.

La figure 6 présente la comparaison des performances pour l'alignement sur le génome viral des séquences nucléotidiques de 5 échantillons sans (en haut) ou avec (en bas) une première étape filtrant les séquences nucléotidiques s'alignant sur le génome humain.Figure 6 shows the performance comparison for alignment on the viral genome of the nucleotide sequences of 5 samples without (top) or with (bottom) a first step filtering the nucleotide sequences aligning with the human genome.

La figure 7 présente le nombre but de séquences alignées sur le génome de référence du CMV (CMV_NS) ou normalisé en fonction du nombre de séquences totales de l'échantillon dans un échantillon infecté par le CMV.Figure 7 shows the objective number of sequences aligned on the CMV reference genome (CMV_NS) or normalized as a function of the number of total sequences of the sample in a sample infected with CMV.

La figure 8 présente une estimation de la concentration en contaminant des échantillons à partir de la profondeur moyenne normalisée et la corrélation entre la concentration en contaminant théorique de l'échantillon et celle estimée par le procédé selon l'invention.FIG. 8 presents an estimation of the concentration by contaminating samples from the standardized mean depth and the correlation between the theoretical contaminant concentration of the sample and that estimated by the method according to the invention.

La figure 9 présente un exemple de réalisation de l'invention pour la détection d'une virémie dans des échantillons plasmatiques.Figure 9 shows an exemplary embodiment of the invention for the detection of a viremia in plasma samples.

La figure 10 présente le profil d'un échantillon positif selon le procédé de l'invention et ayant une virémie positive pour le CMV.Figure 10 shows the profile of a positive sample according to the method of the invention and having a positive viremia for CMV.

La figure 11 présente la profondeur moyenne normalisée de 4 échantillons (en abscisse) pour 9 micro-organismes étudiés (famille des herpesviridae). Définitions :Figure 11 shows the standardized mean depth of 4 samples (abscissa) for 9 microorganisms studied (family Herpesviridae). Definitions:

Echantillon biologique humain : Des biopsies liquides ou solides de tissus humains, des cellules isolées à partir de biopsies liquides ou solides, les liquides biologiques tels que le plasma ou liquide céphalorachidien.Human biological sample: Liquid or solid biopsies of human tissues, cells isolated from liquid or solid biopsies, biological fluids such as plasma or cerebrospinal fluid.

Fasta : Format de fichier texte permettant de stocker des séquences biologiques telles que des séquences nucléotidiques de génomes de référence.Fasta: Text file format for storing biological sequences such as nucleotide sequences of reference genomes.

Fastq : Format de fichier texte permettant de stocker des séquences et leur score de qualité associé telles que les séquences nucléotidiques issues du séquençage nouvelle génération.Fastq: Text file format for storing sequences and their associated quality score such as nucleotide sequences from next-generation sequencing.

Microbiome : Le microbiome regroupe l'ensemble des microorganismes qui prédominent ou sont durablement adaptées à la surface et à l’intérieur d’un organisme vivant. Ce terme désigne également la somme des génomes des micro-organismes vivant dans ou sur un organisme animal ou végétal. Des états pathologiques de l'organisme animal ou végétal peuvent être attribués à un déséquilibre de son microbiome. ORF (Open Reading Frame) : Phase ouverte de lecture correspond à une région du génome susceptible de corder pour une protéine. Elle est définie par la présence d'un codon initiateur et d'un codon stop qui délimitent une région codante entourée dans certains cas de séquences dîtes régulatrices.Microbiome: The microbiome includes all microorganisms that predominate or are permanently adapted to the surface and inside of a living organism. This term also refers to the sum of genomes of microorganisms living in or on an animal or plant organism. Pathological states of the animal or plant organism can be attributed to an imbalance of its microbiome. ORF (Open Reading Frame): Open reading phase is a region of the genome that can string for a protein. It is defined by the presence of an initiator codon and a stop codon which delimit a coding region surrounded in certain cases by regulatory sequences.

Profondeur de séquençage : Correspond au nombre de fois moyen que le génome est couvert (souvent exprimé en équivalent génome). Autrement dit, la profondeur de séquençage se définit comme le nombre de séquences qui couvrent une région génomique particulière.Sequencing Depth: The average number of times the genome is covered (often expressed in genome equivalents). In other words, the sequencing depth is defined as the number of sequences that cover a particular genomic region.

Read : Séquence nucléotidique obtenue après séquençage nouvelle génération Séquençage : Consiste à déterminer l'ordre des nucléotides d'une séquence d'acide nucléique donné selon différentes méthodes. Séquençage nouvelle génération (ou séquençage haut-débit) : Consiste à déterminer de manière massive et parallélisée l'ordre des nucléotides d'un grand nombre de séquences d'acides nucléiques au sein d'un échantillon. Typiquement cette méthode permet le séquençage du génome ou du transcriptome d'un échantillon biologique.Read: Nucleotide sequence obtained after next-generation sequencing Sequencing: Consists of determining the order of nucleotides of a given nucleic acid sequence according to different methods. Next Generation Sequencing (or High Throughput Sequencing): Consists of massively and parallelizing the order of nucleotides of a large number of nucleic acid sequences within a sample. Typically this method allows the sequencing of the genome or transcriptome of a biological sample.

Score de qualité (score Phred) : Score de qualité assigné à chaque base nucléique obtenue après séquençage nouvelle génération. Ils permettent de déterminer l’exactitude de chaque nucléotide d'une séquence biologique stockée dans un fichier fastq.Quality score (Phred score): Quality score assigned to each nucleobase obtained after next generation sequencing. They make it possible to determine the accuracy of each nucleotide of a biological sequence stored in a fastq file.

Préparation des échantillonsSample preparation

Les acides nucléiques des échantillons biologiques sont extraits selon les techniques classiques bien connues de l'Homme du métier. L'étape d'extraction des acides nucléiques est adaptée à chaque échantillon biologique et permet la lyse des cellules afin de libérer les acides nucléiques qui sont ensuite purifiés et fragmentés si nécessaire afin de permettre leur séquençage par des techniques de séquençage nouvelle génération. Par exemple, le plasma est récolté après centrifugation d'un prélèvement sanguin et correspond au surnageant. Cette phase liquide ne contient pas ou peu de cellules sanguines. L'ADN circulant dans le plasma est ensuite extrait de cet échantillon biologique. Dans le cas de l'ADN plasmatique circulant aucune étape de fragmentation n'est nécessaire. Séquençage :The nucleic acids of the biological samples are extracted according to conventional techniques well known to those skilled in the art. The nucleic acid extraction step is adapted to each biological sample and allows lysis of the cells to release the nucleic acids which are then purified and fragmented if necessary to allow their sequencing by next generation sequencing techniques. For example, the plasma is harvested after centrifugation of a blood sample and corresponds to the supernatant. This liquid phase contains no or few blood cells. The DNA circulating in the plasma is then extracted from this biological sample. In the case of circulating plasma DNA, no fragmentation step is necessary. Sequencing:

Les échantillons sont ensuite séquencés par des techniques de séquençage haut-débit, par exemple séquençage en single-end ou paired-end, long-reads ou short-reads. Ce séquençage peut être fait sur des plateformes bien connues de l'Homme du métier comme les plateformes Illumina®, Roche® ou IonTorrent®. Par exemple, dans le cas d'un séquençage suivant la technologie Illumina®, des séquences adaptatrices sont ajoutées à chaque extrémité des fragments d'ADN. Ces adaptateurs sont différents pour chaque échantillon et permettent leur identification après séquençage de plusieurs échantillons sur une même puce. L'ajout des adaptateurs est suivi par une amplification clonale des fragments d'ADN (par pontage ou PCR en émulsion par exemple) puis par l'étape de séquençage sur l'automate choisi (par exemple HiSeql500™).The samples are then sequenced by high-throughput sequencing techniques, for example sequencing in single-end or paired-end, long-reads or short-reads. This sequencing can be done on platforms well known to those skilled in the art, such as Illumina®, Roche® or IonTorrent® platforms. For example, in the case of sequencing according to Illumina® technology, adapter sequences are added at each end of the DNA fragments. These adapters are different for each sample and allow their identification after sequencing of several samples on the same chip. The addition of the adapters is followed by clonal amplification of the DNA fragments (by bridging or emulsion PCR, for example) and then by the sequencing step on the chosen automaton (for example HiSeql500 ™).

Prétraitement des données de séquençage : - Dénombrage du nombre total de séquences :Pretreatment of the sequencing data: - Counting of the total number of sequences:

Les données de séquençage sont stockées dans des fichiers fastq sous-forme de séquences nucléotidiques dont la taille dépend essentiellement de la technologie de séquençage utilisée, auquel sont associées un score qualité appelé le score Phred. Le nombre de séquences contenues dans chaque fichier fastq correspond au nombre total de séquences obtenues après séquençage nouvelle génération. - Filtrage des séquences nucléotidiques en fonction de leur qualité :The sequencing data is stored in fastq files in the form of nucleotide sequences whose size depends essentially on the sequencing technology used, which is associated with a quality score called the Phred score. The number of sequences contained in each fastq file corresponds to the total number of sequences obtained after next generation sequencing. - Filtering of nucleotide sequences according to their quality:

Les séquences nucléotidiques sont ensuite filtrées sur leur qualité. Seules les séquences nucléotidiques de qualité suffisante sont conservées (figure 2). De même, les duplicats de PCR sont filtrés lors de cette étape. - Filtrage des séquences humaines par alignement de séquences avec les séquences du génome de référence humain :The nucleotide sequences are then filtered on their quality. Only nucleotide sequences of sufficient quality are conserved (Figure 2). Similarly, the PCR duplicates are filtered during this step. - Filtering human sequences by alignment of sequences with sequences of the human reference genome:

Un premier alignement sur le génome de référence humain GRCh38 est effectué afin de filtrer les séquences nucléotidiques d'origine humaine. En fonction de la technologie et de la plateforme de séquençage utilisé, il convient d'adapter l'outil d'alignement utilisé. En effet les algorithmes utilisés par les différents aligneurs disponibles sont dépendant, notamment de la taille des séquences, mais aussi de leur type de séquençage (en paired- ou single-end) et doivent être choisis en fonction de ces différents paramètres. Par exemple, l'outil Bowtie, permet un alignement efficace et rapide des séquences de petite taille (moins de 50pb) issus de séquençage de génome entier (Langmead et al., 2009). Dans le cas de données de séquençage obtenues après séquençage en single-end de 26pb, les séquences qui s'alignent sans variants et moins de 5 fois sur le génome de référence humain GRCh38 sont considérés comme des séquences nucléotidiques d'origine humaine. Afin d'accélérer cette étape, le meilleur alignement des séquences sur le génome de référence humain peut ne pas être rapporté (tableau 1).A first alignment on the human reference genome GRCh38 is performed in order to filter the nucleotide sequences of human origin. Depending on the technology and the sequencing platform used, the alignment tool used should be adapted. Indeed, the algorithms used by the different aligners available are dependent, in particular on the size of the sequences, but also on their type of sequencing (in paired or single-end) and must be chosen according to these different parameters. For example, the Bowtie tool allows efficient and fast alignment of small (less than 50bp) sequences from whole genome sequencing (Langmead et al., 2009). In the case of sequencing data obtained after single-end sequencing of 26bp, sequences that align without variants and less than 5-fold on the human reference genome GRCh38 are considered nucleotide sequences of human origin. In order to accelerate this step, the best sequence alignment on the human reference genome may not be reported (Table 1).

Tableau 1 : Exemple de paramètres d'alignement des séquences nucléotidiques sur le génome de référence humain GRCh38 avec l'outil d'alignement Bowtie pour des données de séquençage Illumina obtenues sur HiSeqlSOO™ en single-end de 26pbTable 1: Example of Nucleotide Sequence Alignment Parameters on the GRCH38 Human Reference Genome with the Bowtie Alignment Tool for Illumina Sequencing Data Obtained on HiSeqlSOO ™ as a 26pb Single-End

Dans cet exemple, en moyenne, après séquençage de génome entier, environ 19% des séquences totales ayant une qualité suffisante ne s'alignent pas sur le génome de référence GRCh38 (figure 3).In this example, on average, after whole genome sequencing, about 19% of the total sequences of sufficient quality do not align with the reference GRCH38 genome (FIG. 3).

Identification des séquences spécifiques des ADN contaminants - Génomes de références :Identification of the specific sequences of the contaminating DNAs - Genomes of references:

Sur certaines régions génomiques particulières on observe l'alignement non-spécifique de nombreuses séquences nucléotidiques. Le nombre et la taille de ces régions particulières au sein d'un génome de référence sont indépendants de la taille de ce dernier. Cette étape n'est pas obligatoire pour tous les génomes de référence et dépend essentiellement de la séquence de ce dernier. En revanche un maximum de 5 nucléotides par centaine de nucléotides de la séquence de référence peuvent être modifiés à cette étape afin d'assurer une sensibilité d'alignement suffisante pour la suite de l'analyse (modification de 0% à 5% des nucléotides).On certain particular genomic regions the non-specific alignment of many nucleotide sequences is observed. The number and size of these particular regions within a reference genome are independent of the size of the reference genome. This step is not mandatory for all reference genomes and depends mainly on the sequence of the reference genome. On the other hand, a maximum of 5 nucleotides per hundred nucleotides of the reference sequence can be modified at this stage in order to ensure sufficient alignment sensitivity for the rest of the analysis (modification of 0% to 5% of the nucleotides) .

Par exemple, sur un panel de 60 virus à ADN, 9 présentent, un l'alignement non-spécifique de 4 à 173 séquences (tableau 2).For example, on a panel of 60 DNA viruses, 9 present a non-specific alignment of 4 to 173 sequences (Table 2).

Tableau 2 : Génome viraux présentant des régions nucléotidiques de basse complexité entraînant un alignement non-spécifique de séquences nucléotidiquesTable 2: Viral genomes with low complexity nucleotide regions resulting in non-specific alignment of nucleotide sequences

Certaines régions génomiques particulières sont généralement composées de séquences d'ADN de basse complexité qui correspondent à une faible diversité nucléotidique en général, une ou deux bases sont surreprésentées (par exemple : AAATAAAAAAAATAAAAAAT). Les régions de basse complexité provoquent souvent des alignements non-spécifiques. De telles régions peuvent aussi comporter des répétitions de motifs (séquences de quelques bases).Some particular genomic regions are generally composed of low complexity DNA sequences that correspond to low nucleotide diversity in general, one or two bases are overrepresented (eg AAAAAAAAAAATAAAAAAT). Regions of low complexity often cause non-specific alignments. Such regions may also include repetitions of patterns (sequences of some bases).

Les régions nucléotidiques entraînant des alignements non-spécifiques sont donc masquées, afin de permettre une meilleure homogénéité de l'alignement sur le génome de référence et une diminution du bruit de fond observé pour les échantillons négatifs. Cette méthode permet de diminuer le nombre de séquences alignées de manière non-spécifique. Par exemple, pour le virus du CMV (HSV-5), l'étape de masquage des 4 régions de basse complexité passe par la modification de 155pb du génome de référence qui deviennent des N (SEQ ID 1). Dans ce cas, le masquage impacte 0,06% des nucléotides du génome du CMV.The nucleotide regions resulting in nonspecific alignments are thus masked, in order to allow a better homogeneity of the alignment on the reference genome and a decrease of the background noise observed for the negative samples. This method makes it possible to reduce the number of non-specific aligned sequences. For example, for the CMV virus (HSV-5), the step of masking the 4 low complexity regions passes through the modification of 155bp of the reference genome which become N (SEQ ID 1). In this case, the masking affects 0.06% of the nucleotides of the CMV genome.

Cette étape permet de ramener le nombre de séquences comptées pour les échantillons négatifs à un niveau basal proche de zéro et donc de discriminer plus facilement les échantillons faiblement concentrés en micro-organismes et les échantillons négatifs (figure 4). - Alignement sur le génome de référence de microorganismes :This step makes it possible to reduce the number of sequences counted for the negative samples to a basal level close to zero and thus to discriminate more easily the low concentration samples in microorganisms and the negative samples (FIG. 4). - Alignment on the reference genome of microorganisms:

Les séquences nucléotidiques qui ne s'alignent pas sur le génome humain, dont l'origine est inconnue, sont ensuite alignées sur le ou les génomes de référence cibles : génomes de parasites, viraux, de procaryotes ou de micro-organismes eucaryotes. Seuls les séquences s'alignant sans ambiguïté sont conservées. Le nombre de variants tolérés par séquences lors de l'alignement de cette séquence est dépendant du microorganisme étudié et de sa variabilité génique et de la plateforme de séquençage utilisé. Par exemple dans le cas d'un micro-organisme peu variable, comme les virus à ADN séquencé sur une plateforme Illumina HiSeql500™ en single-end de 26pb un maximum de 2 variants est toléré pour la suite de l'analyse (tableau 3).Nucleotide sequences that do not align with the human genome, whose origin is unknown, are then aligned with the target reference genome (s): parasite, viral, prokaryotic or eukaryotic microorganism genomes. Only sequences that align unambiguously are preserved. The number of variants tolerated by sequences during the alignment of this sequence is dependent on the microorganism studied and its gene variability and the sequencing platform used. For example, in the case of a non-variable micro-organism, such as DNA viruses sequenced on a platform Illumina HiSeql500 ™ single-end 26pb a maximum of 2 variants is tolerated for the following analysis (Table 3) .

Tableau 3 : Exemple de paramètres d'alignement des séquences nucléotidiques sur le génome de référence du microorganisme avec l'outil d'alignement Bowtie pour des données de séquençage Illumina obtenues sur HiSeqlSOO™ en single-end de 26pb - Impact du filtre de la présence des séquences nucléotidiques humaines sur la détection des microorganismes (acide nucléique contaminant) :Table 3: Example of alignment parameters of the nucleotide sequences on the microorganism reference genome with the Bowtie alignment tool for Illumina sequencing data obtained on HiSeqlSOO ™ 26pb single-end - Impact of the presence filter human nucleotide sequences on the detection of microorganisms (contaminating nucleic acid):

La première étape d'alignement des séquences sur le génome de référence humain s'effectue sur le génome de référence humain disponible le plus récent : GRCh38 (Genome ReferenceThe first sequence alignment step on the human reference genome is performed on the latest available human reference genome: GRCh38 (Genome Reference

Consortium Human genome build 38) mis à jour en 2013. L'élimination préalable des séquences humaines permet de diminuer le nombre d'alignements non spécifiques. Par exemple, le nombre de séquences nucléotidiques s'alignant sur le génome du CMV observés après les deux étapes d'alignement est inférieur à celui observé après alignement direct sur le génome de référence viral (figure 6).Consortium Human genome build 38) updated in 2013. The prior elimination of human sequences makes it possible to reduce the number of non-specific alignments. For example, the number of nucleotide sequences aligning with the CMV genome observed after the two alignment steps is less than that observed after direct alignment with the viral reference genome (FIG. 6).

Analyse quantitative des résultats - Validation de la profondeur de séquençage total :Quantitative Analysis of Results - Validation of Total Sequencing Depth:

Un premier filtre de validation de l'étape de séquençage est mis en place sur la base du nombre minimum de séquences qui doivent être obtenues afin d'assurer une profondeur de séquençage suffisante pour permettre la suite de l'analyse. De plus, un pourcentage de séquences suffisant s'alignant sur le génome de référence humain est nécessaire afin de valider le bon déroulement du séquençage.A first validation filter of the sequencing step is set up based on the minimum number of sequences that must be obtained to ensure a sufficient depth of sequencing to allow further analysis. In addition, a sufficient percentage of sequences aligning with the human reference genome is necessary in order to validate the smooth sequencing.

Dans le cas d'un séquençage comme décrit précédemment (Illumina HiSeql500™ en single-end de 26pb) un seuil de 10 millions de séquences minimales doit être obtenu (0,07X en équivalent génome humain) afin d'assurer une détection robuste et reproductible des séquences spécifiques des microorganismes étudiés (tableau 4). Ainsi, le procédé selon l'invention nécessite une profondeur de séquençage très faible du génome humain permettant de séquencer un maximum d'échantillons simultanément afin de minimiser les temps et les coûts de séquençage.In the case of sequencing as previously described (Illumina HiSeql500 ™ single-end 26pb) a threshold of 10 million minimum sequences must be obtained (0.07X in human genome equivalent) to ensure robust and reproducible detection specific sequences of the microorganisms studied (Table 4). Thus, the method according to the invention requires a very low depth of sequencing of the human genome to sequence a maximum of samples simultaneously to minimize sequencing times and costs.

Tableau 4 : Exemple de paramètres des filtres de qualité du séquençage pour des données de séquençage Illumina obtenues sur HiSeqlSOO™ en single-end de 26pb - Validation de l'homogénéité d'alignement :Table 4: Example of Sequencing Quality Filter Parameters for Illumina Sequencing Data Obtained on HiSeqlSOO ™ 26pb Single-End - Validation of Alignment Homogeneity:

Un filtre optionnel permet d'identifier les alignements biaisés en vérifiant si le génome est uniformément couvert par les séquences d'intérêts alignées. Cette vérification de l'homogénéité de l'alignement est réalisée en calculant l'écart-type de la profondeur de séquençage des régions génomiques présents uniformément dans l'échantillon.An optional filter is used to identify biased alignments by checking if the genome is uniformly covered by the aligned interest sequences. This verification of the homogeneity of the alignment is performed by calculating the standard deviation of the sequencing depth of the genomic regions present uniformly in the sample.

Typiquement, pour les micro-organismes ayant un génome à ADN, cette étape peut être réalisée sur l'ensemble du génome du micro-organisme. En revanche, pour les micro-organismes ayant un génome à ARN, tels que les virus à ARN, il peut être nécessaire de ne considérer que les régions inter-géniques non soumises aux variations d'expression pour cette validation.Typically, for microorganisms having a DNA genome, this step can be performed on the entire genome of the microorganism. On the other hand, for microorganisms with an RNA genome, such as RNA viruses, it may be necessary to consider only those intergenic regions not subject to expression variations for this validation.

On définit la profondeur de séquençage (depth) comme le nombre de séquences qui couvrent une région génomique particulière. La profondeur moyenne de séquençage (depthmean) est définie comme :The depth of sequencing is defined as the number of sequences that cover a particular genomic region. The average depth of depthmean is defined as:

nb reads ·* nombre de séquences alignées sur le génome longueurreads : nombre de nucléotides des séquences taillegénome : nombre de nucléotides du génome de référence L'écart-type de la profondeur de séquençage du génome est égal à :nb reads · * number of sequences aligned on the genome lengthreads: number of nucleotides of the genome size sequences: number of nucleotides of the reference genome The standard deviation of the sequencing depth of the genome is equal to:

depth± : profondeur pour une région génomique donnée sur le génome de référence depthmean : profondeur moyenne sur tout le génome de référence taillegénome : nombre de nucléotides du génome de référencedepth ±: depth for a given genomic region on the reference genome depthmean: average depth over the entire genome reference sizegenome: number of nucleotides of the reference genome

Comme la profondeur suit une loi de Poisson, l'écart-type théorique est égal à la racine de la moyenne (depthmean). Au final, le paramètre permettant d'estimer de l'homogénéité de l'alignement est un écart-type normalisé (centré) et asymétrique :As the depth follows a Poisson distribution, the theoretical standard deviation is equal to the root of the mean (depthmean). Finally, the parameter allowing to estimate the homogeneity of the alignment is a standardized (centered) and asymmetric standard deviation:

σ: écart-type de la profondeur sur tout le génome de référence depthmean : profondeur moyenne sur tout le génome de référence taillegênome : nombre de nucléotides du génome de référenceσ: standard deviation of the depth over the entire reference genome depthmean: mean depth over the entire reference genome genome size: number of nucleotides of the reference genome

Au final :Finally :

depth± : profondeur pour une région génomique donnée sur le génome de référence depthmean : profondeur moyenne sur tout le génome de référence nbreads : nombre de séquences alignées sur le génome longueurreads : nombre de nucléotides des séquences A partir de résultats de séquençage de bonne et de mauvaise qualité, un seuil a été établi pour lequel il est possible de déterminer la qualité du séquençage. Ainsi, un écart-type inférieur à ce seuil permet, indépendamment du génome de référence, d'affirmer que l'alignement est de bonne.depth ±: depth for a given genomic region on the reference genome depthmean: average depth over the entire reference genome nbreads: number of sequences aligned on the genome lengthreads: number of nucleotides of the sequences Based on the results of good sequencing and poor quality, a threshold has been established for which it is possible to determine the quality of sequencing. Thus, a standard deviation below this threshold makes it possible, independently of the reference genome, to affirm that the alignment is good.

Analyse quantitative des résultats : - Normalisation du nombre de séquences de microorganismes :Quantitative analysis of the results: - Normalization of the number of sequences of microorganisms:

Le nombre de séquences spécifiques de chaque micro-organisme recensé dans un échantillon est dépendant de la taille du génome de référence de l'organisme étudié. Plus le microorganisme étudié présente un génome de grande taille, plus la probabilité de retrouver des séquences de ce micro-organisme dans la librairie est importante. Afin de pouvoir quantifier chaque micro-organisme indépendamment de leur taille, on considérera non pas le nombre de séquences comptées mais la profondeur moyenne de séquençage du génome cible (depthmean) comme définit précédemment :The number of specific sequences of each microorganism identified in a sample is dependent on the size of the reference genome of the organism studied. The more the microorganism studied has a large genome, the greater the probability of finding sequences of this microorganism in the library. In order to be able to quantify each microorganism independently of their size, we will not consider the number of sequences counted but the average depth of sequencing of the target genome (depthmean) as previously defined:

nbreads : nombre de séquences alignées sur le génome longueurreads : nombre de nucléotides des séquences taillegénome : nombre de nucléotides du génome de référencenbreads: number of sequences aligned on the genome lengthreads: number of nucleotides of the sequences taillegénome: number of nucleotides of the reference genome

Le nombre de séquences comptées est directement proportionnel à la profondeur de séquençage totale obtenue à l'échelle de l'échantillon total. Plus le nombre de séquences issues du séquençage est élevé, plus le nombre de séquences d'origine microbienne sera important pour un échantillon présentant une même charge infectieuse (figure 7).The number of sequences counted is directly proportional to the total sequencing depth obtained at the scale of the total sample. The greater the number of sequences resulting from the sequencing, the more the number of sequences of microbial origin will be important for a sample having the same infectious load (FIG. 7).

Le nombre de séquences est donc normalisé par rapport au nombre de séquences totales :The number of sequences is therefore normalized with respect to the number of total sequences:

nbreads : nombre de séquences alignées sur le génome nbreadsTotai : nombre de séquences totales issues du séquençage ayant passées le filtre qualité c : constantenbreads: number of sequences aligned on the genome nbreadsTotai: number of total sequences resulting from the sequencing having passed the quality filter c: constant

La constante c permet enfin de rapporter la valeur de profondeur normalisée à une échelle interprétable :The constant c finally makes it possible to relate the value of standardized depth to an interpretable scale:

readsnorm : nombre de séquences alignées sur le génome après normalisation longueurreads : nombre de nucléotides des séquences taillegênome : nombre de nucléotides du génome de référence c : constante L'analyse de cohortes d'échantillons positifs, c'est à dire infectés par un micro-organisme, et d'échantillons négatifs non-infectés permet par une analyse ROC de déterminer un seuil de profondeur moyenne normalisée de séquençage du génome cible pour lequel il est possible de déterminer si l'échantillon est infecté ou non. Ainsi si depthnorm est supérieur au seuil alors l'échantillon sera probablement infecté par le micro-organisme d'intérêt. Le taux de faux-positifs et de faux-négatifs attendu est déterminé par les résultats de sensibilité et de spécificité du seuil déterminé par l'analyse ROC. - Détection d'une infection :readsnorm: number of sequences aligned on the genome after normalization lengthreads: number of nucleotides of the genome size sequences: number of nucleotides of the reference genome c: constant Analysis of cohorts of positive samples, that is to say infected with a micro- organism, and uninfected negative samples allows by a ROC analysis to determine a standardized average depth of sequencing of the target genome for which it is possible to determine whether the sample is infected or not. So if depthnorm is above the threshold then the sample will probably be infected by the microorganism of interest. The expected false-positive and false-negative rate is determined by the sensitivity and specificity results of the threshold determined by the ROC analysis. - Detection of an infection:

Le dépistage d'une infection par un micro-organisme est réalisé à partir de la profondeur moyenne de séquençage du génome du micro-organisme d'intérêt, calculé et normalisé comme décrit précédemment. Le z-score est un test statistique permettant de mettre en évidence un écart significatif d'une valeur au sein d'une population. Un z-score supérieur à 3 permet d'identifier des échantillons pour lesquels, statistiquement le nombre de séquences nucléotidiques s'alignant sur le génome cible est différent de celui de la population étudiée. Le z-score est calculé à partir de la moyenne (mean) et de la déviation absolue de la déviation standard (StDev) du nombre de séquences alignées et normalisées de tous les échantillons étudiés :Screening for infection by a microorganism is made from the average depth of sequencing of the genome of the microorganism of interest, calculated and standardized as described above. The z-score is a statistical test to highlight a significant difference in a value within a population. A z-score greater than 3 makes it possible to identify samples for which, statistically, the number of nucleotide sequences aligning with the target genome is different from that of the population studied. The z-score is calculated from the mean (mean) and the absolute deviation of the standard deviation (StDev) from the number of aligned and normalized sequences of all the samples studied:

readsnorm : nombre de séquences alignées sur le génome après normalisation. - quantification de l'infection : A partir de gammes croissantes d'échantillons infectés, séquencés préalablement, il est possible d'effectuer une régression permettant d'estimer le taux d'infection des échantillons testés. De manière générale ces gammes, de concentrations en séquences microbiennes connues, doivent être séquencées au minimum en duplicate. Un minimum de 4 points de gamme est requis pour cette étape.readsnorm: number of sequences aligned on the genome after normalization. - quantification of the infection: From increasing ranges of infected samples, sequenced beforehand, it is possible to perform a regression to estimate the infection rate of the samples tested. In general, these ranges, of known microbial sequence concentrations, must be sequenced at least in duplicate. A minimum of 4 range points is required for this step.

La profondeur moyenne normalisée est calculée pour chaque point de gamme et est corrélée de manière linéaire à la concentration en contaminant du point de gamme (figure 8). Une régression linéaire est alors réalisée afin de déterminer l'équation permettant de relier le taux d'infection (concentration en contaminant) et la profondeur moyenne normalisée de séquençage du génome (depthnorm) :The normalized mean depth is calculated for each range point and is correlated linearly with the range point contaminant concentration (Figure 8). A linear regression is then performed to determine the equation for linking the infection rate (contaminant concentration) and the normalized average depth of genome sequencing (depthnorm):

depthnorm : profondeur moyenne normalisée sur tout le génome de référence k : constantedepthnorm: standardized mean depth over the entire reference genome k: constant

Exemple de réalisation n°l : Détection et quantification de cytomégalovirus (CMV) plasmatique chez la femme enceinteEmbodiment No. 1: Detection and Quantification of Cytomegalovirus (CMV) Plasma in Pregnant Women

Le CMV appartient à la famille des herpesviridae. Il s'agit d'un virus enveloppé à ADN double brin d'environ 240kb. L'infection est latente avec un maintien du génome viral sous forme d'épisome dans les macrophages ou les cellules endothéliales (Bolovan-Fritts et al., 1999). Sa transmission est interhumaine et se fait principalement par contact entre les muqueuses. Au cours du processus d'infection, la transmission du virus chez l'hôte s'effectue par contacts intercellulaires notamment grâce aux macrophages circulants.CMV belongs to the family of herpesviridae. It is a double-stranded DNA enveloped virus of about 240kb. The infection is latent with maintenance of the viral genome as an episome in macrophages or endothelial cells (Bolovan-Fritts et al., 1999). Its transmission is interhuman and is mainly by contact between the mucous membranes. During the infection process, transmission of the virus in the host is carried out by intercellular contacts, in particular through circulating macrophages.

La primo-infection par le CMV touche près de 50% de la population mondiale et est asymptomatique dans la plupart des cas. Le CMV peut être réactivé au cours de la vie d'un individu. De même, des infections à partir de différentes souches virales peuvent également être observées. Parmi les plus connues, 4 souches non manipulées génétiquement, ont été isolées et entièrement séquencées (Dolan et al., 2004) (tableau 5).Primary CMV infection affects almost 50% of the world's population and is asymptomatic in most cases. CMV can be reactivated during the life of an individual. Similarly, infections from different viral strains can also be observed. Among the best known, 4 non-genetically engineered strains were isolated and fully sequenced (Dolan et al., 2004) (Table 5).

Tableau 5 : Description des principales souches de référence du CMV (NCBI®)Table 5: Description of the main CMV reference strains (NCBI®)

Parmi les souches isolées après culture cellulaire prolongée, des délétions ont été observées pouvant expliquer leur résistance et leur survie en culture. Au final, la souche de référence considérée comme la plus proche du CMV primaire observé chez l'homme et la souche Merlin. L'infection par le CMV au cours de la grossesse résulte dans la majorité des cas d'une primo-infection intervenant chez une femme séronégative. De manière plus minoritaire, l'infection peut découler d'une infection secondaire ou d'une réactivation virale chez les femmes séropositives. Les manifestations cliniques sont dans tous les cas inexistantes ou mineures (syndrome grippal).Among the strains isolated after prolonged cell culture, deletions were observed that could explain their resistance and survival in culture. Finally, the reference strain considered to be the closest to the primary CMV observed in humans and the Merlin strain. CMV infection during pregnancy is mostly the result of a primary infection in an HIV-negative woman. More rarely, infection can result from secondary infection or viral reactivation in HIV-positive women. The clinical manifestations are in all cases non-existent or minor (flu syndrome).

Les femmes enceintes séronégatives en début de grossesse sont donc les principaux sujets à risque. En France, plusieurs études épidémiologiques ont montré que 50% à 55% des femmes en âge de procréer présentent une sérologie CMV négative. Chez ces femmes, le risque d'infection au cours de la grossesse est d'environ 1%. L'incidence des infections secondaires ou des réactivations virales est peu connue (Adler, 2011).Seronegative pregnant women in early pregnancy are therefore the main subjects at risk. In France, several epidemiological studies have shown that 50% to 55% of women of childbearing age have a negative CMV serology. In these women, the risk of infection during pregnancy is about 1%. The incidence of secondary infections or viral reactivations is poorly known (Adler, 2011).

En cas d'infection chez la mère, le virus peut infecter le fœtus par l'intermédiaire de la barrière fœto-placentaire. L'infection congénitale du fœtus est définie par la détection du virus dans la circulation du nouveau-né dans les 3 premières semaines de vie, et intervient dans 40% à 50% des cas de primo-infection au cours de la grossesse. Au final, la prévalence du CMV à la naissance est d'environ 0,5% à 1%. L'ampleur des complications résultant d'une infection congénitale est encore mal définie. Les symptômes peuvent émerger à la naissance chez 10 à 20 % des nourrissons infectés ou au cours de la première année de vie chez près de 30% des enfants infectés asymptomatiques à la naissance. Plusieurs types de séquelles neurologiques et/ou sensorielles sont souvent retrouvés chez les enfants symptomatiques (tableau 6). Dans 5% des cas, l'infection par le CMV à la naissance entraîne le décès du nouveau-né (Benoist et al., 2013; James and Kimberlin, 2016).In case of infection in the mother, the virus can infect the fetus via the fœto-placental barrier. The congenital infection of the fetus is defined by the detection of the virus in the circulation of the newborn in the first 3 weeks of life, and intervenes in 40% to 50% of the cases of primary infection during the pregnancy. In the end, the prevalence of CMV at birth is about 0.5% to 1%. The magnitude of complications resulting from congenital infection is still poorly defined. Symptoms can occur at birth in 10 to 20% of infected infants or in the first year of life in up to 30% of asymptomatic infants born at birth. Several types of neurological and / or sensory sequelae are often found in symptomatic children (Table 6). In 5% of cases, CMV infection at birth results in the death of the newborn (Benoist et al., 2013, James and Kimberlin, 2016).

Tableau 6 : Description des principales séquelles observées chez le nouveau-né atteint d'une Infection congénitale par le CMV (James and Kimberlin, 2016)Table 6: Description of the main sequelae observed in neonates with congenital CMV infection (James and Kimberlin, 2016)

La primo-infection chez la mère est d'autant plus fréquente que 1 ' âge de la gestation augmente. De plus, il a été montré que le risque pour le fœtus augmente lorsque la primoinfection intervient en début de grossesse (avant le premier semestre, 26% des fœtus présenteront une pathologie sévère contre seulement 6,2% au cours des deuxièmes et troisièmes semestres de grossesse) (Daiminger et al., 2005; Liesnard et al·, 2000). A ce jour, en France, seules quatre pathologies infectieuses font l'objet de programmes de dépistage prénatal obligatoire : la toxoplasmose, la rubéole, la syphilis et l'hépatite B. Bien que la transmission verticale du CMV soit la principale cause infectieuse de malformation congénitale, le dépistage prénatal du CMV n'est pas réalisé de manière systématique. Cependant, malgré l'absence de recommandation, le dépistage prénatal sérologique du CMV au cours de la grossesse est réalisé de plus en plus fréquemment.The primary infection in the mother is all the more frequent as the age of gestation increases. In addition, it has been shown that the risk to the fetus increases when primary infection occurs in early pregnancy (before the first half, 26% of fetuses will present a severe pathology compared to only 6.2% during the second and third semesters of pregnancy) (Daiminger et al., 2005, Liesnard et al., 2000). To date, in France, only four infectious diseases are the subject of mandatory prenatal screening programs: toxoplasmosis, rubella, syphilis and hepatitis B. Although the vertical transmission of CMV is the main infectious cause of malformation congenital, prenatal CMV screening is not performed systematically. However, despite the absence of a recommendation, prenatal serological screening for CMV during pregnancy is being carried out more and more frequently.

Au cours de la grossesse, la détection de l'infection chez la mère peut être réalisée grâce à des tests sérologiques : dosage des immunoglobulines de type M et mesure de l'avidité des immunoglobulines de type G par des tests Elisa. Le dosage des immunoglobulines ne permet pas d'identifier précisément les primo-infections car elles peuvent persister longtemps après l'infection. De plus leur interprétation reste difficile, notamment du fait d'une absence de standardisation des tests proposés et du statut sérologique des sujets infectés au cours du temps. D'après la Haute Autorité de Santé, l'établissement de la date de l'infection n'est possible que dans 75% à 80% des cas. De plus, ce test ne permet pas d'identifier des infections secondaires.During pregnancy, the detection of infection in the mother can be achieved through serological tests: assay of immunoglobulin type M and measurement of the avidity of immunoglobulin type G by Elisa tests. The immunoglobulin assay does not accurately identify primary infections because they may persist long after infection. Moreover their interpretation remains difficult, in particular because of a lack of standardization of the proposed tests and the serological status of the infected subjects over time. According to the High Health Authority, the date of infection is only possible in 75% to 80% of cases. In addition, this test does not identify secondary infections.

Le suivi échographique permet d'identifier des anomalies du développement embryonnaire non spécifiques de l'infection congénitale par le CMV. Cependant, dans près de la moitié des cas qui présenteront des séquelles, aucun signe n'est observé au cours de la grossesse, d'où l'importance de détecter le CMV.Ultrasound monitoring can identify non-specific embryonic developmental abnormalities of congenital CMV infection. However, in nearly half of the cases with sequelae, no signs are observed during pregnancy, hence the importance of detecting CMV.

Actuellement, la confirmation de l'infection du fœtus par le CMV peut être réalisée par le biais d'un geste invasif. La présence de particules ou d'ADN viral dans le liquide amniotique est mis en évidence par des techniques de culture cellulaire ou de PCR et permet alors de diagnostiquer une infection chez le fœtus. Cependant, les gestes invasifs sont dangereux et leur spécificité, de même que leur sensibilité, restent limitées. Des résultats faux-négatifs peuvent être dus à des amniocentèses réalisées trop tôt au cours du développement fœtal (la fonction d'urination fœtale apparaît seulement après 2 0 semaines de grossesse) et trop tôt après l'infection (6 à 8 semaines pour que le CMV soit excrété dans l'urine). Par ailleurs, des faux-positifs peuvent être le résultat d'une contamination par le sang maternel intervenant suite au geste invasif (amniocentèse).Currently, confirmation of fetal CMV infection can be achieved through an invasive procedure. The presence of particles or viral DNA in the amniotic fluid is demonstrated by cell culture or PCR techniques and can then diagnose an infection in the fetus. However, invasive procedures are dangerous and their specificity, as well as their sensitivity, remain limited. False-negative results may be due to amniocentesis performed too early during fetal development (fetal urination function appears only after 20 weeks of pregnancy) and too soon after infection (6 to 8 weeks for CMV is excreted in the urine). In addition, false positives can be the result of a contamination by the maternal blood intervening following the invasive gesture (amniocentesis).

La symptomatologie de l'infection chez l'adulte n'est pas spécifique (syndrome grippal) et ne permet pas de poser le diagnostic de l'infection par le CMV. Les tests sérologiques actuels ne permettent pas d'identifier toutes les infections actives chez la femme enceinte, notamment dans le cas des infections secondaires ou réactivation virale, et sont peu précis. De plus, le suivi échographique seul ne permet pas d'estimer le risque d'infection congénitale du fœtus. En cas de doute, seul un geste invasif permet de poser le diagnostic et d'évaluer le risque pour le fœtus. L'identification de la présence d'ADN circulant plasmatique d'origine fœtale, de même que l'émergence des technologies de séquençage nouvelle génération, a permis le développement du dépistage et du diagnostic prénatal non invasif de différentes pathologies (DPNI) : détermination du génotype RHD, dépistage des aneuploïdies fœtales... Par exemple, la surreprésentation de séquences spécifiques du chromosome 21 dans le plasma permet de mettre en évidence une trisomie 21 (ou Syndrome de Down) chez le fœtus. Le séquençage entier de 1'ADN plasmatique maternel permet de dépister d'éventuelles aneuploïdies fœtales.The symptomatology of the infection in the adult is not specific (flu syndrome) and does not allow to make the diagnosis of the CMV infection. Current serological tests do not identify all active infections in pregnant women, particularly in the case of secondary infections or viral reactivation, and are not accurate. In addition, ultrasound alone can not be used to estimate the risk of congenital fetal infection. In case of doubt, only an invasive procedure makes it possible to make the diagnosis and to evaluate the risk for the fetus. The identification of the presence of circulating plasmatic DNA of fetal origin, as well as the emergence of the new generation sequencing technologies, allowed the development of non-invasive prenatal screening and diagnosis of various pathologies (PNID): For example, the overrepresentation of chromosome 21-specific sequences in the plasma makes it possible to demonstrate trisomy 21 (or Down syndrome) in the fetus. The entire sequencing of the maternal plasma DNA makes it possible to detect possible fetal aneuploidies.

Le procédé de la présente invention utilise le séquençage du génome de 1'ADN plasmatique maternel pour détecter chez la mère une infection par le virus du CMV. En effet, en cas d'infection active le virus se retrouve dans la circulation sanguine : de 1'ADN viral peut ainsi être observé et quantifié dans le plasma maternel. Ce test non-invasif permet de déterminer avec précision le statut infectieux de la femme au cours de la grossesse, et ainsi améliorer la prise en charge des femmes infectées en limitant notamment le nombre de gestes invasifs proposés.The method of the present invention utilizes genome sequencing of maternal plasma DNA to detect CMV virus infection in the mother. Indeed, in case of active infection the virus is found in the bloodstream: viral DNA can thus be observed and quantified in the maternal plasma. This non-invasive test makes it possible to accurately determine the infective status of the woman during pregnancy, and thus improve the management of infected women by limiting the number of invasive procedures proposed.

Le test de dépistage prénatal est réalisé selon l'invention à partir d'échantillons de plasma maternels. Le plasma est récolté après centrifugation d'un prélèvement sanguin de la femme enceinte et récupération de la phase surnageante. Cette phase liquide ne contient pas de cellules sanguines. L'ADN circulant dans le plasma est ensuite extrait afin de permettre la production des librairies qui permettent le séquençage du génome entier de chaque échantillon sur la plateforme Illumina HiSeql500™, selon les recommandations du fabriquant. Le séquençage est réalisé dans cet exemple en single end. Les données brutes issues du séquençage sous forme de fichier bel sont ensuite convertis sous forme de fichiers fastq contenant la totalité des séquences nucléotidiques obtenues par échantillon. Les fichiers fastq contenant les séquences sont ensuite traités conformément à la présente invention (figure 9).The prenatal screening test is carried out according to the invention from maternal plasma samples. Plasma is collected after centrifugation of a blood sample from the pregnant woman and recovery of the supernatant phase. This liquid phase does not contain blood cells. Plasma circulating DNA is then extracted to allow the production of libraries that allow the sequencing of the entire genome of each sample on the Illumina HiSeql500 ™ platform, according to the manufacturer's recommendations. Sequencing is performed in this example as a single end. The raw data from sequencing as a bel file are then converted into fastq files containing all the nucleotide sequences obtained per sample. The fastq files containing the sequences are then processed according to the present invention (FIG. 9).

Au total, 82 échantillons de plasma maternel ont été séquencés. A ce test de dépistage prénatal ont été ajouté 5 échantillons contrôles (4 contrôles positifs et 1 contrôle négatif). L'alignement successif des séquences sur le génome humain puis sur le génome de référence du CMV modifié comme décrit précédemment (SEQ ID 1) permet d'identifier, pour chaque échantillon, les séquences nucléotidiques spécifiques du CMV (tableau 7).A total of 82 maternal plasma samples were sequenced. To this prenatal screening test were added 5 control samples (4 positive controls and 1 negative control). The sequential alignment of the sequences on the human genome and then on the modified CMV reference genome as described above (SEQ ID No. 1) makes it possible to identify, for each sample, the CMV-specific nucleotide sequences (Table 7).

Tableau 7. Résultats des différentes étapes d'alignementTable 7. Results of the different alignment steps

Les échantillons contrôles ont passé les deux filtres qualité du procédé selon l'invention, validant pour ces échantillons une profondeur de séquençage suffisante et un alignement des séquences sur le génome du CMV homogène. Parmi les contrôles positifs analysés, tous sont détectés positifs à l'infection au CMV dans le procédé selon l'invention avec une profondeur normalisée supérieur au seuil de 0,1424 déterminé par des tests préalablement effectués sur une gamme d'échantillons de concentration virale connue [range : 0,2926-18.9330]. De même, la charge virale (concentration en contaminant) estimée par le procédé selon l'invention est cohérente avec la charge virale théorique (concentration en contaminant théorique) des échantillons contrôles positifs (R2=0.98). Le contrôle négatif sort bien comme non-infecté par le CMV avec une profondeur normalisée égale à 0,00019.The control samples passed the two quality filters of the method according to the invention, validating for these samples a sufficient depth of sequencing and alignment of the sequences on the homogeneous CMV genome. Of the positive controls analyzed, all were detected positive for CMV infection in the method according to the invention with a standardized depth greater than the threshold of 0.1424 determined by tests previously carried out on a range of samples of known viral concentration. [range: 0.2926-18.9330]. Similarly, the viral load (contaminant concentration) estimated by the method according to the invention is consistent with the theoretical viral load (theoretical contaminant concentration) of the positive control samples (R2 = 0.98). The negative control comes out well as non-infected with CMV with a standardized depth equal to 0.00019.

Au sein des 82 échantillons primaires testés, 1 seul n'a pas passé les filtres qualité du fait d'une profondeur de séquençage trop faible : 40.450 séquences obtenues contre en moyenne 19.468.992 séquences obtenues pour tous les échantillons. L'analyse quantitative conclue notamment à une infection positive de cet échantillon avec une profondeur normalisée supérieur à 0,1424. Ce résultat faux-positifs met en évidence la nécessité de valider la qualité du séquençage en vérifiant que la profondeur de séquençage est suffisante pour la suite de l'analyse. Pour les 81 échantillons restant : 80 sont négatifs à l'infection et 1 est positif avec une charge virale (concentration en contaminant) estimée à 9.889 copies/mL (figure 10).In the 82 primary samples tested, only 1 did not pass the quality filters because of a too low depth of sequencing: 40,450 sequences obtained against an average 19,468,992 sequences obtained for all the samples. The quantitative analysis concludes in particular to a positive infection of this sample with a standardized depth greater than 0.1424. This false-positive result highlights the need to validate the quality of sequencing by verifying that the sequencing depth is sufficient for further analysis. For the 81 remaining samples: 80 are negative for infection and 1 is positive with a viral load (contaminant concentration) estimated at 9,889 copies / mL (Figure 10).

Cette approche utilise des résultats de séquençage utilisés pour réaliser d'autres dépistages de pathologies fœtales de manière non-invasive (dépistage des aneuploïdies fœtales). La détection de virus et d'autres micro-organismes plasmatiques au cours de la grossesse permet pour un coût et un temps identiques d'augmenter le nombre d'informations ayant un intérêt pour la santé de la femme et du bébé au cours de la grossesse.This approach uses sequencing results used to perform other non-invasive fetal pathology screenings (fetal aneuploidy screening). The detection of viruses and other plasma microorganisms during pregnancy allows for the same cost and time to increase the number of information of interest to the health of the woman and the baby during pregnancy .

Exemple de réalisation n°2 : Détection et quantification de séquences virales dans le diagnostic de tumeurs solides L'oncogenèse (ou transformation maligne) est le processus qui transforme une cellule normale en cellule cancéreuse. Ce processus passe par l'acquisition de propriétés particulières telles que la prolifération incontrôlée, l'échappement au système immunitaire... (Hanahan and Weinberg, 2011). Il peut être induit par de nombreux évènements dont les infections virales. En effet, depuis l'identification par Peyton Rous du virus RSV (Rous Sarcoma Virus) capable d'entraîner l'apparition d'un sarcome chez le poulet, de nombreux virus à ADN et à ARN ont été associées à l'apparition d'un cancer chez l'Homme (tableau 8). Néanmoins, le caractère oncogénique des virus a été longuement débattu, du fait notamment de leur caractère ubiquitaire et du délai entre infection virale et développement d'une tumeur.Embodiment 2: Detection and quantification of viral sequences in the diagnosis of solid tumors Oncogenesis (or malignant transformation) is the process that transforms a normal cell into a cancerous cell. This process involves the acquisition of particular properties such as uncontrolled proliferation, escape from the immune system ... (Hanahan and Weinberg, 2011). It can be induced by many events including viral infections. Indeed, since the identification by Peyton Rous of RSV virus (Rous Sarcoma Virus) capable of causing the appearance of sarcoma in chicken, many DNA and RNA viruses have been associated with the appearance of cancer in humans (Table 8). Nevertheless, the oncogenic character of the viruses has been discussed at length, in particular because of their ubiquitous nature and the time between virus infection and tumor development.

Tableau 8 : Exemples de virus oncogènesTable 8: Examples of Oncogenic Viruses

La transformation maligne d'un tissu dépend du tropisme des virus et s'accompagne de la persistance du génome viral dans les cellules tumorales le plus souvent après intégration dans l'ADN de la cellule hôte (provirus). L'intégration du virus se faisant de manière aléatoire dans le génome humain, l'action oncogénique des virus semble provenir, non pas d'une mutagénèse d'insertion mais de modification physiologique de la cellule infectée par les protéines virales.The malignant transformation of a tissue depends on the tropism of the viruses and is accompanied by the persistence of the viral genome in the tumor cells most often after integration into the DNA of the host cell (provirus). Since the integration of the virus occurs randomly in the human genome, the oncogenic action of the viruses seems to come not from an insertion mutagenesis but from a physiological modification of the cell infected by the viral proteins.

Certains virus ont été directement associés à certains types de cancers : - EBV et carcinome nasopharyngé : Le virus Epstein-Barr ( EBV ou HSV-4) est un virus de la famille des herpesviridae. Il s'agit d'un virus à ADN double brin dont l'infection ubiquitaire affecte près de 90% de la population mondiale. L'infection primaire par EBV peut être asymptomatique ou s'accompagner de l'émergence d'une pathologie bénigne de type mononucléose. L'EBV est un virus à infection latente qui persiste après infection dans les lymphocytes B sous forme d'épisome. Chez des sujets sains, il est fréquent d'observer des réactivations virales au cours de la vie.Some viruses have been directly associated with certain types of cancer: - EBV and nasopharyngeal carcinoma: Epstein-Barr virus (EBV or HSV-4) is a virus of the family Herpesviridae. It is a double-stranded DNA virus whose ubiquitous infection affects nearly 90% of the world's population. Primary infection with EBV may be asymptomatic or may be accompanied by the emergence of benign mononucleosis. EBV is a latently infected virus that persists after infection in B-lymphocytes as an episome. In healthy subjects, it is common to observe viral reactivations in the course of life.

Il existe plusieurs formes de latence en fonction des gènes dont l'expression persiste dans les cellules hôtes. Un défaut de contrôle de cet état peut entraîner l'émergence d'une tumeur. Dans le carcinome nasopharyngé (NEC) il a été observé, spécifiquement, la présence du génome de l'EBV dans les cellules épithéliales tumorales. Dans la majorité des cas, il est possible d'observer la présence de multiples copies du génome virale sous forme d'épisome dans les cellules infectées (Raab-Traub, 2015). - EBV, HPV et cancer œsophagien : Le cancer œsophagien est l'un des cancers les plus fréquents observés chez l'Homme. De multiples facteurs sont impliqués dans l'émergence d'une tumeur, et notamment les agents infectieux tels que les papillomavirus (HPV), EBV ou la bactérie H. pylori (Xu et al., 2015). En fonction de l'infection à l'origine de la transformation tumorale, le type de tumeur qui va émerger peut varier. De même, les approches thérapeutiques envisagées peuvent être différentes, de même que les techniques permettant le suivi de la maladie.There are several forms of latency depending on the genes whose expression persists in the host cells. A lack of control of this state can lead to the emergence of a tumor. In nasopharyngeal carcinoma (NEC), the presence of the EBV genome has been observed specifically in tumor epithelial cells. In the majority of cases, it is possible to observe the presence of multiple copies of the viral genome as an episome in infected cells (Raab-Traub, 2015). - EBV, HPV and oesophageal cancer: Esophageal cancer is one of the most common cancers observed in humans. Multiple factors are involved in the emergence of a tumor, including infectious agents such as papillomavirus (HPV), EBV or H. pylori bacteria (Xu et al., 2015). Depending on the infection causing the tumor transformation, the type of tumor that will emerge may vary. In the same way, the therapeutic approaches envisaged can be different, as well as the techniques allowing the follow-up of the disease.

La découverte d'ADN tumoral circulant dans le plasma a permis la mise en place de nouvelles stratégies de détection et de suivi non-invasif des cancers (Anker et al., 1999). Par exemple, dans le cas d'EBV, il a été montré que la quantité de virus circulant dans le plasma des patients était dépendante du statut de réponse à un traitement et pouvait être utilisé comme biomarqueur de réponse anti-tumorale. Un test unique permettant de quantifier des marqueurs présents sur l'ADN tumoral humain tels que les microsatellites, de même que des marqueurs viraux pourrait améliorer le diagnostic et le suivi de la maladie de manière non-invasive et plus précise. De plus, la caractérisation de l'infection virale associée à une transformation tumorale peut participer à l'amélioration du diagnostic en facilitant la discrimination entre plusieurs type tumoraux chez un individu et en proposant des stratégies thérapeutiques plus ciblées. C'est le cas par exemple des cancers œsophagiens qui peuvent être liées à diverses infections par des micro-organismes. Cette approche est notamment utile dans les cas des tumeurs trop difficiles d'accès pour permettre les biopsies.The discovery of tumor DNA circulating in the plasma has made it possible to set up new strategies for detecting and monitoring non-invasive cancers (Anker et al., 1999). For example, in the case of EBV, it has been shown that the amount of virus circulating in patients' plasma was dependent on the response status of a treatment and could be used as a biomarker of anti-tumor response. A single test to quantify markers on human tumor DNA such as microsatellites, as well as viral markers, could improve the diagnosis and monitoring of the disease in a non-invasive and more accurate way. In addition, the characterization of the viral infection associated with a tumor transformation can contribute to the improvement of the diagnosis by facilitating the discrimination between several tumor types in an individual and by proposing more targeted therapeutic strategies. This is the case, for example, with oesophageal cancers that can be linked to various infections by micro-organisms. This approach is particularly useful in the case of tumors too difficult to access to allow biopsies.

Le test de dépistage selon l'invention est réalisé à partir d'échantillons de plasma. L'ADN plasmatique est extrait comme décrit précédemment. La production des librairies qui permettent le séquençage du génome entier de chaque échantillon sur la plateforme Illumina MySeq, est réalisée selon les recommandations du fabriquant. Le séquençage est réalisé dans cet exemple en single end. Les données brutes issues du séquençage sous forme de fichier bel sont ensuite converties sous forme de fichiers fastq contenant la totalité des séquences nucléotidiques obtenues par échantillon. Les fichiers fastq contenant les séquences sont ensuite traités conformément à l'invention comme précédemment décrit (figure 9)·The screening test according to the invention is carried out from plasma samples. Plasma DNA is extracted as previously described. The production of libraries that allow the sequencing of the entire genome of each sample on the Illumina MySeq platform is performed according to the manufacturer's recommendations. Sequencing is performed in this example as a single end. The raw data from the bel file sequencing are then converted into fastq files containing all the nucleotide sequences obtained per sample. The fastq files containing the sequences are then processed according to the invention as previously described (FIG. 9).

Au total, 17 échantillons de plasma tests ont été séquencés et analysés. L'alignement successif des séquences sur le génome humain puis sur les 9 génomes de référence permet d'identifier, pour chaque échantillon, des séquences nucléotidiques d'origine virale.A total of 17 plasma test samples were sequenced and analyzed. The sequential alignment of the sequences on the human genome and then on the 9 reference genomes makes it possible to identify, for each sample, nucleotide sequences of viral origin.

Tous les échantillons séquencés ont passé les tests qualités validant à la fois la qualité de séquençage globale et la qualité de l'alignement des séquences sur les génomes de référence étudiés. Sur les 17 échantillons analysés pour 9 génomes de référence (SEQ ID 1 pour le CMV), 3 échantillons sortent positifs avec une profondeur normalisée supérieure au seuil de 0,1426 préalablement établi par l'étude d'une gamme d'échantillons infectés de concentration virale connue. Ces 3 échantillons correspondant aux 3 contrôles positifs de l'étude. Les autres, étaient négatifs, comme attendu, pour toutes les références étudiées (tableau 9).All sequenced samples passed the quality tests validating both the overall sequencing quality and the quality of sequence alignment on the reference genomes studied. Of the 17 samples analyzed for 9 reference genomes (SEQ ID 1 for CMV), 3 samples were positive with a normalized depth greater than the threshold of 0.1426 previously established by the study of a range of infected samples of concentration. viral known. These 3 samples corresponding to the 3 positive controls of the study. The others were negative, as expected, for all references studied (Table 9).

Tableau 9 : Résultats positifs issus de l'analyse L'alignement est spécifique : les contrôles positifs présentent une profondeur de séquençage supérieur au seuil de détection uniquement pour un unique génome de référence (figure 11). Ainsi il est possible d'identifier de manière spécifique (spécificité : 100% sur 17 échantillons testés) et sensible (sensibilité : 100% sur 17 échantillons testés) des échantillons présentant une virémie pour une ou plusieurs espèces virales.Table 9: Positive results from the analysis The alignment is specific: positive controls have a depth of sequencing greater than the detection limit only for a single reference genome (Figure 11). Thus it is possible to specifically identify (specificity: 100% of 17 samples tested) and sensitive (sensitivity: 100% of 17 samples tested) samples showing viremia for one or more viral species.

Dans cet exemple, l'utilisation des technologies de séquençage à haut-débit met en évidence l'utilité de la détection et de la quantification de virus dans le diagnostic et le suivi de patients atteints de cancer viro-induit. La détection de faible concentration de virus permet, dans ce cas, de suivre et de quantifier par exemple la rémission de patients sous traitement avec une bonne sensibilité. RéférencesIn this example, the use of high throughput sequencing technologies highlights the utility of virus detection and quantification in the diagnosis and follow-up of virally induced cancer patients. The detection of low virus concentration makes it possible, in this case, to monitor and quantify, for example, the remission of patients undergoing treatment with good sensitivity. References

Adler, S.P. (2011). Screening for Cytomégalovirus during Pregnancy. Infect. Dis. Obstet. Gynecol. 2011.Adler, S.P. (2011). Screening for Cytomegalovirus during Pregnancy. Infect. Dis. Obstet. Gynecol. 2011.

Anker, P., Mulcahy, H., Chen, X.Q., and Stroun, M. (1999). Détection of circulating tumour DNA in the blood (plasma/serum) of cancer patients. Cancer Metastasis Rev. 18, 65-73.Anker, P., Mulcahy, H., Chen, X.Q., and Stroun, M. (1999). Detection of circulating tumor DNA in the blood (plasma / serum) of cancer patients. Cancer Metastasis Rev. 18, 65-73.

Benoist, G., Leruez-Ville, M., Magny, J.F., Jacquemard, F., Salomon, L.J., and Ville, Y. (2013). Management of pregnancies with confirmed cytomégalovirus fêtai infection. Fêtai Diagn. Ther. 33, 203-214.Benoist, G., Leruez-City, M., Magny, J.F., Jacquemard, F., Salomon, L.J., and Ville, Y. (2013). Management of pregnancies with confirmed cytomegalovirus feasted infection. Feast Diagn. Ther. 33, 203-214.

Blackadar, C.B. (2016). Historical review of the causes of cancer. World J. Clin. Oncol. 7, 54—86.Blackadar, BC (2016). Historical review of the causes of cancer. World J. Clin. Oncol. 7, 54-86.

Bolovan-Fritts, C.A., Mocarski, E.S., and Wiedeman, J.A. (1999). Peripheral blood CD14(+) cells from healthy subjects carry a circular conformation of latent cytomégalovirus genome. Blood 93, 394—398.Bolovan-Fritts, C.A., Mocarski, E.S., and Wiedeman, J.A. (1999). Peripheral blood CD14 (+) cells from healthy subjects carry a circular conformation of latent cytomegalovirus genome. Blood 93, 394-398.

Daiminger, A., Bâder, U., and Enders, G. (2005). Pre- and periconceptional primary cytomégalovirus infection: risk of vertical transmission and congénital disease. BJOG Int. J. Obstet. Gynaecol. 112, 166—172.Daiminger, A., Bâder, U., and Enders, G. (2005). Pre- and periconceptional primary cytomegalovirus infection: risk of vertical transmission and congenital disease. BJOG Int. J. Obstet. Gynaecol. 112, 166-172.

De Vlaminck, I., Martin, L., Kertesz, M., Patel, K., Kowarsky, M., Strehl, C., Cohen, G., Luikart, H., Neff, N.F., Okamoto, J., et al. (2015). Noninvasive monitoring of infection and rejection after lung transplantation. Proc. Natl. Acad. Sci. U. S. A. 112, 13336-13341.From Vlaminck, I., Martin, L., Kertesz, M., Patel, K., Kowarsky, M., Strehl, C., Cohen, G., Luikart, H., Neff, NF, Okamoto, J., et al. (2015). Noninvasive monitoring of infection and rejection after lung transplantation. Proc. Natl. Acad. Sci. U.S.A. 112, 13336-13341.

Dunn, W., Chou, C., Li, H., Hai, R., Patterson, D., Stolc, V., Zhu, H., and Liu, F. (2003). Functional profiling of a human cytomégalovirus genome. Proc. Natl. Acad. Sci. U. S. A. 100, 14223-14228.Dunn, W., Chou, C., Li, H., Hai, R., Patterson, D., Stolc, V., Zhu, H., and Liu, F. (2003). Functional profiling of a human cytomegalovirus genome. Proc. Natl. Acad. Sci. U.S.A. 100, 14223-14228.

Hanahan, D., and Weinberg, R.A. (2011). Hallmarks of cancer: the next génération. Cell 144, 646—674.Hanahan, D., and Weinberg, R.A. (2011). Hallmarks of cancer: the next generation. Cell 144, 646-674.

James, S.H., and Kimberlin, D.W. (2016). Advances in the prévention and treatment of congénital cytomégalovirus infection. Curr. Opin. Pediatr. 28, 81—85.James, S.H., and Kimberlin, D.W. (2016). Advances in the prevention and treatment of congenital cytomegalovirus infection. Curr. Opin. Pediatr. 28, 81-85.

Langmead, B., Trapnell, C., Pop, M., and Salzberg, S.L. (2009). Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10, R25.Langmead, B., Trapnell, C., Pop, M., and Salzberg, S.L. (2009). Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10, R25.

Liesnard, C., Donner, C., Brancart, F., Gosselin, F., Delforge, M.L., and Rodesch, F. (2000). Prénatal diagnosis of congénital cytomégalovirus infection: prospective study of 237 pregnancies at risk. Obstet. Gynecol. 95, 881—888. NIH HMP Working Group, Peterson, J., Garges, S., Giovanni, M., Mclnnes, P., Wang, L., Schloss, J.A., Bonazzi, V., McEwen, J.E., Wetterstrand, K.A., et al. (2009). The NIH Human Microbiome Project. Genome Res. 19, 2317—2323.Liesnard, C., Donner, C., Brancart, F., Gosselin, F., Delforge, M.L., and Rodesch, F. (2000). Prenatal diagnosis of congenital cytomegalovirus infection: prospective study of 237 pregnancies at risk. Obstet. Gynecol. 95, 881-888. NIH HMP Working Group, Peterson, J., Garges, S., Giovanni, M., Mclnnes, P., Wang, L., Schloss, J.A., Bonazzi, V., McEwen, J.E., Wetterstrand, K.A., et al. (2009). The NIH Human Microbiome Project. Genome Res. 19, 2317-2323.

Pereira, L., Maidji, E., McDonagh, S., and Tabata, T. (2005). Insights into viral transmission at the uterine-placental interface. Trends Microbiol. 13, 164—174.Pereira, L., Maidji, E., McDonagh, S., and Tabata, T. (2005). Insights into viral transmission at the uterine-placental interface. Trends Microbiol. 13, 164-174.

Raab-Traub, N. (2015). Nasopharyngeal Carcinoma: An Evolving Rôle for the Epstein-Barr Virus. Curr. Top. Microbiol. Immunol. 390, 339—363.Raab-Traub, N. (2015). Nasopharyngeal Carcinoma: An Evolving Role for the Epstein-Barr Virus. Curr. Top. Microbiol. Immunol. 390, 339-363.

Xu, W., Liu, Z., Bao, Q., and Qian, Z. (2015). Viruses, Other Pathogenic Microorganisms and Esophageal Cancer. Gastrointest. Tumors 2, 2—13.Xu, W., Liu, Z., Bao, Q., and Qian, Z. (2015). Viruses, Other Pathogenic Microorganisms and Esophageal Cancer. Gastrointest. Tumors 2, 2-13.

Claims (1)

Revendications 1 — Procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique humain comprenant des acides nucléiques totaux, comportant les étapes suivantes : - extraction des acides nucléiques totaux dudit échantillon biologique - séquençage haut débit desdits acides nucléiques totaux - traitement informatique des données de séquençage consistant à o dénombrer le nombre total de séquences o filtrer lesdites séquences en fonction d'un score de qualité o filtrer des séquences humaines par alignement de séquences avec les séquences du génome de référencé humain caractérisé en ce que lesdites étapes de traitement informatique comprennent en outre : - une étape initiale de calibration consistant à caractériser une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante - une étape de masquage de 0 à 5% des nucléotides du génome de référence d'au moins un micro-organisme par rapport aux nucléotides totaux dudit génome de référence, lesdits nucléotides masqués correspondant à des séquences de faible complexité - le filtrage des séquences d'au moins un micro-organisme par alignement de séquences non humaines avec les séquences du génome de référence d'au moins un microorganisme d'au moins un échantillon de référence - le calcul de la profondeur de séquençage du génome de référence d'au moins un micro-organisme - la validation de l'homogénéité de la couverture du génome d'au moins un micro-organisme consistant à calculer l'écart-type de la profondeur de séquençage du génome à la référence dudit génome d'au moins un micro-organisme - la détermination d'un indicateur de la quantification d'au moins un micro-organisme fonction de ladite profondeur de séquençage du génome de référence 2 — Procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 1 caractérisé en ce que l'étape de calcul de la profondeur de séquençage du génome de référence d'au moins un micro-organisme comprend un traitement de normalisation de la profondeur par rapport au nombre total de séquences issues du séquençage. 3 — Equipement pour la détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique caractérisé en ce qu'il comporte un calculateur commandé par un programme d'ordinateur pour la réalisation des traitements de : - calibration initiale consistant à caractériser une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante - masquage de 0 à 5% des nucléotides du génome de référence d'au moins un micro-organisme par rapport aux nucléotides totaux dudit génome de référence, lesdits nucléotides masqués correspondant à des séquences de faible complexité - filtrage des séquences d'au moins un micro-organisme par alignement de séquences non-humaines avec les séquences d'au moins un génome de référence dudit micro-organisme d'au moins un échantillon de référence - calcul de la profondeur de séquençage dudit génome de référence - la validation de l'homogénéité de la couverture du génome d'au moins un micro-organisme consistant à calculer l'écart-type de la profondeur de séquençage du génome à la référence dudit génome d'au moins un micro-organisme - détermination d'un indicateur de concentration en microorganisme fonction de ladite profondeur de séquençage du génome de référence. 4 — Programme d'ordinateur commandant un calculateur d'un équipement pour la détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique caractérisé en ce qu'il commande la réalisation des traitements de : - calibration initiale consistant à caractériser une pluralité d'échantillons de référence dont la concentration en micro-organisme est connue, et à enregistrer une matrice correspondant à la profondeur déterminée par ladite caractérisation, et la concentration en micro-organisme connue correspondante - masquage de 0 à 5% des nucléotides du génome de référence d'au moins un micro-organisme par rapport aux nucléotides totaux dudit génome de référence, lesdits nucléotides masqués correspondant à des séquences de faible complexité - filtrage des séquences d'au moins un micro-organisme par alignement de séquences non-humaines avec les séquences du génome de référence dudit micro-organisme d'au moins un échantillon de référence - calcul de la profondeur de séquençage du génome de référence - la validation de l'homogénéité de la couverture du génome d'au moins un micro-organisme consistant à calculer l'écart-type de la profondeur de séquençage du génome à la référence dudit génome d'au moins un micro-organisme - détermination d'un indicateur de concentration en microorganisme fonction de ladite profondeur de séquençage du génome de référence. 5 — Kit pour la détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique conformément au procédé selon la revendication 1 caractérisé en ce qu'il comprend : - une pluralité de tubes contenant chacun une dilution d'au moins une séquence d'ADN d'un génome de référence d'au moins un micro-organisme dans un ADN contrôle - un tube contenant de 1'ADN contrôle - la séquence nucléotidique du génome de référence d'au moins un micro-organisme dont 0 à 5% des nucléotides sont masqués, lesdits nucléotides masqués correspondant à des séquences de faible complexité. 6 — Application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 1 à la détermination de la concentration d'un parasite. 7 — Application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 6 caractérisé en ce que ledit parasite est un organisme procaryote. 8 — Application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 6 caractérisé en ce que ledit parasite est un virus. 9 — Application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 6 caractérisé en ce que ledit parasite est un organisme eucaryote. 10 — Application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 6 pour le diagnostic prénatal caractérisé en ce que ledit parasite est un cytomégalovirus. 11 — Application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 6 pour le diagnostic d'un cancer induit par le virus Epstein Barr et/ou le suivi d'un traitement anticancéreux caractérisé en ce que ledit parasite est un virus Epstein Barr. 12 — Application du procédé de détermination de la présence et quantification d'au moins un micro-organisme dans un échantillon biologique selon la revendication 6 pour le suivi d'une greffe caractérisé en ce que ledit parasite est un virus cytomégalovirus. 13 — Kit pour le diagnostic prénatal mettant en œuvre le procédé conforme à la revendication 1 caractérisé en ce que ladite séquence du génome de référence d'au moins un microorganisme est un cytomégalovirus dont jusqu'à 0,06% des nucléotides sont masqués. 14 — Kit pour le suivi d'une greffe mettant en œuvre le procédé conforme à la revendication 1 caractérisé en ce que ladite séquence du génome de référence d'au moins un microorganisme est un cytomégalovirus. 15 — Kit pour le diagnostic d'un cancer induit par le virus Epstein Barr et/ou le suivi d'un traitement anticancéreux mettant en œuvre le procédé conforme à la revendication 1 caractérisé en ce que ladite séquences du génome de référence d'au moins un micro-organisme est un virus Epstein Barr.Claims 1 - Method for determining the presence and quantification of at least one microorganism in a human biological sample comprising total nucleic acids, comprising the following steps: - extraction of the total nucleic acids from said biological sample - high-throughput sequencing of said acids total nuclei - computer processing of sequencing data consisting in counting the total number of sequences or filtering said sequences as a function of a quality score; filtering human sequences by sequence alignment with the sequences of the human referenced genome characterized in that said computer processing steps further comprise: an initial calibration step of characterizing a plurality of reference samples whose concentration of microorganism is known, and recording a matrix corresponding to the depth determined by said actinisation, and the corresponding known microorganism concentration - a 0-5% masking step of the nucleotides of the reference genome of at least one microorganism relative to the total nucleotides of said reference genome, said masked nucleotides corresponding to sequences of low complexity - filtering the sequences of at least one microorganism by alignment of non-human sequences with reference genome sequences of at least one microorganism of at least one reference sample - the calculation of the sequencing depth of the reference genome of at least one microorganism - the validation of the homogeneity of the genome coverage of at least one microorganism consisting of calculating the standard deviation of the genome sequencing depth at the reference of said genome of at least one microorganism - the determination of an indicator of the quantification of at least one microorganism function of said pro sequencing melter of the reference genome 2 - A method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 1 characterized in that the step of calculating the depth of sequencing of the genome of reference of at least one microorganism comprises a depth normalization treatment with respect to the total number of sequences resulting from the sequencing. 3 - Equipment for the determination of the presence and quantification of at least one microorganism in a biological sample characterized in that it comprises a computer controlled by a computer program for carrying out treatments of: - initial calibration consisting of characterizing a plurality of reference samples whose concentration in microorganism is known, and recording a matrix corresponding to the depth determined by said characterization, and the corresponding known microorganism concentration - masking of 0 to 5% of the nucleotides of the reference genome of at least one microorganism relative to the total nucleotides of said reference genome, said masked nucleotides corresponding to sequences of low complexity - filtering the sequences of at least one microorganism by non-sequence alignment -humans with the sequences of at least one reference genome of said microorganism of at least one reference sample - calculation of the sequencing depth of said reference genome - validation of the homogeneity of the genome coverage of at least one micro-organism consisting in calculating the standard deviation of the depth of sequencing of the genome to the reference of said genome of at least one microorganism - determination of a microorganism concentration indicator according to said depth of sequencing of the reference genome. 4 - Computer program controlling a calculator of an equipment for the determination of the presence and quantification of at least one microorganism in a biological sample characterized in that it controls the carrying out of the treatments of: - initial calibration consisting of characterizing a plurality of reference samples whose concentration in microorganism is known, and recording a matrix corresponding to the depth determined by said characterization, and the corresponding known microorganism concentration - masking of 0 to 5% of the nucleotides of the reference genome of at least one microorganism relative to the total nucleotides of said reference genome, said masked nucleotides corresponding to sequences of low complexity - filtering the sequences of at least one microorganism by non-sequence alignment -humans with reference genome sequences of said microorganism of at least one n reference sample - calculation of the sequencing depth of the reference genome - the validation of the homogeneity of the genome coverage of at least one microorganism consisting in calculating the standard deviation of the depth of sequencing of the genome reference to said genome of at least one microorganism - determination of a microorganism concentration indicator according to said depth of sequencing of the reference genome. Kit for the determination of the presence and quantification of at least one microorganism in a biological sample according to the process according to claim 1, characterized in that it comprises: a plurality of tubes each containing a dilution of least one DNA sequence of a reference genome of at least one microorganism in a control DNA - a tube containing DNA controls - the nucleotide sequence of the reference genome of at least one microorganism of which 0 to 5% of the nucleotides are masked, said masked nucleotides corresponding to sequences of low complexity. 6 - Application of the method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 1 for determining the concentration of a parasite. 7 - Application of the method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 6 characterized in that said parasite is a prokaryotic organism. 8 - Application of the method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 6 characterized in that said parasite is a virus. 9 - Application of the method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 6, characterized in that said parasite is a eukaryotic organism. - Application of the method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 6 for the prenatal diagnosis characterized in that said parasite is a cytomegalovirus. 11 - Application of the method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 6 for the diagnosis of a cancer induced by the Epstein Barr virus and / or the monitoring of a treatment anticancer agent characterized in that said parasite is an Epstein Barr virus. 12 - Application of the method for determining the presence and quantification of at least one microorganism in a biological sample according to claim 6 for monitoring a transplant characterized in that said parasite is a cytomegalovirus virus. 13 - Kit for prenatal diagnosis implementing the method according to claim 1 characterized in that said reference genome sequence of at least one microorganism is a cytomegalovirus of which up to 0.06% of the nucleotides are masked. 14 - Kit for monitoring a transplant implementing the method according to claim 1 characterized in that said reference genome sequence of at least one microorganism is a cytomegalovirus. 15 - Kit for the diagnosis of a cancer induced by the Epstein Barr virus and / or the monitoring of an anticancer treatment implementing the method according to claim 1 characterized in that said reference genome sequences of at least a microorganism is an Epstein Barr virus.
FR1654459A 2016-05-19 2016-05-19 PROCESS FOR DETERMINING THE PRESENCE AND QUANTIFICATION OF AT LEAST ONE MICRO-ORGANISM IN A BIOLOGICAL SAMPLE Active FR3051482B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR1654459A FR3051482B1 (en) 2016-05-19 2016-05-19 PROCESS FOR DETERMINING THE PRESENCE AND QUANTIFICATION OF AT LEAST ONE MICRO-ORGANISM IN A BIOLOGICAL SAMPLE
PCT/FR2017/051204 WO2017198956A1 (en) 2016-05-19 2017-05-18 Process for determining the presence and quantification of at least one microorganism in a biological sample

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1654459A FR3051482B1 (en) 2016-05-19 2016-05-19 PROCESS FOR DETERMINING THE PRESENCE AND QUANTIFICATION OF AT LEAST ONE MICRO-ORGANISM IN A BIOLOGICAL SAMPLE

Publications (2)

Publication Number Publication Date
FR3051482A1 true FR3051482A1 (en) 2017-11-24
FR3051482B1 FR3051482B1 (en) 2021-01-29

Family

ID=56943650

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1654459A Active FR3051482B1 (en) 2016-05-19 2016-05-19 PROCESS FOR DETERMINING THE PRESENCE AND QUANTIFICATION OF AT LEAST ONE MICRO-ORGANISM IN A BIOLOGICAL SAMPLE

Country Status (2)

Country Link
FR (1) FR3051482B1 (en)
WO (1) WO2017198956A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114420213A (en) * 2021-12-31 2022-04-29 圣湘生物科技股份有限公司 Biological information analysis method and device, electronic equipment and storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4599216A (en) * 1983-11-21 1986-07-08 Board Of Regents For The University Of Oklahoma Apparatus for exposure to microwaves
WO2012101643A1 (en) * 2011-01-26 2012-08-02 Ramot At Tel-Aviv University Ltd. Detection of infection by a microorganism using small rna sequencing subtraction and assembly
WO2015070086A1 (en) * 2013-11-07 2015-05-14 The Board Of Trustees Of The Leland Stanford Junior University Cell-free nucleic acids for the analysis of the human microbiome and components thereof
CN105132584A (en) * 2015-08-03 2015-12-09 中国人民解放军成都军区总医院 Kit for genotyping VZV, production method of kit and application of kit

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104619858B (en) 2012-07-31 2017-06-06 深圳华大基因股份有限公司 The Non-invaive examination of foetus health state

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4599216A (en) * 1983-11-21 1986-07-08 Board Of Regents For The University Of Oklahoma Apparatus for exposure to microwaves
WO2012101643A1 (en) * 2011-01-26 2012-08-02 Ramot At Tel-Aviv University Ltd. Detection of infection by a microorganism using small rna sequencing subtraction and assembly
WO2015070086A1 (en) * 2013-11-07 2015-05-14 The Board Of Trustees Of The Leland Stanford Junior University Cell-free nucleic acids for the analysis of the human microbiome and components thereof
CN105132584A (en) * 2015-08-03 2015-12-09 中国人民解放军成都军区总医院 Kit for genotyping VZV, production method of kit and application of kit

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CAMARGO M CONSTANZA ET AL: "Validation and calibration of next-generation sequencing to identify Epstein-Barr virus-positive gastric cancer in The Cancer Genome Atlas", GASTRIC CANCER, SPRINGER JAPAN, TOKYO, vol. 19, no. 2, 23 June 2015 (2015-06-23), pages 676 - 681, XP035987818, ISSN: 1436-3291, [retrieved on 20150623], DOI: 10.1007/S10120-015-0508-X *
FABIAN RIPP ET AL: "All-Food-Seq (AFS): a quantifiable screen for species in biological samples by deep DNA sequencing", BMC GENOMICS, BIOMED CENTRAL LTD, LONDON, UK, vol. 15, no. 1, 31 July 2014 (2014-07-31), pages 639, XP021191569, ISSN: 1471-2164, DOI: 10.1186/1471-2164-15-639 *
JÉRÔME D. ROBIN ET AL: "Comparison of DNA Quantification Methods for Next Generation Sequencing", SCIENTIFIC REPORTS, vol. 6, 6 April 2016 (2016-04-06), pages 24067, XP055340141, DOI: 10.1038/srep24067 *

Also Published As

Publication number Publication date
WO2017198956A1 (en) 2017-11-23
FR3051482B1 (en) 2021-01-29

Similar Documents

Publication Publication Date Title
Doan et al. Illuminating uveitis: metagenomic deep sequencing identifies common and rare pathogens
Oakeshott et al. Frequency and risk factors for prevalent, incident, and persistent genital carcinogenic human papillomavirus infection in sexually active women: community based cohort study
KR102205950B1 (en) Cell-free nucleic acids for the analysis of the human microbiome and components thereof
Mackay et al. Molecular assays for detection of human metapneumovirus
Watts et al. Effects of bacterial vaginosis and other genital infections on the natural history of human papillomavirus infection in HIV-1–infected and high-risk HIV-1–uninfected women
JP5659319B2 (en) Non-invasive detection of genetic abnormalities in the fetus
US11047011B2 (en) Immunorepertoire normality assessment method and its use
Amer et al. Isolation and molecular characterization of type I and type II feline coronavirus in Malaysia
WO2018045359A1 (en) Detection and treatment of infection during pregnancy
Tió-Coma et al. Blood RNA signature RISK4LEP predicts leprosy years before clinical onset
JP2019511922A (en) Methods and systems for early risk assessment for preterm birth outcomes
CN104619858B (en) The Non-invaive examination of foetus health state
Pommier et al. Childhood encephalitis in the Greater Mekong region (the SouthEast Asia Encephalitis Project): a multicentre prospective study
Konstantinidis et al. Real‐time polymerase chain reaction quantification of Epstein–Barr virus in chronic periodontitis patients
Grande et al. Herpes viruses in periodontal compromised sites: comparison between HIV‐positive and‐negative patients
Hernández et al. Comparison of parasite loads in serum and blood samples from patients in acute and chronic phases of Chagas disease
Rosales et al. Brain meta-transcriptomics from harbor seals to infer the role of the microbiome and virome in a stranding event
WO2018192452A1 (en) Method for microbiological detection based on exosome nucleic acid and application thereof
WO2017198956A1 (en) Process for determining the presence and quantification of at least one microorganism in a biological sample
Pan Development of diagnostic methods using cell-free nucleic acids
de Mello Malta et al. Nucleocapsid single point-mutation associated with drop-out on RT-PCR assay for SARS-CoV-2 detection
KR102329555B1 (en) Method for providing the information for diagnosing rhinosinusitis with nasal polyps
Alves et al. Beyond arboviruses: A multicenter study to evaluate differential diagnosis of rash diseases and acute febrile illness cases in Rio de Janeiro, Brazil
Liu et al. Human cytomegalovirus-IgM seropositivity is not associated with atherogenic alterations of lipid profiles and inflammatory status in ischemic stroke patients: a preliminary study
RU2750525C1 (en) Method for diagnosing disseminated pulmonary tuberculosis in patients with hiv infection and negative results of bacterioscopic and immunological methods

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20171124

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7

PLFP Fee payment

Year of fee payment: 8