BE1023274A9 - Estimation method and system for estimating a fetal fraction - Google Patents

Estimation method and system for estimating a fetal fraction Download PDF

Info

Publication number
BE1023274A9
BE1023274A9 BE20155460A BE201505460A BE1023274A9 BE 1023274 A9 BE1023274 A9 BE 1023274A9 BE 20155460 A BE20155460 A BE 20155460A BE 201505460 A BE201505460 A BE 201505460A BE 1023274 A9 BE1023274 A9 BE 1023274A9
Authority
BE
Belgium
Prior art keywords
allele
genetic
fetal
subset
origin
Prior art date
Application number
BE20155460A
Other languages
Dutch (nl)
Other versions
BE1023274B1 (en
BE1023274A1 (en
Inventor
Paul Vauterin
Michaël Vyverman
Schrijver Joachim De
Original Assignee
Multiplicom Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Multiplicom Nv filed Critical Multiplicom Nv
Priority to BE20155460A priority Critical patent/BE1023274A9/en
Application granted granted Critical
Publication of BE1023274B1 publication Critical patent/BE1023274B1/en
Publication of BE1023274A1 publication Critical patent/BE1023274A1/en
Publication of BE1023274A9 publication Critical patent/BE1023274A9/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

Samenvatting Schattingswerkwijze voor het schatten van een foetale fractie, welke werkwijze omvat het meten van allelaanwezigheden voor een vooraf bepaald aantal genetische markeringen in een monster van celvrij DNA van een zwangere vrouw, waarbij elke allelaanwezigheid de aanwezigheid voorstelt op een genetische markering van het vooraf bepaalde aantal genetische markeringen van minstens één van: een referentie-allel van maternale of foetale oorsprong, en een alternatief allel van maternale of foetale oorsprong; op basis van de gemeten allelaanwezigheden, het berekenen van een overeenstemmend aantal allelfrequenties voor het vooraf bepaalde aantal genetische markeringen; op basis van het berekende aantal allelfrequenties, het detecteren van een deelverzameling van het vooraf bepaalde aantal genetische markeringen, welke deelverzameling geassocieerd is met heterozygote allelparen van maternale oorsprong; en het schatten van de foetale fractie op basis van de gedetecteerde deelverzameling, waarbij de foetale fractie de fractie voorstelt van celvrij DNA van foetale oorsprong in het monster.

Summary Estimation method for estimating a fetal fraction, which method comprises measuring allelic events for a predetermined number of genetic markers in a sample of cell-free DNA from a pregnant woman, each allelic presence representing the presence on a genetic marker of the predetermined number genetic markers of at least one of: a reference allele of maternal or fetal origin, and an alternative allele of maternal or fetal origin; on the basis of the measured allele presence, calculating a corresponding number of allele frequencies for the predetermined number of genetic markers; on the basis of the calculated number of allele frequencies, detecting a subset of the predetermined number of genetic markers, which subset is associated with heterozygous allele pairs of maternal origin; and estimating the fetal fraction based on the detected subset, wherein the fetal fraction represents the fraction of cell-free DNA of fetal origin in the sample.

Description

Schattingswerkwijze en -systeem voor het schatten van een foetale fractieEstimation method and system for estimating a fetal fraction

Domein van de uitvindingDomain of the invention

Het domein van voorliggende uitvinding heeft betrekking op het schatten van een foetale fractie. Bijzondere uitvoeringsvormen hebben betrekking tot een schattingswerkwijze en -systeem voor het schatten van een foetale fractie, en tot een computerprogrammaproduct en een digitaal dataopslagmedium voor het schatten van een foetale fractie.The domain of the present invention relates to the estimation of a fetal fraction. Particular embodiments relate to an estimation method and system for estimating a fetal fraction, and to a computer program product and a digital data storage medium for estimating a fetal fraction.

Achtergrond EP 0 994 063 openbaart niet-invasieve prenatale diagnosewerkwijzen, bijvoorbeeld om bepaalde ziekten op te sporen. De prenatale diagnosewerkwijzen omvatten het schatten van de foetale fractie, dat wil zeggen de fractie van het celvrij DNA (deoxyribonucleïnezuur) in het maternale monster die eigenlijk van de foetus komt. Bekende schattingswerkwijzen voor het schatten van de foetale fractie omvatten de detectie van SNP (of single-nucleotide polymorphism, enkele-nucleotidepolymorfïsmen, dat wil zeggen een genetische markering die een enkele variabele nucleotide omvat) allelen (dat wil zeggen varianten of alternatieve vormen van eenzelfde gen of voor eenzelfde genetische markering) op het foetale celvrije DNA die niet aanwezig zijn in het maternale DNA. Met andere woorden, deze bekende schattingswerkwijzen onderzoeken SNP-allelen waarbij het maternale DNA homozygoot is.Background EP 0 994 063 discloses non-invasive prenatal diagnostic methods, for example to detect certain diseases. The prenatal diagnostic methods include estimating the fetal fraction, i.e., the fraction of cell-free DNA (deoxyribonucleic acid) in the maternal sample that actually comes from the fetus. Known estimation methods for estimating the fetal fraction include the detection of SNP (or single-nucleotide polymorphism, single-nucleotide polymorphisms, i.e. a genetic marker comprising a single variable nucleotide) alleles (i.e. variants or alternative forms of the same gene or for the same genetic marking) on the fetal cell-free DNA that are not present in the maternal DNA. In other words, these known estimation methods investigate SNP alleles in which the maternal DNA is homozygous.

SamenvattingSummary

Uitvoeringsvormen van de uitvinding beogen een aanpak te voorzien voor het schatten van de foetale fractie.Embodiments of the invention aim to provide an approach for estimating the fetal fraction.

Volgens een eerste aspect van de uitvinding wordt een schattingswerkwijze voorzien voor het schatten van een foetale fractie. De werkwijze omvat het meten van allelaanwezigheden voor een vooraf bepaald aantal genetische markeringen in een monster van celvrij DNA van een zwangere vrouw, waarbij elke allelaanwezigheid de aanwezigheid voorstelt op een genetische markering van het vooraf bepaalde aantal genetische markeringen van ten minste één van: een referentie-allel van maternale of foetale oorsprong, en een alternatief allel van maternale of foetale oorsprong. Voor de volledigheid wordt opgemerkt dat dit niet impliceert dat een onderscheid kan worden gemaakt tussen een allel van maternale oorsprong en een allel van foetale oorsprong, maar slechts dat een allel van één van beide oorsprongen kan gemeten worden. De werkwijze omvat tevens, op basis van de gemeten allelaanwezigheden, het berekenen van een overeenstemmend aantal allelfrequenties voor het vooraf bepaalde aantal genetische markeringen. De werkwijze omvat tevens, op basis van het berkenede aantal allelfrequenties, het detecteren van een deelverzameling van het vooraf bepaalde aantal genetische markeringen, waarbij de deelverzameling geassocieerd is met heterozygote allelparen van maternale oorsprong. De werkwijze omvat tevens het schatten van de foetale fractie op basis van de gedetecteerde deelverzameling, waarbij de foetale fractie de fractie van celvrij DNA van foetale oorsprong in het monster voorstelt.According to a first aspect of the invention, an estimation method is provided for estimating a fetal fraction. The method comprises measuring allele presence for a predetermined number of genetic markers in a sample of cell-free DNA from a pregnant woman, wherein each allele presence represents the presence on a genetic mark of the predetermined number of genetic markings of at least one of: a reference -allel of maternal or fetal origin, and an alternative allele of maternal or fetal origin. For the sake of completeness, it is noted that this does not imply that a distinction can be made between an allele of maternal origin and an allele of fetal origin, but only that an allele of one of the two origins can be measured. The method also comprises, on the basis of the measured allele presence, the calculation of a corresponding number of allele frequencies for the predetermined number of genetic markers. The method also comprises, on the basis of the known number of allele frequencies, detecting a subset of the predetermined number of genetic markers, wherein the subset is associated with heterozygous allele pairs of maternal origin. The method also includes estimating the fetal fraction based on the detected subset, the fetal fraction representing the fraction of cell-free DNA of fetal origin in the sample.

In de context van deze specificatie is een ‘genetische markering’ een positie op het genoom waarvan geweten is dat die verscheidene mogelijke toestanden aanneemt over individuen in een populatie.In the context of this specification, a "genetic marker" is a position on the genome that is known to assume various possible states about individuals in a population.

Door deze schattingswerkwijze te voorzien, voorzien uitvoeringsvormen van de uitvinding een aanpak voor het schatten van de foetale fractie.By providing this estimation method, embodiments of the invention provide an approach to estimating the fetal fraction.

Verder ontwikkelde uitvoeringsvormen kunnen onder meer rusten op het inventieve inzicht dat het schatten van de foetale fractie op basis van de gedetecteerde deelverzameling toelaat om de foetale fractie zoals geschat in bekende schattings werkwijzen te verifiëren, onafhankelijk van onderzochte SNP-allelen waarbij het maternale DNA homozygoot is. deze verificatie verbetert de nauwkeurigheid van een foetale fractie zoals geschat in bekende schattingswerkwijzen.Further developed embodiments may be based, among other things, on the inventive insight that estimating the fetal fraction based on the detected subset allows to verify the fetal fraction as estimated in known estimation methods, independently of investigated SNP alleles where the maternal DNA is homozygous . this verification improves the accuracy of a fetal fraction as estimated in known estimation methods.

Volgens een voorkeursuitvoeringsvorm omvat het detecteren van de deelverzameling, op basis van het berekende aantal allelfrequenties, het selecteren uit het vooraf bepaalde aantal genetische markeringen, als die deelverzameling van een tweede aantal genetische markeringen waarvan overeenstemmende allelfrequenties een vooraf bepaalde minimum allelfrequentiedrempel overschrijden. Volgens een verder ontwikkelde uitvoeringsvorm overschrijden de overeenstemmende allelfrequenties van het tweede aantal genetische markeringen een vooraf bepaalde maximum allelfrequentiedrempel niet. Volgens een verder ontwikkelde voorkeursuitvoeringsvorm overschrijden de overeenstemmende allelfrequenties van het tweede aantal genetische markeringen de vooraf bepaalde minimum allelfrequentiedrempel en overschrijden ze niet de vooraf bepaalde maximum allelfrequentiedrempel.According to a preferred embodiment, on the basis of the calculated number of allele frequencies, detecting the subset comprises selecting from the predetermined number of genetic markers, as that subset of a second number of genetic markers whose corresponding allele frequencies exceed a predetermined minimum allele frequency threshold. According to a further developed embodiment, the corresponding allele frequencies of the second number of genetic markers do not exceed a predetermined maximum allele frequency threshold. According to a further developed preferred embodiment, the corresponding allele frequencies of the second number of genetic markers exceed the predetermined minimum allele frequency threshold and do not exceed the predetermined maximum allele frequency threshold.

Op deze wijze kunnen maternaal heterozygote genetische markeringen op een meer directe wijze worden gedetecteerd, zonder het detecteren van allelen van foetale oorsprong die niet aanwezig zijn in het DNA van maternale oorsprong.In this way, maternally heterozygous genetic markers can be detected in a more direct manner without detecting alleles of fetal origin that are not present in the DNA of maternal origin.

Volgens een voorkeursuitvoeringsvorm omvat het schatten het produceren van een initiële schatting voor de foetale fractie en het optimaliseren van de initiële schatting over de gedtecteerde deelverzameling.According to a preferred embodiment, estimating comprises producing an initial estimate for the fetal fraction and optimizing the initial estimate over the detected subset.

Op deze wijze is een schatting direct beschikbaar, en kunnen betere schattingen worden verkregen door meer rekenkracht aan te wenden.In this way an estimate is immediately available, and better estimates can be obtained by using more computing power.

Volgens een verder ontwikkelde uitvoeringsvorm omvat het optimaliseren het maximaliseren van de waarschijnlijkheid van de initiële schatting, door het herhaaldelijk uitvoeren van de volgende verzameling operaties terwijl de schatting wordt gevarieerd. Voor een gegeven waarde van de schatting die wordt gevarieerd, voor elke genetische markering in de gedetecteerde deelverzameling, worden de respectievelijke probabiliteiten berekend dat de genetische markering geassocieerd is met ene homozygoot referentie-allelpaar van foetale oorsprong, een heterozygoot allelpaar van foetale oorsprong, en een homozygoot alternatief allelpaar van foetale oorsprong. Eveneens wordt een waarschijnlijkheid berekend van de gegeven waarde van de schatting die wordt gevarieerd, voor de gedetecteerde deelverzameling, op basis van de berekende respectievelijke probabiliteiten voor elke genetische markering in de gedetecteerde deelverzameling.According to a further developed embodiment, optimizing comprises maximizing the probability of the initial estimate, by repeatedly performing the next set of operations while the estimate is varied. For a given value of the estimate that is varied, for each genetic marker in the detected subset, the respective probabilities are calculated that the genetic marker is associated with a homozygous reference allele pair of fetal origin, a heterozygous allele pair of fetal origin, and a homozygous alternative allel pair of fetal origin. Likewise, a probability of the given value of the estimate being varied is calculated for the detected subset, based on the calculated respective probabilities for each genetic marker in the detected subset.

Op deze wijze wordt een structurele strategie gebruikt om te zoeken naar een betere schatting voor de foetale fractie, rekening houdend met de genetische markeringen in de gedetecteerde deelverzameling.In this way, a structural strategy is used to search for a better estimate for the fetal fraction, taking into account the genetic markers in the detected subset.

Volgens een voorkeursuitvoeringsvorm omvat de werkwijze het corrigeren van allel-specifiek vooroordeel voor minstens één van het vooraf bepaalde aantal genetische markeringen, waarbij het allel-specifieke vooroordeel te wijten is aan ongelijke amplificatie voor respectievelijk een referentie-allel en een alternatief allel voor een genetische markering.According to a preferred embodiment, the method comprises correcting allele-specific bias for at least one of the predetermined number of genetic markers, the allele-specific bias being due to unequal amplification for a reference allele and an alternative allele for a genetic marking, respectively. .

Op deze wijze wordt nauwkeurigheid verbetert, ongeacht allel-specifiek vooroordeel.In this way accuracy is improved, regardless of allele-specific prejudice.

Volgens een verder ontwikkelde uitvoeringsvorm omvat het corrigeren van een allel-specifiek vooroordeel voor een genetische markering het verkrijgen van meerdere monsters van celvrij DNA van zwangere vrouwen, voor welke monsters de genetische markeringen respectievelijk geassocieerd is met heterozygote allelparen van matemale oorsprong. Het corrigeren omvat tevens het berekenen van de gemiddelde allelfrequentie voor de genetische markering over het veelvoud aan monsters. Het corrigeren omvat tevens, op basis van een afwijking van de berekende gemiddelde allelfrequentie van een verwachtingswaarde daarvan, het bepalen van een correctiefector om te gebruiken voor het corrigeren.According to a further developed embodiment, correcting an allele-specific bias for a genetic marking comprises obtaining multiple samples of cell-free DNA from pregnant women, for which samples the genetic markings are respectively associated with heterozygous allel pairs of matematic origin. The correction also includes calculating the average allele frequency for the genetic marker over the plurality of samples. The correction also comprises, on the basis of a deviation of the calculated average allele frequency from an expected value thereof, the determination of a correction vector to be used for the correction.

Op deze wijze wordt allel-specifiek vooroordeel efficiënt gecorrigeerd.In this way, allele-specific prejudice is efficiently corrected.

Volgens een voorkeursuitvoeringsvorm omvat de werkwijze het beperken van de gedetecteerde deelverzameling door: het bepalen voor minstens één genetische markering van de gedetecteerde deelverzameling van een statistische waarschijnlijkheid om geassocieerd te zijn met een homozygoot allelpaar van maternale oorsprong; en, op basis van de bepaalde statistische waarschijnlijkheid of waarschijnlijkheden, het uitsluiten van minstens één genetische markering uit de gedetecteerde deelverzameling. Met andere woorden, dit zal toelaten om genetische markeringen weg te laten die waarschijnlijk geassocieerd zijn met een homozygoot allelpaar van maternale oorsprong.According to a preferred embodiment, the method comprises limiting the detected subset by: determining for at least one genetic tag of the detected subset of a statistical probability of being associated with a homozygous allele pair of maternal origin; and, based on the determined statistical probability or probabilities, the exclusion of at least one genetic marker from the detected subset. In other words, this will allow to omit genetic markings that are probably associated with a homozygous allele of maternal origin.

Op deze wijze wordt de nauwkeurigheid verbeterd door gebruik te maken van genetische markeringen van hogere kwaliteit.In this way the accuracy is improved by using higher quality genetic markers.

Volgens een voorkeursuitvoeringsvorm omvat de werkwijze het beperken van de gedetecteerde deelverzameling door: het verkrijgen van een veelvoud aan monsters van celvrij DNA van zwangere vrouwen, voor welke monsters een genetische markering respectievelijk geassocieerd is met heterozygote allelparen van maternale oorsprong; het berekenen van de standaardafwijking van de allelfrequentie voor de genetische markering over het veelvoud aan monsters; en op basis van de berekende standaardafwijking van de allelfrequentie, het uitsluiten van minstens één genetische markering uit de gedetecteerde deelverzameling.According to a preferred embodiment, the method comprises limiting the detected subset by: obtaining a plurality of samples of cell-free DNA from pregnant women, for which samples a genetic marking is associated with heterozygous allele pairs of maternal origin; calculating the standard deviation of the allele frequency for the genetic marking over the plurality of samples; and based on the calculated standard deviation of the allele frequency, excluding at least one genetic marker from the detected subset.

Op deze wijze wordt de nauwkeurigheid verbeterd door gebruik te maken van genetische markeringen van hogere kwaliteit.In this way the accuracy is improved by using higher quality genetic markers.

Volgens een voorkeursuitvoeringsvorm omvat de werkwijze het beperken van de gedetecteerde deelverzameling door: het verkrijgen van een veelvoud aan monsters van celvrij DNA van zwangere vrouwen, voor welke monsters de genetische markering respectievelijk geassocieerd is met heterozygote allelparen van maternale oorsprong; het berekenen van de gemiddelde allelfrequentie voor de genetische markering over het veelvoud aan monsters; en op basis van een afwijking van de berekende gemiddelde allelfrequentie van een verwachtingswaarde daarvan, het uitsluiten van minstens één genetische markering uit de gedetecteerde deelverzameling.According to a preferred embodiment, the method comprises limiting the detected subset by: obtaining a plurality of samples of cell-free DNA from pregnant women, for which samples the genetic marking is associated with heterozygous allele pairs of maternal origin; calculating the average allele frequency for the genetic marker over the plurality of samples; and on the basis of a deviation of the calculated average allele frequency from an expectation value thereof, excluding at least one genetic marker from the detected subset.

Op deze wijze wordt de nauwkeurigheid verbeterd door gebruik te maken van genetische markeringen van hogere kwaliteit.In this way the accuracy is improved by using higher quality genetic markers.

Volgens een voorkeursuitvoeringsvorm omvat de werkwijze het beperken van de gedetecteerde deelverzameling door het uitsluiten van minstens één genetische markering uit de gedetecteerde deelverzameling, welke minstens één genetische markering minder gemeten allelaanwezigheden heeft dan een vooraf bepaalde drempelwaarde, voor het gebruikte monster.According to a preferred embodiment, the method comprises limiting the detected subset by excluding at least one genetic tag from the detected subset, which has at least one genetic tag fewer measured allelic events than a predetermined threshold value for the sample used.

Op deze wijze wordt de nauwkeurigheid verbeterd door gebruik te maken van genetische markeringen van hogere kwaliteit.In this way the accuracy is improved by using higher quality genetic markers.

Volgens een voorkeursuitvoeringsvorm is het monster matemaal bloed, plasma, urine, cerebrospinale vloeistof, serum, saliva of transcervicale spoelingsvloeistof.In a preferred embodiment, the sample is blood, plasma, urine, cerebrospinal fluid, serum, saliva, or transcervical flushing fluid.

Op deze wijze is de werkwijze toepasbaar voor een veelheid aan monsters die gecreëerd kunnen worden van een zwangere vrouw.In this way the method is applicable for a multitude of samples that can be created from a pregnant woman.

In een voorkeursuitvoeringsvorm omvat het meten het verwerken van het monster gebruikmakend van minstens één van de volgende: polymerase kettingreactie (PCR), ligase kettingreactie, nucleïnezuur sequentiegebaseerde amplificatie (NASBA), en vertakte DNA werkwijzen; en bij voorkeur PCR.In a preferred embodiment, the measurement comprises processing the sample using at least one of the following: polymerase chain reaction (PCR), ligase chain reaction, nucleic acid sequence-based amplification (NASBA), and branched DNA methods; and preferably PCR.

In voorbeelduitvoeringsvormen van de uitvinding kan het meten van allelaanwezigheden het meten van SNP-allelaanwezigheden en/of het meten van allelaanwezigheden voor korte inserties en/of deleties omvatten.In exemplary embodiments of the invention, measuring allelic presentations may include measuring SNP allelic presentations and / or measuring allelic presentations for short insertions and / or deletions.

Volgens een verder aspect van de uitvinding wordt een computerprogrammaproduct voorzien omvattende computeruitvoerbare instructies om, wanneer het programma wordt uitgevoerd op een computer, ten minste de stap uit te voeren van het schatten van de foetale fractie van uitvoeringsvormen van de werkwijze die hierboven is geopenbaard. De referentie naar computeruitvoerbare instructie moet zo worden uitgelegd dat ze zowel direct uitvoerbare machinecode, code die gecompileerd moet worden om te worden uitgevoerd, en code die wordt geïnterpreteerd in plaats van per se te worden uitgevoerd omvat.According to a further aspect of the invention, a computer program product is provided comprising computer executable instructions to, when the program is executed on a computer, perform at least the step of estimating the fetal fraction of embodiments of the method disclosed above. The reference to computer executable instruction must be interpreted to include both directly executable machine code, code that must be compiled to be executed, and code that is interpreted rather than necessarily executed.

Volgens een verder aspect van de uitvinding wordt een digitaal dataopslagmedium voorzien dat een machine-uitvoerbaar programma van instructies encodeert om minstens de stap van het schatten van de foetale fractie van uitvoeringsvormen van de werkwijze die hierboven is geopenbaard uit te voeren.According to a further aspect of the invention, a digital data storage medium is provided that encodes a machine-executable program of instructions to perform at least the step of estimating the fetal fraction of embodiments of the method disclosed above.

Volgens een verder aspect van de uitvinding wordt een computerprogramma voorzien omvattende computeruitvoerbare instructies om, wanneer het programma wordt uitgevoerd op een computer, één of meer stappen van uitvoeringsvormen van de werkwijze die hierboven is geopenbaard uit te voeren. Volgens een verder aspect van de uitvinding wordt een computertoestel of ander hardware-toestel voorzien geprogrammeerd om één of meer stappen uit te voeren van eender welke van de uitvoeringsvormen van de werkwijze die hierboven is geopenbaard. Volgens een ander aspect wordt een dataopslagtoestel voorzien dat een programma encodeert in machineleesbare en machine-uitvoerbare vorm om één of meer stappen uit te voeren van eender welke van de uitvoeringsvormen van de werkwijze die hierboven is geopenbaard.According to a further aspect of the invention, a computer program is provided comprising computer-executable instructions to, when the program is executed on a computer, to perform one or more steps of embodiments of the method disclosed above. According to a further aspect of the invention, a computer device or other hardware device is provided programmed to perform one or more steps of any of the embodiments of the method disclosed above. In another aspect, a data storage device is provided that encodes a program in machine-readable and machine-executable form to perform one or more steps of any of the embodiments of the method disclosed above.

Volgens een verder aspect van de uitvinding, wordt een schattingssysteem voor het schatten van een foetale fractie voorzien. Het systeem omvat een metingsmodule, een berekeningsmodule, een detectiemodule en een schattingsmodule. De metingsmodule is ingericht voor het meten van allelaanwezigheden voor een vooraf bepaald aantal genetische markeringen in een monster van celvrij DNA van een zwangere vrouw, waarbij elke allelaanwezigheid de aanwezigheid voorstelt op een genetische markering van het vooraf bepaalde aantal genetische markeringen minstens één van: een referentie-allel van maternale of foetale oorsprong, en een alternatief allel van matemale of foetale oorsprong. De berekeningsmodule is ingericht voor: op basis van de gemeten allelaanwezigheden, het berekenen van een overeenstemmend aantal allelfrequenties voor het vooraf bepaalde aantal genetische markeringen, de detectiemodule is ingericht voor, op basis van het berekende aantal allelfrequenties, het detecteren van een deelverzameling van het vooraf bepaalde aantal genetische markeringen, welke deelverzameling geassocieerd is met heterozygote allelparen van matemale oorsprong. De schattingsmodule is ingericht voor het schatten van de foetale fractie op basis van de gedetecteerde deelverzameling, waarbij de foetale fractie de fractie voorstelt van celvrij DNA van foetale oorsprong in het monster.According to a further aspect of the invention, an estimation system for estimating a fetal fraction is provided. The system comprises a measurement module, a calculation module, a detection module and an estimation module. The measurement module is adapted to measure allele presence for a predetermined number of genetic markers in a sample of cell-free DNA from a pregnant woman, each allele presence representing the presence on a genetic mark of the predetermined number of genetic markings at least one of: a reference -allel of maternal or fetal origin, and an alternative allele of matemal or fetal origin. The calculation module is arranged for: on the basis of the measured allele presence, calculating a corresponding number of allele frequencies for the predetermined number of genetic markers, the detection module is arranged for, on the basis of the calculated number of allele frequencies, detecting a subset of the predetermined allele frequencies certain number of genetic markers, which subset is associated with heterozygous allel pairs of matemal origin. The estimation module is adapted to estimate the fetal fraction based on the detected subset, the fetal fraction representing the fraction of cell-free DNA of fetal origin in the sample.

Uitvoeringsvormen van het systeem kunnen worden belichaamd als een geheel in hardware, in software, of in een combinatie van hardware en software. In een voorkeursuitvoeringsvorm van het systeem, kan de metingsmodule een hardware-inrichting omvatten, aangepast voor het verkrijgen van het monster en voor het uitvoeren van de metingen op het monster (typisch door software gecontroleerd). De berekeningsmodule kan worden voorzien als een stukje software dat kan worden uitgevoerd op een computerprocessor gekoppeld met de metingsmodule, of kan anderszins worden aangepast om de gemeten allelaanwezigheden te verkrijgen die zijn geproduceerd door de metingsmodule, bijvoorbeeld via een datacommunicatiekanaal van de metingsmodule naar de computerprocessor waarop het stukje software kan worden uitgevoerd - of in een bijzondere uitvoeringsvorm kan de berekeningsmodule worden voorzien als een hardware-module gekoppeld met de hardware-metingsmodule. In de voorkeursuitvoeringsvorm kan de detectiemodule worden voorzien als een stukje software dat kan worden uitgevoerd op een computerprocessor (dezelfde computerprocessor als hierboven of een andere computerprocessor), of kan anderszins worden aangepast om het berekende aantal allelffequenties te verkrijgen van de berekeningsmodule, bijvoorbeeld via het datacommunicatiekanaal of via een andere geschikt datacommunicatiekanaal. De schattingsmodule kan worden voorzien als een stukje software dat kan worden uitgevoerd op een computerprocessor (dezelfde computerprocessor als verder hierboven, of dezelfde andere computerprocessor als hierboven, of nog een andere computerprocessor), of kan anderszins worden aangepast om de gedetecteerde deelverzameling te verkrijgen, bijvoorbeeld via het datacommunicatiekanaal of via een ander geschikt datacommunicatiekanaal. In een bijzondere uitvoeringsvorm omvat het systeem een hardware-metingsmodule, gekoppeld met één of meer computerprocessoren met geassocieerde computergeheugenopslag. De metingsmodule, de detectiemodule en de schattingsmodule zijn aanwezig als softwaremodules die geïnstalleerd zijn in de geassocieerde computergeheugenopslag, of die kunnen worden geactiveerd of op andere wijze aangevraagd door het systeem om te worden uitgevoerd op de één of meer computerprocessoren.Embodiments of the system can be embodied as a whole in hardware, in software, or in a combination of hardware and software. In a preferred embodiment of the system, the measurement module may comprise a hardware device adapted to obtain the sample and to perform the measurements on the sample (typically software-controlled). The calculation module can be provided as a piece of software that can be run on a computer processor coupled to the measurement module, or can be otherwise adapted to obtain the measured allele events produced by the measurement module, for example via a data communication channel from the measurement module to the computer processor on which the piece of software can be executed - or in a particular embodiment, the calculation module can be provided as a hardware module coupled to the hardware measurement module. In the preferred embodiment, the detection module can be provided as a piece of software that can be run on a computer processor (the same computer processor as above or another computer processor), or can be otherwise adjusted to obtain the calculated number of allele sequence of the calculation module, e.g. via the data communication channel or via another suitable data communication channel. The estimation module can be provided as a piece of software that can be run on a computer processor (the same computer processor as above, or the same other computer processor as above, or yet another computer processor), or can be otherwise modified to obtain the detected subset, e.g. via the data communication channel or via another suitable data communication channel. In a particular embodiment, the system comprises a hardware measurement module coupled to one or more computer processors with associated computer memory storage. The measurement module, the detection module and the estimation module are present as software modules that are installed in the associated computer memory store, or that can be activated or otherwise requested by the system to run on the one or more computer processors.

De vakman zal inzien dat de stappen van eender welke van de voorkeurs- en verder ontwikkelde uitvoeringsvormen van de werkwijze die hierboven is geopenbaard kunnen worden uitgevoerd door de respectieve overeenkomstige modules van het systeem.Those skilled in the art will appreciate that the steps of any of the preferred and further developed embodiments of the method disclosed above can be performed by the respective corresponding modules of the system.

Volgens een voorkeursuitvoeringsvorm omvat het systeem een vooroordeelcorrectiemodule ingericht voor het corrigeren van allel-specifiek vooroordeel voor minstens één van het vooraf bepaalde aantal genetische markeringen, welk allel-specifiek vooroordeel te wijten is aan ongelijke amplificatie voor respectievelijk een referentie-allel en een alternatief allel voor een genetische markering.According to a preferred embodiment, the system comprises a bias correction module adapted to correct allele-specific bias for at least one of the predetermined number of genetic markers, which allele-specific bias is due to unequal amplification for a reference allele and an alternative allele for a genetic marker.

Volgens een voorkeursuitvoeringsvorm omvat het systeem een beperkingsmodule ingericht voor het uitvoeren van de stap van het beperken van de gedetecteerde deelverzameling van eender welke van de uitvoeringsvormen van de werkwijze die hierboven is geopenbaard.According to a preferred embodiment, the system comprises a restriction module adapted to perform the step of limiting the detected subset of any of the embodiments of the method disclosed above.

Korte figuurbeschriivingShort figure description

De bijgaande tekeningen worden gebruikt om niet-beperkende voorbeelduitvoeringsvormen van toestellen van de voorliggende uitvinding die tegenwoordig de voorkeur genieten te illustreren. De hierboven beschreven en andere voordelen van de maatregelen en doelen van de uitvinding zullen duidelijker worden en de uitvinding zal beter worden begrepen aan de hand van de volgende gedetailleerde beschrijving wanneer die wordt gelezen samen met de bijgaande tekeningen, waarin:The accompanying drawings are used to illustrate non-limiting exemplary embodiments of devices of the present invention that are currently preferred. The above described and other advantages of the features and objects of the invention will become more apparent and the invention will be better understood with reference to the following detailed description when read in conjunction with the accompanying drawings, in which:

Figuur 1 illustreert schematisch een puntgrafiek die data toont voor een monster zoals gebruikt in een uitvoeringsvorm van een werkwijze volgens voorliggende uitvinding;Figure 1 schematically illustrates a point chart showing data for a sample as used in an embodiment of a method according to the present invention;

Figuur 2 illustreert schematisch een andere puntgrafiek die data toont voor een monster zoals gebruikt in een uitvoeringsvorm van een werkwijze volgens voorliggende uitvinding;Fig. 2 schematically illustrates another point graph showing data for a sample as used in an embodiment of a method according to the present invention;

Figuur 3 illustreert schematisch een voorbeeldoptimalisatie zoals uitgevoerd in een uitvoeringsvorm van een werkwijze volgens voorliggende uitvinding; en Figuur 4 illustreert schematisch een voorbeeldpuntgrafiek die data toont van meerdere monsters zoals gebruikt in een uitvoeringsvorm van een werkwijze volgens voorliggende uitvinding.Figure 3 schematically illustrates an example optimization as performed in an embodiment of a method according to the present invention; and Figure 4 schematically illustrates an exemplary point chart showing data from a plurality of samples as used in an embodiment of a method according to the present invention.

Gedetailleerde beschrijving van voorbeelduitvoeringsvormenDetailed description of exemplary embodiments

In een Niet-Invasieve Prenatale Test (Non-Invasive Prénatal Test, NIPT), bekend in de stand van de techniek, wordt celvrij DNA (cfDNA) in een matemaal serum of plasmamonster van een zwangere vrouw gesequentieerd om de aanwezigheid van chromosomale aneuploïdieën in de foetus op te sporen, zoals trisomie van chromosoom 21. Een factor om te schatten om de data te interpreteren is de foetale fractie (FF), die de fractie is van hef celvrije DNA in het maternale monster die afstamt van de fbetus. Typische foetale fracties liggen tussen 2 % en 6 %, of zelfs tussen 0.39 % en 11.4 %. Volgens voorbeelduitvoeringsvormen van de uitvinding wordt een werkwijze voorzien voor het schatten van de foetale fractie gebruikmakend van data van de Clarigo-test van de Aanvraagster die niet de detectie omvatten van SNP-allelen op het foetale DNA die niet aanwezig zijn in het DNA van de zwangere vrouw.In a Non-Invasive Prenatal Test (NIPT), known in the art, cell-free DNA (cfDNA) is sequenced in a mature serum or plasma sample from a pregnant woman to detect the presence of chromosomal aneuploidies in the detecting the fetus, such as trisomy of chromosome 21. One factor to estimate to interpret the data is the fetal fraction (FF), which is the fraction of cell-free DNA in the maternal sample that is descended from the fbetus. Typical fetal fractions are between 2% and 6%, or even between 0.39% and 11.4%. According to exemplary embodiments of the invention, a method is provided for estimating the fetal fraction using applicant's Clarigo test data that does not include the detection of SNP alleles on the fetal DNA that are not present in the DNA of the pregnant woman woman.

De Clarigo-test bestaat uit het doelgericht sequentiëren van een aantal gebieden op het menselijke genoom (met andere woorden het doelen op specifieke genetische markeringen), gebruikmakend van bekende SNP’s (enkele-nucleotide polymorfisme - single-nucleotide polymorphism) met grote (bijvoorbeeld groter dan 1 %, bij voorkeur groter dan 10 %) populatieprevalentie en twee mogelijke allelen (te weten een referentie-allel ook gekend als REF; en een alternatief allel ook gekend als ALT). Meer details over de Clarigo-test kunnen worden gevonden op het internet op http://www.multiplicom.com/product/clarigo, en in WO 2013/057568 ten name van de Aanvraagster.The Clarigo test consists of targeting sequentially a number of regions on the human genome (in other words, targeting specific genetic markers), using known SNPs (single-nucleotide polymorphism - single-nucleotide polymorphism) with large (e.g., greater than 1%, preferably greater than 10%) population prevalence and two possible alleles (i.e., a reference allele also known as REF; and an alternative allele also known as ALT). More details about the Clarigo test can be found on the internet at http://www.multiplicom.com/product/clarigo, and in WO 2013/057568 in the name of the Applicant.

Document EP 0 994 063 uit de stand van de techniek openbaart niet-invasieve prenatale diagnosemethoden, bijvoorbeeld om bepaalde ziekten op te sporen. De prenatale diagnosemethoden omvatten het schatten van de foetale fractie. Bekende schattingswerkwijzen voor het schatten van de foetale fractie omvatten de detectie van SNP-allelen op het foetale celvrije DNA die niet aanwezig zijn in het maternale DNA. Met andere woorden, deze bekende schattingswerkwijzen onderzoeken SNP-allelen waarbij het maternale DNA homozygoot is.Prior art document EP 0 994 063 discloses non-invasive prenatal diagnostic methods, for example to detect certain diseases. The prenatal diagnostic methods include estimating the fetal fraction. Known methods for estimating the fetal fraction include the detection of SNP alleles on the fetal cell-free DNA that are not present in the maternal DNA. In other words, these known estimation methods investigate SNP alleles in which the maternal DNA is homozygous.

Uitvoeringsvormen van voorliggende uitvinding beogen een aanpak te voorzien van het schatten van de foetale fractie.Embodiments of the present invention aim to provide an approach to estimating the fetal fraction.

Het baseren van schatting van de foetale fractie op onderzoeken van deze allelen kan de betrouwbaarheid beperken. Bijzondere uitvoeringsvormen van voorliggende uitvinding kunnen daarom beogen een verificatie toe te laten van de bevindingen van bekende schattingswerkwijzen. Deze bijzondere uitvoeringsvormen zijn onder meer gebaseerd op het inventieve inzicht dat het schatten van de foetale fractie op basis van de gedetecteerde deelverzameling van het aantal genetische markeringen toelaat om de foetale fractie te verifiëren zoals geschat in bekende schattingswerkwijzen, onafhankelijk van de onderzochte SNP-allelen waarbij het matemale DNA homozygoot is. Deze verificatie verbetert de betrouwbaarheid van de foetale fractie zoals geschat in bekende schattingswerkwijzen, door de nauwkeurigheid van die schattingen te meten.Basing the estimate of the fetal fraction on studies of these alleles can limit reliability. Particular embodiments of the present invention may therefore be intended to permit verification of the findings of known estimation methods. These particular embodiments are based inter alia on the inventive insight that estimating the fetal fraction based on the detected subset of the number of genetic markers allows to verify the fetal fraction as estimated in known estimation methods, independently of the SNP alleles investigated the matte DNA is homozygous. This verification improves the reliability of the fetal fraction as estimated in known estimation methods, by measuring the accuracy of those estimates.

Bovendien kan het bijzonder voordelig zijn om de bekende schattingswerkwijzen te combineren met uitvoeringsvormen van voorliggende uitvinding, om de betrouwbaarheid van de geschatte foetale fractie verder te verbeteren. Door het combineren van schattingswerkwijzen die de detectie omvatten van SNP-allelen op het foetale celvrije DNA die niet aanwezig zijn in het matemale DNA en uitvoeringsvormen van voorliggende uitvinding kan de betrouwbaarheid van de geschatte foetale fractie verder worden verbeterd, aangezien schattingen gebaseerd kunnen zijn op SNP-allelen waarbij het matemale DNA homozygoot is zowel als op SNP-allelen (of korte inserties en deleties) waarbij het matemale DNA heterozygoot is.Moreover, it may be particularly advantageous to combine the known estimation methods with embodiments of the present invention to further improve the reliability of the estimated fetal fraction. By combining estimation methods that include the detection of SNP alleles on the fetal cell-free DNA that are not present in the matte DNA and embodiments of the present invention, the reliability of the estimated fetal fraction can be further improved, since estimates may be based on SNP - alleles in which the matte DNA is homozygous as well as on SNP alleles (or short insertions and deletions) in which the matte DNA is heterozygous.

In een typische uitvoeringsvorm is het matemale serum of plasmamonster afgeleid van het matemale bloed. Dit kan een kleine hoeveelheid serum of plasma zijn, bijvoorbeeld 1-20 ml. Afhankelijk van de gewenste nauwkeurigheid, kan het de voorkeur genieten om grotere volumes te gebruiken. De preparatie van het serum of plasma van het matemale bloedmonster kan worden uitgevoerd gebruikmakend van standaardtechnieken. Geschikte technieken omvatten: centrifugatie, matrixgebaseerde technieken, etc. In mogelijke uitvoeringsvormen kan een sequentiegebaseerde verrijkingswerkwijze worden gebruikt op het matemale serum of plasma om het specifiek te verrijken voor foetale nucleïnezuursequenties.In a typical embodiment, the matte serum or plasma sample is derived from the matte blood. This can be a small amount of serum or plasma, for example 1-20 ml. Depending on the desired accuracy, it may be preferable to use larger volumes. The preparation of the serum or plasma of the matte blood sample can be performed using standard techniques. Suitable techniques include: centrifugation, matrix-based techniques, etc. In possible embodiments, a sequence-based enrichment method can be used on the matrimal serum or plasma to enrich it specifically for fetal nucleic acid sequences.

Uitvoeringsvormen van de werkwijze van de uitvinding kunnen het bepalen omvatten of een monster al dan niet foetaal DNA bevat op een foetale fractie groter dan een vooraf bepaalde drempelwaarde.Embodiments of the method of the invention may include determining whether or not a sample contains fetal DNA at a fetal fraction greater than a predetermined threshold value.

In voorkeursuitvoeringsvormen wordt een amplificatie van de foetale DNA-sequenties in het monster uitgevoerd. Eender welke amplificatiewerkwijze bekend voor de vakman kan worden gebruikt, zoals een PCR- (polymerase kettingreactie, polymerase chain reaction) werkwijze.In preferred embodiments, an amplification of the fetal DNA sequences is performed in the sample. Any amplification method known to those skilled in the art can be used, such as a PCR (polymerase chain reaction, polymerase chain reaction) method.

Nu zal in detail een eerste uitvoeringsvorm van een werkwijze voor het schatten van een foetale fractie worden besproken. Allelaanwezigheden worden gemeten voor een vooraf bepaald aantal genetische markeringen in een monster van celvrij DNA van een zwangere vrouw. Elke allelaanwezigheid stelt de aanwezigheid voor op een genetische markering van het vooraf bepaalde aantal genetische markeringen van minstens één van: een referentie-allel van matemale of foetale oorsprong, en een alternatief allel van maternale of foetale oorsprong.A first embodiment of a method for estimating a fetal fraction will now be discussed in detail. Allelic events are measured for a predetermined number of genetic markers in a sample of cell-free DNA from a pregnant woman. Each allele presence represents the presence on a genetic marker of the predetermined number of genetic markers of at least one of: a reference allele of matemal or fetal origin, and an alternative allele of maternal or fetal origin.

Met andere woorden, voor een aantal DNA-sequenties met een bekende locatie op een chromosoom, wordt bepaald al of niet, en hoe vaak, hetzij een referentie-allel, een alternatief allel, of beide aanwezig zijn. De allelen kunnen elk van respectievelijk matemale of foetale oorsprong zijn, aangezien de metingen uitgevoerd worden op een monster van celvrij DNA van een zwangere vrouw, en bijgevolg DNA bevatten van zowel de vrouw als de foetus.In other words, for a number of DNA sequences with a known location on a chromosome, it is determined whether or not, and how often, either a reference allele, an alternative allele, or both are present. The alleles can be of matemal or fetal origin, respectively, since the measurements are performed on a sample of cell-free DNA from a pregnant woman, and therefore contain DNA from both the woman and the fetus.

Een voordelige manier om de resultaten voor te stellen van het meten van allelaanwezigheden voor een genetische markering is om de volgende informatie te associëren met een variantdatapunt voor die genetische markering. Een variantdatapunt (hetgeen een datapunt is geassocieerd met een aantal varianten, zoals allelen) wordt gebruikt in deze specificatie als een handige weergave voor een genetische markering, en stelt dus het resultaat voor van het meten van allelaanwezigheden in een aantal amplicons voor genetische markeringen. Een amplicon is een stukje DNA of RNA dat (de bron en/of) het product van amplificatie- of replicatiegebeurtenissen is - met andere woorden, een amplicon is een biofysisch stukje replicatiemateriaal, ontworpen om een bekende SNP-positie te bevatten met een hoge populatieprevalentie (bijvoorbeeld groter dan 1 %, bij voorkeur groter dan 10 %). Elk variantdatapunt wordt dus geassocieerd met een bekend SNP met grote populatieprevalentie (bijvoorbeeld groter dan 1 %, bij voorkeur groter dan 10 %) en met twee mogelijke allelen (te weten een referentie-allel ook gekend als REF; en een alternatief allel ook gekend als ALT). Voor elk variantdatapunt □□ kunnen de volgende getallen worden bepaald gebruikmakend van bijvoorbeeld aan standaard bio-informaticapijplijn toegepast op de sequentiëringsdata: • Het aantal inlezingen die het REF-allel op de bekende SNP-positie bevatten,An advantageous way to present the results of measuring allele presence for a genetic marker is to associate the following information with a variant data point for that genetic marker. A variant data point (which is a data point associated with a number of variants, such as alleles) is used in this specification as a handy representation for a genetic mark, and thus represents the result of measuring allele presence in a number of genetic markers amplicons. An amplicon is a piece of DNA or RNA that is (the source and / or) the product of amplification or replication events - in other words, an amplicon is a biophysical piece of replication material designed to contain a known SNP position with a high population prevalence (e.g. greater than 1%, preferably greater than 10%). Each variant data point is thus associated with a known SNP with high population prevalence (e.g. greater than 1%, preferably greater than 10%) and with two possible alleles (i.e., a reference allele also known as REF; and an alternative allele also known as ALT). For each variant data point □□, the following numbers can be determined using, for example, a standard bioinformatics pipeline applied to the sequencing data: • The number of readings containing the REF allele at the known SNP position,

• Het aantal inlezingen die het ALT-allel op de bekende SNP-positie bevatten,• The number of readings that contain the ALT allele at the known SNP position,

• De totale dekking• The total coverage

• De allelfrequentie, of de fractie van ALT-allelinlezingen op de totale dekking• The allele frequency, or the fraction of ALT allele readings on the total coverage

Bijgevolg kunnen, voor een gegeven genetische markering i, de allelaanwezigheden worden gemeten voor zowel het REF-allel, voor het ALT-allel, als voor beide allelen, door het meten van de aantallen inlezingen die respectievelijk het REF-allel, het ALT-allel en zowel het REF- als het ALT-allel bevatten. Op basis van de gemeten allelaanwezigheden wordt een overeenstemmend aantal allelfrequenties berekend voor het vooraf bepaalde aantal genetische markeringen.Therefore, for a given genetic marker i, the allele presentations can be measured for both the REF allele, for the ALT allele and for both alleles, by measuring the numbers of readings that respectively the REF allele, the ALT allele and contain both the REF and the ALT allele. Based on the measured allele presence, a corresponding number of allele frequencies is calculated for the predetermined number of genetic markers.

Voor elke positie in het genoom (dat wil zeggen voor elke genetische locus) - met uitsluiting van de geslachtschromosomen en aannemend dat er geen relevante chromosoomstoornissen zijn, zijn er vier kopieën aanwezig in het monster (aannemend dat de positie geen deel uitmaakt van een aneuploïdieregio), die het totale aantal inlezingen bepalen: twee kopieën van het matemale DNA en twee kopieën van het foetale DNA.For each position in the genome (i.e. for each genetic locus) - excluding sex chromosomes and assuming there are no relevant chromosome disorders, there are four copies present in the sample (assuming the position is not part of an aneuploid region) , which determine the total number of readings: two copies of the matte DNA and two copies of the fetal DNA.

Voor een individueel variantdatapunt (dat wil zeggen voor een individuele genetische markering) laat A en B het REF- en ALT-allel aanduiden voor de bekende SNP op het matemale DNA voor die genetische markering, en a en b de overeenstemmende toestanden voor het foetale DNA. Dit betekent dat het variantdatapunt in de mogelijke toestanden opgelijst in Tabel 1 kan zijn:For an individual variant data point (i.e. for an individual genetic marking), A and B have the REF and ALT alleles indicated for the known SNP on the matte DNA for that genetic marking, and a and b the corresponding states for the fetal DNA . This means that the variant data point in the possible states listed in Table 1 can be:

Tabel 1Table 1

Ter illustratie toont de puntgrafiek geïllustreerd in Figuur 1 data voor een monster, waarbij:For illustration, the dot graph illustrated in Figure 1 shows data for a sample, where:

• Elk punt een variantdatapunt is (en het resultaat van metingen gemaakt op amplicons voor een gegeven genetische markering voorstelt). • De horizontale as de fractie inlezingen toont met het ALT-SNP-allel (dat wil zeggen de allelfrequentie Fi). • De verticale as de totale inlezingsdekking Cn toont.• Each point is a variant data point (and represents the result of measurements made on amplicons for a given genetic marker). • The horizontal axis shows the fraction read-in with the ALT-SNP allele (ie the allele frequency Fi). • The vertical axis shows the total reading coverage Cn.

Het valt te zien uit Figuur 1 dat specifieke variantdatapunten geassocieerd zijn met een specifieke allelfrequentie.It can be seen from Figure 1 that specific variant data points are associated with a specific allele frequency.

Bijvoorbeeld wordt variantdatapunt 111 getoond aan de linkerzijde, en stelt het een genetische markering voor waarvoor ongeveer 2800 inlezingen werden uitgevoerd. Alle of bijna alle inlezingen voor deze genetische markering hebben gemeten dat de allelaanwezigheid aangeeft dat REF-allelen (dat wil zeggen A) aanwezig zijn, maar niet dat ALT-allelen aanwezig zijn (dat wil zeggen B). Bijgevolg is variantdatapunt 111 aan de linkerzijde geplot in Figuur 1, waar de allelfrequentie (bijna) 0 is, en waarschijnlijk een homozygote genetische markering AAaa voorstelt.For example, variant data point 111 is shown on the left, and it represents a genetic marker for which approximately 2800 readings were performed. All or nearly all readings for this genetic marker have measured that the allele presence indicates that REF alleles (i.e., A) are present, but not that ALT alleles are present (i.e., B). Consequently, variant data point 111 is plotted on the left in Figure 1, where the allele frequency is (almost) 0, and probably represents a homozygous genetic marker AAaa.

Variantdatapunt 112 wordt aan de rechterzijde getoond, en stelt een genetische markering voor waarvoor ongeveer 2700 inlezingen werden uitgevoerd. Alle of bijna alle inlezingen voor deze genetische markering hebben gemeten dat de allelaanwezigheid aangeeft dat REF-allelen (dat wil zeggen A) niet aanwezig zijn, maar dat ALT-allel (dat wil zeggen B) aanwezig zijn. Bijgevolg is variantdatapunt 112 aan de rechterzijde geplot in Figuur 1, waar de allelfrequentie (bijna) 1 is, en waarschijnlijk een homozygote genetische markering BBbb voorstelt.Variant data point 112 is shown on the right, and represents a genetic marker for which approximately 2,700 readings were made. All or nearly all readings for this genetic marker have measured that the allele presence indicates that REF alleles (i.e., A) are not present, but that ALT alleles (i.e., B) are present. Consequently, variant data point 112 is plotted on the right-hand side in Figure 1, where the allele frequency is (almost) 1, and probably represents a homozygous genetic marker BBbb.

Variantdatapunt 121 stelt een genetische markering voor waarvoor ongeveer 3000 inlezingen werden uitgevoerd. De gemeten allelaanwezigheden laten toe om de allelfrequentie te berekenen, die relatief laag is, maar niet 0. Bijgevolg stelt variantdatapunt 121 waarschijnlijk een genetische markering voor die maternaal homozygoot is voor het referentie-allelpaar maar een heterozygoot allelpaar van foetale origine heeft (dus AAab), aangezien de fractie van maternaal DNA aanwezig in het monster voor de genetische markering (veel) groter is dan de fractie van foetaal DNA aanwezig in het monster voor de genetische markering.Variant data point 121 represents a genetic marker for which approximately 3000 readings were made. The measured allele presence makes it possible to calculate the allele frequency, which is relatively low but not 0. Consequently, variant data point 121 probably suggests a genetic mark that is maternally homozygous for the reference allele pair but has a heterozygous allele pair of fetal origin (so AAab) , since the fraction of maternal DNA present in the sample for the genetic marking is (much) larger than the fraction of fetal DNA present in the sample for the genetic marking.

Variantdatapunt 122 wordt aan de rechterzijde getoond, en stelt een genetische markering voor waarvoor ongeveer 1800 inlezingen werden uitgevoerd. Door dezelfde redenering stelt variantdatapunt 122 waarschijnlijk een genetische markering voor die maternaal homozygoot is voor het alternatieve allelpaar maar een heterozygoot allelpaar van foetale origine heeft (dus BBab).Variant data point 122 is shown on the right, and represents a genetic marker for which approximately 1800 readings were made. By the same reasoning, variant data point 122 probably suggests a genetic marker that is maternally homozygous for the alternative allele pair but has a heterozygous allele pair of fetal origin (ie, BBab).

Variantdatapunt 131 stelt een genetische markering voor waarvoor ongeveer 2700 inlezingen werden uitgevoerd. De gemeten allelaanwezigheden laten toe om de allelfrequentie te berekenen, waarvan gevonden wordt dat die ongeveer 0.51 is. Bijgevolg stelt variantdatapunt 131 waarschijnlijk een genetische markering voor die matemaal heterozygoot is (dus AB). Het is niet prima facie zo dat het variantdatapunt een genetische markering zou voorstellen die tevens heterozygoot is voor de foetus, hoewel dit gegeven de grote totale inlezingsdekking, waarschijnlijk is.Variant data point 131 represents a genetic marker for which approximately 2,700 readings were made. The measured allele presence makes it possible to calculate the allele frequency, which is found to be approximately 0.51. Consequently, variant data point 131 is likely to represent a genetic marker that is almost heterozygous (ie AB). It is not prima facie that the variant data point would represent a genetic marker that is also heterozygous for the fetus, although this is likely given the large overall read-in coverage.

Variantdatapunt 132 stelt een genetische markering voor waarvoor ongeveer 800 inlezingen werden uitgevoerd. De gemeten allelaanwezigheden laten toe om de allelfrequentie te berekenen, waarvan gevonden wordt dat die ongeveer 0.68 is. Bijgevolg stelt variantdatapunt 132 waarschijnlijk een genetische markering voor die matemaal heterozygoot is (dus AB). Aangezien het variantdatapunt 131 een groter aantal inlezingen voorstelt voor een specifieke genetische markering dan variantdatapunt 132, is variantdatapunt 131 statistisch betrouwbaarder dan variantdatapunt 132.Variant data point 132 represents a genetic marker for which approximately 800 readings were made. The measured allele presence makes it possible to calculate the allele frequency, which is found to be approximately 0.68. Consequently, variant data point 132 is likely to represent a genetic marker that is almost heterozygous (ie AB). Since the variant data point 131 represents a greater number of readings for a specific genetic marking than variant data point 132, variant data point 131 is statistically more reliable than variant data point 132.

Bijgevolg kunnen drie groepen variantdatapunten (1 IA en 1 IB, 12A en 12B, en 13) worden onderscheiden: • variantdatapunten 1 IA en 11B die homozygoot zijn in het matemale en foetale DNA (AAaa, BBbb). • variantdatapunten 12A en 12B die homozygoot zijn in het matemale DNA, en heterozygoot in het foetale DNA (AAab, BBab). Merk op dat in deze gevallen het foetale DNA een allel bevat dat overgeërfd is van de vader en dat niet aanwezig is in het matemale DNA. • variantdatapunten 13 die heterozygoot zijn in het matemale DNA (ABaa, ABab, ABbb). Merk op dat voor elk van deze variantdatapunten het foetale DNA enkel allelen bevat die ook aanwezig zijn in het matemale DNA.Consequently, three groups of variant data points (1 IA and 1 IB, 12A and 12B, and 13) can be distinguished: • variant data points 1 IA and 11B that are homozygous in the matrimal and fetal DNA (AAaa, BBbb). Variant data points 12A and 12B that are homozygous in the matte DNA, and heterozygous in the fetal DNA (AAab, BBab). Note that in these cases, the fetal DNA contains an allele inherited from the father and not present in the matte DNA. Variant data points 13 that are heterozygous in the matte DNA (ABaa, ABab, ABbb). Note that for each of these variant data points, the fetal DNA contains only alleles that are also present in the matte DNA.

Men merkt op dat meerdere variantdatapunten dezelfde (of nagenoeg dezelfde) allelfrequentie kunnen hebben, vooral wanneer ze deel uitmaken van dezelfde groep. Dit betekent dat (nagenoeg) hetzelfde aantal allelaanwezigheden gemeten is geweest voor hen, ten opzichte van het totale aantal inlezingen.It is noted that several variant data points may have the same (or almost the same) allele frequency, especially if they are part of the same group. This means that (almost) the same number of allele present was measured for them, compared to the total number of readings.

Men merkt tevens op dat, in Figuur 1, variantdatapunten met een grotere totale inlezingsdekking (dichter bij de bovenkant van de grafiek) een nauwkeurigere allelfrequentie hebben, simpelweg omdat er meer metingsdata is. Dit verklaart waarom de groepen 11A-B, 12A-B en 13 van variantdatapunten in Figuur 1 een algemeen taps toelopende vorm hebben. Deze eigenschap kan in rekening worden gebracht wanneer men een statistische betrouwbaarheid bepaalt voor een gegeven variantdatapunt.It is also noted that, in Figure 1, variant data points with greater total read-in coverage (closer to the top of the graph) have a more accurate allele frequency simply because there is more measurement data. This explains why the groups 11A-B, 12A-B and 13 of variant data points in Figure 1 have a generally tapered shape. This property can be taken into account when determining a statistical reliability for a given variant data point.

De foetale fractie kan worden geschat als volgt.The fetal fraction can be estimated as follows.

Op basis van het berekende aantal allelfrequenties, wordt een deelverzameling van het vooraf bepaalde aantal genetische markeringen gedetecteerd. De deelverzameling wordt geassocieerd met heterozygote allelparen van matemale oorsprong. Bijgevolg omvat de gedetecteerde deelverzameling bij voorkeur genetische markeringen waarvan de variantdatapunten zich in de toestanden ABaa, ABab, en ABbb bevinden, en bij voorkeur geen genetische markeringen omvatten waarvan de variantdatapunten zich in de toestanden AAaa en BBbb, en AAab en BBab bevinden. Voor de duidelijkheid, wanneer wordt gezegd dat een variantdatapunt zich in een toestand bevindt, wordt bedoeld dat amplicons voor zijn genetische markering zijn ingelezen als zijnde in die toestand - met andere woorden, metingen voor die genetische markering hebben aangetoond dat het in die toestand is (en bijgevolg dat die genetische markering bijvoorbeeld heterozygoot in zij matemaal DNA is, hetgeen kan worden voorgesteld in de voorliggende specificatie door een variantdatapunt in één van de toestanden ABaa, ABab, of ABbb).Based on the calculated number of allele frequencies, a subset of the predetermined number of genetic markers is detected. The subset is associated with heterozygous allel pairs of matemal origin. Accordingly, the detected subset preferably includes genetic markers whose variant data points are in the states ABaa, ABab, and ABbb, and preferably do not include genetic markers whose variant data points are in the states AAaa and BBbb, and AAab and BBab. For the sake of clarity, when a variant data point is said to be in a state, it is meant that amplicons for its genetic marking are read in as being in that state - in other words, measurements for that genetic marking have shown that it is in that state ( and therefore that that genetic marker is, for example, heterozygous in side template DNA, which can be represented in the present specification by a variant data point in one of the states ABaa, ABab, or ABbb).

Merk op dat deze detectie niet noodzakelijk de detectie omvat van (SNP-) allelen op het foetale celvrije DNA die niet aanwezig zijn in het maternale DNA. In het bijzonder worden (SNP-) allelen gedetecteerd op het foetale celvrij DNA die aanwezig zijn in het matemale DNA, aangezien het maternale DNA heterozygoot is voor de gedetecteerde deelverzameling: of de allelen van de foetale oorsprong aa, ab of bb zijn, elk van die allelen behoort tot de zwangere vrouw, die AB heeft.Note that this detection does not necessarily include the detection of (SNP) alleles on the fetal cell-free DNA that are not present in the maternal DNA. In particular, (SNP) alleles are detected on the fetal cell-free DNA present in the matte DNA, since the maternal DNA is heterozygous for the detected subset: whether the alleles are of the fetal origin aa, ab or bb, any of those alleles belong to the pregnant woman who has AB.

In een specifieke uitvoeringsvorm wordt deze deelverzameling gedetecteerd, op basis van het berekende aantal allelfrequenties, door het selecteren uit het vooraf bepaalde aantal genetische markering, als die deelverzameling, van een tweede aantal genetische markeringen waarvan overeenstemmende allelfrequenties een vooraf bepaalde minimum allelfrequentiedrempel overschrijden en een vooraf bepaalde maximum allelfrequentiedrempel niet overschrijden. Voorbeelddrempels kunnen respectievelijk 0.3 en 0.7 zijn, of respectievelijk 0.4 en 0.6. Voorbeeldminimum en -maximum drempels kunnen vooraf bepaald worden op basis van één of meer gekende kalibratiemonsters.In a specific embodiment, this subset is detected, based on the calculated number of allele frequencies, by selecting from the predetermined number of genetic markers, as that subset, a second number of genetic markers whose corresponding allele frequencies exceed a predetermined minimum allele frequency threshold and a predetermined minimum certain maximum allele frequency threshold. Example thresholds can be 0.3 and 0.7, or 0.4 and 0.6 respectively. Example minimum and maximum thresholds can be predetermined on the basis of one or more known calibration samples.

Op basis van de gedetecteerde deelverzameling wordt de foetale fractie (dat wil zeggen de fractie van celvrij DNA van foetale oorsprong in het monster) geschat. Dit kan worden begrepen uit de indicatie hierboven dat ten minste enkele van de genetische markeringen van de gedetecteerde deelverzameling (bijvoorbeeld die in de toestanden ABaa en ABbb) probabilistisch verwant zijn aan de foetale fractie. Bijgevolg kan de foetale fractie worden geschat op basis van deze gedetecteerde deelverzameling. Genetische markeringen (voorgesteld door variantdatapunten □□ die inlezingen voorstellen gemaakt op amplicons) van de gedetecteerde deelverzameling zijn heterozygoot in het maternale DNA en kunnen bijgevolg hetzij ABaa, ABab, of ABbb zijn. Echter, de eigenlijke toestand is niet gekend, en het is ondoenlijk om deze te bepalen voor een individueel variantdatapunt aangezien de distributies van de toestanden ABaa, ABab, en ABbb overlappen voor typische waarden van de foetale fractie.Based on the detected subset, the fetal fraction (i.e., the fraction of cell-free DNA of fetal origin in the sample) is estimated. This can be understood from the indication above that at least some of the genetic markers of the detected subset (e.g. those in the ABaa and ABbb states) are probabilistically related to the fetal fraction. Consequently, the fetal fraction can be estimated based on this detected subset. Genetic markings (represented by variant data points □□ representing readings made on amplicons) of the detected subset are heterozygous in the maternal DNA and can therefore be either ABaa, ABab, or ABbb. However, the actual state is not known, and it is impossible to determine it for an individual variant data point since the distributions of the ABaa, ABab, and ABbb states overlap for typical fetal fraction values.

In een specifieke uitvoeringsvorm kan de schatting het produceren omvatten van een initiële schatting voor de foetale fractie en het optimaliseren van de initiële schatting over de gedetecteerde deelverzameling.In a specific embodiment, the estimate may include producing an initial estimate for the fetal fraction and optimizing the initial estimate over the detected subset.

In een verder ontwikkelde uitvoeringsvorm kan het optimaliseren het maximaliseren omvatten van de waarschijnlijkheid van de initiële schatting - dat wil zeggen het vinden van een schatting voor de foetale fractie, op basis van de initiële schatting, die maximaal waarschijnlijk de eigenlijke foetale fractie karakteriseert. Dit kan worden gedaan door het herhaaldelijk uitvoeren van de volgende verzameling operaties terwijl de schatting wordt gevarieerd (dat wil zeggen het nemen van een andere waarde voor de schatting dat haar initiële waarde): voor een gegeven waarde van de schatting die wordt gevarieerd, het berekenen, voor elke genetische markering in de gedetecteerde deelverzameling, van de respectieve probabiliteiten dat die genetische markering geassocieerd is met een homozygoot referentie-allelpaar van foetale oorsprong, een heterozygoot allelpaar van foetale oorsprong, of een homozygoot alternatief allelpaar van foetale oorsprong; en het berekenen van een waarschijnlijkheid van de gegeven waarde van de schatting die gevarieerd wordt, voor de gedetecteerde deelverzameling, op basis van de berekende respectieve probabiliteiten voor elke genetische markering in de gedetecteerde deelverzameling.In a further developed embodiment, optimizing may include maximizing the probability of the initial estimate - i.e., finding an estimate for the fetal fraction, based on the initial estimate, which most likely characterizes the actual fetal fraction. This can be done by repeatedly performing the next set of operations while the estimate is varied (i.e., taking a different value for the estimate that is its initial value): for a given value of the estimate being varied, calculating , for each genetic marker in the detected subset, of the respective probabilities that that genetic marker is associated with a homozygous reference allele pair of fetal origin, a heterozygous allele pair of fetal origin, or a homozygous alternative allele pair of fetal origin; and calculating a probability of the given value of the estimate being varied for the detected subset, based on the calculated respective probabilities for each genetic marker in the detected subset.

In een voorbeelduitvoeringsvorm, om de waarschijnlijkheid te bepalen van een gegeven schatting voor de foetale fractie, worden de respectieve probabiliteiten berekend dat de waargenomen REF-en ALT-inlezingsaantallen overeenstemmen met een genetische markering met een bijzondere toestand van ABaa, ABab, en ABbb, en met de gegeven schatting voor de foetale fractie. Deze berekening kan worden uitgevoerd rekening houdend met een statistische distributie-aanname voor de inlezingsaantallen - bijvoorbeeld gebruikmakend van de aanname dat de inlezingsaantallen een Poissondistributie volgen.In an exemplary embodiment, to determine the probability of a given estimate for the fetal fraction, the respective probabilities are calculated that the observed REF and ALT read numbers correspond to a genetic mark with a particular state of ABaa, ABab, and ABbb, and with the given estimate for the fetal fraction. This calculation can be performed taking into account a statistical distribution assumption for the read-in numbers - for example, using the assumption that the read-in numbers follow a Poison distribution.

In de voorbeelduitvoeringsvorm kan een algemene waarschijnlijkheid optioneel worden berekend van de gemeten allelaanwezigheden, dat wil zeggen van de waargenomen REF- en ALT-inlezingen voor elk variantdatapunt met de gegeven schatting voor de foetale fractie door de grootste probabiliteit te nemen van de respectieve probabiliteiten berekend voor de mogelijke toestanden ABaa, ABab en ABbb.In the exemplary embodiment, a general probability can optionally be calculated from the measured allele presence, i.e. from the observed REF and ALT readings for each variant data point with the given estimate for the fetal fraction by taking the greatest probability of the respective probabilities calculated for the possible states of ABaa, ABab and ABbb.

In de voorbeelduitvoeringsvorm wordt de waarschijnlijkheid van de gegeven schatting berekend, op basis van de berekende respectieve probabiliteiten voor elke genetische markering in de gedetecteerde deelverzameling - voor deze uitvoeringsvorm in het bijzonder door het nemen van het product van alle algemene probabiliteiten over de gedetecteerde deelverzameling. Deze waarschijnlijkheid kan dan worden gemaximaliseerd, bijvoorbeeld gebruikmakend van een niet-lineaire optimalisatiewerkwijze.In the exemplary embodiment, the probability of the given estimate is calculated based on the calculated respective probabilities for each genetic marker in the detected subset - in particular for this embodiment, by taking the product of all general probabilities over the detected subset. This probability can then be maximized, for example using a non-linear optimization method.

Voor sommige variantdatapunten in de test, vermeerdert de amplificatie in het verwerken van het monster om de allelaanwezigheden te meten de REF- en ALT-allelen niet in gelijke verhoudingen. Het resultaat is een allel-specifiek vooroordeel.For some variant data points in the test, the amplification in sample processing to measure the allele attributes does not increase the REF and ALT alleles in equal proportions. The result is an allele-specific prejudice.

Dit vooroordeel kan worden gecorrigeerd voor een gegeven genetische markering, door het analyseren van een batch van meerder monsters, bij voorkeur gelijktijdig, en het meten van de gemiddelde allelfrequentie van de variantdatapunten voor de gegeven genetische markering over alle monsters in de batch, welke variantdatapunten heterozygoot zijn op het matemale DNA. Als dit gemiddelde gebaseerd is op een voldoende groot aantal monsters, kan zijn afwijking van de verwachtingswaarde 0.5 gebruikt worden om een correctiefactor op te stellen voor elk variantdatapunt.This bias can be corrected for a given genetic marking, by analyzing a batch of several samples, preferably simultaneously, and measuring the average allele frequency of the variant data points for the given genetic marking over all samples in the batch, which variant data points are heterozygous are on the matemale DNA. If this average is based on a sufficiently large number of samples, its deviation from the expected value 0.5 can be used to establish a correction factor for each variant data point.

De nauwkeurigheid van schatting van de foetale fractie kan worden verbeterd door het beperken van de geselecteerde variantdatapunten tot een hoge kwaliteits-deelverzameling. Deze beperking kan gebaseerd zijn op een individueel doelmonster, of op een batch monters. Voorbeelden van filters voor een dergelijke beperking bevatten één of meer van de volgende benaderingen: • weiger variantdatapunten waarbij de totale dekking onder een vooraf bepaalde specifieke drempel voor het doelmonster is; en • voor elk variantdatapunt, bereken de standaardafwijking van de allelffequenties over alle monsters in een batch, gebruikmakend van slechts die monsters waarbij het variantdatapunt heterozygoot is in het matemaal DNA; en weiger het variantdatapunt indien deze standaardafwijking boven een vooraf bepaalde specifieke drempel is.The accuracy of estimation of the fetal fraction can be improved by limiting the selected variant data points to a high quality subset. This limitation can be based on an individual target sample, or on a batch of monters. Examples of filters for such a limitation include one or more of the following approaches: • Reject variant data points where total coverage is below a predetermined specific threshold for the target sample; and • for each variant data point, calculate the standard deviation of the allelic sequences over all samples in a batch, using only those samples where the variant data point is heterozygous in the DNA template; and reject the variant data point if this standard deviation is above a predetermined specific threshold.

Figuur 2 illustreert schematisch een andere puntgrafiek die data toont voor een monster zoals gebruikt in een uitvoeringsvorm van een werkwijze volgens voorliggende uitvinding. De puntgrafiek toont de allelfrequentie ITvan elk variantdatapunt in functie van zijn totale dekking □D3 Met andere woorden, voor elke genetische markering die in beschouwing wordt genomen, toont de verticale as hoeveel allelaanwezigheden in totaal werden gemeten (REF en ALT gecombineerd) voor die genetische markering, en de horizontale as toont hoe frequent de aanwezigheid van het ALT-allel gemeten is geweest voor die genetische markering.Figure 2 schematically illustrates another point graph showing data for a sample as used in an embodiment of a method according to the present invention. The dot graph shows the allele frequency IT of each variant data point as a function of its total coverage □ D3 In other words, for each genetic marker that is taken into consideration, the vertical axis shows how many allele presences were measured in total (REF and ALT combined) for that genetic marker , and the horizontal axis shows how frequently the presence of the ALT allele has been measured for that genetic marking.

In totaal zijn 3638 variantdatapunten weergegeven in Figuur 2. Zoals voor Figuur 1 kunnen drie groepen variantdatapunten (21A-B, 22A-B en 23) worden onderscheiden: • 1947 variantdatapunten 2IA en 21B zijn puur homozygoot en stellen variantdatapunttoestanden AAaa (te weten 2 IA) en BBbb (te weten 21B) voor. • 647 variantdatapunten 22A en 22B stellen variantdatapunttoestanden AAab (te weten 22A) en BB ab (te weten 22B) voor. • 1044 variantdatapunten 23 zijn heterozygoot en stellen alle andere variantdatapunttoestanden voor (te weten ABaa, ABab en ABbb).A total of 3638 variant data points are shown in Figure 2. As for Figure 1, three groups of variant data points (21A-B, 22A-B and 23) can be distinguished: • 1947 variant data points 2IA and 21B are purely homozygous and set variant data point states AAaa (namely 2 IA ) and BBbb (namely 21B) for. • 647 variant data points 22A and 22B represent variant data point states AAab (namely 22A) and BB ab (namely 22B). • 1044 variant data points 23 are heterozygous and represent all other variant data point states (namely ABaa, ABab and ABbb).

De verticale lijnen 24 en 25 bij allelfrequenties 0.3 en 0.7 geven voorbeelddrempelwaarden aan om de heterozygote variantdatapunten te scheiden (dus de heterozygote genetische markeringen) van de rest van de variantdatapunten. Deze variantdatapunten worden in deze uitvoeringsvorm gebruikt om de foetale fractie te schatten, zoals hieronder uitgelegd. De vakman zal begrijpen dat andere minimum en maximum drempelwaarden zouden kunnen zijn gekozen, bijvoorbeeld 0.2 en 0.8, of 0.4 en 0.6, of andere waarden zoals 0.301 en 0.699, of zelf combinaties hiervan, zoals 0.2 en 0.7, of 0.3 en 0.6, of 0.4 en 0.8, etc.The vertical lines 24 and 25 at allele frequencies 0.3 and 0.7 indicate exemplary threshold values to separate the heterozygous variant data points (i.e. the heterozygous genetic markers) from the rest of the variant data points. These variant data points are used in this embodiment to estimate the fetal fraction, as explained below. Those skilled in the art will understand that other minimum and maximum threshold values could have been chosen, for example 0.2 and 0.8, or 0.4 and 0.6, or other values such as 0.301 and 0.699, or even combinations thereof, such as 0.2 and 0.7, or 0.3 and 0.6, or 0.4 and 0.8, etc.

Laat één van de variantdatapunten in dit voorbeeld zijn, getoond in Figuur 1, met totale dekking □□□ = 1697, waarbij 911 inlezingen het REF-allel bevatten op de bekende SNP-positie (Hbo = 911) en 786 inlezingen het ALT-allel op de bekende SNP-positie bevatten (¾ = 786). De allelfrequentie p = Ρχ/ ( Γρα + 1¾) s 0.46 valt tussen de minimum en maximum drempel voor heterozygositeit en dus wordt variantdatapunt Do geselecteerd als deel van de deelverzameling gedetecteerd in de werkwijze-uitvoeringsvorm en gebruikt om de foetale fractie te schatten.Let one of the variant data points in this example be shown in Figure 1, with total coverage □□□ = 1697, with 911 readings containing the REF allele at the known SNP position (Hbo = 911) and 786 readings being the ALT allele at the known SNP position (¾ = 786). The allele frequency p = Ρχ / (Γρα + 1¾) s 0.46 falls between the minimum and maximum threshold for heterozygosity and thus variant data point Do is selected as part of the subset detected in the method embodiment and used to estimate the fetal fraction.

Figuur 3 illustreert schematisch een voorbeeldoptimalisatie zoals uitgevoerd in een uitvoeringsvorm van een werkwijze volgens voorliggende uitvinding. Figuur 3 toont horizontaal de geschatte foetale fractie FF, en toont verticaal de geaggregeerde (logaritmische) waarschijnlijkheid van een overeenstemmende geschatte foetale fractie FF.Figure 3 schematically illustrates an example optimization as performed in an embodiment of a method according to the present invention. Figure 3 shows the estimated fetal fraction FF horizontally, and shows the aggregated (logarithmic) probability of a corresponding estimated fetal fraction FF vertically.

Laat □] = 4 % een initiële schatting zijn van de foetale fractie FF. Gebruikmakend van deze schatting van de foetale fractie en aannemend dat het aantal inlezingen een Poissondistributie volgt, kunnen probabiliteitswaarden worden berekend die aangeven hoe goed variantdatapunt 0D overeenstemt met de toestanden ABaa, ABab of ABbb. Voor de duidelijkheid van voorstelling, is de natuurlijke logaritme van de probabiliteitswaarden hier gegeven. De respectieve logaritmewaarden van de probabiliteiten berekend door de werkwijze-uitvoeringsvorm in dit voorbeeld zijn: • Toestand ABaa:-9.9, • Toestand ABab:-13.4, • Toestand ABbb: -19.4.Let □] = 4% be an initial estimate of the fetal fraction FF. Using this estimate of the fetal fraction and assuming that the number of readings follows a Poisson distribution, probability values can be calculated that indicate how well variant data point 0D corresponds to the states ABaa, ABab or ABbb. For the sake of clarity of representation, the natural logarithm of the probability values is given here. The respective logarithm values of the probabilities calculated by the method embodiment in this example are: • Condition ABaa: -9.9, • Condition ABab: -13.4, • Condition ABbb: -19.4.

Dit betekent dat toestand ABaa de meest waarschijnlijke toestand voor □□ is, gegeven de huidige waarde van de schatting Ervoor de foetale fractie FF. Wanneer de logaritmische waarden van de probabiliteiten van alle variantdatapunten worden geaggregeerd, dus voor alle genetische markeringen in de gedetecteerde deelverzameling, is de logaritmische waarschijnlijkheid Q van Fb= 4%-7916.08.This means that the ABaa state is the most likely state for □□, given the current value of the For the fetal fraction FF estimate. When the logarithmic values of the probabilities of all variant data points are aggregated, i.e. for all genetic markers in the detected subset, the logarithmic probability Q of Fb = 4% is -7916.08.

Varieer vervolgens de schatting zodanig dat ze L = 10 % wordt. Dan zijn de logaritmische waarden van de probabiliteiten voor variantdatapunt □□ : • Toestand ABaa:-9.0, • Toestand ABab:-13.4, • Toestand ABbb: -32.9.Then vary the estimate so that it becomes L = 10%. Then the logarithmic values of the probabilities for variant data point □□ are: • Condition ABaa: -9.0, • Condition ABab: -13.4, • Condition ABbb: -32.9.

Dit betekent dat toestand ABaa de meest waarschijnlijke toestand voor □□ is, gegeven de nieuwe waarde van de schattig Ervoor de foetale fractie FF. De logaritmische waarschijnlijkheid Q voor Q] = 10 % over alle genetische markeringen in de gedetecteerde deelverzameling is -7672.53. Deze waarschijnlijkheid is groter dan de vorige schatting, hetgeen 1¾ = 10 % een meer waarschijnlijke kandidaat maakt voor de eigenlijke foetale fractie.This means that condition ABaa is the most likely condition for □□, given the new value of the cute Before the fetal fraction FF. The logarithmic probability Q for Q] = 10% over all genetic markers in the detected subset is -7672.53. This probability is greater than the previous estimate, making 1¾ = 10% a more likely candidate for the actual fetal fraction.

Analoge berekeningen kunnen worden uitgevoerd door uitvoeringsvormen van de werkwijze voor het variëren van schattingen (¾ van de foetale fractie (bijvoorbeeld 301-306) gebruikmakend van een niet-lineaire optimalisatiewerkwijze, hetgeen kromme 31 geeft. Probabiliteiten van schattingen van de foetale fractie voor dit voorbeeld zijn getoond in Figuur 3. De maximale waarschijnlijkheid wordt bereikt (bij lijn 33) voor 1¾ = 9.5 % (bij lijn 32).Analog calculations can be performed by embodiments of the method for varying estimates (¾ of the fetal fraction (e.g. 301-306) using a non-linear optimization method, which gives curve 31. Probabilities of estimates of the fetal fraction for this example are shown in Figure 3. The maximum probability is reached (for line 33) for 1¾ = 9.5% (for line 32).

Figuur 4 illustreert schematisch een voorbeeldpuntgrafiek die data toont van meerdere monsters zoals gebruikt in een uitvoeringsvorm van een werkwijze volgens voorliggende uitvinding, en voorziet een voorbeeld van mogelijke filtering van onbetrouwbare variantdatapunten door het beperken van de gedetecteerde deelverzameling van genetische markeringen. De data stelt een batch monsters van celvrij DNA van zwangere vrouwen voor, voor welke monsters een genetische markering respectievelijk is geassocieerd met heterozygote allelparen van matemale oorsprong (dat wil zeggen ABaa, ABab, of ABbb). Voor elk heterozygoot datapunt in de voorbeeldbatch wordt de gemiddelde allelfrequentie <F;> in die gevallen waarbij ze matemaal heterozygoot (x-as) is versus de standaardafwijking SD van die allelfrequenties (te weten voor die gevallen waarbij de genetische markeringen matemaal heterozygoot zijn) geplot.Figure 4 schematically illustrates an exemplary point chart showing data from multiple samples as used in an embodiment of a method according to the present invention, and provides an example of possible filtering of unreliable variant data points by limiting the detected subset of genetic markers. The data represents a batch of cell-free DNA samples from pregnant women, for which samples a genetic marking is associated with heterozygous allele pairs of matemal origin (i.e., ABaa, ABab, or ABbb). For each heterozygous data point in the example batch, the average allele frequency <F;> in those cases where it is all the time heterozygous (x-axis) versus the standard deviation SD from those allele frequencies (namely for those cases where the genetic markers are all heterozygous) .

Voor een optionele eerste beperking kan de standaardafwijking van de allelfrequentie worden berekend voor de genetische markering over het veelvoud aan monsters. Op basis van de berekende standaardafwijking van de allelfrequentie kan minstens één genetische markering worden uitgesloten van de gedetecteerde deelverzameling (bij voorkeur alle genetische markeringen die meer dan een vooraf bepaalde afwijkingsdrempel afwijken).For an optional first restriction, the standard deviation of the allele frequency can be calculated for the genetic marking over the plurality of samples. On the basis of the calculated standard deviation of the allele frequency, at least one genetic marker can be excluded from the detected subset (preferably all genetic markers that deviate more than a predetermined deviation threshold).

Voor een optionele tweede beperking die apart of tezamen met de eerste beperking kan worden gebruikt, kan de gemiddelde allelfrequentie worden berekend voor de genetische markering over het veelvoud aan monsters. Op basis van een afwijking van de berekende gemiddelde allelfrequentie van een verwachtingswaarde daarvan, kan minstens één genetische markering worden uitgesloten van de gedetecteerde deelverzameling (bij voorkeur alle genetische markeringen waarvan het gemiddelde te ver verwijderd is).For an optional second restriction that can be used separately or together with the first restriction, the average allele frequency can be calculated for the genetic marking over the plurality of samples. Based on a deviation of the calculated average allele frequency from an expected value thereof, at least one genetic marker can be excluded from the detected subset (preferably all genetic markers whose average is too far away).

De lijnen 41, 42 en 43 geven voorbeelddrempels aan voor het filteren om te gebruiken in dergelijke uitsluitingen. Variantdatapunten met grote standaardafwijking (bijvoorbeeld die boven drempel 43) worden gefilterd (dat wil zeggen hun overeenstemmende genetische markeringen worden uitgesloten van de gedetecteerde deelverzameling), alsook variantdatapunten waarvan de gemiddelde heterozygote allelfrequentie te ver van 0.5 afwijkt (bijvoorbeeld die buiten drempel 41 en 42), zodoende allel-specifiek vooroordeel in de data voorstellend. Dit laat de datacluster 40 van hogere kwaliteit (meer betrouwbaarheid) over.The lines 41, 42 and 43 indicate exemplary thresholds for filtering for use in such exclusions. Variant data points with large standard deviation (for example those above threshold 43) are filtered (i.e. their corresponding genetic markers are excluded from the detected subset), as well as variant data points whose average heterozygous allele frequency deviates too far from 0.5 (for example those outside thresholds 41 and 42) , thus presenting allele-specific prejudice in the data. This leaves the data cluster 40 of higher quality (more reliability).

Een vakman zou zonder meer erkennen dat stappen van verschillende hierboven beschreven werkwijzen kunnen worden uitgevoerd door geprogrammeerde computers. Hierbij is het de bedoeling dat sommige uitvoeringsvormen eveneens programmaopslagtoestellen afdekken, bijvoorbeeld, digitale opslagmedia, die machine- of computerleesbaar zijn en machine-uitvoerbare of computeruitvoerbare instructieprogramma’s encoderen, waarbij de instructies enkele of alle stappen van de hierboven beschreven werkwijzen uitvoeren. De programmaopslagtoestellen kunnen, bijvoorbeeld, digitale geheugens, magnetische opslagmedia zoals magnetische schijven en magnetische tapes, harde schijven, of optisch leesbare digitale dataopslagmedia zijn. Het is tevens de bedoeling dat de uitvoeringsvormen computers afdekken die geprogrammeerd zijn om de stappen van de hierboven beschreven werkwijzen uit te voeren.One skilled in the art would readily recognize that steps of various methods described above can be performed by programmed computers. Hereby, some embodiments are also intended to cover program storage devices, for example, digital storage media that are machine or computer readable and encode machine executable or computer executable instruction programs, the instructions executing some or all of the steps of the methods described above. The program storage devices can be, for example, digital memories, magnetic storage media such as magnetic disks and magnetic tapes, hard disks, or optically readable digital data storage media. It is also intended that the embodiments cover computers that are programmed to perform the steps of the methods described above.

De functies van de verschillende elementen getoond in de figuren, inclusief functionele blokken gelabeld als “processoren” of “modules”, kunnen worden voorzien door het gebruik van toegewijde hardware zowel als hardware in staat om software uit te voeren in overeenstemming met geschikte software. Indien voorzien door een processor, kunnen de functies worden voorzien door een enkele toegewijde processor, door een enkele gedeelde processor, of door een veelvoud aan individuele processoren, waarvan er enkele gedeeld zijn. Bovendien hoort expliciet gebruik van de term "processor” of “controller” niet te worden uitgelegd als exclusief verwijzen naar hardware in staat om software uit te voeren, en mag dit impliciet omvatten, zonder beperking, digitale signaal verwerkings- (DSV) hardware, netwerkprocessor, application specific integrated circuit (ASIC), field programmable gâte array (FPGA), read only memoiy (ROM) voor het opslaan van software, random access memory (RAM), en niet-volatiele opslag. Andere hardware, conventioneel en/of specifiek ontworpen, kan eveneens worden omvat. Op gelijkaardige wijze zijn schakelaars getoond in de figuren slechts conceptueel. Hun functie kan uitgevoerd worden door het bedienen van programmalogica, door middel van specifieke logica, door interactie van programmacontrole en specifieke logica, of zelfs manueel, waarbij de specifieke techniek geselecteerd kan worden door een persoon die de functie implementeert zoals in het bijzonder begrepen wordt uit de context.The functions of the various elements shown in the figures, including functional blocks labeled as "processors" or "modules", can be provided through the use of dedicated hardware as well as hardware capable of executing software in accordance with suitable software. If provided by a processor, the functions may be provided by a single dedicated processor, by a single shared processor, or by a plurality of individual processors, some of which are shared. In addition, explicit use of the term "processor" or "controller" should not be construed as referring exclusively to hardware capable of executing software, and may implicitly include, without limitation, digital signal processing (DSV) hardware, network processor , application-specific integrated circuit (ASIC), field programmable gate array (FPGA), read-only memory (ROM) for storing software, random access memory (RAM), and non-volatile storage Other hardware, conventional and / or specific Similarly, switches shown in the figures are only conceptual and their function can be performed by operating program logic, by means of specific logic, by interaction of program control and specific logic, or even manually, whereby the specific technique can be selected by a person who implements the function as specifically understood from the context.

De vakman zal begrijpen dat blokschema’s conceptuele aanzichten van voorbeeldschakelingen waarin de principes van de uitvinding geïmplementeerd zijn, tonen. Op gelijkaardige wijze zal begrepen worden dat grafieken, stroomschema’s, toestandtransitieschema’s, pseudocode, en gelijkaardig verscheidene processen voorstellen die in hoofdzaak voorgesteld kunnen zijn door een computerleesbaar medium, en zo uitgevoerd kunnen worden door een computer of processor, ook al is een dergelijke computer of processor niet expliciet getoond.Those skilled in the art will appreciate that block diagrams show conceptual views of exemplary circuits in which the principles of the invention are implemented. Similarly, it will be understood that graphs, flow charts, state transition schemes, pseudocode, and the like represent various processes that may be essentially represented by a computer-readable medium, and thus may be executed by a computer or processor, even though such a computer or processor not explicitly shown.

Ofschoon de principes van de uitvinding hierboven zijn uiteengezet in verbinding met specifieke uitvoeringsvormen, moet men verstaan dat deze beschrijving slechts als voorbeeld is gedaan en niet als beperking van de beschermingsomvang die wordt bepaald door de bijgevoegde conclusies.Although the principles of the invention have been set forth above in connection with specific embodiments, it is to be understood that this description is made merely as an example and not as a limitation on the scope of protection defined by the appended claims.

Claims (17)

ConclusiesConclusions 1. Schattingswerkwijze voor het schatten van een foetale fractie, welke werkwijze omvat: - het meten van allelaanwezigheden voor een vooraf bepaald aantal genetische markeringen in een monster van celvrij DNA van een zwangere vrouw, waarbij elke allelaanwezigheid de aanwezigheid voorstelt op een genetische markering van het vooraf bepaalde aantal genetische markeringen van minstens één van: een referentie-allel van matemale of foetale oorsprong, en een alternatief allel van maternale of foetale oorsprong; - op basis van de gemeten allelaanwezigheden, het berekenen van een overeenstemmend aantal allelfrequenties voor het vooraf bepaalde aantal genetische markeringen; - op basis van het berekende aantal allelfrequenties, het detecteren van een deelverzameling van het vooraf bepaalde aantal genetische markeringen, waarbij de deelverzameling geassocieerd is met heterozygote allelparen van matemale oorsprong; en - het schatten van de foetale fractie op basis van de gedetecteerde deelverzameling, waarbij de foetale fractie de fractie voorstelt van celvrij DNA van foetale oorsprong in het monster.An estimation method for estimating a fetal fraction, which method comprises: - measuring allelic events for a predetermined number of genetic markers in a sample of cell-free DNA from a pregnant woman, wherein each allelic presence represents the presence on a genetic mark of the fetal fraction predetermined number of genetic markers of at least one of: a reference allele of matemal or fetal origin, and an alternative allele of maternal or fetal origin; - on the basis of the measured allele presence, calculating a corresponding number of allele frequencies for the predetermined number of genetic markers; - on the basis of the calculated number of allele frequencies, detecting a subset of the predetermined number of genetic markers, wherein the subset is associated with heterozygous allele pairs of matematic origin; and - estimating the fetal fraction based on the detected subset, wherein the fetal fraction represents the fraction of cell-free DNA of fetal origin in the sample. 2. Schattingswerkwijze volgens conclusie 1, waarbij het detecteren van de deelverzameling omvat: - op basis van het berekende aantal allelfrequenties, het selecteren uit het vooraf bepaalde aantal genetische markeringen, als de deelverzameling, van een tweede aantal genetische markeringen waarvan overeenstemmende allelfrequenties een vooraf bepaalde minimum allelfrequentiedrempel overschrijden en een vooraf bepaalde maximum allelfrequentiedrempel niet overschrijden.Estimation method according to claim 1, wherein detecting the subset comprises: - based on the calculated number of allele frequencies, selecting from the predetermined number of genetic markers, as the subset, a second number of genetic markers whose corresponding allele frequencies have a predetermined minimum allele frequency threshold and do not exceed a predetermined maximum allele frequency threshold. 3. Schattingswerkwijze volgens één der voorgaande conclusies, waarbij het schatten omvat: - het produceren van een initiële schatting voor de foetale fractie; en - het optimaliseren van de initiële schatting over de gedetecteerde deelverzameling.The estimation method according to any of the preceding claims, wherein the estimation comprises: - producing an initial estimate for the fetal fraction; and - optimizing the initial estimate about the detected subset. 4. Schattingswerkwijze volgens conclusie 3, waarbij het optimaliseren het maximaliseren omvat van de waarschijnlijkheid van de initiële schatting, door herhaaldelijk de volgende verzameling operaties uit te voeren terwijl de schatting wordt gevarieerd: - voor een gegeven waarde van de schatting die wordt gevarieerd, het berekenen, voor elke genetische markering in de gedetecteerde deelverzameling, van de respectieve probabiliteiten dat de genetische markering geassocieerd is met een homozygoot referentie-allelpaar van foetale oorsprong, een heterozygoot allelpaar van foetale oorsprong, en een homozygoot alternatief allelpaar van foetale oorsprong; en - het berekenen van een waarschijnlijkheid van de gegeven waarde van de schatting die gevarieerd wordt, voor de gedetecteerde deelverzameling, op basis van de berekende respectieve probabiliteiten voor elke genetische markering in de gedetecteerde deelverzameling.Estimation method according to claim 3, wherein optimizing comprises maximizing the probability of the initial estimate, by repeatedly performing the following set of operations while the estimate is varied: - calculating for a given value of the estimate being varied , for each genetic marker in the detected subset, of the respective probabilities that the genetic marker is associated with a fetal-origin homozygous reference allele pair, a fetal-origin heterozygous allele pair, and a fetal-origin homozygous alternative pair; and - calculating a probability of the given value of the estimate being varied, for the detected subset, based on the calculated respective probabilities for each genetic marker in the detected subset. 5. Schattingswerkwijze volgens één der voorgaande conclusies, omvattende het corrigeren van allel-specifiek vooroordeel voor minstens één van het vooraf bepaalde aantal genetische markeringen, welk allel-specifiek vooroordeel te wijten is aan ongelijke amplificatie voor respectievelijk een referentie-allel en een alternatief allel voor een genetische markering.5. Estimation method according to one of the preceding claims, comprising correcting allele-specific bias for at least one of the predetermined number of genetic markers, which allele-specific bias is due to unequal amplification for a reference allele and an alternative allele for a genetic marker. 6. Schattingswerkwijze volgens conclusie 5, waarbij het corrigeren van allel-specifiek vooroordeel voor een genetische markering omvat: - het verkrijgen van een veelvoud aan monsters van celvrij DNA van zwangere vrouwen, voor welke monsters de genetische markering respectievelijk geassocieerd is met heterozygote allelparen van matemale oorsprong; - het berekenen van de gemiddelde allelfrequentie voor de genetische markering over het veelvoud aan monsters; en - op basis van een afwijking van de berekende gemiddelde allelfrequentie van een verwachtingswaarde daarvan, het bepalen van een correctiefactor om te gebruiken voor het corrigeren.Estimation method according to claim 5, wherein correcting allele-specific bias for a genetic marking comprises: - obtaining a plurality of samples of cell-free DNA from pregnant women, for which samples the genetic marking is respectively associated with heterozygous alleles from matemale origin; - calculating the average allele frequency for the genetic marking over the plurality of samples; and - determining a correction factor to use for correcting based on a deviation of the calculated average allele frequency from an expected value thereof. 7. Schattingswerkwijze volgens één der voorgaande conclusies, omvattende het beperken van de gedetecteerde deelverzameling door: - het bepalen voor minstens één genetische markering van de gedetecteerde deelverzameling van een statistische waarschijnlijkheid die geassocieerd is met een homozygoot allelpaar van matemale oorsprong; en - op basis van de bepaalde statistische waarschijnlijkheid of waarschijnlijkheden, het uitsluiten van minstens één genetische markering van de gedetecteerde deelverzameling.7. Estimation method according to any one of the preceding claims, comprising limiting the detected subset by: - determining for at least one genetic marking of the detected subset of a statistical probability associated with a homozygous allele pair of matematic origin; and - based on the determined statistical probability or probabilities, the exclusion of at least one genetic marker from the detected subset. 8. Schattingswerkwijze volgens één der voorgaande conclusies, omvattende het beperken van de gedetecteerde deelverzameling door: - het verkrijgen van een veelvoud aan monsters van celvrij DNA van zwangere vrouwen, voor welke monsters een genetische markering respectievelijk geassocieerd is met heterozygote allelparen van matemale oorsprong; - het berekenen van de standaardafwijking van de allelfrequentie voor de genetische markering over het veelvoud aan monsters; en - op basis van de berekende standaardafwijking van de allelfrequentie, het uitsluiten van minstens één genetische markering van de gedetecteerde deelverzameling.Estimation method according to any one of the preceding claims, comprising limiting the detected subset by: - obtaining a plurality of samples of cell-free DNA from pregnant women, for which samples a genetic marking is associated with heterozygous allele pairs of matematic origin; - calculating the standard deviation of the allele frequency for the genetic marking over the plurality of samples; and - based on the calculated standard deviation of the allele frequency, excluding at least one genetic marker from the detected subset. 9. Schattingswerkwijze volgens één der voorgaande conclusies, omvattende het beperken van de gedetecteerde deelverzameling door: - het verkrijgen van een veelvoud aan monsters van celvrij DNA van zwangere vrouwen, voor welke monsters de genetische markering respectievelijk geassocieerd is met heterozygote allelparen van matemale oorsprong; - het berekenen van de gemiddelde allelfrequentie voor de genetische markering over het veelvoud aan monsters; en - op basis van een afwijking van de berekende gemiddelde allelfrequentie van een verwachtingswaarde daarvan, het uitsluiten van minstens één genetische markering van de gedetecteerde deelverzameling.Estimation method according to any one of the preceding claims, comprising limiting the detected subset by: - obtaining a plurality of samples of cell-free DNA from pregnant women, for which samples the genetic marking is respectively associated with heterozygous allele pairs of matematic origin; - calculating the average allele frequency for the genetic marking over the plurality of samples; and - on the basis of a deviation of the calculated average allele frequency from an expected value thereof, excluding at least one genetic marker from the detected subset. 10. Schattingswerkwijze volgens één der voorgaande conclusies, omvattende het beperken van de gedetecteerde deelverzameling door: - het uitsluiten van minstens één genetische markering van de gedetecteerde deelverzameling, welke minstens één genetische markering, voor het gebruikte monsters, minder gemeten allelaanwezigheden heeft dan een vooraf bepaalde drempel.10. Estimation method according to any one of the preceding claims, comprising limiting the detected subset by: - excluding at least one genetic tag from the detected subset, which at least one genetic tag, for the samples used, has fewer measured allele presences than a predetermined allele presence threshold. 11. Schattingswerkwijze volgens één der voorgaande conclusies, waarbij het monster matemaal bloed, plasma, urine, cerebrospinale vloeistof, serum, saliva of transcervicale spoelingsvloeistof is.The estimation method according to any of the preceding claims, wherein the sample is blood, plasma, urine, cerebrospinal fluid, serum, saliva or transcervical flushing fluid. 12. Schattingswerkwijze volgens één der voorgaande conclusies, waarbij het verkrijgen ten minste één van de volgende omvat: polymerase kettingreactie (polymerase chain reaction, PCR), ligase kettingreactie, nucleïnezuur-sequentiegebaseerde amplificatie (nucleic acid sequence based amplification, NASBA), en vertakte DNA-werkwijzen; en bij voorkeur PCR.The estimation method according to any of the preceding claims, wherein the obtaining comprises at least one of the following: polymerase chain reaction, polymerase chain reaction, ligase chain reaction, nucleic acid sequence-based amplification (nucleic acid sequence based amplification, NASBA), and branched DNA methods; and preferably PCR. 13. Computerprogrammaproduct omvattende computeruitvoerbare instructies om, wanneer het programma wordt uitgevoerd op een computer, minstens de stap uit te voeren van het schatten van de foetale fractie van de werkwijze volgens één der voorgaande conclusies.A computer program product comprising computer executable instructions to, when the program is run on a computer, perform at least the step of estimating the fetal fraction of the method of any one of the preceding claims. 14. Digitaal opslagmedium dat een machine-uitvoerbaar programma van instructies encodeert om minstens de stap uit te voeren van het schatten van de foetale fractie van de werkwijze volgens één der conclusies 1-12.A digital storage medium encoding a machine-executable program of instructions to at least perform the step of estimating the fetal fraction of the method of any one of claims 1-12. 15. Schattingssysteem voor het schatten van een foetale fractie, welk systeem omvat: - een metingsmodule ingericht voor het meten van allelaanwezigheden voor een vooraf bepaald aantal genetische markeringen in een monster van celvrij DNA van een zwangere vrouw, waarbij elke allelaanwezigheid de aanwezigheid voorstelt op een genetische markering van het vooraf bepaalde aantal genetische markeringen van minstens één van: een referentie-allel van maternale of foetale oorsprong, en een alternatief allel van maternale of foetale oorsprong; - een berekeningsmodule ingericht voor, op basis van de gemeten allelaanwezigheden, het berekenen van een overeenstemmend aantal allelfrequenties voor het vooraf bepaalde aantal genetische markeringen; - een detectiemodule ingericht voor, op basis van het berekende aantal allelfrequenties, het detecteren van een deelverzameling van het vooraf bepaalde aantal genetische markeringen, waarbij de deelverzameling geassocieerd is met heterozygote allelparen van maternale oorsprong; en - een schattingsmodule ingericht voor het schatten van de foetale fractie op basis van de gedetecteerde deelverzameling, waarbij de foetale fractie de fractie voorstelt van celvrij DNA van foetale oorsprong in het monster.15. Estimation system for estimating a fetal fraction, which system comprises: - a measurement module adapted to measure allelic events for a predetermined number of genetic markers in a sample of cell-free DNA from a pregnant woman, each allelic presence representing the presence on a genetic marking of the predetermined number of genetic markings of at least one of: a reference allele of maternal or fetal origin, and an alternative allele of maternal or fetal origin; - a calculation module arranged for, on the basis of the measured allele presence, calculating a corresponding number of allele frequencies for the predetermined number of genetic markers; - a detection module adapted to detect, based on the calculated number of allele frequencies, a subset of the predetermined number of genetic markers, wherein the subset is associated with heterozygous allele pairs of maternal origin; and an estimation module adapted to estimate the fetal fraction based on the detected subset, the fetal fraction representing the fraction of cell-free DNA of fetal origin in the sample. 16. Schattingssysteem volgens conclusie 15, omvattende een vooroordeelcorrectiemodule ingericht voor het corrigeren van allel-specifiek vooroordeel voor minstens één van het vooraf bepaalde aantal genetische markeringen, welk allel-specifiek vooroordeel te wijten is aan ongelijke amplificatie voor respectievelijk een referentie-allel en een alternatief allel voor een genetische markering.16. Estimation system according to claim 15, comprising a bias correction module adapted to correct allele-specific bias for at least one of the predetermined number of genetic markers, which allele-specific bias is due to unequal amplification for a reference allele and an alternative, respectively allele for a genetic marking. 17. Schattingssysteem volgens conclusie 15 of 16, omvattende een beperkingsmodule ingericht voor het uitvoeren van de stap van het beperken van de gedetecteerde deelverzameling van één der conclusies 7-10.17. Estimation system according to claim 15 or 16, comprising a restriction module adapted to perform the step of limiting the detected subset of one of claims 7-10.
BE20155460A 2015-07-17 2015-07-17 Estimation method and system for estimating a fetal fraction BE1023274A9 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BE20155460A BE1023274A9 (en) 2015-07-17 2015-07-17 Estimation method and system for estimating a fetal fraction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
BE20155460A BE1023274A9 (en) 2015-07-17 2015-07-17 Estimation method and system for estimating a fetal fraction

Publications (3)

Publication Number Publication Date
BE1023274B1 BE1023274B1 (en) 2017-01-19
BE1023274A1 BE1023274A1 (en) 2017-01-19
BE1023274A9 true BE1023274A9 (en) 2017-03-17

Family

ID=54292997

Family Applications (1)

Application Number Title Priority Date Filing Date
BE20155460A BE1023274A9 (en) 2015-07-17 2015-07-17 Estimation method and system for estimating a fetal fraction

Country Status (1)

Country Link
BE (1) BE1023274A9 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3078752B1 (en) * 2011-04-12 2018-08-01 Verinata Health, Inc Resolving genome fractions using polymorphism counts
EP3301190A1 (en) * 2011-10-18 2018-04-04 Multiplicom NV Fetal chromosomal aneuploidy diagnosis
US20150004601A1 (en) * 2013-06-28 2015-01-01 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction
WO2015026967A1 (en) * 2013-08-20 2015-02-26 Natera, Inc. Methods of using low fetal fraction detection

Also Published As

Publication number Publication date
BE1023274B1 (en) 2017-01-19
BE1023274A1 (en) 2017-01-19

Similar Documents

Publication Publication Date Title
US20220093212A1 (en) Size-based analysis of fetal dna fraction in plasma
Teo et al. Statistical challenges associated with detecting copy number variations with next-generation sequencing
Teare et al. Allele‐dose association of the C5orf30 rs26232 variant with joint damage in rheumatoid arthritis
Heinrich et al. Estimating exome genotyping accuracy by comparing to data from large scale sequencing projects
Pool Genetic mapping by bulk segregant analysis in Drosophila: experimental design and simulation-based inference
CN104182655A (en) Method for judging gene type of fetus
Dou et al. Using off-target data from whole-exome sequencing to improve genotyping accuracy, association analysis and polygenic risk prediction
BE1023274A9 (en) Estimation method and system for estimating a fetal fraction
Ellison et al. Using targeted sequencing of paralogous sequences for noninvasive detection of selected fetal aneuploidies
Hakobyan et al. Quantitative trait association study for mean telomere length in the South Asian genomes
Trask et al. 4040 SNPs for genomic analysis in the rhesus macaque (Macaca mulatta)
TWI694464B (en) Copy number measurement device, copy number measurement program product, copy number measurement method, and gene set
BE1022771B1 (en) Method and system for determining whether a woman is pregnant based on a blood sample
BE1022789B1 (en) Method and system for gender assessment of a fetus of a pregnant woman
Marderstein et al. Age, Sex, and Genetics Influence the Abundance of Infiltrating Immune Cells in Human Tissues

Legal Events

Date Code Title Description
PD Change of ownership

Owner name: AGILENT TECHNOLOGIES, INC.; US

Free format text: DETAILS ASSIGNMENT: CHANGE OF OWNER(S), ASSIGNMENT

Effective date: 20210315