BE1023266B1 - Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp - Google Patents

Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp Download PDF

Info

Publication number
BE1023266B1
BE1023266B1 BE2015/5443A BE201505443A BE1023266B1 BE 1023266 B1 BE1023266 B1 BE 1023266B1 BE 2015/5443 A BE2015/5443 A BE 2015/5443A BE 201505443 A BE201505443 A BE 201505443A BE 1023266 B1 BE1023266 B1 BE 1023266B1
Authority
BE
Belgium
Prior art keywords
chromosome
readings
sample
sequences
scores
Prior art date
Application number
BE2015/5443A
Other languages
English (en)
Other versions
BE1023266A1 (nl
Inventor
Benoit Devogelaere
Joke Allemeersch
Original Assignee
Cartagenia N.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cartagenia N.V. filed Critical Cartagenia N.V.
Priority to BE2015/5443A priority Critical patent/BE1023266B1/nl
Application granted granted Critical
Publication of BE1023266B1 publication Critical patent/BE1023266B1/nl
Publication of BE1023266A1 publication Critical patent/BE1023266A1/nl

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance

Abstract

De onderhavige uitvinding beschrijft een werkwijze voor het bepalen van de aanwezigheid of afwezigheid van een foetale chromosomale aneuploïdie bij een zwangere vrouw, waarbij de werkwijze de berekening omvat van een parameter p van sequenties verkregen van een biologisch monster van de genoemde zwangere vrouw. De onderhavige uitvinding biedt eveneens een werkwijze voor het bepalen van de foetale fractie van het genoemde monster.

Description

SYSTEEM EN METHODOLOGIE VOOR DE ANALYSE VAN GENOMISCHE GEGEVENS DIE ZIJN VERKREGEN VAN EEN ONDERWERP
TECHNISCH GEBIED
De uitvinding heeft betrekking op een werkwijze en systeem voor de analyse van genomische gegevens van een patiënt. De huidige uitvinding heeft in het bijzonder betrekking op een werkwijze die de bepaling van de aanwezigheid van een foetale aneuploïdie toelaat in een monster op een in hoofdzaak niet-invasieve manier.
INLEIDING
De beschikbaarheid van DNA-sequencingtechnologieën met een hoge verwerkingscapaciteit heeft bijna-allesomvattende onderzoeken toegelaten naar het aantal en type van sequentievarianten bij individuen in verschillende populaties en met verschillende ziektes. Sequencing van het volledig genoom kan een relatief routinematige procedure worden in de nabije toekomst aangezien de kosten en efficiëntie van sequencing met een hoge verwerkingscapaciteit blijven verbeteren. Aangezien de kosten blijven zakken, wordt namelijk verwacht dat sequencing met een hoge verwerkingscapaciteit een vaak gebruikt instrument zal worden, niet enkel in humane op fenotype gebaseerde sequencingprojecten, maar ook als een doeltreffend instrument in vooruitstrevende genetische toepassingen in modelorganismen, en voor de diagnose van ziektes die eerder als idiopathisch werden beschouwd.
Zodra een sequentie is verkregen, wordt een inspanning gedaan om de locatie en het karakter van deze delen van een sequentie te identificeren die verschillen van een of meerdere "standaard" referentiesequenties, waarbij elk verschil gewoonlijk een variant wordt genoemd. Dit kan helpen de delen van het genoom van een individu te identificeren die mogelijk zouden kunnen bijdragen tot een klinische aandoening of ander kenmerk van het individu. Het is bijvoorbeeld gebruikelijk de sequentie van een bepaald individu te vergelijken met humane referentiegenoomsequenties die worden bewaard door de University of California, Santa Cruz, en een lijst te maken van de varianten die bestaan tussen de sequentie van een individu en een referentiesequentie.
Deze lijst met varianten kan miljoenen varianten bevatten, maar geeft weinig of geen informatie over de impact die een bepaalde variant op de genfunctie kan hebben. Onderzoeksprogramma's wereldwijd verzamelen continu informatie over bepaalde varianten van een genfunctie, ziektestadia, en dergelijke. Bovendien zijn verscheidene computerwerkwijzen ontwikkeld voor het afleiden van mogelijke fysiologische effecten van bepaalde types varianten op basis van de locatie ervan op het genoom en de aard van de variant, zelfs als er geen biochemische of klinische laboratoriumstudies zijn uitgevoerd op die bepaalde va riant.
Prenatale analyse van een foetus is vandaag steeds meer verschoven naar een genomische analyse van de foetus en het DNA van de ouders.
De aanwezigheid van circulerend extracellulair DNA in het perifere bloed is een fenomeen dat goed gekend is. Er is aangetoond dat in het geval van een zwangere vrouw extracellulair foetaal DNA aanwezig is in de bloedsomloop van de moeder en kan worden gedetecteerd in het plasma of serum van de moeder. Hoewel de meeste mensen in het vakgebied dit type DNA als foetaal DNA beschrijven, is het in feite placentair DNA, en kunnen er kleine verschillen voorkomen tussen foetaal en placentair DNA omwille van mozaïscisme dat afkomstig is tijdens embryogenese. In dit document zal de term "foetaal DNA" echter worden gebruikt aangezien dit de vaakst gebruikte terminologie is om dit type DNA te beschrijven. Studies hebben aangetoond dat dit circulerende foetale genetische materiaal kan worden gebruikt voor de erg betrouwbare bepaling, bijv. door PCR (polymerasekettingreactie) -technologie, van foetale genetische loci die volledig afwezig zijn uit het genoom van de moeder. Voorbeelden van dergelijke foetale genetische loei zijn het foetale RhD-gen tijdens risicozwangerschappen voor HDN (hemolytische ziekte van de foetus en pasgeborene) of foetaal Y-chromosoomspecifieke sequenties in risicozwangerschappen voor een X-chromosoomgebonden aandoening, bijv. hemofilie of fragiel X-syndroom.
Foetale aneuploïdie en andere chromosomale afwijkingen treffen 9 van de 1000 levende geboortes. De gouden standaard voor het diagnosticeren van chromosomale afwijkingen is karyotypering van foetale cellen die zijn verkregen via invasieve procedures zoals chorionische villusbemonstering en amniocentese. Deze procedures houden kleine, maar mogelijk significante risico's in voor zowel de foetus als de moeder. In de laatste jaren is er vooruitgang geboekt in de ontwikkeling van niet-invasieve screeningmethodes voor foetale chromosomale afwijkingen.
Sinds de ontdekking van intacte foetuscellen in het bloed van de moeder is er sterke interesse in het proberen gebruiken ervan als een diagnostisch venster voor foetale genetica. EP 2183693 en familieleden beschrijven een methodologie voor het uitvoeren van een prenatale diagnose van een foetale chromosomale aneuploïdie in een biologisch monster dat is verkregen van de zwangere moeder. Het monster wordt willekeurig gesequencet en de verkregen sequenties worden gebruikt voor het bepalen van een parameter die wordt gebruikt voor het evalueren van de aanwezigheid of afwezigheid van een foetale aneuploïdie. US8195415 beschrijft een werkwijze voor het evalueren of een chromosoom een abnormale verdeling heeft in een monster dat is verkregen van een patiënt. De werkwijze omvat shotgun-sequencing van het DNA dat aanwezig is in het monster, en vervolgens het aligneren van de verkregen sequentietags met chromosoomdelen. Waarden worden bepaald op basis van het aantal uitlijningen die dan worden gebruikt voor het berekenen van een verschil dat bepalend is voor het feit of er al dan niet een abnormale verdeling bestaat.
Bayindir et al., 2015 beschrijft een niet-invasieve prenatale testmethodologie op basis van de Z- en ZZ-score, waarbij de genoemde Z-score een chromosomaal-brede-Z-score is en de ZZ-score wordt berekend als de standaardscore van de Z-score van een bepaald autosoom vergeleken met de Z-scores van resterende autosomen.
Hoewel de bovengenoemde methodologieën waardevol zijn, blijft de verhouding van valse positieven en negatieven hoog in het veld. Daarom wordt er constant gestreefd naar het bieden van methodologieën die het percentage valse positieven en in het bijzonder valse negatieven kunnen verlagen, om een meer nauwkeurige en robuuste screening te bieden.
De onderhavige uitvinding wil een nauwkeurigere niet-invasieve methodologie bieden voor het bepalen of er een aneuploïdie bestaat in een foetus, samen met de bepaling van de foetale fractie aangezien dit als een belangrijke kwaliteitsmetriek wordt beschouwd voor het beoordelen van het risico op valse negatieven in een monster.
Vanuit een breder perspectief wil de onderhavige uitvinding ook een methodologie en instrumenten bieden voor het analyseren van genomische gegevens, bijv. voor genomische variantannotatie.
SAMENVATTING VAN DE UITVINDING
De uitvinding heeft betrekking op een werkwijze voor het bepalen van de aanwezigheid of afwezigheid van een aneuploïdie volgens conclusie 1 of een van de afhankelijke conclusies. De methodologie volgens de conclusies laat toe de aanwezigheid of afwezigheid van dergelijke aneuploïdie te evalueren op basis van een reeks referentiemonsters. De onderhavige methodologie biedt een betrouwbare en robuuste parameter voor het bepalen van de aanwezigheid van een aneuploïdie. De methodologie is gevoelig en minimaliseert valse positieven en valse negatieven.
De onderhavige uitvinding biedt ook een werkwijze voor het bepalen van de foetale fractie volgens conclusie 27 en afhankelijke conclusies. De werkwijze biedt een duidelijke en gemakkelijke schatting van de foetale fractie in een monster gebaseerd op de beschikbare willekeurige sequencinggegevens met een lage dekking. Deze laatste dient ook als een aanvullende kwaliteitscontrole voor de detectie van aneuploïdie, in het bijzonder voor de gevallen waar er geen aneuploïdie gedetecteerd werd (aangezien sommige daarvan valse positieven zouden kunnen zijn, omdat de foetale fractie te laag was om de detectie van een aneuploïdie toe te laten met behulp van sequencing met een lage dekking).
Tot slot biedt de onderhavige methodologie ook een computerprogrammaproduct volgens conclusie 19 of 30, dat een of meerdere bewerkingen kan uitvoeren volgens de onderhavige uitvinding en een rapport gegenereerd daardoor volgens conclusie 25.
FIGUREN
Figuur 1 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 21 in een monster A, waarbij het genoemde chromosoom 21 werd geïdentificeerd als abnormaal door de werkwijze volgens de onderhavige uitvinding.
Figuur 2 toont een grafische voorstelling van de parameters die zijn verkregen voor alle chromosomen binnen één monster A. Enkel chromosoom 21 vertoonde een afwijking.
Figuur 3 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 11 in monster A. Er zijn geen afwijkingen geobserveerd.
Figuur 4 toont een grafische voorstelling van de berekende secundaire parameters volgens een uitvoeringsvorm van de onderhavige uitvinding, berekend voor alle chromosomen van monster A. Er werd een trisomie geobserveerd.
Figuur 5 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 16 in monster B. Er werd een trisomie geobserveerd.
Figuur 6 toont een grafische voorstelling van de parameters die zijn verkregen voor alle chromosomen binnen monster B. Slechts één chromosoom, chromosoom 16, vertoonde een afwijking.
Figuur 7 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 1 in monster B. Er werd geen trisomie geobserveerd.
Figuur 8 toont een grafische voorstelling van de berekende secundaire parameters volgens een uitvoeringsvorm van de onderhavige uitvinding, berekend voor alle chromosomen van monster B. Er werd een trisomie geobserveerd.
Figuur 9 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 21 in een monster A, waarbij het genoemde chromosoom 21 werd geïdentificeerd als abnormaal door de werkwijze volgens de onderhavige uitvinding.
Figuur 10 toont een grafische voorstelling van de parameters die zijn verkregen voor alle chromosomen binnen één monster A. Slechts één chromosoom vertoonde een afwijking.
Figuur 11 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 11 in monster A. Er zijn geen afwijkingen geobserveerd.
Figuur 12 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 16 in monster B. Er werd een aneuploïdie geobserveerd.
Figuur 13 toont een grafische voorstelling van de parameters die zijn verkregen voor alle chromosomen binnen monster B. Slechts één chromosoom 16 vertoonde een afwijking.
Figuur 14 toont een rapport volgens een uitvoeringsvorm van de onderhavige uitvinding, dat berekende parameters en een visuele voorstelling toont voor chromosoom 1 in monster B. Er werd geen trisomie geobserveerd.
Figuur 15 toont een grafische voorstelling van een secundaire parameter die indicatief is voor het slaagpercentage van het experiment verkregen voor alle chromosomen in monster A volgens een uitvoeringsvorm van het onderhavige voorbeeld. Het experiment was geslaagd.
Figuur 16 toont een grafische voorstelling van een secundaire parameter die indicatief is voor het slaagpercentage van het experiment verkregen voor alle chromosomen in monster B volgens een uitvoeringsvorm van het onderhavige voorbeeld. Het experiment was geslaagd.
Figuur 17 toont een grafische voorstelling in een monster, dat is verkregen door een uitvoeringsvorm van de onderhavige uitvinding, die de aanwezigheid aangeeft van een polymorfe plaats, meer in het bijzonder een kopieaantalvariatie die aanwezig zou kunnen zijn in het genoom van de moeder in plaats van het genoom van de foetus.
Figuren 18 tot 24 tonen grafische voorstellingen voor een chromosoom in een monster dat is verkregen door een uitvoeringsvorm van de onderhavige uitvinding. Er is bewezen dat de methodologie van de onderhavige uitvinding een hogere gevoeligheid heeft ten opzichte van de werkwijzen uit de stand der techniek.
Figuur 25 toont een grafische voorstelling met het aantal aflezingen met betrekking tot het Y-chromosoom voor monsters die waren ingedeeld als mannelijk, vrouwelijk of van onbepaald geslacht.
Figuur 26 toont een grafische voorstelling met de X- en Y-gebaseerde foetale fractieschattingen voor een reeks mannelijke zwangerschappen.
Figuur 27 toont de spreidingsdiagrammen van de genormaliseerde tellingen voor een bepaalde polymorfe plaats binnen een reeks testmonsters.
Figuur 28 en 29 tonen een grafische voorstelling van de geschatte foetale fractie voor een reeks mannelijke zwangerschappen op basis van een bepaalde informatieve polymorfe plaats, zoals berekend met behulp van een uitvoeringsvorm van de onderhavige uitvinding (X-as) versus op basis van de aflezingstellingen van chromosoom X of Y (Y-as).
Figuur 30 toont een grafische voorstelling die de geschatte foetale fractie visualiseert voor een reeks mannelijke zwangerschappen op basis van de informatieve polymorfe plaats, zoals geïdentificeerd in het monster zoals berekend met behulp van een uitvoeringsvorm van de onderhavige uitvinding (X-as) versus de geschatte foetale fractie op basis van de aflezingstellingen van chromosoom X of Y (Y-as).
DEFINITIES
De term "biologisch monster" zoals hierin gebruikt, verwijst naar elk monster dat is afgenomen van een patiënt (bijv. een mens, zoals een zwangere vrouw) en een of meerdere interessante nucleïnezuurmolecule(n) bevat.
De term "nucleïnezuur" of "polynucleotide" verwijst naar een deoxyribonucleïnezuur (DNA) of ribonucleïnezuur (RNA) en een polymeer daarvan in hetzij enkel- hetzij dubbelstrengige vorm. Tenzij specifiek beperkt, omvat de term nucleïnezuren bevattende welbekende analogen van natuurlijke nucleotiden die gelijkaardige bindingseigenschappen hebben als het referentienucleïnezuur en op gelijkaardige manier gemetaboliseerd zijn als natuurlijke voorkomende nucleotiden. Tenzij anders aangegeven, omvat een bepaalde nucleïnezuursequentie ook impliciet conversatief gewijzigde varianten daarvan (bijv. degeneercodonsubstituties), allellen, orthologen, enkel-nucleotide polymorfismen (SNP's) en complementaire sequenties evenals de expliciet aangegeven sequentie. Degenereercodonsubstituties kunnen in het bijzonder worden verkregen door het genereren van sequenties waarin de derde positie van een of meerdere geselecteerde (of alle) codons is gesubstitueerd met gemengde-basis en/of deoxyinosine-residuen. De term nucleïnezuur wordt verwisselbaar gebruikt met gen, DNA, cDNA, mRNA, klein niet-coderend RNA, micro-RNA (miRNA), Piwi-interagerend RNA, en korte haarspeld RNA (shRNA) gecodeerd door een gen of locus.
De term "gen" betekent het segment van DNA dat betrokken is bij de productie van een polypeptideketen. Het kan gebieden omvatten voorafgaand of volgend op het coderingsgebied (kop en staart) evenals interveniërende sequenties (intronen) tussen individuele coderingssegmenten (exonen).
De term "reactie" zoals hierin gebruikt, verwijst naar elk proces omvattende een chemische, enzymatische of fysieke actie die indicatief is voor de aanwezigheid of afwezigheid van een bepaalde interessante polynucleotidesequentie. Een voorbeeld van een "reactie" is een amplificatiereactie zoals een polymerasekettingreactie (PCR). Een ander voorbeeld van een "reactie" is een sequencingreactie, hetzij door synthese, ligatie, hybridisatie hetzij door het brengen van DNA door een porie en het meten van signalen die indicatief zijn voor een bepaalde nucleotide. Een "informatieve reactie" is een reactie die wijst op de aanwezigheid van een of meerdere bepaalde interessante polynucleotidesequenties, en in een geval waar slechts één interessante sequentie aanwezig is. De term "putje" zoals hier gebruikt, verwijst naar een reactie op een vooraf bepaalde locatie binnen een beperkte structuur, bijv. een putjesvormig flesje, cel, of kamer in een PCR-array of bijv. de individuele reactievolumes waarin sequencingreacties plaatsvinden (inclusief zogenaamde patroonstroomcellen van Illumina).
De term "klinisch relevante nucleïnezuursequentie" of "doelchromosoom of chromosomaal segment" zoals hierin gebruikt, kan verwijzen naar een polynucleotidesequentie overeenkomstig een segment van een grotere genomische sequentie waarvan het potentiële onevenwicht is getest of naar de grotere genomische sequentie zelf. Een voorbeeld is de sequentie van chromosoom 21. Andere voorbeelden omvatten chromosoom 18, 13 X en Y. Nog andere voorbeelden omvatten gemuteerde genetische sequenties of genetische polymorfismen of kopieaantalvariaties (CNV's) die een foetus kan overerven van een of beide van de ouders. Nog andere voorbeelden omvatten sequenties die zijn gemuteerd, gewist of geamplificeerd in een kwaadaardige tumor, bijv. sequenties waarin verlies van heterozygositeit of genduplicatie voorkomt. In sommige uitvoeringsvormen kunnen meerdere klinisch relevante nucleïnezuursequenties, of equivalente meerdere makers van de klinisch relevante nucleïnezuursequenties worden gebruikt voor het bieden van gegevens voor het detecteren van het onevenwicht. Gegevens van vijf niet-opeenvolgende sequenties over chromosoom 21 kunnen bijvoorbeeld op een aanvullende manier worden gebruikt voor de bepaling van mogelijk onevenwicht in chromosoom 21, waardoor de nood aan monstervolume effectief wordt gereduceerd tot 1/5.
De term "oververtegenwoordigde nucleïnezuursequentie" zoals hierin gebruikt, verwijst naar de nucleïnezuursequentie van twee interessante sequenties (bijv. een klinisch relevante sequentie en een achtergrondsequentie) die in meer overvloed aanwezig is dan de andere sequentie in een biologisch monster.
De term "gebaseerd op" zoals hierin gebruikt, betekent "ten minste gedeeltelijk gebaseerd op" en verwijst naar één waarde (of resultaat) die wordt gebruikt bij de bepaling van een andere waarde, zoals plaatsvindt in verband met een ingang van een werkwijze en de uitgang van die werkwijze. De term "afleiden" zoals hierin gebruikt, verwijst naar de relatie van een ingang van een werkwijze en de uitgang van die werkwijze, zoals plaatsvindt wanneer de afleiding de berekening van een formule is.
De term "parameter" verwijst hierin naar een numerieke waarde die een kwantitatieve gegevensreeks en/of een numerieke relatie tussen kwantitatieve gegevensreeksen kenmerkt.
De term "score" zoals hierin gebruikt, verwijst naar een numerieke waarde die is verbonden met of is gebaseerd op een specifiek kenmerk, bijv. het aantal aflezingen of aflezingstellingen voor een bepaalde sequentie die aanwezig is in een monster. De term "eerste score" wordt hierin gebruikt om te verwijzen naar een numerieke waarde die is verbonden met het doelchromosoom of chromosomaal segment. Een ander voorbeeld van een score is bijv. een Z-score die kwantificeert hoeveel het aantal aflezingen van een bepaalde sequentie verschilt van het aantal aflezingen die werden verkregen van dezelfde sequentie in een reeks referentiemonsters. Het is welbekend bij een vakman hoe een dergelijke Z-score kan worden berekend.
De term "drempelwaarde" of "drempel" zoals hierin gebruikt, betekent een numerieke waarde waarvan de waarde wordt gebruikt voor het onderscheiden tussen twee of meer statussen (bijv. zieke en niet-ziekte) van classificatie voor een biologisch monster. Als een parameter bijvoorbeeld groter is dan de drempelwaarde, wordt een eerste classificatie van de kwantitatieve gegevens gemaakt (bijv. ziekte status); of als de parameter lager is dan de drempelwaarde, wordt een andere classificatie van de kwantitatieve gegevens gemaakt (bijv. niet-ziekte status).
De term "onevenwicht" zoals hierin gebruikt, betekent elke significante afwijking zoals gedefinieerd door ten minste één drempelwaarde in een hoeveelheid van de klinisch relevante nucleïnezuursequentie van een referentiehoeveelheid. De referentiehoeveelheid zou bijvoorbeeld een verhouding kunnen zijn van 3/5, en een onevenwicht zou dan kunnen plaatsvinden als de gemeten verhouding 1:1 is.
De term "willekeurige sequencing" zoals hierin gebruikt, verwijst naar sequencing, waarbij de gesequencete nucleïnezuurfragmenten niet specifiek zijn geïdentificeerd of beoogd vóór de sequencingprocedure. Sequentiespecifieke primers om te richten op specifieke genloci zijn niet vereist. De groepen gesequencete nucleïnezuren variëren van monster tot monster en zelfs van analyse tot analyse voor hetzelfde monster. De identiteiten van de gesequencete nucleïnezuren worden enkel bekendgemaakt van de gegenereerde sequencinguitgang. In sommige uitvoeringsvormen van de onderhavige uitvinding kan de willekeurige sequencing voorafgegaan worden door procedures voor het verrijken van een biologisch monster met bepaalde populaties nucleïnezuurmoleculen die bepaalde gemeenschappelijke kenmerken delen. In een uitvoeringsvorm hebben elk van de DNA-fragmenten in het biologische monster een gelijke kans om gesequencet te worden.
De term "fractie van het humane genoom" of "deel van het humane genoom" zoals hierin gebruikt, verwijst naar minder dan 100% van de nucleotidesequenties in het humane genoom dat zo'n 3 miljard baseparen van nucleotiden omvat. In de context van sequencing verwijst het naar minder dan 1-voudige dekking van de nucleotidesequenties in het humane genoom. De term kan uitgedrukt worden als een percentage of absoluut aantal nucleotiden/baseparen. Als een gebruikersvoorbeeld kan de term worden gebruikt om te verwijzen naar de werkelijke hoeveelheid sequencing dat is uitgevoerd. Uitvoeringsvormen kunnen de vereiste minimale waarde voor de gesequencete fractie van het humane genoom bepalen om een nauwkeurige diagnose te verkrijgen. Als een ander gebruiksvoorbeeld kan de term verwijzen naar de hoeveelheid gesequencete gegevens die zijn gebruikt voor het afleiden van een parameter of hoeveelheid voor de classificatie van ziektes.
De term "samenvattende statistieken" zoals hierin gebruikt, wordt gebruikt als een statistische term, en verwijst naar een indicatie van de omvang van een verdeling van waarden of scores, of een indicatie van de score/waarde aanwezig in het midden van de verdeling. Dit kan bijv. een gemiddelde of mediaan of standaardafwijking (StDev) of mediane absolute afwijking (mad) of gemiddelde absolute afwijking van een verzameling scores zijn.
De term "foetale fractie" zoals hierin gebruikt, verwijst naar de fractie van foetale nucleïnezuren die aanwezig zijn in een monster omvattende nucleïnezuur van de foetus en van de moeder.
De term "kopieaantalvariatie" of "CNV" (copy number variation) verwijst hierin naar variatie in het aantal kopieën van een nucleïnezuursequentie die enkele bp of groter is aanwezig in een testmonster in vergelijking met het kopieaantal van de nucleïnezuursequentie die aanwezig is in een gekwalificeerd monster. Een "kopieaantalvariant" verwijst naar de enkele bp grote of grotere sequentie van nucleïnezuur waarin verschillen in kopieaantallen worden gevonden door vergelijking van een interessante sequentie in het testmonster met deze aanwezig in een gekwalificeerd monster. Kopieaantalvarianten/-variaties omvatten deleties, waaronder microdeleties, inserties, waaronder micro-inserties, duplicaties, multiplicaties. CNV's omvatten chromosomale aneuploïdieën en gedeeltelijke aneuploïdieën.
De term "aneuploïdie" verwijst hierin naar een onevenwicht van genetisch materiaal veroorzaakt door een verlies of versterking van een volledig chromosoom, of deel van een chromosoom. Aneuploïdie verwijst zowel naar chromosomale als subchromosomale onevenwichten, zoals, maar niet beperkt tot, deleties, microdeleties, inserties, micro-inserties, kopieaantalvariaties, duplicaties. Kopieaantalvariaties kunnen variëren in grootte in het bereik van enkele bp tot meerdere Mb, of in bijzondere gevallen van 1 kb tot meerdere Mb. Grote subchromosomale afwijkingen die zich uitstrekken over tientallen MB's en/of overeenkomen met een significant deel van een chromosoomarm, kunnen ook segmentele aneuploïdieën worden genoemd.
De term "chromosomale aneuploïdie" verwijst hierin naar een onevenwicht van genetisch materiaal veroorzaakt door een verlies of versterking van een volledig chromosoom, en omvat kiemlijnaneuploïdie en mozaiëkaneuploïdie.
De term "gedeeltelijke aneuploïdie" verwijst hierin naar een onevenwicht van genetisch materiaal veroorzaakt door een verlies of versterking van een deel van een chromosoom bijv. gedeeltelijke monosomie en gedeeltelijke trisomie, en omvat onevenwichten die het resultaat zijn van translocaties, deleties en inserties.
De term "polymorfisme, polymorf doelnucleïnezuur", "polymorfe sequentie", "polymorfe doelnucleïnezuursequentie" en "polymorf nucleïnezuur" worden onderling verwisselbaar gebruikt om te verwijzen naar een nucleïnezuursequentie die een of meerdere polymorfe plaatsen bevat.
De term "polymorfe plaats" verwijst hierin naar een enkel-nucleotidepolymorfisme (SNP, single nucleotide polymorfismen), een kleinschalige multi-basis deletie of insertie, een Multi-Nucleotide Polymorfisme (MNP) of een Korte Tandemherhaling (STR, short tandem repeats) of een CNV (kopieaantalvariatie).
De term "meerdere" wordt hierin gebruikt met verwijzing naar een aantal nucleïnezuurmoleculen of sequentietags of aflezingen dat voldoende is voor het identificeren van significante verschillen in kopieaantalvariaties (bijv. chromosoomdoses) in testmonster en gekwalificeerde monsters met behulp van de werkwijzen volgens de uitvinding. In sommige uitvoeringsvormen worden ten minste ongeveer 3xlOE6 sequentietags, ten minste ongeveer 5xlOE6 sequentietags, ten minste ongeveer 8xlOE6 sequentietags, ten minste ongeveer 10xl0E6 sequentietags, ten minste ongeveer 15xlOE6 sequentietags, ten minste ongeveer 20xl0E6 sequentietags, ten minste ongeveer 30xl0E6 sequentietags, ten minste ongeveer 40xl0E6 sequentietags, of ten minste ongeveer 50xl0E6 sequentietags verkregen voor elk testmonster. Elke sequentietag kan een enkele-sequentie aflezing zijn van 20 tot 400 bp, of een koppel van 2 sequentieaflezingen met gepaard uiteinde van elk 20 tot 400 bp.
De termen "polynucleotide", "nucleïnezuur" en "nucleïnezuurmoleculen" worden onderling verwisselbaar gebruikt en verwijzen naar een covalente-gebonden sequentie van nucleotiden (d.w.z. ribonucleotiden voor RNA en deoxyribonucleotiden voor DNA) waarin de 3'-positie van de pentose van één nucleotide wordt gebonden door een fosfodi-estergroep aan de 5'-positie van de pentose van de volgende, sequenties omvatten in eender welke vorm van nucleïnezuur, maar niet beperkt tot RNA- en DNA-moleculen. De term "polynucleotide" omvat, maar is niet beperkt tot, enkel- en dubbelstrengige polynucleotide.
De term "deel", wanneer gebruikt met verwijzing naar de hoeveelheid sequentie-informatie van nucleïnezuurmoleculen van de foetus en de moeder in een biologisch monster, verwijst hierin naar de hoeveelheid sequentie-informatie van nucleïnezuurmoleculen van de foetus of de moeder in een biologisch monster die samen in aantal lager zijn dan de sequentie-informatie van <1 humaan genoom.
De term "testmonster" verwijst hierin naar een monster omvattende een mengsel van nucleïnezuren omvattende ten minste één nucleïnezuursequentie waarvan vermoed wordt dat het kopieaantal variatie ondergaan heeft of ten minste één nucleïnezuursequentie waarvoor het wenselijk is te bepalen of er een kopieaantalvariatie bestaat. Nucleïnezuren die aanwezig zijn in een testmonster worden testnucleïnezuren genoemd, of doelnucleïnezuren of doelchromosomen of chromosomale doelsegmenten.
De term "referentiemonster" verwijst hierin naar een monster omvattende een mengsel van nucleïnezuren waarvoor de sequencinggegevens worden gebruikt samen met de sequencinggegevens van het testmonster voor het berekenen van scores en parameters zoals beschreven in conclusie 1. Hoewel het niet noodzakelijk is, is een referentiemonster bij voorkeur normaal (d.w.z. niet aneuploïde) voor de interessante sequentie. Een referentiemonster is dus bij voorkeur een gekwalificeerd monster dat geen trisomie 21 draagt en dat kan worden gebruikt voor het identificeren van de aanwezigheid van een trisomie 21 in een testmonster.
De term "referentiereeks" omvat meerdere "referentiemonsters".
De term "verrijken" verwijst hierin naar het proces van het in het bijzonder amplificeren van bepaalde doelnucleïnezuren die zijn opgenomen in een deel van een monster van de moeder. Het geamplificeerde product wordt dan vaak gecombineerd met de rest van het monster van de moeder waaruit het deel verwijderd was.
De term "interessante sequentie" verwijst hierin naar een nucleïnezuursequentie die is geassocieerd met een verschil in sequentievoorstelling in gezonde versus zieke personen. Een interessante sequentie kan een sequentie op een chromosoom zijn dat verkeerd is voorgesteld d.w.z. over- of ondervertegenwoordigd, in een ziekte of genetische aandoening. Een interessante sequentie kan ook een deel van een chromosoom, of een chromosoom zijn. Een interessante sequentie kan bijvoorbeeld een chromosoom zijn dat oververtegenwoordigd is in een aneuploïdie-aandoening. Interessante sequenties omvatten sequenties die over- of ondervertegenwoordigd zijn in de totale populatie, of een subpopulatie van cellen van een patiënt.
De term "groep chromosomen" verwijst hierin naar twee of meer chromosomen. De term "verzameling" verwijst naar een reeks chromosomen of chromosomale segmenten, maar kan ook verwijzen naar een reeks waarden of scores die zijn afgeleid van een overeenkomstige reeks chromosomen of chromosomale segmenten.
De term "aflezing" verwijst naar een experimenteel verkregen DNA-sequentie die voldoende lang is (bijv. ten minste ongeveer 20 bp) die kan worden gebruikt voor het identificeren van een grotere sequentie of gebied, bijv. die kan worden uitgelijnd en in het bijzonder toegewezen aan een chromosoomlocatie of genomisch gebied of gen. De termen "aflezing" en "sequenties" kunnen onderling verwisselbaar worden gebruikt in de kladversie.
De term "aflezingstelling" verwijst naar het aantal aflezingen die zijn opgehaald uit een monster die zijn toegewezen aan een referentiegenoom of een deel van het genoemde referentiegenoom (bin).
De term "stuk" (bin) van een genoom moet worden begrepen als een segment van het genoom. Een genoom kan in verschillende stukken worden onderverdeeld, met hetzij een vaste hetzij een vooraf bepaalde grootte of een variabele grootte. Een mogelijke vaste stukgrootte kan bijv. 10 kB, 20 kB, 30 kB, 40 kB, 50 kB, 60 kB, 70 kB, enz. zijn, waarbij kB staat voor kilobaseparen, een eenheid die overeenkomt met 1000 baseparen.
De term "venster" moet worden begrepen als meerdere stukken.
De termen "uitgelijnd", "uitlijning", "toegewezen" of "uitlijning", "toewijzing" verwijst naar een of meerdere sequenties die zijn geïdentificeerd als een match in termen van de volgorde van hun nucleïnezuurmoleculen met een gekende sequentie van een referentiegenoom. Een dergelijke uitlijning kan manueel of door een computeralgoritme worden gedaan, waarvoor voorbeelden onder andere het Efficient Local Alignment of Nucleotide Data (ELAND) computerprogramma zijn verdeeld als deel van de Illumina Genomics Analysts-pijpleiding. De overeenstemming van een sequentieaflezing bij de uitlijning kan een sequentiematch van 100% of minder dan 100% zijn (niet-perfecte match).
De term "referentiegenoom" zoals hierin gebruikt, verwijst naar een digitale nucleïnezuursequentiegegevensbank, samengesteld als een representatief voorbeeld van een soort' DNA. Aangezien het wordt samengesteld uit de sequencing van DNA van meerdere, stelt een referentiegenoom niet nauwkeurig het DNA van een enkele persoon voor. Het wordt gebruikt om de toewijzing van sequencingaflezingen van een monster aan specifieke chromosomale posities toe te laten.
De term "klinisch relevante sequentie" verwijst hierin naar een nucleïnezuursequentie die welbekend is en waarvan vermoed wordt dat deze is geassocieerd of betrokken met een genetische of ziekteaandoening. Het bepalen van de afwezigheid of aanwezigheid van een klinisch relevante sequentie kan nuttig zijn bij de bepaling van een diagnose of het bevestigen van een diagnose van een medische aandoening, of het stellen van een prognose voor de ontwikkeling van een ziekte.
De term "afgeleid" wanneer gebruikt in de context van een nucleïnezuur of een mengsel van nucleïnezuren, verwijst hierin naar de middelen waardoor het of de nucleïnezuren worden verkregen uit de bron waaruit ze afkomstig zijn. In één uitvoeringsvorm betekent een mengsel van nucleïnezuren dat is afgeleid van twee verschillende genomen bijvoorbeeld dat de nucleïnezuren, bijv. celvrij DNA, natuurlijk werden afgegeven door cellen door natuurlijk voorkomende processen zoals nécrosé of apoptose, of door lyse van de cellen omwille van onjuiste opslag- of transportomstandigheden.
De term "monster van de moeder" verwijst hierin naar een biologisch monster dat is verkregen uit een zwangere patiënte, bijv. een vrouw.
De term "biologisch fluïdum" verwijst hierin naar een vloeistof die is genomen uit een biologische bron en omvat, bijvoorbeeld, bloed, serum, plasma, sputum, wasfluïdum, cerebrospinaal fluïdum, urine, sperma, zweet, tranen, speeksel, blastocoelfluïdum en dergelijke. Het verwijst ook naar het medium waarin biologische monsters kunnen worden gekweekt, zoals in vitro kweekmedium waarin cellen, weefsel of embryo kunnen worden gekweekt. Zoals hierin gebruikt, omvatten de termen "bloed", "plasma" en "serum" fracties of verwerkte delen daarvan. Wanneer een monster uit een biopsie, uitstrijkje, smeer, enz. wordt genomen, omvat het "monster" zo ook uitdrukkelijk een verwerkte fractie of deel afgeleid van de biopsie, het uitstrijkje, smeer, enz.
De termen "nucleïnezuren van de moeder" en "nucleïnezuren van de foetus" verwijzen hierin naar respectievelijk de nucleïnezuren van een zwangere vrouwelijke patiënt en de nucleïnezuren van de foetus die wordt gedragen door de zwangere vrouw. Zoals hiervoor uitgelegd, worden "nucleïnezuren van de foetus" en "nucleïnezuren van de placenta" vaak gebruikt om te verwijzen naar hetzelfde type nucleïnezuren, hoewel er biologische verschillen kunnen bestaan tussen de twee types nucleïnezuren.
De term "overeenkomstig" verwijst hierin naar een nucleïnezuursequentie, bijv. een gen of een chromosoom, dat aanwezig is in het genoom van verschillende patiënten, en dat niet noodzakelijk dezelfde sequentie heeft in alle genomen, maar dient voor het bieden van de identiteit eerder dan de genetische informatie van een interessante sequentie, bijv. een gen of chromosoom.
De term "in hoofdzaak celvrij" verwijst hierin naar bereidingen van het gewenste monster waaruit componenten die normaal daarmee zijn geassocieerd, zijn verwijderd. Een plasmamonster kan bijvoorbeeld in hoofdzaak celvrij gemaakt worden door het verwijderen van bloedcellen bijv. witte bloedcellen, die normaal daarmee zijn geassocieerd. In sommige uitvoeringsvormen worden in hoofdzaak vrije monsters verwerkt voor het verwijderen van cellen die anders zouden bijdragen tot het genetische materiaal dat moet worden getest op een aneuploïdie.
Zoals hierin gebruikt, verwijst de term "chromosoom" naar de erfelijke gendrager van een levende cel die is afgeleid van chromatine en die DNA en proteïnecom pon enten (in het bijzonder histonen) omvat. Het conventioneel internationaal erkende individuele humane genoomchromosoomnummeringssysteem wordt hierin gebruikt. De term "chromosomale segmenten" moet worden begrepen als een deel van een chromosoom. De genoemde segmenten kunnen naar een stuk, venster of specifiek gebied binnen een chromosoom verwijzen, bijv. waarvan gekend is dat het bijvoorbeeld deleties of inserties of kopieaantalvariaties omvat.
Zoals hierin gebruikt, verwijst de term "polynucleotidelengte" naar het absolute aantal nucleïnezuurmoleculen (nucleotiden) in een sequentie of in een gebied van een referentiegenoom. De term "chromosoomlengte" verwijst naar de gekende lengte van het chromosoom gegeven in baseparen.
De term "patiënt" verwijst hierin naar een humane patiënt evenals een niet-humane patiënt zoals een zoogdier, een ongewerveld dier, een schimmel, een gist, een bacterie en een virus. Hoewel de voorbeelden hier betrekking hebben op humane genomen en de beschrijving hoofdzakelijk is gericht op mensen, is het concept van de onderhavige uitvinding van toepassing op genomen van eender welke plant of dier, en kan het worden gebruikt in het gebied van de dierengeneeskunde, dierenwetenschappen, onderzoekslaboratoria en dergelijke.
De term "conditie" verwijst hier naar "medische conditie" als een brede term die alle ziektes en aandoeningen omvat, maar die letsels en normale gezonde situaties kan omvatten, zoals zwangerschap, die een invloed kunnen hebben op de gezondheid van een persoon, voordeel uit medische hulp of implicaties hebben voor medische behandelingen.
De term "attribuut" moet worden begrepen als een eigenschap of waarde van een object of element. Dit kan bijv. een bepaalde correctiefactor zijn die wordt gebruikt voor het corrigeren van de aflezingstelling voor een bepaald polymorfisme. Een attribuut kan experimenteel worden gedefinieerd met behulp van een reeks monsters.
GEDETAILLEERDE BESCHRIJVING
De uitvinding heeft betrekking op een werkwijze voor het bepalen van de aan-of afwezigheid van een foetale chromosomale aneuploïdie bij een zwangere vrouw. Deze bepaling kan worden uitgevoerd door de berekening van een parameter die is verbonden met chromosomale gegevens die zijn verkregen uit een biologisch monster. Ook wordt een door de computer leesbaar medium voorzien dat is gecodeerd met meerdere instructies voor het sturen van een computersysteem voor het uitvoeren van de werkwijzen.
In een tweede aspect beschrijft de onderhavige uitvinding een methodologie voor de bepaling van de foetale fractie in een monster. De werkwijze laat in het bijzonder de bepaling van de fractie celvrij DNA (cfDNA) toe die wordt bijdragen door een foetus aan het mengsel van foetaal en moederlijk cfDNA in een monster van de moeder, bijv. een plasmamonster. In een voorkeur dragende uitvoeringsvorm laat de onderhavige uitvinding zowel de bepaling van de aan-of afwezigheid van een foetale chromosomale aneuploïdie bij een zwangere vrouw als de bepaling van de foetale fractie toe, onafhankelijk van het geslacht van de foetus.
In één aspect worden aflezingstellingen bepaald op basis van de sequencing van nucleïnezuurmoleculen in een monster van de moeder, zoals urine, plasma, serum, blastocoel fluïdum en andere geschikte biologische monsters. Nucleïnezuurmoleculen van het biologische monster zijn willekeurig gesequencet, zodat een fractie van het genoom wordt gesequencet. Eén of meerdere drempelwaarden worden gekozen voor het bepalen of er een verandering is vergeleken met een referentiehoeveelheid (d.w.z. onevenwicht), bijvoorbeeld met betrekking tot de verhouding van hoeveelheden van twee chromosomale gebieden (of reeksen van gebieden).
De gedetecteerde verandering in de referentiehoeveelheid kan eender welke afwijking (op- of neerwaarts) zijn met betrekking tot de klinisch relevante nucleïnezuursequentie of het doelchromosoom of chromosomaal segment ten opzichte van de andere niet-klinisch relevante sequenties. De referentiestatus kan dus een verhouding of andere hoeveelheid (bijv. ander dan een 1-1-overeenkomst) zijn, en de gemeten status die wijst op een verandering kan een verhouding of andere hoeveelheid zijn die verschilt van de referentiehoeveelheid zoals bepaald door een of meerdere drempelwaarden.
Het klinisch relevante chromosomale gebied (ook een klinisch relevante nucleïnezuursequentie of doelchromosoom of chromosomaal segment genoemd) en de achtergrondnucleïnezuursequentie kunnen van een eerste type cellen of van een of meerdere tweede types cellen afkomstig zijn. Foetale nucleïnezuursequenties die afkomstig zijn van cellen van de foetus/placenta kunnen bijvoorbeeld aanwezig zijn in een biologisch monster, zoals plasma van de moeder, die een achtergrond van nucleïnezuursequenties van de moeder bevat die afkomstig zijn van cellen van de moeder. Merk op dat het percentage van de foetale sequenties in een monster kan worden bepaald door enige van de foetus afgeleide loei en niet beperkt is tot het meten van de klinisch relevante nucleïnezuursequenties. 1. Algemene methode voor het evalueren van een aneuploïdie De onderhavige uitvinding beschrijft een methodologie voor het detecteren van de aan- of afwezigheid van een foetale chromosomale aneuploïdie en/of de bepaling van de foetale fractie die aanwezig is in een biologisch monster.
In een eerste aspect is de werkwijze voor het detecteren van de aan- of afwezigheid van een foetale chromosomale aneuploïdie gebaseerd op de bepaling van een parameter uit de nucleïnezuurinhoud van een biologisch monster. Het biologische monster kan plasma, urine, serum, blastocoel fluïdum of enig ander geschikt monster zijn. Het monster bevat nucleïnezuurmoleculen van de foetus en de zwangere vrouw. De nucleïnezuurmoleculen kunnen bijvoorbeeld fragmenten van chromosomen zijn.
Ten minste een deel van meerdere van de nucleïnezuurmoleculen opgenomen in het biologische monster wordt willekeurig gesequencet voor het verkrijgen van een aantal sequenties. Het gesequencete deel stelt een fractie van het humane genoom voor en kan worden geïsoleerd uit het monster door middel van conventionele middelen (bijv. celvrije DNA-extractie en bereiding van een NGS-bibliotheek). In één uitvoeringsvorm zijn de nucleïnezuurmoleculen fragmenten van respectievelijke chromosomen. Eén uiteinde (bijv. 50 baseparen (bp)), beide uiteinden, of het volledige fragment kunnen gesequencet zijn. Een subreeks van de nucleïnezuurmoleculen in het monster kan gesequencet zijn, en deze subreeks wordt willekeurig gekozen, zoals hieronder meer in detail zal worden beschreven.
In één uitvoeringsvorm gebeurt de willekeurige sequencing met behulp van massief parallelle sequencing. Massief parallelle sequencing, zoals deze bereikt op de HiSeq2000, HiSeq2500, HiSeq3000, HiSeq4000, HiSeq X, MiSeq, MiSeqDx, NextSeq500, NextSeq550 flowcell, het 454 platform (Roche), Illumina Genome Analyzer (or Solexa platform) of SOLiD System (Applied Biosystems) of PGM of Proton platform (IonTorrent) of GeneRead (Qiagen) of de Helicos True Single Molecule DNA-sequencingtechnologie, de enkele molecule, real-time (SMRT™) technologie van Pacific Biosciences, en nanopore sequencing zoals in MinlON, PromethION, GridlON (Oxford Nanopore technologies), laten de sequencing toe van veel nucleïnezuurmoleculen die op een parallelle manier zijn geïsoleerd uit een specimen bij hogere ordes van multiplexing. Elk van deze platforms sequencet klonaal geëxpandeerd of zelfs niet-geamplificeerde enkele moleculen van nucleïnezuurfragmenten. Klonale expansie kan worden verkregen door brugamplificatie, emulsie-PCR of Wildfire-technologie.
Aangezien een groot aantal sequencingaflezingen, in de grootorde van honderdduizenden tot miljoenen of zelfs mogelijk honderd miljoen of miljarden, worden gegenereerd uit elk monster in elke run, vormen de resulterende gesequencete aflezingen een representatief profiel van de mix van nucleïnezuurspecies in het originele specimen. Het (De?) halotype, transcriptoom en methylatieprofielen van de gesequencete aflezingen lijken bijvoorbeeld op deze van het originele specimen. Omwille van de grote bemonstering van sequenties uit elk specimen, is het aantal identieke sequenties, zoals deze gegenereerd uit de sequencing van een nucleïnezuurgroep op verschillende veelvouden van dekking of hoge redundantie, ook een goede kwantitatieve voorstelling van de telling van een bepaalde nucleïnezuurspecies of locus in het oorspronkelijke monster.
Op basis van de sequencing (bijv. gegevens uit de sequencing) wordt een eerste score van een doelchromosoom of chromosomaal segment (bijv. het klinisch relevante chromosoom) bepaald. De eerst score wordt bepaald op basis van sequenties die zijn geïdentificeerd als afkomstig uit (d.w.z. alignerend met) het doelchromosoom of chromosomaal segment. Een bio-informatieprocedure kan dan bijvoorbeeld worden gebruikt om elk van deze DNA-sequenties voor het humaan genoom of een referentiegenoom te lokaliseren. Het is mogelijk dat een deel van dergelijke sequenties zal worden verwijderd uit latere analyse omdat ze aanwezig zijn in de herhalingsgebieden van het humane genoom, of in gebieden die worden onderworpen aan interindividuele variaties, bijv. kopienummervariaties. Een score van het doelchromosoom of chromosomaal segment en van een of meerdere andere chromosomen kan aldus worden bepaald.
Op basis van de sequencing wordt een verzameling van scores van een of meerdere chromosomen of chromosomale segmenten bepaald van sequenties die zijn geïdentificeerd als afkomstig uit (d.w.z. alignerend met) een reeks van een of meerdere chromosomen. In één uitvoeringsvorm bevat de genoemde reeks alle andere chromosomen naast de eerste (d.w.z. de eerste die is getest). In een andere uitvoeringsvorm bevat de genoemde reeks een enkel ander chromosoom. In een meest voorkeurdragende uitvoeringsvorm bevat de genoemde reeks chromosomen of chromosomale segmenten en omvat het het doelchromosoom of chromosomaal segment.
Er zijn een aantal manieren om een score te bepalen. De genoemde score is bij voorkeur gebaseerd op de aflezingstellingen die zijn verkregen uit sequencing. De genoemde aflezingstellingen kunnen het tellen omvatten van het aantal gesequencete aflezingen, het aantal gesequencete nucleotiden (baseparen) of de geaccumuleerde lengtes van gesequencete nucleotiden (baseparen) afkomstig uit een bepaald chromoso(o)m(en) of chromosomale segmenten zoals stukken of vensters of klinisch relevante chromosoomdelen.
Regels kunnen worden opgelegd op de resultaten van de sequencing om te bepalen wat wordt geteld. In één aspect kan een aflezingstelling worden verkregen op basis van een deel van de gesequencete output. Sequencingoutput overeenkomstig nucleïnezuurfragmenten met een gespecificeerd groottebereik zou bijvoorbeeld kunnen worden geselecteerd.
In één uitvoeringsvorm is de genoemde score de onbewerkte aflezingstelling vooreen bepaald chromosoom of chromosomaal segment.
In een voorkeurdragende uitvoeringsvorm worden de genoemde aflezingstellingen onderworpen aan wiskundige functies of bewerkingen om de genoemde score van de genoemde aflezingstelling af te leiden. Dergelijke bewerkingen zijn, onder andere, maar zijn niet beperkt tot, statistische bewerkingen, regressiemodellen, standaard berekeningen (optellen, aftrekken, vermenigvuldigen en delen), waarbij de genoemde standaardberekeningen bij voorkeur zijn gebaseerd op een of meerdere verkregen aflezingstellingen.
In een voorkeurdragende uitvoeringsvorm is de genoemde eerste score een genormaliseerde waarde die is afgeleid van de aflezingstellingen of wiskundig gewijzigde aflezingstellingen. In een andere voorkeurdragende uitvoeringsvorm is de genoemde score een Z-score of standaard score met betrekking tot de aflezingstellingen van een bepaald chromosoom, chromosomaal segment of de wiskundig gewijzigde tellingen daarvan, waarbij de Z-score kwantificeert hoeveel het aantal aflezingen van een bepaalde sequentie verschilt van het aantal aflezingen die zijn verkregen uit dezelfde sequentie in een reeks referentiemonsters. Het is welbekend bij een vakman hoe een dergelijke Z-score kan worden berekend.
In een voorkeurdragende uitvoeringsvorm wordt een parameter bepaald op basis van een eerste score (overeenkomstig het doelchromosoom of chromosomaal segment) en een verzameling van scores. De parameter stelt bij voorkeur een relatieve score voor tussen de eerste score en een samenvattende statistieke van de verzameling van scores. De parameter kan, bijvoorbeeld, een eenvoudige verhouding voorstellen van de eerste score ten opzichte van een samenvattende statistiek van de verzameling van scores. In één aspect zou elke score een argument van een functie of afzonderlijke functies kunnen zijn, waarbij een verhouding dan kan worden genomen van deze afzonderlijke functies.
In een voorkeurdragende uitvoeringsvorm kan de parameter worden verkregen door een verhouding tussen: - een eerste functie waarbij de eerste score en de verzameling van scores de argumenten zijn; - een tweede functie waarbij de verzameling van scores het argument is.
In een voorkeurdragende uitvoeringsvorm is de genoemde eerste functie gedefinieerd als een verschil, bij voorkeur het verschil tussen de eerste score en een samenvattende statistiek van de verzameling van scores, waarbij de genoemde samenvattende statistiek bij voorkeur is geselecteerd uit het gemiddelde, de mediaan, de standaardafwijking of mediane absolute afwijking (mad) of gemiddelde absolute afwijking.
In een andere voorkeurdragende uitvoeringsvorm is de genoemde tweede functie gedefinieerd als een variabiliteitsamenvattende statistiek van de verzameling van scores, waarbij de genoemde samenvattende statistiek bij voorkeur is geselecteerd uit het gemiddelde, de mediaan, de standaardafwijking of mediane absolute afwijking (mad) of gemiddelde absolute afwijking.
Een geschikte uitvoeringsvorm volgens de onderhavige uitvinding omvat gewoonlijk de volgende stappen (na DNA-sequenties uit een willekeurige, lage-dekking sequencingproces op een biologisch monster te hebben verkregen). - het aligneren van sequenties met een referentiegenoom; - het verkrijgen van de aflezingstellingen per chromosoom of chromosomaal segment; - het normaliseren van het aantal aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score die is afgeleid van het genoemde genormaliseerde aantal aflezingen en een verzameling van scores afgeleid van de genoemde genormaliseerde aflezingstellingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van het genormaliseerde aantal aflezingen die waren verkregen uit een reeks chromosomen of chromosoomsegmenten die het chromosomaal doelsegment of chromosoom omvatten; - het berekenen van een parameter van de genoemde scores, waarbij de genoemde parameter een verhouding voorstelt tussen de genoemde eerste score en een samenvattende statistiek van de genoemde verzameling scores, waarbij de eerste functie van de genoemde verhouding wordt gedefinieerd als een verschil tussen de eerste score en een samenvattende statistiek van de genoemde verzameling scores; en waarbij de tweede functie van de genoemde verhouding wordt gedefinieerd als een samenvattende statistiek van de genoemde verzameling scores.
De genoemde sequenties worden bij voorkeur verkregen door lage-dekking sequencing.
De genoemde normalisatie vindt bij voorkeur plaats op basis van een reeks referentiemonsters, waarbij de genoemde referentiemonsters bij voorkeur, maar niet noodzakelijk, euploïde of in hoofdzaak euploïde zijn voor het chromosoom of chromosomaal segment dat overeenkomt met het doelchromosoom of chromosomaal segment (d.w.z. het grootste deel van het chromosoom of chromosomaal segment in de referentiemonsters die overeenkomen met het doelchromosoom of chromosomaal segment in het testmonster zijn euploïde). Dergelijke referentiereeks heeft verschillende monstergroottes. Een mogelijke monstergrootte kan bijv. 100 monsters zijn, zoals 50 mannelijke en 50 vrouwelijke monsters. Het zal duidelijk zijn voor een vakman dat de referentiereeks vrij kan worden gekozen door de gebruiker.
Het genoemde aantal aflezingen is bij voorkeur opnieuw gekalibreerd om te corrigeren voor GC-inhoud en/of totaal aantal aflezingen verkregen uit het genoemde monster.
Door rekening te houden met een reeks scores afgeleid van aflezingen van chromosomen of chromosomale segmenten die het doelchromosoom of chromosomale segment bevatten, kan een gevoeligere en betrouwbaardere parameter worden verkregen in vergelijking met werkwijzen volgens de stand der techniek. Anders dan in de werkwijzen die bekend zijn in de stand der techniek moet er geen veronderstelling worden gedaan over de ploïdiestatus van enige van de chromosomen in het testmonster. Door een parameter volgens de onderhavige uitvinding te definiëren is de parameter voor het chromosoom of gebied dat moet worden geanalyseerd namelijk duidelijk (d.w.z. is het sterk toegenomen/afgenomen) en verdwijnt het niet in de ruis (d.w.z. slechts matig of niet toegenomen/afgenomen). Voor de screening is gevoeligheid bovendien essentieel, aangezien het belangrijk is een betrouwbaar en te vertrouwen resultaat te hebben, waarbij het aantal valse negatieven wordt geminimaliseerd. Voor de screening kan het namelijk belangrijker zijn hoge superioriteit te hebben vergeleken met specificiteit.
De parameter volgens de onderhavige uitvinding laat robuuste detectie en automatische classificatie van chromosomen toe, zelfs in gegevens met ruis. Door rekening te houden met een verzameling van chromosomen of segmenten, inclusief het doelchromosoom of segment, d.w.z. het merendeel van informatie die aanwezig is in de gegevensreeks, wordt het merendeel van de beschikbare informatie gebruikt, waardoor een adequatere analyse wordt verkregen. Als men bijv. chromosoom 1 (het grootse chromosoom, 7,9% van het genoom) zou verwijderen, zou een grote hoeveelheid gegevens worden verwijderd waarmee geen rekening wordt gehouden, hetgeen een verstoring in de analyse zou veroorzaken.
De onderhavige uitvinding is in het bijzonder erg nuttig in situaties waarin een laag aantal aflezingen of gegevens met ruis wordt verkregen. De uitvinders hebben gevonden dat de parameter volgens de onderhavige uitvinding, in de laatste situaties, superieur was vergeleken met andere methodologieën.
In een voorkeurdragende uitvoeringsvorm worden de genoemde scores verkregen op basis van de genomische voorstelling van het doelchromosoom of chromosomaal segment (of een gebied daarvan) en de genomische voorstelling van alle autosomen of chromosomen, waardoor het doelchromosoom of chromosomaal segment opgenomen is.
De parameter wordt vergeleken met een of meerdere drempelwaarden. De drempelwaarden kunnen worden bepaald op enig aantal geschikte manieren. Dergelijke manieren zijn onder andere waarschijnlijkheidsmethode van het Bayesiaanse type, sequentiële waarschijnlijkheidstest (SPRT, sequential proability ratio testing), ontdekking van valse resultaten, betrouwbaarheidsinterval, door de ontvanger bediend kenmerk (ROC, receiver operating characteristic). In een meer voorkeur dragende uitvoeringsvorm is de genoemde drempelwaarde gebaseerd op statistische overwegingen of wordt het empirisch bepaald door het testen van biologische monsters. De drempelwaarde kan worden gevalideerd door middel van testgegevens of een validatiereeks en kan, indien nodig, worden gewijzigd telkens meer gegevens beschikbaar zijn.
Het is mogelijk dat in sommige varianten van de procedure, de drempelwaarde zou worden aangepast in overeenstemming met informatie over de fractie van het celvrije foetale DNA in het monster van het plasma van de moeder (ook foetale fractie genoemd of afgekort ff of f). In een andere uitvoeringsvorm kan de genoemde foetale fractie dienen als een interne controle van de kwaliteit van het monster. De waarde van f kan op verschillende manieren worden bepaald op basis van de sequencinggegevensreeks (afhankelijk van het geslacht van de foetus, of onafhankelijk van het geslacht van de foetus), zoals hieronder verder zal worden uitgelegd.
Op basis van de vergelijking wordt een classificatie bepaald of er een foetale chromosomale aneuploïdie bestaat voor het doelchromosoom of chromosomaal deel. In een uitvoeringsvorm is de classificatie een definitieve ja of nee. In een andere uitvoeringsvorm kan de classificatie niet classificeerbaar zijn of onzeker. In nog een andere uitvoeringsvorm kan de classificatie een risicoscore zijn die moet worden geïnterpreteerd op een latere datum, bijvoorbeeld, door een arts.
In een verder voorkeurdragende uitvoeringsvorm worden secundaire parameters van de aflezingstellingen berekend, die dienen als een aanvullende interne controle voor de bruikbaarheid van de parameter, de omvang van de aneuploïdie (indien geïdentificeerd) en/of een indicatie voor de betrouwbaarheid van de parameter, het biologische monster of de sequenties die zijn verkregen daarvan en bijgevolg de uiteindelijke beoordeling. De waarde voor de genoemde secundaire parameters kan bijv. een maatstaf of vereiste zijn van de aanwezigheid van de genoemde aneuploïdie en/of een meting van de kwaliteit van het monster.
In één uitvoeringsvorm wordt de genoemde secundaire parameter berekend als de mediaan van de Z-verdeling van de aflezingstellingen of een afgeleide daarvan, voor een doelchromosoom of chromosomaal doelsegment gemeten per stuk of een verzameling stukken (d.w.z. vensters). De laatste secundaire parameters laten beoordeling toe als het merendeel (meer dan 50%) van de vensters in een chromosoom is toegenomen of afgenomen. Het laatste laat de detectie van chromosomale en grote subchromosomale aneuploïdeën toe. Wanneer minder dan 50% van de vensters getroffen wordt, zullen de secundaire parameters niet beïnvloed worden (bijv. kleinere CNV's).
In een andere uitvoeringsvorm kunnen de genoemde secundaire parameters worden berekend als de mediaan van de absolute waarde van de Z-scores voor de aflezingstellingen of een afgeleide daarvan, van de resterende chromosomen (dat is een verzameling van chromosomen of segmenten die het doelchromosoom of chromosomaal segment uitsluiten).
De laatste secundaire parameters laten de detectie toe van o.a. de aanwezigheid van technische of biologische instabiliteiten en het onderscheiden daarvan van CNV's van de moeder. Als minder dan de vensters van de andere van alle chromosomen getroffen worden, zal deze secundaire parameters niet beïnvloed worden. Als meer dan 50% van de vensters getroffen wordt, zal dit kunnen worden afgeleid van de genoemde secundaire parameters.
In een andere uitvoeringsvorm biedt de onderhavige uitvinding ook een kwaliteitsscore (QS). QS laat toe de algemene variatie binnen het genoom te beoordelen. Een lage QS is een indicatie van een goede monsterverwerking en een laag niveau van technische en biologische ruis. Een stijging in de QS kan twee mogelijke redenen hebben. Hetzij een fout die is opgetreden tijdens de verwerking van het monster. In het algemeen zal aan de gebruiker worden gevraagd een nieuw biologisch staal af te nemen en te testen. Dit is typisch voor matig gestegen QS-scores. Een sterk gestegen QS zou een indicatie kunnen zijn van een sterk aneuploïde monster en de gebruiker zal worden aangemoedigd een bevestigende test te doen. De genoemde QS wordt bij voorkeur bepaald door het berekenen van de standaardafwijkingen van alle Z-scores voor chromosomen of chromosomale segmenten en optioneel door het verwijderen van de uitschieters daarvan (d.w.z. de hoogste en laagste Z-scores in deze verzameling).
Als een alternatieve of aanvullende uitvoeringsvorm dient de bepaling van de foetale fractie (zie hieronder) ook als een interne kwaliteitscontrole van het monster en de daarvan verkregen sequenties. De kwaliteit van een monster kan verstoord worden na ophaling, bijv. door ongeschikte omstandigheden tijdens de verzameling, het transport of de opslag. Dit laatste kan een effect hebben op het celvrije DNA in het monster, bijvoorbeeld omwille van breuk van (moederlijke) witte bloedcellen. Bijgevolg zal de hoofdgroep van vrijzwevend DNA meer verrijkt worden voor moederlijk DNA, waardoor het percentage van de foetale fractie in vergelijking met het totale celvrije DNA-gehalte in het monster zal dalen. De genoemde foetale fractie zal bij voorkeur worden bepaald door ten minste een van de hieronder beschreven werkwijzen.
In een uitvoeringsvorm van de onderhavige uitvinding zal de parameter voldoende zijn om een onderscheid te maken tussen de aanwezigheid en/of afwezigheid van een aneuploïdie. In een meer voorkeurdragende uitvoeringsvorm van de onderhavige uitvinding zullen zowel de parameter als de secundaire parameters worden gebruikt om een beslissing te nemen met betrekking tot de aanwezigheid of afwezigheid van een aneuploïdie. Ook de genoemde secundaire parameters zullen bij voorkeur vergeleken worden met vooraf gedefinieerde drempelwaarden.
De methodologie volgens de onderhavige uitvinding is bij voorkeur in het bijzonder geschikt voor het analyseren van aneuploïdieën verbonden met segmenten of deleties gegeven in Tabel 1 die een niet-limitatieve lijst van chromosoomafwijkingen bevat die mogelijk kunnen worden geïdentificeerd door de werkwijzen en kits die hier beschreven zijn. In een andere of verdere uitvoeringsvorm is het genoemde chromosomale doelsegment geselecteerd uit een stuk of een venster afgeleid van chromosoom X, Y, 6, 7, 8, 13, 14, 15, 16, 18, 21 en/of 22.
In een verdere of andere uitvoeringsvorm is het genoemde chromosoom geselecteerd uit chromosoom X, Y, 6, 7, 8, 13, 14, 15, 16, 18, 21 en/of 22.
Tabel 1
II Seauencina. uitliinina en correctie
Zoals hierboven vermeld, wordt slechts een fractie van het genoom gesequencet. In één aspect, zelfs wanneer een groep nucleïnezuren in een specimen gesequencet is bij <100% genomische dekking in plaats van met verscheidende veelvouden van dekking, en uit de verhouding van gesequencete nucleïnezuurmoleculen, wordt het meeste van elk nucleïnezuurspecies niet gesequencet of slechts éénmaal gesequencet.
Dit staat in contrast met situaties waarin gerichte verrijking wordt uitgevoerd van een subreeks van het genoom voorafgaand aan de sequencingreactie, gevolgd door hoge-dekking sequencing van die subreeks.
In één uitvoeringsvorm worden de genoemde sequenties verkregen door sequencing van de volgende generatie. In een andere voorkeurdragende uitvoeringsvorm is de genoemde sequencingwerkwijze een lage-dekking, willekeurige sequencingwerkwijze.
In één uitvoeringsvorm wordt massieve parallelle korte-aflezing sequencing gebruikt. Korte sequentietags of aflezingen worden gegenereerd, bijv. uit een bepaalde lengte tussen 20 bp en 400 bp. Sequencing met gepaard uiteinde zou ook kunnen worden uitgevoerd.
In één uitvoeringsvorm is een voorverwerkingsstap beschikbaar voor het vooraf verwerken van de verkregen aflezingen. Dergelijke voorafgaande verwerkingsoptie laat filtering toe van aflezingen met een lage kwaliteit, waardoor voorkomen wordt dat ze worden toegewezen. Toewijzing van aflezingen met een lage kwaliteit kan langdurige computerverwerkingscapaciteit vereisen, kan onjuist zijn en 'heeft als risiko dat de technische ruis in de gegevens verhoogt, waardoor een minder nauwkeurige parameter wordt verkregen. Dergelijke voorafgaande verwerking is in het bijzonder waardvol wanneer sequencinggegevens van de volgende generatie worden gebruikt, die een algemene lagere kwaliteit of enige andere omstandigheid hebben die is gekoppeld met een algemene lagere kwaliteit van de aflezingen.
De gegenereerde aflezingen kunnen later worden uitgelijnd met een of meerdere humane referentiegenoomsequenties. Het aantal uitgelijnde aflezingen worden bij voorkeur geteld en/of gesorteerd volgens de chromosomale locatie ervan.
Een aanvullende reinigingsprotocol kan worden uitgevoerd, waarbij deduplicatie wordt uitgevoerd, bijv. met Picard-instrumenten, waarbij enkel uniek toegewezen aflezingen worden weerhouden. Aflezingen met mismatches en leemtes kunnen worden verwijderd. Aflezingen die de gebieden op de zwarte lijst indelen, kunnen worden uitgesloten. Dergelijke gebieden op de zwarte lijst kunnen worden genomen uit een vooraf gedefinieerde lijst van bijv. gewone CNV's, collapsed repeats, DAC zwarte-lijst gebieden zoals geïdentificeerd in het ENCODE-project (d.w.z. een reeks gebieden in het humane genoom dat afwijkende, ongestructureerde, hoog-signaal/aflezingstellingen heeft in NGS-experimenten onafhankelijk van cellijn en type experiment) en de ongedefinieerde delen van het referentiegenoom. In één uitvoeringsvorm zijn gebieden op de zwarte lijst gegeven aan de gebruiker. In een andere uitvoeringsvorm kan de gebruiker zijn of haar eigen reeks gebieden op de zwarte lijst gebruiken of definiëren.
In een andere uitvoeringsvorm zijn chromosomen onderverdeeld in gebieden met een vooraf gedefinieerde lengte, in het algemeen stukken genoemd. In een uitvoeringsvorm is de stukgrootte een vooraf gedefinieerde grootte die is gegeven aan de gebruiker. In een andere uitvoeringsvorm kan de genoemde stukgrootte gedefinieerd zijn door een gebruiker, kan het uniform zijn voor alle chromosomen, kan het een specifieke stukgrootte per chromosoom zijn of kan het variëren volgens de verkregen sequentiegegevens. Verandering van de stukgrootte kan een effect hebben op de uiteindelijke parameter die moet worden gedefinieerd, hetzij door het verbeteren van de gevoeligheid (gewoonlijk verkregen door het verlagen van de stukgrootte, vaak ten koste van de specificiteit) hetzij door het verbeteren van de specificiteit (in het algemeen door het verhogen van de stukgrootte, vaak ten koste van de gevoeligheid). Een mogelijke stukgrootte die een aanvaardbare specificiteit en gevoeligheid oplevert, is 50 kb.
In een verdere stap worden de uitgelijnde en gefilterde aflezingen binnen een stuk geteld, om aflezingstellingen te verkrijgen.
De verkregen aflezingstellingen kunnen worden gecorrigeerd voor de GC-telling voor het stuk. Van GC-voorspanning is gekend dat het genoomassemblage verergert. Verscheidende GC-correcties zijn welbekend in de stand der techniek (bijv. Benjamini et al., Nucleic Acid Research 2012). In een voorkeurdragende uitvoeringsvorm zal de genoemde GC-correctie een LOESS-regressie zijn. In een uitvoeringsvorm kan een gebruiker van de methodologie volgens de onderhavige uitvinding voorzien zijn van de keuze van verscheidene mogelijke GC-correcties.
In een latere stap wordt de genomische voorstelling (GR, genomic représentation) van aflezingstellingen berekend. Dergelijke voorstelling wordt bij voorkeur gedefinieerd als een verhouding tussen de GC-gecorrigeerde aflezingstellingen voor een specifiek stuk en de som van alle GC-gecorrigeerde aflezingstellingen.
In een uitvoeringsvorm wordt de genoemde GR als volgt gedefinieerd:
met k over alle chromosomale stukken.
De factor 107 (of 10E7) in de bovenstaande formule is willekeurig gedefinieerd, en kan eender welke constante waarde zijn.
In een uiteindelijke stap worden de verkregen GC per stuk samengevoegd over een gebied, waarbij het genoemde gebied een subgebied (venster) van een chromosoom of het volledige chromosoom kan zijn. Het genoemde venster kan een vooraf gedefinieerd of variabele grootte hebben, die optioneel kan zijn gekozen door de gebruiker. Een mogelijk venster zou een grootte kunnen hebben van 5 MB of 100 aangrenzende stukken met een grootte van 50 kb.
De GR samengevoegd voor een chromosoom kan worden gedefinieerd door
In een andere uitvoeringsvorm moet de genomische voorstelling van een reeks referentiemonsters berekend worden. De genoemde reeks referentiemonsters (of ook referentiereeks genoemd) kan vooraf gedefinieerd of gekozen zijn door een gebruiker (bijv. geselecteerd uit zijn/haar eigen referentiemonsters). Door de gebruiker toe te laten een eigen referentiereeks te gebruiken, zal een gebruiker de terugkerende technische variatie van zijn/haar omgeving en de variabelen ervan (bijv. verschillende natte labreagentia of protocol, verschillend NGS-instrument of platform, enz.) beter kunnen vastleggen. In een voorkeurdragende uitvoeringsvorm omvat de genoemde referentiereeks genomische informatie van 'gezonde' monsters waarvan verwacht wordt of waarvan bekend is dat ze (relevante) aneuploïdieën bevatten. De genomische voorstelling (GR) van de referentiereeks kan worden gedefinieerd, hetzij op het niveau van het genoom en/of op een subgebied (chromosoom, chromosomaal segment, venster of bin).
Andere sequencingstrategieën met een enkele molecule zoals die door het Roche 454 platform, het Applied Biosystems SOLiD-platform, de Hélicos True Single Molecule DNA-sequencingtechnologie, de enkele molecule, real-time (SMRT™)-technologie van Pacific Biosciences, en nanoporie sequencing technologieën zoals MinlON, GridlON of PromethION van Oxford Nanopore Technologies zouden ook kunnen worden gebruikt in deze toepassing. III Bepaling van scores, parameter en secundaire parameters
Op basis van de uitlijningen en de verkregen aflezingstellingen of een afgeleide daarvan, optioneel gecorrigeerd voor GC-gehalte en/of totaal aantal aflezingen verkregen van het genoemde monsters, worden scores berekend die uiteindelijk leiden tot een parameter die toelaat de aanwezigheid van een aneuploïdie in een monster te bepalen. De genoemde scores zijn genormaliseerde waarden die zijn afgeleid van de tellingen van de aflezingen of wiskundig gewijzigde tellingen van de aflezingen, waarbij normalisatie plaatsvindt met het oog op de referentie reeks. Bijgevolg wordt elke score verkregen door middel van een vergelijking met de referentiereeks. De term eerste score wordt gebruikt om te verwijzen naar de score die is gekoppeld met de telling van de aflezingen voor een doelchromosoom of een chromosomaal segment. Een verzameling van scores is een reeks scores die zijn afgeleid van een reeks genormaliseerde aantal aflezingen die het genormaliseerde aantal aflezingen van het genoemde chromosomale doelsegment of doelchromosoom kan omvatten.
De genoemde eerste score stelt bij voorkeur een Z-score of standaardscore voor een doelchromosoom of chromosomaal segment voor. De genoemde verzameling is bij voorkeur afgeleid van een reeks van Z-scores die zijn verkregen uit een overeenkomstige reeks chromosomen of chromosomale segmenten die het genoemde chromosomale doelsegment of doelchromosoom omvatten.
In een meest voorkeurdragende uitvoeringsvorm worden de eerste score en de verzameling van scores berekend op basis van de genomische voorstelling van hetzij een doelchromosoom hetzij een chromosomaal doelsegment, of alle autosomen (of gebieden daarvan) daarbij omvattende het doelchromosoom of chromosoomsegment.
Dergelijke scores kunnen als volgt worden berekend:
Met i een venster of een chromosoom of een chromosoomsegment.
Een samenvattende statistiek van de genoemde verzameling scores kan bijv. worden berekend als het gemiddelde of de mediane waarde van de individuele scores. Een andere samenvattende statistiek van de genoemde verzameling scores kan worden berekend als de standaardafwijking of mediane absolute afwijking of gemiddelde absolute afwijking van de individuele scores.
De genoemde parameter p zal worden berekend als een functie van de eerste score en een afgeleide (bijv. samenvattende statistiek) van de verzameling van scores. In een voorkeurdragende uitvoeringsvorm zal de genoemde parameter een verhouding zijn tussen de eerste score gecorrigeerd door de verzameling scores (of een afgeleide daarvan) en een afgeleide van de genoemde verzameling scores.
In een andere uitvoeringsvorm zal de genoemde parameter een verhouding zijn tussen de eerste score gecorrigeerd door een samenvattende statistiek van een eerste verzameling scores en een samenvattende statistiek van een andere, tweede verzameling scores, waarbij beide verzamelingen van scores de eerste score omvatten.
In een specifieke voorkeurdragende uitvoeringsvorm is de genoemde parameter p een verhouding tussen de eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en een samenvattende statistiek van de genoemde verzameling scores. De samenvattende statistiek is bij voorkeur geselecteerd uit het gemiddelde, de mediaan, de standaardafwijking, de mediane absolute afwijking of de gemiddelde absolute afwijking. In één uitvoeringsvorm zijn de genoemde beide gebruikte samenvattende statistieken in de functie dezelfde. In een andere, meer voorkeurdragende uitvoeringsvorm verschillen de genoemde samenvattende statistieken van de verzameling scores in de teller en noemer.
Een geschikte uitvoeringsvorm volgens de onderhavige uitvinding omvat gewoonlijk de volgende stappen (na DNA-sequenties uit een willekeurig sequencingproces op een biologisch monster te hebben verkregen). - het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor tellingen van aflezingen worden verkregen; - het normaliseren van de genoemde tellingen van aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score en een verzameling van scores afgeleid van de genoemde genormaliseerde aflezingstellingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van een overeenkomstige reeks chromosomen of chromosoomsegmenten die het chromosomaal doelsegment of chromosoom omvatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores, waarbij de genoemde parameter een verhouding voorstelt tussen * de genoemde eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de genoemde verzameling scores.
Een mogelijke parameter p kan als volgt worden berekend:
waarbij Zi de eerste score voorstelt en Z j de verzameling van scores en waarbij i het doelchromosoom of chromosomale sectie voorstelt, en waarbij j een verzameling chromosomen of chromosomale segmenten i, a, b, ... voorstelt die het genoemde chromosomale segment of chromosoom i bevatten.
In een andere uitvoeringsvorm wordt de genoemde parameter p berekend als
Waarbij Z, de eerste score voorstelt en Z j de verzameling van scores en waarbij i het doelchromosoom of chromosomale sectie voorstelt, en waarbij j een verzameling chromosomen of chromosomale segmenten i, a, b, ... voorstelt, die het genoemde chromosomale segment of chromosoom i bevatten.
In een nog andere, meest voorkeurdragende uitvoeringsvorm wordt de genoemde parameter p berekend als
waarbij Zi de eerste score voorstelt en Z j de verzameling van tweede scores en waarbij i het doelchromosoom of chromosomale sectie voorstelt, en waarbij j een verzameling chromosomen of chromosomale segmenten i, a, b, ... voorstelt die het genoemde chromosomale segment of chromosoom i voorstellen.
Naast de parameter p die de identificatie van de aanwezigheid van een aneuploïdie toelaat, kunnen secundaire parameters worden berekend die kunnen dienen als kwaliteitscontrole of extra informatie bieden met betrekking tot een of meerdere aneuploïdieën die aanwezig zijn in het monsters.
Een eerste secundaire parameter die kan worden berekend, laat toe te definiëren of chromosomale en grote subchromosomale aneuploïdieën aanwezig zijn in het monster (vergeleken met bijv. kleinere aneuploïdieën). In een voorkeurdragende uitvoeringsvorm wordt een dergelijke parameter gedefinieerd door een mediaan van Z scores gemeten per subgebied (bijv. vensters van 5 Mb) in een doelchromosoom of chromosomale doelsectie. Als meer dan 50% van deze subgebieden getroffen wordt, zal dit merkbaar zijn in de secundaire parameter.
In een andere uitvoeringsvorm kan een secundaire parameter worden berekend als de mediaan van de absolute waarde van de Z-scores berekend over de resterende chromosomen (dat is alle chromosomen behalve het doelchromosoom of chromosomaal segment) per subgebied (bijv. vensters van 5 Mb).
De laatste secundaire parameter laat de detectie toe van de aanwezigheid van technische of biologische instabiliteiten. Als minder dan de helft van de vensters van de andere of alle chromosomen getroffen worden, zal deze secundaire parameter niet beïnvloed worden. Als meer dan 50% van de vensters getroffen wordt, zal dit kunnen worden afgeleid van de genoemde secundaire parameter.
In een andere uitvoeringsvorm biedt de onderhavige uitvinding ook een kwaliteitsscore (QS). QS laat toe de algemene variatie binnen het genoom te beoordelen. Een lage QS is een indicatie van een goede monsterverwerking en een laag niveau van technische en biologische ruis. Een stijging in de QS kan twee mogelijke redenen hebben. Hetzij een fout die is opgetreden tijdens de verwerking van het monster. In het algemeen zal aan de gebruiker worden gevraagd een nieuw biologisch staal af te nemen en te sequencen. Dit is typisch voor matig gestegen QS-scores. Een sterk gestegen QS zou een indicatie kunnen zijn van een sterk aneuploïde monster en de gebruiker zal worden aangemoedigd een bevestigende test te doen. De genoemde QS wordt bij voorkeur bepaald door het berekenen van de standaardafwijkingen van alle Z-scores voor de autosomen of chromosomen en door het verwijderen van het hoogst en laagst scorende chromosoom.
Monsters met een QS hoger dan 2 worden bijvoorbeeld beschouwd als zijnde van een slechte kwaliteit, en een QS tussen 1,5 en 2 is van een tussenliggende kwaliteit. IV. Vergelijking van drempelwaarde
De parameter p zoals berekend in de bovenstaande uitvoeringsvormen zal vervolgens worden vergeleken met een drempelwaarde om te bepalen of er een verandering is vergeleken met een referentiehoeveelheid (d.w.z. onevenwicht), bijvoorbeeld met betrekking tot de verhouding van hoeveelheden van twee chromosomale gebieden (of reeksen van gebieden). In één uitvoeringsvorm zal de gebruiker zijn/haar eigen drempelwaarde kunnen definiëren, hetzij empirisch op basis van ervaring of eerdere experimenten, hetzij bijvoorbeeld op basis van standaard statistische overwegingen. Als een gebruiker de gevoeligheid van de test zou willen verhogen, kan de gebruiker de drempels verlagen (d.w.z. ze dichter naar 0 brengen). Als een gebruiker de specificiteit van de test zou willen verhogen, kan de gebruiker de drempels verhogen (d.w.z. ze verder van 0 brengen). Een gebruiker zal vaak een evenwicht moeten vinden tussen gevoeligheid en specificiteit, en dit evenwicht is vaak lab- en toepassingsspecifiek, daarom is het gemakkelijk als een gebruiker de drempelwaarden zelf kan veranderen.
Op basis van de vergelijking met de drempelwaarde kan een aneuploïdie aan-of afwezig worden gevonden.
In een uitvoeringsvorm van de onderhavige uitvinding is vergelijking van parameter p met een drempelwaarde voldoende voor het bepalen van de aan-of afwezigheid van een aneuploïdie. In een andere uitvoeringsvorm wordt de genoemde aneuploïdie bepaald op basis van een vergelijking van parameter p met een drempelwaarde en een vergelijking van ten minste een van de secundaire parameters, kwaliteitsscore en/of eerste score met een drempelwaarde, waarbij voor elke score een overeenkomstige drempelwaarde wordt gedefinieerd of ingesteld.
In een voorkeurdragende uitvoeringsvorm wordt de genoemde aanwezigheid/afwezigheid van een aneuploïdie gedefinieerd door een vergelijking van een parameter p met een vooraf gedefinieerde drempelwaarde, evenals door vergelijking van alle secundaire parameters en eerste scores zoals hierboven beschreven met de overeenkomstige drempelwaarden ervan.
De uiteindelijke beslissingsboom kan dus afhankelijk zijn van parameter p alleen, of gecombineerd met een van de secundaire parameters en/of kwaliteitsscore of eerste score zoals hierboven is beschreven.
In een voorkeurdragende uitvoeringsvorm omvat de genoemde methodologie volgens de onderhavige uitvinding de volgende stappen: - multiplex sequencing van 50 bp enkel-uiteinde aflezingen (uitgevoerd door eindgebruiker) - uploaden van sequentieaflezingen - toewijzing van aflezingen aan een referentiegenoom - tellingaantal van aflezingen per stuk (een stuk heeft een grootte van 50 kb) - berekenen van GC-gehalte per stuk en corrigeren voor GC-gehalte - berekenen van genomische voorstelling (GR)-score per stuk. Voor stuk i is dit gelijk aan
waarbij GCi het GC-gecorrigeerde aantal aflezingen voor stuk i voorstelt, en GCk het GC-gecorrigeerde aantal aflezingen per stuk k voorstelt. het samenvoegen van de GR-waarden per venster (een venster bestaat uit 100 opeenvolgende vensters) berekenen van een Z-score per venster of per chromosoom, waarbij de Z-score is gebaseerd op de GR-score per chromosoom, vergeleken met de GR-scores in een reeks referentiemonsters.
met i een chromosoom of een venster, μ Ref,j de gemiddelde of mediane GR-score voor de overeenkomstige stukken in de reeks referentiemonsters en σ Ref,i de standaardafwijking van de GR-scores voor de overeenkomstige stukken in de reeks referentiemonsters - berekenen van een ZofZ-score, waarbij de ZofZ-score is gebaseerd op de Z-score, gecorrigeerd door de mediaan (of het gemiddelde) van de Z-scores van een verzameling chromosomen of chromosoomseg menten omvattende doelchromosoom i en gedeeld door een factor die de variabiliteit van de Z-scores meet van een verzameling chromosomen die het doelchromosoom i omvat (standaardafwijking van een meer robuuste versie daarvan, zoals bijv. de mediane absolute afwijking of mad). - vergelijking van de Z-score met een drempelwaarde, en de ZofZ-score met een drempelwaarde, voor het voorspellen van de aanwezigheid of afwezigheid van een aneuploïdie.
In een andere voorkeurdragende uitvoeringsvorm vindt de genoemde voorspelling van de aanwezigheid of afwezigheid van een aneuploïdie plaats via een beslissingsboom die is gebaseerd op een parameter p en secundaire parameters. V. Bepaling van foetale fractie
Afzonderlijk van of naast de bepaling van de aanwezigheid van een aneuploïdie biedt de onderhavige uitvinding ook een of meerdere methodologieën voor het bepalen van de foetale fractie van foetale nucleïnezuren in een monster dat een mengsel van nucleïnezuren van de foetus en van de moeder is. De foetale fractie binnen het monster zal in het algemeen zo laag zijn dat het niet gemakkelijk kan worden bepaald. De foetale fractie in monsters varieert in het algemeen van 4 tot 20% tussen verschillende monsters, met een gemiddelde van ongeveer 10% van de totale genoomfractie.
De onderhavige uitvinding biedt twee verschillende methodologieën voor het definiëren van de foetale fractie in een monster, afhankelijk van de aard van de zwangerschap.
Een eerste methodologie is onafhankelijk van het type zwangerschap of geslacht van de foetus. Dergelijke methodologie is gebaseerd op de aanwezigheid van polymorfismen in het DNA van de moeder (en van de foetus) van het monster. Het is meer in het bijzonder gebaseerd op vooraf gedefinieerde stukken DNA die aanwezig kunnen zijn in het foetaal DNA en afwezig in het DNA van de moeder. Polymorfe plaatsen die zijn opgenomen in de doelnucleïnezuren omvatten, maar zijn niet beperkt tot, enkel-nucleotide polymorfismen (SNP's), tandem SNP's, kleinschalige multi-basis deleties of inserties, genoemde IN-DELs (ook deletie insertie polymorfismen of DIP's genoemd), multi-nucleotide polymorfismen (MNP's), kopienummervariaties (CNV's) en korte tandemherhalingen (STR's). In een meest voorkeurdragende uitvoeringsvorm zijn de polymorfismen CNV's. In een eerste stap is het monster gesequencet zoals hierboven beschreven en worden aflezingen in kaart gebracht tegenover een referentiegenoom.
In een latere stap wordt het aantal sequenties die aligneren met elk van een vooraf bepaalde reeks polymorfismen geteld. Optioneel kan dit worden verkregen door toewijzing van de verkregen sequentieaflezingen aan elk van de genoemde vooraf gedefinieerde polymorfismen. De genoemde vooraf gedefinieerde reeks polymorfismen worden begrepen als een verzameling van polymorfismen die zijn geïdentificeerd en waarvan wordt aangenomen dat ze relevant zijn voor de bepaling van de foetale fractie.
De genoemde reeks polymorfismen zijn bij voorkeur goedaardige polymorfismen die vaak voorkomen in de populatie. In een voorkeurdragende uitvoeringsvorm omvat de genoemde reeks CNV's. Dergelijke CNV's kunnen variabel zijn in grootte, in een voorkeurdragende uitvoeringsvorm hebben de genoemde CNV's een lengte tussen 10 kb en 1 Nb, meer bij voorkeur tussen 10 kb en 100 kb. Alternatief zijn genoemde CNV's ook 2 bp en 10 Mb lang. Hierin verwijst kb naar kilobaseparen (d.w.z. 1000 baseparen) en verwijst Mb naar megabasisparen (d.w.z. 1000000 baseparen).
In een andere voorkeurdragende uitvoeringsvorm omvat de genoemde reeks polymorfismen aanvullende gegevens die zijn verbonden met de polymorfismen binnen de genoemde reeks. In een voorkeurdragende uitvoeringsvorm omvatten de genoemde gegevens een of meerdere attributen van elk polymorfisme. De genoemde attributen kunnen een correctiefactor voor elk polymorfismen omvatten, maar zijn daar niet toe beperkt, waarbij de genoemde correctiefactor een link biedt tussen tellingen van aflezingen voor het genoemde polymorfisme en de werkelijke foetale fractie. Dit laatste laat een eenvoudige correctie toe van de verkregen aflezingen overeenkomstig een polymorfisme binnen een monster waardoor een schatting wordt verkregen van de foetale fractie of de werkelijke foetale fractie.
De genoemde attributen kunnen een drempelwaarde per polymorfisme omvatten dat toelaat te identificeren of het genoemde polymorfisme, indien het aanwezig is in een monster, in aanmerking komt als informatief polymorfisme.
In een voorkeurdragende uitvoeringsvorm zijn de genoemde attributen bepaald met behulp van een reeks waarden waarvoor de foetale fractie gekend is. Deze monsters zouden bijv. zwangerschappen van jongens (waarvoor de foetale fractie kan worden bepaald met behulp van aflezingen afkomstig van het X- of Y-chromosoom, zoals hieronder wordt beschreven), of anders monsters kunnen zijn waarvoor de foetale fractie was bepaald met behulp van orthogonale methodes (gebaseerd op epigenetiek of gerichte sequencing of digitale PCR).
In een uitvoeringsvorm zijn de genoemde reeks polymorfismen en attributen vooraf gedefinieerd. In een andere uitvoeringsvorm kunnen de genoemde reeks polymorfismen en attributen door de gebruiker gedefinieerd zijn.
In een latere stap wordt de verkregen telling van aflezingen - of een afgeleide daarvan - voor elk polymorfisme gebruikt voor het identificeren of het bepaalde polymorfisme informatief is in het monster. Dergelijke informatieve polymorfismen zijn in het algemeen de polymorfismen die een lager aantal aflezingen hebben dan een bepaalde drempelwaarde, waarbij de drempelwaarde overeenkomt met een theoretisch verwacht aantal aflezingen gezien het totale aantal aflezingen voor het monster, of een afgeleide daarvan. Er wordt aangenomen dat het lagere aantal geobserveerde aantal aflezingen voor dergelijke informatieve polymorfismen te wijten is aan de aanwezigheid ervan in het foetale genoom en niet in het genoom van de moeder. Het aantal aflezingen - of een afgeleide daarvan - moet bij voorkeur lager zijn dan de helft van het theoretisch verwachte aantal aflezingen, aangezien dit zou betekenen dat het polymorfisme niet aanwezig is in 1, 2 of meerdere kopieën in het genoom van de moeder en bijgevolg enkel aanwezig is in het foetale genoom. Op basis van deze informatieve polymorfismen kan een schatting van de foetale fractie worden gemaakt door aan te nemen dat de verkregen telling van aflezingen rechtstreeks is gecorreleerd met de foetale fractie. In een voorkeurdragende uitvoeringsvorm wordt de foetale fractie berekend door eerst het corrigeren van de verkregen telling van aflezingen voor elk informatief polymorfisme met behulp van de polymorfisme attributen ervan, en vervolgens het nemen van de mediaan of het gemiddelde van de gecorrigeerde tellingen van aflezingen over alle informatieve polymorfismen. Een monster moet ten minste één informatief polymorfisme hebben om de foetale fractie te kunnen schatten. De foetale fractie van monsters waarvoor geen informatief polymorfisme was geïdentificeerd, kan worden geschat met behulp van alternatieve methoden, op voorwaarde dat het monster was afgenomen van een mannelijke foetus (zie hieronder).
In een uitvoeringsvorm wordt de fractie van foetale nucleïnezuren in het mengsel van nucleïnezuren van de foetus en van de moeder berekend voor elk van de informatieve polymorfismen. In een eerste stap wordt het verwachte aantal voor het informatieve polymorfisme bepaald op basis van de genormaliseerde tellingen (genormaliseerd naar bijv. 10 000 000) verkregen van het genoemde monster. Op basis van de verwachte tellingen (d.w.z. het aantal aflezingen dat men zou verwachten voor het polymorfisme, gezien het totale aantal aflezingen verkregen voor het monster, en optioneel gecorrigeerd met een polymorfismespecifieke attribuut), wordt vervolgens een schatting van de foetale fractie van het testmonster afgeleid.
In een uitvoeringsvorm kan deze schatting worden bepaald voor elk informatief polymorfisme, met behulp van de formule 2 x 100 x geobserveerde tellingen voor het informatieve polymorfisme / verwachte tellingen voor het informatieve polymorfisme.
De verwachte telling is het aantal aflezingen dat men zou verwachten voor het polymorfisme, gezien het totale aantal aflezingen verkregen voor het monster, en optioneel gecorrigeerd met een polymorfismespecifieke attribuut. Dit polymorfismespecifieke attribuut of deze factor kan worden afgeleid voor elk polymorfisme in de genoemde reeks polymorfismen met behulp van een reeks monsters waarvoor de foetale fractie gekend is met behulp van alternatieve methodes (bijv. voor mannelijke foetussen met behulp van tellingen van aflezingen op chromosoom X of Y).
In een uitvoeringsvorm kan de werkelijke foetale fractie als volgt worden berekend:
Werkelijke foetale fractie = geschatte foetale fractie x factor.
Het percentage foetale fractie wordt berekend voor ten minste 1, ten minste 2, ten minste 3, ten minste 4, ten minste 5, ten minste 6, ten minste 7, ten minste 8, ten minste 9, ten minste 10, ten minste 11, ten minste 12, ten minste 13, ten minste 14, ten minste 15, ten minste 16, ten minste 37, ten minste 18, ten minste 19, ten minste 20, ten minste 25, ten minste 30, ten minste 35, ten minste 40 of meer informatieve polymorfismen. In een uitvoeringsvorm zal de foetale fractie worden bepaald door het gemiddelde of de mediane foetale fractie zoals bepaald door elke individuele informatieve polymorfismen. In een uitvoeringsvorm is de foetale fractie de gemiddelde of mediane foetale fractie bepaald voor ten minste 1, 2 of 3 informatieve polymorfismen.
De bepaling van de foetale fractie in een monster van een zwangere vrouw wordt in het algemeen verkregen door het verkrijgen van tellingen van aflezingen van een of meerdere polymorfismen in een monster, en het bepalen of een polymorfisme informatief is op basis van deze tellingen van aflezingen en polymorfismespecifieke attributen, waarbij de telling van aflezingen van elk informatief polymorfisme is gerelateerd met de geschatte foetale fractie.
In een uitvoeringsvorm van de onderhavige uitvinding wordt de genoemde foetale fractie in een monster als volgt bepaald: - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; - het tellen van het aantal sequenties die aligneren met een vooraf gedefinieerde reeks polymorfismen - het vergelijken van het verkregen aantal sequenties met het verwachte aantal sequenties voor elke polymorfe plaats voor het identificeren van de informatieve polymorfe plaats(en) voor het monster; - het berekenen op basis van het verkregen aantal sequenties voor de genoemde informatieve polymorfe plaats(en) van een hoeveelheid, waarbij de genoemde hoeveelheid een indicatie is voor de foetale fractie.
De genoemde hoeveelheid wordt berekend met behulp van lineaire schaling op basis van informatieve polymorfismespecifieke attributen.
In één uitvoeringsvorm worden de genoemde sequenties verkregen door sequencing van de volgende generatie. In een andere voorkeurdragende uitvoeringsvorm is de genoemde sequencingwerkwijze een willekeurige lage-dekking, willekeurige sequencingwerkwijze.
De genoemde polymorfismen zijn bij voorkeur kopieaantalvariaties met een grootte tussen 100 bp en 1 Mb, of tussen 1 kb en 1 Mb, of tussen 2 bp en 10 Mb.
De genoemde foetale fractie kan dienen als een interne kwaliteitscontrole van het monster en bijgevolg een andere secundaire parameter opleveren die wordt verkregen uit het genoemde monster.
In een andere uitvoeringsvorm van de onderhavige uitvinding is een werkwijze voor het bepalen van de foetale fractie gebaseerd op gevallen waarin een mannelijke zwangerschap (d.w.z. de zwangere vrouw draagt een mannelijke foetus) was geïdentificeerd. Als een mannelijke zwangerschap is gedetecteerd, kan de foetale fractie worden bepaald op basis van aflezingen die zijn uitgelijnd met het Y-chromosoom. Het X- en Y-chromosoom hebben gewoonlijk gebieden die gelijkaardig zijn tussen het X- en Y-chromosoom, Pseudo-Autosomale-Gebieden (PAR, pseudo-autosomal-regions) genoemd. Aangezien het Y-chromosoom klein is, is de invloed van deze PAR-gebieden sterk, aangezien slechts een kleine hoeveelheid van de aflezingen zal worden toegewezen aan specifieke gebieden binnen het Y-chromosoom. De invloed van PAR op het X-chromosoom is minder belangrijk omwille van de grootte van het X-chromosoom.
In een eerst stap worden deze gebieden die uniek zijn voor het X- of Y-chromosoom (buiten de PAR-gebieden) gedefinieerd. Aflezingen gericht tegen deze unieke X- en/of Y-chromosoomgebieden worden geteld en de foetale fractie wordt bepaald op basis van de unieke X- en/of Y-chromosoomgebieden (of een afgeleide van deze aflezingen, zoals genormaliseerde aflezingen).
Op basis van de X-chromosomen kan de foetale fractie worden bepaald als tweemaal het verschil op het 50 kb-stukniveau tussen het mediane aantal aflezingen toegewezen aan de autosomen en het mediane aantal aflezingen toegewezen aan chromosoom X, gedeeld door het mediane aantal aflezingen toegewezen aan de autosomen. Dit kan als de volgende formule worden geschreven:
Als tweede kan de foetale fractie ook worden geschat op basis van het Y-chromosoom aangezien alle aflezingen die betrekking hebben op het chromosoom Y in theorie afkomstig moeten zijn van het foetale DNA. De foetale fractie op basis van chromosoom Y wordt gedefinieerd als tweemaal het mediane aantal GC-gecorrigeerde aflezingen toegewezen aan Y over het mediane aantal GC-gecorrigeerde aflezingen toegewezen aan de autosomen, of in een formule:
De onderhavige uitvinding biedt eveneens een computerprogrammaproduct omvattende een door de computer leesbaar medium dat is gecodeerd met meerdere instructies voor het controleren van een computersysteem voor het uitvoeren van een bewerking van het bepalen of schatten van de foetale fractie in een biologisch monster dat is verkregen uit een zwangere vrouw volgens de onderhavige uitvinding. De bewerking omvat meer in het bijzonder de volgende stappen: - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; - het tellen van het aantal sequenties die aligneren met een vooraf gedefinieerde reeks polymorfismen - het vergelijken van het verkregen aantal sequenties met het verwachte aantal sequenties voor het identificeren van de informatieve polymorfe plaats(en) voor het monster; en - het berekenen op basis van het verkregen aantal sequenties voor de genoemde informatieve polymorfe plaats(en) van een hoeveelheid, waarbij de genoemde hoeveelheid een indicatie is voor de foetale fractie. VI Geslachtsbepaling
Geslachtsbepaling kan gebeuren door het bepalen van gebieden die informatief of indicatief zijn voor mannelijke zwangerschappen. Deze gebieden kunnen worden gedefinieerd door te kijken in een gegevensreeks omvattende sequencinggegevens van mannelijke gegevensreeksen. Gebieden die statistisch indicatief zijn voor mannelijke zwangerschappen worden later weerhouden.
De aflezingen voor een of meerdere informatieve gebieden - die gewoonlijk op het Y-chromosoom liggen - worden verkregen uit het geanalyseerde monster en vergeleken met een vooraf gedefinieerde drempelwaarde. Als het totaal aantal aflezingen over alle geselecteerde gebieden in een testmonster hoger is dan een eerste drempelwaarde, is het hoogstwaarschijnlijk een mannelijke zwangerschap. Anderzijds, als het totaal aantal aflezingen over alle geselecteerde gebieden in een testmonster lager is dan een tweede drempelwaarde, is het hoogstwaarschijnlijk een vrouwelijke zwangerschap. Als het totaal aantal aflezingen over alle geselecteerde gebieden in een testmonster ligt tussen de eerste en de tweede drempelwaarde, kan het geslacht niet worden bepaald (dit zou het geval kunnen zijn van "vanishing twins"). Door de juiste selectie van de gebieden, de eerste en de tweede drempelwaarden, zou de werkwijze minder gevoelig zijn voor afwijkingen die het resultaat zijn van vanishing twins (in het bijzonder in het geval van jongens). VII Toolbox en kit
De methodologieën zoals hierboven beschreven worden bij voorkeur allemaal door een computer geïmplementeerd. Daarom heeft de onderhavige uitvinding eveneens betrekking op een computerprogrammaproduct omvattende een door de computer leesbaar medium dat is gecodeerd met meerdere instructies voor het sturen van een computersysteem voor het uitvoeren van een bewerking voor het uitvoeren van prenatale diagnose van een foetale aneuploïdie en/of het screenen voor foetale aneuploïdieën en/of de bepaling van de foetale fractie in een biologisch monster dat is verkregen van een zwangere vrouw, waarbij het biologische monster nucleïnezuurmoleculen omvat.
Met betrekking tot de bepaling van de aan- of afwezigheid van een aneuploïdie in een monster omvat de bewerking de stappen van: - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; - het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor tellingen van aflezingen worden verkregen; - het normaliseren van de genoemde tellingen van aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score van de genoemde genormaliseerde aflezingen en een verzameling van scores afgeleid van de genoemde genormaliseerde aflezingstellingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van het genormaliseerde aantal aflezingen voor een reeks chromosomen of chromosoomsegmenten die het chromosomaal doelsegment of chromosoom omvatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores.
In een voorkeurdragende uitvoeringsvorm stelt de genoemde parameter een verhouding voor tussen: * een eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de verzameling scores.
Met betrekking tot de bepaling van de foetale fractie in een biologisch monster omvat de bewerking de stappen van: - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; - het tellen van het aantal sequenties die aligneren met een vooraf gedefinieerde reeks polymorfismen - het vergelijken van het verkregen aantal sequenties met het verwachte aantal sequenties voor het identificeren van de informatieve polymorfe plaats(en) voor het monster; en - het berekenen op basis van het verkregen aantal sequenties voor de genoemde informatieve polymorfe plaats(en) van een hoeveelheid, waarbij de genoemde hoeveelheid een indicatie is voor de foetale fractie.
In een andere uitvoeringsvorm kan de genoemde foetale fractie worden bepaald in geval van een mannelijke zwangerschap op basis het Y-chromosoom.
De genoemde bewerkingen omvatten de stappen van - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; - het bepalen van het geslacht van de genoemde foetus; waarbij als de genoemde foetus mannelijk is: * het aligneren van de genoemde verkregen sequenties met een referentiegegevensbank; * het identificeren en tellen van aflezingen die zich specifiek in niet-PAR-gebieden van het X- en/of Y-chromosoom bevinden; * het berekenen op basis van de genoemde tellingen van aflezingen van een hoeveelheid, waarbij de genoemde hoeveelheid een indicatie is voor de foetale fractie.
De genoemde bewerkingen kunnen worden uitgevoerd door een gebruiker of beroepskracht in een omgeving weg van de locatie waar het monster is afgenomen en/of de natte labprocedure, die de extractie is van de nucleïnezuren uit het biologische monster en de sequencing.
De genoemde bewerkingen kunnen worden geleverd aan de gebruiker door middel van aangepaste software die moet worden geïnstalleerd op een computer, en kan worden opgeslagen in de cloud.
Na de vereiste of gewenste bewerking uitgevoerd te hebben, zal de beoefenaar of gebruiker een rapport of score krijgen, waarbij het genoemde rapport of de genoemde score informatie geeft over het kenmerk dat is geanalyseerd. Een rapport omvat bij voorkeur een link naar een patiënt of monster-ID dat is geanalyseerd. Het genoemde rapport of de genoemde score geeft informatie over de aan- of afwezigheid van een aneuploïdie in een monster, waarbij de genoemde informatie is verkregen op basis van een parameter die is berekend door de bovengenoemde methodologie. Het rapport kan ook informatie geven over de aard van de aneuploïdie (indien gedetecteerd, bijv. grote of kleine chromosomale afwijkingen) en/of de kwaliteit van het monster dat is geanalyseerd.
De genoemde beoefenaar of gebruiker kan ook informatie krijgen over de foetale fractie, waarbij de genoemde foetale fractie is bepaald door een van methodologieën van de onderhavige uitvinding.
In een andere uitvoeringsvorm kan de genoemde beoefenaar of gebruiker, op basis van het rapport, informatie krijgen over het geslacht van de foetus.
Het zal duidelijk zijn voor een vakman dat de bovengenoemde informatie in één rapport kan worden voorgesteld aan een beoefenaar.
De bovengenoemde bewerkingen zijn bij voorkeur deel van een digitaal platform dat de moleculaire analyse van een monster toelaat door middel van verscheidene door de computer geïmplementeerde bewerkingen.
De onderhavige uitvinding omvat in het bijzonder ook een visualisatie-instrument, dat aan de gebruiker of beoefenaar toelaat de verkregen resultaten evenals de onbewerkte gegevens te visualiseren die in het systeem zijn ingegeven. In een uitvoeringsvorm omvatten de genoemde visualisaties een venster per chromosoom, dat het chromosoom toont dat is geanalyseerd, dat aflezingen per gebied of een score toont die daarvan is afgeleid en de scores en/of parameters die zijn berekend. Door aan de beoefenaar of gebruiker de berekende scores of parameter te tonen samen met de visuele voorstelling van de tellingen van aflezingen, kan een gebruiker een aanvullende controle of beoordeling van de verkregen resultaten uitvoeren. Door aan de gebruiker toe te laten de gegevens in te kijken, zullen gebruikers verbeterde beslissingsregels en drempels kunnen definiëren.
Bovendien wordt een aanvullende controle toegevoegd, aangezien de visuele gegevens per chromosoom aan de gebruiker toelaten voor elke chromosoom te evalueren of de geautomatiseerde classificatie juist is. Dit voegt een aanvullende veiligheidsparameter toe.
In een voorkeurdragende uitvoeringsvorm wordt het genoemde platform en het genoemde visualisatie-instrument voorzien met algoritmen die rekening houden met het feit dat bepaalde gebieden meer aflezingen opleveren (omwille van een terugkerende technische afwijking die sommige gebieden van het genoom altijd over- of ondervertegenwoordigd maakt). Correctiemetingen kunnen worden gegeven voor deze oververtegenwoordiging door een vergelijking te maken met een referentiereeks (die idealiter wordt verwerkt met behulp van hetzelfde of een gelijkaardige protocol) en plotting van bijv. Z-scores of alternatieve scores die de kans op bepaalde observaties onder de veronderstelling van aneuploïdie voorstellen. Standaard visualisatie-instrumenten tonen enkel tellingen van aflezingen, en laten niet toe de terugkerende technische afwijking te corrigeren.
Tot slot, op basis van de link tussen de verkregen sores en/of parameters en de visuele gegevens per chromosoom, kan een gebruiker of beoefenaar beslissen de drempelwaarde te veranderen die is gebruikt voor het definiëren van de aanwezigheid van een aneuploïdie. De gebruiker kan bijgevolg beslissen te streven naar een hogere gevoeligheid (bijv. minder stringent te zijn inzake de stijging/daling van de parameter of scores) of hogere specificiteit (bijv. door meer stringent te zijn inzake de stijging/daling van parameter of scores).
Het platform kan voorzien zijn van andere kenmerken, die een nauwkeurigere analyse bieden van de moleculaire gegevens die zijn verkregen van het biologische monster.
Zoals eerder vermeld, laat de methodologie en het platform een bepaalde vrijheidsgraad aan de gebruiker toe. Naast het definiëren van eigen drempelwaarden en drempels, kan de gebruiker ook eigen referentiereeksen van genomen definiëren, om te worden gebruikt voor het berekenen van de scores en/of andere informatie zoals de foetale fractie, de bepaling van het geslacht, enz. Door zijn/haar eigen referentie reeks te gebruiken kan een gebruiker beter de terugkerende technische variatie van het lab detecteren (verschillende natte labreagentia en protocol, verschillend NGS-instrument en platform, verschillende operator, verschillende ...) en bijgevolg een beter geschikte referentiegegevensreeks hebben voor het bepaalde lab. Om te zorgen voor de robuustheid van een nieuwe referentiereeks, worden methodologieën voorzien voor het verwijderen van uitschieters uit de referentiereeks. Bijv. als 100 referentiemonsters worden gebruikt in een referentiereeks, zullen er 100 referentiereeksen zijn voor elke 50 kb bin. Als een bepaald vooraf gedefinieerd percentage van uitschieters verwijderd wordt (bijv. 5% van de resultaten) kan de referentiereeks robuuster worden gemaakt voor variatie in de referentiereeks.
In een uitvoeringsvorm wordt een werkwijze voorzien voor het uitvoeren van CNV-calling. Met de term 'CNV calling' wordt een methodologie bedoeld die de grenzen van een CNV of een segmentale aneuploïdie bepaalt. De genoemde grenzen moeten worden geïnterpreteerd als de benaderende chromosomale coördinaten.
Deze grenzen worden later gebruikt voor kruisreferentie met CNV-referentiegenoomgegevensbanken die eerder geobserveerde CNV's bevatten (optioneel geannoteerd, bijv. goedaardig of pathogeen). CNV calling kan worden uitgevoerd door verscheidene methodologieën. Sommige daarvan werden ontwikkeld in het array-CGH veld (waar één of aangrenzende reeks van eCGH sonde(s) kan worden overwogen als het equivalent van een bin), andere zijn specifieker voor NGS-gegevens.
In een andere uitvoeringsvorm laat het genoemde platform CNV-kwantificering toe. Met de term CNV-kwantificering wordt bedoeld de bepaling van het absolute aantal kopieën (of het verwachte bereik) van de geobserveerde CNV. Dit laatste laat de bepaling toe of een CNV eerder van de moeder komt (erg hoge waarde) of eerder van de foetus (erg lage waarde). De genoemde CNV-kwantificering gebeurt bij voorkeur na CNV calling. In een andere, meer voorkeurdragende uitvoeringsvorm houdt de genoemde CNV calling rekening met kennis op de celvrije fractie.
In een uitvoeringsvorm laat het genoemde platform CNV- handtekeningherkenning toe. Met de term 'CNV handtekeningherkenning' wordt een methodologie bedoeld voor het bepalen of een specifieke combinatie van CNV's (en de hoeveelheid ervan) aanwezig is in een monster. CNV handtekeningherkenning wordt bij voorkeur uitgevoerd na CNV calling en CNV kwantificering.
Alle bovengenoemde methodologieën maken gebruik van een of meerdere CNV-referentiegenoomgegevensbanken die gekende CNV's bevatten. De bovengenoemde methodologieën kunnen gebaseerd zijn op de uitlijning van sequenties die zijn verkregen uit een biologisch monster tegenover de genoemde een of meerdere CNV-referentiegegevensbanken, of anders het aligneren van de sequenties die zijn verkregen van een biologisch monster tegenover een referentiegenoom en later het identificeren van de aflezingen die zijn uitgelijnd tegenover specifieke interessante gebieden (d.w.z. de gebieden die zijn geïdentificeerd als CNV's in de CNV-referentiegegevensbanken). Koppeling met dergelijke referentiegegevensbanken laat de identificatie toe van CNV's die (waarschijnlijk) pathogeen zijn en bijgevolg wordt de (klinische) nauwkeurigheid verhoogd: als een CNV wordt geobserveerd, en het bevat een (waarschijnlijk) pathogeen gebied, zou het zeer relevant kunnen zijn en verdere opvolging van de patiënt kunnen vereisen.
Het platform volgens de onderhavige uitvinding laat een hoge vrijheidsgraad voor de gebruiker of beroepskracht toe. Het genoemde platform zal bij voorkeur compatibel zijn met verschillende gegevensformaten zoals fastq-, fastq.gz-, bel- en bam-bestanden. In een verdere uitvoeringsvorm kan het genoemde platform gegevensformaten omvatten die rechtstreeks gestreamd zijn van het sequencingplatform dat wordt gebruikt (bijv. NGS-instrument). Dit laatste vermindert de wachttijd sterk voor gegevensupload aangezien de upload gelijktijdig met de sequencingreactie plaatsvindt. De totale tijd-tot-resultaat zal bijgevolg worden geoptimaliseerd, hetgeen voordelig is voor de gebruiker.
In een uitvoeringsvorm is het genoemde platform compatibel met sequencinggegevens van verschillende bronnen, waaronder SNRT (enkel-molecule real-time) sequencinggegevens. Algoritmen kunnen aanwezig zijn die de verwerking toelaten van SMRT-gegevens (zoals bijv. PacBio) en epigenetische informatie afleiden (bijv. methylatie of andere modificaties) van de genoemde SMRT-gegevens. Dit laatste laat opnieuw identificatie toe van parameters die de detectie van aneuploïdie aangeven of zouden kunnen helpen bij de bepaling van de foetale fractie, of het bepalen van kwaliteitsmetriek.
Het platform volgens de onderhavige uitvinding is inherent compatibel met veel verschillende types NGS-bibliotheekbereidingskits en protocollen en NGS-sequencingplatform. Dit is een voordeel aangezien een gebruiker niet zal moeten investeren in speciaal NGS-sequencingplatform of NGS-bibliotheekbereidingskits die specifiek zijn voor een specifieke toepassing, maar de gebruiker kan in plaats daarvan het voorkeurdragende platform en de voorkeurdragende kit gebruiken. Bovendien biedt het aan een gebruiker een bepaalde graad van flexibiliteit met betrekking tot het materiaal dat moet worden gebruikt. Als nieuwere of goedkopere instrumenten of kits beschikbaar worden, zal een gebruiker gemakkelijk kunnen veranderen.
Zoals hierboven vermeld, is de onderhavige methodologie compatibel met celvrij DNA dat is geëxtraheerd uit verschillende soorten biologische monsters, waaronder bloed, speeksel, blastocoel fluïdum en urine. Het gebruik van urine of speeksel in plaats van bloed zou een echt niet-invasief monstertype bieden en laat bijv. testen thuis en verzending van het monster naar het testlabo toe. Dit is duidelijk een extra voordeel vergeleken met andere werkwijzen voor het verkrijgen van monsters zoals het afnemen van bloed.
Voorbeelden
Bereiding en seauencina van het monster
1. Bloedafname, scheiding van plasma en extractie van celvrij DNA Eén proefbuisje (10 ml) van bloed van de moeder wordt verzameld in Streck-proefbuisjes en bewaard bij 4°C. Het bloed wordt afgenomen via een standaard flebotomieprocedure.
Het plasma (+/- 5 ml) wordt maximum 72 uur gescheiden na de afname van het bloed door de standaard dubbele centrifugatiemethode: • Het bloedmonster wordt gecentrifugeerd bij 2000xg gedurende 20 minuten (dit kan plaatsvinden bij kamertemperatuur), zonder het gebruik van de rem. • Het plasma wordt dan overgebracht naar hetzij drie 1,5 ml lage bindingsproefbuisjes, hetzij één enkel 5 ml lage bindingsproefbuisje. Een tweede centrifugatie bij 13000xg gebeurt gedurende 2 minuten (dit kan plaatsvinden bij kamertemperatuur). • Het plasma wordt overgebracht naar steriele 1,5 ml of 5 ml lage bindingsproefbuisjes voor opslag bij -20°C voorafgaand aan de extractie van celvrij DNA (cfDNA).
De vaalgele coatingslaag kan optioneel worden bewaard voor latere tests. Genomisch DNA van de moeder van de vaalgele coatinglaag kan onderzocht worden om afwijkingen van de moeder te bevestigen of uit te sluiten.
Het celvrije DNA wordt geëxtraheerd uit het plasma met behulp van de QIAamp Circulating Nucleic Acid Kit (Qiagen) volgens de aanbevelingen van de fabrikant, met een uiteindelijk elutievolume van 60 pi. De DNA-monsters worden bewaard bij -20°C wanneer ze niet onmiddellijk worden gebruikt voor bibliotheekbereiding. 2. cfDNA-kwantificerina
Het geëxtraheerde cfDNA wordt gekwantificeerd met behulp van een Qubit-fluorometer. De concentratie van het celvrije DNA bedraagt gewoonlijk 0,1-1 ng/pl. 3. Bibliotheekbereidina 25 μΙ van het geëxtraheerd cfDNA wordt gebruikt als startmateriaal voor bibliotheekbereiding.
Tijdens de bibliotheekbereiding worden de DNA-monsters aangepast voor volgende-generatie sequencing. Adaptors worden toegevoegd aan de uiteinden van de DNA-fragmenten.
De sequencingbibliotheken worden bereid met behulp van de TruSeq ChlP-bibliotheekbereidingskit (Illumina) met bepaalde aanpassingen van het protocol van de fabrikant door het verlagen van de reagensvolumes om de generatie van sequencingbibliotheken toe te laten met behulp van lage starthoeveelheden van DNA.
Het protocol voor bibliotheekbereiding kan als volgt worden samengevat: (Opmerking: De korrelgebaseerde grootteselectie voor het verwijderen van grote DNA-fragmenten en het verwijderen van kleine DNA-fragmenten beschreven in het protocol wordt NIET gebruikt.)
Eindherstellina van de DNA-fraamenten: 1. Voeg 5 μΙ Hersuspensiebuffer en 20 μΙ eindherstellingsmix toe aan het 25 μΙ startmateriaal (totaal = 50 μΙ)
De korrelgebaseerde grootteselectie voor het verwijderen van grote DNA-fragmenten en het verwijderen van kleine DNA-fragmenten beschreven in het protocol wordt NIET gebruikt.
2. Incubeer gedurende 30 minuten op 30°C 3. Voeg 80 μΙ onverdunde AMPure-korrels toe aan het 50 μΙ monstermengsel na eindherstelling. 4. Was de korrels tweemaal met 190 μΙ 80% EtOH. 5. Suspendeer de gedroogde pellet opnieuw met 10 μΙ hersuspensiebuffer.
Breng 9 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje.
Adenvlatie van de 3'-uiteinden 1. Voeg 6,25 μΙ A-staart mix toe
2. Verwarm gedurende 30 minuten bij 37°C + 5 minuten bij 70°C
Liaatie van de geïndexeerde aepaard-uiteinde adaptors met het DNA 1. Adaptors worden l/2e verdund met hersuspensiebuffer => voeg 2,5 μΙ toe aan het monster
2. Voeg 1,25 μΙ ligatiemix toe (geen hersuspensiebuffer). Incubeer gedurende 30 minuten op 30°C 3. Voeg 2,5 μΙ stopligatiebuffer toe 4. Voeg 21 μΙ AMPure toe voor reiniging 5. Was de korrels tweemaal met 190 μΙ 80% EtOH. 6. Suspendeer de gedroogde pellet opnieuw in 27 μΙ hersuspensiebuffer. Breng 25 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje. 7. Voeg 25 μΙ AMPure toe voor reiniging 8. Was de korrels tweemaal met 190 μΙ 80% EtOH. 9. Suspendeer de gedroogde pellet opnieuw in 12,5 μΙ hersuspensiebuffer. Breng 10 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje.
Verrijken van DNA-fraamenten 1. Bereid de PCR-mix voor door 2,5 μΙ PCR Primer Cocktail en 12,5 μΙ PCR Master Mix te mengen voor elk monster. 2. PCR-condities: 98°C gedurende 30 seconden 15 cycli van:
98°C gedurende 10 seconden 60°C gedurende 30 seconden 72°C gedurende 30 seconden 72°C gedurende 5 seconden houden op 4°C 3. Voeg 25 μΙ AMPure toe voor reiniging 4. Was de korrels tweemaal met 190 μΙ 80% EtOH. 5. Suspendeer de gedroogde pellet opnieuw in 32,5 μΙ hersuspensiebuffer. Breng 30 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje. 6. Gebruik 2 μΙ van het monster voor Qubit-kwantificering en 2 μΙ voor fragmenta na lyse (zie volgende deel). 4. Kwaliteitscontrole van bibliotheek
Goede celvrije DNA-isolatie en NGS-bibliotheekbereiding worden getest door het analyseren van elke bibliotheek op de fragmentanalyser (Advanced Analytical Technologies Ine., Duitsland) voorafgaand aan sequencing, voor de beoordeling van: • de grootteverdeling (geschikte grootteprofiel bevestigen met behulp van concentratie, piekverhouding, piekhoogte, ...), • de kwaliteit van de bibliotheek. Monsters bevattende fragmenten met een hoog moleculair gewicht zullen worden ingedeeld als monsters die in aanmerking komen voor sequencing (geeft contaminatie aan met genomisch DNA van de moeder).
Typische bibliotheken vertonen een smalle grootteverdeling met een piek op ongeveer 300-350 bp.
Daarnaast wordt een Qubit-kwantificeringsstap uitgevoerd zodat de verrijkingsreactie zal plaatsvinden met de geschikte hoeveelheid van ingebracht DNA-materiaal. De concentratie van DNA bedraagt gewoonlijk 15-30 ng/pl. 5. Bibliotheken normaliseren en groeperen
Monsters worden geïndexeerd tijdens bibliotheekbereiding en tot 24 monsters worden genormaliseerd en gegroepeerd in gelijke volumes voor multiplex sequencing over beide banen van een Illumina HiSeq2500 stroomcel. 6. NGS-run
Sequencing wordt uitgevoerd op de HiSeq 2500 (Illumina) in Snelle Runmodus waarbij 50 bp enkel-uiteinde aflezingen worden geproduceerd.
Detectie van een aneuploïdie in een biologisch monster: validatie van de methodologie • Mapping en filtering van de toegekende aflezingen
De 50 bp enkel-uiteinde sequentieaflezingen van een testmonster worden toegewezen aan het referentiegenoom GRCh37.75 met BWA-backtrack. Met Picard tools worden gedupliceerde aflezingen verwijderd en gebaseerd op de mappingkwaliteit worden aflezingen die verwijzen naar meerdere locaties genegeerd. Ook aflezingen die suboptimaal verwijzen naar meerdere locaties worden verwijderd. Om de variabiliteit van monsters te reduceren weerhouden we enkel de aflezingen die perfect overeenkomen met het referentiegenoom (d.w.z. er zijn geen mismatches en geen openingen toegelaten). Tot slot worden ook aflezingen die in een intern opgestelde lijst van gebieden op de zwarte lijst vallen, verwijderd. Deze gebieden op de zwarte lijst omvatten gewone polymorfe CNV's, collapsed repeats, DAC zwarte-lijst gebieden gegenereerd voor het ENCODE-project en het ongedefinieerde deel van het referentiegenoom (d.w.z. d eNs). * Berekenen van genomische voorstelling
Het referentiegenoom is onderverdeeld in stukken van 50 kb en het aantal aflezingen van het testmonster wordt geteld per stuk. Deze tellingen van aflezingen worden gecorrigeerd volgens de GC-gehaltes van de stukken met lokaal gewogen spreidingsdiagramafvlakking (Loess-regressie). Deze GC-gecorrigeerde aflezingstellingen worden dan gedeeld door de totale som van alle autosomale GC-gecorrigeerde aflezingstellingen en vermenigvuldigd met 107. Dit wordt gedefinieerd als de genomische voorstellingen (GR) per stuk. Op deze per-stuk GR-waarden wordt een schuifvenster toegepast en de som van deze GR-waarden wordt bepaald voor alle opeenvolgende 100 stukken. De vensters worden elk in de tijd verschoven met 1 stuk (d.w.z. 50 kb). Op deze manier wordt een GR-waarde verkregen per venster van 5 Mb. Zo ook wordt voor elke autosoom de som van de per-stuk GR-waarden berekend, om een GR-waarde te verkrijgen voor elke autosoom in het testmonster. * Vergelijking met een referentiereeks
In een referentiereeks van 100 normale monsters (50 mannelijke en 50 vrouwelijke zwangerschappen) worden de GR-waarden berekend voor alle autosomen en voor alle vensters van 50 Mb zoals hierboven is beschreven. Voor elk autosoom en venster van 5 Mb worden het gemiddelde μ en de standaardafwijking σ van de GR-scores berekend over alle 100 referentiemonsters. Op deze manier kan een Z-score worden berekend voor elk venster en elk autosoom i in een testmonster, gedefinieerd als
waarbij GRt de GR-waarde in het testmonster is voor venster of autosoom i en μ£, σ; het gemiddelde en de standaardafwijking, respectievelijk, van de GR-scores gemeten in de 100 referentiemonsters voor venster of autosoom i.
Op basis van de 22 Z-scores van de autostomen in een testmonster is een ZZ2 score berekend voor elk autosoom als
waarbij de Z-score Zt van autosoom i in het testmonster wordt vergeleken met de mediaan en de standaardafwijking (sd) van de 22 Z-scores verkregen voor alle 22 autosomen in het testmonster.
Als alternatief, wordt een ZofZ-score berekend als
waarbij de Z-score Z{ van chromosoom i in het testmonster wordt vergeleken met de mediaan en de mediane absolute afwijking (mad) van de 22 Z-scores verkregen voor alle 22 autosomen in het testmonster. De ZZ2- en ZofZ-scores kwantificeren de afwijking van de Z-score van het doelautosoom van? alle Z-scores die zijn geobserveerd in het testmonster. Deze robuuste versie van de Z-of-Z-scores maakt geen vooronderstellingen over de aneuploïdie-status van het desbetreffende autosoom en de andere autosomen.
Op basis van de Z-scores berekend voor alle 5 Mb-vensters in het testmonster, wordt de BM-score van elk autostoom / berekend als de mediaan van de Z-scores over alle vensters in het doelautosoom:
waar de mediaan van de Z-scores wordt berekend over alle vensters j op autosoom /'.
Deze BM-score geeft de grootte van de afwijking weer: aneuploïdieën zullen resulteren in hogere BM-waarden, terwijl kleinere, segmentele CNV's minder invloed zullen hebben op de mediaan van de Z-scores en resulteren in lagere BM-scores.
Om een onderscheid te maken tussen afwijkingsgerelateerde BM-scores en verhoogde BM-waarden omwille van ruis in de gegevensreeks, wordt de OM-score voor een autosoom /' berekend als de mediaan van de Z-scores van alle vensters van de andere autosomen:
waarbij de mediaan wordt berekend over alle, absolute Z-scores voor 5 Mb vensters j die zich niet op autosoom /' bevinden.
Tot slot wordt voor elk testmonster een kwaliteitsscore (QS) berekend als
met; over alle autosomen behalve voor de 2 autosomen met de hoogste en de laagste Z-score. Deze score zal testmonsters identificeren met een slechte kwaliteit die resulteren in onbetrouwbare aneuploïdie calling. Een sterk verhoogde QS-score kan ook verwijzen naar DNA-monsters bevattende ten minste een fractie van DNA dat afkomstig is van een tumor.
Voor elk van de hierboven berekende parameters kan een drempelwaarde worden gedefinieerd. Op basis van standaard statistische overwegingen kan men een drempelwaarde van 2, 2,5 of 3 kiezen. In de context van de Z-score betekent dit dat de kans dat het testresultaat normaal is (d.w.z. de verkregen GR-score is gelijkaardig aan de GR-scores voor hetzelfde gebied in de referentiereeks) erg klein is. Om een test specifieker te maken, zou men de drempelwaarde kunnen verhogen. Om een test gevoeliger te maken, zou men de drempelwaarde kunnen verlagen. Deze drempelwaarden kunnen voor elk van de parameters worden bepaald, en kunnen voor elk van de parameters verschillen. Het is bijvoorbeeld denkbaar dat drempelwaarden voor BM en OM worden ingesteld op 1 terwijl ze voor de Z-score en ZZ-score op 3 worden ingesteld. Ook negatieve drempelwaarden kunnen worden gebruikt.
Voorbeeld 1
1.1 ZZ2-berekening voor chromosoom 21 voor monster A
Voor monster A is de mediaan van de Z-scores voor alle chromosomen gelijk aan -0,1641 en is de standaardafwijking gelijk aan 2,494. Voor chromosoom 21 hebben wij een Z-score van 11,147 en dit resulteert in een ZZ2-score van 4,5347, boven de drempel van 3. (Figuur 1)
Deze geautomatiseerde indeling als een abnormaal chromosoom op basis van ZZ2>3 is ook bevestigd door visuele inspectie van de grafiek. Dit monster werd getest met een invasieve test en de trisomie werd bevestigd.
Geen van de andere chromosomen in monster A hebben verhoogde ZZ2-scores (figuur 2).
De grafieken van de Z-scores van deze andere chromosomen zijn ook niet indicatief voor aneuploïdie. Op chromosoom 11 bijvoorbeeld hebben we een ZZ2-score van 0,319 en dit resulteert in de grafiek zoals getoond op figuur 3.
De grafiek op figuur 3 toont de BM-scores van alle autosomen. Dit laatste bevestigt dat het chromosoom 21 sterk afwijkend is, terwijl andere potentiële autosomale afwijkingen minder dan de helft van het chromosoom zullen dekken.
1.2 ZofZ-berekening voor chromosoom 21 voor monster A
Voor monster A is de mediaan van de Z-scores voor alle chromosomen gelijk aan -0,164 en is de mediane absolute afwijking gelijk aan 0,819. Voor chromosoom 21 hebben wij een Z-score van 11,147 en dit resulteert in een ZofZ-score van 13,817, ver boven de drempel van 3. Als we de Z-scores in een grafiek uitzetten, wijst dit duidelijk op trisomie 21 (figuur 9). Dit monster werd getest met een invasieve test en de trisomie werd bevestigd.
Op basis van deze ZofZ-scores en een drempel van 3 zou geen van de andere chromosomen aneuploïdie genoemd worden (figuur 10).
De grafieken van de Z-scores van deze andere chromosomen zijn ook niet indicatief voor aneuploïdie. Op chromosoom 11 bijvoorbeeld hebben we een ZofZ-score van 0,973 en dit resulteert in de grafiek zoals getoond op figuur 11.
1.3 ZZ2-berekenina voor chromosoom 16 voor monster B
In monster B is de mediaan van de Z-scores voor alle chromosomen gelijk aan -0,2651 en is de standaardafwijking gelijk aan 1,464. Voor chromosoom 16 hebben wij een Z-score van 5,754 hetgeen resulteert in een ZZ2-score van 4,111, dat hoger is dan de drempel van 3.
Als de Z-scores in een grafiek worden uitgezet (figuur 5), wijst dit namelijk duidelijk op een trisomie 16. Dit monster werd getest met een invasieve test en de trisomie werd bevestigd.
Geen van de andere chromosomen in monster B hebben verhoogde ZZ2-scores (figuur 6).
De grafieken van de Z-scores van deze andere chromosomen zijn ook niet indicatief voor aneuploïdie. Op chromosoom 1 bijvoorbeeld hebben we een ZZ2-score van -0,459 hetgeen resulteert in de grafiek zoals getoond op figuur 7.
De grafiek van de BM-scores van alle autosomen zoals getoond op figuur 8 bevestigt dat chromosoom 16 sterk afwijkend is, terwijl andere, mogelijk afwijkende autosomale afwijkingen minder dan de helft van het chromosoom zullen dekken.
1.4 ZofZ-berekening voor chromosoom 16 voor monster B
Voor monster B is de mediaan van de Z-scores voor alle chromosomen gelijk aan -0,265 en is de mediane absolute afwijking gelijk aan 0,685. Voor chromosoom 16 hebben wij een Z-score van 5,754 hetgeen resulteert in een ZofZ-score van 8,782, boven de drempel van 3. Als we de Z-scores in een grafiek uitzetten, wijst dit namelijk duidelijk op trisomie 16 (figuur 12). Dit monster werd getest met een invasieve test en de trisomie werd bevestigd.
Op basis van deze ZofZ-scores en een drempel van 3 zou geen van de andere chromosomen aneuploïdie genoemd worden (figuur 13).
De grafieken van deze andere chromosomen zijn ook niet indicatief voor aneuploïdie. Op chromosoom 1 hebben we bijvoorbeeld een ZofZ-score van -0,980 (figuur 14).
1.5 Beoordeling van de monsterkwaliteit via ON en QS
Monsters A en B waren twee duidelijke gevallen waarin één chromosoom trisoom is, terwijl alle andere autosomen zich diploïde gedragen. De volgende grafieken tonen de OM-waarden van de autosomen in monsters A en B en alle OM-waarden bevestigen dat dit een geslaagd experiment was. Dit is ook bevestigd door lage QS-scores (d.w.z. 0,576 voor monster A en 0,652 voor monster B, zie figuur 15 en 16).
Voorbeeld 2
In monster C observeren we een ZofZ-score van 4,141 voor chromosoom 7, terwijl de BM-score laag blijft. Figuur 17 toont een grafiek van chromosoom 7, waar een deel van het chromosoom dat waarschijnlijk een hoger kopienummer heeft, wordt geobserveerd. Dit kan wijzen op CNV van de moeder.
ZofZ-scores kunnen bijgevolg ook indicatief zijn voor segmentele CNV's.
Geautomatiseerde classificatie van het chromosoom met behulp van ZofZ>3 is erg gevoelig voor opname van CNV's (zie voorbeeld C) of grotere aneuploidieën (zie monster A en B). ZofZ kan bijgevolg worden gebruikt voor het identificeren van abnormale chromosomen, en visuele inspectie van de grafiek kan de aanwezigheid van dergelijke afwijkingen bevestigen.
Geautomatiseerde classificatie van het chromosoom met behulp van een combinatie van ZofZ>3 met een andere parameter, kan verder de specificiteit van de geautomatiseerde classificatie verbeteren, en meer granulariteit toevoegen aan de resultaten. Als bijv. ZofZ>3 en BM<1, kan dit wijzen op de aanwezigheid van een CNV (zie monster C), terwijl als bijv. ZofZ>3 en BM>1, kan dit wijzen op de aanwezigheid van grotere aneuploïdie (zie monsters A en B).
Voorbeeld 3: ZofZ gevoeliger dan ZZ
De ZofZ-score kan gevoeliger zijn in vergelijking met ZZ voor de identificatie van CNV's. ZofZ-score kan ook gevoeliger zijn in vergelijking met ZZ voor de identificatie van CNV's of grotere aneuploïdieën in monsters met ruis. 3.1 Segmentele afwijking op chromosoom 21
In monster D werd een ZofZ-score van -6,873 voor chromosoom 21 geobserveerd, terwijl de ZZ-score zoals beschreven in Bayindir et al. 2015 (die werd gebruikt als referentiemethode) resulteerde in een ZZ-score van -2,341 (d.w.z. niet significant). In de grafiek van dat chromosoom zoals getoond op figuur 18 observeren we een deel van het chromosoom dat ondervertegenwoordigd blijkt te zijn. Dit kan wijzen op CNV van de moeder of de foetus. 3.2Segmentele afwijking op chromosoom 15
Op basis van de ZZ-score en de beslissingsboom beschreven in Bayindir et al. 2015, zou dit chromosoom 15 worden ingedeeld als een normaal profiel (ZZ =-2.730). De ZofZ-score van -4,51 trekt echter de aandacht naar dit chromosoom (zie figuur 19). De BM-score is gelijk aan -0,6, hetgeen erop wijst dat de afwijking gedeeltelijk is, zoals ook zou kunnen worden afgeleid uit de visuele inspectie van de grafiek. 3.3Segmentele afwijking op chromosoom 22
In monster E werd een ZofZ-score van 3,029 voor chromosoom 22 geobserveerd (zie figuur 20), terwijl de ZZ-score zoals beschreven in Bayindir et al. 2015 resulteerde in een ZZ-score van -0,629 (d.w.z. niet significant).
Op basis van de ZZ-score en de beslissingsboom beschreven in Bayindir et al. 2015, zou dit chromosoom niet worden aangeduid en ingedeeld als normaal. Dit zou te wijten zijn aan het feit dat dit monster ook een trisomie 18 heeft (zie figuur 21). 3.4Segmentele afwijking op chromosoom 20
In monster I zou de ZZ-score zoals beschreven in Bayindir et al. 2015 lager zijn dan 3 (d.w.z. ZZ=2,195), terwijl de ZofZ-score gelijk is aan 3,31. De BM-score is ook gelijk aan 1,51, hetgeen aangeeft dat meer dan de helft van de Z-scores is gestegen. De OM-score van 1,05 toont dat deze gegevensreeks eerder ruis bevat (zie figuur 22). 3.5 Indicatie van monosomie van chromosoom 22
In monster F zien we een ZofZ-score van -3,094 voor chromosoom 22, terwijl de ZZ-score berekend zoals beschreven in Bayindir et al. 2015 gelijk is aan -1,771 (d.w.z. niet significant) (figuur 23). De ZZ-score zou resulteren in een normale waarde. Monster F heeft een trisomie 21 dat misschien dit monosome gedrag van chromosoom 22 maskeert. Merk op dat de trisomie 21 werd bevestigd via invasieve opvolging. Er waren geen opvolgingsgegevens voor chromosoom 22.
De laatste resultaten tonen allemaal aan dat de werkwijze volgens de onderhavige uitvinding gevoeliger is dan de methodologieën die welbekend zijn in de stand der techniek. Deze visuele voorstelling van de gegevens zoals getoond op de figuren laat geautomatiseerde classificatie en interpretatie toe. Bovendien laat de visualisatie volgens de onderhavige uitvinding toe een onderscheid te maken tussen technische ruis en ruis die te wijten is aan aneuploïdieën.
Als de gegevens ruis bevatten, en variëren langs de Z=0 as (d.w.z. zowel hoger als lager dan 0), dan is de kans groter op technische ruis. Terwijl als de gegevens niet variëren langs de Z=0 as voor een groot chromosomaal segment, is de kans groter op een renale aneuploïdie. Uit de grafiek op figuur 24 blijkt duidelijk dat het zicht niet te wijten is aan technische ruis, maar aan een afwijkende situatie.
Voorbeeld 4: Geslachtsbepaling
Het geslacht van de monsters kan worden bepaald door het beoordelen van het aantal aflezingen die verwijzen naar twintig 50kb stukken op chromosoom Y die empirisch werden geselecteerd om specifiek te zijn voor mannelijke zwangerschappen (zie Bayindi 2015 voor meer details). In geval ten minste 3 of meer Y-specifieke stukken meer dan 1 aflezing bevatten, werd bepaald dat het geslacht mannelijk was. In geval maximum 1 stuk 1 aflezing bevatte of geen van de 20 stukken een aflezing bevatte, werd bepaald dat het geslacht vrouwelijk was. In alle andere gevallen werd geen geslachtsbepaling gedaan en werd gezegd dat het geslacht onbepaald was. Dit kon bijvoorbeeld te wijten zijn aan een vanishing twin wanneer het bloedmonster foetaal DNA van twee foetussen in plaats van één bevat.
In een reeks van 249 geslaagde experimenten (d.w.z. QS-score was lager dan 1,5 en het aantal aflezingen dat overbleef na alle filteringstappen was hoger dan 7.000.000), werd het geslacht bepaald en dit resulteerde in een reeks van 116 (46,59%) vrouwelijke zwangerschappen, 131 (52,61%) mannelijke zwangerschappen en 2 (0,80%) onbepaalde zwangerschappen. De grafieken zoals getoond op figuur 24 en 25 voor deze 249 monsters tonen het aantal aflezingen dat is toegewezen aan het Y-chromosoom (na filtering van het BAM-bestand). 4.1 Foetale fractiebepaling voor mannelijke zwangerschappen
Zodra het geslacht bepaald is, kan de foetale fractie worden bepaald voor de mannelijke zwangerschappen. Voor mannelijke zwangerschappen kan men voordeel halen uit het feit dat het foetale DNA slechts 1 kopie van X en een kopie van Y zal hebben, in plaats van de 2 kopieën van X die aanwezig zijn in het DNA van de moeder. Dit laat toe de foetale fractie op twee manieren te bepalen. Op basis van de X-chromosomen kan de foetale fractie worden bepaald als tweemaal het verschil op het 50kb-stuk niveau tussen het mediane aantal aflezingen in kaart gebracht tegenover de autosomen en het mediane aantal aflezingen in kaart gebracht tegenover chromosoom X, gedeeld door het mediane aantal aflezingen in kaart gebracht tegenover de autosomen. Dit kan als de volgende formule worden geschreven:
Als tweede kan de foetale fractie ook worden geschat op basis van het Y-chromosoom aangezien alle aflezingen die betrekking hebben op het chromosoom Y in theorie afkomstig moeten zijn van het foetale DNA. De foetale fractie op basis van chromosoom Y wordt gedefinieerd als tweemaal het mediane aantal GC-gecorrigeerde aflezingen in kaart gebracht ten opzichte van Y over het mediane aantal GC-gecorrigeerde aflezingen in kaart gebracht tegenover de autosomen, of in een formule:
Nadeel van deze benadering is dat de foetale fractie enkel kan worden bepaald voor ongeveer de helft van de monsters (d.w.z. enkel voor de mannelijke zwangerschappen). In onze vorige voorbeelden werden foetale fracties berekend. De resultaten zijn getoond in tabel I.
Figuur 25 toont voor de 131 mannelijke zwangerschappen, geïdentificeerd in voorbeeld 4.1, de X- en Y-gebaseerde foetale fracties.
Voorbeeld 6: CNV-aebaseerde benadering voor het bepalen van een minderheidsfractie fbiiv. foetale fractie!
De methodologie van de onderhavige uitvinding kan worden geïllustreerd als men uitgaat van een monster met een foetale fractie van 10%, die werd gesequencet met een dekking van 0,1X om 50 bp aflezingen op te leveren. Verder moet worden uitgegaan van een CNV van 10 Mb.
In geval van een normaal monster (d.w.z. 2 kopieën van de CNV) bestaande uit 100% DNA van de patiënt, worden 20 000 aflezingen die verwijzen naar dat CNV-gebied verwacht. In geval de patiënt slechts 1 kopie van de bepaalde CNV heeft, worden 10 000 aflezingen verwacht in dat gebied; in geval van 0 kopieën, worden er geen aflezingen verwacht.
In geval van een minderheidsfractie van 10% kunnen de volgende gevallen worden verwacht (Tabel II): # kopieën # kopieën foetus Verwacht # aflezingen vrouw
Tabel II
In geval wordt gevonden dat de CNV een veel te lage dekking heeft die niet nul is, kan worden besloten dat de moeder dit gebied (0 kopieën) niet heeft en dat de aflezingen die geobserveerd werden, afkomstig zijn van het minderheids-DNA. Bijgevolg kan de CNV als informatief worden beschouwd voor de bepaling van de foetale fractie.
Daarom kan de minderheidsfractie als volgt worden bepaald: 2*geobserveerde aflezingen/verwachte aflezingen = 2*1.000/20.000=10%
Als een schatting voor het verwachte aantal fragmenten, kan de globale dekking van het monster worden gebruikt evenals de lengte van de CNV. Een correctie van de algemene aflezingsdiepte kan plaatsvinden en de verwachte dekking op basis van alle monsters kan worden bepaald, bijv. door het gemiddelde te nemen na de bovenste en onderste 10% van de monsters uit te sluiten of de mediane dekking te gebruiken.
Om te corrigeren voor terugkerende technische ruis, kan een CNV-specifiek attribuut worden berekend met behulp van monsters met gekende foetale fractie, waarbij het attribuut de verkregen aflezingstellingen kan corrigeren voor terugkerende technische ruis op die bepaalde CNV.
De sequenties kunnen worden verkregen zoals hierboven beschreven, behalve dat filtering van aflezingen die in de gebieden op de zwarte lijst liggen, niet werd toegepast.
Berekening van dekking per CNV
Een CNV-referentiegenoomgegevensbank werd gebruikt, bevattende 581774 CNV's. Merk op dat de CNV's in deze reeks niet allemaal unieke CNV's waren aangezien de gegevensbank overlappingen bevat.
De aflezingen werden uitgelijnd tegen het referentiegenoom. Voor elke CNV werd het aantal aflezingen geteld die overlapping vertoonde van ten minste X bases met de CNV-gebieden, waarbij X eender welke waarde tussen 1 en 50 kan zijn. In het huidige voorbeeld werd X op 1 ingesteld. Dit resulteert in een matrix met de onbewerkte tellingen. Onbewerkte tellingen gelijk aan of lager dan X worden gedefinieerd als zijnde gelijk aan 0 aangezien ze minimale overlapping vertonen met de CNV.
Omdat de onbewerkte tellingen niet gecorrigeerd werden voor het totale aantal lezingen, werd het aantal gefilterde aflezingen geëxtraheerd voor elk monster en werd het gecorrigeerd door de volgende vergelijking: genormaliseerde telling = 10.000.000 * onbewerkte telling/totaal aantal aflezingen; waarbij 10.000.000 willekeurig gekozen was en zou kunnen worden vervangen door eender welke andere waarde.
Eerder bepaalde foetale fracties verkregen voor een reeks mannelijke zwangerschappen werden geïmporteerd. Deze foetale fracties zijn gebaseerd op de tellingen op het X- en Y-chromosoom en gebruiken het feit dat het foetale DNA, in mannelijke zwangerschappen, slechts 1 kopie van chromosoom X en één kopie van chromosoom Y heeft; terwijl het DNA van de moeder twee kopieën van chromosoom X heeft. Bijgevolg kan de X- en Y-gebaseerde methode van de foetale fractie enkel een schatting geven over de foetale fractie voor de mannelijke zwangerschappen (in tegenstelling tot op CNV-gebaseerde methode van de foetale fractie die hier is voorgesteld).
De eerder verkregen foetale fracties werden gefilterd om monsters met een foetale fractie kleiner dan Y te verwijderen, Y kan eender welke waarde aannemen tussen 0,05 en 1. In het huidige voorbeeld werd genoemde Y ingesteld op 0,3, aangezien dit werd beschouwd als de maximale foetale fractie die men routinematig zou kunnen tegenkomen.
Bepalen van informatieve CNV's in een reeks CNV's
In een volgende stap werden informatie CNV's bepaald. Voor elke CNV werden monsters geïdentificeerd waarvoor enkel de foetus 1 of 2 kopieën had en waarbij de moeder geen kopieën had. Alle tellingen zijn dus afgeleid van de foetus. Vervolgens werd gecontroleerd of deze foetale tellingen voor de mannelijke zwangerschappen correleren met de X/Y-gebaseerde foetale fracties, waardoor ze resulteren in een X-gebaseerde en Y-gebaseerde correlatie. Dit gaf inzicht in het feit of de CNV's informatief waren voor foetale fracties.
Als een voorbeeld werden de volgende 3 willekeurige CNV's beschouwd, die verschillende lengtes dekken: 1. Chr 1: 72,773,259-72,798,581; dit is een gebied van 25kb (25,323bp) 2. Chr 1: 148,539,255-149,765,886; dit is een gebied van 1Mb (1.226,632bp) 3. Chr 9: 38,725,590-71,025,693; dit is een gebied van 32Mb (32.300,104bp)
In een spreidingsdiagram (niet getoond) van de genormaliseerde tellingen (genormaliseerd ten opzichte van het totale aantal aflezingen) voor CNV 1, worden 3 pieken geobserveerd (die waarschijnlijk zullen overeenkomen met 0, 1 en 2 kopieën van de moeder). Voor CNV 2 werden 4 grote pieken geobserveerd (die waarschijnlijk overeenkomen met 0, 1, 2 en 3 kopieën van de moeder). In de derde en grootste CNV konden er geen pieken worden waargenomen. Daarom werd de analyse verdergezet met CNV 1 en 2.
Om lokale minima te vinden, werd een densiteitsfunctie toegepast en werden de tekens van de afgeleide van de densiteitsfuncties gecontroleerd.
De twee lokale minima waren op: 1. CNV 1: 18.39 en 67.96 2. CNV 2:
766.69; 1160.26; 1538.69; 1568.97; 1705.20 en 1856.57 (zie figuur 29).
De genormaliseerde tellingen werden geëxtraheerd voor deze monsters die genormaliseerde tellingen hadden die kleiner waren dan het kleinste lokale minimum en groter dan 0. Er werd aangenomen dat de tellingen voor deze monsters hoofdzakelijk afgeleid zijn van het foetale DNA en minimale tot lage bijdrage leveren van het DNA van de moeder.
Op basis van de genormaliseerde tellingen werd de verwachte telling berekend voor elke CNV. De genormaliseerde tellingen werden genormaliseerd naar een willekeurig gekozen waarde van 10.000.000 aflezingen.
Met deze verwachte telling werd een schatting van de foetale fracties berekend als: 2 x 100 x geobserveerde tellingen/verwachte tellingen.
Deze schatting van de foetale fractie is gecorreleerd met de werkelijke foetale fractie. Er werd echter gevonden dat het niet identiek is. De geschatte foetale fractie kan in feite als volgt worden gezien: geschatte foetale fractie = factor * werkelijke foetale fractie.
Deze factor is een constante factor die kan worden beschouwd als een attribuut van elke CNV in de gegevensreeks, en die empirisch moet worden bepaald (zie verder).
Voorbeeld van het bepalen van de foetale fractie: a) voor CNV 1:
Foetale fractie kan worden geschat als 2*100*genormaliseerde telling/verwachte tellingen=2*100*genormaliseerde telling/88,58
Figuur 28 toont de berekende foetale fracties voor alle mannelijke zwangerschappen met minder dan 18,54 tellingen voor CNV 1 (d.w.z. 142 monsters) versus de in-house foetale fractie berekend via chromosoom X (links) of chromosoom Y (rechts). Correlaties zijn gelijk aan 0,54 en 0,56 met respectievelijk de X- en Y-gebaseerde foetale fracties. b) voor CNV 2
Foetale fractie kan worden geschat als: 2*100*genormaliseerde telling/verwachte tellingen=2*100*genormaliseerde tellingen/4.290
Figuur 29 toont de berekende foetale fracties voor alle mannelijke zwangerschappen met minder dan 359,20 tellingen voor CNV 2 (d.w.z. 17 monsters) versus de foetale fractie berekend via chromosoom X (links) of chromosoom Y (rechts). Correlaties zijn gelijk aan 0,601 en 0,963.
Voor alle CNV's werd het lokale minimum, het lokale maximum, aantal pieken, aantal mannelijke zwangerschappen met een telling lager dan het kleinste lokale minimum en de correlaties met de X/Y-gebaseerde foetale fracties berekend.
Op basis van deze informatie werden autosomale "pseudo-informatieve" CNV's geselecteerd. • X- of Y-gebaseerde correlatie groter dan A (tussen 0,01 en 1, A was ingesteld als 0,5 in dit voorbeeld) • gebaseerd op ten minste B (tussen 1 en 100 of meer, B was ingesteld op 8 in dit voorbeeld) mannelijke zwangerschappen • met meer dan C pieken (tussen 0 en 5, C was ingesteld op 2). • de CNV's uitsluiten op het X- en Y-chromosoom. • het eerste lokale minimum vergelijken met het derde lokale maximum. De verhouding tussen het derde lokale maximum en het eerste lokale minimum moet groter zijn dan D (tussen 0,1 en 100 is D ingesteld op 3).
Dit kan het aantal CNV's sterk reduceren tot ergens tussen 1 en 100.000 of meer "pseudo-informatieve" CNV's. In dit voorbeeld werden ongeveer 5.000 "pseudo-informatieve" CNV's geïdentificeerd.
Binnen de lijst verkregen pseudo-informatieve CNV's werden veel overlappende CNV's geïdentificeerd. De lijst werd daarom opgeschoond door een of meer van de volgende methodologieën: • Per set overlappende CIW's, enkel A weerhouden (A = tussen 1 en 100 of meer, waarbij A was ingesteld als 1 in dit voorbeeld) daarvan, d.w.z. de ene met de hoogste gemiddelde correlatie (d.w.z. gemiddelde van de X- en Y-gebaseerde correlaties. • Verwijderen van duplicaten • Voor elk gelijkaardige CNV's werd enkel de langste CNV weerhouden.
Merk op dat het opschonen optioneel is, maar het aantal CNV's sterk kan reduceren tot ergens tussen 1 en 100.000 of meer "informatieve" CNV's. In dit voorbeeld was het aantal gereduceerd tot ongeveer 100 "informatieve" CNV's.
In een latere stap en voor elk van de informatieve CNV's werden de genormaliseerde tellingen geschaald naar de X/Y-gebaseerde foetale fracties. Voor elke CNV werd bijgevolg geëvalueerd hoe de aflezingstellingen de foetale fractie voorspellen. De methode is beperkt tot CNV's met een correlatie hoger dan D (waarbij D ligt tussen 0,01 en 1 en is ingesteld als 0,5 in dit voorbeeld). In geval de X-gebaseerde correlatie hoger was dan D, terwijl de Y-gebaseerde correlatie lager was dan D, werd enkel rekening gehouden met de X-gebaseerde foetale fracties. Merk op dat het omgekeerde ook mogelijk is.
Als voorbeeld werd CNV 1: 1.541.063-1.541.536 overwogen. Een regressielijn van de X(Y)-gebaseerde foetale fracties versus de genormaliseerde tellingen werd geplaatst voor de kleine tellingen gezien in mannelijke zwangerschappen van geslaagde experimenten. Dit resulteerde in 2 regressielijnen, elk met een afgesneden stuk en richtingscoëfficiënt, voor alle CNV's of alle pseudo-informatieve CNV's, of alle informatieve CNV's.
Met de richtingscoëfficiënt en het afgesneden stuk van deze regressielijnen, werden voor elke CNV de overeenkomstige, klein genormaliseerde tellingen geschaald. Merk op dat deze schaling kan gebeuren voor alle monsters (d.w.z. mannelijke en vrouwelijke monsters). De volgende grafieken tonen de geschaalde tellingen versus de X/Y-gebaseerde foetale fracties voor de mannelijke zwangerschappen die kleine tellingen hadden voor CNV 1: 1.541.063-1.541.536.
Voor elke CNV en voor alle monsters met kleine tellingen voor die bepaalde CNV zijn twee schattingen van de foetale fractie verkregen, de X- en Y-gebaseerde foetale fractie. Als derde schatting werd het gemiddelde van de X-en Y-gebaseerde geschaalde tellingen genomen.
In geval een van de 2 correlaties, bijv. de X-gebaseerde correlatie, lager is dan E (waarbij E ligt tussen 0,01 en 1, en ingesteld als 0,5 in dit voorbeeld E = 0,5 in dit voorbeeld), dan is het gemiddelde gelijk aan de Y-gebaseerde geschaalde tellingen.
Voor elk monster zijn drie schattingen voor de foetale fractie voor alle CNV's die een klein aantal aflezingen tonen binnen het monster, verkregen: - X-gebaseerde schatting - Y-gebaseerde schatting - gemiddeld-geschaalde schatting
In een laatste stap werd het gemiddelde van de CNV-gebaseerde foetale fractie over alle CNV's verkregen. Om te controleren of dit gemiddelde de chromosoom X- en Y-gebaseerde foetale fracties voor de mannelijke zwangerschappen weergeeft, worden ze in een grafiek uitgezet versus elkaar voor de geslaagde experimenten.
Op figuur 31 is duidelijk dat er een duidelijke correlatie is tussen de CNV-gebaseerde bepaling van de foetale fractie en de X- en Y-gebaseerde bepaling van de foetale fractie. Om de CNV-gebaseerde methode van de foetale fractie te gebruiken om de werkelijke foetale fractie te bepalen, kan de schaling empirisch worden aangepast (d.w.z. de regressielijn kan worden aangepast om een richtingscoëfficiënt van 1 te hebben).

Claims (30)

  1. CONCLUSIES
    1. Een werkwijze voor het bepalen van de aan- of afwezigheid van een foetale chromosomale aneuploïdie bij een zwangere vrouw, de werkwijze omvattend: - het voorzien van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw, waarbij het genoemde biologische monster celvrij DNA van zowel de moeder als van de foetus bevat; - het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor leestellingen worden verkregen; - het normaliseren van de genoemde leestellingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score van de genoemde genormaliseerde aflezingen en het verkrijgen van een verzameling van scores van de genoemde genormaliseerde aflezingen, waarbij de genoemde eerste score is afgeleid van de genoemde genormaliseerde aflezingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van het genormaliseerde aantal aflezingen voor een reeks chromosomen of chromosoomsegmenten die het chromosomaal doelsegment of chromosoom bevatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores, waarbij de genoemde parameter een verhouding voorstelt tussen * de genoemde eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de genoemde verzameling scores; en - het vergelijken van de genoemde parameter p met een drempelwaarde, waarbij de genoemde drempelwaarde een vereiste is voor de aanwezigheid of afwezigheid van een aneuploïdie van het doelchromosoom of chromosomaal segment.
  2. 2. De werkwijze volgens conclusie 1, met het kenmerk dat het genoemde aantal aflezingen opnieuw wordt gekalibreerd om te corrigeren voor GC-inhoud en/of totaal aantal aflezingen verkregen uit het genoemde monster.
  3. 3. De werkwijze volgens conclusie 1 of 2, met het kenmerk dat de genoemde normalisatie gebeurt via vergelijking met gegevens die zijn verkregen van overeenkomstige chromosomale segmenten of chromosomen uit een referentiereeks.
  4. 4. De werkwijze volgens één der conclusies 1 tot 3, met het kenmerk dat de genoemde samenvattende statistiek het gemiddelde, de mediaan, de standaardafwijking, de gemiddelde absolute afwijking of de mediane absolute afwijking is.
  5. 5. De werkwijze volgens één der conclusies 1 tot 4, waarbij de sequenering willekeurig wordt uitgevoerd op een deel van de nucleïnezuurmoleculen die in het biologische monster zitten.
  6. 6. De werkwijze volgens één der voorgaande conclusies, waarbij het biologische monster bloed, plasma, serum, urine, blastocoel fluïdum, transcervicaal fluïdum of speeksel van de moeder is.
  7. 7. De werkwijze volgens één der voorgaande conclusies, waarbij het chromosomale doelsegment is geselecteerd uit Tabel 1, en/of uit een stuk of een venster afgeleid van chromosoom X, Y, 6, 7, 8, 13, 14, 15, 16, 18, 21 en/of 22.
  8. 8. De werkwijze volgens één der voorgaande conclusies 1 tot 6, met het kenmerk dat het genoemde doelchromosoom is geselecteerd uit chromosoom X, Y, 6, 7, 8, 13, 14, 15, 16, 18, 21 en/of 22.
  9. 9. De werkwijze volgens één der voorgaande conclusies, waarbij de genoemde drempelwaarde is bepaald met behulp van standaard statistische overwegingen, of empirisch bepaald met behulp van biologische monsters.
  10. 10. De werkwijze volgens één der voorgaande conclusies, waarbij de genoemde score wordt berekend als:
    waarbij i een chromosoom of chromosomaal segment of het doelchromosoom of chromosomaal doelsegment is.
  11. 11. De werkwijze volgens conclusie 10, met het kenmerk dat de genoemde parameter p is berekend als:
    waarbij (Zj) een verzameling scores voorstelt die zijn afgeleid van chromosomen of chromosomale segmenten i, a, b, ... waarbij i overeenkomt met het chromosomale doelsegment of chromosoom.
  12. 12. De werkwijze volgens één der voorgaande conclusies, omvattende de berekening van secundaire parameters, waarbij de genoemde secundaire parameters een vereiste zijn voor de aanwezigheid van de genoemde aneuploïdie en/of een maatstaf van de kwaliteit van het monster.
  13. 13. De werkwijze volgens conclusie 10, waarbij de genoemde secundaire parameters worden vergeleken met een drempelwaarde.
  14. 14. De werkwijze volgens één der conclusies 12 of 13, waarbij de genoemde aanwezigheid of afwezigheid van een aneuploïdie wordt bepaald door de vergelijking van de genoemde parameter met een drempelwaarde en de vergelijking van en of meerdere secundaire parameters met overeenkomstige drempelwaarden.
  15. 15. De werkwijze volgens één der voorgaande conclusies, waarbij de foetale fractie van het monster wordt bepaald.
  16. 16. De werkwijze volgens conclusie 15, waarbij de genoemde bepaling van de foetale fractie de stappen omvat van: - het tellen van het aantal sequenties die aligneren met een vooraf gedefinieerde reeks polymorfismen; - het vergelijken van het verkregen aantal sequenties met het verwachte aantal sequenties voor het identificeren van de informatieve polymorfe plaats(en) voor het monster; - het berekenen op basis van het verkregen aantal sequenties voor de genoemde informatieve polymorfe plaats(en) van een hoeveelheid, waarbij de genoemde hoeveelheid een indicatie is voor de foetale fractie.
  17. 17. De werkwijze volgens conclusie 16, waarbij de genoemde hoeveelheid wordt berekend met behulp van lineaire schaling op basis van informatieve polymorfismespecifieke attributen.
  18. 18. De werkwijze volgens één der conclusies 15 tot 17, waarbij de genoemde hoeveelheid die indicatief is voor de foetale fractie dient als een kwaliteitscontrole van het genoemde monster.
  19. 19. Een computerprogrammaproduct omvattende een door de computer leesbaar medium gecodeerd met meerdere instructies voor het sturen van een computersysteem voor het uitvoeren van een bewerking voor het uitvoeren van prenatale diagnose van een foetale chromosomale aneuploïdie in een biologisch monster dat is verkregen van een zwangere vrouwelijke patiënt, waarbij het biologische monster nucleïnezuurmoleculen bevat, waarbij de bewerking de stappen omvat van - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw, waarbij het genoemde biologische monster celvrij DNA van zowel de moeder als van de foetus omvat; - het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor tellingen van aflezingen worden verkregen; - het normaliseren van het genoemde aantal aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score van de genoemde genormaliseerde aflezingen en een verzameling van scores van de genoemde genormaliseerde aflezingen, waarbij de genoemde eerste score is afgeleid van de genormaliseerde aflezingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van de genormaliseerde aflezingen voor een reeks chromosomen of chromosomale segmenten die het chromosomaal doelsegment of chromosoom bevatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores, waarbij de genoemde parameter een verhouding voorstelt tussen * de genoemde eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de genoemde verzameling scores; en - het vergelijken van de genoemde parameter p met een drempelwaarde, waarbij de genoemde drempelwaarde een vereiste is voor de aanwezigheid of afwezigheid van een aneuploïdie van het doelchromosoom of chromosomaal segment.
  20. 20. Computerprogrammaproduct volgens conclusie 19, verder omvattende bewerkingen voor het berekenen van een of meerdere secundaire parameters, waarbij de genoemde secundaire parameters een vereiste zijn voor de aanwezigheid van de genoemde aneuploïdie en/of een maatstaf van de kwaliteit van het monster.
  21. 21. Computerprogrammaproduct volgens één der voorgaande conclusies, omvattende bewerkingen voor het bepalen van de foetale fractie.
  22. 22. Computerprogrammaproduct volgens één der voorgaande conclusies, verder omvattende bewerkingen voor het uitvoeren van CNV calling, CNV kwantificering en/of CNV handtekeningherkenning.
  23. 23. Een kit omvattende een computerprogrammaproduct volgens één der conclusies 19 tot 22 en een protocol voor het verkrijgen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen opgenomen in een biologisch monster dat is verkregen van een zwangere vrouw, waarbij het genoemde biologische monster celvrij DNA van zowel de moeder als de foetus omvat.
  24. 24. Kit volgens conclusie 23, verder omvattend reagentia en middelen voor het verkrijgen van de genoemde sequenties.
  25. 25. Een rapport, omvattende een schatting van de aanwezigheid of afwezigheid van een foetale chromosomale aneuploïdie bij een zwangere vrouw, waarbij het genoemde rapport de parameter, een of meerdere secundaire parameters en een vergelijking met een drempelwaarde omvat zoals gedefinieerd in één der conclusies 1 tot 18 en een visualisatie van de genoemde aflezingen per chromosoom.
  26. 26. Rapport volgens conclusie 25, met het kenmerk dat de genoemde visualisatie de genoemde eerste score per venster van een doelchromosoom en/of parameter p toont.
  27. 27. Een werkwijze voor het bepalen van een foetale fractie in een biologisch monster verkregen van een zwangere vrouw, waarbij de genoemde werkwijze omvat: - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; - het tellen van het aantal sequenties die aligneren met een vooraf gedefinieerde reeks polymorfismen; - het vergelijken van het verkregen aantal sequenties met het verwachte aantal sequenties voor het identificeren van de informatieve polymorfe plaats(en) voor het monster; - het berekenen op basis van het verkregen aantal sequenties voor de genoemde informatieve polymorfe plaats(en) van een hoeveelheid, waarbij de genoemde hoeveelheid een indicatie is voor de foetale fractie.
  28. 28. De werkwijze volgens conclusie 27, waarbij de genoemde hoeveelheid wordt berekend met behulp van lineaire schaling op basis van informatieve polymorfismespecifieke attributen.
  29. 29. Werkwijze volgens conclusie 27 of 28, met het kenmerk dat de genoemde polymorfismen kopieaantalvariaties zijn met een grootte tussen 100 bp en 1 Mb, of tussen 1 kb en 1 Mb, of tussen 2 bp en 250 Mb.
  30. 30. Computerprogrammaproduct omvattende een door de computer leesbaar medium gecodeerd met meerdere instructies voor het sturen van een computersysteem voor het uitvoeren van een bewerking voor het bepalen of schatten van de foetale fractie in een biologisch monster dat is verkregen van een zwangere vrouwelijke patiënt, waarbij het biologische monster nucleïnezuurmoleculen bevat, waarbij de bewerking de stappen omvat van: - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; - het tellen van het aantal sequenties die aligneren met een vooraf gedefinieerde reeks polymorfismen - het vergelijken van het verkregen aantal sequenties met het verwachte aantal sequenties voor het identificeren van de informatieve polymorfe plaats(en) voor het monster; en - het berekenen op basis van het verkregen aantal sequenties voor de genoemde informatieve polymorfe plaats(en) van een hoeveelheid, waarbij de genoemde hoeveelheid een indicatie is voor de foetale fractie.
BE2015/5443A 2015-07-13 2015-07-13 Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp BE1023266B1 (nl)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BE2015/5443A BE1023266B1 (nl) 2015-07-13 2015-07-13 Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
BE2015/5443A BE1023266B1 (nl) 2015-07-13 2015-07-13 Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp

Publications (2)

Publication Number Publication Date
BE1023266B1 true BE1023266B1 (nl) 2017-01-17
BE1023266A1 BE1023266A1 (nl) 2017-01-17

Family

ID=54360821

Family Applications (1)

Application Number Title Priority Date Filing Date
BE2015/5443A BE1023266B1 (nl) 2015-07-13 2015-07-13 Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp

Country Status (1)

Country Link
BE (1) BE1023266B1 (nl)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011102998A2 (en) * 2010-02-19 2011-08-25 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
WO2013109981A1 (en) * 2012-01-20 2013-07-25 Sequenom, Inc. Diagnostic processes that factor experimental conditions
WO2014015319A1 (en) * 2012-07-20 2014-01-23 Verinata Health, Inc. System for determining a copy number variation
WO2014014497A1 (en) * 2012-07-20 2014-01-23 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome
WO2014190286A2 (en) * 2013-05-24 2014-11-27 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014209597A2 (en) * 2013-06-28 2014-12-31 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction
WO2015061359A1 (en) * 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
WO2015184404A1 (en) * 2014-05-30 2015-12-03 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies and copy number variations

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011102998A2 (en) * 2010-02-19 2011-08-25 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
WO2013109981A1 (en) * 2012-01-20 2013-07-25 Sequenom, Inc. Diagnostic processes that factor experimental conditions
WO2014015319A1 (en) * 2012-07-20 2014-01-23 Verinata Health, Inc. System for determining a copy number variation
WO2014014497A1 (en) * 2012-07-20 2014-01-23 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome
WO2014190286A2 (en) * 2013-05-24 2014-11-27 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014209597A2 (en) * 2013-06-28 2014-12-31 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction
WO2015061359A1 (en) * 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
WO2015184404A1 (en) * 2014-05-30 2015-12-03 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies and copy number variations

Also Published As

Publication number Publication date
BE1023266A1 (nl) 2017-01-17

Similar Documents

Publication Publication Date Title
US11168370B2 (en) Detecting mutations for cancer screening
US9051616B2 (en) Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
DK2823062T3 (en) SIZE-BASED ANALYSIS OF Fetal DNA FRACTION IN MOTHER PLASMA
US20120003636A1 (en) Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
EP3662479A1 (en) A method for non-invasive prenatal detection of fetal sex chromosomal abnormalities and fetal sex determination for singleton and twin pregnancies
EP3118323A1 (en) System and methodology for the analysis of genomic data obtained from a subject
BE1023266B1 (nl) Systeem en methodologie voor de analyse van genomische gegevens die zijn verkregen van een onderwerp
AU2013200581B2 (en) Diagnosing cancer using genomic sequencing
AU2008278843B2 (en) Diagnosing fetal chromosomal aneuploidy using genomic sequencing
AU2013203077A1 (en) Diagnosing fetal chromosomal aneuploidy using genomic sequencing

Legal Events

Date Code Title Description
MM Lapsed because of non-payment of the annual fee

Effective date: 20200731