BE1023267B1

BE1023267B1 - Werkwijze voor het analyseren van kopienummervariatie bij de detectie van kanker

Info

Publication number: BE1023267B1
Application number: BE2015/5444A
Authority: BE
Inventors: Benoit Devogelaere; Joke Allemeersch
Original assignee: Cartagenia N.V.
Priority date: 2015-07-13
Filing date: 2015-07-13
Publication date: 2017-01-17
Also published as: BE1023267A1

Abstract

De onderhavige uitvinding heeft betrekking op een werkwijze voor het identificeren van de aanwezigheid van kanker en/of een verhoogd risico op kanker bij een zoogdier, door het berekenen van een parameter die is verkregen uit een biologisch monster, waarbij de genoemde drempelwaarde een vereiste is voor de aanwezigheid of afwezigheid van een of meerdere aneuploïdieën in het genoemde doelchromosoom of chromosoomsegment dat een indicator is voor de aanwezigheid en/of een verhoog risico op kanker.

Description

WERKWIJZE VOOR HET ANALYSEREN VAN KOPIENUMMERVARIATIE BIJ DE DETECTIE VAN KANKER

Technisch gebied

De uitvinding heeft betrekking op het technische gebied van een werkwijze voor het bepalen van kopienummervariatie (CNV) van een interessante sequentie in een testmonster dat een mengsel van nucleïnezuren omvat waarvan bekend is of vermoed wordt dat ze verschillen in de hoeveelheid van een of meerdere interessante sequenties. De werkwijze omvat een statistische benadering die rekening houdt met verhoogde variabiliteit afkomstig van procesgerelateerde, interchromosomale en inter-sequencing variabiliteit. De werkwijze is van toepassing voor het bepalen van CNV's waarvan bekend is of wordt vermoed dat ze zijn geassocieerd met verschillende medische aandoeningen. CNV's die kunnen worden bepaald volgens de werkwijze omvatten trisomieën en monosomieën van enige een of meerdere chromosomen 1-22, X en Y, andere chromosomale nullisomieën en polysomieën, en deleties en/of duplicaties en/of amplificaties van segmenten van enige een of meerdere van de chromosomen, die kunnen worden gedetecteerd door sequencing van de nucleïnezuren van een testmonster.

Achtergrond

Een van de kritische uitdagingen in de humane medische wetenschap is de ontdekking van genetische afwijkingen die nadelige gevolgen voor de gezondheid met zich meebrengen. In veel gevallen zijn specifieke genen en/of kritische diagnostische markers geïdentificeerd in segmenten van het genoom die aanwezig zijn in abnormale kopieaantallen. In prenatale diagnose zijn extra of ontbrekende kopieën van volledige chromosomen bijvoorbeeld vaak voorkomende genetische afwijkingen. Bij kanker komen deletie of amplificatie van kopieën van volledige chromosomen of chromosomale segmenten of specifieke gebieden van het genoom vaak voor.

De meeste informatie over kopievariatie wordt gegeven voor cytogenetische resolutie die herkenning van structurele afwijkingen heeft toegelaten. Conventionele procedures voor genetische screening en biologische disometrie hebben invasieve procedures gebruikt bijv. amniocentese of biopsie van solide tumoren, om cellen te verkrijgen voor de analyse van karyotypes. Dankzij de erkenning van de nood aan snellere testmethodes die geen celkweek vereisen zijn fluorescentie in situ hybridisatie (FISH), kwantitatieve fluorescentie PCR (QF-PCR) en arrayvergelijkende genomische hybridisatie (array-CGH) ontwikkeld als moleculaire-cytogenetische methodes voor de analyse van kopieaantalvariaties.

De komst van technologieën die sequencing van volledige genomen op relatief korte tijd toelaten, en de ontdekking van circulerend celvrij DNA (cfDNA) hebben de opportuniteit geboden om genetisch materiaal dat afkomstig is van één chromosoom te vergelijken om te worden vergeleken met dat van een ander zonder de risico's die zijn geassocieerd met invasieve bemonsteringsmethodes. US20130034546 en US20130310263 beschrijven beide een werkwijze voor het identificeren van de aanwezigheid van kanker of het risico om kanker te ontwikkelen op basis van een analyse van verkregen sequentieaflezingen die zijn verkregen uit een celvrije DNA-fractie in een monster.

Vandenberghe et al., "Non-invasive détection of genomic imbalances in Hodgkin/Reed-Sternberg cells in early and advanced stage Hodgkin's lymphoma by sequencing of circulating cell-free DNA: a technical proof-of-principle study", 2015 beschrijft een methodologie voor het identificeren van genomische onevenwichten bij een patiënt die lijdt aan een presymtomatische Hodgkin lymfoomkanker door masieve parallelle sequencing van circulerend celvrij DNA.

De beperkingen van de bestaande werkwijzen, die onvoldoende gevoeligheid omvatten omwille van de beperkte niveaus van cfDNA, en de sequencingbias van de technologie omwille van de inherente aard van genomische informatie, onderstrepen echter de voortdurende nood aan niet-invasieve werkwijzen die enige of alle van de specificiteit, gevoeligheid en toepasbaarheid zouden bieden, om een betrouwbare diagnose te kunnen stellen van kopieaantalveranderingen in een verscheidenheid aan klinische settings.

Hoewel de bovengenoemde methodologieën waardevol zijn, blijft de verhouding van valse positieven en negatieven hoog in het veld. Daarom wordt er constant gestreefd naar het bieden van methodologieën die het percentage valse positieven en in het bijzonder valse negatieven kunnen verlagen, om een meer nauwkeurige screening te bieden.

De onderhavige uitvinding heeft als doel het bieden van een nauwkeurigere, in hoofdzaak niet-invasieve methodologie voor het bepalen of een individu van tumor afgeleid celvrij DNA heeft in zijn of haar perifeer bloed, voor het bevestigen van de diagnose van kanker, om te helpen bij de classificatie van een kanker, voor het beoordelen van de behandelingsrespons, voor het monitoren van de patiënt.

Samenvatting van de uitvinding

De onderhavige uitvinding biedt een werkwijze, systemen en een apparaat voor het bepalen of er een nucleïnezuursequentieonevenwicht (bijv. chromosoomonevenwicht of een onevenwicht van een chromosoomsegment of gebied) of een genoombrede instabiliteit bestaat binnen een biologisch monster dat is verkregen van een patiënt of voor het bepalen van kopieaantalvariaties.

De onderhavige uitvinding biedt in het bijzonder een werkwijze volgens conclusie 1 en een computerprogram ma product volgens conclusie 27.

Andere uitvoeringsvormen van de uitvinding zijn gericht op systemen en door de computer leesbare media die zijn geassocieerd met de werkwijzen die hier beschreven zijn.

BESCHRIJVING VAN DE FIGUREN

Figuur 1 toont een grafiek van secundaire parameters die zijn verkregen volgens een uitvoeringsvorm van de onderhavige uitvinding per chromosoom van een monster.

Figuur 2 toont spreidingsdiagrammen van chromosomen van een monster, waarbij de berekening van een parameter volgens een uitvoeringsvorm volgens de onderhavige uitvinding genoombrede instabiliteit aangeeft die zou kunnen wijzen op de aanwezigheid van een tumor.

DEFINITIES

Tenzij anders gedefinieerd hebben alle termen die zijn gebruikt in de beschrijving van de uitvinding, inclusief technische en wetenschappelijke termen, de betekenis die algemeen wordt begrepen door een vakman in het gebied waarop deze uitvinding betrekking heeft. Verder zijn definities van de termen opgenomen om de beschrijving van de onderhavige uitvinding beter te begrijpen.

Zoals hierin gebruikt, hebben de volgende termen de volgende betekenis:

De term "biologisch monster" zoals hierin gebruikt, verwijst naar elk monster dat is afgenomen van een patiënt (bijv. een mens, zoals een zwangere vrouw) en een of meerdere interessante nucleïnezuurmolecule(n) bevat.

De term "nucleïnezuur" of "polynucleotide" verwijst naar een deoxyribonucleïnezuur (DNA) of ribonucleïnezuur (RNA) en een polymeer daarvan in hetzij enkel- hetzij dubbelstrengige vorm. Tenzij specifiek beperkt, omvat de term nucleïnezuren bevattende welbekende analogen van natuurlijke nucleotiden die gelijkaardige bindingseigenschappen hebben als het referentienucleïnezuur en op gelijkaardige manier gemetaboliseerd zijn als natuurlijke voorkomende nucleotiden. Tenzij anders aangegeven, omvat een bepaalde nucleïnezuursequentie ook impliciet conversatief gewijzigde varianten daarvan (bijv. degeneercodonsubstituties), allellen, orthologen, enkel-nucleotide polymorfismen (SNP's) en complementaire sequenties evenals de expliciet aangegeven sequentie. Degenereercodonsubstituties kunnen in het bijzonder worden verkregen door het genereren van sequenties waarin de derde positie van een of meerdere geselecteerde (of alle) codons is gesubstitueerd met gemengde-basis en/of deoxyinosine-residuen. De term nucleïnezuur wordt verwisselbaar gebruikt met gen, DNA, cDNA, mRNA, klein niet-coderend RNA, micro-RNA (miRNA), Piwi-interagerend RNA, en korte haarspeld RNA (shRNA) gecodeerd door een gen of locus.

De term "gen" betekent het segment van DNA dat betrokken is bij de productie van een polypeptideketen. Het kan gebieden omvatten voorafgaand of volgend op het coderingsgebied (kop en staart) evenals interveniërende sequenties (intronen) tussen individuele coderingssegmenten (exonen).

De term "reactie" zoals hierin gebruikt, verwijst naar elk proces omvattende een chemische, enzymatische of fysieke actie die indicatief is voor de aanwezigheid of afwezigheid van een bepaalde interessante polynucleotidesequentie. Een voorbeeld van een "reactie" is een amplificatiereactie zoals een polymerasekettingreactie (PCR). Een ander voorbeeld van een "reactie" is een sequencingreactie, hetzij door synthese, hybridisatie hetzij door het brengen van DNA door een porie en het meten van signalen die indicatief zijn voor een bepaalde nucleotide. Een "informatieve reactie" is een reactie die wijst op de aanwezigheid van een of meerdere bepaalde interessante polynucleotidesequenties, en in een geval waar slechts één interessante sequentie aanwezig is. De term "putje" zoals hier gebruikt, verwijst naar een reactie op een vooraf bepaalde locatie binnen een beperkte structuur, bijv. een putjesvormig flesje, cel, of kamer in een PCR-array of bijv. de individuele reactievolumes waarin sequencingreacties plaatsvinden (inclusief zogenaamde patroonstroomcellen van Illumina).

De term "klinisch relevante nucleïnezuursequentie" of "doelchromosoom of chromosomaal segment" zoals hierin gebruikt, kan verwijzen naar een polynucleotidesequentie overeenkomstig een segment van een grotere genomische sequentie waarvan het potentiële onevenwicht is getest of naar de grotere genomische sequentie zelf. Een voorbeeld is de sequentie van chromosoom 21. Andere voorbeelden omvatten chromosoom 18, 13 X en Y. Nog andere voorbeelden omvatten gemuteerde genetische sequenties of genetische polymorfismen of kopieaantalvariaties (CNV's) die een foetus kan overerven van een of beide van de ouders. Nog andere voorbeelden omvatten sequenties die zijn gemuteerd, gewist of geamplificeerd in een kwaadaardige tumor, bijv. sequenties waarin verlies van heterozygositeit of genduplicatie voorkomt. In sommige uitvoeringsvormen kunnen meerdere klinisch relevante nucleïnezuursequenties, of equivalente meerdere makers van de klinisch relevante nucleïnezuursequenties worden gebruikt voor het bieden van gegevens voor het detecteren van het onevenwicht. Gegevens van vijf niet-opeenvolgende sequenties over chromosoom 21 kunnen bijvoorbeeld op een aanvullende manier worden gebruikt voor de bepaling van mogelijk onevenwicht in chromosoom 21, waardoor de nood aan monstervolume effectief wordt gereduceerd tot 1/5.

De term "oververtegenwoordigde nucleïnezuursequentie" zoals hierin gebruikt, verwijst naar de nucleïnezuursequentie van twee interessante sequenties (bijv. een klinisch relevante sequentie en een achtergrondsequentie) die in meer overvloed aanwezig is dan de andere sequentie in een biologisch monster.

De term "gebaseerd op" zoals hierin gebruikt, betekent "ten minste gedeeltelijk gebaseerd op" en verwijst naar één waarde (of resultaat) die wordt gebruikt bij de bepaling van een andere waarde, zoals plaatsvindt in verband met een ingang van een werkwijze en de uitgang van die werkwijze. De term "afleiden" zoals hierin gebruikt, verwijst naar de relatie van een ingang van een werkwijze en de uitgang van die werkwijze, zoals plaatsvindt wanneer de afleiding de berekening van een formule is.

De term "parameter" verwijst hierin naar een numerieke waarde die een kwantitatieve gegevensreeks en/of een numerieke relatie tussen kwantitatieve gegevensreeksen kenmerkt. Een verhouding (of functie van een verhouding) tussen het aantal sequentielezingen toegewezen aan een chromosoom en de lengte van het chromosoom waaraan de lezingen zijn toegewezen, is bijvoorbeeld een parameter.

De term "score" zoals hierin gebruikt, verwijst naar een numerieke waarde die is verbonden met of is gebaseerd op een specifiek kenmerk, bijv. het aantal aflezingen of aflezingstellingen voor een bepaalde sequentie die aanwezig is in een monster. De term "eerste score" wordt hierin gebruikt om te verwijzen naar een numerieke waarde die is verbonden met het doelchromosoom of chromosomaal segment. Een ander voorbeeld van een score is bijv. een Z-score die kwantificeert hoeveel het aantal aflezingen van een bepaalde sequentie verschilt van het aantal aflezingen die werden verkregen van dezelfde sequentie in een reeks referentiemonsters. Het is welbekend bij een vakman hoe een dergelijke Z-score kan worden berekend. De term "drempelwaarde" of "drempel" zoals hierin gebruikt, betekent een numerieke waarde waarvan de waarde wordt gebruikt voor het onderscheiden tussen twee of meer statussen (bijv. ziekte en niet-ziekte) van de classificatie voor een biologisch monster. Als een parameter bijvoorbeeld groter is dan de drempelwaarde, wordt een eerste classificatie van de kwantitatieve gegevens gemaakt (bijv. ziekte status); of als de parameter lager is dan de drempelwaarde, wordt een andere classificatie van de kwantitatieve gegevens gemaakt (bijv. niet-ziekte status).

De term "onevenwicht" zoals hierin gebruikt, betekent elke significante afwijking zoals gedefinieerd door ten minste één drempelwaarde in een hoeveelheid van de klinisch relevante nucleïnezuursequentie van een referentiehoeveelheid. De referentiehoeveelheid zou bijvoorbeeld een verhouding kunnen zijn van 3/5, en een onevenwicht zou dan kunnen plaatsvinden als de gemeten verhouding 1:1 is.

De term "willekeurige sequencing" zoals hierin gebruikt, verwijst naar sequencing, waarbij de gesequencete nucleïnezuurfragmenten niet specifiek zijn geïdentificeerd of beoogd vóór de sequencingprocedure. Sequentiespecifieke primers om te richten op specifieke genloci zijn niet vereist. De groepen gesequencete nucleïnezuren variëren van monster tot monster en zelfs van analyse tot analyse voor hetzelfde monster. De identiteiten van de gesequencete nucleïnezuren worden enkel bekendgemaakt van de gegenereerde sequencinguitgang. In sommige uitvoeringsvormen van de onderhavige uitvinding kan de willekeurige sequencing voorafgegaan worden door procedures voor het verrijken van een biologisch monster met bepaalde populaties nucleïnezuurmoleculen die bepaalde gemeenschappelijke kenmerken delen. In een uitvoeringsvorm hebben elk van de DNA-fragmenten in het biologische monster een gelijke kans om gesequencet te worden.

De term "fractie van het humane genoom" of "segment van het humane genoom" zoals hierin gebruikt, verwijst naar minder dan 100% van de nucleotidesequenties in het humane genoom dat zo'n 3 miljard baseparen van nucleotiden omvat. In de context van sequencing verwijst het naar minder dan 1-voudige dekking van de nucleotidesequenties in het humane genoom. De term kan uitgedrukt worden als een percentage of absoluut aantal nucleotiden/baseparen. Als een gebruikersvoorbeeld kan de term worden gebruikt om te verwijzen naar de werkelijke hoeveelheid sequencing dat is uitgevoerd. Uitvoeringsvormen kunnen de vereiste minimale waarde voor de gesequencete fractie van het humane genoom bepalen om een nauwkeurige diagnose te verkrijgen. Als een ander gebruiksvoorbeeld kan de term verwijzen naar de hoeveelheid gesequencete gegevens die zijn gebruikt voor het afleiden van een parameter of hoeveelheid voor de classificatie van ziektes.

De term "samenvattende statistieken" zoals hierin gebruikt, wordt gebruikt als een statistische term, en verwijst naar een indicatie van de omvang van een verdeling van waarden of scores, of een indicatie van de score/waarde aanwezig in het midden van de verdeling. Dit kan bijv. een gemiddelde of mediaan of standaardafwijking (StDev) of mediane absolute afwijking (mad) of gemiddelde absolute afwijking van een verzameling scores zijn.

De term "kopieaantalvariatie" of "CNV" (copy number variation) verwijst hierin naar variatie in het aantal kopieën van een nucleïnezuursequentie die enkele bp kb of groter is aanwezig in een testmonster in vergelijking met het kopieaantal van de nucleïnezuursequentie die aanwezig is in een gekwalificeerd monster. Een "kopieaantalvariant" verwijst naar de weinige bp of grotere sequentie van nucleïnezuur waarin verschillen in kopieaantallen worden gevonden door vergelijking van een interessante sequentie in het testmonster met die aanwezig in een gekwalificeerd monster. Kopieaantalvarianten/-variaties omvatten deleties, waaronder microdeleties evenals amplificaties. CNV's omvatten chromosomale aneuploïdieën en gedeeltelijke aneuploïdieën.

De term "aneuploïdie" verwijst hierin naar een onevenwicht van genetisch materiaal veroorzaakt door een verlies of versterking van een volledig chromosoom, of deel van een chromosoom. Aneuploïdie verwijst zowel naar chromosomale als subchromosomale onevenwichten, zoals, maar niet beperkt tot, deleties, microdeleties, inserties, micro-inserties, kopieaantalvariaties, duplicaties. Kopieaantalvariaties kunnen variëren in grootte in het bereik van 1 kb tot meerdere Mb. Grote subchromosomale afwijkingen die zich uitstrekken over tientallen MB's en/of overeenkomen met een significant deel van een chromosoomarm, kunnen ook segmentele aneuploïdieën worden genoemd.

De term "chromosomale aneuploïdie" verwijst hierin naar een onevenwicht van genetisch materiaal veroorzaakt door een verlies of versterking van een volledig chromosoom, en omvat kiemlijnaneuploïdie en mozaiëkaneuploïdie.

De term "gedeeltelijke aneuploïdie" verwijst hierin naar een onevenwicht van genetisch materiaal veroorzaakt door een verlies of versterking van een deel van een chromosoom bijv. gedeeltelijke monosomie en gedeeltelijke trisomie, en omvat onevenwichten die het resultaat zijn van translocaties, deleties en inserties.

De term "polymorfisme, polymorf doelnucleïnezuur", "polymorfe sequentie", "polymorfe doelnucleïnezuursequentie" en "polymorf nucleïnezuur" worden onderling verwisselbaar gebruikt om te verwijzen naar een nucleïnezuursequentie die een of meerdere polymorfe plaatsen bevat.

De term "polymorfe plaats" verwijst hier naar een enkel nucleotidepolymorfisme (SNP, single nucleotide polymorfisme), een kleinschalige multi-basis deletie of insertie, een Multi-Nucleotide Polymorfisme (MNP) of een Korte Tandemherhaling (STR, short tandem repeat) of een CNV (kopieaantalvariatie).

De term "meerdere" wordt hierin gebruikt met verwijzing naar een aantal nucleïnezuurmoleculen of sequentietags of aflezingen dat voldoende is voor het identificeren van significante verschillen in kopieaantalvariaties (bijv. chromosoomdoses) in testmonster en gekwalificeerde monsters met behulp van de werkwijzen volgens de uitvinding. In sommige uitvoeringsvormen worden ten minste ongeveer 3xl06 sequentietags, ten minste ongeveer 5xl06 sequentietags, ten minste ongeveer 8xl06 sequentietags, ten minste ongeveer lOxlO6 sequentietags, ten minste ongeveer 15xl06 sequentietags, ten minste ongeveer 20xl06 sequentietags, ten minste ongeveer 30xl06 sequentietags, ten minste ongeveer 40xl06 sequentietags, of ten minste ongeveer 50xl06 sequentietags verkregen voor elk testmonster. Elke sequentietag kan een enkele-sequentie aflezing zijn van 20 tot 400 bp, of een koppel van 2 sequentieaflezingen met gepaard uiteinde met elk 20 tot 400 bp.

De termen "polynucleotide", "nucleïnezuur" en "nucleïnezuurmoleculen" worden onderling verwisselbaar gebruikt en verwijzen naar een covalent-gebonden sequentie van nucleotiden (d.w.z. ribonucleotiden voor RNA en deoxyribonucleotiden voor DNA) waarin de 3'-positie van de pentose van één nucleotide wordt gebonden door een fosfodi-estergroep aan de 5'-positie van de pentose van de volgende, sequenties omvatten in eender welke vorm van nucleïnezuur, maar niet beperkt tot RNA- en DNA-moleculen. De term "polynucleotide" omvat, maar is niet beperkt tot, enkel- en dubbelstrengige polynucleotide.

De term "deel", wanneer gebruikt met verwijzing naar de hoeveelheid sequentie-informatie van nucleïnezuurmoleculen in een biologisch monster verwijst hierin naar de hoeveelheid sequentie-informatie van nucleïnezuurmoleculen in een biologisch monster die samen in aantal lager zijn dan de sequentie-informatie van <1 humaan genoom.

De term "testmonster" verwijst hierin naar een monster omvattende een mengsel van nucleïnezuren omvattende ten minste één nucleïnezuursequentie waarvan vermoed wordt dat het kopieaantal variatie ondergaan heeft of ten minste één nucleïnezuursequentie waarvoor het wenselijk is te bepalen of er een kopieaantalvariatie bestaat. Nucleïnezuren die aanwezig zijn in een testmonster worden testnucleïnezuren genoemd, of doelnucleïnezuren of doelchromosomen of chromosomale doelsegmenten.

De term "referentiemonster" verwijst hierin naar een monster omvattende een mengsel van nucleïnezuren waarvoor de sequencinggegevens worden gebruikt samen met de sequencinggegevens van het testmonster voor het berekenen van scores en parameters zoals beschreven in conclusie 1. Hoewel het niet noodzakelijk is, is een referentiemonster bij voorkeur normaal d.w.z. niet aneuploïde voor de interessante sequentie. Een referentiemonster is dus bij voorkeur een gekwalificeerd monster dat geen trisomie 21 draagt en dat kan worden gebruikt voor het identificeren van de aanwezigheid van een trisomie 21 in een testmonster.

De term "referentiereeks" omvat meerdere "referentiemonsters".

De term "verrijken" verwijst hierin naar het proces van het in het bijzonder amplificeren van bepaalde doelnucleïnezuren die zijn opgenomen in een segment van een monster. Het geamplificeerde product wordt dan vaak gecombineerd met de rest van het monster waaruit het segment verwijderd was.

De term "interessante sequentie" verwijst hierin naar een nudeïnezuursequentie die is geassocieerd met een verschil in sequentievoorstelling in gezonde versus zieke personen. Een interessante sequentie kan een sequentie op een chromosoom zijn dat verkeerd is voorgesteld d.w.z. over- of ondervertegenwoordigd, in een ziekte of genetische aandoening. Een interessante sequentie kan ook een segment van een chromosoom, of een chromosoom zijn. Een interessante sequentie kan bijvoorbeeld een chromosoom zijn dat oververtegenwoordigd is in een aneuploïdie-aandoening, of een gen dat een tumorsuppressor codeert die ondervertegenwoordigd is in een kanker. Interessante sequenties omvattende sequenties die over- of ondervertegenwoordigd zijn in de totale populatie, of een subpopulatie van cellen van een patiënt.

De term "meerdere polymorfe doelnucleïnezuren" verwijst hierin naar een aantal nucleïnezuursequenties elk omvattende ten minste één polymorfe plaats bijv. één SNP of CNV, zodat ten minste 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40 of meer verschillende polymorfe plaatsen worden geamplificeerd.

De term "groep chromosomen" verwijst hierin naar twee of meer chromosomen. De term "verzameling" verwijst naar een reeks chromosomen of chromosomale segmenten, maar kan ook verwijzen naar een reeks waarden of scores die zijn afgeleid van een overeenkomstige reeks chromosomen of chromosomale segmenten.

De term "aflezing" verwijst naar een experimenteel verkregen DNA-sequentie die voldoende lang is (bijv. ten minste ongeveer 20 bp) die kan worden gebruikt voor het identificeren van een grotere sequentie of gebied, bijv. die kan worden uitgelijnd en in het bijzonder toegewezen aan een chromosoomlocatie of genomisch gebied of gen.

De term "aflezingstelling" verwijst naar het aantal aflezingen die zijn opgehaald uit een monster die zijn toegewezen aan een referentiegenoom of een segment van het genoemde referentiegenoom (stuk).

De term "stuk" (bin) van een genoom moet worden begrepen als een segment van het genoom. Een genoom kan in verschillende stukken worden onderverdeeld, met hetzij een vaste hetzij een vooraf bepaalde grootte of een variabele grootte. Een mogelijke stukgrootte kan bijv. 10 kB, 20 kB, 30 kB, 40 kB, 50 kB, 60 kB, 70 kB, enz. zijn.

De term "venster" moet worden begrepen als meerdere stukken.

De termen "uitgelijnd", "uitlijning", "toegewezen" of "uitlijning", "toewijzing" verwijst naar een of meerdere sequenties die zijn geïdentificeerd als een match in termen van de volgorde van hun nucleïnezuurmoleculen met een gekende sequentie van een referentiegenoom. Een dergelijke uitlijning kan manueel of door een computeralgoritme worden gedaan, waarvoor voorbeelden onder andere het Efficient Local Alignment of Nucleotide Data (ELAND) computerprogramma zijn verdeeld als deel van de Illumina Genomics Analysts-pijpleiding. De overeenstemming van een sequentieaflezing bij de uitlijning kan een sequentiematch van 100% of minder dan 100% zijn (niet-perfecte match).

De term "referentiegenoom" zoals hierin gebruikt, verwijst naar een digitale nucleïnezuursequentiegegevensbank, samengesteld als een representatief voorbeeld van een soort' DNA. Aangezien het wordt samengesteld uit de sequencing van DNA van meerdere, stelt een referentiegenoom niet nauwkeurig het DNA van een enkele persoon voor. Het wordt gebruikt om de toewijzing van sequencingaflezingen van een monster aan specifieke chromosomale posities toe te laten.

De term "klinisch relevante sequentie" verwijst hierin naar een nucleïnezuursequentie die welbekend is en waarvan vermoed wordt dat deze is geassocieerd of betrokken met een genetische of ziekteaandoening. Het bepalen van de afwezigheid of aanwezigheid van een klinisch relevante sequentie kan nuttig zijn bij de bepaling van een diagnose of het bevestigen van een diagnose van een medische aandoening, of het stellen van een prognose voor de ontwikkeling van een ziekte.

De term "afgeleid" wanneer gebruikt in de context van een nucleïnezuur of een mengsel van nucleïnezuren, verwijst hierin naar de middelen waardoor het of de nucleïnezuren worden verkregen uit de bron waaruit ze afkomstig zijn. In één uitvoeringsvorm betekent een mengsel van nucleïnezuren dat is afgeleid van twee verschillende genomen bijvoorbeeld dat de nucleïnezuren, bijv. celvrij DNA, natuurlijk werden afgegeven door cellen door natuurlijk voorkomende processen zoals nécrosé of apoptose, of door lyse van de cellen omwille van onjuiste opslag-of transportomstandigheden.

De term "biologisch fluïdum" verwijst hierin naar een vloeistof die is genomen uit een biologische bron en omvat, bijvoorbeeld, bloed, serum, plasma, sputum, wasfluïdum, cerebrospinaal fluïdum, urine, sperma, zweet, tranen, speeksel, blastocoelfluïdum en dergelijke. Het verwijst ook naar het medium waarin biologische monsters kunnen worden gekweekt, zoals in vitro kweekmedium waarin cellen, weefsel of embryo kunnen worden gekweekt. Zoals hierin gebruikt, omvatten de termen "bloed", "plasma" en "serum" uitdrukkelijk fracties of verwerkte segmenten daarvan. Wanneer een monster uit een biopsie, uitstrijkje, smeer, enz. wordt genomen, omvat het "monster" zo ook uitdrukkelijk een verwerkte fractie of segment afgeleid van de biopsie, het uitstrijkje, smeer, enz.

De term "overeenkomstig" verwijst hierin naar een nucleïnezuursequentie, bijv. een gen of een chromosoom, dat aanwezig is in het genoom van verschillende patiënten, en dat niet noodzakelijk dezelfde sequentie heeft in alle genomen, maar dient voor het bieden van de identiteit eerder dan de genetische informatie van een interessante sequentie, bijv. een gen of chromosoom.

De term "in hoofdzaak celvrij" verwijst hierin naar bereidingen van het gewenste monster waaruit componenten die normaal daarmee zijn geassocieerd, zijn verwijderd. Een plasmamonster kan bijvoorbeeld in hoofdzaak celvrij gemaakt worden door het verwijderen van bloedcellen bijv. witte bloedcellen, die normaal daarmee zijn geassocieerd. In sommige uitvoeringsvormen worden in hoofdzaak vrije monsters verwerkt voor het verwijderen van cellen die anders zouden bijdragen tot het genetische materiaal dat moet worden getest op een aneuploïdie.

Zoals hierin gebruikt, verwijst de term "chromosoom" naar de erfelijke gendrager van een levende cel die is afgeleid van chromatine en die DNA en proteïnecomponenten (in het bijzonder histonen) omvat. Het conventioneel internationaal erkende individuele humane genoomchromosoomnummeringssysteem wordt hierin gebruikt. De term "chromosomale segmenten" moet worden begrepen als een deel van een chromosoom. De genoemde segmenten kunnen naar een stuk, venster of specifiek gebied binnen een chromosoom verwijzen, bijv. waarvan gekend is dat het bijvoorbeeld deleties of inserties of kopieaantalvariaties omvat.

Zoals hierin gebruikt, verwijst de term "polynucleotidelengte" naar het absolute aantal nucleïnezuurmoleculen (nucleotiden) in een sequentie of in een gebied van een referentiegenoom. De term "chromosoomlengte" verwijst naar de gekende lengte van het chromosoom gegeven in baseparen.

De term "patiënt" verwijst hierin naar een humane patiënt evenals een niet-humane patiënt zoals een zoogdier, een ongewerveld dier, een schimmel, een gist, een bacterie en een virus. Hoewel de voorbeelden hier betrekking hebben op humane cellen en de beschrijving hoofdzakelijk is gericht op mensen, is het concept van de onderhavige uitvinding van toepassing op genomen van eender welke plant of dier, en kan het worden gebruikt in het gebied van de dierengeneeskunde, dierenwetenschappen, onderzoekslaboratoria en dergelijke.

De term "conditie" verwijst hier naar "medische conditie" als een brede term die alle ziektes en aandoeningen omvat, maar die letsels en normale gezonde situaties kan omvatten, zoals zwangerschap, die een invloed kunnen hebben op de gezondheid van een persoon, voordeel uit medische hulp of implicaties hebben voor medische behandelingen. De genoemde aandoening is bij voorkeur gelinkt met de aanwezigheid van een tumor.

Gedetailleerde beschrijving van de uitvinding

De onderhavige uitvinding heeft betrekking op een werkwijze voor het bepalen of een patiënt tumorafgeleid celvrij DNA in zijn of haar perifeer bloed heeft, voor het bevestigen van een kankerdiagnose, voor het helpen bij de classificatie van een kanker, voor het beoordelen van de behandelingsrespons, voor het monitoren van de patiënt, voor het identificeren van de aanwezigheid van een kanker en/of een verhoogd risico op een kanker bij een patiënt, waarbij de genoemde patiënt bij voorkeur een zoogdier is. Deze identificatie kan worden uitgevoerd door de berekening van een parameter die is verbonden met chromosomale en/of subchromosomale gegevens die zijn verkregen uit een biologisch monster. Ook wordt een door de computer leesbaar medium voorzien dat is gecodeerd met meerdere instructies voor het sturen van een computersysteem voor het uitvoeren van de werkwijzen.

In één aspect wordt een hoeveelheid van aflezingstellingen gelinkt met een chromosoom of chromosomaal segment bepaald op basis van een sequencing van nucleïnezuurmoleculen in een biologisch monster, zoals urine, plasma, serum, blastocoel fluïdum en andere geschikte biologische monsters.

Nucleïnezuurmoleculen van het biologische monster zijn willekeurig gesequencet, zodat een fractie van het genoom wordt gesequencet. Eén of meerdere drempelwaarden worden gekozen voor het bepalen of er een verandering is vergeleken met een referentiehoeveelheid (d.w.z. onevenwicht), bijvoorbeeld met betrekking tot de verhouding van hoeveelheden van twee chromosomale gebieden (of reeksen van gebieden).

Het chromosomale doelgebied (ook een klinisch relevante nudeïnezuursequentie genoemd) en de achtergrondnucleïnezuursequentie kunnen van een eerste type cellen of van een of meerdere tweede types cellen afkomstig zijn. 1. Algemene methode voor het evalueren van een aneuploïdie

De onderhavige uitvinding beschrijft een methodologie voor het bepalen of een patiënt tumorafgeleid celvrij DNA in zijn of haar perifeer bloed heeft, voor het bevestigen van een kankerdiagnose, voor het helpen bij de classificatie van een kanker, voor het beoordelen van de behandelingsrespons, voor het monitoren van de patiënt, voor het identificeren van de aanwezigheid van een kanker en/of een verhoogd risico op een kanker bij een patiënt, waarbij de genoemde patiënt bij voorkeur een zoogdier is.

In een eerste aspect is de werkwijze voor het bepalen of een patiënt tumorafgeleid celvrij DNA in zijn of haar perifeer bloed heeft, voor het bevestigen van een kankerdiagnose, voor het helpen bij de classificatie van een kanker, voor het beoordelen van de behandelingsrespons, voor het monitoren van de patiënt, voor het identificeren van de aanwezigheid van een kanker en/of een verhoogd risico op een kanker bij een patiënt, gebaseerd op de bepaling van een parameter van het nucleïnezuurgehalte van een biologisch monster. Het biologische monster kan plasma, urine, serum, blastocoel fluïdum of enig ander geschikt monster zijn. De nucleïnezuurmoleculen kunnen bijvoorbeeld fragmenten van chromosomen zijn.Ten minste een deel van meerdere van de nucleïnezuurmoleculen opgenomen in het biologische monster wordt willekeurig gesequencet voor het verkrijgen van een aantal sequenties. Het gesequencete deel stelt een fractie van het humane genoom voor en kan worden geïsoleerd uit het monster door middel van conventionele middelen (bijv. celvrije DNA-extractiemiddelen en bereiding van een NGS-bibliotheek). In één uitvoeringsvorm zijn de nucleïnezuurmoleculen fragmenten van respectievelijke chromosomen. Eén uiteinde (bijv. 50 baseparen (bp)), beide uiteinden, of het volledige fragment kunnen gesequencet zijn. Een subreeks van de nucleïnezuurmoleculen in het monster kan gesequencet zijn, en deze subreeks wordt willekeurig gekozen, zoals hieronder meer in detail zal worden beschreven.

In één uitvoeringsvorm gebeurt de willekeurige sequencing met behulp van massief parallelle sequencing. Massief parallelle sequencing, zoals deze bereikt op de HiSeq2500, HiSeq3000, HiSeq4000, HiSeq X, MiSeq, MiSeqDx, NextSeq500, NextSeq550 flowcell, het 454 platform (Roche), Illumina Genome Analyzer (or Solexa platform) of PGM of Proton platform (IonTorrent) of GeneRead (Qiagen) of SOLiD System (Applied Biosystems) of de Hélicos True Single Molecule DNA-sequencingtechnologie, de enkele molecule, real-time (SMRT™) technologie van Pacific Biosciences, en nanopore sequencing zoals in MinlON, PromethION, GridlON (Oxford Nanopore technologies), laten de sequencing toe van veel nucleïnezuurmoleculen die op een parallelle manier zijn geïsoleerd uit een specimen bij hogere ordes van multiplexing. Elk van deze platforms sequencet klonaal geëxpandeerd of zelfs niet-geamplificeerde enkele moleculen van nucleïnezuurfragmenten. Klonale expansie kan worden verkregen door brugamplificatie, emulsie-PCR of Wildfire-technologie.

Aangezien een groot aantal sequencingaflezingen, in de grootorde van honderdduizenden tot miljoenen of zelfs mogelijk honderd miljoen of miljarden, worden gegenereerd uit elk monster in elke run, vormen de resulterende gesequencete aflezingen een representatief profiel van de mix van nucleïnezuurspecies in het originele specimen. Het halotype, transcriptoom en methylatieprofielen van de gesequencete aflezingen lijken bijvoorbeeld op deze van het originele specimen. Omwille van de grote bemonstering van sequenties uit elk specimen, is het aantal identieke sequenties, zoals deze gegenereerd uit de sequencing van een nucleïnezuurgroep op verschillende veelvouden van dekking of hoge redundantie, ook een goede kwantitatieve voorstelling van de telling van een bepaalde nucleïnezuurspecies of locus in het oorspronkelijke monster.

Op basis van de sequencing (bijv. gegevens uit de sequencing) wordt een eerste score van een doelchromosoom of chromosomaal segment bepaald. De eerst score wordt bepaald op basis van sequenties die zijn geïdentificeerd als afkomstig uit (d.w.z. alignerend met) het doelchromosoom of segment. Een bio-informatieprocedure kan dan bijvoorbeeld worden gebruikt om elk van deze DNA-sequenties voor het humaan genoom of een referentiegenoom te lokaliseren. Het is mogelijk dat een deel van dergelijke sequenties zal worden verwijderd uit latere analyse omdat ze aanwezig zijn in de herhalingsgebieden van het humane genoom, of in gebieden die worden onderworpen aan interindividuele variaties, bijv. kopienummervariaties. Een score van het doelchromosoom of chromosomaal segment en van een of meerdere andere chromosomen kan aldus worden bepaald.

Op basis van de sequencing wordt een verzameling van scores van een of meerdere chromosomen of chromosomale segmenten bepaald van sequenties die zijn geïdentificeerd als afkomstig uit (d.w.z. alignerend met) een reeks van een of meerdere chromosomen. In één uitvoeringsvorm bevat de genoemde reeks alle andere chromosomen naast de eerste (d.w.z. de eerste die is getest). In een andere uitvoeringsvorm bevat de genoemde reeks een enkel ander chromosoom. In een meest voorkeurdragende uitvoeringsvorm bevat de genoemde reeks chromosomen of chromosomale segmenten en omvat het het doelchromosoom of chromosomaal segment.

Er zijn een aantal manieren om een score te bepalen. De genoemde score is bij voorkeur gebaseerd op de aflezingstellingen die zijn verkregen uit sequencing. De genoemde aflezingstellingen kunnen het tellen omvatten van het aantal aflezingen, het aantal gesequencete nucleotiden (baseparen) of de geaccumuleerde lengtes van gesequencete nucleotiden (baseparen) afkomstig uit een bepaald chromoso(o)m(en) of chromosomale segmenten zoals stukken of vensters of klinisch relevante chromosoomdelen.

Regels kunnen worden opgelegd op de resultaten van de sequencing om te bepalen wat wordt geteld. In één aspect kan een aflezingstelling worden verkregen op basis van een deel van de gesequencete output. Sequencingoutput overeenkomstig nucleïnezuurfragmenten met een gespecificeerd groottebereik zou bijvoorbeeld kunnen worden geselecteerd.

In één uitvoeringsvorm is de genoemde score de onbewerkte aflezingstelling voor een bepaald chromosoom of chromosomaal segment.

In een voorkeurdragende uitvoeringsvorm worden de genoemde aflezingstellingen onderworpen aan wiskundige functies of bewerkingen om de genoemde score van de genoemde aflezingstelling af te leiden. Dergelijke bewerkingen zijn, onder andere, maar zijn niet beperkt tot, statistische bewerkingen, regressiemodellen, standaard berekeningen (optellen, aftrekken, vermenigvuldigen en delen), waarbij de genoemde standaard berekeningen bij voorkeur zijn gebaseerd op een of meerdere verkregen aflezingstellingen.

In een voorkeurdragende uitvoeringsvorm is de genoemde eerste score een genormaliseerde waarde die is afgeleid van de aflezingstellingen of wiskundig gewijzigde aflezingstellingen. In een andere voorkeurdragende uitvoeringsvorm is de genoemde score een Z-score of standaard score met betrekking tot de aflezingstellingen van een bepaald chromosoom, chromosomaal segment of de wiskundig gewijzigde tellingen, waarbij de Z-score kwantificeert hoeveel het aantal aflezingen van een bepaalde sequentie verschilt van het aantal aflezingen die zijn verkregen uit dezelfde sequentie in een reeks referentiemonsters. Het is welbekend bij een vakman hoe een dergelijke Z-score kan worden berekend.

In een voorkeurdragende uitvoeringsvorm wordt een parameter bepaald op basis van een eerste score (overeenkomstig het doelchromosoom of chromosomaal segment) en een verzameling van scores. De parameter stelt bij voorkeur een relatieve score voor tussen de eerste score en een samenvattende statistiek van de verzameling van scores. De parameter kan, bijvoorbeeld, een eenvoudige verhouding voorstellen van de eerste score ten opzichte van een samenvattende statistiek van de verzameling van scores. In één aspect zou elke score een argument van een functie of afzonderlijke functies kunnen zijn, waarbij een verhouding dan kan worden genomen van deze afzonderlijke functies. De parameter kan, bijvoorbeeld, een eenvoudige verhouding voorstellen van de eerste score ten opzichte van een samenvattende statistiek van scores in de verzameling. In één aspect zou elke score een argument van een functie of afzonderlijke functies kunnen zijn, waarbij een verhouding dan kan worden genomen van deze afzonderlijke functies.

In een voorkeurdragende uitvoeringsvorm kan de parameter worden verkregen door een verhouding tussen: - een eerste functie waarbij de eerste score en de verzameling van scores de argumenten zijn; - een tweede functie waarbij de verzameling van scores het argument is.

In een voorkeurdragende uitvoeringsvorm is de genoemde eerste functie gedefinieerd als een verschil, bij voorkeur het verschil tussen de eerste score en een samenvattende statistiek van de verzameling van scores, waarbij de genoemde samenvattende statistiek bij voorkeur is geselecteerd uit het gemiddelde, de mediaan, de standaardafwijking of mediane absolute afwijking (mad) of gemiddelde absolute afwijking.

In een andere voorkeurdragende uitvoeringsvorm is de genoemde tweede functie gedefinieerd als een variabiliteitsamenvattende statistiek van de verzameling van scores, waarbij de genoemde samenvattende statistiek bij voorkeur is geselecteerd uit het gemiddelde, de mediaan, de standaardafwijking of mediane absolute afwijking (mad) of gemiddelde absolute afwijking.

Een geschikte uitvoeringsvorm volgens de onderhavige uitvinding omvat gewoonlijk de volgende stappen (na DNA-sequenties uit een willekeurige, lage-dekking sequencingproces op een biologisch monster te hebben verkregen). - het aligneren van sequenties met een referentiegenoom; - het verkrijgen van de aflezingstellingen per chromosoom of chromosomaal segment; - het normaliseren van het aantal aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score die is afgeleid van het genoemde genormaliseerde aantal aflezingen en een verzameling van scores afgeleid van de genoemde genormaliseerde aflezingstellingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van het genormaliseerde aantal aflezingen die waren verkregen uit een reeks chromosomen of chromosoomsegmenten die het chromosomaal doelsegment of chromosoom omvatten; - het berekenen van een parameter van de genoemde scores, waarbij de genoemde parameter een verhouding voorstelt tussen de genoemde eerste score en een samenvattende statistiek van de genoemde verzameling scores, waarbij de eerste functie van de genoemde verhouding wordt gedefinieerd als een verschil tussen de eerste score en een sa men vattende statistiek van de genoemde verzameling scores; en waarbij de tweede functie van de genoemde verhouding wordt gedefinieerd als een samenvattende statistiek van de genoemde verzameling scores. De genoemde sequenties worden bij voorkeur verkregen door lage-dekking sequencing.

De genoemde normalisatie vindt bij voorkeur plaats op basis van een reeks referentiemonsters, waarbij de genoemde referentiemonsters bij voorkeur, maar niet noodzakelijk, euploïde of in hoofdzaak euploïde zijn voor het chromosoom of chromosomaal segment dat overeenkomt met het doelchromosoom of chromosomaal segment (d.w.z. het grootste deel van het chromosoom of chromosomaal segment in de referentiemonsters die overeenkomen met het doelchromosoom of chromosomaal segment in het testmonster zijn euploïde). Dergelijke referentiereeks heeft verschillende monstergroottes. Een mogelijke monstergrootte kan bijv. 100 monsters zijn, zoals 50 mannelijke en 50 vrouwelijke monsters. Het zal duidelijk zijn voor een vakman dat de referentiereeks vrij kan worden gekozen door de gebruiker.

Het genoemde aantal aflezingen is bij voorkeur opnieuw gekalibreerd om te corrigeren voor GC-inhoud en/of totaal aantal aflezingen verkregen uit het genoemde monster.

Door rekening te houden met een reeks scores afgeleid van aflezingen van chromosomen of chromosomale segmenten die het doelchromosoom of chromosomale segment bevatten voor berekening van de verzameling van scores, kan een gevoeligere en betrouwbaardere parameter worden verkregen in vergelijking met werkwijzen volgens de stand der techniek. Anders dan in de werkwijzen die bekend zijn in de stand der techniek moet er geen veronderstelling worden gedaan over de ploïde-status van enige van de chromosomen in het testmonster. Zelfs als meerdere aneuploïdieën aanwezig zouden zijn in het testmonster of er veel technische of biologische ruis aanwezig is (bijv. afkomstig van de aanwezigheid van kanker of CNV's), biedt de huidige parameter p nog steeds een waardevol instrument, terwijl de werkwijzen die bekend zijn in de stand der techniek kunnen falen in deze situaties (Vandenberghe et al., "Non-invasive détection of genomic imbalances in Hodgkin/Reed-Sternberg cells in early and advanced stage Hodgkin's lymphoma by sequencing of circulating cell-free DNA: a technical proof-of-principle study", 2015). Door een parameter volgens de onderhavige uitvinding te definiëren is de parameter voor het chromosoom of gebied dat moet worden geanalyseerd namelijk duidelijk (d.w.z. is het sterk toegenomen/afgenomen) en verdwijnt het niet in de ruis (d.w.z. slechts matig of niet toegenomen/afgenomen). Voor de screening is gevoeligheid bovendien essentieel, aangezien het belangrijk is een betrouwbaar en te vertrouwen resultaat te hebben, waarbij het aantal valse negatieven wordt geminimaliseerd. Voor de screening kan het namelijk belangrijker zijn hoge gevoeligheid te hebben vergeleken met specificiteit.

De parameter volgens de onderhavige uitvinding laat robuuste detectie en automatische classificatie van chromosomen toe, zelfs in gegevens met ruis. Door rekening te houden met een verzameling van chromosomen of segmenten, inclusief het doelchromosoom of segment, d.w.z. het merendeel van informatie die aanwezig is in de gegevensreeks, wordt het merendeel van de beschikbare informatie gebruikt, waardoor een adequatere analyse wordt verkregen. Als men bijv. chromosoom 1 (het grootse chromosoom, 7,9% van het genoom) zou verwijderen, zou een grote hoeveelheid gegevens worden verwijderd waarmee geen rekening wordt gehouden, hetgeen een verstoring in de analyse zou veroorzaken.

De onderhavige uitvinding is in het bijzonder erg nuttig in situaties waarin een laag aantal aflezingen of gegevens met ruis wordt verkregen. De uitvinders hebben gevonden dat de parameter volgens de onderhavige uitvinding, in de laatste situaties, superieur was vergeleken met andere methodologieën.

In een voorkeurdragende uitvoeringsvorm worden de genoemde scores verkregen op basis van de genomische voorstelling van het doelchromosoom of chromosomaal segment (of een gebied daarvan) en de genomische voorstelling van alle autosomen of andere chromosomen, waardoor het doelchromosoom of chromosomaal segment opgenomen is.

De parameter wordt vergeleken met een of meerdere drempelwaarden. De drempelwaarden kunnen worden bepaald op enig aantal geschikte manieren. Dergelijke manieren zijn onder andere waarschijnlijkheidsmethode van het Bayesiaanse type, sequentiële waarschijnlijkheidstest (SPRT, sequential proability ratio testing), ontdekking van valse resultaten, betrouwbaarheidsinterval, door de ontvanger bediend kenmerk (ROC, receiver operating characteristic). In een meer voorkeurdragende uitvoeringsvorm is de genoemde drempelwaarde gebaseerd op statistische overwegingen of wordt het empirisch bepaald door het testen van biologische monsters. De drempelwaarde kan worden gevalideerd door middel van testgegevens of een validatiereeks en kan, indien nodig, worden gewijzigd telkens meer gegevens beschikbaar zijn.

Op basis van de vergelijking wordt een classificatie bepaald of een chromosomale aneuploïdie bestaat voor het doelchromosoom. In een uitvoeringsvorm is de classificatie een definitieve ja of nee. In een andere uitvoeringsvorm kan de classificatie niet classificeerbaar zijn of onzeker. In nog een andere uitvoeringsvorm kan de classificatie een score zijn die moet worden geïnterpreteerd op een latere datum, bijvoorbeeld, door een arts. In een andere uitvoeringsvorm kan de classificatie gebeuren op een genoombreed niveau. In nog een andere uitvoeringsvorm kan de classificatie een score zijn die de kans bepaalt op de aanwezigheid van genoombrede instabiliteit of de aanwezigheid van een vooraf gedefinieerde CNV-handtekening (d.w.z. een gedefinieerde combinatie van CNV's of subchromosomale of chromosomale kopieaantalafwijkingen).

In een verder voorkeurdragende uitvoeringsvorm worden secundaire parameters van de aflezingstellingen berekend, die dienen als een aanvullende interne controle voor de bruikbaarheid van de parameter, de omvang van de aneuploïdie (indien geïdentificeerd) en/of een indicatie voor de betrouwbaarheid van de parameter, het biologische monster of de sequenties die zijn verkregen daarvan en bijgevolg de uiteindelijke beoordeling. De genoemde secundaire parameters kunnen een vereiste zijn voor de aanwezigheid van de genoemde aneuploïdie en/of een maatstaf voor de kwaliteit van het monsters evenals een maatstaf voor genoombrede instabiliteit.

In één uitvoeringsvorm wordt de genoemde secundaire parameter berekend als de mediaan van de Z-verdeling van de aflezingstellingen of een afgeleide daarvan, voor een doelchromosoom of chromosomaal doelsegment gemeten per stuk of een verzameling stukken (d.w.z. vensters). De laatste secundaire parameters laten beoordeling toe als het merendeel (meer dan 50%) van de vensters in een chromosoom is toegenomen of afgenomen. Het laatste laat de detectie van chromosomale en grote subchromosomale aneuploïdeën toe. Wanneer minder dan 50% van de vensters getroffen wordt, zullen de secundaire parameters niet beïnvloed worden (bijv. kleinere CNV's).

In een andere uitvoeringsvorm kunnen de genoemde secundaire parameters worden berekend als de mediaan van de absolute waarde van de Z-scores voor de aflezingstellingen of een afgeleide daarvan, van de resterende chromosomen (dat is een verzameling van chromosomen of segmenten die het doelchromosoom of segment uitsluiten).

De laatste secundaire parameters laten de detectie toe van bijv. de aanwezigheid van technische of biologische instabiliteiten (cf. kwaadaardigheden, kanker) en het onderscheiden daarvan van CNV's van de moeder. Als minder dan de vensters van de andere of alle chromosomen getroffen worden, zal deze secundaire parameters niet beïnvloed worden. Als meer dan 50% van de vensters getroffen wordt, zal dit kunnen worden afgeleid van de genoemde secundaire parameters.

In een andere uitvoeringsvorm biedt de onderhavige uitvinding ook een kwaliteitsscore (QS). QS laat toe de algemene variatie binnen het genoom te beoordelen. Een lage QS is een indicatie van een goede monsterverwerking en een laag niveau van technische en biologische ruis. Een stijging in de QS kan twee mogelijke redenen hebben. Hetzij een fout die is opgetreden tijdens de verwerking van het monster. In het algemeen zal aan de gebruiker worden gevraagd een nieuw biologisch staal af te nemen en te testen. Dit is typisch voor matig gestegen QS-scores. Een sterk gestegen QS zou een indicatie kunnen zijn van een sterk aneuploïde monster en de gebruiker zal worden aangemoedigd een bevestigende test te doen. De genoemde QS wordt bij voorkeur bepaald door het berekenen van de standaardafwijkingen van alle Z-scores voor chromosomen of chromosomale segmenten en optioneel door het verwijderen van de uitschieters daarvan (d.w.z. de hoogste en laagste Z-scores in deze verzameling).

In een uitvoeringsvorm van de onderhavige uitvinding zal de parameter p voldoende zijn om een onderscheid te maken tussen de aanwezigheid en/of afwezigheid van een aneuploïdie. In een meer voorkeurdragende uitvoeringsvorm van de onderhavige uitvinding zullen zowel de parameter als de secundaire parameters worden gebruikt om een beslissing te nemen met betrekking tot de aanwezigheid of afwezigheid van een aneuploïdie. Ook de genoemde secundaire parameters zullen bij voorkeur vergeleken worden met vooraf gedefinieerde drempelwaarden.

In een voorkeurdragende uitvoeringsvorm omvatten het genoemde doelchromosoom of chromosomaal segment volledige chromosoomamplificaties en/of deleties waarvan gekend is dat ze zijn geassocieerd met een kanker (bijv. zoals hierin beschreven). In bepaalde uitvoeringsvormen omvatten het genoemde doelchromosoom of chromosoomsegmenten chromosoomsegmentamplificaties of deleties waarvan bekend is dat ze zijn geassocieerd met een of meerdere kankers. In bepaalde uitvoeringsvormen omvatten de chromosoomsegmenten in hoofdzaak volledige chromosoomarmen (bijv. zoals hierin beschreven). In bepaalde uitvoeringsvormen omvatten de chromosoomsegmenten volledige chromosoomaneuploïdieën. In bepaalde uitvoeringsvormen omvatten de volledige chromosoomaneuploïdiën een verlies, terwijl de volledige chromosoomaneuploïdiën in bepaalde andere uitvoeringsvormen een winst (bijv. een winst of een verlies zoals getoond in Tabel 1) omvatten. In bepaalde uitvoeringsvormen zijn de interessante chromosoomsegmenten in hoofdzaak segmenten op armniveau omvattende een p arm of een q arm van een of meerdere chromosomen 1-22, X en Y. In bepaalde uitvoeringsvormen omvatten de aneuploïdieën een amplificatie van een substantieel segment op armniveau van een chromosoom of een deletie van een substantieel segment op armniveau van een chromosoom. In bepaalde uitvoeringsvormen omvatten de interessante chromosomale segmenten in hoofdzaak een of meerdere armen geselecteerd uit de groep bestaande uit lq, 3q, 4p, 4q, 5p, 5q, 6p, 6q, 7p, 7q, 8p, 8q, 9p, 9q, 10p, lOq, 12p, 12q, 13q, 14q, 16p, 17p, 17q, 18p, 18q, 19p, 19q, 20p, 20q, 21q en/of 22q. In bepaalde uitvoeringsvormen omvatten de aneuploïdieën een amplificatie van een of meerdere armen geselecteerd uit de groep bestaande uit lq, 3q, 4p, 4q, 5p, 5q, 6p, 6q, 7p, 7q, 8p, 8q, 9p, 9q, 10p, lOq, 12p, 12q, 13q, 14q, 16p, 17p, 17q, 18p, 18q, 19p, 19q, 20p, 20q, 21q, 22q. In bepaalde uitvoeringsvormen omvatten de aneuploïdieën een deletie van een of meerdere armen geselecteerd uit de groep bestaande uit lq, 3q, 4p, 4q, 5q, 6q, 8p, 8q, 9p, 9q, 10p, lOq, lip, llq, 13q, 14q, 15q, 16q, 17p, 17q, 18p, 18q, 19p, 19q, 22q. In bepaalde uitvoeringsvormen zijn de interessante chromosomale segmenten segmenten die een gebied en/of een gen omvatten getoond in Tabel 3 en/of Tabel 5 en/of Tabel 4 en/of Tabel 6. In bepaalde uitvoeringsvormen omvatten de aneuploïdieën een amplificatie van een gebied en/of een gen getoond in Tabel 3 en/of Tabel 5. In bepaalde uitvoeringsvormen omvatten de aneuploïdieën een deletie van een gebied en/of een gen getoond in Tabel 4 en/of Tabel 6. In bepaalde uitvoeringsvormen zijn de interessante chromosoomsegmenten segmenten waarvan bekend is dat ze een of meerdere oncogenen en/of een of meerdere tumoronderdrukkende genen omvatten. In bepaalde uitvoeringsvormen omvatten de aneuploïdieën een amplificatie van een of meerdere gebieden geselecteerd uit de groep bestaande uit 20Q13, 19ql2, Iq21-lq23, 8pll-pl2, en de ErbB2. In bepaalde uitvoeringsvormen omvatten de aneuploïdieën een amplificatie van een of meerdere gebieden omvattende een gen geselecteerd uit de groep bestaande uit MYC, ERBB2 (EGFR), CCND1 (Cyclin Dl), FGFR1, FGFR2, HRAS, KRAS, MYB, MDM2, CCNE, NRAS, MET, ERBB1, CDK4, MYCB, ERBB2, AKT2, MDM2, BRAF, ARAF, CRAF, PIK3CA, AKT1, PTEN, STK11, MAP2K1, ALK, ROS1, CTNNB1, TP53, SMAD4, FBX7, FGFR3, NOTCH1, ERBB4 en CDK4 en dergelijke. In bepaalde uitvoeringsvormen is de kanker een kanker geselecteerd uit de groep bestaande uit leukemie, ALL, hersenkanker, borstkanker, colorectale kanker, gededifferentieerd liposarcoom, esofagaal adenocarcinoom, esofagale squameuze celkanker, GIST, glioom, HCC, hépatocellulaire kanker, longkanker, long NSC, long SC, medullobastoom, melanoom, MPD, myeloproliferatieve aandoening, baarmoederhalskanker, eierstokkanker, prostaatkanker en nierkanker.

In bepaalde uitvoeringsvormen omvat het biologisch monster een monster dat is geselecteerd uit de groep bestaande uit volledig bloed, een bloedfractie, speeksel/oraal fluïdum, urine, een weefselbiopsie, pleuraal fluïdum, pericardiaal fluïdum, cerebrospinaal fluïdum en peritonaal fluïdum

In bepaalde uitvoeringsvormen wijst de detectie van aneuploïdieën of genoombrede instabiliteit of CNV-handtekeningen of microsatellietinstabiliteit (MSI) op een positief resultaat en omvat de genoemde werkwijze verder het voorschrijven, starten en/of veranderen van een behandeling aan een humane patiënt van wie het testmonster was afgenomen. In bepaalde uitvoeringsvormen omvat het voorschrijven, starten en/of veranderen van een behandeling aan een humane patiënt van wie het testmonster was afgenomen, het voorschrijven en/of uitvoeren van verdere diagnose voor het bepalen van de aanwezigheid en/of ernst van een kanker. In bepaalde uitvoeringsvormen omvatten de verdere diagnostische handelingen het screenen van een monster van de genoemde patiënt voor een biomarker van een kanker, en/of beeldvorming van de genoemde patiënt voor een kanker. In bepaalde uitvoeringsvormen, wanneer de genoemde werkwijze de aanwezigheid aangeeft van neoplastische cellen bij het genoemde zoogdier, omvat het behandelen van het genoemde zoogdier of ervoor zorgen dat het genoemde zoogdier wordt behandeld, het verwijderen en/of het afremmen van de groei of proliferatie van de genoemde neoplastische cellen. In bepaalde uitvoeringsvormen omvat het behandelen van het zoogdier het chirurgisch verwijderen van de neoplastische (bijv. tumor) cellen. In bepaalde uitvoeringsvormen omvat het behandelen van het zoogdier het uitvoeren van radiotherapie of het ervoor zorgen dat radiotherapie wordt uitgevoerd op het genoemde zoogdier om de neoplastische cellen te doden. In bepaalde uitvoeringsvormen omvat het behandelen van het genoemde zoogdier het toedienen of het ervoor zorgen dat aan het genoemde zoogdier kankerbestrijdende geneesmiddelen worden toegediend zoals Receptor Tyrosine Kinase (RTK)-remmers, kinaseremmers, CTLA4-remmers, PDl-remmers, PDL1-remmers, immunothérapie, tumor-targeting T-celtherapieën, chimere antigen receptor (CAR) T-celtherapie, kankervaccins (bijv., matuzumab, erbitux, vectibix, nimotuzumab, matuzumab, panitumumab, fluorouracil, capecitabine, 5-trifluoromethyl-2'-deoxyuridine, methotrexaat, raltitrexed, pemetrexed, cytosine arabinoside, 6-mercaptopurine, azathioprine, 6-thioguanine, pentostatine, fludarabine, cladribine, floxuridine, cyclophosphamide, neosar, ifosfamide, thiotepa, l,3-bis(2-chloroethyl)-l-nitosourea, l,-(2-chloroethyl)-3-cyclohexyl-lnitrosourea, hexamethylmelamine, busulfan, procarbazine, dacarbazine, chlorambucil, melphalan, cisplatine, carboplatine, oxaliplatine, bendamustine, carmustine, chloromethine, dacarbazine, fotemustine, lomustine, mannosulfan, nedaplatine, nimustine, prednimustine, ranimustine, satraplatin, semustine, streptozocine, temozolomide, treosulfan, triaziquon, triethyleenmelamine, thiotepa, triplatinetetranitraat, trofosfamide, uramustine, doxorubicine, daunorubicine, mitoxantron, etoposide, topotecan, teniposide, irinotecan, camptosar, camptothecine, belotecan, rubitecan, vincristine, Vinblastine, vinorelbine, vindesine, paclitaxel, docetaxel, abraxane, ixabepilone, larotaxel, ortataxel, tesetaxel, vinflunine, imatinib mesylaat, sunitinib malaat, sorafenib tosylaat, nilotinib hydrochloride monohydraat, tasigna, semaxanib, vandetanib, vatalanib, vemurafenib, dabrafenib, trametinib, ipilimumab, pembrolizumab, nivolumab, retinoïnezuur, een retinoïnezuurderivaat, en dergelijke).

Werkwijzen voor het monitoren van een behandeling van een patiënt voor een kanker worden ook voorzien. In verscheidene uitvoeringsvormen omvatten de werkwijzen het uitvoeren van een werkwijze voor het bepalen of een patiënt van tumorafgeleid celvrij DNA heeft in zijn of haar perifeer bloed, voor het bevestigen van de diagnose van kanker, voor het helpen bij de classificatie van een kanker, voor het beoordelen van de behandelingsrespons, voor het monitoren van de patiënt, voor het identificeren van de aanwezigheid van een kanker en/of een verhoogd risico op een kanker bij een zoogdier zoals hierin beschreven op een monster van de patiënt of het ontvangen van de resultaten van dergelijke werkwijze uitgevoerd op het monster voor of tijdens de behandeling; en het opnieuw uitvoeren van de werkwijze op een tweede monster van de patiënt of het ontvangen van de resultaten van een dergelijke werkwijze uitgevoerd op het tweede monster op een later tijdstip tijdens of na de behandeling; waarbij een verlaagd aantal of een verlaagde ernst van aneuploïdie (bijv. een verlaagde aneuploïdiefrequentie en/of een daling of afwezigheid van bepaalde van bepaalde aneuploïdieën) of een verandering in de CNV-handtekening in de tweede meting (bijv. in vergelijking met de eerste meting) een indicator kan zijn van een positief verloop van de behandeling en hetzelfde of een gestegen aantal of ernst van aneuploïdie of geen of een ongunstige verandering in de CNV-handtekening in de tweede meting (bijv. in vergelijking met de eerste meting) een indicator kan zijn van een negatief verloop van de behandeling en, wanneer de genoemde indicator negatief is, het aanpassen van het behandelingsregime aan een meer agressief behandelingsregime en/of een palliatief behandelingsregime.

Tabel 1 Illustratieve specifieke, terugkerende chromosoomwinsten en -verliezen bij kanker bij mensen (zie bijv. Gordon et al. (2012) Nature Rev. Genetics. 13: 189-203).

In verschillende uitvoeringsvormen kan de werkwijze die hierin beschreven is, worden gebruikt voor het detecteren en/of kwantificeren van volledige chromosoomaneuploïdieën die zijn geassocieerd met kanker in het algemeen en/of die zijn geassocieerd met bepaalde kankers. In bepaalde uitvoeringsvormen worden bijgevolg detectie en/of kwantificatie van volledige chromosoomaneuploïdieën gekenmerkt door winsten of verliezen getoond in Tabel 1 verwacht.

Verschillende studies hebben patronen van kopieaantalvariaties op armniveau binnen grote aantallen kankerspecimens gerapporteerd (Lin et al. Cancer Res 68, 664-673 (2008); George et al. PLoS ONE 2, e255 (2007); Demichelis et al. Genes Chromosomes Cancer 48: 366-380 (2009); Beroukhim et al. Nature. 463(7283): 899-905 [2010]). Daarnaast is vastgesteld dat de frequentie van kopieaantalvariaties op armniveau afneemt met de lengte van chromosoomarmen. Aangepast aan deze trend vertonen de meeste chromosoomarmen sterk bewijs van voorkeurdragende winsten of verliezen, maar zelden beide, binnen meervoudige kankergeslachten (zie bijv. Beroukhim et al. Nature. 463(7283): 899-905 [2010]).

In een uitvoeringsvorm worden de hierin beschreven werkwijzen overeenkomstig gebruikt voor het bepalen van CNV's op armniveau (CNV's omvattende één chromosomale arm of in hoofdzaak één chromosomale arm) in een monster. De CNV's kunnen worden bepaald in een testmonster omvattende een constitutioneel (kiemlijn) nucleïnezuur en de CNV's op armniveau kunnen worden geïdentificeerd in deze constitutionele nucleïnezuren. In bepaalde uitvoeringsvormen worden CNV's op armniveau geïdentificeerd (indien aanwezig) in een monster omvattende een mengsel van nucleïnezuren (bijv. nucleïnezuren die zijn afgeleid van normale en nucleïnezuren afgeleid van neoplastische cellen). In bepaalde uitvoeringsvormen is het monster afgeleid van een patiënt van wie vermoed wordt of gekend is dat hij/zij kanker heeft bijv. carcinoom, sarcoom, lymfoom, leukemie, kiemceltumoren, blastoom en dergelijke. In een uitvoeringsvorm is het monsters een plasmamonster dat is afgeleid (verwerkt) van perifeer bloed dat een mengsel van cfDNA omvat dat is afgeleid van normale en kankercellen. In een andere uitvoeringsvorm is het biologische monster dat wordt gebruikt voor het bepalen of een CNV aanwezig is, afgeleid van cellen die, indien een kanker aanwezig is, een mengsel van kanker- en niet-kankercelen omvat van andere biologische weefsels waaronder, maar niet beperkt tot, biologische fluïda zoals serum, zweet, tranen, sputum, urine, sputum, oorsmeer, lymfe, speeksel, cerebropinaal fluïdum, ravages, beenmergsuspensie, vaginaal vocht, transcervicale spoeling, hersenvocht, ascites, melk, afscheidingen van de ademhalings-, darm- en urogenitale kanalen, en leukoforesemonsters, of in weefselbiopsieën, uitstrijkjes of smeersels. In andere uitvoeringsvormen is het biologische monster een monster van stoelgang (fecaal monster).

In verschillende uitvoeringsvormen omvatten de CNV's die als indicatief zijn geïdentificeerd voor de aanwezigheid van een kanker of een verhoogd risico op een kanker, maar zijn ze niet beperkt tot, CNV's op armniveau die in Tabel 2 zijn opgenomen. Zoals in Tabel 2 wordt geïllustreerd zijn bepaalde CNV's die een substantiële winst op armniveau omvatten, indicatief voor de aanwezigheid van een kanker of een verhoogd risico op kanker voor een bepaalde kanker. Een winst van lq is bijgevolg bijvoorbeeld indicatief voor de aanwezigheid of een verhoogd risico op acute lymfoblastische leukemie (ALL), borstkanker, GIST, HCC, long NSC, medulloblastoom, melanoom, MPD, eierstokkanker en/of prostaatkanker. Een winst van 3q is indicatief voor de aanwezigheid of een verhoogd risico op esofagale squameuze kanker, Long SC en/of PMD. Een winst van 7q is indicatief voor de aanwezigheid of een verhoogd risico op colorectale kanker, glioom, HCC, long NSC, medulloblastoom, melanoom, prostaatkanker en/of nierkanker. Een winst van 7p is indicatief voor de aanwezigheid of een verhoogd risico op borstkanker, colorectale kanker, esofagaal adenocarcinoom, glioom, HCC, Long NSC, medulloblastoom, melanoom en/of nierkanker. Een winst van 20q is indicatief voor de aanwezigheid of een verhoogd risico op borstkanker, colorectale kanker, gededifferentieerd liposarcoom, esofagaal adenocarcinoom, esofagaal squameus, glioomkanker, HCC, long NSC, melanoom, eierstokkanker en/of nierkanker enzovoort.

Zo ook, zoals in Tabel 2 wordt geïllustreerd zijn bepaalde CNV's die een substantiële winst op armniveau omvatten, indicatief voor de aanwezigheid en/of een verhoogd risico voor bepaalde kankers. Een verlies van lp is bijgevolg bijvoorbeeld indicatief voor de aanwezigheid of een verhoogd risico voor gastrointestinale stromale tumor. Een verlies van 4q is indicatief voor de aanwezigheid of een verhoogd risico op colorectale kanker, esofagaal adenocarcinoom, long SC, melanoom, eierstokkanker en/of nierkanker. Een winst van 17p is indicatief voor de aanwezigheid of een verhoogd risico op borstkanker, colorectale kanker, esofagaal adenocarcinoom, HCC, Long NSC, Long SC, en/of eierstokkanker.

Tabel 2 Significante kopieaantalveranderingen van het chromosomaal segment op armniveau bij elk van 16 kankersubtypes

De voorbeelden van associaties tussen kopieaantalvariaties op armniveau zijn bedoeld om illustratief en niet limitatief te zijn. Andere kopieaantalvariaties op armniveau en de kankerassociaties ervan zijn welbekend bij de vakman.

Andere kopieaantalvariaties die geen significant deel van een chromosoom of chromosoomarm dekken, zoals CNV's van 1 kb tot 1Mb, of 1 kb tot 10 Mb, of 100 kb tot 10 Mb, of 1 kb tot 50 Mb, of 2 bp tot 10 Mb of 2 bp tot 50 Mb zouden even informatief kunnen zijn voor de detectie of bevestiging van de aanwezigheid van tumorafgeleid celvrij DNA.

Zoals hierboven is aangegeven, kan de hierin beschreven werkwijze worden gebruikt voor het bepalen van de aan- of afwezigheid van een chromosomale amplificatie. In sommige uitvoeringsvormen is de chromosomale amplificatie de winst van een of meerdere volledige chromosomen. In andere uitvoeringsvormen is de chromosomale amplificatie de winst van een of meerdere segmenten van een chromosoom. In nog andere uitvoeringsvormen is de chromosomale amplificatie de winst van twee of meerdere segmenten van twee of meer chromosomen. In verschillende uitvoeringsvormen kan de chromosomale amplificatie de winst van een of meerdere oncogenen omvatten.

Dominant optredende genen die zijn geassocieerd met humane solide tumoren oefenen hun effect gewoonlijk uit door overexpressie of gewijzigde expressie. Genamplificatie is een vaak voorkomend mechanisme dat leidt tot upregulatie van genexpressie. Bewijs van cytogenetische studies geeft aan dat significante amplificatie plaatsvindt in meer dan 50% van de humane borstkankers. De amplificatie van de proto-oncogeen humane epidermale groeifactor receptor 2 (HER2) die zich op chromosoom 17 bevindt (17(17q21-q22)) resulteert meestal in overexpressie van HER2-receptoren op het celoppervlak hetgeen leidt tot overmatige en gedisreguleerde signalering bij borstkanker en andere kwaadaardige kankers (Park et al., Clinical Breast Cancer 8:392-401 [2008]). Van verscheidene oncogenen is gevonden dat ze worden geamplificeerd in andere humane kwaadaardige kankers. Voorbeelden van de amplificatie van cellulaire oncogenen in humane tumoren omvattende amplificatie van: c-myc in promyelocytische leukemiecellijn HL60, en in kleincellige longcarcinoomcellijnen, N-myc in primaire neuroblastomen (stadia III en IV), neuroblastoomcellijnen, retinoblastoomcellijn en primaire tumoren, en kleincellige longcarcinoomcellijnen en tumoren, L-myc in kleincellige longcarcinoomcellijnen en tumoren, c-myb in acute myeloïde leukemie en in coloncarcinoomcellijnen, c-erbb in epidermoïde carcinoomcel, en primaire gliomen, c-K-ras-2 of KRAS in primaire carcinomen van de long, dikke darm, blaas en het rectum, N-ras of NRAS in carcinoomcellijnen bij zoogdieren (Varmus H., Ann Rev Genetics 18: 553-612 (1984) [geciteerd in Watson et al., Molecular Biology of the Gene (4th ed.; Benjamin/Cummings Publishing Co. 1987)].

Amplificaties van oncogenen zijn een vaak voorkomende oorzaak van veel types kanker, net zoals het geval is met P70-S6 Kinase 1 amplificatie en borstkanker. In dergelijke gevallen vindt de genetische amplificatie plaats in een somatische cel en treft het enkel het genoom van de kankercellen zelf, niet het volledige organisme, laat staan enige van de nakomelingen. Andere voorbeelden van oncogenen die zijn geamplificeerd in humane kankers omvatten MYC, ERBB2 (EFGR), CCND1 (Cyclin Dl), FGFR1 en FGFR2 in borstkanker, MYC en ERBB2 in baarmoederhalskanker, HRAS, KRAS, NRAS, en MYB in colorectale kanker, MYC, CCND1 en MDM2 in esofagale kanker, CCNE, KRAS en MET in maagkanker, ERBB1, en CDK4 in glioblastomen, CCND1, ERBB1, en MYC in hoofd- en nekkanker, CCND1 in hépatocellulaire kanker, MYCB in neuroblastomen, MYC, ERBB2 en AKT2 in eierstokkanker, MDM2 en CDK4 in sarcomen, NRAS in melanomen en MYC in kleincellige longkanker. In een uitvoeringsvorm kan de onderhavige werkwijze worden gebruikt voor het bepalen van de aan- of afwezigheid van amplificatie van een oncogeen dat is geassocieerd met een kanker. In sommige uitvoeringsvormen wordt het geamplificeerde oncogen geassocieerd met borstkanker, baarmoederhalskanker, colorectale kanker, esofagale kanker, maagkanker, glioblastoom, hoofd- en nekkanker, hépatocellulaire kanker, neuroblastoom, eierstokkanker, melanoom, prostaatkanker, sarcoom en kleincellige longkanker.

In een uitvoeringsvorm kan de onderhavige werkwijze worden gebruikt voor het bepalen van de aan- of afwezigheid van een chromosomale deletie. In sommige uitvoeringsvormen is de chromosomale deletie het verlies van een of meerdere volledige chromosomen. In andere uitvoeringsvormen is de chromosomale deletie het verlies van een of meerdere segmenten van een chromosoom. In nog andere uitvoeringsvormen is de chromosomale deletie het verlies van twee of meerdere segmenten van twee of meer chromosomen. De chromosomale deletie kan het verlies omvatten van een of meerdere tumoronderdrukkende genen.

Van chromosomale deleties omvattende tumoronderdrukkende genen wordt aangenomen dat ze een belangrijke rol spelen in de ontwikkeling en progressie van de genoemde tumoren. Het retinoblastoom-tumoronderdrukkend gen (Rb-1), dat zich in chromosoom 13ql4 bevindt, is het meest uitgebreid gekenmerkte tumoronderdrukkende gen. Het Rb-1 genproduct, een 105 kDa nucleaire fosfoproteïne, speelt blijkbaar een belangrijke rol in de regulatie van de celcyclus (Howe et al., Proc Natl Acad Sei (USA) 87:5883-5887 [1990]). Gewijzigde of verloren expressie van het Rb-eiwit wordt veroorzaakt door inactivering van beide genallelen hetzij door een puntmutatie hetzij door een chromosomale deletie. Er is gevonden dat Rb-i-genwijzigingen aanwezig zijn niet enkel in retinoblastomen, maar ook in andere kwaadaardige tumoren zoals osteosarcomen, kleincellige longkanker (Rygaard et al., Cancer Res 50: 5312-5317 [1990)]) en borstkanker. Studies inzake restrictiefragmentlengtepolymorfisme (RFLP) hebben aangegeven dat dergelijke tumortypes frequent verloren heterozygositeit hebben op 13q hetgeen suggereert dat een van de Rb-1 genallelen verloren is gegaan omwille van een grote chromosomale deletie (Bowcock et al., Am J Hum Genet, 46: 12 [1990]). Chromosoom 1-afwijkingen omvattende duplicaties, deleties en ongebalanceerde translocaties omvattende chromosoom 6 en andere partnerchromosomen geven aan dat gebieden van chromosoom 1, in het bijzonder Iq21-lq32 en lpll-13, oncogenen of tumoronderdrukkende genen kunnen bevatten die pathogenetisch relevant zijn voor zowel chronische als gevorderde fases van myeloproliferatieve neoplasmen (Caramazza et al., Eur J Hematol 84:191-200 [2010]). Myeloproliferatieve neoplasmen worden ook geassocieerd met deleties van chromosoom 5. Volledig verlies of interstitiële deleties van chromosoom 5 zijn de meest voorkomende karyotypische afwijking in myelodysplastische syndromen (MDS's). Geïsoleerde del(5q)/5q—MDS-patiënten hebben een gunstigere prognose dan deze met extra karyotypische afwijkingen, die de neiging hebben myeloproliferatieve neoplasmen (MPN's) en acute myeloïde leukemie te ontwikkelen. De frequentie van ongebalanceerde chromosoom 5-deleties heeft geleid tot het idee dat 5q een of meerdere tumoronderdrukkende genen bezit die fundamentele rollen hebben in de groeicontrole van hematopoïetische stam-/progenitorcellen (HSC's/HPC's). Cytogenetische mapping van vaak gewiste gebieden (CDR's, commonly deleted régions) gecentreerd op 5q31 en 5q32 identificeerden kandidaat-tumoronderdrukkende genen, waaronder de ribosomale subeenheid RPS14, de transcriptiefactor Egrl/Krox20 en het cytoskeletale remodeling-eiwit, alfa-catenine (Eisenmann et al., Oncogene 28:3429-3441 [2009]). Cytogenetische en allelotyping-studies van verse tumoren en tumorcellijnen hebben aangetoond dat allelverlies van verschillende afzonderlijke gebieden op chromosoom 3p, waaronder 3p25, 3p21-22, 3p21.3, 3pl2-13 en 3pl4, de vroegste en meest frequentie genomische afwijkingen zijn die betrokken zijn in een breed spectrum van majeure epitheelkankers van de longen, borst, nier, hoofd en nek, eierstok, baarmoederhals, dikke darm, pancreas, slokdarm, blaas en andere organen. Verschillende tumoronderdrukkende genen zijn toegewezen aan het chromosoom 3p gebied, en er wordt aangenomen dat interstitiële deleties of promoter hypermethylatie het verlies van het 3p of het volledige chromosoom 3 in de ontwikkeling van carcinomen voorafgaat (Angeloni D., Briefings Functional Genomics 6:19-39 [2007]).

Pasgeborenen en kinderen met het syndroom van Down (DS) hebben vaak congenitale transiënte leukemie en hebben een verhoogd risico op acute myeloïde leukemie en acute lymfoblastische leukemie. Chromosoom 21, met ongeveer 300 genen, kan betrokken zijn in veel structurele afwijkingen, bijv. translocaties, deleties en amplificaties, bij leukemie, lymfomen en solide tumoren. Bovendien is gevonden dat genen die zich op chromosoom 21 bevinden een belangrijke rol spelen in tumorigenese. Somatische numerieke evenals structurele chromosoom 21-afwijkingen worden geassocieerd met leukemie, en specifieke genen waaronder RUNX1, TMPRSS2, en TFF, die zich in 21q bevinden, spelen een rol in de tumorigenese (Fonatsch C Gene Chromosomes Cancer 49:497-508 [2010]).

Gezien het voorgaande kan de hierin beschreven werkwijze, in verschillende uitvoeringsvormen, worden gebruikt voor het bepalen van de segment-CNV's waarvan bekend is dat ze een of meerdere oncogenen of tumoronderdrukkende genen bevatten, en/of waarvan bekend is dat ze worden geassocieerd met een kanker of een verhoogd risico op kanker. In bepaalde uitvoeringsvormen kunnen de CNV's worden bepaald in een testmonster omvattende een constitutioneel (kiemlijn) nucleïnezuur en kan het segment worden geïdentificeerd in deze constitutionele nucleïnezuren. In bepaalde uitvoeringsvormen worden segment-CNV's geïdentificeerd (indien aanwezig) in een monster omvattende een mengsel van nucleïnezuren (bijv. nucleïnezuren die zijn afgeleid van normale en nucleïnezuren afgeleid van neoplastische cellen). In bepaalde uitvoeringsvormen is het monster afgeleid van een patiënt van wie vermoed wordt of gekend is dat hij/zij kanker heeft bijv. carcinoom, sarcoom, lymfoom, leukemie, kiemceltumoren, blastoom en dergelijke. In een uitvoeringsvorm is het monsters een plasmamonster dat is afgeleid (verwerkt) van perifeer bloed dat een mengsel van cfDNA omvat dat is afgeleid van normale en kankercellen. In een andere uitvoeringsvorm is het biologische monster dat wordt gebruikt voor het bepalen of een CNV aanwezig is, afgeleid van cellen die, indien een kanker aanwezig is, een mengsel van kanker- en niet-kankercelen omvat van andere biologische weefsels waaronder, maar niet beperkt tot, biologische fluïda zoals serum, zweet, tranen, sputum, urine, sputum, oorsmeer, lymfe, speeksel, cerebropinaal fluïdum, ravages, beenmergsuspensie, vaginaal vocht, transcervicale spoeling, hersenvocht, ascites, melk, afscheidingen van de ademhalings-, darm- en urogenitale kanalen, en leukoforesemonsters, of in weefselbiopsieën, uitstrijkjes of smeersels. In andere uitvoeringsvormen is het biologische monster een monster van stoelgang (fecaal monster).

De CNV's die worden gebruikt voor het bepalen van de aanwezigheid van een kanker en/of een verhoogd risico op een kanker kunnen amplificatie of deleties omvatten.

In verschillende uitvoeringsvormen omvatten de CNV's die als indicatief zijn geïdentificeerd voor de aanwezigheid van een kanker of een verhoogd risico op een kanker, een of meerdere van de amplificaties omvatten die zijn getoond in Tabel 3.

Tabel 3 Illustratieve, maar niet-limitatieve chromosomale segmenten gekenmerkt door amplificaties die met kankers worden geassocieerd.

In bepaalde uitvoeringsvormen, in combinatie met de hierboven beschreven amplificaties (hierin), of afzonderlijk, omvatten de CNV's die zijn geïdentificeerd als indicatief voor de aanwezigheid van een kanker of een verhoogd risico op een kanker een of meerdere van de deleties getoond in Tabel 4.

Tabel 4 Illustratieve, maar niet limitatieve chromosomale segmenten gekenmerkt door deleties die met kankers zijn geassocieerd.

De aneuploïdieën die zijn geïdentificeerd als kenmerkend voor verschillende kankers (bijv. de aneuploïdieën geïdentificeerd in Tabellen 3 en 4) kunnen genen bevatten waarvan bekend is dat ze betrokken zijn in kankeretiologieën (bijv. tumoronderdrukkende genen, oncogenen, enz.). Er kan ook onderzocht worden dat deze aneupoïdieën relevante, maar vroeger onbekende genen identificeren.

Tabel 5 illustreert targetgenen waarvan bekend is dat ze vallen binnen het geïdentificeerde geamplificeerde segment en voorspelde genen, en Tabel 6 illustreert targetgenen waarvan bekend is dat ze vallen binnen het geïdentificeerde gewiste segment en voorspelde genen.

Tabel 5 Illustratieve, maar niet-limitatieve chromosomale segmenten en genen waarvan bekend is of wordt voorspeld dat ze aanwezig zijn in gebieden die worden gekenmerkt door amplificatie bij verschillende kankers

Tabel 6 Illustratieve, maar niet-limitatieve chromosomale segmenten en genen waarvan bekend is of wordt voorspeld dat ze aanwezig zijn in gebieden die worden gekenmerkt door amplificatie bij verschillende kankers

Hoewel de voorbeelden hier betrekking hebben op humane genomen en de beschrijving hoofdzakelijk is gericht op mensen, is het concept van de onderhavige uitvinding van toepassing op genomen van eender welke plant of dier.

In verschillende uitvoeringsvormen wordt verwacht de hier geïdentificeerde werkwijze te gebruiken voor het identificeren van CNV's van segmenten omvattende de geamplificeerde gebieden of genen die zijn geïdentificeerd in Tabel 5 en/of het gebruiken van de hier geïdentificeerde werkwijzen voor het identificeren van CNV's van segmenten omvattende gewiste gebieden of genen die zijn geïdentificeerd in Tabel 6. In andere uitvoeringsvormen wordt verwacht de hier geïdentificeerde werkwijze te gebruiken voor het screenen voor de aanwezigheid van CNV's van segmenten die eerder niet werden gelinkt met kanker of niet zijn beschreven in Tabel 5 of 6.

In één uitvoeringsvorm bieden de hierin beschreven werkwijzen een middel voor het beoordelen van de associatie tussen genamplificatie en de mate van tumorevolutie. Correlatie tussen amplificatie en/of deletie en het stadium of de graad van een kanker kan voor de prognose belangrijk zijn omdat dergelijke informatie kan bijdragen tot de definitie van een genetisch gebaseerde tumorgraad die het toekomstige verloop van een ziekte met meer geavanceerde tumoren met de slechtste prognose beter zou voorspellen. Daarnaast zou informatie over vroege amplificatie- en/of deletie-events nuttig kunnen zijn bij het associëren van deze events als voorspellers van de latere progressie van de ziekte.

Genamplificatie en -deleties zoals geïdentificeerd door de werkwijze kunnen worden geassocieerd met andere bekende parameters zoals de tumorgraad, histologie, Brd/Urd-labelingindex, hormonale status, nodale betrokkenheid, tumorgrootte, levensverwachting en andere tumoreigenschappen die beschikbaar zijn uit epidemiologische en biostatistische studies. Tumor-DNA dat moet worden getest door de werkwijze zou bijvoorbeeld atypische hyperplasie, ductaal carcinoom in situ, stadium I-III kanker en metastatische lymfknopen kunnen omvatten om de identificatie van associaties tussen amplificaties en deleties en stadium toe te laten. De gemaakte associaties maken een doeltreffende therapeutische interventie mogelijk. Consistent geamplificeerde gebieden kunnen bijvoorbeeld een overmatig uitgedrukt gen bevatten, waarvan het product therapeutisch kan worden aangevallen (bijv. de groeifactor receptor tyrosine kinase, pl85HER2).

In verschillende uitvoeringsvormen kan de hierin beschreven werkwijze worden gebruikt voor het identificeren van amplificatie- en/of deletie-events die zijn geassocieerd met geneesmiddelenresistentie door het bepalen van het kopieaantalvariaties van nudeïnezuursequenties van primaire kankers ten opzichte van deze die zijn gemetastaseerd naar andere plaatsen. Als genamplificatie en/of deletie een manifestatie van karyotypische instabiliteit is die een snelle ontwikkeling van geneesmiddelenresistentie toelaat, zou meer amplificatie en/of deletie in primaire tumoren van chemoresistente patiënten dan in tumoren bij chemogevoelige patiënten verwacht worden. Als amplificatie van specifieke genen verantwoordelijk is voor de ontwikkeling van geneesmiddelenresistentie, zou bijvoorbeeld verwacht worden dat gebieden die deze genen omgeven, consistent geamplificeerd worden in tumorcellen van pleurale effusies van chemoresistentie patiënten, maar niet in de primaire tumoren. De ontdekking van associaties tussen genamplificatie en/of deletie en de ontwikkeling van geneesmiddelenresistentie kan de identificatie toelaten van patiënten die al dan niet voordeel hebben bij therapie van een adjuvans.

In andere uitvoeringsvormen kan de hierin beschreven werkwijze worden gebruikt voor het identificeren van de aanwezigheid van genoombrede instabiliteit en/of microsatellietinstabiliteit en/of specifieke combinaties van kopieaantalvariaties (die volledige chromosomen, chromosoomarmen of kleinere DNA-segmenten zouden kunnen dekken).

In nog een andere uitvoeringsvorm kan de hierin beschreven werkwijze worden gebruikt voor het identificeren van de oorsprong van de tumor, d.w.z. het primaire weefsel of orgaan waarvan de tumor afkomstig is alvorens metastatisch te worden.

Zowel volledige als gedeeltelijke chromosomale aneuploïdieën evenals kleinere kopieaantalvariaties van DNA-segmenten die zouden kunnen worden geassocieerd met de vorming, en progressie van kanker kunnen worden bepaald volgens de onderhavige uitvinding. II Seauencina. uitliinina en correctie

Zoals hierboven vermeld, wordt slechts een fractie van het genoom gesequencet. In één aspect, zelfs wanneer een groep nucleïnezuren in een specimen gesequencet is bij <100% genomische dekking in plaats van met verscheidende veelvouden van dekking, en uit de verhouding van gesequencete nucleïnezuurmoleculen, wordt het meeste van elk nucleïnezuurspecies niet gesequencet of slechts éénmaal gesequencet.

Dit staat in contrast met situaties waarin gerichte verrijking wordt uitgevoerd van een subreeks van het genoom voorafgaand aan de sequencingreactie, gevolgd door hoge-dekking sequencing van die subreeks.

In één uitvoeringsvorm wordt massieve parallelle korte-aflezing sequencing gebruikt. Korte sequentietags of aflezingen worden gegenereerd, bijv. uit een bepaalde lengte tussen 20 bp en 400 bp. Sequencing met gepaard uiteinde zou ook kunnen worden uitgevoerd.

In één uitvoeringsvorm is een voorverwerkingsstap beschikbaar voor het vooraf verwerken van de verkregen aflezingen. Dergelijke voorafgaande verwerkingsoptie laat filtering toe van aflezingen met een lage kwaliteit, waardoor voorkomen wordt dat ze worden toegewezen. Toewijzing van aflezingen met een lage kwaliteit kan langdurige computerverwerkingscapaciteit vereisen, kan onjuist zijn en heeft als risiko dat de technische ruis in de gegevens verhoogt, waardoor een minder nauwkeurige parameter wordt verkregen. Dergelijke voorafgaande verwerking is in het bijzonder waardvol wanneer sequencinggegevens van de volgende generatie worden gebruikt, die een algemene lagere kwaliteit of enige andere omstandigheid hebben die is gekoppeld met een algemene lagere kwaliteit van de aflezingen.

De gegenereerde aflezingen kunnen later worden uitgelijnd met een of meerdere humane referentiegenoomsequenties. Het aantal uitgelijnde aflezingen worden bij voorkeur geteld en/of gesorteerd volgens de chromosomale locatie ervan.

Een aanvullend reinigingsprotocol kan worden uitgevoerd, waarbij deduplicatie wordt uitgevoerd, bijv. met Picard-instrumenten, waarbij enkel uniek toegewezen aflezingen worden weerhouden. Aflezingen met mismatches en leemtes kunnen worden verwijderd. Aflezingen die de gebieden op de zwarte lijst indelen, kunnen worden uitgesloten. Dergelijke gebieden op de zwarte lijst kunnen worden genomen uit een vooraf gedefinieerde lijst van bijv. gewone CNV's, collapsed repeats, DAC zwarte-lijst gebieden zoals geïdentificeerd in het ENCODE-project (d.w.z. een reeks gebieden in het humane genoom dat afwijkende, ongestructureerde, hoog-signaal/aflezingstellingen heeft in NGS-experimenten onafhankelijk van cellijn en type experiment) en het ongedefinieerde segment van het referentiegenoom. In één uitvoeringsvorm zijn gebieden op de zwarte lijst gegeven aan de gebruiker. In een andere uitvoeringsvorm kan de gebruiker zijn of haar eigen reeks gebieden op de zwarte lijst gebruiken of definiëren.

In een andere uitvoeringsvorm zijn chromosomen onderverdeeld in gebieden met een vooraf gedefinieerde lengte, in het algemeen stukken genoemd. In een uitvoeringsvorm is de stukgrootte een vooraf gedefinieerde grootte die is gegeven aan de gebruiker. In een andere uitvoeringsvorm kan de genoemde stukgrootte gedefinieerd zijn door een gebruiker, kan het uniform zijn voor alle chromosomen of kan het een specifieke stukgrootte per chromosoom zijn of kan het variëren volgens de verkregen sequentiegegevens. Verandering van de stukgrootte kan een effect hebben op de uiteindelijke parameter die moet worden gedefinieerd, hetzij door het verbeteren van de gevoeligheid (gewoonlijk verkregen door het verlagen van de stukgrootte, vaak ten koste van de specificiteit) hetzij door het verbeteren van de specificiteit (in het algemeen door het verhogen van de stukgrootte, vaak ten koste van de gevoeligheid). Een mogelijke stukgrootte die een aanvaardbare specificiteit en gevoeligheid oplevert, is 50 kb.

In een verdere stap worden de uitgelijnde en gefilterde aflezingen binnen een stuk geteld, om aflezingstellingen te verkrijgen.

De verkregen aflezingstellingen kunnen worden gecorrigeerd voor de GC-telling voor het stuk. Van GC-voorspanning is gekend dat het genoomassemblage verergert. Verscheidende GC-correcties zijn welbekend in de stand der techniek (bijv. Benjamini et al., Nucleic Acid Research 2012). In een voorkeur dragende uitvoeringsvorm zal de genoemde GC-correctie een LOESS-regressie zijn. In een uitvoeringsvorm kan een gebruiker van de methodologie volgens de onderhavige uitvinding voorzien zijn van de keuze van verscheidene mogelijke GC-correcties.

In een latere stap wordt de genomische voorstelling (GR, genomic représentation) van aflezingstellingen berekend. Dergelijke voorstelling wordt bij voorkeur gedefinieerd als een verhouding tussen de GC-gecorrigeerde aflezingstellingen voor een specifiek stuk en de som van alle GC-gecorrigeerde aflezingstellingen.

In een uitvoeringsvorm wordt de genoemde GR als volgt gedefinieerd:

met k over alle chromosomale stukken (waarbij de factor 107 in de bovenstaande formule willekeurig is gedefinieerd, en eender welke constante waarde kan zijn)

In een uiteindelijke stap worden de verkregen GC per stuk samengevoegd over een gebied, waarbij het genoemde gebied een subgebied (venster) van een chromosoom of het volledige chromosoom kan zijn. Het genoemde venster kan een vooraf gedefinieerd of variabele grootte hebben, die optioneel kan zijn gekozen door de gebruiker. Een mogelijk venster zou een grootte kunnen hebben van 5 MB of 100 aangrenzende stukken met een grootte van 50 kb.

De GR samengevoegd voor een chromosoom kan worden gedefinieerd door

In een andere uitvoeringsvorm moet de genomische voorstelling van een reeks referentiemonsters berekend worden. De genoemde reeks referentiemonsters (of ook referentiereeks genoemd) kan vooraf gedefinieerd of gekozen zijn door een gebruiker (bijv. geselecteerd uit zijn/haar eigen referentiemonsters). Door de gebruiker toe te laten een eigen referentiereeks te gebruiken, zal een gebruiker de terugkerende technische variatie van zijn/haar omgeving en de variabelen ervan (bijv. verschillende natte labreagentia of protocol, verschillend NGS-instrument of platform, enz.) beter kunnen vastleggen. In een voorkeurdragende uitvoeringsvorm omvat de genoemde referentiereeks genomische informatie van 'gezonde' monsters waarvan verwacht wordt of waarvan bekend is dat ze (relevante) aneuploïdieën bevatten. De genomische voorstelling (GR) van de referentiereeks kan worden gedefinieerd, hetzij op het niveau van het genoom en/of op een subgebied (chromosoom, chromosomaal segment, venster of bin).

Andere sequencingstrategieën met een enkele molecule zoals die door het Roche 454 platform, het Applied Biosystems SOLiD-platform, de Hélicos True Single Molecule DNA-sequencingtechnologie, de enkele molecule, real-time (SMRT™)-technologie van Pacific Biosciences, en nanoporie sequencing technologieën zoals MinlON, GridlON of PromethION van Oxford Nanopore Technologies zouden ook kunnen worden gebruikt in deze toepassing. III Bepaling van scores, parameter en secundaire parameters

Op basis van de uitlijningen en de verkregen aflezingstellingen of een afgeleide daarvan, optioneel gecorrigeerd voor GC-gehalte en/of totaal aantal aflezingen verkregen van het genoemde monsters, worden scores berekend die uiteindelijk leiden tot een parameter die toelaat de aanwezigheid van een aneuploïdie in een monster te bepalen. De genoemde scores zijn genormaliseerde waarden die zijn afgeleid van de tellingen van de aflezingen of wiskundig gewijzigde tellingen van de aflezingen, waarbij normalisatie plaatsvindt met het oog op de referentiereeks. Bijgevolg wordt elke score verkregen door middel van een vergelijking met de referentiereeks. De term eerste score wordt gebruikt om te verwijzen naar de score die is gekoppeld met de telling van de aflezingen voor een doelchromosoom of een chromosomaal segment. Een verzameling van scores is een reeks scores die zijn afgeleid van een reeks genormaliseerde aantal aflezingen die het genormaliseerde aantal aflezingen van het genoemde chromosomale doelsegment of doelchromosoom kan omvatten.

De genoemde eerste score stelt bij voorkeur een Z-score of standaardscore voor een doelchromosoom of chromosomaal segment voor. De genoemde verzameling is bij voorkeur afgeleid van een reeks van Z-scores die zijn verkregen uit een overeenkomstige reeks chromosomen of chromosomale segmenten die het genoemde chromosomale doelsegment of doelchromosoom omvatten.

Dergelijke scores kunnen als volgt worden berekend:

Met i een venster of een chromosoom of een chromosoomsegment.

Een samenvattende statistiek van de genoemde verzameling scores kan bijv. worden berekend als het gemiddelde of de mediane waarde van de individuele scores.

Een andere samenvattende statistiek van de genoemde verzameling scores kan worden berekend als de standaardafwijking of mediane absolute afwijking of gemiddelde absolute afwijking van de individuele scores.

Optioneel, maar niet noodzakelijk, wordt dezelfde verzameling scores gebruikt voor beide types berekeningen.

De genoemde parameter p zal worden berekend als een functie van de eerste score en een afgeleide (bijv. samenvattende statistiek) van de verzameling van scores. In een voorkeurdragende uitvoeringsvorm zal de genoemde parameter p een verhouding zijn tussen de eerste score gecorrigeerd door de verzameling scores (of een afgeleide daarvan) en een afgeleide van de genoemde verzameling scores.

In een andere uitvoeringsvorm zal de genoemde parameter een verhouding zijn tussen de eerste score gecorrigeerd door een samenvattende statistiek van een eerste verzameling scores en een samenvattende statistiek van een andere, tweede verzameling scores, waarbij beide verzamelingen van scores de eerste score omvatten.

In een specifieke voorkeurdragende uitvoeringsvorm is de genoemde parameter p een verhouding tussen de eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en een samenvattende statistiek van de genoemde verzameling scores. De samenvattende statistiek is bij voorkeur geselecteerd uit het gemiddelde, de mediaan, de standaardafwijking, de mediane absolute afwijking of de gemiddelde absolute afwijking. In één uitvoeringsvorm zijn de genoemde beide gebruikte samenvattende statistieken in de functie dezelfde. In een andere, meer voorkeurdragende uitvoeringsvorm verschillen de genoemde samenvattende statistieken van de verzameling scores in de teller en noemer.

Een geschikte uitvoeringsvorm volgens de onderhavige uitvinding omvat gewoonlijk de volgende stappen (na DNA-sequenties uit een willekeurige, sequencingproces op een biologisch monster te hebben verkregen). het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor tellingen van aflezingen worden verkregen; - het normaliseren van de genoemde tellingen van aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score en een verzameling van scores afgeleid van de genoemde genormaliseerde aflezingstellingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van een overeenkomstige reeks chromosomen of chromosoomsegmenten die het chromosomaal doelsegment of chromosoom omvatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores, waarbij de genoemde parameter een verhouding voorstelt tussen * de genoemde eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de genoemde verzameling scores.

Een mogelijke parameter p kan als volgt worden berekend:

waarbij Zi de eerste score voorstelt en Z j de verzameling van scores en waarbij i het doelchromosoom of chromosomale sectie voorstelt, en waarbij j een verzameling chromosomen of chromosomale segmenten i, a, b, ... voorstelt die het genoemde chromosomale segment of chromosoom i bevatten. In een andere uitvoeringsvorm wordt de genoemde parameter p berekend als

waarbij Zi de eerste score voorstelt en Z j de verzameling van scores en waarbij i het doelchromosoom of chromosomale sectie voorstelt, en waarbij j een verzameling chromosomen of chromosomale segmenten i, a, b, ... voorstelt die het genoemde chromosomale segment of chromosoom i bevatten.

In een nog andere, meest voorkeurdragende uitvoeringsvorm wordt de genoemde parameter p berekend als

Waarbij Zi de eerste score voorstelt en Z j de verzameling van scores en waarbij i het doelchromosoom of chromosomale sectie voorstelt, en waarbij j een verzameling chromosomen of chromosomale segmenten i, a, b, ... voorstelt die het genoemde chromosomale segment of chromosoom i voorstellen.

Naast de parameter p die de identificatie van de aanwezigheid van aneuploïdieën toelaat, kunnen secundaire parameters worden berekend die kunnen dienen als kwaliteitscontrole of extra informatie bieden met betrekking tot een of meerdere aneuploïdieën die aanwezig zijn in het monsters.

Een eerste secundaire parameter die kan worden berekend, laat toe te definiëren of chromosomale en grote subchromosomale aneuploïdieën aanwezig zijn in het monster (vergeleken met bijv. kleinere aneuploïdieën). In een voorkeurdragende uitvoeringsvorm wordt een dergelijke parameter gedefinieerd door een mediaan van Z scores gemeten per subgebied (bijv. vensters van 5 Mb) in een doelchromosoom. Als meer dan 50% van deze subgebieden getroffen wordt, zal dit merkbaar zijn in de secundaire parameters.

In een andere uitvoeringsvorm kan een secundaire parameter worden berekend als de mediaan van de absolute waarde van de Z-scores berekend over de resterende chromosomen (dat is alle chromosomen behalve het doelchromosoom of chromosomaal segment) per subgebied (bijv. vensters van 5 Mb). De laatste secundaire parameters laten de detectie toe van bij. de aanwezigheid van technische of biologische instabiliteiten (cf. kwaadaardigheid, kanker). Als minder dan de helft van de vensters van de andere of alle autosomen of chromosomen getroffen worden, zal deze secundaire parameter niet beïnvloed worden. Als meer dan 50% van de vensters getroffen wordt, zal dit kunnen worden afgeleid van de genoemde secundaire parameters.

In een andere uitvoeringsvorm biedt de onderhavige uitvinding ook een kwaliteitsscore (QS). QS laat toe de algemene variatie binnen het genoom te beoordelen. Een lage QS is een indicatie van een goede monsterverwerking en een laag niveau van technische en biologische ruis. Een stijging in de QS kan twee mogelijke redenen hebben. Hetzij een fout die is opgetreden tijdens de verwerking van het monster. In het algemeen zal aan de gebruiker worden gevraagd een nieuw biologisch staal af te nemen en te sequencen. Dit is typisch voor matig gestegen QS-scores. Een sterk gestegen QS is een indicatie van een sterk aneuploïde of genoombreed instabiel monster en de gebruiker zal worden aangemoedigd een bevestigende test te doen om verder te beoordelen of de patiënt kanker ontwikkelt. De genoemde QS wordt bij voorkeur bepaald door het berekenen van de standaardafwijkingen van alle Z-verdelingen voor de chromosomen en door het verwijderen van het hoogst en laagst scorende chromosoom.

Monsters met een QS hoger dan 2 worden bijvoorbeeld beschouwd als zijnde van een slechte kwaliteit, of als monsters met een verhoogd risico om kanker te ontwikkelen, en een QS tussen 1,5 en 2 is van een tussenliggende kwaliteit. IV. Vergelijking van drempelwaarde

De parameter p zoals berekend in de bovenstaande uitvoeringsvormen zal vervolgens worden vergeleken met een drempelwaarde om te bepalen of er een verandering is vergeleken met een referentiehoeveelheid (d.w.z. onevenwicht), bijvoorbeeld met betrekking tot de verhouding van hoeveelheden van twee chromosomale gebieden (of reeksen van gebieden). De aanwezigheid van een aneuploïdie en/of een verhoogd aantal van de genoemde aneuploïdie is een indicator voor de aanwezigheid en/of een verhoogd risico voor een kanker. In één uitvoeringsvorm zal de gebruiker zijn/haar eigen drempelwaarde kunnen definiëren, hetzij empirisch op basis van ervaring of eerdere experimenten, hetzij bijvoorbeeld op basis van standaard statistische overwegingen. Als een gebruiker de gevoeligheid van de test zou willen verhogen, kan de gebruiker de drempels verlagen (d.w.z. ze dichter naar 0 brengen). Als een gebruiker de specificiteit van de test zou willen verhogen, kan de gebruiker de drempels verhogen (d.w.z. ze verder van 0 brengen). Een gebruiker zal vaak een evenwicht moeten vinden tussen gevoeligheid en specificiteit, en dit evenwicht is vaak lab- en toepassingsspecifiek, daarom is het gemakkelijk als een gebruiker de drempelwaarden zelf kan veranderen.

Op basis van de vergelijking met de drempelwaarde, kan een aneuploïdie aan- of afwezig worden gevonden. Dergelijke aanwezigheid is indicatief voor de aanwezigheid en/of een verhoogd risico voor een kanker.

In een uitvoeringsvorm van de onderhavige uitvinding is vergelijking van parameter p met een drempelwaarde voldoende voor het bepalen van de aan- of afwezigheid van een aneuploïdie. In een andere uitvoeringsvorm wordt de genoemde aneuploïdie bepaald op basis van een vergelijking van parameter p met een drempelwaarde en een vergelijking van ten minste een van de secundaire parameters, kwaliteitsscore en/of eerste score met een drempelwaarde, waarbij voor elke score een overeenkomstige drempelwaarde wordt gedefinieerd of ingesteld.

In een voorkeurdragende uitvoeringsvorm wordt de genoemde aanwezigheid/afwezigheid van een aneuploïdie gedefinieerd door een vergelijking van een parameter p met een vooraf gedefinieerde drempelwaarde, evenals door vergelijking van alle secundaire parameters en eerste scores zoals hierboven beschreven met de overeenkomstige drempelwaarden ervan.

De uiteindelijke beslissingsboom kan dus afhankelijk zijn van parameter p alleen, of gecombineerd met een van de secundaire parameters en/of kwaliteitsscore of eerste score zoals hierboven is beschreven.

In een voorkeur dragende uitvoeringsvorm omvat de genoemde methodologie volgens de onderhavige uitvinding de volgende stappen: - multiplex sequencing van 50 bp enkel-uiteinde aflezingen (uitgevoerd door eindgebruiker) - uploaden van sequentieaflezingen - toewijzing van aflezingen aan een referentiegenoom - tellingaantal van aflezingen per stuk (een stuk heeft een grootte van 50 kb) - berekenen van GC-gehalte per stuk en corrigeren voor GC-gehalte - berekenen van genomische voorstelling (GR)-score per stuk. Voor stuk i is dit gelijk aan

het samenvoegen van de GR-waarden per venster (een venster bestaat uit 100 opeenvolgende vensters) berekenen van een Z-score per venster of per chromosoom, waarbij de Z-score is gebaseerd op de GR-score per chromosoom, vergeleken met de GR-scores in een reeks referentiemonsters.

met i een chromosoom of een venster, μ Ref,i de gemiddelde of mediane GR-score voor de overeenkomstige stukken in de reeks referentiemonsters en σ Ref;i de standaardafwijking van de GR-scores voor de overeenkomstige stukken in de reeks referentiemonsters - berekenen van een ZofZ-score, waarbij de ZofZ-score is gebaseerd op de Z-score, gecorrigeerd door de mediaan (of het gemiddelde) van de Z-scores van een verzameling chromosomen omvattende doelchromosoom i en gedeeld door een factor die de variabiliteit van de Z-scores meet van een verzameling chromosomen die het doelchromosoom i omvat (standaardafwijking van een meer robuuste versie daarvan, zoals bijv. de mediane absolute afwijking of mad). - vergelijking van de Z-score met een drempelwaarde, en de ZofZ-score met een drempelwaarde, voor het voorspellen van de aanwezigheid of afwezigheid van een aneuploïdie.

In een andere voorkeurdragende uitvoeringsvorm vindt de genoemde voorspelling van de aanwezigheid of afwezigheid van een aneuploïdie plaats via een beslissingsboom die is gebaseerd op een parameter p en secundaire parameters. V Toolbox en kit

De methodologieën zoals hierboven beschreven worden bij voorkeur allemaal door een computer geïmplementeerd. Daarom heeft de onderhavige uitvinding eveneens betrekking op een computerprogrammaproduct omvattende een door de computer leesbaar medium dat is gecodeerd met meerdere instructies voor het sturen van een computersysteem voor het uitvoeren van een bewerking voor het uitvoeren van analyse van een chromosomale of subchromosomale aneuploïdie in een biologisch monster dat is verkregen van een patiënt, waarbij het biologische monster nucleïnezuurmoleculen omvat.

Met betrekking tot de bepaling van de aan- of afwezigheid van een aneuploïdie of genoombrede instabiliteit in een monster omvat de bewerking de stappen van: - het ontvangen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van de genoemde zwangere vrouw; het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor tellingen van aflezingen worden verkregen; - het normaliseren van de genoemde tellingen van aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score van de genoemde genormaliseerde aflezingen en een verzameling van scores afgeleid van de genoemde genormaliseerde aflezingstellingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van het genormaliseerde aantal aflezingen voor een reeks chromosomen of chromosoomsegmenten die het chromosomaal doelsegment of chromosoom omvatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores.

In een voorkeurdragende uitvoeringsvorm stelt de genoemde parameter een verhouding voor tussen: * een eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de verzameling scores.

De genoemde bewerkingen kunnen worden uitgevoerd door een gebruiker of beroepskracht in een omgeving weg van de locatie waar het monster is afgenomen en/of de natte labprocedure, die de extractie is van de nucleïnezuren uit het biologische monster en de sequencing.

De genoemde bewerkingen kunnen worden geleverd aan de gebruiker door middel van aangepaste software die moet worden geïnstalleerd op een computer, en kan worden opgeslagen in de cloud.

Na de vereiste of gewenste bewerking uitgevoerd te hebben, zal de beoefenaar of gebruiker een rapport of score krijgen, waarbij het genoemde rapport of de genoemde score informatie geeft over het kenmerk dat is geanalyseerd. Een rapport omvat bij voorkeur een link naar een patiënt of monster-ID dat is geanalyseerd. Het genoemde rapport of de genoemde score geeft informatie over de aan- of afwezigheid van een aneuploïdie in een monster, waarbij de genoemde informatie is verkregen op basis van een parameter die is berekend door de bovengenoemde methodologie. Het rapport kan ook informatie geven over de aard van de aneuploïdie (indien gedetecteerd, bijv. grote of kleine chromosomale afwijkingen) en/of de kwaliteit van het monster dat is geanalyseerd.

Het zal duidelijk zijn voor een vakman dat de bovengenoemde informatie in één rapport kan worden voorgesteld aan een beoefenaar.

De bovengenoemde bewerkingen zijn bij voorkeur deel van een digitaal platform dat de moleculaire analyse van een monster toelaat door middel van verscheidene door de computer geïmplementeerde bewerkingen.

De onderhavige uitvinding omvat in het bijzonder ook een visualisatie-instrument, dat aan de gebruiker of beoefenaar toelaat de verkregen resultaten evenals de onbewerkte gegevens te visualiseren die in het systeem zijn ingegeven. In een uitvoeringsvorm omvatten de genoemde visualisaties een venster per chromosoom, dat het chromosoom toont dat is geanalyseerd, dat aflezingen per gebied en de scores en/of parameters die zijn berekend. Door aan de beoefenaar of gebruiker de berekende scores of parameter te tonen samen met de visuele voorstelling van de tellingen van aflezingen, kan een gebruiker een aanvullende controle of beoordeling van de verkregen resultaten uitvoeren. Door aan de gebruiker toe te laten de gegevens in te kijken, zullen gebruikers verbeterde beslissingsregels en drempels kunnen definiëren.

Bovendien wordt een aanvullende controle toegevoegd, aangezien de visuele gegevens per chromosoom aan de gebruiker toelaten voor elke chromosoom te evalueren of de geautomatiseerde classificatie juist is. Dit voegt een aanvullende veiligheidsparameter toe.

In een voorkeurdragende uitvoeringsvorm wordt het genoemde platform en het genoemde visualisatie-instrument voorzien met algoritmen die rekening houden met het feit dat bepaalde gebieden meer aflezingen opleveren (omwille van een terugkerende technische afwijking die sommige gebieden van het genoom altijd over- of ondervertegenwoordigd maakt). Correctiemetingen kunnen worden gegeven voor deze oververtegenwoordiging door een vergelijking te maken met een referentiereeks (die idealiter wordt verwerkt met behulp van hetzelfde of een gelijkaardige protocol) en plotting van bijv. Z-scores of alternatieve scores die de kans op bepaalde observaties onder de veronderstelling van aneuploïdie voorstellen. Standaard visualisatie-instrumenten tonen enkel tellingen van aflezingen, en laten niet toe de terugkerende technische afwijking te corrigeren.

Tot slot, op basis van de link tussen de verkregen sores en/of parameters en de visuele gegevens per chromosoom, kan een gebruiker of beoefenaar beslissen de drempelwaarde te veranderen die is gebruikt voor het definiëren van de aanwezigheid van een aneuploïdie. De gebruiker kan bijgevolg beslissen te streven naar een hogere gevoeligheid (bijv. minder stringent te zijn inzake de stijging/daling van de parameter of scores) of hogere specificiteit (bijv. door meer stringent te zijn inzake de stijging/daling van parameter of scores).

Het platform kan voorzien zijn van andere kenmerken, die een nauwkeurigere analyse bieden van de moleculaire gegevens die zijn verkregen van het biologische monster.

Het platform volgens de onderhavige uitvinding is inherent compatibel met veel verschillende types NGS-bibliotheekbereidingskits en protocollen en NGS-sequencingplatform. Dit is een voordeel aangezien een gebruiker niet zal moeten investeren in speciaal NGS-sequencingplatform of NGS-bibliotheekbereidingskits die specifiek zijn voor een specifieke toepassing, maar de gebruiker kan in plaats daarvan het voorkeurdragende platform en de voorkeur dragende kit gebruiken. Bovendien biedt het aan een gebruiker een bepaalde graad van flexibiliteit met betrekking tot het materiaal dat moet worden gebruikt. Als nieuwere of goedkopere instrumenten of kits beschikbaar worden, zal een gebruiker gemakkelijk kunnen veranderen.

Zoals hierboven vermeld, is de onderhavige methodologie compatibel met celvrij DNA dat is geëxtraheerd uit verschillende soorten biologische monsters, waaronder bloed, speeksel en urine. Het gebruik van urine of speeksel in plaats van bloed zou een echt niet-invasief monstertype bieden en laat bijv. testen thuis en verzending van het monster naar het testlabo toe. Dit is duidelijk een extra voordeel vergeleken met andere werkwijzen voor het verkrijgen van monsters zoals het afnemen van bloed.

De uitvinding wordt verder beschreven door de volgende niet-limitatieve voorbeelden die de uitvinding verder illustreren, en die niet zijn bedoeld, en niet mogen worden geïnterpreteerd als zijnde een beperking van het bereik van de uitvinding.

Voorbeelden

Bereiding en seauencina van het monster

1. Bloedafname, scheiding van plasma en extractie van celvrij DNA Eén proefbuisje (10 ml) van perifeer bloed wordt verzameld in Streck-proefbuisjes en bewaard bij 4°C. Het bloed wordt afgenomen via een standaard flebotomieprocedure.

Het plasma (+/- 5 ml) wordt maximum 72 uur gescheiden na de afname van het bloed door de standaard dubbele centrifugatiemethode: • Het bloedmonster wordt gecentrifugeerd bij 2000xg gedurende 20 minuten (dit kan plaatsvinden bij kamertemperatuur), zonder het gebruik van de rem. • Het plasma wordt dan overgebracht naar hetzij drie 1,5 ml lage bindingsproefbuisjes, hetzij één enkel 5 ml lage bindingsproefbuisje. Een tweede centrifugatie bij 13000xg gebeurt gedurende 2 minuten (dit kan plaatsvinden bij kamertemperatuur). • Het plasma wordt overgebracht naar steriele 1,5 ml of 5 ml lage bindingsproefbuisjes voor opslag bij -20°C voorafgaand aan de extractie van celvrij DNA (cfDNA).

De vaalgele coatingslaag kan optioneel worden bewaard voor latere tests. Genomisch DNA van de vaalgele coatinglaag kan onderzocht worden om kiemlijnafwijkingen te bevestigen of uit te sluiten.

Het celvrije DNA wordt geëxtraheerd uit het plasma met behulp van de QIAam Circulating Nucleic Acid Kit (Qiagen) volgens de aanbevelingen van de fabrikant, met een uiteindelijk elutievolume van 60 pl. De DNA-monsters worden bewaard bij -20°C wanneer ze niet onmiddellijk worden gebruikt voor bibliotheekbereiding. 2. cfDNA-kwantificerina

Het geëxtraheerde cfDNA wordt gekwantificeerd met behulp van een Qubit-fluorometer. De concentratie van het celvrije DNA bedraagt gewoonlijk 0,1-1 ng/pl. 3. Bibliotheekbereidina 25 pl van het geëxtraheerd cfDNA wordt gebruikt als startmateriaal voor bibliotheekbereiding.

Tijdens de bibliotheekbereiding worden de DNA-monsters aangepast voor volgende-generatie sequencing. Adaptors worden toegevoegd aan de uiteinden van de DNA-fragmenten.

De sequencingbibliotheken worden bereid met behulp van de TruSeq ChlP-bibliotheekbereidingskit (Illumina) met bepaalde aanpassingen van het protocol van de fabrikant door het verlagen van de reagensvolumes om de generatie van sequencingbibliotheken toe te laten met behulp van lage starthoeveelheden van DNA.

Het protocol voor bibliotheekbereiding kan als volgt worden samengevat: (Opmerking: De korrelgebaseerde grootteselectie voor het verwijderen van grote DNA-fragmenten en het verwijderen van kleine DNA-fragmenten beschreven in het protocol wordt NIET gebruikt.)

Eindherstellina van de DNA-fraamenten: 1. Voeg 5 pl Hersuspensiebuffer en 20 μΙ eindherstellingsmix toe aan het 25 μΙ startmateriaal (totaal = 50 μΙ)

De korrelgebaseerde grootteselectie voor het verwijderen van grote DNA-fragmenten en het verwijderen van kleine DNA-fragmenten beschreven in het protocol wordt NIET gebruikt.

2. Incubeer gedurende 30 minuten op 30°C 3. Voeg 80 μΙ onverdunde AMPure-korrels toe aan het 50 μΙ monstermengsel na eindherstelling. 4. Was de korrels tweemaal met 190 μΙ 80% EtOH. 5. Suspendeer de gedroogde pellet opnieuw met 10 pl hersuspensiebuffer. Breng 9 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje.

Adenvlatie van de 3'-uiteinden 1. Voeg 6,25 μΙ A-staart mix toe

2. Verwarm gedurende 30 minuten bij 37°C + 5 minuten bij 70°C

Liaatie van de geïndexeerde aepaard-uiteinde adaptors met het DNA 1. Adaptors worden l/2e verdund met hersuspensiebuffer => voeg 2,5 μΙ toe aan het monster

2. Voeg 1,25 μΙ ligatiemix toe (geen hersuspensiebuffer). Incubeer gedurende 30 minuten op 30°C 3. Voeg 2,5 μΙ stopligatiebuffer toe 4. Voeg 21 μΙ AMPure toe voor reiniging 5. Was de korrels tweemaal met 190 μΙ 80% EtOH. 6. Suspendeer de gedroogde pellet opnieuw in 27 μΙ hersuspensiebuffer. Breng 25 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje. 7. Voeg 25 μΙ AMPure toe voor reiniging 8. Was de korrels tweemaal met 190 μΙ 80% EtOH. 9. Suspendeer de gedroogde pellet opnieuw in 12,5 μΙ hersuspensiebuffer. Breng 10 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje.

Verrijken van DNA-fraamenten 1. Bereid de PCR-mix voor door 2,5 μΙ PCR Primer Cocktail en 12,5 μΙ PCR Master Mix te mengen voor elk monster. 2. PCR-condities: 98°C gedurende 30 seconden 15 cycli van:

98°C gedurende 10 seconden 60°C gedurende 30 seconden 72°C gedurende 30 seconden 72°C gedurende 5 seconden houden op 4°C 3. Voeg 25 μΙ AMPure toe voor reiniging 4. Was de korrels tweemaal met 190 μΙ 80% EtOH. 5. Suspendeer de gedroogde pellet opnieuw in 32,5 μΙ hersuspensiebuffer. Breng 30 μΙ van de bovendrijvende laag over naar een nieuw proefbuisje. 6. Gebruik 2 μΙ van het monster voor Qubit-kwantificering en 2 μΙ voor fragmentanalyse (zie volgende deel). 4. Kwaliteitscontrole van bibliotheek

Goede celvrije DNA-isolatie en NGS-bibliotheekbereiding worden getest door het analyseren van elke bibliotheek op de fragmentanalyser (Advanced Analytical Technologies Ine., Duitsland) voorafgaand aan sequencing, voor de beoordeling van: • de grootteverdeling (geschikte grootteprofiel bevestigen met behulp van concentratie, piekverhouding, piekhoogte, ...), • de kwaliteit van de bibliotheek. Monsters bevattende fragmenten met een hoog moleculair gewicht zullen worden ingedeeld als monsters die in aanmerking komen voor sequencing (geeft contaminatie aan met genomisch DNA).

Typische bibliotheken vertonen een smalle grootteverdeling met een piek op ongeveer 300-350 bp.

Daarnaast wordt een Qubit-kwantificeringsstap uitgevoerd zodat de verrijkingsreactie zal plaatsvinden met de geschikte hoeveelheid van ingebracht DNA-materiaal. De concentratie van DNA bedraagt gewoonlijk 15-30 ng/pl. 5. Bibliotheken normaliseren en groeperen

Monsters worden geïndexeerd tijdens bibliotheekbereiding en tot 24 monsters worden genormaliseerd en gegroepeerd in gelijke volumes voor multiplex sequencing over beide banen van een Illumina HiSeq2500 stroomcel. 6. NGS-run

Sequencing wordt uitgevoerd op de HiSeq 2500 (Illumina) in Snelle Runmodus waarbij 50 bp enkel-uiteinde aflezingen worden geproduceerd.

Detectie van een aneuploïdie in een biologisch monster: validatie van de methodologie * Mapping en filtering van de toegekende aflezingen

De 50 bp enkel-uiteinde sequentieaflezingen van een testmonster worden toegewezen aan het referentiegenoom GRCh37.75 met BWA-backtrack. Met Picard tools kunnen gedupliceerde aflezingen worden verwijderd en gebaseerd op de mappingkwaliteit kunnen aflezingen die verwijzen naar meerdere locaties worden genegeerd. Ook aflezingen die suboptimaal verwijzen naar meerdere locaties worden verwijderd. Om de variabiliteit van monsters te reduceren weerhouden we enkel de aflezingen die perfect overeenkomen met het referentiegenoom (d.w.z. er zijn geen mismatches en geen openingen toegelaten), hoewel dit eerder een optionele stap is. Tot slot kunnen ook aflezingen die in een intern opgestelde lijst van gebieden op de zwarte lijst vallen, worden verwijderd. Deze gebieden op de zwarte lijst omvatten gewone polymorfe CNV's, collapsed repeats, DAC zwarte-lijst gebieden gegenereerd voor het ENCODE-project en het ongedefinieerde segment van het referentiegenoom (d.w.z. d eNs). * Berekenen van genomische voorstelling

Het referentiegenoom is onderverdeeld in stukken van 50 kb en het aantal aflezingen van het testmonster wordt geteld per stuk. Deze tellingen van aflezingen worden gecorrigeerd volgens de GC-gehaltes van de stukken met lokaal gewogen spreidingsdiagramafvlakking (Loess-regressie). Deze GC-gecorrigeerde aflezingstellingen worden dan gedeeld door de totale som van alle autosomale GC-gecorrigeerde aflezingstellingen en vermenigvuldigd met 107. Dit wordt gedefinieerd als de genomische voorstellingen (GR) per stuk. Op deze per-stuk GR-waarden wordt een schuifvenster toegepast en de som van deze GR-waarden wordt bepaald voor alle opeenvolgende 100 stukken. De vensters worden elk in de tijd verschoven met 1 stuk (d.w.z. 50 kb). Op deze manier wordt een GR-waarde verkregen per venster van 5 Mb. Zo ook wordt voor elke autosoom de som van de per-stuk GR-waarden berekend, om een GR-waarde te verkrijgen voor elke autosoom in het testmonster. * Vergelijking met een referentiereeks

In een referentiereeks van 100 referentie monsters (een kleiner of groter aantal is ook mogelijk) worden de GR-waarden berekend voor alle autosomen en voor alle vensters van 50 Mb zoals hierboven is beschreven. Voor elk autosoom en venster van 5 Mb worden het gemiddelde μ en de standaardafwijking σ van de GR-scores berekend over alle referentiemonsters. Op deze manier kan een Z-score worden berekend voor elk venster en elk autosoom i in een testmonster, gedefinieerd als

waarbij Gfy de GR-waarde in het testmonster is voor venster of autosoom i en μί; σ; het gemiddelde en de standaardafwijking, respectievelijk, van de GR-scores gemeten in de referentiemonsters voor venster of autosoom i.

Op basis van de 22 Z-scores van de autostomen in een testmonster is een ZZ2 score berekend voor elk autosoom als

waarbij de Z-score zt van autosoom i in het testmonster wordt vergeleken met de mediaan en de standaardafwijking (sd) van de 22 Z-scores verkregen vooralle 22 autosomen in het testmonster.

Als alternatief, wordt een ZofZ-score berekend als

waarbij de Z-score zt van chromosoom i in het testmonster wordt vergeleken met de mediaan en de mediane absolute afwijking (mad) van de 22 Z-scores verkregen voor alle 22 autosomen in het testmonster. De ZZ2- en ZofZ-scores kwantificeren de afwijking van de Z-score van het doelautosoom van? alle Z-scores die zijn geobserveerd in het testmonster. Deze robuuste versie van de Z-of-Z-scores maakt geen vooronderstellingen over de aneuploïdiestatus van het desbetreffende autosoom en de andere autosomen.

Op basis van de Z-scores berekend voor alle 5 Mb-vensters in het testmonster, wordt de BM-score van elk autostoom / berekend als de mediaan van de Z-scores over alle vensters in het doelautosoom:

waar de mediaan van de Z-scores wordt berekend over alle vensters j op autosoom /'.

Deze BM-score geeft de grootte van de afwijking weer: aneuploïdieën zullen resulteren in hogere BM-waarden, terwijl kleinere, segmentele CNV's minder invloed zullen hebben op de mediaan van de Z-scores en resulteren in lagere BM-scores. Om een onderscheid te maken tussen afwijkingsgerelateerde BM-scores en verhoogde BM-waarden omwille van ruis in de gegevensreeks, of de aanwezigheid van genoombrede instabiliteit die indicatief zou kunnen zijn voor kanker, wordt de OM-score voor een autosoom / berekend als de mediaan van de Z-scores van alle vensters van de andere autosomen:

waarbij de mediaan wordt berekend over alle, absolute Z-scores voor 5 Mb vensters j die zich niet op autosoom / bevinden.

Tot slot wordt voor elk testmonster een kwaliteitscore (QS) berekend als

met j over alle autosomen behalve voor de 2 autostomen met de hoogste en de laagste Z-score. Deze score zal testmonsters identificeren met een slechte kwaliteit die resulteren in onbetrouwbare aneuploïdie calling. Een sterk verhoogde QS-score kan ook verwijzen naar DNA-monsters bevattende ten minste een fractie van DNA dat afkomstig is van een tumor.

Voor elk van de hierboven berekende parameters kan een drempelwaarde worden gedefinieerd. Op basis van standaard statistische overwegingen kan men een drempelwaarde van 2, 2,5 of 3 kiezen. In de context van de Z-score betekent dit dat de kans dat het testresultaat normaal is (d.w.z. de verkregen GR-score is gelijkaardig aan de GR-scores voor hetzelfde gebied in de referentiereeks) erg klein is. Om een test specifieker te maken, zou men de drempelwaarde kunnen verhogen. Om een test gevoeliger te maken, zou men de drempelwaarde kunnen verlagen. Deze drempelwaarden kunnen voor elk van de parameters worden bepaald, en kunnen voor elk van de parameters verschillen. Het is bijvoorbeeld denkbaar dat drempelwaarden voor BM en OM worden ingesteld op 1 terwijl ze voor de Z-score en ZZ-score op 3 worden ingesteld. Ook negatieve drempelwaarden kunnen worden gebruikt.

Geanalyseerd monster G vertoonde een QS-score van 27,526. De grafiek van de OM-waarden of de autosomen vertoonde extreme waarden (Figuur 1). Visuele inspectie van de grafieken van de individuele autosomen bevestigde dat dit monster zich abnormaal gedroeg (figuur 2). Dit type van algemeen sterk variërende patronen in de Z-scores is indicatief voor genoombrede instabiliteit.

Er wordt verondersteld dat de onderhavige uitvinding niet beperkt is tot enige uitvoeringsvorm die hierboven is beschreven en dat bepaalde wijzigingen kunnen worden toegevoegd aan het onderhavige voorbeeld zonder herwaardering van de bijgevoegde conclusies.

Claims

Conclusies

1. Een werkwijze voor het identificeren van de aanwezigheid van tumorafgeleid celvrij DNA bij een zoogdier, waarbij de genoemde werkwijze omvat: - het voorzien van de sequenties van ten minste een segment van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van een patiënt, waarbij het genoemde biologische monster celvrij DNA omvat; - het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor tellingen van aflezingen worden verkregen; - het normaliseren van de genoemde tellingen van aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score van de genoemde genormaliseerde aflezingen en het verkrijgen van een verzameling van scores van de genoemde genormaliseerde aflezingen, waarbij de genoemde eerste score is afgeleid van de genoemde genormaliseerde aflezingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van het genormaliseerde aantal aflezingen voor een reeks chromosomen of chromosoomseg menten die het chromosomaal doelsegment of chromosoom bevatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores, waarbij de genoemde parameter een verhouding voorstelt tussen * de genoemde eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de genoemde verzameling scores; en - het vergelijken van de genoemde parameter met een drempelwaarde, waarbij de genoemde drempelwaarde een vereiste is voor de aanwezigheid of afwezigheid van een of meerdere aneuploïdieën van het genoemde doelchromosoom of chromosomaal segment dat een indicator is van de aanwezigheid van tumorafgeleid celvrij DNA.
2. De werkwijze volgens conclusie 1, met het kenmerk dat het genoemde aantal aflezingen opnieuw wordt gekalibreerd om te corrigeren voor GC-inhoud en/of totaal aantal aflezingen verkregen uit het genoemde monster.
3. De werkwijze volgens conclusie 1 of 2, met het kenmerk dat de genoemde normalisatie gebeurt via vergelijking met gegevens die zijn verkregen van overeenkomstige chromosomale segmenten of chromosomen uit een referentiereeks.
4. De werkwijze volgens één der conclusies 1 tot 3, met het kenmerk dat de genoemde samenvattende statistiek het gemiddelde, de mediaan, de standaardafwijking, de gemiddelde absolute afwijking of de mediane absolute afwijking is.
5. De werkwijze volgens één der conclusies 1 tot 4, waarbij de sequencing willekeurig wordt uitgevoerd op een segment van de nucleïnezuurmoleculen die in het biologische monster zitten.
6. De werkwijze volgens één der voorgaande conclusies, waarbij het biologische monster bloed, plasma, serum, urine, transcervicaal fluïdum of speeksel is.
7. De werkwijze volgens één der voorgaande conclusies, waarbij de genoemde drempelwaarde is bepaald met behulp van standaard statistische overwegingen, of empirisch bepaald met behulp van biologische monsters.
8. De werkwijze volgens één der voorgaande conclusies, waarbij de genoemde eerste score wordt berekend als:

waarbij i een chromosoom of chromosomaal segment of het doelchromosoom of chromosomaal doelsegment is.
9. De werkwijze volgens één der voorgaande conclusies, met het kenmerk dat de genoemde parameter p is berekend als:

waarbij (Zj) een verzameling scores voorstelt die zijn afgeleid van chromosomen of chromosomale segmenten i, a, b, ... waarbij i overeenkomt met het chromosomale doelsegment of chromosoom.
10. De werkwijze volgens één der voorgaande conclusies, omvattende de berekening van secundaire parameters, waarbij de genoemde secundaire parameters een vereiste zijn voor de hoeveelheid van de genoemde aneuploïdie, indien wordt gevonden dat het aanwezig is, en/of een maatstaf van de kwaliteit van het monster.
11. De werkwijze volgens conclusie 10, waarbij de genoemde secundaire parameters worden vergeleken met een drempelwaarde.
12. De werkwijze volgens één der conclusies 10 of 11, waarbij de genoemde aanwezigheid of afwezigheid van een aneuploïdie wordt bepaald door de vergelijking van de genoemde parameter met een drempelwaarde en de vergelijking van een of meerdere secundaire parameters en overeenkomstige drempelwaarden.
13. De werkwijze volgens één der voorgaande conclusies 1 tot 12, waarbij de genoemde aneuploïdie aneuploïdie van het volledige chromosoom, een verlies, een winst, een amplificatie of een deletie van een substantieel segment van een chromosoom op armniveau omvat.
14. De werkwijze van conclusie 13, waarbij de genoemde aneuploïdie van het volledige chromosoom een winst of een verlies omvat zoals getoond in Tabel 1.
15. De werkwijze van conclusie 14, waarbij de genoemde chromosomale doelsegmenten substantieel segmenten op armniveau zijn omvattende een p-arm of een q-arm van elk een of meerdere van de chromosomen 1-22, X en Y.
16. De werkwijze van conclusie 15, waarbij het genoemde chromosomale doelsegment een of meerdere armen omvat geselecteerd uit de groep bestaande uit lq, 3q, 4p, 4q, 5p, 5q, 6p, 6q, 7p, 7q, 8p, 8q, 9p, 9q, 10p, lOq, 12p, 12q, 13q, 14q, 16p, 17p, 17q, 18p, 18q, 19p, 19q, 20p, 20q, 21q en/of 22q.
17. De werkwijze van conclusie 1 tot 14, waarbij de genoemde aneuploïdie een amplificatie of deletie omvat van een of meerdere armen geselecteerd uit de groep bestaande uit lq, 3q, 4p, 4q, 5p, 5q, 6p, 6q, 7p, 7q, 8p, 8q, 9p, 9q, 10p, 10q, 12p, 12q, 13q, 14q, 16p, 17p, 17q, 18p, 18q, 19p, 19q, 20p, 20q, 21q, 22q.
18. De werkwijze van conclusie 1 tot 17, waarbij de genoemde chromosomale segmenten segmenten zijn die een gebied en/of een gen omvatten getoond in Tabel 3 en/of Tabel 5 en/of Tabel 4 en/of Tabel 6.
19. De werkwijze van conclusie 1 tot 17, waarbij de genoemde aneuploïdie een amplificatie omvat van een gebied en/of een gen getoond in Tabel 3 en/of Tabel 5.
20. De werkwijze van conclusie 1 tot 17, waarbij de genoemde aneuploïdie een deletie omvat van een gebied en/of een gen getoond in Tabel 4 en/of Tabel 6.
21. De werkwijze van conclusie 1 tot 20, waarbij de genoemde chromosoomsegmenten segmenten zijn waarvan bekend is dat ze een of meerdere oncogenen en/of een of meerdere tumoronderdrukkende genen bevatten.
22. De werkwijze van conclusie 1 tot 17, waarbij de genoemde aneuploïdie een amplificatie omvat van een of meerdere gebieden geselecteerd uit de groep bestaande uit 20Q13, 19ql2, Iq21-lq23, 8pll-pl2, MYC, ERBB2 (EGFR), CCIMDl (Cyclin Dl), FGFR1, FGFR2, HRAS, KRAS, MYB, MDM2, CCNE, IMRAS, MET, ERBB1, CDK4, MYCB, ERBB2, AKT2, MDM2, BRAF, ARAF, CRAF, PIK3CA, AKT1, PTEIM, STK11, MAP2K1, ALK, ROSI, CTIMIMB1, TP53, SMAD4, FBX7, FGFR3, NOTCH1, ERBB4 en CDK4 en dergelijke.
23. De werkwijze van één der conclusies 1 tot 22, waarbij de genoemde kanker een kanker is geselecteerd uit de groep bestaande uit leukemie, ALL, hersenkanker, borstkanker, colorectale kanker, gededifferentieerd liposarcoom, esofagaal adenocarcinoom, esofagale squameuze celkanker, GIST, glioom, HCC, hépatocellulaire kanker, longkanker, long NSC, long SC, medullobastoom, melanoom, MPD, myeloproliferatieve aandoening, baarmoederhalskanker, eierstokkanker, prostaatkanker en nierkanker.
24. De werkwijze van één der conclusies 1 tot 23, waarbij de detectie van aneuploïdieën een positief resultaat aangeeft en de genoemde werkwijze verder het voorschrijven, starten en/of veranderen van een behandeling omvat van een humane patiënt van wie het testmonster was afgenomen.
25. De werkwijze van conclusie 24, waarbij het genoemd voorschrijven, starten en/of veranderen van een behandeling van een humane patiënt van wie het testmonster was afgenomen, het voorschrijven en/of uitvoeren van verdere diagnose omvat voor het bepalen van de aanwezigheid en/of ernst van een kanker.
26. De werkwijze van conclusie 25, waarbij de verdere diagnostiekhet screenen omvat van een monster van de genoemde patiënt voor een biomarker van een kanker, en/of beeldvorming van de genoemde patiënt voor een kanker.
27. Een computerprogrammaproduct omvattende een door de computer leesbaar medium gecodeerd met meerdere instructies voor het sturen van een computersysteem voor het uitvoeren van een bewerking voor het uitvoeren van de analyse van de aanwezigheid van een kanker en/of een verhoogd risico op een kanker bij een zoogdier in een biologisch monster dat is verkregen van een patiënt, waarbij het biologische monster nucleïnezuurmoleculen bevat, waarbij de bewerking de stappen omvat van: - het ontvangen van de sequenties van ten minste een segment van de nucleïnezuurmoleculen die zijn opgenomen in een biologisch monster dat is verkregen van een patiënt, waarbij het genoemde biologische monster celvrij DNA omvat; - het aligneren van de genoemde verkregen sequenties met een referentiegenoom; - het tellen van het aantal aflezingen op een reeks chromosomale segmenten en/of chromosomen waardoor tellingen van aflezingen worden verkregen; - het normaliseren van de genoemde tellingen van aflezingen of een afgeleide daarvan naar een genormaliseerd aantal aflezingen; - het verkrijgen van een eerste score van de genoemde genormaliseerde aflezingen en het verkrijgen van een verzameling van scores van de genoemde genormaliseerde aflezingen, waarbij de genoemde eerste score is afgeleid van de genormaliseerde aflezingen voor een doelchromosoom of chromosomaal segment, en waarbij de genoemde verzameling van scores een reeks scores is die zijn afgeleid van de genormaliseerde aflezingen voor een reeks chromosomen of chromosomale segmenten die het chromosomaal doelsegment of chromosoom bevatten; - het berekenen van een parameter p op basis van de genoemde eerste score en de genoemde verzameling scores, waarbij de genoemde parameter een verhouding voorstelt tussen * de genoemde eerste score, gecorrigeerd door een samenvattende statistiek van de genoemde verzameling scores, en * een samenvattende statistiek van de genoemde verzameling scores; en - het vergelijken van de genoemde parameter met een drempelwaarde, waarbij de genoemde drempelwaarde een vereiste is voor de aanwezigheid of afwezigheid van een of meerdere aneuploïdieën in het genoemde doelchromosoom of chromosoomsegment dat een indicator is voor de aanwezigheid en/of een verhoogd risico op kanker.
28. Computerprogrammaproduct volgens conclusie 27, verder omvattende bewerkingen voor het berekenen van een of meerdere secundaire parameters, waarbij de genoemde secundaire parameters een vereiste zijn voor de intensiteit van de genoemde aneuploïdie, indien gevonden wordt dat dit aanwezig is, en/of een maatstaf van de kwaliteit van het monster.
29. Een kit omvattende een computerprogrammaproduct volgens één der conclusies 27 of 28 en een protocol voor het verkrijgen van de sequenties van ten minste een deel van de nucleïnezuurmoleculen opgenomen in een biologisch monster, waarbij het genoemde biologische monster celvrij DNA omvat.
30. Een rapport, omvattende een schatting van de aanwezigheid of afwezigheid van een chromosomale aneuploïdie bij een patiënt, waarbij het genoemde rapport de parameter p, een of meerdere secundaire parameters en een vergelijking met een drempelwaarde omvat zoals gedefinieerd in één der conclusies 1 tot 27 en een visualisatie van de genoemde aflezingen per chromosoom.