JP6683752B2 - Non-invasive determination of fetal or tumor methylome by plasma - Google Patents

Non-invasive determination of fetal or tumor methylome by plasma Download PDF

Info

Publication number
JP6683752B2
JP6683752B2 JP2018061744A JP2018061744A JP6683752B2 JP 6683752 B2 JP6683752 B2 JP 6683752B2 JP 2018061744 A JP2018061744 A JP 2018061744A JP 2018061744 A JP2018061744 A JP 2018061744A JP 6683752 B2 JP6683752 B2 JP 6683752B2
Authority
JP
Japan
Prior art keywords
methylation
cancer
plasma
dna
maternal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018061744A
Other languages
Japanese (ja)
Other versions
JP2018121644A (en
Inventor
ワイ クン チウ ロッサ
ワイ クン チウ ロッサ
クワン チー チャン
クワン チー チャン
ユク−ミン デニス ロー
ユク−ミン デニス ロー
ミウ ファン ルン
ミウ ファン ルン
ペイヨン チャン
ペイヨン チャン
ワイ マン チャン
ワイ マン チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=50340462&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6683752(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from US13/842,209 external-priority patent/US9732390B2/en
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Publication of JP2018121644A publication Critical patent/JP2018121644A/en
Priority to JP2020055387A priority Critical patent/JP6985753B2/en
Application granted granted Critical
Publication of JP6683752B2 publication Critical patent/JP6683752B2/en
Priority to JP2021188060A priority patent/JP2022031753A/en
Priority to JP2023167714A priority patent/JP2024009833A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Description

分野
本開示は一般に、DNAのメチル化パターン(メチローム)の決定に関し、より詳しくは、別々のゲノムに由来(例えば胎児と母親にそれぞれ由来、または腫瘍と正常細胞にそれぞれ由来)するDNAの混合物を含む生物試料(例えば血漿)を解析して、少数のゲノムのメチル化パターン(メチローム)を決定することに関する。決定されたメチロームの使用についても記載する。
FIELD The present disclosure relates generally to the determination of methylation patterns (methylome) of DNA, and more particularly to the detection of a mixture of DNAs from different genomes (eg, fetal and maternal, or tumor and normal cell, respectively). It relates to analyzing a biological sample containing (eg plasma) to determine the methylation pattern (methylome) of a small number of genomes. The use of the determined methylome is also described.

関連出願への相互参照
本願は、2013年6月3日出願の米国仮特許出願第61/830,571号「Tumor Detection In Plasma Using Methylation Status And Copy Number」と、2012年9月20日出願の米国仮特許出願第61/703,512号「Method Of Determining The Whole Genome DNA Methylation Status Of The Placenta By Massively Parallel Sequencing Of Maternal Plasma」の非仮出願でありその利益を主張する2013年3月15日出願の米国出願第13/842,209号「Non−Invasive Determination Of Methylome Of Fetus Or Tumor From Plasma」と、に対して優先権を主張するPCT出願であり、それらの全体はあらゆる目的のために参照によって本明細書に援用される。
CROSS REFERENCE TO RELATED APPLICATIONS This application is incorporated by reference in US Provisional Patent Application No. 61 / 830,571, "Tumor Detection In Plasma Using Measurement Status And Copy Number", filed June 3, 2013, filed September 20, 2012. U.S. Provisional Patent Application No. 61 / 703,512 "Method of Determining The Whore Genome DNA Methylation Status of The Placenta by Massively Application for 15 years in the 15th month of non-profitable May 13th of the month of 13th of May. Application No. 13 / 842,209 of "Non-Invasive Determination" f a Methylome Of Fetus Or Tumor From Plasma ", a PCT application claiming priority to, in their entirety are hereby incorporated by reference for all purposes.

背景
胚および胎児の発生は複雑なプロセスであり、一連の高度に統制された遺伝的および後成的現象が関与している。がんの発生もまた、典型的に多重的な遺伝的および後成的過程が関与する複雑なプロセスである。発生プロセスの後成的制御における異常は、不妊症、自然流産、子宮内発育異常、および出生後経過に関係するとされる。DNAメチル化は、研究されることの最も多い後成的メカニズムのひとつである。DNAのメチル化は、CpGジヌクレオチドの間でシトシン残基の5’炭素にメチル基が付加されるという状況としてもっともよく起こる。シトシンメチル化は、遺伝子転写およびDNA機能に制御を一階層付加する。例えば、CpG島と称される、CpGジヌクレオチドの多い遺伝子プロモーターの高度メチル化は通常、遺伝子機能の抑制に関連づけられる。
Background Embryonic and fetal development is a complex process that involves a series of highly regulated genetic and epigenetic phenomena. Cancer development is also a complex process that typically involves multiple genetic and epigenetic processes. Abnormalities in the epigenetic control of developmental processes are associated with infertility, spontaneous abortion, intrauterine developmental abnormalities, and postnatal course. DNA methylation is one of the most studied epigenetic mechanisms. Methylation of DNA most commonly occurs in the context of adding a methyl group to the 5'carbon of cytosine residues between CpG dinucleotides. Cytosine methylation adds a layer of control to gene transcription and DNA function. For example, hypermethylation of CpG dinucleotide-rich gene promoters, called CpG islands, is usually associated with repression of gene function.

発生プロセスを調和させる上で後成的メカニズムの役割が重要であるにもかかわらず、ヒトの胚および胎児の組織は、解析のために容易に利用できない(腫瘍も同様に利用できないことがある)。ヒトの出生前期中の健康と疾患におけるこのような後成的プロセスの動的変化について研究は実質上不可能である。胚外組織、特に胎盤は出生前診断の手順の一部として、または出産後に得ることができるので、このような調査にとって主要な手段のひとつとなっている。しかしながら、このような組織は浸潤性の手順を必要とする。   Despite the importance of epigenetic mechanisms in coordinating developmental processes, human embryonic and fetal tissues are not readily available for analysis (and tumors may be unavailable as well) . Studies on the dynamic changes of these epigenetic processes in human prenatal health and disease are virtually impossible. Extraembryonic tissues, especially the placenta, have become one of the major tools for such studies, as they can be obtained as part of the prenatal diagnostic procedure or after delivery. However, such tissue requires an invasive procedure.

ヒト胎盤のDNAメチル化特性は数十年の間研究者の興味を引いてきた。ヒト胎盤は、DNAメチル化の関係する独特な生理的特徴を非常に多く示す。全体のレベルでは、胎盤組織はほとんどの体細胞組織に比べて低メチル化となっている。遺伝子のレベルでは、所定のゲノム遺伝子座のメチル化状態は、胎盤組織に固有の特異的な特徴である。全体的および遺伝子座特異的なメチル化特性の両方が妊娠期間依存的な変化を示す。刷り込み遺伝子、即ち、その発現が対立遺伝子の親起源に依存的な遺伝子は、胎盤において重要な機能を果たす。胎盤は擬似悪性として説明され、いくつかの腫瘍抑制遺伝子の高度メチル化が観察されてきた。   The DNA methylation properties of human placenta have been of interest to researchers for decades. The human placenta exhibits numerous unique physiological features associated with DNA methylation. At a global level, placental tissue is hypomethylated compared to most somatic tissues. At the genetic level, the methylation status of a given genomic locus is a unique feature unique to placental tissue. Both global and locus-specific methylation properties show gestation-dependent changes. Imprinted genes, ie genes whose expression is dependent on the parental origin of the allele, play important functions in the placenta. The placenta has been described as pseudo-malignant and hypermethylation of several tumor suppressor genes has been observed.

胎盤組織のDNAメチル化特性の研究は、例えば、子癇前症および子宮内胎児発育遅延等、妊娠関連または発生関連疾患の病態生理学に洞察を与えてきた。ゲノム刷り込みにおける障害は、プラダー・ウィリー症候群およびアンジェルマン症候群等、発達障害に関連するとされる。胎盤および胎児の組織におけるゲノム刷り込みおよび全体DNAメチル化の変動特性が、補助生殖医療によって起こる妊娠において観察されている(H Hiura et al.2012 Hum Reprod;27:2541−2548)。いくつかの環境要因、例えば母親の喫煙(KE Haworth et al.2013 Epigenomics;5:37−49)、母親の食事要因(X Jiang et al.2012 FASEB J;26:3563−3574)、および糖尿病等の母親の代謝状態(N Hajj et al.,Diabetes.doi:10.2337/db12−0289)が、出生児の後成的異常に関連するとされている。   Studies of the DNA methylation properties of placental tissues have provided insights into the pathophysiology of pregnancy-related or development-related diseases such as preeclampsia and intrauterine growth restriction. Disorders in genomic imprinting are said to be associated with developmental disorders such as Prader-Willi syndrome and Angelman syndrome. Variable characteristics of genomic imprinting and global DNA methylation in placenta and fetal tissues have been observed in pregnancy caused by assisted reproductive medicine (H Hiura et al. 2012 Hum Reprod; 27: 2541-2548). Several environmental factors, such as mother's smoking (KE Harborth et al. 2013 Epigenomics; 5: 37-49), mother's dietary factor (X Jiang et al. 2012 FASEB J; 26: 3563-3574), and diabetes. Mother's metabolic status (N Hajj et al., Diabetes. Doi: 10.2337 / db12-0289) has been implicated in epigenetic abnormalities in offspring.

概要
数十年間の努力にもかかわらず、胎児または腫瘍のメチロームを研究するためおよび、妊娠中または悪性腫瘍等の疾患経過中を通して動的変化を監視するために、利用可能な実用的手段が何もなかった。したがって、胎児のメチロームおよび腫瘍のメチロームの全てまたは部分を非浸潤的に解析する方法を提供することが望まれている。
Despite efforts SUMMARY decades to study the Mechiromu fetal or tumors and, in order to monitor the dynamic changes throughout the course of the disease, such as pregnant or malignant tumors, what is available practical means There was no. Therefore, it is desired to provide a method for noninvasively analyzing all or part of a fetal methylome and a tumor methylome.

実施形態は、種々の組織および試料のメチル化特性を決定し使用する系、方法、および装置を提供する。実施例を提供する。メチル化特性は、血漿メチル化(または無細胞DNAをもった他の試料、例えば尿、唾液、生殖器流出物)と母親/患者のメチル化特性との比較に基づいて、胎児/腫瘍組織について推定することができる。試料がDNAの混合物を有する場合、組織特異的対立遺伝子を用いて胎児/腫瘍からDNAを特定し、その胎児/腫瘍組織についてメチル化特性を決定することができる。メチル化特性を用いて、胎児/腫瘍のゲノムにおけるコピー数変動を決定することができる。胎児についてのメチル化マーカーは、種々の技術によって特定されてきた。メチル化特性を、DNA断片のサイズ分布のサイズパラメーターを決定することによって決定し、サイズパラメーターに対する参照値を用いてメチル化レベルを決定することができる。   Embodiments provide systems, methods, and devices for determining and using the methylation properties of various tissues and samples. Examples are provided. Methylation profile is estimated for fetal / tumor tissue based on comparison of plasma methylation (or other samples with cell-free DNA such as urine, saliva, genital effluent) to maternal / patient methylation profiles can do. If the sample has a mixture of DNAs, tissue-specific alleles can be used to identify DNA from the fetus / tumor and determine the methylation profile for that fetal / tumor tissue. The methylation profile can be used to determine copy number variation in the fetal / tumor genome. Methylation markers for the fetus have been identified by various techniques. The methylation profile can be determined by determining the size parameter of the size distribution of the DNA fragments and a reference value for the size parameter can be used to determine the methylation level.

加えて、メチル化レベルを用いてがんのレベルを決定することができる。がんの関連においては、血漿におけるメチロームの変化の測定によってがんを検出して(例えば、スクリーニングを目的として)、監視(例えば、抗がん治療に続く応答の検出、およびがん再発の検出)、および予後判定が(例えば、身体におけるがん細胞の負荷の測定のため、または病期分類目的のため、または、疾患または疾患進行若しくは転移プロセスによる死亡の可能性の推定のために)可能となる。   In addition, methylation levels can be used to determine cancer levels. In the cancer context, detecting cancer by measuring changes in methylome in plasma (eg, for screening purposes), monitoring (eg, detecting response following anti-cancer treatment, and detecting cancer recurrence). ), And prognosis (eg, for measuring the burden of cancer cells in the body, or for staging purposes, or for estimating the likelihood of death from a disease or disease progression or metastatic process) Becomes

以下の、発明を実施するための形態と添付図面を参照して、本発明の実施形態の性質および利点についてよりよい理解が得られる。   A better understanding of the nature and advantages of the embodiments of the present invention may be gained by reference to the following detailed description and the accompanying drawings.

本発明の実施形態による、母体血、胎盤、および母体血漿の配列決定の、表100の結果を示す。10 shows the results of Table 100 of maternal blood, placenta, and maternal plasma sequencing according to embodiments of the present invention. 本発明の実施形態による、母体血、胎盤、および母体血漿の配列決定の、表100の結果を示す。10 shows the results of Table 100 of maternal blood, placenta, and maternal plasma sequencing according to embodiments of the present invention. 本発明の実施形態に従って配列決定された試料の1Mbウィンドウ内のメチル化密度を示す。3 shows the methylation density within a 1 Mb window of a sample sequenced according to an embodiment of the invention. メチル化指標に対するβ値のプロットを示す:(A)母体血液細胞、(B)絨毛膜絨毛検体、(C)満期胎盤組織。Shown are plots of β values against the methylation index: (A) maternal blood cells, (B) chorionic villous specimen, (C) term placenta tissue. メチル化指標に対するβ値のプロットを示す:(A)母体血液細胞、(B)絨毛膜絨毛検体、(C)満期胎盤組織。Shown are plots of β values against the methylation index: (A) maternal blood cells, (B) chorionic villous specimen, (C) term placenta tissue. メチル化指標に対するβ値のプロットを示す:(A)母体血液細胞、(B)絨毛膜絨毛検体、(C)満期胎盤組織。Shown are plots of β values against the methylation index: (A) maternal blood cells, (B) chorionic villous specimen, (C) term placenta tissue. 成人男性および非妊娠成人女性から採取された血漿および血液細胞における、メチル化されたCpG部位の割合の棒グラフを示す:(A)常染色体、(B)X染色体。Figure 3 shows a bar graph of the percentage of methylated CpG sites in plasma and blood cells collected from adult males and non-pregnant adult females: (A) autosomal chromosome, (B) X chromosome. 成人男性および非妊娠成人女性から採取された血漿および血液細胞における、メチル化されたCpG部位の割合の棒グラフを示す:(A)常染色体、(B)X染色体。Figure 3 shows a bar graph of the percentage of methylated CpG sites in plasma and blood cells collected from adult males and non-pregnant adult females: (A) autosomal chromosome, (B) X chromosome. 血液細胞DNAおよび血漿DNAにおける対応する遺伝子座のメチル化密度のプロットを示す:(A)非妊娠成人女性、(B)成人男性。Shows plots of methylation densities of corresponding loci in blood cell DNA and plasma DNA: (A) non-pregnant adult female, (B) adult male. 血液細胞DNAおよび血漿DNAにおける対応する遺伝子座のメチル化密度のプロットを示す:(A)非妊娠成人女性、(B)成人男性。Shows plots of methylation densities of corresponding loci in blood cell DNA and plasma DNA: (A) non-pregnant adult female, (B) adult male. 妊娠女性から採取した試料間の、メチル化されたCpG部位の割合の棒グラフを示す:(A)常染色体、(B)X染色体。Figure 4 shows a bar graph of the percentage of methylated CpG sites between samples taken from pregnant women: (A) autosomal chromosome, (B) X chromosome. 妊娠女性から採取した試料間の、メチル化されたCpG部位の割合の棒グラフを示す:(A)常染色体、(B)X染色体。Figure 4 shows a bar graph of the percentage of methylated CpG sites between samples taken from pregnant women: (A) autosomal chromosome, (B) X chromosome. 母体血、胎盤および母体血漿における、ヒトゲノムの異なる反復クラスのメチル化レベルの棒グラフを示す。3 shows a bar graph of methylation levels of different repeat classes of the human genome in maternal blood, placenta and maternal plasma. 第一期試料のCircosプロット700を示す。1 shows a Circos plot 700 of a first trimester sample. 第三期試料のCircosプロット750を示す。3 shows a Circos plot 750 of a third trimester sample. 有益な一塩基多型を囲んでいるCpG部位についての、母体血漿DNAに対するゲノム組織DNAのメチル化密度の比較のプロットを示す。Figure 4 shows a comparative plot of methylation densities of genomic tissue DNA versus maternal plasma DNA for CpG sites surrounding the informative single nucleotide polymorphism. 有益な一塩基多型を囲んでいるCpG部位についての、母体血漿DNAに対するゲノム組織DNAのメチル化密度の比較のプロットを示す。Figure 4 shows a comparative plot of methylation densities of genomic tissue DNA versus maternal plasma DNA for CpG sites surrounding the informative single nucleotide polymorphism. 有益な一塩基多型を囲んでいるCpG部位についての、母体血漿DNAに対するゲノム組織DNAのメチル化密度の比較のプロットを示す。Figure 4 shows a comparative plot of methylation densities of genomic tissue DNA versus maternal plasma DNA for CpG sites surrounding the informative single nucleotide polymorphism. 有益な一塩基多型を囲んでいるCpG部位についての、母体血漿DNAに対するゲノム組織DNAのメチル化密度の比較のプロットを示す。Figure 4 shows a comparative plot of methylation densities of genomic tissue DNA versus maternal plasma DNA for CpG sites surrounding the informative single nucleotide polymorphism. 本発明の実施形態に従って、生物の生物試料から第一のメチル化特性を決定するための方法900を示すフローチャートである。6 is a flowchart illustrating a method 900 for determining a first methylation property from a biological sample of an organism according to an embodiment of the invention. 本発明の実施形態に従って、生物の生物試料から第一メチル化特性を決定する方法1000を示すフローチャートである。6 is a flow chart illustrating a method 1000 of determining a first methylation characteristic from a biological sample of an organism according to an embodiment of the invention. 本発明の実施形態による、母体血漿データおよび胎児DNA濃度分率を用いた予測アルゴリズムの実行のグラフを示す。6 shows a graph of the execution of a prediction algorithm using maternal plasma data and fetal DNA concentration fractions according to embodiments of the invention. 本発明の実施形態による、母体血漿データおよび胎児DNA濃度分率を用いた予測アルゴリズムの実行のグラフを示す。6 shows a graph of the execution of a prediction algorithm using maternal plasma data and fetal DNA concentration fractions according to embodiments of the invention. 本発明の実施形態に従った、メチル化予測のための、15の選択されたゲノム遺伝子座の詳細を示す表1200である。1 is a table 1200 detailing 15 selected genomic loci for methylation prediction, according to an embodiment of the invention. 15の選択されたゲノム遺伝子座および胎盤におけるそれらの対応するメチル化レベルの推定カテゴリーを示すグラフ1250を示す。11 shows a graph 1250 showing the estimated categories of 15 selected genomic loci and their corresponding methylation levels in placenta. 少なくとも1つの胎児を妊娠した女性対象の生物試料から胎児の染色体異常を検出する方法1300のフローチャートである。6 is a flowchart of a method 1300 for detecting fetal chromosomal abnormalities from a biological sample of a female subject who has been pregnant with at least one fetus. 本発明の実施形態に従って、胎盤メチル化特性を母体メチル化特性と比較することによる、メチル化マーカーを特定するための方法1400のフローチャートである。6 is a flow chart of a method 1400 for identifying methylation markers by comparing placental methylation profile to maternal methylation profile according to embodiments of the present invention. 33の以前に報告された第一期マーカーを参照して第一期データを用いる、DMR特定アルゴリズムの性能を示す、表1500である。FIG. 13 is a table 1500 showing the performance of the DMR identification algorithm using first trimester data with reference to 33 previously reported trimester markers. 第三期データを用いる、分娩時に得られた胎盤試料と比較された、DMR特定アルゴリズムの性能を示す、表1550である。FIG. 15 is a table 1550 showing the performance of the DMR identification algorithm compared to placental samples obtained at parturition using the third trimester data. 母体血漿亜硫酸水素塩配列決定データの直接解析に基づいて高度メチル化または低メチル化状態であると予測された遺伝子座の数を示す、表1600である。1B is a table 1600 showing the number of loci predicted to be hypermethylated or hypomethylated based on direct analysis of maternal plasma bisulfite sequencing data. 母体血漿DNA、非妊娠女性対照血漿DNA、胎盤DNAおよび末梢血DNAのサイズ分布を示す、プロット1700である。1D is a plot 1700 showing the size distribution of maternal plasma DNA, non-pregnant female control plasma DNA, placental DNA and peripheral blood DNA. 母体血漿、成人女性対照血漿、胎盤組織および成人女性対照血液のサイズ分布およびメチル化特性の、プロット1750である。1750 is a plot 1750 of size distribution and methylation profile of maternal plasma, adult female control plasma, placental tissue and adult female control blood. 本発明の実施形態による、血漿DNA分子のメチル化密度およびサイズのプロットである。3 is a plot of methylation density and size of plasma DNA molecules, according to an embodiment of the invention. 本発明の実施形態による、血漿DNA分子のメチル化密度およびサイズのプロットである。3 is a plot of methylation density and size of plasma DNA molecules, according to an embodiment of the invention. 成人非妊娠女性の配列決定されたリードのメチル化密度およびサイズの、プロット1900を示す。FIG. 3B shows a plot 1900 of methylation density and size of sequenced reads for adult non-pregnant women. 母体血漿中の胎児特異的DNA分子および母体特異的DNA分子のサイズ分布およびメチル化特性を示す、1950である。1950, showing size distribution and methylation characteristics of fetal-specific and maternal-specific DNA molecules in maternal plasma. 本発明の実施形態に従って、生物の生物試料中のDNAのメチル化レベルを推定するための方法2000のフローチャートである。3 is a flow chart of a method 2000 for estimating the methylation level of DNA in a biological sample of an organism, according to an embodiment of the invention. 肝細胞がん(HCC)患者の手術前血漿および組織試料のメチル化密度を示す表2100である。FIG. 2B is a table 2100 showing pre-operative plasma and tissue sample methylation densities of hepatocellular carcinoma (HCC) patients. 試料ごとに達成された配列リードの数および配列決定深度を示す表2150である。FIG. 2B is a table 2150 showing the number of sequence reads and the sequencing depth achieved for each sample. 常染色体におけるメチル化密度が健常対照群の血漿試料において71.2%〜72.5%の範囲であったことを示す、表220である。Table 220, showing that the autosomal methylation densities ranged from 71.2% to 72.5% in healthy control plasma samples. HCC患者の軟膜、腫瘍組織、非腫瘍性肝組織、手術前血漿および手術後血漿のメチル化密度を示す。3 shows the methylation densities of buffy coat, tumor tissue, non-neoplastic liver tissue, pre-operative plasma and post-operative plasma of HCC patients. HCC患者の軟膜、腫瘍組織、非腫瘍性肝組織、手術前血漿および手術後血漿のメチル化密度を示す。3 shows the methylation densities of buffy coat, tumor tissue, non-neoplastic liver tissue, pre-operative plasma and post-operative plasma of HCC patients. HCC患者から得た手術前血漿のメチル化密度を示すプロット2400である。FIG. 2B is a plot 2400 showing the methylation density of pre-operative plasma obtained from HCC patients. HCC患者から得た手術後血漿のメチル化密度を示すプロット2450である。FIG. 3B is a plot 2450 showing the methylation density of post-operative plasma obtained from HCC patients. 1番染色体の参照として4人の健常対照患者の血漿メチロームデータを用いた、HCC患者の手術前(プロット2500)および手術後(プロット2550)の血漿試料の血漿DNAメチル化密度のZ値を示す。The Z values of plasma DNA methylation densities of plasma samples of HCC patients before surgery (plot 2500) and after surgery (plot 2550) were used, using plasma methylome data of 4 healthy control patients as a reference to chromosome 1. Show. 1番染色体の参照として4人の健常対照患者の血漿メチロームデータを用いた、HCC患者の手術前(プロット2500)および手術後(プロット2550)の血漿試料の血漿DNAメチル化密度のZ値を示す。The Z values of plasma DNA methylation densities of plasma samples of HCC patients before surgery (plot 2500) and after surgery (plot 2550) were used, using plasma methylome data of 4 healthy control patients as a reference to chromosome 1. Show. 手術前血漿および手術後血漿のZ値のデータを示す、表2600である。FIG. 2B is a table 2600 showing data for Z values for pre- and post-operative plasma. 全常染色体から解析された1Mbビンの参照として4人の健常対照患者を用いた、HCC患者の手術前血漿試料および手術後血漿試料の血漿DNAメチル化密度のZ値を示すCircosプロット2620である。Circos plot 2620 showing Z values of plasma DNA methylation densities of pre-operative and post-operative plasma samples of HCC patients, using 4 healthy control patients as a reference for 1 Mb bins analyzed from all autosomes. . HCC患者の手術前血漿試料および手術後血漿試料の両方における全ゲノムの1MbビンのZ値の分布を示す、表2640である。Table 2640 shows the distribution of whole genome 1 Mb bin Z values in both pre- and post-surgical plasma samples of HCC patients. CHH配列およびCHG配列を用いた場合の対照血漿試料のいくつかと重複する、腫瘍組織および手術前血漿試料のメチル化レベルを示す、表2660である。Table 2660 shows methylation levels of tumor tissue and pre-operative plasma samples that overlap some of the control plasma samples with the CHH and CHG sequences. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットを示す。6 shows a Circos plot of methylation densities of eight cancer patients, according to an embodiment of the invention. 配列リードの数および試料毎に達成された配列決定深度を示す表2780である。FIG. 3 is a table 2780 showing the number of sequence reads and the sequencing depth achieved for each sample. 異なる悪性腫瘍を有する患者の血漿中のゲノム全体における1MbビンのZ値分布を示す、表2790である。CL=肺腺がん;NPC=上咽頭がん;CRC=結腸直腸がん;NE=神経内分泌がん;SMS=平滑筋肉腫。Table 2790 shows the Z value distribution of 1 Mb bins across the genome in plasma of patients with different malignancies. CL = lung adenocarcinoma; NPC = nasopharyngeal cancer; CRC = colorectal cancer; NE = neuroendocrine cancer; SMS = leiomyosarcoma. 本発明の実施形態に従って、生物の生物試料を解析してがんのレベルの分類を決定する、方法2800のフローチャートである。6 is a flowchart of a method 2800 of analyzing a biological sample of an organism to determine a cancer level classification in accordance with an embodiment of the present invention. 分布が正規分布に従うことを仮定する、参照対象におけるメチル化密度の分布を示すプロット2900である。FIG. 6 is a plot 2900 showing the distribution of methylation densities in a reference subject, assuming the distribution follows a normal distribution. がん対象におけるメチル化密度の分布を、この分布が正規分布になり、平均メチル化レベルがカットオフより2標準偏差下回ると仮定して示すプロット2950である。3 is a plot 2950 showing the distribution of methylation densities in cancer subjects, assuming that the distribution is normal and the average methylation level is 2 standard deviations below the cutoff. 健常対象およびがん患者の血漿DNAのメチル化密度の分布を示す、プロット3000である。3 is a plot 3000 showing the distribution of plasma DNA methylation density in healthy subjects and cancer patients. 健常対象の血漿DNAおよびHCC患者の腫瘍組織の平均値の間のメチル化密度における差異の分布を示す、グラフ3100である。FIG. 3B is a graph 3100 showing the distribution of differences in methylation density between plasma DNA of healthy subjects and mean values of tumor tissues of HCC patients. 血漿試料が5%または2%の腫瘍DNAを含有した場合の、配列決定深度の減少の影響を示す、表3200である。Table 3200 showing the effect of decreasing sequencing depth when plasma samples contained 5% or 2% tumor DNA. 4人の健常対照群対象の血漿、並びにHCC患者の軟膜、正常肝組織、腫瘍組織、手術前血漿試料、および手術後血漿試料の、反復要素と非反復領域のメチル化密度を示すグラフ3250である。FIG. 3B is a graph 3250 showing the methylation densities of repetitive elements and non-repetitive regions of plasma from four healthy control subjects and buffy coat, normal liver tissue, tumor tissue, pre- and post-operative plasma samples of HCC patients. is there. 本発明の実施形態による系および方法とともに使用することができる例示的コンピューターシステム3300のブロック図を示す。FIG. 13 shows a block diagram of an exemplary computer system 3300 that can be used with the systems and methods according to embodiments of the invention. 全身性エリテマトーデス(SLE)患者SLE04における血漿DNAのサイズ分布を示す。3 shows the size distribution of plasma DNA in systemic lupus erythematosus (SLE) patient SLE04. SLE患者SLE04(図34B)およびHCC患者TBR36(図34C)から得られた血漿DNAのメチル化解析を示す。34 shows methylation analysis of plasma DNA obtained from SLE patient SLE04 (FIG. 34B) and HCC patient TBR36 (FIG. 34C). SLE患者SLE04(図34B)およびHCC患者TBR36(図34C)から得られた血漿DNAのメチル化解析を示す。34 shows methylation analysis of plasma DNA obtained from SLE patient SLE04 (FIG. 34B) and HCC patient TBR36 (FIG. 34C). 本発明の実施形態に従って、CG島の高度メチル化に基づいてがんのレベルの分類を決定する、方法3500のフローチャートである。6 is a flowchart of a method 3500 for determining a cancer level classification based on CG island hypermethylation, in accordance with an embodiment of the present invention. 本発明の実施形態に従って複数の染色体領域を用いて生物の生物試料を解析する、方法3600のフローチャートである。11 is a flow chart of a method 3600 of analyzing a biological sample of an organism using multiple chromosomal regions in accordance with an embodiment of the present invention. 患者TBR36の腫瘍組織、非亜硫酸水素塩(BS)処理血漿DNAおよび亜硫酸水素塩処理血漿DNAのCNA解析(内側から外側に)を示す。3 shows CNA analysis (inside to outside) of tumor tissue, non-bisulfite (BS) -treated and bisulfite-treated plasma DNA of patient TBR36. 患者TBR36の1Mbビンの亜硫酸水素塩処理血漿および非亜硫酸水素塩処理血漿を用いるCNAの検出におけるZ値間の関連性を示す、散布図である。FIG. 6 is a scatter plot showing the association between Z values in the detection of CNA using 1 Mb bin bisulfite-treated and non-bisulfite-treated plasma of patient TBR36. 患者TBR34の腫瘍組織、非亜硫酸水素塩(BS)処理血漿DNAおよび亜硫酸水素塩処理血漿DNA(内側から外側に)のCNA解析を示す。3 shows CNA analysis of patient TBR34 tumor tissue, non-bisulfite (BS) -treated plasma DNA and bisulfite-treated plasma DNA (from inside to outside). 患者TBR34の1Mbビンの亜硫酸水素塩処理血漿および非亜硫酸水素塩処理血漿を用いるCNAの検出におけるZ値間の関連性を示す、散布図である。FIG. 9 is a scatter plot showing the association between Z values in the detection of CNA using 1 Mb bin bisulfite-treated plasma and non-bisulfite-treated plasma of patient TBR34. HCC患者TBR240の亜硫酸水素塩処理血漿のCNA(内側の環)およびメチル化解析(外側の環)を示す、Circosプロットである。FIG. 6 is a Circos plot showing CNA (inner ring) and methylation analysis (outer ring) of bisulfite treated plasma of HCC patient TBR240. HCC患者TBR164の亜硫酸水素塩処理血漿の、CNA(内側の環)およびメチル化解析(外側の環)を示す、Circosプロットである。FIG. 6 is a Circos plot showing CNA (inner ring) and methylation analysis (outer ring) of bisulfite treated plasma of HCC patient TBR164. 患者TBR36についての、処置前試料および処置後試料に対するCNA解析を示す。9 shows CNA analysis for patient TBR36 on pre-treatment and post-treatment samples. 患者TBR36についての、処置前試料および処置後試料に対するメチル化解析を示す。14 shows methylation analysis for pre-treatment and post-treatment samples for patient TBR36. 患者TBR34についての、処置前試料および処置後試料に対するCNA解析を示す。9 shows CNA analysis for patient TBR34 on pre-treatment and post-treatment samples. 患者TBR34についての、処置前試料および処置後試料に対するメチル化解析を示す。14 shows methylation analysis for pre-treatment and post-treatment samples for patient TBR34. 異なる数の配列決定されたリードを用いたゲノムワイドな低メチル化解析の診断能の図を示す。Figure 4 shows a diagram of the diagnostic capabilities of genome-wide hypomethylation analysis using different numbers of sequenced reads. 異なるビンサイズ(50kb、100kb、200kbおよび1Mb)を用いた、ゲノムワイドな低メチル化解析に基づくがんの検出における、ROC曲線を示す図である。FIG. 6 shows ROC curves in cancer detection based on genome-wide hypomethylation analysis using different bin sizes (50 kb, 100 kb, 200 kb and 1 Mb). 累積確立(CP)および異常を有するビンの割合の診断能を示す。Shows the diagnostic ability of cumulative probability (CP) and the percentage of bins with abnormalities. 全体的な低メチル化、CG島高度メチル化およびCNAの血漿解析の診断能を示す。Figure 3 shows the diagnostic ability of plasma analysis of global hypomethylation, CG island hypermethylation and CNA. 肝細胞癌患者における全体的な低メチル化、CG島高度メチル化およびCNAの結果を含む、表を示す。FIG. 7 shows a table with global hypomethylation, CG island hypermethylation and CNA results in hepatocellular carcinoma patients. 肝細胞癌以外のがんを有する患者における全体的な低メチル化、CG島高度メチル化およびCNAの結果を含む、表を示す。1 shows a table containing global hypomethylation, CG island hypermethylation and CNA results in patients with cancers other than hepatocellular carcinoma. 症例TBR34の血漿メチル化の連続解析を示す。12 shows a serial analysis of plasma methylation of case TBR34. HCC患者TBR36の亜硫酸水素塩処理血漿DNAにおけるCNA(内側の環)およびメチル化変化(外側の環)を示す、Circosプロットを示す。FIG. 6 shows a Circos plot showing CNA (inner ring) and methylation changes (outer ring) in bisulfite treated plasma DNA of HCC patient TBR36. HCC患者TBR36の、染色体の増加および減少を有する領域、並びにコピー数に変化が無い領域の、メチル化Z値のプロットである。FIG. 6 is a plot of methylated Z-values of HCC patient TBR36 in regions with increased and decreased chromosomes, and in regions with unchanged copy number. HCC患者TBR34の亜硫酸水素塩処理血漿DNAにおけるCNA(内側の環)およびメチル化変化(外側の環)を示す、Circosプロットを示す。FIG. 7 shows a Circos plot showing CNA (inner ring) and methylation changes (outer ring) in bisulfite treated plasma DNA of HCC patient TBR34. HCC患者TBR34の、染色体の増加および減少を有する領域、およびコピー数に変化が無い領域の、メチル化Z値のプロットである。FIG. 9 is a plot of methylated Z-values of HCC patient TBR34 in regions with chromosomal gains and losses and in unchanged copy number. SLE患者SLE04およびSLE10に対する血漿低メチル化およびCNA解析の結果を示す。FIG. 6 shows the results of plasma hypomethylation and CNA analysis for SLE patients SLE04 and SLE10. SLE患者SLE04およびSLE10に対する血漿低メチル化およびCNA解析の結果を示す。FIG. 6 shows the results of plasma hypomethylation and CNA analysis for SLE patients SLE04 and SLE10. 2人のHCC患者(TBR34およびTBR36)の血漿における、CNAを有する領域およびCNAを有さない領域に対する、Zmeth解析を示す。Z meth analysis for plasma with and without CNA in plasma of two HCC patients (TBR34 and TBR36). 2人のHCC患者(TBR34およびTBR36)の血漿における、CNAを有する領域およびCNAを有さない領域に対する、Zmeth解析を示す。Z meth analysis for plasma with and without CNA in plasma of two HCC patients (TBR34 and TBR36). 2人のSLE患者(SLE04およびSLE10)の血漿における、CNAを有する領域およびCNAを有さない領域に対する、Zmeth解析を示す。Z meth analysis for the regions with and without CNA in the plasma of two SLE patients (SLE04 and SLE10). 2人のSLE患者(SLE04およびSLE10)の血漿における、CNAを有する領域およびCNAを有さない領域に対する、Zmeth解析を示す。Z meth analysis for the regions with and without CNA in the plasma of two SLE patients (SLE04 and SLE10). CNA、全体メチル化、およびCpG島メチル化についてA群特徴を用いる、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示す。FIG. 7 shows a hierarchical clustering analysis for plasma samples from HCC patients, non-HCC cancer patients and healthy control patients using group A features for CNA, global methylation, and CpG island methylation. CNA、全体メチル化、およびCpG島メチル化についてB群特徴を用いる階層クラスタリングを示す。13 shows hierarchical clustering using group B features for CNA, global methylation, and CpG island methylation. A群CG島メチル化特徴を用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示す。FIG. 6 shows a hierarchical clustering analysis for plasma samples from HCC patients, non-HCC cancer patients and healthy control patients using Group A CG island methylation features. A群全体メチル化密度を用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示す。FIG. 7 shows a hierarchical clustering analysis for plasma samples obtained from HCC patients, non-HCC cancer patients and healthy control patients using Group A global methylation densities. A群全体CNAを用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示す。FIG. 6 shows a hierarchical clustering analysis for plasma samples obtained from HCC patients, non-HCC cancer patients and healthy control patients using Group A whole CNAs. B群CpG島メチル化密度を用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示す。FIG. 6 shows hierarchical clustering analysis for plasma samples obtained from HCC patients, non-HCC cancer patients and healthy control patients using Group B CpG island methylation density. HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示す。3 shows a hierarchical clustering analysis for plasma samples obtained from HCC patients, non-HCC cancer patients and healthy control patients. B群全体メチル化密度を用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示す。FIG. 6 shows a hierarchical clustering analysis for plasma samples obtained from HCC patients, non-HCC cancer patients and healthy control patients using Group B global methylation densities. 32人の健常対象間の、1Mbビンの平均メチル化密度(赤い点)を示す。Shown is the average methylation density of 1 Mb bins (red dots) among 32 healthy subjects.

定義
「メチローム」は、ゲノム内の複数の部位または遺伝子座におけるDNAメチル化量の尺度を与える。メチロームは、ゲノム全体、ゲノムの相当な部分、またはゲノムの比較的小さな部分に該当し得る。「胎児メチローム」は、妊娠女性の胎児のメチロームに該当する。胎児メチロームは、種々の胎児組織または胎児DNAの供給源、例えば、胎盤組織および母体血漿中の無細胞胎児DNAを用いて、決定することができる。「腫瘍メチローム」は、生物(例えば、ヒト)の腫瘍のメチロームに該当する。腫瘍メチロームは、腫瘍組織または母体血漿中の無細胞腫瘍DNAを用いて決定することができる。胎児メチロームおよび腫瘍メチロームは、目的のメチロームの例である。目的のメチロームの他の例は、体液(例えば、血漿、血清、汗、唾液、尿、生殖器分泌物、精液、便液(stools fluid)、下痢液(diarrheal fluid)、脳脊髄液、胃腸管分泌物、膵臓分泌物、腸分泌物、痰、涙、乳房からの吸引液および甲状腺等)にDNAを与え得る臓器のメチローム(例えば、脳細胞、骨、肺、心臓、筋肉および腎臓等のメチローム)である。臓器は移植された臓器であってもよい。
Definitions "Methylome" gives a measure of the amount of DNA methylation at multiple sites or loci within the genome. The methylome can correspond to the entire genome, a substantial portion of the genome, or a relatively small portion of the genome. “Fetal methylome” corresponds to the methylome of the fetus of a pregnant woman. Fetal methylome can be determined using various sources of fetal tissue or fetal DNA, such as placental tissue and cell-free fetal DNA in maternal plasma. "Tumor methylome" corresponds to a methylome of a tumor of an organism (eg, human). Tumor methylome can be determined using cell-free tumor DNA in tumor tissue or maternal plasma. Fetal and tumor methylomes are examples of methylomes of interest. Other examples of methylomes of interest are body fluids (eg, plasma, serum, sweat, saliva, urine, genital secretions, semen, stools fluid, diarrheal fluid, cerebrospinal fluid, gastrointestinal secretions. Substances, pancreatic secretions, intestinal secretions, sputum, tears, aspirates from the breast, and thyroid gland), and the methylomes of organs (eg, brain cells, bones, lungs, hearts, muscles and kidneys). Is. The organ may be a transplanted organ.

「血漿メチローム」は、動物(例えば、ヒト)の血漿または血清から決定されるメチロームである。血漿メチロームは、血漿および血清は無細胞DNAを含むことから、無細胞メチロームの一例である。血漿メチロームは、胎児/母体メチロームまたは腫瘍/患者メチロームの混合物であることから、混合メチロームの一例でもある。「胎盤メチローム」は、絨毛膜絨毛検体(chorionic villus sample:CVS)または胎盤組織検体(例えば、出産後に得られる)から決定することができる。「細胞メチローム」は、患者の細胞(例えば、血液細胞)から決定されるメチロームに該当する。血液細胞のメチロームは、血液細胞メチローム(または血液メチローム)と称される。   A "plasma methylome" is a methylome determined from the plasma or serum of an animal (eg, human). Plasma methylome is an example of a cell-free methylome because plasma and serum contain cell-free DNA. Plasma methylome is also an example of a mixed methylome as it is a mixture of fetal / maternal methylome or tumor / patient methylome. “Placenta methylome” can be determined from a chorionic villus sample (CVS) or a placental tissue sample (eg, obtained after delivery). "Cellular methylome" corresponds to a methylome determined from cells (eg, blood cells) of a patient. Blood cell methylomes are referred to as blood cell methylomes (or blood methylomes).

「部位」は、一塩基位置であっても一群の関連塩基位置(例えば、CpG部位)であってもよい、単一部位に該当する。「座位」は、複数の部位を含む領域に該当する。座位は、該座位をその配列内のある部位と等しくする、ただ一つの部位を含み得る。   A “site” corresponds to a single site, which may be a single base position or a group of related base positions (eg, CpG sites). The “sitting position” corresponds to a region including a plurality of parts. A locus can include only one site that equates the locus to a site within its sequence.

各ゲノム部位(例えば、CpG部位)の「メチル化指数」は、その部位を被覆するリードの総数に対する、部位においてメチル化を示す配列リードの比率を指す。領域の「メチル化密度」は、該領域内の部位を被覆するリードの総数で除算した、メチル化を示す該領域内の部位におけるリードの数である。部位は特定の特徴を有していてもよく、例えば、CpG部位であってもよい。従って、領域の「CpGメチル化密度」は、該領域内のCpG部位(例えば、特定のCpG部位、CG島内のCpG部位、またはより大きな領域)を被覆するリードの総数で除算した、CpGメチル化を示すリードの数である。例えば、ヒトゲノム内の各100kbのビン(bin)のメチル化密度は、該100kb領域に位置付けられる配列リードによって被覆される全CpG部位の比率として、CpG部位における亜硫酸水素塩処理後に変換されていないシトシンの総数(メチル化シトシンに相当)から決定することができる。この解析は、他のビン部位(例えば、50kbまたは1Mb等)に対しても行うこともできる。領域は、ゲノム全体または染色体または染色体の部分(例えば、染色体腕)であり得る。CpG部位のメチル化指数は、領域がそのCpG部位を含むのみである場合の、領域のメチル化密度と同じである。「メチル化シトシンの比率」は、解析されたシトシン残基(すなわち、該領域内のCpG配列の外側にあるシトシンを含む)の総数に対する、メチル化されていることが示される(例えば、亜硫酸水素塩変換の後に変換されていない)、シトシン部位(「C」)の数を指す。メチル化指数、メチル化密度およびメチル化シトシンの比率は、「メチル化レベル」の例である。   The "methylation index" for each genomic site (eg, CpG site) refers to the ratio of sequence reads that show methylation at the site to the total number of reads that cover that site. The "methylation density" of a region is the number of reads at a site within the region that exhibits methylation divided by the total number of reads covering the site within the region. The site may have a particular characteristic and may be, for example, a CpG site. Therefore, the "CpG methylation density" of a region is the CpG methylation divided by the total number of reads covering CpG sites within that region (eg, a particular CpG site, a CpG site within a CG island, or a larger region). Is the number of leads. For example, the methylation density of each 100 kb bin in the human genome is the cytosine unconverted after bisulfite treatment at the CpG site as the percentage of total CpG sites covered by the sequence reads located in the 100 kb region. Can be determined from the total number of (corresponding to methylated cytosine). This analysis can also be performed for other bin sites (eg 50 kb or 1 Mb, etc.). A region can be an entire genome or a chromosome or a portion of a chromosome (eg, chromosomal arm). The methylation index of a CpG site is the same as the methylation density of the region when the region only contains that CpG site. "Ratio of methylated cytosines" is shown to be methylated relative to the total number of cytosine residues analyzed (ie, including cytosines outside the CpG sequence within the region) (eg, bisulfite). Refers to the number of cytosine sites (“C”), not converted after salt conversion. The methylation index, methylation density and ratio of methylated cytosines are examples of "methylation levels".

「メチル化特性」(メチル化状態とも称される)は、領域のDNAメチル化に関連する情報を含む。DNAメチル化に関連する情報としては、限定はされないが、CpG部位のメチル化指数、領域内のCpG部位のメチル化密度、隣接領域にわたるCpG部位の分布、2つ以上のCpG部位を含有する領域内の個々のCpG部位のメチル化のパターンまたはレベル、および非CpGメチル化が含まれ得る。ゲノムの相当な部分のメチル化特性は、メチロームと等価であるとみなすことができる。哺乳類ゲノムにおける「DNAメチル化」は、典型的には、CpGジヌクレオチド間の、シトシン残基の5’炭素へのメチル基の付加(すなわち、5-メチルシトシン)を指す。DNAメチル化は、他の配列内のシトシン、例えば、CHGおよびCHH(Hはアデニン、シトシンまたはチミンである)において生じ得る。シトシンメチル化は、5-ヒロドキシメチルシトシンの形態であってもよい。N6-メチルアデニン等の非シトシンメチル化も報告されている。   "Methylation properties" (also referred to as methylation status) contain information related to the DNA methylation of a region. The information relating to DNA methylation includes, but is not limited to, the methylation index of CpG sites, the methylation density of CpG sites within a region, the distribution of CpG sites over adjacent regions, and the region containing two or more CpG sites. Patterns or levels of methylation of individual CpG sites within and non-CpG methylation may be included. The methylation properties of a significant portion of the genome can be considered equivalent to methylome. “DNA methylation” in the mammalian genome typically refers to the addition of a methyl group to the 5 ′ carbon of cytosine residues between CpG dinucleotides (ie, 5-methylcytosine). DNA methylation can occur in cytosines within other sequences, such as CHG and CHH, where H is adenine, cytosine or thymine. Cytosine methylation may be in the form of 5-hydroxymethylcytosine. Non-cytosine methylation such as N6-methyladenine has also been reported.

「組織」はあらゆる細胞に該当する。異なる種類の組織は、異なる種類の細胞(例えば、肝臓、肺、または血液)に該当し得るが、異なる生物(母対胎児)から得られた組織または正常細胞対腫瘍細胞にも該当し得る。「生物試料」は、対象(例えば、ヒト、例えば、妊娠女性、担がん患者、または担がんが疑われる人、臓器移植受容者、または臓器(例えば、心筋梗塞における心臓、または脳卒中における脳)に関する疾患仮定を有することが疑われる対象)から得られ、一つまたは複数の目的の核酸分子を含有する、あらゆる試料を指す。生物試料は、体液血液、血漿、血清、尿、膣液、子宮または膣洗い流し液(flushing fluid)、複数の体液、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液等の体液であり得る。便試料を用いることもできる。   "Tissue" corresponds to all cells. Different types of tissue may correspond to different types of cells (eg liver, lung, or blood), but also to tissues obtained from different organisms (mother vs. fetus) or normal cells vs. tumor cells. A “biological sample” is a subject (eg, a human, eg, a pregnant woman, a cancer-bearing patient, or a suspected cancer-bearer, an organ transplant recipient, or an organ (eg, a heart in myocardial infarction, or a brain in stroke). Subject) suspected of having a disease hypothesis for) and containing one or more nucleic acid molecules of interest. Biological samples include body fluids such as blood, plasma, serum, urine, vaginal fluid, uterus or flushing fluid, multiple body fluids, ascites, cerebrospinal fluid, saliva, sweat, tears, sputum, bronchoalveolar lavage fluid, etc. It can be a body fluid. A stool sample can also be used.

用語「がんのレベル」は、がんが存在するかどうか、がんの段階、腫瘍のサイズ、転移の有無、身体の総腫瘍量、および/またはがんの重症度の他の尺度を指し得る。がんのレベルは、数または他の特性であり得る。レベルはゼロであってもよい。がんのレベルは、変異またはいくつかの変異と関連する前悪性状態または前がん状態も含む。がんのレベルは様々な方法で用いることができる。例えば、スクリーニングは、がんを有することが以前に知られていない者にがんが存在するかどうかを調べることができる。評価により、がんを有すると診断された者を調査することで、がんの進行を経時的にモニターすること、治療の有効性を研究すること、または予後を決定することができる。一実施形態では、予後は、患者ががんで死亡する確率、またはがんが特定の期間もしくは時間の後に進行する確率、またはがんが転移する確率を表し得る。検出は、「スクリーニング」を意味し得る、あるいは、がんを示唆する特徴(例えば、症状または他の陽性検査)を有する者ががんを有するかどうかをチェックすることを意味し得る。   The term "cancer level" refers to the presence or absence of cancer, the stage of the cancer, the size of the tumor, the presence or absence of metastases, the total tumor burden of the body, and / or other measures of cancer severity. obtain. The level of cancer can be number or other characteristic. The level may be zero. The level of cancer also includes a premalignant or precancerous condition associated with a mutation or some mutations. Cancer levels can be used in a variety of ways. For example, screening can determine if cancer is present in a person previously unknown to have the cancer. By assessing who has been diagnosed with cancer by evaluation, it is possible to monitor the progression of cancer over time, study the efficacy of treatment, or determine prognosis. In one embodiment, the prognosis may represent the probability that the patient will die of cancer, or the cancer will progress after a certain period or time, or the cancer will metastasize. Detection can mean "screening" or can mean checking whether a person with characteristics suggestive of cancer (eg, symptoms or other positive tests) has cancer.

詳細な説明
エピジェネティック機構は、胚発生および胎児発生において重要な役割を担う。しかし、ヒトの胚および胎児組織(胎盤組織を含む)は容易に利用できるものではない(米国特許第6,927,028号)。ある特定の実施形態は、母体循環系に存在する無細胞胎児DNA分子を含有する試料を分析することにより、この問題に取り組んだ。胎児メチロームは様々な方法で推定することができる。例えば、母体血漿メチロームは細胞メチローム(母親の血液細胞からの)と比較することができ、その差異は胎児メチロームと相関することが示されている。別の例として、胎児特異的対立遺伝子を用いることで、特定の遺伝子座での胎児メチロームのメチル化決定することができる。さらに、サイズおよびメチル化率間の相関が示されているため、断片のサイズはメチル化率の指標として用いることができる。
DETAILED DESCRIPTION Epigenetic machinery plays an important role in embryonic and fetal development. However, human embryonic and fetal tissues, including placental tissues, are not readily available (US Pat. No. 6,927,028). Certain embodiments addressed this issue by analyzing samples containing cell-free fetal DNA molecules present in the maternal circulation. The fetal methylome can be estimated in various ways. For example, maternal plasma methylome can be compared to cellular methylome (from maternal blood cells) and the difference has been shown to correlate with fetal methylome. As another example, fetal-specific alleles can be used to determine methylation of fetal methylome at a particular locus. Furthermore, the size of the fragment can be used as an indicator of the methylation rate, since a correlation between size and methylation rate is shown.

一実施形態では、ゲノムワイド亜硫酸水素塩配列決定は、単一ヌクレオチド分析(single nucleotide resolution)において母体血漿DNAのメチル化特性(メチロームの一部または全て)を分析するために用いられる。母親および胎児間の多形性差異を利用することで、胎児メチロームを母体血試料から構築することができる。別の実施においては、多形性差異を用いたが、血漿メチロームおよび血液細胞メチローム間の差異を用いることができる。   In one embodiment, genome-wide bisulfite sequencing is used to analyze the methylation properties of maternal plasma DNA (some or all of the methylome) in single nucleotide resolution. By taking advantage of polymorphic differences between mother and fetus, the fetal methylome can be constructed from a maternal blood sample. In another implementation, polymorphic differences were used, but differences between plasma and blood cell methylomes can be used.

別の実施形態では、腫瘍ゲノムおよび非腫瘍ゲノム間の単一ヌクレオチド変異および/またはコピー数異常、並びに血漿(または他の試料)から得た配列決定データを利用することにより、がんを有することが疑われるまたはがんを有すると診断された患者の試料において、腫瘍のメチル化プロファイリングを行うことができる。健常対照または健常対照群の血漿メチル化レベルと比較した場合の試験個体の血漿試料中のメチル化レベルの差異は、試験個体ががんを有することの特定を可能にし得る。さらに、メチル化特性は、例えば、患者がどの臓器から発達させたか、および転移がどの臓器から生じたか等の、がんの種類を明らかにするサインとして機能し得る。   In another embodiment, having cancer by utilizing single nucleotide mutations and / or copy number abnormalities between tumor and non-tumor genomes and sequencing data obtained from plasma (or other samples) Methylation profiling of tumors can be performed on samples of patients suspected of having cancer or diagnosed with cancer. The difference in the methylation level in the plasma sample of the test individual as compared to the plasma methylation level of the healthy control or the healthy control group may allow identification of the test individual as having cancer. In addition, methylation properties can serve as a signature that reveals the type of cancer, such as from which organ the patient developed and which metastasis originated.

このアプローチは非侵襲性であるため、第一期、第三期および出産後に採取した母体血試料から胎児および母体の血漿メチロームを連続的に評価することができた。妊娠に関連する変化を観察した。前記アプローチは、第二期中に得られた試料に適応することもできる。妊娠中の母体血漿から推定された胎児メチロームは胎盤メチロームに似ていた。インプリンティング遺伝子および示差的にメチル化された領域を母体血漿データから特定した。   The non-invasive nature of this approach allowed the continuous evaluation of fetal and maternal plasma methylomes from maternal blood samples taken during the first, third and post-partum period. Changes related to pregnancy were observed. The approach can also be adapted to samples obtained during the second phase. The fetal methylome deduced from maternal plasma during pregnancy was similar to the placental methylome. Imprinted genes and differentially methylated regions were identified from maternal plasma data.

胎児メチロームを非侵襲的、連続的且つ包括的に研究することにより、生物マーカーを同定する、または妊娠に関連した病態を直接検査する可能性を提供するアプローチを開発した。また、実施例を用いることで、対象がかんを有しているかどうかをスクリーニングまたは検出するため、がん患者における悪性疾患をモニターするため、および予後判定のために、腫瘍メチロームを非侵襲的に、連続的に、且つ包括的に研究することができる。実施例は、あらゆるがん型、例えば、限定はされないが、肺がん、乳がん、結腸直腸がん、前立腺がん、鼻咽腔がん、胃がん、精巣がん、皮膚がん(例えばメラノーマ)、神経系に発症するがん、骨がん、卵巣がん、肝臓がん(例えば肝細胞癌)、造血器腫瘍、膵がん、子宮内膜癌(endometriocarcinoma)、腎がん、子宮頸がん、膀胱がん等に、適用することができる。   By non-invasively, serially and comprehensively studying the fetal methylome, an approach has been developed that offers the possibility to identify biomarkers or directly test for pregnancy-related pathologies. The examples are also used to non-invasively study tumor methylome to screen or detect whether a subject has a kan, monitor malignancy in cancer patients, and for prognosis. , Continuous and comprehensive research is possible. Examples include, but are not limited to, lung cancer, breast cancer, colorectal cancer, prostate cancer, nasopharyngeal cancer, gastric cancer, testicular cancer, skin cancer (eg, melanoma), nerves. Systemic cancer, bone cancer, ovarian cancer, liver cancer (eg hepatocellular carcinoma), hematopoietic cancer, pancreatic cancer, endometriocarcinoma, renal cancer, cervical cancer, It can be applied to bladder cancer and the like.

メチロームまたはメチル化特性を決定する方法の記述を最初に考察し、次に、種々のメチローム(例えば、胎児メチローム、腫瘍メチローム、母親または患者のメチローム、および混合メチローム(例えば、血漿から得られた))を記述する。次に、胎児特異的マーカーを用いる、または混合メチル化特性を細胞メチル化特性と比較することによる、胎児メチル化特性の決定を記述する。胎児メチル化マーカーはメチル化特性を比較することにより決定される。サイズおよびメチル化間の関連性を考察する。がんを検出するためのメチル化特性の使用も提供する。   A description of methods for determining methylome or methylation properties is first considered, and then various methylomes (eg, fetal methylome, tumor methylome, mother or patient methylome, and mixed methylomes (eg, obtained from plasma) ) Is described. Next, the determination of fetal methylation properties using fetal-specific markers or by comparing mixed methylation properties with cellular methylation properties is described. Fetal methylation markers are determined by comparing methylation profiles. Consider the relationship between size and methylation. Also provided is the use of methylation properties to detect cancer.

I. メチロームの決定
胎盤メチロームを調べるために無数のアプローチが用いられているが、それぞれのアプローチには限界がある。例えば、亜硫酸水素ナトリウムは、非メチル化シトシン残基をウラシルに変化させ、メチル化シトシンを変化させない化学薬品であるが、これは、シトシンメチル化における差異を、さらなる照合のための遺伝子配列差異へと変換する。シトシンメチル化を研究するゴールドスタンダードな方法は、組織DNAを亜硫酸水素ナトリウムで処理し、その後、亜硫酸水素塩によって変換されたDNA分子の個々のクローンを直接配列決定することに基づいている。DNA分子の複数のクローンを解析した後、CpG部位あたりのシトシンメチル化のパターンおよび量的特性を得ることができる。しかし、クローニング化亜硫酸水素塩配列決定は、ゲノムワイドな規模に容易に応用することができない、ロースループットで非常に手間のかかる手順である。
I. Determining the Methylome A myriad of approaches have been used to study placental methylome, but each approach has its limitations. For example, sodium bisulfite is a chemical that changes unmethylated cytosine residues to uracil and does not change methylated cytosine, which translates differences in cytosine methylation into gene sequence differences for further matching. And convert. The gold standard method of studying cytosine methylation is based on treating tissue DNA with sodium bisulfite followed by direct sequencing of individual clones of the bisulfite converted DNA molecule. After analyzing multiple clones of a DNA molecule, the pattern and quantitative characteristics of cytosine methylation per CpG site can be obtained. However, cloned bisulfite sequencing is a low-throughput and very laborious procedure that cannot be easily applied on a genome-wide scale.

非メチル化DNAを典型的に消化するメチル化感受性制限酵素は、DNAメチル化を研究するための安価なアプローチを提供する。しかし、そのような研究から得られたデータは、酵素認識モチーフを有する遺伝子座に限定されており、結果は非定量的である。抗メチル化シトシン抗体が結合したDNAの免疫沈降は、ゲノムの巨大なセグメントを調べるのに用いることができるが、抗体が高密度なメチル化を有する遺伝子座により強く結合することから、そのような領域に偏る傾向がある。マイクロアレイに基づくアプローチは、照合プローブの演繹的設計、並びに該プローブおよび標的DNA間のハイブリダイゼーション効率に依存している。   Methylation sensitive restriction enzymes, which typically digest unmethylated DNA, provide an inexpensive approach to study DNA methylation. However, the data obtained from such studies are limited to loci with enzyme recognition motifs and the results are non-quantitative. Immunoprecipitation of DNA bound by anti-methylated cytosine antibodies can be used to probe large segments of the genome, but such antibodies are more strongly bound to loci with high density of methylation. Tends to be biased in the area. Microarray-based approaches rely on the a priori design of reference probes and the efficiency of hybridization between the probes and target DNA.

メチロームを包括的に調べるために、いくつかの実施形態では、大規模並列配列決定(massively parallel sequencing:MPS)を用いることで、1ヌクレオチドあたりおよび1対立遺伝子あたりのメチル化レベルのゲノムワイドな情報および定量的評価が与えられる。近年、亜硫酸水素塩変換後のゲノムワイドMPSが実行可能になった(R Lister et al 2008 Cell; 133: 523-536)。   To comprehensively examine the methylome, in some embodiments, massively parallel sequencing (MPS) is used to provide genome-wide information on methylation levels per nucleotide and per allele. And a quantitative assessment is given. Recently, genome-wide MPS after bisulfite conversion has become feasible (R Lister et al 2008 Cell; 133: 523-536).

ゲノムワイド亜硫酸水素塩配列決定をヒトメチロームの調査に応用した、小数の公表された研究(R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331; Y Li et al. 2010 PLoS Biol; 8: e1000533;およびM Kulis et al. 2012 Nat Genet; 44: 1236-1242)のうち、2つの研究が、胚性幹細胞および胎児線維芽細胞に焦点を当てた(R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331)。これらの研究は共に細胞系由来DNA分析した。   A small number of published studies applying genome-wide bisulfite sequencing to investigate human methylomes (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331. Y Li et al. 2010 PLoS Biol; 8: e1000533; and M Kulis et al. 2012 Nat Genet; 44: 1236-1242), two studies focused on embryonic stem cells and fetal fibroblasts. (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331). Both of these studies analyzed DNA from cell lines.

A. ゲノムワイド亜硫酸水素塩配列決定
ある特定の実施形態は、上記の問題を克服することが可能であり、胎児メチロームの照合を包括的、非侵襲、且つ連続的に可能にする。一実施形態では、妊娠女性の血行中に存在する無細胞胎児DNA分子を分析するために、ゲノムワイド亜硫酸水素塩配列決定が用いられた。血漿DNA分子が少量で断片化されていることから、母体血漿から高分解能胎児メチロームを構築することで、妊娠の進行に伴う変化を連続的に観察することができた。非侵襲的出生前検査(noninvasive prenatal testing:NIPT)への強い関心を考慮して、実施形態は、胎児生物マーカーを発見するための強力な新規の手段を提供する、または、胎児関連疾患もしくは妊娠関連疾患のNIPTを達成するための直接的なプラットフォームとして役立つことができる。胎児メチロームを得ることができる、種々の試料のゲノムワイド亜硫酸水素塩配列決定から得られたデータが、以下に提供される。一実施形態では、この科学技術は、子癇前症、または子宮内胎児発育遅延、または早産と合併した妊娠におけるメチル化プロファイリングに応用され得る。そのような合併妊娠において、この科学技術は、モニタリングおよび/または予後判定および/または治療に対する応答を可能にするために、その非浸潤的な性質から、連続的に用いることができる。
A. Genome-Wide Bisulfite Sequencing Certain embodiments are capable of overcoming the above problems and allow fetal methylome matching to be comprehensive, non-invasive, and continuous. In one embodiment, genome-wide bisulfite sequencing was used to analyze cell-free fetal DNA molecules present in the bloodstream of pregnant women. Since the plasma DNA molecules were fragmented in small amounts, it was possible to continuously observe changes with the progress of pregnancy by constructing a high resolution fetal methylome from maternal plasma. In light of the strong interest in noninvasive prenatal testing (NIPT), embodiments provide powerful new means for discovering fetal biomarkers, or fetal-related diseases or pregnancy. It can serve as a direct platform for achieving NIPT of related diseases. Data obtained from genome-wide bisulfite sequencing of various samples from which fetal methylome can be obtained is provided below. In one embodiment, this technology can be applied to methylation profiling in preeclampsia, or in utero fetal growth retardation, or pregnancy associated with preterm birth. In such combined pregnancies, this technology can be used continuously due to its non-invasive nature to enable monitoring and / or prognosis and / or response to treatment.

図1Aは、本発明の実施形態による、母体血、胎盤、および母体血漿の配列決定の、表100の結果を示している。一実施形態では、全ゲノム配列決定が、第一期に採取された血液試料の血液細胞、CVS、期間の終了時に採取された胎盤組織、第一期および第三期並びに産褥期に採取された母体血漿試料の、メチル化DNAライブラリーアダプター(イルミナ社)(R Lister et al. 2008 Cell; 133: 523-536)を用いて調製された、亜硫酸水素塩によって変換されたDNAライブラリーに対して、行われた。1人の成人男性および1人の成人非妊娠女性から得られた血液細胞および血漿DNA試料も分析した。合計95億対の生配列リードを本研究において作製した。各試料の配列決定被覆率は表100に示される。   FIG. 1A shows the results of Table 100 of maternal blood, placenta, and maternal plasma sequencing according to embodiments of the present invention. In one embodiment, whole-genome sequencing was performed on blood cells of a blood sample collected at the first trimester, CVS, placental tissue collected at the end of the trimester, first and third trimesters, and puerperium. Against a bisulfite converted DNA library of a maternal plasma sample prepared using a methylated DNA library adapter (Illumina) (R Lister et al. 2008 Cell; 133: 523-536). ,It was conducted. Blood cell and plasma DNA samples from one adult male and one adult non-pregnant female were also analyzed. A total of 9.5 billion pairs of live sequence reads were generated in this study. The sequencing coverage of each sample is shown in Table 100.

ヒト参照ゲノムに唯一マッピング可能であった配列リードは、第一期、第三期および出産後の母体血漿試料において、それぞれ50倍、34倍および28倍の平均1倍体ゲノム被覆率に達した。ゲノム内のCpG部位の被覆率は、前記妊娠期間から得られた試料において、81%〜92%の範囲であった。CpG部位に広がる配列リードは、第一期、第三期および出産後の母体血漿試料において、それぞれ33倍/鎖、23倍/鎖および19倍/鎖の平均1倍体被覆率に達した。全ての試料の亜硫酸水素塩変換効率は99.9%超であった(表100)。   Sequence reads that were uniquely mappable to the human reference genome reached mean haploid genome coverages of 50-fold, 34-fold and 28-fold, respectively, in first-stage, third-stage and post-natal maternal plasma samples. . The coverage of CpG sites in the genome ranged from 81% to 92% in the samples obtained from the gestation period. Sequence reads spanning the CpG site reached an average haploid coverage of 33-fold / chain, 23-fold / chain and 19-fold / chain in the first, third, and postnatal maternal plasma samples, respectively. The bisulfite conversion efficiency of all samples was above 99.9% (Table 100).

表100において、あいまいな割合(「a」と標識)は、参照ヒトゲノムのワトソン鎖およびクリック鎖の両方にマッピングされたリードの割合を指す。λ変換率は、亜硫酸水素塩修飾によって「チミン」残基に変換されている、内部λDNA対照における非メチル化シトシンの割合を指す。Hは一般的にA、C、またはTに等しい。「a」は、特定のゲノム遺伝子座にマッピングすることができるが、ワトソン鎖またはクリック鎖に割り当てることができない、リードを指す。「b」は、同一の開始および終止の位置情報(coordinate)を有するリード対を指す。「c」について、λDNAを亜硫酸水素塩変換の前に各試料にスパイクした。λ変換率は、亜硫酸水素塩変換後にシトシンとして残っているシトシンヌクレオチドの割合を指し、成功した亜硫酸水素塩変換の割合の指標として用いられる。「d」は、参照ヒトゲノム内に存在し、亜硫酸水素塩変換後にシトシン配列として残っている、シトシンヌクレオチドの数を指す。   In Table 100, the ambiguous percentage (labeled "a") refers to the percentage of reads that were mapped to both the Watson and Crick strands of the reference human genome. Lambda conversion refers to the percentage of unmethylated cytosines in the internal Lambda DNA control that have been converted to "thymine" residues by bisulfite modification. H is generally equal to A, C, or T. "A" refers to a lead that can be mapped to a particular genomic locus but cannot be assigned to the Watson or Crick strands. "B" refers to lead pairs that have the same start and end coordinates. For "c", lambda DNA was spiked into each sample prior to bisulfite conversion. The lambda conversion rate refers to the proportion of cytosine nucleotides remaining as cytosines after bisulfite conversion and is used as an indicator of the proportion of successful bisulfite conversion. "D" refers to the number of cytosine nucleotides that are present in the reference human genome and remain as cytosine sequences after bisulfite conversion.

亜硫酸水素塩修飾の間に、非メチル化シトシンはウラシルに変換され、その後PCR増幅後にチミンに変換されるが、一方、メチル化シトシンは未変化のまま残る(M Frommer et al. 1992 Proc Natl Acad Sci USA;89:1827-31)。従って、配列決定およびアライメントの後に、個々のCpG部位のメチル化状態は、CpG配列内のシトシン残基における、メチル化配列リード「M」(メチル化)の数および非メチル化配列リード「U」(非メチル化)の数から推測することができる。亜硫酸水素塩配列決定データを用いて、母体血、胎盤および母体血漿の全体のメチロームが構築された。母体血漿における特定の遺伝子座の平均メチル化CpG密度(メチル化密度MDとも称される)は、下記式を用いて算出することができ、   During bisulfite modification, unmethylated cytosine is converted to uracil and then to thymine after PCR amplification, while methylated cytosine remains unchanged (M Frommer et al. 1992 Proc Natl Acad. Sci USA; 89: 1827-31). Therefore, after sequencing and alignment, the methylation status of individual CpG sites is determined by the number of methylated sequence reads "M" (methylated) and unmethylated sequence lead "U" at cytosine residues within the CpG sequence. It can be inferred from the number of (unmethylated). Using bisulfite sequencing data, a whole methylome of maternal blood, placenta and maternal plasma was constructed. The average methylated CpG density (also referred to as methylated density MD) of a specific locus in maternal plasma can be calculated using the following formula:

式中、Mは遺伝子座内のCpG部位におけるメチル化リードの数であり、Uは遺伝子座内のCpG部位における非メチル化リードの数である。座位内に2つ以上のCpG部位が存在する場合、およびUはそれらの部位の全体における数に一致する。 Where M is the number of methylated reads at the CpG site within the locus and U is the number of unmethylated reads at the CpG site within the locus. If there is more than one CpG site within the locus, and U corresponds to the total number of those sites.

B. 様々な手法
上記のように、メチル化プロファイリングは、亜硫酸水素塩によって変換された血漿DNAの大規模並列配列決定(MPS)を用いて実行することができる。亜硫酸水素塩によって変換された血漿DNAのMPSは、ランダムまたはショットガン様式で実行することができる。配列決定の深度は、目的の領域のサイズに応じて変動し得る。
B. Various approaches As described above, methylation profiling can be performed using massively parallel sequencing (MPS) of plasma DNA converted by bisulfite. MPS of plasma DNA converted by bisulfite can be performed in a random or shotgun fashion. Sequencing depth can vary depending on the size of the region of interest.

別の実施形態では、亜硫酸水素塩によって変換された血漿DNA内の目的の領域は、液相または固相ハイブリダイゼーションに基づくプロセス、その後のMPSを用いて、最初に捕捉され得る。大規模並列配列決定は、合成による配列決定(sequencing-by-synthesis)プラットフォーム(例えば、Illumina)、ライゲーションによる配列決定(sequencing-by-ligation)プラットフォーム(例えば、ライフテクノロジーズ社製のSOLiDプラットフォーム)、半導体ベースの配列決定システム(例えば、ライフテクノロジーズ社製のIon TorrentまたはIon Protonプラットフォーム)、または単一分子配列決定システム(例えば、HelicosシステムまたはPacific Biosciencesシステムまたはナノポアベース配列決定システム)を用いて実行することができる。ナノポアベース配列決定には、例えば、脂質二重層およびタンパク質ナノポアを用いて構築されたナノポア、並びに固体ナノポア(例えば、グラフェンベースのナノポア)が含まれる。選択された単一分子配列決定プラットフォームは、DNA分子のメチル化状態(例えば、N6−メチルアデニン、5−メチルシトシンおよび5−ヒロドキシメチルシトシン)を亜硫酸水素塩変換無しに直接的に解明できるようにするため(BA Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389)、そのようなプラットフォームの使用は、亜硫酸水素塩によって変換されていない試料DNA(例えば血漿DNA)のメチル化状態の解析を可能にする。   In another embodiment, the region of interest within the plasma DNA converted by bisulfite can be first captured using a solution or solid phase hybridization based process followed by MPS. Large-scale parallel sequencing includes sequencing-by-synthesis platform by synthesis (eg Illumina), sequencing-by-ligation platform by ligation (eg SOLiD platform manufactured by Life Technologies), semiconductor Performing using a base-based sequencing system (eg, Ion Torrent or Ion Proton platform from Life Technologies) or a single molecule sequencing system (eg, Helicos system or Pacific Biosciences system or nanopore-based sequencing system). You can Nanopore-based sequencing includes, for example, nanopores constructed with lipid bilayers and protein nanopores, as well as solid-state nanopores (eg, graphene-based nanopores). Selected single-molecule sequencing platforms can directly elucidate the methylation status of DNA molecules (eg, N6-methyladenine, 5-methylcytosine and 5-hydroxymethylcytosine) without bisulfite conversion. (BA Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3: 1389. Doi: 10.1038 / srep01389). It allows analysis of the methylation status of sample DNA that has not been converted by salt (eg plasma DNA).

配列決定に加えて、他の手法を用いることができる。一実施形態では、メチル化プロファイリングを、メチル化特異的PCRまたはメチル化感受性制限酵素消化、その後のPCRまたはリガーゼ連鎖反応、その後のPCRによって、行うことができる。さらに別の実施形態では、PCRは、単一分子またはデジタルPCRの形態である(B Vogelstein et al. 1999 Proc Natl Acad Sci USA; 96: 9236-9241)。さらに別の実施形態では、PCRは、リアルタイムPCRであり得る。他の実施形態では、PCRはマルチプレックスPCRであり得る。   In addition to sequencing, other techniques can be used. In one embodiment, methylation profiling can be performed by methylation specific PCR or methylation sensitive restriction enzyme digestion followed by PCR or ligase chain reaction followed by PCR. In yet another embodiment, PCR is in the form of single molecule or digital PCR (B Vogelstein et al. 1999 Proc Natl Acad Sci USA; 96: 9236-9241). In yet another embodiment, the PCR can be real-time PCR. In other embodiments, the PCR can be multiplex PCR.

II. メチロームの解析
いくつかの実施形態は、全ゲノム亜硫酸水素塩 配列決定を用いて、血漿DNAのメチル化特性を決定することができる。胎児のメチル化特性は、以下に記載される通りに母体血漿DNA試料を配列決定することによって決定することができる。従って、胎児DNA分子(および胎児メチローム)は、妊娠期間中に非侵襲的にアクセス可能であり、妊娠が進行するにつれて、変化が連続的にモニタリングされた。配列決定データの包括性のために、単一ヌクレオチド分解能において、ゲノムワイドな規模で母体血漿メチロームを研究することができた。
II. Methylome analysis In some embodiments, whole genome bisulfite sequencing can be used to determine the methylation profile of plasma DNA. Fetal methylation properties can be determined by sequencing maternal plasma DNA samples as described below. Therefore, fetal DNA molecules (and fetal methylome) were non-invasively accessible during pregnancy and changes were continuously monitored as pregnancy progressed. Due to the comprehensiveness of the sequencing data, it was possible to study the maternal plasma methylome on a genome-wide scale at single nucleotide resolution.

配列決定されたリードのゲノム位置情報は公知であったため、これらのデータによって、ゲノム内のメチロームまたはあらゆる目的領域の全体メチル化レベルの研究を可能にし、異なる遺伝因子間の比較を可能となった。さらに、複数の配列リードはそれぞれのCpG部位または座位を被覆した。メチロームを測定するのに用いられた測定基準のいくつかの説明を以下に記載する。   Since the genomic location information of the sequenced reads was known, these data allowed the study of global methylation levels of the methylome or any region of interest within the genome, allowing comparisons between different genetic elements. . In addition, multiple sequence reads covered each CpG site or locus. Below is a description of some of the metrics used to measure methylome.

A. 血漿DNA分子のメチル化
DNA分子は、低濃度で、断片化された形態で、典型的には、モノヌクレオソーム単位に類似した長さで、ヒト血漿中に存在する(YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91; and YW Zheng at al. 2012 Clin Chem; 58: 549-558)。これらの制限にもかかわらず、ゲノムワイド亜硫酸水素塩配列決定パイプラインは、血漿DNA分子のメチル化を解析することが可能であった。さらに別の実施形態では、選択された単一分子配列決定プラットフォームは、DNA分子のメチル化状態を亜硫酸水素塩変換無しに直接的に解明できるようにすることから(BA Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389)、そのようなプラットフォームの使用は、亜硫酸水素塩によって変換されていない血漿DNAを、血漿DNAのメチル化レベルを測定するため、または血漿メチロームを測定するために用いることを可能にする。そのようなプラットフォームは、異なる形態のメチル化の異なる生物学的機能に関連した、結果の改善(例えば、感度または特異度の改善)をもたらし得る、N6−メチルアデニン、5−メチルシトシン、および5−ヒロドキシメチルシトシンを検出することができる。そのような結果の改善は、実施形態を特定の障害(例えば子癇前症)または特定のがん型の検出またはモニタリングに適用する場合に有用であり得る。
A. Methylation of Plasma DNA Molecules DNA molecules are present in human plasma in low concentrations, in fragmented form, typically similar in length to mononucleosome units (YMD Lo et al. 2010 Sci. Transl Med; 2: 61ra91; and YW Zheng at al. 2012 Clin Chem; 58: 549-558). Despite these limitations, the genome-wide bisulfite sequencing pipeline was able to analyze the methylation of plasma DNA molecules. In yet another embodiment, the single molecule sequencing platform of choice allows direct elucidation of the methylation status of DNA molecules without bisulfite conversion (BA Flusberg et al. 2010 Nat Methods 7: 461-465; J Shim et al. 2013 Sci Rep; 3: 1389. Doi: 10.1038 / srep01389), the use of such a platform allows the conversion of plasma DNA not converted by bisulfite into plasma DNA. It can be used for measuring methylation levels or for measuring plasma methylome. Such platforms may provide improved results (eg, improved sensitivity or specificity) associated with different biological functions of different forms of methylation, N6-methyladenine, 5-methylcytosine, and 5 -Hydroxymethylcytosine can be detected. Such improved outcomes may be useful when applying the embodiments to the detection or monitoring of particular disorders (eg, preeclampsia) or particular cancer types.

亜硫酸水素塩配列決定は、異なる形態のメチル化を識別することもできる。一実施形態では、亜硫酸水素塩配列決定は、5−メチルシトシンを5−ヒロドキシメチルシトシンと区別することが可能な追加のステップを含み得る。1つのそのようなアプローチは、酸化的亜硫酸水素塩配列決定(oxidative bisulfite sequencing:oxBS−seq)であり、これは、一塩基分解能で、5−メチルシトシンおよび5−ヒロドキシメチルシトシンの位置を明らかにすることができる(MJ Booth et al. 2012 Science; 336: 934-937; MJ Booth et al. 2013 Nature Protocols; 8: 1841-1851)。亜硫酸水素塩配列決定では、5−メチルシトシンおよび5−ヒロドキシメチルシトシンは共に、シトシンとして読まれるため、区別することができない。一方、oxBS−seqでは、過ルテニウム酸カリウム(KRuO4)による処理、続く亜硫酸水素塩変換を用いた新たに形成された5−ホルミルシトシンのウラシルへの変換による、5−ヒロドキシメチルシトシンの5−ホルミルシトシンへの特定の酸化は、5−ヒロドキシメチルシトシンを5−メチルシトシンから区別することを可能にする。従って、5−メチルシトシンの読み取りは1回のoxBS−seq実行から得ることができ、5−ヒロドキシメチルシトシンレベルは、亜硫酸水素塩配列決定の結果を比較することによって推定される。別の実施形態では、5−メチルシトシンは、Tet補助亜硫酸水素塩配列決定(Tet-assisted bisulfite sequencing:TAB−seq)を用いることで、5−ヒロドキシメチルシトシンと区別することができる(M Yu et al. 2012 Nat Protoc; 7: 2159-2170)。TAB−seqは、5−ヒロドキシメチルシトシンを一塩基分解能で特定することができ、それぞれの修飾部位におけるその存在量を決定することができる。この方法には、5−ヒロドキシメチルシトシンのβ−グルコシルトランスフェラーゼを介した保護(グルコシル化)、および5−メチルシトシンの5−カルボキシルシトシンへの組換えマウスTet1(mTet1)を介した酸化が含まれる。続く亜硫酸水素塩処理およびPCR増幅の後、シトシンおよび5−カルボキシルシトシン(5−メチルシトシン由来)は共に、チミン(T)に変換され、一方、5−ヒロドキシメチルシトシンはCとして読まれる。   Bisulfite sequencing can also identify different forms of methylation. In one embodiment, bisulfite sequencing may include an additional step capable of distinguishing 5-methylcytosine from 5-hydroxymethylcytosine. One such approach is oxidative bisulfite sequencing (oxBS-seq), which locates 5-methylcytosine and 5-hydroxymethylcytosine at single base resolution. It can be clarified (MJ Booth et al. 2012 Science; 336: 934-937; MJ Booth et al. 2013 Nature Protocols; 8: 1841-1851). Bisulfite sequencing is indistinguishable because both 5-methylcytosine and 5-hydroxymethylcytosine are read as cytosines. On the other hand, in oxBS-seq, treatment of 5-hydroxymethylcytosine by treatment with potassium perruthenate (KRuO4) followed by conversion of newly formed 5-formylcytosine to uracil using bisulfite conversion. The specific oxidation to formylcytosine makes it possible to distinguish 5-hydroxymethylcytosine from 5-methylcytosine. Therefore, a 5-methylcytosine reading can be obtained from a single oxBS-seq run, and 5-hydroxymethylcytosine levels are estimated by comparing the bisulfite sequencing results. In another embodiment, 5-methylcytosine can be distinguished from 5-hydroxymethylcytosine by using Tet-assisted bisulfite sequencing (TAB-seq) (M. Yu et al. 2012 Nat Protoc; 7: 2159-2170). TAB-seq can specify 5-hydroxymethylcytosine with single base resolution, and can determine its abundance at each modification site. This method involved β-glucosyltransferase-mediated protection of 5-hydroxymethylcytosine (glucosylation), and recombinant mouse Tet1 (mTet1) -mediated oxidation of 5-methylcytosine to 5-carboxylcytosine. included. After subsequent bisulfite treatment and PCR amplification, both cytosine and 5-carboxyl cytosine (from 5-methylcytosine) are converted to thymine (T), while 5-hydroxymethylcytosine is read as C.

図1Bは、本発明の実施形態に従って配列決定された試料の1Mbウィンドウ内のメチル化密度を示す。プロット150は、母体血漿およびゲノム全域の1Mbウィンドウ内のゲノムDNAにおけるメチル化密度を示すCircosプロットである。外側から内側に向かって:染色体模式図は、時計回りの方向でpter−qter配向であり得る:(セントロメアは赤色で示される)、母体血(赤色)、胎盤(黄色)、母体血漿(緑色)、母体血漿内の共有リード(青色)、および母体血漿内の胎児特異的リード(紫色)。母体血細胞、胎盤および母体血漿の全体のCpGメチル化レベル(すなわち、密度レベル)は、表100に見出すことができる。母体血細胞のメチル化レベルは、通常、全ゲノムにわたって、胎盤のメチル化レベルよりも高い。   FIG. 1B shows the methylation density within the 1 Mb window of samples sequenced according to embodiments of the invention. Plot 150 is a Circos plot showing the methylation density in maternal plasma and genomic DNA within the 1 Mb window across the genome. From outside to inside: Chromosome schematic can be in the pter-qter orientation in the clockwise direction: (centromere shown in red), maternal blood (red), placenta (yellow), maternal plasma (green). , Shared lead in maternal plasma (blue), and fetal-specific lead in maternal plasma (purple). Total CpG methylation levels (ie, density levels) in maternal blood cells, placenta and maternal plasma can be found in Table 100. Maternal blood cell methylation levels are usually higher than placental methylation levels across the entire genome.

B. 亜硫酸水素塩配列決定と他の手法の比較
大規模並列亜硫酸水素塩配列決定を用いて胎盤メチロームを研究した。さらに、ヒトゲノムにおける約480,000のCpG部位を網羅したオリゴヌクレオチドアレイプラットフォーム(イルミナ社)を用いて、胎盤メチロームを研究した(M Kulis et al. 2012 Nat Genet; 44: 1236-1242;およびC Clark et al. 2012 PLoS One; 7: e50233)。ビーズチップベースの遺伝子型同定およびメチル化解析を用いる一実施形態では、イルミナ社製HumanOmni2.5−8遺伝子型同定アレイを用い、製造業者のプロトコルに従って、遺伝子型同定を行った。遺伝子型は、Genome Studio Software(イルミナ社)のGenCallアルゴリズムを用いてコール(call)した。コールレイト(call rate)は99%超であった。マイクロアレイに基づくメチル化解析において、ゲノムDNA(500〜800ng)を、イルミナ社製Infinium Methylationアッセイ用に、製造業者の推奨に従って、Zymo EZ DNAメチル化キット(ジモ・リサーチ社(Zymo Research)、米国カリフォルニア州オレンジ)を用いて、亜硫酸水素ナトリウムで処理した。
B. Comparison of bisulfite sequencing and other techniques Placental methylome was studied using massively parallel bisulfite sequencing. In addition, placental methylomes were studied using an oligonucleotide array platform (Illumina) that covers approximately 480,000 CpG sites in the human genome (M Kulis et al. 2012 Nat Genet; 44: 1236-1242; and C Clark). et al. 2012 PLoS One; 7: e50233). In one embodiment using bead-chip based genotyping and methylation analysis, genotyping was performed using the Illumina Human Omni2.5-8 genotyping array according to the manufacturer's protocol. Genotypes were called using the GenCall algorithm of Genome Studio Software (Illumina). The call rate was over 99%. In a microarray-based methylation analysis, genomic DNA (500-800 ng) was loaded into a Zymo EZ DNA methylation kit (Zymo Research, Calif., USA) for Illumina Infinity Methylation assay according to manufacturer's recommendations. Orange) and treated with sodium bisulfite.

Infinium HDメチル化アッセイプロトコルに従って、4μlの、亜硫酸水素塩によって変換されたゲノムDNA(50ng/μl)に対して、メチル化アッセイを行った。ハイブリダイズされたビーズチップをイルミナ社製iScan装置上でスキャンした。DNAメチル化データをGenomeStudio(v2011.1)Methylation Module(v1.9.0)ソフトウェアによって解析し、内部標準に対する正規化およびバックグラウンド除去も行った。個々のCpG部位のメチル化指数はβ値(β)によって表され、これは、メチル化対立遺伝子および非メチル化対立遺伝子の間の蛍光強度の比を用いて算出される:   Methylation assays were performed on 4 μl of bisulfite converted genomic DNA (50 ng / μl) according to the Infinium HD methylation assay protocol. The hybridized bead chips were scanned on an IlScan iScan device. DNA methylation data was analyzed by GenomeStudio (v2011.1) Methylation Module (v1.9.0) software, normalization to an internal standard and background removal were also performed. The methylation index of an individual CpG site is represented by the β value (β), which is calculated using the ratio of fluorescence intensity between the methylated and unmethylated alleles:

アレイ上に表され、少なくとも10倍の被覆率に配列決定されたCpG部位について、アレイによって得られたβ値を、同一部位の配列決定によって決定されるメチル化指数と比較した。β値は、メチル化されたプローブの強度を、同一のCpG部位を被覆するメチル化プローブおよび非メチル化プローブの混合強度の比率として表した。各CpG部位のメチル化指数は、そのCpGを被覆するリードの総数に対するメチル化リードの比率を指す。   For CpG sites represented on the array and sequenced for at least 10-fold coverage, the β value obtained by the array was compared to the methylation index determined by sequencing the same sites. The β value represents the intensity of the methylated probe as a ratio of the mixed intensities of the methylated probe and the unmethylated probe covering the same CpG site. The methylation index of each CpG site refers to the ratio of methylated reads to the total number of reads covering that CpG.

図2A〜図2Cは、両方のプラットフォームによって調べられた対応するCpG部位のゲノムワイド亜硫酸水素塩配列決定によって決定されたメチル化指数に対する、イルミナ社製Infinium HumanMethylation 450Kビーズチップアレイによって決定されたβ値のプロットを示している:(A)母体血細胞、(B)絨毛膜絨毛検体、(C)妊娠末期胎盤組織。両方のプラットフォームから得られたデータは高度に一致しており、母体血細胞、CVSおよび妊娠末期胎盤組織のそれぞれについて、ピアソン相関係数は0.972、0.939および0.954であり、R2値は0.945、0.882および0.910であった。 2A-2C are β-values determined by Illumina Infinium HumanMethylation 450K bead chip array versus methylation index determined by genome-wide bisulfite sequencing of the corresponding CpG sites probed by both platforms. Shows plots of: (A) maternal blood cells, (B) chorionic villous specimen, (C) late pregnancy placental tissue. The data obtained from both platforms are highly consistent, with Pearson correlation coefficients of 0.972, 0.939 and 0.954 for maternal blood cells, CVS and late pregnancy placental tissue, respectively, and R 2 The values were 0.945, 0.882 and 0.910.

さらに、配列決定データを、約27,000のCpG部位を網羅するオリゴヌクレオチドアレイを用いて12対のCVSおよび母体血細胞DNA試料のメチル化特性を調べた、Chu et alによって報告された配列決定データと比較した(T Chu et al. 2011 PLoS One; 6: e14723)。CVSおよび母体血細胞DNA、並びに先の研究における12対の各試料の配列決定の結果の間の相関データによって、母体血において平均ピアソン係数(0.967)およびR2(0.935)が得られ、CVSにおいて平均ピアソン計数(0.943)およびR2(0.888)が得られた。両方のアレイ上に表されたCpG部位の中で、我々のデータは発表データと高度に相関していた。母体血細胞、CVSおよび胎盤組織において非CpGメチル化の割合は1%未満であった(表100)。これらの結果は、相当量の非CpGメチル化が主に多能性細胞に限定されたという現在の知見と一致した(R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331)。 In addition, the sequencing data was compared to the sequencing data reported by Chu et al, which examined the methylation properties of 12 pairs of CVS and maternal blood cell DNA samples using an oligonucleotide array covering approximately 27,000 CpG sites. (T Chu et al. 2011 PLoS One; 6: e14723). Correlation data between CVS and maternal blood cell DNA and the sequencing results of each of the 12 pairs of samples in the previous study yielded mean Pearson coefficient (0.967) and R 2 (0.935) in maternal blood. , CVS average Pearson counts (0.943) and R 2 (0.888) were obtained. Of the CpG sites represented on both arrays, our data were highly correlated with published data. The percentage of non-CpG methylation in maternal blood cells, CVS and placental tissues was less than 1% (Table 100). These results were consistent with the current finding that significant amounts of non-CpG methylation were mainly restricted to pluripotent cells (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331).

C. 非妊娠対象の血漿メチロームおよび血液メチロームの比較
図3Aおよび図3Bは、成人男性および非妊娠成人女性から採取された血漿および血液細胞における、メチル化されたCpG部位の割合の棒グラフを示している:(A)常染色体、(B)X染色体。図表は、男性および非妊娠女性の血漿メチロームおよび血液メチローム間の類似性を示している。男性および非妊娠女性の血漿試料におけるメチル化されたCpG部位の全体的な割合は、対応する血液細胞DNAとほぼ同じであった(表100並びに図2Aおよび図2B)。
C. Comparison of Plasma Methylome and Blood Methylome in Non-Pregnant Subjects FIGS. 3A and 3B show a bar graph of the percentage of methylated CpG sites in plasma and blood cells collected from adult males and non-pregnant adult females: (A) Autosome, (B) X chromosome. The chart shows the similarities between plasma and blood methylomes in males and non-pregnant women. The overall proportion of methylated CpG sites in male and non-pregnant female plasma samples was about the same as the corresponding blood cell DNA (Table 100 and Figures 2A and 2B).

次に、血漿試料および血液細胞試料のメチル化特性の座位特異的な相関を研究した。ヒトゲノムにおける各100kbのビンのメチル化密度を、100kb領域にマッピングされた配列リードによって被覆された全CpG部位の割合として、CpG部位における未変換シトシンの総数を決定することにより、決定した。メチル化密度は、男性および女性試料の血漿試料および対応する血液細胞DNAの間で高度に一致した。   Next, the locus-specific correlation of the methylation properties of plasma and blood cell samples was studied. The methylation density of each 100 kb bin in the human genome was determined by determining the total number of unconverted cytosines at the CpG sites as a percentage of the total CpG sites covered by the sequence reads mapped to the 100 kb region. The methylation density was highly consistent between plasma samples of male and female samples and the corresponding blood cell DNA.

図4Aおよび図4Bは、血液細胞DNAおよび血漿DNAにおける対応する遺伝子座のメチル化密度のプロットを示している:(A)非妊娠成人女性、(B)成人男性。非妊娠女性試料のピアソン相関係数およびR2値はそれぞれ0.963および0.927であり、男性試料のピアソン相関係数およびR2値はそれぞれ0.953および0.908であった。これらのデータは、造血細胞がヒト血漿におけるDNAの主な供給源であることを示した、同種間造血幹細胞移植の受容者の血漿DNA分子の遺伝子型評価に基づく先の知見(YW Zheng at al. 2012 Clin Chem; 58: 549-558)と一致している。 Figures 4A and 4B show plots of methylation density of corresponding loci in blood cell and plasma DNA: (A) non-pregnant adult female, (B) adult male. Pearson correlation coefficient and R 2 value of the non-pregnant female samples are each 0.963 and 0.927, Pearson correlation coefficient and R 2 value of male samples were, respectively, 0.953 and 0.908. These data indicated that hematopoietic cells were the major source of DNA in human plasma, with previous findings based on the genotyping of plasma DNA molecules in recipients of allogeneic hematopoietic stem cell transplantation (YW Zheng at al. 2012 Clin Chem; 58: 549-558).

D. メチローム全般のメチル化レベル
次に、メチル化レベルを決定するために、母体血漿DNA、母体血細胞、および胎盤組織のDNAメチル化レベルを調べた。反復領域、非反復領域、および全域におけるレベルを決定した。
D. Methylome-wide methylation levels Next, DNA methylation levels of maternal plasma DNA, maternal blood cells, and placental tissues were examined to determine methylation levels. Levels in repetitive, non-repetitive and global regions were determined.

図5Aおよび図5Bは、妊娠女性から採取した試料間の、メチル化されたCpG部位の割合の棒グラフを示している:(A)常染色体、(B)X染色体。メチル化されたCpGsの全割合は、第一期および第三期の母体血漿試料において、それぞれ67.0%および68.2%であった。非妊娠個体から得られた結果とは異なり、これらの割合は第一期母体血細胞試料のそれよりも低かったが、CVSおよび妊娠末期胎盤組織検体のそれよりも高かった(表100)。注目すべきことに、出産後母体血漿試料におけるメチル化されたCpGの割合は73.1%であり、これは血液細胞データに類似していた(表100)。これらの傾向は、全ての常染色体およびX染色体にわたって分布するCpGにおいて観察され、ヒトゲノムの非反復領域および複数のクラスの反復領域の両方に及んだ。   5A and 5B show bar graphs of the percentage of methylated CpG sites among samples taken from pregnant women: (A) autosomal chromosome, (B) X chromosome. The total percentage of methylated CpGs was 67.0% and 68.2% in the first and third stage maternal plasma samples, respectively. Unlike the results obtained from non-pregnant individuals, these rates were lower than that of the first trimester maternal blood cell sample, but higher than that of the CVS and late pregnancy placental tissue specimens (Table 100). Of note, the percentage of methylated CpG in the postnatal maternal plasma sample was 73.1%, which was similar to the blood cell data (Table 100). These trends were observed in CpG, which is distributed across all autosomal and X chromosomes, spanning both the non-repetitive regions of the human genome and multiple classes of repetitive regions.

胎盤における反復領域および非反復領域の両方は、母体血細胞と比較して低メチル化であることが分かった。これらの結果は、胎盤が他の組織(例えば、末梢血細胞)と比較して低メチル化であるという、文献中の知見と一致した。   Both repetitive and non-repetitive regions in the placenta were found to be hypomethylated compared to maternal blood cells. These results were consistent with findings in the literature that placenta is hypomethylated compared to other tissues (eg, peripheral blood cells).

妊娠女性、非妊娠女性および成人男性から得られた血液細胞DNAにおいて、配列決定されたCpG部位のうち71%〜72%がメチル化されていた(図1の表100)。これらのデータは、Y Li et al. 2010 PLoS Biol; 8: e1000533によって報告された、血中単核細胞のCpG部位の68.4%という報告と同程度である。胎盤組織の低メチル化性質に関する先の報告と一致して、CpG部位の55%および59%が、それぞれCVSおよび妊娠末期胎盤組織においてメチル化されていた(表100)。   In blood cell DNA obtained from pregnant women, non-pregnant women and adult men, 71% to 72% of the sequenced CpG sites were methylated (Table 100 in Figure 1). These data are comparable to the report of 68.4% of CpG sites in blood mononuclear cells reported by Y Li et al. 2010 PLoS Biol; 8: e1000533. Consistent with previous reports on the hypomethylated nature of placental tissue, 55% and 59% of CpG sites were methylated in CVS and late pregnancy placental tissue, respectively (Table 100).

図6は、母体血、胎盤および母体血漿における、ヒトゲノムの異なる反復クラスのメチル化レベルの棒グラフを示している。反復クラスはUCSCゲノムブラウザによって定義される。示されるデータは第一期試料から得られたものである。胎盤組織の低メチル化性質がゲノム内のある特定の反復クラスにおいて主に観察されたことを示す初期のデータ(B Novakovic et al. 2012 Placenta; 33: 959-970)と異なり、ここでは、胎盤が、血液細胞を基準にして、ゲノムエレメントの大部分のクラスにおいて実際は低メチル化状態であったことを示す。   FIG. 6 shows a bar graph of methylation levels of different repeat classes of the human genome in maternal blood, placenta and maternal plasma. Repeat classes are defined by the UCSC Genome Browser. The data shown are from the first trimester samples. Unlike the earlier data (B Novakovic et al. 2012 Placenta; 33: 959-970), which showed that the hypomethylated nature of placental tissues was mainly observed in a particular recurrent class within the genome, where placenta Show that they were actually hypomethylated in most classes of genomic elements, relative to blood cells.

E. メチロームの類似性
実施形態によって、同一のプラットフォームを用いて胎盤組織、血液細胞および血漿のメチロームを決定することができる。従って、それらの生物試料型のメチロームの直接比較が可能であった。男性および非妊娠女性における血液細胞および血漿のメチローム間、並びに母体血細胞および出産後母体血漿試料間の高レベルの類似によって、造血細胞がヒト血漿におけるDNAの主な供給源であることがさらに確認された(YW Zheng at al. 2012 Clin Chem; 58: 549-558)。
E. Methylome Affinity Embodiments allow the same platform to be used to determine methylome in placental tissue, blood cells and plasma. Therefore, it was possible to directly compare the methylomes of those biological sample types. The high level of similarity between blood cell and plasma methylomes in males and non-pregnant women, as well as between maternal blood cells and postnatal maternal plasma samples further confirms that hematopoietic cells are the major source of DNA in human plasma. (YW Zheng at al. 2012 Clin Chem; 58: 549-558).

ゲノム内のメチル化CpGの全割合の点から、並びに血液細胞DNAおよび血漿DNAにおける対応する遺伝子座間のメチル化密度の高い相関から、類似は明らかである。しかし、第一期および第三期の母体血漿試料におけるメチル化CpGの全割合は、母体血細胞データまたは出産後母体血漿試料と比較した場合、減少していた。妊娠中のメチル化レベルの減少は、母体血漿内に存在する胎児DNA分子の低メチル化性質のためであった。   The similarity is clear in terms of the total percentage of methylated CpG within the genome and from the high correlation of methylation density between corresponding loci in blood cell DNA and plasma DNA. However, the total proportion of methylated CpG in the first and third stage maternal plasma samples was reduced when compared to maternal blood cell data or postnatal maternal plasma samples. The reduction in methylation levels during pregnancy was due to the hypomethylated nature of fetal DNA molecules present in maternal plasma.

出産後母体血漿試料におけるメチル化特性が逆転して母体血細胞のメチル化特性により類似するようになったことは、胎児DNA分子が母体循環系から排除されたことを示唆している。胎児のSNPマーカーに基づいて胎児DNA濃度の算出したところ、確かに、濃度が出産前の33.9%から、出産後試料においてはほんの4.5%に変化したことが示された。   The reversal of the methylation profile in postnatal maternal plasma samples to make them more similar to the methylation profile of maternal blood cells suggests that fetal DNA molecules have been eliminated from the maternal circulation. Calculation of fetal DNA concentration based on the fetal SNP marker showed that the concentration did change from 33.9% prenatal to only 4.5% in postnatal samples.

F. 他の応用
実施形態は、血漿DNAのMPS解析を通じて、DNAメチロームを構築することに成功している。母体血漿から胎盤メチロームまたは胎児メチロームを決定する能力は、子癇前症、子宮内胎児発育遅延、早産等の妊娠関連状態と関連する異常なメチル化特性を決定、検出およびモニタリングするための非浸潤的方法を提供する。例えば、疾患特異的な異常なメチル化サインの検出は、そのような妊娠関連状態の検診、診断およびモニタリングを可能にする。母体血漿メチル化レベルの測定は、そのような妊娠関連状態の検診、診断およびモニタリングを可能にする。妊娠関連状態の研究への直接適用に加えて、前期アプローチは、血漿DNA解析を目的とした他の医学領域に応用することができる。例えば、がんのメチロームは、がん患者の血漿DNAから決定することができる。本明細書に記載される、血漿からのがんメチローム解析は、血漿からのがんゲノム解析に対して相乗的な科学技術になり得る(KCA Chan at al. 2013 Clin Chem; 59: 211-224およびRJ Leary et al. 2012 Sci Transl Med; 4:162ra154)。
F. Other Applications Embodiments have been successful in constructing DNA methylomes through MPS analysis of plasma DNA. The ability to determine placental or fetal methylome from maternal plasma is a non-invasive property for determining, detecting and monitoring aberrant methylation properties associated with pregnancy-related conditions such as preeclampsia, intrauterine growth retardation and preterm birth. Provide a way. For example, detection of disease-specific aberrant methylation signatures allows for screening, diagnosis and monitoring of such pregnancy related conditions. Measurement of maternal plasma methylation levels allows for screening, diagnosis and monitoring of such pregnancy related conditions. In addition to its direct application to the study of pregnancy-related conditions, the prophase approach can be applied to other areas of medicine for plasma DNA analysis. For example, the cancer methylome can be determined from the plasma DNA of cancer patients. The cancer methylome analysis from plasma described herein can be a synergistic science and technology for cancer genome analysis from plasma (KCA Chan at al. 2013 Clin Chem; 59: 211-224. And RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154).

例えば、血漿試料のメチル化レベルの決定は、がんの検診に用いることができる。血漿試料のメチル化レベルが健常対照群と比較して異常なレベルを示す場合、がんが疑われ得る。その後、異なるゲノム遺伝子座におけるメチル化の血漿特性を決定することにより、または腫瘍関連性のコピー数異常、染色体転座および単一ヌクレオチド変異を検出するための血漿ゲノム解析により、がん型またはがんの組織起源のさらなる確認および評価を行ってもよい。実際に、本発明の一実施形態では、血漿におけるがんのメチロームおよびゲノムのプロファイリングは、同時に行うことができる。あるいは、放射線検査および画像診断検査(例えば、コンピュータ断層撮影、磁気共鳴画像法、陽電子断層撮影法)または内視鏡検査(例えば、上部消化管内視鏡検査または大腸内視鏡検査)を用いることで、血漿メチル化レベル解析に基づいてがんを有することが疑われた個体をさらに検査することができる。   For example, the determination of methylation levels in plasma samples can be used to screen for cancer. Cancer may be suspected if the methylation level of the plasma sample shows abnormal levels compared to healthy controls. Subsequent determination of the cancer type or phenotype by determining plasma characteristics of methylation at different genomic loci or by plasma genomic analysis to detect tumor-associated copy number abnormalities, chromosomal translocations, and single nucleotide mutations. Further confirmation and evaluation of the tissue origin of cancer may be performed. Indeed, in one embodiment of the invention, the cancer methylome and genome profiling in plasma can be performed simultaneously. Alternatively, by using radiography and diagnostic imaging (eg, computed tomography, magnetic resonance imaging, positron emission tomography) or endoscopy (eg, upper gastrointestinal endoscopy or colonoscopy) Individuals suspected of having cancer can be further tested based on plasma methylation level analysis.

がんの検診または検出において、血漿試料(または他の生物試料)のメチル化レベルの決定は、がんの検診または検出用の他の様式と併せて用いることができ、例えば、前立腺特異抗原測定(例えば、前立腺がん用)、癌胎児抗原(例えば、結腸直腸癌、胃癌、膵癌、肺癌、乳癌、甲状腺髄様癌用)、αフェトプロテイン(例えば、肝臓がんまたは胚細胞性腫瘍用)、CA125(例えば、卵巣がんおよび乳がん用)およびCA19−9(例えば、膵癌用)である。   In the screening or detection of cancer, the determination of methylation levels of plasma samples (or other biological samples) can be used in conjunction with other modalities for screening or detection of cancer, eg prostate specific antigen measurement. (For example, prostate cancer), carcinoembryonic antigen (for example, colorectal cancer, gastric cancer, pancreatic cancer, lung cancer, breast cancer, medullary thyroid cancer), α-fetoprotein (for example, liver cancer or germ cell tumor), CA125 (eg, for ovarian and breast cancer) and CA19-9 (eg, for pancreatic cancer).

さらに、他の組織を配列決定して細胞メチロームを得ることができる。例えば、肝組織を解析することで、肝臓に特異的なメチル化パターンを決定することができ、これを、肝臓病変を特定するのに用いてもよい。分析が可能である他の組織には、脳細胞、骨、肺、心臓、筋肉および腎臓等が含まれる。種々の組織のメチル化特性は、例えば、発生、加齢、疾患仮定(例えば、炎症または肝硬変または自己免疫過程(例えば、全身性エリテマトーデス))として、または処置(例えば、5−アザシチジンおよび5−アザデオキシシチジン等の脱メチル化剤での処置)の結果として、時に応じて変化し得る。DNAメチル化の動的性質は、生理学的プロセスおよび病理学的プロセスをモニタリングする上で、そのような解析を潜在的に非常に価値のあるものにしている。例えば、個体が健康であった時に得られたベースライン値と比較して個体の血漿メチロームにおける変化を検出する場合、血漿DNAを与える臓器における疾患仮定を検出することができる。   In addition, other tissues can be sequenced to obtain cellular methylomes. For example, analysis of liver tissue can determine liver-specific methylation patterns, which may be used to identify liver lesions. Other tissues that can be analyzed include brain cells, bones, lungs, heart, muscles and kidneys. Methylation properties of various tissues can be characterized, for example, as development, aging, disease hypothesis (eg, inflammation or cirrhosis or autoimmune processes (eg, systemic lupus erythematosus)), or treatment (eg, 5-azacytidine and 5-azacytidine. As a result of treatment with a demethylating agent such as deoxycytidine). The dynamic nature of DNA methylation makes such an analysis potentially very valuable in monitoring physiological and pathological processes. For example, a disease hypothesis in an organ that provides plasma DNA can be detected when detecting changes in an individual's plasma methylome compared to baseline values obtained when the individual was healthy.

また、移植臓器のメチロームは、臓器移植受容者の血漿DNAから決定することができる。本発明に記載される、血漿からの移植片メチローム解析は、血漿からの移植片ゲノム解析に対する相乗的な科学技術となり得る(YW Zheng at al, 2012; YMD Lo at al. 1998 Lancet; 351: 1329-1330;およびTM Snyder et al. 2011 Proc Natl Acad Sci USA; 108: 6229-6234)。血漿DNAは一般的には細胞死のマーカーと見なされていることから、移植臓器から放出されたDNAの血漿内レベルの増加は、その臓器からの細胞死の増加、例えば、拒絶エピソードまたはその臓器に関わる他の病理過程(例えば、感染または膿瘍)に対するマーカーとして用いることができる。抗拒絶反応療法が上手く開始されたイベントにおいて、移植臓器によって放出されたDNAの血漿内レベルは、減少することが予測される。   Further, the methylome of the transplanted organ can be determined from the plasma DNA of the organ transplant recipient. The graft methylome analysis from plasma described in the present invention can be a synergistic science and technology for the analysis of graft genome from plasma (YW Zheng at al, 2012; YMD Lo at al. 1998 Lancet; 351: 1329). -1330; and TM Snyder et al. 2011 Proc Natl Acad Sci USA; 108: 6229-6234). Since plasma DNA is generally regarded as a marker of cell death, an increase in plasma levels of DNA released from a transplanted organ results in an increase in cell death from that organ, eg, a rejection episode or the organ. It can be used as a marker for other pathological processes involved in (eg, infection or abscess). In the event that anti-rejection therapy is successfully initiated, plasma levels of DNA released by transplanted organs are expected to decrease.

III. SNPを用いた胎児メチロームまたは腫瘍メチロームの決定
上記のように、非妊娠健常人において、血漿メチロームは血液メチロームに一致する。しかし、妊娠女性においては、これらのメチロームは異なる。胎児DNA分子が、大部分の母体DNAバックグラウンドの中、母体血漿内を循環している(YMD Lo et al. 1998 Am J Hum Genet; 62: 768-775)。それ故、妊娠女性において、血漿メチロームは、大部分は胎盤メチロームおよび血液メチロームの混成である。従って、血漿から胎盤メチロームを抽出することができる。
III. Determination of Fetal or Tumor Methylome Using SNPs As described above, plasma methylome is consistent with blood methylome in non-pregnant healthy individuals. However, in pregnant women these methylomes are different. Fetal DNA molecules circulate in maternal plasma in most maternal DNA backgrounds (YMD Lo et al. 1998 Am J Hum Genet; 62: 768-775). Therefore, in pregnant women, the plasma methylome is predominantly a mixture of placental and blood methylomes. Therefore, the placenta methylome can be extracted from plasma.

一実施形態では、母親および胎児間の一塩基多型(SNP)の差異は、母体血漿中の胎児DNA分子を特定するために用いられる。母親がホモ接合性であるが胎児がヘテロ接合性であるSNP遺伝子座を特定することを目的としており;胎児特異的対立遺伝子を用いることで、どのDNA断片が胎児由来であるかを決定することができる。母体血細胞由来のゲノムDNAを、SNP遺伝子型同定アレイ、イルミナ社製HumanOmni2.5−8を用いて解析した。一方、母親がヘテロ接合性であり胎児がホモ接合性であるSNP遺伝子座については、母親に特異的なSNP対立遺伝子を用いることで、どの血漿DNA断片が母親由来であるかを決定することができる。そのようなDNA断片のメチル化レベルは、母親における関連ゲノム領域のメチル化レベルを反映する。   In one embodiment, single nucleotide polymorphism (SNP) differences between mother and fetus are used to identify fetal DNA molecules in maternal plasma. Aims to identify SNP loci in which the mother is homozygous but the fetus is heterozygous; using fetal-specific alleles to determine which DNA fragment is from the fetus You can Maternal blood cell-derived genomic DNA was analyzed using a SNP genotyping array, Human Omni 2.5-8 manufactured by Illumina. On the other hand, for SNP loci in which the mother is heterozygous and the fetus is homozygous, it is possible to determine which plasma DNA fragment is derived from the mother by using the SNP allele specific to the mother. it can. The methylation level of such DNA fragments reflects the methylation level of the relevant genomic region in the mother.

A. 胎児特異的リードのメチル化および胎盤メチロームの相関
一方の対立遺伝子(B)の量がもう一方の対立遺伝子(A)の量よりも有意に少ない、2つの異なる対立遺伝子を有する遺伝子座を、生物試料の配列決定の結果から特定した。B対立遺伝子を被覆するリードは胎児特異的(胎児特異的リード)と見なした。母親はAについてホモ接合性であり、胎児はA/Bについてヘテロ接合性であることが決定されたことから、A対立遺伝子を被覆するリードは母親および胎児によって共有されていた(共有リード)。
A. Correlation of fetal-specific lead methylation and placental methylome A locus with two different alleles is significantly less abundant in the amount of one allele (B) than in the other (A). It was identified from the results of sequencing the samples. Reads covering the B allele were considered fetal-specific (fetal-specific reads). Since it was determined that the mother was homozygous for A and the fetus was heterozygous for A / B, the lead covering the A allele was shared by the mother and the fetus (shared lead).

本発明における概要のいくつかを説明するために用いられた、解析された1つの妊娠症例において、妊娠中の母親は、常染色体上の1,945,516の遺伝子座においてホモ接合性であることが分かった。これらのSNPを被覆する母体血漿DNA塩基配列決定法のリードを検査した。非母体対立遺伝子を保有するリードが107,750の遺伝子座において検出され、これらは有益な遺伝子座であると見なされた。それぞれの有益なSNPにおいて、母親由来でなかった対立遺伝子は胎児特異的対立遺伝子と称され、その他の対立遺伝子は共有対立遺伝子と称された。   In one analyzed case of pregnancy, used to explain some of the aspects of the invention, the pregnant mother is homozygous at the 1,945,516 locus on the autosomal chromosome. I understood. The maternal plasma DNA sequencing reads covering these SNPs were examined. Leads carrying non-maternal alleles were detected at 107,750 loci, which were considered to be informative loci. In each informative SNP, the non-maternal allele was designated as the fetal-specific allele and the other alleles as the shared allele.

母体血漿中の胎児/腫瘍DNA濃度分率(胎児DNA割合とも称される)を決定することができる。一実施形態では、母体血漿中の胎児DNA濃度分率(f)は下記式によって決定され、   The fetal / tumor DNA concentration fraction in maternal plasma (also called fetal DNA percentage) can be determined. In one embodiment, the fetal DNA concentration fraction (f) in maternal plasma is determined by the formula:

式中、pは胎児特異的対立遺伝子を有する配列決定されたリードの数であり、qは母親および胎児間で共有される対立遺伝子を有する配列決定されたリードの数である(YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91)。第一期、第三期および出産後母体血漿試料における胎児DNA割合は、それぞれ14.4%、33.9%および4.5%であることが分かった。また、Y染色体に並んだリードの数を用いて、胎児DNA割合を算出した。Y染色体データに基づくと、結果は、第一期、第三期および出産後母体血漿試料中で、それぞれ14.2%、34.9%および3.7%であった。 Where p is the number of sequenced reads with the fetus-specific allele and q is the number of sequenced reads with the allele shared between the mother and the fetus (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91). The fetal DNA rates in the first, third and post-natal maternal plasma samples were found to be 14.4%, 33.9% and 4.5%, respectively. The fetal DNA ratio was calculated using the number of reads arranged on the Y chromosome. Based on Y chromosome data, the results were 14.2%, 34.9% and 3.7% in the 1 st, 3 rd and post-natal maternal plasma samples, respectively.

胎児特異的配列リードまたは共有配列リードを別々に解析することにより、実施形態は、循環中の胎児DNA分子がバックグラウンドDNA分子よりもさらにより低メチル化状態であったことを示している。第一期および第三期の両方の胎児特異的母体血漿リードおよび胎盤組織データにおける対応する遺伝子座のメチル化密度の比較によって、高レベルの相関が明らかになった。これらのデータは、胎盤が母体血漿中の胎児由来DNA分子の主な供給源であるというゲノムレベルでの証拠を与え、選択された遺伝子座から得られる情報に基づく先の証拠と比較して、大きな進歩を示すものである。   By analyzing fetal-specific or shared sequence reads separately, embodiments show that circulating fetal DNA molecules were even more hypomethylated than background DNA molecules. Comparison of methylation densities of corresponding loci in fetal-specific maternal plasma leads and placental tissue data for both first and third trimesters revealed high levels of correlation. These data provide genomic-level evidence that the placenta is the major source of fetal-derived DNA molecules in maternal plasma, compared to earlier evidence based on information obtained from selected loci, It shows great progress.

ゲノム内の各1Mb領域のメチル化密度を、有益なSNPに隣接するCpG部位を被覆する胎児特異的リードまたは共有リードを用いて決定した。母体血漿配列リードから構築された胎児特異的メチロームおよび非胎児特異的メチロームは、例えばCircosプロットに、表示することができる(M Krzywinski et al. 2009 Genome Res; 19: 1639-1645)。母体血細胞および胎盤組織検体における1Mbのビンあたりのメチル化密度も決定した。   The methylation density of each 1 Mb region in the genome was determined using a fetal-specific or shared read covering the CpG site adjacent to the informative SNP. Fetal-specific and non-fetal-specific methylomes constructed from maternal plasma sequence reads can be displayed, eg, in the Circos plot (M Krzywinski et al. 2009 Genome Res; 19: 1639-1645). The methylation density per bin of 1 Mb in maternal blood cells and placental tissue specimens was also determined.

図7Aは、第一期試料のCircosプロット700を示している。図7Bは、第三期試料のCircosプロット750を示している。プロット700およびプロット750は1Mbのビンあたりのメチル化密度を示している。染色体模式図(最外側の環)は、時計回りの方向でpter−qter配向である(セントロメアは赤色で示される)。最外側から2番目のトラックは、対応する1Mb領域におけるCpG部位の数を示している。示される赤色バーのスケールは1Mbのビンあたり最大20,000部位である。対応する1Mb領域のメチル化密度は、中央に示される配色に基づいてその他のトラックに示される。   FIG. 7A shows a Circos plot 700 of the first trimester sample. FIG. 7B shows a Circos plot 750 of the third trimester sample. Plot 700 and plot 750 show methylation density per bin of 1 Mb. The schematic diagram of the chromosome (outermost ring) is in the pter-qter orientation in the clockwise direction (centromere is shown in red). The second track from the outermost side shows the number of CpG sites in the corresponding 1 Mb region. The red bar scale shown is up to 20,000 sites per 1 Mb bin. The methylation density of the corresponding 1 Mb region is shown in the other tracks based on the color scheme shown in the center.

第一期試料(図7A)において、内側から外側に向かって、トラックは、絨毛膜絨毛検体、母体血漿中の胎児特異的リード、母体血漿中の母体特異的リード、母体血漿中の胎児リードおよび非胎児リードの組み合わせ、並びに母体血細胞である。第三期 試料(図7B)において、トラックは、妊娠末期胎盤組織、母体血漿中の胎児特異的リード、母体血漿中の母体特異的リード、母体血漿中の胎児リードおよび非胎児リードの組み合わせ、出産後母体血漿並びに母体血細胞(第一期血液試料から得られる)である。第一期および第三期の血漿試料の両方において、胎児メチロームは、非胎児特異的メチロームのメチル化状態よりも、より低メチル化状態であったことが理解できる。   In the first trimester sample (FIG. 7A), from the inside to the outside, the tracks are chorionic villous specimens, fetal-specific leads in maternal plasma, maternal-specific leads in maternal plasma, fetal leads in maternal plasma and A combination of non-fetal leads, as well as maternal blood cells. In the third trimester sample (FIG. 7B), tracks indicate late pregnancy placental tissue, fetal-specific reads in maternal plasma, maternal-specific reads in maternal plasma, fetal and non-fetal leads in maternal plasma, and delivery. Post maternal plasma as well as maternal blood cells (obtained from first stage blood samples). It can be seen that in both the first and third stage plasma samples, the fetal methylome was more hypomethylated than that of the non-fetal specific methylome.

胎児メチロームの全体的なメチル化特性は、CVSまたは胎盤組織検体のメチル化特性とよく似ていた。反対に、主に母体DNAであった血漿中の共有リードのDNAメチル化特性は、母体血細胞のメチル化特性とよく似ていた。次に、母体血漿DNAリードおよび母体組織または胎児組織のメチル化密度の系統的な座位ごとの比較を行った。同一の配列リード上に有益なSNPとして存在し、少なくとも5つの母体血漿DNA配列リードによって被覆された、CpG部位のメチル化密度を決定した。   The overall methylation profile of fetal methylome was very similar to that of CVS or placental tissue specimens. On the contrary, the DNA methylation properties of the shared reads in plasma, which were predominantly maternal DNA, were very similar to those of maternal blood cells. Next, a systematic locus-by-locus comparison of maternal plasma DNA leads and maternal or fetal tissue methylation densities was performed. The methylation density of CpG sites that were present as informative SNPs on the same sequence read and covered by at least 5 maternal plasma DNA sequence reads was determined.

図8A〜図8Dは、有益な一塩基多型を囲んでいるCpG部位についての、母体血漿DNAに対するゲノム組織DNAのメチル化密度の比較のプロットを示している。図8Aは、CVS試料中のリードのメチル化密度と比較した、第一期母体血漿試料中の胎児特異的リードのメチル化密度を示している。図に示すように、胎児特異的リードの値は、CVSリードの値とよく一致している。   8A-8D show a plot of the comparison of methylation densities of genomic tissue DNA to maternal plasma DNA for CpG sites surrounding the informative single nucleotide polymorphism. FIG. 8A shows the methylation density of fetal-specific reads in the first trimester maternal plasma sample compared to the methylation density of reads in the CVS sample. As shown in the figure, the value of the fetus-specific read is in good agreement with the value of the CVS read.

図8Bは、妊娠末期胎盤組織のリードのメチル化密度と比較した、第三期母体血漿試料中の胎児特異的リードのメチル化密度を示している。再度、これら一組の密度はよく一致しているが、このことは、胎児メチル化特性が、胎児特異的対立遺伝子を有するリードを解析することによって得ることが可能であることを示している。   FIG. 8B shows the methylation densities of fetal-specific reads in the third trimester maternal plasma sample compared to the methylation densities of reads for late pregnancy placental tissue. Once again, the densities of these sets are in good agreement, indicating that fetal methylation profiles can be obtained by analyzing reads with fetal-specific alleles.

図8Cは、母体血細胞内のリードのメチル化密度と比較した、第一期母体血漿試料中の共有リードのメチル化密度を示している。共有リードの大部分が母親由来であることを考慮すると、これら2組の値はよく一致している。図8Dは、母体血細胞内のリードのメチル化密度と比較した、第三期母体血漿試料中の共有リードのメチル化密度を示している。   FIG. 8C shows the methylation densities of the shared reads in the first trimester maternal plasma sample compared to the methylation densities of the leads in maternal blood cells. These two sets of values are in good agreement, considering that the majority of the shared reads are of maternal origin. FIG. 8D shows the methylation density of shared leads in the third trimester maternal plasma sample compared to the methylation density of leads in maternal blood cells.

母体血漿中の胎児特異的リードにおいて、第一期母体血漿およびCVS間のスピアマン相関係数は0.705(P<2.2*e−16)であり;第三期母体血漿および妊娠末期胎盤組織間のスピアマン相関係数は0.796(P<2.2*e−16)であった(図8Aおよび図8B)。母体血漿中の共有リードと母体血細胞データについて、同様の比較を行った。第一期血漿試料においてピアソン相関係数は0.653(P<2.2*e−16)であり、第三期血漿試料においてピアソン相関係数は0.638(P<2.2*e−16)であった(図8Cおよび図8D)。   In fetal-specific reads in maternal plasma, the Spearman correlation coefficient between first trimester maternal plasma and CVS is 0.705 (P <2.2 * e-16); third trimester maternal plasma and late pregnancy placenta The Spearman correlation coefficient between tissues was 0.796 (P <2.2 * e-16) (FIGS. 8A and 8B). Similar comparisons were made for maternal plasma shared reads and maternal blood cell data. The Pearson correlation coefficient is 0.653 (P <2.2 * e-16) in the first stage plasma sample, and the Pearson correlation coefficient is 0.638 (P <2.2 * e in the third stage plasma sample. -16) (FIGS. 8C and 8D).

B. 胎児メチローム
一実施形態において、母体血漿から胎児メチロームを構築するため、少なくとも1つの有益な胎児SNP部位を被覆し、同一リード内に少なくとも1つのCpG部位を含有する配列リードを選別した。胎児特異的対立遺伝子を示したリードは、胎児メチロームの構築に含まれた。共有対立遺伝子(すなわち非胎児特異的対立遺伝子)を示したリードは、母体由来DNA分子から主に成る非胎児特異的メチロームの構築に含まれた。
B. Fetal Methylome In one embodiment, at least one informative fetal SNP site was coated and sequence reads containing at least one CpG site within the same read were selected to construct a fetal methylome from maternal plasma. Reads that showed a fetal-specific allele were included in the fetal methylome construction. Reads that showed shared alleles (ie, non-fetal-specific alleles) were included in the construction of non-fetal-specific methylomes that consist primarily of maternally-derived DNA molecules.

第一期母体血漿試料の胎児特異的リードは、常染色体上の218,010のCpG部位を被覆した。第三期および出産後の母体血漿試料の対応する数字は、それぞれ、263,611および74,020であった。平均して、共有リードはそれらのCpG部位をそれぞれ、平均して33.3倍、21.7倍および26.3倍被覆した。第一期、第三期および出産後の母体血漿試料の胎児特異的リードは、それらのCpG部位をそれぞれ3.0倍、4.4倍および1.8倍被覆した。   The fetal-specific reads of the first trimester maternal plasma sample covered the 218,010 CpG sites on the autosomal chromosome. The corresponding numbers for the third trimester and post-natal maternal plasma samples were 263,611 and 74,020, respectively. On average, the shared reads averaged 33.3-fold, 21.7-fold, and 26.3-fold their CpG sites, respectively. Fetal-specific reads of the first, third and post-natal maternal plasma samples covered their CpG sites by 3.0-fold, 4.4-fold and 1.8-fold, respectively.

胎児DNAは母体血漿中では小数の集団であるため、胎児特異的リードによるそれらのCpG部位の被覆率は、該試料の胎児DNA割合に比例した。第一期母体血漿試料において、胎児リード間のメチル化CpGの全体割合は47.0%であり、一方、共有リードのメチル化CpGの全体割合は68.1%であった。第三期母体血漿試料において、胎児リードのメチル化CpGの割合は53.3%であり、一方、共有リードのメチル化CpGの割合は68.8%であった。これらのデータにより、母体血漿中の胎児特異的リードが、母体血漿中の共有リードよりも、より低いメチル化状態であったことが示された。   Since fetal DNA is a minor population in maternal plasma, the coverage of their CpG sites by fetal-specific reads was proportional to the fetal DNA percentage of the sample. In the first trimester maternal plasma sample, the overall percentage of methylated CpG between fetal leads was 47.0%, while the overall percentage of shared lead methylated CpG was 68.1%. In the third trimester maternal plasma sample, the fetal lead had a methylated CpG ratio of 53.3%, while the shared lead had a methylated CpG ratio of 68.8%. These data showed that the fetal-specific reads in maternal plasma had a lower methylation status than the shared reads in maternal plasma.

C. 方法
上記の手法を用いることで、腫瘍メチル化特性を決定することもできる。胎児および腫瘍のメチル化特性を決定する方法を以下に記載する。
C. Method Tumor methylation properties can also be determined using the above procedure. Described below are methods for determining fetal and tumor methylation properties.

図9は、本発明の実施形態に従って、生物の生物試料から第一のメチル化特性を決定するための方法900を示している、フローチャートである。方法900は、母体血漿のメチル化特性から胎児のエピジェネティックマップを構築することができる。生物試料には、第一組織由来および第二組織由来の無細胞DNAの混合物を含む無細胞DNAが含まれる。例として、第一組織は胎児、腫瘍、または移植臓器から得ることができる。   FIG. 9 is a flow chart illustrating a method 900 for determining a first methylation property from a biological sample of an organism, according to an embodiment of the invention. Method 900 can build an epigenetic map of the fetus from the methylation profile of maternal plasma. The biological sample includes cell-free DNA containing a mixture of cell-free DNA from the first tissue and the second tissue. By way of example, the first tissue can be obtained from a fetus, a tumor, or a transplanted organ.

ブロック910において、複数のDNA分子が生物試料から解析される。DNA分子の解析には、生物のゲノム内のDNA分子の位置を決定すること、DNA分子の遺伝子型を決定すること、およびDNA分子が一つまたは複数の部位においてメチル化されているかどうかを決定すること、が含まれ得る。   At block 910, a plurality of DNA molecules are analyzed from the biological sample. Analysis of DNA molecules includes determining the position of the DNA molecule within the genome of the organism, determining the genotype of the DNA molecule, and determining whether the DNA molecule is methylated at one or more sites. Can be included.

一実施形態では、DNA分子は、DNA分子の配列リードを用いて解析され、そこでの配列決定ではメチル化が認識される。従って、配列リードは、生物試料由来のDNA分子メチル化状態を含む。メチル化状態は、特定のシトシン残基が5−メチルシトシンまたは5−ヒロドキシメチルシトシンであるかどうか、を含み得る。配列リードは、種々の配列決定法、PCR法、アレイ、および断片の配列を特定するための他の適切な手法から得ることができる。配列リードの部位のメチル化状態は、本明細書に記載の通りに得ることができる。   In one embodiment, the DNA molecule is analyzed using a sequence read of the DNA molecule, where sequencing determines methylation. Therefore, the sequence reads include DNA molecule methylation status from the biological sample. The methylation status can include whether a particular cytosine residue is 5-methylcytosine or 5-hydroxymethylcytosine. Sequence reads can be obtained from a variety of sequencing methods, PCR methods, arrays, and other suitable techniques for identifying the sequence of fragments. The methylation status at the site of the sequence read can be obtained as described herein.

ブロック920において、第一組織の第一ゲノムがそれぞれの第一対立遺伝子およびそれぞれの第二対立遺伝子についてヘテロ接合性であり、第二組織の第二ゲノムがそれぞれの第一対立遺伝子についてホモ接合性である、複数の第一遺伝子座が特定される。例えば、胎児特異的リードは、複数の第一遺伝子座において特定され得る。あるいは、腫瘍特異的リードは、複数の第一遺伝子座において特定され得る。組織特異的リードは、第二対立遺伝子の配列リードの割合が特定の範囲、例えば、約3%〜25%の範囲に入り、それにより、その座位におけるヘテロ接合性ゲノム由来のDNA断片が小数の集団であり、その座位におけるホモ接合性ゲノム由来のDNA断片が大多数の集団であることが示される、配列決定リードから特定することができる。   At block 920, the first genome of the first tissue is heterozygous for each first allele and each second allele, and the second genome of the second tissue is homozygous for each first allele. , Multiple first loci are identified. For example, fetal-specific reads can be identified at multiple first loci. Alternatively, tumor-specific leads can be identified at multiple first loci. Tissue-specific reads have a percentage of sequence reads of the second allele falling within a particular range, eg, about 3% to 25%, which results in a small number of DNA fragments from the heterozygous genome at that locus. It can be identified from sequencing reads, which are populations and are shown to be the majority population of DNA fragments from the homozygous genome at that locus.

ブロック930において、各第一座位の一つまたは複数の部位に位置するDNA分子が解析される。部位においてメチル化されており、その座位の各第二対立遺伝子に対応するいくつかのDNA分子が決定される。座位あたりに2つ以上の部位が存在し得る。例えば、SNPは、断片が胎児特異的であること、および断片がメチル化状態が決定されている複数の部位を有し得ることを示し得る。メチル化された各部位におけるリードの数を決定することができ、その座位のメチル化リードの総数を決定することができる。   At block 930, DNA molecules located at one or more sites in each first locus are analyzed. Several DNA molecules that are methylated at the site and correspond to each second allele at that locus are determined. There can be more than one site per locus. For example, a SNP may indicate that the fragment is fetal-specific and that the fragment may have multiple sites whose methylation status has been determined. The number of reads at each methylated site can be determined and the total number of methylated reads at that locus can be determined.

座位は、特定の数の部位、特定の一連の部位、または組織特異的対立遺伝子を含む変異の周囲の領域の具体的なのサイズによって定義され得る。座位はただ1つの部位を有し得る。部位は特定の性質を有し得、例えば、CpG部位であり得る。非メチル化されたリードの数の決定は同じであり、メチル化状態の決定に包含される。   A locus can be defined by a specific number of sites, a specific set of sites, or the specific size of the region surrounding a mutation containing a tissue-specific allele. The locus can have only one site. The site may have specific properties, for example a CpG site. The determination of the number of unmethylated reads is the same and is included in the determination of methylation status.

ブロック940において、第一遺伝子座のそれぞれについて、その座位の一つまたは複数の部位においてメチル化され、その座位のそれぞれの第二対立遺伝子に対応するDNA分子の数に基づいて、メチル化密度が算出される。例えば、座位に対応するCpG部位のメチル化密度を決定することができる。   At block 940, for each of the first loci, the methylation density is methylated at one or more sites of the locus, based on the number of DNA molecules corresponding to each second allele of the locus. It is calculated. For example, the methylation density of the CpG site corresponding to the locus can be determined.

ブロック950において、第一組織の第一メチル化特性は、第一遺伝子座のメチル化密度から作成される。第一メチル化特性は、特定の部位、例えば、CpG部位に対応し得る。メチル化特性は、胎児特異的対立遺伝子を有する全ての遺伝子座、またはそれらの遺伝子座のほんのいくつかのものであり得る。   At block 950, the first methylation profile of the first tissue is generated from the methylation density of the first locus. The first methylation property may correspond to a particular site, eg a CpG site. The methylation profile can be all loci with fetal-specific alleles, or just a few of those loci.

IV. 血漿メチロームおよび血液メチロームの差異の使用
上記において、血漿由来の胎児特異的リードが胎盤メチロームと相関することが示された。母体血漿メチロームの母体成分は主に血液細胞によって与えられるため、血漿メチロームおよび血液メチローム間の差異を用いることで、胎児特異的対立遺伝子の位置だけでなく、全ての遺伝子座の胎盤メチロームを決定することができる。血漿メチロームおよび血液メチローム間の差異を用いることで、腫瘍のメチロームを決定することもできる。
IV. Use of the Differences between Plasma and Blood Methylome In the above, it was shown that plasma-derived fetal-specific leads correlate with placental methylome. Because the maternal component of the maternal plasma methylome is mainly provided by blood cells, the differences between plasma and blood methylomes are used to determine the placental methylome of all loci, not just the location of the fetal-specific alleles. be able to. The difference between plasma and blood methylomes can also be used to determine the tumor methylome.

A. 方法
図10は、本発明の実施形態に従って、生物の生物試料から第一メチル化特性を決定する方法1000を示す、フローチャートである。生物試料(例えば、血漿)には、第一組織由来および第二組織由来の無細胞DNAの混合物を含む無細胞DNAが含まれる。第一メチル化特性は、第一組織(例えば、胎児組織または腫瘍組織)のメチル化特性に対応する。方法1200は、母体血漿由来の示差的にメチル化された領域の推論を可能にし得る。
A. Method FIG. 10 is a flow chart illustrating a method 1000 of determining a first methylation profile from a biological sample of an organism, according to an embodiment of the invention. A biological sample (eg, plasma) includes cell-free DNA containing a mixture of cell-free DNA from a first tissue and a second tissue. The first methylation profile corresponds to the methylation profile of the first tissue (eg, fetal or tumor tissue). Method 1200 may allow inference of differentially methylated regions from maternal plasma.

ブロック1010において、生物試料が受け取られる。生物試料は、装置(例えば、配列決定装置)において単純に受け取られ得る。生物試料は、生物から入手された形態であってもよいし、あるいは加工された形態であってもよく、例えば、試料は血液試料から抽出された血漿であってもよい。   At block 1010, a biological sample is received. The biological sample may simply be received at the device (eg, a sequencing device). The biological sample may be in a form obtained from the organism or in a processed form, for example, the sample may be plasma extracted from a blood sample.

ブロック1020において、第二組織のDNAに対応する第二メチル化特性が得られる。第二メチル化特性は、以前に決定されているため、メモリーから読まれ得る。第二メチル化特性は、第二組織(例えば、第二組織の細胞を唯一または主に含有する異なる試料)から決定することができる。第二メチル化特性は、細胞メチル化特性に対応し得、細胞DNAから得ることができる。別の例として、第二特性は、妊娠前に、あるいは、がんを有さない非妊娠者の血漿メチロームは血液細胞のメチロームと非常に似ていることから、がんの発達の前に、採取された血漿試料から決定することができる。   At block 1020, a second methylation profile corresponding to the DNA of the second tissue is obtained. The secondary methylation profile has been previously determined and can be read from memory. The second methylation profile can be determined from a second tissue (eg, a different sample containing only or predominantly cells of the second tissue). The secondary methylation profile can correspond to the cellular methylation profile and can be obtained from cellular DNA. As another example, the second characteristic is that before pregnancy, or because the plasma methylome of a cancer-free non-pregnant person is very similar to that of blood cells, before the development of cancer, It can be determined from the collected plasma sample.

第二メチル化特性は、生物のゲノム内の複数の遺伝子座のそれぞれにおけるメチル化密度を与え得る。特定の座位におけるメチル化密度は、メチル化された第二組織のDNAの割合に対応する。一実施形態では、メチル化密度はCpGメチル化密度であり、そこでは、座位と関連するCpG部位はメチル化密度を決定するために用いられる。座位に1つの部位が存在する場合、メチル化密度はメチル化指数と同じであり得る。メチル化密度および非メチル化密度の値は相補的であることから、メチル化密度は非メチル化密度にも対応する。   The second methylation profile may provide the methylation density at each of multiple loci within the organism's genome. The methylation density at a particular locus corresponds to the percentage of methylated second tissue DNA. In one embodiment, the methylation density is the CpG methylation density, where the CpG site associated with the locus is used to determine the methylation density. If there is one site at the locus, the methylation density can be the same as the methylation index. Since the values of the methylated density and the unmethylated density are complementary, the methylated density also corresponds to the unmethylated density.

一実施形態では、生物の試料由来の細胞DNAのメチル化認識配列決定を行うことにより、第二メチル化特性が得られる。メチル化認識配列決定の一例は、DNAを亜硫酸水素ナトリウムで処理し、次にDNA塩基配列決定法を行うことを含む。別の例では、メチル化認識配列決定は、亜硫酸水素ナトリウムを用いずに、DNA分子のメチル化状態(例えば、N6−メチルアデニン、5−メチルシトシンおよび5−ヒロドキシメチルシトシン)を亜硫酸水素塩変換無しに直接的に解明することを可能にする単一分子配列決定プラットフォームを用いて(AB Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389);または、メチル化シトシンの免疫沈降(例えば、メチルシトシンに対する抗体を用いることによる、またはメチル化されたDNA結合タンパク質もしくはペプチドを用いることによる)(LG Acevedo et al. 2011 Epigenomics; 3: 93-101)、その後の配列決定によって;または、メチル化感受性制限酵素の使用、その後の配列決定によって、行うことができる。別の実施形態では、アレイ、デジタルPCRおよび質量分析等の、非配列決定法が用いられる。   In one embodiment, methylation recognition sequencing of cellular DNA from a sample of the organism is performed to obtain a second methylation profile. One example of methylation recognition sequencing involves treating the DNA with sodium bisulfite followed by DNA sequencing. In another example, methylation recognition sequencing determines the methylation status of DNA molecules (eg, N6-methyladenine, 5-methylcytosine and 5-hydroxymethylcytosine) without the use of sodium bisulfite. Using a single molecule sequencing platform that allows direct elucidation without salt conversion (AB Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3: 1389. doi: 10.1038 / srep01389); or immunoprecipitation of methylated cytosine (eg, by using an antibody against methylcytosine or by using a methylated DNA binding protein or peptide) (LG Acevedo et al. 2011 Epigenomics; 3: 93-101), followed by sequencing; or by the use of methylation sensitive restriction enzymes followed by sequencing. In another embodiment, non-sequencing methods such as arrays, digital PCR and mass spectrometry are used.

別の実施形態では、第二組織の第二メチル化密度は、対象の対照試料から、または他の対象から、予め得ることができる。別の対象からのメチル化密度は、参照メチル化密度を有する参照メチル化特性として役立ち得る。参照メチル化密度は、複数の試料から決定することができ、そこでは、座位における異なるメチル化密度の平均レベル(または他の統計値)がその座位における参照メチル化密度として用いられ得る。   In another embodiment, the second tissue methylation density can be previously obtained from a control sample of the subject, or from another subject. A methylation density from another subject can serve as a reference methylation property with a reference methylation density. The reference methylation density can be determined from multiple samples, where the average level of different methylation densities at a locus (or other statistic) can be used as the reference methylation density at that locus.

ブロック1030において、混合物の無細胞DNAから無細胞メチル化特性が決定される。無細胞メチル化特性は、複数個の遺伝子座のそれぞれにおけるメチル化密度を与える。無細胞メチル化特性は、無細胞DNAの配列決定から配列リードを得て、該配列リードを用いてメチル化情報を得ることにより、決定することができる。無細胞メチル化特性は、細胞メチロームと同様に決定することができる。   At block 1030, cell-free methylation properties are determined from the cell-free DNA of the mixture. The cell-free methylation profile gives the methylation density at each of the multiple loci. Cell-free methylation properties can be determined by obtaining sequence reads from sequencing cell-free DNA and using the sequence reads to obtain methylation information. Cell-free methylation properties can be determined similar to cell methylome.

ブロック1040において、生物試料内の第一組織由来の無細胞DNAの割合が決定される。一実施形態では、第一組織は胎児組織であり、対応するDNAは胎児DNAである。別の実施形態では、第一組織は腫瘍組織であり、対応するDNAは腫瘍DNAである。割合は、様々な方法で、例えば、胎児特異的対立遺伝子または腫瘍特異的対立遺伝子を用いて、決定することができる。コピー数を用いることで、例えば、3013年3月13日に出願された、「Mutational Analysis Of Plasma DNA For Cancer Detection」という題名の米国特許出願公開第13/801,748号(参照によって組み込まれる)に記載されるように、割合を決定することもできる。   At block 1040, the percentage of cell-free DNA from the first tissue in the biological sample is determined. In one embodiment, the first tissue is fetal tissue and the corresponding DNA is fetal DNA. In another embodiment, the first tissue is tumor tissue and the corresponding DNA is tumor DNA. The ratio can be determined in various ways, for example using a fetal-specific or tumor-specific allele. By using copy number, for example, US Patent Application Publication No. 13 / 801,748, filed March 13, 3013, entitled "Mutational Analysis Of Plasma DNA For Cancer Detection," incorporated by reference. Percentages can also be determined as described in.

ブロック1050において、第一メチロームを決定するための複数の遺伝子座が特定される。これらの遺伝子座は、無細胞メチル化特性および第二メチル化特性を決定するために用いられる各遺伝子座に対応し得る。従って、複数個の遺伝子座は一致し得る。無細胞メチル化特性および第二メチル化特性を決定するためにより多くの遺伝子座を用いることができる可能性がある。   At block 1050, a plurality of loci for determining the first methylome are identified. These loci may correspond to each locus used to determine cell-free and secondary methylation properties. Therefore, multiple loci can be matched. It is possible that more loci can be used to determine cell-free and secondary methylation properties.

いくつかの実施形態において、第二メチル化特性において高度メチル化または低メチル化された遺伝子座は、例えば、母体血細胞を用いて特定することができる。母体血細胞において高度メチル化された遺伝子座を特定するために、X%以上(例えば、80%)のメチル化指数を有するCpG部位が染色体の片端から走査され得る。次に、下流領域内(例えば、200bpの下流内)の次のCpG部位が探索され得る。すぐ下流のCpG部位がX%以上(または他の特定の量)のメチル化指数を有していた場合、第一CpG部位および第二CpG部位はグループ化され得る。次の下流領域内に他のCpG部位が存在しなくなるまで;またはすぐ下流のCpG部位がX%未満のメチル化指数を有するまで、グループ化は継続され得る。グループ化されたCpG部位の領域は、領域が少なくとも5つの直接隣接した高度メチル化CpG部位を含有している場合に、母体血細胞において高度メチル化されていると報告され得る。同様の解析を行うことで、20%以下のメチル化指数を有すするCpG部位について、母体血細胞において低メチル化状態の遺伝子座を探索することができる。第二メチル化特性のメチル化密度は、短く収載された(short-listed)遺伝子座について算出することができ、対応する遺伝子座の第一メチル化特性(例えば、胎盤組織メチル化密度)を、例えば、母体血漿亜硫酸水素塩配列決定データから、推定するのに用いることができる。   In some embodiments, hypermethylated or hypomethylated loci in the secondary methylation profile can be identified using, for example, maternal blood cells. CpG sites with a methylation index greater than or equal to X% (eg, 80%) can be scanned from one end of the chromosome to identify loci that are hypermethylated in maternal blood cells. Next, the next CpG site within the downstream region (eg, within 200 bp downstream) can be searched. The first CpG site and the second CpG site may be grouped if the immediately downstream CpG site had a methylation index greater than or equal to X% (or other specified amount). Grouping can be continued until no other CpG sites are present in the next downstream region; or immediately downstream CpG sites have a methylation index of less than X%. Regions of grouped CpG sites can be reported as hypermethylated in maternal blood cells if the region contains at least 5 immediately adjacent hypermethylated CpG sites. By performing the same analysis, a locus in a hypomethylated state can be searched for in a maternal blood cell for a CpG site having a methylation index of 20% or less. The methylation density of the second methylation property can be calculated for short-listed loci, and the first methylation property of the corresponding locus (eg placental tissue methylation density) can be calculated as For example, it can be used to extrapolate from maternal plasma bisulfite sequencing data.

ブロック1060において、第一組織の第一メチル化特性は、複数個の遺伝子座のそれぞれについて第二メチル化特性のメチル化密度および無細胞メチル化特性のメチル化密度間の差異を含む示差パラメーターを算出することによって、決定される。差異は割合に応じて決定される。   At block 1060, the first methylation profile of the first tissue has a differential parameter including a difference between a methylation density of the second methylation profile and a methylation density of the cell-free methylation profile for each of the plurality of loci. It is determined by calculating. Differences are determined as a percentage.

一実施形態では、第一(例えば、胎盤)組織における座位の第一メチル化密度(D)は、下記式を用いて推定され、   In one embodiment, the first methylation density (D) of the locus in the first (eg, placenta) tissue is estimated using the formula:

式中、mbcは、座位(例えば、母体血細胞の亜硫酸水素塩配列決定データにおいて決定される短く収載された座位)における第二メチル化特性のメチル化密度を示し;mpは、母体血漿の亜硫酸水素塩配列決定データにおける対応する座位のメチル化密度を示し;fは、第一組織由来の無細胞DNAの割合(例えば、胎児DNA濃度分率)を示し、CNは、座位におけるコピー数(例えば、正常と比較した場合の、より高い増幅値またはより少ない欠失数)を示す。第一組織に増幅も欠失も存在しない場合、CNは1つであり得る。トリソミー(すなわち、腫瘍または胎児における領域の重複)において、CNは1.5であり(増加は2コピーから3コピーであるため)、モノソミーは0.5を有する。より高度な増幅は、0.5の値ずつ増加し得る。この例において、Dは示差パラメーターに対応し得る。 Where mbc is the methylation density of the second methylation profile at the locus (eg, the shortly listed locus determined in maternal blood cell bisulfite sequencing data); mp is maternal plasma bisulfite Denotes the methylation density of the corresponding loci in the salt sequencing data; f is the percentage of cell-free DNA from the first tissue (eg fetal DNA concentration fraction), CN is the copy number at the locus (eg, Higher amplification value or lower number of deletions) compared to normal. The CN may be one if there is no amplification or deletion in the first tissue. In trisomy (ie duplication of regions in the tumor or fetus), the CN is 1.5 (because the increase is 2 to 3 copies) and the monosomy has 0.5. Higher amplification can be increased by a value of 0.5. In this example, D may correspond to the differential parameter.

ブロック1070において、第一組織の補正第一メチル化密度を得るために、第一メチル化密度が変換される。変換は、示差パラメーターおよび第一組織の実際のメチル化特性間の固定された差異を与え得る。例えば、前記値は、固定された定数ずつ、または勾配ずつ、異なり得る。変換は線形または非線形であり得る。   At block 1070, the first methylation density is transformed to obtain a corrected first methylation density of the first tissue. The transformation may give a fixed difference between the differential parameters and the actual methylation properties of the first tissue. For example, the values can differ by a fixed constant or by a slope. The transformation can be linear or non-linear.

一実施形態では、推定値Dの分布は、胎盤組織の実際のメチル化レベルよりも低いことが分かった。例えば、推定値は、CpG部位が過剰出現したゲノム分節であるCG島から得られたデータを用いて線形に変換され得る。本研究で用いられるCG島のゲノム位置は、UCSC Genome Browserデータベース(NCBI build 36/hg18)から得られた(PA Fujita et al. 2011 Nucleic Acids Res; 39: D876-882)。例えば、CG島は、50%以上のGC含量、200bp超のゲノム長および0.6超の測定/予測CpG数比を有するゲノム分節として定義され得る(M Gardiner-Garden et al 1987 J Mol Biol; 196: 261-282)。   In one embodiment, the distribution of estimates D was found to be lower than the actual methylation level of placental tissue. For example, the estimates can be linearly transformed using data obtained from CG islands, which are genomic segments in which CpG sites are over-represented. The genomic location of CG islands used in this study was obtained from the UCSC Genome Browser database (NCBI build 36 / hg18) (PA Fujita et al. 2011 Nucleic Acids Res; 39: D876-882). For example, a CG island can be defined as a genomic segment with a GC content of 50% or greater, a genome length of greater than 200 bp and a measured / predicted CpG number ratio of greater than 0.6 (M Gardiner-Garden et al 1987 J Mol Biol; 196: 261-282).

ある実施において、線形変換式を得るために、少なくとも4つのCpG部位および配列決定された試料内のCpG部位あたり5以上の平均読み深度を有するCG島が含まれ得る。CVSまたは妊娠末期胎盤におけるCG島のメチル化密度および推定値Dの間の直線関係を決定した後、下記式を用いて予測値を決定した:
第一期予測値=D×1.6+0.2
第三期予測値=D×1.2+0.05
In some implementations, at least 4 CpG sites and CG islands with an average reading depth of 5 or more per CpG site in the sequenced sample may be included to obtain a linear transformation. After determining the linear relationship between the methylation density of CG islands in CVS or late placenta and the estimated value D, the predicted value was determined using the following formula:
First-term forecast = D x 1.6 + 0.2
Third-term forecast = D x 1.2 + 0.05

B. 胎児の例
上記のように、方法1000を用いることで、母体血漿から胎盤のメチル化状況を推定することができる。血漿中の循環DNAは、主に造血細胞に由来する。なお、未知の他の内部臓器から与えられる無細胞DNAの割合は未知である。さらに、胎盤由来無細胞DNAは、母体血漿中の全DNAのおよそ5〜40%を占め、平均値はおよそ15%である。従って、母体血漿中のメチル化レベルは、上記のように、既存のバックグラウンドのメチル化+妊娠中の胎盤の寄与に等しいと仮定することができる。
B. Fetal Example As described above, method 1000 can be used to estimate placental methylation status from maternal plasma. Circulating DNA in plasma is mainly derived from hematopoietic cells. Note that the proportion of cell-free DNA given by another unknown internal organ is unknown. Furthermore, placenta-derived cell-free DNA accounts for approximately 5-40% of the total DNA in maternal plasma, with an average value of approximately 15%. Therefore, it can be assumed that the methylation level in maternal plasma is equal to the existing background methylation + placental contribution during pregnancy, as described above.

母体血漿メチル化レベルMPは、下記式を用いて決定することができ、   Maternal plasma methylation level MP can be determined using the formula:

式中、BKGは血液細胞および内部臓器から得られる血漿中のバックグラウンドのDNAメチル化レベルであり、PLNは胎盤のメチル化レベルであり、fは母体血漿中の胎児DNA濃度分率である。 Where BKG is the background DNA methylation level in plasma obtained from blood cells and internal organs, PLN is the placenta methylation level, and f is the fetal DNA concentration fraction in maternal plasma.

一実施形態では、胎盤のメチル化レベルは下記式によって理論上は推定することができる。   In one embodiment, placental methylation levels can be theoretically estimated by the formula:

式(1)および式(2)は、CNが1に等しく、DがPLNに等しく、BKGがmbcに等しい場合に、等しい。別の実施形態では、胎児DNA濃度分率は、特定の値に仮定または設定することができる(例えば、最小値fが存在するという仮定の一環として)。 Equations (1) and (2) are equal if CN equals 1, D equals PLN and BKG equals mbc. In another embodiment, the fetal DNA concentration fraction can be hypothesized or set to a particular value (eg, as part of the hypothesis that a minimum value f exists).

母体血のメチル化レベルは、母体血漿のバックグラウンドメチル化を表すものと見なした。母体血細胞において高度メチル化または低メチル化された遺伝子座に加えて、臨床的関連性を有する定義された領域、例えば、ヒトゲノム内のCG島に焦点を当てることにより、推定アプローチをさらに求めた。   Maternal blood methylation levels were considered to represent background methylation of maternal plasma. The putative approach was further sought by focusing on defined regions with clinical relevance, such as CG islands in the human genome, in addition to hypermethylated or hypomethylated loci in maternal blood cells.

常染色体およびX染色体上の合計27,458のCG島(NCBI Build36/hg18)の平均メチル化密度を、母体血漿および胎盤の配列決定データから得た。胎盤、母体血および母体血漿を含む全ての分析試料における、10以上の被覆CpG部位および被覆CpG部位あたり5以上の平均読み深度を有するCG島のみを選別した。結果として、26,698のCG島(97.2%)が妥当なものとして残り、それらのメチル化レベルを、上記式に従って、血漿メチル化データおよび胎児DNA濃度分率を用いて推定した。   Mean methylation densities of a total of 27,458 CG islands (NCBI Build36 / hg18) on the autosomal and X chromosomes were obtained from maternal plasma and placental sequencing data. Only CG islands with 10 or more coated CpG sites and an average reading depth of 5 or more per coated CpG site were selected in all analytical samples including placenta, maternal blood and maternal plasma. As a result, 26,698 CG islands (97.2%) remained valid and their methylation levels were estimated using plasma methylation data and fetal DNA concentration fractions according to the above equation.

推定PLN値の分布が胎盤組織におけるCG島の実際のメチル化レベルよりも低かったことが注目された。従って、一実施形態では、推定PLN値、または単に推定値(D)は、胎盤におけるCG島のメチル化レベルを推定するための、任意の単位として用いられた。変換後、線形的に推定された値およびそれらの分布は、実際のデータセットにより類似したものとなった。変換した推定値はメチル化予測値(methylation predictive value:MPV)と命名され、その後、胎盤における遺伝子座のメチル化レベルを予測するために用いられた。   It was noted that the distribution of estimated PLN values was lower than the actual methylation level of CG islands in placental tissue. Thus, in one embodiment, the estimated PLN value, or simply the estimated value (D), was used as an arbitrary unit to estimate the methylation level of CG islands in the placenta. After transformation, the linearly estimated values and their distributions were more similar to the actual dataset. The transformed estimate was named the methylation predictive value (MPV) and was then used to predict the methylation level of the locus in the placenta.

この例において、CG島は、胎盤におけるそれらのメチル化密度に基づいて3つのカテゴリーに分類された:低(0.4以下)、中(0.4超〜0.8未満)および高(0.8以上)。推定式を用いて、同じ一連のCG島のMPVを算出し、次に、その値を用いて、CG島を同一のカットオフで3つのカテゴリーに分類した。実際のデータセットおよび推定データセットを比較することにより、短く収載されたCG島の75.1%が、それらのMPVによる組織データにおける同一のカテゴリーに正確に一致し得ることが分かった。CG島の約22%が1レベルの差異(高対中、または中対低)を有するグループに割り当てられ、3%未満が完全に誤って分類された(高対低)図12A)。また、全体的な分類性能が決定された:胎盤において0.4以上、0.4超〜0.8未満および0.8以上のメチル化密度を有する86.1%、31.4%および68.8%のCG島は、「低」、「中」および「高」と正確に推定された(図12B)。   In this example, CG islands were classified into three categories based on their methylation densities in the placenta: low (less than 0.4), medium (greater than 0.4 to less than 0.8) and high (0). .8 or more). The estimation formula was used to calculate the MPV of the same series of CG islands, and then the values were used to classify the CG islands into three categories with the same cutoff. By comparing the actual and estimated datasets, it was found that 75.1% of the shortly listed CG islands could exactly match the same category in their MPV-tissue data. Approximately 22% of CG islands were assigned to groups with one level of difference (high vs. medium or medium vs. low), and less than 3% were completely misclassified (high vs. low) (Figure 12A). Also, the overall classification performance was determined: 86.1%, 31.4% and 68 with methylation densities greater than 0.4, greater than 0.4 and less than 0.8 and greater than 0.8 in placenta. CG islands of 0.8% were accurately estimated as "low", "medium" and "high" (Fig. 12B).

図11Aおよび図11Bは、本発明の実施形態による、母体血漿データおよび胎児DNA濃度分率を用いた予測アルゴリズムの実行のグラフを示している。図11Aは、MPV補正分類(推定カテゴリーは実際のデータセットと正確に一致);1レベルの差異(推定カテゴリーは実際のデータセットから1レベル異なる);誤分類(推定カテゴリーは実際のデータセットと反対)を用いた、CG島分類の正確さを示すグラフ1100である。図11Bは、各推定カテゴリーに分類されたCG島の割合を示すグラフ1150である。   11A and 11B show graphs of performing a prediction algorithm using maternal plasma data and fetal DNA concentration fractions, according to embodiments of the invention. FIG. 11A shows MPV corrected classification (estimated category exactly matches the actual dataset); one level difference (estimated category differs from the actual dataset by one level); misclassification (estimated category differs from the actual dataset). 1 is a graph 1100 showing the accuracy of CG island classification using (opposite). FIG. 11B is a graph 1150 showing the percentage of CG islands classified into each estimation category.

母体バックグラウンドメチル化がそれぞれのゲノム領域において低度であるならば、循環血液中の高度メチル化胎盤由来DNAの存在は、全体的な血漿メチル化レベルを胎児DNA濃度分率に応じた程度まで増加させる。放出される胎児DNAが十分にメチル化されている場合、顕著な変化が観察され得る。反対に、母体バックグラウンドメチル化が高度である場合、血漿メチル化レベルにおける変化の程度は、低メチル化胎児DNAが放出された場合により有意になる。従って、推定スキームは、メチル化レベルが母体バックグラウンドおよび胎盤間で異なることが知られている遺伝子座について、特に、高度メチル化された遺伝子座および胎盤における低メチル化マーカーについて推定される場合に、より実際的になり得る。   If maternal background methylation is low in each genomic region, the presence of highly methylated placenta-derived DNA in the circulating blood increases the overall plasma methylation level to a degree dependent on the fetal DNA concentration fraction. increase. Significant changes can be observed if the fetal DNA released is fully methylated. Conversely, when maternal background methylation is high, the degree of change in plasma methylation levels becomes more significant when hypomethylated fetal DNA is released. Therefore, the estimation scheme is designed for loci whose methylation levels are known to differ between maternal background and placenta, especially for hypermethylated loci and hypomethylation markers in placenta. , Can be more practical.

図12Aは、本発明の実施形態に従った、メチル化予測のための、15の選択されたゲノム遺伝子座の詳細を示す、表1200である。手法を確認するために、先に研究されている、15の示差的にメチル化されたゲノム遺伝子座を選択した。選択された領域のメチル化レベルを推定し、先に研究された15の示差的にメチル化された遺伝子座と比較した(RWK Chiu et al. 2007 Am J Pathol; 170: 941-950; S.S.C. Chim et al. 2008 Clin Chem; 54: 500-511; SSC Chim et al. 2005 Proc Natl Acad Sci U S A; 102: 14753-14758; DWY Tsui et al. 2010 PLoS One; 5: e15069)。   FIG. 12A is a table 1200 showing details of 15 selected genomic loci for methylation prediction, according to an embodiment of the invention. To confirm the approach, 15 previously studied differentially methylated genomic loci were selected. Methylation levels in selected regions were estimated and compared to the 15 previously studied differentially methylated loci (RWK Chiu et al. 2007 Am J Pathol; 170: 941-950; SSC Chim. et al. 2008 Clin Chem; 54: 500-511; SSC Chim et al. 2005 Proc Natl Acad Sci USA; 102: 14753-14758; DWY Tsui et al. 2010 PLoS One; 5: e15069).

図12Bは、15の選択されたゲノム遺伝子座および胎盤におけるそれらの対応するメチル化レベルの推定カテゴリーを示すグラフ1250である。推定されたメチル化カテゴリーは、低、0.4以下;中、0.4超〜0.8未満;高、0.8以上である。表1200およびグラフ1300は、胎盤におけるそれらのメチル化レベルが、いくつかの例外(RASSF1A、CGI009、CGI137およびVAPA)を有して、正確に推定され得ることを示している。これらの4つのマーカーのうち、CGI009のみが、実際のデータセットとの顕著な矛盾を示した。その他はわずかに誤分類されたのみである。   FIG. 12B is a graph 1250 showing estimated categories of 15 selected genomic loci and their corresponding methylation levels in placenta. The estimated methylation categories are low, 0.4 or less; medium, greater than 0.4 and less than 0.8; high, 0.8 or more. Table 1200 and graph 1300 show that their methylation levels in placenta can be accurately estimated with some exceptions (RASSF1A, CGI009, CGI137 and VAPA). Of these four markers, only CGI009 showed a significant discrepancy with the actual data set. Others were only slightly misclassified.

表1200において、「1」は、下記式によって算出される推定値(D)を指し、   In Table 1200, “1” indicates an estimated value (D) calculated by the following formula,

式中、fは胎児DNA濃度分率である。標識「2」は、式:MPV=D×1.6+0.25を用いる、線形変換された推定値を指している、メチル化予測値(MPV)を指す。標識「3」は、推定値に対する分類カットオフ(classification cutoff)を指す:低、0.4以下;中、0.4超〜0.8未満;高、0.8以上。標識「4」は、実際の胎盤データセットに対する分類カットオフを指す:低、0.4以下;中、0.4超〜0.8未満;高、0.8以上。標識「5」は、胎盤状態が母体血細胞のメチル化状態と比較した胎盤のメチル化状態を指すことを表している。 In the formula, f is the fetal DNA concentration fraction. The label "2" refers to the predicted methylation value (MPV), which refers to the linearly transformed estimate using the formula: MPV = D × 1.6 + 0.25. The label "3" refers to the classification cutoff for the estimate: low, 0.4 or less; medium,> 0.4 to <0.8; high, 0.8 or more. Label "4" refers to the classification cutoff for the actual placenta data set: low, 0.4 or less; medium, greater than 0.4 and less than 0.8; high, 0.8 or greater. The label "5" indicates that the placental status refers to the methylation status of the placenta compared to the methylation status of maternal blood cells.

C. 胎児DNAの濃度分率の算出
一実施形態では、第一組織由来の胎児DNAの割合は、男児胎児のY染色体を用いることができる。母体血漿試料中のY染色体配列の割合(Y染色体率)は、男児胎児由来のY染色体リードおよびY染色体に誤整列した母体(女性)リードの数の混成であった(RWK Chiu et al. 2011 BMJ; 342: c7401)。従って、試料中のY染色体率および胎児DNA濃度分率(f)間の関連性は、以下で与えられ得、
C. Calculation of Fetal DNA Concentration Fraction In one embodiment, the proportion of fetal DNA derived from the first tissue can be the Y chromosome of the male fetus. The proportion of Y-chromosome sequences in maternal plasma samples (Y-chromosome rate) was a hybrid of the number of Y-chromosome leads from boy fetuses and maternal (female) reads misaligned with the Y chromosome (RWK Chiu et al. 2011). BMJ; 342: c7401). Therefore, the relationship between the Y chromosome rate in the sample and the fetal DNA concentration fraction (f) can be given by:

式中、%chrYmale(Y染色体率(男性))は、100%の男性DNAを含有する血漿試料中のY染色体に整列したリードの割合を指し;%chrYfemale(Y染色体率(女性))は、100%の女性DNAを含有する血漿試料中のY染色体に整列したリードの割合を指す。 In the formula,% chrY male (Y chromosome rate (male)) refers to the percentage of reads aligned with the Y chromosome in a plasma sample containing 100% male DNA;% chrY female (Y chromosome rate (female)). Refers to the percentage of reads aligned to the Y chromosome in a plasma sample containing 100% female DNA.

Y染色体率は、男児胎児を妊娠した女性から得られた試料のミスマッチを有さずにY染色体に整列したリードから決定することができ、例えば、該リードは亜硫酸水素塩によって変換された試料から得られるものである。%chrYmale値は、2つの成人男性血漿試料の亜硫酸水素塩配列決定から得ることができる。%chrYfemale値は、2つの非妊娠成人女性血漿試料の亜硫酸水素塩配列決定から得ることができる。 Y-chromosome percentage can be determined from reads aligned to the Y-chromosome without mismatches in samples obtained from women who were pregnant with male fetuses, eg, the reads from samples converted by bisulfite. Is what you get. The% chrY male value can be obtained from bisulfite sequencing of two adult male plasma samples. The% chrY female value can be obtained from bisulfite sequencing of two non-pregnant adult female plasma samples.

他の実施形態では、胎児DNA率は、常染色体上の胎児特異的対立遺伝子から決定することができる。別の例として、エピジェネティックマーカーを用いて、胎児DNA率を決定してもよい。胎児DNA率を決定する他の方法を用いてもよい。   In another embodiment, fetal DNA rates can be determined from autosomal fetal-specific alleles. As another example, epigenetic markers may be used to determine fetal DNA rates. Other methods of determining fetal DNA rate may be used.

D. メチル化を用いてコピー数を決定する方法
胎盤ゲノムは母体ゲノムよりもより低メチル化状態である。前述の通り、妊娠女性の血漿のメチル化は、母体血漿中の胎盤由来胎児DNAの濃度分率に依存する。従って、染色体領域のメチル化密度の解析を通じて、胎児組織の母体血漿への寄与における差異を検出することが可能である。例えば、トリソミー胎児(例えば、トリソミー21またはトリソミー18またはトリソミー13を抱える胎児)を身籠っている妊娠女性において、胎児は、二染色体性染色体と比較した場合に、三染色体性染色体から母体血漿にさらなる量のDNAを与える。この状況において、三染色体性染色体(または増幅を有するあらゆる染色体領域)の血漿メチル化密度は、二染色体性染色体のそれよりもより低くなる。差異の程度は、血漿試料中の胎児DNA濃度分率を考慮することにより、数学的計算によって予測することができる。血漿試料中の胎児DNA濃度分率が高くなるほどに三染色体性染色体および二染色体性染色体間のメチル化密度における差異はより大きなものになる。欠失を有する領域については、メチル化密度はより高くなる。
D. Methods for determining copy number using methylation The placental genome is more hypomethylated than the maternal genome. As mentioned above, the methylation of plasma in pregnant women depends on the concentration fraction of placental-derived fetal DNA in maternal plasma. Therefore, it is possible to detect differences in the contribution of fetal tissue to maternal plasma through analysis of the methylation density of chromosomal regions. For example, in a pregnant woman harboring a trisomy fetus (eg, a fetus carrying trisomy 21 or trisomy 18 or trisomy 13), the fetus is further transferred from the trisomic chromosome to maternal plasma when compared to the disomal chromosome. Give a quantity of DNA. In this situation, the plasma methylation density of trisomic chromosomes (or any chromosomal region with amplification) will be lower than that of disomic chromosomes. The degree of difference can be predicted by mathematical calculations by taking into account the fetal DNA concentration fraction in the plasma sample. The higher the fetal DNA concentration fraction in the plasma sample, the greater the difference in the methylation density between the trisomic and disomic chromosomes. For regions with deletions, the methylation density will be higher.

欠失の1例は、女性胎児が1コピーのX染色体しか有さない場合のターナー症候群である。この状況では、ターナー症候群を抱える胎児を身籠る妊娠女性においては、血漿DNA中のX染色体のメチル化密度は、正常な数のX染色体を有する女性胎児を身籠る同じ妊娠女性の状況よりも高くなる。この戦略の一実施形態では、Y染色体配列の存在または不在について、母体血漿が最初に解析され得る(例えば、MPSまたはPCRに基づく手法を用いて)。Y染色体配列が存在する場合、胎児は男性に分類され得、その後の解析は必要ではない。一方、Y染色体配列が母体血漿中に存在しない場合、胎児は女性に分類され得る。この状況では、母体血漿中のX染色体のメチル化密度が次に解析され得る。正常よりも高いX染色体メチル化密度は、胎児がターナー症候群を有するリスクが高いことを示す。このアプローチは、その他の性染色体異数性にも応用することができる。例えば、XYYを有する胎児において、母体血漿中のY染色体のメチル化密度は、母体血漿中に同様のレベルの胎児DNAを有する正常なXY胎児のそれよりも低くなる。別の例として、クラインフェルター症候群(XXY)を抱える胎児においては、Y染色体配列は母体血漿中に存在するが、母体血漿中のX染色体のメチル化密度は、母体血漿中に同様のレベルの胎児DNAを有する正常なXY胎児のそれよりも低くなる。   One example of a deletion is Turner's syndrome when a female fetus has only one copy of the X chromosome. In this situation, in pregnant women carrying a fetus with Turner syndrome, the methylation density of the X chromosome in plasma DNA is higher than in the same pregnant woman carrying a female fetus with a normal number of X chromosomes. Become. In one embodiment of this strategy, maternal plasma may first be analyzed for the presence or absence of Y chromosome sequences (eg, using MPS or PCR based techniques). If the Y chromosome sequence is present, the fetus can be classified as male and subsequent analysis is not necessary. On the other hand, if the Y chromosome sequence is not present in maternal plasma, the fetus can be classified as female. In this situation, the methylation density of the X chromosome in maternal plasma can then be analyzed. A higher than normal X chromosome methylation density indicates that the fetus is at increased risk of having Turner syndrome. This approach can be applied to other sex chromosome aneuploidies. For example, in a fetus with XYY, the methylation density of the Y chromosome in maternal plasma will be lower than that in a normal XY fetus with similar levels of fetal DNA in maternal plasma. As another example, in a fetus with Kleinfelter's syndrome (XXY), the Y-chromosome sequences are present in maternal plasma, but the methylation density of the X-chromosome in maternal plasma shows similar levels in fetuses in maternal plasma. It will be lower than that of a normal XY fetus with DNA.

先の考察から、二染色体性染色体の血漿メチル化密度(MPNon-aneu(非異数))は、 From the above consideration, the plasma methylation density (MP Non-aneu ) of the disomic chromosome is

として算出することができ、式中、BKGは血液細胞および内部臓器由来の血漿中のバックグラウンドDNAメチル化レベルであり、PLNは胎盤のメチル化レベルであり、fは母体血漿中の胎児DNA濃度分率である。 Where BKG is the background DNA methylation level in plasma from blood cells and internal organs, PLN is the placenta methylation level, and f is the fetal DNA concentration in maternal plasma. It is a fraction.

三染色体性染色体の血漿メチル化密度(MPAneu(異数))は、 Plasma methylation density of trisomic chromosomes (MP Aneu ( unequal number )) is

として算出することができ、式中、1.5はコピー数CNに対応し、もう1つの染色体の追加は50%の増加となる。三染色体性染色体および二染色体性染色体間の差異(MPDiff)は、以下となる。 Where 1.5 corresponds to the copy number CN and the addition of another chromosome results in a 50% increase. The difference between the trisomic and disomy chromosomes (MP Diff ) is:

一実施形態では、潜在的に異数体の染色体(または染色体領域)のメチル化密度の、一つまたは複数の他の推定非異数体染色体またはゲノムの全体のメチル化密度に対する比較は、血漿試料中の胎児DNA濃度を効率的に正規化するために使用することができる。前記比較は、正規化されたメチル化密度を得るための、それら2つの領域のメチル化密度の間のパラメーター(例えば、比または差異を含む)の算出によるものであり得る。前記比較は、得られるメチル化レベルの依存(例えば、それら2つのメチル化密度からパラメーターとして決定される)を排除することができる。   In one embodiment, comparing the methylation density of potentially aneuploid chromosomes (or chromosomal regions) to the overall methylation density of one or more other putative non-aneuploid chromosomes or genomes is It can be used to efficiently normalize fetal DNA concentration in a sample. The comparison may be by calculating a parameter (eg, including a ratio or difference) between the methylation densities of the two regions to obtain a normalized methylation density. The comparison can eliminate the resulting dependence of methylation levels (eg, determined as a parameter from the two methylation densities).

潜在的に異数体の染色体のメチル化密度が一つもしくは複数の他の染色体のメチル化密度、または胎児DNAの濃度分率を反映する他のパラメーターに対して正規化されていない場合、濃度分率は血漿中のメチル化密度に影響を与える主な要因となる。例えば、10%の胎児DNA濃度分率を有するトリソミー21胎児を身籠る妊娠女性の21番染色体の血漿メチル化密度は、正倍数体胎児を身籠る妊娠女性のそれと同じであり、胎児DNA濃度分率は15%であるが、正規化されたメチル化密度は差異を示す。   If the methylation density of a potentially aneuploid chromosome is not normalized to the methylation density of one or more other chromosomes, or other parameters that reflect the concentration fraction of fetal DNA, the concentration Fraction is the main factor affecting the methylation density in plasma. For example, the plasma methylation density of chromosome 21 of a pregnant woman who carries a trisomy 21 fetus having a fetal DNA concentration fraction of 10% is the same as that of a pregnant woman who carries an euploid fetus. The rate is 15%, but the normalized methylation densities show differences.

別の実施形態では、潜在的に異数体の染色体のメチル化密度は、胎児DNA濃度分率に対して正規化され得る。
例えば、下記式は、メチル化密度を正規化するために適用することができ、
In another embodiment, the methylation density of potentially aneuploid chromosomes can be normalized to the fetal DNA concentration fraction.
For example, the following equation can be applied to normalize the methylation density,

式中、MPNormalized(正規化)は血漿中の胎児DNA濃度分率を用いて正規化されたメチル化密度であり、MPnon-normalized(非正規化)は測定メチル化密度であり、BKGは母体血細胞または組織から得られるバックグラウンドメチル化密度であり、PLNは胎盤組織におけるメチル化密度であり、fは胎児DNA濃度分率である。BKGおよびPLNのメチル化密度は、正常妊娠女性から得られた母体血細胞および胎盤組織から先に確立された基準値に基づき得る。様々な遺伝学およびエピジェネティクスの手法を用いることで、例えば、非亜硫酸水素塩変換DNAに対する大規模並列配列決定またはPCRを用いた、Y染色体からの配列リードの割合の測定によって、血漿試料中の胎児DNA濃度分率を決定することができる。 Where MP Normalized is the methylation density normalized using the fetal DNA concentration fraction in plasma, MP non-normalized is the measured methylation density, and BKG is Background methylation density obtained from maternal blood cells or tissues, PLN is the methylation density in placental tissue, and f is the fetal DNA concentration fraction. BKG and PLN methylation densities can be based on previously established baseline values from maternal blood cells and placental tissue obtained from normal pregnant women. Various genetic and epigenetic techniques have been used to measure the proportion of sequence reads from the Y chromosome in plasma samples, for example, by massively parallel sequencing or PCR with non-bisulfite converted DNA. The fetal DNA concentration fraction of can be determined.

ある実施では、潜在的に異数体の染色体の正規化されたメチル化密度は、正倍数体胎児を身籠る妊娠女性から成る参照群と比較され得る。参照群の正規化されたメチル化密度の平均値およびSDが決定され得る。次に、検査症例の正規化されたメチル化密度が、下記式による参照群の平均値からのSDの数字を示すZ値として表され得、
In some implementations, the normalized methylation density of potentially aneuploid chromosomes can be compared to a reference group consisting of pregnant women bearing euploid fetuses. The mean and SD of the normalized methylation densities of the reference group can be determined. The normalized methylation density of the tested cases can then be expressed as a Z value that represents the number of SD from the mean of the reference group according to the formula:

式中、MPNormalizedは検査症例の正規化されたメチル化密度であり、Mean(平均値)は参照症例の正規化されたメチル化密度の平均値であり、SDは参照症例の正規化されたメチル化密度の標準偏差である。カットオフ(例えば、−3未満のZ値)を用いることで、染色体有意に低メチル化されているかどうかを分類することができ、それにより、試料の異数体状態を決定することができる。 Where MP Normalized is the normalized methylation density of the tested cases, Mean (mean) is the averaged normalized methylation density of the reference cases, and SD is the normalized methylation of the reference cases. It is the standard deviation of the methylation density. A cutoff (eg, a Z value of less than -3) can be used to classify whether chromosomes are significantly hypomethylated, thereby determining the aneuploid state of the sample.

別の実施形態では、MPDiffは、正規化されたメチル化密度として用いられ得る。そのような実施形態では、PLNは、例えば方法1000を用いて、推定され得る。いくつかの実施において、参照メチル化密度(fを用いて正規化することができる)は、非異数体領域のメチル化レベルから決定され得る。例えば、Mean(平均値)は、同一試料の一つまたは複数の染色体領域から決定され得る。カットオフは、fに応じて決定されるか、または単に、最低濃度が存在するに足る充分なレベルに設定される。 In another embodiment, MP Diff can be used as the normalized methylation density. In such an embodiment, PLN may be estimated using, for example, method 1000. In some implementations, the reference methylation density (which can be normalized with f) can be determined from the methylation level of the non-aneuploid region. For example, the Mean can be determined from one or more chromosomal regions of the same sample. The cutoff is determined as a function of f, or simply set to a level sufficient to have a minimum concentration present.

従って、カットオフに対する領域のメチル化レベルの比較は、様々な方法で達成することができる。比較は正規化(例えば、上記のような)を含み得、正規化は、メチル化レベルまたはカットオフ値に対して、それらの値が定義された方法に応じて、等しく行われ得る。従って、領域の決定されたメチル化レベルが基準レベル(同一試料または他の試料から決定)と統計学的に異なるかどうかは、様々な方法で決定することができる。   Thus, comparing the methylation level of a region to the cutoff can be achieved in various ways. The comparison can include normalization (eg, as described above), and the normalization can be performed equally on methylation levels or cutoff values, depending on the way those values were defined. Thus, whether the determined methylation level of a region is statistically different from the reference level (determined from the same or other samples) can be determined in various ways.

上記解析は、染色体全体または染色体の部分(例えば、染色体の近接したまたはばらばらの小領域)を含み得る、染色体領域の解析に応用することができる。一実施形態では、潜在的に異数体の染色体は、いくつかのビンに分割され得る。ビンは同じまたは異なるサイズのものであり得る。各ビンのメチル化密度は、試料の濃度分率に対して、または一つもしくは複数の推定非異数体染色体のメチル化密度もしくはゲノムの全体的なメチル化密度に対して、正規化され得る。各ビンの正規化されたメチル化密度は次に、有意に低メチル化されているかどうかを決定するために参照群と比較され得る。次に、有意に低メチル化されているビンの割合が決定され得る。カットオフ(例えば、ビンの5%、10%、15%、20%または30%超が有意に低メチル化されている)は、症例の異数体状態を分類するために用いられ得る。   The above analysis can be applied to the analysis of chromosomal regions, which can include whole chromosomes or parts of chromosomes (eg, contiguous or discrete small regions of a chromosome). In one embodiment, potentially aneuploid chromosomes may be divided into bins. The bins can be of the same or different sizes. The methylation density of each bin can be normalized to the concentration fraction of the sample, or to the methylation density of one or more putative non-aneuploid chromosomes or the overall methylation density of the genome . The normalized methylation density of each bin can then be compared to a reference group to determine if it is significantly hypomethylated. The percentage of bins that are significantly hypomethylated can then be determined. Cutoffs (eg,> 5%, 10%, 15%, 20%, or 30% of bins are significantly hypomethylated) can be used to classify case aneuploidal status.

増幅または欠失について検査する場合、メチル化密度は参照メチル化密度と比較され得、これは、検査される特定の領域に特異的であり得る。メチル化は領域によって、特に、領域のサイズに応じて(例えば、より小さな領域ほどより大きな変動を示す)異なり得るため、各領域は異なる参照メチル化密度を有し得る。   When testing for amplification or deletion, the methylation density can be compared to a reference methylation density, which can be specific to the particular region tested. Each region may have a different reference methylation density, as the methylation may differ from region to region, and in particular depending on the size of the region (eg smaller regions show greater variation).

上記のように、正倍数体胎児をそれぞれ身籠る一人または複数人の妊娠女性を用いることで、目的領域のメチル化密度の正常範囲、または2つの染色体領域間のメチル化密度におけるまたは差異を定義することができる。PLNの正常範囲を決定することもできる(例えば、直接測定によって、または方法1000による推定値として)。他の実施形態では、2つのメチル化密度の間の比が用いられ得、例えば、潜在的に異数体の染色体および非異数体染色体のメチル化密度が、それらの差異の代わりに解析に用いられ得る。このメチル化解析アプローチを、配列リード計数アプローチ(RWK Chiu et al. 2008 Proc Natl Acad Sci USA;105:20458-20463)および血漿DNAのサイズ解析を含むアプローチ(米国特許出願公開第2011/0276277号)と組み合わせることで、異数体を決定または確認することができる。メチル化解析との組み合わせで用いられる配列リード計数アプローチは、ランダムシークエンス(RWK Chiu et al. 2008 Proc Natl Acad Sci USA;105:20458-20463; DW Bianchi DW et al. 2012 Obstet Gynecol 119:890-901)またはターゲットシークエンス(AB Sparks et al. 2012 Am J Obstet Gynecol 206:319.e1-9; B Zimmermann et al. 2012 Prenat Diagn 32:1233-1241; GJ Liao et al. 2012 PLoS One; 7:e38154)を用いて行うことができる。   As described above, by using one or more pregnant women who carry euploid fetuses, respectively, we define the normal range of methylation density in the target region, or the difference in methylation density between two chromosomal regions. can do. The normal range of PLN can also be determined (eg, by direct measurement or as an estimate by method 1000). In other embodiments, a ratio between the two methylation densities can be used, for example, the methylation densities of potentially aneuploid and non-aneuploid chromosomes can be analyzed instead of their differences. Can be used. This methylation analysis approach includes a sequence read counting approach (RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105: 20458-20463) and an approach including size analysis of plasma DNA (US Patent Application Publication No. 2011/0276277). In combination with, aneuploidy can be determined or confirmed. The sequence read counting approach used in combination with methylation analysis was based on a random sequence (RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105: 20458-20463; DW Bianchi DW et al. 2012 Obstet Gynecol 119: 890-901. ) Or the target sequence (AB Sparks et al. 2012 Am J Obstet Gynecol 206: 319.e1-9; B Zimmermann et al. 2012 Prenat Diagn 32: 1233-1241; GJ Liao et al. 2012 PLoS One; 7: e38154) Can be done using.

BKGの使用は、試料間のバックグラウンドにおける差異を説明し得る。例えば、ある女性は別の女性と異なるBKGメチル化レベルを有し得るが、BKGおよびPLNの間の差異はそのような状況において試料をまたがって使用され得る。異なる染色体領域のカットオフは、例えば、ゲノムのある領域のメチル化密度がゲノムの別の領域と異なる場合、異なり得る。   The use of BKG may explain the difference in background between samples. For example, one woman may have a different BKG methylation level than another, but the difference between BKG and PLN can be used across samples in such situations. The cutoffs of different chromosomal regions can be different, for example, if the methylation density of one region of the genome differs from another region of the genome.

このアプローチは、胎児ゲノムにおける欠失および増幅を含むあらゆる染色体異常を検出するために一般化され得る。さらに、この解析の分解能は所望のレベルに調整することができ、例えば、ゲノムは10Mb、5Mb、2Mb、1Mb、500kb、100kbのビンに分割することができる。従って、本科学技術は、染色体内(subchromosomal)重複または染色体内欠失を検出するのにも用いることができる。従って、本科学技術は、出生前胎児の分子的核型を非侵襲的に得ることを可能にする。このように用いられる場合、本科学技術は、分子の計数に基づく非侵襲的出生前検査法(A Srinivasan et al. 2013 Am J Hum Genet;92:167-176; SCY Yu et al. 2013 PLoS One 8: e60968)と組み合わせて用いられ得る。他の実施形態では、ビンのサイズは同一でなくてもよい。例えば、ビンのサイズは、各ビンが同数のCpGジヌクレオチドを含有するように調整され得る。この場合、ビンの物理的サイズは異なるであろう。   This approach can be generalized to detect any chromosomal abnormality, including deletions and amplifications in the fetal genome. Furthermore, the resolution of this analysis can be adjusted to the desired level, for example the genome can be divided into 10Mb, 5Mb, 2Mb, 1Mb, 500kb, 100kb bins. Thus, the technology can also be used to detect subchromosomal duplications or deletions. Therefore, the present technology makes it possible to non-invasively obtain the molecular karyotype of the prenatal fetus. When used in this way, the technology is a non-invasive prenatal test based on molecular enumeration (A Srinivasan et al. 2013 Am J Hum Genet; 92: 167-176; SCY Yu et al. 2013 PLoS One. 8: e60968). In other embodiments, the bin sizes may not be the same. For example, the size of the bins can be adjusted so that each bin contains the same number of CpG dinucleotides. In this case, the physical size of the bin will be different.

前記式は、様々なタイプの染色体異常に適用するために以下のように書き換えることができる。   The above equation can be rewritten as follows to apply to various types of chromosomal abnormalities.

式中、CNは障害領域におけるコピー数変化の数を表す。CNは、1コピーの染色体の増加において1に等しく、2コピーの染色体の増加において2に等しく、2つの相同染色体のうち1つの減少において−1に等しい(例えば、XO核型をもたらす、女性胎児がX染色体の1つを失っている胎児ターナー症候群の検出)。ビンのサイズを変更する際、この式を変更する必要は無い。しかし、CpGジヌクレオチド(または胎児DNAおよび母体DNAの間で示差的なメチル化を示す他のヌクレオチドの組み合わせ)の数が少ないほど、より小さなビン内に存在することとなり、これによりメチル化密度の測定における確率的変動が増加するため、より小さなビンのサイズが用いられる場合、感度および特異度は減少し得る。一実施形態では、必要なリードの数は、メチル化密度の変動係数および所望の感度レベルを解析することによって決定され得る。 In the formula, CN represents the number of copy number changes in the damaged area. CN is equal to 1 in an increase in one copy of the chromosome, is equal to 2 in an increase in two copies of the chromosome, and is equal to -1 in a decrease of one of the two homologous chromosomes (e.g. Detection of fetal Turner syndrome in which one of the X chromosomes has been lost). It is not necessary to change this formula when changing the size of the bin. However, the lower the number of CpG dinucleotides (or other nucleotide combinations that show differential methylation between fetal and maternal DNA), the more they are in the smaller bins, which leads to a higher methylation density. Due to the increased stochastic variability in the measurements, sensitivity and specificity can be reduced when smaller bin sizes are used. In one embodiment, the number of reads required can be determined by analyzing the coefficient of variation of methylation density and the desired sensitivity level.

このアプローチが実行可能であることを示すために、9人の妊娠女性から得た血漿試料を解析した。5人の妊娠女性において、それぞれは正倍数体胎児を身籠っており、その他の4人はそれぞれトリソミー21(T21)胎児を身籠っていた。それら5人の正倍数体妊娠女性から3人を無作為に選び、参照群を形成させた。残りの2人の正倍数体妊娠例(Eu1およびEu2)および4人のT21例(T21−1、T21−2、T21−3およびT21−4)を、潜在的なT21状態を検査するために本アプローチを用いて解析した。血漿DNAを亜硫酸水素塩によって変換し、イルミナ社製HiSeq2000プラットフォームを用いて配列決定した。一実施形態では、個々の染色体のメチル化密度が算出された。次に、21番染色体およびその他の21個の常染色体の平均値の間のメチル化密度における差異を決定して、正規化されたメチル化密度を得た(表1)。参照群の平均値およびSDは、6つの検査例のZ値の算出に用いた。   To show that this approach is feasible, plasma samples obtained from 9 pregnant women were analyzed. Of the 5 pregnant women, each had euploid fetuses, and the other four had trisomy 21 (T21) fetuses each. From the 5 euploid pregnant women, 3 were randomly selected to form a reference group. The remaining two euploid pregnancies (Eu1 and Eu2) and four T21 cases (T21-1, T21-2, T21-3 and T21-4) were tested for potential T21 status. It was analyzed using this approach. Plasma DNA was converted with bisulfite and sequenced using the Illumina HiSeq2000 platform. In one embodiment, the methylation density of individual chromosomes was calculated. The difference in methylation density between the mean values of chromosome 21 and the other 21 autosomes was then determined to give the normalized methylation density (Table 1). The average value and SD of the reference group were used to calculate the Z value of the 6 test examples.

別の実施形態において、ゲノムを1Mbのビンに分割し、1Mbのビンそれぞれのメチル化密度を決定した。潜在的に異数体の染色体上の全てのビンのメチル化密度は、推定非異数体染色体上に位置する全てのビンのメチル化密度中央値を用いて正規化することができる。ある実施において、各ビンについて、非異数体ビンの中央値とのメチル化密度における差異を算出することができる。これらの値のZ値は、参照群の平均値および標準偏差値を用いて算出することができる。低メチル化(表2)を示すビンの割合を決定し、カットオフ率と比較することができる。   In another embodiment, the genome was divided into 1 Mb bins and the methylation density of each 1 Mb bin was determined. The methylation densities of all bins on potentially aneuploid chromosomes can be normalized using the median methylation densities of all bins located on putative non-aneuploid chromosomes. In one implementation, the difference in methylation density from the median of non-aneuploid bins can be calculated for each bin. The Z value of these values can be calculated using the average value and standard deviation value of the reference group. The percentage of bins exhibiting hypomethylation (Table 2) can be determined and compared to the cutoff rate.

胎児の染色体または染色体内の異常を検出するためのこのDNAメチル化に基づくアプローチは、配列決定(RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105: 20458-20463)もしくはデジタルPCR(YMD Lo et al. 2007 Proc Natl Acad Sci USA; 104: 13116-13121)等による分子の計数、またはDNA分子のサイズ測定(米国特許出願公開第2011/0276277号)に基づくアプローチと組み合わせて用いることができる。そのような組み合わせ(例えば、DNAメチル化+分子計数、またはDNAメチル化+サイズ測定、またはDNAメチル化+分子計数+サイズ測定)は、臨床背景、例えば感度および/または特異度の向上において有利となる相乗効果を有するであろう。例えば、例えば配列決定により解析が必要となるDNA分子の数を、診断精度に不利な影響を与えずに減らすことができる。この特徴は、そのような検査をより経済的に行うことを可能にする。別の例として、分析される所与の数のDNA分子について、組み合わされたアプローチは、胎児の染色体または染色体内の異常をより低い濃度分率の胎児DNAにおいて検出することを可能にする。   This DNA methylation-based approach for detecting fetal chromosomes or abnormalities within chromosomes has been sequenced (RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105: 20458-20463) or digital PCR (YMD Lo et al. al. 2007 Proc Natl Acad Sci USA; 104: 13116-13121) or the like, or can be used in combination with an approach based on size measurement of DNA molecules (US Patent Application Publication No. 2011/0276277). Such a combination (eg, DNA methylation + molecule count, or DNA methylation + size measurement, or DNA methylation + molecule count + size measurement) may be advantageous in clinical settings, such as increased sensitivity and / or specificity. Will have a synergistic effect. For example, the number of DNA molecules that need to be analyzed, for example by sequencing, can be reduced without adversely affecting diagnostic accuracy. This feature makes it possible to carry out such tests more economically. As another example, for a given number of DNA molecules analyzed, the combined approach allows detection of fetal chromosomes or intrachromosomal abnormalities in lower concentrations of fetal DNA.

図13は、生物の生物試料から染色体異常を検出するための方法1300のフローチャートである。生物試料には、第一組織由来および第二組織由来の無細胞DNAの混合物を含む無細胞DNAが含まれる。第一組織は胎児または腫瘍から得られたものであり得、第二組織は妊娠女性または患者から得られたものであり得る。   FIG. 13 is a flow chart of a method 1300 for detecting a chromosomal abnormality from a biological sample of an organism. The biological sample includes cell-free DNA containing a mixture of cell-free DNA from the first tissue and the second tissue. The first tissue may be obtained from a fetus or tumor and the second tissue may be obtained from a pregnant female or patient.

ブロック1310において、生物試料由来の複数のDNA分子が解析される。DNA分子の解析には、生物のゲノムにおけるDNA分子の位置を決定し、DNA分子が一つまたは複数の部位においてメチル化されているかどうかを決定すること、が含まれ得る。前記解析はメチル化認識配列決定から配列リードを得ることで行うことができるため、前記解析はそのDNAから以前に得られたデータに対してのみ行われ得る。他の実施形態では、前記解析は、実際の配列決定またはデータを得るための他の有効な段階を含み得る。   At block 1310, a plurality of DNA molecules from the biological sample are analyzed. Analyzing a DNA molecule can include determining the location of the DNA molecule in the organism's genome and determining whether the DNA molecule is methylated at one or more sites. Since the analysis can be performed by obtaining a sequence read from methylation recognition sequencing, the analysis can only be performed on data previously obtained from that DNA. In other embodiments, the analysis may include actual sequencing or other valid steps to obtain data.

位置の決定は、ヒトゲノムの各部分への、例えば、特定領域へのDNA分子のマッピング(例えば、配列リードを介した)を含み得る。ある実施において、あるリード目的領域に位置しない場合、そのリードは無視することができる。   Positioning can include mapping the DNA molecule to each part of the human genome, eg, to a specific region (eg, via a sequence read). In some implementations, a lead may be ignored if it is not located in a lead target area.

ブロック1320において、複数の部位のそれぞれについて、部位においてメチル化されているDNA分子のそれぞれの数が決定される。一実施形態では、部位はCpG部位であり、本明細書に記載の一つまたは複数の判定基準を用いて選択されるある特定のCpG部位のみであり得る。メチル化されているDNAの数は、正規化が特定部位における分析されたDNA分子の総数(例えば、配列リードの総数)を用いて行われたならば、非メチル化状態である数の決定に等しい。   At block 1320, for each of the plurality of sites, the number of each DNA molecule that is methylated at the site is determined. In one embodiment, the site is a CpG site, and may only be one particular CpG site selected using one or more of the criteria described herein. The number of DNAs that are methylated can be used to determine the number that is unmethylated if normalization was performed using the total number of DNA molecules analyzed at a particular site (eg, total number of sequence reads). equal.

ブロック1330において、第一染色体領域の第一メチル化レベルは、第一染色体領域内の部位においてメチル化されているDNA分子のそれぞれの数に基づいて算出される。第一染色体領域はいかなるサイズ(例えば、上記サイズ)のものであってもよい。メチル化レベルは、例えば、正規化手順の一部として、第一染色体領域に整列したDNA分子の総数を説明することができる。   At block 1330, the first methylation level of the first chromosomal region is calculated based on the respective number of DNA molecules that are methylated at sites within the first chromosomal region. The first chromosomal region can be of any size (eg, the size described above). The methylation level can explain, for example, the total number of DNA molecules aligned to the first chromosomal region as part of the normalization procedure.

第一染色体領域は、いかなるサイズ(例えば、染色体全体)であってもよく、ばらばらの小領域から成っていてもよい(すなわち、小領域が互いに分離している)。各小領域のメチル化レベルを決定し、それを組み合わせることで(例えば、平均値または中央値として)、第一染色体領域のメチル化レベルを決定することができる。   The first chromosomal region can be of any size (eg, an entire chromosome) and can be composed of discrete subregions (ie, the subregions are separated from each other). The methylation level of each subregion can be determined and combined (eg, as a mean or median) to determine the methylation level of the first chromosomal region.

ブロック1340において、第一メチル化レベルはカットオフ値と比較される。カットオフ値は参照メチル化レベルであってもよいし、あるいは参照メチル化レベルと関連していてもよい(例えば、正常レベルからの特定の距離)。カットオフ値は、第一染色体領域の染色体異常を有さない胎児を身籠る他の妊娠女性対象から、がんを有さない個人の試料から、または異数体と関連していないことが知られている生物の遺伝子座(すなわち、二染色体性の領域)から、決定され得る。   At block 1340, the first methylation level is compared to the cutoff value. The cutoff value may be the reference methylation level or it may be associated with the reference methylation level (eg, a particular distance from normal levels). Cutoff values are known not to be associated with other pregnant female subjects who carry fetuses without chromosomal abnormalities in the first chromosome region, from samples of individuals without cancer, or with aneuploidy. It can be determined from the locus of the organism (ie, the disomy region) in which it is maintained.

一実施形態では、カットオフ値は、下記式の参照メチル化レベルとの差異を有すると定義され得、   In one embodiment, the cutoff value may be defined as having a difference from a reference methylation level of the formula:

式中、BKGは女性のバックグラウンド(または他の対象からの平均値または中央値)であり、fは第一組織由来の無細胞DNAの濃度分率であり、CNは検査されるコピー数である。CNは、異常の種類(欠失または重複)に対応するスケーリング因子の一例である。CN=1のカットオフが最初に全ての増幅を検査するために用いられ得、その後、さらなるカットオフが増幅の程度を決定するために用いられ得る。カットオフ値を、第一組織由来の無細胞DNAの濃度分率に基づかせることで、座位のメチル化の予測レベルを決定することができる(例えば、コピー数異常が存在しない場合)。 Where BKG is the female background (or mean or median from other subjects), f is the concentration fraction of cell-free DNA from the first tissue, and CN is the copy number tested. is there. CN is an example of a scaling factor corresponding to the type of abnormality (deletion or duplication). A CN = 1 cutoff can be used first to check all amplifications, and then a further cutoff can be used to determine the extent of amplification. The cut-off value can be based on the concentration fraction of cell-free DNA from the first tissue to determine the predictive level of methylation at the locus (eg, in the absence of copy number abnormalities).

ブロック1350において、第一染色体領域の異常の分類が、比較に基づいて決定される。レベルにおける統計的に有意な差異は、染色体異常を有する胎児のリスクの増加を示し得る。種々の実施形態において、染色体異常は、21トリソミー、18トリソミー、13トリソミー、ターナー症候群、またはクラインフェルター症候群であり得る。他の例は、染色体内欠失、染色体内重複、またはディジョージ症候群である。   At block 1350, a classification of abnormalities in the first chromosomal region is determined based on the comparison. Statistically significant differences in levels may indicate an increased risk for fetuses with chromosomal abnormalities. In various embodiments, the chromosomal abnormality can be trisomy 21, trisomy 18, trisomy 13, triner Turner syndrome, or Kleinfelter syndrome. Other examples are intrachromosomal deletions, intrachromosomal duplications, or DiGeorge syndrome.

V. マーカーの決定
上記で言及したように、胎児ゲノムのある特定の部分は、母体ゲノムと異なるようにメチル化されている。これらの差異は妊娠全体にわたって一般的であり得る。異なるメチル化の領域は、胎児由来のDNA断片を特定するために用いることができる。
V. Marker Determination As mentioned above, certain parts of the fetal genome are methylated differently from the maternal genome. These differences can be common throughout pregnancy. Regions of different methylation can be used to identify fetal DNA fragments.

A. 胎盤組織および母体組織からDMRを決定する方法
胎盤は組織特異的なメチル化サインを有する。胎児特異的DNAメチル化マーカーは、胎盤組織および母体血細胞間で示差的にメチル化された遺伝子座に基づいて、母体血漿検出のために、および非浸潤的出生前診断適用のために、開発された(SSC Chim et al. 2008 Clin Chem; 54: 500-511; EA Papageorgiou et al 2009 Am J Pathol; 174: 1609-1618;およびT Chu et al. 2011 PLoS One; 6: e14723)。そのような示差的にメチル化された領域(DMR)をゲノムワイドに探索する実施形態が提供される。
A. Methods for Determining DMR from Placental and Maternal Tissue Placenta has a tissue-specific methylation signature. A fetal-specific DNA methylation marker was developed for maternal plasma detection and for non-invasive prenatal diagnostic applications based on the loci differentially methylated between placental tissue and maternal blood cells. (SSC Chim et al. 2008 Clin Chem; 54: 500-511; EA Papageorgiou et al 2009 Am J Pathol; 174: 1609-1618; and T Chu et al. 2011 PLoS One; 6: e14723). Embodiments are provided for genome-wide searching for such differentially methylated regions (DMRs).

図14は、本発明の実施形態に従って、胎盤メチル化特性を母体メチル化特性(例えば、血液細胞から決定された)と比較することによる、メチル化マーカーを同定するための方法1400のフローチャートである。方法1400は、腫瘍メチル化特性を健常組織に対応するメチル化特性と比較することにより腫瘍マーカーを決定するために、用いてもよい。   FIG. 14 is a flow chart of a method 1400 for identifying methylation markers by comparing placental methylation properties to maternal methylation properties (eg, determined from blood cells) according to embodiments of the present invention. . Method 1400 may be used to determine tumor markers by comparing tumor methylation profiles to methylation profiles corresponding to healthy tissue.

ブロック1410において、胎盤メチロームおよび血液メチロームが得られる。胎盤メチロームは胎盤試料(例えば、CVSまたは妊娠末期胎盤)から決定することができる。メチロームはゲノムの一部のみのメチル化密度を含み得ることを理解されたい。   At block 1410, a placenta methylome and a blood methylome are obtained. Placental methylome can be determined from placental samples (eg, CVS or late pregnancy placenta). It is to be understood that the methylome may contain the methylation density of only part of the genome.

ブロック1420において、特定の数の部位(例えば、5つのCpG部位)を含む領域が特定され、そのために充分な数のリードが入手された。一実施形態では、各染色体の一端から特定を開始して、少なくとも5つの適切なCpG部位を含有する最初の500bp領域を突き止めた。CpG部位は、該部位が少なくとも5つの配列リードによって被覆された場合に、適切と見なされ得る。   At block 1420, a region containing a particular number of sites (eg, 5 CpG sites) was identified and a sufficient number of reads were obtained for that. In one embodiment, identification was initiated at one end of each chromosome to locate the first 500 bp region containing at least 5 suitable CpG sites. A CpG site may be considered suitable if it is covered by at least 5 sequence reads.

ブロック1430において、胎盤メチル化指数および血中メチル化指数が各部位について算出される。例えば、メチル化指数は各500bp領域内の全ての適切なCpG部位について個別に算出された。   At block 1430, a placental methylation index and a blood methylation index are calculated for each site. For example, the methylation index was calculated individually for all appropriate CpG sites within each 500 bp region.

ブロック1440において、メチル化指数を母体血細胞および胎盤試料間で比較することで、一連の指数が互いに異なるかどうかを決定した。例えば、メチル化指数を、例えば、マン・ホイットニー検定を用いて、母体血細胞およびCVSまたは妊娠末期胎盤間で比較した。例えば、0.01以下のP値を統計的に有意に異なると見なしたが、より低い数字が偽陽性領域を減少させる場合は他の値を用いてもよい。   At block 1440, the methylation index was compared between maternal blood cells and placental samples to determine if the series of indices differed from each other. For example, the methylation index was compared between maternal blood cells and CVS or late pregnancy placenta using, for example, the Mann-Whitney test. For example, P values of 0.01 or less were considered to be statistically significantly different, but other values may be used if lower numbers reduce false positive areas.

一実施形態では、適切なCpG部位の数が5未満である場合、またはマン・ホイットニー検定が有意でない場合、500bp領域は100bp下流に移動された。領域は、マン・ホイットニー検定が500bp領域について有意になるまで、下流への移動を継続された。次に、次の500bp領域が考慮された。次の領域がマン・ホイットニー検定による統計的有意性を示すことが分かった場合、結合された隣接領域が1,000bp以下でない限り、目下の領域に追加された。   In one embodiment, the 500 bp region was moved 100 bp downstream if the number of suitable CpG sites was less than 5, or if the Mann-Whitney test was not significant. The region was allowed to move downstream until the Mann-Whitney test was significant for the 500 bp region. Next, the next 500 bp region was considered. If the next region was found to show statistical significance by the Mann-Whitney test, it was added to the current region unless the combined flanking region was less than 1,000 bp.

ブロック1450において、統計的に有意に異なっていた(例えば、マン・ホイットニー検定により)隣接領域が統合され得る。2つの試料のメチル化指数の間に差異が存在することに注意されたい。一実施形態では、隣接領域が互いの特定の距離(例えば、1,000bp)内に存在し、それらが同様のメチル化特性を示す場合、それらは統合される。ある実施において、隣接領域間のメチル化特性の類似性は、以下のいずれかを用いて定義され得る:(1)母体血細胞に関して、胎盤組織において同じ傾向を示す(例えば、両領域が血液細胞においてよりも胎盤組織においてよりメチル化されている);(2)胎盤組織における隣接領域において10%未満のメチル化密度における差異を有する;および(3)母体血細胞における隣接領域において10%未満のメチル化密度における差異を有する。   At block 1450, adjacent regions that were statistically significantly different (eg, by the Mann-Whitney test) may be integrated. Note that there is a difference between the methylation indices of the two samples. In one embodiment, adjacent regions are integrated if they are within a certain distance of each other (eg, 1,000 bp) and they show similar methylation properties. In certain implementations, the similarity of methylation properties between adjacent regions can be defined using any of the following: (1) For maternal blood cells, the same trend in placental tissue (eg, both regions show More methylated in placental tissue); (2) with less than 10% difference in methylation density in adjacent regions in placental tissue; and (3) less than 10% methylated in adjacent regions in maternal blood cells. Have a difference in density.

ブロック1460において、領域における、母体血細胞DNAおよび胎盤試料(例えば、CVSまたは妊娠末期胎盤組織)からの血液メチロームのメチル化密度が算出される。メチル化密度は本明細書に記載の通りに決定することができる。   At block 1460, the methylation density of blood methylome from maternal blood cell DNA and placental samples (eg, CVS or late pregnancy placental tissue) in the region is calculated. Methylation density can be determined as described herein.

ブロック1470において、全胎盤メチル化密度および全血液メチル化密度が領域内の全ての部位について統計的に有意に異なる推定上のDMRが決定される。一実施形態では、統合された領域内の全ての適切なCpG部位がχ2検査を受ける。χ2検査により、統合された領域内の全ての適切なCpG部位間のメチル化シトシンおよび非メチル化シトシンの割合としてのメチル化シトシンの数が、母体血細胞および胎盤組織間で統計的に有意に異なるかどうかを評価された。ある実施では、χ2検査において、0.01以下のP値が統計的に有意に異なると見なされ得る。χ2検査によって有意性を示された統合されたセグメントが、推定上のDMRと見なされた。 At block 1470, putative DMRs at which the total placental and blood methylation densities are statistically significantly different for all sites in the region are determined. In one embodiment, all suitable CpG sites within the integrated region undergo a χ 2 test. The χ 2 test showed that the number of methylated cytosines as a percentage of methylated and unmethylated cytosines between all relevant CpG sites within the integrated region was statistically significant between maternal blood cells and placental tissues. It was evaluated whether it was different. In some implementations, a P value of 0.01 or less may be considered statistically significantly different in the χ 2 test. Integrated segments that were shown to be significant by the χ 2 test were considered putative DMRs.

ブロック1480において、母体血細胞DNAのメチル化密度が高カットオフ超または低カットオフ未満であった遺伝子座が特定された。一実施形態では、母体血細胞DNAのメチル化密度が20%以下または80%以上であった遺伝子座が特定された。他の実施形態では、母体血以外の体液、例えば、限定はされないが、唾液、女性生殖器からの子宮または子宮頸部の洗浄液、涙、汗、唾液、および尿が用いられ得る。   At block 1480, loci in which the methylation density of maternal blood cell DNA was above the high cutoff or below the low cutoff were identified. In one embodiment, loci were identified in which the maternal blood cell DNA methylation density was 20% or less or 80% or more. In other embodiments, body fluids other than maternal blood may be used, including but not limited to saliva, uterine or cervical lavage fluid from female reproductive organs, tears, sweat, saliva, and urine.

母体血漿における胎児特異的なDNAメチル化マーカーの開発を成功させるために重要なことは、母体血細胞のメチル化状態が、可能な限り高度にメチル化されているか、または可能な限りメチル化されていないことであり得る。これは、反対のメチル化特性を示す胎盤由来胎児DNA分子の解析に干渉する母体DNA分子を有する可能性を減少(例えば、最小化)させ得る。従って、一実施形態では、候補DMRがさらなる選別によって選択された。候補低メチル化遺伝子座は、母体血細胞において20%以下のメチル化密度を示し、胎盤組織において少なくとも20%より高いメチル化密度を有するものであった。候補高度メチル化遺伝子座は、母体血細胞において80%以上のメチル化密度を示し、胎盤組織において少なくとも20%より低いメチル化密度を有するものであった。他のパーセンテージを用いてもよい。   Important for successful development of fetal-specific DNA methylation markers in maternal plasma is that the methylation status of maternal blood cells is as highly or as methylated as possible. Can be not. This may reduce (eg, minimize) the likelihood of having a maternal DNA molecule that interferes with the analysis of placental-derived fetal DNA molecules that exhibit opposite methylation properties. Therefore, in one embodiment, candidate DMRs were selected by further screening. Candidate hypomethylation loci were those that showed a methylation density of 20% or less in maternal blood cells and a methylation density of at least 20% higher in placental tissue. Candidate hypermethylation loci were those that showed a methylation density of 80% or higher in maternal blood cells and a methylation density of at least 20% lower in placental tissues. Other percentages may be used.

ブロック1490において、次に、DMRが、差異を閾値と比較することにより、胎盤メチル化密度が血液メチル化密度と有意に異なる一部の遺伝子座の間で特定された。一実施形態では、閾値は20%であり、そのため、メチル化密度は母体血細胞のメチル化密度と少なくとも20%異なっていた。従って、それぞれの特定された遺伝子座における胎盤メチル化密度および血液メチル化密度間の差異が算出され得る。差異は単純な減算であり得る。他の実施形態では、スケーリング因子および他の関数が差異を決定するための用いられ得る(例えば、差異は単純な減算に適用された関数の結果であり得る)。   At block 1490, DMRs were then identified among some loci where placental methylation density was significantly different from blood methylation density by comparing the difference to a threshold. In one embodiment, the threshold is 20%, so the methylation density was at least 20% different from the methylation density of maternal blood cells. Thus, the difference between placental and blood methylation densities at each identified locus can be calculated. The difference can be a simple subtraction. In other embodiments, scaling factors and other functions can be used to determine the difference (eg, the difference can be the result of a function applied to a simple subtraction).

ある実施では、この方法を用いて、11,729の高度メチル化遺伝子座および239,747の低メチル化遺伝子座が第一期胎盤試料から特定された。上から100の高度メチル化遺伝子座を付録の表S2Aに列挙する。上から100の低メチル化遺伝子座を付録の表S2Bに列挙する。表S2Aおよび表S2Bは、染色体、開始位置および終止位置、領域のサイズ、母体血におけるメチル化密度、胎盤試料におけるメチル化密度、P値(全て非常に小さい)、並びにメチル化の差異を列挙している。位置は参照ゲノムhg18に対応しており、これは、hgdownload.soe.ucsc.edu/goldenPath/hg18/chromosomesで見つけることができる。   In one implementation, 11,729 hypermethylated loci and 239,747 hypomethylated loci were identified from first stage placental samples using this method. The top 100 hypermethylated loci are listed in Appendix S, Table S2A. The top 100 hypomethylated loci are listed in Table S2B in the Appendix. Tables S2A and S2B list chromosomes, start and stop positions, size of region, methylation density in maternal blood, methylation density in placental samples, P-values (all very small), and methylation differences. ing. The position corresponds to the reference genome hg18, which is located in hgdownload. soe. ucsc. It can be found at edu / goldenPath / hg18 / chromosomes.

11,920の高度メチル化遺伝子座および204,768の低メチル化遺伝子座を第三期胎盤試料から特定した。第三期の上から100の高度メチル化遺伝子座を表S2Cに列挙し、上から100の低メチル化遺伝子座を表S2Dに列挙する。母体血細胞および第一期胎盤組織間で示差的にメチル化されていることが以前に報告された33の遺伝子座を用いて、第一期候補の列挙の妥当性を確認した。33の遺伝子座の79%が、本アルゴリズムを用いることにより、DMRであると特定された。   11,920 hypermethylated loci and 204,768 hypomethylated loci were identified from third stage placental samples. The top 100 hypermethylated loci of the third stage are listed in Table S2C and the top 100 hypomethylated loci are listed in Table S2D. The 33 loci previously reported to be differentially methylated between maternal blood cells and first stage placental tissue were used to validate the enumeration of first stage candidates. 79% of the 33 loci were identified as DMRs using this algorithm.

図15Aは、33の以前に報告された第一期マーカーを参照して第一期データを用いる、DMR特定アルゴリズムの性能を示す、表1500である。表中で、「a」は、遺伝子座1〜15が(RWK Chiu et al. 2007 Am J Pathol; 170:941-950 and SSC Chim et al. 2008 Clin Chem; 54:500-511)で以前に報告されたこと;遺伝子座16〜23が(KC Yuen, thesis 2007, The Chinese University of Hong Kong, Hong Kong)で以前に報告されたこと;および遺伝子座24〜33が(EA Papageorgiou et al. 2009 Am J Pathol; 174:1609-1618)で以前に報告されたことを示している。「b」は、これらのデータが上記刊行物から得られたことを示している。「c」は、母体血細胞のメチル化密度および絨毛膜絨毛検体のメチル化密度並びにそれらの差異が、本研究で作製されたが元の研究によって提供されたゲノム座標に基づく配列決定データから観察されたことを示している。「d」は、遺伝子座に関するデータが、Chiu et al (2007), Chim et al (2008), Yuen (2007)およびPapageorgiou et al (2009)による上記刊行物を参照せずに、亜硫酸水素塩配列決定データに対する方法1400の実施形態を用いて特定されたことを示している。遺伝子座の全長は以前に報告されたゲノム領域を含んだが、概して、より大きな領域にまたがった。「e」は、候補DMRが、母体血細胞および絨毛膜絨毛検体におけるDMRの対応するゲノム座標のメチル化密度の間で、0.20超の差異を観察する必要に基づいて、真陽性(TP)または偽陽性(FN)に分類されたことを示している。   FIG. 15A is a table 1500 showing the performance of the DMR identification algorithm using first trimester data with reference to 33 previously reported trimester markers. In the table, "a" refers to loci 1 to 15 previously (RWK Chiu et al. 2007 Am J Pathol; 170: 941-950 and SSC Chim et al. 2008 Clin Chem; 54: 500-511). What was reported; loci 16-23 were previously reported in (KC Yuen, thesis 2007, The Chinese University of Hong Kong, Hong Kong); and loci 24-33 were (EA Papageorgiou et al. 2009). Am J Pathol; 174: 1609-1618). "B" indicates that these data were obtained from the above publications. “C” indicates that the methylation densities of maternal blood cells and chorionic villus specimens and their differences were observed from the genomic coordinate-based sequencing data produced in this study but provided by the original study. It shows that. "D" is the bisulfite sequence without reference to the above publications by Chiu et al (2007), Chim et al (2008), Yuen (2007) and Papageorgiou et al (2009) for data on loci. 6 illustrates that it has been identified using an embodiment of method 1400 for decision data. The full length of the locus contained previously reported genomic regions, but generally spanned larger regions. “E” is a true positive (TP) based on the need for the candidate DMR to observe more than 0.20 differences between the methylation densities of the corresponding genomic coordinates of DMR in maternal blood cells and chorionic villus samples. Or it has shown that it was classified into the false positive (FN).

図15Bは、第三期データを用いる、分娩時に得られた胎盤試料と比較された、DMR特定アルゴリズムの性能を示す、表1550である。「a」は、図17A中の記載と同一の33の遺伝子座の列挙が用いられたことを示している。「b」は、33の遺伝子座は妊娠初期試料から以前に特定されたため、それらは第三期データに適用可能でない場合があることを示している。従って、元の研究によって提供されたゲノム座標に基づいて妊娠末期胎盤組織に関する本研究において作成された亜硫酸水素塩配列決定データが概説された。母体血細胞および妊娠末期胎盤組織間のメチル化密度における0.20超の差異は、遺伝子座が確かに第三期における真のDMRであるかどうかを決定するために用いられた。「c」は、遺伝子座に関するデータが、Chiu et al (2007), Chim et al (2008), Yuen (2007)およびPapageorgiou et al (2009)による刊行物を参照せずに、亜硫酸水素塩配列決定データに対する方法1400を用いて特定されたことを示している。遺伝子座の全長は以前に報告されたゲノム領域を含んだが、概して、より大きな領域にまたがった。「d」は、第三期における示差的なメチル化に適した遺伝子座を含有する候補DMRが、母体血細胞および妊娠末期胎盤組織におけるDMRの対応するゲノム座標のメチル化密度の間で、0.20超の差異を観察する必要に基づいて、真陽性(TP)または偽陽性(FN)に分類されたことを示している。第三期における示差的なメチル化に適していなかった遺伝子座については、DMRの列挙中のそれらの不在または該遺伝子座を含有するが0.20未満のメチル化差異を示すDMRの存在が、真の陰性(TN)DMRと見なされた。   FIG. 15B is a table 1550 showing the performance of the DMR identification algorithm compared to placental samples obtained at parturition using the third trimester data. "A" indicates that the same listing of 33 loci as described in Figure 17A was used. "B" indicates that 33 loci were previously identified from early pregnancy samples, so they may not be applicable to trimester data. Therefore, the bisulfite sequencing data generated in this study on late pregnancy placental tissue based on the genomic coordinates provided by the original study was reviewed. Greater than 0.20 differences in methylation densities between maternal blood cells and late pregnancy placental tissue were used to determine whether the locus was indeed a true DMR in third trimester. "C" is for bisulfite sequencing without reference to data published by Chiu et al (2007), Chim et al (2008), Yuen (2007) and Papageorgiou et al (2009) for loci data. It is shown that it was identified using the method 1400 for the data. The full length of the locus contained previously reported genomic regions, but generally spanned larger regions. “D” indicates that a candidate DMR containing a locus suitable for differential methylation in the third trimester is between 0. 0 between the methylation densities of the corresponding genomic coordinates of the DMR in maternal blood cells and late pregnancy placental tissue. It shows that they were classified as true positive (TP) or false positive (FN) based on the need to observe more than 20 differences. For loci that were not suitable for differential methylation in the third phase, the absence of those in the DMR enumeration or the presence of DMRs containing the locus but showing a methylation difference of less than 0.20, It was considered a true negative (TN) DMR.

B. 母体血漿配列決定データから得られるDMR
試料の胎児DNA濃度分率も既存であるならば、胎盤組織DMRを母体血漿DNAの亜硫酸水素塩配列決定データから直接的に特定できるはずである。胎盤は母体血漿中の胎児DNAの主な供給源であり得るため(SSC Chim et al. 2005 Proc Natl Acad Sci USA 102, 14753-14758)、本研究において、母体血漿中の胎児特異的DNAのメチル化状態が胎盤メチロームと相関することが示された。
B. DMR obtained from maternal plasma sequencing data
If the fetal DNA concentration fraction of the sample was also pre-existing, placental tissue DMRs could be directly identified from the bisulfite sequencing data of maternal plasma DNA. Since the placenta may be the major source of fetal DNA in maternal plasma (SSC Chim et al. 2005 Proc Natl Acad Sci USA 102, 14753-14758), methyl methylation of fetal-specific DNA in maternal plasma was used in this study. It has been shown that the maturation status correlates with placental methylome.

従って、胎盤試料を用いる代わりに、血漿メチロームを用いて方法1400の態様を実行して、推定胎盤メチロームを決定してもよい。従って、方法1000および方法1400を組み合わせてDMRを決定することができる。方法1000を用いることで、胎盤メチル化特性の予測値を決定し、それらを方法1400で用いることができる。この解析において、実施例は、母体血細胞において20%以下または80%以上メチル化されていた遺伝子座にも焦点を当てている。   Thus, instead of using a placental sample, an embodiment of method 1400 may be performed using a plasma methylome to determine a putative placental methylome. Therefore, method 1000 and method 1400 can be combined to determine a DMR. Using method 1000, predictive values for placental methylation properties can be determined and used in method 1400. In this analysis, the Examples also focus on loci that were methylated below 20% or above 80% in maternal blood cells.

ある実施において、母体血細胞と比較して胎盤組織において高度メチル化された遺伝子座を推定するために、母体血細胞において20%以下のメチル化、並びに血液細胞メチル化密度および予測値の間に少なくとも50%の差異を有する、予測値による60%以上のメチル化を示した遺伝子座を選び出した。母体血細胞と比較して胎盤組織において低メチル化状態の遺伝子座を推定するために、母体血細胞において80%以上のメチル化、並びに血液細胞メチル化密度および予測値の間に少なくとも50%の差異を有する、予測値による40%以下のメチル化を示した遺伝子座を選び出した。   In some implementations, to estimate hypermethylated loci in placental tissue as compared to maternal blood cells, less than 20% methylation in maternal blood cells, and at least 50 between blood cell methylation density and predictive value. Loci showing a methylation of 60% or more by the predicted value with a difference of% were selected. To estimate loci of hypomethylation status in placental tissue compared to maternal blood cells, methylation of 80% or more in maternal blood cells and at least 50% difference between blood cell methylation density and predicted value should be used. Those loci that had less than 40% methylation by the predicted value were selected.

図16は、母体血漿亜硫酸水素塩配列決定データの直接解析に基づいて高度メチル化または低メチル化状態であると予測された遺伝子座の数を示す、表1600である。「N/A」は適用不可を意味する。「a」は、高度メチル化遺伝子座の探索が、母体血細胞において20%未満のメチル化密度を示す遺伝子座リストから開始されたことを示している。「b」は、低メチル化遺伝子座の探索が、母体血細胞において80%超のメチル化密度を示す遺伝子座リストから開始されたことを示している。「c」は、絨毛膜絨毛検体から得られた亜硫酸水素塩配列決定データが第一期母体血漿データの妥当性を検証するために用いられ、妊娠末期胎盤組織が第三期母体血漿データを検証するために用いられたことを示している。   FIG. 16 is a table 1600 showing the number of loci predicted to be hypermethylated or hypomethylated based on direct analysis of maternal plasma bisulfite sequencing data. “N / A” means not applicable. "A" indicates that the search for hypermethylated loci was initiated from the locus list showing less than 20% methylation density in maternal blood cells. "B" indicates that the search for hypomethylated loci started with the locus list showing methylation densities greater than 80% in maternal blood cells. “C” is used to verify the validity of the first trimester maternal plasma data from bisulfite sequencing data obtained from chorionic villus specimens, and the third trimester maternal plasma data to be verified by late pregnancy placental tissues. It has been used to do.

表1600に示すように、非侵襲的に推定された遺伝子座の大部分は、組織において予測されたメチル化パターンを示し、組織データから掘り出され先のセクションに示されたたDMRと重複した。付録は血漿から特定されたDMRを収載している。表S3Aは、第一期母体血漿の亜硫酸水素塩配列決定データから高度メチル化状態であると推定された、上から100の遺伝子座を収載している。表S3Bは、第一期母体血漿の亜硫酸水素塩配列決定データから低メチル化状態であると推定された、上から100の遺伝子座を収載している。表S3Cは、第三期母体血漿の亜硫酸水素塩配列決定データから高度メチル化状態であると推定された、上から100の遺伝子座を収載している。第三期母体血漿の亜硫酸水素塩配列決定データから低メチル化状態であると推定された、上から100の遺伝子座を収載している。   As shown in Table 1600, the majority of non-invasively estimated loci displayed predicted methylation patterns in tissues, overlapping with DMRs mined from tissue data and shown in the previous section. . The appendix lists DMRs identified from plasma. Table S3A lists the 100 loci from the top that were estimated to be hypermethylated from the bisulfite sequencing data of first-stage maternal plasma. Table S3B lists the 100 loci from the top that were estimated to be hypomethylated from the bisulfite sequencing data of first stage maternal plasma. Table S3C lists the 100 loci from the top that were estimated to be hypermethylated from the bisulfite sequencing data of the third trimester maternal plasma. The top 100 loci estimated to be hypomethylated from the bisulfite sequencing data of the third stage maternal plasma are listed.

C. 胎盤メチロームおよび胎児メチロームの妊娠性変動
CVSにおけるメチル化CpGの全割合は55%であり、一方、妊娠末期胎盤におけるメチル化CpGの全割合は59%であった(図1の表100)。より低メチル化状態のDMRは妊娠末期胎盤よりもCVSから特定され得たが、高度メチル化DMRの数はそれら2つの組織において同様であった。従って、CVSが妊娠末期胎盤よりもより低メチル化状態であることは明らかであった。この妊娠性傾向は母体血漿データにおいても明白であった。胎児特異的リード間のメチル化CpGの割合は、第一期母体血漿においては47.0%であったが、第三期母体血漿においては53.3%であった。確認された高度メチル化遺伝子座の数は、第一(1,457遺伝子座)および第三期(1,279遺伝子座)母体血漿試料において同様であったが、第三期試料(12,677遺伝子座)よりも第一試料(21,812遺伝子座)において実質的により多くの低メチル化遺伝子座が存在した(図16の表1600)。
C. Placental Methylome and Fetal Methylome Pregnancy Variation The total percentage of methylated CpG in CVS was 55%, while the total percentage of methylated CpG in late pregnancy placenta was 59% (Table 100 in Figure 1). The lower methylated DMRs could be identified from CVS more than the late placenta, but the number of hypermethylated DMRs was similar in the two tissues. Therefore, it was clear that CVS was more hypomethylated than the late pregnancy placenta. This fertility trend was also evident in maternal plasma data. The proportion of methylated CpG between fetal-specific reads was 47.0% in first trimester maternal plasma, but 53.3% in third trimester maternal plasma. The number of hypermethylated loci identified was similar in the first (1,457 locus) and third stage (1,279 locus) maternal plasma samples, but not in the third stage sample (12,677). There were substantially more hypomethylated loci in the first sample (21,812 locus) than in the locus (Table 1600 in Figure 16).

D. マーカーの使用
示差的にメチル化されたマーカー、またはDMRは、いくつかの態様において有用である。母体血漿中のそのようなマーカーの存在により、胎児DNAまたは胎盤DNAの存在が示され、確認される。この確認は、非侵襲的出生前検査の精度管理として用いることができる。DMRは、母体血漿中の一般的な胎児DNAマーカーとして役立ち、遺伝子多型に基づくマーカーまたはY染色体に基づくマーカー等の母親および胎児の間の遺伝子型の差異に依存するマーカーに優る利点を有し得る。DMRは、あらゆる妊娠に有用な一般的な胎児マーカーである。遺伝子多型に基づくマーカーは、胎児がその父親から該マーカーを受け継いでおり、その母親がそのゲノム内に該マーカーを保有していない、一部の妊娠にのみ適用可能である。さらに、それらのDMRに由来するDNA分子を定量化することによって、母体血漿試料中の胎児DNA濃度を測定することができる。正常妊娠に期待されるDMRの特性を知ることで、母体血漿DMR特性またはメチル化特性の、正常妊娠に期待される該特性からの逸脱を観察することによって、妊娠関連合併症、特に胎盤組織変化を伴う妊娠関連合併症を、検出することができる。胎盤組織変化を伴う妊娠関連合併症としては、限定はされないが、胎児染色体異数性が挙げられる。例として、21トリソミー、子癇前症、子宮内胎児発育遅延および早産が挙げられる。
D. Use of Markers Differentially methylated markers, or DMRs, are useful in some embodiments. The presence of such markers in maternal plasma indicates and confirms the presence of fetal or placental DNA. This confirmation can be used as a quality control for non-invasive prenatal testing. DMR serves as a general fetal DNA marker in maternal plasma and has advantages over markers that rely on genotypic differences between the mother and fetus, such as genetic polymorphism-based markers or Y-chromosome-based markers. obtain. DMR is a common fetal marker useful for any pregnancy. Markers based on genetic polymorphisms are applicable only to some pregnancies where the fetus has inherited the marker from its father and whose mother does not carry the marker in its genome. In addition, fetal DNA concentrations in maternal plasma samples can be measured by quantifying those DMR-derived DNA molecules. By knowing the characteristics of DMR expected for normal pregnancy, pregnancy-related complications, especially placental tissue changes, can be observed by observing deviations of maternal plasma DMR characteristics or methylation characteristics from those expected for normal pregnancy. Pregnancy related complications associated with can be detected. Pregnancy-related complications associated with placental tissue changes include, but are not limited to, fetal chromosomal aneuploidy. Examples include trisomy 21, preeclampsia, intrauterine growth restriction and preterm birth.

E. マーカーを用いるキット
実施形態は、本明細書に記載の方法および他の適用可能な方法を実行するための組成物およびキットを提供し得る。キットは、胎児DNA(例えば、母体血漿中の無細胞胎児DNA)を分析するアッセイを実行するために用いることができる。一実施形態では、キットは、本明細書で同定される一つまたは複数の遺伝子座との特異的なハイブリダイゼーションに有用な少なくとも1つのオリゴヌクレオチドを含み得る。キットは、一つまたは複数の参照遺伝子座との特異的なハイブリダイゼーションに有用な少なくとも1つのオリゴヌクレオチドも含み得る。一実施形態では、胎盤高度メチル化マーカーが測定される。検査座位は母体血漿中のメチル化DNAであり得、参照座位は母体血漿中のメチル化DNAであり得る。血漿中の腫瘍DNAを分析するために類似のキットを構成することができる。
E. Kits Using Markers Embodiments may provide compositions and kits for performing the methods described herein and other applicable methods. The kit can be used to perform an assay that analyzes fetal DNA (eg, cell-free fetal DNA in maternal plasma). In one embodiment, the kit may include at least one oligonucleotide useful for specific hybridization with one or more loci identified herein. The kit may also include at least one oligonucleotide useful for specific hybridization with one or more reference loci. In one embodiment, the placental hypermethylation marker is measured. The test locus can be methylated DNA in maternal plasma and the reference locus can be methylated DNA in maternal plasma. A similar kit can be constructed to analyze tumor DNA in plasma.

いくつかの例において、前記キットは、標的座位(例えば、付録中の座位)および参照座位の少なくとも1区間の増幅に用いることができる少なくとも2つのオリゴヌクレオチドプライマーを含み得る。プライマーの代わりに、またはそれに追加して、キットは、標的座位および参照座位に対応するDNA断片を検出するための標識プローブを含み得る。種々の実施形態において、前記キットの一つまたは複数のオリゴヌクレオチドは、付録の表中の座位に対応している。典型的に、キットは、試験試料を分析し検査対象における生理機能または病態の状態を評価する際に使用者を手引きする取扱説明書も提供する。   In some examples, the kit can include at least two oligonucleotide primers that can be used to amplify at least one section of the target locus (eg, the locus in the appendix) and the reference locus. Instead of, or in addition to, primers, the kit can include labeled probes for detecting DNA fragments corresponding to target and reference loci. In various embodiments, one or more oligonucleotides of the kit corresponds to a locus in the table in the Appendix. Typically, the kit will also provide instructions that guide the user in analyzing the test sample and assessing the physiological or pathological condition in the test subject.

種々の実施形態において、胎児DNAおよび胎児を妊娠している女性対象由来のDNAの混合物を含有する生物試料中の胎児DNAを分析するキットが提供される。前記キットは、表S2A、S2B、S2C、S2D、S3A、S3B、S3C、およびS3Dに収載されるゲノム領域の少なくとも一区画に特異的にハイブリダイズする一つまたは複数のオリゴヌクレオチドを含み得る。従って、これらの表全てからの、または(are)1つの表のみからのいかなる数のオリゴヌクレオチドも、用いることができる。オリゴヌクレオチドはプライマーとして機能し得、表中の特定の領域に対応するプライマー対として構築され得る。   In various embodiments, a kit is provided for analyzing fetal DNA in a biological sample containing a mixture of fetal DNA and DNA from a female subject having a fetus. The kit may include one or more oligonucleotides that specifically hybridize to at least a partition of the genomic region listed in Tables S2A, S2B, S2C, S2D, S3A, S3B, S3C, and S3D. Thus, any number of oligonucleotides from all of these tables, or (are) only one table can be used. Oligonucleotides can function as primers and can be constructed as a primer pair corresponding to a particular region in the table.

VI. サイズおよびメチル化密度の関連性
血漿DNA分子は、短い分子の形態で循環血液中に存在することが知られており、大部分の分子は約160bpの長さを有している(YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91, YW Zheng at al. 2012 Clin Chem; 58: 549-558)。興味深いことに、我々のデータは、血漿DNA分子のメチル化状態およびサイズの間の関連性を明らかにした。このように、血漿DNA断片長はDNAメチル化レベルと関連している。血漿DNA分子の特徴的なサイズ特性は、大部分が、アポトーシス中の酵素的分解から生じ得るモノヌクレオソームと関連があることを示唆している。
VI. Size and Methylation Density Relationship Plasma DNA molecules are known to exist in the circulating blood in the form of short molecules, with most molecules having a length of approximately 160 bp (YMD Lo et. al. 2010 Sci Transl Med; 2: 61ra91, YW Zheng at al. 2012 Clin Chem; 58: 549-558). Interestingly, our data revealed a link between methylation status and size of plasma DNA molecules. Thus, plasma DNA fragment length is associated with DNA methylation levels. The characteristic size characteristics of plasma DNA molecules suggest that most are associated with mononucleosomes, which may result from enzymatic degradation during apoptosis.

循環DNAは天然では断片化されている。具体的には、循環胎児DNAは、母体血漿試料中の母体由来DNAよりも短い(KCA Chan et al. 2004 Clin Chem; 50: 88-92)。ペアエンド(paired-end)アライメントは亜硫酸水素塩によって処理されたDNAのサイズ解析を可能にするため、血漿DNA分子のサイズおよびそれらの各メチル化レベルの間に相関が存在するかどうかを、直接的に評価することができる。母体血漿および非妊娠成人女性の対照血漿試料においてこれを調べた。   Circulating DNA is naturally fragmented. Specifically, circulating fetal DNA is shorter than maternally-derived DNA in maternal plasma samples (KCA Chan et al. 2004 Clin Chem; 50: 88-92). Since paired-end alignment allows size analysis of bisulfite treated DNA, it is possible to directly determine whether there is a correlation between the size of plasma DNA molecules and their respective methylation levels. Can be evaluated. This was investigated in maternal plasma and control plasma samples of non-pregnant adult women.

本研究において各試料を解析するために、各DNA分子の両端に対するペアエンド配列決定(分子全体の配列決定を含む)を用いた。各DNA分子の末端配列の対を参照ヒトゲノムに整列させ、配列されたリードの最末端のゲノム座標を記録することで、配列決定されたDNA分子の長さを決定することができる。血漿DNA分子は天然において小分子に断片化されており、血漿DNAの配列決定ライブラリーは典型的にはいかなる断片化ステップも用いずに作成される。それ故、配列決定により推定された長さは、元の血漿DNA分子のサイズを表すものであった。   Paired-end sequencing on both ends of each DNA molecule (including whole molecule sequencing) was used to analyze each sample in this study. The length of the sequenced DNA molecule can be determined by aligning the terminal sequence pair of each DNA molecule with the reference human genome and recording the genomic coordinates of the extreme ends of the sequenced reads. Plasma DNA molecules are naturally fragmented into small molecules, and sequencing libraries of plasma DNA are typically made without any fragmentation step. Therefore, the length estimated by sequencing was representative of the size of the original plasma DNA molecule.

以前の研究において、母体血漿中の胎児DNA分子および母体DNA分子のサイズ特性を決定した(YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91)。血漿DNA分子がモノヌクレオソームに似たサイズを有し、胎児DNA分子が母体DNA分子よりも短かったことが示された。この研究において、血漿DNA分子のメチル化状態のそれらのサイズに対する関連性が決定された。   In a previous study, the size characteristics of fetal and maternal DNA molecules in maternal plasma were determined (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91). It was shown that plasma DNA molecules had a size similar to mononucleosomes and fetal DNA molecules were shorter than maternal DNA molecules. In this study, the relevance of the methylation status of plasma DNA molecules to their size was determined.

A. 結果
図17Aは、母体血漿DNA、非妊娠女性対照血漿DNA、胎盤DNAおよび末梢血DNAのサイズ分布を示す、プロット1700である。母体試料および非妊娠女性対照血漿において、これら2つの亜硫酸水素塩処理血漿試料は、最も豊富な166〜167bp長の全体配列および143bpよりも短いDNA分子の10bpの周期性(periodicity)を有する、先に報告された(YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91)ものと同じ特徴的なサイズ分布を示した。
A. Results FIG. 17A is a plot 1700 showing the size distribution of maternal plasma DNA, non-pregnant female control plasma DNA, placental DNA and peripheral blood DNA. In maternal samples and non-pregnant female control plasma, these two bisulfite-treated plasma samples had the most abundant total sequence of 166-167 bp long and 10 bp periodicity of DNA molecules shorter than 143 bp. (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91).

図17Bは、母体血漿、成人女性対照血漿、胎盤組織および成人女性対照血液のサイズ分布およびメチル化特性の、プロット1750である。同一サイズを有し、少なくとも1つのCpG部位を含有するDNA分子について、それらの平均メチル化密度を算出した。次に、DNA分子のサイズおよびそれらのメチル化密度の間の関連性をプロットした。具体的には、少なくとも1つのCpG部位を被覆する配列決定されたリードについて、50bpから最大180bpまでの範囲の各断片長の平均メチル化密度を決定した。興味深いことに、メチル化密度は血漿DNAサイズに伴って増加し、約166〜167bpで最大となった。しかし、このパターンは、超音波処理システムを用いて断片化された胎盤DNA試料および対照血液DNA試料においては観察されなかった。   FIG. 17B is a plot 1750 of size distribution and methylation profile of maternal plasma, adult female control plasma, placental tissue and adult female control blood. For DNA molecules having the same size and containing at least one CpG site, their average methylation density was calculated. Next, the relationship between the size of DNA molecules and their methylation densities was plotted. Specifically, for sequenced reads covering at least one CpG site, the average methylation density for each fragment length ranging from 50 bp up to 180 bp was determined. Interestingly, the methylation density increased with plasma DNA size and peaked at about 166-167 bp. However, this pattern was not observed in placental DNA samples and control blood DNA samples that were fragmented using the sonication system.

図18は、血漿DNA分子のメチル化密度およびサイズのプロットを示している。図18Aは、第一期母体血漿についてのプロット1800である。図18Bは、第三期母体血漿についてのプロット1850である。少なくとも1つのCpG部位を被覆する全ての配列決定されたリードのデータは、青色の曲線1805で表される。胎児特異的SNP対立遺伝子も含有したリードのデータは、赤色の曲線1810で表される。母体特異的SNP対立遺伝子も含有したリードのデータは緑色の曲線1815で表される。   FIG. 18 shows a plot of methylation density and size of plasma DNA molecules. FIG. 18A is a plot 1800 for first trimester maternal plasma. FIG. 18B is a plot 1850 for third trimester maternal plasma. The data for all sequenced reads covering at least one CpG site is represented by the blue curve 1805. Data for reads that also contained the fetal-specific SNP allele are represented by the red curve 1810. Data for reads that also contained the maternal-specific SNP allele are represented by the green curve 1815.

胎児特異的SNP対立遺伝子を含有していたリードは、胎児DNA分子由来と見なした。母体特異的SNP対立遺伝子を含有していたリードは、母体DNA分子由来と見なした。概して、高いメチル化密度を有するDNA分子はサイズがより長かった。この傾向は、第一期および第三期の両方における胎児DNA分子および母体DNA分子の両方に現れた。胎児DNA分子の全体サイズは、先に報告された母体DNA分子の全体サイズよりも短かった。   Reads that contained the fetal-specific SNP allele were considered to be from a fetal DNA molecule. Reads that contained maternal-specific SNP alleles were considered to be from maternal DNA molecules. In general, DNA molecules with higher methylation densities were longer in size. This trend appeared in both fetal and maternal DNA molecules in both first and third trimesters. The overall size of fetal DNA molecules was shorter than the overall size of maternal DNA molecules reported previously.

図19Aは、成人非妊娠女性の配列決定されたリードのメチル化密度およびサイズの、プロット1900を示している。成人非妊娠女性から得られた血漿DNA試料も、DNA分子のサイズおよびメチル化状態の間に同じ関連性を示した。一方、ゲノムDNA試料は、MPS解析に先立ち、超音波処理ステップによって断片化された。プロット1900に示されるように、血液細胞および胎盤組織検体から得られたデータは、同じ傾向を示さなかった。細胞の断片化は人工的であるため、サイズおよび密度の関連性は無いと予想される。血漿中の天然に断片化されたDNA分子はサイズに対する依存性を示すため、メチル化密度が低いほど、分子がより小さな断片に切断される可能性が高いと仮定することができる。   FIG. 19A shows a plot 1900 of methylation density and size of sequenced reads for adult non-pregnant women. Plasma DNA samples obtained from adult non-pregnant women also showed the same association between DNA molecule size and methylation status. On the other hand, the genomic DNA sample was fragmented by an sonication step prior to MPS analysis. As shown in plot 1900, the data obtained from blood cell and placental tissue specimens did not show the same trend. Since cell fragmentation is artificial, size and density are not expected to be related. Since naturally fragmented DNA molecules in plasma show size dependence, it can be assumed that the lower the methylation density, the more likely it is that the molecule will be cleaved into smaller fragments.

図19Bは、母体血漿中の胎児特異的DNA分子および母体特異的DNA分子のサイズ分布およびメチル化特性を示す、プロット1950である。胎児特異的血漿DNA分子および母体特異的血漿DNA分子も、断片化サイズおよびメチル化レベルの間に同じ相関を示した。胎盤由来循環無細胞DNAおよび母体循環無細胞DNAの断片長は共に、メチル化レベルに伴って増加した。さらに、それらのメチル化状態の分布は互いに重複せず、このことは、前記現象が循環DNA分子の供給源の元の断片長にかかわりなく起こることを示唆している。   FIG. 19B is a plot 1950 showing the size distribution and methylation profile of fetal-specific and maternal-specific DNA molecules in maternal plasma. Fetal-specific and maternal-specific plasma DNA molecules also showed the same correlation between fragmentation size and methylation level. Both placenta-derived circulating cell-free DNA and maternal circulating cell-free DNA fragment lengths increased with methylation levels. Moreover, their methylation status distributions do not overlap with each other, suggesting that the phenomenon occurs regardless of the original fragment length of the source of circulating DNA molecules.

B. 方法
従って、サイズ分布を用いることで、血漿試料の全体メチル化率を推定することができる。このメチル化測定値は次に、妊娠中、がんのモニタリング中、または図18Aおよび図18Bに示される関連性による、血漿DNAのサイズ分布の連続測定による処理中に、追跡することができる。メチル化測定値は、目的の臓器または組織からのDNA放出の増加または減少を探すことにも用いることができる。例えば、特定の臓器(例えば肝臓)に特有のDNAメチル化サインを具体的に探して、血漿中のこれらのサインの濃度を測定することができる。DNAは細胞が死ぬ際に血漿中に放出されるため、レベルの増加は、その特定の臓器または組織における細胞死または細胞傷害の増加を意味し得る。特定の臓器からのレベルの減少は、その臓器における傷害または病理過程に対抗する処置が制御下にあることを意味し得る。
B. Methods Therefore, the size distribution can be used to estimate the overall methylation rate of plasma samples. This methylation measurement can then be followed during pregnancy, during cancer monitoring, or during processing by continuous measurement of the size distribution of plasma DNA according to the relationships shown in Figures 18A and 18B. Methylation measurements can also be used to look for increased or decreased DNA release from the organ or tissue of interest. For example, DNA methylation signatures specific to particular organs (eg, liver) can be specifically sought and the concentration of these signatures in plasma determined. Since DNA is released into the plasma when cells die, increased levels may mean increased cell death or cytotoxicity in that particular organ or tissue. A decrease in levels from a particular organ may mean that the treatment against injury or pathological processes in that organ is under control.

図20は、本発明の実施形態に従って、生物の生物試料中のDNAのメチル化レベルを推定するための方法2000のフローチャートである。ゲノムの特定領域またはゲノム全体のメチル化レベルを推定することができる。特定領域が望ましい場合、その特定領域のみに由来するDNA断片が用いられ得る。   FIG. 20 is a flow chart of a method 2000 for estimating the methylation level of DNA in a biological sample of an organism, according to an embodiment of the invention. The methylation level of a particular region of the genome or of the entire genome can be estimated. If a specific region is desired, DNA fragments derived only from that specific region can be used.

ブロック2010において、様々なサイズに対応するDNA断片の量が測定される。複数のサイズの各サイズについて、サイズに対応する生物試料由来の複数のDNA断片の量が測定され得る。例えば、140塩基長を有するDNA断片の数が測定され得る。前記量はヒストグラムとして記録され得る。一実施形態では、生物試料由来の複数個の核酸のそれぞれのサイズが測定され、その測定は、個別に(例えば、分子全体または分子の末端のみの単一分子配列決定によって)、またはまとめて(例えば、電気泳動によって)行われ得る。サイズは範囲に対応し得る。従って、量は、特定の範囲内のサイズを有するDNA断片の量であり得る。ペアエンド配列決定が行われる場合、特定の領域に位置(整列)するDNA断片(ペア配列リードによって決定される)は、該領域のメチル化レベルを決定するために用いられ得る。   At block 2010, the amount of DNA fragments corresponding to various sizes is measured. For each size of the multiple sizes, the amount of multiple DNA fragments from the biological sample corresponding to the size can be measured. For example, the number of DNA fragments having 140 base length can be measured. The quantity may be recorded as a histogram. In one embodiment, the size of each of a plurality of nucleic acids from a biological sample is measured, and the measurements can be performed individually (eg, by single molecule sequencing of the entire molecule or only the ends of the molecule) or collectively (eg. (For example, by electrophoresis). The size can correspond to a range. Thus, the amount can be the amount of DNA fragments having a size within the specified range. When paired-end sequencing is performed, DNA fragments that are located (aligned) in a particular region (determined by paired sequence reads) can be used to determine the methylation level of that region.

ブロック2020において、第一パラメーターの第一の値が、複数のサイズにおけるDNA断片の量に基づいて算出される。一態様において、第一パラメーターは、生物試料中のDNA断片のサイズ特性(例えば、ヒストグラム)の統計的尺度を与える。前記パラメーターは、複数個のDNA断片のサイズから決定されることから、サイズパラメーターと称され得る。   At block 2020, a first value for the first parameter is calculated based on the amount of DNA fragments in the plurality of sizes. In one aspect, the first parameter provides a statistical measure of size characteristics (eg, histogram) of DNA fragments in a biological sample. Since the parameter is determined from the sizes of a plurality of DNA fragments, it can be referred to as a size parameter.

第一パラメーターは様々な形態のパラメーターであり得る。あるパラメーターは、全DNA断片に対する、または別のサイズまたは範囲のDNA断片に対する、特定のサイズまたはサイズ範囲のDNA断片の割合である。そのようなパラメーターは、ヒストグラム(特定のサイズの断片の絶対計数または相対計数を与えるあらゆるデータ構造)から得られ得る、断片の総数で除算された特定のサイズのDNA断片の数である。別の例として、パラメーターは、別のサイズまたは範囲の断片の数で除算された、特定のサイズの、または特定の範囲内の断片の数であり得る。除算は、異なる試料について解析されている異なる数のDNA断片を説明するための、正規化の機能を果たし得る。正規化は、各試料について同一数のDNA断片を解析することにより達成され得、これは、解析された断片の総数での除算と同じ結果を効率的に与える。パラメーターの、およびサイズ解析についてのさらなる例は、米国特許出願公開第13/789,553号に見出すことができる(あらゆる目的で参照によって組み込まれる)。   The first parameter can be of various forms. One parameter is the ratio of DNA fragments of a particular size or size range to total DNA fragments or to DNA fragments of another size or range. Such a parameter is the number of DNA fragments of a particular size divided by the total number of fragments that can be obtained from a histogram (any data structure giving absolute or relative counts of fragments of a particular size). As another example, a parameter can be the number of fragments of a particular size or within a particular range divided by the number of fragments of another size or range. Division can serve as a normalization function to account for the different numbers of DNA fragments being analyzed for different samples. Normalization can be achieved by analyzing the same number of DNA fragments for each sample, which effectively gives the same result as dividing by the total number of analyzed fragments. Further examples of parameters and for size analysis can be found in US Patent Application Publication No. 13 / 789,553 (incorporated by reference for all purposes).

ブロック2030において、第一のサイズ値が参照サイズ値と比較される。参照サイズ値は、参照試料のDNA断片から算出することができる。参照サイズ値を決定するために、参照試料のメチル化特性が算出および定量化され、同様に、第一サイズパラメーターの値が算出および定量化され得る。このように、第一のサイズ値が参照サイズ値と比較されると、メチル化レベルが決定され得る。   At block 2030, the first size value is compared to the reference size value. The reference size value can be calculated from the DNA fragment of the reference sample. To determine the reference size value, the methylation properties of the reference sample can be calculated and quantified, as can the value of the first size parameter. Thus, when the first size value is compared to the reference size value, the methylation level can be determined.

ブロック2040において、メチル化レベルが前記比較に基づいて推定される。一実施形態では、第一パラメーターの第一の値が参照サイズ値を超えるまたは下回るかどうかが決定され、それにより、目下の試料のメチル化レベルが参照サイズ値に対するメチル化レベルを上回るかまたは下回るかどうかが決定され得る。別の実施形態では、前記比較は、第一の値を較正関数に入力することにより達成される。較正関数は、第一の値に対応する曲線上の点を特定することにより、第一の値を較正値(一連の参照サイズ値)と効率的に比較することができる。次いで、推定メチル化レベルが較正関数の出力値として与えられる。   At block 2040, the methylation level is estimated based on the comparison. In one embodiment, it is determined whether the first value of the first parameter is above or below the reference size value, whereby the methylation level of the current sample is above or below the methylation level relative to the reference size value. Whether or not can be determined. In another embodiment, said comparing is accomplished by inputting a first value into a calibration function. The calibration function can efficiently compare the first value with the calibration value (a series of reference size values) by identifying the point on the curve that corresponds to the first value. The estimated methylation level is then given as the output value of the calibration function.

従って、サイズパラメーターはメチル化レベルに合わせて較正することができる。例えば、メチル化レベルは、測定され、その試料の特定のサイズパラメーターと関連付けられ得る。次に、種々の試料からのデータポイントが較正関数に当てはめられ得る。ある実施において、異なる較正関数が、異なるDNAサブセットに用いられ得る。従って、特定のDNAサブセットのメチル化およびサイズの間の関連性に関する予備知識に基づく、いくつかの較正の形態が存在し得る。例えば、胎児DNAおよび母体DNAの較正は異なり得る。   Therefore, the size parameter can be calibrated to the methylation level. For example, the methylation level can be measured and associated with a particular size parameter of the sample. The data points from various samples can then be fitted to a calibration function. In some implementations, different calibration functions may be used for different DNA subsets. Therefore, there may be several forms of calibration based on prior knowledge of the association between methylation and size of a particular DNA subset. For example, the calibration of fetal and maternal DNA can be different.

上記に示したように、胎盤は母体血と比較してより低メチル化状態であるため、胎児DNAは、そのより低度のメチル化のために、より小さい。従って、試料の断片の平均サイズ(または他の統計値)を用いることで、メチル化密度を推定することができる。断片サイズは、技術的により複雑であり得るメチル化認識配列決定ではなく、ペアエンド配列決定を用いて測定することができるため、このアプローチは、臨床に用いた場合に対費用効果が高い可能性がある。このアプローチは、妊娠の進行に伴う、または子癇前症、早産および胎児障害(例えば、染色体もしくは遺伝子異常または子宮内胎児発育遅延によって引き起こされる障害)等の妊娠関連疾患と関連する、メチル化変化をモニタリングするために用いることができる。   As indicated above, fetal DNA is smaller due to its lower methylation because the placenta is more hypomethylated compared to maternal blood. Therefore, by using the average size (or other statistic) of the sample fragments, the methylation density can be estimated. This approach can be cost-effective when used clinically, as fragment size can be measured using paired-end sequencing rather than methylation recognition sequencing, which can be technically more complex. is there. This approach eliminates methylation changes associated with the progress of pregnancy or associated with pregnancy-related diseases such as preeclampsia, preterm birth and fetal disorders (eg, disorders caused by chromosomal or genetic abnormalities or intrauterine growth retardation). It can be used for monitoring.

別の実施形態では、このアプローチは、がんの検出およびモニタリングに用いることができる。例えば、がんの治療が成功することで、このサイズに基づくアプローチを用いて測定される血漿または別の体液におけるメチル化特性は、がんを有さない健常人のそれに向かって変化するだろう。逆に、がんが進行中である場合では、血漿または別の体液におけるメチル化特性は、がんを有さない健常人のそれから逸脱するだろう。   In another embodiment, this approach can be used for cancer detection and monitoring. For example, successful treatment of cancer will shift the methylation profile in plasma or other body fluids measured using this size-based approach towards that of healthy individuals without cancer. . Conversely, if the cancer is in progress, the methylation profile in plasma or another body fluid will deviate from that of a healthy person without cancer.

要約すると、低メチル化分子は、血漿中で高度メチル化分子よりも短かった。胎児DNA分子および母体DNA分子の両方において同じ傾向が観察された。DNAメチル化ヌクレオソームの詰め込みに影響を与えることが知られていることから、我々のデータは、恐らく低メチル化DNA分子にはより低密度にヒストンが詰め込まれており、そのために、酵素的分解の影響をより受け易いことを示唆している。一方、図18Aおよび図18Bに示されるデータにより、胎児DNAが母体リードよりもはるかに低メチル化状態であるにもかかわらず、胎児DNAおよび母体DNAのサイズ分布は互いから完全には分離しないことも示された。図19Bにおいて、同じサイズ分類であっても、胎児特異的リードおよび母体特異的リードのメチル化レベルは互いに異なることを理解することができる。この観察は、胎児DNAの低メチル化状態が、母体DNAに対するその相対的な短さを説明する唯一の因子ではないことを示唆している。   In summary, hypomethylated molecules were shorter in plasma than hypermethylated molecules. The same trend was observed for both fetal and maternal DNA molecules. Given that it is known to affect the packing of DNA methylated nucleosomes, our data indicate that hypomethylated DNA molecules are probably less densely packed with histones, which results in enzymatic degradation. It suggests that they are more susceptible. On the other hand, the data shown in Figures 18A and 18B indicate that the fetal and maternal DNA size distributions are not completely separate from each other, even though fetal DNA is much less methylated than maternal reads. Was also shown. It can be seen in FIG. 19B that the fetal-specific and maternal-specific reads have different methylation levels, even though they are of the same size classification. This observation suggests that the hypomethylated state of fetal DNA is not the only factor explaining its relative shortness to maternal DNA.

VII. 遺伝子座の刷り込み状態
母体血漿中の母親と同じ遺伝子型を共有するが異なるエピジェネティックサインを有する胎児由来DNA分子は、検出が可能である(LLM Poon et al. 2002 Clin Chem; 48: 35-41)。配列決定アプローチが母体血漿中の胎児由来DNA分子の捕捉において感度が高いことを示すために、同じ戦略を、母体血漿試料中の刷り込み胎児対立遺伝子の検出に適用した。2つのゲノム刷り込み領域が特定された:H19(11番染色体:1,977,419〜1,977,821、NCBI Build36/hg18)およびMEST(7番染色体:129,917,976〜129,920,347、NCBI Build36/hg18)。それらは共に、母体配列および胎児配列を区別するための有益なSNPを含有している。母体で発現される遺伝子であるH19に関して、領域内のSNP rs2071094(11番染色体:1,977,740)について、母親はホモ接合性(A/A)であり、胎児はヘテロ接合性(A/C)であった。A母体対立遺伝子の一方は充分にメチル化されており、他方は非メチル化状態であった。しかし、胎盤においては、対立遺伝子Aは非メチル化状態であったが、一方、父親から遺伝したC対立遺伝子は充分にメチル化されていた。胎盤由来の刷り込まれた父性対立遺伝子に対応するC遺伝子型を有する2つのメチル化リードを母体血漿中で検出した。
VII. Imprinted state of the locus Fetus-derived DNA molecules that share the same genotype as maternal but different epigenetic signatures in maternal plasma are detectable (LLM Poon et al. 2002 Clin Chem; 48: 35- 41). To show that the sequencing approach is sensitive in capturing fetal DNA molecules in maternal plasma, the same strategy was applied to the detection of imprinted fetal alleles in maternal plasma samples. Two genomic imprinted regions have been identified: H19 (chromosome 11: 1,977,419-1977,821, NCBI Build36 / hg18) and MEST (chromosome 7: 129,917,976-129,920). , 347, NCBI Build 36 / hg18). Both of them contain valuable SNPs for distinguishing maternal and fetal sequences. Regarding H19, which is a gene expressed in the mother, for the SNP rs2071094 (chromosome 11: 1,977,740) in the region, the mother is homozygous (A / A) and the fetus is heterozygous (A / C). One of the A maternal alleles was fully methylated and the other was unmethylated. However, in placenta, the allele A was unmethylated, while the C allele inherited from the father was fully methylated. Two methylated leads with a C genotype corresponding to the imprinted paternal allele from placenta were detected in maternal plasma.

MESTは、PEG1としても知られており、これは父親性発現遺伝子である。母親および胎児の両方が、刷り込み遺伝子座内のSNP rs2301335(7番染色体:129,920,062)についてヘテロ接合性(A/G)であった。母体血において、G対立遺伝子はメチル化されいたが、A対立遺伝子は非メチル化状態であった。胎盤におけるメチル化パターンは逆転しており、母性A対立遺伝子はメチル化されいて、父性G対立遺伝子は非メチル化状態であった。父親由来の3つの非メチル化状態のG対立遺伝子は、母体血漿中で検出可能であった。対照的に、19番染色体上の非刷り込み遺伝子座(19番染色体:6,723,621−6,724,121)であるVAV1は、組織および血漿DNA試料においていかなる対立遺伝子メチル化パターンも示さなかった。   MEST, also known as PEG1, is a paternally expressed gene. Both mother and fetus were heterozygous (A / G) for SNP rs2301335 (Chromosome 7: 129,920,062) within the imprinted locus. In maternal blood, the G allele was methylated while the A allele was unmethylated. The methylation pattern in the placenta was reversed, the maternal A allele was methylated and the paternal G allele was unmethylated. The three unmethylated G alleles from the father were detectable in maternal plasma. In contrast, VAV1, a non-imprinted locus on chromosome 19 (chromosome 19: 6,723, 621-6, 724, 121), shows any allelic methylation pattern in tissue and plasma DNA samples. There wasn't.

従って、メチル化状態は、どのDNA断片が胎児由来であるかを決定するのに用いることができる。例えば、母体血漿中のA対立遺伝子の検出だけでは、母親がGAヘテロ接合性である場合に、胎児マーカーとして用いることができない。しかし、血漿中のA分子のメチル化状態を識別する場合、メチル化されたA分子は胎児特異的であり、一方非メチル化状態のA分子は母体特異的であり、あるいは逆も同じである。   Therefore, the methylation status can be used to determine which DNA fragment is of fetal origin. For example, detection of the A allele in maternal plasma alone cannot be used as a fetal marker when the mother is GA heterozygous. However, when identifying the methylation status of A molecules in plasma, methylated A molecules are fetal-specific, while unmethylated A molecules are maternal-specific and vice versa. .

次に、胎盤組織においてゲノム刷り込みを示すことが報告されている遺伝子座に焦点を当てた。Woodfine et al.(2011 Epigenetics Chromatin; 4: 1)によって報告された遺伝子座のリストに基づいて、刷り込み制御領域内でSNPを含有していた遺伝子座をさらに選別した。4つの遺伝子座が判定基準を満たし、これらは、H19、KCNQ10T1、MESTおよびNESPであった。   Next, we focused on the loci reported to show genomic imprinting in placental tissue. Based on the list of loci reported by Woodfine et al. (2011 Epigenetics Chromatin; 4: 1), loci that contained SNPs within the imprinted control region were further selected. Four loci met the criteria, these were H19, KCNQ10T1, MEST and NESP.

H19およびKCNQ10T1の母体血細胞試料のリードに関して、これらの母体リードは、SNPについてホモ接合性であり、メチル化リードおよび非メチル化リードはおよそ等しい割合であった。CVSおよび妊娠末期胎盤組織検体によって、胎児が両方の遺伝子座についてヘテロ接合性であり、各対立遺伝子が排他的にメチル化または非メチル化状態である、すなわち単一対立遺伝子性メチル化を示すことが明らかになった。母体血漿試料において、父親から遺伝された胎児DNA分子が両方の遺伝子座において検出された。H19において、父親から遺伝された分子は、胎児特異的対立遺伝子を含有していた配列決定されたリードによって表され、メチル化されていた。KCNQ10T1において、父親から遺伝された分子は、胎児特異的対立遺伝子を含有していた配列決定されたリードによって表され、非メチル化状態であった。   With respect to the leads of the H19 and KCNQ10T1 maternal blood cell samples, these maternal reads were homozygous for the SNPs with approximately equal proportions of methylated and unmethylated reads. CVS and late pregnancy placental tissue specimens indicate that the fetus is heterozygous for both loci and each allele is exclusively methylated or unmethylated, ie, monoallelic methylation Became clear. In the maternal plasma sample, fetal DNA molecules inherited from the father were detected at both loci. In H19, the paternally inherited molecule was methylated, represented by a sequenced read that contained a fetal-specific allele. In KCNQ10T1, the paternally inherited molecule was represented by a sequenced read that contained a fetal-specific allele and was unmethylated.

一方、母親はMESTおよびNESPの両方についてヘテロ接合性であった。MESTに関して、母親および胎児の両方がSNPについてGAヘテロ接合体であった。しかし、母体血細胞および胎盤組織のワトソン鎖のデータから明らかなように、SNPに隣接したCpGのメチル化状態は母親および胎児において反対であった。A対立遺伝子は母親のDNAにおいて非メチル化状態であったが、胎児のDNAにおいてはメチル化されていた。MESTに関して、母性対立遺伝子はメチル化されていた。従って、胎児はその母親から遺伝されたA対立遺伝子(CVSにおいてメチル化状態)を有しており、その母親は彼女の父親から遺伝されたA対立遺伝子(母体血細胞において非メチル化状態)を有していたことを特定することができる。興味深いことに、母体血漿試料において、4つ全ての分子群は容易に区別することができた(例えば、母親の2つの対立遺伝子のそれぞれおよび胎児の2つの対立遺伝子のそれぞれ)。従って、遺伝子型情報を刷り込み遺伝子座におけるメチル化状態と組み合わせることにより、母親から遺伝された胎児DNA分子をバックグラウンド母体DNA分子から容易に区別することができた(LLM Poon et al. 2002 Clin Chem; 48: 35-41)。   On the other hand, the mother was heterozygous for both MEST and NESP. For MEST, both mother and fetus were GA heterozygotes for SNPs. However, the methylation status of CpGs adjacent to SNPs was opposite in the mother and fetus, as evidenced by data on maternal blood cells and placental tissue Watson chains. The A allele was unmethylated in maternal DNA, but methylated in fetal DNA. For MEST, the maternal allele was methylated. Thus, the fetus has the A allele (methylated in CVS) inherited from its mother, and the mother has the A allele (unmethylated in maternal blood cells) inherited from her father. You can identify what you were doing. Interestingly, in maternal plasma samples, all four molecular groups were easily distinguishable (eg, each of the mother's two alleles and each of the fetus's two alleles). Therefore, fetal DNA molecules inherited from the mother could be easily distinguished from background maternal DNA molecules by combining the genotype information with the methylation status at the imprinted locus (LLM Poon et al. 2002 Clin. Chem; 48: 35-41).

このアプローチは片親性ダイソミーを検出するのに用いることができる。例えば、この胎児の父親がG対立遺伝子についてホモ接合性であることが分かっている場合、非メチル化状態のG対立遺伝子が母体血漿中に検出できないことは、父性対立遺伝子の寄与の欠如を示している。さらに、そのような状況下で、メチル化されたG対立遺伝子およびメチル化されたA対立遺伝子の両方がこの妊娠女性の血漿中に検出された場合、胎児が母親由来のヘテロダイソミー(heterodisomy)を有していること、すなわち、父親から遺伝はされずに母親から2つの異なる対立遺伝子を受け継いでいることが示唆される。あるいは、メチル化状態のA対立遺伝子(母親から受け継いだ胎児性対立遺伝子)および非メチル化状態のA対立遺伝子(母方の祖父から受け継いだ母性対立遺伝子)の両方が、非メチル化状態のG対立遺伝子(胎児に遺伝されているはずの父性対立遺伝子)無しで、母体血漿中に検出された場合、胎児が母親由来のイソダイソミー(isodisomy)を有すること、すなわち、母親から2つの同一の対立遺伝子を受け継ぎ、父親からは何も受け継いでいないことが示唆される。   This approach can be used to detect uniparental disomy. For example, if the father of this fetus is known to be homozygous for the G allele, the failure to detect the unmethylated G allele in maternal plasma indicates a lack of paternal allele contribution. ing. Furthermore, under such circumstances, if both the methylated G allele and the methylated A allele are detected in the plasma of this pregnant woman, the fetus will develop maternal heterodisomy. It is suggested that they have, that is, they do not inherit from their father but inherit two different alleles from their mother. Alternatively, both the methylated A allele (fetal allele inherited from the mother) and the unmethylated A allele (maternal allele inherited from the maternal grandfather) are both unmethylated G alleles. The fetus has maternal-derived isodisomy when it is detected in maternal plasma without the gene (the paternal allele that should have been inherited by the fetus), ie, two identical alleles from the mother He inherited it, and his father suggests he has not inherited anything.

NESPに関して、母親はSNPにおいてGAヘテロ接合体であり、一方、胎児はG対立遺伝子についてホモ接合性であった。NESPにおいて、父性対立遺伝子はメチル化されていた。母体血漿試料において、メチル化状態の、父親から遺伝された胎児性G対立遺伝子は、非メチル化状態のバックグラウンド母性G対立遺伝子から容易に区別することができた。   For NESP, the mother was GA heterozygous at the SNP, while the fetus was homozygous for the G allele. In NESP, the paternal allele was methylated. In maternal plasma samples, the methylated, paternally inherited fetal G alleles were easily distinguishable from the unmethylated background maternal G alleles.

VIII. がん/供与者
いくつかの実施形態は、循環血漿/血清DNAのメチル化解析を用いたがんの検出、検診、モニタリング(例えば、再発、軽快、または治療に対する応答(例えば、存在または不在)の)、病期分類、分類(例えば、最も適切な治療法の選択を助けるための)および予後判定に、用いることができる。
VIII. Cancer / Donors In some embodiments, cancer detection, screening, monitoring (eg, relapse, remission, or response to therapy (eg, present or absent)) using methylation analysis of circulating plasma / serum DNA. ,), Staging, classification (eg, to aid in selecting the most appropriate treatment) and prognosis.

がんDNAは異常なDNAメチル化を示すことが知られている(JG Herman et al. 2003 N Engl J Med; 349: 2042-2054)。例えば、非がん細胞と比較して、遺伝子(例えば、腫瘍抑制遺伝子)のCG島プロモーターは高度メチル化されているが、その遺伝子本体のCpG部位は低メチル化状態である。がん細胞のメチル化特性が、本明細書に記載の方法を用いて、腫瘍由来血漿DNA分子のメチル化特性に反映され得る場合、血漿における全体的なメチル化特性は、がんを有さない健常人と比較した場合に、またはがんが治癒されている者と比較した場合に、がんを有する個体間で異なるであろうことが予想される。メチル化特性における差異の種類は、ゲノムのメチル化密度および/またはのゲノムの区画のメチル化密度における定量的差異に関してであり得る。例えば、がん組織由来のDNAの普遍的な低メチル化性質(Gama-Sosa MA et al. 1983 Nucleic Acids Res; 11: 6883-6894)から、血漿メチロームまたはゲノムの区画におけるメチル化密度の減少が、がん患者の血漿において観察されるだろう。   Cancer DNA is known to exhibit abnormal DNA methylation (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054). For example, compared to non-cancer cells, the CG island promoter of a gene (eg, tumor suppressor gene) is hypermethylated, but the CpG site of the gene itself is hypomethylated. If the methylation profile of cancer cells can be reflected in the methylation profile of tumor-derived plasma DNA molecules using the methods described herein, the overall methylation profile in plasma is cancer-bearing. It is expected that there will be differences between individuals with cancer when compared to healthy individuals or when the cancer has been cured. The type of difference in methylation properties can be in terms of quantitative differences in the methylation density of the genome and / or of the compartments of the genome. For example, due to the universal hypomethylation property of DNA derived from cancer tissues (Gama-Sosa MA et al. 1983 Nucleic Acids Res; 11: 6883-6894), there is a decrease in methylation density in plasma methylome or genomic compartments. , Will be observed in the plasma of cancer patients.

メチル化特性における定量的変化は、血漿メチロームデータ間でも反映されるはずである。例えば、がん細胞においてのみ高度メチル化されている遺伝子に由来する血漿DNA分子は、同一遺伝子に由来するが健常対照の試料中の血漿DNA分子と比較した場合に、がん患者の血漿において高度メチル化を示すであろう。異常なメチル化は大部分のがんにおいて生じているため、本明細書に記載の方法は、異常なメチル化を有するあらゆる形態の悪性腫瘍、例えば、限定はされないが、肺、乳房、結腸直腸、前立腺、鼻咽頭、胃、精巣、皮膚、神経系、骨、卵巣、肝臓、血液系組織、膵臓、子宮、腎臓、膀胱、リンパ組織等における悪性腫瘍の検出に適用することができる。悪性腫瘍は、例えば、癌腫、腺癌、肉腫、線維腺癌、神経内分泌、および未分化癌等の、種々の組織学的亜型の悪性腫瘍であってもよい。   Quantitative changes in methylation profile should also be reflected among plasma methylome data. For example, a plasma DNA molecule derived from a gene that is hypermethylated only in cancer cells is highly expressed in the plasma of cancer patients when compared to plasma DNA molecules derived from the same gene but in healthy control samples. Will show methylation. Because aberrant methylation occurs in most cancers, the methods described herein can be applied to any form of malignancy with aberrant methylation, including but not limited to lung, breast, colorectal. , Prostate, nasopharynx, stomach, testis, skin, nervous system, bone, ovary, liver, blood system tissue, pancreas, uterus, kidney, bladder, lymphoid tissue and the like. Malignant tumors may be malignant tumors of various histological subtypes, such as, for example, carcinoma, adenocarcinoma, sarcoma, fibroadenocarcinoma, neuroendocrine, and undifferentiated carcinoma.

一方、腫瘍由来DNA分子はバックグラウンド非腫瘍由来DNA分子から区別することができることが予想されるが、それは、腫瘍由来DNAの全体的に短いサイズ特性が、DNA分子のサイズに対してさらなる影響を及ぼすであろう、腫瘍関連性の異常な低メチル化を有する遺伝子座由来のDNA分子において強調されるためである。また、腫瘍由来血漿DNA分子は、腫瘍DNAに関連する複数の特性、例えば、限定はされないが、単一ヌクレオチド変異、コピー数の増加および減少、転座、逆位、異常な高度または低度メチル化並びにサイズ特性を用いて、バックグラウンド非腫瘍由来血漿DNA分子から区別することができる。これらの変化は全て独立して起こり得るため、これらの特徴の併用は、血漿中のがんDNAの高感度且つ特異的な検出のための、さらなる利点を与え得る。   On the other hand, it is expected that tumor-derived DNA molecules can be distinguished from background non-tumor-derived DNA molecules, because the overall short size characteristics of tumor-derived DNA have an additional effect on the size of DNA molecules. This is because it is emphasized in DNA molecules derived from loci having abnormal tumor-associated aberrant hypomethylation. Tumor-derived plasma DNA molecules also have multiple characteristics associated with tumor DNA, such as, but not limited to, single nucleotide mutations, increased and decreased copy numbers, translocations, inversions, abnormally high or low methylation. Characterization and size characteristics can be used to distinguish from background non-tumor derived plasma DNA molecules. Since all of these changes can occur independently, the combination of these features may offer additional advantages for sensitive and specific detection of cancer DNA in plasma.

A. サイズおよびがん
血漿中の腫瘍由来DNA分子のサイズはまた、モノヌクレオソーム単位のサイズに似ており、がん患者の血漿中に同時に存在しているバックグラウンド非腫瘍由来DNA分子よりも短い。サイズパラメーターは、米国特許出願公開第13/789,553号(あらゆる目的で参照によって組み込まれる)に記載されているように、がんと関連があることが示されている。
A. Size and Cancer The size of tumor-derived DNA molecules in plasma is also similar to the size of mononucleosome units and is shorter than the background non-tumor-derived DNA molecules that are simultaneously present in plasma of cancer patients. Size parameters have been shown to be associated with cancer, as described in US Patent Application Publication No. 13 / 789,553, incorporated by reference for all purposes.

血漿中の胎児由来DNAおよび母体由来DNAの両方が分子のサイズおよびメチル化状態の間に関連性を示したことから、腫瘍由来DNA分子は同じ傾向を示すことが予想される。例えば、低メチル化分子は、がん患者の血漿またはがん検査を受ける対象において、高度メチル化分子よりも短いだろう。   Tumor-derived DNA molecules are expected to show the same trend, as both fetal and maternal DNA in plasma showed an association between molecular size and methylation status. For example, a hypomethylated molecule will be shorter than a hypermethylated molecule in the plasma of cancer patients or in a subject undergoing a cancer test.

B. がん患者における様々な組織のメチル化密度
この例において、肝細胞癌(HCC)患者の血漿および組織試料を解析した。腫瘍の外科的切除の前、およびその1週間後にHCC患者から血液試料を採取した。血液試料の遠心分離後に血漿および軟膜を収集した。切除腫瘍および隣接非腫瘍性肝組織を採取した。血漿および組織試料から抽出したDNA試料を、事前の亜硫酸水素塩処理有りおよび無しの大規模並列配列決定を用いて解析した。がんを有さない4人の健常人から得られた血漿DNAも、対照として解析した。DNA試料の亜硫酸水素塩処理により、非メチル化シトシン残基はウラシルに変換される。下流のポリメラーゼ連鎖反応および配列決定において、これらのウラシル残基はチミジンとして振る舞う。一方、亜硫酸水素塩処理によってメチル化シトシン残基がウラシルに変換されない。大規模並列配列決定の後、配列決定リードをMethy−Pipeを用いて解析して(P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis, paper presented at the IEEE International Conference on Bioinformatics and Biomedicine Workshops, Hong Kong, 18 to 21 December 2010)、全てのCGジヌクレオチド位置(すなわち、CpG部位)におけるシトシン残基のメチル化状態を決定した。
B. Methylation Densities of Different Tissues in Cancer Patients In this example, plasma and tissue samples of hepatocellular carcinoma (HCC) patients were analyzed. Blood samples were taken from HCC patients before and one week after surgical resection of the tumor. Plasma and buffy coat were collected after centrifugation of blood samples. Excised tumor and adjacent non-neoplastic liver tissue were collected. DNA samples extracted from plasma and tissue samples were analyzed using massively parallel sequencing with and without prior bisulfite treatment. Plasma DNA obtained from 4 healthy individuals without cancer was also analyzed as a control. Bisulfite treatment of DNA samples converts unmethylated cytosine residues to uracil. In the downstream polymerase chain reaction and sequencing, these uracil residues behave as thymidines. On the other hand, bisulfite treatment does not convert methylated cytosine residues to uracil. After massively parallel sequencing, sequencing reads were analyzed using Methy-Pipe (P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis, paper presented at the IEEE International. Conference on Bioinformatics and Biomedicine Workshops, Hong Kong, 18 to 21 December 2010), the methylation status of cytosine residues at all CG dinucleotide positions (ie CpG sites) was determined.

図21Aは、HCC患者の手術前血漿および組織試料のメチル化密度を示す表2100である。目的領域(例えば、CpG部位、プロモーター、または反復領域等)のCpGメチル化密度は、ゲノムのCpGジヌクレオチドを被覆するリードの総数に対するCpGメチル化を示すリードの割合を指す。軟膜および非腫瘍性肝組織のメチル化密度は同様であった。全ての常染色体から得られるデータに基づく腫瘍組織の全体メチル化密度は、軟膜および非腫瘍性肝組織のそれよりも25%より低かった。低メチル化は個々の染色体全てにおいて一貫していた。血漿のメチル化密度は非悪性組織およびがん組織の値の間であった。この観察は、がん組織および非がん組織の両方ががん患者の循環DNAに寄与しているという事実と一致している。造血系が、活性な悪性状態を有さない個体における循環DNAの主な供給源であることも示されている(YYN Lui, et al. 2002 Clin Chem; 48: 421-7)。従って、4人の健常対照群から得られた血漿試料も解析した。試料ごとに達成された配列リードの数および配列決定深度を図21Bの表2150に示す。   FIG. 21A is a table 2100 showing pre-operative plasma and tissue sample methylation densities of HCC patients. The CpG methylation density of a region of interest (eg, CpG site, promoter, or repeat region) refers to the ratio of reads showing CpG methylation to the total number of reads covering genomic CpG dinucleotides. The methylation densities of buffy coat and non-neoplastic liver tissue were similar. The overall methylation density of tumor tissue based on data obtained from all autosomes was 25% lower than that of buffy coat and non-neoplastic liver tissue. Hypomethylation was consistent on all individual chromosomes. Plasma methylation density was between that of non-malignant and cancerous tissues. This observation is consistent with the fact that both cancerous and non-cancerous tissue contribute to circulating DNA in cancer patients. It has also been shown that the hematopoietic system is the major source of circulating DNA in individuals who do not have an active malignant state (YYN Lui, et al. 2002 Clin Chem; 48: 421-7). Therefore, plasma samples obtained from 4 healthy control groups were also analyzed. The number of sequence reads and sequencing depth achieved for each sample is shown in Table 2150 of Figure 21B.

図22は、常染色体におけるメチル化密度が健常対照群の血漿試料において71.2%〜72.5%の範囲であったことを示す、表220である。これらのデータにより、腫瘍DNAの供給源を有さない個体から得られた血漿試料中のDNAメチル化の予測レベルが示された。がん患者においては、腫瘍組織も血行中にDNAを放出する(KCA Chan et al. 2013 Clin Chem; 59: 211-224); RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154)。HCC腫瘍の低メチル化性質のために、患者の手術前血漿中の腫瘍由来DNAおよび非腫瘍由来DNAの両方の存在は、健常対照群の血漿内レベルと比較した場合のメチル化密度の減少をもたらす。実際に、手術前血漿試料のメチル化密度は、腫瘍組織のメチル化密度および健常対照群の血漿のメチル化密度の間であった。その理由は、がん患者の血漿DNAのメチル化レベルが、腫瘍組織の異常なメチル化の程度(この場合は低メチル化)および循環血液中の腫瘍由来DNAの濃度分率によって影響を受けるためである。腫瘍組織のより低いメチル化密度および循環血液中の腫瘍由来DNAのより高い濃度分率は、がん患者における血漿DNAのより低いメチル化密度をもたらす。大部分の腫瘍は、全体的な低メチル化を示すことが報告されている(JG Herman et al. 2003 N Engl J Med; 349: 2042-2054; MA Gama-Sosa et al. 1983 Nucleic Acids Res; 11: 6883-6894)。従って、HCC試料において見られる現在の知見は、他の型の腫瘍にも適用可能なはずである。   FIG. 22 is a table 220 showing that autosomal methylation densities ranged from 71.2% to 72.5% in plasma samples from the healthy control group. These data showed predictive levels of DNA methylation in plasma samples obtained from individuals who had no source of tumor DNA. In cancer patients, tumor tissues also release DNA into the bloodstream (KCA Chan et al. 2013 Clin Chem; 59: 211-224); RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Due to the hypomethylated nature of HCC tumors, the presence of both tumor-derived and non-tumor-derived DNA in the patient's pre-operative plasma resulted in reduced methylation density when compared to plasma levels in healthy controls. Bring In fact, the methylation densities of the pre-operative plasma samples were between those of the tumor tissue and the plasma of healthy controls. The reason is that the plasma DNA methylation level of cancer patients is affected by the degree of abnormal methylation of tumor tissue (in this case, hypomethylation) and the concentration fraction of tumor-derived DNA in the circulating blood. Is. The lower methylation density of tumor tissue and the higher concentration fraction of tumor-derived DNA in the circulating blood results in lower methylation density of plasma DNA in cancer patients. Most tumors have been reported to exhibit global hypomethylation (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054; MA Gama-Sosa et al. 1983 Nucleic Acids Res; 11: 6883-6894). Therefore, the current findings found in HCC samples should be applicable to other types of tumors.

一実施形態では、血漿DNAのメチル化密度を用いることで、腫瘍組織のメチル化レベルが既知である場合に血漿/血清試料中の腫瘍由来DNAの濃度分率を決定することができる。腫瘍組織のメチル化レベル(例えば、メチル化密度)は、腫瘍試料が入手可能である、または腫瘍の生検が入手可能である場合に得ることができる。別の実施形態では、腫瘍組織のメチル化レベルに関する情報は、類似の型の腫瘍群におけるメチル化レベルの調査から得ることができ、この情報(例えば、平均レベルまたはレベル中央値)は、本発明に記載の科学技術を用いて解析される患者に適用される。腫瘍組織のメチル化レベルは、患者の腫瘍組織の解析によって決定、または、同一もしくは類似のがん型を有する他の患者の腫瘍組織の解析から推測することができる。腫瘍組織のメチル化は、一連のメチル化認識プラットフォーム、例えば、限定はされないが、大規模並列配列決定、単一分子配列決定、マイクロアレイ(例えば、オリゴヌクレオチドアレイ)、または質量分析(例えば、Epityper解析、シクアノム社(Sequenom, Inc.))を用いて決定することができる。いくつかの実施形態において、そのような解析は、DNA分子のメチル化状態に敏感な手順、例えば、限定はされないが、シトシン免疫沈降およびメチル化認識制限酵素消化に先行され得る。腫瘍のメチル化レベルが既知である場合、がん患者の血漿中の腫瘍DNAの濃度分率は、血漿メチローム解析後に算出することができる。   In one embodiment, the methylation density of plasma DNA can be used to determine the concentration fraction of tumor-derived DNA in plasma / serum samples when the methylation level of tumor tissue is known. Tumor tissue methylation levels (eg, methylation density) can be obtained if a tumor sample is available or a tumor biopsy is available. In another embodiment, information about the methylation level of tumor tissue can be obtained from a survey of methylation levels in groups of tumors of similar type, which information (eg, mean or median level) It is applied to patients analyzed using the technology described in. The level of tumor tissue methylation can be determined by analysis of the patient's tumor tissue, or inferred from analysis of tumor tissue of other patients with the same or similar cancer types. Tumor tissue methylation may be performed by a series of methylation recognition platforms such as, but not limited to, massively parallel sequencing, single molecule sequencing, microarrays (eg, oligonucleotide arrays), or mass spectrometry (eg, Epiperper analysis). , Sequenom, Inc.). In some embodiments, such an analysis may be preceded by a methylation status sensitive procedure of the DNA molecule, including but not limited to cytosine immunoprecipitation and methylation recognition restriction enzyme digestion. If the methylation level of the tumor is known, the concentration fraction of tumor DNA in the plasma of cancer patients can be calculated after plasma methylome analysis.

血漿メチル化レベル(P)、腫瘍DNA濃度分率(f)、および腫瘍組織メチル化レベル(TUM)の間の関連性は、P=BKG×(1−f)+TUM×fとして記載することができ、式中、BKGは血液細胞および他の内部臓器由来の血漿中のバックグラウンドDNAメチル化レベルである。例えば、全常染色体の全体メチル化密度は、このHCC患者から得られた腫瘍生検組織において(すなわち、この場合はTUM値)、42.9%であることが示された。4人の健常対照群から得られた血漿試料の平均メチル化密度(すなわち、この場合はBKG値)は71.6%であった。手術前血漿の血漿メチル化密度は59.7%であった。これらの値を用いて、fは41.5%であると推定される。   The relationship between plasma methylation level (P), tumor DNA concentration fraction (f), and tumor tissue methylation level (TUM) may be described as P = BKG × (1-f) + TUM × f. Yes, where BKG is the background DNA methylation level in plasma from blood cells and other internal organs. For example, the total methylation density of all autosomal chromosomes was shown to be 42.9% in tumor biopsy tissues obtained from this HCC patient (ie TUM value in this case). The average methylation density (ie BKG value in this case) of plasma samples obtained from 4 healthy control groups was 71.6%. The plasma methylation density of preoperative plasma was 59.7%. Using these values, f is estimated to be 41.5%.

別の実施形態では、腫瘍組織のメチル化レベルは、血漿試料中の腫瘍由来DNAの濃度分率が既知である場合、血漿メチロームデータに基づいて、非侵襲的に推定することができる。血漿試料中の腫瘍由来DNAの濃度分率は、他の遺伝子解析、例えば、前述(米国特許出願公開第13/308,473号;KCA Chan et al. 2013 Clin Chem; 59: 211-24)の、対立遺伝子欠失(GAAL)のゲノムワイド解析および単一ヌクレオチド変異の解析によって、決定することができる。計算は、本実施形態では、fの値が既知でありTUMの値が未知となる以外は同一の、上記の関連性に基づく。推定は、母体血漿データから胎盤組織メチル化レベルを決定する状況において観察されたデータと同様に、全ゲノムに対して、またはゲノムの部分に対して、行うことができる。   In another embodiment, tumor tissue methylation levels can be estimated non-invasively based on plasma methylome data when the concentration fraction of tumor-derived DNA in the plasma sample is known. The concentration fraction of tumor-derived DNA in plasma samples can be determined by other genetic analyzes such as those described above (US Patent Application Publication No. 13 / 308,473; KCA Chan et al. 2013 Clin Chem; 59: 211-24). , Allele deletion (GAAL) genome-wide analysis and single nucleotide mutation analysis. The calculations are based on the above relationships, which in this embodiment are the same, except that the value of f is known and the value of TUM is unknown. Estimates can be made for the entire genome, or for portions of the genome, similar to the data observed in the context of determining placental tissue methylation levels from maternal plasma data.

別の実施形態では、がんを有する対象とがんを有さない対象を区別するために、メチル化密度のビン内変動または特性を利用することができる。メチル化解析の分解能は、ゲノムを特定のサイズ(例えば、1Mb)のビンに分割することによってさらに増加することができる。そのような実施形態において、各1Mbのbinのメチル化密度は、採取された試料、例えば、軟膜、切除されたHCC組織、腫瘍に隣接する非腫瘍性肝組織および腫瘍切除の前および後に採取された血漿について算出された。別の実施形態では、ビンのサイズは一定でなくてもよい。ある実施において、ビンそれ自体はサイズにおいて異なり得るが、CpG部位の数は各ビン内で一定である。   In another embodiment, in-bin variation or characteristics of methylation density can be utilized to distinguish between subjects with and without cancer. The resolution of methylation analysis can be further increased by dividing the genome into bins of specific size (eg, 1 Mb). In such embodiments, methylation densities of each 1 Mb bin are collected before and after harvested samples, eg, buffy coat, excised HCC tissue, non-neoplastic liver tissue adjacent to the tumor, and tumor resection. Calculated for plasma. In another embodiment, the bin size may not be constant. In some implementations, the bins themselves may differ in size, but the number of CpG sites is constant within each bin.

図23Aおよび図23Bは、HCC患者の軟膜、腫瘍組織、非腫瘍性肝組織、手術前血漿および手術後血漿のメチル化密度を示している。図23Aは、1番染色体における結果のプロット2300である。図23Bは、2番染色体における結果のプロット2350である。   23A and 23B show the methylation densities of buffy coat, tumor tissue, non-neoplastic liver tissue, pre- and post-operative plasma of HCC patients. FIG. 23A is a plot 2300 of results on chromosome 1. FIG. 23B is a plot 2350 of the results on chromosome 2.

1Mbウィンドウの大部分において、軟膜および腫瘍に隣接する非腫瘍性肝組織のメチル化密度は同様であったが、一方、腫瘍組織のメチル化密度はより低かった。手術前血漿のメチル化密度は、腫瘍組織および非悪性組織のメチル化密度の間である。腫瘍組織内の照合ゲノム領域のメチル化密度は、手術前血漿のメチル化データおよび腫瘍DNA濃度分率を用いて推定することができる。前記方法は、全ての常染色体のメチル化密度値を用いる上記と同じである。記載された腫瘍メチル化の推定は、このより高い分解能の血漿DNAメチル化データを用いて行うこともできる。300kb、500kb、2Mb、3Mb、5Mbまたは5Mb超等の他のビンのサイズを用いることもできる。一実施形態では、ビンのサイズは一定でなくてもよい。ある実施において、ビンそれ自体はサイズにおいて異なり得るが、CpG部位の数は各ビン内で一定である。   In the majority of the 1 Mb windows, the methylation densities of buffy coat and non-neoplastic liver tissue adjacent to the tumor were similar, while tumor tissue had a lower methylation density. Preoperative plasma methylation density is between that of tumor and non-malignant tissue. Methylation densities of matched genomic regions within tumor tissue can be estimated using preoperative plasma methylation data and tumor DNA concentration fractions. The method is the same as above using all autosomal methylation density values. The described tumor methylation estimation can also be performed using this higher resolution plasma DNA methylation data. Other bin sizes such as 300 kb, 500 kb, 2 Mb, 3 Mb, 5 Mb or more than 5 Mb can also be used. In one embodiment, the bin size may not be constant. In some implementations, the bins themselves may differ in size, but the number of CpG sites is constant within each bin.

C. がん患者および健常人の間の血漿メチル化密度の比較
2100に示されるように、手術前血漿DNAのメチル化密度は、がん患者における非悪性組織のメチル化密度よりも低かった。これは、低メチル化状態であった腫瘍組織由来DNAの存在が原因であり得る。このより低い血漿DNAメチル化密度は、潜在的に、がんの検出用およびモニタリング用の生物マーカーとして用いることができる。がんのモニタリングにおいて、がんが進行中である場合、血漿中のがん由来DNAの量の経時的な増加が起こる。この例において、血漿中の循環がん由来DNAの量の増加は、ゲノムワイドなレベルでの血漿DNAメチル化密度におけるさらなる減少に繋がる。
C. Comparison of Plasma Methylation Density Between Cancer Patients and Healthy Subjects As shown in 2100, the methylation density of preoperative plasma DNA was lower than that of non-malignant tissues in cancer patients. This may be due to the presence of tumor tissue-derived DNA that was in a hypomethylated state. This lower plasma DNA methylation density can potentially be used as a biomarker for cancer detection and monitoring. In cancer monitoring, when the cancer is in progress, an increase in the amount of cancer-derived DNA in plasma occurs over time. In this example, an increase in the amount of circulating cancer-derived DNA in plasma leads to a further decrease in plasma DNA methylation density at genome-wide levels.

逆に、がんが治療に応答している場合、血漿中のがん由来DNAの量は経時的に減少する。この例において、血漿中のがん由来DNAの量の減少は、血漿DNAメチル化密度の増加に繋がる。例えば、上皮増殖因子受容体変異を有する肺がん患者が標的療法(例えば、チロシンキナーゼ阻害)によって処置されている場合、血漿DNAメチル化密度の増加は応答を示すものである。その後に、チロシンキナーゼ阻害耐性の腫瘍クローンの発生は、再発を示す血漿DNAメチル化密度の減少と関連している。   Conversely, if the cancer is responding to treatment, the amount of cancer-derived DNA in plasma will decrease over time. In this example, a decrease in the amount of cancer-derived DNA in plasma leads to an increase in plasma DNA methylation density. For example, when lung cancer patients with epidermal growth factor receptor mutations are treated by targeted therapy (eg, tyrosine kinase inhibition), increased plasma DNA methylation density is indicative of a response. Subsequent development of tumor clones resistant to tyrosine kinase inhibition is associated with a decrease in plasma DNA methylation density indicative of relapse.

血漿メチル化密度測定は連続的に行うことができ、そのような測定値の変化率は、算出して、臨床上の進行または軽快または予後を予測または関連付けに用いることができる。がん組織においては高度メチル化状態であるが正常組織においては低メチル化状態である選択されたゲノム遺伝子座(例えば、いくつかの腫瘍抑制遺伝子のプロモーター領域)において、がんの進行および処置への好ましい応答の間の関連性は、上記のパターンと反対である。   Plasma methylation density measurements can be performed continuously and the rate of change of such measurements can be calculated and used to predict or correlate clinical progression or amelioration or prognosis. At selected genomic loci that are hypermethylated in cancer tissues but hypomethylated in normal tissues (eg, the promoter region of some tumor suppressor genes) for the progression and treatment of cancer. The relevance between the preferred responses of the is opposite to the above pattern.

このアプローチが実行可能であることを示すため、腫瘍の外科的切除の前および後にがん患者から採取した血漿試料のDNAメチル化密度を、4人の健常な対照患者から得た血漿DNAと比較した。   To demonstrate the feasibility of this approach, DNA methylation densities of plasma samples taken from cancer patients before and after surgical resection of tumors were compared with plasma DNA obtained from four healthy control patients. did.

表2200は、がん患者の手術前および手術後の血漿試料の全ての、並びに4人の健常健常対照患者の、各常染色体のDNAメチル化密度および常染色体の値の組み合わせ示している。全ての染色体において、手術前血漿DNA試料のメチル化密度は、手術後試料および4人の健常対象から得た血漿試料のメチル化密度よりも低かった。手術前試料および手術後試料の間の血漿DNAメチル化密度における差異により、手術前血漿試料におけるより低いメチル化密度がHCC腫瘍由来のDNAの存在が原因であったという、裏付けになる証拠が得られる。   Table 2200 shows a combination of DNA methylation densities and autosomal values for each autosomal chromosome in all pre- and post-surgical plasma samples of cancer patients and in 4 healthy healthy control patients. On all chromosomes, the methylation densities of pre-operative plasma DNA samples were lower than those of post-operative samples and plasma samples obtained from 4 healthy subjects. Differences in plasma DNA methylation densities between pre- and post-operative samples provided supporting evidence that the lower methylation densities in pre-operative plasma samples were due to the presence of HCC tumor-derived DNA. To be

手術後血漿試料におけるDNAメチル化密度の、健常対照群の血漿試料と同様のレベルへの回復によって、腫瘍由来DNAの大部分が供給源(すなわち、腫瘍)の外科的切除により消失したことが示唆された。これらのデータは、巨大なゲノム領域(例えば、全常染色体または個々の染色体)から入手できるデータを用いて決定される手術前血漿のメチル化密度が、健常対照群のメチル化レベルよりも低いメチル化レベルであり、これにより、がんを有する検査症例の同定(すなわち、診断または検診)が可能であることを示唆している。   Restoration of DNA methylation density in post-operative plasma samples to levels similar to those in healthy control plasma samples suggests that the majority of tumor-derived DNA was lost by surgical excision of the source (ie tumor) Was done. These data indicate that methylation density in pre-operative plasma is lower than that in healthy controls, as determined using data available from large genomic regions (eg, whole autosomes or individual chromosomes). Level, which suggests that it is possible to identify (ie, diagnose or screen) a laboratory case with cancer.

手術後血漿のメチル化レベルよりもさらにより低いメチル化レベルが、血漿メチル化レベルが腫瘍量をモニターし、それにより患者におけるがんの進行を予後判定およびモニターするのにも利用することができることも、手術前血漿のデータによって示された。参照値は、健常対照群またはがんのリスクがあるが現在はがんを有していない者の血漿から決定することができる。HCCのリスクがある者には、慢性B型またはC型肝炎感染を有する者、ヘモクロマトーシスを有する者、および肝硬変を有する者が含まれる。   Methylation levels even lower than post-operation plasma methylation levels can also be used to monitor tumor burden, thereby prognosing and monitoring cancer progression in patients Was also shown by preoperative plasma data. Reference values can be determined from the plasma of healthy controls or those at risk of cancer but not currently having cancer. Those at risk for HCC include those with a chronic hepatitis B or C infection, those with hemochromatosis, and those with cirrhosis.

基準値に基づく既定のカットオフを超える(例えば、より低い)血漿メチル化密度値は、非妊娠女性の血漿が腫瘍DNAを有しているかどうかを評価するのに用いることができる。低メチル化状態の循環腫瘍DNAの存在を検出するため、カットオフは、対照集団の値の5もしくは1パーセンタイルよりも低く、または対照の平均メチル化密度値より低い標準偏差の数、例えば、2もしくは3の標準偏差(SD)に基づいて、または中央値倍数(MoM)の決定に基づいて、定義され得る。高度メチル化状態の腫瘍DNAについては、カットオフは、対照集団の値の95もしくは99パーセンタイルよりも高く、または対照の平均メチル化密度値を超える標準偏差の数、例えば、2もしくは3のSDに基づいて、または中央値倍数(MoM)の決定に基づいて、定義され得る。一実施形態では、対照集団は、検査対象と年齢が一致している。年齢の一致は厳密でなくてもよく、年齢帯(例えば、35歳の検査対象に対して、30〜40歳)において行われ得る。   Plasma methylation density values above a predetermined cutoff (eg, lower) based on baseline values can be used to assess whether plasma of non-pregnant women has tumor DNA. In order to detect the presence of circulating tumor DNA in a hypomethylated state, the cutoff is below the 5 or 1 percentile of the value of the control population, or the number of standard deviations below the control mean methylated density value, eg 2 Alternatively, it can be defined based on a standard deviation (SD) of 3 or based on the determination of median multiple (MoM). For hypermethylated tumor DNA, the cutoff is higher than the 95th or 99th percentile of the control population value, or at a number of standard deviations above the control mean methylated density value, eg, SD of 2 or 3. Or based on the determination of median multiple (MoM). In one embodiment, the control population is age-matched with the test subject. Age matching need not be exact and may occur in the age range (eg, 30-40 years for a 35-year-old test subject).

次に、がん患者および4人の対照患者の血漿試料間で、1Mbのビンのメチル化密度を比較した。図示するために、1番染色体の結果を示す。   Next, the methylation densities of 1 Mb bins were compared between plasma samples of cancer patients and 4 control patients. For illustration, the results for chromosome 1 are shown.

図24Aは、HCC患者から得た手術前血漿のメチル化密度を示すプロット2400である。図24Bは、HCC患者から得た手術後血漿のメチル化密度を示すプロット2450である。青色のドットは対照患者の結果を表し、赤色のドットはHCC患者の血漿試料の結果を表す。   FIG. 24A is a plot 2400 showing the methylation density of pre-operative plasma from HCC patients. FIG. 24B is a plot 2450 showing the methylation density of post-operative plasma from HCC patients. Blue dots represent the results for control patients and red dots represent the results for plasma samples from HCC patients.

図24Aに示すように、HCC患者から得た手術前血漿のメチル化密度は、大部分のビンにおいて、対照患者のそれよりも低かった。類似のパターンが他の染色体において観察された。図24Bに示すように、HCC患者から得た手術後血漿のメチル化密度は、大部分のビンにおいて、対照患者のそれと同様であった。類似のパターンが他の染色体において観察された。   As shown in Figure 24A, the methylation density of pre-operative plasma from HCC patients was lower in most bins than that of control patients. Similar patterns were observed on other chromosomes. As shown in Figure 24B, the methylation density of post-operative plasma from HCC patients was similar to that of control patients in most bins. Similar patterns were observed on other chromosomes.

検査対象ががんを有しているかどうかを評価するために、検査対象の結果を参照群の値と比較した。一実施形態では、参照群はいくつかの健常対象から成る。別の実施形態では、参照群は、非悪性状態(例えば、慢性B型肝炎感染または肝硬変)を有する対象から成り得る。検査対象および参照群間のメチル化密度における差異が次に定量化され得る。   The results of the test subjects were compared to the values of the reference group to assess whether the test subjects had cancer. In one embodiment, the reference group consists of some healthy subjects. In another embodiment, the reference group may consist of subjects having a non-malignant condition (eg, chronic hepatitis B infection or cirrhosis). The difference in methylation density between the test subject and the reference group can then be quantified.

一実施形態では、参照範囲は対照群の値から得ることができる。次に、参照群の上限または下限からの検査対象の結果における逸脱が、該対象が腫瘍を有するかどうかを決定するために用いられ得る。この量は、血漿中の腫瘍由来DNAの濃度分率並びに悪性組織および非悪性組織間のメチル化レベルにおける差異によって影響を受ける。血漿中の腫瘍由来DNAの濃度分率がより高いほど、検査血漿試料および対照の間により大きなメチル化密度の差異をもたらす。悪性組織および非悪性組織のメチル化レベルにおける差異のより大きいな程度は、検査血漿試料および対照間のより大きなメチル化密度の差異にも関連する。さらに別の実施形態では、様々な参照群が様々な年齢範囲の検査対象に対して選ばれた。   In one embodiment, the reference range can be obtained from the control values. Deviations in the test subject's results from the upper or lower limits of the reference group can then be used to determine if the subject has a tumor. This amount is affected by the concentration fraction of tumor-derived DNA in plasma and the difference in methylation levels between malignant and non-malignant tissues. The higher the concentration fraction of tumor-derived DNA in plasma, the greater the methylation density difference between the test plasma sample and the control. The greater degree of difference in methylation levels in malignant and non-malignant tissues is also associated with greater differences in methylation density between test plasma samples and controls. In yet another embodiment, different reference groups were chosen for subjects of different age ranges.

別の実施形態では、4人の対照患者のメチル化密度の平均値およびSDが、各1Mbビンについて算出された。次に、対応するビンについて、HCC患者およびのメチル化密度および対照患者の平均値の間の差異が算出された。一実施形態では、次に、この差異が対応するビンのSDで除算されて、Z値が決定された。言い換えれば、Z値は、対照患者の平均値からのSDの数として表される、検査血漿試料および対照血漿試料の間のメチル化密度の差異を表す。ビンの3より大きいZ値は、HCC患者の血漿DNAが、そのビンにおいて3より大きなSDだけ対照患者よりもより高度なメチル化状態であることを示しており、一方、ビンの−3未満のZ値は、HCC患者の血漿DNAがそのビンにおいて3より大きなSDだけ対照患者よりもより低メチル化状態であることを示している。   In another embodiment, the mean methylation density and SD of 4 control patients were calculated for each 1 Mb bin. Then, for the corresponding bins, the difference between the methylation density of HCC patients and the mean value of control patients was calculated. In one embodiment, this difference was then divided by the SD of the corresponding bins to determine the Z value. In other words, the Z value represents the difference in methylation density between the test and control plasma samples, expressed as the number of SDs from the mean of control patients. A Z value greater than 3 in a bin indicates that the plasma DNA of HCC patients is more highly methylated in that bin with an SD greater than 3 while that in a bin is less than -3 in a bin. Z values indicate that the plasma DNA of HCC patients is hypomethylated in their bins by SD greater than 3 than control patients.

図25Aおよび図25Bは、1番染色体の参照として4人の健常対照患者の血漿メチロームデータを用いた、HCC患者の手術前(プロット2500)および手術後(プロット2550)の血漿試料の血漿DNAメチル化密度のZ値を示している。各ドットは、1つの1Mbビンの結果を表している。黒色ドットは、−3〜3のZ値を有するビンを表している。赤色ドットは−3未満のZ値を有するビンを表している。   25A and 25B are plasma DNA of plasma samples of pre-operative (Plot 2500) and post-operative (Plot 2550) HCC patients using plasma methylome data from four healthy control patients as a reference to chromosome 1. The Z value of the methylation density is shown. Each dot represents the result of one 1 Mb bin. Black dots represent bins with Z values of -3 to 3. Red dots represent bins with Z values less than -3.

図26Aは、手術前血漿および手術後血漿のZ値のデータを示す、表2600である。手術前血漿試料における1番染色体上のビンの大部分(80.9%)は−3未満のZ値を有していたが、これは、HCC患者の手術前血漿DNAが対照患者の手術前血漿DNAよりも有意により低いメチル化状態であったことを示している。その反対に、赤色ドットの数は手術後血漿試料において実質的に減少した(1番染色体上のビンの8.3%)が、これは、腫瘍DNAの大部分が循環腫瘍DNAの供給源が外科的切除されたために血行から除去されたことを示唆している。   FIG. 26A is a table 2600 showing Z value data for pre- and post-operative plasma. The majority of the bins on chromosome 1 (80.9%) in the pre-operative plasma samples had Z-values less than -3 because pre-operative plasma DNA in HCC patients was pre-operative in control patients. This indicates that the methylation state was significantly lower than that of plasma DNA. On the contrary, the number of red dots was substantially reduced in post-operative plasma samples (8.3% of bins on chromosome 1), which was due to the majority of the tumor DNA as a source of circulating tumor DNA. It has been removed from circulation due to surgical resection.

図26Bは、全常染色体から解析された1Mbビンの参照として4人の健常対照患者を用いた、HCC患者の手術前血漿試料および手術後血漿試料の血漿DNAメチル化密度のZ値を示すCircosプロット2620である。最外側の環は、ヒト常染色体の記号を示している。中央の環は、手術前血漿試料のデータを示している。最内側の環は、手術後血漿試料のデータを示している。各ドットは、1つの1Mbビンの結果を表している。黒色ドットは、−3〜3のZ値を有するビンを表している。赤色ドットは、−3未満のZ値を有するビンを表している。緑色ドットは、3超のZ値を有するビンを表している。   FIG. 26B is a Circos showing Z-values of plasma DNA methylation densities of pre-operative and post-operative plasma samples of HCC patients, using 4 healthy control patients as a reference for 1 Mb bins analyzed from all autosomes. This is plot 2620. The outermost ring indicates the human autosomal symbol. The middle ring shows data for pre-operative plasma samples. The innermost ring shows data for post-operative plasma samples. Each dot represents the result of one 1 Mb bin. Black dots represent bins with Z values of -3 to 3. Red dots represent bins with Z values less than -3. Green dots represent bins with Z values greater than 3.

図26Cは、HCC患者の手術前血漿試料および手術後血漿試料の両方における全ゲノムの1MbビンのZ値の分布を示す、表2640である。結果は、HCC患者の手術前血漿DNAが、全ゲノムにおける領域の大部分(1Mbビンの85.2%)において、対照の手術前血漿DNAよりもより低いメチル化状態であったことを示している。それとは反対に、手術後血漿試料における領域の大部分(1Mbビンの93.5%)は、対照と比較して、有意な高度メチル化または低メチル化を示さなかった。これらのデータは、このHCCの天然において主に低メチル化状態である腫瘍DNAの大部分が、手術後血漿試料中に存在していなかったことを示している。   FIG. 26C is a table 2640 showing the distribution of whole genome 1 Mb bin Z values in both pre- and post-operative plasma samples of HCC patients. The results show that pre-operative plasma DNA of HCC patients was less methylated than control pre-operative plasma DNA in most of the regions in the whole genome (85.2% of 1 Mb bin). There is. In contrast, the majority of the areas in post-operative plasma samples (93.5% of 1 Mb bins) did not show significant hypermethylation or hypomethylation compared to controls. These data indicate that most of the naturally predominantly hypomethylated tumor DNA of this HCC was not present in post-operative plasma samples.

一実施形態では、−3未満のZ値を有するビンの数、割合または比率は、がんが存在するかどうかを示すために用いることができる。例えば、表2640に示されるように、解析された2734のbinのうち2330(85.2%)が手術前血漿において−3未満のZ値を示したが、解析された2734のビンのうち171のみ(6.3%)が手術後血漿において−3未満のZ値を示した。前記データは、手術前血漿中の腫瘍DNA量が手術後血漿中の腫瘍DNA量よりもかなり大きかったことを示している。   In one embodiment, the number, percentage or ratio of bins with Z values less than -3 can be used to indicate whether cancer is present. For example, as shown in Table 2640, 2330 (85.2%) of the 2734 bins analyzed showed a Z value of less than -3 in preoperative plasma, but 171 of the 2734 bins analyzed. Only (6.3%) showed a Z value of less than -3 in post-operative plasma. The data show that the amount of tumor DNA in pre-operative plasma was significantly higher than the amount of tumor DNA in post-operative plasma.

びんの数のカットオフ値は、統計手法を用いて決定され得る。例えば、ビンのおよそ0.15%は、正常分布に基づいて−3未満のZ値を有することが予測される。従って、ビンのカットオフ数は解析されているビンの総数の0.15%であり得る。言い換えれば、非妊娠個体から得られれた血漿試料が0.15%よりも多い、−3未満のZ値を有するビンを示す場合、血漿中の低メチル化DNAの供給源、すなわち、がんが存在する。例えば、この例において解析された2734の1Mbビンのうちの0.15%は、約4のビンである。この値をカットオフとして用いると、手術前血漿試料および手術後血漿試料の両方が低メチル化腫瘍由来DNAを含有していたが、その量は、手術後血漿試料よりも、手術前血漿試料においてかなり多かった。4人の健常対照患者において、いずれのビンも、有意な高度メチル化または低メチル化を示さなかった。他のカットオフ値(例えば、1.1%)を用いることもでき、用いられるアッセイの要求に応じて異なり得る。他の例として、カットオフ率は、統計分布、並びに所望の感度および許容できる特異度に応じて異なり得る。   The cutoff value for the number of bottles can be determined using statistical methods. For example, approximately 0.15% of bins are predicted to have Z-values of less than -3 based on the normal distribution. Therefore, the cutoff number of bins may be 0.15% of the total number of bins being analyzed. In other words, if a plasma sample obtained from a non-pregnant individual exhibits more than 0.15% bins with a Z value of less than -3, the source of hypomethylated DNA in plasma, i.e. the cancer is Exists. For example, 0.15% of the 2734 1 Mb bins analyzed in this example are approximately 4 bins. Using this value as a cut-off, both pre- and post-surgical plasma samples contained DNA from hypomethylated tumors, but the amount was higher in pre-surgical plasma samples than in post-surgical plasma samples. It was quite a lot. None of the bins showed significant hypermethylation or hypomethylation in 4 healthy control patients. Other cutoff values (eg, 1.1%) can also be used and can vary depending on the requirements of the assay used. As another example, the cutoff rate may vary depending on the statistical distribution and the desired sensitivity and acceptable specificity.

別の実施形態では、カットオフ値は、幾人かのがん患者およびがんを有さない個体を解析することによる受信者動作特性(ROC)曲線解析によって、決定され得る。このアプローチの特異度をさらに確認するために、非悪性状態(C06)の診察を求める患者から得られた血漿試料を解析した。ビンの1.1%が−3未満のZ値を有していた。一実施形態では、様々なレベルの疾病状態を分類するために、様々な閾値が用いられ得る。より低い閾値率を用いることで良性症状から健常状態を区別することができ、より高い閾値率を用いることで悪性腫瘍から良性症状を区別することができる。   In another embodiment, the cutoff value may be determined by receiver operating characteristic (ROC) curve analysis by analyzing some cancer patients and individuals without cancer. To further confirm the specificity of this approach, plasma samples obtained from patients seeking non-malignant status (C06) consultation were analyzed. 1.1% of the bottles had a Z value of less than -3. In one embodiment, different thresholds may be used to classify different levels of disease states. A lower threshold rate can be used to distinguish a healthy state from a benign condition, and a higher threshold rate can be used to distinguish a benign condition from a malignant tumor.

大規模並列配列決定を用いる血漿低メチル化解析の診断能は、特定クラスの反復領域(例えば、長鎖散在反復配列−1(LINE−1))のポリメラーゼ連鎖反応(PCR)に基づく増幅を用いて得られるそれよりも優れていると思われる(P Tangkijvanich et al. 2007 Clin Chim Acta; 379:127-133)。この所見の1つの可能な説明は、低メチル化は腫瘍ゲノムの広範にわたるが、ゲノム領域毎にある程度の不均一性を有するということである。   The diagnostic ability of plasma hypomethylation analysis using massively parallel sequencing uses polymerase chain reaction (PCR) -based amplification of specific classes of repeat regions (eg, long interspersed repeat sequence-1 (LINE-1)). It appears to be superior to that obtained by P Tangkijvanich et al. 2007 Clin Chim Acta; 379: 127-133. One possible explanation for this finding is that hypomethylation is widespread in the tumor genome, but with some heterogeneity between genomic regions.

実際に、参照対象の平均血漿メチル化密度がゲノム全域で異なることが観察された(図56)。図56中の赤色ドットのそれぞれは、32人の健常対象間の、1つの1Mbビンの平均メチル化密度を示している。プロットは、ゲノム全域で解析された全ての1Mbビンを示している。各ボックス内の数字は染色体数を表している。平均メチル化密度がビン毎に異なることが観察された。   Indeed, it was observed that the mean plasma methylation densities of the reference subjects differ across the genome (Figure 56). Each red dot in FIG. 56 represents the average methylation density of one 1 Mb bin among 32 healthy subjects. The plot shows all 1 Mb bins analyzed across the genome. The number in each box represents the number of chromosomes. It was observed that the average methylation density varied from bottle to bottle.

単純なPCRに基づくアッセイは、そのような領域毎の不均一性をその診断アルゴリズムの考慮に入れることができないだろう。そのような不均一性は、健常人の間に観察されるメチル化密度の範囲を広げる。メチル化密度のより大規模な減少は、低メチル化を示すと見なされる試料に必要とされる。これは、検査感度の減少をもたらす。   A simple PCR-based assay would not be able to take such region-wise heterogeneity into account in its diagnostic algorithm. Such heterogeneity broadens the range of methylation densities observed in healthy individuals. Larger reductions in methylation density are required for samples considered to exhibit hypomethylation. This results in a reduction in test sensitivity.

対照的に、大規模並列配列決定に基づくアプローチでは、ゲノムが1Mbビン(または他のサイズのビン)に分割され、そのようなビンのメチル化密度が個々に測定される。このアプローチは、異なるゲノム領域にわたるベースラインメチル化密度における変動の影響を減少させるが、これはそのような領域が試験試料および対照間で比較されるためである。実際に、同じビン内で、32人の健常対照群間の個人間変動は比較的小さかった。ビンの95%は、32人の健常対照群間で1.8%以下の変動係数(CV)を有していた。なお、がんに関連する低メチル化の検出感度をさらに増強するため、比較を複数のゲノム領域にわたって行うことができる。ただ1つの領域が検査された時にがん試料が特定領域における低メチル化を偶然示さない場合の生物学的変動の影響から保護されることから、感度は複数のゲノム領域を検査することにより増強されであろう。   In contrast, the massively parallel sequencing-based approach divides the genome into 1 Mb bins (or bins of other sizes) and measures the methylation density of such bins individually. This approach reduces the effect of variations in baseline methylation density over different genomic regions, as such regions are compared between test samples and controls. In fact, within the same bin, the inter-individual variability between the 32 healthy control groups was relatively small. 95% of the bins had a coefficient of variation (CV) of 1.8% or less among the 32 healthy control groups. It should be noted that the comparison can be performed across multiple genomic regions in order to further enhance the sensitivity of detection of hypomethylation associated with cancer. Sensitivity is enhanced by testing multiple genomic regions, as it protects against the effects of biological variation when a cancer sample does not accidentally show hypomethylation in a specific region when only one region is tested It will be done.

対照および試験試料間の対応するゲノム領域のメチル化密度を比較し(例えば、各ゲノム領域を別々に検査し、次にかかる結果を組み合わせる)、複数のゲノム領域に対してこの比較を行うアプローチは、がんに関連する低メチル化の検出においてより高い信号雑音比を有する。この大規模並列配列決定アプローチを例として示す。複数のゲノム領域のメチル化密度を決定し、対照および試験試料間の対応する領域のメチル化密度の比較を可能にし得る他の方法論は、同様の効果を達成すると予想される。例えば、特定のゲノム領域に由来する血漿DNA分子を標的とし、該領域のメチル化レベルを決定することができるハイブリダイゼーションプローブまたは分子反転(molecular inversion)プローブは、所望の効果を達成するように設計することができる。   An approach to compare the methylation densities of corresponding genomic regions between control and test samples (eg, examine each genomic region separately and then combine such results) and make this comparison for multiple genomic regions is , With a higher signal-to-noise ratio in the detection of cancer-related hypomethylation. This massively parallel sequencing approach is shown as an example. Other methodologies that can determine the methylation densities of multiple genomic regions and allow comparison of the methylation densities of corresponding regions between control and test samples are expected to achieve similar effects. For example, hybridization or molecular inversion probes that can target plasma DNA molecules from a particular genomic region and determine the methylation level of that region are designed to achieve the desired effect. can do.

さらに別の実施形態では、がんが存在するかどうかを決定するために、または血漿DNAメチル化のレベルの連続的変化をモニタリングするために、全てのビンのZ値の和が用いられ得る。腫瘍DNAの全体的な低メチル化性質のため、Z値の和は、健常対照群よりも、がんを有する個体から採取された血漿においてより低くなるだろう。HCC患者の手術前および手術後の血漿試料のZ値の和は、それぞれ、−49843.8および−3132.13であった。   In yet another embodiment, the sum of the Z values of all bins can be used to determine if cancer is present or to monitor continuous changes in the level of plasma DNA methylation. Due to the overall hypomethylated nature of tumor DNA, the sum of Z values will be lower in plasma collected from individuals with cancer than in healthy controls. The sum of the Z values of the plasma samples of HCC patients before and after surgery was -4983.8 and -132.13, respectively.

他の実施形態では、血漿DNAのメチル化レベルを調べるために、他の方法が用いられ得る。例えば、シトシン残基の総量に対するメチル化シトシン残基の割合は、質量分析(ML Chen et al. 2013 Clin Chem; 59: 824-832)または大規模並列配列決定を用いることで決定することができる。しかし、シトシン残基の大部分はCpGジヌクレオチド配列に存在しないため、全シトシン残基におけるメチル化シトシンの割合は、CpGジヌクレオチドの配列において推定されるメチル化レベルと比較した場合、比較的小さくなるだろう。HCC患者から得られた組織および血漿試料並びに健常対照群から得ら得られた4つの血漿試料のメチル化レベルを決定した。ゲノムワイドな大規模並列配列決定データを用いて、CpG配列、あらゆるシトシン、CHG配列およびCHH配列におけるメチル化レベルを測定した。Hはアデニン、チミンまたはシトシン残基を指す。   In other embodiments, other methods can be used to determine the methylation level of plasma DNA. For example, the ratio of methylated cytosine residues to the total amount of cytosine residues can be determined using mass spectrometry (ML Chen et al. 2013 Clin Chem; 59: 824-832) or massively parallel sequencing. . However, since the majority of cytosine residues are not present in the CpG dinucleotide sequence, the percentage of methylated cytosines in all cytosine residues is relatively small when compared to the estimated methylation level in the CpG dinucleotide sequence. It will be. The methylation levels of tissue and plasma samples obtained from HCC patients and four plasma samples obtained from healthy controls were determined. Genome-wide massively parallel sequencing data was used to measure methylation levels in CpG sequences, any cytosine, CHG and CHH sequences. H refers to adenine, thymine or cytosine residues.

図26Dは、CHH配列およびCHG配列を用いた場合の対照血漿試料のいくつかと重複する、腫瘍組織および手術前血漿試料のメチル化レベルを示す、表2660である。腫瘍組織および手術前血漿試料のメチル化レベルは、CpGおよび不特定シトシンの両方において、軟膜、非腫瘍性肝組織、手術後血漿試料および健常対照血漿試料と比較して一貫してより低かった。しかし、メチル化CpGに基づくデータ、すなわち、メチル化密度は、メチル化シトシンに基づくデータよりも広いダイナミックレンジを示した。   FIG. 26D is a table 2660 showing methylation levels of tumor tissue and pre-operative plasma samples that overlap some of the control plasma samples with the CHH and CHG sequences. Methylation levels of tumor tissue and pre-operative plasma samples were consistently lower in both CpG and nonspecific cytosine compared to buffy coat, non-neoplastic liver tissue, post-operative plasma samples and healthy control plasma samples. However, the data based on methylated CpG, ie methylation density, showed a wider dynamic range than the data based on methylated cytosine.

他の実施形態では、血漿DNAのメチル化状態は、メチル化シトシンに対する抗体を用いる方法(例えば、メチル化DNA免疫沈降(MeDIP))によって決定され得る。しかし、これらの方法の精度は、抗体結合における変動性のために、配列決定に基づく方法よりも劣ることが予想される。さらに別の実施形態では、血漿DNA中の5−ヒロドキシメチルシトシンのレベルが決定され得る。これに関して、5−ヒロドキシメチルシトシンのレベルの減少は、ある特定のがん(例えば、メラノーマ)の後成的特徴であることが分かっている(CG Lian, et al. 2012 Cell; 150: 1135-1146)。   In other embodiments, the methylation status of plasma DNA can be determined by methods using antibodies to methylated cytosine, such as methylated DNA immunoprecipitation (MeDIP). However, the accuracy of these methods is expected to be less than that of sequencing-based methods due to variability in antibody binding. In yet another embodiment, the level of 5-hydroxymethylcytosine in plasma DNA can be determined. In this regard, reduced levels of 5-hydroxymethylcytosine have been found to be an epigenetic feature of certain cancers (eg, melanoma) (CG Lian, et al. 2012 Cell; 150: 1135-1146).

HCCに加えて、このアプローチが他のがん型に適応可能かどうかも調べた。肺腺癌(CL1およびCL2)を有する2人の患者、上咽頭癌(NPC1およびNPC2)を有する2人の患者、結腸直腸がん(CRC1およびCRC2)を有する2人の患者、転移性神経内分泌腫瘍(NE1)を有する1人の患者および転移性平滑筋肉腫(SMS1)を有する1人の患者から得られた血漿試料を解析した。これらの対象の血漿DNAを亜硫酸水素塩によって変換し、一端の50bpについて、イルミナ社製HiSeq2000プラットフォームを用いて配列決定した。上記の4人の健常対照患者を、これら8人の患者の解析のための参照群として用いた。一端の配列リードの50bpを用いた。ゲノム全体を1Mbビンに分割した。参照群から得られたデータを用いて、各ビンのメチル化密度の平均値およびSDを算出した。次に、8人のがん患者の結果を、参照群の平均値からのSDの数値を示すZ値として表した。正の値は検査例のメチル化密度が参照群の平均値よりも低いことを示しており、逆に、負の値は検査例のメチル化密度が参照群の平均値よりも高いことを示す。配列リードの数および試料毎に達成された配列決定深度を、図27Iの表2780に示す。   In addition to HCC, we also investigated whether this approach is adaptable to other cancer types. 2 patients with lung adenocarcinoma (CL1 and CL2), 2 patients with nasopharyngeal cancer (NPC1 and NPC2), 2 patients with colorectal cancer (CRC1 and CRC2), metastatic neuroendocrine Plasma samples obtained from one patient with tumor (NE1) and one patient with metastatic leiomyosarcoma (SMS1) were analyzed. Plasma DNA of these subjects was converted with bisulfite and 50 bp at one end was sequenced using the Illumina HiSeq 2000 platform. The 4 healthy control patients described above were used as a reference group for the analysis of these 8 patients. A 50 bp sequence read at one end was used. The entire genome was divided into 1 Mb bins. The data obtained from the reference group was used to calculate the mean and SD of the methylation densities for each bin. Next, the results of 8 cancer patients were expressed as Z values showing the numerical value of SD from the average value of the reference group. A positive value indicates that the methylation density of the test case is lower than the mean value of the reference group, and a negative value indicates that the methylation density of the test case is higher than the mean value of the reference group. . The number of sequence reads and the sequencing depth achieved for each sample is shown in Table 2780 of Figure 27I.

図27A−Hは、本発明の実施形態による、8人のがん患者のメチル化密度のCircosプロットである。各ドットは1Mbビンの結果を表す。黒色ドットは−3〜3のZ値を有するビンを表す。赤色ドットは−3未満のZ値を有するビンを表す。緑色ドットは3より大きいZ値を有するビンを表す。2本の連続線間の間隔はZ値の差異が20であることを表す。   27A-H are Circos plots of methylation densities of eight cancer patients, according to embodiments of the invention. Each dot represents a 1 Mb bin result. Black dots represent bins with Z values of -3 to 3. Red dots represent bins with Z values less than -3. Green dots represent bins with Z values greater than 3. The spacing between two continuous lines represents a Z value difference of 20.

肺がん、上咽頭癌、結腸直腸がんおよび転移性神経内分泌腫瘍を含む大部分のがん型を有する患者のゲノム全域の複数の領域において、有意な低メチル化が観察された。興味深いことに、低メチル化に加えて、転移性平滑筋肉腫を有する症例において、有意な高度メチル化がゲノム全域の複数の領域において観察された。平滑筋肉腫の胚起源は中胚葉であるが、一方、残り7人の患者における他のがん型の胚起源は外胚葉である。従って、肉腫のDNAメチル化パターンは癌腫のDNAメチル化パターンと異なる場合があり得る。   Significant hypomethylation was observed in multiple regions across the genome of patients with most cancer types including lung, nasopharyngeal, colorectal and metastatic neuroendocrine tumors. Interestingly, in addition to hypomethylation, significant hypermethylation was observed in multiple regions throughout the genome in cases with metastatic leiomyosarcoma. The embryonic origin of leiomyosarcoma is mesoderm, while the embryonic origin of the other cancer types in the remaining 7 patients is ectoderm. Therefore, the DNA methylation pattern of sarcoma can be different from that of carcinoma.

この例から理解できるように、血漿DNAのメチル化パターンは、異なる型のがんを識別するのに有用であり得、この例では癌腫および肉腫の識別である。これらのデータは、前記アプローチを、悪性腫瘍に関連する異常な高度メチル化を検出するのに用いることができることも示唆している。これら8つ全ての例では、血漿試料のみが利用可能であり、腫瘍組織は解析されなかった。これにより、腫瘍組織の事前のメチル化特性またはメチル化レベルが無くとも、記載された方法を用いることで血漿中で腫瘍由来DNAを容易に検出できることが示された。   As can be seen from this example, the methylation pattern of plasma DNA can be useful in distinguishing different types of cancer, in this case distinguishing between carcinoma and sarcoma. These data also suggest that the approach can be used to detect aberrant hypermethylation associated with malignancy. In all eight of these cases, only plasma samples were available and no tumor tissue was analyzed. This indicates that tumor-derived DNA can be easily detected in plasma using the described method, even without prior methylation properties or levels of methylation in the tumor tissue.

図27Jは、異なる悪性腫瘍を有する患者の血漿中のゲノム全体における1MbビンのZ値分布を示す、表2790である。−3未満、−3〜3および3を超えるZ値を有するビンの割合が各例について示される。全ての例において、ビンの5%超が−3未満のZ値を有していた。従って、試料をがん陽性であると分類するために、5%のビンが有意に低メチル化されているというカットオフを用いる場合、これらの例は全て、がん陽性に分類されるだろう。結果は、低メチル化が様々ながん型における一般的な現象であり得、血漿メチローム解析が様々ながん型を検出するのに有用であろうことを示している。   FIG. 27J is a table 2790 showing the Z value distribution of 1 Mb bins throughout the genome in plasma of patients with different malignancies. The percentage of bins with Z values less than -3, -3 to 3 and greater than 3 are shown for each example. In all cases, greater than 5% of the bins had Z values less than -3. Therefore, if we use the cutoff that 5% of the bins are significantly hypomethylated to classify a sample as cancer positive, then all of these examples would be classified as cancer positive. . The results indicate that hypomethylation may be a common phenomenon in various cancer types and plasma methylome analysis may be useful in detecting various cancer types.

D. 方法
図28は、本発明の実施形態に従って、生物の生物試料を解析してがんのレベルの分類を決定する、方法2800のフローチャートである。生物試料は、正常細胞由来のDNA含み、がんと関連する細胞由来のDNAを潜在的に含み得る。DNAの少なくとも一部は、生物試料中で無細胞DNAであり得る。
D. Method FIG. 28 is a flow chart of a method 2800 of analyzing a biological sample of an organism to determine a cancer level classification in accordance with an embodiment of the present invention. A biological sample contains DNA from normal cells and may potentially contain DNA from cells associated with cancer. At least a portion of the DNA can be cell-free DNA in the biological sample.

ブロック2810において、生物試料由来の複数のDNA分子が解析される。DNA分子の解析には、生物のゲノム内でのDNA分子の位置を決定し、該DNA分子が一つまたは複数の部位においてメチル化されているかどうかを決定することが含まれ得る。前記解析はメチル化認識配列決定から配列リードを得ることによって行うことができるため、前記解析は、前記DNAから先に得られたデータに対してのみ行われ得る。他の実施形態では、前記解析は、実際の配列決定または他のデータを得るための能動的ステップを含み得る。   At block 2810, a plurality of DNA molecules from the biological sample are analyzed. Analyzing a DNA molecule can include determining the location of the DNA molecule within the organism's genome and determining whether the DNA molecule is methylated at one or more sites. Since the analysis can be performed by obtaining a sequence read from methylation recognition sequencing, the analysis can only be performed on the data previously obtained from the DNA. In other embodiments, the analysis may include active steps to obtain actual sequencing or other data.

ブロック2820において、複数の部位のそれぞれについて、部位においてメチル化されているDNA分子のそれぞれの数が決定される。一実施形態では、部位はCpG部位であり、本明細書に記載の一つまたは複数の判定基準を用いて選択されるある特定のCpG部位のみであり得る。メチル化されているDNA分子の数は、正規化が特定部位における分析されたDNA分子の総数(例えば、配列リードの総数)を用いて行われたならば、非メチル化状態である数の決定に等しい。例えば、領域のCpGメチル化密度の増加は、同一領域の非メチル化CpGの密度の減少に等しい。   At block 2820, for each of the plurality of sites, the number of each DNA molecule that is methylated at the site is determined. In one embodiment, the site is a CpG site, and may only be one particular CpG site selected using one or more of the criteria described herein. The number of DNA molecules that are methylated is determined by determining the number that is unmethylated if normalization was performed using the total number of DNA molecules analyzed at a particular site (eg, total number of sequence reads). be equivalent to. For example, an increase in CpG methylation density in a region is equivalent to a decrease in unmethylated CpG density in the same region.

ブロック2830において、複数個の部位においてメチル化されているDNA分子のそれぞれの数に基づいて、第一メチル化レベルが算出される。第一メチル化レベルは、複数個の部位に対応するDNA分子の数に基づいて決定されるメチル化密度に対応し得る。部位は複数の遺伝子座またはただ1つの座位に対応し得る。   At block 2830, a first methylation level is calculated based on the respective numbers of DNA molecules that are methylated at the plurality of sites. The first methylation level can correspond to a methylation density determined based on the number of DNA molecules corresponding to multiple sites. A site can correspond to multiple loci or only one locus.

ブロック2840において、第一メチル化レベルが第一カットオフ値と比較される。第一カットオフ値は参照メチル化レベルであってもよいし、あるいは参照メチル化レベルと関連していてもよい(例えば、正常レベルからの特定の距離)。参照メチル化レベルは、がんを有さない個人の試料から、または生物のがんと関連していないことが知られている生物の遺伝子座から、決定され得る。第一カットオフ値は、生物試料の検査に先立って得られた、事前の該生物の生物試料から得られた参照メチル化レベルから確立されてもよい。   At block 2840, the first methylation level is compared to the first cutoff value. The first cutoff value may be the reference methylation level or it may be associated with the reference methylation level (eg, a certain distance from normal levels). Reference methylation levels can be determined from samples of individuals who do not have cancer, or from genetic loci of organisms known not to be associated with cancer of the organism. The first cutoff value may be established from a reference methylation level obtained from a previous biological sample of the organism, obtained prior to examination of the biological sample.

一実施形態では、第一カットオフ値は、健常生物から得られた生物試料から確立された参照メチル化レベルからの、特定の距離(例えば、標準偏差の特定の値)である。比較は、第一メチル化レベルおよび参照メチル化レベル間の差異を決定し、次にその差異を第一カットオフ値に対応する閾値と比較することによって行うことができる(例えば、メチル化レベルが参照メチル化レベルと統計学的に異なるかどうかを決定するために)。   In one embodiment, the first cutoff value is a particular distance (eg, a particular value of standard deviation) from a reference methylation level established from a biological sample obtained from a healthy organism. The comparison can be performed by determining the difference between the first methylation level and the reference methylation level and then comparing the difference to a threshold corresponding to the first cutoff value (eg, methylation level is (To determine if it is statistically different from the reference methylation level).

ブロック2850において、がんのレベルの分類は、前記比較に基づいて決定される。がんのレベルの例は、対象ががんまたは前癌状態を有するかどか、または対象ががんを発症させる可能性が増加しているかが含まれる。一実施形態では、第一カットオフ値は、対象から事前に得られた試料から決定され得る(例えば、参照メチル化レベルは事前の試料から決定され得る)。   At block 2850, a classification of cancer levels is determined based on the comparison. Examples of levels of cancer include whether the subject has cancer or a precancerous condition, or whether the subject has an increased likelihood of developing cancer. In one embodiment, the first cutoff value can be determined from a sample previously obtained from the subject (eg, the reference methylation level can be determined from the previous sample).

いくつかの実施形態において、第一メチル化レベルは、メチル化レベルが閾値を超えている領域の数に対応し得る。例えば、生物のゲノムの複数の領域が特定され得る。本明細書に記載の判定基準(例えば、ある特定の長さまたはある特定の数の部位を有する)を用いて、領域は特定され得る。一つまたは複数の部位(例えば、CpG部位)は、各領域内で特定され得る。領域メチル化レベルは各領域について算出され得る。第一メチル化レベルは第一領域についてである。各領域メチル化レベルは、領域間で同じであっても異なっていてもよいそれぞれの領域カットオフ値と比較される。第一領域の領域カットオフ値は第一カットオフ値である。それぞれの領域カットオフ値は、参照メチル化レベルからの特定の量(例えば、0.5)であるため、非がん対象から決定され得る参照からの有意差を有する領域のみが計数され得る。   In some embodiments, the first methylation level can correspond to the number of regions where the methylation level is above the threshold. For example, multiple regions of the organism's genome may be identified. Regions can be identified using the criteria described herein (eg, having a certain length or a certain number of sites). One or more sites (eg, CpG sites) can be identified within each region. Regional methylation levels can be calculated for each region. The first methylation level is for the first region. Each regional methylation level is compared to a respective regional cutoff value, which may be the same or different between regions. The area cutoff value of the first area is the first cutoff value. Since each region cutoff value is a certain amount (eg, 0.5) from the reference methylation level, only regions with significant differences from the reference that can be determined from non-cancer subjects can be counted.

領域メチル化レベルがそれぞれの領域カットオフ値を超えている領域の第一の数は、決定され、閾値と比較されて、分類が決定され得る。ある実施において、閾値は割合である。閾値の第一の数の比較は、第一の領域数を第二の領域数(例えば、全ての領域)で除算し、その後、例えば、正規化過程の一部として、閾値と比較することを含み得る。   A first number of regions with regional methylation levels above their respective regional cutoff values can be determined and compared to a threshold to determine a classification. In one implementation, the threshold is a percentage. The comparison of the first number of thresholds involves dividing the first number of regions by the second number of regions (e.g., all regions) and then comparing with the threshold, for example, as part of the normalization process. May be included.

上記のように、生物試料中の腫瘍DNAの濃度分率は、第一カットオフ値を算出するのに用いられ得る。濃度分率は最小値より大きいことが単純に推定され得るが、一方、最小値より低い濃度分率を有する試料は、例えば解析に適していないものとして、警告され得る。最小値は、参照メチル化レベルと比較した腫瘍のメチル化レベルにおける期待される差異に基づいて決定され得る。例えば、差異が0.5(例えば、カットオフ値として用いられる)である場合、ある特定の腫瘍の濃度は、この差異を見るために充分高いことが必要とされる。   As described above, the concentration fraction of tumor DNA in the biological sample can be used to calculate the first cutoff value. It can simply be estimated that the concentration fraction is greater than the minimum value, whereas samples with concentration fractions lower than the minimum value can be warned, eg as not suitable for analysis. The minimum value can be determined based on the expected difference in the methylation level of the tumor compared to the reference methylation level. For example, if the difference is 0.5 (eg, used as a cutoff value), then the concentration of a particular tumor needs to be high enough to see this difference.

方法1300からの特定の手法は、方法2800に応用され得る。方法1300において、コピー数変動が腫瘍において決定され得る(例えば、腫瘍の第一染色体領域が、その腫瘍の第二染色体領域と比較してコピー数変化を有しているかどうかが検査され得る)。従って、方法1300により、腫瘍が存在することが推定され得る。方法2800において、試料は、いかなるコピー数の特徴にもかかわらず、いずれの腫瘍が存在する徴候があるかどうかが検査され得る。前記2つの方法のいくつかの手法は同様であり得る。しかし、方法2800のカットオフ値およびメチル化パラメーター(例えば、正規化されたメチル化レベル)では、がんDNAおよびコピー数変化を有し得るいくつかの領域を有する非がん性DNAの混合物の参照メチル化レベルからの差異とは対照的に、非がん性DNAの参照メチル化レベルからの統計的有意差が検出され得る。従って、方法2800の基準値は、がんを含まない試料から、例えば、がんを有さない生物から、または同一患者の非がん性組織から(例えば、事前に採取された血漿、または細胞DNAから決定され得る、がんを有さないことが知られている同時期に得られた試料から)、決定され得る。   Certain techniques from method 1300 can be applied to method 2800. In method 1300, copy number variation can be determined in the tumor (eg, it can be examined whether the chromosome 1 region of the tumor has a copy number change as compared to the chromosome 2 region of the tumor). Therefore, the method 1300 may presume that a tumor is present. In method 2800, the sample can be examined for signs of any tumor present, regardless of any copy number characteristics. Some approaches of the two methods may be similar. However, the cut-off values and methylation parameters (eg, normalized methylation levels) of method 2800 indicate that a mixture of cancer DNA and non-cancerous DNA with some regions that may have copy number changes. In contrast to the difference from the reference methylation level, a statistically significant difference from the reference methylation level of non-cancerous DNA can be detected. Accordingly, the baseline value for Method 2800 is from a cancer-free sample, eg, from a cancer-free organism, or from non-cancerous tissue of the same patient (eg, pre-collected plasma or cells). (Determined from DNA, from contemporaneously obtained samples known not to have cancer).

E. 血漿DNAメチル化解析を用いる検出される腫瘍DNA最小濃度分率の予測
血漿DNAのメチル化レベルを用いてがんを検出するアプローチの感度を測定する1つの方法は、対照の血漿DNAメチル化レベルと比較した場合の血漿DNAメチル化レベルにおける変化を明らかにするのに必要な、最小の腫瘍由来DNA濃度分率と関連している。検査感度は、健常対照群または血液細胞DNAにおける腫瘍組織およびベースライン血漿DNAメチル化レベル間のDNAメチル化における差異の程度にも依存している。血液細胞は、健常人の血漿中のDNAの主な供給源である。差異が大きいほど、がん患者は非がん性個体からより容易に区別され得、血漿中の腫瘍由来物のより低い検出限界およびがん患者を検出する際のより高い臨床的感度として反映されるだろう。さらに、健常対象または異なる年齢の対象における血漿DNAメチル化の変動(G Hannum et al. 2013 Mol Cell; 49: 359-367)も、がんの存在と関連するメチル化変化を検出する感度に影響するだろう。健常対象における血漿DNAメチル化の変動が小さいほど、少量のがん由来DNAの存在によって引き起こされる変化の検出はより容易になるだろう。
E. Prediction of Minimum Tumor DNA Concentration Fractions Detected Using Plasma DNA Methylation Analysis One method of measuring the sensitivity of the cancer detection approach using plasma DNA methylation levels is to control plasma DNA methylation levels. It is associated with the minimum tumor-derived DNA concentration fraction required to account for changes in plasma DNA methylation levels when compared to. The test sensitivity also depends on the degree of difference in DNA methylation between tumor tissue and baseline plasma DNA methylation levels in healthy control or blood cell DNA. Blood cells are the major source of DNA in the plasma of healthy people. The greater the difference, the more easily cancer patients can be distinguished from non-cancerous individuals, reflected in lower detection limits of tumor-derived in plasma and higher clinical sensitivity in detecting cancer patients. Will Furthermore, fluctuations in plasma DNA methylation in healthy subjects or subjects of different ages (G Hannum et al. 2013 Mol Cell; 49: 359-367) also influence the sensitivity of detecting methylation changes associated with the presence of cancer. will do. The smaller the fluctuations in plasma DNA methylation in healthy subjects, the easier it will be to detect the changes caused by the presence of small amounts of cancer-derived DNA.

図29Aは、分布が正規分布に従うことを仮定する、参照対象におけるメチル化密度の分布を示すプロット2900であり、この解析は、1つのメチル化密度値(例えば、全常染色体または特定の染色体のメチル化密度)のみを与える、各血漿試料に基づいている。それにより、解析の特異度がどのように影響を受けるかが説明される。一実施形態では、参照対象の平均DNAメチル化密度を3SD下回るカットオフが、検査試料が参照対象から得られた試料よりも有意により低いメチル化状態であるかどうかを決定するために用いられる。このカットオフが用いられる場合、非がん性対象のおよそ0.15%が、がんを有すると分類される偽陽性の結果を有することとなり、99.85%の特異度に帰着することが予想される。   FIG. 29A is a plot 2900 showing the distribution of methylation densities in a reference subject, assuming that the distribution follows a normal distribution, this analysis shows one methylation density value (eg, for all autosomal or specific chromosomes). (Methylation density) only, based on each plasma sample. It explains how the specificity of the analysis is affected. In one embodiment, a cutoff of 3 SD below the average DNA methylation density of the reference subject is used to determine if the test sample is significantly less methylated than the sample obtained from the reference subject. If this cutoff is used, approximately 0.15% of non-cancerous subjects will have false positive results classified as having cancer, resulting in a specificity of 99.85%. is expected.

図29Bは、参照対象およびがん患者におけるメチル化密度の分布を示す、プロット2950である。カットオフ値は、参照対象のメチル化密度の平均値を3SD下回る。がん患者のメチル化密度の平均値がカットオフ値を2SD下回る(すなわち、参照対象の平均値を5SD下回る)場合、がん対象の97.5%は、カットオフ値を下回るメチル化密度を有すると予想される。言い換えれば、1つのメチル化密度値が各対象に与えられる場合、例えば、ゲノム全体、全常染色体または特定の染色体の全体メチル化密度が解析される場合、予想感度は97.5%となるだろう。前記2つの集団の平均メチル化密度間の差異は、2つの因子、すなわち、がん性組織および非がん性組織間のメチル化レベルにおける差異の程度、並びに血漿試料中の腫瘍由来DNAの濃度分率に影響を受ける。これら2つのパラメーターの値が高いほど、これら2つの集団のメチル化密度値の差異はより大きくなるだろう。さらに、2つの集団のメチル化密度分布のSDが低いほど、それら2つの集団のメチル化密度分布の重複はより少なくなる。   FIG. 29B is a plot 2950 showing the distribution of methylation densities in reference subjects and cancer patients. The cut-off value is 3 SD below the mean value of the methylation density of the reference. If the mean methylation density of cancer patients is 2 SD below the cutoff value (ie, 5 SD below the mean of the reference subjects), 97.5% of cancer subjects will have a methylation density below the cutoff value. Expected to have. In other words, if one methylation density value is given to each subject, eg the whole methylation density of the whole genome, all autosomes or a particular chromosome is analyzed, the expected sensitivity will be 97.5%. Let's do it. The difference between the average methylation densities of the two populations depends on two factors: the degree of difference in methylation levels between cancerous and non-cancerous tissues, and the concentration of tumor-derived DNA in plasma samples. Affected by fractions. The higher the value of these two parameters, the greater the difference in the methylation density values of these two populations. Furthermore, the lower the SD of the methylation density distribution of the two populations, the less overlap of the methylation density distribution of the two populations.

以下で、仮説例を用いてこの概念を説明する。腫瘍組織のメチル化密度がおよそ0.45であり、健常対象の血漿DNAのメチル化密度がおよそ0.7であると仮定する。これらの仮定値は、常染色体の全体メチル化密度が42.9%であり、健常対照群から得られた血漿試料の常染色体の平均メチル化密度が71.6%であった、HCC患者から得られた値に類似している。ゲノム全体の血漿DNAメチル化密度を測定するCVが1%であると仮定すると、カットオフ値は、0.7×(100%−3×1%)=0.679、になる。97.5%の感度を達成するために、がん患者の血漿DNAの平均メチル化密度は、およそ、0.679−0.7×(2×1%)=0.665である必要がある。fにより血漿試料中の腫瘍由来DNAの濃度分率を表す。fは、(0.7−0.45)×f=0.7−0.665、として算出され得る。これから、fはおよそ14%である。この計算から、血漿中で検出が可能な最小濃度分率は14%であり、その結果、ゲノム全体の全体メチル化密度が診断パラメーターとして使用される場合に、97.5%の診断鋭敏度が達成されることが推定される。   Below, this concept is explained using a hypothetical example. It is assumed that the tumor tissue has a methylation density of approximately 0.45 and the plasma DNA of a healthy subject has a methylation density of approximately 0.7. These hypothesized values are from HCC patients whose autosomal total methylation density was 42.9% and the plasma samples obtained from the healthy control group had an autosomal average methylation density of 71.6%. It is similar to the value obtained. Assuming a CV measuring plasma DNA methylation density of the entire genome of 1%, the cut-off value is 0.7 × (100% −3 × 1%) = 0.679. To achieve a sensitivity of 97.5%, the average methylation density of plasma DNA of cancer patients should be approximately 0.679-0.7 x (2 x 1%) = 0.665. . f represents the concentration fraction of tumor-derived DNA in the plasma sample. f can be calculated as (0.7−0.45) × f = 0.7−0.665. From this, f is approximately 14%. From this calculation, the minimum detectable fraction in plasma is 14%, which results in a diagnostic sensitivity of 97.5% when the overall genome-wide methylation density is used as a diagnostic parameter. Estimated to be achieved.

次に、HCC患者から得られたデータに対してこの解析を行った。これを説明するために、全ての常染色体から推定された値に基づく1回のみのメチル化密度測定を各試料に行った。健常対象から得られた血漿試料間の平均メチル化密度は71.6%であった。これら4つの試料のメチル化密度のSDは0.631%であった。従って、血漿メチル化密度のカットオフ値は、−3未満のZ値および99.85%の特異度を達成するために、71.6%−3×0.631%=69.7%である必要がある。97.5%の感度を達成するために、がん患者の平均血漿メチル化密度は、カットオフを2SD下回っている(すなわち、68.4%である)必要がある。腫瘍組織のメチル化密度は42.9%であったため、式:P=BKG×(1−f)+TUM×fを用いると、fは少なくとも11.1%である必要がある。   This analysis was then performed on the data obtained from HCC patients. To account for this, only one methylation density measurement was performed on each sample based on the values estimated from all autosomes. The average methylation density between plasma samples obtained from healthy subjects was 71.6%. The SD of the methylation density of these four samples was 0.631%. Therefore, the cut-off value for plasma methylation density is 71.6% −3 × 0.631% = 69.7% to achieve a Z value of less than −3 and a specificity of 99.85%. There is a need. To achieve a sensitivity of 97.5%, the average plasma methylation density of cancer patients needs to be 2SD below the cutoff (ie, 68.4%). The methylation density of the tumor tissue was 42.9%, so using the formula: P = BKG × (1-f) + TUM × f, f should be at least 11.1%.

別の実施形態では、異なるゲノム領域のメチル化密度は、例えば、図25Aまたは図26Bに示されるように、別々に解析され得る。言い換えれば、複数のメチル化レベル測定が各試料に対して行われる。以下に示すように、有意な低メチル化は血漿中のさらにより低い腫瘍DNA濃度分率において検出され得るため、がん検出における血漿DNAメチル化解析の診断能は増強される。参照集団からのメチル化密度の有意な逸脱を示すゲノム領域の数が計数され得る。次に、ゲノム領域の数がカットオフ値と比較されて、検査されたゲノム領域の集団(例えば、ゲノム全体のの1Mbビン)にわたる血漿DNAの全体的な有意な低メチル化が存在するかどうかが決定され得る。カットオフ値は、がんを有さない参照対象の1群の解析によって確立されるか、または数学的に、例えば、正規分布関数に従って得られる。   In another embodiment, the methylation densities of different genomic regions can be analyzed separately, eg, as shown in FIG. 25A or FIG. 26B. In other words, multiple methylation level measurements are made on each sample. As shown below, significant hypomethylation can be detected at even lower tumor DNA concentration fractions in plasma, thus enhancing the diagnostic power of plasma DNA methylation analysis in cancer detection. The number of genomic regions showing a significant deviation of methylation density from the reference population can be counted. The number of genomic regions is then compared to a cutoff value to determine if there is an overall significant hypomethylation of plasma DNA over the population of examined genomic regions (eg, 1 Mb bins of the entire genome). Can be determined. The cut-off value is established by analysis of a panel of cancer free reference subjects or is obtained mathematically, for example according to a normal distribution function.

図30は、健常対象およびがん患者の血漿DNAのメチル化密度の分布を示す、プロット3000である。各1Mbビンのメチル化密度が参照群の対応する値と比較される。有意な低メチル化(参照群の平均値を3SD下回る)を示すビンの割合が決定された。腫瘍由来DNAが血漿試料中に存在しているかどうかを決定するために、有意な低メチル化状態である10%のカットオフが用いられた。検査の所望の感度および特異度に応じて、5%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%または90%等の他のカットオフ値も用いることができる。   FIG. 30 is a plot 3000 showing the distribution of methylation densities of plasma DNA in healthy subjects and cancer patients. The methylation density of each 1 Mb bin is compared to the corresponding value in the reference group. The percentage of bins showing significant hypomethylation (3 SD below the mean of the reference group) was determined. A cut-off of 10%, a significant hypomethylation state, was used to determine if tumor-derived DNA was present in plasma samples. 5%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80% or 90% depending on the desired sensitivity and specificity of the test Other cutoff values such as

例えば、腫瘍由来DNAを含有しているとして試料を分類するために、10%の、有意な低メチル化(−3未満のZ値)を示す1Mbビンがカットオフとして用いられ得る。参照群よりも有意により低メチル化状態であるビンが10%を超えて存在する場合、その試料はがん検査において陽性に分類される。各1Mbビンにおいて、参照群の平均メチル化密度を3SD下回るカットオフが、有意により低メチル化状態であると試料を定義するために用いられる。1Mbビンのそれぞれについて、がん患者の平均血漿DNAメチル化密度が参照対象の平均血漿DNAメチル化密度よりも1.72SD低い場合、がん患者のいずれか特定のビンのメチル化密度値がカットオフよりも低く(すなわち、−3未満のZ値)、陽性の結果を与える、10%の確率が存在する。次に、ゲノム全体の全ての1Mbビンを調べる場合、ビンのおよそ10%が、有意により低いメチル化密度を有する(すなわち、−3未満のZ値)という陽性の結果を示すことが予想される。健常対象の血漿DNAの全体メチル化密度はおよそ0.7であり、各1Mbビンの血漿DNAメチル化密度測定の変動係数(CV)が1%であると仮定すると、がん患者の血漿DNAの平均メチル化密度は、0.7×(100%−1.72×1%)=0.68796になる必要があるだろう。fを血漿中の腫瘍由来DNAの濃度分率とすると、この平均血漿DNAメチル化密度が得られる。腫瘍組織のメチル化密度が0.45であると仮定すると、fは下記式を用いて算出され得、   For example, to classify a sample as containing tumor-derived DNA, a 1 Mb bin showing 10% significant hypomethylation (Z value less than -3) can be used as a cutoff. A sample is classified as positive in a cancer test if greater than 10% of the bins are significantly more hypomethylated than the reference group. A cutoff of 3 SD below the mean methylation density of the reference group in each 1 Mb bin is used to define the sample as being significantly more hypomethylated. For each 1 Mb bin, if the mean plasma DNA methylation density of the cancer patient is 1.72 SD lower than the mean plasma DNA methylation density of the reference subject, the methylation density value of any particular bin of the cancer patient will be cut There is a 10% probability of giving a positive result, lower than off (ie, Z value less than −3). Next, when examining all 1 Mb bins across the genome, approximately 10% of the bins are expected to show positive results with significantly lower methylation densities (ie, Z values less than -3). . Assuming that the total methylation density of plasma DNA of a healthy subject is about 0.7, and the coefficient of variation (CV) of the measurement of plasma DNA methylation density of each 1 Mb bin is 1%, the The average methylation density would need to be 0.7 x (100% -1.72 x 1%) = 0.68796. This average plasma DNA methylation density is obtained, where f is the concentration fraction of tumor-derived DNA in plasma. Assuming that the methylation density of the tumor tissue is 0.45, f can be calculated using the formula:

式中、 In the formula,

は、参照個体中の血漿DNAの平均メチル化密度を表し; Represents the mean methylation density of plasma DNA in the reference individual;

は、がん患者の腫瘍組織のメチル化密度を表し; Represents the methylation density of the tumor tissue of a cancer patient;

は、がん患者の血漿DNAの平均メチル化密度を表す。 Represents the average methylation density of plasma DNA of cancer patients.

この式を用いると、(0.7−0.45)×f=0.7−0.68796となる。従って、最少濃度分率はこのアプローチを用いて検出され得、4.8%と推定される。感度は、有意により低メチル化状態であるビンのカットオフ率を、例えば、10%から5%まで減少させることにより、さらに増強され得る。   Using this equation, (0.7-0.45) xf = 0.7-0.68796. Therefore, the minimum concentration fraction can be detected using this approach and is estimated to be 4.8%. Sensitivity can be further enhanced by reducing the cutoff rate for bins that are significantly more hypomethylated, for example from 10% to 5%.

上記の例で示されたように、この方法の感度は、がん性組織および非がん性組織(例えば、血液細胞)間のメチル化レベルにおける差異の程度によって決定される。一実施形態では、非がん対象の血漿DNAおよび腫瘍組織間のメチル化密度において大きな差異を示す染色体領域のみが選択される。一実施形態では、0.5より大きなメチル化密度における差異を有する領域のみが選択される。他の実施形態では、0.4、0.6、0.7、0.8または0.9の差異が、適切な領域を選択するために用いられ得る。さらに別の実施形態では、ゲノム領域の物理的サイズは固定されない。代わりに、ゲノム領域は、例えば、固定の読み深度または固定のCpG部位数に基づいて定義される。これらのゲノム領域の複数におけるメチル化レベルが各試料において評価される。   As demonstrated in the examples above, the sensitivity of this method is determined by the degree of difference in methylation levels between cancerous and non-cancerous tissues (eg blood cells). In one embodiment, only those chromosomal regions that show large differences in methylation density between plasma DNA and tumor tissue of non-cancerous subjects are selected. In one embodiment, only regions with a difference in methylation density greater than 0.5 are selected. In other embodiments, a difference of 0.4, 0.6, 0.7, 0.8 or 0.9 can be used to select the appropriate region. In yet another embodiment, the physical size of the genomic region is not fixed. Instead, genomic regions are defined based on, for example, a fixed reading depth or a fixed number of CpG sites. Methylation levels in multiples of these genomic regions are evaluated in each sample.

図31は、健常対象の血漿DNAおよびHCC患者の腫瘍組織の平均値の間のメチル化密度における差異の分布を示す、グラフ3100である。正の値はメチル化密度が健常対象の血漿DNAにおいてより高いことを示し、負の値はメチル化密度が腫瘍組織においてより高いことを示す。   FIG. 31 is a graph 3100 showing the distribution of differences in methylation density between plasma DNA of healthy subjects and mean values of tumor tissue of HCC patients. Positive values indicate that the methylation density is higher in plasma DNA of healthy subjects, negative values indicate that the methylation density is higher in tumor tissue.

一実施形態では、がん組織および非がん性組織のメチル化密度間で最も大きな差異を有するビン(例えば、0.5超の差異を有するビン)が、腫瘍がこれらのビンにおいて低メチル化状態であるか高度メチル化状態であるかにかかわらず、選択され得る。血漿中の腫瘍由来DNAの濃度分率の検出限界は、がん対象および非がん対象間の血漿DNAメチル化レベルの分布間の差異がより大きいために、これらのビンに焦点を当てることにより低下し得、血漿中の腫瘍由来DNAが同じ濃度分率が与えられ得る。例えば、0.5超の差異を有するビンのみが用いられ、ビンの10%が有意により低メチル化状態であるというカットオフが採用されて検査個体ががんを有するかどうかが決定される場合、検出される腫瘍由来DNAの最小濃度分率(f)は、下記式を用いて算出され得、   In one embodiment, the bins that have the greatest difference between the methylation densities of cancerous and non-cancerous tissues (eg, those that have a difference of greater than 0.5) have tumors that are hypomethylated in these bins. It can be selected regardless of state or hypermethylation state. The detection limit of the concentration fraction of tumor-derived DNA in plasma was increased by focusing on these bins due to the greater difference between the distribution of plasma DNA methylation levels between cancer and non-cancer subjects. It can be reduced and tumor-derived DNA in plasma can be given the same concentration fraction. For example, if only bins with a difference of more than 0.5 are used, and a cutoff of 10% of the bins is significantly more hypomethylated is used to determine whether a test individual has cancer. The minimum concentration fraction (f) of tumor-derived DNA detected can be calculated using the following formula:

式中、 In the formula,

は、参照個体における血漿DNAの平均メチル化密度を表し; Represents the mean methylation density of plasma DNA in the reference individual;

は、がん患者における腫瘍組織のメチル化密度を表し; Represents the methylation density of tumor tissue in cancer patients;

は、がん患者における血漿DNAの平均メチル化密度を表す。 Represents the mean methylation density of plasma DNA in cancer patients.

一方、参照対象の血漿および腫瘍組織間のメチル化密度における差異は少なくとも0.5である。そのとき、0.5×f=0.7−0.68796となり、f=2.4%である。従って、がん組織および非がん性組織間のメチル化密度においてより大きな差異を有するビンに焦点を当てることにより、腫瘍由来DNA分率の下限は4.8%から2.4%に低下され得る。どのビンががん組織および非がん性組織(例えば、血液細胞)間でより大きな程度のメチル化差異を示すかに関する情報は、他の個体から得られる同じ臓器または同じ組織型の腫瘍組織から決定され得る。   On the other hand, the difference in methylation density between the reference plasma and the tumor tissue is at least 0.5. At that time, 0.5 × f = 0.7−0.68796, and f = 2.4%. Therefore, by focusing on bins with greater differences in methylation densities between cancerous and non-cancerous tissues, the lower limit of tumor-derived DNA fraction was reduced from 4.8% to 2.4%. obtain. Information on which bins show a greater degree of methylation difference between cancerous and non-cancerous tissues (eg blood cells) can be found in tumor tissues of the same organ or of the same tissue type obtained from other individuals. Can be determined.

別の実施形態では、パラメーターは全てのビンの血漿DNAのメチル化密度から得られ、がん組織および非がん性組織間のメチル化密度における差異が考慮され得る。より大きな差異を有するビンはより重い重量が与えられ得る。一実施形態では、各ビンのがん組織および非がん性組織間のメチル化密度における差異は、最終パラメーターを算出する際の特定のビンならば、重量として直接的に用いられ得る。   In another embodiment, the parameter is derived from the methylation density of plasma DNA in all bins, and differences in methylation density between cancerous and non-cancerous tissues can be considered. Bins with greater differences may be given heavier weight. In one embodiment, the difference in methylation densities between the cancerous and non-cancerous tissues of each bin can be used directly as the weight for a particular bin in calculating the final parameters.

さらに別の実施形態では、異なるがん型は、異なるパターンの腫瘍組織におけるメチル化を有し得る。がん特異的な重量特性は特定のがん型のメチル化の程度から得られ得る。   In yet another embodiment, different cancer types may have different patterns of methylation in tumor tissue. Cancer-specific weight profiles can be derived from the degree of methylation of a particular cancer type.

さらに別の実施形態では、メチル化密度のビンの間の関連性が、がんを有する対象およびがんを有さない対象において決定され得る。図8において、小数のビンにおいて、腫瘍組織が参照対象の血漿DNAよりもよりメチル化状態であったことが観察できる。従って、最も極端な差異の値(例えば0.5超の差異および0未満の差異)を有するビンが選択され得る。次に、検査個体ががんを有するかどうかを示すために、これらのビンのメチル化密度の比が用いられ得る。他の実施形態では、異なるビンのメチル化密度の差異および商が、ビンの間の関連性を示すためのパラメーターとして用いられ得る。   In yet another embodiment, the association between methylation density bins can be determined in subjects with and without cancer. In FIG. 8, it can be observed that in a small number of bins, the tumor tissue was more methylated than the reference plasma DNA. Therefore, the bin with the most extreme difference value (eg, greater than 0.5 difference and less than 0 difference) may be selected. The ratio of the methylation densities of these bins can then be used to indicate whether the test individual has cancer. In other embodiments, the difference and quotient of methylation densities of different bins can be used as a parameter to indicate the association between bins.

HCC患者から得られたデータにより示される、複数のゲノム領域のメチル化密度を用いて腫瘍を検出または評価するためのアプローチの検出感度をさらに評価した。まず、手術前血漿由来のリードを健常対照群の血漿試料由来のリードと混合して、20%〜0.5%の範囲の腫瘍DNA濃度分率を含有する血漿試料を模倣した。次に、−3未満のZ値と等しいメチル化密度を有する(ゲノム全体における2,734のビン中の)1Mbビンの割合を計数した。血漿中の腫瘍DNA濃度分率が20%であった場合に、ビンの80.0%が有意な低メチル化を示した。10%、5%、2%、1%および0.5%の血漿中の腫瘍DNA濃度分率に対応するデータは、それぞれ、67.6%、49.7%、18.9%、3.8%および0.77%の低メチル化を示すビンであった。対照試料において−3未満のZ値を示すビンの数の理論限界は0.15%であるため、我々のデータは、腫瘍濃度分率がたった0.5%であった場合でも、理論上のカットオフ限界を超えるさらに多くのビン(0.77%)が存在したことを示している。   The sensitivity of the approach for detecting or assessing tumors using the methylation densities of multiple genomic regions, demonstrated by the data obtained from HCC patients, was further evaluated. First, reads from pre-operative plasma were mixed with reads from healthy control plasma samples to mimic plasma samples containing tumor DNA concentration fractions ranging from 20% to 0.5%. The percentage of 1 Mb bins (out of 2,734 bins in the whole genome) with a methylation density equal to a Z value of less than -3 was then counted. 80.0% of the bins showed significant hypomethylation when the tumor DNA concentration fraction in plasma was 20%. Data corresponding to tumor DNA concentration fractions in plasma of 10%, 5%, 2%, 1% and 0.5% are 67.6%, 49.7%, 18.9%, 3. The bottles showed hypomethylation of 8% and 0.77%. Since the theoretical limit for the number of bins exhibiting Z-values less than -3 in the control sample is 0.15%, our data show that even if the tumor concentration fraction was only 0.5%, the theoretical It indicates that there were more bins (0.77%) above the cutoff limit.

図32Aは、血漿試料が5%または2%の腫瘍DNAを含有した場合の、配列決定深度の減少の影響を示す、表3200である。有意な低メチル化を示す高い割合のビン(0.15%超)は、平均配列決定深度が1倍体ゲノムあたりたった0.022回であった場合でも検出され得る。   FIG. 32A is a table 3200 showing the effect of reduced sequencing depth when plasma samples contained 5% or 2% tumor DNA. A high percentage of bins (> 0.15%) that show significant hypomethylation can be detected even when the average sequencing depth was only 0.022 times per haploid genome.

図32Bは、4人の健常対照患者の血漿、HCC患者の軟膜、正常肝組織、腫瘍組織、手術前血漿試料および手術後血漿試料における反復領域および非反復領域のメチル化密度を示す、グラフ3250である。がん組織および非がん性組織の両方において、反復領域が非反復領域よりもよりメチル化されていた(より高いメチル化密度)ことが観察され得る。しかし、反復領域および非反復領域間のメチル化における差異は、腫瘍組織と比較した場合、非がん性組織および健常対象の血漿DNAにおいて、より大きかった。   FIG. 32B is a graph 3250 showing methylation densities of repetitive and non-repetitive regions in plasma of four healthy control patients, buffy coat, normal liver tissue, tumor tissue of HCC patients, pre-operative and post-operative plasma samples. Is. It can be observed that the repetitive regions were more methylated (higher methylation density) than the non-repetitive regions in both cancerous and non-cancerous tissues. However, the difference in methylation between repetitive and non-repetitive regions was greater in non-cancerous tissue and plasma DNA of healthy subjects when compared to tumor tissue.

結果として、がん患者の血漿DNAは、非反復領域よりも、反復領域におけるメチル化密度においてより大きな減少を示した。4人の健常対照群の平均値およびHCC患者間の血漿DNAメチル化密度における差異は、反復領域および非反復領域において、それぞれ0.163および0.088であった。また、手術前血漿試料および手術後血漿試料に関するデータは、メチル化密度における変化のダイナミックレンジが非反復領域においてよりも反復領域においてより大きかったことを示した。一実施形態では、反復領域の血漿DNAメチル化密度は、患者がんに冒されているかどうかの決定または疾患増悪のモニタリングのために用いられ得る。   As a result, plasma DNA of cancer patients showed a greater reduction in methylation density in the repeat region than in the non-repetitive region. The difference in plasma DNA methylation density between the mean of 4 healthy controls and between HCC patients was 0.163 and 0.088 in the repetitive and non-repetitive regions, respectively. The data for pre- and post-operative plasma samples also showed that the dynamic range of changes in methylation density was greater in the repetitive region than in the non-repetitive region. In one embodiment, plasma DNA methylation densities of repetitive regions can be used to determine whether a patient has cancer or monitor disease progression.

前述の通り、参照対象の血漿におけるメチル化密度の変動は、がん患者を非がん個体と区別する正確さにも影響を与える。メチル化密度の分布がより密接であるほど(すなわち、標準偏差がより小さいほど)、がん対象および非がん対象の区別がより正確になる。別の実施形態では、1Mbビンのメチル化密度の変動係数(CV)が、参照群における血漿DNAメチル化密度の変動性が小さいビンを選択するための判定基準として用いられ得る。例えば、1%未満のCVを有するビンのみが選択される。他の値、例えば0.5%、0.75%、1.25%および1.5%も、メチル化密度の変動性が小さいビンを選択するための判定基準として用いることができる。さらに別の実施形態では、選択判定基準は、ビンのCV並びにがん組織および非がん性組織間のメチル化密度における差異の両方を含み得る。   As mentioned above, variations in the methylation density in the reference plasma also affect the accuracy with which cancer patients are distinguished from non-cancer individuals. The closer the distribution of methylation densities (ie, the smaller the standard deviation), the more accurate the distinction between cancer and non-cancer subjects. In another embodiment, the coefficient of variation of methylation density (CV) of 1 Mb bin can be used as a criterion for selecting bins with low variability of plasma DNA methylation density in the reference group. For example, only bins with a CV of less than 1% are selected. Other values, such as 0.5%, 0.75%, 1.25% and 1.5% can also be used as criteria for selecting bins with low methylation density variability. In yet another embodiment, the selection criteria may include both the CV of the bin and the difference in methylation density between cancerous and non-cancerous tissues.

メチル化密度は、腫瘍組織のメチル化密度が既知である場合の血漿試料中の腫瘍由来DNAの濃度分率を推定するのにも用いることができる。この情報は、患者の腫瘍の解析によって、または同じがん型を有する幾人かの患者から得られた腫瘍の調査から、得ることができる。前述の通り、血漿メチル化密度(P)は下記式を用いて表現することができ、   Methylation density can also be used to estimate the concentration fraction of tumor-derived DNA in plasma samples where the methylation density of the tumor tissue is known. This information can be obtained by analysis of the patient's tumor or from examination of tumors obtained from several patients with the same cancer type. As mentioned above, the plasma methylation density (P) can be expressed using the following equation:

式中、BKGは血液細胞および他の臓器から得られたバックグラウンドメチル化密度、TUMは腫瘍組織におけるメチル化密度であり、fは血漿試料中の腫瘍由来DNAの濃度分率である。これは以下のように書き換えることができる。 Where BKG is the background methylation density obtained from blood cells and other organs, TUM is the methylation density in tumor tissue, and f is the concentration fraction of tumor-derived DNA in plasma samples. This can be rewritten as:

BKGの値は、がんが存在していない時点の患者の血漿試料を解析することによって、またはがんを有さない個体から成る参照群の調査から、決定することができる。従って、血漿メチル化密度を測定した後、fを決定することができる。   BKG values can be determined by analyzing plasma samples of patients at the absence of cancer or from a survey of a reference group of individuals without cancer. Therefore, f can be determined after measuring the plasma methylation density.

F. 他の方法との併用
本明細書に記載のメチル化解析アプローチは、血漿中の腫瘍由来DNAの遺伝子変化に基づく他の方法と併用して用いることができる。そのような方法の例には、がん関連染色体異常(KCA Chan et al. 2013 Clin Chem; 59:211-224; RJ Leary et al. 2012 Sci Transl Med; 4:162ra154)および血漿におけるがん関連単一ヌクレオチド変異(KCA Chan et al. 2013 Clin Chem; 59:211-224)の解析が含まれる。メチル化解析アプローチにはそれらの遺伝学的アプローチに優る利点が存在する。
F. Combination with other methods The methylation analysis approach described herein can be used in combination with other methods based on genetic alterations of tumor-derived DNA in plasma. Examples of such methods include cancer-associated chromosomal abnormalities (KCA Chan et al. 2013 Clin Chem; 59: 211-224; RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154) and cancer-related in plasma. Analysis of single nucleotide mutations (KCA Chan et al. 2013 Clin Chem; 59: 211-224) is included. The methylation analysis approaches have advantages over their genetic approaches.

図21Aに示すように、腫瘍DNAの低メチル化は、ゲノムのほぼ全体にわたって分布する領域を含む全体的な現象である。従って、全ての染色体領域からのDNA断片は、患者における血漿/血清DNAへの腫瘍由来低メチル化DNAの潜在的寄与に関して、有益である。対照的に、染色体異常(染色体領域の増幅または欠失)はいくつかの染色体領域に存在するのみであり、腫瘍組織における染色体異常を有さない領域からのDNA断片は解析において有益ではない(KCA Chan et al. 2013 Clin Chem; 59: 211-224)。同様に、ほんの数千の単一ヌクレオチド変化各がんゲノムにおいて観察される(KCA Chan et al. 2013 Clin Chem; 59: 211-224)。これらの単一ヌクレオチド変化と重複しないDNA断片は、腫瘍由来DNAが血漿中に存在しているかどうかを決定する際に有益ではない。従って、本メチル化解析アプローチは、循環血液中でがんに関連する変化を検出するそれらの遺伝学的アプローチよりも潜在的により対費用効果が高い。   As shown in FIG. 21A, hypomethylation of tumor DNA is a global phenomenon that includes regions distributed almost throughout the genome. Therefore, DNA fragments from all chromosomal regions are beneficial with respect to the potential contribution of tumor-derived hypomethylated DNA to plasma / serum DNA in patients. In contrast, chromosomal abnormalities (amplification or deletion of chromosomal regions) are only present in some chromosomal regions, and DNA fragments from regions without chromosomal abnormalities in tumor tissue are not informative (KCA). Chan et al. 2013 Clin Chem; 59: 211-224). Similarly, only thousands of single nucleotide changes are observed in each cancer genome (KCA Chan et al. 2013 Clin Chem; 59: 211-224). DNA fragments that do not overlap with these single nucleotide changes are not useful in determining whether tumor-derived DNA is present in plasma. Thus, the present methylation analysis approaches are potentially more cost-effective than their genetic approaches to detect cancer-related changes in circulating blood.

一実施形態では、血漿DNAメチル化解析の対費用効果の高さは、最も有益な領域からのDNA断片、例えば、がん組織および非がん性組織間で最も高度に示差的なメチル化差異を有する領域を富化することによって、さらに増強され得る。これらの領域を富化する方法の例には、ハイブリダイゼーションプローブ(例えば、ニンブルジェン社製SeqCapシステムおよびアジレント社製SureSelect Target Enrichmentシステム)、PCR増幅および固相ハイブリダイゼーションの使用が含まれる。   In one embodiment, the cost-effectiveness of plasma DNA methylation analysis is due to the DNA fragments from the most informative regions, such as the most highly differential methylation differences between cancerous and non-cancerous tissues. Can be further enhanced by enriching the region with Examples of methods for enriching these regions include the use of hybridization probes (eg, Nimburgen SeqCap system and Agilent SureSelect Target Enrichment system), PCR amplification and solid phase hybridization.

G. 組織特異的解析/提供者
腫瘍由来細胞は隣接臓器または遠隔臓器に浸潤および転移する。浸潤された組織または転移巣は、細胞死の結果としてDNAを血漿中に供給する。がん患者の血漿中のDNAのメチル化特性を解析し、組織特異的メチル化サインの存在を検出することにより、疾患経過に関与する組織型を検出することができる。このアプローチは、がん過程に関与する組織の非浸潤性解剖学的走査を提供することで、原発部位および転移部位として関わる臓器の特定に役立つ。また、血漿中の病変臓器のメチル化サインの相対濃度をモニタリングすることにより、それらの臓器の腫瘍量を評価し、その臓器におけるがん過程が増悪中であるまたは改善中であるまたは治癒が完了しているかどうかを決定することが可能となる。例えば、遺伝子Xが肝臓において特異的にメチル化されているとする。その場合、がん(例えば、結腸直腸がん)によるその肝臓の転移性関与は、血漿中の遺伝子X由来のメチル化配列の濃度を増加させると予想される。遺伝子Xと似たメチル化特徴を有する別の配列または配列群も存在するだろう。その場合、そのような配列から得られた結果を組み合わせることができる。同様の考察が、他の組織、例えば、脳、骨、肺および腎臓等に適用可能である。
G. Tissue-specific analysis / donor Tumor-derived cells invade and metastasize to adjacent or distant organs. Infiltrated tissues or metastases supply DNA into the plasma as a result of cell death. By analyzing the methylation characteristics of DNA in plasma of cancer patients and detecting the presence of a tissue-specific methylation signature, the tissue type involved in the disease process can be detected. This approach helps identify organs involved as primary and metastatic sites by providing a non-invasive anatomical scan of tissues involved in the cancer process. In addition, by monitoring the relative levels of methylation signatures in diseased organs in plasma, tumor burden in those organs can be assessed and the cancer process in those organs is worsening or improving or the cure is complete. It becomes possible to decide whether or not. For example, suppose gene X is specifically methylated in the liver. In that case, metastatic involvement of the liver by the cancer (eg, colorectal cancer) would be expected to increase the concentration of the methylated sequence from gene X in plasma. There may be other sequences or sequences with similar methylation characteristics as gene X. In that case, the results obtained from such sequences can be combined. Similar considerations apply to other tissues, such as brain, bone, lungs and kidneys.

一方、異なる臓器由来のDNAは組織特異的メチル化サインを示すことが知られている(BW Futscher et al. 2002 Nat Genet; 31:175-179; SSC Chim et al. 2008 Clin Chem; 54: 500-511)。従って、血漿中のメチル化プロファイリングは、種々の臓器に由来する組織の血漿中への寄与を解明するために用いることができる。血漿DNAは細胞が死ぬ時に放出されると考えられているため、そのような寄与の解明は臓器傷害を評価するのに用いることができる。例えば、肝炎(例えば、ウイルス、自己免疫過程等による)または肝毒性(hepatoxicity)(例えば、薬剤過剰摂取(パラセタモール等による)または薬剤によって生じる毒素(アルコール等)等の肝臓病変は、肝細胞傷害と関連しており、血漿中の肝臓由来DNAのレベルの増加と関連していることが予想される。例えば、遺伝子Xが肝臓において特異的にメチル化されているとする。その場合、肝臓病変は、血漿中の遺伝子X由来メチル化配列の濃度を増加させると予想される。逆に、肝臓において遺伝子Yが特異的に低メチル化されているとする。その場合、肝臓病変は、血漿中の遺伝子Y由来メチル化配列の濃度を減少させると予想される。さらに他の実施形態では、遺伝子Xまたは遺伝子Yは、遺伝子でなくてもよい、身体内の異なる組織において示差的なメチル化を示すいかなるゲノム配列によっても置換され得る。   On the other hand, DNAs derived from different organs are known to show a tissue-specific methylation signature (BW Futscher et al. 2002 Nat Genet; 31: 175-179; SSC Chim et al. 2008 Clin Chem; 54: 500. -511). Therefore, plasma methylation profiling can be used to elucidate the contribution of tissues from various organs to plasma. Since plasma DNA is believed to be released when cells die, elucidation of such contributions can be used to assess organ injury. For example, liver lesions such as hepatitis (eg, due to viruses, autoimmune processes, etc.) or hepatotoxicity (eg, drug overdose (eg, paracetamol) or toxins (alcohol, etc.) caused by drugs are associated with hepatocyte damage. It is related and is expected to be associated with an increase in the level of liver-derived DNA in plasma, eg, gene X is specifically methylated in the liver, in which case liver lesions are , It is expected to increase the concentration of methylated sequences derived from gene X in plasma. Conversely, gene Y is specifically hypomethylated in the liver, in which case liver lesions It is expected to reduce the concentration of methylated sequences from gene Y. In yet other embodiments, gene X or gene Y may be different from the body, which may not be the gene. It may be replaced by any genomic sequence show differential methylation in weaving.

本明細書に記載の手法は、臓器移植受容者の血漿中の提供者由来DNAの評価にも適用することができる(YMD Lo et al. 1998 Lancet; 351:1329-1330)。提供者および受容者間の多形性差異が、血漿中で提供者由来DNAを受容者由来DNAと区別するのに用いられた(YW Zheng et al. 2012 Clin Chem; 58: 549-558)。移植臓器の組織特異的メチル化サインが受容者の血漿中の提供者DNAを検出する方法としても用いられ得ることを報告する。   The method described herein can also be applied to the evaluation of donor-derived DNA in plasma of organ transplant recipients (YMD Lo et al. 1998 Lancet; 351: 1329-1330). Polymorphic differences between donors and recipients were used to distinguish donor-derived DNA from recipient-derived DNA in plasma (YW Zheng et al. 2012 Clin Chem; 58: 549-558). We report that the tissue-specific methylation signature of transplanted organs can also be used as a method to detect donor DNA in the plasma of recipients.

提供者DNAの濃度をモニタリングすることにより、移植臓器の状態を非侵襲的に評価することができる。例えば、移植拒絶反応は、より高い細胞死率、およびそれによる、移植臓器のメチル化サインによって反映される受容者血漿(または血清)中の提供者DNAのより高い濃度と関連しており、患者が安定状態にある時と比較した場合、または他の安定な移植受容者もしくは移植されていない健常対照群と比較した場合に、増加しているだろう。がんについて報告されていることと同様に、提供者由来DNAは、多形性差異、移植された実質臓器のより短いサイズのDNA(YW Zheng et al. 2012 Clin Chem; 58: 549-558)および組織特異的メチル化特性を含む特性の全てまたはいくつかを検出することにより、移植受容者の血漿中で特定され得る。   By monitoring the concentration of the donor DNA, the condition of the transplanted organ can be evaluated non-invasively. For example, transplant rejection is associated with higher cell death rates, and thereby higher concentrations of donor DNA in recipient plasma (or serum) as reflected by the methylation signature of transplanted organs, Would be increased when compared to the stable state or to other stable transplant recipients or non-transplanted healthy controls. Similar to what has been reported for cancer, donor-derived DNA is polymorphic difference, shorter size DNA of transplanted parenchymal organs (YW Zheng et al. 2012 Clin Chem; 58: 549-558). And by detecting all or some of the properties, including tissue-specific methylation properties, can be identified in the plasma of transplant recipients.

H. サイズに基づくメチル化の正規化
上記およびLun et al(FMF Lun et al. Clin. Chem. 2013; doi:10.1373/clinchem.2013.212274)に記載されているように、メチル化密度(例えば、血漿DNAのメチル化密度)はDNA断片のサイズと相関している。より短い血漿DNA断片のメチル化密度の分布は、より長い断片のメチル化密度よりも有意により低かった。血漿DNAの異常な断片化パターンを有するいくつかの非がん性状態(例えば、全身性エリテマトーデス(SLE))が、より低メチル化状態であるより大量の短い血漿DNA断片の存在により、見かけの血漿DNA低メチル化を示し得ることを提唱する。言い換えれば、血漿DNAのサイズ分布は、血漿DNAのメチル化密度の交絡因子であり得る。
H. Normalization of Methylation Based on Size As described above and in Lun et al (FMF Lun et al. Clin. Chem. 2013; doi: 10.1373 / clinchem.2013.212274), methylation density (eg plasma DNA Methylation density) correlates with the size of the DNA fragment. The distribution of methylation densities of shorter plasma DNA fragments was significantly lower than that of longer fragments. Some non-cancerous conditions (eg, systemic lupus erythematosus (SLE)) with an abnormal pattern of plasma DNA fragmentation are apparent due to the presence of larger amounts of shorter plasma DNA fragments that are more hypomethylated. We propose that it may exhibit plasma DNA hypomethylation. In other words, the size distribution of plasma DNA can be a confounder of the methylation density of plasma DNA.

図34Aは、SLE患者SLE04における血漿DNAのサイズ分布を示している。9人の健常対照患者のサイズ分布は灰色点線として示され、SLE04のサイズ分布は黒色実線として示される。短い血漿DNA断片は、9人の健常対照患者においてよりも、SLE04においてより豊富であった。より短いDNA断片は概してより低メチル化状態であるため、このサイズ分布パターンは、血漿DNAのメチル化解析を混乱させ、さらなる見かけの低メチル化をもたらし得る。   FIG. 34A shows the size distribution of plasma DNA in SLE patient SLE04. The size distribution of 9 healthy control patients is shown as the gray dotted line and the size distribution of SLE04 is shown as the black solid line. Short plasma DNA fragments were more abundant in SLE04 than in 9 healthy control patients. This size distribution pattern can disrupt the methylation analysis of plasma DNA, resulting in additional apparent hypomethylation, as shorter DNA fragments are generally more hypomethylated.

いくつかの実施形態において、血漿DNAメチル化解析に対するサイズ分布の交絡効果を低減させるために、測定されたメチル化レベルは正規化され得る。例えば、複数個の部位におけるDNA分子のサイズが測定され得る。種々の実施において、測定によって、DNA分子の特定のサイズ(例えば、長さ)が得られるか、またはサイズにも対応し得る、サイズが特定の範囲内にあることが単に決定され得る。次に、正規化されたメチル化レベルはカットオフ値と比較され得る。サイズ分布の血漿DNAメチル化解析に対する交絡効果を低減させるための正規化を行うための、いくつかの方法がある。   In some embodiments, the measured methylation levels can be normalized to reduce the confounding effect of size distribution on plasma DNA methylation analysis. For example, the size of the DNA molecule at multiple sites can be measured. In various implementations, measurements can simply determine that a size is within a particular range, which can, or can correspond to, a particular size (eg, length) of a DNA molecule. The normalized methylation level can then be compared to the cutoff value. There are several ways to perform normalization to reduce confounding effects on plasma DNA methylation analysis of size distribution.

一実施形態では、DNA(例えば、血漿DNA)のサイズ分画が行われ得る。サイズ分画は、類似のサイズを有するDNA断片が、カットオフ値と整合的な様式でメチル化レベルを決定するのに用いられることを確実にし得る。サイズ分画の一部として、第一のサイズ(例えば、第一の長さ範囲)を有するDNA断片が選択され得、ここで、第一のカットオフ値は第一のサイズに対応している。正規化は、それらの選択されたDNA断片のみを用いてメチル化レベルを算出することにより達成され得る。   In one embodiment, size fractionation of DNA (eg, plasma DNA) can be performed. Size fractionation may ensure that DNA fragments with similar sizes are used to determine methylation levels in a manner consistent with cutoff values. As part of the size fraction, a DNA fragment having a first size (eg, a first length range) can be selected, where the first cutoff value corresponds to the first size. . Normalization can be achieved by calculating methylation levels using only those selected DNA fragments.

サイズ分画は、種々の方法で、例えば、異なるサイズのDNA分子の物理的分離によって(例えば電気泳動もしくはマイクロフルイディクスに基づく科学技術、または遠心分離に基づく科学技術によって)、またはインシリコ解析によって、達成され得る。インシリコ解析において、一実施形態では、血漿DNA分子のペアエンド大規模並列配列決定が行われ得る。次に、配列決定された分子のサイズが、血漿DNA分子の2つの末端のそれぞれの位置を参照ヒトゲノムと比較することにより、推定され得る。次に、一つまたは複数のサイズ選択判定基準(例えば、特定の範囲内であるサイズの判定基準)に適合する配列決定されたDNA分子を選択することにより、その後の解析が行われ得る。従って、一実施形態では、より小さなサイズ(例えば、特定の範囲内)を有する断片のメチル化密度が解析され得る。カットオフ値(例えば、方法2800のブロック2840における)は、同じサイズ範囲内の断片に基づいて決定され得る。例えば、メチル化レベルはがんを有するまたはがんを有さないことが知られている試料から決定され得、カットオフ値はこれらのメチル化レベルから決定され得る。   Size fractionation can be performed in various ways, for example by physical separation of DNA molecules of different sizes (for example by electrophoretic or microfluidics-based technology or by centrifugation-based technology) or by in silico analysis. Can be achieved. In in silico analysis, in one embodiment, paired-end massively parallel sequencing of plasma DNA molecules can be performed. The size of the sequenced molecule can then be estimated by comparing the position of each of the two ends of the plasma DNA molecule to the reference human genome. Subsequent analysis can then be performed by selecting sequenced DNA molecules that meet one or more size selection criteria (eg, a size criterion within a particular range). Thus, in one embodiment, the methylation density of fragments with smaller size (eg, within a certain range) can be analyzed. The cutoff value (eg, at block 2840 of method 2800) may be determined based on the fragments within the same size range. For example, methylation levels can be determined from samples known to have cancer or not, and cutoff values can be determined from these methylation levels.

別の実施形態では、循環DNAのメチル化密度およびサイズ間の関数関係が決定され得る。関数関係は、関数のデータポイントまたは係数によって定義され得る。関数関係はそれぞれのサイズに対応するスケーリング値を与え得る(例えば、より短いサイズはメチル化に対する対応する増加を有し得る)。種々の実施において、スケーリング値は、0〜1または1超であり得る。   In another embodiment, a functional relationship between methylation density and size of circulating DNA can be determined. Functional relationships can be defined by the data points or coefficients of the function. The functional relationship may provide a scaling value corresponding to each size (eg, shorter size may have a corresponding increase for methylation). In various implementations, the scaling value can be 0-1 or greater than 1.

正規化は平均サイズに基づいて行われ得る。例えば、第一メチル化レベルを算出するのに用いられるDNA分子に対応する平均サイズがコンピュータで算出され得、その第一メチル化レベルが対応するスケーリング値(すなわち、平均サイズに対応している)で乗算され得る。別の例として、各DNA分子のメチル化密度は、DNA分子のサイズ並びにDNAサイズおよびメチル化間の関連性に従って正規化され得る。   Normalization can be done based on average size. For example, the average size corresponding to the DNA molecules used to calculate the first methylation level can be computed and the first methylation level corresponds to a corresponding scaling value (ie, corresponding to the average size). Can be multiplied by. As another example, the methylation density of each DNA molecule can be normalized according to the size of the DNA molecule and the relationship between DNA size and methylation.

別の実施において、正規化は分子毎に行われ得る。例えば、特定部位におけるDNA分子のそれぞれのサイズが(例えば、上記のように)得られ、それぞれのサイズに対応するスケーリング値が関数関係から特定され得る。正規化されない算出において、各分子は部位におけるメチル化指数の決定において同等に計数される。正規化された算出において、メチル化指数に対する分子の寄与は、分子のサイズに対応するスケーリング因子によって加重値が与えられ得る。   In another implementation, normalization can be done on a molecule-by-molecule basis. For example, the size of each of the DNA molecules at a particular site can be obtained (eg, as described above) and the scaling value corresponding to each size can be identified from the functional relationship. In the non-normalized calculation, each molecule is counted equally in determining the methylation index at the site. In a normalized calculation, the contribution of a molecule to the methylation index can be weighted by a scaling factor that corresponds to the size of the molecule.

図34Bおよび図34Cは、SLE患者SLE04(図34B)およびHCC患者TBR36(図34C)から得られた血漿DNAのメチル化解析を示している。外側の環は、インシリコサイズ分画無しの血漿DNAのZmeth結果を示している。内側の環は、130bp以上の血漿DNAのZmeth結果を示している。SLE患者SLE04において、ビンの84%がインシリコサイズ分画無しで低メチル化を示した。低メチル化を示すビンの割合は、130bp以上の断片のみが解析された場合に、15%にまで減少した。HCC患者TBR36において、ビンの98.5%および98.6%が、それぞれインシリコサイズ分画有りまたは無しで、血漿DNAの低メチル化を示した。これらの結果は、インシリコサイズ分画が、血漿DNAの断片化の増加(例えば、SLEまたは他の炎症性疾患を有する患者における)に関連する、偽陽性の低メチル化結果を効果的に減少させ得ることを示唆している。 34B and 34C show methylation analysis of plasma DNA from SLE patient SLE04 (FIG. 34B) and HCC patient TBR36 (FIG. 34C). The outer circle shows the Z meth result for plasma DNA without in silico size fractionation. The inner ring shows the Z meth result for plasma DNA above 130 bp. In SLE patient SLE04, 84% of the bins showed hypomethylation without in silico size fractionation. The percentage of bins exhibiting hypomethylation was reduced to 15% when only fragments of 130 bp and above were analyzed. In HCC patient TBR36, 98.5% and 98.6% of the bins showed hypomethylation of plasma DNA with or without in silico size fractionation, respectively. These results indicate that in silico size fractionation effectively reduces false positive hypomethylation results associated with increased fragmentation of plasma DNA (eg, in patients with SLE or other inflammatory diseases). Suggests to get.

一実施形態では、サイズ分画有りおよび無しの解析の結果が比較されて、メチル化結果に対するサイズの交絡効果が存在するかが示され得る。従って、正規化に加えて、または正規化の代わりに、特定のサイズにおけるメチル化レベルの算出が、カットオフ値を超えるビンの割合がサイズ分画有りおよび無しで異なる場合の偽陽性の可能性が存在するかどうか、または特定のメチル化レベルのみが異なるのかどうかを決定するために、用いられ得る。例えば、サイズ分画有りおよび無しでの試料の結果間の有意差の存在が、異常な断片化パターンによる偽陽性結果の可能性を示すために用いられ得る。差異が有意であるかどうかを決定するための閾値は、がん患者のコホートおよび非がん対照患者のコホートの解析によって確立され得る。   In one embodiment, the results of analyzes with and without size fractionation can be compared to indicate if there is a size confounding effect on methylation results. Therefore, in addition to, or instead of, normalization, the calculation of methylation levels at a particular size may result in false positives when the percentage of bins above the cutoff value differs with and without size fractionation. Can be used to determine whether or not a particular methylation level differs. For example, the presence of a significant difference between the results of samples with and without size fractionation can be used to indicate the likelihood of false positive results due to aberrant fragmentation patterns. Thresholds for determining whether a difference is significant can be established by analysis of cohorts of cancer patients and non-cancer control patients.

I. 血漿中のゲノムワイドなCG島高度メチル化の解析
全体的な低メチル化に加えて、CG島の高度メチル化が、がんにおいて共通して観察される(SSB Baylin et al. 2011 Nat Rev Cancer; 11: 726-734; PA Jones et al. 2007, Cell; 128: 683-692; M Esteller et al. 2007 Nat Rev Genet 2007; 8: 286-298; M Ehrlich et al. 2002 Oncogene 2002; 21: 5400-5413)。このセクションでは、がんを検出およびモニタリングするためのCG島高度メチル化のゲノムワイド解析の使用について記載する。
I. Analysis of genome-wide CG island hypermethylation in plasma In addition to global hypomethylation, CG island hypermethylation is commonly observed in cancer (SSB Baylin et al. 2011 Nat Rev Cancer ; 11: 726-734; PA Jones et al. 2007, Cell; 128: 683-692; M Esteller et al. 2007 Nat Rev Genet 2007; 8: 286-298; M Ehrlich et al. 2002 Oncogene 2002; 21: 5400-5413). This section describes the use of genome-wide analysis of CG island hypermethylation to detect and monitor cancer.

図35は、本発明の実施形態に従って、CG島の高度メチル化に基づいてがんのレベルの分類を決定する、方法3500のフローチャートである。方法2800の複数の部位にはCpG部位が含まれ得、ここで、CpG部位は複数のCG島に構築され、各CG島は一つまたは複数のCpG部位を含んでいる。各CG島のメチル化レベルは、がんのレベルの分類を決定するために用いられ得る。   FIG. 35 is a flowchart of a method 3500 for determining a cancer level classification based on CG island hypermethylation, according to an embodiment of the invention. The plurality of sites of method 2800 can include CpG sites, where the CpG sites are assembled into multiple CG islands, each CG island including one or more CpG sites. The methylation level of each CG island can be used to determine the classification of cancer levels.

ブロック3510において、解析されるCG島が特定される。この解析において、一例として、健常参照対象の血漿における比較的低いメチル化密度を特徴とする、解析される一連のCG島が定義された。一態様において、がん関連高度メチル化の検出をより容易に可能とするために、参照群におけるメチル化密度の変化は比較的小さなものであり得る。一実施形態では、CG島は参照群における第一の割合に満たない平均メチル化密度を有し、参照群におけるメチル化密度の変動係数は第二の割合に満たない。   At block 3510, CG islands to be analyzed are identified. In this analysis, as an example, a series of CG islands to be analyzed were defined, which were characterized by a relatively low methylation density in plasma of a healthy reference. In one aspect, the change in methylation density in the reference group can be relatively small to allow for easier detection of cancer-associated hypermethylation. In one embodiment, the CG islands have an average methylation density that is less than the first percentage in the reference group and the coefficient of variation of methylation density in the reference group is less than the second percentage.

一例として、説明を目的として、以下の判定基準が有用なCG島を特定するために用いられる:
i. 参照群(例えば健常対象)におけるCG島の平均メチル化密度が5%未満
ii. 参照群(例えば健常対象)の血漿におけるメチル化密度の解析の変動係数が30%未満。これらのパラメーターは特定の適用のために調整され得る。我々のデータセットから、ゲノム内の454のCG島がこれらの判定基準を満たした。
As an example, for illustrative purposes, the following criteria are used to identify useful CG islands:
i. Average methylation density of CG islands in the reference group (eg healthy subjects) is less than 5% ii. Coefficient of variation of analysis of methylation density in plasma of reference group (eg healthy subjects) is less than 30%. These parameters can be adjusted for the particular application. From our dataset, 454 CG islands within the genome met these criteria.

ブロック3520において、各CG島のメチル化密度が算出される。メチル化密度は本明細書に記載の通りに算出され得る。   At block 3520, the methylation density for each CG island is calculated. Methylation density can be calculated as described herein.

ブロック3530において、各CG島が高度メチル化されているかどうかが決定される。例えば、検査症例のCG島高度メチル化の解析において、各CG島のメチル化密度は、参照群の対応するデータと比較された。メチル化密度(メチル化レベルの一例)が一つまたは複数のカットオフ値と比較されて、特定の島が高度メチル化されているかどうかが決定され得る。   At block 3530, it is determined whether each CG island is hypermethylated. For example, in the analysis of CG island hypermethylation of the tested cases, the methylation density of each CG island was compared to the corresponding data of the reference group. Methylation density (an example of methylation level) can be compared to one or more cutoff values to determine whether a particular island is hypermethylated.

一実施形態では、第一カットオフ値は、参照群のメチル化密度の平均値+特定の割合に一致し得る。別のカットオフ値は、参照群のメチル化密度の平均値+特定の標準偏差値に一致し得る。ある実施では、Z値(Zmeth)が算出され、カットオフ値と比較された。一例として、検査対象(例えば、がんを検診されている対象)におけるCG島は、以下の判定基準を満たした場合に有意に高度メチル化されていると見なされた:
i. そのメチル化密度が参照群の平均値よりも2%より高く、
ii. Zmethが3より大きい。
また、これらのパラメーターは特定の適用のために調整され得る。
In one embodiment, the first cutoff value may correspond to the mean value of the methylation density of the reference group + a specific percentage. Another cut-off value may correspond to the mean of the methylation densities of the reference group + a specific standard deviation value. In one implementation, the Z value (Z meth ) was calculated and compared to the cutoff value. As an example, a CG island in a test subject (eg, a subject who has been screened for cancer) was considered to be significantly hypermethylated if the following criteria were met:
i. Its methylation density is more than 2% higher than the mean value of the reference group,
ii. Z meth is greater than 3.
Also, these parameters can be adjusted for the particular application.

ブロック3540において、高度メチル化CG島のメチル化密度(例えば、Z値)は、累積スコアを決定するために用いられる。例えば、有意に高度メチル化されたCG島を全て特定した後、Z値の和または高度メチル化されたCG島全てのZ値の関数を含むスコアが算出され得る。スコアの一例は、別のセクションに記載される累積確率(CP)スコアである。累積確率スコアは、確率分布(例えば、自由度3を有するスチューデントt確率分布)に従って、そのような観察を偶然に有する確率を決定するためにZmethを用いる。 At block 3540, the methylation density (eg, Z value) of hypermethylated CG islands is used to determine a cumulative score. For example, after identifying all significantly hypermethylated CG islands, a score can be calculated that includes the sum of Z values or a function of the Z values of all hypermethylated CG islands. An example of a score is the cumulative probability (CP) score described in another section. Cumulative probability scores use Z meth to determine the probability of having such observations by chance, according to a probability distribution (eg, Student's t probability distribution with 3 degrees of freedom).

ブロック3550において、累積スコアは、がんのレベルの分類を決定するために、累積閾値と比較される。例えば、特定されたCG島における全高度メチル化が充分に大きい場合、その生物はがんを有していると特定され得る。一実施形態では、累積閾値は参照群から得られる最も高い累積スコアに一致する。   At block 3550, the cumulative score is compared to a cumulative threshold to determine the level classification of the cancer. For example, an organism can be identified as having cancer if the total hypermethylation at the identified CG island is sufficiently high. In one embodiment, the cumulative threshold matches the highest cumulative score obtained from the reference group.

IX. メチル化およびCNA
上記のように、本明細書に記載のメチル化解析アプローチは、血漿中の腫瘍由来DNAの遺伝子変化に基づく他の方法と併用して用いられ得る。そのような方法の例には、がん関連染色体異常の解析が含まれる(KCA Chan et al. 2013 Clin Chem; 59: 211-224; RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154)。コピー数異常(CNA)の側面は、米国特許出願公開第13/308,473号に記載されている。
IX. Methylation and CNA
As mentioned above, the methylation analysis approach described herein can be used in combination with other methods based on genetic alterations of tumor-derived DNA in plasma. Examples of such methods include analysis of cancer-associated chromosomal abnormalities (KCA Chan et al. 2013 Clin Chem; 59: 211-224; RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Aspects of Copy Number Abnormality (CNA) are described in US Patent Application Publication No. 13 / 308,473.

A. CNA
コピー数異常は、ゲノムの特定部分に整列するDNA断片を計数し、その計数を正規化し、その計数ををカットオフ値と比較することにより検出され得る。種々の実施形態において、正規化は、ゲノムの同一部分の別のハプロタイプに整列したDNA断片の計数によって(相対ハプロタイプ適用量(relative haplotype dosage:RHDO))またはゲノムの別の部分に整列したDNA断片の計数によって、行われ得る。
A. CNA
Copy number abnormalities can be detected by counting the DNA fragments that align with a particular portion of the genome, normalizing the count and comparing the count to a cutoff value. In various embodiments, normalization is performed by counting DNA fragments that are aligned with different haplotypes of the same portion of the genome (relative haplotype dosage (RHDO)) or with DNA fragments that are aligned with other portions of the genome. Can be done by counting.

RHDO法はヘテロ接合性遺伝子座の使用に依存している。本セクションに記載される実施形態は、2つの領域および同一領域の2つでないハプロタイプを比較することにより、ホモ接合性の遺伝子座に対しても用いることができ、故に、非ハプロタイプ特異的である。相対染色体領域適用量法(relative chromosomal region dosage method)において、1つの染色体領域由来の断片の数(例えば、その領域に整列した配列リードを計数することにより決定される)は、期待値(参照染色体領域から、または健常であることが知られている別の試料の同一領域から得られ得る)と比較される。このように、染色体領域の断片は、配列決定されたタグがどのハプロタイプ由来であるかにかかわらず、計数される。従って、非ヘテロ接合性遺伝子座を含有する配列リードも用いることができる。比較を行うために、ある実施形態では、比較の前にタグ数が正規化され得る。各領域は少なくとも2つの遺伝子座(互いに分離される)によって定義され、これらの遺伝子座における断片は、その領域に関する集合的値を得るために用いられ得る。   The RHDO method relies on the use of heterozygous loci. The embodiments described in this section can also be used for homozygous loci by comparing two regions and not two haplotypes of the same region, and thus are non-haplotype specific. . In the relative chromosomal region dosage method, the number of fragments from one chromosomal region (eg, determined by counting sequence reads aligned to that region) is the expected value (reference chromosome). Region, or from the same region of another sample known to be healthy). Thus, fragments of chromosomal regions are counted regardless of which haplotype the sequenced tag came from. Therefore, sequence reads containing non-heterozygous loci can also be used. To make the comparison, in some embodiments, the tag count may be normalized before the comparison. Each region is defined by at least two loci (separated from each other) and the fragments at these loci can be used to obtain a collective value for that region.

特定領域の配列決定されたリード(タグ)の正規化数は、その領域に整列している配列決定されたリードの数を、ゲノム全体に整列可能な配列決定されたリードの総数で除算することによって、算出され得る。この正規化されたタグ数は、ある試料から得られた結果を、別の試料の結果と比較することを可能にする。例えば、正規化数は、上記のように、特定領域由来であることが期待される配列決定されたリードの比(例えば、割合または分率)であり得る。他の実施形態では、正規化のための他の方法が可能である。例えば、1つの領域の計数の数を、参照領域(上記例において、該参照領域は単なるゲノム全体である)の計数の数で除算することにより、正規化することができる。この正規化されたタグ数は、次に、がんを示さない一つまたは複数の参照試料から決定され得る閾値と比較され得る。   The normalized number of sequenced reads (tags) in a particular region is the number of sequenced reads aligned in that region divided by the total number of sequenced reads that can be aligned throughout the genome. Can be calculated by This normalized tag number allows the results obtained from one sample to be compared with the results of another sample. For example, the normalization number can be the ratio (eg, percentage or fraction) of sequenced reads expected to be from a particular region, as described above. In other embodiments, other methods for normalization are possible. For example, one can normalize by dividing the number of counts in one region by the number of counts in the reference region (in the above example, the reference region is simply the entire genome). This normalized tag number can then be compared to a threshold that can be determined from one or more reference samples that do not show cancer.

検査症例の正規化されたタグ数は、次に、一つまたは複数の参照対象(例えばがんを有さない一つまたは複数の参照対象)の正規化されたタグ数と比較される。一実施形態では、前記比較は、特定の染色体領域における前記症例のZ値を算出することにより、行われる。Z値は、下記式を用いて算出され得:Z値=(症例の正規化されたタグ数−平均値)/SD、式中、「平均値」は、参照試料の特定の染色体領域に整列している正規化されたタグ数の平均値であり;SDは、参照試料の特定の領域に整列している正規化されたタグ数の数の標準偏差である。従って、Z値は、検査症例の染色体領域の正規化されたタグ数が、一つまたは複数の参照対象の同一染色体領域の正規化された平均タグ数から逸脱している、標準偏差の数である。   The normalized tag number of the test case is then compared to the normalized tag number of one or more reference subjects (eg, one or more reference subjects without cancer). In one embodiment, the comparison is performed by calculating the Z value of the case in a particular chromosomal region. The Z-value can be calculated using the following formula: Z-value = (normalized tag number of cases-mean) / SD, where "mean" aligns with a particular chromosomal region of the reference sample. Is the average of the normalized tag numbers; SD is the standard deviation of the number of normalized tag numbers aligned in a particular region of the reference sample. Therefore, the Z value is the number of standard deviations in which the normalized number of tags of the chromosomal region of the examined case deviates from the normalized average number of tags of the same chromosomal region of one or more reference objects. is there.

検査生物ががんを有する状況において、腫瘍組織において増幅された染色体領域は、血漿DNA中で大きな比率を占める。これは、正の値のZ値をもたらす。一方、腫瘍組織において欠失している染色体領域は、血漿DNA中で小さな比率を占める。これは、負の値のZ値をもたらす。Z値の大きさはいくつかの因子によって決定される。   In situations where the test organism has cancer, the chromosomal regions amplified in tumor tissue make up a large proportion of plasma DNA. This results in a positive Z value. On the other hand, chromosomal regions deleted in tumor tissue occupy a small proportion in plasma DNA. This results in a negative Z value. The magnitude of the Z value is determined by several factors.

1つの因子は、生物試料(例えば血漿)中の腫瘍由来DNAの濃度分率である。試料(例えば血漿)中の腫瘍由来DNAの濃度分率が高いほど、検査症例および参照症例の正規化されたタグ数の間の差異はより大きくなる。従って、より大きな規模のZ値がもたらされる。   One factor is the concentration fraction of tumor-derived DNA in a biological sample (eg plasma). The higher the concentration fraction of tumor-derived DNA in the sample (eg plasma), the greater the difference between the normalized tag numbers of the test and reference cases. Therefore, a larger magnitude Z value is provided.

別の因子は、一つまたは複数の参照症例における正規化されたタグ数の変動である。検査症例の生物試料(例えば血漿)における染色体領域の過剰提示が同じ程度である場合、参照群における正規化されたタグ数のより小さな変動(すなわち、より小さな標準偏差)は、より大きなZ値をもたらす。同様に、検査症例の生物試料(例えば血漿)における染色体領域の過小提示が同じ程度である場合、参照群における正規化されたタグ数のより小さな標準偏差は、さらに負のZ値をもたらす。   Another factor is the variation in normalized tag number in one or more reference cases. If the over-presentation of chromosomal regions in the biological samples of the tested cases (eg plasma) is of similar extent, smaller variations in the normalized tag number in the reference group (ie smaller standard deviations) lead to larger Z values. Bring Similarly, a smaller standard deviation of the normalized tag number in the reference group leads to a more negative Z-value if the underpresentation of chromosomal regions in the biological samples (eg plasma) of the tested cases is of similar extent.

別の因子は、腫瘍組織における染色体異常の規模である。染色体異常の規模は、特定の染色体領域のコピー数変化(増加または減少)を指す。腫瘍組織におけるコピー数変化がより高いほど、血漿DNA中の特定の染色体領域の過剰または過小提示の程度はより高くなる。例えば、染色体の両方のコピーの損失は、染色体の2つのコピーのうちの一方の損失よりも、血漿DNA中の染色体領域のより大きな過小提示をもたらし、故に、さらに負のZ値をもたらす。典型的に、がんには複数の染色体異常が存在する。それぞれのがんにおける染色体異常は、その性質(すなわち、増幅または欠失)、その程度(単一または複数のコピーの増加または減少)およびその範囲(染色体の長さに関する異常のサイズ)によってさらに異なり得る。   Another factor is the magnitude of chromosomal aberrations in tumor tissue. The magnitude of a chromosomal abnormality refers to a copy number change (increase or decrease) of a specific chromosomal region. The higher the copy number change in tumor tissue, the higher the degree of over- or under-presentation of a particular chromosomal region in plasma DNA. For example, loss of both copies of a chromosome results in greater under-representation of chromosomal regions in plasma DNA than loss of one of the two copies of the chromosome, and thus an even more negative Z value. Typically, cancer has multiple chromosomal abnormalities. Chromosome abnormalities in each cancer further depend on their nature (ie, amplification or deletion), their extent (increasing or decreasing single or multiple copies) and their extent (size of the abnormality with respect to chromosome length). obtain.

正規化されたタグ数を測定する精度は、解析される分子の数によって影響を受ける。1つのコピー変化(増加または減少)を有する染色体異常を検出するために、濃度分率がそれぞれおよそ12.5%、6.3%および3.2%である場合、15,000、60,000および240,000個の分子が解析される必要があると予想される。異なる染色体領域におけるがんの検出におけるタグ計数のさらなる詳細は、Lo et al.による「Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing」という題名の米国特許出願公開第2009/0029377号に記載されており、該米国特許出願公開の全ての内容はあらゆる目的で参照によって本明細書組み込まれる。   The accuracy of measuring the normalized number of tags is affected by the number of molecules analyzed. To detect chromosomal abnormalities with one copy change (increase or decrease), 15,000, 60,000 when the concentration fractions are approximately 12.5%, 6.3% and 3.2%, respectively. And 240,000 molecules are expected to need to be analyzed. Further details of tag counting in the detection of cancer in different chromosomal regions is described in Lo et al., US Patent Application Publication No. 2009/0029377, entitled "Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing", The entire contents of the US patent application publication are hereby incorporated by reference for all purposes.

実施形態では、タグ計数法の代わりに、サイズ解析も用いられ得る。サイズ解析はまた、正規化されたタグ数の代わりに用いられ得る。サイズ解析では、本明細書および米国特許出願公開第12/940,992号に記載の種々のパラメーターが用いられ得る。例えば、上記からのQ値またはF値が用いられ得る。そのようなサイズ値は、これらの値がリードの数に対応していないため、他の領域からの計数による正規化を必要としない。上記の、および米国特許出願公開第13/308,473号により詳細に記載されるRHDO法等の、ハプロタイプ特異的な方法の手法は、非特異的な方法にも用いられ得る。例えば、領域の深度および細分化(refinement)を含む手法が用いられ得る。いくつかの実施形態において、特定領域のGC傾向が2つの領域を比較する際に考慮され得る。RHDO法は同一領域を用いるため、そのような補正は不要である。   In embodiments, size analysis may also be used instead of the tag counting method. Size analysis can also be used instead of normalized tag number. Various parameters described herein and in US Patent Application Publication No. 12 / 940,992 may be used in size analysis. For example, the Q or F value from above can be used. Such size values do not require normalization by counting from other areas, as these values do not correspond to the number of reads. Haplotype-specific method approaches, such as the RHDO method described above and described in more detail in US Patent Application Publication No. 13 / 308,473, can also be used for non-specific methods. For example, techniques involving region depth and refinement may be used. In some embodiments, the GC trend of a particular region may be considered when comparing the two regions. Since the RHDO method uses the same area, such correction is unnecessary.

ある種のがんは典型的に特定の染色体領域内に異常を有して存在し得るが、そのようながんは、常に排他的に、そのような領域内に異常を有して存在しているわけではない。例えば、追加の染色体領域が異常を示す場合があり、そのような追加の領域の位置は未知である場合がある。さらに、がんの初期段階を特定するために患者を検診する際、ゲノム全体わたって存在する異常を示し得る、広範ながんの特定が望まれる場合がある。これらの状況に対応するため、実施形態では、複数の領域が系統的に解析されて、どの領域が異常を示しているかが決定され得る。異常の数およびそれらの位置(例えば、それらが近接しているかどうか)が、例えば、異常を確認し、がんのステージを決定し、がんの診断を下し(例えば、前記数が閾値よりも大きい場合)、異常を示している種々の領域の数および位置に基づいて予後を下すために、用いられ得る。   Although some cancers may typically be present with abnormalities in particular chromosomal regions, such cancers are always exclusively present with abnormalities in such regions. It doesn't mean that. For example, additional chromosomal regions may exhibit abnormalities and the location of such additional regions may be unknown. Furthermore, when screening patients to identify early stages of cancer, it may be desirable to identify a wide range of cancers that may exhibit abnormalities that exist throughout the genome. To address these situations, embodiments may systematically analyze multiple regions to determine which regions exhibit anomalies. The number of abnormalities and their location (eg, whether they are in close proximity), for example, identify the abnormalities, determine the stage of the cancer, and make a cancer diagnosis (eg, the number is above a threshold). If too large), it can be used to make a prognosis based on the number and location of various regions exhibiting abnormalities.

従って、実施形態では、異常を示す領域の数に基づいて、生物ががんを有しているかどうかが特定され得る。従って、異常を示す領域の数を特定するために、複数の領域(例えば、3,000)が検査され得る。前記領域は、ゲノム全体にわたっていてもよいし、あるいはゲノムの部分のみ(例えば、非反復領域)にわたっていてもよい。   Therefore, in an embodiment, whether or not an organism has cancer can be identified based on the number of regions that show an abnormality. Therefore, multiple regions (eg, 3,000) may be examined to identify the number of regions that exhibit anomalies. The region may span the entire genome or may span only a portion of the genome (eg, a non-repetitive region).

図36は、本発明の実施形態に従って複数の染色体領域を用いて生物の生物試料を解析する、方法3600のフローチャートである。生物試料には核酸分子(断片とも称される)が含まれる。   FIG. 36 is a flow chart of a method 3600 for analyzing a biological sample of an organism using multiple chromosomal regions according to an embodiment of the present invention. Biological samples include nucleic acid molecules (also called fragments).

ブロック3610において、生物のゲノムの複数の領域(例えば、非オーバーラップ領域)が特定される。各染色体領域には複数の遺伝子座が含まれる。領域は、1Mbのサイズ、またはいくつかの他の同等のサイズであり得る。領域が1Mbサイズである場合、ゲノム全体には、それぞれ所定のサイズおよび位置を有する約3,000個の領域が含まれ得る。そのような所定の領域は、特定の染色体の長さまたは用いられる領域の特定の数、および本明細書に記載のあらゆる他の判定基準に適応するために、変動し得る。領域が異なる長さを有する場合、そのような長さは、例えば、本明細書に記載のように、結果を正規化するために用いられ得る。領域は、特定の生物のある特定の判定基準に基づいて、および/または検査されているがんの知見に基づいて、具体的に選択され得る。領域は任意に選択もされ得る。   At block 3610, multiple regions (eg, non-overlapping regions) of the organism's genome are identified. Each chromosomal region contains multiple loci. The region may be 1 Mb in size, or some other comparable size. If the region is 1 Mb in size, the entire genome may include approximately 3,000 regions each having a given size and position. Such a given region may vary to accommodate a particular chromosome length or a particular number of regions used, and any other criteria described herein. If the regions have different lengths, such lengths can be used to normalize the results, eg, as described herein. Regions may be specifically selected based on certain criteria for a particular organism and / or based on the findings of the cancer being tested. Areas can also be arbitrarily selected.

ブロック3620において、生物の参照ゲノム内の核酸分子の位置が、複数の核酸分子のそれぞれについて特定される。前記位置は、本明細書に記載の方法のいずれかで、例えば、配列決定されたタグを得るために断片を配列決定し、配列決定されたタグを参照ゲノムに整列させることにより、決定され得る。分子の特定のハプロタイプも、ハプロタイプ特異的な方法のために決定され得る。   At block 3620, the location of the nucleic acid molecule within the organism's reference genome is identified for each of the plurality of nucleic acid molecules. The location can be determined by any of the methods described herein, for example, by sequencing the fragment to obtain a sequenced tag and aligning the sequenced tag with a reference genome. . The particular haplotype of the molecule can also be determined for haplotype specific methods.

染色体領域のそれぞれについて、ブロック3630〜3650が行われる。ブロック3630において、それぞれの核酸分子群が、特定された位置に基づいて、該染色体領域に由来することが特定される。各群には、前記染色体領域の複数個の遺伝子座のそれぞれに位置する、少なくとも1つの核酸分子が含まれ得る。一実施形態では、前記群は、前記染色体領域の特定のハプロタイプに(例えば、上記のRHDOに)整列する断片であり得る。別の実施形態では、前記群は、前記染色体領域に整列するあらゆる断片であり得る。   Blocks 3630-3650 are performed for each of the chromosomal regions. At block 3630, each nucleic acid molecule group is identified as originating from the chromosomal region based on the identified location. Each group may include at least one nucleic acid molecule located at each of a plurality of loci in the chromosomal region. In one embodiment, the group may be fragments that align with a particular haplotype of the chromosomal region (eg, in RHDO as described above). In another embodiment, the group can be any fragment that aligns with the chromosomal region.

ブロック3640において、コンピューターシステムによって、各核酸分子群の各値が算出される。各値は、各群の核酸分子の特定を定義する。各値は本明細書に記載される値のいずれかであり得る。例えば、前記値は、群における断片の数または群における断片のサイズ分布の統計値であり得る。各値はまた、正規化数、例えば、試料におけるタグ数の総数または参照領域におけるタグ数の数で除算された領域のタグ数であり得る。各値は、別の値(例えば、RHDOにおける)からの差異または比であり得、それによって領域における差異の特性が得られ得る。   At block 3640, the computer system calculates each value for each nucleic acid molecule population. Each value defines the identity of each group of nucleic acid molecules. Each value can be any of the values described herein. For example, the value can be a statistic of the number of fragments in a group or the size distribution of fragments in a group. Each value can also be a normalized number, eg, the total number of tags in the sample or the number of tags in the region divided by the number of tags in the reference region. Each value may be a difference or ratio from another value (eg, in RHDO), which may give rise to a characteristic of the difference in area.

ブロック3650において、各値が基準値と比較されて、第一の染色体領域が欠失または増幅を示すかどうかの分類が決定される。この基準値は、本明細書に記載のいかなる閾値または基準値であってもよい。例えば、基準値は正常試料において決定された閾値であり得る。RHDOにおいて、各値は2つのハプロタイプにおけるタグ数の差異または比であり得、基準値は統計的に有意な逸脱が存在することを決定するための閾値であり得る。別の例として、基準値は別のハプロタイプまたは領域のタグ数またはサイズ値であり得、比較には、差異または比(またはそのような比の関数)を得た後、その差異または比が閾値よりも大きいかどうかを決定することが含まれ得る。   At block 3650, each value is compared to a reference value to determine a classification as to whether the first chromosomal region exhibits a deletion or amplification. This reference value may be any threshold value or reference value described herein. For example, the reference value can be a threshold value determined in a normal sample. In RHDO, each value can be the difference or ratio of tag numbers in the two haplotypes, and the reference value can be a threshold for determining that a statistically significant deviation exists. As another example, the reference value can be the tag number or size value of another haplotype or region, and the comparison can include obtaining a difference or ratio (or a function of such ratio), and then the difference or ratio being a threshold value. May be included.

基準値は他の領域の結果に基づいて変動し得る。例えば、隣接する領域も逸脱を示す場合(ある閾値(例えば、3のZ値)と比較して小さいが)、より小さなが用いられ得る。例えば、3つの連続した領域全てが第一の閾値を上回る場合、がんである可能性が高い。従って、この第一の閾値は、非連続領域からがんを特定するのに必要な別の閾値よりも低くてもよい。小さくとも逸脱を有する3つの領域(または3つより多い)を有することは、感度および特異度が保存され得る偶然の影響の可能性が、充分に低くなり得る。   The reference value may vary based on the results of other areas. For example, if adjacent regions also exhibit deviations (though small compared to some threshold (eg, a Z value of 3)), a smaller one may be used. For example, if all three consecutive regions are above the first threshold, then it is likely a cancer. Therefore, this first threshold may be lower than another threshold needed to identify cancer from non-contiguous regions. Having three regions (or more than three) with at least deviations can be sufficiently low in chance of chance effects where sensitivity and specificity can be preserved.

ブロック3660において、欠失または増幅を示すと分類されるゲノム領域の量が決定される。計数される染色体領域には制限があり得る。例えば、少なくとも1つの他の領域と隣接している領域のみが計数され得る(または、隣接領域はある特定のサイズ(例えば、4以上の領域)であることが必要とされ得る)。領域が等しくない実施形態において、前記数は、それぞれの長さも説明し得る(例えば、前記数は異常な領域の全長であり得る)。   At block 3660, the amount of genomic region classified as exhibiting a deletion or amplification is determined. There may be restrictions on the chromosomal regions that are counted. For example, only areas that are adjacent to at least one other area may be counted (or the adjacent areas may be required to be of a certain size (eg, 4 or more areas)). In embodiments where the regions are not equal, the numbers may also account for their respective lengths (eg, the numbers may be the total length of the abnormal region).

ブロック3670において、前記量が量閾値と比較されて、試料の分類が決定される。例として、分類は、生物ががんを有しているかどうか、がんのステージ、およびがんの予後であり得る。一実施形態では、全ての異常な領域が計数され、それらの領域がどこに出現するかにかかわらず、単一の閾値が用いられる。別の実施形態では、閾値は、計数された領域の位置およびサイズに基づいて変動し得る。例えば、特定の染色体または染色体腕上の領域の量は、その特定の染色体(または腕)の閾値と比較され得る。複数の閾値を用いてもよい。例えば、特定の染色体(または腕)上の異常な領域の量は、第一の閾値よりも大きくなくてはならず、ゲノム内の異常な領域の総量は第二の閾値よりも大きくなくてはならない。閾値は、欠失または増幅を示すことが決定された領域の割合であり得る。   At block 3670, the quantity is compared to a quantity threshold to determine a sample classification. As an example, the classification can be whether the organism has cancer, the stage of the cancer, and the prognosis of the cancer. In one embodiment, all abnormal areas are counted and a single threshold is used regardless of where those areas appear. In another embodiment, the threshold may vary based on the position and size of the counted area. For example, the amount of a region on a particular chromosome or arm can be compared to a threshold for that particular chromosome (or arm). Multiple thresholds may be used. For example, the amount of abnormal regions on a particular chromosome (or arm) must be greater than the first threshold, and the total amount of abnormal regions in the genome must be greater than the second threshold. I won't. The threshold may be the percentage of the area determined to show deletion or amplification.

領域の量に対するこの閾値は、計数された領域において不均衡がどれだけ強いかにも依存し得る。例えば、がんの分類を決定するための閾値として用いられる領域の量は、各領域における異常を検出するために用いられる特異度および感度(異常な閾値)に依存し得る。例えば、異常な閾値が低い場合(例えば2のZ値)、量閾値は、高く(例えば、150)あることが選択され得る。しかし、異常な閾値が高い場合(例えば、3のZ値)、量閾値は低くなり得る(例えば、50)。また、異常を示す領域の量は加重値であり得、例えば、高度な不均衡を示す1つの領域は、小さな不均衡を示すだけの領域よりも高く加重され得る(すなわち、異常について単なる陽性および陰性よりも多くの分類が存在する)。一例として、Z値の和が用いられ得、それにより加重値が用いられる。   This threshold for the amount of area may also depend on how strong the imbalance is in the counted area. For example, the amount of region used as a threshold to determine the classification of cancer may depend on the specificity and sensitivity (abnormal threshold) used to detect anomalies in each region. For example, if the abnormal threshold is low (eg, a Z value of 2), the quantity threshold may be selected to be high (eg, 150). However, if the abnormal threshold is high (eg a Z value of 3), the quantity threshold may be low (eg 50). Also, the amount of regions exhibiting anomalies may be weighted, for example, one region exhibiting a high degree of imbalance may be weighted higher than a region exhibiting only a small imbalance (ie, simply positive for anomalies and There are more classifications than negatives). As an example, the sum of the Z values can be used, and thus the weighted value is used.

従って、正規化されたタグ数(または群の特性における他の各値)の有意な過剰または過小提示を示す染色体領域の量(数および/またはサイズを含み得る)は、疾患の重症度を反映するために用いられ得る。異常な正規化されたタグ数を有する染色体領域の量は、2つの因子、すなわち、腫瘍組織内の染色体異常の数(またはサイズ)および生物試料(例えば血漿)中の腫瘍由来DNAの濃度分率によって決定され得る。より進行したがんは、より多くの(且つより大きな)染色体異常を示す傾向がある。従って、より多くのがん関連染色体異常が、試料(例えば血漿)中で検出可能であり得る。より進行したがんを有する患者において、より高い腫瘍量は、血漿中の腫瘍由来DNAのより高い濃度分率をもたらすだろう。結果として、腫瘍関連染色体異常は、血漿試料中でより容易に検出されるであろう。   Therefore, the amount of chromosomal regions (which may include number and / or size) that show significant over- or under-presentation of the normalized tag number (or each other value in the group's characteristics) reflects the severity of the disease. Can be used to The amount of chromosomal regions with aberrant normalized tag numbers is determined by two factors: the number (or size) of chromosomal abnormalities within the tumor tissue and the concentration fraction of tumor-derived DNA in the biological sample (eg plasma). Can be determined by More advanced cancers tend to show more (and larger) chromosomal abnormalities. Therefore, more cancer-related chromosomal abnormalities may be detectable in a sample (eg plasma). In patients with more advanced cancer, higher tumor burden will result in a higher concentration fraction of tumor-derived DNA in plasma. As a result, tumor-associated chromosomal abnormalities will be more easily detected in plasma samples.

特異度を犠牲にせずに感度を向上させるための1つの可能なアプローチは、隣接する染色体セグメントの結果を考慮することである。一実施形態では、Z値のカットオフは、2超および−2未満のままである。しかし、染色体領域は、2つの連続したセグメントが同じタイプの異常を示す(例えば、両方のセグメントが2超のZ値を有する)場合にのみ、潜在的に異常であると分類される。他の実施形態では、隣接セグメントのZ値は、より高いカットオフ値を用いて、合計され得る。例えば、3つの連続したセグメントのZ値が合計され得、5のカットオフ値が用いられ得る。この概念は、3つを超える連続したセグメントに拡張され得る。   One possible approach to improve sensitivity without sacrificing specificity is to consider the results of adjacent chromosomal segments. In one embodiment, the Z-value cutoff remains above 2 and below -2. However, a chromosomal region is classified as potentially abnormal only if two consecutive segments exhibit the same type of abnormality (eg, both segments have Z values greater than 2). In other embodiments, the Z-values of adjacent segments may be summed with higher cutoff values. For example, the Z values of three consecutive segments may be summed and a cutoff value of 5 may be used. This concept can be extended to more than three consecutive segments.

量および異常な閾値の組み合わせは、解析の目的、および生物のあらゆる予備知識(またはその欠如)にも依存し得る。例えば、健常集団をがんについて検診する場合、典型的には、領域の量(すなわち、領域の数に対する高い閾値)および領域が異常を有すると特定された場合の異常な閾値のおそらく両方において、高い特異度が用いられる。しかし、より高いリスクを有する患者(例えば、腫瘍(lump)または家族歴を訴える患者、喫煙者、慢性的なヒトパピローマウイルス(HPV)保因者、肝炎ウイルス保因者、または他のウイルス保因者)では、より高い感度(より少ない偽陰性)を持たせるために、閾値はより低くなり得る。   The combination of quantity and abnormal threshold may also depend on the purpose of the analysis and any prior knowledge (or lack thereof) of the organism. For example, if a healthy population is screened for cancer, typically both at the amount of area (ie, a high threshold for the number of areas) and possibly at an abnormal threshold when the area is identified as having abnormalities, High specificity is used. However, patients at higher risk (eg, patients with lump or family history complaints, smokers, chronic human papillomavirus (HPV) carriers, hepatitis virus carriers, or other viral carriers) ), The threshold can be lower in order to have higher sensitivity (less false negatives).

一実施形態では、染色体異常を検出するために1Mb分解能および6.3%の腫瘍由来DNAというより低い検出限界が用いられる場合、各1Mbセグメントにおける分子の数は、60,000であることが必要となる。これは、ゲノム全体においておよそ1.8億(60,000リード/Mb×3,000Mb)の整列可能なリードに置き換えられる。   In one embodiment, if a lower detection limit of 1 Mb resolution and 6.3% tumor-derived DNA is used to detect chromosomal abnormalities, then the number of molecules in each 1 Mb segment must be 60,000. Becomes This replaces approximately 180 million (60,000 reads / Mb x 3,000 Mb) alignable reads throughout the genome.

より小さなセグメントサイズは、より小さな染色体異常を検出するためのより高い分解能を与える。しかし、これは、全体で解析される分子の数の要求を増加させる。より大きなセグメントサイズは、分解能を犠牲にして、解析に必要な分子の数を減少させる。従って、より大きな異常のみが検出され得る。ある実施では、より大きな領域が用いられ得、異常を示すセグメントが細分割され得、これらの小領域が解析されてより良好な分解能が得られ得る(例えば、上記の通り)。検出される欠失または増幅のサイズ(または検出するための最低濃度)についの推定を有する場合、解析される分子の数は減少し得る。   The smaller segment size gives higher resolution for detecting smaller chromosomal abnormalities. However, this increases the requirement for the number of molecules analyzed in total. Larger segment sizes reduce the number of molecules needed for analysis at the expense of resolution. Therefore, only larger anomalies can be detected. In some implementations, larger regions may be used, segments that show anomalies may be subdivided, and these small regions may be analyzed for better resolution (eg, as described above). Having a conjecture on the size of the deletion or amplification detected (or the lowest concentration to detect), the number of molecules analyzed can be reduced.

B. 亜硫酸水素塩処理血漿DNAの配列決定に基づくCNA
ゲノムワイドな低メチル化およびCNAは、腫瘍組織において頻繁に観察され得る。ここで、CNAおよびがん関連メチル化変化の情報が血漿DNAの亜硫酸水素塩配列決定から同時に得られ得ることを示す。それら2つのタイプの解析は同じデータセットに対して実行することができるため、CNA解析のための追加のコストは実質的に存在しない。他の実施形態では、メチル化情報および遺伝情報を得るために異なる手順が用いられ得る。他の実施形態では、CNA解析と組み合わせて、がん関連高度メチル化に対する同様の解析が行われ得る。
B. CNA based on sequencing of bisulfite treated plasma DNA
Genome-wide hypomethylation and CNAs can frequently be observed in tumor tissue. Here we show that information on CNA and cancer-related methylation changes can be obtained simultaneously from bisulfite sequencing of plasma DNA. Since the two types of analysis can be performed on the same dataset, there is virtually no additional cost for CNA analysis. In other embodiments, different procedures may be used to obtain methylation and genetic information. In other embodiments, a similar analysis for cancer associated hypermethylation may be performed in combination with CNA analysis.

図37Aは、患者TBR36の腫瘍組織、非亜硫酸水素塩(BS)処理血漿DNAおよび亜硫酸水素塩処理血漿DNAのCNA解析(内側から外側に)を示している。図37Aは、患者TBR36の腫瘍組織、非亜硫酸水素塩(BS)処理血漿DNAおよび亜硫酸水素塩処理血漿DNAのCNA解析(内側から外側に)を示している。最外側の環は染色体模式図を示している。各ドットは1Mb領域の結果を表している。緑色、赤色および灰色のドットは、それぞれ、コピー数増加を有する領域、コピー数減少を有する領域およびコピー数変化が無い領域を表している。血漿解析において、Z値が示される。2本の同心性の線の間には5の差異が存在する。腫瘍組織解析において、コピー数が示される。2本の同心性の線の間には1つのコピー差異が存在する。図38Aは、患者TBR34の腫瘍組織、非亜硫酸水素塩(BS)処理血漿DNAおよび亜硫酸水素塩処理血漿DNA(内側から外側に)のCNA解析を示している。亜硫酸水素塩処理血漿試料および非亜硫酸水素塩処理血漿試料において検出されたCNAのパターンは一致した。   FIG. 37A shows a CNA analysis (inside to outside) of tumor tissue, non-bisulfite (BS) -treated and bisulfite-treated plasma DNA of patient TBR36. FIG. 37A shows a CNA analysis (inside to outside) of tumor tissue, non-bisulfite (BS) -treated and bisulfite-treated plasma DNA of patient TBR36. The outermost ring shows a schematic diagram of the chromosome. Each dot represents the result of the 1 Mb area. Green, red and gray dots represent areas with increased copy number, areas with decreased copy number and areas with no changed copy number, respectively. Z values are shown in plasma analysis. There are 5 differences between the two concentric lines. Tumor tissue analysis indicates copy number. There is one copy difference between the two concentric lines. FIG. 38A shows a CNA analysis of patient TBR34 tumor tissue, non-bisulfite (BS) treated plasma DNA and bisulfite treated plasma DNA (from inside to outside). The patterns of CNA detected in the bisulfite-treated and non-bisulfite-treated plasma samples were in agreement.

腫瘍組織、非亜硫酸水素塩処理血漿および亜硫酸水素塩処理血漿において検出されたCNAのパターンは一致した。亜硫酸水素塩処理血漿および非亜硫酸水素塩処理血漿の結果の間の一致をさらに評価するために、散布図が作成される。図37Bは、患者TBR36の1Mbビンの亜硫酸水素塩処理血漿および非亜硫酸水素塩処理血漿を用いるCNAの検出におけるZ値間の関連性を示す、散布図である。それら2つの解析のZ値の間に正相関が観察された(r=0.89、p<0.001、ピアソン相関)。図38Bは、患者TBR34の1Mbビンの亜硫酸水素塩処理血漿および非亜硫酸水素塩処理血漿を用いるCNAの検出におけるZ値間の関連性を示す、散布図である。それら2つの解析のZ値の間に正相関が観察された(r=0.81、p<0.001、ピアソン相関)。   The patterns of CNA detected in tumor tissue, non-bisulfite treated plasma and bisulfite treated plasma were consistent. Scatter plots are generated to further evaluate the agreement between the results for the bisulfite-treated and non-bisulfite-treated plasmas. FIG. 37B is a scatter plot showing the relationship between Z values in the detection of CNA using 1 Mb bin bisulfite-treated plasma and non-bisulfite-treated plasma of patient TBR36. A positive correlation was observed between the Z values of those two analyzes (r = 0.89, p <0.001, Pearson correlation). FIG. 38B is a scatter plot showing the association between Z values in the detection of CNA using 1 Mb bin bisulfite-treated and non-bisulfite-treated plasma of patient TBR34. A positive correlation was observed between the Z values of those two analyzes (r = 0.81, p <0.001, Pearson correlation).

C. がん関連CNAおよびメチル化変化の相乗的解析
上記のように、CNAの解析は各1Mb領域内の配列リードの数の計数を含み得るが、一方、メチル化密度の解析は、メチル化されているCpGジヌクレオチドにおけるシトシン残基の割合の検出が含まれ得る。これら2つの解析の組み合わせは、がんの検出において相乗的な情報を与え得る。例えば、メチル化分類およびCNA分類が用いられることで、がんのレベルの第三の分類が決定され得る。
C. Synergistic Analysis of Cancer-Associated CNAs and Methylation Changes As noted above, analysis of CNAs may involve counting the number of sequence reads within each 1 Mb region, while analysis of methylation density indicates that methylation is Detection of the percentage of cytosine residues in the existing CpG dinucleotide can be included. The combination of these two analyzes can provide synergistic information in cancer detection. For example, the methylation classification and CNA classification can be used to determine a third classification of cancer levels.

一実施形態では、がん関連CNAまたはメチル化変化のいずれかの存在が用いられて、がんの潜在的な存在が示され得る。そのような実施形態において、がんを検出する感度は、CNAまたはメチル化変化が検査対象の血漿に存在する場合に増加し得る。別の実施形態では、両方の変化の存在が用いられて、がんの存在が示され得る。そのような実施形態において、これら2つのタイプの変化のいずれかが幾人かの非がん対象において潜在的に検出され得るため、検査の特異度は向上され得る。従って、第三の分類は、第一の分類および第二の分類の両方ががんを示す場合にのみ、がん陽性であり得る。   In one embodiment, the presence of either cancer-associated CNAs or methylation changes may be used to indicate the potential presence of cancer. In such embodiments, the sensitivity of detecting cancer may be increased when CNA or methylation changes are present in the plasma under test. In another embodiment, the presence of both changes can be used to indicate the presence of cancer. In such an embodiment, the specificity of the test can be increased because either of these two types of changes can potentially be detected in some non-cancerous subjects. Thus, the third classification can be cancer positive only if both the first and second classifications indicate cancer.

26人のHCC患者および22人の健常対象が募集した。血液試料を各対象から採取し、血漿DNAを亜硫酸水素塩処理後に配列決定した。HCC患者において、血液試料は診断時に採取された。有意な量のCNAの存在は、例えば、−3未満または3超のZ値を示す5%超のビンを有するものとして定義した。有意な量のがん関連低メチル化の存在は、−3未満のZ値を示す3%超のビンを有するものとして定義した。例として、領域(ビン)の量は、ビンの生の数、割合、およびビンの長さとして表され得る。   Twenty-six HCC patients and 22 healthy subjects were recruited. Blood samples were taken from each subject and plasma DNA was sequenced after bisulfite treatment. In HCC patients, blood samples were taken at diagnosis. The presence of a significant amount of CNA was defined as having bins greater than 5% with, for example, Z values less than -3 or greater than 3. The presence of a significant amount of cancer-associated hypomethylation was defined as having more than 3% bins with Z values less than -3. As an example, the amount of area (bin) may be expressed as the raw number of bins, the percentage, and the length of the bin.

表3は、亜硫酸水素塩処理血漿DNAに対する大規模並列配列決定を用いた、26人のHCC患者の血漿における有意な量のCNAおよびメチル化変化の検出を示している。   Table 3 shows the detection of significant amounts of CNA and methylation changes in plasma of 26 HCC patients using massively parallel sequencing on bisulfite treated plasma DNA.

がん関連メチル化変化およびCNAの検出率は、それぞれ、69%および50%であった。がんの潜在的な存在を示すためにいずれかの判定基準の存在が用いられた場合、検出率(すなわち、診断鋭敏度)は73%に向上した。   The detection rates of cancer-related methylation changes and CNAs were 69% and 50%, respectively. When either criterion's presence was used to indicate the potential presence of cancer, the detection rate (ie, diagnostic sensitivity) improved to 73%.

CNA(図39A)またはメチル化変化(図39B)の存在を示す2人の患者の結果が示される。図39Aは、HCC患者TBR240の亜硫酸水素塩処理血漿のCNA(内側の環)およびメチル化解析(外側の環)を示す、Circosプロットである。CNA解析において、緑色、赤色および灰色のドットは、それぞれ、染色体の増加を有する、染色体の減少を有する、およびコピー数に変化が無い領域を表す。メチル化解析において、緑意図、赤色および灰色のドットは、それぞれ、高度メチル化、低メチル化および正常なメチル化を有する領域を表す。この患者において、がん関連CNAが血漿において検出されたが、メチル化解析は有意な量のがん関連低メチル化を示さなかった。図39Bは、HCC患者TBR164の亜硫酸水素塩処理血漿の、CNA(内側の環)およびメチル化解析(外側の環)を示す、Circosプロットである。この患者において、がん関連低メチル化が血漿において検出された。しかし、有意な量のCNAを観察することができなかった。CNAおよびメチル化変化の両方の存在を示す2人の患者の結果は図48A(TBR36)および図49A(TBR34)に示される。   Results from two patients showing the presence of CNA (Figure 39A) or methylation changes (Figure 39B) are shown. FIG. 39A is a Circos plot showing CNA (inner ring) and methylation analysis (outer ring) of bisulfite treated plasma of HCC patient TBR240. In CNA analysis, green, red and gray dots represent regions with increased chromosomes, decreased chromosomes and unchanged copy number, respectively. In the methylation analysis, green intent, red and gray dots represent regions with hypermethylation, hypomethylation and normal methylation, respectively. Cancer-associated CNAs were detected in plasma in this patient, but methylation analysis did not show significant amounts of cancer-associated hypomethylation. FIG. 39B is a Circos plot showing CNA (inner ring) and methylation analysis (outer ring) of bisulfite treated plasma of HCC patient TBR164. Cancer-related hypomethylation was detected in plasma in this patient. However, no significant amount of CNA could be observed. The results of two patients showing the presence of both CNA and methylation changes are shown in Figure 48A (TBR36) and Figure 49A (TBR34).

表4は、亜硫酸水素塩処理血漿DNAに対する大規模並列配列決定を用いた、22人の対照患者の血漿における有意な量のCNAおよびメチル化変化の検出を示している。ブートストラッピング(すなわち、一個抜き)法を各対照患者の評価に用いた。従って、特定の対象が評価された場合、その他の21人の対象は対照群の平均値およびSDの算出に用いられた。   Table 4 shows the detection of significant amounts of CNA and methylation changes in the plasma of 22 control patients using massively parallel sequencing on bisulfite treated plasma DNA. The bootstrapping (ie, stripping) method was used to evaluate each control patient. Therefore, when a particular subject was evaluated, the other 21 subjects were used to calculate the mean and SD of the control group.

有意な量のメチル化変化およびCNAの検出の特異度は、それぞれ、86%および91%であった。両方の判定基準の存在ががんの潜在的な存在を示すために必要であった場合に、特異度は95%まで向上した。   The specificity of detection of significant amounts of methylation changes and CNA was 86% and 91%, respectively. Specificity increased to 95% when the presence of both criteria was required to indicate the potential presence of cancer.

一実施形態では、CNAおよび/または低メチル化陽性の試料はがん陽性と見なされ、試料は、その両方が検出できない場合、陰性と見なされる。「または」の論法を用いることで、より高い感度が与えられる。別の実施形態では、CNAおよび低メチル化の両方について陽性である試料のみが、がん陽性と見なされ、それにより、より高い特異度が与えられる。さらに別の実施形態では、3階層の分類が用いられ得る。対象は、i.共に正常;ii.一方が異常;iii.共に異常に分類される。   In one embodiment, CNA and / or hypomethylation positive samples are considered cancer positive and samples are considered negative if both are undetectable. Higher sensitivity is provided by using the "or" reasoning. In another embodiment, only samples that are positive for both CNA and hypomethylation are considered cancer positive, thereby conferring higher specificity. In yet another embodiment, a three tier classification may be used. The subject is i. Both are normal; ii. One is abnormal; iii. Both are classified as abnormal.

これら3つの分類に異なる追跡戦略が用いられ得る。例えば、(iii)の対象は、最も集中的な追跡プロトコル(例えば、全身イメージングを含む)を施され得;(ii)の対象は、それほど集中的でない追跡プロトコル(例えば、数週間という比較的短い時間間隔の後の反復血漿DNA塩基配列決定法)を施され得;(i)の対象は、最も集中的でない追跡プロトコル(例えば、幾年後かの再検査)を施され得る。他の実施形態では、メチル化およびCNAの測定値が、分類をさらに細分化するための他の臨床的パラメーター(例えば、イメージングの結果または血清生化学)と組み合わせて用いられ得る。   Different tracking strategies can be used for these three classifications. For example, the subject in (iii) may be subjected to the most intensive tracking protocol (including, eg, whole body imaging); the subject in (ii) may be less intensive in the tracking protocol (eg, relatively short, such as weeks). Repetitive plasma DNA sequencing after time intervals) may be administered; subjects in (i) may be subjected to the least intensive follow-up protocol (eg, retest at some years later). In other embodiments, methylation and CNA measurements can be used in combination with other clinical parameters to further subdivide the classification, such as imaging results or serum biochemistry.

D. 治療を目的とした処置後の血漿DNA解析の予後値
血漿におけるがん関連CNAおよび/またはメチル化変化の存在は、がん患者の循環血液中の腫瘍由来DNAの存在を示す。これらのがん関連変化の減少または排除が、処置(例えば、外科手術)後に期待される。一方、処置後における血漿中のこれらの変化の持続は、身体からの全腫瘍細胞の不完全な除去を示し得、疾患再発の有用な予後判定因子となり得る。
D. Prognostic value of plasma DNA analysis after therapeutic treatments The presence of cancer-associated CNA and / or methylation changes in plasma indicates the presence of tumor-derived DNA in the circulating blood of cancer patients. Reduction or elimination of these cancer-related changes is expected after treatment (eg, surgery). On the other hand, the persistence of these changes in plasma after treatment may indicate incomplete removal of all tumor cells from the body and may be a useful prognostic factor for disease recurrence.

血液試料を、腫瘍の治療を目的とした外科的切除の1週間後に、2人のHCC患者、TBR34およびTBR36から採取した。CNAおよびメチル化解析を、亜硫酸水素塩処理した処置後血漿試料に対して行った。   Blood samples were taken from two HCC patients, TBR34 and TBR36, one week after surgical resection aimed at treating the tumor. CNA and methylation analyzes were performed on bisulfite treated post-treatment plasma samples.

図40Aは、HCC患者TBR36の腫瘍の外科的切除の前(内側の環)および後(外側の環)に採取された、亜硫酸水素塩処理血漿DNAに対するCNA解析を示している。各ドットは1Mb領域の結果を表している。緑色、赤色および灰色のドットは、それぞれ、コピー数増加を有する領域、コピー数減少を有する領域およびコピー数に変化が無い領域を表している。処置前に観察されたCNAの大部分は腫瘍切除後に消失した。−3未満または3超のZ値を示すビンの割合は、25%から6.6%に減少した。   FIG. 40A shows CNA analysis on bisulfite treated plasma DNA taken before (inner ring) and after (outer ring) surgical resection of tumor in HCC patient TBR36. Each dot represents the result of the 1 Mb area. The green, red and gray dots represent the areas with increased copy number, the areas with decreased copy number and the areas with unchanged copy number, respectively. Most of the CNA observed before treatment disappeared after tumor resection. The percentage of bins with Z-values below -3 or above 3 decreased from 25% to 6.6%.

図40Bは、HCC患者TBR36の腫瘍の外科的切除の前(内側の環)および後(外側の環)に採取された、亜硫酸水素塩処理血漿DNAに対するメチル化解析を示している。緑色、赤色および灰色のドットは、それぞれ、高度メチル化、低メチル化および正常なメチル化を有する領域を表している。有意な低メチル化を示すビンの割合に90%から7.9%への顕著な減少が見られ、低メチル化の程度も顕著な減少を示した。この患者は、腫瘍切除の22ヶ月後に完全な臨床的寛解を得た。   FIG. 40B shows methylation analysis on bisulfite treated plasma DNA taken before (inner ring) and after (outer ring) surgical resection of tumors in HCC patient TBR36. Green, red and gray dots represent regions with hypermethylation, hypomethylation and normal methylation, respectively. A significant decrease in the percentage of bins showing significant hypomethylation was seen from 90% to 7.9%, and the degree of hypomethylation also showed a significant decrease. This patient had a complete clinical remission 22 months after tumor resection.

図41Aは、HCC患者TBR34の腫瘍の外科的切除の前(内側の環)および後(外側の環)に採取された、亜硫酸水素塩処理血漿DNAに対するCNA解析を示している。腫瘍の外科的切除後にCNAを示すビンの数および影響を受けたビンにおけるCNAの規模は共に減少するが、残留CNAが手術後血漿試料中に観察され得る。赤色の環は、残留CNAが最も明白であった領域を強調している。−3未満または3超のZ値を示すビンの割合は57%から12%に減少した。   FIG. 41A shows a CNA analysis on bisulfite treated plasma DNA taken before (inner ring) and after (outer ring) surgical resection of tumor in HCC patient TBR34. Both the number of CNA-representing bins and the magnitude of CNA in the affected bins after surgical resection of the tumor are reduced, but residual CNA can be observed in post-operative plasma samples. The red ring highlights the area where residual CNA was most apparent. The percentage of bins with Z-values below -3 or above -3 was reduced from 57% to 12%.

図41Bは、HCC患者TBR34の腫瘍の外科的切除の前(内側の環)および後(外側の環)に採取された、亜硫酸水素塩処理血漿DNAに対するメチル化解析を示している。低メチル化の規模は腫瘍切除後に減少し、低メチル化ビンの平均Z値は−7.9から−4.0に減少した。しかし、−3未満のZ値を有するビンの割合は逆の変化を示し、41%から85%に増加した。この観察は、処置後における残留がん細胞の存在を潜在的に示している。臨床的に、腫瘍切除の3ヵ月後に残りの非切除肝臓において、腫瘍小結節の複数の病巣が検出された。肺転移が外科手術後4カ月目から観察された。患者は、手術から8ヵ月後に局所再発および転移性疾患によって死亡した。   FIG. 41B shows methylation analysis on bisulfite treated plasma DNA taken before (inner ring) and after (outer ring) surgical resection of tumor in HCC patient TBR34. The magnitude of hypomethylation decreased after tumor resection, and the mean Z value for hypomethylated bins decreased from -7.9 to -4.0. However, the percentage of bins with Z values less than -3 showed the opposite change, increasing from 41% to 85%. This observation potentially indicates the presence of residual cancer cells after treatment. Clinically, multiple lesions of tumor nodules were detected in the remaining non-resected liver 3 months after tumor resection. Lung metastases were observed 4 months after surgery. The patient died 8 months after surgery due to local recurrence and metastatic disease.

これら2人の患者(TBR34およびTBR36)における観察は、CNAおよび低メチル化の、残留したがん関連変化の存在を、治療を目的とした処置後のがん患者のモニタリングおよび予後判定に用いることができることを示唆している。またデータは、検出された血漿CNAの量における変化の程度が、治療有効性の予後判定およびモニタリングのための、血漿DNA低メチル化の範囲における変化の程度の評価と共に、相乗的に用いられ得ることを示した。   Observations in these two patients (TBR34 and TBR36) indicate that the presence of residual cancer-related changes in CNA and hypomethylation should be used for the monitoring and prognosis of post-treatment cancer patients for therapeutic purposes. Suggest that you can. The data also show that the degree of change in the amount of plasma CNA detected can be used synergistically with the assessment of the degree of change in the range of plasma DNA hypomethylation for prognostic and monitoring therapeutic efficacy. I showed that.

従って、いくつかの実施形態において、1つの生物試料が処置前に得られ、第二の生物試料が処置(例えば、外科手術)後に得られる。第一の値が第一の試料において得られ、例えば、領域のZ値(例えば、領域メチル化レベルおよびCNAの正規化された数)および低メチル化およびCNA(例えば、増幅または欠失)を示す領域の数等である。第二の値は第二の試料において得られ得る。別の実施形態では、第三、またはさらに追加された試料が、処置後に得られ得る。低メチル化およびCNA(例えば、増幅または欠失)を示す領域の数が、第三またはさらに追加された試料から得られ得る。   Thus, in some embodiments, one biological sample is obtained before treatment and a second biological sample is obtained after treatment (eg, surgery). A first value is obtained in the first sample, for example the Z value of the region (eg, the region methylation level and the normalized number of CNAs) and the hypomethylation and CNA (eg, amplification or deletion). It is the number of regions to be shown. The second value can be obtained in the second sample. In another embodiment, a third, or even added sample may be obtained after treatment. The number of regions exhibiting hypomethylation and CNA (eg amplification or deletion) can be obtained from the third or further added samples.

図40Aおよび図41Aについての上記のように、第一の試料における低メチル化を示す領域の第一の数は、第二の試料における低メチル化を示す領域の第二の量と比較され得る。図40Bおよび図41Bについての上記のように、第一の試料における低メチル化を示す領域の第一の量は、第二の試料における低メチル化を示す領域の第二の量と比較され得る。第一の量と第二の量との比較および第一の数と第二の数との比較が用いられて、処置の予後が決定され得る。種々の実施形態において、それらの比較の一方のみが予後の決定要因になり得、あるいは両方の比較が用いられ得る。第三またはさらに追加された試料が得られる実施形態において、これらの試料のうちの一つまたは複数が用いられて、それ自体により、または第二の試料との組み合わせにおいて、処置の予後が決定され得る。   As described above for FIGS. 40A and 41A, a first number of hypomethylated regions in the first sample can be compared to a second amount of hypomethylated regions in the second sample. . As described above for FIGS. 40B and 41B, the first amount of regions showing hypomethylation in the first sample can be compared to the second amount of regions showing hypomethylation in the second sample. . Comparison of the first amount with the second amount and comparison of the first number with the second number can be used to determine the prognosis of treatment. In various embodiments, only one of those comparisons may be a determinant of prognosis, or both comparisons may be used. In embodiments where a third or additional sample is obtained, one or more of these samples are used to determine the prognosis of the treatment, either by itself or in combination with the second sample. obtain.

ある実施において、予後は、第一の量および第二の量間の第一の差異が第一の差異閾値を下回る場合に、悪化することが予想される。別の実施において、予後は、第一の数および第二の数の間の第二の差異が第二の差異閾値を下回る場合に、悪化することが予想される。前記閾値は同じであっても異なっていてもよい。一実施形態では、第一の差異閾値および第二の差異閾値はゼロである。従って、上記の例において、メチル化の値の間の差異は、患者TBR34のさらに悪い予後を示す。   In some implementations, the prognosis is expected to be exacerbated when the first difference between the first amount and the second amount is below the first difference threshold. In another implementation, the prognosis is expected to be exacerbated when the second difference between the first number and the second number is below the second difference threshold. The thresholds may be the same or different. In one embodiment, the first difference threshold and the second difference threshold are zero. Thus, in the above example, the difference between the methylation values indicates a worse prognosis for patient TBR34.

予後は、第一の差異および/または第二の差異が同じ閾値またはそれぞれの閾値を上回る場合により良くなり得る。予後の分類は、差異がどれだけ大きく閾値を上回るまたは下回っているかに依存し得る。複数の閾値が種々の分類を与えるために用いられ得る。より大きな差異であるほど、より良い予後が予想され得、より小さな差異であるほど(およびさらには負の値)、より悪い予後が予想され得る。   The prognosis may be better if the first difference and / or the second difference are above the same threshold or respective thresholds. Classification of prognosis may depend on how much the difference is above or below the threshold. Multiple thresholds can be used to give different classifications. The greater the difference, the better the prognosis can be expected, and the smaller the difference (and even negative values), the worse the prognosis can be expected.

いくつかの実施形態において、種々の試料が採取される時点も記録される。そのような時間パラメーターを用いることで、前記量の変化の動態または速度が決定され得る。一実施形態では、血漿における腫瘍関連低メチル化の急速な減少および/または血漿における腫瘍関連CNAの急速な減少は、良好な予後を予測するものである。逆に、血漿における腫瘍関連低メチル化の静的(static)増加または急速な増加および/または腫瘍関連CNAの静的増加または急速な増加は、不良な予後を予測するものである。メチル化およびCNAの測定は、臨床成績の予測のために、他の臨床的パラメーター(例えば、イメージング結果または血清生化学またはタンパク質マーカー)と組み合わせて用いることができる。   In some embodiments, the times at which various samples are taken are also recorded. Using such time parameters, the kinetics or rate of change of said amount can be determined. In one embodiment, a rapid decrease in tumor-associated hypomethylation in plasma and / or a rapid decrease in tumor-associated CNA in plasma is predictive of a good prognosis. Conversely, a static or rapid increase in tumor-associated hypomethylation in plasma and / or a static or rapid increase in tumor-associated CNA is predictive of a poor prognosis. Methylation and CNA measurements can be used in combination with other clinical parameters (eg imaging results or serum biochemistry or protein markers) for prediction of clinical outcome.

実施形態では血漿以外に他の試料が用いられ得る。例えば、腫瘍関連性のメチル化異常(例えば、低メチル化)および/または腫瘍関連CNAが、がん患者の血液中で循環している腫瘍細胞から、尿、便、唾液、痰、胆汁液、膵液、子宮頸部スワブ、生殖器系(例えば、膣)からの分泌物、腹水、胸膜液、精液、汗および涙中の無細胞DNAまたは腫瘍細胞から、測定され得る。   In addition to plasma, other samples may be used in embodiments. For example, tumor-associated methylation abnormalities (eg, hypomethylation) and / or tumor-associated CNAs are found in circulating urine, stool, saliva, sputum, bile fluid from tumor cells in the blood of cancer patients. It can be measured from acellular DNA or tumor cells in pancreatic juice, cervical swabs, secretions from the reproductive system (eg vagina), ascites, pleural fluid, semen, sweat and tears.

種々の実施形態において、腫瘍関連メチル化異常(例えば、低メチル化)および/または腫瘍関連CNAは、乳がん、肺がん、結腸直腸がん、膵がん、卵巣がん、上咽頭癌、子宮頸がん、メラノーマ、脳腫瘍等を有する患者の血液または血漿から検出され得る。実際に、メチル化およびCNA等の遺伝子変化はがんにおいて普遍的な現象であるため、前記アプローチは全てのがん型に用いられ得る。メチル化およびCNAの測定値は、臨床成績の予測のために、他の臨床的パラメーター(例えば、イメージング結果)と組み合わせて用いられ得る。実施形態は、前癌病変部(例えば、腺腫)を有する患者の検診およびモニタリングにも用いられ得る。   In various embodiments, tumor-associated methylation abnormalities (eg, hypomethylation) and / or tumor-associated CNAs include breast cancer, lung cancer, colorectal cancer, pancreatic cancer, ovarian cancer, nasopharyngeal cancer, cervical cancer. Cancer, melanoma, brain tumors, etc. can be detected in blood or plasma. Indeed, since methylation and genetic alterations such as CNA are universal phenomena in cancer, the approach can be used for all cancer types. Methylation and CNA measurements can be used in combination with other clinical parameters (eg, imaging results) for predicting clinical outcome. Embodiments may also be used in the screening and monitoring of patients with precancerous lesions (eg, adenomas).

従って、一実施形態では、生物試料は処置前に採取され、CNAおよびメチル化の測定は処置後に繰り返される。前記測定から、欠失または増幅を示すことが決定された領域の後の第一の量が得られ得、各領域カットオフ値を超える領域メチル化レベルを有することが決定された領域の後の第二の量が得られ得る。第一の量が後の第一の量と比較され、第二の量が後の第二の量と比較されることで、生物の予後が決定され得る。   Thus, in one embodiment, the biological sample is taken prior to treatment and CNA and methylation measurements are repeated after treatment. From the measurement, a first amount after the regions determined to show deletion or amplification can be obtained, which can be obtained after the regions determined to have a region methylation level above each region cutoff value. A second amount can be obtained. The prognosis of the organism can be determined by comparing the first amount to the later first amount and the second amount to the later second amount.

生物の予後を決定するための比較には、第一の量および後の第一の量の間の第一の差異を決定することが含まれ得、第一の差異が一つまたは複数の第一の差異閾値と比較されることで、予後が決定され得る。生物の予後を決定するための比較には、第二の量および後の第二の量の間の第二の差異を決定することが含まれ得、第二の差異は一つまたは複数の第二の差異閾値と比較され得る。閾値は、ゼロまたは別の数であり得る。   A comparison to determine the prognosis of an organism can include determining a first difference between a first amount and a subsequent first amount, where the first difference is one or more firsts. A prognosis can be determined by comparison with a difference threshold. A comparison to determine the prognosis of an organism can include determining a second difference between a second amount and a subsequent second amount, where the second difference is one or more firsts. It can be compared to two difference thresholds. The threshold can be zero or another number.

予後は、第一の差異が第一の差異閾値を上回る場合よりも、第一の差異が第一の差異閾値を下回る場合に、悪化することが予測され得る。予後は、第二の差異が第二の差異閾値を上回る場合よりも、第二の差異が第二の差異閾値を下回る場合に、悪化することが予測され得る。処置の例としては、免疫療法、外科手術、放射線療法、化学療法、抗体に基づく療法、遺伝子療法、エピジェネティック療法または標的療法が挙げられる。   The prognosis may be predicted to be worse when the first difference is below the first difference threshold than when the first difference is above the first difference threshold. The prognosis may be predicted to be worse when the second difference is below the second difference threshold than when the second difference is above the second difference threshold. Examples of treatments include immunotherapy, surgery, radiation therapy, chemotherapy, antibody-based therapy, gene therapy, epigenetic therapy or targeted therapy.

E. 性能
CNAおよびメチル化解析における異なる数の配列リードおよび異なる数のビンサイズの診断能が以下に記載される。
E. Performance The diagnostic ability of different numbers of sequence reads and different numbers of bin sizes in CNA and methylation analysis is described below.

1. 配列リードの数
一実施形態に従って、32人の健常対照患者、26人の肝細胞癌を有する患者および他のがん型(例えば、上咽頭癌、乳がん、肺がん、神経内分泌がんおよび平滑筋肉腫)を有する20人の患者の、血漿DNAが解析された。32人中22人の健常対象が参照群として無作為に選択された。これら22人の参照個体の平均値および標準偏差(SD)が、メチル化密度およびゲノム表現(genomic representation)の正常範囲を決定するために用いられた。各個体の血漿試料から抽出されたDNAが、イルミナ社製ペアエンド配列決定キットを用いる配列決定ライブラリー(sequencing library)構築のために用いられた。配列決定ライブラリーは次に、非メチル化シトシン残基をウラシルに変換する亜硫酸水素塩処理を受けた。各血漿試料の亜硫酸水素塩処理された配列決定ライブラリーは、イルミナ社製HiSeq2000配列決定装置の1レーンを用いて配列決定された。
1. Number of Sequence Reads According to one embodiment, 32 healthy control patients, 26 patients with hepatocellular carcinoma and other cancer types (eg nasopharyngeal cancer, breast cancer, lung cancer, neuroendocrine cancer and leiomyosarcoma). DNA of 20 patients with Twenty-two out of 32 healthy subjects were randomly selected as a reference group. The mean and standard deviation (SD) of these 22 reference individuals were used to determine the normal range of methylation density and genomic representation. The DNA extracted from the plasma sample of each individual was used for construction of a sequencing library using a Illumina paired-end sequencing kit. The sequencing library was then subjected to bisulfite treatment which converted unmethylated cytosine residues to uracil. The bisulfite treated sequencing library of each plasma sample was sequenced using one lane of an Illumina HiSeq2000 sequencer.

ベースコールの後、断片末端のアダプター配列および低クオリティ塩基(low quality base)(すなわち、クオリティスコアが5未満)が除去された。FASTQ形式のトリミングされたリードは次に、Methy−Pipeと称されるメチル化データ解析パイプラインによって処理された(P Jiang et al. 2010, IEEE International Conference on Bioinformatics and Biomedicine, doi:10.1109/BIBMW.2010.5703866)。亜硫酸水素塩変換した配列決定リードを整列させるために、最初に、参照ヒトゲノム(NCBI build 36/hg19)を用いて、ワトソン鎖およびクリック鎖上で別々に、全シトシン残基のチミンへのインシリコ変換が行われた。次に、処理された全てのリードにおいて各シトシンのチミンへのインシリコ変換が行われ、それぞれの変換された残基の位置情報が保持された。SOAP2が、変換されたリードを2つの事前変換された参照ヒトゲノムに整列させるために用いられ(R Li et al. 2009 Bioinformatics 25:1966-1967)、最高2つのミスマッチが整列されたリードのそれぞれに許された。ユニークなゲノム位置にマッピング可能なリードのみが、下流の解析に用いられた。ワトソン鎖およびクリック鎖の両方にマッピングされるあいまいなリードおよび重複(クローン)リードは排除された。CpGジヌクレオチド配列内のシトシン残基が下流のメチル化解析に用いられた。アライメントの後、配列決定されたリード上に元々存在したシトシンは、インシリコ変換中に保持された位置情報に基づいて、回復された。CpGジヌクレオチド中の回復されたシトシンは、メチル化状態としてスコアリングされた。CpGジヌクレオチド中のチミンは、非メチル化状態としてスコアリングされた。   After basecalling, adapter sequences at the ends of the fragments and a low quality base (ie, quality score less than 5) were removed. Trimmed reads in FASTQ format were then processed by a methylation data analysis pipeline called Methy-Pipe (P Jiang et al. 2010, IEEE International Conference on Bioinformatics and Biomedicine, doi: 10.1109 / BIBMW. 2010.5703866). To align the bisulfite converted sequencing reads, first, using the reference human genome (NCBI build 36 / hg19), in silico conversion of all cytosine residues to thymine separately on the Watson and Crick strands. Was done. Next, in silico conversion of each cytosine to thymine was performed in all processed reads, and positional information of each converted residue was retained. SOAP2 was used to align the converted reads to two pre-converted reference human genomes (R Li et al. 2009 Bioinformatics 25: 1966-1967), with up to 2 mismatches in each of the aligned reads. Forgiven Only reads that could be mapped to unique genomic locations were used for downstream analysis. Ambiguous and overlapping (clone) reads that map to both Watson and Crick strands were eliminated. Cytosine residues within the CpG dinucleotide sequence were used for downstream methylation analysis. After alignment, the cytosines originally present on the sequenced reads were recovered based on the positional information retained during the in silico conversion. Recovered cytosines in CpG dinucleotides were scored as methylated. Thymine in the CpG dinucleotide was scored as an unmethylated state.

メチル化解析において、ゲノムは等しいサイズのビンに分割された。検査されたビンのサイズには、50kb、100kb、200kbおよび1Mbが含まれる。各ビンのメチル化密度は、CpG位置におけるシトシンの総数で除算された、CpGジヌクレオチドの配列中のメチル化シトシンの数として算出された。他の実施形態では、ビンサイズはゲノム全域で不等であり得る。一実施形態では、不等なサイズのそのようなビンの中の各ビンが、複数の対象にわたって比較される。   In the methylation analysis, the genome was divided into bins of equal size. The sizes of bins examined include 50 kb, 100 kb, 200 kb and 1 Mb. The methylation density of each bin was calculated as the number of methylated cytosines in the CpG dinucleotide sequence divided by the total number of cytosines at the CpG position. In other embodiments, bin sizes may be unequal across the genome. In one embodiment, each bin in such bins of unequal size is compared across multiple subjects.

検査症例の血漿メチル化密度が正常であるかどうかを決定するために、メチル化密度が参照群の結果と比較された。32人中22人の健常対象が、メチル化Z値(Zmeth)の算出のために、参照群として無作為に選択された。 Methylation densities were compared to the results of the reference group to determine if plasma methylation densities of the tested cases were normal. Twenty-two out of thirty-two healthy subjects were randomly selected as a reference group for the calculation of methylated Z-values ( Zmeth ).

式中、 In the formula,

は、検査症例の特定の1Mbビンのメチル化密度であり; Is the methylation density of a particular 1 Mb bin of the tested case;

は、参照群の対応するビンの平均メチル化密度であり; Is the mean methylation density of the corresponding bins in the reference group;

は、参照群の対応するビンのメチル化密度のSDである。 Is the SD of the methylation density of the corresponding bins in the reference group.

CNA解析において、各1Mbビンにマッピングされる配列決定されたリードの数が決定された(KCA Chan el al. 2013 Clin Chem 59:211-24)。先に報告された(EZ Chen et al. 2011 PLoS One 6: e21791)局所加重散布図平滑化回帰(Locally Weighted Scatter Plot Smoothing regression)を用いるGCの偏りに対する補正の後、各ビンにおける配列決定されたリード密度が決定された。血漿解析において、検査症例の配列決定されたリード密度が参照群と比較されて、CNAのZ値、   In CNA analysis, the number of sequenced reads mapped to each 1 Mb bin was determined (KCA Chan el al. 2013 Clin Chem 59: 211-24). Sequencing in each bin after correction for GC bias using the Locally Weighted Scatter Plot Smoothing regression reported previously (EZ Chen et al. 2011 PLoS One 6: e21791). The lead density was determined. In plasma analysis, the sequenced read densities of the tested cases were compared to a reference group to determine the CNA Z-value,

が算出された。 Was calculated.

式中、 In the formula,

は、検査症例の特定の1Mbビンの配列決定されたリード密度であり; Is the sequenced read density of a particular 1 Mb bin of the tested case;

は、参照群の対応するビンの配列決定されたリード密度の平均値であり; Is the average of the sequenced read densities of the corresponding bins of the reference group;

は、参照群の対応するビンの配列決定されたリード密度のSDであった。ビンは、ビンのZCNAが−3未満または3超である場合に、CNAを示すと定義された。 Was the SD of the sequenced read density of the corresponding bins in the reference group. A bin was defined as exhibiting a CNA if the Z CNA of the bin was less than -3 or greater than 3.

9300万の整列されたリード(範囲:3900万〜1億4200万)の平均値が症例毎に得られた。診断能に対する配列決定されたリードの数の減少の影響を評価するために、各症例から1000万の整列されたリードが無作為に選択された。配列決定されたリードが減少したデータセットにおける、各1Mbビンの参照範囲を確立するために、同じ参照個体群が用いられた。有意な低メチル化(すなわち、Zmethが−3未満)を示すビンの割合およびCNA(すなわち、ZCNAが−3未満または3超)を有するビンの割合が、各症例において決定された。1レーンからの全ての配列決定されたリードおよび症例毎の1000万のリードを用いたデータセットに対するゲノムワイドな低メチル化およびCNA解析の診断能を図示するために、受信者操作特性(ROC)曲線が用いられた。ROC解析において、32人全ての健常対象が解析に用いられた。 An average of 93 million aligned reads (range: 39-142 million) was obtained for each case. To evaluate the effect of reducing the number of sequenced reads on diagnostic performance, 10 million aligned reads from each case were randomly selected. The same reference population was used to establish a reference range for each 1 Mb bin in the sequenced read reduced dataset. The percentage of bins showing significant hypomethylation (ie Z meth <-3) and the percentage of bins having CNA (ie Z CNA <-3 or > 3) was determined in each case. To illustrate the diagnostic power of genome-wide hypomethylation and CNA analysis on a dataset with all sequenced reads from one lane and 10 million reads per case, receiver operating characteristics (ROC) Curves were used. In the ROC analysis, all 32 healthy subjects were used in the analysis.

図42は、異なる数の配列決定されたリードを用いたゲノムワイドな低メチル化解析の診断能の図を示している。低メチル化解析において、ROC曲線の曲線下面積は、1レーンからの全ての配列決定されたリードおよび症例毎の1000万のリードを解析した2つのデータセット間で、有意差があるとは言えなかった(P=0.761)。CNA解析において、診断能は、配列決定されたリードの数が、1レーンのデータの使用から、1000万に、減少した場合に、曲線下面積の有意な減少を伴って劣化した(P<0.001)。   FIG. 42 shows a diagram of the diagnostic capabilities of genome-wide hypomethylation analysis with different numbers of sequenced reads. In hypomethylation analysis, the area under the curve of the ROC curve is not significantly different between the two data sets analyzed for all sequenced reads from one lane and 10 million reads per case. None (P = 0.761). In CNA analysis, diagnostic power deteriorated with a significant decrease in the area under the curve when the number of sequenced reads decreased from the use of 1-lane data to 10 million (P <0. .001).

2. 異なるビンサイズの使用の影響
ゲノムの1Mbビンへの分割の他に、より小さなビンサイズが使用可能であるかどうかも調べられた。理論上は、より小さなビンの使用は、ビン内のメチル化密度における変動性を減少させ得る。これは、メチル化密度が異なるゲノム領域間で大きく異なり得るためである。ビンがより大きい場合、異なるメチル化密度を有する領域を含む確率は増加するため、ビンのメチル化密度における変動性の全体的な増加に繋がる。
2. Impact of using different bin sizes In addition to dividing the genome into 1 Mb bins, it was also investigated whether smaller bin sizes could be used. In theory, the use of smaller bins can reduce the variability in methylation density within the bin. This is because genomic regions with different methylation densities can differ significantly. For larger bins, the probability of containing regions with different methylation densities increases, leading to an overall increase in variability in the methylation densities of the bins.

より小さなビンサイズの使用は領域間差異に関連するメチル化密度における変動性を減少させ得るが、これは、一方で、特定のビンにマッピングされる配列決定されたリードの数を減少させる。個々のビンにマッピングされるリードの減少は、抽出変動により、変動性を増加させる。メチル化密度において最も小さな全体的な変動性を生じ得る最適なビンサイズは、特定の診断的適用の要求に応じて、実験的に決定され得る(例えば、試料毎の配列決定されたリードの総数および使用されるDNA配列決定装置の型)。   While the use of smaller bin sizes can reduce the variability in methylation density associated with interregional differences, this, in turn, reduces the number of sequenced reads that map to a particular bin. The reduction of reads mapped to individual bins increases variability due to extraction variability. The optimal bin size that can result in the smallest overall variability in methylation density can be determined empirically, as required by the particular diagnostic application (eg, total number of sequenced reads per sample). And the type of DNA sequencer used).

図43は、異なるビンサイズ(50kb、100kb、200kbおよび1Mb)を用いた、ゲノムワイドな低メチル化解析に基づくがんの検出における、ROC曲線を示す図である。示されるP値は、1Mbのビンサイズを用いた曲線下面積比較のP値である。ビンサイズが1Mbから200kbに減少した場合に、向上の傾向が見ることができる。   FIG. 43 shows ROC curves in cancer detection based on genome-wide hypomethylation analysis using different bin sizes (50 kb, 100 kb, 200 kb and 1 Mb). The P-values shown are P-values for area under the curve comparisons using a 1 Mb bin size. A trend of improvement can be seen when the bin size is reduced from 1 Mb to 200 kb.

F. 累積確率スコア
メチル化およびCNAの領域の量は、様々な値であり得る。上記例により、試料ががんと関連しているかどうかを分類するためのパラメーターとしての、カットオフ値を超過する領域の数、または有意な低メチル化もしくはCNAを示した領域の割合が説明された。そのようなアプローチは、個々のビンにおける異常の規模を考慮していない。例えば、−3.5のZmethを有するビンと、−30のZmethを有するビンは、共に有意な低メチル化を有すると分類されるため、同一である。しかし、血漿中の低メチル化変化の程度(すなわち、Zmeth値の規模)は、試料中のがん関連DNAの量によって影響され、そのため、異常を示すビンの割合の情報を補足して、腫瘍量を反映し得る。血漿試料中の腫瘍DNAのより高い濃度分率は、より低いメチル化密度をもたらし、これはより低いZmeth値に換算される。
F. Cumulative Probability Score The amount of regions of methylation and CNA can be various values. The above example illustrates the number of regions that exceed the cut-off value or the percentage of regions that show significant hypomethylation or CNA as a parameter for classifying whether a sample is associated with cancer. It was Such an approach does not consider the magnitude of the anomaly in individual bins. For example, a bin with Z meth of −3.5 and a bin with Z meth of −30 are both identical because they are both classified as having significant hypomethylation. However, the extent of hypomethylation changes in plasma (ie, the magnitude of Z meth levels) is affected by the amount of cancer-associated DNA in the sample, thus supplementing the information on the percentage of bins showing abnormalities, It may reflect tumor burden. A higher concentration fraction of tumor DNA in plasma samples results in a lower methylation density, which translates into a lower Z meth value.

1. 診断パラメーターとしての累積確率スコア
異常の規模から得られる情報を利用するため、累積確立(CP)スコアと称されるアプローチが開発される。正規分布確率関数に基づいて、各Zmeth値が、そのような観察が偶然に得られる確率に換算された。
1. Cumulative Probability Score as a Diagnostic Parameter To take advantage of the information gained from the magnitude of abnormalities, an approach called Cumulative Probability (CP) Score is developed. Based on the normal distribution probability function, each Z meth value was converted to the probability that such an observation would be obtained by chance.

CPスコアは、−3未満のZmethを有するビン(i)について、 The CP score is for bin (i) with Z meth less than -3,

として算出され、式中、Probiは、自由度3を有するスチューデントt分布に従うビン(i)のZmethの確率であり、logは自然対数関数である。別の実施形態では、10(または他の数字)を低とする対数が用いられ得る。他の実施形態では、他の分布(例えば、限定はされないが、正規分布およびγ分布)が、Z値をCPに変換するために適用され得る。 Where Prob i is the Z meth probability of bin (i) following a Student t distribution with 3 degrees of freedom, and log is the natural logarithmic function. In another embodiment, a logarithm as low as 10 (or other number) may be used. In other embodiments, other distributions, such as, but not limited to, normal distributions and gamma distributions, can be applied to transform Z values into CP.

より大きなCPスコアは、正規母集団にそのような逸脱したメチル化密度を偶然に有する、確率がより低いことを示している。従って、高いCPスコアは、試料中に異常な低メチル化DNAを有する(例えば、がん関連DNAの存在)可能性がより高いことを示している。   Larger CP scores indicate a lower probability of having such a deviated methylation density in the normal population by chance. Therefore, a high CP score indicates that it is more likely to have aberrantly hypomethylated DNA in the sample (eg, the presence of cancer-associated DNA).

異常を示すビンの割合と比較すると、CPスコア測定はより高いダイナミックレンジを有している。異なる患者間の腫瘍量は大きく異なり得るが、より大きな範囲のCP値は、比較的高い、および比較的低い腫瘍量を有する患者の腫瘍量を反映するのに有用である。さらに、CPスコアの使用は、潜在的に、血漿中の腫瘍関連DNAの濃度における変化を検出するためのより高い感度となり得る。これは、治療応答および予後判定のモニタリングに有利である。従って、治療中のCPスコアの減少は、良好な治療応答を示すものである。治療中のCPスコアの減少の欠如またはさらには増加は、応答が乏しいことまたは応答の欠如を示している。予後判定において、高いCPスコアは、高い腫瘍量を示しており、不良な予後(例えば、死亡または腫瘍進行の確率がより高い)を示唆するものである。   The CP score measure has a higher dynamic range when compared to the percentage of bins that show anomalies. Tumor burden between different patients can vary widely, but a larger range of CP values is useful to reflect the tumor burden of patients with higher and lower tumor burdens. Moreover, the use of CP scores can potentially be more sensitive for detecting changes in the concentration of tumor-associated DNA in plasma. This is advantageous for monitoring treatment response and prognosis. Therefore, a decrease in CP score during treatment is indicative of a good therapeutic response. A lack of or even an increase in CP score during treatment is indicative of poor response or lack of response. In prognosis, a high CP score indicates a high tumor burden, suggesting a poor prognosis (eg, higher probability of death or tumor progression).

図44Aは、累積確立(CP)および異常を有するビンの割合の診断能を示している。それら2つのタイプの診断アルゴリズムの曲線下面積の間に有意差はなかった(P=0.791)。   FIG. 44A shows the diagnostic potential for cumulative probability (CP) and the percentage of bins with abnormalities. There was no significant difference between the areas under the curves of the two types of diagnostic algorithms (P = 0.791).

図44Bは、全体的な低メチル化、CG島高度メチル化およびCNAの血漿解析の診断能を示している。試料あたり1レーンの配列決定(低メチル化解析については200kbビンサイズ、CNAについては1Mbビンサイズ、そしてCG島は、カリフォルニア大学サンタクルズ校(UCSC)が主催したデータベースに従って定義された)を行ったところ、3種の解析全ての曲線下面積は0.90を上回った。   FIG. 44B shows the diagnostic potential of plasma analysis of global hypomethylation, CG island hypermethylation and CNA. Sequencing of one lane per sample (200 kb bin size for hypomethylation analysis, 1 Mb bin size for CNA, and CG islands defined according to a database hosted by the University of California, Santa Cruz (UCSC)) The area under the curve for all three analyzes was greater than 0.90.

その後の解析において、対照患者における最も高いCPスコアが、前記3種の解析のそれぞれに対するカットオフとして用いられた。これらのカットオフの選択は、100%の診断特異度を与えた。全体的な低メチル化、CG島高度メチル化およびCNA解析の診断感度は、それぞれ、78%、89%および52%であった。46人中43人のがん患者において、これら3種の異常のうちの少なくとも1つが検出され、これにより、93.4%の感度および100%の特異度が得られた。これらの結果は、これら3種の解析ががんの検出に相乗的に用いられ得ることを示している。   In subsequent analyses, the highest CP score in control patients was used as the cutoff for each of the three analyses. Selection of these cutoffs gave 100% diagnostic specificity. The diagnostic sensitivity of global hypomethylation, CG island hypermethylation and CNA analysis was 78%, 89% and 52%, respectively. At least one of these three abnormalities was detected in 43 out of 46 cancer patients, resulting in a sensitivity of 93.4% and a specificity of 100%. These results indicate that these three analyzes can be used synergistically to detect cancer.

図45は、肝細胞癌患者における全体的な低メチル化、CG島高度メチル化およびCNAの結果を含む、表を示している。これら3種の解析におけるCPスコアのカットオフ値は、それぞれ、960、2.9および211であった。陽性のCPスコア結果は、太字にされ、且つ下線が引かれた。   FIG. 45 shows a table containing global hypomethylation, CG island hypermethylation and CNA results in patients with hepatocellular carcinoma. The CP score cutoff values in these three analyzes were 960, 2.9, and 211, respectively. Positive CP score results were bolded and underlined.

図46は、肝細胞癌以外のがんを有する患者における全体的な低メチル化、CG島高度メチル化およびCNAの結果を含む、表を示している。これら3種の解析におけるCPスコアのカットオフ値は、それぞれ、960、2.9および211であった。陽性のCPスコア結果は、太字にされ、且つ下線を引かれた。   FIG. 46 shows a table containing global hypomethylation, CG island hypermethylation and CNA results in patients with cancers other than hepatocellular carcinoma. The CP score cutoff values in these three analyzes were 960, 2.9, and 211, respectively. Positive CP score results were bolded and underlined.

2. がんモニタリングへのCPスコアの適用
連続試料が、処置の前および後にHCC患者TBR34から採取された。これらの試料は、全体的な低メチル化について解析された。
2. Application of CP Score to Cancer Monitoring Serial samples were taken from HCC patient TBR34 before and after treatment. These samples were analyzed for global hypomethylation.

図47は、症例TBR34の血漿メチル化の連続解析を示している。最内側の環は、軟膜(黒色)および腫瘍組織(紫色)のメチル化密度を示している。これらの血漿試料において、各1MbビンのZmethが示されている。2本の線の間の差異は、5のZmeth差異を表している。赤色および灰色のドットは、参照群と比較して、低メチル化を有するビンおよびメチル化密度における変化を有さないビンを表している。2番目に内側の環から外側に向かって、それぞれ、処置前、腫瘍切除の3日後および腫瘍切除の2ヵ月後に採取された血漿試料である。処置前では、高度な低メチル化が血漿中に観察され得、18.5%超のビンが−10未満のZmethを有していた。腫瘍切除の3日後では、血漿中の低メチル化の程度が減少したことが観察され得、いずれのビンも−10未満のZmethを有さなかった。 FIG. 47 shows a serial analysis of plasma methylation in case TBR34. The innermost ring shows the methylation density of buffy coat (black) and tumor tissue (purple). In each of these plasma samples, Z meth of 1 Mb bin is shown. The difference between the two lines represents a Z meth difference of 5. Red and gray dots represent bins with hypomethylation and no change in methylation density compared to the reference group. Plasma samples taken from the second inner ring outward, pretreatment, 3 days after tumor resection and 2 months after tumor resection, respectively. Prior to treatment, a high degree of hypomethylation could be observed in plasma with> 18.5% of the bins having a Z meth less than -10. At 3 days after tumor resection, it could be observed that the degree of hypomethylation in plasma was reduced, and neither bin had Z meth less than -10.

表5は、低メチル化変化の規模は腫瘍の外科的切除の3日後に減少したが、異常を示すビンの割合は逆に増加を示したことを示している。一方、CPスコアは、血漿中の低メチル化の程度における減少をより正確に示し、腫瘍量における変化をより反映するものであり得る。   Table 5 shows that the magnitude of hypomethylation changes decreased 3 days after surgical excision of the tumor, whereas the proportion of abnormal bins showed an increase. On the other hand, the CP score may more accurately indicate the decrease in the degree of hypomethylation in plasma and better reflect the change in tumor burden.

手術(OT)の2ヵ月後でも、低メチル化変化を示すビンが有意な割合で存在した。CPスコアも、およそ15,000において静止したままであった。この患者は後に、3ヵ月目の残りの非切除肝臓において、多巣性の腫瘍堆積(外科手術の時点において事前に未知であった)を有すると診断され、手術の4ヶ月後には複数の肺転移を有すると報告された。前記患者は、手術の8ヶ月後に転移性疾患により死亡した。これらの結果により、CPスコアが、腫瘍量の反映において、異常を有するビンの割合よりも、より強力であり得ることが示唆された。   Even 2 months after surgery (OT), there was a significant proportion of bins showing hypomethylation changes. The CP score also remained stationary at approximately 15,000. This patient was later diagnosed with multifocal tumor deposits (previously unknown at the time of surgery) in the remaining unresected liver at 3 months and had multiple lungs 4 months after surgery. It was reported to have metastases. The patient died of metastatic disease 8 months after surgery. These results suggested that the CP score may be more powerful in reflecting tumor burden than the percentage of bins with abnormalities.

全体として、CPは、血漿中の腫瘍DNAの量の測定を必要とする適用に有用であり得る。そのような適用の例としては、がん患者の予後判定およびモニタリング(例えば、治療に対する応答を観察するための、または腫瘍進行を観察するための)が挙げられる。   Overall, CP may be useful in applications requiring measurement of the amount of tumor DNA in plasma. Examples of such applications include prognosis and monitoring of cancer patients (eg, to observe response to treatment or to observe tumor progression).

累積Z値はZ値の直和である(すなわち、確率への変換が無い)。この例において、累積Z値は、CPスコアと同じ挙動を示す。他の例において、CPは、CPスコアのダイナミックレンジがより大きいことから、残存疾患のモニタリングにおいて、累積Z値よりも高感度であり得る。   The cumulative Z value is the direct sum of the Z values (ie, no conversion to probabilities). In this example, the cumulative Z value behaves the same as the CP score. In another example, CP may be more sensitive than cumulative Z-value in monitoring residual disease due to the greater dynamic range of CP scores.

X. メチル化に対するCNAの影響
がんのレベルの各分類を決定するためのCNAおよびメチル化の使用(ここで、これらの分類は組み合わされることで第三の分類を与える)が、上に記載された。そのような組み合わせに加え、CNAは、メチル化解析におけるカットオフ値を変化させるために、および異なるCNA特徴を有する領域群のメチル化レベルを比較することにより偽陽性を特定するために、用いられ得る。例えば、過剰なメチル化レベル(例えば、3超のZCNA)は、正常な存在量のメチル化レベル(例えば、−3<ZCNA<3)と比較され得る。まず、メチル化レベルに対するCNAの影響が記載される。
X. Effect of CNAs on Methylation The use of CNAs and methylation to determine each classification of cancer level, where these classifications are combined to give a third classification, has been described above. . In addition to such combinations, CNAs are used to change the cutoff values in methylation analysis and to identify false positives by comparing the methylation levels of groups of regions with different CNA features. obtain. For example, hypermethylation level (e.g., 3 more than Z CNA) can be compared to normal abundance of methylation levels (e.g., -3 <Z CNA <3) . First, the effect of CNA on methylation levels is described.

A. 染色体の増加および減少を有する領域におけるメチル化密度の変化
腫瘍組織は概して全体的な低メチル化を示すため、がん患者の血漿中の腫瘍由来DNAの存在は、非がん対象と比較した場合、メチル化密度の減少をもたらす。がん患者の血漿中の低メチル化の程度は、理論上は、血漿試料中の腫瘍由来DNAの濃度分率に比例する。
A. Changes in Methylation Density in Regions with Chromosomal Increases and Decreases Tumor tissue generally exhibits global hypomethylation, so the presence of tumor-derived DNA in the plasma of cancer patients when compared to non-cancer subjects. , Resulting in a decrease in methylation density. The degree of hypomethylation in plasma of cancer patients is theoretically proportional to the concentration fraction of tumor-derived DNA in plasma samples.

腫瘍組織における染色体増加を示す領域において、さらなる量の腫瘍DNAが、増幅したDNAセグメントから血漿中に放出される。この、血漿への腫瘍DNAの寄与の増加は、理論上は、罹患領域の血漿DNA中のより高度な低メチル化をもたらす。さらなる因子は、増幅を示すゲノム領域が、腫瘍細胞に増殖有意性を与えていることが予想され、従って発現されていることが予想されるということである。そのような領域は概して低メチル化状態である。   In the regions showing chromosomal gains in tumor tissue, additional amounts of tumor DNA are released from the amplified DNA segment into plasma. This increased contribution of tumor DNA to plasma theoretically results in a higher degree of hypomethylation in plasma DNA in the affected area. An additional factor is that genomic regions that exhibit amplification are expected to confer growth significance on tumor cells and are therefore expected to be expressed. Such regions are generally hypomethylated.

対照的に、腫瘍組織において染色体減少を示す領域では、血漿への腫瘍DNAの寄与の減少は、コピー数変化が無い領域と比較して、より低度の低メチル化をもたらす。さらなる因子は、腫瘍細胞において欠失しているゲノム領域が腫瘍抑制遺伝子を含有し得ること、およびそのような発現停止した領域を有することが腫瘍細胞に有利であり得ることである。従って、そのような領域は、高度メチル化されている可能性がより高いことが予想される。   In contrast, in regions showing chromosomal loss in tumor tissue, the reduced contribution of tumor DNA to plasma results in a lower degree of hypomethylation, as compared to regions without copy number changes. An additional factor is that the genomic region that is deleted in tumor cells may contain tumor suppressor genes, and that having such a silenced region may be beneficial to tumor cells. Therefore, it is expected that such regions are more likely to be hypermethylated.

ここで、この影響を説明するために、2人のHCC患者(TBR34およびTBR36)の結果が用いられる。図48A(TBR36)および図49A(TBR34)は、染色体の増加または減少を有する領域を強調している環、および対応するメチル化解析を有する。図48Bおよび図49Bは、それぞれ、TBR36患者およびTBR34患者における減少、正常、および増加についての、メチル化z値のプロットを示している。   Here, the results of two HCC patients (TBR34 and TBR36) are used to explain this effect. Figure 48A (TBR36) and Figure 49A (TBR34) have rings highlighting regions with increased or decreased chromosomes and the corresponding methylation analysis. 48B and 49B show plots of methylated z-values for decrease, normal, and increase in TBR36 and TBR34 patients, respectively.

図48Aは、HCC患者TBR36の亜硫酸水素塩処理血漿DNAにおけるCNA(内側の環)およびメチル化変化(外側の環)を示す、Circosプロットを示している。赤色の環は染色体の増加または減少を有する領域を強調している。染色体増加を示す領域は、コピー数変化が無い領域よりも、より低メチル化状態であった。染色体減少を示す領域は、コピー数変化が無い領域よりも、低メチル化の程度が低かった。図48Bは、HCC患者TBR36の、染色体の増加および減少を有する領域、並びにコピー数に変化が無い領域の、メチル化Z値のプロットである。コピー変化を有さない領域と比較して、染色体増加を有する領域はより負のZ値(より低メチル化)を有し、染色体減少を有する領域はそれほど負ではないZ値(それほど低メチル化でない)を有していた。   FIG. 48A shows a Circos plot showing CNA (inner ring) and methylation changes (outer ring) in bisulfite-treated plasma DNA of HCC patient TBR36. Red circles highlight regions with increased or decreased chromosomes. Regions showing increased chromosomes were more hypomethylated than regions without copy number changes. Regions showing chromosomal loss had a lower degree of hypomethylation than regions without copy number changes. FIG. 48B is a plot of methylated Z-values of HCC patient TBR36 in regions with chromosomal gains and losses and in unchanged copy number. Regions with chromosomal gains have more negative Z values (lower methylation) and regions with chromosomal loss have less negative Z values (less hypomethylation) compared to regions without copy changes. Not).

図49Aは、HCC患者TBR34の亜硫酸水素塩処理血漿DNAにおけるCNA(内側の環)およびメチル化変化(外側の環)を示す、Circosプロットを示している。図49Bは、HCC患者TBR34の、染色体の増加および減少を有する領域、およびコピー数に変化が無い領域の、メチル化Z値のプロットである。染色体の増加および減少を有する領域間のメチル化密度における差異は、患者TBR34においてよりも患者TBR36においてより大きかったが、これは、患者TBR36における腫瘍由来DNAの濃度分率がより高かったためである。   FIG. 49A shows a Circos plot showing CNA (inner ring) and methylation changes (outer ring) in bisulfite-treated plasma DNA of HCC patient TBR34. FIG. 49B is a plot of methylated Z-values of HCC patient TBR34 in regions with increased and decreased chromosomes, and in regions with unchanged copy number. The difference in methylation density between regions with chromosomal gains and losses was greater in patient TBR36 than in patient TBR34, due to the higher concentration fraction of tumor-derived DNA in patient TBR36.

この例において、CNAを決定するために用いられた領域は、メチル化を決定するために用いられた領域と同一である。一実施形態では、それぞれの領域カットオフ値は、それぞれの領域が欠失または増幅を示すかどうかに依存している。ある実施において、それぞれの領域カットオフ値(例えば、低メチル化を決定するために用いられたZ値カットオフ)は、増幅が示されない場合よりもそれぞれの領域が増幅を示す場合に、より大きな規模を有する(例えば、規模は3より大きくなり得、−3未満のカットオフが用いられ得る)。従って、低メチル化の検査において、それぞれの領域カットオフ値は、増幅が示されない場合よりもそれぞれの領域が増幅を示す場合に、より大きな負の値を有し得る。そのような実施は、がんを検出するための検査の特異度を向上させることが期待される。   In this example, the region used to determine CNA is the same as the region used to determine methylation. In one embodiment, the respective region cutoff value depends on whether the respective regions exhibit deletions or amplifications. In some implementations, each region cutoff value (eg, the Z value cutoff used to determine hypomethylation) is greater when each region shows amplification than when no amplification is shown. Have a scale (eg, scale can be greater than 3 and cutoffs less than −3 can be used). Thus, in the hypomethylation test, each region cutoff value may have a greater negative value when each region shows amplification than when no amplification is shown. Such practices are expected to improve the specificity of tests for detecting cancer.

別の実施において、それぞれの領域カットオフ値は、欠失が示されない場合よりもそれぞれの領域が欠失を示す場合に、より小さな規模(例えば、3未満)を有する。従って、低メチル化の検査において、それぞれの領域カットオフ値は、欠失が示されない場合よりもそれぞれの領域が欠失を示す場合に、それほど負でない値を有し得る。そのような実施は、がんを検出するための検査の感度を向上させることが期待される。上記実施におけるカットオフ値の調整は、特定の診断シナリオの所望の感度および特異度に依存して変化し得る。他の実施形態では、メチル化およびCNAの測定は、他の臨床的パラメーター(例えば、イメージングの結果または血清生化学)と組み合わせて、がんの予測に用いられ得る。   In another implementation, each region cutoff value has a smaller magnitude (eg, less than 3) when each region exhibits a deletion than when no deletion is exhibited. Thus, in the hypomethylation test, each region cutoff value may have a less negative value when each region shows a deletion than when no deletion is shown. Such practices are expected to improve the sensitivity of tests for detecting cancer. The adjustment of the cutoff value in the above implementation may vary depending on the desired sensitivity and specificity of the particular diagnostic scenario. In other embodiments, methylation and CNA measurements can be used in combination with other clinical parameters (eg, imaging results or serum biochemistry) to predict cancer.

B. 領域を選択するためのCNAの使用
上記のように、腫瘍組織におけるコピー数異常を有する領域において血漿メチル化密度が変化することが示された。腫瘍組織におけるコピー数増加を有する領域において、血漿への低メチル化腫瘍DNAの寄与の増加は、コピー数異常を有さない領域と比較して、血漿DNAのより大きな程度の低メチル化をもたらす。逆に、腫瘍組織におけるコピー数減少を有する領域において、血漿への低メチル化がん由来DNAの寄与の減少は、血漿DNAのより低度の低メチル化をもたらす。血漿DNAのメチル化密度および相対的な提示の間のこの関連性は、潜在的に、がん関連DNAの存在に伴う低メチル化の結果と、血漿DNA中の低メチル化の他の非癌性の原因(例えば、SLE)とを区別するために、用いられ得る。
B. Use of CNAs to Select Regions As noted above, plasma methylation densities were shown to be altered in regions with copy number abnormalities in tumor tissue. Increased contribution of hypomethylated tumor DNA to plasma in regions with increased copy number in tumor tissue results in a greater degree of hypomethylation of plasma DNA compared to regions without copy number abnormalities . Conversely, in regions with copy number reduction in tumor tissue, the reduced contribution of hypomethylated cancer-derived DNA to plasma results in lesser hypomethylation of plasma DNA. This association between the methylation density and relative presentation of plasma DNA is potentially a consequence of hypomethylation associated with the presence of cancer-associated DNA and other non-cancerous hypomethylation in plasma DNA. Can be used to distinguish from sexual causes (eg, SLE).

このアプローチを説明するために、2人の肝細胞癌(HCC)患者およびがんを有さないがSLEを有する2人の患者の血漿試料が解析された。これらの2人のSLE患者(SLE04およびSLE10)は、血漿における低メチル化およびCNAの見かけの存在を示した。患者SLE04において、84%のビンが低メチル化を示し、11.2%のビンがCNAを示した。患者SLE10において、10.3%のビンが低メチル化を示し、5.7%のビンがCNAを示した。   To illustrate this approach, plasma samples from two hepatocellular carcinoma (HCC) patients and two patients without cancer but with SLE were analyzed. These two SLE patients (SLE04 and SLE10) showed hypomethylation in plasma and the apparent presence of CNA. In patient SLE04, 84% of the bins had hypomethylation and 11.2% had CNA. In patient SLE10, 10.3% of the bins had hypomethylation and 5.7% had CNA.

図50Aおよび図50Bは、SLE患者SLE04およびSLE10に対する血漿低メチル化およびCNA解析の結果を示している。外側の環は、1Mb分解能においての、メチル化Z値(Zmeth)を示している。−3未満のメチル化Zmethを有するビンは赤色であり、−3超のZmethを有するビンは灰色であった。内側の環はCNAのZ値(ZCNA)を示している。緑色、赤色および灰色のドットは、それぞれ、3超、3未満および−3〜3のZCNAを有するビンを表している。これら2人のSLE患者において、低メチル化およびCNAの変化が血漿中で観察された。 50A and 50B show the results of plasma hypomethylation and CNA analysis for SLE patients SLE04 and SLE10. The outer ring shows the methylated Z value (Z meth ) at 1 Mb resolution. Bins with methylation Z meth less than -3 is red, the bottle having a -3 greater than Z meth was gray. The inner ring shows the CNA Z value (Z CNA ). Green, red and gray dots represent bins with greater than 3, less than 3, and -3 to 3 Z CNAs , respectively. Hypomethylation and CNA changes were observed in plasma in these two SLE patients.

メチル化およびCNAにおける変化が血漿中のがん由来DNAの存在と一貫しているかどうかを決定するために、3超、3未満および−3〜3のZCNAを有する領域のZmethが比較された。血漿中のがん由来DNAによって寄与されるメチル化変化およびCNAにおいて、−3未満のZCNAを有する領域は、より低度の低メチル化状態であることが予測され、それほど負でないZmethを有した。対照的に、3超のZCNAを有する領域は、より低メチル化状態であることが予想され、より負なZmethを有した。説明のために、片側順位和検定が適用されて、CNAを有する領域(すなわち、−3未満または3超のZCNAを有する領域)のZmethが、CNAを有さない領域(すなわち、−3〜3のZCNAを有する領域)のZmethと比較された。他の実施形態では、他の統計検定、例えば、限定はされないが、スチューデントt検定、分散分析(ANOVA)検定およびクラスカル・ワリス検定が、用いられ得る。 To determine whether changes in methylation and CNA are consistent with the presence of cancer-derived DNA in plasma, Z meth in regions with more than 3, less than 3, and -3 to 3 Z CNAs were compared. It was In the methylation changes and CNAs contributed by cancer-derived DNA in plasma, regions with Z CNAs less than -3 were predicted to be less hypomethylated, with less negative Z meth I had. In contrast, regions with Z CNAs greater than 3 were expected to be more hypomethylated and had more negative Z meth . For purposes of illustration, a one-sided rank sum test is applied such that Z meth of regions with CNA (ie, regions with Z CNA less than −3 or greater than 3) has no CNA (ie, −3). Z meth of the region having a Z CNA of ˜3). In other embodiments, other statistical tests may be used, including but not limited to Student's t test, analysis of variance (ANOVA) test and Kruskal-Wallis test.

図51Aおよび図51Bは、2人のHCC患者(TBR34およびTBR36)の血漿における、CNAを有する領域およびCNAを有さない領域に対する、Zmeth解析を示している。−3未満のZCNAを有する領域および3超のZCNAを有する領域は、それぞれ、血漿中の、過小提示を有する領域および過剰提示を有する領域を表す。TBR34およびTBR36の両方において、血漿中で過小提示された領域(すなわち、−3未満のZCNAを有する領域)は、血漿中に正常な提示を有する領域(すなわち、−3〜3のZCNAを有する領域)よりも、有意に高いZmeth(P値<10-5、片側順位和検定)を有した。正常な提示は、正倍数体ゲノムに期待されるものと一致する。血漿において過剰提示を有する領域(すなわち、3超のZCNAを有する領域)において、それらは、血漿において正常な提示を有する領域よりも、有意により低いZmethを有した(P値<10-5、片側順位和検定)。これらの変化は全て、血漿試料中の低メチル化腫瘍DNAの存在と一貫した。 51A and 51B show Z meth analyzes for the regions with and without CNA in the plasma of two HCC patients (TBR34 and TBR36). Region having an area and 3 greater than Z CNA having Z CNA less than -3, respectively, represent the region with the plasma, the region and overrepresentation having under-presentation. In both TBR34 and TBR36, plasma with under-presented area (i.e., a region having a Z CNA less than -3), the region having a normal presentation in plasma (i.e., the Z CNA of -3 to 3 Had a significantly higher Z meth (P value <10 −5 , one-sided rank sum test). Normal presentation is consistent with that expected for the euploid genome. In regions with over-presentation in plasma (ie regions with Z CNA greater than 3), they had significantly lower Z meth than in regions with normal presentation in plasma (P value <10 −5). , One-sided rank sum test). All these changes were consistent with the presence of hypomethylated tumor DNA in plasma samples.

図51Cおよび図51Dは、2人のSLE患者(SLE04およびSLE10)の血漿における、CNAを有する領域およびCNAを有さない領域に対する、Zmeth解析を示している。−3未満のZCNAを有する領域および3超のZCNAを有する領域は、それぞれ、血漿中の、過小提示を有する領域および過剰提示を有する領域を表す。SLE04において、血漿中で過小提示された領域(すなわち、−3未満のZCNAを有する領域)は、血漿中に正常な提示を有する領域(すなわち、−3〜3のZCNAを有する領域)よりも、有意により高いZmethを有さず(P値=0.99、片側順位和検定)、血漿において過剰提示を有する領域(すなわち、3超のZCNAを有する領域)は、血漿において正常な提示を有する領域よりも、有意により低いZmethを有さなかった(P値=0.68、片側順位和検定)。これらの結果は、血漿中の腫瘍由来低メチル化DNAの存在を原因とする、期待された変化とは異なった。同様に、SLE10において、−3未満のZCNAを有する領域は、−3〜3のZCNAを有する領域よりも、有意により高いZmethを有さなかった(P値=0.99、片側順位和検定)。 51C and 51D show Z meth analyzes for the regions with and without CNA in the plasma of two SLE patients (SLE04 and SLE10). Region having an area and 3 greater than Z CNA having Z CNA less than -3, respectively, represent the region with the plasma, the region and overrepresentation having under-presentation. In SLE04, plasma with under-presented area (i.e., a region having a Z CNA less than -3), from regions with normal presentation in plasma (i.e., a region having a Z CNA of -3 to 3) Also had no significantly higher Z meth (P value = 0.99, one-sided rank sum test) and regions with over-presentation in plasma (ie regions with Z CNA > 3) were normal in plasma. We did not have a significantly lower Z meth than the region with presentation (P value = 0.68, one-sided rank sum test). These results differed from the expected changes due to the presence of tumor-derived hypomethylated DNA in plasma. Similarly, in SLE10, regions having a Z CNA less than -3, than the region having the Z CNA of -3 to 3, did not have a high Z meth significantly (P value = 0.99, one-sided rank Sum test).

SLE患者におけるZmethおよびZCNAの間に典型的ながん関連パターンが無い理由は、SLE患者において、低メチル化も示す特定の細胞型にCNAが存在しないことである。実際に、観察された、CNAおよび低メチル化の見かけの存在は、SLE患者における循環DNAのサイズ分布の変化が原因である。参照が健常対象から得られるために、サイズ分布の変化は、潜在的に、異なるゲノム領域における配列決定されたリード密度を変化させて、見かけのCNAをもたらし得る。先のセクションに記載されたように、循環DNA断片のサイズおよびそのメチル化密度の間には相関が存在する。従って、サイズ分布の変化は、異常なメチル化ももたらし得る。 The reason for the lack of a typical cancer-related pattern between Z meth and Z CNA in SLE patients is the absence of CNAs in certain cell types that also show hypomethylation in SLE patients. Indeed, the observed presence of CNA and hypomethylation is due to the altered size distribution of circulating DNA in SLE patients. The change in size distribution can potentially change the sequenced read densities in different genomic regions, resulting in an apparent CNA, as the reference is obtained from healthy subjects. As described in the previous section, there is a correlation between the size of the circulating DNA fragment and its methylation density. Thus, changes in size distribution can also result in aberrant methylation.

3超のZCNAを有する領域は−3〜3のZCNAを有する領域よりもわずかにより低いメチル化レベルを有したが、比較におけるp値は、2人のがん患者において観察されたものよりもはるかに高かった。一実施形態では、p値は、検査症例ががんを有する可能性を決定するためのパラメーターとして用いられ得る。別の実施形態では、正常な提示を有する領域および異常な提示を有する領域の間のZmethにおける差異は、がんが存在する可能性を示すためのパラメーターとして用いられ得る。一実施形態では、がん患者の一群が、ZmethおよびZCNA間の相関を確立するために、並びに異なるパラメーターの閾値を決定するために用いられて、変化が検査血漿試料中のがん由来低メチル化DNAの存在と一貫していることが示され得る。 Although areas with 3 more than Z CNA had a slightly lower methylation level than the region having the Z CNA of -3 to 3, p values in comparison, than that observed in two cancer patients Was also much higher. In one embodiment, the p-value can be used as a parameter to determine the likelihood that a tested case has cancer. In another embodiment, the difference in Z meth between regions with normal and abnormal presentation can be used as a parameter to indicate the potential presence of cancer. In one embodiment, a panel of cancer patients is used to establish a correlation between Z meth and Z CNA , as well as to determine thresholds for different parameters, wherein the changes are derived from cancer in a test plasma sample. It can be shown to be consistent with the presence of hypomethylated DNA.

従って、一実施形態では、CNA解析が行わて、全てが欠失、増幅、または正常な提示のうちの1つを示す、第一の一連の領域が決定され得る。例えば、第一の一連の領域は、全て欠失を示し得るか、または全て増幅を示し得るか、または全て正常な提示を示し得る(例えば、正常な第一の量の領域を有する(例えば、正常なZmeth))。メチル化レベルは、この第一の一連の領域について決定され得る(例えば、方法2800の第一メチル化レベルは第一の一連の領域に対応し得る)。 Thus, in one embodiment, CNA analysis can be performed to determine a first series of regions, all of which exhibit one of deletion, amplification, or normal presentation. For example, the first series of regions may exhibit all deletions, or all amplifications, or all may exhibit normal presentation (eg, have a normal first amount of regions (eg, Normal Z meth )). A methylation level can be determined for this first series of regions (eg, the first methylation level of method 2800 can correspond to the first series of regions).

CNA解析によって、全てが第二の欠失、増幅、または正常な提示を示す、第二の一連の領域が決定され得る。第二の一連の領域は、第一の一連の領域とは異なるように、示す。例えば、第一の一連の領域が正常であった場合、第二の一連の領域は欠失または増幅を示し得る。第二のメチル化レベルは、第二の一連の領域内の部位におけるメチル化されたDNA分子の数のそれぞれに基づいて、算出され得る。   CNA analysis can determine a second series of regions, all showing a second deletion, amplification, or normal presentation. The second set of regions is shown as different from the first set of regions. For example, if the first set of regions was normal, the second set of regions may exhibit deletions or amplifications. The second level of methylation can be calculated based on each of the number of methylated DNA molecules at a site within the second series of regions.

次に、パラメーターが第一メチル化レベルおよび第二メチル化間で算出され得る。例えば、差異または比が算出され、カットオフ値と比較され得る。また、前記差異または比は、確率分布(例えば、統計検定の一部として)にかけられて、その値が得られる確率が決定され得、この確率はカットオフ値と比較されて、メチル化レベルに基づいてがんのレベルが決定され得る。そのようなカットオフは、がんを有する試料とがんを有さない試料(例えば、SLE)を区別するように選択され得る。   Parameters can then be calculated between the first methylation level and the second methylation. For example, the difference or ratio can be calculated and compared to the cutoff value. Also, the difference or ratio can be multiplied by a probability distribution (eg, as part of a statistical test) to determine the probability of obtaining that value, which is compared to the cutoff value to determine the methylation level. The level of cancer can be determined based on the. Such cutoffs can be selected to distinguish between samples with cancer and samples without cancer (eg, SLE).

一実施形態では、第一の一連の領域または領域の混合(すなわち、増幅、欠失、および正常を示す領域の混合)のメチル化レベルが決定され得る。このメチル化レベルは次に、解析の第一段階の一部として、第一のカットオフと比較され得る。カットオフを上回った場合、これによりがんの可能性が示されるが、その現れが偽陽性であるかどうを決定するために、上記の解析が行われ得る。このように、がんのレベルの最終的な分類には、2つのメチル化レベルのパラメーターの第二のカットオフとの比較が含まれ得る。   In one embodiment, the methylation level of a first series of regions or a mixture of regions (ie, a mixture of regions showing amplification, deletion, and normal) can be determined. This methylation level can then be compared to the first cutoff as part of the first step of the analysis. Above the cutoff, this indicates a cancer potential, but the above analysis can be performed to determine if the manifestation is a false positive. Thus, the final classification of cancer levels may include comparison of the two methylation level parameters with a second cutoff.

第一メチル化レベルは、第一の一連の領域の各領域について算出された領域メチル化レベルの、統計値(例えば、平均値または中央値)であり得る。第二のメチル化レベルも、第二の一連の領域の各領域について算出された領域メチル化レベルの、統計値であり得る。例として、統計値は、片側順位和検定、スチューデントt検定、分散分析(ANOVA)検定、またはクラスカル・ワリス検定を用いて決定され得る。   The first methylation level can be a statistic (eg, mean or median) of the calculated region methylation levels for each region of the first series of regions. The second methylation level can also be a statistic of the calculated region methylation level for each region of the second series of regions. As an example, the statistic may be determined using a one-tailed rank sum test, Student's t-test, analysis of variance (ANOVA) test, or Kruskal-Wallis test.

XI. がん型分類
生物ががんを有するかどうかを決定することに加えて、実施形態では、試料と関連するがん型が特定され得る。このがん型の特定では、全体的な低メチル化、CG島高度メチル化、および/またはCNAのパターンが用いられ得る。前記パターンには、測定された領域メチル化レベル、領域の各CNA値、およびCG島のメチル化レベルを用いた既知の診断を有する患者のクラスタリングが含まれ得る。下記の結果は、類似のがん型を有する生物が、領域およびCG島において類似の値を有すること、並びに非がん患者が類似の値を有することを示している。クラスタリングにおいて、領域または島におけるこれらの値のそれぞれは、クラスタリング過程において、別々の次元であり得る。
XI. Cancer Type In addition to determining whether an organism has cancer, in embodiments, the cancer type associated with the sample can be identified. Global hypomethylation, CG island hypermethylation, and / or CNA patterns can be used in identifying this cancer type. The pattern may include clustering of patients with a known diagnosis using the measured regional methylation levels, the respective CNA values of the regions, and the CG island methylation levels. The results below show that organisms with similar cancer types have similar values in the region and CG islands, and non-cancer patients have similar values. In clustering, each of these values in a region or island can be a separate dimension in the clustering process.

同じがん型は類似の遺伝子変化および後成的変化を共有していることが知られている(E Gebhart et al. 2004 Cytogenet Genome Res; 104: 352-358; PA Jones et al. 2007 Cell; 128: 683-692)。下記に、血漿中で検出検出されるCNAおよびメチル化変化のパターンが、がんの起源または型を推測するのにどのように有用であるかが記載される。HCC患者、非HCC患者および健常対照患者からえられた血漿DNA試料が、例えば階層クラスタリング解析を用いて、分類された。解析は、例えば、R scriptパッケージのheatmap.2機能(cran.r-project.org/web/packages/gplots/gplots.pdf)を用いて、行われた。   The same cancer types are known to share similar genetic and epigenetic changes (E Gebhart et al. 2004 Cytogenet Genome Res; 104: 352-358; PA Jones et al. 2007 Cell; 128: 683-692). Below is described how the patterns of CNA and methylation changes detected and detected in plasma are useful in inferring the origin or type of cancer. Plasma DNA samples from HCC patients, non-HCC patients and healthy control patients were classified, for example using hierarchical clustering analysis. The analysis is performed by, for example, the heatmap. It was performed using two functions (cran.r-project.org/web/packages/gplots/gplots.pdf).

このアプローチの可能性を説明するために、血漿試料を分類するのに有用な特徴を特定するための例として、2組の判定基準(A群およびB群)が用いられた(表6を参照)。他の実施形態では、これらの特徴を特定するために他の判定基準が用いられ得る。用いられた特徴には、1Mb分解能における全体CNA、1Mb分解能における全体メチル化密度およびCG島メチル化が含まれた。   To illustrate the potential of this approach, two sets of criteria (Group A and Group B) were used as an example to identify features useful for classifying plasma samples (see Table 6). ). In other embodiments, other criteria may be used to identify these features. Features used included global CNA at 1 Mb resolution, global methylation density at 1 Mb resolution, and CG island methylation.

第一の2つの例において、CNA、1Mb分解能における全体メチル化およびCG島メチル化特徴の全てが分類に用いられた。他の実施形態では、他の判定基準、例えば、限定はされないが、参照群の血漿における特徴を測定する精度が用いられ得る。   In the first two examples, CNA, global methylation at 1 Mb resolution and CG island methylation features were all used for classification. In other embodiments, other criteria may be used, such as, but not limited to, the accuracy of measuring characteristics in the plasma of the reference group.

図52Aは、355のCNA、584の1Mb分解能における全体メチル化特徴および110のCG島のメチル化状態を含む1,130のA群特徴の全てを用いる、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。上側のカラーバーは試料群を表しており:緑色、青色および赤色は、それぞれ、健常対象、HCCがん患者および非HCCがん患者を表している。概して、前記3つの対象群は共にクラスター化する傾向があった。縦軸は分類特徴を表している。異なる対象間で類似のパターンを有する特徴は一緒にクラスター化された。これらの結果は、血漿におけるCG島メチル化変化、1Mb分解能におけるゲノムワイドなメチル化変化およびCNAのパターンが、潜在的に、原発不明である患者におけるがんの起源を特定するのに用いられ得ることを示唆している。   FIG. 52A shows HCC patients, non-HCC cancer patients and healthy subjects, using all of the CNAs of 355, global methylation characteristics at 1 Mb resolution of 584 and group A characteristics of 1,130 including the methylation status of 110 CG islands. 3 shows a hierarchical clustering analysis for plasma samples obtained from control patients. The upper color bars represent sample groups: green, blue and red represent healthy subjects, HCC cancer patients and non-HCC cancer patients, respectively. Overall, the three subject groups tended to cluster together. The vertical axis represents classification characteristics. Features with similar patterns among different subjects were clustered together. These results indicate that CG island methylation changes in plasma, genome-wide methylation changes at 1 Mb resolution, and patterns of CNAs could be used to identify the origin of cancer in potentially unknown primary patients. Suggests that.

図52Bは、759のCNA、1,911の1Mb分解能における全体メチル化および191のCG島のメチル化状態を含む2,780のB群特徴の全てを用いる、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。上側のカラーバーは試料群を表しており:緑色、青色および赤色は、それぞれ、健常対象、HCCがん患者および非HCCがん患者を表している。概して、前記3つの対象群は一緒にクラスター化する傾向があった。縦軸は分類特徴を表している。異なる対象間で類似のパターンを有する特徴は一緒にクラスター化された。これらの結果は、血漿におけるCG島メチル化変化、1Mb分解能におけるゲノムワイドなメチル化変化およびCNAの様々な集合のパターンが、原発不明である患者におけるがんの起源を特定するのに用いられ得ることを示唆している。分類特徴の選択は特定の適用のために調整され得る。さらに、様々ながん型についての対象の事前確率に応じて、がん型予測には加重が加えられ得る。例えば、ウイルス性慢性肝炎を有する患者は、肝細胞癌を発達させる傾向があり、常習的喫煙者は肺がんを発達させる傾向がある。従って、がん型の加重された確率は、例えば、限定はされないが、ロジスティック回帰、重回帰、またはクラスタリング回帰を用いて、算出され得る。   Figure 52B shows HCC patients, non-HCC cancer patients and all 2,780 Group B features, including 759 CNAs, 1,911 global methylation at 1 Mb resolution and 191 CG island methylation status. 3 shows a hierarchical clustering analysis for plasma samples obtained from healthy control patients. The upper color bars represent sample groups: green, blue and red represent healthy subjects, HCC cancer patients and non-HCC cancer patients, respectively. In general, the three subject groups tended to cluster together. The vertical axis represents classification characteristics. Features with similar patterns among different subjects were clustered together. These results show that patterns of CG island methylation changes in plasma, genome-wide methylation changes at 1 Mb resolution, and various assembly of CNAs can be used to identify the origin of cancer in patients with unknown primary. Suggests that. The selection of classification features can be tailored for a particular application. In addition, cancer type predictions may be weighted depending on the prior probabilities of the subject for different cancer types. For example, patients with chronic viral hepatitis tend to develop hepatocellular carcinoma and addictive smokers tend to develop lung cancer. Thus, the cancer type weighted probabilities can be calculated using, for example, without limitation, logistic regression, multiple regression, or clustering regression.

他の実施形態では、1種類の特徴が分類解析に用いられ得る。例えば、以下の例では、1Mb分解能における全体メチル化のみ、CG島高度メチル化のみまたは1Mb分解能におけるCNAのみが、階層クラスタリング解析に用いられる。区別能力は、異なる特徴が用いられた場合、異なり得る。分類特徴の特徴細分化によて、潜在的に、分類精度が向上され得る。   In other embodiments, one type of feature may be used for classification analysis. For example, in the following example, only global methylation at 1 Mb resolution, only CG island hypermethylation or only CNA at 1 Mb resolution is used for hierarchical clustering analysis. The distinguishing ability can be different if different features are used. Feature refinement of classification features can potentially improve classification accuracy.

図53Aは、A群CG島メチル化特徴を用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。概して、がん患者は一緒にクラスター化し、非がん対象別のクラスターに含まれた。しかし、HCC患者および非HCC患者は、3種全ての特徴を用いた場合と比較して、それほど分離されなかった。   Figure 53A shows a hierarchical clustering analysis for plasma samples from HCC patients, non-HCC cancer patients and healthy control patients using the Group A CG island methylation feature. In general, cancer patients were clustered together and included in non-cancer subjects. However, HCC and non-HCC patients were less segregated compared to using all three characteristics.

図53Bは、1Mb分解能におけるA群全体メチル化密度を分類特徴として用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。HCC患者および非HCC患者の優先的なクラスタリングが観察された。   FIG. 53B shows a hierarchical clustering analysis for plasma samples from HCC patients, non-HCC cancer patients and healthy control patients using group A global methylation density at 1 Mb resolution as the classification feature. A preferential clustering of HCC and non-HCC patients was observed.

図54Aは、1Mb分解能におけるA群全体CNAを分類特徴として用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。HCC患者および非HCC患者の優先的なクラスタリングが観察された。   FIG. 54A shows a hierarchical clustering analysis for plasma samples obtained from HCC patients, non-HCC cancer patients and healthy control patients using Group A whole CNAs at 1 Mb resolution as the classification feature. A preferential clustering of HCC and non-HCC patients was observed.

図54Bは、B群CG島メチル化密度を分類特徴として用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。HCC患者および非HCCがん患者の優先的なクラスタリングが観察され得た。   FIG. 54B shows a hierarchical clustering analysis for plasma samples from HCC patients, non-HCC cancer patients and healthy control patients using Group B CG island methylation density as a classification feature. A preferential clustering of HCC and non-HCC cancer patients could be observed.

図55Aは、B群1Mb分解能における全体メチル化密度を分類特徴として用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。HCC患者および非HCCがん患者の優先的なクラスタリングが観察され得た。   FIG. 55A shows a hierarchical clustering analysis for plasma samples from HCC patients, non-HCC cancer patients and healthy control patients, using global methylation density at Group 1 Mb resolution as a classification feature. A preferential clustering of HCC and non-HCC cancer patients could be observed.

図55Bは、B群1Mb分解能における全体CNAを分類特徴として用いた、HCC患者、非HCCがん患者および健常対照患者から得られた血漿試料に対する、階層クラスタリング解析を示している。HCC患者および非HCCがん患者の優先的なクラスタリングが観察され得た。   FIG. 55B shows a hierarchical clustering analysis for plasma samples obtained from HCC patients, non-HCC cancer patients and healthy control patients using global CNA at Group B 1 Mb resolution as the classification feature. A preferential clustering of HCC and non-HCC cancer patients could be observed.

血漿試料に対するこれらの階層クラスタリングの結果は、異なる特徴の組み合わせが潜在的に原発性癌型の特定に用いられ得ることを示唆している。選択判定基準のさらなる細分化により、分類の精度がさらに向上され得る。   The results of these hierarchical clusterings on plasma samples suggest that different feature combinations could potentially be used for primary cancer type identification. The accuracy of classification can be further improved by further subdividing the selection criterion.

従って、一実施形態では、メチル化分類が生物にがんが存在することを示す場合、生物に関連するがん型は、メチル化レベル(例えば、方法2800からの第一のメチル化またはあらゆる領域メチル化レベル)を、他の生物(すなわち、ヒト等の同種の他の生物)から決定された対応する値と比較することによって、特定され得る。対応する値は、メチル化レベルが算出された、同一領域または一連の部位の値であり得る。少なくとも2つの他の生物が異なるがん型を有すると特定される。例えば、対応する値はクラスターへと組織化され得、ここで、2つのクラスターは異なるがんと関連している。   Thus, in one embodiment, if the methylation classification indicates that a cancer is present in the organism, the cancer type associated with the organism is the methylation level (eg, the first methylation or any region from method 2800). Methylation level) can be determined by comparing the corresponding values determined from other organisms (ie other organisms of the same species, such as humans). The corresponding value can be the value of the same region or series of sites where the methylation level was calculated. At least two other organisms are identified as having different cancer types. For example, the corresponding values can be organized into clusters, where the two clusters are associated with different cancers.

さらに、がんのレベルの第三の分類を得るためにCNAおよびメチル化が共に用いられる場合、CNAおよびメチル化の特徴は、他の生物から得られた対応する値と比較され得る。例えば、欠失または増幅を示す領域の第一の量(例えば、図36からの)が、他の生物から決定された対応する値と比較されて、該生物と関連するがん型が特定され得る。   Furthermore, when CNA and methylation are used together to obtain a third classification of cancer levels, the CNA and methylation characteristics can be compared to corresponding values obtained from other organisms. For example, a first amount of regions exhibiting deletions or amplifications (eg, from Figure 36) is compared to corresponding values determined from other organisms to identify cancer types associated with that organism. obtain.

いくつかの実施形態において、メチル化特徴は、ゲノムの複数の領域の領域メチル化レベルである。それぞれの領域カットオフ値を超過する領域メチル化レベルを有することが決定された領域が、用いられ得、例えば、生物の領域メチル化レベルは、ゲノムの同一領域において、他の生物の領域メチル化レベルと比較され得る。比較によって、がん型の区別が可能となり得、あるいは、がんを確認するための(例えば、偽陽性を特定するための)追加のフィルターが与えられ得る。従って、生物が、第一のがん型、がんの非存在、または第二のがん型を有しているかどうかが、比較に基づいて決定され得る。   In some embodiments, the methylation characteristic is regional methylation level of multiple regions of the genome. Regions that have been determined to have regional methylation levels that exceed their respective regional cutoff values can be used, for example, the regional methylation level of an organism is the regional methylation of another organism in the same region of the genome. Can be compared to the level. The comparison may allow cancer type discrimination, or may provide an additional filter to identify cancer (eg, to identify false positives). Thus, whether the organism has the first cancer type, the absence of cancer, or the second cancer type can be determined based on the comparison.

他の生物は(検査を受けている生物と一緒に)、領域メチル化レベルを用いて、クラスタリングされ得る。従って、領域メチル化レベルの比較は、どのクラスターに生物が属するかを決定するために用いられ得る。クラスタリングでは、上記の通り、欠失または増幅を示すことが決定された領域のCNA正規化数も用いられ得る。そして、クラスタリングでは、高度メチル化されたCG島のそれぞれのメチル化密度が用いられ得る。   Other organisms (along with the organism under test) can be clustered using regional methylation levels. Therefore, comparison of regional methylation levels can be used to determine which cluster an organism belongs to. Clustering may also use the CNA normalized number of regions determined to exhibit deletions or amplifications, as described above. The clustering may then use the methylation density of each of the hypermethylated CG islands.

この方法の原理を説明するために、2つの未知の試料の分類に対しロジスティック回帰を用いる例が示される。この分類の目的は、これら2つの試料がHCCであるかまたは非HCCがんであるかを決定することであった。HCC患者から採取された23の血漿試料およびHCC以外のがんを有する患者から採取された18の試料を含んだ、訓練試料セットが収集された。従って、訓練セットには合計41の症例が存在した。この例において、CG島のメチル化に関する5つの特徴(X1〜X5)、1Mb領域のメチル化に関する6つの特徴(X6〜X11)および1Mb領域のCNAに関する2つの特徴(X12〜X13)を含む、13の特徴が選択された。CpGメチル化特徴が、3超または−3未満のZ値を有する訓練セット中の少なくとも15の症例の判定基準に基づいて、選択された。1Mbメチル化特徴が、3超または−3未満のZ値を有する訓練セット中の少なくとも39の症例の判定基準に基づいて、選択された。CNA特徴が、3超または−3未満のZ値を有する少なくとも20の症例の判定基準に基づいて、選択された。この訓練セットの試料に対してロジスティック回帰が行われ、各特徴(X1〜X13)の回帰係数が決定された。より大きな規模の回帰係数を有する特徴(肯定的な意味または否定的な意味であるかにかかわらず)によって、HCC試料および非HCC試料間のより良好な区別が得られる。各特徴における各症例のZ値が、独立変数の入力値として用いられた。次に、一方はHCC患者(TBR36)由来、他方は肺がんを有する患者(TBR177)由来の2つの血漿試料が、13の特徴について解析された。   To illustrate the principle of this method, an example using logistic regression for the classification of two unknown samples is shown. The purpose of this classification was to determine if these two samples were HCC or non-HCC cancer. A training sample set was collected that included 23 plasma samples taken from HCC patients and 18 samples taken from patients with cancers other than HCC. Therefore, there were a total of 41 cases in the training set. In this example, five features for CG island methylation (X1-X5), six features for 1 Mb region methylation (X6-X11) and two features for 1 Mb region CNA (X12-X13) are included, Thirteen features were selected. CpG methylation features were selected based on the criteria of at least 15 cases in the training set with Z values greater than 3 or less than -3. A 1 Mb methylation feature was selected based on the criteria of at least 39 cases in the training set with Z values greater than 3 or less than -3. CNA features were selected based on criteria for at least 20 cases with Z values greater than 3 or less than -3. Logistic regression was performed on the samples in this training set to determine the regression coefficient for each feature (X1-X13). Features with regression coefficients of greater magnitude (whether positive or negative) give better discrimination between HCC and non-HCC samples. The Z value for each case in each feature was used as the input value for the independent variable. Next, two plasma samples, one from an HCC patient (TBR36) and the other from a patient with lung cancer (TBR177), were analyzed for 13 features.

このがん型分類解析において、これら2つの試料は、原発不明のがんを有する患者から採取されたと仮定された。各試料において、各特徴のZ値がロジスティック回帰式に入力されて、オッズ比の自然対数(ln(オッズ比))が決定され、ここで、オッズ比は、HCCを有する確率およびHCCを有さない確率の比(HCC/非HCC)を表す。   In this cancer typing analysis, it was hypothesized that these two samples were taken from patients with cancers of unknown primary. In each sample, the Z value of each feature is input to a logistic regression equation to determine the natural logarithm of the odds ratio (ln (odds ratio)), where the odds ratio has the probability of having HCC and HCC. Represents the ratio of no probabilities (HCC / non-HCC).

表7は、ロジスティック回帰式の13の特徴における回帰係数を示している。2つの検査症例(TBR36およびTBR177)の各特徴のZ値も示される。TBR36およびTBR177のHCCのln(オッズ比)は、それぞれ、37.03および−4.37であった。これらのオッズ比から、血漿試料がHCC患者から採取された可能性は、それぞれ、99.9%超および1%と算出された。要約すれば、TBR36はHCC患者から採取された試料である可能性が高く、一方、TBR177はHCC患者から採取された試料である可能性が低かったということである。   Table 7 shows the regression coefficients for the 13 features of the logistic regression equation. The Z values for each feature of the two examined cases (TBR36 and TBR177) are also shown. The HCC ln (odds ratio) of TBR36 and TBR177 were 37.03 and -4.37, respectively. From these odds ratios, the likelihood that plasma samples were taken from HCC patients was calculated to be> 99.9% and 1%, respectively. In summary, TBR36 was likely to be a sample taken from HCC patients, while TBR177 was unlikely to be a sample taken from HCC patients.

他の実施形態では、階層クラスタリング回帰、分類木解析および他の回帰モデルが、がんの可能性のある原発部位を決定するために、用いられ得る。   In other embodiments, hierarchical clustering regression, classification tree analysis and other regression models can be used to determine potential cancer primary sites.

XII. 材料および方法
A. 亜硫酸水素塩処理DNAライブラリーの作製および配列決定
0.5%(w/w)非メチル化λDNA(プロメガ社)を加えられたゲノムDNA(5μg)を、Covaris S220 System(コバリス社(Covaris))でおよそ200bp長に断片化した。メチル化されたアダプター(イルミナ社)をDNA断片にライゲーションした以外は製造業者の取扱説明書に従い、Paired−End Sequencing Sample Preparation Kit(イルミナ社)を用いて、DNAライブラリーを作製した。AMPure XP磁気ビーズ(ベックマン・コールター社)を用いた2回の精製の後、ライゲーション産物を2つの部分に分割し、その一方を、EpiTect Bisulfite Kit(キアゲン社)を用いる2回の亜硫酸水素塩修飾にかけた。インサート内のCpG部位における非メチル化シトシンをウラシルに変換し、メチル化シトシンはそのままにした。亜硫酸水素ナトリウムで処理された、または処理されていないアダプター連結DNA分子を、以下のレシピを用いて10サイクルのPCRで富化した:50μlの反応液中の2.5UのPfuTurboCxホットスタートDNAポリメラーゼ(アジレント・テクノロジー社)、1×PfuTurboCx反応緩衝液、25μMのdNTP、1μlのPCR Primer PE 1.0および1μlのPCR Primer PE 2.0(イルミナ社)。熱サイクルプロファイルは、95℃を2分間、98℃を30秒間 、次に98℃を15秒間、60℃を30秒間および72℃を4分間の10サイクル、そして最終ステップである72℃を10分間であった(R Lister, et al. 2009 Nature; 462: 315-322)。AMPure XP磁気ビーズを用いてPCR産物を精製した。
XII. Materials and Methods A. Preparation and sequencing of bisulfite-treated DNA library Genomic DNA (5 μg) supplemented with 0.5% (w / w) unmethylated λDNA (Promega) was used as Covaris S220 System (Covaris). Fragmented to approximately 200 bp. A DNA library was prepared using the Paired-End Sequencing Sample Preparation Kit (Illumina) according to the manufacturer's instruction manual, except that the methylated adapter (Illumina) was ligated to the DNA fragment. After two rounds of purification with AMPure XP magnetic beads (Beckman Coulter), the ligation product was split into two parts, one of which was twice bisulfite modified with EpiTect Bisulfite Kit (Qiagen). I went to Unmethylated cytosine at the CpG site in the insert was converted to uracil, leaving methylated cytosine intact. Adapter-ligated DNA molecules treated with or without sodium bisulfite were enriched in 10 cycles of PCR using the following recipe: 2.5 U of PfuTurboCx hot start DNA polymerase (50 μl reaction). (Agilent Technology), 1 × PfuTurboCx reaction buffer, 25 μM dNTP, 1 μl PCR Primer PE 1.0 and 1 μl PCR Primer PE 2.0 (Illumina). The thermal cycle profile was 95 ° C for 2 minutes, 98 ° C for 30 seconds, then 98 ° C for 15 seconds, 60 ° C for 30 seconds and 72 ° C for 4 minutes for 10 cycles, and the final step 72 ° C for 10 minutes. (R Lister, et al. 2009 Nature; 462: 315-322). PCR products were purified using AMPure XP magnetic beads.

3.2〜4mlの母体血漿試料から抽出された血漿DNAを、断片化λDNA(血漿1mlあたり25pg)でスパイクし、上記のようなライブラリー構築にかけた(RWK Chiu et al. 2011 BMJ; 342: c7401)。メチル化されたアダプターにライゲーションした後、ライゲーション産物を2等分に分割し、一方の部分を2回の亜硫酸水素塩修飾にかけた。亜硫酸水素塩処理されたまたは未処理のライゲーション産物を次に、10サイクルのPCRで上記のように富化した。   Plasma DNA extracted from 3.2-4 ml maternal plasma samples was spiked with fragmented lambda DNA (25 pg / ml plasma) and subjected to library construction as described above (RWK Chiu et al. 2011 BMJ; 342: c7401). After ligation to the methylated adapter, the ligation product was split into two equal parts and one part was subjected to two bisulfite modifications. The bisulfite treated or untreated ligation product was then enriched as above with 10 cycles of PCR.

亜硫酸水素塩処理されたまたは未処理のDNAライブラリーを、HiSeq2000装置(イルミナ社)上で、ペアエンド形式で、75bpについて配列決定した。cBot装置(イルミナ社)上でPaired−End Cluster Generation Kit v3を用いて、DNAクラスターを作製した。HiSeq Control Software(HCS)v1.4およびReal Time Analysis(RTA)Software v1.13(イルミナ社)を用いてリアルタイム画像解析およびベースコールを行い、これにより、自動マトリックスおよび位相計算は、DNAライブラリーを用いて配列決定された、中にスパイクされたPhiX control v3に基づかれた。   The bisulfite treated or untreated DNA library was sequenced on a HiSeq 2000 instrument (Illumina) in paired-end format for 75 bp. A DNA cluster was prepared using a Paired-End Cluster Generation Kit v3 on a cBot device (Illumina). Real-time image analysis and base calling were performed using HiSeq Control Software (HCS) v1.4 and Real Time Analysis (RTA) Software v1.13 (Illumina), whereby the automatic matrix and phase calculation performed on the DNA library. Based on PhiX control v3, spiked in, sequenced using.

B. 配列アラインメントおよびメチル化シトシンの特定
ベースコールの後、断片末端のアダプター配列および低クオリティ塩基(low quality base)(すなわち、クオリティスコアが20未満)が除去された。FASTQ形式のトリミングされたリードは次に、Methy−Pipeと称されるメチル化データ解析パイプラインによって処理された(IEEE International Conference on Bioinformatics and Biomedicine Workshops(香港、2010年12月18〜21日)で発表された論文である、P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis)。亜硫酸水素塩変換した配列決定リードを整列させるために、最初に、参照ヒトゲノム(NCBI build 36/hg18)を用いて、ワトソン鎖およびクリック鎖上で別々に、全シトシン残基のチミンへのインシリコ変換が行われた。次に、処理された全てのリードにおいて各シトシンのチミンへのインシリコ変換が行われ、それぞれの変換された残基の位置情報が保持された。SOAP2R Li, et al. 2009 Bioinformatics; 25: 1966-1967)が、変換されたリードを2つの事前変換された参照ヒトゲノムに整列させるために用いられ、最高2つのミスマッチが整列されたリードのそれぞれに許された。ユニークなゲノム位置にマッピング可能なリードのみが、選択された。ワトソン鎖およびクリック鎖の両方にマッピングされるあいまいなリード、並びに同一の開始および終止ゲノム位置を有する重複(クローン)リードは排除された。600bp以下のインサートサイズを有する配列決定されたリードが、メチル化解析およびサイズ解析のために保持された。
B. After sequence alignment and methylated cytosine specific base call, the fragment end adapter sequences and low quality bases (ie, quality score <20) were removed. Trimmed reads in FASTQ format were then processed by a methylation data analysis pipeline called Methy-Pipe (IEEE International Conference on Bioinformatics and Biomedicine Workshops, Hong Kong, December 18-21, 2010). P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis). To align the bisulfite-converted sequencing reads, first in silico conversion of all cytosine residues to thymine separately on the Watson and Crick strands using the reference human genome (NCBI build 36 / hg18). Was done. Next, in silico conversion of each cytosine to thymine was performed in all processed reads, and positional information of each converted residue was retained. SOAP2R Li, et al. 2009 Bioinformatics; 25: 1966-1967) was used to align the converted reads to two pre-converted reference human genomes, with up to two mismatches in each of the aligned reads. Forgiven Only reads that could be mapped to unique genomic locations were selected. Ambiguous reads that map to both the Watson and Crick strands as well as duplicate (clone) reads with identical start and stop genomic positions were excluded. Sequenced reads with insert sizes of 600 bp or less were retained for methylation and size analysis.

CpGジヌクレオチド配列内のシトシン残基は、下流DNAメチル化研究の主な標的であった。アライメントの後、配列決定されたリード上に元々存在したシトシンは、インシリコ変換中に保持された位置情報に基づいて、回復された。CpGジヌクレオチド中の回復されたシトシンは、メチル化状態としてスコアリングされた。CpGジヌクレオチド中のチミンは、非メチル化状態としてスコアリングされた。ライブラリー作製中に含まれる非メチル化λDNAは、亜硫酸水素ナトリウム修飾の効率を推定するための内部標準として機能した。亜硫酸水素塩変換効率が100%であるならば、λDNA上のシトシンは全て、チミンに変換されているはずである。   Cytosine residues within the CpG dinucleotide sequence have been the main target for downstream DNA methylation studies. After alignment, the cytosines originally present on the sequenced reads were recovered based on the positional information retained during the in silico conversion. Recovered cytosines in CpG dinucleotides were scored as methylated. Thymine in the CpG dinucleotide was scored as an unmethylated state. The unmethylated λ DNA included during library construction served as an internal standard to estimate the efficiency of sodium bisulfite modification. If the bisulfite conversion efficiency is 100%, then all the cytosines on λDNA should be converted to thymine.

XIII. 概要
本明細書に記載の実施形態の使用により、例えば対象の血漿を用いた、がんの非侵襲的な検診、検出、モニタリングまたは予後判定が可能となる。母体血漿から得られる胎児DNAのメチル化特性を推定することにより、胎児の出生前の検診、診断、調査またはモニタリングの実行も可能となる。本アプローチの能力を説明するために、胎盤組織の研究を通じ従来法で得られた情報が、母体血漿から直接的に評価され得ることが示された。例えば、遺伝子座の刷り込み状態、胎児DNAおよび母体DNA間で示差的なメチル化を有する遺伝子座の特定、並びに遺伝子座のメチル化特性における妊娠性変動が、母体血漿DNAの直接的な解析を通じて達成される。本アプローチの主な利点は、胎児メチロームを、妊娠に対する混乱または胎児組織の浸潤的試料採取の必要無しに、妊娠中に、包括的に評価できることである。DNAメチル化状態の変化および多くの妊娠関連状態の間の既知の関連性を考慮すると、本研究において記載されるアプローチは、それらの状態における生物マーカーの病態生理の調査およびそれらの生物マーカーの特定のための、重要な手段として機能し得る。刷り込み遺伝子座に焦点を当てることにより、父系伝達性の胎児メチル化特性および母系伝達性の胎児メチル化特性の両方が、母体血漿から評価可能であることが示された。このアプローチは、刷り込み疾患の研究に潜在的に有用であり得る。実施形態は、胎児疾患または妊娠関連疾患の出生前評価に直接適用することもできる。
XIII. Overview The use of the embodiments described herein allows for non-invasive screening, detection, monitoring or prognosis of cancer, eg, with plasma of a subject. Estimating the methylation properties of fetal DNA obtained from maternal plasma also allows prenatal screening, diagnosis, investigation or monitoring of the fetus to be performed. To illustrate the power of this approach, it was shown that the information previously obtained through placental tissue studies can be evaluated directly from maternal plasma. For example, imprinted status of loci, identification of loci with differential methylation between fetal and maternal DNA, and gestational variation in the methylation characteristics of loci have been demonstrated through direct analysis of maternal plasma DNA. To be achieved. The main advantage of this approach is that the fetal methylome can be comprehensively evaluated during pregnancy without the need for confusion with pregnancy or invasive sampling of fetal tissue. Given the changes in DNA methylation status and the known associations between many pregnancy-related conditions, the approach described in this study was designed to investigate the pathophysiology of biomarkers in those conditions and identify those biomarkers. Can serve as an important means for By focusing on imprinted loci, it was shown that both paternally transmitted fetal and maternally transmitted fetal methylation properties can be evaluated from maternal plasma. This approach could potentially be useful in the study of imprinted disease. Embodiments can also be directly applied to prenatal assessment of fetal or pregnancy related disorders.

ゲノムワイド亜硫酸水素塩配列決定が、胎盤組織のDNAメチル化特性の研究に適用できることが示された。ヒトゲノム内にはおよそ28MのCpG部位が存在する(C Clark et al. 2012 PLoS One; 7: e50233)。CVSおよび妊娠末期胎盤組織検体の亜硫酸水素塩配列決定データは、CpGの80%超を被覆した。これは、他のハイスループットなプラットフォームを用いて達成できるものよりも、実質的により広い被覆率を表す。例えば、胎盤組織に関する先の研究(T Chu et al. 2011 PLoS One; 6: e14723)において用いられたイルミナ社製Infinium HumanMethylation 27Kビーズチップアレイは、ゲノム内のCpGのうちの0.1%を被覆したのみであった。より最近になって利用可能になったイルミナ社製Infinium HumanMethylation 450Kビーズチップアレイは、CpGの1.7%を被覆したのみであった(C Clark et al. 2012 PLoS One; 7: e50233)。MPSアプローチはプローブ設計、ハイブリダイゼーション効率または抗体捕捉の強度に関する制限が無いため、CG島内外の、および大部分の配列構成内のCpGを評価することができた。   It has been shown that genome-wide bisulfite sequencing can be applied to study the DNA methylation properties of placental tissues. There are approximately 28 M CpG sites in the human genome (C Clark et al. 2012 PLoS One; 7: e50233). Bisulfite sequencing data for CVS and late pregnancy placental tissue specimens covered more than 80% of CpG. This represents a substantially wider coverage than can be achieved with other high throughput platforms. For example, the Illumina Infinium HumanMethylation 27K bead chip array used in the previous study on placental tissue (T Chu et al. 2011 PLoS One; 6: e14723) covers 0.1% of CpG in the genome. It was only done. More recently available the Illumina Infinium HumanMethylation 450K bead chip array only coated 1.7% of CpG (C Clark et al. 2012 PLoS One; 7: e50233). Since the MPS approach has no restrictions on probe design, hybridization efficiency or strength of antibody capture, it was possible to evaluate CpG in and out of CG islands and within most sequence configurations.

XIV. コンピューターシステム
本明細書において言及されたコンピューターシステムのいずれも、あらゆる適切な数のサブシステムを利用し得る。そのようなサブシステムの例は、コンピューターデバイス3300において、図33に示される。いくつかの実施形態において、コンピューターシステムには、サブシステムが構成要素であり得る単一のコンピューターデバイスが含まれ得る。他の実施形態では、コンピューターシステムには、それぞれが内部構成要素を有するサブシステムである、複数のコンピューターデバイスが含まれ得る。
XIV. Computer System Any of the computer systems mentioned herein may utilize any suitable number of subsystems. An example of such a subsystem is shown in FIG. 33 at computing device 3300. In some embodiments, a computer system may include a single computer device, subsystems of which may be components. In other embodiments, a computer system may include multiple computer devices, each subsystem having internal components.

図33に示されるサブシステムは、システムバス3375を介して相互接続される。プリンター3374、キーボード3378、記憶デバイス3379、ディスプレイアダプター3382と連結されたモニター3376等の追加のサブシステムが示されている。I/O制御デバイス3371に連結された周辺デバイスおよび入出力(I/O)デバイスは、シリアルポート3377等の当該技術分野において既知のいかなる数の手段によっても、コンピューターシステムに連結され得る。例えば、シリアルポート3377または外部インターフェース3381(例えば、イーサネット、Wi−Fi等)が用いられて、コンピューターシステム3300はインターネット等の広域ネットワーク、マウス入力デバイス、またはスキャナーに連結され得る。システムバス3375を介した相互接続は、中央処理デバイス3373が各サブシステムと通信し、システムメモリ3372または記憶デバイス3379(例えば、固定ディスク)からの指示の実行、およびサブシステム間の情報の交換を制御することを可能にする。システムメモリ3372および/または記憶デバイス3379は、コンピューター可読媒体を包含していてもよい。本明細書に記載される値のいずれも、ある構成要素から別の構成要素に出力可能であり、使用者に出力可能である。   The subsystems shown in FIG. 33 are interconnected via a system bus 3375. Additional subsystems such as a printer 3374, a keyboard 3378, a storage device 3379, a monitor 3376 coupled with a display adapter 3382 are shown. Peripheral devices and input / output (I / O) devices coupled to I / O control device 3371 may be coupled to the computer system by any number of means known in the art, such as serial port 3377. For example, serial port 3377 or external interface 3381 (eg, Ethernet, Wi-Fi, etc.) may be used to couple computer system 3300 to a wide area network such as the Internet, a mouse input device, or a scanner. Interconnects via the system bus 3375 allow the central processing device 3373 to communicate with each subsystem, execute instructions from the system memory 3372 or storage device 3379 (eg, fixed disk), and exchange information between subsystems. Allows you to control. System memory 3372 and / or storage device 3379 may include computer-readable media. Any of the values described herein can be output from one component to another and can be output to the user.

コンピューターシステムは、例えば、外部インターフェース3381によって、または内部インターフェースによって相互接続された、複数の同一の構成要素またはサブシステムを含み得る。いくつかの実施形態において、コンピューターシステム、サブシステム、または装置は、ネットワーク上で通信し得る。そのような装置において、あるコンピューターはクライアントと見なされ得、別のコンピューターはサーバーと見なされ得、ここで、それぞれは同一のコンピューターシステムの一部であり得る。クライアントおよびサーバーは、それぞれ複数のシステム、サブシステム、または構成要素を含み得る。   A computer system may include multiple identical components or subsystems interconnected by, for example, an external interface 3381 or an internal interface. In some embodiments, computer systems, subsystems, or devices may communicate over a network. In such a device, one computer may be considered a client and another computer may be considered a server, where each may be part of the same computer system. The client and server may each include multiple systems, subsystems, or components.

本発明の実施形態のいずれも、ハードウェア(例えば、特定用途向け集積回路またはフィールド・プログラマブル・ゲート・アレイ)、および/または一般的にプログラム可能なプロセッサを有するコンピュータソフトウェアをモジュール様式または集積様式で用いて、制御論理の形態で実行され得ることが理解されよう。本明細書における使用者として(as user herein)、プロセッサには、マルチコア・プロセッサもしくは同一の集積チップ、または単一の回路基盤もしくはネットワーク接続基盤上の複数の処理装置が含まれる。本明細書に記載される開示および教示に基づいて、当業者は、ハードウェア並びにハードウェアおよびソフトウェアの組み合わせを用いて本発明の実施形態を実行するための他のやり方および/または方法を知り、理解するであろう。   Any of the embodiments of the invention include hardware (eg, an application specific integrated circuit or field programmable gate array) and / or computer software having a generally programmable processor in a modular or integrated fashion. It will be appreciated that the implementation can be used in the form of control logic. As used herein, a processor includes a multi-core processor or the same integrated chip, or multiple processing units on a single circuit board or network connection board. Based on the disclosure and teachings provided herein, those of ordinary skill in the art will be aware of other ways and / or methods for implementing embodiments of the invention using hardware and combinations of hardware and software. You will understand.

本願に記載されるソフトウェアコンポーネントまたは機能のいずれも、例えば、従来のまたはオブジェクト指向の技術を用いて、例えば、Java、C++またはPerl等のあらゆる適切なコンピューター言語を用いて、プロセッサによって実行されるようコードされたソフトウェアとして、実行され得る。コードされたソフトウェアは、保存および/または伝達のためにコンピューター可読媒体上に一連の指示または命令として保存され得、適切な媒体には、読み書き可能メモリ(RAM)、読出し専用メモリ(ROM)、ハードドライブもしくはフロッピーディスク等の磁気媒体、またはコンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)等の光媒体、フラッシュメモリー等が含まれる。コンピューター可読媒体は、そのような保存または伝達デバイスのいかなる組み合わせであってもよい。   Any of the software components or functionality described herein may be implemented by a processor, eg, using conventional or object oriented techniques, eg, any suitable computer language such as Java, C ++ or Perl. It can be implemented as coded software. Coded software may be stored as a series of instructions or instructions on a computer-readable medium for storage and / or transmission, suitable medium including readable and writable memory (RAM), read only memory (ROM), hard disk. A magnetic medium such as a drive or a floppy disk, an optical medium such as a compact disk (CD) or a DVD (digital versatile disk), a flash memory and the like are included. Computer readable media can be any combination of such storage or communication devices.

そのようなプログラムはまた、インターネットを含む、種々のプロトコルに適合する有線、光、および/または無線ネットワークを介した伝達に適したキャリア信号を用いて、コード化および伝達され得る。従って、本発明の一実施形態に係るコンピューター可読媒体は、そのようなプログラムによってコード化されたデータ信号を用いて作製され得る。コードされたプログラムによってコード化されたコンピューター可読媒体は、互換デバイスとひとまとめにされ得るか、または他のデバイスとは別々に提供され得る(例えば、インターネットダウンロードを介して)。いかなるそのようなコンピューター可読媒体も、単一のコンピュータプログラム製品(例えば、ハードドライブ、CD、またはコンピューターシステム全体)上、またはその内部に存在し得、システムまたはネットワーク内の異なるコンピュータプログラム製品上またはその内部に存在し得る。コンピューターシステムには、モニター、プリンター、または本明細書に記載される結果のいずれかを使用者に提供するための他の適切なディスプレイが含まれ得る。   Such programs may also be coded and communicated using carrier signals suitable for transmission over wired, optical, and / or wireless networks compatible with various protocols, including the Internet. Therefore, a computer-readable medium according to an embodiment of the present invention can be made using a data signal encoded by such a program. Computer readable media encoded with the encoded program can be packaged with a compatible device or provided separately from other devices (eg, via Internet download). Any such computer-readable medium may reside on or within a single computer program product (eg, a hard drive, a CD, or an entire computer system), on a different computer program product in a system or network, or in that computer program product. Can be internal. The computer system can include a monitor, printer, or other suitable display for providing a user with any of the results described herein.

本明細書に記載の方法のいずれも、それらのステップを実行するように構成され得る一つまたは複数のプロセッサを含むコンピューターシステムを用いて、完全にまたは部分的に実行され得る。従って、実施形態は、各ステップまたは各ステップ群を実行する異なる構成要素を含み得る、本明細書に記載の方法のいずれかのステップを実行するように構成されたコンピューターシステムに関し得る。番号を付けたステップとして提供されているが、本明細書における方法のステップは、同時にまたは異なる順序で実行され得る。さらに、これらのステップの一部は、他の方法からの他のステップの一部と共に用いられ得る。また、ステップの全てまたは一部は任意であり得る。さらに、いずれの方法のいずれのステップも、これらのステップを実行するためのモジュール、回路、または他の手段を用いて、実行され得る。   Any of the methods described herein can be fully or partially performed with a computer system that includes one or more processors that can be configured to perform those steps. Accordingly, embodiments may relate to computer systems configured to perform any step of the methods described herein, which may include different components performing each step or groups of steps. Although provided as numbered steps, the method steps herein may be performed simultaneously or in different orders. Moreover, some of these steps may be used in conjunction with some of the other steps from other methods. Also, all or some of the steps may be optional. Moreover, any step of any method may be performed using modules, circuits, or other means for performing these steps.

特定の実施形態の具体的な詳細は、本発明の実施形態の精神および範囲から逸脱することなく、あらゆる適切な様式で、組み合わせられ得る。しかし、本発明の他の実施形態は、個々の態様、またはこれらの個々の態様の特定の組み合わせに関連する特定の実施形態に関し得る。   The specific details of the particular embodiments may be combined in any suitable manner without departing from the spirit and scope of the embodiments of the invention. However, other embodiments of the invention may relate to particular embodiments relating to particular aspects, or particular combinations of these individual aspects.

例示的な本発明の実施形態の上述の説明は、説明および解説を目的として提示されている。網羅的であること、または記載された正確な形態に本発明を限定することは意図されておらず、多くの変更形態および変形形態が上記の教示に照らし合わせて可能である。実施形態は、本発明の原理およびその実際の応用を最良に説明し、それにより他の当業者が、種々の実施形態で、および企図される特定の用途に適した種々の変更を加えて、本発明を最良に利用できるようにするために、選択および記述されている。   The foregoing description of the exemplary embodiments of the present invention has been presented for purposes of illustration and explanation. It is not intended to be exhaustive or to limit the invention to the precise form recited, and many modifications and variations are possible in light of the above teaching. The embodiments best explain the principles of the invention and its practical application so that others skilled in the art may make various modifications in various embodiments and appropriate for the particular application contemplated. It has been chosen and described in order to best utilize the invention.

「a」、「an」または「the」の記述は、特に記載がない限り、「一つまたは複数」を意味することが意図される。   References to "a", "an" or "the" are intended to mean "one or more" unless stated otherwise.

全ての特許、特許出願、刊行物、および本明細書で言及された記述は、あらゆる目的でそれら全体が参照によって組み込まれる。いずれも、先行技術であることを認めるものではない。   All patents, patent applications, publications, and statements mentioned herein are incorporated by reference in their entirety for all purposes. None of them admits to be prior art.

Claims (43)

生物の生物試料由来のセルフリーDNA分子を解析することによって癌種を決定する方法であって、
(a)生物試料由来のセルフリーDNA分子から配列リードを得るステップ、ここで、前記配列リードはセルフリーDNA分子の各々の1以上の部位でのメチル化状態を含み;
(b)複数の部位の各々でのメチル化セルフリーDNA分子数を決定するために前記配列リードを解析し、及び、セルフリーDNA分子における複数の部位のメチル化状態を単一ヌクレオチド分析で得るために当該数を使用するステップ;
(c)複数の部位のメチル化状態からメチル化特性を決定するステップ;及び
(d)少なくとも一部は、メチル化特性に基づいて、癌種を決定するステップ、ここで、癌種を決定することは、メチル化特性を1以上の参照メチル化特性と比較することを含み、1以上の参照メチル化特性の少なくとも1つは、癌を有することが知られている対象から得られた少なくとも1つの試料から得られる、
を含む、方法。
A method for determining a cancer type by analyzing a cell-free DNA molecule derived from a biological sample of an organism,
(A) obtaining a sequence read from a cell-free DNA molecule from a biological sample, wherein the sequence read comprises methylation status at one or more sites of each of the cell-free DNA molecules;
(B ) analyzing the sequence reads to determine the number of methylated cell-free DNA molecules at each of the multiple sites and obtaining the methylation status of the multiple sites in the cell-free DNA molecule by single nucleotide analysis Using the number to :
(C) determining a methylation property from methylation states of a plurality of sites; and (d) determining a cancer type based at least in part on the methylation property , wherein the cancer type is determined. Comprising comparing the methylation profile to one or more reference methylation profiles, wherein at least one of the one or more reference methylation profiles is at least 1 derived from a subject known to have cancer. Obtained from one sample,
Including the method.
前記生物試料が、血液、血漿、及び血清から成る群より選択される、請求項1に記載の方法。   The method of claim 1, wherein the biological sample is selected from the group consisting of blood, plasma, and serum. 前記生物試料が、尿、膣液、子宮又は膣洗い流し液(flushing fluid)、複数の体液、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、体液、及び便から成る群より選択される、請求項1に記載の方法。   The biological sample is a group consisting of urine, vaginal fluid, uterus or flushing fluid, multiple body fluids, ascites, cerebrospinal fluid, saliva, sweat, tears, sputum, bronchoalveolar lavage fluid, body fluid, and feces. The method of claim 1, selected from: 癌種が、癌が発症した臓器に基づく、請求項1〜3のいずれか1項に記載の方法。 The method according to claim 1, wherein the cancer type is based on an organ in which cancer has developed. 癌種が、癌の起源の組織に基づく、請求項1〜3のいずれか1項に記載の方法。 4. The method of any one of claims 1-3, wherein the cancer type is based on the tissue of origin of the cancer. 癌の起源の組織が、脳、骨、肺、心臓、腎臓、肝臓、乳房、結腸直腸、前立腺、鼻咽腔、胃、精巣、皮膚、卵巣、膵臓、子宮、及び膀胱から成る群より選択される、請求項5に記載の方法。   The tissue of cancer origin is selected from the group consisting of brain, bone, lung, heart, kidney, liver, breast, colorectal, prostate, nasopharynx, stomach, testis, skin, ovary, pancreas, uterus, and bladder. The method according to claim 5, wherein 癌種が、肺がん、乳がん、結腸直腸がん、前立腺がん、鼻咽腔がん、胃がん、精巣がん、皮膚がん、神経系に発症するがん、骨がん、卵巣がん、肝臓がん、造血器腫瘍、膵がん、子宮内膜癌、及び腎がんから成る群より選択される、請求項1〜6のいずれか1項に記載の方法。   Cancer types include lung cancer, breast cancer, colorectal cancer, prostate cancer, nasopharyngeal cancer, gastric cancer, testicular cancer, skin cancer, cancer that develops in nervous system, bone cancer, ovarian cancer, liver The method according to any one of claims 1 to 6, which is selected from the group consisting of cancer, hematopoietic tumor, pancreatic cancer, endometrial cancer, and renal cancer. 配列リードを得るためにセルフリーDNA分子を配列決定することを更に含む、請求項1〜7のいずれか1項に記載の方法。   8. The method of any one of claims 1-7, further comprising sequencing the cell-free DNA molecule to obtain a sequence read. 配列決定が、メチル化認識配列決定を含む、請求項8に記載の方法。   9. The method of claim 8, wherein the sequencing comprises methylation recognition sequencing. メチル化認識配列決定が、亜硫酸水素塩配列決定を含む、請求項9に記載の方法。   The method of claim 9, wherein methylation recognition sequencing comprises bisulfite sequencing. 亜硫酸水素塩配列決定が、ゲノムワイド亜硫酸水素塩配列決定を含む、請求項10に記載の方法。   11. The method of claim 10, wherein the bisulfite sequencing comprises genome-wide bisulfite sequencing. メチル化認識配列決定が、ペアエンド大規模並列亜硫酸水素塩配列決定又は全ゲノム配列決定を含む、請求項9〜11のいずれか1項に記載の方法。 12. The method of any one of claims 9-11, wherein the methylation recognition sequencing comprises paired -end massively parallel bisulfite sequencing or whole genome sequencing. 配列決定の前に、セルフリーDNA分子の豊富化を更に含む、請求項8〜12のいずれか1項に記載の方法。   13. The method of any one of claims 8-12, further comprising enrichment for cell-free DNA molecules prior to sequencing. 豊富化が、ハイブリダイゼーションプローブの使用、ポリメラーゼ連鎖反応増幅、又は固相ハイブリダイゼーションを含む、請求項13に記載の方法。   14. The method of claim 13, wherein the enrichment comprises the use of hybridization probes, polymerase chain reaction amplification, or solid phase hybridization. 複数の部位が、1以上のCpG部位を含む、請求項1〜14のいずれか1項に記載の方法。   15. The method of any one of claims 1-14, wherein the plurality of sites comprises one or more CpG sites. 複数の部位が、1以上のCpG島に体系づけられる1以上のCpG部位を含む、請求項1〜15のいずれか1項に記載の方法。   16. The method of any one of claims 1-15, wherein the plurality of sites comprises one or more CpG sites organized into one or more CpG islands. 複数の部位のメチル化特性を決定することが、1以上のCpG島での配列リードから決定されたメチル化状態を用いて、1以上のCpG島のメチル化密度を計算することを含む、請求項16に記載の方法。   Determining the methylation profile of multiple sites comprises calculating the methylation density of one or more CpG islands using the methylation status determined from sequence reads at one or more CpG islands. Item 16. The method according to Item 16. 複数の部位のメチル化特性を決定することが、当該部位での配列リードから決定されたメチル化状態を用いて、複数の部位の各々の部位のメチル化密度を計算することを含む、請求項16に記載の方法。   Determining the methylation profile of the plurality of sites comprises calculating the methylation density of each of the plurality of sites using the methylation status determined from the sequence reads at the site. 16. The method according to 16. 解析が、ゲノム中のセルフリーDNA分子の位置を決定することを更に含む、請求項1〜18のいずれか1項に記載の方法。   19. The method of any one of claims 1-18, wherein the analysis further comprises determining the location of the cell-free DNA molecule in the genome. メチル化特性を決定することが、1以上のゲノム領域に位置するセルフリーDNA分子の配列リードから決定されたメチル化状態を用いて、1以上のゲノム領域における1以上のメチル化レベルを決定することを含む、請求項19に記載の方法。   Determining methylation properties determines one or more methylation levels in one or more genomic regions using methylation status determined from sequence reads of cell-free DNA molecules located in one or more genomic regions 20. The method of claim 19, comprising: 1以上のゲノム領域が、ゲノムにおいて特定された複数のゲノムビンを含む、請求項20に記載の方法。   21. The method of claim 20, wherein the one or more genomic regions comprises a plurality of genomic bins identified in the genome. 複数のゲノムのビンが50 kb〜1 Mbの大きさを有する、請求項21に記載の方法。   22. The method of claim 21, wherein the multiple genomic bins have a size of 50 kb to 1 Mb. 複数のゲノムビンが異なった大きさを有する、請求項21又は22に記載の方法。   23. The method of claim 21 or 22, wherein the plurality of genomic bins have different sizes. ゲノムビンの各々のメチル化レベルを、ゲノムビンが低メチル化又は高度メチル化されていることを示すカットオフ値と比較することによって一群のゲノムビンを選択することを更に含む、請求項21〜23のいずれか1項に記載の方法。 24. Any of claims 21-23, further comprising selecting a group of genomic bins by comparing the methylation level of each of the genomic bins with a cut-off value indicating that the genomic bin is hypomethylated or hypermethylated. The method described in paragraph 1. 少なくとも一部は、選択した一群のゲノムビンのメチル化レベルに基づいて、癌種を決定することを更に含む、請求項24に記載の方法。   25. The method of claim 24, further comprising, at least in part, determining the cancer type based on the methylation level of the selected population of genomic bins. 他の対象が、癌を有することが知られている対象である、請求項25に記載の方法。 Other subjects, Ru target der known to have a cancer, the method according to claim 25. 他の対象が健常対象である、請求項25に記載の方法。 Other subject Ru healthy subject der A method according to claim 25. 1以上の参照メチル化特性がセルフリーDNA分子を含む1以上の参照試料から得られる、請求項1〜27のいずれか1項に記載の方法。 28. The method of any one of claims 1-27, wherein the one or more reference methylation properties are obtained from one or more reference samples containing cell-free DNA molecules . 1以上の参照メチル化特性のもう1つが健常対象に相当する、請求項28に記載の方法。 29. The method of claim 28, wherein another of the one or more reference methylation properties corresponds to a healthy subject. 1以上の参照試料はそれぞれの対象に相当する複数の参照試料を含み、メチル化特性を1以上の参照メチル化特性と比較することは、
参照メチル化特性の1以上のクラスターを得るために、複数の参照試料から決定された参照メチル化プロファイルをクラスタリングし;及び
メチル化特性と関連した癌種を決定するために、メチル化特性を1以上の分類と比較すること
を含む、請求項28に記載の方法。
One or more reference samples includes multiple reference samples corresponding to each subject, and comparing the methylation profile to one or more reference methylation profiles is
Clustering reference methylation profiles determined from multiple reference samples to obtain one or more clusters of reference methylation profiles; and
Comparing methylation profiles with one or more categories to determine cancer types associated with methylation profiles
29. The method of claim 28, comprising :
メチル化特性に基づくコピー数異常の存在又は非存在を決定することを更に含む、請求項1〜30のいずれか1項に記載の方法。   31. The method of any one of claims 1-30, further comprising determining the presence or absence of copy number abnormalities based on methylation characteristics. セルフリーDNA分子中の1以上のゲノム部位での1以上のメチル化レベルを決定することを更に含む、請求項1〜31のいずれか1項に記載の方法。   32. The method of any one of claims 1-31, further comprising determining one or more methylation levels at one or more genomic sites in a cell-free DNA molecule. メチル化特性を決定することが、1以上のCpG島の1以上のメチル化レベルを決定することを含む、請求項1〜32のいずれか1項に記載の方法。   33. The method of any one of claims 1-32, wherein determining the methylation profile comprises determining one or more methylation levels of one or more CpG islands. 対象由来の生物試料を解析する方法であって、
(a)対象の生物試料由来のセルフリーDNA分子の配列リードを得るステップ、ここで、前記配列リードは、単一ヌクレオチド分析において、セルフリーDNA分子の複数の部位でのメチル化状態を含み;
(b)複数の部位の各々でメチル化されたセルフリーDNA分子数を決定するために配列リードを分析し、及び複数の部位のメチル化状態に基づく複数の部位のメチル化特性を決定するために当該数を使用するステップ;及び
(c)少なくとも一部は、メチル化特性に基づいて、生物試料由来のセルフリーDNA分子の少なくとも一部の組織源を決定するステップ、ここで、組織源を決定することは、メチル化特性を1以上の参照メチル化特性と比較することを含み、1以上の参照メチル化特性の少なくとも1つは、癌を有することが知られている対象から得られた少なくとも1つの試料から得られる、を含む、方法。
A method for analyzing a biological sample derived from a subject, comprising:
(A) obtaining a sequence read of a cell-free DNA molecule from a biological sample of interest, wherein the sequence read comprises methylation status at multiple sites of the cell-free DNA molecule in a single nucleotide analysis;
(B) analyzing sequence reads to determine the number of cell-free DNA molecules methylated at each of the multiple sites, and determining the methylation properties of the multiple sites based on the methylation status of the multiple sites And (c) determining a tissue source of at least a portion of the cell-free DNA molecules from the biological sample based on the methylation characteristics , wherein the tissue source is Determining includes comparing the methylation profile to one or more reference methylation profiles, at least one of the one or more reference methylation profiles was obtained from a subject known to have cancer. Obtained from at least one sample .
セルフリーDNA分子の少なくとも一部が癌由来分子であり、少なくとも一部は、メチル化特性に基づいて、対象の癌種を決定することを更に含む、請求項34に記載の方法。   35. The method of claim 34, wherein at least a portion of the cell-free DNA molecule is a cancer-derived molecule and at least a portion further comprises determining the cancer type of interest based on the methylation profile. 癌種が、肺がん、乳がん、結腸直腸がん、前立腺がん、鼻咽腔がん、胃がん、精巣がん、皮膚がん、神経系に発症するがん、骨がん、卵巣がん、肝臓がん、造血器腫瘍、膵がん、子宮内膜癌、及び腎がんから成る群より選択される、請求項35に記載の方法。   Lung cancer, breast cancer, colorectal cancer, prostate cancer, nasopharyngeal cancer, gastric cancer, testicular cancer, skin cancer, cancer that develops in nervous system, bone cancer, ovarian cancer, liver 36. The method of claim 35, selected from the group consisting of cancer, hematopoietic tumor, pancreatic cancer, endometrial cancer, and renal cancer. 配列リードを得るためにセルフリーDNA分子を配列決定することを更に含む、請求項34に記載の方法。   35. The method of claim 34, further comprising sequencing the cell-free DNA molecule to obtain a sequence read. 配列決定が、メチル化認識配列決定を含む、請求項37に記載の方法。   38. The method of claim 37, wherein the sequencing comprises methylation recognition sequencing. メチル化認識配列決定が、亜硫酸水素塩配列決定を含む、請求項38に記載の方法。   39. The method of claim 38, wherein methylation recognition sequencing comprises bisulfite sequencing. 複数の部位が、1以上のCpG部位を含む、請求項39に記載の方法。   40. The method of claim 39, wherein the plurality of sites comprises one or more CpG sites. コンピューターに、請求項1〜7、15〜36及び40のいずれか1項に記載の方法を実行させるプログラム。   A program that causes a computer to execute the method according to any one of claims 1 to 7, 15 to 36, and 40. 1以上のプロセッサ及び請求項41に記載のプログラムを保存するコンピューター可読媒体を含む、装置。   An apparatus comprising one or more processors and a computer-readable medium storing a program according to claim 41. 請求項1〜7、15〜36及び40のいずれか1項に記載の方法を実行するようにプログラムされている1以上のプロセッサを含む、コンピューター装置。   A computer device comprising one or more processors programmed to perform the method of any one of claims 1-7, 15-36 and 40.
JP2018061744A 2012-09-20 2018-03-28 Non-invasive determination of fetal or tumor methylome by plasma Active JP6683752B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020055387A JP6985753B2 (en) 2012-09-20 2020-03-26 Non-invasive determination of fetal or tumor methylome by plasma
JP2021188060A JP2022031753A (en) 2012-09-20 2021-11-18 Non-invasive determination of methylome of fetus or tumor from plasma
JP2023167714A JP2024009833A (en) 2012-09-20 2023-09-28 Non-invasive determination of methylome of fetus or tumor from plasma

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201261703512P 2012-09-20 2012-09-20
US61/703,512 2012-09-20
US13/842,209 2013-03-15
US13/842,209 US9732390B2 (en) 2012-09-20 2013-03-15 Non-invasive determination of methylome of fetus or tumor from plasma
US201361830571P 2013-06-03 2013-06-03
US61/830,571 2013-06-03

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015532250A Division JP6317354B2 (en) 2012-09-20 2013-09-20 Non-invasive determination of fetal or tumor methylomes by plasma

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020055387A Division JP6985753B2 (en) 2012-09-20 2020-03-26 Non-invasive determination of fetal or tumor methylome by plasma

Publications (2)

Publication Number Publication Date
JP2018121644A JP2018121644A (en) 2018-08-09
JP6683752B2 true JP6683752B2 (en) 2020-04-22

Family

ID=50340462

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2015532250A Active JP6317354B2 (en) 2012-09-20 2013-09-20 Non-invasive determination of fetal or tumor methylomes by plasma
JP2018061744A Active JP6683752B2 (en) 2012-09-20 2018-03-28 Non-invasive determination of fetal or tumor methylome by plasma
JP2020055387A Active JP6985753B2 (en) 2012-09-20 2020-03-26 Non-invasive determination of fetal or tumor methylome by plasma
JP2021188060A Pending JP2022031753A (en) 2012-09-20 2021-11-18 Non-invasive determination of methylome of fetus or tumor from plasma
JP2023167714A Pending JP2024009833A (en) 2012-09-20 2023-09-28 Non-invasive determination of methylome of fetus or tumor from plasma

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015532250A Active JP6317354B2 (en) 2012-09-20 2013-09-20 Non-invasive determination of fetal or tumor methylomes by plasma

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2020055387A Active JP6985753B2 (en) 2012-09-20 2020-03-26 Non-invasive determination of fetal or tumor methylome by plasma
JP2021188060A Pending JP2022031753A (en) 2012-09-20 2021-11-18 Non-invasive determination of methylome of fetus or tumor from plasma
JP2023167714A Pending JP2024009833A (en) 2012-09-20 2023-09-28 Non-invasive determination of methylome of fetus or tumor from plasma

Country Status (27)

Country Link
EP (6) EP3839065A1 (en)
JP (5) JP6317354B2 (en)
KR (5) KR102307424B1 (en)
CN (2) CN104781422B (en)
AU (4) AU2013317708C1 (en)
BR (3) BR122021021823B1 (en)
CA (2) CA3122779A1 (en)
CY (1) CY1124139T1 (en)
DK (3) DK3354747T3 (en)
EA (1) EA201500327A1 (en)
ES (2) ES2665273T5 (en)
FI (1) FI3536807T3 (en)
HK (3) HK1206797A1 (en)
HR (1) HRP20210716T1 (en)
HU (1) HUE053822T2 (en)
IL (3) IL299444A (en)
LT (1) LT3354747T (en)
MX (1) MX360034B (en)
MY (2) MY173356A (en)
NZ (2) NZ706269A (en)
PH (1) PH12015500547A1 (en)
PL (2) PL3354747T3 (en)
PT (3) PT3536807T (en)
SG (2) SG11201501927VA (en)
TW (5) TWI806621B (en)
WO (1) WO2014043763A1 (en)
ZA (1) ZA201501772B (en)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101153336B (en) 2006-09-27 2011-09-07 香港中文大学 Diagnostic method for detecting DNA methylation degree
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
JP6317354B2 (en) * 2012-09-20 2018-04-25 ザ チャイニーズ ユニバーシティ オブ ホンコン Non-invasive determination of fetal or tumor methylomes by plasma
US10706957B2 (en) 2012-09-20 2020-07-07 The Chinese University Of Hong Kong Non-invasive determination of methylome of tumor from plasma
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
WO2015013885A1 (en) * 2013-07-30 2015-02-05 深圳华大基因科技有限公司 Method for determining nucleic acid composition of nucleic acid mixture
US10174375B2 (en) 2013-09-20 2019-01-08 The Chinese University Of Hong Kong Sequencing analysis of circulating DNA to detect and monitor autoimmune diseases
WO2015126840A1 (en) * 2014-02-18 2015-08-27 Bionano Genomics, Inc. Improved methods of determining nucleic acid structural information
EP3140421B8 (en) 2014-05-09 2020-05-06 Eurofins LifeCodexx GmbH Detection of dna that originates from a specific cell-type and related methods
EP2942400A1 (en) 2014-05-09 2015-11-11 Lifecodexx AG Multiplex detection of DNA that originates from a specific cell-type
WO2016010401A1 (en) * 2014-07-18 2016-01-21 에스케이텔레콘 주식회사 Method for expecting fetal single nucleotide polymorphisms using maternal serum dna
TWI703216B (en) * 2014-07-18 2020-09-01 香港中文大學 Methylation pattern analysis of tissues in a dna mixture
EP3172341A4 (en) 2014-07-25 2018-03-28 University of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
AU2016218631B2 (en) 2015-02-10 2022-03-10 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
TWI798718B (en) 2015-07-20 2023-04-11 香港中文大學 Methylation pattern analysis of haplotypes in tissues in a dna mixture
TWI730973B (en) * 2015-07-23 2021-06-21 香港中文大學 Analysis of fragmentation patterns of cell-free dna
CN107849607B (en) 2015-08-12 2022-10-11 香港中文大学 Single molecule sequencing of plasma DNA
CN115035949A (en) 2015-09-22 2022-09-09 香港中文大学 Accurate quantification of fetal DNA fraction by shallow depth sequencing of maternal plasma DNA
US10260088B2 (en) * 2015-10-30 2019-04-16 New England Biolabs, Inc. Compositions and methods for analyzing modified nucleotides
CN108368548A (en) * 2015-11-09 2018-08-03 普罗格尼迪公司 Method for the source for determining DNA molecular
EP3168309B8 (en) 2015-11-10 2020-06-03 Eurofins LifeCodexx GmbH Detection of foetal chromosomal aneuploidies using dna regions that are differentially methylated between the foetus and the pregnant female
EP3798321A1 (en) 2015-12-17 2021-03-31 Illumina, Inc. Distinguishing methylation levels in complex biological samples
CA3013366A1 (en) * 2016-02-02 2017-08-10 Guardant Health, Inc. Cancer evolution detection and diagnostic
US11514289B1 (en) 2016-03-09 2022-11-29 Freenome Holdings, Inc. Generating machine learning models using genetic data
KR20230054746A (en) * 2016-05-03 2023-04-25 유니버시티 헬스 네트워크 Methods of capturing cell-free methylated dna and uses of same
US20190256921A1 (en) * 2016-05-04 2019-08-22 Queen's University At Kingston Cell-free detection of methylated tumour dna
IL262953B2 (en) 2016-05-30 2023-11-01 Univ Hong Kong Chinese Detecting hematological disorders using cell-free dna in blood
ES2897550T3 (en) * 2016-06-16 2022-03-01 Univ Johns Hopkins Epigenetic analysis methods and system
WO2018036537A1 (en) * 2016-08-24 2018-03-01 中国科学院上海生命科学研究院 Novel modification of 5-methylcytosine catalyzed by cmd1 enzyme and application thereof
EP3529377B1 (en) 2016-10-19 2023-04-05 The Chinese University Of Hong Kong Gestational age assessment by methylation and size profiling of maternal plasma dna
EP3535415A4 (en) 2016-10-24 2020-07-01 The Chinese University of Hong Kong Methods and systems for tumor detection
KR20230062684A (en) * 2016-11-30 2023-05-09 더 차이니즈 유니버시티 오브 홍콩 Analysis of cell-free dna in urine and other samples
EP3555311A4 (en) * 2016-12-13 2020-08-12 Bellwether Bio, Inc. Determining a physiological condition in an individual by analyzing cell-free dna fragment endpoints in a biological sample
CA3049442A1 (en) * 2017-01-11 2018-07-19 Quest Diagnostics Investments Llc Method for non-invasive prenatal screening for aneuploidy
EP3575407B1 (en) * 2017-01-24 2024-03-27 BGI Genomics Co., Ltd. Method for determining proportion of cell-free nucleic acids from predetermined source in biological sample
TW202348802A (en) 2017-01-25 2023-12-16 香港中文大學 Diagnostic applications using nucleic acid fragments
CN107247873B (en) * 2017-03-29 2020-04-14 电子科技大学 Differential methylation site recognition method
CA3063405A1 (en) * 2017-05-12 2018-11-15 President And Fellows Of Harvard College Universal early cancer diagnostics
KR20200029532A (en) * 2017-07-12 2020-03-18 에이엔디이 코포레이션 Pattern recognition system
CA3069754A1 (en) * 2017-07-12 2019-01-17 University Health Network Cancer detection and classification using methylome analysis
EP3658684B1 (en) * 2017-07-26 2023-08-30 The Chinese University Of Hong Kong Enhancement of cancer screening using cell-free viral nucleic acids
US20200263170A1 (en) 2017-09-14 2020-08-20 Grail, Inc. Methods for preparing a sequencing library from single-stranded dna
WO2019067973A1 (en) 2017-09-28 2019-04-04 Grail, Inc. Enrichment of short nucleic acid fragments in sequencing library preparation
US11168356B2 (en) 2017-11-02 2021-11-09 The Chinese University Of Hong Kong Using nucleic acid size range for noninvasive cancer detection
US11884966B2 (en) 2018-03-15 2024-01-30 Grail, Llc Tissue-specific methylation marker
CA3095056A1 (en) * 2018-04-13 2019-10-17 Freenome Holdings, Inc. Machine learning implementation for multi-analyte assay of biological samples
US11932899B2 (en) * 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
CN109448789A (en) * 2018-09-17 2019-03-08 上海派森诺生物科技股份有限公司 A kind of automated analysis method of the special SNP site of population based on perl language
EP3856903A4 (en) 2018-09-27 2022-07-27 Grail, LLC Methylation markers and targeted methylation probe panel
CN109295230A (en) * 2018-10-24 2019-02-01 福建翊善生物科技有限公司 A method of the polygene combined abrupt climatic change based on ctDNA assesses tumour dynamic change
CN113366122B (en) * 2018-12-19 2024-01-12 香港中文大学 Free DNA end characterization
US20200239965A1 (en) 2018-12-21 2020-07-30 Grail, Inc. Source of origin deconvolution based on methylation fragments in cell-free dna samples
WO2020163410A1 (en) 2019-02-05 2020-08-13 Grail, Inc. Detecting cancer, cancer tissue of origin, and/or a cancer cell type
AU2020217719A1 (en) 2019-02-05 2021-08-19 Grail, Llc Detecting cancer, cancer tissue of origin, and/or a cancer cell type
US11773450B2 (en) 2019-04-03 2023-10-03 Grail, Llc Methylation-based false positive duplicate marking reduction
SG11202112246UA (en) * 2019-05-03 2021-12-30 Univ Cornell Markers for identifying and quantifying of nucleic acid sequence mutation, expression, splice variant, translocation, copy number, or methylation changes
AU2020333348B2 (en) * 2019-08-19 2023-11-23 Green Cross Genome Corporation Method for detecting chromosomal abnormality by using information about distance between nucleic acid fragments
KR102452413B1 (en) * 2019-08-19 2022-10-11 주식회사 지씨지놈 Method for detecting chromosomal abnormality using distance information between nucleic acid fragments
GB201915469D0 (en) 2019-10-24 2019-12-11 Univ London Cancer detection methods
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
WO2021174072A1 (en) * 2020-02-28 2021-09-02 Grail, Inc. Identifying methylation patterns that discriminate or indicate a cancer condition
CN112662764A (en) * 2020-03-17 2021-04-16 博尔诚(北京)科技有限公司 Probe composition for detecting 11 cancers
RU2738675C1 (en) * 2020-07-28 2020-12-15 Федеральное государственное автономное образовательное учреждение высшего образования "Белгородский государственный национальный исследовательский университет" (НИУ "БелГУ") Method for prediction of the risk of developing preeclampsia in women without an aggravated family history taking into account genetic factors
CN112813148A (en) * 2021-02-02 2021-05-18 博淼生物科技(北京)有限公司 Method for detecting 5-hydroxymethylcytosine by flight time mass spectrum
KR20230059423A (en) * 2021-10-26 2023-05-03 주식회사 지씨지놈 Method for diagnosing and predicting cancer type using methylated cell free DNA
US20230138633A1 (en) * 2021-11-04 2023-05-04 Universal Diagnostics, S.L. Systems and methods for preparing biological samples for genetic sequencing
CN115064211B (en) * 2022-08-15 2023-01-24 臻和(北京)生物科技有限公司 ctDNA prediction method and device based on whole genome methylation sequencing
CN115612723B (en) * 2022-09-26 2023-07-14 广州女娲生命科技有限公司 Screening method of embryo before implantation
CN117025753A (en) * 2023-08-15 2023-11-10 广州女娲生命科技有限公司 Method and device for detecting chromosomal variation
CN117079822B (en) * 2023-10-17 2024-01-02 北京大学第三医院(北京大学第三临床医学院) System for predicting fetal brain injury by four factors in early and middle gestation period

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
EP1342794B1 (en) 2002-03-05 2005-12-14 Epigenomics AG Method and device for determination of tissue specificity of free floating DNA in bodily fluids
WO2004046332A2 (en) 2002-11-19 2004-06-03 Amgen Inc. Amplified genes involved in cancer
US20060183128A1 (en) 2003-08-12 2006-08-17 Epigenomics Ag Methods and compositions for differentiating tissues for cell types using epigenetic markers
DE10348407A1 (en) 2003-10-17 2005-05-19 Widschwendter, Martin, Prof. Prognostic and diagnostic markers for cell proliferative disorders of breast tissues
CA2902980A1 (en) * 2004-03-08 2005-09-29 Rubicon Genomics, Inc. Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation
EP1888786A4 (en) 2005-05-27 2009-12-30 Wayne John Cancer Inst Use of free circulating dna for diagnosis, prognosis, and treatment of cancer
US7901884B2 (en) * 2006-05-03 2011-03-08 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
US7754428B2 (en) * 2006-05-03 2010-07-13 The Chinese University Of Hong Kong Fetal methylation markers
CN101153336B (en) * 2006-09-27 2011-09-07 香港中文大学 Diagnostic method for detecting DNA methylation degree
EP2173897A2 (en) 2007-06-19 2010-04-14 Oncomethylome Sciences SA Improved urine sample collecting and processing
CN103902809B (en) 2007-07-23 2017-11-28 香港中文大学 Determine that nucleotide sequence is unbalance using multiple labels
US20110028333A1 (en) * 2009-05-01 2011-02-03 Brown University Diagnosing, prognosing, and early detection of cancers by dna methylation profiling
US8563242B2 (en) * 2009-08-11 2013-10-22 The Chinese University Of Hong Kong Method for detecting chromosomal aneuploidy
WO2011038507A1 (en) * 2009-10-02 2011-04-07 Centre For Addiction And Mental Health Method for analysis of dna methylation profiles of cell-free circulating dna in bodily fluids
RS58879B1 (en) * 2009-11-05 2019-08-30 Univ Hong Kong Chinese Fetal genomic analysis from a maternal biological sample
EP4212630A1 (en) 2009-11-06 2023-07-19 The Chinese University of Hong Kong Size-based genomic analysis
WO2011091046A1 (en) * 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
DK2529032T3 (en) 2010-01-26 2017-05-01 Nipd Genetics Ltd METHODS AND COMPOSITIONS FOR NON-INVASIVE PRE-NATIONAL DIAGNOSTICATION OF Fetal ANEUPLOIDITIES
JP6073217B2 (en) 2010-04-29 2017-02-08 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Pathway recognition algorithm (PARADIGM) using data integration for genome models
GB201007944D0 (en) 2010-05-12 2010-06-30 Univ Aberystwyth Methods
WO2011150075A2 (en) 2010-05-25 2011-12-01 The Johns Hopkins University Compositions and methods for detecting a neoplasia
KR20130041961A (en) * 2010-07-23 2013-04-25 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Methods for detecting signatures of disease or conditions in bodily fluids
SG186787A1 (en) * 2010-07-23 2013-02-28 Esoterix Genetic Lab Llc Identification of differentially represented fetal or maternal genomic regions and uses thereof
WO2012031329A1 (en) 2010-09-10 2012-03-15 Murdoch Childrens Research Institute Assay for detection and monitoring of cancer
EP2646579B1 (en) 2010-11-30 2017-06-14 The Chinese University Of Hong Kong Detection of genetic or molecular aberrations associated with cancer
JP6317354B2 (en) * 2012-09-20 2018-04-25 ザ チャイニーズ ユニバーシティ オブ ホンコン Non-invasive determination of fetal or tumor methylomes by plasma

Also Published As

Publication number Publication date
KR20210120124A (en) 2021-10-06
AU2017251832A1 (en) 2017-11-16
KR102587176B1 (en) 2023-10-06
SG10201705198UA (en) 2017-07-28
EP3536807B1 (en) 2023-11-29
EP4056712A1 (en) 2022-09-14
MX360034B (en) 2018-10-19
HRP20210716T1 (en) 2021-06-11
MY173356A (en) 2020-01-21
IL268512B2 (en) 2023-06-01
EP4335929A2 (en) 2024-03-13
CN104781422A (en) 2015-07-15
NZ706269A (en) 2016-08-26
KR20220065034A (en) 2022-05-19
AU2020200128B2 (en) 2021-11-18
EP3354747A1 (en) 2018-08-01
CN117757932A (en) 2024-03-26
CY1124139T1 (en) 2022-05-27
DK2898100T3 (en) 2018-02-26
AU2020200128A1 (en) 2020-01-30
BR112015006183A2 (en) 2017-07-04
HUE053822T2 (en) 2021-07-28
BR112015006183B1 (en) 2022-04-26
FI3536807T3 (en) 2024-02-01
JP2018121644A (en) 2018-08-09
IL268512A (en) 2019-09-26
PL2898100T5 (en) 2023-11-06
IL299444A (en) 2023-02-01
EP3536807A1 (en) 2019-09-11
DK2898100T4 (en) 2023-07-24
JP2024009833A (en) 2024-01-23
NZ717423A (en) 2017-08-25
EP3839065A1 (en) 2021-06-23
AU2022201026A1 (en) 2022-03-10
JP6985753B2 (en) 2021-12-22
JP2015536639A (en) 2015-12-24
PT3536807T (en) 2024-02-01
BR122021021825B1 (en) 2022-05-24
EP2898100B9 (en) 2023-08-02
PL2898100T3 (en) 2018-06-29
AU2013317708A1 (en) 2015-04-09
DK3354747T3 (en) 2021-04-19
TW201418474A (en) 2014-05-16
DK3536807T3 (en) 2024-02-05
KR102390711B1 (en) 2022-04-26
HK1207124A1 (en) 2016-01-22
ES2665273T5 (en) 2023-10-02
TW202043483A (en) 2020-12-01
KR20150082228A (en) 2015-07-15
AU2013317708B2 (en) 2017-08-03
TWI640634B (en) 2018-11-11
IL237495A0 (en) 2015-04-30
CA2884066A1 (en) 2014-03-27
PT2898100T (en) 2018-02-26
BR122021021823B1 (en) 2023-04-25
AU2017251832B2 (en) 2019-10-10
JP6317354B2 (en) 2018-04-25
HK1206797A1 (en) 2016-01-15
CA2884066C (en) 2021-08-10
CN104781422B (en) 2023-12-26
TW202305145A (en) 2023-02-01
LT3354747T (en) 2021-04-12
JP2020108400A (en) 2020-07-16
EP2898100B2 (en) 2023-05-10
TW201907013A (en) 2019-02-16
ES2665273T3 (en) 2018-04-25
KR102307424B1 (en) 2021-09-29
MY187444A (en) 2021-09-22
WO2014043763A1 (en) 2014-03-27
ZA201501772B (en) 2016-10-26
EP2898100A4 (en) 2016-05-11
TWI806621B (en) 2023-06-21
PH12015500547A1 (en) 2015-05-04
PL3354747T3 (en) 2021-07-26
TWI707953B (en) 2020-10-21
CA3122779A1 (en) 2014-03-27
PT3354747T (en) 2021-05-07
TWI784258B (en) 2022-11-21
IL237495B (en) 2019-09-26
TW202334438A (en) 2023-09-01
KR102148547B1 (en) 2020-08-26
ES2862726T3 (en) 2021-10-07
AU2013317708C1 (en) 2017-11-23
EP3354747B1 (en) 2021-02-17
KR20230145530A (en) 2023-10-17
MX2015003571A (en) 2015-06-22
JP2022031753A (en) 2022-02-22
HK1257868A1 (en) 2019-11-01
KR20200085928A (en) 2020-07-15
EP2898100B1 (en) 2017-11-22
EA201500327A1 (en) 2015-07-30
EP2898100A1 (en) 2015-07-29
SG11201501927VA (en) 2015-04-29

Similar Documents

Publication Publication Date Title
JP6683752B2 (en) Non-invasive determination of fetal or tumor methylome by plasma
EA042157B1 (en) NON-INVASIVE DETERMINATION OF FETUS METHYLOMA OR TUMORS ON PLASMA
BR122021021820B1 (en) METHOD FOR DETERMINING A METHYLATION PROFILE OF A BIOLOGICAL SAMPLE OF AN ORGANISM AND COMPUTER READABLE STORAGE MEDIA

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180426

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200326

R150 Certificate of patent or registration of utility model

Ref document number: 6683752

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250