JP6068598B2 - 多胎妊娠の分子検査 - Google Patents

多胎妊娠の分子検査 Download PDF

Info

Publication number
JP6068598B2
JP6068598B2 JP2015217329A JP2015217329A JP6068598B2 JP 6068598 B2 JP6068598 B2 JP 6068598B2 JP 2015217329 A JP2015217329 A JP 2015217329A JP 2015217329 A JP2015217329 A JP 2015217329A JP 6068598 B2 JP6068598 B2 JP 6068598B2
Authority
JP
Japan
Prior art keywords
fetal
loci
allele
fetuses
fetal dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015217329A
Other languages
English (en)
Other versions
JP2016034282A (ja
Inventor
ミン デニス ロー ユク
ミン デニス ロー ユク
クン ロッサ チウ ワイ
クン ロッサ チウ ワイ
クワン チェー チャン
クワン チェー チャン
タク ユン ルン
タク ユン ルン
ペイヨン チャン
ペイヨン チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Publication of JP2016034282A publication Critical patent/JP2016034282A/ja
Application granted granted Critical
Publication of JP6068598B2 publication Critical patent/JP6068598B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Data Mining & Analysis (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)

Description

関連出願の相互参照
本出願は、2011年2月24日に出願された「双胎妊娠の分子検査」の名称の米国特許仮出願第61/446,256号の非仮出願であり、この仮出願特許の優先権を主張する。この特許の全内容は、あらゆる目的において、参照によって本明細書に組み込まれる。
本出願は、2010年11月1日に出願されたLoらによる「母体の生物学的試料による胎児ゲノム解析」の名称の所有者共通米国特許出願第12/940,993号(代理人整理番号80015−006710US)に関し、この特許の開示は、参照によってその全体が組み込まれる。
背景
多胎妊娠は、2人以上の胎児を宿している妊婦の妊娠を意味する。双胎妊娠は、最も多い形の多胎妊娠である。一卵性双生児は、同じ受精卵由来の一組の双生児を意味する。従って、その一組の双生児は、ゲノム全体にわたり同じ遺伝的構成を有する。二卵性双生児は、2つの異なる受精卵由来の一組の双生児である。その一組の双生児の遺伝的構成は、同じではないであろう。その代わりに、この一組の双生児の遺伝的構成の類似性は、異なる時に生まれた一組の同胞に似ているであろう。
双胎妊娠の接合状態に関する情報は、従来、超音波走査(Chauhan SP et al.Am J Obstet Gynecol 2010;203:305−315)または侵襲的出生前診断(例えば、羊水穿刺)(Chen CP et al.Hum Reprod 2000;15:929−934)により取得されてきた。このような接合状態情報は、その後の産科管理にとって有用である。例えば、異数性検出用に羊水穿刺を行う場合には、二卵性双生児を伴う妊娠では、各羊膜嚢に対し別々にサンプリングが必要となろう。2つの羊膜嚢を伴う一卵性双生児妊娠に対しては、理論的には、2つの羊膜嚢の内の1つのサンプリングのみで充分であろう。しかし、超音波走査は、不正確であるか、または制限がある(例えば、胎児が異なる性である場合)場合があり、また、侵襲的出生前診断は、胎児および/または母親に対し害を与える場合がある。
従って、多胎児を伴う妊娠に対する接合状態情報を得る新規技術が望まれる。
簡単な概要
本発明の実施形態は、母親から採取した、胎児に対し非侵襲的な生物学的試料を使って多胎児妊娠の接合状態を判定する方法、システム、および装置を提供する。試料(例えば、血漿)中の胎児および母体のDNAの特定の染色体領域を分析して、胎児の遺伝的差異を特定することができる。例えば、胎児が二卵性である場合は、主要または副次的アレルの尺度の正規化パラメータにおける、異なる染色体の領域での不一致が示される。このような不一致は、胎児が遺伝的に同一である場合の期待値に比較して決定できる。正規化パラメータの変動を解析し、胎児DNA濃度および種々の座位での母体胎児混合遺伝子型を決定する統計的方法が提供される。また、親の遺伝子型およびハプロタイプ情報を使用して、胎児の間での遺伝的差異を示す異なる親のハプロタイプの継承を特定することもできる。他の利点として、多胎妊娠の接合状態の判定により、例えば、母体の血液を使って行われる非侵襲的出生前検診の実施を支援できる。
一実施形態は、多胎児を宿す妊婦の生物学的試料を分析し、少なくとも妊婦の2人の胎児が二卵性であるか否かを判定する方法である。生物学的試料は、胎児および母体のDNAを含む。妊婦の遺伝子型は、第1の染色体の領域内の1つまたは複数の第1の座位のそれぞれの座位で決定される。母親は、それぞれの第1の座位でホモ接合であるか、またはそれぞれの第1の座位でヘテロ接合である。各第1の座位は、生物学的試料中のそれぞれの主要アレルおよびそれぞれの副次的アレルを示す。それぞれの主要アレルは、各第1の座位において、それぞれの副次的アレルよりも量が多い。生物学的試料中の1つまたは複数の第1の座位において、1つまたは複数の主要アレルの第1の量、および/または1つまたは複数の副次的アレルの第2の量が測定される。第1の量または第2の量に対し、正規化パラメータが得られる。胎児が第1の染色体領域で遺伝的に同じである場合に、正規化パラメータがカットオフ値と比較され、正規化パラメータが統計的に期待値とは異なるか否かが判定される。期待値は、生物学的試料の測定により得られる。カットオフ値に対する正規化パラメータの比較に基づき、妊婦の胎児の内の少なくとも2人が二卵性であるか否かが判定される。
別の実施形態では、1つまたは複数の胎児特異的配列の第1の量が、生物学的試料中の1つまたは複数の第1の座位の測定時に測定される。第1の量に対し、正規化パラメータが得られる。第1の染色体領域で胎児が遺伝的に同じ場合に、正規化パラメータが、カットオフ値と比較され、正規化パラメータが期待値と統計的に異なるか否かが判定される。期待値は、生物学的試料の測定により得られる。次に、カットオフ値に対する正規化パラメータの比較に基づいて、妊婦の胎児の内の少なくとも2人が二卵性であるか否かが判定される。
別の実施形態では、複数の染色体のそれぞれの領域に対し、1つまたは複数のアレルが、生物学的試料中のそれぞれの染色体の領域の1つまたは複数のそれぞれの座位において測定され、それぞれの測定されたアレルのそれぞれの量が、各座位において決定される。胎児の内の少なくとも2人がそれぞれの染色体の領域の第1の親由来の異なるハプロタイプを受け継いでいるか否かが、測定されたアレルのそれぞれの量に基づいて判定される。胎児の内の少なくとも2人が第1の親由来の異なるハプロタイプを受け継いでいる染色体の領域の第1の量が決定される。その第1の量が、1つまたは複数のカットオフ値と比較され、胎児の内の少なくとも2人が二卵性であるか否かが判定される。
別の実施形態では、以下のようにして、ヒストグラムが作られる。複数の染色体のそれぞれの領域に対し、生物学的試料中のそれぞれの第1のアレルおよびそれぞれの第2のアレルが検出される位置でそれぞれの染色体の領域の1つまたは複数の座位が特定され、生物学的試料の1つまたは複数の座位での1つまたは複数の第1のアレルの第1の量、および/または1つまたは複数の第2のアレルの第2の量が測定され、また、この第1の量または第2の量から正規化パラメータが得られる。ヒストグラムのカウンターは、規定値の正規化パラメータを有する染色体の領域の数に基づいて増やされる。母親がホモ接合で、胎児の内の少なくとも1人がヘテロ接合である座位に対応するか、または母親がヘテロ接合で、胎児の内の少なくとも1人がホモ接合である座位に対応する染色体の領域が特定される。多成分混合モデルが特定された染色体の領域に対応するヒストグラムに適合する。多成分混合モデルは、複数の成分の各々に対する混合係数を含む。混合係数の内の少なくとも2つを使って、胎児の内の少なくとも2人が二卵性であるか否かが判定される。
別の実施形態では、少なくとも2人の胎児を宿す妊婦由来の生物学的試料中の胎児DNAパーセンテージの測定方法が提供される。複数の染色体の領域のそれぞれに対し、それぞれの染色体の領域中の1つまたは複数の座位が、生物学的試料中のそれぞれの第1のアレルおよびそれぞれの第2のアレルが検出される位置で特定され、生物学的試料中の1つまたは複数の座位で、1つまたは複数の第1のアレルの第1の量、および/または1つまたは複数の第2のアレルの第2の量が測定され、さらに、第1の量または第2の量の正規化パラメータが得られる。ヒストグラムのカウンターは、規定値の正規化パラメータを有する染色体の領域の数に基づいて増やされる。確率分布の線形結合がヒストグラムに適合し、この場合、胎児DNAパーセンテージは、確率分布の線形結合への入力である。入力胎児DNAパーセンテージを変えることにより、確率分布の線形結合のヒストグラムへのフィットを最適化できる最適胎児DNAパーセンテージが見つけられる。
他の実施形態は、本明細書記載の方法に関連するシステムおよびコンピュータ可読メディアに関する。
以下の詳細説明および付随する図を参照することにより、本発明の特質および利点のさらなる理解が得られるであろう。
図1は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を解析し、妊婦の胎児の内の少なくとも2人が二卵性であるか否かの判定をする方法100を示すフローチャートである。 図2Aは、所与の染色体領域の2つの座位の親のハプロタイプがわかっている場合に、胎児の接合状態を決定する例を示す。図2Aは、母親が2つの座位でホモ接合であり、父親がヘテロ接合である場合の例を示す。 図2Bは、所与の染色体領域の2つの座位の親のハプロタイプがわかっている場合に、胎児の接合状態を決定する例を示す。図2Bは、母親が2つの座位でヘテロ接合であり父親がホモ接合である場合の例を示す。 図3は、また、座位が4つの異なるアレルを有する場合のマイクロサテライト分析の例を示す。 図4は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を解析し、妊婦の胎児の内の少なくとも2人が第1の染色体領域で遺伝的に異なるか否かの判定を行う方法400を示すフローチャートである。 図5は、第1の染色体領域に対する見かけのパラメータ比率(例えば、胎児DNA濃度)を測定することにより、第1の親由来の第1の染色体領域で、妊婦の胎児の内の少なくとも2人が遺伝的に異なるか否かを判定する方法500を示すフローチャートである。 図6は、本発明の実施形態に従って、母体血漿中の胎児DNA画分中の領域によるゲノム変異を使用して双胎妊娠の接合状態を明らかにする例である。 図7は、本発明の実施形態に従って、母体血漿中の胎児DNA画分中の領域によるゲノム変異を使用して双胎妊娠の接合状態を明らかにする例である。 図8は、本発明の実施形態に従って、等量の胎児DNAを与える二卵性双生児に対する胎児DNA濃度のヒストグラムの例を示す。 図9は、2人の胎児が異なる量のDNAを母体の血漿試料に与える場合の、SNP分析に基づく胎児DNA比率分布のヒストグラムを示す。 図10は、一組の二卵性双生児を宿している妊婦で、見かけの胎児DNA濃度比率に与える組換えの効果の例を示す。 図11は、本発明の実施形態に従って、少なくとも2人の胎児を宿す妊婦由来の生物学的試料中の胎児DNAパーセンテージを測定し、胎児の内の少なくとも2人が二卵性であるか否かを判定する方法1100を示すフローチャートである。 図12Aは、本発明の実施形態に従って、演繹的SNP分析の結果を示す表である。 図12Bは、本発明の実施形態に従って、演繹的SNP分析の結果を示す表である。 図12Cは、本発明の実施形態に従って、演繹的SNP分析の結果を示す表である。 図12Dは、本発明の実施形態に従って、演繹的SNP分析の結果を示す表である。 図12E1は、本発明の実施形態に従って、演繹的SNP分析の結果を示す表である。 図13は、二卵性妊娠に対する2つの異なるピークの特定を示す。 図14は、一卵性妊娠に対する1つのピークの特定を示す。 図15は、一卵性および二卵性双生児を宿す妊婦の異なる染色体領域に対する血漿中胎児DNA濃度比率を示す。 図16は、一組の一卵性双生児の存在を仮定した、確率的変動レベルを測定するためのシミュレーション分析を示す。 図17は、本発明の実施形態に従って、3人の胎児(胎児A、BおよびC)に対するいくつかの可能なピークを示すヒストグラムを示す。 図18は、本発明の実施形態によるシステムおよび方法で使用可能な例としてのコンピュータシステム1800のブロックダイアグラムを示す。
定義
本明細書で使われる用語の「生物学的試料」は、対象(例えば、妊婦等のヒト)から採取される任意の試料を意味し、1つまたは複数の目的の核酸分子を含む。例には、血漿、唾液、胸水、汗、腹水、胆汁、尿、血清、膵液、糞便および子宮頸部スメア試料が含まれる。
用語の「核酸」または「ポリヌクレオチド」は、単鎖または二重鎖型のデオキシリボ核酸(DNA)またはリボ核酸(RNA)およびそれらのポリマーを意味する。特に制限されていなければ、この用語は、参照核酸と類似の結合特性を有し、天然ヌクレオチドに類似の方式で代謝される天然ヌクレオチドの既知の類似体を含む核酸を包含する。別段の記載がなければ、特定の核酸配列は、また、保存的に改変されたそれらの変異体(例えば、縮重コドン置換)、アレル、オーソログ、SNP、および相補的配列を暗黙裏に包含し、また同様に明示的に示された配列も含む。具体的には、縮重コドン置換は、1つまたは複数の選択(または全ての)コドンの第3の位置が、混合塩基、および/またはデオキシイノシン残基で置換される配列を生成することにより実現できる(Batzer MA et al.、Nucleic Acid Res 1991;19:5081;Ohtsuka E et al.、J Biol Chem 1985;260:2605−2608;およびRossolini GM et al.、Mol Cell Probes 1994;8:91−98)。用語の核酸は、遺伝子、cDNA、mRNA、小分子ノンコーディングRNA、マイクロRNA(miRNA)、Piwi結合RNA、および遺伝子または座位によりコードされる低分子ヘアピン型RNA(shRNA)と同義に使用される。
用語の「遺伝子」は、ポリペプチド鎖または転写されたRNA産物の産生に関与するDNAのセグメントを意味する。これは、コード領域(リーダーおよびトレーラー)前後の領域、ならびに各コードセグメント(エキソン)の間の介在配列(イントロン)を含んでもよい。
本明細書で使われる用語の「反応」は、目的の特定のポリヌクレオチド配列の存在または非存在を示す化学的、酵素的、または物理的作用を伴ういずれかのプロセスを意味する。「反応」の一例は、ポリメラーゼ連鎖反応(PCR)等の増幅反応である。「反応」の別の例は、合成、連結反応、ハイブリダイゼーションまたは分解によるシーケンシング反応である。「情報価値の高い反応」は、1つまたは複数の目的の特定のポリヌクレオチド配列の存在を示す反応であり、唯一目的の配列のみが存在する場合もある。本明細書で使われる用語の「ウエル」は、限定された構造、例えば、ウエル形状のバイアル、小容器、PCRアレイ中の容器、乳剤中の液滴、粒子、ナノポアまたは表面上のある領域、の内の所定の部位での反応を意味する。
本明細書で使われる用語の「過剰出現核酸配列」は、生物学的試料中の2つの目的の配列(例えば、臨床的に関連する配列およびバックグラウンド配列)の間で、他の配列よりも多い存在量である核酸配列を意味する。
本明細書で使われる用語の「〜に基づく」は、「少なくとも一部は〜に基づく」を意味し、ある方法の入力およびその方法の出力の関係で発生するような、別の値の決定に使われるある値(または結果)を指す。本明細書で使われる用語の「誘導する」は、また、導出が式の計算である場合に発生するような、方法の入力およびその方法の出力の関係を指す。
本明細書で使われる用語の「定量データ」は、1つまたは複数の反応から得られ、1つまたは複数の数値を与えるデータを意味する。例えば、特定の配列に対する蛍光マーカーを示すウエルの数は、定量的データでありうる。
本明細書で使われる用語の「パラメータ」は、定量的データセット、および/または定量的データセット間の数値的関係を特徴付ける数値を意味する。例えば、第1の核酸配列の第1の量および第2の核酸配列の第2の量の間の比率(または比率の関数)は、パラメータである。
本明細書で使われる用語の「座位(locus)」またはその複数形「座位(loci)」は、ゲノム全域にわたり変化する、任意の長さのヌクレオチド(または塩基対)の位置またはアドレスである。用語の「アレル」は、同じ物理ゲノム座位の代替DNA配列を意味し、異なる表現型形質を生じても生じなくてもよい。それぞれの染色体の2つのコピー(男性ヒト対象の性染色体を除く)を有するいずれの特定の二倍体生物体でも、各遺伝子に対する遺伝子型は、その座位に存在する一組のアレルを含み、それらは、ホモ接合体では同じで、ヘテロ接合体では異なる。典型的な例では、生物体の集団または種は、種々の個体の中の各座位で複数のアレルを含む。集団中に2つ以上のアレルが認められるゲノム座位は、多型部位と呼ばれる。ある座位でのアレル変異は、存在するアレルの数(すなわち、多型の程度)、または集団中のヘテロ接合体の比率(すなわち、ヘテロ接合割合)として測定可能である。座位は、配列を含むことも、配列を含まないことも可能なので、配列(例えば、遺伝子)の存在または非存在は、また、アレル変異の1つのタイプと見なされる。このような配列の非存在(例えば、RHD遺伝子)は、通常は、欠失した配列の前後に存在する配列の結合により、特定できる。本明細書で使われる用語の「多型」は、その頻度に関係なく、ヒトゲノム中のいずれかの個体相互の変化を意味する。このような変化の例には、限定されないが、一塩基多型、単純タンデムリピート多型(simple tandem repeat polymorphism)、挿入−欠失多型、変異(疾患の原因となりうる)およびコピー数変化、が含まれる。
本明細書で使われる用語の「ハプロタイプ」は、同じ染色体または染色体の領域上で一緒に移動される、複数の座位にあるアレルの組み合わせを意味する。ハプロタイプは、わずか一対の座位でも、染色体の領域でも、または全染色体であってもよい。「染色体の領域」は、特定の染色体の複数のヌクレオチド位置を指す。染色体の領域は、全染色体でも、より小さい区域であってもよい。正常な人では、染色体の領域は、領域を含む染色体の各コピーに対し1つずつの、2つのハプロタイプを持つ。2つのハプロタイプは、染色体の領域中で同じでも異なってもよい。
本明細書で使われる用語の「カットオフ値」は、生物学的試料の分類上の2つ以上の状態(例えば、疾患および非疾患)の間の判定を行うのに使用される数値を意味する。例えば、パラメータがカットオフ値よりも大きい場合は、定量データに対し第1の分類が適用され(例えば、疾患状態);またはパラメータがカットオフ値より小さい場合は、定量データの異なる分類が適用される(例えば、非疾患状態)。
本明細書で使われる用語の「不均衡」は、臨床的に関連する核酸配列の量の参照量からの、少なくとも1つのカットオフ値により規定される何らかの大きな偏差を意味する。例えば、参照量は、3/5の比率であってもよく、従って、不均衡は、測定された比率が1:1の場合に発生することになる。
用語の「配列決定されたタグ」は、全てのまたは一部の核酸分子、例えば、DNA断片から得られる配列を意味する。一実施形態では、例えば、約30bpの断片の一方の末端のみが配列決定される。配列決定されたタグは、次に、参照ゲノムに整列させることができる。あるいは、断片の両末端が配列決定されて2つの配列決定がなされたタグが生成でき、より高い正確さで整列化でき、また、断片の長さを与えることができる。さらに別の実施形態では、直鎖DNA断片を、例えば、連結反応により環状化でき、連結反応部位をまたぐ部分が配列決定できる。
用語の「ユニバーサルシーケンシング(universal sequencing)」は、アダプターが断片の末端に付加され、シーケンシング用プライマーがそのアダプターに付加されている場合のシーケンシングを意味する。従って、いずれの断片も同じプライマーを使って配列決定でき、シーケンシングをランダムに行うことができる。
本明細書で使われる用語の「分類」は、特定の試料の特性に関連する何らかの数字または他の文字(単語を含む)を指す。例えば、「+」記号は、試料が欠失または増幅を有するとして分類されることを意味してもよい。用語の「カットオフ値」および「閾値」は、操作で使用される所定の数値を指す。例えば、カットオフサイズは、それを越える断片が排除されるサイズを指す。閾値は、それを越える、またはそれ未満の場合に、特定の分類が適用される値でありうる。これらの用語のどちらも、これらの文脈のいずれかで使用できる。
用語の「ヒストグラム」は、指定範囲内のいくつかのデータポイントの数を保持しているデータ構造を意味する。例えば、一連の値としてのパラメータ(例えば、胎児DNAパーセンテージ)を提示している染色体の領域の数のデータ構造。
用語の「最適な」は、数値的に1つまたは複数の他の値よりも良いと判断されるいずれかの値を意味する。例えば、最適値は、必ずしも最良の値ではなく、単に基準を満たすのみでよい(例えば、費用関数における前の値からの変化が許容範囲内である)。
発明の詳細な説明
胎児DNAは、妊婦の血漿および血清中に存在することが示されている(Lo et al.Lancet 1997;350:485−487;および米国特許第6,258,540号)。母体の血漿または血清中の胎児DNAの分析は、比較的に非侵襲的であり、母親の血液試料が必要なだけであるという利点がある。出生前検診用の従来の非侵襲的方法、例えば、超音波走査と比べて、母体の血漿または血清中の胎児DNA検査は、胎児の遺伝情報の直接的評価を可能とするであろう。以降で、我々は、母体の血漿または血清(または他の生物学的試料)中のDNAをどのようにして分析し、妊婦が一卵性または二卵性胎児(例えば、一組の一卵性または二卵性双生児)を宿しているか否かを識別する原理を説明する。
最初に、複数の染色体の領域を分析して胎児ゲノム間の差異のレベルを測定し、これを、胎児の接合状態に関する分類を行うために使用する。次に、我々は、複数の座位の2つの異なる父方のハプロタイプが既知で、母親がこれらの座位でホモ接合である場合(母親がヘテロ接合で、父親がホモ接合の例も、考察される)、特定の染色体の領域を分析し、胎児がその領域中で遺伝的に異なるかどうか(例えば、各双生児が異なる父方のハプロタイプを受け継いでいるかどうか)を判定する具体的な例を考察する。両親の遺伝子型情報が既知である場合の他の例、例えば、3つ以上の異なるアレルが特定の座位にある場合も、記載される。その後、見かけの胎児DNA濃度の測定値の変化、または領域全体の他のパラメータの変動を比較および/または特定する技術が記載される。このような技術は、明確な母体の遺伝子型情報を使用してもよく、または胎児および母体のDNAを含む生物学的試料、例えば、妊婦の血漿、の測定により母体の遺伝子型を推定してもよい。多胎児妊娠に対する演繹的技術もまた、説明される。
I.異なる染色体領域を使った接合状態の判定
一卵性胎児は、遺伝的に同じであるが、二卵性胎児は、遺伝的に異なる。遺伝的差異の程度は、同じ両親の家庭に生まれた他の妊娠での他の同胞と類似しているであろう。しかし、統計的確率に従って、二卵性胎児は、ゲノムの一部で同じ遺伝的配列を共有できる。
胎児は、通常、特定の染色体領域に対し、染色体の2つのコピーのそれぞれに1つずつ、2つのハプロタイプ(同じでも同じでなくてもよい)を有する。胎児が一卵性の場合は、胎児は、染色体領域中に同じ2つのハプロタイプを持つであろう。また、二卵性胎児は、所与の染色体領域で、統計的確率に従い同じ対のハプロタイプを持つことができる。実施形態は、複数の染色体領域を分析し、胎児が異なるハプロタイプを受け継いでいるか否かを検出でき、それにより、異なる領域のパーセンテージ(または他のパラメータ)を使って、胎児が一卵性であるか、二卵性であるかを判定できる。規定数の染色体領域を分析して所望の統計的有意性を得ることができる。
A.方法
図1は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を分析して妊婦の胎児の内の少なくとも2人が二卵性であるか否かを判定する方法100を示すフローチャートである。生物学的試料は、胎児および母体のDNAを含む。例えば、妊婦由来の血漿を使用できる。方法100は、本明細書記載のいずれかの方法で可能なように、コンピュータシステムを使って実施できる。
ステップ110では、生物学的試料中の複数の染色体領域のそれぞれに対し、1つまたは複数のアレルが、それぞれの染色体領域中の1つまたは複数のそれぞれの座位で測定される。生物学的試料中のDNAは、種々の技術で分析でき、これらには、その座位の特定のアレルを測定するための、定量ポリメラーゼ連鎖反応(PCR)、デジタルPCR、シーケンシング(例えば、サンガーシーケンシングおよび大量並列シーケンシング)、連結反応、ハイブリダイゼーションおよび質量分析(Sequenom MassARRAYプラットフォーム、等)を含む。シーケンシングに向けて、シーケンシングの前に濃縮ステップを実施し、一連の特定の染色体領域由来のDNA断片の割合を増やすことができる。一実施形態では、このような濃縮ステップは、溶液相(例えば、Agilent SureSelectプラットフォームを使って)、または固相(例えば、Roche NimbleGenプラットフォームを使って)ハイブリダイゼーションを使って行うことができる。測定ステップそれ自体は、いずれか1つまたは複数の上記技術から得られるデータを使って実現できる。例えば、配列決定されたタグを、参照ゲノムに配列させ、配列決定されたタグが得られた、対応するDNA断片の部位およびアレルを特定できる。生物学的試料中のDNAを解析するのに使用できる1つの方法は、選択領域のデジタル解析(DANSR)と呼ばれる技術であり、これは、ハイブリダイゼーション、連結反応、増幅および大量並列シーケンシングを含む(SparksABetal.Am J Obstet Gynecol 2012;doi:10.1016/j.ajog.2012.01.030)。
使用可能な大量並列シーケンシングプラットフォームの例には、Illumina Genome Analyzerプラットフォーム、Life Technologies SOLiD、Ion Torrent and Ion Proton systems、Roche 454 system、HelicosやPacific Biosciences社の単分子シーケンシングシステム、またはナノポアをベースにしたシステム(例えば、Oxford Nanopore Technologiesのシステム)が含まれる。別の実施形態では、標的シーケンシングが行われ、この場合、選択されたゲノム領域(例えば、SNPまたはマイクロサテライト多型等の他のタイプの変異を含む領域)が補足または増幅され、その後、この補足または増幅された領域に対し、大量並列シーケンシングが優先的に行われる。一実施形態では、Agilent SureSelect systemを使って標的シーケンシングが行われる(LiaoGJ et al.Clin Chem 2011;57:92−101)。標的シーケンシングは、また、RocheNimbleGen systemを使って行うこともできる。
デジタルPCRを使って、母体の血漿中のDNA単分子の分析を行うことができる(Vogelstein B and Kinzler KW.Proc Natl Acad Sci USA 1999;96:9236−9241;LoY MD et al.Proc Natl Acad Sci USA 2007;104;13116−13121)。デジタルPCRは、限定されないが、マイクロフルイディクス(Lun FMF et al.Clin Chem 2008;54:1664−1672)、RainDanceプラットフォーム(Kiss MM et al.Anal Chem 2008;80:8975−8981)等のエマルジョンPCR(Dressman D et al.Proc Natl Acad Sci USA 2003;100:8817−8822)を含むいくつかのプラットフォーム使って行うことができる。
ステップ120では、測定されたアレルのそれぞれの量が決定される。例えば、試料中のDNA断片を(例えば、ユニバーサルシーケンシングを使って)配列決定し、配列決定されたタグ(これは、末端タグ対であってもよい)を得ることができ、配列決定されたタグを、参照ゲノムに整列させ、断片のゲノム位置を特定できる。母親および/または胎児のゲノムの座位に変異がある場合は、次に、その座位の別のアレルが測定されることになる。座位の各アレルに対応する断片のそれぞれの量は、追跡できる。特定の座位の特定のアレルのそれぞれの量は、断片の数または比率、同じ多型部位の異なるアレルの間の比率、マイクロアレイハイブリダイゼーションに対するシグナル強度、リアルタイムPCRでの閾値サイクルの数、または閾値サイクルの差異、デジタルPCRで測定したアレルの陽性反応の比率または数、および、質量分析のピーク高さ、等の種々の方法で測定できる。
ステップ130では、複数の染色体領域のそれぞれに対し、測定されたアレルのそれぞれの量に基づいて、それぞれの染色体領域の第1の親由来の異なるハプロタイプを胎児の内の2人が受け継いでいるか否かが判定される。1人の胎児が第1のハプロタイプを受け継ぎ、もう1人の胎児が異なるハプロタイプを受け継いでいる場合は、これは、二卵性の指標である。3人以上の胎児の場合は、一組は、同じハプロタイプを受けつぎ、別の組は異なるハプロタイプを受けつぐことが可能である。一実施形態では、異なるハプロタイプの継承は、1つまたは複数の座位のアレルの測定されたデータから推測可能である。例えば、演繹的方法を使って、下記に示すように、胎児のゲノムの差異を特定することができる。
別の実施形態では、片方または両方の親由来の遺伝子型情報が既知であってもよい。このような情報は、1つの座位のみからの測定値を使って異なるハプロタイプが第1の親から受け継がれている部位の判定を可能とする。例えば、親の第1の座位の3つの異なる遺伝子型がある場合、第1の座位だけを使って判定できる。しかし、座位に2つの遺伝子型しか存在しない場合は、別の座位の測定値が必要となろう。いくつかの例が以降で示される。
染色体領域で複数の座位が使われている場合は、その座位由来のデータは、種々の方法で組み合わせることができる。例えば、アレルが特定のハプロタイプと関連していることがわかっている場合は、特定の座位の特定のアレルを有する断片の数の計数は、実質上、特定のハプロタイプの断片の数の計数になる。例えば、第1の親(例えば、父親)の第1のハプロタイプに対応するいくつかの断片の数を、第1のハプロタイプのアレルおよび座位を有する断片の数を加え合わせることにより求めることができる。あるいは、測定を、それぞれの座位に対し独立に行うことができ、それぞれの座位の測定値の一致性を比較できる。
ステップ140では、胎児の内の少なくとも2人が第1の親由来の異なるハプロタイプを受け継いでいる染色体領域の第1の量が求められる。第1の量は、単に胎児間で差異を有すると特定されている染色体領域の数であってもよい。別の例のように、第1の量は、胎児間で差異を有すると特定されている染色体領域の割合であってもよい。
ステップ150では、第1の量が1つまたは複数のカットオフ値と比較され、2人の胎児が一卵性であるか二卵性であるかが決定される。例えば、第1の量は、10%等のパーセンテージ(または他の比率)であってもよく、この量は、カットオフ値と比較でき、5%を越える場合は二卵性に分類される。カットオフ値は、所望の正確さ、ステップ130での判定の正確さ、使った染色体領域の数、ならびに集団中の異なる染色体領域の結合不均衡および分析した異なる染色体領域間の組換え確率に基づいて決定できる。これらについては次のセクションで記述する。一態様では、3人以上の胎児が存在する場合、決定は、一組が二卵性であることのみが可能であり、従って、別の組が一卵性である可能性を残す。
B.ハプロタイプ検出に対する統計的分析
上述のように、染色体領域の親由来の両方のハプロタイプ(すなわち、異なる場合)の継承は、双生児が一卵性ではなく二卵性であることを示す。例えば、染色体領域の第1の座位での父方の両方のハプロタイプの検出は、その組の双生児が二卵性であることを示すであろう。しかし、母体の血漿試料中の染色体領域で父方の1つのみのハプロタイプの検出に対しては、いくつかの説明が可能である。
第1に、2人の胎児は、染色体領域で父親由来の同じ父方のハプロタイプを単に偶然に受け継ぐ場合がある。それらが一組の一卵性双生児である場合は、全ゲノム領域にわたり、父親由来の同じ父方のハプロタイプを常に受け継いでいるであろう。しかし、たとえそれらが二卵性双生児であるにしても、いずれの特定の領域に対しても、父親由来の同じ父方のハプロタイプを受け継ぐ50%の確率がある。しかし、その1組の二卵性双生児が同じ父方のハプロタイプを全ゲノム領域にわたり受け継ぐ可能性はほとんど無いであろう。
別のシナリオでは、2人の二卵性双生児胎児は、異なる父方のハプロタイプを受け継いでいる可能性があるが、不適切なサンプリングが原因で、特定の分析により1つの父方のハプロタイプのみが検出される。これらの種々のシナリオの発生する確率は、特定の染色体領域に対し分析される母体血漿試料中の胎児DNA濃度比率および母体血漿DNA分子の数に依存する。以下に我々は、染色体領域に対応するどのくらい多くの分子およびどのくらい多くの染色体領域を使って、充分な統計的検出力を有するロバストな分類に到達し、不適切なサンプリングが原因の誤ったハプロタイプ解釈の確率を最小限にすることができるかに関する計算を提供する。
特定の染色体領域に対応する分析に必要な分子の数は、下記の方式で決定できる。母体血漿中に父方のハプロタイプが存在する場合、特定の母体血漿DNA試料中でそれを検出する確率は、その父方のハプロタイプを持つ胎児DNA濃度比率および分析される分子の合計数に依存し、ポアソン分布に従う。
表1は、母体血漿中に存在する父方のハプロタイプを有するが、特定の試料中で検出されない確率が1%未満であるような、分析に必要な染色体の対象領域に対応する分子の数を示す。この表は、次の式:0.01>exp(−Nxf/2)、に基づいて計算される。式中、Nは、分析に必要な分子の数;fは、ただ1組の双生児胎児により与えられる胎児DNA濃度比率;およびexpは指数関数である。分子の数は、染色体領域を分析するのに使用されるいずれかの座位でのDNA断片の数である。父方のハプロタイプ検出の所望の確実性を得るために、分析に必要な分子の数は、染色体領域中の1つの座位を表1に示す数まで測定することにより得ることができる。あるいは、同じ染色体領域中のいくつかの座位を分析する場合は、座位当たりの分析に必要な分子の数は、座位の数と、座位当たり分析される分子の平均数の積が表1の分子数に達する程度まで減らすことが可能であろう。
Figure 0006068598
分析に必要な染色体領域の数も、決定できる。染色体領域は、結合不均衡ではないと仮定して、2人の二卵性双生児が異なる父方のハプロタイプを受け継いでいる確率は、それぞれの異なる染色体領域に対し、50%となるであろう。染色体領域の数をnとすると、これらのn染色体領域のそれぞれに対し、1組の二卵性双生児が同じ父方のハプロタイプを受け継いでいる確率は、2-nとなるであろう。従って、7つの独立した染色体領域分析される場合、それぞれの7領域に対し、1組の二卵性双生児が同じ父方のハプロタイプを受け継いでいる確率は、1%未満であろう。この場合、ステップ140のカットオフを、14%とすると、7つの領域の内の異なる遺伝性ハプロタイプを示す1つの領域は、二卵性の分類が割り当てられるであろう。1つの領域の絶対値もまた、使用可能である。多数の領域(例えば、50または100)を使用する場合は、受け継がれた異なるハプロタイプを示す1つまたは複数の領域が許容されうるが、その場合でもまだ一卵性の分類が割り当てられる。
II.親の遺伝子型を使った胎児ハプロタイプの特定
上述のように、染色体領域の1つまたは複数の座位での親遺伝子型を使って、2人の胎児が親由来の異なるハプロタイプを受け継いでいるか否かを判定するのを支援できる。例えば、双生児妊娠の妊婦から採取された母体血漿試料中の同じゲノム領域に対応する2つの異なる父方のハプロタイプの検出を使うことができる。下記の分析は、2つの異なる父方のハプロタイプの検出に基づく試料に注目しているが、技術のアレンジにより、2つの異なる母方ハプロタイプへの適用も可能である。
a.2つの座位でのSNP分析
図2Aは2つの異なる座位に対し母親の遺伝子型がわかっており、所与の染色体領域に対し父親のハプロタイプが解っている場合の、接合状態を判定する例を示す。この実施形態は、双生児の母親妊婦がホモ接合で、双生の父親がヘテロ接合であるSNP座位に注目している。図2Aに示す例では、母親は、SNP座位1および2でホモ接合であり、それぞれ遺伝子型AAおよびTTである。父親はSNP座位1および2でヘテロ接合であり、それぞれ遺伝子型ACおよびGTである。
座位1および2は、接近している、すなわち、組換えが起こりそうもない(例えば、2つの座位間で組換え発生確率<0.1%)と仮定して、2つの座位のアレルは、胎児により一緒に受け継がれ、ハプロタイプを形成するであろう。母親は座位1および座位2の両方でホモ接合であるので、母親は2つの同じハプロタイプを持つ。我々は、これらの同じ母体のハプロタイプをHap IおよびHap IIと定義する。他方、父親は、2つの異なるハプロタイプを有し、我々は、図2Aに示すように、それらをHap IIIおよびIVと定義する。
妊婦が一組の一卵性双生児を宿している場合、2人の胎児の遺伝的構成は、同じであろう。換言すれば、2つの父方のハプロタイプの1つのみが、これらの2人の双生児胎児により受け継がれるであろう。図示した例では、両方の胎児が父親由来のHap IIIを受け継いでいる。
母体血漿試料が分析される場合、座位1でアレルAのみが検出されるであろう。理由は、母親および両方の胎児がアレルAに関しホモ接合であるからである。分析された座位1に対応する分子の数が充分に大きい場合、母体血漿中のCアレルの非存在は、胎児のどちらもHap IVを父親から受け継いでいないことを示す。分析に必要な分子の数は、例えば、表1に示すように、母体血漿試料中のCアレルの存在の除外に必要な母体血漿DNA試料中の胎児DNA濃度比率および統計的検出力に依存するであろう。
他方、TおよびGアレルの両方は、母体血漿試料中の座位2で検出されるであろう。母親がTアレルに対しホモ接合のであるので、これは、胎児の内の少なくとも1人が父親由来のHap IIIを受け継いでいることを示す。座位1および座位2由来の情報をまとめると、両方の胎児が父親由来のHap IIIを受け継いでいる可能性がある。
二卵性双生児の状況では、2人の双生児胎児は、父親由来の異なるハプロタイプを受け継いでいる可能性がある。図2Aの例では、双生児1は、Hap IIIを受け継いでおり、双生児2は、父親由来のHap IVを受け継いでいる可能性がある。従って、母体血漿中では、AおよびCアレルの両方が座位1で検出される可能性があり、GおよびTアレルの両方が、座位2で検出される可能性がある。座位のアレルの検出は、定量化され、検出が不正確ではない(例えば、分析誤差が原因で、特定のタイプの1つか2つのアレルのみが測定される)ことを保証できる。例えば、特定のタイプのアレルの数が、測定され、閾値と比較でき、特定のアレルの統計的に有意な量が測定されていることが保証される。カットオフは、試料の測定値の数(例えば、特定の座位に対し測定されたアレルの数)に基づいて変更できる。例えば、ある座位に対し1,000アレルが測定された場合、閾値は、その座位で100アレルのみが測定された場合よりも大きくできる。従って、測定量が閾値を超える場合は、アレルが検出されていると見なすことができる。
これらの知見は、父方のHap IIIおよびHap IVの両方が、母体血漿中に存在していることを示す。それぞれの胎児は、父親由来の1つのハプロタイプを受け継ぐことのみが可能であるから、これらの知見は、2人の胎児が父親由来の異なるハプロタイプを受け継ぎ、従って、2人の胎児は遺伝的に異なることをさらに示す。従って、例えば、この染色体領域または他の染色体領域由来のデータと組み合わせて使うだけで、2人の胎児は、座位1および2を含む染色体領域に対し異なるハプロタイプを受け継いでいると特定でき、そのため、2人の胎児は、一組の二卵性双生児であると判断できる。
従って、第1の親が父親の場合、第1の親の2つのハプロタイプは、第1の染色体領域に対し、複数の座位で決定できる。例えば、Hap IIIおよびHap IVが、特定の染色体領域に対し決定できる。胎児の内の2人が第1の親由来の第1の染色体領域の異なるハプロタイプを受け継いでいるという判定は、以下のように進めることができる。第1の座位および第2の座位(例えば、座位1および座位2)は、第1の親がヘテロ接合である第1の染色体領域中で特定でき、座位1および座位2の父性的に特有のアレル(すなわち、母体のゲノム中には現れない)は、同じ父方のハプロタイプ上には存在しない。
統計的に有意な量の第1の座位の第1の親の第1のハプロタイプが、生物学的試料中で検出できる。上述のように、母親が第1のアレル(座位1のA)に対しホモ接合であり、父親が第1のハプロタイプ上の第2のアレル(座位1のHap IV)を有するヘテロ接合である場合に、これが実現される。第2のアレル(座位1のC)を有するDNA断片の数を検出し、カットオフ値(閾値)と比較して、統計的に有意な量の第1のハプロタイプが検出されているか否かを判定できる。第2のアレルを含むDNA断片の数(第2のアレルの測定量の1例)は、そのままで(例えば、カットオフは絶対数でもよい)で、または正規化して(例えば、カットオフは、比率であってもよい)使用できる。
次に、第2の座位の第1の親の第2のハプロタイプの統計的に有意な量が、生物学的試料中で検出できる。上述のように、第3のアレル(座位2のT)に対し母親がホモ接合で、父親が第2のハプロタイプ上の第4のアレル(座位1のG)を有するヘテロ接合(座位2のHap III)である場合にこれが実現できる。第4のアレル(座位1のG)を有するDNA断片の数を検出し、カットオフ値(閾値)と比較して、統計的に有意な量の第1のハプロタイプが検出されているか否かを判定できる。第3および第4のアレルは、再度AおよびCであってもよいが、Hap III上のCを伴うことに留意されたい。
従って、一実施形態では、ある染色体領域に対し、第1の親の第1のハプロタイプが、いずれかの胎児により受け継がれているか否かを判定できる。第1のハプロタイプが受け継がれている場合は、その染色体領域に対し、第1の親の第2のハプロタイプがいずれかの胎児により受け継がれているか否かが判定される。その染色体領域に対し第2のハプロタイプもまた受け継がれている場合は、胎児は、二卵性に分類される。上記の考察は第1の親が父親であった場合の1つの例を提供したが、以降で、第1の親が母親である場合の1つの例を提供する。
また、2つの母体のハプロタイプの定量分析を使って、2人の胎児が一卵性であるか、二卵性であるかの判定をすることができる。図2Bは、父親の2つの異なる座位での遺伝子型および所与の染色体領域に対する母親のハプロタイプが解っている場合に、接合状態を決定する1つの例を示す。2人の胎児が一卵性であるシナリオでは、2人の胎児は、全ての染色体領域に対し同じ母体のハプロタイプを受け継いでいるであろう。胎児に受け継がれているハプロタイプは、母体血漿中により高濃度で存在する可能性がある。2つの母体ハプロタイプの濃度の差異は、母体血漿中の胎児DNA濃度比率に比例する。これは、20%胎児DNA濃度に比例する差異により、BアレルよりもAアレルが高頻度に発生する座位1に関して、図2Bに示されている。座位2に関しては、アレルBに対し父親がホモ接合であるために、等量のアレルAおよびアレルBが存在する。胎児が、等しくないパーセンテージの胎児DNAを与える場合は、座位1でのアレルBに対するアレルAの比率は、合計胎児DNAパーセンテージ(すなわち、個別胎児DNAパーセンテージの合計)に依存するであろう。胎児が等しくないパーセンテージの胎児DNAを与える場合は、座位1のアレルBに対するアレルAの比率は、合計胎児DNA濃度比率(すなわち、個別胎児DNA濃度比率または胎児DNAパーセンテージの合計)に正の相関を持つであろう。本発明では、用語の胎児DNA濃度比率および胎児DNAパーセンテージは、同義に使用される。
他方、2人の胎児が二卵性である場合は、2人の胎児は、いずれかの染色体領域で異なる母体のハプロタイプを受け継いでいる可能性がある。2人の胎児が特定の染色体領域で異なる母体のハプロタイプを受け継いでいる場合は、2つの母体のハプロタイプは、母体血漿中に等量で存在するであろう。従って、1つまたは複数の染色体領域で2つの母体ハプロタイプの等しい出現は、一組の二卵性双生児の存在を示すのに使用できる可能性がある。この等しい出現は、座位1および座位2の両方に対し、アレルAおよびBの間の同じ差異として顕在化するが、過剰出現アレルは異なる。過剰出現アレルは、異なるハプロタイプ由来であるという事実を使って、胎児が母親の特定された異なるハプロタイプを有することを識別できる。過剰出現の程度は、合計胎児DNAパーセンテージの半分(示されているように10%)であることに留意されたい。このような現象は、後程さらに詳細に考察される。胎児が等しくないパーセンテージの胎児DNAを与える場合は、座位1のアレルBに対するアレルAの比率は、双生児1により与えられる胎児DNAパーセンテージに依存し、座位2のアレルBに対するアレルAの比率は、双生児2により与えられる胎児DNAパーセンテージに依存するであろう。Hap I上のアレルは、両方の座位で同じである必要はないことに留意されたい。
従って、母体のハプロタイプが第1の座位および第2の座位でわかっている場合、検出対象の母親の異なるハプロタイプを検出できる方法がある。図2Bに示すように、父親が、第1の座位の第1のアレル(図中のA)に対しホモ接合であり、母親が、第1の座位の第1のアレルおよび第2のアレル(図中のB)に対しヘテロ接合である。第1のアレルは、母親の第1のハプロタイプ(Hap I)上にあり、第2のアレルは、第2のハプロタイプ(Hap II)上にある。第1の座位の第1の親の第1のハプロタイプの検出には、第1の座位で測定されたそれぞれの量の第1のアレルが、第2の座位で測定されたそれぞれの量の第2のアレルよりも統計的に有意な量だけ大きいことの判定を含むことができる。これは、110:90の比率で示される。一実施態様では、カットオフ値を使って、その値間の差異が統計的に有意であることを保証することができる。
第2の座位に対しては、父親が第2の座位の第3のアレル(Bで示されるが、Aを含むいずれのアレルでもよい)に対してホモ接合であり、母親が第1の座位の第3のアレルおよび第4のアレル(Aで示す)に対し、ヘテロ接合である。第3のアレルは、母親の第1のハプロタイプ上にあり、第4のアレルは、第2のハプロタイプ上にある。生物学的試料中の第2の座位の第1の親の第2のハプロタイプの検出には、第2の座位で測定されたそれぞれの量の第4のアレルが、第2の座位で測定されたそれぞれの量の第3のアレルよりも統計的に有意な量だけ大きいことを判定することを含むことができる。
b.他のタイプの多型に対する分析
上記の例は、ある染色体領域に対し、異なるハプロタイプが第1の親から引き継がれているか否かを判定するために使われる座位で、異なるヌクレオチドを含んでいた。しかし、SNP以外の多型も、異なる父方のハプロタイプのマーカーとして使用可能である。他のタイプの多型の例には、限定されないが、マイクロサテライト、制限断片長多型、挿入/欠失多型、およびコピー数多型(CNV)が含まれる。このような他の多型は、図2Aおよび2Bの構成を生じうるが、この場合、第1のアレルおよび第2のアレルは、これらの他の多型の1つから生ずる。いずれの多型に対しても、また、3つ以上のアレルが存在しうる。一例を下記に示す。
図3は、また、座位が4つの異なるアレルを有する場合のマイクロサテライト分析の一例を示す。マイクロサテライトは、ゲノム中の可変数の短いタンデム反復(STR)を含む多型性の領域である。この例では、母親は、このマイクロサテライト領域に対し、2つの異なるアレル、すなわち、4および7反復から成るそれぞれアレルIおよびアレルIIを有する。父親もまた、2つのアレル、すなわち、5および8反復から成るそれぞれアレルIIIおよびアレルIVを有する。従って、座位は、事実上、親中の4つの異なるアレルを有する。
一組の一卵性双生児の遺伝的構成は同一であると思われるので、それらは同じ父方のアレルを受け継いでいるであろう。結果として、1つのみの父方のアレルが母体血漿中で検出できる。この例では、5反復を有する父方のアレルIIIのみが、4反復を有する母体のアレルIと一緒に、母体血漿試料中で検出されるであろう。所与の染色体領域に対し、複数の座位が分析され、それぞれの座位に対し、ただ1つの父方のアレルが母体血漿試料中で検出可能である場合、上述のように、双生児が一卵性である確率を統計的に決定可能であろう。
他方、その一組の双生児が二卵性である場合、2人の双生児胎児は、異なる父方のアレルを受け継ぐことができる。図3に例示されているように、二卵性双生児の1人が、父親由来のアレルIIIを受け継ぎ、もう1人が、アレルIVを受け継ぐ。結果として、両方の父方のアレルが、例えば、上述の検出方法により、母体血漿試料中で検出可能である。換言すれば、両方の父方のアレルが母体血漿試料中で同時に検出できる場合は、胎児が染色体異常(例えば、胎児が、その座位でトリソミーである)を持たない限り、双生児胎児は、二卵性であろう。母親がその座位で、例えば、反復数4(またはいずれかの他のアレルの多型)に対し、ホモ接合である場合、類似の分析を行うことができる。
従って、多型が3つ以上のアレルを有する状況では、両方共妊婦のゲノム中には存在しない2つの父方から受け継いでいるアレルが母体血漿中で検出される場合は、二卵性双生児妊娠を検出可能である。一実施形態では、母体血漿中のこのような遺伝子型パターンは、双生児妊娠の存在の超音波による証拠により支持されうるであろう。このような超音波による双生児妊娠の証拠がない場合には、このような血漿遺伝子型パターンは、トリソミー胎児の存在を示すと思われる(Ghanta S et al.PLoS ONE 2010;5:e13184)。
III.ゲノム領域の変異の特定
前のセクションでは、染色体領域の異なるハプロタイプが第1の親から受け継がれているか否かを判定する技術の例を記載した。このような例では、親遺伝子型情報は、両親に関し既知であり、分析に使用された。下記の説明では、親の遺伝子型は、使用することができるが必要ではない。例えば、胎児DNA濃度(または他のパラメータ)は、二卵性胎児に対し、種々の座位で異なる値を示すであろう。
A.一般的方法
図4は、本発明の実施形態に従って、多胎児を宿す妊婦の生物学的試料を分析し、妊婦の胎児の内の少なくとも2人が第1の染色体領域に関し遺伝的に異なるか否かの判定をする方法400を示すフローチャートである。他の方法と同様に、生物学的試料は、胎児および母体のDNAを含む。方法400は、方法100のステップ130を実行するために使用できる。
ステップ410では、妊婦の遺伝子型が、第1の染色体領域内の1つまたは複数の第1の座位のそれぞれで決定される。第1の座位は、妊婦が、1つまたは複数の第1の座位のそれぞれでホモ接合であるか、または1つまたは複数の第1の座位のそれぞれでヘテロ接合であるような座位である。従って、それぞれの第1の座位は、母体の遺伝子型に関し同じカテゴリー(すなわち、ホモ接合またはヘテロ接合)である。遺伝子型は、種々の方法で決定できる。例えば、妊婦の全血由来の主に母体のDNAのみが存在するバフィーコートまたは細胞ペレットレイヤー、または他の母体のみの試料を分析できる。標準的遺伝子型技術を使用できる。別の例として、遺伝子型は、胎児および母体のDNAを含む生物学的試料の分析から推定できる(このような技術は、下記でさらに詳細に説明される)。
それぞれの第1の座位は、主要アレルおよび副次的アレルを示し、すなわち、生物学的試料は、それぞれの座位に対し、主要アレルおよび副次的アレルを含む。母親が第1の座位でホモ接合である場合は、副次的アレルは、胎児の内の少なくとも1人から与えられる。このような状況では、それぞれの座位は、主要アレルおよび副次的アレルを有し、主要アレルは、副次的アレルよりも量が多い。母親がヘテロ接合で、胎児の内の少なくとも1人がホモ接合の場合、主要アレルは、また、副次的アレルより量が多い。しかし、母親がヘテロ接合で、胎児の全ても、ヘテロ接合である(同じアレルに対し)場合は、主要アレルも、副次的アレルも、どちらも量的に他方より多いことはない。各座位が主要アレルおよび副次的アレルを有するという事実は、種々の方法で、例えば、アレルを検出することにより(ステップ420参照)または親遺伝子型を知ること(演繹的または系統的)により、測定できる。
ステップ420では、それぞれの第1の座位のそれぞれの主要アレルおよび/またはそれぞれの副次的アレルが、生物学的試料中で検出できる。主要アレルのみ、または副次的アレルのみが検出される場合の実施形態では、親遺伝子型に関するいくつかの情報を介して、他のアレルの存在を知ることができる。例えば、副次的アレルBが検出され、母親がある座位の主要アレルAに対しホモ接合であることがわかっている場合は、生物学的試料がその座位で2つのアレルを有することが決定できる。このような1つの例は、母親がRhD陰性(従って、RHD遺伝子の非存在により表されるアレルに対するホモ接合)であり、RHD遺伝子が生物学的試料中で検出される場合である。それぞれの座位の両方のアレルもまた、検出される。
主要および副次的アレルがある座位に存在することがわかっている場合は、胎児遺伝子型は、実質上類似のカテゴリーにあると特定できる。例えば、母親が、その座位の1つでアレルAに対しホモ接合である場合、アレルAは、主要アレルであろう。さらに、副次的アレルBが検出されることから、胎児の内の少なくとも1人がヘテロ接合であることがわかる。従って、全ての第1の座位は、カテゴリーAAABに入るであろう。ここで下付文字は胎児の内の少なくとも1人がヘテロ接合であることを示す。母親がヘテロ接合のABで、胎児の内の少なくとも1人がホモ接合のAAである場合の一例では、Bが、再度、副次的アレルで、Aが主要アレルであろう。この場合では、全ての第1の座位は、カテゴリーABAAに属し、下付文字は胎児の内の少なくとも1人がホモ接合であることを示す。
ステップ430では、第1の量の1つまたは複数の主要アレルおよび/または第2の量の1つまたは複数の副次的アレルが生物学的試料中の1つまたは複数の座位で測定される。各座位は、異なる主要アレルを持つことができるが、それぞれの主要アレルの量は、組み合わせて(例えば、合算して)、第1の量を得ることができる。同じことは、第2の量に対しても行うことができる。一実施形態では、第1の量のみが決定される。別の実施形態では、第2の量のみが決定される。さらに別の実施形態では、第1と第2の量の両方が決定される。ステップ420および430は、同時に達成でき、従って、実質的に同じステップでありうる。
ステップ440では、第1の量または第2の量に対する正規化パラメータが得られる。一実施形態では、正規化パラメータは、第1の領域に対する比率のパラメータ値(例えば、胎児DNA濃度比率)を計算することにより得られる。この場合、比率は、第2の量に対する第1の量の比率である。一態様では、第1の染色体領域で2人の胎児が遺伝的に異なる(例えば、1人のみがヘテロ接合)場合、実際の胎児DNA濃度とは異なる可能性があるために、胎児DNA濃度比率は、見かけの値である。別の実施形態では、正規化パラメータは、検量方式、すなわち、期待値と同じ、またはそれに相関した方式で得られる。これに関しては下記で説明される。相関方式は、一定の差異または比率(例えば、1つの技術は、別の技術の値の1.2倍の値を常に与える)の再現性のよい値を提供する、または、ひとつの技術から得られた結果を別の技術の期待値に変える変換曲線が存在するいずれの方法であってもよい。従って、正規化パラメータは、それが較正方式で得られる場合は、単に、第1の量(または、第2の量)であってもよい。
正規化パラメータは、また、別の染色体領域内の1つまたは複数の座位由来の第3の量の1つまたは複数の他の配列(例えば、アレルまたはホモ接合配列)を計算することにより決定でき、第3の量を使って第1の量または第2の量を正規化できる。このような正規化(ならびに他のタイプの正規化)は、他の領域に対し異なる技術または非較正技術を使って計算された量の比較を可能とする。較正された技術では、第1の量または第2の量を他の領域由来の測定値と比較できる。第1の量または第2の量の使用により、同じ情報を伝達できる。
ステップ450では、胎児が第1の染色体領域で遺伝的に同じである場合、正規化パラメータがカットオフ値と比較され、正規化パラメータが期待値と統計的に異なるか否かが判定される。例えば、1人のみの胎児がヘテロ接合である場合、全ての胎児がヘテロ接合であるか、またはホモ接合である場合の数に比べて、副次的アレルの数は異なるであろう。期待値(例えば、胎児DNA濃度)は、例えば、他の染色体領域由来の生物学的試料の測定値から、染色体Y配列の量を定量して、または1つまたは複数のエピジェネティックマーカーを使って、得ることができる。これについては、下記でより詳細に説明される。他の期待値は、胎児DNA濃度のこのような測定値から得ることができ、または直接測定でき、従って、期待値は、胎児DNA濃度期待値に限定されない。
カットオフ値は、所望の正確さに基づき選択できる。例えば、期待値の測定値の標準偏差を知ることができる。この場合、カットオフは、期待値マイナス(または、場合によってはプラス)標準偏差(SD)の3倍になるように選択できる。この方式の実施形態では、正規化パラメータの期待値との差異(または、1からの比率の偏差)が、カットオフ値との関係に基づいて統計的に有意であることを判定できる。他の実施形態では、カットオフは、2.0、2.5、3.5、または4SDであってもよい。
ステップ460では、カットオフ値に対する正規化パラメータの比較に基づいて、妊婦の2人の胎児が二卵性であるか否かが判定される。例えば、正規化パラメータが統計的に期待値と異なる場合は、妊婦の2人の胎児が第1の染色体領域で遺伝的に異なることが判定できる。正規化パラメータが統計的に期待値と異ならない場合は、胎児は、一卵性であると判定できる。染色体領域のこのような測定を例えば、上述のステップ150のためのような接合状態の決定用の、他の染色体領域の測定由来の測定値と組み合わせることができる。あるいは、第1の染色体領域で同じでない2人の胎児の測定により、他の染色体領域の測定値がなくとも、二卵性の分類を付与することができる。
B.見かけの比率パラメータ(胎児DNA濃度)
上述のように、ステップ440での正規化パラメータは、第1の量および第2の量を含む比率値であってもよい。図5は、第1の染色体領域の見かけの比率パラメータ(例えば、胎児DNA濃度)を決定することにより、妊婦の胎児の内の少なくとも2人が、第1の親由来の第1の染色体領域で遺伝的に異なるか否かを判定する方法500を示すフローチャートである。方法500は、方法400と同様に、多胎児を宿す妊婦の生物学的試料を分析する。方法500は、母親が第1の座位でホモ接合である状況に対し説明されているが、この方法は、母親がヘテロ接合の場合の座位に対しても同様に適用できる。
ステップ510では、妊婦がホモ接合で、胎児の内の少なくとも1人がヘテロ接合である第1の染色体領域内の1つまたは複数の座位が特定される。このような状況下で、各座位は、主要アレルおよび副次的アレルを有し、主要アレルは副次的アレルより量が多いであろう。例えば、母親がアレルAに対しホモ接合の場合、アレルAは、主要アレルであろう。あるいは、妊婦がヘテロ接合で、胎児の内の少なくとも1人がホモ接合である1つまたは複数の座位が特定でき、この場合、胎児に対しホモ接合のアレルが主要アレルであろう。
このような座位は、ステップ110のような測定ステップから得られるアレルを分析することにより特定できる。例えば、特定の座位のアレルの測定により、大部分がアレルA(主要アレル)で、例えば、70%超であり、唯一の他のアレル(例えば、T)が有意な量で計数されることを示すことができる。このような測定により、母親がアレルAに対しホモ接合で、提示の内の少なくとも1人がアレルTに対しヘテロ接合であることを示すことができる。異なるカットオフ値(例えば、より高い副次的アレル比率)を使って、母親がヘテロ接合で、胎児の内の少なくとも1人がホモ接合であるかどうかを判定できる。座位が上記条件を満たすか否かを判定するための種々のカットオフ値が、仮定または測定された胎児DNA濃度に基づいて決定できる。米国特許出願第12/940,993号は、このような技術を1人の胎児を宿す妊娠に対し、より詳細に説明している。以下のセクションで、多胎児妊娠における座位に対し遺伝子型情報を得るためのさらに複雑な方法を提供する。
ステップ520では、1つまたは複数の主要アレルの第1の量qが、生物学的試料中の1つまたは複数の座位で測定される。各座位は、異なる主要アレルを持つことができるが、各主要アレルの量を、組み合わせて(例えば、合算して)、第1の量を得ることができる。この方式では、複数の座位が使用されるため、染色体領域に対する分析の読み深度が基本的に拡大する。例えば、限られた量のアレルが各座位で測定可能であるが、座位全体として考えると、統計的ロバスト性を得るのに充分な数のアレルが測定できている。染色体領域内の座位は、座位間の組換えの確率が低く、例えば、1%未満になるように選択できる。
ステップ530では、1つまたは複数の副次的アレルの第2の量pが、生物学的試料中の1つまたは複数の座位で測定される。類似の方式で、各座位は、異なる副次的アレルを持つことができるが、各副次的アレルの量は、組み合わせて(例えば、合算されて)、第2の量を得ることができる。副次的アレルは、座位の間の異なるハプロタイプから生じることも可能である。
ステップ540では、第1の量および第2の量から第1のパラメータが決定される。第1のパラメータは、第1の量および第2の量の間の相対量を提供する。例えば、第1のパラメータは、F=2p/(p+q)として計算される胎児DNA濃度比率Fの値であってもよい。他の例には、2つの量の何らかの比率、第1の量の関数の比率、またはこのような比率の関数が含まれる。別の例は、2つの量の差異で、正規化されてもよい。
ステップ550では、第1の染色体領域で2人の胎児が遺伝的に同じである場合、第1のパラメータがカットオフ値に対し比較され、第1のパラメータが統計的に期待値と異なるかどうかが判定される。例えば、両方の胎児が、第1の染色体領域中の座位で主要および副次的アレルに対しヘテロ接合である場合、第1のパラメータは、上式が使用される場合、合計胎児DNA濃度に等しくなければならない。しかし、また、胎児の1人が、その座位でホモ接合である場合、胎児DNA濃度は、合計胎児DNA濃度よりも低いであろう。胎児DNA濃度期待値は、生物学的試料の測定値、例えば、両方の胎児が男児であることがわかっている(例えば、超音波走査により)場合は、他の染色体領域から、染色体Y配列の量を測定して、または1つまたは複数のエピジェネティックマーカーを使って、得ることができる。これら両方については、後程さらに詳細に記載される。他の期待値は、胎児DNA濃度のこのような測定値から、または直接測定により得ることができ、従って、期待値は、胎児DNA濃度期待値に限定されない。
ステップ560では、カットオフ値に対する第1のパラメータの比較に基づいて、妊婦の2人の胎児が二卵性であるか否かが判定される。例えば、第1のパラメータが統計的に期待値と異なる場合に、妊婦の2人の胎児が第1の染色体領域で遺伝的に同じでないことが判定できる。正規化パラメータが期待値と統計的に異ならない場合は、胎児は、一卵性であると判定できる。第1のパラメータが胎児DNA濃度比率の場合には、第1のパラメータは、見かけの胎児DNA濃度比率でもよく、実際の胎児DNA濃度比率でなくともよい。胎児DNA濃度比率の計算は、2人の胎児が二卵性である場合には異なる可能性があり、従って、計算された値が、実際の胎児DNA濃度比率ではないという理由から、用語の「見かけの」が使われる。
従って、母体血漿試料中の見かけの胎児DNA濃度比率(F)は、母親がホモ接合で、双生児の内の少なくとも1人に対しヘテロ接合である多型座位(例えば、SNP座位)で、式:
F=2p/(p+q)、
により決定できる。
式中、pは、胎児特異的アレルを含むDNA分子の数で、qは、胎児および母親で共通のアレルを含むDNA分子の数である。見かけの胎児DNA濃度比率分析に適するSNP座位は、本出願の前のセクションで記載のように、2つの異なるアレルが母体血漿中で個別SNP座位に対し検出される座位である。このような座位は、母親がホモ接合であるか、またはヘテロ接合のタイプでよいが、領域は、比較時に同じタイプでなければならない。
胎児DNA濃度比率の計算のために、1つのSNP座位または複数のSNP座位由来の情報が使用できる。複数のSNP座位から読み取られた数は、一緒に合算できる。換言すれば、ゲノム全領域のSNP座位が「グループ」に分割される。1つのグループの座位は、好ましくは、同じ隣接の一続きのDNAであるべきである。一実施形態では、このようなグループは、同じ染色体腕上のSNPを含む。別の実施形態では、このようなグループは、1kb、5kbまたは10kbのヒト続きのDNA内のSNPを含む。各グループ内のSNP座位の数は、胎児DNA濃度比率の所望の測定精度および各SNP座位の読み深度(すなわち、各SNP座位が検出され、定量される回数)に依存するであろう。一態様では、所望の濃度比率の測定精度は、2つの異なるSNP座位グループが同じか、または少なくとも2つの異なる見かけの胎児DNA濃度比率を有するかどうかの判定を可能にする最低限の精度であろう。
各SNP座位の読み深度を高めることで、胎児DNA濃度比率を正確に測定するのに必要なSNPの数を減らすことができる。一実施形態では、目的のSNP座位に対する読み深度は、標的シーケンシング手法により深めることができる(Liao GJ et al.Clin Chem 2011;57:92−101)。この手法では、血漿DNA分子が、最初に目的領域中の配列に相補的なプローブにハイブリダイズされ、捕捉された分子が大量並列シーケンシングに供せられる。必要な分子の数に関する計算は、以降のセクションで考察される。
C.異なる領域に対する量の期待値としての使用
上述のように、期待値は、別の染色体領域の分析から決定できる。例えば、第2のパラメータが、第2の染色体領域に対し決定でき(例えば、上述と類似の方式で)、このような値を期待値として使用できる。全ての胎児がヘテロ接合、例えば、第2の染色体領域に対し、ある座位でA:T(例えば、母親がホモ接合のA:Aで、父親がT:Tであることがわかっている場合)である場合は、2つのアレルの2つの量から得た第2のパラメータを、合計胎児DNA濃度の期待値とすることができる。その後、第1の領域に対する第1のパラメータが、第2の領域に対し決定された期待値とは統計的に異なる場合、データは、1人の胎児のみが、第1の染色体領域の座位でヘテロ接合であり、胎児は、遺伝的に異なることを示唆している。他の技術を使って、期待値を決定することができる。これについては次のセクションで説明する。
また、他の染色体領域に対するパラメータも、決定でき、それぞれは、方法400の複数回の反復に使用できる。種々の実施形態により、決定されたパラメータをグループに分割でき、その集団が相互に異なるかどうかを判定できる。これについては、後程さらに詳細に記載される。このような集団は、最初に選別され、母親の類似の領域が使われていることを確認でき、例えば、パラメータ値がクラスター形成している領域で、母親がホモ接合であることを確実にすることができる。その後、2つ以上のパラメータ値の集団がデータ中に現れる場合、一部の領域は、胎児間で同じであるが、他の領域は異なり、それにより二卵性を示すことが推測できる。従って、母体血漿中の胎児DNA画分中の局所的ゲノム変異は、双胎妊娠の接合状態を示すことができる。下記の例では、見かけの胎児DNA濃度分析が使用されるが、他のパラメータも使用できる。
一組の双生児が一卵性か、または二卵性であるかの判定は、複数のSNP座位を使って、見かけの胎児DNA濃度比率分析することにより実現できる。見かけの胎児DNA濃度は、胎児特異的遺伝子マーカーを使って特定の領域で測定された胎児DNA濃度である。特定の領域の見かけの胎児DNA濃度は、胎児の内の少なくとも2人が二卵性である場合には、実際の胎児DNA濃度とは異なる可能性がある。一卵性双生児に対しては、見かけの胎児DNA濃度比率は、全ゲノム領域の異なるSNP座位で類似であろう。しかし、二卵性双生児に対しては、見かけの胎児DNA濃度比率は、2人の胎児の遺伝子型の差異が理由で、二峰性または三峰性分布を示すであろう。このような方法では、父親および/または母親に対するハプロタイプ情報は、使用できるが、必要ではない。
見かけの胎児DNA濃度を使った例
図6および7は、本発明の実施形態に従い、母体血漿中の胎児DNA画分中の局所的ゲノム変異を使って、双胎妊娠の接合状態を示す例である。図6は、双生児が一卵性である例を示し、図7は、双生児が二卵性である例を示す。2つのSNP座位(座位1および座位2)での父親、母親および一組の双生児(一卵性または二卵性)の遺伝子型を示す。これらの2つの座位は、異なる染色体領域由来であり、従って、上記の用語を使って表すと、2つの異なるグループの一部である。
説明のために、我々は、2つの双生児胎児のそれぞれが、母体血漿DNA中の10%を与え、母体血漿試料中に合計で100ゲノム当量のDNAが存在すると仮定する。1ゲノム当量は、正倍数性ヒト細胞に含まれるDNAの量である。別のシナリオでは、2人の胎児がそれぞれ異なる量のDNAを生物学的試料(例えば、母体血漿)に与える。
一卵性双生児に対しては(図6に示すように)、それらの遺伝的組成物は、同じである。従って、両方の双生児は、座位1および座位2の両方、ならびに、母体血漿試料中の共有の、および胎児特異的アレルの両方を定量化することによる見かけの胎児DNA濃度比率を測定するのに適する他のいずれの座位でもヘテロ接合である。座位1に対しては、Aアレルを有する180分子、およびTアレルを有する20分子が母体血漿中に存在し、従って、見かけの胎児DNA濃度比率:20%[20x2/(180+20)]を生ずる。座位2に対しては、GおよびCアレルの定量化により、見かけの胎児DNA濃度比率の20%が、同様に検出される。2つの双生児胎児の遺伝的構成が同じであるので、双生児1が特定のSNP座位でヘテロ接合である場合、双生児2もまた、同じSNP座位でヘテロ接合となろう。従って、全ゲノム領域のいずれかのSNP座位で測定される見かけの胎児DNA濃度比率は、類似となるであろう。
二卵性双生児に対しては、少なくとも一部のゲノムに対する遺伝子型は、異なるであろう。図7に示すように、双生児1および双生児2の両方が、座位1でヘテロ接合であり、従って、見かけの胎児DNA濃度比率:20%を与える。他方、双生児1は、座位2でGアレルに対しホモ接合であり、双生児2は、ヘテロ接合である。結果として、座位2での見かけの胎児DNA濃度比率は、GおよびCアレルの量に基づいて、10%[10x2/(10+190)]である。換言すれば、両方の胎児が、ある座位でヘテロ接合である場合は、見かけの胎児DNA濃度比率は、20%となるであろう。しかし、1人のみの胎児が、ある座位でヘテロ接合である場合は、見かけの胎児DNA濃度比率は、減らされることになろう(例えば、双生児の各メンバーにより放出された胎児DNAの量が等しい場合は、10%)。従って、見かけの胎児DNA濃度比率が複数のSNP座位で測定される場合、両胎児が等しい量の胎児DNAを放出すると、二峰性分布を生ずるであろう。双生児のそれぞれのメンバーが異なる量のDNAを母体血漿中に放出する可能性が存在する。このシナリオでは、母体血漿DNAが分析される場合に、胎児DNA濃度比率の三峰性分布が見られるであろう。これに関しては以下で考察する。
D.期待値測定用の他の技術
上述のように、期待値(例えば、実際の胎児DNA濃度比率)は、他の染色体領域での遺伝的測定値から決定できる。この変動を測定する別の手法は、遺伝子マーカーを使って測定された胎児DNAの濃度比率(またはいくつかの他のパラメータ)を、別の手法、例えば、事実上遺伝的ではないマーカーに基づいた手法を使って測定されたものと比較することである。従って、期待値(例えば、全胎児由来の胎児DNA濃度比率の合計)は、また、他の測定値により決定できる。一実施形態では、生物学的試料中の胎盤特異的エピジェネティックマーカー、例えば、DNAメチル化の量を測定することを含む。
一実施形態では、胎児DNAの濃度比率は、エピジェネティックマーカーを使って測定できる。一実施形態では、エピジェネティックマーカーは、DNAメチル化マーカーであってもよい。1例の胎児DNAメチル化マーカーは、血漿中の胎児由来および母体由来DNAの間で異なるDNAメチル化パターンを示すものである(米国特許第6,927,028号)。このようなマーカーの1例は、maspinをコードするSERPINB5遺伝子で、これは、母体血漿中に存在する胎児DNA中で低メチル化を示すが、母体血漿中の母体DNAに対し高度メチル化を示す(米国特許第8,026,067号)。別の例は、RASSF1A遺伝子で、これは、母体血漿中に存在する胎児DNA中で高度メチル化を示すが、母体血漿中の母体のDNAに対して、低メチル化を示す(米国特許第7,754,428号)。他のDNAメチル化マーカーが別の文献に記載されている(Papageorgiou EA et al.Am J Pathol 2009;174:1609−1618)。
このようなDNAメチル化マーカーは、当業者によく知られたいくつかの技術を使って母体血漿中で検出できる。これらの技術には、メチル化特異的PCR(Herman JG、et al.Proc Natl Acad Sci USA 1996;93:9821−9826)、リアルタイムメチル化特異的PCR(Lo YMD et al.Cancer Res 1999;59:3899−3903)またはMethyLight(Eads C et al.Nucleic Acids Res 2000;28:E32)、重亜硫酸塩シーケンシング(Frommer M.Proc Natl Acad Sci USA1992;89:1827−1831)、メチル化感受性制限酵素消化(Chan KCA et al.Clin Chem 2006;52:2211−2218)、methyl−BEAMing(Li M et al.Nat Biotechnol 2009;27:858−863)、および大量並列シーケンシング(Komori HK et al.Genome Res 2011;21:1738−1745)、が含まれる。
一例であるが、RASSF1Aを分子マーカーとして使用して、母体血漿中の合計(すなわち、高度メチル化+低メチル化)RASSF1A配列に対する高度メチル化を示すRASSF1A配列の割合を測定することにより、母体血漿中の胎児DNA濃度比率を計算できる。一卵性双胎妊娠に対しては、1つの、または一連の胎児遺伝子マーカーを使ってゲノムの異なる部分について測定した母体血漿中の胎児DNA濃度比率は、この項の最初の文章で説明されているRASSF1A DNAメチル化マーカーシステムを使って測定したものと密接な相関があるはずである。しかし、二卵性双胎妊娠に対しては、胎児遺伝子マーカーを使って測定した胎児DNA濃度比率の間の相関は、RASSF1A DNAメチル化マーカーシステムと、より弱い相関を示すはずである。一実施形態では、一連のこれらそれぞれのタイプのマーカーを使って、遺伝的およびDNAメチル化マーカーシステムの間の相関を解析できる。例えば、その相関は、ピアソン相関または線形回帰を使って調査できる。他のタイプのエピジェネティックマーカーには、メチル化およびアセチル化等のヒストン修飾に基づくものが含まれる。
別の実施形態は、胎児ゲノム中に存在するが母体ゲノム中には存在しない遺伝的配列の量の測定である。このような遺伝的配列の例には、母親がRhD陰性で、父親がRHDに対しホモ接合的に陽性の妊娠に対するRHD遺伝子が含まれる。従って、全ての胎児がRhD陽性で、母親がRhD陰性の場合、RHD遺伝子は、実際の胎児DNA濃度を測定するのに使用できる。別の例は、男児の胎児のみを含む多胎児妊娠における染色体Y配列の量の測定である。例えば、全ての胎児が男児の場合、実際の胎児DNA濃度は、Y染色体上の座位を使って測定できる。
従って、一実施形態では、遺伝子マーカーを使って、1つまたは複数の胎児特異的配列から選択される胎児特異的配列を有するDNA断片の第3の量を測定することにより、期待値(例えば、胎児DNA濃度)を計算できる。期待値(例えば、胎児DNA濃度)に関する計算であることから、胎児が遺伝的に同じである場合は、全ての胎児が、胎児特異的配列(例えば、上記例のもの)を有する。例えば、本明細書記載の方法により、第3の量の正規化値が得られ、正規化パラメータが決定される。正規化値は、次に、期待値(例えば、胎児DNA濃度)として使用できる。一実施態様では、胎児がそれぞれの第1のアレルを有し、母親がそれぞれの第1のアレルを持たない1つまたは複数の第2の座位が特定される。胎児特異的配列は、また、それぞれの第1のアレルである。第3の量の正規化値は、1つまたは複数の第2の座位のアレル合計量を測定し、第3の量の比率および合計量から胎児DNA濃度を計算することにより得ることができる。
E.非多型性胎児特異的配列
別の実施形態では、非多型性胎児特異的配列を使って、見かけの胎児DNA濃度比率を測定できる。例えば、母体血漿試料中の染色体Y配列の量は、非胎児特異的配列、例えば、レプチンをコードするLEP遺伝子を基準として測定できる。LEP DNAに対する染色体Yの比率は、期待値、例えば、胎盤特異的DNAメチル化マーカーを使って測定した合計胎児DNA濃度比率と比較できる。染色体Y濃度比率が期待値とは異なる場合は、妊娠が、少なくとも1つの二卵性胎児セットを含み、さらに、胎児の内の少なくとも1人が男児であり、同様に、胎児の内の少なくとも1人が女児であることを意味する。染色体Y量比率に加えて、母体血漿試料中の染色体Y配列の量の絶対値もまた、以降で記載のように、接合状態を判定する測定値として使用可能である。
従って、1つまたは複数の胎児特異的配列(非多型性配列を含んでもよい)の第1の量は、生物学的試料中で、1つまたは複数の第1の座位で測定できる。第1の量に対する正規化パラメータを得ることができ、次に、本明細書記載のように使用して、胎児の内の少なくとも2人が二卵性であるか否かを判定できる。
F.絶対胎児DNA濃度
胎児DNA濃度比率の代替物として、何らかの較正(正規化を暗黙裏に含む)が行われる限り、染色体領域に対する副次的アレルの測定値(例えば、数)の絶対値を使用できる。このような使用は、明示的比率が計算されないという意味で、「絶対値」と名付けられる。例えば、測定ステップで、ある領域由来の特定の量のDNA断片が1つの実験から別の実験へと制御、または相関付けできるように較正できる場合は、主要アレルの量は、合計−副次的アレルの第2の量として暗黙裏に決定できる。領域(すなわち、領域の特異的座位)に対するDNA断片の量(例えば、数)の絶対値を知ることに加え、1つの領域から別の領域までの固定比率のDNA断片により、較正が提供される。例えば、プロトコルは、第1の領域由来のDNA断片の合計数が第2の領域のDNA断片合計数の1.4倍であるような、指定された方式の試料調製を要求してもよい。この拡大縮小因子は、その後、比較の一部として使用できる。一実施形態では、既知量のDNAまたは他のタイプの較正用試料を生物学的試料に添加できる。
この方式で、異なる染色体領域由来の副次的アレル(または他の胎児特異的遺伝子マーカー)の量を直接相互に比較できる。このような状況では、パラメータは、まだ、主要アレルの第1の量を使って効率的に計算されるが、このような値は、較正が原因で消滅する(すなわち、第1の量、または第1の量+第2の量が同じで、そのため、それらはその式から取り消される)。例えば、デジタルPCR結果の計数またはシーケンシングデータの解析は別として、マーカーは、標的濃度が同じの場合、マーカーが較正されて同じ定量的読み出しを与えるように適切に構築された較正曲線により測定できる。同様に、異なる染色体領域由来の主要アレルの第1の量は、相互に比較でき、第1の量は第2の量の変動とは逆に変化するであろうから(例えば、二卵性胎児では、第1の量の2つのピークが見られるであろう。図8と比較されたい)、このような変化は、副次的アレルの量に対し本明細書記載の同じ結果を与えることができる。
従って、所与のこのような胎児特異的遺伝子マーカーセットに対し、一卵性および二卵性双胎妊娠におけるそれらの相関性は異なるであろう。一実施形態では、マーカーは、デジタルPCRを使って定量化され、この場合、それらは、一卵性双胎妊娠において全て同じまたは類似の測定量を与えるであろう。逆に、二卵性双胎妊娠では、このようなマーカーの比率は、さらに多岐にわたる結果を与えるであろう。説明のために、二卵性妊娠の両方の胎児が同じ濃度の胎児DNAを母体血漿中に放出すると仮定する(必ずしもこれが必要な事例ではないが)。このケースで、両方の胎児が母親のゲノムにはない同じ父系遺伝性アレルを受け継いでいる場合の第1のマーカーに対し、第1のマーカー(例えば、母親がホモ接合の場合の副次的アレル)の測定された量は、1人の胎児のみが母親のゲノムにはない父系遺伝性アレルを受け継いでいる場合の第2のマーカーにより測定された量の2倍であるはずである。それぞれが異なる量の胎児DNAを放出する二卵性双生児に対しては、第1のマーカーの測定量は、第2のマーカーの測定量より多いが、2つの値は2倍までの差異はないであろう。
デジタルPCR分析を使った較正方法の1例として、同じ母体血漿DNA試料を使って、デジタルPCR反応当たり同じ平均テンプレート分子濃度で、座位1の胎児特異的アレルの定量化、および座位2の別の胎児特異的アレルの定量化を行うことができる。このようなシナリオでは、非胎児DNAのバックグラウンド量は、座位1および座位2で同じである。従って、座位1の胎児特異的アレルに対し、デジタルPCRウエル陽性の数を単純にカウントして座位1の胎児DNAの見かけの絶対量を決定できる。同じプロセスを座位2で行い、胎児DNAの見かけの絶対量を決定できる。次に、2つの絶対値を、相互に比較して(例えば、1つが期待値として使用される場合)、または別の方法で決定した期待値と比較して(例えば、上述のように)統計的に有意差があるか否かを判定できる。
G.胎児DNA濃度の差異の検出
図8は、本発明の実施形態に従って、等量の胎児DNAを与える二卵性双生児に対する胎児DNA濃度のヒストグラム800の例を示す。このヒストグラムでは、横軸(X)は、胎児DNA濃度である。ある染色体領域に対し測定された胎児DNA濃度(絶対値または比率)を使って、測定値を含む範囲に対しカウンターを増やすことができる。図で、第1のピーク810は、1人の胎児のみが胎児特異的アレルを有する場合の座位の測定胎児DNA濃度に対応し、他方、第2のピーク820は、両方の胎児が胎児特異的アレルを有する場合の座位の測定胎児DNA濃度に対応する。ピーク820は、実際の胎児DNA濃度に対応するであろうが、ピーク810は、見かけの胎児DNA濃度に対応するであろう。2つのピークが認められるので、胎児は二卵性であると推測できる。一態様では、ピークの相対的高さを、例えば、ステップ150の一部として、接合状態の判定に使用できる。
ヒストグラム800は、また、実際の胎児DNA濃度が、ヒストグラム生成以外の技術を使って、種々の染色体領域でのパラメータ値から測定される場合の方法を模式化するのを助けることができる。例えば、実際の胎児DNA濃度が2F%であると測定できる(例えば、エピジェネティック手法を用いて)。次に、ピーク810に属する領域が分析される場合、見かけのDNA濃度に対する尺度パラメータは、ピーク810の近くに出現するはずである。これは、2F%の値から離れた統計的に有意な距離であろう。
ピークの位置は、一グループの正規化パラメータ(この例では胎児DNA濃度)の統計値の1つの例であり、この場合、グループは815および825の曲線の内の1つに対するデータポイント(すなわち、正規化パラメータの数)である。例えば、ピーク820は、曲線825により表される正規化パラメータグループに対する統計値であり、ピーク820は、期待値として使用できる。曲線815および825(基のデータにフィットする場合)は、後程考察されるように、混合モデルの確率分布、および構成要素の例であることに留意されたい。
2つの異なる胎児DNA濃度比率から1つを識別するのにどのくらい多くの読み取り数が必要かの判定は、以下のように行うことができる。2人の二卵性双生児のそれぞれが母体のDNAのF%に寄与すると仮定する。母体血漿中の2つの異なる胎児DNA濃度比率を示すSNP座位の2つの集団(クラスター)が存在する。1つのSNP集団で、見かけの濃度比率は、F%であるが、他方、他のSNP集団では、見かけの濃度比率は、2F%である。優先SNP座位セットの分布の標準偏差(SD)は、
Figure 0006068598
で、式中、Nは、このSNP座位セットに整合させた読み取りの合計数である。後者のグループのSNP座位のSDは、また、大略
Figure 0006068598
に等しい。
2つのSNP座位集団は、
Figure 0006068598
の場合は、5%オーバーラッピング未満で識別できる。従って、N>16(1−F%)/F%である。
表2は、種々のF%の値に対し、2つのSNP座位集団から得られた2つの見かけの胎児DNA濃度比率(F%vs2F%)を識別するのに必要な配列読み取り数を示す。
Figure 0006068598
H.各胎児のための別のピーク
双生児の各メンバーが異なる量のDNAを母体血漿中に放出する場合もある。このシナリオでは、母体血漿DNAが分析されると、胎児DNA濃度比率の三峰性分布が認められるであろう。これらのピークの内の2つは、2人の個別双生児胎児のそれぞれにより放出された胎児DNA濃度比率を表すが、他方、3番目のピークは、2人の胎児の胎児DNA比率の全体の累計を表すであろう。従って、実施形態は、また、双生児の各メンバーにより放出された相対的量のDNAが推定できる方法を提供できる。
各双生児により放出されたDNAの量の大きな不一致は、有害な結果、例えば、双生児の内の1人の危急の死亡に繋がる可能性があると思われる。各胎児の胎児DNAの異なる寄与は、経時的に追跡され、胎児の健康をモニターできる。各双生児により放出された相対DNA量の別の有用性は、胎児染色体の異数性、例えば、トリソミー21の検出のために母体血漿DNAの大量並列シーケンシングを使っている場合であろう(Chiu RWK et al.Proc Natl Acad Sci USA 2008;105:20458−20463;Fan HC et al.Proc Natl Acad Sci USA 2008;105:16266−16271;Sehnert AJ et al.Clin Chem 2011;57:1042−1049;Sparks AB et al.Am J Obstet Gynecol 2012;doi:10.1016/j.ajog.2012.01.030)。胎児DNA濃度比率は、このような手法の診断鋭敏度の重要なパラメータである。
従って、双生児が一卵性であることを示すことができる場合は、胎児トリソミー21の非侵襲的検出には、基本的に、大量並列シーケンシングデータを取り扱うのと同じアルゴリズムを使うのみでよい。他方、二卵性双生児を含む場合には、最初に各双生児により与えられる胎児DNAの相対比率を測定し、その後、より少ない量のDNAを母体血漿中に放出した双生児の胎児DNA濃度比率が、使われるシーケンシングの深度で検出可能か否かを調べることができる。必要に応じ、シーケンシング深度を増やすことができる。換言すれば、実施形態は、双胎妊娠に対しても、胎児染色体の異数性選別を行うことを可能とする。
説明のために、特定の二卵性双生児妊娠において、胎児1および胎児2が、妊婦である母親の血漿中のDNAのそれぞれ3%および2%の寄与をすると仮定する。また、母親の血漿の大量並列シーケンシングを使って、トリソミー21の検出を実行することを希望していると仮定する(Chiu RWK et al.Proc Natl Acad Sci USA 2008;105:20458−20463)。実施形態を使うことにより、我々が、3%および2%の胎児DNA濃度比率、ならびに両方の胎児の一緒の寄与、すなわち、5%の胎児DNA濃度比率を特定することが可能となる。ロバストなトリソミー21検出を可能とするのに必要なシーケンシング深度は、胎児DNA濃度比率が2%の場合には、トリソミー21胎児を検出するのに充分な深度であろう。必要なシーケンシング深度および胎児DNAの濃度比率の間の関係は、以前に報告されている(Fan HC et al.PLoS ONE 2010;5:e10439;Chiu RWK et al.BMJ 2011;342:c7401)。類似の考慮が、トリソミー13、トリソミー18の出生前検出(Chen EZ et al.PLoS ONE 2011;6:e21791;Palomaki GE et al.Genet Med 2012;doi:10.1038/gim.2011.73)、性染色体異数性(Lau TK et al.J Matern Fetal Neonatal Med 2011;doi:10.3109/14767058.2011.635730、染色体の転座(Lun FM et al.Clin Chem 2011;57:917−919)および染色体の微小欠失(Peters D et al.N Engl J Med 2011;365:1847−1848)に対しても適用できる。
従って、胎児DNA濃度比率の計算は、出生前診断の他の適用のために重要でありうる。例えば、母体血漿分析による非侵襲的出生前診断の正確度は、母体血漿試料中の評価対象胎児が寄与するDNAの濃度比率に依存する可能性がある。染色体の異数性の出生前の検出に対しては、母体血漿中の罹患した染色体の追加の染色体投与量は、胎児DNA濃度比率に比例する。2人の胎児のそれぞれが寄与する胎児DNA濃度比率は、上述の技術を使って次のように決定できる。
図9は、本発明の実施形態に従って、2人の胎児が、異なる量のDNAを母体血漿試料に寄与する場合の、NP分析に基づく胎児DNA比率分布のヒストグラム900を示す。胎児DNA濃度比率の3つのピークが観察され、4%、7%および11%の濃度比率に対応する。最初の2つのピークは、それぞれ2人の胎児の寄与による濃度比率に対応するであろう。理由は、1人の胎児のみが、母親がホモ接合のSNP座位でヘテロ接合である場合、胎児特異的アレルにより与えられる割合は、その特定の双生児胎児の胎児DNA濃度比率を反映するために使えることによる。最後のピークは、両方の胎児がヘテロ接合であるが、母親がホモ接合であるSNP座位に対応する。これらのSNP座位を使って計算された胎児DNA濃度比率は、両方の胎児により与えられた合計胎児DNA濃度比率である。正確な診断をするために最小限の胎児DNA濃度比率を必要とするいずれの適用に対しても、3つの図の最も低い濃度比率側のものが重要であろう。理由は、これが母体血漿試料に対し最低量の寄与による胎児由来の胎児DNA濃度比率を反映していると思われるためである。シーケンシングの深度は、したがって、後者の胎児の胎児DNA濃度比率を前提として、統計的にロバストな診断結果を提供できるように調節できるであろう。
I.全体集団に対する統計的変動の使用
一実施形態では、2つ以上のピークの組み合わせ集団に対するSD値は、接合状態を決定するのに使用できる。一卵性胎児に対しては、SD(パラメータ値の広がりの尺度の例)は、二卵性双生児に対するSDより小さいであろう。これは、基のデータが実際に2つのピーク由来であり、従って、パラメータ値が1つのピークの場合よりも多様で、測定パラメータ値の広がりが単純に統計的変動に起因したという理由による。このような技術は、特定の母体の遺伝子型内の別々の集団の座位の特定を必要としないであろう。それでも、例えば、2つのアレルが検出される座位に対し、母親がヘテロ接合である領域と、母親がホモ接合である領域の区別の必要がまだあるかもしれない。
このように、二卵性双胎妊娠では、母体血漿中の合計DNAに比較して、個別の、または選択された組み合わせの濃度比率の一連の胎児特異的遺伝子マーカーにより測定した母体血漿または血清中の胎児DNAの濃度比率は、一卵性双胎妊娠の場合の濃度比率より大きな変動を示すであろう。変動は、当業者によく知られた統計的方法、例えば、SD、分布範囲、四分位数間範囲、等により測定できる。
従って、正規化パラメータ(例えば、ステップ440で計算されたような)の標準偏差または他の分散を使って、接合状態を決定できる。分散は、閾値と比較でき、分散が閾値を超える場合、胎児の内の少なくとも2人は二卵性であると判定できる。正規化パラメータをカットオフ値に比較して、正規化パラメータが統計的に期待値と異なるかどうかの判定は、分散の計算および閾値との比較により効率的に実現される。
J.減数分裂組換えに対する考察
上述のように、染色体領域内の座位は、座位間の組換え確率が低いように、例えば、1%未満になるように選択される。以下の例は、染色体領域の座位間の組換えが起こる場合に生ずる問題を取り扱う。
上述のように、いずれかの染色体領域に対し、2人の胎児が同じ父方のハプロタイプを受け継いでいる場合、胎児特異的アレルに基づいて計算された見かけの胎児DNA濃度比率は、2人の胎児により寄与される合計DNAを表すであろう。他方、2人の胎児が、父親がヘテロ接合(AB)で、母親がホモ接合(AA)であるいずれかのSNP座位で、異なる父方のハプロタイプを父親から受け継いでいる場合は、1人の胎児のみが、母体血漿に対し胎児特異的アレルを与えるであろう。結果として、これらの座位で測定された見かけの胎児DNA濃度比率は、両方の胎児が同じ父方のハプロタイプを受け継いでいる場合の座位で測定された値より、低くなるであろう。
図10は、一組の二卵性双生児を宿す妊婦の見かけの胎児DNA濃度比率に与える組換えの効果の例を示す。この例では、父方のハプロタイプが双生児1に伝えられる場合、父方のHap IIIおよびHap IVの間の組換えがある。組換えは、SNP座位3および4の間で発生する。実際上、双生児1は、座位1から3でHap IIIを受け継ぎ、座位4から6でHap IVを受け継いでいる。双生児2は、何ら組換えなしに、父親からHap IVを受け継いでいる。
この妊婦に関し、胎児DNA濃度比率の分析の間、1、2、3および5のみが情報価値がある。理由は、胎児特異的アレル(Bアレル)は、母体血漿中に存在すると思われるからである。座位4および6は、情報価値がなくなるであろう。理由は、両方の胎児が、父親から母体のアレルと同じAアレルを受け継いでいるからである。他方、座位5では、両方の胎児が父親からBアレルを受け継いでおり、座位1から3に対し決定された値に比べて、より高い見かけの胎児DNAの原因となる。全領域(座位1から6を含む)を見かけの胎児DNA濃度の分析に使用する場合、推定濃度は、両胎児が同じ父方のハプロタイプを受け継いでいる領域および2人の胎児が異なる父方のハプロタイプを受け継いでいる領域の見かけの胎児DNA濃度比率の間になるであろう。
IV.演繹的SNPコール
上記セクションでは、両方の親の遺伝子型情報が既知の場合、および母親の遺伝子型だけが既知の場合の接合状態特定に関する例を記載した。しかし、実施形態(例えば、方法100および400)は、親に関する遺伝子型情報がわかっていない場合に適用できる。このような状況では、測定パラメータ値は、母体遺伝子型、または少なくとも最も可能性のある母体遺伝子型を特定するために、グループに分けることができる。この方式では、母親から採取された生物学的試料の分析の前に、演繹的知識を持つ必要がない。従って、実施形態は、母体の遺伝子型、および胎児遺伝子型を推察できる。いくつかの領域は、未分類で残ってもよいことに留意されたい。
少なくとも一部の染色体領域が分類される(例えば、母親がホモ接合で、胎児の内の少なくとも1人がヘテロ接合であるグループに)とすぐに、本明細書記載の方法を胎児の接合状態を判定するために使用できる。例えば、一組の双生児が一卵性であるか、または二卵性であるかの判定は、見かけの胎児DNA濃度比率(または他のパラメータ)を複数のSNP座位を使って分析することにより実現できる。一卵性双生児に対しては、見かけの胎児DNA濃度比率は、全ゲノム領域の異なるSNP座位で類似であろう。しかし、二卵性双生児に対しては、2人の胎児の遺伝子型の差異のために、見かけの胎児DNA濃度比率は、二峰性分布を示すであろう。
接合状態の決定に加えて、胎児DNA濃度は、また、遺伝的分析からも決定できる。この分析は、上述のように、多胎妊娠が原因で複雑である。上述のように、胎児DNA濃度は、接合状態の特定に加えて、非侵襲的胎児診断技術にとって有用である。
A.方法
胎児DNA濃度比率を配列決定データ(例えば、高倍読み深度の)またはPCRデータから直接求めるために、我々は、SNP部位iで可変比
Figure 0006068598
を次のように定義する:
Figure 0006068598
式中、aiは、SNP座位(部位)iでの特異的アレル(すなわち、主要アレル)の最大数、およびbiは、SNP座位iの別のアレル(すなわち、副次的アレル)の2番目の最大数である。この値は、母親がホモ接合の座位に対し上述の式を使って得た見かけの胎児DNA濃度の半分である。この技術は、また、上述の絶対胎児DNA濃度等の他の正規化パラメータと一緒に使用できる。
単胎妊娠の母体血漿中のSNP部位(または他の多型部位)を考慮すれば、これらのSNP部位は、母体の遺伝子型および胎児遺伝子型の組み合わせ、いわゆる母体−胎児混合遺伝子型に基づいて、暗黙裏にAAAA、AAAB、ABAAおよびABABの形式の4つのカテゴリーに分類でき、ここで、下付文字は、胎児遺伝子型を表す。AAは、ホモ接合状態を示し、ABは、ヘテロ接合状態を示す。従って、各SNP座位iでの測定値は、シーケンシングデータ由来の最大数に相当するアレルAの発生数(ai)および次の最大数に相当するアレルBの発生数(bi)から構成される。胎児DNA濃度比率は、カテゴリーAAABおよびABAAに対するそれぞれのSNP部位で
Figure 0006068598
に影響を与えるであろう。理論では、カテゴリーAAAAに対する
Figure 0006068598
は、0で、カテゴリーABABに対する
Figure 0006068598
は、0.5である。従って、胎児DNA濃度比率により、母体血漿中の母体−胎児混合遺伝子型の分布を特定できる。原理的には、胎児DNA濃度比率の最適推定は、最高確率を有する
Figure 0006068598
の観察プロファイルを生成する分布を作り出すであろう。
実施形態は、4つのカテゴリーを識別でき、さらなるカテゴリーAAABおよびABAAの分析を、例えば、上述の方法400のように、実行できる。異なるカテゴリーの間での識別(すなわち、どの染色体領域がそのカテゴリーに属するか)の一部として、実施形態は、データが確率分布の線形結合に最適フィットする最適濃度を見つけることにより、胎児DNA濃度を決定できる。
図11は、本発明の実施形態に従って、少なくとも2人の胎児を宿す妊婦由来の生物学的試料中の胎児DNAパーセンテージを特定し、胎児の内の少なくとも2人が二卵性であるか否かを判定する方法1100を示すフローチャートである。生物学的試料は、胎児および母体のDNAを含む。
ステップ1110では、複数の染色体領域それぞれに対し正規化パラメータを決定することによりヒストグラムが生成される(例えば、方法400で上述のように)。複数の染色体領域のそれぞれに対し、それぞれの染色体領域中の1つまたは複数の座位が特定され、そこで、生物学的試料中のそれぞれの第1のアレルおよびそれぞれの第2のアレルが検出される。このような領域は、上述の4つの異なるカテゴリーに対応する。
アレルは、いずれかの適切な方式で検出でき、統計的に有意な量のそれぞれのアレルを確かなものにできる。第1の量の1つまたは複数の第1のアレルおよび/または第2の量の1つまたは複数の第2のアレルが生物学的試料中の1つまたは複数の座位で測定される。複数座位の間で、第1のアレルが異なっていてもよく、第2のアレルの場合も同様である。一実施形態では、第1のアレルが、染色体領域中の特定の座位の第2のアレルより量が多い場合は、第1のアレルの全体は、それぞれの座位の第2のアレルより量が多い。このような方式で、複数の座位由来のアレルの数を組み合わせることができる。
第1の量または第2の量の正規化パラメータが得られる。正規化パラメータは、本明細書記載のいずれのタイプでもよい。例えば、正規化パラメータは、第1の量および第2の量から決定でき、第1の量および第2の量の間の相対的尺度を与える。1例には、胎児DNA濃度比率が含まれる。正規化パラメータは、また、適切な較正により決定できるような絶対胎児DNA濃度であってもよい。一実施形態では、上記で定義の
Figure 0006068598
が使用される。
それぞれの染色体領域に対し正規化パラメータが決定されるとすぐに、これらのデータポイントを使って、ヒストグラムを生成できる。ヒストグラムのデータ構造は、正規化パラメータの可能な値をいくつかのサブレンジに分割することにより生成できる。例えば、範囲が0と0.5の間の場合、サブレンジは、それぞれ0.01のサイズであってもよい。カウンターを、各サブレンジに関連付けることができる。次に、正規化パラメータの指定された値を持ついくつかの染色体領域に基づいて(すなわち、対応する各サブレンジ内の値に対し)カウンターを増やすことができる。
ステップ1120では、確率分布の線形結合がヒストグラムにフィッティングされる。例えば、2つの確率分布を使って、カテゴリーAAABおよびABAAに対しデータをフィッティングできる。下記のように、これらのカテゴリーのそれぞれに対するデータポイントの位置は、胎児DNAパーセンテージに依存する。従って、胎児DNAパーセンテージは、確率分布の線形結合への入力である。下記に示すように、他のカテゴリーに対する分布もまた、使用できる。
別の実施形態では、データポイントは、もはや特定のカテゴリー:AAABおよびABAAに限定できる。双生児妊娠に対しては、分布の数は、両方の胎児が生物学的血漿に対し等量のDNAの寄与をする場合、2つになるか、または2人の胎児が母体血漿に対し異なる量のDNAの寄与をする場合は、3つになるであろう。3人以上の胎児を含む妊娠に対しては、分布の数は、各胎児が母体血漿に対し等量のDNAの寄与をする場合は、胎児の数となるであろう。このような実施形態では、ステップ1150は、冗長であるとしてスキップでき、ステップ1160では、確率分布係数を使用することになる。
ステップ1130では、入力胎児DNAパーセンテージφを変化させ、確率分布の線形結合のヒストグラムへのフィッティングを最適化する最適胎児DNAパーセンテージを見つけることができる。用語の「最適な」は、上記で定義されている。最適化プロセスの一部として、データおよび確率分布の線形結合の間で誤差が特定できる。この誤差項を使用して、φの値がデータに充分フィッティングする場合を特定できる(すなわち、誤差が充分小さいのでφの値が最適であると呼ばれる)。
ステップ1140では、胎児DNAパーセンテージφがわかるとすぐに、母親がホモ接合で、胎児の内の少なくとも1人がヘテロ接合である座位に対応する確率分布、または母親がヘテロ接合で、胎児の内の少なくとも1人がホモ接合である座位に対応する確率分布が特定される。例えば、2つの線形結合が使用される場合は、胎児DNAパーセンテージφは、分布のピークのおよその位置を与えることができる。胎児(またはそれらの内の少なくとも2人)は二卵性である可能性があるので、ピークは、φにより予測される正確な位置にはない可能性があるが、2つの分布が識別できる。例えば、φ/2の値に近いピークを有する分布は、カテゴリーAAABに属し、0.5−φ/2に近いピークを有する分布は、ABAAに属するであろう。
ステップ1150では、多成分混合モデルが特定の確率分布にフィッティングされる。多成分混合モデルは、複数の成分のそれぞれに対する混合係数を含む。一態様では、成分は、図8または9のピークに対応する。成分は、ガウス分布等のいずれかの適切な関数形を使って定義でき、その場合、各成分は、異なるガウス関数に対応するであろう。
下記で述べるように、追加のピークは、トリプレットを生ずるであろう。混合モデルの成分の数を求める1つの方法は、胎児が母体血漿に対し等量のDNAの寄与をする場合、成分の数=胎児の数とすること(例えば、実際の胎児DNA濃度を示す領域を考慮すること)である。あるいは、ベイズ情報量基準(BIC)または赤池の情報量基準(AIC)を使って、混合モデルの成分の数を求めることができる。従って、混合モデルは、等量の胎児DNAの寄与をする双生児に対しては2つの成分を持ち、または各双生児が異なる量のDNAの寄与をする場合、もしくは、2人以上の胎児を含む妊娠に対し、さらに多くの成分の数を持つことができる。
一実施形態では、特定された分布は、母親を遺伝子型解析して、カテゴリーAAABまたはABAAを特定することにより見つけることができる。このような実施形態では、ステップ1130および1140が実施されないであろう。また、φの値は、他の方法、例えば、エピジェネティックマーカーを使って求めることが可能である。逆に、母親の特定の染色体領域の遺伝子型は、その特定の染色体領域に対応する確率分布を決定することにより特定できる。例えば、特定の染色体領域の正規化パラメータの最高値を有する確率分布を決定でき、その確率分布を使って母体の遺伝子型を決定できる。確率分布は、胎児DNAパーセンテージに別々に依存するので、対応する母体の遺伝子型は、直接的に決定できる。
同様に、特定の染色体領域での胎児の遺伝子型は、その特定の染色体領域に対応する確率分布(混合モデルの成分であってもよい)を決定することにより特定できる。例えば、特定の染色体領域の正規化パラメータの最高値を有する確率分布を決定でき、その確率分布を使用して、それぞれのSNP座位でヘテロ接合の胎児の数を特定できる。確率分布は、それぞれのSNP座位でのヘテロ接合の胎児の数、および胎児DNAパーセンテージにも依存するので、胎児の遺伝子型情報が推定できる。
ステップ1160では、胎児の内の少なくとも2人が、混合係数の内の少なくとも2つを使って、二卵性であるか否かが判定される。例えば、混合係数の内の少なくとも2つを、閾値と比較できる。係数の値を使って、ピークが実際に存在するか否かを判定できる。ピークが小さい場合は、混合係数は小さく、追加のピークが実際に存在しないと仮定できる(例えば、2F%が実際の胎児DNAパーセンテージの場合、F%の位置に生ずるであろうピーク)。その場合、混合モデルは、1つのピークのみが実際に存在し、胎児は一卵性であることを表すであろう。混合係数の内2つが閾値を超える場合は、少なくとも2つのピークが実際に存在し、胎児の内の少なくとも2人が二卵性である。閾値は、他の成分の係数に比べ絶対値でも、または相対値でもよい(例えば、閾値は、1つまたは複数の係数の値、例えば、最大値のパーセンテージまたは係数のカバー率に依存する)。用語の「係数」は、係数に乗じる、または成分中に暗黙裏に含まれる任意の拡大縮小因子を包含することに留意されたい。3つの成分が使われる場合(例えば、合計胎児DNAパーセンテージに対する各胎児の個別の寄与が求められるか、または三つ子が検査されているという理由で)、二卵性の判定は、この場合、二卵性は、既に特定されているであろうという理由から、2つの係数のみが検査された後、中止できる。
一実施形態では、混合モデルの成分のピーク位置は、所定の値を超える分離ギャップを持つように強制される。分離ギャップは、1つのピークから最近接ピークまでの距離(ヒストグラムのパラメータ値の単位で測定した距離)である。所定の値は、所望の正確さおよび所望の結果に依存する。例えば、接合状態を特定することのみを望む場合(例えば、それぞれ個別胎児からの寄与のピークの間の区別が目的ではない場合)、モデルに対する2つの成分を使うことができ、所定の値は、所定の胎児DNA濃度に依存しうる(例えば、より大きな胎児DNA濃度は、より大きな分離距離に繋がる可能性がある)。所定の値は、また、胎児の数に依存する可能性があり、例えば、三つ子に対しては、異なるピークの分離は、相対基準でみて、より小さい可能性がある。理由は、ピークは、実際の胎児DNA濃度の1/2ではなく、大略1/3に相当する可能性があるためである。
相対的ピークサイズを使うことができる。例えば、相対的サイズにより、胎児が遺伝的に同じであるか、または胎児が遺伝的に異なるさらに多くの領域が存在するか否かを示すことができる。これは、染色体領域の選択に依存するであろう。しかし、複数胎児のシナリオでは、染色体領域の選択がランダムである場合には、2人の二卵性双生児が同じ父方のハプロタイプおよび異なる父方のハプロタイプを受け継いでいる領域の数は、類似であるはずである。この点で、相対的ピークサイズを使って、データを、異なる分布曲線に対し、より正確にフィッティングできる。
B.演繹的SNPコール分析による胎児DNA比率の決定
上記原理の操作を説明するために、我々は、標的シーケンシングを行い、二項混合モデルを適用して、胎児DNA濃度を推定した。二項混合モデリングの適用に成功し、腫瘍ゲノム中の単一ヌクレオチド変異体が特定されている(Goya R et al.Bioinformatics 2010;26:730−736;Shah SP et al.Nature 2009;461:809−813)。我々は、そのモデルを採用し、妊婦母体血漿中の胎児DNA濃度を推定した。我々は、血漿中のSNP位置iでの母体−胎児混合遺伝子型Gi=k、k∈{AAAA,AAAB,ABAA,ABAB}を、多項ランダム変数であると仮定する。また、
Figure 0006068598
でSNP位置iでのAアレルおよびBアレルのアレル数を表すとする。ここでNi=ai+biは、観察された読み深度である。我々は、SNP位置iでの数は、Gi=k、Xi〜Binom(bi|μk,Ni)が条件とされる二項分布により生成されると仮定する。式中、μk∈{μAAAA,μAAAB,μABAA,μABAB}は、母体血漿中のBアレル頻度(bi)の期待分布であり、これは、下式で与えられる:
Figure 0006068598
理論的には、μAAAAは定数0に、μAAABは胎児DNA濃度の半分:φ/2に、μABAAは0.5−φ/2に、μABABはほぼ定数0.5に近づく。μAAAAおよびμABABでは、それぞれ期待定数値0および0.5からのずれは、主にシーケンシング誤差および分析の偏りにより影響され、一方、μAAABおよびμABAAでは、0および0.5からの摂動は、胎児DNA濃度比率によりほとんど決まる。分析の偏りの例には、大量並列シーケンシングにおけるGCバイアス(Chen EZ et al.PLoS One 2011;6:e21791)およびアラインメントバイアス(Degner JF et al.Bioinformatics 2009.25:3207−3212.)、が含まれる。
その後、我々は、二項混合モデルを適用して観察アレル数を説明した。所与のSNP位置iに対し、Xi、p(Xi)の混合分布は、多項式πk、0≦πk≦1、および Σkπk=1により重みをつけた二項分布の線形結合:
Figure 0006068598
から導かれる。式中、πkは、母体−胎児混合遺伝子型の事前確率である。換言すれば、πkは、ランダムに選択された位置がそれぞれの遺伝子型の位置となるであろうという事前信念を表す。
最終的データ対数尤度は、
Figure 0006068598
により与えられる。式中、Tは、母体血漿中の観察SNP位置の合計数、πk∈{πAAAA,πAAAB,πABAA,πABAB}、である。さらに、その尤度は、正確さを潜在的に改善できるマッピング特性および塩基特性により下記式でモデル化できる(Goya R et al.Bioinformatics 2010;26:730−736):
Figure 0006068598
式中、
Figure 0006068598
は、マッピング特性、および
Figure 0006068598
は、位置iのj番目に整列した塩基に対するシーケンシング特性である。我々のデフォルト分析では、現在のマッピングソフトウェアがマッピング特性の利益をもたらさなかったので、シーケンシング特性をモデル化した。
一般的には、πkは、異なる母体−胎児混合遺伝子型の集団頻度に従って、それぞれ、0.7、0.1、0.1、および0.1に指定され、例えば、Affymetrix Genome−Wide Human SNP Array 6.0を使って推定できる。μkは、AAABおよびABAAの両方に対し、胎児DNA濃度比率φ(0≦φ≦1.0)に依存する。妊婦母体血漿では、φが0.4より大きいことはありそうにない(Chiu RW et al.BMJ 2011;342:c7401)。従って、われわれは、0〜0.5の胎児DNA濃度比率φについて、繰り返し毎に0.001以下の増分で、対数尤度が最大になるまで繰り返し計算する。φが実際の胎児DNA濃度比率に近づくと、対数尤度が最大になると予測される。換言すれば、対数尤度を最大化する典型的なφは、最高確率を有する観察アレル数を説明できる。そうでない場合には、上記で定義のように、対数尤度がその最大値に対するまでπkおよびμkを繰り返し更新する必要がある。
更新ルールは、AAAAおよびABABを考慮すると、下記の式で定義される:
Figure 0006068598
式中、I(Gi=k)は、母体−胎児混合遺伝子型kGiが、異なる母体−胎児混合遺伝子型の荷重確率に従って、SNP位置iのGiに割り当てられているか否かを示す指標関数であり、さらに:
Figure 0006068598
Figure 0006068598
であり、式中、AAABおよびABAAは、血漿中の胎児DNA濃度比率の拘束下にあり、従って:
Figure 0006068598
Figure 0006068598
である。
さらに、上記式(6)〜(9)に対し、μkは、ベータ分布μk〜β(μk|αk,βk)に従って分布する。Gk∈{AAAA,AAAB,ABAA,ABAB}にそれぞれ対応させて、αk={10000,9500,5500,5000}およびβk={1,500,4500,5000}とし、μkをβk/(αk+βk)で初期化する。理由は、μkは、{0,0.05,0.45,0.5}近傍で変動し、実際に観察される分布
Figure 0006068598
により調節されることが期待されると我々は考えるからである。πkは、ディリクレ分布:πk〜β(πk|δk)に従って分布する。πkは、
Figure 0006068598
により初期化される。式中、δkは、デフォルトで重みベクトル{7,1,1,1}により設定され、これは、妊婦母体血漿中のGkの比率を表し、従って、ランダムに選択された位置がそれぞれの遺伝子型に割り当てられるであろうという事前信念を示す。
パラメータπkおよびμkが観察アレル数により適合されるとすぐに、我々は、ベイズの定理を適用し、母体−胎児混合遺伝子型に対する事後確率γk=Pr(Gk|ai,Ni,πk,μk)を計算できる。
式中:
Figure 0006068598
である。
さらに、γkに基づいて、AAABの形の情報価値のあるSNP部位を特定することができる。
C.情報価値のあるSNP部位から接合状態の特定
双胎妊娠で、上記アルゴリズムを適用して見かけの胎児DNA濃度比率を推定し、母体−胎児混合遺伝子型AAABに属するSNP部位を特定できる。この状況では、AAABは、単胎児妊娠とは異なる意味を有する。一卵性双生児に対しては、AAABの母体−胎児混合遺伝子型の演繹による結論では、両胎児でABの胎児遺伝子型が示される。二卵性双生児に対しては、AAABは、異なる遺伝的構成から生じた、それぞれ、AA/AA/AB(母親/胎児I/胎児II)、AA/AB/AAおよびAA/AB/AB、の3つの潜伏型グループを含む。シーケンシングデータのみからは、AA/AB/AAからAA/AA/ABを区別できないので、我々は、前者2つのカテゴリーを1つに融合し、以下の分析を行うために、それぞれ、AA/AA/ABおよびAA/AB/AB、の2つの有効な潜伏型カテゴリーのみを存在させる。
母体血漿中の全ゲノム(または標的にしている目的領域)に対し、胎児DNA濃度比率のモダリティー(すなわち、1つまたは2つの最頻値があるか否か)(SNP部位当たりまたはブロック当たり、または血漿中の染色体当たりの
Figure 0006068598
)が双生児の接合状態により決定される。双生児に対しては、二卵性状態で、2つの最頻値が生じる可能性があり、胎児が異なるパーセンテージの胎児DNAの寄与をする場合、これらの最頻値の内の1つは、実際は、2つのサブノードから構成される場合がある(例えば、図9に示すように)。
遺伝的構成のモダリティーを明らかにするために、我々は、2成分混合ガウスモデル(GMM)を下記の
Figure 0006068598
の分布にフィッティングさせる:
Figure 0006068598
Figure 0006068598
式中、λmは、m=1,…,M(Mは、可能な最大ピーク数)に対し、
Figure 0006068598
を満たす混合比率である。胎児が、母体血漿中に等量のDNAの寄与を与える場合は、Mは、胎児の数、すなわち、双生児妊娠に対しては2に等しい。Φmおよびσ2 mは、正規分布の平均および分散である。
我々は、標準的期待値最大化(EM)アルゴリズム(McLachlan GJ and Krishnan T.EMアルゴリズムと機能拡張(The EM Algorithm and Extensions).New York:Wiley;1997)を使って、モデル(11)の混合成分を推定する。このアルゴリズムで、2つの成分を特定する場合、我々は、2つの追加の拘束を設定した:
1)
Figure 0006068598
式中、λmは、ピークmのサイズを表す;
2)
Figure 0006068598
式中、
Figure 0006068598
は、2つのピーク間の距離を示す。
D.結果
我々は、調査用に1つの二絨毛膜二羊膜(DCDA)双生児妊娠および1つの単絨毛膜二羊膜(MCDA)双生児妊娠を採用した。DCDAのケースに対しては、妊娠の17週に母親から各双生児由来の臍帯血を調査用に貯蔵した。MCDAのケースでは、妊娠の12週に母親から血液サンプルを採取した。絨毛膜絨毛試料(CVS)DNAの一部を調査用に貯蔵した。
SNP遺伝子型同定を行うために、母体のバフィーコートから抽出したDNAおよび双生児由来の臍帯血またはCVS試料を、Affymetrix Genome−Wide Human SNP Array 6.0システムを使って遺伝子型解析を行った。母親および各胎児のホモ接合状態/ヘテロ接合状態に基づいて、SNPを異なるカテゴリーに分類した(図12Aの表1200および図12Bの表1220)。双生児Iおよび双生児IIに対する遺伝子型の一致は、DCDAのケースが二卵性であることを示す(図12Cの表1240)。表1200は、DCDAのケースの遺伝子型解析結果を示す。表1220は、MCDAのケースに対する遺伝子型解析結果を示す。表3は、DCDAのケースの双生児Iおよび双生児IIに対する一致を示す。
血漿DNAのシーケンシングを次のように行った。母体血漿から抽出したDNAを、例示の目的のために、Agilent Sure Select技術を使って標的濃縮し、その後、合計5.5Mbサイズの標的領域に対し平均138〜143倍の読み深度に相当する抽出DNA断片(20300〜20900万)で、イルミナ社Hi−Seq standard paired−endプロトコル(各末端50bp)を使って配列決定した。標的領域には、chr1(0.33Mb)、chr2(0.30Mb)、chr3(0.62Mb)、chr4(0.32Mb)、chr5(0.33Mb)、chr7(0.31Mb)、chr8(0.62Mb)、chr9(0.31Mb)、chr12(0.05Mb)、chr13(0.30Mb)、chr15(0.33Mb)、chr17(0.66Mb)、chr19(0.35Mb)、chr20(0.34Mb)およびchr22(0.30Mb)を含めた。他の標的濃縮技術、例えば、Roche NimbleGenプラットフォームおよびPCRベース技術(例えば、RainDanceプラットフォームを使った)もまた使用可能である。
見かけの胎児DNA濃度比率を各染色体全領域で測定した。母体血漿中の見かけの胎児DNA濃度比率を、シーケンシングデータと組み合わせた遺伝子型を使って計算した。図12Dは、シーケンシングデータと組み合わせた遺伝子型に基づいて計算した見かけの胎児DNA濃度比率を示す(母親がAAで、胎児の少なくとも1人がAB)。各染色体に対する結果は、MCDAのケースに対しては、比較的一定で、1.52のSDであったが、他方、DCDAのケースに対しては、より大きい変動を示し、SDはほぼ2倍の3.36になった(図12Dの表1260)。MCDAに対しては、胎児DNA濃度比率は、16.35%であった。DCDAでは、胎児Iの胎児DNA濃度比率は、12.35%(AA/AB/AA)で、胎児IIの胎児DNA濃度比率は、13.60%(AA/AB/AA)であった。合わせた胎児DNA濃度比率は、22.45%(AA/AB/AB)で、見かけの胎児DNA濃度比率は、18.82%であった。
標的シーケンシングデータから直接に接合状態を区別できるかどうかを調べるために、我々は、演繹的SNPコール分析を行い、胎児DNA濃度を計算した。図12Eは、演繹的SNPコール分析により計算された見かけの胎児DNA濃度比率を示す。結果は、遺伝子型とシーケンシングデータの組み合わせに基づく推定値と高い一致を示した(ピアソンの相関係数:DCDAおよびMCDAに対しそれぞれ0.8および0.8)(図12Eの表1280)。さらに、SDは、一卵性双生児と二卵性双生児を直接識別するのを可能とした(二卵性双生児および一卵性双生児に対し、それぞれ、2.14および1.10)。
見かけの胎児DNA濃度比率の包括的分布に対し、我々は、標的ゲノム領域を複数のブロック(DCDAおよびMCDAに対し、それぞれ、432および445)に分割し、50kb未満の距離を有する5つを越える近接SNPを含めることにより、各ブロックを構築した。次に、各ブロックに対し見かけの胎児DNA濃度比率を計算し、胎児DNA濃度の分布を描いた。2成分混合ガウスモデルを使って、ブロック毎の胎児DNA濃度比率の分布をフィッティングさせた。
結果として、DCDAのケースに対し、我々は、分布由来の2つの異なるピークを特定することができた(図13)が、一方、MCDAのケースに対しては、1つのピークを得たのみであった(図14)。従って、二卵性双生児は、混合ガウスモデルを介して、一卵性双生児と識別できる。
別の実施形態では、我々は、それぞれ、一卵性双生児および二卵性双生児の対する胎児DNA濃度比率の2つの分布をコンピュータによりシミュレートした。その後、実際の胎児DNA分布比率をシミュレート胎児DNA分布比率と比較し、どちらのシミュレート分布が実際の胎児DNA分布により近いかを判定することにより、接合状態を推定した。また、実施形態は式(11)中のMの値を変更することにより、3人以上の胎児を含む妊娠に対しても使用できる。
結論としては、母体血漿DNAの大量並列シーケンシングにより、我々は、SNP当たり、またはブロック当たり、または染色体当たりの見かけ胎児DNA濃度比率の観点から、一卵性双生児と二卵性双生児の間に有意差を認めた。この技術は、非侵襲的であり、また、超音波走査による形態学的観察より信頼性が高いという利点を有する。他の実施形態では、胎児DNA濃度の1つまたは複数のピークが存在するか否かの判定のために、他の統計的モデル、例えば、隠れマルコフモデル、も使用できる。
V.胎児DNA濃度比率の変動
異なる染色体領域で胎児DNA濃度比率を測定することにより、我々は、1つのみの胎児DNA濃度なのか、または2つ以上の胎児DNA濃度が存在するのかを判定できる。一卵性および二卵性双生児を宿す妊婦の異なる染色体領域に対する血漿胎児DNA濃度比率を図15に示す。一組の一卵性双生児を宿す妊婦に対しては、胎児DNA濃度比率は、異なる染色体領域全体で一定である。対照的に、一組の二卵性双生児を宿す妊婦では、異なる染色体領域全体で胎児DNA濃度比率間の変動が増加する。このような変動は、二卵性胎児に対し上で示した標準偏差(SD)の増加に匹敵する。
別の実施形態では、我々は、異なる染色体領域全体の見かけの胎児DNA濃度比率の計算のために固定数のSNPを使用した。原理的には、二卵性双生児を宿す妊婦では、異なるゲノム領域全体にわたり、見かけの胎児DNA濃度比率は変動を示すと思われるが、一方、一卵性双生児を宿す妊婦では、異なるゲノム領域全体にわたり、見かけの濃度は変動がないであろう。濃度比率の変動が、一卵性双生児に伴う確率的変動に起因するのか、または二卵性双生児に伴う異なる胎児DNA濃度比率の存在に起因するのかを判定するために、我々は、一組の一卵性双生児の存在を仮定して、シミュレーション分析を行い、確率的変動のレベルを特定した(図16)。
シミュレーションは、以下の仮定に基づいて行った:(a)一組の一卵性双生児が存在する;(b)全領域の全体濃度比率をそれぞれの試験領域の濃度比率として使用する;(c)それぞれの試験領域中のSNPの配列決定深度は、全領域の平均配列決定深度と同じである;および(d)二項分布に従うSNPアレルの分布。
図16では、相対的見かけの胎児DNA濃度比率を、1000の連続SNPの内のアレル数に基づいて、その時点までの途中経過の合計として計算した。1000SNPに対する局所領域濃度を、全領域の平均胎児DNA濃度比率で除算することにより、相対的見かけの濃度比率を計算した。緑の線は、一組の一卵性双生児を宿す母親に対する結果を表し、赤い線は、一組の二卵性双生児を宿す母親に対する結果を表す。灰色の陰影領域は、上述の1000の異なるシミュレーションの結果を表す。緑の線が陰影領域内で変動し、濃度比率の変動が一組の一卵性双生児に対する予測変動範囲内にあることを示すのがわかる。一方、赤い線は、陰影領域を越えて変動し、濃度比率の変動が確率的変動のみでは説明できず、従って、その一組の双生児が二卵性であることを示唆することを示す。
VI.三つ子以上の多胎児
また、上述の方法を使って、3つ子以上の多胎妊娠における全ての胎児が遺伝的に同じであるか、または胎児の内の少なくとも1人が他の胎児とは遺伝的に異なるかを判定できる。三つ子以上の多胎妊娠は、例えば、超音波により立証されるように、母体血漿試料中で2つの父方のハプロタイプが検出できる場合は、胎児内の少なくとも1人が他の胎児とは異なることが示されるであろう。胎児DNA濃度比率の分析に対し、情報価値のあるSNPの推定方法は代わらないであろう。情報価値のあるSNPの特定および異なるゲノム領域に対する胎児DNA濃度比率の計算の後で、状況に応じて変更した式中のパラメータを使って、上記の式により、胎児の接合状態を決定できる。
三つ子およびそれより多い多胎児に対しては、多成分混合モデルに対する可能なピークMの数は、次のように決定できる。三つ子以上の胎児が存在する場合は、Mの計算は、一層複雑になるであろう。図17は、本発明の実施形態に従って、3人の胎児(胎児A、BおよびC)に対するいくつかの可能なピークを示すヒストグラムである。これら3人の胎児は、遺伝的に異なり、異なる量のDNAを母体血漿に対し寄与する。塗りつぶされていないピークは、1人の胎児のみがヘテロ接合である染色体領域を表す。1つの色のピークは、2人の胎児がヘテロ接合である染色体領域を表す。異なるパターンで塗りつぶされたピークは、3人全ての胎児がヘテロ接合である染色体領域を表す。従って、合計6つのピークが存在することになる。
胎児の数(N)およびピークの数(M)の間の関係は、
Figure 0006068598
となる。実際、胎児の全てが異なる量のDNAを母体血漿に対し寄与する場合、必ずしも全てのピークを特定する必要はないであろう。しかし、胎児の全てが等量のDNAを母体血漿に対し寄与する場合は、Mは、Nに等しくなるであろう。
VII.実施例
以下は、1人の胎児またはいく人かの一卵性胎児が寄与する最小の胎児濃度比率の決定のための仮説例である。最初の例に関して、多胎妊娠における異なる胎児の胎児DNA濃度比率の決定は、母体血漿の分析に基づく出生前診断試験の感度を調節するのに有用である(段落118も参照)。このような用途では、遺伝的に異なる胎児のいずれか1人により与えられる最小胎児DNA濃度比率、または2人以上の遺伝的に同じ胎児由来の組み合わせ胎児DNA濃度は、どちらが低いにしても、診断試験の感度が、胎児遺伝子異常、例えば、胎児異数性を検出するのに充分であるか否かを示すために使用できる。図17に示す例では、胎児Aにより寄与されるピークは、最小の見かけの胎児DNA濃度を表す。
一実施形態では、最小胎児DNA濃度比率は、母親がホモ接合で、父親がヘテロ接合である位置のいくつかの情報価値のあるSNPを分析することにより決定できる。これらのSNPは、いくつかの異なる染色体または染色体領域上に位置していることが好ましい。これらのSNPのそれぞれでの見かけの胎児DNA濃度比率は、胎児特異的アレルおよび母親と胎児の間で共通のアレルを有するDNA断片の数により計算される。母体血漿中への最小量のDNAの寄与を与える胎児のみがヘテロ接合であるが、他の胎児がホモ接合であるいずれのSNP座位でも、見かけの胎児DNA濃度比率は、全ての分析されたSNP座位中で最小になるであろう。従って、これらのSNP座位で決定された最小胎児DNA濃度比率は、いずれかの遺伝的に異なる胎児により寄与がなされた最小量の胎児DNAの推定値として使用できる。
別の実施形態では、SNP座位でのDNA濃度比率の決定を、SNP座位上の選択領域のデジタル解析(DANSR)を使って行うことができる(Sparks AB et al.Am J Obstet Gynecol 2012;doi:10.1016/j.ajog.2012.01.030)。1つまたは複数の染色体上に位置する胎児特異的および共通のアレルのデジタル計数を使って、SNP座位のそれぞれで見かけの濃度比率を推定できる。あるいは、同じ染色体領域上に位置する複数のSNP座位に関するアレル数情報を、一緒に分析し、それぞれの染色体領域での見かけの胎児DNA濃度比率を示すことができる。最小の見かけの胎児DNA濃度を示す染色体領域を使って、いずれかの胎児により寄与された最小胎児DNAを示すことができる。他の実施形態では、異なるSNP座位での濃度比率の決定を、リアルタイムPCR、質量分析(例えば、SequenomMassARRAYシステムにより)およびデジタルPCR分析を使って行うことができる。
分析されるSNP座位の数は、分析される座位の内の少なくとも1つで、二卵性双生児の内の少なくとも一組を宿す妊娠に対し、母体のアレルに関して、最小量のDNAを母体血漿に対し寄与する胎児(または一卵性胎児の組み合わせ)のみがヘテロ接合であるが、他の胎児は、ホモ接合であることを保証するのに充分な大きさでなければならない。例えば、100を越える潜在的に情報価値のあるSNPが分析されるべきである。さらに、それぞれに情報価値のあるSNP座位の分析に関し、充分に大きな量のDNA断片を分析して、胎児特異的アレルが検出されることを保証しなければならない。
2つ目の例では、実施形態のプロセスに従って説明が行われる。10mLの母体の末梢血試料を、超音波により双生児胎児を宿すことがわかっている妊婦から採取する。血液サンプルを血漿および血液細胞中に分取する。血漿を採取し、DNAを抽出する。次に、母体血漿DNAを一連の10マルチプレックスPCRにより増幅する。各PCRは、異なるゲノム領域に分布した20のSNP座位の増幅を可能とする。従って、この例では、全体で200SNP座位が分析されることになる。
マルチプレックスPCRのそれぞれ由来のPCR産物をプライマー伸長アッセイにより解析し、伸長産物を、例えば、Sequenom MassARRAYシステムにより分析する。各プライマー伸長アッセイに続けて、Sequenom MassARRAY分析により、SNP座位のそれぞれのアレルに対応する質量分析ピークを明らかにする。相対的ピーク高さは、各SNPアレルの相対量を示す。妊婦母親および胎児の両方が、同じアレルに対しホモ接合であるSNPでは、そのアレルに対応する1つのピークのみが、質量分析の読み取りで認められる。妊婦である母親がヘテロ接合であるSNPでは、両方のSNPのアレルに対応するほぼ同じ高さの2つのピークが、質量分析の読み出しで認められる。妊婦である母親がホモ接合で、胎児の内の少なくとも1人がヘテロ接合であるSNPに対しては、1つのピーク(母親のアレルに対応する)および1つの小さなピーク(母親のゲノム中に存在しない胎児アレルに対応する)が、質量分析の読み出しで認められる。後者の2つのピークの相対的サイズにより、胎児DNAパーセンテージ(すなわち、胎児DNA濃度比率)の測定が可能となる。
一実施形態では、座位の特定の組み合わせで、1つの大きな(母体のアレルに対応する)ピークおよび1つの小さな(胎児特異的アレルに対応する)ピークを示すSNPの比率は、例えば、6%になるであろう。双生児胎児が一卵性の場合には、これらの6%のSNPにより測定した胎児DNA濃度比率は、相対的に相互に近いはずである。値の近さは、例えば、標準偏差(SD)により測定できる。双生児胎児が二卵性の場合は、6%のSNPを2つのグループに分割できる。第1のグループに対しては、2人の胎児は、両方共、単に偶然に、ヘテロ接合であろう。2つ目のグループでは、またしても単に偶然に、胎児の内の1人は、ホモ接合で、残りはヘテロ接合であろう。第1のグループで1つまたは複数のSNPにより測定された胎児DNA濃度比率は、2つ目のグループで1つまたは複数のSNPにより測定された濃度比率より大きいであろう。このような分析用に選択されるSNPは、特定の集団に対し最も情報価値のあるように選択できる。
質量分析の代わりとして、この例の分析を当業者に既知の同等の方法を使って行うことができる。1例は、大量並列シーケンシングの前の、増幅手続きのSNP座位に対する性能である。この戦略の1つの変形は、選択領域のデジタル解析である(DANSR)(Sparks AB et al.Am J ObstetGynecol 2012;doi:10.1016/j.ajog.2012.01.030)。別の例は、QuantaLifeプラットフォームまたはRainDanceプラットフォームを使う等の、微小滴デジタルPCR(microdroplet digital PCR)である(Zhong Q et al.Lab Chip 2011;11:2167−2174)、さらに別の例は、マイクロフルイディクスデジタルPCRの使用である。このようなアッセイのマルチプレクシングにより、このような分析のスループットを高められるであろう。
VIII.コンピュータシステム
本明細書に記載のいずれのコンピュータシステムに関しても、任意の適切な数のサブシステムを利用することが可能である。このようなサブシステムの例を、図18のコンピュータ装置1800に示す。一部の実施形態では、コンピュータシステムは、ただ1つのコンピュータ装置を含み、この場合、サブシステムは、コンピュータ装置の構成要素でありうる。他の実施形態では、コンピュータシステムは、複数のコンピュータ装置を含み、それぞれが内部構成要素を含むサブシステムであってもよい。
図18に示すサブシステムは、システムバス1875を介して相互接続される。例えば、プリンター1874、キーボード1878、固定ディスク1879、ディスプレイアダプター1882に接続されたモニター1876、等の追加のサブシステム、が示されている。I/O制御装置1871に接続された周辺装置および入/出力(I/O)装置を、当技術分野で既知の任意の数のシリアルポート1877、等の手段によりコンピュータシステムに接続できる。例えば、シリアルポート1877または外部インターフェイス1881を使って、コンピュータシステム1800をインターネット等の広域ネットワーク、マウス入力装置、またはスキャナーに接続できる。システムバス1875を介した相互接続は、中央処理装置1873のそれぞれのサブシステムとの通信、およびシステムメモリー1872または固定ディスク1879からの命令の実行の制御、ならびにサブシステム間の情報交換の制御を可能とする。システムメモリー1872および/または固定ディスク1879は、コンピュータ可読メディアを組み入れることができる。本明細書に記載のいずれのデータも、1つの装置から別の装置に出力でき、また、ユーザーにも出力できる。
コンピュータシステムは、例えば、外部インターフェイス1881または内部インターフェイスにより接続された複数の同じ装置またはサブシステムを含むことができる。一部の実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワークを介して通信できる。このような場合は、1つのコンピュータをクライアント、別のコンピュータをサーバーと見なすことができ、この場合、それぞれは、同じコンピュータシステムの一部となりうる。クライアントおよびサーバーは、それぞれ複数のシステム、サブシステム、または装置を含んでもよい。
本発明のいずれの実施形態も、モジュールまたは集積方式のハードウェアおよび/またはコンピュータソフトウェアを使った制御論理の形で実装できることは理解されよう。本明細書で提供される開示と教示に基づいて、当業者なら、ハードウェアおよびハードウェアとソフトウェアの組み合わせを使って、本発明の実施形態を実施する他の手段、および/または方法を知り、理解するであろう。
本出願に記載のいずれのソフトウェア成分または機能も、例えば、Java、C++またはPerl等のいずれかの適切なコンピュータ言語を使い、例えば、従来の、またはオブジェクト指向技術を使って、プロセッサにより実行されるソフトウェアコードとして実装可能である。ソフトウェアコードは、保存、および/または送信用のコンピュータ可読メディア上の一連の指令または命令として保存できる。適切なメディアには、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、ハードドライブもしくはフロッピーディスク、等の磁気メディア、またはコンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)等の光学メディア、フラッシュメモリ、等が含まれる。コンピュータ可読メディアは、このような保存または送信装置のいずれかの組み合わせであってもよい。
このようなプログラムは、また、インターネットを含む種々のプロトコルに準拠した有線、光学、および/または無線ネットワークを介した送信に適応したキャリアシグナルを使って、コード化および送信できる。従って、本発明の実施形態によるコンピュータ可読メディアは、このようなプログラムでコードされたデータシグナルを使って作成できる。プログラムコードでコードされたコンピュータ可読メディアは、互換性のある装置と一緒にパッケージされても、または他の装置から別々に(例えば、インターネットのダウンロードで)提供されてもよい。いずれのこのようなコンピュータ可読ディアも、単一コンピュータプログラム製品(例えば、ハードドライブ、CD、または全体コンピュータシステム)上にあっても、内部にあってもよく、また、システムまたはネットワーク内の異なるコンピュータプログラム製品上にあっても、内部にあってもよい。コンピュータシステムは、モニター、プリンター、または本明細書記載のいずれかの結果をユーザーに提供するための他の適切なディスプレイを含んでもよい。
本明細書記載の方法のいずれかは、全体的に、または部分的に、ステップを実行するように構成できる、プロセッサを含むコンピュータシステムを使って行うことができる。従って、実施形態は、本明細書記載の方法のいずれかのステップを実行するように構成され、場合によっては、それぞれのステップまたはそれぞれのステップグループを実行する異なる装置を備えた、コンピュータシステムを対象にできる。番号を付けたステップとして示したが、本明細書にある方法のステップは、同時にまたは異なる順で行うことができる。さらに、これらのステップの一部は、他の方法由来の他のステップの一部と一緒に使用できる。また、全部または一部のステップは、任意に選択できる。さらに、いずれかの方法のいずれかのステップは、モジュール、回路、またはこれらのステップを実行する他の手段と一緒に行うことができる。
特定の実施形態の特定の詳細は、本発明の実施形態の趣旨および範囲を逸脱することなく、いずれかの適切な方法で組み合わせることができる。しかし、本発明の他の実施形態は、それぞれの個別態様、またはこれらの個別態様の特定の組み合わせ、に関連する具体的実施形態を対象にできる。
本発明の代表的実施形態の上記説明は、例示と説明の目的で提示されている。それは、網羅的とする意図、または本発明を記載された通りの形態に限定する意図はなく、上記教示を考慮すると多くの修正及び変形が可能である。実施形態は、本発明の原理およびその実際的適用を最良に説明し、それにより、種々の実施形態で、特定の意図された用途に適合されるように種々の変形を用いて、他の当業者が本発明を最良に利用するのを可能とするように選択および記載された。
特に逆の指示がなければ、「a」、「an」または「the」の記述は、「1つまたは複数の」を意味することが意図されている。
全ての特許、特許出願、出版物、および上述の記載は、参照によってその全体が、あらゆる目的において、本明細書に組み込まれる。これらのいずれも先行技術であることを認めるものではない。

Claims (30)

  1. 多胎児を宿す妊婦の、胎児および母体のDNAを含む生物学的試料を分析する方法であって、以下のステップ:
    妊婦が1つまたは複数の第1の座位のそれぞれでホモ接合であるか、または1つまたは複数の第1の座位のそれぞれでヘテロ接合であり、第1の座位のそれぞれが生物学的試料中でそれぞれの主要アレルおよびそれぞれの第2の(secondary)アレルを示し、第1の座位のそれぞれに対するそれぞれの主要アレルがそれぞれの第2のアレルよりも量が多い、第1の染色体領域内の1つまたは複数の第1の座位のそれぞれで妊婦の遺伝子型を決定し;
    1つまたは複数の第1の座位で、生物学的試料中の1つまたは複数の主要アレルの第1の量および/または1つまたは複数の第2のアレルの第2の量を測定し;
    第1の量または第2の量に対する正規化パラメータを取得し;および
    第1の染色体領域で胎児が遺伝的に互いに同じ場合に、正規化パラメータが統計的に期待値とは異なるかどうかの判定を行うために、正規化パラメータとカットオフ値とを比較し、ここで、期待値は、生物学的試料の別個の測定により取得され、該生物学的試料中の胎児DNAの総画分に対応し、それによって、カットオフ値に対する正規化パラメータの比較に基づき、妊婦の胎児の内の少なくとも2人が二卵性であるか否かを評価すること、
    を含む、方法。
  2. 第1の座位のそれぞれで、生物学的試料中のそれぞれの主要アレルおよびそれぞれの第2のアレルの検出をさらに含む、請求項1に記載の方法。
  3. 正規化パラメータの取得が、
    異なる染色体領域内での1つまたは複数の座位由来の1つまたは複数の配列の第3の量の測定;および
    正規化パラメータを計算するための第3の量および第1の量または第2の量の使用;
    を含む、請求項1に記載の方法。
  4. 正規化パラメータの取得が、
    1つまたは複数の第1の座位で、生物学的試料中の1つまたは複数の主要アレルの第1の量および1つまたは複数の第2のアレルの第2の量の測定;
    第1の量および第2の量の間の相対量を与える、第1の量および第2の量からの第1のパラメータの決定;さらに
    第1のパラメータの、第1の量の正規化値としての使用、
    を含む、請求項1に記載の方法。
  5. 正規化パラメータの取得が、
    較正プロセスを使った測定ステップの実行;および
    第1の量または第2の量の正規化パラメータとしての使用、
    を含む、請求項1に記載の方法。
  6. 期待値が、生物学的試料中の胎児DNA濃度である、請求項1に記載の方法。
  7. 1つまたは複数のエピジェネティックマーカーを用いる胎児DNA濃度の測定をさらに含む、請求項6に記載の方法。
  8. 1つまたは複数のエピジェネティックマーカーが、1つまたは複数のDNAメチル化マーカーを含む、請求項7に記載の方法。
  9. 全ての胎児が胎児特異的配列を有する場合に、1つまたは複数の胎児特異的配列から選択される胎児特異的配列を有するDNA断片の第3の量の測定;
    第3の量の正規化値の取得;および
    正規化値の胎児DNA濃度としての使用、
    による遺伝子マーカーを使った胎児DNA濃度の計算をさらに含む、請求項6に記載の方法。
  10. 胎児が全て男児で、1つまたは複数の胎児特異的配列がY染色体上にある、請求項9に記載の方法。
  11. 胎児特異的配列がRHD遺伝子で、母親がRhD陰性であり、全ての胎児がRhD陽性である、請求項9に記載の方法。
  12. 胎児がそれぞれの第1のアレルを有し、母親がそれぞれの第1のアレルを持たない1つまたは複数の第2の座位の特定、ここで、胎児特異的配列がそれぞれの第1のアレルである、をさらに含み、
    第3の量に対する正規化値の取得が:
    1つまたは複数の第2の座位でのアレル合計量の測定;
    第3の量および合計量の比率からの胎児DNA濃度の計算、
    を含む、請求項9に記載の方法。
  13. 1つまたは複数の座位がRHD遺伝子の座位を含み、母親がRHD遺伝子の非存在により表されるアレルに対しホモ接合であり、胎児の内の少なくとも1人がRhD陽性である、請求項1に記載の方法。
  14. 妊婦が1つまたは複数の第1の座位のそれぞれでホモ接合であるか、または1つまたは複数の第1の座位のそれぞれでヘテロ接合であり、第2の座位のそれぞれが、生物学的試料中のそれぞれの主要アレルおよびそれぞれの第2のアレルを提示する場合に、第2の染色体領域内の1つまたは複数の第2の座位のそれぞれで妊婦の遺伝子型を決定し;
    生物学的試料中の1つまたは複数の第2の座位で、1つまたは複数の主要アレルの第3の量および/または1つまたは複数の第2のアレルの第4の量を測定し;
    第3の量または第4の量に対する第2の正規化パラメータを取得し;および
    期待値を得るための第2の正規化パラメータを使用すること、
    をさらに含む、請求項1に記載の方法。
  15. 第2の正規化パラメータが期待値として使用される、請求項14に記載の方法。
  16. 他の染色体領域の追加の正規化パラメータの計算;
    染色体領域の第1のグループの正規化パラメータから第1の統計値の計算;および
    第1の統計値の期待値としての使用
    をさらに含む、請求項14に記載の方法。
  17. 第1の染色体領域グループの座位の全てに対し、それぞれの主要アレルが、それぞれの第2のアレルより量が多い、請求項16に記載の方法。
  18. 第1の統計値が、第1の染色体領域グループに対する正規化パラメータのヒストグラムの正規化パラメータの値のピーク位置である、請求項16に記載の方法。
  19. 第1の染色体領域を含む第2の染色体領域グループのパラメータから第2の統計値の計算をさらに含み、
    正規化パラメータのカットオフ値との比較が、第2の統計値のカットオフ値との比較を含む、請求項16に記載の方法。
  20. 計算パラメータのヒストグラムの分析による第1および第2の染色体領域グループの特定をさらに含み、第1の染色体領域グループがヒストグラムの第1のピークに対応し、第2の染色体領域グループがヒストグラムの第2のピークに対応する、請求項19に記載の方法。
  21. 大量並列シーケンシング、標的大量並列シーケンシング、PCR、定量PCR、リアルタイムPCR、デジタルPCR、連結反応(ライゲーション)、ハイブリダイゼーションまたは質量分析から得たデータを使って測定が行われる、請求項1に記載の方法。
  22. 異なる染色体領域内の1又は複数の座位から1又は複数の配列の第3の量を計算し;
    該第3の量のもう一つの正規化パラメータを取得し;
    他の正規化パラメータが統計的に期待値とは異なるかどうかの判定を行うための、他の正規化パラメータとカットオフ値とを比較し、ここで、妊婦の胎児の内の少なくとも2人が二卵性であるか否かの評価は、正規化パラメータとカットオフ値との比較に更に基づく、
    をさらに含む、請求項1に記載の方法。
  23. 多胎児を宿す妊婦の、胎児および母体のDNAを含む生物学的試料を分析する方法であって、
    生物学的試料中の1つまたは複数の第1の座位で、1つまたは複数の胎児特異的配列の第1の量の測定;
    第1の量の正規化パラメータの取得;および
    第1の染色体領域で胎児が遺伝的に互いに同じ場合に、正規化パラメータが統計的に期待値とは異なるか否かの判定のための、正規化パラメータのカットオフ値に対する比較、ここで、期待値は、生物学的試料の別個の測定により取得され、該生物学的試料中の胎児DNAの総画分に対応する、それによって、カットオフ値に対する正規化パラメータの比較に基づき、妊婦の胎児の内の少なくとも2人が二卵性であるか否かの評価、
    を含む、方法。
  24. 胎児特異的配列がY染色体上にある、請求項23に記載の方法。
  25. 胎児特異的配列がRHD遺伝子であり、妊婦がRhD陰性である、請求項23に記載の方法。
  26. 生物学的試料中の期待値が胎児DNA濃度である、請求項23に記載の方法。
  27. 1つまたは複数の第1の座位が第1の染色体領域内にあり、
    第1の染色体領域とは異なる第2の染色体領域内にある1つまたは複数の第2の座位で、生物学的試料中の1つまたは複数の追加の胎児特異的配列の第2の量の測定;
    第2の量に対する追加の正規化パラメータの取得;および
    追加の正規化パラメータの期待値を得るための使用;
    をさらに含む、請求項23に記載の方法。
  28. 1つまたは複数の第1の座位が第1の染色体領域内にあり、
    第1の染色体領域とは異なる第2の染色体領域内にある1つまたは複数の第2の座位で、生物学的試料中の1つまたは複数の追加の胎児特異的配列の第2の量の測定;
    第2の量に対する追加の正規化パラメータの取得;および
    追加の正規化パラメータの期待値を得るための使用
    をさらに含む、請求項23に記載の方法。
  29. 演算を実行するためのプロセッサ制御用の複数の命令を記憶したコンピュータ可読メディアであって、その命令が請求項1〜28のいずれか1項で定義された方法を含む、コンピュータ可読メディア。
  30. 請求項1〜28のいずれか1項で定義された方法を実行する手段を含むコンピュータシステムであって、少なくともプロセッサおよびメモリを更に含む、コンピュータシステム。
JP2015217329A 2011-02-24 2015-11-05 多胎妊娠の分子検査 Active JP6068598B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161446256P 2011-02-24 2011-02-24
US61/446,256 2011-02-24

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013554948A Division JP5837622B2 (ja) 2011-02-24 2012-02-24 多胎妊娠の分子検査

Publications (2)

Publication Number Publication Date
JP2016034282A JP2016034282A (ja) 2016-03-17
JP6068598B2 true JP6068598B2 (ja) 2017-01-25

Family

ID=47753591

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013554948A Active JP5837622B2 (ja) 2011-02-24 2012-02-24 多胎妊娠の分子検査
JP2015217329A Active JP6068598B2 (ja) 2011-02-24 2015-11-05 多胎妊娠の分子検査

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013554948A Active JP5837622B2 (ja) 2011-02-24 2012-02-24 多胎妊娠の分子検査

Country Status (9)

Country Link
US (2) US10900080B2 (ja)
EP (5) EP2678451B1 (ja)
JP (2) JP5837622B2 (ja)
CN (2) CN103492589B (ja)
AU (1) AU2012311262C1 (ja)
CA (2) CA2827873C (ja)
HK (1) HK1203567A1 (ja)
TW (1) TWI611186B (ja)
WO (1) WO2013041921A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI3783110T3 (fi) 2009-11-05 2023-03-02 Fetaalisen genomin analyysi maternaalisesta biologisesta näytteestä
US11322224B2 (en) * 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
JP5837622B2 (ja) 2011-02-24 2015-12-24 ザ チャイニーズ ユニバーシティー オブ ホンコンThe Chinese University Of Hongkong 多胎妊娠の分子検査
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
RU2014152211A (ru) * 2012-05-23 2016-07-20 БГИ Диагносис Ко., Лтд. Способ и система идентификации типов близнецов
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
TWI489305B (zh) * 2012-11-21 2015-06-21 Bgi Diagnosis Co Ltd 對胎兒遺傳異常的無創性檢測
EP3351643B1 (en) 2013-02-28 2019-09-18 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing
KR20150132216A (ko) * 2013-03-15 2015-11-25 더 차이니즈 유니버시티 오브 홍콩 다태 임신에 대한 태아 게놈의 결정
AU2014284180B2 (en) 2013-06-21 2020-03-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP3739061B1 (en) * 2015-07-20 2022-03-23 The Chinese University Of Hong Kong Methylation pattern analysis of haplotypes in tissues in dna mixture
EP3518974A4 (en) 2016-09-29 2020-05-27 Myriad Women's Health, Inc. NON-INVASIVE PRENATAL SCREENING USING DYNAMIC ITERATIVE DEEP OPTIMIZATION
US11441174B2 (en) 2017-06-02 2022-09-13 Affymetrix, Inc. Array-based methods for analysing mixed samples using differently labelled allele-specific probes
WO2018223057A1 (en) * 2017-06-02 2018-12-06 Affymetrix, Inc. Array-based methods for analysing mixed samples using different allele-specific labels, in particular for detection of fetal aneuploidies
US11603557B2 (en) 2017-06-02 2023-03-14 Affymetrix, Inc. Array-based methods for analysing mixed samples using differently labelled allele-specific probes
CN112634986A (zh) * 2019-09-24 2021-04-09 厦门希吉亚生物科技有限公司 一种基于孕妇外周血对双胞胎合子性质的无创鉴定方法
KR102162831B1 (ko) 2019-12-26 2020-10-08 주식회사 마크로젠 혼합 모델을 이용한 쌍태아의 접합성 타입 결정 방법 및 분석 장치
JP7121440B1 (ja) * 2020-12-16 2022-08-18 株式会社seeDNA 多型座位の信号の信頼性値の算出方法
CN114214425B (zh) * 2020-12-23 2024-01-19 上海亿康医学检验所有限公司 一种鉴定核酸样本的亲本倾向性的方法或装置
CN113981062B (zh) * 2021-10-14 2024-02-20 武汉蓝沙医学检验实验室有限公司 以非生父和母亲dna评估胎儿dna浓度的方法及应用
WO2023120783A1 (ko) * 2021-12-24 2023-06-29 주식회사 마크로젠 혼합 모델을 이용한 쌍태아의 접합성 타입 결정 방법 및 분석 장치

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US6013449A (en) * 1997-11-26 2000-01-11 The United States Of America As Represented By The Department Of Health And Human Services Probe-based analysis of heterozygous mutations using two-color labelling
CA2428757A1 (en) * 2000-11-15 2002-07-18 Roche Diagnostics Corporation Methods and reagents for identifying rare fetal cells in the maternal circulation
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
WO2003031646A1 (en) * 2001-10-12 2003-04-17 The University Of Queensland Multiple genetic marker selection and amplification
US6977162B2 (en) * 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US7709194B2 (en) 2004-06-04 2010-05-04 The Chinese University Of Hong Kong Marker for prenatal diagnosis and monitoring
ATE382101T1 (de) 2004-07-01 2008-01-15 Integragen Sa Einen transkriptionsfaktor kodierendes humanes prädispositionsgen für autismus sowie dessen verwendungen
US7754428B2 (en) 2006-05-03 2010-07-13 The Chinese University Of Hong Kong Fetal methylation markers
WO2007147074A2 (en) * 2006-06-14 2007-12-21 Living Microsystems, Inc. Use of highly parallel snp genotyping for fetal diagnosis
US20090029377A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
EP2116618A1 (en) 2008-05-09 2009-11-11 Agency for Science, Technology And Research Diagnosis and treatment of Kawasaki disease
US8476013B2 (en) * 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
SG10201501804WA (en) * 2008-12-22 2015-05-28 Celula Inc Methods and genotyping panels for detecting alleles, genomes, and transcriptomes
FI3783110T3 (fi) 2009-11-05 2023-03-02 Fetaalisen genomin analyysi maternaalisesta biologisesta näytteestä
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US20110312503A1 (en) * 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
US20120190021A1 (en) * 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
CA2824387C (en) 2011-02-09 2019-09-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
JP5837622B2 (ja) 2011-02-24 2015-12-24 ザ チャイニーズ ユニバーシティー オブ ホンコンThe Chinese University Of Hongkong 多胎妊娠の分子検査
SI3078752T1 (sl) * 2011-04-12 2018-12-31 Verinata Health, Inc Razreševanje frakcij genoma z uporabo števila polimorfizmov
WO2012141712A1 (en) 2011-04-14 2012-10-18 Verinata Health, Inc. Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
ES2886508T3 (es) * 2011-10-06 2021-12-20 Sequenom Inc Métodos y procedimientos para la evaluación no invasiva de variaciones genéticas
KR20150132216A (ko) 2013-03-15 2015-11-25 더 차이니즈 유니버시티 오브 홍콩 다태 임신에 대한 태아 게놈의 결정

Also Published As

Publication number Publication date
EP3202921A1 (en) 2017-08-09
CN103492589A (zh) 2014-01-01
EP2860265A1 (en) 2015-04-15
EP2678451B1 (en) 2017-04-26
EP2678451A4 (en) 2014-10-22
EP3489368B1 (en) 2020-09-09
CA2827873C (en) 2022-08-16
CN106011237A (zh) 2016-10-12
CN103492589B (zh) 2016-06-15
HK1203567A1 (en) 2015-10-30
CN106011237B (zh) 2019-12-13
TWI611186B (zh) 2018-01-11
US10900080B2 (en) 2021-01-26
EP2678451A1 (en) 2014-01-01
EP2682887A2 (en) 2014-01-08
AU2012311262C1 (en) 2017-06-29
JP5837622B2 (ja) 2015-12-24
EP3202921B1 (en) 2019-02-13
AU2012311262A1 (en) 2013-05-02
JP2014507158A (ja) 2014-03-27
US20210095340A1 (en) 2021-04-01
CA3160848A1 (en) 2013-03-28
US20130059733A1 (en) 2013-03-07
WO2013041921A1 (en) 2013-03-28
TW201243326A (en) 2012-11-01
EP2860265B1 (en) 2016-10-26
CA2827873A1 (en) 2013-03-28
AU2012311262B2 (en) 2014-10-09
JP2016034282A (ja) 2016-03-17
EP3489368A1 (en) 2019-05-29

Similar Documents

Publication Publication Date Title
JP6068598B2 (ja) 多胎妊娠の分子検査
US20220282332A1 (en) Size-based genomic analysis
TWI458976B (zh) 由母體之生物樣本分析胎兒之基因體
US20190042693A1 (en) Noninvasive prenatal genotyping of fetal sex chromosomes
US20140256559A1 (en) Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
US20210130900A1 (en) Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
AU2015200462B2 (en) Size-based genomic analysis

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161222

R150 Certificate of patent or registration of utility model

Ref document number: 6068598

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250