JP2022519159A - 循環細胞の分析方法 - Google Patents

循環細胞の分析方法 Download PDF

Info

Publication number
JP2022519159A
JP2022519159A JP2021534226A JP2021534226A JP2022519159A JP 2022519159 A JP2022519159 A JP 2022519159A JP 2021534226 A JP2021534226 A JP 2021534226A JP 2021534226 A JP2021534226 A JP 2021534226A JP 2022519159 A JP2022519159 A JP 2022519159A
Authority
JP
Japan
Prior art keywords
cancer
cells
patient
dna
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021534226A
Other languages
English (en)
Inventor
ブレヴノフ,マキシム
リバーズ,エリザベス
Original Assignee
ナテラ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナテラ, インコーポレイテッド filed Critical ナテラ, インコーポレイテッド
Publication of JP2022519159A publication Critical patent/JP2022519159A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、循環細胞を特徴解析および分析するための方法を提供する。特に本発明は、個々の細胞の固有性を確認する方法、および取得されたサンプルが、既定された固有性の一つの細胞に由来することを確認する方法を提供する。循環胎児細胞、微小欠失、癌に関連する一塩基変動、または癌の早期再発と転移の状況において、コピー数変動および異数性を決定するために一つの細胞のサンプルを分析する追加の方法が提供される。【選択図】図1

Description

関連出願への相互参照
本出願は、2018年12月17日に出願された米国仮特許出願第62/780,724号明細書および2019年1月28日に出願された米国仮特許出願第62/797,518号明細書の利益を主張するものであり、それら出願はその全体で参照により本明細書に組み込まれる。
現在、出生前診断、疾患および状態の診断、ならびに疾患の発生と治療応答の検査とモニタリングに関して、侵襲性の高い組織生検法の代わりとして液体生検(liquid biopsy)を使用することに大きな関心が寄せられている。例えば、妊娠中の母親の液体生検は、非侵襲的な胎児の診断法と検査を提供するものであり、胎児または羊水に対する侵襲的な生検を実施することで発生するリスクが回避される。癌の発生および治療応答の診断ならびにモニタリングを行う場合でも、液体生検は、転移または外科手術合併症の原因となる可能性があるリスクを伴う侵襲的な腫瘍組織生検の実施を回避し得る。また液体生検を基にした方法は、早期ステージでの再発または転移を検出するには感受性が不充分な画像系の検出法よりも感度が高い場合がある。
液体生検は、患者から血液または尿のサンプルを採取すること、および胎児、腫瘍、または他の対象となる器官から剥がれ落ちるセルフリーDNAや循環細胞を単離することに基づいている。セルフリーDNAや循環細胞の分析を行うことによって、強力で非侵襲的な診断方法が提供されてきた。しかしセルフリーDNAは断片化されており、全ゲノムは網羅されないため、セルフリーDNAの分析では、細胞および/または組織から全ゲノムDNAを直接分析する場合と同量の情報は得られない。一方で循環細胞の分析は、非常に少量の細胞サンプルを特徴解析および分析するという困難さにより、課題を抱えている。したがって、液体生検を基にした方法を最大限に活用するために、少数の細胞または一つの細胞のみを含有するサンプルを単離および分析する方法が求められている。
本明細書において、少数の循環細胞または一つの循環細胞のみを含有する場合がある循環細胞サンプルを分析および特徴解析するための方法が開示される。本明細書に例証される態様によれば、一つの実施形態において、胎児を妊娠している母親の血液サンプルに由来する、または細胞株に由来する胎児起源であると推測される循環細胞を分析および特徴解析する方法であって、当該方法は、a)当該血液サンプルまたは細胞株から取得された胎児起源であると推測される一つ以上の循環細胞から単離された細胞DNAの第一のアンプリコン(amplicon)セットと、当該血液サンプルの血漿画分から取得されたセルフリーDNA、または子供の細胞株と母親の細胞株の混合DNAの第二のアンプリコンセットを生成する工程であって、当該第一のアンプリコンセットと第二のアンプリコンセットは、複数の一塩基多型(SNP)座位の多重化増幅反応を実施することによって取得される工程、b)当該第一のアンプリコンセットと当該第二のアンプリコンセットを、次世代シーケンスにより遺伝子型解析する工程、およびc)当該第一のアンプリコンセットと当該第二のアンプリコンセットの遺伝子型に基づき、当該一つ以上の循環細胞が、一つ以上の母細胞である、一つ以上の胎児細胞である、または母細胞と胎児細胞の混合であると決定する工程、を含む。
一つの実施形態において、本明細書に開示される方法は、血液サンプルのバフィーコート画分から取得された一つ以上の母細胞から単離された母細胞DNAの第三のアンプリコンセットを生成すること、および当該第三のアンプリコンセットを次世代シーケンスにより遺伝子型解析して、母親の遺伝子型を決定すること、をさらに含む。
一つの実施形態では、本明細書に開示される方法は、血液サンプルから、胎児起源であると推測される循環細胞、セルフリーDNAを含む血漿画分、および母細胞を含むバフィーコート画分を取得することをさらに含む。
一つの実施形態では、当該一つ以上の循環細胞が、一つ以上の母細胞である、一つ以上の胎児細胞である、または母細胞と胎児細胞の混合であると決定することは、血漿画分から取得されたセルフリーDNA(または子供と母親のDNA混合であることが判明しているセルフリーDNA)と、胎児起源であることが推測される循環細胞(または子供の細胞株)から取得された細胞DNAの間の母体一致と胎児一致を計算すること、および胎児混合割合(または子供割合)の計算を含む。
一つの実施形態では、第一のアンプリコンセットと第二のアンプリコンセットは、少なくとも1,000個のSNP座位の多重化増幅反応を実施することにより取得される。
一つの実施形態では、本明細書に開示される方法は、SNP座位の量を測定することにより、母細胞と胎児細胞の混合物(または母親と子供の細胞株の混合物)のうちの胎児割合を推定することをさらに含む。
一つの実施形態では、本明細書に開示される方法は、SNPでのアレル比を決定することをさらに含む。
一つの実施形態では、胎児割合の推定は、アレル比を使用する。
一つの実施形態では、本明細書に開示される方法は、複数の循環細胞を個々の反応ボリュームに分けること、各反応ボリューム中の細胞DNAを単離すること、および各反応ボリュームにおいて単離された細胞DNAにサンプルバーコードを取り付けることを含む。
一つの実施形態では、細胞DNAは、胎児細胞であると推測される一つの循環細胞から単離される。
一つの実施形態では、当該方法はさらに、一つ以上の循環細胞が一つ以上の胎児細胞であると決定された遺伝子型を使用して、非侵襲的な出生前検査を実施することを含む。
一つの実施形態では、当該方法はさらに、一つ以上の胎児細胞であると決定された一つ以上の循環細胞における対象となる標的染色体または標的染色体セグメントのコピー数変動または異数性を検出することを含む。
一つの実施形態では、対象となる標的染色体または標的染色体セグメントは、13番染色体、18番染色体、21番染色体、性染色体、および/またはそれらの染色体セグメントである。
一つの実施形態では、本明細書に開示される方法はさらに、一つ以上の純粋な胎児細胞であると決定された一つ以上の循環細胞における微小欠失を検出することを含む。
一つの実施形態では、微小欠失は、ディジョージ症候群に関連する22q11.2欠失、プラダーウィリ症候群に関連する微小欠失、アンジェルマン症候群に関連する微小欠失、1p36欠失、および/または猫鳴き症候群に関連する微小欠失である。
別の例示的態様において、一つの態様では、本開示は、腫瘍に由来すると決定された一つ以上の循環細胞を取得することにより、癌患者における腫瘍の早期再発または転移をモニタリングおよび検出するための方法を提供し、当該方法は、
a)癌と診断された患者の腫瘍サンプルにおいて特定された変異に基づいて、一つ以上の患者特異的変異を選択する工程、
b)当該患者が外科手術、第一選択化学療法、および/またはアジュバント療法で治療された後、当該患者から一つ以上の血液サンプルを長期的に採取する工程、
c)当該癌患者から取得された当該血液サンプルから取得された、循環腫瘍細胞であると推測される一つ以上の循環細胞から単離された細胞DNAから第一のアンプリコンセット、およびセルフリーDNAから第二のアンプリコンセットを生成する工程であって、当該腫瘍細胞および正常細胞は、当該癌患者の血液サンプルまたはその画分の各々から取得され、当該第一のアンプリコンセットおよび当該第二のアンプリコンセットは、癌に関連する患者特異的変異の多重化増幅反応を実施することにより取得される工程、
d)次世代シーケンスにより当該第一のアンプリコンセットと当該第二のアンプリコンセットをシーケンスする工程、
e)当該第一のアンプリコンセットの配列に基づき、一つ以上の循環細胞の起源を決定する工程であって、当該第二のアンプリコンセットの配列は参照として使用され、腫瘍が起源であると決定された循環細胞から生成された第一のアンプリコンセットからの一つ以上の患者特異的変異の検出は、癌の早期再発または転移を示唆する工程、を含む。
別の態様では、本明細書における開示は、癌患者を治療するための方法を提供し、当該方法は、
a)外科手術、第一選択化学療法、および/またはアジュバント療法で癌患者を治療する工程、
b)当該患者が外科手術、第一選択化学療法、および/またはアジュバント療法で治療された後、当該患者から一つ以上の血液サンプルを長期的に採取する工程、
c)当該癌患者から取得された当該血液サンプルから取得された、循環腫瘍細胞であると推測される一つ以上の循環細胞から単離された細胞DNAから第一のアンプリコンセット、およびセルフリーDNAから第二のアンプリコンセットを生成する工程であって、当該腫瘍細胞および正常細胞は、当該癌患者の血液サンプルまたはその画分の各々から取得され、当該第一のアンプリコンセットおよび当該第二のアンプリコンセットは、癌に関連する患者特異的変異の多重化増幅反応を実施することにより取得される工程、
d)次世代シーケンスにより当該第一のアンプリコンセットと当該第二のアンプリコンセットをシーケンスする工程、
e)当該第一のアンプリコンセットの配列に基づき、一つ以上の循環細胞の起源を決定する工程であって、当該第二のアンプリコンセットの配列は参照として使用され、腫瘍が起源であると決定された循環細胞から生成された第一のアンプリコンセットからの一つ以上の患者特異的変異の検出は、癌の早期再発または転移を示唆する工程、
f)当該患者に化合物を投与する工程であって、当該化合物は、血液サンプルから検出された当該一つ以上の患者特異的変異を有する癌の治療に有効であることが判明している工程、を含む方法。
本明細書に提供される改善方法によって、非常に少数のCTCを含有するサンプルの正確な分析と特徴解析が可能となる。本発明方法により分析されるサンプル中のCTCの数は、100細胞未満、75細胞未満、50細胞未満、25細胞未満、20細胞未満、15細胞未満、10細胞未満、5細胞未満、または一つの細胞であり得る。本明細書に提供される方法を使用することにより、一つの循環腫瘍細胞、2CTC、3CTC、4CTC、5CTC、6CTC、7CTC、8CTC、9CTC、または10CTCから正確なゲノム情報が取得され得る。
一部の実施形態では、方法は、予め決定された患者特異的変異に基づいて循環腫瘍細胞であると推測される循環細胞の固有性を決定することにより、癌患者における腫瘍の早期再発または転移をモニタリングおよび検出することを含む。一部の実施形態では、患者特異的変異は、癌に関連した一塩基バリアント(SNV)、コピー数バリアント(CNV:copy number variant)、インデル、欠失、または遺伝子融合を含む。一部の実施形態では、癌に関連する患者特異的変異が少なくとも2個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも8個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも16個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも50個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも100個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも100個~約1000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも100個~約1000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。
一つの態様では、多重化増幅が実施されて、癌に関連する患者特異的変異を包含するアンプリコンが取得される。一部の実施形態では、第一のアンプリコンセットと第二のアンプリコンセットは、50~1000個の癌関連患者特異的変異の多重化増幅反応を実施することにより取得される。
一つの態様では、癌患者における腫瘍の早期再発と転移のモニタリングおよび検出のための方法は、複数の循環細胞を個々の反応ボリュームに分けること、各反応ボリューム中の細胞DNAを単離すること、および各反応ボリュームにおいて単離された細胞DNAにサンプルバーコードを取り付けることを含む。一部の実施形態では、細胞DNAは、腫瘍細胞であると推測される一つの循環細胞から単離される。
一部の実施形態では、当該方法はさらに、一つ以上の循環細胞が一つ以上の腫瘍細胞であると決定された遺伝子型を使用して、非侵襲的な癌検査を実施することを含む。
別の例証的態様において、一つの実施形態では、移植レシピエントの血液サンプルに由来する、ドナー細胞であると推測される循環細胞を分析および特徴解析する方法であって、当該方法は、a)当該血液サンプルから取得されたドナー細胞であると推測される一つ以上の循環細胞から単離された細胞DNAの第一のアンプリコンセットと、当該血液サンプルの血漿画分から取得されたセルフリーDNAの第二のアンプリコンセットを生成する工程であって、当該第一のアンプリコンセットと第二のアンプリコンセットは、複数の一塩基多型(SNP)座位の多重化増幅反応を実施することによって取得される工程、b)当該第一のアンプリコンセットと当該第二のアンプリコンセットを、次世代シーケンスにより遺伝子型解析する工程、c)当該第一のアンプリコンセットと当該第二のアンプリコンセットの遺伝子型解析に基づき、当該一つ以上の循環細胞が、一つ以上のドナー細胞である、一つ以上のレシピエント細胞である、またはドナー細胞とレシピエント細胞の混合であると決定する工程、を含む。
図1は、循環細胞を取得および分析するための例示的な方法のワークフローを示す。
図2は、個々の循環細胞の固有性を確認するための例示的な方法のワークフローを示す。
図3は、実施例2で得られた遺伝的データのヘトレート(hetrate)プロットを示す。図3Aは、1個の胎児細胞を含有するサンプル1Fのヘトレートプロットである。図3Bは、2個の胎児細胞を含有するサンプル2Fのヘトレートプロットである。図3Cは、4個の胎児細胞を含有するサンプル4Fのヘトレートプロットである。図3Dは、10個の胎児細胞を含有するサンプル10Fのヘトレートプロットである。図3Eは、20個の胎児細胞を含有するサンプル20Fのヘトレートプロットである。
図4は、実施例3で取得された遺伝的データのヘトレートプロットを示す。図4Aは、10個の胎児細胞を含有するサンプル10Fのヘトレートプロットである。図4Bは、9個の胎児細胞と1個の母細胞を含有するサンプル9F1Mのヘトレートプロットである。図4Cは、7個の胎児細胞と3個の母細胞を含有するサンプル7F3Mのヘトレートプロットである。図4Dは、5個の胎児細胞と5個の母細胞を含有するサンプル5F5Mのヘトレートプロットである。図4Eは、3個の胎児細胞と7個の母細胞を含有するサンプル3F7Mのヘトレートプロットである。図4Fは、1個の胎児細胞と4個の母細胞を含有するサンプル1F4Mのヘトレートプロットである。図4Gは、1個の胎児細胞と9個の母細胞を含有するサンプル1F9Mのヘトレートプロットである。図4Hは、1個の胎児細胞と19個の母細胞を含有するサンプル1F19Mのヘトレートプロットである。図4Iは、10個の母細胞を含有するサンプル10Mのヘトレートプロットである。図4Jは、10%の胎児DNAと90%の母体DNAを含有するサンプル10% CF混合物のヘトレートプロットである。 同上。
図5は、実施例1によるマルチプレックスPCR増幅反応の例示的なワークフローと条件を示す。
ここに開示する実施形態は、添付の図面を参照しながらさらに説明されるものであり、同じ構造は、複数の図面にわたって同じ符合で表される。示される図面は必ずしも縮尺通りではなく、ここに開示する実施形態の原則の説明について、通常の配置をする代わりに強調して示される。
上記に特定した図は、提示するために提供されるのであって限定するためではない。
1.概要
本開示は、循環細胞の特徴解析およびゲノム解析のための方法および組成物を提供する。特に本開示は、単離された一つの循環細胞の固有性の確認方法、および一つの細胞からのゲノムデータを分析する方法を提供するものであり、それらは文献上、前例がない方法である。
一つの細胞の単離とゲノム解析は、臨床研究者や企業研究者の多くの関心を引いている。シングルセルゲノミクスは、細胞レベルでの遺伝情報を提供する。単離された一つの細胞から取得された遺伝子型解析プロファイルとゲノム情報は、臨床診断、リスク予測、薬剤開発および疾患治療において多くのアプリケーションの可能性を秘めている。しかし一つの細胞からゲノム情報を取得する方法の開発は、一つの細胞のサンプルはもちろん、少数の細胞を含むサンプルからデータを分析するという大きな試練により妨げられてきた。本明細書の開示は、一つの細胞サンプルからゲノム情報を正確に取得および分析するための生化学的方法および分析方法の両方を提供する。
特に一つの細胞からゲノム情報を正確に取得および分析する方法は、液体生検に基づく診断に大きな影響を及ぼすであろう。液体生検とは、固形ではない生物学的組織のサンプル採取を指し、最も多いのは血液であるが、唾液、尿、脳脊髄液や他の体液もある。例えば、妊娠中の母親の液体生検を使用して、胎児を起源とするセルフリーDNA(cfDNA)と胎児循環細胞の両方を含有するサンプルを取得することにより、胎児の非侵襲的な診断が可能となる。インタクトな循環胎児細胞(CFC)は、母体の血液循環に入ることができる。そのため、胎児の遺伝物質の解析を行うことによって、非侵襲的出生前遺伝子診断(NIPGDまたはNPD:Non-Invasive Prenatal Genetic Diagnosis)を提供することが可能となる。しかしCFCは、何十億もの母体血液細胞の中で、高度に希釈されてしまう。もう一つの例は癌患者の液体生検の使用であり、腫瘍自体の生検を行うことなく腫瘍を診断またはモニタリングする。癌患者の液体生検により、循環腫瘍細胞(CTC)および循環腫瘍DNA(ctDNA)が単離され、腫瘍の診断およびモニタリング、ならびに治療に対する腫瘍の応答性を検査することが可能となる。CTCは、原発病変および転移病変から癌患者の血流中に剥落するが、進行性転移疾患を有する患者であっても、患者の血液細胞の中ではCTCは相対的に稀である。したがって液体生検に基づく腫瘍の正確な診断は、少数の細胞または一つの細胞のみを含有する細胞サンプルの正確な単離と分析に依存する。さらに液体生検を使用して、移植された器官を起源とする循環細胞の単離および分析を行い、移植臓器をモニタリングしてもよい。
したがって液体生検を基にした診断の最大限の活用は、例えば循環胎児細胞(CFC)や循環腫瘍細胞(CTC)などのCRCを正確に単離および分析する診断方法の能力に依存する。例えば、CFCを使用して妊娠した母親の胎児を診断する場合、妊娠した母親の血液サンプルに由来する一つの循環細胞の分析は、単離された当該一つの循環細胞が胎児を起源とすることが確認され、有用な情報を提供することに依存する。同様に、癌患者からの一つの循環細胞の分析は、単離された当該一つの循環細胞が腫瘍を起源とすることが確認され、有用な情報を提供することに依存する。それに加えて循環希少細胞(CRC:circulating rare cell)を基にした診断は、少数の細胞のみ、または一つの細胞のみを含むサンプルを分析する能力にも依存する。
本開示は、単離された一つの循環細胞を正確に分析し、それらを定性的および定量的に特徴解析することができる方法を提供することによって、このニーズを満たすものである。本明細書の開示は、単離された一つの循環細胞サンプルを分析するためのSNPを基にした次世代シーケンス(NGS)法を提供するものであり、当該方法は、細胞のタイプを特定し、そのDNAの純度を推定し、そしてサンプルの品質を測定することができる。例えば本開示方法を使用して、胎児細胞であると推測される単離細胞が、純粋な一つの単離胎児細胞、純粋な母細胞、または胎児細胞と母細胞の混合であることを確認してもよい。別の実施形態では、本開示方法を使用して、循環腫瘍細胞であると推測される単離細胞サンプルが、単離された一つの循環腫瘍細胞であるか、または患者の血液に由来する正常細胞であるかを確認してもよい。
図1は、母体の血液サンプルから単離された循環胎児細胞の分析のための、本開示の例示的実施形態のワークフローの概要である。したがって図1に概要されるワークフローを適合させて、循環腫瘍細胞または対象から単離された任意の他の循環希少細胞の分析を実現してもよい。一つの例示的な実施形態では、図1に概要され、以下でさらに詳細に説明される本開示の方法は、
1.胎児を妊娠している母親から血液サンプルを収集する工程、
2.当該血液サンプルから血漿画分および/またはバフィーコート画分を単離する工程、
3.当該血液サンプルから胎児細胞と母細胞を単離する工程、
4.(a)当該血漿画分からセルフリーDNA(cfDNA)、および任意で、(b)当該バフィーコート画分からゲノムDNA、を抽出する工程、
5.単離された(a)胎児細胞、および(b)母細胞を溶解させる工程、
6.シーケンス用のcfDNAライブラリーを調製する工程、
7.(a)細胞溶解物に対して直接、(b)母DNAに対して、および(c)cfDNAライブラリーに対して、大規模多重化PCR(mmPCR:massively-multiplexed PCR)を実施する工程、
8.DNAバーコードを増幅されたDNAサンプルに付加し、各サンプルをラベリングする工程、
9.シーケンス用のDNAサンプルプールを調製する工程、
10.次世代シーケンス(NGS)プロトコールを介してサンプルをランする工程、
11.(a)NGSデータの前処理、および(b)NGSデータの分析、を実施する工程、ならびに
12.当該NGSデータの処理および分析の結果を解釈する工程、を含む。
上述の方法の結果によって、cfDNAおよび胎児DNA(細胞溶解物)および母体DNAとの間の一致に関する情報が提供され、細胞サンプルの純度決定が可能となり得る。本明細書の図2および実施例に示されるように、本開示方法を使用して、分析されたDNAサンプルが一つの循環細胞に由来したことが確認され得る。本明細書に提供される実施例は、図1および2に概要されるワークフローに従い、参照としてcfDNAを使用することで、当該方法が、未知のサンプルからの細胞DNAの起源、およびサンプルの組成を決定することができることを示した。例えば、妊娠中の女性の血液から単離された胎児/母細胞の場合、当該方法は、当該サンプルが純粋な胎児細胞、または純粋な母細胞であるかを決定することができる(図2および実施例)。
さらにデータからは、循環細胞中の染色体異常を明らかにすることができる。サンプルが母細胞と胎児細胞の混合であると決定された場合、胎児割合を決定することができる。別の態様では、本明細書に提供される方法を使用して、循環腫瘍細胞サンプルの純度を決定してもよく、循環腫瘍細胞のゲノム情報を分析してもよい。一部の実施形態では、本明細書に提供される方法によって、移植された器官に由来すると推測される循環細胞が、移植臓器を起源とする純粋な単離細胞であるとの決定が可能となる。
2.一つの細胞を分析してその固有性を確認する方法
本明細書の開示は、非常に少数の細胞、さらには一つの細胞のサンプルからもゲノム情報の分析が可能なデータ分析方法を提供する。特に本開示は、血液サンプルから単離された一つの循環細胞の固有性を決定し、当該一つの循環細胞のゲノム情報を分析することができる方法を提供する。例えば、以下および本明細書の実施例においてさらに説明されるように、本開示は、妊娠した母親の血液サンプルに由来する循環胎児細胞の固有性をどのように確認し、次いで当該確認された純粋な胎児細胞サンプルのゲノム情報をどのように分析するかを示している。以下の記載の方法は、参照として対応するセルフリーDNAを使用することによって、任意の細胞サンプルの固有性の確認に適合されることができる。
本明細書に例証される態様によれば、一つの実施形態において、胎児を妊娠している母親の血液サンプルからの胎児起源であると推測される循環細胞を分析および特徴解析する方法は、a)当該血液サンプルから取得された胎児起源であると推測される一つ以上の細胞株または一つ以上の循環細胞から単離された細胞DNAの第一のアンプリコン(amplicon)セットと、当該血液サンプルの血漿画分から取得されたセルフリーDNA、または子供のDNAと母親のDNAから取得されたDNA混合物の第二のアンプリコンセットを生成することであって、当該第一のアンプリコンセットと第二のアンプリコンセットは、複数の一塩基多型(SNP)座位の多重増幅反応を実施することによって取得される、生成すること、b)当該第一のアンプリコンセットと当該第二のアンプリコンセットを、次世代シーケンスにより遺伝子型解析すること、およびc)当該第一のアンプリコンセットと当該第二のアンプリコンセットの遺伝子型解析に基づき、当該一つ以上の循環細胞が、一つ以上の母細胞である、一つ以上の胎児細胞である、または母細胞と胎児細胞の混合であると決定すること、を含む。一つの実施形態において、本明細書に開示される方法は、血液サンプルのバフィーコート画分から取得された一つ以上の母細胞から単離された、または母親の細胞株から単離された母細胞DNAの第三のアンプリコンセットを生成すること、および当該第三のアンプリコンセットを次世代シーケンスにより遺伝子型解析して、母親の遺伝子型を決定すること、をさらに含む。
一つの実施形態では、当該一つ以上の循環細胞が、一つ以上の母細胞である、一つ以上の胎児細胞である、または母細胞と胎児細胞の混合であると決定することは、血漿画分から取得されたセルフリーDNA、または子供と母親のDNA混合物と、胎児起源であることが推測される循環細胞から取得された細胞DNAの間の母体一致と胎児一致を計算すること、および胎児混合割合の計算を含む。
以下の指標すべてを計算するための最初の工程は、cfDNAサンプルのアレル比(AR:allele ratio)を分析し、それらを母体遺伝子型/胎児遺伝子型=RR/RR、RR/RM、RM/*、MM/MM、またはMM/MRとして分類することである。アレル比は、以下の方法により計算される:所与のSNPに対する参照カウント数/総カウント数。一部の実施形態において、cfDNAに対する基礎的な遺伝子型決定装置(genotyper)は、ARによりSNPを分類する。この計算のアルゴリズムは、様々なアプリケーションに調整可能である。例示的であるが、非限定的な実施形態において、cfDNAに対する基礎的な遺伝子型決定装置は、以下の様式で、ARによりSNPを分類する:
Figure 2022519159000002
あるいは一部の実施形態では、cfDNAの遺伝子型は、PANORAMA(登録商標)遺伝子型決定装置を使用することによって分類され得る。
二番目の工程として、未知のサンプル中のSNPは、アレル比(AR)に基づき、ホモ接合性-R(HoR)、ホモ接合性-M(HoM)、またはヘテロ接合性(Het)に分類される。この計算のアルゴリズムは、様々なアプリケーションに調整可能である。例示的であるが、非限定的な実施形態では、未知のサンプル中のSNPは、以下の様式で、アレル比率(AR)に基づきホモ接合性-R(HoR)、ホモ接合性-M(HoM)、またはヘテロ接合性(Het)に分類される:
Figure 2022519159000003
三番目の工程として、これらSNPの遺伝子型決定/分類を使用することにより、未知のサンプルを分類するために使用され得る以下の指標が計算された:
母体一致=未知のサンプルにおいて、予測範囲内にあるアレル比(それぞれHoRおよびHoM)を有するcfDNAサンプル中のホモ接合性SNP(RR/RRまたはMM/MM)の割合。
Figure 2022519159000004
母体一致が高い場合(約85%超)、当該未知のサンプルは、cfDNAサンプルと同じ母親に由来する可能性が高い。
胎児一致=未知のサンプルにおいて、予測範囲内にあるアレル比(Het)を有するcfDNAサンプル中の胎児バンド(band)SNP(RR/RMまたはMM/MR)の割合。
Figure 2022519159000005
胎児一致が高い場合(約85%超)、当該未知のサンプルは、少なくともいくつかの胎児DNAを含む可能性が高い。
胎児混合割合=未知のサンプルにおける、胎児DNAによる寄与の推定である。これは、未知のサンプル中の胎児バンドのRR/RMおよびMM/MRの分離を1から引いたものである。サンプルが純粋な母細胞である場合、分離は1に近く、胎児混合割合は0である。サンプルが純粋な胎児細胞である場合、分離は0に近く、胎児割合は1に近い。混合は、これら二つの値の間の数値である。
Figure 2022519159000006
一つの例証的実施形態では、未知のサンプルは、計算された母体一致、胎児一致、および胎児混合割合を使用することによって、以下の表1に従って分類される。表1に示される例証的実施形態によれば、純粋な胎児サンプルは、95%を超える胎児混合割合、ならびに85%を超える胎児一致および母体一致を有すると定義される。一部の実施形態では、サンプルは、胎児混合割合が、75%、80%、85%、90%、95%、または98%を超え、母体一致および胎児一致が、75%、80%、85%、90%、または95%を超える場合に、純粋な胎児サンプルである。一つの特定の実施形態では、サンプルは、胎児混合割合が95%を超え、胎児一致が85%を超える場合に、純粋な胎児サンプルである。サンプルは、母体一致が、75%、80%、85%、90%、または95%を超え、胎児混合割合が15%、10%、5%、または2%未満である場合に、純粋な母サンプルであり得る。一つの特定の実施形態では、母体一致が85%を超え、胎児混合割合が5%未満であるとき、サンプルは純粋な母細胞である。特定の組み合わせ(例えば、100%の胎児一致と0%の胎児混合割合)は不可能であるか、または非常に可能性が低く(例えば、高い胎児一致と低い母体一致)、そのため分類表から除外されることに留意されたい。
Figure 2022519159000007
この方法は、13番染色体、18番染色体、および21番染色体に関し、Pano(登録商標)V2標的セットに対して本明細書の実施例で検証されており、任意のSNP標的セット(ただし充分なサイズとマイナーアレル頻度とする)に有用であることが予期される。例えば、SPECTRUM(登録商標)標的セットは、本開示方法に対して有用な遺伝子型決定装置であり得る。
3.循環細胞の単離
循環胎児細胞(CFC)、循環腫瘍細胞(CTC)、および移植臓器からの循環細胞は、液体生検サンプルにおいて相対的に稀である。例えば、母体血液中の胎児細胞濃度は、妊娠の段階および胎児の状態に依存するが、推定値としては、母体血液1ミリリットル当たり1~40個の胎児細胞、または100,000個の母体有核細胞当たり1個未満の胎児細胞の範囲である。現在の技術でも少量の胎児細胞を母親の血液から分離することができるが、胎児細胞を任意の量で純粋になるまで濃縮することは困難である。
循環希少細胞を濃縮するための方法が多数開発されており、それら方法は、循環腫瘍細胞に関しては周囲の正常細胞から循環腫瘍細胞を識別する特性、または循環胎児細胞に関しては母細胞から循環胎児細胞を識別する特性に基づいている。
こうした識別特性は、例えばサイズ、密度、電荷、および変形能などの物理的特性であってもよく、特殊フィルターを通した濾過、マイクロピペッティングと組み合わせた顕微鏡、マイクロ流体システム、遠心分離、電気泳動、またはフローサイトメトリーなどの方法の使用に基づいた濃縮が可能である。
あるいは識別特性は、例えば細胞表面タンパク質の発現または生存能力などの生物学的特性であってもよく、循環細胞を標識して正常細胞または母細胞から識別することが可能である。例えば抗体を使用して、周囲の細胞ではなく循環細胞によって発現される特定の細胞表面マーカーを検出してもよく、その後、当該循環細胞は、フローサイトメトリー、磁気ビーズ、抗体を結合する剤でコーティングされた固形支持体に置いて、結合抗体とともにある細胞を単離することにより単離されてもよい。例えば、循環腫瘍細胞は、上皮細胞接着分子(EpCAM)に対する抗体を使用して単離されている。Alix-Panabieres and Pantel,Clin.Chem.,59(1):110-118(2013)を参照のこと。あるいは循環細胞は、循環細胞上にはなく正常細胞上にある抗原を認識する抗体を使用して、その後、抗体標識細胞を除去することによるネガティブ選択によって濃縮されてもよい。別のネガティブ選択方法は、赤血球の選択溶解である。
4.患者集団
本明細書で使用される場合、「対象」、「患者」、または「個体」とは、任意の対象、患者、または個人を指し、当該用語は本明細書において相互交換可能に使用される。これに関して、「対象」、「患者」、および「個体」は、哺乳動物、および特にヒトを含む。「その必要のある」と併せて使用される場合、「対象」、「患者」または「個体」という用語は、特定の症状または障害を有する、またはそのリスクがある任意の対象、患者、または個体を意図する。
本開示の方法および組成物を使用して、哺乳動物を含むヒトおよび非ヒト動物、ならびに様々な症状または障害に罹患しているヒトの子供および成人を含む未成熟動物および成熟動物を含む、様々な対象を診断、モニタリングまたは治療することができる。診断または治療されるヒト対象は、胚、胎児、幼児、小児、学齢期の子供、10代、青年、成人、または高齢者の患者であり得る。
一部の実施形態では、母親の血液サンプルから取得された循環胎児細胞を単離および分析することにより診断またはモニタリングされる対象は、胎児である。一部の実施形態では、本明細書に開示される方法は、胎児の父子鑑定に使用されてもよい。一部の実施形態では、本明細書に開示される方法を使用して、妊娠した母親の胎児中の対象となる染色体または染色体セグメントにおけるコピー数変動を決定してもよい。一部の実施形態では、本明細書に開示される方法を使用して、第13染色体、第18染色体、第21染色体、性染色体、および/またはそれら染色体セグメントのコピー数変動を決定してもよい。一部の実施形態では、本明細書に開示される方法を使用して、胎児の染色体における微小欠失を検出してもよい。一部の実施形態では、胎児で検出される微小欠失は、ディジョージ症候群に関連する22q11.2欠失、プラダーウィリ症候群に関連する微小欠失、アンジェルマン症候群に関連する微小欠失、1p36欠失、および猫鳴き症候群に関連する微小欠失である。一部の実施形態では、本明細書に開示される方法を使用して、妊娠した母親の胎児における一塩基変動(single nucleotide variation)を検出してもよい。
一部の実施形態では、本明細書に開示される方法を使用して、癌患者を診断またはモニタリングしてもよい。一部の実施形態では、本明細書に開示される方法を使用して、患者の血液サンプルから循環腫瘍細胞を単離および検出することにより、腫瘍組織におけるコピー数変動を検出してもよい。一部の実施形態では、本明細書の方法を使用して、癌患者中の癌に関連する患者特異的変異を一つ以上検出してもよい。一部の実施形態では、本明細書の方法を使用して、癌患者の腫瘍中の癌に関連する患者特異的変異を少なくとも2個検出してもよい。一部の実施形態では、本明細書の方法を使用して、癌患者の腫瘍の早期再発または転移に関連する変異を検出してもよい。一部の実施形態では、本明細書に開示される方法を使用して、治療に対する癌患者の反応をモニタリングしてもよい。
一部の実施形態では、本明細書に開示される方法を使用して、移植臓器を起源とする循環細胞の単離および分析を行うことにより、移植臓器のレシピエントをモニタリングしてもよい。一部の実施形態では、本明細書に開示される方法を使用して、移植臓器のレシピエントにおける移植片宿主病を診断してもよい。一部の実施形態では、本明細書に開示される方法を使用して、免疫抑制治療に対する臓器移植患者の反応をモニタリングしてもよい。
5.遺伝子型データの取得
5.1 遺伝子データのソース
任意の関連する個体遺伝子データは、以下から取得できる:個体のバルク二倍体組織、個体由来の一つ以上の二倍体細胞、個体由来の一つ以上の一倍体細胞、標的個体由来の一つ以上の割球、個体に存在する細胞外遺伝物質、母親の血液または癌患者の血液中に存在する個体由来の細胞外遺伝物質、母親の血液に存在する個体由来の細胞、関連個体の配偶子から生成された一つ以上の胚、当該胚から採取された一つ以上の割球、関連個体に存在する細胞外遺伝物質、関連個体を起源とすることが判明している遺伝物質、およびそれらの組み合わせ。例示的な実施形態では、本明細書に提供される方法を使用して、例えば胎児細胞または腫瘍細胞などの標的細胞からの標的サンプルのゲノムを起源とする遊離DNAが分析される。一つの実施形態では、本明細書に開示される方法は、血液サンプルから、胎児起源であると推測される循環細胞、セルフリーDNAを含む血漿画分、および母細胞を含むバフィーコート画分を取得することをさらに含む。一つの実施形態では、本明細書に開示される方法は、腫瘍細胞であると推測される循環細胞、セルフリーDNAを含む血漿画分、および正常細胞を含むバフィーコート画分を血液サンプルから取得することをさらに含む。
本明細書で使用される場合、「セルフリーDNA」という用語は、細胞を溶解する工程を必要とせずに分析に利用可能なDNAを指す。セルフリーDNAは、血液または他の体液中に見出され得る。セルフリーDNAは、様々な組織から取得されてもよい。そうした組織は、例えば血液、リンパ、腹水、脳脊髄液などの液状形態の組織であってもよい。セルフリーDNAは、様々な細胞源由来であってもよい。一部の例では、セルフリーDNAは、胎児細胞から誘導されたDNAから構成される。セルフリーDNAは、標的細胞および非標的細胞から誘導されたDNAの混合物であってもよい。胎児の異数性に関するDNAの分析の場合、一部の実施形態では、セルフリーDNAは、妊娠女性の血液から取得されてもよく、この場合においてセルフリーDNAは、母親由来のセルフリーDNAと胎児由来のセルフリーDNAの混合物を含む。他の実施形態では、セルフリーDNAは、癌性腫瘍細胞から誘導されてもよい。セルフリーDNAは、腫瘍細胞から誘導されたセルフリーDNAと、身体の別の箇所の腫瘍ではない細胞から誘導されたセルフリーDNAの混合物を含んでもよい。
或る説明的な実施形態においては、本発明の方法で解析されるサンプルは、血液サンプル又はそのフラクションである。或る実施形態においては、本明細書で提供する方法は、DNA断片の、特に血液循環腫瘍DNA(ctDNA)中で発見した腫瘍のDNA断片の増幅に特に適している。こうした断片は、典型的には、長さを約160ヌクレオチドとする。
例えばcfNAである無細胞核酸(cfNA)は、アポトーシス、壊死、自家融解及びネクロプトーシス等である種々の細胞死の形態を介して循環系に放出され得るということがこの技術分野で知られている。cfDNAは断片化され、断片のサイズ分布は150~350bpから、10000bp超まで変化する(Kalnina et al.World J Gastroenterol.2015 Nov 7;21(41):11636-11653を参照のこと)。例えば、肝細胞癌(HCC)患者の血漿DNA断片のサイズ分布は、カウント数(count frequency)のピークが約166bpである長さ100~220bpの範囲に及ぶものであって、また長さ150~180bpの断片において腫瘍DNA濃度が最も高かった(Jiang et al.Proc Natl Acad Sci USA 112:E1317-E1325を参照)。
説明的な実施形態においては、血液循環腫瘍DNA(ctDNA)は、細胞片及び血小板を遠心分離で除去後、EDTA-2Naチューブを用いて血液から単離した。血漿サンプルは、例えばQIAamp DNAミニキット(キアゲン社(Qiagen)、独国ヒルデン)を用いてDNAを抽出するまで、-80℃で保存することが可能である(例えばHamakawa et al.,Br J Cancer.2015;112:352-356)。Hamakavaらは、全サンプルのうち抽出したセルフリーDNAの濃度の中央値が血漿1ml当たり43.1ng(9.5~1338ng/mlの範囲に及ぶ)であり、変異断片は0.001~77.8%の範囲に及び、中央値は0.90%であると報告した。
例えばDNA配列データなどの遺伝データは、一つ以上の標的細胞から誘導されたDNAと、一つ以上の非標的細胞から誘導されたDNAを含むDNAの混合物から取得することができる。標的細胞および非標的細胞は、他の基準に基づき、ゲノムレベルで互いに異なっている。「誘導された」という用語は、細胞が、DNAの最終的な源であることを示すために使用される。したがって、例えば、妊娠女性の母体血液から得られたセルフリーDNAは、胎児の胎盤由来の細胞から誘導されており、これらは典型的には胎児自身および母親の細胞と遺伝的に同一である。当該方法は、患者の組み合わせを採用する。
5.2 増幅(例えばPCR)反応混合物:
一部の実施形態では、遺伝子型データの取得は、シーケンス(例えば、ショットガンシーケンス、単一分子シーケンス、または他の次世代シーケンス技術など)、多型座位を検出するためのSNPアレイ、またはマルチプレックスPCRを含む。一部の実施形態において、遺伝子型解析は、例えば少なくとも100、200、500、750、1,000、2,000、5,000、7,500、10,000、20,000、25,000、30,000、40,000、50,000、75,000、または100,000個の異なる多型座位といった多型座位を検出するSNPアレイの使用を伴う。一部の実施形態では、遺伝子型解析は、マルチプレックスPCRの使用を伴う。一部の実施形態では、当該方法は、少なくとも100、200、500、750、1,000、2,000、5,000、7,500、10,000、13,000、15,000、20,000、25,000、30,000、40,000、50,000、75,000、または100,000個の異なる多形座位(例えば、SNP)に同時にハイブリダイズするプライマーのライブラリーと、画分中のサンプルを接触させて、反応混合物を生成すること、当該反応混合物をプライマー伸長反応条件下に置いて増幅産物を生成させ、ハイスループットシーケンサーで測定して、シーケンスデータを生成することを伴う。一部の実施形態では、RNA(例えば、mRNA)がシーケンスされる。mRNAはエクソンのみを含んでいるため、mRNAをシーケンスすることで、例えば数メガベースなどゲノム中の長距離にわたり多型座位(例えばSNPなど)についてアレルを決定することができる。
一つの実施形態では、多重化標的PCRは、溶解細胞サンプルに直接実施される。一部の実施形態では、細胞は、プロテアーゼK消化により溶解される。一部の実施形態では、細胞は、塩化カリウム(KCl)、塩化マグネシウム(MgCl)、およびトリス-塩酸塩を含む生理食塩水中でのプロテアーゼK消化によって溶解される。一部の実施形態では、PCR増幅用の細胞を調製するために、細胞は、塩化カリウム(KCl)、塩化マグネシウム(MgCl)、およびトリス-塩酸塩を含まない生理食塩水中でのプロテアーゼK消化によって溶解される。さらなる詳細については、実施例の項を参照のこと。
一部の実施形態では、サンプルバーコードは、アンプリコンの生成工程の間にDNAに付加される。
或る実施形態においては、本発明の方法は、増幅反応混合物を形成することを含む。この反応混合物は典型的に、ポリメラーゼと、ヌクレオチド三リン酸塩と、サンプルから生成した核酸ライブラリーからの核酸断片と、一連の標的特異的な順方向アウタープライマーと、単鎖(first strand)逆方向アウターユニバーサルプライマーとを組み合わせることによって形成する。他の説明的な実施形態では、反応混合物は、標的特異的な順方向アウタープライマーの代わりである標的特異的な順方向インナープライマーと、核酸ライブラリーからの核酸断片の代わりである、アウタープライマーを用いた第一のPCR反応からのアンプリコンとを含む。本明細書で提供するこの反応混合物は、説明的な実施形態においては、この発明の独立した態様でそれぞれが形成される。説明的な実施形態においては、この反応混合物はPCR反応混合物である。PCR反応混合物は典型的に、マグネシウムを含む。
一部の実施形態においては、この反応混合物は、エチレンジアミン四酢酸(EDTA)、マグネシウム、塩化テトラメチルアンモニウム(TMAC)又はそれらの組み合わせを含む。一部の実施形態においては、TMACの濃度を、20から70mMの間(両端の値を含める)とする。いずれの特定の理論と結びつける意図はないが、TMACが、DNAに結合し、二本鎖を安定させ、プライマー特異性を増加させ及び/又は様々なプライマーの融点を均一化させるということがわかっている。一部の実施形態においては、TMACが、様々な標的に対する増幅産物の量の均一性を増加させる。一部の実施形態においては、マグネシウム(塩化マグネシウムからのマグネシウム等)の濃度を1から8mMの間とする。
大量の標的のマルチプレックスPCR用の大量のプライマーが、多量のマグネシウムをキレート化し得る(プライマー中の2つのリン酸塩が1つのマグネシウムをキレート化する)。例えば、プライマーからのリン酸塩濃度が約9mMであるように十分なプライマーを用いると、該プライマーは、有効なマグネシウム濃度を約4.5mMだけ減少させ得る。一部の実施形態においては、高濃度のマグネシウムが、非標的遺伝子座の増幅等であるPCRエラーを引き起こすことがあるため、ポリメラーゼに対する補助因子として利用可能なマグネシウムの量を減少させるためにEDTAを用いる。一部の実施形態においては、EDTAの濃度が、利用可能なマグネシウムの量を1から5mMの間(例えば3から5mMの間)まで減少させる。
一部の実施形態においては、pHが7.5から8.5の間とし、例えば7.5から8、8から8.3、又は8.3から8.5の間(両端の値を含める)等である。一部の実施形態においては、Trisバッファーを、例えば10から100mMの間の濃度で、例えば10から25mM、25から50mM、50から75mM又は25から75mMの間(両端の値を含める)等の濃度で用いる。一部の実施形態においては、これら濃度のTrisバッファーはいずれも、7.5から8.5の間のpHで用いる。一部の実施形態においては、KCl及び(NH4)2SO4の組み合わせを用いるものであり、例えば50から150mMの間のKCl及び10から90mMの間の(NH4)2SO4等(両端の値を含める)である。一部の実施形態においては、KClの濃度は、0から30mMの間、50から100mMの間又は100から150mMの間(両端の値を含める)である。一部の実施形態においては、(NH4)2SO4の濃度は、10から50mM、50から90mM、10から20mM、20から40mM、40から60mM、又は60から80mMの(NH4)2SO4の間(両端の値を含める)である。一部の実施形態においては、アンモニウム[NH4+]の濃度は、0から160mMの間であり、例えば0から50、50から100、又は100から160mMの間等(両端の値を含める)である。一部の実施形態においては、カリウムとアンモニウムとの濃度の合計([K+]+[NH4+])は、0から160mMの間であり、例えば0から25、25から50の間、50から150、50から75、75から100、100から125、又は125から160mMの間等(両端の値を含める)である。[K+]+[NH4+]が120mMである例示的なバッファーは、KClが20mM及び(NH4)2SO4が50mMである。一部の実施形態においては、該バッファーは、pHが7.2から8のTrisバッファーを25から75mM、KClを0から50mM、硫酸アンモニウムを10から80mM及びマグネシウムを3から6mMを含む(両端の値を含める)。一部の実施形態においては、該バッファーは、pHが7から8.5のTrisバッファーを25から75mM、MgCl2を3から6mM、KClを10から50mM及び(NH4)2SO4を20から80mMを含む(両端の値を含める)。一部の実施形態においては、100から200Units/mLのポリメラーゼを用いる。一部の実施形態においては、pH8.1の最終体積20μl中、100mMのKCl、50mMの(NH4)2SO4、3mMのMgCl2、ライブラリー中の各プライマー7.5nM、50mMのTMAC、および7μlのDNA鋳型が使用される。
一部の実施形態においては、ポリエチレングリコール(PEG、例えばPEG8,000)又はグリセロール等のクラウディング試薬(crowding agent)を用いる。一部の実施形態においては、PEG(例えばPEG8,000)の量は、0.1から20%であり、0.5から15%、1から10%、2から8%又は4から8%の間(両端の値を含める)等である。一部の実施形態においては、グリセロールの量は、0.1から20%の間であり、0.5から15%、1から10%、2から8%又は4から8%の間(両端の値を含める)等である。一部の実施形態においては、クラウディング試薬により、用いられるポリメラーゼ濃度の低濃度化及び/又はアニーリング時間の短縮化が可能となる。一部の実施形態においては、クラウディング試薬が、DORの均一性を改善し及び/又は脱落(未検出のアレル)を低減する。一部の実施形態では、プルーフリーディング活性をもつポリメラーゼ、プルーフリーディング活性のない(又はごくわずかな)ポリメラーゼ、又は、プルーフリーディング活性をもつポリメラーゼとプルーフリーディング活性のない(又はごくわずかな)ポリメラーゼとの混合物を用いる。一部の実施形態においては、ホットスタート(hot start)ポリメラーゼ、非ホットスタート(non-hot start)ポリメラーゼ、又は、ホットスタートポリメラーゼと非ホットスタートポリメラーゼとの混合物を用いる。一部の実施形態においては、HotStarTaq DNAポリメラーゼを用いる(例えば、キアゲン社のカタログNo.203203を参照)。一部の実施形態においては、AmpliTaq Gold(登録商標)DNAポリメラーゼを用いる。一部の実施形態においては、PrimeSTAR GXL DNAポリメラーゼであって、反応混合物中に過剰なテンプレートが存在する場合に、及び、長い産物を増幅する場合に有効なPCR増幅を提供するハイフィデリティポリメラーゼを用いる(カリフォルニア州マウンテンビュー、タカラクロンテック社(Takara Clontech))。一部の実施形態においては、KAPA Taq DNAポリメラーゼ又はKAPA Taq HotStart DNAポリメラーゼを用いて、これらはシングルサブユニットの、野生型TaqDNAポリメラーゼである好熱性バクテリア、サーマス・アクアチクス(Thermus aquaticus)に基づく。KAPA Taq及びKAPA Taq HotStart DNAポリメラーゼは、5’-3’ポリメラーゼと5’-3’エキソヌクレアーゼ活性とを有するが、3’から5’へのエキソヌクレアーゼ(プルーフリーディング)活性は有さない(例えば、KAPA BIOSYSTEMS社カタログNo.BK1000を参照)。一部の実施形態においては、PfuDNAポリメラーゼを用いるものであり、それは超好熱性古細菌パイロコッカス・フリオサス(Pyrococcus furiosus)からの高度に熱安定なDNAポリメラーゼである。酵素が、5’→3’の向きで、二重鎖DNAにヌクレオチドのテンプレート依存性重合を触媒する。Pfu DNAポリメラーゼもまた、ポリメラーゼに対してヌクレオチド取り込みエラーを修正可能にさせる3’→5’のエキソヌクレアーゼ(プルーフリーディング)活性を示す。当該ポリメラーゼは、5’→3’のエキソヌクレアーゼ活性を有さない(例えば、サーモサイエンティフィック社(Thermo Scientific)カタログNo.EP0501を参照)。一部の実施形態においては、Klentaq1を用いるものであり、それはTaq DNAポリメラーゼのクレノウ断片(Klenow-fragment)アナログであるであり、エキソヌクレアーゼ又はエンドヌクレアーゼ活性を有さない(例えば、ミズーリ州セントルイス、DNA POLYMERASE TECHNOLOGY社カタログNo.100を参照)。一部の実施形態においては、ポリメラーゼは、PHUSION DNAポリメラーゼであり、例えばPHUSIONハイフィデリティ(High-Fidelity)DNAポリメラーゼ(M0530S、ニュー・イングランド・バイオラボ社(New England BioLabs,Inc.))又はPHUSIONホットスタートフレックス(Hot Start Flex)DNAポリメラーゼ(M0535S、ニュー・イングランド・バイオラボ社)等である。一部の実施形態においては、ポリメラーゼは、Q5(登録商標)DNAポリメラーゼ、例えば、Q5(登録商標)High-Fidelity DNA ポリメラーゼ(M0491S、New England BioLabs,Inc.)またはQ5(登録商標)Hot Start High-Fidelity DNAポリメラーゼ(M0493S、New England BioLabs,Inc.)である。一部の実施形態においては、ポリメラーゼは、T4 DNAポリメラーゼ(M0203S、ニュー・イングランド・バイオラボ社)である。
一部の実施形態においては、5から600Units/mL(反応ボリューム1mL当たりのユニット数)の間のポリメラーゼであり、5から100、100から200、200から300、300から400、400から500又は500から600Units/mLの間(両端の値を含める)等であるポリメラーゼを用いる。
5.3 PCR法
一部の実施形態においては、ホットスタートPCRを用いて、PCRサーモサイクルを行う前に重合を軽減又は防止する。例示的なホットスタートPCR法は、反応混合物が高温に達するまで、最初のDNAポリメラーゼを抑制すること、又は、反応成分の反応を物理的に分離することを含む。一部の実施形態においては、マグネシウムの緩やかな放出を利用する。DNAポリメラーゼは、活性のためにマグネシウムイオンを要するため、マグネシウム は、化学物質と結合させておくことで反応から化学的に分離し、高温でのみ溶液中に放出させる。一部の実施形態においては、抑制剤の非共有結合性の結合を利用する。この方法においては、ペプチド、抗体又はアプタマーが、低温で酵素に非共有結合的に結合し、その活性を抑制する。上昇した温度でのインキュベーション後、抑制剤が放出されて、反応が開始する。一部の実施形態においては、低温ではほとんど活性をもたない改変DNAポリメラーゼ等の、低温感受性のTaqポリメラーゼを利用する。一部の実施形態においては、化学的な改変を利用する。この方法においては、DNAポリメラーゼの活性部位内のアミノ酸の側鎖に、ある分子が共有結合している。この分子は、上昇した温度で反応混合物をインキュベーションすることによって、酵素から放出される。分子が放出されると、酵素が活性化する。
一部の実施形態においては、テンプレートの核酸(RNA又はDNAのサンプル等)に対する量は、20から5,000ngの間であり、20から200、200から400、400から600、600から1,000、1,000から1,500又は2,000から3,000ngの間等(両端の値を含める)である。
一部の実施形態においては、キアゲン社のマルチプレックスPCRキットを利用する(キアゲン社カタログNo.206143)。100×50μLのマルチプレックスPCR反応に関しては、キットには、2×QIAGEN Multiplex PCR Master Mix(最終濃度が3mMのMgCl2を与える、3×0.85ml)、5×Q-Solution(1×2.0ml)及びRNaseフリー水(2×1.7ml)が含まれる。QIAGEN Multiplex PCR Master Mix(MM)は、KCl及び(NH4)2SO4の組み合わせのみならず、PCR添加剤、テンプレートにおけるプライマーの局所濃度を増加させるFactor MPを含有する。Factor MPは、特に結合したプライマー同士を安定化させ、HotStarTaq DNAポリメラーゼによって有効なプライマー伸長が可能になる。HotStarTaq DNAポリメラーゼは、TaqDNAポリメラーゼの改変型であり、室温ではポリメラーゼ活性を有さない。一部の実施形態においては、HotStarTaq DNAポリメラーゼは、任意の既存のサーモサイクルプログラムに組み込むことが可能な95℃での15分間のインキュベーションにより活性化される。
一部の実施形態においては、1×QIAGEN MM最終濃度(推奨濃度)、ライブラリー中の各プライマーを7.5nM、TMACを50mM、および20μl最終体積中でDNA鋳型7μlが使用される。一部の実施形態においては、PCRサーモサイクル条件は、95℃で10分(ホットスタート)、96℃で30分間を20サイクル、65℃で15分間及び72℃で30秒間、次いで72℃で2分間(最終伸長)、その後4℃での保持を含む。
一部の実施形態においては、総体積20μl中、2×QIAGEN MM最終濃度(推奨濃度の2倍)、ライブラリー中の各プライマーを2nM、TMACを70mM、およびDNA鋳型7μlが使用される。一部の実施形態においては、4mMまでのEDTAも含む。一部の実施形態においては、PCRサーモサイクル条件は、95℃で10分間(ホットスタート)、96℃で30秒間を25サイクル、65℃で20、25、30、45、60、120又は180分間及び任意に72℃で30秒間、次いで72℃で2分間(最終伸長)、その後4℃での保持を含む。
他の例示的な条件のセットは、セミネスト(semi-nested)PCRのアプローチを含む。第一のPCR反応では、2×QIAGEN MM最終濃度、ライブラリー中の各プライマーを1.875nM(順方向及び逆方向のアウタープライマー)、及び、DNAテンプレートを含む、20μlの反応ボリュームを用いる。
サーモサイクル用パラメータには、95℃で10分間と、96℃で30秒間、65℃で1分間、58℃で6分間、60℃で8分間、65℃で4分間及び72℃で30秒間を25サイクルと、その後72℃で2分間とを含み、その後4℃で保持する。次に、1:200で希釈された、得られた産物2μlを、第二のPCR反応の入力として用いる。この反応では、1×QIAGEN MM最終濃度、順方向インナープライマーをそれぞれ20nM、および1μMの逆方向プライマータグを含む、10μlの反応ボリュームを用いる。サーモサイクル用パラメータは、95℃で10分間と、95℃で30秒間、65℃で1分間、60℃で5分間、65℃で5分間及び72℃で30秒間を15サイクルと、その後72℃で2分間とを含み、その後4℃で保持する。アニーリング温度は、本明細書で述べているように、任意に、プライマーの一部又はプライマーの全ての融点より高くすることが可能である(その全体を参照することによって本明細書に組み入れるものとする2015年10月20日出願の米国特許出願第14/918,544号を参照)。
融点(Tm)は、オリゴヌクレオチド(例えば、プライマー)のDNA二本鎖の半分(50%)と、その完全な相補鎖が解離して、一本鎖DNAになる温度である。アニーリング温度(TA)は、PCRプロトコールが実行される温度である。従来の方法では、用いるプライマーの最低Tmよりも通常5℃低いものであり、これにより可能性のある全ての二重鎖がほとんど形成される(本質的に全てのプライマー分子がテンプレート核酸と結合するように)。これは高効率であるが、低温では、より非特異的な反応となることが必至である。TAが低過ぎることによるひとつの結果として、内部での一塩基の不一致又は部分的なアニーリングが許容されることがあるため、プライマーが、真の標的以外の配列に対してアニールされ得ることがある。本発明の一部の実施形態においては、TAはTmよりも高く、ある瞬間で標的のごく一部のみが、プライマーをアニーリングする(例えば、約1~5%のみ)。これらが伸長すれば、それらがプライマー及び標的のアニーリング及び解離の平衡状態から脱し(伸長でTmが直ぐに70℃を超えるまでに上昇するため)、標的のうち新たな約1~5%がプライマーを有する。これにより、反応を長時間のアニーリングとすることにより、1サイクル当たり約100%のコピーされた標的を得ることが可能である。
種々の実施形態においては、アニーリング温度は、1、2、3、4、5、6、7、8、9、10、11、12、13℃から、範囲の上限で2、3、4、5、6、7、8、9、10、11、12、13又は15℃の間であり、少なくとも25、50、60、70、75、80、90、95又は100%の不一致のプライマーの融点(経験的に測定又は計算したTm等)よりも高いものである。様々な実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての融点(例えば、実験により測定された、または計算されたTm)よりも1~15℃(例えば、1℃以上~10℃以下、1℃以上~5℃以下、1℃以上~3℃以下、3℃以上~5℃以下、5℃以上~10℃以下、5℃以上~8℃以下、8℃以上~10℃以下、10℃以上~12℃以下、または12℃以上~15℃以下)高い。種々の実施形態においては、アニーリング温度は、1から15℃の間(1から10、1から5、1から3、3から5、3から8、5から10、5から8、8から10、10から12又は12から15℃の間等(両端の値を含める))であり、不一致のプライマーのうち少なくとも25%、50%、60%、70%、75%、80%、90%、95%の融点(経験的に測定又は計算したTm等)か又は不一致のプライマーの全ての融点(経験的に測定又は計算したTm等)よりも高いものであり、アニーリングステップの長さ(1PCRサイクル当たり)は、5から180分の間であり、15から120分、15から60分、15から45分又は20から60分の間等(両端の値を含める)である。
例示的なマルチプレックスPCR法
種々の実施形態においては、長いアニーリング時間(本明細書で述べるとおりであり実施例12に例示する)及び/又は低プライマー濃度を用いる。実際には、或る実施形態においては、制限したプライマーの濃度及び/又は条件を用いる。種々の実施形態においては、アニーリングステップの長さは、範囲の下限で15、20、25、30、35、40、45又は60分から、範囲の上限で20、25、30、35、40、45、60、120又は180分の間である。種々の実施形態においては、アニーリングステップの長さ(1PCRサイクル当たり)は30から180分の間である。例えば、アニーリングステップを30から60分の間とすることが可能であり、各プライマーの濃度を20、15、10又は5nM未満とすることが可能である。他の実施形態においては、プライマー濃度は、範囲の下限で1、2、3、4、5、6、7、8、9、10、15、20又は25nMから、範囲の上限で2、3、4、5、6、7、8、9、10、15、20、25及び50である。
高濃度の多重化においては、溶液中の大量のプライマーが原因で、溶液が粘稠となり得る。溶液が粘稠過ぎる場合は、プライマーがテンプレートDNAに結合するのにそれでも十分な量までプライマー濃度を減少させることが可能である。種々の実施形態においては、1,000から100,000の様々なプライマーを用いて、各プライマーの濃度を20nM未満とし、例えば10nM未満、又は1から10nMの間(両端の値を含める)等とする。
5.4 例示的なマルチプレックスPCR法
一つの態様では、本発明は、(i)核酸サンプルを、少なくとも1,000;2,000;5,000;7,500;10,000;15,000;19,000;20,000;25,000;27,000;28,000;30,000;40,000;50,000;75,000;または100,000個の様々な標的座位に同時にハイブリダイズするプライマーライブラリーと接触させ、反応混合物を生成すること、および(ii)当該反応混合物をプライマー伸長反応条件(例えばPCR条件など)におき、標的アンプリコンを含む増幅産物を生成すること、を含む、核酸サンプル中の標的座位を増幅させ宇方法を特徴とする。一部の実施形態において、本方法はまた、少なくとも一つの標的アンプリコン(例えば、標的アンプリコンの少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%)の有無を決定することを含む。一部の実施形態において、本方法はまた、少なくとも一つの標的アンプリコン(例えば、標的アンプリコンの少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%)の配列を決定することを含む。一部の実施形態では、標的座位の少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%が増幅される。一部の実施形態では、少なくとも25;50;75;100;300;500;750;1,000;2,000;5,000;7,500;10,000;15,000;19,000;20,000;25,000;27,000;28,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的座位が、少なくとも5、10、20、40、50、60、80、100、120、150、200、300、または400倍に増幅される。一部の実施形態では、標的座位の少なくとも50、60、70、80、90、95、96、97、98、99、99.5、または100%が、少なくとも5、10、20、40、50、60、80、100、120、150、200、300、または400倍に増幅される。様々な実施形態において、増幅産物の60、50、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満が、プライマー二量体である。一部の実施形態では、方法は、マルチプレックスPCRとシーケンス(例えば、ハイスループットシーケンス)を伴う。
種々の実施形態では、長時間のアニーリングおよび/または低濃度のプライマーが使用される。様々な実施形態では、アニーリング工程の長さは、3分、5分、8分、10分、15分、20分、30分、45分、60分、75分、90分、120分、150分、または180分よりも長い。種々の実施形態では、(1PCRサイクル当たりの)アニーリング工程の長さは、例えば、5分以上~60分以下、10分以上~60分以下、5分以上~30分以下、または10分以上~30分以下など、5分以上~180分以下である。様々な実施形態では、アニーリング工程の長さは、5分より長く(例えば、10分または15分より長い)、各プライマーの濃度は、20nM未満である。様々な実施形態では、アニーリング工程の長さは、5分より長く(例えば、10分または15分より長い)、各プライマーの濃度は、1nM以上~20nM以下、または1nM以上~10nM以下である。様々な実施形態では、アニーリング工程の長さは、20分より長く(例えば、30分、45分、60分または90分より長い)、各プライマーの濃度は、1nM未満である。
高濃度の多重化においては、溶液中の大量のプライマーが原因で、溶液が粘稠となり得る。溶液が粘稠過ぎる場合は、プライマーがテンプレートDNAに結合するのにそれでも十分な量までプライマー濃度を減少させることが可能である。様々な実施形態では、60,000個未満の様々なプライマーが使用され、各プライマーの濃度は、例えば10nM未満、または1nM以上~10nM以下など、20nM未満である。様々な実施形態では、60,000個超の様々なプライマー(例えば、60,000~120,000個の様々なプライマー)が使用され、各プライマーの濃度は、例えば5nM未満、または1nM以上~10nM以下など、10nM未満である。
アニーリング温度は、任意でプライマーの一部または全ての融点よりも高くなり得ることが見出された(対照的に、他の方法はプライマーの融点よりも低いアニーリング温度を使用する)。融点(T)は、オリゴヌクレオチド(例えば、プライマー)のDNA二本鎖の半分(50%)と、その完全な相補鎖が解離して、一本鎖DNAになる温度である。アニーリング温度(T)は、PCRプロトコールが実行される温度である。従来の方法では使用されるプライマーの最も低いTよりも通常、5℃低い温度であり、そのため可能性のあるほぼ全ての二本鎖が形成されていた(本質的に全てのプライマー分子が鋳型核酸に結合するため)。これは高効率であるが、低温では、より非特異的な反応となることが必至である。Tが低過ぎることによるひとつの結果として、内部での一塩基の不一致又は部分的なアニーリングが許容されることがあるため、プライマーが、真の標的以外の配列に対してアニールされ得ることがある。本発明の一部の実施形態では、Tは(T)よりも 高く、ある瞬間で標的のごく一部のみがプライマーをアニーリングする(例えば、約1~5%のみ)。これらが伸長すれば、それらがプライマーと標的のアニーリングおよび解離の平衡状態から脱し(伸長でTが直ぐに70℃を超えるまでに上昇するため)、標的のうち新たな約1~5%がプライマーを有する。これにより、反応を長時間のアニーリングとすることにより、1サイクル当たり約100%のコピーされた標的を得ることが可能である。したがって最も安定した分子対(プライマーと鋳型DNAの完全なDNA対を伴う分子対)が優先的に伸長され、正しい標的アンプリコンが生成される。例えば、63℃未満の融点を有するプライマーを用いて、アニーリング温度として57℃、およびアニーリング温度として63℃で同じ実験が行われた。アニーリング温度が57℃であったとき、増幅されたPCR産物のマッピングされたリードの割合は50%と低かった(増幅された産物の約50%がプライマー二量体であった)。アニーリング温度が63℃であったとき、増幅産物のプライマー二量体の割合は約2%に低下した。
様々な実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての融点(例えば、実験により測定された、または計算されたT)よりも少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13または15℃高い。一部の実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての融点(例えば、実験により測定された、または計算されたT)よりも少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13または15℃高く、そして(PCRサイクル1回あたりの)アニーリング工程の長さは、1、3、5、8、10、15、20、30、45、60、75、90、120、150、または180分よりも長い。
様々な実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての融点(例えば、実験により測定された、または計算されたT)よりも1~15℃(例えば、1℃以上~10℃以下、1℃以上~5℃以下、1℃以上~3℃以下、3℃以上~5℃以下、5℃以上~10℃以下、5℃以上~8℃以下、8℃以上~10℃以下、10℃以上~12℃以下、または12℃以上~15℃以下)高い。様々な実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての融点(例えば、実験的に測定された、または計算されたT)よりも1~15℃(例えば、1℃以上~10℃以下、1℃以上~5℃以下、1℃以上~3℃以下、3℃以上~5℃以下、5℃以上~10℃以下、5℃以上~8℃以下、8℃以上~10℃以下、10℃以上~12℃以下、または12℃以上~15℃以下)高く、(PCR1サイクル当たりの)アニーリング工程の長さは、例えば、5分以上~60分以内、10分以上~60分以内、5分以上~30分以内、または10分以上~30分以内など、5分以上~180分以内である。
一部の実施形態では、アニーリング温度は、プライマーの最も高い融点(例えば、実験的に測定または計算されたT)よりも少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、または15℃高い。一部の実施形態において、アニーリング温度は、プライマーの最も高い融点(例えば、実験的に測定された、または計算されたT)よりも少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13または15℃高く、そして(PCRサイクル1回あたりの)アニーリング工程の長さは、1、3、5、8、10、15、20、30、45、60、75、90、120、150、または180分よりも長い。
一部の実施形態では、アニーリング温度は、プライマーの最も高い融点(例えば、実験的に測定または計算されたT)よりも1~15℃(例えば、1℃以上~10℃以内、1℃以上~5℃以内、1℃以上~3℃以内、3℃以上~5℃以内、5℃以上~10℃以内、5℃以上~8℃以内、8℃以上~10℃以内、10℃以上~12℃以内または12℃以上~15℃以内)高い。一部の実施形態では、アニーリング温度は、プライマーの最も高い融点(例えば、実験的に測定または計算されたT)よりも1~15℃(例えば、1℃以上~10℃以内、1℃以上~5℃以内、1℃以上~3℃以内、3℃以上~5℃以内、5℃以上~10℃以内、5℃以上~8℃以内、8℃以上~10℃以内、10℃以上~12℃以内または12℃以上~15℃以内)高く、(PCR1サイクル当たりの)アニーリング工程の長さは、例えば、5分以上~60分以内、10分以上~60分以内、5分以上~30分以内、または10分以上~30分以内など、5分以上~180分以内である。
一部の実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての平均融点(例えば、実験により測定された、または計算されたT)よりも少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13または15℃高い。一部の実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての平均融点(例えば、実験により測定された、または計算されたT)よりも少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13または15℃高く、そして(PCRサイクル1回あたりの)アニーリング工程の長さは、1、3、5、8、10、15、20、30、45、60、75、90、120、150、または180分よりも長い。
一部の実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての平均融点(例えば、実験により測定された、または計算されたT)よりも1~15℃(例えば、1℃以上~10℃以下、1℃以上~5℃以下、1℃以上~3℃以下、3℃以上~5℃以下、5℃以上~10℃以下、5℃以上~8℃以下、8℃以上~10℃以下、10℃以上~12℃以下、または12℃以上~15℃以下)高い。一部の実施形態において、アニーリング温度は、同一ではないプライマーのうちの少なくとも25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000個、またはすべての平均融点(例えば、実験的に測定された、または計算されたT)よりも1~15℃(例えば、1℃以上~10℃以下、1℃以上~5℃以下、1℃以上~3℃以下、3℃以上~5℃以下、5℃以上~10℃以下、5℃以上~8℃以下、8℃以上~10℃以下、10℃以上~12℃以下、または12℃以上~15℃以下)高く、(PCR1サイクル当たりの)アニーリング工程の長さは、例えば、5分以上~60分以内、10分以上~60分以内、5分以上~30分以内、または10分以上~30分以内など、5分以上~180分以内である。
一部の実施形態において、アニーリング温度は、50℃以上~70℃以内、例えば55℃以上~60℃以内、60℃以上~65℃以内、または65℃以上~70℃以内である。一部の実施形態では、アニーリング温度は、50℃以上~70℃以内、例えば55℃以上~60℃以内、60℃以上~65℃以内、または65℃以上~70℃以内であり、そして(i)(PCR1サイクル当たりの)アニーリング工程の長さは、3、5、8、10、15、20、30、45、60、75、90、120、150または180分よりも長いか、または(ii)(PCR1サイクル当たりの)アニーリング工程の長さは、例えば、5分以上~60分以内、10分以上~60分以内、5分以上~30分以内、または10分以上~30分以内など、5分以上~180分以内であるかのいずれかである。
一部の実施形態では、以下の条件のうちの一つ以上が、Tの実験的測定に使用されるか、または仮定されてTが計算される:温度は60.0℃、プライマー濃度は100nM、および/または塩濃度は100mM。一部の実施形態では、ライブラリーを用いたマルチプレックスPCRに使用される条件など、他の条件が使用される。一部の実施形態では、100mM KCl、50mM(NHSO、3mM MgCl、格プライマーが7.5nM、および50mM TMAC、pH8.1が使用される。一部の実施形態では、Tは、内臓SantaLuciaパラメータ(primer3.sourceforge.netのワールドワイドウェブ、参照によりその全体が本明細書に組み込まれる)を使用して、Primer3プログラム(libprimer3、リリース2.2.3)を使用して計算される。一部の実施形態では、計算されたプライマー融点は、プライマー分子の半分がアニーリングされると予想される温度である。上述のように、計算された融点よりも高い温度であっても、一定の割合のプライマーがアニーリングされ、それに従いPCR伸長も可能となる。一部の実施形態では、実験的に測定されたTm(実際のTm)は、UV分光光度計においてサーモスタット制御されたセルを使用することにより決定される。一部の実施形態では、温度を吸光度に対してプロットすることにより、2つのプラトーを伴うS字型曲線が生成される。プラトー間の中間の吸光度の値が、Tmに相当する。
一部の実施形態では、ultrospec 2100 pr UV/可視光分光光度計(Amersham Biosciences社)での260nmでの吸光度が、温度の関数として測定される(例えば、Takiya et al.,“An empirical approach for thermal stability(Tm)prediction of PNA/DNA duplexes,”Nucleic Acids Symp Ser(Oxf);(48):131-2,2004を参照のこと。当該文献は、参照によりその全体で本明細書に援用される)。一部の実施形態では、260nmでの吸光度は、毎分2℃のペースで95℃から20℃まで温度を低下させることにより測定される。一部の実施形態では、プライマーおよびその完全な相補鎖(例えば、2μMの各ペアのオリゴマー)が混合され、次いで30分の間にサンプルを95℃に加熱して5分間その温度を維持し、その後室温まで冷却して、95℃で少なくとも60分間サンプルを維持することによりアニーリングが行われる。一部の実施形態では、融点は、SWIFT Tmソフトウェアを使用してデータを分析することによって決定される。本発明方法のいずれかの一部の実施形態では、当該方法は、プライマーが標的座位のPCR増幅に使用される前または後のいずれかに、ライブラリー中のプライマーの少なくとも50、80、90、92、94、96、98、99、または100%の融点を実験的に測定または計算(コンピューターで計算)することを含む。
一部の実施形態では、ライブラリーは、マイクロアレイを含む。一部の実施形態では、ライブラリーは、マイクロアレイを含まない。
一部の実施形態では、プライマーの大部分または全てが伸長されて、増幅産物を形成する。PCR反応において全てのプライマーが消費された場合、同数またはほぼ同数のプライマー分子が各標的座位の標的アンプリコンへと転換されるため、様々な標的座位の増幅の均一性が増加する。一部の実施形態では、プライマー分子の少なくとも80、90、92、94、96、98、99、または100%が伸長されて、増幅産物を形成する。一部の実施形態では、標的座位の少なくとも80、90、92、94、96、98、99、または100%に関し、その標的座位に対するプライマー分子の少なくとも80、90、92、94、96、98、99、または100%が伸長されて、増幅産物を形成する。一部の実施形態では、当該割合のプライマーが消費されるまで、複数のサイクルが実施される。一部の実施形態では、全て、または実質的に全てのプライマーが消費されるまで、複数のサイクルが実施される。所望の場合、初期プライマー濃度を低下させる、および/または実施されるPCRサイクル数を増加させることにより、高割合のプライマーが消費され得る。
一部の実施形態では、PCR法は、マイクロリットル単位の反応ボリュームで実施されてもよいが、マイクロ流体アプリケーションで使用されるナノリットル単位またはピコリットル単位の反応ボリュームと比較して、(鋳型核酸の局所濃度が低いため)特異的なPCR増幅の実施が困難となる可能性がある。一部の実施形態では、反応ボリュームは、1L以上~60L以下、例えば、5L以上~50L以下、10L以上~50L以下、10L以上~20L以下、20L以上~30L以下、30L以上~40L以下、または40L以上~50L以下である。
一つの実施形態では、本明細書に開示される方法は、高効率の高度に多重化された標的化PCRを使用してDNAを増幅し、続いてハイスループットシーケンスを行って各標的座位におけるアレル頻度が決定される。得られたシーケンスリードの大部分が標的座位にマッピングされるように、一つの反応ボリュームにおいて約50または100個を超えるPCRプライマーを多重化する能力は新規であり、自明ではない。高度に多重化された標的PCRを非常に効率的な様式で実施することが可能な技術の一つは、互いにハイブリダイズする可能性が低いプライマーを設計することである。典型的にはプライマーと呼称されるPCRプローブは、少なくとも300個;少なくとも500個;少なくとも750個;少なくとも1,000個;少なくとも2,000個;少なくとも5,000個;少なくとも7,500個;少なくとも10,000個;少なくとも20,000個;少なくとも25,000個;少なくとも30,000個;少なくとも40,000個;少なくとも50,000個;少なくとも75,000;または少なくとも100,000個の可能性のあるプライマー対の間の有害な可能性のある相互作用、またはプライマーとサンプルDNAの間の意図されない相互作用に関する熱力学的モデルを生成し、次いで当該モデルを使用して、プール中の他の設計との適合性がない設計を除外することにより選択される。高度に多重化された標的化PCRを非常に効率的な様式で実施することが可能な別の方法は、標的化PCRに対する部分的または完全な入れ子型法を使用することである。これら方法のうちの一つまたは組み合わせを使用することで、一つのプール中の少なくとも300個、少なくとも800、少なくとも1,200、少なくとも4,000、または少なくとも10,000個のプライマーの多重化が可能となり、得られる増幅DNAは、シーケンスされたときに標的座位にマッピングされるDNA分子が大部分である。これら方法のうちの一つまたは組み合わせを使用することで、一つのプール中の大多数のプライマーの多重化が可能となり、得られる増幅DNAは、標的座位にマッピングされるDNA分子が、50%超、60%超、67%超、80%超、90%超、95%超、96%超、97%超、98%超、99%超、または99.5%超である。
一部の実施形態では、標的遺伝物質の検出は、多重化された様式で行われてもよい。並行して行われ得る標的遺伝子配列の数は、1~10個、10~100個、100~1000個、1000~1万個、1万~10万個、10万~100万個、または100万~1000万個の範囲であり得る。1プール当たり100個を超えるプライマーを多重化しようする試みた結果、例えばプライマー二量体が形成されるなどの望ましくない副反応といった重大な問題が生じた。
5.5 標的化PCR
一部の実施形態では、PCRを使用して、ゲノムの特定の位置を標的とすることができる。血漿サンプルでは、オリジナルのDNAは高度に断片化されている(典型的には500bp未満、平均の長さは200bp未満)。PCRでは、フォワードプライマーとリバースプライマーの両方が同じ断片にアニーリングして増幅することが可能である。したがって断片が短い場合、PCRアッセイは比較的短い領域でも増幅するはずである。MIPSのように、多型の位置がポリメラーゼ結合部位に近すぎる場合、様々なアレルからの増幅においてバイアスが生じる可能性がある。現在、例えばSNPを含有するなどの多型領域を標的とするPCRプライマーは、典型的にはプライマーの3’末端が多型塩基に直接隣接する塩基にハイブリダイズするように設計される。本開示の実施形態では、フォワードPCRプライマーとリバースPCRプライマーの両方の3’末端が、標的アレルのバリアント位置(多型部位)から一つまたはいくつか離れた位置の塩基にハイブリダイズするように設計される。多型部位(SNPまたは別の多型)とプライマーの3’末端がハイブリダイズするように設計される塩基の間の塩基数は、1塩基であってもよく、2塩基であってもよく、3塩基であってもよく、4塩基であってもよく、5塩基であってもよく、6塩基であってもよく、7~10塩基であってもよく、11~15塩基であってもよく、または16~20塩基であってもよい。フォワードプライマーおよびリバースプライマーは、多型部位から様々な塩基数で離れてハイブリダイズするよう設計されてもよい。
PCRアッセイは多数行うことができるが、異なるPCRアッセイの間の相互作用により、アッセイは約100個を超えて多重化することは困難である。様々な複雑な分子的アプローチを使用して、多重化のレベルを増加させることができるが、それでも1反応当たり100個、おそらくは200個、または場合により500個未満のアッセイ数に限定されている。大量のDNAを含むサンプルは、複数のサブ反応に分割され、次いでシーケンス前に再度混合される。サンプル全体またはDNA分子の一部の亜集団のいずれかが限定されているサンプルについては、サンプルを分割することで統計的なノイズを生じさせることになる。一つの実施形態では、少数または限定された量のDNAとは、10pg未満、10~100pg、100pg~1ng、1~10ng、または10~100ngの量を指す場合がある。他の方法が複数プールへの分割を含み、それにより生じた確率的ノイズに関連して重大な問題が生じる可能性がある少量のDNAの場合には当該方法は特に有用であり、さらに当該方法は任意のDNA量のサンプルに対して実行された場合にバイアスを最小化するという利点も提供することに留意されたい。これらの状況下では、全般的な前増幅工程を使用して、全体的なサンプル量を増加させてもよい。理想的には、この前増幅工程は、アレル分布を大きく変化させるべきではない。
一つの実施形態では、本開示方法は、多数の標的座位、具体的には1,000~5,000個の座位、5,000~10,000個の座位、または10,000個を超える座位に特異的なPCR産物を生成させ、例えば一つの細胞または体液由来DNAなどの限定的なサンプルからシーケンス法または何らかの他の遺伝子型解析法により遺伝子型解析を行うことができる。現在、5~10個を超える標的のマルチプレックスPCR反応の実施は大きな挑戦であり、例えばプライマー二量体や他のアーチファクトといったプライマーの副産物により妨げられることが多い。ハイブリダイゼーションプローブを用いたマイクロアレイを使用して標的配列を検出する場合、プライマー二量体や他のアーチファクトは検出されないため、無視してもよい。しかし検出方法としてシーケンスを使用する場合、シーケンスリードの大部分はサンプル中の所望の標的配列ではなく、そうしたアーチファクトをシーケンスしてしまう。一つの反応ボリュームにおいて、50または100を超える反応を多重化し、その後にシーケンスを行うために使用される先行技術の方法は多くの場合、20%超、さらには50%超、多くの場合には80%超、および場合によっては90%超のオフターゲットのシーケンスリードが生じる。
概してサンプルの複数(n個)の標的(50個超、100個超、500個超、または1,000個超)の標的化シーケンスを実施するためには、サンプルを多数の並行反応へと分割し、個々の一つの標的を増幅してもよい。この方法はPCRマルチウェルプレートで実施されており、または例えばFLUIDIGM ACCESS ARRAY(マイクロ流体チップ中、1サンプル当たり48反応)またはRAIN DANCE TECHNOLOGY社によるDROPLET PCR(数百~数千個の標的)などの市販プラットフォームで行うことができる。残念なことに、これらの分割およびプール法は、DNAの量が限定的なサンプルでは問題があり、各ウェルに1コピーの各ゲノム領域が確実に存在するようにするには、ゲノムコピー数が充分ではないことが多い。分割とプール化によって生じる確率的ノイズにより、元のDNAサンプル中に存在したアレル割合に関して非常に不正確な測定結果が生じてしまうため、多型座位が標的とされる場合、および多型座位でのアレルの相対的割合が必要とされる場合には特に重大な問題である。本明細書において、限定的な量のDNAのみが利用可能である場合に適用可能な、多数のPCR反応を効果的および効率的に増幅する方法が記載される。一つの実施形態では、方法は、一つの細胞、体液、例えば血漿、生検、環境および/または法医学サンプルに存在する遊離した浮遊DNAなどDNA混合物の分析に適用されてもよい。
一つの実施形態では、標的化シーケンスは、以下の工程のうちの一つ、複数、またはすべてを伴い得る:a)DNA断片の両端にアダプター配列を有するライブラリーを生成および増幅する工程。b)ライブラリー増幅後に複数の反応に分割する工程。c)DNA断片の両端にアダプター配列を有するライブラリーを生成し、任意で増幅する工程。d)1標的当たり、一つの標的特異的な「フォワード」プライマーと、一つのタグ特異的プライマーを使用して、選択標的の1000~10,000-多重化増幅回行う工程。e)「リバース」の標的特異的プライマーと、第一ラウンドで標的特異的フォワードプライマーの一部として導入されたユニバーサルタグに特異的な一つ(または一つ以上)のプライマーを使用して、当該産物の2回目の増幅を行う工程。f)選択標的の1000-多重化前増幅を、限定された回数のサイクルで行う工程。g)産物を複数のアリコートに分け、個々の反応(例えば、50~500-多重化であるが、一重化でも使用することができる)において標的のサブプールを増幅する工程。h)並行サブプール反応の産物をプールする工程。i)これら増幅の間、プライマーはシーケンス適合タグ(部分的または全長)を担持し、それにより産物がシーケンスされ得る工程。
5.6 高度多重化PCR
本明細書において、例えば血漿から得られたゲノムDNAなどの核酸サンプルから数百~数万の標的配列(例えば、SNP座位)の標的化増幅を可能とする方法が開示される。増幅されたサンプルは、プライマー二量体産物を比較的含み得ず、標的座位でのアレルバイアスが低い。増幅中または増幅後に産物にシーケンス適合アダプターが付加される場合、これらの産物の分析はシーケンスにより実施されることができる。
当分野で公知の方法を使用して高度に多重化されたPCR増幅を行っても、望みの増幅産物を上回る、シーケンスに適さないプライマー二量体産物が生成される。当該産物は、当該産物を形成するプライマーを除去することによって、またはプライマーのインシリコ選択を実施することによって、実験的に減少させることができる。しかしアッセイ数が多いほど、この問題はより困難になる。
一つの解決策は、5000-多重化反応を、例えば、100個の50-多重化反応または50個の100-多重化反応といった、いくつかの低多重化増幅へと分けることであり、またはサンプルを個々のPCR反応に分けてしまうことである。しかし例えば妊娠血漿からの非侵襲的な出生前診断など、サンプルDNAが限定的である場合には、複数反応にサンプルを分割することはボトルネックを生じさせ、避けるべきである。
本明細書において、最初にサンプルの血漿DNAを広範に増幅させ、その後、サンプルを、1反応あたりより中程度の数の標的配列を有する複数の多重化標的濃縮反応に分割する方法を記載する。一つの実施形態では、本開示方法は、複数の座位でDNA混合物を優先的に濃縮するために使用することができる。当該方法は、以下の工程のうちの一つ以上を含む:DNA混合物からライブラリーを生成および増幅させる工程であって、ライブラリー中の分子はDNA断片の両末端にライゲートされたアダプター配列を有する工程、当該増幅されたライブラリーを複数の反応に分割する工程、一つの標的当たり一つ以上の標的特異的「フォワード」プライマーと、一つ以上のアダプター特異的ユニバーサル「リバース」プライマーを使用して、選択標的の多重化増幅の第一ラウンドを実施する工程。一つの実施形態では、本開示の方法は、「リバース」の標的特異的プライマーと、当該第一ラウンドにおける標的特異的フォワードプライマーの一部として導入されたユニバーサルタグに特異的な一つ以上のプライマーを使用して、第二の増幅を実施することをさらに含む。一つの実施形態では、当該方法は、完全入れ子型、ヘミ入れ子型、セミ入れ子型、片側完全入れ子型、片側ヘミ入れ子型、または片側セミ入れ子型のPCR法を伴ってもよい。一つの実施形態では、本開示の方法は、複数の座位でDNA混合物を優先的に濃縮するために使用され、当該方法は、選択された標的の多重化前増幅を限定された回数のサイクルで増幅すること、産物を複数のアリコートに分割すること、および個々の反応中の標的のサブプールを増幅すること、および並行サブプール反応の産物をプールすることを含む。この方法を使用して、50~500座位、500~5,000座位、5,000~50,000座位、またはさらには50,000~500,000座位に対して、低レベルのアレルバイアスとなるよう標的化増幅が実施され得ることに留意されたい。一つの実施形態では、プライマーは、部分的または全長のシーケンス適合タグを担持する。
ワークフローは、(1)例えば、血漿DNAなどのDNAを抽出すること、(2)断片の両末端にユニバーサルアダプターを有する断片ライブラリーを調製すること、(3)当該アダプターに特異的なユニバーサルプライマーを使用してライブラリーを増幅させること、(4)増幅されたサンプル「ライブラリー」と複数のアリコートに分割すること、(5)アリコートに対して、多重化(例えば、標的一つ当たり一つの標的特異的プライマー、およびタグ特異的プライマーで、約100-多重化、1,000または10,000-多重化)を実施すること、(6)1サンプルのアリコートをプールすること、(7)サンプルをバーコード化すること、(8)サンプルを混合し、濃度を調整すること、(9)サンプルをシーケンスすること、を伴ってもよい。ワークフローは、複数のサブ工程を含んでもよく、サブ工程は、列記される工程のうちの一つを含む(例えば、ライブラリー調製の工程(2)は、三つの酵素工程(平滑末端、dAテーリング、およびアダプターライゲーション)と三つの精製工程を伴い得る)。ワークフローの工程はまとめられてもよく、分割されてもよく、または異なる順序で実施されてもよい(例えば、サンプルのバーコード化およびプール化)。
ライブラリー増幅は、短い断片がより効率的に増幅されるよう、偏りが生じるような方法で実施され得ることに留意されたい。このようにして、例えば妊娠女性の循環中に存在するセルフリー胎児DNA(胎盤起源)のようなモノヌクレオソームDNA断片などの短い配列を優先的に増幅させることが可能となる。PCRアッセイは、例えばシーケンスタグ(通常、15~25塩基の短縮型)などのタグを有し得ることに留意されたい。多重化を行った後、サンプルのPCR多重化物をプールし、次いでタグ化は、タグ特異的PCR(ライゲーションによって行うこともできる)によって完了する(バーコード化を含む)。さらに全長シーケンスタグを、多重化と同じ反応で加えることもできる。最初のサイクルで標的特異的プライマーを用いて標的を増幅してもよく、次いでタグ特異的プライマーに継続してSQアダプターシーケンスが完了する。PCRプライマーはタグを担持しなくてもよい。シーケンスタグは、ライゲーションによって増幅産物に付加されてもよい。
一つの実施形態では、高度なマルチプレックスPCRに続いてクローナルシーケンスを行って増幅産物を評価することにより、例えば胎児異数性の検出などの様々なアプリケーションが行われてもよい。従来的なマルチプレックスPCRは同時に最大で50個の座位を評価する。一方で本明細書に記載される方法を使用することで、同時に50個を超える座位、同時に100個を超える座位、同時に500個を超える座位、同時に1,000個を超える座位、同時に5,000個を超える座位、同時に10,000個を超える座位、同時に50,000個を超える座位、同時に100,000個を超える座位の同時評価が可能となり得る。実験により最大で10,000個、および10,000個以上の別個の座位を一つの反応で同時に評価し得ること、高い正確性で非侵襲的な出生前異数性診断および/またはコピー数判定を行うために充分に良好な効率および特異性であり得ることが示されている。アッセイは、例えば血漿から単離されたcfDNAサンプルなどのサンプル全体、その画分、またはさらに処理されたcfDNAの派生物を用いて一つの反応で組み合わされてもよい。サンプル(例えば、cfDNAまたは派生物)は、複数の並行多重化反応に分割されてもよい。最適なサンプル分割および多重化は、様々な性能仕様をトレードオフすることにより決定される。物質の量が限られているため、サンプルを複数の画分に分割すると、サンプリングノイズが生じ、処理のための時間が必要となり、誤差の可能性が増大する可能性がある。反対に高度な多重化であるほど、偽増幅の量が多くなり、増幅の不均衡も大きくなる。それら両方ともが検査性能を低下させる可能性がある。
本明細書に記載される方法のアプリケーションにおいて、元のサンプル(例えば血漿)の量が限定的であること、およびアレル頻度または他の測定項目を取得する物質中の元の分子数が限定的であること、の二つの重要な関連懸念事項がある。元の分子の数が特定のレベルを下回ると、ランダムサンプリングノイズが顕著となり、試験の精度に影響を与える可能性がある。典型的には、標的座位一つ当たり500-1000個に相当する元の分子を含むサンプルに対して測定が行われる場合には、非侵襲的な出生前異数性診断を行うために充分な品質のデータを取得することができる。例えば、サンプル量を増加させるなど、別個の測定回数を増加させる方法も多く存在する。サンプルに行われる各操作も、物質の喪失をもたらす可能性がある。様々な操作によって生じた喪失を特徴解析して回避するか、または必要に応じて特定の操作の収率を改善して、検査性能を低下させる可能性のある喪失を回避することが不可欠である。
一つの実施形態では、元のサンプル(例えば、cfDNAサンプル)のすべて、または画分を増幅させることにより、その後の工程における喪失の可能性を軽減させることが可能である。サンプル中の遺伝物質の全てを増幅させ、下流の手順で利用可能な量を増加させるための様々な方法が利用可能である。一つの実施形態では、ライゲーション介在性PCR(LM-PCR:ligation mediated PCR)のDNA断片は、一つの別個のアダプター、二つの別個のアダプター、または多くの別個のアダプターのいずれかのライゲーションを行った後にPCRによって増幅される。一つの実施形態では、多重置換増幅(MDA:multiple displacement amplification)のphi-29ポリメラーゼを使用して、全てのDNAが等温で増幅される。DOP-PCRおよびその変形版では、ランダムプライミングを使用して、元の材料DNAを増幅する。各方法は、例えば、ゲノムのすべての表出領域にわたる増幅の均一性、元のDNAの捕捉と増幅の効率、および断片長の関数としての増幅性能などの特徴を有する。
一つの実施形態では、LM-PCRは、3-プライムチロシンを有する一つのヘテロ二本鎖アダプターと共に使用されてもよい。ヘテロ二本鎖アダプターは、一つのアダプター分子の使用を可能とし、当該分子は、PCRの第一ラウンド中に元のDNA断片の5プライム末端と3プライム末端上の二つの異なる配列へと変換され得る。一つの実施形態では、増幅されたライブラリーを、サイズ分離、またはAMPURE、TASSなどの産物により、または他の類似の方法によって分割することが可能である。ライゲーションの前に、サンプルDNAは平滑末端化されてもよく、次いで一つのアデノシン塩基が3-プライム末端に付加される。ライゲーションの前に、制限酵素または何らかの他の切断方法を使用してDNAが切断されてもよい。ライゲーションの間に、サンプル断片の3-プライムアデノシンと、アダプターの相補的3-プライムチロシンオーバーハングによって、ライゲーション効率が高められる。PCR増幅の伸長工程は、時間的見地から、約200bp、約300bp、約400bp、約500bp、または約1,000bpより長い断片からの増幅を減少させるよう、制限されてもよい。市販のキットによって指定される条件を使用して多数の反応を実行した。その結果、サンプルDNA分子の10%未満が、ライゲーションに成功した。これに対する反応条件の一連の最適化によって、ライゲーションはおよそ70%まで改善された。
一つの実施形態では、本明細書に記載される方法は、少なくとも1000個の標的座位の高効率で高度に多重化された標的化PCRを行い、次いで次世代シーケンスを行って遺伝子型データを取得する。一部の実施形態では、多重化された標的化PCRは、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、25000、30000、35000、40000、45000、または50000個の標的座位に実施される。一つの実施形態では、多重化された標的化PCRは、13000個の標的座位に実施される。一部の実施形態では、標的座位は、一塩基多型(SNP)である。
5.7 ミニPCR
以下のミニPCR法は、例えばcfDNAなど、短い核酸、消化核酸、または断片化核酸を含有するサンプルに望ましい。従来のPCRアッセイの設計は、明確な胎児分子の著しい喪失を生じさせるが、ミニPCRアッセイと呼ばれる非常に短いPCRアッセイを設計することにより喪失を大幅に低下させることができる。母体血清中の胎児cfDNAは高度に断片化され、断片サイズは、平均160bp、標準偏差15bp、最小サイズは約100bp、および最大サイズは約220bpで、およそガウス型で分布する。標的とされる多型に関し、断片の開始位置および終了位置の分布は必ずしもランダムではないが、個々の標的の間で、およびすべての標的の間で集合的に大きく異なっており、一つの特定の標的座位の多型部位は、その座位に由来する様々な断片の間で、開始位置から終了位置までの任意の位置を占め得る。ミニPCRという用語は、追加の制限または限定なく、通常のPCRを等しく指す場合もあることに留意されたい。
PCRを行う間、増幅は、フォワードプライマー部位とリバースプライマー部位の両方を含む鋳型DNA断片からのみ発生する。胎児cfDNA断片は短いため、両方のプライマー部位が存在する尤度は、フォワードプライマー部位とリバースプライマー部位の両方を含む長さLの胎児断片の尤度であり、アンプリコンの長さと断片の長さの比である。理想的な条件下では、アンプリコンが、45、50、55、60、65、または70bpであるアッセイは、利用可能な鋳型断片分子のそれぞれ72%、69%、66%、63%、59%、または56%からの増幅に成功する。アンプリコンの長さは、フォワードのプライミング部位とリバースのプライミング部位の5-プライム末端の間の距離である。当業者により典型的に使用されるよりも短いアンプリコン長は、短いシーケンスリードのみを必要とすることによって、より効率的な所望の多型座位の測定をもたらし得る。一つの実施形態では、アンプリコンのかなりの割合が、100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満、または45bp未満であるものとする。
先行技術の方法において、例えば本明細書に記載のものなどの短いアッセイは通常回避される。その理由は、必要ではないこと、ならびにプライマーの長さ、アニーリング特性、およびフォワードプライマーとリバースプライマーの間の距離が限定されることにより、プライマー設計にかなりの制約が課されるためである。
また、いずれかのプライマーの3-プライム末端が多型部位のおよそ1~6塩基内にある場合、偏って増幅される可能性があることにも留意されたい。初期ポリメラーゼ結合部位におけるこの一塩基の差は、一つのアレルの優先的な増幅を生じさせる可能性があり、そのためアレル頻度の実測値が変化し、性能が低下される可能性がある。これらの制約の全てが、特定の座位の増幅に成功するプライマーの特定を非常に困難にし、さらには同じ多重化反応での適合性を有する巨大プライマーセットの設計も困難にする。一つの実施形態では、内側フォワードプライマーおよびリバースプライマーの3’末端は、多型部位から上流のDNA領域にハイブリダイズするように設計され、少数の塩基によって多型部位から分離される。理想的には、塩基の数は、6~10塩基であってもよいが、4~15塩基、3~20塩基、2~30塩基、または1~60塩基であってもよく、実質的に同じ結果を達成し得る。
マルチプレックスPCRは、すべての標的が増幅される一ラウンドのPCRを伴う場合もあれば、一ラウンドのPCRを行い、続いて一ラウンド以上の入れ子型PCRまたは何らかの変形版の入れ子型PCRが伴う場合もある。入れ子型PCRは、前のラウンドで使用されたプライマーに対して少なくとも1塩基対、内側に結合する一つ以上の新たなプライマーを使用した後続ラウンドのPCR増幅からなる。入れ子型PCRは、後続反応において正しい内部配列を有する従前の増幅からの増幅産物のみを増幅することによって、偽増幅標的の数を減少させる。偽増幅標的の減少は、特にシーケンスにおいて、取得可能な有用測定数を改善する。入れ子型PCRは典型的には、前のプライマー結合部位に対して完全に内部でプライマーを設計することを伴い、増幅に必要な最小DNAセグメントサイズを必然的に増加させる。DNAが高度に断片化されている例えば血漿cfDNAなどのサンプルについては、アッセイサイズが大きくなるにつれ、測定値を取得することができる個別のcfDNA分子の数が減少する。一つの実施形態では、この効果を相殺するために、第二ラウンドのプライマーの一方または両方が第一の結合部位と重複して数塩基、内側に伸長され、さらに特異的となる一方で、アッセイの合計サイズは最小限に増加する部分的入れ子型法を使用してもよい。
一つの実施形態では、PCRアッセイの多重化プールは、一つ以上の染色体の潜在的なヘテロ接合性のSNPまたは他の多型座位もしくは非多型座位を増幅するように設計され、これらアッセイは一つの反応で使用されて、DNAを増幅する。PCRアッセイの数は、50~200PCRアッセイ、200~1,000PCRアッセイ、1,000~5,000PCRアッセイ、または5,000~20,000PCRアッセイ(それぞれ50~200-多重化、200~1,000-多重化、1,000~5,000-多重化、5,000~20,000-多重化、20,000超-多重化)であってもよい。一つの実施形態では、約10,000PCRアッセイ(10,000-多重化)の多重化プールは、X染色体、Y染色体、第13染色体、第18染色体、および第21染色体、および第1または第2染色体の潜在的なヘテロ接合性SNP座位を増幅するように設計され、これらのアッセイは一つの反応で使用され、母体血漿、絨毛膜の絨毛サンプル、羊水穿刺サンプル、一つもしくは少数の細胞、他の体液もしくは組織、癌、または他の遺伝物質から取得されたcfDNAを増幅する。各座位のSNP頻度は、クローナル法またはアンプリコンのシーケンスの何らかの他の方法により決定されてもよい。アレル頻度分布の統計解析、またはすべてのアッセイの比率を使用して、サンプルが、検査に含まれる染色体の一つ以上のトリソミーを含有するかが決定されてもよい。別の実施形態では、元のcfDNAサンプルは二つのサンプルに分割され、並行的な5,000-多重化アッセイが実施される。別の実施形態では、元のcfDNAサンプルは、n個のサンプルに分割され、並行的(約10,000/n)多重化アッセイが実施される。この場合においてnは、2~12、または12~24、または24~48、または48~96である。データは、既に説明されている方法と似た方法で収集および分析される。この方法は、転座、欠失、重複、および他の染色体異常の検出にも同様に良好に適用可能であることに留意されたい。
一つの実施形態では、標的ゲノムに対する相同性のないテールが、プライマーのいずれかの3-プライム末端または5-プライム末端に添加されてもよい。これらのテールは、その後の操作、手順、または測定を容易にする。一つの実施形態では、テール配列は、フォワードまたはリバースの標的特異的プライマーと同じであってもよい。一つの実施形態では、異なるテール配列が、フォワードまたはリバースの標的特異的プライマーに使用されてもよい。一つの実施形態では、複数の異なるテールが、異なる座位、または座位セットに使用されてもよい。特定のテールは、すべての座位で共通してもよく、または座位のサブセットに共通してもよい。例えば、現行の任意のシーケンスプラットフォームにより必要とされるフォワードプライマーおよびリバースプライマーに対応するフォワードテールおよびリバーステールを使用することによって、増幅後の直接的なシーケンスが可能となる。一つの実施形態では、テールは、すべての増幅された標的に共通のプライミング部位として使用することができ、他の有用な配列を加えるために使用され得る。一部の実施形態では、内側のプライマーは、標的座位(例えば、多型座位)の上流または下流のいずれかにハイブリダイズするよう設計された領域を含有してもよい。一部の実施形態では、プライマーは、分子バーコードを含有してもよい。一部の実施形態では、プライマーは、PCR増幅が可能となるよう設計されたユニバーサルプライミング配列を含有してもよい。
一つの実施形態では、フォワードプライマーおよびリバースプライマーが、例えばILLUMINAから入手可能なHISEQ、GAIIX、またはMYSEQなどのハイスループットシーケンス装置(しばしば大規模並行的シーケンス装置とも呼称される)に必要とされる必須のフォワード配列およびリバース配列に対応するテールを有するように、10,000-多重化PCRアッセイプールが作製される。さらに、シーケンステールに対して含有される5-プライムは、アンプリコンにヌクレオチドバーコード配列を加えるための後続のPCRにおいてプライミング部位として使用され得る追加配列であり、ハイスループットシーケンス装置の一つのレーンで複数のサンプルの多重化シーケンスが可能となる。
一つの実施形態では、10,000-多重化PCRアッセイプールは、リバースプライマーが、ハイスループットシーケンス装置に必要とされる必須のリバース配列に対応するテールを有するように作製される。第一の10,000-多重化アッセイで増幅した後、後続のPCR増幅は、すべての標的に対して部分的に入れ子型となったフォワードプライマー(例えば、6塩基の入れ子)、および最初のラウンドに含まれたリバースシーケンステールに対応するリバースプライマーを有する別の10,000-多重化プールを使用して実施されてもよい。ただ一つの標的特異的プライマーとユニバーサルプライマーを用いた部分的入れ子型増幅の後続ラウンドを行うことで、必要とされるアッセイサイズが限定され、サンプルノイズが減少するが、偽アンプリコンの数も大幅に減少する。シーケンスタグは、添付されたライゲーションアダプターに付加されてもよく、および/またはPCRプローブの一部として付加されてもよく、その結果として当該タグは最終的なアンプリコンの一部となる。
腫瘍の割合は、検査性能に影響を及ぼす。患者血漿中に存在するDNAの腫瘍割合を高めるための方法は多数存在する。腫瘍割合は、すでに検討されている前述のLM-PCR方法によって、ならびに長い断片の標的化除去によって増加させることができる。一つの実施形態では、標的座位のマルチプレックスPCR増幅を行う前に、追加のマルチプレックスPCR反応を実施して、後続のマルチプレックスPCRで標的とされる座位に対応する長大な母体断片を選択的に除去してもよい。追加のプライマーは、セルフリー胎児DNA断片中に存在すると予想される多型からの距離よりも長い距離の部位でアニーリングするように設計される。これらのプライマーは、1サイクルのマルチプレックスPCR反応において使用され、その後、標的多型座位のマルチプレックスPCRが実施されてもよい。これらの遠位プライマーは、DNAのタグ付けされた断片の選択的な認識が可能となる分子または部分にタグ付けされる。一つの実施形態では、これらのDNA分子は、1サイクルのPCRの後に、ビオチン分子で共有結合的に修飾されてもよく、それによりこれらのプライマーを含む新たに形成された二本鎖DNAの除去が可能となる。第一ラウンド中に形成された二本鎖DNAは、母親が起源である可能性が高い。ハイブリッドな物質の除去は、磁気ストレプトアビジンビーズを使用することによって達成されてもよい。同様に機能する他のタグ化方法も存在する。一つの実施形態では、サイズ選択方法を使用して、より短いDNA鎖、例えば、約800bp未満、約500bp未満、または約300bp未満の鎖のサンプルを濃縮してもよい。その後、短い断片の増幅を通常通り進行させることができる。
本開示に記載されるミニPCR法は、一つのサンプルから、一つの反応において、数百~数千、さらには数百万の座位について、高度に多重化された増幅と分析を可能にする。それと同時に、増幅されたDNAの検出を多重化することができる。数十~数百個のサンプルを、バーコード化PCRを使用して一つのシーケンスレーンで多重化することができる。この多重化検出は、最大で49-多重化まで試験に成功しており、それより多い多重化も可能である。事実上、これにより、1回のシーケンス実行において、数千個のSNPで、数百個のサンプルが遺伝子型解析されることが可能となる。これらのサンプルについて、当該方法により遺伝子型とヘテロ接合率の決定、同時にコピー数の決定も可能となり、それらの両方ともが異数性検出の目的で使用されてもよい。突然変異量に関する方法の一部として使用されてもよい。当該方法は、任意の量のDNAまたはRNAに使用されてもよく、標的領域は、SNP、他の多型領域、非多型領域、およびそれらの組み合わせであってもよい。
一部の実施形態では、断片化DNAのライゲーション介在性ユニバーサルPCR増幅が使用されてもよい。ライゲーション介在性ユニバーサルPCR増幅を使用して血漿DNAを増幅することができ、次いでそれを複数の並行反応に分割することができる。さらにこれを使用して短い断片を優先的に増幅することができ、その結果、腫瘍割合が高められる。一部の実施形態では、ライゲーションにより断片へのタグを付加することにより、より短い断片の検出、より短い標的配列特異的プライマー部分の使用、および/または非特異的反応を減少させる高温でのアニーリングが可能になる。
本明細書に記載される方法は、ある量の混入DNAと混合されている標的DNAセットである場合の多数の目的に対し、使用されてもよい。一部の実施形態では、標的DNAおよび混入DNAは、遺伝的に関連する個体由来のものであってもよい。例えば、胎児(標的)の遺伝子異常は、胎児(標的)DNAと母体(混入)DNAも含有する母体血漿から検出される場合がある。当該異常には、全染色体異常(例えば、異数性)、部分染色体異常(例えば、欠失、重複、逆位、転座)、ポリヌクレオチド多型(例えば、STR)、一塩基多型、および/または他の遺伝的な異常もしくは差異が含まれる。一部の実施形態において、標的DNAと混入DNAは、同じ個体由来であってもよいが、標的DNAと混入DNAは、例えば癌の場合などには一つ以上の変異によって異なっている。(例えば、H.Mamon et al.Preferential Amplification of Apoptotic DNA from Plasma:Potential for Enhancing Detection of Minor DNA Alterations in Circulating DNA.Clinical Chemistry 54:9(2008)を参照のこと)。一部の実施形態において、DNAは、細胞培養(アポトーシス)上清中に見出され得る。一部の実施形態において、生物学的サンプル(例えば、血液)にアポトーシスを誘導することが可能であり、その後にライブラリー調製、増幅および/またはシーケンスが実施される。この目的を達成するための多数のワークフローおよびプロトコールが、本開示の別段に提示されている。
一部の実施形態において、標的DNAは一つの細胞に由来してもよく、1コピー未満の標的ゲノムからなるDNAサンプルに由来してもよく、少量のDNAに由来してもよく、混合起源(例えば、癌患者の血漿と腫瘍、健常DNAと癌性DNAの混合、移植など)からのDNAに由来してもよく、他の体液に由来してもよく、細胞培養物に由来してもよく、培養上清に由来してもよく、法医学DNAサンプルに由来してもよく、古代のDNAサンプル(例えばコハクに閉じ込められた昆虫)に由来してもよく、他のDNAサンプルに由来してもよく、そしてそれらの組み合わせであってもよい。
一部の実施形態において、短いアンプリコンサイズを使用してもよい。短いアンプリコンサイズは、断片化されたDNAに特に好適である(例えば、A.Sikora,et sl.Detection of increased amounts of cell-free fetal DNA with short PCR amplicons.Clin Chem.2010 Jan;56(1):136-8を参照のこと)。
短いアンプリコンサイズを使用することで、いくつかの顕著な利益がもたらされ得る。短いアンプリコンサイズは、最適化された増幅効率がもたらされ得る。短いアンプリコンサイズは通常、短い産物を生じさせる。ゆえに非特異的プライミングが発生する可能性は低い。クラスターが小さくなるため、短い産物は、シーケンスフローセル上でより高密度にクラスター化することができる。本明細書に記載される方法は、より長いPCRアンプリコンと同等に良好に機能し得ることに留意されたい。アンプリコンの長さは、例えばより長い配列をシーケンスする場合など、必要に応じて増加させてもよい。入れ子型PCRプロトコールの第一工程として100bpから200bpの長さのアッセイを用いた146-多重化標的増幅を用いた実験を、一つの細胞に対して、およびゲノムDNAに対して実施し、陽性の結果が得られた。
一部の実施形態では、本明細書に記載の方法を使用して、SNP、コピー数、ヌクレオチドのメチル化、mRNAレベル、他のタイプのRNA発現レベル、他の遺伝的特性、および/もしくはエピジェネティックな特性を増幅ならびに/または検出してもよい。本明細書に記載されるミニPCR法は、次世代シーケンスと共に使用されてもよく、例えばマイクロアレイ、デジタルPCRによる計数、リアルタイムPCR、質量分析法などの他の下流方法と共に使用されてもよい。
一部の実施形態では、本明細書に記載されるミニPCR増幅法は、少数集団の正確な定量のための方法の一部として使用されてもよい。スパイクキャリブレーターを使用した絶対的定量に使用されてもよい。ベリーディープシーケンス(very deep sequencing)を介した変異/マイナーアレルの定量に使用されてもよく、および高度に多重化された様式で実行されてもよい。標準的な父子鑑定に使用されてもよく、およびヒト、動物、植物、または他の生物における親族または祖先のアイデンティティ検査に使用されてもよい。法医学的検査に使用されてもよい。例えば羊水およびCVS、精子、受精産物(POC)などの任意の種類の材料に対する迅速遺伝子型解析およびコピー数分析(CN)に使用されてもよい。例えば胚から生検されたサンプルに対する遺伝子型解析など、単一細胞解析に使用されてもよい。ミニPCRを使用した標的シーケンスにより、迅速な胚解析(生検から1日以内、1日、または2日以内)に使用されてもよい。
一部の実施形態では、ミニPCR増幅法は、腫瘍分析に使用することができる。腫瘍生検は多くの場合、健康な細胞と腫瘍細胞との混合物である。標的化PCRによって、バックグラウンド配列をほぼ有さない、SNPおよび座位のディープシーケンスが可能となる。腫瘍DNAに対するコピー数分析およびヘテロ接合性消失の分析に使用されてもよい。当該腫瘍DNAは、腫瘍患者の多くの様々な体液または組織に存在し得る。腫瘍再発の検出、および/または腫瘍スクリーニングに使用されてもよい。種子の品質管理試験に使用されてもよい。交配目的または漁業目的に使用されてもよい。これらの方法のいずれかも、倍数性分類の目的のために、非多型座位を標的としても同様に好適に使用され得ることに留意されたい。
本明細書に開示される方法の根底にある基礎的な方法の一部を説明するいくつかの文献としては、以下が挙げられる:(1)Wang HY,Luo M,Tereshchenko IV,Frikker DM,Cui X,Li JY,Hu G,Chu Y,Azaro MA,Lin Y,Shen L,Yang Q,Kambouris ME,Gao R,Shih W,Li H.Genome Res.2005 Feb;15(2):276-83.Department of Molecular Genetics,Microbiology and Immunology/The Cancer Institute of New Jersey,Robert Wood Johnson Medical School,New Brunswick,New Jersey 08903,USA.(2)High-throughput genotyping of single nucleotide polymorphisms with high sensitivity.Li H,Wang HY,Cui X,Luo M,Hu G,Greenawalt DM,Tereshchenko IV,Li JY,Chu Y,Gao R.Methods Mol Biol.2007;396 - PubMed PMID:18025699.(3)A method comprising multiplexing of an average of 9 assays for sequencing is described in:Nested Patch PCR enables highly multiplexed mutation discovery in candidate genes.Varley KE,Mitra RD.Genome Res.2008 Nov;18(11):1844-50.Epub 2008 Oct 10.本明細書に開示される方法によって、上記の参考文献よりも高度な多重化が可能となることに留意されたい。
6.非侵襲的出生前検査のための、循環胎児細胞からのゲノム情報の分析方法。
一つの態様では、当該方法はさらに、一つ以上の循環細胞が一つ以上の胎児細胞であると決定された遺伝子型を使用して、非侵襲的な出生前検査を実施することを含む。
一つの実施形態では、当該方法はさらに、一つ以上の胎児細胞であると決定された一つ以上の循環細胞における対象となる標的染色体または標的染色体セグメントのコピー数変動または異数性を検出することを含む。
倍数性分類は、「染色体コピー数分類」または「コピー数分類」(CNC:Copy Number Calling)とも呼ばれ、細胞中に存在する一つ以上の染色体の量および染色体の固有性の判定を指す。異数性とは、細胞中に誤った数の染色体が存在する状態を指す。ヒト体細胞の場合、細胞が22対の常染色体と1対の性染色体を含有しない場合を指す。ヒト配偶子の場合、細胞が23個の各染色体のうちの一つを含有しない場合を指す。一つの染色体の場合、2よりも多い、または2よりも少ない、相同であるが同一ではない染色体が存在する場合を指し、当該二つの各染色体は異なる親を起源とする。倍数性の状態とは、細胞中の一つ以上の染色体の量および染色体の固有性を指す。
CNVは、影響を受ける配列の長さに基づいて、二つの主要カテゴリーのうちの一つに割り当てられることが多い。第一のカテゴリーにはコピー数多形(CNP)が含まれ、これは一般的な集団に共通し、1%よりも高い全体的頻度で発生する。典型的にはCNPは小さく(ほとんどが長さ10キロ塩基未満)、薬物の解毒と免疫に重要なタンパク質をコードする遺伝子に関して濃縮されることが多い。これらのCNPのサブセットは、コピー数に関して非常に変化に富んでいる。結果として、異なるヒトの染色体は、特定の遺伝子セットに関して、広範なコピー数(例えば、2、3、4、5など)を有し得る。最近になって、免疫反応遺伝子に関連するCNPが、乾癬、クローン病、および糸球体腎炎を含む複雑な遺伝性疾患に対する感受性と関連していた。
第二のCNVには、数十万塩基対から100万塩基対を超える長さのサイズに及ぶ、CNPよりもはるかに長い、比較的希少なバリアントが含まれる。一部の例では、これらのCNVは、特定の個体を誕生させた精子または卵子の産生中に生じたか、または家族内の数世代の間でのみ受け継がれていた可能性がある。これらの巨大で希少な構造的バリアントは、精神遅滞、発達遅滞、分裂症、および自閉症の対象において不均衡に観察されている。そのような対象における当該出現は、巨大で希少なCNVが、一塩基置換を含む他の遺伝性変異型よりも神経認知性疾患においてより重要である可能性があるという推測を導いた。
遺伝子コピー数は、癌細胞において変化し得る。例えば、Chrlpの重複は乳癌に普遍的であり、EGFRのコピー数は非小細胞肺癌において正常状態よりも高くなり得る。癌診断のためのさらなる標的遺伝子については、本明細書のセクション9に提供される。癌は主要な死亡原因の一つである。したがって癌の早期診断と治療が重要であり、患者の転帰を改善することができる(例えば、寛解の確率および寛解の持続期間を増加させる)。また早期診断によって、患者は、少数の抜本的な治療選択肢を受けることもできる。癌性細胞を破壊する現行治療の多くは正常細胞にも影響を与え、その結果、例えば悪心、嘔吐、血球数の減少、感染リスクの上昇、脱毛、および粘膜の潰瘍など、様々な副作用の可能性が生じる。したがって癌の早期検出が望ましく、それにより癌を除去するために必要な治療(例えば化学療法剤または放射線など)の量および/または回数を減少させることができる。
コピー数変動は、重度の精神的および肉体的な障害、ならびに特発性学習障害とも関連している。セルフリーDNA(cfDNA)を使用した非侵襲的出生前検査(NIPT)を使用して、例えば胎児のトリソミー13、18、および21、三倍体性、ならびに性染色体の異数性などの異常を検出することができる。したがって一つの実施形態では、対象となる標的染色体または標的染色体セグメントは、13番染色体、18番染色体、21番染色体、性染色体、および/またはそれらの染色体セグメントである。
また、重度の精神的および肉体的な障害を生じさせる可能性がある亜染色体の微小欠失は、そのサイズの小ささによって検出がより困難である。微小欠失症候群のうちの8つは、1000分の1より高い総発生率であり、胎児常染色体トリソミーとほぼ同じ頻度である。したがって一つの実施形態では、本明細書に開示される方法はさらに、一つ以上の純粋な胎児細胞であると決定された一つ以上の循環細胞における微小欠失を検出することを含む。一つの実施形態では、微小欠失は、ディジョージ症候群に関連する22q11.2欠失、プラダーウィリ症候群に関連する微小欠失、アンジェルマン症候群に関連する微小欠失、1p36欠失、および/または猫鳴き症候群に関連する微小欠失である。
さらに、CCL3L1のコピー数の多さは、HIV感染に対する感受性の低さと関連しており、FCGR3B(CD16細胞表面免疫グロブリン受容体)のコピー数の少なさは、全身性エリテマトーデスおよび類似の炎症性自己免疫障害に対する感受性を増大させる可能性がある。
所与の染色体または染色体セグメントにマッピングされるDNA配列を基にしたリード数の計数に基づき、胎児細胞における染色体コピー数を測定する方法は、染色体コピー数または染色体セグメントコピー数を分析するための「計数方法」または「定量方法」と簡便に呼称される。そうした方法の例は、特に、公開特許出願US2013/0172211A1、米国特許第8,008,018号、米国特許第8,467,976B2号、米国公開特許出願US2012/0003637A1に見出すことができる。多くの場合、そうした方法には、特定の染色体にマッピングされるDNA配列のリード数に対する参照値(カットオフ値)の生成を伴い、値を超えるリード数である場合、特定の遺伝子異常を示している。
したがって、胎児起源であると推測される細胞サンプルを分析および特徴解析する方法は、コピー数を決定するための方法およびシステム、または胎児細胞であることが確認された対象となる細胞における対象となる染色体または染色体セグメントの異数性を検出するための方法およびシステムと組み合わされてもよい。コピー数を決定、または異数性を検出するためのこれらの方法は、対象となる染色体または染色体セグメントを使用して実施され、バイアスモデルを設定する。すなわち、検査パラメータを設定するために、同一の並行分析において、高い信頼性で二倍体サンプルと特定されているサンプルを分析に使用して、試験サンプルのセット中の他のサンプルの対象となる同一染色体または染色体セグメントの異数性の分析が行われる。信頼とは、分類されたSNP、アレル、アレルのセット、倍数性の分類、または決定された染色体セグメントのコピー数が、個体の実際の遺伝的状態を正しく表している統計的な可能性を指す。そうした胎児DNAからのコピー数変動および異数性を決定する方法は、その全体が本明細書に組み込まれる米国特許公開2018/0173846に記載されている。
標的細胞および非標的細胞から得られたDNA調製物のシーケンスにより検出された各座位の量は、例えばPCRなどの増幅工程を行う前など、シーケンス用の調製前の初期サンプル材料中の座位の開始量以外の理由によって、座位ごとに異なる可能性がある。例えばPCRプライマーの結合効率、アンプリコン長さ、GC含量などの変数は、シーケンス用の調製またはシーケンス中の個々の座位の出現における変動原因となり得る。このような因子は、座位に特異的なバイアスを生じさせ、座位ごとに過剰に出現または過小に出現させ得る。さらにバイアスは、サンプル特異的な不一致から生じることがある。例えば、サンプルの物理的処理中のピペッティングのエラーまたは他の測定エラーに起因して、一つのサンプルが、サンプルセット中の別のサンプルよりも多くのDNAを有する場合がある。例示的な実施形態では、これらのサンプル特異的なバイアスは、サンプル特異的パラメータによって考慮される。サンプル特異的パラメータに関するこれら特定の実施形態は、その全体が本明細書に組み込まれる米国特許公開2018/0173846に開示されている。
遺伝情報の生成に使用される特定の方法とは無関係に、各座位からの遺伝配列情報の量は、元のサンプル中の座位のコピー数の相対的な量に依存する。同じ染色体セグメント上にあると考えられる座位、または一部の実施形態では、同じ染色体上にあると考えられる座位は、同じ開始量を有すると推定される。したがって、例えば、標的細胞のゲノム(または非標的細胞のゲノム)の21番染色体上に存在する複数の座位は、ゲノムDNA中でほぼ等しい量で存在すると推定される。したがって、同じ染色体上の座位間で実測される遺伝情報の量における差異は、座位特異的バイアスの結果である。例えば、SNP1とSNP2が同じ染色体上に位置し、同じ染色体上で同じコピー数を有すると仮定され、SNP1が0.1%のリード深度を有することが判明し、SNP2が0.4%のリード深度を有することが判明した場合、SNP1よりもSNP2からのDNA配列の産生に有利な定量的な座位特異的バイアスによりこれが説明され得る。このバイアスは、二つの異なるSNPについて、可能性のあるサンプリング結果の分布を考慮することによって、さらに正規化され得る。したがって、本発明の方法は、その全体が本明細書に組み込まれる米国特許公開2018/0173846においてより詳細に論じられるように、バイアスを分析し、バイアスモデルを提供するものである。
本発明の特定の実施形態では、一つまたは二つの最尤法が使用される。上述のように、第一の最尤法を使用して、サンプルセット中の二倍体サンプルを特定し、サンプルセット中の他のサンプルが異数性である第一の確率を決定することができる。したがって、特定の実施形態では、対象となる染色体または染色体セグメントのうちの一つ以上またはすべてが、第一の最尤法を使用して二染色体性であることが決定される。当該方法は、その全体が本明細書に組み込まれる米国特許公開2018/0173846においてさらに記述および図示される。
別の実施形態では、対象となる染色体または染色体セグメントのコピー数は、複数の第二の倍数仮説または第二の倍数仮説セットを生成することにより決定され、この場合において第二の倍数仮説の各々は、標的細胞中の対象となる染色体または染色体セグメントの特定のコピー数に関連付けられる。次いでモデルを使用して、各患者からの遺伝データが、第二の仮説の各々にどの程度適合するかを試験する。第二の仮説の各々に対する適合度が決定される。第二の確率値は、第二の仮説ごとに計算され、この場合において当該第二の確率値は、標的細胞のゲノムが、第二の仮説によって指定される染色体または染色体セグメントの数を有する可能性を示す。したがって、最大尤度を有する第二の仮説を選択することによって、標的細胞のゲノム中の染色体または染色体セグメントのコピー数を決定し得る。そうした第一および第二の仮説を組み合わせて検討し、その全体が本明細書に組み込まれる米国特許公開2018/0173846で詳細に検討されるように、異数性決定の信頼度を高めることができる。
胎児の倍数性の状態を決定するために使用される方法に関する本開示の一つの実施形態では、サンプル中の胎児DNAの割合を考慮に入れることをさらに含む。本開示の一つの実施形態では、方法は、胎児起源または胎盤起源であるサンプル中のDNAのパーセントを計算することを伴う。本開示の一つの実施形態では、異数性分類の閾値は、計算された胎児DNAパーセントに基づいて適応的に正規化される。一部の実施形態では、DNA混合物において胎児起源であるDNAのパーセントを推定する方法は、母親の遺伝物質と胎児の遺伝物質を含有する混合サンプルを取得すること、胎児の父親から遺伝子サンプルを取得すること、混合サンプル中のDNAを測定すること、父親のサンプル中のDNAを測定すること、および混合サンプルと父親サンプルのDNA測定結果を使用して混合サンプル中の胎児起源のDNAのパーセントを計算すること、を含む。
一つの態様では、本明細書に記載の方法は、細胞サンプルが真の胎児細胞と真の母細胞の両方を含有する場合、サンプルが胎児細胞と母細胞の混合物であることの確認が可能となり、セルフリーDNA(cfDNA)を参照として使用することにより、胎児割合を推定し得る。本明細書にその全体で組み込まれる米国特許出願第2018/0298439号に記載されるように、母体DNAの遺伝子型データ、胎児DNAと母体DNAの混合物、および胎児DNAの推定割合によって、胎児の父性の決定が可能となる。母親と子のcfDNAの混合物、および胎児と母親のDNAの混合物から得られた遺伝子型データを使用して、サンプルの胎児割合が決定され、父子鑑定が可能となり得る。
一部の実施形態は、PARENTAL SUPPORT(商標)(PS)法と組み合わせて使用されてもよく、当該方法は、米国特許出願11/603,406(米国公開20070184467)、米国特許出願12/076,348(米国公開20080243398)、米国特許出願13/110,685、PCT出願PCT/US09/52730(PCT公開:WO/2010/017214)、PCT出願PCT/US10/050824(PCT公開:WO/2011/041485)、PCT出願PCT/US2011/037018(PCT公開:WO/2011/146632)、およびPCT出願PCT/US2011/61506に記載されており、それら出願はその全体で参照により本明細書に組み込まれる。PARENTAL SUPPORT(商標)は、遺伝子データを解析するために使用され得る情報科学ベースの方法である。一部の実施形態では、本明細書に開示される方法は、PARENTAL SUPPORT(商標)法の一部として検討されてもよい。一部の実施形態では、PARENTAL SUPPORT(商標)法は、高い精度で標的個体、当該個体由来の一つの細胞もしくは少数の細胞、または標的個体のDNAからなるDNA混合物、または一つもしくは複数の他の個体のDNAの遺伝子データを決定するため、特に疾患関連アレルを決定する、対象となるアレルを決定する、標的個体中の一つもしくは複数の染色体の倍数性の状態を決定する、および/または別の個体と標的個体の関連性の程度を決定するために使用され得る方法の集合である。PARENTAL SUPPORT(商標)は、これらの方法のいずれかを指す場合がある。PARENTAL SUPPORT(商標)は、情報科学に基づく方法の一例である。
本発明の一部の実施形態では、異数性決定に関する信頼性の改善は、定量的な非アレル性閾値またはカットオフ法を使用してサンプルの異数性を決定することにより得ることができ、そして同じサンプルに対し、尤度を決定する方法を使用して異数性を決定することにより得ることができる。サンプルが、閾値法により対象となる染色体または染色体セグメント中に異数性を有すると特定され、当該サンプルが、仮説セットに対する尤度決定を使用して高い信頼度で異数性を有すると特定される場合、当該サンプルは、当該サンプルの供給源である対象中の一つ以上の標的細胞に関し、対象となる染色体または染色体セグメントに異数性を有するサンプルと特定される。当該方法は、その全体が本明細書に組み込まれる米国特許公開2018/0173846においてさらに説明および図示される。
特にNIPTなど、非アレル性閾値分析を実施する方法が当分野に公知である。例えば、その全体で参照により本明細書に組み込まれる米国特許第 7,888,017号および第8,318,430号は、推定される染色体にマッピングされるリード数を計数し、これを参照染色体にマッピングされるリード数と比較して、推定される染色体上に過剰なリードがある場合には、当該染色体での胎児の三倍体性に相当するという仮定を使用して、胎児異数性を決定する方法を提供する。シーケンスリードの深度と参照値を含む当該文献中の教示は、本発明の実施形態の実施に有用であり得る。
7.循環腫瘍細胞からゲノム情報を分析する方法。
本明細書に提供される方法および組成物は、液体生検を使用して循環腫瘍細胞を含有する試料を取得することにより、癌(例えば、乳癌、膀胱癌、または結腸直腸癌)の検出、診断、病期分類、スクリーニング、治療、および管理を改善する。本明細書で提供する方法は、解説的な実施形態において、循環流体中、特に循環腫瘍細胞(CTC)中の癌に関連する変異を分析する。当該方法は、必要とされていた複数回試験ではなく、全てが有効であれば腫瘍サンプルを利用する一回の試験で、腫瘍中で発見される大部分の変異体、クローン性変異のみならずサブクローン性変異を特定するという利点を提供する。
したがって一つの態様において、本開示は、腫瘍に由来すると決定された一つ以上の循環細胞を取得することにより、癌患者における腫瘍の早期再発または転移をモニタリングおよび検出するための方法を提供し、当該方法は、
a)癌と診断された患者の腫瘍サンプルにおいて特定された変異に基づいて、一つ以上の患者特異的変異を選択する工程、
b)当該患者が外科手術、第一選択化学療法、および/またはアジュバント療法で治療された後、当該患者から一つ以上の血液サンプルを長期的に採取する工程、
c)当該癌患者から取得された当該血液サンプルから取得された、循環腫瘍細胞であると推測される一つ以上の循環細胞から単離された細胞DNAから第一のアンプリコンセット、およびセルフリーDNAから第二のアンプリコンセットを生成する工程であって、当該腫瘍細胞および正常細胞は、当該癌患者の血液サンプルまたはその画分の各々から取得され、当該第一のアンプリコンセットおよび当該第二のアンプリコンセットは、癌に関連する患者特異的変異の多重化増幅反応を実施することにより取得される工程、
d)次世代シーケンスにより当該第一のアンプリコンセットと当該第二のアンプリコンセットをシーケンスする工程、
e)当該第一のアンプリコンセットの配列に基づき、一つ以上の循環細胞の起源を決定する工程であって、当該第二のアンプリコンセットの配列は参照として使用され、腫瘍が起源であると決定された循環細胞から生成された第一のアンプリコンセットからの一つ以上の患者特異的変異の検出は、癌の早期再発または転移を示唆する工程、を含む。
別の態様では、本明細書における開示は、癌患者を治療するための方法を提供し、当該方法は、
a)外科手術、第一選択化学療法、および/またはアジュバント療法で癌患者を治療する工程、
b)当該患者が外科手術、第一選択化学療法、および/またはアジュバント療法で治療された後、当該患者から一つ以上の血液サンプルを長期的に採取する工程、
c)当該癌患者から取得された当該血液サンプルから取得された、循環腫瘍細胞であると推測される一つ以上の循環細胞から単離された細胞DNAから第一のアンプリコンセット、およびセルフリーDNAから第二のアンプリコンセットを生成する工程であって、当該腫瘍細胞および正常細胞は、当該癌患者の血液サンプルまたはその画分の各々から取得され、当該第一のアンプリコンセットおよび当該第二のアンプリコンセットは、癌に関連する患者特異的変異の多重化増幅反応を実施することにより取得される工程、
d)次世代シーケンスにより当該第一のアンプリコンセットと当該第二のアンプリコンセットをシーケンスする工程、
e)当該第一のアンプリコンセットの配列に基づき、一つ以上の循環細胞の起源を決定する工程であって、当該第二のアンプリコンセットの配列は参照として使用され、腫瘍が起源であると決定された循環細胞から生成された第一のアンプリコンセットからの一つ以上の患者特異的変異の検出は、癌の早期再発または転移を示唆する工程、
f)当該患者に化合物を投与する工程であって、当該化合物は、血液サンプルから検出された当該一つ以上の患者特異的変異を有する癌の治療に有効であることが判明している工程、を含む方法。
本明細書に提供される改善方法によって、非常に少数のCTCを含有するサンプルの正確な分析と特徴解析が可能となる。本発明方法により分析されるサンプル中のCTCの数は、100細胞未満、75細胞未満、50細胞未満、25細胞未満、20細胞未満、15細胞未満、10細胞未満、5細胞未満、または一つの細胞であり得る。本明細書に提供される方法を使用することにより、一つの循環腫瘍細胞、2CTC、3CTC、4CTC、5CTC、6CTC、7CTC、8CTC、9CTC、または10CTCから正確なゲノム情報が取得され得る。
一部の実施形態では、方法は、予め決定された患者特異的変異に基づいて循環腫瘍細胞であると推測される循環細胞の固有性を決定することにより、癌患者における腫瘍の早期再発または転移をモニタリングおよび検出することを含む。一部の実施形態では、患者特異的変異は、癌に関連した一塩基バリアント(SNV)、コピー数バリアント(CNV)、インデル、欠失、または遺伝子融合を含む。一部の実施形態では、癌に関連する患者特異的変異が少なくとも2個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも8個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも16個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも50個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも100個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも1000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも5000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも10000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも15000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。
一部の実施形態では、癌に関連する患者特異的変異が少なくとも100個~約1000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも100個~約1000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも1000個~約5000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも5000個~約10000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも10000個~約15000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも15000個~約20000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも20000個~約25000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも50000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。
一部の実施形態では、癌に関連する患者特異的変異が少なくとも5000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも10000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも15000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。一部の実施形態では、癌に関連する患者特異的変異が少なくとも25000個存在する場合、当該一つ以上の循環細胞が腫瘍細胞であることを示唆する。
一つの態様では、多重化増幅が実施されて、癌に関連する患者特異的変異を包含するアンプリコンが取得される。一部の実施形態では、第一のアンプリコンセットと第二のアンプリコンセットは、50~1000個の癌関連患者特異的変異の多重化増幅反応を実施することにより取得される。
一つの態様では、癌患者における腫瘍の早期再発と転移のモニタリングおよび検出のための方法は、複数の循環細胞を個々の反応ボリュームに分けること、各反応ボリューム中の細胞DNAを単離すること、および各反応ボリュームにおいて単離された細胞DNAにサンプルバーコードを取り付けることを含む。一部の実施形態では、細胞DNAは、腫瘍細胞であると推測される一つの循環細胞から単離される。
一部の実施形態では、当該方法はさらに、一つ以上の循環細胞が一つ以上の腫瘍細胞であると決定された遺伝子型を使用して、非侵襲的な癌検査を実施することを含む。
当該方法および組成物は、それ自体のみでも有用であり得、または癌(例えば、乳癌、膀胱癌または結腸直腸癌)の検出、診断、病期分類、スクリーニング、治療および管理のための他の方法とともに使用される場合でも有用であり得、例えばこれら他の方法の結果を補助して、信頼性の高い結果および/または最終的な結果を提供する。
「癌」および「癌性」という用語は、典型的には非制御状態の細胞増殖を特徴とする、動物における生理学的状態を指す、または記載する。「腫瘍」は、一つ以上の癌性細胞を含む。癌にはいくつかの主な種類がある。癌腫は、皮膚で始まる癌、または内臓を縁取る、もしくは覆う組織で始まる癌である。肉腫は、骨、軟骨、脂肪、筋肉、血管、または他の結合組織もしくは支持組織で始まる癌である。白血病は、例えば骨髄などの血液形成組織で始まり、大量の異常な血液細胞が産生されて血中に入る癌である。リンパ腫および多発性骨髄腫は、免疫系の細胞で始まる癌である。中枢神経系の癌は、脳および脊髄の組織で始まる癌である。
一部の実施形態では、癌は、急性リンパ芽球性白血病、急性骨髄性白血病、副腎皮質癌、AIDS関連癌、AIDS関連リンパ腫、肛門癌、虫垂癌、星状細胞腫、非定型奇形腫様/ラブドイド腫瘍、基底細胞癌、膀胱癌、脳幹神経膠腫、脳腫瘍(脳幹神経膠腫、中枢神経系の非定型奇形腫様/ラブドイド腫瘍、中枢神経系の胚芽腫、星状細胞腫、頭蓋咽頭腫、上衣芽細胞腫、上衣細胞腫、髄芽細胞腫、髄様上皮腫、松果体実質腫瘍の中間分化型、テント上原始神経外胚葉性腫瘍、および松果体芽細胞腫)、乳癌、気管支腫瘍、バーキットリンパ腫、原発部位不明の癌、カルチノイド腫瘍、原発部位不明の癌腫、中枢神経系の非定型奇形腫様/ラブドイド腫瘍、中枢神経系の胚芽腫、子宮頸癌、小児癌、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖性障害、結腸癌、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、内分泌膵島細胞腫、子宮内膜癌、上衣芽細胞腫、上衣細胞腫、食道癌、鼻腔神経芽細胞腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管癌、胆嚢癌、胃癌、胃腸カルチノイド腫瘍、消化管間質細胞腫瘍、消化管間質腫瘍(GIST)、妊娠性絨毛性腫瘍、神経膠腫、有毛細胞白血病、頭頚部癌、心臓癌、ホジキンリンパ腫、下咽頭癌、眼内黒色腫、島細胞腫、カポジ肉腫、腎癌、ランゲルハンス細胞組織球増加症、喉頭癌、口唇癌、肝癌、悪性線維性組織球腫、骨癌、髄芽細胞腫、髄様上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮種、原発不明の転移性頸部扁平上皮癌、口腔癌、多発性内分泌腫瘍症候群、多発性黒色腫、多発性黒色腫/形質細胞腫、菌状息肉腫、骨髄異形成症候群、骨髄増殖性新生物、鼻腔癌、上咽頭癌、神経芽細胞腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌(oral cancer)、口腔癌(oral cavity cancer)、口腔咽頭癌、骨肉腫、他の脳腫瘍および脊髄腫瘍、卵巣癌、上皮性卵巣癌、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、膵癌、乳頭腫症、副鼻腔癌、副甲状腺癌、骨盤内癌、陰茎癌、咽頭癌、松果体実質腫瘍の中間分化型、松果体芽細胞腫、下垂体部腫瘍、形質細胞腫/多発性骨髄腫、胸膜肺芽細胞腫、原発性中枢神経系(CNS)リンパ腫、原発性肝細胞性肝癌、前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、セザリー症候群、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮細胞癌、扁平上皮頸部癌、胃癌、テント上原始神経外胚葉腫瘍、T細胞リンパ腫、精巣癌、咽喉癌、胸腺癌、胸腺腫、甲状腺癌、移行上皮細胞癌、腎盂および尿管の移行上皮細胞癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮肉腫、膣癌、外陰部癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む。
他の実施形態においては、本明細書において、例えば癌を有すると推測される個体などの個体からの血液サンプルまたはその画分中の癌(例えば、乳癌、膀胱癌または結腸直腸癌)を検出するための方法が提供され、当該方法は、本明細書に提供されるctDNA SNV増幅/シーケンスワークフローを使用して、循環腫瘍細胞を含有するサンプルおよびctDNAサンプル中に存在する一塩基バリアントを決定することにより、サンプル中に存在する一塩基バリアントを決定することを含む。複数の一塩基座位で、サンプル中に、範囲の下限で1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個のSNV、範囲の上限で2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、または50個のSNVの存在は、癌(例えば、乳癌、膀胱癌、または結腸直腸癌)の存在を示す。
当該実施形態の特定の例では、癌は、ステージ1a、1b、もしくは2aの乳癌、膀胱癌、または結腸直腸癌である。当該実施形態の特定の例では、癌は、ステージ1aもしくは1bの乳癌、膀胱癌、または結腸直腸癌である。当該実施形態の特定の例では、個体は外科手術を受けていない。当該実施形態の特定の例では、個体は生検を受けていない。本明細書で提供する方法の実施形態のいずれについての或る実施例においては、ある個体からのCTCに標的増幅を実行する前に、当該個体に由来する腫瘍に存在するSNVに関してデータが提供される。したがってこれら実施形態においては、SNVの増幅/シークエンシング反応を、個体からの一つ又は複数の腫瘍サンプルに対して実行する。この方法では、本明細書で提供するCTCのSNVの増幅/シークエンシング反応は、それがクローン性及びサブクローン性の変異の液体生検を提供することを理由に、やはり有利である。また、本明細書で提供するように、癌(例えば、乳癌、膀胱癌、または結腸直腸癌)を有する個体において、あるSNVに関して、該個体からのctDNAサンプル中で例えば1、2、3、4、5、6、7、8、9、10%VAF以上である高い割合のVAFが確定するものであれば、クローン性変異であることがより明確に特定可能である。
説明的な実施形態においては、本明細書の方法のうちいずれかの、一組の一塩基バリアント遺伝子座が、癌(例えば、乳癌、膀胱癌、または結腸直腸癌)に関するTCGAおよびCOSMICのデータセットにおいて特定された一塩基バリアント遺伝子座の全てを含む。
本明細書の方法のうちのいずれかの或る実施形態において、一組の一塩基バリアント遺伝子座は、癌(例えば、乳癌、膀胱癌または結腸直腸癌)に関連することが判明している一塩基バリアント遺伝子座を、範囲の下限で2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、75、100、250、500、1000、2500、5000又は10,000個含み、範囲の上限で5、6、7、8、9、10、15、20、25、30、40、50、75、100、250、500、1000、2500、5000、10,000、20,000及び25,000個含む。
他の実施形態においては、個体からの血液またはその画分のサンプルから、癌(例えば乳癌、膀胱癌または結腸直腸癌)を有すると推測される個体などの個体に対して癌(例えば乳癌、膀胱癌または結腸直腸癌)の診断を裏付ける方法を本明細書で提供するものであって、当該方法は、本明細書で提供されるCTC SNV増幅/シーケンスワークフローを実行して、一つ又は複数の一塩基バリアントが複数の一塩基バリアント遺伝子座中に存在するか否かを決定することを含む。当該実施形態では、以下の要素、意見、ガイドライン、または規則が適用される:一塩基バリアントの非存在は、ステージ1a、1bまたは2aの腺癌の診断を裏付けるものであり、一塩基バリアントの存在は、扁平上皮細胞癌またはステージ2bもしくは3aの腺癌の診断を裏付けるものであり、および/または10個以上の一塩基バリアントの存在は、扁平上皮細胞癌またはステージ2bもしくは3の腺癌の診断を裏付けるものである。
或る実施形態においては、この方法は、治療計画、治療法を決定することと、及び/又は、一つ又は複数のクローン性一塩基バリアントを標的とする化合物を個体に投与することとをさらに含む。或る実施例においては、サブクローン性SNV及び/又は他のクローン性SNVは治療法で標的とされない。或る治療法及び関連する変異が、この明細書の他の部分で提供されるが、この分野で公知である。したがって、ある実施例においては、当該方法は、個体に化合物を投与することをさらに含むものであって、当該化合物は、決定された一塩基バリアントのうちの一つ又は複数を有する癌(例えば乳癌、膀胱癌または結腸直腸癌)の治療に特に有効であることがわかっているものである。
或る実施形態においては、本明細書のSNVを検出する方法を用いて治療レジメンを行うことが可能である。ADC及びSCCに関連する特定の変異を標的とする治療法が、利用可能であり、開発中である(Nature Review Cancer.14:535-551(2014))。例えば、治療の選択には、L858R又はT790MにおけるEGFR変異の検出が有益であり得る。エルロチニブ、ゲフィチニブ、アファチニブ、AZK9291、CO-1686及びHM61713は、米国又は治験で現在承認されている治療であり、これらは特定のEGFR変異を標的としている。他の例では、KRAS中のG12D、G12C又はG12Vの変異を利用して、個体に対してセルメチニブとドセタキセルとを組み合わせた治療を行うことが可能である。他の例として、BRAFにおけるV600E変異を利用して、対象に対してベムラフェニブ、ダブラフェニブ及びトラメチニブによる治療を行うことが可能である。
本発明の標的遺伝子は、例示的な実施形態においては癌関連遺伝子であり、多くの説明的な実施形態においては癌関連遺伝子である。癌関連遺伝子(例えば、癌関連遺伝子または膀胱癌関連遺伝子または結腸直腸癌関連遺伝子)とは、癌(例えば乳癌、膀胱癌または結腸直腸癌)のリスク変化に関連する遺伝子、または癌の予後変化に関連する遺伝子を指す。癌を促進する例示的な癌関連の遺伝子には、癌遺伝子、細胞の増殖や湿潤又は転移を高める遺伝子、アポトーシスを抑制する遺伝子、及び、血管新生促進(pro-angiogenesis)遺伝子が含まれる。癌を抑制する癌関連遺伝子には、腫瘍抑制遺伝子、細胞の増殖や湿潤又は転移を抑制する遺伝子、アポトーシスを促進する遺伝子、及び、抗血管新生(anti-angiogenesis)遺伝子が含まれるが、これに限定されない。
変異検出方法の一実施形態では、標的となる遺伝子の領域を選択することから開始する。公知の変異を含む領域を用いて、mPCR-NGSのためのプライマーを増殖させて、増幅して変異を検出する。
本明細書で提供する方法を使用して、事実上あらゆるタイプの変異、特に癌に関連することが判明している変異を検出することができ、特に本明細書に提供される方法は、癌、特に乳癌、膀胱癌または結腸直腸癌に関連する特にSNVなどの変異を目的とする。例示的なSNVは、以下の遺伝子のうちの一つ又は複数中に存在し得る:種々の肺癌サンプル中において、変異している、コピー数が増加している又は他の遺伝子と融合している、及びその組み合わせであるものとして特定された、EGFR、FGFR1、FGFR2、ALK、MET、ROS1、NTRK1、RET、HER2、DDR2、PDGFRA、KRAS、NF1、BRAF、PIK3CA、MEK1、NOTCH1、MLL2、EZH2、TET2、DNMT3A、SOX2、MYC、KEAP1、CDKN2A、NRG1、TP53、LKB1及びPTEN(Non-small-cell lung cancers:a heterogeneous set of diseases.Chen et al.Nat.Rev.Cancer.2014 Aug 14(8):535-551)。他の実施例においては、遺伝子の一覧は上記に列記したものであって、SNVは引用したChen et al.の参照文献等で報告されている。
8.分析方法の例示的な実施形態
8.1 癌を検出するための例示的な実施形態
特定の実施形態では、循環腫瘍核酸が存在するか否かを決定する方法における分析工程は、癌において異数性を呈することが判明している染色体セグメントのセットを分析することを含む。特定の実施形態では、循環腫瘍核酸が存在するか否かを決定する方法における分析工程は、1,000~50,000個、または100~1000個の倍数性に関する多形座位を分析することを含む。特定の実施形態では、循環腫瘍核酸が存在するか否かを決定する方法における分析工程は、100~1000個の一塩基バリアント部位を分析することを含む。例えば、これらの実施形態では、分析工程は、マルチプレックスPCRを実施して、1000~50,000個のポリマー座位および100~1000個の一塩基バリアント部位にわたってアンプリコンを増幅することを含む。この多重化反応は、1回の反応として、または異なるサブセットの多重化反応のプールとして設定することができる。本明細書に開示される大規模マルチプレックスPCRなど、本明細書に提供される多重化反応は、多重化を改善し、それに伴い感度レベル改善の実現を補助する増幅反応を実施するための例示的プロセスを提供する。
特定の実施形態では、マルチプレックスPCR反応は、限定的プライマー条件下で、反応の少なくとも10%、20%、25%、50%、75%、90%、95%、98%、99%、または100%に対して実施される。本明細書に提供される大規模な多重化反応を実施するための改善条件を使用することができる。
特定の態様では、循環腫瘍核酸が個体中のサンプルに存在するか否かを決定するための上記の方法、およびその全ての実施形態は、システムを用いて実施することができる。本開示は、当該方法を実施するための特定の機能的および構造的な特性に関する教示を提供する。非限定的な例として、システムは以下を含む:
サンプルからのデータを分析して、個体中の染色体セグメント上の多型座位セットでの倍数性を決定するように構成された入力プロセッサ;および
多型座位に存在するアレル不均衡のレベルを、倍数性の決定に基づき決定するよう構成されたモデラ―であって、この場合において0.5%以上のアレル不均衡は、循環の存在を示す。
8.2 一塩基バリアントを検出するための例示的な実施形態
特定の態様では、本明細書において、一塩基バリアントを検出するための方法が提供される。本明細書に提供される改善方法は、サンプル中の0.015、0.017、0.02、0.05、0.1、0.2、0.3、0.4、または0.5パーセントのSNVの検出限界を実現することができる。SNVを検出するための全ての実施形態が、システムを用いて実施することができる。本開示は、当該方法を実施するための特定の機能的および構造的な特性に関する教示を提供する。さらに本明細書において、処理デバイスにより実行されたとき、当該処理デバイスに、本明細書に提供されるSNVの検出方法を実行させるコンピューター可読コードを含む非一時的コンピューター可読媒体を含む実施形態が提供される。
したがって、一つの実施形態において、一塩基バリアントが個体由来のサンプル中のゲノム位置セットに存在に存在するか否かを決定するための方法が本明細書において提供され、当該方法は、各ゲノム位置に対し、当該ゲノム位置に及ぶアンプリコンの効率および1サイクル当たりのエラー率の推定を生成すること、トレーニングデータセットを使用すること、サンプル中の各ゲノム位置に対し実測されたヌクレオチド固有性情報を受信すること、各ゲノム位置で一つ以上の真の変異から生じた一塩基バリアントのパーセントの確率セットを、各ゲノム位置で実測されたヌクレオチド固有性情報と、様々なバリアントのパーセントのモデルとを、各ゲノム位置に対して独立して推定された増幅効率と1サイクル当たりのエラー率を使用して決定すること、および各ゲノム位置に対する確率セットから最も可能性の高い真のバリアントのパーセントと信頼度を決定すること、を含む。
一塩基バリアントが存在するか否かを決定する方法の例示的実施形態において、効率および1サイクル当たりのエラー率の推定は、ゲノム位置に及ぶアンプリコンセットに対して生成される。例えば、ゲノム位置に及ぶ2個、3個、4個、5個、10個、15個、20個、25個、50個、100個、またはそれ以上のアンプリコンが含有され得る。
一塩基バリアントが存在するか否かを決定する方法の例示的な実施形態において、実測されたヌクレオチド固有性情報には、各ゲノム位置に対し実測された総リード数、および各ゲノム位置に対し実測されたバリアントアレルのリード数が含まれる。
一塩基バリアントが存在するか否かを決定する方法の例示的な実施形態において、サンプルは血漿サンプルであり、一塩基バリアントは、サンプルの循環腫瘍DNA中に存在する。一塩基バリアントが存在するか否かを決定する方法の例示的な実施形態において、サンプルは血漿サンプルであり、一塩基バリアントは、サンプルの循環胎児DNA中に存在する。
別の実施形態では、本明細書において、個体由来のサンプル中に存在する一塩基バリアントのパーセントを推定する方法が提供される。当該方法は、以下の工程を含む:ゲノム位置セットで、当該ゲノム位置に及ぶ一つ以上のアンプリコンに対する効率と1サイクル当たりのエラー率の推定を生成する工程、トレーニングデータセットを使用する工程、サンプル中の各ゲノム位置に対し実測されたヌクレオチド固有性情報を受信する工程、当該アンプリコンの増幅効率と1サイクル当たりのエラー率を使用して、真の変異分子の初期パーセントを含む検索スペースに対し、分子の総数、バックグラウンドのエラー分子、および真の変異分子の推定される平均と分散を生成する工程、および推定される平均と分散を使用した分布を、サンプル中の実測ヌクレオチド固有性情報に適合させることにより最も可能性の高い真の一塩基バリアントのパーセントを決定する工程により、真の変異から生じたサンプル中に存在する一塩基バリアントのパーセントを決定する工程、を含む。
本発明の当該実施形態に関するトレーニングデータセットには、好ましくは健常な個体群からのサンプルが含まれる。特定の例示的な実施形態では、トレーニングデータセットは、一つ以上の試験中サンプルと同じ日に、さらには同じ実行で分析される。例えば、2、3、4、5、10、15、20、25、30、36、48、96、100、192、200、250、500、1000またはそれ以上の健康な個体群からのサンプルを使用して、トレーニングデータセットが生成され得る。より多くの健康な個体、例えば、96以上のデータが利用可能である場合、試験中サンプルに当該方法を実施する前にランが実行されたとしても、増幅効率の推定に対する信頼度は増加する。PCRエラー率は、アンプリコン当たりのエラー率であるため、SNV塩基の位置だけでなく、SNV周囲の全体的な増幅領域に対しても生成される核酸配列情報を使用することができる。例えば、50の個体由来のサンプルを使用し、SNV周囲の20塩基対のアンプリコンをシーケンスすることで、1000塩基リードからのエラー頻度データを使用して、エラー頻度率を決定することができる。
典型的には、増幅効率は、増幅されたセグメントに対する増幅効率の平均および標準偏差を推定し、その後、それを例えば二項分布またはベータ二項分布などの分布モデルに適合させることにより推定する。サイクル数が判明しているPCR反応に対してエラー率が決定され、その後、1サイクル当たりのエラー率が推定される。
特定の例示的な実施形態では、試験データセットの開始分子の推定は、実測リード数が推定リード数と大幅に異なる場合に、工程(b)で推定された開始分子数を使用して、試験データセットに対する効率の推定値を更新することをさらに含む。その後、新しい効率および/または開始分子に対して推定が更新され得る。
分子、バックグラウンドエラー分子、および真の変異分子の総数を推定するために使用される検索スペースは、SNV塩基であるSNV位置の塩基のコピー数の下限に対し、0.1%、0.2%、0.25%、0.5%、1%、2.5%、5%、10%、15%、20%、または25%、および上限に対し、1%、2%、2.5%、5%、10%、12.5%、15%、20%、25%、50%、75%、90%、または95%からの検索スペースを含み得る。低域である下限に対する0.1%、0.2%、0.25%、0.5%、または1%、および高域である上限の1%、2%、2.5%、5%、10%、12.5%、または15%は、当該方法が循環腫瘍DNAを検出している血漿試料の例示的実施例に使用され得る。高域は、腫瘍サンプルに使用される。
分布は、総分子中の総エラー分子数(バックグラウンドエラーと真の変異)に対して適合され、検索スペース中の可能性のある真の変異の各々に対する尤度または確率が計算される。この分布は、二項分布またはベータ二項分布であり得る。
最も可能性の高い真の変異は、最も可能性の高い真の変異のパーセントを決定し、分布適合からのデータを使用して信頼度を計算することにより決定される。例示的な例として、および本明細書に提供される方法の臨床的な解釈の限定ではなく、平均変異率が高い場合、SNVの陽性判定を行うために必要な信頼度は低くなる。例えば、最も可能性の高い仮説を使用したサンプル中のSNVの平均変異率が5%であり、信頼度が99%である場合、陽性SNV分類が行われる。他方で、この例示的な例に関し、最も可能性の高い仮説を使用したサンプル中のSNVの平均変異率が1%であり、信頼度が50%である場合、特定の状況では、陽性SNV分類は行われない。データの臨床的解釈は、感度、特異性、有病率、および代替品の利用可用性の関数であることを理解されたい。
別の実施形態では、本明細書において、個体由来の試験サンプル中の一つ以上の一塩基バリアントを検出する方法が提供される。当該実施形態による方法は、以下の工程を含む:
複数の各正常個体からの複数の対照サンプルのバリアントアレル頻度の中央値を、シーケンスランで生成された結果に基づき一塩基バリアントの位置セット中の各位置塩基バリアントの位置に対して決定し、閾値を下回る正常サンプル中のアレルバリアント頻度の中央値を有する選択された一塩基バリアントを特定し、一塩基バリアント位置の各々に対する外れサンプルを除去した後、一塩基バリアント位置の各々に対するバックグラウンドエラーを決定する工程、試験サンプルのシーケンスランで生成されたデータに基づき、試験サンプルに関して、選択された一塩基バリアント位置に対する実測リード深度で加重された平均および分散を決定する工程、およびコンピューターを使用して、当該位置のバックグラウンドエラーと比較して統計的に有意なリード深度加重平均を伴う一塩基バリアント位置を一つ以上特定し、それにより一つ以上の一塩基バリアントを検出する工程。
一つ以上のSNVを検出するための当該方法の特定の実施形態では、複数の対照サンプルは、少なくとも25個のサンプルを含む。特定の例示的な実施形態では、複数の対照サンプルは、下限に対しては少なくとも5、10、15、20、25、50、75、100、200、または250個のサンプル、および上限に対しては10、15、20、25、50、75、100、200、250、500、および1000個のサンプルである。
一つ以上のSNVを検出するための当該方法の特定の実施形態では、ハイスループットシーケンスで生成されたデータから外れ値を削除し、実測リード深度で加重された平均、および実測分散が決定される。一つ以上のSNVを検出するための当該方法の特定の実施形態では、試験サンプルの一塩基バリアント位置の各々に対するリード深度は、少なくとも100リードである。
一つ以上のSNVを検出するための当該方法の特定の実施形態では、シーケンスランは、限定されたプライマー反応条件下で実施される多重化増幅反応を含む。本明細書に提供される多重化増幅反応を実施するための改善方法を使用して、例示的実施形態におけるこれら実施形態を実施する。
理論により制限されるものではないが、本発明方法は、正常血漿サンプルを使用したバックグラウンドエラーモデルを利用するものであり、当該正常血漿サンプルは、試験サンプルと同じシーケンスランでシーケンスされ、ラン特異的なアーチファクトを説明するものである。例えば、>0.1%、0.2%、0.25%、0.5%、0.75%、および1.0%などの閾値を超える正常バリアントアレル頻度の中央値を有するノイズ位置が除去される。
外れ値のサンプルは、ノイズおよび混入を説明するモデルから繰り返し取り除かれる。全てのゲノム座位の塩基置換毎に、リード深度で加重された平均およびエラー標準偏差が計算される。特定の例示的実施形態では、例えば、少なくとも2、3、4、5、6、7、8、9、10、15、20、25、50、100、250、500、または1000個のバリアントリードなどの少なくとも閾値のリード数、および特定の実施形態ではバックグラウンドエラーモデルに対して2.5、5、7.5、または10よりも高いa1 Zスコアを有する一塩基バリアント位置を含む、例えば循環胎児細胞、循環腫瘍細胞またはセルフリー血漿サンプルなどのサンプルは、候補変異として計数される。
特定の実施形態では、範囲の下限に対して、100、250、500、1,000、2000、2500、5000、10,000、20,000、25,0000、50,000、または100,000よりも高いリード深度、および範囲の上限に対して、2000、2500、5,000、7,500、10,000、25,000、50,000、100,000、250,000、または500,000よりも高いリード深度が、一塩基バリアント位置セット中の各一塩基バリアント位置に対するシーケンスランにおいて獲得される。典型的には、シーケンスランは、ハイスループットシーケンスのランである。例示的な実施形態では、試験サンプルに対して生成された平均値または中央値は、リード深度により加重される。したがって、1000リードで検出された一つのバリアントアレルを有するサンプルにおいて、バリアントアレルの決定は真である尤度は、10,000リードで検出された一つのバリアントアレルを有するサンプルよりも高く重み付けされる。100%の信頼度を伴ってバリアントアレル(すなわち、変異)の決定が為されるわけではないため、特定された一塩基バリアントは、候補バリアントまたは候補変異とみなされ得る。
8.3 相決定されたデータの分析のための例示的な検定統計量
遺伝的に同一ではない二つ以上の細胞を起源とするDNAまたはRNAを含有する混合サンプルであると判明している、または推測されるサンプルの相決定されたデータの分析に関する例示的な検定統計量を、以下に記載する。fは、例えば対象となるCNVを伴うDNAもしくはRNAの割合、または例えば癌細胞などの対象となる細胞からのDNAもしくはRNAの割合といった、対象となるDNAまたはRNAの割合を示す。癌検査の一部の実施形態において、fは、癌細胞と正常細胞の混合物中の癌細胞に由来するDNAまたはRNAの割合を示し、またはfは、癌細胞と正常細胞の混合物中の癌細胞の割合を示す。これは対象となる細胞に由来するDNAの割合を指し、2コピーのDNAが対象となる細胞の各々から与えられると仮定していることに留意されたい。これは、欠失または重複したセグメントでの対象となる細胞に由来するDNA割合とは異なる。
各SNPの可能性のあるアレルは、AおよびBと示される。AA、AB、BA、およびBBを使用して、全ての可能性のある順序でのアレル対が示される。一部の実施形態において、ABまたはBAの順序のアレルを有するSNPが分析される。Nは、i番目のSNPのシーケンスリードの数を示し、AおよびBは、それぞれ、アレルAおよびBを示す、i番目のSNPのリード数を示す。以下が仮定される:
=A+B
アレル比率Rが規定される:
Figure 2022519159000008
Tは、標的とされるSNPの数を示す。
普遍性を失うことなく、一部の実施形態は、一つの染色体セグメントに焦点を当てる。さらなる明確性の問題として、明細書において「第二の相同染色体セグメントと比較された第一の相同染色体セグメント」という文言は、染色体セグメントの第一のホモログと、染色体セグメントの第二のホモログを意味する。一部の実施形態では、標的SNPのすべてが、対象となる染色体セグメントに含有される。他の実施形態では、複数の染色体セグメントが、コピー数変動の可能性について分析される。
MAP推定
この方法は、標的セグメントの欠失または重複を検出するために、順序付けられたアレルを介した相決定の知識を活用する。各SNP iについて、定義する
Figure 2022519159000009
次いで、定義する
Figure 2022519159000010
様々なコピー数仮説(例えば二染色体、第一もしくは第二のホモログの欠失、または第一もしくは第二のホモログの重複に関する仮説)の下でのXおよびSの分布が以下に記載される。
二染色体仮説
標的セグメントが欠失または重複していない仮説の下、
Figure 2022519159000011
式中、
Figure 2022519159000012
リードNの深度が一定であると仮定すると、以下のパラメータを伴う二項分布Sが与えられる
Figure 2022519159000013
欠失仮説
第一のホモログが欠失している(すなわち、AB SNPが、Bとなり、BA SNPがAとなる)仮説の下、Rは、AB SNPに対してパラメータ
Figure 2022519159000014
ならびにBA SNPに対してパラメータ
Figure 2022519159000015
を伴い、二項分布を有する。したがって、
Figure 2022519159000016
リードNの深度が一定であると仮定すると、以下のパラメータを伴う二項分布Sが与えられる
Figure 2022519159000017
第二のホモログが欠失している(すなわち、AB SNPが、Aとなり、BA SNPがBとなる)仮説の下、Rは、AB SNPに対してパラメータ
Figure 2022519159000018
ならびにBA SNPに対してパラメータ
Figure 2022519159000019
を伴い、二項分布を有する。したがって、
Figure 2022519159000020
リードNの深度が一定であると仮定すると、以下のパラメータを伴う二項分布Sが与えられる
Figure 2022519159000021
重複仮説
第一のホモログが重複している(すなわち、AB SNPが、AABとなり、BA SNPがBBAとなる)仮説の下、Rは、AB SNPに対してパラメータ
Figure 2022519159000022
ならびにBA SNPに対してパラメータ
Figure 2022519159000023
を伴い、二項分布を有する。したがって、
Figure 2022519159000024
リードNの深度が一定であると仮定すると、以下のパラメータを伴う二項分布Sが与えられる
Figure 2022519159000025
第二のホモログが重複している(すなわち、AB SNPが、ABBとなり、BA SNPがBAAとなる)仮説の下、Rは、AB SNPに対してパラメータ
Figure 2022519159000026
ならびにBA SNPに対してパラメータ
Figure 2022519159000027
を伴い、二項分布を有する。したがって、
Figure 2022519159000028
リードNの深度が一定であると仮定すると、以下のパラメータを伴う二項分布Sが与えられる
Figure 2022519159000029
分類
上記のセクションで示されたように、Xは、バイナリ確率変数である。
Figure 2022519159000030
これにより、各仮説下での検定統計量Sの確率を計算することができる。測定データを与えられた各仮説の確率を計算することができる。一部の実施形態において、最も高い確率の仮説が選択される。望ましい場合、Sの分布は、各Nを一定のリード深度Nで概算するか、またはリード深度を定数Nまで切り捨てることにより、単純化することができる。この単純化により、与えられる。
Figure 2022519159000031
fの値は、測定データを与えられたfの最も可能性の高い値、例えば、最尤推定、最大事後確率推定またはベイズ推定など、アルゴリズム(例えば、検索アルゴリズム)を使用して最良データ適合を生じさせるfの値を選択することにより推定することができる。一部の実施形態では、複数の染色体セグメントが分析され、fの値は各セグメントのデータに基づき推定される。すべての標的細胞がこれらの重複または欠失を有する場合、これら様々なセグメントのデータに基づくfの推定値は類似する。一部の実施形態では、fは、例えば、癌性と非癌性のDNAまたはRNAの間のメチル化の差異(低メチル化または高メチル化)に基づいて、癌細胞からDNAまたはRNAの割合を決定することにより、実験的に測定される。
単一仮説の棄却
二染色体仮説に対するSの分布は、fに依存しない。ゆえに測定されたデータの確率は、fを計算することなく、二染色体仮説に対して計算することができる。単一仮説棄却の検定を、二染色体のヌル仮説に使用することができる。一部の実施形態において、二染色体仮説下のSの確率が計算され、当該確率が所与の閾値(例えば、1,000分の1未満)を下回る場合、当該二染色体仮説は棄却される。これは、染色体セグメントの重複または欠失が存在することを示す。望ましい場合、閾値を調整することにより偽陽性率を変えることができる。
8.4 相決定されたデータの分析のための例示的方法
遺伝的に同一ではない二つ以上の細胞を起源とするDNAまたはRNAを含有する混合サンプルであると判明している、または推測されるサンプルからのデータの分析に関する例示的な方法を、以下に記載する。一部の実施形態において、相決定されたデータが使用される。一部の実施形態では、当該方法は、計算された各アレル比率に関し、当該計算されたアレル比率が、予測されたアレル比率を上回るか、または下回るか、および特定の座位について差異の程度を決定することを伴う。一部の実施形態では、特定の仮説について、座位でのアレル比率の尤度分布が決定され、計算されたアレル比率が、尤度分布の中心に近いほど、仮説が正しい可能性が高くなる。一部の実施形態では、当該方法は、各座位に関し、仮説が正しい尤度を決定することを伴う。一部の実施形態では、当該方法は、各座位に関し、仮説が正しい尤度を決定すること、および各座位に対する仮説の確率を組み合わせることを含み、最も高い組み合わせ確率を有する仮説が選択される。一部の実施形態では、当該方法は、各座位に関し、仮説が正しい尤度を決定すること、および一つ以上の標的細胞のDNAまたはRNAと、サンプル中の総DNAまたは総RNAの可能性のある各比率を決定することを伴う。一部の実施形態では、各仮定に対する組み合わせ確率は、各座位に対する当該仮説の確率と、可能性のある各比率を組み合わせることにより決定され、最も高い組み合わせ確率を有する仮説が選択される。
一つの実施形態では、以下の仮説が検討される:H11(すべての細胞が正常である)、H10(ホモログ1のみを有し、ホモログ2を欠失する細胞の存在)、H01(ホモログ2のみを有し、ホモログ1を欠失する細胞の存在)、H21(ホモログ1の重複を有する細胞の存在)、H12(ホモログ2の重複を有する細胞の存在)。例えば癌細胞またはモザイク細胞などの標的細胞の割合f(または標的細胞からのDNAまたはRNAの割合)に対し、ヘテロ接合性(ABまたはBA)のSNPの予測アレル比率は、以下のように見出すことができる:
式(1):
Figure 2022519159000032
バイアス、混入およびシーケンスエラーの補正:
SNPでの実測Dは、各アレルが存在する元のマッピングされたリードの数、n およびn からなる。次に、AおよびBのアレル増幅における予測バイアスを使用して、補正されたリードnおよびnを見出すことができる。
は、大気混入(例えば、空気中または環境中のDNAからの混入)を示し、r(c)は、大気混入に対するアレル比率(最初は0.5とされる)を示す。さらに、cは、遺伝子型決定時の混入率(例えば、別のサンプルからの混入など)を示し、r(c)は、混入物に対するアレル比率である。s(A,B)およびs(B,A)は、一つのアレルを異なるアレルに分類するシーケンスエラーを示す(例えば、Bアレルが存在するときに、Aアレルを間違って検出するなど)。
大気混入、遺伝子型決定時の混入、およびシーケンスエラーを補正することにより、所与の予測される比率にr対する実測アレル比率q(r、c、r(c)、c、r(c)、s(A,B)、s(B,A))を見出すことができる。
混入遺伝子型は不明であるため、集団頻度を使用してP(r(c))を見出すことができる。より具体的には、pを、アレルのうちの一つ(参照アレルと呼称される場合もある)の集団頻度とする。次に、P(r(c)=0)=(1-p)、P(r(c)=0)=2p(1-p)およびP(r(cg)=0)=pとする。r(c)に対する条件付き期待値を使用して、E[q(r、c、r(c)、c、r(c)、s(A,B)、s(B,A))]を決定することができる。大気混入および遺伝子型決定時の混入は、ホモ接合性のSNPを使用して決定されるため、欠失または重複の存在の有無に影響を受けないことに留意されたい。さらに所望に応じて、参照染色体を使用して大気混入および遺伝子型決定時の混入を測定することも可能である。
各SNPの尤度:
以下の方程式は、アレル比率rとした場合のnおよびnを観察する確率を与える式である:
式(2):
Figure 2022519159000033
は、SNP sのデータを示す。各仮説のh ε{H11、H01、H10、H21、H12}について、式(1)においてr=r(AB,h)またはr=r(BA,h)とすることができ、r(c)に対する条件付き期待値を見出して、実測アレル比率のE[q(r、c、r(c)、c、r(c))]を決定することができる。次いで、式(2)において、r=E[q(r、c、r(c)、c、r(c)、s(A,B)、s(B,A))]とすることで、P(D|h,f)を決定することができる。
検索アルゴリズム:
一部の実施形態では、外れ値であるように見えるアレル比率を有するSNPは、無視される(例えば、平均値よりも少なくとも2または3標準偏差上回る、または下回るアレル比率を有するSNPを無視または除外する)。この方法で特定される利点は、モザイク化割合が高い場合に、アレル比率の変動性も高い場合があり、ゆえにモザイク化が原因でSNPが除外されないことであることに留意されたい。
F={f,….,f}は、モザイク割合(例えば、腫瘍または胎児の割合)の検索スペースを示す。各SNP sおよびf ε FでのP(D|h,f)を決定することができ、およびすべてのSNPの誘導を組み合わせることができる。
アルゴリズムは、各仮説の各fを探索する。検索方法を使用して、欠失仮説または重複仮説の信頼度が、無欠失仮説または無重複仮説の信頼度よりも高い、fの範囲F*が存在する場合、モザイク化が存在すると結論付ける。一部の実施形態において、F*におけるP(D|h,f)に対する最大尤度推定値が決定される。望ましい場合、f ε F*に対する条件付き期待値が決定されてもよい。望ましい場合、各仮説の信頼度を決定することができる。
一部の実施形態において、ベータ二項分布が、二項分布の代わりに使用される。一部の実施形態では、参照染色体または参照染色体セグメントを使用して、ベータ二項分布のサンプル特異的パラメータが決定される。
8.5 相決定されたデータを用いずに欠失および重複を検出するための例示的な方法
一部の実施形態では、相決定されていない遺伝子データを使用して、個体のゲノム(例えば、一つ以上の細胞中のゲノム、またはcfDNAもしくはcfRNA)中の第二の相同染色体セグメントと比較して、第一の相同染色体セグメントのコピー数の過剰出現があるかを決定される。一部の実施形態において、相決定された遺伝子データが使用されるが、相は無視される。一部の実施形態において、DNAまたはRNAのサンプルは、二つ以上の遺伝的に異なる細胞に由来するcfRNAまたはcfRNAを含む、個体由来のcfDNAまたはcfRNAの混合サンプルである。一部の実施形態において、当該方法は、各座位に対する計算アレル比率と、予測アレル比率の間の差異の大きさを利用する。
一部の実施形態では、当該方法は、個体からの一つ以上の細胞に由来するDNAまたはRNAのサンプル中の染色体または染色体セグメント上の多型座位のセットでの遺伝子データを、各座位の各アレルの量を測定することにより取得することを伴う。一部の実施形態では、アレル比率は、サンプルが誘導された少なくとも一つの細胞においてヘテロ接合性である座位に対して計算される。一部の実施形態では、特定の座位に対し計算されたアレル比率は、当該アレルのうちの一つの測定量を、当該座位のすべてのアレルに対して計算された合計量により割ったものである。一部の実施形態では、特定の座位に対する計算されたアレル比率は、当該アレルのうちの一つ(例えば、第一の相同染色体セグメント上のアレル)の測定量を、当該座位の一つ以上の他のアレル(例えば、第二の相同染色体セグメント上のアレル)の測定量により割ったものである。計算されたアレル比率および予測アレル比率は、本明細書に記載される方法のいずれかを使用して、または任意の標準的な方法(例えば、本明細書に記載される計算アレル比率または予測アレル比率の任意の数学的変換など)を使用して計算されてもよい。
一部の実施形態において、検定統計量は、各座位に対する計算アレル比率と、予測アレル比率の間の差異の大きさに基づいて計算される。一部の実施形態において、検定統計量Δは、以下の式
Figure 2022519159000034
を使用して計算される。
式中、δは、i番目の座位に対する計算アレル比率と、予測アレル比率の間の差異の大きさであり;
式中、μは、δの平均値であり;および
式中、σ は、δi・の標準偏差である。
例えば、予測アレル比率が0.5である場合、以下のようにδを規定することができる。
Figure 2022519159000035
μおよびσの値は、Rが二項確率変数であるという事実を使用してコンピューター計算することができる。一部の実施形態では、標準偏差は、すべての座位に関して同じであると仮定される。一部の実施形態では、標準偏差の平均値もしくは加重平均値、または標準偏差の推定値は、σ の値に使用される。一部の実施形態では、検定統計量は、正規分布を有すると仮定される。例えば、中心極限定理とは、座位の数(例えば、SNPs Tの数など)が大きくなるにつれ、Δの分布が標準的正規に収束することを意味する。
一部の実施形態では、一つ以上の細胞のゲノム中の染色体または染色体セグメントのコピー数を指定する一つ以上の仮説のセットが列挙される。一部の実施形態では、検定統計量に基づき最も可能性が高い仮説が選択され、それに伴い一つ以上の細胞のゲノム中の染色体または染色体セグメントのコピー数が決定される。一部の実施形態では、検定統計量が、当該仮説に対する検定統計量の分布に属する確率が、上限閾値を上回る場合に仮説が選択される。検定統計量が、当該仮説に対する検定統計量の分布に属する確率が、下限閾値を下回る場合に当該仮説の一つ以上が棄却される。または検定統計量が、当該仮説に対する検定統計量に属する確率が、下限閾値と上限閾値の間にある場合、または当該確率が、充分に高い信頼度で決定されない場合、仮説は選択も棄却もされない。一部の実施形態では、上限および/または下限の閾値は、例えばトレーニングデータ(例えば、二倍体サンプルなどのコピー数が判明しているサンプル、または特定の欠失または重複を有することが判明しているサンプルなど)からの分布など、経験分布から決定される。そのような経験分布を使用して、単一仮説の棄却検定に対する閾値を選択することができる。検定統計量Δは、Sから独立しているため、必要に応じて両方を独立して使用できることに留意されたい。
8.6 アレルの分布またはパターンを使用した欠失および重複を検出するための例示的な方法
本項は、第二の相同染色体セグメントと比較して、第一の相同染色体セグメントのコピー数が過剰出現しているかを決定する方法を含む。一部の実施形態では、当該方法は、(i)個体の一つ以上の細胞(例えば癌細胞)のゲノム中に存在する染色体または染色体セグメントのコピー数を指定する複数の仮説、または(ii)個体の一つ以上の細胞のゲノム中の第二の相同染色体セグメントと比較した場合の、第一の相同染色体セグメントのコピー数の過剰出現の程度を指定する複数の仮説を列挙することを伴う。一部の実施形態では、当該方法は、染色体または染色体セグメント上の複数の多型座位(例えば、SNP座位)の個体由来の遺伝子データを取得することを伴う。一部の実施形態では、各仮説について、予測される個体の遺伝子型の確率分布が生成される。一部の実施形態では、取得された個体の遺伝子データと、予測される個体の遺伝子型の確率分布との間のデータ適合が計算される。一部の実施形態では、一つ以上の仮説が、当該データ適合に従いランク付けされ、最高位にランク付けされた仮説が選択される。一部の実施形態では、例えば検索アルゴリズムなどの技術またはアルゴリズムが、以下の工程のうちの一つ以上に使用される:データ適合の計算、仮説のランク付け、または最高位にランク付けされた仮説の選択。一部の実施形態では、データ適合は、ベータ二項分布に対する適合であるか、または二項分布に対する適合である。一部の実施形態では、最尤推定、最大事後確率の推定、ベイズ推定、動的推定(例えば動的ベイズ推定)、および期待値最大化推定からなる群から技術またはアルゴリズムが選択される。一部の実施形態では、当該方法は、当該技術またはアルゴリズムを、取得された遺伝子データまたは予測される遺伝子データに適用することを含む。
一部の実施形態では、当該方法は、(i)個体の一つ以上の細胞(例えば癌細胞)のゲノム中に存在する染色体または染色体セグメントのコピー数を指定する複数の仮説、または(ii)個体の一つ以上の細胞のゲノム中の第二の相同染色体セグメントと比較した場合の、第一の相同染色体セグメントのコピー数の過剰出現の程度を指定する複数の仮説を列挙することを伴う。一部の実施形態では、当該方法は、染色体または染色体セグメント上の複数の多型座位(例えば、SNP座位)の個体由来の遺伝子データを取得することを伴う。一部の実施形態では、遺伝子データは、複数の多型座位のアレル計数を含む。一部の実施形態では、各仮説について、染色体または染色体セグメント上の複数の多型座位で予測されるアレル計数に対する同時分布モデルが生成される。一部の実施形態では、一つ以上の仮説に対する相対的確率は、同時分布モデル、およびサンプルで測定されたアレル計数を使用して決定され、最も高い確率の仮説が選択される。
一部の実施形態では、アレルの分布またはパターン(例えば計算されたアレル比率のパターン)を使用して、例えば欠失または重複など、CNVの存在の有無が決定される。必要に応じて、CNVの親起源を、当該パターンに基づき決定することができる。
8.7 例示的な計数方法/定量的方法
一部の実施形態では、例えば染色体セグメントもしくは染色体全体の欠失または重複など、一つ以上のCNSを検出するために、一つ以上の計数方法(定量方法とも呼称される)が使用される。一部の実施形態では、一つ以上の計数方法を使用して、第一の相同染色体セグメントのコピー数の過剰出現が、第一の相同染色体セグメントの重複によるものか、または第二の相同染色体セグメントの欠失によるものかが決定される。一部の実施形態では、一つ以上の計数方法を使用して、重複している染色体セグメントまたは染色体の余剰なコピーの数が決定される(例えば、1、2、3、4またはそれ以上の余剰なコピーが存在するか否か)。一部の実施形態では、一つ以上の計数方法を使用して、多数の重複と少量の腫瘍割合を有するサンプルと、少数の重複と多量の腫瘍割合を有するサンプルを識別する。例えば、一つ以上の計数方法を使用して、四つの余剰な染色体コピーと10%の腫瘍割合を有するサンプルと、二つの余剰な染色体コピーと20%の腫瘍割合を有するサンプルを識別する。例示的な方法は、例えば、米国特許公開2007/0184467、2013/0172211、および2012/0003637、米国特許第8,467,976号、第7,888,017号、第8,008,018号、第8,296,076号、および第8,195,415号、2014年6月5日に出願された米国特許出願62/008,235、2014年8月4日に出願された米国出願62/032,785に開示されており、それら文献は各々その全体で参照により本明細書に組み込まれる。
一部の実施形態では、f値(例えば、腫瘍割合または胎児割合)がCNV決定において使用されて、例えば、二つの染色体または染色体セグメントの量の間の実測された差異と、fの値が与えられた特定のタイプのCNVに対して予測される差異が比較される(例えば、米国特許公開2012/0190020、米国特許公開2012/0190021、米国特許公開2012/0190557、米国特許公開2012/0191358を参照のこと。当該文献は各々その全体で参照により本明細書に組み込まれる)。例えば、腫瘍割合が増加するにつれ、二染色体性の参照染色体セグメントと比較して、腫瘍中で重複される染色体セグメントの量における差異も増加する。一部の実施形態では、当該方法は、f値に対して、対象となる染色体または染色体セグメントの相対頻度を、参照染色体または参照染色体セグメント(例えば、二染色体性であることが予測または判明している染色体または染色体セグメント)と比較して、CNVの尤度を決定することを含む。例えば、様々な可能性のあるCNV(例えば、対象となる染色体セグメントの一つまたは二つの余剰コピーなど)について、第一の染色体または染色体セグメントと、参照染色体または参照染色体セグメントとの間の量の差異は、f値を考慮して予測される差異と比較することができる。
8.8 参照サンプルを使用した例示的な計数方法/定量的方法
一つ以上の参照サンプルを使用する例示的な定量的方法は、2014年6月5日に出願された米国特許出願62/008,235、および2014年8月4日に出願された米国特許出願62/032,785に記載されており、当該文献はその全体で参照により本明細書に組み込まれる。一部の実施形態では、一つ以上の染色体または対象となる染色体で、CNVをなにも有さない可能性が最も高い一つ以上の参照サンプルは、腫瘍DNA割合が最も高いサンプルを選択すること、ゼロに最も近いz-スコアを有するサンプルを選択すること、最も高い信頼度または尤度を有するCNVに対応しない仮説にデータが適合するサンプルを選択すること、正常であることが判明しているサンプルを選択すること、癌を有する尤度が最も低い個体(例えば、低年齢、乳癌スクリーニングの場合には男性、家族歴が無い、など)由来のサンプルを選択すること、DNAのインプット量が最も高いサンプルを選択すること、最も高いシグナルとノイズの比を有するサンプルを選択すること、癌を有する尤度と相関すると考えられている他の基準に基づきサンプルを選択すること、またはいくつかの基準の組み合わせを使用してサンプルを選択することにより、特定される。参照セットが選択された時点で、これらの事例が二染色体性であると仮定し、次いでSNPあたりのバイアス、すなわち各座位に対する実験特異的な増幅と他の処理バイアスを推定することができる。次いで、この実験特異的バイアスの推定を使用して、例えば第21番染色体の座位などの対象となる染色体および必要に応じて他の染色体の座位の測定におけるバイアスを、第21番染色体に関して二染色体性と仮定されている、サブセットの一部ではないサンプルに対して補正する。倍数性が不明なこれらサンプルにおいて、バイアスが補正されたら、次いでこれらサンプルのデータを、個体がトリソミー21に罹患しているかを決定する同一の方法または別の方法を使用して、2回分析することができる。例えば、定量的方法は、倍数性が不明の残りのサンプルに対して使用することができ、z-スコアは、第21番染色体の補正された測定遺伝子データを使用して計算することができる。あるいは、第21番染色体の倍数性の状態に関する予備的な推定の一部として、癌を有すると推測される個体に由来するサンプルの腫瘍割合を計算することができる。当該腫瘍割合を有する場合について、二染色体性の場合に予測される補正リードの割合(二染色体性仮説)、およびトリソミーの場合に予測される補正リードの割合(トリソミー仮説)を計算することができる。あるいは、過去に腫瘍割合が測定されなかった場合、異なる腫瘍割合について、二染色体仮説およびトリソミー仮説のセットを生成することができる。各例について、様々なDNA座位の選択と測定において予測される統計的変動を考慮し、補正リードの割合に関する予測分布を計算することができる。実測された補正リード割合は、予測補正リード割合の分布と比較することができ、倍数性が不明な各サンプルについて、二染色体仮説とトリソミー仮説に対して尤度比を計算することができる。最も高い計算尤度を有する仮説に関連付けられる倍数性の状態が、正しい倍数性の状態として選択され得る。
8.9 例示的な参照染色体または参照染色体セグメント
一部の実施形態では、本明細書に記載される方法のうちの任意の方法が、一つ以上の参照染色体または参照染色体セグメントに対して実施され、その結果は、対象となる一つ以上の染色体または染色体セグメントと比較される。
一部の実施形態では、参照染色体または参照染色体セグメントは、CNVが存在しないと予測されるものに対する対照として使用される。一部の実施形態では、参照は、当該染色体または染色体セグメントにおいて欠失または重複を有さないと判明している、または予測される一つ以上の様々なサンプルと同じ染色体または染色体セグメントである。一部の実施形態では、参照は、二染色体性であると予測される検査サンプルとは異なる染色体または染色体セグメントである。一部の実施形態では、参照は、検査される同一サンプル中の対象となる染色体のうちの一つに由来する異なるセグメントである。例えば、参照は、潜在的な欠失領域または重複領域の外側の一つ以上のセグメントであってもよい。検査される同一染色体上に参照があることによって、例えば代謝、アポトーシス、ヒストン、不活化および/または増幅における染色体間の差異など、異なる染色体間の変動が回避される。検査される染色体と同一の染色体上にCNVを有さないセグメントの分析を行い、代謝、アポトーシス、ヒストン、不活化、および/または増幅におけるホモログ間の差異を決定することができ、その結果、CNVの非存在下でのホモログ間の変動レベルが決定され、潜在的なCNVからの結果と比較することができる。一部の実施形態では、潜在的なCNVに関し、計算アレル比率と予測アレル比率の間の差異の程度は、参照に対して相当する程度よりも大きく、それによりCNVの存在が確認される。
一部の実施形態では、参照染色体または参照染色体セグメントは、例えば特に対象となる欠失または重複などのCNVが存在すると予測されるものに対する対照として使用される。一部の実施形態では、参照は、当該染色体または染色体セグメントにおいて欠失または重複を有すると判明している、または予測される一つ以上の様々なサンプルと同じ染色体または染色体セグメントである。一部の実施形態では、参照は、CNVを有すると判明または予測される検査サンプルとは異なる染色体または染色体セグメントである。一部の実施形態では、潜在的なCNVに関し、計算アレル比率と予測アレル比率の間の差異の程度は、CNVの参照に対して相当する程度よりも少なく(例えば、有意に違わない)、それによりCNVの存在が確認される。一部の実施形態では、潜在的なCNVに関し、計算アレル比率と予測アレル比率の間の差異の程度は、CNVの参照に対して相当する程度よりも小さく(例えば、有意に小さい)、それによりCNVの非存在が確認される。一部の実施形態では、癌細胞(またはcfDNAもしくはcfRNAなどの癌細胞に由来するDNAまたはRNA)の遺伝子型が、非癌性細胞(またはcfDNAもしくはcfRNAなどの非癌性細胞に由来するDNAまたはRNA)の遺伝子型とは異なる一つ以上の座位が使用されて、腫瘍割合が決定される。腫瘍割合を使用して、第一の相同染色体セグメントのコピー数の過剰出現が、第一の相同染色体セグメントの重複によるものか、または第二の相同染色体セグメントの欠失によるものかが決定され得る。さらに腫瘍割合を使用して、重複する染色体セグメントまたは染色体の余剰コピー数を決定して(例えば、1、2、3、4またはそれ以上の余剰コピーが存在するかを決定して)、例えば四つの余剰染色体コピーと10%の腫瘍割合を有するサンプルを、二つの余剰染色体コピーと20%の腫瘍割合を有するサンプルを識別することもできる。さらに腫瘍割合を使用して、可能性のあるCNVについて、実測データが、予測データにどの程度適合するかを決定することができる。一部の実施形態では、CNVの過剰出現の程度を使用して、個体に特定の治療法または治療レジメンが選択される。例えば一部の治療薬は、少なくとも四つ、六つ、またはそれ以上のコピー数の染色体セグメントに対してのみ有効である。
一部の実施形態では、腫瘍割合を決定するために使用される一つ以上の座位は、参照染色体または参照染色体セグメント、例えば二染色体性であることが判明もしくは予測される染色体または染色体セグメント、一般的に癌細胞で、または個体が有することが判明もしくは有するリスクが増している特定のタイプの癌で、稀に重複または欠失する染色体もしくは染色体セグメント、または異数性である可能性が低い染色体もしくは染色体セグメント(欠失または重複した場合、細胞死が生じると予測されるセグメント)にある。一部の実施形態では、本発明の方法のいずれかを使用して、参照染色体または染色体セグメントが、癌細胞および非癌性細胞の両方において二染色体性であることが確認される。一部の実施形態では、二染色体分類の信頼度が高い一つ以上の染色体または染色体セグメントが使用される。
腫瘍割合を決定するために使用され得る座位の例としては、個体の非癌性細胞(または非癌性細胞に由来するDNAまたはRNA)中に存在しない、癌細胞(または癌細胞に由来するcfDNAもしくはcfRNAなどのDNAまたはRNA)中の多型または変異(例えば、SNP)が挙げられる。一部の実施形態では、腫瘍割合は、個体からのサンプル(例えば、血漿サンプルまたは腫瘍生検)中の非癌性細胞(または非癌性細胞に由来するDNAまたはRNA)中には存在しないアレルを癌細胞(または癌細胞に由来するDNAまたはRNA)が有する多型座位を特定すること、および当該特定された多型座位のうちの一つ以上で癌細胞に固有のアレルの量を使用して、サンプル中の腫瘍割合を決定することにより決定される。一部の実施形態では、非癌性細胞は、多型座位で第一のアレルに関してホモ接合性であり、癌細胞は、多型座位で(i)第一のアレルと第二のアレルに関してヘテロ接合性であるか、または(ii)第二のアレルに関してホモ接合性である。一部の実施形態では、非癌性細胞は、多型座位で第一のアレルと第二のアレルに関してヘテロ接合性であり、癌細胞は、多型座位で(i)1コピーまたは2コピーの第三のアレルを有する。一部の実施形態では、癌細胞は、非癌性細胞には存在しないアレルを1コピーのみ有すると仮定され、または判明している。例えば、非癌性細胞の遺伝子型がAAであり、癌細胞がABであり、サンプル中の当該座位でのシグナルの5%がBアレル由来であり、95%がAアレル由来である場合、サンプルの腫瘍割合は、10%である。一部の実施形態では、癌細胞は、非癌性細胞には存在しないアレルを2コピー有すると仮定され、または判明している。例えば、非癌性細胞の遺伝子型がAAであり、癌細胞がBBであり、サンプル中の当該座位でのシグナルの5%がBアレル由来であり、95%がAアレル由来である場合、サンプルの腫瘍割合は、5%である。一部の実施形態では、非癌性細胞にはないアレルを癌細胞が有する複数の座位を分析して、癌細胞中の座位のいずれがヘテロ接合性であり、いずれがホモ接合性であるかが決定される。例えば、非癌性細胞がAAである座位について、Bアレルからのシグナルが、一部の座位では約5%、そして一部の座位では約10%である場合、癌細胞は、約5%のBアレルを有する座位でヘテロ接合性、約10%のBアレルを有する座位ではホモ接合性であると仮定される(腫瘍割合が約10%であることを示す)。
腫瘍割合の決定に使用され得る座位の例としては、癌細胞と非癌性細胞が共通して一つのアレルを有し得る座位(例えば、癌細胞がABであり、非癌性細胞がBBであるか、または癌細胞がBBであり、非癌性細胞がABである座位)が挙げられる。Aシグナルの量、Bシグナルの量、または混合サンプル(癌細胞と非癌性細胞に由来するDNAまたはRNAを含有する)中のAシグナルとBシグナルの比率は、(i)癌細胞のみに由来するDNAまたはRNAを含有するサンプル、または(ii)非癌性細胞のみに由来するDNAまたはRNAを含有するサンプル、に対応する値と比較される。値の差を使用して、混合サンプルの腫瘍割合が決定される。
一部の実施形態では、腫瘍割合の決定に使用され得る座位は、(i)癌細胞のみに由来するDNAまたはRNAを含有するサンプル、および/または(ii)非癌性細胞のみに由来するDNAまたはRNAを含有するサンプル、の遺伝子型に基づいて選択される。一部の実施形態では、座位は、混合サンプルの分析に基づいて選択され、例えば、各アレルの絶対量または相対量が、癌細胞と非癌性細胞の両方が特定の座位で同じ遺伝子型を有する場合に予測される量とは異なっている座位である。例えば、癌細胞と非癌性細胞が同じ遺伝子型を有する場合、座位は、全ての細胞がAAである場合に0%のBシグナル、全ての細胞がABである場合に50%のBシグナル、または全ての細胞がBBである場合に100%のBシグナルを生じさせると予測される。Bシグナルが他の値であれば、癌細胞と非癌性細胞の遺伝子型は、当該座位で異なっており、当該座位を使用して腫瘍割合を決定できることが示される。
一部の実施形態では、一つ以上の座位でのアレルに基づき計算された腫瘍割合は、本明細書に開示される計数方法のうちの一つ以上を使用して計算された腫瘍割合と比較される。
8.10 表現型の検出方法の例または多重変異分析方法の例
一部の実施形態では、当該方法は、疾患もしくは障害(例えば、癌)に関連する、または疾患もしくは障害のリスク増大に関連する変異のセットに関し、サンプルを分析することを含む。方法のシグナルとノイズの比を改善し、腫瘍を別個の臨床サブセットに分類するために使用され得るクラス(例えば、MまたはCの癌クラス)内での事象間には強い相関が存在する。例えば、一緒に検討される一つ以上の染色体または染色体セグメント上のいくつかの変異(例えば、いくつかのCNV)に対する不明確な結果は、非常に強いシグナルである場合がある。一部の実施形態では、対象となる複数の多型または変異(例えば、2、3、4、5、8、10、12、15、またはそれ以上)の有無を決定することにより、例えば癌などの疾患もしくは障害の有無、または例えば癌などの疾患もしくは障害を有するリスク増大の有無の決定の感度および/または特異度が増す。一部の実施形態では、複数の染色体にわたる事象間の相関を使用して、個々に各シグナルを検討するよりも強力にシグナルが検討される。方法自体の設計は、腫瘍を最もよくカテゴライズするよう最適化され得る。これは、一つの特定の変異/CNVに対する感受性が最も重要であり得る、再発の早期検出およびスクリーニングに非常に有用であり得る。一部の実施形態では、事象は必ずしも相関しているわけではなく、相関する確率を有している。一部の実施形態では、非対角線上の条件を有するノイズ共分散行列を伴う行列推定式が使用される。
一部の実施形態では、本発明は、個体の表現型(例えば、癌の表現型)を検出するための方法を特徴とし、当該表現型は、変異セットのうちの少なくとも一つの存在により規定される。一部の実施形態では、当該方法は、個体からの一つ以上の細胞に由来するDNAまたはRNAのサンプルに対し、DNAまたはRNAの測定値を取得することであって、当該細胞のうちの一つ以上が、表現型を有すると推測される、取得すること、および当該DNAまたは当該RNAの測定値を分析して、当該変異のセット中の各変異について、当該細胞の少なくとも一つが当該変異を有する尤度を決定することを含む。一部の実施形態では、当該方法は、(i)当該変異の少なくとも一つについて、当該細胞の少なくとも一つが当該変異を含有する尤度が、閾値よりも高く、または(ii)当該変異の少なくとも一つについて、当該細胞の少なくとも一つが当該変異を有する尤度が、閾値よりも低く、および当該変異の複数について、当該細胞の少なくとも一つが当該変異の少なくとも一つを有する組み合わせ尤度が、閾値よりも高い、のいずれかの場合に、当該個体が表現型を有すると決定することを含む。一部の実施形態では、一つ以上の細胞は、変異セット中のサブセットまたは全の変異を有する。一部の実施形態では、変異のサブセットは、癌に関連し、または癌のリスク増加に関連する。一部の実施形態では、変異セットは、癌変異のMクラスにおける変異のサブセットまたはすべてを含む(Ciriello,Nat Genet.45(10):1127-1133,2013,doi:10.1038/ng.2762、当該文献は参照によりその全体で本明細書に組み込まれる)。一部の実施形態では、変異セットは、癌変異のCクラスにおける変異のサブセットまたはすべてを含む(Ciriello、上記)。一部の実施形態では、サンプルは、セルフリーのDNAまたはRNAを含む。一部の実施形態では、DNAまたはRNAの測定値は、対象となる一つ以上の染色体または染色体セグメント上の多型座位のセットでの測定値(各座位での各アレルの量など)を含む。
8.11 方法の組み合わせの例
結果の精度を高めるために、CNVの有無を検出するための二つ以上の方法(例えば、本発明の方法のいずれかまたは任意の公知の方法)が実施される。一部の実施形態では、疾患もしくは障害の有無、または疾患もしくは障害のリスク増大を示す因子を分析する一つ以上の方法(例えば、本明細書に記載される方法または任意の公知の方法)が実施される。
一部の実施形態では、標準的な数学的技術を使用して、二つ以上の方法間の共分散および/または相関が計算される。さらに標準的な数学的手法を使用して、二つ以上の検定に基づく特定の仮説の複合確率を決定してもよい。例示的な技術としては、メタ分析、ナリシス、独立検定に対するフィッシャーの複合確率検定、既知の共分散と従属p値を組み合わせるブラウン法、および未知の共分散と従属p値を組み合わせるコスト(Kost)法が挙げられる。第二の方法に対して尤度が決定される場合に対して、ある意味で直交または非関連となる第一の方法により尤度が決定される場合、尤度を組み合わせることは単純であり、乗算または正規化により行うことができ、または例えば以下の式を使用して行うことができる:
comb=R/[R+(1-R)(1-R)]
combは、組み合わされた尤度であり、RおよびRは、個々の尤度である。例えば、方法1からのトリソミーの尤度が90%であり、方法2からのトリソミーの尤度が95%である場合、二つの方法からの結果を組み合わせることにより、臨床医は、(0.90)(0.95)/[(0.90)(0.95)+(1-0.90)(1-0.95)]
=99.42%の尤度で胎児がトリソミーであると結論づけることができる。第一および第二の方法が直交しない場合、すなわち、二つの方法の間に相関がある場合でも、尤度を組み合わせることができる。
複数の因子または変数を分析する方法の例は、2011年9月20日に発行された米国特許第8,024,128号、2006年7月31日に出願された米国公開第2007/0027636号、および2006年12月6日に出願された米国公開第2007/0178501号に開示されており、これらは参照によりその全体が本明細書に組み込まれる)。
様々な実施形態では、特定の仮説または診断の複合確率は、80、85、90、92、94、96、98、99、または99.9%よりも大きいか、または何らかの他の閾値よりも大きい。
8.12 遺伝子データを相決定するための例示的方法
一部の実施形態では、遺伝子データは、本明細書に記載される方法、または遺伝子データを相決定するための任意の公知の方法を使用して相決定される(例えば、2009年2月9日に出願されたPCT公開WO2009/105531、2009年8月4日に出願されたPCT公開WO2010/017214、2012年11月21日に出願された米国特許公開2013/0123120、2010年10月7日に出願された米国特許公開2011/0033862、2010年8月19日に出願された米国特許公開2011/0033862、2011年2月3日に出願された米国特許公開2011/0178719、2008年3月17日に出願された米国特許第8,515,679号、2006年11月22日に出願された米国特許公開2007/0184467、2008年3月17日に出願された米国特許公開2008/0243398、および2014年5月16日に出願された米国出願61/994,791を参照のこと。当該文献は各々参照によりその全体で本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、ハプロタイプ頻度に基づく集団を使用して、例えばHapMapベースの相決定など、最も可能性の高い相を推定するコンピュータープログラムを使用して相決定される。例えば、一倍体のデータセットは、一般集団(例えば、公開されたHapMap ProjectおよびPerlegen Human Haplotype Projectのために生成された集団)における公知のハプロタイプブロックを利用して、統計的方法を使用し二倍体データから直接推測されることができる。ハプロタイプブロックは本質的に様々な集団において繰り返し発生する一連の相関アレルである。これらハプロタイプブロックはしばしば古代から共通しているため、これらを使用して二倍体の遺伝子型からハプロタイプを予測する場合がある。このタスクを実現する、公開されて利用可能なアルゴリズムとしては、不完全系統法、共役事前確率分布に基づくベイズ法、および母集団の遺伝学的特徴からの事前確率分布に基づくベイズ法が挙げられる。これらのアルゴリズムの一部は、隠れマルコフモデルを使用する。
一つの実施形態では、個体の遺伝子データは、遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、局在化ハプロタイプクラスタリング(localized haplotype clustering、例えば、Browning and Browning,“Rapid and Accurate Haplotype Phasing and Missing-Data Inference for Whole-Genome Association Studies By Use of Localized Haplotype Clustering” Am J Hum Genet.Nov 2007;81(5):1084-1097を参照のこと。当該文献はその全体で参照により本明細書に組み込まれる)を使用して相決定される。例示的なプログラムは、Beagleのバージョン:3.3.2またはバージョン4である(hfaculty.washington.edu/browning/beagle/beagle.htmlで、ワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、距離、遺伝子型マーカーの順序と間隔、欠損データの補完、組み換え率の推定、またはそれらの組み合わせを伴う連鎖不平衡の減衰を使用するアルゴリズム(例えば、Stephens and Scheet,“Accounting for Decay of Linkage Disequilibrium in Haplotype Inference and Missing-Data Imputation” Am.J.Hum.Genet.76:449-462,2005を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、PHASEのv.2.1またはv2.1.1である(stephenslab.uchicago.edu/software.htmlでワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、集団の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、隠れマルコフモデルに従って、クラスター構成物質を染色体に沿って連続的に変化させるアルゴリズムを使用して相決定される。この方法は柔軟性があり、連鎖不平衡の「ブロック様」パターンと、距離がある連鎖不平衡の段階的な低下の両方に可能である(例えば、Scheet and Stephens,“A fast and flexible statistical model for large-scale population genotype data:applications to inferring missing genotypes and haplotypic phase.”Am J Hum Genet,78:629-644,2006を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、fastPHASEである(stephenslab.uchicago.edu/software.htmlでワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、例えば以下の参照データセットのうちの一つ以上を使用する方法など、遺伝子型補完方法を使用して相決定される:HapMapデータセット、複数のSNPチップ上で遺伝子型判定された対照データセット、および1,000ゲノムプロジェクトからの高密度型判定されたサンプル。例示的な方法は、正確性を高め、複数の参照パネルにわたって情報を組み合わせる柔軟なモデリングフレームワークである(例えば、Howie,Donnelly,and Marchini(2009)“A flexible and accurate genotype imputation method for the next generation of genome-wide association studies.”PLoS Genetics 5(6):e1000529,2009を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、IMPUTEまたはIMPUTEバージョン2(IMPUTE2としても知られる)である(mathgen.stats.ox.ac.uk/impute/impute_v2.htmlでワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、例えばPHASE v2.1においてStephensによって開発されたアルゴリズムなど、組み換えとの合体遺伝的モデルの下でハプロタイプを推測するアルゴリズムなどのハプロタイプを推測するアルゴリズムを使用して相決定される。主要なアルゴリズムの改善は、各個体の候補ハプロセットのセットを表す二分木の使用に依存する。これらの二分木の表現は、(1)PHASE v2.1で作成された冗長な動作を回避することによって、ハプロタイプの事後確率の計算速度を速める、および(2)二分木において最もらしい経路(すなわちハプロタイプ)のスマートな探索を行うことにより、ハプロタイプ推測問題に関する指数関数的な態様を克服する(例えば、Delaneau,Coulonges and Zagury,“Shape-IT:new rapid and accurate algorithm for haplotype inference,”BMC Bioinformatics 9:540,2008 doi:10.1186/1471-2105-9-540を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、SHAPEITである(mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.htmlでワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、集団の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、ハプロタイプ-断片頻度を使用して、より長いハプロタイプに対する実験ベースの確率を取得するアルゴリズムを使用して相決定される。一部の実施形態では、アルゴリズムはハプロタイプを再構築する。それによって、ハプロタイプは最大の局所的一貫性を有するようになる(例えば、Eronen,Geerts,and Toivonen,“HaploRec:Efficient and accurate large-scale reconstruction of haplotypes,”BMC Bioinformatics 7:542,2006を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、HaploRec、例えばHaploRecのバージョン2.3である(cs.helsinki.fi/group/genetics/haplotyping.htmlでワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、集団の遺伝子型データからハプロタイプを推定するアルゴリズム、例えばパーティション-ライゲーション戦略を使用するアルゴリズム、および期待値最大化ベースのアルゴリズムなどのアルゴリズムを使用して相決定される(例えば、Qin,Niu,and Liu,“Partition-Ligation-Expectation-Maximization Algorithm for Haplotype Inference with Single-Nucleotide Polymorphisms,”Am J Hum Genet.71(5):1242-1247,2002を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、PL-EMである(people.fas.harvard.edu/~junliu/plem/click.htmlでワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、集団の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、遺伝子型をハプロタイプとブロック分割に同時に相決定するアルゴリズムなどのアルゴリズムを使用して相決定される。一部の実施形態では、期待値最大化アルゴリズムが使用される(例えば、Kimmel and Shamir,“GERBIL:Genotype Resolution and Block Identification Using Likelihood,” Proceedings of the National Academy of Sciences of the United States of America(PNAS)102:158-162,2005を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、GEVALTバージョン2プログラムの一部として入手可能なGERBILである(at acgt.cs.tau.ac.il/gevalt/でワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
一つの実施形態では、個体の遺伝子データは、集団の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、EMアルゴリズムを使用して、相を指定しない遺伝子型測定値を与えられたハプロタイプ頻度のML推定値を計算するアルゴリズムなどを使用して相決定される。当該アルゴリズムはさらに、一部の遺伝子型の測定値を(例えば、PCRの失敗を原因として)欠落させる。また当該アルゴリズムは、個々のハプロタイプの多重補完も可能である(例えば、Clayton,D.(2002),“SNPHAP:A Program for Estimating Frequencies of Large Haplotypes of SNPs”を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、SNPHAPである。
一つの実施形態では、個体の遺伝子データは、集団の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、SNPペア形成のために収集された遺伝子型の統計値に基づくハプロタイプ推定のためのアルゴリズムを使用して相決定される。このソフトウェアを使用して、例えばDNAアレイから取得された多数の長いゲノム配列の比較的正確な相決定を行うことができる。例示的なプログラムは、遺伝子型マトリックスを入力として取り込み、対応するハプロタイプマトリックスを出力する(例えば、Brinza and Zelikovsky,“2SNP:scalable phasing based on 2-SNP haplotypes,” Bioinformatics.22(3):371-3,2006を参照のこと。当該文献は参照によりその全体で本明細書に組み込まれる)。例示的なプログラムは、2SNPである(alla.cs.gsu.edu/~software/2SNPでワールドワイドウェブで利用可能である。当該プログラムはその全体で参照により本明細書に組み込まれる)。
様々な実施形態では、個体の遺伝子データは、染色体または染色体セグメントの異なる位置で染色体が交差する確率に関するデータを使用して(例えば、任意の間隔について組み換えリスクスコアを生成する、HapMapデータベースで見出され得る組み換えデータを使用して)、相決定され、染色体または染色体セグメント上の多型アレル間の依存度をモデル化する。一部の実施形態では、多型座位でのアレル数は、シーケンスデータまたはSNPアレイデータに基づいてコンピューター上で計算される。一部の実施形態では、多数の仮説の各々が、染色体または染色体セグメントの様々な可能性のある状態(例えば、個体からの一つ以上の細胞のゲノム中の第二の相同染色体セグメントと比較した場合の第一の相同染色体セグメントのコピー数の過剰出現、第一の相同染色体セグメントの重複、第二の相同染色体セグメントの重複、または第一と第二の相同染色体セグメントの均等な出願)に関連し、生成される(例えば、コンピューター上で生成される)。染色体上の多型座位での予測アレル数に対するモデル(例えば、同時分布モデル)が各仮説に対して構築される(例えば、コンピューター上で構築される)。各仮説の相対的な確率が、当該同時分布モデルおよびアレル数を使用して決定される(例えば、コンピューター上で決定される)。そして最も高い確率の仮説が選択される。一部の実施形態では、アレル数に関する同時分布モデルの構築、および各仮説の相対的な確率を決定する工程は、参照染色体を使用する必要がない方法を使用して為される。
一部の実施形態では、個体由来のサンプル(例えば、腫瘍生検、血液サンプル、血漿サンプル、血清サンプル、または対象となるCNVを有する主たる、もしくは唯一の細胞、DNAまたはRNAを含有する可能性が高い別のサンプル)が分析されて、対象となるCNV(例えば、欠失または重複)を含有することが判明している、または推測される一つ以上の領域の相が決定される。一部の実施形態では、サンプルは、高い腫瘍割合(例えば、30、40、50、60、70、80、90、95、98、99、または100%など)を有する。一部の実施形態では、サンプルは、胎児を妊娠している母親からの血液サンプルである。一部の実施形態では、胎児を妊娠している母親からの血液サンプルは、循環胎児細胞、および/または胎児DNAを含有する。
一部の実施形態では、サンプルは、ハプロタイプの不均衡または任意の異数性を有する。一部の実施形態では、サンプルは、2種類のDNAの任意の混合を含み、当該2種類のDNAは、異なる比率の二つのハプロタイプを有し、少なくとも一つのハプロタイプを共有する。一部の実施形態では、少なくとも10個、100個、500個、1,000個、2,000個、3,000個、5,000個、8,000個、または10,000個の多型座位が分析され、座位の一部またはすべてのアレルの相が決定される。一部の実施形態では、サンプルは、たとえば長期の細胞培養により誘導された異数性など、処理されて異数性となった細胞または組織に由来する。
一部の実施形態では、サンプル中のDNAまたはRNAの大部分またはすべてが、対象となるCNVを有する。一部の実施形態では、総DNAまたは総RNAに対する、対象となるCNVを含有する一つ以上の標的細胞由来のDNAまたはRNAのサンプル中の比率は、少なくとも80、85、90、95、または100%である。欠失を有するサンプルについては、欠失を有する細胞(またはDNAもしくはRNA)について、一つのハプロタイプのみが存在する。この第一のハプロタイプは、欠失領域中に存在するアレルの固有性を決定する標準的な方法を使用して決定され得る。欠失を含む細胞(またはDNAもしくはRNA)のみを含有するサンプルでは、それら細胞に存在する第一のハプロタイプからのシグナルのみが存在する。欠失を伴わない少量の細胞(またはDNAまたはRNA)(少量の非癌性細胞など)も含有するサンプルでは、これらの細胞(またはDNAまたはRNA)中の第二のハプロタイプからの弱いシグナルは無視することができる。欠失がない個体由来の他の細胞、DNAまたはRNAに存在する第二のハプロタイプは、推定により決定することができる。例えば、欠失がない個体由来の細胞の遺伝子型が(AB、AB)であり、当該個体の相決定データが、第一のハプロタイプが(A、A)であると示す場合、他方のハプロタイプが(B、B)であると推測され得る。
欠失を伴う細胞(またはDNAもしくはRNA)と欠失を伴わない細胞(またはDNAもしくはRNA)の両方が存在するサンプルについては、相をさらに決定することができる。例えば、x軸は染色体に沿った個々の座位の直線的な位置を表し、y軸は、総(A+B)アレルのリードの割合としてAアレルのリード数を表すプロットを作成することができる。欠失に関する一部の実施形態では、パターンは、個体がヘテロ接合性であるSNPを表す二つの中心バンドを含む(上のバンドは、欠失がない細胞からのAB、および欠失のある細胞からのAを表し、下のバンドは、欠失の無い細胞からのAB、および欠失のある細胞からのBを表す)。一部の実施形態では、欠失を伴う細胞、DNA、またはRNAの割合が増加するにつれ、これら二つのバンドの分離も増加する。したがって、Aアレルの固有性を使用して第一のハプロタイプを決定し、Bアレルの固有性を使用して、第二のハプロタイプを決定することができる。
重複を有するサンプルについては、重複を有する細胞(またはDNAもしくはRNA)について、当該ハプロタイプの余剰コピーが存在する。重複領域の当該ハプロタイプは、重複領域中に増加した量で存在するアレルの固有性を決定する標準的な方法を使用して決定することができ、または重複していない領域のハプロタイプは、減少した量で存在するアレルの固有性を決定する標準的な方法を使用して決定することができる。一つのハプロタイプが決定された時点で、他のハプロタイプは推定により決定することができる。
重複を伴う細胞(またはDNAもしくはRNA)と重複を伴わない細胞(またはDNAもしくはRNA)の両方が存在するサンプルについては、欠失に関し上述される方法と似た方法を使用して、相をさらに決定することができる。例えば、x軸は染色体に沿った個々の座位の直線的な位置を表し、y軸は、総(A+B)アレルのリードの割合としてAアレルのリード数を表すプロットを作成することができる。欠失に関する一部の実施形態では、パターンは、個体がヘテロ接合性であるSNPを表す二つの中心バンドを含む(上のバンドは、重複がない細胞からのAB、および重複のある細胞からのAABを表し、下のバンドは、重複の無い細胞からのAB、および重複のある細胞からのABBを表す)。一部の実施形態では、重複を伴う細胞、DNA、またはRNAの割合が増加するにつれ、これら二つのバンドの分離も増加する。したがって、Aアレルの固有性を使用して第一のハプロタイプを決定し、Bアレルの固有性を使用して、第二のハプロタイプを決定することができる。一部の実施形態では、癌があることが判明している個体に由来するサンプル(例えば、腫瘍生検または血漿サンプル)について、一つ以上のCNV領域の相(例えば、測定された領域中の多型座位の少なくとも50、60、70、80、90、95、または100%の相)が決定され、同個体に由来するその後のサンプルを分析して、癌の進行がモニタリングされる(例えば、癌の寛解または再発がモニタリングされる)。一部の実施形態では、腫瘍割合が多いサンプル(例えば、腫瘍担持量が多い個体に由来する腫瘍生検または血漿サンプル)を使用して、相決定データが取得され、当該データを使用して、腫瘍割合が少ないその後のサンプル(例えば、癌治療を受けた個体または寛解中の個体の血漿サンプル)の分析が行われる。
一部の実施形態では、本明細書に記載される方法のうちの二つ以上を使用して、個体の遺伝子データが相決定される。一部の実施形態では、バイオインフォマティクス法(例えば、母集団ベースのハプロタイプ頻度を使用して最も可能性の高い相を推定する方法)および分子生物学的方法(例えば、バイオインフォマティクスをベースとして推定された相決定データではなく、実際の相決定データを取得するための、本明細書に記載される分子相決定法のいずれか)が使用される。一部の実施形態において、他の対象(例えば、過去の対象)からの相決定データを使用して、母集団データが改善される。例えば、他の対象からの相決定データを母集団データに追加して、別の対象に対して可能性のあるハプロタイプの事前確率分布を計算することができる。一部の実施形態では、他の対象(例えば、過去の対象)からの相決定データを使用して、別の対象に対する可能性のあるハプロタイプの事前確率分布が計算される。
一部の実施形態では、確率的データを使用してもよい。例えば、サンプル中のDNA分子の出現に関する確率的な性質、ならびに様々な増幅バイアスおよび測定バイアスが原因で、二つの異なる座位から測定された、または所与の座位の異なるアレルから測定されたDNA分子の相対数は、混合物中の分子の相対数、または個体中の分子の相対数を常に表すとは限らない。個体の血漿からDNAをシーケンスすることにより、常染色体上の所与の座位で正常な二倍体個体の遺伝子型を決定しようと試みる場合、一つのアレルのみが観察されるか(ホモ接合性)、またはおよそ等しい数の二つのアレルが観察される(ヘテロ接合性)ことが予測される。もし当該アレルで、10分子のAアレルが観察され、2分子のBアレルが観察された場合、当該個体が当該座位でホモ接合性であり、2分子のBアレルはノイズまたは混入が原因であるか、または当該個体はヘテロ接合性であり、Bアレルの分子の数が少ないのは、血漿中のDNA分子数における無作為で統計的な変動、増幅バイアス、混入または他の様々な原因によるものかは、明白ではない。この場合、個体がホモ接合性である確率、および個体がヘテロ接合性である対応する確率は計算することができ、およびこれらの確率的な遺伝子型をさらなる計算に使用することができる。
所与のアレル比率について、当該比率が、個体中のDNA分子の比率を密接に表している尤度は、観察される分子数が多いほど高くなることに留意されたい。例えば、100分子のAと、100分子のBが測定された場合、実際の比率が50%であった尤度は、10分子のAと10分子のBが測定された場合よりもかなり高い。一つの実施形態では、ベイズ理論をデータの詳細モデルと組み合わせて、実測が行われることで特定の仮説が正しい尤度が決定される。例えば、二つの仮説、すなわちトリソミー個体に相当する仮説と、二染色体個体に相当する仮説を検討する場合、二染色体仮説が正しい確率は、10分子の各2アレルが観察された場合と比較して、100分子の各2アレルが観察された場合の方がかなり高い。バイアス、混入、またはその他のノイズ源によってデータのノイズが大きくなるにつれ、または所与の座位での実測数が少なくなるにつれて、実測データを与えられた最大尤度の仮説が真である確率は低下する。実際には、多くの座位での確率を集約して、最大尤度仮説が正しい仮説であると決定され得る信頼度を増加させることが可能である。一部の実施形態では、確率は、組み換えを考慮せずに単純に集約される。一部の実施形態では、計算は、交差が考慮される。
一つの実施形態では、確率的に相決定されたデータが、コピー数変動の決定に使用される。一部の実施形態では、確率的に相決定されたデータは、例えば、HapMapデータベースなどのデータソースからの母集団ベースのハプロタイプブロック頻度のデータである。一部の実施形態では、確率的に相決定されたデータは、分子学的方法により取得されたハプロタイプデータであり、例えば、染色体の個々のセグメントが、1反応当たり一つの分子に希釈されるが、確率的なノイズが原因で、当該ハプロタイプの固有性は完全には判明しない希釈により相決定される。一部の実施形態では、確率的に相決定されたデータは、分子学的方法により取得されたハプロタイプデータであり、当該ハプロタイプの固有性は、高い確実性で判明している場合がある。
医師が、個体からの血漿DNAを測定することにより、特定の染色体セグメントで欠失を有する何らかの細胞が体内にあるかを判定したいと望む仮定上のケースを想定する。医師は、血漿DNAの起源である細胞のすべてが二倍体であり、同じ遺伝子型である場合、ヘテロ接合性の座位について、二つのアレルのそれぞれについて観察されるDNA分子の相対数は、50%のAアレルと50%のBアレルを集約する一つの分布に入るという知識を利用し得る。しかし 当該血漿DNAの起源である細胞の画分が特定の染色体セグメントで欠失を有していた場合、ヘテロ接合性の座位について、当該二つのアレルの各々で観察されるDNA分子の相対数は、二つの分布に入ると予測され、一つはBアレルを含有する染色体セグメントに欠失がある座位について、50%を超えてAアレルが集約され、一つは、Aアレルを含有する染色体セグメントに欠失がある座位については、50%を下回り集約される。血漿DNAの起源である細胞の比率が高くなると、これら二つの分布は50%からさらに離れる。
この仮定の例では、個体の体内の細胞の一部において、個体が染色体領域の欠失を有するかを判定したい医師を想定する。医師は、個体から血液をバキュテナーまたは他のタイプの血液チューブに採血し、血液を遠心分離して、血漿層を分離してもよい。医師は、血漿からDNAを単離し、場合により標的化増幅もしくは他の増幅、座位捕捉技術、サイズ濃縮または他の濃縮技術によって標的化とされる座位のDNAを濃縮する。医師は、例えばSNPセットでのアレル数を測定することにより、言い換えれば、アレル頻度データを生成、例えばqPCR、シーケンス、マイクロアレイ、またはサンプル中のDNAの量を測定する他の技術といったアッセイを使用して濃縮および/または増幅されたDNAを生成することにより、分析を行ってもよい。本発明者らは、医師が標的化増幅技術を使用してセルフリー血漿DNAを増幅させ、次いで増幅されたDNAをシーケンスして、癌の指標である染色体セグメント上に存在する6個のSNPで、以下の可能性のある例示的データを得る事例について、データ分析を検討する。この場合において、個体は、当該SNPでヘテロ接合性であった:
SNP1:460リードのAアレル、540リードのBアレル(46%A)
SNP2:530リードのAアレル、470リードのBアレル(53%A)
SNP3:40リードのAアレル、60リードのBアレル(40%A)
SNP4:46リードのAアレル、54リードのBアレル(46%A)
SNP5:520リードのAアレル、480リードのBアレル(52%A)
SNP6:200リードのAアレル、200リードのBアレル(50%A)
この一連のデータからは、個体が正常であり、全ての細胞が二染色体性である事例と、または個体が癌を有する可能性があり、細胞の一部は、そのDNAが血漿中に存在するセルフリーDNAとなり、染色体で欠失または重複を有する事例とを識別することは困難である場合がある。例えば、最大尤度の二つの仮説は、個体がこの染色体セグメントで欠失を有し、6%の腫瘍割合を伴い、そして染色体の欠失セグメントは、六つのSNPに関して、(A、B、A、A、B、B)または(A、B、A、A、B、A)の遺伝子型を有する、とする。SNPセットに関する当該個体の遺伝子型の表現において、括弧内の最初の文字はSNP1のハプロタイプの遺伝子型に相当し、二番目の文字はSNP2に相当する。
染色体セグメントでの個体のハプロタイプを決定する方法を使用し、二つの染色体のうちの一つについて、ハプロタイプが(A、B、A、A、B、B)であったことを見出した場合、最大尤度仮説に合致し、個体が当該セグメントで欠失を有し、ゆえに癌性細胞または前癌細胞を有する可能性があるという計算尤度はかなり増加する。一方で、個体がハプロタイプ(A、A、A、A、A、A、A)を有することが見出された場合、個体が当該染色体セグメントにおいて欠失を有する尤度は大きく減少し、おそらく非欠失仮説の尤度が高くなる(実際の尤度値は、例えば特にシステムでの測定ノイズなどの他のパラメータに依存する)。
個体のハプロタイプを決定する方法は多く存在し、その多くが、本明細書において別段に記載される。部分的なリストはここに示されており、網羅的であることは意図されていない。一つの方法は生物学的な方法であり、個々のDNA分子は、任意の所与の反応ボリューム中に各染色体領域からおよそ一つの分子となるまで希釈され、次いでシーケンスなどの方法を使用して遺伝子型が測定される。別の方法は、情報科学ベースの方法であり、頻度と結び付けられた様々なハプロタイプに関する母集団データを確率的に使用することができる。別の方法は、一つまたは複数の関連個体とともに個体の二倍体データを測定する方法であり、当該関連個体は、個体とハプロタイプブロックを共有し、ハプロタイプブロックを示唆すると予測される。別の方法は、高濃度の欠失セグメントまたは重複セグメントを含む組織サンプルを採取し、アレル不均衡に基づきハプロタイプを測定する方法であり、例えば、欠失を伴う腫瘍組織サンプルからの遺伝子型測定値を使用して、当該領域に対する相決定データを判定することができ、次いでこのデータを使用して、癌が切除後に再増殖していたかを判定することができる。
実際には、典型的には20個を超えるSNP、50個を超えるSNP、100個を超えるSNP、500個を超えるSNP、1,000個を超えるSNP、または5,000個を超えるSNPが、所与の染色体セグメントで測定される。
9.変異の例
例えば癌などの疾患または障害、または例えば癌などの疾患または障害のリスク増加(例えば正常レベルを超えるリスク)に関連する変異の例としては、一塩基バリアント(SNV)、多重ヌクレオチド変異、欠失(例えば、200万~3,000万塩基対領域の欠失)、重複、またはタンデムリピートが挙げられる。一部の実施形態では、変異は、例えばcfDNA、セルフリーミトコンドリアDNA(cf mDNA)、核DNA(cf nDNA)、細胞DNAまたはミトコンドリアDNAを起源とするセルフリーDNAなどのDNA中にある。一部の実施形態では、変異は、例えばcfRNA、細胞RNA、細胞質RNA、コード細胞質RNA、非コード細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなどのRNA中にある。一部の実施形態では、変異は、疾患または障害(例えば、癌)を有さない対象よりも、疾患または障害(例えば、癌)を有する対象において高頻度に存在する。一部の実施形態では、変異は、例えば原因変異など、癌の指標である。一部の実施形態では、変異は、疾患または障害において原因となる役割を有するドライバー変異である。一部の実施形態では、変異は、原因変異ではない。例えば、一部の癌では複数の変異が蓄積するが、それらのうちのいくつかは原因変異ではない。原因ではない変異(例えば、疾患または障害を有さない対象よりも、疾患または障害を有する対象において高頻度に存在する変異)であっても、疾患または障害の診断に有用であり得る。一部の実施形態では、変異は、一つ以上のマイクロサテライトでのヘテロ接合性の喪失性(LOH)である。
一部の実施形態では、対象は、対象が有することが判明している一つ以上の多型または変異についてスクリーニングされる(例えば、その存在、これら多形または変異を有する細胞、DNAまたはRNAの量における変化、または癌の寛解もしくは再発の検査のため)。一部の実施形態では、対象は、対象がリスクがあると判明している一つ以上の多型または変異についてスクリーニングされる(例えば、当該多型または当該変異を有する親族がいる対象など)。一部の実施形態では、対象は、例えば癌などの疾患または障害に関連する多形または変異のパネルに関してスクリーニングされる(例えば、少なくとも5個、10個、50個、100個、200個、300個、500個、750個、1,000個、1,500個、2,000個、または5,000個の多型または変異)。
癌に関連する多くのコードバリアントが、Abaanらの“The Exomes of the NCI-60 Panel:A Genomic Resource for Cancer Biology and Systems Pharmacology”,Cancer Research,July 15,2013に記載され、およびdtp.nci.nih.gov/branches/btb/characterizationNCI60.htmlでワールドワイドウェブで利用可能である。当該文献等は参照によりその全体で本明細書に組み込まれる。NCI-60ヒト癌細胞株パネルは、肺、結腸、脳、卵巣、乳房、前立腺、および腎臓、ならびに白血病および黒色腫の癌を表す60個の様々な細胞株からなる。これらの細胞株で特定された遺伝的バリエーションは、以下の二つのタイプからなる:正常集団に存在するI型バリアント、および癌特異的なII型バリアント。
例示的な多型または変異(例えば、欠失または重複)は、以下の遺伝子のうちの一つ以上にある:TP53、PTEN、PIK3CA、APC、EGFR、NRAS、NF2、FBXW7、ERBBs、ATAD5、KRAS、BRAF、VEGF、EGFR、HER2、ALK、p53、BRCA、BRCA1、BRCA2、SETD2、LRP1B、PBRM、SPTA1、DNMT3A、ARID1A、GRIN2A、TRRAP、STAG2、EPHA3/5/7、POLE、SYNE1、C20orf80、CSMD1、CTNNB1、ERBB2.FBXW7、KIT、MUC4、ATM、CDH1、DDX11、DDX12、DSPP、EPPK1、FAM186A、GNAS、HRNR、KRTAP4-11、MAP2K4、MLL3、NRAS、RB1、SMAD4、TTN、ABCC9、ACVR1B、ADAM29、ADAMTS19、AGAP10、AKT1、AMBN、AMPD2、ANKRD30A、ANKRD40、APOBR、AR、BIRC6、BMP2、BRAT1、BTNL8、C12orf4、C1QTNF7、C20orf186、CAPRIN2、CBWD1、CCDC30、CCDC93、CD5L、CDC27、CDC42BPA、CDH9、CDKN2A、CHD8、CHEK2、CHRNA9、CIZ1、CLSPN、CNTN6、COL14A1、CREBBP、CROCC、CTSF、CYP1A2、DCLK1、DHDDS、DHX32、DKK2、DLEC1、DNAH14、DNAH5、DNAH9、DNASE1L3、DUSP16、DYNC2H1、ECT2、EFHB、RRN3P2、TRIM49B、TUBB8P5、EPHA7、ERBB3、ERCC6、FAM21A、FAM21C、FCGBP、FGFR2、FLG2、FLT1、FOLR2、FRYL、FSCB、GAB1、GABRA4、GABRP、GH2、GOLGA6L1、GPHB5、GPR32、GPX5、GTF3C3、HECW1、HIST1H3B、HLA-A、HRAS、HS3ST1、HS6ST1、HSPD1、IDH1、JAK2、KDM5B、KIAA0528、KRT15、KRT38、KRTAP21-1、KRTAP4-5、KRTAP4-7、KRTAP5-4、KRTAP5-5、LAMA4、LATS1、LMF1、LPAR4、LPPR4、LRRFIP1、LUM、LYST、MAP2K1、MARCH1、MARCO、MB21D2、MEGF10、MMP16、MORC1、MRE11A、MTMR3、MUC12、MUC17、MUC2、MUC20、NBPF10、NBPF20、NEK1、NFE2L2、NLRP4、NOTCH2、NRK、NUP93、OBSCN、OR11H1、OR2B11、OR2M4、OR4Q3、OR5D13、OR8I2、OXSM、PIK3R1、PPP2R5C、PRAME、PRF1、PRG4、PRPF19、PTH2、PTPRC、PTPRJ、RAC1、RAD50、RBM12、RGPD3、RGS22、ROR1、RP11-671M22.1、RP13-996F3.4、RP1L1、RSBN1L、RYR3、SAMD3、SCN3A、SEC31A、SF1、SF3B1、SLC25A2、SLC44A1、SLC4A11、SMAD2、SPTA1、ST6GAL2、STK11、SZT2、TAF1L、TAX1BP1、TBP、TGFBI、TIF1、TMEM14B、TMEM74、TPTE、TRAPPC8、TRPS1、TXNDC6、USP32、UTP20、VASN、VPS72、WASH3P、WWTR1、XPO1、ZFHX4、ZMIZ1、ZNF167、ZNF436、ZNF492、ZNF598、ZRSR2、ABL1、AKT2、AKT3、ARAF、ARFRP1、ARID2、ASXL1、ATR、ATRX、AURKA、AURKB、AXL、BAP1、BARD1、BCL2、BCL2L2、BCL6、BCOR、BCORL1、BLM、BRIP1、BTK、CARD11、CBFB、CBL、CCND1、CCND2、CCND3、CCNE1、CD79A、CD79B、CDC73、CDK12、CDK4、CDK6、CDK8、CDKN1B、CDKN2B、CDKN2C、CEBPA、CHEK1、CIC、CRKL、CRLF2、CSF1R、CTCF、CTNNA1、DAXX、DDR2、DOT1L、EMSY(C11orf30)、EP300、EPHA3、EPHA5、EPHB1、ERBB4、ERG、ESR1、EZH2、FAM123B(WTX)、FAM46C、FANCA、FANCC、FANCD2、FANCE、FANCF、FANCG、FANCL、FGF10、FGF14、FGF19、FGF23、FGF3、FGF4、FGF6、FGFR1、FGFR2、FGFR3、FGFR4、FLT3、FLT4、FOXL2、GATA1、GATA2、GATA3、GID4(C17orf39)、GNA11、GNA13、GNAQ、GNAS、GPR124、GSK3B、HGF、IDH1、IDH2、IGF1R、IKBKE、IKZF1、IL7R、INHBA、IRF4、IRS2、JAK1、JAK3、JUN、KAT6A(MYST3)、KDM5A、KDM5C、KDM6A、KDR、KEAP1、KLHL6、MAP2K2、MAP2K4、MAP3K1、MCL1、MDM2、MDM4、MED12、MEF2B、MEN1、MET、MITF、MLH1、MLL、MLL2、MPL、MSH2、MSH6、MTOR、MUTYH、MYC、MYCL1、MYCN、MYD88、NF1、NFKBIA、NKX2-1、NOTCH1、NPM1、NRAS、NTRK1、NTRK2、NTRK3、PAK3、PALB2、PAX5、PBRM1、PDGFRA、PDGFRB、PDK1、PIK3CG、PIK3R2、PPP2R1A、PRDM1、PRKAR1A、PRKDC、PTCH1、PTPN11、RAD51、RAF1、RARA、RET、RICTOR、RNF43、RPTOR、RUNX1、SMARCA4、SMARCB1、SMO、SOCS1、SOX10、SOX2、SPEN、SPOP、SRC、STAT4、SUFU、TET2、TGFBR2、TNFAIP3、TNFRSF14、TOP1、TP53、TSC1、TSC2、TSHR、VHL、WISP3、WT1、ZNF217、ZNF703、およびそれらの組み合わせ(Suら、J Mol Diagn 2011、13:74-84;DOI:10.1016/j.jmoldx.2010.11.010;およびAbaanら、“The Exomes of the NCI-60 Panel:A Genomic Resource for Cancer Biology and Systems Pharmacology”、Cancer Research、July 15、2013、当該文献は参照によりその全体で本明細書に組み込まれる)。一部の実施形態では、重複は、乳癌に関連する染色体1p(Chr1p)重複である。一部の実施形態では、一つ以上の多型または変異は、例えばV600E変異など、BRAF中にある。一部の実施形態では、一つ以上の多型または変異は、K-rasにある。一部の実施形態では、K-rasおよびAPCにおける一つ以上の多型または変異の組み合わせが存在する。一部の実施形態では、K-rasおよびp53における一つ以上の多型または変異の組み合わせが存在する。一部の実施形態では、APCおよびp53における一つ以上の多型または変異の組み合わせが存在する。一部の実施形態では、K-ras、APCおよびp53における一つ以上の多型または変異の組み合わせが存在する。一部の実施形態では、K-rasおよびEGFRにおける一つ以上の多型または変異の組み合わせが存在する。例示的な多型または変異は、以下のマイクロRNAのうちの一つ以上にある:miR-15a、miR-16-1、miR-23a、miR-23b、miR-24-1、miR-24-2、miR-27a、miR-27b、miR-29b-2、miR-29c、miR-146、miR-155、miR-221、miR-222、およびmiR-223(Calinら、A microRNA signature associated with prognosis and progression in chronic lymphocytic leukemia.”N Engl J Med 353:1793-801,2005。当該文献は参照によりその全体で本明細書に組み込まれる)。
一部の実施形態では、欠失は、少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの欠失である。一部の実施形態では、欠失は、1kb以上~40mb以下、例えば、1kb以上~100kb以下、100kb以上~1mb以下、1以上~5mb以下、5以上~10mb以下、10以上~15mb以下、15以上~20mb以下、20以上~25mb以下、25以上~30mb以下、または30以上~40mb以下の欠失である。
一部の実施形態では、重複は、少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの重複である。一部の実施形態では、重複は、1kb以上~40mb以下、例えば、1kb以上~100kb以下、100kb以上~1mb以下、1以上~5mb以下、5以上~10mb以下、10以上~15mb以下、15以上~20mb以下、20以上~25mb以下、25以上~30mb以下、または30以上~40mb以下の重複である。
一部の実施形態では、タンデムリピートは、例えば2以上~6以下、7以上~10以下、10以上~20以下、20以上~30以下、30以上~40以下、40以上~50以下、または50以上~60以下のヌクレオチドなどの2以上~60以下のヌクレオチドのリピートである。一部の実施形態では、タンデムリピートは、2ヌクレオチドのリピート(ジヌクレオチドリピート)である。一部の実施形態では、タンデムリピートは、3ヌクレオチドのリピート(トリヌクレオチドリピート)である。
一部の実施形態では、多型または変異は、予測的である。例示的な予測的変異としては、例えば、結腸直腸癌における術後の疾患再発の指標であるK-ras変異などのK-ras変異が挙げられる(Ryanら、”A prospective study of circulating mutant KRAS2 in the serum of patients with colorectal neoplasia:strong prognostic indicator in postoperative follow up,”Gut 52:101-108,2003;およびLecomte Tら、Detection of free-circulating tumor-associated DNA in plasma of colorectal cancer patients and its association with prognosis,”Int J Cancer 100:542-548,2002。当該文献は各々その全体で参照により本明細書に組み込まれる)。
一部の実施形態では、多型または変異は、特定の治療に対する反応の変化に関連する(例えば、有効性もしくは副作用の増加または減少)。例としては、非小細胞肺癌におけるEGFR系治療に対する反応性の低下と関連するK-ras変異が挙げられる(Wangら、”Potential clinical significance of a plasma-based KRAS mutation analysis in patients with advanced non-small cell lung cancer,” Clin Canc Res16:1324-1330,2010。当該文献は参照によりその全体で本明細書に組み込まれる)。
K-rasは、癌遺伝子であり、多くの癌で活性化される。例示的なK-ras変異は、コドン12、13、および61における変異である。K-ras cfDNA変異は、膵臓癌、肺癌、結腸直腸癌、膀胱癌、および胃癌において特定されている(Fleischhacker & Schmidt “Circulating nucleic acids(CNAs)and caner - a survey,” Biochim Biophys Acta 1775:181-232,2007。当該文献は参照によりその全体で本明細書に組み込まれる)。
p53は腫瘍抑制因子であり、多くの癌で変異し、腫瘍の進行の原因となっている(Levine & Oren“The first 30 years of p53:growing ever more complex.Nature Rev Cancer,”9:749-758,2009。当該文献は参照によりその全体で本明細書に組み込まれる)。例えば、Ser249 など、多くの様々なコドンが変異する場合がある。p53 cfDNA変異は、乳癌、肺癌、卵巣癌、膀胱癌、胃癌、膵臓癌、結腸直腸癌、大腸癌および肝細胞癌において特定されている(Fleischhacker & Schmidt “Circulating nucleic acids(CNAs)and caner - a survey,”Biochim Biophys Acta 1775:181-232,2007。当該文献は参照によりその全体で本明細書に組み込まれる)。
BRAFは、Rasの下流の癌遺伝子である。 BRAF変異は、膠細胞性新生物、黒色腫、甲状腺癌、および肺癌において特定されている(Dias-Santagataら、BRAF V600E mutations are common in pleomorphic xanthoastrocytoma:diagnostic and therapeutic implications.PLOS ONE 2011;6:e17948,2011;Shinozakiら、Utility of circulating B-RAF DNA mutation in serum for monitoring melanoma patients receiving biochemotherapy.Clin Canc Res 13:2068-2074,2007;およびBoardら、Detection of BRAF mutations in the tumor and serum of patients enrolled in the AZD6244(ARRY-142886)advanced melanoma phase II study.Brit J Canc 2009;101:1724-1730。これら文献は各々参照によりその全体で本明細書に組み込まれる)。BRAFのV600E変異は、例えば黒色腫で発生し、進行した段階でより普遍的にみられる。V600E変異は、cfDNAにおいて検出されている。
EGFRは細胞増殖に寄与し、多くの癌において誤制御されている(Downward J.Targeting RAS signalling pathways in cancer therapy.Nature Rev Cancer 3:11-22,2003;およびLevine & Oren“The first 30 years of p53:growing ever more complex.Nature Rev Cancer,”9:749-758,2009。当該文献はその全体で参照により本明細書に組み込まれる)。例示的なEGFR変異としては、エクソン18~21における変異が挙げられ、肺癌患者において特定されている。EGFR cfDNA変異は、肺がん患者において特定されている(Jiaら、“Prediction of epidermal growth factor receptor mutations in the plasma/pleural effusion to efficacy of gefitinib treatment in advanced non-small cell lung cancer,”J Canc Res Clin Oncol 2010;136:1341-1347,2010。当該文献はその全体で参照により本明細書に組み込まれる)。
乳癌に関連する例示的な多型または変異としては、マイクロサテライトでのLOH(Kohlerら、”Levels of plasma circulating cell free nuclear and mitochondrial DNA as potential biomarkers for breast tumors,” Mol Cancer 8:doi:10.1186/1476-4598-8-105,2009。当該文献はその全体で参照により本明細書に組み込まれる)、p53変異(例えば、エクソン5~8の変異)(Garciaら、“Extracellular tumor DNA in plasma and overall survival in breast cancer patients,”Genes,Chromosomes & Cancer 45:692-701,2006。当該文献はその全体で参照により本明細書に組み込まれる)、HER2(Sorensenら、“Circulating HER2 DNA after trastuzumab treatment predicts survival and response in breast cancer,”Anticancer Res30:2463-2468,2010。当該文献はその全体で参照により本明細書に組み込まれる)、PIK3CA、MED1、およびGAS6の多型または変異が挙げられる(Murtazaら、”Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA,”Nature 2013;doi:10.1038/nature12065,2013。当該文献はその全体で参照により本明細書に組み込まれる)。
cfDNAレベルの増加およびLOHは、全生存期間および無病生存期間の減少と関連する。p53変異(エクソン5~8)は、全生存期間の減少と関連する。 循環HER2 cfDNAレベルの減少は HER2-ポジティブの乳癌対象における HER2-標的化治療に対する良好な反応性と関連している。PIK3CAにおける活性化変異、MED1の短縮化、およびGAS6におけるスプライシング変異は、治療耐性を生じさせる。
結腸直腸癌に関連する多型または変異の例としては、p53、APC、K-ras、およびチミジル酸合成酵素の変異、ならびにp16遺伝子のメチル化が挙げられる(Wangら、”Molecular detection of APC,K-ras,and p53 mutations in the serum of colorectal cancer patients as circulating biomarkers,” World J Surg 28:721-726,2004;Ryanら、”A prospective study of circulating mutant KRAS2 in the serum of patients with colorectal neoplasia:strong prognostic indicator in postoperative follow up,” Gut 52:101-108,2003;Lecomteら、“Detection of free-circulating tumor-associated DNA in plasma of colorectal cancer patients and its association with prognosis,” Int J Cancer 100:542-548,2002;Schwarzenbachら、“Molecular analysis of the polymorphisms of thymidylate synthase on cell-free circulating DNA in blood of patients with advanced colorectal carcinoma,” Int J Cancer 127:881-888,2009。当該文献は各々その全体で参照により本明細書に組み込まれる)。血清K-ras変異の術後検出は、疾患再発の強力な予測因子である。K-ras変異およびp16遺伝子メチル化の検出は、生存率の低下および疾患再発の増加と関連する。K-ras、APC、および/またはp53の変異の検出は、再発および/または転移と関連する。cfDNAを使用したチミジル酸合成酵素(フルオロピリミジン系化学療法剤の標的)遺伝子の多型(LOH、SNP、変動的な数のタンデムリピート、および欠失を含む)は、治療反応性と関連する場合がある。
肺癌(例えば、非小細胞肺癌)に関連する多型または変異の例としては、K-ras(例えば、コドン12の変異)およびEGFR変異が挙げられる。例示的な予測的変異としては、全生存期間および無増悪生存期間の増加に関連するEGFR変異(エクソン19の欠失またはエクソン21の変異)が挙げられ、K-ras変異(コドン12および13の変異)が無増悪生存期間の減少と関連している(Jianら、“Prediction of epidermal growth factor receptor mutations in the plasma/pleural effusion to efficacy of gefitinib treatment in advanced non-small cell lung cancer,” J Canc Res Clin Oncol 136:1341-1347,2010;Wangら、“Potential clinical significance of a plasma-based KRAS mutation analysis in patients with advanced non-small cell lung cancer,” Clin Canc Res 16:1324-1330,2010。当該文献は各々その全体で参照により本明細書に組み込まれる)。治療に対する反応性の指標となる多型または変異の例としては、治療に対する反応性を改善するEGFR変異(エクソン19の欠失またはエクソン21の変異)、および治療に対する反応性を減少させるK-ras変異(コドン12および13)が挙げられる。EFGRにおいて耐性寄与変異が特定されている(Murtazaら、“Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA,”Nature doi:10.1038/nature12065,2013。当該文献はその全体で参照により本明細書に組み込まれる)。
黒色腫(例えば、ブドウ膜黒色腫)に関連する多型または変異の例としては、GNAQ、GNA11、BRAF、およびp53の多型または変異が挙げられる。例示的なGNAQおよびGNA11の変異としては、R183およびQ209の変異が挙げられる。GNAQまたはGNA11におけるQ209変異は、骨への転移と関連している。BRAF V600E 変異は、転移性/進行期の黒色腫を有する患者において検出され得る。BRAF V600Eは、浸潤性黒色腫の指標である。化学療法剤後のBRAF V600E変異の存在は、治療に対する非反応性と関連している
膵臓癌に関連する多型または変異の例としては、K-rasおよびp53(例えば、p53 Ser249)の多型または変異が挙げられる。p53 Ser249は、B型肝炎感染および肝細胞癌、ならびに卵巣癌、および非ホジキンリンパ腫とも関連している。
サンプル中に低頻度で存在している多型または変異であっても、本発明方法を用いて検出することができる。例えば、100万個中、1個の頻度で存在する多型または変異は、1,000万回のシーケンスリードを実行することにより、10回実測することができる。望ましい場合には、シーケンスリードの数を、所望の感度レベルに応じて変更することができる。一部の実施形態では、サンプルを再分析するか、または対象からの別のサンプルをより多くの数のシーケンスリードを使用して分析し、感度を改善する。例えば、癌に関連する、または癌のリスク増大に関連する多型または変異が全くない、または少数(例えば、1、2、3、4、または5)しか検出されない場合、サンプルを再分析するか、または別のサンプルを検査する。
一部の実施形態では、複数の多型または変異が、癌または転移性癌に必要である。そのような場合、複数の多型または変異をスクリーニングすることにより、癌または転移性癌を正確に診断する能力が改善される。対象が、癌または転移性癌に必要な複数の多型または変異のサブセットを有する一部の実施形態において、後に対象を再スクリーニングして、対象が追加の変異を獲得したかを判定することができる。
癌または転移性癌に対して、複数の多型または変異が必要とされる一部の実施形態では、多型または変異の各々の頻度を比較して、それらが似た頻度で起こるかを判定することができる。例えば、二つの変異(「A」および「B」と記載される)が癌に必要な場合、一部の細胞はなにも有さず、一部の細胞はAを有し、一部の細胞はBを有し、一部の細胞はAとBを有する。AおよびBが似た頻度で実測される場合、対象は、AおよびBの両方を有する細胞をいくつか有する可能性がさらに高くなる。AおよびBが異なる頻度で観察される場合、対象は、異なる細胞集団を有する可能性がさらに高くなる。
癌または転移性癌に対して、複数の多型または変異が必要とされる一部の実施形態では、対象に存在するそのような多型または変異の数または固有性を使用して、対象が疾患または障害を有する可能性、またはいつ有するかを予測することができる。多型または変異が特定の順序で生じる傾向がある一部の実施形態では、対象は定期的に検査され、対象が他の多型または変異を獲得したかを判定してもよい。
一部の実施形態では、複数の多型または変異(例えば、2、3、4、5、8、10、12、15、またはそれ以上)の有無を決定することにより、例えば癌などの疾患もしくは障害の有無、または例えば癌などの疾患もしくは障害を有するリスク増大の有無の決定の感度および/または特異度が増す。
一部の実施形態では、多型または変異は、直接検出される。一部の実施形態では、多型または変異は、当該多型または当該変異に連鎖した一つ以上の配列(例えば、SNPなどの多型座位)の検出により間接的に検出される。
9.1 例示的な核酸改変
一部の実施形態では、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増加と関連するRNAまたはDNAの完全性の変化(例えば、断片化したcfRNAもしくはcfDNAのサイズ変化、またはヌクレオソーム組成物の変化)が存在する。一部の実施形態では、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増加と関連するRNAまたはDNAのメチル化パターンの変化(例えば、腫瘍抑制性遺伝子の超メチル化)が存在する。例えば、腫瘍抑制遺伝子のプロモーター領域におけるCpGアイランドのメチル化は、局所的な遺伝子サイレンシングを誘発することが示唆されている。p16腫瘍抑制遺伝子の異常なメチル化は、肝癌、肺癌、および乳癌の対象に生じる。APC、Ras関連ドメインファミリータンパク質1A(RASSF1A:Ras association domain family protein 1A)、グルタチオンS-トランスフェラーゼP1(GSTP1:glutathione S-transferase P1)、およびDAPKをはじめとする、頻繁にメチル化される他の腫瘍抑制遺伝子は、例えば上咽頭癌、結腸直腸癌、肺癌、食道癌、前立腺癌、膀胱癌、黒色腫、および急性白血病など、様々なタイプの癌で検出されている。例えばp16などの特定の腫瘍抑制遺伝子のメチル化は、癌形成の早期事象として報告されており、早期の癌スクリーニングに有用である。
一部の実施形態では、メチル化感受性制限酵素消化を使用した亜硫酸水素塩変換法または非亜硫酸水素塩系の方法を使用して、メチル化パターンが決定される(Hung et al.,J Clin Pathol 62:308-313,2009。当該文献はその全体で参照により本明細書に組み込まれる)。亜硫酸水素塩変換法では、メチル化シトシンはシトシンとして残り、非メチル化シトシンがウラシルに変換される。メチル化感受性制限酵素(例えば、BstUI)は、メチル化されていないDNA配列を特定の認識部位(例えば、BstUIについては5’-CG v CG-3)で切断するか、メチル化された配列はそのままである。一部の実施形態では、損なわれていないメチル化配列が検出される。一部の実施形態では、ステムループプライマーが使用されて、酵素消化されていないメチル化DNAを共増幅することなく、制限酵素消化された非メチル化断片が選択的に増幅される。
9.2 mRNAスプライシングにおける変化の例
一部の実施形態では、mRNAスプライシングの変化が、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増加と関連している。一部の実施形態では、mRNAスプライシングの変化は、癌または癌のリスク増加に関連する以下の核酸のうちの一つ以上に存在する:DNMT3B、BRCA1、KLF6、Ron、またはGemin5。一部の実施形態では、検出されたmRNAスプライスバリアントは、例えば癌などの疾患または障害と関連している。一部の実施形態では、複数のmRNAスプライスバリアントが健康な細胞(例えば非癌性細胞など)により産生されるが、mRNAスプライスバリアントの相対量の変化が、例えば癌などの疾患または障害と関連している。一部の実施形態では、mRNAスプライシングの変化は、mRNA配列の変化(例えば、スプライス部位の変異)、スプライシング因子のレベルの変化、利用可能なスプライシング因子の量の変化(例えば、スプライシング因子がリピートに結合することが原因の利用可能なスプライシング因子の量の減少)、スプライシング制御の変化、または腫瘍微小環境が原因である。
スプライシング反応は、スプライソソーム(spliceosome)と呼ばれる複数タンパク質/mRNA複合体により実施される(Fackenthal1 and Godley,Disease Models & Mechanisms 1:37-42,2008,doi:10.1242/dmm.000331。当該文献はその全体で参照により本明細書に組み込まれる)。スプライソソームは、イントロン-エクソンの境界を認識し、2回のエステル交換反応を介して介在イントロンを除去し、二つの隣接エクソンのライゲーションを生じさせる。ライゲーションが誤って発生すると、正常なタンパク質をコードする可能性が低くなる場合があるため、この反応の忠実度は最高でなければならない。例えば、エクソンスキッピングにより翻訳中のアミノ酸の固有性および順序を特定する三つ組みコドンのリーディングフレームが保持される場合、代替的スプライシングが為されたmRNAは、重要なアミノ酸残基を欠いたタンパク質を指定しまう場合がある。より一般的には、エクソンスキッピングは、翻訳リーディングフレームを破壊し、未成熟な終止コドンを生じさせる。これらのmRNAは多くの場合、ナンセンス介在性mRNA分解として知られるプロセスを通して少なくとも90%まで分解され、これにより、このような欠陥のあるメッセージが蓄積して短縮型タンパク質産物が生成されてしまう尤度が低下する。ミススプライシングされたmRNAがこの経路を回避した場合、短縮型、変異型、または不安定なタンパク質が産生される。
代替的スプライシングは、同じゲノムDNAから複数または多くの異なる転写物を発現させる手段であり、特定のタンパク質に対して利用可能なエクソンのサブセットの統合から生じる。一つ以上のエクソンを除外することによって、特定のタンパク質のドメインがコードタンパク質から失われ、その結果mタンパク質の機能喪失または機能獲得が生じる可能性がある。以下のいくつかのタイプの代替的スプライシングが報告されている:エクソンスキッピング、代替5’または3’スプライス部位、相互排他的エクソン、および非常に稀であるが、イントロン保持。バイオインフォマティクス的方法を使用して、癌と正常細胞における代替的スプライシングの量を比較し、癌は、正常細胞よりも低レベルの代替的スプライシングを呈すると判定した研究者もいる。さらに代替的スプライシング事象のタイプの分布は、癌と正常細胞では異なっていた。癌細胞は、正常な細胞よりもエクソンスキッピングが少ないが、代替的5’および3’スプライス部位選択、およびイントロン保持は多く示していた、エクソン化現象(他の組織では主にイントロンとして使用される配列のエクソンとしての使用)が検証されたとき、癌細胞でエクソン化に関連する遺伝子は、mRNAのプロセッシングと優先的に関連していた。このことから、癌細胞と異常なmRNAスプライス型の生成との間の直接的な関連性が示唆される。
9.3 DNAまたはRNAのレベル変化の例
一部の実施形態では、一つ以上のタイプのDNA(例えば、cfDNA、cf mDNA、cf nDNA、細胞DNA、またはミトコンドリアDNA)、またはRNA(cfRNA、細胞RNA、細胞質RNA、コード細胞質RNA、非コード細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNA)の総量または濃度の変化がある。一部の実施形態では、一つ以上の特定のDNA(例えば、cfDNA、cf mDNA、cf nDNA、細胞DNA、またはミトコンドリアDNA)分子、またはRNA(cfRNA、細胞RNA、細胞質RNA、コード細胞質RNA、非コード細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNA)分子の量または濃度の変化がある。一部の実施形態では、一つのアレルは、対象となる座位の別のアレルよりも多く発現される。例示的なmiRNAは、遺伝子の発現を制御する短い20~22ヌクレオチドのRNA分子である。一部の実施形態では、一つ以上のRNA分子の固有性または量の変化など、トランスクリプトームの変化がある。
一部の実施形態では、cfDNAもしくはcfRNAの量または濃度の増加が、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増加と関連している。一部の実施形態では、あるタイプのDNA(例えば、cfDNA、cf mDNA、cf nDNA、細胞DNA、またはミトコンドリアDNAなど)またはRNA(例えば、cfRNA、細胞RNA、細胞質RNA、コード細胞質RNA、非コード細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNA)の総濃度は、健常(例えば、非癌性の)対象における当該タイプのDNAまたはRNAの総濃度と比較して、少なくとも2、3、4、5、6、7、8、9、10倍、またはそれ以上まで増加する。一部の実施形態では、75以上~100ng/mL以下、100以上~150ng/mL以下、150以上~200ng/mL以下、200以上~300ng/mL以下、300以上~400ng/mL以下、400以上~600ng/mL以下、600以上~800ng/mL以下、800以上~1,000ng/mL以下の総濃度のcfDNA、または100ngを超える、例えば200、300、400、500、600、700、800、900、または1,000ng/mLを超える総濃度のcfDNAは、癌を示し、癌リスクの増加を示し、良性より悪性である腫瘍のリスク増加を示し、おそらく寛解に至っている癌の減少を示し、または当該癌の予後の悪化を示す。一部の実施形態では、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増大に関連した多形/変異(例えば、欠失または重複)を一つ以上有する、あるタイプのDNA(例えば、cfDNA、cf mDNA、cf nDNA、細胞DNA、またはミトコンドリアDNA)、またはRNA(cfRNA、細胞RNA、細胞質RNA、コード細胞質RNA、非コード細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNA)の量は、当該タイプのDNAまたはRNAの総量の少なくとも2、3、4、5、6、7、8、9、10、11、12、14、16、18、20または25%である。一部の実施形態では、あるタイプのDNA(例えば、cfDNA、cf mDNA、cf nDNA、細胞DNA、またはミトコンドリアDNA)、またはRNA(cfRNA、細胞RNA、細胞質RNA、コード細胞質RNA、非コード細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNA)の総量のうち、少なくとも2、3、4、5、6、7、8、9、10、11、12、14、16、18、20または25%は、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増大に関連する特定の多形または変異(例えば欠失または重複)を有する。
一部の実施形態では、cfDNAは、封入されている。一部の実施形態では、cfDNAは、封入されていない。
一部の実施形態では、総DNA中の腫瘍DNAの割合(例えば、総cfDNA中、腫瘍cfDNAの割合、または総cfDNA中、特定の変異を有する腫瘍cfDNAの割合)が決定される。一部の実施形態では、腫瘍DNAの割合は、複数の変異について決定されてもよく、この場合において当該変異は、一塩基バリアント、コピー数バリアント、区別的なメチル化、またはそれらの組み合わせであり得る。一部の実施形態では、最も高く計算された腫瘍割合を有する変異の一つまたはセットについて計算された平均腫瘍割合は、サンプル中の実際の腫瘍割合としてみなされる。一部の実施形態では、変異のすべてについて計算された平均腫瘍割合が、サンプル中の実際の腫瘍割合としてみなされる。一部の実施形態では、この腫瘍割合を使用して、癌が病期分類される(腫瘍割合が高くなると、癌のステージはより進行したものとなり得るため)。一部の実施形態では、血漿中の腫瘍DNAの割合と、腫瘍の大きさは相関し得るため、腫瘍割合は、癌のサイズ決定に使用される。一部の実施形態では、血漿サンプル中の実測腫瘍割合と、所与の変異遺伝子型を有する組織のサイズとの間に相関性がある場合があるため、腫瘍割合を使用して、一つまたは複数の変異がある腫瘍比率の大きさが決定される。例えば、所与の変異遺伝子型を有する組織の大きさは、腫瘍DNAの割合と相関する場合があり、当該腫瘍DNAの割合は、当該特定の変異に焦点を当てることによって計算され得る。
10.例示的な生化学的方法および組成物
10.1 サンプル例
本発明の態様のいずれか一部の実施形態において、サンプルは、欠失または重複を有すると推測される細胞、例えば癌性であると推測される細胞または胎児起源であると推測される循環細胞に由来する細胞性遺伝物質および/または細胞外遺伝物質を含む。一部の実施形態では、サンプルは、欠失または重複を有する細胞、DNA、またはRNAを含有すると推測される任意の組織または体液を含む。これら方法の一部として使用される遺伝的測定は、DNAまたはRNAを含む任意のサンプルに行われてもよく、例えば、限定されないが、組織、血液、血清、血漿、尿、毛髪、涙、唾液、皮膚、爪、便、胆汁、リンパ、子宮頸部粘液、精液、腫瘍、胎児、または核酸を含む他の細胞もしくは材料などのサンプルに行われてもよい。サンプルには、任意の細胞型、または任意の細胞型に由来するDNAもしくはRNAが含まれてもよく、使用されてもよい(例えば、癌性またはニューロンであると推測される任意の器官または組織からの細胞など)。一部の実施形態では、サンプルは、核DNAおよび/またはミトコンドリアDNAを含む。一部の実施形態では、サンプルは、本明細書に開示される標的個体のいずれか由来である。一部の実施形態では、標的個体は、癌患者である。
例示的なサンプルとしては、cfDNAまたはcfRNAを含有するサンプルが挙げられる。一部の実施形態では、cfDNAは、細胞を溶解する工程を必要とせずに、分析に利用可能である。セルフリーDNAは、例えば液状の組織、例えば血液、血漿、リンパ、腹水、または脳脊髄液など様々な組織から取得されてもよい。一部の例では、cfDNAは、胎児細胞から誘導されたDNAから構成される。一部の例では、cfDNAは、遠心分離されて細胞物質が除去された全血から単離された血漿から単離される。cfDNAは、標的細胞(例えば、癌細胞)および非標的細胞(例えば、非癌性細胞)から誘導されたDNAの混合物であってもよい。
一部の実施形態では、サンプルは、癌細胞を起源とするDNA(またはRNA)と、非癌性(すなわち正常)細胞を起源とするDNA(またはRNA)の混合物など、DNA(またはRNA)の混合物を含有するか、または含有することが推測される。一部の実施形態では、サンプル中の細胞の少なくとも0.5、1、3、5、7、10、15、20、30、40、50、60、70、80、90、92、94、95、96、98、99、または100%が、癌細胞である。一部の実施形態では、サンプル中のDNA(例えば、cfDNA)またはRNA(例えば、cfRNA)の少なくとも0.5、1、3、5、7、10、15、20、30、40、50、60、70、80、90、92、94、95、96、98、99、または100%が、癌細胞に由来する。様々な実施形態では、サンプル中の癌性細胞である細胞のパーセントは、0.5%以上~99%以下、例えば1%以上~95%以下、5%以上~95%以下、10%以上~90%以下、5%以上~70%以下、10%以上~70%以下、20%以上~90%以下または20%以上~70%以下である。一部の実施形態では、サンプルは、癌細胞に対して濃縮され、または癌細胞由来のDNAまたはRNAに対して濃縮される。サンプルが癌細胞に対して濃縮される一部の実施形態では、濃縮サンプル中の細胞の少なくとも0.5、1、2、3、4、5、6、7、10、15、20、30、40、50、60、70、80、90、92、94、95、96、98、99、または100%が、癌細胞である。サンプルが癌細胞由来のDNAまたはRNAに対して濃縮される一部の実施形態では、濃縮サンプル中のDNAまたはRNAの少なくとも0.5、1、2、3、4、5、6、7、10、15、20、30、40、50、60、70、80、90、92、94、95、96、98、99、または100%が、癌細胞由来である。一部の実施形態では、細胞ソーティング(例えば、蛍光活性化細胞ソーティング(FACS)など)を使用して、癌細胞が濃縮される(Bartenevaら、Biochim Biophys Acta.,1836(1):105-22,Aug 2013.doi:10.1016/j.bbcan.2013.02.004.Epub 2013 Feb 24、およびIbrahimら、Adv Biochem Eng Biotechnol.106:19-39,2007を参照のこと。これらは各々、参照によりその全体が本明細書に組み込まれる)。
一部の実施形態では、サンプルは、胎児細胞に対して濃縮される。サンプルが胎児細胞に対して濃縮される一部の実施形態では、濃縮サンプル中の細胞の少なくとも0.5、1、2、3、4、5、6、7%またはそれ以上が、胎児細胞である。一部の実施形態では、サンプル中の胎児細胞である細胞のパーセントは、0.5%以上~100%以下、例えば1%以上~99%以下、5%以上~95%以下、10%以上~95%以下、10%以上~95%以下、20%以上~90%以下、または30%以上~70%以下である。一部の実施形態では、サンプルは、胎児DNAに対して濃縮される。サンプルが胎児DNAに対して濃縮される一部の実施形態では、濃縮サンプル中のDNAの少なくとも0.5、1、2、3、4、5、6、7%またはそれ以上が、胎児DNAである。一部の実施形態では、サンプル中の胎児DNAであるDNAのパーセントは、0.5%以上~100%以下、例えば1%以上~99%以下、5%以上~95%以下、10%以上~95%以下、10%以上~95%以下、20%以上~90%以下、または30%以上~70%以下である。
一部の実施形態では、サンプルは、一つの細胞を含むか、または一つの細胞に由来するDNAおよび/またはRNAを含む。一部の実施形態では、複数の個々の細胞(例えば、同じ対象または異なる対象に由来する、少なくとも5個、10個、20個、30個、40個、または50個の細胞)が並行して分析される。一部の実施形態では、同じ個体に由来する複数のサンプルからの細胞が組み合わされ、これにより、サンプルを別々に分析する場合と比較して、作業量が減少する。複数のサンプルを組み合わせることにより、癌について同時に複数の組織を検査することも可能となる(これを使用して、癌に対するさらに徹底的なスクリーニングを提供することができる、または癌が他の組織に転移しているか否かが判定され得る)。
一部の実施形態では、サンプルは、一つの細胞または少数の細胞、例えば、2、3、5、6、7、8、9、または10個の細胞を含有する。一部の実施形態では、サンプルは、1~100、100~500、または500~1,000個の細胞を有する。一部の実施形態では、サンプルは、1ピコグラム以上~10ピコグラム以下、10ピコグラム以上~100ピコグラム以下、100ピコグラム以上~1ナノグラム以下、1ナノグラム以上~10ナノグラム以下、10ナノグラム以上~100ナノグラム以下、または100ナノグラム以上~1マイクログラム以下のRNAおよび/またはDNAを含む。
一部の実施形態では、サンプルは、パラフィン包埋される。一部の実施形態では、サンプルは、例えばホルムアルデヒドなどの保存剤を用いて保存され、任意でパラフィン包埋され、これによってDNAが架橋されて、より少ない量のDNAがPCRに利用可能になり得る。一部の実施形態では、サンプルは、ホルムアルデヒド固定されたパラフィン包埋(FFPE)サンプルである。一部の実施形態では、サンプルは、新鮮なサンプルである(例えば、1日または2日間の分析で取得されたサンプル)。一部の実施形態では、サンプルは、分析前に凍結される。一部の実施形態では、サンプルは、病歴サンプルである。
これらのサンプルは、本発明の方法のいずれかで使用することができる。
10.2 サンプル調製方法の例
一部の実施形態では、方法は、DNAおよび/もしくはRNAを単離または精製することを含む。当該目的を達成するための、当分野に公知の多くの標準的な方法がある。一部の実施形態では、サンプルは遠心分離され、様々な層が分離されてもよい。一部の実施形態では、DNAまたはRNAは、ろ過を使用して単離されてもよい。一部の実施形態では、DNAまたはRNAの調製は、増幅、分離、クロマトグラフィーによる精製、液体分離、単離、優先的濃縮、優先的増幅、標的化増幅、または当分野に公知であるか、もしくは本明細書に記載される他の多くの技術のいずれかを含んでもよい。DNA単離に関する一部の実施形態では、RNaseを使用して、RNAが分解される。RNA単離に関する一部の実施形態では、DNase(例えば、Invitrogen社、米国カリフォルニア州カールスバッドのDNaseなど)を使用してDNAが分解される。一部の実施形態では、RNeasy mini kit(Qiagen社)をメーカーのプロトコールに従い使用して、RNAが単離される。一部の実施形態では、低RNA分子は、メーカーのプロトコールに従い、mirVana PARIS kit(Ambion社、米国テキサス州オースティン)を使用して単離される(Guら、J.Neurochem.122:641-649,2012。当該文献はその全体で参照により本明細書に組み込まれる)。RNAの濃度および純度は任意で、Nanovue(GE Healthcare社、米国ニュージャージー州ピスカタウェイ)を使用して決定されてもよく、およびRNAの完全性は任意で、2100 Bioanalyzer(Agilent Technologies社、米国カリフォルニア州サンタクララ)を使用して測定されてもよい(Guら、J.Neurochem.122:641-649,2012。当該文献はその全体で参照により本明細書に組み込まれる)。一部の実施形態では、TRIZOLまたはRNAlater(Ambion社)を使用して、保管中のRNAが安定化される。
一部の実施形態では、ユニバーサルタグ付きアダプターが付加されてライブラリーが作製される。ライゲーションの前に、サンプルDNAは平滑末端化されてもよく、次いで一つのアデノシン塩基が3-プライム末端に付加される。ライゲーションの前に、制限酵素または何らかの他の切断方法を使用してDNAが切断されてもよい。ライゲーションの間に、サンプル断片の3-プライムアデノシンと、アダプターの相補的3-プライムチロシンオーバーハングによって、ライゲーション効率が高められる。一部の実施形態では、アダプターライゲーションは、AGILENT SURESELECT kitにあるライゲーションキットを使用して実施される。一部の実施形態では、ライブラリーは、ユニバーサルプライマーを使用して増幅される。一つの実施形態では、増幅されたライブラリーは、サイズ分離により、または例えばAGENCOURT AMPURE ビーズもしくは他の類似方法などの製品を使用することにより、分割される。一部の実施形態では、PCR増幅を使用して標的座位が増幅される。一部の実施形態では、増幅されたDNAはシーケンスされる(例えば、ILLUMINA IIGAXまたはHiSeqシーケンサーを使用したシーケンス)。一部の実施形態では、増幅されたDNAは、シーケンスエラーを減少させるために、増幅されたDNAの各末端からシーケンスされる。増幅されたDNAの一方の末端からシーケンスされたとき、特定の塩基に配列エラーがある場合、(増幅されたDNAの同じ末端から複数回シーケンスを行うことと比較して)増幅されたDNAの反対側からシーケンスされたとき、相補的な塩基にシーケンスエラーがある可能性は低い。
一部の実施形態では、全ゲノムアプリケーション(WGA:whole genome application)を使用して、核酸サンプルを増幅する。多数の方法がWGAに利用可能である:ライゲーション介在PCR(LM-PCR:ligation-mediated PCR)、縮重オリゴヌクレオチドプライマーPCR(DOP-PCR:degenerate oligonucleotide primer PCR)、および多重置換増幅(MDA:multiple displacement amplification)。LM-PCRでは、アダプターと呼ばれる短いDNA配列がDNAの平滑末端にライゲーションされる。これらのアダプターは、PCRによるDNA増幅に使用されるユニバーサル増幅配列を含有する。DOP-PCRでは、ユニバーサル増幅配列をさらに含有するランダムプライマーが、アニーリングおよびPCRの最初のラウンドで使用される。次いで、第二のPCRラウンドで、当該配列がユニバーサルプライマー配列でさらに増幅される。MDAは、phi-29ポリメラーゼを使用する。このポリメラーゼは、DNAを複製し、単一細胞解析に使用されている、処理能力が高く、非特異的な酵素である。一部の実施形態では、WGAは実施されない。
一部の実施形態では、選択的な増幅または濃縮は、標的座位を増幅または濃縮するために使用される。一部の実施形態では、増幅技術および/または選択的濃縮技術は、例えばライゲーション介在PCR、ハイブリダイゼーションによる断片捕捉、分子反転プローブ(Molecular Inversion Probes)、または他の環状化プローブ(circularizing probes)などのPCRを伴いうる。一部の実施形態では、リアルタイム定量的PCR(RT-qPCR)、デジタルPCR、またはエマルジョンPCR、単一アレル塩基伸長反応とその後の質量分析法が使用される(Hungら、J Clin Pathol 62:308-313,2009。当該文献はその全体で参照により本明細書に組み込まれる)。一部の実施形態では、ハイブリッド捕捉プローブを用いたハイブリダイゼーションによる捕捉を使用して、DNAを優先的に濃縮する。一部の実施形態では、増幅または選択的濃縮の方法はプローブの使用を伴い、この場合において標的配列に正しくハイブリダイゼーションした際に、ヌクレオチドプローブの3-プライム末端または5-プライム末端が、少数のヌクレオチドにより多型アレルの多型部位から分離される。この分離によって、アレルバイアスと呼ばれる一つのアレルの優先的増幅が減少する。これは、正しくハイブリダイズされたプローブの3-プライム末端または5-プライム末端が、アレルの多型部位に直接隣接する、または非常に近くにあるプローブの使用を伴う方法を超える改善である。一つの実施形態では、ハイブリダイズ領域が多型部位を包含する可能性がある、または確実に包含するプローブは除外される。ハイブリダイゼーション部位での多型部位は不均一なハイブリダイゼーションの原因となる可能性があり、一部のアレルではハイブリダイゼーションを完全に阻害し得る。これにより特定アレルの優先的増幅が生じてしまう。これらの実施形態は、サンプルが一つの個体由来の純粋なゲノムサンプルであるか、または個体混合物由来であるかに関わらず、各多型座位でのサンプルの元々のアレル頻度をより良好に保持するという点で、標的増幅および/または選択的濃縮を伴う他の方法を超える改善である。
一部の実施形態では、PCR(ミニPCRと称される)を使用して、非常に短いアンプリコンが生成される(2012年11月21日に出願された米国特許出願第13/683,604号、米国特許出願公開第2013/0123120号、2011年11月18日に出願された米国特許出願第13/300,235号、2011年11月18日に出願された米国特許出願公開第2012/0270212号、および2014年5月16日に出願された米国特許出願第61/994,791号。当該特許出願はその全体で参照により本明細書に組み込まれる)。cfDNA(例えば、ネクローシス的に、またはアポトーシス的に放出された癌性cfDNA)は高度に断片化されている。胎児cfDNAについては、断片サイズは、平均160bp、標準偏差15bp、最小サイズは約100bp、および最大サイズは約220bpで、およそガウス型で分布する。一つの特定の標的座位の多型部位は、当該座位を起源とする様々な断片の中の開始位置から終了位置までの任意の位置を占め得る。cfDNA断片は短いため、両方のプライマー部位が存在する尤度は、フォワードプライマー部位とリバースプライマー部位の両方を含む長さLの断片の尤度であり、アンプリコンの長さと断片の長さの比である。理想的な条件下では、アンプリコンが、45、50、55、60、65、または70bpであるアッセイは、利用可能な鋳型断片分子のそれぞれ72%、69%、66%、63%、59%、または56%からの増幅に成功する。癌を有すると推測される個体のサンプルからのcfDNAに最も好ましい、関連する特定の実施形態では、cfDNAは、85、80、75または70bp、特定の好ましい実施形態では75bpの最大アンプリコン長を生じさせ、50~65℃の融点、特に好ましい実施形態では54~60.5℃の融点を有するプライマーを使用して増幅される。アンプリコンの長さは、フォワードのプライミング部位とリバースのプライミング部位の5-プライム末端の間の距離である。当業者により典型的に使用されるよりも短いアンプリコン長は、短いシーケンスリードのみを必要とすることによって、より効率的な所望の多型座位の測定をもたらし得る。一つの実施形態では、アンプリコンのかなりの割合が、100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満、または45bp未満である。
一部の実施形態では、増幅は、直接多重化PCR、連続PCR、入れ子型PCR、二重入れ子型PCR、1.5辺入れ子型PCR(one-and-a-half sided nested PCR)、完全入れ子型PCR、片側完全入れ子型PCR、片側入れ子型PCR、ヘミ入れ子型PCR、ヘミ入れ子型PCR、三重ヘミ入れ子型PCR、セミ入れ子型PCR、片側セミ入れ子型PCR、リバースセミ入れ子型PCR法、または片側PCRを使用して実施される。これらは2012年11月21日に出願された米国特許出願第13/683,604号、米国特許出願公開第2013/0123120号、2011年11月18日に出願された米国特許出願第13/300,235号、米国特許出願公開第2012/0270212号、および2014年5月16日に出願された米国特許出願第61/994,791号に記載されており、これら特許出願はその全体で参照により本明細書に組み込まれる。望ましい場合、これら方法のいずれかをミニPCRに使用することができる。
望ましい場合、PCR増幅の伸長工程は、時間的な観点から制限され、200ヌクレオチド、300ヌクレオチド、400ヌクレオチド、500ヌクレオチド、または1,000ヌクレオチドよりも長い断片の増幅が減少する場合がある。これにより、断片化されたDNAまたは短いDNA(例えば、胎児DNA、またはアポトーシスもしくは壊死を経た癌細胞由来のDNAなど)の濃縮が生じ、および試験性能の改善がもたらされ得る。
一部の実施形態では、マルチプレックスPCRが使用される。一つの実施形態では、核酸サンプル中の標的座位の増幅方法は、(i)核酸サンプルを、少なくとも100、200、500、750、1,000、2,000、5,000、7,500、10,000、20,000、25,000、30,000、40,000、50,000、75,000、または100,000個の様々な標的座位に同時にハイブリダイズするプライマーライブラリーと接触させ、反応混合物を生成すること、および(ii)当該反応混合物をプライマー伸長反応条件(例えばPCR条件など)におき、標的アンプリコンを含む増幅産物を生成すること、を含む。一部の実施形態では、標的座位の少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%が増幅される。様々な実施形態において、増幅産物の60、50、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満が、プライマー二量体である。一部の実施形態では、プライマーは、溶液中にある(例えば、固相ではなく、液相に溶解される)。一部の実施形態では、プライマーは溶液中にあり、固形支持体上に固定されていない。一部の実施形態では、プライマーは、マイクロアレイの一部ではない。一部の実施形態では、プライマーは、分子反転プローブ(MIP)を含まない。
一部の実施形態では、二つ以上の(例えば3または4)標的アンプリコン(本明細書に開示されるミニPCR方法からのアンプリコン)が一緒にライゲーションされ、次いでライゲーション産物がシーケンスされる。複数のアンプリコンを一つのライゲーション産物にまとめることで、その後のシーケンス工程の効率が上がる。一部の実施形態では、標的アンプリコンは、ライゲーションされる前は150、100、90、75、または50塩基対よりも短い。選択的濃縮および/または増幅は、異なるタグ、分子バーコード、増幅用タグ、および/またはシーケンス用タグを用いて、個々の各分子をタグ付けすることを伴いうる。一部の実施形態では、増幅された産物はシーケンス(例えばハイスループットシーケンス)により分析され、または例えばSNPアレイ、ILLUMINA INFINIUMアレイ、またはAFFYMETRIX遺伝子チップなどのアレイへのハイブリダイゼーションにより分析される。一部の実施形態では、例えば、Genia社により開発されたナノポアシーケンス技術などのナノポアシーケンスが使用される(例えば、geniachip.com/technologyでのワールドワイドウェブを参照のこと。当該内容はその全体で参照により本明細書に組み込まれる)。一部の実施形態において、二本鎖シーケンスが使用される(Schmitt et al.,“Detection of ultra-rare mutations by next-generation sequencing,”Proc Natl Acad Sci U S A.109(36):14508-14513,2012。当該文献はその全体で参照により本明細書に組み込まれる)。この方法は、DNA二本鎖の日本の鎖の各々を個々にタグ付けおよびシーケンスすることによりエラーを大幅に減少させる。二本の鎖は相補的であるため、真の変異は両方の鎖の同じ位置で見出される。対照的にPCRエラーまたはシーケンスエラーは一本の鎖のみで変異を生じさせるため、技術的エラーとして差し引くことができる。一部の実施形態では、当該方法は、二本鎖DNAの両方の鎖を、二本鎖タグ(Duplex Tag)と呼称される無作為だが相補的な二本鎖ヌクレオチド配列でタグ付けすることを伴う。二本鎖タグ配列は、まず一本鎖の無作為化ヌクレオチド配列を一つのアダプター鎖に導入し、次いでDNAポリメラーゼを用いて反対側の鎖を伸長し、相補的な二本鎖タグを生成することにより、標準的なシーケンスアダプターへと組み込まれる。タグ付けされたアダプターをせん断化DNAにライゲーションした後、個別に標識された鎖は、アダプター尾部上の非対称プライマー部位からPCR増幅され、ペア末端シーケンスが行われる。一部の実施形態では、サンプル(例えば、DNAまたはRNAサンプル)は、例えば、異なるウェル(例えば、WaferGen SmartChipのウェル)などの複数の画分へと分割される。一部のウェルにおいて、全サンプルよりも変異を有する分子の割合が高くなるため、異なる画分(例えば、少なくとも5、10、20、50、75、100、150、200または300個の画分)にサンプルを分割することで、分析感度を上昇させることができる。一部の実施形態では、各画分は、500、400、200、100、50、20、10、5、2もしくは1個未満のDNA分子またはRNA分子を有する。一部の実施形態では、各画分中の分子は、別々にシーケンスされる。一部の実施形態では、同じ画分中の全ての分子に同じバーコード(例えば、無作為配列または非ヒト配列)が(例えば、バーコードを含有するプライマーを用いた増幅またはバーコードのライゲーションにより)付けられ、異なるバーコードは、異なる画分の分子に付けられる。バーコード化された分子をプールし、一緒にシーケンスすることができる。一部の実施形態では、分子が増幅され、その後に例えば入れ子型PCRによりプールされ、シーケンスされる。一部の実施形態では、一つのフォワードプライマーと二つのリバースプライマー、または二つのフォワードプライマーと一つのリバースプライマーが使用される。
一部の実施形態では、サンプル(例えば、cfDNAまたはcfRNAのサンプル)中の10、5、2、1、0.5、0.1、0.05、0.01もしくは0.005%未満のDNA分子またはRNA分子に存在する変異(例えば、SNVまたはCNV)が、検出される(または検出可能である)。一部の実施形態では、サンプル(例えば、血液サンプルなどに由来するcfDNAまたはcfRNAのサンプル)中の1,000、500、100、50、20、10、5、4、3もしくは2個未満の元々のDNA分子またはRNA分子(増幅前)に存在する変異(例えば、SNVまたはCNV)が、検出される(または検出可能である)。一部の実施形態では、サンプル(例えば、血液サンプルなどに由来するcfDNAまたはcfRNAのサンプル)中のわずか1個の元々のDNA分子またはRNA分子(増幅前)に存在する変異(例えば、SNVまたはCNV)が、検出される(または検出可能である)。
例えば、変異(例えば、一塩基バリアント(SNV))の検出限界が0.1%である場合、0.01%で存在する変異は、画分を、例えば100ウェルなどの複数の画分に分割することにより検出することができる。ウェルのほとんどは、変異のコピーを有していない。変異を有する数個のウェルについて、変異は、非常に高いリードパーセントとなる。一つの例では、標的座位に由来する20,000個の初期DNAコピーが存在し、それらのコピーのうちの2個が、対象となるSNVを含む。サンプルが100ウェルに分割される場合、98ウェルはSNVを有し、2ウェルは0.5%でSNVを有する。各ウェル内のDNAはバーコード化され、増幅され、他のウェルからのDNAとともにプールされ、シーケンスされる。SNVのないウェルを使用して、バックグラウンド増幅/シーケンスエラー率を測定し、外れ値ウェルからの信号が、バックグラウンドのノイズレベルを超えているかを決定することができる。
一部の実施形態では、増幅産物は、例えば、一つ以上の対象となる染色体(例えば、第13、第18、第21、X、Y染色体またはそれらの任意の組み合わせ)に対するプローブを含むマイクロアレイなどのアレイを使用して検出される。例えば、Illumina社(カリフォルニア州サンディエゴ)、GoldenGate社,DASL社,Infinium社またはCytoSNP-12社の遺伝子型解析アッセイなど、市販のSNP検出マイクロアレイを使用してもよいこと、または例えばOncoScanのマイクロアレイなどのAffymetrix社のSNP検出マイクロアレイ製品を使用してもよいことを理解されたい。
シーケンスを伴う一部の実施形態では、リード深度は、所与の座位にマッピングされるシーケンスリードの数である。リード深度は、リードの総数に対して正規化されてもよい。サンプルのリード深度に関する一部の実施形態では、リード深度は、標的座位に対するリードの平均深度である。座位のリード深度に関する一部の実施形態では、リード深度は、当該座位へのシーケンサーマッピングにより測定されたリードの数である。概して、座位のリード深度が大きいほど、当該座位におけるアレル比率は、元のDNAサンプルにおけるアレル比率に近くなる傾向がある。リード深度は、限定されないが、パーセンテージまたは割合を含む、様々な異なる方法で表現され得る。したがって、例えば、Illumina HISEQなどの高度並行化DNAシーケンサーでは、例えば100万個のクローンのシーケンスが行われ、一つの座位でのシーケンスが3,000回行われることにより、当該座位で3,000のリード深度が生じる。当該座位でのリードの割合は、3,000を100万の総リードで割ったもの、または総リードの0.3%である。
一部の実施形態では、アレルデータが取得され、この場合において当該アレルデータは、多型座位の特定アレルのコピー数を示す、定量的な測定値を含む。一部の実施形態では、当該アレルデータは、多型座位で実測された各アレルのコピー数を示す、定量的な測定値を含む。典型的には、対象となる多型座位の全ての可能性のあるアレルについて、定量的な測定値が取得される。例えば、マイクロアレイ、qPCR、ハイスループットDNAシーケンスなどのDNAシーケンスといったSNP座位またはSNV座位のアレルを決定する、前段落で検討された方法のいずれかを使用して、多型座位の特定のアレルのコピー数の定量的な測定値を生成することができる。この定量的な測定値は、本明細書においてアレル頻度データまたは実測遺伝的アレルデータと呼ばれる。アレルデータを使用する方法は、定量的アレル法と呼ばれることもある。この方法は、アレル固有性に関係なく非多型座位または多型座位からの定量的データのみを使用する定量的方法とは対照的である。アレルデータがハイスループットシーケンスを使用して測定される場合、アレルデータは典型的には、対象となる座位にマッピングされた各アレルのリード数を含む。
一部の実施形態では、非アレルデータが取得され、この場合において当該非アレルデータは、特定座位のコピー数を示す、定量的な測定値を含む。座位は、多型または非多型であり得る。座位が非多型である一部の実施形態では、非アレルデータは、当該座位に存在する可能性がある個々のアレルの相対量または絶対量についての情報を含まない。非アレルデータ(すなわち、非多型座位からの定量的データ、または各断片のアレル固有性に関係ない多型座位からの定量的データ)のみを使用する方法は、定量的方法と呼ばれる。典型的には、対象となる多型座位の全ての可能性のあるアレルについて定量的測定値が取得され、一つの値は、合計で当該座位での全アレルについて測定された量と関連付けられる。多型座位の非アレルデータは、当該座位の各アレルについて、定量的アレルを合計することによって取得され得る。アレルデータがハイスループットシーケンスを使用して測定される場合、非アレルデータは典型的には、対象となる座位にマッピングされたリード数を含む。シーケンス測定値は、座位に存在する各アレルの相対数および/または絶対数を示す場合があり、非アレルデータは、アレル固有性に関係なく、当該座位にマッピングされたリードの合計を含む。一部の実施形態では、同じシーケンス測定値セットを使用して、アレルデータと非アレルデータの両方を生成することができる。一部の実施形態では、アレルデータは、対象となる染色体でのコピー数を決定する方法の一部として使用され、生成された非アレルデータは、対象となる染色体でのコピー数を決定するための異なる方法の一部として使用することができる。一部の実施形態では、二つの方法は統計的に直交しており、これらを組み合わせて対象となる染色体でのコピー数に関するより正確な決定が為される。
一部の実施形態では、遺伝子データの取得には、(i)例えば、自動化ハイスループットDNAシーケンサーの使用によるなど、実験技術によりDNAの配列情報を取得すること、または(ii)実験技術により従前に取得された情報を獲得することであって、当該情報は、例えばインターネット上のコンピューターにより、またはシーケンスデバイスからの電子的転送により、電子的に送信される、獲得すること、を含む。
追加的なサンプルの調製、増幅、および定量法の例は、2012年11月21日に出願された米国特許出願第13/683,604号(米国特許出願公開第2013/0123120号、および2014年5月16日に出願された米国特許出願第61/994,791号)に記載されており、当該出願は参照によりその全体で本明細書に組み込まれる。これらの方法は、本明細書に開示されるサンプルのいずれかの分析に使用することができる。
10.3 セルフリーDNAの定量方法の例
望ましい場合、cfDNAまたはcfRNAの量または濃度は、標準的な方法を使用して測定することができる。一部の実施形態では、セルフリーミトコンドリアDNA(cf mDNA)の量または濃度が決定される。一部の実施形態では、核DNA(cf nDNA)を起源とするセルフリーDNAの量または濃度が決定される。一部の実施形態では、cf mDNAとcf nDNAの量または濃度は、同時に決定される。
一部の実施形態では、qPCRを使用して、cf nDNAおよび/またはcfm DNAが測定される(Kohlerら、“Levels of plasma circulating cell free nuclear and mitochondrial DNA as potential biomarkers for breast tumors.”Mol Cancer 8:105,2009,8:doi:10.1186/1476-4598-8-105。当該文献はその全体で参照により本明細書に組み込まれる)。例えば、cf nDNA由来の一つ以上の座位(例えば、グリセロアルデヒド-3-ホスファデヒドロゲナーゼ、GAPDH)、およびcf mDNA由来の一つ以上の座位(ATPase 8、MTATP 8)を、マルチプレックスqPCRを使用して測定することができる。一部の実施形態では、蛍光標識PCRを使用して、cf nDNAおよび/またはcf mDNAが測定される(Schwarzenbachら、“Evaluation of cell-free tumor DNA and RNA in patients with breast cancer and benign breast disease.”Mol Biosys 7:2848-2854,2011。当該文献はその全体で参照により本明細書に組み込まれる)。望ましい場合、データの正規分布は、例えばシャピロ-ウィルク検定などの標準的な方法を使用して決定することができる。望ましい場合、例えばマン・ホイットニーのU検定などの標準的な方法を使用して、cf nDNAとmDNAのレベルを比較することができる。一部の実施形態では、cf nDNAおよび/またはmDNAのレベルは、例えば、マン・ホイットニーのU検定またはクラスカル・ウォリス検定などの標準的な方法を使用して、他の確立された予後因子と比較される。
10.4 RNAの増幅、定量、および分析方法の例
以下の例示的な方法のいずれかを使用して、例えば、cfRNA、細胞RNA、細胞質RNA、コード細胞質RNA、非コード細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなどのRNAを増幅および任意で定量してもよい。一部の実施形態では、miRNAは、mirbase.orgでワールドワイドウェブで利用可能なmiRBaseデータベースに列挙されたmiRNA分子のいずれかであり、当該内容は参照によりその全体で本明細書に組み込まれる。例示的なmiRNA分子としては、miR-509、miR-21、およびmiR-146aが挙げられる。
一部の実施形態では、逆転写酵素多重化ライゲーション依存プローブ増幅(RT-MLPA:reverse-transcriptase multiplex ligation-dependent probe amplification)を使用して、RNAを増幅する。一部の実施形態では、ハイブリダイズプローブの各セットは、SNPに及ぶ二つの短い合成オリゴヌクレオチドと、一つの長いオリゴヌクレオチドからなる(Liら、Arch Gynecol Obstet.“Development of noninvasive prenatal diagnosis of trisomy 21 by RT-MLPA with a new set of SNP markers,”July 5,2013,DOI 10.1007/s00404-013-2926-5;Schoutenら、“Relative quantification of 40 nucleic acid sequences by multiplex ligation-dependent probe amplification.” Nucleic Acids Res 30:e57,2002;Dengら、(2011)“Non-invasive prenatal diagnosis of trisomy 21 by reverse transcriptase multiplex ligation-dependent probe amplification,”Clin,Chem.Lab Med.49:641-646,2011。当該文献はその全体で参照により本明細書に組み込まれる)。
一部の実施形態では、RNAは、逆転写酵素PCRで増幅される。一部の実施形態では、RNAは、前述のSYBR GREEN Iを用いた一工程のリアルタイム逆転写酵素PCRなどのリアルタイム逆転写酵素PCRで増幅される(Liら、Arch Gynecol Obstet.“Development of noninvasive prenatal diagnosis of trisomy 21 by RT-MLPA with a new set of SNP markers,” July 5,2013,DOI 10.1007/s00404-013-2926-5;Loら、“Plasma placental RNA allelic ratio permits noninvasive prenatal chromosomal aneuploidy detection,” Nat Med 13:218-223,2007;Tsuiら、Systematic micro-array based identification of placental mRNA in maternal plasma:towards non-invasive prenatal gene expression profiling.J Med Genet 41:461-467,2004;Guら、J.Neurochem.122:641-649,2012。当該文献はその全体で参照により本明細書に組み込まれる)。
一部の実施形態では、マイクロアレイを使用してRNAを検出する。例えば、Agilent Technologies社のヒトmiRNAマイクロアレイを、メーカーのプロトコールに従って使用することができる。簡潔に述べると、単離されたRNAは脱リン酸化され、pCp-Cy3でライゲーションされる。標識されたRNAを精製し、Sanger miRBase release 14.0に基づくヒト成熟miRNA用のプローブを含有するmiRNAアレイにハイブリダイズする。アレイを洗浄し、マイクロアレイスキャナー(G2565BA、Agilent Technologies社)を使用してスキャンする。各ハイブリダイゼーションシグナルの強度は、Agilent extraction software v9.5.3により評価される。標識化、ハイブリダイゼーション、およびスキャンは、Agilent miRNA microarray systemのプロトコールに従って実施されてもよい(Guら、J.Neurochem.122:641-649,2012。当該文献はその全体で参照により本明細書に組み込まれる)。
一部の実施形態では、TaqManアッセイを使用してRNAを検出する。例示的なアッセイは、TaqMan Array Human MicroRNA Panel v1.0(Early Access)(Applied Biosystems社)であり、当該アッセイは、157個のTaqMan MicroRNA Assaysを含有し、各逆転写プライマー、PCRプライマー、およびTaqManプローブを含む(Chimら、“Detection and characterization of placental microRNAs in maternal plasma,” Clin Chem.54(3):482-90,2008。当該文献はその全体で参照により本明細書に組み込まれる)。
望ましい場合、一つ以上のmRNAのmRNAスプライシングパターンは、標準的な方法を使用して決定することができる(FFackenthal1 and Godley,Disease Models & Mechanisms 1:37-42,2008,doi:10.1242/dmm.000331。当該文献はその全体で参照により本明細書に組み込まれる)。例えば、高密度マイクロアレイおよび/またはハイスループットDNAシーケンスを使用して、mRNAスプライスバリアントを検出することができる。
一部の実施形態では、全トランスクリプトームのショットガンシーケンスまたはアレイを使用して、トランスクリプトームが測定される。
10.5 増幅方法の例
また、同じ反応ボリューム(例えば、全ての標的座位を同時に増幅するマルチプレックスPCR反応サンプルの一部)において近傍する、または隣接する標的座位を増幅することが原因の干渉を最小化または防止する改善PCR増幅法が開発されている。これらの方法を使用して、近傍する、または隣接する標的座位を同時に増幅することができ、これにより、異なる反応ボリュームに近傍標的座位を分離させて別々に増幅させて干渉を回避するよりも早く、そして安価になる。
一部の実施形態では、標的座位の増幅は、5’→3’の低エキソヌクレアーゼ活性および/または低鎖置換活性を有するポリメラーゼ(例えば、DNAポリメラーゼ、RNAポリメラーゼ、または逆転写酵素)を使用して実施される。一部の実施形態では、5’→3’エキソヌクレアーゼ活性が低レベルであることにより、近傍プライマー(例えば、非伸長プライマー、またはプライマー伸長中に一つ以上のヌクレオチドが付加されたプライマー)の分解を減少または防止する。一部の実施形態では、鎖置換活性が低レベルであることにより、近傍プライマー(例えば、非伸長プライマー、またはプライマー伸長中に一つ以上のヌクレオチドが付加されたプライマー)の置換を減少または防止する。一部の実施形態では、互いに隣接する標的座位(例えば、標的座位の間に塩基が無い)または隣接する標的座位(例えば、座位が、50、40、30、20、15、10、9、8、7、6、5、4、3、2、または1塩基内にある)が増幅される。一部の実施形態では、一つの座位の3’末端は、次の下流座位の5’末端の50、40、30、20、15、10、9、8、7、6、5、4、3、2、または1塩基以内にある。
一部の実施形態では、例えば一つの反応ボリュームにおいて同時増幅することにより、少なくとも100、200、500、750、1,000、2,000、5,000、7,500、10,000、20,000、25,000、30,000、40,000、50,000、75,000、または100,000個の異なる標的座位が増幅される。一部の実施形態では、増幅産物の少なくとも50、60、70、80、90、95、96、97、98、99または99.5%が、標的アンプリコンである。様々な実施形態において、標的アンプリコンである増幅産物の量は、50以上~99.5%以下、例えば60以上~99%以下、70以上~98%以下、80以上~98%以下、90以上~99.5%以下、または95以上~99.5%以下である。一部の実施形態では、標的座位の少なくとも50、60、70、80、90、95、96、97、98、99または99.5%が、例えば一つの反応ボリュームにおける同時増幅により、増幅される(例えば、増幅前の量と比較して、少なくとも5倍、10倍、20倍、30倍、50倍または100倍増幅される)。様々な実施形態において、増幅される(例えば、増幅前の量と比較して少なくとも5倍、10倍、20倍、30倍、50倍または100倍増幅される)標的座位の量は、50以上~99.5%以下、例えば、60以上~99%以下、70以上~98%以下、80以上~99%以下、90以上~99.5%以下、95以上~99.9%以下、または98以上~99.99以下である。一部の実施形態では、より少ない非標的アンプリコンが産生される。例えば、第一のプライマー対からのフォワードプライマーと第二のプライマー対からのリバースプライマーから形成されるアンプリコンは少ない。そうした望ましくない非標的アンプリコンは、過去の増幅方法を使用して、例えば第一のプライマー対からのリバースプライマー、および/または第二のプライマー対からのフォワードプライマーが、分解および/または置換された場合などに、産生される可能性がある。
一部の実施形態では、伸長されるプライマーに結合するポリメラーゼが、5’→3’エキソヌクレアーゼ活性が低い、および/または鎖置換活性が低いポリメラーゼであった場合に、近傍プライマー(例えば、次の下流プライマー)を分解および/または置換する可能性が低いため、これらの方法によって、より長時間の伸長時間を用いることが可能となる。様々な実施形態において、ポリメラーゼの伸長速度によって、伸長するプライマーに付加されるヌクレオチドの数が、プライマー結合部位の3’末端と同鎖上の次の下流プライマー結合部位の5’末端の間のヌクレオチド数の80、90、95、100、110、120、130、140、150、175または200%以上になる反応条件(例えば伸長時間と温度など)が使用される。
一部の実施形態では、DNAポリメラーゼを使用して、DNAを鋳型として使用したDNAアンプリコンが産生される。一部の実施形態では、RNAポリメラーゼを使用して、DNAを鋳型として使用したRNAアンプリコンが産生される。一部の実施形態では、逆転写酵素を使用して、RNAを鋳型として使用したcDNAアンプリコンが産生される。
一部の実施形態では、ポリメラーゼの5’→3’エキソヌクレアーゼ活性レベルの低さは、同条件下での同量のThermus aquaticus ポリメラーゼ(“Taq”ポリメラーゼであり、好熱細菌(thermophilic bacterium)に由来する、普遍的に使用されるDNAポリメラーゼである。PDB 1BGX、EC 2.7.7.7。Muraliら、“Crystal structure of Taq DNA polymerase in complex with an inhibitory Fab:the Fab is directed against an intermediate in the helix-coil dynamics of the enzyme,”Proc.Natl.Acad.Sci.USA 95:12562-12567,1998。当該文献はその全体で参照により本明細書に組み込まれる)の活性の80、70、60、50、40、30、20、10、5、1、または0.1%未満である。一部の実施形態では、ポリメラーゼの鎖置換活性レベルの低さは、同条件下での同量のTaqポリメラーゼの活性の80、70、60、50、40、30、20、10、5、1または0.1%未満である。
一部の実施形態では、ポリメラーゼは、PUSHION DNAポリメラーゼ、例えば、PHUSION High Fidelity DNA ポリメラーゼ(M0530S、New England BioLabs,Inc.)またはPHUSION Hot Start Flex DNAポリメラーゼ(M0535S、New England BioLabs,Inc.;Frey and Suppman BioChemica.2:34-35,1995;Chester and Marshak Analytical Biochemistry.209:284-290,1993。当該文献はその全体で参照により本明細書に組み込まれる)である。PHUSION DNAポリメラーゼは、処理能力強化ドメインと融合されたパイロコッカス様酵素である。PHUSION DNAポリメラーゼは、5’→3’ポリメラーゼ活性と、3’→5’エキソヌクレアーゼ活性を有し、平滑末端産物を生成する。PHUSION DNAポリメラーゼは、5’→3’エキソヌクレアーゼ活性と、鎖置換活性を欠く。
一部の実施形態においては、ポリメラーゼは、Q5(登録商標)DNAポリメラーゼ、例えば、Q5(登録商標)High-Fidelity DNA ポリメラーゼ(M0491S、New England BioLabs,Inc.)またはQ5(登録商標)Hot Start High-Fidelity DNAポリメラーゼ(M0493S、New England BioLabs,Inc.)である。Q5(登録商標)High-Fidelity DNAポリメラーゼは、処理能力強化Sso7dドメインに融合された、3’→5’エキソヌクレアーゼ活性を有する高忠実性、熱安定性のDNAポリメラーゼである。Q5(登録商標)High-Fidelity DNAポリメラーゼは、5’→3’エキソヌクレアーゼ活性と、鎖置換活性を欠く。
一部の実施形態では、ポリメラーゼは、T4 DNAポリメラーゼである(M0203S、New England BioLabs,Inc.;Tabor and Struh.(1989).“DNA-Dependent DNA Polymerases,” In Ausebel et al.(Ed.),Current Protocols in Molecular Biology.3.5.10-3.5.12.New York:John Wiley & Sons,Inc.,1989;Sambrook et al.Molecular Cloning:A Laboratory Manual.(2nd ed.),5.44-5.47.Cold Spring Harbor:Cold Spring Harbor Laboratory Press,1989。当該文献はその全体で参照により本明細書に組み込まれる)。T4 DNAポリメラーゼは、5’→3’方向にDNA合成を触媒し、鋳型およびプライマーの存在を必要とする。この酵素は3’→5’のエキソヌクレアーゼ活性を有し、この活性は、DNAポリメラーゼIの活性よりもはるかに高い。T4 DNAポリメラーゼは、5’→3’のエキソヌクレアーゼ活性と鎖置換活性を欠く。
一部の実施形態では、ポリメラーゼは、Sulfolobus DNA Polymerase IVである((M0327S、New England BioLabs,Inc.;(Boudsocq et al.(2001).Nucleic Acids Res.,29:4607-4616,2001;McDonald,et al.(2006).Nucleic Acids Res.,34:1102-1111,2006。当該文献はその全体で参照により本明細書に組み込まれる)。Sulfolobus DNA Polymerase IVは、様々なDNA鋳型損傷部位にわたり効率的にDNAを合成する、熱安定性のYファミリー損害部位バイパスDNAポリメラーゼである(McDonald,J.P.ら、(2006).Nucleic Acids Res.,34,1102-1111。当該文献はその全体で参照により本明細書に組み込まれる)。Sulfolobus DNA Polymerase IVは、5’→3’のエキソヌクレアーゼ活性と鎖置換活性を欠く。
一部の実施形態では、プライマーがSNPを有する領域に結合する場合、当該プライマーは、異なる効率で様々なアレルに結合し、増幅するか、または一つのアレルのみに結合し、増幅し得る。ヘテロ接合性の対象については、アレルのうちの一つがプライマーにより増幅されない場合がある。一部の実施形態では、プライマーは、各アレルに対して設計される。例えば、二つのアレル(例えば、バイアレル性SNP)が存在する場合、標的座位の同じ位置に結合するために二つのプライマーを使用することができる(例えば、Aアレルに結合するフォワードプライマーと、Bアレルに結合するフォワードプライマー)。例えば、dbSNPデータベースなどの標準的な方法を使用して、ヘテロ接合率が高いSNPホットスポットなどの、公知のSNPの位置を決定することができる。
一部の実施形態では、アンプリコンのサイズは類似している。一部の実施形態では、標的アンプリコンの長さの範囲は、100、75、50、25、15、10、または5ヌクレオチド未満である。一部の実施形態(例えば、断片化されたDNAまたはRNA中の標的座位の増幅など)では、標的アンプリコンの長さは、例えば、60以上~80ヌクレオチド以下、または60以上~75ヌクレオチド以下など、50以上~100ヌクレオチド以下である。一部の実施形態(例えば、エクソンまたは遺伝子全体にわたる、複数の標的座位の増幅など)では、標的アンプリコンの長さは、100以上~500ヌクレオチド以下、例えば150以上~450ヌクレオチド以下、200以上~400ヌクレオチド以下、200以上~300ヌクレオチド以下、または300以上~400ヌクレオチド以下である。
一部の実施形態では、複数の標的座位は、プライマー対を使用して同時に増幅され、当該ペアは、当該反応ボリューム中の増幅される各標的座位に対するフォワードプライマーとリバースプライマーを含む。一部の実施形態では、1ラウンドのPCRは、標的座位あたり一つのプライマーを用いて行われ、その後の第二ラウンドのPCRは、標的座位あたり一つのプライマー対を用いて行われる。例えば、第一ラウンドのPCRは、標的座位あたり一つのプライマーを用いて実施されてもよく、それにより、(例えば、各座位に対するフォワードプライマーを使用して)全てのプライマーが同じ鎖に結合する。その結果、PCRは直線的に増幅することができ、配列の差異または長さの差異を原因とするアンプリコン間の増幅バイアスは減少または消滅する。一部の実施形態では、次いでアンプリコンは、各標的座位に対するフォワードプライマーとリバースプライマーを使用して増幅される。
10.6 プライマー設計方法の例
望ましい場合、マルチプレックスPCRは、プライマー二量体を形成する尤度が低いプライマーを使用して実施されてもよい。特に、高度に多重化されたPCRはしばしば、例えばプライマー二量体の形成など、非生産的な副反応から生じるDNA産物を非常に高割合で生じさせる場合がある。一つの実施形態では、非生産的な副反応を引き起こす可能性が最も高い特定のプライマーをプライマーライブラリーから取り除き、ゲノムにマッピングされる増幅DNAの割合が高くなるプライマーライブラリーを得てもよい。問題のあるプライマー、すなわち、特に二量体を形成する可能性が高いプライマーを取り除く工程によって、予想外なことに、その後のシーケンスによる分析に対し、非常に高レベルのPCR多重化が可能となった。
マッピングされないプライマー二量体、または他のプライマー損害産物の量が最小化されるライブラリーのためにプライマーを選択する方法は多く存在する。実験データは、少数の「不良」プライマーが、大量の非マッピングプライマー二量体の副反応の原因であることを示している。これらの「不良」プライマーを除去することにより、標的座位にマッピングする配列リードの割合を増加させることができる。標的増幅によって増幅されたDNAのシーケンスデータを調べることが、「不良」プライマーを特定する一つの方法である。最大頻度で見られるプライマー二量体を除去して、ゲノムにマッピングされない副産物DNAをもたらす可能性が有意に低いプライマーライブラリーを得ることができる。また、様々なプライマーの組み合わせの結合エネルギーを計算することができるプログラムも公的に利用可能であり、最も高い結合エネルギーを有する組み合わせを除去することによっても、ゲノムにマッピングされない副産物DNAをもたらす可能性が有意に低いプライマーライブラリーが得られる。
プライマー選択に関する一部の実施形態では、候補標的座位に対して一つ以上のプライマーまたはプライマー対を設計することによって、候補プライマーの初期ライブラリーが作製される。候補標的座位(例えばSNP)のセットは、例えば、標的集団内のSNP頻度またはSNPのヘテロ接合性率など、標的座位の望ましいパラメータに関する、公的に利用可能な情報に基づき選択することができる。一つの実施形態では、PCRプライマーは、Primer3プログラム(primer3.sourceforge.netのワールドワイドウェブ、libprimer3 release2.2.3、参照によりその全体が本明細書に組み込まれる)を使用して設計されてもよい。望ましい場合、プライマーは、特定のアニーリング温度範囲内でアニーリングするように設計されてもよく、特定のGC含量範囲を有するよう設計されてもよく、特定のサイズ範囲を有するよう設計されてもよく、特定のサイズ範囲の標的アンプリコンを産生するよう設計されてもよく、および/または他のパラメータ特性を有するように設計されてもよい。候補標的座位あたり、複数のプライマーまたはプライマー対から始めると、標的座位の大部分またはすべてに対するプライマーまたはプライマー対がライブラリー中に残る尤度が高くなる。一つの実施形態では、選択基準は、標的座位あたり少なくとも一つのプライマー対がライブラリーに残ることを必要とする場合がある。そのほうが、標的座位のほとんどまたは全てが、最終プライマーライブラリーを使用することで増幅される。これは、例えばゲノム内の多数の場所での欠失または重複のスクリーニング、または疾患もしくは疾患のリスク増加に関連する多数の配列(例えば、多型または他の変異)のスクリーニングなどの用途に望ましい。ライブラリーからのプライマー対が、別のプライマー対によって生成された標的アンプリコンと重複する標的アンプリコンを生成する場合、当該プライマー対のうちの一つをライブラリーから除去して、干渉を防止してもよい。
一部の実施形態では、候補プライマーのライブラリーからの二つのプライマーの可能性のある組み合わせのほとんどまたはすべてについて、「望ましくないスコア」(スコアが高いと、望ましさは最も少なくなる)が計算される(例えば、コンピューター上の計算など)。様々な実施形態において、望ましくないスコアは、ライブラリー中の候補プライマーの可能性のある組み合わせの少なくとも80、90、95、98、99、または99.5%について計算される。望ましくないスコアはそれぞれ、当該二つの候補プライマー間の二量体形成の尤度に少なくとも部分的に基づいている。必要に応じて、望ましくないスコアは、当該標的座位のヘテロ接合性の比率、標的座位での配列(例えば、多型)と関連する罹患率、当該標的座位での配列(例えば、多型)と関連する疾患浸透率(disease penetrance)、標的座位に対する候補プライマーの特異度、候補プライマーのサイズ、標的アンプリコンの融点、標的アンプリコンのGC含量、標的アンプリコンの増幅効率、標的アンプリコンのサイズ、および組み換えホットスポットの中心からの距離、からなる群から選択される一つ以上の他のパラメータに依存してもよい。一部の実施形態では、標的座位に対する候補プライマーの特異度は、当該候補プライマーが、増幅するよう設計された標的座位以外の座位に結合および増幅することによりミスプライムする尤度を含む。一部の実施形態では、ミスプライムする一つ以上またはすべての候補プライマーが、ライブラリーから除去される。一部の実施形態では、選択する候補プライマーの数を増やすために、ミスプライムの可能性がある候補プライマーは、ライブラリーから除去されない。複数の因子が検討される場合、望ましくないスコアは、様々なパラメータの加重平均に基づいて計算されてもよい。パラメータは、プライマーが使用される特定の用途に対するその重要性に基づいて様々な重みに割り当てられ得る。一部の実施形態では、望ましくないスコアが最も高いプライマーが、ライブラリーから除去される。除去されたプライマーが、一つの標的座位にハイブリダイズするプライマー対のメンバーである場合、当該プライマー対の他方のメンバーも、ライブラリーから除去されてもよい。プライマーを除去するプロセスは、必要に応じて繰り返されてもよい。一部の実施形態では、ライブラリーに残っている候補プライマーの組み合わせに対し、望ましくないスコアがすべて最小閾値以下になるまで、選択方法が実施される。一部の実施形態では、選択方法は、ライブラリーに残っている候補プライマーの数が所望の数に減少するまで実施される。
様々な実施形態において、望ましくないスコアが計算された後、第一の最小閾値を超える望ましくないスコアを有する二つの候補プライマーの組み合わせの最大数の一部である候補プライマーが、ライブラリーから除去される。この工程では、第一の最小閾値以下の相互作用はあまり重要ではないため、無視される。除去されたプライマーが、一つの標的座位にハイブリダイズするプライマー対のメンバーである場合、当該プライマー対の他方のメンバーも、ライブラリーから除去されてもよい。プライマーを除去するプロセスは、必要に応じて繰り返されてもよい。一部の実施形態では、ライブラリーに残っている候補プライマーの組み合わせに対し、望ましくないスコアがすべて第一の最小閾値以下になるまで、選択方法が実施される。ライブラリーに残っている候補プライマーの数が所望よりも多い場合、第一の最小閾値を、さらに低い第二の最小閾値にまで低下させ、プライマーを取り除くプロセスを繰り返すことによって、プライマーの数を減少させてもよい。ライブラリーに残っている候補プライマーの数が所望よりも少ない場合、第一の最小閾値を、さらに高い第二の最小閾値にまで上昇させて、元々の候補プライマーライブラリーを使用してプライマーを取り除くプロセスを繰り返し、より多くの候補プライマーがライブラリーに残れるようにすることにより、当該方法を継続させることができる。一部の実施形態では、ライブラリーに残っている候補プライマーの組み合わせに対し、望ましくないスコアがすべて第二の最小閾値以下になるまで、またはライブラリーに残っている候補プライマーの数が所望の数に減少するまで、選択方法が実施される。
必要に応じて、別のプライマー対によって生成された標的アンプリコンと重複する、標的アンプリコンを生成するプライマー対を、別の増幅反応に分割することができる。候補標的座位の全てを分析することが望ましいアプリケーションに対しては、(重複標的アンプリコンが原因で分析から候補標的座位を省く代わりに)複数回のPCR増幅反応が望ましい場合がある。
これらの選択方法は、ライブラリーから除去する必要のある候補プライマーの数を最小化し、プライマー二量体の望ましい現象を実現する。ライブラリーから少数の候補プライマーを除去することによって、得られたプライマーライブラリーを使用し、より多くの(または全ての)標的座位を増幅することができる。
多数のプライマーを多重化することにより、含有され得るアッセイにかなりの制限が課される。意図せずに相互作用するアッセイは、偽の増幅産物を生じさせる。ミニPCRのサイズ制約は、さらなる制約をもたらす場合がある。一つの実施形態では、非常に多数の潜在的SNP標的(約500~100万個超)から開始することが可能であり、各SNPを増幅するプライマーを設計しようと試みることが可能である。プライマーを設計することが可能な場合、DNA二本鎖形成に関して公開されている熱力学的なパラメータを使用して、全ての可能性のあるプライマー対の間の偽プライマー二本鎖形成の尤度を評価することにより、偽生成物が形成される可能性の高いプライマー対を特定する試みが可能となる。プライマー相互作用は、当該相互作用に関連するスコア化関数によってランク付けされてもよく、最も悪い相互作用スコアを有するプライマーは、所望のプライマー数が満たされるまで取り除かれる。ヘテロ接合性である可能性が高いSNPが最も有用である場合、アッセイのリストをランク付けし、最もヘテロ接合性に適合するアッセイを選択することも可能である。実験により、高い相互作用スコアを有するプライマーが、プライマー二量体を形成する可能性が最も高いことが実証された。高度に多重化された場合、すべての偽相互作用を取り除くことは不可能であるが、インシリコで最も高い相互作用スコアを有するプライマーまたはプライマー対は反応全体で優位に働き、意図される標的からの増幅が大幅に制限されてしまうため、それらを取り除くことは不可欠である。この手順を実施して、最大で10,000個、場合によっては10,000個を超えるプライマーの多重プライマーセットを生成した。この手順による改善は大きく、すべてのPCR産物のシーケンスによって決定したところ、最も不良なプライマーが取り除かれなかった場合の反応からの10%と比較して、標的産物の80%超、90%超、95%超、98%超、さらには99%超の増幅を可能にする。前述の部分的セミ入れ子型法と組み合わせた場合、90%超、さらには95%超のアンプリコンが標的配列にマッピングされ得る。
どのPCRプローブが二量体を形成する可能性が高いかを決定する方法が他にもあることに留意されたい。一つの実施形態では、最適化されていないプライマーセットを使用して増幅されたDNAのプールを分析することで、充分に問題のあるプライマーを決定し得る。例えば、シーケンスを使用して分析が行われてもよく、最大数で存在する二量体は、二量体を形成する可能性が最も高いものと判定され、除去され得る。一つの実施形態では、プライマーの設計方法は、本明細書に記載されるミニPCR方法と組み合わせて使用されてもよい。
プライマー上のタグの使用は、プライマー二量体産物の増幅およびシーケンスを低減し得る。一部の実施形態では、プライマーは、タグとともにループ構造を形成する内部領域を含有する。特定の実施形態では、プライマーは、標的座位に特異的な5’領域、標的座位に特異的ではなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。一部の実施形態では、ループ領域は、二つの結合領域の間にある場合もあり、当該二つの結合領域は、鋳型DNAの連続領域または隣接領域に結合するよう設計されている。様々な実施形態では、3’領域の長さは、少なくとも7ヌクレオチドである。一部の実施形態では、3’領域の長さは、7以上~20ヌクレオチド以下、例えば、7以上~15ヌクレオチド以下、または7以上~10ヌクレオチド以下である。様々な実施形態では、プライマーは、標的座位に特異的ではない5’領域(例えば、タグまたはユニバーサルプライマー結合部位)、次いで標的座位に特異的な領域、標的座位に特異的ではなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。タグプライマーを使用して、必要な標的特異的配列を20塩基対未満、15塩基対未満、12塩基対未満、さらには10塩基対未満にまで短縮することができる。これは、標的配列がプライマー結合部位内で断片化されているときの標準的なプライマー設計で予期せぬ出来事であり得、またはプライマー設計内に策定され得る。この方法の利点としては、特定の最大アンプリコン長について設計可能なアッセイの数を増加させること、およびプライマー配列の「非情報的」なシーケンスを短縮すること、が挙げられる。また、内部タグ付けと組み合わせて使用されてもよい。
一つの実施形態では、多重化標的PCR増幅中の非生産的な産物の相対量は、アニーリング温度を上昇させることによって減少させることができる。標的特異的プライマーと同じタグを用いてライブラリーを増幅する場合、タグがプライマー結合に寄与するため、ゲノムDNAと比較してアニーリング温度を上昇させることができる。一部の実施形態では、任意でアニーリング時間を長くしながら、プライマー濃度を低下させる。一部の実施形態では、アニーリング時間は、3分より長く、5分より長く、8分より長く、10分より長く、15分より長く、20分より長く、30分より長く、60分より長く、120分より長く、240分より長く、480分より長く、さらには960分より長くてもよい。特定の例示的な実施形態では、プライマー濃度を低下させながら、長いアニーリング時間が用いられる。様々な実施形態において、例えば3分、5分、8分、10分、または15分超など、通常よりも長い伸長時間が用いられる。一部の実施形態では、プライマー濃度は、50nM、20nM、10nM、5nM、1nMの低さ、さらには1nMよりも低い。これにより驚くべきことに、例えば、1,000-多重化反応、2,000-多重化反応、5,000-多重化反応、10,000-多重化反応、20,000-多重化反応、50,000-多重化反応、さらには100,000-多重化反応など、高度に多重化された反応に対して安定的な性能がもたらされる。一つの実施形態では、増幅は、長いアニーリング時間での1サイクル、2サイクル、3サイクル、4サイクル、または5サイクルのランを用いて、次いでタグ付けされたプライマーを用いた通常のアニーリング時間でのPCRサイクルで行われる。
標的位置を選択するために、候補プライマー対のプールの設計から開始し、プライマー対の間での潜在的に有害な相互作用に関する熱力学的モデルを作成し、次いで当該モデルを使用して、プール内の他の設計との適合性が無い設計を排除してもよい。
一つの実施形態では、本発明は、標的座位(例えば、疾患もしくは障害に関連する多型または変異、または例えば癌などの疾患もしくは障害に対するリスク増加に関連する多型または変異を含みうる座位)の数を減少させる方法、および/または検出された疾患負荷を増加させる(例えば、検出された多型または変異の数を増加させる)方法を特徴とする。一部の実施形態では、当該方法は、例えば癌などの疾患または障害を有する対象の中での各座位の多型または変異(例えば、一塩基変動、挿入、または欠失、または本明細書に記載される他の変動のいずれかなど)の頻度または再発率により、座位をランク付け(例えば、最高位から最低位までのランク付け)することを含む。一部の実施形態では、PCRプライマーは、座位の一部または全てに対して設計される。プライマーライブラリーに関してPCRプライマーを選択する間は、より高い頻度または再発率の座位(より高くランク付けされた座位)に対するプライマーが、より低い頻度または再発率の座位(より低くランク付けされた座位)でのプライマーよりも好ましい。一部の実施形態では、当該パラメータは、本明細書に記載される望ましくないスコアの計算におけるパラメータの一つとして含まれる。必要に応じて、ライブラリー中の他の設計との適合性のないプライマー(例えば、高くランク付けされた座位に対するプライマー)を、異なるPCRライブラリー/プールに含めることができる。一部の実施形態では、すべてのライブラリー/プールにより現れる座位のすべて(または大部分)の増幅を行うために、複数のライブラリー/プール(例えば、2、3、4、5またはそれ以上)は、別個のPCR反応で使用される。一部の実施形態では、当該方法は、充分なプライマーが一つ以上のライブラリー/プールに含有され、当該プライマーにより、疾患または障害に関して全体として望ましい疾患負荷が(例えば、疾患負荷の少なくとも80、85、90、95、または99%の検出により)捕捉され得るまで継続される。
10.7 プライマーライブラリーの例
一つの態様では、本発明は、本発明方法のいずれかを使用して候補プライマーのライブラリーから選択されたプライマーなど、プライマーのライブラリーを特徴とする。一部の実施形態では、ライブラリーは、一つの反応ボリュームにおいて、少なくとも100、200、500、750、1,000、2,000、5,000、7,500、10,000、20,000、25,000、30,000、40,000、50,000、75,000、または100,000個の異なる標的座位に同時にハイブリダイズする(または同時にハイブリダイズする能力を有する)、または同時に増幅する(または同時に増幅する能力を有する)プライマーを含む。様々な実施形態において、ライブラリーは、一つの反応ボリュームにおいて、100以上~500以下、500以上~1,000以下、1,000以上~2,000以下、2,000以上~5,000以下、5,000以上~7,500以下、7,500以上~10,000以下、10,000以上~20,000以下、20,000以上~25,000以下、25,000以上~30,000以下、30,000以上~40,000以下、40,000以上~50,000以下、50,000以上~75,000以下、または75,000以上~100,000以下の異なる標的座位を同時に増幅する(または同時に増幅する能力を有する)プライマーを含む。様々な実施形態において、ライブラリーは、一つの反応ボリュームにおいて、1,000以上~100,000以下の異なる標的座位、例えば、1,000以上~50,000以下、1,000以上~30,000以下、1,000以上~20,000以下、1,000以上~10,000以下、2,000以上~30,000以下、2,000以上~20,000以下、2,000以上~10,000以下、5,000以上~30,000以下、5,000以上~20,000以下、or 5,000以上~10,000以下の異なる標的座位を同時に増幅する(または同時に増幅する能力を有する)プライマーを含む。一部の実施形態では、ライブラリーは、一つの反応ボリュームにおいて標的座位を同時に増幅する(または同時に増幅する能力を有する)プライマーを含み、増幅産物の60、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.5%未満がプライマー二量体である。様々な実施形態で、プライマー二量体である増幅産物の量は、0.5以上~60%以下、例えば、0.1以上~40%以下、0.1以上~20%以下、0.25以上~20%以下、0.25以上~10%以下、0.5以上~20%以下、0.5以上~10%以下、1以上~20%以下または1以上~10%以下である。一部の実施形態では、プライマーは、一つの反応ボリュームにおいて標的座位を同時に増幅し(または同時に増幅する能力を有し)、それにより増幅産物の少なくとも50、60、70、80、90、95、96、97、98、99または99.5%が、標的アンプリコンである。様々な実施形態において、標的アンプリコンである増幅産物の量は、50以上~99.5%以下、例えば60以上~99%以下、70以上~98%以下、80以上~98%以下、90以上~99.5%以下、または95以上~99.5%以下である。一部の実施形態では、プライマーは一つの反応ボリュームにおいて標的座位を同時に増幅し(または同時に増幅する能力を有し)、それにより標的座位の少なくとも50、60、70、80、90、95、96、97、98、99または99.5%が増幅される(例えば、増幅前の量と比較して、少なくとも5倍、10倍、20倍、30倍、50倍または100倍増幅される)。様々な実施形態において、増幅される(例えば、増幅前の量と比較して少なくとも5倍、10倍、20倍、30倍、50倍または100倍増幅される)標的座位の量は、50以上~99.5%以下、例えば、60以上~99%以下、70以上~98%以下、80以上~99%以下、90以上~99.5%以下、95以上~99.9%以下、または98以上~99.99以下である。一部の実施形態では、プライマーのライブラリーは、少なくとも100、200、500、750、1,000、2,000、5,000、7,500、10,000、20,000、25,000、30,000、40,000、50,000、75,000または100,000個のプライマー対を含み、この場合においてプライマーの各対は、フォワード試験プライマーとリバース試験プライマーを含み、各試験プライマーの対が、標的座位にハイブリダイズする。一部の実施形態では、プライマーのライブラリーは、異なる標的座位に各々ハイブリダイズする少なくとも100、200、500、750、1,000、2,000、5,000、7,500、10,000、20,000、25,000、30,000、40,000、50,000、75,000または100,000個の個々のプライマーを含み、この場合において個々のプライマーはプライマー対の一部ではない。
様々な実施形態において、各プライマーの濃度は、100、75、50、25、20、10、5、2、もしくは1nM未満、または500、100、10、もしくは1μm未満である。様々な実施形態において、各プライマーの濃度は、1μM以上~100nM以下、例えば、1μM以上~1nM以下、1nM以上~75nM以下、2nM以上~50nM以下、または5nM以上~50nM以下である。様々な実施形態において、プライマーのGC含量は、30以上~80%以下、例えば、40以上~70%以下、または50以上~60%以下である。一部の実施形態では、プライマーのGC含量の範囲は、30、20、10、または5%未満である。一部の実施形態では、プライマーのGC含量の範囲は、5以上~30%以下、例えば、5以上~20%以下または5以上~10%以下である。一部の実施形態では、試験プライマーの融点(T)は、40以上~80℃以下、例えば50以上~70℃以下、55以上~65℃以下、または57以上~60.5℃以下である。一部の実施形態では、Tは、内臓SantaLuciaパラメータ(primer3.sourceforge.netのワールドワイドウェブ)を使用して、Primer3プログラム(libprimer3、リリース2.2.3)を使用して計算される。一部の実施形態では、プライマーの融点の範囲は、15、10、5、3、または1℃未満である。一部の実施形態では、プライマーの融点の範囲は、1以上~15℃以下、例えば1以上~10℃以下、1以上~5℃以下、または1以上~3℃以下である。一部の実施形態では、プライマーの長さは、15以上~100ヌクレオチド以下、例えば15以上~75ヌクレオチド以下、15以上~40ヌクレオチド以下、17以上~35ヌクレオチド以下、18以上~30ヌクレオチド以下、または20以上~65ヌクレオチド以下である。一部の実施形態では、プライマーの長さの範囲は、50、40、30、20、10、または5ヌクレオチド未満である。一部の実施形態では、プライマーの長さの範囲は、5以上~50ヌクレオチド以下、例えば、5以上~40ヌクレオチド以下、5以上~20ヌクレオチド以下、または5以上~10ヌクレオチド以下である。一部の実施形態では、標的アンプリコンの長さは、例えば、60以上~80ヌクレオチド以下、または60以上~75ヌクレオチド以下など、50以上~100ヌクレオチド以下である。一部の実施形態では、標的アンプリコンの長さの範囲は、50、25、15、10、または5ヌクレオチド未満である。一部の実施形態では、標的アンプリコンの長さの範囲は、5以上~50ヌクレオチド以下、例えば、5以上~25ヌクレオチド以下、5以上~15ヌクレオチド以下、または5以上~10ヌクレオチド以下である。一部の実施形態では、ライブラリーは、マイクロアレイを含まない。一部の実施形態では、ライブラリーは、マイクロアレイを含む。
一部の実施形態では、アダプターもしくはプライマーの一部(例えば少なくとも80、90、または95%)またはすべては、隣接ヌクレオチド間に、天然に存在するホスホジエステル結合以外の結合を一つ以上含む。そうした結合の例としては、ホスホラミド、ホスホロチオエート、およびホスホロジチオエート結合が挙げられる。一部の実施形態では、アダプターもしくはプライマーの一部(例えば少なくとも80、90、または95%)またはすべては、最後の3’ヌクレオチドと、最後の3’ヌクレオチドの一つ前の間にチオリン酸塩(例えばモノチオリン酸塩)を含む。一部の実施形態では、アダプターもしくはプライマーの一部(例えば少なくとも80、90、または95%)またはすべては、3’末端の最後の2、3、4、または5ヌクレオチドの間にチオリン酸塩(例えばモノチオリン酸塩)を含む。一部の実施形態では、アダプターもしくはプライマーの一部(例えば少なくとも80、90、または95%)またはすべては、3’末端の最後の10ヌクレオチドの外側の少なくとも1、2、3、4または5ヌクレオチドの間にチオリン酸塩(例えばモノチオリン酸塩)を含む。一部の実施形態では、そうしたプライマーは、切断または分解される可能性が低い。一部の実施形態では、プライマーは、酵素切断部位(例えば、プロテアーゼ切断部位)を含有しない。
追加的なマルチプレックスPCR法およびライブラリーの例は、2012年11月21日に出願された米国特許出願第13/683,604号(米国特許出願公開第2013/0123120号)および2014年5月16日に出願された米国特許出願第61/994,791号に記載されており、これらは各々参照によりその全体が本明細書に組み込まれる)。これらの方法およびライブラリーは、本明細書に開示されるサンプルのいずれかの分析に使用することができ、および本発明方法のいずれかに使用することができる。
10.8 組み換え検出用のプライマリーライブラリーの例
一部の実施形態では、プライマーライブラリー中のプライマーは、一つ以上の公知の組み換えホットスポット(例えば相同なヒト染色体間の交差など)で組み換えが生じたかを判定するように設計される。染色体間でどのような交差が発生したかを知ることで、個体に対し、より正確に相決定された遺伝子データを判定することができる。組み換えホットスポットは、組み換え事象が集中する傾向がある染色体の局所的領域である。多くの場合、ホットスポットは、平均組み換え頻度よりも低い領域である“コールドスポット”に隣接される。組み換えホットスポットは、似た形態を共有する傾向があり、およそ1~2キロ塩基対(kbp)の長さである。ホットスポット分布は、GC含量および反復因子の分布と正に相関する。部分的に変性した13merのモチーフであるCCNCCNTNNCCNCは、いくつかのホットスポットの活性において役割を果たしている。PRDM9と呼ばれるジンクフィンガータンパク質がこのモチーフに結合し、その位置で組み換えを開始することが示されている。組み換えホットスポットの中心間の平均距離は、約80kbpであると報告されている。一部の実施形態では、組み換えホットスポットの中心間の距離は、約3kb~約100kbの範囲である。公開データベースには、多数の公知のヒト組み換えホットスポットが含まれており、例えば、HUMHOTおよび国際HapMapプロジェクトデータベースがある(例えば、Nishantら、“HUMHOT:a database of human meiotic recombination hot spots,” Nucleic Acids Research,34:D25-D28,2006,Database issue;Mackiewiczら、“Distribution of Recombination Hotspots in the Human Genome - A Comparison of Computer Simulations with Real Data” PLoS ONE 8(6):e65272,doi:10.1371/journal.pone.0065272;、およびhapmap.ncbi.nlm.nih.gov/downloads/index.html.enのワールドワイドウェブを参照のこと。当該資料は、参照によりその全体で本明細書に組み込まれる)。
一部の実施形態では、プライマーライブラリー中のプライマーは、組み換えホットスポット(例えば、公知のヒト組み換えホットスポット)でクラスター化され、またはその近傍でクラスター化される。一部の実施形態では、対応するアンプリコンを使用して、組み換えホットスポット内またはその近傍の配列を決定し、その特定のホットスポットで組み換えが発生したか否かを決定する(例えば、当該アンプリコンの配列が、組み換えが発生した場合に予想される配列であるか、または組み換えが発生しなかった場合に予想される配列であるか)。一部の実施形態では、プライマーは、組み換えホットスポット(および任意で組み換えホットスポットに隣接する配列)の一部またはすべてを増幅するように設計される。一部の実施形態では、長リードシーケンス(例えば、最大で約10kbまでのシーケンスに対しIllumina社が開発したMoleculo Technologyを使用したシーケンス)、または対形成末端シーケンスを使用して、組み換えホットスポットの一部またはすべてをシーケンスする。組み換え事象が発生したか否かに関する知識を使用して、どのハプロタイプブロックがホットスポットに隣接するかを決定することができる。必要に応じて、特定のハプロタイプブロックの存在を、当該ハプロタイプブロック内の領域に特異的なプライマーを使用して確認することができる。一部の実施形態では、公知の組み換えホットスポット間には交差は存在しないと仮定される。一部の実施形態では、プライマーライブラリー中のプライマーは、染色体の末端で、またはその近傍でクラスター化される。例えば、そのようなプライマーを使用して、染色体の末端で特定のアームまたはセクションが存在するか否かを決定することができる。一部の実施形態では、プライマーライブラリー中のプライマーは、組み換えホットスポットで、またその近傍で、および染色体の末端で、またはその近傍でクラスター化される。
一部の実施形態では、プライマーライブラリーは、組み換えホットスポット(例えば、公知のヒト組み換えホットスポット)に特異的であり、および/または組み換えホットスポットの近傍の領域(例えば、組み換えホットスポットの5’末端または3’末端の10、8、5、3、2、1または0.5kb以内)に特異的である一つ以上のプライマー(例えば少なくとも5、10、50、100、200、500、750、1,000、2,000、5,000、7,500、10,000、20,000、25,000、30,000、40,000、もしくは50,000個の異なるプライマーまたは異なるプライマー対)を含む。一部の実施形態では、少なくとも1、5、10、20、40、60、80、100、または150個の異なるプライマー(またはプライマー対)は、同じ組み換えホットスポットに対して特異的であるか、または同じ組み換えホットスポットに対して特異的であるか、もしくは組み換えホットスポットの近傍の領域に対して特異的である。一部の実施形態では、少なくとも1、5、10、20、40、60、80、100、または150種類の異なるプライマー(またはプライマー対)は、組み換えホットスポット間の領域(例えば、組み換えを受けている可能性が低い領域)に対して特異的であり、これらのプライマーを使用して、ハプロタイプブロック(例えば、組み換えが発生したか否かに応じて予想されるもの)の存在を確認することができる。一部の実施形態では、プライマーライブラリー中の少なくとも10、20、30、40、50、60、70、80、または90%のプライマーは、組み換えホットスポットに特異的であり、および/または組み換えホットスポットの近傍の領域(例えば、組み換えホットスポットの5’末端または3’末端の10、8、5、3、2、1、または0.5kb以内)に特異的である。一部の実施形態では、プライマーライブラリーを使用して、5個以上、10個以上、50個以上、100個以上、200個以上、500個以上、750個以上、1,000個以上、2,000個以上、5,000個以上、7,500個以上、10,000個以上、20,000個以上、25,000個以上、30,000個以上、40,000個以上または50,000個以上の異なる組み換えホットスポット(例えば、公知のヒト組み換えホットスポット)で発生したか否かが決定される。一部の実施形態では、組み換えホットスポットまたはその近傍領域に対するプライマーの標的となる領域は、ゲノムの当該部分に沿ってほぼ均等に広がっている。一部の実施形態では、少なくとも1、5、10、20、40、60、80、100、または150個の異なるプライマー(またはプライマー対)は、染色体の末端領域、またはその近傍領域(例えば、染色体の末端から20、10、5、1、0.5、0.1、0.01、または0.001mb以内の領域)に特異的である。一部の実施形態では、プライマーライブラリー中のプライマーの少なくとも10、20、30、40、50、60、70、80、または90%は、染色体の末端領域またはその近傍領域(例えば、染色体の末端から20、10、5、1、0.5、0.1、0.01、または0.001mb以内の領域)に特異的である。一部の実施形態では、少なくとも1、5、10、20、40、60、80、100、または150個の異なるプライマー(またはプライマー対)は、染色体中の潜在的な微小欠失内の領域に特異的である。一部の実施形態では、プライマーライブラリー中のプライマーの少なくとも10、20、30、40、50、60、70、80、または90%は、染色体中の潜在的な微小欠失内の領域に特異的である。一部の実施形態では、プライマーライブラリー中のプライマーの少なくとも10、20、30、40、50、60、70、80、または90%は、組み換えホットスポット、組み換えホットスポットの近傍領域、染色体の末端領域もしくはその近傍領域、または染色体中の潜在的な微小欠失内の領域に特異的である。
10.9 キットの例
一つの態様では、本発明は、例えば本明細書に記載される方法のいずれかを使用して、核酸サンプル中の標的座位を増幅し、染色体セグメントもしくは染色体全体の欠失および/または重複を検出するキットなどのキットを特徴とする。一部の実施形態では、キットは、本発明のプライマーライブラリーのいずれかを含み得る。一つの実施形態では、キットは、複数の内側フォワードプライマーおよび任意で複数の内側リバースプライマー、ならびに任意で外側フォワードプライマーおよび外側リバースプライマーを含み、各プライマーは、標的の染色体または染色体セグメント、および任意で追加の染色体または染色体セグメントの標的部位(例えば、多型部位)のうちの一つからすぐ上流および/またはすぐ下流のDNA領域にハイブリダイズするように設計される。一部の実施形態では、キットは、例えば、本明細書に記載される方法のいずれかを使用して、一つ以上の染色体セグメントまたは染色体全体の一つ以上の欠失および/または重複を検出することを目的とする、標的座位を増幅するためのプライマーライブラリーの使用に関する説明書を含む。
ある実施形態では、本発明のキットは、染色体異数性の検出およびCNV決定のためのプライマー対、例えばCNV(CoNVERGe)(遺伝子型により明らかにされたコピー数バリアント事象:Copy Number Variant Events Revealed Genotypically)および/またはSNVなどの染色体異数性を検出するための大規模な多重化反応のためのプライマー対などを提供する。これらの実施形態では、キットは、少なくとも100、200、250、300、500、1000、2000、2500、3000、5000、10,000、20,000、25,000、28,000、50,000または75,000個、および最大で200、250、300、500、1000、2000、2500、3000、5000、10,000、20,000、25,000、28,000、50,000、75,000または100,000個のプライマー対を含み、それらは一緒に輸送される。プライマー対は、一つの管、例えば一つのチューブもしくはボックス、または複数のチューブもしくはボックスに含有され得る。ある実施形態では、プライマー対は、商業的提供者によって事前に認定されて、一緒に販売され、他の実施形態では、顧客は、カスタムな遺伝子標的および/またはプライマーを選択し、商業的提供者は、当該顧客に対して、一つのチューブでも複数のチューブでもなく、プライマープールを作製および輸送する。ある例示的な実施形態では、キットは、CNVとSNVの両方、特に、少なくとも一つのタイプの癌と相関することが知られているCNVとSNVを検出するためのプライマーを含む。
本発明の一部の実施形態による循環DNA検出用キットは、循環DNA検出のための標準および/または対照を含む。例えばある実施形態では、標準および/または対照は、本明細書に提供される増幅反応を実施するために使用されるプライマー、例えば、CoNVERGeを実施するためのプライマーとともに販売され、ならびに任意で輸送および包装される。ある実施形態では、対照は、例えばCNVなどの一つ以上の染色体異数性を呈し、および/または一つ以上のSNVを含む単離ゲノムDNAなどのDNAといったポリヌクレオチドを含む。ある実施形態では、標準および/または対照は、PlasmArt標準と呼ばれ、特に特定の遺伝性疾患、ならびに癌などの特定の疾患状態においてCNVを呈することが知られているゲノム領域に対する配列同一性、ならびに血漿中に天然に存在するcfDNA断片のサイズ分布を反映するサイズ分布を含む。PlasmArt標準を作製するための方法の例は、本明細書の実施例に提供される。概して、染色体異数性を含むことが知られている源に由来するゲノムDNAを単離し、断片化し、精製して、サイズ選択する。
したがって、人工cfDNAポリヌクレオチドの標準および/または対照は、上述のように調製された単離ポリヌクレオチドサンプルを、染色体異数性および/またはSNVを呈さないことが判明しているDNAサンプルに、例えば当該流体中のDNAの0.01%~20%、0.1~15%、または0.4~10%など、インビボでcfDNAについて実測される濃度と似た濃度で入れることによって作製することができる。これらの標準/対照は、アッセイ設計、特徴解析、開発、および/または検証のための対照として、ならびに、例えば、CLIAラボで実施される癌検査などの検査中の品質管理標準として、ならびに/または研究用途のキットもしくは診断検査キットに含まれる標準として使用することができる。
11.追加的な例示的実施形態
11.1 データベースの例
本発明はまた、本発明方法からの一つ以上の結果を含むデータベースも特徴とする。例えば データベースは、一つ以上の対象について、以下の情報のいずれかを有する記録を含んでもよい:特定された任意の多型/変異(CNVなど)、疾患もしくは障害または疾患もしくは障害のリスク増加と多形/変異の任意の公知の関連性、コードされるmRNAもしくはタンパク質の発現レベルまたは活性レベルに対する多型/変異の影響、サンプル中の総DNA、総RNAまたは総細胞のうちの疾患または障害に関連するDNA、RNAまたは細胞(例えば疾患または障害に関連する多型/変異を有するDNA、RNAまたは細胞)の割合、多形/変異を特定するために使用されるサンプルの供給源(例えば、血液サンプルまたは特定組織由来のサンプル)、疾患細胞の数、その後に検査を繰り返して得られた結果(例えば、疾患もしくは障害の進行または寛解をモニタリングするための検査の繰り返しなど)、疾患または障害の他の検査結果、対象が診断された疾患または障害のタイプ、与えられた治療、当該治療に対する反応、当該治療の副作用、症状(例えば、疾患または障害に関連する症状)、寛解の長さと回数、生存期間の長さ(例えば、初回検査から死亡までの期間の長さ、または診断から死亡までの期間の長さ)、死亡原因、およびそれらの組み合わせ。
一部の実施形態では、データベースは、一つ以上の対象について、以下の情報のいずれかを有する記録を含む:特定された任意の多型/変異、癌または癌のリスク増加と多形/変異の任意の公知の関連性、コードされるmRNAもしくはタンパク質の発現レベルまたは活性レベルに対する多型/変異の影響、サンプル中の総DNA、総RNAまたは総細胞のうちの癌性のDNA、RNAまたは細胞の画分、多形/変異を特定するために使用されるサンプルの供給源(例えば、血液サンプルまたは特定組織由来のサンプル)、癌性細胞の数、腫瘍のサイズ、その後に検査を繰り返して得られた結果(例えば、癌の進行または寛解をモニタリングするための検査の繰り返しなど)、他の癌検査結果、対象が診断された癌のタイプ、与えられた治療、当該治療に対する反応、当該治療の副作用、症状(例えば、癌に関連する症状)、寛解の長さと回数、生存期間の長さ(例えば、初回検査から死亡までの期間の長さ、または癌診断から死亡までの期間の長さ)、死亡原因、およびそれらの組み合わせ。一部の実施形態では、当該治療に対する応答は、以下のいずれかを含む:腫瘍(例えば、良性腫瘍または癌性腫瘍)のサイズの減少または安定化、腫瘍サイズの増加の遅延または防止、腫瘍細胞数を減少または安定化、腫瘍消失とその再発の間の無病生存期間の延長、腫瘍の初回発生とその後の発生の防止、腫瘍に関連する有害な症状の低減または安定化、またはそれらの組み合わせ。一部の実施形態では、例えば癌などの疾患または障害に対する一つ以上の他の検査結果、例えば組織サンプルのスクリーニング検査、医学的撮像、または顕微鏡的検査からの結果が含まれる。
そのような一つの態様において、本発明は、少なくとも5、10、10、10、10、10、10、10、10またはそれ以上の記録を含む電子データベースを特徴とする。一部の実施形態では、データベースは、少なくとも5、10、10、10、10、10、10、10、10またはそれ以上の異なる対象についての記録を有する。
別の態様では、本発明は、本発明のデータベースとユーザーインターフェースを含むコンピューターを特徴とする。一部の実施形態では、ユーザーインターフェースは、一つ以上の記録に含まれる情報の一部またはすべてを表示させる能力を有する。一部の実施形態では、ユーザーインターフェースは、(i)多型または変異を含有するとして特定される、その記録がコンピューターに保存されている一つ以上のタイプの癌、(ii)特定のタイプの癌で特定される、その記録がコンピューターに保存されている一つ以上の多型または変異、(iii)その記録がコンピューターに保存されている、特定のタイプの癌、または特定の多型もしくは変異に関する予後情報、(iv)その記録がコンピューターに保存されている、多型または変異を有する癌に有用な一つ以上の化合物または他の治療、(v)その記録がコンピューターに保存されている、mRNAもしくはタンパク質の発現または活性を調節する一つ以上の化合物、および(vi)その記録がコンピューターに保存されている、化合物によりその発現または活性が調節される一つ以上のmRNA分子またはタンパク質、を表示させる能力を有する。コンピューターの内部構成要素は、典型的には、メモリに結合されたプロセッサを含む。外部構成要素は通常、大容量デバイス、例えばハードディスクドライブ;ユーザー入力デバイス、例えばキーボードおよびマウス;ディスプレイ、例えばモニター;および任意でコンピューターシステムを他のコンピューターに接続させて、データと処理タスクを共有させる能力を有するネットワークリンクを含む。プログラムは、動作中に当該システムのメモリにロードされてもよい。
別の態様では、本発明は、本発明方法のいずれかの一つ以上の工程を含む、コンピューター実装プロセスを特徴とする。
11.2 リスク要因の例
一部の実施形態では、対象は、例えば癌などの疾患または障害に対する一つ以上のリスク因子に関しても評価される。リスク因子の例としては、疾患または障害の家族歴、ライフスタイル(例えば、喫煙および発癌物質への曝露)、および一つ以上のホルモンまたは血清タンパク質のレベル(例えば、肝癌におけるアルファ-フェトプロテイン(AFP)、結腸直腸癌における癌胎児性抗原(CEA)、または前立腺癌における前立腺特異的抗原(PSA))が挙げられる。一部の実施形態では、腫瘍のサイズおよび/または数が測定され、対象の予後決定、または対象の治療選択の際に使用される。
11.3 スクリーニング方法の例
必要に応じて、例えば癌などの疾患または障害の有無を確認してもよく、または例えば癌などの疾患または障害を、任意の標準的な方法を使用して分類してもよい。例えば、例えば癌などの疾患または障害は多くの方法で検出することができ、特定の兆候および症状の存在、腫瘍生検、スクリーニング検査、または医学的撮像(例えば、マンモグラムまたは超音波)が挙げられる。癌の可能性が検出された時点で、組織サンプルの顕微鏡検査により診断を行ってもよい。一部の実施形態では、診断された対象は、複数の時点で、本発明の方法を使用した反復検査、または疾患もしくは障害に対する公知の検査を使用した反復検査を受けて、当該疾患もしくは障害の進行または当該疾患もしくは障害の寛解または再発をモニタリングされる。
11.4 癌の例
本発明方法のいずれかを使用して治療に対する反応性を予測またはモニタリングされ得る、診断、予後予測、安定化、治療、予防され得る癌の例としては、固形腫瘍、癌腫、肉腫、リンパ腫、白血病、胚細胞腫瘍、または芽腫が挙げられる。様々な実施形態では、癌は、急性リンパ芽球性白血病、急性骨髄性白血病、副腎皮質癌、AIDS関連癌、AIDS関連リンパ腫、肛門癌、虫垂癌、星状細胞腫(例えば、小児の小脳または大脳の星状細胞腫)、基底細胞癌、胆管癌(例えば、肝外胆管癌)、膀胱癌、骨癌(例えば、骨肉腫または悪性線維性組織球腫)、脳幹神経膠腫、脳腫瘍(例えば、小脳星状細胞腫、大脳星状細胞腫/悪性神経膠腫、上衣細胞腫、髄芽細胞腫、テント上原始神経外胚葉性腫瘍、または視覚伝導路および視床下部の神経膠腫)、膠芽細胞腫、乳癌、気管支腺腫またはカルチノイド、バーキットリンパ腫、カルチノイド腫瘍(例えば、小児または消化管のカルチノイド腫瘍)、癌性中枢神経系リンパ腫、小脳星状細胞腫もしくは悪性神経膠腫(例えば、小児の小脳星状細胞腫または悪性神経膠腫)、子宮頸癌、小児癌、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖性障害、結腸癌、皮膚t細胞リンパ腫、線維形成性小円形細胞腫瘍、子宮内膜癌、上衣細胞腫、食道癌、ユーイング肉腫、ユーイングファミリー腫瘍における腫瘍、頭蓋外胚葉細胞腫瘍(例えば、小児の頭蓋外胚葉細胞腫瘍)、性腺外胚葉細胞腫瘍、眼癌(例えば、眼内黒色腫または網膜芽細胞腫の眼癌)、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胚細胞腫瘍(例えば、頭蓋外、性腺外または卵巣の胚細胞腫瘍)、妊娠性絨毛性腫瘍、神経膠腫(例えば、脳幹、小児の大脳星状細胞腫、または小児の視覚伝導路および視床下部の神経膠腫)、胃カルチノイド、有毛細胞白血病、頭頸部癌、心臓癌、肝細胞(肝臓)癌、ホジキンリンパ腫、下咽頭癌、視床下部および視覚伝導路の神経膠腫(例えば、小児の視覚伝導路の神経膠腫)、島細胞癌(例えば、内分泌細胞癌または膵島細胞癌)、カポシ肉腫、腎臓癌、喉頭癌、白血病(例えば、急性リンパ芽球性、急性骨髄性、慢性リンパ性、慢性骨髄性、または有毛細胞性の白血病)、口唇癌もしくは口腔癌、脂肪肉腫、肝癌(例えば、非小細胞癌または小細胞癌)、肺癌、リンパ腫(例えば、AIDS関連リンパ腫、バーキットリンパ腫、皮膚T細胞リンパ腫、ホジキンリンパ腫、非ホジキンリンパ腫、または中枢神経系リンパ腫)、マクログロブリン血症(例えば、ワルデンシュトレームマクログロブリン血症、骨の悪性線維性組織球腫または骨肉腫)、髄芽細胞腫(例えば、小児の髄芽細胞腫)、黒色腫、メルケル細胞癌、中皮腫(例えば、成人または小児の中皮腫)、肉眼で発見できない転移性扁平上皮頸部癌、口腔癌、多発性内分泌性新生組織形成性症候群(例えば、小児の多発性内分泌性新生組織形成性症候群)、多発性骨髄腫もしくは形質細胞新生物、菌状息肉腫、骨髄異形成症候群、骨髄異形成疾患または骨髄増殖性疾患、骨髄性白血病(例えば、慢性骨髄性白血病)、骨髄白血病(例えば、成人急性または小児急性の骨髄白血病)、骨髄増殖性障害(例えば、慢性骨髄増殖性障害)、鼻腔癌もしくは副鼻腔癌、上咽頭癌、神経芽腫、口腔癌、口腔咽頭癌、骨肉腫もしくは骨の悪性線維性組織球腫、卵巣癌、卵巣上皮癌、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、膵臓癌(例えば、膵島膵臓癌)、副鼻腔癌もしくは鼻腔癌、副甲状腺癌、陰茎癌、咽頭癌、褐色細胞腫、松果体星状細胞腫、松果体胚細胞腫、松果体芽細胞腫もしくはテント上原始神経外胚葉性腫瘍(例えば、小児の松果体芽細胞腫またはテント上原始神経外胚葉性腫瘍)、下垂体腺腫、形質細胞新生物、胸膜肺芽腫、原発性中枢神経系リンパ腫、癌、直腸癌、腎細胞癌、腎盂癌もしくは尿路癌(例えば、腎盂または尿路の移行細胞癌)、網膜芽細胞腫、横紋筋肉腫(例えば、小児の横紋筋肉腫)、唾液腺癌、肉腫(例えば、ユーイングファミリー腫瘍における肉腫、カポジ肉腫、軟部組織肉腫、または子宮肉腫)、セザリー症候群、皮膚癌(例えば、非黒色腫、黒色腫、またはメルケル細胞皮膚癌)、小腸癌、扁平上皮細胞癌、テント上原始神経外胚葉性腫瘍(例えば、小児のテント上原始神経外胚葉性腫瘍)、T細胞リンパ腫(例えば、皮膚T細胞リンパ腫など)、精巣癌、咽喉癌、胸腺腫(例えば、小児胸腺腫)、胸腺腫もしくは胸腺癌、甲状腺癌(例えば、小児甲状腺癌)、絨毛性腫瘍(例えば、妊娠性絨毛性腫瘍)、原発部位不明の癌(例えば、成人または小児の原発部位不明癌)、尿道癌(例えば、子宮内膜子宮癌など)、子宮肉腫、膣癌、視覚伝導路もしくは視床下部の神経膠腫(例えば、小児の視覚伝導路または視床下部の神経膠腫)、外陰部癌、ワルデンストレームマクログロブリン血症、またはウィルムス腫瘍(例えば、小児のウィルム腫瘍)である。様々な実施形態において、癌は、転移した、または転移していない。
癌は、ホルモンに関連する癌またはホルモン依存性の癌(例えば、エストロゲンまたはアンドロゲンに関連する癌)であっても、なくてもよい。良性腫瘍または悪性腫瘍は、本発明の方法および/または組成物を使用して、診断、予後判定、安定化、治療、または予防されてもよい。
一部の実施形態では、対象は、癌症候群を有する。癌症候群は、一つ以上の遺伝子内の遺伝子変異によって、影響を受ける個体が癌を発症しやすくなる遺伝的障害であり、これら癌の早期発症の原因となる場合もある。癌症候群はしばしば、生涯にわたる高い癌発症リスクだけでなく、複数の独立した原発性腫瘍発症のリスクも示す。これらの症候群の多くは、細胞の癌化防止に関与する腫瘍抑制遺伝子中の変異が原因である。影響を受ける可能性がある他の遺伝子は、DNA修復遺伝子、癌遺伝子、および血管生成(血管新生)に関与する遺伝子である。遺伝性癌症候群の一般的な例は、遺伝性乳癌-卵巣癌症候群、および遺伝性非ポリープ型結腸癌(リンチ症候群)である。
一部の実施形態では、K-ras、p53、BRA、EGFR、またはHER2に一つ以上の多型または変異を有する対象に、それぞれK-ras、p53、BRA、EGFR、またはHER2を標的とする治療が与えられる。
本発明方法は概して、任意の細胞、組織もしくは臓器型の悪性腫瘍または良性腫瘍の治療に適用することができる。
11.5 治療例
必要に応じて、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増大を安定化、治療、または予防するための任意の治療を、対象(例えば、本発明方法のいずれかを使用して、癌を有する、または癌のリスクが高いとして特定された対象)に与えることができる。様々な実施形態では、治療は、例えば癌などの疾患または障害に対する公知の治療または併用治療であり、限定されないが、細胞障害剤、標的化療法、免疫療法、ホルモン療法、放射線治療、癌性細胞もしくは癌となる可能性が高い細胞の外科的除去、幹細胞移植、骨髄移植、光力学的療法、緩和治療、またはそれらの組み合わせが挙げられる。一部の実施形態では、治療(例えば、予防薬)を使用して、例えば癌などの疾患または障害のリスクが高い対象における、例えば癌などの疾患または障害を予防、遅延、または重症度を低下させる。一部の実施形態では、治療は、外科手術、第一選択の化学療法剤、アジュバント療法、またはネオアジュバント療法である。
一部の実施形態では、標的化療法は、癌の増殖と生存に寄与する癌の特定の遺伝子、タンパク質、または組織環境を標的とする治療である。このタイプの治療は、正常な細胞へのダメージを制限しながら、癌細胞の増殖と拡散を防止するものであり、通常、他の癌治療薬よりも副作用が少ない。
大きく成功した方法の一つは、腫瘍周辺の新しい血管増殖である血管新生を標的とする方法である。例えば、ベバシズマブ(Avastin)、レナリドミド(Revlimid)、ソラフェニブ(Nexavar)、スニチニブ(Sutent)、サリドマイド(Thalomid)などの標的化療法が、血管新生に干渉する。別の例は、HER2を過剰発現する癌(例えば、一部の乳癌など)に対する、例えばトラスツズマブまたはラパチニブなどのHER2を標的とする治療の使用である。一部の実施形態では、モノクローナル抗体を使用して、癌細胞の外側の特定の標的をブロックする。例としては、アレムツズマブ(Campath-1H)、ベバシズマブ、セツキシマブ(Erbitux)、パニツムマブ(Vectibix)、ペルツズマブ(Omnitarg)、リツキシマブ(Rituxan)、およびトラスツズマブが挙げられる。一部の実施形態では、モノクローナル抗体のトシツモマブ(Bexxar)を使用して、腫瘍に放射線が送達される。一部の実施形態では、経口低分子が、癌細胞内部の癌プロセスを阻害する。例としては、ダサチニブ(Sprycel)、エルロチニブ(Tarceva)、ゲフィチニブ(Iressa)、イマチニブ(Gleevec)、ラパチニブ(Tykerb)、ニロチニブ(Tasigna)、ソラフェニブ、スニチニブ、およびテムシロリムス(Torisel)が挙げられる。一部の実施形態では、プロテアソーム阻害剤(例えば、多発性骨髄腫の治療薬であるボルテゾミブ(Velcade))が、細胞内の他のタンパク質を分解する酵素である特殊化タンパク質に干渉する。
一部の実施形態では、免疫療法は、身体の自然防御を強化して癌と戦わせるよう設計される。免疫療法の例示的なタイプは、免疫系機能を増強、標的、または回復させるために、身体または実験室のいずれかによって作製される材料を使用する。
一部の実施形態では、ホルモン療法は、体内のホルモンの量を減少させることにより癌を治療する。一部の乳癌および前立腺癌を含む数種の癌は、ホルモンと呼ばれる体内の天然の化学物質の存在下でのみ増殖し、拡散する。様々な実施形態では、ホルモン療法を使用して、前立腺癌、乳癌、甲状腺癌、および生殖系の癌が治療される。
一部の実施形態では、治療は、造血幹細胞と呼ばれる高度に専門化された細胞によって罹患骨髄が置換される幹細胞移植を含む。造血幹細胞は、血流と骨髄の両方に存在する。
一部の実施形態では、治療は、光増感剤と呼ばれる特殊な薬剤を光とともに使用して癌細胞を殺す光力学的療法を含む。薬剤は、特定の種類の光によって活性化された後で機能する。
一部の実施形態では、治療は、癌性細胞、または癌になる可能性が高い細胞の外科的な切除(例えば、腫瘍摘出手術または乳腺切除術)を含む。例えば、乳癌感受性遺伝子変異(BRCA1遺伝子変異、またはBRCA2遺伝子変異)を有する女性は、リスク軽減卵管卵巣摘出術(卵管および卵巣の除去)、および/またはリスク軽減両側乳房切除術(両乳房の除去)を用いて乳癌と卵巣癌のリスクを減少させてもよい。一部の癌の治療を含む、非常に慎重な外科的作業に対しては、非常に強力で精密な光のビームであるレーザーを、刃物(外科用メス)の代わりに使用することができる。
癌を減速、停止、または除去するための治療(疾患指向性治療とも呼ばれる)に加えて、癌ケアの重要な部分は、対象の症状と、例えば疼痛および悪心などの副作用を緩和することである。これには、緩和的または支持的なケアと呼ばれるアプローチである、身体的、感情的、および社会的なニーズで、対象を支援することが含まれる。ヒトはしばしば、疾患指向性治療と、症状緩和のための治療を同時に受けることがある。
例示的な治療としては、アクチノマイシンD、アドセトリス、アドリアマイシン、アルデスロイキン、アレムツズマブ、アリムタ、アムシジン(amsidine)、アムサクリン(amsacrine)、アナストロゾール、アレディア、アリミデックス、アロマシン、アスパラギナーゼ、アバスチン、ベバシズマブ、ビカルタミド、ブレオマイシン、ボンドロナット、ボネフォス(bonefos)、ボルテゾミブ、ブシルベクス(busilvex)、ブスルファン、カンプト、カペシタビン、カルボプラチン、カルムスチン、カソデックス、セツキシマブ、キマックス(chimax)、クロラムブシル、シメチジン、シスプラチン、クラドリビン、クロドロネート、クロファラビン、クリサンタスパーゼ、シクロホスファミド、酢酸シプロテロン、シプロスタット(cyprostat)、シタラビン、サイトキサン(cytoxan)、ダカルボジン(dacarbozine)、ダクチノマイシン、ダサチニブ、ダウノルビシン、デキサメタゾン、ジエチルスチルベストロール、ドセタキセル、ドキソルビシン、ドロゲニル(drogenil)、エムシット(emcyt)、エピルビシン、エポシン(eposin)、アービタックス、エルロチニブ、エストラサイト(extracyte)、エストラムスチン、エトポホス、エトポシド、エボルトラ、エキセメスタン、フェアストン、フェマーラ、フィルグラスチム、フルダラ、フルダラビン、フルオロウラシル、フルタミド、ゲフィニチブ、ゲムシタビン、ジェムザール、グリーベック(gleevec)、グリベック、ゴナペプチルデポ(gonapeptyl depot)、ゴセレリン、ハラヴェン、ハーセプチン、ハイカムプチン(hycamptin)、ヒドロキシカルバミド、イバンドロン酸、イブリツモマブ、イダルビシン、イホスホミド(ifosfomide)、インターフェロン、イマチニブメシル酸塩、イレッサ、イリノテカン、ジェブタナ、ランビス(lanvis)、ラパチニブ、レトロゾール、リューケラン、リュープロレリン、リュースタット(leustat)、ロムスチン、マブキャンパシュ(mabcampath)、マブセラ、メガセ(megace)、メゲストロール、メトトレキサート、ミトザントロン(mitozantrone)、マイトマイシン、ムツラン(mutulane)、マイレラン、ナベルビン、ニューラスタ(neulasta)、ニューポジェン、ネクサバール、ニペント(nipent)、ノルバデックスD、ノバントロン、オンコビン、パクリタキセル、パミドロネート、PCV、ペメトレキセド、ペントスタチン、パージェタ(perjeta)、プロカルバジン、プロベンジ(provenge)、プレドニゾロン、プロストラップ(prostrap)、ラルチトレキセド(raltitrexed)、リツキシマブ、スプリセル、ソラフェニブ、ソルタモックス(soltamox)、ストレプトゾシン、スチルボエストロール(stilboestrol)、スチムバックス(stimuvax)、スニチニブ、スーテント、タブロイド(tabloid)、タガメット、タモフェン(tamofen)、タモキシフェン、タルセバ、タキソール、タキソテレ、ウラシルを用いたテガフール、テモダール、テモゾロミド、サリドマイド、チオプレックス(thioplex)、チオテパ、チオグアニン、トムデックス、トポテカン、トレミフェン、トラスツズマブ、トレチノイン、トレオスルファン、トリエチレンチオホルホラミド(triethylenethiophorsphoramide)、トリプトレリン、タイバーブ(tyverb)、ウフトラル(uftoral)、ベルケイド、ベプシド(vepesid)、ベサノイド、ビンクリスチン、ビノレルビン、ザーコリ(xalkori)、ゼローダ、ヤーボイ、ザクチマ(zactima)、ザノサー(zanosar)、ザベデス(zavedos)、ゼベリン(zevelin)、ゾラデックス、ゾレドロネート、ゾメタゾレドロン酸、およびザイティガが挙げられる。
一部の実施形態では、癌は、乳癌であり、個体に投与される治療または化合物は、以下のうちの一つ以上である:Abemaciclib、Abraxane(パクリタキセル・アルブミン安定化ナノ粒子製剤)、Ado-Trastuzumab Emtansine、Afinitor(エベロリムス:Everolimus)、Anastrozole、Aredia(パミドロン酸二ナトリウム)、Arimidex(アナストロゾール:Anastrozole)、Aromasin(エキセメスタン:Exemestane)、Capecitabine、Cyclophosphamide、Docetaxel、Doxorubicin Hydrochloride、Ellence(エピルビシン塩酸塩:Epirubicin Hydrochloride)、Epirubicin Hydrochloride、Eribulin Mesylate、Everolimus、Exemestane、5-FU(フルオロウラシル注射剤)、Fareston(トレミフェン:Toremifene)、Faslodex(フルベストラント:Fulvestrant)、Femara(レトロゾール:Letrozole)、Fluorouracil Injection、Fulvestrant、Gemcitabine Hydrochloride、Gemzar(ゲムシタビン塩酸塩)、Goserelin Acetate、Halaven(エリブリンメシル酸塩)、Herceptin(トラスツズマブ:Trastuzumab)、Ibrance(パルボシクリブ:Palbociclib)、Ixabepilone、Ixempra(イクサベピロン:Ixabepilone)、Kadcyla(Ado-トラスツズマブエムタンシン:Ado-Trastuzumab Emtansine)、Kisqali(リボシクリブ:Ribociclib)、Lapatinib Ditosylate、Letrozole、Lynparza(オラパリブ:Olaparib)、Megestrol Acetate、Methotrexate、Neratinib Maleate、Nerlynx(ネラチニブマレイン酸塩:Neratinib Maleate)、Olaparib、Paclitaxel、Paclitaxel Albumin-stabilized Nanoparticle Formulation、Palbociclib、Pamidronate Disodium、Perjeta(ペルツズマブ:Pertuzumab)、Pertuzumab、Ribociclib、Tamoxifen Citrate、Taxol(パクリタキセル:Paclitaxel)、Taxotere(ドセタキセル:Docetaxel)、Thiotepa、Toremifene、Trastuzumab、Trexall(メトトレキサート:Methotrexate)、Tykerb(ラパチニブトシル酸塩:Lapatinib Ditosylate)、Verzenio(アベマシクリブ:Abemaciclib)、Vinblastine Sulfate、Xeloda(カペシタビン:Capecitabine)、Zoladex(ゴセレリン酢酸塩:Goserelin Acetate)、Evista(ラロキシフェン塩酸塩:Raloxifene Hydrochloride)、Raloxifene Hydrochloride、Tamoxifen Citrate。一部の実施形態では、癌は、乳癌であり、個体に投与される治療または化合物は、以下から選択される組み合わせである:ドキソルビシン塩酸塩(アドリアマイシン)とシクロホスファミド;ドキソルビシン塩酸塩(アドリアマイシン)、シクロホスファミド、およびパクリタキセル(タキソール);ドキソルビシン塩酸塩(アドリアマイシン)、シクロホスファミド、およびフルオロウラシル;メトトレキサート、シクロホスファミド、およびフルオロウラシル;エピルビシン塩酸塩、シクロホスファミド、およびフルオロウラシル;ならびにドキソルビシン塩酸塩(アドリアマイシン)、シクロホスファミド、およびドセタキセル(タキソテレ)。
mRNAまたはタンパク質の変異型(例えば、癌関連型)および野生型(例えば、癌に関連しない型)の両方を発現する対象について、療法は、野生型の発現または活性を阻害するよりも少なくとも2倍、5倍、10倍、または20倍多く、変異型の発現または活性を阻害することが好ましい。複数の治療剤の同時に使用または連続して使用することで、癌の発生率を大幅に減少させ、治療に抵抗性となる治療済の癌の数を減少させる場合がある。さらに、併用療法の一部として使用される治療剤は、癌を治療するために当該治療剤が個別に使用されるときに必要とされる対応用量よりも低い用量で済む場合がある。併用療法における各化合物の用量の低さは、当該化合物からの潜在的な有害副作用の重症度を減少させる。
一部の実施形態では、癌のリスクが高いと特定された対象(本発明または任意の標準的方法により)は、特定のリスク要因を回避し、またはライフスタイルを変えて、任意の癌のさらなるリスクを減少させてもよい。
一部の実施形態では、多型、変異、リスク因子、またはそれらの任意の組み合わせを使用して、対象に対する治療レジメンを選択する。一部の実施形態では、癌のリスクが高い対象、または予後不良である対象に対して、高い用量または多くの治療回数が選択される。
11.5.1 個別療法または併用療法に含有される他の化合物
必要に応じて、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスク増加を安定化、治療、または予防するための追加の化合物は、当分野に公知の方法に従って、天然産物または合成(または半合成)抽出物の両方の巨大ライブラリー、または化学物質ライブラリーから特定されてもよい。薬剤開発分野の当業者であれば、被験抽出物または被験化合物の正確な供給源が本発明方法にとって重要ではないことを理解するであろう。したがって、事実上、任意の数の化学抽出物または化合物を、特定のタイプの癌または特定の対象由来の細胞に対するその効果についてスクリーニングすることができ、または癌関連分子(例えば、特定のタイプの癌において活性または発現が変化していることが判明している癌関連分子)の活性または発現に対するその効果についてスクリーニングすることができる。粗抽出物が癌関連分子の活性または発現を調節することが見出された場合、当分野で公知の方法を使用して、ポジティブリード抽出物のさらなる分画化を行い、実測された効果に関与する化学成分を単離してもよい。
11.5.2 治療法の試験のためのアッセイおよび動物モデルの例
必要に応じて、本明細書に開示される治療法のうちの一つ以上が、細胞株(例えば、本発明方法を使用して癌と診断された、または癌リスクが増加したと診断された対象において特定された変異のうちの一つ以上を有する細胞株)、または例えばSCIDマウスモデル(Jainら、Tumor Models In Cancer Research,ed.Teicher,Humana Press Inc.,Totowa,N.J.,pp.647-671,2001。当該文献はその全体で参照により本明細書に組み込まれる)などの疾患または障害の動物モデルを使用して、例えば癌などの疾患または障害に対するその効果を検証されることができる。さらに、例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害に対するリスクの増大を安定化、治療、または予防するための特定の療法の有効性を決定するために使用され得る標準的アッセイ、および動物モデルが多数存在する。治療法は、標準的なヒト臨床試験でも試験することができる。
特定の対象に対して好ましい治療法を選択するために、化合物は、当該対象において変異している一つ以上の遺伝子の発現または活性に対するその効果について試験されることができる。例えば、特定のmRNA分子またはタンパク質の発現を調節する化合物の能力は、標準的なノーザン分析、ウェスタン分析、またはマイクロアレイ分析を使用して検出することができる。一部の実施形態では、(i)当該対象において(例えば、当該対象由来のサンプルにおいて)、正常レベルよりも高いレベルで発現されるか、または正常活性レベルよりも高い活性レベルを有する癌を促進するmRNA分子もしくはタンパク質の発現または活性を阻害する、または(ii)当該対象において正常レベルより低いレベルで発現されるか、または正常活性レベルより低い活性を有する癌を阻害するmRNA分子もしくはタンパク質の発現または活性を促進する、一つ以上の化合物が選択される。(i)対象において、癌に関連する変異を有するmRNA分子またはタンパク質の最大数を調節する、および(ii)対象において、癌に関連する変異を有さないmRNA分子またはタンパク質の最小数を調節する、個別療法または併用療法。一部の実施形態では、選択された個別療法または併用療法は、高い薬剤有効性を有し、存在する場合でも、有害な副作用をほとんどもたらさない。
上述の対象特異的分析法の代替法として、DNAチップを使用して、特定のタイプの早期癌または後期癌(例えば、乳癌細胞)におけるmRNA分子の発現と、正常組織における発現とを比較することができる(Marrackら、Current Opinion in Immunology 12,206-209,2000;Harkin,Oncologist.5:501-507,2000;Pelizzariら、Nucleic Acids Res.28(22):4577-4581,2000。当該文献はその全体で参照により本明細書に組み込まれる)。この分析に基づいて、当該タイプの癌を有する対象に対する個別療法または併用療法を選択し、当該タイプの癌において発現が変化したmRNAまたはタンパク質の発現を調節することができる。
特定の対象または対象群に対する治療法を選択するために使用されることに加えて、発現プロファイリングを使用して、治療中に発生するmRNAおよび/またはタンパク質の発現の変化をモニタリングすることができる。例えば、発現プロファイリングを使用して、癌関連遺伝子の発現が、正常レベルに戻ったか否かを決定することができる。戻っていない場合、当該治療法の一つ以上の化合物の用量を変えて、対応する癌関連遺伝子の発現レベルに対する当該治療法の効果を増加または減少させることができる。さらにこの分析を使用して、治療法が他の遺伝子(例えば、有害な副作用と関連する遺伝子)の発現に影響を及ぼすか否かを決定することができる。必要に応じて、当該治療法の用量または組成を変えて、望ましくない副作用を予防または低減することができる。
11.5.3 製剤および投与方法の例
例えば癌などの疾患もしくは障害、または例えば癌などの疾患もしくは障害のリスクの増大を安定化、治療、または予防するために、組成物は、当業者に公知の任意の方法を使用して製剤化され、投与されてもよい(例えば、米国特許第8,389,578号および第8,389,557号を参照のこと。当該特許は参照によりその全体で本明細書に組み込まれる)。製剤化および投与に関する一般的な技術は、“Remington:The Science and Practice of Pharmacy,”21st Edition,Ed.David Troy,2006,Lippincott Williams & Wilkins,Philadelphia,Pa.に見出すことができ、当該文献はその全体で参照により本明細書に組み込まれる。液体、スラリー、錠剤、カプセル、丸薬、粉末、顆粒、ゲル、軟膏、座薬、注射液、吸入剤、およびエアロゾルは、そうした製剤の例である。例として、調節放出経口製剤または徐放経口製剤は、当分野で公知の追加的な方法を使用して調製することができる。例えば、活性成分の好適な徐放形態は、マトリックス錠剤またはカプセル組成物であり得る。好適なマトリクス形成材料としては、例えば、ワックス(例えば、カルナバ、蜜蝋、パラフィンワックス、セレシン、シェラックワックス、脂肪酸、および脂肪アルコール)、油、硬化オイルまたは脂肪(例えば、硬化した菜種油、ヒマシ油、牛脂、パーム油、および大豆油)、およびポリマー(例えば、ヒドロキシプロピルセルロース、ポリビニルピロリドン、ヒドロキシプロピルメチルセルロース、およびポリエチレングリコール)が挙げられる。他の適切なマトリクス打錠材料は、他の担体とともに、微結晶セルロース、粉末セルロース、ヒドロキシプロピルセルロース、エチルセルロース、および充填剤である。錠剤はまた、顆粒状物質、コーティングされた粉末、またはペレットを含有してもよい。錠剤はまた、多層型であってもよい。任意選択で、完成した錠剤は、コーティングされていても、コーティングされていなくてもよい。
そうした組成物の典型的な投与経路としては、限定されないが、経口、舌下、口腔、局所、経皮、吸入、非経口(例えば、皮下、静脈内、筋肉内、胸骨内の注射、または点滴法)、直腸、膣、および鼻内が挙げられる。好ましい実施形態では、治療法は、徐放デバイスを使用して投与される。
本発明の組成物は、その中に含まれる活性成分が、組成物の投与時に生体利用可能となるように製剤化される。組成物は、一つ以上の投与単位の形態を取ってもよい。組成物は、1、2、3、4、またはそれ以上の活性成分を含有してもよく、および任意で1、2、3、4、またはそれ以上の不活性成分を含有してもよい。
12.定義
以下の定義は、本明細書全体を通して使用される特定の用語の理解を容易にするために提供される。
本明細書で使用される技術用語および科学用語は、別段の定義が無い限り、当分野の当業者により普遍的に理解される意味を有する。当業者に公知の任意の好適な材料および/または方法論を、本明細書に記載の方法の実施において利用することができる。
本発明の記載および添付の請求の範囲において使用される場合、単数形の「a」、「an」および「the」は、文脈から別段であることが明白に示されない限り、相互交換可能に使用され、複数形も同様に含むこと、および各意味の範囲内に含まれることが意図される。また本明細書において使用される場合、「および/または」とは、列記された項目のうちの一つ以上の任意の、およびすべての可能性のある組み合わせを指し、および包含し、ならびに選択的に解釈されるとき(「または」)の組み合わせの欠落を指し、および包含する。
本明細書で使用される場合、「約」は当業者によって理解され、使用される文脈に対してある程度まで変化する。使用される文脈を考慮しても当業者に明白ではない用語の使用がある場合、「約」は特定の用語の最大プラスマイナス10%を意味する。
「一塩基多型(SNP)」は、同じ種の二つのメンバーのゲノム間で異なり場合がある一塩基を指す。用語の使用は、各バリアントが発生する頻度に対するいかなる制限も暗示するものではない。
「配列」とは、DNA配列または遺伝子配列を指す。これは、個体におけるDNA分子またはDNA鎖の一次的で物理的な構造を指す場合がある。これは、当該DNA分子に存在するヌクレオチドの配列、または当該DNA分子に対する相補鎖を指す場合がある。これは、インシリコでのその表現としての当該DNA分子中に含まれる情報を指す場合がある。
「座位」とは、個体のDNA上の特定の対象となる領域を指し、SNP、挿入または欠失の可能性のある部位、または他の何らかの関連する遺伝的変動の部位を指す場合がある。疾患に連鎖したSNPは、疾患連鎖座位を指す場合もある。
「多型アレル」、さらに「多型座位」とは、遺伝子型が所与の種内の個体間で変化するアレルまたは座位を指す。多型アレルのいくつかの例としては、一塩基多型、短タンデムリピート、欠失、重複、および逆位が挙げられる。
「多型部位」とは、個体間で変化する多型領域に存在する特定のヌクレオチドを指す。
「アレル」とは、特定の座位を占有する遺伝子を指す。
「遺伝子データ」さらには「遺伝的データ」とは、一つ以上の個体のゲノムの態様を記述するデータを指す。これは、座位、部分配列もしくは全配列、部分染色体もしくは全染色体、または全ゲノムの一つまたはセットを指す場合がある。これは、一つまたは複数のヌクレオチドの固有性を指す場合もある。これは、連続するヌクレオチド、またはゲノム中の異なる位置に由来するヌクレオチド、またはそれらの組み合わせを指す場合もある。遺伝子型データは典型的にはインシリコであるが、配列中の物質的なヌクレオチドを化学的にコードされた遺伝的データとみなすことも可能である。遺伝子型データは、個体「に対する」、個体「の」、個体「での」、個体「に由来する」、または個体「にある」と言われる場合がある。遺伝子型データとは、遺伝子型解析プラットフォームからの出力測定値を指す場合もあり、当該測定値は遺伝物質に対して生成される。
「遺伝物質」さらには「遺伝子サンプル」とは、例えばDNAまたはRNAを含む一つ以上の個体に由来する組織または血液などの物質を指す。
「信頼度」とは、分類されたSNP、アレル、アレルのセット、倍数性分類、または父性分類が正確である統計的尤度を指す。
「異数性」とは、細胞中に誤った数の染色体が存在する状態を指す。ヒト体細胞の場合、細胞が22対の常染色体と1対の性染色体を含有しない場合を指すこともある。ヒト配偶子の場合、細胞が23個の各染色体のうちの一つを含有しない場合を指すこともある。一つの染色体型の場合、2よりも多い、または2よりも少ない、相同であるが同一ではない染色体コピーが存在する場合を指すこともあり、または同じ親を起源とする二つの染色体コピーが存在する場合を指すこともある。
「染色体」とは、一つの染色体コピーを指すこともあり、これは正常な体細胞中に46個存在する一つのDNA分子を意味し、一例は、母体に由来する18番染色体である。染色体とは、正常なヒト体細胞中に23個存在する染色体型を指す場合もあり、一例は、18番染色体である。
「モノソミー」とは、細胞が染色体型のうちの一つのみを含む状態を指す。
「二染色体性(ダイソミー)」とは、細胞が染色体型のうちの二つを含む状態を指す。
「単為生殖性ダイソミー」とは、細胞が染色体型のうちの二つを含有し、そして両方の染色体が一つの親を起源とする状態を指す。
「トリソミー」とは、細胞が染色体型のうちの三つを含む状態を指す。
遺伝物質の状態またはシンプルに「遺伝子状態」とは、DNA上のSNPのセットの固有性、相決定された遺伝物質のハプロタイプ、または挿入、欠失、リピートおよび変異を含むDNA配列を指す場合がある。また、一つ以上の染色体、染色体セグメント、または染色体セグメントセットの倍数性の状態を指す場合もある。
「父性の確立」または「父性の決定」とは、疑惑のある父親が、妊娠中の胎児の生物学的父親であるか、父親ではないかを確立または決定すること、または疑惑のある父親が、胎児の生物学的父親である尤度を決定または確立することを指す。
「アレル比」とは、サンプル中または個体中に存在する多型座位での各アレルの量の間の比率を指す。サンプルがシーケンスにより測定される場合、アレル比とは、座位の各アレルにマッピングされるシーケンスリードの比率を指す場合がある。サンプルが強度を基にした測定法により測定される場合、アレル比とは、当該測定法により推定される、座位に存在する各アレルの量の比率を指す場合がある。
「アレル分布」またはアレルカウント分布とは、座位セット中の各座位に存在する各アレルの相対量を指す。アレル分布とは、個体、サンプル、またはサンプルに行われた一連の測定値を指し得る。シーケンスの場合、アレル分布とは、多型座位セット中の各アレルに関し、特定のアレルにマッピングされるリードの数または推定数を指す。アレル測定値は確率的に処理されてもよい。すなわち、所与のアレルが、所与のシーケンスリードに現れる尤度は、0~1の割合である。またはアレル測定値はバイナリ様式で処理されてもよい。すなわち、任意の所与のリードは、正確にゼロコピーまたは1コピーの特定のアレルであるとみなされる。
「アレルバイアス」とは、ヘテロ接合性座位の実測アレル比が、元のDNAサンプルにあった比率とは異なる度合を指す。特定の座位のアレルバイアスの度合は、測定時に当該座位の元のDNAサンプルでのアレル比により割られた当該座位の実測アレル比に等しい。アレルバイアスは、1よりも大きいと規定されてもよく、そのため、アレルバイアスの度合の計算値が1未満である値xとなる場合、アレルバイアスの度合は1/xとして書き換えられてもよい。アレルバイアスは、増幅バイアス、精製バイアス、または異なるアレルに異なる影響を及ぼす何らかの他の現象に起因する可能性がある。
「プライマー」さらには「PCRプローブ」とは、一つのDNA分子(DNAオリゴマー)またはDNA分子の集団(複数のDNAオリゴマー)を指し、当該DNA分子は同一であるか、またはほぼ同一であり、当該プライマーは、標的の多型座位にハイブリダイズするよう設計された領域を含有し、およびPCR増幅を可能にするよう設計されたプライミング配列を含有してもよい。プライマーは、分子バーコードをさらに含んでもよい。プライマーは、個々の分子ごとに異なるランダム領域を含有してもよい。
「ハイブリッド捕捉プローブ」とは、例えばPCRまたは直接合成などの様々な方法によって生成され、サンプル中の特定の標的DNA配列のうちの一方の鎖に対して相補的であることが意図される、修飾を受けている可能性のある任意の核酸配列を指す。外来性ハイブリッド捕捉プローブは調製サンプルに加えられ、変性-再アニーリングプロセスを介してハイブリダイズされて、外来性-内在性断片の二本鎖を形成してもよい。次いでこれらの二本鎖は、様々な手段によってサンプルから物理的に分離されてもよい。
「シーケンスリード」とは、クローナルシーケンス法を使用して測定されたヌクレオチド塩基の配列を表すデータを指す。クローナルシーケンス法により、一つのオリジナルDNA分子の単一またはクローンまたはクラスターを表すシーケンスデータが生成され得る。シーケンスリードは、ヌクレオチドが正確に分類された確率を示す、配列の各塩基位置での関連品質スコアを有し得る。
シーケンスリードのマッピングは、特定生物のゲノム配列中のシーケンスリードの起源の位置を決定するプロセスである。シーケンスリードの起源の位置は、当該リードのヌクレオチド配列とゲノム配列の類似性に基づく。
「ホモ接合性」とは、対応する染色体座位に類似のアレルを有することを指す。
「ヘテロ接合性」とは、対応する染色体座位に類似していないアレルを有することを指す。
「ヘテロ接合性率」とは、所与の座位でヘテロ接合性アレルを有する個体の集団中の比率を指す。ヘテロ接合性率とはさらに、個体中、またはDNAサンプル中の所与の座位で予測される、または実測されたアレル比を指す場合もある。
「ハプロタイプ」とは、同一染色体上で一緒に遺伝することが多い、複数座位でのアレルの組み合わせを指す。ハプロタイプとは、所与の座位のセット間に発生した組み換え事象の数に応じて、わずか二つの座位、または染色体全体を指す場合がある。ハプロタイプとは、統計的に関連づけられた一つの染色分体上の一塩基多型(SNP)のセットを指す場合もある。
「ハプロタイプデータ」さらには「相決定データ」または「順序付けられた遺伝子データ」とは、二倍体ゲノム中または多倍数体ゲノム中の一つの染色体、すなわち二倍体ゲノム中の染色体から分離された母系コピーまたは父系コピーからのデータを指す。
「相決定」とは、順序付けられていない二倍体(または多倍数体)遺伝子データを与えられた個体のハプロタイプ遺伝子データを決定する行為を指す。これは、一つの染色体上に存在するアレルセットに関し、アレルの二つの遺伝子のうちいずれが、個体の二つの相同染色体の各々に関連付けられているかを決定する行為を指す場合もある。
「相決定データ」とは、一つ以上のハプロタイプが決定されている遺伝子データを指す。
「胎児」とは、胎児、または胎児と遺伝子的に類似した胎盤の領域を指す。妊娠中の女性において、胎盤の一部は胎児と遺伝学的に類似しており、母体の血液中に存在する遊離浮遊性胎児DNAは、胎児と合致する遺伝子型を有する胎盤の一部を起源とする場合がある。
「胎児起源のDNA」とは、その遺伝子型が本質的に胎児の遺伝子型と同等であった細胞の一部であったDNAを指す。胎児の染色体の半分の遺伝情報は、胎児の母親から遺伝していることに留意されたい。一部の実施形態では、胎児細胞に由来する、これら母系遺伝染色体からのDNAは、「胎児起源のもの」であり、「母体起源のもの」ではないとみなされる。
「母体起源のDNA」とは、その遺伝子型が本質的に母親の遺伝子型と同等であった細胞の一部であったDNAを指す。
「胎児起源の細胞」とは、元々は胎児の一部であったことが確認された循環細胞を指す。
「母体起源の細胞」とは、元々胎児の一部ではなかった、母細胞であることが確認された循環細胞を指す。
「子供」とは、胚、分割球、または胎児を指す場合がある。本開示の実施形態において、記載される概念は、誕生した子供である個体、胎児、胚、またはそれら由来の細胞セットに等しくよく適用されることに留意されたい。「子供」という用語の使用はシンプルに、子供と称される個体が、親の遺伝的子孫であることを示唆することが意図される場合がある。「親」とは、個体の遺伝的な母親または父親を指す。個体は、典型的には2人の親、母親および父親を有するが、遺伝的または染色体的なキメラ現象など、必ずしもそうではない場合がある。「母親」とは、個体の生物学的母親を指す場合があり、および/または、当該個体を妊娠した際にその個体を担持している女性を指す場合もある。
「親の状況」とは、標的の二人の親のうちの一人または両方に関する、二つの関連染色体のうちの各々に関する、所与のSNPの遺伝的状態を指す。
「母体血漿」とは、妊娠している女性からの血液の血漿部分を指す。
「臨床的決定」とは、個体の健康または生存に影響を及ぼす結果をもたらす行為を行うか否かに関する任意の決定を指す。出生前父子鑑定の状況において、臨床的決定とは、胎児を中絶するか否かの決定を指す場合がある。また臨床的決定とは、さらなる検査を実施する決定、または子供の出生に備えるための措置を講じる決定を指す場合もある。
「診断ボックス」とは、本明細書に開示される方法の一つまたは複数の態様を実施するように設計された一つ、または組み合わせの機械を指す。一つの実施形態では、診断ボックスは、患者ケア地点に配置されてもよい。一つの実施形態では、診断ボックスは、標的化増幅、続いてシーケンスを行ってもよい。一つの実施形態では、診断ボックスは、単独で、または技術者の助けを借りて機能してもよい。
「情報科学を基にした方法」または「情報科学を基にしたアプローチ」とは、大量のデータの意味を理解するために統計に大きく依存する方法を指す。出生前診断の状況において、これは、例えば分子アレイまたはシーケンスからの大量の遺伝子データを与えられて、直接物理的に状態を測定するのではなく、最も可能性の高い状態を統計学的に推測することにより、一つ以上の染色体での倍数性の状態、または一つ以上のアレルでのアレルの状態を決定するよう設計された方法を指す。本開示の一つの実施形態では、情報科学を基にした技術は、本特許で開示される技術であってもよい。本開示の一つの実施形態では、当該技術は、PARENTAL SUPPORT(商標)であってもよい。
一つもしくは複数の座位に対応するDNAの選択的濃縮、または一つもしくは複数の座位でのDNAの選択的濃縮とは、当該座位に対応する濃縮前のDNA混合物中のDNA分子の割合よりも、当該座位に対応する濃縮後のDNA混合物中のDNA分子の割合を高くする、任意の方法を指す。当該方法は、座位に対応するDNA分子の選択的な増幅を伴ってもよい。当該方法は、座位に対応しないDNA分子の除去を伴ってもよい。
「増幅」とは、DNA分子のコピー数を増加させる方法を指す。
「選択的増幅」とは、特定のDNA分子のコピー数、またはDNAの特定の領域に対応するDNA分子のコピー数を増加させる方法を指す場合がある。また、特定の標的DNA分子のコピー数を増加させる方法、または非標的DNA分子もしくは非標的DNA領域を増加させるよりも標的DNA領域を増加させる方法を指す場合もある。選択的増幅は、優先的濃縮方法であってもよい。
「ユニバーサルプライミング配列」とは、例えばライゲーション、PCR、またはライゲーション介在PCRにより標的DNA分子集団に付加され得るDNA配列を指す。標的分子の集団に付加されると、ユニバーサルプライミング配列に特異的なプライマーを使用して、1対の増幅プライマーを使用した標的集団の増幅が可能となる。ユニバーサルプライミング配列は、典型的には、標的配列とは関連しない。
「ユニバーサルアダプター」または「ライゲーションアダプター」または「ライブラリータグ」は、標的二本鎖DNA分子集団の5-プライム末端と3-プライム末端に共有結合することができるユニバーサルプライミング配列を含有するDNA分子である。アダプターを付加することによって、標的集団の5-プライム末端および3-プライム末端に対するユニバーサルプライミング配列が提供され、PCR増幅は、1対の増幅プライマーを使用して標的集団から全分子を増幅することが可能となる。
標的化とは、DNA混合物中の座位セットに対応するDNA分子を選択的に増幅する、または別手段により選択的に濃縮するために使用される方法を指す。
決定、確立、および計算は、相互交換可能に使用され得る。
* * * *
以下の実施例は、本明細書で提供する実施形態の使用方法の完全な開示及び説明を当業者にもたらすように定期するものであり、開示の範囲を限定するものでもなく、また以下の実施例が全てであったり又は行った実験のみであるということを示すことを意図しているものでもない。使用する数字(例えば量、温度等)に関して精度を保証するような努力しているが、一部の実験的な誤差や偏差を考慮に入れるべきである。別に示さない限り、部分は容量部であり、温度は摂氏℃である。実施例を説明することを意図した本質的な態様を変更することなく、説明した方法において変形させることが可能であるということを理解されたい。
実施例1.
本実施例の目的は、少数の細胞からDNAを濃縮するための戦略を開発することであった。特に本実施例は、一つの単一単離胎児細胞からのDNAの濃縮を実証した。
本実施例に示されるモデルシステムは、血液からの希少細胞の濃縮効率、特に胎児細胞の濃縮と単離を評価するために設計した。細胞株AG16777を胎児起源の細胞(女性)に使用し、細胞株AG16778を母体起源の細胞に使用した。それらからのDNA混合物をcfDNA様の参照物として使用した。
胎児細胞濃縮プロセスの結果は、濃縮プラットフォームに応じて、1、10、または数百個の細胞レベルの細胞混合物であった。胎児細胞濃縮効率を評価する方法は、わずか数個の細胞、さらには一つの細胞を使用して、胎児細胞を識別し、胎児割合を正確に推定できるようになるために必要であった。
細胞混合物は、AG16777細胞およびAG16778細胞(トリソミー21の娘/母のペア)を個々に手でマイクロピペッティングを行って、様々な比率(例えば、100:0、99:1、98:2、97:3、96:4、95:5、94:6、93:7、92:8、91:9、90:10、89:11、88:12、87:13、86:14、85:15、84:16、83:17、82:18、81:19、80:20、79:21、78:22、77:23、76:24、75:25、74:26、73:27、72:28、71:29、70:30、69:31、68:32、67:33、66:34、65:35、64:36、63:37、62:38、61:39、60:40、59:41、58:42、57:43、56:44、55:45、54:46、53:47、52:48、51:49、50:50、49:51、48:52、47:53、46:54、45:55、44:56、43:57、42:58、41:59、40:60、39:61、38:62、37:63、36:64、35:65、34:66、33:67、32:68、31:69、30:70、29:71、28:72、27:73、26:74、25:75、24:76、23:77、22:78、21:79、20:80、19:81、18:82、17:83、16:84、15:85、14:86、13:87、12:88、11:89、10:90、9:91、8:92、7:93、6:94、5:95、4:96、3:97、2:98、1:99または0:100)で細胞を混合することにより生成された。
PCR増幅用に細胞を調製するために、細胞は、プロテイナーゼK消化を使用して溶解された。
標的座位として選択された13,000個超の一塩基多型(SNP)の高度多重化PCR増幅を使用して、標的細胞由来のDNAを増幅した。図6において、マルチプレックスPCR増幅反応の例示的なワークフローと条件を示す。
当該方法は、1細胞サンプルの分析にも使用された。培養された細胞株(AG16777、AG16778)から単離された1細胞をサンプルインプットとして使用する場合、胎児細胞ワークフローは、標準的なサンプルインプットを使用した場合と同等のヘトレートプロットの生成に成功したことが示された。したがって、1細胞を使用して染色体全体の異数性を決定することが可能となった。
胎児細胞単離での使用以外に、ワークフローを使用して、腫瘍の場合のコピー数変動(CNV:copy number variation)の決定(研究ワークフローおよびデータ2014)および臓器移植患者におけるドナー細胞の存在の決定にも使用できる可能性がある。
本発明者らのSNPを基にしたNGS法は、WGA(全ゲノム増幅)の前増幅を行わずに細胞サンプルのランを実施する。WGAを省略することで、本発明方法は、WGA依存型の従来方法と比較してコスト効率が良く、時間を節約できる。最も重要なことは、WGAを省略することで、WGA工程からのPCRバイアスが回避され、エラーが減少し、より信頼性の高い遺伝子型解析のためのデータが生成されることである。
実施例2.
本実施例の目的は、本明細書に開示される方法および組成物を使用して一つの細胞を分析できることを示すことであった。
細胞株AG16777を胎児細胞として使用した。顕微鏡下でマイクロキャピラリーピペットを使用して、5μLの洗浄緩衝液(PBS緩衝液中、0.1% ウシ血清アルブミン)を入れたPCRチューブに個々の細胞それぞれを採取した。以下の表2は、本実施例で使用された様々な数の細胞を含むサンプルを示す。
Figure 2022519159000036
表2に示す各サンプルに、6μLの溶解緩衝液(Arcturus再構成緩衝液中、プロテイナーゼK)を添加した。反応混合物を、56℃で60分間インキュベートし、続いて95℃で10分間インキュベートした。(注:この手順はサーモサイクラーで実施することができる)サンプル混合物(細胞溶解物)は冷却され、その後、実施例1に記載される胎児細胞に対する増幅ワークフローを通して実行された。特に、STAR1段階については、7.76μgのgDNA STAR1 プライマー混合物、20μLの4xマスター混合物、および0.24μLの5M TMACがサンプルに加えられた。次いで、反応混合物を、以下の表3に概説されるPCRプロトコールを使用して増幅した。
Figure 2022519159000037
PCRワークフローのSTAR2段階のために、STAR1 PCR産物を水で1:200に希釈した。この段階の増幅混合物を作製するために、希釈されたSTAR1産物2uLを、2.94μLのgDNA STAR2 プライマー混合物、2.5μLの4xマスター混合物、2.5μLの水、および0.06μLの5M 塩化テトラメチルアンモニウム(TMAC)と混合した。STAR2反応混合物を、以下の表4に概説されるPCRプロトコールを使用して増幅した。
Figure 2022519159000038
PCRワークフローのバーコード化段階のために、STAR2 PCR産物を水で1:40に希釈した。バーコード化用に増幅混合物を作製するために、希釈されたSTAR2産物2μLを、1μLの10μM F-BCと混合し、2μLのNS2 バーコード(5μM)、2.5μLの4xマスターミックス、および2.5μLの水を一緒に混合した。バーコード化PCRのPCRプロトコールを、以下の表5に示す。
Figure 2022519159000039
次いで、バーコード化産物をプールし、精製し、定量した。次世代シーケンス(NGS)技術を使用して、プールされたサンプルをシーケンスした。
次いでシーケンスデータを、本明細書に記載のデータ解析方法を使用して解析し、図3に示すように、13番染色体、18番染色体、21番染色体、およびX/Y染色体のSNPのヘトレートプロットを作成した。コピー数変動のデータ解析から、トリソミー21(ダウン症候群)が、分析された細胞株に存在したことが示された。21トリソミーの存在は、わずか一つの単一細胞のみを含有することが確認されているサンプルにおいてさえも明白に認められた(図3A)。したがってこの方法は、現在使用されている、cfDNAの使用に基づく検査と比較して、優れた感度を示す。
実施例3.
本実施例の目的は、細胞混合物に対し、本明細書に開示される循環細胞を分析および特徴解析する方法を試験することであった。
細胞混合物サンプルは、顕微鏡下でマイクロキャピラリーピペットを用いて、個々の胎児細胞(AG16777)および個々の母細胞(AG16778)を採取することにより調製した。次いで個々に採取された胎児細胞と母細胞を、以下の表6に示すように特定の比率で混合した。
Figure 2022519159000040
各サンプルチューブにおいて、5μLの洗浄緩衝液(PBS緩衝液中、0.1%ウシ血清アルブミン)中に細胞を懸濁した。細胞を溶解するために、6μLの溶解緩衝液(Arcturus再構成緩衝液中のプロテイナーゼK)を各サンプルに添加した。次いで反応混合物を、56℃で60分間インキュベートし、続いて95℃で10分間インキュベートした。(注:この手順はサーモサイクラーで実施することができる)混合物(細胞溶解物)は冷却され、その後、実施例1に記載される胎児細胞に対するPCR増幅ワークフローへと進んだ。
PCRワークフローの STAR1段階については、7.76μLのgDNA STAR1プライマー混合物、20μLの4xマスター混合物、および0.24μLの5M TMACを各サンプルに加えた。PCRワークフローのSTAR1段階のPCRプロトコールを、以下の表7に示す。
Figure 2022519159000041
PCRワークフローのSTAR2段階のために、STAR1 PCR産物を1:200に水で希釈した。STAR2増幅用の増幅混合物を作製するために、希釈されたSTAR1産物2uLを、2.94μLのgDNA STAR2 プライマー混合物、2.5μLの4xマスター混合物、2.5μLの水、および0.06μLの5M TMACと混合した。STAR2反応のPCRプロトコールを、以下の表8に示す。
Figure 2022519159000042
PCRワークフローのバーコード化段階のために、STAR2 PCR産物を1:40に水で希釈した。バーコード化用に増幅混合物を作製するために、希釈されたSTAR2産物2μLを、1μLの10μM F-BCと混合し、2μLのNS2 バーコード(5μM)、2.5μLの4xマスターミックス、および2.5μLの水を一緒に混合した。バーコード化反応のPCRプロトコールを、以下の表9に示す。
Figure 2022519159000043
次いで、バーコード化産物をプールし、精製し、定量した。次世代シーケンス(NGS)技術を使用して、プールされたサンプルをシーケンスした。
次いでシーケンスデータを、本明細書に記載のデータ解析方法を使用して解析し、図4に示すように、13番染色体、18番染色体、21番染色体、およびX/Y染色体のSNPのヘトレートプロットを作成した。本実施例で分析された胎児細胞にトリソミー21が存在していることは知られており、胎児細胞のトリソミー21は、5F5M(5個の胎児細胞と5個の母細胞、図4D)サンプル、7F3M(7個の胎児細胞と3個の母細胞、図4C)サンプル、9F1M(9個の胎児細胞と1個の母細胞、図4B)サンプル、および10F(10個の胎児細胞、図4A)サンプルで確認された。したがって、本明細書に開示される方法は、わずか5個の標的細胞を含有する混合サンプルを解析することができる。
cfDNAサンプルと細胞サンプルとの間の胎児一致と母体一致、ならびに胎児純度の計算は、選択された細胞の固有性の決定に成功した。
Figure 2022519159000044
実施例4.
本実施例の目的は、妊娠している女性の血液サンプルから単離された循環細胞を分析することである。本実施例は、開示された方法が、例えば母体血液サンプル中の胎児細胞など、個々の循環細胞の固有性を解析および確認できることを実証する。
複数の血液サンプル(各30mL)を、妊娠女性から採取する。5~10mLの血漿画分を、各血液サンプルから単離する。セルフリーDNA(cfDNA)は、血漿画分から抽出される。胎児細胞および母細胞は各血液サンプルから単離され、溶解される。同じ血液サンプルから4~6個の細胞を溶解して、10μLの細胞溶解物を得る。サンプルに、実施例1に記載される胎児細胞のPCR増幅ワークフローを行う。
cfDNAライブラリーの調製 cfDNAライブラリーは、ライブラリー調製キット(Natera、REF 131100)を使用して、NateraのIFU 131100.1 改訂02(IFU-10002)に記載されるプロトコールに従って調製される。
次に、cfDNAライブラリーの6.7μLを、3μLのcfDNA OneStarプライマー混合物、10μLの4xマスター混合物、および0.3μLの 5M TMACと混合することによって、cfDNAのSTAR1増幅を行う。STAR1 PCRプロトコールを、以下の表11に示す。
Figure 2022519159000045
cfDNA STAR1産物をバーコード化するために、STAR1 cfDNA PCR産物を水で1:400に希釈し、2μLの希釈 STAR1 cfDNA PCR産物を、1μLの10μM F-BC、2μLのNS2 バーコード(5μM)、および5μLの4xマスター混合物と混合する。cfDNA STAR1産物をバーコード化するための反応混合物を、以下の表12に示すPCRプロトコールを用いて実行する。
Figure 2022519159000046
細胞溶解物のSTAR1増幅については、5.82μLのgDNA STAR1 プライマー混合物、15μLの4xマスター混合物、および0.18μLの5M TMACを各サンプルに加える。STAR1反応混合物を、以下の表13に示すPCRプロトコールを用いて実行する。
Figure 2022519159000047
STAR1細胞溶解物のPCR産物のSTAR2増幅については、細胞溶解物のSTAR1 PCR産物を水で1:200に希釈し、2μLの希釈STAR1産物を、2.94μLのgDNA STAR2 プライマー混合物、2.5μLの4xマスター混合物、2.5μLの水、および0.06μLの 5M TMACと混合する。STAR2反応混合物を、以下の表14に示すPCRプロトコールを用いて実行する。
Figure 2022519159000048
細胞溶解物サンプルのバーコード化については、細胞溶解物のSTAR2 PCR産物を水で1:40に希釈し、2μLの希釈STAR2 PCR産物を、1μLの10μM F-BC、2μLのNS2 バーコード(5uM)、2.5μLの4xマスター混合物、および2.5μLの水と混合する。バーコード化反応混合物を、以下の表15に示すPCRプロトコールを用いて実行する。
Figure 2022519159000049
次いで、バーコード化産物をプールし、精製し、定量する。次世代シーケンス(NGS)技術を使用して、プールされたサンプルをシーケンスする。サンプルごとに異なるバーコードを使用する。サンプルの総数に応じて、バーコード化cfDNAと、バーコード化細胞溶解物を一つのチューブまたは二つのチューブにプールしてシーケンスを行う。
シーケンスデータは、本明細書に記載されるデータ解析方法を使用して解析され、13番染色体、18番染色体、21番染色体、およびX/Y染色体のSNPのヘトレートプロットが生成される。cfDNAサンプルと細胞サンプルとの間の胎児一致と母体一致は、本明細書のセクション2に記載されるように計算される。cfDNAサンプルと細胞サンプルとの間の胎児一致と母体一致、ならびに胎児純度の計算は、選択された細胞の固有性の決定に成功し得る。
実施例5.
本実施例の目的は、血液からの盲検化細胞サンプルの分析を行うことによって、開示される方法の感度および特異性をさらに試験し、個々の細胞の固有性を確認することである。
妊娠中の女性から複数の血液サンプルが採取され、そこから一つの胎児細胞と一つの母細胞が単離され、cfDNAが抽出される。細胞サンプルは、2個の胎児細胞または2個の母細胞を同じ起源から単離することによって調製される。次いで、単離された細胞を溶解して、複数の細胞溶解物サンプルを得る。cfDNAおよび細胞溶解物サンプルは、改変を伴う最適化Panorama v2 gDNAプロトコールで実行される。
cfDNAライブラリーの調製 cfDNAライブラリーは、ライブラリー調製キット(Natera、REF 131100)を使用して、NateraのIFU 131100.1 改訂02(IFU-10002)に記載されるプロトコールに従って調製される。
cfDNAのSTAR1調製については、6.7μLのcfDNAライブラリーを、3μLのcfDNA OneStarプライマー混合物、10μLの4xマスター混合物、および0.3μLの5M TMACと混合する。STAR1反応混合物を、以下の表16に示すPCRプロトコールを用いて実行する。
Figure 2022519159000050
cfDNAをバーコード化するために、OneStar PCR産物を水で1:400に希釈し、2μLの希釈STAR1産物を、1μLの10uM F-BC、2μLのNS2 バーコード(5μM)、および5μLの4xマスター混合物と混合する。バーコード化反応混合物を、以下の表17に示すPCRプロトコールを用いて実行する。
Figure 2022519159000051
細胞溶解物サンプルDNAのSTAR1増幅については、5.82μLのgDNA STAR1 プライマー混合物、15μLの4xマスター混合物、および0.18μLの5M TMACをサンプルに加える。細胞溶解物サンプルの STAR1 PCR増幅プロトコールを以下の表18に示す。
Figure 2022519159000052
細胞溶解物サンプルのSTAR2増幅については、細胞溶解物のSTAR1 PCR産物を水で1:200に希釈し、2μLの希釈STAR1産物を、2.94μLのgDNA STAR2 プライマー混合物、2.5μLの4xマスター混合物、2.5μLの水、および0.06μLの 5M TMACと混合する。細胞溶解物サンプルの STAR2 PCR増幅プロトコールを以下の表19に示す。
Figure 2022519159000053
細胞溶解物サンプルのバーコード化については、細胞溶解物のSTAR2 PCR産物を水で1:40に希釈し、2μLの希釈STAR2 PCR産物を、1μLの10μM F-BC、2μLのNS2 バーコード(5μM)、2.5μLの4xマスター混合物、および2.5μLの水と混合する。細胞溶解物サンプルのバーコード化PCR増幅プロトコールを以下の表20に示す。
Figure 2022519159000054
次いで、バーコード化産物をプールし、精製し、定量する。次世代シーケンス(NGS)技術を使用して、プールされたサンプルをシーケンスする。シーケンス完了後、本明細書に記載される方法を使用してデータが解析される。13番染色体、18番染色体、21番染色体、およびX/Y染色体のSNPは、ヘトレートプロットで視覚化することができる。cfDNAを参照として使用して、未知の細胞溶解物サンプルからのシーケンスデータを特徴解析することができる。cfDNAサンプルと細胞溶解物サンプルとの間の胎児一致と母体一致は、本明細書に記載されるアルゴリズムを使用して計算され、細胞の細胞固有性を決定するために使用される。

****

Claims (40)

  1. 胎児起源であると推測される循環細胞の起源を決定する方法であって、
    a)小児細胞株、または胎児を妊娠している母親の血液サンプルから取得された胎児起源であると推測される一つ以上の循環細胞から単離された細胞DNAからの第一のアンプリコンセット、および子供と母親のDNA混合物、または前記血液サンプルの血漿画分から取得されたセルフリーDNAからの第二のアンプリコンセットを生成することであって、前記第一のアンプリコンセットと前記第二のアンプリコンセットは、複数の一塩基多型(SNP)座位の多重化増幅反応を実行することによって取得される、生成すること、
    b)次世代シーケンスにより前記第一のアンプリコンセットと前記第二のアンプリコンセットをシーケンスすること、および
    c)前記第一のアンプリコンセットの配列に基づいて前記一つ以上の循環細胞の起源を決定することであって、前記第二のアンプリコンセットの配列は、参照として使用される、決定すること、を含む方法。
  2. 母親の細胞株から、または前記血液サンプルのバフィーコート画分から取得された一つ以上の母細胞から単離された母細胞DNAからの第三のアンプリコンセットを生成すること、および前記第三のアンプリコンセットを次世代シーケンスにより遺伝子型解析し、母親の遺伝子型を決定すること、をさらに含む、請求項1に記載の方法。
  3. 前記血液サンプルから、胎児起源であると推測される前記循環細胞、前記セルフリーDNAを含む前記血漿画分、および前記母細胞を含む前記バフィーコート画分を取得することをさらに含む、請求項2に記載の方法。
  4. 工程(c)が、子供と母親のDNAの混合物または前記血漿画分から取得された前記セルフリーDNAと、胎児起源であると推測される前記循環細胞から取得された前記細胞DNAとの間の母体一致と胎児一致の計算、および胎児混合物割合の計算を含む、請求項1に記載の方法。
  5. 前記第一のアンプリコンセットと前記第二のアンプリコンセットは、少なくとも1,000個のSNP座位の多重化増幅反応を実施することにより取得される、請求項1に記載の方法。
  6. 前記SNP座位の量を測定することによって、前記母細胞と胎児細胞の混合物の前記胎児割合を推定することをさらに含む、請求項1に記載の方法。
  7. 前記方法が、前記SNPでのアレル比を決定することをさらに含む、請求項6に記載の方法。
  8. 前記胎児割合の推定は、前記アレル比を使用する、請求項7に記載の方法。
  9. 前記方法が、複数の循環細胞または細胞株を個々の反応ボリュームに分けること、各反応ボリューム中の細胞DNAを単離すること、および各反応ボリュームにおいて単離された前記細胞DNAにサンプルバーコードを取り付けることを含む、請求項1に記載の方法。
  10. 前記細胞DNAは、胎児細胞であると推測される一つの循環細胞から単離される、請求項1に記載の方法。
  11. 前記方法がさらに、一つ以上の循環細胞が一つ以上の胎児細胞であると決定された遺伝子型を使用して、非侵襲的な出生前検査を実施することを含む、請求項1に記載の方法。
  12. 前記方法がさらに、一つ以上の胎児細胞であると決定された前記一つ以上の循環細胞における対象となる標的染色体または標的染色体セグメントのコピー数変動または異数性を検出することを含む、請求項11に記載の方法。
  13. 対象となる前記標的染色体または標的染色体セグメントは、13番染色体、18番染色体、21番染色体、性染色体、および/またはそれらの染色体セグメントである、請求項12に記載の方法。
  14. 前記方法がさらに、一つ以上の純粋な胎児細胞であると決定された前記一つ以上の循環細胞における微小欠失を検出することを含む、請求項11に記載の方法。
  15. 前記微小欠失は、ディジョージ症候群に関連する22q11.2欠失、プラダーウィリ症候群に関連する微小欠失、アンジェルマン症候群に関連する微小欠失、1p36欠失、および/または猫鳴き症候群に関連する微小欠失である、請求項14に記載の方法。
  16. 癌患者における腫瘍の早期再発または転移をモニタリングおよび検出するための方法であって、前記方法が、
    a)癌と診断された患者の腫瘍サンプルにおいて特定された体細胞変異に基づいて、一つ以上の患者特異的変異を選択する工程、
    b)前記患者が外科手術、第一選択化学療法、および/またはアジュバント療法で治療された後、前記患者から一つ以上の血液サンプルを長期的に採取する工程、
    c)循環腫瘍細胞であると推測され、前記患者の血液サンプルから取得される、一つ以上の循環細胞から単離された細胞DNAからアンプリコンセットを生成する工程であって、前記アンプリコンセットは、癌に関連する前記患者特異的変異を包含するゲノム座位の多重化増幅によって生成される工程、
    d)次世代シーケンスにより前記アンプリコンセットをシーケンスする工程、および前記アンプリコンセット中の前記一つ以上の患者特異的変異の存在に基づいて、前記一つ以上の循環細胞の起源を決定する工程であって、前記一つ以上の患者特異的変異を含む一つ以上の循環腫瘍細胞の検出が、前記癌の早期再発または転移を示す工程、を含む方法。
  17. 前記患者特異的変異が、癌に関連した一塩基バリアント(SNV)、コピー数バリアント(CNV)、インデル、および/または遺伝子融合を含む、請求項16に記載の方法。
  18. 前記アンプリコンセットが、癌に関連する少なくとも8個の患者特異的変異を包含するゲノム座位の多重化増幅により生成される、請求項16に記載の方法。
  19. 前記アンプリコンセットが、癌に関連する少なくとも16個の患者特異的変異を包含するゲノム座位の多重化増幅により生成される、請求項16に記載の方法。
  20. 癌に関連する少なくとも2個の患者特異的変異の前記存在が、前記一つ以上の循環細胞が腫瘍細胞であることを示す、請求項16に記載の方法。
  21. 癌に関連する少なくとも5個の患者特異的変異の前記存在が、前記一つ以上の循環細胞が腫瘍細胞であることを示す、請求項16に記載の方法。
  22. 前記一つ以上の患者特異的変異を含む少なくとも2個の循環腫瘍細胞の検出が、前記癌の早期再発または転移を示す、請求項16に記載の方法。
  23. 前記方法が、複数の循環細胞を個々の反応ボリュームに分けること、各反応ボリューム中の細胞DNAを単離すること、および各反応ボリュームにおいて単離された前記細胞DNAにサンプルバーコードを取り付けることを含む、請求項16に記載の方法。
  24. 前記細胞DNAは、腫瘍細胞であると推測される一つの循環細胞から単離される、請求項16に記載の方法。
  25. 前記方法がさらに、腫瘍細胞であると決定された一つ以上の循環細胞の遺伝子型から、癌に関連する追加の患者特異的変異を特定することをさらに含む、請求項16に記載の方法。
  26. 前記患者は、肺癌に罹患している、請求項16に記載の方法。
  27. 前記患者は、乳癌に罹患している、請求項16に記載の方法。
  28. 前記患者は、膀胱癌に罹患している、請求項16に記載の方法。
  29. 前記患者は、結腸直腸癌に罹患している、請求項16に記載の方法。
  30. ドナー細胞であると推測される循環細胞の起源を決定する方法であって、
    a)移植レシピエントの血液サンプルから取得されたドナー細胞であると推測される一つ以上の循環細胞から単離された細胞DNAからの第一のアンプリコンセット、および前記血液サンプルの血漿画分から取得されたセルフリーDNAからの第二のアンプリコンセットを生成することであって、前記第一のアンプリコンセットと前記第二のアンプリコンセットは、複数の一塩基多型(SNP)座位の多重化増幅反応を実行することによって取得される、生成すること、
    b)次世代シーケンスにより前記第一のアンプリコンセットと前記第二のアンプリコンセットをシーケンスすること、および
    c)前記第一のアンプリコンセットの配列に基づいて前記一つ以上の循環細胞の起源を決定することであって、前記第二のアンプリコンセットの配列は、参照として使用される、決定すること、を含む方法。
  31. 癌患者における腫瘍の早期再発または転移をモニタリングおよび検出するための方法であって、前記方法が、
    a)癌と診断された患者の腫瘍サンプルにおいて特定された体細胞変異に基づいて、一つ以上の患者特異的変異を選択する工程、
    b)前記患者が外科手術、第一選択化学療法、および/またはアジュバント療法で治療された後、前記患者から一つ以上の血液サンプルを長期的に採取する工程、
    c)前記患者の血液サンプルから単離されるセルフリーDNAからの第一のアンプリコンセットを生成する工程であって、前記第一のアンプリコンセットは、癌に関連する前記患者特異的変異を包含するゲノム座位の多重化増幅によって生成される工程、
    d)次世代シーケンスにより前記第一のアンプリコンセットをシーケンスする工程、および前記アンプリコンセット中の一つ以上の患者特異的変異の存在を検出する工程であって、前記一つ以上の患者特異的変異の存在は、癌の早期再発または転移を示す工程、
    e)前記患者の血液サンプルから取得される一つ以上の循環細胞から単離された細胞DNAから第二のアンプリコンセットを生成する工程であって、前記第二のアンプリコンセットは、癌に関連する前記患者特異的変異を包含するゲノム座位の多重化増幅によって生成される工程、
    f)次世代シーケンスにより前記第二のアンプリコンセットをシーケンスする工程、および前記アンプリコンセット中の一つ以上の患者特異的変異の存在に基づいて、前記一つ以上の循環細胞の起源を決定する工程であって、前記一つ以上の患者特異的変異の存在は、前記一つ以上の循環細胞が腫瘍細胞であることを示す工程、および
    g)腫瘍細胞であると決定された前記一つ以上の循環細胞の配列から、癌に関連する一つ以上の追加の変異を特定する工程、を含む方法。
  32. 前記患者特異的変異が、癌に関連した一塩基バリアント(SNV)、コピー数バリアント(CNV)、インデル、および/または遺伝子融合を含む、請求項31に記載の方法。
  33. 前記第一および/または第二のアンプリコンセットが、癌に関連する少なくとも8個の患者特異的変異を包含するゲノム座位の多重化増幅により生成される、請求項31に記載の方法。
  34. 前記第一および/または第二のアンプリコンセットが、癌に関連する少なくとも16個の患者特異的変異を包含するゲノム座位の多重化増幅により生成される、請求項31に記載の方法。
  35. 工程(d)において、癌に関連する少なくとも2個または少なくとも5個の患者特異的変異の前記存在が、癌の早期再発または転移を示す、請求項31に記載の方法。
  36. 工程(f)において、癌に関連する少なくとも2個または少なくとも5個の患者特異的変異の前記存在が、前記一つ以上の循環細胞が腫瘍細胞であることを示す、請求項31に記載の方法。
  37. 前記方法が、複数の循環細胞を個々の反応ボリュームに分けること、各反応ボリューム中の細胞DNAを単離すること、および各反応ボリュームにおいて単離された前記細胞DNAにサンプルバーコードを取り付けることを含む、請求項31に記載の方法。
  38. 前記細胞DNAは、腫瘍細胞であると推測される一つの循環細胞から単離される、請求項31に記載の方法。
  39. 前記患者は、肺癌、乳癌、膀胱癌または結腸直腸癌に罹患している、請求項31に記載の方法。
  40. 癌に関連する前記一つ以上の追加の変異に基づいて前記患者を治療することをさらに含む、請求項31に記載の方法。
JP2021534226A 2018-12-17 2019-12-16 循環細胞の分析方法 Pending JP2022519159A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862780724P 2018-12-17 2018-12-17
US62/780,724 2018-12-17
US201962797518P 2019-01-28 2019-01-28
US62/797,518 2019-01-28
PCT/US2019/066544 WO2020131699A2 (en) 2018-12-17 2019-12-16 Methods for analysis of circulating cells

Publications (1)

Publication Number Publication Date
JP2022519159A true JP2022519159A (ja) 2022-03-22

Family

ID=69187905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021534226A Pending JP2022519159A (ja) 2018-12-17 2019-12-16 循環細胞の分析方法

Country Status (6)

Country Link
US (1) US20220056534A1 (ja)
EP (1) EP3899030A2 (ja)
JP (1) JP2022519159A (ja)
CN (1) CN113330121A (ja)
CA (1) CA3123847A1 (ja)
WO (1) WO2020131699A2 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8825412B2 (en) 2010-05-18 2014-09-02 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
AU2013226081B2 (en) 2012-02-27 2018-06-14 Becton, Dickinson And Company Compositions and kits for molecular counting
WO2015031691A1 (en) 2013-08-28 2015-03-05 Cellular Research, Inc. Massively parallel single cell analysis
EP3957749A1 (en) 2014-04-21 2022-02-23 Natera, Inc. Detecting tumour specific mutations in biopsies with whole exome sequencing and in cell-free samples
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
SG11201901733PA (en) 2016-09-26 2019-04-29 Cellular Res Inc Measurement of protein expression using reagents with barcoded oligonucleotide sequences
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
EP3585889A1 (en) 2017-02-21 2020-01-01 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
EP3788171B1 (en) 2018-05-03 2023-04-05 Becton, Dickinson and Company High throughput multiomics sample analysis
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
US11639517B2 (en) 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
WO2020097315A1 (en) 2018-11-08 2020-05-14 Cellular Research, Inc. Whole transcriptome analysis of single cells using random priming
WO2020123384A1 (en) 2018-12-13 2020-06-18 Cellular Research, Inc. Selective extension in single cell whole transcriptome analysis
ES2945227T3 (es) 2019-01-23 2023-06-29 Becton Dickinson Co Oligonucleótidos asociados con anticuerpos
WO2020206069A1 (en) * 2019-04-03 2020-10-08 Butterfly Network, Inc. Methods and apparatuses for guiding collection of ultrasound images
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
EP4055160B1 (en) 2019-11-08 2024-04-10 Becton Dickinson and Company Using random priming to obtain full-length v(d)j information for immune repertoire sequencing
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
EP4150118A1 (en) 2020-05-14 2023-03-22 Becton Dickinson and Company Primers for immune repertoire profiling
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
US20220119865A1 (en) * 2020-10-21 2022-04-21 Abs Global, Inc. Methods and systems for processing genetic samples to determine identity or detect contamination
CN116438316A (zh) * 2020-11-17 2023-07-14 贝克顿迪金森公司 用于肿瘤学诊断的无细胞核酸和单细胞组合分析
EP4247967A1 (en) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profiling of highly expressed and lowly expressed proteins

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7634808B1 (en) 2004-08-20 2009-12-15 Symantec Corporation Method and apparatus to block fast-spreading computer worms that use DNS MX record queries
US8024128B2 (en) 2004-09-07 2011-09-20 Gene Security Network, Inc. System and method for improving clinical decisions by aggregating, validating and analysing genetic and phenotypic data
WO2006058236A2 (en) 2004-11-24 2006-06-01 Neuromolecular Pharmaceuticals, Inc. Composition comprising an nmda receptor antagonist and levodopa and use thereof for treating neurological disease
US20070027636A1 (en) 2005-07-29 2007-02-01 Matthew Rabinowitz System and method for using genetic, phentoypic and clinical data to make predictions for clinical or lifestyle decisions
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US20070178501A1 (en) 2005-12-06 2007-08-02 Matthew Rabinowitz System and method for integrating and validating genotypic, phenotypic and medical information into a database according to a standardized ontology
US8515679B2 (en) 2005-12-06 2013-08-20 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
WO2007030680A2 (en) 2005-09-07 2007-03-15 Rigel Pharmaceuticals, Inc. Triazole derivatives useful as axl inhibitors
PT2385143T (pt) 2006-02-02 2016-10-18 Univ Leland Stanford Junior Rastreio genético fetal não-invasivo por análise digital
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
US20110033862A1 (en) 2008-02-19 2011-02-10 Gene Security Network, Inc. Methods for cell genotyping
CA2731991C (en) 2008-08-04 2021-06-08 Gene Security Network, Inc. Methods for allele calling and ploidy calling
PT2562268T (pt) 2008-09-20 2017-03-29 Univ Leland Stanford Junior Diagnóstico não invasivo de aneuploidia fetal por sequenciação
US9051602B2 (en) * 2008-12-22 2015-06-09 Celula, Inc. Methods and genotyping panels for detecting alleles, genomes, and transcriptomes
US8825412B2 (en) 2010-05-18 2014-09-02 Natera, Inc. Methods for non-invasive prenatal ploidy calling
WO2011041485A1 (en) 2009-09-30 2011-04-07 Gene Security Network, Inc. Methods for non-invasive prenatal ploidy calling
HRP20230134T1 (hr) 2009-11-05 2023-03-31 The Chinese University Of Hong Kong Analiza genoma fetusa iz biološkog uzorka majke
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
US20130123120A1 (en) 2010-05-18 2013-05-16 Natera, Inc. Highly Multiplex PCR Methods and Compositions
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US20120190557A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Risk calculation for evaluation of fetal aneuploidy
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US20120190020A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
WO2012108920A1 (en) 2011-02-09 2012-08-16 Natera, Inc Methods for non-invasive prenatal ploidy calling
US20180173846A1 (en) 2014-06-05 2018-06-21 Natera, Inc. Systems and Methods for Detection of Aneuploidy
EP3656875B1 (en) * 2014-07-18 2021-09-22 Illumina, Inc. Non-invasive prenatal diagnosis

Also Published As

Publication number Publication date
CN113330121A (zh) 2021-08-31
WO2020131699A3 (en) 2020-07-30
CA3123847A1 (en) 2020-06-25
EP3899030A2 (en) 2021-10-27
WO2020131699A2 (en) 2020-06-25
US20220056534A1 (en) 2022-02-24

Similar Documents

Publication Publication Date Title
JP2022519159A (ja) 循環細胞の分析方法
JP7362805B2 (ja) 変異の検出および染色体分節の倍数性
JP2021520816A (ja) 循環腫瘍dnaの個別化された検出を用いる癌検出およびモニタリングの方法
US20220356530A1 (en) Methods for determining velocity of tumor growth
WO2023133131A1 (en) Methods for cancer detection and monitoring
RU2811503C2 (ru) Способы выявления и мониторинга рака путем персонализированного выявления циркулирующей опухолевой днк

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20210915

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210922

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240326