JP2019526257A - Dna試料中のゲノムコピー変化の検出方法 - Google Patents

Dna試料中のゲノムコピー変化の検出方法 Download PDF

Info

Publication number
JP2019526257A
JP2019526257A JP2019511456A JP2019511456A JP2019526257A JP 2019526257 A JP2019526257 A JP 2019526257A JP 2019511456 A JP2019511456 A JP 2019511456A JP 2019511456 A JP2019511456 A JP 2019511456A JP 2019526257 A JP2019526257 A JP 2019526257A
Authority
JP
Japan
Prior art keywords
region
sample
dna
adapters
genomic dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019511456A
Other languages
English (en)
Other versions
JP2019526257A5 (ja
JP7217224B2 (ja
Inventor
クリストファー ケー. レイモンド,
クリストファー ケー. レイモンド,
リー ピー. リム,
リー ピー. リム,
ジェニファー ヘルナンデス,
ジェニファー ヘルナンデス,
Original Assignee
レゾリューション バイオサイエンス, インコーポレイテッド
レゾリューション バイオサイエンス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by レゾリューション バイオサイエンス, インコーポレイテッド, レゾリューション バイオサイエンス, インコーポレイテッド filed Critical レゾリューション バイオサイエンス, インコーポレイテッド
Publication of JP2019526257A publication Critical patent/JP2019526257A/ja
Publication of JP2019526257A5 publication Critical patent/JP2019526257A5/ja
Priority to JP2021180899A priority Critical patent/JP7304393B2/ja
Application granted granted Critical
Publication of JP7217224B2 publication Critical patent/JP7217224B2/ja
Priority to JP2023044421A priority patent/JP2023078336A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/30Characterised by physical treatment
    • C12Q2523/301Sonication
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/114Reactions characterised by their quantitative nature the purpose being quantitative analysis involving a quantitation step
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/159Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer

Abstract

本発明は、細胞ゲノムDNAまたは無細胞DNA(cfDNA)の試料内の、変異性変化、SNP、転座、逆位、欠失、コピー数における変化、または他の遺伝的変異の検出のために有用な組成物及び方法を含む。いくつかの実施形態において、本発明のこれらの組成物及び方法は、生体試料(たとえば、血液)から全cfDNAのごく一部中のコピー数多型を検出する際に特に有用である非常に高水準の分解能を提供する。【選択図】図1

Description

関連出願の参照
本出願は、2016年8月25日に出願された米国仮特許出願第62/379,593号、及び2017年4月4日に出願された米国仮特許出願第62/481,538号に優先権を主張し、これらのそれぞれは、参照によりそれらの全体が本明細書に援用される。
配列表に関する記述
本出願に関連する配列表は、紙媒体の代わりにテキスト形式で提供され、参照により本明細書に援用される。配列表を含むテキストファイルの名称は、CLFK_005_02WO_ST25である。テキストファイルは、2,238KBであり、2017年8月24日に作成され、EFS−Webを介して電子提出された。
本発明は、概して、生体試料、たとえば、直接組織診または末梢血液などの定量的遺伝子解析のための組成物及び方法に関する。特に、本発明は、生体試料の、遺伝子特性及び解析と同様に、標的特異的コピー数変化の検出方法に関する。
全部でないにしてもほとんどの場合、最も一般的なヒトの癌がヒトゲノムの疾患であることは、明らかになりつつある。個人の一生の間に体細胞変異が蓄積し、体細胞変異がひそむ細胞が腫瘍中に発生する可能性を体細胞変異のいくつかが増加させると考えられる。蓄積された変異事象の誤った組み合わせだけで、前癌性増殖は、制御されない増殖を阻止する制約を失った結果、細胞塊が癌になる。癌の原因となるのに必要かつ十分である一連の変異は、「ドライバー変異」と合わせて称されることが多い。最新の、かつ集中的な分子解析から現れた主題の1つは、癌が以前は単一の組織特異的疾患と考えられていたが、実際には特有の分子病理を各有する関連した疾患群であることである。ヒトゲノム計画は、癌のゲノムワイド解析についての基礎を築いた。
遺伝子コピー数における変化は、生物学的多様性の基本的なドライバーである。進化の背景に、遺伝子の重複、及び機能の多様性は、種の多様性の良く認識されたドライバーである。ヒト疾患の背景に、体細胞内の遺伝子減少及び遺伝子増幅は、癌などの患部組織の特徴である。ある一定の治療薬は、これらのゲノムの増加及び/または減少変異を有する細胞上に特異的に作用するが、これらのような変異が患部細胞または癌細胞のDNA内にのみ存在することが多く、体の他の細胞中で見出されないために、これらのコピー数多型の同定は困難である。患部組織または細胞が変異したDNAの主な供給源であり、バイオプシーを介してDNAを取得することは、侵襲的で、危険であり、そして不可能であることが多い。瀕死の腫瘍または癌細胞が無細胞DNAまたは循環DNAと称される、それらのDNAの小片を血流中に放出する観察は、血液試料などの、低侵襲性技術によって実施されることが可能である遺伝子検査の開発を可能にした。しかしながら、試料から無細胞DNAを単離することから、DNAのわずかな量のみを取得することができ、全DNAの一部のみは、疾患と関連する変異を保因するであろう。たとえば、癌ゲノムの背景に、診断上著しい腫瘍変異は、有意に50%未満であるマイナーアレル頻度でのみ見出されることが多い。これは、アレル頻度が一般的に約100%、50%または0%である、従来のSNP遺伝子型判定と対照的である。
したがって、特異的な標的遺伝子座における遺伝子コピー数変化を検出することが可能であるゲノム技術が必要である。
cfDNAにおける希少変異を検出する方法は、国際PCT公開第WO2016/028316号に先行して記載されている。しかしながら、これらの技術は、非常にマイナーなアレル頻度で最も希少なコピー数減少を検出するために必要な感度を依然として欠く。本明細書に提供されるのは、標的特異的コピー数変化の検出用の組成物及び方法であり、これらの組成物及び方法は、直接組織診、末梢血液、及び特にcfDNAを含む、いくつかの試料タイプに適用可能である。本明細書に記載されるこれらの組成物及び方法は、全DNAのわずかな一部のみに存在するコピー数における変化を検出するのに十分に高感度である。
本発明は、とりわけ、細胞ゲノムDNA(たとえば、組織診試料からの)またはcfDNA(たとえば、血液試料からの)の試料内の、変異性変化、SNP、転座、逆位、欠失、コピー数における変化、または他の遺伝的変異の検出のために有用である組成物及び方法を含む。特に、本発明のこれらの組成物及び方法は、生体試料(たとえば、血液)から全cfDNAのごく一部中のコピー数多型を検出する際に特に有用である非常に高水準の分解能を提供する。
特定の実施形態は、DNA標的領域上で試験試料から遺伝子解析を実施する方法に描画され、この方法は、(a)複数のDNAライブラリ断片を含むゲノムDNAライブラリを生成することであって、各DNAライブラリ断片は試験試料からのゲノムDNA断片、及びアダプタを含む、生成すること、(b)DNA標的領域に特異的に結着する複数のキャプチャプローブとゲノムDNAライブラリを接触させることにより、DNA標的領域を含むキャプチャプローブとDNAライブラリ断片との間に複合体を形成すること、ならびに(c)DNA標的領域を含むゲノムDNA断片の定量的遺伝子解析を実施することを備え、そこでアダプタは増幅領域、試料タグ領域、及びアンカー領域を含むDNAポリヌクレオチドであり、そこで増幅領域はPCR増幅についてプライマー認識部位として機能することが可能であるポリヌクレオチド配列を含み、そこで試料タグはユニークライブラリDNA断片の一致度を符号化し、試験試料の一致度を符号化するポリヌクレオチド配列を含み、そこでアンカー領域は試験試料の一致度を符号化するポリヌクレオチド配列を含み、アンカー領域はゲノムDNA断片に付着することが可能であり、そこで遺伝子解析は疾患状態を示す遺伝的変化を検出するために実施される。
いくつかの実施形態において、疾患状態を示す遺伝的変化は、一塩基多様体(SNV)、40ヌクレオチド長未満の挿入、40ヌクレオチド長未満のDNA領域の欠失、及び/またはコピー数における変化から選択される。特定の実施形態において、疾患状態を示す遺伝的変化は、コピー数における変化である。いくつかの実施形態において、試験試料は、組織診である。さまざまな実施形態において、組織診は、腫瘍、または腫瘍であると疑われる組織から採取される。ある一定の実施形態において、ゲノムDNAは、無細胞DNA(cfDNA)または細胞DNAである。特定の実施形態において、ゲノムDNAは、試験試料から単離されるcfDNAであり、この試験試料は、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、便、粘液、及び汗からなる群から選択される生体試料である。
ある一定の実施形態において、ゲノムDNA断片は、(i)試験試料から細胞DNAを単離すること、及び(ii)この細胞DNAを断片化してゲノムDNA断片を取得すること、を備えるステップによって取得される。特定の実施形態において、ステップ(ii)は、細胞DNAを少なくとも1個の消化酵素と接触させることによって実施される。いくつかの実施形態において、ステップ(ii)は、機械的応力を細胞DNAへ加えることによって実施される。ある一定の実施形態において、この機械的応力は、細胞DNAを超音波処理することによって加えられる。
特定の実施形態において、この試料タグは、ユニークゲノムDNA断片の同定を容易にするユニーク分子識別子(UMI)をさらに含む。
いくつかの実施形態において、増幅領域は、10から50の間のヌクレオチド長にある。特定の実施形態において、増幅領域は、20から30の間のヌクレオチド長にある。ある一定の実施形態において、増幅領域は、25ヌクレオチド長にある。
いくつかの実施形態において、試料タグは、5から50の間のヌクレオチド長にある。特定の実施形態において、試料タグは、5から15の間のヌクレオチド長にある。ある一定の実施形態において、試料タグは、8ヌクレオチド長にある。いくつかの実施形態において、UMI増倍管は、試料タグ領域に隣接する、または試料タグ領域内に含まれる。
ある一定の実施形態において、UMI増倍管は、1から5の間のヌクレオチド長にある。特定の実施形態において、UMI増倍管は、3ヌクレオチド長にあり、64個の可能なヌクレオチド配列のうちの1個を含む。
いくつかの実施形態において、アンカー領域は、1から50の間のヌクレオチド長にある。特定の実施形態において、アンカー領域は、5から25の間のヌクレオチド長にある。ある一定の実施形態において、アンカー領域は、10ヌクレオチド長にある。
本発明の特定の実施形態は、(a)複数のDNAライブラリ断片を含むゲノムDNAライブラリを生成することのステップは、ゲノムDNA断片を複数のアダプタへ付着させることを備える。ある一定の実施形態において、ゲノムDNA断片は、ゲノムDNA断片を複数のアダプタと付着させる前に、末端修復される。特定の実施形態において、複数のアダプタの各アダプタの増幅領域は、同一のヌクレオチド配列を含む。
ある一定の実施形態において、複数のアダプタの各アダプタの試料タグ領域は、2から1,000個の間のヌクレオチド配列のうちの1個を含む。特定の実施形態において、複数のアダプタの各アダプタの試料タグ領域は、50から500個の間のヌクレオチド配列のうちの1個を含む。さまざまな実施形態において、複数のアダプタの各アダプタの試料タグ領域は、100から400個の間のヌクレオチド配列のうちの1個を含む。いくつかの実施形態において、複数のアダプタの各アダプタの試料タグ領域は、200から300個の間のヌクレオチド配列のうちの1個を含む。ある一定の実施形態において、複数のアダプタの各アダプタの試料タグ領域は、8ヌクレオチド長にある。いくつかの実施形態において、ヌクレオチド配列の各配列は、少なくとも2のハミング距離によって240個のヌクレオチド配列のいずれかの他の配列から分離する。
特定の実施形態において、複数のアダプタのそれぞれは、試料タグ領域に隣接する、または試料タグ領域内に含まれるUMI増倍管を含む。いくつかの実施形態において、複数のアダプタのそれぞれは、試料タグ領域に隣接するUMI増倍管を含む。ある一定の実施形態において、複数のアダプタの各アダプタのUMI増倍管は、1から5の間のヌクレオチド長にある。いくつかの実施形態において、複数のアダプタの各アダプタのUMI増倍管は、3ヌクレオチド長にある。
特定の実施形態において、複数のアダプタの各アダプタのアンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の4個のアンカー領域のうちの1個のみに対合される。
いくつかの実施形態において、複数のアダプタの各アダプタの増幅領域は、同一のヌクレオチド配列を含み、複数のアダプタの各アダプタの試料タグ領域は、8ヌクレオチド長にあり、各試料タグのヌクレオチド配列は、少なくとも2のハミング距離によって複数のアダプタの試料タグのいずれかの他のヌクレオチド配列から分離し、複数のアダプタのそれぞれは、試料タグ領域に隣接する、または試料タグ領域内に含まれるUMI増倍管を備え、複数のアダプタの各アダプタのUMI増倍管は、3ヌクレオチド長にあり、それぞれの可能なヌクレオチド配列のUMI増倍管は、複数のアダプタの各試料タグ領域に対合され、複数のアダプタの各アダプタのアンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の4個のアンカー領域のうちの1個のみに対合される。
本発明の特定の実施形態は、方法について描画し、この方法においてゲノムDNA断片を複数のアダプタと付着させるステップは、(i)アンカー領域の少なくとも一部を含むオリゴヌクレオチドを各ゲノムDNA断片へ付着させることであって、アンカー領域の少なくとも一部を含むオリゴヌクレオチドはパートナー鎖によって二本鎖にされる5’リン酸化付着鎖を含むDNA二本鎖であり、パートナー鎖は化学修飾による付着からその3’末端で遮断され、付着鎖はゲノムDNA断片に付着する、付着させること、(ii)アンカー領域の少なくとも一部を含むオリゴヌクレオチドに付着するゲノムDNA断片を、複数のアダプタの各アダプタのヌクレオチド配列についてアダプタ配列の全長を符号化するDNAオリゴヌクレオチドと接触させること、ならびに(iii)DNAライゲーションに適切な条件下で、ゲノムDNA断片、及びアダプタ配列の全長を符号化するDNAオリゴヌクレオチドを、T4ポリヌクレオチドキナーゼ、Taq DNAリガーゼ及びBstポリメラーゼの全長と接触させることを備え、それらにより、複数のアダプタをゲノムDNA断片に付着させる。いくつかの実施形態において、ゲノムDNA断片は、cfDNAである。ある一定の実施形態において、DNA標的領域をコピー数における変化について解析する。
特定の実施形態において、DNA標的領域を含むゲノムDNA断片の定量的遺伝子解析を実施するステップ(c)は、DNA標的領域を含むキャプチャプローブとDNAライブラリ断片との間に形成される複合体の精製を有する。ある一定の実施形態において、ステップ(c)は、DNA標的領域を含むキャプチャプローブとDNAライブラリ断片との間に形成される複合体の精製を有し、ゲノムDNAライブラリから関心領域を含むDNAライブラリ断片のプライマー伸長及び/または増幅を実施する。いくつかの実施形態において、ステップ(c)は、DNA標的領域を含むキャプチャプローブとDNAライブラリ断片との間に形成される複合体の精製を有し、ゲノムDNAライブラリから関心領域を含むDNAライブラリ断片のプライマー伸長及び増幅を実施する。ある一定の実施形態において、ステップ(c)は、複数のシーケンシングリードを生成するために、DNA標的領域を含むDNAライブラリ断片のDNAシーケンシングを備える。
いくつかの実施形態において、本発明は、方法を描画し、そこでゲノム解析は、DNA関心領域におけるコピー数の変化を測定することを備え、またそこでステップ(c)は、DNA標的領域を含むゲノムDNA断片の定量的遺伝子解析を実施し、試験試料に由来するゲノムDNAライブラリに存在する関心領域のコピー数を測定すること、そしてそれを標準試料に由来するゲノムDNAライブラリに存在する関心領域のコピー数と比較することを備え、そこで標準試料は、DNA標的領域の既知のコピー数を有する。
いくつかの実施形態において、関心領域においてコピー数を測定することは、複数のシーケンシングリードを生成するためにDNA標的領域を含むDNAライブラリ断片のDNAシーケンシングを備え、そこで各シーケンシングリードは、ユニーク分子識別素子(UMIE)を含む。いくつかの実施形態において、UMIEは、アダプタからのシーケンシング情報、及びゲノムDNA配列の少なくとも一部を含む。いくつかの実施形態において、同一UMIEを含むシーケンシングリードは、ユニークゲノム配列(UGS)として識別される。
いくつかの実施形態において、コピー数を測定する方法は、ゲノムDNAライブラリと接触するキャプチャプローブのそれぞれについて生のゲノム深度(RGD)を測定することをさらに備える。いくつかの実施形態において、RGDを測定することは、試料複製物群内の各キャプチャプローブ配列と関連するUGSの平均数を測定することを備える。いくつかの実施形態において、非常にばらつきのある数のUGSと関連するキャプチャプローブは、ノイズの多いプローブとして識別され、さらなる計算から除外される。いくつかの実施形態において、RGDを測定することは、試料についてRGDを計算することをさらに備え、この試料中のすべてのキャプチャプローブについてすべてのRGDの数値平均を計算することを備える。いくつかの実施形態において、ノイズの多いプローブについてのRGD値は、試料についてRGDを計算する際に含まれない。
いくつかの実施形態において、キャプチャプローブ用のRGDは、プローブ特異的な正規化されたリードカウントに各キャプチャプローブ用のRGDを変換することによって実験群中のすべての試料にわたり正規化され、これは、(i)試料中の各キャプチャプローブRGDに正規化定数を乗算することであって、正規化定数はいずれかの実数を含む、乗算すること、及び(ii)対応する試料について計算されるRGDで(i)の積を除算すること、または(iii)1サブセットのプローブから計算される平均RGDで(i)の積を除算することを備える。いくつかの実施形態において、1サブセットのプローブは、1セットの対照プローブである。
いくつかの実施形態において、プローブ特異的な正規化されたリードカウントは、コピー数値に変換され、これは、(i)女性に由来する試料において、常染色体及び/またはX連鎖領域を対象とするプローブのプローブ特異的な正規化されたリードカウントに2を乗算すること、(ii)男性に由来する試料において、Y連鎖領域及び/またはX連鎖領域を対象とするプローブのプローブ特異的な正規化されたリードカウントに1を乗算すること、(iii)実験において、すべての試料にわたり(i)及び/または(ii)の積を平均すること、及び(iv)(iii)の平均値で(i)及び/または(ii)の積を除算することを備える。いくつかの実施形態において、特異的な遺伝子を標的にするすべてのプローブについて近似したコピー数値を平均する。
いくつかの実施形態において、本発明は、コピー数増加及びコピー数減少の高感度検出方法について描画され、この方法は、(i)キャプチャプローブについてRGDを測定すること、(ii)キャプチャプローブについてのRGDをプローブ特異的な正規化されたリードカウントに変換することによって実験群中のすべての試料にわたりキャプチャプローブについてのRGDを正規化すること、(iii)各プローブ特異的な正規化されたリードカウントについて近似したコピー数値を計算すること、及び(iv)特異的な遺伝子を標的にするすべてのプローブについて近似したコピー数値を平均することを備える。
いくつかの実施形態において、本発明は、染色体安定性を測定する方法について描画され、この方法は、(i)1セットの1個以上の染色体安定性プローブを設計し、妥当性確認することであって、これらの染色体安定性プローブはヒト染色体にわたり一様に分布する、妥当性確認すること、(ii)1つ以上の染色体安定性プローブを使用して患者試料上で標的シーケンシングを実施すること、(iii)各染色体プローブについて近似したコピー数値を測定すること、(iv)患者試料のゲノム表現型を決定することであって、患者試料中の1つ以上の染色体プローブについてコピー数値における増減はゲノム不安定性を示す、決定することを備える。
いくつかの実施形態において、本発明は、それを必要とする被験体中の癌を処置する方法について描画され、この被験体は請求項62の方法に従い、不安定化されたゲノムを含むと識別され、癌を処置する方法は薬学的に有効量のPARP阻害剤を投与することを備える。
いくつかの実施形態において、本発明は、方法を描画し、そこでゲノム解析は、DNA関心領域におけるコピー数の変化を測定することを備え、またそこでステップ(c)は、DNA標的領域を含むゲノムDNA断片の定量的遺伝子解析を実施し、試験試料に由来するゲノムDNAライブラリに存在する関心領域のコピー数を測定すること、そしてそれを標準試料に由来するゲノムDNAライブラリに存在する関心領域のコピー数と比較することを備え、そこで標準試料は、DNA標的領域の既知のコピー数を有する。いくつかの実施形態において、関心領域は、遺伝子、または遺伝子の一部である。特定の実施形態では、遺伝子は、疾患と関連する。ある一定の実施形態では、この疾患は、がんである。さまざまな実施形態において、この遺伝子は、BRCA2、ATM、BRCA1、BRIP1、CHEK2、FANCA、HDAC2、及び/またはPALB2である。
特定の実施形態は、複数のDNAライブラリ断片を含むゲノムDNAライブラリについて描画され、そこで各DNAライブラリ断片はアダプタ及びゲノムDNA断片を含み、そこでアダプタは増幅領域、試料タグ領域、及びアンカー領域を含むDNAポリヌクレオチドであり、そこで増幅領域はPCR増幅についてプライマー認識部位として機能することが可能であるポリヌクレオチド配列を含み、そこで試料タグはユニークライブラリDNA断片の一致度を符号化し、試験試料の一致度を符号化するポリヌクレオチド配列を含み、そこでアンカー領域は試験試料の一致度を符号化するポリヌクレオチド配列を含み、アンカー領域はゲノムDNA断片に付着することが可能である。いくつかの実施形態において、この試料タグは、ユニーク分子識別子(UMI)をさらに含み、そこでUMIはユニークゲノムDNA断片の同定を容易にする。特定の実施形態において、増幅領域は、10から50の間のヌクレオチド長にある。特定の実施形態において、増幅領域は、25ヌクレオチド長にある。特定の実施形態において、試料タグは、5から50の間のヌクレオチド長にある。ある一定の実施形態において、試料タグは、8ヌクレオチド長にある。いくつかの実施形態において、UMI増倍管は、試料タグ領域に隣接する、または試料タグ領域内に含まれる。特定の実施形態において、UMI増倍管は、1から5の間のヌクレオチド長にある。ある一定の実施形態において、アンカー領域は、1から50の間のヌクレオチド長にある。いくつかの実施形態において、アンカー領域は、10ヌクレオチド長にある。特定の実施形態において、複数のアダプタの各アダプタの増幅領域は、同一のヌクレオチド配列を含む。いくつかの実施形態において、試料タグの各ヌクレオチド配列は、少なくとも2のハミング距離によって試料のヌクレオチド配列のいずれかの他の配列から分離する。ある一定の実施形態において、複数のアダプタのそれぞれは、試料タグ領域に隣接する、または試料タグ領域内に含まれるUMI増倍管を含む。特定の実施形態において、複数のアダプタのそれぞれは、試料タグ領域に隣接するUMI増倍管を含む。いくつかの実施形態において、複数のアダプタの各アダプタのアンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の4個のアンカー領域のうちの1個のみに対合される。いくつかの実施形態において、ゲノムDNA断片は、cfDNAである。
ある一定の実施形態において、複数のアダプタの各アダプタの増幅領域は、同一のヌクレオチド配列を含み、複数のアダプタの各アダプタの試料タグ領域は、8ヌクレオチド長にあり、複数のアダプタの各アダプタの試料タグ領域は、少なくとも2のハミング距離によって複数のアダプタの試料タグのいずれかの他のヌクレオチド配列から分離するヌクレオチド配列を含み、複数のアダプタのそれぞれは、試料タグ領域に隣接する、または試料タグ領域内に含まれるUMI増倍管を備え、複数のアダプタの各アダプタのUMI増倍管は、3ヌクレオチド長にあり、それぞれの可能なヌクレオチド配列のUMI増倍管は、複数のアダプタの各試料タグ領域に対合され、複数のアダプタの各アダプタのアンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の4個のアンカー領域のうちの1個のみに対合される。いくつかの実施形態において、ゲノムDNA断片は、cfDNAである。
ある一定の実施形態は、本明細書に記載される1つより多いゲノムライブラリを含む、複数のゲノムDNAライブラリについて描画される。いくつかの実施形態において、複数のゲノムDNAライブラリに属する1つのゲノムDNAライブラリの試料タグ領域の核酸配列は、複数のゲノムDNAライブラリに属する他のゲノムDNAライブラリの試料タグ領域の核酸配列と異なる。特定の実施形態において、複数のゲノムDNAライブラリに属する1つのゲノムDNAライブラリの増幅領域の核酸配列は、複数のゲノムDNAライブラリに属する他のゲノムDNAライブラリの増幅領域の核酸配列に同一である。
ある一定の実施形態は、無細胞DNA(cfDNA)のDNA標的領域の遺伝子解析方法について描画され、この遺伝子解析方法は、(a)本明細書に記載されるようなDNAライブラリを生成すること、(b)DNA標的領域に特異的に結着する複数のキャプチャプローブとcfDNAライブラリを接触させることにより、DNA標的領域を含むキャプチャプローブとDNAライブラリ断片との間に複合体を形成すること、及び(c)DNA標的領域を含むcfDNA断片の定量的遺伝子解析を実施すること、を備え、それらによりDNA標的領域の遺伝子解析を実施する。
ある一定の実施形態は、被験体における遺伝性疾患を予測する、診断する、または監視する方法を対象とし、この方法は、(a)試験試料を被験体から取得すること、(b)ゲノムDNAを試験試料から単離すること、(c)複数のDNAライブラリ断片を含むDNAライブラリを生成することであって、各DNAライブラリ断片は試験試料からのゲノムDNA断片、及びアダプタを含む、生成すること、(d)DNA標的領域に特異的に結着する複数のキャプチャプローブとcfDNAライブラリを接触させることにより、DNA標的領域を含むキャプチャプローブとDNAライブラリ断片との間に複合体を形成すること、ならびに(e)cfDNAクローンライブラリにおける遺伝性疾患に関連する1つ以上の標的遺伝子座の定量的遺伝子解析を実施することであって、1つ以上の標的遺伝子座における1つ以上の遺伝子損傷の同定または検出は遺伝性疾患の進行の予後判定、診断、または監視である、実施することを備える。特定の実施形態では、定量的遺伝子解析は、複数のシーケンシングリードを生成するためのDNAシーケンシングを含む。
特定の実施形態は、ユニークゲノムDNA断片の一致度、及び試験試料の一致度を符号化する1セットのアダプタについて描画され、ゲノムDNAライブラリを生成する際の使用のために、そこで1セットのアダプタ中の各アダプタは、増幅領域、試料タグ領域、及びアンカー領域を含むDNAポリヌクレオチドであり、そこで増幅領域は、PCR増幅についてプライマー認識部位として機能することが可能であるポリヌクレオチド配列を含み、そこで試料タグは、ユニークライブラリDNA断片の一致度を符号化し、試験試料の一致度を符号化するポリヌクレオチド配列を含み、そこでアンカー領域は、試験試料の一致度を符号化するポリヌクレオチド配列を含み、アンカー領域は、ゲノムDNA断片に付着することが可能である。いくつかの実施形態において、この試料タグは、ユニーク分子識別子(UMI)をさらに含み、そこでUMIはユニークゲノムDNA断片の同定を容易にする。さまざまな実施形態において、増幅領域は、10から50の間のヌクレオチド長にある。ある一定の実施形態において、増幅領域は、25ヌクレオチド長にある。特定の実施形態において、試料タグは、5から50の間のヌクレオチド長にある。いくつかの実施形態において、試料タグは、8ヌクレオチド長にある。特定の実施形態において、UMI増倍管は、試料タグ領域に隣接する、または試料タグ領域内に含まれる。いくつかの実施形態において、UMI増倍管は、1から5の間のヌクレオチド長にある。特定の実施形態において、アンカー領域は、1から50の間のヌクレオチド長にある。いくつかの実施形態において、アンカー領域は、10ヌクレオチド長にある。ある一定の実施形態において、複数のアダプタの各アダプタの増幅領域は、同一のヌクレオチド配列を含む。
いくつかの実施形態において、試料タグの各ヌクレオチド配列は、少なくとも2のハミング距離によって1セットのアダプタの試料タグのいずれかの他のヌクレオチド配列から分離する。さまざまな実施形態において、複数のアダプタのそれぞれは、試料タグ領域に隣接する、または試料タグ領域内に含まれるUMI増倍管を含む。特定の実施形態において、複数のアダプタのそれぞれは、試料タグ領域に隣接するUMI増倍管を含む。
いくつかの実施形態において、複数のアダプタの各アダプタのアンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の4個のアンカー領域のうちの1個のみに対合される。請求項75の1セットのアダプタにおいて、複数のアダプタの各アダプタの増幅領域は、同一のヌクレオチド配列を含み、各アダプタの試料タグ領域は、8ヌクレオチド長にあり、試料タグの各ヌクレオチド配列は、少なくとも2のハミング距離によって1セットのアダプタの試料タグのいずれかの他のヌクレオチド配列から分離し、複数のアダプタのそれぞれは、試料タグ領域に隣接する、または試料タグ領域内に含まれるUMI増倍管を備え、複数のアダプタの各アダプタのUMI増倍管は、3ヌクレオチド長にあり、UMI増倍管は、64個の可能なヌクレオチド配列のうちの1個を含み、それぞれの64個の可能なヌクレオチド配列のUMI増倍管は、複数のアダプタの試料タグ領域のそれぞれに対合され、複数のアダプタの各アダプタのアンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の4個のアンカー領域のうちの1個のみに対合される。
コピー数減少(CNL)アッセイのフレームワークを示す。各遺伝子(縦列)は、本明細書に陰影によって表される特徴的なユニークリード値を示す。各試料(横列)を同一の遺伝子パネルにわたり調べる。 CNLアッセイシグナルのドライバーを示す図解である。 無細胞DNA(cfDNA)上で実施される例示的なCNLアッセイのステップを説明する図解を示す。 例示的な第一生成アダプタ(図4A及び図4B)、及び本発明のアダプタ(図4Cから図4E)の図解を示す。図4Aは、第一生成アダプタ設計を示す。図4Bは、第一生成アダプタ中で249個の可能な配列タグの採取があり、これらの各配列タグは単一のアンカー配列に付着した5ヌクレオチド(nt)長にあったことを示す。図4Cは、第二生成アダプタの図を示す。図4Dは、4セットの8merタグ配列からなり、各セットが60個のメンバーを含む、単一の試料に適用される例示的な1セットのアダプタを示す。60個のタグの各セットは、4個のアンカー配列のうちの1個に特異的である。図4Eは、47ntのアダプタの例示的なDNA配列を示す。 同上。 図5A及び図5Bは、試料タグ内のUMI増倍管の位置を移動させることによりユニーク試料タグの数が増加することが可能であることを説明する図を示す。 CNLアッセイについてのゲノムライブラリを構築するプロセスを説明する図を示す。図6Aは、10ntのアンカー配列をゲノム断片の3’末端に付着させるステップを示す。図6Bは、ゲノムアダプタの全長を最初のアンカー配列にアニールするステップを示す。 DNAインプットをCNLライブラリ中に示す。左に示されるマーカーサイズ(bp)を有するアガロースゲル画像を示す。 図8A〜図8Cは、CNL解析によって決定されるように8個の試料にわたる測定された遺伝子コピーの従来の箱ひげ図を示す。 図9A及び図9Bは、断片化されたゲノム試料についてのCNL測定値における有意な標準からの偏差を定量化するLog10のP値プロットを示す。SNP百分率は、ΔATM及びΔBRCA2試料中に存在する希少なヘテロ接合SNPのマイナーアレル頻度を最上部に示す。 図10A及び図10Bは、断片化されたゲノムDNAによって添加されるcfDNA試料についてのCNL測定値における有意な標準からの偏差を定量化するLog10のP値プロットを示す。SNP百分率は、ΔATM及びΔBRCA2試料中に存在する希少なヘテロ接合SNPのマイナーアレル頻度を最上部に示す。 標的ハイブリッドキャプチャプラットフォームを示す。図11Aは、普遍的なシングルプライマーPCR増幅配列、試料多重化タグ、及びユニーク分子識別子をすべてのゲノムクローンへ提供する追加のアダプタ配列によってゲノムライブラリへのcfDNAの変換を示す。図11Bは、標的特異的キャプチャプローブ及びプライマー伸長によってハイブリダイズされる変性し増幅されたゲノムを示す。図11Cは、非対称ペアエンドシーケンシングの概略図を示す。図11Dは、一般的な標的キャプチャシーケンスランから377,711,020個のIllumina NextSeqリードについてマッピング統計を示す。98.5%のリードをそれらの意図された標的へマッピングする。重複排除後、20.40%のリード(77,053,048)は、ユニークゲノムクローンに由来する。 図12A〜図12Hは、プール1−3からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図13A〜図13Hは、プール4−6からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図14A〜図14Iは、プール7−9からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図15A〜図15Hは、プール10−12からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図16A〜図16Hは、プール13−15からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図17A〜図17Hは、プール16−18からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図18A〜図18Hは、プール19−21からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図19A〜図19Hは、プール22−24からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図20A〜図20Hは、プール25−27からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図21A〜図21Hは、プール28−30からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図22A〜図22Hは、プール31−32からのオリゴヌクレオチドのアダプタの配列を示す。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図23A〜図23Cは、TP53遺伝子の標的シーケンシングを示す。図23Aは、キャプチャプローブのBedFile表示を図示する。図23Bは、0から8000のスケールのユニークリード上で各塩基位置におけるカバレッジ深度を示す。図23Cは、既知のTP53スプライス変異体のUCSC遺伝子モデル表示を示す。より厚い矩形領域は、TP53符号化タンパク質についてアミノ酸コード化領域を表す。 図24A〜図24Cは、16個の試料にわたり、単一のプローブ、TP53r10_1について生の正規化されたユニークリード密度を示す。図24Aは、「重複排除」によって冗長リードの除去後に16個の独立した試料に対してプローブTP53r10_1によって生のユニークリードキャプチャ数を示す。図24Bは、16個の試料すべてについて2596個のキャプチャプローブにわたりユニークリードの網羅的平均を示す。図24Cは、16個の試料 にわたる正規化されたユニークリード深度を示す([プローブTP53r10_1からの試料nユニークリード×定数÷試料nからの網羅的平均ユニークリード/プローブ]として計算された)。 プローブ間の有意な平均深度変動にもかかわらず、いずれかの所与のTP53プローブ内の16個の試料のすべてについて正規化されたユニークリードカウントの一般的な一貫性を示す。16個の試料すべてについて正規化されたユニークリードカウントを狭い間隔の棒グラフの「柱」として示し、TP53を標的にする45個のプローブすべてについて結果を示す。「ノイズの多い」カウント挙動を示す2個のプローブを矢印で強調表示する。これらのようなプローブからのカウントは、後続のコピー数解析における外れ値として現れることが多い。 2596個のプローブの幅広のパネルにわたり正規化されたプローブごとのユニークリードカウントの試料間の一貫性を図示する。3個の代表的な試料からの散布図を示す。各点は、異なるプローブを表す。x軸は、16個の試料にわたる1個のプローブあたりの正規化された平均ユニークリード深度である。y軸は、3個の異なる個々の試料について1個のプローブあたりの正規化されユニークリード深度である。一貫したプローブごとのユニークリードカウントは、染色体コピー変動の定量的解析を支援する。 図27A〜図27Cは、健康な女性及び男性ドナーからのcfDNA、ならびに進行期前立腺癌患者からのcfDNAのコピー数解析を図示する。図27Aは、健康な女性ドナーからのcfDNAの解析を示す。x軸は、22個すべての常染色体からの領域を標的にする一連の対照プローブ、X連鎖AR遺伝子を標的にする一連のプローブ、及びTP53遺伝子のコード化領域を標的にする一連のプローブである。Y軸は、各プローブについて計算された倍数性を示す。この近似は、倍数性が既知である一連の対照試料に対して観察されたユニークリードカウントを正規化することによって各プローブについて計算される([試料_Zのプローブ_Yについてユニークリードカウント]×2÷[複数の対照試料についてのプローブ_Yに対する平均ユニークリードカウント])。図27Bは、X連鎖AR遺伝子が健康な男性における単数体コピー数を示すことを説明する。図27Cは、進行期前立腺癌患者からのcfDNAのコピー数解析を図示し、対照プローブ、AR遺伝子の増幅、及びTP53遺伝子の減少にわたり非常に有意な異数性の根拠を示す。 対照試料に関連する前立腺患者のcfDNAライブラリの全ゲノム異数性解析を示す。239個の各対照プローブについて近似した倍数性を染色体によって選別し、示す。患者の染色体の2個のプローブは、一貫したコピー減少を示し、大部分の染色体の5個のプローブは、コピー増加を示す。全てではないが多くの患者対照プローブについて、近似した倍数性の有意な偏差がみられる。 コピー数減少の検出の解析の妥当性確認を示す。不死化株NA02718(単一アレルΔATM)からのゲノムDNA、及びNA09596(単一アレルΔBRCA2)からのゲノムDNAは、16%でNA12878からの「ゴールドスタンダード」ゲノムDNA中に添加され、8%の両アレル欠失のマイナーアレル頻度に相当するものをもたらした。標的シーケンシング及びCNV解析後に、プローブごとの倍数性を2個の標的遺伝子について平均した。比較のために、2個の撹乱のない対照遺伝子、BRIP1及びHDAC2を示す。
A.概要
本発明は、とりわけ、細胞ゲノムDNA(たとえば、組織診試料からの)またはcfDNA(たとえば、血液試料からの)の試料内の、変異性変化、SNP、転座、逆位、欠失、コピー数における変化、または他の遺伝的変異の検出のために有用である組成物及び方法を含む。本発明のこれらの組成物及び方法は、絶妙な分解能によって生体試料(たとえば、血液)からcfDNA中のコピー数多型を検出する、信じられないほど困難な検出をする際に特に有用である。特に、本発明のいくつかの実施形態は、アダプタへ付着するゲノムDNA断片から作製されるゲノムDNAライブラリを生成し、DNA標的領域を複数のキャプチャプローブによってキャプチャし、このDNA標的領域を含むDNAライブラリ断片を単離し、DNA標的領域の定量的遺伝子解析を実施することによりDNA標的領域のコピー数を測定することによって、試験試料からDNA標的領域のコピー数を検出する方法について描画される。本明細書に記載されるアダプタは、試料の一致度またはゲノムDNAの供給源と同様に、配列されている個々のDNA断片の同定を可能にする。
本発明は、直接組織診及び末梢血を含むがこれらに限定されない、いくつかの試料タイプに適用可能である標的に特異的なコピー数変化の検出のための組成物及び方法を部分的に企図する。癌ゲノミクス、特に、固形腫瘍の解析のための無細胞DNA(cfDNA)アッセイとの関連で、腫瘍DNA量は、DNA全体のごくわずかな割合であることが多い。さらにコピー数減少は、ゲノムDNAアッセイ、特にコピー数変化が試料、たとえば、cfDNAアッセイからの全ゲノムDNAの一部にのみ存在することができるゲノムDNAアッセイ中で検出することが困難である。たとえば、癌患者から抽出される無細胞DNAの大部分は、正常な供給源に由来し、二倍体コピー数を有する(男性被験体中のX連鎖遺伝子を除く)。癌患者、たとえば、血漿から抽出される2%の循環DNAが腫瘍に由来する患者などにおいて、腫瘍に由来するDNAの割合は、低いマイナーアレル頻度を有することが多い。腫瘍抑制遺伝子(たとえば、乳癌中のBRCA1)の1コピーの減少は、検出可能なゲノム断片が存在しないマイナーアレル頻度が1%であることを意味する。この状況において、操作されるコピー数減少アッセイは、100コピー(正常)から99コピー(ヘテロ接合性遺伝子消失)の間で識別することが可能でなければならない。したがって、特定の実施形態は、本発明の方法及び組成物がcfDNAとの関連でもマイナーアレル頻度でコピー数における変化を検出するのに十分な分解能によってコピー数変化の検出を可能にすることを企図する。
この水準の識別を達成するために、本発明は、新規の試料アダプタ設計を提供する。本発明のこれらのアダプタは、(i)アダプタ全体に均一な性能、(ii)多数のユニーク分子識別子(UMI)、(iii)高効率の付着、及び(iv)試料多重化への適応能を含む、成功したコピー数減少のアッセイ性能について重要な特徴を有するように設計される。たとえば、本発明のアダプタは、以下を提供する。
アダプタ全体に均一な性能:生物情報学的解析は、試料内プローブ性能及び試料間プローブ性能に目を向けることが多い。したがって、試料にわたるアダプタプール間のいずれかの性能変動がCNL解析に必要とされるわずかな変動を検出する能力に悪影響を与えると想定される。本発明において、この性能の均一性は、固定試料タグ領域(試料及びゲノム断片の両方を識別するように機能する)が各プールについてランダムに選択されながら、各試料タグプールにすべて見受けられる複数のアンカータグと、ゲノム断片を識別するためにユニーク試料タグ配列を増加させるUMI増倍管とを含むことによって達成される。
多数のユニーク分子識別子(UMI):これらのアダプタが分子生物学的観点から機能的に当量でなければならならず、それらは、ユニークゲノム断片の同定を増強させる非常に多数のユニーク配列のタグ(≧10,000)を含まなければならない。これに関連して、「増強させる」ことによって、二本鎖DNAを切断したゲノム配列中の位置に対応する断片化部位の特定の対を各ゲノムクローン断片が含むことを意味する。各クローンが異なる切断部位を含む可能性が高いため、この切断部位を使用して、ユニークゲノムクローンを区別する。しかしながら、数千個の独立したクローンを含むライブラリにおいて、ユニークに由来する断片は、全く同一の切断部位を含むことが多い。同一の切断部位を共有するゲノムクローン(すなわち、断片)は、同一の試料に由来する他のクローン配列に関して、ユニークまたは冗長のいずれか一方として分類されることが可能である。非常に多様性である配列タグを導入するアダプタを付着させることにより、同一の切断部位を共有する異なるゲノムクローンは、ユニークとして識別される可能性がさらに高い。このシステムにおいて、UMIは、UMI増倍管と試料タグ領域の組み合わせによって作製される。UMI及び切断部位の組み合わせは、ユニーク分子識別子素子(UMIE)を作製し、このUMIEは、冗長リードまたはユニークリードとして配列リードの分類を容易にする。特定の実施形態は、UMI増倍管がより長い配列、またはより短い配列を含み、全体的なUMI複雑性を増す、または低下させることが可能であることを企図する。
高効率の付着:アダプタは、ゲノム断片に高効率で付着しなければならない。ほとんどの腫瘍学用途において、利用可能な細胞DNAまたはcfDNAの量は、限られるため、ゲノムライブラリクローンへのこれらのゲノム断片の変換は、非常に効率的でなければならない。これを達成するために、本発明のいくつかの態様において、本明細書に記載されるアダプタシステムは、約25%から約50%以上のゲノムインプット断片をゲノムライブラリクローンに変換する。
試料多重化への適応能:一般に、アダプタの異なるセットのプールがなければならず、そこでセットの各ユニークアダプタを異なる試料に付着させる。同時に、アダプタのセットの各メンバーは、セット中のすべての他のメンバーへ本質的に同一挙動(配列カウント観点から)を有さなければならない。これを達成するために、いくつかの実施形態において、試料タグ領域は、いずれかの他の可能な試料タグ組み合わせ間で2のハミング距離を有し、リードが誤った試料に擬似的に割り当てられる可能性を減らす。いくつかの実施形態において、各セットのアダプタをプール中で分断し、特異的なアンカー領域と対合させ、試料多重化解除におけるエラーの可能性のさらなる減少を可能にする。たとえば、2のハミング距離を有する8merのタグにおいて、可能な配列の全数は、16,384個である。
特定の実施形態において、アダプタのオリゴヌクレオチドの所定のプールを提供する。これらのような所定のプールを使用して、単一の試料を表す。すなわち、X個のアダプタのオリゴヌクレオチドの各プールにおける各アダプタ配列(上記の所与の例において16,384個)は、他の試料を識別するために使用されるあらゆる他のプール中の各アダプタ配列と異なる。当業者は、アダプタのオリゴヌクレオチドについて可能である別個の所定のプール数が試料タグ及び/またはUMI増倍管の長さに依存することを認識するであろう。
したがって、ある一定の実施形態において、これらのアダプタは、1個の配列を含む、すなわち、試料タグ及び隣接する及び/または包含されたUMI増倍管は、両方の試料を表し、または識別し、遺伝子断片をユニークに識別する。これは、配列を識別するためにランダムに生成されたタグと、多重化を可能にするインデックスを付ける別々のバーコードまたはシーケンサとを使用する、当該技術分野において用いられる現在のシステムに対して全く対照的である。
図3において、標的に特異的なコピー数変化を試料から取得されるDNA内で検出するために例示的な実施形態を示す。図3は、cfDNAからDNAライブラリを生成するが、この例示的な手順は、他の供給源、たとえば、断片化された細胞DNAなどからのDNAによって使用されることが可能である。図3に示されるように、cfDNAを捕集する(最上部のパネル)。つぎに、本発明のゲノムライブラリアダプタ(灰色の丸)をゲノムDNAにコンジュゲートすることによって、ゲノムライブラリをcfDNAから生成する。関心のゲノム領域を認識するキャプチャプローブ(黒色の丸)によってゲノムDNA断片を捕らえる。関心のゲノムDNAを配列決定し、関心のゲノムDNAのコピー減少解析及び/または特徴についてデータ解析を実施する。
反対のことが明示されない限り、本発明における特定の実施形態の実施には、化学、生化学、有機化学、分子生物学、微生物学、組換えDNA技術、遺伝学、免疫学、及び細胞生物学における当業者の技能範囲内の従来的な方法が用いられることになり、これらの多くを、例示の目的で後に説明する。このような技法は、文献で十分に説明されている。たとえば、Sambrook,et al.,Molecular Cloning:A Laboratory Manual(3rd Edition,2001);Sambrook,et al.,Molecular Cloning:A Laboratory Manual(2nd Edition,1989);Maniatis et al.,Molecular Cloning:A Laboratory Manual(1982);Ausubel et al.,Current Protocols in Molecular Biology(John Wiley and Sons,updated July 2008);Short Protocols in Molecular Biology:A Compendium of Methods from Current Protocols in Molecular Biology,Greene Pub.Associates and Wiley−Interscience;Glover,DNA Cloning:A Practical Approach,vol.I&II(IRL Press,Oxford,1985);Anand,Techniques for the Analysis of Complex Genomes,(Academic Press,New York,1992);Transcription and Translation(B.Hames&S.Higgins,Eds.,1984);Perbal,A Practical Guide to Molecular Cloning(1984);及びHarlow and Lane,Antibodies,(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1998)を参照する。
B.定義
別途定義されない限り、本明細書で使用する技術的用語及び科学的用語は、本発明が属する技術分野の当業者によって一般的に理解されている意味と同じ意味を有する。本発明の実施または試験の際に、本明細書に記載の方法及び材料に類似したまたは同等の、任意の方法及び材料を使用することは可能であるが、好ましい実施形態の組成物、方法、及び材料について説明する。本発明において、以下の用語は下記のように定義する。
冠詞「a」、「an」、及び「the」は、本明細書では、冠詞の文法的対象の1つまたは複数(すなわち、少なくとも1つ)を指すように使用している。例として、「(an)要素」は、1つの要素または1つを超える要素を意味する。
選択肢(例えば、「または(or)」)の使用は、選択肢のうちの1つ、両方、またはその任意の組合せのいずれかを意味するものと理解されたい。
「及び/または(and/or)」という用語は、選択肢のうちの1つまたは両方のいずれかを意味するものと理解されたい。
本明細書で使用する「約(about)」または「およそ(approximately)」という用語は、参照の量、レベル、値、数、頻度、パーセンテージ、寸法、サイズ、量、重量、または長さに対し、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%、または1%の分変動する量、レベル、値、数、頻度、パーセンテージ、寸法、サイズ、量、重量、または長さを指す。一実施形態では、「約(about)」または「およそ(approximately)」という用語は、参照の量、レベル、値、数、頻度、パーセンテージ、寸法、サイズ、量、重量、または長さについて、±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%、または±1%の量、レベル、値、数、頻度、パーセンテージ、寸法、サイズ、量、重量、または長さの範囲を指す。
本明細書全体において、文脈上他の意味が要求されない限り、「含む(comprise、comprises、comprising)」という語は、述べられるステップ若しくは要素またはステップ若しくは要素の群を含むことを意味し、ただし任意の他のステップ若しくは要素またはステップ若しくは要素の群を除外することを意味するものではないことを理解されたい。特定の実施形態では、「含む(include)」、「有する(has)」、「含有する(contain)」、及び「含む(comprise)」は同義語として使用される。
「〜からなる(consisting of)」は、「〜からなる(consisting of)」という語句の後に来るものすべてを含み、それに限定されることを意味する。したがって、「〜からなる(consisting of)」という語句は、挙げられる要素が必要または必須であり、かつ他の要素は存在しない場合があることを示す。
「本質的に〜からなる(consisting essentially of)」は、このフレーズの後に挙げられる任意の要素を含み、他の要素については、挙げられる要素の開示内容で指定された活性または作用を妨げず、寄与もしない要素に限定することを意味する。したがって、「本質的に〜からなる(consisting essentially of)」というフレーズは、挙げられる要素は必要または必須であるが、他の要素については任意選択ではなく、挙げられる要素の活性または作用に影響を及ぼすかどうかに応じて、他の要素が存在する場合もあれば存在しない場合もあることを示す。
本明細書全体における「一実施形態(one embodiment)」、「一実施形態(an enbodiment)」、「特定の実施形態」、「関連した実施形態」、「ある特定の実施形態(a certain embodiment)」、「追加的な実施形態」、若しくは「さらなる実施形態」、またはこれらの組合せに対する言及は、実施形態に関連して記載されている特定の特徴、構造、または特色が本発明の少なくとも1つの実施形態に含まれていることを意味する。したがって、本明細書全体の様々な箇所で出現する上記フレーズが、必ずしも全て同じ実施形態を言及しているわけではない。さらに、特定の特徴、構造、または特色は、1つ以上の実施形態における任意の好適な方法で組み合わせることができる。
本明細書で使用する「単離した(isolated)」という用語は、天然の状態において通常は付随する構成要素を実質的または本質的に含まない材料を意味する。特定の実施形態では、「取得した(obtained)」または「導き出した(derived)」という用語は、「単離した」の同義語として使用される。
本明細書で使用する「DNA」という用語は、デオキシリボ核酸を指す。様々な実施形態では、DNAという用語は、ゲノムDNA、組換えDNA、合成DNA、またはcDNAを指す。一実施形態では、DNAはゲノムDNAまたはcDNAを指す。特定の実施形態において、DNAは「標的領域」を含む。本明細書で企図されるDNAライブラリは、ゲノムDNAライブラリ、及びRNAから構築するcDNAライブラリ、例えば、RNA発現ライブラリなどが含まれる。様々な実施形態では、DNAライブラリは1つ以上の追加的なDNA配列及び/またはタグを含む。
用語、「標的遺伝子座」及び「DNA標的領域」は、本明細書に互換的に使用され、DNA配列内の関心領域を指す。様々な実施形態では、標的遺伝子座に対し標的化遺伝子解析を実施する。特定の実施形態では、DNA標的領域は、特定の遺伝子様相、遺伝子状態、遺伝性疾患、胎児検査、遺伝子モザイク、父子鑑定、薬物治療に対する応答の予測、医学的状態の診断若しくは監視、マイクロバイオームプロファイリング、病原体スクリーニング、または臓器移植監視に関連する遺伝子の領域である。さらに実施形態において、DNA標的領域は、特定のヒト染色体、たとえば、特定の常染色体若しくはX連鎖染色体、またはその領域(たとえば、ユニーク染色体領域)などと関連するDNA配列である。
本明細書で使用する「循環DNA」、「循環セルフリーDNA」、及び「セルフリーDNA」という用語は、しばしば互換的に使用され、細胞外DNAであるDNA、細胞から押し出されたDNA、またはネクローシス性細胞若しくはアポトーシス性細胞から放出されたDNAを指す。この用語は、「細胞ゲノムDNA」または「細胞DNA」と対照的に使用されることが多く、本明細書に互換的に使用され、ゲノムDNAを指し、このゲノムDNAは、細胞(すなわち、ヌクレアーゼ)内に含まれ、また細胞の完全性にある、またはその他の方法により細胞の完全性を破壊することによって、本明細書に記載されるこれらのような分子生物学的技術に唯一到達可能である。
本明細書で使用する「対象」、「個体」、または「患者」には、本明細書で企図する組成物により検出または識別され得る状態の症状を示す任意の動物が含まれる。好適な対象としては、実験動物(例えば、マウス、ラット、ウサギ、またはモルモット)、家畜(例えば、ウマ、ウシ、ヒツジ、ブタ)、飼育動物、すなわちペット(例えば、ネコまたはイヌ)が挙げられる。特定の実施形態では、対象は哺乳類である。あるいくつかの実施形態では、対象は非ヒト霊長類であり、好ましい実施形態では、対象はヒトである。
本明細書に使用されるように、用語「対合された」は、異なるポリヌクレオチド配列を含むDNAの2個の異なるポリヌクレオチド配列または領域に関連して使用されるときに、異なるポリヌクレオチド配列を含むDNAの2個の異なるポリヌクレオチド配列または領域が同一のポリヌクレオチド上に存在することを意味する。たとえば、DNAの特定の試料タグ領域がDNAの特定の増幅領域に対合されると言われる場合に、試料タグ領域及び増幅タグが同一のDNAポリヌクレオチド分子上に存在することを意味する。
C.コピー数解析方法
様々な実施形態では、DNA標的領域のDNAのコピー数解析方法を提供する。ある一定の実施形態において、コピー数解析は、ゲノムDNA断片及びアダプタを各含むDNAライブラリ断片のゲノムDNAライブラリを生成し、これらのDNA標的領域を含むDNAライブラリ断片を単離し、DNA標的領域の定量的遺伝子解析を行うことによって実施される。「定量的遺伝子解析」は、DNA変異、SNP、転座、欠失、及びコピー数多型(CNV)を含むが、これらに限定されない、DNA(たとえば、遺伝子、遺伝子座、関心の標的領域など)における変化を定量化することが可能である、いずれかの分子生物学的技術によって実施される解析を意味する。ある一定の実施形態では、定量的遺伝子解析をシーケンシング、たとえば、次世代シーケンシングによって実施する。
次世代DNAシーケンシング(NGS)は、2つの診断用途に最適である。最初は、莫大な規模のDNA配列の決定である。本発明に関連して、この能力は、効果的な治療決定を導く、稀な、実施可能な変異体についての検索を可能にする。つぎは、遺伝子コピー数をカウントすることである。数百万個の独立した配列のアウトプットは、ゲノムワイドスケールで遺伝子コピー数の正確な測定を可能にすることができる。胎児トリソミー用の母体血試料からの非侵襲的な出生前検査の出現は、この能力に対する証明である。インプットがゲノムDNAよりもむしろRNA(cDNA)であるが、RNAseq、すなわち、NGSを使用する遺伝子発現プロファイリング技術は、別の例である。現在のキャプチャ方法の比較は、Samorodnitsky et al.J Mol Diagn.2015 Jan;17(1):64−75、に記載される。
本発明は、NGSカウント能力を標的ハイブリッドキャプチャ方法の範囲に拡張する。本明細書に記載されるこれらの方法は、それらが以下の4つの品質を有するために、少なくとも部分的にコピー数多型の検出に効果的である。
(a)本発明のこれらの方法は、ユニーククローンと冗長クローンとを区別する。増幅されたゲノムDNAライブラリ断片のNGSシーケンシングは、複数の個々のNGSリードをもたらし、これらのNGSリードは、特異的なヒトゲノム配列に結合されるアダプタ符号化配列情報を各含む。これらの素子は、すべてのクローンの一致度を定義する。キャプチャされたゲノム領域をPCRによって増幅するため、その後のNGS解析で同一のクローンに数回遭遇することは、珍しくはない。単一クローン化及びキャプチャプロセスに由来するリード群は、「冗長リード」と称される。2個以上の冗長リードは、ユニーク分子識別素子(UMIE)によって提供されるシーケンシング情報に基づき冗長リードとして識別される。UMIEは、アダプタタグからの配列情報、及びゲノムDNA配列の開始の組み合わせを指す。同一UMIEを含む2個以上のリードを冗長リードとして識別する。冗長リードを合わせてグループ化し、単一の代表的なコンセンサス配列を冗長リードのファミリーから組み立てる。このコンセンサス配列は、「ユニークリード」または「ユニークゲノム配列」(UGS)と称される。各ユニークリードは、元のDNA検体から分離したクローンを表す。冗長クローンファミリーを識別し、グループ化するプロセス、及びこのファミリーを表す単一のユニークリードを生成するプロセスを、「重複排除」と定義する。これらのアダプタは、ゲノムライブラリを作製するために使用され、ユニーク試料タグ情報(1個のアダプタあたり15,360個のコード)の非常に深いレパートリーをもつ。それぞれのキャプチャされたゲノムクローン(キャプチャプローブに関して>100の異なる位置に及ぶことが可能である)の正確なマッピング座標と併せて適用するときに、ゲノムライブラリに生成された後に、標的特異的キャプチャプローブによって取得される各ユニーククローンは、同一のキャプチャ環境を包含するすべての他のユニーククローンと区別可能である非常に高い尤度を有する。ユニーククローンを冗長クローンと区別する能力は、本明細書に記載される方法に中心となるものである。
(b)ゲノムライブラリを作製するために使用されるアダプタは、アダプタ間のばらつきをコピー数カウントにおいて生じることなく試料多重化を可能にする。コピー数決定の重要な基礎は、単一のシーケンシングラン内ですべて処理された1セットの試料の同時解析である。これにより、正及び負の対照を臨床試料に加えて含むことが可能である。以前のアダプタ設計繰り返しに関する主な課題は、同一の対照試料間の遺伝子コピーカウントにおけるわずかなシフトを誘導し、実際には、血液に基づく、固形腫瘍遺伝子型判定アッセイに臨床的に有益であるには高すぎたシグナル対ノイズの不確実性閾値を設定した。本発明は、この課題を克服し、シングルコピー遺伝子減少が≦2%のマイナーアレル頻度で検出可能であるように、シグナル対ノイズ閾値を実質的下げる。この改善されたシグナル認識は、本発明の方法が腫瘍DNAアッセイを循環させる際に有意な臨床的有用性を有することを可能にする。
(c)本明細書に使用される独自開発の標的ハイブリッドキャプチャ方法は、すべての標的にわたり非常に均一な「標的上」リードカバレッジを作製しなければならない。本明細書に記載されるものなどの、ユニークゲノム断片のカウントに頼り、コピー数を推定する方法は、すべての可能なユニーク断片に遭遇する観点から近飽和を達成しなければならない。オーバーサンプリング、すなわち、最終的に遭遇するユニークリード数より多いシーケンシングリードを集めることによってのみ近飽和を達成する。実用的、スケーラブル、及び経済的であるために、標的上リードの<10倍のオーバーサンプリング、及び好ましくは標的上リードの<4倍のオーバーサンプリングが>90%のユニーク標的上リードをすべての標的遺伝子座でキャプチャするように、標的ハイブリッドキャプチャライブラリ中のユニークリードは、十分な均一性を示さなければならない。
(d)標的ハイブリッドキャプチャ方法(米国特許公開第2014−0274731号を参照する)は、高い標的上捕捉率を有さなければならない。実用的、スケーラブル、及び経済的であるために、換言すれば、この分野における他の技術と比較して本開示の顕著な特徴であるために、この方法は、>90%、好ましくは>95%の標的上リードを達成しなければならない。標的上マッピング率が95%を超えながら、標的上リードの4から10倍のオーバーサンプリングについての要件、及びオーバーサンプリング全体についての要件は、同一のものである。
いくつかの実施形態では、試料中に存在するDNA標的領域のコピー数を定量的遺伝子解析によって決定する。いくつかの実施形態において、試料中に存在するDNA標的領域のコピー量を比較すること、またそれを既知のコピー数を有する1つ以上の試料中に存在するDNA標的領域の量と比較することによって、DNA標的領域のコピー数を決定する。
特定の実施形態は、本明細書に記載される組成物及び方法がゲノムDNAの試料中のコピー数における変化を検出するために特に有益であることを企図し、そこで試料中の全ゲノムDNAの一部のみがコピー数における変化を有する。たとえば、有意な腫瘍変異は、試料、たとえば、無細胞DNAの試料などの中に存在する可能性があり、すなわち、アレル頻度が一般的に約100%、50%または0%である従来のSNP遺伝子型判定と比較して、有意に50%未満で(たとえば、0.1%から>20%の範囲に)あるマイナーアレル頻度に存在する。当業者は、本発明の組成物及び方法が一塩基多様体(SNV)、短い(たとえば、40塩基対(bp)未満の)挿入、及び欠失(インデル)を含む変異の他のタイプと、発癌遺伝子融合を含むゲノム再編成とを検出する際にまた有用であることを認識するであろう。
ある一定の実施形態において、本明細書に記載される本発明の組成物及び/または方法は、1つ以上のDNA標的領域のコピー数における変化を検出する、識別する、観察する、及び/または明らかにするために有用であり、これらをすることができ、これらをすることに適しており、及び/またはこれらをすることができ、このコピー数における変化は、試料からの全ゲノムDNAの、約20%未満、約19%未満、約18%未満、約17%未満、約16%未満、約15%未満、約14%未満、約13%未満、約12%未満、約11%未満、約10%未満、約9%未満、約8%未満、約7%未満、約6%未満、約5%未満、約4%未満、約3%未満、約2%未満、約1%未満、約0.5%未満、約0.2%未満、または約0.1%未満に存在する。いくつかの実施形態において、本発明の方法は、試料からの全ゲノムDNAの、約0.01%から約100%、約0.01%から約50%、及び/または約0.1%から約20%の間に存在する1つ以上のDNA標的領域のコピー数における変化を検出する、識別する、観察する、及び/または明らかにするために有用であり、これらをすることが可能であり、これらをするのに適しており、及び/またはこれらのことをすることができる。
特定の実施形態を図1に図示される概念的なフレームワークによって表す。図1において、各遺伝子を縦列によって表し、各患者試料を横列として表す。いずれかの所与のゲノムDNA試料内に、各個々の遺伝子について計数される断片数は、ある程度のばらつきを有し、そしてその関心のいずれかの所与のDNA領域、たとえば、遺伝子などについて、他の試料中のDNA標的領域へ正規化されたカウントに関して有意な断片カウント偏差としてコピー数における撹乱を検出する。このようなアッセイは、試料内で遺伝子ごとの断片カウントプロファイルが再現性のあることを要求し、また試料ごとのカウントプロファイルは同等性が高いことを要求する。アッセイ要件の両方は、良好なシグナル対ノイズカウント識別を要求する。
いくつかの実施形態は、図2に示されるように、シグナル対ノイズ比を増すことに寄与するアッセイ要素がゲノムインプット、プローブ数、及びシーケンシング深度であることを企図する。
特定の実施形態では、cfDNAの遺伝子解析方法は、cfDNAライブラリを生成及び増幅すること、cfDNAライブラリにおけるゲノム当量数を決定すること、ならびに1つ以上のゲノム標的遺伝子座の定量的遺伝子解析を実施することを含む。
特定の実施形態は、本明細書に記載される方法及び組成物のいずれかが、ゲノムDNA、たとえば、細胞DNAまたはcfDNAなどを使用して、遺伝子状態、遺伝子条件、遺伝性疾患、遺伝子モザイク現象、胎児診断、父子鑑定、マイクロバイオームプロファイリング、病原体スクリーニング、及び臓器移植監視を効率的に解析する、検出する、診断する、及び/または監視するための使用に効果的であり、そこで試料中の全ゲノムDNAのすべて、または一部のみが関心特徴、たとえば、遺伝子損傷、変異、一塩基多様体(SNV)などを含むことを企図する。いくつかの実施形態において、関心特徴は、疾患または状態と関連する遺伝子特徴である。たとえば、有意な腫瘍変異は、試料、たとえば、cfDNAの試料などの中に存在する可能性があり、アレル頻度が一般的に約100%、50%または0%である従来のSNP遺伝子型判定と比較して、有意に50%未満で(たとえば、0.1%から>20%の範囲に)あるマイナーアレル頻度に存在する。
ある一定の実施形態において、本明細書に記載される本発明の組成物及び/または方法は、1つ以上のDNA標的領域の遺伝子損傷を検出する、識別する、観察する、及び/または明らかにするために有用であり、これらをすることが可能であり、これらをすることに適し、及び/またはこれらをすることができ、1つ以上のDNA標的領域のこの遺伝子損傷は、試料からの全ゲノムDNAの、約20%未満、約19%未満、約18%未満、約17%未満、約16%未満、約15%未満、約14%未満、約13%未満、約12%未満、約11%未満、約10%未満、約9%未満、約8%未満、約7%未満、約6%未満、約5%未満、約4%未満、約3%未満、約2%未満、約1%未満、約0.5%未満、約0.2%未満、または約0.1%未満に存在する。いくつかの実施形態において、本発明の方法は、試料からの全ゲノムDNAの、約0.01%から約100%、約0.01%から約50%、及び/または約0.1%から約20%の間に存在する1つ以上のDNA標的領域の遺伝子損傷を検出する、識別する、観察する、及び/または明らかにするために有用である、これらをすることが可能である、これらをするのに適している、及び/またはこれらをすることができる。
1.DNAライブラリの生成
特定の実施形態において、本明細書に企図される遺伝子解析方法は、末端修復DNAを生成するために1つ以上の末端修復酵素によって処置するcfDNAまたは断片化細胞ゲノムDNAを含むDNAライブラリを生成すること、及びDNAライブラリを生成するために末端修復DNAの各末端に1つ以上のアダプタを付着させることを備える。
ゲノムDNA
特定の実施形態において、本明細書で企図される方法及び組成物は、ゲノムDNAをアナライトとして使用して、コピー数における変化を効率的に解析、検出、診断、及び/または監視するように設計される。ある一定の実施形態において、コピー数解析は、試験試料、たとえば、組織診などの生体試料などから得られるゲノムDNAからゲノムDNAライブラリを生成することによって実施される。ある一定の実施形態において、ゲノムDNAは、循環または無細胞DNAである。いくつかの実施形態において、ゲノムDNAは、細胞ゲノムDNAである。
ある一定の実施形態において、骨髄、食道、胃、十二指腸、直腸、結腸、回腸、膵臓、肺、肝臓、前立腺、脳、神経、髄膜組織、腎組織、子宮内膜組織、子宮頸部組織、乳房、リンパ節、筋肉、及び皮膚を含むが、これらに限定されない、組織試料、または組織から得られる組織診からゲノムDNAを取得する。ある一定の実施形態において、組織試料は、腫瘍、または疑わしい腫瘍の組織診である。特定の実施形態において、腫瘍は、癌性である、または癌性であると疑われる。特定の実施形態において、組織試料は、癌細胞、または癌性であると疑われる細胞を含む。
細胞からの、または細胞から構成される生体組織からのゲノムDNAを精製する方法は、当該技術分野において周知であり、当業者は、組織、及び組織を取得する条件に応じて、最適な手順または市販のキットを認識するであろう。いくつかの実施形態は、組織からの細胞DNAを精製することにより、たとえば、化学的方法及び物理的方法によって、細胞DNAを曝露するために細胞破砕または細胞溶解を必要とすることを企図し、これらの化学的方法及び物理的方法は、組織試料を配合する、粉砕する、または超音波処理すること、細胞溶解にも機能する界面活性剤またはサーファクタントを加えることによって、膜脂質を除去し、任意選択で、たとえば、プロテアーゼを加えることなどによって、タンパク質を除去すること、たとえば、RNaseを加えることなどによって、RNAを除去すること、ならびにたとえば、細胞溶解ステップ中に使用される界面活性剤、タンパク質、塩類及び試薬類からの、DNA精製などである。たとえば、エタノールまたはイソプロパノールによる、沈殿によって、またフェノール−クロロホルム抽出によって、DNA精製を実施することができる。
特定の実施形態において、本明細書に記載されるようにゲノムDNAライブラリを取得する、生成する、作製する、形成する、及び/または産生する前に、またはこれらをする間に、組織及び/または細胞から取得される細胞DNAを断片化する。当業者は、DNA断片化についていくつかの適切な技術があることを理解し、次世代シーケンシングを有するが、これに限定されない、DNAシーケンシングについてゲノムDNAライブラリを生成するために、細胞DNAを断片化するために適切な技術を認識し、識別することが可能である。ある一定の実施形態は、物理的断片化、酵素的断片化、及び化学的せん断を有するが、これらに限定されない、方法によってライブラリを生成するために、適切な、及び/または十分な長さの断片に細胞DNAを断片化することが可能であることを企図する。
物理的断片化は、音響学的せん断、超音波処理、及び流体力学的せん断を有するが、これらに限定されないことが可能である。いくつかの実施形態において、物理的断片化によって細胞DNAを断片化する。特定の実施形態では、音響学的せん断または超音波処理によって、細胞DNAを断片化する。特定の実施形態は、音響学的せん断及び超音波処理が細胞DNAをせん断するために使用される共通の物理的方法であることを企図する。Covaris(登録商標)機器(Woburn,MA)は、DNAを100から5kb bpで破壊するための音響装置である。またCovarisは、メイトペアライブラリについて、試料を6から20kbで処理するチューブ(gTube)を製造する。Bioruptor(登録商標)(Denville,NJ)は、クロマチン、DNAをせん断し、組織を撹乱するために利用される超音波処理装置である。わずかな量のDNAを150から1kbの長さでせん断することが可能である。Digilab(Marlborough,MA)からのHydroshearは、DNAをせん断するために流体力を利用する。またNebulizer(Life Tech,Grand Island,NY)を使用して、圧縮空気を用いて液体を微粒化し、DNAを100から3kb断片に数秒でせん断することが可能である。噴霧化は、低コストであるが、このプロセスは、元の試料からの細胞DNAの約30%の減少を引き起こすことがある。ある一定の実施形態において、超音波処理によって、細胞DNAを断片化する。
酵素的断片化は、制限エンドヌクレアーゼ、たとえば、DNase Iによる処置、または非特異的ヌクレアーゼによる処理を含むが、これらに限定されないことが可能である。いくつかの実施形態において、酵素的断片化によって細胞DNAを断片化する。特定の実施形態において、制限エンドヌクレアーゼによる処置によって、細胞DNAを断片化する。いくつかの実施形態において、非特異的ヌクレアーゼによる処置によって、細胞DNAを断片化する。ある一定の実施形態において、トランスポサーゼによる処置によって、細胞DNAを断片化する。ある一定の実施形態は、細胞DNAを小片にせん断する酵素的方法がDNAse I、マルトース結合タンパク質(MBP)−T7 Endo I及び非特異的ヌクレアーゼの組み合わせ、Vibrio vulnificus(Vvn)New England Biolabs(Ipswich,MA)の Fragmentase、及びNextera tagmentation technology(Illumina,San Diego,CA)を含むことを企図する。非特異的ヌクレアーゼ及びT7Endoの組み合わせは、相乗的に機能し、非特異的ニック及びカウンタニックを産生し、ニック部位から8ヌクレオチド以下を解離する断片を生成する。タグメンテーションは、アダプタを二本鎖DNA上で同時に断片化し、挿入するトランスポサーゼを使用する。
化学的断片化は、加温及び二価の金属カチオンによる処置を有することが可能である。いくつかの実施形態において、化学的断片化によってゲノムDNAを断片化する。特定の実施形態は、ゲノムDNAに対向するように長いRNA断片の粉砕のために化学的せん断をより一般的に使用することを企図する。化学的断片化は、二価の金属カチオン(マグネシウムまたは亜鉛)によってDNAの加温消化を通して一般的に実施される。インキュベーション時間を増加させる、または減少させることによって、DNA断片の長さを調整することが可能である。
特定の実施形態において、本明細書で企図される方法及び組成物は、無細胞DNA(cfDNA)をアナライトに使用して、コピー数における変化を効率的に解析、検出、診断、及び/または監視するように設計される。cfDNAのサイズ分布は、約150bpから約180bp断片の範囲である。cfDNAの断片化は、エンドヌクレアーゼ及び/またはエキソヌクレアーゼ活性の結果であり得るものであり、この断片化により、正確で信頼性の高いロバストなcfDNA解析に対する困難な課題が提示される。cfDNA解析に関するもう1つの課題は、血流における半減期が約15分程度と短いことである。いかなる特定の理論にも拘泥されることは望まないが、本発明は、その一部として、cfDNAの解析が「リキッドバイオプシー」に類似するものであり、現在の生体プロセスのリアルタイムスナップショットであることを企図している。
さらに、cfDNAは、細胞内に見出されず、また生物学的流体及び便試料を含むが、これらに限定されない、複数の適切な供給源から得ることができるため、解析される組織への直接アクセスなどの、次世代シーケンシング解析を困難にする既存の制限を受けない。
特定の実施形態においてcfDNAを単離するための好適な供与源となる生物学的流体の例示的な例は、以下に限定するものではないが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、粘液、及び汗が挙げられる。特定の実施形態では、生物学的流体は血液または血漿である。
ある一定の実施形態では、市販されているキット及び当業者に知られた他の方法を使用して、患者の生物学的流体から、または過去に取得し、任意選択により安定化させた生物学的試料(例えば、凍結及び/または酵素キレート剤(EDTA、EGTA、または2価カチオンに特異的な他のキレート剤を含むが、これに限定されない)による安定化)から、直接cfDNAを単離することができる。
(a)末端修復cfDNAの生成
特定の実施形態において、ゲノムDNAライブラリを生成することは、単離されたcfDNAまたは断片化細胞DNAの末端修復を備える。断片化cfDNAまたは細胞DNAを末端修復酵素によって処理し、平滑末端、5’−オーバーハング、または3’−オーバーハングによって、末端修復cfDNAを生成する。いくつかの実施形態において、末端修復酵素は、たとえば産生することが可能である。いくつかの実施形態において、末端修復cfDNAまたは細胞DNAは、平滑末端を含有する。いくつかの実施形態では、末端修復細胞DNAまたはcfDNAは、平滑末端を含有するように処理される。いくつかの実施形態では、末端修復cfDNAまたは細胞DNAの平滑末端は、単一塩基対オーバーハングを含有するように、さらに修飾される。いくつかの実施形態では、平滑末端を含む末端修復cfDNAまたは細胞DNAは、アデニン(A)/チミン(T)オーバーハングを含有するようにさらに処理されることが可能である。いくつかの実施形態では、平滑末端を含む末端修復cfDNAまたは細胞DNAは、単一塩基対オーバーハングとしてアデニン(A)/チミン(T)オーバーハングを含有するように、さらに処理されることが可能である。いくつかの実施形態では、末端修復cfDNAまたは細胞DNAは、非鋳型化3’オーバーハングを有する。いくつかの実施形態では、末端修復cfDNAまたは細胞DNAは、3’オーバーハングを含むように処理される。一部の実施形態では、末端修復cfDNAまたは細胞DNAは、3’オーバーハングを含有するように末端トランスフェラーゼ(TdT)で処理される。一部の実施形態では、TdTによりGテールを加えてもよい。いくつかの実施形態では、末端修復cfDNAまたは細胞DNAは、オーバーハング末端を含有するように、任意の公知の制限酵素(例えば、Sau3A酵素など)による部分的消化を用いて処理される。
(b)末端修復cfDNAへのアダプタ分子の付着
特定の実施形態において、cfDNAライブラリを生成することは、1つ以上のアダプタを末端修復cfDNAの各末端へ付着させることを備える。本発明は、部分的に、cfDNAライブラリ中の多数のゲノム当量を収容するように設計されるアダプタモジュールを企図する。アダプタモジュールは、cfDNAライブラリに存在するゲノム当量数を測定するように構成され、伸長によって、シーケンシングアッセイの感度を使用して、配列変異を識別した。
本明細書に使用されるように、用語「アダプタ」及び「アダプタモジュール」は、互換的に使用され、また増幅領域、試料タグ領域、及びアンカー領域の少なくとも3つの要素を含むポリヌクレオチドを指す。特定の実施形態において、アダプタは、増幅領域、試料タグ領域、及びアンカー領域を含む。いくつかの実施形態において、このアダプタは、ユニーク分子識別子(UMI)をも含む。特定の実施形態では、このアダプタは、1つ以上の増幅領域、1つ以上の試料タグ領域、1つ以上のUMI、及び/または1つ以上のアンカー領域を含む。いくつかの実施形態において、このアダプタは、5’から3’の順に、増幅領域、試料タグ領域、UMI、及びアンカー領域を含む。特定の実施形態において、このアダプタは、5’から3’の順に、増幅領域、試料タグ領域、UMI、及びアンカー領域を含む。ある一定の実施形態において、UMIは、試料タグ領域内に含まれ、このアダプタは、5’から3’の順に、増幅領域、組み込まれた試料タグ/UMI領域、及びアンカー領域を含む。
本明細書に使用されるように、用語「増幅領域」は、PCR増幅についてプライマー認識部位として機能することが可能であるポリヌクレオチド配列を含むアダプタ分子の元素を指す。特定の実施形態では、アダプタは、ゲノムDNAライブラリのシングルプライマー増幅について1つ以上のプライマー認識配列を含有する増幅領域を含む。いくつかの実施形態では、増幅領域は、ゲノムDNAライブラリのシングルプライマー増幅について、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、または10個超のプライマー認識配列を含む。
いくつかの実施形態において、増幅領域は、約5から50の間のヌクレオチド長、10から45の間のヌクレオチド長、15から40の間のヌクレオチド長、または20から30の間のヌクレオチド長にある。いくつかの実施形態では、増幅領域は、10個のヌクレオチド、11個のヌクレオチド、12個のヌクレオチド、13個のヌクレオチド、14個のヌクレオチド、15個のヌクレオチド、16個のヌクレオチド、17個のヌクレオチド、約18個のヌクレオチド、19個のヌクレオチド、20個のヌクレオチド、21個のヌクレオチド、22個のヌクレオチド、23個のヌクレオチド、24個のヌクレオチド、25個のヌクレオチド、26個のヌクレオチド、27個のヌクレオチド、28個のヌクレオチド、29個のヌクレオチド、30個のヌクレオチド、31個のヌクレオチド、32個のヌクレオチド、33個のヌクレオチド、34個のヌクレオチド、35個のヌクレオチド、36個のヌクレオチド、37個のヌクレオチド、38個のヌクレオチド、39個のヌクレオチド、または40個以上のヌクレオチドである。特定の実施形態において、増幅領域は、25ヌクレオチド長にある。
本明細書に使用されるように、用語「試料タグ」または「試料タグ領域」は、互換的に使用され、それが由来した試料と同様に特定のDNA断片をユニークに識別するポリヌクレオチド配列を含むアダプタ素子を指す。
ある一定の実施形態において、試料タグ領域は、約3から50の間のヌクレオチド長、約3から25の間のヌクレオチド長、または約5から15の間のヌクレオチド長にある。いくつかの実施形態では、試料タグ領域は、3ヌクレオチド長、4ヌクレオチド長、5ヌクレオチド長、6ヌクレオチド長、7ヌクレオチド長、8ヌクレオチド長、9ヌクレオチド長、10ヌクレオチド長、約11ヌクレオチド長、12ヌクレオチド長、13ヌクレオチド長、14ヌクレオチド長、15ヌクレオチド長、16ヌクレオチド長、17ヌクレオチド長、18ヌクレオチド長、19ヌクレオチド長、または20ヌクレオチド長以上にある。
ある一定の実施形態では、アダプタは、UMI増倍管を含み、そこでUMI増倍管は、少なくとも1ヌクレオチド長、少なくとも2ヌクレオチド長、少なくとも3ヌクレオチド長、少なくとも4ヌクレオチド長、少なくとも5ヌクレオチド長、少なくとも6ヌクレオチド長、少なくとも7ヌクレオチド長、少なくとも8ヌクレオチド長、少なくとも9ヌクレオチド長、または少なくとも10ヌクレオチド長にある。
ある一定の実施形態において、UMI増倍管の各ヌクレオチド位置は、アデニン、グアニン、シトシン、またはチミンのいずれかを含むことが可能である。したがって、いくつかの実施形態において、n個のヌクレオチドを含むUMI増倍管は、n個の可能なヌクレオチド配列のいずれかを含むことが可能である。いくつかの実施形態において、UMI増倍管は、1ヌクレオチド長にあり、4個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、2ヌクレオチド長にあり、16個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、3ヌクレオチド長にあり、64個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、4ヌクレオチド長にあり、256個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、5ヌクレオチド長にあり、1,024個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、6ヌクレオチド長にあり、4,096個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、7ヌクレオチド長にあり、16,384個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、8ヌクレオチド長にあり、65,5336個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、9ヌクレオチド長にあり、262,144個の可能な配列のうちの1個を含む。いくつかの実施形態において、UMI増倍管は、10以上のヌクレオチド長にあり、1,048,576個以上の可能な配列のうちの1個を含む。
特定の実施形態において、アダプタは、UMI増倍管を含み、そこでUMI増倍管は、試料タグ領域(図5A)に隣接する、またはこの試料タグ領域内に含まれる。試料タグに隣接する、または試料タグ内に含まれるUMI増倍管の例示的な例を図5Bに示す。図5Bにおいて、隣接するUMI増倍管(縦列の最上部及び最下部)、または試料タグ(中間の7縦列)内に組み込まれるUMI増倍管を含む、8−mer試料タグ領域を示す。いくつかの実施形態において、そのアダプタは、8ヌクレオチド長にある試料タグ、及び3ヌクレオチド長にあり、64個の可能な配列のうちの1個を含むUMI増倍管を含み、そこでUMI増倍管は、試料タグ領域に隣接する、またはこの試料タグ領域内に含まれる。いくつかの実施形態において、同一のプロセスは、アダプタ全長をゲノム断片の他の末端に付着させる。
特定の実施形態では、アダプタモジュールは、1つ以上のアンカー配列を含む。本明細書に使用されるように、「アンカー領域」及び「アンカー配列」は、互換的に使用され、パートナーオリゴヌクレオチドをハイブリダイズするヌクレオチド配列を指す。いくつかの実施形態では、アンカー領域は、以下の3つの特性を有する。(1)各アンカー配列は、伸長内の各部位に4個の可能なDNA塩基のそれぞれを合わせて表す2個以上のアンカー配列のファミリーの部分であり、この特徴、平衡した塩基表現は、特定の実施形態においてシーケンシングリードにおける適切な塩基呼び出しを較正するために有用である。(2)各アンカー配列は、4個の可能な塩基のうちの2個のみから構成され、そしてこれらは、いずれかの数の、また等しい数のA+C、または等しい数のG+Tであるように特異的に選択され、2個の塩基のみから形成されるアンカー配列は、アンカー配列が適切なアダプタ機能を妨げる二次構造の形成に関与する可能性を減少させる。そして(3)各アンカー配列は、等しい数のA+CまたはG+Tから構成され、各アンカー配列は、1セットの4個中のすべての他のアンカー配列と同一の融解温度及び二本鎖安定性を大まかに共有する。
いくつかの実施形態において、アンカー配列は、1から50の間のヌクレオチド長にある。いくつかの実施形態において、アンカー配列は、4から40の間のヌクレオチド長にある。ある一定の実施形態において、アンカー領域は、5から25の間のヌクレオチド長にある。特定の実施形態では、アンカー領域は、少なくとも4ヌクレオチド長、少なくとも6ヌクレオチド長、少なくとも8ヌクレオチド長、少なくとも10ヌクレオチド長、少なくとも12ヌクレオチド長、少なくとも14ヌクレオチド長、または少なくとも16ヌクレオチド長にある。特定の実施形態において、アンカー領域は、10ヌクレオチド長にある。
特定の実施形態では、付着ステップは、「タグ付き」ゲノムDNAライブラリを生成するためにアダプタモジュールを末端修復cfDNAまたは細胞DNAに付着させる/ライゲーションすることを備える。いくつかの実施形態では、単一アダプタモジュールを用いる。いくつかの実施形態では、2種、3種、4種、または5種のアダプタモジュールを用いる。いくつかの実施形態では、同一配列のアダプタモジュールを、断片化した末端修復DNAの各末端に付着させる。
いくつかの実施形態では、複数種のアダプタを末端修復細胞または無細胞ゲノムDNA断片に付着させる。これらの複数種のアダプタのそれぞれは、cfDNAまたは細胞DNAライブラリの増幅について1個以上の増幅領域と、cfDNAまたは細胞ゲノムDNA断片の同定、及び個々の試料の同定について1個以上の試料タグ領域と、DNAシーケンシングについて1個以上の配列とを含むことができる。
いくつかの実施形態において、複数種のアダプタは、試料の末端修復細胞または無細胞ゲノムDNA断片に付着し、複数種のアダプタは、同一のヌクレオチド配列の増幅領域をすべて含む。
ある一定の実施形態において、試料からのゲノムDNAを、複数のアダプタと付着させ、これらの複数のアダプタは、他の試料からのゲノムDNA断片に付着するアダプタ中の試料タグ領域の他の配列とすべて異なる試料タグ配列を含む。
特定の実施形態において、複数種のアダプタを試料からの末端修復細胞または無細胞ゲノムDNA断片に付着させ、これらの複数のアダプタは、2から10,000個の間のヌクレオチド配列のうちの1個、5から5,000個の間のヌクレオチド配列のうちの1個、25から1,000個の間のヌクレオチド配列のうちの1個、50から500個の間のヌクレオチド配列のうちの1個、100から400個の間のヌクレオチド配列のうちの1個、または200から300個の間のヌクレオチド配列のうちの1個を含有する1個以上の試料タグ領域をすべて含む。いくつかの実施形態において、各アダプタの試料タグ領域は、8ヌクレオチド長にあり、複数のアダプタの各試料タグ領域は、240個のヌクレオチド配列のうちの1個を含む。
ある一定の実施形態において、複数種のアダプタは、試料からの末端修復細胞または無細胞ゲノムDNA断片に付着し、複数種のアダプタの試料タグ領域は、1、2、3、4または4を上回るハミング距離によって互いに異なるヌクレオチド配列を含む。特定の実施形態では、ハミング距離は、2である。
特定の実施形態において、試料のゲノムDNA断片に付着する複数のアダプタの試料タグ領域は、8ヌクレオチド長にあり、2のハミング距離によって互いに異なる240個のヌクレオチド配列のうちの1個を含む。
ある一定の実施形態において、試料タグ領域は、個々のゲノムDNA断片を識別するように、また個々の試料、すなわち、ゲノムライブラリ供給源を識別するように機能する。たとえば、試料に付着する複数のアダプタの試料タグが240個の可能な配列のうちの1個を含むときに、各試料は、240個の可能なタグのうちの1個を含むと識別され、各試料は、2のハミング距離(一方のタグを他方のタグに変化させるために2塩基変化を必要とすることを意味する)によっていずれかの他の試料から分離する、240個のタグの1セットを受容する。これらの同一のタグを使用し、クローン多様性を列挙するので、それらは、配列タグとしても機能する、すなわち、ゲノムDNA断片を識別する。可能な配列タグの多様性をさらに増すために、UMI増倍管を加えることができる。たとえば、3塩基の64個の可能な組み合わせからなる3個のヌクレオチドを含むアダプタ領域にUMI増倍管を加えることが可能である。加えて、複数のアダプタは、1個を上回るアンカー配列を含むことが可能である。たとえば、複数のアダプタは、同時に使用される4個の異なるアンカー配列を含むことができる。また、エラーを少なくするために試料多重化解除中に、これらのアンカー配列を使用することができる。
図4は、第一生成アダプタ(図4A及び図4B)と本発明のアダプタ(図4Cから図4E)との間の例示的な比較を示す。図4A及び図4Bは、40ntの長さにあり、別々のPCR増幅配列、配列タグ、及び試料タグからなる第一生成アダプタの例を示す。ここで、試料は、固定配列(配列タグ)によって識別され、この固定配列は、試料からDNAライブラリを生成するために使用されるすべてのアダプタ上に存在する。個々のゲノム断片は、別々の、また別個の配列(配列タグ)によって識別される。図4Cから図4Eは、本発明からのアダプタの例示的な例を示す。示される例示的なアダプタは、47ヌクレオチド長にあり、配列タグは、試料タグと混合する。3塩基の64個の可能な組み合わせからなる、追加の3ntの配列、UMI増倍管がある。10ntのアンカー配列は、4個の異なる別個の配列のうちの1個である。
したがって、例示的な例(図4Cから図4Eを参照する)において、単一の試料に関連して使用される1セットのアダプタは、240個の試料タグ配列を含み、これらの試料タグ配列は、4セットの試料タグ配列に分割され、各セットは、60個のタグ(各ヌクレオチド、A、C、T及びGについて1個)を含むことが可能である。したがって、60個のタグの各セットは、4個のアンカー配列のうちの1個に特異的である。合計で、1試料あたり240個の可能な試料タグ配置のプールが可能である。具体的に、この事態において、これらの240個の試料タグ配列を60個の配列の4セットに分割し、この各セットは、特異的なアンカー領域を対象とする。したがって、試料IDは、8個のヌクレオチド試料タグからの配列情報だけではなく、関連したアンカー配列情報をも含む。加えて、リード内の配列の位置を固定するので、試料タグ及びアンカー配列は、下流の考察用に封入体フィルタを通すため、シーケンシングリード内に固定位置を有さなければならない。さらに、UMI増倍管の封入体は、配列タグ多様性を240から240×64=15,360個の可能な配列タグまで増加させる。
本明細書に企図される1個以上のアダプタの付着を当業者に知られている方法によって実施することができる。特定の実施形態において、本明細書に企図される1個以上のアダプタを、平滑末端を含む末端修復cfDNAに付着させる。ある一定の実施形態において、本明細書に企図される1個以上のアダプタは、用いられる付着方法に適切である相補的な末端を含む末端修復cfDNAに付着する。ある一定の実施形態において、本明細書企図される1個以上のアダプタは、3’オーバーハングを含む末端修復cfDNAに付着する。
いくつかの実施形態において、ゲノムDNA断片を複数のアダプタに付着させることは、末端修復cfDNAまたは細胞DNA断片を、アンカー領域の少なくとも一部を含むオリゴヌクレオチドに付着させるステップを備える。いくつかの実施形態において、オリゴヌクレオチドは、全アンカー領域を含む。特定の実施形態において、オリゴヌクレオチドは、パートナー鎖によって二本鎖にされる5’リン酸化付着鎖を含むDNA二本鎖であり、そこでパートナー鎖は、化学修飾による付着からその3’末端で遮断され、そこで付着鎖は、ゲノムDNA断片に付着する。ある一定の実施形態において、つぎにアンカー領域の少なくとも一部と付着するDNA断片を、DNAオリゴヌクレオチドによってアニールし、アダプタ配列の全長を符号化する。特定の実施形態において、1個以上のポリヌクレオチドキナーゼ、1個以上のDNAリガーゼ、及び/または1個以上のDNAポリメラーゼを、ゲノムDNA断片、及びDNAオリゴヌクレオチドに加え、アダプタ配列の全長を符号化する。いくつかの実施形態において、ポリヌクレオチドキナーゼは、T4ポリヌクレオチドキナーゼである。いくつかの実施形態において、DNAリガーゼは、Taq DNAリガーゼである。ある一定の実施形態において、DNAポリメラーゼは、Taqポリメラーゼである。特定の実施形態において、DNAポリメラーゼは、Bstポリメラーゼ全長である。
図6は、複数のアダプタを修復されたDNA断片の3’末端に付着させる例示的な方法を示す。第一ステップにおいて、アンカー配列をゲノム断片の3’末端に付着させる。このステップにおいて、アンカー部分は、DNA二本鎖であり、このDNA二本鎖において、10ヌクレオチドの5’リン酸化「付着鎖」は、8ヌクレオチド「パートナー鎖」によって二本鎖にされ、これらのヌクレオチドパートナー鎖は、化学修飾による付着からその3’末端で遮断される。アンカー二本鎖は、リン酸化/遮断末端上の平滑末端であるので、平滑末端ゲノム断片に付着することが可能である。つぎのステップにおいて、全アダプタ配列を符号化するオリゴヌクレオチドのプールを最初のアンカー配列にアニールする。T4ポリヌクレオチドキナーゼ、Taq DNAリガーゼ、及びBstポリメラーゼの全長の混合作用は、上部の鎖について図示されるようにライゲーションを介してこのオリゴヌクレオチドを付着させ、最初のアンカー配列をDNA重合によって下部の鎖上に伸長させ、アダプタ配列の全長を完成させる。同一のプロセスを使用して、アダプタ全長をゲノム断片の5’末端に付着させることができる。
2.DNAライブラリ増幅
特定の実施形態において、本明細書に企図される遺伝子解析方法は、ゲノムDNAライブラリ、たとえば、細胞DNAライブラリまたはcfDNAライブラリなどの増幅を有し、1個のDNAクローンライブラリ、若しくは複数のDNAクローンの1個のライブラリ、たとえば、1個のcfDNAクローンライブラリ、若しくは複数のcfDNAクローンの1個のライブラリ、または1個の細胞DNAクローンライブラリ、若しくは複数の細胞DNAクローンの1個のライブラリなどを生成する。DNAライブラリの各分子は、末端修復DNA断片の各末端に付着するアダプタを含み、各アダプタは、1つ以上の増幅領域を含む。いくつかの実施形態において、異なるアダプタを末端修復cfDNAの異なる末端に付着させる。特定の実施形態において、異なるアダプタを末端修復細胞DNAの異なる末端に付着させる。
いくつかの実施形態において、同じアダプタをDNA断片の両方の末端に付着させる。末端修復DNAの両方の末端への同一アダプタの付着により、シングルプライマー配列によるPCR増幅が可能である。特定の実施形態において、アダプタが付着したcfDNAライブラリの一部を、シングルプライマー配列駆動増幅による標準的なPCR手法を用いて増幅することになる。一実施形態では、単一プライマー配列は、約25ヌクレオチドであり、任意選択により、標準的なイオン強度条件下で≧55℃の推定Tmを有する。
特定の実施形態において、ピコグラム単位の初期ゲノムDNAライブラリ、たとえば、細胞DNAライブラリまたはcfDNAライブラリを、マイクログラム単位のDNAクローンに増幅、つまり10,000倍に増幅する。増幅産物の量は、当該技術分野で公知の方法(例えば、Qubit2.0またはNanodrop装置での定量化)を用いて測定されることができる。
3.ゲノム当量数の決定
様々な実施形態において、ゲノムDNAの遺伝子解析方法は、DNAクローンライブラリにおけるゲノム当量数を決定することを備える。本明細書で使用する「ゲノム当量」という用語は、各ライブラリにおけるゲノムコピー数を指す。本明細書で企図する組成物及び方法が遭遇する重要な課題は、遺伝子配列における希少な遺伝子突然変異または相違を検出し解析するのに十分なアッセイ感度を達成することである。試料ごとに基づいてアッセイ感度の値を決定するために、シーケンシングライブラリ内に存在するゲノム当量数を測定することにより、各試料内に存在する異なる別々の配列の数を測定する。感度を確立するため、ゲノム当量数を試料ライブラリごとに測定しなければならない。
ゲノム当量数は、qPCRアッセイにより、またはシーケンシング実施後のバイオインフォマティクスに基づくカウントにより決定されることができる。臨床試料のプロセスフローでは、ゲノム当量のqPCR測定は、DNAライブラリ、たとえば、cfDNAライブラリまたはゲノムDNAライブラリなどにQCステップとして使用される。配列解析の前にアッセイ感度の期待値を確立させ、試料に対応するDNAクローンライブラリがゲノム当量の要求深度を欠く場合は、その試料を解析から除外することが可能になる。最終的には、バイオインフォマティクスに基づくゲノム当量カウントも使用してゲノム当量を特定する。そのため、それぞれの所与のDNAクローンライブラリに対するアッセイ感度及び偽陰性推定値も特定される。
実験的qPCRアッセイ及び統計的カウントアッセイは十分に相互関係を有するべきである。シーケンシングによってDNAクローンライブラリにおける配列深度が明らかにならない場合は、DNAクローンライブラリの再処理及び/または追加的なシーケンシングが必要となり得る。
一実施形態では、細胞DNAまたはcfDNAクローンライブラリにおけるゲノム当量を定量的PCR(qPCR)アッセイを用いて決定する。特定の実施形態では、既知濃度の標準的なライブラリを使用して標準曲線を構築し、この得られた標準曲線にqPCRアッセイを適合させ、適合度からゲノム当量の値を導き出す。本発明者らは、ゲノム中の共通配列、たとえば、反復配列などへ特異的にハイブリダイズする一方のプライマーと、アダプタ中のプライマー結着部位へ結着する他方のプライマーとを含むqPCR「反復に基づく」アッセイがアダプタの特異的なプライマー(cfDNAクローンの両方の末端上に存在する)だけを使用する方法と比較してゲノム当量中で8倍増加を測定したことを発見した。反復に基づくアッセイにより測定されるゲノム当量数は、より一貫したライブラリ間パフォーマンスをもたらし、またゲノム当量のqPCR推定値とシーケンシング実行時にバイオインフォマティクス的にカウントしたタグ当量との間のアライメントをより良好なものにする。
本明細書で企図する反復に基づくゲノム当量アッセイでの使用に好適な、反復の例示的な例としては、以下に限定するものではないが、短散在型核内反復配列(SINE)(例えば、Alu反復)、長散在型反復配列(LINE)(例えば、LINE1、LINE2、LINE3)、マイクロサテライト反復配列(例えば、短いタンデム反復(STR)、単純反復配列(SSR))、及び哺乳類散在型反復(MIR)が挙げられる。
一実施形態では、反復はAlu反復である。
4.定量的遺伝子解析
様々な実施形態では、ゲノムDNA、たとえば、ゲノム細胞またはcfDNAなどの遺伝子解析方法は、DNAライブラリクローンにおける1つ以上の標的遺伝子座の定量的遺伝子解析を含む。定量的遺伝子解析は、以下のステップの1つ以上、または全てを含む:標的遺伝子座を含むDNAクローンのキャプチャ;キャプチャした標的遺伝子座の増幅;キャプチャし増幅した標的遺伝子座のシーケンシング;及び得られたシークエンスリードのバイオインフォマティクス解析。本明細書に使用されるように、用語「DNAライブラリクローン」は、DNAライブラリ断片を指し、そこでアダプタ及びゲノムDNA断片の組み合わせは、ユニークDNA配列(たとえば、その別のDNAライブラリクローンと区別されることが可能であるDNA配列)をもたらす。
(a)標的遺伝子座のキャプチャ
本発明は、その一部として、より大きなプローブの効率及び信頼性を保持するように設計され、ただしより小さなDNA断片を含むゲノムDNAライブラリ、たとえば、cfDNAクローンライブラリなどにおける情報価値のない配列の生成を最小限にとどめる、キャプチャプローブモジュールを企図する。本明細書に使用されるような「キャプチャプローブ」または「キャプチャプローブモジュール」は、互換的に使用され、キャプチャプローブ配列及びテール配列を含むポリヌクレオチドを指す。特定の実施形態では、キャプチャプローブモジュール配列またはその一部は、1つ以上のシーケンシングプライマーのためのプライマー結合部位として働く。
特定の実施形態では、キャプチャプローブモジュールはキャプチャプローブを含む。本明細書で使用する「キャプチャプローブ」とは、特異的なDNA標的領域とハイブリダイズすることができる領域を指す。いくつかのの実施形態において、キャプチャプローブは、細胞DNAから構築されるゲノムDNAライブラリによって使用される。特定の実施形態において、キャプチャプローブは、cfDNAから構築されるゲノムDNAライブラリによって使用される。cfDNAの平均サイズが約150から約170bpであり、また高度に断片化されるため、ある一定の実施形態は、対象となるDNA標的領域を調べるための高密度及び比較的短いキャプチャプローブの使用を含む本明細書で企図される組成物及び方法を対象とする。いくつかの実施形態において、キャプチャプローブは、すべての染色体セグメントにわたり均一な密度で分布する、DNA標的領域にハイブリダイズすることが可能である。1セットのこれらのようなキャプチャプローブは、本明細書において「染色体安定性プローブ」と称される。染色体コピー数(たとえば、染色体倍数性)のゲノムワイド測定を提供するために、これらの染色体安定性プローブを使用して、コピー数多型をゲノムワイドスケール上で調べる。
高密度キャプチャプローブの使用に関する特定の懸念の1つは、概して、キャプチャプローブが特異的な「配列規則」を用いて設計されていることである。たとえば、冗長配列の領域、または極端に塩基組成物に偏る領域は、キャプチャプローブを設計する際に一般的に排除される。しかし、発明者らは、キャプチャプローブの設計規則が柔軟性に欠けることで、プローブの性能に対する実質的影響が生じるわけではないことを発見した。対照的に、位置的な制約により厳密に選ばれたキャプチャプローブは、標的上の配列情報を提供し、標的外のマッピング不可能なリードキャプチャはごくわずかしか示さず、少数の例外を除いて均一で有用で標的上にリードをもたらす。その上、近接したプローブ間隔での高冗長性は、時として低性能となるキャプチャプローブを補って余りあるものである。
特定の実施形態では、1つの標的領域を複数のキャプチャプローブが標的とし、任意の2つ以上のキャプチャプローブは、当該標的領域に対し、互いの10ヌクレオチド以内、互いの15ヌクレオチド以内、互いの20ヌクレオチド以内、互いの25ヌクレオチド以内、互いの30ヌクレオチド以内、互いの35ヌクレオチド以内、互いの40ヌクレオチド以内、互いの45ヌクレオチド以内、若しくは互いの50ヌクレオチド以内、またはそれより多いヌクレオチド以内、さらにこれらの間にある全てのヌクレオチド長で結合するように設計される。
一実施形態では、キャプチャプローブは、約25ヌクレオチド、約26ヌクレオチド、約27ヌクレオチド、約28ヌクレオチド、約29ヌクレオチド、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチド、約40ヌクレオチド、約41ヌクレオチド、約42ヌクレオチド、約43ヌクレオチド、約44ヌクレオチド、または約45ヌクレオチドである。
一実施形態では、キャプチャプローブは、約100ヌクレオチド、約200ヌクレオチド、約300ヌクレオチド、約400ヌクレオチド、または約100ヌクレオチドである。別の実施形態では、キャプチャプローブは、約100ヌクレオチド〜約500ヌクレオチド、約200ヌクレオチド〜約500ヌクレオチド、約300ヌクレオチド〜約500ヌクレオチド、若しくは約400ヌクレオチド〜約500ヌクレオチド、またはこれらの間にある任意の範囲である。
特定の実施形態では、キャプチャプローブは60ヌクレオチドである。別の実施形態では、キャプチャプローブは、実質的に60ヌクレオチドより小さいが、同じDNA標的領域を標的とする60ヌクレオチドのキャプチャプローブと同等に、同様に、またはより良好にハイブリダイズする。あるいくつかの実施形態では、キャプチャプローブは40ヌクレオチドである。
あるいくつかの実施形態では、キャプチャプローブモジュールはテール配列を含む。本明細書で使用する「テール配列」という用語は、キャプチャプローブモジュールの5’末端におけるポリヌクレオチドを指し、これは特定の実施形態においてプライマー結合部位として働き得る。特定の実施形態では、シーケンシングプライマーは、テール領域内のプライマー結合部位に結合する。
特定の実施形態では、テール配列は、約5〜約100ヌクレオチド、約10〜約100ヌクレオチド、約5〜約75ヌクレオチド、約5〜約50ヌクレオチド、約5〜約25ヌクレオチド、または約5〜約20ヌクレオチドである。あるいくつかの実施形態では、第3の領域は、約10〜約50ヌクレオチド、約15〜約40ヌクレオチド、約20〜約30ヌクレオチド、若しくは約20ヌクレオチド、または間にある任意の数のヌクレオチドである。
特定の実施形態では、テール配列は、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチド、または約40ヌクレオチドである。
様々な実施形態では、キャプチャプローブモジュールは、キャプチャプローブとハイブリダイズするタグ付き及び/または増幅したゲノムDNAライブラリ(たとえば、細胞またはcfDNAライブラリ)における1つ以上のキャプチャした断片の単離及び/または精製を可能にする、特定のメンバーの結合対を含む。特定の実施形態では、キャプチャプローブモジュールは、ビオチンまたは他の好適なハプテン(例えば、ジニトロフェノール、ジゴキシゲニン)に共役する。
様々な実施形態では、キャプチャプローブモジュールを、タグ付きの、任意選択により増幅したDNAライブラリとハイブリダイズして、複合体を形成する。一部の実施形態では、多機能のキャプチャプローブモジュールは、DNAライブラリにおける特異的なゲノム標的領域と実質的にハイブリダイズする。
ハイブリダイゼーションまたはハイブリダイズ条件には、2つのヌクレオチド配列が安定した複合体を形成する(例えば、タグ付きDNAライブラリ及びキャプチャプローブモジュールが安定したタグ付きDNAライブラリ−キャプチャプローブモジュール複合体を形成する)任意の反応条件が含まれ得る。これらのような反応条件は、当技術分野において周知であり、当業者であれば、これらのような条件は、例えばアニーリング温度を低くし、長さの短いキャプチャプローブを用いるというように、必要に応じて、かつ本発明の範囲内で改変することができることを理解することになる。キャプチャプローブ複合体の第2の領域が、タグ付きDNAライブラリの領域に対し、100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、85%、80%、75%、または70%の配列一致度、相同性、または相補性を示す場合、実質的なハイブリダイゼーションが起こり得る。
特定の実施形態では、キャプチャプローブは約40ヌクレオチドであり、約44℃〜約47℃の最適アニーリング温度を有する。
あるいくつかの実施形態では、本明細書で企図する方法は、タグ付きcfDNAライブラリ−キャプチャプローブモジュール複合体を単離することを含む。特定の実施形態では、DNA複合体を単離する方法は当業者に周知であり、当業者が適切とみなす任意の方法を本発明の方法で用いることができる(Ausubel et al.,Current Protocols in Molecular Biology,2007−2012)。特定の実施形態では、ビオチン−ストレプトアビジン単離技術を用いて複合体を単離する。
特定の実施形態では、単離したタグ付きDNAライブラリ断片−キャプチャプローブモジュール複合体からの1本鎖の3’末端除去を企図している。あるいくつかの実施形態では、当該方法は、1本鎖の3’末端を除去するための、単離したタグ付きDNAライブラリ−多機能キャプチャプローブモジュール複合体の3’−5’エキソヌクレアーゼ酵素処理を含む。
あるいくつかの他の実施形態では、当該方法は、単離したタグ付きDNAライブラリ断片を鋳型として利用して多機能キャプチャプローブの5’−3’DNAポリメラーゼ伸長を実施することを含む。
ある一定の他の実施形態において、これらの方法は、5’FLAPエンドヌクレアーゼ、DNA重合、及びDNAリガーゼによるニック閉鎖の協調作用を通じて、ハイブリッドキャプチャプローブ−単離したタグ付きDNA標的分子、たとえば、タグ付きcfDNA標的分子またはタグ付き細胞DNA標的分子などを創出することを含む。
単離したタグ付きDNAライブラリ−多機能キャプチャプローブモジュール複合体の3’−5’エキソヌクレアーゼ酵素処理用に様々な酵素を用いることができる。3’−5’エキソヌクレアーゼ酵素活性を示し、特定の実施形態で使用することができる好適な酵素の例示的例は、限定するものではないが、T4またはエキソヌクレアーゼI、III、Vを含む(Shevelev IV,Hubscher U.,Nat Rev Mol Cell Biol.3(5):364−76(2002)も参照)。特定の実施形態において、3’−5’エキソヌクレアーゼ活性を備える酵素は、T4ポリメラーゼである。特定の実施形態では、3’−5’エキソヌクレアーゼ酵素活性を示し、プライマー鋳型伸長が可能な酵素を使用することができ、これには、例えばT4またはエキソヌクレアーゼI、III、V(同上)が含まれる。
一部の実施形態では、本明細書で企図する方法は、上記または本明細書の他の箇所で論じられている3’−5’エキソヌクレアーゼ酵素処理をした複合体に、シーケンシング及び/またはPCRを実施することを含む。特定の実施形態では、ハイブリッド核酸分子を生成するために、キャプチャプローブ分子のテール部分をコピーする。一実施形態では、生成したハイブリッド核酸分子は、キャプチャプローブモジュールへハイブリダイズ可能な標的領域と、キャプチャプローブモジュールテール配列の相補配列とを含む。
特定の実施形態では、遺伝子解析は、a)1個以上のキャプチャプローブモジュールを複数のゲノムDNAライブラリクローン中の1個以上の標的遺伝子座にハイブリダイズして、1個以上のキャプチャプローブモジュール−DNAライブラリクローン複合体を形成すること;b)a)からの1個以上のキャプチャプローブモジュール−DNAライブラリクローン複合体を単離すること;c)ステップb)からの1個以上の単離したキャプチャプローブモジュール−DNAライブラリクローン複合体を酵素処理すること;d)c)からの酵素処理した複合体にPCRを実施することであって、増幅したハイブリッド核酸分子を生成するためにキャプチャプローブ分子のテール部分をコピーし、増幅したハイブリッド核酸分子がキャプチャプローブにハイブリダイズ可能な標的ゲノム遺伝子座位内の標的配列と、キャプチャプローブモジュールテール配列の相補配列とを含む、実施すること;及びe)d)からの増幅したハイブリッド核酸分子上に定量的遺伝子解析を実施すること、を含む。
特定の実施形態では、特異的な標的遺伝子座のコピー数を決定する方法が企図され、この方法は、a)1個以上のキャプチャプローブモジュールを複数のDNAライブラリクローンにおける1個以上の標的遺伝子座にハイブリダイズして、1個以上のキャプチャプローブモジュール−DNAライブラリクローン複合体を形成すること;b)a)から1個以上のキャプチャプローブモジュール−DNAライブラリクローン複合体を単離すること;c)ステップb)からの1個以上の単離したキャプチャプローブモジュール−DNAライブラリクローン複合体を酵素処理すること;d)c)からの酵素処理した複合体上にPCRを実施することであって、増幅したハイブリッド核酸分子を生成するためにキャプチャプローブ分子のテール部分をコピーし、増幅したハイブリッド核酸分子がキャプチャプローブにハイブリダイズ可能な標的遺伝子座内の標的配列と、キャプチャプローブモジュールテール配列の相補配列とを含む、実施すること;e)d)における増幅したハイブリッド核酸分子のPCR増幅を実施すること;及びf)e)におけるPCR反応を定量化することであって、この定量化によって、特異的な標的領域のコピー数を決定することができる、定量化することを備える。
一実施形態では、ステップc)の酵素処理は、3’−5’エキソヌクレアーゼ活性を有する酵素を用いて、b)からの1個以上のキャプチャプローブモジュール−DNAライブラリクローン複合体上に3’−5’エキソヌクレアーゼ酵素処理を実施して1本鎖の3’末端を除去すること;5’FLAPエンドヌクレアーゼ、DNA重合、及びDNAリガーゼによるニック閉鎖の協調作用を通じて、1個以上のハイブリッドキャプチャプローブ−cfDNAライブラリクローン分子を創出すること;または、複合体内の単離したDNAクローンを鋳型として用いてキャプチャプローブの5’−3’DNAポリメラーゼ伸長を実施すること、を含む。
一実施形態では、ステップc)の酵素処理は、複合体内の単離したDNAクローンを鋳型として用いてキャプチャプローブの5’−3’DNAポリメラーゼ伸長を実施することを含む。
特定の実施形態では、当業者に周知である任意の標準的なPCR反応条件を用いてPCRを実施することができる。ある一定の実施形態において、e)におけるPCR反応は、2個のPCRプライマーを用いる。一実施形態では、e)におけるPCR反応は、標的遺伝子座内の反復にハイブリダイズする第1のPCRプライマーを用いる。特定の実施形態では、e)におけるPCR反応は、標的遺伝子座/テール接合部におけるハイブリッド核酸分子にハイブリダイズする第2のPCRプライマーを用いる。あるいくつかの実施形態では、e)におけるPCR反応は、標的遺伝子座にハイブリダイズする第1のPCRプライマーを用い、第2のPCRプライマーは、標的遺伝子座/テール接合部における増幅したハイブリッド核酸分子にハイブリダイズする。特定の実施形態では、プライマーの少なくとも1個以上のヌクレオチドは標的遺伝子座にハイブリダイズし、プライマーの少なくとも1個以上のヌクレオチドはテール配列にハイブリダイズするように、第2のプライマーは、標的遺伝子座/テール接合部にハイブリダイズする。
あるいくつかの実施形態では、ステップe)から取得する増幅したハイブリッド核酸分子を配列決定し、配列を水平方向にアライメントを取る。すなわち、参照配列に対してではなく、互いに対しアライメントを取る。特定の実施形態では、a)からe)のステップを1個以上のキャプチャプローブモジュールで1回以上反復する。キャプチャプローブモジュールは、同じであっても異なっていてもよく、標的遺伝子座のいずれかのcfDNA鎖を標的にするように設計され得る。一部の実施形態では、キャプチャプローブが異なる場合、これらのキャプチャプローブは、タグ付きcfDNAクローンライブラリにおける標的遺伝子座内のオーバーラップまたは隣接する標的配列にハイブリダイズする。一実施形態では、高密度キャプチャプローブ計画を使用し、この計画で複数のキャプチャプローブは、標的遺伝子座にハイブリダイズし、複数のキャプチャプローブのそれぞれは、タグ付きDNAクローンライブラリ中の標的遺伝子座にハイブリダイズする任意の他のキャプチャプローブから約5、10、15、20、25、30、35、40、45、50、100、200bp以上(間にある全ての距離を含む)内の標的遺伝子座にハイブリダイズする。
一部の実施形態において、この方法は、標的遺伝子座ごとに2個のキャプチャプローブモジュールを用いて実施されることができ、この一方が標的領域の上流にある「ワトソン」鎖(非コード鎖または鋳型鎖)にハイブリダイズし、一方が標的領域の下流にある「クリック」鎖(コード鎖または非鋳型鎖)にハイブリダイズする。
特定の実施形態では、本明細書で企図する方法は、標的遺伝子座ごとに、任意の組合せでワトソン鎖またはクリック鎖にハイブリダイズする任意の数のキャプチャプローブモジュール、例えば、2、3、4、5、6、7、8、9、または10、またはそれ以上のキャプチャプローブモジュールを用いて、さらに複数回実施することができる。一部の実施形態では、取得した配列は、複数の相違のいずれかを識別するために相互にアライメントを取ることができる。
あるいくつかの実施形態では、複数の標的遺伝子座を、1つ以上のキャプチャプローブモジュールを用いた1回の反応で、例えば、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、10000、50000、100000、500000またはそれ以上調べる。
(b)シーケンシング
特定の実施形態では、定量的遺伝子解析は、本明細書の上記の他の箇所で論じているように複数のハイブリッド核酸分子を配列決定して、複数のユニークシーケンシングリードを取得するのに十分なシーケンシング深度を生成することを含む。用語「ユニークリード」または「ユニークゲノム配列」(UGS)は、本明細書に互換的に使用され、個々の冗長リードを合わせて「ファミリー」にグループ化することによって識別される。これらの冗長リードは、個々のUMIEを共有する(たとえば、同一リードコード、及び同一DNA配列の開始位置をゲノム配列内で共有する)配列リードであり、単一の付着事象に由来するため、増幅由来の互いの「同胞」である。冗長リードのファミリーを代表する単一のコンセンサスをユニークリードまたはUGSとして進める。それぞれのユニークリードまたはUGSは、ユニーク付着事象とみなされる。特定のキャプチャプローブに対応するユニークリードの合計は、その特定のキャプチャプローブについての「生のゲノム深度」(RGD)と称される。各キャプチャプローブは、ファミリーにグループ化することにより全リードから計算的に抽出される1セットのユニークリードをもたらす。次に所与の試料についてのユニークリード(たとえば、試料についての生のゲノム深度)を、プローブごとに観察される全てのユニークリードの平均値として計算する。ユニークリードは、それぞれがユニークゲノムDNAクローンから導き出されなければならないため、重要である。それぞれのユニークリードは、一倍体当量のゲノムDNAのインプット及び解析を表す。ユニークリードの和は、解析した一倍体ゲノムの和である。そして解析したゲノムの数は、シーケンシングアッセイの感度を定義する。非限定的な例として、ユニークリードの平均カウントが100ゲノム当量である場合、この特定のアッセイは100のうちの1つの変異リード、すなわち1%を検出することができる感度を有する。これを下回るいかなる観察も正当ではない。
明らかなコピー数の変化(たとえば、ノイズの多いプローブの例)がある場合は、試料平均値の計算に使用するデータセットから除外する。本明細書において、「ノイズの多いプローブ」は、大規模な1セットの同一の試料中のユニークリードの非常にばらつきのある数(たとえば、12から16個の試料複製物中のユニークリードの非常にばらつきのある数)をキャプチャするプローブを指す。いくつかの実施形態において、ノイズの多いプローブと関連するユニークリード数は、50%以上までの試料についてのユニークリードの平均数と比較して増加する。いくつかの実施形態において、ノイズの多いプローブと関連するユニークリード数は、50%以上までの試料についてのユニークリードの平均数と比較して減少する。いくつかの実施形態において、特定の解析において使用される、約2%から約4%のプローブをノイズの多いプローブとして識別し、計算から除外し、所与の試料についてユニークリードの平均数を決定する。
いくつかの実施形態において、シーケンシングリードを「標的上リード」または「標的外リード」のいずれか一方として識別する。標的上リードは、ゲノムライブラリを作製するために使用されるキャプチャプローブの近くにマッピングするゲノムDNA配列を含む。いくつかの実施形態において、各ゲノム配列を特異的なキャプチャプローブへ物理的に結合し、ゲノムセグメント及びキャプチャプローブの両方の配列を統合情報として決定し、開始座標が対応するキャプチャプローブの3’末端の400bp内に、またより一般的に200bp内に、マッピングされるいずれかのゲノム配列として標的上リードを定義する。キャプチャプローブに関して、≧500の塩基対の位置に基準ゲノムにアライメントを取るゲノム配列を含む(及び完全に異なる染色体にマッピングすることがさらに多い)ものとして標的外リードを定義する。
特定の実施形態では、定量的遺伝子解析は複数の試料に由来するハイブリッド核酸分子の多重シーケンシングを含む。
様々な実施形態では、定量的遺伝子解析は、それぞれが第1のDNA配列及び第2のDNA配列を含む、1つ以上または複数のタグ付きDNAライブラリのクローンを取得することであって、第1のDNA配列が標的とする遺伝子座内に配列を含み、第2のDNA配列がキャプチャプローブ配列を含む、取得すること;1つ以上のクローンに対し、対合した末端のシーケンシング反応を実施し1つ以上のシーケンシングリードを取得すること、または、1つ以上のクローンに対し、約100、200、300、400、500またはそれ以上のヌクレオチドを上回る単一の長いシーケンシングリードを取得するシーケンシング反応を実施することであって、リードが第1のDNA配列及び第2のDNA配列の両方を識別するのに十分である、実施すること;ならびに、1つ以上のクローンのシーケンシングリードをシーケンシングリードのプローブ配列に従って順序付けまたはクラスター化すること、を含む。
(c)バイオインフォマティクス解析
様々な実施形態では、定量的遺伝子解析は、シーケンシングリードのバイオインフォマティクス解析を含む。バイオインフォマティクス解析により、シーケンシングのための組成物または方法が不在の場合に実施されるいかなる純粋な精神的解析も除外される。あるいくつかの実施形態では、バイオインフォマティクス解析には、以下に限定するものではないが、配列アライメント、ゲノム当量解析、一塩基多様体(SNV)解析、遺伝子コピー数多型(CNV)解析、染色体コピー数の測定、及び遺伝子損傷の検出が含まれる。特定の実施形態では、バイオインフォマティクス解析は、cfDNAクローンライブラリにおいて解析するゲノム当量数の定量化、標的遺伝子座の遺伝子状態の検出、標的遺伝子座における遺伝子損傷の検出、及び標的遺伝子座内のコピー数変動の測定に有用である。
配列アライメントは、配列リードと1つ以上のヒト参照DNA配列との間で実施されることができる。特定の実施形態では、シーケンシングアライメントは、標的遺伝子座における遺伝子損傷の検出に使用することができ、遺伝子損傷の検出には、以下に限定するものではないが、ヌクレオチドのトランジション若しくはトランスバージョン、ヌクレオチドの挿入若しくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合の検出が含まれる。原因または予後の指標である遺伝子損傷の検出は、特定の遺伝子の状態または疾患の診断、予後判定、処置、及び/または監視に有用であり得る。
本明細書には、参照配列に対するアライメントの必要なしに実施されることができる配列アライメント解析の方法も企図されており、本明細書ではこの方法を水平配列解析と呼ぶ。このような解析は、本明細書で企図する方法または他の任意の方法によって生成した任意の配列に対し実施されることができる。特定の実施形態では、この配列解析は、本明細書で企図する方法によって取得したリードに対し、配列アライメントを実施することを含む。
一実施形態では、cfDNAクローンライブラリにおけるゲノム当量は、シーケンシングの実施後にバイオインフォマティクスに基づくカウントを用いて決定される。各シーケンシングリードは、特定のキャプチャプローブと関連し、各キャプチャプローブに割り当てられたリードの集合体は、群にパースされる。群内において、個々のリードのセットは、ゲノム配列内で同じリードコード、及び同じDNA配列の開始位置を共有する。これらの個々のリードは、「ファミリー」にグループ化され、このファミリーを代表する単一のコンセンサスは、「ユニークリード」として進められる。ファミリーを構成した個々のリードのすべては、単一の付着事象に由来するため、これらは、互いに増幅由来の「同胞」である。それぞれのユニークリードは、ユニーク付着事象とみなされ、ユニークリードの和は、解析されるゲノム当量数に相当するとみなされる。
ユニーククローンの数が、可能な配列組合せの総数に近づくにつれ、確率は、独立した事象により同じコード及び開始部位が創出されること、またこれらの独立した事象が不適切な形で1つのファミリーにグループ化されることを示す。最終結果は、解析ゲノム当量より少ない見積もりとなり、希少な変異リードは、同じ識別子を有する野生型リードと重複するという理由からシーケンシングエラーとして廃棄される場合がある。
特定の実施形態では、cfDNAクローンライブラリの正確な解析を提供するため、解析ゲノム当量数は、可能なユニーククローン数の約1/10、約1/12、約1/14、約1/16、約1/18、約1/20、約1/25またはそれ以下である。上記で概説されている手順が例示的なものに過ぎず、非限定的であることを理解されたい。
一部の実施形態では、解析するゲノム当量数を増加させる必要があり得る。ゲノム当量の深度を拡大するため、少なくとも2つの解決策が企図されている。第1の解決策は、試料ごとに2つ以上のアダプタセットを使用することである。アダプタを組み合わせることにより、可能なクローンの総数を乗法的に拡大し、そのためゲノムインプットの無理のない限界を拡大することが可能である。第2の解決策は、リードコードを1つ、2つ、3つ、4つ、若しくは5つ、またはそれ以上の塩基の分拡大することである。他の全てのリードコードから少なくとも2塩基の分異なる可能なリードコードの数は、4(n−1)のスケールであり、式中、nはリードコード内の塩基の数である。したがって、非限定的な例において、リードコードが5ヌクレオチドであれば4(5−1)=256であるから、追加的な塩基を含めることで、利用可能なレパートリーは追加塩基1つにつき4倍拡大する。
一実施形態では、定量的遺伝子解析は、希少な一塩基多様体(SNV)を識別するための、シーケンシングリードのバイオインフォマティクス解析を含む。
次世代シーケンシングは、大まかに0.02から0.02%の固有のエラー率を有し、これは1/200から1/500のいずれかの塩基呼び出しが不正確であることを意味する。これより低い頻度(例えば、1000配列当たり1の頻度)で発生する変異体及び他の突然変異を検出するため、分子アノテーション計画を発動する必要がある。非限定的な例として、標的配列キャプチャ技術を用いて5000個のユニーク分子を解析すれば、>50,000リードの十分なシーケンシング深度で、5000ユニークリードの集合(各ユニークリードは、いずれもが同じリードコードを所持しているリードの「ファミリー」に属する)が生成されることになる。ファミリー内で発生するSNVは、希少変異体としての候補である。この同じ変異体が2つ以上のファミリーで観察される場合、開始試料内に存在する希少変異体としての非常に有力な候補となる。これに対し、複数ファミリー内で散発的に生じる変異体は、シーケンシングエラーである可能性があり、1つ及び1つのみのファミリー内で生じる変異体は、希少であるかまたは生体外で生じる塩基変更(例えば、DNA塩基の酸化またはPCRにより導入されたエラー)の結果である。
一実施形態では、SNVを検出する方法は、アッセイにおける所望の標的感度の10倍以上のゲノムインプット(ゲノムまたはゲノム当量)を導入することを含む。非限定的な一例では、所望の感度が2%(100のうち2)である場合、実験的標的は2000ゲノムのインプットである。
特定の実施形態では、シーケンシングデータのバイオインフォマティクス解析は、遺伝子の様相、状態または疾患、遺伝子モザイク、胎児検査、父子鑑定、薬物治療に対する応答の予測、医学的状態の診断または監視、マイクロバイオームプロファイリング、病原体スクリーニング、及び臓器移植の監視に関連するSNVの検出または識別に使用される。
様々な実施形態では、コピー数決定解析の方法であって、それぞれが第1のDNA配列及び第2のDNA配列を含む、1つ以上または複数のクローンを取得することを含み、第1のDNA配列が標的とする遺伝子座内に配列を含み、第2のDNA配列がキャプチャプローブ配列を含む、方法が提供される。関係する実施形態では、1つ以上のクローンに対し、対合した末端のシーケンシング反応を実施し、1つ以上のシーケンシングリードを取得する。別の実施形態では、1個以上のクローン上でシーケンシング反応を実施し、約100個を上回るヌクレオチドの単一の長いシーケンシングリードを取得し、このリードは、第一DNA配列及び第二DNA配列の両方を識別するのに十分である。1つ以上のクローンのシーケンシングリードは、シーケンシングリードのプローブ配列に従って順序付けまたはクラスター化することができる。
コピー数解析には、以下に限定するものではないが、所与のゲノムDNA試料で生じる特定の遺伝子または突然変異のコピー数を調べる解析が含まれ、またさらに、所与の遺伝子のコピー数、または所与の試料中の配列相違数の定量的決定も含まれ得る。特定の実施形態では、コピー数解析は、遺伝子の様相、状態または疾患、胎児検査、遺伝子モザイク、父子鑑定、薬物治療に対する応答の予測、医学的状態の診断または監視、マイクロバイオームプロファイリング、病原体スクリーニング、及び臓器移植の監視に関連する遺伝子増幅の検出または識別に使用される。
いくつかの実施形態において、コピー数解析を使用して、染色体不安定性を測定する。これらのような実施形態において、染色体安定性プローブを含むキャプチャプローブセットを使用して、コピー数多型をすべての染色体セットにわたり均一な密度で決定する。コピー数解析を各染色体安定性プローブについて実施し、その後、染色体安定性プローブをそれらの染色体標的に従い順序付けする。これは、ゲノムにわたるコピー数減少または増加の視覚化を可能にし、染色体安定性の測定として機能することが可能である。
特定の実施形態では、シーケンシングデータのバイオインフォマティクス解析は、標的遺伝子座における1個以上の配列または遺伝子損傷の検出または識別に使用されることができ、これらの検出または識別には、以下に限定するものではないが、ヌクレオチドのトランジション若しくはトランスバージョン、ヌクレオチドの挿入若しくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合の検出が含まれる。原因または予後の指標である遺伝子損傷の検出は、特定の遺伝子の状態または疾患の診断、予後判定、処置、及び/または監視に有用であり得る。一実施形態では、遺伝子損傷は、遺伝子の様相、状態または疾患、胎児検査、遺伝子モザイク、父子鑑定、薬物治療に対する応答の予測、医学的状態の診断または監視、マイクロバイオームプロファイリング、病原体スクリーニング、及び臓器移植の監視に関連する。
D.定量的CNLアッセイの臨床応用
様々な実施形態では、本発明は、関心領域における、変異性変化、SNP、転座、逆位、欠失、コピー数における変化、または他の遺伝的変異を検出することによって、被験体における状態または疾患を検出する、識別する、予測する、診断する、または監視する方法を企図する。
E.定量的遺伝子解析の臨床応用
様々な実施形態では、本発明は、被験体における状態または疾患を検出、識別、予測、診断、または監視する方法を企図している。
特定の実施形態では、被験体における遺伝子の様相、状態、または疾患を検出、識別、予測、診断、または監視する方法は、DNAクローンライブラリにおける1つ以上の標的遺伝子座の定量的遺伝子解析を実施して、1つ以上の標的遺伝子座での配列における変化を検出する、または識別することを含む。いくつかの実施形態において、この変化は、コピー数における変化である。
1つの実施形態において、遺伝子状態、条件または疾患を検出する、識別する、予測する、診断する、または監視する方法は、細胞DNAまたはcfDNAを被験体の生体試料から単離する、または取得すること、細胞DNAまたはcfDNAを1個以上の末端修復酵素によって処置し、末端修復DNAを生成すること、1個以上のアダプタを末端修復DNAの各末端に付着させて、ゲノムDNAライブラリを生成すること、DNAライブラリを増幅して、DNAクローンライブラリを生成すること、DNAクローンライブラリ中の遺伝子当量数を決定すること、及び1個以上の標的遺伝子座の定量的遺伝子解析をDNAクローンライブラリ中で実施して、1つ以上の標的遺伝子座の、配列における変化、たとえば、SNP、転座、逆位、欠失、またはコピー数における変化などを検出する、または識別することを備える。
特定の実施形態において、遺伝性疾患、遺伝子モザイク現象、胎児検査、父子鑑定、薬物治療に対する応答の予測、医学的状態の診断または監視、マイクロバイオームプロファイリング、病原体スクリーニング、及び臓器移植の監視からなる群から選択される、遺伝子様相、または遺伝子の状態若しくは疾患を検出、識別、予測、診断、または監視する方法は、ゲノムDNAを被験体の生体試料から単離する、または取得すること、DNAを1個以上の末端修復酵素によって処置して、末端修復DNAを生成すること、1個以上のアダプタを末端修復DNAの各末端に付着させて、ゲノムDNAライブラリを生成すること、ゲノムDNAライブラリを増幅して、DNAクローンライブラリを生成すること、ゲノム当量数をDNAクローンライブラリ中で決定すること、及び1個以上の標的遺伝子座の定量的遺伝子解析をDNAクローンライブラリ中で実施して、1個以上の標的遺伝子座で配列におけるヌクレオチドのトランジション若しくはトランスバージョン、ヌクレオチドの挿入若しくは欠失、ゲノム再編成、コピー数における変化、または遺伝子融合を検出する、または識別することを備える。
本明細書に企図される組成物及び方法によって検出される、識別される、予測される、診断される、または監視されることが可能である遺伝性疾患の例示的な例は、アルツハイマー病(APOE1)、シャルコー・マリー・トゥース病、レーベル遺伝性視神経症(LHON)、アンジェルマン症候群(UBE3A、ユビキチン−タンパク質リガーゼE3A)、プラダー・ウィリー症候群(染色体15中の領域)、βサラセミア(HBB、β−グロビン)、ゴーシェ病(1型)(GBA、グルコセレブロシダーゼ)、嚢胞性線維症(CFTR、上皮クロライドチャネル)、鎌状赤血球症(HBB、β−グロビン)、テイ・サックス病(HEXA、ヘキソサミニダーゼA)、フェニルケトン尿症(PAH、フェニルアラニンヒドロリアーゼ)、家族性高コレステロール血症(LDLR、低密度リポタンパク質受容体)、成人型嚢胞腎(PKD1、ポリシスチン)、ハンチントン病(HDD、ハンチンチン)、神経線維腫症I型(NF1、NF1腫瘍抑制遺伝子)、筋緊張性ジストロフィー(DM、ミオトニン)、結節性硬化症(TSC1、ツベリン)、軟骨形成不全(FGFR3、線維芽細胞増殖因子受容体)、脆弱X染色体症候群(FMR1、RNA結合タンパク質)、デュシェンヌ型筋ジストロフィー(DMD、ジストロフィン)、血友病A(F8C、血液凝固第VIII因子)、レッシュ・ナイハン症候群(HPRT1、ヒポキサンチングアニンリボシルトランスフェラーゼ1)、及び副腎白質ジストロフィー(ABCD1)を有するが、これらに限定されない。
本明細書で企図される組成物及び方法によって検出される、識別される、予測される、診断される、または監視されることが可能である癌の例示的な例は、B細胞癌、例えば、多発性骨髄腫、黒色腫、乳癌、肺癌(非小細胞肺癌腫またはNSCLCなど)、気管支癌、結腸直腸癌、前立腺癌、膵臓癌、胃癌(stomach cancer)、卵巣癌、膀胱癌、脳または中枢神経系癌、末梢神経系癌、食道癌、子宮頸癌、子宮または子宮内膜癌、口腔または咽頭の癌、肝臓癌、腎臓癌、精巣癌、胆道癌、小腸または虫垂癌、唾液腺癌、甲状腺癌(thyroid gland cancer)、副腎癌、骨肉腫、軟骨肉腫、血液組織の癌、腺癌腫、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸癌、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ球性白血病(ALL)、急性骨髄球性白血病(AML)、慢性骨髄球性白血病(CML)、慢性リンパ球性白血病(CLL)、真性赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫(endotheliosarcoma)、リンパ管肉腫、リンパ管内皮肉腫(lymphangioendotheliosarcoma)、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮細胞癌腫、基底細胞癌腫、腺癌腫、汗腺癌腫、脂腺癌腫、乳頭癌腫、乳頭腺癌腫、髄様癌腫、気管支癌腫、腎細胞癌腫、肝細胞癌、胆管癌腫、絨毛癌腫、セミノーマ、胎生期癌腫、ウィルムス腫瘍、膀胱癌腫、上皮癌腫、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起神経膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞癌腫、甲状腺癌(thyroid cancer)、胃癌(gastric cancer)、頭頸部癌、小細胞癌、本態性血小板血症、特発性骨髄化生、好酸球増加症候群、全身性肥満細胞症、一般的な過好酸球増加症、慢性好酸球性白血病、神経内分泌癌、カルチノイド腫瘍などを含むが、これらに限定されない。
1つの実施形態において、遺伝子損傷は、Cosmicデータベースで注釈がつけられた損傷(損傷及び配列データはオンラインで利用可能であり、CosmicウェブサイトのCancer Gene Census sectionからダウンロードされることが可能である)、またはCancer Genome Atlasで注釈がつけられた損傷(損傷及び配列データはオンラインで利用可能であり、Cancer Genome Atlasウェブサイトからダウンロードされることが可能である)である。
本明細書で企図する組成物及び方法により検出、識別、予測、診断、または監視することができるがんに関連する1つ以上の遺伝子損傷を有する遺伝子の例示的な例としては、以下に限定するものではないが、ABCB1、ABCC2、ABCC4、ABCG2、ABL1、ABL2、AKT1、AKT2、AKT3、ALDH4A1、ALK、APC、AR、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA、AURKB、BCL2、BCL2A1、BCL2L1、BCL2L2、BCL6、BRAF、BRCA1、BRCA2、Clorf144、CARD11、CBL、CCND1、CCND2、CCND3、CCNE1、CDH1、CDH2、CDH20、CDH5、CDK4、CDK6、CDK8、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHEK1、CHEK2、CRKL、CRLF2、CTNNB1、CYP1B1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DNMT3A、DOT1L、DPYD、EGFR、EPHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、EPHB6、EPHX1、ERBB2、ERBB3、ERBB4、ERCC2、ERG、ESR1、ESR2、ETV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW7、FCGR3A、FGFR1、FGFR2、FGFR3、FGFR4、FLT1、FLT3、FLT4、FOXP4、GATA1、GNA11、GNAQ、GNAS、GPR124、GSTP1、GUCY1A2、HOXA3、HRAS、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2、ITPA、JAK1、JAK2、JAK3、JUN、KDR、KIT、KRAS、LRP1B、LRP2、LTK、MAN1B1、MAP2K1、MAP2K2、MAP2K4、MCL1、MDM2、MDM4、MEN1、MET、MITF、MLH1、MLL、MPL、MRE11A、MSH2、MSH6、MTHFR、MTOR、MUTYH、MYC、MYCL1、MYCN、NF1、NF2、NKX2−1、NOTCH1、NPM1、NQO1、NRAS、NRP2、NTRK1、NTRK3、PAK3、PAX5、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PKHD1、PLCG1、PRKDC、PTCH1、PTEN、PTPN11、PTPRD、RAF1、RARA、RB1、RET、RICTOR、RPTOR、RUNX1、SLC19A1、SLC22A2、SLCO1B3、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMO、SOD2、SOX10、SOX2、SRC、STK11、SULT1A1、TBX22、TET2、TGFBR2、TMPRSS2、TNFRSF14、TOP1、TP53、TPMT、TSC1、TSC2、TYMS、UGT1A1、UMPS、USP9X、VHL、及びWT1が挙げられる。
特定の実施形態では、遺伝子損傷は、ヌクレオチドのトランジション若しくはトランスバージョン、ヌクレオチドの挿入若しくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。
一実施形態では、遺伝子損傷は、ALK遺伝子の3’コード領域を別の遺伝子に融合させる遺伝子融合である。
一実施形態では、遺伝子損傷は、ALK遺伝子の3’コード領域をEML4遺伝子に融合させる遺伝子融合である。
本明細書で企図される組成物及び方法によって検出される、識別される、予測される、診断される、または監視されることが可能である胎児検査に適している条件の例示的な例は、ダウン症候群(トリソミー21)、エドワード症候群(トリソミー18)、パトー症候群(トリソミー13)、クラインフェルター症候群(XXY)、トリプルX症候群、XYY症候群、トリソミー8、トリソミー16、ターナー症候群(XO)、ロバートソン転座、ディジョージ症候群、及びウォルフ・ヒルショルン症候群を含むが、これらに限定されない。
本明細書で企図される組成物及び方法によって検出される、識別される、予測される、診断される、または監視されることが可能である父子鑑定に適しているアレルの例示的な例は、D20S1082、D6S474、D12ATA63、D22S1045、D10S1248、D1S1677、D11S4463、D4S2364、D9S1122、D2S1776、D10S1425、D3S3053、D5S2500、D1S1627、D3S4529、D2S441、D17S974、D6S1017、D4S2408、D9S2157、アメロゲニン、D17S1301、D1GATA113、D18S853、D20S482、及びD14S1434のうちの16個以上を含むが、これらに限定されない。
本明細書で企図される組成物及び方法によって検出される、識別される、予測される、診断される、または監視されることが可能である薬物治療に対する応答を予測するのに適している遺伝子の例示的な例は、以下の遺伝子、ABCB1(ATP−結着カセット、サブファミリーB(MDR/TAP)、メンバー1)、ACE(酵素を変換するアンジオテンシンI)、ADH1A(アルコール脱水素酵素1A(クラスI)、アルファポリペプチド)、ADH1B(アルコール脱水素酵素1B(クラスI)、ベータポリペプチド)、ADH1C(アルコール脱水素酵素1C(クラスI)、ガンマポリペプチド)、ADRB1(アドレナリン作動性、ベータ−1−、受容体)、ADRB2(アドレナリン作動性、ベータ−2−、受容体、表面)、AHR(アリール炭化水素受容体)、ALDH1A1(アルデヒド脱水素酵素1ファミリー、メンバーA1)、ALOX5(アラキドン酸5−リポキシゲナーゼ)、BRCA1(乳癌1、早期発症型)、COMT(カテコール−O−メチルトランスフェラーゼ)、CYP2A6(チトクロムP450、ファミリー2、サブファミリーA、ポリペプチド6)、CYP2B6(チトクロムP450、ファミリー2、サブファミリーB、ポリペプチド6)、CYP2C9(チトクロムP450、ファミリー2、サブファミリーC、ポリペプチド9)、CYP2C19(チトクロムP450、ファミリー2、サブファミリーC、ポリペプチド19)、CYP2D6(チトクロムP450、ファミリー2、サブファミリーD、ポリペプチド6)、CYP2J2(チトクロムP450、ファミリー2、サブファミリーJ、ポリペプチド2)、CYP3A4(チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド4)、CYP3A5(チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド5)、DPYD(ジヒドロピリミジン脱水素酵素)、DRD2(ドーパミン受容体D2)、F5(凝固因子V)、GSTP1(グルタチオンS−トランスフェラーゼパイ)、HMGCR(3−ヒドロキシ−3−メチルグルタリル−コエンザイムA還元酵素)、KCNH2(電位依存性カリウムチャネル、サブファミリーH(eag関連の)、メンバー2)KCNJ11(内向き整流性カリウムチャネル、サブファミリーJ、メンバー11)、MTHFR(5,10−メチレンテトラヒドロ葉酸還元酵素(NADPH))、NQO1(NAD(P)H脱水素酵素、キノン1)、P2RY1(プリン受容体P2Y、G−タンパク質共役型、1)、P2RY12(プリン受容体P2Y、G−タンパク質共役型、12)、PTGIS(プロスタグランジンI2(プロスタサイクリン)シンターゼ)、SCN5A(ナトリウムチャネル、電位依存性、V型、アルファ(QT延長症候群3))、SLC19A1(溶質輸送体ファミリー19(葉酸トランスポーター)、メンバー1)、SLCO1B1(溶質輸送体有機アニオン輸送体ファミリー、メンバー1B1)、SULT1A1(スルホトランスフェラーゼファミリー、サイトゾル、1A、フェノールが好ましい、メンバー1)、TPMT(チオプリンS−メチルトランスフェラーゼ)、TYMS(チミジル酸シンターゼ)、UGT1A1(UDPグルクロノシルトランスフェラーゼ1ファミリー、ポリペプチドA1)、VDR(ビタミンD(1,25−ジヒドロキシビタミンD3)受容体)、VKORC1(ビタミンKエポキシドレダクターゼ複合体、サブユニット1)のうちの1個以上を含むが、これらに限定されない。
本明細書で企図する組成物及び方法により検出、識別、予測、診断、または監視することができる医学的状態の例示的な例としては、以下に限定するものではないが、脳卒中、一過性脳虚血発作、外傷性脳損傷、心疾患、心臓発作、アンギナ、粥状動脈硬化、及び高血圧が挙げられる。
本明細書で企図する組成物及び方法によりスクリーニングすることができる病原体の例示的な例としては、以下に限定するものではないが、細菌、真菌、及びウイルスが挙げられる。
本明細書で企図する組成物及び方法によりスクリーニングすることができる細菌種の例示的な例としては、以下に限定するものではないが、Mycobacterium種、Pneumococcus種、Escherichia種、Campylobacter種、Corynebacterium種、Clostridium種、Streptococcus種、Staphylococcus種、Pseudomonas種、Shigella種、Treponema種、またはSalmonella種が挙げられる。
本明細書で企図する組成物及び方法によりスクリーニングすることができる真菌種の例示的な例としては、以下に限定するものではないが、Aspergillis種、Blastomyces種、Candida種、Coccicioides種、Cryptococcus種、皮膚糸状菌、Tinea種、Trichophyton種、Microsporum種、Fusarium種、Histoplasma種、Mucoromycotina種、Pneumocystis種、Sporothrix種、Exserophilum種、またはCladosporium種が挙げられる。
本明細書に企図される組成物及び方法によりスクリーニングされることができるウイルスの例示的な例としては、インフルエンザA(たとえば、H1N1、H1N2、H3N2及びH5N1(鳥インフルエンザ)などの)、インフルエンザB、インフルエンザCウイルス、肝炎Aウイルス、肝炎Bウイルス、肝炎Cウイルス、肝炎Dウイルス、肝炎Eウイルス、ロタウイルス、ノーウォークウイルス群のうちのいずれかのウイルス、腸管アデノウイルス、パルボウイルス、デング熱ウイルス、サル痘、モノネガウイルス目、リッサウイルス(たとえば、狂犬病、ラゴスコウモリウイルス、モコラウイルス、ドゥベンヘイジウイルス、ヨーロッパコウモリウイルス1&2、及びオーストラリアコウモリウイルス)、エフェメロウイルス、ベジクロウイルス、水疱性口内炎ウイルス(VSV)、ヘルペスウイルス属(たとえば、単純ヘルペスウイルス1及び2型、水痘帯状発疹、サイトメガロウイルス、エプスタイン・バールウイルス(EBV)、ヒトヘルペスウイルス(HHV)、ヒトヘルペスウイルス6型及び8型)、モロニーマウス白血病ウイルス(M−MuLV)、モロニーマウス肉腫ウイルス(MoMSV)、ハーベイマウス肉腫ウイルス(HaMuSV)、マウス乳癌ウイルス(MuMTV)、テナガザル白血病ウイルス(GaLV)、ネコ白血病ウイルス(FLV)、スプーマウイルス、フレンドマウス白血病ウイルス、マウス幹細胞ウイルス(MSCV)及びラウス肉腫ウイルス(RSV)、HIV(HIV1型、及びHIV2型を含むヒト免疫不全ウイルス)、ビスナ・マエディウイルス(VMV)、ヤギ関節炎脳炎ウイルス(CAEV)、ウマ伝染性貧血ウイルス(EIAV)、ネコ免疫不全ウイルス(FIV)、ウシ免疫不全ウイルス(BIV)、及びサル免疫不全ウイルス(SIV)、パピローマウイルス、マウスガンマヘルペスウイルス、アレナウイルス科(たとえば、アルゼンチン出血熱ウイルス、ボリビア出血熱ウイルス、サビア関連出血熱ウイルス、ベネズエラ出血熱ウイルス、ラッサ熱ウイルス、マチュポウイルス、リンパ球性脈絡髄膜炎ウイルス(LCMV))、ブニヤウイルス科(Bunyaviridiae)(たとえば、クリミア・コンゴ出血熱ウイルス、ハンタウイルス、腎症候性出血熱を引き起こすウイルス、リフトバレー熱ウイルス)、フィロウイルス科(フィロウイルス)(エボラ出血熱及びマールブルグ出血熱を含む)、フラビウイルス科(キャサヌール森林病ウイルス、オムスク出血熱ウイルス、ダニ媒介脳炎を引き起こすウイルス含む)及びパラミクソウイルス科(ヘンドラウイルス及びニパウイルスを含む)、大痘瘡及び小痘瘡(痘瘡)、アルファウイルス属(たとえば、ベネズエラウマ脳炎ウイルス、東部ウマ脳炎ウイルス、西部ウマ脳炎ウイルス)、SARS関連コロナウイルス(SARS−CoV)、西ナイルウイルス、ならびにいずれかの脳炎(encephaliltis)を引き起こすウイルスが挙げられるが、これらに限定されない。
本明細書で企図される組成物及び方法によって検出される、識別される、予測される、診断される、または監視されることが可能である移植患者における臓器移植を監視するのに適している遺伝子の例示的な例は、以下の遺伝子、HLA−A、HLA−B、HLA−C、HLA−DR、HLA−DP、及びHLA−DQのうちの1つ以上を含むが、これらに限定されない。
特定の実施形態では、バイオインフォマティクス解析は、cfDNAクローンライブラリにおいて解析されるゲノム当量数の定量化;標的遺伝子座における遺伝子変異体の検出;標的遺伝子座における突然変異の検出;標的遺伝子座における遺伝子融合の検出、または標的遺伝子座におけるコピー数変動の測定のために使用される。
F.コンパニオン診断
さまざまな実施形態において、遺伝性疾患についてのコンパニオン診断を提供し、このコンパニオン診断は、ゲノムDNAを被験体の生体試料から単離する、または取得すること、DNAを1個以上の末端修復酵素によって処置して、末端修復DNAを生成すること、1個以上のアダプタを末端修復DNAの各末端へ付着させて、DNAライブラリを生成すること、DNAライブラリを増幅して、DNAクローンライブラリを生成すること、DNAクローンライブラリ中のゲノム当量数を決定すること、及びDNAクローンライブラリ中の遺伝性疾患と関連する1個以上のバイオマーカーの定量的遺伝子解析を実施することを備え、そこで1個以上のバイオマーカーのうちの少なくとも1個の検出、またはこれらの検出の失敗は、被験体を遺伝性疾患について処置するかどうかを示す 。いくつかの実施形態では、このDNAはcfDNAである。特定の実施形態では、このDNAは細胞DNAである。
本明細書で使用する「コンパニオン診断」という用語は、特定の抗がん療法に結びついた診断検査を指す。特定の実施形態では、これらの診断方法は、生体試料に関連するバイオマーカーにおける遺伝子損傷の検出を含むことにより、患者を抗がん療法で治療すべきかそうでないかの迅速な識別が可能になる。
抗がん療法としては、以下に限定するものではないが、手術、放射線照射、化学療法、抗がん剤、及び免疫調節剤が挙げられる。
抗がん薬の例示的な例は、アルキル化剤(たとえば、チオテパ及びシクロホスファミド(CYTOXAN(商標)))、アルキルスルホン酸塩類(たとえば、ブスルファン、インプロスルファン及びピポスルファン)、アジリジン類(たとえば、ベンゾドパ、カルボコン、メツレドパ、及びウレドパ)、エチレンイミン類及びメチラメラミン類(たとえば、アルトレタミン、トリエチレンメラミン、トリエチレンホスホルアミド、トリエチレンチオホスファオルアミド、及びトリメチルオロメラミンレジュームを含む)、ナイトロジェンマスタード類(たとえば、クロラムブシル、クロルナファジン、コロホスファミド、エストラムスチン、イホスファミド、メクロレタミン、メクロレタミンオキシド塩酸塩、メルファラン、ノブエンビキン、フェネステリン、プレドニムスチン、トロホスファミド、ウラシルマスタード)、ニトロソウレア類(たとえば、カルムスチン、クロロゾトシン、ホテムスチン、ロムスチン、ニムスチン、ラニムスチン)、抗生物質類(たとえば、アクラシノマイシン類、アクチノマイシン、オースラマイシン、アザセリン、ブレオマイシン類、カクチノマイシン、カリチアマイシン、カラビシン、カルミノマイシン、カルチノフィリン、クロモマイシン類、ダクチノマイシン、ダウノルビシン、デトルビシン、6−ジアゾ−5−オキソ−L−ノルロイシン、ドキソルビシンとそのペグ化製剤類、エピルビシン、エソルビシン、イダルビシン、マルセロマイシン、マイトマイシン類、ミコフェノール酸、ノガラマイシン、オリボマイシン類、ペプロマイシン、ポトフィロマイシン、ピューロマイシン、クエラマイシン、ロドルビシン、ストレプトニグリン、ストレプトゾシン、ツベルシジン、ウベニメクス、ジノスタチン、ゾルビシン)、代謝拮抗剤類(たとえば、メトトレキサート及び5−フルオロウラシル(5−FU))、葉酸類似体(たとえば、デノプテリン、メトトレキサート、プテロプテリン、トリメトレキサート)、プリン類似体(たとえば、フルダラビン、6−メルカプトプリン、チアミプリン、チオグアニン)、ピリミジン類似体(たとえば、アンシタビン、アザシチジン、6−アザウリジン、カルモフール、シタラビン、ジデオキシウリジン、ドキシフルリジン、エノシタビン、フロクスウリジン、5−FU)、アンドロゲン類(たとえば、カルステロン、プロピオン酸ドロモスタノロン、エピチオスタノール、メピチオスタン、テストラクトン)、抗副腎剤類(たとえば、アミノグルテチミド、ミトタン、トリロスタン)、葉酸補充薬(たとえば、フォリン酸(frolinic acid))、アセグラトン、アルドホスファミド配糖体、アミノレブリン酸、アムサクリン、ベストラブシル、ビサントレン、エダトラキサート、デフォファミン、デメコルシン、ジアジクオン、エルホルミチン、エリプチニウムアセテート、エトグルシド、硝酸ガリウム、ヒドロキシ尿素、レンチナン、ロニダミン、ミトグアゾン、ミトキサントロン、モピダモール、ニトラクリン、ペントスタチン、フェナメット、ピラルビシン、ポドフィリン酸、2−エチルヒドラジド、プロカルバジン、PSK(登録商標)、ラゾキサン、シゾフィラン、スピロゲルマニウム、テヌアゾン酸、トリアジコン、2,2’,2’’−トリクロロトリエチルアミン、ウレタン、ビンデシン、ダカルバジン、マンノムスチン、ミトブロニトール、ミトラクトール、ピポブロマン、ガシトシン、アラビノシド(「Ara−C」)、シクロホスファミド、チオテパ、タキソイド類(たとえば、パクリタキセル(TAXOL(登録商標)、Bristol−Myers Squibb Oncology,Princeton,N.J.)及びドキセタキセル(TAXOTERE(登録商標)、Rhne−Poulenc Rorer,Antony,France))、クロラムブシル、ゲムシタビン、6−チオグアニン、メルカプトプリン、メトトレキサート、白金類似体(たとえば、シスプラチン及びカルボプラチン)、ビンブラスチン、白金、エトポシド(VP−16)、イホスファミド、マイトマイシンC、ミトキサントロン、ビンクリスチン、ビノレルビン、ナベルビン、ノバントロン、テニポシド、アミノプテリン、ゼローダ、イバンドロネート、CPT−11、トポイソメラーゼ阻害剤RFS2000、ジフルオロメチロマイシン(difluoromethylomithine)(DMFO)、レチノイン酸誘導体(たとえば、Targretin(商標)(ベキサロテン)、Panretin(商標)(アリトレチノイン))、ONTAK(商標)(デニロイキンジフチトクス)、エスペラミシン類、カペシタビン、ならびに上記いずれかの薬学的に許容される塩類、酸類、または誘導体を含むが、これらに限定されない。この定義にさらに含まれるものとして、がんに対するホルモン作用を調節または阻害するように作用する抗ホルモン剤、例えば、抗エストロゲン剤(例えば、タモキシフェン、ラロキシフェン、アロマターゼ阻害4(5)−イミダゾール類、4−ヒドロキシタモキシフェン、トリオキシフェン、ケオキシフェン、LY117018、オナプリストン、及びトレミフェン(Fareston)を含む)、ならびに抗アンドロゲン剤(例えば、フルタミド、ニルタミド、ビカルタミド、ロイプロリド、及びゴセレリン)、ならびに上記のいずれかの薬学的に許容される塩類、酸類、または誘導体がある。
免疫調節剤の例示的な例としては、以下に限定するものではないが、シクロスポリン、タクロリムス、トレスペリムス、ピメクロリムス、シロリムス、ベロリムス、ラフルニムス、ラキニモド及びイミキモド、ならびにこれらの類似体、誘導体、塩類、イオン類、及び複合体が挙げられる。
いくつかの実施形態では、抗がん薬は、ポリ−ADPリボースポリメラーゼ(PARP)阻害剤を含むことができる。PARP阻害剤の例示的な例は、オラパリブ(AZD−2281)、ルカパリブ(AG014699またはPF−01367338)、ニラパリブ(MK−4827)、タラゾパリブ(BMN−673)、ベリパリブ(ABT−888)、CEP 9722、E7016、BGB−290、3−アミノベンズアミドを含むが、これらに限定されない。
本明細書で引用された全ての刊行物、特許出願及び発行された特許は、個々の刊行物、特許出願、または発行された特許が明確に及び個々に示され、参照により援用されているかのように、参照により本明細書に援用される。特に、国際PCT公開第WO2016/028316号の全内容は、参照により具体的に援用される。
上記の発明を、明快に理解するための例示及び例を通じてある程度詳細に説明してきたが、本発明の教示を踏まえた上で、添付の請求項の趣旨または範囲から逸脱することなく、本発明にあるいくつかの変更及び修正を施してもよいことは、当業者には直ちに明らかになることである。以下の実施例は、単に例として提供されるものであり、限定として提供されるものではない。当業者であれば、本質的に同様な結果をもたらすために変更または修正ができるであろう様々な重要性の低いパラメーターがあることを容易に認識することになる。
実施例1:断片化ゲノムDNAの配合物を含む試料のコピー数解析
断片化された野生型ヒトgDNA試料中に添加されたΔATMまたはΔBRCA2の不死化ヒト試料に由来するDNAを含んだ、断片化ゲノムDNAの配合物を細心に生成した。この試料タイプの利点は、組成を慎重に制御することが可能であり、試料の入手可能性が本質的に無制限であることである。
野生型、ヒト女性ゲノムDNAを、健康な志願者によって提供された全血試料から精製した。ATM遺伝子(NA09596、ΔATM)を網羅するヘテロ接合性欠失を宿す不死化細胞からゲノムDNAを単離し、BRCA2(NA02718、ΔBRCA2)のヘテロ接合性欠失を有する別々の試料をCoriellリポジトリから取得した。重要なことに、これらの試料は、ゲノムの残部にわたりほかの点では正常な倍数性を有するようにみえた。ΔATM試料は、男性ドナーに由来したため、X連鎖AR遺伝子についてのコピー数において、ヘミ接合性でもあった。無細胞DNA(cfDNA)を健康な女性または男性由来のドナー血漿試料から取得した。ライブラリ構築のために、ゲノムDNAを、Covaris機器に関して200bpの設定で超音波処理し、つぎにさらに「両側」DNAビーズ精製を使用して、サイズを選択した。ライブラリインプットDNA試料を図7に示す。
断片化したcfDNA試料の適切な組み合わせを配合して、百分率で定義し、末端修復し、そしてゲノムライブラリに変換した。約500ngの各ライブラリを8個の試料セットに混合し、2304個のDNAプローブを含んだ前立腺プローブプールのコピー数減少(CNL)にハイブリダイズした。試料処理後、8個の試料の各セットを、6千万リード/試料に対応する、Illumina NextSeq NGS機器上で、約4億8千万個のパスフィルタリードの深度へ配列決定した。おおよそ95%のリードは、妥当な試料IDタグを含み、ヒト基準ゲノムにアライメントを取り、そしてこれらのうちの、約98%を意図された標的遺伝子座へマッピングした。シーケンシング深度全体を、1個のプローブにつき、1個のインプットゲノムあたりのリード数として測定し(平均ゲノム深度(2500)によって除算し、またプローブカウント(2400)によって除算する、標的上リード(6千万)として計算した)、1個のプローブにつき、1個のインプットゲノムあたり約10リードであった。コピー数減少解析のグラフ表示を図1に示す。コピー数撹乱を矢印で強調表示した。(試料1、女性DNA中の5%の男性DNA、試料2、女性DNA中の5%のΔATM DNA(男性)、試料3、女性DNA中の5%のΔBRCA2 DNA(女性)、試料4、純粋な女性DNA)。
CNL呼び出し側は、冗長リードを識別し、これらを単一のコンセンサスリード中に縮合させ、つぎに各プローブ位置で定量化する。この情報を遺伝子ごとのコピー数平均値にさらに縮合した。最後に、各CNL測定で検出された偏差に、統計学的有意性を割り当て、これをlog10P値の統計的有意性としてグラフで示す。
図8は、断片化され、配合されたゲノムライブラリ中のAR遺伝子(図8B)及びATM遺伝子(図8C)についてコピー数決定の箱ひげ図を示す。ΔATM試料が男性であるため、AR遺伝子(X連鎖、ヘミ接合性)及びATM遺伝子の両方は、CNL挙動を示した。予測されたように、測定されたコピー変動の大きさは、中程度であった。図9Bに示される統計解析は、観察されたコピー増減が統計的に有意であったことを実証する。さらに、均一なコピー特性を示すと予測された残りの遺伝子中で、ほとんど有意な増減は観察されなかった。これらの値は、さまざまなゲノム配合物について予測された頻度と良く相関していた。図10は、異性からcfDNAの微量なスパイクイン、または断片化gDNAの微量な追加のいずれか一方を有する、主にcfDNAであった試料中で、統計的に有意なコピー増減も容易に観察されたことを示す。これらの値は、さまざまなゲノム配合物について予測された頻度と良く相関していた。断片化されたgDNA、及びcfDNAの両方に関してみられた、これらの結果は、同等であったことにより、アッセイの完全性を実証し、この完全性が臨床試料に翻訳されることを示した。
これらのデータは、遺伝子コピー数において2%のマイナーアレル頻度に下がった、わずかな変化を検出するアッセイシステムの能力を実証する。提示された実証例の焦点は、コピー数減少にあるが、技術は、染色体アーム重複及び局所的増幅を通して発生する遺伝子コピーにおける増加を含む、コピー数増加の検出に等しく良く適している。このアッセイは、SNV、インデル及び遺伝子融合(染色体再編成)を含む、他の種類のゲノム変異体を検出する能力をさらに保持する。重要なことには、これらのデータは、血漿に由来するゲノムDNAに、また組織などの他の供給源及び他の身体供給源に由来するゲノムDNAに、この方法を適用することが可能であることを実証する。
実施例2:健康なドナー及び癌患者からのcfDNAのコピー数解析
以下の例は、ゲノムライブラリ構築中に、またハイブリダイゼーション処理後に、追加される分子特徴を使用して、コピー数解析を生成する方式を示す。Qiagen Circulating Nucleic Acids Extractionキット(Qiagen,Hilden,Germany)を用いて、16個の健康なドナー、及び1個の去勢抵抗性前立腺癌の患者の血漿からDNAを抽出した。Qubit蛍光光度計(Thermo Fisher,Waltham,MA)、及び対応するhsDNA定量化キットを用いて、二本鎖DNAの収量を定量化した。ゲル電気泳動法を2%のアガロースゲル上に用いて、サイズ規格としてPCRマーカー(New England Biolabs,Ipswich,MA)によって、サイズ解析を実施した。試料からのcfDNAの収量によって、約40から100ngのcfDNAをライブラリ構築に使用した。
ライブラリ構築の基本的な特徴を図11Aから11Cに示す。最初にcfDNAを脱リン酸化した後に、二段階プロセスで修復し、末端を平滑末端化した。短い、10ntのアンカー配列は、リン酸化ライゲーション鎖及び不活性パートナー鎖からなり、つぎにcfDNAにライゲーションされた。4個のアンカー配列のセットを作製するために用いられた8個のオリゴヌクレオチドを表1に示す。
アダプタ構造は、アンカー配列にアニールしたアダプタ配列全長の付加によって完成した。32セットのアダプタ配列を、240個のメンバーから各構成し、図12から図22に示す。これらのアダプタをcfDNAに付着させ、ポリヌクレオチドキナーゼ、DNAポリメラーゼ及びDNAリガーゼの協調作用を通して伸長させ、ゲノムライブラリを生成した。シーケンシング前の品質管理ステップとして、得られたゲノムライブラリをqPCRによってカバレッジの深度について定量化した。つぎにゲノムライブラリを増幅し、特異的な遺伝子を標的にするプローブセットへハイブリダイズした(図11B)。ハイブリダイゼーション後に、プローブのプライマー伸長を用いて、キャプチャされたゲノム配列をコピーし、情報を付着したアダプタ中で符号化した(図11C)。標準的な次世代解析ソフトウェアを用いたシーケンシング解析後の例を図11Dに示す。この解析をシーケンシングラン上で実施し、このシーケンシングランは、32個の試料(28個の癌患者試料、及び4個の野生型対照)を含み、それは、シーケンシングリードの全体的な分布を表示する。
本明細書に記載される標的ハイブリッドキャプチャプラットフォームの中心となる機能は、それが複数の種類のゲノム情報を提供することである。キャプチャプローブの1つの必須機能は、標的領域にわたり深いカバレッジ深度で変異検出を提供することである。この機能をキャプチャプローブの配列構成、密度、及び配置によって管理し、TP53遺伝子に関して図23に示す(TP53プローブ配列を以下の表2に示す)。等しい有意性の、標的ハイブリッドキャプチャプラットフォームアッセイを有意な変異が検出されなかった領域中の等しいカバレッジ深度からの読み出しを生成した。これらのデータは、有害な変異が検出されなかった場合に統計的有意性を加えるため、医師及び患者に重要である。
キャプチャされたゲノム配列(図11C)のキャプチャプローブの連鎖は、各プローブ位置におけるゲノム深度の測定をも容易にした。実験に使用されたすべてのキャプチャプローブと関連するユニークリード数を測定した(図24)。図24に示されるデータを、16個の健康なドナーのcfDNA試料を解析したシーケンシングランから導出した。TP53遺伝子中の1箇所のプローブ位置において各試料中で遭遇したユニークリードの深度を計算した(図24に示された生のユニークリードカウント)。ユニークリードの広範な試料間分布に反映されたように、各試料は、ユニークライブラリ深度を有した。また実験において、2596個すべてのキャプチャプローブにわたるユニークリード深度の網羅的平均を計算した(図24B)。有意には、すべてのプローブについて測定された網羅的なユニークリード深度によって図24Cに表された、単一のプローブ部位で観察されたリード深度の正規化は、正規化されたユニークリードの均一な密度を明らかにした。これらのデータは、試料間から解析のために選択された特定のプローブのキャプチャ性能が均一であり、それぞれの個々のライブラリのゲノム深度に比例したことを示す。
この同一の正規化機能を図23に示される45個のTP53−特異的プローブに適用した(図25に示される正規化データ)。図23は、TP53コード領域のシーケンシング深度へのすべてのプローブの凝集寄与を示すが、図25は、個々の各プローブによって取得された正規化深度を示す。個々の各プローブによって取得された正規化深度は、いずれかの所与のプローブについて試料間で一般的に一貫していたが、一方のプローブを他方と比較したときにいくぶんばらつきがあった。いくつかの要因は、プローブ間で観察された正規化後のキャプチャ深度における差を支配し、最も有意なのは、互いに関するプローブの配置であり、またゲノム反復領域に対するプローブの近接性であった。ほとんどのプローブは、均一なキャプチャ挙動を示すが、キャプチャ性能が一貫していなかった2個のプローブを図25に矢印によって強調表示する。しかしながら、これらのデータは、これらのようなプローブが稀であり、容易に識別されることを示す。またこのようなものとして、それらを下流側コピー数解析から除外することが可能である。
均一なキャプチャ性能は、図25中に45個のTP53標的プローブによって示され、本明細書に記載される標的ハイブリッドキャプチャプラットフォームの一般的な特徴である。図26において、この実験中に、特性を明らかにされた16個すべての正常なcfDNAライブラリについて、2596個のキャプチャプローブの1つのパネル中の各プローブについて平均キャプチャ深度を計算した。つぎに散布図解析を使用して、平均値を3個の代表的な試料と個々に比較した。各点は、異なるプローブを表し、グラフ上の各点の位置は、x軸上の平均値とy軸上の個々の試料との比較である。大多数のプローブの緊密な対角分布は、ほとんどのプローブの高い相関関係のユニークリードキャプチャ性能を反映した(3つのグラフすべてについて、R相関関係≧0.95)。重要なことには、プローブごとのシーケンシング深度の一貫性は、コピー数測定における標的ハイブリッドキャプチャプラットフォームの使用をサポートする。
コピー数に関して、プローブデータの最も直接的な処理は、常染色体中で「2」の二倍体平均値に発生する調整されたゲノム深度値をさらに正規化することである。X連鎖性の遺伝子座について女性に発生するプローブ値についても同様である。正常な男性中のX連鎖領域及びY連鎖領域について、平均されたコピー値を「1」へ適宜に設定する。上記に詳細に考察される、この数値変換を、染色体対照プローブ(表3で、22個すべての常染色体上で選択された遺伝子座を標的とする239個のプローブ)のセット、X連鎖AR遺伝子を標的とする199個のプローブのセット、及び45個のTP53−特異的プローブに適用した(図27A及び27B)。各点は、個々のプローブについての値を表す。稀な「ノイズの多い」プローブを除き、領域中の大多数の個々のプローブカウントは、約「2」であった二倍体を含む値であると予測された。健康な男性中のAR遺伝子についてプローブは、予測された「1」に近い平均値に関して増減した。
有意には、去勢抵抗性前立腺癌の患者の血液の血漿部分から収集されたcfDNAに対して、健常試料を使用した正規化対照と同一の解析を適用したときに、3つの突出した特徴が現れた(図27C)。第一に、すべての対照プローブは、ノイズの多いカウント挙動を示した。第二に、すべてのARプローブにわたるカウントは、有意に「1」の正常な値から約「5」の増幅された値へ上昇した。AR遺伝子の増幅は、進行前立腺癌において一貫して観察された。第三に、TP53プローブカウントは、より密接にクラスター化し、「2」の所期の値よりはるかに「1」に近い平均値を有した。これは、腫瘍組織に由来した循環DNA部分におけるコピー数減少によって、TP53の一方または両方のアレルの不活性化を反映した可能性がある。
これらのデータは、本発明の方法が3つの重要な核型分析の態様を有することを示した。すなわち、本明細書に記載されるこれらの方法は、一般染色体異数性、特異的な標的遺伝子のコピー増加、及び同一の特異的な標的遺伝子におけるコピー減少を検出する。さらにこれらの結果は、3つすべてのこれらのゲノム異常が癌に発生することが多いので、本明細書に記載される方法及びプラットフォームが精密治療の使用を導くことが可能であることを示す。
健常対照(茶色の点)と比較した、去勢抵抗性前立腺癌の患者試料(青色の点)についての一般染色体異数性を測定した(図28)。この解析において、実験に使用された239個すべての対照プローブについてほぼ倍数性を、それらの染色体標的に従い順序付けした。いくつかの染色体(たとえば、染色体1及び染色体22)について、患者試料と対照試料との間で同様の倍数性の「2」の値を観察した。他の事例において、これら2個の試料間の偏差を観察した。これらの実験によって提供される、ゲノム倍数性全体についての情報の程度を、使用された対照プローブの数及び密度によって制限した。しかしながら、これらのデータは、均一な密度で染色体セグメントをすべて覆うより高密度なプローブパネルを、本発明の追加のユニーク特徴と併せて使用することが可能であることを示す。これらのような解析は、より高い分解能の、染色体コピー数のゲノムワイド測定を提供するであろう。
これらのデータは、精密治療についてのガイドとして本発明の可能性をさらに強調する。たとえば、相同組換え修復においてゲノム欠損を有する腫瘍は、非常に不安定化した染色体倍数性を示すことが多く、またこれらのような腫瘍を含む患者は、PARP酵素複合体の阻害剤について良い候補である(Popova et al.,Genome Biol.2009;10(11):R128参照)。腫瘍の遺伝子型を探すほとんどのシーケンシングアッセイと異なり、本明細書に記載されるこれらのアッセイは、腫瘍の表現型を駆動する原因の変異が標的解析から隠されている場合でも、シーケンシングを使用して、この腫瘍の表現型として不安定化した染色体倍数性を検出する。
固形腫瘍から脱落するDNA中の遺伝子減少を検出する能力は、特に有意である。腫瘍抑制遺伝子の変異及び欠失は、がんゲノム中で頻繁な事象であり、さらに腫瘍抑制遺伝子の生殖系列喪失に関する個体は、高齢期にがんにかかることに対してユニークに脆弱である。液体バイオプシーコピー数減少(CNL)アッセイの診断値は、その感度に正比例する。本明細書に記載される本発明についての検出の下限値を決定するために、実施例1に記載される不死化株を「ゲノム・イン・ア・ボトル」基準の細胞株、NA12878中で系統的に希釈した。一方の株は、ATMのシングルコピー欠失(単一アレルの減少)を有し、他方の株は、BRCA2のシングルコピー欠失を有する。実験は、純粋なNA12878の4個の対照試料、及び16%の各単一アレル欠失株を含有する8個のスパイクイン試料を含んだ(図29)。報告目的のために、これは、両アレル減少の8%のマイナーアレル頻度に対応する。特異的な遺伝子を標的とするすべてのプローブについての平均値、及び2個の追加の、欠失のない対照遺伝子を図29に示す。ATM及びBRCA2のコピー減少をスパイクイン試料のみに限定した。このデータの追加の計算上の処理は、2%のマイナーアレル頻度まで下げる、両アレル欠失の確信的なコピー減少呼び出しを明らかにした。この感度は、標準的な血液に基づく遺伝子型判定アッセイにおけるコピー減少呼び出しを常に有するため、本発明が特別な配慮を必要としないことを示した。
これらのデータは、標的ゲノム遺伝子座のコピー数増加及びコピー数減少の両方を含む、コピー数の解析のためのプローブ特異的ゲノムキャプチャデータの使用を実証する。加えて、本明細書に記載される本発明は、単一のヌクレオチド変異体、単一のヌクレオチドからなん千もの塩基対に及ぶ挿入及び欠失、ならびに異常な変異プロセスによる染色体再編成(PCT公開第WO2016/028316号、及び米国特許公開第2014−0274731号を参照)に起因する遺伝子融合を検出するために、感度の高い能力をもつことを示している。これらの変異プロセスのすべては、新生物がんへの正常な組織の形質転換に寄与する可能性があり、精密治療が出現し続けるなら、これらの疾患ゲノム特性の正確な診断は、次第に精密医薬の不可欠な機能となるであろう。

Claims (105)

  1. DNA標的領域上で試験試料から遺伝子解析を実施する方法であって、
    (a)複数のDNAライブラリ断片を含むゲノムDNAライブラリを生成することであって、そこで各前記DNAライブラリ断片は前記試験試料からのゲノムDNA断片、及びアダプタを含む、前記生成すること、
    (b)DNA標的領域に特異的に結着する複数のキャプチャプローブと前記ゲノムDNAライブラリを接触させることにより、前記DNA標的領域を含む前記キャプチャプローブとDNAライブラリ断片との間に複合体を形成すること、ならびに
    (c)前記DNA標的領域を含む前記ゲノムDNA断片の定量的遺伝子解析を実施すること、
    を備え、
    そこで前記アダプタは増幅領域、試料タグ領域、及びアンカー領域を含むDNAポリヌクレオチドであり、
    そこで前記増幅領域はPCR増幅についてプライマー認識部位として機能することが可能であるポリヌクレオチド配列を含み、
    そこで前記試料タグは前記ユニークライブラリDNA断片の一致度を符号化し、前記試験試料の一致度を符号化するポリヌクレオチド配列を含み、
    そこで前記アンカー領域は前記試験試料の前記一致度を符号化するポリヌクレオチド配列を含み、そこで前記アンカー領域は前記ゲノムDNA断片に付着することが可能であり、
    そこで前記遺伝子解析は疾患状態を示す遺伝的変化を検出するために実施される、
    前記方法。
  2. 疾患状態を示す前記遺伝的変化は、一塩基多様体(SNV)、40ヌクレオチド長未満の挿入、40ヌクレオチド長未満のDNA領域の欠失、及び/またはコピー数における変化から選択される、請求項1に記載の前記方法。
  3. 疾患状態を示す前記遺伝的変化は、コピー数における変化である、請求項1に記載の前記方法。
  4. 前記試験試料は、組織診である、請求項1から3のいずれかに記載の前記方法。
  5. 前記組織診は、腫瘍、または腫瘍であると疑われる組織から採取される、請求項4に記載の前記方法。
  6. 前記ゲノムDNAは、無細胞DNA(cfDNA)または細胞DNAである、請求項1から3のいずれかに記載の前記方法。
  7. 前記ゲノムDNAは、前記試験試料から単離されるcfDNAであり、前記試験試料は、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、便、粘液、及び汗からなる群から選択される生体試料である、請求項6に記載の前記方法。
  8. 前記ゲノムDNA断片は、
    (i)前記試験試料から細胞DNAを単離すること、
    (ii)前記細胞DNAを断片化し、前記ゲノムDNA断片を取得すること、
    を備えるステップによって取得される、請求項1から5のいずれかに記載の前記方法。
  9. ステップ(ii)は、前記細胞DNAを少なくとも1個の消化酵素と接触させることによって実施される、請求項8に記載の前記方法。
  10. ステップ(ii)は、機械的応力を前記細胞DNAへ加えることによって実施される、請求項8に記載の前記方法。
  11. 前記機械的応力は、前記細胞DNAを超音波処理することによって加えられる、請求項10に記載の前記方法。
  12. 前記試料タグは、前記ユニークゲノムDNA断片の前記同定を容易にするユニーク分子識別子(UMI)をさらに含む、先行請求項のいずれかに記載の前記方法。
  13. 前記増幅領域は、10から50の間のヌクレオチド長にある、先行請求項のうちのいずれか1項に記載の前記方法。
  14. 前記増幅領域は、20から30の間のヌクレオチド長にある、先行請求項のうちのいずれか1項のいずれかに記載の前記方法。
  15. 前記増幅領域は、25ヌクレオチド長にある、先行請求項のうちのいずれか1項のいずれかに記載の前記方法。
  16. 前記試料タグは、5から50の間のヌクレオチド長にある、先行請求項のうちのいずれか1項に記載の前記方法。
  17. 前記試料タグは、5から15の間のヌクレオチド長にある、請求項16に記載の前記方法。
  18. 前記試料タグは、8ヌクレオチド長にある、請求項16に記載の前記方法。
  19. 前記UMI増倍管は、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれる、請求項12から18のうちのいずれか1項に記載の前記方法。
  20. 前記UMI増倍管は、1から5の間のヌクレオチド長にある、請求項19に記載の前記方法。
  21. 前記UMI増倍管は、3ヌクレオチド長にあり、64個の可能なヌクレオチド配列のうちの1個を含む、請求項19に記載の前記方法。
  22. 前記アンカー領域は、1から50の間のヌクレオチド長にある、先行請求項のうちのいずれか1項に記載の前記方法。
  23. 前記アンカー領域は、5から25の間のヌクレオチド長にある、請求項22に記載の前記方法。
  24. 前記アンカー領域は、10ヌクレオチド長にある、請求項22または23に記載の前記方法。
  25. ステップ(a)は、前記ゲノムDNA断片を複数のアダプタへ付着させることを備える、先行請求項のいずれか1項に記載の前記方法。
  26. 前記ゲノムDNA断片は、前記ゲノムDNA断片を複数のアダプタと付着させる前に、末端修復される、請求項25に記載の前記方法。
  27. 前記複数のアダプタの各アダプタの前記増幅領域は、同一のヌクレオチド配列を含む、請求項25に記載の前記方法。
  28. 前記複数のアダプタの各アダプタの前記試料タグ領域は、2から1,000個の間のヌクレオチド配列のうちの1個を含む、請求項26または27に記載の前記方法。
  29. 前記複数のアダプタの各アダプタの前記試料タグ領域は、50から500個の間のヌクレオチド配列のうちの1個を含む、請求項28に記載の前記方法。
  30. 前記複数のアダプタの各アダプタの前記試料タグ領域は、100から400個の間のヌクレオチド配列のうちの1個を含む、請求項28に記載の前記方法。
  31. 前記複数のアダプタの各アダプタの前記試料タグ領域は、200から300個の間のヌクレオチド配列のうちの1個を含む、請求項28に記載の前記方法。
  32. 前記複数のアダプタの各アダプタの前記試料タグ領域は、8ヌクレオチド長にある、請求項28に記載の前記方法。
  33. 前記ヌクレオチド配列の各配列は、少なくとも2のハミング距離によって前記240個のヌクレオチド配列のいずれかの他の配列から分離する、請求項28から32のいずれかに記載の前記方法。
  34. 前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれるUMI増倍管を備える、請求項26から33のうちのいずれか1項に記載の前記方法。
  35. 前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接するUMI増倍管を備える、請求項26から34のうちのいずれか1項に記載の前記方法。
  36. 前記複数のアダプタの各アダプタの前記UMI増倍管は、1から5の間のヌクレオチド長にある、請求項34または35に記載の前記方法。
  37. 前記複数のアダプタの各アダプタの前記UMI増倍管は、3ヌクレオチド長にある、請求項36に記載の前記方法。
  38. 前記複数のアダプタの各アダプタの前記アンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の前記4個のアンカー領域のうちの1個のみに対合される、請求項26から37に記載の前記方法。
  39. 前記複数のアダプタの各アダプタの前記増幅領域は、同一のヌクレオチド配列を含み、
    前記複数のアダプタの各アダプタの前記試料タグ領域は、8ヌクレオチド長にあり、各試料タグの前記ヌクレオチド配列は、少なくとも2のハミング距離によって前記複数のアダプタの前記試料タグのいずれかの他のヌクレオチド配列から分離し、
    前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれるUMI増倍管を備え、前記複数のアダプタの各アダプタの前記UMI増倍管は、3ヌクレオチド長にあり、それぞれの前記可能なヌクレオチド配列の前記UMI増倍管は、前記複数のアダプタの各試料タグ領域に対合され、
    前記複数のアダプタの各アダプタの前記アンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の前記4個のアンカー領域のうちの1個のみに対合される、
    請求項25または26に記載の前記方法。
  40. 前記ゲノムDNA断片を複数のアダプタと付着させる前記ステップは、
    (i)アンカー領域の少なくとも一部を含むオリゴヌクレオチドを各ゲノムDNA断片へ付着させることであって、そこでアンカー領域の少なくとも一部を含む前記オリゴヌクレオチドはパートナー鎖によって二本鎖にされる5’リン酸化付着鎖を含むDNA二本鎖であり、そこで前記パートナー鎖は化学修飾による付着からその3’末端で遮断され、そこで前記付着鎖は前記ゲノムDNA断片に付着する、前記付着させること、
    (ii)前記複数のアダプタの各アダプタのヌクレオチド配列についてアダプタ配列の全長を符号化するDNAオリゴヌクレオチドと、前記アンカー領域の少なくとも一部を含む前記オリゴヌクレオチドに付着する前記ゲノムDNA断片を接触させること、ならびに
    (iii)DNAライゲーションに適切な条件下でT4ポリヌクレオチドキナーゼ、Taq DNAリガーゼ、及びBstポリメラーゼ全長と、前記ゲノムDNA断片、及び前記アダプタ配列の全長を符号化する前記DNAオリゴヌクレオチドを接触させること、
    を備え、
    それらにより、前記複数のアダプタを前記ゲノムDNA断片に付着させる、請求項25から39のいずれか1項に記載の前記方法。
  41. 前記ゲノムDNA断片は、cfDNAである、請求項25から40のいずれかに記載の前記方法。
  42. 前記DNA標的領域は、コピー数における変化について解析される、請求項25から41のいずれかに記載の前記方法。
  43. ステップ(c)は、前記DNA標的領域を含む前記キャプチャプローブとDNAライブラリ断片との間に形成される前記複合体の精製を備える、先行請求項のいずれか1項に記載の前記方法。
  44. ステップ(c)は、前記DNA標的領域を含む前記キャプチャプローブとDNAライブラリ断片との間に形成される前記複合体の精製を備え、前記ゲノムDNAライブラリから前記関心領域を含む前記DNAライブラリ断片のプライマー伸長及び/または増幅を実施する、先行請求項のいずれか1項に記載の前記方法。
  45. ステップ(c)は、前記DNA標的領域を含む前記キャプチャプローブとDNAライブラリ断片との間に形成される前記複合体の精製を備え、前記ゲノムDNAライブラリから前記関心領域を含む前記DNAライブラリ断片のプライマー伸長及び増幅を実施する、先行請求項のいずれか1項に記載の前記方法。
  46. ステップ(c)は、複数のシーケンシングリードを生成するために、前記DNA標的領域を含む前記DNAライブラリ断片のDNAシーケンシングを備える、先行請求項のいずれか1項に記載の前記方法。
  47. 前記ゲノム解析は、DNA関心領域におけるコピー数の変化を測定することを備え、ステップ(c)は、
    (i)前記試験試料に由来する前記ゲノムDNAライブラリ中に存在する前記関心領域のコピー数を測定すること、及び
    (ii)ステップ(i)において測定された前記コピー数を標準試料に由来する前記ゲノムDNAライブラリ中に存在する前記関心領域のコピー数と比較すること、
    を備え、
    前記標準試料は、前記DNA標的領域の既知のコピー数を有する、
    先行請求項のいずれか1項に記載の前記方法。
  48. 前記関心領域における前記コピー数を測定することは、複数のシーケンシングリードを生成するために前記DNA標的領域を含む前記DNAライブラリ断片のDNAシーケンシングを備え、各シーケンシングリードは、ユニーク分子識別素子(UMIE)を含む、請求項47に記載の前記方法。
  49. 前記UMIEは、前記アダプタからのシーケンシング情報、及び前記ゲノムDNA配列の少なくとも一部を含む、請求項48に記載の前記方法。
  50. 同一UMIEを含むシーケンシングリードは、ユニークゲノム配列(UGS)として識別される、請求項49に記載の前記方法。
  51. 前記ゲノムDNAライブラリと接触する前記キャプチャプローブのそれぞれについて生のゲノム深度(RGD)を測定することをさらに備える、請求項47から50のいずれかに記載の前記方法。
  52. 前記RGDは、試料複製物群内の各キャプチャプローブ配列と関連するUGSの前記平均数を測定することを備える、請求項51に記載の前記方法。
  53. 非常にばらつきのある数のUGSと関連するキャプチャプローブは、ノイズの多いプローブとして識別され、さらなる計算から除外される、請求項52に記載の前記方法。
  54. 試料についてRGDを計算することをさらに備え、前記試料中のすべてのキャプチャプローブについてすべてのRGDの数値平均を計算することを備える、請求項52に記載の前記方法。
  55. ノイズの多いプローブについての前記RGD値は、試料についてRGDを計算する際に含まれない、請求項52に記載の前記方法。
  56. 前記キャプチャプローブについての前記RGDは、各キャプチャプローブについての前記RGDをプローブ特異的な正規化されたリードカウントに変換することによって実験群中のすべての試料にわたり正規化され、
    前記プローブ特異的な正規化されたリードカウントは、
    (i)試料中の各キャプチャプローブRGDに正規化定数を乗算することであって、そこで前記正規化定数はいずれかの実数を含む、前記乗算すること、及び
    (ii)前記対応する試料について計算される前記RGDで(i)の前記積を除算すること、または
    (iii)1サブセットのプローブから計算される平均RGDで(i)の前記積を除算すること、
    を備える、請求項51から55のいずれかに記載の前記方法。
  57. 前記1サブセットのプローブは、1セットの対照プローブである、請求項56に記載の前記方法。
  58. 前記プローブ特異的な、正規化されたリードカウントは、コピー数値に変換され、
    前記コピー数値は、
    (i).女性に由来する試料において、常染色体及び/またはX連鎖領域を対象とするプローブの前記プローブ特異的な、正規化されたリードカウントに2を乗算すること、
    (ii).男性に由来する試料において、Y連鎖領域及び/またはX連鎖領域を対象とするプローブの前記プローブ特異的な、正規化されたリードカウントに1を乗算すること、
    (iii).実験中に、すべての試料にわたり(i)及び/または(ii)の前記積を平均すること、ならびに
    (iv).(iii)の前記平均値で(i)及び/または(ii)の前記積を除算すること、
    を備える、請求項57に記載の前記方法。
  59. 特異的な遺伝子を標的にするすべてのプローブについて前記近似したコピー数値は、平均される、請求項58に記載の前記方法。
  60. コピー数増加及びコピー数減少の高感度検出方法であって、
    (i)キャプチャプローブについてRGDを測定すること、
    (ii)前記キャプチャプローブについての前記RGDをプローブ特異的な、正規化されたリードカウントに変換することによって、実験群中にすべての試料にわたり前記キャプチャプローブについての前記RGDを正規化すること、
    (iii)各プローブ特異的な、正規化されたリードカウントについて近似したコピー数値を計算すること、及び
    (iv)特異的な遺伝子を標的にするすべてのプローブについて前記近似したコピー数値を平均すること、
    を備える、前記方法。
  61. 染色体安定性を測定する方法であって、
    (i)1セットの1つ以上の染色体安定性プローブを設計し、妥当性確認することであって、前記染色体安定性プローブはヒト染色体にわたり均一に分布する、前記妥当性確認すること、
    (ii)前記1つ以上の染色体安定性プローブを使用して患者試料上で標的シーケンシングを実施すること、
    (iii)各染色体プローブについて近似したコピー数値を決定すること、
    (iv)患者試料のゲノム表現型を決定することであって、そこで前記患者試料中の1つ以上の染色体プローブについて前記コピー数値における増減はゲノム不安定性を示すこと、
    を備える、前記方法。
  62. それを必要とする被験体中の癌を処置する方法であって、
    前記被験体は請求項61の前記方法に従い、不安定化されたゲノムを含むと識別され、
    前記癌を処置する前記方法は薬学的に有効量のPARP阻害剤を投与する、
    ことを備える、前記方法。
  63. 前記関心領域は、遺伝子、または前記遺伝子の一部である、先行請求項のいずれか1項に記載の前記方法。
  64. 前記遺伝子は、疾患と関連する、請求項63に記載の前記方法。
  65. 前記疾患は、癌である、請求項64に記載の前記方法。
  66. 前記遺伝子は、BRCA2、ATM、BRCA1、BRIP1、CHEK2、FANCA、HDAC2、及び/またはPALB2である、請求項63に記載の前記方法。
  67. 複数のDNAライブラリ断片を含むゲノムDNAライブラリであって、
    前記DNAライブラリ断片のそれぞれはアダプタ及びゲノムDNA断片を含み、
    前記アダプタは増幅領域、試料タグ領域、及びアンカー領域を含むDNAポリヌクレオチドであり、
    前記増幅領域はPCR増幅についてプライマー認識部位として機能することが可能であるポリヌクレオチド配列を含み、
    前記試料タグは前記ユニークライブラリDNA断片の一致度を符号化し、前記試験試料の一致度を符号化するポリヌクレオチド配列を含み、
    前記アンカー領域は前記試験試料の前記一致度を符号化するポリヌクレオチド配列を含み、前記アンカー領域は前記ゲノムDNA断片に付着することが可能である、
    前記ゲノムDNAライブラリ。
  68. 前記試料タグは、ユニーク分子識別子(UMI)をさらに含み、前記UMIは、前記ユニークゲノムDNA断片の前記同定を容易にする、請求項67に記載の前記ゲノムDNAライブラリ。
  69. 前記増幅領域は、10から50の間のヌクレオチド長にある、請求項67または68に記載の前記ゲノムDNAライブラリ。
  70. 前記増幅領域は、25ヌクレオチド長にある、請求項69に記載の前記ゲノムDNAライブラリ。
  71. 前記試料タグは、5から50の間のヌクレオチド長にある、先行請求項のうちのいずれか1項に記載の前記ゲノムDNAライブラリ。
  72. 前記試料タグは、8ヌクレオチド長にある、請求項71に記載の前記ゲノムDNAライブラリ。
  73. 前記UMI増倍管は、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれる、請求項67から72のうちのいずれか1項に記載の前記ゲノムDNAライブラリ。
  74. 前記UMI増倍管は、1から5の間のヌクレオチド長にある、請求項73に記載の前記ゲノムDNAライブラリ。
  75. 前記アンカー領域は、1から50の間のヌクレオチド長にある、先行請求項のうちのいずれか1項に記載の前記ゲノムDNAライブラリ。
  76. 前記アンカー領域は、10ヌクレオチド長にある、請求項75に記載の前記ゲノムDNAライブラリ。
  77. 前記複数のアダプタの各アダプタの前記増幅領域は、同一のヌクレオチド配列を含む、請求項67から76のいずれか1項に記載の前記ゲノムDNAライブラリ。
  78. 前記試料タグの各ヌクレオチド配列は、少なくとも2のハミング距離によって前記試料の前記ヌクレオチド配列のいずれかの他の配列から分離する、請求項67から77のいずれか1項に記載の前記ゲノムDNAライブラリ。
  79. 前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれるUMI増倍管を備える、請求項67から78のいずれか1項に記載の前記ゲノムDNAライブラリ。
  80. 前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接するUMI増倍管を備える、請求項67から78のいずれか1項に記載の前記ゲノムDNAライブラリ。
  81. 前記複数のアダプタの各アダプタの前記アンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の前記4個のアンカー領域のうちの1個のみに対合される、請求項67から78のいずれか1項に記載の前記ゲノムDNAライブラリ。
  82. 前記複数のアダプタの各アダプタの前記増幅領域は、同一のヌクレオチド配列を含み、
    前記複数のアダプタの各アダプタの前記試料タグ領域は、8ヌクレオチド長にあり、前記複数のアダプタの各アダプタの前記試料タグ領域は、少なくとも2のハミング距離によって前記複数のアダプタの前記試料タグのいずれかの他のヌクレオチド配列から分離し、
    前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれるUMI増倍管を備え、前記複数のアダプタの各アダプタの前記UMI増倍管は、3ヌクレオチド長にあり、それぞれの前記可能なヌクレオチド配列の前記UMI増倍管は、前記複数のアダプタの前記試料タグ領域のそれぞれに対合され、
    前記複数のアダプタの各アダプタの前記アンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、
    所与の配列の各試料領域は、所与の配列の前記4個のアンカー領域のうちの1個のみに対合される、
    請求項67に記載の前記ゲノムDNAライブラリ。
  83. 前記ゲノムDNA断片は、cfDNAである、請求項67から82のいずれかに記載の前記ゲノムDNAライブラリ。
  84. 請求項67から83のいずれか1項に従い、1個より多いゲノムライブラリを含む、複数のゲノムDNAライブラリ。
  85. 前記複数のゲノムDNAライブラリに属する1個のゲノムDNAライブラリの前記試料タグ領域の前記核酸配列は、前記複数のゲノムDNAライブラリに属する他のゲノムDNAライブラリの前記試料タグ領域の前記核酸配列と異なる、請求項84に記載の前記複数のゲノムDNAライブラリ。
  86. 前記複数のゲノムDNAライブラリに属する1個のゲノムDNAライブラリの前記増幅領域の前記核酸配列は、前記複数のゲノムDNAライブラリに属する他のゲノムDNAライブラリの前記増幅領域の前記核酸配列に同一である、請求項84または85に記載の前記複数のゲノムDNAライブラリ。
  87. 無細胞DNA(cfDNA)のDNA標的領域の遺伝子解析方法であって、
    (a)請求項67から86のいずれかに記載の前記DNAライブラリを生成すること、
    (b)DNA標的領域に特異的に結着する複数のキャプチャプローブと前記cfDNAライブラリを接触させることにより、前記DNA標的領域を含む前記キャプチャプローブとDNAライブラリ断片との間に複合体を形成すること、及び
    (c)前記DNA標的領域を含む前記cfDNA断片の定量的遺伝子解析を実施すること、
    を備え
    それらにより、前記DNA標的領域の遺伝子解析を実施する、
    前記遺伝子解析方法。
  88. 被験体における遺伝性疾患を予測する、診断する、または監視する方法であって、
    (a)前記被験体から試験試料を得ることと、
    (b)前記試験試料からゲノムDNAを単離することと、
    (c)複数のDNAライブラリ断片を含むDNAライブラリを生成することであって、前記DNAライブラリ断片のそれぞれは前記試験試料からのゲノムDNA断片、及びアダプタを含む、前記生成することと、
    (d)DNA標的領域に特異的に結着する複数のキャプチャプローブと前記cfDNAライブラリを接触させることにより、前記DNA標的領域を含む前記キャプチャプローブとDNAライブラリ断片との間に複合体を形成することと、
    (e)前記cfDNAクローンライブラリにおける前記遺伝性疾患に関連する1つ以上の標的遺伝子座の定量的遺伝子解析を実施することであって、前記1つ以上の標的遺伝子座における1つ以上の遺伝子損傷の前記同定または検出は前記遺伝性疾患の前記進行の予後判定、診断、または監視である、前記実施することと、
    を含む前記方法。
  89. 前記定量的遺伝子解析は、複数のシーケンシングリードを生成するためのDNAシーケンシングを含む、請求項87または88に記載の前記方法。
  90. ユニークゲノムDNA断片の一致度、及び試験試料の一致度を符号化する1セットのアダプタであって、ゲノムDNAライブラリを生成する際の使用のために、
    前記1セットのアダプタ中の各アダプタは増幅領域、試料タグ領域、及びアンカー領域を含むDNAポリヌクレオチドであり、
    前記増幅領域はPCR増幅についてプライマー認識部位として機能することが可能であるポリヌクレオチド配列を含み、
    前記試料タグは前記ユニークライブラリDNA断片の前記一致度を符号化し、前記試験試料の前記一致度を符号化するポリヌクレオチド配列を含み、
    前記アンカー領域は前記試験試料の前記一致度を符号化するポリヌクレオチド配列を含み、前記アンカー領域は前記ゲノムDNA断片に付着することが可能である、
    前記1セットのアダプタ。
  91. 前記試料タグは、ユニーク分子識別子(UMI)をさらに含み、前記UMIは、前記ユニークゲノムDNA断片の前記同定を容易にする、請求項90に記載の前記1セットのアダプタ。
  92. 前記増幅領域は、10から50の間のヌクレオチド長にある、請求項90または91に記載の前記1セットのアダプタ。
  93. 前記増幅領域は、25ヌクレオチド長にある、請求項90から92のいずれか1項に記載の前記1セットのアダプタ。
  94. 前記試料タグは、5から50の間のヌクレオチド長にある、先行請求項のいずれか1項に記載の前記1セットのアダプタ。
  95. 前記試料タグは、8ヌクレオチド長にある、請求項94に記載の前記1セットのアダプタ。
  96. 前記UMI増倍管は、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれる、請求項90から95のいずれか1項に記載の前記1セットのアダプタ。
  97. 前記UMI増倍管は、1から5の間のヌクレオチド長にある、請求項96に記載の前記1セットのアダプタ。
  98. 前記アンカー領域は、1から50の間のヌクレオチド長にある、請求項90から97に記載の前記1セットのアダプタ。
  99. 前記アンカー領域は、10ヌクレオチド長にある、請求項98に記載の前記1セットのアダプタ。
  100. 前記複数のアダプタの各アダプタの前記増幅領域は、同一のヌクレオチド配列を含む、請求項90から99のいずれかに記載の前記1セットのアダプタ。
  101. 前記試料タグの各ヌクレオチド配列は、少なくとも2のハミング距離によって前記1セットのアダプタの前記試料タグのいずれかの他のヌクレオチド配列から分離する、請求項100に記載の前記1セットのアダプタ。
  102. 前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれるUMI増倍管を備える、請求項90から101のいずれか1項に記載の前記1セットのアダプタ。
  103. 前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接するUMI増倍管を備える、請求項90から101のいずれか1項に記載の前記1セットのアダプタ。
  104. 前記複数のアダプタの各アダプタの前記アンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、所与の配列の各試料領域は、所与の配列の前記4個のアンカー領域のうちの1個のみに対合される、請求項103に記載の前記1セットのアダプタ。
  105. 前記複数のアダプタの各アダプタの前記増幅領域は、同一のヌクレオチド配列を含み、
    各アダプタの前記試料タグ領域は、8ヌクレオチド長にあり、前記試料タグの各ヌクレオチド配列は、少なくとも2のハミング距離によって前記1セットのアダプタの前記試料タグのいずれかの他のヌクレオチド配列から分離し、
    前記複数のアダプタのそれぞれは、前記試料タグ領域に隣接する、または前記試料タグ領域内に含まれるUMI増倍管を備え、前記複数のアダプタの各アダプタの前記UMI増倍管は、3ヌクレオチド長にあり、前記UMI増倍管は、64個の可能なヌクレオチド配列のうちの1個を含み、それぞれの前記64個の可能なヌクレオチド配列の前記UMI増倍管は、前記複数のアダプタの前記試料タグ領域のそれぞれに対合され、
    前記複数のアダプタの各アダプタの前記アンカータグ領域は、4個のヌクレオチド配列のうちの1個を含み、
    所与の配列の各試料領域は、所与の配列の前記4個のアンカー領域のうちの1個のみに対合される、
    請求項90から104のいずれか1項に記載の前記1セットのアダプタ。
JP2019511456A 2016-08-25 2017-08-24 Dna試料中のゲノムコピー変化の検出方法 Active JP7217224B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021180899A JP7304393B2 (ja) 2016-08-25 2021-11-05 Dna試料中のゲノムコピー変化の検出方法
JP2023044421A JP2023078336A (ja) 2016-08-25 2023-03-20 Dna試料中のゲノムコピー変化の検出方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662379593P 2016-08-25 2016-08-25
US62/379,593 2016-08-25
US201762481538P 2017-04-04 2017-04-04
US62/481,538 2017-04-04
PCT/US2017/048434 WO2018039463A1 (en) 2016-08-25 2017-08-24 Methods for the detection of genomic copy changes in dna samples

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021180899A Division JP7304393B2 (ja) 2016-08-25 2021-11-05 Dna試料中のゲノムコピー変化の検出方法

Publications (3)

Publication Number Publication Date
JP2019526257A true JP2019526257A (ja) 2019-09-19
JP2019526257A5 JP2019526257A5 (ja) 2020-08-20
JP7217224B2 JP7217224B2 (ja) 2023-02-02

Family

ID=61245331

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019511456A Active JP7217224B2 (ja) 2016-08-25 2017-08-24 Dna試料中のゲノムコピー変化の検出方法
JP2021180899A Active JP7304393B2 (ja) 2016-08-25 2021-11-05 Dna試料中のゲノムコピー変化の検出方法
JP2023044421A Pending JP2023078336A (ja) 2016-08-25 2023-03-20 Dna試料中のゲノムコピー変化の検出方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2021180899A Active JP7304393B2 (ja) 2016-08-25 2021-11-05 Dna試料中のゲノムコピー変化の検出方法
JP2023044421A Pending JP2023078336A (ja) 2016-08-25 2023-03-20 Dna試料中のゲノムコピー変化の検出方法

Country Status (12)

Country Link
US (2) US11319594B2 (ja)
EP (1) EP3504347A4 (ja)
JP (3) JP7217224B2 (ja)
KR (2) KR20230035431A (ja)
CN (2) CN109804080B (ja)
AU (1) AU2017315769B2 (ja)
BR (1) BR112019003704A2 (ja)
CA (1) CA3034649A1 (ja)
MX (1) MX2019002093A (ja)
RU (1) RU2019108294A (ja)
SG (1) SG11201901371XA (ja)
WO (1) WO2018039463A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022023213A (ja) * 2016-08-25 2022-02-07 レゾリューション バイオサイエンス, インコーポレイテッド Dna試料中のゲノムコピー変化の検出方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6913089B2 (ja) 2015-11-11 2021-08-04 レゾリューション バイオサイエンス, インコーポレイテッド Dnaライブラリーの高効率構築
JP2021514663A (ja) * 2018-03-08 2021-06-17 セント・ジョーンズ・ユニバーシティSt. Johns University 循環性血清無細胞dnaバイオマーカー及び方法
AU2019351130A1 (en) 2018-09-27 2021-04-08 Grail, Llc Methylation markers and targeted methylation probe panel
CN111118610A (zh) * 2018-10-31 2020-05-08 深圳华大基因股份有限公司 用于基因突变高深度测序的基因芯片及其制备方法和应用
CN112930407A (zh) * 2018-11-02 2021-06-08 加利福尼亚大学董事会 使用非人类核酸诊断和治疗癌症的方法
KR102452413B1 (ko) * 2019-08-19 2022-10-11 주식회사 지씨지놈 핵산 단편간 거리 정보를 이용한 염색체 이상 검출 방법
US20230178182A1 (en) * 2019-08-19 2023-06-08 Green Cross Genome Corporation Method for detecting chromosomal abnormality by using information about distance between nucleic acid fragments
KR102184277B1 (ko) * 2020-01-16 2020-11-30 성균관대학교산학협력단 초음파 진단 및 dna 검사 일체형 ai 자가 건강 관리 장치 및 이를 이용한 원격 의료 진단 방법
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
CN113496760B (zh) * 2020-04-01 2024-01-12 深圳华大基因科技服务有限公司 基于第三代测序的多倍体基因组组装方法和装置
CN113113085B (zh) * 2021-03-15 2022-08-19 杭州杰毅生物技术有限公司 基于智能宏基因组测序数据肿瘤检测的分析系统及方法
GB202108237D0 (en) * 2021-06-09 2021-07-21 Univ London Cancer methods
CN114649094B (zh) * 2022-03-30 2022-11-15 广东省人民医院 一种基于核磁共振的乳腺癌多参数临床决策辅助装置
CA3230267A1 (en) 2022-08-04 2024-02-08 Nam Hoon Hur Battery pack

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140100792A1 (en) * 2012-10-04 2014-04-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014055790A2 (en) * 2012-10-04 2014-04-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20140242581A1 (en) * 2013-01-23 2014-08-28 Reproductive Genetics And Technology Solutions, Llc Compositions and methods for genetic analysis of embryos
US20150111757A1 (en) * 2013-10-18 2015-04-23 Good Start Genetics, Inc. Methods for determining carrier status
WO2016022833A1 (en) * 2014-08-06 2016-02-11 Nugen Technologies, Inc. Digital measurements from targeted sequencing
WO2016028316A1 (en) * 2014-08-22 2016-02-25 Resolution Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna

Family Cites Families (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5591582A (en) 1985-07-23 1997-01-07 The Board Of Rijks Universiteit Leiden Methods for detecting activated RAS oncogenes
US5888731A (en) 1995-08-30 1999-03-30 Visible Genetics Inc. Method for identification of mutations using ligation of multiple oligonucleotide probes
CA2268368A1 (en) 1997-08-28 1999-03-11 The Perkin-Elmer Corporation Improved detection of mutations in nucleic acids by chemical cleavage
US6480791B1 (en) 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
US6812341B1 (en) 2001-05-11 2004-11-02 Ambion, Inc. High efficiency mRNA isolation methods and compositions
AU2002365028A1 (en) 2001-07-17 2003-06-30 Stratagene Methods for detection of a target nucleic acid using multi-subunit probes
AU2002322518A1 (en) 2001-08-31 2003-03-18 Rosetta Inpharmactis Llc Methods for preparing nucleic acid samples
US7361821B2 (en) 2002-09-20 2008-04-22 Intel Corporation Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading
AU2003284420A1 (en) 2002-12-11 2004-06-30 Keio University Method of constructing assigned molecule and library comprising the same and method of using the same
TW200506052A (en) 2003-05-07 2005-02-16 Takara Bio Inc Method of analyzing DNA region
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
EP2476761A3 (en) 2005-07-07 2012-10-17 Athlomics Pty Ltd Polynucleotide marker genes and their expression, for diagnosis of endotoxemia
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP1989318B1 (en) 2006-01-06 2014-07-30 Agilent Technologies, Inc. Reaction buffer composition for nucleic acid replication with packed dna polymerases
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US8383338B2 (en) 2006-04-24 2013-02-26 Roche Nimblegen, Inc. Methods and systems for uniform enrichment of genomic regions
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
EP2076609A1 (en) 2006-10-10 2009-07-08 Illumina Inc. Compositions and methods for representational selection of nucleic acids fro complex mixtures using hybridization
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
US8067164B2 (en) 2007-08-12 2011-11-29 Integrated Dna Technologies, Inc. Microarray system with improved sequence specificity
US9388457B2 (en) 2007-09-14 2016-07-12 Affymetrix, Inc. Locus specific amplification using array probes
EP2227563B1 (en) 2007-12-05 2012-06-06 Complete Genomics, Inc. Efficient base determination in sequencing reactions
WO2009091798A1 (en) 2008-01-16 2009-07-23 Helicos Biosciences Corporation Quantitative genetic analysis
US8202691B2 (en) 2008-01-25 2012-06-19 Illumina, Inc. Uniform fragmentation of DNA using binding proteins
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
WO2010038042A1 (en) 2008-10-02 2010-04-08 Illumina Cambridge Ltd. Nucleic acid sample enrichment for sequencing applications
WO2010068856A1 (en) 2008-12-11 2010-06-17 Trustees Of Boston University Isolation of rna
CN103952482A (zh) 2009-04-02 2014-07-30 弗卢伊蒂格姆公司 用于对目标核酸进行条形码化的多引物扩增方法
WO2010127186A1 (en) 2009-04-30 2010-11-04 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US20110003301A1 (en) 2009-05-08 2011-01-06 Life Technologies Corporation Methods for detecting genetic variations in dna samples
ES2595055T3 (es) 2009-08-25 2016-12-27 Illumina, Inc. Métodos para seleccionar y amplificar polinucleótidos
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US10378064B1 (en) 2010-04-16 2019-08-13 Chronix Biomedical Analyzing circulating nucleic acids to identify a biomarker representative of cancer presented by a patient population
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US8828688B2 (en) 2010-05-27 2014-09-09 Affymetrix, Inc. Multiplex amplification methods
US20110319290A1 (en) 2010-06-08 2011-12-29 Nugen Technologies, Inc. Methods and Compositions for Multiplex Sequencing
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
EP3572528A1 (en) 2010-09-24 2019-11-27 The Board of Trustees of the Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
KR102040307B1 (ko) 2010-11-30 2019-11-27 더 차이니즈 유니버시티 오브 홍콩 암과 연관된 유전적 또는 분자적 이상들의 검출
AU2011352070A1 (en) 2010-12-30 2013-07-18 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
HUE050032T2 (hu) 2011-04-12 2020-11-30 Verinata Health Inc Genomfrakciók feloldása polimorfizmus-szám alkalmazásával
EP3246416A1 (en) 2011-04-15 2017-11-22 The Johns Hopkins University Safe sequencing system
WO2013056178A2 (en) 2011-10-14 2013-04-18 Foundation Medicine, Inc. Novel estrogen receptor mutations and uses thereof
CN103103624B (zh) 2011-11-15 2014-12-31 深圳华大基因科技服务有限公司 高通量测序文库的构建方法及其应用
US10227587B2 (en) 2012-01-10 2019-03-12 Berry Genomics Co., Ltd. Method for constructing a plasma DNA sequencing library
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
ES2828661T3 (es) 2012-03-20 2021-05-27 Univ Washington Through Its Center For Commercialization Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria
US20130288915A1 (en) 2012-04-27 2013-10-31 Htg Molecular Diagnostics, Inc. Compositions and methods for alk molecular testing
WO2013181170A1 (en) 2012-05-31 2013-12-05 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
AU2013286635B2 (en) 2012-07-03 2018-11-08 Foundation Medicine, Inc. Tm-enhanced blocking oligonucleotides and baits for improved target enrichment and reduced off-target selection
WO2014020502A2 (en) 2012-07-31 2014-02-06 Novartis Ag Markers associated with human double minute 2 inhibitors
WO2014022830A2 (en) 2012-08-03 2014-02-06 Foundation Medicine, Inc. Human papilloma virus as predictor of cancer prognosis
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
KR102028375B1 (ko) 2012-09-04 2019-10-04 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
CA2886605A1 (en) 2012-09-28 2014-04-03 Cepheid Two-primer pcr for microrna multiplex assay
US20150291953A1 (en) 2012-11-02 2015-10-15 Enzymatics Inc. Methods and kits for nucleic acid sample preparation for sequencing
CA2890207A1 (en) 2012-11-05 2014-05-08 Foundation Medicine, Inc. Novel ntrk1 fusion molecules and uses thereof
US9932576B2 (en) 2012-12-10 2018-04-03 Resolution Bioscience, Inc. Methods for targeted genomic analysis
EP2931922B1 (en) 2012-12-14 2018-10-17 Chronix Biomedical Personalized biomarkers for cancer
US11158425B2 (en) 2013-01-05 2021-10-26 Foundation Medicine, Inc. System and method for managing genomic information
WO2014122288A1 (en) 2013-02-08 2014-08-14 Qiagen Gmbh Method for separating dna by size
ES2946689T3 (es) 2013-03-15 2023-07-24 Univ Leland Stanford Junior Identificación y uso de marcadores tumorales de ácido nucleico circulante
US10017807B2 (en) 2013-03-15 2018-07-10 Verinata Health, Inc. Generating cell-free DNA libraries directly from blood
EP2994847A4 (en) 2013-05-10 2017-04-19 Foundation Medicine, Inc. Analysis of genetic variants
US20150072344A1 (en) 2013-09-10 2015-03-12 Imdaptive Incorporated Barcoded Universal Marker Indicator (BUMI) Tags
WO2015073711A1 (en) 2013-11-13 2015-05-21 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
CN103668471B (zh) 2013-12-19 2015-09-30 上海交通大学 一种构建dna高通量测序文库的方法及其配套试剂盒
AU2014369841B2 (en) 2013-12-28 2019-01-24 Guardant Health, Inc. Methods and systems for detecting genetic variants
JP6723929B2 (ja) 2014-01-31 2020-07-15 スウィフト バイオサイエンシズ, インク.Swift Biosciences, Inc. Dna基質を処理するための改善された方法
WO2015134552A1 (en) 2014-03-03 2015-09-11 Swift Biosciences, Inc. Enhanced adaptor ligation
US10975371B2 (en) * 2014-04-29 2021-04-13 Illumina, Inc. Nucleic acid sequence analysis from single cells
KR20170026383A (ko) 2014-06-26 2017-03-08 10엑스 제노믹스, 인크. 핵산 서열의 분석
US20160053301A1 (en) 2014-08-22 2016-02-25 Clearfork Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
CN106661636A (zh) 2014-09-05 2017-05-10 凯杰有限公司 衔接子连接的扩增子的制备
ES2925014T3 (es) 2014-09-12 2022-10-13 Univ Leland Stanford Junior Identificación y uso de ácidos nucleicos circulantes
US9890375B2 (en) 2014-09-12 2018-02-13 Bgi Shenzhen Co., Limited Isolated oligonucleotide and use thereof in nucleic acid sequencing
CA2967447A1 (en) 2014-12-05 2016-06-09 Foundation Medicine, Inc. Multigene analysis of tumor samples
MA40939A (fr) 2014-12-12 2017-10-18 Verinata Health Inc Utilisation de la taille de fragments d'adn acellulaire pour déterminer les variations du nombre de copies
EP3766986B1 (en) 2014-12-31 2022-06-01 Guardant Health, Inc. Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
PT3256605T (pt) 2015-02-10 2022-03-17 Univ Hong Kong Chinese Deteção de mutações para rastreio de cancro e análise fetal
TWI730973B (zh) 2015-07-23 2021-06-21 香港中文大學 游離dna(cell-free dna)之片段化模式分析
CN108474040B (zh) 2015-10-09 2023-05-16 夸登特健康公司 使用无细胞dna的基于群体的治疗推荐
EP3359695B1 (en) 2015-10-10 2020-04-15 Guardant Health, Inc. Methods and applications of gene fusion detection in cell-free dna analysis
JP6913089B2 (ja) 2015-11-11 2021-08-04 レゾリューション バイオサイエンス, インコーポレイテッド Dnaライブラリーの高効率構築
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
MX2018010362A (es) 2016-02-29 2019-03-28 Found Medicine Inc Metodos y sistemas para evaluar carga mutacional de tumores.
WO2017214557A1 (en) 2016-06-10 2017-12-14 Counsyl, Inc. Nucleic acid sequencing adapters and uses thereof
RU2019108294A (ru) 2016-08-25 2020-09-25 Резолюшн Байосайенс, Инк. Способы обнаружения изменений количества геномных копий в образцах днк
CA3027919C (en) 2016-09-30 2023-02-28 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
IL266654B2 (en) 2016-11-17 2024-03-01 Lgc Clinical Diagnostics Inc Methods for preparing reference material for DNA and controls
EP3551769A4 (en) 2016-12-09 2020-10-28 Boreal Genomics, Inc. LINKED LIGATURE
CA3057163A1 (en) 2017-04-14 2018-10-18 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
JP2022513124A (ja) 2018-11-21 2022-02-07 アヴィダ バイオメッド, インコーポレイテッド 標的化された核酸ライブラリー形成のための方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140100792A1 (en) * 2012-10-04 2014-04-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014055790A2 (en) * 2012-10-04 2014-04-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20140242581A1 (en) * 2013-01-23 2014-08-28 Reproductive Genetics And Technology Solutions, Llc Compositions and methods for genetic analysis of embryos
US20150111757A1 (en) * 2013-10-18 2015-04-23 Good Start Genetics, Inc. Methods for determining carrier status
WO2016022833A1 (en) * 2014-08-06 2016-02-11 Nugen Technologies, Inc. Digital measurements from targeted sequencing
WO2016028316A1 (en) * 2014-08-22 2016-02-25 Resolution Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022023213A (ja) * 2016-08-25 2022-02-07 レゾリューション バイオサイエンス, インコーポレイテッド Dna試料中のゲノムコピー変化の検出方法
JP7304393B2 (ja) 2016-08-25 2023-07-06 レゾリューション バイオサイエンス, インコーポレイテッド Dna試料中のゲノムコピー変化の検出方法

Also Published As

Publication number Publication date
EP3504347A1 (en) 2019-07-03
SG11201901371XA (en) 2019-03-28
AU2017315769A1 (en) 2019-03-21
RU2019108294A (ru) 2020-09-25
JP7217224B2 (ja) 2023-02-02
WO2018039463A1 (en) 2018-03-01
CA3034649A1 (en) 2018-03-01
JP7304393B2 (ja) 2023-07-06
KR102505122B1 (ko) 2023-03-08
EP3504347A4 (en) 2020-04-29
JP2023078336A (ja) 2023-06-06
JP2022023213A (ja) 2022-02-07
US20220325353A1 (en) 2022-10-13
CN109804080A (zh) 2019-05-24
CN109804080B (zh) 2023-07-21
BR112019003704A2 (pt) 2019-05-28
AU2017315769B2 (en) 2024-02-01
KR20190041510A (ko) 2019-04-22
KR20230035431A (ko) 2023-03-13
US11319594B2 (en) 2022-05-03
US20180163272A1 (en) 2018-06-14
CN117286217A (zh) 2023-12-26
MX2019002093A (es) 2019-06-20

Similar Documents

Publication Publication Date Title
JP7304393B2 (ja) Dna試料中のゲノムコピー変化の検出方法
JP7318054B2 (ja) Dnaライブラリーの高効率構築
JP6709778B2 (ja) 無細胞DNA(cfDNA)の定量的遺伝子解析のための方法
US20180179578A1 (en) Methods for quantitative genetic analysis of cell free dna
US20220073906A1 (en) Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis
JP7441584B2 (ja) 無細胞DNA(cfDNA)の定量的遺伝子解析のための方法
KR20240004397A (ko) 다중 라이브러리의 동시 유전자 분석을 위한 조성물 및 방법
NZ791679A (en) Methods for the detection of genomic copy changes in dna samples

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200707

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220711

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220711

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20220726

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220825

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230123

R150 Certificate of patent or registration of utility model

Ref document number: 7217224

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04