JP7256748B2 - エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法 - Google Patents

エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法 Download PDF

Info

Publication number
JP7256748B2
JP7256748B2 JP2019552077A JP2019552077A JP7256748B2 JP 7256748 B2 JP7256748 B2 JP 7256748B2 JP 2019552077 A JP2019552077 A JP 2019552077A JP 2019552077 A JP2019552077 A JP 2019552077A JP 7256748 B2 JP7256748 B2 JP 7256748B2
Authority
JP
Japan
Prior art keywords
sequence
nucleic acid
strand
double
damage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019552077A
Other languages
English (en)
Other versions
JP2020511966A5 (ja
JP2020511966A (ja
Inventor
スコット アール ケネディ
ジェシー ジェイ ソーク
マイケル ヒップ
エリザベス シュミット
ローザ アナ リスケス
ダニエラ ナシュマンソン
Original Assignee
ユニヴァーシティ オブ ワシントン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニヴァーシティ オブ ワシントン filed Critical ユニヴァーシティ オブ ワシントン
Publication of JP2020511966A publication Critical patent/JP2020511966A/ja
Publication of JP2020511966A5 publication Critical patent/JP2020511966A5/ja
Priority to JP2023057239A priority Critical patent/JP2023093499A/ja
Application granted granted Critical
Publication of JP7256748B2 publication Critical patent/JP7256748B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/119Double strand sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

関連出願の相互参照
本出願は、2017年3月23日に出願された米国仮特許出願第62/475,682号、および2017年10月23日に出願された、米国仮特許出願第62/575,958号の優先権を主張し、それらの開示は参照によりその全ての内容が本明細書に組み込まれる。
政府の利害に関する声明
本発明は、国立衛生研究所から授与された助成金番号R01 CA160674およびR01 CA181308、ならびに米国陸軍研究局から授与された助成金番号W911NF-15-2-0127の下で政府支援を受けてなされた。政府は、本発明において一定の権利を有する。
特定のタイプの遺伝子分析、例えば法医学DNA分析へのこれまでのアプローチは、PCR増幅産物のキャピラリー電気泳動(CE)分離(PCR-CE)に依存して、短いタンデムリピート配列の長さの多型を識別する。このタイプの分析は、1991年頃に導入されて以来、非常に価値があることが証明されている。それ以来、いくつかの出版物は標準化されたプロトコールを導入し、世界中の研究室での使用を検証し、多くの異なる人種でのその使用を詳述し、miniSTRなどのより効率的なアプローチを導入してきた。
このアプローチは非常に成功していることが証明されているが、この技術にはその有用性を制限する多くの欠点を有している。例えば、STR遺伝子型決定に対する現在のアプローチでは、テンプレートDNA上のポリメラーゼの滑りによって引き起こされるPCRスタッターに起因するバックグラウンドシグナルをしばしば発生させ、最終的に完了した反応で異なる長さのPCR増幅産物の混合物をもたらす。この問題は、1つを超える寄与者による試料(例えば、異なるSTR長バリアントを持つ特定の遺伝子構成を含む異なる特定の個体に由来するDNAの混合物)において、スタッター対立遺伝子と本物の対立遺伝子を区別する困難さのために、特に重要である。分解されたDNA試料を分析するときに別の問題が発生する。損傷したDNAは、スタッターおよびPCRエラーの程度を悪化させる可能性がある。断片の長さの変動により、しばしば、より長いPCR断片が大幅に少なくなるか、または存在しなくなることさえある。結果として、分解されたDNAからのキャピラリー電気泳動図プロファイルは、しばしばより低い識別力を有する。
超並列配列決定(MPS、しばしば次世代DNA配列決定、NGSとしても知られる)システムの導入は、法医学分析におけるいくつかの困難な問題に対処する可能性がある。例えば、これらのプラットフォームは、識別力を劇的に増大させ、民族性および身体的属性(表現型)さえも決定する可能性を提供する、核およびミトコンドリアDNA(mtDNA)のSTRと一塩基多型(SNP)の同時分析を可能にするこれまでに比類のない能力を提供する。さらに、単純に分子の集合集団の平均遺伝子型を報告するPCR-CEとは異なり、MPS技術は、多くの個々のDNA分子の完全なヌクレオチド配列をデジタルで集計し、異種DNA混合物内のマイナー対立遺伝子頻度(MAF)を検出する独自の能力を提供する。2人以上の寄与者を含む法医学試料は、法医学で最も問題のある問題のうちの1つとして残るため、法医学の分野に対するMPSの影響は非常に大きくなり得る。
ヒトゲノムの発表は、MPSプラットフォームの計り知れない力を強調した。しかしながら、ごく最近まで、短いタンデムリピート(STR)座位よりも読取の長さが大幅に短く、長さに基づく遺伝子型決定をコールすることができないため、これらのプラットフォームの完全な力は法医学に限定されていた。当初、MPS Roche 454プラットフォームなどのパイロシーケンサーは、コア標準STR座位を配列決定するのに十分な読取の長さを持つ唯一のプラットフォームであった。しかしながら、競合する技術の読取の長さが増加しているため、法医学用途に対する有用性が発揮されている。全体として、これらの全ての研究の全般的な結果は、プラットフォームに関係なく、STRを正常に分類できるため、損傷した法医学試料からでもCE分析に匹敵する遺伝子型を生成できることである。
多くの研究は、従来のPCR-CEアプローチとの一致を示しており、STR内SNP(一塩基多型)の検出などの追加の利点も示しているが、現在の技術に関する多くの問題もまた強調している。例えば、STR遺伝子型決定に対する現在のMPSアプローチは、配列決定とPCRプライマーの導入に十分なDNAを提供するためのマルチプレックスPCRに依存している。しかしながら、マルチプレックスPCRキットはPCR-CE用に設計されているため、様々なサイズの増幅産物のためのプライマーが含まれている。この変動により、小さな断片が増幅されるバイアスを有して包含が不均衡になり、対立遺伝子が脱落する可能性がある。実際、最近の研究では、特に低MAFにおいて、PCR効率の相違が混合物成分に影響を及ぼすことが示されている。
PCR-CEと同様に、MPSはPCRスタッターの発生に影響されない。STRに関するMPS研究の大部分は、人工的なドロップイン対立遺伝子の発生を報告している。最近、体系的なMPSの研究は、多くのスタッター事象が、4塩基対単位の真の対立遺伝子と異なり、最も一般的にn-4であるが、n-8およびn-12の位置もまた観察される、より短い長さの多型として現れることを報告している。スタッターのパーセントは通常、読取の約1%で発生したが、一部の座位では3%に達する可能性があり、MPSがPCR-CEよりも高い割合でスタッターを示す可能性があることを示している。
MPS用途におけるPCRに基づくエラーの影響を緩和するために、プロトコール開発、化学/生化学、およびデータ処理のレベルでの様々なアプローチが開発されている。さらに、個々のDNA断片から生じるPCRの複製を、固有のランダムなせん断点に基づいて、または外因性のタグ付け(すなわち、分子タグ、固有の分子識別子[UMI]および単一分子識別子[SMI]としても知られる分子バーコードの使用)によって、増幅前または増幅中に、解明することのできる技術は、一般的に使用されている。このアプローチは、DNAおよびRNAテンプレートの計数精度を改善するために使用されている。単一の開始分子に由来する全ての増幅産物を明示的に識別することができるため、同一のタグの付いた配列決定読取の配列の変動を使用して、PCRまたは配列決定中に生じる塩基のエラーを訂正できる。例えば、Kinde,et al.(Proc Natl Acad Sci USA 108,9530-9535,2011)は、一本鎖分子バーコード付けを使用して、バーコード配列決定を共有するPCRコピーをグループ化し、コンセンサスを形成することにより、配列決定のエラー率を低減するSafeSeqSを導入した。このアプローチにより、点変異の平均検出限界は0.5%になるが、そのSTR座位に対する有効性は広く評価されていない。
最近報告された別のアプローチであるMIPSTRは、STR座位に隣接する配列に特異的にアニールする単一分子の分子反転プローブ(smMIP)によるSTR座位の標的化捕捉を使用する。smMIPの3’末端のポリメラーゼ伸長後、末端をライゲートし、PCR増幅および配列決定に供する。STR座位の隣接領域に特異的なMIPを使用すると、標的特異性が大幅に向上し、STR座位の遺伝子型決定の精確さが向上する。しかしながら、Safe-SeqSと同様に、一本鎖分子バーコードを組み込んでも、「ジャックポット」事象として派生コピーに持ち込まれる増幅の最初の回で生じるPCRアーティファクトを完全に排除することができない。
STR座位、一塩基多型(SNP)座位、および他の多くの形態の変異および遺伝的バリアントのより精確な遺伝子型決定の方法は、法医学、医学、科学産業の様々な用途において望まれている。しかしながら、課題は、最大の信頼性を備えつつ、合理的な費用によって、可能な限り多くの関連する配列決定される遺伝物質のコピーから、配列情報を最も効率的に生成する方法である。様々なコンセンサス配列決定法(分子バーコードに基づくものとそうでないものの両方)がエラー訂正に使用され、混合物中のバリアントをより適切に識別できるようになった(詳細な議論についてはJ.Salk et al,Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations,Nature Reviews Genetics,2018を参照されたい)が、性能には様々なトレードオフがある。我々は以前に、エラー訂正を目的として、二本鎖核酸分子の独立した鎖の配列決定を遺伝子型決定および比較することに依存する超高精度配列決定法であるデュプレックス配列決定について記載した。本明細書で明確に述べられる技術は、コスト効率、回収効率、およびその他の性能基準を改善する方法と、デュプレックス配列決定および関連するMPS配列決定方法の全体的なプロセス速度について説明する。
本技術は、概して、標的化核酸配列濃縮のための方法、およびエラー訂正核酸配列決定用途のためのそのような濃縮の使用に関する。いくつかの実施形態では、二本鎖核酸複合体中の一意的に標識された鎖の組み合わせを使用して、各鎖がその相補鎖に情報的に関連するが、各鎖の配列決定に続いてそれが区別されるか、またはそれに由来する増幅産物から区別されるようにして、核酸材料の非常に精確な、エラーが訂正された超並列配列決定が可能であり、この情報は、決定された配列のエラー訂正の目的で使用することができる。本技術のいくつかの態様は、標的化超高精度配列決定のための、コスト、配列決定された分子の変換、および標識分子を生成する時間効率を改善するための方法および組成物を提供する。いくつかの実施形態では、提供される方法および組成物は、非常に少量の核酸材料(例えば、犯罪現場から採取された試料または血液中に自由に浮遊する小さな臨床試料またはDNAからのもの)の精確な分析を可能にする。いくつかの実施形態では、提供される方法および組成物は、100個の細胞または分子に1個未満の頻度(例えば、1000個の細胞または分子に1個未満、1万個の細胞または分子に1個未満、10万個の細胞または分子に1個未満)で存在する核酸材料の試料における変異の検出を可能にする。
いくつかの実施形態では、本開示は、二本鎖核酸材料を提供するステップであって、核酸材料が、核酸材料の各々の鎖上の単一分子の識別子配列および核酸材料の各々の鎖の5’末端および3’末端のうちの少なくとも1つ上のアダプター配列を含み、第1のアダプター配列が核酸材料の第1の鎖の5’末端または3’末端のうちの1つ上に位置し、第2のアダプター配列が核酸材料の第2の鎖の反対側の末端上に位置し、第1の鎖と第2の鎖が、同一の二本鎖核酸材料を起源とする、提供するステップと、核酸材料を増幅するステップと、増幅した核酸材料を第1の試料と第2の試料とに分離するステップと、第1のアダプター配列に特異的なプライマーの使用を通じて第1の試料中の第1の鎖を増幅して第1の核酸産物をもたらすステップと、第2のアダプター配列に特異的なプライマーの使用を通じて第2の試料中の第2の鎖を増幅して第2の核酸産物をもたらすステップと、第1の核酸産物および第2核酸産物の各々を配列決定するステップと、第1の核酸産物の配列を第2の核酸産物の配列と比較するステップと、を含む方法を提供する。いくつかの実施形態では、核酸材料は、核酸材料の各々の鎖の5’末端および3’末端の各々にアダプター配列を含む。
いくつかの実施形態では、本開示は、1つ以上の二本鎖核酸分子を含む二本鎖核酸材料を提供することであって、各々の二本鎖核酸分子が、各々の鎖上の単一分子識別子配列と核酸分子の5’末端および/または3’末端のうちの少なくとも1つの上のアダプターとを含み、各々の核酸分子に対して、第1のアダプター配列が核酸分子の第1の鎖と関連し、第2のアダプター配列が核酸分子の第2の鎖と関連する、提供するステップと、核酸材料を増幅するステップと、増幅した核酸材料を第1の試料と第2の試料とに分離するステップと、第1のアダプター配列に特異的なプライマーの使用を通じて第1の試料中の第1の鎖を増幅して第1の核酸産物をもたらすステップと、第2のアダプター配列に特異的なプライマーの使用を通じて第2の試料中の第2の鎖を増幅して第2の核酸産物をもたらすステップと、第1の核酸産物および第2核酸産物の各々を配列決定するステップと、第1の核酸産物の配列を第2の核酸産物の配列と比較するステップと、を含む方法を提供する。いくつかの実施形態では、核酸材料は、核酸材料の各々の鎖の5’末端および3’末端の各々にアダプター配列を含む。
いくつかの実施形態では、本開示はまた、二本鎖核酸材料を提供するステップであって、核酸材料が、標的化エンドヌクレアーゼ(例えば、CRISPR関連(Cas)酵素/ガイドRNA複合体、例えば、Cas9またはCpf1、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ)による切断の結果として実質的に同様の長さ(約1~1,000,000塩基、約10~1,000塩基、または約100~500塩基の核酸材料の鎖をもたらすように切断されており、核酸材料が、核酸材料の各々の鎖上の単一分子の識別子配列および核酸材料の各々の鎖の5’末端および3’末端のうちの少なくとも1つ上のアダプター配列を含み、第1のアダプター配列が核酸材料の第1の鎖の5’末端または3’末端の1つ上に位置し、第2のアダプター配列が核酸材料の第2の鎖の反対側の末端上に位置し、第1の鎖と第2の鎖が、同一の二本鎖核酸材料を起源とする、提供するステップと、核酸材料を増幅するステップと、増幅した核酸材料を第1の試料と第2の試料とに分離するステップと、第1のアダプター配列に特異的なプライマーの使用を通じて第1の試料中の第1の鎖を増幅して第1の核酸産物をもたらすステップと、第2のアダプター配列に特異的なプライマーの使用を通じて第2の試料中の第2の鎖を増幅して第2の核酸産物をもたらすステップと、第1の核酸産物および第2核酸産物の各々を配列決定するステップと、第1の核酸産物の配列を第2の核酸産物の配列と比較するステップと、を含む方法を提供する。いくつかの実施形態では、核酸材料は、核酸材料の各々の鎖の5’末端および3’末端の各々にアダプター配列を含む。
いくつかの実施形態では、第1の核酸産物と第2の核酸産物の各々を配列決定することは、第1の鎖の配列読取を決定するために、第1の鎖のうちの少なくとも1つを配列決定するステップと、第2の鎖の配列読取を決定するための第2の鎖のうちの少なくとも1つを配列決定するステップと、第1の鎖の配列読取と第2の鎖の配列読取とを比較して、エラーが訂正された配列読取を生成するステップと、を含む。いくつかの実施形態では、エラーが訂正された配列読取は、第1の鎖の配列読取と第2の鎖の配列読取との間で一致するヌクレオチド塩基を含む。いくつかの実施形態では、エラーが訂正された配列読取の特定の位置で生じる変動が真のバリアントとして同定される。いくつかの実施形態では、第1の鎖の配列読取または第2の鎖の配列読取の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される。
いくつかの実施形態では、エラーが訂正された配列読取が、二本鎖標的核酸分子が由来する生物または対象における、がん、がんリスク、がん変異、がんの代謝状態、ミューテーターの表現型、発がん物質への暴露、毒素暴露、慢性炎症暴露、年齢、神経変性疾患、病原体、薬剤耐性バリアント、胎児分子、法医学に関連する分子、免疫学的に関連する分子、変異したT細胞受容体、変異したB細胞受容体、変異した免疫グロブリン遺伝子座、ゲノムのカタエギス部位、ゲノムの超変異部位、低頻度バリアント、サブクローンバリアント、少数の分子集団、混入源、核酸合成エラー、酵素修飾エラー、化学修飾エラー、遺伝子編集エラー、遺伝子治療エラー、核酸情報ストレージの断片、微生物の準種、ウイルスの準種、臓器移植、臓器移植拒絶、がん再発、治療後の残存がん、前がん状態、異形成状態、マイクロキメリズム状態、幹細胞移植状態、細胞療法状態、別の分子に付着した核酸標識、またはそれらの組み合わせを同定または特性評価するために使用される。いくつかの実施形態では、エラーが訂正された配列読取が、発がん性化合物または発がん物質への曝露を同定するために使用される。いくつかの実施形態では、エラーが訂正された配列読取が、変異原性化合物または変異原性への曝露を同定するために使用される。いくつかの実施形態では、核酸材料が法医学試料に由来し、エラーが訂正された配列読取が法医学分析で使用される。
いくつかの実施形態では、単一分子識別子配列が、内因性のせん断点またはせん断点に位置的に関連する可能性のある内因性の配列を含む。いくつかの実施形態では、単一分子識別子配列が、二本鎖核酸分子を一意的に標識する、縮重もしくは半縮重バーコード配列、核酸材料の1つ以上の核酸断片末端、またはそれらの組み合わせのうちの少なくとも1つである。いくつかの実施形態では、アダプターおよび/またはアダプター配列が、少なくとも部分的に非相補的であるか、または少なくとも1つの非標準塩基を含む少なくとも1つのヌクレオチド位置を含む。いくつかの実施形態では、アダプターが、約5個以上の自己相補型ヌクレオチドによって形成される単一の「U字型」オリゴヌクレオチド配列を含む。
様々な実施形態に従って、様々な核酸材料のうちのいずれかが使用され得る。いくつかの実施形態では、核酸材料は、標準的な糖リン酸骨格内のポリヌクレオチドに対する少なくとも1つの修飾を含んでもよい。いくつかの実施形態では、核酸材料は、核酸材料のいずれかの塩基内に少なくとも1つの修飾を含んでもよい。例えば、非限定的な例として、いくつかの実施形態では、核酸材料は、二本鎖DNA、二本鎖RNA、ペプチド核酸(PNA)、ロックド核酸(LNA)のうちの少なくとも1つであるか、またはそれを含む。
いくつかの実施形態では、提供するステップは、二本鎖核酸材料を少なくとも1つの二本鎖縮重バーコード配列にライゲートして、二本鎖核酸分子バーコード複合体を形成し、二本鎖縮重バーコード配列が、各々の鎖中に単一分子識別子配列を含む。
いくつかの実施形態では、第1の試料中の核酸材料を増幅することは、第1の鎖の第1のアダプター配列に特異的なプライマーと第1の鎖の非アダプター部分に特異的な第2のプライマーとの使用を通じて第1の試料中の第1の鎖を増幅して、第1の核酸産物をもたらすことを含む。いくつかの実施形態では、第2の鎖の第2のアダプター配列に特異的なプライマーと第2の鎖の非アダプター部分に特異的な第2のプライマーとの使用を通じて第2の試料中の第2の鎖を増幅して、第2の核酸産物をもたらす。
いくつかの実施形態では、第1の試料中の核酸材料を増幅することは、第1のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドとを使用して、単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む。
いくつかの実施形態では、第2のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドとを使用して、単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む。
いくつかの実施形態では、核酸材料を増幅することが、第1の鎖に由来する複数の増幅産物と、第2の鎖に由来する複数の増幅産物とを生成することを含む。
いくつかの実施形態では、提供される方法は、提供するステップの前に、実質的に既知の長さの標的核酸断片が形成されるように、1つ以上の標的化エンドヌクレアーゼにより核酸材料を切断するステップと、実質的に既知の長さに基づいて、標的核酸断片を単離するステップと、をさらに含む。いくつかの実施形態では、提供される方法は、提供するステップの前に、アダプター(例えば、アダプター配列)を標的核酸(例えば、標的核酸断片)にライゲートすることをさらに含む。
いくつかの実施形態では、核酸材料は1つ以上の標的核酸断片であり得るか、またはそれを含み得る。いくつかの実施形態では、1つ以上の標的核酸断片がそれぞれ、ゲノム中の1つ以上の位置からの目的のゲノム配列を含むいくつかの実施形態では、1つ以上の標的核酸断片が、核酸材料内の実質的に既知の領域からの標的配列を含むいくつかの実施形態では、実質的に既知の長さに基づいて標的核酸断片を単離することが、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、濾過、またはSPRIビーズ精製による標的核酸断片の濃縮を含む。
様々な実施形態によれば、提供されるいくつかの方法は、核酸材料の任意の様々な最適以下の(例えば、損傷または分解)試料の配列決定に有用であり得る。例えば、いくつかの実施形態では、核酸材料の少なくとも一部が損傷している。いくつかの実施形態では、損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、SUMO化、グリコシル化、脱グリコシル化、プトレシニル化、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、X線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高pHによる損傷、低pHによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、ホルマリンまたはホルムアルデヒドなどの組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、DNAの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、1つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも1つであるか、またはそれを含む。
核酸材料は、様々な供給源に由来し得ると考えられる。例えば、いくつかの実施形態では、核酸材料(例えば、1つ以上の二本鎖核酸分子を含む)は、ヒト対象、動物、植物、菌類、ウイルス、細菌、原生動物、または任意の他の生命体の試料から提供される。他の実施形態では、試料は、少なくとも部分的に人工的に合成された核酸材料を含む。いくつかの実施形態では、試料が、体組織、生検、皮膚試料、血液、血清、血漿、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、パップスメア、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、細菌試料、原生動物のサンプル、真菌試料、動物試料、ウイルス試料、複数の生体の試料、爪擦過検体、精液、前立腺液、膣液、膣スワブ、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液またはスワブ、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、剖検試料、剖検試料、臓器試料、人物同定試料、非ヒト同定試料、人工的に産生された核酸試料、合成遺伝子試料、バンクに寄託または保管された核酸試料、腫瘍組織、胎児試料、臓器移植試料、微生物培養試料、核DNA試料、ミトコンドリアDNA試料、葉緑体DNA試料、アピコプラストDNA試料、細胞小器官試料、およびそれらの任意の組み合わせであるか、またはそれを含む。いくつかの実施形態では、核酸材料は1つを超える供給源に由来する。
本明細書に記載されるとき、いくつかの実施形態では、配列決定プロセスの効率、精確さ、および/または速度を改善するために、核酸材料を処理することが有利である。いくつかの実施形態では、核酸材料は、実質的に均一な長さおよび/または実質的に既知の長さの核酸分子を含む。いくつかの実施形態では、実質的に均一な長さおよび/または実質的に既知の長さは、約1~約1,000,000塩基である)。例えば、いくつかの実施形態では、実質的に均一な長さおよび/または実質的に既知の長さは、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、50、60、70、80、90、100、120、150、200、300、400、500、600、700、800、900、1000、1200、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、30,000、40,000、または50,000塩基の長さであり得る。いくつかの実施形態では、実質的に均一な長さおよび/または実質的に既知の長さは、最大で60,000、70,000、80,000、90,000、100,000、120,000、150,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、または1,000,000塩基であり得る。具体的な非限定的な例として、いくつかの実施形態では、実質的に均一な長さおよび/または実質的に既知の長さは、約100~約500塩基である。いくつかの実施形態では、核酸材料は、1つ以上の標的化エンドヌクレアーゼにより、実質的に均一な長さおよび/または実質的に既知の長さの核酸分子に切断されている。いくつかの実施形態では、標的化エンドヌクレアーゼは、少なくとも1つの修飾を含む。
いくつかの実施形態では、核酸材料は、1つ以上の実質的に既知のサイズ範囲内の長さを有する核酸分子を含む。いくつかの実施形態では、核酸分子は、1~約1,000,000塩基、約10~約10,000塩基、約100~約1000塩基、約100~約600塩基、約100~約500塩基、またはそれらのいくつかの組み合わせであり得る。
いくつかの実施形態では、標的化エンドヌクレアーゼは、認識部位またはその近辺でDNAを切断する制限エンドヌクレアーゼ(すなわち、制限酵素)(例えば、EcoRI、BamHI、XbaI、HindIII、AluI、AvaII、BsaJI、BstNI、DsaV、Fnu4HI、HaeIII、MaeIII、N1aIV、NSiI、MspJI、FspEI、NaeI、Bsu36I、NotI、HinF1、Sau3AI、PvuII、SmaI、HgaI、AluI、EcoRVなど)のうちの1つであるかまたはそれを含む。いくつかの制限エンドヌクレアーゼの一覧は、印刷された形式とコンピューターで読取可能な形式の両方で入手可能であり、多くの商業的供給業者(例えば、New England Biolabs,Ipswich,MA)によって提供されている。本技術の様々な実施形態に従って、任意の制限エンドヌクレアーゼを使用することができることを当業者は理解するであろう。他の実施形態では、標的化エンドヌクレアーゼは、例えば、CRISPR関連(Cas)酵素/ガイドRNA複合体(例えば、Cas9もしくはCpf1)またはCas9様酵素などのリボ核タンパク質複合体のうちの少なくとも1つであるか、またはそれを含む。他の実施形態では、標的化エンドヌクレアーゼは、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、および/またはメガヌクレアーゼ(例えば、megaTALヌクレアーゼなど)、アルゴノートヌクレアーゼ、またはそれらの組み合わせであるか、またはそれを含む。いくつかの実施形態では、標的化エンドヌクレアーゼは、Cas9もしくはCPF1、またはそれらの誘導体を含む。いくつかの実施形態では、1つを超える標的化エンドヌクレアーゼを使用してもよい(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上)。いくつかの実施形態では、標的化エンドヌクレアーゼを使用して、核酸材料の1つを超える潜在的標的領域(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上)を切断することができる。いくつかの実施形態では、核酸材料の1つを超える標的領域が存在する場合、各々の標的領域は同一(または実質的に同一)の長さであり得る。いくつかの実施形態では、核酸材料の1つを超える標的領域が存在する場合、既知の長さの標的領域のうちの少なくとも2つは長さが異なる(例えば、100bpの長さの第1の標的領域と、1,000bpの長さの第2の標的領域)。
いくつかの実施形態では、核酸材料の試料の一部(例えば、アダプター配列)に特定の修飾がなされる。特定の例として、いくつかの実施形態では、第1の試料中の核酸材料を増幅することは、分離するステップの後、および第1の試料を増幅することの前に、核酸材料上に見られる第2のアダプター配列の一部または全てを破壊または崩壊することをさらに含む。さらなる例として、いくつかの実施形態では、第2の試料中の核酸材料を増幅することは、分離するステップの後、および第2の試料を増幅することの前に、核酸材料上に見られる第1のアダプター配列を破壊または崩壊することをさらに含む。いくつかの実施形態では、破壊または崩壊することが、酵素消化、少なくとも1つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、切断または一方もしくは両方の鎖をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、8-オキソ-グアニン付加物の組み込み、制限エンドヌクレアーゼの使用、リボ核タンパク質エンドヌクレアーゼ(例えば、Cas9もしくはCPF1などのCas酵素)、または他のプログラム可能なエンドヌクレアーゼ(例えば、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、メガヌクレアーゼ(例えば、megaTALヌクレアーゼ)、アルゴノートヌクレアーゼなど)の使用、およびそれらの任意の組み合わせの少なくとも1つであり得るか、またはそれを含み得る。いくつかの実施形態では、プライマー部位破壊または崩壊に加えて、またはその代替として、親和性プルダウン、サイズ選択、または試料から望ましくない核酸材料を除去および/または増幅しない他の既知の技術などの方法が考えられる。
いくつかの実施形態では、少なくとも1つの増幅ステップは、少なくとも1つの非標準ヌクレオチドであるかまたはそれを含む少なくとも1つのプライマーおよび/またはアダプター配列を含む。さらなる例として、いくつかの実施形態では、少なくとも1つのアダプター配列が、少なくとも1つの非標準ヌクレオチドであるか、またはそれを含むいくつかの実施形態では、非標準ヌクレオチドは、ウラシル、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチドiso-dC、iso dG、2’-O-メチルヌクレオチド、イノシンヌクレオチドロックド核酸、ペプチド核酸、5メチルdC、5-ブロモデオキシウリジン、2,6-ジアミノプリン、2-アミノプリンヌクレオチド、脱塩基ヌクレオチド、5-ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Iリンカー、5’ヘキシニル修飾ヌクレオチド、5-オクタジイニルdU、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、蛍光色素、ビオチン、フラン、BrdU、フルオロ-dU、loto-dU、およびそれらの任意の組み合わせから選択される。
いくつかの実施形態によれば、提供されるプロセスの精確さ、速度、および効率のうちの1つ以上を向上するために、様々な分析ステップのいずれかを使用することができる。例えば、いくつかの実施形態では、第1の核酸産物および第2の核酸産物の各々を配列決定することは、第1の核酸産物中の複数の鎖の配列を比較して、第1の鎖のコンセンサス配列を決定することと、第2の核酸産物中の複数の鎖の配列を比較して、第2の鎖のコンセンサス配列を決定することと、を含む。いくつかの実施形態では、第1の核酸産物の配列を、第2の核酸産物の配列と比較することが、第1の鎖のコンセンサス配列と第2の鎖のコンセンサス配列を比較して、エラーが訂正されたコンセンサス配列を提供することを含む。
核酸材料を増幅するための様々な方法のいずれかが、様々な実施形態に従って使用され得ることが企図される。例えば、いくつかの実施形態では、少なくとも1つの増幅するステップは、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、等温増幅、エマルション内のポロニー増幅、表面、ビーズの表面またはヒドロゲル内部のブリッジ増幅、およびそれらの任意の組み合わせを含む。いくつかの実施形態では、核酸材料を増幅することが、目的のゲノム配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、およびアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む。いくつかの実施形態では、核酸材料を増幅することは、第1アダプター配列および第2アダプター配列の領域に少なくとも部分的に相補的(例えば、核酸材料の各々の鎖の5’および/または3’末端のアダプター配列に少なくとも部分的に相補的)な一本鎖オリゴヌクレオチドの使用を含む。
いくつかの実施形態によって提供される一態様は、非常に少量の核酸材料からの高品質の配列決定情報を生成する能力である。いくつかの実施形態では、提供される方法および組成物は、最大で以下の量の出発核酸材料とともに使用することができる:約1ピコグラム(pg)、10pg、100pg、1ナノグラム(ng)、10ng、100ng、200ng、300ng、400ng、500ng、600ng、700ng、800ng、900ng、または1000ng。いくつかの実施形態では、提供される方法および組成物は、最大で1分子コピーまたはゲノム相当、10分子コピーまたはそのゲノム相当、100分子コピーまたはそのゲノム相当、1,000分子コピーまたはそのゲノム相当、10,000分子コピーまたはそのゲノム相当、100,000分子コピーまたはそのゲノム相当、または1,000,000分子コピーまたはそのゲノム相当の投入量の核酸材料とともに使用することができ、例えば、いくつかの実施形態では、最大で1,000ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で100ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で10ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で1ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で100pgの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で1pgの核酸材料が特定の配列決定プロセスに最初に提供される。
本出願で使用するとき、「約」および「およそ」という用語は同等のものとして使用される。本明細書での出版物、特許、または特許出願への全ての引用は、それらの全体が参照により本明細書に組み込まれる。本出願で使用される、約/およそを有するかまたは有さない数字は、関連技術分野の当業者によって認識される通常の変動を包含することを意味する。
様々な実施形態では、目的の領域への核酸材料の濃縮を含む核酸材料の濃縮は、より速い速度で(例えば、より少ないステップで)、より少ないコストで(例えば、より少ない試薬を使用して)提供され、望ましいデータの増加をもたらす。本技術の様々な態様は、前臨床試験および臨床試験と診断との両方、ならびに他の用途において多くの用途を有する。
本技術のいくつかの実施形態の具体的な詳細は、図1A~図24を参照して以下に説明される。実施形態の多くはデュプレックス配列決定に関して本明細書に記載されているが、本明細書に記載されたものに加えてエラー訂正配列決定読取および/または他の配列決定読取を生成できる他の配列決定様式は本技術の範囲内である。さらに、本明細書に記載される核酸濃縮方法および試薬から利益を得るために、他の核酸の調査が企図される。さらに、本技術の他の実施形態は、本明細書で説明されるものとは異なる構成、構成要素、または手順を有することができる。それゆえに、当業者は、技術が追加の要素を備えた他の実施形態を有することができ、技術が図1A~24を参照して以下に示され記載される特徴のいくつかを含まずに他の実施形態を有することができることをそれに従って理解するであろう。
本開示の多くの態様は、以下の図面を参照することによってよりよく理解することができる。図面の構成要素は必ずしも縮尺通りではない。代わりに、本開示の原理を明確に示すことに重点が置かれている。
本技術のいくつかの実施形態で使用するための核酸アダプター分子、および本技術の実施形態によるアダプター分子の二本鎖核酸断片へのライゲーションから生じる二本鎖アダプター-核酸複合体を示す。 本技術の実施形態による様々なデュプレックス配列決定方法のステップの概念図である。 本開示の特定の態様による、次世代シーケンス(NGS)、一本鎖タグベースのエラー訂正、および二重鎖配列決定エラー訂正の分子集団におけるバリアント対立遺伝子頻度の関数として陽性的中率をプロットしたグラフである。 本開示の態様による、エラー訂正の非存在下のCODIS遺伝子型と対配列決定読取の数を示す一連のグラフ(図3A)、および3つの異なる座位の標準的なDSによる分析(図3B)を示す。 本技術の一実施形態によるSPLiT-DS法のステップの概念図である。 本技術の一実施形態による、SPLiT-DS法のステップの概念図であり、二重鎖コンセンサス配列を生成するステップを示している。 本技術の実施形態による様々なSPLiT-DS法のステップの概念図である。 本技術の一実施形態によるさらなるSPLiT-DS法のステップの概念図である。 本技術の追加の実施形態による二本鎖プライマー部位破壊スキームを組み込んだSPLiT-DS法のステップの概念図である。 図8Aに示され、本技術の実施形態によるSPLiT-DS法のステップの例の概念図である。 本技術の追加の態様による、図8Aに示される方法のステップに続くSPLiT-DS法のステップの実施形態の概念図である。 本技術の別の実施形態による二本鎖プライマー部位破壊スキームを組み込んだSPLiT-DS法のステップの概念図である。 本技術のさらなる態様による一本鎖プライマー部位破壊スキームを組み込んだSPLiT-DS法のステップの様々な実施形態の概念図である。 本技術のさらに別の実施形態による、より長い核酸分子の二重鎖コンセンサス配列を生成するための複数の標的化プライマーを使用するSPLiT-DS法のステップの概念図である。 本技術の一実施形態による、核酸インサートサイズと増幅後に得られるファミリーサイズとの関係をプロットしたグラフである。 本技術の態様による、異なる核酸インサートのサイズについて生成された配列決定データを示す概略図である。 本技術の一実施形態による、配列決定情報を生成するためのCRISPR/Cas9によって特定のサイズに切断された標的化断片を生成する方法のステップを示す概略図である。 本技術の一実施形態によるCRISPR-DS法のステップの概念図である。図12Aは、TP53のCRISPR/Cas9消化からの結果を示し、7つの断片は、gRNAを使用する標的化切断により切除された全てのTP53コーディングエクソンを含む。暗い灰色は参照鎖を表し、明るい灰色は反参照鎖を表す。図12Bは、0.5×SPRIビーズを使用するサイズ選択を示し、未切断のゲノムDNAはビーズに結合し、溶液中の切除された断片の回収を可能にする。図12Cは、10bpのランダムな相補的ヌクレオチドおよび3’-dT突出を含む二本鎖DSアダプターで断片化およびライゲートされた二本鎖DNA分子の概略図を示す。図12Dは、DSによるエラー訂正の概略図を示す。同一のDNA鎖に由来する読取を比較して、一本鎖コンセンサス配列(SSCS)を形成する。次いで、同一の開始DNA分子の両方の鎖を互いに比較して二本鎖コンセンサス配列(DSCS)を作成し、両方のSSCS読取で見つかった変異をDSCS読取の真の変異として計数する。 本技術の特定の実施形態による、CRISPR-DSおよび標準的なDSの方法のステップを概略的に比較する。図12Eは、CRISPR-DSおよび標準的なDSのライブラリー調製ステップの比較である。各ボックスは1時間を表す。図12Fは、最適で一貫した長さであり、配列決定読取の完全な包含を有するCRISPR-DSによる断片産物と比較して、最適長よりも短いかまたは長い(それぞれ、失われた情報または冗長な情報に対応する)、超音波処理を使用して産生された断片の概略図を示す。 本技術の一実施形態によるSPLiT-DS手順から得られたデータを示す。図13Aは、配列決定前のインサート断片サイズを示す代表的なゲルである。図13Bおよび13Cは、CODIS遺伝子型対エラー訂正の非存在下(図13B)およびSPLiT-DSによる分析後(図13C)の配列決定読取の数を示すグラフである。 本技術の実施形態による、高度に損傷したDNAに対する、CODIS遺伝子型対エラー訂正の非存在下(図14A)およびSPLiT-DSによる分析後(図14B)の配列決定読取の数を示すグラフである。 本技術の実施形態による、cfDNAの10ng(図15A)および20ng(図15B)から生成されたKRASエクソン2のSPLiT-DS配列決定データを視覚的に表す。 本技術の実施形態による、超音波処理およびCRISPR/Cas9断片化によって産生される断片の長さの概略図である。 、本技術の実施形態による、標準的なDSおよびCRISPR-DSプロトコールで調製された試料の断片インサートサイズを示すヒストグラムグラフである。X軸は、最適な断片サイズ、例えば、分子バーコードとクリッピングの調整後の配列決定読取の長さに一致する断片サイズ、との差異の割合を表す。縦欄領域は、最適なサイズから10%以内の範囲にある断片サイズの範囲を示し、最適なサイズは垂直のハッシュ線で指定される。 本技術の実施形態による、ヒトTP53のコード領域の標的化された濃縮のためのCRISPR/Cas9スキームを示す。TP53腫瘍タンパク質;Homo sapiens;NC_000017.11 Chr.17,Ref. GRCh38.p2.灰色の文字はコード領域を表し、エクソン名は、右マージンに示され、同一の断片にあるときは、一緒にボックスで囲まれる。灰色で強調表示されたテキストは、PAM配列に二重下線を付したCas9切断部位を表す。下線を付した単一のテキストは、ビオチン化プローブを表し、プローブ名は左マージンに示されている。 二重鎖コンセンサス配列読取(図18B)を産生するインプットDNA中のゲノムのパーセンテージによって計算された回収パーセンテージを示し、および本技術の実施形態による標準的なDSおよびCRISPR-DSを使用して処理された様々なインプット量のDNAの全ての標的領域にわたる中央二重鎖コンセンサス配列深度(図18C)を示す、オンターゲットの未処理の配列決定読取(生の読取り)のパーセント(TP53を包含)を示す棒グラフ(図18A)である。 本技術の一実施形態による、3つの異なる血液DNA試料での2つの捕捉ステップと比較して、1つの捕捉ステップでCRISPR-DSによりもたらされる標的濃縮を示す棒グラフである。 、パルスフィールドゲル上のBluePippinによる高分子量DNAのプレ濃縮の結果(図20A)、およびオンターゲットの未処理読取と、本技術の実施形態によるBluePippinプレ濃縮の前後に配列決定された同一のDNAについての二重鎖コンセンサス配列深度とのパーセンテージの比較を示す棒グラフ(図20B)を示す。 、合成二本鎖DNA分子の概略図(図21A)およびCRISPR/Cas9消化後の予測断片の長さのチャート(図21B)、ならびに合成二本鎖DNA分子のCRISPR/Cas9消化後の実際のDNA断片の長さの得られたTapeStationゲル画像(図21C)であり、本技術の実施形態によるCRISPR/Cas9消化を使用した成功した切断を実証する。 本技術の一実施形態による、CRISPR-DSおよび標準的なDSプロトコールを使用したTP53の増幅後の核酸インサートサイズと得られたファミリーサイズとの関係をプロットしたグラフである。ドットは元のバーコードDNA分子を表し、CRISPR-DSでは、全てのDNA分子(明るいドット)はあらかじめ設定されたサイズを持ち、同様の数のPCRコピーを生成する(いくつかの「ドット様」の明るいドットのクラスターによって示される)。標準的なDS(暗いドット)では、超音波処理によりDNAが様々な断片の長さに切断される(暗いドット、明るいドットよりもプロット上でより広く分布)。このプロットは、長い断片よりも短い断片の数が多いことを示している。 本技術の実施形態による、CRISPR-DSおよび標準的なDS法のステップから得られたTP53に関するデータを示す。図22Bは、アダプターライゲーション後および配列決定前のインサート断片サイズを示す代表的なゲルである。図22Cおよび22Dは、配列決定の前にCRISPR-DS(図22C)および標準的なDS(図22D)によって生成された得られた核酸ライブラリーのピークを示すエレクトロフェログラムである。図22Eは、CRISPR-DSおよびIntegative Genomics Viewerによる標準的なDSプロトコールによって生成されたTP53の二重鎖コンセンサス配列読取を示す。図22Bは、CRISPR-DS(A1)および標準的なDS(B1)からのラダーと試料を有するTapeStationゲルを示す。バンドのサイズは、アダプターを有するCRISPR/Cas9切断断片に対応している。図22Eは、CRISPR/Cas9切断点に対応する明確な境界と、断片内と断片間の両方の位置にわたる深度の均一な分布を示す。標準的なDSは、断片のランダムなせん断およびハイブリダイゼーション捕捉、ならびに不均一な包含によって生成されたピークパターンを示す。 本技術の一実施形態によるCRISPR-DSデータ処理のステップの概略図である。 本技術の一実施形態による、CRISPR/Cas9消化とそれに続くサイズ選択後の標的濃縮の度合を定量化した結果を示すチャート(図24A)およびグラフ(図24B)である。図24Aは、DNA試料およびそれぞれについて達成された濃縮を示す。図24Bは、インプットDNAの量と比較して「オンターゲット」にあった未処理の読取のパーセントを示す。
定義
本開示をより容易に理解するために、特定の用語を最初に以下に定義する。以下の用語およびその他の用語の追加の定義は、明細書全体に記載されている。
本出願において、文脈からそうでないことが明確でない限り、用語「a」は「少なくとも1つ」を意味すると理解され得る。本出願で使用するとき、「または」という用語は「および/または」を意味すると理解され得る。本出願では、「含むこと(comprising)」および「含むこと(including)」という用語は、それ自体で、または1つ以上の追加の構成要素またはステップとともに提示されるかどうかにかかわらず、項目化された構成要素またはステップを包含すると理解され得る。本明細書で範囲が提供されている場合、端点が含まれる。本出願で使用するとき、「含む(comprise)」という用語、ならびに「含むこと(comprising)」および「含む(comprises)」などの用語の変形は、他の添加剤、構成要素、整数、またはステップを除外することを意図していない。
約:「約」という用語は、値に関して本明細書で使用するとき、文脈において、参照される値に類似する値を指す。一般に、文脈に精通している当業者は、その文脈の「約」に包含される関連する分散の程度を理解するであろう。例えば、いくつかの実施形態では、「約」という用語は、言及された値の25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、またはそれ以下内の値の範囲を包含し得る。
類似体:本明細書で使用するとき、「類似体」という用語は、1つ以上の特定の構造的特徴、要素、成分、または部分を参照物質と共有する物質を指す。通常、「類似体」は、参照物質との重要な構造的類似性、例えばコアまたはコンセンサス構造の共有を示すが、特定の個別の点で異なってもいる。いくつかの実施形態では、類似体は、例えば、参照物質の化学的操作により、参照物質から生成できる物質である。いくつかの実施形態では、類似体は、参照物質を生成するものと実質的に類似する(例えば、複数のステップを共有する)合成プロセスの実行を通じて生成できる物質である。いくつかの実施形態では、類似体は、参照物質の生成に使用されたものとは異なる合成プロセスの実行により生成されるか、または生成することができる。
生体試料:本明細書で使用するとき、「生体試料」または「試料」という用語は、通常、本明細書に記載される目的の生物学的供給源(例えば、組織または生物または細胞培養)から得られるまたはそれに由来する試料を指す。いくつかの実施形態では、目的の供給源は、動物またはヒトなどの生物を含む。他の実施形態では、目的の供給源は、細菌、ウイルス、原生動物、または真菌などの微生物を含む。さらなる実施形態では、目的の供給源は、合成組織、生物、細胞培養物、核酸、または他の物質であり得る。さらなる実施形態では、目的の供給源は植物ベースの生物であり得る。さらに別の実施形態では、試料は、例えば水試料、土壌試料、考古学的試料、または非生物源から収集された他の試料などの環境試料であってもよい。他の実施形態では、試料は多生物試料(例えば、混合生物試料)であり得る。いくつかの実施形態では、生体試料は、生体組織または生体液である。いくつかの実施形態では、生体試料は、骨髄、血液、血球、腹水、細針生検試料、細胞含有体液、浮遊核酸、喀痰、唾液、尿、脳脊髄液、腹水、胸水、糞便、リンパ液、婦人科液、皮膚スワブ、膣スワブ、パップスメア、口腔スワブ、鼻腔スワブ、管洗浄液または気管支肺胞洗浄液などの洗液または洗浄液、膣液、吸引物、擦過検体、骨髄試料、組織生検試料、胎児組織または体液、摘出試料、糞便、他の体液、分泌物、および/または排泄物、および/またはそこからの細胞などであり得るか、またはそれを含む。いくつかの実施形態では、生体試料は、個体から得られた細胞であるか、またはそれを含む。いくつかの実施形態では、得られた細胞は、試料が得られた個体の細胞であるか、またはそれを含む。特定の実施形態では、生体試料は、対象から得られた液体生検である。いくつかの実施形態では、試料は、適切な手段によって目的の供給源から直接得られた「一次試料」である。例えば、いくつかの実施形態では、一次生体試料は、生検(例えば、細針吸引または組織生検)、手術、体液の収集(例えば、血液、リンパ液、糞便)などからなる群から選択された方法によって取得される。いくつかの実施形態では、文脈から明らかなように、「試料」という用語は、一次試料を処理することによって(例えば、1つ以上の成分を除去することによって、および/または1つ以上の薬剤を添加することによって)得られる調製物を指す。例えば、半透膜を使用したフィルタリングである。そのような「処理された試料」は、例えば、試料から抽出されるか、あるいは一次試料をmRNAの増幅もしくは逆転写、特定の成分の単離および/または精製などの技術に供することにより得られた核酸またはタンパク質を含み得る。
決定する:本明細書に記載される多くの方法論には、「決定すること」のステップが含まれる。本明細書を読む当業者は、そのような「決定すること」が、例えば本明細書に明示的に言及される特定の技術を含む、当業者に利用可能な様々な技術のいずれかを利用することにより利用または達成できることを理解するであろう。いくつかの実施形態では、決定することには物理的な試料の操作が含まれる。いくつかの実施形態では、決定することには、関連する分析を実行するように適合されたコンピューターまたは他の処理ユニットの利用など、データまたは情報の検討および/または操作が含まれる。いくつかの実施形態では、決定することには、供給源からの関連情報および/または物質の受容が含まれる。いくつかの実施形態では、決定することには、試料または実体の1つ以上の特徴を比較可能な参照と比較することが含まれる。
発現:本明細書で使用するとき、核酸配列の「発現」とは、以下の事象の1つ以上を指す:(1)DNA配列からのRNAテンプレートの産生(例えば、転写による)、(2)RNA転写産物の処理(例えば、スプライシング、編集、5’キャップ形成、および/または3’末端形成による)、(3)RNAのポリペプチドまたはタンパク質への翻訳、および/または(4)ポリペプチドまたはタンパク質の翻訳後修飾。
gRNA:本明細書で使用するとき、「gRNA」または「ガイドRNA」は、DNAまたはRNAの特定の領域の切断を促進する実質的に標的特異的な配列に対する標的化エンドヌクレアーゼ(例えば、Cas9またはCpf1などのCas酵素、または類似の特性を有する別のリボ核タンパク質など)結合に適した足場配列を含む短いRNA分子を指す。
核酸:本明細書で使用するとき、その最も広い意味で、オリゴヌクレオチド鎖に組み込まれているか、または組み込むことができる任意の化合物および/または物質を指す。いくつかの実施形態では、核酸は、ホスホジエステル結合を介してオリゴヌクレオチド鎖に組み込まれているか、または組み込むことができる化合物および/または物質である。文脈から明らかなように、いくつかの実施形態では、「核酸」とは、個々の核酸残基(例えば、ヌクレオチドおよび/またはヌクレオシド)を指し、いくつかの実施形態では、「核酸」とは、個々の核酸残基を含むオリゴヌクレオチド鎖を指す。いくつかの実施形態では、「核酸」はRNAであるか、またはそれを構成し、いくつかの実施形態では、「核酸」はDNAであるか、またはDNAを構成する。いくつかの実施形態では、核酸は、1つ以上の天然の核酸残基であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸は、1つ以上の核酸類似体であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸類似体は、ホスホジエステル骨格を利用しないという点で核酸とは異なる。例えば、いくつかの実施形態では、核酸は、当該技術分野で既知であり、骨格にホスホジエステル結合の代わりにペプチド結合を有し、本技術の範囲内であると考えられる、1つ以上の「ペプチド核酸」であるか、それを含むか、またはそれからなる。代替的にまたは追加的に、いくつかの実施形態では、核酸は、ホスホジエステル結合ではなく、1つ以上のホスホロチオエートおよび/または5’-N-ホスホラミダイト結合を有する。いくつかの実施形態では、核酸は、1つ以上の天然のヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸は、1つ以上のヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C-5プロピニル-シチジン、C-5プロピニル-ウリジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、0(6)-メチルグアニン、2-チオシチジン、メチル化塩基、挿入塩基、およびそれらの組み合わせ)であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸は、天然の核酸のものと比較して、1つ以上の修飾糖(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース)を含む。いくつかの実施形態では、核酸は、RNAやタンパク質などの機能的な遺伝子産物をコードするヌクレオチド配列を有する。いくつかの実施形態では、核酸には1つ以上のイントロンが含まれる。いくつかの実施形態では、核酸は、天然源からの分離、相補的テンプレートに基づく重合による酵素合成(インビボまたはインビトロ)、組換え細胞またはシステムでの複製、および化学合成の1つ以上によって調製される。いくつかの実施形態では、核酸は少なくとも2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、またはそれ以上の残基の長さである。いくつかの実施形態では、核酸は部分的または完全に一本鎖であり、いくつかの実施形態では、核酸は部分的または完全に二本鎖である。いくつかの実施形態では、核酸は、ポリペプチドをコードする、またはコードする配列の相補体である少なくとも1つの要素を含むヌクレオチド配列を有する。いくつかの実施形態では、核酸は酵素活性を有する。いくつかの実施形態では、核酸は、例えば、リボ核タンパク質複合体またはトランスファーRNAにおいて機械的機能を果たす。
参照:本明細書で使用するとき、比較が実行される基準または対照を説明する。例えば、いくつかの実施形態では、薬剤、動物、個体、集団、試料、配列、または目的の値は、参照または対照の薬剤、動物、個体、集団、試料、配列、または値と比較される。いくつかの実施形態では、参照または対照は、目的の試験または決定と実質的に同時に試験および/または決定される。いくつかの実施形態では、参照または対照は、具体的な媒体で必要に応じて具体化される歴史的な参照または対照である。典型的には、当業者に理解されるように、参照または対照は、評価下のものと比較可能な条件または状況下で決定または特性評価される。当業者は、特定の可能な参照または対照への依存および/または比較を正当化するのに十分な類似性が存在するときを認識するであろう。
単一の分子識別子(SMI):本明細書で使用するとき、「単一の分子識別子」または「SMI」という用語(他の名称のうちとりわけ、「タグ」、「バーコード」、「分子バーコード」、「固有の分子識別子」、または「UMI」と呼ばれることもある)は、分子の大きな不均一な集団内の個々の分子を区別することができる任意の物質(例えば、ヌクレオチド配列、核酸分子の特徴)を指す。いくつかの実施形態では、SMIは、外因性に適用されるSMIであるか、またはそれを含むことができる。いくつかの実施形態では、外因性に適用されるSMIは、縮重または半縮重配列であり得るか、またはそれを含み得る。いくつかの実施形態では、実質的に縮重したSMIは、ランダム固有分子識別子(R-UMI)として知られている場合がある。いくつかの実施形態では、SMIは、既知のコードのプール内からのコード(例えば、核酸配列)を含み得る。いくつかの実施形態では、事前定義されたSMIコードは、定義済み固有分子識別子(D-UMI)として知られている。いくつかの実施形態では、SMIは内因性SMIであり得るか、または内因性SMIを含み得る。いくつかの実施形態では、内因性SMIは、標的配列の特定のせん断点に関連する情報、または標的配列を含む個々の分子の末端に関連する特徴であり得るか、またはそれを含み得る。いくつかの実施形態では、SMIは、ランダムまたはセミランダム損傷、化学修飾、酵素修飾、または核酸分子への他の修飾によって引き起こされる核酸分子の配列変化に関連し得る。いくつかの実施形態では、修飾はメチルシトシンの脱アミノ化であり得る。いくつかの実施形態では、修飾は、核酸ニックの部位を伴う場合がある。いくつかの実施形態では、SMIは外因性要素と内因性要素の両方を含む場合がある。いくつかの実施形態では、SMIは物理的に隣接するSMI要素を含み得る。いくつかの実施形態では、SMI要素は分子内で空間的に異なっていてもよい。一部の実施形態では、SMIは非核酸であり得る。いくつかの実施形態では、SMIは、2つ以上の異なるタイプのSMI情報を含み得る。SMIの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されており、その全体が参照により本明細書に組み込まれる。
鎖定義要素(SDE):本明細書で使用するとき、「鎖定義要素」または「SDE」という用語は、二本鎖核酸材料の特定の鎖の同定を可能にし、したがって他の/相補鎖との区別を可能にする任意の物質を指す(例えば、標的二本鎖核酸から生じる2つの一本鎖核酸のそれぞれの増幅産物を、配列決定または他の核酸調査後に互いに実質的に区別可能にする任意の物質)。いくつかの実施形態では、SDEは、アダプター配列内の実質的に非相補的な配列の1つ以上のセグメントであり得るか、またはそれを含み得る。特定の実施形態では、アダプター配列内の実質的に非相補的な配列のセグメントは、Y形状または「ループ」形状を含むアダプター分子によって提供され得る。他の実施形態では、アダプター配列内の実質的に非相補的な配列のセグメントは、アダプター配列内の隣接する相補配列の中央に不対の「バブル」を形成し得る。他の実施形態では、SDEは核酸修飾を包含し得る。いくつかの実施形態では、SDEは、物理的に分離された反応コンパートメントへのペア鎖の物理的分離を含み得る。いくつかの実施形態では、SDEは化学修飾を含んでもよい。いくつかの実施形態では、SDEは修飾された核酸を含んでもよい。いくつかの実施形態では、SDEは、ランダムまたはセミランダム損傷、化学修飾、酵素修飾、または核酸分子への他の修飾によって引き起こされる核酸分子の配列変化に関連し得る。いくつかの実施形態では、修飾はメチルシトシンの脱アミノ化であり得る。いくつかの実施形態では、修飾は、核酸ニックの部位を伴う場合がある。SDEの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されており、その全体が参照により本明細書に組み込まれる。
対象:本明細書で使用するとき、「対象」という用語は、生物、典型的には哺乳動物(例えば、出生前のヒトの形態を含むいくつかの実施形態ではヒト)を指す。いくつかの実施形態では、対象は関連する疾患、障害または状態に苦しんでいる。いくつかの実施形態では、対象は疾患、障害、または状態に影響されやすい。いくつかの実施形態では、対象は疾患、障害、または状態の1つ以上の症状または特徴を示す。いくつかの実施形態では、対象は症状、または疾患、障害、もしくは状態の特徴を示さないいくつかの実施形態では、対象とは、疾患、障害、または状態に対する感受性またはリスクを特徴とする1つ以上の特徴を有するものである。いくつかの実施形態では、対象は患者である。いくつかの実施形態では、対象は、診断および/または治療が、施されているおよび/または施された個体である。
実質的に:本明細書で使用するとき、「実質的に」という用語は、目的の特徴または特性の全体またはほぼ全体の範囲または度合を示す定性的な状態を指す。生物学分野の当業者は、生物学的および化学的現象が、もし存在する場合、めったに完了しないこと、および/またはめったに完全に進まないこと、または絶対的な結果を達成または回避することはめったにないことを理解するであろう。したがって、本明細書では、「実質的に」という用語は、多くの生物学的および化学的現象に固有の潜在的な完全性の欠如を捉えるために使用される。
<詳細な説明>
デュプレックス配列決定法と関連するアダプターおよび試薬の選択された実施形態
デュプレックス配列決定(DS)は、二本鎖核酸分子からエラーが訂正されたDNA配列を生成する方法であり、元は国際特許公開第WO2013/142389号および米国特許第9,752,188号に記載されており、それらの両方は、それらの全体が参照により組み込まれる。図1A~1Cに示されるように、および本技術の特定の態様では、DSを使用して、個々のDNA分子の両方の鎖を独立して配列決定し、誘導体配列読取がMPS中に同一の二重鎖核酸親分子に由来するものとして認識できるが、配列決定後に識別可能な実体として互いに区別されるようにすることができる。デュプレックスコンセンサス配列(DCS)として知られる元の二本鎖核酸分子のエラーが訂正された配列を取得する目的で、各鎖から得られた配列読取を比較する。DSのプロセスにより、元の二本鎖核酸分子の一方または両方の鎖が、DCSを形成するために使用される生成された配列データ中に表されるかどうかを確認することができる。
特定の実施形態では、DSを組み込む方法は、二本鎖標的核酸複合体を産生するために、第1の鎖標的核酸配列および第2の鎖標的核酸配列を含む標的二本鎖核酸分子への1つ以上の配列決定アダプターのライゲーションを含み得る(例えば、図1A)。
様々な実施形態では、得られた標的核酸複合体は、外因性に適用される縮重または半縮重配列、標的二本鎖核酸分子の特定のせん断点に関連する内因性情報、またはその組み合わせを伴う可能性がある少なくとも1つのSMI配列を含むことができる。SMIは、標的核酸分子を、配列決定される集団内の複数の他の分子から実質的に区別可能にすることができる。SMI要素の実質的に区別可能な特徴は、二本鎖核酸分子を形成する一本鎖の各々によって独立して運ぶことができ、配列決定後に、各鎖の誘導体増幅産物が同一の元の実質的に固有の二本鎖核酸分子に由来するものとして認識できる。他の実施形態では、SMIは追加の情報を含むことができ、および/または上述の刊行物に記載されているような分子識別機能が有用な他の方法で使用することができる。別の実施形態では、アダプターライゲーション後にSMI要素を組み込むことができる。いくつかの実施形態では、SMIは本質的に二本鎖である。他の実施形態では、それは本質的に一本鎖である。他の実施形態では、それは、本質的に一本鎖と二本鎖の組み合わせである。
いくつかの実施形態では、各二本鎖標的核酸配列複合体は、配列決定後に実質的に互いに区別できる標的二本鎖核酸分子を形成する2つの一本鎖核酸の増幅産物をもたらす要素(例えば、SDE)をさらに含むことができる。一実施形態では、SDEは、配列決定アダプター内に含まれる非対称プライマー部位を含んでもよく、または他の配置では、配列の非対称性が、プライマー配列内ではないアダプター分子に導入されてもよく、増幅および配列決定後、第1の鎖標的核酸配列複合体および標的核酸配列複合体の第2の鎖のヌクレオチド配列の少なくとも一部が互いに異なるようにされていてもよい。他の実施形態では、SMIは、標準的なヌクレオチド配列A、T、C、GまたはUとは異なるが、2つの増幅および配列決定された分子における少なくとも1つの標準的なヌクレオチド配列の差に変換される2つの鎖間の別の生化学的非対称性を含み得る。さらに別の実施形態では、SDEは、増幅前に2本の鎖を物理的に分離する手段であり得、第1の鎖標的核酸配列および第2の鎖標的核酸配列からの誘導体増幅産物は、2つの区別を維持するために一方と他方とを実質的な物理的分離中に維持される。上述の刊行物に記載されているような第1および第2の鎖を区別することを可能にするSDE機能を提供する他のそのような配置または方法論、または記載された機能的目的に役立つ他の方法を利用し得る。
少なくとも1つのSMIと少なくとも1つのSDEを含む二本鎖標的核酸複合体を生成した後、またはこれらの要素の一方または両方がその後導入される場合、複合体はPCRまたは任意の他のDNA増幅の生化学的方法(例えば、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、または表面結合増幅)などのDNA増幅に供し得、第1の鎖標的核酸配列の1つ以上のコピーと第2の鎖標的核酸配列の1つ以上のコピーが産生されるようにされる(例えば、図1B)。次いで、第1の鎖標的核酸分子の1つ以上の増幅コピーおよび第2の標的核酸分子の1つ以上の増幅コピーを、好ましくは「次世代」の超並列DNA配列決定プラットフォームを使用するDNA配列決定に供し得る(例えば、図1B)。
元の二本鎖標的核酸分子に由来する第1の鎖標的核酸分子および第2の鎖標的核酸分子のいずれかから産生された配列読取は、関連する実質的に固有のSMIの共有に基づいて識別され、SDEにより反対の鎖標的核酸分子と区別される。いくつかの実施形態では、SMIは、数学ベースのエラー訂正コード(例えば、ハミングコード)に基づく配列であり得、それにより、特定の増幅エラー、配列決定エラー、またはSMI合成エラーは、元のデュプレックス(例えば、二本鎖核酸分子)の相補鎖上のSMI配列の配列に関連する目的のために許容され得る。例えば、SMIが標準的なDNA塩基の完全に縮重した配列の15塩基対を含む二本鎖外因性SMIでは、完全に縮重したSMIの母集団に推定4^15 = 1,073,741,824のSMIバリアントが存在する。10,000個のサンプリングされたSMIの母集団のうち、SMI配列内の1つのヌクレオチドのみが異なる配列データの読取から2つのSMIが回収された場合、ランダムな偶然によってこの発生する確率が数学的に計算でき、おそらく、単一の塩基対の相違が前述のタイプのエラーのうちの1つを反映しているかどうかを決定でき、SMI配列が実際には同一の元の二重鎖分子に由来するものであると判断することができる。SMIが少なくとも部分的に、外因的に適用された配列であり、配列バリアントが互いに完全に縮重せず、少なくとも部分的に既知の配列であるいくつかの実施形態では、既知の配列の識別性は、いくつかの実施形態では、前述のタイプの1つ以上のエラーが1つの既知のSMI配列の識別性を別のSMI配列のものに変換しないように設計することができ、1つのSMIが別のSMIのものと誤解される可能性が低減される。いくつかの実施形態では、このSMI設計戦略は、ハミングコードアプローチまたはその派生物を含む。識別されると、第1の鎖標的核酸分子から産生された1つ以上の配列読取を、第2の鎖標的核酸分子から生成された1つ以上の配列読取と比較して、エラーが訂正された標的核酸分子配列を産生する(例えば、図1C)。例えば、第1の鎖と第2の鎖の両方の標的核酸配列の塩基が一致するヌクレオチド位置は真の配列とみなされるが、2つの鎖間で一致しないヌクレオチド位置は、無視され得る技術的エラーの可能性のある部位として認識される。したがって、元の二本鎖標的核酸分子のエラーが訂正された配列を産生することができる(図1Cに示す)。
代替的に、いくつかの実施形態では、2つの鎖間の配列不一致の部位は、元の二本鎖標的核酸分子の生物学的に由来する不一致の潜在的な部位として認識され得る。代替的に、いくつかの実施形態では、2つの鎖間の配列不一致の部位は、元の二本鎖標的核酸分子のDNA合成に由来する不一致の潜在的な部位として認識され得る。代替的に、いくつかの実施形態では、2つの鎖間の配列不一致の部位は、損傷または修飾されたヌクレオチド塩基が一方または両方の鎖に存在し、酵素プロセス(例えば、DNAポリメラーゼ、DNAグリコシラーゼ、または別の核酸修飾酵素、または化学プロセス)によって不一致に変換された潜在的な部位として認識され得る。いくつかの実施形態では、この後者の発見は、酵素プロセスまたは化学処理の前に核酸損傷またはヌクレオチド修飾の存在を推測するために使用できる。
図2は、本開示の特定の態様による、次世代シーケンス(NGS)、一本鎖タグベースのエラー訂正、および二重鎖配列決定エラー訂正の分子集団におけるバリアント対立遺伝子頻度の関数として理論的な陽性的中率をプロットしたグラフである。図2を参照すると、陽性的中率(例えば、陽性コールの総数で割った正解陽性コールの期待数)は、次世代配列決定(NGS)、一本鎖タグベースのエラー訂正、および特定されたエラー率のDSエラー訂正の分子集団におけるバリアント対立遺伝子頻度の関数としてプロットされている。曲線の重複でわかるように、検出されたバリアントの頻度が10につき2つ以上の場合、どのメソッドを使用してもほぼ全ての変異コールが訂正される。しかしながら、標準的なイルミナシーケンスのエラー率および一本鎖タグベースのエラー訂正は、それぞれ、100あたり約1および1,000あたり1のバリアント頻度で陽性的中率に重大な損失をもたらす。DSによって提供される非常に低いエラー率により、100,000あたり1未満のバリアントを確実に識別できる(点線)。
いくつかの実施形態では、および本技術の態様によると、本明細書で論じたDSのステップから生成された配列読取をさらにフィルタリングして、DNA損傷分子(例えば、保管中、輸送中、または、組織もしくは血液の抽出後、ライブラリーの調製中または調製後など)からの配列決定読取を排除することができる。例えば、ウラシルDNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)、および8-オキソグアニンDNAグリコシラーゼ(OGG1)などのDNA修復酵素を、DNA損傷(例えば、インビトロDNA損傷またはインビボ損傷)を排除または訂正するのに利用することができる。例えば、これらのDNA修復酵素は、DNAから損傷した塩基を除去するグリコリアーゼである。例えば、UDGはシトシンの脱アミノ化(シトシンの自然加水分解により起こる)から生じるウラシルを除去し、FPGは8-オキソ-グアニン(例えば、活性酸素種に起因する一般的なDNA損傷)を除去する。FPGはまた、無塩基部位に1塩基のギャップを生じさせるリアーゼ活性をも有する。そのような脱塩基部位は、一般に、例えば、ポリメラーゼがテンプレートのコピーに失敗するため、PCRによる増幅が失敗する。したがって、このようなDNA損傷修復/除去酵素を使用すると、真の変異を持たない損傷DNAを効果的に除去できるが、そうでなければ、配列決定および二重鎖配列分析後にエラーとして検出されない。まれに塩基の損傷によるエラーはしばしばDSによって訂正されるが、理論的には両方の鎖の同一の位置で相補的なエラーが発生する可能性があるため、エラーが増加する損傷を減らすと、アーティファクトの可能性を減らすことができる。さらに、ライブラリーの調製中に、配列決定されるDNAの特定のフラグメントは、その供給源または処理ステップ(例えば、機械的なDNSせん断)から一本鎖になる場合がある。これらの領域は通常、当該技術分野で既知の「末端修復」ステップ中に二本鎖DNAに変換され、DNAポリメラーゼとヌクレオシド基質がDNA試料に添加され、5’陥凹末端が延長される。コピーされるDNAの一本鎖部分のDNA損傷の変異部位(すなわち、DNA二重鎖の片端もしくは両端の1本鎖5’突出または内部の一本鎖ニックもしくはギャップ)は、一本鎖変異、合成エラー、または核酸損傷部位を二本鎖の形に変換し得るフィルイン反応中にエラーを引き起こす可能性があり、実際にはそうではないときに、元の二本鎖核酸分子に真の変異が存在する真の変異として最終的な二重鎖コンセンサス配列で誤解される可能性がある。「偽二重鎖」と呼ばれるこのシナリオは、このような損傷を破壊/修復する酵素を使用することで軽減または防止できる。他の実施形態では、この発生は、元の二重鎖分子の一本鎖部分を破壊または防止する戦略の使用(例えば、元の二本鎖核酸材料の断片化に使用される、機械的せん断またはニックやギャップを残す可能性のある特定の他の酵素ではない特定の酵素の使用)により減少または排除することができる。他の実施形態では、元の二本鎖核酸の一本鎖部分を排除するプロセスの使用(例えば、S1ヌクレアーゼまたはマングビーンヌクレアーゼなどの一本鎖特異的ヌクレアーゼ)を同様の目的に利用することができる。
さらなる実施形態では、本明細書で論じされるDSのステップから生成された配列決定読取をさらにフィルタリングして、偽二重鎖アーティファクトに最もなりやすい読取の末端をトリミングすることにより、偽の変異を排除できる。例えば、DNA断片化により、二本鎖分子の末端に一本鎖部分が生成されることがある。これらの一本鎖部分は、末端修復中に(例えば、クレノウまたはT4ポリメラーゼによって)満たすことができる。場合によっては、ポリメラーゼはこれらの末端修復領域でコピーミスを起こし、「擬似二重鎖分子」の生成をもたらす。ライブラリー調製のこれらのアーティファクトは、配列決定されると誤って真の変異であるように見える場合がある。末端修復メカニズムの結果としてのこれらのエラーは、配列決定読取の末端をトリミングして、リスクの高い領域で発生した可能性のある任意の変異を除外することにより、配列決定後の解析から排除または削減でき、これによって偽の変異の数を低減できる。一実施形態では、配列決定読取のそのようなトリミングは自動的に達成することができる(例えば、通常のプロセスのステップ)。別の実施形態では、断片末端領域について変異頻度を評価することができ、断片末端領域で変異の閾値レベルが観察される場合、DNA断片の二本鎖コンセンサス配列読取を生成する前に、配列決定読取のトリミングを実行することができる。
DSの鎖比較技術によって提供される高度なエラー訂正は、標準的な次世代配列決定法と比較して、二本鎖核酸分子の配列決定エラーを数桁低減する。このエラーの減少により、ほぼ全てのタイプの配列の配列決定の精確さが向上するが、特にエラーを起こしやすいことが当該技術分野でよく知られている生化学的に困難な配列に特に適している。そのようなタイプの配列の1つの非限定的な例は、ホモポリマーまたは他のマイクロサテライト/短いタンデムリピートである。DSエラー訂正の恩恵を受けるエラーを起こしやすいシーケンスの別の非限定的な例は、例えば、加熱、放射線、機械的ストレス、または1つ以上のヌクレオチドポリメラーゼによるコピー中にエラーを起こしやすい化学付加物を作成する様々な化学物質暴露によって損傷した分子である。さらなる実施形態では、DSは、二本鎖核酸分子の集団間の少数配列バリアントの精確な検出にも使用することができる。本出願の1つの非限定的な例は、対象内の非がん性組織からの多数の非変異分子の中で、がんに由来する少数のDNA分子の検出である。DSによるまれなバリアント検出の別の非限定的な用途は、異なる遺伝子型の別の個体のDNAと低濃度で混合された1人の個体からのDNAの法医学検出である。
DSは、ミトコンドリアDNAおよび核DNAの増幅と配列決定/シーケンサーとの両方に由来するアーティファクトの除去に非常に成功することが示されている。しかしながら、特定の先行研究では、体細胞の点変異と小さな(例えば5bp未満の)挿入および欠失の検出に焦点が当てられていた。法医学分析に関連するいくつかの課題(例えば、PCRスタッターの除去、低レベルのDNA、混合された試料など)に対処する際に、DSは法医学界に大きな期待を抱いている。例えば、図3Aおよび3Bを参照すると、DSは、標準的なMPSと比較したときにPCRスタッターを除去する能力を実証した。この例では、10ngのPromega 2800M標準参照物質DNAからの3つの代表的なCODIS座位を、300bpの対末端読取を備えたIllumina MiSeqプラットフォームで従来のMPS(図3A)およびDS(図3B)を使用して配列決定し、データをSTRait-Razor STR対立遺伝子呼び出しツールによって視覚化した。図3Aは、3つのCODIS座位のそれぞれのCODIS遺伝子型対エラー訂正の非存在下の配列決定読取の数(例えば、従来のMPS)を示す3つのグラフを示し、いくつかのスタッター事象を示す(黒い矢印)。対照的に、図3Bに示すように、DSは同一の3つのCODIS座位のスタッター事象を排除した。同様の結果は、全ての元のCODIS 13座位で見られる。したがって、DS技術の様々な態様は、法医学分析に関して従来の方法論が経験する制限のいくつかを克服することができる。法医学分析の他の態様は、DSの他の用途に加えて、変換効率の様々な態様、またはエラーが訂正された配列データに変換されるインプットDNAのパーセンテージの改善から恩恵を受け得る。法医学分析は、とりわけ、ヒトの犯罪、自然災害、大規模な死傷者の事件、動物または他の生命界の密猟、人身売買または誤用、ヒトまたは動物の遺体の同定、暴行の同定、行方不明者の同定、性的暴行の同定、古生物学的応用、および考古学的応用に関連する用途を指し得る。
DSプロセスの効率に関して、2種類の効率、変換効率とワークフロー効率についてさらに詳しく説明する。DSの効率を議論する目的のために、変換効率は、少なくとも1つの二重鎖コンセンサス配列読取が産生される配列決定ライブラリー調製反応にインプットされる固有の核酸分子の割合として定義することができる。ワークフロー効率は、デュプレックス配列決定ライブラリーを産生するためにこれらのステップを実行するため、および/または目的の配列の標的化濃縮を実行するために必要な時間、相対的なステップ数、および/または試薬/物質の財務コストの相対的な非効率性に関連し得る。
場合によっては、変換効率とワークフロー効率の制限のいずれかまたは両方が、その他では非常に適している一部の用途の高精度DSの有用性を制限する場合がある。例えば、変換効率が低いと、標的二本鎖核酸のコピー数が制限される状況になり、産生される配列情報が望ましい量よりも少なくなる可能性がある。この概念の非限定的な例には、循環腫瘍細胞からのDNA、腫瘍由来の無細胞DNA、または血漿などの体液に流されて他の組織からの過剰なDNAと混ざり合った出生前の乳児が含まれる。DSには通常、10万を超える非変異分子の中から1つの変異分子を分離できる精確さがあるが、例えば試料中で10,000分子しか利用できない場合、およびこれらを二重鎖コンセンサス配列読取に変換する理想的な100%の効率でも、測定できる最低の変異頻度は1/(10,000×100%)=1/10,000となる。臨床診断として、がんまたは治療に関連する変異の低レベルのシグナルを検出するための最大感度を有することが重要である可能性があり、したがって、比較的低い変換効率はこの文脈では望ましくないだろう。同様に、法医学用途では、しばしば、試験に使用できるDNAがほとんどない。犯罪現場または自然災害の現場からナノグラムまたはピコグラムの量しか回収できず、複数の個体からのDNAが混在している場合、混合物中の全ての個体のDNAの存在を検出できるようにするには、変換効率を最大にすることが重要である。
場合によっては、特定の核酸検査用途でワークフローの非効率性が同様に困難になる可能性がある。これの1つの非限定的な例は、臨床微生物検査である。しばしば、1つ以上の感染性生物の性質を迅速に検出することが望ましく、例えば、微生物または多微生物性の血流感染は、いくつかの生物が、その生物が持つ固有の遺伝的変異に基づいて特定の抗生剤に耐性があるが、感染性生物を培養すること、および感染性生物の抗生剤感受性を経験的に決定することにかかる時間は、治療に使用する抗生剤について治療上の決定を下す必要がある時間よりもはるかに長い。血液(または他の感染した組織または体液)からのDNAのDNA配列決定は、より迅速になる可能性があり、例えば、DSは他の高精度配列決定方法の中でも特に、DNAシグネチャーに基づいて、感染集団の治療上重要な少数派バリアントを非常に精確に検出できる。データ生成までのワークフローの所要時間は、治療選択肢を決定するために重要である可能性があるため(例えば、本明細書で使用される例のように)、データ出力に到達する速度を上げる用途も望ましいであろう。
本明細書でさらに開示されるのは、標的化核酸配列の濃縮のための方法および組成物、ならびにコスト、配列決定された分子の変換、および標的化された超高精度配列決定のための標識分子を生成する時間効率の改善を提供するエラーが訂正された核酸配列決定用途のためのそのような濃縮の使用である。
SPLiT-DS
いくつかの実施形態では、提供された方法は、エラー訂正のための分子バーコードの使用と互換性のあるPCRベースの標的化濃縮戦略を提供する。図4は、本技術の一実施形態による、配列決定のためのリンクしたテンプレートの分離PCR(「SPLiT-DS」)方法のステップを利用する配列決定濃縮戦略の概念図である。図4を参照すると、および一実施形態では、SPLiT-DSアプローチは、上記と同様の方法で、および標準的なDSライブラリー構築プロトコールに関して(例えば、図1Bに示されているように)、分子バーコードによって断片化二本鎖核酸材料(例えば、DNA試料から)を標識化(例えば、タグ付け)することで始めることができる。いくつかの実施形態では、二本鎖核酸材料は断片化されている場合がある(例えば、無細胞DNA、損傷したDNAなど)が、他の実施形態では、様々なステップは、超音波処理などの機械的せん断、または本明細書でさらに説明するような他のDNA切断方法を使用した核酸材料の断片化を含むことができる。断片化された二本鎖核酸材料の標識の態様には、特定の用途で必要な場合、末端修復および3’-dA-テーリングが含まれ、その後に二本鎖核酸断片とSMIを含むDSアダプターがライゲーションされる(図4、ステップ1)。他の実施形態では、SMIは、元の核酸分子の両方の鎖からの情報を一意的に関連付けるための内因性または外因性および内因性配列の組み合わせであり得る。アダプター分子を二本鎖核酸材料にライゲーションした後、方法は増幅(例えば、PCR増幅、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、表面結合増幅など)を続けることができる(図4、ステップ2)。
特定の実施形態では、例えば、1つ以上のアダプター配列に特異的なプライマーを使用して、核酸材料の各鎖を増幅し、元の二本鎖核酸分子の各鎖に由来する核酸増幅産物の複数コピーをもたらすことができ、各増幅産物は、元々関連付けられていたSMIを保持している(図4、ステップ2)。増幅および反応副産物を除去するための関連ステップの後、試料を2つ以上の別々の試料(必須ではないが、好ましくは実質的に均等に)に分割することができる(例えば、チューブ中に、エマルション滴中に、マイクロチャンバー中に、表面上の孤立した液滴に、または「チューブ」と総称される他の既知の容器に)(図4、ステップ3)。代替的に、増幅の増幅産物は、例えば、マイクロビーズに結合した後、マイクロビーズの集団を2つのチャンバーに分割するか、または分割した増幅産物を表面上の2つ以上の異なる物理的位置に固定するなど、溶液中に存在する必要のない方法で分割することができる。本明細書では、これらの後者の分割された集団のいずれかを機能的に同等であり、別個の「チューブ」にあるのと同様に称する。図4に示される例では、このステップにより、各チューブで見られる任意の所与の鎖/バーコード増幅産物のコピーの半分の平均が得られる。元の試料が2つを超える別々の試料に分割される他の実施形態では、そのような核酸材料の割り当てにより、増幅産物の数が比較的同等に減少する。増幅産物が分割されるランダムな性質により、この平均に関する分散が生じることに注意されたい。この分散を考慮するために、超幾何分布(つまり、置換なしでk個のバーコードコピーを選択する確率)をモデルとして使用して、SMI(例えば、バーコード)の増幅産物(例えば、PCRコピー)の最小数を決定でき、これは、各チューブが両方の鎖に由来する少なくとも1つのコピーを含む可能性を最大化するために必要である。特定の理論に固執することを望まずに、ステップ2で4サイクル以上のPCRサイクル(つまり、24=16コピー/バーコード)により、各鎖に由来する各バーコードコピーが各チューブに少なくとも1回表れる確率が、99%を超えることが想定される。いくつかの実施形態では、増幅産物を不均一に分割することが好ましい場合がある。核酸材料が2つを超えるチューブに分割される場合、追加の増幅サイクルを使用して、追加のコピーを生成し、さらなる分割に対応することができる。試料を2つのチューブに分割した後、アダプター配列に特異的なプライマーおよび目的の標的核酸領域に特異的なプライマーを使用して、マルチプレックスPCRで標的核酸領域(例えば、目的の領域、座位など)を濃縮できる(図4、ステップ3)。別の実施形態では、目的の標的領域の指数関数的増幅を可能にする第2のプライマーの後続の追加の前に線形増幅ステップを追加することができる。
特定の実施形態では、マルチプレックス標的特異的PCRは、各チューブで得られるPCR産物が2本の鎖のうちの1本のみ(例えば、「トップ鎖」または「ボトム鎖」)に由来するように行われる。図4(ステップ3)に示すように、いくつかの実施形態では、これは以下のように達成される:第1のチューブ(左側に表示)に、アダプター配列(図4、ステップ3、灰色の矢印)の「読取1」(例えば、Illumina P5)に少なくとも部分的に相補的なプライマー、および目的の核酸領域に少なくとも部分的に相補的であり「読取2」(すなわち、Illumina P7、灰色のテールを持つ黒い矢印)アダプター配列を含むプライマーが、元の核酸分子の「トップ鎖」を特異的に増幅(例えば、濃縮)するのに使用される(図4、ステップ3および4)。この第1の試料では、SDEの性質(例えば、この場合、標的核酸インサートに対する固有のアダプター配列の向き)のため、「ボトム鎖」は適切に増幅しない。同様に、第2のチューブ(左側に表示)に、アダプター配列(図4、ステップ3、灰色の矢印)の「読取2」に少なくとも部分的に相補的なプライマー(例えば、Illumina P5)、および目的の核酸領域に少なくとも部分的に相補的であり「読取1」アダプター配列を含むプライマー(すなわち、Illumina P7、灰色の尾を持つ黒い矢印)が、元の核酸分子の「ボトム鎖」を特異的に増幅(例えば、濃縮)するのに使用される(図4、ステップ3および4)。この第2の試料では、「トップ鎖」が適切に増幅しない。PCRまたは他の増幅方法に続いて、「トップ鎖」の複数のコピーが第1のチューブで生成され、「ボトム鎖」の複数のコピーが第2のチューブで生成される。これらの得られた標的特異的なコピーの各々は、核酸増幅産物の各末端で利用可能な両方のアダプター配列を有するため(例えば、Illumina P5およびIllumina P7アダプター配列)、これらの標的濃縮産物は標準的なMPS法を使用して配列決定できる。
図5は、図4に関して示され議論されたSPLiT-DS法のステップの概念図であり、本技術の実施形態によるPCR濃縮標的領域の複数のコピーを配列決定し、二重コンセンサス配列を生成するステップをさらに示す。第1のチューブからの「トップ鎖」の複数のコピーと第2のチューブからの「ボトム鎖」の複数のコピーの配列決定に続いて、シーケンスデータはDSと同様のアプローチで分析でき、これによって元の二本鎖標的核酸分子の「トップ」または「ボトム」の鎖に由来する同一の分子バーコードを共有する配列読取(それぞれ、第1のチューブと第2のチューブに見られる)は別々にグループ化される。いくつかの実施形態では、「トップ鎖」からのグループ化された配列読取は、トップ鎖コンセンサス配列(例えば、一本鎖コンセンサス配列(SSCS))を形成するために使用され、「ボトム鎖」からのグループされた配列読取は、ボトム鎖コンセンサス配列(例えば、SSCS)を形成するために使用される。図5を参照すると、トップとボトムのSSCSを比較して、2つの鎖間で一致するヌクレオチドを有する二重鎖コンセンサス配列(DCS)を生成することができる(例えば、バリアントまたは変異は、療法の鎖に由来する配列決定読取に現れる場合に真とみなされる)(例えば、図1Cを参照されたい)。
具体的な例として、いくつかの実施形態では、本明細書で提供されるのは、二本鎖標的核酸材料を少なくとも1つのアダプター配列にライゲートしてアダプター標的核酸材料複合体を形成するステップを含む二本鎖標的核酸材料のエラーが訂正された配列読取を生成する方法であって、少なくとも1つのアダプター配列は、(a)二本鎖標的核酸材料の各々の分子を一意的に標識する縮重または半縮重単一分子識別子(SMI)配列、ならびに(b)アダプター-標的核酸材料複合体の第1の鎖にタグ付けする第1のヌクレオチドアダプター配列、およびアダプター-標的核酸材料複合体の第2の鎖にタグ付けする第1のヌクレオチド配列に少なくとも部分的に非相補的である第2のヌクレオチドアダプター配列を含み、アダプター-標的核酸材料服が応対の各鎖がその相補的な鎖に対して明確に同定可能なヌクレオチド配列を有するようにされる、方法である。この方法は次に、アダプター-標的核酸材料複合体の各鎖を増幅して複数の第1の鎖アダプター-標的核酸複合体増幅産物および複数の第2の鎖鎖アダプター-標的核酸複合体増幅産物を産生するステップと、アダプター-標的核酸複合体増幅産物を第1の試料と第2の試料に分離するステップと、を含み得る。この方法は、第1のヌクレオチドアダプター配列に少なくとも部分的に相補的な第1のプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して、第1の試料中の第1の鎖を増幅して第1の核酸産物をもたらすステップと、第2のヌクレオチドアダプター配列に少なくとも部分的に相補的な第2のプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して、第2の試料中の第2の鎖を増幅して第2の核酸産物をもたらすステップと、をさらに含み得る。この方法はまた、第1の核酸産物および第2の核酸産物のそれぞれを配列決定して複数の第1の鎖配列読取および複数の第2の鎖配列読取を産生するステップと、少なくとも1つの第1の鎖配列読取および少なくとも1つの第2の鎖配列読取の存在を確認するステップと、を含み得る。この方法は、少なくとも1つの第1の鎖配列読取を少なくとも1つの第2の鎖は利悦読取と比較することと、一致しないヌクレオチド位置を無視することによって、または代替的に、比較された第1および第2の鎖配列読取が非相補的である1つ以上のヌクレオチド位置を有する比較された第1および第2の鎖配列読取を除去することによって、二本鎖標的核酸材料のエラーが訂正された配列読取を生成するステップと、さらに含み得る。
さらなる具体的な例として、いくつかの実施形態では、本明細書で提供されるのは、試料からDNAバリアントを同定する方法であって、核酸材料(例えば、二本鎖標的DNA分子)の療法の鎖を、少なくとも1つの非対称のアダプター分子とライゲートして、二本鎖標的DNA分子のトップ鎖と関連する第1のヌクレオチド配列および第1のヌクレオチド配列に少なくとも部分的に非相補的であり、二本鎖標的DNA分子のボトム鎖と関連する第2のヌクレオチド配列を有するアダプター-標的核酸材料複合体を形成するステップと、アダプター-標的核酸材料の各鎖を増幅して、異なるが、なおも関連する増幅されたアダプター-標的DNA産物のセットを生成する各鎖を得るステップと、を含む方法である。この方法はまた、アダプター-標的DNA産物を第1の試料と第2の試料に分離するステップと、第1のヌクレオチド配列に特異的(例えば、少なくとも部分的に相補的)なプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して第1の試料中のアダプター-標的DNA産物のトップ鎖を増幅して、トップ鎖アダプター-標的核酸複合体増幅産物をもたらすステップと、第2のヌクレオチド配列に特異的(例えば、少なくとも部分的に相補的)な第2のプライマーおよび第2のプライマーを使用して、第2の試料中のボトム鎖を増幅して、ボトム鎖アダプター-標的核酸複合体増幅産物をもたらすステップと、を含み得る。この方法は、トップ鎖アダプター-標的核酸複合体増幅産物とボトム鎖アダプター-標的核酸複合体増幅産物の各々を配列決定するステップと、アダプター-標的DNA複合体の各鎖からの少なくとも1つの増幅された配列読取の存在を確認するステップと、トップ鎖から得られた少なくとも1つの増幅された配列読取をボトム鎖から得られた少なくとも1つの増幅された配列読取とを比較して核酸材料(例えば、二本鎖標的DNA分子)の両方の鎖の配列が一致しているヌクレオチド塩基のみを有する核酸材料(例えば、二本鎖標的DNA分子)のコンセンサス配列読取を形成するステップと、をさらに含み得、コンセンサス配列読取の特定の位置に起こるバリアントが真のDNAバリアントとして同定されるようにする。
いくつかの実施形態では、本明細書で提供されるのは、二本鎖核酸材料からエラー訂正二本鎖コンセンサス配列を生成する方法であって、個々の二重鎖DNA分子をアダプター分子でタグ付けしてタグ付けされたDNA物質を形成するステップであって、各アダプター分子は、(a)二重鎖DNA分子を一意的に標識する縮重または半縮重の単一分子識別子(SMI)、および(b)タグ付けされたDNA分子ごとに、タグ付けされたDNA物質内の個々のDNA分子の元のトップ鎖を元のボトム鎖と区別する第1および第2の非相補的ヌクレオチドアダプター配列を含む、ステップと、タグ付けされたDNA分子の元のトップ鎖の複製のセット、およびタグ付けされたDNA分子の元のボトム鎖の複製のセットを生成して、増幅されたDNA物質を形成するステップと、を含む方法である。この方法はまた、増幅されたDNA物質を第1の試料と第2の試料に分離するステップと、第1のヌクレオチドアダプター配列に特異的なプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して第1の試料中の元のトップ鎖のさらなる複製を生成して第1の核酸産物をもたらすステップと、第2のヌクレオチドアダプター配列(同一または異なる)に特異的なプライマーおよび目的の標的配列に少なくとも部分的の相補的なプライマーを使用して第2の試料中の元のボトム鎖のさらなる複製を生成して第2の核酸産物をもたらすステップと、を含み得る。この方法は、元のトップ鎖のさらなる複製から第1の一本鎖コンセンサス配列(SSCS)を作成し、元のボトム鎖のさらなる複製から第2の一本鎖コンセンサス配列(SSCS)を作成するステップと、元のトップ鎖の第1のSSCSを元のボトム鎖の第2のSSCSと比較するステップと、元のトップ鎖の第1のSSCSと元のボトム鎖の第2のSSCSの両方の配列が相補的であるヌクレオチド塩基のみを有するエラーが訂正された二本鎖コンセンサス配列を生成するステップと、をさらに含み得る。
単一分子識別子配列(SMIs)
様々な実施形態によれば、提供される方法および組成物は、核酸材料の各鎖上に1つ以上のSMI配列を含む。SMIは、二本鎖核酸分子から生じる一本鎖の各々によって独立して運ぶことができ、配列決定後に、各鎖の誘導体増幅産物が同一の元の実質的に固有の二本鎖核酸分子に由来するものとして認識できる。いくつかの実施形態では、SMIは追加の情報を含むことができ、および/または当業者によって理解されるような分子識別機能が有用な他の方法で使用することができる。いくつかの実施形態では、SMI要素は、核酸材料へのアダプター配列ライゲーションの前、実質的に同時に、または後に組み込むことができる。
いくつかの実施形態では、SMI配列には少なくとも1つの縮重または半縮重核酸が含まれ得る。他の実施形態では、SMI配列は非縮重であり得る。いくつかの実施形態では、SMIは、核酸分子のフラグメント末端に関連するかまたはそれに近い配列(例えば、ライゲートされた核酸材料のランダムまたは半ランダムにせん断された末端)であり得る。いくつかの実施形態では、外因性配列は、例えば、互いからの単一DNA分子を区別することのできるようなSMI配列を得るために、ライゲートされた核酸材料(例えば、DNA)のランダムまたは半ランダムにせん断された末端に対応する配列と併せて考慮され得る。いくつかの実施形態では、SMI配列は、二本鎖核酸分子にライゲートされるアダプター配列の一部である。特定の実施形態では、SMI配列を含むアダプター配列は二本鎖であり、二本鎖核酸分子の各鎖は、アダプター配列へのライゲーション後にSMIを含む。別の実施形態では、SMI配列は、二本鎖核酸分子へのライゲーションの前後に一本鎖であり、相補的SMI配列は、DNAポリメラーゼで反対側の鎖を伸長することによって相補的二本鎖SMI配列をもたらすことにより生成できる。いくつかの実施形態では、各SMI配列には約1~約30の核酸(例えば、1、2、3、4、5、8、10、12、14、16、18、20、またはそれ以上の縮重または半縮重核酸)が含まれる。
いくつかの実施形態では、SMIは、核酸材料とアダプター配列の一方または両方にライゲートできる。いくつかの実施形態では、SMIは、核酸材料のT突出、A突出、CG突出、脱ヒドロキシル化塩基、および平滑末端のうちの少なくとも1つにライゲートできる。
いくつかの実施形態では、SMIの配列は、例えば、核酸材料(例えば、ライゲートされた核酸材料)のランダムまたは半ランダムにせん断された末端に対応する配列と合わせて考慮され(またはそれに従って設計され)得、単一の核酸分子を互いに区別できるSMI配列を得る。
いくつかの実施形態では、少なくとも1つのSMIは内因性SMIであり得る(例えば、せん断点に関連するSMI、例えばせん断点自体を使用するか、またはせん断点に直接隣接した[例えば、せん断点から2、3、4、5、6、7、8、9、10ヌクレオチド]核酸材料中のヌクレオチドの定義された数を使用する)。いくつかの実施形態では、少なくとも1つのSMIは外因性SMI(例えば、標的核酸材料に見られない配列を含むSMI)であり得る。
いくつかの実施形態では、SMIは、イメージング部分(例えば、蛍光または他の光学的に検出可能な部分)であり得るか、またはそれを含み得る。いくつかの実施形態では、そのようなSMIは、増幅ステップを必要とせずに検出および/または定量化を可能にする。
一部の実施形態では、SMI要素は、アダプター-標的核酸複合体上の異なる位置に位置する2つ以上の別個のSMI要素を含み得る。
SMIの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されており、その全体が参照により本明細書に組み込まれる。
鎖定義要素(SDE):
いくつかの実施形態では、二本鎖核酸材料の各鎖は、標的二本鎖核酸材料を形成する2つの一本鎖核酸の増幅産物を、配列決定後に互いに実質的に区別可能にする要素をさらに含み得る。いくつかの実施形態では、SDEは、配列決定アダプター内に含まれる非対称プライマー部位であり得るか、それを含み得、または他の配置では、少なくとも1つの位置がプライマー配列内ではなくアダプター配列に導入され得、第1の鎖の標的核酸配列複合体の標的核酸配列複合体の第2の鎖のヌクレオチド配列中の少なくとも1つの位置が、増幅および配列決定後に互いに異なるようにされる。他の実施形態では、SDEは、標準的なヌクレオチド配列A、T、C、GまたはUとは異なるが、2つの増幅および配列決定された分子における少なくとも1つの標準的なヌクレオチド配列の差に変換される2つの鎖間の別の生化学的非対称性を含み得る。さらに別の実施形態では、SDEは、増幅前に2本の鎖を物理的に分離する手段であり得るか、または含み得、第1の鎖標的核酸配列および第2の鎖標的核酸配列からの誘導体増幅産物は、2つの誘導体増幅産物間の区別を維持するために互いに実質的な物理的分離中に維持される。第1および第2の鎖を区別することを可能にするSDE機能を提供するための他のそのような配置または方法論が利用されてもよい。
いくつかの実施形態では、SDEはループ(例えば、ヘアピンループ)を形成し得る。いくつかの実施形態では、ループは少なくとも1つのエンドヌクレアーゼ認識部位を含んでもよい。いくつかの実施形態では、標的核酸複合体は、ループ内の切断事象を促進するエンドヌクレアーゼ認識部位を含み得る。いくつかの実施形態では、ループは非標準的なヌクレオチド配列を含んでもよい。いくつかの実施形態では、含まれる非標準的なヌクレオチドは、鎖切断を促進する1つ以上の酵素によって認識可能であってもよい。いくつかの実施形態では、含まれる非標準的なヌクレオチドは、ループ内の鎖切断を促進する1つ以上の化学プロセスによって標的化され得る。いくつかの実施形態では、ループは、ループ内の鎖切断を促進する1つ以上の酵素的、化学的、または物理的プロセスによって標的化され得る修飾核酸リンカーを含み得る。いくつかの実施形態では、この修飾リンカーは光切断可能なリンカーである。
他の様々な分子ツールがSMIおよびSDEとして機能し得る。せん断点およびDNAベースのタグ以外に、ペア鎖を物理的に近接させる単一分子区画化法または他の非核酸タグ付け法は、鎖関連機能に役立ち得る。同様に、物理的に分離することができるようなアダプター鎖の非対称化学標識は、SDEの役割を果たし得る。最近説明されたDSの改変では、重亜硫酸塩変換を使用して、シトシンのメチル化の形での天然に存在する鎖の非対称性を、2つの鎖を区別する配列の相違に変換する。この組み込みは検出できる変異のタイプを制限するが、天然の非対称性を利用するという概念は、修飾ヌクレオチドを直接検出できる新しい配列決定の技術の文脈では注目に値する。SDEの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されており、その全体が参照により組み込まれる。
アダプターおよびアダプター配列
様々な配置において、SMI(例えば、分子バーコード)、SDE、プライマー部位、フローセル配列、および/または他の特徴を含むアダプター分子は、本明細書に開示される多くの実施形態での使用が企図される。いくつかの実施形態では、提供されるアダプターは、以下の特性の少なくとも1つを有するPCRプライマーに相補的または少なくとも部分的に相補的な1つ以上の配列(例えば、プライマー部位)であり得るか、それらを含み得る:1)高い標的特異性、2)多重化できる、3)堅牢で最小限にバイアスのある増幅を示す。
いくつかの実施形態では、アダプター分子は、「Y字型」、「U字型」、「ヘアピン」型であり得、バブル(例えば、非相補的である配列の一部)、またはその他の特徴を有し得る。他の実施形態では、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」形状、またはバブルを含むことができる。特定のアダプターは、修飾または非標準のヌクレオチド、制限部位、またはインビトロでの構造または機能の操作のための他の特徴を含み得る。アダプター分子は、末端を有する様々な核酸材料にライゲートし得る。例えば、アダプター分子は、核酸材料のT突出、A突出、CG突出、複数ヌクレオチドの突出、脱ヒドロキシル化塩基、および平滑末端にライゲートするのに適切であり得、分子の末端は標的の5’であり、脱リン酸化されるか、そうでなければ従来のライゲーションから保護される。他の実施形態では、アダプター分子は、ライゲーション部位の5’鎖上に脱リン酸化またはそうでなければライゲーション防止修飾を含むことができる。後者の2つの実施形態では、そのような戦略は、ライブラリー断片またはアダプター分子の二量体化を防ぐのに有用であり得る。
アダプター配列は、一本鎖配列、二本鎖配列、相補配列、非相補配列、部分相補配列、非対称配列、プライマー結合配列、フローセル配列、ライゲーション配列、またはアダプター分子によって提供される他の配列を意味し得る。特定の実施形態では、アダプター配列は、オリゴヌクレオチドに対する相補体として増幅に使用される配列を意味し得る。
いくつかの実施形態では、提供される方法および組成物には、少なくとも1つのアダプター配列が含まれる(例えば、核酸材料の5’および3’の各末端に1つずつの2つのアダプター配列)。いくつかの実施形態では、提供される方法および組成物は、2つ以上(例えば、3、4、5、6、7、8、9、10またはそれ以上)のアダプター配列を含んでもよい。いくつかの実施形態では、アダプター配列の少なくとも2つが互いに(例えば、配列ごとに)異なる。いくつかの実施形態では、各アダプター配列は他のアダプター配列とは(例えば、配列ごとに)異なる。いくつかの実施形態では、少なくとも1つのアダプター配列は、少なくとも1つの他のアダプター配列の少なくとも一部に対して少なくとも部分的に非相補的である(例えば、少なくとも1つのヌクレオチドで非相補的である)。
いくつかの実施形態では、アダプター配列は少なくとも1つの非標準ヌクレオチドを含む。いくつかの実施形態では、非標準ヌクレオチドは、脱塩基部位、ウラシル、テトラヒドロフラン、8-オキソ-7,8-ジヒドロ-2’デオキシアデノシン(8-オキソ-A)、8-オキソ-7,8-ジヒドロ-2’-デオキシグアノシン(8-オキソ-G)、デオキシイノシン、5’ニトロインドール、5-ヒドロキシジエチル-2’-デオキシシチジン、イソシトシン、5’-メチルイソシトシン、またはイソグアノシン、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、光切断可能なリンカー、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチドiso-dC、iso dG、2’-O-メチルヌクレオチド、イノシンヌクレオチドロックド核酸、ペプチド核酸、5メチルdC、5-ブロモデオキシウリジン、2,6-ジアミノプリン、2-アミノプリンヌクレオチド、脱塩基ヌクレオチド、5-ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Iリンカー、5’ヘキシニル修飾ヌクレオチド、5-オクタジイニルdU、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、およびそれらの任意の組み合わせから選択される。
いくつかの実施形態では、アダプター配列は、磁気特性を有する部分(すなわち、磁気部分)を含む。いくつかの実施形態では、この磁気特性は常磁性である。アダプター配列が磁気部分(例えば、磁気部分を含むアダプター配列にライゲートされた核酸材料)を含むいくつかの実施形態では、磁場が適用されると、磁気部分を含むアダプター配列は、磁気部分を含まないアダプター部分(例えば、磁気部分を含まないアダプター配列にライゲートされた核酸材料)から実質的に分離される。
いくつかの実施形態では、少なくとも1つのアダプター配列がSMIの5’に位置している。いくつかの実施形態では、少なくとも1つのアダプター配列がSMIの3’に位置している。
いくつかの実施形態では、アダプター配列は、1つ以上のリンカードメインを介してSMIおよび核酸材料のうちの少なくとも1つに連結され得る。いくつかの実施形態では、リンカードメインはヌクレオチドで構成されていてもよい。いくつかの実施形態では、リンカードメインには、(例えば、この開示のいずこかで説明されているように)少なくとも1つの修飾ヌクレオチドまたは非ヌクレオチド分子が含まれ得る。いくつかの実施形態では、リンカードメインはループであり得るか、ループを含み得る。
いくつかの実施形態では、二本鎖核酸材料の各鎖の片端または両端のアダプター配列は、SDEをもたらす1つ以上の要素をさらに含んでもよい。いくつかの実施形態では、SDEは、アダプター配列内に含まれる非対称プライマー部位であり得るか、またはそれを含み得る。
いくつかの実施形態では、アダプター配列は、少なくとも1つのSDEおよび少なくとも1つのライゲーションドメイン(すなわち、少なくとも1つのリガーゼの活性に修正可能なドメイン、例えば、リガーゼの活性による核酸材料へのライゲートに適したドメイン)であり得るか、または含み得る。いくつかの実施形態では、アダプター配列は、5’~3’に向かって、プライマー結合部位、SDE、およびライゲーションドメインであり得るか、それを含み得る。
DSアダプターを合成するための様々な方法は、例えば、米国特許第9,752,188号および国際特許公開第WO2017/100441号に以前に記載されており、これらは両方ともそれらの全体が参照により本明細書に組み込まれる。
プライマー
いくつかの実施形態では、以下の特性の少なくとも1つを有する1つ以上のPCRプライマー:1)高い標的特異性、2)多重化できる、3)堅牢で最小限にバイアスのある増幅を示すが、本技術の態様による、様々な実施形態での使用に企図される。多くの先行研究および市販製品は、従来のPCR-CEのこれらの基準のいくつかを満たすプライマー混合物を設計した。しかしながら、これらのプライマー混合物は、MPSでの使用に必ずしも最適ではないことに留意されたい。実際、高度に多重化されたプライマー混合物の開発は、困難で時間のかかるプロセスである。便利なことに、IlluminaとPromegaの両方が、Illuminaプラットフォーム用のマルチプレックス適合プライマー混合物を最近開発し、様々な標準および非標準のSTRおよびSNP遺伝子座の堅牢かつ効率的な増幅を示している。これらのキットは、配列決定の前にPCRを使用して標的領域を増幅するため、ペアエンド配列データの各読取の5’末端は、DNAの増幅に使用されるPCRプライマーの5’末端に対応する。いくつかの実施形態では、提供される方法および組成物には、均一な増幅を保証するために設計されたプライマーが含まれ、これには、様々な反応濃度、融解温度、二次構造、およびプライマー内/プライマー間相互作用の最小化が必要になる場合がある。MPS用途のための高度に多重化されたプライマー最適化のための多数の技術が説明されている。特に、これらの技術は、当該技術分野でよく説明されているように、ampliseq法としてしばしば知られている。
増幅
提供される方法および組成物は、様々な実施形態において、核酸材料(またはその一部、例えば特定の標的領域または座位)が増幅されて増幅された核酸材料(例えば、いくつかの数の増幅産物)を形成する少なくとも1つの増幅ステップを使用するか、またはその使用である。いくつかの実施形態では、提供される方法には、増幅された核酸材料を、例えば、第1および第2の試料に分離するステップが含まれる。
いくつかの実施形態では、第1の試料中の核酸材料を増幅することは、第1のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドとを使用して、SMI配列が少なくとも部分的に維持されるように、元の二本鎖核酸材料からの単一の核酸鎖に由来する核酸材料を増幅するステップを含む。
いくつかの実施形態では、第2の試料中の核酸材料を増幅することは、第2のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドとを使用して、SMI配列が少なくとも部分的に維持されるように、元の二本鎖核酸材料からの単一の核酸鎖に由来する核酸材料を増幅するステップを含む。
いくつかの実施形態では、増幅された核酸材料は、第2の増幅ステップの前に、3つ以上の試料(例えば、4、5、6、7、8、9、20、20、30、40、50またはそれ以上の試料)に分離され得る。いくつかの実施形態では、各試料には、互いの試料で、ほぼ同一の量の増幅された核酸材料が含まれている。いくつかの実施形態では、少なくとも2つの試料には、実質的に異なる量の増幅された核酸材料が含まれている。
いくつかの実施形態では、第1の試料または第2の試料の核酸材料を増幅することには、「チューブ」(例えば、PCRチューブ)、エマルション滴、マイクロチャンバー、および上記の他の例または他の既知の容器内の試料を増幅することが含まれる。
いくつかの実施形態では、少なくとも1つの増幅ステップは、少なくとも1つの非標準ヌクレオチドであるかまたはそれを含む少なくとも1つのプライマーを含む。いくつかの実施形態では、非標準ヌクレオチドは、ウラシル、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、ビオチン化ヌクレオチド、ロックド核酸、ペプチド核酸、高Tm核酸バリアント、対立遺伝子識別核酸バリアント、本明細書のいずこかに記載されている他のヌクレオチドまたはリンカーバリアント、およびそれらの任意の組み合わせから選択される。
用途に適した任意の増幅反応はいくつかの実施形態に適合すると考えられるが、特定の例として、いくつかの実施形態では、増幅するステップは、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、等温増幅、エマルション内のポロニー増幅、表面、ビーズの表面またはヒドロゲル内部のブリッジ増幅、およびそれらの任意の組み合わせであり得るか、またはそれを含み得る。
いくつかの実施形態では、核酸材料の試料の一部(例えば、アダプター配列)に特定の修飾がなされ得る。例として、いくつかの実施形態では、第1の試料中の核酸材料を増幅することは、分離するステップの後、および第1の試料を増幅することの前に、核酸材料上に見られる第2のアダプター配列の一部または全てを破壊または崩壊することをさらに含み得る。さらなる特定の例として、いくつかの実施形態では、第2の試料中の核酸材料を増幅することは、分離するステップの後、および第2の試料を増幅することの前に、核酸材料上に見られる第1のアダプター配列の少なくとも一部を破壊または崩壊することをさらに含み得る。いくつかの実施形態では、破壊または崩壊することが、酵素消化(例えば、エンドヌクレアーゼおよび/またはエクソヌクレアーゼによる)、少なくとも1つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、切断または一方もしくは両方の鎖をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、8-オキソ-グアニン付加物の組み込み、配列特異的制限エンドヌクレアーゼの使用、標的化エンドヌクレアーゼの使用、およびそれらの任意の組み合わせの少なくとも1つであり得るか、またはそれを含み得る。いくつかの実施形態では、プライマー部位破壊または崩壊に加えて、またはその代替として、親和性プルダウン、サイズ選択、または試料から望ましくない核酸材料を除去および/または増幅しない他の既知の技術などの方法が考えられる。
いくつかの実施形態では、少なくとも部分的な破壊の標的とする望ましくない第1の増幅産物は、2つの別個のプライマー結合部位ではなく分子の各末端に2つの類似のプライマー結合部位を最終的に含む標的化プライマーによる第2の増幅に続く第2の増幅産物をもたらす。いくつかの実施形態では、そのような構造は、MPS DNA配列の性能または効率にとって問題となり得る。
いくつかの実施形態では、核酸材料を増幅することが、目的の標的領域または標的配列(例えば、ゲノム配列、ミトコンドリア配列、プラスミド配列、合成的に産生された標的核酸など)に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、およびアダプター配列(例えば、プライマー部位)の領域に少なくとも部分的に相補的な少なくとも1つの一本鎖オリゴヌクレオチドの使用を含む。いくつかの実施形態では、核酸材料を増幅することは、核酸材料の各鎖の5’および3’末端のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む。
一般に、例えばPCR増幅のような堅牢な増幅は、反応条件に大きく依存する。例えば、マルチプレックスPCRは、緩衝剤組成、1価または2価のカチオン濃度、界面活性剤濃度、密集剤(すなわち、PEG、グリセロールなど)濃度、プライマー濃度、プライマーTm、プライマー設計、プライマーGC含有量、プライマー修飾ヌクレオチドの特性、およびサイクル条件(すなわち、温度と伸長時間、および温度変化率)に影響されやすい。緩衝剤条件の最適化は、困難で時間のかかるプロセスであり得る。いくつかの実施形態では、増幅反応では、以前に既知の増幅プロトコールに従って、緩衝剤、プライマープール濃度、PCR条件の少なくとも1つを使用できる。いくつかの実施形態では、新しい増幅プロトコールを作成することができ、および/または、増幅反応最適化を使用することができる。特定の例として、いくつかの実施形態では、マルチプレックス、リアルタイム、GCリッチ、阻害剤耐性増幅などの様々なPCR用途のために部分的に最適化された多数の事前に調製された緩衝剤が含まれる、Promega(登録商標)のPCR最適化キットなどのPCR最適化キットを使用できる。これらの事前に調製された緩衝剤には、種々なMg2+およびプライマー濃度、ならびにプライマープール比を迅速に補充できる。さらに、いくつかの実施形態では、様々なサイクル条件(例えば、熱サイクル)が評価および/または使用し得る。特定の実施形態が特定の所望の用途に適切であるかどうかを評価する際に、他の態様の中でも特に、特異性、ヘテロ接合座位の対立遺伝子包含率、座位間バランス、および深度のうちの1つ以上を評価してもよい。増幅の成功の測定には、産物のDNA配列決定、ゲルまたはキャピラリー電気泳動またはHPLCまたはその他のサイズ分離法とそれに続く断片の視覚化による産物の評価、二本鎖核酸結合色素または蛍光プローブを使用した融解曲線分析、質量分析、または当該技術分野で既知の他の方法が含まれ得る。
様々な実施形態によれば、様々な要因のいずれかが特定の増幅ステップの長さ(例えば、PCR反応のサイクル数など)に影響を与える可能性がある。例えば、いくつかの実施形態では、提供された核酸材料は、損傷しているか、さもなければ最適以下である(例えば、分解および/または混入されている)可能性がある。そのような場合、より長い増幅ステップは、所望の産物が許容可能な程度に増幅されることを確実にするために役立ち得る。いくつかの実施形態では、増幅ステップは、各開始DNA分子から平均3~10個の配列決定されたPCRコピーを提供し得るが、他の実施形態では、トップ鎖およびボトム鎖のそれぞれの単一コピーのみが必要である。特定の理論に固執することを望まずに、PCRコピーが多すぎる、または少なすぎると、アッセイの効率が低下し、最終的に深度が低下する可能性がある。一般に、増幅(例えば、PCR)反応で使用される核酸(例えば、DNA)断片の数は、同一のSMI/バーコード配列を共有する読取の数を決定できる主要な調整可能な変数である。SPLiT-DSは追加のPCRステップを使用し、いくつかのこれまでに記載された方法のようにハイブリダイゼーションベースの標的化捕捉を使用する必要がないため、従来の方法を使用して報告された二本鎖核酸のインプット量の要件は、より効率的である可能性がある現在提供されている方法に直接変換できない可能性がある。
プライマー部位破壊
図6~図9Bは、本技術の追加の実施形態による様々なSPLiT-DS方法のステップの概念図である。上述のように、および図4-6を参照して、SPLiT-DSに関連する方法のステップは、SMIおよび複数の試料に分離できる増幅の第1の回後の非対称プライマー部位(例えば、IlluminaP5およびP7プライマーに関する、図6)を含む追加のアダプター配列でタグ付けされた第1および第2の鎖増幅産物(例えば、α、α’、β、β’、図6)を有する増幅された核酸材料をもたらす。図7は、ネステッドPCR反応が、別個の反応試料(例えば、チューブ)中の元の核酸分子のトップおよびボトム鎖の濃縮された増幅を提供できる後続のステップを示す。図7に示すように、所望の増幅産物の濃縮に加えて、いくつかの望ましくない増幅産物およびその後の配列決定読取が生成され得る。したがって、およびいくつかの実施形態では、効率が低下する場合がある(例えば、SPLiT-DSで使用するための所望の産物のパーセントは、SPLiT-DSプロトコールでは有用でない産物に比べて低い場合がある)。
本技術のさらなる態様によれば、望ましくない増幅産物の増幅および配列決定を低減および/または排除するための1つ以上の戦略を採用することにより、変換効率およびワークフロー効率の様々な態様が向上し得る。いくつかの実施形態では、プライマー部位破壊または崩壊(例えば、アダプター配列内のプライマー部位破壊)は、増幅の第1の回および増幅された核酸材料の複数の試料への分離後、特定の核酸産物を濃縮する方法として使用できる(例えば図8Aのように)。いくつかの実施形態では、提供される方法には、二本鎖プライマー部位破壊の使用が含まれ得る。本明細書では、プライマー部位破壊のいくつかの方法が企図される。図8A~8Dは、二本鎖プライマー部位破壊スキームを組み込んだSPLiT-DS法のステップの概念図である。二本鎖プライマー部位破壊は、第1の増幅ステップで使用される修飾プライマーを介した標的化鎖へのプライマー部位修飾の導入を含む、様々な手段で達成可能であり得る(例えば、図6)。いくつかの実施形態では、第1のPCRのプライマーは、ウラシル、メチル化、RNA塩基、8-オキソ-グアニンを含む修飾、または後のステップで標的化され得る他の修飾を有し得る。いくつかの実施形態では、プライマー部位破壊は、例えば、アダプター配列に存在する配列の、制限酵素または他の標的化エンドヌクレアーゼ(Cas9、CPF1など)による消化であり得るか、または含み得、制限部位の可能性は、目的の配列に生じる可能性が低いと判断されている。
特定の実施形態では、破壊されるべきプライマー配列に相補的なオリゴヌクレオチドを特定の試料に添加し、続いて二本鎖DNAに特異的な標的化エンドヌクレアーゼで調べることができる。別の特定の実施形態では、メチル基を有するハイブリダイズするオリゴを使用して、メチル化特異的制限エンドヌクレアーゼを相補的プライマー部位に動員することができる。図8Aに示すように、二本鎖プライマー部位破壊(例えば、試料中の非標的鎖の両方のコピー上のプライマー部位破壊)を使用して、チューブ1中の「トップ鎖」と「ボトム鎖」の両方のコピーから「P5」プライマー配列を破壊、無効化または除去することができる。同様に、チューブ2中で、「トップ鎖」と「ボトム鎖」の両方のコピーから「P7」プライマー配列を選択的に破壊、無効化、または除去することができる。図8Bは、試料中のプライマー配列を選択的に破壊するための一例の概念図である。図8Bに示すように、第1の試料は、第1のプライマー配列(例えば、Illumina「P5」)に見られる部位を選択的に切断する第1の制限エンドヌクレアーゼ(例えば、MspJI)によって処理し、それにより第1の試料中の全ての核酸材料の第1のプライマー部位を破壊することができる。同様に、第2の試料は、第2のプライマー配列(例えば、Illumina「P7」)に見られる部位を選択的に切断する第2の制限エンドヌクレアーゼ(例えば、FspEI)によって処理し、それにより第2の試料中の全ての核酸材料の第2のプライマー部位を破壊することができる。
図8Aおよび8Cを合わせて参照すると、「P7」プライマーおよび「P5」プライマー部位テールを有する標的配列プライマー(例えば、遺伝子特異的プライマー)を使用してチューブ1中の産物を選択的に増幅する(1回または複数の線形サイクルを延長する)ことによって、「P7」と「P5」プライマー部位の両方を組み込んだ「ボトム鎖」種のみが生成され(例えば、図8Cを参照されたい)、チューブ1中の他の核酸種は指数関数的に増幅も配列決定もできない(例えば、「P5」プライマー部位を欠く)。同様に、「P5」プライマーおよび「P7」プライマー部位テールを有する標的配列プライマー(例えば、遺伝子特異的プライマー)を使用してチューブ2中の産物を選択的に増幅する(1回または複数の線形サイクルを延長する)ことによって、「P5」と「P7」プライマー部位の両方を組み込んだ「トップ鎖」種のみが生成され(例えば、図8Cを参照されたい)、チューブ2中の他の核酸種は指数関数的に増幅も配列決定もできない(例えば、「P5」プライマー部位を欠く)。望ましくない線形産物は配列決定も指数関数的に増幅もしないが、それらはプライマーやdNTPを消費する可能性があり、そのような反応の効率に影響を与える可能性があることを理解されたい。
いくつかの実施形態では、プライマー部位破壊を含む方法では、1つ以上のビオチン化または他の標的化プライマーを使用することもできる。図8Dは、本技術の別の実施形態による二本鎖プライマー部位破壊スキームを組み込んだSPLiT-DS法のステップの概念図である。図8Dに示される実施形態では、「P5」プライマー部位テールまたは「P7」プライマー部位テールを有する標的配列プライマーがビオチン化される。図8Dを参照し、ビオチン化標的化プライマーによる伸長ステップに続いて、ストレプトアビジンビーズまたはヒドロゲル濃縮を使用して、2つのプライマー部位を有する産物を濃縮し、それにより1つのプライマー部位のみを有する核酸種の大部分を排除することができる。いくつかのそのような実施形態において、そのような濃縮は、PCR効率を改善し、および/または多重化アプローチを促進し、および/またはMPS DNAシーケンサーでのクラスター増幅効率を改善し、および/またはMPS DNAシーケンサーでより有用な配列決定データを生成することが起こり得る。
ビオチン/ストレプトアビジン濃縮により捕捉された種のオフターゲット濃縮をさらに制限するために、ネステッドプライマー(例えば、「P5」または「P7」プライマーおよび反対のフローセル配列を有する内部にネステッド第2の標的化プライマー)によるさらなる増幅を使用して、オンターゲット種をさらに濃縮し、望ましくない増幅産物を減らすことができる。特定の実施形態では、例えば、目的の標的配列に特異的なプライマーを使用する選択的線形増幅は、指数関数的増幅のための対になったネステッドプライマーの添加前に、所望の種をさらに濃縮できる。
いくつかの実施形態では、一本鎖プライマー部位破壊が使用され得る。図9Aおよび9Bは、本技術のさらなる態様による一本鎖プライマー部位破壊スキームを組み込んだSPLiT-DS法のステップの様々な実施形態の概念図である。非限定的な例として、図9Aに示すように、SPLiT-DSの第1の増幅ステップ中に修飾プライマー(図示せず)を使用することにより、二本鎖分子の一方の鎖のプライマー部位を破壊することができる(例えば、図6を参照されたい)。修飾されたプライマーは、影響を受ける鎖上のプライマー部位の破壊または無効化の後に標的化することができる化学修飾(例えば、ウラシル、メチル化、RNA塩基、8-オキソ-グアニンなど)などを含むことができる。「P7」プライマーと特別に標識(例えば、ビオチン、異なるフローセルアダプターテールなど)された標的配列プライマー(例えば、遺伝子特異的プライマー)を使用した、チューブ1中の所望の標的のその後の増幅(1回または複数の線形サイクルの延長)により、「P7」と特別な標識(例えば、ビオチン、異なるプライマー部位など)の両方を組み込んだ「ボトム鎖」種のみが生成される(例えば、図9Aを参照されたい)が、チューブ1中の他の核酸種は指数関数的に増幅しない。次のステップでは、ストレプトアビジンビーズ濃縮(図示せず)により、または「P7」プライマーおよび異なるプライマー部位相補体を持つ修飾プライマーおよび「P5」プライマー部位を持つフローセルアダプターテールによるさらなる増幅により、望ましくない産物がさらに選択される(図9B)。「P7」および「P5」プライマーによる最終増幅反応により、チューブ1試料中で濃縮された「ボトム鎖」産物が得られる(図9B)。チューブ2の試料中の相補ステップは、「トップ鎖」産物を濃縮するために実行できる(図9B)。特定の理論に拘束されることを望まないが、二本鎖プライマー部位消化の選択肢が利用可能な場合、そのような選択肢は一本鎖消化よりも好ましい場合がある。
さらなる実施形態では、図6~図9Bに関して説明したスキームの1つ以上を組み合わせてもよく、または特定の効率改善を依然として達成しながら特定のステップを削除してもよい。例えば、一実施形態では、ビオチン化標的化プライマーは、伸長ステップ中に使用することができ(例えば、図6に示す方法のステップに続いて)、その後のストレプトアビジンプローブ化を使用して、目的の鎖を回収することができる。この実施形態(例えば、プライマー部位破壊を伴わない)では、同一のプライマー部位の2つ(例えば、2つの「P5」プライマー部位、2つの「P7」プライマー部位)を有する種も回収される。
捕捉された分子ごとに複数のPCR
特定の用途では、核酸切断点が標的特異的プライマーに近づくことができず、短い断片または完全に欠落した領域が生じる可能性があるため、標的化領域または配列は配列決定が困難な場合がある。例えば、循環腫瘍DNAまたは循環胎児DNAなどのランダムにせん断されたDNAまたは循環無細胞DNA(cfDNA)の試料には、取得できない標的配列を有する場合がある(例えば、配列決定読取で検出/または包含されない)。いくつかの実施形態では、提供される方法は、標的配列のスタガー(staggered)部分に相補的な複数の標的プライマーの使用などにより、標的配列内の複数の領域を標的化することにより、そのような課題を克服することができる(例えば、各プライマーが標的配列の異なる領域を標的化する)。短い断片に関連する課題を回避するために、そして一実施形態では、最適な配列決定に典型的に望ましくなり得るよりも大きな断片にDNAをせん断することができる。図10は、本技術のさらに別の実施形態による、より長い核酸分子の二重鎖コンセンサス配列を生成するための複数の標的化プライマーを使用するSPLiT-DS法のステップの概念図である。
図10を参照すると、提供される方法は、複数の増幅プライマー、例えば、目的の標的配列の領域(例えば、約100BP離れている)をそれぞれ標的とする複数のプライマーの使用を含み得る。様々な実施形態によれば、そのようなアプローチは、例えば、近くのまたは隣接するプライマーが互いに相互作用するのを避けるために、単一の反応(例えば、チューブ)で、または他の実施形態では、複数の反応(例えば、チューブ)で実行され得る。いくつかの実施形態では、同一のチューブ内での複数のスタガープライマーの相互作用を防止することは、下流からプライミングするプライマーがさらに上流からプライミングするプライマーを阻止しないように、鎖置換ポリメラーゼで伸長を実行することで軽減できる。いくつかの実施形態では、伸長は、第1のプライマーでいくつかの線形サイクルで実行され、その後クリーンアップ、第2のプライマーでの別のセットの伸長などが実行される。図10に示すように、ネステッドプライマーセットは、後で配列決定できる異なる長さの増幅産物を生成する。全ての増幅産物の読取1は同一の配列情報を生成するが、増幅産物A、B、およびCのそれぞれからのペアエンド配列読取は、読取1配列情報と合わせて、従来、MPSまたは標準的なDSプロトコールで可能であったものよりも長い長さの組み合わされた配列を提供するスタガー配列決定情報をもたらす。
いくつかの実施形態では、マルチプライマーデータの分析は、他のDS法に対して非標準のメソッドで実施される。当業者には理解されるように、多重化された試料は同一のタグを持つ様々な長さの生成物を含むことがあるため、マルチプライマー配列読取の二重鎖アセンブリはSMIタグ単独では不可能である。この課題に対処するために、いくつかの実施形態は、SMIと標的プライマー開始部位の配列(例えば、ゲノム)位置との組み合わせであるタグによる二重鎖のアセンブリを含む。いくつかの実施形態では、二重鎖アセンブリの後、一般的なSMIを有し、長さが異なる二重鎖読取についてのデータを評価できる。いくつかの実施形態では、個々の二重鎖ファミリーは、集合的な「多重読取二重鎖ファミリー」にまとめることができる。いくつかのそのような実施形態は、特定の用途に有利であり、短い読取配列決定プラットフォームで標的核酸分子の有効な遺伝子型決定の長さを増加させる、より長い単一分子読取へのDS標的化領域のサブアセンブリを促進し得ると考えられる。
当業者に知られているように、Illumina NextSeqで現在取得できる最長の連続読取は約300BPであり、酵素標的化とプライマーがこの長さに実質的に近い断片を産生するように慎重に設計されている限り、中間で一致するペアエンド150BP読取である。したがって、本明細書に記載されるマルチプライマーアプローチを組み込んだ実施形態は、いくつかの実施形態では、より長い全分子DS配列を達成し得る。
いくつかの態様では、提供される方法は、いくつかの実施形態では、SPLiT-DSと組み合わせた複数の標的化プライマーが、とりわけ、(i)単一の長い分子の連続配列、および必要に応じて、(ii)高い特異性および/または(ii)DSの精確さを達成し得る。ここで提供される方法は、例えば、次のような用途で有用である可能性が高いと考えられる:長く、精確な連続読取が必要な用途、デノボゲノムアセンブリ、固有のマッピングが困難な反復領域(すなわち、反復配列を持つゲノムの領域)でアッセイを実行すること、特に困難であると考えられる領域の配列決定(例えば、HLA座位、がん偽遺伝子、マイクロサテライト)、がん(例えば、薬物感作性変異、耐性変異)、ハプロタイプ分析(例えば、循環胎児DNA(例えば、母性、父性、または胎児起源)における変異の起源の評価)などのバリアントの同時発生のアッセイ、メタゲノミクス(例えば、抗生剤耐性)、特定の酵素の制限を克服すること(例えば、Cas9と、酵素認識部位の位置に基づいて特定の領域をどれだけ離す必要があるかの制限)、大規模な構造的再配置、および/またはインデルなど。
核酸材料を処理するためのさらなる実施形態
いくつかの実施形態では、配列決定プロセスの効率、精確さ、および/または速度を改善するために、核酸材料を処理することが有利である。本技術のさらなる態様によれば、例えば、DSおよび/またはSPLiT-DSの効率は、標的化核酸の断片化によって増強され得る。古典的に、核酸(例えば、ゲノム、ミトコンドリア、プラスミドなど)の断片化は、物理的なせん断(例えば、超音波処理)またはDNAホスホジエステル結合を切断するために酵素カクテルを利用するやや非配列特異的な酵素的アプローチのいずれかによって達成される。上記のいずれかの方法の結果は、無傷の核酸材料(例えば、ゲノムDNA(gDNA))がランダムまたは半ランダムのサイズの核酸断片の混合物に減少された試料である。これらのアプローチは効果的であるが、可変サイズの核酸断片を生成し、増幅バイアス(例えば、短い断片は長い断片よりもPCR増幅し、ポロニー形成中にクラスターがより容易に増幅する傾向がある)および不均一な配列決定の深度をもたらし得る。例えば、図11Aは、核酸インサートのサイズと増幅後に生じるファミリーサイズとの関係をプロットしたグラフである。図11Aに示すように、より短い断片は優先的に増幅する傾向があるため、これらのより短い断片のそれぞれのより多くのコピーが生成および配列決定され、これらの領域の不均衡なレベルの配列決定の深度が提供される。さらに、より長いフラグメントでは、配列決定読取の限界間(またはペアエンド配列決定読取の末端間)のDNAの一部を調査できず、ライゲート、増幅、および捕捉に成功したにもかかわらず「暗い」である(図11B)。同様に、短い読取の場合、およびペアエンド配列決定を使用するとき、両方の読取から分子の中央で同一の配列を読み取ることで、冗長な情報が得られ、費用効率が低くなる(図11B)。ランダムまたは半ランダムな核酸断片化は、ハイブリッド捕捉のベイト鎖と相補性または相補性が低下している可能性のある断片を生成する標的分子の予測不可能な切断点をもたらし、それにより標的捕捉効率を低下させる。ランダムまたは半ランダムな断片化はまた、目的の配列を破壊、およびまたはライブラリーの調製の他の段階で失われる非常に小さいまたは非常に大きい断片をもたらし、データの収量と効率を低下させる可能性がある。
ランダム断片化の多くの方法、特に機械的または音響的方法のもう1つの問題は、二本鎖DNAの一部が二本鎖でなくなる可能性がある二本鎖切断を超える損傷をもたらすことである。例えば、機械的せん断により、分子の端に3’または5’の突出、および分子の中央に一本鎖のニックが生じることがある。「末端修復」酵素のカクテルなどのアダプターライゲーションに適したこれらの一本鎖部分は、それをもう一度人工的に二本鎖にするために使用され、人為的エラーの原因になる可能性がある「偽二重分子」に関して上述されるものなど)。多くの実施形態では、取り扱い中に天然の二本鎖形態のままである目的の二本鎖核酸の量を最大化することが最適である。
したがって、いくつかの実施形態では、提供される方法および組成物は、標的化エンドヌクレアーゼ(例えば、リボ核タンパク質複合体(Cas9、Cpf1などのCRISPR関連エンドヌクレアーゼ)、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、アルゴノートヌクレアーゼ、および/またはメガヌクレアーゼ(例えば、megaTALヌクレアーゼなど)、またはそれらの組み合わせ)、または核酸材料を切断して配列決定のための最適な断片サイズで目的の標的配列を切り出すことができる他の技術(例えば、1つ以上の制限酵素)を利用する。いくつかの実施形態では、標的化エンドヌクレアーゼは、目的の正確な配列領域を特異的かつ選択的に切除する能力を有する。図11Cは、本技術の一実施形態による、CRISPR/Cas9によって特定のサイズに切断され標的化断片を生成し、配列決定情報を生成するための方法のステップを示す概略図である。例えば、所与の実質的に均一なサイズの断片(図11C)をもたらすプログラム可能なエンドヌクレアーゼ(例えば、CRISPR関連(Cas)酵素/ガイドRNA複合体)を使用して切断部位を事前に選択することにより、バイアス、および情報のない読取の存在を大幅に減らすことができる。さらに、切除された断片と残りの非切断DNAのサイズの相違により、サイズ選択ステップ(以下でさらに説明する)を実行して、大きなオフターゲット領域を除去し、任意のさらなる処理ステップの前に、試料を事前に濃縮することができる。末端修復ステップの必要性も同様に減少または排除される可能性があり、したがって、時間と偽二重化の課題のリスクを節約し、場合によっては、分子の末端近くのデータの計算によるトリミングの必要性を削減または排除して、効率を改善する。
制限エンドヌクレアーゼ
様々な制限エンドヌクレアーゼ(すなわち、酵素)のいずれかを使用して、実質的に均一な長さの核酸材料を提供できることが特に考えられている。一般に、制限酵素は通常、特定の細菌/他の原核生物によって産生され、DNAの特定のセグメントの特定の配列で、その近くで、またはその間を切断する。
特定の部位、または代替的に、切断のための制限部位を作成するために生成される部位で切断するように制限酵素が選択されることは、当業者には明らかであろう。いくつかの実施形態では、制限酵素は合成酵素である。いくつかの実施形態では、制限酵素は合成酵素ではない。いくつかの実施形態では、本明細書で使用される制限酵素は、酵素自体のゲノム内に1つ以上の変化を導入するように修飾されている。いくつかの実施形態では、制限酵素は、DNAの特定の部分内の定義された配列間で二本鎖切断を産生する。
いくつかの実施形態に従って任意の制限酵素(例えば、I型、II型、III型、および/またはIV型)を使用してもよいが、以下は、使用できる制限酵素の非限定的な一覧を表す:AluI、ApoI、AspHI、BamHI、BfaI、BsaI、CfrI、DdeI、DpnI、DraI、EcoRI、EcoRII、EcoRV、HaeII、HaeIII、HgaI、HindII、HindIII、HinFI、KpnI、MamI、MseI、MstI、MstII、NcoI、NdeI、NotI、PacI、PstI、PvuI、PvuII、RcaI、RsaI、SacI、SacII、SalI、Sau3AI、ScaI、SmaI、SpeI、SphI、StuI、XbaI、XhoI、XhoII、XmaI、XmaII、および任意のそれらの組み合わせ。適切な制限酵素の広範囲であるが完全に網羅されていない一覧は、公開されているカタログおよびインターネットで見つけることができる(例えば、New England Biolabs, Ipswich, MA, U.S.A.で入手できる)。
標的化エンドヌクレアーゼ
標的化エンドヌクレアーゼ(例えば、Cas9またはCpf1などのCRISPR関連リボ核タンパク質複合体、ホーミングヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、megaTALヌクレアーゼ、アルゴノートヌクレアーゼ、および/またはその誘導体)を使用して、配列決定用途のためにそのような標的化部分を濃縮する目的で、核酸材料の標的化部分を選択的に切断および切除することができる。いくつかの実施形態では、例えば、強化された熱安定性、耐塩性、および/またはpH耐性を提供するためのアミノ酸置換を有するなど、標的化エンドヌクレアーゼを修飾することができる。他の実施形態では、標的化エンドヌクレアーゼは、ビオチン化され、ストレプトアビジンと融合され、および/または他の親和性に基づいた(例えば、バイト/プレイ)技術を組み込んでもよい。特定の実施形態では、標的化エンドヌクレアーゼは、改変された認識部位特異性を有し得る(例えば、改変されたPAM部位特異性を有するSpCas9バリアント)。本明細書では、CRISPRベースの標的化エンドヌクレアーゼをさらに説明して、標的化エンドヌクレアーゼの使用のさらに詳細な非限定的な例を提供する。そのような標的ヌクレアーゼ周辺の命名法は流動的であることに留意されたい。本明細書の目的のために、「CRISPERベース」という用語を使用して、一般に、切断される核酸配列を再定義するためにその配列を修飾できる核酸配列を含むエンドヌクレアーゼを意味する。Cas9とCPF1は現在使用されているこのような標的化エンドヌクレアーゼの例であるが、自然界の様々な場所に存在するものがさらに多くあり、このような標的化された容易に調整可能なヌクレアーゼの様々な種類が今後数年間で急速に増加すると予想される。同様に、これらの酵素の特性を強化または改変するための、これらの酵素の複数の改変バリアントが利用可能になりつつある。本明細書では、本明細書に明示的に記載されていないか、またはまだ発見されていない実質的に機能的に類似の標的化エンドヌクレアーゼの使用を明示的に企図し、記載された開示と同様の目的を達成する。
CRISPR-DS
本技術のさらなる態様は、プログラム可能なエンドヌクレアーゼCRISPR/Cas9を使用して目的の領域を濃縮する方法に関する。特に、CRISPR/Cas9(または他のプログラム可能なエンドヌクレアーゼ)を使用して、1つ以上の目的の配列領域を選択的に切除でき、切除された標的領域は1つ以上の所与の長さになるように設計されているため、DSおよびSPLiT-DSなどの配列決定用途のためのライブラリーの調製前にサイズ選択を可能にする。これらのプログラム可能なエンドヌクレアーゼは、単独で、または制限エンドヌクレアーゼなどの他の形態の標的化ヌクレアーゼと組み合わせて使用することができる。CRISPR-DSと呼ばれるこの方法は、非常に高度のオンターゲット濃縮を可能にし(後続のハイブリッド捕捉ステップの必要性を減らすことができる)、時間とコストを大幅に削減し、変換効率を高めることができる。図12A~12Dは、本技術の一実施形態によるCRISPR-DS法のステップの概念図である。例えば、CRISPR/Cas9を使用して、標的配列内の1つ以上の特定の部位(例えば、PAM部位)を切断できる(図12A;この例ではTP53標的領域)。図12Bは、SPRI/Ampureビーズおよび磁石精製を使用して切除された標的部分を単離して、所与のより短い断片を残しながら高分子量DNAを除去する1つの方法を示す。他の実施形態では、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、およびろ過精製法を含むがこれらに限定されない様々なサイズ選択方法を使用して、所与の長さの切除部分を望ましくないDNA断片および他の高分子量ゲノムDNA(該当する場合)から分離することができる。サイズ選択後、CRISPR-DS法には、Aテーリング(CRISPR/Cas9切除により平滑末端が残る)、DSアダプターのライゲーション(図12C)、二重鎖増幅(図12D)、各鎖の配列決定および二重鎖コンセンサス配列(図12D)の生成前の捕捉ステップおよび指標増幅(例えばPCR)を含む、DSメソッドのステップ(例えば、図12Eを参照されたい)と一致するステップが含まれる。図12Eで明らかなワークフロー効率の改善に加えて、CRISPR-DSは高効率の増幅および配列決定ステップに最適な断片長を提供する(図12F)。
特定の実施形態では、CRISPR-DSは、例えば、CRISPRベースのサイズ選択により最適化され得る非効率的な標的濃縮、エラーが訂正された二重鎖コンセンサス配列を生成するためのDS方法論を使用して削除できる配列エラー、事前に設計されたCRISPR/Cas9断片化によって緩和される不均一な断片サイズを含む、NGSに関連する複数の一般的な問題を解決する(表1)。
表1、TP53のCRISPR/Cas9消化のためのcrRNA配列
Figure 0007256748000001
Target description:標的の説明、Name:名称、Sequence plus pam sige:配列+pam部位、
Position start:開始位置、Position end:収量位置、Zhang score:Zhangスコア
upstream of exon 11:エクソン11の上流
downstream of exon 11:エクソン11の下流
upstream of exon 10:エクソン10の上流
downstream of exon 10:エクソン10の下流
upstream of exon 9-8:エクソン9-8の上流
downstream of exon 9-8:エクソン9-8の下流
downstream of exon 7:エクソン7の下流
upstream of exon 6-5:エクソン6-5の上流
downstream of exon 6-5:エクソン6-5の下流
upstream of exon 4-3:エクソン4-3の上流
downstream of exon 4-3:エクソン4-3の下流
downstream of exon2:エクソン2の下流
Cas9ヌクレアーゼによるDNA物質のインビトロ消化では、リボ核タンパク質複合体の形成を利用し、これは、所与の部位(例えば、PAM部位、図11C)を認識および切断する。この複合体は、ガイドRNA(「gRNA」、例えばcrRNA+tracrRNA)とCas9で形成される。多重切断の場合、全てのcrRNAをプールしてからtracrRNAと複合体化することによってか、または各crRNAとtracrRNAを別々に複合体化してからプールすることによって、gRNAを複合体化できる。いくつかの実施形態では、crRNA間の競合を排除するため、第2の選択肢が好ましい場合がある。
本明細書に記載されるように、当業者には理解されるように、CRISPR-DSは、法医学および早期がん検出用途など、試料がDNAに制限される状況での変異の高感度同定のための用途を有し得る。
いくつかの実施形態では、核酸材料は、実質的に均一な長さの核酸分子を含む。いくつかの実施形態では、実質的に均一な長さは、約1~約1,000,000塩基である)。例えば、いくつかの実施形態では、実質的に均一な長さは、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、50、60、70、80、90、100、120、150、200、300、400、500、600、700、800、900、1000、1200、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、30,000、40,000、または50,000塩基の長さであり得る。いくつかの実施形態では、実質的に均一な長さは、最大で60,000、70,000、80,000、90,000、100,000、120,000、150,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、または1,000,000塩基であり得る。具体的な非限定的な例として、いくつかの実施形態では、実質的に均一な長さは、約100~約500塩基である。いくつかの実施形態では、本明細書に記載されているようなサイズ選択ステップは、任意の特定の増幅ステップの前に実行されてもよい。いくつかの実施形態では、本明細書に記載されているようなサイズ選択ステップは、任意の特定の増幅ステップの後に実行されてもよい。いくつかの実施形態では、本明細書に記載されているようなサイズ選択ステップの後に、消化ステップおよび/または別のサイズ選択ステップなどの追加のステップが続く場合がある。
標的化エンドヌクレアーゼの使用に加えて、実質的に均一な長さの核酸分子を達成する任意の他の用途に適した方法が使用されてもよい。非限定的な例として、そのような方法は、アガロースまたは他のゲル、アフィニティーカラム、HPLC、PAGE、ろ過、SPRI/Ampureタイプのビーズ、または当業者によって認識される他の適切な方法の1つ以上の使用であり得るか、または含み得る。
いくつかの実施形態では、実質的に均一な長さ(または質量)の核酸分子を産生するように核酸材料を処理することは、試料から1つ以上の所望の標的領域(例えば、目的の標的配列)を回収するために使用できる。いくつかの実施形態では、実質的に均一な長さ(または質量)の核酸分子を生成するように核酸材料を処理することは、試料の特定の部分(例えば、望ましくない種、または同一の種の望ましくない対象からの核酸材料)を排除するために使用できる。いくつかの実施形態では、核酸材料は様々なサイズで存在し得る(例えば、実質的に均一な長さまたは質量ではない)。
いくつかの実施形態では、1つを超える標的化エンドヌクレアーゼまたは実施的に均一な長さの核酸分子をもたらすための他の方法を使用してもよい(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上)。いくつかの実施形態では、標的化ヌクレアーゼを使用して、核酸材料の1つを超える潜在的標的領域(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上)を切断することができる。いくつかの実施形態では、核酸材料の1つを超える標的領域が存在する場合、各々の標的領域は同一(または実質的に同一)の長さであり得る。いくつかの実施形態では、核酸材料の1つを超える標的領域が存在する場合、既知の長さの標的領域のうちの少なくとも2つは長さが異なる(例えば、100bpの長さの第1の標的領域と、1,000bpの長さの第2の標的領域)。
いくつかの実施形態では、複数の標的化エンドヌクレアーゼ(例えば、プログラム可能なエンドヌクレアーゼ)を組み合わせて使用して、目的の標的核酸の複数の領域を断片化してもよい。いくつかの実施形態では、1つ以上のプログラム可能な標的化エンドヌクレアーゼを他の標的化ヌクレアーゼと組み合わせて使用してもよい。いくつかの実施形態では、1つ以上の標的化エンドヌクレアーゼをランダムまたは半ランダムヌクレアーゼと組み合わせて使用してもよい。いくつかの実施形態では、1つ以上の標的化エンドヌクレアーゼを、機械的または音響的せん断など、他のランダムまたは半ランダムな核酸断片化方法と組み合わせて使用してもよい。いくつかの実施形態では、1つ以上のサイズ選択ステップを介在させて連続ステップで切断を行うことが有利な場合がある。標的化された断片化がランダムまたは半ランダム断片化と組み合わせて使用されるいくつかの実施形態では、後者のランダムまたは半ランダムな性質は、SMIの目的を果たすのに役立つ場合がある。標的化断片化がランダムまたは半ランダム断片化と組み合わせて使用されるいくつかの実施形態では、後者のランダムまたは半ランダムな性質は、長い高度の反復領域などの標的化された方法で容易に切断されない核酸の領域の配列決定を促進するのに有用であり得る。
さらなる方法
いくつかの実施形態では、提供される方法は、核酸材料を提供するステップ、所与の長さの標的領域が残りの核酸材料から分離されるように標的エンドヌクレアーゼ(例えば、リボ核タンパク質複合体)により核酸材料を切断するステップと、切断された標的領域を分析することと、を含み得る。いくつかの実施形態では、提供される方法は、少なくとも1つのSMIおよび/またはアダプター配列を、所与の長さの切断された標的領域の5’または3’末端のうちの少なくとも1つにライゲートすることをさらに含み得る。いくつかの実施形態では、分析することは、定量および/または配列決定であり得るか、またはそれを含み得る。
いくつかの実施形態では、定量化は、分光光度分析、リアルタイムPCR、および/または蛍光ベースの定量化(例えば、蛍光色素タグ付けを使用すること)であり得るか、またはそれを含み得る。いくつかの実施形態では、配列決定は、サンガー配列決定、ショットガン配列決定、ブリッジPCR、ナノポア配列決定、単一分子リアルタイム配列決定、イオントレント配列決定、パイロ配列決定、デジタル配列決定(例えば、デジタルバーコードベースの配列決定)、ライゲーションによる配列決定、ポロニーベースの配列決定、電流ベースの配列決定(例えば、トンネル電流)、質量分析による配列決定、マイクロフルイディクスベースの配列決定、およびそれらの任意の組み合わせであり得るか、またはそれを含み得る。
いくつかの実施形態では、標的化エンドヌクレアーゼは、CRISPR関連(Cas)酵素(例えば、Cas9もしくはCpf1)、または他のリボ核タンパク質複合体、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、アルゴノートヌクレアーゼ、および/またはmegaTALヌクレアーゼのうちの少なくとも1つであるか、それを含む。いくつかの実施形態では、1つを超える標的化エンドヌクレアーゼを使用してもよい(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上)。いくつかの実施形態では、標的化ヌクレアーゼを使用して、所与の長さの1つを超える潜在的標的領域(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上)を切断することができる。いくつかの実施形態では、所与の長さの1つを超える標的領域が存在する場合、各々の標的領域は同一(または実質的に同一)の長さであり得る。いくつかの実施形態では、所与の長さの1つを超える標的領域が存在する場合、所与の長さの標的領域のうちの少なくとも2つは長さが異なる(例えば、100bpの長さの第1の標的領域と、1,000bpの長さの第2の標的領域)。
さらなる態様
本開示の一態様によれば、いくつかの実施形態は、非常に少量の核酸材料から高品質の配列決定情報を提供する。いくつかの実施形態では、提供される方法および組成物は、最大で以下の量の出発核酸材料とともに使用することができる:約1ピコグラム(pg)、10pg、100pg、1ナノグラム(ng)、10ng、100ng、200ng、300ng、400ng、500ng、600ng、700ng、800ng、900ng、または1000ng。いくつかの実施形態では、提供される方法および組成物は、最大で1分子コピーまたはゲノム相当、10分子コピーまたはそのゲノム相当、100分子コピーまたはそのゲノム相当、1,000分子コピーまたはそのゲノム相当、10,000分子コピーまたはそのゲノム相当、100,000分子コピーまたはそのゲノム相当、または1,000,000分子コピーまたはそのゲノム相当の投入量の核酸材料とともに使用することができる。例えば、いくつかの実施形態では、最大で1,000ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で100ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で10ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で1ngの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で100pgの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で1pgの核酸材料が特定の配列決定プロセスに最初に提供される。
本技術の他の態様によれば、提供されるいくつかの方法は、核酸材料の任意の様々な最適以下の(例えば、損傷または分解)試料の配列決定に有用であり得る。例えば、いくつかの実施形態では、核酸材料の少なくとも一部が損傷している。いくつかの実施形態では、損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、SUMO化、グリコシル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、X線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高pHによる損傷、低pHによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、ホルマリンまたはホルムアルデヒドなどの組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、DNAの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、1つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも1つであるか、またはそれを含む。
核酸材料
種類
様々な実施形態に従って、様々な核酸材料のうちのいずれかが使用され得る。いくつかの実施形態では、核酸材料は、標準的な糖リン酸骨格内のポリヌクレオチドに対する少なくとも1つの修飾を含んでもよい。いくつかの実施形態では、核酸材料は、核酸材料のいずれかの塩基内に少なくとも1つの修飾を含んでもよい。例えば、非限定的な例として、いくつかの実施形態では、核酸材料は、二本鎖DNA、一本鎖DNA、二本鎖RNA、一本鎖RNA、ペプチド核酸(PNA)、ロックド核酸(LNA)のうちの少なくとも1つであるか、またはそれを含む。
修飾
様々な実施形態によれば、核酸材料は、特定の提供される方法または組成物が使用される用途に応じて、特定のステップの前、実質的に同時、または後に1つ以上の修飾を受けてもよい。
いくつかの実施形態では、修飾は、核酸材料の少なくとも一部の修復であってもよく、またはそれを含んでもよい。核酸修復の用途に適した任意の方法は、いくつかの実施形態に適合すると考えられるが、特定の例示的な方法および組成物は、したがって、以下および実施例に記載されている。
非限定的な例として、いくつかの実施形態では、ウラシルDNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)、および8-オキソグアニンDNAグリコシラーゼ(OGG1)などのDNA修復酵素を、DNA損傷(例えば、インビトロDNA損傷)を訂正するのに利用することができる。例えば、これらのDNA修復酵素は、DNAから損傷した塩基を除去するグリコリアーゼである。例えば、UDGはシトシンの脱アミノ化(シトシンの自然加水分解により起こる)から生じるウラシルを除去し、FPGは8-オキソ-グアニン(例えば、活性酸素種に起因する多くの一般的なDNA損傷)を除去する。FPGはまた、無塩基部位に1塩基のギャップを生じさせるリアーゼ活性をも有する。そのような脱塩基部位は、例えば、ポリメラーゼがテンプレートのコピーに失敗するため、PCRによる増幅が失敗する。したがって、このようなDNA損傷修復酵素を使用すると、真の変異を持たない損傷DNAを効果的に除去できるが、そうでなければ、配列決定および二重鎖配列分析後にエラーとして検出されない。
上述のように、さらなる実施形態では、本明細書で論じされる処理するステップから生成された配列決定読取をさらにフィルタリングして、アーティファクトに最もなりやすい読取の末端をトリミングすることにより、偽の変異を排除できる。例えば、DNA断片化により、二本鎖分子の末端に一本鎖部分が生成されることがある。これらの一本鎖部分は、末端修復中に(例えば、クレノウによって)満たすことができる。場合によっては、ポリメラーゼはこれらの末端修復領域でコピーミスを起こし、「擬似二重鎖分子」の生成をもたらす。これらのアーティファクトは、配列決定されると真の変異であるように見える場合がある。末端修復メカニズムの結果としてのこれらのエラーは、配列決定読取の末端をトリミングして、発生した可能性のある任意の変異を除外することにより、配列決定後の解析から排除でき、これによって偽の変異の数を低減できる。いくつかの実施形態では、配列決定読取のそのようなトリミングは自動的に達成することができる(例えば、通常のプロセスのステップ)。いくつかの実施形態では、断片末端領域について変異頻度を評価することができ、断片末端領域で変異の閾値レベルが観察される場合、DNA断片の二本鎖コンセンサス配列読取を生成する前に、配列決定読取のトリミングを実行することができる。
供給源
核酸材料は、任意の様々な供給源に由来し得ると考えられる。例えば、いくつかの実施形態では、核酸材料は、少なくとも1つの対象(例えば、ヒトもしくは動物の対象)または他の生物学的供給源からの試料から提供される。いくつかの実施形態では、バンク寄託/保管された試料から核酸材料が提供される。いくつかの実施形態では、試料が、血液、血清、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、爪擦過検体、精液、前立腺液、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、剖検試料、剖検試料、臓器試料、人物同定試料、人工的に産生された核酸試料、合成遺伝子試料、核酸データ貯蔵試料、腫瘍組織、およびそれらの任意の組み合わせのうちの少なくとも1つであるか、またはそれを含む。他の実施形態では、試料は、微生物、植物ベースの生物、または収集された環境試料(例えば、水、土壌、考古学など)のうちの少なくとも1つであるか、またはそれを含む。
選択された用途の例
本明細書に記載されるとき、提供される方法および組成物は、様々な目的のいずれかおよび/または様々なシナリオのいずれかで使用されてもよい。以下は、特定の説明のみを目的とした非限定的な用途および/またはシナリオの例である。
法医学
法医学DNA分析へのこれまでのアプローチは、PCR増幅産物のキャピラリー電気泳動分離にほとんど完全に依存して、短いタンデムリピート配列の長さの多型を識別する。このタイプの分析は、1991年に導入されて以来、非常に価値があることが証明されている。それ以来、いくつかの出版物は標準化されたプロトコールを導入し、世界中の研究室での使用を検証し、多くの異なる人種でのその使用を詳述し、miniSTRなどのより効率的なアプローチを導入してきた。
このアプローチは非常に成功していることが証明されているが、この技術にはその有用性を制限する多くの欠点を有している。例えば、STR遺伝子型決定に対する現在のアプローチでは、テンプレートDNA上のポリメラーゼの滑りによって引き起こされるPCRスタッターに起因するバックグラウンドシグナルをしばしば発生させる。この問題は、スタッター対立遺伝子と真の対立遺伝子を区別するのが難しいため、2つ以上の寄与者による試料においてとくに重要である。分解されたDNA試料を分析するときに別の問題が発生する。断片の長さの変動により、しばしば、より長いPCR断片が大幅に少なくなるか、または存在しなくなることさえある。結果として、分解されたDNAからのプロファイルは、しばしばより低い識別力を有する。
MPSシステムの導入は、法医学分析におけるいくつかの困難な問題に対処する可能性を有している。例えば、これらのプラットフォームは、識別力を劇的に増大させ、民族性および身体的属性さえも決定する可能性を提供する、核およびmtDNAのSTRとSNPの同時分析を可能にする比類のない能力を提供する。さらに、単純に分子の集合集団の平均遺伝子型を報告するPCR-CEとは異なり、MPS技術は、多くの個々のDNA分子の完全なヌクレオチド配列をデジタルで集計し、異種DNA混合物内のMAFを検出する独自の能力を提供する。2人以上の寄与者を含む法医学試料は、法医学で最も問題のある問題のうちの1つとして残るため、法医学の分野に対するMPSの影響は非常に大きくなり得る。
ヒトゲノムの発表は、MPSプラットフォームの計り知れない力を強調した。
しかしながら、ごく最近まで、読取の長さがSTR座位よりも大幅に短く、長さに基づく遺伝子型を判定することができないため、これらのプラットフォームの完全な力はは法医学に限定されていた。当初、Roche 454プラットフォームなどのパイロシーケンサーは、コアSTR座位を配列決定するのに十分な読取長を持つ唯一のプラットフォームであった。しかしながら、競合する技術の読取の長さが増加しているため、法医学用途に対する有用性が発揮されている。多くの研究により、STR座位のMPS遺伝子型決定の可能性が明らかになっている。全体として、これらの全ての研究の全般的な結果は、プラットフォームに関係なく、STRを正常に分類できるため、損傷した法医学試料からでもCE分析に匹敵する遺伝子型を生成できることである。
全てのこれら研究は、従来のPCR-CEアプローチとの一致を示しており、STR内SNPの検出などの追加の利点も示しているが、現在の技術に関する多くの問題もまた強調している。例えば、STR遺伝子型決定に対する現在のMPSアプローチは、配列決定とPCRプライマーの導入に十分なDNAを提供するためのマルチプレックスPCRに依存している。しかしながら、マルチプレックスPCRキットはPCR-CE用に設計されているため、様々なサイズの増幅産物のためのプライマーが含まれている。この変動により、小さな断片が増幅されるバイアスを有して包含が不均衡になり、対立遺伝子が脱落する可能性がある。実際、最近の研究では、特に低MAFにおいて、PCR効率の相違が混合物成分に影響を及ぼすことが示されている。この問題に対処するために、法医学のために特別に設計されたいくつかの配列決定キットが現在市販されており、検証研究が報告され始めている。しかしながら、多重化のレベルが高いため、増幅バイアスは依然として明らかである。
PCR-CEと同様に、MPSはPCRスタッターの発生に影響されない。STRに関するMPS研究の大部分は、人工的なドロップイン対立遺伝子の発生を報告している。最近、体系的なMPSの研究は、多くのスタッター事象が、4塩基対単位の真の対立遺伝子と異なり、最も一般的にn-4であるが、n-8およびn-12の位置もまた観察される、より短い長さの多型として現れることを報告している。スタッターのパーセントは通常、読取の約1%で発生したが、一部の座位では3%に達する可能性があり、MPSがPCR-CEよりも高い割合でスタッターを示す可能性があることを示している。
対照的に、いくつかの実施形態では、提供される方法および組成物は、上記および以下の実施例で説明されるように、低品質および/または少量の試料の高品質かつ効率的な配列決定を可能にする。したがって、いくつかの実施形態では、提供される方法および/または組成物は、異なる遺伝子型の別の個体のDNAと低濃度で混合された1人の個体からのDNAのまれなバリアントの検出に有用であり得る。
法医学DNA試料には通常、非ヒトDNAが含まれている。この外因性DNAの潜在的な供給源は次の通りである:DNAの供給源(例えば、唾液または口腔試料中の微生物)、試料が収集された表面環境、および実験室(例えば、試薬、作業エリアなど)からの混入。いくつかの実施形態によって提供される別の態様は、特定の提供される方法および組成物が、他の供給源(例えば、異なる種)および/または表面もしくは環境混入物質からの混入核酸材料の区別を可能にし、これらの物質(および/またはその効果)を最終分析から削除でき、配列決定結果にバイアスをもたらさない。
高度に分解されたDNAでは、必要なプライマーアニーリング部位を含まないDNA断片が原因で座位特異的PCRがうまく機能せず、対立遺伝子のドロップアウトが生じる。この状況は、遺伝子型コールの一意性を制限し、特に混合試験では、一致の信頼性が保証されない。しかしながら、いくつかの実施形態では、提供される方法および組成物は、STRマーカーに加えて、またはSTRマーカーの代替として、一塩基多型(SNP)を使用できるようにする。
実際、ヒトの遺伝的変異に関するデータは増え続けており、SNPは法医学研究にますます重要になっている。そのため、いくつかの実施形態では、提供される方法および組成物は、例えば現在利用可能な配列決定キットに基づいてマルチプレックスプライマーパネルを作成できるようにプライマー設計戦略を使用し、読取が1つ以上のSNP位置を確実にまたぐようにする。
患者の層別化
患者の層別化は、一般に1つ以上の治療に関連しない要因に基づいて患者を分割することを指し、医学界で大きな関心を集めているトピックである。この関心の多くは、特定の治療薬候補が、部分的に試験中の患者間のこれまで認識されていなかった相違に起因してFDAの承認を取得できなかったという事実に起因する可能性がある。これらの相違は、1つの群の患者と1つ以上の他の群の患者で、治療薬の代謝が異なる、または副作用が生じるまたは悪化する1つ以上の遺伝的相違であり得るか、またはそれを含み得る。場合によっては、これらの相違の一部または全てが、同一の遺伝的プロファイルを示さない他の患者とは異なる治療薬への反応をもたらす、患者の1つ以上の異なる遺伝子プロファイルとして検出され得る。
したがって、いくつかの実施形態では、提供される方法および組成物は、特定の患者集団(例えば、一般的な疾患、障害または状態に苦しむ患者)のどの対象が特定の治療に応答するかを決定する際に有用であり得る。例えば、いくつかの実施形態では、提供される方法および/または組成物を使用して、特定の被験者が治療に対する応答不良に関連する遺伝子型を保有しているか否かを評価することができる。いくつかの実施形態では、提供される方法および/または組成物を使用して、特定の被験者が治療に対する陽性の応答に関連する遺伝子型を保有しているか否かを評価することができる。
治療に対する応答のモニタリング(腫瘍変異など)
ゲノム研究における次世代シーケンシング(NGS)の出現により、前例のない詳細を備えた腫瘍の変異状況の特性評価が可能になり、診断、予後、および臨床的に処置し得る変異のカタログ化をもたらした。まとめると、これらの変異は、個別化医療によるがん転帰の改善および潜在的な早期がんの検出とスクリーニングに大きな期待を抱かせる。本開示の前に、この分野における重大な制限は、これらの変異が低頻度で存在するときにこれらの変異を検出できないことであった。臨床生検の多くはしばしば、大部分が正常細胞で構成されており、DNA変異に基づくがん細胞の検出は、現代のNGSにとっても技術的な課題である。数千の正常なゲノムの中で腫瘍の変異を同定することは、干し草の山から針を見つけることに類似しており、これまでに知られている方法を超えるレベルの配列決定の精確さを必要とする。
一般的に、この問題は液体生検の場合に悪化し、この場合、課題は腫瘍の変異を見つけるために必要な極度の感度を提供するだけでなく、これらの生検に通常存在する最小限の量のDNAでそれを行うことである。「液体生検」という用語は通常、循環している腫瘍DNA(ctDNA)の存在に基づいて癌について知らせる能力のある血液を指す。ctDNAは、がん細胞によって血流中に放出され、がんをモニター、検出、および予測し、ならびに腫瘍の遺伝子型決定と治療法の選択を可能にする大きな期待を示している。これらの用途は、がん患者の現在の管理に革命をもたらす可能性があるが、進歩は以前に予想されていたよりも遅くなっている。大きな問題は、通常、ctDNAは血漿中に存在する全ての無細胞DNA(cfDNA)のごく一部を占めることである。転移性がんでは、その頻度は5%を超える可能性があるが、限局性がんでは1%~0.001%の間である。理論的には、十分な数の分子をアッセイすることにより、あらゆるサイズのDNA亜集団を検出できるはずである。しかしながら、以前の方法の基本的な制限は、塩基が誤ってスコアリングされる頻度が高いことである。多くの場合、エラーはクラスターの生成、配列決定サイクル、低いクラスターの解像度、テンプレートの分解の際に発生する。その結果、配列決定された塩基の約0.1~1%が誤ってコールされる。さらなる問題は、PCRの際のポリメラーゼのミスや増幅バイアスから生じ得、集団のゆがみや偽変異対立遺伝子頻度(MAF)の導入をもたらし得る。まとめると、従来のNGSを含むこれまで知られている技術は、低頻度変異の検出に必要なレベルで実行することができない。
NGSの精確さを向上させるために、いくつかのアプローチが採用されている。
インビトロ修復キットを使用したDNA損傷の除去は、NGSでの誤ったバリアントコールの数を減らすことが示されている。しかしながら、全ての変異原性病変がこれらの酵素によって認識されるわけではなく、修復の忠実度も完全ではない。重要な牽引力を得た別のアプローチは、個々のDNA断片から生じるPCRの重複を利用してコンセンサスを形成することである。「分子バーコード付け」と呼ばれる、PCRの前または最中に固有のランダムなせん断ポイントまたは外因性に導入されたランダムなDNA配列を共有する読取がグループ化され、最も一般的な配列が保持される。Kindeらは、一本鎖分子バーコード付けを使用して、バーコード配列決定を共有するPCRコピーをグループ化し、コンセンサスを形成することにより、配列決定のエラー率を低減するSafeSeqSによってこの概念を導入した。このアプローチにより、平均検出限界は0.5%になり、転移癌におけるctDNAの検出に成功したが、早期癌の約40%でのみ成功している。この検出限界は、MAFで約0.01%の低い変異を検出できるデジタルドロップレットPCR(ddPCR)で大幅に改善できる。しかしながら、変異は事前に知られている必要があり、これは複数のがんの用途を深刻に制限する。さらに、一度に試験できるのは1~4個の変異のみであり、ハイスループットスクリーニングが不可能である(表2)。
表2
Figure 0007256748000002
本開示の前に、ddPCRに匹敵する感度を有するが、腫瘍変異の先験的な知識を必要としない唯一の技術はDSである。DSは、2本鎖の分子バーコードを使用して、2本のDNA鎖が相補的な情報を含むという事実を利用することにより、分子バーコード付けの概念を拡張する。私たちは以前、このアプローチにより、ヒト核DNAの0.005%未満の比類ない感度が得られることを実証した。
DS、SPLiT-DS、およびCRISPR-DSの高精度により、DS、SPLiT-DS、およびCRISPR-DS、ならびにこれらの配列決定プラットフォームの変換とワークフローの効率を向上させる方法は、腫瘍学の分野で有望である。本明細書に記載されるように、提供される方法および組成物は、エラー訂正を維持しながら効率および拡張性を高めるために、DSの二本鎖分子タグ付けを標的配列特異的増幅(例えばPCR)と統合するDS方法論への革新的なアプローチを可能にする。
非常に精確で効率的なアッセイの必要性に加えて、臨床検査室の現実は、高速で拡張性があり、合理的に費用効果の高いアッセイも要求する。したがって、DSのワークフロー効率を改善する本技術の態様による様々な実施形態(例えば、DSのための濃縮戦略)が非常に望ましい。本書に記載されているように、DS用途のための特定の標的配列の増幅ベースの濃縮および消化/サイズ選択濃縮は、高い標的特異性、低DNAインプットでの性能、拡張性、および最小コスト(通常約2~3ドル/試料)を提供する。
提供される方法および組成物のいくつかの実施形態は、一般にがん研究、特にctDNAの分野で特に重要であり、これは、本明細書で開発された技術が、DNAインプット、調製時間、およびコストを最小限にしながら、比類ない感度でがん変異を同定する可能性があるためである。本明細書に開示される他の実施形態の中でも特に、SPLiT-DSおよびCRISPR-DSは、改善された患者管理および早期がん検出により生存率を大幅に高めることができる臨床用途に有用であり得る。
本発明の具体的な実施態様をいくつか以下に例示する。
〔1〕1つ以上の二本鎖核酸分子を含む二本鎖核酸材料を提供することであって、各々の二本鎖核酸分子が、各々の鎖上の単一分子識別子配列と前記核酸分子の5’末端および/または3’末端のうちの少なくとも1つの上のアダプターとを含み、各々の核酸分子に対して、第1のアダプター配列が前記核酸分子の第1の鎖と関連し、第2のアダプター配列が前記核酸分子の第2の鎖と関連する、提供することと、
前記核酸材料を増幅することと、
前記増幅した核酸材料を、第1の試料と第2の試料とに分離することと、
前記第1のアダプター配列に特異的なプライマーの使用を通じて前記第1の試料中の前記第1の鎖を増幅して、第1の核酸産物をもたらすことと、
前記第2のアダプター配列に特異的なプライマーの使用を通じて前記第2の試料中の前記第2の鎖を増幅して、第2の核酸産物をもたらすことと、
前記第1の核酸産物および第2の核酸産物の各々を配列決定することと、
前記第1の核酸産物の配列と前記第2の核酸産物の配列とを比較することと、を含む、方法。
〔2〕前記核酸材料が、二本鎖DNAおよび二本鎖RNAのうちの少なくとも1つであるか、またはそれを含む、前記〔1〕に記載の方法。
〔3〕前記提供するステップが、
二本鎖核酸材料を少なくとも1つの縮重または半縮重バーコード配列にライゲートして、二本鎖核酸分子バーコード複合体を形成することを含み、前記バーコード配列が、前記単一分子識別子配列を含む、前記〔1〕または前記〔2〕に記載の方法。
〔4〕前記単一分子識別子配列が、前記二本鎖核酸分子を一意的に標識する、縮重もしくは半縮重バーコード配列、前記核酸材料の1つ以上の核酸断片末端、またはそれらの組み合わせのうちの少なくとも1つである、前記〔1〕または前記〔2〕に記載の方法。
〔5〕前記単一分子識別子配列が、内因性のせん断点または前記せん断点に位置的に関連する可能性のある内因性の配列を含む、前記〔1〕または前記〔2〕に記載の方法。
〔6〕前記核酸材料を増幅することが、前記第1の鎖に由来する複数の増幅産物と、前記第2の鎖に由来する複数の増幅産物とを生成することを含む、前記〔1〕~〔5〕のいずれか1項に記載の方法。
〔7〕前記第1の試料中の前記核酸材料を増幅することが、
前記第1のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドとを使用して、前記単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む、前記〔1〕~〔6〕のいずれか1項に記載の方法。
〔8〕前記第2の試料中の前記核酸材料の前記増幅することが、
前記第2のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチドとを使用して、前記単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む、前記〔1〕~〔7〕のいずれか1項に記載の方法。
〔9〕前記核酸材料の少なくとも一部が損傷している、前記〔1〕~〔8〕のいずれか1項に記載の方法。
〔10〕前記損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、SUMO化、グリコシル化、脱グリコシル化、プトレシニル化、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、X線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高pHによる損傷、低pHによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、ホルマリンまたはホルムアルデヒドなどの組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、DNAの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、1つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも1つであるか、またはそれを含む、前記〔9〕に記載の方法。
〔11〕前記核酸材料が、対象または生物を起源とする1つ以上の二本鎖核酸分子を含む試料により提供される、前記〔1〕~〔10〕のいずれか1項に記載の方法。
〔12〕前記試料が、体組織、生検、皮膚試料、血液、血清、血漿、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、パップスメア、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、細菌試料、原生動物のサンプル、真菌試料、動物試料、ウイルス試料、複数の生体の試料、爪擦過検体、精液、前立腺液、膣液、膣スワブ、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液またはスワブ、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、剖検試料、剖検試料、臓器試料、人物同定試料、非ヒト同定試料、人工的に産生された核酸試料、合成遺伝子試料、バンクに寄託または保管された試料、腫瘍組織、胎児試料、臓器移植試料、微生物培養試料、核DNA試料、ミトコンドリアDNA試料、葉緑体DNA試料、アピコプラストDNA試料、細胞小器官試料、およびそれらの任意の組み合わせであるか、またはそれを含む、前記〔11〕に記載の方法。
〔13〕前記核酸材料が、実質的に均一またはほぼ均一な長さの核酸分子を含む、前記〔1〕~〔12〕のいずれか1項に記載の方法。
〔14〕前記実質的に均一な長さが、約1~約1,000,000塩基である、前記〔13〕に記載の方法。
〔15〕前記核酸材料が、標的化エンドヌクレアーゼによって実質的に均一またはほぼ均一の長さの核酸分子に切断されている、前記〔13〕または前記〔14〕に記載の方法。
〔16〕前記核酸材料が、1つ以上の実質的に既知のサイズ範囲内の長さを有する核酸分子を含む、前記〔1〕~〔12〕のいずれか1項に記載の方法。
〔17〕前記核酸分子が1~約1,000,000塩基、約10~約10,000塩基、約100~約1000塩基、約100~約600塩基、約100~約500塩基、またはそれらのいくつかの組み合わせである、前記〔16〕に記載の方法。
〔18〕前記方法が、前記提供するステップの前に、
実質的に既知の長さの標的核酸断片が形成されるように、1つ以上の標的化エンドヌクレアーゼにより前記核酸材料を切断することと、
前記実質的に既知の長さに基づいて、前記標的核酸断片を単離することと、を含む、前記〔1〕~〔17〕のいずれか1項に記載の方法。
〔19〕前記1つ以上の標的化エンドヌクレアーゼが、リボ核タンパク質、Cas酵素、Cas9様酵素、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ、またはそれらの組み合わせからなる群から選択される、前記〔18〕に記載の方法。
〔20〕前記1つ以上の標的化エンドヌクレアーゼが、Cas9もしくはCPF1またはそれらの誘導体を含む、前記〔18〕または前記〔19〕に記載の方法。
〔21〕前記提供するステップの前に、前記アダプターを前記標的核酸断片にライゲートすることをさらに含む、前記〔18〕~〔20〕のいずれか1項に記載の方法。
〔22〕前記標的核酸断片が対象または生物を起源とする、前記〔18〕~〔21〕のいずれか1項に記載の方法。
〔23〕前記標的核酸断片が少なくとも部分的に人工的に合成されている、前記〔18〕~〔21〕のいずれか1項に記載の方法。
〔24〕前記核酸材料を切断することが、実質的に既知の長さの2つ以上の標的核酸断片が形成されるように、前記核酸材料を1つ以上の標的化エンドヌクレアーゼによって切断することを含む、前記〔18〕~〔23〕のいずれか1項に記載の方法。
〔25〕前記標的核酸断片が、異なる実質的に既知の長さである、前記〔24〕に記載の方法。
〔26〕前記標的核酸断片がそれぞれ、ゲノム中の1つ以上の異なる位置からの目的のゲノム配列を含む、前記〔24〕に記載の方法。
〔27〕前記標的核酸断片がそれぞれ、前記核酸材料内の実質的に既知の領域からの標的配列を含む、前記〔24〕に記載の方法。
〔28〕前記実質的に既知の長さに基づいて前記標的核酸断片を単離することが、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、濾過、またはSPRIビーズ精製による前記標的核酸断片の濃縮を含む、前記〔18〕~〔27〕のいずれか1項に記載の方法。
〔29〕少なくとも1つの増幅するステップが、少なくとも1つの非標準ヌクレオチドであるか、またはそれを含む少なくとも1つのプライマーを含む、前記〔1〕~〔28〕のいずれか1項に記載の方法。
〔30〕少なくとも1つのアダプター配列が、少なくとも1つの非標準ヌクレオチドであるか、またはそれを含む、前記〔1〕~〔29〕のいずれか1項に記載の方法。
〔31〕前記非標準ヌクレオチドが、ウラシル、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチド iso-dC、iso dG、2’-O-メチルヌクレオチド、イノシンヌクレオチド ロックド核酸、ペプチド核酸、5メチルdC、5-ブロモデオキシウリジン、2,6-ジアミノプリン、2-アミノプリンヌクレオチド、脱塩基ヌクレオチド、5-ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Iリンカー、5’ヘキシニル修飾ヌクレオチド、5-オクタジイニルdU、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、蛍光色素、ビオチン、フラン、BrdU、フルオロ-dU、loto-dU、およびそれらの任意の組み合わせから選択される、前記〔29〕または前記〔30〕に記載の方法。
〔32〕前記第1の核酸産物および第2の核酸産物の各々を配列決定することが、
前記第1の核酸産物中の複数の鎖の前記配列を比較して、第1の鎖のコンセンサス配列を決定することと、
前記第2の核酸産物中の複数の鎖の前記配列を比較して、第2の鎖のコンセンサス配列を決定することと、を含む、前記〔1〕~〔31〕のいずれか1項に記載の方法。
〔33〕前記第1の核酸産物の前記配列を、前記第2の核酸産物の前記配列と比較することが、前記第1の鎖のコンセンサス配列と前記第2の鎖のコンセンサス配列を比較して、エラーが訂正されたコンセンサス配列を提供することを含む、前記〔32〕に記載の方法。
〔34〕前記第1の核酸産物および第2の核酸産物の各々を配列決定することが、
前記第1の鎖の少なくとも1つを配列決定して、第1の鎖の配列読取を決定することと、
前記第2の鎖の少なくとも1つを配列決定して、第2の鎖の配列読取を決定することと、
前記第1の鎖の配列読取と前記第2の鎖の配列読取とを比較して、エラーが訂正された配列読取を生成することと、を含む、前記〔1〕~〔33〕のいずれか1項に記載の方法。
〔35〕前記エラーが訂正された配列読取が、前記第1の鎖の配列読取と前記第2の鎖の配列読取との間で一致するヌクレオチド塩基を含む、前記〔34〕に記載の方法。
〔36〕前記エラーが訂正された配列読取の特定の位置で生じる変動が真のバリアントとして同定される、前記〔34〕または前記〔35〕に記載の方法。
〔37〕前記第1の鎖の配列読取または前記第2の鎖の配列読取の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される、前記〔34〕~〔36〕のいずれか1項に記載の方法。
〔38〕前記エラーが訂正された配列読取が、二本鎖標的核酸分子が由来する生物または対象における、がん、がんリスク、がん変異、がんの代謝状態、ミューテーターの表現型、発がん物質への暴露、毒素暴露、慢性炎症暴露、年齢、神経変性疾患、病原体、薬剤耐性バリアント、胎児分子、法医学に関連する分子、免疫学的に関連する分子、変異したT細胞受容体、変異したB細胞受容体、変異した免疫グロブリン遺伝子座、ゲノムのカタエギス部位、ゲノムの超変異部位、低頻度バリアント、サブクローンバリアント、少数の分子集団、混入源、核酸合成エラー、酵素修飾エラー、化学修飾エラー、遺伝子編集エラー、遺伝子治療エラー、核酸情報ストレージの断片、微生物の準種、ウイルスの準種、臓器移植、臓器移植拒絶、がん再発、治療後の残存がん、前がん状態、異形成状態、マイクロキメリズム状態、幹細胞移植状態、細胞療法状態、別の分子に付着した核酸標識、またはそれらの組み合わせを同定または特性評価するために使用される、前記〔34〕~〔36〕のいずれか1項に記載の方法。
〔39〕前記エラーが訂正された配列読取が、変異原性化合物または曝露を同定するために使用される、前記〔34〕~〔36〕のいずれか1項に記載の方法。
〔40〕前記エラーが訂正された配列読取が、発がん性化合物または曝露を同定するために使用される、前記〔34〕~〔36〕のいずれか1項に記載の方法。
〔41〕前記核酸材料が法医学試料に由来し、前記エラーが訂正された配列読取が法医学分析で使用される、前記〔34〕~〔36〕のいずれか1項に記載の方法。
〔42〕少なくとも1つの増幅するステップがポリメラーゼ連鎖反応(PCR)を含む、前記〔1〕~〔41〕のいずれか1項に記載の方法。
〔43〕最大でも1000ngの核酸材料が最初に提供される、前記〔1〕~〔42〕のいずれか1項に記載の方法。
〔44〕最大でも10ngの核酸材料が最初に提供される、前記〔1〕~〔43〕のいずれか1項に記載の方法。
〔45〕前記第1の試料中の前記核酸材料を増幅することが、前記分離するステップの後、および前記第1の試料を前記増幅することの前に、前記核酸材料上に見られる第2のアダプター配列を破壊または崩壊することをさらに含む、前記〔1〕~〔44〕のいずれか1項に記載の方法。
〔46〕前記第2の試料中の前記核酸材料を増幅することが、前記分離するステップの後、および前記第2の試料を前記増幅することの前に、前記核酸材料上に見られる第1のアダプター配列を破壊または崩壊することをさらに含む、前記〔1〕~〔45〕のいずれか1項に記載の方法。
〔47〕前記破壊することが、酵素消化、少なくとも1つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、切断または一方もしくは両方の鎖をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、8-オキソ-グアニン付加物の組み込み、制限エンドヌクレアーゼの使用、標的化ヌクレアーゼの使用、およびそれらの任意の組み合わせの少なくとも1つを含む、前記〔45〕または前記〔46〕に記載の方法。
〔48〕増幅することが、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、または表面結合増幅を含む、前記〔1〕~〔47〕のいずれか1項に記載の方法。
〔49〕前記核酸材料を増幅することが、目的の配列に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、および前記アダプターの領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、前記〔1〕~〔48〕のいずれか1項に記載の方法。
〔50〕前記核酸材料が、前記核酸材料の各々の鎖の5’末端および3’末端の各々にアダプターを含む、前記〔1〕~〔49〕のいずれか1項に記載の方法。
〔51〕前記核酸材料を増幅することが、前記第1のアダプター配列および前記第2のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、前記〔50〕に記載の方法。
〔52〕前記アダプターが、少なくとも部分的に非相補的であるか、または少なくとも1つの非標準塩基を含む少なくとも1つのヌクレオチド位置を含む、前記〔1〕~〔51〕のいずれか1項に記載の方法。
〔53〕前記アダプターが、約5個以上の自己相補型ヌクレオチドによって形成される単一の「U字型」オリゴヌクレオチド配列を含む、前記〔1〕~〔52〕のいずれか1項に記載の方法。
〔54〕二本鎖核酸材料を提供することであって、前記核酸材料が、標的化エンドヌクレアーゼによる切断の結果、約1~1,000,000塩基であり、前記核酸材料が、前記核酸材料の各々の鎖上の単一分子識別子配列と前記核酸材料の各々の鎖上の5’末端および3’末端のうちの少なくとも1つの上のアダプター配列とを含み、第1のアダプター配列が前記核酸材料の第1の鎖の5’末端または3’末端の1つの上に位置し、第2のアダプター配列が前記核酸材料の第2の鎖の反対の末端の上に位置し、前記第1の鎖と前記第2の鎖が、同一の二本鎖核酸分子を起源とする、提供することと、
前記核酸材料を増幅することと、
前記増幅した核酸材料を、第1の試料と第2の試料とに分離することと、
前記第1のアダプター配列に特異的なプライマーの使用を通じて前記第1の試料中の前記第1の鎖を増幅して、第1の核酸産物をもたらすことと、
前記第2のアダプター配列に特異的なプライマーの使用を通じて前記第2の試料中の前記第2の鎖を増幅して、第2の核酸産物をもたらすことと、
前記第1の核酸産物および第2の核酸産物の各々を配列決定することと、
前記第1の核酸産物の配列と前記第2の核酸産物の配列とを比較することと、を含む、方法。
〔55〕前記核酸材料が、2つ以上の供給源に由来する核酸材料を含む、前記〔1〕~〔54〕のいずれか1項に記載の方法。
実施例1:SPLiT-DS
SPLiT-DSは、デュプレックス配列決定エラー訂正(図4A)のための各鎖の分子バーコードの使用と互換性のあるPCRベースの標的濃縮戦略である。この例示的な実施形態では、SPLiT-DS分析を開始するために、1つ以上のアプローチを使用して1つ以上のDNA試料が断片化される(当技術分野で既知のこれまでに記載されたデュプレックス配列決定ライブラリー構築と同様)。断片化の後、最も一般的には末端修復と3’-dA-テーリングが行われ、続いて各DNA断片と縮重または半縮重二本鎖バーコードを含むT-テール付きDSアダプターとライゲートされる(図4、ステップ1)。代替的に、他のタイプのライゲーション突出、平滑末端ライゲーション、または国際特許公開第WO2017/100441号および米国特許第9,752,188号にこれまでに記載されたアダプターライゲーション化学を使用することができる。実質的に全てのデュエル適合DNA分子は、一本鎖アダプターテールのユニバーサルプライマー結合部位に特異的なプライマーを使用してPCR増幅され、各鎖に由来するDNA断片(「バーコード断片」)の複数のバーコードコピーをもたらす(図4、ステップ2)。反応副産物を除去した後、所与の試料を2つの別々のチューブに分割する(図4、ステップ3)(すなわち、試料を半分に分割し、各チューブが試料の内容の約半分を含む)。平均して、所与のバーコード断片のコピーの半分が各チューブに移されるが、試料の分割に伴うランダム性により、所与のバーコード断片の分布に分散が生じる可能性がある。このような分散を説明するために、超幾何分布(すなわち、置換なしでk個のバーコードコピーを選択する確率)をモデルとして使用して、各チューブが元の二重鎖の2本(つまり両方)のDNA鎖のそれぞれに由来する少なくとも1つのバーコード断片を含むということのかなり高い確率を達成するために必要な所与のバーコードのPCRコピーの最小数を決定する。超幾何モデルによると、ステップ1での4を超えるPCRサイクル(すなわち、2E4=16コピー/バーコード)により、各バーコード断片(各鎖から)が各チューブで少なくとも1回表れることが99%を超える確率を提供する可能性が高いと考えられる。これは、全てのシナリオで現実的ではないかもしれない均一でほぼ100%のPCR増幅効率を前提としているが、比較的低いインプットの高品質DNA試料(例えば、50uLのPCRあたり10ngのヒトゲノムDNA)での合理的な仮定である。試料を2本のチューブに分割した後、標的座位は、アダプター配列と目的の座位に特異的なプライマーを使用したマルチプレックスPCRで濃縮される(図4、ステップ4)。
マルチプレックス座位特異的PCRは、各チューブで得られるPCR産物が、所与のDNA分子試料の2本の元の鎖のうちの1本のみに由来するように行われる。これは、本明細書に記載されているように2つのチューブ(第1チューブと第2チューブ)に分割された試料を使用して、次の手順に従って実現される。第1のチューブでは、「読取1」アダプター配列(図4、ステップ3、灰色の矢印)にハイブリダイズするのに特異的なプライマー(すなわち、IlluminaP5)、および目的の遺伝子座に特異的な、読取2アダプター配列(図4、ステップ3、灰色の尾を持つ黒い矢印)の配列でテールされるプライマー(すなわち、Illumina P7)を使用してPCRを実行する。代替的に、このテールを短くして、完全なP7配列を含まないようにすることもでき、代わりに、配列決定の前に、のちのPCRにおいて追加することもできる。このステップでは、各末端に1つのP5および1つのP7配列を含む増幅産物が、元の親DNA分子の1本の鎖(すなわち、最初の試料DNA)に由来するDNAからのみ生じることが提案される。逐次的にまたは同時に、第2のチューブで同様の反応が繰り返され、第1のチューブでの試料の増幅と比較して、同一のゲノム位置の反対側の鎖に由来する増幅産物から増幅が起こる。これは、チューブ1のように反対の鎖の向きにアニールする、反対のユニバーサルプライマー配列(すなわち、P7の代わりにP5)と反対のユニバーサルプライマー配列へのアダプタープライマー(すなわちP5の代わりにP7)でテールされた座位特異的プライマー(すなわち、反参照対参照配列)を使用することにより達成される。データは、従来のデュプレックス配列決定分析/ライブラリー構築で使用されるものと同様のアプローチで分析され、これにより、「元の第1の鎖または元の第2の鎖」由来の特定のバーコードを共有する読取が一本鎖コンセンサス配列にグループ化される。
次いで、これらの一本鎖コンセンサス配列(「SSCS」)は、他の元の鎖(例えば、本明細書に記載されるような反対の鎖)について計算されたコンセンサスと比較される。ヌクレオチド位置の識別性は、同一の位置で得られた配列が二重鎖の元の鎖のそれぞれに由来する2つのSSCSに対して相補的である場合にのみ保持される。位置の識別性がSSCSで一致しない場合、これは指摘される。対になったSSCS間で一致するヌクレオチド位置については、この位置の識別性は最終的なデュプレックスコンセンサス配列に詳述される(すなわち、DCSを形成する)(図1C)。2つのSSCS間の配列識別性が一致しない位置については、潜在的なエラー部位としてフラグが付され、通常、この位置を不明(すなわち、「N」)としてマークすることで無視される。国際特許公開第WO2017/100441号および米国特許第9,752,188号でこれまでに説明された代替戦略には、不一致が見つかった場合にコンセンサス読取全体を無視するか、統計的アプローチを使用して一方のバリアントと他方のバリアントに信頼性を割り当て、特定のタイプのエラーの事前の確率およびそれを構成するファミリーの数について所与のSSCSがどれだけうまく表現されているかおよびそれらがどれらけ一致するかに基づいてどちらが真のバリアントである可能性が高いかを決定する。別のアプローチは、例えば、IUPAC命名法(GまたはTのいずれかである位置を表す「K」など)を使用して、ヌクレオチド位置の不確実性を保持することである。コンセンサス配列データファイルに追加情報を適用して、例えば特定のタイプのシーケンサーの事前の確率または所与の配列コンテキストまたは各ペアのコンセンサスファミリーのその位置で各バリアントをサポートする読取の相対的な数、またはSSCSファミリーを含む未処理の赤の読取品質スコアなどに基づいて、別の不確かな位置に対する1つのヌクレオチドの識別性の相対尤度を反映する。
デュプレックスコンセンサスコールアプローチは、国際特許公開第WO2017/100441号および米国特許第9,752,188号に記載されているものと実質的に類似するが、SPLiT-DSの場合には、分子の端の単一の分子識別子配列は、通常、個々の分子を識別するために使用され(各端に1つではなく)、元の鎖の1つのコピーに由来する配列読取は1つのチューブに見られ、相補的な元の鎖は他のチューブに見られ得る。しかしながら、必ずしもそうである必要はなく:本明細書にで記載されるように、二重鎖増幅ライブラリーのPCR反応は、2つより多いチューブ(例えば、各チューブに1つの特定のプライマーペアを持つ4つのチューブ)に分割され、分子ごとに2つのデュプレックスコンセンサス配列が作製されるように、元の分子の両端で上記のプロセスを実行できる。同様に、初期のPCR反応を複数のチューブに分割し(図10)、デュプレックス配列決定エラー訂正および/または短い読取配列を持つ長いシーケンスのサブアセンブリに対して複数の読取を生成できる。
しばしば、各チューブの産物に異なるインデックスを付けて、マルチプレックス配列決定後にそれらを区別することに利便性がある。ただし、これは必須ではない。SPLiT-DSの利点の1つは、PCRを使用する標的化濃縮を実現できることであり、これにより、目的の領域を濃縮するためにハイブリッド捕捉に依存する以前のバージョンのデュプレックス配列決定または他のアプローチのワークフローが高速化される。同時に、デュプレックスアダプターとタグを使用して最大限の精確さを実現できるが、これは従来のアンプリコン配列決定では達成できない。
実施例2CODIS STR座位のためのSPLiT-DSの開発
本実施例は、短いタンデムリピート(STR)などのDNAの反復領域を遺伝子型決定する現在利用可能な方法が精確さと感度の改善から利益を得るという洞察に基づいている。本実施例は、「SPLiT-DS」アッセイ/プロトコールを作成するために、DSのための確立されたプロトコール(それ自体が「スタッター」を除去できる;図3B)を拡張および改善する。現在の例では、(1)マルチプレックスPCRで使用するためのプライマーの設計とその後の選択、(2)DNAライブラリーの調製を改善する方法、(3)例えば、減少するDNA量の使用などの提供された技術の精確さ、精度、感度、特異性の評価;(4)最終的なエラーが訂正されたデータの大幅に減少したスタッターの実証を実証した。
マルチプレックスPCRのためのプライマー設計と選択
SPLiT-DS PCRプライマーは、好ましくは次の特性を持つように設計されている:1)高い標的特異性、2)多重化できる、3)堅牢で最小限にバイアスのある増幅を示す。従来のPCRキャピラリー電気泳動(PCR-CE)で使用するためのこれらの基準を満たす多くの既存のプライマー混合物が存在するが、MPSでは同一のプライマー混合物は信頼できない。この目的のために、利用可能なデータ(配列決定の前に標的座位を増幅する市販のキットを使用して取得した配列決定データからのマッピング座標(すなわち、ペアエンド配列決定データの各読取の5’端は、DNAを増幅するために使用されるPCRプライマーの5’端に対応する))は、この例で使用するためのプライマーを開発するために活用された。本明細書で説明する洞察とこれまでの実施例から得られたデータは、拡張CODISコア座位(CODIS20)に加えて、PentaD、PentaE、およびSE3329(簡潔に、別途示されない限り、これはまとめて単にCODIS座位と呼ばれる)の初期プライマーセットの設計を通知するために使用される。これまでに決定されたマッピング座標は、長さ、融解温度、濃度など、市販の(またはその他の)キットで使用されるプライマーに関する他の情報を提供しないため、本実施例でのプライマーの作成は、反応を多重化する前の、均一、堅牢、および特異的な増幅を達成する確率を最大にする設計に焦点を当てている。
結果は、ゲル分析などとは対照的に、直接配列決定(例えば、Illumina MiSeqプラットフォーム)によって分析できる。最適なプライマー混合物を設計するために、各試料をいくつかの基準で評価できる。基準には以下が含まれる:1)特異性(すなわち、オンターゲット読取の数をオフターゲット読取の数で割った値)、2)ヘテロ接合座位の対立遺伝子包含率(すなわち、低深度の対立遺伝子を高深度の対立遺伝子で割ったもの;理想は1.0)、3)座位間バランス(すなわち、最低深度座位を最高深度座位で割ったもの;理想は1.0)、4)深度の変化(すなわち、各座位の平均深度を全ての座位の合計平均深度で割ったもの)。さらなる分析と開発のために、これらの基準に基づいて少なくとも1つのプライマーセットを選択できる。代替的および/または追加的に、プライマー設計は、例えば、各STRマーカーのPrimer3などのウェブベースのプログラムの使用を含んでもよい。
実施例3ライブラリーの調製方法の改善
SPLiT-DSのライブラリー調製プロトコールは、第1のPCRステップが完了するまで、デュプレックス配列決定プロトコールなどの既知の標準プロトコールに従う。本実施例は、本明細書で提供されるSPLiT-DS技術に特有の座位特異的PCRにおいて、特に、最初のデュプレックス配列決定PCRステップ後に生じるステップを改善することにより、このプロトコールを改善および拡張する。
参照点として、反応はまず既知の緩衝液、プライマープール濃度、およびPCR条件(例えば、標準的なDSプロトコールのように)を使用して実行されるが、SPLiT-DSアプローチに適用され、最初のデュプレックス配列決定PCRが実行され、場合によっては、ハイブリッド捕捉など、他の形式の標的化濃縮が行われる。マルチプレックスPCRでのこれらの条件の有効性は、Illumina MiSeqプラットフォームで反応を直接配列決定し、特異性、ヘテロ接合座位の対立遺伝子の包含率、座位間バランス、および深度をモニターすることで決定される。このアッセイはPCRの有効性を評価し(例えばエラー訂正はしない)、条件ごとに約100,000~500,000の読取が使用され、配列決定実行ごとに少なくとも50のPCR条件の分析が可能になる。
この特定の実施例では、分析を成功させるために、各開始DNA分子から平均3~10個の配列決定されたPCRコピー(すなわち、バーコードファミリー)を取得する必要がある。他の実施形態において、成功した分析は、特定の二重鎖分子の各々の元のDNA鎖の1つ以上のコピーを回収することとして定義され得る。追加の有用なデータがなくても、シーケンサーリソースの使用に関して、3~10コピーを超えるとアッセイ効率が低下する可能性があると考えられる。各鎖の平均コピーが少なすぎると、定義された成功した分析の基準を満たさず、最終的には深度が減少すると考えられる。いくつかの実施形態では、各鎖の最小数の配列決定されたコピーを達成するとして成功した分析を定義することは、元の鎖あたりの最小必要コピー数が少ないデュプレックス配列決定よりも高い精確さのデュプレックス配列決定を促進すると考えられる。
SPLiT-DSは、他の現在利用可能な技術と比較して独自のアプローチであるため、DNAインプットの既知の条件(例えば、他のアッセイで知られている条件)に依存することはできず、したがって、第1のPCRステップが必然的に後処理の深度に影響を与えるまでのインプット量の変更(例えば、低減)として、分割後に発生するPCRで使用されるDNAインプット量が決定される。
DNAインプット範囲が決定された後、qPCRベースのアッセイを使用して、アダプターがライゲートされた標的DNAの絶対量を定量化する(例えば、図4のステップ3と同様)。
DNAインプットの減少に伴う精確さ、精度、感度、および特異性
一般的に使用される標準参照物質(SRM)DNAの精確さ、精度、感度、および特異性は、本明細書に記載される改善された技術の参照点として実施される。SPLiT-DSは、連続希釈(例えば、約50pgから約10ngの範囲内)を使用して、インプットDNAの量の減少(すなわち、感度)で実行される(例えば、アプローチの精確さと精度を評価する)。各DNAインプットに対して、少なくとも6つの異なるライブラリーが個別に調製される。配列決定およびエラー訂正(デュプレックス配列決定のSPLiT-DSバリアント用に特別に開発および設計された社内ソフトウェアを使用)後、STRait Razorを使用して以下についての精確さを評価する:(i)処理されたデータの遺伝子型決定、および/または(ii)各CODIS座位で「訂正」遺伝子型を示す読取の割合を決定(すなわち、標準化された試料から既知)。精度は、以下を決定することにより評価される:(i)ヘテロ接合座位の対立遺伝子包含率、(ii)座位間バランス、(iii)深度の変化、および/または(iv)スタッターパーセント(例えば、試料間の変化の定量化)。
混入DNAの検出
本実施例はまた、外因性DNA(例えば、非ヒトDNAで混入されたヒトの法医学的DNA)による所与の試料の混入を検出するための現在利用可能なDNA評価方法の改善に焦点を当てている。SPLiT-DS分析は、混入DNA(マウス、イヌ、ウシ、トリ、Candida albicans、Escherichia coli、Staphylococcus aureusなど)の存在下でヒトDNA試料に対して行われる。分析には、10ngの混入DNAをスパイクした試料DNAが含まれ、次の比率で3回繰り返す:50:50、10:1、および100:1(混入物:試料DNA、重量比で)、ならびに100:0対照(すなわち、ヒトDNAを含まない)0:100(スパイクされていないヒトDNA)。正常に生成された各ライブラリーは配列決定され、参照ゲノムとヒトゲノム(GRCh38)に対応する所与の混入物にマッピングされる。このマッピングを使用して、各座位で正しい(例えば、参照ゲノムと一致する)遺伝子型を示す読取のパーセンテージを決定し、対照の値と比較する。アライメントは、SPLiT-DSの成功をなおも許容する混入DNAの範囲に関する情報を提供する(すなわち、SPLiT-DSの精度や強度に悪影響を与えずに存在する可能性のある混入DNAのレベル)。
実施例4:唯一の供給源試料でのSPLiT-DSの検証。
SPLiT-DSが代表的なヒト集団で実行可能な高精度遺伝子型決定法として検証されるように、Personal Genome Project(PGP)から取得した細胞から精製されたDNAが使用される(例えば、表3のPGPの人口統計の詳細を参照されたい)。
表3:PGP試料の詳細
Figure 0007256748000003
SPLiT-DSの能力を評価して、DNA単一供給源試料を正しく遺伝子型決定する。
SPLiT-DSは、PGPの血縁関係のない個人の細胞株から精製されたDNAに対して、2回ずつ実行される。約110人の固有の個人からのDNAが試験される。SPLiT-DSは、前の実施例で決定された適切な量のDNAを使用して実行される(すなわち、各座位の平均60倍を超えるポストプロセッシング深度で配列決定ライブラリーを確実に(例えば、80%を超えて)産生する最小量)。本明細書に記載されている社内SPLiT-DSソフトウェアを使用して配列決定を行い、エラー訂正を実行した後、STRait Razorを使用して試料の遺伝子型を決定する。
SPLiT-DSデータの遺伝子型決定の解釈ガイドラインとして、次のように、2つの複製の修正された「コンセンサス」アプローチが使用される。
結果なし:少なくとも1つ(例えば、2つのうちの1つ)の複製が低い包含(例えば、60倍未満)を産生するとき;
正しい遺伝子型:全て(例えば、2つのうち2つ)の複製が予想される遺伝子型を産生するとき(すなわち、所与の試料のWGSデータの遺伝子型と一致する)。
未定義の遺伝子型:所与の座位で全ての複製(2つのうち2つなど)で異なる遺伝子型が取得されるとき、または1つの遺伝子型のみがWGSデータと異なるとき。
誤った遺伝子型:全て(2つのうち2つ)の複製が同一の誤った遺伝子型を示すとき。
配列決定された座位のスタッター比を決定することにより、全ての試料と座位でスタッターの量を定量化する。スタッター比は、所与のスタッター対立遺伝子の読取数を実際の試料の対立遺伝子の読取数で割ることによって計算される。1つを超えるタイプのスタッター事象が観察された場合、各スタッター長の計算が行われる。この分析のバイアスを最小限にするために、スタッター率は、平均深度が60倍以上の座位でのみ計算される(5%で発生する代替スタッター対立遺伝子を含む1以上のポストプロセッシング読取を検出する80%の力(1-Sample Binomial試験)。少なくともいくつかの座位で一貫した高い深度包含が得られる場合、低頻度のスタッター事象が調べられ、比率が適切に計算される(例えば、パワーを調整する)。
本実施例の分析の別の部分には、様々なパラメーターに対するSTRの長さの影響が含まれ、参照の所与の座位での結果とSTRの長さと比較することが含まれる(例えば、特異性、ヘテロ接合座位の対立遺伝子包含率、座位間バランス、および/または深度)。これらのパラメーターの評価により、STRの長さに基づいた多型の解釈が改善されると考えられる(例えば、評価されるSPLiT-DS試料は一般的に非近交系の集団から採取され、例えば様々なSTR長の多型を持っている可能性があることを含む)。STRの長さの効果の評価に加えて、スタッター比も決定される。最後に、各試料の識別力の計算(本明細書に記載されているガイドラインに従って正しく遺伝子型決定された座位に基づいて、例えば、米国の人口で予想される対立遺伝子頻度を使用して)が実行される。
本実施例で説明する分析の結果は、例えば様々なタイプの試料、および/またはSTRの遺伝子型決定のためなどの、SPLiT-DSの使用範囲(および方法の任意のバイアスの程度)を決定する。
キャピラリー電気泳動およびMPSアプローチによる比較および一致の研究
例えば、法医学用途の配列決定法としてのSPLiT-DSの優位性を実証するために、現在利用可能な手法に対する一致研究が実施される。現在、法医学のSTR遺伝子型決定の「ゴールドスタンダード」はPCR-CEである。本明細書に記載される実施例に従って得られたSPLiT-DSの結果は、標準手順に従って、PCR-CE分析および1ngのインプットDNAを使用して遺伝子型決定された同一のDNA試料と比較される。2つのデータセット(PCR-CEおよびSPLiT-DS、適切な対照/参照(例えば、WGS PGP試料データ)が伴う)によって、2つのアプローチ間の一致のレベルを決定できる。一致の研究はまた、CODIS座位を含む63のSTRおよび95の識別性情報SNPの標的化PCR増幅を使用する市販のキット(例えば、Illumina FORENSEQ DNA Signature Prep Kit)を使用して実行される。PCR-CEとSPLiT-DSの一致の研究で使用されたのと同一の試料が使用され、遺伝子型決定はSTRait-Razorを使用して実行される。PCRスタッターも各アプローチ(PCR-CE、市販キット、SPLiT-DS)でレビューされ、真の対立遺伝子ピークの高さが少なくとも600RFU(確率的しきい値)であるが15,000RFUを超えない場合にスタッターが計算される。ヘテロ接合対立遺伝子間の繰り返し位置でのプラスおよびマイナスのスタッターの付加的な全ての効果を排除するために、2つの繰り返し単位を離れた位置は含まれない。本明細書に記載されるように、スタッターのパーセンテージは、スタッターピークのピーク高さを真の対立遺伝子のピーク高さで割ることにより計算される。市販のキットによって分析した試料の場合、60以上の観察された読取を持つ全ての対立遺伝子がコールされ、本明細書に記載されるようにスタッターのパーセンテージが計算される。比較は、試験された各座位のスタッターパーセントの間で実行される。プラットフォーム間のスタッターの結果は互いに直接比較できないが、データは各方法におけるスタッターの相対的な豊富さの合理的な推定を提供すると考えられる。
実施例5:損傷したDNAおよびDNA混合物に対するSPLiT-DSの検証。
高度に損傷/分解されたDNAおよび混合物は、現在利用可能な遺伝子型決定技術を混乱させる。したがって、本実施例は、SPLiT-DSが損傷したDNAおよびDNA混合物を含む試料を正しく遺伝子型決定し、現在利用可能な方法論を改善および拡張する能力を実証する。
単一の寄与者からの損傷したDNAに対するSPLiT-DSの検証
SPLiT-DSは、法医学的に関連する以下の3つのカテゴリーにさらされた試料DNAに対して実行される:(i)化学物質への暴露、(ii)紫外線(UV)光、および(iii)高温(従来のSTR分析に影響を与えることが知られている/以前の研究で使用された例示的な暴露方法/条件の要約については、表4を参照されたい)。損傷したDNA試料に利用できるSRMの不足により、誘発される損傷のレベルは生物学的複製間で標準化される。DNAは最初に表4に示す環境条件および時点にさらされ、所与の試料中のDNA損傷/分解の決定に使用される市販のキット(例えば、KAPA Biosystems hgDNA Quantification and QC qPCR kit(Roche/KAPA Biosystems))を使用して評価が行われる。特定の環境条件(本明細書に記載されるアッセイで決定されるような)に対して同等のレベルの損傷(観測平均値の1標準偏差以内として定義)を示す試料のみが、本実施例の分析に使用される。
損傷/分解したDNAでSPLiT-DSを評価する実験は、表4の各カテゴリー(本明細書に記載されるようになされたそのような量の決定)で考えられる最も過酷な条件でSPLiT-DSを使用して配列決定できるライブラリーを一貫して(>50%)形成するのに必要な最小インプットDNA量を使用して、Promega 2800M SRM DNAで3回実行される。一貫性のあるライブラリーを産生しない条件は、損傷/分解したDNAに対するSPLiT-DSの感度の限界を定義するとみなされると考えられる。そのようなライブラリーはいずれも評価されない。
表4:DNA損傷条件
Figure 0007256748000004
試料は、Illumina MiSeqプラットフォームで300bpペアエンド読取を使用して配列決定され、STRait Razorを使用して決定されたデータ遺伝子型について、本明細書に記載されるカスタムSPLiT-DSソフトウェアを使用して処理される。(前の実施例で説明したように)正しく遺伝子型を決定できなくなる実験条件は、損傷/分解したDNAのSPLiT-DSの精確さの限界を定義すると考えられる。計算は、特異性、ヘテロ接合座位の対立遺伝子包含率、および/または損傷/分解DNAの各座位の深度を決定するために実行され、結果は損傷のない対照と比較される。
高品質のDNAでのSPLiT-DSの相対的な性能は、損傷したDNAでの性能と必ずしも直接変換可能ではないため、SPLiT-DS、標準PCR-CE、およびMPS法を使用して比較も実行される。これらの方法は、以前の実施例で遺伝子型決定した10のPGP試料を使用して実行され、正常に遺伝子型決定したSPLiT-DS試料の損傷の各カテゴリーで最も困難な条件(結果により決定)に供される。試料は、以前の実施例に記載したように、適切な市販のキットを使用して、PCR-CEおよび従来のMPSで遺伝子型決定する。SPLiT-DSのPCR-CEおよびMPSへの相対的な性能は、アプローチ間のスタッター、対立遺伝子ドロップアウト、対立遺伝子内バランス、および遺伝子型決定の成功率の相対的な量の決定と比較を含んで、本明細書に記載されるように決定される。I SPLiT-DSは、他の方法で達成できるよりも、より小さな試料および/またはDNAのより損傷した/より分解した試料を使用して、より高感度で精確な結果をもたらし得る。
混合物でのSPLiT-DSの検証。
広範囲のMAF比の遺伝的に無関係な2人の個人からなるDNA混合物のSPLiT-DS分析の有効性の向上(例えば、利用可能な方法と比較したときの精確さと感度の向上)が実証される。表5の各混合物については、前の例で遺伝子型決定したPGP試料から、10組の2人の組み合わせが選択される。本実施例で使用される特定のPGP試料は、以前の実施例または全ゲノム配列(PGPの一部として入手可能)により決定される特定の遺伝子型に依存する。可能であれば、8を超える座位で少なくとも2回の繰り返しの長さの異なる寄与者ペアが選択される。各試料から10ngを超えるDNAが必要になる可能性が高いと考えられる。正確な量は、以前の実施例で決定したように、各座位でSPLiT-DSがどれだけ効率的に機能するかによって決定される。
表5:DNA混合物条件
Figure 0007256748000005
DNAのインプット量は、任意のマイナーな寄与者が少なくとも10の読取で表れるように調整される。少なくとも10の読取がある表現は、全てのCODIS座位で両方の対立遺伝子を検出する可能性が95%を超えると考えられる。以前の実施例で示したように、10のMAFの読取を達成するために必要な特定の量は、SPLiT-DSの感度の限界に依存する。
複製間のばらつきを最小限にするために、QUANTIFILER Duo DNA定量化キット(Thermo Fisher)を使用して、3重のDNA定量化に基づいて混合物を構築する。本明細書に記載されるように、Illumina MiSeqプラットフォームで試料を配列決定し、本明細書で記載されるカスタムSPLiT-DSソフトウェアを使用してデータを処理し、STRait Razorを使用して遺伝子型を決定する。これらの実験でスタッターの存在を評価することは、DNA混合物でのSPLiT-DSの性能の評価に役立つ。各混合試料で分析された各座位について、既知のMAFのウィルソンスコア間隔(二項比例信頼区間の形式)が計算される。混合物の既知のMAFと1反復長だけ異なるスタッター事象の数計数される。
スタッター読取計数がMAF対立遺伝子の1つの95%ウィルソンスコア間隔内にある場合、座位は部分一致とみなされる。両方のMAF対立遺伝子がこの試験に失敗する場合、座位は失敗した遺伝子型コールとみなされる(MAFがスタッターと区別できない場合、ホモ接合性対立遺伝子は自動的に失敗する)。以前の実施例と同様に、SPLiT-DSのPCR-CEおよびMPSに対する比較研究、ならびにスタッター、対立遺伝子ドロップアウト、対立遺伝子内バランス、および/または遺伝子型決定の成功率の相対的な量の比較も、本明細書に記載されるように実施および評価される。次いで、2人の混合実験の結果を使用して、2人の混合分析と同じ試料選択基準と分析を使用して、3人の混合実験(例えば、表5を参照されたい)を実施する。
SPLiT-DSは、以前に分析された市販の法医学DNA習熟度試験から、ワシントン州パトロール法医学研究所サービスビューローによって提供されたDNAを使用して、単一供給源および2人の混合物の模擬ケースワーク試料を使用して実行される。SPLiT-DSを使用した遺伝子型決定は、試料のオンライン投稿コンセンサス結果と比較される。
実施例6:損傷したDNA試料でのSPLiT-DSの向上したパフォーマンス
ホルマリン固定は、シチジン脱アミノ化、酸化的損傷、および架橋の形で極端なDNA損傷を引き起こす。現在利用可能な方法と比較してSPLiT-DSの機能を実証するために、Promega 2800M SRMのD3S1358座位でホルマリン固定された核DNAを配列決定することにより、高度に損傷したDNAの分析を実施した(図13Bおよび14A)。図13A~13Cは、本技術の一実施形態によるSPLiT-DS手順から得られたデータを示す。図13Aは、配列決定前のインサート断片サイズを示す代表的なゲルである(レーン1はラダーであり、レーン2および3は、各チューブからのPCR産物の試料である、例えば図4のステップ4を参照されたい)。図13Bおよび13Cは、CODIS遺伝子型対エラー訂正の非存在下(図13B)およびSPLiT-DSによる分析後(図13C)の配列決定読取の数を示すグラフである。図13Bは、エラー訂正の非存在下で多型が観察された試料(D3S1358)を示し、スタッター事象は黒い矢印で示される。図13Cは、SPLiT-DSによる分析後、検出可能なスタッター事象を含まない試料(D3S1358-DCS)を示す。図13Bおよび13Cのそれぞれのx軸は、CODIS遺伝子型を示し、y軸は、読取の数を示す。
図14Aおよび14Bは、本技術の実施形態による、高度に損傷したDNAに対する、CODIS遺伝子型対エラー訂正の非存在下(図14A)およびSPLiT-DSによる分析後(図14B)の配列決定読取の数を示すグラフである。各パネルのx軸は、CODIS遺伝子型を示し、y軸は、読取の数を示す。図14Aは、SPLiT-DS(D3S1358)によって分析されない損傷DNA試料を示し、スタッター事象(黒い矢印)および顕著な量の明らかな点変異(図示せず)を示している。図14Bは、SPLiT-DSエラー訂正で分析された試料(D3S1358-DCS)を示しており、検出可能なスタッター事象がないことを示す。明らかな点突然変異は全く観察されなかった。
SPLiT-DSの結果は、ホルマリンにさらされたDNAで、標準の配列決定法を使用して存在する全てのPCRおよび配列決定ベースのアーティファクトがSPLiT-DSを使用して排除されることを示した。(図13Cおよび14B)。これらの試料では効率の低下(約3倍)があったことが注目された(例えば、図14B対図13Cを参照されたい)が、ホルマリン固定に共通の鎖間架橋の存在がこの低下に寄与している可能性がある。
実施例7:標的化ゲノム断片化
本実施例は、ゲノムDNA(gDNA)の配列決定の効率を改善する方法として、標的化ゲノム断片化を実証している。SPLiT-DSゲノムの断片化は、通常、例えば物理的せん断またはDNAホスホジエステル結合の酵素消化などの方法によって達成される。そのようなアプローチは、無傷のgDNAがランダムなサイズのDNA断片の混合物に低減された試料を産生する。非常に堅牢であるが、可変サイズのDNA断片は、PCR増幅バイアス(短いフラグメントがより多く増幅する)と不均一な配列決定の深度(図11A)、ならびにDNA断片内の目的の領域と重複しない配列決定読取を引き起こす可能性がある。したがって、本実施例ではCRISPR/Cas9を使用してこれらの問題を克服する。切断部位は、あらかじめ決められた均一なサイズの断片を産生するように設計される。断片のより均質なセットは、標的化断片化を使用しない他の技術の効率に影響を与える可能性のあるバイアスおよび/または情報のない読取の存在を克服しない可能性が高いとみなされる。また、断片サイズの一貫性/差異のために、gDNAから断片を分離することにより大きなオフターゲット領域の除去が可能になる可能性が高いため、標的化断片化がライブラリー調製前に所与の試料の事前濃縮を促進する可能性が高いと考えられている。
実施例8:がんの監視と診断のためのSPLiT-DS
血液中の循環腫瘍DNAの存在は何十年も認識されてきたが、がんバイオマーカー(例えば、疾患の存在/進行を診断および/または追跡するためのマーカー)の信頼できる開発のために超高感度の方法が必要である。SPLiT-DSは、様々な量の無細胞DNAを含む血液試料内の少量の循環腫瘍DNAを含む、広範な課題を克服するのに役立つ。SPLiT-DSはまた、特定の変異の事前知識を必要としないため、BEAMing、SafeSeqS、TamSeq、ddPCRなど、当該技術分野で既知のいくつかの高感度かつ特定の方法を改善および拡張する。SPLiT-DSは、低いDNAインプットで、特定の腫瘍変異に関する予備知識なしで、現在利用可能な最高レベルの精確さでがん関連変異を検出できるアプローチを提供する。
本実施例では、SPLiT-DSを使用して、循環腫瘍細胞DNAに関連する配列を評価する。既知の変異の対照試料が、がんと診断される、および/またはがんの疑いがある患者からの試料と一緒に使用および実行される。
SPLiT-DSおよびゲノムDNAまたは無細胞DNA
SPLiT-DSは、低インプットgDNA(10~100ng)およびcfDNA(約10ng)の精確な配列決定のためのアッセイの開発に使用される。ゲノムDNAは一般に大きな断片(1Kbを超える)で発生し、無細胞DNAはほとんど例外なく、約150bpの頻度の少ない断片として発生する。
低インプット(10~100ng)gDNAの根拠
本実施例は、低DNAインプットに対するSPLiT-DSの実現可能性と多重化への適合性を実証する。がん患者の生検から組織を入手し得るが、必要な全ての試験を完了するために、このような試料の使用は控えめにすることが好ましい。したがって、gDNAの配列決定は、低インプットの物質を必要とするSPLiT-DSが提供するプラットフォームなどの改善されたプラットフォームから恩恵を受ける。
SPLiT-DSの各標的は、個別に設計および最適化される。遺伝子TP53、KRAS、およびBRAFは、原理の証明として分析される。特に、各遺伝子にはがんに関連する変異が発生する既知の標的領域がある。TP53には10のコーディングエクソン(比較的小さいサイズ)があり、その全てがSPLiT-DSを使用して標的化される。KRASは、エクソン2のコドン12、13、および61に既知の変異ホットスポットを有するが、これらは全て標的化される。BRAFには、エクソン15で標的化されるV600Eの変異を有する。
材料および方法
SPLiT-DSアッセイは、TP53、KRAS、およびBRAFで既知のクローン変異を有する匿名化された腫瘍のDNA、ならびにがんのない個人の白血球gDNAを使用して、図4および5に概説されているように、gDNAで実行される。任意の最適化/検証ステップを実験して、効率と感度を試験するために、2つの異なる実験セットが実行される。
効率
効率は、DCS読取に変換されるインプットDNA分子のパーセンテージとして定義される。本実施例の効率は、少なくとも30%であるが、50%を超えることを目標とする。10ngのインプットDNAが目的の座位全体にわたって平均1000倍のDCS深度を達成する可能性が高いと考えられる(10ng=約3200ゲノム、したがって3200×0.3効率=約1000ゲノムが配列決定される)。効率は、一部、マルチプレックスPCRの性能に依存する。インシリコアプローチを使用して、PCRプライマーは次のように設計される:i)高い標的特異性、ii)多重化する能力、iii)堅牢で最小バイアスの増幅を実行する能力。
CRISPR/Cas9システムは、特定の目的の領域を含む約500~550bpの断片を特異的に産生するために使用される(図11Cを参照されたい)。ガイドRNAとPCRプライマーの設計を完了した後、コンビナトリアルアプローチを使用して以下を達成する:(i)標的特異性(すなわち、標的読取のパーセンテージ、70%を超えると許容可能):および(ii)座位間深度バランス(すなわち、最低深度の座位を最高深度の座位で割る、0.5%を超えると許容範囲)。最適化されたガイドとプライマーのプールは、次いで、10ngおよび100ngの同一のgDNAに適用される。これらのプールは、gDNAを含む全ての後続の実験に使用される。
感度
TP53変異腫瘍gDNAは、1:2、1:10、1:100、1:1000、1:10,000の比率で、対照の非変異白血球gDNAにスパイクされる。KRASおよびBRAFのそれぞれに既知のクローン変異を含む2つの追加の腫瘍DNAを使用して、合計15の試料(3つの遺伝子ごとに5希釈)で同じ混合実験を行う。これらの15の試料は、10ngおよび100ngのインプットDNAを使用して、本明細書で記載されるようなSPLiT-DSで処理される。「期待される」MAFと「観察される」MAFを比較する(最大MAFはMAFmax=α INによって決定されるガイドラインを使用し、Nはゲノムの数であり、aはSPLiT-DSの効率であり、例えば、30%の効率で、MAFmaxが10ngのDNAに対して0.1%であり、100ngのDNAに対して0.01%である)。
二項分布に基づいて、MAFmaxに存在する所与の変異を検出する確率が63%に達する可能性が高いと考えられる。実験には3つのスパイクされた変異があるため、統計的には少なくとも1つが0.1%と0.01%で検出される可能性が高く、効率は30%を超えるとこの確率が高くなる。
スパイクされた変異に加えて、正常な対照DNAは腫瘍DNAとは異なる個体からのものであるため、感度を確認するためにSNPが使用される。SNPは、同一の希釈(ホモ接合SNP)および1:4、1:20、1:200、1:2000、および1:20,000の有効希釈(ヘテロSNP)で調べられる。
CRISPR/Cas9は、全てのTP53エクソンを効率的に切断し、サイズ選択による濃縮を促進し、読取使用量を最大化できた。CRISPR/Cas9ガイドは、TP53エクソンを切断するように設計された(図12Aを参照されたい)。エクソン5~6および7(図12Cおよび12D)を増幅するための適切なPCRプライマーによって、以前の実施例に記載したように、SPLiT-DS(図12Bおよび12Cを参照されたい)を使用して10ngのgDNAを消化および処理した。DNAの両方の鎖は、高いパーセンテージのオンターゲット読取により適切に配列決定され、各分子の相補的なランダムタグと一致した後、DCS読取が生成された(図12D)。さらに、10ngのDNAの開始量で得られた平均深度は25%の効率に相当し(すなわち、元の3000ゲノムから、平均で約800倍が配列決定された)、これは、標準DSの50倍の改善、および従来の溶液ハイブリダイゼーションアプローチと比較した比類なき改善を表す。
実施例9:cfDNAの精確な配列決定のためのSPLiT-DSの開発
本実施例は、以下の例示的ながん関連遺伝子の変異の検出のためのSPLiT-DSの使用を実証する:cfDNA中のTP53、KRAS、およびBRAF。
材料および方法
市販の血漿(Conversant Bio)からの無細胞DNAは、QIAamp Circulating Nucleic Acidキットを使用して抽出される。目的の3つの遺伝子のそれぞれについて既知の変異をコードする3つの異なる合成150bpのDNA分子が使用される。これらの各合成DNA分子は、1:2、1:10、1:100、1:1000、1:10,000の比率でcfDNAにスパイクされる。cfDNAのSPLiT-DSプロトコールパラメーターを最適化および検証するために、2つの異なる実験セットが実行される。
効率
cfDNAはすでに断片化されているため、切断(例えば、CRISPR/Cas9)は必要ない。したがって、SPLiT-DSは、ネステッドPCRを追加して、以前の実施例で記載したように実行される。得られたフラグメントは、MiSeq v3で150サイクルで配列決定され、それぞれ約250万回の読取のために約10の試料がカートリッジに多重化される。
感度
cfDNAのTP53、KRAS、およびBRAF変異のそれぞれに対する5つの混合希釈(1:2、1:10、1:100、1:1000、1:10,000)は、本実施例で設計され、10ngおよび100ngのDNAで開始する、最適化されたプライマーを使用するSPLiT-DSによって分析される。実験は、SafeSeqSと並行して実行され、技術間の感度を比較する(ctDNAの精確な配列決定のための既知の技術はSafeSeqSであり、一本鎖訂正を使用してNGSエラーを低減する)。SPLiT-DSは、MAF=0.1%および0.01%での変異の検出に関してSafeSeqSを上回る可能性が高いと考えられる。SPLiT-DSは推定平均感度0.5%でスパイク変異を検出できる可能性が高いと考えられるが(表2)、Safe-SeqSはそのような低頻度ではスパイク変異を検出できない。
プライマー(ネステッドPCRアプローチのための)は、KRASエクソン2のコドン12および13を増幅するように設計された。正常な血漿(Conversant Bio)から抽出された10ngと20ngのcfDNAを並行して処理した。図15Aおよび15Bは、本技術の一実施形態により、ネステッドPCRを使用し、10ng(図15A)および20ng(図15B)のcfDNAから生成されたKRASエクソン2のSPLiT-DS配列決定データを視覚的に表す。本実施例では、SPLiT-DSを使用して標的濃縮を行い、配列決定はは75bpのペアエンド読取でlllumina MiSeqで行った。二重鎖形成前の「A」鎖と「Β」鎖の両方のSSCS、および最終DCS読取が示される。矢印は、2つの座位特異的PCRプライマーを示す(灰色のプライマー=ネステッドPCRプライマー)。
図15Aおよび15Bに示すように、「サイドA」および「サイドB」はDNAの2つの異なる鎖に対応し、適切に増幅され、それらの相補鎖が非常に精確なDCS読取を形成することを発見した。得られた深度は控えめであった(約50読取)が、約1%の効率に相当し、これは標準的なDSの現在の効率である。したがって、ベースライン(すなわち最適化なし)で、SPLiT-DSは現在使用されているアプローチと同じ効率で結果を取たが、わずか10ngのインプットDNAで、非常に少ない量を含んで、cfDNAを配列決定するために利用可能な他のアプローチよりも効率が向上していることを実証している。
実施例10:ctDNAに基づく膵臓癌の検出と予後のためのSPLiT-DS。
本実施例は、SPLiT-DSを使用した膵管腺癌(PDAC)患者のctDNAの変異の検出時の改善(現在利用可能な方法と比較して)を示す。SPLiT-DSは、KRAS、TP53、およびBRAFを含む複数の標的遺伝子におけるddPCRの感度を向上させる。これらのアッセイの結果は、現在のアプローチでPDAC患者の95%で1つの変異を検出し、PDAC症例の50%を超えて2つの変異を検出する感度の向上を示す可能性が高いと考えられる。
さらに、ヒト対象の循環中のほとんどのDNA(すなわち、循環系(例えば、無細胞DNA))は造血起源であるため、白血球DNAはcfDNAに見られるものと比較される配列と変異となる。これらの結果は、特定のバックグラウンド変異が白血球サブクローンに由来するかどうかを、他の結果よりも高い感度と精確さで通知することが提案されている。
物質および方法
PDACの40人の患者、慢性膵炎の20人の患者、および年齢が一致した20人の正常対照からの完全に特定されていないcfDNAおよび一致する白血球DNA試料が評価される。血液試料は抽出後2時間以内に処理され、2~5mlの血漿と500ulのバフィーコートを含む試料が提供される。さらに、PDAC患者の場合、腫瘍の変異を確認するために凍結腫瘍片が利用可能になる。全てのPDAC患者について、術前に血液が調達される。全ての患者は臨床的に追跡され、再発までの時間および死亡率を含む詳細な臨床病理情報が利用可能になる。患者の試料には、20人の限局性がんと20人の転移性がんが含まれる。
ctDNAはQIAamp Circulating Nucleic Acid Kitで抽出され、gDNAはQIAamp DNA Miniキットで抽出される。10 ng以上のcfDNA(収集された血漿から)、100ngのgDNA、および利用可能な全てのctDNA(最大100ng)は、KRAS、BRAF、およびTP53を対象に、本明細書に記載されるような適切なSPLiT-DS手順で処理される。配列決定は、ctDNAの場合はIllumina 150サイクル、gDNAの場合は600サイクルのMiSeq v3 Reagent Kitを使用して実行される。150サイクルキットでは10のctDNA試料が多重化され、600サイクルキットでは15のgDNA試料が多重化される。実験デザインに基づいて、10ngのDNAで少なくとも1,000倍、100ngのDNAで10,000倍もの配列決定深度で、少なくとも30%の予想効率が得られる可能性が高いと考えられる。データは、配列決定、DCS生成、および変異の同定後に分析される。
膵臓癌の検出
本実施例では、PDAC患者のcfDNAにおけるKRAS、TP53、およびBRAF変異を検出するSPLiT-DSの感度と特異性を決定する。感度を分析するために、cfDNAで見つかった変異を、SPLiT-DSで同定された腫瘍変異(クローンおよびサブクローン)と比較する。SPLiT-DSの結果は、1変異のPDAC症例のほぼ全てと2変異の症例の50%を超えて包含するため、全ての転移症例と約80%の限局性症例のcfDNAで少なくとも1つの腫瘍変異を検出するる可能性が高いと考えられ、全てのPDACに対する感度の合計が約90%となる。
cfDNAで見つかった変異は、同じ患者から精製された一致した白血球で見つかった変異と比較される。cfDNAで見つかった変異と一致する白血球は生物学的バックグラウンドとみなされ、cfDNAの最終的な変異数からは無視される。共有される突然変異を差し引くと、PDAC、膵炎、および対照のcfDNA変異が比較される。生物学的バックグラウンド変異(例えば、年齢関連の変異)が試料に残っている場合でも、がんの変異は生物学的バックグラウンドの変異よりも高い頻度で発生する可能性が高いと考えられる。曲線下面積と年齢補正ROCモデルを使用して、最大の感度と特異性でがんと対照を区別するために、変異頻度の最適な閾値が決定される。
膵臓癌の予後
以前の実施例で示したように、SPLiT-DSの感度が向上したため、以前に利用可能なアプローチとは対照的に、ctDNAはほぼ(90%)全てのPDAC患者で検出可能である可能性が高いと考えられる。ctDNAの存在に対するバイナリ変数(すなわち、はい/いいえ)の代わりに、ctDNA MAFは量的変数として分析され、MAFスコアと臨床データを比較する(例えば、MAFスコアと予後を比較する)。変異した遺伝子、コドン、および/または変異タイプが再発または死亡と相関しているかどうかも決定される。交絡因子(年齢と病期を含む)に合わせて調整された多変量COXモデルを使用して、これらの変数とその組み合わせの能力を試験し、無病生存率と全生存率を予測する。カプラン・マイヤー曲線は、カテゴリー変数の予測値を表すために使用される。
実施例11:転移性CRCにおける耐性変異の同定のためのSPLiT-DS
早期がんの検出、およびctDNAを使用した再発の予測
発症時の症例の約50%を占める転移性CRC(すなわち、ステージIV)では、治療の決定を導くために腫瘍の遺伝子型決定が不可欠である:KRAS、NRAS、およびBRAFの発癌性変異は、CRC患者の約50%で発生し、EGFRモノクローナル抗体セツキシマブおよびパニツムマブに対する応答の欠如を予測する。したがって、これらの遺伝子は固定と未固定の組織生検の両方で日常的に評価されるが、現在利用可能なアプローチはしばしば低品質のサブクローン解像度をもたらし、試料採取バイアスに悩まれる。その結果、サブクローン変異を有する腫瘍は見逃され、一部の患者には確実に失敗する治療法が投与される可能性がある。したがって、本実施例では、SPLiT-DSを使用したctDNAによる腫瘍遺伝子型決定により、現在利用可能な技術よりも感度が向上したアッセイが実証され、これはまた、EGFR遮断療法の患者の適格性を条件付けるSPLiT-DSの既存の耐性変異の検出により、診断と治療を改善する。
CRCの存在および/または再発の検出および予測
SPLiT-DSは、特定の腫瘍変異に関する予備知識なしにctDNAの変異の検出を実証するために、5つの一般的に変異したCRC遺伝子のパネルで使用される。このアッセイの結果は、はるかに単純化された検査(例えば血液検査)を使用して将来のCRC検出を通知できる可能性が高いと考えられる。
本実施例は、再発を検出および/または予測するために使用される方法の改善も実証する。現在、十分な感度および/または特異性の欠如により利用可能な技術が制限されるか、または、十分な感度/特異性を有する技術の場合、それらは法外な費用がかかる。したがって、ctDNAのSPLiT-DS分析は、CRCの再発の改善された検出および予測を実証し、精確さの改善(例えば、例としてのSafeSeqSの100倍を超える)、ならびに複数の遺伝子を拡大および評価する能力を提供する。
物質および方法
本実施例では、腫瘍の外科的切除を受けた300人を超える患者からの複数の生検タイプの患者からの試料が使用される。利用可能な生体試料には、腫瘍、血漿、バフィーコートが含まれる。試料が得られた患者を縦断的に追跡し、ベースライン切除後6、12、および24か月で血液試料を入手できる。全ての患者について、再発を含む詳細な臨床病理情報が利用可能である。全ての試料とコード化された医療情報は完全に匿名化されている。転移性疾患の患者からの試料は、セツキシマブまたはパニツムマブに対する応答の可能性を決定するために、以前にKRASおよびNRASの変異について評価された。変異が見つからなかった場合、標的化療法が適用された。耐性は、イメージング研究の進行を介して記録された。
転移性がんの20人の患者(IV期)と限局性がんの40人の患者(I期~III期)の試料を評価する。DNAは、手術前に得られた血漿(2~5ml)およびバフィーコート、ならびに凍結腫瘍試料から精製される。転移性がんを有すると分類される患者は、KRASおよびNRASの変異について陰性と試験されたが、EGFR阻害剤療法に応答しなかった患者である。少なくとも10人の再発患者も含まれる。ctDNAは、手術後6、12、および24か月に収集された血液で測定される。以前の実施例のように、白血球DNA変異を使用して、cfDNAに存在する可能性のある潜在的な生物学的バックグラウンド変異を同定する。
さらに、APCはCRCで最も一般的な変異遺伝子であり、本実施例で使用されるSPLiT-DSパネルには、例えば、コドン1,286からコドン1,585に及ぶ変異クラスター領域(299bp)など、APCの最も一般的な変異領域が含まれ、これはAPC52のCRC変異の約60%を包含し、COSMICで見つかった追加の上位ヒットは合計で約1000bpである。NRASコドン12、13、61も含まれる。したがって、本実施例で使用されるパネルには、APC(約1000bp)、TP53(コード領域1182bp)、KRAS(コドン12、13、61)、BRAF(V600E)、およびNRAS(コドン12、13、61)が含まれ、合計サイズは約2700bpである。本実施例で記載されるパネルが、1つの変異と2つの変異を含むもののサブセットを含む全てのCRC試料を包含する可能性が高いと考えられる。
転移性CRCにおける耐性変異の同定
SPLiT-DSは、cfDNAのクローン腫瘍変異について、転移性CRCからの試料を評価するために使用される。全ての腫瘍はKRASおよびNRASの変異に対して陰性であるが、本実施例に記載されるパネルで同定された少なくとも1つのクローン変異(APCまたはTP53中)を保有する可能性がある。SPLiT-DSは、EGFR療法に対する耐性を付与するctDNAの非常に低い頻度(0.1%未満)の変異の存在が検出可能かどうかを判断するためにも使用される。転移性疾患の患者からの試料は、非常に高い深度(約10,000倍)で正常にシーケンスされる可能性が高いと考えられる。SPLiT-DS分析は、腫瘍DNAのサンガー配列決定によりKRASおよびNRASが陰性であるがEGFR療法に失敗した転移性疾患患者のctDNAにおける低頻度KRAS、BRAFおよびNRAFの変異の検出も改善する。SPLiT-DSを使用して同様の高深度で腫瘍DNAを配列決定し、ctDNAにおける一次耐性変異の有無を判定する。ctDNAと腫瘍内組織由来のDNAの結果を比較する。
限局性CRCの検出
SPLiT-DSは、限局性(ステージI~III)がんの試料で、本明細書に記載される5つのCRC遺伝子のパネルを使用してctDNAを同定するために使用される。腫瘍DNAもSPLiT-DSを使用した配列になる。以前の実施例に記載したように、白血球細胞に由来する生物学的バックグラウンド変異の存在も決定される。
現在利用可能な特定の方法(例えばCEA)は、再発を検出する他の方法と比較して、推定1.5~6か月の「リードタイム」を提供するが、そのような時間が生存に影響するかどうかは明らかではない。他の技術はリードタイムを改善するかもしれないが、腫瘍の遺伝子型の先験的な知識を必要とする。したがって、SPLiT-DSを使用してctDNAを配列決定し、「リード」タイムを数か月改善する優れた能力を実証し、本明細書で記載するように、腫瘍遺伝子型の事前の知識は必要ない。本実施例では、再発を経験した限局性CRC患者の初回手術後6、12、および24ヶ月でctDNAを検出するSPLiT-DSの能力を実証する。腫瘍とベースラインctDNAが前述のパネルの遺伝子に少なくとも1つの変異(理想的には2)を保有している再発を有することに基づいて、10人の患者が選択される。各試料(個人)について、ベースライン、6、12、および24か月での各変異の総ctDNAレベルに対して、経時的な病歴(化学療法、CTスキャン、および再発の他の指標)がプロットされる。ctDNAおよびCEAのCEAレベルおよび再発までのリードタイムにおける比較も評価される。
実施例12:CRISPR-DS
本実施例では、非常に精確で高感度の配列決定を実行するためのCRISPR-DSの作成について記載する。CRISPRベースの技術を使用して、あらかじめ決められた均一な長さで設計された標的領域を切除した(図12A)。本実施例では、使用されたCRISPR適合性ヌクレアーゼはCas9であった。このサイズコントロールを使用して、ライブラリー調製の前にサイズ選択を容易にし(図12B)、続いてエラー除去を実行するために二本鎖バーコード付け(図12C)を実行した(前述の、例えばDS法と同様)(図12D)。バーコード付けに続いて、単一回の捕捉が実行され(他の利用可能な方法とは対照的に)、非常に高いオンターゲット濃縮が行われ、完全な配列決定読取を包含する断片を産生することができる(図12Fおよび16A)。ハイブリダイゼーション捕捉の断片化は通常、超音波処理で実行され、これは、長すぎたり、目的の領域と重複しない配列決定読取、および/または短すぎたり、相互に重複し、同一の配列を再読取する配列決定読取をしばしば生成する(図12Fおよび16A)。図16Bおよび16Cは、本技術の実施形態による、標準的なDSおよびCRISPR-DSプロトコールで調製された試料の断片インサートサイズを示すヒストグラムグラフである。X軸は、最適な断片サイズ、例えば、分子バーコードとクリッピングの調整後の配列決定読取の長さに一致する断片サイズ、との差異の割合を表す。縦欄領域は、最適なサイズから10%以内の範囲にある断片サイズの範囲を示し、最適なサイズは垂直のハッシュ線で指定されます。図16Bおよび16Cに示すように、超音波処理により、最適な断片サイズからの逸脱量に大幅なばらつきが生じた(図16B)が、一方で、CRISPR/Cas9消化により、最適な断片サイズ内に大部分の読取を有する断片が得られた(図16C)。
本実施例は、CRISPRベースの断片化を使用することにより、例えば本実施例で使用される酵素Cas9が平滑末端を産生するため、末端修復を必要としないということを含めて、偽変異がどのように防止されるかを示す。したがって、本明細書で提供される技術は、非効率的な標的濃縮、配列決定エラー、および不均一な断片サイズを含む、NGSの複数の一般的かつ広範にわたる問題を克服する。
ガイドRNA(gRNA)は、TP53のコード領域と隣接するイントロン領域を切り出すように設計された(図12A)。断片サイズは約500bpに設定された。gRNAは、特異性スコアと断片の長さに基づいて選択された(表1、図17A~17C)。可変量のインプットDNA(10~250ng)を含む試験試料をCRISPR/Cas9で消化し、続いて固相可逆固定化(SPRI)ビーズでサイズ選択して未消化の高分子量DNAを除去し、標的化領域を含む切除断片を濃縮した(図12B)。後続のライブラリー調製は、現在利用可能な標準プロトコールに従って行われたが、本明細書に記載するように、1回の捕捉とわずかな修正のみを使用した。DNAをAテールにし、DSアダプターとライゲートし、増幅し、ビーズ洗浄により精製し、TP53エクソンを標的化するビオチン化120bpのDNAプローブとのハイブリダイゼーションにより捕捉した(表6)。捕捉された試料はインデックスプライマーで増幅され、Illumina MiSeq v3 600サイクルキットで配列決定された。標準プロトコールと同様に分析を実施したが、アラインメントの前にコンセンサス配列の生成を含むように修正した(図23)。
表6.TP53ハイブリダイゼーション捕捉プローブ
Figure 0007256748000006
Targeted exon:標的化エクソン、IDT probe name:IDTプローブ名称、IDT probe sequence:IDT プローブ配列Exon:エクソン
1回または2回のハイブリダイゼーション捕捉を伴う標準的なDSと1回のハイブリダイゼーション捕捉を伴うCRISPR-DSとの並列比較を図18A~18Cに示す。図18A~18Cは、二重鎖コンセンサス配列読取(図18B)を産生するインプットDNA中のゲノムのパーセンテージによって計算された回収パーセンテージを示し、および標準的なDSおよびCRISPR-DSを使用して処理された様々なインプット量のDNAの全ての標的領域にわたる中央二重鎖コンセンサス配列深度(図18C)を示す、オンターゲットの未処理の配列決定読取のパーセント(TP53を包含)を示す棒グラフ(図18A)である。図18Aは、2回の捕捉を伴うStandard-DSと1回のキャプチャを伴うCRISPR-DSとの間のオンターゲット(TP53を包含する)の未処理の配列決定読取のパーセンテージを示す。図18Bは、DCS読取を産生したインプットDNA中のゲノムのパーセンテージによって計算された回収率を示す。図18Cは、全ての標的領域にわたるDCS深度の中央値が各インプット量について計算されたことを示している。正常なヒト膀胱組織から抽出された同一のDNAの3つのインプット量(250ng、100ng、および25ng)は、準プロトコール(つまり、標準的なDS)およびCRISPR-DSで配列決定された。1回の捕捉で、CRISPR-DSは90%を超えるオンターゲットの未処理の読取を達成し(例えば、TP53を包含)(以下に示す表8)、これは、標準的なDS(1回の捕捉で、約5%のオンターゲットの未処理の読取を達成する(表8、下に表示)を超える大幅な改善を表す。2回目の捕捉では、CRISPR-DSの未処理の読取が最小限に増加した(図19)。Standard-DSは、異なるインプット全体で約1%の回収率(例えば、配列決定されたゲノムとして回収されたインプットゲノムのパーセンテージ;分数ゲノム等価回収としても知られている)を産生し、CRISPR-DSは6~12%の範囲の回収率を産生した。CRISPR-DSの回収率は、標準的なDSで250ngのDNAが産生するものに匹敵するDCS深度(DCS読取で生成される深度)を生成する25ngのDNAに変換される。2つの方法を並べて比較すると、CRISPR-DSは、PCR増幅バイアスに起因する短い断片の過剰表示が発生しない/結果に影響を与えない(すなわち、目的の領域の包含が均等である)という改善を提供できることが実証され、明確なバンド/ピークにより、配列決定前の正しいライブラリー調製の確認が提供され、標的化断片化によって作成された明確な断片は、均一な包含で所望の標的領域に完全に広がった(図22E)。
物質および方法
試料
本実施例で分析された試料には、末梢血、癌を伴うまたは伴わない膀胱、および腹水DNAからの匿名化されたヒトゲノムDNAが含まれた。患者情報は腹水試料で利用可能であり、腫瘍変異の存在を確認するために使用された。ワシントン大学婦人科腫瘍組織バンクから体液試料を入手し、ワシントン大学ヒト対象部門の治験審査委員会によって承認されたプロトコール番号27077に基づくインフォームドコンセント後に検体と臨床情報を収集した。匿名化された凍結膀胱試料は、ワシントン大学泌尿生殖器がん生物標本保管所および以前に固定または凍結されていない剖検組織から入手した。DNAは以前にQIAamp DNA Miniキット(Qiagen,Inc.,Valencia,CA,USA)で抽出されており、変性したことはなかった。DNAはQubit HS dsDNAキット(ThermoFisher Scientific)で定量化した。DNAの品質はGenomic TapeStation(Agilent,Santa Clara,CA)で評価され、DNAの完全性の数値(DIN)が決定された。DINは、1(非常に劣化)から10(劣化なし)までのゲノムDNA品質の尺度である。末梢血DNAおよび腹水DNAのDINは7を超えていた(分解のない良質のDNAを反映)。図19は、3つの異なる血液DNA試料での2つの捕捉ステップと比較して、1つの捕捉ステップでCRISPR-DSによりもたらされる標的濃縮を示す棒グラフである。
膀胱試料は、異なるレベルのDNA分解を含むように意図的に選択された。膀胱DNA試料B1からB13は6.8から8.9のDINを持ち、CRISPR-DSによって正常に分析された(以下に示す表10)。試料B14およびB16は、それぞれ6および4のDINを持ち、Bluepippinシステムで高分子量DNAを事前に濃縮することによってなされた改善を実証するために使用された(図20Aおよび20B)。
CRISPRガイド設計
TP53エクソンを切除するgRNAは、以下の特性を有するよう設計された:TP53コード領域を包含する約500bpの断片を産生する能力、(2)最高のMIT Webサイトスコア(「MITスコア」;CRISPR.mit.edu:8079/;表1および図17A-17C)。エクソン7の場合、ガイドは、目的の領域内の近位のポリAトラクト(tract)を避けるために、より小さいサイズの断片を産生するように設計された。合計12のgRNAが設計され、TP53が7つの異なる断片に切り出された(図12A)。全てのgRNAの「MIT」スコアは60を超えていた。切断の品質は、Integative Genomics Viewerを使用して最終DCS読取のアライメントをレビューすることにより評価された。成功したガイドは、領域境界の鋭いエッジと適切なDCS深度を持つ典型的な包含パターンを産生した(図22E)。ガイドが「失敗」した場合、DCS深度の低下が観察され、予想される切断点を超える長い読取の存在が観察され、そのようなガイドは、必要に応じて再設計された。ランダムなDNA配列(表7)で挟まれた全てのgRNA配列を含む合成GeneBlock DNA断片(IDT,Coralville,IA)を使用してガイドを評価した(図21A~21B)。本明細書に記載されるCRISPR/Cas9インビトロ消化プロトコールを使用して、3ngのGeneBlock DNAを各gRNAで消化した。消化後、TapeStation 4200(Agilent Technologies,Santa Clara,CA,USA)で反応を分析した(図21C)。定義済みの断片の長さが存在し、適切なgRNAアセンブリとgRNAがその標的部位を切断する能力を確認した。
表7.GeneBlock DNA断片
Figure 0007256748000007
Geneblock fragment: 500bp with all of the gRNA target sequences:GeneBlock断片-全てのgRNA標的配列を含む500bp。
Spacer Sequences 17bp(frin ubtribu areas DS id TP53 exon 10:スペーサー配列17bp(TP53のエクソン10のイントロン領域DS由来)
Beginning spacer sequence (7bp):開始スペーサー配列(7bp):
Ending spacer sequencer (30bp):終了スペーサー配列(30bp)
ゲノムDNAのCRISPR/Cas9インビトロ消化
crRNAおよびtracrRNA(IDT,Coralville,IA)をgRNAと複合体形成させ、30nMのgRNAを約30nMのCas9ヌクレアーゼ(NEB,Ipswich,MA)、1×NEB Cas9反応緩衝液、および23~27μLの水とともに、25℃で10分間インキュベートした。次いで、10~250ngのDNAを添加し、最終容量を30μLにした。反応物を37℃で一晩インキュベートした後、酵素不活性化のために70℃で10分間熱ショックを与えた。
サイズ選択。
サイズ選択を使用して、ライブラリー調製の前にターゲット濃縮のための所定の長さの断片を選択した。AMPure XPビーズ(Beckman Coulter, Brea,CA,USA)を使用して、オフターゲットの未消化高分子DNAを除去した。熱不活性化後、反応物を0.5倍比のビーズと組み合わせ、少し混合し、次いで、3分間インキュベートして高分子量DNAを結合させた。次いで、磁石でビーズを溶液から分離し、溶液(目的の長さのDNA断片を含む)を新しいチューブに移した。標準のAMPure 1.8倍比のビーズ精製を実行し、50μLのTE Lowに溶離した。
ライブラリー調製
A-テーリングおよびライゲーション
断片化したDNAはA-テール化され、製造元のプロトコールに従ってNEBNext Ultra II DNA Library Prep Kit(NEB,Ipswich,MA)を使用してライゲートした。NEB末端修復およびAテーリング(ERAT)反応は、20℃で30分間、および65℃で30分間インキュベートした。CRISPR-DSには末端修復は必要ない(Cas9は平滑末端を産生する)が、有用なA-テーリングのためにERAT反応が使用された。NEBライゲーションマスターミックスと15μMのDSアダプターの2.5μlを添加し、20℃で15分間インキュベートした。市販のアダプタープロトタイプ(図12C)は、これまでの研究で使用されたアダプターとは次の相違を有して合成された:(1)12bpの代わりに、10bpのランダムな二本鎖分子タグが使用された、(2)単純な3’-dT突出による以前の3’の5bp保存配列の置換を使用して、5’-dAテールDNA分子にライゲートした。ライゲーション時に、DNAを0.8倍比のAMPureビーズ精製で洗浄し、23μLのヌクレアーゼフリー水に溶離した。
PCR
KAPA Real-Time Amplification kitと蛍光標準(KAPA Biosystems,Woburn MA,USA))を使用して、ライゲートされたDNAを増幅した。KAPA HiFi HotStartリアルタイムPCRマスターミックス、23μlの事前にライゲートおよび精製されたDNA、ならびに最終濃度2μΜのDSプライマーMWS13およびMWS20を含む50μlの反応液を調製した。反応は、98℃で45秒間変性され、98℃で15秒間、65℃で30秒間、72℃で30秒間を6~8サイクルで増幅され、72℃で1分間の最終伸長が続いた。蛍光標準3(試料全体にわたる捕捉に十分な標準化された数のDNAコピーを産生し、過剰増幅を防ぎ、Cas9の切断とライゲーションの成功を示す)に達するまで試料を増幅し、通常、DNAインプットの量に応じて6~8サイクルかかる。0.8倍比のAMPure Bead洗浄を実施して増幅断片を精製し、40μLのヌクレアーゼフリー水に溶離した。PCRステップの標準DSと比較して、CRISPR-DSは以下を含む改善を提供する:(i)同様のサイズの断片を提供する(小さな断片への増幅バイアスを低減する(図22A)、(ii)目的の領域のより均一な包含の生成(図22E)、(iii)TapeStation 4200による、ライブラリー調製(所定の断片サイズ特性を使用)が成功したことの精確な評価(Agilent Technologies,Santa Clara,CA,USA)。標準DSでは、PCR産物は超音波処理により幅広いサイズであり、試料間で比較するのが困難である広いスメアとして存在する(図22A)。例えば、標準的なDS(試料間で比較するのが困難である結果を産生できる)などの他のアプローチとは対照的に、CRISPR-DSは、切断とライゲーションの成功を明確に示し、試料全体にわたる品質管理の比較に適した離散ピークを産生する(図22B~D)。
捕捉と捕捉後のPCR
TP53 xGen Lockdown Probes(IDT, Coralville,IA)を使用して、以前の研究に従ってTP53エクソンのハイブリダイゼーション捕捉を実行したが、次のように変更した:プローブ(IDT TP53 Lockdownプローブセット由来)を選択して、TP53コード領域全体を包含した(エクソン1およびエクソン11の一部はコード領域ではない)(表6)。各CRISPR/Cas9切除断片は、最小で2つのプローブと最大で5つのプローブに包含されていた(図17A~17C)。捕捉プローブプールを産生するために、所与の断片に対する各プローブを等モル量でプールし、7つの異なるプール(各断片に1つ)を生成した。次いで、7つの断片プールを再び等モル量で混合した(エクソン7とエクソン8~9のプールは例外で、それぞれ40%と90%で表れた)。これらのエクソンの捕捉プローブの減少は、エクソンの過剰表現がシーケンスで観察された場合にもたらされた。最終的な捕獲プールを0.75pmol/μlに希釈した。ハイブリダイゼーション捕捉は、次の変更を加えた標準IDTプロトコールに従って実行された:DSアダプターに特異的なブロッカーMWS60およびMSW61を使用した、75μl(100μlの代わり)のDynabeads M-270ストレプトアビジンビーズを使用した、捕捉後後PCRは、最終濃度0.8μMのMWS13およびインデックス付きプライマーMWS21を使用して、KAPA Hi-Fi HotStart PCRキット(KAPA Biosystems,Woburn,MA,USA)により実施した。反応は98℃で45秒間変性し、次いで98℃で30秒間、60℃で45秒間、72℃で45秒間を20サイクルで増幅し、72℃で60秒間の延長が後に続いた。PCR産物は0.8倍のAMPureビーズ洗浄で精製した。
配列決定
Qubit dsDNA HS Assay Kitを使用して試料を定量化し、希釈し、配列決定のためにプールした。次いで、Agilent 4200 TapeStationで試料プールを視覚化して、ライブラリーの品質を確認した。TapeStationのエレクトロフェログラムは、設計されたCRISPR/Cas9切断断片の断片の長さに対応するシャープで明確なピークを示した(図22B~22D)。(このステップは、プールする前に各試料に対して個別に実行して、必要に応じて/所望なら、個々の試料の性能を検証することもできる)。最終的なプールは、KAPA Library Quantification kit(KAPA Biosystems,Woburn,MA,USA)を使用して定量化した。ライブラリーは、製造者の取扱説明書に従って、v3 600サイクルキット(Illumina,San Diego,CA,USA)を使用して、MiSeq Illuminaプラットフォームで配列決定された。各試料には、約7~10%のレーンが割り当てられ(約200万回の読み取りに対応)、各配列決定の実行には、約1%のPhiX対照DNAがスパイクされた。
データ処理
未処理のFASTQファイルからテキストファイルへの分析を自動化するために、カスタムバイオインフォマティクスパイプラインが作成された(図23)。このパイプラインは、標準的なDS分析に使用される方法に類似するが、次の変更が加えられている:(i)ペア読取情報の保持が達成され、(ii)アラインメントの前にコンセンサス作製が実行される。ペアエンド読取はCRISPR-DSデータの分析に使用されるが、断片サイズの品質管理と短い断片の存在による潜在的な技術的アーティファクトの除去をもたらすので、標準的なDS分析よりも改善されている。さらに、標準的なDS分析では、全ての読取が参照ゲノムにマッピングされた後にコンセンサスが作製されるが、CRISPR-DS分析では、シーケンサーによる塩基読取のみに依存して最初のステップとしてコンセンサスが実行される。この変更により、コンセンサス作製が改善され、データ処理に必要な時間が短縮される可能性が高いと考えられる。CRISPR-DSでは、コンセンサス作製は、同一のタグに由来する全ての読取を取得し、各位置でコールされた塩基を比較し、一本鎖コンセンサス(SSCS)読取を産生するUnifiedConsensusMaker.pyと呼ばれるカスタムpythonスクリプトによって実行された。次いで、タグの各相補ペアのSSCS読取を位置ごとに比較して、二本鎖コンセンサス(DCS)読取を作成した(図12D)。得られたSSCS読取とDCS読取を含む2つのFASTQファイルが作製された(DCS読取は元のDNA分子に対応するため、平均DCS深度は配列決定されたゲノム数の推定値である)。回収率(分数ゲノム等価回収とも呼ばれる)は、平均DCS深度(配列決定されたゲノム)をインプットゲノム数(1ngのDNAが約330の半数体ゲノムに対応)で割って計算された。ゲノム座標が上流および下流のCRISPR/Cas9切断部位内にあり、いずれかの側に100bpのウィンドウが追加された読取の数を計数することにより、オンターゲットの未処理読取を計算した。ペアエンドのDCS FASTQファイルは、bwa-mem v.0.7.419をデフォルトパラメータとともに使用して、ヒト参照ゲノムv38とアライメントされた。マッピングされた読取はGATK Indel-Realignerで再アライメントされ、低品質のベースはGATK Clip-Readsで両端からクリップされた。3’末端から30塩基、5’末端から7塩基の保守的なクリッピングが行われた。さらに、TP53設計では約80bpにわたる読取ペアの重複領域は、fgbio ClipOverlappingReadsを使用してトリミングされた。このアルゴリズムは、ペアの読み取りの両端から一致するまでクリッピングを実行し、これにより、高いPHRED品質スコアを持つ配列決定塩基の使用が最大化される。SAMtools mpileupを使用して、得られたファイルからパイルアップファイルが作成された。次いで、標的化ゲノム位置のためのBEDファイルを含むカスタムPythonスクリプトを使用して、パイルアップファイルをフィルタリングした。BEDファイルは、CRISPR/Cas9のgRNAの座標を使用して簡単に作成できる。次いで、フィルタリングされたパイルアップファイルは、「mutpos」と呼ばれる変異情報を含むタブ区切りテキストファイルを作成する、カスタム作製スクリプトmut-position.1.33.pyによって処理される。mutposには、DCSの深度と配列決定された各位置の変異の概要が含まれる(CRISPR-DS分析で使用されるソフトウェアは、ハイパーテキスト転送プロトコールsecure://github.com/risqueslab/CRISPR-DSでアクセスできる)。
標準的なDS
正常なヒト膀胱試料B9からの3つの量のDNA(25ng、100ng、および250ng)を1回および2回の捕捉で標準的なDSで配列決定し、CRISPR-DSの結果と比較した。標準的なDS分析を実施したが、末端修復とライゲーションにはKAPA Hyperprepキット(KAPA Biosystems,Woburn,MA,USA)を使用し、PCR増幅には、KAPA Hi-Fi HotStart PCRキット(KAPA Biosystems,Woburn,MA,USA)を使用した。ハイブリダイゼーション捕捉は、TP53エクソン2~11を包含するxGen Lockdownプローブを使用して実行された(標準的なDSとCRISPR-DSの両方で同一のプローブが使用された)。試料は、短い断片の長さに対応するために、HiSeq 2500 Illuminaプラットフォームの約10%で配列決定された。
CRISPR-DS標的濃縮
CRISPR-DS標的濃縮を特徴評価するために、2つの別々の分析が実行された。
最初の分析には、1回対2回での捕捉の比較(および標準的なDSの結果との比較)が含まれていた。3つのDNA試料をCRISPR-DS用に処理し、1回のハイブリダイゼーション捕捉後に半分に分割した。元のDSプロトコールで必要とされたように、第1の半分にはインデックスが付けられて配列決定され、第2の半分は追加の回の捕捉の対象となった。「オンターゲット」(すなわち、TP53エクソンを包含する)未処理の読取のパーセンテージを、1対2の捕捉で比較した。標準的なDSとCRISPR-DSの比較の詳細を表8に示す。
表8.標準的なDS対CRISPR-DSの比較
Figure 0007256748000008
2番目の分析では、ハイブリダイゼーション捕捉を実行せずにオンターゲットの未処理の読取のパーセンテージを評価し、CRISPR切除断片をサイズ選択することによって排他的に産生される濃縮を判定した。異なるDNA量(10ng~250ng)の3つの異なる試料を、第1のPCRまで(すなわち、ハイブリダイゼーション捕捉の前に)、第1の分析で記載したプロトコールで処理した。図24Aおよび24Bは、本技術の一実施形態による、CRISPR/Cas9消化とそれに続くサイズ選択後の標的濃縮の度合を定量化した結果を示すチャート(図24A)およびグラフ(図24B)である。図24Aは、DNA試料およびそれぞれについて達成された濃縮を示す。図24Bは、インプットDNAの量と比較して「オンターゲット」にあった未処理の読取のパーセントを示す。次いで、PCR産物にインデックスを付け、配列決定した。オンターゲットの未処理の読取のパーセンテージを計算し、濃縮倍率を推定した(標的化領域サイズ、この場合は3280bpを考慮した)。
高分子量DNAの事前濃縮
高分子量DNAを選択すると、CRISPR-DSで分解されたDNAの性能が向上する。この選択は、BluePippinシステム(Sage Science, Beverly,MA)を使用して実行した。DINが6および4の2つの膀胱DNAを、0.75%ゲルカセットとハイパス設定を使用して実行し、8kbを超える断片を取得した。サイズ選択はTapeStationで確認された(図20A)。次いで、BluePippinの前に250ngのDNAとBluePippinの後に250ngのDNAがCRISPR-DSによって並行して処理された。オンターゲットの未処理の読取のパーセンテージと平均DCS深度を定量化し、比較した(図20B)。
実施例13:卵巣癌試料でのCRISPR-DS
低頻度変異を検出するCRISPR-DSの能力を検証するために、卵巣癌の女性から減量手術中に4つの腹水試料を収集し、分析した。これらの試料にTΡ53腫瘍変異が存在することは、標準的なDSによってこれまでに実証されていた。100ngのDNA(標準的なDSに使用されたものより30~100倍少ない)がCRISPR-DS分析に使用され、標準的なDSに匹敵するDCS深度が得られ、TP53腫瘍変異が全ての場合で正常に同定された(表9)。回収率は6~12%の範囲で、同一のDNAによる標準的なDSと比較して15倍から200倍の増加を示した。
表9.TP53変異を含む4つの異なる試料のStandard-DS対CRISPR-DSの比較。
Figure 0007256748000009
実施例14:膀胱組織試料のCRISPR-DS
本実施例では、様々な患者の膀胱組織から抽出された13のDNA試料のセットでのCRISPR-DSの使用について記載する(表10)。各試料からの250ngのDNAをアッセイに使用し、回収率の中央値7.4%に相当する6,143倍の中央値のDCS深度が得られた。2つの試料(B2およびB4)の技術的な重複により、再現可能な性能が実証された。全ての試料のオンターゲットのDCS読取は98%を超えていたが、オンターゲットの未処理の読取(生の読取り)のパーセンテージは43%~98%の範囲であった。低いターゲット濃縮は、7未満のDNA Integrity Numbers(DIN)の試料に対応していた。
表10.250ngのインプットDNAで処理した13の試料のCRISPR-DS配列決定結果。
Figure 0007256748000010
アッセイの性能に対するDINの効果を試験するために、CRISPR/Cas9消化の前に低分子量DNAを除去した。BluePippinシステムのパルスフィールド機能を使用して、「分解されたDNA」を持つ2つの試料(DIN 6および4)から高分子量DNAを選択した。事前濃縮により、オンターゲットの未処理の読取が2倍、DCS深度が5倍増加した(図20B)。単純にCRISPR/Cas9消化とそれに続くサイズ選択によって付与される濃縮の度合を直接定量化するために、3つの試料を捕捉せずに配列決定した。10~250ngのDNAを消化し、サイズ選択し、ライゲートし、増幅し、配列決定した。「オンターゲット」の未処理の読取のパーセンテージは、0.2%~5%の範囲で、約2,000倍~50,000倍の濃縮に対応した(表11)。特に、低DNAインプットは最高の濃縮度を示し、これはおそらく、少量で存在するときの、オフターゲットの高分子量DNA断片の最適な除去を反映している可能性がある。
表11.サイズ選択による標的濃縮
Figure 0007256748000011
CRISPR/Cas9断片化とそれに続くサイズ選択により、効率的な標的濃縮が正常に実行され、小さな標的領域の2回目の捕捉の必要が排除された。さらに、PCRバイアスが排除され、目的の領域の均一な包含が達成され、現在利用可能な方法よりも大幅な改善を示す。
均等物と範囲
本技術の実施形態の上記の詳細な説明は、網羅的であること、または技術を上記で開示された正確な形態に限定することを意図していない。本技術の特定の実施形態および実施例は、例示の目的で上述されているが、当業者が認識するように、本技術の範囲内で様々な均等の修正が可能である。例えば、ステップは所与の順序で提示されるが、代替の実施形態では異なる順序でステップを実行できる。本明細書に記載される様々な実施形態は、さらなる実施形態を提供するために組み合わされてもよい。本明細書で引用される全ての参照文献は、その全てが本明細書に記述されるように、参照により本明細書に組み込まれる。
上記から、本技術の特定の実施形態が例示の目的で本明細書に記載されているが、本技術の実施形態の説明を不必要に曖昧にすることを避けるために、周知の構造および機能は詳細に図示または説明されていないことが理解されよう。文脈が許す場合、単数または複数の用語は、それぞれ複数または単数の用語を含んでもよい。さらに、技術の特定の実施形態に関連する利点がそれらの実施形態の文脈で説明されたが、他の実施形態もそのような利点を示す可能性があり、全ての実施形態が必ずしも本技術の範囲内にあるような利点を示す必要はない。したがって、本開示および関連技術は、本明細書に明示的に示されていないまたは説明されていない他の実施形態を包含することができる。
当業者は、日常的な実験にすぎないものを用いて、本明細書において記載される開示された技術の具体的な実施形態の多くの均等物を認識するか、またはそれを確かめることができるであろう。本技術の範囲は、上記の説明に限定されることを意図するものではなく、以下の特許請求の範囲に記述されるようなものである。

Claims (53)

  1. 1つ以上の二本鎖DNA分子を提供することであって、前記1つ以上の各々の二本鎖DNA分子が、サンプルに由来する二本鎖DNA断片、各々の鎖上の単一分子識別子配列、および前記二本鎖DNA断片の二つの末端の少なくとも一つに位置しているアダプター分子を含み、各々の二本鎖DNA分子に対して、前記二本鎖DNA分子の第1の鎖が第1のアダプター配列を含み前記二本鎖DNA分子の第2の鎖が前記第1のアダプターに少なくとも部分的に非相補的である第2のアダプター配列を含み
    前記1つ以上の二本鎖DNA分子を増幅して第1鎖増幅産物と第2鎖増幅産物を含む増幅産物を生成することと
    前記増幅産物を、第1の試料と第2の試料とに分離することと、
    (a)前記第1のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチド、および、
    (b)目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチド、
    の使用により
    前記第1の試料中の前記第1の鎖または第1鎖増幅産物を増幅して、第1のDNA産物をもたらすことであって、前記単一分子識別子配列が少なくとも部分的に前記第1のDNA産物中に維持され、
    (a)前記第2のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチド、および、
    (b)目的の標的配列に少なくとも部分的に相補的である少なくとも1つの一本鎖オリゴヌクレオチド、
    の使用により、
    前記第2の試料中の前記第2の鎖または第2鎖増幅産物を増幅して、第2のDNA産物をもたらすことであって、前記単一分子識別子配列が少なくとも部分的に前記第2のDNA産物中に維持され、
    前記第1のDNA産物および第2のDNA産物の各々を配列決定することと、
    前記第1のDNA産物の配列と前記第2のDNA産物の配列とを比較することと、を含む、方法。
  2. 提供するステップが、
    1つ以上の二本鎖DNA断片の各々に少なくとも1つの縮重または半縮重バーコード配列ライゲートして、1つ以上の二本鎖DNA分子バーコード複合体を形成することを含み、前記バーコード配列が、単一分子識別子配列を含む、請求項1に記載の方法。
  3. 単一分子識別子配列が、二本鎖DNA分子を一意的に標識する、縮重もしくは半縮重バーコード配列、または、1つ以上の内因性のせん断点または前記1つ以上の内因性せん断点に位置的に関連する可能性のある内因性配列、またはそれらの組み合わせのうちの少なくとも1つを含む、請求項1または請求項2に記載の方法。
  4. 単一分子識別子配列が、内因性のせん断点または前記せん断点に位置的に関連する可能性のある内因性の配列を含む、請求項に記載の方法。
  5. 1つ以上の二本鎖DNA分子を増幅することが、前記第1の鎖に由来する複数の増幅産物と、前記第2の鎖に由来する複数の増幅産物とを生成することを含む、請求項1~のいずれか1項に記載の方法。
  6. 1つ以上の二本鎖DNA分子の少なくとも一が損傷している、請求項1~5のいずれか1項に記載の方法。
  7. 損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、SUMO化、グリコシル化、脱グリコシル化、プトレシニル化、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、X線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高pHによる損傷、低pHによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、DNAの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、1つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも1つを含む、請求項に記載の方法。
  8. 1つ以上の二本鎖DNA分子が各々、対象または生物を起源とする試料により提供される二本鎖DNA断片を含む、請求項1~のいずれか1項に記載の方法。
  9. 1つ以上の二本鎖DNA分子が、それぞれ、体組織、生検、皮膚試料、血液、血清、血漿、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、パップスメア、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、細菌試料、原生動物のサンプル、真菌試料、動物試料、ウイルス試料、複数の生体の試料、爪擦過検体、精液、前立腺液、膣液、膣スワブ、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液またはスワブ、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、生検試料、剖検試料、臓器試料、人物同定試料、非ヒト同定試料、人工的に産生された核酸試料、合成遺伝子試料、バンクに寄託または保管された試料、腫瘍組織、胎児試料、臓器移植試料、微生物培養試料、核DNA試料、ミトコンドリアDNA試料、葉緑体DNA試料、アピコプラストDNA試料、細胞小器官試料、またはそれらの任意の組み合わせから得られる二本鎖DNA断片を含む、請求項1~8のいずれか1項に記載の方法。
  10. 1つ以上の二本鎖DNA分子の各々が実質的に均一またはほぼ均一な長さの二本鎖DNA断片を含む、請求項1~のいずれか1項に記載の方法。
  11. 実質的に均一な長さが、約100~約10,000塩基である、請求項10に記載の方法。
  12. 1つ以上の二本鎖DNA分子が、それぞれ、標的化エンドヌクレアーゼによって実質的に均一またはほぼ均一の長さに切断されている二本鎖DNA断片を含む、請求項10または請求項11に記載の方法。
  13. 二本鎖DNA断片の長さが、1つ以上の実質的に既知のサイズ範囲内である、請求項1~のいずれか1項に記載の方法。
  14. 1つ以上の二本鎖DNA断片の長さが、約100~約1000塩基、約100~約600塩基、約100~約500塩基、またはそれらのいくつかの組み合わせである、請求項13に記載の方法。
  15. 提供するステップの前に、
    実質的に既知の長さの標的二本鎖DNA断片が形成されるように、1つ以上の標的化エンドヌクレアーゼにより二本鎖DNA材料を切断することと、
    前記実質的に既知の長さに基づいて、前記標的二本鎖DNA断片を単離することと、を含む、請求項1~14のいずれか1項に記載の方法。
  16. 1つ以上の標的化エンドヌクレアーゼが、リボ核タンパク質、Cas酵素、Cas9様酵素、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ、およびそれらの組み合わせからなる群から選択される、請求項15に記載の方法。
  17. 1つ以上の標的化エンドヌクレアーゼが、Cas9もしくはCPF1またはそれらの誘導体を含む、請求項15または請求項16に記載の方法。
  18. 提供するステップの前に、アダプターを標的二本鎖DNA断片にライゲートすることをさらに含む、請求項1517のいずれか1項に記載の方法。
  19. 標的二本鎖DNA断片が対象または生物を起源とする、請求項1518のいずれか1項に記載の方法。
  20. 標的二本鎖DNA断片が少なくとも部分的に人工的に合成されている、請求項1518のいずれか1項に記載の方法。
  21. 二本鎖DNA材料を切断することが、実質的に既知の長さの2つ以上の標的二本鎖DNA断片が形成されるように、前記二本鎖DNA材料を1つ以上の標的化エンドヌクレアーゼによって切断することを含む、請求項1520のいずれか1項に記載の方法。
  22. 標的二本鎖DNA断片が異なる実質的に既知の長さである、請求項21に記載の方法。
  23. 標的二本鎖DNA断片がそれぞれ、ゲノム中の1つ以上の異なる位置からの目的のゲノム配列を含む、請求項21に記載の方法。
  24. 標的二本鎖DNA断片がそれぞれ、1つ以上の二本鎖DNA分子内の実質的に既知の領域からの標的配列を含む、請求項21に記載の方法。
  25. 実質的に既知の長さに基づいて標的二本鎖DNA断片を単離することが、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、濾過、またはSPRIビーズ精製による前記標的二本鎖DNA断片の濃縮を含む、請求項1524のいずれか1項に記載の方法。
  26. 少なくとも1つの増幅するステップが、少なくとも1つの非標準ヌクレオチドであるか、またはそれを含む少なくとも1つのプライマーを含む、請求項1~25のいずれか1項に記載の方法。
  27. 少なくとも1つのアダプター配列が、少なくとも1つの非標準ヌクレオチドであるか、またはそれを含む、請求項1~26のいずれか1項に記載の方法。
  28. 非標準ヌクレオチドが、ウラシル、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチドiso-dC、iso dG、2’-O-メチルヌクレオチド、イノシンヌクレオチドロックド核酸、ペプチド核酸、5メチルdC、5-ブロモデオキシウリジン、2,6-ジアミノプリン、2-アミノプリンヌクレオチド、脱塩基ヌクレオチド、5-ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Iリンカー、5’ヘキシニル修飾ヌクレオチド、5-オクタジイニルdU、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、蛍光色素、ビオチン、フラン、BrdU、フルオロ-dU、loto-dU、およびそれらの任意の組み合わせから選択される、請求項26または請求項27に記載の方法。
  29. 第1のDNA産物および第2のDNA産物の各々を配列決定することが、
    第1のDNA産物中の複数の鎖の前記配列を比較して、第1の鎖のコンセンサス配列を決定することと、
    前記第2のDNA産物中の複数の鎖の前記配列を比較して、第2の鎖のコンセンサス配列を決定することと、を含む、請求項1~28のいずれか1項に記載の方法。
  30. 第1のDNA産物の配列を第2のDNA産物の配列と比較することが、第1の鎖のコンセンサス配列と第2の鎖のコンセンサス配列を比較して、エラーが訂正されたコンセンサス配列を提供することを含む、請求項29に記載の方法。
  31. 第1のDNA産物および第2のDNA産物の各々を配列決定することが、
    第1のDNA産物の鎖の少なくとも1つを配列決定して、第1の鎖の配列読取を決定することと、
    第2のDNA産物の鎖の少なくとも1つを配列決定して、第2の鎖の配列読取を決定することと、
    前記第1の鎖の配列読取と前記第2の鎖の配列読取とを比較して、エラーが訂正された配列読取を生成することと、を含む、請求項1~30のいずれか1項に記載の方法。
  32. エラーが訂正された配列読取が、第1の鎖の配列読取と第2の鎖の配列読取との間で一致するヌクレオチド塩基を含む、請求項31に記載の方法。
  33. エラーが訂正された配列読取の特定の位置で生じる変動が真のバリアントとして同定される、請求項31または請求項32に記載の方法。
  34. 第1の鎖の配列読取または前記第2の鎖の配列読取の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される、請求項3133のいずれか1項に記載の方法。
  35. エラーが訂正された配列読取が、変異原性化合物または曝露を同定するために使用される、請求項31~34のいずれか1項に記載の方法。
  36. エラーが訂正された配列読取が、発がん性化合物または曝露を同定するために使用される、請求項31~34のいずれか1項に記載の方法。
  37. 1つ以上の二本鎖DNA分子の二本鎖DNA断片が法医学試料に由来し、前記エラーが訂正された配列読取が法医学分析で使用される、請求項31~34のいずれか1項に記載の方法。
  38. 少なくとも1つの増幅するステップがポリメラーゼ連鎖反応(PCR)を含む、請求項1~37のいずれか1項に記載の方法。
  39. 最大でも1000ngの二本鎖DNA断片が最初に提供される、請求項1~38のいずれか1項に記載の方法。
  40. 最大でも10ngの二本鎖DNA断片が最初に提供される、請求項1~39のいずれか1項に記載の方法。
  41. 第1の試料中の第1の鎖または第1鎖増幅産物を増幅することが、分離するステップの後、および前記第1の試料を増幅することの前に、前記1つ以上の二本鎖DNA分子上に見られる第2のアダプター配列を破壊または崩壊することをさらに含む、請求項1~40のいずれか1項に記載の方法。
  42. 第2の試料中の第2の鎖または第2鎖増幅産物を増幅することが、分離するステップの後、および前記第2の試料を増幅することの前に、前記1つ以上の二本鎖DNA分子上に見られる第1のアダプター配列を破壊または崩壊することをさらに含む、請求項1~41のいずれか1項に記載の方法。
  43. 破壊することが、酵素消化、少なくとも1つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、一方もしくは両方の鎖の切断をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、8-オキソ-グアニン付加物の組み込み、制限エンドヌクレアーゼの使用、標的化ヌクレアーゼの使用、およびそれらの任意の組み合わせの少なくとも1つを含む、請求項41または請求項42に記載の方法。
  44. 増幅することが、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、または表面結合増幅を含む、請求項1~43のいずれか1項に記載の方法。
  45. 第1の鎖または第1鎖増幅産物を増幅すること、または、第2の鎖または第2鎖増幅産物を増幅することが、目的の配列に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、および前記アダプターの領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、請求項1~44のいずれか1項に記載の方法。
  46. 複数の1つ以上の二本鎖DNA分子が、二本鎖DNA断片の両方の末端にアダプターを含む、請求項1~45のいずれか1項に記載の方法。
  47. 第1の鎖または第1鎖増幅産物を増幅すること、または、第2の鎖または第2鎖増幅産物を増幅することが、第1のアダプター配列および前記第2のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、請求項46に記載の方法。
  48. アダプターが、少なくとも部分的に非相補的であるか、または少なくとも1つの非標準塩基を含む少なくとも1つのヌクレオチド位置を含む、請求項1~47のいずれか1項に記載の方法。
  49. アダプターが、約5個以上の自己相補型ヌクレオチドによって形成される単一の「U字型」オリゴヌクレオチド配列を含む、請求項1~48のいずれか1項に記載の方法。
  50. 1つ以上の二本鎖DNA分子の二本鎖DNA断片が、2つ以上の供給源に由来する、請求項1~49のいずれか1項に記載の方法。
  51. エラー訂正コンセンサス配列が第1の鎖のコンセンサス配列と第2の鎖のコンセンサス配列で一致するヌクレオチド塩基を含む、請求項30記載の方法。
  52. エラー訂正コンセンサス配列中の特定の位置で生じる変動が真のバリアントとして同定される、請求項30記載の方法。
  53. 第1の鎖のコンセンサス配列または第2の鎖のコンセンサス配列の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される、請求項30記載の方法。
JP2019552077A 2017-03-23 2018-03-23 エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法 Active JP7256748B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023057239A JP2023093499A (ja) 2017-03-23 2023-03-31 エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762475682P 2017-03-23 2017-03-23
US62/475,682 2017-03-23
US201762575958P 2017-10-23 2017-10-23
US62/575,958 2017-10-23
PCT/US2018/024194 WO2018175997A1 (en) 2017-03-23 2018-03-23 Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023057239A Division JP2023093499A (ja) 2017-03-23 2023-03-31 エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法

Publications (3)

Publication Number Publication Date
JP2020511966A JP2020511966A (ja) 2020-04-23
JP2020511966A5 JP2020511966A5 (ja) 2021-05-13
JP7256748B2 true JP7256748B2 (ja) 2023-04-12

Family

ID=63585768

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019552077A Active JP7256748B2 (ja) 2017-03-23 2018-03-23 エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法
JP2023057239A Pending JP2023093499A (ja) 2017-03-23 2023-03-31 エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023057239A Pending JP2023093499A (ja) 2017-03-23 2023-03-31 エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法

Country Status (9)

Country Link
US (2) US11479807B2 (ja)
EP (2) EP3601598B1 (ja)
JP (2) JP7256748B2 (ja)
CN (2) CN118638898A (ja)
AU (1) AU2018240559A1 (ja)
CA (1) CA3057867A1 (ja)
ES (1) ES2929281T3 (ja)
IL (1) IL269431A (ja)
WO (1) WO2018175997A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3246416T3 (da) 2011-04-15 2024-09-02 Univ Johns Hopkins Sikkert sekventeringssystem
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
PT3387152T (pt) 2015-12-08 2022-04-19 Twinstrand Biosciences Inc Adaptadores, métodos e composições melhorados para sequenciamento duplex
US10844429B2 (en) 2017-01-18 2020-11-24 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
CA3060369A1 (en) 2017-05-01 2018-11-08 Illumina, Inc. Optimal index sequences for multiplex massively parallel sequencing
AU2018266377B2 (en) 2017-05-08 2024-06-20 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
CN118126816A (zh) 2017-11-06 2024-06-04 伊鲁米那股份有限公司 核酸索引化技术
AU2018366213A1 (en) 2017-11-08 2020-05-14 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
AU2019269635A1 (en) * 2018-05-16 2020-11-26 Twinstrand Biosciences, Inc. Methods and reagents for resolving nucleic acid mixtures and mixed cell populations and associated applications
EP3802864A1 (en) 2018-06-06 2021-04-14 The Regents Of The University Of California Methods of producing nucleic acid libraries and compositions and kits for practicing same
JP7445610B2 (ja) 2018-06-27 2024-03-07 エフ. ホフマン-ラ ロシュ アーゲー 医療に有用な新規化合物
BR112021000409A2 (pt) 2018-07-12 2021-04-06 Twinstrand Biosciences, Inc. Métodos e reagentes para caracterizar edição genômica, expansão clonal e aplicações associadas
US11987837B2 (en) * 2018-08-06 2024-05-21 Cz Biohub Sf, Llc Nucleic acid sequence enrichment by defined nucleic acid-directed endonuclease digestion
EP3914727A4 (en) * 2019-01-22 2022-11-30 Singular Genomics Systems, Inc. POLYNUCLEOTIDE BARCODES FOR MULTIPLEXED PROTEOMICS
KR20210148122A (ko) * 2019-02-25 2021-12-07 트위스트 바이오사이언스 코포레이션 차세대 시퀀싱을 위한 조성물 및 방법
JP2022528139A (ja) * 2019-04-05 2022-06-08 クラレット バイオサイエンス, エルエルシー 核酸を解析するための方法および組成物
CN109880891B (zh) * 2019-04-22 2021-07-30 上海交通大学 基于核酸酶偶联pcr原理富集低丰度dna突变的检测技术体系及应用
AU2020321991A1 (en) * 2019-08-01 2022-03-03 Twinstrand Biosciences, Inc. Methods and reagents for nucleic acid sequencing and associated applications
WO2021050565A1 (en) * 2019-09-09 2021-03-18 Oregon Health & Science University Crispr-mediated capture of nucleic acids
CA3151538A1 (en) * 2019-09-30 2021-04-08 Stefanie Ann Ward Mortimer Compositions and methods for analyzing cell-free dna in methylation partitioning assays
EP4103748A4 (en) * 2020-02-14 2024-03-13 The Johns Hopkins University METHOD AND MATERIALS FOR ASSESSING NUCLEIC ACIDS
EP4110957A4 (en) * 2020-02-24 2024-03-06 The Board of Trustees of the Leland Stanford Junior University METHODS FOR ANALYZING CELLULAR NUCLEIC ACIDS AND RELATED APPLICATIONS
CN113593636B (zh) * 2020-04-30 2024-05-03 深圳市真迈生物科技有限公司 测序结果分析方法、系统及计算机可读存储介质和电子设备
EP4170046A4 (en) * 2020-06-23 2024-07-24 Heimbiotek Inc COMPOSITION FOR SEQUENTIAL POLYMERASE CHAIN REACTION, AND GENE AMPLIFICATION METHOD USING SAME
CA3188197A1 (en) * 2020-09-11 2022-03-17 Andrew Slatter Methods of enriching a target sequence from a sequencing library using hairpin adaptors
WO2022076313A1 (en) * 2020-10-06 2022-04-14 Genetics Research, Llc Nucleic acid enrichment method
US20230407370A1 (en) * 2020-11-20 2023-12-21 Camena Bioscience Limited Geometric synthesis methods and compositions for double-stranded nucleic acid sequencing
CN116964221A (zh) * 2021-02-18 2023-10-27 豪夫迈·罗氏有限公司 阻止测序期间核酸模板穿过纳米孔的结构
CN118019856A (zh) * 2021-07-22 2024-05-10 深圳华大智造科技股份有限公司 缺口-连接stlfr
US11680293B1 (en) * 2022-04-21 2023-06-20 Paragon Genomics, Inc. Methods and compositions for amplifying DNA and generating DNA sequencing results from target-enriched DNA molecules
US12091715B2 (en) 2022-04-21 2024-09-17 Paragon Genomics, Inc. Methods and compositions for reducing base errors of massive parallel sequencing using triseq sequencing
WO2023225175A1 (en) * 2022-05-19 2023-11-23 Predicine, Inc. Systems and methods for cancer therapy monitoring
WO2024015869A2 (en) * 2022-07-12 2024-01-18 University Of Washington Systems and methods for variant detection in cells

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013142389A1 (en) 2012-03-20 2013-09-26 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100331204A1 (en) * 2009-02-13 2010-12-30 Jeff Jeddeloh Methods and systems for enrichment of target genomic sequences
CN102482668A (zh) 2009-08-20 2012-05-30 群体遗传学科技有限公司 分子内核酸重排的组合物和方法
US20160153039A1 (en) 2012-01-26 2016-06-02 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
WO2013112923A1 (en) 2012-01-26 2013-08-01 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
EP2820155B1 (en) * 2012-02-28 2017-07-26 Population Genetics Technologies Ltd. Method for attaching a counter sequence to a nucleic acid sample
ES2905448T3 (es) * 2012-05-10 2022-04-08 Massachusetts Gen Hospital Métodos para determinar una secuencia nucleotídica
US11414695B2 (en) 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9
JP6571665B2 (ja) * 2013-12-28 2019-09-04 ガーダント ヘルス, インコーポレイテッド 遺伝的バリアントを検出するための方法およびシステム
EP3363904B1 (en) * 2014-01-31 2019-10-23 Swift Biosciences, Inc. Improved methods for processing dna substrates
BR112016019267B8 (pt) * 2014-02-18 2023-01-10 Illumina Inc Método para construir um perfil de dna, biblioteca de ácido nucléico, método para construir uma biblioteca de ácido nucléico, pluralidade de iniciadores e kit
US10465241B2 (en) * 2015-06-15 2019-11-05 The Board Of Trustees Of The Leleand Stanford Junior University High resolution STR analysis using next generation sequencing
GB201515557D0 (en) * 2015-09-02 2015-10-14 14M Genomics Ltd Method of sequencing
PT3387152T (pt) 2015-12-08 2022-04-19 Twinstrand Biosciences Inc Adaptadores, métodos e composições melhorados para sequenciamento duplex
WO2018013598A1 (en) 2016-07-12 2018-01-18 Qiagen Sciences, Llc Single end duplex dna sequencing
WO2018031588A1 (en) 2016-08-09 2018-02-15 Takara Bio Usa, Inc. Nucleic acid adaptors with molecular identification sequences and use thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013142389A1 (en) 2012-03-20 2013-09-26 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Proc. Natl. Acad. Sci. USA, 2012, 109(36), pp.14508-14513

Also Published As

Publication number Publication date
US12006532B2 (en) 2024-06-11
JP2023093499A (ja) 2023-07-04
EP3601598A4 (en) 2020-12-23
US11479807B2 (en) 2022-10-25
CN110520542A (zh) 2019-11-29
EP3601598B1 (en) 2022-08-03
US20230295686A1 (en) 2023-09-21
EP4134444A1 (en) 2023-02-15
IL269431A (en) 2019-11-28
WO2018175997A1 (en) 2018-09-27
EP3601598A1 (en) 2020-02-05
US20200131561A1 (en) 2020-04-30
CN110520542B (zh) 2024-06-14
AU2018240559A1 (en) 2019-09-19
CA3057867A1 (en) 2018-09-27
ES2929281T3 (es) 2022-11-28
JP2020511966A (ja) 2020-04-23
CN118638898A (zh) 2024-09-13

Similar Documents

Publication Publication Date Title
JP7256748B2 (ja) エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法
JP7434215B2 (ja) 無細胞メチル化dnaを捕捉する方法及びその使用
CN113661249A (zh) 用于分离无细胞dna的组合物和方法
US20210010065A1 (en) Methods and reagents for enrichment of nucleic acid material for sequencing applications and other nucleic acid material interrogations
JP5986572B2 (ja) 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定
JP7379418B2 (ja) 腫瘍のディープシークエンシングプロファイリング
US11821028B2 (en) Single end duplex DNA sequencing
EP3885445B1 (en) Methods of attaching adapters to sample nucleic acids
CN114616343A (zh) 用于在甲基化分区测定中分析无细胞dna的组合物和方法
JP2022505050A (ja) プーリングを介した多数の試料の効率的な遺伝子型決定のための方法および試薬
US10465241B2 (en) High resolution STR analysis using next generation sequencing
Steiert et al. A critical spotlight on the paradigms of FFPE-DNA sequencing
CN110869515A (zh) 用于基因组重排检测的测序方法
CN114746560A (zh) 改进甲基化多核苷酸结合的方法、组合物和系统
WO2024015869A2 (en) Systems and methods for variant detection in cells
JP2024035110A (ja) 変異核酸の正確な並行定量するための高感度方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220425

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220725

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230130

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230331

R150 Certificate of patent or registration of utility model

Ref document number: 7256748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150