JP7155021B2 - 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法 - Google Patents

単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法 Download PDF

Info

Publication number
JP7155021B2
JP7155021B2 JP2018568388A JP2018568388A JP7155021B2 JP 7155021 B2 JP7155021 B2 JP 7155021B2 JP 2018568388 A JP2018568388 A JP 2018568388A JP 2018568388 A JP2018568388 A JP 2018568388A JP 7155021 B2 JP7155021 B2 JP 7155021B2
Authority
JP
Japan
Prior art keywords
indexed
nuclei
sequence
nucleic acid
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018568388A
Other languages
English (en)
Other versions
JP2019520828A (ja
Inventor
ジェー ステーマス フランク
シー エイディ アンドリュー
エー ビタック サラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oregon Health Science University
Original Assignee
Oregon Health Science University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oregon Health Science University filed Critical Oregon Health Science University
Publication of JP2019520828A publication Critical patent/JP2019520828A/ja
Priority to JP2022124469A priority Critical patent/JP2022169578A/ja
Application granted granted Critical
Publication of JP7155021B2 publication Critical patent/JP7155021B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

関連出願の相互参照
本出願は、2016年7月22日に出願された米国仮特許出願第62/365916号と、2017年1月27日に出願された米国仮特許出願第62/451305号の利益を主張するものであり、該文献はそれぞれ参照により本明細書に組み込まれるものとする。
〔配列表〕
本出願は、サイズが27キロバイトで、2017年7月18日に作成した、「1592SeqListing_ST25.txt」と題した、ASCIIテキストファイルとしてEFS-Webを介して米国特許商標庁に電子的に提出した配列表を含む。配列表に含まれる情報は、参照により本明細書に組み込まれるものとする。
本開示の実施形態は、核酸のシーケンシングに関する。特に、本明細書で提供する方法および組成物の実施形態は、インデックス付き単細胞シーケンシングライブラリを生成し、それから配列データを得ることに関する。
単細胞シーケンシングにより、哺乳類の脳の体細胞異数性(McConnell, M. J. et al. Science (80.). 342, 632-637 (2013), Cai, X. et al. Cell Rep. 8, 1280-1289 (2014), Knouse, K. A. et al., Proc Natl Acad Sci U S A 111, 13409-13414 (2014), Rehen, S. K. et al. Proc. Natl. Acad. Sci. U. S. A. 98, 13361-6 (2001))および腫瘍内不均一性(Navin, N. et al. Nature 472, 90-94 (2011), Eirew, P. et al. Nature 518, 422-6 (2014), Gawad, C. et al.Proc. Natl. Acad. Sci. U. S. A. 111, 17947-52 (2014), Gao, R. et al. Nat. Genet. 1-15 (2016). doi: 10.1038/ng. 3641)を含め、種々の文脈における細胞間のゲノム不均一性の広がりが明らかにされた。研究では、2つのアプローチ:単一ヌクレオチド変異体検出用の細胞ごとの高深度のシーケンシング(Cai, X. et al. Cell Rep. 8, 1280-1289 (2014), Zong, C. et al. Science (80-. ). 338, 1622-1626 (2012))、または、コピー数多型(CNV)と異数性を特定するローパスシーケンシング(McConnell, M. J. et al. Science (80.). 342, 632-637 (2013), Baslan, T. et al. Genome Res. 125, 714-724 (2015), Knouse, K. A. et al. Genome Res. gr. 198937.115‐ (2016). doi: 10.1101/gr. 198937.115)の一方が利用された。後者のアプローチでは、多数の単細胞ライブラリを生成するための効率的で費用効果的な方法が欠如していたため、集団規模でCNVのある細胞の頻度を定量すること、または、がんの文脈における不均一性について確実な解析を提供することが難しかった(Gawad, C. et al. Nat. Rev. Genet. 17, 175-88 (2016))。
最近では、隣接性を保持した転移(CPT-seq)、トランスポザーゼをベースにした組み合わせインデックス付加戦略を使用して、それぞれにバーコードを付加した連結配列リードライブラリを数千個生成する方法が確立された(Adey, A. et al. Genome. Biol. 11, R119 (2010), Amini, S. et al. Nat. Genet. 46, 1343-9 (2014), Adey, A. et al. Genome Res. 24, 2041-2049 (2014))。当社はCPT-seqを、ゲノムハプロタイプ分解能(Amini, S. et al. Nat. Genet. 46, 1343-9 (2014))と、de novoゲノムアセンブリ(Adey, A. et al. Genome Res. 24, 2041-2049 (2014))の問題に適用した。次に、この概念を、クロマチンアクセシビリティーアッセイ、ATAC-seq(Buenrostro, J. D. et al.Nat. Methods 10, 1213-8 (2013))と統合して、数千の単細胞中の活性調節エレメントのプロファイルを生成した(Cusanovich, D. a et al.Science 348, 910-4 (2015))(sciATAC-seq、図4a)。組み合わせインデックスを付加する場合、96個のインデックス付きシーケンシングアダプターの1つをトランスポザーゼを介して組み込むことにより、核が最初にバーコード化される。次に、96個の反応を組み合わせ、これらのランダムにインデックスを付加された核のうち15-25個を、蛍光活性化核ソーティング(FANS、図5)によりPCRプレートの各ウェルに配置する。そのため、任意の2つの核が同じトランスポザーゼバーコードを有する確率は低い(6-11%)(Cusanovich, D. a et al.Science 348, 910-4 (2015))。次に、各PCRウェルを、インデックス付きプライマーを使用してユニークにバーコード化する。このプロセスの終わりに、各配列リードは2つのインデックス:トランスポザーゼプレートからのインデックス1と、PCRプレートからのインデックス2を含み、これらは単細胞の識別を容易にする。原理の証明として、Cusanovichと同僚らは、15000超のsciATAC-seqプロファイルを生成し、これらを使用して、2つの細胞タイプの混合物を、それらの到達可能クロマチンランドスケープによって分離した(Cusanovich, D. a et al.Science 348, 910-4 (2015))。
高細胞カウント単細胞シーケンシングは、トランスクリプトーム、クロマチンアクセシビリティー、および変異の違いにより複雑な組織内で集団を分離することには効率性を示したが、これまで、単細胞の全ゲノムを含んだ配列情報を得ることは不可能だった。
本明細書で提供するのは、複数の単細胞に由来する核酸を含んだシーケンシングライブラリを調製する方法である。一実施形態において、本方法は、複数の細胞から単離核を提供するステップと;前記単離核の完全性を維持しながら、前記単離核を化学処理にかけてヌクレオソーム除去核を生成するステップと;前記ヌクレオソーム除去核のサブセットを、第1の複数のコンパートメントに分配し、各サブセットをトランスポソーム複合体と接触させるステップであって、各コンパートメントの前記トランスポソーム複合体は、トランスポザーゼと第1インデックス配列を含み、該第1インデックス配列は、その他のコンパートメントの第1インデックス配列とは異なる、ステップと;前記ヌクレオソーム除去核のサブセット中の核酸を複数の核酸断片に断片化し、前記第1インデックス配列を、前記核酸断片の少なくとも1本の鎖に組み込んで、インデックス付き核酸断片を含んだインデックス付き核を生成するステップであって、前記インデックス付き核酸断片は、前記トランスポザーゼに付着したままである、ステップと;前記インデックス付き核を組み合わせて、プールされたインデックス付き核を生成するステップと;前記プールされたインデックス付き核のサブセットを、第2の複数のコンパートメントに分配するステップと;各コンパートメントのインデックス付き核酸断片に、第2インデックス配列を組み込んで、二重インデックス断片を生成するステップであって、各コンパートメントの前記第2インデックス配列は、その他のコンパートメントの第2インデックス配列と異なる、ステップと;前記二重インデックス断片を組み合わせることにより、前記複数の単細胞に由来するゲノム核酸を全て含んだシーケンシングライブラリを生成するステップとを含む。
一実施形態では、化学処理には、リチウム3,5-ジヨードサリチル酸などの、核酸-タンパク質の相互作用を阻害することが可能なカオトロピック剤を用いた処理が含まれる。一実施形態では、化学処理には、ドデシル硫酸ナトリウム(SDS)などの、核酸-タンパク質の相互作用を阻害することが可能な界面活性剤を用いた処理が含まれる。
一実施形態では、核がホルムアルデヒドなどの架橋剤で処理されてから、単離核が化学処理にかけられる。架橋剤は、約0.2%~約2%の濃度であり得、一実施形態では、約1.5%である。一実施形態では、ホルムアルデヒドによる架橋は、プールされたインデックス付き核のサブセットの分配後、かつ、各コンパートメントのインデックス付き核酸断片に第2インデックス配列が組み込まれる前に、逆転される。一実施形態では、架橋の逆転には、約55℃~約72℃でのインキュベーションが含まれる。一実施形態では、トランスポザーゼは、架橋の逆転の前にインデックス付き核酸断片から分離される。一実施形態では、トランスポザーゼは、ドデシル硫酸ナトリウム(SDS)を使用して、インデックス付き核酸断片から分離される。
一実施形態では、核が制限酵素で処理されてから、ヌクレオソーム除去核のサブセット中の核酸が複数の核酸断片に断片化され、第1インデックス配列が組み込まれる。一実施形態では、制限酵素での処理の後、核はリガーゼで処理される。
一実施形態では、ヌクレオソーム除去核のサブセットの分配、プールされたインデックス付き核のサブセットの分配、またはその組み合わせは、蛍光活性化核ソーティングにより実行される。一実施形態では、ヌクレオソーム除去核のサブセットは、ほぼ等しい数の核を含み、一実施形態では、ヌクレオソーム除去核のサブセットは、1~約2000個の核を含む。一実施形態では、プールされたインデックス付き核のサブセットは、ほぼ等しい数の核を含み、一実施形態では、プールされたインデックス付き核のサブセットは、1~約25個の核を含む。一実施形態では、プールされたインデックス付き核のサブセットに含まれる核は、ヌクレオソーム除去核のサブセットの少なくとも10分の1であるか、または、ヌクレオソーム除去核のサブセットの少なくとも100分の1である。
一実施形態では、第1の複数のコンパートメント、第2の複数のコンパートメント、またはその組み合わせは、96ウェルプレートまたは384ウェルプレートなどのマルチウェルプレートである。
一実施形態では、トランスポソーム複合体は、ヌクレオソーム除去核のサブセットがコンパートメントに分配された後に、コンパートメントに加えられる。一実施形態では、トランスポソーム複合体はそれぞれトランスポゾンを含み、トランスポゾンはそれぞれ転移鎖を含む。一実施形態では、転移鎖は、第1インデックス配列と、第1ユニバーサル配列を含む。
一実施形態では、第2インデックス配列のインデックス付き核酸断片への組み込みは、各コンパートメントのインデックス付き核酸断片を、第1ユニバーサルプライマーおよび第2ユニバーサルプライマーと接触させるステップであって、前記第1ユニバーサルプライマーおよび第2ユニバーサルプライマーはそれぞれインデックス配列を含み、それぞれ第1ユニバーサル配列の一部と同一または相補的な配列を含む、ステップと、指数関数的増幅反応を実施するステップとを含む。一実施形態では、指数関数的増幅反応は、ポリメラーゼ連鎖反応(PCR)であり得、一実施形態では、PCRは15~30サイクルを含み得る。一実施形態では、第1ユニバーサルプライマーのインデックス配列は、第2ユニバーサルプライマーのインデックス配列の逆相補体であり、別の実施形態では、第1ユニバーサルプライマーのインデックス配列は、第2ユニバーサルプライマーのインデックス配列の逆相補体とは異なる。一実施形態では、第1ユニバーサルプライマーは、さらに、第1捕捉配列と、二重インデックス断片の3´末端のユニバーサル配列に対して相補的な第1アンカー配列とを含み、一実施形態では、第1捕捉配列は、P5プライマー配列を含む。一実施形態では、第2ユニバーサルプライマーは、さらに、第2捕捉配列と、二重インデックス断片の5´末端のユニバーサル配列に対して相補的な第2アンカー配列とを含み、一実施形態では、第2捕捉配列は、P7プライマー配列の逆相補体を含む。
本方法は、また、二重インデックス断片に対し特異性を有する複数の捕捉オリゴヌクレオチドを使用した、二重インデックス断片の濃縮を含み得る。一実施形態では、捕捉オリゴヌクレオチドは、固形基板の表面に固定化され、一実施形態では、捕捉オリゴヌクレオチドがユニバーサル結合対の第1メンバーを含み、結合対の第2メンバーが、固形基板の表面に固定化される。
本方法は、また、複数の単細胞に由来する核酸のヌクレオチド配列を決定する二重インデックス断片のシーケンシングを含み得る。一実施形態では、本方法は、複数の増幅部位を含む表面を提供するステップであって、該増幅部位は、遊離3´末端を有する付着した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含む、ステップと、増幅部位を含む表面を、個々の二重インデックス断片からのアンプリコンのクローン集団をそれぞれが含む複数の増幅部位を生成するのに適切な条件下で、二重インデックス断片と接触させるステップとを含む。一実施形態では、二重インデックス断片の数は増幅部位の数を上回り、二重インデックス断片は増幅部位に流体アクセスし、増幅部位にはそれぞれ、シーケンシングライブラリ中のいくつかの二重インデックス断片のための容量がある。一実施形態では、接触ステップは、(i)二重インデックス断片を平均輸送速度で増幅部位に輸送するステップと、(ii)増幅部位にある二重インデックス断片を平均増幅速度で増幅させるステップを同時に含み、ここにおいて、平均増幅速度は平均輸送速度を上回る。
また、本明細書では、組成物も提供する。一実施形態では、組成物は、化学的に処理されたヌクレオソーム除去単離核を含み、該単離核は、インデックス付き核酸断片を含む。一実施形態では、単離核は、非天然の架橋を含む。一実施形態では、組成物は、オーバーハングを含む切断制限部位において終端するインデックス付き核酸断片を含む。一実施形態では、単離核は、再編成されたゲノムDNAを含む。別の実施形態では、組成物はマルチウェルプレートに含まれ、マルチウェルプレートのウェルは、化学的に処理されたヌクレオソーム除去単離核を含み、単離核はインデックス付き核酸断片を含む。
本開示の例示的な実施形態についての以下の詳細な説明は、以下の図面と併せて読んだ場合に最良に理解され得る。
本開示の単細胞組み合わせインデックス付加の一般的で例示的な方法の、一般的なブロック図である。 インデックス付き核酸断片の例示的な実施形態の略図である。 二重インデックス断片の例示的な実施形態の略図である。 ヌクレオソーム除去を用いた単細胞組み合わせインデックス付加を示す図である。(図4a)単細胞組み合わせインデックス付加のワークフロー。(図4b)標準的な単離の後に、リチウム随伴ヌクレオソーム除去(LAND)または架橋とSDS処理(xSDS)を使用したヌクレオソーム除去を続けることにより生成された、インタクトな核の位相差画像。スケールバー:100μm。(図4c)ヌクレオソーム除去により、クロマチンアクセシビリティー部位に限定されない、ゲノム全体での均一なカバレッジが得られる。 蛍光活性化核ソーティング(FANS)を示す図である。単一核のFANSソーティングによる代表的なプロット。全てのプロットは、注意書きがない場合、第2(PCR)プレートのソーティングからのものである。(図5a)ATAC-seq核、(図5b)LAND、(図5c)HeLa S3および3T3、(図5d)xSDS、(図5e)PDAC Sort1トランスポザーゼプレート、(5f)PDAC Sort2 PCRプレート。 混合モデルを使用した、SCI-seq単細胞決定を示す図である。HeLa.LAND3を図示。RパッケージミックスツールのnormalmixEMを使用して、各分布:ノイズインデックス組み合わせ(左のピーク)と単細胞ライブラリ(右のピーク)を特定した。インデックス組み合わせを単細胞ライブラリとして考えるためのリードカウント閾値は、単細胞分布の平均を1標準偏差下回る値(log10領域において)か、ノイズ分布の平均を2上回る値(log10領域において、したがって100倍大きい)の大きい方で、最低1,000である。図示するライブラリでは、単細胞成分の平均を1標準偏差下回る値がより大きく、そのためこれをリードカウント閾値として使用する。 SCI-seqを用いた、LANDとxSDSのヌクレオソーム除去の比較を示す図である。(図7a)GM12878における6個のLAND SCI-seq調製物の1つの複雑度。右、リードカウントの分布を示すヒストグラム。破線は、単細胞リードのカットオフを表す。(図7b)3つのPCRプレートのうち1つでのxSDSヌクレオソーム除去であることを除き、図7aと同じ。(図7c)左、GM12878 xSDS調製物でダウンサンプリングしたリードで作られ、カバレッジの最高深度を予測するために使用されるモデル。右、LAND調製物の1つと完全xSDS調製物についての予測。陰影は、多数のモデル全体のs.d.を表す。点は、実際のシーケンシング深度を表す。(図7d)LANDまたはxSDSを使用したSCI-seqと、準ランダムプライミング(QRP)および変性オリゴヌクレオチドPCR(DOP)での、カバレッジ均一性スコア。(図7e)分散フィルタの付加ありおよびなしでの、全調製物における、染色体腕レベルで異数性を示す細胞のパーセンテージについての要約。(図7f)50個のGM12878細胞の核型決定の結果。(図7g、図7h)LAND(図7g)またはxSDS(図7h)を使用して生成した単一GM12878のウィンドウ付きのコピー数コールと、クラスタ化についての要約。各パネルにおいて、上部は、全細胞の獲得頻度または損失頻度についての染色体腕規模での要約を表し;下部は、少なくとも1つのCNVコールを含む細胞のクラスタ化プロファイルである。 全調製物についてのSCI-seqライブラリの複雑度と、インデックスリードカウント分布を示す図である。各調製物について2つのプロットを示す。左:各点は、ユニークなインデックスの組み合わせを表し、x軸はそのインデックスの組み合わせに割り当てられたユニークリードの割合であり、y軸はインデックスの組み合わせのlog10ユニークリードカウントである。等高線は、点密度を表す。右:インデックスの組み合わせそれぞれの、log10ユニークリードカウントのヒストグラムである。我々は、潜在的なインデックスの組み合わせの大多数は単細胞ライブラリを表さず、そのため、含まれるユニークリードは非常に少数で(最も左の分布)、単細胞ライブラリは、はるかに多くのリードカウントを有する(右の分布またはよりパフォーマンスの低いライブラリのテール)と予測する。プロットはlog10スケールであることから、ノイズ分布は、実際には、全リードカウントのうち少数しか取り上げていない。 ヒトおよびマウス細胞の混合物におけるSCI-seqを示す図である。全パネルについて、各インデックス成分のリード数が、ヒト参照ゲノムまたはマウス参照ゲノムに整列したカウントに基づき、プロットされている。(図9a、b)ヒト(GM12878)およびマウス(3T3)におけるLANDヌクレオソーム除去、(図9c、d)ヒト(HeLa S3)およびマウス(3T3)におけるLANDヌクレオソーム除去、(9e)ヒト(HeLa S3)およびマウス(3T3)におけるxSDSヌクレオソーム除去。 より深いシーケンシング後のSCI-seqライブラリの複雑度と、インデックスリードカウントの分布を示す図である。S2において、左のプロットが、各インデックスの組み合わせについてのユニークリード割合対ユニークリードカウントを示すように、各調製物について2つのプロットが示される。一方、右のプロットは、各インデックスの組み合わせについてのリードカウントのヒストグラムを示す。より深くシーケンシングされたウェルの細胞は、該ウェルが属するプレートの残りと共に示される。より複雑度の低い細胞集団(左側)は、より深くシーケンシングされた集団である。 同じ単細胞において、隣接した転移事象のシーケンシングより観察される、9bpのリードオーバーラップを示す図である。(図11a)9bpのコピーが転移事象から如何に起こるかについてのダイアグラム。(図11b)9bpで破線を入れた、全アンプリコンオーバーラップのサイズを示す、代表的な単細胞。 HMMとCBSについてコピー数をコールするコンピュータワークフローを示す図である。コール後、CBSおよびHMMについてのコールセットを、Ginkgoと交差させ、3つのセット全てに存在するコールのみを、最終コールセットとして維持した。 GM12878上で単細胞をシーケンシングの標準的な方法を使用したCNVアセスメントを示す図である。上:染色体腕の増幅および欠失についての要約、下:細胞の階層的クラスタ化。 全方法にわたる、ウィンドウサイズによる分散とリードカウントカットオフを示す図である。プロットは、ウィンドウサイズとセルごとのリードカウントの関数として、MADまたはMAPDスコアの変化を示す。 分散スコアカットオフ全体でのGM12878異数性率を示す図である。各点は、所与のスコアカットオフ(x軸)に含まれる細胞数により調整した、細胞集団の異数性率(y軸)である。 準ランダムプライミング(QRP)を使用した、アカゲザル前頭皮質、個体1のCNVプロファイルを示す図である。(図16a)Ginkgoコール、(図16b)CBSコール、(図16c)HMMコール、(図16d)3つ全ての交差、(図16e)CBSとHMMのみの交差。 変性オリゴヌクレオチドプライムPCR(DOP)を使用した、アカゲザル前頭皮質、個体1のCNVプロファイルを示す図である。(図17a)Ginkgoコール、(図17b)CBSコール、(図17c)HMMコール、(図17d)3つ全ての交差、(図17e)CBSとHMMのみの交差。 LANDヌクレオソーム除去ありでSCI-seqを使用した、アカゲザル前頭皮質、個体1のCNVプロファイルを示す図である。(図18a)Ginkgoコール、(図18b)CBSコール、(図18c)HMMコール、(図18d)3つ全ての交差、(図18e)CBSとHMMのみの交差。 xSDSヌクレオソーム除去ありでSCI-seqを使用した、アカゲザル前頭皮質、個体1のCNVプロファイルを示す図である。(図19a)Ginkgoコール、(図19b)CBSコール、(図19c)HMMコール、(図19d)3つ全ての交差、(図19e)CBSとHMMのみの交差。 アカゲザルの脳内の体細胞CNVを示す図である。(図20a)コピー数多型を示す3つの単細胞例と、SCI-seq調製物の1つの代表的な正倍数性細胞(HMM)。(図20b)フィルタリングありおよびなしの方法それぞれにより求められた、異数性の頻度。 アカゲザルの前頭皮質個体1の、カバレッジ均一性についての比較を示す図である。均一性の測定は、GM12878調製物の測定(図7b)と非常に似ている。 分散スコアカットオフ全体でのアカゲザルの異数性率を示す図である。各点は、所与のスコアカットオフ(x軸)に含まれる細胞数により調整した、細胞集団の異数性率(y軸)である。 xSDSヌクレオソーム除去ありでSCI-seqを使用した、アカゲザル前頭皮質、個体2のCNVプロファイルを示す図である。(図23a)Ginkgoコール、(図23b)CBSコール、(図23c)HMMコール、(図23d)3つ全ての交差、(図23e)CBSとHMMのみの交差。 ステージIIIヒト膵管腺がん(PDAC)のSCI-seq解析を示す図である。(図24a)SCI-seqライブラリの複雑度。右パネル、リードカウントの分布を示すヒストグラムは。破線は、単細胞リードのカットオフを表す。(図24b)log2配列深さ比の切断点コール(上)と、切断点ウィンドウマトリックス。(図24c)切断点マトリックスについての主な成分解析およびk-meansクラスタ化。(図24d)各クラスタからの凝集細胞における100kbp分解能CNVコール。(図24e)全クラスタに存在するクラスタ特異性CNVとCEBPA増幅(k4を図示する)。 膵管腺がんでの、xSDSをベースとしたヌクレオソーム除去を使用したSCI-seqを示す図である。解析で使用したコピー数をコールする3つの方法:(図25a)Ginkgo、(図25b)CBS、および(図25c)HMMでの2.5Mbpウィンドウでのコピー数コールの要約を示す図である。 xSDS SCI-seqを使用した一次PDACでの単細胞CNVコールを示す図である。代表的な単細胞シグナルプロット。 切断点解析のワークフローの図式を示す。まず、個々の細胞の切断点を解析する。全細胞の切断点を合わせ、上記の閾値を超える場合は局所的に合計する。インターバルは、局所的に共有される切断点の間で定義され、平均比スコアは各インターバル内に見つけられる。 コピー数多型コールについて隠れマルコフモデル法を使用し、HeLavS3においてLANDをベースにしたヌクレオソーム除去を使用したSCI-seqを示す図である。ウィンドウ化(2.5Mbp)コールと、細胞の階層クラスタ化の要約。CBCコピー数コールは、サブ染色体コールに対し重度のバイアスを生み、Ginkgoは、細胞数の倍数性を正しく特定することができず、コール細胞の大多数が全体的に増幅される結果となった。 隠れマルコフモデル法を使用し、単細胞でのHeLa S3コピー数多型コールにおいてLANDをベースにしたヌクレオソーム除去を使用した、SCI-seqを示す図である。代表的な単細胞シグナルプロット。1のシグナルは、2.98の平均倍数性に相当する。 HeLaの切断点解析を示す図である。(図30a)2.5Mbpウィンドウを使用したHMM解析により、HeLa細胞株において特定された切断点。(図30b)GMI12878に正規化された、細胞のHeLa切断点ウィンドウのLog2マトリックス。 HeLa切断点ウィンドウについてのPCAを示す図である。HeLaは、細胞株の安定性に基づいて予想される単一集団を生成する。赤および青の点は、異なる調製物を示す。 保存ステージIIの直腸がんサンプルにおける、xSDSに基づいたヌクレオソーム除去を使用したSCI-seqを示す図である。2.5Mbpウィンドウでの交差したコピー数コールの要約。 前方散乱、側方散乱、およびDAPI強度パラメータを使用した、トランスポザーゼを用いた処置の後で、単一核を単離するのに使用したゲーティング機構を示す図である。 本開示の単細胞組み合わせインデックス付加およびゲノムと染色体の立体配座の一般的で例示的な方法の一実施形態の、一般的なブロック図である。 種々のホルムアルデヒド濃度および架橋逆転時間を使用する方法から得られた、ライブラリ複雑度とユニークリードカウントを示す図である。 HeLaにおいてsci-GCCを使用した単細胞ライブラリの例を示す図である。キメラライゲーション接合部リードにより生成されたシグナルは、x軸に第1ウィンドウを、y軸に連結ウィンドウを有する10Mbpウィンドウにわたる、ゲノムの遠位領域間に示される。強調表示したのはHeLaに存在する既知の転座であり、ここではトランス染色体3Cシグナルが高まる。
略図は、必ずしも縮尺されているわけではない。図で使用する同様の数字は、同様の要素、ステップ等を指す。しかしながら、所与の図の要素を指すために数字を使用することにより、同じ数字を標識された別の図の要素を限定する意図はないことが理解されよう。さらに、要素を指すために異なる数字を使用することにより、別の数字を付けられた要素が、他の数字を付けられた要素と同じではあり得ないまたは類似し得ないことを示す意図はない。
〔例示的な実施形態の詳細な説明〕
本明細書で使用する場合、用語「生物」、「対象」は、区別なく使用され、動物および植物を指す。動物の例は、哺乳動物、例えばヒトなどである。
本明細書で使用する場合、用語「細胞種」は、形態、表現型、発生学的起源、または他の既知のもしくは認識可能な目立った細胞特徴に基づき、細胞を特定することを意図する。種々の異なる細胞型が、単一の生物(または、同じ種の生物)より得られ得る。例示的な細胞型としては、限定するわけではないが、膀胱、膵臓上皮、膵α、膵β、膵臓内皮、骨髄リンパ芽球、骨髄Bリンパ芽球、骨髄マクロファージ、骨髄赤血球、骨髄樹状、骨髄脂肪細胞、骨髄骨細胞、骨髄軟骨細胞、前骨髄球、骨髄巨核芽球、膀胱、脳Bリンパ球、脳グリア、ニューロン、脳アストロサイト、神経外胚葉、脳マクロファージ、脳ミクログリア、脳上皮、皮質ニューロン、脳線維芽細胞、脳上皮、結腸上皮、結腸Bリンパ球、乳房上皮、乳房筋上皮、乳房線維芽細胞、結腸細胞、頸部上皮、卵巣上皮、卵巣線維芽細胞、乳管上皮、舌上皮、扁桃腺樹状、扁桃腺Bリンパ球、末梢血リンパ芽球、末梢血Tリンパ芽球、末梢血皮膚Tリンパ球、末梢血ナチュラルキラー、末梢血Bリンパ芽球、末梢血単球、末梢血骨髄芽球、末梢血単芽球、末梢血前骨髄球、末梢血マクロファージ、末梢血好塩基球、肝臓内皮、肝臓マスト、肝臓上皮、肝臓Bリンパ球、脾臓内皮、脾臓上皮、脾臓Bリンパ球、肝細胞、肝臓線維芽細胞、肺上皮、気管支上皮、肺線維芽細胞、肺Bリンパ球、肺シュワン、肺扁平上皮、肺マクロファージ、肺骨芽細胞、神経内分泌、肺胞、胃上皮、および胃線維芽細胞が挙げられる。
本明細書で使用する場合、用語「組織」は、一緒に作用して生物において1つまたは複数の特異的な機能を果たす細胞の集合または凝集物を意味することを意図する。細胞は、任意選択的に、形態的に類似している可能性がある。例示的な組織としては、限定するわけではないが、目、筋肉、皮膚、腱、静脈、動脈、血液、心臓、脾臓、リンパ節、骨、骨髄、肺、気管支、気管、腸、小腸、大腸、結腸、直腸、唾液腺、舌、胆嚢、虫垂、肝臓、膵臓、脳、胃、皮膚、腎臓、尿管、膀胱、尿道、生殖腺、精巣、卵巣、子宮、卵管、胸腺、下垂体、甲状腺、副腎、または副甲状腺が挙げられる。組織は、ヒトまたは他の生物の種々の臓器の何れかに由来し得る。組織は健康な組織である場合も不健康な組織である場合もある。不健康な組織の例としては、限定するわけではないが、肺、乳房、大腸、前立腺、上咽頭、胃、精巣、皮膚、神経系、骨、卵巣、肝臓、血液組織、膵臓、子宮、腎臓、リンパ組織などの悪性腫瘍が挙げられる。悪性腫瘍は、種々の組織学的サブタイプ、例えば、細胞種、腺がん、肉腫、繊維腺がん、神経内分泌、または未分化のものなどであり得る。
本明細書で使用する場合、用語「ヌクレオソーム」は、クロマチンの基本的な反復単位を指す。ヒトゲノムは、平均直径が~10μmの細胞の核内に圧縮された数メートルのDNAからなる。真核生物の核では、DNAは、クロマチンとして知られるヌクレオプロテイン複合体にパッケージ化されている。ヌクレオソーム(クロマチンの基本的な反復単位)は、典型的には、コアなヒストン八量体の周りに、約1.7回巻かれたDNAの~146塩基対を含む。ヒストン八量体は、ヒストンH2A、H2B、H3、およびH4のそれぞれの2つのコピーからなる。ヌクレオソームは、紐上のビーズの要領で、DNAに沿って規則正しく間隔を置いて配置される。
本明細書で使用する場合、用語「コンパートメント」は、何かを他のものから分離させるまたは単離する領域または体積を意味することを意図する。例示的なコンパートメントとしては、限定するわけではないが、バイアル、管、ウェル、液滴、ボーラス、ビーズ、容器、面フィーチャ、または、流体の流れ、磁気、電流等などの物理的な力により分離された領域もしくは体積が挙げられる。一実施形態では、コンパートメントは、96または384ウェルプレートなどの、マルチウェルプレートのウェルである。
本明細書で使用する場合、「トランスポソーム複合体」は、統合認識部位を含む、統合酵素と核酸を指す。「トランスポソーム複合体」は、トランスポザーゼと、転移反応を触媒可能なトランスポザーゼ認識部位とにより形成される機能的複合体である(例えば、Gunderson et al.、国際公開第2016/130704号を参照)。統合酵素の例としては、限定するわけではないが、インテグラーゼまたはトランスポザーゼが挙げられる。統合認識部位の例としては、限定するわけではないが、トランスポザーゼ認識部位が挙げられる。
本明細書で使用する場合、用語「核酸」は、当技術分野におけるその用途と合致していることを意図し、自然発生的核酸またはその機能類似体を含む。特に有用な機能類似体は、配列特異的に核酸とハイブリダイズすることができる、または特定のヌクレオチド配列を複製するための鋳型として使用され得る。自然発生的核酸は、概して、リン酸ジエステル結合を含む主鎖を有する。類似体構造は、当技術分野で既知の種々のもののうち何れかを含む、代替的主鎖結合を有し得る。自然発生的核酸は、概して、デオキシリボース糖(例えば、デオキシリボ核酸(DNA)に見られる)、またはリボース糖(例えば、リボ核酸(RNA)に見られる)を有する。核酸は、当技術分野で既知であるこれらの糖部分の種々の類似体の何れかを含み得る。核酸は、天然または非天然の塩基を含み得る。この点に関して、天然デオキシリボ核酸は、アデニン、チアミン、シトシン、またはグアニンからなる群から選択される1つまたは複数の塩基を有することができ、リボ核酸は、アデニン、ウラシル、シトシン、またはグアニンからなる群から選択される1つまたは複数の塩基を有し得る。核酸に含めることができる有用な非天然の塩基は当技術分野で既知である。非天然の塩基の例としては、ロックド核酸(LNA)および架橋核酸(BNA)が挙げられる。LNA塩基およびBNA塩基はDNAオリゴヌクレオチドに組み込まれ、オリゴヌクレオチドのハイブリダイゼーション強度と特異性を高め得る。LNA塩基およびBNA塩基と斯かる塩基の使用は、当業者にとって既知であり、ルーチンである。
本明細書で使用する場合、「ヌクレアーゼ」は、核酸を切断する任意の酵素を指す。ヌクレアーゼは、ヒドロラーゼと呼ばれる酵素クラスに属し、通常は、作用において特異的であり、リボヌクレアーゼはリボ核酸(RNA)に優先的に作用し、デオキシリボヌクレアーゼは、デオキシリボ核酸(DNA)に優先的に作用する。
本明細書で使用する場合、用語「標的」は、核酸に関して使用する場合、本明細書で記載する方法または組成物の文脈では、核酸に対する意味論上の識別子として意図し、必ずしも、明示的に指示されているものを超えて、核酸の構造または機能を限定するものではない。標的核酸は、本質的には、既知のまたは未知の配列の任意の核酸であり得る。例えば、ゲノムDNAまたはcDNAの断片であり得る。シーケンシングは、標的分子の全体または一部の配列の決定をもたらし得る。標的は、一次核酸サンプル、例えば、核などに由来し得る。標的は、また、cDNAへの逆転写により、一次RNAサンプルより得ることも可能である。一実施形態では、標的は処理されて、各標的断片の末端へユニバーサル配列を配置することにより、増幅に適した鋳型になり得る。
本明細書で使用する場合、用語「ユニバーサル」は、ヌクレオチド配列を説明する際に使用する場合、2つ以上の核酸分子に共通の配列領域を指し、ここにおいて、分子は、互いに異なる配列領域も有する。分子集合の異なるメンバーに存在するユニバーサル配列により、ユニバーサル捕捉配列などの、ユニバーサル配列の一部に対し相補的な捕捉オリゴヌクレオチドなどのユニバーサル捕捉核酸の集団を使用した、多数の異なる核酸の捕捉が可能になる。ユニバーサル捕捉配列の非限定的例としては、P5およびP7プライマーと同一または相補的な配列が挙げられる。同様に、分子集合の異なるメンバーに存在するユニバーサル配列により、ユニバーサル配列の一部に対し相補的なユニバーサルプライマー、例えば、ユニバーサルアンカー配列の集団を使用した、多数の異なる核酸の増幅または複製(例えばシーケンシング)が可能になる。そのため、補足オリゴヌクレオチドまたはユニバーサルプライマーは、ユニバーサル配列に特異的にハイブリダイズし得る配列を含む。ハイブリダイズする2つのユニバーサル配列は、ユニバーサル結合対という。例えば、ハイブリダイズする捕捉オリゴヌクレオチドとユニバーサル捕捉配列は、ユニバーサル結合対である。
用語「P5」および「P7」は、ユニバーサル捕捉配列または捕捉オリゴヌクレオチドを指す場合に使用し得る。用語「P5´」(P5プライム)および「P7´」(P7プライム)は、それぞれ、P5とP7の相補体を指す。任意の適切なユニバーサル捕捉配列または捕捉オリゴヌクレオチドを本明細書に示す方法で使用することが可能であり、P5とP7の使用は、単なる例示的な実施形態であることが理解されよう。P5およびP7などの捕捉オリゴヌクレオチドまたはその補体をフローセル上で使用することは、国際公開第2007/010251号、同第2006/064199号、同第2005/065814号、同第2015/106941号、同第1998/044151号、および同第2000/018957号の開示により例示されるように、当技術分野で既知である。例えば、任意の適切な増幅フォワードプライマーは、固定化されていても、溶液中にあっても、本明細書に提示の方法において、相補的な配列に対するハイブリダイゼーションおよび配列の増幅に有用であり得る。同様に、任意の適切な増幅リバースプライマーも、固定化されていても、溶液中にあっても、本明細書に提示の方法において、相補的な配列に対するハイブリダイゼーションおよび配列の増幅に有用であり得る。当業者であれば、本明細書に提示の核酸の捕捉および/または増幅に適切なプライマー配列を、如何に設計し使用するか、理解しよう。
本明細書で使用する場合、用語「プライマー」およびその誘導体は、概して、関心の標的配列にハイブリダイズし得る任意の核酸を指す。典型的には、プライマーは、ヌクレオチドがポリメラーゼにより重合され得る基質として機能するが;一部の実施形態では、プライマーは、合成核酸鎖に組み込まれ、別のプライマーがハイブリダイズして、その合成核酸分子に相補的な新しい鎖の合成を刺激し得る部位を提供し得る。プライマーは、ヌクレオチドまたはその類似体の任意の組み合わせを含み得る。一部の実施形態では、プライマーは一本鎖オリゴヌクレオチドまたはポリヌクレオチドである。用語「ポリヌクレオチド」および「オリゴヌクレオチド」は本明細書では区別なく使用し、任意の長さの高分子形態のヌクレオチドを指し、リボヌクレオチド、デオキシリボヌクレオチド、その類似体、またはその混合物が含まれ得る。該用語は、同等物として、ヌクレオチド類似体より作成されるDNAまたはRNAの何れかの類似体を含み、一本鎖(例えば、センスまたはアンチセンスなど)および二本鎖のポリヌクレオチドに適用可能であることを理解されたい。本明細書で使用する場合、該用語は、また、相補的であるか、または、例えば、逆転写酵素の作用によりRNA鋳型により生成されるコピーDNAである、cDNAを包含する。この用語は、分子の一次構造のみを指す。したがって、該用語には、三本鎖、二本鎖、および一本鎖のデオキシリボ核酸(DNA)、ならびに、三本鎖、二本鎖、および一本鎖のリボ核酸(RNA)が含まれる。
本明細書で使用する場合、用語「アダプター」およびその誘導体、例えば、ユニバーサルアダプターは、概して、本開示の核酸分子にライゲーションし得る、任意の直鎖オリゴヌクレオチドを指す。一部の実施形態では、アダプターは、サンプル中に存在する任意の標的配列の3´末端または5´末端に対し、実質的に非相補的である。一部の実施形態では、適切なアダプター長さの範囲は、約10-100ヌクレオチド長、約12-60ヌクレオチド長、または約15-50ヌクレオチド長である。概して、アダプターは、ヌクレオチドおよび/または核酸の任意の組み合わせを含み得る。一部の態様では、アダプターは、1つまたは複数の場所に1つまたは複数の切断可能基を含み得る。別の態様では、アダプターは、プライマー、例えばユニバーサルプライマーの少なくとも一部に対し、実質的に同一であるか、または実質的に相補的である配列を含み得る。一部の実施形態では、アダプターは、下流のエラー修正、特定、またはシーケンシングを補助するバーコード(本明細書ではタグまたはインデックスともいう)を含み得る。用語「アダプター(adaptor)」と「アダプター(adapter)」は、区別なく使用する。
本明細書で使用する場合、用語「各」は、文脈上、明確に他の指示がない限り、事項の集合に関し使用する場合は、集合における個別事項を特定することを意図するが、必ずしも集合におけるすべての事項について言及するものではない。
本明細書で使用する場合、用語「輸送」は、流体を通じた分子の移動を指す。該用語は、分子の濃度勾配に沿った分子の移動などの受動輸送(例えば、受動拡散)を含み得る。該用語は、また、分子がその濃度勾配に沿って、または濃度勾配に逆らって移動し得る能動輸送も含み得る。したがって、輸送は、エネルギーを適用して、1つまたは複数の分子を所望の方向または所望の場所、例えば、増幅部位などへ移動させることを含み得る。
本明細書で使用する場合、「増幅する」、「増幅すること」、または「増幅反応」、およびその派生語は、概して、核酸分子の少なくとも一部が、少なくとも一つの追加の核酸分子に複製またはコピーされる、任意の作用またはプロセスを指す。追加の核酸分子は、任意選択的に、鋳型核酸分子の少なくとも一部と実質的に同一または実質的に相補的である配列を含む。鋳型核酸分子は一本鎖でも二本鎖でもよく、追加の核酸分子も、独立して、一本鎖でも二本鎖でもよい。増幅には、任意選択的に、線形または指数関数的な核酸分子の複製が含まれる。一部の実施形態では、斯かる増幅は、等温条件を使用して実行され得;他の実施形態では、斯かる増幅には熱サイクリングが含まれ得る。一部の実施形態では、増幅は、単一増幅反応での複数の標的配列の同時増幅を含む多重増幅である。一部の実施形態では、「増幅」には、DNAおよびRNAをベースにした核酸の少なくとも一部の単独でのまたは組み合わせての増幅が含まれる。増幅反応は、当業者に既知の増幅プロセスの何れかを含み得る。一部の実施形態では、増幅反応は、ポリメラーゼ連鎖反応(PCR)を含む。
本明細書で使用する場合、「増幅条件」およびその派生語は、概して、1つまたは複数の核酸配列を増幅するのに適した条件を指す。斯かる増幅は、線形である場合も指数関数的である場合もある。一部の実施形態では、増幅条件は、等温条件を含む場合もあるし、代わりに、熱サイクリング条件または等温および熱サイクリング条件の組み合わせを含む場合もある。一部の実施形態では、1つまたは複数の核酸配列を増幅するのに適した条件には、ポリメラーゼ連鎖反応(PCR)条件が含まれる。典型的には、増幅条件は、ユニバーサル配列が隣接する1つもしくは複数の標的配列などの核酸を増幅するか、または、1つもしくは複数のアダプターにライゲーションした増幅標的配列を増幅するのに十分な反応混合物を指す。概して、増幅条件には、増幅または核酸合成用の触媒、例えばポリメラーゼと;増幅する核酸に対しある程度の相補性を有するプライマーと;いったん核酸にハイブリダイズしたらプライマーの伸長を促進する、デオキシリボヌクレオチド三リン酸(dNTP)などのヌクレオチドとを含む。増幅条件は、プライマーの核酸へのハイブリダイゼーションまたはアニーリング、プライマーの伸長、および伸長したプライマーが、増幅が進む核酸配列から分離される変性ステップを必要とする場合がある。典型的には、必ずしもというわけではないが、増幅条件には熱サイクリングが含まれ得;一部の実施形態では、増幅条件には、アニーリング、伸長、および分離のステップが繰り返される複数のサイクルが含まれる。典型的には、増幅条件にはMg2+またはMn2+などのカチオン含まれ、また、イオン強度の種々の修飾因子も含まれ得る。
本明細書で使用する場合、「再増幅」およびその派生語は、概して、増幅核酸分子の少なくとも一部がさらに任意の適切な増幅プロセス(一部の実施形態では「二次」増幅という)により増幅されることにより、再増幅核酸分子を生成する任意のプロセスを指す。二次増幅は、増幅核酸分子が生成された最初の増幅プロセスと同一である必要も、再増幅核酸分子が、増幅核酸分子と完全に同一または完全に相補的である必要もなく;再増幅核酸分子が、増幅核酸分子の少なくとも一部またはその補体を含めば十分である。例えば、再増幅は、異なる増幅条件および/または一次増幅以外の別の標的特異的プライマーを含む、異なるプライマーの使用を伴い得る。
本明細書で使用する場合、用語「ポリメラーゼ連鎖反応(「PCR」)」は、Mullis米国特許第4683195号明細書および同第4683202号明細書の方法を指し、前記文献は、クローン化も精製もなしに、ゲノムDNAの混合物における関心のポリヌクレオチドのセグメントの濃度を高める方法について記載する。この関心のポリヌクレオチドを増幅するプロセスは、大過剰の2つのオリゴヌクレオチドプライマーを、所望の関心のポリヌクレオチドを含むDNA混合物に導入し、その後、DNAポリメラーゼの存在下で一連の熱サイクリングが続くことからなる。2つのプライマーは、関心の二本鎖ポリヌクレオチドの各鎖に対し、相補的である。混合物はまず高温で変性され、プライマーが、次に、関心の分子のポリヌクレオチド内の相補的配列にアニールする。アニーリングに続き、プライマーがポリメラーゼで伸長して、新たな相補的鎖の対を形成する。変性、プライマーアニーリング、およびポリメラーゼ伸長のステップは、何度も繰り返されて(熱サイクリングという)、所望の関心のポリヌクレオチドの増幅セグメントを高濃度で得ることが可能である。所望の関心のポリヌクレオチドの増幅セグメント(アンプリコン)の長さは、プライマーの互いに対する相対的な位置により決定され、そのため、この長さは制御可能なパラメータである。プロセスを繰り返すことから、この方法は、ポリメラーゼ連鎖反応(以後、「PCR」)という。所望の関心のポリヌクレオチドの増幅セグメントが、混合物中で主な核酸配列(濃度の点で)になることから、それらは「PCR増幅された」という。上記で論じた方法に対する修正では、標的核酸分子は、複数の異なるプライマー対、一部の場合では関心の標的核酸分子ごとに1つまたは複数のプライマー対を使用してPCR増幅され得、それにより、多重PCR反応が形成される。
本明細書で定義する場合、「多重増幅」は、少なくとも1つの標的特異的プライマーを使用した、サンプル内の2つ以上の標的配列の選択的で非ランダムな増幅を指す。一部の実施形態では、多重増幅は、標的配列の一部またはすべてが単一反応容器内で増幅されるように実行される。所与の多重増幅の「plexy」または「plex」は、概して、単一多重増幅時に増幅される、異なる標的特異的配列の数を指す。一部の実施形態では、plexyは、約12plex、24plex、48plex、96plex、192plex、384plex、768plex、1536plex、3072plex、6144plex、またはそれ以上であり得る。また、いくつかの別の方法論により増幅標的配列を検出することが可能である(例えば、ゲル電気泳動後の濃度測定、バイオアナライザまたは定量的PCRを用いた定量化、標識プローブでのハイブリダイゼーション;ビオチン化プライマーの組み込み後のアビジン-酵素抱合体検出;32P-標識化デオキシヌクレオチド三リン酸の増幅標的配列への組み込み)。
本明細書で使用する場合、「増幅標的配列」およびその派生語は、概して、標的特異的プライマーと本明細書で提供する方法を使用して、標的配列を増幅することにより生成される核酸配列を指す。増幅標的配列は、標的配列に対し、同一センス(つまり、プラス鎖)またはアンチセンス(つまり、マイナス鎖)の何れかであり得る。
本明細書で使用する場合、用語「ライゲーションすること」、「ライゲーション」、およびその派生語は、概して、2つ以上の分子が共に共有結合するプロセス、例えば、2つ以上の核酸分子が互いに共有結合するプロセスを指す。一部の実施形態では、ライゲーションには、核酸の隣接ヌクレオチド間のニックを結合することを含む。一部の実施形態では、ライゲーションには、第1核酸分子の末端と、第2核酸分子の末端の間に共有結合を形成することを含む。一部の実施形態では、ライゲーションには、ある核酸の5´リン酸基と、第2核酸の3´ヒドロキシル基の間に共有結合を形成することにより、ライゲーションされた核酸分子を形成することを含み得る。概して、本開示では、増幅標的配列は、アダプターにライゲーションされて、アダプターライゲーション増幅標的配列を生成し得る。
本明細書で使用する場合、「リガーゼ」およびその派生語は、概して、2つの基質分子のライゲーションを触媒し得る任意の薬剤を指す。一部の実施形態では、リガーゼには、核酸の隣接ヌクレオチド間のニックの結合を触媒し得る酵素が含まれる。一部の実施形態では、リガーゼには、ある核酸分子の5´リン酸と、別の核酸分子の3´ヒドロキシルの間での共有結合の形成を触媒することにより、ライゲーションした核酸分子を形成し得る酵素が含まれる。適切なリガーゼとしては、限定するわけではないが、T4 DNAリガーゼ、T4 RNAリガーゼ、およびE.coli DNAリガーゼが挙げられ得る。
本明細書で使用する場合、「ライゲーション条件」およびその派生語は、概して、2つの分子を互いにライゲーションするのに適切な条件を指す。一部の実施形態では、ライゲーション条件は、核酸間のニックまたはギャップを埋めるのに適している。本明細書で使用する場合、用語ニックまたはギャップは、当技術分野における該用語の使用と同じである。典型的には、ニックまたはギャップは、適切な温度およびpHでのリガーゼなどの酵素の存在下でライゲーションされ得る。一部の実施形態では、T4 DNAリガーゼは、約70-72℃の温度で核酸間のニックを結合し得る。
用語「フローセル」は、本明細書で使用する場合、1つまたは複数の流体試薬が流れ得る固体表面を含むチャンバを指す。フローセルおよび関連する流体系ならびに本開示の方法で容易に使用することが可能な検出プラットフォームの例は、例えば、Bentley et al., Nature 456:53-59 (2008)、国際公開第04/018497号;米国特許第7057026号明細書;国際公開第91/06678;同第07/123744号;米国特許第7329492号明細書;同第7211414号明細書;同第7315019号明細書;同第7405281号明細書、および米国特許出願公開第2008/0108082号明細書に記載されている。
本明細書で使用する場合、用語「アンプリコン」は、核酸に関して使用する場合、核酸をコピーした産物を意味し、該産物は、核酸のヌクレオチド配列の少なくとも一部と同じまたは相補的なヌクレオチド配列を有する。アンプリコンは、核酸またはそのアンプリコンを鋳型として使用する種々の増幅方法の何れか(例えば、ポリメラーゼ伸長、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、ライゲーション伸長、またはライゲーション連鎖反応を含む)により生成される。アンプリコンは、特定のヌクレオチド配列の単一コピー(例えば、PCR産物)またはヌクレオチド配列の多数のコピー(例えば、RCAのコンカテマー産物)を有する核酸分子であり得る。標的核酸の第1アンプリコンは、典型的には相補的なコピーである。後続のアンプリコンは、第1アンプリコンの生成の後に、標的核酸または第1アンプリコンから作成されるコピーである。後続のアンプリコンは、標的核酸に対し実質的に相補的であるか、または、標的核酸と実質的に同一である配列を有し得る。
本明細書で使用する場合、用語「増幅部位」は、1つまたは複数のアンプリコンが生成され得る、アレイ内またはアレイ上の部位を指す。増幅部位は、該部位で生成される少なくとも1つのアンプリコンを含むか、保持するか、または付着させるようにさらに構成され得る。
本明細書で使用する場合、用語「アレイ」は、相対的な場所により互いに識別可能な部位の集合を指す。アレイの異なる部位にある異なる分子は、アレイの部位の場所により互いに識別可能である。アレイの個々の部位は、1つまたは複数の特定のタイプの分子を含み得る。例えば、部位が、特定の配列を有する単一標的核酸分子を含む場合もあるし、部位が、同じ配列(および/またはその相補的配列)を有するいくつかの核酸分子を含む場合もある。アレイの部位は、同じ基板上に位置する別のフィーチャであり得る。例示的なフィーチャとしては、限定するわけではないが、基板内のウェル、基板内または基板上のビーズ(もしくは他の粒子)、基板からの突起、基板上のリッジ、または基板内チャネルが挙げられる。アレイの部位は、別の分子をそれぞれ担持する別個の基板であり得る。別個の基板に付着している異なる分子は、基板が結合している表面上での基板の位置により、または、液体もしくはゲル内の基板の位置により特定され得る。表面上に別箇の基板が位置している例示的なアレイとしては、限定するわけではないが、ウェル中にビーズを有するものが挙げられる。
本明細書で使用する場合、用語「容量」は、部位および核酸物質に関して使用する場合、部位を占有し得る核酸物質の最大量を意味する。例えば、該用語は、特定の条件において部位を占有し得る核酸分子の総数を指し得る。例えば、特定の条件において部位を占有し得る、核酸物質の総量または特定のヌクレオチド配列のコピーの総数を含め、他の尺度も同様に使用され得る。典型的には、標的核酸用部位の容量は、標的核酸のアンプリコン用部位の容量と実質的に同等となる。
本明細書で使用する場合、用語「捕捉剤」は、標的分子(例えば、標的核酸)に付着、それを保持またはそれと結合可能な、物質、化学物質、分子またはその部分を指す。例示的捕捉剤としては、限定するわけではないが、標的核酸の少なくとも一部と相補的である捕捉核酸(本明細書では捕捉オリゴヌクレオチドという)、標的核酸(もしくはそれに付着している連結部分)と結合可能な受容体-リガンド結合対のメンバー(例えば、アビジン、ストレプトアビジン、ビオチン、レクチン、炭水化物、核酸結合タンパク質、エピトープ、抗体など)、または標的核酸(もしくはそれに付着している連結部分)と共有結合を形成可能な化学試薬が挙げられる。
本明細書で使用する場合、用語「クローン集団」とは、特定のヌクレオチド配列に関して均一である核酸の集団を指す。均一配列は、典型的には、少なくとも10ヌクレオチド長であるが、例えば、少なくとも50、100、250、500または1000ヌクレオチド長を含め、さらにより長い場合もある。クローン集団は、単一の標的核酸または鋳型核酸に由来し得る。典型的には、クローン集団中の核酸のすべてが、同一ヌクレオチド配列を有する。クローン集団では、クローン性から逸脱することなく、少数の突然変異(例えば、増幅アーチファクトによる)が起こり得ることが理解されよう。
本明細書で使用する場合、組成物、物品、核酸、または核の文脈における「供与すること」は、組成物、物品、核酸、もしくは核を作ること、組成物、物品、核酸、もしくは核を購入すること、または化合物、組成物、物品、もしくは核を別の方法で得ることを意味する。
用語「および/または」は、列挙した要素の1つもしくは全て、または、列挙した要素の任意の2つ以上の組み合わせを意味する。
単語「好適な」および「好適には」は、ある状況下で利益をもたらし得る、本開示の実施形態を指す。しかしながら、他の実施形態も、同じまたは他の状況下で好適であり得る。さらに、1つまたは複数の好適な実施形態の記載は、他の実施形態が有用ではないことを含意するものではなく、本開示の範囲から他の実施形態を除外することを意図するものでもない。
用語「含む」およびその変形は、これらの用語が明細書および特許請求の範囲にある場合、限定的な意味を有さない。
実施形態が本明細書において「含む(include)」、「含む(includes)」、または「含み(including)」等の言語と共に記載されている場合は、常に、「からなる」および/または「から本質的になる」という用語で記載される他の類似の実施形態も提供されることを理解されたい。
別段の定めがない限り、「1つ(a)」、「1つ(an)」、「その(the)」、および「少なくとも1つ」は、区別なく使用され、1つまたは複数を意味する。
また、本明細書では、端点による数値範囲の記載は、その範囲内に包含される全ての数を含む(例えば、1~5は、1、1.5、2、2.75、3、3.80、4、5などを含む)。
別個のステップを含む本明細書に開示の任意の方法では、そのステップは、任意の実現可能な順で実行されてよい。また、適切に、2つ以上のステップの任意の組み合わせは、同時に実行されてよい。
本明細書全体で、「一実施形態」、「実施形態」、「ある実施形態」、または「いくつかの実施形態」などへの言及は、実施形態に関連して記載される特定の特色、構成、組成、または特徴が、本開示の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体の種々の場所において斯かる句が出現することは、必ずしも、本開示の同一の実施形態を指しているわけではない。さらに、特定の特色、構成、組成、または特徴は、1つまたは複数の実施形態において、任意の適切な方法で組み合わせられ得る。
本明細書で提供する方法を使用して、複数の単細胞の全ゲノムを含むシーケンシングライブラリを生成することが可能である。一実施形態では、本方法を使用して、コピー数多型(CNV、例えば、細胞の遺伝子型における、特定の配列、例えば、遺伝子などのコピー数)を検出することが可能である。例えば、本方法を使用して、生物由来の体細胞サンプルにおける、CNVを有する核の頻度を定量化する、または、ある症状、例えばがんなどの文脈において、不均一性についての情報を提供することが可能である。
本明細書で提供する方法は、複数の細胞から単離した核を提供するステップを含む(図1、ブロック12;図34、ブロック12)。細胞は、任意の生物、および、その生物の任意の細胞型または任意の組織に由来し得る。本方法は、さらに、細胞を分離する、および/または、核を単離するステップを含み得る。細胞から核を単離する方法は、当業者にとって既知であり、ルーチンである。核の数は少なくとも2つであり得る。上限は、本明細書に記載する方法の他のステップで使用する機器(例えば、マルチウェルプレート)の実用上の限界に左右される。例えば、一実施形態では、核の数は1,000,000,000以下、100,000,000以下、10,000,000以下、1,000,000以下、100,000以下、10,000以下、または1,000以下であり得る。当業者は、各核の核酸分子が、生物の全遺伝子相補体(生物の全ゲノムともいう)を表し、イントロンおよびエクソン配列の両方と、プロモーターおよびエンハンサー配列などの非コーディング調節配列とを含むゲノムDNA分子であることを理解しよう。
単離した核は、ヌクレオソームフリーである場合も、ヌクレオソームの核を除去する条件に従い、ヌクレオソーム除去核を生成する場合もある(図1、ブロック13;図34ブロック13)。ヌクレオソーム除去核は、細胞の全ゲノムのDNA配列を決定する方法において有用である。
一実施形態では、ヌクレオソーム除去に使用される条件は、単離核の完全性を維持する。典型的には、ヌクレオソーム除去方法は、単細胞のペレットまたは懸濁液において使用され、したがって、細胞の供給源として接着細胞培養物または組織が使用される実施形態では、その供給源を処理して単細胞のペレットまたは懸濁液を得る。
一実施形態では、ヌクレオソーム除去の条件には、核酸-タンパク質の相互作用を阻害することが可能なカオトロピック剤を用いた化学処理が含まれる。有用なカオトロピック剤の例としては、限定するわけではないが、3,5-ジヨードサリチル酸リチウムが挙げられる。3,5-ジヨードサリチル酸リチウムを使用する条件には、それを、細胞ペレットに加え、氷上でインキュベートすることが含まれる。
別の実施形態では、条件には、核酸-タンパク質の相互作用を阻害することが可能な界面活性剤を用いた化学処理が含まれる。有用な界面活性剤の例としては、限定するわけではないが、ラウリル硫酸ナトリウム(SDS)が挙げられる。SDSを使用する条件には、それを細胞ペレットに加え、42℃などの高温でインキュベートし、次に、Triton(商標)X-100などの非イオン性界面活性剤を加え、42℃などの高温でインキュベートすることが含まれる。
一部の実施形態では、SDSなどの界面活性剤を使用する場合、核は、ヌクレオソーム除去の前に架橋剤にさらされる。一実施形態では、核は、細胞内にありながら架橋剤にさらされ(図34、ブロック11)、別の実施形態では、単離核が架橋剤にさらされる。架橋剤の有用な例としては、限定するわけではないが、ホルムアルデヒドが挙げられる(Hoffman et al., 2015, J. Biol. Chem., 290:26404-26411)。ホルムアルデヒドを用いた細胞の処理には、細胞懸濁液にホルムアルデヒドを加えることと、室温でインキュベートすることが含まれ得る。一実施形態では、ホルムアルデヒドの濃度は、0.2%~2%、例えば、0.2%超かつ1.5%以下であり得る。ホルムアルデヒド処理の後、核は、グリシンと、Igepal(登録商標)などの非イオン性非変性界面活性剤にさらされ得る。核を単離する前に細胞を架橋する場合、架橋は、55℃~72℃、例えば68℃などで30分~16時間、例えば1時間インキュベートすることにより逆転され得、典型的には、そうである(図34、ブロック19)。逆転は、典型的には、より遅くに、プールされたインデックス付き核のサブセットを第2の複数のコンパートメントに分配した後(図34、ブロック18)かつ二重インデックス断片を生成する前(図34、ブロック20)に起きる。サブセットの分配および二重インデックス断片の生成についても、本明細書で記載する。
架橋剤を使用する一部の実施形態では、本方法は、また、核内の染色体構造についての情報を提供する操作、例えば、クロマチンフォールディング解析、および、限定するわけではないが、転座などのゲノム再編成の検出を含み得る。斯かるタイプの解析は、当技術分野において、chromosome conformation capture(3C)および関連方法(4C、5C、およびHi-C)として知られている。操作には、典型的には、核内のゲノムDNAの消化(図34、ブロック14)と、それに続く、近接しているゲノム断片の末端のライゲーションが含まれる(図34、ブロック15)。これらのステップはキメラ断片をもたらすが、キメラ断片は核内で物理的に近接して側にあり、核もまた、典型的には配列スペースにおいて近くにある(Nagano et al., 2013, Nature, 502:59-64)。典型的には、核が架橋剤にさらされた後、かつ、核酸を断片化する前に、核に存在するゲノムDNAは、制限エンドヌクレアーゼなどのヌクレアーゼで消化される(図34、ブロック14)。任意の制限エンドヌクレアーゼを使用することが可能であり、一実施形態では、制限エンドヌクレアーゼは、核酸を切断して、当業者には接着性のある末端としても知られる、2つのオーバーハングをもたらす。制限エンドヌクレアーゼを用いてゲノムDNAを消化した後、核をリガーゼにさらして、ゲノムDNAの断片を連結させる(図34、ブロック15)。
単離核のヌクレオソームを除去するプロセス時に(図1、ブロック13;図34ブロック13)、単離核の完全性は維持される。ヌクレオソームを除去する条件にさらした後も核がインタクトなままであるかは、位相差画像法などの常法によって核の状態を可視化することにより求められ得る。一実施形態では、少なくとも100,000個の核が、ヌクレオソーム除去の後、インタクトである。
本明細書で提供する方法は、ヌクレオソーム除去核のサブセットを、第1の複数のコンパートメントに分配するステップを含む(図1、ブロック14;図34、ブロック16)。サブセット、ひいては各コンパートメントに存在する核の数は、少なくとも1であり得る。一実施形態では、サブセットに存在する核の数は、1,000,000以下、100,000以下、10,000以下、4,000以下、3,000以下、2,000以下、または1,000以下であり得る。一実施形態では、サブセットに存在する核の数は、1~1,000、1,000~10,000、10,000~100,000、または100,000~1,000,000である。一実施形態では、核サブセットに存在する核の数は、ほぼ等しい。核をサブセットに分配する方法は、当業者にとって既知であり、ルーチンである。例としては、限定するわけではないが、蛍光活性化核ソーティング(FANS)が挙げられる。
各コンパートメントは、トランスポソーム複合体を含む。トランスポソーム複合体は、核のサブセットがコンパートメントに加えられる前、その後、またはそれと同時に各コンパートメントに加えられ得る。トランスポソーム複合体、トランスポザーゼ認識部位に結合したトランスポザーゼは、「タグメンテーション」と呼ばれることもあるプロセスにおいて、トランスポザーゼ認識部位を、核内の標的核酸に挿入することが可能である。一部の斯かる挿入事象では、トランスポザーゼ認識部位の一方の鎖は、標的核酸に転移され得る。斯かる鎖は、「転移鎖」という。一実施形態では、トランスポソーム複合体は、2つのサブユニットを有する二量体トランスポザーゼと、2つの非連続トランスポゾン配列を含む。別の実施形態では、トランスポザーゼは、2つのサブユニットを有する二量体トランスポザーゼと、連続トランスポゾン配列を含む。
一部の実施形態は、機能亢進性のTn5トランスポザーゼと、Tn5-型トランスポザーゼ認識部位の使用(Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998))、またはMuAトランスポザーゼとR1およびR2の末端配列を含むMuトランスポザーゼ認識部位の使用(Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, et al., EMBO J., 14: 4893, 1995)を含み得る。Tn5モザイク末端(ME)配列も、当業者により最適化されて使用され得る。
本明細書で提供する組成物および方法のある実施形態と共に使用され得る転移系のより多くの例としては、Staphylococcus aureus Tn552(Colegio et al., J. Bacteriol., 183: 2384-8, 2001, Kirby C et al., Mol. Microbiol., 43: 173-86, 2002)、Ty1(Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994、および国際公開第95/23875号)、トランスポゾンTn7(Craig, N L, Science. 271: 1512, 1996; Craig, N L, Review in: Curr Top Microbiol Immunol., 204:27-48, 1996)、Tn/OおよびIS10(Kleckner N, et al., Curr Top Microbiol Immunol., 204:49-82, 1996)、マリナートランスポザーゼ(Lampe D J, et al., EMBO J., 15: 5470-9, 1996)、Tc1(Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996)、P Element(Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004)、Tn3(Ichikawa & Ohtsubo, J Biol. Chem. 265:18829-32, 1990)、細菌挿入配列(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996);レトロウイルス(Brown, et al., Proc Natl Acad Sci USA, 86:2525-9, 1989)、ならびにイーストのレトロトランスポゾン(Boeke & Corces, Annu Rev Microbiol. 43:403-34, 1989)が挙げられる。より多くの例としては、IS5、Tn10、Tn903、IS911、およびトランスポザーゼファミリー酵素の操作バージョンが挙げられる(Zhang et al., (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct 16; Wilson C. et al (2007) J. Microbiol. Methods 71: 332-5)。
本明細書で提供する方法および組成物と共に使用することができるインテグラーゼの他の例としては、レトロウイルスインテグラーゼと、斯かるレトロウイルスインテグラーゼに対するインテグラーゼ認識配列、例えば、HIV-1、HIV-2、SIV、PFV―1、RSVからのインテグラーゼなどが挙げられる。
本明細書に記載する方法および組成物に有用なトランスポゾン配列は、米国特許出願公開第2012/0208705号明細書、同第2012/0208724号明細書、および国際特許出願公開第2012/061832号で提供される。一部の実施形態では、トランスポゾン配列は、第1トランスポザーゼ認識部位、第2トランスポザーゼ認識部位、および、2つのトランスポザーゼ認識部位間に存在するインデックス配列を含む。
本明細書で有用ないくつかのトランスポソーム複合体は、2つのトランスポゾン配列を有するトランスポザーゼを含む。一部の斯かる実施形態では、2つのトランスポゾン配列は互いに連結せず、言い換えると、トランスポゾン配列は、互いに非連続である。斯かるトランスポソームの例は、当技術分野で既知である(例えば、米国特許出願公開第2010/0120098号明細書参照)。
一部の実施形態では、トランスポソーム複合体は、2つのトランスポザーゼサブユニットを結合して「ループ状複合体」または「ループ状トランスポソーム」を形成する、トランスポゾン配列核酸を含む。一例では、トランスポソームは、二量体トランスポザーゼとトランスポゾン配列を含む。ループ状複合体は、元の標的DNAの順序情報を維持しながら、標的DNAを断片化することなく、トランスポゾンが標的DNAに挿入されることを保証することができる。理解されるように、ループ状構造は、標的核酸の物理的結合性を維持しながら、所望の核酸配列、例えばインデックスなどを標的核酸に挿入する。一部の実施形態では、ループ状トランスポソーム複合体のトランスポゾン配列は、該トランスポゾン配列が断片化されて2つのトランスポゾン配列を含むトランスポソーム複合体を作成するように、断片化部位を含み得る。斯かるトランスポソーム複合体は、トランスポゾンが挿入される隣接する標的DNAフラグメントが、アッセイの後期段階で明瞭にアセンブルされ得るコードの組み合わせを確実に受け取るようにするのに有用である。
トランスポソーム複合体は、また、トランスポザーゼインデックスともいう、少なくとも1つのインデックス配列を含む。インデックス配列は、トランスポゾン配列の一部として存在する。一実施形態では、インデックス配列は、転移鎖、つまり、標的核酸に転移されるトランスポザーゼ認識部位の鎖に存在し得る。インデックス配列は、タグまたはバーコードともいい、特定の標的核酸が存在したコンパートメントに特徴的なマーカーとして有用である。トランスポソーム複合体のインデックス配列は、各コンパートメントで異なる。したがって、この実施形態では、インデックスは、特定のコンパートメントに存在する標的核酸のそれぞれに付着する核酸配列タグであり、その存在は、本方法のこの段階で核集団が存在するコンパートメントを示すか、または、該コンパートメントを特定するために使用される。
インデックス配列は、最大20ヌクレオチド長であり得、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20であり得る。4つのヌクレオチドタグは、同一アレイ上で256サンプルの多重化を可能にし、6つの塩基タグは、4096個のサンプルを同一アレイ上で処理することを可能にする。
一実施形態では、転移鎖は、また、ユニバーサル配列を含み得る。ユニバーサル配列についても、本明細書で記載する。したがって、転移鎖が標的核酸に転移される一部の実施形態では、標的核酸は、トランスポザーゼインデックス、ユニバーサル配列、またはその組み合わせを含む。
本方法は、また、インデックス付き核を生成するステップも含む(図1、ブロック15;図34ブロック17)。一実施形態では、インデックス付き核の生成は、ヌクレオソーム除去核のサブセットに存在する核酸(例えば、各コンパートメントに存在する核酸)を複数の核酸断片に断片化することを伴う。核酸を断片化した後も、トランスポザーゼは核酸断片に付着したままであり、その結果、同じゲノムDNA分子に由来する核酸断片は、物理的に連結されたままである(Adey et al., 2014, Genome Res., 24:2041-2049)。
一実施形態では、核酸の断片化は、核酸に存在する断片化部位を使用することにより達成される。典型的には、断片化部位は、トランスポソーム複合体を使用することにより、標的核酸に導入される。例えば、ループ状トランスポソーム複合体は、断片化部位を含み得る。断片化部位を使用して物質を切断することが可能であるが、標的核酸に挿入されたインデックス配列間の情報の関連性は切断されない。切断は、生化学的手段、化学的手段、または他の手段によりなされ得る。一部の実施形態では、断片化部位は、種々の手段により断片化され得るヌクレオチドまたはヌクレオチド配列を含み得る。断片化部位の例としては、限定するわけではないが、制限エンドヌクレアーゼ部位、RNAseで切断可能な少なくとも1つのリボヌクレオチド、ある化学薬品の存在下で切断可能なヌクレオチド類似体、過ヨウ素酸での処理により切断可能なジオール結合、化学的還元剤で切断可能なジスルフィド基、光化学切断にかけることができる切断可能部、および、ペプチダーゼ酵素または他の適切な手段により切断可能なペプチド(例えば、米国特許出願公開第2012/0208705号明細書、同第2012/0208724号明細書、および国際公開第2012/061832号参照)。断片化の結果は、インデックス付き核の集団であり、ここで各核はインデックス付き核酸断片を含む。インデックス付き核酸断片は、少なくとも一本の鎖に、特定のコンパートメントを示すインデック配列を含み得るものであり、典型的には、それを含む。インデックス付き核酸断片の例を、図2に示す。インデックス付き核酸断片20の一本鎖は、トランスポザーゼインデックスと、増幅および/またはシーケンシングに使用可能なユニバーサル配列とを含む、トランスポソーム複合体の転移鎖に由来するヌクレオチド21および22を含む。インデックス付き核酸断片は、また、核23のゲノムDNAに由来するヌクレオチドも含む。
多数のコンパートメントに由来するインデックス付き核は、組み合わせることが可能である(図1、ブロック16;図34ブロック18)。例えば、2~96個のコンパートメント(96ウェルプレートを使用する場合)からのインデックス付き核または2~384個のコンパートメント(384ウェルプレートを使用する場合)が、組み合わされる。これらの組み合わせたインデックス付き核のサブセットは、本明細書ではプールされたインデックス付き核といい、これは、次に、第2の複数のコンパートメントに分配される。サブセット、ひいては各コンパートメントに存在する核の数は、本方法のこのステップで同じコンパートメントに行き着く同じトランスポザーゼインデックスを有する2つの核の存在である、インデックス衝突を減少させたいという願望に一部基づく。この実施形態で、サブセットに存在する核の数は、2~30、例えば1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30などであり得る。一実施形態では、サブセットに存在する核の数は、20~24、例えば、22などである。一実施形態では、各サブセットに存在する核の数は、ほぼ等しい。一実施形態では、各サブセットに存在する核の数は、ヌクレオソーム除去核のサブセットの核の少なくとも10分の1である(図1、ブロック14;図34ブロック16)。一実施形態では、各サブセットに存在する核の数は、ヌクレオソーム除去核のサブセットの核の少なくとも100分の1である(図1、ブロック14;図34ブロック16)。核をサブセットに分配する方法は当業者にとって既知であり、ルーチンである。例としては、限定するわけではないが、蛍光活性化核ソーティング(FANS)が挙げられる。
核をサブセットに分配した後、各コンパートメントのインデックス付き核酸断片に第2インデックス配列を組み込んで、二重インデックス断片を生成するが、各コンパートメントの第2インデックス配列は、その他のコンパートメントの第2インデックス配列とは異なる。これは、固定化およびシーケンシングの前に、インデックス付き核酸断片のさらなるインデックス付加をもたらす(図1、ブロック17;図34ブロック20)。細胞が架橋剤により架橋される実施形態では、インデックス付き核酸断片に付着したトランスポザーゼは、インデックス付き核酸断片から解離される。一実施形態では、付着したトランスポザーゼは、架橋が逆転される前に解離される(図34、ブロック19)。界面活性剤を使用してトランスポザーゼを解離させることが可能であり、一実施形態では、界面活性剤はドデシル硫酸ナトリウム(SDS)である。
一実施形態では、組込みは、典型的には、PCRなどの指数関数的増幅反応による。インデックス付き核酸断片の末端に存在するユニバーサル配列は、プライマーとして機能し得るユニバーサルアンカー配列の結合のために使用され、増幅反応で伸長され得る。典型的には、2つの異なるユニバーサルプライマーが使用される。1つのプライマーがインデックス付き核酸断片の一方の鎖の3´末端でユニバーサル配列とハイブリダイズし、第2プライマーが、インデックス付き核酸断片のもう一方の鎖の3´末端でユニバーサル配列とハイブリダイズする。したがって、各プライマーのアンカー配列は異なり得る。適切なプライマーは、それぞれ、ユニバーサル捕捉配列などの追加のユニバーサル配列と、別のインデックス配列とを含み得る。各プライマーは、インデックスを含み得ることから、このステップは、1つまたは2つのインデックス配列、例えば、第2および任意選択的な第3のインデックスの付加をもたらす。第2および任意選択的な第3のインデックスを有するインデックス付き核酸断片は、二重インデックス断片という。第2および第3のインデックスは、互いの逆相補体である場合もあるし、第2および第3インデックスは、互いの逆相補体ではない配列を有する場合もある。この第2インデックス配列および任意選択的な第3インデックスは、分配されるインデックス付き核が置かれる各コンパートメントに対し特有である(図1、ブロック16;図34ブロック18)。
一実施形態では、第2インデックス配列の組み込みは、各コンパートメントのインデックス付き核酸断片を、第1ユニバーサルプライマーおよび第2ユニバーサルプライマーと接触させるステップを含む。第1ユニバーサルプライマーは、第1ユニバーサル配列の一部と同一である配列を含み、第2ユニバーサルプライマーは、第1ユニバーサル配列の一部に対し相補的な配列を含む。各プライマーは、インデックス配列を含む。一実施形態では、第1ユニバーサルプライマーのインデックス配列は、第2ユニバーサルプライマーのインデックス配列の逆相補体である。別の実施形態では、第1ユニバーサルプライマーのインデックス配列は、第2ユニバーサルプライマーのインデックス配列の逆相補体とは異なる。
一実施形態では、第1ユニバーサルプライマーは、また、第1捕捉配列と、二重インデックス断片の3´末端のユニバーサル配列に対し相補的な第1アンカー配列とを含む。一実施形態では、第1捕捉配列は、P5プライマー配列を含む。一実施形態では、第2ユニバーサルプライマーも、第2捕捉配列と、二重インデックス断片の5´末端のユニバーサル配列に対し相補的な第2アンカー配列とを含む。一実施形態では、第2捕捉配列は、P7プライマー配列の逆相補体を含む。
別の実施形態では、組み込みは、インデックス付き核酸断片を、断片の両末端へ追加の配列をライゲーションする条件に従わせるステップを含む。一実施形態では、平滑末端ライゲーションが使用され得る。別の実施形態では、例えば、デオキシアデノシン(A)などの単一デオキシヌクレオチドをインデックス付き核酸断片の3´末端に付加する、非鋳型依存性末端トランスフェラーゼ活性を有するTaqポリメラーゼまたはKlenow exo minusポリメラーゼなどのある種のDNAポリメラーゼの活性により、単一オーバーハングヌクレオチドを有する断片が調製される。斯かる酵素を使用して、単一ヌクレオチド「A」を、断片の核鎖の平滑末端である3´末端に付加することが可能である。したがって、「A」が、TaqまたはKlenow exo minusポリメラーゼを用いた反応により二本鎖標的断片の各鎖の3´末端に付加される一方で、断片の各末端に付加される追加の配列の、付加される二本鎖核酸の各領域の3´末端には、適合性のある「T」オーバーハングが存在し得る。この末端修飾は、また、この実施形態で付加される配列に隣接するインデックス付き核酸断片の形成に偏りを生じさせる核酸のセルフライゲーションを防ぐ。
本明細書に記載する方法による核酸分子の断片化は、平滑末端と3´-および5´-オーバーハング末端の不均一な混合を有する断片を生じさせ得る。一部の実施形態では、そのため、当技術分野既知の方法またはキット(例えば、Lucigen DNAターミネーター末端修復キットなど)を使用して断片末端を修復して、例えば、クローニングベクターの平滑部位への挿入に最適な末端を生成することが望ましい。特定の実施形態では、核酸集団の断片末端は、平滑末端化される。より具体的には、断片末端は平滑末端化およびリン酸化される。リン酸部分は、例えば、ポリヌクレオチドキナーゼを使用した酵素処理により導入され得る。
一実施形態では、インデックス付き核酸断片は、まず、同一のユニバーサルアダプター(「ミスマッチアダプター」ともいう)(その一般的な特徴は、Gormley et al.、米国特許第7741463号明細書、およびBignell et al.、米国特許第8053192号明細書に記載されている)を、インデックス付き核酸断片の5´および3´末端にライゲーションすることにより処理されて、二重インデックス断片を形成する。一実施形態では、ユニバーサルアダプターは、1つまたは2つのインデックス配列と、二重インデックス断片をアレイに固定化するための配列を含め、シーケンシングに必要な全ての配列を含む。シーケンシングする核酸は、単細胞に由来するため、二重インデックス断片のさらなる増幅は、シーケンシングのために十分な数の二重インデックス断片を達成するのに有益である。
一実施形態では、第2インデックス配列の組み込みは、ユニバーサルアダプターを、各コンパートメントのインデックス付き核酸断片にライゲーションするステップを含む。ユニバーサルアダプターは、2本の核酸鎖を含み、各鎖は第2インデックス配列を含む。一実施形態では、ユニバーサルアダプターの一方の鎖の第2インデックス配列は、ユニバーサルアダプターの第2鎖の第2インデックス配列の逆相補体である。他の実施形態では、ユニバーサルアダプターの一方の鎖の第2インデックス配列は、ユニバーサルアダプターの第2鎖の第2インデックス配列の逆相補体とは異なる。
一実施形態では、ユニバーサルアダプターは、また、第1捕捉配列と第1アンカー配列も含む。一実施形態では、第1捕捉配列は、P5プライマー配列を含む。一実施形態では、ユニバーサルアダプターは、また、第2捕捉配列と第2アンカー配列も含む。一実施形態では、第2捕捉配列は、P7プライマー配列の逆相補体を含む。
別の実施形態では、インデックス付き核酸断片にライゲーションされたユニバーサルアダプターが、シーケンシングに必要な全ての配列を含まない場合、PCRなどの指数関数的増幅ステップを使用して、固定化およびシーケンシングの前に、各インデックス付き核酸断片に存在するユニバーサルアダプターをさらに修飾することが可能である。例えば、初期のプライマー伸長反応が、インデックス付き核酸断片に存在するユニバーサル配列に対し相補的なユニバーサルアンカー配列を使用して行われ、各個別のインデックス付き核酸断片の両鎖に対し相補的な伸長産物が形成される。典型的には、PCRにより、ユニバーサル捕捉配列などの追加のユニバーサル配列と、別のインデックス配列が付加される。各プライマーは、インデックスを含み得ることから、このステップは、1つまたは2つのインデックス配列、例えば、第2および任意選択的な第3のインデックスの付加と、アダプターライゲーションによるインデックス付き核酸断片へのインデックス付加をもたらす(図1、ブロック17;図34ブロック20)。
ユニバーサルアダプターが付加された後、シーケンシングに必要な全ての配列を含むユニバーサルアダプターをライゲーションする単一ステップの方法により、または、ユニバーサルアダプターをライゲーションし、次に、指数関数的に増幅してユニバーサルアダプターをさらに修飾するという2ステップの方法の何れかにより、最終的な二重インデックス断片は、ユニバーサル捕捉配列、第2インデックス配列、および任意選択的な第3インデックス配列を含むことになる。第2および第3のインデックスは、互いの逆相補体である場合もあるし、第2および第3インデックスは、互いの逆相補体ではない配列を有する場合もある。これらの第2インデックス配列および任意選択的な第3インデックス配列は、分配されるインデックス付き核が、第1インデックスがタグメンテーションにより付加された後で置かれる各コンパートメントに対し、特有である(図1、ブロック17;図34ブロック20)。ユニバーサルアダプターを各末端に付加した結果は、図3に示す、二重インデックス断片に類似したまたは同一の構造を有する複数の二重インデックス断片または二重インデックス断片のライブラリである。二重インデックス断片30の一本鎖は、3´フローセルアダプター(例えば、P5)および5´プロ―セルアダプター(例えば、P7´)ともいう、捕捉配列31および38それぞれと、i5およびi7などのインデックス32および37を含む。二重インデックス断片30は、また、トランスポザーゼインデックス34と、増幅および/またはシーケンシングに使用することが可能なユニバーサル配列35とを含む、トランスポソーム複合体33の転移鎖に由来するヌクレオチドも含む。二重インデックス断片は、また、核36のゲノムDNAに由来するヌクレオチドも含む。
結果として生じる二重インデックス断片は、共同で、固定化され、次いでシーケンシングされ得る核酸ライブラリを提供する。用語ライブラリは、本明細書ではシーケンシングライブラリともいい、これは、3´および5´末端に既知のユニバーサル配列を含む単細胞由来の核酸断片の集合を指す。ライブラリは、1つまたは複数の単離核に由来する全ゲノム核酸を含む。
二重インデックス断片は、150~400ヌクレオチド長、例えば、150~300ヌクレオチドなどの所定のサイズ範囲を選択する条件を課される場合がある。結果として生じる二重インデックス断片はプールされ、任意選択的に、組み込まれていないユニバーサルアダプターまたはプライマーの少なくとも一部を除去することによりDNA分子に対する純度を高める、クリーンアッププロセスにかけられ得る。電気泳動、サイズ排除クロマトグラフィー等などの任意の適切なクリーンアッププロセスが使用され得る。一部の実施形態では、可逆的固相固定化常磁性ビーズを利用して、所望のDNA分子を、付着していないユニバーサルアダプターまたはプライマーより分離して、サイズに応じて核酸を選択することができる。可逆的固相固定化常磁性ビーズは、Beckman Coulter(Agencourt AMPure XP)、Thermofisher(MagJet)、Omega Biotek(Mag-Bind)、Promega Beads(PrOmega)、およびKapa Biosystems(Kapa Pure Beads)より商業的に入手可能である。
複数の二重インデックス断片が、シーケンシングのために調製され得る。二重インデックス断片は、プールされた後、典型的には固定化および/または増幅により濃縮されてからシーケンシングされる(図1、ブロック18;図34ブロック21)。1つまたは複数の供給源からの二重インデックス断片を基板に付着させる方法は、当技術分野で既知である。一実施形態では、二重インデックス断片は、二重インデックス断片に対し特異性を有する複数の捕捉オリゴヌクレオチドを使用して濃縮され、捕捉オリゴヌクレオチドは、固定基板の表面に固定化され得る。例えば、捕捉オリゴヌクレオチドは、ユニバーサル結合対の第1メンバーを含み得、結合対の第2メンバーは、固定基板の表面に固定化される。同様に、固定化された二重インデックス断片を増幅する方法としては、限定するわけではないが、架橋増幅および動力学的排除(kinetic exclusion)が挙げられる。シーケンシングの前に固定化および増幅する方法は、例えば、Bignell et al.(米国特許第8053192号明細書)、Gunderson et al.(国際公開第2016/130704号)、Shen et al.(米国特許第8895249号明細書、およびPipenburg et al.(米国特許第9309502号明細書)に記載されている。
プールされたサンプルは、シーケンシング用の調製時に固定化され得る。シーケンシングは、単一分子のアレイとして実行される場合もあるし、シーケンシングの前に増幅される場合もある。増幅は、1つまたは複数の固定化プライマーを使用して実行され得る。固定化プライマーは、例えば、平面表面上またはビーズのプール上のローンであり得る。ビーズのプールはエマルジョンに単離され得、エマルジョンの各「コンパートメント」には単一ビーズがある。「コンパートメント」毎に1つの鋳型のみという濃度では、単一鋳型のみが各ビーズ上で増幅される。
用語「固相増幅」は、本明細書で使用する場合、固体支持体上でまたはそれに関連して実行され、その結果、増幅産物の全てまたは一部が、それらが形成された固体支持体に固定化される、任意の核酸増幅反応を指す。特に、該用語は、フォワード増幅プライマーおよびリバース増幅プライマーの一方または両方が固体支持体に固定化されていることを除き、標準的な液相増幅と類似した反応である、固相ポリメラーゼ連鎖反応(固相PCR)と、固相等温増幅を包含する。固相PCRは、あるプライマーがビーズに係留され、他のプライマーが自由溶液中にある、エマルジョンと、あるプライマーが表面に係留され、あるプライマーが自由溶液中にある固相ゲルマトリックス中にある、コロニー形成などの系をカバーする。
一部の実施形態では、固体支持体は、パターン化表面を含む。「パターン化表面」は、固体支持体の露出層内または露出層上での異なる領域の配置を指す。例えば、1つまたは複数の領域は、1つまたは複数の増幅プライマーが存在するフィーチャであり得る。フィーチャは、増幅プライマーが存在しない間隙領域により分離され得る。一部の実施形態では、パターンは、行と列のフィーチャのxy形式であり得る。一部の実施形態では、パターンは、フィーチャおよび/または間隙領域の反復配置であり得る。一部の実施形態では、パターンは、フィーチャおよび/または間隙領域のランダムな配置であり得る。本明細書に記載する方法および組成物で使用することが可能な例示的なパターン化表面は、米国特許第8778848号明細書、同第8778849号明細書、および同第9079148号明細書、ならびに米国特許出願公開第2014/0243224号明細書に記載されている。
一部の実施形態では、固体支持体は、表面にウェルまたはくぼみのアレイを含む。これは、限定するわけではないが、フォトリソグラフィ、プレス加工技法、成型技法、およびマイクロエッチング技法を含む種々の技法を使用して、当技術分野で一般的に知られているように作製され得る。当業者には理解されようが、使用される技法は、アレイ基板の組成および形に左右されよう。
パターン化表面のフィーチャは、パターン化された、ポリ(N-(5-アジドアセトアミジルペンチル)アクリルアミド-co-アクリルアミド)などの共有結合ゲルを有する、ガラス、シリコン、プラスチック、または他の適切な固体支持体上のウェル(例えば、マイクロウェルまたはナノウェル)のアレイ中のウェルであり得る(PAZAM、例えば、米国特許出願公開第2013/184796号明細書、国際公開第2016/066586号、および同第2015/002813号を参照されたい)。本プロセスにより、多数のサイクルを有するシーケンシングランで安定的であり得る、シーケンシングに使用されるゲルパッドが作成される。ウェルへのポリマーの共有結合は、種々の使用時に、構造化基板の耐用年数にわたり、構造化されたフィーチャにゲルを維持するのに有益である。しかしながら、多くの実施形態では、ゲルはウェルに供給結合する必要はない。例えば、一部の条件では、構造化基板のどの部分にも共有結合しないシランフリーアクリルアミド(SFA、例えば、米国特許第8563477号明細書参照)を、ゲル材料として使用可能である。
特定の実施形態では、構造化基板は、固体支持体材料にウェル(例えば、マイクロウェルまたはナノウェル)をパターン化し、パターン化支持体をゲル材料(例えば、PAZAM、SFA、または化学修飾されたその変異体、例えば、SFAのアジド化バージョン(アジド-SFA)など)でコーティングし、ゲルコーティング支持体を、例えば、化学的研磨または機械的研磨により研磨することにより、ウェル内のゲルは維持しつつ、ウェル間の構造化基板表面上の間隙領域からゲルの全てを除去するかまたは実質的に不活化することによって、作成され得る。プライマー核酸は、ゲル材料に付着させることができる。次いで、二重インデックス断片溶液を研磨した基板に接触させ、その結果、個々の二重インデックス断片が、ゲル材料に付着したプライマーとの相互作用により個々のウェルに播種されるようにすることが可能であるが;ゲル材料が欠如しているかまたは不活性化されているため、標的核酸が間隙領域を占有することはない。間隙領域においてゲルが欠如しているかまたは不活性化されていることにより、成長する核酸コロニーが外に移動することを妨げられるため、二重インデックス断片の増幅はウェル内に限定されよう。このプロセスは、スケーラブルであり、従来のマイクロまたはナノ加工法を利用して、都合良く製造することが可能である。
本開示は、1つの増幅プライマーのみを固定化する(他のプライマーは、通常、遊離溶液中に存在する)「固相」増幅法を包含するが、一実施形態では、固体支持体に、フォワードプライマーとリバースプライマーの両方が固定化されることが好ましい、実際には、増幅プロセスは、増幅を維持するために過剰なプライマーを要することから、「複数」の同一のフォラードプライマーおよび/または「複数」の同一のリバースプライマーが固体支持体に固定化されるだろう。したがって、本明細書において、フォワードプライマーおよびリバースプライマーに言及することは、文脈上他の意味が示される場合を除き、「複数」の斯かるプライマーを包含していると解釈すべきである。
当業者には理解されようが、任意の所与の増幅反応は、増幅する鋳型に対し特異的な、少なくとも一種類のフォワードプライマーと、少なくとも一種類のリバースプライマーを必要とする。しかしながら、ある実施形態では、フォワードプライマーおよびリバースプライマーは、同一配列の鋳型特異的部分を含む場合も、完全に同一のヌクレオチド配列および構造(任意の非ヌクレオチド修飾を含む)を有する場合もある。言い換えると、一種類のプライマーのみを使用して固相増幅を行うことが可能であり、斯かる単一プライマー方法も本開示の範囲に含まれる。他の実施形態は、同一の鋳型特異的配列を含むがいくつかの他の構造特徴は異なる、フォワードプライマーとリバースプライマーを使用し得る。例えば、ある種類のプライマーは、他には存在しない非ヌクレオチド修飾を含み得る。
本開示の全実施形態において、固相増幅用プライマーは、好適には、プライマーの5´末端でまたはその近くで、固体支持体に共有結合する単一点により固定化され、プライマーの鋳型特異的部分をその同族鋳型とアニールするように遊離させ、3´ヒドロキシ基をプライマー伸長のために遊離させる。当技術分野で既知の任意の適切な共有結合手段を、この目的で使用してよい。選択される付着化学反応は、固体支持体の性質と、それに適用される任意の誘導体化または機能化に左右されよう。プライマー自体は、付着を容易にするヌクレオチド以外の化学修飾であり得る部分を含み得る。特定の実施形態では、プライマーは、硫黄含有求核試薬、例えば、ホスホロチオエートまたはチオホスフェートを5´末端に含み得る。固体支持されたポリアクリルアミドハイドロゲルの場合、この求核試薬は、ハイドロゲル中に存在するブロモアセトアミド基に結合しよう。プライマーおよび鋳型を固体支持体に付着させるより具体的な手段は、国際公開第05/065814号に記載されているように、重合したアクリルアミドおよびN-(5-ブロモアセトアミジルペンチル)アクリルアミド(BRAPA)を含むハイドロゲルへの5´ホスホロチオエート付着を介する。
本開示のある実施形態は、例えば、ポリヌクレオチドなどの生体分子への共有結合を可能にする反応性基を含む中間材料の層またはコーティングを適用することにより、「機能化」された、不活性基板または不活性マトリックス(例えば、ガラススライド、ポリマービーズなど)を含む固体支持体を利用し得る。斯かる支持体の例としては、限定するわけではないが、ガラスなどの不活性基板に支持されたポリアクリルアミドハイドロゲルが挙げられる。斯かる実施形態では、生体分子(例えば、ポリヌクレオチド)は、中間材料(例えば、ハイドロゲル)に直接結合し得るが、中間材料自体は、基板またはマトリックス(例えば、ガラス基板)に共有結合し得ない。従って、用語「個体支持体に共有結合した」は、この種の配置を包含すると解釈すべきである。
プールされたサンプルはビーズ上で増幅され得、各ビーズは、フォワード増幅プライマーとリバース増幅プライマーを含む。特定の実施形態では、二重インデックス断片ライブラリを使用して、固相増幅、より具体的には固相等温増幅により、米国特許出願公開第2005/0100900号明細書、米国特許第7115400号明細書、国際公開第00/18957号、および同第98/44151号に記載されているものに類似した、クラスタ化された核酸コロニーのアレイを調製する。用語「クラスタ」および「コロニー」は、本明細書では、区別なく使用されて、複数の同一の固定化核酸鎖と複数の同一の固定化された相補的な核酸鎖を含んだ固体支持体上の別個の部位を指す。用語「クラスタ化アレイ」は、斯かるクラスタまたはコロニーより形成されたアレイを指す。この文脈では、用語「アレイ」は、順序よく並べられたクラスタ配置を必要とすると解されるべきではない。
用語「固相」または「表面」は、プライマーが平坦な表面、例えば、ガラス、シリカもしくはプラスチックの顕微鏡スライド、もしくは類似のフローセルデバイスに付着した平面アレイ;1つもしくは2つのプライマーが付着し、増幅されるビーズ;または、ビーズが増幅された後の表面上のビーズアレイを意味するために使用される。
クラスタ化アレイは、国際公開第98/44151号に記載されている熱サイクリングのプロセスか、または、温度が一定に維持され、伸長および変性のサイクルが試薬の変更を用いて行われるプロセスの何れかを使用して調製され得る。斯かる等温増幅法は、特許出願番号である国際公開第02/46456号および米国特許出願公開第2008/0009420号明細書に記載されている。等温プロセスで有用な温度は低いため、これは特に一部の実施形態において好ましい。
本明細書に記載するまたは当技術分野で一般的に既知である任意の増幅方法は、固定化DNA断片を増幅するためのユニバーサルプライマーまたは標的特異的プライマーと共に使用可能であることが理解されよう。増幅のための適切な方法としては、限定するわけではないが、米国特許第8003354号明細書に記載されているように、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写介在増幅(TMA)、および核酸配列に基づく増幅(NASBA)が挙げられる。上記の増幅法を利用して、1つまたは複数の関心の核酸を増幅することができる。例えば、多重PCR、SDA、TMA、NASBA等を含むPCRを利用して、固定化されたDNA断片を増幅することができる。一部の実施形態では、関心のポリヌクレオチドを特異的に対象とするプライマーが、増幅反応に含まれる。
ポリヌクレオチドの増幅のための他の適切な方法としては、オリゴヌクレオチド伸長およびライゲーション、ローリングサークル増幅(RCA(Lizardi et al., Nat. Genet. 19:225-232 (1998))、ならびにオリゴヌクレオチドライゲーションアッセイ(OLA)(一般的に、米国特許第7582420号明細書、同第5185243号明細書、同第5679524号明細書、および同第5573907号明細書;欧州特許第0320308号明細書;同第0336731号明細書;同第0439182号明細書;国際公開第90/01069号;同第89/12696号;および同第89/09835号参照)技法が挙げられ得る。これらの増幅方法は、固定化されたDNA断片を増幅するために設計され得ることが理解されよう。例えば、一部の実施形態では、増幅方法には、関心の核酸を特異的に対象とするプライマーを含む、ライゲーションプローブ増幅またはオリゴヌクレオチドライゲーションアッセイ(OLA)反応が含まれ得る。一部の実施形態では、増幅方法には、関心の核酸を特異的に対象とするプライマーを含む、プライマー伸長-ライゲーション反応が含まれ得る。関心の核酸を増幅するように特異的に設計され得るプライマー伸長およびライゲーションのプライマーの非限定的例として、増幅は、米国特許第7582420号明細書および同第7611869号明細書に例示されるように、GoldenGateアッセイ(Illumina,Inc.、カリフォルニア州サンディエゴ)に使用されるプライマーを含み得る。
本開示の方法で使用することができる例示的な等温増幅方法としては、限定するわけではないが、例えば、Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)に例示されるような多置換増幅(MDA)、または、例えば、米国特許第6214587号明細書に例示されるような等温鎖置換核酸増幅が挙げられる。本開示で使用し得る他のPCRをベースとしない方法としては、例えば、Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995;米国特許第5455166号明細書、同第5130238号明細書、およびWalker et al., Nucl. Acids Res. 20:1691-96 (1992)に記載される鎖置換増幅(SDA)、または、例えば、Lage et al., Genome Res. 13:294-307 (2003)に記載される超分岐鎖置換増幅が挙げられる。等温増幅方法は、例えば、鎖置換Phi29ポリメラーゼまたはBst DNAポリメラーゼラージ断片、ゲノムDNAのランダムプライマー増幅用5´→3´エキソと共に使用され得る。これらのポリメラーゼの使用は、その高い処理能力と鎖置換作用を利用する。高い処理能力により、ポリメラーゼは10-20kb長の断片を生成することが可能となる。上に記載したように、より小さい断片は、Klenowポリメラーゼなどの処理能力と鎖置換作用が低いポリメラーゼを使用する等温条件下で生成され得る。増幅反応、条件、および成分についての追加の説明は、米国特許第7670810号明細書の開示に詳細に記載されている。
本開示で有用な別の増幅方法は、例えば、Grothues et al. Nucleic Acids Res. 21(5):1321-2 (1993)に記載されている、定常5´領域の後にランダム3´領域を有する2ドメインプライマーの集団を使用するTagged PCRである。増幅の第1ラウンドを実行して、個別ハイブリダイゼーションに基づく熱変性DNAにおいてランダムに合成された3´領域から多数の開始を可能にする。3´領域の性質により、開始部位はゲノム全体を通してランダムであると考えられる。その後、非結合プライマーは除去され、さらに、定常5´領域に対し相補的なプライマーを使用した複製が起き得る。
一部の実施形態では、exclusion amplification(ExAmp)ともいう動力学的排除増幅(KEA)を使用した等温増幅が実行され得る。本開示の核酸ライブラリは、増幅試薬を反応させて、部位に播種された個々の標的核酸に由来するアンプリコンの実質的クローン集団をそれぞれが含む複数の増幅部位を生成するステップを含む方法を使用して作製され得る。一部の実施形態では、増幅反応は、各増幅部位の容量を満たすのに十分な数のアンプリコンが生成されるまで進行する。このようにすでに播種された部位が容量まで満たされると、標的核酸が、その部位に着地して増幅され、それによりその部位でアンプリコンのクローン集団が生成されることは妨げられる。一部の実施形態では、増幅部位が容量まで満たされていなくても、第2標的核酸がその部位に到達する前に、見かけのクローン性は達成され得る。いくつかの条件下では、第1標的核酸の増幅は、十分な数のコピーが、その部位に輸送される第2標的核酸からのコピーの生成を効率的に打ち負かすまたは圧倒するほど作成されるまで、進行し得る。例えば、直径が500nmより小さい円形フィーチャ上で架橋増幅プロセスを使用する実施形態では、第1標的核酸の指数関数的増幅を14サイクル行った後、同じ部位での第2標的核酸による汚染では、不十分な数の汚染性アンプリコンしか生成されず、Illuminaシーケンシングプラットフォームでのシーケンシング・バイ・シンセシス解析に悪影響を及ぼすことはないことが分かっている。
一部の実施形態では、アレイの増幅部位は、完全にクローン性である場合もあるが、必ずしもそうである必要はない。むしろ、いくつかの用途では、個々の増幅部位には、第1の二重インデックス断片由来のアンプリコンが主に集合するが、該部位は、第2標的核酸由来の低レベルの汚染性アンプリコンも有し得る。アレイは、汚染レベルが、その後のアレイの使用に許容できない影響を与えない限り、低レベルの汚染性アンプリコンを有する1つまたは複数の増幅部位を有し得る。例えば、アレイが検出用途で使用される場合、許容される汚染レベルとは、ノイズに対する信号または検出技法の分解能に、許容できない形では影響を与えることがないレベルである。したがって、見かけのクローン性は、概して、本明細書に記載する方法によって作成されたアレイの特定の使用または用途に関係がある。特定の用途のために、個々の増幅部位で許容され得る例示的な汚染レベルとしては、限定するわけではないが、多くても0.1%、0.5%、1%、5%、10%、または25%汚染性アンプリコンが挙げられる。アレイは、これらの例示的なレベルの汚染性アンプリコンを有する1つまたは複数の増幅部位を含み得る。例えば、アレイの増幅部位の最大5%、10%、25%、50%、75%、またはさらには100%が、いくつかの汚染性アンプリコンを有し得る。アレイまたは他の部位集合において、少なくとも50%、75%、80%、85%、90%、95%、または99%、またはそれ以上の部位がクローン性であるかまたは見かけ上クローン性であり得ることが理解されよう。
一部の実施形態では、プロセスが、別の事象またはプロセスが起きるのを効果的に排除するのに十分な速い速度で起きる場合に、動力学的排除は起こり得る。アレイの部位に溶液からの二重インデックス断片がランダムに播種され、二重インデックス断片のコピーが増幅プロセスで生成されて播種された各部位を容量まで満たす、核酸アレイの作成を例にとる。本開示の動力学的排除法では、播種および増幅プロセスは、増幅速度が播種速度を超える条件下で、同時に進み得る。したがって、第1標的核酸が播種された部位でコピーが作成される比較的速い速度は、第2核酸が増幅のためにその部位に播種されることを効果的に排除するだろう。動力学的排除増幅方法は、米国特許出願公開第2013/0338042号明細書の開示に詳細に記載されているように実行され得る。
動力学的排除は、増幅を開始する比較的遅い速度(例えば、二重インデックス断片の第1コピーを作成する遅い速度)対二重インデックス断片の(または、二重インデックス断片の第1コピー)の後続のコピーを作成する比較的速い速度を利用することが可能である。前段落の例では、動力学的排除は、二重インデックス断片播種の比較的遅い速度(例えば、比較的遅い拡散または輸送)対二重インデックス断片シードのコピーで部位を満たすように増幅が起きる比較的速い速度に起因して起きる。別の例示的な実施形態では、動力学的排除は、部位に播種された二重インデックス断片の第1コピーの形成の遅れ(例えば、活性化の遅れまたは遅い活性化)対後続のコピーが部位を満たすように作成される比較的速い速度に起因して起き得る。この例では、個々の部位は、いくつかの異なる二重インデックス断片で播種されている場合がある(例えば、いくつかの二重インデックス断片が、増幅前の各部位に存在し得る)。しかしながら、任意の所与の二重インデックス断片の第1コピーの形成がランダムに活性化され、その結果、第1コピー形成の平均速度が、後続のコピーが生成される速度と比較して比較的遅くなる場合がある。この場合、個々の部位にいくつかの異なる二重インデックス断片が播種されている場合もあるが、動力学的排除により、その二重インデックス断片の1つのみを増幅することが可能になろう。より具体的には、いったん第1の二重インデックス断片が増幅のために活性化されると、部位は迅速にそのコピーで容量まで満たされ、それにより、第2の二重インデックス断片のコピーが、その部位で作成されるのは妨げられよう。
一実施形態では、本方法は、(i)二重インデックス断片を平均輸送速度で増幅部位に輸送することと、(ii)増幅部位にある二重インデックス断片を平均増幅速度で増幅することが同時に実行され、ここにおいて、平均増幅速度は、平均輸送速度を上回る(米国特許第9169513号明細書)。したがって、動力学的排除は、比較的遅い輸送速度を使用することにより、斯かる実施形態で達成され得る。例えば、所望の平均輸送速度を達成するために、十分に低い濃度の標的核酸が選択され得、低濃度ほど、遅い平均輸送速度をもたらす。あるいはまたはさらに、輸送速度を低下させるために、高粘度溶液および/または溶液における分子密集試薬の存在が使用され得る。有用な分子密集試薬の例としては、限定するわけではないが、ポリエチレングリコール(PEG)、フィコール、デキストランまたはポリビニルアルコールが挙げられる。例示的な分子密集試薬および製剤は、米国特許第7399590号明細書に記載されており、これは参照により本明細書に組み込まれるものとする。所望の輸送速度を達成するために調整され得る別の因子は、標的核酸の平均サイズである。
増幅試薬は、アンプリコン形成を促進する、いくつかの場合では、アンプリコン形成の速度を増大させるさらなる成分を含み得る。一例は、リコンビナーゼである。リコンビナーゼは、反復侵入/伸長を可能にすることによりアンプリコン形成を促進し得る。より具体的には、リコンビナーゼは、ポリメラーゼによる二重インデックス断片の侵入と、アンプリコン形成の鋳型として二重インデックス断片を使用するポリメラーゼによるプライマーの伸長を促進し得る。このプロセスは、侵入/伸長の各ラウンドから生成されたアンプリコンが、後続のラウンドで鋳型として機能する連鎖反応として反復され得る。このプロセスは、変性サイクル(例えば、加熱または化学変性による)が必要ではないため、標準PCRよりも迅速に起こり得る。したがって、リコンビナーゼによって促進される増幅は、等温で実施され得る。増幅を促進するためには、リコンビナーゼによって促進される増幅試薬中に、ATPまたは他のヌクレオチド(またはいくつかの場合では、その非加水分解性類似体)を含むことが概して望ましい。リコンビナーゼおよび一本鎖結合(SSB)タンパク質の混合物は、SSBが増幅をさらに促進し得るため、特に有用である。リコンビナーゼによって促進される増幅用の例示的な製剤としては、TwistDx(英国ケンブリッジ)よりTwistAmpキットとして商業的に販売されているものが挙げられる。リコンビナーゼによって促進される増幅試薬の有用な成分および反応条件は、米国特許第5223414号明細書および同第7399590号明細書に記載されている。
アンプリコン形成を促進する、いくつかの場合では、アンプリコン形成速度を増大させるために増幅試薬中に含まれ得る成分の別の例は、ヘリカーゼである。ヘリカーゼは、アンプリコン形成の連鎖反応を可能にすることによってアンプリコン形成を促進し得る。このプロセスは、変性サイクル(例えば、加熱または化学的変性による)が必要ではないため、標準PCRよりも迅速に起き得る。したがって、ヘリカーゼによって促進される増幅は、等温で実施され得る。ヘリカーゼおよび一本鎖結合(SSB)タンパク質の混合物は、SSBが増幅をさらに促進し得るため特に有用である。ヘリカーゼによって促進される増幅のための例示的な製剤としては、Biohelix(マサチューセッツ州ビバリー)からIsoAmpキットとして商業的に販売されているものが挙げられる。さらに、ヘリカーゼタンパク質を含む有用な製剤の例は、米国特許第7399590号明細書および同第7829284号明細書に記載されている。
アンプリコン形成を促進する、いくつかの場合では、アンプリコン形成速度を増大させるために増幅試薬中に含まれ得る成分のさらに別の例は、起点結合タンパク質である。
二重インデックス断片の表面への付着に続き、固定化され、増幅された二重インデックス断片の配列が決定される。シーケンシングは、任意の適切なシーケンシング技法を使用して実行され、鎖の再合成を含んだ、固定化され増幅された二重インデックス断片の配列を決定する方法は、当技術分野で既知であり、例えば、Bignell et al.(米国特許第8053192号明細書)、Gunderson et al.(国際公開第2016/130704号)、Shen et al.(米国特許第8895249号明細書)、およびPipenburg et al.(米国特許第9309502号明細書)に記載されている。
本明細書で記載する方法は、種々の核酸シーケンシング技法と併せて使用することが可能である。特に適用可能な技法は、核酸が、その相対位置が変化しないようにアレイ中の固定された場所に付着し、そのアレイが繰り返し撮像されるものである。例えば、あるヌクレオチド塩基種を別のものと識別するのに使用される異なる標識と符号する、異なる色チャネルで画像が得られる実施形態が、特に適用可能である。一部の実施形態では、二重インデックス断片のヌクレオチド配列を決定するプロセスは、自動化プロセスであり得る。好適な実施形態には、シーケンシング・バイ・シンセシス(「SBS」)技法が含まれる。
SBS技法は、概して、鋳型鎖に対するヌクレオチドの反復付加により、新生核酸鎖を酵素的に伸長させることを伴う。SBSの従来の方法では、単一ヌクレオチドモノマーが、各送達において、ポリメラーゼの存在下で標的ヌクレオチドに供与され得る。しかしながら、本明細書に記載の方法では、2種類以上のヌクレオチドモノマーを、各送達において、ポリメラーゼの存在下で標的核酸に供与することが可能である。
一実施形態では、ヌクレオチドモノマーは、ロックド核酸(LNA)または架橋核酸(BNA)を含む。ヌクレオチドモノマーにおいてLNAまたはBNAを使用することにより、ヌクレオチドモノマーと、固定化二重インデックス断片に存在するシーケンシングプライマー配列とのハイブリダイゼーション強度が高まる。
SBSは、ターミネーター部分を有するヌクレオチドモノマーを使用する場合もあるし、ターミネーター部分を欠くヌクレオチドモノマーを使用する場合もある。ターミネーターを欠くヌクレオチドモノマーを使用する方法としては、例えば、パイロシーケンシング、および、本明細書でさらに詳細に記載する、γ-リン酸標識ヌクレオチドを使用するシーケンシングが挙げられる。ターミネーターを欠くヌクレオチドモノマーを使用する方法では、各サイクルで付加されるヌクレオチドの数は、一般的に可変であり、鋳型配列およびヌクレオチド送達方法に左右される。ターミネーター部分を有するヌクレオチドモノマーを利用するSBS技法では、ターミネーターは、ジデオキシヌクレオチドを利用する従来のSangerシーケンシングの場合のように、使用されるシーケンシング条件下で効果的に不可逆的である場合もあるし、ターミネーターは、Solexa(現Illumina,Inc.)により開発されたシーケンシング法の場合のように、可逆的である場合もある。
SBS技法は、標識部分を有するヌクレオチドモノマーを使用する場合もあるし、標識部分を欠くヌクレオチドモノマーを使用する場合もある。したがって、標識の蛍光などの標識の特徴;分子量または電荷などのヌクレオチド分子の特徴;ピロリン酸の放出などのヌクレオチド組み込みの副産物;等に基づいて、組込み事象が検出され得る。2つ以上の異なるヌクレオチドがシーケンシング試薬に存在する実施形態では、異なるヌクレオチドは、互いに識別可能である場合もあるし、あるいは、2つ以上の異なる標識は、使用される検出技法下では識別不能である場合もある。例えば、シーケンシング試薬中に存在する異なるヌクレオチドは異なる標識を有し得、それらはSolexa(現Illumina,Inc.)により開発されたシーケンシング法により例示されるような適切な光学系を使用して識別することが可能である。
好適な実施形態には、パイロシーケンシング技法が含まれる。パイロシーケンシングは、特定のヌクレオチドが新生鎖に組み込まれたときの無機ピロリン酸(PPi)の放出を検出する(Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) “Real-time DNA sequencing using detection of pyrophosphate release.” Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) “Pyrosequencing sheds light on DNA sequencing. " Genome Res. 11(1), 3-11; Ronaghi, M., Uhlen, M. and Nyren, P. (1998) “A sequencing method based on real-time pyrophosphate. ", Science 281(5375), 363;米国特許第6210891号明細書;同第6258568号明細書、および同第6274320号明細書)。パイロシーケンシングでは、放出されたPPiは、ATPスルフリラーゼによってアデノシン三リン酸(ATP)に直ちに変換されることによって検出され得、生成されたATPのレベルがルシフェラーゼ産生光子を介して検出される。配列決定される核酸は、アレイにおいてフィーチャに付着し得、アレイは、アレイのフィーチャにおけるヌクレオチドの組み込みに起因して生成される化学発光シグナルを捕捉するように画像化され得る。画像は、アレイを特定のヌクレオチド種(例えば、A、T、C、またはG)により処理した後で得られる。各ヌクレオチド種の付加後に得られる画像は、アレイ内のどのフィーチャが検出されたかという点で異なる。画像内のこれらの違いは、アレイ上のフィーチャの異なる配列内容を反映している。しかしながら、各フィーチャの相対的な位置は、画像において不変である。画像は、本明細書に記載の方法を使用して保存、処理、および解析することが可能である。例えば、アレイをそれぞれ異なるヌクレオチド種で処理した後で得られる画像は、可逆的ターミネーターをベースにしたシーケンシング法のための異なる検出チャネルから得られる画像について本明細書で例示するのと同じ方法で、扱うことが可能である。
別の例示的な種類のSBSにおいて、サイクルシーケンシングは、例えば、国際公開第04/018497号および米国特許第7057026号明細書に記載されるように、例えば、切断可能または光脱色可能な色素標識を含有する可逆的ターミネーターヌクレオチドの段階的な付加により達成される。このアプローチは、Solexa(現Illumina,Inc.)により商品化されており、また、国際公開第91/06678号および同第07/123744号にも記載されている。両方の終結が可逆的である蛍光標識ターミネーターと、切断される蛍光標識が利用可能であることは、効率的な周期性可逆的終結(cyclic reversible termination、CRT)シーケンシングを容易にする。ポリメラーゼはまた、これらの修飾ヌクレオチドを効率的に組み込み、その修飾ヌクレオチドから伸長するように同時操作することが可能である。
可逆的ターミネーターをベースにしたシーケンシングのいくつかの実施形態では、標識はSBS反応の条件下では、伸長を実質的に阻害しない。しかしながら、検出標識は、例えば切断または分解により除去可能である。画像は、標識がアレイ化された核酸フィーチャに組み込まれた後に取得され得る。特定の実施形態において、各サイクルは、4つの異なるヌクレオチド種を同時にアレイに送達することを含み、各ヌクレオチド種はスペクトルが異なる標識を有する。次いで、4つの異なる標識の1つに対し選択的な検出チャネルをそれぞれ使用して、4つの画像を得ることが可能である。あるいは、異なるヌクレオチド種を順次付加し、各付加ステップの間でアレイの画像を取得することが可能である。斯かる実施形態では、各画像は、特定の種類のヌクレオチドを組み込んだ核酸フィーチャを示すだろう。各フィーチャの配列内容が異なるため、異なる画像には、異なるフィーチャが存在または欠如するだろう。しかしながら、フィーチャの相対的な位置は画像において不変であろう。斯かる可逆的ターミネーター-SBS法により得られる画像は、本明細書に記載するように、保存、処理、および解析することが可能である。画像取得ステップに続き、後続のヌクレオチドの付加および検出サイクルのために、標識を除去し、可逆的ターミネーター部分を除去することが可能である。標識が特定のサイクルで検出された後かつ後続のサイクルの前で標識を除去することは、バックグランドシグナルとサイクル間のクロストークを減少させるという利点をもたらし得る。有用な標識および除去方法の例を以下に記載する。
特定の実施形態において、一部またはすべてのヌクレオチドモノマーは可逆的ターミネーターを含み得る。斯かる実施形態では、可逆的ターミネーター/切断可能フルオロフォアは、3´エステルリンケージを介してリボース部分に結合したフルオロフォアを含み得る(Metzker, Genome Res. 15:1767-1776 (2005))。他のアプローチは、ターミネーターの化学作用を蛍光標識の切断から切り離した(Ruparel et al., Proc Natl Acad Sci USA 102: 5932-7 (2005))。Ruparelらは、小さい3´アリル基を用いて伸長をブロックするが、パラジウム触媒を用いた手短な処理により容易に脱ブロック化できる、可逆的ターミネーターの開発について記載した。フルオロフォアを、長波長UV光に30秒当てることによって容易に切断され得る光切断可能なリンカーを介して塩基に付着させた。したがって、ジスルフィド還元または光切断の何れかを光切断可能なリンカーとして使用することが可能である。可逆的終結に対する別のアプローチは、dNTPに大量の色素を配置した後に起きる自然な終結を用いるものである。dNTPにおける帯電した大量の色素の存在は、立体障害および/または静電的障害を通して効果的なターミネーターとして作用し得る。色素が除去されない限り、1つの組み込み事象の存在によりさらなる組み込みが妨げられる。色素の切断によりフルオロフォアは除去され、終結は効果的に反転させられる。修飾ヌクレオチドの例は、米国特許第7427673号明細書および同第7057026号明細書にも記載されている。
本明細書に記載の方法およびシステムと共に利用することが可能な追加の例示的なSBSシステムおよび方法は、米国特許出願公開第2007/0166705号明細書、同第2006/0188901号明細書、同第2006/0240439号明細書、同第2006/0281109号明細書、同第2012/0270305号明細書、および同第2013/0260372号明細書、米国特許第7057026号明細書、国際公開第05/065814号、米国特許出願公開第2005/0100900号明細書、ならびに国際公開第06/064199号および同第07/010251号に記載されている。
一部の実施形態は、4つ未満の異なる標識を用いた4つの異なるヌクレオチドの検出を使用され得る。例えば、SBSは、米国特許出願公開第2013/0079232号明細書に組み込まれた資料に記載された方法およびシステムを使用して実行することが可能である。第1の例として、ヌクレオチド種の対は同じ波長で検出され得るが、これは、該対のうち一方の強度をもう一方と比較した差に基づいて、または、目に見えるシグナルの出現または消失を引き起こす(例えば、化学的修飾、光化学的修飾、または物理的修飾を介した)該対の一方の変化と、該対のもう一方で検出されるシグナルとの比較に基づいて、識別することが可能である。第2の例としては、4つの異なるヌクレオチド種のうち3つが特定の条件下において検出され得る一方で、4番目のヌクレオチド種は、該条件下で検出可能な標識を欠くか、または、該条件下では最小限にしか検出されない(例えば、バックグランド蛍光などによる最小限の検出)。最初の3つのヌクレオチド種の核酸への組み込みは、その個々のシグナルの存在に基づき求めることが可能であり、4番目のヌクレオチド種の核酸への組み込みは、任意のシグナルの欠如または該シグナルの最小限の検出に基づき求めることが可能である。第3の例としては、1つのヌクレオチド種が、2つの異なるチャネルで検出される標識を含み得るのに対し、他のヌクレオチド種は各チャネルの1つのみで検出される。上記3つの例示的な構成は互いに排他的であるとはみなされず、種々の組み合わせで使用することが可能である。3つの例を全て組み合わせる例示的な実施形態は、第1チャネルで検出される第1ヌクレオチド種(例えば、第1励起波長により励起された場合に第1チャネルにおいて検出される標識を有するdATP)と、第2チャネルで検出される第2ヌクレオチド種(例えば、第2励起波長により励起された場合に第2チャネルにおいて検出される標識を有するdCTP)と、第1チャネルおよび第2チャネルの両方で検出される第3ヌクレオチド種(例えば、第1および/または第2励起波長により励起された場合に両チャネルにおいて検出される標識を少なくとも1つ有するdTTP)と、いずれのチャネルでも検出されないか、または最小限のみ検出される、標識を欠く第4のヌクレオチド種(例えば、標識を持たないdGTP)を用いる、蛍光ベースのSBS法である。
さらに、米国特許出願公開第2013/0079232号明細書に組み込まれた資料に記載されているように、シーケンシングデータは、単一チャネルを用いて得ることが可能である。このようないわゆる一色素シーケンシングアプローチでは、第1ヌクレオチド種は標識化されるが、該標識は第1画像が生成された後で除去され、第2ヌクレオチド種は第1画像が生成されて初めて標識化される。第3ヌクレオチド種は、第1画像および第2画像の両方でその標識を保持し、第4ヌクレオチド種は両画像で標識化されないままである。
一部の実施形態は、ライゲーション技法によるシーケンシングを使用することが可能である。斯かる技法は、DNAリガーゼを使用してオリゴヌクレオチドを組み込み、そのオリゴヌクレオチドの組み込みを特定する。オリゴヌクレオチドは、典型的には、そのオリゴヌクレオチドがハイブリダイズする配列の特定のヌクレオチドの同一性と相関する異なる標識を有する。他のSBS法と同様に、画像を、核酸フィーチャのアレイを標識化シーケンシング試薬で処置した後で得ることが可能である。各画像は、組み込まれた特定の種類の標識を有する核酸フィーチャを示すだろう。各フィーチャの配列内容が異なるために、異なる画像には異なるフィーチャが存在または欠如するだろうが、フィーチャの相対的位置は、画像において不変であろう。ライゲーションをベースとするシーケンシング法により得られる画像は、本明細書に記載するように保存、処理、および解析することが可能である。本明細書に記載の方法およびシステムとともに利用することが可能な例示的なSBSシステムおよび方法は、米国特許第6969488号明細書、同第6172218号明細書、および同第6306597号明細書に記載されている。
一部の実施形態は、ナノポアシーケンシングを使用することが可能である(Deamer, D. W. & Akeson, M. “Nanopores and nucleic acids: prospects for ultrarapid sequencing. " Trends Biotechnol. 18, 147-151 (2000);Deamer, D. and D. Branton, “Characterization of nucleic acids by nanopore analysis”, Acc. Chem. Res. 35:817-825 (2002);Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, “DNA molecules and configurations in a solid-state nanopore microscope” Nat. Mater. 2:611-615 (2003))。斯かる実施形態では、二重インデックス断片はナノポアを通過する。ナノポアは、合成ポアまたはα-ヘモリシンなどの生体膜タンパク質であり得る。二重インデックス断片がナノポアを通過する際、ポアの電気コンダクタンスの変動を測定することにより、各塩基対を特定することが可能である。(米国特許第7001792号明細書;Soni, G. V. & Meller, “A. Progress toward ultrafast DNA sequencing using solid-state nanopores.” Clin. Chem. 53, 1996-2001 (2007);Healy, K. “Nanopore-based single-molecule DNA analysis.” Nanomed. 2, 459-481 (2007);Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. “A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution. " J. Am. Chem. Soc. 130, 818-820 (2008))。ナノポアシーケンシングにより得られるデータは、本明細書に記載するように保存、処理、および解析することが可能である。特にデータは、本明細書に記載する光学画像および他の画像の例示的処理に従って、画像として処理することが可能である。
一部の実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を使用することが可能である。ヌクレオチドの組み込みは、例えば米国特許第7329492号明細書および同第7211414号明細書に記載されているように、フルオロフォア担持ポリメラーゼとγ-ホスフェート標識ヌクレオチドの間の蛍光共鳴エネルギー移動(FRET)の相互作用を介して検出することが可能であり、または、ヌクレオチドの組み込みは、例えば米国特許第7315019号明細書に記載されているようにゼロモード導波路を用いて、ならびに、例えば米国特許第7405281号明細書および米国特許出願公開第2008/0108082号明細書に記載されているように、蛍光ヌクレオチド類似体および操作ポリメラーゼを用いて、検出することが可能である。照射は、蛍光標識ヌクレオチドの組み込みを低バックグラウンドで観察することが可能であるように、表面結合ポリメラーゼの周りのゼプトリットルスケールの体積に制限することが可能である(Levene, M. J. et al. “Zero-mode waveguides for single-molecule analysis at high concentrations. " Science 299, 682-686 (2003);Lundquist, P. M. et al. “Parallel confocal detection of single molecules in real time.” Opt. Lett. 33: 1026-1028 (2008);Korlach, J. et al. “Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures.” Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)).斯かる方法で得られた画像は、本明細書に記載するように保存、処理および解析することが可能である。
いくつかのSBS実施形態には、ヌクレオチドが伸長産物に組み込まれる際に放出されるプロトンの検出が含まれる。例えば、放出されたプロトンの検出に基づくシーケンシングは、Ion Torrent社(コネチカット州ギルフォード、Life Technologies社の子会社)より商業的に入手可能な電気検出器および関連技法、または、米国特許出願公開第2009/0026082号明細書、同第2009/0127589号明細書、同第2010/0137143号明細書、および同第2010/0282617号明細書に記載のシーケンシング法およびシステムを使用することが可能である。動力学的排除を使用して標的核酸を増幅する本明細書に記載の方法は、プロトンを検出するために使用される基板に容易に適用させることができる。より具体的には、本明細書に記載の方法を使用して、プロトンを検出するために使用されるアンプリコンのクローン集団を生成することが可能である。
上記のSBS法は、多数の異なる二重インデックス断片が同時に操作されるように、多重形式で有利に実行することが可能である。特定の実施形態では、異なる二重インデックス断片を共通の反応容器または特定の基板の表面で処理することが可能である。これは、シーケンシング試薬の簡便な送達、未反応試薬の除去、および組み込み事象を多重的に検出することを可能にする。表面結合した標的核酸を使用する実施形態では、二重インデックス断片はアレイ形式であり得る。アレイ形式では、二重インデックス断片は、典型的には、空間的に識別可能な方法で表面に結合し得る。二重インデックス断片は、直接的な共有結合、ビーズもしくは他の粒子への結合、または、表面に付着したポリメラーゼもしくは他の分子への結合により、結合し得る。アレイは、二重インデックス断片の単一コピーを各部位(フィーチャともいう)において含む場合もあるし、同一配列を有する多数のコピーが各部位またはフィーチャに存在する場合もある。多数のコピーは、以下にさらに詳細に記載するように、ブリッジ増幅またはエマルジョンPCRなどの増幅法により生成され得る。
本明細書に記載の方法は、例えば、少なくとも約10フィーチャ/cm、100フィーチャ/cm、500フィーチャ/cm、1,000フィーチャ/cm、5,000フィーチャ/cm、10,000フィーチャ/cm、50,000フィーチャ/cm、100,000フィーチャ/cm、1,000,000フィーチャ/cm、5,000,000フィーチャ/cm、またはそれより高いものを含む、任意の種々の密度でフィーチャを有するアレイを使用することが可能である。
本明細書に記載の方法の利点は、該方法が、複数のcmの迅速かつ効率的な検出を並行して行うことである。したがって、本開示は、本明細書で例示したものなどの当技術分野で既知の技法を使用して核酸を調製および検出することが可能な、統合システムを提供する。したがって、本開示の統合システムは、増幅試薬および/またはシークエンシング試薬を1つまたは複数の固定化された二重インデックス断片に送達することが可能な流体コンポーネントを備えることができ、該システムは、ポンプ、バルブ、リザーバ、および流体ラインなどコンポーネントを備える。フローセルは、標的核酸の検出用統合システムにおいて構成および/または使用され得る。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768号明細書および米国特許出願番号第13/273666号明細書に記載されている。フローセルで例示されるように、統合システムの1つまたは複数の流体コンポーネントを、増幅法と検出法に使用することが可能である。核酸シーケンシングの実施形態を例にとると、統合システムの1つまたは複数の流体コンポーネントは、本明細書に記載の増幅法と、上記で例示するようなシーケンシング法におけるシーケンシング試薬の送達に使用することが可能である。あるいは、統合システムは、増幅法を実行するためおよび検出法を実行するための、別個の流体システムを備えることが可能である。増幅核酸を作成し、核酸配列を決定することも可能な統合シーケンシングシステムの例としては、限定するわけではないが、MiSeq(商標)プラットフォーム(Illumina,Inc.、カリフォルニア州サンディエゴ)、および米国特許出願番号13/273666号明細書に記載されている装置が挙げられる。
本明細書では、組成物も提供する。本明細書に記載の方法の実施時に、種々の組成物が生じ得る。例えば、化学的に処理されたヌクレオソーム除去単離核を含み、該単離核はインデックス付き核酸断片を含む、組成物が生じ得る。また、マルチウェルプレートも提供するが、ここで、該マルチウェルプレートのウェルは、インデックス付き核酸断片を有する単離核を含む。一実施形態では、単離核は、架橋剤、例えばホルムアルデヒドにより形成される種類の架橋などの、非天然架橋を含み得る。一実施形態では、インデックス付き核酸断片は、オーバーハングを有する切断制限部位において終端する。一実施形態では、単離核は、再編成ゲノムDNAを含む。
実施形態
実施形態1.複数の単細胞に由来する核酸を含むシーケンシングライブラリを調製する方法であって:
(a)複数の細胞から単離核を提供するステップと;
(b)前記単離核の完全性を維持しながら、前記単離核を化学処理にかけてヌクレオソーム除去核を生成するステップと;
(c)前記ヌクレオソーム除去核のサブセットを、第1の複数のコンパートメントに分配し、各サブセットをトランスポソーム複合体と接触させるステップであって、各コンパートメントの前記トランスポソーム複合体は、トランスポザーゼと第1インデックス配列を含み、該第1インデックス配列はその他のコンパートメントの第1インデックス配列とは異なる、ステップと;
(d)前記ヌクレオソーム除去核のサブセット中の核酸を複数の核酸断片に断片化し、前記第1インデックする配列を、前記核酸断片の少なくとも1つの鎖に組み込んで、インデックス付き核酸断片を含んだインデックス付き核を生成するステップであって、前記インデックス付き核酸断片は、トランスポザーゼに付着したままである、ステップと;
(e)前記インデックス付き核を組み合わせてプールされたインデックス付き核を生成するステップと;
(f)前記プールされたインデックス付き核のサブセットを、第2の複数のコンパートメントに分配するステップと;
(g)各コンパートメントの前記インデックス付き核酸断片に第2インデックス配列を組み込んで、二重インデックス断片を生成するステップであって、各コンパートメントの前記第2インデックス配列は、その他のコンパートメントの第2インデックス配列とは異なる、ステップと;
(h)前記二重インデックス断片を組み合わせることにより、前記複数の単細胞に由来する全ゲノム核酸を含むシーケンシングライブラリを生成するステップとを含む、方法。
実施形態2.前記化学処理には、核酸-タンパク質の相互作用を阻害することが可能なカオトロピック剤を用いた処理が含まれる、実施形態1の方法。
実施形態3.前記カオトロピック剤は、リチウム3,5-ジヨードサリチル酸を含む、実施形態2または3の方法。
実施形態4.前記化学処理には、核酸-タンパク質の相互作用を阻害することが可能な界面活性剤を用いた処理が含まれる、実施形態1~3の何れかの方法。
実施形態5.前記界面活性剤にはドデシル硫酸ナトリウム(SDS)が含まれる、実施形態1~4の何れかの方法。
実施形態6.前記核は、ステップ(b)の前に架橋剤で処理される、実施形態1~5の何れかの方法。
実施形態7.前記架橋剤はホルムアルデヒドである、実施形態1~6の何れかの方法。
実施形態8.前記ホルムアルデヒドの濃度は、約0.2%~約2%の範囲である、実施形態1~7の何れかの方法。
実施形態9.前記ホルムアルデヒドの濃度は約1.5%以下である。実施形態1~8の何れかの方法。
実施形態10.ホルムアルデヒドによる前記架橋は、ステップ(f)の後とステップ(g)の前に逆転される、実施形態1~9の何れかの方法。
実施形態11.前記架橋の逆転には、約55℃~約72℃でのインキュベートを含む、実施形態1~10の何れかの方法。
実施形態12.前記トランスポザーゼは、前記架橋の逆転の前に前記インデックス付き核酸断片から解離される、実施形態1~11の何れかの方法。
実施形態13.前記トランスポザーゼは、ドデシル硫酸ナトリウム(SDS)を使用して前記インデックス付き核酸断片から解離される、実施形態1~12の何れかの方法。
実施形態14.前記核はステップ(d)の前に制限酵素で処理される、実施形態1~13の何れかの方法。
実施形態15.前記核は、前記制限酵素での処理の後、リガーゼで処理される、実施形態1~14の何れかの方法。
実施形態16.ステップ(c)および(f)における分配は、蛍光活性化核ソーティングにより実行される、実施形態1~15の何れかの方法。
実施形態17.前記ヌクレオソーム除去核のサブセットは、ほぼ等しい数の核を含む、実施形態1~16の何れかの方法。
実施形態18.前記ヌクレオソーム除去核のサブセットは、1~約2000個の核を含む、実施形態1~17の何れかの方法。
実施形態19.前記第1の複数のコンパートメントはマルチウェルプレートである、実施形態1~18の何れかの方法。
実施形態20.前記マルチウェルプレートは96ウェルプレートまたは384ウェルプレートである、実施形態1~19の何れかの方法。
実施形態21.前記プールされたインデックス付き核のサブセットは、ほぼ等しい数の核を含む、実施形態1~20の何れかの方法。
実施形態22.前記プールされたインデックス付き核のサブセットは、1~約25個の核を含む、実施形態1~21の何れかの方法。
実施形態23.前記プールされたインデックス付き核のサブセットに含まれる核は、前記ヌクレオソーム除去核のサブセットの少なくとも10分の1である、実施形態1~22の何れかの方法。
実施形態24.前記プールされたインデックス付き核のサブセットに含まれる核は、前記ヌクレオソーム除去核のサブセットの少なくとも100分の1である、実施形態1~23の何れかの方法。
実施形態25.前記第2の複数のコンパートメントはマルチウェルプレートである、実施形態1~24の何れかの方法。
実施形態26.前記マルチウェルプレートは96ウェルプレートまたは384ウェルプレートである、実施形態1~25の何れかの方法。
実施形態27.ステップ(c)は、前記ヌクレオソーム除去核のサブセットが分配された後、前記トランスポソーム複合体を前記コンパートメントに加えるステップを含む、実施形態1~26の何れかの方法。
実施形態28.前記トランスポソーム複合体はそれぞれトランスポゾンを含み、前記トランスポゾンはそれぞれ転移鎖を含む、実施形態1~27の何れかの方法。
実施形態29.前記転移鎖は、前記第1インデックス配列と、第1ユニバーサル配列を含む、実施形態1~28の何れかの方法。
実施形態30.ステップ(g)における第2インデックス配列の組み込みは、各コンパートメントの前記インデックス付き核酸断片を、第1ユニバーサルプライマーおよび第2ユニバーサルプライマーに接触させるステップであって、前記第1ユニバーサルプライマーおよび第2ユニバーサルプライマーはそれぞれインデックス配列を含み、それぞれ前記第1ユニバーサル配列の一部と同一または相補的な配列を含む、ステップと、指数関数的増幅反応を実施するステップとを含む、実施形態1~29の何れかの方法。
実施形態31.前記第1ユニバーサルプライマーのインデックス配列は、前記第2ユニバーサルプライマーのインデックス配列の逆相補体である、実施形態1~30の何れかの方法。
実施形態32.前記第1ユニバーサルプライマーのインデックス配列は、前記第2ユニバーサルプライマーのインデックス配列の逆相補体とは異なる、実施形態1~31の何れかの方法。
実施形態33.前記第1ユニバーサルプライマーは、さらに、第1捕捉配列と、前記二重インデックス断片の3´末端のユニバーサル配列に対し相補的な第1アンカー配列とを含む、実施形態1~32の何れかの方法。
実施形態34.前記第1捕捉配列は、P5プライマー配列を含む、実施形態1~33の何れかの方法。
実施形態35.前記第2ユニバーサルプライマーは、さらに、第2捕捉配列と、前記二重インデックス断片の5´末端のユニバーサル配列に対し相補的な第2アンカー配列とを含む、実施形態1~34の何れかの方法。
実施形態36.前記第2捕捉配列は、P7プライマー配列の逆相補体を含む、実施形態1~35の何れかの方法。
実施形態37.前記指数関数的増幅反応には、ポリメラーゼ連鎖反応(PCR)が含まれる、実施形態1~36の何れかの方法。
実施形態38.前記PCRは15~30サイクルを含む、実施形態1~37の何れかの方法。
実施形態39.前記二重インデックス断片に対し特異性を有する複数の捕捉オリゴヌクレオチドを使用した、二重インデックス断片の濃縮をさらに含む、実施形態1~38の何れかの方法。
実施形態40.前記捕捉オリゴヌクレオチドは、固体基板の表面に固定化される、実施形態1~39の何れかの方法。
実施形態41.前記捕捉オリゴヌクレオチドは、ユニバーサル結合対の第1メンバーを含み、前記結合対の第2メンバーは固体基板の表面に固定化される、実施形態1~40の何れかの方法。
実施形態42.前記二重インデックス断片をシーケンシングして、前記複数の単細胞に由来する核酸のヌクレオチド配列を決定するステップをさらに含む、実施形態1~42の何れかの方法。
実施形態43.
複数の増幅部位を含む表面を提供するステップであって、前記増幅部位は、遊離3´末端を有する付着した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含む、ステップと;
増幅部位を含む前記表面を、個々の二重インデックス断片からのアンプリコンのクローン集団をそれぞれが含む複数の増幅部位を生成するのに適切な条件下で、前記二重インデックス断片と接触させるステップをさらに含む、実施形態1~42の何れかの方法。
実施形態44.前記二重インデックス断片の数は、増幅部位の数を上回り、前記二重インデックス断片は前記増幅部位に流体アクセスし、前記増幅部位にはそれぞれ、前記シーケンシングライブラリ中のいくつかの二重インデックス断片のための容量がある、実施形態1~43の何れかの方法。
実施形態45.前記接触ステップは、(i)前記二重インデックス断片を平均輸送速度で前記増幅部位に輸送するステップと、(ii)前記増幅部位にある二重インデックス断片を平均増幅速度で増幅させるステップとを同時に含み、前記平均増幅速度は前記平均輸送速度を上回る、実施形態1~44の何れかの方法。
実施形態46.化学的に処理されたヌクレオソーム除去単離核を含み、前記単離核は、インデックス付き核酸断片を含む、組成物。
実施形態47.前記単離核は、非天然架橋を含む、実施形態46の組成物。
実施形態48.前記組成物は、オーバーハングを含む切断制限部位において終端するインデックス付き核酸断片を含む、実施形態46または47の何れかの組成物。
実施形態49.前記単離核は、再編成ゲノムDNAを含む、実施形態46~48の何れかの組成物。
実施形態50.ウェルが実施形態46~49の何れかの組成物を含む、マルチウェルプレート。
本開示は、以下の例により例示される。特定の例、材料、量、および手順は、本明細書に記載の開示内容の範囲および趣旨に従って、広く解釈されるべきであることを理解されたい。
実施例1
組み合わせインデックス付加を伴う、数千個の単細胞ゲノムの生成およびシーケンシング
単細胞ゲノムのシーケンシングは、特に腫瘍進化の文脈において、体細胞変異を検出するのに有益であることが分かっている。現在の技法は、ライブラリ構築が高コストであるという欠点を持ち、これにより評価可能な細胞数が制限され、その結果、組織内の不均一性を測定する機能が制限されている。ここで、単細胞組み合わせインデックス付加シーケンシング(Single cell Combinatorial Indexed Sequencing、SCI-seq)を、体細胞コピー数多型を検出するための、数千個のローパス単細胞ライブラリを同時に生成する手段として提示する。16,698個の単細胞のライブラリを、培養細胞株、霊長類の前頭皮質組織、および膵臓腫瘍内のサブクローン性変異の詳細な評価を含む、2つのヒト腺がんの組み合わせより構築した。この実施例は、または、Vitak et al. (2017, Nature Methods, 14, 302-308, doi: 10.1038/nmeth. 4154)としても入手可能である。
方法
サンプル調製および核の単離
組織培養細胞株を、接着性の場合は(HeLa S3、ATCC CCL-2.2;NIH/3T3、ATCC CRL-1658)、トリプシン処理してからペレット化し、懸濁液中で増殖させた場合は(GM12878、Coriell;OHSU Research Cytogenetics Laboratoryで核型分析済み)、ペレット化し、続いて、氷冷PBSで1回洗浄した。次いで、それらを架橋して(xSDS法の場合)または直接、ヌクレオソームを除去してまたは除去しないで、核単離緩衝液(NIB、10mM TrisHCl pH7.4、10mM NaCl、3mM MgCl、0.1% Igepal(登録商標)、1Xプロテアーゼ阻害剤(Roche,Cat.11873580001))を使用する核調製へ進めた。組織サンプル(RhesusFcx1,RhesusFcx2,PDAC,CRC)をNIB中でダウンスホモジナイズし、次に35μmの細胞ストレーナーに通してから、ヌクレオソームを除去した。アカゲザル凍結前頭皮質サンプルであるRhesusFcx1(4歳、メス)およびRhesusFcx2(9歳、メス)を、Oregon National Primate Research Centerより、加齢非ヒト霊長類リソースの一部として入手した。
標準的な単細胞ライブラリの構築
QRP(quasi-random priming)とDOP(degenerate oligonucleotide primed PCR)を使用して構築した単細胞ライブラリを、ヌクレオソームを除去せずに単離核から調製し、NIBで1mLとし、5μLの5mg/mL DAPI(Thermo Fisher,Cat.D1306)で染色し、次に、単細胞モードのSony SH800でFANSソーティングした。1つの核を、それぞれのサンプル緩衝液を含む各単一ウェルに置いた。QRPライブラリは、PicoPlex DNA-seq Kit(Rubicon Genomics,Cat.R300381)を製造業者のプロトコルに従って使用し、キットで提供されたインデックス付きPCRプライマーを使用して、調製した。DOPライブラリは、SeqPlex DNA増幅キット(Sigma,Cat.SEQXE-50RXN)を製造業者のプロトコルに従って使用し、ただし、10bpインデックス配列を含むカスタムPCRインデックス付きプライマーを使用して、調製した。過剰増幅を避けるため、増幅をモニタリングし、指数関数的増殖の半ばまで到達した反応を除去する目的で、全てのQRPライブラリとDOPライブラリを、BioRad CFXサーモサイクラーにおいて、0.5μLの100X SYBR Green(FMC BioProducts,Cat.50513)を付加して増殖させた。
ヌクレオソーム除去
リチウム補助ヌクレオソーム除去(LAND):調製した核をペレット化し、氷上で、5分間、200μLの12.5mMのリチウム3,5-ジヨードサリチル酸(本文では、ジヨードサリチル酸リチウムともいう、Sigma,Cat.D3635)を追加したNIBに再懸濁してから、800μLのNIBを加え、次いで、フローソーティングに直接かけた。
架橋およびSDSヌクレオソーム除去(xSDS):細胞を10mLの培地(細胞培養液)中で、または、核を、1.5%のホルムアルデヒドを含む10mLのHEPES NIB(20mM HEPES,10mM NaCl,3mM MgCl2,0.1%igepal(登録商標)、1Xプロテアーゼ阻害剤(Roche,Cat.11873580001))(組織サンプル)中で、室温で10分間インキュベートすることにより、架橋を達成した。架橋反応は、反応物を200mMのグリシン(Sigma,Cat.G8898-500G)に持っていき、氷上で5分間インキュベートすることにより中和させた。細胞培養サンプルを架橋し、次に、10mLの氷冷の1x PBSで1回洗浄し、氷上で20分間、NIB緩衝液中でインキュベートすることにより核を単離し、再度ペレット化した。次に、核を、0.3% SDS(Sigma,Cat.L3771)を有する800μLの1x NEBuffer 2.1(NEB,Cat.B7202S)に再懸濁し、サーモミキサー(Eppendorf)で30分間激しく振とうしながら42℃でインキュベートした。次に、SDSを、200μLの10%のTriton-X100(Sigma,Cat.9002-93-1)を加えることによりクエンチし、30分間激しく振とうしながら42℃でインキュベートした。
タグメンテーションおよびPCRを介した組み合わせインデックス付加
核を、5μLの5mg/mlのDAPI(Thermo Fisher,Cat.D1306)で染色し、35μmの細胞ストレーナーに通した。Nextera(登録商標)DNAサンプル調製キット(Illumina,Cat.FC-121-1031)の1x Nextera(登録商標)タグメントDNA(TD)緩衝液10μLを各ウェルにおいてNIBで希釈して、96ウェルプレートを準備した。Sony SH800フローソーターを使用して、迅速ソートモードで、2000個の単一核を96ウェルタグメンテーションプレートの各ウェルにソートした。次に、ユニークにインデックス付けした2.5μMトランスポザーゼ-アダプター複合体(トランスポソーム)1μLを、各ウェルに加えた。これらの複合体および関連する配列は、Amini et. al. (Amini, S. et al. Nat. Genet. 46,1343-9, 2014)に記載されている。反応物を55℃で15分間インキュベートした。室温まで冷却した後、全てのウェルをプールして、前記のようにDAPIで染色した。8.5μLの0.058%SDS、8.9nMのBSA溶液、および2.5μLの10μMの2つのユニークにバーコード化されたプライマー含む各ウェルを有する、第2の96ウェルプレートまたは96ウェルプレートのセットを準備した。次に、96個の反応のプールから、22個のタグメンテーション後の核を、同じ機器上で、ただし単細胞ソートモードで第2プレートの各ウェルにフローソートし、次に、55℃で5分間SDS溶液中でインキュベートして、核骨格を壊し、トランスポザーゼ酵素を解離させた。68℃で1時間インキュベートすることにより架橋を逆転させた(xSDS)。次に、Nextera(登録商標)PCR Master mix(Illumina,Cat.FC-121-1031)7.5μLならびに100x SYBR Green(FMC BioProducts,Cat.50513)0.5μLおよび水4μLを加えることにより、SDSを希釈した。次に、まず反応物を72℃で5分間、次に98℃で3分間インキュベートし、[98℃で20秒、63℃で15秒、および72℃で25秒]を15-20サイクル行うことにより、リアルタイムPCRをBioRad CFXサーモサイクラー上で実行した。反応をモニタリングし、指数関数的増幅がウェルの大部分で観察されたら、反応を止めた。次に、各ウェルの5μLをプールし、Qiaquick PCR精製カラム(Qiagen,Cat.28104)を使用して精製し、30μLのEBで溶出した。
ライブラリの定量化およびシーケンシング
ライブラリを、200bpおよび1kbpの範囲の間で、High Sensitivity Bioanalyzer kit(Agilent,Cat.5067-4626)において定量化した。ライブラリを、0.8pMをロードしたIllumina NextSeq(登録商標)500において、カスタムシーケンシングケミストリープロトコル(リード1:50イメージ化サイクル;インデックスリード1:8イメージ化サイクル、27ダークサイクル、10イメージ化サイクル;インデックスリード2:8イメージ化サイクル、21ダークサイクル、10イメージ化サイクル;リード2:50イメージ化サイクル)を用い、Amini et. al. (Amini, S. et al. Nat. Genet. 46,1343-9, 2014)に記載されるカスタムシーケンシングプライマーを使用して、シーケンシングした。QRPおよびDOPライブラリを、二重インデックス付加を伴うhigh-capacity 75サイクルキットを使用して、NextSeq(登録商標)500において、標準的なプライマーを使用して、シーケンシングした。QRPでは、リードの最初の15bpを「G」塩基について高度に濃縮するという追加の課題があるが、これは、NextSeq(登録商標)2色化学作用では蛍光性ではなく、そのため、機器におけるクラスタの特定はできない。そのため、この領域をスキップするカスタムシーケンシングプロトコルを使用して、ライブラリをシーケンシングした(リード1:15ダークサイクル、50イメージ化サイクル;インデックスリード1:10イメージ化サイクル;インデックスリード2:10イメージ化サイクル)。
シーケンシングリード処理
SCI-seqの生のリードを処理するソフトウェアは、World Wide Web上のsci-seq. sourceforge. netで入手可能である。シーケンスランを、--create-fastq-for-index-readsオプションと--with-failed-readsオプションを有するbcl2fastq(Illumina Inc.、バージョン2.15.0)を使用し処理して、fastqファイルを生成した。インデックスリードを連結し(全部で36bp)、末端に付加されたユニークリード番号を用いてリード名として使用した。次に、これらのインデックスを、対応するインデックス参照セットとマッチングさせ、4つのインデックス成分(i7-トランスポザーゼ(8bp)、i7-PCR(10bp)、i5-トランスポザーゼ(8bp)、およびi5-PCR(10bp))のそれぞれについてハミング距離2を許容し、次に、四重インデックス組み合わせにマッチングしたリードを正確なインデックスに名称を変え(かつ、ユニークなリードナンバーは保持し)、これを、続いて、細胞識別子として使用した。次に、リードをアダプタートリミングし、次いで対にし、対になっていないリードをBowtie2により参照ゲノムに整列させ、混合した。ヒト調製物をGRCh37に整列させ、アカゲザル調製物をRheMac8に整列させ、ヒト/マウス混合調製物を組み合わせたヒト(GRCh37)およびマウス(mm10)参照の組み合わせに整列させた。整列させたbamファイルは、Bowtie2により報告されるように、10未満の整列スコアのリードと共に、各バーコードを基準に同一の整列座標を有するリードを取り除くカスタムスクリプトを使用する、PCR duplicate除去にかけた。
単細胞識別
各PCRプレートについて、全部で9,216個のユニークなインデックスの組み合わせが可能であるが(12個のi7-トランスポザーゼインデックス×8個のi5-トランスポザーゼインデックス×12個のi7-PCRインデックス×8個のi5-PCRインデックス)、これについては、インデックス組み合わせの大部分が存在しないはずである―つまり、核のトランスポザーゼインデックス組み合わせが所与のPCRウェルにソートされなかった―ことから、少数だけが実質的なリードカウントを有するはずである。これらの「空の」インデックスが含むリードは、典型的には非常に少なく(ランの1-3%)、リードの大部分は真の単細胞インデックス組み合わせに分類される(ランの97-99%)。結果として生じる、インデックス組み合わせについてのlog10ユニークリードカウントのヒストグラム(図6)は、2つの正規分布:ノイズ成分と単細胞成分の混合を生成する。次に、Rパッケージ「mixtool」を使用し、混合モデルにフィットさせて(normalmixEM)、各成分の比率(λ)、平均(μ)、および標準偏差(σ)を特定した。単細胞ライブラリとして認定するためのリードカウント閾値は、log10領域の単細胞成分の平均を1標準偏差下回る値か、ノイズ成分の平均の100倍大きい値(log10領域では+2)の大きい方であるように設定し、最小値は1,000ユニークリードでなければならなかった。
ヒト-マウス混合実験
i)細胞段階(HumMus.LAND1およびHumMus.LAND2)で混合するか、またはii)核段階(HumMus.LAND3,HumMus.LAND4、およびHumMus.xSDS)で混合する2つのアプローチのうち一方を、ヒト(GM12878またはHeLa S3)とマウス(3T3)細胞の混合物に対し利用した。後者を利用して、ダブレットを生じさせる可能性がある核の架橋または凝集を制御した。2つの別個のDAPI陽性集団がフローソート時に観察されるようなライブラリを本明細書に記載するように構築し、該ライブラリは、比率が歪まないように、同じゲートの集団を両方含んだ。リードは他の実験のように処理したが、ただし、リードは、GRCh37(hg19)およびmm10を含む参照配列に整列させた。マッピングクオリティ10フィルタにより、両ゲノムの保存領域に整列したリードを効率的に除去し、次に、特定された単細胞それぞれについて、各種に対するリードを記録し、これを使用して衝突頻度を推定した。初期のLAND調製物では、25個のインデックス付き核をPCRウェル毎にソートし、28.1%および10.4%という総衝突率(つまり、ヒト-マウス衝突率の2倍)を得た。第2の2つのLAND調製物では、PCRウェル毎に22個の核をソートしたが、これは、一方の調製物では4.3%の総衝突率を生成し、もう一方では、検出可能な衝突はなかった。xSDS調製物で2つのFANSソート条件もテストしたが、一方は寛大で、より広い範囲のDAPI蛍光を許容し、もう一方はより制限的とし、同じPCRプレートの別の部位で両方を調製した。許容的なゲーティングでは、23.6%の総衝突率を観察したが、より制限的なゲーティングでは実質的に減少し、8.1%だった。これらの結果に基づき、より制限的なFANSを使用して、PCRウェル毎に22個の核のソートを続けることにした。
ライブラリ深度予測
ライブラリプールをより深い深度までシーケンシングする場合、またはシーケンシングする際のライブラリプールの性能を評価するため、ランダムなリードを、各SCI-seq調製物から、非整列リードおよび総生リードの1%毎に置換を含まない低質リードを含む全ての組み合わせインデックスにわたって、漸増的にサンプリングした。各点で、各単細胞インデックスに割り当てられた高品質(MQ≧10)な整列リードの総数と、ユニークなPCR複製物ではないリードの割合、および、対応する、そのインデックスに割り当てられたサンプリング総リードの割合を特定した。これらの点を使用して、非線形モデルとヘインズ-ウルフ変換モデルの両方をフィットさせて、プール内の各個別の単細胞ライブラリについてさらなるシーケンシングを予測し、5%という、細胞でのユニークリードパーセンテージの中央値まで予想した。モデルの正確性を測るため、細胞毎のユニークリードパーセンテージの中央値が90%である点に到達すると考えられる、ダウンサンプリングした各ライブラリの生リードの数を求めたが、これは、低カバレッジでシーケンシングしたライブラリで到達されたものよりも幾分低い。次に、30回の反復のために所定の数のリードをサブサンプリングし、各反復で各細胞について新しいモデルを構築し、次に、達成された真のシーケンシング深度までの、各細胞のユニークリードカウントを予測した。次に、全細胞の全ての反復にわたる真のリードカウントの標準偏差を計算した。
ゲノムウィンドウ生成
ゲノムウィンドウを、カスタムツールを使用して、各ライブラリベースで決定した。各染色体について、全染色体のサイズを標的ウィンドウサイズにより分割して、染色体毎のウィンドウ数を生成した。全単細胞(完全コピー数が決定された全ヒトサンプルおよび平均コピー数と比較して増幅または欠失が確認されたプールされた各サンプルとして、GM12878)のプール全体で要約した染色体の総リードカウントを、次に、ウィンドウカウントにより分割して、ウィンドウごとの平均リードカウントを求めた。次に、染色体を移動させ、プールからの配列リードを符号させ、ウィンドウごとの標的リードカウントが達成されたらウィンドウブレイクを作成した。染色体の境界でのウィンドウは、それが、その染色体について、ウィンドウ限界ごとに75%超の平均リードを含む場合にのみ含めた。動的ウィンドウを使用することにより、高度反復領域、動原体、および、固定サイズビン22の場合にリードドロップアウトを引き起こし得る他の複合領域などのバイアスを説明した。
GCバイアス修正
リードを可変サイズのビンに置き、動的ウィンドウのGC含量ではなく、個々のリードのGC含量に基づいてGCを修正した。単細胞解析に必要な大きいビンは、より小規模のGC含量変化を平均するものと仮定する。さらに、SCI-seqは、ゲノムの大きい領域が増幅されるプレ増幅を伴わないため、GCバイアスはPCRによってのみ生じ、アンプリコン特異的である。リードの修正量を計算するため、所与のGCを有する全リードの割合を、同じGC割合で平均挿入サイズを有するシミュレートした総リードの割合と比較した。次に、この量をリードカウントの代わりに使用し、所与のウィンドウにおける前リードにわたって合計した。DACブラックリスト化領域に存在する全領域は、ヒトサンプル解析のための解析からは除外した(http: //genome. ucsc. edu/cgi-bin/hgFileUi?db=hg19&g=wgEncodeMapability)19。GC修正後、全てのリードを、ゲノムにわたって、ビン毎に平均リード数により正規化した。最後に、各ウィンドウで、各細胞の正規化リードカウントをとり、それを、プールしたサンプルベースラインにより割って、比率スコアを生成した。
データのばらつきの測定
データの質を測定するため、カバレッジのばらつきについての2つの異なる測定値:中央絶対偏差(MAD)、中央絶対対差(median absolute pairwise difference、MAPD)を計算した。各スコアについて、細胞内の平均ビンカウントにより正規化された近傍のビンの間の全ての対の差の絶対値の中央値を計算した(MAPDスコアについてはlog-正規化比率)。これらのスコアは、頻度の低い2,22、コピー数状態の変化ではなく、技術的なノイズに起因する正規化ビンリードのばらつきを測定するものである。
コピー数多型コール
CNVコールを、2つの異なるセグメント化戦略を利用する2つの利用可能なRパッケージ:隠れマルコフモデルアプローチ(HMMcopy,バージョン3.3.0,Ha, G. et al., Genome Res. 22, 1995-2007, 2012)およびCircular Binary Segmentation(DNAcopy,バージョン1.44.0,Olshen et al. Biostatistics5, 557-572, 2004)を用いて、ウィンドウ化し、GCを修正し、バルクサンプルを正規化したリードにおいて実行した。値は、インプットについて変換したLog(CBSに対し2*log)であり、コピー数コールは、Knouse et al. 2016, Knouse et al., Genome Res. gr. 198937.115, 2016, doi: 10.1101/gr. 198937.115)からの最適化パラメータに基づいて行った。サイズ≧5Mbのコピー数コールを検出するための最適な感度および特異性のため、セグメント伸長(E)の確率をHMMでは0.995に設定し、CBSでは、コピー数変化(α)を認める有意水準が0.0001であるように選択した。損失および獲得をコールするLogカットオフは、HMMでは0.4および-0.35とし、CBSでは1.32および0.6とした。CNVコールのための追加のツールとして、データ正規化のために別の方法を使用するGinkgo22を使用した。各細胞に対するベッドファイルと、Picard Tools(ダウンサンプル確率0.1を使用)を用いて作成した量を減らしてサンプリングしたベッドファイルをアップロードした。解析には、ダウンサンプリングしたバルクベッドファイルで単細胞を分割することを選択し、サンプルについて倍数性が既知である場合は、FACSファイルを作成して、Ginkgoにその倍数性を正規化させた。3つの方法でのコールを、各ウィンドウを基準に交差させるか、または、全長が染色体腕の≧80%であるコールのみを含むようにフィルタリングし、次に、異数性解析のために交差させた。
腫瘍切断点解析
孤発型の異数性の評価とは異なり、腫瘍構造多型は、染色体内に切断点の大部分を有し、はるかに複雑である。さらに、腫瘍の任意の所与のサブクローン内の孤発型の異数性も、存在する亜集団の正確なプロファイルほどの妥当性はない。そのため、HMMおよびCBSにより分割した比率スコアマトリックスを使用して、細胞中の分割領域の境界を一致させることにより、切断点を特定した。次に、結果として生じた、ゲノム中で共有される染色体切断点の分布を使用して、コールが作成された特異的なウィンドウの可変性を説明する極大値を特定し、次に、細胞の少なくとも5%に存在するものを保持した。次に、各切断点の全長内の全てのウィンドウを合わせ、正倍数性集団の平均値を超える、各異数体細胞の新しいlog比を計算した。次に、主な成分の解析を実行してから、シルエット解析で求めたk値を用いてk-meansクラスタリングを行った。仮想単細胞の~10%を占め得るダブレットの影響を最小化し、また、低パフォーマンス細胞を除外するため、それぞれの重心に近いもののみを保持した。次に、各クラスタ内の全細胞の配列リードを合わせ、次に、HMM戦略を使用して高分解能CNV解析(標的ウィンドサイズ100kbp)を実行し、その後、完全なコピー数状態の特定と、スライディングウィンドウ外れ値戦略20を使用した極限的増幅および欠失の特定を行った。腫瘍内のクローン関係は、構造的な変化は、細胞に対しより影響力の強いDNAの切断を伴うという仮定に基づくセグメントのコピー数のずれとは対照的に、共有された切断点により最も正確に捕捉される。したがって、高分解能(100kbp)CNV解析を使用して特定された、セグメント総数の少なくとも90%で重複する(コピー数変化としてコールされた、正確なウィンドウのノイズを説明する)、切断点間のセグメント比率を評価することにより、細胞を比較した。
結果
均一なゲノムカバレッジのためのヌクレオソーム除去
均一に分配された配列リードを生成するために組み合わせインデックス付加を適応させることに対するハードルは、核の完全性を損なうことなくゲノムDNAへのヌクレオソーム結合を除去することである。sciATAC-seq方法を天然のクロマチン上で実行することにより、DNAを、オープンクロマチン(ゲノムの1-4%)の領域内でのみ、ライブラリ分子に変換することが可能になる18。この制限は、エピジェネティックな特徴付けのために望ましいが;CNV検出では、それは、生物学的なバイアスと、著しく制限されたリードカウント(細胞毎に~3000個)を生じさせる17。したがって、我々は、SCI-seqライブラリ構築のために核の完全性を維持しながら、ヌクレオソームをゲノムDNAから解放する、2つの戦略を開発した。第1のリチウム補助ヌクレオソーム除去(LAND)は、カオトロピック剤であるジヨードサリチル酸リチウムを利用して、細胞におけるDNA-タンパク質の相互作用を阻害し、その結果、DNAをヒストンから放出させる。第2のSDSを用いた架橋(xSDS)は、界面活性剤SDSを使用して、ヒストンタンパク質を変性し、ヒストンタンパク質がDNAに結合できないようにする。しかしながら、SDSは、核の完全性に対し破壊的な作用を有し、そのため、インタクトな核を維持するために、変性前に架橋ステップを必要とする。
これらの戦略の実行可能性をテストするため、クロマチンアクセシビリティーおよびゲノム構造を広範に測定したHeLa S3細胞株において、バルク(30,000個の核)調製を行い19,20、標準的な対照と共に、LANDまたはxSDS処理を行った。これらの3つのケースにおいて、核はインタクトなままだった(これが、SCI-seqワークフローの重要な要件である)(図4b)。次に、調製した核を、標準的なATAC-seqライブラリ構築に進めた16。未処理核から調製されたライブラリは、予想されたATAC-seqシグナルを生成し、10.8倍に濃縮された配列リードが、注釈を付けたHeLa S3のアクセシビリティー部位に整列した。LAND調製物とxSDS調製物の両方の濃縮は、それぞれ、2.8倍および2.2倍と実質的により低く、ショットガンシーケンシングで観察された1.4倍に近かった(図4c、表1)。さらに、LAND調製物およびxSDS調製物に存在するユニーク配列リードの予想数は、それぞれ17億個および7億9800万個であり、1億7000万個の標準ライブラリよりはるかに大きく、ゲノムのより多くの部分が、実行可能なシーケンシング分子に変換されたことを示唆した。
表1.バルクライブラリ統計。ヌクレオソーム除去を評価するために構築したバルク細胞ライブラリについての情報。*SHOTライブラリは、アクセッション:phs000640.v4.p1下のHeLa dbGaPリポジトリより得た、60Mリードのランダムなサンプリングである(The ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature489, 57-74 (2012)。ライブラリサイズの推定値は、Picardツールの機能「EstimateLibraryComplexity」を使用して生成した。ショットガンシーケンシングでは、使用したリードは重複除去されるため、重複率とライブラリサイズの推定値は求めなかった。
Figure 0007155021000001
ヌクレオソームの除去を伴うSCI-seq
当社の単細胞組み合わせインデックス付加ワークフローを用いた、ヌクレオソーム除去の性能を評価するため、まず、深く測定した、正倍数性リンパ芽球様細胞株GM12878に焦点を当てた14,15,19。PCRインデックス付加段階での単一96ウェルプレートをそれぞれ使用した、種々のLAND条件の全部で6個のSCI-seqライブラリと、3×96ウェルPCRプレートを用いる単一xSDSライブラリを生成した。既存の方法との比較として機能させるため、準ランダムプライミング(QRP、40個がQCを通過)を使用した42個の単細胞ライブラリと、変性オリゴヌクレオチドprimed PCR(DOP、45個がQCを通過)を使用した51を調製した。最後に、50個の細胞の核型を決定して、異数性測定の非シーケンシング手段として機能させた(表2)。
Figure 0007155021000002
Figure 0007155021000003
表2.SCI-seqライブラリ概要。ライブラリ構築についての情報および各SCI-seqライブラリ調製について得られた実際の深度についての統計値。(a)ライブラリ構築物と、単細胞ライブラリのリードカウント閾値を求めるために使用する混合モデルについての詳細。(b)ライブラリにおける、本研究で得られた実際の配列深度についての詳細。
各SCI-seq調製物では、潜在的なインデックス組み合わせの数は96(トランスポザーゼインデックス付加)×N(PCRインデックス付加、プレートごとに96)であるが;各PCRウェルは、15-25個のトランスポザーゼインデックス付加核のみを含むことから、全てのインデックス組み合わせが単細胞ライブラリを表すわけではない。空ではないインデックス組み合わせを特定するため、潜在的なインデックス組み合わせそれぞれについて、ユニークで(つまり、非PCR重複)、高品質(MQ≧10)の整列リードのlog10変換ヒストグラムを生成した。これは、50~200リードに集中した低リードカウントのノイズ成分と、10,000~100,000リードに集中した高リードカウントの単細胞成分を含んだ二峰性分布を生成した(図7a、b、図8)。次に、混合モデルを使用して、この高リードカウント成分に当てはまるインデックスを特定したところ(図6)、ヌクレオソーム除去のためにLANDを使用した6つのSCI-seq調製物では4,643個の単細胞ライブラリが生じ、xSDS調製物では3,123個が生じた。
仮想の単細胞ライブラリの大部分が真の単細胞を含むことを確かめるため、LANDを使用したヒト細胞とマウス細胞の混合物(全部で2,369細胞)において4つのSCI-seqライブラリを調製し、PCRウェル毎に22または25個の核を入れ、1つの調製では、2つのFANS条件の間でxSDS分離を使用した(総細胞1,367個;図9)。各実験では、リードの≧90%がヒトまたはマウスゲノムに独占的に整列する仮想単細胞の比率を解析した。残りの細胞は、ヒト-マウス衝突(つまり、ダブレット)を表し、これは、総衝突率の約半分を占めた(残りの半分はヒト-ヒトまたはマウス-マウスである)。総衝突率は0-23.6%の間で変動し、これを使用して、sciATAC-seq17と比較可能な、<10%という標的ダブレット頻度に対する制限的ソート条件、または、高スルーアウト単細胞RNA-seq技法21では、ウェル毎に22個の核とすることを決定した。
SCI-seq調製物の各ライブラリについて生成されるユニークリードカウントは、ライブラリ複雑度およびシーケンシング深度の関数である。開発時にあらゆる調製物を深くシーケンシングすることは抑制的コストとなることから、当社は、モデルを実行して、予測リードカウントと、深いシーケンシング深度で達成されるであろうPCR重複パーセンテージを予測した(図7c、方法)。質を評価する手段として、いくつかの他の測定基準と共に、追加のシーケンシングが過剰になる点を表す(つまり、追加リードの50%超が新しい情報を提供しない)、細胞のリードの50%の中央値がPCR重複(M50)である深さを特定した(表3)。シーケンシングしたリードのサブセットからのモデル予測は、全ライブラリにわたる中央値の0.02%以内(最大2.25%、平均0.41%)で、ユニークリードカウントの実際の中央値を正確に予測した。さらなる確認として、いくつかの調製物からのPCRウェルのサブセットを追加してシーケンシングし、ユニークリードカウントを生成したが、これは、当社のモデルにより予測されたものの中央値の0.13%以内(最大3.56%、平均0.72%)だった(図10)。
Figure 0007155021000004
Figure 0007155021000005
表3.SCI-seqライブラリ予測統計値。深いシーケンシング深度が得られた場合の、各SCI-seqライブラリの予測統計値についての情報。予測には、方法セクションに記載したモデルを使用する。失敗した(GM12878.LAND2およびHeLa.LAND2)または、予測が当てはまらないほど飽和するまでシーケンシングしたライブラリ(アカゲザル.ind1.xSDSおよびアカゲザル.ind2.xSDS)は含めていない。(a)その点に到達する生リードカウントを含む、所与の複雑性中央値までの予測。(b)ライブラリを、飽和するまでシーケンシングした場合、種々のリードカウント閾値を満たす単細胞数を列挙する(複雑性中央値5%)。
カバレッジの均一性を、平均絶対偏差(MAD)22および平均絶対対偏差(MAPD)を使用して評価したところ、LANDよりもxSDSを使用して、著しく良好な均一性が示された(MAD:平均1.57倍の改善,p=<1x10-15;MAPD:1.70倍の改善,p=<1x10-15、ウェルチのt検定)。xSDSを使用した偏差は、多置換増幅法に類似しているが、QRPとDOPよりもはるかに高い(図7d)22。LAND調製物がより高いカバレッジバイアスを有した一方、該調製物は、xSDS(例えば、GM12878調製物でM50が63,223)と比較した場合、細胞毎でより高度にユニークなリードカウントを生成した(例えば、3つのHeLa LAND調製物のうち1つでM50が763,813)。全てのライブラリについて、転移13,23の機構に起因した、隣接するリード対の特徴的な9塩基対の重複が観察されたが、これは、トランスポザーゼ挿入事象の何れかの側で分子を配列決定可能であることを示す(図11)。
SCI-seqを使用したコピー数多型コール
任意の単細胞ゲノムシーケンシング研究では、真の異数体細胞を除去することなく、如何に不良ライブラリをフィルタにかけ除去するかを決定することは、著しい難題である。他の方法と直接比較するため、最初に、どのフィルタリングもなしに、当社のSCI-seq調製物において、CNVコールを進めた。全ての調製物について、CNVコールのために、可変サイズのゲノムウィンドウ(標的中央値は250万bp)を用いて、最低で50,000個のユニークで高品質な整列リードを有する細胞を使用し(全LANDライブラリで868個、xSDSライブラリでは1,056個)、Ginkgo22、Circular Binary Segmentation(CBS)24、およびHidden Markov Model(HMM)25を適用し(図12)、3つの方法全ての交差を保存的に維持した。核型を決定した細胞を用いる当社のシーケンシングに基づくコールと比較するために、染色体腕レベルの事象に焦点を当てた(図7e、f)。カバレッジ均一性の差と一致して、当社のLAND SCI-seq調製物は、高い異数性比率(61.9%)を生成し、これは、カバレッジ均一性の欠如による偽陽性の存在を示唆する(図7e、g)。しかしながら、SCI-seqを用いたxSDSヌクレオソーム除去戦略は、22.6%の異数性頻度をもたらし、これは、核型決定結果(図7e、h)ならびにDOPおよびQRP(それぞれ、15.0%および13.5%)にはるかに近かった(図13)。
当社は、次に、種々の分解能およびリードカウント閾値にわたって、MADおよびMAPDスコアに基づき、フィルタリング基準を決定した(図14)。この解析により、当社のSCI-seq調製物の分解能におけるより広い可変性範囲が明らかになったが、これは、標準的な方法と比較した場合に、細胞毎のより広い範囲のユニークリードにより主に引き起こされるものである。全方法に0.2のMAD偏差フィルタを適用することにより、xSDS、DOP、およびQRPの異数性比率はそれぞれ12.2%、9.7%、および10.5%まで落ち、全て、核型決定により決められた比率を下回ったが、フィルタリング前よりも互いにより近くなった(図15)。
アカゲザルの脳内のコピー数多型
哺乳類の脳における異数性および大規模なCNV頻度の推定値は、<5%~33%と広く変動する1-4。この不確実性は、主に、定量測定に十分な数の単細胞を測定ことが不可能であることから生じる。ヒトサンプルが入手困難で、生涯の環境曝露における高い可変性により混同されることから、アカゲザルが、脳の異数性の存在を定量化するのに理想的なモデルである。さらに、アカゲザルの脳は、げっ歯類よりも、系統的、構造的、および生理学的によりヒトに似ている26
当社のプラットフォームの多用途性を実証するため、LANDとxSDSのSCI-seqを、QRPを使用した38個の細胞(35個がQCを通過)およびDOPを使用した35個の細胞(30個がQCを通過)と共に、記録した前頭皮質組織(個体1)に適用した。当社の低容量LAND調製物(16PCRインデックス)は、ユニークリードカウント中央値が141,449(248細胞≧50,000ユニークリード)である340個の単細胞ライブラリを生成し、xSDS調製物は、ユニークリードカウント中央値が55,142(92細胞≧50,000ユニークリード)である171個の単細胞ライブラリを生成した。当社のxSDS調製物で生成された細胞数は、追加の細胞脱凝集ステップにより修正され得るソート時の核凝集を主な原因として、予想より少なかった。
ライブラリ構築の全方法にわたり、アカゲザルの参照ゲノムの質が低めであることにおそらく起因して(284,705コンティグ<1Mbp)、ヒト解析(図16-19)よりも3つのCNVコールアプローチ間により大きな矛盾が観察され、これは、「プラチナ」品質の参照ゲノムの必要性を強調した27。そのため、当社は、サブ染色体コールについてのHMM結果に焦点を当て(図20a)、CBSおよびHMMのコールの交差を使用した異数性解析を実施した。当社の細胞株の結果と一致して、LAND調製物は、より高い異数性率(95.1%)を生成し、これは、カバレッジの非均一性に由来する偽陽性を示唆した(図21-22)。xSDS SCI-seqの非フィルタリング異数性率(25.0%)は、DOP調製物(18.5%)に近く、QRPははるかに低い比率(3.1%;図20b)を生成した。MADスコア0.2以下のセルに対し、分散フィルタを課した後の異数性率は、xSDS調製物で12.0%、DOPで8.7%にまで下落し、QRP調製物では3.1%で同じままだった。これらの比率は、第2個体の前頭皮質の200mm切片(381単細胞、中央値リードカウント62,731、213細胞≧50,000ユニークリード)においてxSDS SCI-seqにより生成された比率と類似しており、12.1%および10.3%のフィルタリングなしの異数性率とフィルタリングありの異数性率を生成した(図23)。
原発腫瘍サンプルにおけるSCI-seqにより、クローン集団を明らかになる
単細胞ゲノムのシーケンシングの主な適用の一つは、腫瘍の不均一性の測定およびがんにおけるクローン進化を理解することである。これは、それが、治療耐性に関連するためである5-8。約250mmの新たに取得したステージIIIの膵管腺がん(PDAC)サンプルにおいて、単一xSDS SCI-seq調製を行い、これにより、1,715個の単細胞のライブラリを生成し、細胞毎のユニークリードカウント中央値が49,272とシーケンシングされた(M50は71,378;ライブラリがシーケンシングされた深度で846細胞≧50,000ユニークリード;図24a)。まず、比較のための正倍数体基線として当社のGM12878ライブラリを使用し、CNVコールを実施して、信頼度の高い正倍数体細胞のセット(298、35.2%)を特定し、これを次に、個体および調製物に対し特異的な新たな基線として使用した(図23、25、26)。サブ染色体コピー数の変化(ゲノムの不安定性により引き起こされる)は、全染色体異数性(細胞分裂時のエラーに起因する)よりもサブクローン集団を特定するのにより有益であると仮定して、新しいウィンドウ境界として使用する低分解能での仮想コピー数切断点を特定する戦略を開発し(方法、図27)、その後、主成分解析(PCA)およびk-meansクラスタリングにより層別化した。最初にこの方法を当社のHeLaライブラリ(全部で2,361単細胞)に適用し、明確な不均一性がないことを明らかにし、さらに、HeLa細胞株の安定性を支持し20(図28-31)、次に、当社の主要なPDACサンプルにおいて、シルエット分析により、最適なクラスタカウント4を明らかにした(図24b、c)。
これらのクラスタの1つ目(k3)は、最初の解析で正倍数性の信頼度が高いとは考えられず、そのため除去されなかった、正倍数性細胞の集団である。これらを含める場合、正倍数性集団は、PDACで予想される範囲内で、最終腫瘍細胞純度46.0%で389まで上昇した28。残りのk1(199細胞)、k2(115細胞)、およびk4(91細胞)では、各重心に近い細胞から全てのリードを集め(方法)、100kbpウィンドウ、最初の解析よりも25倍高い分解能を使用してCNVコールを実施し、次に、完全コピー数状態を決定した20(図24d)。
3つの腫瘍クラスタ全体で、コピー数セグメントのかなりの部分が共有され(44.8%)、これは、それらが、共通の前駆集団より生じたことを示唆する。これには、AMLにおいて高頻度で変異し、エンハンサー結合タンパク質をコードするCEBPAの、コピー数7の極限的増幅を宿し29、最近では、膵臓腫瘍においてエピジェネティック制御が変化することが示された30、高度に再編成された染色体19が含まれた(図24e)。網羅的な一対比較により、クラスタk2およびk4が最も類似しており、コピー数セグメントの65.9%を共有し、次に、k1とk4が58.3%、k1とk2が55.0%で続くことが明らかになった。いくつかのクラスタ特異的CNVには、潜在的に機能的に関連する遺伝子が含まれる(図24e)。これには、NF-κBシグナル伝達経路において重要なセリンキナーゼをコードする31、クラスタk1のIKBKBのコピー数6への極限的な増幅と;遺伝子DSC1,2,3およびDSG1,2,3,4(これらは全て、細胞-細胞付着と細胞位置決めに関連するタンパク質をコードし、がんにおいてしばしば誤制御される32)を含むクラスタk1のコピー数5への極限的増幅と;細胞増殖シグナル伝達に関連するチロシンキナーゼ細胞表面受容体をコードし、がんにおいて高頻度に変異する33クラスタk2に対し特異的な、PDGRFBを含む領域の欠失とが含まれる。
最後に、xSDS SCI-seqを、500mmの凍結ステージII直腸腺がんに適用した。調製時に、多量の核デブリに気づき、146個の単細胞ライブラリ(ユニークリードカウント中央値71,378;M50が352,168;111細胞≧50,000ユニークリード)の調製物(16PCRインデックス)の収率を下げる可能性のあった核を破裂させた。PDACサンプルのように同じCNVコールアプローチを実施したが;高頻度の切断点は観察されず、サブクローン集団は特定できなかった(図32)。これは、直腸がんに共通の処置である照射による核の変質の結果であるかもしれず、全ての単細胞方法12に共有される高品質の単細胞または核の懸濁液を生成する難しさを強調する。
考察
当社は、組み合わせインデックス付加ワークフローにおいて核の除去を利用して数千個の単細胞ゲノムシーケンシングライブラリを生成する方法である、SCI-seqを開発した。SCI-seqを使用して、単細胞ゲノムリサーチの2つの主要な領域である:体細胞異数性とがんを代表する、一次組織単離物を含む無数のサンプルから、16,698個の単細胞ライブラリ(このうち5,395個は、CNVコールに十分な深度までシーケンシングした)を生成した。スループットの利点に加え、プラットフォームは、特別なマイクロフルイディクス機器も液滴乳化技法も必要としない。当社のより均一なヌクレオソーム除去戦略であるxSDSを使用して、250kbpの桁での分解能を達成することができたが、別の架橋剤などのさらなる最適化により、分解能の改善に十分な深度が提供され得ると思われる。また、当社は、増殖、転位に影響を与え得る、または他の分子サブタイプを駆動する可能性がある34、サブクローン特異性CNVを明らかにしたこの戦略の膵管腺がんへの適用により、凝集し得るクローン集団を特定して高分解能のCNVコールを容易にすることが可能であることを実証する。
この技法を使用して、SCI-seq、またはTHS-seq35、ATAC-seq変形体などにおけるT4 in vitro転写の組み込みの前に、核骨格内にin situプレ増幅を含ませて、結果として生じるカバレッジをブーストし、単一ヌクレオチド変異体検出を容易にすることが可能であり得る。任意の新しい方法と同様に、最適化が可能であるが、当社は、SCI-seqにより提供されるスループットが、哺乳動物の体細胞ゲノムの安定性についての深い定量化への扉を開くと共に、DNAメチル化およびクロマチン構造を含む単細胞の他の特性を評価するためのプラットフォームとして機能すると考える。
アクセッションコード
NCBI BioProject ID:PRJNA326698
HeLa dbGaPアクセッション:phs000640
データ利用可能性
GM12878およびアカゲザルの配列データは、NCBI Sequence Read Archive(SRA)を介して、無制限アクセス用のBioProject ID:PRJNA326698の下で、アクセス可能である。HeLa配列データは、Genotypes and Phenotypes(dbGaP)のデータベースを介して、アクセッション番号phs000640の下、調査の一部として、アクセス可能である。ヒト腫瘍サンプルはdbGaPへ提出され、studyアクセッションの割り当てを待っている。このプロジェクトに対し特異的に開発されたソフトウェアは、World Wide Web上のsci-seq. sourceforge. net.で利用可能である。
実施例1で引用した参考文献
1. McConnell, M. J. et al. Mosaic Copy Number Variation in Human Neurons. Science (80.). 342, 632-637 (2013).
2. Cai, X. et al. Single-Cell, Genome-wide Sequencing Identifies Clonal Somatic Copy-Number Variation in the Human Brain. Cell Rep. 8, 1280-1289 (2014).
3. Knouse, K. A., Wu, J., Whittaker, C. A. & Amon, A. Single cell sequencing reveals low levels of aneuploidy across mammalian tissues. Proc Natl Acad Sci U S A 111, 13409-13414 (2014).
4. Rehen, S. K. et al. Chromosomal variation in neurons of the developing and adult mammalian nervous system. Proc. Natl. Acad. Sci. U. S. A. 98,13361-6 (2001).
5. Navin, N. et al. Tumour evolution inferred by single-cell sequencing. Nature 472, 90-94 (2011).
6. Eirew, P. et al. Dynamics of genomic clones in breast cancer patient xenografts at single-cell resolution. Nature518, 422-6 (2014).
7. Gawad, C., Koh, W. & Quake, S. R. Dissecting the clonal origins of childhood acute lymphoblastic leukemia by single-cell genomics. Proc. Natl. Acad. Sci. U. S. A. 111,17947-52 (2014).
8. Gao, R. et al. Punctuated copy number evolution and clonal stasis in triple-negative breast cancer. Nat. Genet. 1-15 (2016). doi:10.1038/ng.3641
9. Zong, C., Lu, S., Chapman, A. R. & Xie, X. S. Genome-Wide Detection of Single Nucleotide and Copy Number Variations of a Single Human Cell. Science (80-. ).338, 1622-1626 (2012).
10. Baslan, T. et al. Optimizing sparse sequencing of single cells for highly multiplex copy number profiling. Genome Res. 125, 714-724 (2015).
11. Knouse, K. A., Wu, J. & Amon, A. Assessment of megabase-scale somatic copy number variation using single cell sequencing. Genome Res.gr.198937.115- (2016). doi:10.1101/gr.198937.115
12. Gawad, C., Koh, W. & Quake, S. R. Single-cell genome sequencing: current state of the science. Nat. Rev. Genet. 17, 175-88 (2016).
13. Adey, A. et al. Rapid, low-input, low-bias construction of shotgun fragment libraries by high-density in vitro transposition. Genome Biol. 11, R119 (2010).
14. Amini, S. et al. Haplotype-resolved whole-genome sequencing by contiguity-preserving transposition and combinatorial indexing. Nat. Genet. 46, 1343-9 (2014).
15. Adey, A. et al. In vitro, long-range sequence information for de novo genome assembly via transposase contiguity. Genome Res. 24,2041-2049 (2014).
16. Buenrostro, J. D., Giresi, P. G., Zaba, L. C., Chang, H. Y. & Greenleaf, W. J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat. Methods10, 1213-8 (2013).
17. Cusanovich, D. a et al. Epigenetics. Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing. Science 348, 910-4 (2015).
18. Stergachis, A. B. et al. Developmental fate and cellular maturity encoded in human regulatory DNA landscapes. Cell154, 888-903 (2013).
19. The ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature 489, 57-74 (2012).
20. Adey, A. et al. The haplotype-resolved genome and epigenome of the aneuploid HeLa cancer cell line. Nature500, 207-211 (2013).
21. Macosko, E. Z. et al. Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets. Cell 161, 1202-1214 (2015).
22. Garvin, T. et al. Interactive analysis and quality assessment of single-cell copy-number variations. bioRxiv11346 (2014). doi:10.1101/011346
23. GORYSHIN, I. Y., MILLER, J. A., KIL, Y. V., LANZOV, V. A. & REZNIKOFF, W. S. Tn5/IS50 target recognition. Proc. Natl. Acad. Sci. U S A 95, 10716-10721 (1998).
24. Olshen, A. B., Venkatraman, E. S., Lucito, R. & Wigler, M. Circular binary segmentation for the analysis of array-based DNA copy number data. Biostatistics 5,557-572 (2004).
25. Ha, G. et al. Integrative analysis of genome-wide loss of heterozygosity and monoallelic expression at nucleotide resolution reveals disrupted pathways in triple-negative breast cancer. Genome Res. 22, 1995-2007 (2012).
26. Rosenkrantz, J. & Carbone, L. Investigating somatic aneuploidy in the brain: why we need a new model. Chromosoma (2016).
27. Callaway, E. ‘Platinum’ genome takes on disease. Nat. News 515, 323 (2014).
28. Waddell, N. et al. Whole genomes redefine the mutational landscape of pancreatic cancer. Nature 518, 495-501 (2015).
29. De Kouchkovsky, I. & Abdul-Hay, M. ‘Acute myeloid leukemia: a comprehensive review and 2016 update’. Blood Cancer J. 6, e441 (2016).
30. Kumagai, T. et al. Epigenetic regulation and molecular characterization of C/EBPalpha in pancreatic cancer cells. Int J Cancer 124, 827-833 (2009).
31. Perkins, N. D. Integrating cell-signalling pathways with NF-kappaB and IKK function. Nat. Rev. Mol. Cell Biol. 8, 49-62 (2007).
32. Stahley, S. N. & Kowalczyk, A. P. Desmosomes in acquired disease. Cell Tissue Res. 360, 439-56 (2015).
33. Forbes, S. A. et al. COSMIC: Exploring the world’s knowledge of somatic mutations in human cancer. Nucleic Acids Res. 43, D805-D811 (2015).
34. Bailey, P. et al. Genomic analyses identify molecular subtypes of pancreatic cancer. Nature 531, 47-52 (2016).
35. Sos, B. et al. Characterization of chromatin accessibility with a transposome hypersensitive sites sequencing (THS-seq) assay. Genome Biol 17, 20 (2016).
〔実施例2〕
実施例2で使用した試薬
・リン酸緩衝生理食塩水(PBS,Thermo Fisher,Cat.10010023)
・0.25%トリプシン(Thermo Fisher,Cat.15050057)
・トリス(Fisher,Cat.T1503)
・HCl(Fisher,Cat.A144)
・NaCl(Fisher,Cat.M-11624)
・MgCl2(Sigma,Cat.M8226)
・Igepal(登録商標)CA-630(Sigma,I8896)
・プロテアーゼ阻害剤(Roche,Cat.11873580001)
・3,5-ジヨードサリチル酸リチウム(Sigma,Cat.D3635)-LANDのみ
・ホルムアルデヒド(Sigma,Cat.F8775)-xSDSのみ
・グリシン(Sigma,Cat.G8898)-xSDSのみ
・HEPES(Fisher,Cat.BP310)-xSDSのみ
・NEBuffer2.1(NEB,Cat.B7202)-xSDSのみ
・SDS(Sigma,Cat.L3771)-xSDSのみ
・Triton(商標)-X100(Sigma,Cat.9002-93-1)-xSDSのみ
・DAPI(Thermo Fisher,Cat.D1306)
・Nextera(登録商標)キットのTD緩衝液およびNPM(Illumina,Cat.FC-121-1031)
・96インデックス付きトランスポソーム(公開済みの方法を使用して組み立てまたはIlluminaより入手、表4に示すオリゴ)
・インデックス付きi5およびi7 PCRプライマー(表5)
・SYBR Green(FMC BioProducts,Cat.50513)
・Qiaquick(登録商標)PCR精製キット(Qiagen,Cat.28104)
・dsDNA高感度qubit(登録商標)(Thermo Fisher,Cat.Q32851)
・高感度バイオアナライザキット(Agilent,Cat.5067-4626)
・NextSeqシーケンシングキット(HighまたはMid 150サイクル)
・シーケンシングプライマー(表6)
実施例で使用した機器
・ダウンス型ホモジナイザー
・35μMの細胞ストレーナー(BD Biosciences,Cat.352235)
・Sony SH800セルソータ―(Sony Biotechnology,Cat.SH800)またはDAPIをベースにした単一核ソートが可能なFACS機器
・CFX Connect RTサーマルサイクラー(Bio-Rad,Cat.1855200)または他のリアルタイムサーモサイクラー
・Qubit(登録商標)2.0フルオロメーター(Thermo Fisher,Cat.Q32866)
・2100バイオアナライザ(Agilent,Cat.G2939A)
・NextSeq(登録商標)500(Illumina,Cat.SY-415-1001)
Figure 0007155021000006
Figure 0007155021000007

Figure 0007155021000008

Figure 0007155021000009

Figure 0007155021000010

Figure 0007155021000011

Figure 0007155021000012

Figure 0007155021000013
Figure 0007155021000014
I.3,5-ジヨードサリチル酸リチウム(LAND)またはSDS(xSDS)を使用した核の調製
A.核調製および核除去のLAND法
細胞が細胞培養懸濁液中にある場合、培養物をそっと砕いて細胞凝集塊を破壊し、4℃で5分間、500xgで回転することにより細胞をペレット化し、500μLの氷冷PBSで洗浄した。
細胞が接着細胞培養物中にある場合、培地を吸引し、細胞を37℃のPBS10mLで洗浄し、次に、37℃の0.25%トリプシンを十分に与えて、単層を覆った。37℃で5分間インキュベートした後、または、細胞の90%が表面に接着しなくなるまで、37℃の培地を1:1の比率で加えてトリプシンをクエンチした。4℃で5分間、500xgで回転することにより細胞をペレット化し、次に、500μLの氷冷PBSで洗浄した。
組織を使用する場合、組織サンプルを氷上でダウンス型ホモジナイザー2mLに置いた。2mLのNIB緩衝液(10mMのTrisHCl pH7.4、10MM NaCl、3mM MgCl、0.1%Igepal(登録商標)、1xプロテアーゼ阻害剤)をサンプルに加え、氷上で5分間インキュベートした。サンプルをlooseペッスルで5回ダウンスし、続いて、tightペッスルで15ストロークし、次に、35μMの細胞ストレーナーに通し、必要に応じて追加のストレーナーを使用した。
細胞培養懸濁液、接着細胞培養物、または組織サンプルからの細胞を、5分間500xgで回転することによりペレット化し、次に、NIB緩衝液中の12.5mM LIS200μL(2.5μLの1M LIS+197.5μLのNIB緩衝液)に再懸濁した。氷上で5分間インキュベートした後、800μLのNIB緩衝液と5μLのDAPI(5mg/mL)を加えた。細胞を、35μMの細胞ストレーナーにそっと通した。
B.核調製およびヌクレオソーム除去のxSDS法
細胞が細胞培養懸濁液中にある場合、培地をそっと砕いて細胞凝集塊を破壊した。培地中の細胞10mLに、37%ホルムアルデヒド406μLを加え、室温で10分間、軽く振とうしながらインキュベートした。800マイクロリットルの2.5Mグリシンを細胞に加え、氷上で5分間インキュベートし、次に、4℃で8分間、550xgで遠心分離した。10mLの氷冷PBSで洗浄した後、細胞を5mLの氷冷NIB(10mM TrisHCl pH7.4,10mM NaCl,3mM MgCl,0.1%Igepal(登録商標),1x プロテアーゼ阻害剤)に再懸濁し、氷上で20分間、静かに混ぜながらインキュベートした。
細胞が接着細胞培養物中にある場合、培地を吸引し、細胞を37℃のPBS10mLで洗浄し、次に、37℃の0.25%トリプシンを十分に加えて、単層を覆った。37℃で5分間インキュベートした後、または、細胞の90%が表面に接着しなくなるまで、37℃の培地を1:1の比率で加えてトリプリンをクエンチし、体積を培地で10mLにした。細胞を10mLの培地に再懸濁し、406μLの37%ホルムアルデヒドを加え、室温で10分間、軽く振とうしながらインキュベートした。800マイクロリットルの2.5Mグリシンを細胞に加え、氷上で5分間インキュベートした。4℃で8分間、500xgで細胞を遠心分離し、10mLの氷冷PBSで洗浄した。5mLの氷冷NIBに細胞を再懸濁した後、氷上で20分間、静かに混ぜながらインキュベートした。
組織を使用する場合、組織サンプルを氷上でダウンス型ホモジナイザー2mLに置いた。2mLのHEPES NIB(20mMのHEPES、10MM NaCl、3mM MgCl2、0.1%igepal、1xプロテアーゼ阻害剤)緩衝液をサンプルに加え、氷上で5分間インキュベートした。サンプルをlooseペッスルで5回ダウンスし、続いて、tightペッスルで15ストロークし、次に、35μMの細胞ストレーナーに通し、必要に応じて追加のストレーナーを使用した。体積をHEPES-NIBで10mLにし、406μLの37%ホルムアルデヒドを10mLの体積に加えた。800マイクロリットルの2.5Mグリシンを加え、氷上で5分間インキュベートした。
細胞培養懸濁液または接着細胞培養物からの細胞または核を、5分間500xgで回転することによりペレット化し、900μLの1x NEBuffer2.1で洗浄した。5分間500xgで回転した後、ペレットを、12μLの20%SDSを有する800μLの1x NEBuffer2.1に再懸濁し、30分間激しく振とうしながら42℃でインキュベートし、次に、200μLの10%Triton(商標)X-100を加え、30分間激しく振とうしながら42℃でインキュベートした。細胞を、35μMの細胞ストレーナーにそっと通し、5μLのDAPI(5mg/mL)を加えた。
II.核ソートおよびタグメンテーション
タグメンテーションプレートを、10μLの1X TD緩衝液を用いて準備し(1プレートに対し:500μLのNIB緩衝液+500μLのTD緩衝液)、2000個の単一核をタグメンテーションプレートの核ウェルにソートした。このステップでは、ウェル毎の核の数は、ウェル毎の核の数が全プレートで変わらない限り、多少変化してよい。また、トランスポザーゼインデックスが保存されることから、異なるサンプルをプレートの異なるウェルに多重化することも可能である。細胞を図33に従いゲート化した。プレートを回転した後、2.5nMのユニークにインデックス付加したトランスポソーム1μLを、各ウェルに加えた。封止した後、プレートを、55℃で15分間、軽く振とうしながらインキュベートした。次に、プレートを室温に戻し、次に氷上に置いた。全てのウェルをプールし、5μLのDAPI(5mg/mL)を加え、次に、細胞を35μMの細胞ストレーナーに通した。
III.第2ソートおよびPCRインデックス付加
各ウェルに対し、20mg/mLのBSA0.25μL、1%SDS0.5μL、およびHO7.75μLを用いてマスターミックスを調製した。マスターミックス(8.5μL)と、それぞれ(i5およびi7)10μMのプライマー2.5μLを、96ウェルプレートの各ウェルに加えた。単一核(15-22個)を、最もストリンジェントなソート設定を使用して、各ウェルにソートした。次に、プレートを沈降させた。LAND法を使用して調製した核を、55℃で5分間インキュベートして、トランスポザーゼを変性させた。xSDS法を使用して調製した核を68℃で45分間インキュベートして、トランスポザーゼを変性させ、架橋を逆転させた。
緩衝液を調製し(1プレートに対し:750μLのNPM、400μLのHO、および50μLの100x SYBR Green)、緩衝液12μLを、ストリップチューブの各ウェルに加えた。以下のPCRサイクルを実行した:72℃で5分間、98℃で30秒、次に、(98℃で10秒、63℃で30秒、72℃で1分間、その後、プレートリードおよび追加で72℃で10秒)の連続サイクル。これらのサイクルを、ウェルの大部分がSYBR green蛍光により求められる指数関数的増幅を示すまで、繰り返した。
IV.ライブラリのクリーンアップおよび定量化
PCRプレートの5μLの各ウェルを使用して、ライブラリをプールし、次に、Qiaquick(登録商標)PCR精製カラムを使用して精製し、10mMのTris-Cl,pH8.5(EB)30μLに溶出した。2マイクロリットルを使用して、dsDNA High Sensitivity Qubit(登録商標)2.0フルオロメーターを製造業者のプロトコルに従って用いて、DNAの濃度を定量化した。Qubit(登録商標)の読み取りを使用して、ライブラリを~4ng/uLまで希釈し、1μLを、製造業者のプロトコルに従って、High Sensitivity Bioanalyser 2100の上を走らせた。次に、ライブラリを、200bp-1kbpの範囲で定量化して、プールを、Illuminaシーケンシングのために1nMに希釈した。
V.シーケンシング
NextSeq(登録商標)500を、以下の変更を除いて、1nMのサンプル用の製造業者の指示通りにラン用にセットした ライブラリプールを濃度0.8pM、総体積1.5mLで充填し、カートリッジポジション10に置き;100μMのストックシーケンシングプライマー1の9μLを、全部で1.5mLのHT1緩衝液に希釈し、カートリッジポジション7に入れることにより、カスタムプライマーをセットし;100μMのストックシーケンシングプライマー2の9μLを、全部で1.5mLのHT1緩衝液に希釈し、カートリッジポジション8に入れることにより、シーケンシングプライマーをセットし;100μMのストック濃度の各カスタムインデックスシーケンシングプライマーの18μLを、全部で3mLのHT1緩衝液に希釈し、カートリッジポジション9に入れることにより、カスタムインデックスシーケンシングプライマーをセットした(表7参照)。NextSeq(登録商標)500を、スタンドアロンモードで操作し;SCIseqカスタム化学処方(Amini et al., 2014, Nat. Genet. 46, 1343-1349)を選択し;二重インデックスを選択し;適切な数のリードサイクルを入力し(50推奨)、各インデックスにつき18サイクル;全リードとインデックスに対しカスタムチェックボックスを選択した。
Figure 0007155021000015
〔実施例3〕
単細胞組み合わせインデックス付加およびゲノムと染色体の立体配座
単離核の制限エンドヌクレアーゼ消化とその後のライゲーションを使用して、クロマチンフォールディング解析およびゲノム再編成検出など、核内の染色体構造についての情報を入手した。斯かるタイプの解析は、chromosome conformation capture(3C)および関連方法(4C、5C、およびHi-C)として、当技術分野で既知である。
実施例1および2に記載する方法と併せて使用することが可能な、単細胞組み合わせインデックス付加と、ゲノムおよび染色体の立体配座(single-cell combinatorial indexing and genome and chromosome conformation、sci-GCC)の方法を、図34に記載する。具体的には、単細胞組み合わせインデックス付加と、ゲノムおよび染色体の立体配座の方法は、図34に示すように、ブロック12、13、14、および19を含む。単細胞のゲノムと染色体の立体配座解析の他の方法(Nagano et al., 2013, Nature, 502:59-64)とは異なり、本明細書に記載の方法は、ゲノムとクロマチンの両方の立体配座配列データを得るために、ビオチン充填もビオチンプルダウンも必要としない。
細胞を架橋するための条件を評価して、細胞を架橋し、核の完全性を維持するのに必要なホルムアルデヒドの最終濃度を求めた。HeLa細胞を、該細胞を0.2%、0.35%、1.5%のホルムアルデヒドにさらすことにより、またはホルムアルデヒドにさらすことなく架橋し、図34に記載の方法の簡易版を行い、結果として生じる核の数を求めた。
ホルムアルデヒドにさらしていないか、または0.2%ホルムアルデヒドにさらした細胞からは、インタクトな核は単離されなかった。0.35%ホルムアルデヒドにさらした細胞は、3.8×10個の通常の形態の核を産生し、1.5%ホルムアルデヒドにさらした細胞は、6.4×10個の通常の形態の核を産生した。
架橋を逆転させる条件も評価した。HeLa細胞を、細胞を0.35%、0.75%、1.5%のホルムアルデヒドにさらすことにより、またはホルムアルデヒドにさらすことなく架橋し、図34に記載の方法の簡易版を実施した。単離した核を68℃で1時間または16時間インキュベートすることにより、架橋を逆転させた(図35)。
データは、68℃で1時間のインキュベーションという逆転条件と共に、0.35%ホルムアルデヒドを使用することが最良であったことを示す。
シーケンシングしたsci-GCCライブラリから、ゲノム全域にわたる同等のユニークなリードカウントが、実施例1および2、ならびに図35に記載する方法でのように得られた。ゲノム配列リードに加え、配列リードの5%~15%は、Nagano et al., (2013, Nature, 502:59-64)に記載のクロマチン立体配座シグナルに特徴的である、キメラライゲーションジャンクションを含んだ。平均して、架橋最適化調製物において、細胞毎に40,000超のユニークな平均キメラライゲーションジャンクションリードカウントを有する、既存の単細胞HiC戦略(例えば、Nagano et al., 2013, Nature, 502:59-64参照)と比較しで、より多くのユニークなキメラライゲーションジャンクションリードカウントが得られた。HeLaでは、これらのライブラリにより、HeLaにおける既知の転座を含め、クロマチン構造を明確に特定するのに十分なキメラジャンクションリードが生成された(図36)。
本明細書で引用する、全ての特許、特許出願、および刊行物、ならびに電子的に利用可能な資料(例えば、GenBankおよびRefSeqでのヌクレオチド配列提出物、および例えばSwissProt、PIR、PRF、PDBにおけるアミノ酸配列提出物、およびGenBankおよびRefSeqにおける注釈付のコード領域からの翻訳を含む)の完全な開示は、参照によりその全体が組み込まれるものとする。刊行物において参照される補助資料(例えば、補足表、補足図面、補足的な資料および方法、ならびに/または補足的な実験データ)も同様に参照によりその全体が組み込まれるものとする。本出願の開示と、参照により本明細書に組み込まれる任意の文献の開示との間にいかなる矛盾が存在する場合も、本出願の開示が優先されるものとする。前述の詳細な説明及び実施例は、単に理解しやすくするために記載した。これらにより、不必要な制限が課されるものではない。当業者にとって明らかな変更は、特許請求の範囲によって定義される本発明に含まれるため、本発明は、示し記載する正確な詳細に限定されない。
別段の記載がない限り、本明細書及び特許請求の範囲の中で使用される成分の量、分子量等を表わす数値は全て、「約」という用語により、すべての場合において修正されているものと理解されたい。従って、反対のことが明示されない限り、本明細書及び特許請求の範囲に記載する数値パラメータは、本発明で得られるように試みられる所望の特性に応じて変化し得る近似である。少なくとも、特許請求の範囲に均等論を限定しようとするものではなく、各数値パラメータは、少なくとも、報告された有効数字の数を踏まえて、通常の四捨五入法の適用によって解釈すべきである。
本発明の広い範囲を記載する数値範囲およびパラメータは近似値であるものの、特定の例に記載した数値は、可能な限り正確に報告される。しかしながら、すべての数値は、それぞれの試験測定値に見られる標準偏差より必然的に生じる範囲を本質的に含む。
全ての見出しは、読者の便宜のためであり、特段の記載がない限り、見出しに続く文章の意味を限定するために使用されるべきではない。

Claims (47)

  1. 複数の単細胞に由来する核酸を含むシーケンシングライブラリを調製する方法であって:
    (a)複数の細胞から単離核を提供するステップと;
    (b)前記単離核の完全性を維持しながら、前記単離核を化学処理にかけてヌクレオソーム除去核を生成するステップであって、前記化学処理には、カオトロピック剤を用いた処理が含まれる、ステップと;
    (c)前記ヌクレオソーム除去核のサブセットを、第1の複数のコンパートメントに分配し、各サブセットをトランスポソーム複合体と接触させるステップであって、各コンパートメントの前記トランスポソーム複合体は、トランスポザーゼと第1インデックス配列を含み、該第1インデックス配列はその他のコンパートメントの第1インデックス配列とは異なる、ステップと;
    (d)前記ヌクレオソーム除去核のサブセット中の核酸を複数の核酸断片に断片化し、前記第1インデック配列を、前記核酸断片の少なくとも1つの鎖に組み込んで、インデックス付き核酸断片を含んだインデックス付き核を生成するステップであって、前記インデックス付き核酸断片は、トランスポザーゼに付着したままである、ステップと;
    (e)前記インデックス付き核を組み合わせてプールされたインデックス付き核を生成するステップと;
    (f)前記プールされたインデックス付き核のサブセットを、第2の複数のコンパートメントに分配するステップと;
    (g)各コンパートメントの前記インデックス付き核酸断片に第2インデックス配列を組み込んで、二重インデックス断片を生成するステップであって、各コンパートメントの前記第2インデックス配列は、その他のコンパートメントの第2インデックス配列とは異なる、ステップと;
    (h)前記二重インデックス断片を組み合わせることにより、前記複数の単細胞に由来する全ゲノム核酸を含むシーケンシングライブラリを生成するステップとを含む、方法。
  2. 複数の単細胞に由来する核酸を含むシーケンシングライブラリを調製する方法であって:
    (a)複数の細胞から単離核を提供するステップと;
    (b)前記単離核の完全性を維持しながら、前記単離核を化学処理にかけてヌクレオソーム除去核を生成するステップであって、前記化学処理には、界面活性剤を用いた処理が含まれる、ステップと;
    (c)前記ヌクレオソーム除去核のサブセットを、第1の複数のコンパートメントに分配し、各サブセットをトランスポソーム複合体と接触させるステップであって、各コンパートメントの前記トランスポソーム複合体は、トランスポザーゼと第1インデックス配列を含み、該第1インデックス配列はその他のコンパートメントの第1インデックス配列とは異なる、ステップと;
    (d)前記ヌクレオソーム除去核のサブセット中の核酸を複数の核酸断片に断片化し、前記第1インデック配列を、前記核酸断片の少なくとも1つの鎖に組み込んで、インデックス付き核酸断片を含んだインデックス付き核を生成するステップであって、前記インデックス付き核酸断片は、トランスポザーゼに付着したままである、ステップと;
    (e)前記インデックス付き核を組み合わせてプールされたインデックス付き核を生成するステップと;
    (f)前記プールされたインデックス付き核のサブセットを、第2の複数のコンパートメントに分配するステップと;
    (g)各コンパートメントの前記インデックス付き核酸断片に第2インデックス配列を組み込んで、二重インデックス断片を生成するステップであって、各コンパートメントの前記第2インデックス配列は、その他のコンパートメントの第2インデックス配列とは異なる、ステップと;
    (h)前記二重インデックス断片を組み合わせることにより、前記複数の単細胞に由来する全ゲノム核酸を含むシーケンシングライブラリを生成するステップとを含む、方法。
  3. 前記カオトロピック剤は、リチウム3,5-ジヨードサリチル酸を含む、請求項1の方法。
  4. 前記界面活性剤にはドデシル硫酸ナトリウム(SDS)が含まれる、請求項2の方法。
  5. 前記核は、ステップ(b)の前に架橋剤で処理される、請求項2の方法。
  6. 前記架橋剤はホルムアルデヒドである、請求項5の方法。
  7. 前記ホルムアルデヒドの濃度は、約0.2%~約2%の範囲である、請求項6の方法。
  8. 前記ホルムアルデヒドの濃度は約1.5%以下である、請求項6の方法。
  9. 前記ホルムアルデヒドによる架橋は、ステップ(f)の後とステップ(g)の前に逆転される、請求項6の方法。
  10. 前記架橋の逆転には、約55℃~約72℃でのインキュベートを含む、請求項9の方法。
  11. 前記トランスポザーゼは、前記架橋の逆転の前に前記インデックス付き核酸断片から解離される、請求項9または10の何れか一項の方法。
  12. 前記トランスポザーゼは、ドデシル硫酸ナトリウム(SDS)を使用して前記インデックス付き核酸断片から解離される、請求項11の方法。
  13. 前記核はステップ(d)の前に制限酵素で処理される、請求項1または2の方法。
  14. 前記核は、前記制限酵素での処理の後、リガーゼで処理される、請求項13の方法。
  15. ステップ(c)および(f)における分配は、蛍光活性化核ソーティングにより実行される、請求項1または2の方法。
  16. 前記ヌクレオソーム除去核のサブセットは、ほぼ等しい数の核を含む、請求項1または2の方法。
  17. 前記ヌクレオソーム除去核のサブセットは、1~約2000個の核を含む、請求項16の方法。
  18. 前記第1の複数のコンパートメントはマルチウェルプレートである、請求項1または2の方法。
  19. 前記マルチウェルプレートは96ウェルプレートまたは384ウェルプレートである、請求項18の方法。
  20. 前記プールされたインデックス付き核のサブセットは、ほぼ等しい数の核を含む、請求項1または2の方法。
  21. 前記プールされたインデックス付き核のサブセットは、1~約25個の核を含む、請求項20の方法。
  22. 前記プールされたインデックス付き核のサブセットに含まれる核は、前記ヌクレオソーム除去核のサブセットの少なくとも10分の1である、請求項1または2の方法。
  23. 前記プールされたインデックス付き核のサブセットに含まれる核は、前記ヌクレオソーム除去核のサブセットの少なくとも100分の1である、請求項1または2の方法。
  24. 前記第2の複数のコンパートメントはマルチウェルプレートである、請求項1または2の方法。
  25. 前記マルチウェルプレートは96ウェルプレートまたは384ウェルプレートである、請求項24の方法。
  26. ステップ(c)は、前記ヌクレオソーム除去核のサブセットが分配された後、前記トランスポソーム複合体を前記コンパートメントに加えるステップを含む、請求項1または2の方法。
  27. 前記トランスポソーム複合体はそれぞれトランスポゾンを含み、前記トランスポゾンはそれぞれ転移鎖を含む、請求項1または2の方法。
  28. 前記転移鎖は、前記第1インデックス配列と、第1ユニバーサル配列を含む、請求項27の方法。
  29. ステップ(g)における第2インデックス配列の組み込みは、各コンパートメントの前記インデックス付き核酸断片を、第1ユニバーサルプライマーおよび第2ユニバーサルプライマーに接触させるステップであって、前記第1ユニバーサルプライマーおよび第2ユニバーサルプライマーはそれぞれインデックス配列を含み、それぞれ前記第1ユニバーサル配列の一部と同一または相補的な配列を含む、ステップと、指数関数的増幅反応を実施するステップとを含む、請求項28の方法。
  30. 前記第1ユニバーサルプライマーのインデックス配列は、前記第2ユニバーサルプライマーのインデックス配列の逆相補体である、請求項29の方法。
  31. 前記第1ユニバーサルプライマーのインデックス配列は、前記第2ユニバーサルプライマーのインデックス配列の逆相補体とは異なる、請求項29の方法。
  32. 前記第1ユニバーサルプライマーは、さらに、第1捕捉配列と、前記二重インデックス断片の3´末端のユニバーサル配列に対し相補的な第1アンカー配列とを含む、請求項29の方法。
  33. 前記第1捕捉配列は、P5プライマー配列を含む、請求項32の方法。
  34. 前記第2ユニバーサルプライマーは、さらに、第2捕捉配列と、前記二重インデックス断片の5´末端のユニバーサル配列に対し相補的な第2アンカー配列とを含む、請求項29の方法。
  35. 前記第2捕捉配列は、P7プライマー配列の逆相補体を含む、請求項34の方法。
  36. 前記指数関数的増幅反応には、ポリメラーゼ連鎖反応(PCR)が含まれる、請求項29の方法。
  37. 前記PCRは15~30サイクルを含む、請求項36の方法。
  38. 前記二重インデックス断片に対し特異性を有する複数の捕捉オリゴヌクレオチドを使用した、二重インデックス断片の濃縮をさらに含む、請求項1または2の方法。
  39. 前記捕捉オリゴヌクレオチドは、固体基板の表面に固定化される、請求項38の方法。
  40. 前記捕捉オリゴヌクレオチドは、ユニバーサル結合対の第1メンバーを含み、前記結合対の第2メンバーは固体基板の表面に固定化される、請求項38~39の何れか一項の方法。
  41. 前記二重インデックス断片をシーケンシングして、前記複数の単細胞に由来する核酸のヌクレオチド配列を決定するステップをさらに含む、請求項1または2の方法。
  42. 複数の増幅部位を含む表面を提供するステップであって、前記増幅部位は、遊離3´末端を有する付着した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含む、ステップと;
    増幅部位を含む前記表面を、個々の二重インデックス断片からのアンプリコンのクローン集団をそれぞれが含む複数の増幅部位を生成するのに適切な条件下で、前記二重インデックス断片と接触させるステップをさらに含む、請求項41の方法。
  43. 前記二重インデックス断片の数は、増幅部位の数を上回り、前記二重インデックス断片は前記増幅部位に流体アクセスし、前記増幅部位にはそれぞれ、前記シーケンシングライブラリ中のいくつかの二重インデックス断片のための容量がある、請求項42の方法。
  44. 前記接触ステップは、(i)前記二重インデックス断片を平均輸送速度で前記増幅部位に輸送するステップと、(ii)前記増幅部位にある二重インデックス断片を平均増幅速度で増幅させるステップとを同時に含み、前記平均増幅速度は前記平均輸送速度を上回る、請求項42~43の何れか一項の方法。
  45. 請求項1~44の何れか一項の方法により調整されるシーケンシングライブラリを含み、前記シーケンシングライブラリは、インデックス付き核酸断片を含む、組成物。
  46. 前記組成物は、オーバーハングを含む切断制限部位において終端するインデックス付き核酸断片を含む、請求項45の組成物。
  47. ウェルが請求項45または46の組成物を含む、マルチウェルプレート。
JP2018568388A 2016-07-22 2017-07-21 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法 Active JP7155021B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022124469A JP2022169578A (ja) 2016-07-22 2022-08-04 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662365916P 2016-07-22 2016-07-22
US62/365,916 2016-07-22
US201762451305P 2017-01-27 2017-01-27
US62/451,305 2017-01-27
PCT/US2017/043381 WO2018018008A1 (en) 2016-07-22 2017-07-21 Single cell whole genome libraries and combinatorial indexing methods of making thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022124469A Division JP2022169578A (ja) 2016-07-22 2022-08-04 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法

Publications (2)

Publication Number Publication Date
JP2019520828A JP2019520828A (ja) 2019-07-25
JP7155021B2 true JP7155021B2 (ja) 2022-10-18

Family

ID=60988232

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018568388A Active JP7155021B2 (ja) 2016-07-22 2017-07-21 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法
JP2022124469A Pending JP2022169578A (ja) 2016-07-22 2022-08-04 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022124469A Pending JP2022169578A (ja) 2016-07-22 2022-08-04 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法

Country Status (12)

Country Link
US (2) US11535883B2 (ja)
EP (2) EP3488002B1 (ja)
JP (2) JP7155021B2 (ja)
KR (2) KR20230003255A (ja)
CN (2) CN110268059B (ja)
AU (2) AU2017299803B2 (ja)
CA (1) CA3026773C (ja)
DK (1) DK3488002T3 (ja)
ES (1) ES2873723T3 (ja)
IL (1) IL263920B2 (ja)
SG (1) SG11201811504PA (ja)
WO (1) WO2018018008A1 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
WO2012142213A2 (en) 2011-04-15 2012-10-18 The Johns Hopkins University Safe sequencing system
CN109457030B (zh) 2012-10-29 2022-02-18 约翰·霍普金斯大学 卵巢和子宫内膜癌的帕帕尼科拉乌测试
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
ES2922624T3 (es) 2017-03-13 2022-09-19 Gigagen Inc Sistemas y métodos para el análisis combinatorio paralelo masivo de células individuales
BR112020002555A2 (pt) 2017-08-07 2020-08-11 The Johns Hopkins University métodos e materiais para avaliar e tratar câncer
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
EP4234717A3 (en) * 2018-05-03 2023-11-01 Becton, Dickinson and Company High throughput multiomics sample analysis
EP3794141A4 (en) * 2018-05-17 2022-02-23 Illumina, Inc. HIGH THROUGHPUT SINGLE-CELL SEQUENCE WITH REDUCED GAIN Bias
WO2019236599A2 (en) * 2018-06-04 2019-12-12 Illumina, Inc. High-throughput single-cell transcriptome libraries and methods of making and of using
EP3830262A1 (en) * 2018-08-03 2021-06-09 Becton Dickinson and Company Nuclei barcoding and capture in single cells
EP3841219A4 (en) * 2018-08-24 2022-05-04 Swift Biosciences, Inc. ASYMMETRICAL TARGETED AMPLIFICATION METHODS
US10704094B1 (en) 2018-11-14 2020-07-07 Element Biosciences, Inc. Multipart reagents having increased avidity for polymerase binding
US10876148B2 (en) * 2018-11-14 2020-12-29 Element Biosciences, Inc. De novo surface preparation and uses thereof
GB2598656B (en) * 2018-11-15 2023-10-04 Element Biosciences Inc Methods for generating circular nucleic acid molecules
SG11202012762WA (en) 2018-12-05 2021-01-28 Illumina Cambridge Ltd Methods and compositions for cluster generation by bridge amplification
EP3899041A1 (en) 2018-12-18 2021-10-27 Illumina Cambridge Limited Methods and compositions for paired end sequencing using a single surface primer
FI3899037T3 (fi) 2018-12-19 2023-11-21 Illumina Inc Menetelmiä polynukleotidiklusterin klonaalisuusprioriteetin parantamiseksi
SG11202102530QA (en) * 2019-03-01 2021-04-29 Illumina Inc High-throughput single-nuclei and single-cell libraries and methods of making and of using
EP3947727A4 (en) * 2019-04-05 2023-01-04 Board of Regents, The University of Texas System METHODS AND APPLICATIONS OF CELL BARCODING
US20220042078A1 (en) 2019-04-29 2022-02-10 Illumina, Inc. Identification and analysis of microbial samples by rapid incubation and nucleic acid enrichment
US11535891B2 (en) 2019-05-03 2022-12-27 The Regents Of The University Of California Barcoded solid supports and methods of making and using same
WO2021011433A1 (en) * 2019-07-12 2021-01-21 New York Genome Center, Inc Methods and compositions for scalable pooled rna screens with single cell chromatin accessibility profiling
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
CN110952147B (zh) * 2019-12-18 2023-05-05 南方科技大学 单细胞基因组测序用的dna文库的构建方法
AU2020407641A1 (en) 2019-12-19 2021-09-23 Illumina, Inc. High-throughput single-cell libraries and methods of making and of using
EP4107286A4 (en) * 2020-02-19 2024-04-24 Sequencing Health Inc METHODS AND SYSTEMS FOR NUCLEIC ACID PROCESSING
WO2021188889A1 (en) * 2020-03-20 2021-09-23 Mission Bio, Inc. Single cell workflow for whole genome amplification
WO2021252617A1 (en) 2020-06-09 2021-12-16 Illumina, Inc. Methods for increasing yield of sequencing libraries
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
CN111996598A (zh) * 2020-08-11 2020-11-27 杭州瀚因生命科技有限公司 一种单细胞染色质可及性的建库方法
US20230265499A1 (en) * 2020-08-14 2023-08-24 Factorial Diagnostics, Inc. In Situ Library Preparation for Sequencing
CN112280828A (zh) * 2020-10-22 2021-01-29 上海交通大学医学院 一种降低单细胞扩增偏倚性的离体组织细胞核分离方法
CN112309500A (zh) * 2020-10-30 2021-02-02 广州序科码生物技术有限责任公司 一种基于单细胞测序数据唯一片段序列捕获方法
WO2022109207A2 (en) 2020-11-19 2022-05-27 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Massively paralleled multi-patient assay for pathogenic infection diagnosis and host physiology surveillance using nucleic acid sequencing
CN114686564B (zh) * 2020-12-31 2023-10-24 深圳华大生命科学研究院 一种适用于微量样本的dna样本制备方法
CN114836838A (zh) * 2021-02-01 2022-08-02 南方医科大学 一种中通量单细胞拷贝数文库构建的方法及其应用
EP4298244A1 (en) 2021-02-23 2024-01-03 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
WO2022188054A1 (en) * 2021-03-10 2022-09-15 Nanjing University Methods and reagents for sample multiplexing for high throughput single-cell rna sequencing
EP4314327A1 (en) 2021-03-22 2024-02-07 Illumina Cambridge Limited Methods for improving nucleic acid cluster clonality
WO2022222101A1 (zh) * 2021-04-22 2022-10-27 深圳华大生命科学研究院 Rna测序文库的构建方法、测序方法及试剂盒
AU2022297521A1 (en) * 2021-06-24 2024-01-04 Illumina, Inc. Methods and compositions for combinatorial indexing of bead-based nucleic acids
CN114277093B (zh) * 2021-12-24 2024-02-27 中国农业科学院生物技术研究所 一种提取植物细胞核的方法
CN114277094B (zh) * 2021-12-24 2024-02-27 中国农业科学院生物技术研究所 提取植物细胞核的裂解液
WO2023196572A1 (en) 2022-04-07 2023-10-12 Illumina Singapore Pte. Ltd. Altered cytidine deaminases and methods of use
WO2024069581A1 (en) 2022-09-30 2024-04-04 Illumina Singapore Pte. Ltd. Helicase-cytidine deaminase complexes and methods of use
WO2024073043A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Methods of using cpg binding proteins in mapping modified cytosine nucleotides
WO2024073047A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Cytidine deaminases and methods of use in mapping modified cytosine nucleotides
WO2024118903A1 (en) 2022-11-30 2024-06-06 Illumina, Inc. Chemoenzymatic correction of false positive uracil transformations

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007526743A (ja) 2003-06-06 2007-09-20 ザ・ボード・オブ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・イリノイ クロマチン分析を利用して細胞の侵襲可能性を評価するための方法
JP2015519084A (ja) 2012-06-15 2015-07-09 イラミーナ インコーポレーテッド 核酸ライブラリーの動力学排除増幅
WO2016003814A1 (en) 2014-06-30 2016-01-07 Illumina, Inc. Methods and compositions using one-sided transposition
JP2016508715A (ja) 2013-01-09 2016-03-24 イルミナ ケンブリッジ リミテッド 固形支持体でのサンプル調製
WO2016083823A1 (en) 2014-11-28 2016-06-02 Porvair Filtration Group Limited Pipette tip and method of use thereof
JP2016518860A5 (ja) 2014-05-20 2017-06-29

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4882268A (en) 1985-12-24 1989-11-21 Massachusetts Institute Of Technology Method for determining tissue of origin and degree of malignancy of tumor cells
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
EP0379559B1 (en) 1988-06-24 1996-10-23 Amgen Inc. Method and reagents for detecting nucleic acid sequences
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
EP0425563B1 (en) 1988-07-20 1996-05-15 David Segev Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
EP0439182B1 (en) 1990-01-26 1996-04-24 Abbott Laboratories Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
AU694187B2 (en) 1994-02-07 1998-07-16 Beckman Coulter, Inc. Ligase/polymerase-mediated genetic bit analysis TM of single nucleotide polymorphisms and its use in genetic analysis
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
CA2185239C (en) 1994-03-16 2002-12-17 Nanibhushan Dattagupta Isothermal strand displacement nucleic acid amplification
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6245974B1 (en) * 1997-08-06 2001-06-12 North Carolina State University Matrix attachment regions
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
ATE377093T1 (de) 2000-07-07 2007-11-15 Visigen Biotechnologies Inc Sequenzbestimmung in echtzeit
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
US8030000B2 (en) 2002-02-21 2011-10-04 Alere San Diego, Inc. Recombinase polymerase amplification
ES2550513T3 (es) 2002-08-23 2015-11-10 Illumina Cambridge Limited Nucleótidos modificados para secuenciación de polinucleótidos
AU2003272438B2 (en) 2002-09-20 2009-04-02 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
AU2004253882B2 (en) 2003-06-20 2010-06-10 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
ES2949821T3 (es) 2004-01-07 2023-10-03 Illumina Cambridge Ltd Matrices moleculares
US7476503B2 (en) 2004-09-17 2009-01-13 Pacific Biosciences Of California, Inc. Apparatus and method for performing nucleic acid analysis
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
ES2511218T5 (es) * 2005-06-20 2017-12-07 Advanced Cell Diagnostics, Inc. Kits y productos para detección de ácidos nucleicos en células individuales y para identificación de células raras en grandes poblaciones de células heterogéneas
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP2021503A1 (en) 2006-03-17 2009-02-11 Solexa Ltd. Isothermal methods for creating clonal single molecule arrays
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
EP2639579B1 (en) 2006-12-14 2016-11-16 Life Technologies Corporation Apparatus for measuring analytes using large scale FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2010003132A1 (en) 2008-07-02 2010-01-07 Illumina Cambridge Ltd. Using populations of beads for the fabrication of arrays on surfaces
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
AU2011323107B2 (en) 2010-11-05 2015-09-10 Illumina, Inc. Linking sequence reads using paired code tags
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
WO2012166425A2 (en) * 2011-05-27 2012-12-06 President And Fellows Of Harvard College Methods of amplifying whole genome of a single cell
US9926552B2 (en) * 2011-06-06 2018-03-27 Cornell University Microfluidic device for extracting, isolating, and analyzing DNA from cells
EP2718465B1 (en) 2011-06-09 2022-04-13 Illumina, Inc. Method of making an analyte array
US9453258B2 (en) 2011-09-23 2016-09-27 Illumina, Inc. Methods and compositions for nucleic acid sequencing
CA3003082C (en) 2011-10-28 2020-12-15 Illumina, Inc. Microarray fabrication system and method
EP3366348B1 (en) 2012-01-16 2023-08-23 Greatbatch Ltd. Emi filtered co-connected hermetic feedthrough, feedthrough capacitor and leadwire assembly for an active implantable medical device
MX337140B (es) 2012-04-03 2016-02-12 Illumina Inc Cabazal integrado de lectura optoelectrónica y cartucho fluído útil para secuenciación de ácidos nucleicos.
WO2014018460A1 (en) * 2012-07-24 2014-01-30 Sequenta, Inc. Single cell analysis using sequence tags
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
DK3553175T3 (da) 2013-03-13 2021-08-23 Illumina Inc Fremgangsmåde til fremstilling af et nukleinsyresekvenseringsbibliotek
WO2014151554A1 (en) * 2013-03-15 2014-09-25 The Trustees Of The University Of Pennsylvania Phi29 method for library preparation
CA3156663A1 (en) * 2013-03-15 2014-09-18 Verinata Health, Inc. Generating cell-free dna libraries directly from blood
WO2014189957A2 (en) * 2013-05-23 2014-11-27 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
PT3017065T (pt) 2013-07-01 2018-12-18 Illumina Inc Funcionalização de superfícies sem catalisador e enxerto de polímeros
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
AU2015331739B2 (en) * 2014-10-17 2021-12-02 Illumina Cambridge Limited Contiguity preserving transposition
SG11201703386XA (en) 2014-10-31 2017-05-30 Illumina Cambridge Ltd Novel polymers and dna copolymer coatings
CN116083546A (zh) 2015-02-10 2023-05-09 亿明达股份有限公司 用于分析细胞组分的方法和组合物
WO2017156336A1 (en) * 2016-03-10 2017-09-14 The Board Of Trustees Of The Leland Stanford Junior University Transposase-mediated imaging of the accessible genome

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007526743A (ja) 2003-06-06 2007-09-20 ザ・ボード・オブ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・イリノイ クロマチン分析を利用して細胞の侵襲可能性を評価するための方法
JP2015519084A (ja) 2012-06-15 2015-07-09 イラミーナ インコーポレーテッド 核酸ライブラリーの動力学排除増幅
JP2016508715A (ja) 2013-01-09 2016-03-24 イルミナ ケンブリッジ リミテッド 固形支持体でのサンプル調製
JP2016518860A5 (ja) 2014-05-20 2017-06-29
WO2016003814A1 (en) 2014-06-30 2016-01-07 Illumina, Inc. Methods and compositions using one-sided transposition
WO2016083823A1 (en) 2014-11-28 2016-06-02 Porvair Filtration Group Limited Pipette tip and method of use thereof

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Cell, 1984, Vol.39, pp.223-232
Nature Genetics, 2014, Vol.46, No.12, pp.1343-1349
Nature, 2013, Vol.502, No.7469, pp.59-64
Science, 2015, Vol.348, pp.910-914, Supplementary Materials

Also Published As

Publication number Publication date
CN117822128A (zh) 2024-04-05
SG11201811504PA (en) 2019-01-30
IL263920B2 (en) 2023-02-01
DK3488002T3 (da) 2021-06-21
US20180023119A1 (en) 2018-01-25
WO2018018008A1 (en) 2018-01-25
US20230323426A1 (en) 2023-10-12
ES2873723T3 (es) 2021-11-03
CA3026773C (en) 2022-10-18
AU2017299803A1 (en) 2019-01-24
AU2023222858A1 (en) 2023-09-28
KR102475710B1 (ko) 2022-12-08
KR20190034164A (ko) 2019-04-01
CN110268059A (zh) 2019-09-20
AU2017299803B2 (en) 2023-06-29
CA3026773A1 (en) 2018-01-25
EP3488002B1 (en) 2021-03-31
EP3904514A1 (en) 2021-11-03
IL263920A (en) 2019-01-31
KR20230003255A (ko) 2023-01-05
NZ749719A (en) 2021-06-25
CN110268059B (zh) 2024-01-12
JP2022169578A (ja) 2022-11-09
IL263920B (en) 2022-10-01
US11535883B2 (en) 2022-12-27
EP3488002A1 (en) 2019-05-29
JP2019520828A (ja) 2019-07-25

Similar Documents

Publication Publication Date Title
JP7155021B2 (ja) 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法
JP7407597B2 (ja) メチル化配列決定のための単一細胞全ゲノムライブラリー
JP7234146B2 (ja) 低減した増幅バイアスによるハイスループット単一細胞シークエンシング
JP7457434B2 (ja) 核酸増幅のための方法
AU2019248635B2 (en) Compositions and methods for making controls for sequence-based genetic testing
NZ749719B2 (en) Single cell whole genome libraries and combinatorial indexing methods of making thereof
NZ794511A (en) Single cell whole genome libraries for methylation sequencing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220804

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20220805

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220824

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221005

R150 Certificate of patent or registration of utility model

Ref document number: 7155021

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150