JP2023507876A - 哺乳類dnaのメチル化の検出及び分析 - Google Patents

哺乳類dnaのメチル化の検出及び分析 Download PDF

Info

Publication number
JP2023507876A
JP2023507876A JP2022524572A JP2022524572A JP2023507876A JP 2023507876 A JP2023507876 A JP 2023507876A JP 2022524572 A JP2022524572 A JP 2022524572A JP 2022524572 A JP2022524572 A JP 2022524572A JP 2023507876 A JP2023507876 A JP 2023507876A
Authority
JP
Japan
Prior art keywords
dna
binding site
transposon
library
unique
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022524572A
Other languages
English (en)
Other versions
JP7489455B2 (ja
Inventor
カオ、ユンロン
シェ、シャオリァン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changping National Laboratory
Original Assignee
Changping National Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changping National Laboratory filed Critical Changping National Laboratory
Publication of JP2023507876A publication Critical patent/JP2023507876A/ja
Application granted granted Critical
Publication of JP7489455B2 publication Critical patent/JP7489455B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本開示は、ゲノムフラグメントのメチル化解析の方法を提供する。

Description

本発明の実施の形態は、概して、少量のDNA、例えば、少数の細胞~100個の細胞又は単一細胞(a single cell)に由来するDNAをシーケンシングする方法及び組成物に関する。
腫瘍増殖、幹細胞リプログラミング、記憶形成、胚発生等、細胞間変動及び集団の不均一性が重要な役割を果たす研究では、単一細胞レベルDNAにて高カバー率で高精度な哺乳類DNAメチル化研究を行う能力が不可欠である。これは、分析対象の細胞試料が貴重又は希少であるか、試料が単一細胞、又は単一細胞DNA若しくは無細胞DNAのゲノムの全体若しくは一部である場合等、微量の場合にも重要である。
DNAメチル化を単一塩基分解能で分析するには、DNAが化学変換又は酵素変換を経て、メチル化シトシン及び非メチル化シトシンを効果的に区別する必要がある。一般的な変換方法としては、限定されるものではないが、亜硫酸水素ナトリウム、TETアシストピリジンボランシーケンシング(TAPS)、非特許文献1、非特許文献2が挙げられる。
全ての化学変換又は酵素変換における主要な課題は、変換と同時に発生するDNAの損失又は損傷である。長いインキュベーション時間、高温、高バイサルファイト濃度、及び高い酸化性又は還元性環境等、完全な変換に必要な条件は、インキュベートされたDNAの最大90%の分解、DNA塩基損傷、及び断片化につながる可能性がある。変換中の工程間又は工程後にDNA精製を行うと、DNAが最大90%失われる可能性もある。広範なDNAの損失及び損傷は問題であり、限られた量若しくは少量の開始DNA、又は、更には単一細胞レベルのDNAを扱う場合等には更に問題がある。低カバー率の単一細胞バイサルファイトシーケンシングは、単一細胞に対してバイサルファイト変換を直接行い、続いてDNA増幅を行うことによって達成された(非特許文献3、非特許文献4)。
化学変換又は酵素変換中のDNA損傷、及び変換と同時に起こるDNA精製中のDNA損失は、100bp~4kbのサイズの超音波処理されたラムダDNA等のキャリアDNAを追加することによって大幅に減少する可能性がある。しかしながら、キャリアDNAと標的化DNAを混合すると、後で区別できない試料の混合物が生じ、その後のメチル化の検出及び分析が困難になるか、又は失敗することさえある。
in vitro転位は、DNA増幅の或る特定の用途で使用されている。かかる方法では、標的DNAが同時に断片化され、タグが付けられ、下流処理のために所望のDNA配列でタグ付けされた断片が生成される。ライブラリーの調製方法として、in vitro転位はIllumina, IncのNextera技術で利用されており、DNAを同時に断片化し、各フラグメントに次世代シーケンシングのための適切な配列がタグ付けされている(特許文献1)。単一細胞のゲノム及びエピゲノムを研究するためのツールとして、in vitro転位はBuenrostro et al.によってクロマチンのアクセシビリティをプロファイルするために使用され(非特許文献5)、三次元染色体コンフォメーションを研究するためにRamani et al.によって使用され(非特許文献6)、単一細胞ゲノムを直接シーケンスライブラリーに増幅するためにZahn et al.(非特許文献7)によって使用されている。しかしながら、これらの方法は全て、元の標的核酸のおよそ50%の損失を受ける。これは、2つのトランスポゾン配列(以後、A及びBとして表す)がタグ付けに使用されるために起こる。トランスポゾンA及びBを標的DNAにタグ付けした後、4つの異なるタイプのDNAフラグメントを作製することができ、これらのフラグメントは、各フラグメントの2つの末端にA-A、B-B、A-B、又はB-Aでタグ付けされたフラグメントである。全転位産物の50%を占めるA-B又はB-Aでタグ付けされたフラグメントのみが、PCR増幅又はペアエンドシーケンシングに適している。A-A又はB-Bでタグ付けされたフラグメントの残り50%は失われる。かかる損失率は、着床前の遺伝子スクリーニングに使用される単一細胞等、希少、固有の又は貴重な単一細胞試料を含む、DNA量が限られている試料では確かに望ましくなく、潜在的に許容できない。追加の転位方法は特許文献2に記載されているが、かかる方法では転位バイアスに起因する50%の損失は減少しない。
したがって、従来技術の方法に関連するDNAの損失を招くことなく、少量の哺乳類DNAのメチル化状態を解析する更なる方法が必要である。
米国特許出願公開第20110287435号明細書 国際公開第2016/073690号
Liu et al., Nature Biotechnology (2019). "Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution", Enzymatic-methyl seq conversion (EM-seq) Williams et al., New England Biolabs, Inc. (2019). "Enzymatic Methyl-seq: The Next Generation of Methylome Analysis" [world wide website international.neb.com/tools-and-resources/feature-articles/enzymatic-methyl-seq-the-next-generation-of-methylome-analysis] Guo, H., eta. (2013). "Single-cell methylome landscapes of mouse embryonic stem cells and early embryos analyzed using reduced representation bisulfite sequencing." Genome Res 23(12): 2126-2135 Smallwood, S. A., et al. (2014). "Single-cell genome-wide bisulfite sequencing for assessing epigenetic heterogeneity." Nat Methods 11(8): 817-820. Buenrostro, J. D., Wu, B., Litzenburger, U. M., Ruff, D., Gonzales, M. L., Snyder, M. P., ... & Greenleaf, W. J. (2015). Single-cell chromatin accessibility reveals principles of regulatory variation. Nature, 523(7561), 486-490 Ramani, V., Deng, X., Qiu, R., Gunderson, K. L., Steemers, F. J., Disteche, C. M., ... & Shendure, J. (2017). Massively multiplex single-cell Hi-C. Nature Methods, 14(3), 263-266 Zahn, H., Steif, A., Laks, E., Eirew, P., VanInsberghe, M., Shah, S. P., ... & Hansen, C. L. (2017). Scalable whole-genome single-cell library preparation without preamplification. Nature Methods, 2017
本開示は、複数のトランスポソームを用いたゲノムDNAフラグメント化を含む、少量で存在する標的DNA試料、例えば、複数の細胞から又は単一細胞からのDNAのメチル化状態を分析する方法であって、複数のトランスポソームの各メンバーは、プライミング部位配列を有する2つのトランスポゾン核酸配列を含む、方法を提供する。トランスポゼースに結合するプライミング部位配列を有するトランスポゾン核酸配列は、変換化学がメチル化シトシン又は非メチル化シトシンを変換するかどうかに応じて、全てのシトシンについてメチル化されてもよく、又はメチル化されなくてもよい。トランスポソームによって産生されるDNAフラグメントは、シトシン及び/又はメチルシトシンをその中に存在させることができる。
トランスポソームを用いた少量のDNAの断片化、ギャップ充填、精製、増幅及びシーケンシングの方法は、国際出願PCT/US2018/034162号(その全体が引用することにより本明細書の一部をなす)で提供され、一般にマルチエンドタギング増幅(Multiple End Tagging Amplification)すなわち「META」と称される。一態様によれば、トランスポソームの各トランスポゾン核酸配列のプライミング部位配列は同じである。一態様によれば、トランスポソームの各トランスポゾン核酸配列のプライミング部位配列は異なる。一態様によれば、複数のトランスポソームの各メンバーは、固有の及び/又は異なったプライミング部位配列を含み得る。一態様によれば、複数のトランスポソームの各メンバーは、トランスポソーム内の各トランスポゾンに対して1つずつ、2つの固有の及び/又は異なったプライミング部位配列を含み得る。このようにして、トランスポソームと会合する固有のプライマー結合部位配列(又は2つの固有の及び/又は異なったプライミング部位配列)を有し、トランスポソームを区別するために使用することができる一組のトランスポソームが提供される。言い換えれば、トランスポソーム内のトランスポゾンのプライマー結合部位配列は同じであってもよく、又は異なっていてもよく、すなわち同一でなくてもよい。標的核酸配列に付着し、フラグメントを作製するために使用される隣接する2つのトランスポソームにおけるトランスポソームのプライマー結合部位配列は、例えば高い確率で同一ではない。トランスポゾンを、トランスポソーム内の各トランスポゾンが異なるプライミング部位配列を有する限り、マルチプレックストランスポゾンと称することができる。トランスポソームのライブラリー内のプライミング部位を、各トランスポソームが、トランスポソームのセット内の他のトランスポソーム内の他のプライミング部位とは異なる、すなわち同一でない又は固有のプライミング部位を有する限り、マルチプレックスプライミング部位と称することができる。一態様によれば、上記方法は、隣接するトランスポソームが異なるプライマー結合部位配列を有するように、標的核酸配列に沿ってライブラリー又は複数のトランスポソームからのトランスポソームを結合する工程を提供する。このようにして、断片化部位の末端に異なるプライマー結合部位配列がタグ付けされる。これは、トランスポソームがその2つのトランスポゾンDNAのそれぞれについて同じプライマー結合部位配列を持っているか、又はトランスポソームがその2つのトランスポゾンDNAのそれぞれに対して異なるプライマー結合部位配列を持っているかどうかに関係なく達成できる。このようにして、本明細書に記載されるマルチプレックスエンドタギング増幅方法は、複数のプライミング配列を使用して、2つの末端が異なる配列でタグ付けされた標的DNAフラグメントを作り出す。マルチプレックスエンドタギング増幅方法は、2つの隣接するトランスポソーム(すなわちフラグメント配列を形成するように直接隣接している)が異なるトランスポゾンプライマー結合部位配列(フラグメントは、各末端に異なるプライマー結合部位配列を有する)を保有する限り、トランスポソーム内の2つのトランスポゾン配列が同じであるか異なっているかにかかわらず行うことができる。
一態様によれば、トランスポソームのセット内のマルチプレックスプライミング部位配列の使用は、単一細胞のゲノム核酸配列等のゲノム核酸配列を断片化及びタグ付けするために転位法が用いられる場合に、損失率を低下させた。本明細書の教示によれば、反応混合物中にN個の異なるトランスポゾン配列がある場合、すなわち固有のプライミング部位配列の数がNである場合、同じトランスポゾン配列によってタグ付けされたDNAフラグメントの確率、すなわち損失率は1/Nである。したがって、本開示は、損失率を制御するために、固有のプライミング部位配列の数、すなわち数Nを変更する方法を提供する。例えば、ヒトの単一細胞から得られたDNAで使用する場合、20の異なるトランスポゾン配列がある場合、損失率は1/20すなわち5%である。
本明細書に記載される複数のフラグメントを作製する方法は、トランスポソームのセットの各メンバーが1つ又は2つの異なるプライマー結合部位配列を有し、トランスポソームのセットの各メンバーが、例えば高い確率で、トランスポソームのセットのそれぞれの他のメンバーと比較して、1つ又は2つの固有の又は異なったプライミング結合部位を有するトランスポソームのセットを使用する。このようにして、フラグメントの隣接する末端は、断片化プロセス中に異なった及び/又は固有の末端バーコード配列でバーコード化され、各末端に固有のバーコード配列(プライミング部位配列)を有するフラグメントを作り出す。このようにして、フラグメントの反対側の末端は、断片化プロセス中に高い確率で異なった及び/又は固有の末端バーコード配列でバーコード化され、各末端に異なるバーコード配列(プライミング部位配列)を有するフラグメントを作り出す。このようにして、フラグメントの対向する2つの末端は、断片化プロセス中に異なった及び/又は固有の末端バーコード配列でバーコード化され、各末端に固有のバーコード配列(プライミング部位配列)を有するフラグメントを作り出す。
一態様によれば、トランスポソームライブラリーは、水性媒体中でゲノムDNAのフラグメントを作製するために使用され、トランスポソームのトランスポゼースによって切断された部位で、ゲノムDNAの各末端に固有のバーコード配列が挿入又は付着される。各トランスポソームは、セット若しくは複数の、又はライブラリーの他のトランスポソームメンバーと比較して、1つ又は2つの異なった及び/又は固有のプライミング部位配列を有するため、各フラグメントは、各末端に固有のプライミング部位配列(バーコード配列)を有する。一態様によれば、各フラグメントは、1つ以上のシトシン又は1つ以上のメチルシトシンを含む。本明細書に記載される方法は、シトシンをウラシルに変換する化学変換工程中にキャリアDNAを利用して、化学変換工程中に試料DNAが喪失又は損傷されるのを防止する。シトシンをウラシルに変換するために使用される試薬又は酵素は、当業者には知られている。シトシンをウラシルに変換する酵素試薬、すなわちシトシンデアミナーゼとしては、APOBEC-seq又はAPOBEC3A等のABOPECファミリーのものが挙げられる。APOBECファミリーのメンバーは、5-ヒドロキシメチルシトシンを維持しながら、すなわち5-ヒドロキシメチルシトシンを変化させずに、シトシンをウラシルに変換するシチジンデアミナーゼである。5-メチルシトシンは、TET酵素との酸化反応により5-ヒドロキシメチルシトシンに変換され得る。かかる酵素は米国特許出願公開第2013/0244237号に記載されており、New England Biolabsから入手され得る。他の酵素試薬は、本開示に基づいて、当業者には明らかになるであろう。一態様によれば、試薬はバイサルファイトではない若しくはバイサルファイトを除外するか、又は試薬がバイサルファイトでないことを条件として、シトシンをウラシルに変換する。次いで、キャリアDNAを除去するか、又はキャリアDNAも増幅することなく変換されたフラグメントを増幅して、増幅された断片化DNAをもたらすことができる。より具体的には、トランスポソーム法を用いて断片化された標的DNAに挿入されたプライマー又はアダプターと、塩基分解能メチル化分析に必要とされるDNAの化学変換又は酵素変換中のDNA損失及びDNA損傷を低減するためのキャリアDNAの添加とを使用する方法が提供される。本明細書に記載される(及びキャリアDNAの添加前に)各末端にプライマー又はアダプターを有するフラグメントを作り出すためのトランスポソームの使用は、標的化DNAがキャリアDNAと十分に区別できるように、標的化DNAにバーコード及びPCRアダプターを付加する。本明細書に記載される方法によれば、アダプター結合型DNAは増幅されるが、キャリアDNAは増幅されない。キャリアDNAは一本鎖DNA、すなわちssDNAになり、混合物から除去され、純粋な増幅された標的化DNAが得られる。
本開示は、本明細書に記載されるトランスポソームライブラリーを使用して、ゲノムDNAを複数のフラグメント、例えば、5以上のフラグメント、10以上のフラグメント、100以上のフラグメント、1000以上のフラグメント、10000以上のフラグメント、100000以上のフラグメント、1000000以上のフラグメント、又は10000000以上のフラグメントに断片化することを企図する。固有の及び/又は異なったプライマー結合部位配列の数に依存する一態様によれば、トランスポソームライブラリーは、5~10のタイプ若しくは種類のトランスポソームメンバー、10~100のタイプ若しくは種類のトランスポソームメンバー、100以上のタイプ若しくは種類のトランスポソームメンバー、1000以上のタイプ若しくは種類のトランスポソームメンバー、10000以上のタイプ若しくは種類のトランスポソームメンバー、100000以上のタイプ若しくは種類のトランスポソームメンバー、1000000以上のタイプ若しくは種類のトランスポソームメンバー、又は10000000以上のタイプ若しくは種類のトランスポソームメンバー、又は5~50のタイプ若しくは種類のトランスポソームメンバーを含む。
一態様によれば、各トランスポソームは、2つのトランスポゼースと2つのトランスポゾンDNAとを含む。トランスポソームの2つのトランスポゾンDNAのそれぞれは、トランスポゼース結合部位及びプライマー結合部位配列を含む。一態様によれば、トランスポゾンDNAは、単一のトランスポゼース結合部位及び固有のプライマー結合部位配列を含む。各トランスポゾンDNAは、トランスポゼース結合部位でトランスポゼースに結合した別々の核酸である。トランスポソームは、それぞれが独自のトランスポゾンDNAに結合した2つの別々のトランスポゼースのダイマーである。ダイマーは、各トランスポゾン上に同じプライマー結合部位配列を有してもよく、又は各トランスポゾン上に異なるプライマー結合部位配列を有してもよい。一態様によれば、トランスポソームは、それぞれがそれ自身の対応するトランスポゼースに結合している2つの別個のトランスポゾンDNAを含む。一態様によれば、トランスポソームは、2つのトランスポゼース及び2つのトランスポゾンDNAのみを含む。一態様によれば、トランスポソームの一部としての2つのトランスポゾンDNAは、別個の、又は連結されていないトランスポゾンDNAであり、それぞれがそれ自身の対応するトランスポゼースに結合している。
一態様によれば、ライブラリーの各トランスポソームメンバーは、固有の異なったプライミング部位配列を含む。同じ固有の異なったプライミング部位配列がトランスポソームの各トランスポゾンDNA上に存在してもよく、又はトランスポソームの各トランスポゾンDNA上に異なる固有の異なったプライミング部位配列が存在してもよい。このようにして、各トランスポソームは、トランスポソームライブラリー内の任意の他のトランスポソームのプライミング部位配列とは固有で異なった、固有で異なったプライミング部位配列を含む。一態様によれば、トランスポソームライブラリーは、他のトランスポソームメンバーと同じプライミング部位配列を有するトランスポソームメンバーを含み得るが、確率は比較的小さいか、又は重要ではない。このように、各フラグメント切断部位が異なるプライミング部位を有するゲノムDNAを断片化することを目的としているため、トランスポソームライブラリーは、調製されたトランスポソームのコレクションのサブセットであると考えることができ、そのサブセットは、固有の異なったプライミング部位配列を有するトランスポソームのみを含む。各断片切断部位が異なるプライミング部位配列を有するゲノムDNAを断片化する目的は、隣接するトランスポソームがそれぞれ固有の異なったプライミング部位配列を有する場合に達成され得るが、それはトランスポソームの2つのトランスポゾンによって共有されてもよいことを理解されたい。各断片切断部位が異なるプライミング部位配列を有するゲノムDNAを断片化するという目的は、隣接するトランスポソームがそれぞれ2つの固有の異なったプライミング部位配列を有し、トランスポソームの各トランスポゾンが固有の異なったプライミング部位配列を有する場合に達成され得ることを理解されたい。
トランスポソームライブラリーの調製により、わずかな数の切断部位が同じプライミング部位配列を共有する可能性があることを理解されたい。例えば、所与のライブラリー調製方法では、同じプライミング部位配列を持つトランスポソームの分子が複数存在することは数学的に可能であるが、ライブラリーは、異なるプライミング部位配列の数が実際に標的ゲノムに挿入されるトランスポソーム分子の数を大幅に超えるように調製される。一態様によれば、トランスポソームライブラリーは、同じ2つのプライミング部位配列を有するトランスポソームメンバーを含み得る、すなわち、プライミング部位配列が同一又は同じであるが、このプライミング部位配列は、トランスポソームライブラリーのトランスポソームメンバーの任意の他のトランスポゾンDNAと比較して固有である。かかるトランスポソームライブラリーを作るには、トランスポゼースと固有のプライミング部位配列を含むトランスポゾンDNAとを混合して、各トランスポソームメンバーを別々に作製する。次いで、全てのトランスポソームメンバーが共に混合されてトランスポソームライブラリーが形成される。
一態様によれば、トランスポソームライブラリーは、全てのトランスポゾン配列をトランスポゼースと共に混合してトランスポソームを形成することによって調製される。この方法では、ほとんどのトランスポソームは異なるトランスポゾン配列を持っているが、トランスポソームが同じトランスポゾン配列を保有する可能性は1/Nである。トランスポソームライブラリーを作製する別の方法によれば、各タイプのトランスポゾン配列がトランスポゼースと別々に混合され、次いで全てのトランスポソームが混合されてトランスポソームライブラリーが形成される。この方法では、全てのトランスポソームが同じトランスポゾン配列を持つことになる。
一態様によれば、固有の及び/又は異なったプライミング部位配列の数は、5~50、10~50、15~45、20~40、又は1~1000、1~10000、1~100000、1~1000000、又は1~10000000である。一態様によれば、ゲノムDNA中の切断部位の数は、トランスポソームの濃度によって決定又は調整され、濃度が高いほど切断部位の数が多くなり、濃度が低いほど切断部位の数が少なくなる。一態様によれば、実質的に全ての切断部位が2つの異なった及び/又は固有のプライミング部位配列を有するように、トランスポソームの数、並びに関連する異なった及び/又は固有のプライミング部位配列が選択される。一態様によれば、切断部位の90%超が2つの異なった及び/又は固有のプライミング部位配列を有し、切断部位の95%超が2つの異なった及び/又は固有のプライミング部位配列を有し、切断部位の96%が2つの異なった及び/又は固有のプライミング部位配列を有し、切断部位の97%が2つの異なった及び/又は固有のプライミング部位配列を有し、切断部位の98%が2つの異なった及び/又は固有のプライミング部位配列を有し、切断部位の99%が2つの異なった及び/又は固有のプライミング部位配列を有し、切断部位の99.5%が2つの異なった及び/又は固有のプライミング部位配列を有し、又は切断部位の100%が2つの異なった及び/又は固有のプライミング部位配列を有する。
次いで、トランスポソームライブラリーを使用してゲノムDNAを切断し、各トランスポソームは、切断部位の末端で各トランスポゾンDNAのプライミング部位配列を挿入又は付着させる。隣接するトランスポソームが互いに比べて固有の異なったプライミング部位配列を有する場合、切断部位は部位の各末端に固有の異なったプライミング部位配列を有することになり、すなわち、挿入されるプライミング部位配列が異なることになる。このようにして、トランスポソームライブラリーによって生成された複数の又はほとんどの又は実質的に全てのフラグメントは、隣接するトランスポソームが互いに比較して固有の異なったプライミング部位配列を有する限り、フラグメントの各末端、すなわち対向する末端に異なった及び/又は固有のプライミング部位配列を有する。次いで、トランスポゼースを各フラグメントから除去し、続いてギャップ埋め工程、例えばポリメラーゼ伸長工程を行うことができる。次いで、得られた二本鎖核酸フラグメント配列は、例えばマルチプレックスPCR増幅を用いて増幅することができる。次いで、フラグメントを配列決定し、ゲノムDNAの配列を決定することができる。
一態様によれば、トランスポソームのトランスポゾンDNAは、当業者に知られている方法を使用するPCR又はRNA転写等により、シーケンシングの前にフラグメントを増幅できるように、フラグメントに付着することができる特異的プライマー配列又は転写プロモーター配列等の増幅方法を促進する配列を含むことができる。本開示は、フラグメントを増幅するための種々の増幅方法を企図し、アンプリコンをシーケンシングするための種々の配列決定方法は、任意の特定の増幅又はシーケンシング方法に限定されないことを理解されたい。
本開示の実施の形態は、核酸、例えばゲノムDNA、例えば微量若しくは少量のゲノムDNA、又は限られた量のDNA、例えば単一細胞若しくは同じ細胞型の複数の細胞から、又は個体若しくは基質から得られた組織、体液若しくは血液試料から得られた単数又は複数のゲノム配列のマルチプレックスエンドタギング増幅の方法に関する。本開示の或る特定の態様によれば、本明細書に記載される方法は、単一の反応混合物を用いて単一のチューブ内で実施することができる。本開示の或る特定の態様によれば、核酸試料は、単一細胞からの未精製又は未処理の溶解物内にあってもよい。本明細書に開示される方法に供される核酸は、種々の試薬と接触する前、及び本明細書に記載される様々な条件下で、カラム精製等によって精製される必要はない。本明細書に記載される方法は、ハイスループットシーケンシングのために増幅されたDNAを産生する単一細胞の全ゲノムの実質的かつ均一なカバー率を提供するのを補助するように、損失率、すなわち元の標的核酸の損失を減少させる。
本発明の実施の形態は、一般に、DNAフラグメント、例えば、単一細胞の全ゲノムからのDNAフラグメントを作製する方法及び組成物に関し、次いで、当業者に知られている及び本明細書に記載されるように、増幅及びシーケンシング方法に供することができる。或る特定の態様によれば、本明細書に記載される核酸フラグメントを作製する方法は、トランスポソームライブラリーを利用する。一態様によれば、トランスポソームの一部としてのトランスポゼースは、一組の二本鎖ゲノムDNAフラグメントを作るために使用される。或る特定の態様によれば、トランスポゼースは、反応容器内又は反応容量にある場合等、互いに接触すると、トランスポゾンDNAに結合して二量体化する能力を有し、トランスポソームと呼ばれるトランスポゼース/トランスポゾンDNA複合体ダイマーを形成する。トランスポソームの各トランスポゾンDNAは、二本鎖トランスポゼース結合部位と、プライミング部位配列及び任意に転写プロモーター部位等の機能配列を含む第1の核酸配列とを含む。第1の核酸配列は、一本鎖伸長の形態であってもよい。トランスポソームライブラリーの各トランスポソームは、トランスポソームライブラリーの残りの各メンバーのプライミング部位配列とは異なる固有の異なったプライミング部位配列を含む。一態様によれば、トランスポソームライブラリーの各トランスポソームは、トランスポソームライブラリーの残りの各メンバーのプライミング部位配列とは異なる2つの固有の異なったプライミング部位配列を含む。
トランスポソームは、二本鎖ゲノムDNA等の二本鎖核酸に沿った標的位置にランダムに結合する能力を有し、トランスポソーム及び二本鎖ゲノムDNAを含む複合体を形成する。トランスポソーム内のトランスポゼースは二本鎖ゲノムDNAを切断し、1つのトランスポゼースは上部鎖を切断し、1つのトランスポゼースは下部鎖を切断する。トランスポソーム中の各トランスポゾンDNAは、切断部位の各末端の二本鎖ゲノムDNAに付着しており、すなわち、トランスポソームの一方のトランスポゾンDNAが左側の切断部位に付着し、トランスポソームのもう一方のトランスポゾンDNAが右側の切断部位に付着している。トランスポソームのトランスポゾンDNAがそれぞれ異なるプライマー結合部位配列を持つ場合、左側の切断部位及び右側の切断部位は、異なった固有のバーコード、すなわちプライミング部位配列で「バーコード化」される。トランスポソームのトランスポゾンDNAがそれぞれ同じプライマー結合部位配列を持つ場合、左側の切断部位及び右側の切断部位は、同じバーコード、すなわちプライミング部位配列で「バーコード化」される。フラグメントを作製するために使用される隣接するトランスポソームがそれぞれ異なった固有のプライマー結合部位配列を持つ場合、得られるフラグメントは、フラグメントの各末端に異なった固有のプライマー結合部位を持つことになる。或る特定の態様によれば、複数のトランスポゼース/トランスポゾンDNA複合体ダイマー、すなわちトランスポソームは、例えば、二本鎖ゲノムDNAに沿って対応する複数の標的位置に結合し、次いで二本鎖ゲノムDNAを複数の二本鎖フラグメントに切断し、各フラグメントは、二本鎖フラグメントの各末端に異なるバーコード配列が付着したトランスポゾンDNAを有する。
一態様によれば、トランスポゾンDNAは二本鎖ゲノムDNAに付着し、ゲノムDNAの1つの鎖とトランスポゾンDNAの1つの鎖との間に一本鎖ギャップが存在する。一態様によれば、ギャップ伸長は、ギャップを埋め、二本鎖ゲノムDNAと二本鎖トランスポゾンDNAとの間に二本鎖接続を作り出すために行われる。一態様によれば、トランスポゼース結合部位及びプライミング部位配列を含む核酸配列が、二本鎖フラグメントの各末端に付着している。或る特定の態様によれば、トランスポゼースは、二本鎖フラグメントの各末端に付着しているトランスポゾンDNAに付着している。一態様によれば、トランスポゼースは、二本鎖ゲノムDNAフラグメントの各末端に付着しているトランスポゾンDNAから除去される。
本開示の一態様によれば、二本鎖ゲノムDNAフラグメントの各末端に付着された異なるプライミング部位配列を有するトランスポゾンDNAを有する二本鎖ゲノムDNAフラグメントは、次いで、トランスポゾンDNAをテンプレートとして用いてギャップ充填され伸長される。したがって、二本鎖ゲノムDNAフラグメントと、二本鎖ゲノムDNAの各末端に異なるプライミング部位配列を含む二本鎖トランスポゾンDNAとを含む二本鎖核酸伸長産物が生成される。
この段階で、ゲノムDNAフラグメント、各末端の異なるプライミング部位配列を含む二本鎖核酸伸長産物は、当業者に知られている方法を使用して増幅され、各末端のゲノムDNAフラグメント及び異なるプライマー結合部位のアンプリコンを生成することができる。PCRプライマー配列及び試薬を増幅に使用できる。本明細書に記載されるトランスポゾンは、RNA転写産物を生成するためのRNAポリメラーゼ結合部位も含むことができ、これを、次いで、線形増幅のためにcDNAに逆転写することができる。ゲノムDNAフラグメントと各末端に異なるプライミング部位配列とを含む二本鎖核酸伸長産物は、増幅試薬と組み合わせることができ、次いで、二本鎖ゲノム核酸フラグメントを、当業者に知られている方法を用いて増幅して、二本鎖ゲノム核酸フラグメントのアンプリコンを生成することができる。
次いで、アンプリコンは、更なる分析の前に収集及び/又は精製することができる。アンプリコンは、当業者に知られている方法を使用して配列決定することができる。配列決定すると、配列をコンピューターで解析してゲノムDNAを同定することができる。
本開示の実施の形態は、マルチプレックスエンドタギングを使用するDNA増幅の方法に関し、DNAは、微量若しくは少量のゲノムDNA、又は限られた量のDNA、例えば単一細胞若しくは同じ細胞型の複数の細胞から得られた、又は個体若しくは基質から得られた組織、体液若しくは血液の試料から得られた単数又は複数のゲノム配列である。本開示の或る特定の態様によれば、本明細書に記載される方法を単一のチューブ内で実施して、各末端に異なった固有の配列を有するフラグメントを作ることができ、次いで、このフラグメントは、当業者に知られているハイスループットシーケンシングプラットフォームを用いて増幅及び配列決定される。
本明細書に記載されるトランスポソームの断片化及びバーコード化の方法は、低量、少量、又は限られた量のDNAを増幅し、次いでシーケンシングするのに有用である。本明細書に記載される方法は、腫瘍及び神経腫瘤等の非常に不均一な細胞集団を特徴とする生体系又は組織試料において特有の用途を有する。本明細書に記載される方法は、遺伝的に不均一な組織(例えば、癌)、希少で貴重な試料(例えば、胚性幹細胞)、及び非分裂細胞(例えばニューロン)等を含む、DNA材料の様々な供給源、並びに当業者に知られているシーケンシングプラットフォーム及び遺伝子型決定方法を利用することができる。
本開示の或る特定の実施形態の更なる特徴及び利点は、その実施形態及び図面の以下の説明において、並びに特許請求の範囲から、より完全に明らかになるであろう。
本発明の前述及び他の特徴及び利点は、添付の図面と併せて、例示的な実施形態の以下の詳細な説明から、より完全に理解されるであろう。
5’の伸長が線状であるトランスポゾンDNAの構造を概略図に示し、図中、Tは二本鎖トランスポゼース結合部位、Mは伸長の一端のマルチプレックスプライミング部位である。 トランスポゼース及びトランスポゾンDNAがトランスポソームを自発的に形成する一般的な実施形態の概略図であり、これは液滴又は他の形成媒体内で起こり得る。トランスポソームの形成の前、各トランスポゾンは異なるパターンで表される異なった固有のプライミング部位配列を有する。トランスポソーム形成後、トランスポソームの各トランスポゾンは、異なるパターンで表される異なった固有のプライミング部位配列を有する。 トランスポソームがゲノムDNAに結合し、フラグメントに切断し、トランスポゼース結合部位(黒色)と、各トランスポソームにおいて異なるパターンで表される各トランスポソームの各トランスポゾン上の固有の異なったプライミング部位配列とを含むトランスポゾンDNAの付加又は挿入の概略図である。 トランスポソームがゲノムDNAに結合し、フラグメントに切断し、トランスポゼース結合部位(黒色)と、トランスポソームを代表する固有の異なったプライミング部位配列とを含むトランスポゾンDNAの付加又は挿入の概略図であり、すなわち、各トランスポソームにおいて同じパターンで表されるように、トランスポソームの各トランスポゾンには、同一の固有の異なったプライマー結合部位配列が存在する。各トランスポソーム間の異なるプライマー結合部位配列は、異なるパターンで表される。 トランスポゼース除去、ゲノムDNA、トランスポゼース結合部位、及び伸長産物の各末端における固有の異なったプライミング部位配列を含む核酸伸長産物を形成するためのギャップ充填の概略図である。 図4のフラグメントのマルチプレックスPCR増幅を示す概略図である。 低インプットメチル化検出法の一般的なワークフローを示す概略図である。 scEM-seqのワークフローを示す概略図である。 異なるアライメントアルゴリズム(PE又はPE+SE)を用いたsc-COOL seq及びscWGBSと比較したscEM-seqのゲノムカバー率である。PE:ペアエンド・アライメントを使用。PE+SE:読み取りにシングルエンドアラインメントを使用すると参照ゲノムにアライメントされなかった。scEM-seq及びsc-COOL seqを4細胞段階のマウス胚に実施する。scWGBSはマウスESCに実施する。 scEM-seq、sc-COOL seq、及びscWGBS間のマッピング率の比較の図である。 sc-COOL seq及びscEM-seqのメチル化率分布の比較の図である。
一態様によれば、単一細胞からの二本鎖ゲノムDNAを、それぞれがトランスポゾンDNAに結合したTn5トランスポゼース等のトランスポゼースと接触させることを含む、単一細胞全ゲノム増幅、シーケンシング及びアセンブリの方法が提供され、ここで、トランスポゾンDNAは、二本鎖19bpトランスポゼース(Tnp)結合部位と、固有の異なったプライミング部位配列を含む第1の核酸配列とを含み、トランスポソームと呼ばれるトランスポゼース/トランスポゾンDNA複合体ダイマーを形成する。第1の核酸配列は、一本鎖伸長の形態であってもよい。一態様によれば、第1の核酸配列は、5’オーバーハング等のオーバーハングであってもよく、オーバーハングは、固有で異なったプライミング部位配列を含む。オーバーハングは、必要に応じて他の機能配列を含むことができる。オーバーハングは、プライミング部位配列、又は必要に応じて他の機能配列を含めるのに適した任意の長さであり得る。トランスポソームは、二本鎖ゲノムDNAに沿った標的位置に結合し、二本鎖ゲノムDNAを複数の二本鎖フラグメントに切断し、各二本鎖フラグメントは、Tnp結合部位によって上部鎖に付着した第1の複合体と、Tnp結合部位によって下部鎖に付着した第2の複合体とを有する。トランスポゾン結合部位、したがってトランスポゾンDNAと共にプライマー結合部位は、二本鎖フラグメントの各5’末端に付着している。一態様によれば、Tn5トランスポゼースは複合体から除去される。
二本鎖フラグメントは、1つ以上のシトシン又は1つ以上のメチルシトシンを含み、トランスポゾンDNAに沿って伸長して、二本鎖伸長産物の各末端に異種、又は異なった若しくは固有のプライミング部位配列を有する二本鎖伸長産物を作製する。一態様によれば、二本鎖ゲノムDNAフラグメントへのTn5トランスポゼース結合部位の付着から生じ得るギャップを埋めることができる。
次いで、ギャップ充填された二本鎖伸長産物をキャリアDNAの存在下で化学処理し、シトシンをウラシルに変換する。
ギャップ充填された二本鎖伸長産物を増幅試薬と混合し、二本鎖ゲノムDNAフラグメントを増幅する。アンプリコンは、各末端に異種、又は異なった若しくは固有のプライミング部位配列(バーコード配列として機能し得る)を含み、例えば、当業者に知られているハイスループットシーケンシング法を用いて配列決定される。
特定の態様では、実施形態は、特定の部位の表現を失うことなく、実質的に全ゲノムを増幅、シーケンシング、及びアセンブリする方法(本明細書では「全ゲノム増幅」と定義される)に関する。特定の実施形態において、全ゲノム増幅は、ゲノムライブラリーの実質的に全てのフラグメント又は全てのフラグメントの増幅を含む。更なる特定の実施形態において、「実質的に全体」又は「実質的に全部」とは、ゲノム中の全配列の約80%、約85%、約90%、約95%、約97%、又は約99%を指す。
或る特定の実施形態の実施又は或る特定の実施形態の特徴は、特に明記されていない限り、当業者の技術の範囲内である分子生物学、微生物学、組換えDNA等の従来の手法を用いることができる。かかる技術は文献で完全に十分に説明されている。例えば、Sambrook, Fritsch, and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, Second Edition (1989), OLIGONUCLEOTIDE SYNTHESIS (M. J. Gait Ed., 1984), ANIMAL CELL CULTURE (R. I. Freshney, Ed., 1987), the series METHODS IN ENZYMOLOGY (Academic Press, Inc.); GENE TRANSFER VECTORS FOR MAMMALIAN CELLS (J. M. Miller and M. P. Calos eds. 1987), HANDBOOK OF EXPERIMENTAL IMMUNOLOGY, (D. M. Weir and C. C. Blackwell, Eds.), CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, R. Brent, R. E. Kingston, D. D. Moore, J. G. Siedman, J. A. Smith, and K. Struhl, eds., 1987), CURRENT PROTOCOLS IN IMMUNOLOGY (J. E. Coligan, A. M. Kruisbeek, D. H. Margulies, E. M. Shevach and W. Strober, eds., 1991); ANNUAL REVIEW OF IMMUNOLOGY;並びにADVANCES IN IMMUNOLOGY等の雑誌の研究論文を参照されたい。本明細書に言及される全ての特許、特許出願及び出版物は、上記及び下記の両方において、引用することにより本明細書の一部をなす。
本明細書で使用される核酸化学、生化学、遺伝学、及び分子生物学の用語及び記号は、この分野の標準的な論文及びテキスト、例えば、Kornberg and Baker, DNA Replication, Second Edition (W.H. Freeman, New York, 1992); Lehninger, Biochemistry, Second Edition (Worth Publishers, New York, 1975); Strachan and Read, Human Molecular Genetics, Second Edition (Wiley-Liss, New York, 1999); Eckstein, editor, Oligonucleotides and Analogs: A Practical Approach (Oxford University Press, New York, 1991); Gait, editor, Oligonucleotide Synthesis: A Practical Approach (IRL Press, Oxford, 1984)等のものに従う。
定義
本明細書で使用される場合、「生物学的試料」という用語は、限定されるものではないが、被験体から単離された組織、細胞、生体液及びそれらの単離物、並びに被験体内に存在する組織、細胞及び体液を含む。
「in vitro」という用語は、例えば、精製された試薬又は抽出物、例えば細胞抽出物を含む、その技術分野で認められた意味を有する。「in vivo」という用語は、例えば、生細胞、例えば不死化細胞、初代細胞、細胞株、及び/又は生物内の細胞を含む、その技術分野で認められた意味も有する。
本明細書で使用される場合、「相補的」及び「相補性」という用語は、塩基対合の規則によって関連するヌクレオチド配列を参照して使用される。例えば、配列5’-AGT-3’は、配列5’-ACT-3’に相補的である。相補性は部分的であってもよく、全体的であってもよい。部分相補性は、1つ以上の核酸塩基が塩基対合の規則に従って一致しない場合に起こる。核酸間の全体的又は完全な相補性は、どの核酸塩基も塩基対合の規則の下で別の塩基と一致する場合に起こる。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率及び強度に大きな影響を及ぼす。
「ハイブリダイゼーション」という用語は、相補的な核酸の対合を指す。ハイブリダイゼーション及びハイブリダイゼーションの強度(すなわち、核酸間の会合の強度)は、核酸間の相補性の程度、関与する条件のストリンジェンシー、形成されるハイブリッドのT、及び核酸内のG:C比等の要因によって影響される。その構造内に相補的な核酸対を含む単一の分子は、「自己ハイブリダイズ」していると言われる。
「T」という用語は、核酸の融解温度を指す。融解温度は、二本鎖核酸分子の集団が一本鎖に半分解離する温度である。核酸のTを計算する方程式は、当該技術分野でよく知られている。標準的な参考文献で示されるように、T値の簡単な推定は次の式で計算することができる。核酸が1M NaClの水溶液中にある場合、T=81.5+0.41(%G+C)(例えば、Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985)を参照されたい)。他の参考文献は、Tの計算のために構造特性並びに配列特性を考慮したより高度な計算を含む。
「ストリンジェンシー」という用語は、温度、イオン強度、及び有機溶媒等の他の化合物の存在の条件を指し、その下で核酸ハイブリダイゼーションが行われる。
「低ストリンジェンシー条件」は、核酸ハイブリダイゼーションに関連して使用される場合、5×SSPE(43.8g/l NaCl、6.9g/l NaHPO(HO)及び1.85g/l EDTA、NaOHでpHを7.4に調整)、0.1%SDS、5×デンハルト試薬(500mlあたり50×デンハルトは次を含む:5g Ficoll(Type 400、Pharmacia)、5g BSA(画分V;Sigma))、及び100mg/ml変性サケ精子DNAからなる溶液中での42℃での結合又はハイブリダイゼーション、続いて約500ヌクレオチド長のプローブを用いる場合、5×SSPE、0.1%SDSを含む溶液中42℃での洗浄と同等の条件を含む。
「中ストリンジェンシー条件」は、核酸ハイブリダイゼーションに関連して使用される場合、5×SSPE(43.8g/l NaCl、6.9g/l NaHPO(HO)及び1.85g/l EDTA、NaOHでpHを7.4に調整)、0.5%SDS、5×デンハルト試薬、及び100mg/ml変性サケ精子DNAからなる溶液中での42℃での結合又はハイブリダイゼーション、続いて約500ヌクレオチド長のプローブを用いる場合、1.0×SSPE、1.0%SDSを含む溶液中42℃での洗浄と同等の条件を含む。
「高ストリンジェンシー条件」は、核酸ハイブリダイゼーションに関連して使用される場合、5×SSPE(43.8g/l NaCl、6.9g/l NaHPO(HO)及び1.85g/l EDTA、NaOHでpHを7.4に調整)、0.5%SDS、5×デンハルト試薬、及び100mg/ml変性サケ精子DNAからなる溶液中での42℃での結合又はハイブリダイゼーション、続いて約500ヌクレオチド長のプローブを用いる場合、0.1×SSPE、1.0%SDSを含む溶液中42℃での洗浄と同等の条件を含む。
本明細書で使用される場合、「ゲノム」という用語は、個体、細胞、又はオルガネラによって運ばれる集合的な遺伝子セットとして定義される。本明細書で使用される場合、「ゲノムDNA」という用語は、個体、細胞、又はオルガネラによって運ばれる部分的又は完全な集合遺伝子セットを含むDNA材料として定義される。
本明細書で使用される場合、「ヌクレオシド」という用語は、リボース又はデオキシリボース糖に共有結合したプリン又はピリミジン塩基を有する分子を指す。例示的なヌクレオシドとしては、アデノシン、グアノシン、シチジン、ウリジン及びチミジンが挙げられる。追加の例示的なヌクレオシドとしては、イノシン、1-メチルイノシン、プソイドウリジン、5,6-ジヒドロウリジン、リボチミジン、2N-メチルグアノシン及び2,2-N,N-ジメチルグアノシン(「希少」ヌクレオシドとも称される)が挙げられる。「ヌクレオチド」という用語は、糖部分へのエステル結合で結合した1つ以上のリン酸基を有するヌクレオシドを指す。例示的なヌクレオチドとしては、ヌクレオシド一リン酸、二リン酸及び三リン酸が挙げられる。「ポリヌクレオチド」、「オリゴヌクレオチド」及び「核酸分子」という用語は、本明細書では同じ意味で使用され、5’及び3’炭素原子間のホスホジエステル結合によって互いに結合された任意の長さのデオキシリボヌクレオチド又はリボヌクレオチドのいずれかのヌクレオチドのポリマーを指す。ポリヌクレオチドは任意の三次元構造を持つことができ、既知又は未知のあらゆる機能を果たすことができる。以下は、ポリヌクレオチドの非限定的な例である:遺伝子又は遺伝子フラグメント(例えば、プローブ、プライマー、EST又はSAGEタグ)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、単離された任意のDNA配列、単離された任意のRNA配列、核酸プローブ及びプライマー。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類縁体等の修飾ヌクレオチドを含むことができる。この用語は、二本鎖分子と一本鎖分子との両方を指すこともある。別段の指定又は要求がない限り、ポリヌクレオチドを含む本発明の任意の実施形態は、二本鎖形態と、二本鎖形態を構成することが知られている、又は予測される2つの相補的な一本鎖形態のそれぞれの両方を包含する。ポリヌクレオチドは、アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、及びポリヌクレオチドがRNAである場合、チミンの代わりにウラシル(U)の4つのヌクレオチド塩基の特定の配列で構成される。したがって、ポリヌクレオチド配列という用語は、ポリヌクレオチド分子のアルファベット表現である。このアルファベット表現は、中央処理ユニットを有するコンピューター内のデータベースに入力することができ、機能ゲノミクス及びホモロジー検索等のバイオインフォマティクスアプリケーションに使用することができる。
「DNA」、「DNA分子」、及び「デオキシリボ核酸分子」という用語は、デオキシリボヌクレオチドのポリマーを指す。DNAは自然に合成され得る(例えば、DNA複製により)。RNAは転写後修飾が可能である。DNAは化学的に合成することもできる。DNAは一本鎖(すなわち、ssDNA)又は多本鎖(例えば、二本鎖、すなわちdsDNA)であり得る。
「ヌクレオチド類縁体」、「変性ヌクレオチド」及び「修飾ヌクレオチド」という用語は、非天然に存在するリボヌクレオチド又はデオキシリボヌクレオチドを含む非標準ヌクレオチドを指す。或る特定の例示的な実施形態において、ヌクレオチド類縁体は、ヌクレオチドの或る特定の化学的性質を変化させるが、ヌクレオチド類縁体がその意図された機能を果たす能力を保持するように、任意の位置で修飾される。誘導体化され得るヌクレオチド位の例としては、5位、例えば、5-(2-アミノ)プロピルウリジン、5-ブロモウリジン、5-プロピンウリジン、5-プロペニルウリジン等;6位、例えば6-(2-アミノ)プロピルウリジン;アデノシン及び/又はグアノシンの場合の8位、例えば8-ブロモグアノシン、8-クロログアノシン、8-フルオログアノシン等が挙げられる。また、ヌクレオチド類縁体としては、デアザヌクレオチド、例えば、7-デアザ-アデノシン;O-及びN修飾された(例えば、アルキル化、例えば、N6-メチルアデノシン、又は当該技術分野で別途知られている)ヌクレオチド;並びにHerdewijn, Antisense Nucleic Acid Drug Dev., 2000 Aug. 10(4):297-310に記載されるような他の複素環式修飾ヌクレオチド類縁体も挙げられる。
ヌクレオチド類縁体はまた、ヌクレオチドの糖部分に対する修飾を含み得る。例えば、2’OH基は、H、OR、R、F、Cl、Br、I、SH、SR、NH、NHR、NR、COOR、又はORから選択される基で置換されてもよく、Rは、置換又は未置換のC~Cアルキル、アルケニル、アルキニル、アリール等である。その他の可能な修飾としては、米国特許第5,858,988号及び同第6,291,438号に記載のものが挙げられる。
ヌクレオチドのリン酸基はまた、例えば、1つ以上のリン酸基の酸素を硫黄で置換することによって(例えば、ホスホロチオエート)、又はヌクレオチドがその意図された機能を果たすことを可能にする他の置換を行うことによって、例えばEckstein, Antisense Nucleic Acid Drug Dev. 2000 Apr. 10(2):117-21, Rusckowski et al. Antisense Nucleic Acid Drug Dev. 2000 Oct. 10(5):333-45, Stein, Antisense Nucleic Acid Drug Dev. 2001 Oct. 11(5):317-25, Vorobjev et al. Antisense Nucleic Acid Drug Dev. 2001 Apr. 11(2):77-85、及び米国特許第5,684,143号に記載されるように修飾され得る。上で参照される修飾の一部(例えば、リン酸基修飾)は、例えば、上記類縁体を含むポリヌクレオチドのin vivo又はin vitroでの加水分解速度を低下させる。
DNA試料の入手
本明細書に記載の方法により処理される核酸は、DNAであってもよく、それらは、例えば、ヒト試料等の任意の有用な供給源から得ることができる。特定の実施形態において、二本鎖DNA分子は、例えば、ヒト由来の試料から得られるゲノム等のゲノムを含むものとして更に定義される。試料は、血液、血清、血漿、脳脊髄液、頬擦過物(cheek scrapings)、乳頭吸引液、生検試料、精液(射精液と呼ばれることもある)、尿、糞便、毛包、唾液、汗、免疫沈降又は物理的に分離されたクロマチン等、ヒト由来の任意の試料であってもよい。特定の実施形態において、試料は単一の細胞を含む。特定の実施形態において、試料は単一の細胞のみを含む。
一態様によれば、DNA試料は、ゲノムDNA、マイクロ解剖染色体DNA、酵母人工染色体(YAC)DNA、プラスミドDNA、コスミドDNA、ファージDNA、P1由来人工染色体(PAC)DNA、又は細菌人工染色体(BAC)DNA、ミトコンドリアDNA、葉緑体DNA、法医学試料DNA、又は試験する天然若しくは人工の供給源からの他のDNAである。別の好ましい実施形態において、DNA試料は、哺乳類DNA、植物DNA、酵母DNA、ウイルスDNA、又は原核生物DNAである。更に別の好ましい実施形態において、DNA試料は、ヒト、ウシ、ブタ、ヒツジ、ウマ、齧歯類、鳥類、魚、エビ、植物、酵母、ウイルス、又は細菌から得られる。DNA試料はゲノムDNAであることが好ましい。
或る特定の例示的な実施形態において、細胞が同定され、次いで単一の細胞又は複数の細胞が単離される。本開示の範囲内の細胞は、DNA含有量の理解が当業者によって有用であると考えられるあらゆる種類の細胞を含む。本開示による細胞としては、任意の種類の癌細胞、肝細胞、卵母細胞、胚、幹細胞、iPS細胞、ES細胞、ニューロン、赤血球、メラニン形成細胞、星状膠細胞、生殖細胞、オリゴデンドロサイト、腎臓細胞等を含む。一態様によれば、本発明の方法は、単一細胞からの細胞DNAを用いて実施される。複数の細胞は、約2個~約1000000個の細胞、約2個~約10個の細胞、約2個~約100個の細胞、約2個~約1000個の細胞、約2個~約10000個の細胞、約2個~約100000個の細胞、約2個~約10個の細胞、又は約2個~約5個の細胞を含む。
本明細書で使用される場合、「単一細胞」は1つの細胞を指す。本明細書に記載される方法において有用な単一細胞は、目的の組織から、又は生検試料、血液試料若しくは細胞培養物から得ることができる。さらに、特定の臓器、組織、腫瘍、新生物等から細胞を得て、本明細書に記載する方法で使用することができる。さらに、一般に、細菌又は酵母を含む原核生物又は真核生物の単細胞生物の集団等、任意の集団からの細胞をこの方法で使用することができる。単一細胞懸濁液は、例えば、トリプシン又はパパインを酵素的に使用して、組織試料中で細胞をつないでいるタンパク質を消化すること、又は培養物中で付着細胞を放出すること、又は試料中の細胞を機械的に分離することを含む、当該技術分野で知られている標準的な方法を用いて得ることができる。単一細胞は、単一細胞を個別に処理できる任意の適切な反応容器に入れることができる。例えば、96ウェルプレートで、各単一細胞を1つのウェルに入れる。
単一細胞を操作する方法は当該技術分野で知られており、蛍光活性化細胞選別(FACS)、フローサイトメトリー(Herzenberg., PNAS USA 76:1453-55 1979)、マイクロマニピュレーション、及び半自動セルピッカー(例えば、Stoelting Co.製のQuixell(商標)細胞移送システム)の使用が挙げられる。個々の細胞は、例えば、位置、形態、又はレポーター遺伝子発現等の顕微鏡観察によって検出可能な特徴に基づいて個別に選択することができる。さらに、勾配遠心分離とフローサイトメトリーとの組合せを使用して、分離又は選別の効率を高めることもできる。
所望の細胞が同定されたら、その細胞を溶解して、当業者に知られている方法を用いて、DNAを含む細胞内容物を放出する。細胞内容物は、容器内又は収集量(collection volume)に収容される。本発明のいくつかの態様では、ゲノムDNA等の細胞内容物は、細胞を溶解することによって細胞から放出され得る。溶解は、例えば、細胞を加熱することによって、又は洗浄剤若しくは他の化学的方法を使用することによって、又はこれらの組み合わせによって達成することができる。しかしながら、当該技術分野で知られている任意の適切な溶解法を使用することができる。例えば、細胞を溶解するには、Tween-20の存在下、72℃で2分間細胞を加熱するだけで十分である。或いは、細胞を、水中で65℃まで10分間(Esumi et al., Neurosci Res 60(4):439-51 (2008))、若しくは0.5%NP-40を補充したPCRバッファーII(Applied Biosystems)で70℃まで90秒間(Kurimoto et al., Nucleic Acids Res 34(5):e42 (2006))加熱することもでき、又は溶解を、プロテアーゼK等のプロテアーゼ又はグアニジンイソチオシアネート等のカオトロピック塩の使用によって達成することができる(米国特許出願公開第2007/0281313号)。本明細書に記載される方法によるゲノムDNAの増幅を細胞溶解物に対して直接行うことができ、その結果、反応混合物を細胞溶解物に添加することができる。或いは、細胞溶解物を、各容量の容器、チューブ又は領域に含まれる細胞溶解物の一部を用いて、当業者に知られている方法を用いて、2つ以上の容器、チューブ、又は領域等、2つ以上の量に分離することができる。各容器、チューブ又は領域に含まれるゲノムDNAは、次いで、本明細書に記載される方法、又は当業者に知られている方法によって増幅され得る。
本発明で使用される核酸は、天然又は非天然の塩基を含むこともできる。これに関して、天然デオキシリボ核酸は、アデニン、チミン、シトシン又はグアニンからなる群から選択される1種以上の塩基を有することができ、リボ核酸は、ウラシル、アデニン、シトシン又はグアニンからなる群から選択される1種以上の塩基を有することができる。核酸に含めることができる例示的な非天然塩基は、天然の骨格又は類縁体構造を有するかにかかわらず、限定されないが、イノシン、キサンチン、ヒポキサンチン、イソシトシン、イソグアニン、5-メチルシトシン、5-ヒドロキシメチルシトシン、2-アミノアデニン、6-メチルアデニン、6-メチルグアニン、2-プロピルグアニン、2-プロピルアデニン、2-チオラシル、2-チオチミン、2-チオシトシン、15-ハロウラシル、15-ハロシトシン、5-プロピニルウラシル、5-プロピニルシトシン、6-アゾウラシル、6-アゾシトシン、6-アゾチミン、5-ウラシル、4-チオウラシル、8-ハロアデニン又はグアニン、8-アミノアデニン又はグアニン、8-チオールアデニン又はグアニン、8-チオアルキルアデニン又はグアニン、8-ヒドロキシルアデニン又はグアニン、5-ハロ置換ウラシル又はシトシン、7-メチルグアニン、7-メチルアデニン、8-アザグアニン、8-アザアデニン、7-デアザグアニン、7-デアザアデニン、3-デアザグアニン、3-デアザアデニン等が挙げられる。特定の実施形態は、非特異的ハイブリダイゼーションを減少させるため米国特許第5,681,702号に概ね記載されるように、核酸中のイソシトシン及びイソグアニンを利用することができる。
フラグメントを生成するためのトランスポソームの使用
本発明の一部は、トランスポゼース又はトランスポソームを使用して、ゲノムDNA等のオリジナルの又は初めの核酸配列を断片化し、切断部位又は断片化部位の各末端に異なるプライミング部位配列を付着させ、それによりセットの各メンバーが、2つの固有の異なったプライミング部位配列を有する一組のフラグメントを生成する、DNA又はゲノムDNA等から核酸フラグメントテンプレートを作製する方法に一部基づく。核酸フラグメントテンプレートを増幅してアンプリコンを生成する。核酸フラグメントテンプレートのアンプリコンを収集し、配列決定することができる。収集されたアンプリコンは、ゲノムDNA等、オリジナルの核酸のフラグメントのアンプリコンのライブラリーを形成する。例示的な一態様によれば、Tn5等の酵素を用いて核酸フラグメントを作製する方法が記載される。かかる方法は当該技術分野で知られており、IlluminaのNexteraキットを使用して実施される方法を含む。例示的な一態様によれば、本明細書に記載される方法は、トランスポソームライブラリー及び「タグメンテーション(tagmentation)」と称される方法を利用して、フラグメントがより大きなdsDNA配列から作られ、フラグメントがプライマーでタグ付けされ、単一のプライマーの伸長及び増幅に使用される。
一態様によれば、溶解された単一細胞から得られるゲノム核酸等のゲノムDNAが得られる。複数のトランスポソーム又はトランスポソームのライブラリーを使用して、ゲノムDNAを二本鎖フラグメントに切断する。複数の又はライブラリーの各トランスポソームは、トランスポゾンDNAに結合したトランスポゼースのダイマーであり、すなわち、各トランスポソームは、2つの別個のトランスポゾンDNAを含む。トランスポソームの各トランスポゾンDNAは、トランスポゼース結合部位及びプライマー結合部位配列を含む。プライマー結合部位配列はトランスポソームに固有のものである。一態様によれば、トランスポソームの各トランスポゾンのプライミング部位配列は固有であってもよく、及び/又は異なってもよい。一態様によれば、トランスポソームの各トランスポゾンのプライミング部位配列は同じであり得る。一態様によれば、トランスポソームの大部分は、異なるプライミング部位配列を有する2つのトランスポゾンDNAを有し、トランスポソームのごく一部のみが、同じプライミング部位配列を有する2つのトランスポゾンDNAを有する。一態様によれば、各トランスポソームメンバーの2つのトランスポゾンDNAのプライミング部位配列は同じであってもよいが、異なるトランスポソームメンバーからのトランスポゾンDNAの単数又は複数のプライミング部位配列は固有であり異なる。トランスポゼースに結合するプライミング部位配列を有するトランスポゾン核酸配列は、全てのシトシンでメチル化されてもよいことから、メチル化検出に必要なシトシン変換後にプライミング部位配列は変化しない。
一態様によれば、トランスポソームの各トランスポゾンDNAのプライミング部位配列は固有であり異なっている。一態様によれば、トランスポソームのトランスポゾンDNAの単数又は複数のプライミング部位配列は、固有であり、複数のトランスポソーム又はトランスポソームライブラリーの残りのメンバーとは異なる。一態様によれば、複数又はライブラリーのトランスポソームの各トランスポソームは、複数のトランスポソーム又はトランスポソームライブラリーの残りのメンバーとは異なる独自の異なったプライミング部位配列を有し、複数のトランスポソーム又はトランスポソームライブラリーの残りのメンバーとは異なる2つの固有の異なったプライミング部位配列を有してもよい。トランスポゾンDNAは、各切断部位又は断片化部位で、各二本鎖フラグメントの上下の鎖に付着するようになる。プライミング部位配列はトランスポゾンDNAごとに異なる場合があるため、切断部位又は断片化部位には異なるプライミング部位配列がタグ付けされる。プライミング部位配列は各トランスポゾンDNAで同じ場合があるため、切断部位又は断片化部位には同じプライミング部位配列がタグ付けされる。フラグメントを生成するために使用される隣接するトランスポソームはそれぞれ、それに関連する異なるプライマー結合部位配列を有し、フラグメントは、フラグメントの各末端に異なるプライマー結合部位配列を有する。したがって、フラグメントは2つの固有の異なったプライマー結合部位配列を有することになる。各トランスポソームは、それに関連する独自の及び/又は異なったプライミング部位配列を有し(及びそれに関連する2つの固有の及び/又は異なったプライミング部位配列を有していてもよい)、トランスポソームのライブラリーを使用して多数の切断部位又は断片化部位を作るため、各切断部位又は断片化部位は、切断部位のいずれかの末端に付着した異なった固有のプライミング部位配列を有し、各フラグメントは、そのフラグメントの各末端に異なった及び/又は固有のプライミング部位配列を有する。したがって、元の核酸配列からの多くのフラグメントは、トランスポソームのライブラリーによって作られ、各フラグメントは、フラグメントの各末端に異種プライミング部位配列を持つ。次いで、二本鎖のフラグメントを処理して、ギャップを埋める。フラグメントは、プライマー配列、DNAポリメラーゼ、及びPCR増幅のためのヌクレオチド等の適切な増幅試薬を用いて増幅され、当業者に知られている方法を用いて配列決定される。
或る特定の態様によれば、例示的なトランスポゾンシステムとしては、Tn5トランスポゼース、Muトランスポゼース、Tn7トランスポゼース又はIS5トランスポゼース等が挙げられる。他の有用なトランスポゾンシステムは、当業者に知られており、Tn3トランスポゾンシステム(Maekawa, T., Yanagihara, K., and Ohtsubo, E. (1996), A cell-free system of Tn3 transposition and transposition immunity, Genes Cells 1, 1007-1016を参照されたい)、Tn7トランスポゾンシステム(Craig, N.L. (1991), Tn7: a target site-specific transposon, Mol. Microbiol. 5, 2569-2573を参照されたい)、Tn10トランスポゾンシステム(Chalmers, R., Sewitz, S., Lipkow, K., and Crellin, P. (2000), Complete nucleotide sequence of Tn10, J. Bacteriol 182, 2970-2972を参照されたい)、Piggybacトランスポゾンシステム(Li, X., Burnight, E.R., Cooney, A.L., Malani, N., Brady, T., Sander, J.D., Staber, J., Wheelan, S.J., Joung, J.K., McCray, P.B., Jr., et al. (2013), PiggyBac transposase tools for genome engineering, Proc. Natl. Acad. Sci. USA 110, E2279-2287を参照されたい)、Sleeping beautyトランスポゾンシステム(Ivics, Z., Hackett, P.B., Plasterk, R.H., and Izsvak, Z. (1997), Molecular reconstruction of Sleeping Beauty, a Tc1-like transposon from fish, and its transposition in human cells, Cell 91, 501-510を参照されたい)、Tol2トランスポゾンシステム(Kawakami, K. (2007), Tol2: a versatile gene transfer vector in vertebrates, Genome Biol. 8 Suppl. 1, S7を参照されたい)が挙げられる。
特定のTn5転位システムが説明され、当業者に利用可能である。Goryshin, I.Y. and W.S. Reznikoff, Tn5 in vitro transposition. The Journal of biological chemistry, 1998. 273(13): p. 7367-74; Davies, D.R., et al., Three-dimensional structure of the Tn5 synaptic complex transposition intermediate. Science, 2000. 289(5476): p. 77-85; Goryshin, I.Y., et al., Insertional transposon mutagenesis by electroporation of released Tn5 transposition complexes. Nature biotechnology, 2000. 18(1): p. 97-100、及びSteiniger-White, M., I. Rayment, and W.S.Reznikoff, Structure/function insights into Tn5 transposition. Current opinion in structural biology, 2004. 14(1): p. 50-7を参照されたい(これらの各々が、全ての目的で、引用することによりその全体が本明細書の一部をなす)。DNAライブラリーの調製及び他の用途にTn5転位システムを利用するキットが知られている。Adey, A., et al., Rapid, low-input, low-bias construction of shotgun fragment libraries by high-density in vitro transposition. Genome biology, 2010. 11(12): p. R119; Marine, R., et al., Evaluation of a transposase protocol for rapid generation of shotgun high-throughput sequencing libraries from nanogram quantities of DNA. Applied and environmental microbiology, 2011. 77(22): p. 8071-9; Parkinson, N.J., et al., Preparation of high-quality next-generation sequencing libraries from picogram quantities of target DNA. Genome research, 2012. 22(1): p. 125-33; Adey, A. and J. Shendure, Ultra-low-input, tagmentation-based whole-genome bisulfite sequencing. Genome research, 2012. 22(6): p. 1139-43; Picelli, S., et al., Full-length RNA-seq from single cells using Smart-seq2. Nature protocols, 2014. 9(1): p. 171-81 and Buenrostro, J.D., et al., Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nature methods, 2013を参照されたい(これらの各々が、全ての目的で、引用することによりその全体が本明細書の一部をなす)。国際公開第98/10077号、欧州特許第2527438号、及び欧州特許第2376517号も参照されたい(これらの各々が、全ての目的で、引用することにより本明細書の一部をなす)。市販の転位キットはNEXTERAという名称で販売されており、Illuminaから入手可能である。
ギャップ充填
本明細書に記載のトランスポソーム法によって生成された二本鎖フラグメントは、次いで、ギャップを埋めるために処理される。一態様によれば、トランスポゾンは、本明細書に記載されるメチル化シトシンアダプター又はプライマー等の1つ以上のメチル化シトシンを含み得る。メチル化シトシンアダプターを使用してTn5転位を行うシステムでは、ギャップ充填工程は、完全にメチル化された二本鎖アダプターを作るために、dNTPミックスにおいてdCTPの代わりにメチル化dCTPを使用することを含む。
キャリアDNA及び任意の精製
或る特定の態様によれば、ギャップが充填されたフラグメントを、次いで、キャリアDNAと組み合わせる。キャリアDNAは、100塩基対(bp)から4キロ塩基対の長さの任意のdsDNAフラグメントであり得る。一態様によれば、キャリアDNAは、標的DNAとは異なるDNA型であってもよい。一態様によれば、キャリアDNAは、標的DNAと同じDNA型であってもよい。一態様によれば、キャリアDNAは超音波処理されたラムダDNAである。一態様によれば、キャリアDNAはIlluminaシーケンシングアダプターを含まない。
キャリアDNAは、化学処理の厳しい条件から標的DNAを保護し、標的DNAへの損傷又は標的DNAの損失を減らす働きをする。DNA損傷に関しては、例示的な非バイサルファイト変換は、ヒドロキシルラジカルを生成することによってDNA損傷を引き起こす強力な酸化試薬Fe(II)を利用する。キャリアDNAは、試料DNAよりも100倍~10000倍(例えば、100倍~1000倍)多い量で反応媒体に添加され、過剰なヒドロキシラジカルを占有し、標的DNAとの相互作用を防止又は制限する働きをする。例示的な一態様によれば、単一細胞由来の6pgの試料DNAの場合、20ngの超音波処理されたラムダキャリアDNAが提供される。
DNA損失に関しては、異なる工程の前又は更には異なる工程の間に、変換反応は特殊なバッファー及び精製(DNAを保存しながらバッファーを交換する)を使用する。また、PCR増幅の前に化学試薬を除去する精製工程が必要になる場合がある。シトシン変換プロセスの結果として、2つ又は3つの精製工程を行うことができる。各DNA精製工程は、単一細胞からのDNAのように、入力DNA量が少ない場合、50%~90%のDNA損失をもたらす可能性がある。しかしながら、6pgの試料DNAに20ngのラムダDNAを添加する等、キャリアDNAを試料DNAに添加する場合、DNA精製では10%の損失しか発生せず、キャリアDNAと混合しても試料DNAの90%が保存される。本開示によれば、入力DNAの量が増加するにつれて、DNA精製の効率が向上する。
或る特定の態様によれば、ギャップ充填された二本鎖セグメント及びキャリアDNAを含む反応媒体は、メチル化検出に必要とされるDNA変換の前に、DNAスピンカラム若しくはビーズベースのDNA精製、又は当業者に知られている他の精製方法によって精製することができる。或いは、反応媒体は直接化学変換に進むことができる。
化学処理
キャリアDNAと組み合わされたギャップ充填フラグメントは、シトシンをウラシルに化学的に変更する化学試薬との混合へと進む。かかる化学試薬は米国特許出願公開第2013/0244237号に記載されており、New England Biolabsから入手され得る。他の酵素試薬は、本開示に基づいて、当業者には明らかになるであろう。一態様によれば、試薬はバイサルファイトではない若しくはバイサルファイトを除外する、又は試薬がバイサルファイトでないことを条件として、シトシンをウラシルに変換する。
任意の精製
或る特定の態様によれば、化学的に変換されたフラグメントを含む反応媒体は、増幅の前に、DNAスピンカラム又はビーズベースのDNA精製、又は当業者に知られている他の精製方法によって精製することができる。或いは、反応媒体は直接増幅に進むことができる。
増幅
一態様によれば、標的フラグメントのみの増幅を、トランスポソームによってフラグメントに組み込まれたアダプター配列を標的とするプライマーを用いて行う。キャリアDNAは増幅されず、変性によりssDNAになる。
「増幅」又は「増幅する/増幅すること」という表現は、特定のポリヌクレオチドの追加のコピー又は複数のコピーが形成されるプロセスを指す。増幅するDNAは、単一の細胞又は少数の細胞集団から取得され得る。本明細書に記載の方法は、単一の反応容器内で実施される単一の反応混合物等の反応混合物中の任意の種又は生物からDNAを増幅することを可能にする。一態様では、本明細書に記載される方法は、ヒト、動物、植物、酵母、ウイルス、真核生物及び原核生物のDNAを含むがこれらに限定されない任意の供給源からのDNAの配列に依存しない増幅を含む。
本明細書に記載のトランスポゼース法を用いて作製されたDNAフラグメントテンプレートを、当業者に知られている方法を用いて微小液滴内で増幅することができる。微小液滴は、油相及び水相のエマルジョンとして形成することができる。エマルジョンは、連続油相内の水滴又は単離された水の量(volume)を含み得る。エマルジョン全ゲノム増幅法は、単一細胞のゲノムの均一な増幅のため、各フラグメントを単離するために油中の少量の水滴を使用して記載される。各フラグメントを独自の液滴又は分離された水性反応ボリュームに分配することにより、各液滴はDNA増幅の飽和に達することができる。次に、各液滴内のアンプリコンは解乳化によって融合され、単一細胞の全ゲノムの全てのフラグメントが均一に増幅される。
或る特定の態様では、PCRを使用して増幅が達成される。PCRは、上流及び下流のプライマーからなる一対のプライマー又はプライマーのセットと、DNAポリメラーゼ等の重合触媒と、典型的には熱的に安定なポリメラーゼ酵素とを使用して、標的ポリヌクレオチドから複製コピーを作成する反応である。PCRの方法は当該技術分野でよく知られており、例えばMacPherson et al. (1991) PCR 1: A Practical Approach (IRL Press at Oxford University Press)に教示されている。Mullis(米国特許第4,683,195号、同第4,683,202号及び同第4,965,188号)の「ポリメラーゼ連鎖反応」(「PCR」)という用語は、クローニング又は精製を行わずに標的配列のセグメントの濃度を増加させる方法を指す。標的配列を増幅するこのプロセスは、オリゴヌクレオチドプライマーに所望の標的配列及び増幅試薬を提供し、続いてポリメラーゼ(例えば、DNAポリメラーゼ)の存在下での熱サイクリングの正確な順序を提供することを含む。プライマーは、二本鎖標的配列のそれぞれの鎖(「プライマー結合配列」)と相補的である。増幅を行うために、二本鎖の標的配列を変性させた後、プライマーを標的分子内の相補配列にアニーリングする。アニーリングに続いて、プライマーはポリメラーゼで伸長され、新たな一対の相補鎖を形成する。変性、プライマーアニーリング、及びポリメラーゼ伸長の工程を何度も繰り返すことができ(すなわち、変性、アニーリング及び伸長は1つの「サイクル」を構成し、多数の「サイクル」が存在する可能性がある)、高濃度の所望の標的配列の増幅セグメントを得ることができる。所望の標的配列の増幅されたセグメントの長さは、プライマーの互いに対する相対的な位置によって決定され、したがって、この長さは制御可能なパラメータである。このプロセスの繰り返しの態様により、この方法は「ポリメラーゼ連鎖反応」(以下「PCR」)と称され、標的配列は「PCR増幅された」と言われる。
PCRを使用すると、ゲノムDNAの特定の標的配列の単一コピーを、いくつかの異なる方法論で検出可能なレベルまで増幅することができる(例えば、標識されたプローブとのハイブリダイゼーション、ビオチン化プライマーの取り込みとそれに続くアビジン酵素コンジュゲートの検出、dCTP又はdATP等の32P標識デオキシヌクレオチド三リン酸の増幅セグメントへの取り込み)。ゲノムDNAに加えて、任意のオリゴヌクレオチド又はポリヌクレオチド配列は、適切なプライマー分子のセットを用いて増幅することができる。特に、各微小液滴内でPCRプロセス自体によって作られた増幅セグメントは、それら自体が後続のPCR増幅のための効率的なテンプレートである。PCRを行う方法及びキットは、当該技術分野でよく知られている。PCR又は遺伝子クローニング等のポリヌクレオチドの複製コピーを生成する全てのプロセスを、本明細書では総称して複製と称する。プライマーは、サザンブロット分析又はノーザンブロット分析等のハイブリダイゼーション反応のプローブとしても使用できる。
「増幅」又は「増幅する/増幅すること」という表現は、特定のポリヌクレオチドの追加のコピー又は複数のコピーが形成されるプロセスを指す。増幅としては、PCR、ライゲーション増幅(又はリガーゼ連鎖反応、LCR)等の方法及びその他の増幅方法が挙げられる。これらの方法は当該技術分野で知られており、広く実施されている。例えば、米国特許第4,683,195号及び同第4,683,202号、並びにInnis et al., ''PCR protocols: a guide to method and applications'' Academic Press, Incorporated (1990)(PCRの場合)、及びWu et al. (1989) Genomics 4:560-569(LCRの場合)を参照されたい。一般に、PCR手順は、(i)DNA試料(又はライブラリー)内の特定の遺伝子へのプライマーの配列特異的ハイブリダイゼーション、(ii)DNAポリメラーゼを使用した複数回のアニーリング、伸長、及び変性を含むその後の増幅、並びに(iii)正しいサイズのバンドについてのPCR産物のスクリーニングで構成される遺伝子増幅の方法を記載する。使用されるプライマーは、重合の開始を提供するのに十分な長さと適切な配列のオリゴヌクレオチドであり、すなわち、各プライマーは、増幅されるゲノム遺伝子座の各鎖に相補的であるように特別に設計されている。
増幅反応を行うための試薬及びハードウェアが市販されている。特定の遺伝子領域からの配列を増幅するのに有用なプライマーは、好ましくは、標的領域又はその近接領域の配列と相補的であり、特異的にハイブリダイズし、当業者に知られている方法を用いて調製することができる。増幅によって生成された核酸配列は、直接配列決定することができる。
2本の一本鎖ポリヌクレオチド間でハイブリダイゼーションが反平行配置で起こる場合、その反応は「アニーリング」と呼ばれ、これらのポリヌクレオチドは「相補的」と説明される。二本鎖ポリヌクレオチドは、第1のポリヌクレオチドの鎖の一方と第2のポリヌクレオチドの鎖の一方との間でハイブリダイゼーションが起こり得る場合、もう一方のポリヌクレオチドと相補的又は相同性であり得る。相補性又は相同性(或るポリヌクレオチドが別のポリヌクレオチドと相補的である程度)は、一般に認められている塩基対合の規則に従って、互いに水素結合を形成すると予想される対向鎖の塩基の割合に関して定量化で可能である。
「PCR産物」、「PCRフラグメント」、及び「増幅産物」という用語は、変性、アニーリング、及び伸長のPCR工程の2サイクル以上が完了した後に得られる化合物の混合物を指す。これらの用語は、1つ以上の標的配列の1つ以上のセグメントの増幅があった場合を包含する。
「増幅試薬」という用語は、プライマー、核酸テンプレート、及び増幅酵素を除いて、増幅に必要な試薬(デオキシリボヌクレオチド三リン酸、バッファー等)を指す場合がある。典型的には、増幅試薬を他の反応成分と共に反応容器(試験管、マイクロウェル等)に入れ、収容する。増幅法としては、当業者に知られているPCR法が挙げられ、またローリングサークル増幅(Blanco et al., J. Biol.Chem., 264, 8935-8940, 1989)、超分岐ローリングサークル増幅(Lizard et al., Nat. Genetics, 19, 225-232, 1998)、及びループ介在等温増幅(Notomi et al., Nuc. Acids Res., 28, e63, 2000)が挙げられる(これらの各々が引用することによりそれらの全体が本明細書の一部をなす)。
エマルジョンPCRの場合、エマルジョンPCR反応は、「油中水」ミックスを激しく振盪又は撹拌することによって作られ、数百万ミクロンサイズの水性コンパートメントを生成する。マイクロ流体チップは、油相及び水相を振盪又は撹拌することによってエマルジョンを作る装置を備えてもよい。或いは、或る特定の油を水相と組み合わせるか、又は油相に水相を導入することによって、水滴を自発的に形成することもできる。増幅するDNAライブラリーは、乳化の前に限定希釈液で混合される。コンパートメントサイズ、すなわち微小液滴サイズと、増幅されるDNAフラグメントライブラリーの限界希釈を生じさせる微小液滴の量との組み合わせを使用して、平均して1つのDNA分子のみを含むコンパートメントを生成する。微小液滴形成又は乳化工程中に生成される水コンパートメントのサイズに応じて、1μlあたり最大3×10の個別のPCR反応を同じチューブで同時に行うことができる。本質的に、エマルジョン中の小さな水コンパートメント微小液滴はそれぞれ、マイクロPCR反応器を形成する。エマルジョン中のコンパートメントの平均サイズは、乳化条件に応じて、直径がサブミクロン~100ミクロン以上、又は1ピコリットル~1000ピコリットル、又は1ナノリットル~1000ナノリットル、又は1ピコリットル~1ナノリットル、又は1ピコリットル~1000ナノリットルの範囲である。
その他の増幅方法は、英国特許出願公開第2,202,328号及びPCT特許出願の国際出願PCT/US89/01025号(各々が引用することにより本明細書の一部をなす)に記載されるように、本開示に従って使用することができる。前者の出願では、「修飾された」プライマーがPCR様のテンプレート及び酵素依存性合成に使用される。プライマーは、捕捉部分(例えば、ビオチン)及び/又は検出器部分(例えば、酵素)で標識することによって修飾され得る。後者の出願では、過剰な標識されたプローブが試料に添加される。標的配列の存在下で、プローブは結合し、触媒的に切断される。切断後、標的配列はそのまま放出され、過剰なプローブに結合される。標識されたプローブの切断は、標的配列の存在を示す。
他の適切な増幅方法としては、「レース(race)」及び「片側(one-sided)PCR」が挙げられる(Frohman, In:PCR Protocols: A Guide To Methods And Applications, Academic Press, N.Y., 1990、それぞれ引用することにより本明細書の一部をなす)。得られる「ジオリゴヌクレオチド」の配列を有する核酸の存在下での2つ(又はそれ以上)のオリゴヌクレオチドのライゲーションに基づく方法であって、それによってジオリゴヌクレオチドを増幅する方法もまた、本開示に従ってDNAを増幅するために使用され得る(Wu et al., Genomics 4:560-569, 1989、引用することにより本明細書の一部をなす)。
本明細書で使用される場合、「プライマー」という用語は、一般に、天然又は合成のいずれかのオリゴヌクレオチドを含み、オリゴヌクレオチドは、ポリヌクレオチドテンプレートとデュプレックスを形成する際に、シーケンシングプライマー等の核酸合成の開始点として作用することができ、伸長デュプレックスが形成されるように、テンプレートに沿ってその3’末端から伸長される。伸長プロセス中に添加されるヌクレオチドの配列は、テンプレートポリヌクレオチドの配列によって決定される。通常、プライマーはDNAポリメラーゼによって伸長される。プライマーは、通常、3ヌクレオチド~36ヌクレオチド、また5ヌクレオチド~24ヌクレオチド、また14ヌクレオチド~36ヌクレオチドの範囲の長さを有する。本発明の範囲内のプライマーとしては、オルソゴナルプライマー、増幅プライマー、構造プライマー(constructions primer)等が挙げられる。プライマー対は、目的の配列又は目的の配列のセットに近接することができる。プライマー及びプローブは、配列において縮重又は準縮重であり得る。本発明の範囲内のプライマーは、標的配列に隣接して結合する。「プライマー」は短いポリヌクレオチドと考えることができ、一般に、標的とハイブリダイズすることにより、目的の試料中に潜在的に存在する標的又はテンプレートに結合し、その後、標的と相補的なポリヌクレオチドの重合を促進する遊離3’-OH基を有する。本発明のプライマーは、17ヌクレオチド~30ヌクレオチドの範囲のヌクレオチドからなる。一態様では、プライマーは、少なくとも17ヌクレオチド、或いは少なくとも18ヌクレオチド、或いは少なくとも19ヌクレオチド、或いは少なくとも20ヌクレオチド、或いは少なくとも21ヌクレオチド、或いは少なくとも22ヌクレオチド、或いは少なくとも23ヌクレオチド、或いは少なくとも24ヌクレオチド、或いは少なくとも25ヌクレオチド、或いは少なくとも26ヌクレオチド、或いは少なくとも27ヌクレオチド、或いは少なくとも28ヌクレオチド、或いは少なくとも29ヌクレオチド、或いは少なくとも30ヌクレオチド、或いは少なくとも50ヌクレオチド、或いは少なくとも75ヌクレオチド、或いは少なくとも100ヌクレオチドである。
精製
或る特定の態様によれば、増幅されたフラグメントを含む反応媒体は、シーケンシングの前に、DNAスピンカラム若しくはビーズベースのDNA精製、又は当業者に知られている他の精製方法によって精製することができる。PCR反応等による増幅後に続くDNA精製は、ほとんどの一本鎖キャリアDNAを除去し、シーケンシングの準備が整った純粋な増幅標的DNAライブラリーをもたらす。
シーケンシング
本明細書に記載される方法に従って増幅されたDNAは、当業者に知られている方法を用いて配列決定及び分析され得る。目的の核酸配列の配列決定は、限定されるものではないが、ハイブリダイゼーションによるシーケンシング(SBH)、ライゲーションによるシーケンシング(SBL)(Shendure et al. (2005) Science 309:1728)、定量的増分蛍光ヌクレオチド付加シーケンシング(QIFNAS)、段階的ライゲーション及び切断、蛍光共鳴エネルギー移動(FRET)、分子ビーコン、TaqManレポータープローブ消化、パイロシーケンシング、蛍光in situシーケンシング(FISSEQ)、FISSEQビーズ(米国特許第7,425,431号)、ウォブルシーケンシング(国際出願PCT/US05/27695号)、マルチプレックスシーケンシング(米国特許出願第12/027,039号、2008年2月6日に出願;Porreca et al (2007) Nat. Methods 4:931)、重合コロニー(POLONY)シーケンシング(米国特許第6,432,360号、同第6,485,944号、同第6,511,803号、及び国際出願PCT/US05/06425号);ナノグリッドローリングサークルシーケンシング(ROLONY)(米国特許出願第12/120,541号、2008年5月14日に出願)、対立遺伝子特異的オリゴライゲーションアッセイ(例えば、オリゴライゲーションアッセイ(OLA)、ライゲーテッドリニアプローブ及びローリングサークル増幅(RCA)読み出しを用いた単一テンプレート分子OLA、ライゲーテッドパドロックプローブ(ligated padlock probe)及び/又はライゲーションされた円形パドロックプローブ及びローリングサークル増幅(RCA)読み出しを用いた単一テンプレート分子OLA)等を含む当該技術分野で知られている様々な配列決定方法を用いて行うことができる。例えば、Roche 454、Illumina Solexa、AB-SOLiD、Helicos、Polonatorプラットフォーム等のプラットフォームを使用するハイスループットシーケンシング法も利用することができる。当該技術分野では、様々な光ベースのシーケンシング技術が知られている(Landegren et al. (1998) Genome Res. 8:769-76;Kwok (2000) Pharmacogenomics 1:95-100;及びShi (2001) Clin. Chem. 47:164-172)。
増幅されたDNAは、任意の適切な方法で配列決定され得る。特に、増幅されたDNAは、Applied BiosystemsのSOLiDシーケンシング技術、又はIlluminaのゲノムアナライザー等のハイスループットスクリーニング法を使用して配列決定することができる。本発明の一態様では、増幅されたDNAをショットガン配列決定することができる。読み取り回数は、少なくとも10000、少なくとも100万、少なくとも1000万、少なくとも1億、又は少なくとも10億であり得る。別の態様では、読み取り回数は10000~100000、或いは100000~100万、或いは100万~1000万、或いは1000万~1億、或いは1億~10億であり得る。「読み取り」とは、シーケンシング反応によって得られる連続核酸配列の長さのことである。
「ショットガンシーケンシング」とは、非常に大量のDNA(ゲノム全体等)を配列決定するために使用される方法を指す。この方法では、配列決定されるDNAは、最初に個別に配列決定できるより小さなフラグメントに細断される。これらのフラグメントの配列は、重複配列に基づいて元の順序に再構成され、完全な配列が生成される。DNAの「シュレッディング(shredding)」は、制限酵素消化又は機械的剪断を含む様々な技術を使用して行うことができる。重複配列は、通常、適切にプログラムされたコンピューターによって整列される。cDNAライブラリーのショットガンシーケンシングの方法及びプログラムは、当該技術分野ではよく知られている。
増幅及び配列決定方法は、診断アッセイ、予後アッセイ、薬理ゲノミクス、及びモニタリング臨床試験が予後(予測)目的で用いられ、それによって個体を予防的に治療する予測医学の分野で有用である。したがって、本発明の一態様は、個体が障害及び/又は疾患を発症するリスクがあるかどうかを判断するために、ゲノムDNAを決定するための診断アッセイに関する。かかるアッセイは、予後又は予測の目的で使用することができ、それによって障害及び/又は疾患の発症前に個人を予防的に治療することができる。したがって、或る特定の例示的な実施形態において、本明細書に記載される1つ以上の発現プロファイリング方法を使用して、1つ以上の疾患及び/又は障害を診断及び/又は予後判定する方法が提供される。
電子的実施形態
或る特定の例示的な実施形態において、本明細書に記載される1つ以上のゲノムDNA配列を含む電子機器可読媒体が提供される。本明細書で使用される場合、「電子機器可読媒体」とは、電子機器によって直接読み取り及びアクセス可能なデータ又は情報を格納、保持、又は収容するのに適した任意の媒体を指す。かかる媒体としては、限定されるものではないが、フロッピーディスク、ハードディスク記憶媒体、及び磁気テープ等の磁気記憶媒体;コンパクトディスク等の光学記憶媒体;RAM、ROM、EPROM、EEPROM等の電子記憶媒体;磁気/光学記憶媒体等の一般的なハードディスク及びこれらのカテゴリのハイブリッドを挙げることができる。媒体は、本明細書に記載された1つ以上の発現プロファイルをその上に記録するように適合又は構成される。
本明細書で使用される場合、「電子機器」という用語は、データ又は情報を格納するために構成又は適合された任意の適切なコンピューティング装置若しくは処理装置、又はその他のデバイスを含むことを意図する。本発明と共に使用するのに適した電子機器の例としては、スタンドアロンコンピューティング装置;ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、イントラネット、及びエクストラネットを含むネットワーク;携帯情報端末(PDA)、携帯電話、ポケットベル等の電子装置;並びにローカル処理システム及び分散処理システムが挙げられる。
本明細書で使用される場合、「記録された」とは、電子機器可読媒体に情報を格納又は符号化するプロセスを指す。当業者は、既知の媒体に情報を記録するための現在知られている方法のいずれかを容易に採用して、本明細書に記載される1つ以上の発現プロファイルを備える製品を作製することができる。
本発明のゲノムDNA情報を電子機器可読媒体に格納するために、種々のソフトウェアプログラム及びフォーマットを使用することができる。例えば、核酸配列は、ワープロテキストファイルで表すか、WordPerfect及びMicrosoft Word等の市販のソフトウェアでフォーマットするか、又はASCIIファイルの形式で表すことができ、DB2、Sybase、Oracle等のデータベースアプリケーションと並んでその他の形態で格納され得る。本明細書に記載の1つ以上の発現プロファイルを記録した媒体を取得又は作るために、任意の数のデータプロセッサ構造化フォーマット(例えば、テキストファイル又はデータベース)を用いることができる。
記載されている本発明の実施形態は、本発明の原理の適用のいくつかの例示にすぎないことを理解されたい。本発明の真の趣旨及び範囲から逸脱することなく、本明細書に提示される教示に基づいて、当業者によって多数の修正が行われ得る。本出願を通して引用されている全ての参考文献、特許、及び公開された特許出願の内容は、全ての目的で引用することによりそれらの全体が本明細書の一部をなす。
以下の実施例を、本発明を表すものとして記載する。これらの実施例は、これらの実施形態及び他の同等の実施形態が本開示、図及び添付の請求の範囲を考慮して明らかとなることから、本発明の範囲を限定するものと解釈されるものではない。
実施例I
特定の例示的な態様によれば、転位システムは、所望により、キャリアDNAを含む化学的メチル化処理、増幅、及びシーケンシングのための核酸フラグメントを作製するために使用される。一態様によれば、転位システムを使用して、ゲノムDNAを二本鎖ゲノムDNAフラグメントに断片化し、その中に異なるプライミング部位配列を有するトランスポゾンDNAを挿入する。図1に示すように、トランスポゾンDNAは、二本鎖トランスポゼース結合部位と、固有の異なったプライミング部位配列Mとを含む。図1には示されていないが、トランスポゾンDNAは1つ以上の5-メチルシトシンを含むことができる。二本鎖トランスポゼース結合部位は、オーバーハングの一端等で、プライミング部位配列を含む一本鎖オーバーハングに、共有結合等により連結又は接続された二本鎖19bpのTn5トランスポゼース(Tnp)結合部位であってもよい。トランスポゾンDNAは、トランスポゼースを使用してフラグメントを作りながら、単一細胞のゲノムDNAに挿入される。トランスポゼースの除去及びギャップ埋めの後、フラグメントの各末端に異種、又は異なった又は固有のプライミング部位配列を有するゲノムDNAフラグメントは、プライマーをDNAポリメラーゼ、ヌクレオチド及び増幅試薬と共に用いて増幅され、単一細胞の全ゲノムをPCR増幅する。
或る特定の態様によれば、いくつかの細胞、すなわち2個~5個、又は2個~10個の細胞、又は2個~100個、又は単一の細胞からのDNAといった微量又は少量のDNAを増幅する場合、増幅前に、単一細胞内から得ることができる少量(約6pg)のゲノムDNAを最大化するようにDNAカラム精製工程は行われない。DNAは、細胞溶解物又はその他の不純な状態から直接増幅することができる。したがって、DNA試料は不純であるか、未精製であるか、又は単離されていなくてもよい。したがって、本発明の方法の態様は、増幅のためにゲノムDNAを最大化し、他の方法、すなわち非マルチプレックス法と同様に、両末端に同じプライミング部位配列を有するフラグメントによる損失を低減することを可能にする。追加の態様によれば、本明細書に記載される方法は、PCR以外の増幅方法を利用することができる。
一態様によれば、図2に概ね示されるように、異なるパターンのオーバーハング配列によって示される、それぞれが固有の異なったプライミング部位配列を有するトランスポゼース(Tnp、灰色の円)及びトランスポゾンDNAを組み合わせて、複数のトランスポソームを形成する。各トランスポソームは、2つの異なった固有のプライミング部位配列を有する。各トランスポソームは、その複数ある内の互いのトランスポソームと比較して、2つの異なった固有のプライミング部位配列を有する。20個のトランスポゾン配列のトランスポゾン混合物のプールを作るため、等モルの各タイプのトランスポゾン配列を、10mM Tris pH=8、50mM NaCl、及び1mM EDTAを含むバッファーに混合する。トランスポソーム複合体をアセンブルするために、20個のトランスポゾンプールをTn5トランスポゼースと等モル比で混合し、室温で30分間インキュベートする。
図3Aに示すように、トランスポソームライブラリーのトランスポソームは、標的の単一細胞ゲノムDNAをダイマーとして無作為に捕捉するか、そうでなければ結合する。代表的なトランスポソームには1、2、3の番号が付けられているが、所望の用途に応じてトランスポソームメンバーの数が多くなる場合がある。異なった及び/又は固有のプライマー結合部位配列を有するトランスポゾンの代表的な数は、5~50である。各トランスポソームは、2つの固有の及び/又は異なったプライミング部位配列を含む。例えば、トランスポソーム1は、2つの固有の及び/又は異なったプライミング部位配列を含み、トランスポソーム2は、2つの固有の及び/又は異なったプライミング部位配列を含み、トランスポソーム3は、2つの固有の及び/又は異なったプライミング部位配列を含む等である。固有の及び/又は異なったプライミング部位配列は、トランスポソームの各トランスポゾンDNA内にある。トランスポソーム内のトランスポゼースはゲノムDNAを切断し、1つのトランスポゼースは上部鎖を切断し、1つのトランスポゼースは下鎖を切断してゲノムDNAフラグメントを作り出す。図3Aには示されていないが、フラグメントは1つ以上のシトシン又は1つ以上の5-メチルシトシンを含み得る。複数のトランスポソームは、1つ以上のシトシン又は1つ以上の5-メチルシトシンを含む、1つ以上のフラグメントを有する複数のゲノムDNAフラグメントを作り出す。
したがって、トランスポゾンDNAダイマーからの1つのトランスポゾンDNAが切断部位又は断片化部位の各末端に付着し、すなわち、トランスポソーム1からの1つのトランスポゾンDNAが左側の切断部位に付着し、トランスポソーム1からの他のトランスポゾンDNAが右側の切断部位に付着する。トランスポソームライブラリーは核酸をフラグメントに切断するため、各フラグメントはフラグメントの各末端で異種プライミング部位配列を持つことになる。これは、2つの例示的なフラグメントによって表され、上部フラグメントは、一端に固有の異なったプライミング部位配列1と、他の一端に固有の異なったプライミング部位配列2とを有する。同様に、下部フラグメントは、一端に固有の異なったプライミング部位配列2と、他の一端に固有の異なったプライミング部位配列3とを有する。図に示すように、2つのフラグメント間の切断部位はトランスポソーム2によって生成され、左側の切断部位(すなわち、図3の上部フラグメントの右側を見る)は、固有の異なったプライミング部位配列2を持つ1つのトランスポゾンを含み、右側の切断部位(すなわち、図3の下部フラグメントの左側を見る)は、固有の異なったプライミング部位配列2(「2」はトランスポソーム2を指す)を含む。一態様によれば、100nMのトランスポソームを細胞溶解物に添加し、転位反応混合物を55度で10分間インキュベートし、マグネシウムの最終濃度を5mMとする。トランスポゼースを除去した後、ゲノムDNAは数百万の小さなDNAフラグメントに切断され、それぞれが各末端に20個のトランスポゾン配列の1つでタグ付けされる(図3A)。このように、トランスポソームライブラリーは、本明細書に記載される20の異なった及び/又は固有のプライマー結合部位配列を含むことができ、一方、トランスポソームライブラリーのメンバーは数百万のメンバーに達する可能性がある。
図3Bに示すように、トランスポソームライブラリーのトランスポソームは、標的の単一細胞ゲノムDNAをダイマーとして無作為に捕捉するか、そうでなければ結合する。代表的なトランスポソームに1、2、3の番号が付けられているが、所望の用途に応じてトランスポソームメンバーの数が多くなる場合がある。異なった及び/又は固有のプライマー結合部位配列を有するトランスポゾンの代表的な数は、5~50である。各トランスポソームは、トランスポソームの各トランスポゾンにおいて同じ固有の及び/又は異なったプライマー結合部位配列を含む。例えば、トランスポソーム1は各トランスポゾンに同じプライマー結合部位配列を含み、トランスポソーム2は各トランスポゾンに同じプライマー結合部位配列を含み、トランスポソーム3は各トランスポゾンに同じプライマー結合部位配列を含む等である。しかしながら、各トランスポソームは、それに関連する固有の異なったプライマー結合部位を有し、そのため、各トランスポソームは、トランスポソームライブラリーの他のメンバーと比較して、それに関連する異なるプライマー結合部位を有する。トランスポソーム内のトランスポゼースはゲノムDNAを切断し、1つのトランスポゼースは上部鎖を切断し、1つのトランスポゼースは下鎖を切断してゲノムDNAフラグメントを作り出す。複数のトランスポソームは、シトシンをウラシルに変えるための化学処理のために、1つ以上のシトシン又は1つ以上の5-メチルシトシンを含む1つ以上のフラグメントを有する複数のゲノムDNAフラグメントを作り出す。したがって、トランスポゾンDNAダイマーからの1つのトランスポゾンDNAが切断部位又は断片化部位の各末端に付着し、すなわち、トランスポソーム1からの1つのトランスポゾンDNAが左側の切断部位に付着し、トランスポソーム1からの他のトランスポゾンDNAが右側の切断部位に付着する。トランスポソームライブラリーは核酸をフラグメントに切断することから、各フラグメントはフラグメントの各末端で異種プライミング部位配列を有することになり、これはフラグメントを作り出す核酸に結合された隣接するトランスポソームがそれぞれ異なるプライマー結合部位配列を持つためである。これは、2つの例示的なフラグメントによって表され、上部フラグメントは、一端に固有の異なったプライミング部位配列1と、他の一端に固有の異なったプライミング部位配列2とを有する。同様に、下部フラグメントは、一端に固有の異なったプライミング部位配列2(上部フラグメントの右端と同じプライマー結合部位配列)と、他の一端に固有の異なったプライミング部位配列3とを有する。図に示すように、2つのフラグメント間の切断部位はトランスポソーム2によって生成され、左側の切断部位(すなわち、図3の上部フラグメントの右側を見る)は、固有の異なったプライミング部位配列2を有する1つのトランスポゾンを含み、右側の切断部位(すなわち、図3の下部フラグメントの左側を見る)は、固有の異なったプライミング部位配列2(「2」はトランスポソーム2を指す)を含む。したがって、トランスポソームが各トランスポゾン上で同じプライマー結合部位配列を有する場合でも、この方法により、フラグメントの各末端に異なるプライマー結合部位配列を有するフラグメントがもたらされる。
図4に示すように、ゲノムDNAの断片化及びメチルトランスポゾンの挿入は、転位/挿入部位の両端にギャップを残す。ギャップの長さは任意であるが、9塩基のギャップが典型的である。その結果、上部鎖の5’位にトランスポゾンDNA Tnp結合部位が付着し、下部鎖の5’位にトランスポゾンDNA Tnp結合部位が付着したゲノムDNAフラグメントが得られる。トランスポゾンDNAの付着又は挿入によって生じるギャップが示される。転位後、トランスポゼースを除去し、ギャップ伸長を行ってギャップを埋め、図4に示すようにトランスポゾンDNAに元々設計された一本鎖オーバーハングを補完する。その後、ギャップを埋めたフラグメントを、キャリアDNAの存在下でシトシンをウラシルに変換するための化学処理に供する。これらの化学的に処理されたフラグメントを、次いで、本明細書に記載されるように、増幅及び精製に供することができる。
一態様によれば、次いで、200μMの各dNTP、1×NEB Q5反応バッファー、それぞれ125nMの20個のプライマー、及び0.02U/μL Q5 DNAポリメラーゼを含むDNAポリメラーゼ反応混合物を添加し、転位によって残されたギャップを埋めるために、72℃で3分間インキュベートする(図4)。更に図5に示すように、図4に示すフラグメントをマルチプレックスPCR増幅に供してアンプリコンを生成する。15サイクルのPCR反応を次のように(98℃で30秒、65℃で1分、72℃で2分)実施することにより標的ゲノムDNAを増幅する。次いで、増幅産物をZymo DNA精製カラムによって精製する。
実施例II
一般的なプロトコル
単一細胞を溶解バッファーに溶解する。Tn5転位は、本明細書に記載されるように、それぞれ異なった固有のプライマー結合部位配列を有する(又はそれぞれが2つの異なった固有のプライマー結合部位配列を有する)トランスポソームを含む及びメチルトランスポゾンを含むトランスポソームライブラリーを用いて行われ、転位バッファーを細胞溶解物に添加し、これをよく混合し、55℃で10分間インキュベートする。転位後に1mg/mlのプロテアーゼを添加して、トランスポゼースが単一細胞ゲノムDNAに結合しないようにする。Q5 DNAポリメラーゼ、dNTP、PCR反応バッファー、及びプライマーを反応混合物に添加し、72℃に10分間加熱して、トランスポゾン挿入から生じるギャップを埋める。100bp~4000bpの超音波処理ラムダDNA等のキャリアDNA、及びシトシンをウラシルに変換するための化学試薬又は酵素試薬を添加し、シトシンからウラシルへの変換を行う。この工程は、事前の精製なしに行うことができる。次いで、化学的に処理されたフラグメントを5サイクル~25サイクルのPCR反応に供し、単一細胞のゲノムDNAを増幅する。この工程は精製せずに行うことができる。増幅産物を、ハイスループットディープシーケンシング等の更なる分析のために精製する。
実施例III
細胞溶解
細胞を選択し、培養皿から切り取り、レーザー解剖顕微鏡(LMD-6500、Leica)を使用してチューブに次のように分注する。細胞を膜コーティングされた培養皿にプレーティングし、10倍対物レンズ(Leica)の明視野顕微鏡検査を用いて観察する。次いで、UVレーザーを使用して、個々に選択された細胞の周りの膜を切断して、PCRチューブのキャップに落ちるようにする。チューブを短時間遠心分離して、細胞をチューブの底に落とす。3μl~5μl溶解バッファー(30mM Tris-Cl pH7.8、2mM EDTA、20mM KCl、0.2%Triton X-100、500μg/mlのQiagenプロテアーゼ)をPCRチューブの側面に添加し、遠沈した。次いで、捕捉した細胞をPCR機で次の温度スケジュールを使用して熱溶解する:50℃で3時間、75℃で30分。或いは、EDTA及びQIAGENプロテアーゼ(QIAGEN)等のプロテアーゼを10μg/mL~5000μg/mLの濃度で含む低塩溶解バッファーに単一細胞を口ピペットで移す。インキュベーション条件は、使用するプロテアーゼによって異なる。QIAGENプロテアーゼの場合、インキュベーションは1時間~4時間、37℃~55℃である。次いで、プロテアーゼを80℃まで熱不活性化し、更に、4-(2-アミノエチル)ベンゼンスルホニルフルオリド塩酸塩(AEBSF)又はフェニルメタンスルホニルフルオリド(PMSF)(Sigma Aldrich)等の特異的プロテアーゼ阻害剤によって不活性化する。細胞溶解物を-80℃で保存する。
単一細胞溶解の手順の例を以下に示す:
(1)溶解バッファーをa)20μLの1M Tris pH8.0(Invitrogen 15568025;最終:20mM);b)4μLの5M NaCl(Invitrogen AM9760G;最終:20mM);c)15μLの10%Triton X-100(Sigma 93443;最終:0.15%);d)150μLの100mM DTT(Sigma 43816;最終:15mM);e)2μLの0.5M EDTA(Invitrogen AM9260G;最終:1mM);f)5μLの100μM キャリアssDNA(最終:500nM);及びg)804μLの水から調製する。組み合わせを混合し、-20℃で保存する。
(2)2×転位バッファー(細胞あたり5μL;1mLの場合は下記のレシピ)を次のように調製する。a)20μLの1M TAPS pH8.5(Boston Bio Products BB-2375)(最終:20mM);b)10μLの1M MgCl(最終:10mM);c)320μLの50%PEG 8000(Hampton Research HR2-535)(最終:16%);d)650μLの水。組み合わせを混合し、-20℃で保存する。
(3)溶解を次のように行う:7.5mg/mL Qiagenプロテアーゼを、a)1μLの60mg/mL Qiagenプロテアーゼ及びb)7μLの水から調製する。2μl溶解バッファーをチューブごとに添加する。0.5μlの7.5mg/ml QPをチューブごとに添加する。細胞を密閉PCR機において2.5μL量で、次のサイクル(a)50℃で1時間、b)65℃で1時間、b)70℃で15分、c)4℃で一定に保つ)にて溶解する。
実施例IV
転位
単一細胞溶解及びトランスポソームライブラリーを、1mM~100mMのMg2+及び任意に1mM~100mMのMn2+又はCo2+又はCa2+も含むバッファー系で混合し、37℃~55℃で5分~240分間インキュベートする。反応量は細胞溶解量によって異なる。反応に追加されるトランスポソームライブラリーの量は、所望の断片化サイズに応じて簡単に調整され得る。転位反応は、EDTA及び任意にEGTA又は他のイオン用キレート剤を用いてMg2+をキレート化することによって停止する。任意に、短い二本鎖DNAをスパイクインとして混合物に加えることができる。残留トランスポソームを、QIAGENプロテアーゼ等のプロテアーゼの消化により、最終濃度1μg/mL~500μg/mLで37℃~55℃にて10分~60分間不活性化する。次いで、プロテアーゼを、熱及び/又はAEBSF等のプロテアーゼ阻害剤によって不活性化する。
例示的な方法及びコンストラクトを以下に提供する:
Nexteraコンストラクト:
Nexteraトランスポゾンは1本の5’-/Phos/-CTGTCTCTTATACACATCT-3’(配列番号1)鎖と、5’-TMGTMGGMAGMGTMAGATGTGTATAAGAGAMAG-3’(「P5」)(配列番号2)又は5’-GTMTMGTGGGMTMGGAGATGTGTATAAGAGAMAG-3’(「P7」)(配列番号3)(IDT、精製:PAGE)のいずれか1本の5mC修飾鎖とを有する。Nextera XT(Illumina)を使用することもできる。Mはメチル化シトシンを表す。
Nexteraインデックスプライマー(IDT、精製:標準脱塩、次いで0.1×TEに5μMまで溶解し、-20℃で保存)は、
5’-CAAGCAGAAGACGGCATACGAGAT-[i7]-GTCTCGTGGGCTCGG-3’及び、
5’-AATGATACGGCGACCACCGAGATCTACAC-[i5]-TCGTCGGCAGCGTC-3’、
のフォーマットである。
配列は次のとおりである:
701:CAAGCAGAAGACGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGG(配列番号4)
702:CAAGCAGAAGACGGCATACGAGATCTAGTACGGTCTCGTGGGCTCGG(配列番号5)
703:CAAGCAGAAGACGGCATACGAGATTTCTGCCTGTCTCGTGGGCTCGG(配列番号6)
704:CAAGCAGAAGACGGCATACGAGATGCTCAGGAGTCTCGTGGGCTCGG(配列番号7)
705:CAAGCAGAAGACGGCATACGAGATAGGAGTCCGTCTCGTGGGCTCGG(配列番号8)
706:CAAGCAGAAGACGGCATACGAGATCATGCCTAGTCTCGTGGGCTCGG(配列番号9)
707:CAAGCAGAAGACGGCATACGAGATGTAGAGAGGTCTCGTGGGCTCGG(配列番号10)
708:CAAGCAGAAGACGGCATACGAGATCCTCTCTGGTCTCGTGGGCTCGG(配列番号11)
709:CAAGCAGAAGACGGCATACGAGATAGCGTAGCGTCTCGTGGGCTCGG(配列番号12)
710:CAAGCAGAAGACGGCATACGAGATCAGCCTCGGTCTCGTGGGCTCGG(配列番号13)
711:CAAGCAGAAGACGGCATACGAGATTGCCTCTTGTCTCGTGGGCTCGG(配列番号14)
712:CAAGCAGAAGACGGCATACGAGATTCCTCTACGTCTCGTGGGCTCGG(配列番号15)
501:AATGATACGGCGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTC(配列番号16)
502:AATGATACGGCGACCACCGAGATCTACACCTCTCTATTCGTCGGCAGCGTC(配列番号17)
503:AATGATACGGCGACCACCGAGATCTACACTATCCTCTTCGTCGGCAGCGTC(配列番号18)
504:AATGATACGGCGACCACCGAGATCTACACAGAGTAGATCGTCGGCAGCGTC(配列番号19)
505:AATGATACGGCGACCACCGAGATCTACACGTAAGGAGTCGTCGGCAGCGTC(配列番号20)
506:AATGATACGGCGACCACCGAGATCTACACACTGCATATCGTCGGCAGCGTC(配列番号21)
507:AATGATACGGCGACCACCGAGATCTACACAAGGAGTATCGTCGGCAGCGTC(配列番号22)
508:AATGATACGGCGACCACCGAGATCTACACCTAAGCCTTCGTCGGCAGCGTC(配列番号23)
本明細書に記載されるデータを生成するために使用されるコンストラクトは、次の配列のn=20タグを持つ5mC修飾配列である。プライマー結合部位配列の多くの他のかかるセットは、当業者によって設計可能であり、以下の20個のトランスポゾンプライマー結合部位配列は、いかなる方法でも制限することを意図していないことを理解されたい。
1.AGAAGMMGTGTGMMGGTMTA(配列番号24)
2.ATMGTGMGGAMGAGAMAGMA(配列番号25)
3.AATMMTAGMAMMGGTTMGMM(配列番号26)
4.AMGTGTTGMAGGTGMAMTMG(配列番号27)
5.AMAMMAMAMGGMMTAGAGTM(配列番号28)
6.TGGAMAATMAMGMGAMMAGM(配列番号29)
7.TMATMTAAMGMGMAMMGTGM(配列番号30)
8.TTMGTMGGMTMTMTMGAAMM(配列番号31)
9.TGGTGGAGMGTGMAGAMTMT(配列番号32)
10.TATMTTMMTGMGMAGMGGAM(配列番号33)
11.MTGAMGTGTGAGGMGMTAGA(配列番号34)
12.MMATMATMMAAMMGGMTTMG(配列番号35)
13.MAMGAGAAGMMGTMMGMTTA(配列番号36)
14.MGTAMGTGMAAMAMTMMGMT(配列番号37)
15.MTTGGTMAGGMGAGAAGMAM(配列番号38)
16.GGMGTGATMAGTGMGTGGAT(配列番号39)
17.GAGMGTTTGGTGAMMGMMAT(配列番号40)
18.GMMTGMGGTMMATTGAMMTA(配列番号41)
19.GTAAGMMAMTMMAGMGTMAM(配列番号42)
20.GATMTGTTGMGMGTMTGGTG(配列番号43)
Tn5トランスポゾンは5’-/Phos/CTGTCTCTTATACACATCT-3’から構築され、もう一方の鎖は5’-[tag]-AGATGTGTATAAGAGAMAG-3’の形態であった。各オリゴ(IDT、精製:PAGE)を0.1×TEに溶解し、最終濃度100μMにした。n=20個のタグのそれぞれについて、2本の鎖がそれぞれ5μMの最終濃度でアニーリングされた。次いで、アニールされた20個のトランスポゾンを等量でプールした。第2に、pTXB1-Tn5プラスミド(Addgene)からの発現後にトランスポゼースを精製した。トランスポソームを、1.25μMダイマー(2.5μMモノマー)、1:10希釈(125nMダイマー、又は250nMモノマー)の最終濃度でアセンブリし、単回使用のため分注し、-80℃で保存した。
20プライマーミックス(PCRミックス1で使用)は、5’-[tag]AGATGTGTATAAG-3’の形態であった。各オリゴ(IDT、精製:標準脱塩)を0.1×TEに溶解して最終濃度を100μMにし、等量(合計100μM、又はそれぞれ5μM)で合わせた。-20℃で保存する。40プライマーミックス(PCRミックス2で使用)は、Illuminaアダプターの片側では、
5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT-[METAtag]AGATGTGTATAAG-3’、
の形態であり、もう片側では、
5’GACTGGAGTTCAGACGTGTGCTCTTCCGATCT-[METAtag]AGATGTGTATAAG-3’、
であった。各オリゴ(IDT、精製:PAGE)を0.1×TEに溶解して最終濃度を50μMにし、等量(合計50μM、又はそれぞれ1.25μM)で合わせ、-20℃で保存した。
10μlの反応でNextera又は本明細書に記載されるトランスポソームのいずれかのトランスポソームを使用するアダプター挿入のため、各単一細胞について、以下の試薬のそれぞれを低結合PCRチューブに添加する:A)2.5μlの溶解試料、B)5μl 2×トランスバッファー、C)2.5μl希釈Tn5複合体であり、55℃で10分間維持し、その後4℃で一定に保つ。
トランスポソーム反応を、次のように停止バッファーを使用して停止する。0.2mg/ml QPを調製する;停止バッファーを調製する;1μlの2×停止バッファー;1μlの2mg/ml QP(最終100μg/ml)。転位は、a)50℃で40分間、b)70℃を20分間、c)その後4℃に保つ条件下で実行する(12μL量)ことによって停止する又は止める。
実施例V
ギャップ充填及びキャリアDNA
転位及びトランスポゼース除去後、Mg2+、dNTPミックス、プライマー、及びDeepvent exo-DNAポリメラーゼ(New England Biolabs)等の熱安定性DNAポリメラーゼを含むPCR反応混合物を適切な温度で適切な時間、溶液に添加して、転位反応によって残された9bpのギャップを埋める。ギャップ充填インキュベーションの温度及び時間は、使用する特定のDNAポリメラーゼに依存する。反応後、DNAポリメラーゼは、加熱及び/又はQIAGENプロテアーゼ等のプロテアーゼ処理によって任意に不活性化される。次いで、プロテアーゼは、使用される場合、熱及び/又はプロテアーゼ阻害剤によって不活性化される。次いで、キャリアDNA(dsDNA)を反応媒体に添加する。存在するキャリアDNAは、ラムダDNAを超音波処理することによって作られるような、長さ100bp~4000bpのDNAフラグメントを含む。キャリアDNAは、少なくとも20ng、及び20ng~50ngの量で反応媒体内に存在する。
ギャップ充填の手順の例は次のとおりである:
1.5-メチル-dCTP(各nt2.5mM)内でdNTPミックスを調製する。100μLの10mM dTTP(NEB N0443S)、100μLの10mM dGTP(NEB N0442S)、100μLの10mM dATP(NEB N0440S)を100μLの10mM 5-メチル-dCTP(NEB N0356S)に加え、次いでボルテックスを行って完全に混合し、-20℃で保存する。
2.PCRミックスを作製する(細胞あたり23μL);a)7μLのQ5反応バッファー(Q5に含まれる);b)7μLのQ5高GCエンハンサー(Q5に含まれる);c)5-メチル-dCTP(各nt2.5mM)内の2.8μLのdNTPミックス;d)0.7μL 100mM MgCl(Invitrogen AM9530G);e)0.35μLのQ5(NEB M0491S);f)1μlの20ng/μlラムダキャリアDNA(超音波処理200bp~300bp);g)4.15μlのHOをボルテックスして混合する。
3.液体に触れないようにチューブあたり23μLのPCRミックスを加える。ボルテックスして遠沈する。
次の条件下:a)4℃で3分間(蓋を予熱するため)、b)65℃で3分間、c)4℃で保存を実行する(35μL量)ことによってギャップ充填を行う。
クリーンアップの場合:1.200μl結合バッファーをpcrチューブに直接加え、10回混合し、カラム(ZYMO DCC)に移す;2.200μlで2回洗浄する;3.17.8μlの溶出バッファーで溶出する(edtaなし、EM-seqキットのNEBの白色キャップのボトル)。
実施例VI
シトシンのウラシルへの化学変換又は酵素変換
次いで、キャリアDNA(dsDNA)を化学試薬と共に反応媒体に追加して、シトシンをウラシルに変換する。シトシンのウラシルへの化学変換又は酵素変換中に存在するキャリアDNAは、ラムダDNAを超音波処理することによって作り出されるような、長さ100bp~4000bpのDNAフラグメントを含む。キャリアDNAは、少なくとも20ng、及び20ng~50ngの量で反応媒体内に存在する。
実施例VII
DNAフラグメント増幅
一態様によれば、当業者に知られている一般的な方法を用いて、DNAフラグメントを増幅する。上記の実施例からの化学変換されたフラグメントを、水性媒体中でPCR反応試薬と組み合わせる。次いで、水性媒体をPCR条件に供し、各DNAフラグメントをPCRで増幅する。
実施例VIII
DNAフラグメントアンプリコンのシーケンシング
一態様によれば、フラグメントは、当業者に知られている方法を用いて配列決定され、配列はコンピューター可読メモリに記憶される。次いで、この配列は、当業者に知られているソフトウェア方法を含む方法を使用して、ゲノム配列と比較し、アセンブルすることができる。
実施例IX
単一細胞のメチル化検出
本開示の一態様を図7に示す。
(1)標的DNAを、単一細胞、又は2細胞、又は4細胞、又は...100細胞から抽出する。かかる抽出されたDNAは少量であると考えられる。
(2)標的DNAを断片化し、Tn5トランスポソームを用いてメチルトランスポゾンを挿入又は結合させる。Tn5に結合するトランスポゾンプライマーは、全てのシトシンで完全にメチル化されている。その結果、完全にメチル化されたPCRアダプターを含む標的DNAのフラグメントが生成される。
(3)フラグメントはギャップ充填される。ギャップ充填の後、キャリアDNAを反応に追加する。キャリアDNAを、超音波処理されたラムダDNAから、100bp~400bpを有するフラグメントにする。
(4)反応媒体をDNAスピンカラムによって精製する。DNA変換を、NEB製のEM-seqキットを使用して行った。EM-SeqキットのABOPEC工程を、量(volume)を40μlに減らすように変更する。
(5)変換後、Q5Uポリメラーゼ及びバッファーを、DNA精製を行わずに直接反応に追加する。全ゲノム増幅を、本明細書に記載されるように、Nextera PCRプライマー(Nexteraトランスポソームシステムを使用する場合)又はPCRプライマーを使用して実施する。
(6)PCR反応後、反応媒体を精製して一本鎖キャリアDNAを除去し、DNAシーケンシングのため精製ライブラリーの準備を整える。
図8に示すように、キャリアDNAを用いたトランスポソームアプローチを用いた本明細書に記載の方法は、既存の単一細胞全メチロームシーケンシング手法と比較して、より高いゲノムカバー率をもたらした。図9に示すように、キャリアDNAを用いたトランスポソームアプローチを使用する本明細書に記載の方法は、既存の単一細胞全メチロームシーケンシング手法と比較して、より高いマッピング率をもたらした。図10に示すように、キャリアDNAを用いたトランスポソームアプローチを使用する本明細書に記載の方法は、既存の単一細胞全メチロームシーケンシング手法と比較して、より高い精度をもたらした。手法としては、scWGBS(非特許文献4)、及びscCOOL-seq("Guo, F., Li, L., Li, J., Wu, X., Hu, B., Zhu, P., ... & Tang, F. (2017). Single-cell multi-omics sequencing of mouse early embryos and embryonic stem cells. Cell research, 27(8), 967.")が挙げられる。
実施例X
酵素Methyl-seqキットの変換
5-メチルシトシン及び5-ヒドロキシメチルシトシンの酸化
1.TET2バッファーを調製する。
100μlのTET2反応バッファー(TET2に含まれる)を1本のTET2反応バッファーサプリメント(TET2に含まれる)のチューブに加え、よく混ぜてから-20℃で保存する。
2.新たに希釈した鉄(II)を調製する。
500mM鉄(II)溶液(TET2に含まれる)を水で0.4mMに希釈する。
3.氷上で、9.6μLの酸化プレミックス(6μLの再構成されたTET2反応バッファー(TET2に含まれる)、0.6μLの酸化サプリメント(TET2に含まれる)、0.6μLの酸化増強剤(TET2に含まれる)、2.4μLのTET2(E7120S))を17.4μlのタグ付けされた(tagmented)DNAに直接添加する。ボルテックスで完全に混合し、短時間遠心分離し、次いで3μLの新たに希釈した0.4mM鉄(II)を加えて合計量30μLにする。ボルテックスでよく混ぜてから、短時間遠心分離する。37℃で1時間インキュベートし、次いで4℃にてサーモサイクラーでインキュベートする。TET反応の総量は30μlで、低インプットDNAには十分である。総量は20μl~40μlであり得る。この範囲の体積は、DNAの損失を減らすために、続く精製工程を同じ単一チューブで実施できるという利点がある。
4.0.6μlの停止試薬(TET2に含まれる)を加える。ボルテックスでよく混ぜてから、短時間遠心分離する。37℃で30分間インキュベートし、次いで4℃にてサーモサイクラーでインキュベートする。
酸化DNAのクリーンアップ
1.200μlの結合バッファーをPCRチューブに直接加え、10回混合し、カラムに移す(ZYMO DCC)
2.200μlで2回洗う
3.12.3μlの溶出バッファーで溶出(EDTAなし、EM-seqキットのNEBの白色キャップのボトル)
DNAのカラム精製は、精製によるDNAの損失を最小限に抑えるために、ビーズ精製を行うことが好ましい。
水酸化ナトリウムによるDNAの変性
1.99μLの水に1μLの10M NaOHを加えることで、新たに希釈した0.1N NaOH(Sigma)を調製する。
2.12μLの酸化DNAに3μlの0.1N NaOHを加える。ボルテックスして混合し、次いで短時間遠心分離する。予熱したサーモサイクラーで50℃にて10分間インキュベートする。次いで、氷上に置き、次のセクションに進む。
シトシンの脱アミノ化
1.1.48μl~998.52μlの水を加えることで、37%の塩酸(Sigma 30721)を0.018Mに希釈する。
2.氷上で、15μlの変性DNAに7μLの0.018M HClを加える。
3.氷上で、18μLの脱アミノ化プレミックス(13.2μLの水、4μLのAPOBEC反応バッファー(APOBECに含まれる)、0.4μLのBSA(APOBECに含まれる)、0.4μLのAPOBEC(E7120S))を加える。ボルテックスしてよく混合し、短時間遠心分離する。
4.37℃で3時間インキュベートし、次いで4℃にてサーモサイクラーでインキュベートする。
変性工程及びABOPEC反応の反応量は40μlであり、30μl~60μlであり得る。この量は、APOBECによる処理後のDNA精製工程を回避できるという利点がある。PCRは、DNAポリメラーゼ及びプライマーを含む40μlのPCRバッファーミックスを40μlのABOPEC反応に添加することによって直接行うことができる。
実施例XI
PCRによるライブラリー調製
Nexteraコンストラクト
40μlの脱アミノ化システム、40μlのQ5U 2×マスターミックス、及び0.4μlの100mM nextera index(P5及びP7)を合わせる。次のことを実行して増幅する(80.8μL量):a)4℃で3分(蓋を予熱するため)、b)98℃で20秒、c)98℃で10秒、62℃で30秒、65℃で1分を12サイクル、e)65℃で5分間、及びf)4℃で一定にする。AMpureビーズを使用した1.2×ビーズサイズの選択。
META(マルチエンドタギング増幅)コンストラクト:
以下を合わせる:META 20プライマーミックス、2μL;40μlのDNA溶出;40μlのQ5U 2×マスターミックス;98℃で20秒間インキュベーション、10サイクルの[98℃で10秒、62℃で30秒、65℃で1分]、及び65℃で5分間。増幅産物を、この工程で13.8μLの溶出バッファーで精製し、シーケンスライブラリーを2つの追加のPCR工程で調製した。最初のPCR工程では、16.5μLのPCRミックス2(15μlのQ5U 2×マスターミックス及び1.5μLの40プライマーミックス)を添加し、98℃で30秒間、98℃で10秒間+62℃で30秒間+65℃で1分間を2サイクル、及び65℃で5分間インキュベーションすることにより、PCRを実施した。第2のPCR工程では、プライマーも同様に1μLの20U/μL ExoI(NEB M0293S)を添加し、37℃で30分間、72℃で20分間インキュベーションすることによって除去した。PCRを、同様に、2.5μLのNEBインデックスプライマー(NEB E7335S、E7500S、E7710S、E7730S)及び6.5μLのPCRミックス3(5μL Q5U 2×マスターミックス(NEB)、1.25μLの水、0.25μLのユニバーサルプライマー(IDT、精製:PAGE))を添加し、98℃で30秒、98℃で10秒間+62℃で30秒+65℃で1分間を2サイクル以上、及び65℃で5分間インキュベーションを行うことによって実施した。ライブラリーを、この工程で、又はその後の任意の工程でプールすることができた。1.2×AMpureビーズをサイズ選択に使用する。
実施例IX
キット
開示された増幅方法に必要な材料及び試薬を、キットに組み入れることができる。本開示のキットは、一般に、必要に応じてプライマーセットと共に特許請求の範囲に記載の方法を行うのに必要な、少なくともトランスポソーム(トランスポゼース酵素及びトランスポゾンDNAからなる)、ヌクレオチド、DNAポリメラーゼ、キャリアDNA、及びシトシンをウラシルに、又は5-メチルシトシンをウラシルに変換するための化学試薬を含む。好ましい実施形態において、キットは、DNA試料からDNAを増幅するための指示も含む。例示的なキットは、全ゲノムDNAの増幅で使用するのに適したキットである。いずれの場合も、キットは、個々の試薬、酵素、又は反応物ごとに別々の容器を有することが好ましい。各作用物質は、一般に、それぞれの容器に適切に配分される。キットの容器手段は、一般に、少なくとも1つのバイアル又は試験管を含む。フラスコ、ボトル、及び試薬を入れて分注する他の容器手段も可能である。キットの個々の容器は、商業販売のために密閉して保管することが好ましい。適切な大型容器は、所望のバイアルが保持される射出成形又はブロー成形されたプラスチック容器を含む場合がある。キットと共に説明書が提供されることが好ましい。

Claims (34)

  1. 標的ゲノムDNAのメチル化特性を分析する方法であって、
    ゲノムDNAをトランスポソームのライブラリーに接触させることと、
    前記ライブラリーの各トランスポソームが2つのトランスポゼースと2つのトランスポゾンDNAとを有し、各トランスポゾンDNAがトランスポゼース結合部位及びプライマー結合部位配列を含み、前記プライマー結合部位配列が前記トランスポソームライブラリーの他のメンバーの前記プライマー結合部位とは異なり、各トランスポゾンDNAが1つ以上の5-メチルシトシンを含み、
    前記トランスポソームのライブラリーが前記ゲノムDNAに沿った標的位置に結合し、前記トランスポゼースがゲノムDNAフラグメントライブラリーを表す複数の二本鎖ゲノムDNAフラグメントへとゲノムDNAを切断し、各二本鎖ゲノムDNAフラグメントが1つ以上のシトシン及び/又は1つ以上の5-メチシトシンと、前記ゲノムDNAフラグメントの各末端にある固有の及び/又は異なったプライマー結合部位配列とを含む;
    前記トランスポゾンDNAと前記ゲノムDNAフラグメントとの間のギャップを埋めて、各末端に固有の及び/又は異なったプライマー結合部位配列を有する二本鎖ゲノムDNAフラグメント伸長産物のライブラリーを形成することと、
    前記二本鎖ゲノムDNAフラグメント伸長産物のライブラリーを処理して、キャリアDNAの存在下でシトシンをウラシルに変換することと、
    前記二本鎖ゲノムDNAフラグメント伸長産物を増幅してアンプリコンを生成することと、
    を含む、方法。
  2. 前記アンプリコンを配列決定することを更に含む、請求項1に記載の方法。
  3. 前記トランスポソームのライブラリー内の各トランスポソームが、2つの異なるプライマー結合部位配列を含む、請求項1に記載の方法。
  4. 前記トランスポソームのライブラリー内の各トランスポソームが、前記トランスポソームの各トランスポゾン上に2つの同一のプライマー結合部位配列を含み、該プライマー結合部位配列が、前記トランスポソームのライブラリーの他のトランスポソームにおけるプライマー結合部位配列とは異なる、請求項1に記載の方法。
  5. 前記ゲノムDNAが単一細胞から得られた全ゲノムDNAである、請求項1に記載の方法。
  6. 前記トランスポゼースがTn5トランスポゼース、Muトランスポゼース、Tn7トランスポゼース、又はIS5トランスポゼースである、請求項1に記載の方法。
  7. 前記トランスポゾンDNAが、19bpの二本鎖Tnp結合部位及びオーバーハングを含み、前記オーバーハングが、該オーバーハングの5’末端に固有及び/又は異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  8. 前記二本鎖ゲノムDNAフラグメントのギャップ充填及び伸長の前に、結合したトランスポゼースを前記二本鎖フラグメントから除去する、請求項1に記載の方法。
  9. 前記ゲノムDNAが出生前細胞、癌細胞、又は循環腫瘍細胞に由来する、請求項1に記載の方法。
  10. 前記ゲノムDNAが、単一の出生前細胞、単一の癌細胞、又は単一の循環腫瘍細胞に由来する、請求項1に記載の方法。
  11. 前記固有の異なったプライマー結合部位配列が特異的PCRプライマー結合部位である、請求項1に記載の方法。
  12. 前記トランスポソームのライブラリーが、1個~100個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  13. 前記トランスポソームのライブラリーが、1個~10個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  14. 前記トランスポソームのライブラリーが、5個~50個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  15. 前記トランスポソームのライブラリーが、30個~100個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  16. 前記トランスポソームのライブラリーが、15個~25個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  17. 前記トランスポソームのライブラリーが、100個~1000個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  18. 前記トランスポソームのライブラリーが、1000個~10000個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  19. 前記トランスポソームのライブラリーが、10000個~100000個の固有の異なったプライマー結合部位配列を含む、請求項1に記載の方法。
  20. 前記異なったプライマー結合部位配列が直交している、請求項1に記載の方法。
  21. 前記トランスポゾンDNAが全てのシトシンでメチル化されている、請求項1に記載の方法。
  22. 前記トランスポゾンDNAがメチル化シトシンアダプターを含む、請求項1に記載の方法。
  23. 前記ギャップ充填工程が、dNTP混合物においてdCTPの代わりにメチル化dCTPを使用することを含む、請求項22に記載の方法。
  24. 前記キャリアDNAが、100塩基対(bp)~4キロ塩基対の長さを有するdsDNAフラグメントからなる群から選択される、請求項1に記載の方法。
  25. 前記キャリアDNAが標的DNAと異なる又は同じDNA型である、請求項1に記載の方法。
  26. 前記キャリアDNAが超音波処理されたラムダDNAである、請求項1に記載の方法。
  27. 前記キャリアDNAがIlluminaシーケンシングアダプターを含まない、請求項1に記載の方法。
  28. 前記キャリアDNAが、試料DNAの量の100倍~10000倍の量で反応媒体に添加される、請求項1に記載の方法。
  29. 前記ギャップ充填工程の後、かつ前記変換工程の前の工程、すなわち、前記ギャップ充填された二本鎖セグメント及びキャリアDNAを含む反応媒体を精製することを更に含む、請求項1に記載の方法。
  30. 前記精製工程がDNAスピンカラム又はビーズベースのDNA精製によって行われる、請求項29に記載の方法。
  31. 前記ギャップ充填された二本鎖セグメント及びキャリアDNAを含む反応媒体を、精製せずに直接、前記変換工程に進める、請求項1に記載の方法。
  32. シトシンをウラシルに変換する試薬がバイサルファイトではないか、又はバイサルファイトを除外する、請求項1に記載の方法。
  33. 前記変換工程の後、かつ前記増幅工程の前の工程、すなわち、化学的に変換されたフラグメントを含む反応媒体を精製することを更に含む、請求項1に記載の方法。
  34. 化学的に変換されたフラグメントを含む反応媒体を精製せずに直接、前記増幅工程に進める、請求項1に記載の方法。
JP2022524572A 2019-10-25 2019-10-25 哺乳類dnaのメチル化の検出及び分析 Active JP7489455B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/113387 WO2021077415A1 (en) 2019-10-25 2019-10-25 Methylation detection and analysis of mammalian dna

Publications (2)

Publication Number Publication Date
JP2023507876A true JP2023507876A (ja) 2023-02-28
JP7489455B2 JP7489455B2 (ja) 2024-05-23

Family

ID=75619645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022524572A Active JP7489455B2 (ja) 2019-10-25 2019-10-25 哺乳類dnaのメチル化の検出及び分析

Country Status (5)

Country Link
US (1) US20220389412A1 (ja)
EP (1) EP4048808A4 (ja)
JP (1) JP7489455B2 (ja)
CN (1) CN114391043B (ja)
WO (1) WO2021077415A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114438184B (zh) * 2022-04-08 2022-07-12 昌平国家实验室 游离dna甲基化测序文库构建方法及应用
WO2024065721A1 (en) * 2022-09-30 2024-04-04 Peking University Methods of determining genome-wide dna binding protein binding sites by footprinting with double stranded dna deaminase

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2188389A4 (en) * 2007-08-15 2011-12-07 Univ Hong Kong METHOD AND COMPOSITIONS FOR BISULFIT DNA SEQUENCING WITH HIGH PERFORMANCE AND BENEFITS
CN102105483A (zh) * 2008-07-22 2011-06-22 纽约哥伦比亚大学理事会 甲基化分析的通用方法
US10457936B2 (en) * 2011-02-02 2019-10-29 University Of Washington Through Its Center For Commercialization Massively parallel contiguity mapping
US20130017978A1 (en) * 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
EP3102691B1 (en) * 2014-02-03 2019-09-11 Thermo Fisher Scientific Baltics UAB Method for controlled dna fragmentation
IL299976A (en) 2014-10-17 2023-03-01 Illumina Cambridge Ltd Continuity-preserving transposition
WO2016191618A1 (en) * 2015-05-27 2016-12-01 Jianbiao Zheng Methods of inserting molecular barcodes
WO2018057779A1 (en) * 2016-09-23 2018-03-29 Jianbiao Zheng Compositions of synthetic transposons and methods of use thereof
WO2018165366A1 (en) * 2017-03-08 2018-09-13 President And Fellows Of Harvard College Methods of amplifying dna to maintain methylation status
AU2018273401A1 (en) * 2017-05-23 2019-12-19 President And Fellows Of Harvard College Multiplex end-tagging amplification of nucleic acids
EP4293122A3 (en) * 2017-06-07 2024-01-24 Oregon Health & Science University Single cell whole genome libraries for methylation sequencing
CN108300766A (zh) * 2018-01-16 2018-07-20 四川大学 利用转座酶对染色质开放区和线粒体甲基化研究的方法

Also Published As

Publication number Publication date
EP4048808A4 (en) 2023-08-09
CN114391043B (zh) 2024-03-15
US20220389412A1 (en) 2022-12-08
JP7489455B2 (ja) 2024-05-23
CN114391043A (zh) 2022-04-22
WO2021077415A1 (en) 2021-04-29
EP4048808A1 (en) 2022-08-31

Similar Documents

Publication Publication Date Title
US20230203563A1 (en) Multiplex End-Tagging Amplification of Nucleic Acids
US20190203204A1 (en) Methods of De Novo Assembly of Barcoded Genomic DNA Fragments
RU2770879C2 (ru) Полногеномные библиотеки отдельных клеток для бисульфитного секвенирования
KR102640255B1 (ko) 감소된 증폭 편향을 갖는 고속-대량 단일 세포 서열분석
US10894980B2 (en) Methods of amplifying nucleic acid sequences mediated by transposase/transposon DNA complexes
CN106574287B (zh) 用于核酸扩增的样品制备
US20230056763A1 (en) Methods of targeted sequencing
CN110741092A (zh) 扩增dna以维持甲基化状态的方法
JP7489455B2 (ja) 哺乳類dnaのメチル化の検出及び分析
WO2024146540A1 (zh) 单细胞dna甲基化检测方法
CN118308491A (en) Single cell DNA methylation detection method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221024

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240513

R150 Certificate of patent or registration of utility model

Ref document number: 7489455

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150