JP6626830B2 - Dna操作のための複数のトランスポザーゼアダプター - Google Patents

Dna操作のための複数のトランスポザーゼアダプター Download PDF

Info

Publication number
JP6626830B2
JP6626830B2 JP2016552415A JP2016552415A JP6626830B2 JP 6626830 B2 JP6626830 B2 JP 6626830B2 JP 2016552415 A JP2016552415 A JP 2016552415A JP 2016552415 A JP2016552415 A JP 2016552415A JP 6626830 B2 JP6626830 B2 JP 6626830B2
Authority
JP
Japan
Prior art keywords
adapter
transposase
dna
sequence
strand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016552415A
Other languages
English (en)
Other versions
JP2016534757A (ja
Inventor
ベリャーエフ,アレクサンダー・エス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of JP2016534757A publication Critical patent/JP2016534757A/ja
Application granted granted Critical
Publication of JP6626830B2 publication Critical patent/JP6626830B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)

Description

[関連出願の相互参照]
本出願は、2013年11月7日出願の米国仮特許出願第61/901,037号および2014年6月18日出願の米国仮特許出願第62/013,833号の優先権を主張する。これらの出願の内容は、その全体が参照によって本明細書に組み込まれる。
[発明の分野]
本発明は、トランスポザーゼアダプター、ならびにDNA分子の調製、in vitro増幅、核酸の配列決定および目的の配列についてのDNAライブラリーのスクリーニングならびに生細胞中への核酸送達における使用を含む、それらの使用に関する。
トランスポザーゼは、トランスポゾンの末端に結合し、カットアンドペースト機構または複製的転位機構によるゲノムの別の部分へのトランスポゾンの移動を触媒する酵素のクラスである。これらの酵素は、次世代配列決定(NGS)、変異誘発、核酸送達(遺伝子治療)、および再生医学のための多能性細胞の生成のためのサンプルの調製において使用されてきた。これらの適用では、トランスポザーゼは、単離されたタンパク質としては作用しないが、特異的DNA配列との複合体で核タンパク質として作用する。かかる配列は、一般に、トランスポザーゼ認識配列、トランスポゾン末端、逆方向反復右配列(IRR)、逆方向反復左配列(IRL)またはアダプターと呼ばれる。
NGSライブラリーの調製に使用する場合、トランスポザーゼ−アダプター複合体は、ハイスループット配列決定を達成するための重要なステップである、ゲノムDNAの断片化に使用される。超音波処理およびDNAse処理などの他の断片化技術と比較して、トランスポザーゼベースの断片化は、サンプル調製が配列決定費用全体の約50%を構成することを考慮すると、時間、労働および設備支出において、数倍の節約になる。しかし、現在利用可能なトランスポザーゼ−アダプター複合体によるDNA断片化は、あまりランダムではない。即ち、一部の領域においてはより多い読み取りまたは他の領域においてはより少ない読み取りを生じるバイアスを有し、これは、1〜3%より高い重複率、および同じ全体的なカバー率を達成するためのより多い配列決定の試みを生じる場合が多い。従来のトランスポザーゼベースのNGSサンプル調製方法もまた、時間のかかるアダプターの除去を必要とし、非常に低い量のDNAを有するサンプルを処理するためには適切ではない。
従って、ランダムさを増加させ、重複率を低減させるように、適切な活性および異なる特性を有する異なるトランスポザーゼアダプターの必要性もまた存在する。非常に低い量のDNAを有するサンプルのトランスポザーゼ反応における直接的な処理のためのより効率的および/または適切な方法の必要性も存在する。
本発明は、複数のトランスポザーゼアダプターを提供することによって、上述の、未だ解決されていない必要性に対処する。
一態様では、本発明は、第1の配列を含む第1の鎖と第2の配列を含む第2の鎖とを含む単離された合成核酸アダプターを提供する。この第1の配列および第2の配列は、互いに対して完全に相補的または実質的に相補的であり、このアダプターは、トランスポザーゼによって認識される。
この単離された合成核酸アダプターは、トランスポザーゼのネイティブ認識配列と比較して、1または複数の改変を有するトランスポザーゼ認識配列を含む。例えば、この第1の配列は、トランスポザーゼの親、ネイティブもしくは公知の認識配列の改変されたバージョンであるか、またはこの第2の配列は、親アダプター配列の相補体の改変されたバージョンであるか、あるいはそれら両方が、かかる改変されたバージョンであるかのいずれかである。
この単離された合成核酸アダプターは、トランスポザーゼのネイティブ認識配列と比較して、(a)第1の配列(第1の鎖上)の5’末端(1位)もしくは第2の配列(第2の鎖上)の3’末端、または両方における、1または複数の改変、(b)第1の鎖または第1の配列における1または複数の改変されたヌクレオチドであって、この1または複数の改変されたヌクレオチドは、第1の鎖のプライマー伸長を妨害する、1または複数の改変されたヌクレオチド、および、(c)第2の鎖または第2の配列における1または複数のホスホロチオエート結合、の改変のうちの1または複数を有し得る。
一実施形態では、この単離された合成核酸アダプターは、トランスポザーゼのネイティブもしくは公知の認識配列(親アダプター配列または親認識配列)と比較して、第1の配列の5’末端(1位)において、またはネイティブ認識配列の相補体と比較して、第2の配列の3’末端において、あるいはこれら末端の両方において、1または複数の改変を有する。例えば、この第1の配列は、親認識配列と比較して、その5’末端において、異なるヌクレオチドを有し得るか、少なくとも1つの付加されたヌクレオチドを有し得るか、または1つのヌクレオチドを欠損し得る。同様に、第2の配列もまた、相補体と比較して、その3’末端において少なくとも1つの異なるヌクレオチドを有し得るか、付加されたヌクレオチドを有し得るか、または1つのヌクレオチドを欠損し得る。これらのアダプターの例は、図3B、図4Bおよび図5Cに示される。
別の一実施形態では、上述の(b)における1または複数の改変されたヌクレオチドは、デオキシウリジン、脱塩基部位、2’OMeで改変されたリボ核酸(RNA)および逆方向チミジンからなる群から選択される。この逆方向チミジンは、好ましくは、第1の鎖の3’末端に存在する。一部の例では、この1または複数の改変されたヌクレオチドには、ホスホロチオエート結合またはスペーサーが先行する(即ち、改変されたヌクレオチドに対して5’側に存在する)。第2の鎖は、かかる1または複数の改変されたヌクレオチドを含まなくてもよい。
なお別の一実施形態では、少なくとも1つのホスホロチオエート結合が、第2の鎖または第2の配列の3’側の最後のヌクレオチドと3’側の最後から2番目のヌクレオチドとの間にある。この第2の鎖または第2の配列は、約1〜18個(例えば、2〜15個、3〜14個または4〜10個、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17または18個)のホスホロチオエート結合を含み得る。第1の鎖または第1の配列は、ホスホロチオエート結合を含まなくてもよい。
上述のアダプターにおいて、第1の鎖および第2の鎖は、二重鎖を形成できる。この二重鎖は、15〜30bp長であり得る。その場合、この二重鎖は、第1または第2の鎖の3’末端または5’末端において(例えば、第2の鎖の3’末端または第1の鎖の5’末端において)、平滑末端または付着末端を有し得る。このアダプターにおいて、第1または第2の配列における1または複数の改変の結果、二重鎖において(例えば、第1または第2の鎖の1または複数の末端において)、1または複数の未対合のヌクレオチド、例えば、未対合の塩基またはオーバーハングが生じ得る。
好ましくは、この第1または第2の配列(または鎖)は、17〜80、18〜60または19〜50ヌクレオチド長、例えば、17、18、19、20、21、22、23、24、25、30、40、50、60または80ヌクレオチド長である。より好ましい実施形態では、この第1または第2の配列は、19〜21ヌクレオチド長、即ち、19または20または21ヌクレオチド長である。
一部の好ましい実施形態では、親、ネイティブまたは公知の認識配列は、1位においてCを有する。これらを含むかかる親認識配列の例は、図1に示される。一実施形態では、本発明のアダプターは、1位において、第2の配列(即ち、図3〜5に示されるアダプターの下の鎖)上にGからAの置換を有する(例えば、図5に示され、以下の実施例2に記載される、アダプター6、8、13、17および27)。別の一実施形態では、このアダプターは、第2の配列上の1位において、GからAの置換を有し、かつ反対の鎖上に、即ち、第1の配列の1位において、ミスマッチした塩基を有する(例えば、その位置においてミスマッチしたCを有するアダプター8および27)。なお別の一実施形態では、このアダプターは、第2の配列上の1位においてネイティブのGを有するが、反対の鎖上にミスマッチした塩基を有する(例えば、それぞれ、その位置においてミスマッチしたTおよびGを有するアダプター7および12)。これらのアダプターは全て、親アダプターと比較して増加した活性を付与する。
さらなる一実施形態では、このアダプターは、第1の配列の1位のCに対して5’側の付加された塩基、またはアダプター配列1位のGに対して3’側の付加された塩基を有し得る(例えば、アダプター5、9および10)。これらのアダプターは、親アダプターよりも低い、または親アダプターと匹敵する重複率を有する。
一部の実施形態では、この第1または第2の鎖は、2−アミノプリン、2,6−ジアミノプリン、5−ブロモdU、デオキシウリジン、逆方向dT、逆方向ジデオキシ−T、ジデオキシ−C、5−メチルdC、デオキシイノシン、5−ニトロインドールを含むユニバーサル塩基、2’−O−メチルRNA塩基、イソ−dC、イソ−dG、リボヌクレオチド、モルホリノ、タンパク質ヌクレオチドアナログ、グリコイックヌクレオチドアナログ(glycoic nucleotide analogue)、ロックトヌクレオチドアナログ、トレオースヌクレオチドアナログ、鎖終結ヌクレオチドアナログ、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシンおよびウィオシン(wyosine)からなる群から選択される少なくとも1つの改変されたヌクレオチドを含み得る。他では、第1または第2の鎖における少なくとも1つのヌクレオチドは、リン酸化され得るか、もしくはリボヌクレオチドであり得、または改変された糖、非天然の結合、脱塩基部位、ジデオキシ塩基、5−メチル塩基もしくはスペーサーを有し得る。一部の実施形態では、第2の鎖は、第2の配列に対して5’側にタグ配列をさらに含み得る。同様に、第1の鎖は、第1の配列に対して3’側に、例えば、図1に示される19位を超えて、タグ配列をさらに含み得る。第1および第2の配列へのタグは、以下に記載されるように、それらの使用に基づいて互いに対して非相補的であり得る。アダプターに対して、トランスポザーゼは、「カットアンドペースト」トランスポザーゼ、例えば、ビブリオ・ハーベイ(Vibrio Harveyi)トランスポザーゼまたは高活性Tn5トランスポザーゼであり得る。
本発明は、(i)上述の第1の単離された合成核酸アダプターと、(ii)上述の第2の単離された合成核酸アダプターとを有する、単離された合成核酸アダプターのセットもまた提供し、この第1のアダプターおよび/または第2のアダプターは、そのそれぞれの親認識配列またはその相補体と比較して、少なくとも1つの異なる改変を有する。例えば、2つのアダプターのうち少なくとも1つは、上記単離された合成核酸アダプターである。これら2つのアダプターは、同じトランスポザーゼによって、または2つの異なるトランスポザーゼによって、認識され得る。
これらのセットの例には、図5Cに示されるアダプター4〜10、12〜23および27〜28、図13に示されるアダプター3U2、8U2、3U4、8U4、3i0dTおよび8i0dT、アダプターE8(図18)、ならびに図19に示されるアダプターの任意の組み合わせが含まれる。
この第1の配列および第2の配列は、それぞれ、配列番号73および配列番号74、配列番号75および配列番号76、配列番号28および配列番号36、配列番号28および配列番号22、配列番号2および配列番号36、配列番号2および配列番号74、配列番号2および配列番号76、配列番号26および配列番号22、配列番号26および配列番号36、配列番号26および配列番号39、配列番号26および配列番号41、配列番号24および配列番号22、配列番号24および配列番号36、配列番号24および配列番号39、配列番号24および配列番号41、配列番号28および配列番号39、配列番号28および配列番号41、配列番号2および配列番号39、配列番号2および配列番号41、配列番号75および配列番号36、もしくは配列番号73および配列番号36を含み得るか、またはこれらから本質的になり得るか、またはこれらからなり得る。他の例には、図11に示されるアダプター1および5〜10のセット、アダプター5〜10のセット、アダプター6、8、13、17および27のセット、アダプター8および27のセット、アダプター7および12のセット、ならびにアダプター5および9のセットが含まれる。さらなる例には、アダプター5〜10、12、13、17および27の任意の組み合わせが含まれる。他の例には、図13に示されるアダプター対2〜4、および図19に示されるアダプターの任意の組み合わせが含まれる。
第1のトランスポザーゼおよびこのトランスポザーゼによって認識される配列を有する上述の第1のアダプターを有するキットもまた提供される。このキットは、緩衝液、重合酵素、エンドヌクレアーゼおよび制限酵素からなる群から選択される少なくとも1つの成分、ならびに標的DNAからDNAライブラリーを作製するための指示書を、さらに含み得る。一部の実施形態では、アダプターの第2の鎖は、第2の配列に対して5’側にタグ配列をさらに含み、キットは、このタグ配列に対して相補的なプライマーをさらに含む。他では、このキットは、第1のアダプターとは異なるが、第1のトランスポザーゼまたは異なるトランスポザーゼによって認識され得る、第2のアダプターをさらに含み得る。
別の一態様では、本発明は、標的DNA分子を断片化するためのin vitroの方法を提供する。この方法は、トランスポザーゼを得るステップと、トランスポザーゼによって認識され得る上記単離された合成核酸アダプターを得るステップと、アダプター、トランスポザーゼおよび標的DNA分子を混合するステップと、転位反応を実施するための条件下で、アダプター、トランスポザーゼおよび標的DNAをインキュベートし、それによって、アダプターおよびトランスポザーゼが標的DNA分子と会合し、トランスポザーゼ媒介性の切断を介して標的DNA分子を切断して、切断されたDNA産物を提供するステップとを含む。
他の態様では、本発明は、少なくとも1つのトランスポザーゼを有するトランスポザーゼ成分と本発明のアダプターとを含む、トランスポザーゼ複合体を提供する。トランスポザーゼ複合体を産生するために、1または複数のトランスポザーゼを、このトランスポザーゼの認識配列を含む本発明の1または複数のアダプターと共にインキュベートし、アダプターがトランスポザーゼに結合するのに十分な時間を与え、それによって、トランスポザーゼ複合体を創出することができる。このトランスポザーゼ複合体は、固体基材に結合され得る。その場合、特異的結合対を含むリンカー成分を使用することができる。特異的結合対のメンバーの一方は、アダプターに結合され得、他方のメンバーは、固体基材に結合され得る。かかる固体基材に結合したトランスポザーゼ複合体では、複合体1つにつきアダプターの少なくとも1つが、それに結合した特異的結合対のメンバーを有する。
なお他の一態様では、本発明は、標的DNA分子を断片化するためのin vitroの方法を提供する。この方法は、標的DNA分子を上述のトランスポザーゼ複合体と接触させて、反応混合物を形成するステップと、転位反応を実施するための条件下でこの反応混合物をインキュベートするステップとを含む。この標的DNA分子は、低い数の細胞数、例えば、1〜10細胞、1〜3細胞もしくは1つの単一細胞、または染色体からなるサンプルから得ることができる。
本発明は、標的DNA分子の配列決定またはマイクロアレイ分析のためにアッセイサンプルを調製するための方法をさらに提供する。この方法は、標的DNA分子を、上記単離された合成核酸アダプターおよびこのアダプターに結合するトランスポザーゼを有する複合体と接触させて、反応混合物を形成するステップと、転位反応を実施するための条件下でこの反応混合物をインキュベートして、切断されたDNA産物を生成するステップと、この切断されたDNA産物を増幅するステップとを含む。本明細書で開示する場合、このアダプターの優越性に起因して、増幅するステップの前にアダプターを除去する必要性は存在しない。即ち、この増幅するステップは、アダプターを事前に除去することなく実施される。
マイクロアレイのためのDNAサンプル調製の方法もまた提供される。この方法は、サンプルDNA分子を、本明細書に開示される単離された合成核酸アダプターおよびこのアダプターに結合するトランスポザーゼを有する複合体と接触させて、反応混合物を形成するステップと、転位反応を実施するための条件下でこの反応混合物をインキュベートして、サンプルDNA分子のDNA断片を生成するステップとを含む。このアダプターは、オリゴヌクレオチドタグを有し、これらのDNA断片は、このオリゴヌクレオチドタグで両方の末端においてタグ化される。この方法は、このオリゴヌクレオチドタグに対して相補的なプライマーを使用してDNA断片を増幅するステップをさらに含み得る。このタグは、このタグに対して相補的なプライマーの着地部位として使用され得る。この1または複数のプライマーは、フルオロフォアで標識化された少なくとも1つのdNTPを含むdNTP混合物を使用するポリメラーゼ反応において伸長され得る。
本発明の1または複数の実施形態の詳細は、以下の説明および図面中に示されている。本発明の他の特徴、目的および利点は、説明、図面および特許請求の範囲から明らかである。
一方の鎖のみが示された、アダプター中の第1の位置(C)が保存された、トランスポザーゼの、ネイティブIRLおよびIRR、ならびに改変されたアダプターのリストを示す図であり、異なる色は、異なるアダプターにおける類似性および差異を示す。各配列の後ろの括弧中の数字は、その配列についての配列番号を指す。 DDEモチーフを有するTn5トランスポザーゼの触媒部位、およびアダプターを示す略図を示す図である。保存されたC(図1中に示される1位)および反対のアダプター鎖上の保存されたGに下線を付す。 (A)Vibharトランスポザーゼの第1および第2のアダプター配列を含む親アダプター二重鎖、ならびに(B)複数の改変されたアダプターを、模式的に示すリストを示す図であり、上の鎖および下の鎖は、それぞれ、上述の第1の配列および第2の配列に対応する。各配列の後ろの括弧中の数字は、その配列についての配列番号を指す。 (A)「高活性」Tn5トランスポザーゼの親アダプター、および(B)複数の改変されたアダプターを模式的に示すリストを示す図であり、上の鎖および下の鎖は、それぞれ、上述の第1の配列および第2の配列に対応する。各配列の後ろの括弧中の数字は、その配列についての配列番号を指す。 ヌクレオチドの置換および付加に基づく、Vibharトランスポザーゼのアダプターの例を示す略図を示す図である。(A)親アダプター、(B)1位における変化/付加に基づいて番号を振ったアダプター、および(C)誘導体アダプターの例。各配列の後ろの括弧中の数字は、その配列についての配列番号を指す。 高いDNAインプットにおけるNGSのためのサンプル調製における複数のアダプターの活性の評価を示す略図を示す図である。異なるアダプターをロードしたVibharトランスポザーゼを使用して生成したNGSサンプルを、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。 他の誘導体アダプターおよび親アダプター1と比較した、高いDNAインプットにおけるアダプター8のより高い活性の確認を示す略図を示す図である。異なるアダプターをロードしたVibharトランスポザーゼを使用して生成したNGSサンプルを、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。 中間の(AおよびB)および低い(CおよびD)DNAインプットにおけるNGSのためのサンプル調製における複数のアダプターの活性の評価を示す略図のセットを示す図である。異なるアダプターをロードしたVibharトランスポザーゼを使用して生成したNGSサンプルを、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。 異なるトランスポザーゼ濃度(A−5ug/ml、B−1.7ug/ml、C−0.56ug/ml)における、親アダプター1と比較した、アダプター8によってトランスポザーゼに付与されたより高い活性の確認を示す略図を示す図である。0−トランスポザーゼなしの陰性コントロール。異なるアダプターをロードしたVibharトランスポザーゼを使用して生成したNGSサンプルを、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。 親アダプター1、ならびにDNAを添加しなかった場合の背景なし(NC)と比較した、低いDNAインプットにおける、アダプター8によってトランスポザーゼに付与されたより高い活性の確認を示す略図を示す図である。異なるアダプターをロードしたVibharトランスポザーゼを使用して生成したNGSサンプルを、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。 異なるアダプターおよびそれらの混合物によってVibharトランスポザーゼに付与された重複率を示す略図を示す図である。 異なるアダプターによってVibharトランスポザーゼに付与されたATドロップアウトを示す略図を示す図である。 いくつかの先行技術のオリゴヌクレオチド、ならびにAgP1、AgP2、3ilb、8ilb、3i0、8i0、3U2、8U2、3U4、8U4、3i0dTおよび8i0dT(それぞれ、配列番号79〜90)を含む本発明のいくつかの例示的な改変されたオリゴヌクレオチドを示す図である。(A)DNA挿入物、即ち、3ilb/3i0および8ilb/8i0アダプターでタグ化されたDNA断片、ならびにPCRにおけるDNA断片の増幅のためのAgP1およびAgP2プライマーを含む、トランスポザーゼ反応の典型的産物の例。DNA挿入物の両方の側にギャップが示される。ギャップ中の矢印は、ギャップのDNAポリメラーゼ修復の方向を示す。(B)先行技術のアダプターおよび改変されたアダプター。矢印の実線部分は、ハイブリダイズしたオリゴヌクレオチドを示す。破線部分は、伸長された部分、即ち、DNAポリメラーゼによってコピーされた部分を示す。太字のXは、妨害または遮断されたDNAポリメラーゼ伸長を示す。dU:デオキシウリジン;InvdT:逆方向チミジン;およびアスタリスク:ホスホロチオエート結合。 SPRI精製なしのトランスポザーゼ反応からの直接的なトランスポザーゼ反応産物の増幅を示す写真を示す図である。(A)トランスポザーゼ反応を、標的DNAなしであるが、アダプター対1、3または4をロードしたVibharトランスポザーゼを用いて、25分間実施した。(B)ヒトDNA(20ul当たり20ng)を、アダプター対1、3または4をロードしたVibharトランスポザーゼを用いて、断片化し、20分間または45分間、トランスポザーゼ反応においてタグ化した。 高い標的DNAインプット(20ul当たり200ng)のトランスポザーゼ反応後の、SPRI精製ありまたはなしで得られたPCR産物の比較を示す写真を示す図である。 AgP1、AgP2、3ilb、8ilb、3iltおよび8ilt(それぞれ、配列番号79、116、81、82および91〜92)を含む、標準的アダプターを示す略図およびNGSのためのサンプル調製の模式図を示す図である。P5およびP7は、Illuminaフローセルへの結合に必要な部分を示す。 15分間、25分間または42分間にわたる、50ng/mlおよび100ng/mlのトランスポザーゼ(それぞれ、「A」および「B」)と共に標準的アダプターを使用した、DNAの断片化およびタグ化の時点で観察されたヌクレアーゼ活性を示す写真を示す図である。 20pgのヒトDNAインプット(約3つの二倍体細胞に対応する)を用いた、異なるトランスポザーゼ濃度、即ち、A−180ng/ml、B−120ng/ml、C−80ng/mlにおける、アダプター78を使用したトランスポザーゼDNAの断片化およびタグ化におけるヌクレアーゼ活性の非存在、ならびにそのホスホロチオエート誘導体(アダプターE8)によって付与された増加したトランスポザーゼ活性を示す写真を示す図である。 トランスポザーゼアダプターの誘導体を示す図である。(A)アダプター78のホスホロチオエート誘導体の例、(B)標準的アダプターのホスホロチオエート誘導体(図16上に示されるものに対する上の鎖のみが示される)、ならびに(C)誤対合、逆方向dTおよびdU改変と組み合わせたホスホロチオエートアダプター。括弧中の数字は、配列番号を指す。 Illumina機器でのNGS配列決定に適切なサンプル調製のための4プライマーPCR反応における、アダプター78またはその誘導体のPCR増幅のためのプライマーを示す図である。P5およびP7は、Illuminaフローセルへの結合に必要な部分を示す。括弧中の数字は、配列番号を指す。 マイクロアレイのためのサンプル調製における、DNAの断片化/タグ化(A)、増幅(B)、および標識化(C)を示す略図のセットを示す図である。 マイクロアレイのための、トランスポザーゼ反応において断片化およびタグ化され、それらのタグに対して相補的なプライマーを用いてPCRにおいて増幅されたヒトDNAを示す写真を示す図である。A:16pgのDNAインプット、および、B:200ngのDNAインプット。
本発明は、複数の単離された合成核酸トランスポザーゼアダプターの予測されなかった発見に、少なくとも一部基づく。これらの合成アダプターは、ほとんどの保存された部位において公知の機能的トランスポザーゼアダプター(ネイティブまたは改変されたものの両方)とは異なるが、これらの合成アダプターは、活性を保持し、そのうちいくつかは、さらに高い活性を有し、NGSのために使用される場合、増加したランダムさ、低減された重複率またはそれら両方を生じることは、驚くべきことであった。一部の実施形態では、選択されたトランスポザーゼに異なる特性を付与する複数の有用なアダプターが、ネイティブアダプターにおける保存された1位を改変させることによって生成され得ることが実証された。アダプターへのいくつかの改変により、時間のかかるアダプターの除去なしにNGSのためのDNAサンプルを調製することが可能になり、および/または非常に低い量のDNAを有するサンプルを処理することが可能になることを見出したこともまた、驚くべきことであった。
アダプター
本発明は、それぞれ上述の第1の配列および第2の配列を含むか、またはかかる配列から本質的になるか、またはかかる配列からなる、第1の鎖および第2の鎖を含む単離された合成核酸アダプターを提供する。この第1の配列および第2の配列は、互いに対して完全に相補的または実質的に相補的であり、このアダプターは、トランスポザーゼによって認識される。
上述のように、トランスポザーゼは、単離されたタンパク質としては作用しないが、特異的DNA配列またはアダプターとの複合体で作用し、これらは、トランスポザーゼと共に安定な複合体を形成でき、従って、それらを活性にできる。これらのアダプターは、天然に見出されるトランスポザーゼ認識配列であり得、または改変されたネイティブ配列でもあり得る。従来より、通例、1つのかかる配列のみが、特異的トランスポザーゼとの使用に推奨されている。例えば、より活性に、より安定にかつより良く発現されるように変異された「高活性」Tn5トランスポザーゼは、これもまたネイティブ配列から変異された「モザイク」配列(アダプター)を認識し、この配列のみが、このトランスポザーゼとの使用に推奨されている(Zhou et al.,J Mol Biol.1998,276(5):913−25;Brouilette et al.,Dev Dyn.2012,241(10):1584−90)。
トランスポザーゼのDDEアミノ酸モチーフは、触媒部位の一部であることが公知であり、トランスポザーゼ活性に必要である(Nesmelova and Hackett,Adv Drug Deliv Rev.2010,30;62(12):1187−95;Steiniger−White et al.,Curr Opin Struct Biol.2004,Feb;14(1):50−7)。DDEモチーフとそれに近接してのアダプターの存在との両方が活性に必要であるので、本発明者は、複合体の特性が、DDEモチーフに近い触媒部位に位置付けられたアダプター中のヌクレオチドを変化させることによって適切にモジュレートできると認識した。しかし、厳密に保存されたDDEモチーフと同様に、触媒部位に最も近いアダプター中のヌクレオチドもまた厳密に保存されているということが、当該分野で公知であった。そのために、図1は、トランスポザーゼのいくつかの公知のネイティブおよび改変されたアダプターを列挙し、一方の鎖のみが示される。この図に示すように、これらのアダプター中の第1の位置におけるCは、異なるアダプターの全てにおいて保存されている。
本明細書で使用する場合、用語「アダプター」とは、それが引き続いて接続される核酸断片を取り扱う手段を提供する、非標的核酸成分、一般にはDNAを指す。例えば、実施形態では、アダプターは、(例えば、DNAポリメラーゼによる伸長のためのプライマーなどのオリゴヌクレオチドをアニーリングするための部位、または捕捉のためもしくはライゲーション反応のためのオリゴヌクレオチドを提供することによって)このアダプターが結合されるDNAの同定、認識および/または分子的操作もしくは生化学的操作を可能にするヌクレオチド配列を含む。本明細書で開示する場合、本発明のアダプターは、(i)トランスポザーゼのネイティブもしくは公知の認識配列の改変されたバージョンである第1の配列を有する第1の鎖、および/または、(ii)認識配列の相補体の改変されたバージョンである第2の配列を有する第2の鎖を有する。アダプターの鎖のうちの一方は、ネイティブであり得、もう一方の鎖は、改変(複数可)を含み得る。
用語「トランスポザーゼの認識配列」、「トランスポザーゼ認識配列」、「トランスポザーゼ結合配列」および「トランスポザーゼ結合部位」は、転位を媒介する場合にトランスポザーゼが特異的に結合するトランスポゾン末端配列内に見出されるヌクレオチド配列を指すために、本明細書で相互交換可能に使用される。トランスポザーゼ結合配列は、トランスポザーゼサブユニットに結合するための1つよりも多い部位を含み得る。
「トランスポザーゼ」とは、トランスポゾン末端含有組成物(例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物)と共に機能的複合体を形成することが可能であり、in vitroまたはin vivoでの転位反応において共にインキュベートされる二本鎖標的DNA中へのトランスポゾン末端含有組成物の挿入または転位を触媒することが可能な酵素を指す。
用語「トランスポゾン末端」は、in vitroまたはin vivoでの転位反応において機能的であるトランスポザーゼまたはインテグラーゼ酵素と共に複合体を形成するために必要なヌクレオチド配列(「トランスポゾン末端配列」)のみを示す二本鎖DNAを意味する。トランスポゾン末端は、「複合体」、「シナプス複合体」または「トランスポソーム複合体」を形成する。トランスポゾン末端は、(i)「移行されるトランスポゾン末端配列」または「移行される鎖」および(ii)「移行されないトランスポゾン末端配列」または「移行されない鎖」からなる2つの相補的配列を示す。例えば、Vibharトランスポザーゼのいくつかのトランスポゾン末端/アダプターを、図3に示す。各々における上の鎖(例えば、Vibhar IRRについて5’−CTGTCTCTTGATCACAAGT−3’、配列番号2)は、移行されないトランスポゾン末端配列を示す移行されない鎖であるが、下の鎖(例えば、Vibhar IRRについて3’−GACAGAGAACTAGTGTTCA−5’または5’−ACTTGTGATCAAGAGACAG−3’、配列番号22)は、移行されるトランスポゾン末端配列を示す移行される鎖である。同様に、図4では、各々における上の鎖(例えば、モザイク(改変されたTn5)について5’−CTGTCTCTTATACACATCT−3’、配列番号6)は、移行されない鎖であるが、下の鎖(例えば、モザイク(改変されたTn5)について5’−AGATGTGTATAAGAGACAG−3’、配列番号48)は、移行される鎖である。本明細書で使用する場合、用語「第1の鎖」とは、移行されない鎖を指し、図3〜5において、かかる第1の鎖/移行されない鎖は、各アダプターについて上の鎖として示される。用語「第2の鎖」とは、移行される鎖を指し、図3〜5において、かかる第2の鎖/移行される鎖は、各アダプターについて下の鎖として示される。野生型トランスポゾン末端では、移行されない/第1の/上の鎖は、その5’末端において保存的Cを有し、対応する移行される/第2の/下の鎖は、その3’末端において保存的Gを有する。図13、16、18、19および21では、移行されない/第1の鎖は、各アダプターについて下の鎖として示され、対応する移行される/第2の鎖は、各アダプターについて上の鎖として示される。図1では、移行されない/第1の鎖のみが示され、その全てが、5’末端または1位において保存的Cを有する。
本明細書で使用する場合、「1位」とは、図1に示される野生型トランスポゾン末端の移行されない/第1の鎖上の5’末端Cヌクレオチドに対応する位置、および例えば図3〜5に示される対応する移行される/第2の鎖/下の鎖上の3’末端Gヌクレオチドに対応する位置を指す。また、図2に示され下線が付されるように、1位(移行されない/第1の上の鎖のCおよび移行される/第2の鎖/下の鎖のG)は、トランスポザーゼの触媒部位にある。
上述のように、一部の実施形態では、本発明のアダプター内の第1および第2の配列は、互いに対して相補的または実質的に相補的である。本明細書で使用する場合、特記しない限り、用語「相補的」または「実質的に相補的」は、第2のヌクレオチド配列に関して第1のヌクレオチド配列を記述するために使用される場合、第1のヌクレオチド配列を含むオリゴヌクレオチドまたはポリヌクレオチドが、当業者に理解される条件下で、第2のヌクレオチド配列を含むオリゴヌクレオチドまたはポリヌクレオチドとハイブリダイズし、二重鎖構造を形成する能力を指す。
これは、第1のヌクレオチド配列および第2のヌクレオチド配列の全長にわたる、第1のヌクレオチド配列を含むオリゴヌクレオチドまたはポリヌクレオチドの、第2のヌクレオチド配列を含むオリゴヌクレオチドまたはポリヌクレオチドとの塩基対合を含む。かかる配列は、本明細書で、互いに対して「完全に相補的」であると言われ得る。しかし、一部の実施形態では、第1のヌクレオチド配列および第2のヌクレオチド配列は、特記しない限り、互いに対して実質的に相補的であり得、互いに対して少なくとも約80%、90%、95%、96%、97%、98%または99%相補的である。本明細書で使用する場合、第1の配列が、本明細書で第2の配列に対して「実質的に相補的」と言われる場合、これら2つの配列は、完全に相補的であり得、またはこれらは、それらの最終適用に最も適切な条件下でハイブリダイズする能力を保持しつつ、ハイブリダイゼーションの際に、19〜21bpの長さにわたって、1もしくは複数であるが、一般には例えば4、3、2もしくは1つ以下のミスマッチした塩基対、好ましくは2または1つのミスマッチした塩基対を形成し得る。しかし、2つのオリゴヌクレオチドが、ハイブリダイゼーションの際に、1または複数の一本鎖オーバーハングを形成するように設計される場合、かかるオーバーハングは、相補性の決定に関してミスマッチとみなすべきではない。
「相補的」配列は、本明細書で使用する場合、それらがハイブリダイズする能力に関して上記要求が満たされる限り、Watson−Crick塩基対、非Watson−Crick塩基対ならびに/もしくは非天然のおよび改変されたヌクレオチドから形成される塩基対を含み得、またはかかる塩基対から完全に形成され得る。
A.1位において改変を有するアダプター
一実施形態では、本発明のアダプターは、一般にトランスポザーゼのネイティブまたは公知の認識配列の改変されたバージョンである配列を有する鎖を有する。ネイティブまたは公知の認識配列の1位における厳密に保存された性質に起因して、これらのヌクレオチドを変化させることによってトランスポザーゼ複合体の特性をモジュレートする課題は、人を萎縮させるように思われた。実際、保存されたDDEモチーフにおける変化が、トランスポザーゼを完全に不活性にし、従って回避すべきであるのと全く同じように、厳密に保存されたヌクレオチド位置における変化の結果、活性における鋭い低下が不可避的に生じることが、当該分野で十分に理解された。
しかし、性質における選択は、これらの保存された位置における未対合のヌクレオチドまたは改変されたヌクレオチドとしての、アダプターにおけるかかるバリエーションに対しては適用されてこなかったので、本発明者は、厳密に保存されたヌクレオチド位置におけるいくつかの変化が活性と適合性であり得ることを、予期せず見出した。かかる変化が天然においてまれに生じ得るとしても、それらは迅速に修復される。従って、子孫においてそれらを保存する機構は存在しない。これらの位置は、保存されており、従って、トランスポザーゼ活性をモジュレートするために非常に重要であるが、それらに対する選択圧が存在しないいくつかの変化を導入することが可能でなければならず、従って活性をモジュレートすることが可能でなければならない。そのために、どのヌクレオチド変化の結果、どの型のモジュレーション、例えば、より高いまたはより低い活性、高度に希釈された状態での活性(低いインプットの適用)、ATまたはGCリッチなヌクレオチド配列のより可能性の高い認識、複合体の安定性、固体支持体上での活性、半精製または粗製サンプルにおける活性、ならびに種々のin vitro反応条件(pH、温度、Mn++またはMg++濃度、塩(例えば、NaClおよびKCl)、グリセロールなど)におけるまたはin vivo適用(送達ビヒクル、細胞型、オルガネラ型)次第での、上記したものの顕在化の程度が生じるかは、先験的には明らかでない。しかし、本明細書の開示を考慮すると、当業者は、当業者が自由に使える複数の適切なアダプターの利益を即座に認識し、プロジェクトおよび当業者が解決を望む具体的な問題次第で、最も適切なアダプターを選択するための実験を設計する。かかるプロジェクトおよび実験設計の例は、以下に実証される。
本発明のアダプターは、トランスポザーゼのネイティブまたは公知の認識配列と比較して、種々の変化を有し得る。転位事象におけるカットに最も近く(天然ではトランスポゾンの内側に面する)、同じファミリーのトランスポザーゼにおいて保存されているヌクレオチド位置、例えば、図1に示される1位が、改変に好ましい。2位および/または3位もまた改変され得るが、例えば、図2においてTn5トランスポザーゼについて示されているように、1位は、カットに隣接しており、触媒部位中に位置付けられるので、トランスポザーゼ特性をモジュレートするために最も重要であるので、これらはあまり好ましくない。Vibharトランスポザーゼについて図3に、「高活性」Tn5トランスポザーゼについて図4に示すように、この1位は、いずれかの鎖もしくは両方の鎖上の1つのヌクレオチドをネイティブもしくは改変されたヌクレオチドに置換することによって、または少なくとも1つのネイティブもしくは改変されたヌクレオチドを、一方または両方の鎖に付加することによって、または一方の鎖から少なくとも1つのヌクレオチドを除去することによって、あるいは上記の組み合わせによって、改変され得る。
B.プライマー伸長を妨害する改変を有するアダプター
別の一実施形態では、本発明のアダプターは、PCR反応などにおけるプライマー伸長を妨害する1または複数の改変を有する。かかるアダプターは、トランスポザーゼを使用するNGSのためのDNAサンプルの調製に有用である。
従来、NGSのためのDNAサンプルの調製には、オリゴヌクレオチドアダプターがロードされたトランスポザーゼを使用した標的DNAの断片化およびタグ化、その後の、未使用のアダプターからのタグ化されたDNA断片の精製、ならびに断片のPCR増幅が関与する。これまでのところ、例えば、Agencourt Ampure XP SPRI磁性ビーズ(Beckman−Coulter)またはRNA結合ナノスピンカラム(Agilent Technologies)を使用して、かなり小さいアダプターからより大きいサイズのDNA断片を精製することが必要であった。精製ステップを省略するための試みは、標的DNAの増幅を事実上生じなかったか、または所望のDNA断片の非常に低い収量を生じたかのいずれかであった。その代り、おそらくはアダプター−プライマーダイマーを含む小さいサイズの副産物(典型的には100bp未満)が産生された。本質において、かかるPCR反応は、標的DNA断片ではなく、これらの副産物の優先的な増幅によって「毒される」。
本明細書で開示する場合、プライマー伸長を妨害する1または複数の改変を有するアダプターは、トランスポザーゼ反応の後に上述の精製ステップを無効にすることによって、NGSサンプル調製を単純化することを可能にする。これは、NGSサンプル調製を、より速く、あまり高価でなく、自動化により従いやすいものにする。
トランスポザーゼを使用するDNAの断片化およびタグ化のための一般的な方法および組成物は、当該分野で公知である。例えば、米国特許出願公開第20120301925号を参照のこと。例えば、ビブリオ・ハーベイ(Vibhar)トランスポザーゼ認識配列を含む19b.p.のオリゴヌクレオチドが、かかるオリゴヌクレオチド/アダプターと共に複合体を形成し得るトランスポザーゼ上に「ロードされ」得る。標的DNAと混合される場合、ロードされたトランスポザーゼは、図13Aに示すように、標的DNAを切断し、アダプターによってそれらの断片(DNA挿入物)をタグ化する。二本鎖の19bp領域に加えて、アダプターは、PCRプライマーの着地部位を提供できる一本鎖領域を含み得る。図13Aに示すように、PCRプライマーAgP1およびAgP2は、Illuminaフローセル部位のためのDNA配列、P5およびP7を含む。
トランスポザーゼ反応の典型的な産物もまた、図13Aに模式的に示される。この図に示すように、アダプター(ハイブリダイズしたオリゴヌクレオチド3ilb/3i0および8ilb/8i0)は、標的DNA断片(DNA挿入物)の末端に結合される。DNA挿入物は、オリゴヌクレオチド3ilbおよび8ilbにおいて、アダプターに接続される。これは、プライマーAgP1およびAgP2を使用して、PCRにおいて増幅される。しかし、DNA挿入物の両方の末端上にはギャップが存在する。このギャップは、3i0および8i0オリゴヌクレオチドの置換を生じるPCRステップにおいて修復される(ギャップ中の矢印)。本発明者は、PCRステップにおいて、置換されたオリゴヌクレオチドが、互いと、ならびにAgP1およびAgP2 PCRプライマーと相互作用し得、そうしてアダプター−プライマーダイマーを形成すると仮説を立てた。本発明者はまた、3i0および8i0オリゴヌクレオチドはトランスポザーゼ反応ステップにおいてのみ有用であり、さらなる使用を有さないので、かかる改変がトランスポザーゼ反応を妨害しない限り、これらが、ダイマーの生成を妨害するように改変され得るとも仮説を立てた。
以下の実施例4に示すように、DNAポリメラーゼを止める少なくとも1つの改変を、アダプターの少なくとも1つの鎖中に導入した。増幅のためにしばしば使用されるPfu DNAポリメラーゼは、dU残基上で止まるので(Hogrefe et al.,Proc.Natl.Acad.Sci.USA,99(2),596−601,2002.)、dU改変を、アダプター対2および3中に導入した(図13B)。PCRにおけるアダプターの下の鎖(オリゴヌクレオチド3U2、8U2、3U4および8U4)のコピーを妨害するために、改変を、PCRプライマーAgP1およびAgP2の着地部位の下流に導入した。従って、アダプターのコピーおよび増幅は止まるが、ギャップ修復の後、タグ化されたDNA断片は改変されたヌクレオチドを含まないので、標的DNA断片の増幅は妨害されずに進行する。ポリメラーゼを止める他の改変、例えば、Pfuポリメラーゼを止める脱塩基部位または2’OMeで改変されたRNAが、この目的のために、当業者によって使用され得る(例えば、米国特許第7,659,069号を参照のこと)。同様に、ポリメラーゼを止める任意の改変が使用され得、それらがトランスポザーゼ反応を妨害しない限り、互いに組み合わされ得る。
別のアプローチもまた、同じ目的のために使用され得る。より具体的には、改変されたヌクレオチドが、アダプター鎖に結合され得る。図13Bおよび以下の実施例4に示すように、標準的アダプター対1を用いると、オリゴヌクレオチドAgP1およびAgP2は、鋳型として機能し、それらにハイブリダイズした状態で、オリゴヌクレオチド3i0および8i0は、プライマーとして機能し、それによって、PCR反応において望ましくない副産物を生成する。本発明者は、これが、アダプター−プライマーダイマーの生成に寄与し得ると仮説を立てた。従って、アダプターの下の鎖の3’末端を、このプロセスを妨害するために、逆方向dTで遮断した(図13B、アダプター対4)。さらに、この逆方向dTには、DNAポリメラーゼ3’エキソヌクレアーゼ活性による逆方向dTの除去を防止するために、ホスホロチオエート結合が先行し得る。他のアプローチ、例えば、スペーサーが逆方向dTまたは他の3’遮断基に先行することが、同じ目的のために使用され得る。このために、多くの3’遮断基が、本明細書の開示を考慮して使用され得る。
本発明において開示されるオリゴヌクレオチド改変の適用は、トランスポザーゼを使用するゲノムDNAサンプル調製に限定されない。これらは、PCR、例えば、SureSelect、HaloPlex、超音波処理を使用するゲノムDNAサンプルプレップなどを実施するために、合成オリゴヌクレオチドからの標的核酸断片の精製を現在必要としている他の技術において、アダプター/タグ/ベクター精製ステップを排除するために適用され得る。特に、単一細胞適用は、本発明から利益を得うる。SPRI精製を含む精製ステップで、100%効率的なものは存在しない。従って、初期ゲノム材料のいずれの喪失も、ゲノムカバー率にとって有害であり、その結果対立遺伝子ドロップアウトが生じるので、PCR増幅前の精製ステップを無効にすることは有益である。
C.ホスホロチオエート結合を有するアダプター
なお別の一実施形態では、本発明のアダプターは、1または複数のホスホロチオエート結合を有する。かかるアダプターは、非常に低い初期インプットのDNAからの、例えば、低い数の細胞、即ち、1つの単一細胞または数個の細胞(例えば、2、3、4、5、6、7、8、9または10個の細胞)からの、NGS配列決定またはマイクロアレイ分析のためのサンプル調製に有用である。
標準的Vibharアダプターおよびトランスポザーゼを使用する典型的なNGS配列決定サンプル調製では、これらのアダプターは、トランスポザーゼによって認識される19bpの二本鎖部分を含み、PCRプライマーの着地部位として使用される一本鎖部分もまた含む。例えば、図16および米国特許出願公開第2012/0301925号を参照のこと。トランスポザーゼ反応では、インプットDNAが切断され、得られた断片は、アダプターによって両方の末端においてタグ化される。次に、DNA断片は、アダプター配列に対して相補的なプライマーを使用するPCRにおいて増幅される。同時に、これらの断片には、例えば、Illuminaフローセル結合部位P5およびP7への結合に重要なDNA配列が提供される。Vibharトランスポザーゼ、アダプター設計、トランスポザーゼ−アダプター複合体を形成する方法および組成物、インプットDNAの断片化およびタグ化の機構は、当該分野で公知である。例えば、米国特許出願公開第2012/0301925号を参照のこと。
Vibharトランスポザーゼ調製物は、大腸菌(E.coli)発現宿主、または(以下で議論するように)弱い固有の非特異的ヌクレアーゼ活性のトランスポザーゼのいずれかに起源し得る微量のヌクレアーゼ活性を含む。これは、数千のヒト細胞由来の通常のDNAインプットでは大した問題を提示しないが、低いDNAインプットでは許容できない。図17に示すように、3つの細胞由来のDNAを用いると、満足な収量の適切なDNA断片が、25分間のトランスポザーゼ反応の後に観察されたが、NGSのために望ましいサイズ範囲の断片(200〜500bp)は、反応の42分の時点において、ほぼ完全に消失した。これは、トランスポザーゼ反応の25分の時点においてさえも、適切な材料の喪失がかなりのものであり得、50%以上の量になり得ることを暗示しており、これは、低いDNAまたは細胞数のインプットを用いたNGS配列のためには許容できない。
ホスホロチオエート結合は、ヌクレアーゼ攻撃に対する耐性を付与することが、当該分野で公知であった。例えば、参照によって本明細書に組み込まれる、Stein et al.,Nucl.Acids Res.,16:8,3209−3221,1988を参照のこと。アダプターは、断片の両方の末端に結合されるので、アダプター中にかかる結合を含めることは、エキソヌクレアーゼ攻撃に対する保護のために有用であり得る。しかし、先験的には、アダプターにおける非天然の結合がトランスポザーゼ反応においてアダプターを不活性にするか否かは、明らかではなかった。実際、ホスホロチオエート結合は、天然ではなく、かかる結合を含むDNAは、天然のホスホジエステル結合のみを含むDNAよりも、酵素にとって効率的な基質ではないことが観察された(Ciafre et al.,Nucl.Acids Res.,23:20,4134−4142)。
以下の実施例5に示すように、ホスホロチオエート結合を、トランスポザーゼ活性を不必要に苦しめることなしにヌクレアーゼに対する保護を付与するために、アダプターの一方の鎖(移行される鎖)中にのみ、控えめに導入した。予想外に、ホスホロチオエート結合の組み合わせ(例えば、アダプターE8)が、トランスポザーゼ反応効率における大きな改善を付与したことが見出された(図18)。
アダプターの移行される鎖のみがDNA断片に結合されるので、ホスホロチオエート結合は、その鎖中に導入され、標的DNA断片からギャップによって分離される相補的アダプター鎖は、ホスホロチオエート結合を含まない。本明細書に開示されるように、これらの鎖をPCR増幅に不適切なものにすることが有益であるので、ホスホロチオエート結合なしの鎖は、保護されない。
改善が、異なるトランスポザーゼ濃度ならびに異なるインキュベーション時間において、いくつかの実験において一貫して観察された。しかし、ほとんどの部分について、この改善は、ヌクレアーゼに対する保護には関連しなかった。実際、同じヌクレオチド配列を有するがホスホロチオエート結合を含まない短いアダプター78では、ヌクレアーゼ分解は事実上観察されなかった(図18)。標準的アダプターとは異なり、アダプター78およびそのホスホロチオエート誘導体E8は、トランスポザーゼによって認識され、トランスポザーゼによって結合され、大部分が隠されてヌクレアーゼ攻撃から保護される可能性が高い、19bpの二重鎖のみからなる。ヌクレアーゼ活性は、標準的アダプターの単鎖部分を認識し、それが消化するDNA断片の内部へと反転するという可能性がある。かなりのサイズのタンパク質、例えば、トランスポザーゼダイマー(MW約102KD)が、かかる手技に必要である。大腸菌由来の常在性ヌクレアーゼはサイズが小さく、大腸菌は十分に研究されており、かかる活性は大腸菌では記載されてこなかったので、大腸菌由来の常在性ヌクレアーゼがDNA分解を担う可能性は低いと思われる。機構が何であれ、実務上の観点から、トランスポザーゼ反応の効率が、アダプターにホスホロチオエート結合を付加することによって大きく改善され得ることが、重要である。
本明細書で議論するように、トランスポザーゼ反応の効率における数倍の改善が、単一細胞ゲノムのほぼ完全なゲノムカバー率に必要である。本発明の改変されたアダプターは、この改善を達成させる。効率をさらに改善するために、ホスホロチオエート結合を再シャッフリング、付加または除去すること、ならびに本明細書に開示されるアダプターへの他の改変を含む、さらなる手段を採ることができる。この手順は、マイクロアレイ適用のためにも採用され得、PCRまたはDNA−リガーゼ反応のいずれかにおいてかかるタグを付加することによって、Illuminaまたは他の型の機器での配列決定に必要なタグを提供し得る。限定されない例として、Illuminaタグを提供するためのかかるアダプターおよびPCRプライマーのいくつかは、図19および20に示される。
上に開示したアダプターは、低い数の細胞、例えば単一細胞由来の核酸を配列決定するための、当該分野における必要性に対処する。単一細胞配列決定は、いくつかの形態の癌のより良い理解、診断および処置にとって有望である。しかし、この分野における迅速な進歩にもかかわらず、これらの方法の全てにおいて高いエラー率が存在し、それらの方法には十分に良いものはないというコンセンサスが存在した。問題の1つは、単一細胞から得られた少量のDNAが、配列決定またはマイクロアレイのために直接的に処理(断片化およびタグ化)されないことである。まず、高度に進行性のポリメラーゼがより多くのDNAを生成するために縮重プライマーと組み合わせて使用され、次いで、増幅されたDNAのみが処理される、全ゲノム増幅(WGA)において、DNAが増幅される(Zheng et al.,J Zhejiang Univ Sci B.2011 Jan;12(1):1−11;Hou et al.Cell.2013 Dec 19;155(7):1492−506)。
エラーのほとんどがWGAステップにおいて生じることは、一般に許容される。まず、誤りは、ポリメラーゼ読み取りの段階で生じるが、さらに重要なことには、ゲノムの一部の領域は、他の領域よりも効率的に増幅され、一部の領域は全く増幅されない。これは、遺伝子コピー数の分析を複雑にするバイアスを生じる。さらに悪いことに、これは、対立遺伝子ドロップアウトを生じる。この理由のために、単一癌細胞ゲノム配列決定は、染色体DNAからは稀にしか試みられない。その代り、癌細胞のトランスクリプトームの配列決定またはマイクロアレイ分析が実施される。遺伝子は、複数のmRNAコピーによって提示されることが多いので、トランスクリプトームに焦点を合わせることは、対立遺伝子ドロップアウト問題を緩和する(Lawrence et al.Nature.2013 Jul 11;499(7457):214−8)。しかし、これにより、癌細胞のタンパク質コード領域に主に関する情報が得られるが、遺伝子調節領域、例えば、プロモーター、エンハンサーおよびサイレンサーに関する情報は得られない。また、ほとんどの形態の癌および他の広範な複雑な疾患への素因などの複雑な形質を担う遺伝的およびエピジェネティックなバリエーションの大部分は、非コード調節領域中に局在化するので、これは、当該分野における必要性に対処しない(Mitchison A. Immunogenetics.1997;46(1):46−52;Gaffney et al.,Genome Biology,2012,13:R7,1−15;Knight JC.Clin Sci(Lond).2003 May;104(5):493−501;Savinkova et al.,Biochemistry(Mosc).2009 Feb;74(2):117−29;Wang et al.,Carcinogenesis.2013 May;34(5):1012−7;Elahi et al.,Biochim Biophys Acta.2009 Mar;1792(3):163−72;Ruiz−Narvaez EA.Med Hypotheses.2011 May;76(5):638−42;Zabaleta J.Methods Mol Biol.2012;863:411−35;Susantitaphong et al.,Nephron Clin Pract.2012;122(3−4):107−13;Itzykson R,Fenaux P.Leukemia.2013 Nov 19.doi:10.1038/leu.2013.343];Vezzoli et al.J Transl Med.2011 Nov 22;9:201;Martini et al.,Diabetes.2013 Jul;62(7):2605−12;およびClark SJ.Hum Mol Genet.2007 Apr 15;16 Spec No 1:R88−95)。
従来のアプローチの技術的制限に起因して、遺伝子プロモーターは配列決定されないので、癌の発達および他の広範な複雑な疾患への素因の両方にとって最も妥当である豊富な遺伝子調節情報は、トランスクリプトームに焦点を当ててはアクセスできないままである。トランスクリプトームを配列決定することは、発現量的形質遺伝子座(eQLT)としても公知の、疾患と相関し得る豊富な転写物に関する情報を提供する。しかし、同じ個々の遺伝子において、発現プロファイルは、細胞型によって大きく異なり、容易に入手可能な細胞、例えばリンパ球の発現プロファイルは、有用でない場合が多い。例えば、脂肪組織における全ての遺伝子発現形質のうち50%超は、血液における10%未満と比較して、肥満と関連する臨床形質と強く相関した(Emillson et al.,Nature,2008,452:423−430)。さらに、アルツハイマーにおける脳細胞などの最も妥当な細胞の生検は、利用可能でない場合がある。ゲノムDNAの直接的配列決定は、これらの問題に対処することが理解されるが、現在、従来の単一細胞ゲノム配列決定技術の情況に起因して、実際的ではない。
個々の癌細胞のゲノムを配列決定することに加えて、単一細胞配列決定の別の適用は、非侵襲性出生前診断(NIPD)における適用である。母親の血液から単離された胎児の単一有核赤血球の分析は、10億ドルを超えるNIPD市場にとって有望である(Kantak et al.,Lab Chip.2014 Mar 7;14(5):841−54)。現在、「小細胞数」技術の最も大きい商業的適用は、迅速な着床前遺伝子診断(PGD)における適用である(Harper et al.,Eur J Hum Genet.2013)。
PGDは、最も一般的には、胚発生の3日目における1〜2細胞または5日目の約5細胞(胚盤胞)のいずれかから実施される。最近、胚盤胞アプローチは、より信頼性が高い、即ち、より多くの細胞由来の材料に伴う対立遺伝子ドロップアウト問題がより少なく、胚盤胞段階におけるモザイク現象がより少なく、胚細胞ではなく栄養外胚葉細胞(胎盤細胞の先祖)が採取されるので胚への損傷がより少ないので、より多くの人気を得ていた(Harper and Sengupta.Hum Genet.2012 Feb;131(2):175−86)。過去において、分析は、PCRおよびFISH技術(同書)を使用して排他的に実施され、現在は、マイクロアレイおよびさらにはNGS技術に切り替わっている(Yin et al.,Biol Reprod.2013 Mar 21,88(3):69;およびZhang et al.,PLoS One.2013,8(1):e54236.)。この分析を実施するためには1〜5細胞由来の材料は十分でないので、マイクロアレイおよびNGS法の両方がWGAを必要とする。しかし、WGAは、コピー数バリエーション(CNV)概算を複雑化するバイアスの主な供給源であるだけでなく、PGDワークフローにおける時間の主要な割り当てでもある。PGDの適時性の性質および課題を考慮すると、WGAと比較してより速く、WGAと匹敵するまたはより良い性能を提供する技術の必要性が存在する。
これらの問題に対する魅力的な解決は、単一細胞由来のDNAの直接的処理(断片化およびタグ化)であり、それによって、WGA法を完全に回避する。しかし、広く使用される超音波処理による断片化は、極度に低いDNA濃度における断片へのオリゴヌクレオチドタグの引き続くライゲーションの困難性に起因して、この目的のためには不適切である。対照的に、トランスポザーゼ法におけるDNAの断片化およびタグ化は、1ステップで同時に起こり、これが解決を提供すると思われる。2ステップの代わりに1ステップを有することに加えて、トランスポザーゼ反応は、本質的に2成分反応であり、WGAなどにおけるような3成分ライゲーションプロセスよりも、元来かなり効率的である。Illumina機器での配列決定に適切な単一細胞由来のライブラリーは、Vibharトランスポザーゼを使用して数分以内に生成され得る。サンプルのより迅速かつより経済的な処理を前向きに提供するとはいっても、低いDNAインプットにおけるトランスポザーゼ反応の不十分な効率に起因して、これまでのところ、このアプローチは、WGA法と同じ問題に悩まされていた。実際、以下の例に示すように、単一〜数個の細胞由来のDNAインプットを用いると、インプットDNA材料のごく一部が、標準的トランスポザーゼ反応において処理された。従って、トランスポザーゼ反応の改善された効率(即ち、改善されたアウトプット/インプット比)が、NGSおよびマイクロアレイのためのサンプル調製の「WGAなしの」単一細胞の方法を開発するために必要である。
NGSのためのDNAサンプル調製には、トランスポザーゼ反応における標的DNAの断片化およびタグ化と、その後の断片のPCR増幅が関与する。同様に、トランスポザーゼは、ゲノム異常のマイクロアレイ分析のためのDNAサンプルの調製において使用され得る。数千のヒト細胞由来の最も広く使用されるDNAインプット(10〜50ngのDNA)において、単一のHiSeq実行は、適切なゲノムカバー率および比較的低い重複率(それぞれ、90%を超える、および6%を下回る)を提供する。しかし、単一細胞由来のDNAまたは数個の細胞由来のDNAが、WGAなしにトランスポザーゼ反応において直接処理される場合には、ゲノムカバー率は劇的に低減され、重複率はしかるべく上昇する。例えば、3つのヒト細胞ゲノム由来のDNAインプットは、一般に、たった42%のカバー率を生じさせるが、72%の重複率を生じさせる。
本明細書に開示されるアダプターは、単一細胞のインプットにおいてさえも匹敵するまたはより良い配列決定カバー率を達成できるように、低いDNAインプットにおいて、トランスポザーゼベースのDNA調製の性能を数倍改善することを可能にする。効率におけるこの改善は、NGSおよびマイクロアレイ分析のための、非常に低いインプット(例えば、単一〜数個の細胞または個々の染色体由来のサンプル)における、ゲノムDNAのWGAなしの処理を可能にする。さらに、これは、より高いゲノムDNAおよびcDNAインプットにおいて、より良いゲノムカバー率および低減されたバイアスもまたもたらす。
本明細書に開示されるアダプターは、マイクロアレイ適用のためのサンプル調製においても使用され得る。NGSおよびマイクロアレイのためのサンプル調製は、トランスポザーゼ技術を用いて促進され得る共通のステップを有するという事実にもかかわらず、これまで、トランスポザーゼは、マイクロアレイのためのサンプル調製においては使用されなかった。NGSおよびマイクロアレイとは別に、本発明のトランスポゾンアダプターは、変異誘発のために、遺伝子治療において、および再生医学のための多能性細胞の生成においても、使用され得る(Palazzoli et al.Geneteca,2010,138(3):285−99)。
D.さらなるアダプター改変
限定されない例として、改変されたヌクレオチドの例は、2−アミノプリン、2,6−ジアミノプリン、5−ブロモdU、デオキシウリジン、逆方向dT、逆方向ジデオキシ−T、ジデオキシ−C、5−メチルdC、デオキシイノシン、5−ニトロインドールなどのユニバーサル塩基、2’−O−メチルRNA塩基、イソ−dC、イソ−dG、リボヌクレオチド、モルホリノ、タンパク質ヌクレオチドアナログ、グリコイックヌクレオチドアナログ、ロックトヌクレオチドアナログ、トレオースヌクレオチドアナログ、鎖終結ヌクレオチドアナログ、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、ウィオシンヌクレオチドを含む。これらは、ネイティブアダプター配列に、改変されたアダプター配列、例えば「モザイク」に、または上記改変に、取り込まれ得るかまたは付加され得る。
さらに、有用な改変は、改変された塩基を必ずしも含まない。例えば、これらは、脱塩基部位;官能基、例えば、アルキン官能基、アジド官能基、例えばアジド(NHSエステル);非天然の結合、例えば、ホスホロチオエート結合;スペーサー、例えば、1’,2’−ジデオキシリボース(dSpacer)、ヘキサンジオール、光切断可能なスペーサー、異なる数の炭素原子を有する異なる長さのスペーサー、例えば、C3スペーサーホスホラミダイト、C9スペーサー、例えば、トリエチレングリコールスペーサー、C18の18原子ヘキサエチレングリコールスペーサーなどを含み得る。かかるスペーサーは、アダプターの5’末端もしくは3’末端に、または内部において、取り込まれ得る。さらに、本発明のアダプターの少なくとも1つの鎖は、リン酸化によって改変され得る、即ち、図1に示されるように1位における5’リン酸、もしくは相補的鎖上ではあるが同じ位置における3’リン酸、またはそれら両方のいずれかを含む。上記改変を有するまたは有さないオリゴヌクレオチドは、いくつかの供給業者、例えば、Integrated DNA Technologies(Coralville、Iowa)、TriLink(San Diego、CA)、Eurofins MWG Operon(Huntsville、AL)、GenScript(Piscataway、NJ)によってカスタムメイドされ得る。本明細書で使用する場合、「スペーサー」とは、2つの部分を接続する分子または分子の群を指す。典型的なスペーサーは、アルキレン(炭素−炭素)、エーテル、アミノ、アミド、エステル、カルバメート、ウレアおよびケト、ならびにそれらの組み合わせから選択されるものなどの結合を含み得る。スペーサーは、1もしくは複数の型のヘテロ原子含有連結と交互になっている、またはかかるヘテロ原子含有連結によって隣接される、短いアルキレン部分を含み得る。非限定的な例には、−−CHOCHCHCH−−、−−CHC(O)NHCH−−、−−C(O)OCH−−、−−OC(O)NHCHCH−−、−−CHCHNHCH、−−CHCHC(O)CHCH−−、−−CHCHCHC(O)NHCHCHNH−−および−−CHCHCHC(O)NHCHCHNHC(O)CHCH−−などが含まれるがこれらに限定されない。このスペーサー部分は、加水分解的に安定であり得、または生理学的に加水分解可能なもしくは酵素的に分解可能な連結(例えば、エステル連結)を含み得る。
トランスポザーゼは、標的DNAを切断した後にギャップを残し、改変されたアダプターは、例えばギャップ修復ステップの間に置換されて、in vitro適用およびin vivo適用に適切な改変されていない二本鎖DNAを生じ得るので、アダプターの下の鎖上の改変(図3および図4)は、DNA修復酵素、例えば、ポリメラーゼ、キナーゼおよびリガーゼによる認識に必ずしも適切である必要はない。本明細書の開示を考慮すると、当業者は、適用次第で、異なるオリゴヌクレオチド配列、例えば、Illuminaチップへの結合のために必要な配列が、かかるアダプターに結合され得ることを、即座に認識する(米国特許出願公開第2012/0301925号)。さらに、本明細書の開示を考慮すると、当業者は、トランスポザーゼ活性部位においてアダプター配列を改変することによってトランスポザーゼ特性を改変する可能性、および特定の必要性のために改善された特性を有するアダプターを選択する可能性を、即座に認識する。
認識配列領域に加えて、典型的には、本発明のアダプターは、増幅または他の重合反応のためのプライマー結合のために設計され得る、少なくとも1つの他の領域を含む。これらのプライマー結合領域は、二本鎖または一本鎖であり得、任意の適切なプライマー結合配列を含むように設計され得る。当業者にとって、プライマー結合配列および対応するプライマーを設計することは、慣用的な仕事であり、プライマー結合、伸長および増幅、例えば、PCR、多置換増幅(Lasken RS.Biochem Soc Trans.2009 Apr;37(Pt2):450−3)、多重アニーリングおよびルーピングベースの増幅サイクル(Zong et al.,Science.2012 Dec 21;338(6114):1622−6.)などにおける使用のための適切な配列を考案することは、実施者にゆだねられる。
このアダプターは、1または複数の二本鎖DNA(dsDNA)または一本鎖DNA(ssDNA)配列(本明細書で、「タグ」とも呼ばれる)をさらに含み得る。これらのタグは、Illuminaチップなどの配列決定チップへの生成されたDNA断片の結合を可能にし、インデックス配列などの標的DNAライブラリーの供給源の同定を可能にするために、含まれ得る。
一態様では、このアダプターは、(例えば、特定のプロセスステップ、例えば、増幅および/または富化を実施した後に)引き続いて配列決定され得る縮重塩基領域(DBR)を含むタグを有する。配列決定実行中に存在する異なるDBR配列の数は、特定の配列分析構成またはプロセスにおいて配列決定された同じ元のサンプルの同じゲノム領域に起源する個々のポリヌクレオチド分子の数を決定/概算するために使用され得る。DBRは、多くの異なる核酸配列決定適用の分析を改善するために使用され得る。例えば、DBRは、読み取り数単独からは導出できない遺伝子型決定アッセイにおける対立遺伝子コールについての統計的値の決定を可能にする。
DBRは、サンプル中の他のタグ化されたポリヌクレオチドと比較して、変動する塩基組成または配列(「ランダム」とみなされ得る)を有し得る領域である。サンプル中のポリヌクレオチドの集団中の異なるDBRの数は、DBR中の塩基の数、ならびに各位置において存在し得る異なる塩基の潜在的な数に依存する。例えば、各位置がA、C、GおよびTのうちのいずれか1つであり得る2つの塩基位置を有するDBRが結合したポリヌクレオチドの集団は、潜在的に、2または16の異なるDBR(AA、AC、AGなど)を有する。従って、DBRは、2〜220またはそれ以上の異なる順列を生じるように、15以上、20以上などを含む、1、2、3、4、5、6、7、8、9、10またはそれ以上の塩基を含み得る。特定の実施形態では、このDBRは、3〜10塩基長である。さらに、DBR中の各位置は、異なる塩基組成を有し得る。例えば、4塩基のDBRは、NNNN;NRSN;SWSW;BDHVの組成のいずれかを有し得る。特定の実施形態では、DBR中の塩基は、検出可能な改変またはそれに結合した他の部分を有することによって変動し得ることに、さらに留意されたい。例えば、特定の次世代配列決定プラットホーム(例えば、Pacific Biosciences(商標))が、配列決定プロセスの間の塩基におけるメチル化の差異を検出するために使用され得る。このように、DBR中の非メチル化塩基は、DBR中のメチル化塩基から識別され得る。従って、DBRの長さまたは塩基組成に関しては制限がないことが意図される。
DBRは、単一の領域であり得る(即ち、互いに隣接する全てのヌクレオチド塩基を有する)か、またはポリヌクレオチド上の異なる位置に存在し得る(即ち、DBRの塩基は、スプリットDBRとも呼ばれる非DBR配列によって分離される)。例えば、DBRは、ポリヌクレオチド上の第1の位置における第1のアダプター中の1または複数の塩基および同じポリヌクレオチド上の第2の位置における第2のアダプター中の1または複数の塩基を有し得る(例えば、DBRは、非対称的にタグ化されたポリヌクレオチド、即ち、非対称的アダプターを有するポリヌクレオチドの両方の末端において存在する塩基を有し得る)。これに関して制限は意図されない。
DBRを有するアダプターを生成することは、例えば、当該分野で周知のDNA合成方法を使用して、任意の従来の様式で達成され得る。親サンプル中のポリヌクレオチドに一旦結合すると、これらのポリヌクレオチドは、さらなる処理に供され得、最終的に配列決定され得る。実施され得る処理ステップは、使用者が望む任意のプロセスステップ、例えば、富化、増幅などを含む。この配列決定ステップでは、DBRならびにポリヌクレオチドの一部分(例えば、目的の領域を含む)の配列が得られる。配列が一旦得られると、目的のポリヌクレオチドに結合した異なるDBRの数が決定される。この数は、配列決定結果において提示された出発親サンプル由来の目的の異なるポリヌクレオチドの数を決定または概算するために使用され得、このとき、一部の実施形態では、決定された数は、配列決定結果において提示された出発親サンプル由来の目的の異なるポリヌクレオチドの最小数である。
上述のように、本発明のアダプターは、NGSまたはマイクロアレイ分析のために、非常に低い量のDNAを有するサンプル由来のDNAを断片化するために特に適切である。サンプル調製のこの初期段階のための従来のアプローチの結果、1つの対立遺伝子に全て対応する読み取りの高いカバー率が生じ得、これは、二項分布に従って予測されるはずのものよりも何倍も多く生じ得る。これは、単一の染色体(即ち、目的のサンプル中に実際に存在する2つの二倍体染色体のうち一方だけ)上の遺伝子座から誘導された多数の読み取りを生じる数分子のDNA(またはさらには単一の分子)の増幅に起因する。これの結果は、カバー率の関数としての誤差が、予測された二項誤差から大幅に逸脱するというものである。DBRを使用することは、限定量のDNAを有するサンプルから対立遺伝子コールを作成することにおいて、信頼度を増加させ得る。例えば、遺伝子座由来の1つの対立遺伝子の16の配列決定読み取りが、全て同じDBR配列を含む場合、これらの読み取りは全て、同じ親ポリヌクレオチド分子由来である可能性が高い(従って、ホモ接合性対立遺伝子コールは正しいとは言えない)。しかし、16の配列決定読み取りが各々異なるDBR配列を有する場合、各読み取りは異なる親ポリヌクレオチド分子から来ているので、より信頼度の高いホモ接合性コールが作成され得る。
遺伝学的分析におけるDBRドメインは、NGSプラットホームと組み合わせた場合には、強力であり、それらの多くは、配列決定されるサンプル中に存在する各個々のポリヌクレオチドについての配列データを提供する。ポリヌクレオチドの個々のクローンが独立して配列決定される従来の配列決定アプローチとは対照的に、NGSプラットホームは、サンプル中の複数の異なるポリヌクレオチドについての配列を同時に提供する。この差異は、各々のポリヌクレオチドをクローニングし独立して配列決定する必要があることによって拘束されない、サンプル特異的な統計的分析が行われることを可能にする。従って、本明細書に記載されるDBRドメイン分析は、本発明の改変されたアダプターおよびNGSプラットホームと協同して、プールされたサンプルからの非常に大きい量の配列データを分析するための、改善された統計的アプローチを提供する。さらに、DBR配列は、複雑なゲノムまたはプールを含む不均一サンプル中の配列バリアントの統計的検証などの他の分析において使用され得る。例えば、DBRは、腫瘍サンプル、微生物サンプル、環境サンプルなどにおける複雑なゲノムの分析において使用を見出す。例えば、その内容が参照によって組み込まれる米国特許第8,481,292号を参照のこと。
次世代配列決定への適用可能性を目的とすると、アダプター末端の約半分が1つの型のタグでタグ化され、もう一方の半分が異なるタグでタグ化されることが好ましく、その結果、標的DNAのトランスポザーゼ媒介性の断片化の後に、1種類のタグが、標的DNA断片の一方の末端に結合され、別の型のタグが反対の末端に結合されて、両方の方向でのDNA断片の読み取りを可能にする。本発明者は、さらなる分析のための断片の調製のための改善されたDNA断片化(即ち、断片化の改善されたランダム化)が、2つの異なるトランスポザーゼ認識配列を組み合わせることによって達成され得ること、即ち、特定の組成物中のアダプターの一部(例えば、約50%)が、トランスポザーゼの第1の認識配列を含み、残りのアダプターが、第2の異なる認識配列を含むことを、認識した。この認識配列は、トランスポザーゼについての天然に存在する配列であり得、またはアダプターにさらなる機能または代替的機能を提供する操作された配列であり得る。
例示的な実施形態では、この認識配列は、断片化される標的DNAの各末端について異なっている。一部の実施形態では、標的DNA断片の末端における2つの配列は、同一または実質的に同一であり得、互いに対して少なくとも90%(即ち、90%〜100%)の配列同一性を有する。一部の他の実施形態では、これら2つの配列は異なっており、互いに対して90%未満(即ち、89%以下、最小は約30%)の同一性を有する。しかし、両方の認識配列が、およそ同じ程度まで、それらと併せて使用されているトランスポザーゼによって認識可能であることが好ましい。このために、トランスポザーゼ断片化の効率が、いくつかの認識配列について別々に評価され得、事実上同じ効率を有する認識配列が、一緒に使用するために選択される。あるいは、あまり効率的でないアダプターが、より効率的なアダプターと混合され得、後者は、前者よりも少ない量で使用される。例示的な実施形態では、これらの認識配列は、図1および図3〜5に示されるものなどの、天然配列および改変された配列の両方を含む。さらに、単一の型の天然もしくは改変された認識配列が使用され得るか、または同時に2つ以上の型の天然もしくは改変された認識配列が、任意の組み合わせで、使用され得る。当業者は、任意のトランスポザーゼを使用することができ、その認識配列を容易に識別できるが、これは、認識配列が、トランスポザーゼ遺伝子に隣接するIRR反復およびIRL反復として存在することが公知だからである。
当業者は、任意のヌクレオチド配列が、オリゴヌクレオチド合成の間に、または例えばDNAリガーゼを使用する他の方法によって、認識配列に容易に結合され得ることを認識する。かかる配列は、DNA断片を増幅するために、配列決定プライマーのためおよびPCRプライマーの着地部位を提供し得、IlluminaチップなどのDNA配列決定チップにDNA断片を結合させるという目的にも役立ち得る。さらなるヌクレオチド配列は、好ましくは一本鎖であり、または大部分が一本鎖である。さもなければ、トランスポザーゼは、基質として過剰なdsDNAを認識するので、阻害され得る。かなり小さい程度までであるが、一本鎖伸長の結合は、トランスポザーゼ活性もまた低減させ得、従って、結合のサイズを最小に維持することが好ましい。このために、2つの異なる認識配列の使用は、これら2つの間で異なる認識配列の一部へと伸長され得るプライマーに着地部位を提供することによって、有利である(例えば、その内容が参照によって組み込まれる米国特許出願公開第2012/0301925号を参照のこと)。この設計は、両方のアダプターに対する同じトランスポザーゼ認識配列を使用するNEXTERA(商標)システムにおける4つのプライマーと比較して、DNA断片のPCR増幅のための2つのプライマーだけの使用を可能にする。4つではなく2つのプライマーの使用は、より単純かつPCR増幅においてより効率的であるという点で、以前のシステムの長所である。
アダプターを作製するために、これらのアダプターは、産生されるトランスポザーゼ(複数可)に特異的に結合するように設計される。このように、各アダプター上に存在する必要がある認識配列は、アダプターを合成する前に既知である。天然の認識配列は、トランスポザーゼのオープンリーディングフレームの50〜200ヌクレオチド上流およびすぐ下流に見出され得る逆方向反復を構成する場合が多く、当業者によってゲノム配列において同定され得る。これらのアダプターは、化学的合成を含む任意の適切な技術を使用して作製され得る。これらのアダプターは、二本鎖である部分を少なくとも含む。このように、使用の前に、2つの相補的部分が、ハイブリダイゼーションが生じる条件下で互いに対して曝露されて、二本鎖部分を産生することが好ましい。
一部の実施形態では、本発明のアダプターは、特異的結合対のメンバーを含む。このメンバーは、アダプターの核酸に共有結合され得、特異的結合対の他のメンバーへの特異的結合を可能にする。例示的な実施形態では、特異的結合対の他のメンバーは、固体基材に結合され得る。この方法では、アダプターは、例えば、対応するトランスポザーゼの精製および固体基材に結合したトランスポザーゼ切断産物(例えば、増幅/特徴付けのためのDNA断片)を産生するためのアダプター−トランスポザーゼ複合体の使用を促進する固体基材に特異的に結合され得る。一般に、アダプターの一方の鎖の5’末端を介した、結合対メンバー、例えば、ビオチンの結合が好ましい。しかし、結合対メンバー(複数可)は、トランスポザーゼ複合体の阻害活性を回避するために、DNA挿入物から遠い3’末端に、または3’末端および5’末端の両方にも、結合され得る。
上に述べ、下に例示するように、本発明の合成アダプターは、ほとんどの保存された部位において公知の機能的トランスポザーゼアダプター(ネイティブまたは改変された)とは異なるが、予想外に、活性を保持する。さらに驚くべきことに、それらの一部は、さらに高い活性を有し、NGSに使用した場合、増加したランダムさもしくは低減された重複率またはそれら両方を生じる。
一部の実施形態では、選択されたトランスポザーゼに異なる特性を付与する複数の有用なアダプターが、ネイティブアダプター中の保存された1位を改変することによって生成され得ることが実証された。当業者は、選択されたトランスポザーゼのための複数のアダプターを創出し、トランスポザーゼ適用次第で、ならびにサンプル中に存在し得る不純物次第で、トランスポザーゼ特性の最適化のために複数のアダプターを適用するため、例えば、未精製の血清または半精製血液サンプルについて最良のアダプターを選択するため、単一細胞ゲノム配列決定のため、ホルマリン固定パラフィン包埋スライド由来のDNAを配列決定するためなどに、これを使用できる。
増加した活性は、例えば、低いDNA濃度を有するサンプルを分析する必要性がある場合、特に、低いDNAインプットの反応条件について、多数の適用のために有用である。例えば、単一細胞ゲノム配列決定は、癌の発達の機構を理解するためおよび抗癌薬物発見のために、特に目的とされる。単一のヒト細胞由来のDNAの等価物ほどの少なさから出発し、可能な限り少ない増幅サイクルを用いて極少量のDNAを配列決定する能力は、個別化医療の開発、比較診断および癌の全体的な理解のために高度に有利であることは、広く認識されている(Navin and Hicks,Genome Medicine 2011,3:31)。さらに、ヒト細胞の等価物未満のDNAインプットは、単離された染色体または小さいゲノムを配列決定するためなどの、いくつかの適用にとって望ましい(Giorgi et al.,PLoS One.2013;8(2):e57994.doi:10.1371/journal.pone.0057994)。
低いDNAインプットに対する主要な適用の1つは、腫瘍中の「パッセンジャー細胞」とのそれらの混合物ではなく、転移活性を担う単一の単離された癌細胞のゲノム配列決定である。これは、癌のより良い理解を可能にし、改善された癌の処置および診断をもたらすことができるはずである。比較的少ない腫瘍細胞が、患者における癌の発達およびその広がり(転移)を担うので、個々の細胞のゲノムを配列決定することが必要である。主に背景の「パッセンジャー細胞」のゲノムは、腫瘍細胞の混合物から生成されたライブラリーにおいて配列決定されるので、癌細胞の大部分は、ただの「パッセンジャー細胞」であり、腫瘍サンプルの頻繁な分析は、癌の原因となっている変異についての答えを与えない。単一細胞ゲノム配列決定の現在の方法は、典型的に、増幅されたDNAからの引き続くサンプル調製を伴う全ゲノム増幅を必要とする。このアプローチを使用して、大きい(マイクログラム)量のDNAが、単一細胞から生成され得、NGSのために処理され得る。しかし、これは、選択的増幅に起因して、単一細胞ゲノムの部分的な配列カバー率のみを生じる。従って、単一細胞DNAから直接NGSのためのライブラリーを生成する必要性が存在し、低いDNA濃度において極度に少量のDNAを処理(断片化およびタグ化)できるより高い活性のトランスポザーゼが、望ましい。
別の適用は、ヒト血液由来の遊離DNAの分析である。転移を担う癌細胞は、腫瘍から脱離し、脆弱であり、それらのDNAは、低い濃度である場合が多いものの、血液中に存在する場合が多い。別個の適用は、妊娠女性の血液中の遊離DNAの分析である。かかるDNAは、胎児に起源し得、その分析は、遺伝性疾患、または複雑な疾患への素因の診断のために有用である(Papageorgiou and Patsalis,BMC Med.2013,11(1):56)。さらに、低いインプットの方法は、ヒト血液、食物または環境サンプル中の感染性因子の検出に適用され得る。なお別の適用は、複雑な生態系を理解することに関する。多くの微生物は現在、それらの環境の外側では培養できないので、単一細胞NGS技術を用いない場合、ヒトマイクロバイオーム中または環境サンプル中の微生物の部分的な分析のみが実現可能である(Fodor et al.,PLoS One.2012;7(7):e41294.doi:10.1371)。
トランスポザーゼ−アダプター複合体および関連組成物
本発明は、上記アダプターおよびトランスポザーゼの複合体ならびにこれらの複合体を含む組成物をさらに提供する。
種々のトランスポザーゼが、複合体を作製するために使用され得る。これらは、in vitroでトランスポザーゼ活性を有する任意のタンパク質、例えば、天然に存在するトランスポザーゼまたは組換えトランスポザーゼであり得る。このトランスポザーゼは、少なくともある程度まで、その天然の環境(即ち、細胞核またはサイトゾル)から、単離または精製され得る。好ましくは、このトランスポザーゼは、組換え産生され、好ましくは、組換え宿主環境(即ち、細胞核またはサイトゾル)から単離または精製される。最も好ましくは、このトランスポザーゼは、本発明の組成物中に含める前に、90%以上のレベルまで、他の細胞性成分から精製される。好ましくは、このトランスポザーゼは、約95%以上のレベル、例えば、約98%純粋、約99%純粋、または99%を超えて純粋である。純度は、クマシーブルー染色、銀染色、HPLC、質量分析、またはタンパク質サンプル中の不純物を検出するための他の高感度技術などによって、純度を決定するための一般的な技術に基づいて決定される。DNA不純物は、例えば、PCRを使用しても評価され得る。例示的な実施形態では、このトランスポザーゼは、転位の「カットアンドペースト」機構を有するトランスポザーゼであり(Yuan and Wessler,Proc Natl Acad Sci U S A.2011 May 10;108(19):7884−9)、IS4ファミリーのトランスポザーゼのメンバー、例えば、ビブリオ・ハーベイが含まれるがこれらに限定されないビブリオ(Vibrio)種において天然に見出されるものである。実施形態において、このトランスポザーゼは、Tn5トランスポザーゼでも、例えば野生型Tn5トランスポザーゼの変異誘発によってTn5トランスポザーゼから誘導されたトランスポザーゼでもない。
トランスポザーゼは、それらが天然に存在する環境またはそれらが産生された環境とは異なる環境において見出される場合、単離または精製されたとみなされる。例えば、トランスポザーゼは、それらが産生される細胞の他の生体分子の一部または全てが除去される環境中に存在し得る。これらのトランスポザーゼは、それらが天然に見出される細胞ではない細胞において産生される場合、組換えであり、それらが由来または起源するトランスポザーゼ(複数可)の天然に存在する配列(複数可)とは異なるアミノ酸配列を有する場合、改変されている。例えば、本発明に従うトランスポザーゼは、天然に存在するトランスポザーゼ(野生型)のアミノ酸配列、または1もしくは複数の天然に存在するアミノ酸が欠失もしくは異なるアミノ酸で置き換えられた改変されたトランスポザーゼのアミノ酸配列を有し得るか、あるいは改変されたトランスポザーゼは、野生型配列に付加されたアミノ酸配列を有し得る。さらに、天然に存在するアミノ酸配列は、その配列中の1または複数の部位における1または複数のアミノ酸の添加によって破壊され得る。一部の実施形態では、これらのトランスポザーゼは、キメラタンパク質である、即ち、これらは、2つ以上の異なるトランスポザーゼ由来のアミノ酸配列の混合物を含むタンパク質である。
これらの複合体は、1または複数のトランスポザーゼ分子および1または複数のアダプターを含み得る。少なくとも2つのトランスポザーゼを含む複合体では、これらのトランスポザーゼのうち少なくとも2つが、核酸またはオリゴヌクレオチドアダプターに結合される。複合体が2つのトランスポザーゼを含む実施形態では、この複合体は、シナプス複合体と類似の形態を示し得る。より高次の複合体、例えば、4つのトランスポザーゼ、8つのトランスポザーゼを含む複合体、または異なる数のサイズの複合体の混合物もまた可能である。2つよりも多いトランスポザーゼを含む複合体では、全てのトランスポザーゼがオリゴヌクレオチドによって結合される必要があるわけではない。むしろ、さらなるオリゴヌクレオチドが結合され得るが、トランスポザーゼのうちの2つが結合されることが十分である。通常、2つ以上のトランスポザーゼ分子が複合体中に存在する場合、同じトランスポザーゼが、複合体において使用される。しかし、一部の実施形態では、2つ以上の異なるトランスポザーゼが、単一の複合体において使用されることが好ましい。例えば、複合体中のトランスポザーゼ分子のうち1または複数が、それらのアミノ酸配列の改変を介して部分的にまたは全体的に不活性にされ得、活性なトランスポザーゼ分子および部分的または全体的に不活性なトランスポザーゼ分子の混合物が、活性サブユニット間の距離をモジュレートするために使用され得、結果として、複合体によって産生されたDNA断片の平均サイズがモジュレートされ得る。同様に、例えば、高GC配列に対する認識配列を有するトランスポザーゼおよびより低いGC含量を有する配列に対する認識配列を有する別のトランスポザーゼを含む複合体などの、異なる認識配列を有する異なる複合体が使用され得る。認識配列において異なるGCおよびAT含量を有するトランスポザーゼを混合することは、標的DNA配列について断片化パターンを調整することを可能にする。1つの型のオリゴヌクレオチドアダプターがDNAを断片化するために使用され得るが、断片化の後に断片化されたDNAの増幅および配列決定が行われる実施形態では、少なくとも2種類のオリゴヌクレオチドアダプターの使用が、DNA断片のPCR増幅を促進するため、および両方の方向でDNA断片を配列決定するために使用される異なるDNA配列決定プライマーの異なる着地部位を提供するために、好ましい。いくつかの制限エンドヌクレアーゼとは異なり、トランスポザーゼは、1つの正確な認識配列に必ずしも限定されないので、1または複数のトランスポザーゼ認識配列が、アダプターを設計するために使用され得る。
これらのトランスポザーゼは、トランスポザーゼに加えて少なくとも1種の他の物質を含む組成物中に存在し得る。これらの組成物は、存在する物質の数および型において、特に制限されない。一般に、液体組成物は、水および複合体を含む。典型的に、塩、イオン、緩衝化化合物、金属または1種もしくは複数の生体分子などの、1種または複数の他の物質が存在する。一般に、任意の数の物質が、組成物中に含まれ得る。種々のさらなる成分の正体、数および量は、典型的には、組成物のための適用、または最適な活性のための特定のトランスポザーゼ複合体についての特定の要求によって、決定される。
特定の実施形態では、これらの組成物は、2つ以上の異なるトランスポザーゼを含む。他の物質の性質および数は、特に制限されない。多くの実施形態では、これらの組成物は、少なくとも水を含むが、特定の実施形態は、凍結組成物または乾燥(例えば、フリーズドライ)組成物に関する。例示的な実施形態では、これらの組成物は、一部の実施形態ではEDTAおよび/またはオリゴヌクレオチドが補充された細胞溶解物またはDNA断片化反応混合物中に、トランスポザーゼを含む。EDTAは、二価カチオンをキレートし、そうして、それらの活性のためにMg2+イオンを典型的に必要とする宿主細胞ヌクレアーゼを阻害し、さもなければ、宿主細胞ヌクレアーゼはオリゴヌクレオチドを分解する。トランスポザーゼ−オリゴヌクレオチド複合体の形成が二価カチオンを必要としないという事実は、複合体の形成の破壊も維持の破壊もなしの、粗製細胞溶解物へのEDTAまたは他のヌクレアーゼインヒビターの添加を可能にする。
一部の実施形態では、本発明のこの態様の組成物は、精製されたトランスポザーゼ、またはトランスポザーゼが産生される(およびアダプターが細胞溶解の前または後に添加されている)細胞の細胞溶解物中のトランスポザーゼに結合した、アダプターを含む。精製されたトランスポザーゼ−アダプター複合体組成物もまた、複合体が溶液中に遊離していても固体基材に結合していても、DNA切断/断片化反応などの酵素反応組成物中に含まれ得る。かかる組成物中に存在し得る非限定的な例示的な物質には、トランスポザーゼ複合体によって切断される標的DNA、標的DNA断片の重合のためのオリゴヌクレオチドプライマー、1または複数のDNAポリメラーゼ、制限エンドヌクレアーゼ、DNA改変酵素、ポリサッカリド、脂質膜、ナノ粒子、磁性ビーズを含むビーズ、トランスフェクション試薬、および界面活性剤が含まれる。
本発明のトランスポザーゼ−アダプター複合体は、固体基材または固体支持体に結合され得る。用語「固体基材」および「固体支持体」は、当該分野におけるそれらの意味に従って使用される。従って、これらは、精製および/または酵素反応の条件下で核酸を結合および保持するのに適切であることが当該分野で公知の任意の材料である。当業者は、固体基材として使用するのに適切な材料をよく知っている。本発明において有用な固体基材の非限定的な例には、ナイロン、ケイ酸イットリウム(YSi)、および磁性ビーズを含むポリビニルトルエン(PVT)ビーズ(例えば、Dorgan et al.,Journal of Magnetism and Magnetic Materials,Vol.194:p.69−75,1999を参照されたい)、ナイロン、ニトロセルロースまたはPVDFメンブレン、ならびにプラスチック表面、例えば、ポリスチレンまたはポリプロピレンは含むものであって、後者は、ストレプトアビジンコーティングされたSTREP Thermo−Fast PCRプレート(Abgene、Surrey、UK)などの、核酸のPCR増幅のためのプレートまたはウェル上に見出される、プラスチック表面が含まれる。固体支持体は、特定の結合対の結合を促進するために、化学的に改変され得る、例えば、アミノ化(第一級アミンもしくは第二級アミン)またはカルボキシル化され得る。
固体支持体への複合体の結合は、複合体のアダプターまたはトランスポザーゼ部分のいずれかを介して、達成され得る。後者の場合、このトランスポザーゼ部分は、固体支持体への結合を可能にするタグを保有し得る。例えば、ビオチンタグは、C末端またはN末端のストレプトアビジン結合ペプチドを介して組換えトランスポザーゼに結合され得(Keefe et al.,Protein Expr Purif.,Vol.23,No.3,p.440−446,2001;Duffy et al.,Anal Biochem.,Vol.262,No.2,p.122−128,1998)、この複合体は、ストレプトアビジンコーティングされたビーズまたはプレートに結合され得る。しかし、固体支持体への直接的トランスポザーゼ結合は、その酵素活性に重要なトランスポザーゼ分子の移動を立体的に妨害し得る。さらに、ペプチドタグとの融合タンパク質は、ネイティブタンパク質と比較して劣った活性を有する場合が多いが、それは、かかるタグが、タンパク質の折り畳みを妨害し得るからである。従って、本発明者は、ネイティブトランスポザーゼタンパク質を使用しつつ、そのアダプター部分を介したトランスポザーゼ−アダプター複合体の結合の洗練された解決を考え付いた。当業者によって使用され得る多くのかかるタグが存在する。任意の適切な特異的結合対が、本発明に従って使用され得、このとき、この対の少なくとも1つのメンバーが、固体支持体上に固定化され、当業者は、任意の数の考慮事項に基づいて、適切な対を自由に選択できる。結合対の非排他的な列挙には、アビジンまたはストレプトアビジンおよびビオチン、ナノ−タグおよびストレプトアビジン(例えば、Lamla and Erdmann,Protein Expr Purif.Vol.33,No.1,p.39−47,2004を参照のこと)、抗体(またはその抗原結合部分)ならびに抗体が特異的に結合する抗原/エピトープ、例えば、MycまたはFLAGタグ、酵素−基質対、例えば、グルタチオントランスフェラーゼおよび還元型グルタチオン、ポリ−ヒスチジンおよびニッケルベースの樹脂、アプタマーおよびそれらの特異的標的分子、ならびにSi−タグおよびシリカ粒子(例えば、Motomura et al.,Protein Expr Purif.,Vol 77,No.2,p.173−177,2011を参照のこと)が含まれる。
特異的結合対のメンバーは、好ましくはその5’末端において、アダプターに共有結合により連結され得る。連結は、物質を核酸に化学的に連結させるための公知の任意の適切な技術によるものであり得る。唯一の制限は、特異的結合対のメンバーが、トランスポザーゼへのアダプターの結合を妨害し、固体基材に結合した場合にトランスポザーゼの活性を無効にし、またはPCRにおける固体基材に結合したDNA断片の増幅を妨害するはずであるということである。このために、リンカーが、特異的結合対のメンバーと認識配列との間に提供され得る。例えば、その内容が参照によって組み込まれる米国特許出願公開第2012/0301925号および同時係属中の米国特許出願第13/960,837号を参照のこと。
固体支持体に結合したトランスポザーゼ複合体を使用することの1つの利点は、1つのアダプターが固体支持体に結合されるという事実に由来する。このように、トランスポザーゼ複合体が標的DNAを切断する場合、この標的DNAは、アダプターを介して固体支持体上に捕捉される。この反応の結果としての、標的による酵素の置き換えは、反応成分から容易に精製され得るDNA断片を産生するための洗練された方法である。DNA断片は、単純に洗浄することによって容易に精製され得るので、これは、DNA断片の多重ステップの精製の必要性なしに種々の反応に供され得るDNA断片を産生するための洗練された方法でもある。
本発明はさらに、上述のアダプター−トランスポザーゼ複合体を作製する方法を提供する。一般に、この方法は、1または複数のトランスポザーゼを、トランスポザーゼ(複数可)に対する認識配列(複数可)を含むアダプターオリゴヌクレオチドと混合するステップと、アダプターがトランスポザーゼに結合して複合体を形成するのを可能にするステップとを含む。「可能にする」ステップは、列挙された作用が生じる条件を提供することを含む。かかる条件は、数時間(例えば、5〜14時間)にわたって約0℃〜約室温(即ち、約21℃〜25℃)におけるトランスポザーゼおよびアダプターオリゴヌクレオチドのインキュベーションが含まれるがこれらに限定されない、任意の適切な条件であり得る。より高い温度およびより短いインキュベーション時間が使用され得るが、トランスポザーゼ活性の喪失の可能性に起因して、あまり好ましくない。この方法は、トランスポザーゼ、アダプターまたはそれら両方を産生するステップをさらに含み得る。この方法がトランスポザーゼを産生するステップを含む場合、この方法は、細胞を溶解させるステップの前に、宿主細胞においてトランスポザーゼを発現させるステップを含む。このトランスポザーゼは、それが天然に見出される細胞において発現され得、またはそのネイティブの宿主細胞ではない宿主細胞において組換え発現され得る。細菌、酵母、植物、昆虫または哺乳動物細胞などの、タンパク質の組換え産生のための多数の宿主細胞が当該分野で公知であり、実施者は、任意の適切な宿主細胞を自由に選択できる。例示的な実施形態では、大腸菌細胞は、トランスポザーゼの組換え産生のための宿主細胞として使用される。
使用
上記アダプターおよびアダプター−トランスポザーゼ複合体は、多数の使用を有する。それらの使用のうちで、本明細書は、さらなる分析手順(例えば、ハイスループット配列決定)において使用される断片化されたDNAの調製のため、ならびに植物細胞および動物細胞中への遺伝子送達のための、これらのトランスポザーゼ複合体の使用を例示する。
A.DNA断片化および関連の使用
上記アダプターおよびアダプター−トランスポザーゼ複合体は、ゲノムDNAなどのDNA分子を断片化するために使用され得る。断片化されたDNAは、無細胞増幅(例えば、PCR)またはハイスループット配列決定を含むいくつかの目的のために使用され得る。
一態様では、DNAを断片化する方法、および好ましくは、DNAをアダプターによってタグ化する方法が、提供される。一般に、この方法は、断片化される標的DNAを、固体基材に結合され得るトランスポザーゼ複合体と組み合わせるステップと、このトランスポザーゼ複合体によるDNA切断に適切な条件下でこの組み合わせをインキュベートして、固体基材に結合した断片化された標的DNAを得るステップとを含む。次いで、固体基材に結合したDNA断片は、任意の数の分析反応において使用され得る。一部の実施形態では、固体基材に結合していない反応混合物の成分が、例えば、当該分野で公知の任意の適切な洗浄手順によって除去される。一部の実施形態では、固体基材に結合したDNA断片が創出され、さらなる精製または調製なしに即座に使用される。例えば、ワンミックスDNA断片化および増幅混合物が提供され得、ここで、標的DNAは、固体基材に結合したDNA断片を産生するためのDNA断片化を可能にする条件下で、固体基材に結合したトランスポザーゼ複合体と組み合わされ、次いで、この混合物は、例えばPCRによる、結合したDNA断片の無細胞増幅を可能にする条件に供される。
一実施形態では、DNA断片ライブラリーを生成するためのin vitroの方法が提供される。この方法は、本発明のアダプターおよび対応するトランスポザーゼを含むトランスポゾン複合体を、転位反応を実施するための条件下で、目的の標的DNAと共にインキュベートするステップを含む。この転位反応は、標的DNAの断片化を生じ、断片化された標的DNAの5’末端中にトランスポゾン末端を取り込む。
一実施形態では、この方法は、断片化された標的DNAのトランスポゾン末端/5’末端中に対して相補的な第1および第2のオリゴヌクレオチドプライマーを使用する増幅反応において、断片化された標的DNAを増幅するステップをさらに含む。この第1および第2のプライマーは、任意選択で、以下にさらに記載される5’タグを含む。別の一実施形態では、この方法は、断片化された標的DNAの5’末端においてトランスポゾン末端を含む標的DNAの断片を、5’−3’エキソヌクレアーゼ活性または鎖置換活性を有するDNAポリメラーゼと接触させるステップをさらに含み、その結果、完全に二本鎖のDNA分子が、標的DNAの断片から産生される。このステップは、転位反応において転位産物中に生成されたギャップを充填するために使用される。このギャップの長さは、特定の転位酵素に特徴的である。PCRなどの下流のステップのために転位産物を調製するために、この方法は、完全に二本鎖のDNA分子を変性させて、増幅反応における使用のための一本鎖DNAを産生するステップをさらに含み得る。
トランスポゾン末端配列が操作された切断部位を含む場合、この方法は、断片化された標的DNAを、切断部位に特異的な酵素と共にインキュベートするさらなるステップを含み得、その結果、断片化された標的DNAに取り込まれたトランスポゾン末端が、この切断部位において切断される。切断酵素は、それぞれ、ウラシル−N−グリコシラーゼまたはメチル化特異的制限酵素などのN−グリコシラーゼまたは制限酵素であり得る。
一実施形態では、この方法で使用される第1および/または第2のPCRプライマー(複数可)の5’タグは、増幅タグ、配列決定タグおよび/または検出タグの群のうちの1または複数を含む。増幅タグは、引き続くラウンドの増幅において使用されるオリゴヌクレオチドプライマーに対して相補的な特異的配列を提供する核酸配列である。例えば、この配列は、得られた核酸の増幅を促進するために使用され得る。配列決定タグは、次世代配列決定のための鋳型としての、増幅反応から得られた増幅されたDNA断片の使用を可能にする核酸配列を提供する。例えば、この配列決定タグは、固相上でのハイブリダイゼーションによる配列決定のためのアニーリング部位を提供し得る。かかる配列決定タグは、Life TechnologiesのION TORRENT配列決定タグ、Rocheの454Aおよび454B配列決定タグ、Applied BiosystemsのSOLiD(商標)配列決定タグ、ILLUMINA(商標)SOLEXA(商標)配列決定タグ、Pacific BiosciencesのSMRT(商標)配列決定タグ、Pollonator Polony配列決定タグおよびComplete Genomics配列決定タグであり得る。他方、検出タグは、中間体産物を検出およびモニタリングすることを可能にする。この検出タグは、増幅ステップから得られた核酸の検出を促進するための配列または検出可能な化学的部分もしくは生化学的部分を含み得る。検出タグの例には、特異的核酸配列、蛍光および化学発光色素、緑色蛍光タンパク質、ならびに基質の存在下で検出可能な酵素、例えば、NBT+BCIPとのアルカリホスファターゼ、または適切な基質とのペルオキシダーゼが含まれる。バーコードなどの異なる検出タグを使用することによって、複数のサンプル由来の配列が、同じ機器実行において配列決定され得、検出タグの配列によって同定され得る。例としては、TruSeq DNA Sample Prep KitsにおけるIlluminaのインデックス配列、またはLife TechnologiesのSOLiD(商標)DNA Barcoding KitsにおけるMolecular barcodesである。
本発明に従うアダプターは、DNAを断片化するために使用される場合、少なくとも2つのトランスポザーゼ分子から構成される複合体中に好ましくは存在し、このとき、各複合体のトランスポザーゼのうちの少なくとも2つは、少なくとも部分的に二本鎖であるアダプターを有するDNAオリゴヌクレオチドへの化学的結合によって、会合される。好ましい実施形態では、これらの複合体は、各々がアダプターによって結合された2つのトランスポザーゼ分子を含む。トランスポザーゼ複合体内で、各トランスポザーゼは同じであり得るか、またはDNAに対する同じ認識配列を有し得る。あるいは、トランスポザーゼが、いくつかのヌクレオチドが異なる配列を認識できる場合、これらの認識配列は異なり得る(例えば、米国特許出願公開第20120301925号および米国特許出願第13/960,837号を参照のこと)。さらにもう一度、これら2つは、同一性および/または認識配列が異なり得る。2つのトランスポザーゼが異なる認識配列を有する場合、これらのアダプターは、各トランスポザーゼがアダプターに結合できるように、適切に設計される。一実施形態では、使用される転位系は、ビブリオ・ハーベイなどのビブリオ種のトランスポザーゼに基づく。この方法のために、米国特許出願公開第2012/0301925号に記載される条件において、in vitroで安定であるが触媒的に不活性なビブリオ・ハーベイ転位複合体をアセンブルすることができる。
これらのアダプターは、トランスポザーゼの認識配列を含むアダプターのdsDNA領域において、複合体のトランスポザーゼに化学的に結合され得る。特定の複合体中のアダプターは、特定のトランスポザーゼの単一の認識配列を含み得るが、必ずしも含まなくてもよい。実施形態では、これらのアダプターは、同じトランスポザーゼの2つ以上の認識配列を含み得る。あるいは、2つの異なるトランスポザーゼが複合体中にあり、各々が異なる認識配列を有する場合、この複合体の一方のアダプターは、トランスポザーゼのうちの一方に対する認識配列を有し、他方のアダプターは、他方のトランスポザーゼの認識配列を有する。
DNA分子を断片化するために使用する場合、特定の範囲のDNAインプットのためにトランスポザーゼロードを選択することが重要である。例えば、ヒト血液における遊離DNA濃度または白血球計数は、異なる患者において顕著に変動し得る。従って、特定された濃度の範囲をカバーするトランスポザーゼ−アダプターロードを選択することは、事前のDNA濃度の測定および調整なしの、NGSのための自動サンプル処理を可能にする。より良い適したアダプターを選択することは、ちょうど異なるDNAインプットに限定されない。特定の必要性次第で、選択/スクリーニングが行われ得る多くのパラメーターが存在する。例えば、選択は、例えば、土壌由来、血液由来、または他の体液もしくは組織由来の粗製、半精製または未精製のDNAサンプルを処理する能力について行われ得る。別の一態様では、選択は、損なわれている可能性があるサンプル、即ち、エレメントへの曝露に起因して部分的に分解された可能性のあるサンプル、即ち、古くからのサンプルおよび法医学的サンプルを処理する能力、またはFFPEスライドの場合のように、サンプル調製技術および貯蔵を目的として行われ得る(Fortes et al.,Bioessays.2013 Aug,35(8):690−5;Sah et al.,Genome Med.2013 Aug 30;5(8):77)。例えば、より小さいサイズのトランスポザーゼ生成された断片を目指した分解されたサンプルの選択を用いると、以下の例に記載されるアダプター8が、有用であり得る。
ペアードエンド配列決定(Illumina)およびIon Torrent(Life Sciences)は、NGSプラットホームにおいて最も広く使用されている。いずれかのプラットホームのためのサンプルは、超音波処理を使用するDNA断片化と、その後のアダプターの結合とによって、または同じ反応混合物においてDNA断片化およびアダプターの結合を数分間で同時に実施するトランスポザーゼ法のいずれかによって、調製され得る。これらの方法には、良い点と悪い点とがある。超音波処理は、よりランダムなDNA断片化を達成するが、これは、トランスポザーゼ法よりもかなり労力を要し、時間がかかり、高価である。トランスポザーゼ法は、かなり迅速であり、はるかに安価である。しかし、DNA断片化は、あまりランダムでない、即ち、これはバイアスを有し、一部の領域においてはより多い読み取りおよびより良いゲノムカバー率を生じるが、他の領域においてはあまり良くなく、これは、1〜3%より高い重複率および対応して、同じ全体的カバー率を達成するためのより多い配列決定の試みを生じる場合が多い。時間、労働および設備支出における、トランスポザーゼ法を用いたときの数倍の利益を考慮し、サンプル調製が配列決定費用全体の約50%を構成することを考慮すると、これは、支払う代償が小さいように思われる。それにもかかわらず、重複率を低減させることは、高度に望ましい。
本明細書で開示する場合、異なるアダプターは異なる重複率を付与する。図11に示すように、アダプター9およびアダプター5は、第1の位置においてネイティブCG対を有する標準的アダプター1よりも、有意に低い重複率を付与した。アダプター6およびアダプター8は、より高い重複率を付与し、アダプター7およびアダプター10は、アダプター1とおよそ同じ重複率を付与した。驚くべきことに、アダプターの混合物は、いずれのアダプターよりもかなり低い重複率を付与した(図11)。可能な解釈は、異なるアダプターがロードされたトランスポザーゼが、標的DNA上の異なる場所に偏っているということである。トランスポザーゼによってより熱心に認識されるこれらの場所は、「ホットスポット」と呼ばれる(Berg et al.,Genetics.1983,105(4):813−28)。ホットスポットエリアはより頻繁に配列決定されるので、これらのホットスポットは、重複を大いに担う。しかし、異なるアダプターは異なるホットスポットを付与する。これらのホットスポットは、異なるアダプターによって異なるので、異なるアダプターがロードされたトランスポザーゼ混合物を適用することは、ホットスポットをランダム化し、重複率を低減させる。さらに、低い重複率を個々に付与するアダプターの混合物について選択することは、重複率をさらにもっと低減させ得る。異なるアダプターがロードされたトランスポザーゼロードは、他の特性、例えば、異なるATドロップアウト率においても異なる(図12)。
B.低細胞数配列決定およびマイクロアレイに関する使用
上述のように、本明細書に開示されるアダプターは、マイクロアレイにおいて使用されるサンプルを調製するために使用され得る。マイクロアレイ技術は、大規模遺伝子型決定、遺伝子発現プロファイリング、比較ゲノムハイブリダイゼーション、DNA配列決定、遺伝子発見、経路の再構築および疾患診断に使用される(Dufva M.Methods Mol Biol.2009;529:1−22;Gibriel AA.Brief Funct Genomics.2012 Jul;11(4):311−8)。この分野における非の打ちどころのない利益にもかかわらず、臨床設定における適用は、いくつかの高度に特殊化された実験室における伝統的なマイクロアレイ技術の使用によって、なおも制限されている(Guarnaccia et al.,Genomics.2014 pii:S0888−7543(14))。その主な理由は、研究実験室には適切であるが診断実験室には適切でない、マイクロアレイ技術の複雑さである(同書)。
マイクロアレイのためのDNAサンプル調製は、一般に、(i)DNA断片化、(ii)DNA増幅(任意選択、および出発材料の量次第)、および(iii)固体支持体上に固定化されたDNAプローブにハイブリダイズしたサンプルの検出を可能にするための、フルオロフォアによるDNA標識化を含む。参照および被験サンプルは、別々に処理され得、サンプル間の比較を可能にするために、異なるフルオロフォアで標識化される(Agilent Oligonucleotide Array−Based CGH for Genomic DNA analysis.Protocolバージョン7.2 2012年7月)。一般に、マイクロアレイのためのDNAサンプルは、制限エンドヌクレアーゼ消化または熱DNA断片化を使用して断片化され得る。これらの従来のアプローチの中で、エンドヌクレアーゼ消化は、より良い性能を提供するが、これは、実施するのに約2時間20分かかる。対照的に、95℃におけるDNA断片化は、わずか4分以内に達成される。しかし、これは、制限ヌクレアーゼ消化ほど頑強でない場合が多く、SNP分析適用、例えば、SurePrint G3 CGH+SNPには不適切である。
本明細書で開示する場合、本発明は、3つ全ての段階において顕著な改善を提供する。より具体的には、第1の段階において、トランスポザーゼは、特定のサイズ(200〜500bp、即ち、Agilentアレイにとって理想的)へとDNAを同時に断片化し、規定された19bpのタグを提供する(図21A)。増幅段階において、現在のAgilentプロトコールおよび他のWGA法とは異なり、かなり信頼性が低いランダムプライマーではなく、規定された19bpのプライマーが使用される(図21B)。最後に、標識化ステップにおいて、ランダムプライマーではなく同じ規定されたプライマーが使用されるので、かなり速い標識化が達成される(図21C)。
以下の実施例6に示すように、サンプルDNAは、トランスポザーゼ−オリゴヌクレオチド複合体を使用して断片化され得、次いで、これらのDNA断片は、オリゴヌクレオチドタグで両方の末端においてタグ化され得る。これらのオリゴヌクレオチドタグは、タグに対して相補的なプライマーを用いてDNA断片を増幅するために使用され得、またはタグに対して相補的なプライマーの着地部位として使用され得、このプライマーは、フルオロフォアで標識化された少なくとも1つのdNTPを含むdNTP混合物を使用して、ポリメラーゼ反応において伸長される。
DNAインプット次第で、この反応は、わずか5〜20分の短い時間で起こり得る。より重要なことに、オリゴヌクレオチドタグは、産生されたDNA断片の各末端に結合される(図21A)。実施例6に示すように、反応をおよそ中性のpHで、45℃で、短い時間にわたって実施した場合、DNA損傷は観察されなかった。トランスポザーゼ法を用いて、理想的なサイズのDNA断片が、Agilentマイクロアレイのために創出された(Agilent Oligonucleotide Array−Based CGH for Genomic DNA analysis.Protocolバージョン7.2 2012年7月)。図22に示すように、200b.p.と500b.p.との間の理想的な断片長が、16pg〜200ngの範囲のDNAインプットにおいて、ルーチンで産生された。
断片化されたDNAは、任意選択である増幅に供され得る。即ち、増幅は、gDNA量が、1パック、2パックもしくは4パックのAgilentマイクロアレイについては0.5ug未満、または8パックのマイクロアレイについては0.2ug未満である場合に、必要とされる。以下の実施例6において、DNA増幅を、トランスポザーゼ反応においてDNA断片の末端に結合されたタグに対して相補的なプライマーを使用するPCRを用いて、実施した(図21B)。限定ではなく例として、そのホスホジエステル相補体との二重鎖中のホスホロチオエート含有オリゴヌクレオチド5’−ACAAGAGACAG−3’(配列番号95)によって断片がタグ化される場合、断片は、プライマー7 5’−AGATGTGATCAAGAGACAG−3’(配列番号93、図21B)を用いて増幅される。PCRサイクルの数は、出発DNAの量に依存する。
多くの熱安定性DNAポリメラーゼおよびポリメラーゼ組成物が、この目的のために使用され得、例には、Taq、Taq2000、Pfu、PfuUltra、PicoMaxxおよびHerculaseが含まれる。あるいは、BstまたはPhi29などの高度に進行性のポリメラーゼが、増幅に使用され得る。先行技術のランダムプライマーの代わりに、プライマー7などの本発明の規定されたプライマーを使用すると、かなり迅速かつより良好な品質の増幅を達成することができる。ランダムプライマーは、全ゲノム増幅(WGA)法において生成されるバイアスの主要な理由であるので、より良い品質(より少ないバイアス)が、規定されたプライマーを用いて達成される。さらに、ランダムプライマーからのプライミングは、4096のヘキサマー組み合わせが存在する場合、着地部位に対する6マープライマーの相対濃度が低いことに起因して、非効率的である。その非効率に関する別の理由は、反応温度が、ランダムプライマーのTmを約30℃上回ることである(Agilent Oligonucleotide Array−Based CGH for Genomic DNA analysis.Protocolバージョン7.2 2012年7月)。一見したところ、後者の問題は、反応温度を低下させることによって解決され得るが、この温度は、酵素反応にとって最適未満となる。従って、本発明の規定されたプライマーを使用することは、増幅バイアスの低減だけでなく、反応条件が最適である場合のサンプルのより速い処理もまた可能にする。
マイクロアレイサンプル調製における第3のステップは、DNA標識化である。DNA標識化ステップを改善するための理論的根拠は、DNA増幅ステップを改善するための理論的根拠と同じであり、それは、規定されたプライマーが、先行技術におけるランダムプライマーとは対照的に、本発明において使用されるということである。一般に、標識化は、参照サンプルについてはシアニン3−dUTPを用いて、試験サンプルについてはシアニン5−dUTPを用いて、達成される(Agilent Oligonucleotide Array−Based CGH for Genomic DNA analysis.Protocolバージョン7.2 2012年7月)。大腸菌DNAポリメラーゼのエキソ(−)Klenow断片が、ランダムプライマーと組み合わせて使用される。標識化反応は、ランダムプライマーの非効率に主に起因して、約2時間のインキュベーションを必要とする。本明細書に開示された規定されたプライマーを利用することは、ポリメラーゼIによる塩基対合成の速度が、平均して10ヌクレオチド/秒と20ヌクレオチド/秒との間であるので、反応時間を数分に削減する。200〜500ヌクレオチドのDNA断片の3’末端にしっかりとアニーリングした規定されたプライマーを用いると(図21C)、約10分間が、標識化反応のために十分である。ポリメラーゼIの速度は比較的遅く、解離速度が高いので、より良い処理能力を有するより速い酵素が、この時間をさらに低減させるために、当業者によって選択され得る(Anderson et al.,Incorporation of reporter−labeled nucleotides by DNA polymerases.2005,BioTechniques 38:257−264)。例えば、Taq、VentエキソポリメラーゼまたはPfuエキソポリメラーゼを使用するPCR反応における標識化もまた、選択肢である。
要するに、本明細書に開示されるアダプターおよび方法は、マイクロアレイサンプル調製の顕著な性能改善を達成することを可能にする。制限エンドヌクレアーゼを使用する典型的に好ましい従来の方法は、低いインプットにおいては非実用的であるので、DNA断片化ステップにおける改善された品質は、特に低いDNAインプットに関して達成される。熱DNA断片化は、制限エンドヌクレアーゼよりも、低いインプットに対してより適切であるものの、DNAを損傷し、SNP適用には適切でない。さらに、ランダムプライマーが使用されないので、品質における顕著な利益(より少ないライブラリーバイアス)が、増幅段階において達成される。改善された効率および時間における低減もまた、3つ全てのステップにおいて達成される。上述のように、DNA断片化ステップにおいて、従来の制限エンドヌクレアーゼ消化は、一般に約2時間かかるが、トランスポザーゼアプローチは、約5〜20分間かかる(DNAインプット次第)。50ngのDNAインプットによるDNA増幅ステップにおいて、従来のWGA/PCRは約3時間かかるが、トランスポザーゼ−PCRアプローチは約1時間かかる。標識化ステップにおいて、帯流電流(convention current)−ランダムプライマーアプローチは2時間かかるが、トランスポザーゼ−規定されたプライマーアプローチは約10分間かかる。全体的な時間節約は、最大で約4〜5時間またはそれ以上であり得る。
本発明のアダプターは、サンプルのかなり速い処理および改善された性能と組み合わせて、マイクロアレイのためのDNAサンプル調製の複雑さを低減させることを可能にする。このアプローチを使用すると、標準的プロトコール(例えば、Agilent Oligonucleotide Array−Based CGH for Genomic DNA analysisサンプル調製プロトコール)と比較して、効率を改善し、サンプル調製のための時間を数時間低減させ、バイアスを低減させることが可能である。上述のように、これらは、着床前診断、コピー数バリエーションおよびSNP分析における、単一細胞または低細胞数適用のためにも重要である。
C.核酸送達
トランスポザーゼは、真核生物細胞、例えば、哺乳動物(Suganuma et al.,Biol Reprod.2005 Dec;73(6):1157−63)、昆虫(Rowan et al.,Insect Biochem Mol Biol.2004 Jul;34(7):695−705.)および植物(Wu et al.,Plant J.2011 ct;68(1):186−200;Wu et al.,Plant Mol Biol.2011 Sep;77(1−2):117−27)中への遺伝子送達のためツールとして十分確立されている。米国特許第8,283,518号および同第8,227,432号もまた参照のこと。本発明のアダプターおよびアダプター−トランスポザーゼ複合体は、疾患の処置、有用なタンパク質の産生、ならびに遺伝子改変された植物および動物の生成のために、植物および動物の細胞中に核酸(例えば、遺伝子)を送達するために、核酸送達ビヒクル中に含まれ得る。
典型的なトランスポザーゼ遺伝子送達系は、トランスポソームを含まないが、その代わりに2つのプラスミドを含み、一方のドナープラスミドは、プロモーターに作動可能に連結された目的の遺伝子をコードし、もう一方のドナープラスミドは、トランスポザーゼをコードする。例えば、Meir and Wu,MChang Gung Med J.2011 Nov−Dec;34(6):565−79;Yusa et al.,Proc.Natl.Acad.Sci.USA,Vol.108,No.4,1531−1536,2011;Germon et al.,Genetic,Vol.173,No.3:265−276,2009;De Silva et al.,Human Gene Therapy,21:1603−1613,2010)を参照のこと。ドナープラスミドでは、目的の遺伝子およびプロモーターには、互いに対して逆方向のトランスポザーゼ認識配列が隣接する。ヘルパープラスミドでは、トランスポザーゼをコードする配列が、プロモーターに作動可能に連結される。真核生物宿主細胞の細胞質中への同時トランスフェクションの際に、ヘルパープラスミドの一部は、核に到達し、そこで、トランスポザーゼ遺伝子は、mRNAへと転写され得、次いで、このmRNAは、細胞質中に輸送され得、トランスポザーゼタンパク質へと翻訳され得る。このトランスポザーゼは、ドナープラスミドDNA中のその認識配列に結合し、プラスミド外DNA配列を切り出し、認識配列が隣接する目的の遺伝子と共に、複合体、即ち、トランスポソームを形成する。次に、この複合体は、核中に輸送され、そこで、ゲノムDNAに対して作用し得、その中に組み込まれ得る。
代替的なトランスポザーゼベースの遺伝子送達系は、その内容が全体で本明細書に組み込まれる、2013年3月13日出願の米国特許出願第61/779,623号に記載されている。この代替法は、植物および動物の細胞中への遺伝子送達を大いに改善する。根本的には、この代替的系は、目的の標的(例えば、核またはミトコンドリア)または宿主細胞の予め選択されたDNA含有オルガネラにトランスポソームを標的化する標的化エレメントに可逆的にまたは放出可能に連結されたトランスポソーム(即ち、トランスポザーゼ(複数可)に対する2つの結合部位を有する核酸に結合した少なくとも1つのトランスポザーゼ)を含む複合体を含む。使用において、この複合体は、目的の細胞に送達され、それらの細胞によって取り込まれ、細胞内で、予め選択されたDNA含有オルガネラへと輸送される。一旦予め選択されたDNA含有オルガネラの内側に入ると、トランスポソームおよび標的化エレメントは、典型的には分離され、このトランスポソームは、核酸を宿主細胞のDNA中に挿入する。
本発明のアダプターおよびアダプター−トランスポザーゼ複合体は、従来の系および代替的系の両方において使用され得る。これらの系および関連の遺伝子送達方法は、例えば、2013年3月13日出願の米国特許出願第61/779,623号に記載される様式で、ゲノムDNAまたは予め選択されたDNA含有オルガネラのDNA中に核酸を挿入するために使用され得る。
これらの使用を考慮すると、本発明のアダプターおよびアダプター−トランスポザーゼ複合体は、疾患もしくは障害に罹患している被験体またはかかる疾患もしくは障害を発症する高い可能性がある被験体を処置する方法において使用され得る。この方法は、疾患または障害に罹患している被験体を処置する治療方法であり得る。あるいは、この方法は、将来疾患または障害を発症する高い可能性を有すると疑われる被験体を処置する予防方法であり得る。なお他の実施形態では、この方法は、DNAワクチンなどを介して、被験体において疾患または障害を予防する方法である。所望の遺伝子をコードする核酸を、特定の制御エレメントの下で被験体の細胞中に送達することによって、特定のタンパク質もしくは核酸が、細胞において発現され得、または特定のタンパク質もしくは核酸の発現は、低減されもしくは無効にされ得、こうして、被験体の処置をもたらす。
目的の配列を有する核酸を送達する能力は、トランスジェニックの非ヒト動物および植物を創出するためにも使用され得る。かかるトランスジェニックの非ヒト動物および植物は、特定のウイルスまたは細菌に対する免疫、特定の薬物または毒素に対する耐性、耐乾燥性、増加したタンパク質対脂肪比、栄養素の産生の増加、医薬的に活性な物質の発現、および有害物質の低減された産生を含む、1または複数の所望の表現型特徴を有し得る。
キット
本発明の別の態様は、キットを提供する。一般に、本発明に従うキットは、上記本発明のアダプターのうちの少なくとも1つ、および例えば、DNAを断片化するため、断片化および配列決定のため、または核酸送達のために有用なさらなる試薬を含む。
本発明のキットの一実施形態では、1または複数のオリゴヌクレオチドアダプターが、1または複数のコンテナ中に提供される。このアダプターは、1または複数のコンテナ中に液体溶液(例えば、水溶液またはアルコール溶液)として提供され得る。あるいは、このアダプターは、1または複数のコンテナ中に乾燥組成物として提供され得る。実施形態では、2つ以上の異なるアダプターが、単一のコンテナまたは2つ以上のコンテナ中に提供され得る。2つ以上のコンテナが提供される場合、各コンテナは、単一のアダプターを含み得るか、またはこれらのコンテナのうちの1つ、一部もしくは全てが、これらのアダプターのうちの1つ、一部もしくは全ての混合物を含み得る。
このキットは、1または複数の精製されたトランスポザーゼをさらに含み得る。このトランスポザーゼは、1または複数のコンテナ中に、液体溶液としてまたは乾燥組成物として提供され得る。一部の実施形態では、2つ以上の異なる精製されたトランスポザーゼが、単一のコンテナまたは2つ以上のコンテナ中に提供される。2つ以上のコンテナが提供される場合、各コンテナは、単一のトランスポザーゼを含み得るか、またはこれらのコンテナのうちの1つ、一部もしくは全てが、これらのトランスポザーゼのうちの1つ、一部もしくは全ての混合物を含み得る。
好ましくは、これらのアダプターのうちの少なくとも1つは、これらのトランスポザーゼのうちの少なくとも1つに対する認識配列を含む。より好ましくは、このキットの少なくとも1つのトランスポザーゼの認識配列を有する少なくとも1つのアダプターが、提供される。この実施形態では、特定のトランスポザーゼが複数の関連配列を認識し得るので、キット中のトランスポザーゼおよびアダプターは一対一で一致している必要性はないことに留意すべきである。他の実施形態と同様に、キットのこの実施形態では、トランスポザーゼおよびアダプターは、異なるコンテナ中に単一で提供され得、またはトランスポザーゼおよびアダプターの任意の混合物が、任意の数のコンテナ中に提供され得る。
なお別の一実施形態では、このキットは、1または複数のトランスポザーゼ複合体を含み得る。他の実施形態と同様に、これらの複合体は、液体組成物中にまたは乾燥材料として提供され得る。さらに、任意の数の異なる複合体が、キット中に提供され得る。上記のように、これらの複合体は、異なるコンテナ中にもしくは異なるコンテナ上に単一で提供され得、または複合体の任意の混合物が、任意の数のコンテナ中にもしくは任意の数のコンテナ上に提供され得る。
例示的な一実施形態では、このキットは、ビーズまたはナノ粒子などの固体支持体に結合した1または複数のトランスポザーゼ複合体を含む。この実施形態では、この固体支持体は、複合体のためのコンテナとみなされる。これらの複合体は、リンカーによって、例えば特異的結合対によって、固体支持体に結合される。例示的な一実施形態では、これらの複合体は、PCRプレートのウェルの表面に結合されて提供される。この実施形態では、各ウェルは、単一の型の複合体を含み得る、または2つ以上の異なる複合体を含み得る。キットの別の例示的な一実施形態では、これらの複合体は、ナイロンストリップなどのナイロンメンブレンの表面に結合されて提供される。この実施形態では、これらの複合体は、任意の所望の順序および幾何学的形状で、ならびに任意の組み合わせで、メンブレンに関して分布され得る。例えば、このメンブレンは、一連の線または点としてメンブレン上に配置された単一の複合体を有し得る。あるいは、異なる複合体の一連の線または点が提供され得る(例えば、複合体1は点1上に配置され、複合体2は点2上に配置されるなど)。さらにもう一度、2つ以上の複合体の混合物が、点、線などの上に配置され得る。
上で留意したように、特定の実施形態では、GC対ATのバイアスを低減させるため、従ってゲノムDNAの断片化の優れた制御を提供するために、異なる認識配列を有する2つ以上の異なるトランスポザーゼ複合体を提供することが好ましい。キットを創出する前に、トランスポザーゼ複合体の混合物を含むキットに関して、1または複数の混合物は、混合物中の複合体の比率を変動させることによって、特定の標的DNAについてバイアスを最小化するために最適化され得る。当業者は、トランスポザーゼ−アダプター複合体の異なる混合物を創出する方法、それらを固体支持体上に固定化する方法、およびそれらを標的DNAの断片化に適用する方法を、容易に認識できる。当業者は、断片を増幅および配列決定する方法、配列決定データを分析する方法、最低のバイアスを有する混合物の組み合わせ(比率)を選択する方法、ならびにその組み合わせに基づいてキットを製造する方法もまた、知っている。異なる比率が、異なるDNA標的のために推奨され得、異なるキットが、異なる型の標的のために製造され得ることに、留意すべきである。例えば、当業者は、ATバイアスを有するより多くのトランスポザーゼ−アダプター複合体が、ATリッチ標的のために使用されるべきであることを認識できる。
2つの異なるトランスポザーゼが存在するキットの特定の実施形態では、これらのキットは、好ましくは、4つの異なるオリゴヌクレオチドアダプターを含む。これらのアダプターのうちの2つは、1つのトランスポザーゼの認識配列(複数可)を含むが、そのうち1つだけが、特異的結合対のメンバーを含む。他の2つのアダプターは、他のトランスポザーゼの認識配列(複数可)を含むが、そのうち1つのみが、特異的結合対のメンバーを含む。アダプターの組み合わせの使用を介して、トランスポザーゼ複合体が形成され得、特異的結合対のメンバーを介して固体基材に結合され得る。
本発明のキットは、本発明の方法を実施するために有用な任意の数のさらなる試薬または物質を含み得る。かかる物質には、宿主細胞の溶解のための試薬(緩衝液を含む)、二価カチオンキレート剤またはヌクレアーゼを阻害する他の薬剤、トランスポザーゼ複合体および反応の他の成分が適切に機能していることを確実にする際に使用するためのコントロールDNA、DNA断片化試薬(緩衝液を含む)、PCR反応試薬(緩衝液を含む)、ならびに洗浄溶液が含まれるがこれらに限定されない。本発明のキットは、任意の温度で提供される。例えば、液体中での、トランスポザーゼ、アダプターまたは複合体を含むキットの貯蔵のために、これらのキットは、0℃未満で、好ましくは−20℃以下で、または他の場合には凍結状態で、提供および維持されることが好ましい。
これらのキットの成分は、コンテナ中または固体基材上に提供され得る。これらのコンテナおよび固体基材は、ボール紙、プラスチック、金属またはそれらの組み合わせで作られた箱などの適切な包装中に包装された組み合わせで提供される。バイオテクノロジー試薬のための適切な包装材料は、当該分野で公知であり広く使用されており、従って、本明細書で特定する必要はない。
用語「核酸」とは、本明細書で使用する場合、DNA分子(例えば、ゲノムDNAもしくはcDNA)、RNA分子(例えば、mRNA)またはDNAもしくはRNAアナログを指す。DNAまたはRNAアナログは、ヌクレオチドアナログから合成され得る。核酸分子は、一本鎖または二本鎖であり得るが、好ましくは、二本鎖DNAである。本発明の核酸アダプターは、正準および/または非正準核酸塩基を含み得る。用語「正準」は、DNAにおいて一般に見出される4種の一般的核酸塩基アデニン、シトシン、グアニンおよびチミンを指すため、または正準塩基を含むそれぞれのデオキシリボヌクレオシド、デオキシリボヌクレオチドもしくは2’−デオキシリボヌクレオシド−5’−三リン酸を指すために、使用される。用語「非正準」は、これら4種の正準塩基以外の、DNA中の核酸塩基を指すため、または非正準塩基を含むそれぞれのデオキシリボヌクレオシド、デオキシリボヌクレオチドもしくは2’−デオキシリボヌクレオシド−5’−三リン酸を指すために、使用される。例えば、ウラシルは、RNA中の一般的な核酸塩基であるが、ウラシルは、DNA中では非正準塩基である。「非正準塩基」は、非正準ヌクレオチドの(例えば、オリゴヌクレオチド合成機を使用する合成による、もしくはDNAポリメラーゼを使用する合成による)取り込みの結果として、または既存の塩基(正準もしくは非正準)の改変の結果として、核酸中に見出される。
用語「オリゴヌクレオチド」とは、ヌクレオチドおよび/またはヌクレオチドアナログの短いポリマーを指す。オリゴヌクレオチドは、好ましくは少なくとも4ヌクレオチド、例えば、少なくとも約10〜15、10〜20、15〜25または15〜200ヌクレオチドである。正確なサイズは、多くの因子に依存し、これらは次に、オリゴヌクレオチドの最終機能または使用に依存する。このオリゴヌクレオチドは、化学的合成、DNA複製、逆転写、PCR、ライゲーションまたはそれらの組み合わせを含む任意の様式で、生成され得る。
「単離された核酸」は、その構造が、いずれの天然に存在する核酸の構造とも同一ではない、または天然に存在するゲノム核酸のいずれの断片の構造とも同一ではない、核酸である。従って、この用語は、例えば、(a)天然に存在するゲノムDNA分子の一部の配列を有するが、それが天然に存在する生物のゲノム中の分子のその一部に隣接する配列の両方によっては隣接されない、DNA、(b)得られた分子がいずれの天然に存在するベクターともゲノムDNAとも同一でないような様式で、ベクター中にまたは原核生物もしくは真核生物のゲノムDNA中に取り込まれた核酸、(c)別個の分子、例えば、cDNA、ゲノム断片、ポリメラーゼ連鎖反応(PCR)によって産生された断片、または制限断片、および(d)ハイブリッド遺伝子の一部である組換えヌクレオチド配列をカバーする。
本明細書で使用する場合、用語「単離された」、「単離すること」、「単離」、「精製された」、「精製すること」、「精製」、およびそれらの文法的等価物は、本明細書で使用する場合、特記しない限り、材料が単離されるサンプル由来または供給源(例えば、細胞)由来の少なくとも1つの夾雑物(例えば、タンパク質および/または核酸配列)の量における低減を指す。従って、精製は、「富化」、即ち、サンプル中の望ましいタンパク質および/または核酸配列の量における増加を生じる。
本明細書で使用する場合、「タグ」とは、それが接続される核酸断片を取り扱うための手段を提供する、非標的核酸成分、一般にはDNAを指す。例えば、好ましい実施形態では、タグは、タグが結合されるDNAの同定、認識および/または分子的操作もしくは生化学的操作を可能にするヌクレオチド配列を含む(例えば、DNAポリメラーゼによる伸長のためのプライマーなどのオリゴヌクレオチドをアニーリングするための部位、または捕捉のためもしくはライゲーション反応のためのオリゴヌクレオチドを提供することによる)。タグをDNA分子に接続するためのプロセスは、時折、本明細書で「タグ化」と呼ばれ、タグ化を受けるDNAまたはタグを含むDNAは、「タグ化された」と言われる(例えば、「タグ化されたDNA」)。「タグ部分」または「タグドメイン」は、所望の意図した目的または適用のための配列を示すタグの一部分またはドメインを意味する。
本明細書で使用する場合、「配列決定タグ」または「配列決定タグドメイン」は、タグ化された環状ssDNA断片を合成するため(例えば、合成による配列決定のためのプライミング部位を提供するため、またはライゲーションによる配列決定のためのアニーリング部位を提供するため、またはハイブリダイゼーションによる配列決定のためのアニーリング部位を提供するため)の方法を使用してタグが接続されるssDNA断片の配列決定を促進することを目的とした配列を示す、タグまたはタグドメインを意味する。例えば、一部の実施形態では、この配列決定タグドメインは、このssDNA断片またはこのssDNA断片の相補体のDNA合成をプライミングするための部位を提供する。
本明細書で使用する場合、「増幅タグ」または「増幅タグドメイン」は、タグが付け加えられる核酸の増幅を促進することを目的とした配列を示す、タグまたはタグドメインを意味する。例えば、一部の実施形態では、この増幅タグまたはドメインは、DNAポリメラーゼを使用する核酸増幅反応(例えば、PCR増幅反応もしくは鎖置換増幅反応、またはローリングサークル増幅反応)のためのプライミング部位、または核酸増幅反応において鋳型依存的リガーゼを使用するプローブのライゲーション(例えば、ライゲーション連鎖反応)のためのライゲーション鋳型を提供する。
本明細書で使用する場合、「検出タグ」または「検出タグドメイン」は、タグ化されたssDNA断片の検出を促進することを目的とした配列または検出可能な化学的もしくは生化学的部分を示す、タグまたはタグドメインを意味する(例えば、ここで、この配列または化学的部分は、検出可能な分子を含むまたは検出可能な分子に接続される。例えば、可視的、蛍光、化学発光もしくは他の検出可能な色素のなかから選択される検出可能な分子、基質の存在下で検出可能な酵素、例えば、NBT+BCIPとのアルカリホスファターゼ、または適切な基質とのペルオキシダーゼ)、検出可能なタンパク質、例えば、緑色蛍光タンパク質、ならびに検出可能な部分に結合される、または別の検出可能な親和性結合分子と親和性結合対もしくは特異的結合対を形成し得る、親和性結合分子、あるいは当該分野で公知の任意の多くの他の検出可能な分子または系)。
本明細書で使用する場合、「アドレスタグ」または「アドレスタグドメイン」は、特定のサンプルの同定を可能にする配列を示す、タグまたはタグドメインを意味する(例えば、ここで、移行される鎖は、各サンプルについて異なる配列を示す異なるアドレスタグドメインを有する)。
本明細書で使用する場合、「DNA断片ライブラリー」または「DNA断片のライブラリー」は、標的DNAから生成されたタグ化されたDNA断片の収集または集団を意味し、ここで、この収集または集団中のタグ化されたDNA断片の組み合わせは、タグ化されたDNA断片が生成された標的DNAの配列を定性的におよび/または定量的に代表する配列を示し、この収集または集団中にあるタグ化されたDNA断片は、標的DNAのヌクレオチドまたは配列組成に基づいてタグ化されたDNA断片を含むまたは排除するかのいずれかの方法を意図的に使用することによって、それについて選択されていない、またはそれに対して選択されていない。種々の理由のために、DNA断片ライブラリーは、標的DNAによって示される全ての配列を示すタグ化されたDNA断片を含まない可能性があり得る。
本明細書で使用する場合、「標的DNA」とは、例えば、タグ化されたDNA断片のライブラリーを生成するために、転位に供される目的の任意のdsDNAを指す。標的DNAは、1つまたは複数の細胞、組織、臓器、または生きているもしくは死んだかのいずれかの生物由来、あるいは任意の生物学的または環境供給源(例えば、水、空気、土壌)由来を含む、任意のin vivoまたはin vitroの供給源から誘導され得る。例えば、一部の実施形態では、この標的DNAは、ヒト、動物、植物、真菌(例えば、カビもしくは酵母)、細菌、ウイルス、ウイロイド、マイコプラズマまたは他の微生物に起源するまたはこれらから誘導される、真核生物および/または原核生物dsDNAを含む、あるいはかかる真核生物および/または原核生物dsDNAからなる。一部の実施形態では、この標的DNAは、ゲノムDNA、サブゲノムDNA、染色体DNA(例えば、単離された染色体もしくは染色体の一部分由来、例えば、染色体由来の1もしくは複数の遺伝子もしくは遺伝子座由来)、ミトコンドリアDNA、葉緑体DNA、プラスミドもしくは他のエピソーム由来DNA(または、その中に含まれる組換えDNA)、または第1鎖cDNAを生成するためにRNA依存的DNAポリメラーゼもしくは逆転写酵素を使用してRNAを逆転写し、dsDNAを生成するために第1鎖cDNAにアニーリングしたプライマーを次いで伸長させることによって作製された二本鎖cDNAを含む、あるいはこれらからなる。一部の実施形態では、この標的DNAは、核酸分子中のまたは核酸分子から調製された複数のdsDNA分子(例えば、生物学的(例えば、細胞、組織、臓器、生物)もしくは環境(例えば、水、空気、土壌、唾液、痰、尿、糞便)供給源中のもしくはこれらの供給源由来のゲノムDNAもしくはRNAから調製されたcDNA中のまたはかかるゲノムDNAもしくはcDNAから調製された、複数のdsDNA分子)を含む。一部の実施形態では、この標的DNAは、in vitro供給源由来である。例えば、一部の実施形態では、この標的DNAは、一本鎖DNAからまたは一本鎖RNAもしくは二本鎖RNAから(例えば、当該分野で周知の方法、例えば、適切なDNA依存的および/またはRNA依存的DNAポリメラーゼ(逆転写酵素)を使用するプライマー伸長を使用して)in vitroで調製されるdsDNAを含むまたはかかるdsDNAからなる。一部の実施形態では、この標的DNAは、DNAもしくはRNA増幅(例えば、PCRもしくは逆転写PCR(RT−PCR)、転写媒介性の増幅方法、1もしくは複数の核酸分子の全てもしくは一部分の増幅を用いる)、適切な宿主細胞において引き続いて複製されるプラスミド、フォスミド、BACもしくは他のベクター中の1もしくは複数の核酸分子の全てもしくは一部分の分子クローニング、またはハイブリダイゼーションによる、例えば、アレイもしくはマイクロアレイ上のDNAプローブへのハイブリダイゼーションによる、1もしくは複数の核酸分子の捕捉(例えば、「配列捕捉」による;例えば、ROCHE NIMBLEGEN、AGILENTまたはFEBIT製のキットおよび/またはアレイを使用する)、のための方法を含む、当該分野で公知の任意の方法を使用して、1または複数の二本鎖または一本鎖のDNAまたはRNA分子の全てまたは一部分から調製されるdsDNAを含む、あるいはかかるdsDNAからなる。
「プライマー」は、核酸ポリメラーゼによって伸長され得る遊離3’−OH基を一般に有する、オリゴヌクレオチド(「オリゴ」)である。鋳型依存的ポリメラーゼのために、一般に、プライマーオリゴの少なくとも3’部分は、DNAポリメラーゼによる合成の開始のためのプライマー/鋳型複合体を得るために、オリゴが水素結合および他の分子力によって鋳型に「結合する」(または「複合体化する」、「アニーリングする」もしくは「ハイブリダイズする」)、ならびにDNA合成のプロセスにおいて鋳型に対して相補的なその3’末端において連結された共有結合した塩基の付加によって伸長される(即ち、「プライマー伸長される」)、鋳型核酸の一部分に対して相補的である。その結果は、プライマー伸長産物である。鋳型依存的DNAポリメラーゼ(逆転写酵素を含む)は、一般に、DNA合成を開始するために(「プライミング」)、一本鎖鋳型へのオリゴヌクレオチドプライマーの複合体化を必要とするが、RNAポリメラーゼは、一般に、DNA鋳型に対して相補的であるRNAの合成(転写)のためにプライマーを必要としない。
本明細書で開示する場合、いくつかの値の範囲が提供される。その範囲の上限と下限との間の、下限の単位の10分の1までの各介在する値もまた、文脈が明確に他を示さない限り、具体的に開示されていることが理解される。述べられた範囲における任意の述べられた値または介在する値と、その述べられた範囲における任意の他の述べられた値または介在する値との間の、各々のより小さい範囲は、本発明内に包含される。これらのより小さい範囲の上限および下限は、その範囲中に独立して含まれまたは排除され得、より小さい範囲中にいずれかの限界値が含まれる、いずれの限界値も含まれない、または両方の限界値が含まれる各範囲もまた、本発明の範囲内に包含され、述べられた範囲における任意の具体的に排除された限界値の支配下にある。述べられた範囲が、これらの限界値の一方または両方を含む場合、これらの含まれた限界値のいずれかまたは両方を排除する範囲もまた、本発明に含まれる。
特異的トランスポザーゼのための複数のアダプターを設計する
この実施例は、ネイティブまたは公知のトランスポザーゼ認識配列に基づいてトランスポザーゼアダプターを設計および生成することを記載する。
ネイティブまたは公知のトランスポザーゼ認識(アダプター)配列を、「高活性」Tn5トランスポザーゼの「モザイク」などのように刊行物から(Zhou et al.,J Mol Biol.1998;276(5):913−25)、またはVibharトランスポザーゼについてと同様にバイオインフォマティクスの方法を使用して(米国特許出願公開第20120301925号)、得た(図1)。簡潔に述べると、微生物ヌクレオチドblastを、blastnアルゴリズム(高度に類似した配列のために最適化されたMegablast、代表的ゲノムのみ、最大標的配列250、期待閾値10、ギャップコスト線形、低い複雑さの領域をフィルタリング)を使用して、NCBI Microbial Nucleotide BLASTウェブサイト(blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch&PROG_DEF=blastn&BLAST_PROG_DEF=megaBlast&SHOW_DEFAULTS=on&BLAST_SPEC=MicrobialGenomes)上で、公知のトランスポザーゼ認識配列に対して実施した。発見されたトランスポザーゼ認識配列(アダプター)の妥当性を、配列の近くにあるトランスポザーゼ遺伝子を見出すことによって確認した。
次に、複数のアダプターを、ネイティブトランスポザーゼアダプターに基づいて、または特定のトランスポザーゼのために既に開発された改変されたアダプター、例えば、Tn5トランスポザーゼのための「モザイク」もしくはVibharトランスポザーゼのためのアダプター3ilおよび8ilに基づいて、設計した(米国特許出願公開第20120301925号)。転位事象におけるカットに最も近く(天然にトランスポゾンの内側に面する)、同じファミリーのトランスポザーゼの間で保存されているヌクレオチド位置を、改変のために選択した。図1に示される1位が好ましかったが、例えば、図2にTn5トランスポザーゼについて示されるように、1位は、カットに隣接しており、触媒部位中に位置付けられるので、トランスポザーゼ特性をモジュレートするためには1位が最も重要であるので、2位および/または3位はあまり好ましくない。
Vibharトランスポザーゼについて図3に、「高活性」Tn5トランスポザーゼについて図4に示すように、この位置は、いずれかの鎖もしくは両方の鎖上の1つのヌクレオチドを、ネイティブもしくは改変されたヌクレオチドに置換すること、または少なくとも1つのネイティブもしくは改変されたヌクレオチドを一方の鎖もしくは両方の鎖に付加すること、または1つの鎖から少なくとも1つのヌクレオチドを除去すること、または上記の組み合わせによって、改変され得る。改変されたヌクレオチドの例は、上記されている。
高い、中間のおよび低いインプットのNGSのためにアダプターを選択する
この実施例では、上記実施例1で生成したいくつかのトランスポザーゼアダプターを、異なるDNAインプットレベルにおけるNGSのためにゲノムDNAを断片化することにおけるそれらの活性について試験した。
説明を単純にするために、この実施例で使用したアダプターを、図5Bに示すように番号付けし、図中、両方の鎖上の1位における塩基、上の鎖上のさらに5’の塩基、および下の鎖上のさらに3’の塩基のみが示される。Vibharトランスポザーゼに、以前に記載されたように(米国特許出願公開第2012/0301925号)Illumina機器での配列決定に必要なさらなるヌクレオチド配列が提供された3ilおよび8ilアダプターをロードし、大腸菌DNA(ATCCカタログ番号8739D−5)の断片化に適用した。
高いDNAインプットについて、断片化を、200ngの大腸菌DNAである大腸菌(Migula)CastellaniおよびChalmers(ATCC、Manassas、VA)、10mM Bicine−NH4 pH7.5、5mM MnCl2、12mMグルタミン酸カリウムならびに50ug Vibharトランスポザーゼを含む20μlの反応混合物中で実施した。この反応混合物を、46℃または56℃で15分間インキュベートし、最大20mMのEDTAの添加によって停止させた。断片化およびタグ化されたDNAを、製造業者の指示に従って、Agencourt AMPure XPシステム、別名SPRIビーズ(Beckmam Coulter、Indianapolis、IN)を使用して、取り込まれていないアダプターから精製した。1回のPCR反応由来のDNAを、ビーズから20μlの水中に溶出させた。
次に、断片化およびタグ化されたDNAを、PCRにおいて増幅した。20μlのPCR反応混合物は、2μlのSPRIビーズ精製された鋳型、4μlの5×Herculase II Rxn緩衝液、0.5μl Herculase(登録商標)II(Agilent Technologies、Santa Clara、CA)、1mM dNTPs、5%DMSO、共に1uMの濃度のフォワードプライマーAgP1 5’−AATGATACGGCGACCACCGAGATCTACACGCTGACGTCGAGACTTGTGA−3’(配列番号77)およびリバースプライマーAgP2 5’−CAAGCAGAAGACGGCATACGAGATCGGTGGAGCTGTGCGTAGATGTGA−3’(配列番号78)を含んでいた。増幅を、アダプターギャップを充填し、下のアダプター鎖を置換するために、72℃で2分間のインキュベーションで開始し、その後、95℃で3分間のDNA融解ステップ、ならびに11サイクルの、i)95℃で40秒間の変性、ii)61℃で1.5分間のアニーリング、およびiii)72℃で3分間の伸長を行った。これらのサイクルの後に、PCR断片が完全に二本鎖になるのを確実にするために、72℃で10分間のインキュベーションを行った。PCR断片を、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。これらのゲルを、MultiImage(商標)multiimage light cabinet(Alpha Innotech、San Leandro、CA)を使用して、302nMの波長で写真撮影した。
図6に示されるゲルからわかるように、高いDNAインプットでは、アダプターのほとんどが、Illumina機器でのNGSのためのDNAの断片化およびタグ化において適切な活性を示し、これは、保存された1位における変化のほとんどが、十分に耐容されたことを示している。従って、適切な活性を有する複数のアダプターが、Vibharネイティブアダプターの1位において保存的CG対を変化させているにもかかわらず、創出された。さらに、アダプターは、トランスポザーゼに異なる特性を付与し、例えば、アダプター8は、より高い活性を付与するようであり、これはより小さい断片サイズを生じ、これをさらなる実験において確認した(図7)。
増加した活性は、特に、低いDNA濃度を有するサンプルを分析する必要性がある場合に、多数の適用のために有用である。これらの使用の例には、単一細胞ゲノム配列決定、単離された染色体または小さいゲノムの配列決定、血液由来の遊離DNAの分析、および複雑な生態系の理解が含まれる。例えば、Giorgi et al.,PLoS One.2013;8(2):e57994.doi:10.1371/journal.pone.0057994,Fodor et al.,PLoS One.2012;7(7):e41294.doi:10.1371)を参照のこと。従って、いくつかのアダプターを、中間のおよび低いDNAインプットについて評価した。
実験を、より少ないDNAおよびより少ないトランスポザーゼをこれらの研究において使用し、より多くのPCR増幅サイクルを適用したことを除いて、高いDNAインプットについてと同様に実施した。図8Aに示すデータからわかるように、20ngのインプット、11回のPCRサイクルで、最良の活性が、アダプター12を用いて得られた。1ngのインプット(図8B)、15回のPCRサイクルでは、同じアダプター12は、アダプター6、7、8および27と共に、親アダプター1および他の誘導体アダプターよりも有意に高い活性もまた示した。
同様に、アダプター6、8、12および27、ならびにさらにアダプター13および17は、68pgのDNAインプット(図8C)、19サイクルにわたる増幅において、より高い活性を示した。最後に、アダプター8、17および27は、4pgのDNAインプット(図8D)、即ち、単一のヒト細胞のDNA含量未満において、最良の活性を示した。増幅は、23サイクルにわたって実施した。アダプター8は、一貫して、ロードされたトランスポザーゼ濃度の広い範囲において、アダプター1よりもDNA断片の良い収量を付与した(図9)。重要なことに、26回のPCRサイクルを要した0.5pg(二倍体ヒト細胞の約1/13のDNA含量)の低いDNAインプットでさえも、いずれの試薬由来のバックグラウンドも存在しなかった(図10)。比較のために、市販のキット(Nextera XT DNA Sample Preparation Kits、Illumina、San Diego、CA)を使用した処理のために推奨される最も少量のDNAは、1ngであり、即ちヒト細胞のDNA含量よりも約150倍多い。全体として、1位におけるGからAへの置換は、より高い活性を付与し(アダプター6、8、13、17および27)、この位置におけるGからAへの置換およびミスマッチの組み合わせは、反対の鎖上にCを含むアダプター8および27において、活性をさらに増加させた。1位にネイティブのGを有するが、反対の鎖上にミスマッチを有するアダプター7および12もまた、増加した活性を付与した。別の重要な一態様は、異なるアダプターがロードされたトランスポザーゼ量が、特定の範囲のトランスポザーゼロードおよび標的DNA濃度において動作することである。例えば、実験の条件において、アダプター12がロードされたVibharトランスポザーゼは、DNAインプット範囲68ng〜20ngにおいて良好に動作したが、アダプター17がロードされたトランスポザーゼは、範囲4〜68pgにおいて良好に動作し、1ngでは活性をほとんど有さず、20μlのトランスポザーゼ反応当たり20ngのより高いDNAインプットでは、事実上不活性であった(図8)。アダプター13は、狭い活性範囲を付与し、68pgのDNAインプットにおいてのみ最良に動作した。
NGSのためのサンプル調製においてバイアスを最小化する
ペアードエンド配列決定(Illumina)およびIon Torrent(Life Sciences)は、NGSプラットホームにおいて最も広く使用されている。いずれかのプラットホームのためのサンプルは、同じ反応混合物においてDNAの断片化およびアダプターの結合を数分間で同時に実施するトランスポザーゼ法を使用して、調製され得る。しかし、上述のように、従来のトランスポザーゼ媒介性のDNA断片化は、あまりランダムではなく、ランダムさを増加させ重複率を減少させる必要性が存在する。
この実施例では、異なるアダプターが異なる重複率を付与することが発見された。図11に示すように、アダプター9およびアダプター5は、第1の位置においてネイティブのCG対を有する標準的アダプター1よりも有意に低い重複率を付与した。アダプター6およびアダプター8は、より高い重複率を付与し、アダプター7およびアダプター10は、アダプター1とおよそ同じ重複率を付与した。驚くべきことに、アダプターの混合物は、これらのアダプターのいずれよりもかなり低い重複率を付与した(図11)。
可能な解釈は、異なるアダプターがロードされたトランスポザーゼが、標的DNA上の異なる場所に偏っているということである。トランスポザーゼによってより熱心に認識されるこれらの場所は、「ホットスポット」と呼ばれる(Berg et al.,Genetics.1983,105(4):813−28)。ホットスポットエリアはより頻繁に配列決定されるので、これらのホットスポットは、重複を大いに担う。しかし、異なるアダプターは異なるホットスポットを付与する。これらのホットスポットは、異なるアダプターによって異なるので、異なるアダプターがロードされたトランスポザーゼ混合物を適用することは、ホットスポットをランダム化し、重複率を低減させる。さらに、低い重複率を個々に付与するアダプターの混合物について選択することは、重複率をさらにもっと低減させ得る。異なるアダプターがロードされたトランスポザーゼロードは、他の特性、例えば、異なるATドロップアウト率においても異なる(図12)。
NGSサンプル調製のためにプライマー伸長を妨害する
この実施例では、アッセイを実施して、NGSサンプル調製のためにプライマー伸長を妨害する改変を有するトランスポザーゼアダプターを試験した。
1つのアプローチでは、Pfu DNAポリメラーゼが止まるdU改変を、図13Bに示すように、アダプター対2および3中に、PCRプライマーAgP1およびAgP2の着地部位の下流に導入して、PCRにおけるアダプターの下の鎖(オリゴヌクレオチド3U2、8U2、3U4および8U4)のコピーを妨害した。アダプターのコピーおよび増幅は止まったが、ギャップ修復の後、タグ化されたDNA断片は改変されたヌクレオチドを含まないので、標的DNA断片の増幅は妨害されずに進行した。別のアプローチでは、アダプターの下の鎖の3’末端を、プライマー伸長プロセスを妨害するように、逆方向dTで遮断した(図13B、アダプター対4を参照のこと)。この逆方向dTには、ホスホロチオエート結合が先行して、DNAポリメラーゼの3’エキソヌクレアーゼ活性による逆方向dTの除去を防止した。
トランスポザーゼ反応を、上記の様式で実施し、トランスポザーゼ反応産物を、AgP1およびAgP2プライマーと共にPfu DNAポリメラーゼ(HerculaseII、Agilent Technologies)を使用するPCRにおいて直接増幅し、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色し、このとき、1kb+DNAラダー(Life Technologies)を、試験したDNAサンプルと並行して泳動した。
図14Aに示すように、標的DNAインプットなしでAgP1およびAgP2プライマーを使用するPCRにおいて増幅した場合、標準的アダプター対1がロードされたVibharトランスポザーゼによるトランスポザーゼ反応は、大量の小さいサイズの副産物を生成した。対照的に、これらの小さいサイズ副産物の生成は、アダプター対3および4を使用した場合には妨害された。中間のDNAインプット(即ち、20μlのトランスポザーゼ反応当たり20ngの標的ヒトDNAおよび5ugのロードされたトランスポザーゼ)を、トランスポザーゼ反応において使用したところ、標準的トランスポザーゼアダプター対1を使用する反応のPCR増幅は、有用な産物を事実上を生じなかった。図14Bを参照のこと。対照的に、アダプター対3または4は、満足な収量のタグ化されたDNA産物を生じた。
上記の結果は、dUまたは逆方向dTのいずれかを用いて妨害することが、アダプター−プライマーダイマーの産生を実質的に低減させ、中間のDNAインプットにおいて、満足な収量のタグ化されたDNA PCR産物をもたらしたことを示している。
これらのアッセイを、高いDNAインプット(即ち、20ulのトランスポザーゼ反応当たり200ngの標的ヒトDNAおよび50ugのロードされたトランスポザーゼ)を使用しても実施した。図15に示すように、高いDNAインプットを用いた場合、同じプライマーを用いたトランスポザーゼ反応の増幅は、再び、標準的トランスポザーゼアダプター1、またはアダプター対2もしくは3を使用した場合には、有用な産物を事実上生じなかった。しかし、タグ化されたDNA断片の収量は、アダプター対4がロードされたトランスポザーゼを使用した場合、満足のいくものであった。これらの結果は、高いDNAインプットにおいて、アダプター対2および3の妨害能力が、アダプター対4のものよりも効率的でなく、アダプター対4と同様に3’末端を遮断することが、好ましい実施形態を提示することを示している。
重要なことに、本発明の全てのアダプター改変は、トランスポザーゼ反応と適合性である。PCR増幅をSPRI精製後に実施した場合、改変されたアダプター対2、3、4または改変されていないアダプター対1のいずれも、匹敵する量の標的DNA断片を生成した(図15、SPRI+)。さらに、アダプター対4を用いると、これらの断片の収量は、SPRI精製ありでもなしでも事実上同じであった(図15)。
つまり、より少ないアダプターをトランスポザーゼ反応において使用し、結果としてより少ないアダプターがPCRに添加された場合には、アダプター対3および4の両方が、PCR反応が「毒される」ことを防止することにおいて効率的であったが(図14B)、アダプター対4のみが、増加した標的DNAおよびアダプターインプットでPCRが「毒される」ことを防止することにおいて効率的であった(図15)。これらの結果を考慮すると、標的DNAインプット次第でロードされたトランスポザーゼの量を、トランスポザーゼ反応において特定のアダプター改変に対して使用されるロードされたトランスポザーゼの量を最適化する方法は、当業者に即座に明らかである。
低い数の細胞からのNGSのためのDNAサンプルの調製
この実施例では、ホスホロチオエート結合ありまたはなしのトランスポザーゼアダプターを使用して、低い数の細胞からのNGSのためにDNAサンプルを調製した。
簡潔に述べると、DNAを、3つのヒト細胞由来のDNA材料に対応する20pgのヒトDNAから調製した。このDNAを、ホスホロチオエート結合を有さない標準的アダプター3il/8ilを使用し、異なる濃度のトランスポザーゼ(50または100ng/ml)を用いるトランスポザーゼ反応において、断片化およびタグ化し、AgP1およびAgP2プライマーを使用してPCRサイクルにおいて増幅した。次いで、これらのPCR断片を、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。結果を図17に示す。この図に示すように、満足な収量の適切なDNA断片が、3つの細胞由来のDNAを用いた25分間のトランスポザーゼ反応の後に観察されたが、NGSのために望ましいサイズ範囲の断片(200〜500bp)は、反応の42分の時点において、ほぼ完全に消失した。この結果は、トランスポザーゼ反応の25分の時点においてさえも、適切な材料の喪失がかなりのものであり得、50%以上の量になり得ることを示しており、これは、NGS適用のためには許容できない。
上記のアッセイを、アダプターE8およびアダプター78を用いて繰り返した。これら2つのアダプターは、アダプターE8が図18の上において示される位置においてホスホロチオエート結合を有することを除いて、同一である。結果を図18に示す。
この図に示すように、ホスホロチオエート結合の組み合わせ(アダプターE8)が、トランスポザーゼ反応効率における大きな改善を付与したことは、予測されていなかった。改善は、異なるトランスポザーゼ濃度(20pgのヒトDNAインプットで、180ng/ml、120ng/mlおよび80ng/ml)ならびに異なるインキュベーション時間(6〜70分間)におけるいくつかの実験において、一貫して観察された。ほとんどの部分について、この改善は、ヌクレアーゼに対する保護に起因しなかったこともまた見出された。実際、ヌクレアーゼ分解は、同じヌクレオチド配列を有するがホスホロチオエート結合を含まない短いアダプター78では事実上観察されなかった(図18)。
標準的アダプター3ilおよび8il(図16)とは異なり、アダプター78およびそのホスホロチオエート誘導体E8は、トランスポザーゼによって認識され、そのトランスポザーゼによって結合され、大部分が隠されてヌクレアーゼ攻撃から保護される可能性が高い、19b.p.の二重鎖のみからなった。ヌクレアーゼ活性は、標準的アダプターの単鎖部分を認識し、それが消化するDNA断片の内部へと反転するという可能性がある。かなりのサイズのタンパク質、例えば、トランスポザーゼダイマー(MW約102KD)が、かかる手技に必要である。大腸菌由来の常在性ヌクレアーゼはサイズが小さく、大腸菌は十分に研究されており、かかる活性は大腸菌では記載されてこなかったので、大腸菌由来の常在性ヌクレアーゼがDNA分解を担う可能性は低いと思われる。
要するに、これらの結果は、トランスポザーゼ反応の効率が、ホスホロチオエート結合をアダプターに付加することによって大きく改善されたことを示している。
マイクロアレイ適用のためのDNAサンプルの調製
この実施例では、ホスホロチオエート結合ありまたはなしのトランスポザーゼアダプターを使用して、マイクロアレイ適用のためのDNAサンプルを調製した。そのために、16pgおよび200ngのDNAを、図21A〜Cに示されるプロセスに供した。
最初に、サンプルDNAを、トランスポザーゼ−オリゴヌクレオチド複合体を使用して断片化し、そのホスホジエステル相補体との二重鎖中にホスホロチオエート含有オリゴヌクレオチド5’−ACAAGAGACAG−3’(配列番号95)を有するオリゴヌクレオチドタグで、両方の末端においてタグ化した。次いで、増幅段階において、断片化されたDNAを、トランスポザーゼ反応においてDNA断片の末端に結合されたタグに対して相補的であるプライマー7(5’−AGATGTGATCAAGAGACAG−3’、配列番号93)を使用してPCR増幅した(図21B)。ここで、従来のプロトコールおよびWGAとは異なり、信頼性の低いランダムプライマーではなく、規定された19bpプライマーを使用した(図21B)。PCRサイクルの数は、出発DNAの量に依存する。最後に、標識化ステップにおいて、オリゴヌクレオチドタグおよびプライマーを使用して、フルオロフォアで標識化された少なくとも1つのdNTPを含むdNTP混合物の存在下で、DNA断片を増幅した。このステップを、ランダムプライマーベースの従来の方法よりもかなり速い、約10分間で実施した。
得られたDNA断片を、1kb+DNAラダー(Life Technologies)と共に、2%アガロースゲルにおいて分離し、エチジウムブロマイドで染色した。結果を図22A〜Bに示す。これらの図に示されるように、200bpと500bpとの間の長さを有する断片を、16pg〜200ngの範囲のDNAインプットにおいてルーチンで産生したところ、DNA断片化段階において、トランスポザーゼが、特定したサイズ(200〜500bp、これはアレイにとって理想的であった)へとDNAを同時に断片化し、規定された19bpのタグを提供したことが示された(図21A)。反応をおよそ中性のpHで、45℃で、短い時間にわたって実施した場合、DNA損傷は観察されなかった。トランスポザーゼ法を用いて、理想的なサイズのDNA断片が、Agilentマイクロアレイのために創出された(Agilent Oligonucleotide Array−Based CGH for Genomic DNA analysis.Protocolバージョン7.2 2012年7月)。
先行技術のランダムプライマーの代わりに、プライマー7などの規定されたプライマーを使用することで、より早くかつより良い品質の増幅が達成されたことが見出された。これらの結果は、規定されたプライマーを使用することで、反応条件が最適な場合には、増幅バイアスの低減だけでなく、サンプルのより速い処理もまた可能になることを示している。
好ましい実施形態の上述の例および説明は、特許請求の範囲によって規定される本発明を限定するのではなく、例示すると解釈すべきである。容易に理解されるように、上に示される特徴の多数のバリエーションおよび組み合わせが、特許請求の範囲に示される本発明から逸脱することなしに、利用され得る。かかるバリエーションは、本発明の範囲からの逸脱とはみなされず、全てのかかるバリエーションが、以下の特許請求の範囲の範囲内に含まれる意図である。本明細書に引用される全ての参考文献は、その全体が本明細書に組み込まれる。

Claims (37)

  1. 第1の配列を含む第1の鎖と、
    前記第1の配列に対して相補的または実質的に相補的である第2の配列を含む第2の鎖と
    を含む、単離された合成核酸アダプターであって、
    前記アダプターは、トランスポザーゼのネイティブ認識配列と比較して、1または複数の改変を有するトランスポザーゼ認識配列を含み、前記1または複数の改変は、以下:
    (a)前記第1の配列の5’末端(1位)もしくは前記第2の配列の3’末端、またはそれらの両方における、1または複数の改変、
    (b)前記第1の鎖または前記第1の配列における1または複数の改変されたヌクレオチドであって、前記1または複数の改変されたヌクレオチドは、前記第1の鎖のプライマー伸長を妨害する、1または複数の改変されたヌクレオチド、および
    (c)前記第2の鎖または前記第2の配列における1または複数のホスホロチオエート結合、
    からなる群から選択される改変であり、かつ、前記アダプターは前記トランスポザーゼによって認識され、
    前記第1の配列および前記第2の配列が、それぞれ、配列番号75および配列番号76、配列番号28および配列番号36、配列番号28および配列番号22、配列番号2および配列番号36、配列番号2および配列番号74、配列番号26および配列番号22、配列番号26および配列番号36、配列番号24および配列番号36、または配列番号75および配列番号36である、単離された合成核酸アダプター。
  2. 前記第1の配列が、前記ネイティブ認識配列と比較して、その5’末端において少なくとも1つの付加されたヌクレオチドを有するか、または前記第2の配列が、相補体と比較して、その3’末端において少なくとも1つの付加されたヌクレオチドを有する、請求項1に記載のアダプター。
  3. 前記第1の配列が、前記ネイティブ認識配列と比較して、その5’末端において少なくとも1つのヌクレオチドを欠失しているか、または前記第2の配列が、相補体と比較して、その3’末端において少なくとも1つのヌクレオチドを欠失している、請求項1に記載のアダプター。
  4. 前記(b)の前記1または複数の改変されたヌクレオチドが、デオキシウリジン、脱塩基部位、2’OMeで改変されたリボ核酸(RNA)および逆方向チミジンからなる群から選択される、請求項1から3のいずれか1項に記載のアダプター。
  5. 前記逆方向チミジンが、前記第1の鎖の3’末端に存在する、請求項4に記載のアダプター。
  6. 前記1または複数の改変されたヌクレオチドに、ホスホロチオエート結合またはスペーサーが先行する、請求項1から5のいずれか1項に記載のアダプター。
  7. 前記第2の鎖が、前記1または複数の改変されたヌクレオチドを含まない、請求項1から6のいずれか1項に記載のアダプター。
  8. 1つのホスホロチオエート結合が、前記第2の鎖または前記第2の配列の3’側の最後のヌクレオチドと3’側の最後から2番目のヌクレオチドとの間に存在する、請求項1から7のいずれか1項に記載のアダプター。
  9. 前記第2の鎖または前記第2の配列が、約1〜18のホスホロチオエート結合を含む、請求項8に記載のアダプター。
  10. 前記第2の鎖または前記第2の配列が、約2〜15のホスホロチオエート結合を含む、請求項9に記載のアダプター。
  11. 前記第2の鎖または前記第2の配列が、約9のホスホロチオエート結合を含む、請求項10に記載のアダプター。
  12. 前記第1の鎖または第1のアダプター配列が、ホスホロチオエート結合を含まない、請求項1から11のいずれか1項に記載のアダプター。
  13. 前記第1または第2の鎖が、17〜80ヌクレオチド長である、請求項1から12のいずれか1項に記載のアダプター。
  14. 前記第1の鎖および前記第2の鎖が、15〜30bp長である二重鎖を形成する、請求項1から13のいずれか1項に記載のアダプター。
  15. 前記二重鎖が、前記第2の鎖の3’末端または前記第1の鎖の5’末端において、平滑末端または付着末端を有する、請求項14に記載のアダプター。
  16. 前記第1または第2の配列における前記1または複数の改変の結果、前記二重鎖において1または複数の未対合のヌクレオチドが生じる、請求項14または15に記載のアダプター。
  17. 前記第1または第2の鎖が、2−アミノプリン、2,6−ジアミノプリン、5−ブロモdU、デオキシウリジン、逆方向dT、逆方向ジデオキシ−T、ジデオキシ−C、5−メチルdC、デオキシイノシン、5−ニトロインドールを含むユニバーサル塩基、2’−O−メチルRNA塩基、イソ−dC、イソ−dG、リボヌクレオチド、モルホリノ、タンパク質ヌクレオチドアナログ、グリコイックヌクレオチドアナログ、ロックトヌクレオチドアナログ、トレオースヌクレオチドアナログ、鎖終結ヌクレオチドアナログ、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシンおよびウィオシンからなる群から選択される少なくとも1つの改変されたヌクレオチドを含む、請求項1から16のいずれか1項に記載のアダプター。
  18. 前記第1または第2の鎖における少なくとも1つのヌクレオチドが、リン酸化されている、請求項1から17のいずれか1項に記載のアダプター。
  19. 前記第1または第2の鎖における少なくとも1つのヌクレオチドが、改変された糖、非天然の結合、脱塩基部位、ジデオキシ塩基、5−メチル塩基およびスペーサーからなる群から選択される1または複数を含む、請求項1から18のいずれか1項に記載のアダプター。
  20. 前記第1または第2の鎖における少なくとも1つのヌクレオチドが、リボヌクレオチドである、請求項1から19のいずれか1項に記載のアダプター。
  21. 前記トランスポザーゼが、「カットアンドペースト」トランスポザーゼである、請求項1から20のいずれか1項に記載のアダプター。
  22. 前記トランスポザーゼが、ビブリオ・ハーベイトランスポザーゼまたは高活性Tn5トランスポザーゼである、請求項1から21のいずれか1項に記載のアダプター。
  23. 前記ネイティブ認識配列が、1位においてCを有する、請求項1から22のいずれか1項に記載のアダプター。
  24. 前記ネイティブ認識配列が、図1に示されるネイティブ認識配列(配列番号1〜21)から選択される、請求項1から23のいずれか1項に記載のアダプター。
  25. 前記第2の鎖が、前記第2の配列に対して5’側にタグ配列をさらに含むか、または前記第1の鎖が、前記第1の配列に対して3’側にタグ配列をさらに含む、請求項1から24のいずれか1項に記載のアダプター。
  26. 前記タグ配列が縮重塩基領域を含む、請求項25に記載のアダプター。
  27. 単離された合成核酸アダプターのセットであって、
    (i)請求項1から26のいずれか1項に記載の第1の単離された合成核酸アダプターと、
    (ii)請求項1から26のいずれか1項に記載の第2の単離された合成核酸アダプターと
    を含み、前記第1のアダプターおよび前記第2のアダプターは、ネイティブ認識配列またはその相補体と比較して、少なくとも1つの異なる改変を有する、単離された合成核酸アダプターのセット。
  28. 1または複数のトランスポザーゼ分子と、請求項1から26のいずれか1項に記載の1または複数のアダプターとを含む、トランスポザーゼ複合体。
  29. 標的DNA分子を断片化するためのin vitroの方法であって、
    標的DNA分子を請求項28に記載のトランスポザーゼ複合体と接触させて、反応混合物を形成するステップと、
    転位反応を実施するための条件下で前記反応混合物をインキュベートするステップと
    を含む、方法。
  30. 前記標的DNA分子が、1〜10細胞からなるサンプルから得られる、請求項29に記載の方法。
  31. 前記標的DNA分子が、1〜3細胞からなるサンプルから得られる、請求項30に記載の方法。
  32. 標的DNA分子の配列決定またはマイクロアレイ分析のためにアッセイサンプルを調製するための方法であって、
    標的DNA分子を、請求項1から26のいずれか1項に記載の単離された合成核酸アダプターおよび前記アダプターに結合するトランスポザーゼを有する複合体と接触させて、反応混合物を形成するステップと、
    転位反応を実施するための条件下で前記反応混合物をインキュベートして、切断されたDNA産物を生成するステップと、
    前記切断されたDNA産物を増幅するステップと
    を含む、方法。
  33. 前記増幅するステップが、前記反応混合物から、前記アダプターを事前に除去することなく、または前記切断されたDNA産物を分離することなく実施される、請求項32に記載の方法。
  34. マイクロアレイのためのDNAサンプル調製の方法であって、
    サンプルDNA分子を、請求項1から26のいずれか1項に記載の単離された合成核酸アダプターおよび前記アダプターに結合するトランスポザーゼを有する複合体と接触させて、反応混合物を形成するステップと、
    転位反応を実施するための条件下で前記反応混合物をインキュベートして、前記サンプルDNA分子のDNA断片を生成するステップと
    を含み、前記アダプターは、オリゴヌクレオチドタグを含み、前記DNA断片は、前記オリゴヌクレオチドタグで両方の末端においてタグ化されている、方法。
  35. 前記オリゴヌクレオチドタグに対して相補的なプライマーを使用して前記DNA断片を増幅するステップをさらに含む、請求項34に記載の方法。
  36. 前記タグが、前記タグに対して相補的なプライマーの着地部位として使用される、請求項34に記載の方法。
  37. 前記1または複数のプライマーが、フルオロフォアで標識化された少なくとも1つのdNTPを含むdNTP混合物を使用するポリメラーゼ反応において伸長される、請求項35または36に記載の方法。
JP2016552415A 2013-11-07 2014-09-05 Dna操作のための複数のトランスポザーゼアダプター Active JP6626830B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361901037P 2013-11-07 2013-11-07
US61/901,037 2013-11-07
US201462013833P 2014-06-18 2014-06-18
US62/013,833 2014-06-18
PCT/US2014/054218 WO2015069374A1 (en) 2013-11-07 2014-09-05 Plurality of transposase adapters for dna manipulations

Publications (2)

Publication Number Publication Date
JP2016534757A JP2016534757A (ja) 2016-11-10
JP6626830B2 true JP6626830B2 (ja) 2019-12-25

Family

ID=53041926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016552415A Active JP6626830B2 (ja) 2013-11-07 2014-09-05 Dna操作のための複数のトランスポザーゼアダプター

Country Status (5)

Country Link
US (2) US10287622B2 (ja)
EP (1) EP3066114B1 (ja)
JP (1) JP6626830B2 (ja)
CN (1) CN105705515B (ja)
WO (1) WO2015069374A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014210223A1 (en) 2013-06-25 2014-12-31 Prognosys Biosciences, Inc. Spatially encoded biological assays using a microfluidic device
WO2015113725A1 (en) * 2014-02-03 2015-08-06 Thermo Fisher Scientific Baltics Uab Method for controlled dna fragmentation
US11136576B2 (en) 2014-02-03 2021-10-05 Thermo Fisher Scientific Baltics Uab Method for controlled DNA fragmentation
WO2015179706A1 (en) * 2014-05-23 2015-11-26 Fluidigm Corporation Haploidome determination by digitized transposons
CN107532207B (zh) 2015-04-10 2021-05-07 空间转录公司 生物样本的空间区别、多重核酸分析
WO2017123758A1 (en) * 2016-01-12 2017-07-20 Seqwell, Inc. Compositions and methods for sequencing nucleic acids
MX2018011429A (es) * 2016-03-25 2019-06-06 Karius Inc Añadiduras de ácidos nucleicos sintéticos.
US10240196B2 (en) 2016-05-27 2019-03-26 Agilent Technologies, Inc. Transposase-random priming DNA sample preparation
CN108265101A (zh) * 2016-12-30 2018-07-10 天津强微特生物科技有限公司 一种快速稳定的Tn5转座酶酶活测定方法
CN106801044B (zh) * 2017-01-09 2021-03-23 北京全式金生物技术有限公司 一种环状转座子复合物及其应用
WO2018195224A1 (en) * 2017-04-18 2018-10-25 Fred Hutchinson Cancer Research Center Barcoded transposases to increase efficiency of high-accuracy genetic sequencing
EP3615671B1 (en) 2017-04-23 2021-07-21 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
EP3615692A1 (en) 2017-04-23 2020-03-04 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
AU2018260627A1 (en) * 2017-04-23 2019-11-14 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
US10934584B2 (en) 2017-04-23 2021-03-02 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries
US20210163927A1 (en) * 2018-06-15 2021-06-03 Roche Sequencing Solutions, Inc. Generation of double-stranded dna templates for single molecule sequencing
WO2020123319A2 (en) 2018-12-10 2020-06-18 10X Genomics, Inc. Methods of using master / copy arrays for spatial detection
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
EP3976820A1 (en) 2019-05-30 2022-04-06 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
WO2021092433A2 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Enhancing specificity of analyte binding
SG11202106899SA (en) 2019-12-23 2021-09-29 10X Genomics Inc Methods for spatial analysis using rna-templated ligation
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
EP4242325A3 (en) 2020-04-22 2023-10-04 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021252499A1 (en) 2020-06-08 2021-12-16 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
CN116034166A (zh) 2020-06-25 2023-04-28 10X基因组学有限公司 Dna甲基化的空间分析
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
AU2021409136A1 (en) 2020-12-21 2023-06-29 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
EP4284942A1 (en) 2021-01-29 2023-12-06 10X Genomics, Inc. Method for transposase mediated spatial tagging and analyzing genomic dna in a biological sample
EP4314279A1 (en) * 2021-03-29 2024-02-07 Illumina, Inc. Improved methods of library preparation
EP4334442A1 (en) * 2021-05-03 2024-03-13 European Molecular Biology Laboratory Methods for isolating and/or obtaining captured polynucleotide fragments
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
CN114250266A (zh) * 2021-12-20 2022-03-29 南京诺唯赞生物科技股份有限公司 一种转座酶活性测定方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
US20030143740A1 (en) * 2001-10-15 2003-07-31 Christine Wooddell Processes for transposase mediated integration into mammalian cells
AU2003231048A1 (en) 2002-04-22 2003-11-03 Regents Of The University Of Minnesota Transposon system and methods of use
US20040172667A1 (en) 2002-06-26 2004-09-02 Cooper Richard K. Administration of transposon-based vectors to reproductive organs
DE10322662A1 (de) * 2002-11-06 2004-10-07 Grünenthal GmbH Wirksame und stabile DNA-Enzyme
EP1924704B1 (en) 2005-08-02 2011-05-25 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
US20070172839A1 (en) 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
US7659069B2 (en) 2007-08-31 2010-02-09 Agilent Technologies, Inc. Binary signaling assay using a split-polymerase
AU2009205523A1 (en) * 2008-01-14 2009-07-23 Applied Biosystems, Llc Compositions, methods, and kits for detecting ribonucleic acid
DK2376517T3 (da) 2008-10-24 2013-02-11 Epict Technologies Corp Transposon-ende-sammensætninger og fremgangsmåder til at modificere nukleinsyrer
ES2595433T3 (es) 2010-09-21 2016-12-30 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
EP2635679B1 (en) * 2010-11-05 2017-04-19 Illumina, Inc. Linking sequence reads using paired code tags
AU2012211081B2 (en) * 2011-01-28 2016-02-04 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
US9005935B2 (en) * 2011-05-23 2015-04-14 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
US20130017978A1 (en) * 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
US9145623B2 (en) 2011-07-20 2015-09-29 Thermo Fisher Scientific Oy Transposon nucleic acids comprising a calibration sequence for DNA sequencing
WO2015113725A1 (en) * 2014-02-03 2015-08-06 Thermo Fisher Scientific Baltics Uab Method for controlled dna fragmentation

Also Published As

Publication number Publication date
EP3066114A4 (en) 2017-10-11
JP2016534757A (ja) 2016-11-10
US10287622B2 (en) 2019-05-14
CN105705515A (zh) 2016-06-22
WO2015069374A1 (en) 2015-05-14
US20190284613A1 (en) 2019-09-19
EP3066114A1 (en) 2016-09-14
US20160289737A1 (en) 2016-10-06
CN105705515B (zh) 2021-05-25
EP3066114B1 (en) 2019-11-13

Similar Documents

Publication Publication Date Title
JP6626830B2 (ja) Dna操作のための複数のトランスポザーゼアダプター
US20200325471A1 (en) Compositions and methods for detecting nucleic acid regions
US11434526B2 (en) Enhanced nucleic acid identification and detection
JP6982087B2 (ja) 競合的鎖置換を利用する次世代シーケンシング(ngs)ライブラリーの構築
Van Dijk et al. Library preparation methods for next-generation sequencing: tone down the bias
CA2936564C (en) Methods for generating double stranded dna libraries and sequencing methods for the identification of methylated cytosines
CN115927563A (zh) 用于分析修饰的核苷酸的组合物和方法
JP6925424B2 (ja) 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법
US20130123117A1 (en) Capture probe and assay for analysis of fragmented nucleic acids
KR20210114918A (ko) 복합체 표면-결합 트랜스포좀 복합체
CN110914418A (zh) 用于对核酸进行测序的组合物和方法
JP6876785B2 (ja) 単分子配列決定のための一本鎖環状dnaライブラリーを生成するための方法
US20230095295A1 (en) Phi29 mutants and use thereof
WO2023116373A1 (zh) 一种生成标记的核酸分子群的方法及其试剂盒
WO2022256228A1 (en) Method for producing a population of symmetrically barcoded transposomes
WO2022251510A2 (en) Oligo-modified nucleotide analogues for nucleic acid preparation
JP2024511760A (ja) エラー補正のための固有分子識別子を有するトランスポゾンベースの技術を使用した指向性タグメンテーション配列決定ライブラリーの調製方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190924

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20191001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191202

R150 Certificate of patent or registration of utility model

Ref document number: 6626830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250