JP2022537069A - 次世代配列決定ライブラリを調製するための核酸の標識化に有用なオリゴヌクレオチドが連結された三リン酸ヌクレオチド - Google Patents

次世代配列決定ライブラリを調製するための核酸の標識化に有用なオリゴヌクレオチドが連結された三リン酸ヌクレオチド Download PDF

Info

Publication number
JP2022537069A
JP2022537069A JP2021576459A JP2021576459A JP2022537069A JP 2022537069 A JP2022537069 A JP 2022537069A JP 2021576459 A JP2021576459 A JP 2021576459A JP 2021576459 A JP2021576459 A JP 2021576459A JP 2022537069 A JP2022537069 A JP 2022537069A
Authority
JP
Japan
Prior art keywords
oligonucleotide
polymerase
ligated
nucleic acid
oligonucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021576459A
Other languages
English (en)
Inventor
アルヴィダス ルビース
インガ チコティエン
ザナ カプスティナ
アルトゥラス ベレズニアコヴァス
ジュスティナ メッジゥン
シモナ ゼイミテ
マーク アンダーセン
マイケル アレン
シホン チェン
Original Assignee
サーモ フィッシャー サイエンティフィック バルティックス ユーエービー
ライフ テクノロジーズ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サーモ フィッシャー サイエンティフィック バルティックス ユーエービー, ライフ テクノロジーズ コーポレーション filed Critical サーモ フィッシャー サイエンティフィック バルティックス ユーエービー
Publication of JP2022537069A publication Critical patent/JP2022537069A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3517Marker; Tag

Abstract

本開示は、オリゴヌクレオチドが連結されたヌクレオチド、それらを作製する方法、およびそれらを使用する方法を記載している。オリゴヌクレオチドが連結されたヌクレオチドは、いくつかの実施形態において、約3~約100ヌクレオチドの長さのオリゴヌクレオチドに連結されたヌクレオチドを含む。これらのオリゴヌクレオチドが連結されたヌクレオチドは、いくつかの実施形態においてバーコードとして機能することができる既知のオリゴヌクレオチドで、複数の異なる状況において複数の異なる種類の核酸を標識化するために使用され得る。得られたオリゴヌクレオチドで標識化された核酸オリゴヌクレオチドは、様々な核酸配列決定法において使用され得る。

Description

関連出願の相互参照
本出願は、2019年6月21日に出願され、「Tethered Oligos and Uses Thereof」と題された米国仮出願第62/864,589号、および2020年5月29日に出願され、「Tethered Oligos and Uses Thereof」と題された米国仮出願第63/032,297号の優先権の利益を主張する。
配列表
本出願は、ASCII形式で電子的に提出された配列表を含み、参照によりその全体が本明細書に組み込まれる。2020年6月22日に作成された該ASCIIのコピーは、LT01475PCT_SL_EA.txtという名称であり、14,318バイトのサイズである。
本開示は、オリゴヌクレオチドが連結されたヌクレオチドおよびそれを使用する核酸タグ付けの方法に関する。本開示はさらに、次世代配列決定、特に、ただしこれらに限定されないが、次世代配列決定ライブラリを調製するための組成物、方法、およびキットに関する。
DNA分子を操作および改変する能力は、現代の分子生物学の基礎を形成する。次世代配列決定(NGS)の台頭は、特に単一細胞レベルで適用された場合、DNA改変および合成ツールキットの新たなニーズを開いた。最大の核酸改変効率、最小のバイアス、自動化の容易さ、および小型化は、現在の方法が適切に対処していない重要なニーズの例である。
核酸ライブラリの調製は、次世代配列決定ワークフローにおける重要なステップである。これには、プラットフォーム特異的アダプターのライゲーションが含まれ、それは、種々のベンダー間で10倍以上変化するが、一部のライゲーションの効率が非常に低いため、元のライブラリの複雑さが損なわれ、配列決定結果が低下する可能性がある。微量または個々のDNA分子でさえ配列決定は可能であるが、これには現在、前増幅技術が必要である。等温条件下でプロセッシブDNAポリメラーゼによって実行される多置換反応(MDA)は、高いゲノムカバレッジを提供するが、配列依存のバイアスをもたらし、特定のゲノム領域において過剰増幅を引き起こし、他の領域において増幅不足を引き起こす。単一細胞または超低入力RNA配列決定ライブラリの調製の場合にしばしば行われるcDNAの前増幅は、特定の配列のドロップアウトを引き起こすか、または他の方法においてトランスクリプトームの元の組成を歪める可能性がある。これは、ゲノムおよび単一細胞のDNAおよびRNA配列決定における課題を克服するための新しいアプローチの必要性を示している。
典型的なNGSライブラリの調製ワークフローは、DNAまたはcDNA試料のランダムな断片化、それに続く5’および3’アダプターライゲーションを含む。通常、断片化およびアダプターの追加は別々のステップとして実行される。次いで、アダプターをライゲーションした断片をPCRで増幅し、精製する。ライブラリ増幅ステップでは、高度に複雑な分子の集団のバイアスのない複製が必要である。非常に忠実度の高い増幅により、誤った遺伝子バリアントの呼び出しを引き起こす可能性のあるPCRエラーが制限される。あるいは、「タグ付け」は、断片化およびライゲーション反応を単一のステップに組み合わせて、ライブラリの調製プロセスを簡素化する。または、トランスポゾンでアダプターを追加することもできる。
本開示は、上記の問題のうちの1つ以上に対処し、次世代配列決定プラットフォームのための核酸ライブラリを調製するためのさらに改善された方法を提供するために提供される。
本開示は、次世代配列決定のためのライブラリを調製するための改善された核酸標識技術および方法を提供する。
したがって、いくつかの実施形態は、核酸にオリゴヌクレオチドをタグ付けするための方法を提供し、この方法は、a.タグ付けされる核酸を提供するステップ、b.核酸をポリメラーゼおよび少なくとも1つの式(A)のオリゴヌクレオチドが連結されたヌクレオチド
Figure 2022537069000001
またはその塩と接触させるステップを含み、式中、
NBは、核酸塩基であり、
オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、
XおよびQの各々は、独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、
ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、
CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキレン、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択され、それによって第1のタグ付けされた核酸を産生する。
いくつかの実施形態において、接触は、核酸を少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチド、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、およびポリメラーゼと接触させることを含み得る。
いくつかの実施形態において、方法は、プライマーを核酸にアニーリングするステップをさらに含む。
いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドは、ジデオキシヌクレオチドであり、任意選択で、ジデオキシヌクレオチドは、ジデオキシアデノシン三リン酸、ジデオキシグアノシン三リン酸、ジデオキシチミジン三リン酸、ジデオキシウリジン三リン酸、ジデオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される。
いくつかの実施形態において、方法は、以下のさらなるステップを含む。第1のタグ付けされた核酸鎖を産生した後、連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるプライマーをアニーリングするステップ、第1のタグ付けされた核酸鎖およびアニーリングされたプライマーを、核酸ポリメラーゼおよび少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させるステップ、ならびにポリメラーゼで、連結されたオリゴヌクレオチドにアニーリングされたプライマーの3’ヒドロキシルから伸長し、第2の核酸鎖を形成するステップ。
いくつかの実施形態において、方法は、以下のさらなるステップを含む。第1のタグ付けされた核酸鎖を産生した後、連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるスプリントオリゴヌクレオチドをアニーリングするステップ、第1のタグ付けされた核酸鎖およびアニーリングされたスプリントオリゴヌクレオチドを、核酸ポリメラーゼおよび少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させるステップ、ならびにポリメラーゼで、連結されたオリゴヌクレオチドの3’ヒドロキシルからスプリントオリゴヌクレオチドを横断して伸長するステップ。
1つ以上の核酸を含む試料から核酸のライブラリを生成するための方法も提供される。適宜に、いくつかの実施形態は、1つ以上の核酸を含む試料から核酸のライブラリを生成するための方法を提供し、任意選択で、試料は、複数の細胞を含む。方法は、1つ以上の核酸に少なくとも部分的に相補的である第1のプライマーをアニーリングするステップ、1つ以上の核酸を、核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させ、それらの3’末端で、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の核酸鎖を形成するステップ、連結されたオリゴヌクレオチドに少なくとも部分的に相補的である第2のプライマーをアニーリングするステップ、ならびにポリメラーゼで、連結されたオリゴヌクレオチドにアニーリングされた第2のプライマーの3’ヒドロキシルから伸長し、それによって核酸のライブラリを産生するステップを含み得る。
いくつかの実施形態は、1つ以上の核酸を含む試料から核酸のライブラリを生成するための方法を提供し、任意選択で、試料は、複数の細胞または細胞核を含み、この方法は、1つ以上の核酸に少なくとも部分的に相補的である第1のプライマーをアニーリングするステップ、1つ以上の核酸を、第1の核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させ、3’末端で、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の第1の伸長産物を形成するステップ、第1の伸長産物の連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるスプリントオリゴヌクレオチドをアニーリングするステップ、ならびに第1の伸長産物を核酸ポリメラーゼおよび1つ以上のヌクレオチドと接触させ、ポリメラーゼで、連結されたオリゴヌクレオチドの3’ヒドロキシルからアニーリングされたスプリントを横断して伸長し、第2の伸長産物を産生し、それによって核酸のライブラリを産生するステップを含む。
いくつかの実施形態において、核酸のライブラリは、二本鎖核酸のライブラリである。
いくつかの実施形態において、核酸のライブラリは、5’末端にユニバーサルハンドルを含む第1の伸長産物のライブラリであり、第1の伸長産物は、3’末端にユニバーサルハンドルを追加するように含むか、またはさらに操作され、ユニバーサルハンドルは増幅プライマーのアニーリングを可能にする。
いくつかの実施形態において、試料中の1つ以上の核酸は、オリゴヌクレオチドが連結された結合剤(OTBA)のオリゴヌクレオチドを含む。いくつかの実施形態において、OTBAの連結されたオリゴヌクレオチドは、細胞マーカー結合剤インデックスを含み、OTBAの結合剤は、アプタマーもしくは抗体またはそれらの機能的断片を含む。
試料をスプリントオリゴヌクレオチドと接触させ、試料は1つ超の細胞または細胞核を含むいくつかの実施形態において、細胞または細胞核の亜集団は、1つ以上の細胞マーカーを含み得る。
試料は、第1のプライマーを1つ以上の核酸にアニーリングするステップの前に2つ以上の第1の部分に分割し得、各第1の部分は、元の試料の細胞または細胞核の亜集団を含む。第1のプライマーは、第1のユニバーサルハンドル配列および第1のバーコードを含み、該第1のバーコードは、各第1の部分における第1のプライマー間で共通であるが、他の第1の部分における第1のプライマーにおいて存在する第1のバーコードとは異なり、オリゴヌクレオチドが連結されたジデオキシヌクレオチドのオリゴヌクレオチドは、第2のユニバーサルハンドル配列を含む。方法はまた、スプリントオリゴヌクレオチドをアニーリングする前に、以下のさらなるステップを実行することを含み得る。第1の核酸伸長産物の形成後に第1の部分を混ぜ合わせるステップ、および混ぜ合わされた第1の部分を2つ以上の第2の部分に分割するステップ、第2の部分は、スプリントオリゴヌクレオチドを含み、スプリントオリゴヌクレオチドは、連結されたオリゴヌクレオチド上の第2のユニバーサルハンドルにアニーリングするオリゴヌクレオチド配列、各第2の部分の第2のバーコードは共通であるが、他の第2の部分の第2のバーコードとは異なる、第2のバーコードについての鋳型配列、および第3のユニバーサルハンドルの鋳型配列を含む。したがって、第1の伸長産物の3’末端に、第2のバーコードおよび第3のユニバーサルハンドルを含む、第2の伸長産物を含む核酸のライブラリが生成される。
いくつかの実施形態において、方法は、以下のさらなるステップを含み得る。第2の部分を混ぜ合わせるステップ、混ぜ合わされた第2の部分を2つ以上の第3の部分に分割するステップ、各第3の部分を増幅プライマーと接触させるステップ、増幅プライマーは、第1のユニバーサルハンドルおよび第3のユニバーサルハンドルにハイブリダイゼーションし、そこから伸長し、第2の伸長産物を増幅することができる。増幅プライマーは、任意選択で、それぞれ第3および/または第4のバーコード、ならびにそれぞれ第1および/または第2のアダプター配列を含む。増幅産物の第1、第2、および第3のバーコード配列(またはその相補体)の組み合わせは、単一の細胞または核に由来する増幅産物に特有である。
核酸にタグを付けるための方法および/または1つ以上の核酸を含む試料から核酸ライブラリを生成する方法のいくつかの実施形態において、プライマー、連結されたオリゴヌクレオチド、またはそれらの両方は、ランダム配列、標的特異的配列またはそれらの両方を含む。
核酸にタグを付けるための方法および/または1つ以上の核酸を含む試料から核酸ライブラリを生成する方法のいくつかの実施形態において、プライマー、連結されたオリゴヌクレオチド、またはスプリントオリゴヌクレオチドのうちの1つ以上は、ユニバーサルハンドル、ユニバーサル配列、特有の分子同定子、アダプター配列、プロモーター配列、バーコード配列、インデックス配列、またはそれらの任意の組み合わせを含む。
核酸にタグを付けるための方法および/または1つ以上の核酸を含む試料から核酸ライブラリを生成する方法のいくつかの実施形態において、ポリメラーゼは、DNA依存性DNAポリメラーゼ、RNA依存性DNAポリメラーゼ、鋳型非依存性DNAポリメラーゼ、DNA依存性RNAポリメラーゼ、RNA依存性RNAポリメラーゼ、または鋳型非依存性RNAポリメラーゼである。
核酸にタグを付けるための方法および/または1つ以上の核酸を含む試料から核酸ライブラリを生成する方法のいくつかの実施形態において、核酸は、DNAまたはRNAである。
また、本明細書で提供されるのは、式
(A):
Figure 2022537069000002
のオリゴヌクレオチドが連結されたヌクレオチドまたはその塩であり、
式中、NBは、核酸塩基であり、
オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、
XおよびQの各々は、独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、
ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、
CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキレン、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択される。
いくつかの実施形態において、CXNはクリックであり、クリックは、以下の対の官能基のうちの1つの間のクリック反応の産物である。
i)アルキニルおよびアジド、
ii)チオールおよびアルキニル、
iii)チオールおよびアルケニル、
iv)アジドおよびシクロオクタニル、ならびに
v)シクロオクタニルおよびニトロン。
核酸ライブラリの調製における、または核酸のタグ付けにおける使用のための、本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドの使用も本明細書で提供される。
いくつかの実施形態において、本明細書で使用されるオリゴヌクレオチドが連結されたヌクレオチドは、概して、式(A)による構造、またはその塩を有する。
Figure 2022537069000003
式中、NBは、核酸塩基であり、オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、XおよびQの各々は独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキレン、アルケニレン、アルキニレン、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキル、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択される。
いくつかの実施形態において、式(A)の化合物の塩は、四級アンモニウム塩である。
いくつかの実施形態において、Xは、H、OH、F、N3、およびアミノから選択される。他の実施形態において、Xは、H、N3、およびOHから選択される。いくつかの実施形態において、Xは、OHである。他の実施形態において、Xは、Hである。
いくつかの実施形態において、Qは、H、OH、F、Cl、Br、I、N3である。他の実施形態において、Qは、Hである。
いくつかの実施形態において、オリゴは、
Figure 2022537069000004
から選択され、式中、オリゴ*はオリゴ基由来の残りの2~99ヌクレオチドであり、NB2は、核酸塩基である。
いくつかの実施形態において、CXNは、各々が1~3個のヘテロ原子を有する5員複素環および6員複素環から選択される。いくつかの実施形態において、CXNは、ピロロ、チオフェニル、フラニル、ピロリジニル、チオラニル、テトラヒドロフラニル、イソキサゾリル、オキサゾロ、ピラゾロ、イミダゾリル、イソチアゾロ、チアゾリル、トリアゾロ、オキサジアゾロ、チアジアゾロ、ピラニル、チオピラニル、ピリジニル、テトラヒドロピラニル、テトラヒドロチオピラニル、ピペリジニル、ピリダジニル、ピリミジニル、ピラジニル、ヘキサヒドロピリダジニル、ヘキサヒドロピリミジニル、ピペラジニル、ジオキサニル、モルフォリノ、チアジニル、オキサジノ、ジチアニル、トリアジニル、ジチアジノ、チアジアジノ、トリアジナニル、およびオキサチアジノから選択される。
他の実施形態において、CXNは、クリックであり、クリックは、クリック反応の産物である。いくつかの実施形態において、クリックは、以下の対の官能基のうちの1つの間のクリック反応の産物である。i)アルキニルおよびアジド、ii)チオールおよびアルキニル、iii)チオールおよびアルケニル、iv)アジドおよびシクロオクタニル、ならびにv)シクロオクタニルおよびニトロン
いくつかの実施形態において、CXNは
Figure 2022537069000005
である。
いくつかの実施形態において、ZおよびYは、各々、リンカーまたは連結部分であり、これは、ddNTPまたはdNTPとオリゴヌクレオチドとの間の全体的な連結を所望の特性で提供するように変化し得る特定の官能基を指す。
いくつかの実施形態において、ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキレン、アルケニレン、アルキニレン、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択される。いくつかの実施形態において、各ZおよびYは、独立して、アミノ、アミド、アルキレン、アルケニレン、アルキニレン、エーテル、ケトン、カルボニル、無水物、エステル、イミド、またはそれらの任意の組み合わせから選択される。他の実施形態において、Yは、アルキレンまたはアルキニレンである。
他の実施形態において、Zは、アルキニレン、アルキレン、エーテル、およびアミドのうちの1つ以上の組み合わせである。さらに他の実施形態において、-NB-Z-の組み合わせは、
Figure 2022537069000006
であり、式中、L1は、アルキレン、アルケニレン、アルキニレン、およびポリアルキレングリコールから選択される。
いくつかの実施形態において、式(A)の化合物は、式(B1)~(B4)
Figure 2022537069000007
の化合物およびそれらの塩から選択され、式中、オリゴ*は、オリゴ基由来の残りの2~99ヌクレオチドであり、NB2は、核酸塩基であり、L1は、アルキレン、アルケニレン、アルキニレン、およびポリアルキレングリコールから選択され、L2は、アルキレンまたはアルキニレンである。
他の実施形態において、L1は、C1-C12アルキレン、C2-C12アルケニレン、C2-C12アルキニレン、および2~8グリコール単位を有するポリアルキレングリコールである。他の実施形態において、L1は、2グリコール単位を有するポリエチレングリコール(PEG2)、4グリコール単位を有するポリエチレングリコール(PEG4)、または6グリコール単位を有するポリエチレングリコール(PEG6)、メチレン、エチレン、n-プロピレン、イソプロピレン、1-ブチレン、シス-2-ブチレン、トランス-2-ブチレン、イソブチレン、1-ペンチレン、シス-2-ペンチレン、トランス-2-ペンチレン、イソペンチレン、およびヘキシレンから選択される。さらに他の実施形態において、L1は、-CH2-、-(CH23-、-(CH25-、PEG2、およびPEG4から選択される。
いくつかの実施形態において、連結基Yは、アルキレンまたはアルキニレンから選択されるL2の亜群を含む。他の実施形態において、L2は、C1-C12アルキレンまたはC1-C12アルキニレンである。他の実施形態において、L2-オリゴの組み合わせは、-(CH24-オリゴまたは-(CH24C≡C-オリゴから選択される。
いくつかの実施形態において、オリゴは、その5’-リン酸を介してdNTPまたはddNTPの核酸塩基へのいずれかでヌクレオチドに連結される。いくつかの実施形態において、オリゴは、核酸塩基(NB2)を介して連結される。
いくつかの実施形態において、NBおよびNB2は、独立して核酸塩基である。いくつかの実施形態において、核酸塩基は、アデニン、7-デアザ-アデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される。
いくつかの実施形態において、NBは、ピリミジンであり、ピリミジンは、核酸塩基の5位でオリゴヌクレオチドに連結される。他の実施形態において、NBは、プリンであり、プリンは、核酸塩基の7位でオリゴヌクレオチドに連結される。
いくつかの実施形態において、式(I)のオリゴヌクレオチドが連結されたヌクレオチドまたはその塩が提供される。
Figure 2022537069000008
式中、XはH、N3、またはOHであり、
NBは、アデニン、7-デアザ-アデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される核酸塩基を表し、
ZおよびYはリンカーであり、ZおよびYは、各々独立して、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、またはそれらの任意の組み合わせから選択される少なくとも1つの連結部位を含み、
クリックは、クリック反応の産物であり、
オリゴは、3~100ヌクレオチドの長さのオリゴヌクレオチドである。
いくつかの実施形態において、「クリック」は、以下の対の官能基のうちの1つの間のクリック反応の産物である。
i)アルキニルおよびアジド、
ii)アジドおよびアルキニル、
iii)チオールおよびアルキニル、
iv)アルキニルおよびチオール、
v)チオールおよびアルケニル、
vi)アルケニルおよびチオール、
vii)アジドおよびシクロオクタニル、
viii)シクロオクタニルおよびアジド、
xi)ニトロンおよびシクロオクタニル、ならびに
xii)シクロオクタニルおよびニトロン。
いくつかの実施形態において、式(II)のオリゴヌクレオチドが連結されたヌクレオチドまたはその塩が提供される。
Figure 2022537069000009
式中、Xは、H、OH、N3であり、
NBは、アデニン、7-デアザ-アデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される核酸塩基を表し、
ZおよびYはリンカーであり、ZおよびYは、各々独立して、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、またはそれらの任意の組み合わせから選択される少なくとも1つの連結部位を含み、
オリゴは、3~100ヌクレオチドの長さのオリゴヌクレオチドである。
式(I)または(II)のオリゴヌクレオチドが連結されたヌクレオチドのいくつかの実施形態において、Xは、OHである。他の実施形態において、Xは、Hである。
いくつかの実施形態において、アルキレンは、C1-C6、アルキレンである。いくつかの実施形態において、アルケニレンは、C2-C6アルケニレンである。
いくつかの実施形態において、アルキニレンは、C2-C6アルキニレンである。
いくつかの実施形態において、ポリアルキレングリコールは、2~8個のグリコール単位を有する。
いくつかの実施形態において、オリゴヌクレオチドは、その5’末端でヌクレオチドに連結されている。
いくつかの実施形態において、ZおよびYの一方は、トリアゾール環の1位に共有結合で結合し、ZおよびYの他方は、トリアゾール環の4位に共有結合で結合する。いくつかの実施形態において、Zは、トリアゾール環の1位に共有結合で結合し、Yは、トリアゾール環の1位に共有結合で結合する。他の実施形態において、Zは、トリアゾール環の4位に共有結合で結合し、Yは、トリアゾール環の1位に共有結合で結合する。
いくつかの実施形態において、式(III)のオリゴヌクレオチドが連結されたヌクレオチドまたはその塩が提供される。
Figure 2022537069000010
式中、
L1は、アルキレン、ポリアルキレングリコール、またはそれらの組み合わせを含むリンカーであり、
L2は、アルキニレンを含むリンカーである。
いくつかの実施形態において、L1は、2、4、または6個のアルケニレングリコール基を有するポリアルケニレングリコールを含む。いくつかの実施形態において、ポリアルケニレングリコールはポリエチレングリコールである。
いくつかの実施形態において、L1は、1~12個の炭素原子を有するアルキレンを含む。いくつかの実施形態において、アルキレンは、メチレン、エチレン、n-プロピレン、イソプロピレン、1-ブチレン、シス-2-ブチレン、トランス-2-ブチレン、イソブチレン、1-ペンチレン、シス-2-ペンチレン、トランス-2-ペンチレン、イソペンチレン、またはヘキシレンである。
いくつかの実施形態において、L2は、ヘキシニルである。
いくつかの実施形態において、核酸塩基は、ピリミジンであり、ピリミジンは、核酸塩基の5位でオリゴヌクレオチドに連結される。他の実施形態において、核酸塩基は、プリンであり、プリンは、核酸塩基の7位でオリゴヌクレオチドに連結される。
式(I)、(II)または(III)のオリゴヌクレオチドが連結されたヌクレオチドのいくつかの実施形態において、塩は、四級アンモニウム塩である。
いくつかの実施形態において、オリゴヌクレオチドは、バーコード配列、アダプター配列、特有の分子同定子、またはそれらの任意の組み合わせを含む。
いくつかの実施形態において、核酸にオリゴヌクレオチドをタグ付けするための方法が提供され、方法は、以下を含む。
タグ付けされる核酸を提供すること、
核酸を少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチドおよびポリメラーゼと接触させること、それによってタグ付けされた核酸を産生すること。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、核酸を少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチド、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、およびポリメラーゼと接触させることをさらに含む。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、プライマーを核酸にアニーリングすることをさらに含む。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、スプリントオリゴヌクレオチドをタグ付けされた核酸にアニーリングすることをさらに含む。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、核酸は、5’末端、3’末端、またはそれらの両方でタグ付けされる。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、核酸は複数の位置でタグ付けされる。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、核酸は、ニック翻訳またはギャップ充填反応中にオリゴヌクレオチドが連結されたヌクレオチドでタグ付けされる。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、例えばライゲーションまたは重合反応によって、アダプター配列を核酸の3’末端に付加することをさらに含む。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、1つ以上の配列(例えば、バーコード配列、ユニバーサル配列、特有の分子同定子配列、インデックス配列、プロモーター配列、配列、アダプター配列など)を、例えば、ライゲーションまたは重合反応により、オリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドの3’末端に付加することをさらに含む。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、タグ付けされた核酸をPCRに供することをさらに含む。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、タグ付けされた核酸を、タグ付けされた核酸の連結されたオリゴヌクレオチド上のユニバーサルハンドル配列に部分的に相補的なスプリントオリゴヌクレオチドと接触させ、ポリメラーゼで、スプリントオリゴヌクレオチドを横断して連結されたオリゴヌクレオチドの3’OHを介して伸長することをさらに含む。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、核酸は、DNAであり、他の実施形態において、核酸は、RNAである。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、ポリメラーゼは、A型DNAポリメラーゼ、B型DNAポリメラーゼ、X型DNAポリメラーゼ、または逆転写酵素である。他の実施形態において、ポリメラーゼは、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、HIV-1逆転写酵素、ポリAポリメラーゼ(PAP、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体である。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、ポリメラーゼは、TdTである。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、ヌクレオチドオリゴヌクレオチドが連結されたヌクレオチドは、デオキシヌクレオチドであり、任意選択で、デオキシヌクレオチドは、デオキシアデノシン三リン酸、デオキシグアノシン三リン酸、デオキシチミジン三リン酸、デオキシウリジン三リン酸、デオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、ヌクレオチドオリゴヌクレオチドが連結されたヌクレオチドは、ジデオキシヌクレオチドであり、任意選択で、ジデオキシヌクレオチドは、ジデオキシアデノシン三リン酸、ジデオキシグアノシン三リン酸、ジデオキシチミジン三リン酸、ジデオキシウリジン三リン酸、ジデオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法におけるオリゴヌクレオチドが連結されたヌクレオチドの濃度は、1fmol~10μmolの範囲である。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチド対対応する天然のヌクレオチド(すなわち、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、または連結されたオリゴヌクレオチドを欠くが、天然に存在し、連結されたオリゴヌクレオチドを有さない他の修飾されたヌクレオチドの両方を含むヌクレオチド)のモル比は、1:1~1:1000の範囲である。
本明細書に記載のヌクレオチドタグ付け反応のいくつかの実施形態において、方法は、少なくとも1つのクリーンアップステップを実行することをさらに含む。
いくつかの実施形態において、核酸にオリゴヌクレオチドをタグ付けするための方法が提供され、方法は、タグ付けされる核酸を提供すること、核酸を第1の末端デオキシヌクレオチジルトランスフェラーゼおよび少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチドと接触させること、それによって第1のタグ付けされた核酸鎖を産生することを含む。いくつかの実施形態において、方法は、第1のタグ付けされた核酸鎖を産生した後、連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるプライマーをアニーリングすること、第1のタグ付けされた核酸鎖およびアニーリングされたプライマーを核酸ポリメラーゼおよび少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させること、ならびにポリメラーゼで、連結されたオリゴヌクレオチドにアニーリングされたプライマー上の3’ヒドロキシルから伸長し、第2の核酸鎖を形成することをさらに含む。いくつかの実施形態において、方法は、任意選択で、第2の核酸鎖を形成した後にタグ付けされた核酸鎖をエキソヌクレアーゼと接触させることをさらに含み、第1の核酸鎖はエキソヌクレアーゼによって分解される。いくつかの例において、第1の核酸鎖が5’-リン酸を有する場合、第1の核酸鎖を分解するためにラムダエキソヌクレアーゼを使用し得る。
いくつかの実施形態において、1つ以上の核酸を含む試料から核酸のライブラリを生成するための第1の方法が提供され、方法は以下を含む。
a.1つ以上の核酸に少なくとも部分的に相補的である第1のプライマーをアニーリングすること、
b.1つ以上の核酸を、核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させ、それらの3’末端で、第1のオリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む1つ以上の第1の核酸鎖を形成すること、
c.連結されたオリゴヌクレオチドに少なくとも部分的に相補的である第2のプライマーをアニーリングすること、ならびに
d.ポリメラーゼで、連結されたオリゴヌクレオチドにアニーリングされた送信プライマーの3’ヒドロキシルから伸長し、それによって核酸のライブラリを産生すること。
いくつかの実施形態において、任意選択で、試料が複数の細胞または核を含む、1つ以上の核酸を含む試料から核酸のライブラリを生成するための第2の方法が提供され、方法は以下を含む。
a.1つ以上の核酸に少なくとも部分的に相補的である第1のプライマーをアニーリングすること、
b.第1の核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドを有する1つ以上の核酸を、3’末端で、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の第1の伸長産物へ接触させること、
c.第1の伸長産物の連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるスプリントオリゴヌクレオチドをアニーリングすること、ならびに
d.第1の伸長産物を第2の核酸ポリメラーゼと接触させ、ポリメラーゼで、連結されたオリゴヌクレオチドの3’ヒドロキシルからアニーリングされたスプリントオリゴヌクレオチドを横断して伸長し、それによって核酸のライブラリを産生して第2の伸長産物を産生し、それにより核酸のライブラリを産生する。
核酸のライブラリを生成するための第1または第2の方法のいくつかの態様において、1つ以上のポリヌクレオチドは、第1のプライマーのアニーリングの前に生成される複数のポリヌクレオチド断片を含む。
核酸のライブラリを生成するための第1の方法のいくつかの態様において、第2のアニーリングされたプライマーと核酸ポリメラーゼとの接触は、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドおよび第2のオリゴヌクレオチドが連結されたジデオキシヌクレオチドの存在下で行われ、第2の核酸鎖は、その3’末端でオリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む。核酸のライブラリを生成するための方法のいくつかの実施形態において、第1のオリゴヌクレオチドが連結されたジデオキシヌクレオチドにおける連結されたオリゴヌクレオチドと、第2のオリゴヌクレオチドが連結されたジデオキシヌクレオチドにおける連結されたオリゴヌクレオチドとは異なる。
核酸のライブラリを生成するための第2の方法のいくつかの態様において、試料中の1つ以上の核酸は、オリゴヌクレオチドが連結された結合剤(OTBA)のオリゴヌクレオチドである。いくつかの実施形態において、OTBAのオリゴヌクレオチドは、細胞マーカー結合剤インデックスを含み、OTBAの結合剤は、アプタマーもしくは抗体またはそれらの機能的断片を含む。いくつかの実施形態において、抗体は、機能的な抗体断片である。例えば、抗体断片は、F(ab’)2、Fab’、Fab、Fv、sFvなどの抗体の一部であり得る。抗体断片は、全長抗体によって認識される同じ抗原と結合し得る。抗体断片は、重鎖および軽鎖の可変領域からなる「Fv」断片、ならびに軽鎖および重鎖可変領域がペプチドリンカーによって接続されている組換え単鎖ポリペプチド分子(「scFvタンパク質」)など抗体の可変領域からなる単離された断片を含み得る。例示的な抗体には、癌細胞に対する抗体、ウイルスに対する抗体、細胞表面受容体(例えば、CD8、CD34、およびCD45)に結合する抗体、および治療用抗体が挙げられるが、これらに限定されない。本明細書で使用される場合、「インデックス」または「細胞マーカー結合剤インデックス」は、細胞マーカー結合剤を同定し、それに特異的であるオリゴヌクレオチド配列を指す(すなわち、各細胞マーカー結合剤に特有のユニバーサル配列である)。
核酸のライブラリを生成するための第2の方法のいくつかの態様において、1つ以上の核酸を含む試料は、1つ超の細胞または核を含み、細胞または細胞核(またはその亜集団)は、1つ以上の細胞マーカーを含み得る。いくつかの態様において、細胞マーカーは、試料中の細胞の一部によって発現される。いくつかの態様において、細胞マーカーは、細胞表面マーカーである。
核酸のライブラリを生成するための第2の方法のいくつかの態様において、試料は、試料の1つ以上の核酸に少なくとも部分的に相補的である第1のプライマーがアニーリングされる前に、元の試料の細胞または細胞核の亜集団を各々が含む2つ以上の第1の部分に分割される。第1のプライマーは、第1のユニバーサルハンドルおよび第1のバーコードを含み得、連結されたオリゴヌクレオチドは、第2のユニバーサルハンドルを含み得る。第1のバーコード配列は、各部分における第1のプライマー間で共通であるが、他の第1の部分における他の第1のプライマーの第1のバーコード配列とは異なり、該第1の部分を、アニーリングされた第1のプライマーの伸長が可能な条件下で接触させて、第1の核酸伸長産物を形成する。方法は、第1の核酸伸長産物の形成後に第1の部分を混ぜ合わせるさらなるステップ、および混ぜ合わされた第1の部分を2つ以上の第2の部分に分割するさらなるステップを含み得る。各第2の部分を、スプリントオリゴヌクレオチド、ポリメラーゼ、および1つ以上のヌクレオチド(例えば、dNTP)と接触させ得る。スプリントオリゴヌクレオチドは、(i)連結されたオリゴヌクレオチドの第2のユニバーサルハンドルにアニーリングするオリゴヌクレオチド配列、(ii)各第2の部分におけるスプリントオリゴヌクレオチドの第2のバーコードは共通であるが、他の第2の部分におけるスプリントオリゴヌクレオチドの第2のバーコードとは異なる、第2のバーコードの鋳型配列、および(iii)第3のユニバーサルハンドルについての鋳型配列を含み得る。ポリメラーゼは、スプリントオリゴヌクレオチドを横断して連結されたオリゴヌクレオチドの3’OHを伸長し、それによって5’から3’に向かって、第1のユニバーサルハンドル、第1のバーコード、試料核酸配列のコピー、第2のユニバーサルハンドル、第2のバーコード、および第3のユニバーサルハンドルを含む第2の核酸伸長産物を生成する。方法は、第2の部分を混ぜ合わせ、混ぜ合わされた第2の部分を2つ以上の第3の部分に分割するステップをさらに含み得る。
増幅産物を含む核酸のライブラリを生成するために、第3の部分を、第2の伸長産物の5’および3’末端の第1および第3のユニバーサル配列にハイブリダイゼーションする増幅プライマー、ポリメラーゼおよびヌクレオチド(例えば、dNTP)と接触させ得る。増幅プライマーは、例えば、配列決定アダプター、または任意の他の所望の配列を含み得る。増幅産物の第1、第2、および第3のバーコード配列(またはその相補体)の組み合わせは、単一細胞の試料核酸に由来する増幅産物に特有である。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、オリゴヌクレオチドが連結されたヌクレオチドは、式(A)、(I)、(II)または(III)のうちのいずれか1つを有するオリゴヌクレオチドが連結されたヌクレオチドである。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、プライマー、連結されたオリゴヌクレオチド、またはそれらの両方が、ランダム配列、標的特異的配列、またはそれらの両方を含む。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、プライマー、連結されたオリゴヌクレオチド、またはスプリントオリゴヌクレオチドは、ユニバーサルハンドル、ユニバーサル配列、特有の分子同定子、アダプター配列、プロモーター配列、バーコード配列、インデックス配列、またはそれらの任意の組み合わせを含む。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、オリゴヌクレオチドが連結されたヌクレオチドもしくはスプリントオリゴヌクレオチド、またはそれらの両方が、親和性タグをさらに含む。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、ポリメラーゼは、A型DNAポリメラーゼ、B型DNAポリメラーゼ、X型DNAポリメラーゼ、または逆転写酵素である。B型ポリメラーゼの例としては、Deep Ventポリメラーゼ、およびP.furiosus、P.calidifontis、P.aerophilum、T.kodakarensis、T.gorgonarius、およびThermococcus sp.9°N-7のファミリーBポリメラーゼなどのPyrococcus属およびThermococcus属のものが挙げられる。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、ポリメラーゼは、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、HIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体から選択される。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、ヌクレオチドは、デオキシアデノシン三リン酸、ジデオキシアデノシン三リン酸、デオキシグアノシン三リン酸、ジデオキシグアノシン三リン酸、デオキシチミジン三リン酸、ジデオキシチミジン三リン酸、デオキシシチジン三リン酸、ジデオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、方法は、ライブラリを増幅することをさらに含む。
本明細書に記載の核酸のライブラリを生成する第1および第2の方法のいくつかの態様において、および本明細書に記載の核酸にタグ付けする方法のいくつかの実施形態において、ステップ(a)におけるオリゴヌクレオチドが連結されたヌクレオチドの濃度は、1fmol~10μmolの範囲である。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチド対対応する天然のヌクレオチドのモル比は、1:1~1:1000の範囲である。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、方法は、少なくとも1つのクリーンアップステップを実行することをさらに含む。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、核酸は、DNA、例えば、ゲノムDNAなどである。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、核酸は、RNAである。いくつかの実施形態において、方法は、RNAを逆転写して対応するcDNAを産生することをさらに含む。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、方法は、第1のプライマーをアニーリングする前および/または試料を分割する前に、細胞を固定および透過性にすることをさらに含む。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、方法は、1つ以上の伸長産物を生成した後に細胞を溶解することをさらに含む。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、第1の核酸伸長産物を生成した後、第1の部分または混ぜ合わされた第1の部分をブロッキングオリゴヌクレオチドと接触させ、ブロッキングオリゴヌクレオチドは、第1の伸長プライマーの細胞の核酸へのハイブリダイゼーションを防止する。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、方法は、第2の核酸伸長産物を生成した後、第3の部分を第2の伸長プライマーと接触させる前に、スプリントオリゴヌクレオチドを除去するステップをさらに含む。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、スプリントオリゴヌクレオチドは、結合部位を含み、方法は、第2の部分または混ぜ合わされた第2の部分を、同種の結合部位を含むスプリントオリゴヌクレオチドの結合および除去を促進する捕捉部位を含む化合物と接触させるステップを含む。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、結合部位および同種の捕捉部位は、ストレプトアビジンおよびビオチン、マルトースおよびマルトース結合タンパク質、グルタチオンおよびグルタチオンS-トランスフェラーゼ、キチンおよびキチン結合タンパク質、またはアプタマーおよびその抗原の結合対から選択される結合対である。
本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、捕捉部位は、固体支持体上に固定化される。本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、固体支持体は、ビーズを含む。本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、ビーズは、磁性または常磁性のビーズである。本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、第1の伸長プライマーは、伸長条件下で目的のmRNAにハイブリダイゼーションすることができる配列を含む。本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、第1の伸長プライマーは、3’末端にポリ(T)を含む。本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、第1の伸長プライマーは、3’末端にランダムヘキサマー配列を含む。本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、第1の部分を、伸長プライマーの混合物と接触させ、少なくとも1つの第1の伸長プライマーは、3’末端にポリ(T)配列を含み、少なくとも1つの第1の伸長プライマーは、ランダムヘキサマー配列を含む。本明細書に記載の核酸のライブラリを生成する方法のいくつかの実施形態において、任意選択の第1および第2のアダプターは、Illuminaプラットフォーム、ION Torrentプラットフォームなどの様々なNGSプラットフォームで配列決定するためのアダプターを含む。
いくつかの実施形態において、式(A)、(I)、(II)、または(III)のオリゴヌクレオチドが連結されたヌクレオチドを調製するための方法が提供され、方法は、以下を含む。
a.第2の官能基とのクリック反応を受けることができる第1の官能基に共有結合で結合したヌクレオチドを提供すること、クリック反応を受けてトリアゾール環を形成することができる第2の官能基に共有結合で結合したオリゴヌクレオチドを提供すること、ヌクレオチドをオリゴヌクレオチドと接触させてクリック反応産物を形成すること。
第1および第2の官能基は、それぞれ、以下から選択される。
i)アルキニルおよびアジド、
ii)アジドおよびアルキニル、
iii)チオールおよびアルキニル、
iv)アルキニルおよびチオール、
v)チオールおよびアルケニル、
vi)アルケニルおよびチオール、
vii)アジドおよびシクロオクタニル、
viii)シクロオクタニルおよびアジド、
xi)ニトロンおよびシクロオクタニル、ならびに
xii)シクロオクタニルおよびニトロン。
いくつかの実施形態において、第1および第2の官能基は、それぞれ、i)アルキニルおよびアジド、およびii)アジドおよびアルキニルから選択される。いくつかの実施形態において、ヌクレオチドは、デオキシヌクレオチドまたはジデオキシヌクレオチドである。
いくつかの実施形態において、ステップ(c)は、銅触媒および銅(I)配位子の存在下でヌクレオチドをオリゴヌクレオチドと接触させて、1,2,3-トリアゾールを形成することを含む。いくつかの実施形態において、銅触媒は、銅(I)または銅(II)を含み、触媒が銅(II)である場合、還元剤が存在する。いくつかの実施形態において、銅触媒は、Cu(NO32Cu(OAc)、CuSO4またはそれらの任意の組み合わせである。
いくつかの実施形態において、還元剤は、アスコルビン酸塩、トリス(2-カルボキシエチル)ホスフィン(TCEP)、2.4.6-トリクロロフェノール(TCP)、NADH、NADPH、チオ硫酸塩、金属銅、キノン、ヒドロキノン、ビタミンK、グルタチオン、システイン、2-メルカプトエタノール、ジチオスレイトール、Fe(II)、Co(II)、印加電位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、W、またはそれらの任意の組み合わせを含む。いくつかの実施形態において、還元剤は、アスコルビン酸ナトリウムを含む。いくつかの実施形態において、配位子は、トリス(ベンジルトリアゾリルメチル)アミンまたはトリス(3-ヒドロキシプロピルトリアゾリルメチル)アミンを含む。
いくつかの実施形態において、配列決定ライブラリを産生するためのキットが提供され、キットは以下を含む。
a.オリゴヌクレオチドが連結されたヌクレオチド、ならびに
(i)A、C、G、Uおよび/もしくはTヌクレオチドまたはそれらの組み合わせ、
(ii)ポリメラーゼ、
(iii)プライマーおよび/もしくはアダプター配列、
(iv)緩衝液、または
(v)塩のうちの少なくとも1つ。
いくつかの実施形態において、キットは、A、C、G、U、および/またはTヌクレオチドを含む。
いくつかの実施形態において、キットは、ポリメラーゼを含み得る。いくつかの実施形態において、ポリメラーゼは、野生型ポリメラーゼ、修飾されたポリメラーゼ、変異型ポリメラーゼ、操作されたポリメラーゼ、またはそれらの組み合わせである。
いくつかの実施形態において、ポリメラーゼは、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、およびHIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体である。
いくつかの実施形態において、キットは、1つ以上のプライマー、アダプター、バーコード、または特有の分子同定子配列を含む。
いくつかの実施形態において、キットは、少なくとも1つの緩衝液を含む。
いくつかの実施形態において、キットは、少なくとも1つの塩を含む。
本明細書で提供されるいくつかの実施形態は、組み合わせバーコーディングのためのキットを含む。キットは、以下を含み得る。
a.オリゴヌクレオチドが連結されたヌクレオチド、ならびに
(i)A、C、G、Uおよび/もしくはTヌクレオチドまたはそれらの組み合わせ、
(ii)ポリメラーゼ、
(iii)プライマーおよび/もしくはアダプター配列、
(iv)緩衝液、または
(v)塩のうちの少なくとも1つ。
いくつかの実施形態において、以下のポリメラーゼのうちの1つ以上を有する組み合わせバーコーディングキットが提供される。Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、およびHIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体。例えば、好ましい実施形態において、組み合わせバーコーディングキットは、逆転を含み得る。例として、組み合わせバーコーディングキットは、Superscript(商標)逆転写酵素およびPfusion-exo-ポリメラーゼを含み得る。
いくつかの実施形態において、キットは、複数の区画を提供する容器をさらに含み、各区画は、区画特異的バーコードを含むプライマーを含む。例えば、いくつかの実施形態において、
次に、本開示の特定の実施形態を詳細に参照し、その例を添付の図に示す。本開示は、図示の実施形態と併せて説明されるが、それらは、開示をそれらの実施形態に限定することを意図するものではないことが理解されるだろう。それどころか、本開示は、添付の特許請求の範囲によって定義されるように、開示に含まれ得るすべての代替、修正、および同等物を網羅することを意図している。
NGSライブラリの調製におけるオリゴヌクレオチドが連結されたデオキシヌクレオチド三リン酸(dNTP)の適用の概略図を示す。この実施形態において、オリゴヌクレオチドが連結されたdNTPは、核酸中の複数の位置に組み込まれる(図1A)。図1Bは、連結されたオリゴヌクレオチドにアニーリングされたプライマーの伸長、およびその後の非天然リンカーを通るポリメラーゼの読み過ごしを示す。 NGSライブラリの調製におけるオリゴヌクレオチドが連結されたジデオキシヌクレオチド三リン酸(ddNTP)の適用の概略図を提供する。この実施形態において、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)は、第1のアダプター配列を含む単一のオリゴヌクレオチドが連結されたddNTPを、鋳型非依存性様式で核酸の3’末端に付加する(図2A)。さらに、第2のアダプターをアニーリングしてライゲーションし、両端に相補的およびミスマッチな領域を有するアダプターを有するポリヌクレオチドのライブラリを提供する(図2B)。 オリゴヌクレオチドが連結されたジデオキシヌクレオチドを組み込むことにより、プライマー伸長およびランダムDNA合成終結の基本原理を示す。これにより得られたDNA断片の両端に事前に設計された配列タグが導入される。次いで、タグ付けされたDNA断片のライブラリは、PCRプライマーを使用して増幅され得、これにより、順次プラットフォーム特異的アダプター配列が導入される。必要に応じて、連結されたオリゴヌクレオチドは、核酸標的の濃縮のために使用され得る親和性タグ(例えば、ビオチン、左側のスキーム)を含み得る。タグ付けされたDNA断片の長さは、オリゴヌクレオチドが連結されたddNTP濃度および/または対応する天然のデオキシヌクレオチドに対する比率の調整を介して制御され得る。 ニック翻訳またはギャップ充填反応中にオリゴヌクレオチドが連結されたddNTPを組み込むことによるDNA標識化の原理を示す。 (TdT)によるオリゴヌクレオチドが連結されたddNTPの鋳型非依存性の組み込みによるDNA末端標識化の基本原理を示す。図36Aに示されるように、二本鎖、一本鎖、および部分的に二本鎖のDNAの末端は標識され得る。 ポリ(A)またはポリ(U)ポリメラーゼによるオリゴヌクレオチドが連結されたddNTPの鋳型非依存性の組み込みによるRNA末端標識の基本原理を示す。 アジド修飾dCTPを調製するための例示的な合成スキームおよびいくつかの例示的なリンカーの構造を示す。 アジド修飾dATPを調製するための例示的な合成スキームを示す。 オリゴヌクレオチドが連結されたdCTPを調製するための例示的なクリック反応スキームを、いくつかの例示的なリンカーの構造とともに示す。 オリゴヌクレオチドが連結されたddUTPを調製するための例示的なクリック反応スキームを示す。 様々な種類のポリメラーゼのオリゴヌクレオチドが連結されたヌクレオチドを組み込む能力を試験する実験の結果を示す。矢印はクリック反応産物を示す。K-レーンは反応前のCy5が標識された鎖を示し、K+レーンは4つの天然のdNTP(AおよびB)またはdCTP(C)を使用した反応産物を示す。C6-B1、PEG4-B1、C2-B1、C4-B1およびPEG2-B1は、表1に提供されるクリック反応産物に対応し、B1は、配列番号33に対応する。 オリゴヌクレオチドが連結された組み込み実験の結果を示す。具体的には、図12Aは、複数のオリゴヌクレオチドが連結されたヌクレオチドの組み込み実験のための核酸基質を示す。矢印は、オリゴヌクレオチドが連結されたdCTPの組み込みの可能性がある部位を示す。図12Bは、DNA/RNA基質上のオリゴヌクレオチドが連結されたヌクレオチドの組み込みを示すゲルの画像である。K-レーンは反応前のCy5が標識された鎖を示し、K+レーンは4つの天然のdNTPを使用した反応産物を示し、レーン2~5は天然のdNTPの非存在下での様々な量のオリゴヌクレオチドが連結されたヌクレオチドを組み込んだ重合反応産物を示す(C2-B2はアジド-C2-dCTPと配列番号23との間のクリック反応から生じるOTDNを示す)。レーン8における産物は、複数のオリゴヌクレオチドが連結されたシトシンの組み込み事象の発生を示す。 ddUTPの組み込みおよびPAGEゲルを示す。すなわち、二本鎖および一本鎖核酸でのTdTによるddUTPの組み込みを示すスキームが提供される。結果をPAGEゲルを使用して分析した。K-レーンは反応前のCy5が標識された鎖を示す。ddUTP-pレーンは、オリゴヌクレオチドが連結されたddUTP(配列番号2)の組み込みが成功したことを示す。 RNAの3’末端のポリ(U)ポリメラーゼ標識化の実験結果を示す。この実験により、ポリ(U)ポリメラーゼがオリゴヌクレオチドが連結されたddUTPを組み込むことが確認された。 いくつかの異なるポリメラーゼでのオリゴヌクレオチドが連結されたヌクレオチドの組み込み実験の結果を示す。矢印は、組み込み事象の成功を示す。K-レーンは反応前のCy5が標識された鎖を示し、K+レーンは天然のdTTPおよびdCTPを使用した場合の反応産物を示す。「ddUTP」レーンはddUTPの組み込みを示し、「OTDDN」レーンはオリゴヌクレオチドが連結されたddUTP(配列番号1)の組み込みを示す。 PCRにおいて特定のプライマーを使用してポリメラーゼのオリゴヌクレオチドが連結されたプライマー伸長読み過ごし事象を確認するための原理実証実験モデルのスキームを示す。まず、第1のプライマーは、組み込まれる最初のヌクレオチドがオリゴヌクレオチドが連結されたデオキシヌクレオチド(オリゴヌクレオチドが連結されたdC)であるように鋳型にアニーリングされる(ステップI)。次いで、第2のプライマー(ステップIIの破線)をアニーリングし、プライマー伸長のためにPfu DNAポリメラーゼを添加する。曲線の矢印は、読み過ごし位置を示す。次いで、伸長されたDNA断片をPCR増幅する(ステップIII)。正しい読み過ごし事象を確認するために、得られたPCR断片をクローン化し、サンガー配列決定を行った(データは示していない)。 正しい読み過ごし産物の形成を確認するための別の実験のスキームを示す。図17Bは、結果を示すゲルの画像である(図17B)。図12のスキームからのプライマー伸長産物は、開始鋳型として使用される(配列番号30および31)。黒丸はCy5色素、白丸はCy3色素を示す。 アラインメント結果を示す。図18Aは、2つのM13mp18特異的プライマーの伸長およびオリゴヌクレオチドが連結されたddNTPの組み込みによるランダムな終結によって生成されたアンプリコンライブラリの配列決定時に得られたリードのアラインメントを示す。アラインメント(図18B)は、プライミング部位に対応する固定された位置に位置する両方の挿入物の5’末端での2つのM13mp18ゲノム遺伝子座のカバレッジを示し、3’末端はオリゴヌクレオチドが連結されたddNTP組み込み部位に対応するランダム領域で発生する。 ランダムプライマーの伸長およびオリゴヌクレオチドが連結されたddNTPの組み込みによる終結によって生成されたアンプリコンライブラリの配列決定時に得られたリードのアラインメントを示す。アラインメントはE.coli K-12染色体全体のカバレッジを示す。 16S rRNA遺伝子のゲノムコンテキストの分析の原理を示す。図20Aは、16S rRNA遺伝子マップと、オリゴヌクレオチドが連結されたddNTPの終結を使用する、つまり単一の外向きプライマーから開始するセミ標的化断片ライブラリの調製の戦略を示す。図20Bおよび20Cは、対応するAgilent 2100 Bioanalyzerの電気泳動図である。V1~V9は、16S rRNA遺伝子内の可変配列の領域を示す。 図20に示される原理に従ったATCC(商標)MSA-1002(商標)微生物叢標準配列決定の結果を示す。 ランダムプライマーの伸長およびオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みによるDNA合成の終結による転写産物の全長をカバーする断片ライブラリの生成を含む、鎖特異的mRNA配列決定ライブラリの調製の基本原理を示す。タグ付けされた断片のライブラリの生成は、第2の鎖合成中に実行される。次いで、タグ付けされたDNA断片のライブラリは、PCRプライマーを使用して増幅され得、これにより、順次プラットフォーム特異的アダプター配列が導入される。タグ付けされたDNA断片の長さは、オリゴヌクレオチドが連結されたジデオキシヌクレオチドの濃度および/または対応する天然のデオキシヌクレオチドに対する比率の調整を介して制御され得る。図22は、配列番号41として「TTTTTTTTTTTTTT」を開示する。 図22に示す原理に従って調製されたmRNA配列決定ライブラリについて算出された遺伝子本体カバレッジを示す。 オリゴ(dT)逆転写プライマーの伸長およびオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みによるcDNA合成の終結による転写産物の3’末端をカバーする断片ライブラリの生成を含む、鎖特異的mRNA配列決定ライブラリの調製の基本原理を示す。次いで、タグ付けされたcDNA断片のライブラリは、ジデオキシヌクレオチドにコンジュゲートしたオリゴヌクレオチドに相補的なプライマーの線形伸長によって前増幅され得る。高いリンカー読み過ごし活性を有するポリメラーゼを採用して実施されるこの手順は、転写産物の検出感度を改善し得る。次いで、プラットフォーム特異的アダプター配列を導入するプライマーを使用したPCRによって最終増幅が実施される。タグ付けされたcDNA断片の長さは、逆転写ステップでのオリゴヌクレオチドが連結されたジデオキシヌクレオチドの濃度および/または対応する天然のデオキシヌクレオチドに対する比率の調整を介して制御され得る。オリゴヌクレオチドが連結されたジデオキシヌクレオチドの濃度および対応する天然のデオキシヌクレオチドに対する比率は、広範囲のRNA入力量にわたって同様のサイズの挿入物を生成し得る。図24は、配列番号41として「TTTTTTTTTTTTTT」を開示する。 図24に示す原理に従って調製されたmRNA配列決定ライブラリについて算出された遺伝子本体カバレッジを示す。 オリゴヌクレオチドが連結されたヌクレオチドを使用した3’mRNA-seqライブラリの調製の結果を示す。(図26A)は得られたライブラリのAgilent 2100 Bioanalyzerの電気泳動図を示し、および(図26B)は、オリゴヌクレオチドが連結されたヌクレオチドの組み込み部位から開始する配列決定リードの塩基組成を示す。最初の位置の「A」は、ddUTP組み込み部位に対応する。 オリゴヌクレオチドが連結されたヌクレオチドの技術を単一細胞RNA配列決定ライブラリの調製ワークフローに組み込んだ概念実証実験の結果を示す。図27Aは、調製されたライブラリのAgilent 2100 Bioanalyzerの電気泳動図を示し、図27Bは、検出された転写産物の生物型の分布を示し、図27Cおよび27Dは、それぞれ、細胞バーコード当たりの平均遺伝子数および特有の分子同定子(UMI)数の推定を示す。 第2の鎖合成プライマーの伸長およびオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みによるDNA合成の終結による転写産物の5’末端をカバーする断片ライブラリの生成を含む、鎖特異的mRNA配列決定ライブラリの調製の基本原理を示す。次いで、タグ付けされたDNA断片のライブラリは、PCRプライマーを使用して増幅され得、これにより、順次プラットフォーム特異的アダプター配列が導入される。タグ付けされたDNA断片の長さは、オリゴヌクレオチドが連結されたジデオキシヌクレオチドの濃度および/または対応する天然のデオキシヌクレオチドに対する比率の調整を介して制御され得る。図28は、配列番号41として「TTTTTTTTTTTTTT」を開示する。 は、図28に示す原理に従って調製されたmRNA配列決定ライブラリについて算出された遺伝子本体カバレッジを示す。 オリゴヌクレオチドが連結されたヌクレオチド配列に含まれるT7 RNAポリメラーゼプロモーターから生成されたインビトロ転写産物を示す。約49ntのRNA断片のピークは、リンカー部位で合成が終結した転写産物を示し、約95ntのRNA断片のピークは、二次構造の影響を受けた同じ転写産物の移動を示す。約61ntの長さのRNA断片のピークは、リンカーホッピングで合成された転写産物を示す。約138ntのRNA断片のピークは、二次構造の影響を受けた同じ転写産物の移動を示す。結果は、オリゴヌクレオチドが連結されたヌクレオチドに含まれるT7プロモーター配列が機能的であり、インビトロ転写開始部位として機能し得ることを示す。 配列番号24(Cy5標識)および27のアラインメントを示す二本鎖を示す。 配列番号24(Cy5標識およびビオチン化)および28のアラインメントを示す二本鎖を示す。 配列番号31および32のアラインメントを示す二本鎖を示す。 いくつかの例示的な抗逆転キャップ類似体の構造を示す。 全長配列決定アダプター修飾を含むオリゴヌクレオチドが連結されたジデオキシヌクレオチドを用いたPCRフリーRNAライブラリの調製の基本原理を示す。得られたライブラリの配列決定時に、予想される構造のリードはcDNA断片に対応し、転写産物の予想される部分をカバーする。図35Aは、配列番号42として「AAAAAAAAAA」を開示する。 末端デオキシヌクレオチドトランスフェラーゼ(TdT)によるオリゴヌクレオチドが連結されたジデオキシヌクレオチドでの鋳型非依存性DNA末端標識化の原理を示す。(A)第2の標識化ステップの前に鋳型DNAオリゴヌクレオチドを除去しない標識化スキームおよび標識化の結果、ならびに(B)エキソヌクレアーゼ処理による鋳型鎖の除去時の標識化スキームおよび標識化の結果。 両方の末端に既知の配列を有する複数のDNA断片を生成するオリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)での鋳型依存性DNA末端標識化の原理を示す(図37A)。結果は、そのような二重タグ付けの原理が、ライブラリの調製の配列決定に採用できることを示す(図37B~37C)。 オリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)の鋳型指向性伸長を介した3’末端標化識核酸の原理を示す。 単一細胞、全トランスクリプトーム解析のための組み合わせバーコーディングワークフローにおけるオリゴヌクレオチドが連結されたジデオキシヌクレオチドの使用を示す例示的なワークフローの概略図である。BC=バーコード、B=ビオチン、SA=ストレプトアビジン。 Rosenberg et al.,Science 360,176-182(2018)からのSPLiT-seqプロトコルを要約する。P5およびP7は、Illuminaプラットフォームでの配列決定に関連する配列を表す。RT=逆転写、SPRI=固相可逆固定化、Tn5=トランスポザーゼTn5、TSO=鋳型スイッチオリゴヌクレオチド。図40は、出現順に、それぞれ、配列番号43、44、43、44、43、44、44および44を開示する。 従来のSPLiT-seqプロトコル(「元のワークフロー」)と比較したオリゴヌクレオチドが連結されたジデオキシヌクレオチドを使用する現在の組み合わせバーコーディングプロトコル(「OTDDNワークフロー」)を要約する。S5およびS7配列は、増幅中のアダプター追加のためのハンドル配列を表す。P5、P7、インデックス5、およびインデックス7は、Illuminaプラットフォームでの配列決定に関連する配列を表す。ME=モザイク末端。 第1(A)および第2(B)増幅反応後の実施例9に従って本明細書に記載のオリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)組み合わせバーコーディングワークフローを使用して人工多能性幹細胞(iPSC)から調製されたRNAのNGSライブラリの調製物のAgilent 2100 Bioanalyzerの電気泳動図である。 実施例9に従って本明細書に記載のオリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)組み合わせバーコーディングワークフローを使用して末梢血単核細胞(PBMC)から調製されたRNAのライブラリの調製物のAgilent 2100 Bioanalyzerの電気泳動図である。 オリゴヌクレオチドに結合した抗体を含む、オリゴヌクレオチドが連結された細胞マーカー結合剤(OTBA)を作製するための例示的なスキームを示す。オリゴヌクレオチドは、5’から3’方向に、5’ハンドル(5’ハンドル)、細胞結合剤インデックス(Abインデックス)、および3’OHを有するポリ(A)配列(ポリA30、配列番号46)を含む。また、抗体に連結された5’ハンドル配列の鋳型指向性伸長を容易にするための鋳型として使用されるスプリントも示す。図48は、配列番号40として「PolyT30」を開示する。 本明細書に記載の組み合わせバーコーディングワークフローを使用して、HEK-293およびNIH-3T3細胞から核酸ライブラリを調製した場合の単一細胞の分解能を示す。HEK-293およびNIH-3T3ライブラリを混合し、ともに処理した。マップされたリードはバーコードで選別され、種ごとにプロットされた。X軸のバーコードはヒト配列のリード(ヒトリード)であり、Y軸のバーコードはマウス配列のリード(マウスリード)である。軸から外れたバーコードは、同じバーコードを共有する2つ以上の細胞が原因である(つまり、単一細胞の分解能が不足している)。
配列の説明
以下の表により、本明細書で参照される特定の配列のリストが提供される。
Figure 2022537069000011
Figure 2022537069000012
Figure 2022537069000013
本開示は、オリゴヌクレオチドが連結されたヌクレオチド、それらを作製する方法、およびそれらを使用する方法を提供する。オリゴヌクレオチドが連結されたヌクレオチドは約3~約100ヌクレオチドの長さのオリゴヌクレオチドに連結されたヌクレオチドを含む。これらのオリゴヌクレオチドが連結されたヌクレオチドを使用して、複数の異なる用途において複数の異なる種類の核酸に既知のオリゴヌクレオチドを標識またはタグ付けし得、これは特有の配列を担持し、バーコード(例えば、細胞または核のバーコード、区画バーコード、インデックスUMIなど)、伸長プライマー、アニーリング部位、または下流用途において使用される特定のプロモーターをコードする配列(T7プロモーター配列など)として機能し得る。
一実施形態において、ポリメラーゼは、オリゴヌクレオチドに連結されたヌクレオチドを核酸鎖に組み込み、核酸合成開始のための新しいプライミング部位を提供する。連結されたオリゴヌクレオチドに少なくとも部分的に相補的なプライマーが提供され、連結されたオリゴヌクレオチドにアニーリングすることが可能になる。ポリメラーゼは、オリゴヌクレオチドが連結されたヌクレオチド上の非天然リンカーを通ってアニーリングされたプライマーを伸長し、それによって新しい核酸鎖を生成し得る。
他の実施形態において、ポリメラーゼは、オリゴヌクレオチドに連結されたヌクレオチドを核酸鎖に組み込み、スプリントオリゴヌクレオチドをアニーリングするためのユニバーサルハンドル配列を提供する。スプリントオリゴヌクレオチドは、(i)連結されたヌクレオチドのユニバーサルハンドル配列にアニーリングすることができる配列および(ii)所望の配列についての鋳型を含む。ポリメラーゼは、鋳型指向性重合を介して、アニーリングされたスプリントオリゴヌクレオチドを横断して連結されたオリゴヌクレオチドの3’OHを伸長し得、それにより、任意の所望の配列(バーコード、特有の分子同定子、ユニバーサル配列、ランダム配列、特有の分子同定子、プロモーターなど)を組み込み、新しい核酸鎖を生成し得る。
得られた新しい核酸鎖を、さらに操作し得る(例えば、その後の増幅、伸長、ライゲーション、または他の処理を使用して)。例として、得られた新しい核酸鎖を増幅して、および/またはアダプター付加反応に供して、次世代配列決定ライブラリを提供し得る。配列決定ライブラリは、多くの配列決定方法において、様々なプラットフォームにわたって役立つ。
いくつかの実施形態において、オリゴヌクレオチドは、dNTP核酸塩基を介してdNTPに連結され得る。オリゴヌクレオチドがdNTPに連結される場合、ヌクレオチドを核酸に複数回組み込むことが可能である(例えば、図1および12を参照されたい)。あるいは、オリゴヌクレオチドは、ddNTP核酸塩基を介してddNTP(OTDDN)に連結される。オリゴヌクレオチドがddNTPに連結される実施形態において、オリゴヌクレオチドが連結されたヌクレオチドの組み込みは、核酸合成を終結させる(図3を参照されたい)。
いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドは、「クリック」ケミストリーを使用して調製され得る。例えば、オリゴヌクレオチドは、アジド基とアルキン基との間の(3+2)環化付加反応、次ぐ1,2,3-トリアゾール環の形成などのクリック反応の結果として、dNTPまたはddNTPの核酸塩基に連結され、それはオリゴヌクレオチドをdNTPまたはddNTPと化学的に接合する
いくつかの実施形態において、連結されたオリゴヌクレオチドは、核酸ポリメラーゼによる核酸合成のためのプライミング部位として使用され得る。連結されたオリゴヌクレオチドに相補的なプライマーは、配列決定のためのアダプターおよび/またはバーコードを付加するために使用される尾部配列を有し得る(例えば、Illuminaフローセルにハイブリダイゼーションするために使用されるP5およびP7配列)。
本明細書に記載の実施形態において、オリゴヌクレオチドが連結されたヌクレオチドは、標的産物の濃縮を容易にするために親和性タグを修飾され得る。
I.オリゴヌクレオチドが連結されたヌクレオチド
本アプローチは、オリゴヌクレオチドが修飾されたヌクレオチドの核酸への組み込みに基づく。様々な核酸ポリメラーゼは、それらの核酸塩基に結合したかさ高い基を有する修飾されたヌクレオチドを組み込む能力を有し、そのような修飾されたヌクレオチドは、例えば、ランダム化されたヘキサマーから開始される核酸コピープロセス中に、核酸ポリメラーゼによって成長中の核酸鎖に組み込まれ得る、または末端トランスフェラーゼなどの鋳型非依存性ポリメラーゼによって一本鎖または二本鎖核酸の非常に3’末端に付加されるであろうと期待される(例えば、図1および2を参照されたい)。修飾されたヌクレオチドがそれらの糖部位に3’-ヒドロキシル基を有する場合、コピーされた核酸へのオリゴヌクレオチドを有するヌクレオチドの少なくとも1つおよび任意選択で複数の組み込みが期待される。そのような新たに合成された核酸上に複数のプライミング部位を有することは、例えば、ランダムヘキサマーおよび組み込まれたヌクレオチドに結合した連結されたオリゴヌクレオチドに相補的なオリゴヌクレオチド(図1)の両方を伸長プライマーとして使用するバイアスのない等温増幅を容易にする。末端トランスフェラーゼ(TdT)で二本鎖DNAの構造に3’末端において組み込まれたオリゴヌクレオチドを有するヌクレオチドを使用して、完全または部分的に相補的なオリゴヌクレオチドを反対のDNA鎖(相補的およびミスマッチのアダプター領域、図2を参照されたい)に付加することができる。適切に設計されたオリゴヌクレオチドを使用することにより、Illuminaプラットフォームを含むがこれに限定されない様々なプラットフォームでの配列決定に適合するDNA末端を生成することが可能である。
理論に拘束されないが、核酸合成中の修飾されたヌクレオチドの効率的な組み込みは、結合した標識のサイズに大きく依存すると考えられている。例えば、ヌクレオチド複素環式塩基と標識との間の連結基(または複数の基)(すなわち、式(A)の-Y-CXN-Z-基)の長さは、組み込みに顕著な影響を及ぼし得る。リンカーは、標識の立体障害およびヌクレオチドの立体構造の変化を低減するのに十分に長い必要がある。同時に、核酸鎖へのバックフォールディングを避けるために十分に短い必要がある。さらに、リンカーの末端官能基は、核酸ポリメラーゼ酵素によって許容される必要がある。適切に設計されたリンカーは、大きな標識を有するヌクレオチドの組み込みを可能にする。
オリゴヌクレオチドが連結されたヌクレオチドが3’-ヒドロキシル基の代わりに3’-Hを有する場合(例えば、ジデオキシ修飾されたヌクレオチド)、そのようなオリゴヌクレオチドが連結されたヌクレオチドの組み込みは、核酸合成を終結させる(図3)。オリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)が合成反応において使用される場合、ランダムに終結した断片のセットが生成される。
例えば、対応する天然のヌクレオチドに対する合成反応におけるOTDDNの濃度を、調整することにより、合成(および合成された鎖の長さ)を操作し得る。いくつかの実施形態において、合成反応は、例えば、単一の種類のOTDDN(例えば、OTddATP、OTddTTP、OTddCTP、OTddCTP、OTddUTP)を含む。いくつかの例において、合成反応は、例えば、2つ以上のOTDDNの組み合わせ(例えば、OTddTTPおよびOTddCTP、または他の組み合わせ)を含む。いくつかの実施形態において、反応中に存在する単一の種類のOTDDN(他の天然のヌクレオチドを伴う)が存在し、反応は、例えば、対応する天然のヌクレオチドを含まない。いくつかの実施形態において、反応中に単一の種類のOTDDNが存在し、反応は、対応する天然のヌクレオチドと比較して比較的多くの存在するOTDDN、ほぼ等量のOTDDNおよび対応する天然のヌクレオチド、または対応する天然のヌクレオチドと比較して比較的少なく存在するOTDDNを含む。
伸長反応から(例えば、連結されたオリゴヌクレオチドにハイブリダイゼーションした伸長プライマーから、またはスプリントオリゴヌクレオチドを横断した連結されたオリゴヌクレオチドの伸長から)、またはOTDDNを利用する増幅反応から得られる核酸を、さらに操作し得る(例えば、その後の増幅、伸長、ライゲーション、または他の処理を使用して)。例として、次いで、OTDDNを組み込んだ伸長産物を、上記のように下流の操作(例えば、さらなる伸長反応、増幅反応など)に供し得る。いくつかの例において、OTDDNが組み込まれた伸長産物を、プラットフォーム特異的な全長配列決定のアダプターの導入のための下流伸長または増幅(例えば、PCR)反応において使用し得る。いくつかの実施形態において、この方法はまた、核酸断片化についての必要性を克服するために使用され得る。
本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドは、濃縮を容易にするために、任意選択で親和性標識(例えば、ビオチン修飾された)を含み得る。あるいは、オリゴヌクレオチドが連結されたヌクレオチドは、他の標識を含み得る。
本開示の方法は、任意のヌクレオチドへのオリゴヌクレオチドの連結、その後の核酸ポリメラーゼを用いた鎖合成中の核酸配列への組み込みを有利に可能にする。したがって、本明細書で提供される方法は、任意の核酸配列組成物の任意の最終(すなわち、例えば、3’末端などの末端)ヌクレオチドへのオリゴヌクレオチドの結合を有利に可能にする。
いくつかの実施形態において、本明細書で使用されるオリゴヌクレオチドが連結されたヌクレオチドは、概して、式(A)による構造、またはその塩を有する。
Figure 2022537069000014
式中、NBは、核酸塩基であり、オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、XおよびQの各々は独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキレン、アルケニレン、アルキニレン、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキル、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択される。
いくつかの実施形態において、式(A)の化合物の塩は、四級アンモニウム塩である。
いくつかの実施形態において、Xは、H、OH、F、N3、およびアミノから選択される。他の実施形態において、Xは、H、N3、およびOHから選択される。いくつかの実施形態において、Xは、OHである。他の実施形態において、Xは、Hである。
いくつかの実施形態において、Qは、H、OH、F、Cl、Br、I、N3である。他の実施形態において、Qは、Hである。
いくつかの実施形態において、XおよびQは、Hである。
オリゴヌクレオチド、「オリゴ」は、以下のC1に示されるようにdNTPまたはddNTPの核酸塩基に5’-リン酸を介して、または以下のC2に示されるように核酸塩基(NB2)を介してヌクレオチドに連結され得る。
Figure 2022537069000015
構造C1およびC2は、式(A)のオリゴがdNTPまたはddNTPにどのように連結されるかのより詳細な図を提供する。したがって、Oligo*は、式(A)の化合物に存在する元のオリゴ配列の1ユニットを除くすべてを表す。
「CXN」は、結果として中間体がカップリングして、本明細書に開示されるオリゴヌクレオチドが連結されたヌクレオチドを形成する、中間体上の官能基間の反応によって形成される基である。
他の実施形態において、反応は、1~4個のN、O、S原子またはそれらの組み合わせを含む複素環式基を形成し得、複素環式基は、任意選択で炭素、窒素または硫黄原子において置換されている。いくつかの実施形態において、反応は、i)1つのヘテロ原子を有する5員複素環(例えば、ピロール、チオフェン、フラン、ピロリジン、チオラン、テトラヒドロフラン)、ii)1,2位または1,3位に2つのヘテロ原子を有する5員複素環(例えば、イソオキサゾール、オキサゾール、ピラゾール、イミダゾール、イソチアゾール、チアゾール)、iii)3つのヘテロ原子を有する5員複素環(例えば、トリアゾール、オキサジアゾール、チアジアゾール)、iv)1つのヘテロ原子を有する6員複素環(例えば、ピラン、チオピラン、ピリジン、テトラヒドロピラン、テトラヒドロチオピラン、ピペリジン)、v)2つのヘテロ原子を有する6員複素環(例えば、ピリダジン、ピリミジン、ピラジン、ヘキサヒドロピリダジン、ヘキサヒドロピリミジン、ピペラジン、ジオキサン、モルホリン、チアジン、オキサジン、ジチアン)、およびvi)3つのヘテロ原子を有する6員複素環(例えば、トリアジン、ジチアジン、チアジアジン、トリアジナン、オキサチアジン)から選択される複素環式基を形成し得る。
いくつかの実施形態において、CXNは、各々が1~3個のヘテロ原子を有する5員複素環および6員複素環から選択される。いくつかの実施形態において、CXNは、ピロロ、チオフェニル、フラニル、ピロリジニル、チオラニル、テトラヒドロフラニル、イソキサゾリル、オキサゾロ、ピラゾロ、イミダゾリル、イソチアゾロ、チアゾリル、トリアゾロ、オキサジアゾロ、チアジアゾロ、ピラニル、チオピラニル、ピリジニル、テトラヒドロピラニル、テトラヒドロチオピラニル、ピペリジニル、ピリダジニル、ピリミジニル、ピラジニル、ヘキサヒドロピリダジニル、ヘキサヒドロピリミジニル、ピペラジニル、ジオキサニル、モルフォリノ、チアジニル、オキサジノ、ジチアニル、トリアジニル、ジチアジノ、チアジアジノ、トリアジナニル、およびオキサチアジノから選択される。
いくつかの実施形態において、CXNは、
Figure 2022537069000016
である。
いくつかの実施形態において、ZおよびYは、各々、リンカーまたは連結部分であり、これは、ddNTPまたはdNTPとオリゴヌクレオチドとの間の全体的な連結を所望の特性で提供するように変化し得る特定の官能基を指す。いくつかの実施形態において、ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキレン、アルケニレン、アルキニレン、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択される。いくつかの実施形態において、各ZおよびYは、独立して、アミノ、アミド、アルキレン、アルケニレン、アルキニレン、エーテル、ケトン、カルボニル、無水物、エステル、イミド、またはそれらの任意の組み合わせから選択される。他の実施形態において、Yは、アルキレンまたはアルキニレンである。他の実施形態において、Zは、アルキニレン、アルキレン、エーテル、およびアミドのうちの1つ以上の組み合わせである。他の実施形態において、Zは、(CH-CH)C(O)(CH2CH2)NHC(O)(CH25-または-HN-である。さらに他の実施形態において、-NB-Z-の組み合わせは、
Figure 2022537069000017
またはNB-HN-L1-、-NB-(CH-CH)C(O)(CH2CH2)NHC(O)-L1)であり、L1は、アルキレン、アルケニレン、アルキニレン、およびポリアルキレングリコールから選択される。
いくつかの実施形態において、式(A)の化合物は、式(B1)~(B4)の化合物
Figure 2022537069000018
およびそれらの塩から選択され、式中、オリゴ*は、オリゴ基由来の残りの2~99ヌクレオチドであり、NB2は、核酸塩基であり、L1は、アルキレン、アルケニレン、アルキニレン、およびポリアルキレングリコールから選択され、L2は、アルキレンまたはアルキニレンである。
いくつかの実施形態において、CXNは、クリックケミストリーを使用して作製された、本明細書に記載のうちの1つ以上の基を含む。
いくつかの実施形態において、連結基Zは、アルキレン、アルケニレン、アルキニレン、およびポリアルキレングリコールから選択されるL1の亜群を含む。他の実施形態において、L1は、C1-C2アルキレン、C2-C12アルケニレン、C2-C12アルキニレン、および2~8グリコール単位を有するポリアルキレングリコールである。他の実施形態において、L1は、2グリコール単位を有するポリエチレングリコール(PEG2)、4グリコール単位を有するポリエチレングリコール(PEG4)、または6グリコール単位を有するポリエチレングリコール(PEG6)、メチレン、エチレン、n-プロピレン、イソプロピレン、1-ブチレン、シス-2-ブチレン、トランス-2-ブチレン、イソブチレン、1-ペンチレン、シス-2-ペンチレン、トランス-2-ペンチレン、イソペンチレン、およびヘキシレンから選択される。さらに他の実施形態において、L1は、-CH2-、-(CH23-、-(CH25-、PEG2、およびPEG4から選択される。
いくつかの実施形態において、連結基Yは、アルキレンまたはアルキニレンから選択されるL2の亜群を含む。他の実施形態において、L2は、C1-C12アルキレンまたはC1-C12アルキニレンである。他の実施形態において、L2-オリゴの組み合わせは、-(CH24-オリゴまたは-(CH24C≡C-オリゴから選択される。オリゴヌクレオチド、「オリゴ」は、dNTPまたはddNTPの核酸塩基に5’-リン酸を介して、または核酸塩基(NB2)を介してヌクレオチドに連結され得る。
NBおよびNB2は、独立して、核酸塩基である。いくつかの実施形態において、核酸塩基は、アデニン、7-デアザアデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される。NB2は、オリゴ基の単一ヌクレオチドであるため、NB-オリゴ*の組み合わせはオリゴである。
いくつかの実施形態において、NBは、ピリミジンであり、ピリミジンは、核酸塩基の5位でオリゴヌクレオチドに連結される。他の実施形態において、NBは、プリンであり、プリンは、核酸塩基の7位でオリゴヌクレオチドに連結される。
本明細書で使用されるオリゴヌクレオチドが連結されたヌクレオチドは、概して、式(I)による構造、またはその塩を有する。
Figure 2022537069000019
式中、Xは、H、OH、またはN3であり、NBは、核酸塩基を表し、ZおよびYは、リンカーであり、オリゴは、3~100ヌクレオチドの長さのオリゴヌクレオチドを表し、クリックは、ZおよびYリンカーに共有結合で結合するクリック反応の反応産物を表す。いくつかの実施形態において、核酸塩基は、アデニン、7-デアザアデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される。いくつかの実施形態において、ZおよびYは、各々独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、またはそれらの任意の組み合わせ、またはそれらの任意の組み合わせから選択される少なくとも1つの連結部位を含む。
あるいは、オリゴヌクレオチドが連結されたヌクレオチドは、非環式(I’)であり得る。
Figure 2022537069000020
クリック反応産物は、銅触媒によるアジド-アルキン付加環化(CuAAC)、銅を含まないクリックケミストリーとしても知られるひずみ促進アジド-アルキン付加環化(SPAAC)、ひずみ促進アルキン-ニトロン付加環化(SPANC)、アルキンヒドロチオール化、およびアルケンヒドロチオール化などの反応産物を含むが、これらに限定されない。
いくつかの実施形態において、クリック反応は、アジドおよびアルキンの(3+2)付加環化反応であり、その結果、1,2,3-トリアゾールが生じる。反応産物は、トリアゾール産物を提供し、それにより式(II)のオリゴヌクレオチドが連結されたヌクレオチド、またはその塩を提供する。
Figure 2022537069000021
式中、X、NB、Z、Yおよびオリゴは、上記で定義されたとおりである。式(II)において、ZおよびYのうちの一方が、トリアゾールの1位に共有結合で結合し、ZおよびYのうちの他方が、トリアゾールの4または5の位置に共有結合で結合する。一実施形態において、Xは、OHであり、別の実施形態において、Xは、Hであり、さらに別の実施形態において、Xは、N3である。
いくつかの実施形態において、リンカーZおよび/またはYは、炭素ベースの鎖、例えば、線状または分岐状であり得る1~12個の炭素原子を有するアルキル鎖を含む。いくつかの実施形態において、アルキレンは、直鎖または分岐のC1-C6、アルキレンである。リンカーZおよび/またはYはまた、2~12個の炭素を有する直鎖または分岐のアルケニレンを含み得る。あるいは、アルケニレンは、直鎖または分岐CのC2-C6アルケニレンである。いくつかの実施形態において、リンカーZおよびYは、2~12個の炭素の直鎖または分岐のアルキニレン鎖を含む。いくつかの実施形態において、アルキニレンは、直鎖または分岐のC2-C6、アルキニレンである。
いくつかの実施形態において、Zおよび/またはYは、2~20のアルキレングリコール単位を有するポリアルキレングリコールを含み、他の実施形態において、ポリアルキレングリコールは、2~8のアルキレングリコール単位を有する。いくつかの実施形態において、ポリアルキレングリコールは、2、4、または6~8個のグリコール単位を有する。適切なアルキレングリコール単位は、エチレングリコール、1,2-プロパンジオール、1,2-ブチレングリコールなどを含む。
オリゴヌクレオチドが連結されたヌクレオチドは、より具体的には、式(III)の構造、またはその塩を有し得る。
Figure 2022537069000022
式中、L1およびL2は、各々独立して、アルキレン、アルキニレン、ポリアルキレングリコール、またはそれらの任意の組み合わせを含むリンカーである。
いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドは、式(III)の構造、またはその塩を有し得、式中、L1は、アルキレン、ポリアルキレングリコール、またはそれらの組み合わせを含むリンカーであり、L2は、2~12個の炭素を有するアルキニレンを含むリンカーである。より具体的には、L2は、ヘキシニルである。ポリアルキレングリコールは、2~6個のエチレングリコール単位を有するポリエチレングリコールであり得る。別の実施形態において、L1は、1~12個の炭素原子を有するアルキレンを含む。より具体的には、アルキレンは、メチレン、エチレン、n-プロピレン、イソプロピレン、1-ブチレン、シス-2-ブチレン、トランス-2-ブチレン、イソブチレン、1-ペンチレン、シス-2-ペンチレン、トランス-2-ペンチレン、イソペンチレン、またはヘキシレンである。
あるいは、銅を含まないクリックケミストリーとしても知られるひずみ促進アジド-アルキン付加環化(SPAAC)を使用してオリゴヌクレオチドが連結されたヌクレオチドを生成する場合、得られる本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドは、概して式(IV)による構造またはその塩を有する。
Figure 2022537069000023
式中、Xは、HまたはOHまたはN3であり、NBは、核酸塩基を表し、ZおよびYは、リンカーであり、オリゴは、3~100ヌクレオチドの長さのオリゴヌクレオチドを表す。いくつかの実施形態において、核酸塩基は、アデニン、7-デアザアデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される。いくつかの実施形態において、ZおよびYは、各々独立して、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、またはそれらの任意の組み合わせ、またはそれらの任意の組み合わせから選択される少なくとも1つの連結部位を含む。
あるいは、いくつかの実施形態において、アジド修飾をヌクレオチドの3’位置に導入することができ、したがって、オリゴヌクレオチドをヌクレオチドの3’位置(VおよびVI)に共有結合で連結し得る。
Figure 2022537069000024
NBは、核酸塩基を表し、Yは、リンカーであり、オリゴは、3~100ヌクレオチドの長さのオリゴヌクレオチドを表す。いくつかの実施形態において、核酸塩基は、アデニン、7-デアザアデニン、シトシン、グアニン、7デアザグアニン、チミン、ウラシルおよびイノシンから選択される。いくつかの実施形態において、ZおよびYは、各々独立して、-C(O)NH-、-C(O)C)-、-NH-、-S-、-O-、アルキル、アルケニル、およびアルキニル、またはそれらの任意の組み合わせから選択される少なくとも1つの連結部位を含む。
本開示のオリゴヌクレオチドが連結されたヌクレオチドは、いくつかの実施形態において、ピリミジン核酸塩基を含む。これらの実施形態において、ピリミジン核酸塩基は、ピリミジンの5位でオリゴヌクレオチドに結合される(例えば、化合物E1を参照されたい)。あるいは、オリゴヌクレオチドが連結されたヌクレオチドがプリン塩基を含む場合、プリン核酸塩基は、核酸塩基の7位でオリゴヌクレオチドに結合される。他の実施形態において、オリゴヌクレオチドが連結されたヌクレオチドは、5’末端のリン酸基にC6(ヘキシニル)-アルキンモチーフを有するオリゴヌクレオチドを使用して得られる(例えば、化合物E2を参照されたい)。
Figure 2022537069000025
本開示のオリゴヌクレオチドが連結されたヌクレオチドの塩は、四級アンモニウム塩、ナトリウム塩、カリウム塩などを含む。
いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドは、その5’末端でヌクレオチドに連結される。いくつかの実施形態において、アルキン修飾は、8個の炭素原子のスペーサーを介してオリゴヌクレオチド核酸塩基に付加され、「Ald」修飾と称されるか、あるいは、アルキン基は、ヘキシニルリンカーを介してオリゴヌクレオチドの5’末端のリン酸に結合される。本説明全体で使用されているように、オリゴヌクレオチドが連結されたヌクレオチドが「Ald」を有することが示される場合(例えば、ddUTP-AldU-[オリゴヌクレオチド配列])、オリゴヌクレオチドは、オリゴヌクレオチドの核酸塩基に8個の炭素原子のスペーサーを介して結合したアルキン基の反応中にヌクレオチドに連結された(共有結合で連結された)と理解される。あるいは、オリゴヌクレオチドが連結されたヌクレオチドが「HEXYNYL」を有することが示される場合(例えば、ddUTP-HEXYNYL-[オリゴヌクレオチド配列])、オリゴヌクレオチドは、オリゴヌクレオチドの5’末端のリン酸にヘキシニルリンカーを介して結合したアルキン基の反応中にヌクレオチドに連結された(共有結合で連結された)と理解される。いくつかの例において、オリゴヌクレオチドは、例えば、その3’末端に修飾を有する。いくつかの例において、修飾は、ビオチン、リン酸、アミン、またはホスホロチオエート修飾である。
いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドは、デオキシリボヌクレオチドを含む。いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドは、リボヌクレオチドを含む。いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドは、デオキシリボヌクレオチドおよびリボヌクレオチドを含む。
連結されたオリゴヌクレオチドの長さは、オリゴヌクレオチドが連結されたヌクレオチドが使用される方法に依存する。いくつかの例において、オリゴヌクレオチドは、3~100ヌクレオチド、10~100ヌクレオチド、10~50ヌクレオチド、または20~40ヌクレオチドである。いくつかの例において、オリゴヌクレオチドは、100ヌクレオチド超の長さ、例えば、最大1000ntであり得る。
本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドは、任意の特定の配列に限定されない。むしろ、本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドは、バーコード配列、アダプター配列、特有の分子同定子、インデックス配列、ポリメラーゼのアニーリング部位、ハンドル配列、ユニバーサルハンドル、ユニバーサル配列など、ランダム配列、標的特異的配列、またはそれらの任意の組み合わせを含み得る。
いくつかの例において、オリゴヌクレオチドが連結されたヌクレオチドは、式B1およびB3の化合物から選択され、式中、Xは、OHであり、Qは、Hであり、L1は、C1アルキレン、C3アルキレン、C5アルキレン、2グリコール単位を有するポリエチレングリコール(PEG2)、または4グリコール単位のポリエチレングリコール(PEG4)であり、L2は、C1-C12アルキレンまたはC1-C12アルキニレンである。いくつかの例において、L2-オリゴの組み合わせは、(CH24C≡C-オリゴである。
いくつかの例において、オリゴヌクレオチドが連結されたヌクレオチドは、式B2およびB4の化合物から選択され、式中、Xは、OHであり、Qは、Hであり、L1は、C1アルキレン、C3アルキレン、C5アルキレン、2グリコール単位を有するポリエチレングリコール(PEG2)、または4グリコール単位のポリエチレングリコール(PEG4)であり、L2は、C1-C12アルキレンまたはC1-C12アルキニレンである。いくつかの例において、L2-オリゴの組み合わせは、-(CH24-オリゴである。
いくつかの例において、オリゴヌクレオチドが連結されたヌクレオチドは、式B1およびB3の化合物から選択され、式中、Xは、Hであり、Qは、Hであり、L1は、C1アルキレン、C3アルキレン、C5アルキレン、2グリコール単位を有するポリエチレングリコール(PEG2)、または4グリコール単位のポリエチレングリコール(PEG4)であり、L2は、C1-C12アルキレンまたはC1-C12アルキニレンである。いくつかの例において、L2-オリゴの組み合わせは、(CH24C≡C-オリゴである。
いくつかの例において、オリゴヌクレオチドが連結されたヌクレオチドは、式B2およびB4の化合物から選択され、式中、Xは、Hであり、Qは、Hであり、L1は、C1アルキレン、C3アルキレン、C5アルキレン、2グリコール単位を有するポリエチレングリコール(PEG2)、または4グリコール単位のポリエチレングリコール(PEG4)であり、L2は、C1-12アルキレンまたはC1-12アルキニレンである。いくつかの例において、L2-オリゴの組み合わせは、-(CH24-オリゴである。さらなる例示的なオリゴヌクレオチドが連結されたヌクレオチドは、式B1およびB3の化合物から選択され、式中、Xは、Hであり、Qは、Hであり、L1は、C1アルキレンであり、L2-オリゴの組み合わせは、(CH24C≡C-オリゴであり、NBおよびNB2は、独立して、チミン、アデニン、グアニン、シトシン、またはウラシルから選択される。さらなる例示的なオリゴヌクレオチドが連結されたヌクレオチドは、式B2およびB4の化合物から選択され、式中、Xは、Hであり、Qは、Hであり、L1は、C1アルキレンであり、L2-オリゴの組み合わせは、(CH24-オリゴであり、NBおよびNB2は、独立して、チミン、アデニン、グアニン、シトシン、またはウラシルから選択される。
以下のリストにより、いくつかのさらに代表的なオリゴヌクレオチドが連結されたヌクレオチドを提供される。
Figure 2022537069000026
Figure 2022537069000027
Figure 2022537069000028
Figure 2022537069000029
II.オリゴヌクレオチドが連結されたヌクレオチドの作製方法
オリゴヌクレオチドが連結されたヌクレオチドを調製するために様々な戦略を使用することができ、請求された組成物およびそれらを使用する方法は、これらの有用な化合物を作製する方法のいずれの説明によっても制限されない。
A.核酸修飾におけるクリックケミストリー
「クリックケミストリー」という用語は当技術分野でよく理解されており、概して、容易に精製され、位置特異的である速い反応を指す。クリックケミストリーは、選択した基質と特定の分子との接合を可能にする反応のクラスである。クリックケミストリーは単一の特定の反応ではないが、事実上の例に従う産物を生成する方法をし、これは、小さなモジュラーユニットを接合することによって物質も生成する。多くの用途において、クリック反応は、生体分子およびレポーター分子を接合する。クリックケミストリーは、生物学的条件に限定されない。「クリック」反応の概念は、薬理学的および様々な生体模倣用途で使用されてきた。しかしながら、それらは生体分子の検出、位置特定、および認定に特に有用になっている。古典的なクリック反応は、銅触媒によるアジドとアルキンとの反応であり、5員のヘテロ原子環を形成する、Cu(I)触媒によるアジド-アルキン付加環化反応(CuAAC)である。ひずみ促進アジド-アルキン付加環化(SPAAC)または銅を含まない反応、ひずみ促進アルキン-ニトロン付加環化(SPANC)、アルキンヒドロチオール化、およびアルケンヒドロチオール化を含むさらなるの反応が当技術分野で知られており、本開示のCXN基を作成するのに有用である。
本明細書で使用される場合、特に明記しない限り、「接触する」、「添加する」、「反応する」、「処理する」などの用語は、ある反応物、試薬、溶媒、触媒、反応性基などを別の反応物、試薬、溶媒、触媒、反応性基などと接触させることを意味する。反応物、試薬、溶媒、触媒、反応性基などは、個別に、同時に、または別々に添加され得、所望の結果を達成する任意の順序で添加され得る。それらは、加熱または冷却装置の存在下または非存在下で添加され得、任意選択で不活性雰囲気下で添加され得る。
本出願の場合、クリック反応はヌクレオチドに対して行われ、オリゴヌクレオチドが連結されたヌクレオチドを産生し、これは、さらなる用途を妨害する可能性のある未反応のクリック反応前駆体および他の残基を除去する必要がなくなる。本明細書に提示される方法はまた、DNA合成終結(これは断片化と同様の効果を有し、合成終結反応の結果は異なるより短いDNA断片のセットである)およびタグ付けが単一のステップで実行されるのでワークフローを単純化するという利点を有する。
いくつかの実施形態において、本開示によるオリゴヌクレオチドが連結されたヌクレオチドを調製するための方法は、第2の官能基とのクリック反応を受けることができる第1の官能基に共有結合で結合したヌクレオチドを提供すること、クリック反応を受けることができる第2の官能基に共有結合で結合したオリゴヌクレオチドを提供することを含み、第1および第2の官能基は、それぞれ、以下の対、アルキニルおよびアジド、アジドおよびアルキニル、チオールおよびアルキニル、アルキニルおよびチオール、チオールおよびアルケニル、アルケニルおよびチオール、アジドおよびシクロオクタニル、シクロオクタニルおよびアジド、ニトロンおよびシクロオクタニル、シクロオクタニルおよびニトロンから選択され、銅触媒および銅(I)配位子の存在下でヌクレオチドをオリゴヌクレオチドと接触させて、クリック反応産物を形成することを含む。
特定の実施形態において、方法は、1,2,3-トリアゾールを形成するためのアジドおよびアルキンのクリック反応を含む。アジドおよび末端または内部アルキンは、1,3-双極子付加環化(Huisgen付加環化)反応を受け、1,2,3-トリアゾールを生成し得る。しかしながら、この反応には長い反応時間と高温が必要である。あるいは、アジドおよび末端アルキンは、室温で銅(I)触媒によるアジド-アルキン付加環化(CuAAC)を受け得る。そのような銅(I)触媒によるアジド-アルキン付加環化は、「クリックケミストリー」としても知られ、Huisgen 1,3-双極付加環化のバリアントであり、有機アジドおよび末端アルキンが反応して1,2,3-トリアゾールの1,4-位置異性体が得られる。「クリック」ケミストリー反応の例は、Sharpless et al.(2005年10月6日に公開された米国特許出願公開第2005/0222427号、PCT/US03/17311、Lewis W.G.et al.,Angewandte Chemie-Int’l Ed.41(6):1053、Kolb,H.C.,et al.,Angew.Chem.Inst.Ed.2001,40:2004-2021においてレビューされた方法)によって説明されており、化合物のライブラリを作成するために、(炭素-炭素結合とは対照的に)ヘテロ原子結合で相互に高収率で反応し、副反応がほとんどない試薬を開発した。
標識(レポーター基、固体支持体または担体分子)を核酸にコンジュゲートさせるために本明細書に記載の方法において使用される「クリックケミストリー」反応のための触媒として使用される銅は、Cu(I)還元状態にある。そのような銅(I)触媒によるアジド-アルキン付加環化において使用される銅(I)の供給源は、臭化第一銅またはヨウ化第一銅などのハロゲン化第一銅を含むがこれらに限定されない任意の第一銅塩であり得る。しかしながら、この位置選択的付加環化は、金属触媒および還元剤の存在下でも実施され得る。
特定の実施形態において、銅は、還元剤の存在下で、Cu(II)還元状態で(例えば、Cu(NO32、Cu(OAc)2、またはCuSO4などであるがこれらに限定されない塩として)提供され得、Cu(II)の還元によってCu(I)がインサイチュで形成される。このような還元剤は、アスコルビン酸塩、トリス(2-カルボキシエチル)ホスフィン(TCEP)、2.4.6-トリクロロフェノール(TCP)、NADH、NADPH、チオ硫酸塩、金属銅、キノン、ヒドロキノン、ビタミンK、グルタチオン、システイン、2-メルカプトエタノール、ジチオスレイトール、Fe(II)、Co(II)、または印加電位を含むが、これらに限定されない。他の実施形態において、還元剤は、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、およびWから選択される金属を含む。特定の実施形態において、還元剤はアスコルビン酸塩である。
いくつかの実施形態において、アジドおよびアルキンの(3+2)付加環化は、配位子の存在下で実施される。理論に拘束されないが、配位子はCu(I)イオンを安定化し、それによってCu(II)イオンへの酸化を防ぐと考えられている。例えば、配位子は、3-[4-({ビス[(1-tert-ブチル-1H-1,2,3-トリアゾール-4-イル)メチル]アミノ}メチル)-1H-1,2,3-トリアゾール-1-イル]プロパノール(BTTP)、3-[4-({ビス[(1-tert-ブチル-1H-1,2,3-トリアゾール-4-イル)メチル]アミノ}メチル)-1H-1,2,3-トリアゾール-1-イル]硫酸水素プロピル(BTTPS)、2-[4-({ビス[(1-tert-ブチル-1H-1,2,3-トリアゾール-4-イル)メチル]アミノ}メチル)-1H-1,2,3-トリアゾール-1-イル]エチル水素硫酸塩(BTTES)、バソフェナントロリン二スルホン酸二ナトリウム塩(BTTAA)、Nε-((1R,2R)-2-アジドシクロペンチルオキシ)カルボニル)-L-リジン(BPS)、ペンタメチルジエチレントリアミン(PMDETA)、トリス(2-ベンズイミダゾリルメチル)アミン((BimH)3)トリス-(ベンジルトリアゾリルメチル)アミン(TBTA)、またはトリス(3-ヒドロキシプロピルトリアゾリルメチル)アミン(THPTA)から選択され得る。特定の実施形態において、リガンドは、THPTAである。
核酸を標識化するための銅(I)触媒によるアジド-アルキン付加環化は、水、ならびに、水と、アルコール、ジメチルスルホキシド(DMSO)、ジメチルホルムアミド(DMF)、tert-ブタノール(tBuOH)およびアセトンを含む様々な(部分的に)混和性有機溶媒との混合物を含む様々な溶媒中で実施され得る。
いくつかの実施形態において、CXNを形成するクリック反応は、i)アルキニル基とアジド基との間の反応である。
アジド中間体は、図7および図8に示される方法を使用して調製され得る。様々なdNTPおよびddNTP出発物質が市販されている。いくつかの実施形態において、以下のD1およびD2のアジド中間体が提供され、式中、NB、L1、XおよびQは、本明細書に記載のとおりである。
Figure 2022537069000030
D2のアジド中間体は、例えば、図7および8に示される方法の原理スキームを使用して、適切な構造の出発物質を使用して、調製され得る。
中間アルキン化合物の例、C3およびC4は、市販されており
Figure 2022537069000031
式中、NB2、L2、およびオリゴ*は、本明細書に記載のとおりである。
オリゴヌクレオチドが連結されたヌクレオチドは、例えば、図9および図10に示される方法を使用して、上記のアジド中間体および中間体アルキン化合物から調製され得る。様々なdNTPおよびddNTP出発物質が市販されている。図9および10は、中間体アルキン化合物C4およびD1のアジド中間体が使用される場合の例示的な調製方法を示す。あるいは、中間体アルキン化合物C3およびD1のアジド中間体、またはC3およびD2、またはC4およびD2の組み合わせを、例示されるような反応において使用して、オリゴヌクレオチドが連結されたヌクレオチドを調製し得る。
いくつかの実施形態において、本明細書に提供されるのは、本明細書に開示のオリゴヌクレオチドが連結されたヌクレオチドを調製するための方法であり、方法は以下を含む。
a.第2の官能基とのクリック反応を受けることができる第1の官能基に共有結合で結合したヌクレオチドを提供すること、クリック反応を受けてトリアゾール環を形成することができる第2の官能基に共有結合で結合したオリゴヌクレオチドを提供すること、ヌクレオチドをオリゴヌクレオチドと接触させてクリック反応産物を形成すること。
第1および第2の官能基は、それぞれ、以下から選択される。
i)アルキニルおよびアジド、
ii)アジドおよびアルキニル、
iii)チオールおよびアルキニル、
iv)アルキニルおよびチオール、
v)チオールおよびアルケニル、
vi)アルケニルおよびチオール、
vii)アジドおよびシクロオクタニル、
viii)シクロオクタニルおよびアジド、
xi)ニトロンおよびシクロオクタニル、ならびに
xii)シクロオクタニルおよびニトロン。
いくつかの実施形態において、第1および第2の官能基は、それぞれ、i)アルキニルおよびアジド、ならびにii)アジドおよびアルキニルから選択される。
いくつかの実施形態において、ステップ(c)は、銅触媒および銅(I)配位子の存在下でヌクレオチドをオリゴヌクレオチドと接触させて、1,2,3-トリアゾールを形成することを含む。
いくつかの実施形態において、ヌクレオチドは、デオキシヌクレオチドまたはジデオキシヌクレオチドである。いくつかの実施形態において、ヌクレオチドは、リボヌクレオチドまたは3’-デオキシリボヌクレオチドである。
いくつかの実施形態において、銅触媒は、銅(I)または銅(II)を含み、触媒が銅(II)である場合、還元剤が存在する。他の実施形態において、銅触媒はCu(NO32Cu(OAc)、CuSO4またはそれらの任意の組み合わせである。
いくつかの実施形態において、還元剤は、アスコルビン酸塩、トリス(2-カルボキシエチル)ホスフィン(TCEP)、2.4.6-トリクロロフェノール(TCP)、NADH、NADPH、チオ硫酸塩、金属銅、キノン、ヒドロキノン、ビタミンK、グルタチオン、システイン、2-メルカプトエタノール、ジチオスレイトール、Fe(II)、Co(II)、印加電位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、W、またはそれらの任意の組み合わせを含む。他の実施形態において、還元剤は、アスコルビン酸ナトリウムを含む。
いくつかの実施形態において、銅(I)配位子の配位子は、トリス(ベンジルトリアゾリルメチル)アミンを含む。
III.オリゴヌクレオチドが連結されたヌクレオチドの使用方法
オリゴヌクレオチドが連結されたヌクレオチドは、オリゴヌクレオチド連結を有するヌクレオチドが合成反応(例えば、伸長反応、増幅反応、TdT反応など)から形成される核酸に組み込まれ得るように核酸合成反応における試薬として使用され得る。有利なことに、これにより、直接的に、すなわち、オリゴヌクレオチドに連結されたヌクレオチドのオリゴヌクレオチドが機能的配列を提供する場合、または間接的に、例えば、本明細書でさらに説明するように、様々な機能的配列の付加を可能にする配列を提供することによって、様々な種類の機能的配列(例えば、配列決定アダプター、プロモーター配列、バーコード、特有の分子同定子、ハンドル配列など)の組み込みを可能にする。
したがって、本明細書で提供される態様は、核酸、例えば、試料核酸または試料ポリヌクレオチドに特定のオリゴヌクレオチド配列を直接タグ付けするためのオリゴヌクレオチドが連結されたヌクレオチドの使用を開示する。
例えば、ポリヌクレオチド試料から核酸のライブラリを生成するための方法が提供される。そのような方法は、以下のステップを含み得る。
a.第1の伸長プライマーを1つ以上の試料ポリヌクレオチドまたは試料核酸にアニーリングするステップ、
b.1つ以上の試料ポリヌクレオチドまたは試料核酸を、核酸ポリメラーゼ、少なくとも1つのヌクレオチド、および本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドと接触させて、オリゴヌクレオチドが連結されたヌクレオチドを含む第1の伸長産物を形成するステップ、
c.連結されたオリゴヌクレオチドに少なくとも部分的に相補的である第2のプライマーをアニーリングして、第2のアニーリングされた複合体を形成するステップ、
d.第2のアニーリングされた複合体を核酸ポリメラーゼと接触させて、連結されたオリゴヌクレオチドから核酸分子を産生し、
それにより、その末端の少なくとも1つが連結されたオリゴヌクレオチド配列を含むポリヌクレオチドのライブラリを産生するステップ。
いくつかの実施形態において、第1の伸長プライマーは、ユニバーサル配列を含み、それにより、その末端にユニバーサル配列および連結されたオリゴヌクレオチド配列を含むポリヌクレオチドのライブラリが産生される。(図3を参照されたい)。いくつかの実施形態において、第1の伸長プライマーはユニバーサル配列を含み、第2のプライマーはユニバーサル配列を含み、それにより、その末端にユニバーサル配列および連結されたオリゴヌクレオチド配列を含むポリヌクレオチドのライブラリが産生される。いくつかの実施形態において、第1および第2のプライマーは、異なるユニバーサル配列を含む。
いくつかの態様において、ポリヌクレオチドは、第1の伸長プライマーを試料ポリヌクレオチドにアニーリングするステップの前に断片化される。
上記の方法において、核酸は、オリゴヌクレオチドが連結されたヌクレオチドおよびその対応する未修飾の天然のヌクレオチドの組み合わせを使用することにより、所定の位置またはランダムな位置で特定のオリゴヌクレオチド配列をタグ付けされ得る。オリゴヌクレオチドが連結されたヌクレオチドのランダムな組み込みの頻度は、オリゴヌクレオチドが連結されたヌクレオチドおよび対応する天然のヌクレオチドのモル比の調整を介して制御され得る。
第1の伸長プライマーがユニバーサル配列およびランダム配列を含むいくつかの態様において、方法は、全ゲノムまたは全トランスクリプトーム配列決定に有用であり得る。他の実施形態において、第1のプライマーが特定のプライマーを含む場合、この方法は、標的化されたDNA/RNA配列決定に有用であり得る。
他の例において、オリゴヌクレオチドが連結されたヌクレオチドを使用して、例えば鋳型依存性様式で、バーコード、特有の分子同定子、ハンドル、および/または配列決定アダプターなどの情報の追加を容易にすることができる。したがって、いくつかの実施形態において、鋳型依存的様式で核酸配列を試料ポリヌクレオチドに付加する方法が提供される。方法は、(a)第1のプライマーを1つ以上の試料ポリヌクレオチドまたは試料核酸にアニーリングするステップ、(b)1つ以上の試料ポリヌクレオチドまたは試料核酸を、核酸ポリメラーゼ、少なくとも1つのヌクレオチド、および本明細書に記載のオリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)と接触させ、3’末端にOTDDNが組み込まれた1つ以上の試料ポリヌクレオチドまたは試料核酸の少なくとも一部のコピーを含む第1の伸長産物を形成するステップを含み得る。伸長産物を、(i)OTDDNのオリゴヌクレオチド部分にハイブリダイゼーションする配列、および(ii)ポリメラーゼおよびヌクレオチド(第1の伸長反応から存在しても存在しなくてもよい)の存在下での所望の追加の配列のための鋳型を含むスプリントオリゴヌクレオチドと接触させることによって、必要な情報を第1の伸長産物の3’末端に追加し得、それにより第2の伸長産物を産生する。この手段により、バーコード、インデックス、特有の分子同定子、アダプター(例えば、配列決定アダプター)、ハンドル配列、プロモーター配列、またはそれらの任意の組み合わせ、または他の任意の所望の配列などの所望の追加配列が、第1の伸長産物の連結されたオリゴヌクレオチドの3’末端に付加される。
いくつかの例において、スプリントオリゴヌクレオチドは、スプリントの3’末端からの伸長を防止するブロッキング基を含むことができる。例えば、スプリントは、3’アミノ、3’リン酸、ジデオキシ、または伸長を妨げる他の修飾を含み得る。いくつかの例において、スプリントオリゴヌクレオチドは、スプリントオリゴヌクレオチドの精製を可能にする機能的部位(例えば、ビオチン/ストレプトアビジンなどの同種の捕捉部位に特異的に結合する結合部位)を含み得る。
試料ポリヌクレオチドは、RNA分子、DNA分子などであり得る。いくつかの実施形態において、試料ポリヌクレオチドは、mRNA分子である。いくつかの実施形態において、試料ポリヌクレオチドは、DNA分子である。いくつかの実施形態において、試料ポリヌクレオチドは、目的の分子(例えば、抗体またはその断片、アプタマーなどの細胞結合剤)に連結された(例えば、共有結合または非共有結合で連結した)オリゴヌクレオチドである。
試料核酸または試料ポリヌクレオチドにアニーリングする第1のプライマーは、伸長条件下で試料ポリヌクレオチドにアニーリングすることを可能にするハイブリダイゼーション配列を含み得る。例えば、いくつかの実施形態において、ハイブリダイゼーション配列は、mRNAへの第1の伸長プライマーの結合を可能にするポリ(T)尾部であり得る。いくつかの実施形態において、ハイブリダイゼーション配列は、試料ポリヌクレオチドへの第1の伸長プライマーの非選択的結合を可能にするランダム配列(例えば、ランダムヘキサマーなど)であり得る。いくつかの実施形態において、ハイブリダイゼーション配列は、(例えば、特定の標的核酸配列へのハイブリダイゼーションを可能にする)標的特異的配列であり得る。いくつかの実施形態において、試料核酸または試料ポリヌクレオチドを、1種より多くのハイブリダイゼーション配列を含む第1のプライマー(例えば、ポリ(T)ハイブリダイゼーション配列を有する第1の伸長プライマーおよびランダムヘキサマーなどのランダムハイブリダイゼーション配列を有する第1の伸長プライマーの混合物)と接触させる。
図38は、本明細書に記載のオリゴテザーヌクレオチドを使用して、末端プライマー伸長産物の3’末端への遺伝情報の付加を容易にできる方法を示す例示的なワークフローを示すスキームを示す。図38は、試料ポリヌクレオチドがmRNAであるワークフローを例示しているが、ワークフローは、試料ヌクレオチドがDNA(例えば、gDNA)、目的の分子(例えば、図44に示されるような細胞マーカー結合剤)に連結されたオリゴヌクレオチドである状況で使用され得る。
いくつかの実施形態において、本方法は、任意選択で、少なくとも1つのクリーンアップステップを実行することを含む。
上記の方法において使用され、本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドは、1fmol~10μmolの範囲であり得る。特定の状況において、オリゴヌクレオチドが連結されたヌクレオチド対対応する天然のヌクレオチドの比率は、1:1~1:1000の範囲である。例えば、オリゴヌクレオチドが連結されたヌクレオチド対対応する天然のヌクレオチドの比率は、1:10、1:50、または1:100である。いくつかの実施形態において、試料を、オリゴヌクレオチドが連結されたチミン、アデニン、グアニン、シトシン、またはウラシルヌクレオチドのうちの2つ以上と接触させる。
上記の方法において、単一のポリメラーゼを使用し得る。あるいは、2つの異なるポリメラーゼを使用し得、第1のポリメラーゼは、オリゴヌクレオチドが連結されたヌクレオチドを組み込むためのものであり、第2のポリメラーゼは、プライマーの伸長/読み過ごしのためのものである。ポリメラーゼがオリゴヌクレオチドが連結されたヌクレオチドを組み込み、組み込まれたオリゴヌクレオチドが連結されたヌクレオチドの非天然リンカーを読み過ごし、および/またはプライマー/オリゴヌクレオチドを伸長する間のポリメラーゼ反応は、ポリメラーゼ活性に適した条件下で実施され得る。例えば、プライマー/鋳型系、ポリメラーゼ反応緩衝液、インキュベーション温度およびインキュベーション時間は、対応するポリメラーゼについて典型的推奨されるとおりであり得る。
別の実施形態において、TdTは、鋳型非依存性様式で、一本鎖または二本鎖DNA/RNAの3’末端に単一のオリゴヌクレオチドに連結されたジデオキシヌクレオチドを組み込む。このような手段により、例えば、NGSなどのためのアダプターを、試料核酸に付加することができる。いくつかの実施形態において、OTDDNのオリゴヌクレオチド配列は、第1のアダプター配列を含み得る。第1のアダプター配列に部分的に相補的である第2のアダプターは、アニーリングされ、鋳型核酸にライゲーションされ得る。(例えば、図2を参照されたい)。結果として得られるライブラリは両端にアダプターを有し、アダプターには相補的および不一致の領域を有する。ライブラリはさらに増幅され得る。
いくつかの実施形態において、本明細書に記載の方法におけるヌクレオチドに連結されたオリゴヌクレオチド(または本明細書に記載の間接的に試料ポリヌクレオチドに付加されるオリゴヌクレオチド)は、T7プロモーター配列を含む。そのように本明細書で提供されるのは、試料核酸またはポリヌクレオチドにインビトロ転写開始部位を導入する手段である。
上記の本明細書に記載の方法はまた、単一細胞または核配列決定の用途に使用され得る。オリゴヌクレオチドが連結されたジデオキシヌクレオチドの使用は、例えば、単一細胞または核に由来する核酸の前増幅の必要性を排除することによって、ウェルまたはチューブなどの従来の区画中では実施されない単一細胞または核配列決定法を改善し得る。例えば、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを使用して、組織試料のトランスクリプトームの、ゲノムの、およびタンパク質学のデータを空間的に分解するために使用される方法を改善し得る。
いくつかの実施形態において、本明細書に開示される方法は、大きなゲノムの分析に有用であり得る。遺伝子末端を標的とし、外側を向いている特定のプライマーは、ゲノムコンテキストの分析のためにオリゴヌクレオチドが連結されたヌクレオチドの技術を採用するように設計され得る。この原理は、既知の特定の遺伝子座の近くにある未知の配列領域を調査することを目的とした任意の実験系に適用できる。
別の例として、オリゴヌクレオチドが連結されたヌクレオチドは、以下を含む核酸にオリゴヌクレオチドをタグ付けするための方法において使用され得る。
e.プライマーを核酸にアニーリングすること、
核酸を本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチド、およびポリメラーゼと接触させ、それにより、タグ付けされた核酸を産生すること。
いくつかの実施形態において、接触は、核酸を少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチド、オリゴヌクレオチドに連結されていない少なくとも1つのヌクレオチド、およびポリメラーゼと接触させることを含む。
いくつかの実施形態において、単一の種類のオリゴヌクレオチドに連結されたヌクレオチドの組み込みが実施される。他の実施形態において、複数の異なるオリゴヌクレオチドが連結されたヌクレオチドの組み込みが望ましい。
いくつかの用途では、方法は、核酸の5’末端および/または3’末端にアダプター配列を付加する(例えば、ライゲーションする)ことを含む。方法はまた、タグ付けされた核酸を、例えば、インデクシングPCRなどのPCRによる増幅に供することをさらに含み得る。
オリゴヌクレオチドが連結されたヌクレオチドは、RNA、DNA、またはそれらの両方を含む、異なる種類の核酸の合成反応において採用され得る。いくつかの例において、ギャップファイリング反応またはニック翻訳中に、核酸がオリゴヌクレオチドが連結されたヌクレオチドでタグ付けされる。例えば、二本鎖DNAは、ニック翻訳またはギャップ充填反応中にオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みにより、事前に設計された特定の配列タグによってランダムに標識化される(図4)。オリゴヌクレオチドの組み込みの頻度は、DNAニッキング率の調整(例えば、DNase I処理時間を変更することによって)を介して制御され得る。得られたポリヌクレオチドライブラリは、3’末端に事前に設計されたタグを有するであろう。平均断片長はニッキング率を介して制御されるため、タグ付けは、ニック翻訳またはギャップ充填反応混合物において、単一の天然のヌクレオチドをオリゴヌクレオチドが連結されたヌクレオチドで完全に置換することによって実行され得る。
DNA末端標識化:末端デオキシヌクレオチドトランスフェラーゼ(TdT)によるオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みを介して、事前に設計された配列での鋳型非依存性DNA 3’末端標識化が達成される。この目的のために、ジデオキシヌクレオチドに連結されたオリゴヌクレオチドは、伸長されないように、ブロックされた3’末端(例えば、3’リン酸または3’アミノ修飾、またはジデオキシヌクレオチドを有する)を有し得る。標識化の第1のラウンドの後、コンジュゲーションリンカーを読み過ごすことができる任意のポリメラーゼによるジデオキシヌクレオチドにコンジュゲートされたオリゴヌクレオチドからのプライマー伸長時に相補鎖が合成される。次いで、新たに合成された鎖がアクセス可能な3’末端を有するので、DNA末端標識化の第2のラウンドが実施される(図5)。
RNA末端標識化。任意の事前に設計された配列での鋳型非依存性のRNA 3’末端標識化は、ポリ(A)またはポリ(U)ポリメラーゼによるオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みを介して達成され得る(Tailing and 3’-end labeling of RNA with yeast poly(A) polymerase and various nucleotides.G.Martin and W.Keller.RNA(1998),4:226-230,Cambridge University Press)。次いで、組み込まれたオリゴヌクレオチドは、逆転写酵素の鋳型スイッチ活性を介して5’末端を標識する可能性を伴う逆転写のためのユニバーサルプライミング部位として機能し得る。得られたタグ付けされたcDNAは、PCRを介して配列決定対応ライブラリに変換され、これにより、順次プラットフォーム特異的全長アダプターが導入される(図6)。
PCRフリーのDNAおよびRNA配列決定対応ライブラリの調製。配列決定プラットフォームに統合されたポリメラーゼが非天然のリンカーを介して読み過ごすことができる限り、DNAおよびRNA試料の両方からPCRフリーの配列決定対応ライブラリの調製が可能である。全長アダプターに対応する5’アンカーを有するプライマーを使用したワンステッププライマー伸長、および第2の全長プラットフォーム特異的アダプター配列を有するオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みによる終結は、配列決定対応の一本鎖ライブラリの生成を可能にし、それは任意の他の酵素操作なしで配列決定に供し得る。これは、必要なライブラリ準備ステップが少なくなるという利点を提供する。RNA試料を使用する場合、そのような戦略は、5’および3’末端にアダプターを含む配列決定対応の一本鎖DNAを達成するために必要なのは、第1の鎖のcDNAの合成のみであるというさらなる利点を提供する。
連結されたヌクレオチドへの配列の鋳型指向性付加。連結されたヌクレオチドが核酸に組み込まれると、連結されたオリゴヌクレオチドを使用して、鋳型非依存性様式で、バーコード、インデックス、特有の分子タグ、ハンドル、プロモーター、および/または配列決定アダプターなどの情報を付加することが容易になり得る。連結されたオリゴヌクレオチドは、スプリントオリゴヌクレオチドのアニーリング部位を提供する3’ハンドルを含み得る。連結されたオリゴヌクレオチドへのスプリントオリゴヌクレオチドのアニーリングは、第2のアニーリングされた複合体を形成する。伸長条件下でポリメラーゼおよびヌクレオチドと接触すると、連結されたオリゴヌクレオチドの3’末端が鋳型非依存性様式で伸長され、スプリントオリゴヌクレオチドの5’末端によって提供される所望の情報が組み込まれる。この方法によって、本明細書に開示の方法を使用して、アダプター配列を組み込み、ワークフローを大幅に単純化することにより、NGSライブラリを調製するために従来のワークフローを有利に改善し得る。
A.修飾されたヌクレオチドを組み込むことができるポリメラーゼ
オリゴヌクレオチドが連結されたヌクレオチドを核酸合成産物に組み込むために、ポリメラーゼを使用し得る。
DNAポリメラーゼ、RNAポリメラーゼ、逆転写酵素、テロメラーゼは、酵素基質として修飾されたヌクレオシド三リン酸を受け入れることが示されている。例えば、修飾されたヌクレオシド三リン酸は、プライマー伸長および増幅プロトコルに一般的に使用されるDNAポリメラーゼ、例えばTaqポリメラーゼ、Ventポリメラーゼ、Pfxポリメラーゼ、Pwoポリメラーゼ、またはTherminatorポリメラーゼなどの熱安定性DNAポリメラーゼによって容認される。あるいは、修飾されたヌクレオシド三リン酸は、例えば、MMLV逆転写酵素、T7 DNAポリメラーゼ、末端デオキシヌクレオチドトランスフェラーゼなどの中温性ポリメラーゼによって容認される。
修飾ヌクレオチド、特に本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドを組み込むことができるポリメラーゼは、DNAおよびRNAポリメラーゼから選択され得る。いくつかの実施形態において、DNAポリメラーゼは、DNA依存性DNAポリメラーゼ、RNA依存性DNAポリメラーゼ、または鋳型非依存性DNAポリメラーゼである。いくつかの実施形態において、RNAポリメラーゼは、DNA依存性RNAポリメラーゼ、またはRNA依存性RNAポリメラーゼ、または鋳型非依存性RNAポリメラーゼである。これらのポリメラーゼは、例えば、修飾されたヌクレオチドを許容し、それらを核酸の鎖により効率的に組み込むことができる、野生型、変異型アイソフォーム、キメラ型、およびエキソポリメラーゼなどの遺伝子操作されたバリアントならびに他の変異体を含む。
いくつかの実施形態において、ポリメラーゼは、AファミリーDNAポリメラーゼ、BファミリーDNAポリメラーゼ、XファミリーポリメラーゼおよびRTファミリーポリメラーゼ、ならびにそれらのバリアントおよび誘導体から選択される。
いくつかの実施形態において、ポリメラーゼは、ポリAポリメラーゼ(PAP)またはポリUポリメラーゼ(PUP)などの鋳型非依存性RNAポリメラーゼである。いくつかの実施形態において、核酸ポリメラーゼは、鋳型依存性RNAポリメラーゼである。いくつかの例において、RNAポリメラーゼは、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、およびT7型バクテリオファージ由来の他のRNAポリメラーゼなどのDNA依存性RNAポリメラーゼである。他の例において、RNAポリメラーゼは、Q-ベータレプリカーゼなどのRNA依存性RNAポリメラーゼである。これらのポリメラーゼは、例えば、修飾されたヌクレオチドを許容し、それらを核酸の鎖により効率的に組み込むことができる、野生型、変異型アイソフォーム、キメラ型、ならびに遺伝子操作されたバリアントおよび変異体を含む。
いくつかの実施形態において、AファミリーDNAポリメラーゼは、熱安定性または中温性ポリメラーゼである。いくつかの実施形態において、BファミリーDNAポリメラーゼは、熱安定性(例えば、archeal)または中温性ポリメラーゼである。
いくつかの実施形態において、DNAポリメラーゼは、E.coli DNAポリメラーゼ、E.coli DNAポリメラーゼのKlenow断片などのPol I型DNAポリメラーゼ、T.aquaticus(Taq DNAポリメラーゼ)、T.thermophilus(Tth DNAポリメラーゼ)、Bacillus stearothermophilus(Bst DNAポリメラーゼ)、T3(T3 DNAポリメラーゼ)またはT7(T7 DNAポリメラーゼ)などのバクテリオファージ由来のポリメラーゼ、ならびにそれらのバリアントおよび誘導体から選択されるAファミリーDNAポリメラーゼである。AファミリーDNAポリメラーゼのバリアントおよび誘導体は、例えば、Thermo Sequenase(商標)(ジデオキシヌクレオチドなどの修飾されたヌクレオチドをより効率的に組み込むことができる変異型Taq DNAポリメラーゼ)、CycleSeq(商標)(ジデオキシヌクレオチドなどの修飾されたヌクレオチドをより効率的に組み込むことができるTaq DNAポリメラーゼ変異体の組み合わせ)、Stoeffel断片(Taq DNAポリメラーゼの短縮バージョン)、Sequenase(商標)V2.0(ジデオキシヌクレオチドなどの修飾されたヌクレオチドをより効率的に組み込むことができるT7 DNAポリメラーゼ変異体)であり得る。
他の実施形態において、DNAポリメラーゼは、Tliポリメラーゼ、Pfuポリメラーゼ、Pwoポリメラーゼ、KODポリメラーゼ、Sacポリメラーゼ、Ssoポリメラーゼ、Pocポリメラーゼ、Pabポリメラーゼ、Mthポリメラーゼ、ファージPhi29ポリメラーゼ、およびファージB103ポリメラーゼ、Pyrococcus株GB-D(Deep Ventポリメラーゼ)、P.furiosus(Pfu DNAポリメラーゼ)、P.calidifontis(Pca DNAポリメラーゼ)、P.aerophilum、T.kodakarensis(KOD DNAポリメラーゼ)、T.gorgonarius(Tgo DNAポリメラーゼ)、およびThermococcu sp.9°N-7(9°N DNAポリメラーゼ)などのPyrococcus属およびThermococcus属由来のB型ポリメラーゼ、ならびにそのバリアントおよび誘導体から選択されるBファミリーDNAポリメラーゼである。いくつかの実施形態において、B型DNAポリメラーゼは、修飾されたPyrococcus furiosus DNAポリメラーゼである。いくつかの実施形態において、DNAポリメラーゼは、dsDNA結合ドメインと融合したキメラPyrococcus様DNAポリメラーゼであり、例えば、Phusion DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Q5 DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼである。いくつかの実施形態において、DNAポリメラーゼは、2017年1月13日に出願された米国特許出願第15/405,574号に記載されているように、Phusion exo-または他のPyrococcus様DNAポリメラーゼであり、これは参照により本明細書に組み込まれる。エキソヌクレアーゼマイナス修飾は、エキソヌクレアーゼ活性を阻害するためのエキソヌクレアーゼドメインにおける修飾(D141AおよびE143A)または他のそれぞれの修飾を含む。BファミリーDNAポリメラーゼの他のバリアントおよび誘導体は、例えば、Therminatorポリメラーゼ(ジデオキシヌクレオチドなどの修飾されたヌクレオチドを組み込む能力が増強された9°N(商標)DNAポリメラーゼ変異体)であり得る。
他の実施形態において、DNAポリメラーゼは、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、ポリ(A)ポリメラーゼ、およびポリ(U)ポリメラーゼならびにそのバリアントおよび誘導体から選択されるX型ポリメラーゼである。
他の実施形態において、ポリメラーゼは、HIV逆転写酵素、M-MLV逆転写酵素およびAMV逆転写酵素ならびにそのバリアントおよび誘導体から選択されるRTポリメラーゼである。
場合によっては、ポリメラーゼは、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV(変異型MMLV RT)、Superscript(商標)II(変異型MMLV RT)、Superscript(商標)III(変異型MMLV RT)、Maxima(商標)(変異型MMLV RT)、RevertAid(商標)(変異型MMLV RT)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H(変異型MMLV RT)、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、およびHIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体から選択される。
いくつかの例において、ポリメラーゼは、Taq DNAポリメラーゼ、Superscript(商標)IV(変異型MMLV RT)、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、Maxima H(変異型MMLV RT)、Therminator(商標)ポリメラーゼ、T7 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、Phusion(exo-)DNAポリメラーゼ、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体から選択される。
いくつかの実施形態において、ポリメラーゼは、野生型ポリメラーゼ、修飾されたポリメラーゼ(例えば、化学修飾を有するポリメラーゼ)、変異型ポリメラーゼ、キメラポリメラーゼ、エキソヌクレアーゼマイナスポリメラーゼ、操作されたポリメラーゼ、またはそれらの組み合わせである。修飾されたヌクレオチドを許容し、それらを核酸の鎖に組み込むexo-ポリメラーゼおよび他の変異体などの遺伝子操作されたバリアントを使用し得る。
いくつかの実施形態において、ポリメラーゼは、コンジュゲーションリンカーを読み過ごすことができる。オリゴヌクレオチドが連結されたヌクレオチドの組み込み時に提供される非天然リンカーを読み過ごすことができるポリメラーゼは、オリゴヌクレオチドが連結されたヌクレオチドを組み込むことができるポリメラーゼと比較して、同じであっても異なっていてもよい。いくつかの実施形態において、プライマー伸長および/または増幅プロトコルのために一般的に使用されるDNAポリメラーゼが使用される。いくつかの実施形態において、非天然リンカーを読み過ごすことができるポリメラーゼは、DNA依存性DNAポリメラーゼ、RNA依存性DNAポリメラーゼ、DNA依存性RNAポリメラーゼ、およびRNA依存性RNAポリメラーゼから選択される。
B.核酸配列決定
いくつかの実施形態において、本開示は、核酸配列決定において使用される核酸のライブラリの調製に関する。いくつかの実施形態において、鋳型核酸配列は、DNAまたはRNAである。いくつかの実施形態において、鋳型核酸配列は、二本鎖DNAに由来し、ゲノムDNAであり得る。あるいは、鋳型核酸配列は一本鎖DNAであり得る。他の実施形態において、鋳型核酸配列は、全RNA、mRNA、またはmiRNAである。いくつかの実施形態において、鋳型核酸は、オリゴヌクレオチドが連結された結合剤(OTBA)によって提供されるヌクレオチド配列である。いくつかの実施形態において、配列決定は、超並列核酸配列決定である。
いくつかの実施形態において、配列決定のためのライブラリの調製は、オリゴヌクレオチドが連結されたヌクレオチドを使用する以下のステップによって実施される。最初に、相補的プライマーを鋳型核酸鎖にアニーリングし、オリゴヌクレオチドが連結されたヌクレオチドおよびポリメラーゼと接触させて、合成された相補的核酸鎖に組み込む。いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドのデオキシバージョンが使用される場合、核酸鎖は、従来のヌクレオチドおよびオリゴヌクレオチドが連結されたヌクレオチドを組み込むことによってさらに伸長され得る。いくつかの実施形態において、オリゴヌクレオチドが連結されたヌクレオチドのジデオキシバージョンが使用される場合、ポリメラーゼによる鎖のさらなる伸長は、組み込まれたオリゴヌクレオチドが連結されたヌクレオチド上の終結基によってブロックされる。次いで、いくつかの実施形態において、鎖は、プライマー伸長ベースの反応、例えば、非対称PCR、インデクシングPCR、または逆転写反応を含むがこれらに限定されないPCRに供され、様々な配列決定法で使用される。いくつかにおいて、配列決定ライブラリは、ユニバーサルハンドル配列を含む連結されたオリゴヌクレオチドの組み込み、およびユニバーサルハンドル配列へのスプリントオリゴヌクレオチドのアニーリングによって調製され、スプリントオリゴヌクレオチドは配列決定アダプターを含む。
核酸断片を増幅する方法は、この分野の当業者には周知である。増幅は、いくつかの実施形態において、ポリメラーゼ連鎖反応(PCR)またはMDA、RCA、NASBA、LAMP、HDA、ICAN、NEARおよびEXPARを含むがこれらに限定されない任意の等温DNA増幅法によって達成され得る。核酸断片を、定量的ポリメラーゼ連鎖反応、マイクロアレイ、蛍光分析または分光光度分析を使用して定量し得る。
本明細書に記載の技術は、任意の特定の配列決定プラットフォームに限定されるものではなく、概して適用可能であり、プラットフォームとは独立している。いくつかの実施形態において、技術は、エマルジョンPCRベースの方法、ビーズベース、および非ビーズベースの方法に適用可能である。
産生された核酸分子を配列決定する適切な方法は、当業者には周知である。例えば、核酸断片は、マキサムギルバート、サンガー、パイロ配列決定、合成ごとの配列決定(sequencing-by-synthesis)、ライゲーションごとの配列決定(sequencing-by-ligation)、単一分子リアルタイム配列決定、質量分析、超並列署名配列決定、ポロニー配列決定、Illumina(Solexa)配列決定、半導体配列決定、DNAナノボール配列決定、ヘリスコープおよび単一分子配列決定などの当技術分野で知られている任意の適切な技術を使用して配列決定され得る。
C.単一細胞または単一核分析のための組み合わせバーコーディング
オリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)を使用して、組み合わせバーコーディング法を大幅に簡素化および改善し得る。単一細胞および単一核分析の状況において、例えば、目的の生体分子(例えば、細胞表面分子、タンパク質、DNA、RNA、miRNAを含む核酸など)の組み合わせバーコーディングに基づく単一細胞/核分析プロトコルの品質、など)が改善される。
組み合わせバーコーディングワークフロー
図39に示すように、細胞レベルで全トランスクリプトーム解析を改善するための方法が本明細書で提供される。図39は全トランスクリプトーム分析を示しているが、本明細書に記載の組み合わせバーコーディングワークフローを、1つ以上の特定の核酸および/またはタンパク質標的を分析するために、例えば、標的特異的配列(目的の標的mRNAまたはDNA配列、または本明細書の他の場所に記載されているOTBAなどの目的の生体分子に連結されたヌクレオチドなど)を有する第1の伸長プライマーを使用することによって、容易に適合および多重化させ得る。同様に、本明細書に記載の組み合わせバーコーディングワークフローを、本明細書の他の場所に記載のとおりgDNAをOTDDNでランダムにタグ付けし、本明細書に提供される組み合わせバーコーディングワークフローに従うことにより、全ゲノム分析(WGA)に適合させ得る。本明細書に記載の方法において、個々の試料細胞の生体分子を固定化し、その後、試料細胞を透過性にする。本明細書で提供される組み合わせワークフローを使用して、以下でさらに説明するオリゴヌクレオチドが連結された細胞結合剤を使用してタンパク質を分析する場合、試料細胞をOTBAで処理して、固定前に結合できるようにする。
本明細書に開示の方法において有用な固定および透過化の方法は、当技術分野において周知である。例として、本明細書に開示の方法で使用され得る固定剤は、ホルムアルデヒド、ホルマリン、メタノール、パラホルムアルデヒド、メタノール:酢酸などを含むがこれらに限定されない。例えば、いくつかの態様において、細胞は、例えばリン酸緩衝生理食塩水中、例えば、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%(v/v)またはそれ以上、または間の任意の範囲のホルムアルデヒドまたはパラホルムアルデヒドに細胞を接触させることによって固定化され得る。
本明細書に開示の実施形態において細胞を透過性にするための有用な薬剤は、トリトン100、サポニン、Tween20、およびメタノール、アセトンなどの有機溶媒を含むが、これらに限定されない。例えば、いくつかの態様において、細胞を、例えば、0.01~10%(v/v)のトリトンX100、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、またはそれ以上のホルムアルデヒドで処理し得る。
分析される固定化および透過化された試料細胞集団は複数の第1の部分に分割される。例として、第1の部分の各々は、各個々の細胞が第1の部分にランダムに分配されるように、異なるマイクロウェルまたはチューブに添加され得る。第1の部分の各々を、第1の伸長反応に供して、第1の伸長産物を生成する。例えば、逆転写酵素(RT)を第1の伸長反応に使用して、cDNAである第1の伸長産物を生成し得る。第1の部分の各々を、(i)ポリメラーゼ(例えば、RNA試料核酸/ポリヌクレオチドを分析するための逆転写酵素)、(iii)異なる第1の部分の各々に特有の第1のバーコード(すなわち、第1の伸長バーコードまたは第1のウェル特異的バーコード)を含む第1のプライマー(例えば、逆転写酵素(RT)伸長プライマー)、(iv)ヌクレオチド、および(v)ユニバーサルハンドルを含む少なくとも1つのオリゴヌクレオチドが連結されたddNTPと接触させる。接触ステップは、伸長条件下で行われ得る(例えば、伸長ステップにおいて使用されるポリメラーゼのための典型的な条件下)。
全トランスクリプトーム解析の場合、第1の伸長プライマーは、mRNAのバイアスのない増幅を可能にする配列を含み得る。したがって、第1の伸長プライマーは、mRNAのバイアスのないプライミングを可能にするためにポリ(T)を含み得る。あるいは、第1の伸長プライマーは、細胞RNAのランダムプライミングを容易にするための配列(例えば、ランダムヘキサマー)を含み得る。いくつかの実施形態において、ポリ(T)またはランダムプライマーは、第1の伸長プライマーの3’末端に含まれる。さらに他の方法において、ポリ(T)を有するプライマーと、ランダムプライミングを容易にするための配列を含むプライマーとの組み合わせが、伸長反応において使用される。
本明細書に記載の改良された組み合わせバーコーディングワークフローは、標的mRNA、標的DNA、標的タンパク質などの標的生体分子を分析する状況下で使用され得る。標的核酸およびタンパク質分析のワークフローにおいて、第1の伸長プライマーは、標的特異的配列を含み得る。例えば、標的mRNAまたはDNAの状況下で、第1の伸長プライマーは、目的の標的配列に特異的にハイブリダイゼーションする配列を含み得る。標的タンパク質(または細胞マーカー)の分析の状況下で、(i)目的のタンパク質、生体分子、または細胞マーカーに特異的に結合し、(ii)結合剤を同定する関連オリゴヌクレオチド配列を含む、オリゴヌクレオチドに連結された結合剤は、固定前に試料細胞に結合することを可能にする。そのため、OTBAは、標的核酸の分析のために使用される標的特異的配列と同じ様式で機能する。このようにして、OTBAはタンパク質に結合し、タンパク質発現に関するデータを、核酸の配列決定に使用される装置と方法論を使用して分析され得る形式に変換するために使用し得る。フルオロフォアで標識された抗体を使用する方法では、フルオロフォアのスペクトルの重複に問題がある可能性があるため、タンパク質シグナルを、核酸の配列決定のための機器および方法論を使用して分析され得る形式に変換することで、複数のタンパク質シグナルの分解能を高めることができる。また、OTBAを使用する方法は、フルオロフォアおよびフルオロフォアの分析のための機器(FACSソーティングに使用されるものなど)の使用を必要とせずに実施され得る。
当業者は、本明細書で以下に説明する組み合わせワークフローが容易に多重化できることを容易に理解するであろう。例えば、本明細書に記載の組み合わせバーコーディングワークフローを多重化することにより、トランスクリプトームおよび1つ以上の標的生体分子(例えば、標的タンパク質など)を同時に処理および分析し得る。例えば、以下の本明細書に記載のとおり、細胞集団を、結合剤インデックスおよび3’ポリ(A)尾部を含むオリゴヌクレオチドを含む1つ以上のOTBA(例えば、1、2、3、4、5、6、7、8、9、10個またはそれ以上のOTBA)と接触させ得る。(図44を参照されたい)。固定化および透過化された細胞は、第1の区画に分割され、全トランスクリプトーム解析で細胞が処理されるのと同じ方法で処理される。すなわち、3’ポリ(T)配列を含む第1の伸長プライマーを使用する。
第1の区画がマイクロウェルまたはチューブである方法において、マイクロウェルまたはチューブは、各々が第1の伸長プライマー、およびオリゴヌクレオチドが連結されたddNTPを含むように提供され得る。必要に応じて、マイクロウェルまたはチューブは、ポリメラーゼ、ヌクレオチド、またはそれらの両方をさらに含み得る。例えば、いくつかの実施形態において、マイクロウェルまたはチューブは、事前に充填された(例えば、乾燥されたまたは溶液中で)第1の伸長プライマーなどを含み得る。
第1の伸長は、第1の伸長産物(例えば、分析される試料核酸がRNAである場合のcDNA)へのオリゴヌクレオチドが連結されたddNTPのランダムな組み込みをもたらし、それによって各第1の核酸伸長産物のランダムな終結点が生成される。各伸長産物の「停止」点は、各第1の伸長産物の子孫を決定するための同定子として有利に使用され得る。各第1の核酸伸長産物は、各個々の第1の部分内のすべての核酸伸長産物に共通であり、他の区画における第1のバーコード/他の区画において生成された第1の伸長産物に対して特有である第1のバーコード(その5’末端)、および後続の反応において伸長し得る3’OHを提供する3’末端の第2のユニバーサルハンドルを含む。
複数の第1の部分は、例えば単一のチューブまたはウェルへ混ぜ合わされ、またはプールされ、その後、例えば、個々のマイクロウェル、チューブなどの中に、複数の第2の部分に分割される。したがって、個々の細胞は、再び個々の第2の部分にランダムに分配される。
第2の部分を、スプリントオリゴヌクレオチド、ポリメラーゼ、およびヌクレオチドと接触させる。スプリントオリゴヌクレオチドは、3’末端に第1の核酸伸長産物上の第2のユニバーサルハンドルにアニーリングする配列を含む。スプリントオリゴヌクレオチドはまた、スプリントの伸長を防止するために、3’末端に修飾(例えば、3’アミノ、3’リン酸、3’ジデオキシヌクレオチドなど)を含み得る。第3のユニバーサルハンドル配列のための鋳型配列は、スプリントオリゴヌクレオチドの5’末端に存在する。第2のユニバーサルハンドルにハイブリダイゼーションする配列および第3のユニバーサルハンドルの間に、スプリントオリゴヌクレオチドは、各第2の部分に特有の第2のバーコードのための鋳型配列を含む。したがって、第2の部分内の第1の伸長産物はさらに伸長されて、5’から3’方向に、第1のユニバーサルハンドル配列、cDNA、ジデオキシヌクレオチド、第2のユニバーサルハンドル、第2のバーコードおよび第3のユニバーサルハンドルを含む第2の伸長産物を生成する。
いくつかの例において、第3のバーコードおよび第4のユニバーサルハンドルを、試料の核酸試料に付加し得る。具体的には、第2の部分を混ぜ合わせ/プールし、例えば、個々のマイクロウェル、チューブなどの中で、複数の第3の部分に分割し得る。したがって、個々の細胞は、個々の第3の部分にランダムに分散される。プールおよび分割の後に各部分に特有のバーコードを付加するために第2のスプリントオリゴヌクレオチドのセットを使用する伸長反応は、複数回実施され得、各反復は、各部分に特有の別のバーコード(ただし、特定の部分に分散されたすべての細胞に共通)の核酸への追加をもたらす。
いくつかの実施形態において、方法は、例えば、第2の核酸伸長産物を生成した後、第3の部分を第2の伸長プライマーと接触させる前に、スプリントオリゴヌクレオチドを除去、ブロックまたは消化するステップを含む。いくつかの実施形態において、スプリントオリゴヌクレオチドは、結合部位を含み、方法は、第2の部分または混ぜ合わされた第2の部分を、同種の結合部位を含むスプリントオリゴヌクレオチドの結合および除去を容易にする捕捉部位を含む化合物と接触させるステップを含む。いくつかの実施形態において、結合部位および同種捕捉部位は、ストレプトアビジンおよびビオチン、マルトースおよびマルトース結合タンパク質、グルタチオンおよびグルタチオンS-トランスフェラーゼ、キチンおよびキチン結合タンパク質、またはアプタマーおよびその抗原のうちの結合対から選択される結合対である。いくつかの実施形態において、生体試料は、固体支持体上に固定化される。いくつかの実施形態において、固体支持体は、ビーズを含む。いくつかの実施形態において、ビーズは、磁性または常磁性のビーズである。
所望の数のバーコードが各細胞内の核酸伸長産物に付加された後、細胞を溶解して核酸伸長産物を放出するために、最終部分を溶解条件下で接触させ得る。例えば、方法は、第2の部分を、混ぜ合わせ、混ぜ合わせた第2の部分を分割し、第3の部分に分割し、第3のヌクレオチド伸長産物を生成することを含み得、各第3ヌクレオチド伸長産物内の第1、第2、および第3のバーコード配列(またはその相補体)の組み合わせは、単一細胞に由来する各核酸伸長産物に特有のものである。「特有」とは、第1、第2、および第3のバーコード配列の組み合わせがほぼ完全に特有である可能性があることを意味するが、この用語は、1つ以上のバーコードの偶然の繰り返しを除外するものではない。
いくつかの実施形態において、OTDDNを、全トランスクリプトーム分析、全ゲノム分析、有向性mRNA分析、短いRNA(例えば、miRNA)など、およびそれらの組み合わせなどの単一細胞または単一核ワークフローに組み込み得る。ほんの一例として、本明細書で提供されるのは、細胞集団内の単一細胞または核のトランスクリプトームを分析するためのワークフローである(図39を参照されたい)。
いくつかの実施形態において、本明細書で提供される組み合わせバーコーディング法は、細胞または核内の核酸、タンパク質、および他の生体分子が無傷のままであり、それらの起源の細胞内に固定されるように、細胞集団内の細胞または核を固定化および透過化するステップをさらに含む。同時に、透過化ステップは、試薬(例えば、ポリメラーゼ、ヌクレオチド、プライマーなど)が、例えば、逆転写、増幅反応などにおいて機能することができる細胞または核に入るのを可能にするように機能する。細胞および核を固定化および透過化する多くの方法が当技術分野において既知である。例として、本明細書に開示の実施形態において有用な細胞を固定化および透過化するための方法は、Rosenberg,et al.(2018)Science(360)176-182,Supplementary Materials、米国特許出願公開第2016/0138086号、および国際特許出願公開第2014/060843号に記載のものを含むがこれらに限定されない。
いくつかの実施形態において、本明細書で提供される組み合わせバーコーディング法は、1つ以上の伸長産物を生成した後に細胞を溶解することをさらに含み得る。さらに、本明細書で提供される組み合わせバーコーディング法はまた、最後のバーコードの付加の後、1つ以上の増幅反応を含み得る。いくつかの実施形態において、増幅プライマーは、伸長産物の3’および5’末端に存在するユニバーサルハンドルにアニーリングし得る。増幅プライマーは、任意選択でアダプター配列(例えば、本明細書の他の場所に記載のとおり、核酸ライブラリを所望のNGSプラットフォームで処理および分析することを可能にする配列決定アダプター)を含み得る。
組み合わせバーコーディング法はまた、溶解ステップなどに続く細胞破片から離れた核酸の精製を含むがこれらに限定されない1つ以上の試料調製ステップを含み得る。
D.対象の生体分子の空間分解能
本明細書に記載の改良された核酸タグ付けおよび核酸ライブラリの調製法はまた、組織試料中の目的の生体分子を空間的に分解するために使用され得る。
いくつかの方法では、組織試料を、5’から3’方向にアドレス可能なバーコードドメイン(例えば、アレイ上の位置情報をコードする第1のバーコード)およびハイブリダイゼーションドメイン(すなわち、アドレス可能なプライマーの組織試料のポリヌクレオチドへのハイブリダイゼーションを可能にするドメイン)を含むアドレス可能なプライマーのアレイと接触させ得る。アドレス可能なバーコードは、アレイのx座標とy座標に関連する情報を含み得る。本明細書に記載の実施形態において有用なアドレス可能なバーコードドメインのアレイは、当技術分野において既知である。
本明細書で使用される場合、「アレイ」という用語は、相対的な位置に従って互いに区別することができる特徴または部位の集団を指す。アレイの異なる部位にある異なる分子は、アレイ内の部位の位置に従って互いに区別され得る。アレイの個々の部位は、特定の種類の1つ以上の分子を含み得る。例えば、部位は、特定の配列を有する単一の標的核酸分子を含み得、または部位は、同じ配列(および/またはその相補的配列)を有するいくつかの核酸分子を含み得る。本明細書に記載の実施形態において使用され得るアドレス可能なバーコードのアレイの非限定的な例としては、国際特許出願番号第2016/168825号、同第2012/140224号、同第2014/060483号、同第2016/162309号などにおいて記載されるアレイが挙げられる。いくつかの実施形態において、アドレス可能なプライマーは、固体表面に共有結合で結合する。
組織試料のポリヌクレオチドは、RNA(例えば、mRNA)、組織試料に結合したOTBAのオリゴヌクレオチドなどであり得る。したがって、ハイブリダイゼーションドメインは、目的の配列(例えば、ポリ(T)、またはランダム配列)へのバイアスのないハイブリダイゼーションを容易にすることができ、または特定の標的配列(例えば、特定のmRNA配列)へのハイブリダイゼーションを可能にし、またはOTBAのオリゴヌクレオチドへのハイブリダイゼーションを可能にする。
組織試料をアドレス可能なプライマーのアレイと接触させて、オリゴヌクレオチドが連結されたジドキシヌクレオチド、連結されていないヌクレオチド、およびポリメラーゼの存在下で第1のアニーリングされた複合体を生成し得る。第1のアニーリングされた複合体の伸長は、オリゴヌクレオチドが連結されたヌクレオチド(例えば、オリゴヌクレオチドが連結されたジデオキシヌクレオチド)の第1の伸長産物への組み込みをもたらす。組み込まれたOTDDNを含む第1の伸長産物を、本明細書の他の場所に記載されているように操作し、例えば、NGS配列決定に適した核酸ライブラリを産生し得る。
アドレス指定可能なプライマーを、アレイ上の種々の特徴に共有結合で連結させ得る。アドレス可能なプライマーは、アレイ上の特徴からアドレス可能なプライマーの少なくとも一部分を放出する手段を提供する切断ドメインをさらに含むことができ、放出された部分は、位置バーコードおよびハイブリダイゼーション配列を含む。例えば、アドレス可能なプライマーは、例えば、組織核酸の存在下でアドレス可能なプライマーの伸長時に、制限酵素による切断を容易にする配列を含み得る。
組織切片は、第1の伸長産物が形成される前後に、視覚化または画像化され、例えば、染色および写真撮影され得る。したがって、いくつかの態様において、アドレス可能なバーコードは、組織試料内の位置と相関する。いくつかの実施形態において、本明細書に記載の方法は、分析される生体分子(例えば、RNA、DNA、タンパク質)の三次元プロファイルを生成するために、複数の連続する組織切片に対して実行され得る。したがって、いくつかの実施形態において、アドレス可能なプライマーのバーコードは、さらにz座標を含む。
IV.キット
本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドおよび/またはオリゴが連結された細胞マーカー結合剤を含むキットも提供される。いくつかの実施形態において、キットは、上記のようにオリゴヌクレオチドが連結されたヌクレオチドおよび/またはオリゴが連結された細胞マーカー結合剤(OTBA)、ならびに、(i)A、C、G、Uおよび/またはTヌクレオチド、(ii)ポリメラーゼ、プライマーおよび緩衝液のうちの少なくとも1つを含む核酸配列決定ライブラリを産生するためのものである。
キットに含まれ得るポリメラーゼは、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript III、Superscript IV、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼI、Klenow断片、Thermophilus aquaticus DNAポリメラーゼ、Tth DNAポリメラーゼ、Phusion(商標)DNAポリメラーゼ、SuperFi(商標)DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、およびHIV-1逆転写酵素、ならびにそれらの様々な誘導体または変異体から選択され得る。
いくつかの実施形態は、組み合わせバーコーディングのためのキットに関する。キットは、本明細書に記載のオリゴヌクレオチドが連結されたジデオキシヌクレオチドと、ポリメラーゼ、1つ以上のヌクレオチド、複数の第1のバーコードを含む複数の第1の伸長プライマー、複数の第2のバーコードを含む複数の第2の伸長プライマー、バーコード、複数の第3のバーコードを含む複数の増幅プライマー、および少なくとも1つのスプリントオリゴヌクレオチド、またはそれらの組み合わせのうちの1つ以上を含み得る。
V.定義
本教示を詳細に説明する一方で、開示は特定の組成物または処理ステップに限定されず、それ自体が変化し得ることを理解されたい。本明細書および添付の特許請求の範囲において使用される単数形「a」、「an」および「the」は、文脈が明確に他を指示していない限り複数形の言及を含むことに留意されたい。したがって、例えば、「色素」への言及は、複数の色素を含み、「細胞」への言及は、複数の細胞などを含む。
測定値および測定可能な値は、有効数字および測定に関連する誤差を考慮して、近似値であると理解される。すべての範囲は、「エンドポイントを含まない」などの明示的な除外がない場合、エンドポイントを含むものとして解釈される。したがって、例えば、「10~15以内」には、値10および15が含まれる。「含む(comprise)」「含む(comprises)」、「含んでいる(comprising)」、「含む(contain)」、「含む(contains)」、「含んでいる(containing)」、「含む(include)」、「含む(includes)」、および「含んでいる(including)」の使用は、限定することを意図するものではない。前述の概要および詳述の両方が例示および説明のためのみのものであり、本教示を限定するものではないことを理解されたい。本明細書に特に記載されていない限り、様々な構成成分を「含む」と記載されている明細書の実施形態は、記載されている構成成分「からなる」または「から本質的になる」ともみなされる。
本明細書に使用される節の見出しは、構成目的のものに過ぎず、決して所望の主題を限定すると解釈されるものではない。参照により組み込まれた任意の文献が本明細書において定義された用語と矛盾する場合、本明細書が優先される。本教示を様々な実施形態と併せて記載するが、本教示をかかる実施形態に限定することを意図していない。むしろ、本教示は、当業者が理解するように、様々な代替物、変形物、および等価物を包含する。
それらに限定されるものではないが、特許、特許出願、記事、書籍、論文、およびインターネットウェブページを含む、本出願で引用されるすべての文献および同様の資料が、いかなる目的であれ、それらの全体が参照によって明示的に組み込まれる。別途定義されない限り、本明細書に使用されるすべての技術および科学用語は、本明細書に記載される様々な実施形態が属する分野の当業者に通常理解されるものと同様の意味を有する。組み込まれた参照文献における用語の定義が、本教示において提供される定義と異なるように見える場合、本教示に提供される定義が優先されるものとする。
本技術の理解を容易にするために、いくつかの用語および句を以下に定義する。詳細な説明全体を通して、追加の定義が記載される。
本明細書で使用される「一実施形態において」という句は、必ずしも同じ実施形態を指すとは限らないが、そうである場合もある。さらに、本明細書で使用される「別の実施形態において」という句は、必ずしも異なる実施形態を指すとは限らないが、そうである場合もある。したがって、以下に説明するように、本開示の様々な実施形態は、本開示の範囲または趣旨から逸脱することなく、容易に組み合わせ得る。
本明細書において使用される単数形「a」、「an」および「the」は、文脈が明確に他を指示していない限り複数形の言及を含む。したがって、例えば、「部分」への言及は、複数のそのような部分などを含む。「含む」という用語およびその文法上の同等物は、具体的に同定された特徴に加えて、他の特徴が任意選択で存在することを意味するために、本明細書において使用される。本明細書において2つ以上の定義されたステップを含む方法に言及する場合、定義されたステップは任意の順序でまたは同時に実行され得(文脈がその可能性を除外する場合を除く)、方法は任意選択で、定義されたステップの前、2つの定義されたステップの間、またはすべての定義されたステップの後に実施される1つ以上の他のステップを含み得る(文脈がその可能性を除外している場合を除く)。本明細書において「第1」および「第2」の特徴に言及する場合、これは、概して、識別の目的で行われ、文脈が別の方法を必要とする場合を除き、第1および第2の特徴は、同じでも異なってもよく、第1の特徴への言及は、第2の特徴が必ずしも存在することを意味するわけではない(存在する場合もある)。本明細書において「a」または「an」特徴に言及する場合、これには、そのような特徴が2つ以上ある可能性を含む。
本開示による「ヌクレオチド」という用語は、特に、リボヌクレオチド、2’-デオキシリボヌクレオチドまたは2’、3’-ジデオキシリボヌクレオチドに関する。ヌクレオチド類似体は、糖または骨格が修飾されたヌクレオチド、特に酵素的に核酸に組み込まれ得るヌクレオチド類似体から選択され得る。糖が修飾されたヌクレオチドのいくつかの実施形態において、リボース糖の2’-OHまたはH基は、OR、R、ハロ、SH、SR、NH2、NHR、NR2またはCNから選択される基によって置き換えられ、RはC1-C6アルキル、アルケニルまたはアルキニルであり、ハロはF、Cl、BrまたはIである。リボース自体が、シクロペンタンまたはシクロヘキセン基などの他の炭素環式または複素環式の5または6員基で置き換えられ得る。骨格が修飾されたヌクレオチドの一実施形態において、ホスホ(トリ)エステル基は、例えば、ホスホロチオエート基またはH-ホスホネート基などの修飾基によって置き換えられ得る。さらなる実施形態において、ヌクレオチド類似体は、モルフォリノ核酸、ペプチド核酸またはロックド核酸などの核酸類似体の合成のための基礎的要素を含む。
「核酸塩基」という用語は、天然または非天然のプリンまたはピリミジン塩基のいずれかを指す。核酸塩基は、アデニン、シトシン、グアニン、チミン、ウラシル、ヒポキサンチン、キサンチン、7-デアザ-アデニンおよび7-デアザグアニン、イノシンを含む。
本明細書で使用される場合、「dNTP」という句は、2’-デオキシヌクレオチド三リン酸を意味し、ヌクレオチドは、天然または非天然の核酸塩基を含む。
本明細書で使用される場合、「ddNTP」という句は、2’,3’-ジデオキシヌクレオチド三リン酸を意味し、ヌクレオチドは、天然または非天然の核酸塩基を含む。
本明細書で使用される場合、「オリゴヌクレオチド」という用語は、2つ以上のデオキシリボヌクレオチドおよび/またはリボヌクレオチドを含む分子として定義される。その正確なサイズは多くの要因に依存し、それは順次オリゴヌクレオチドの最終的な機能または使用に依存する。オリゴヌクレオチドは、合成的にまたはクローニングによって得られる。
本明細書で使用される場合、「ポリヌクレオチド」という用語は、鎖状に共有結合で結合されたヌクレオチドモノマーからなるポリマー分子を指す。DNA(デオキシリボ核酸)およびRNA(リボ核酸)はポリヌクレオチドの例である。本明細書で使用されるポリヌクレオチドは、DNA、RNA、線状または環状dsDNA/ssDNA、断片化dsDNA/RNA、線状または環状RNA、および他の既知の形態または核酸などの二本鎖または一本鎖核酸を指す。
本明細書で使用される場合、「オリゴヌクレオチドが連結されたヌクレオチド」という用語は、ヌクレオチド核酸塩基に共有結合で結合する2つ以上のデオキシリボヌクレオチドおよび/またはリボヌクレオチドを含む分子を指す。例えば、2つ以上のデオキシリボヌクレオチドおよび/またはリボヌクレオチドは、トリアゾール環を介してヌクレオチド核酸塩基に共有結合で結合している。そのような共有結合での結合は、「クリックケミストリー」プロセスの結果であり得る。いくつかの例において、オリゴヌクレオチドが連結されたヌクレオチドは、OTDN(オリゴヌクレオチドが連結されたデオキシヌクレオチド)またはOTDDN(オリゴヌクレオチドが連結されたジデオキシヌクレオチド)と称され得る。
本明細書で使用される場合、「二本鎖」という用語は、ポリヌクレオチドに関して使用される場合、ポリヌクレオチドの相補鎖間のヌクレオチドの一部またはすべてが互いに水素結合して、部分的または完全な二重らせんを形成することを意味する。部分的に二本鎖のポリヌクレオチドは、そのヌクレオチドの少なくとも10%、25%、50%、60%、70%、80%、90%、または95%が相補的ヌクレオチドに水素結合することができる。
一本鎖ポリヌクレオチドは、二重らせんが形成されないか、または所与の一連のハイブリダイゼーション条件下で不安定であるように、別のポリヌクレオチドとほとんど、またはまったく水素結合を有しないポリヌクレオチドを指す。
「ポリメラーゼ」は、概して、ヌクレオチド、オリゴマー、およびそれらの類似体における3’-OHおよび5’-三リン酸との間の反応を触媒して核酸ポリマーを形成する酵素である。ポリメラーゼには、DNA依存性DNAポリメラーゼ、DNA依存性RNAポリメラーゼ、RNA依存性DNAポリメラーゼ、RNA依存性RNAポリメラーゼ、鋳型非依存性DNAポリメラーゼ、鋳型非依存性RNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Thermophilus aquaticus DNAポリメラーゼ、Tth DNAポリメラーゼ、Phusion DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Vent DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi、KOD1 DNAポリメラーゼ、Q-ベータ複製酵素、末端トランスフェラーゼ(TdT)、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、HIV-1逆転写酵素、Thermo Sequenase(Thermo Fisher Scientific)を含むが、これらに限定されない。これらのポリメラーゼは、例えば、修飾されたヌクレオチドを許容し、それらを核酸の鎖に組み込む、野生型、変異型アイソフォーム、キメラ型、およびエキソポリメラーゼなどの遺伝子操作されたバリアントならびに他の変異体を含む。
本明細書で使用される場合、「バーコード」という用語は、バーコードが関連付けられている核酸のいくつかの特徴を同定することを可能にする既知の核酸配列を指す。いくつかの実施形態において、同定される核酸の特徴は、核酸が由来する試料または供給源である。ほんの一例として、本明細書に記載のいくつかの実施形態は、細胞の集団中に存在する単一の細胞における目的の核酸への複数のバーコード(例えば、2、3、4、5、6個、またはそれ以上)の付加を記載する。各個々の細胞の核酸に追加されたバーコードの特有の組み合わせにより、目的のタグ付けされた核酸が由来する細胞の同定が有利に可能になる。いくつかの実施形態において、バーコードは、長さが少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15ヌクレオチド、またはそれ以上である。いくつかの実施形態において、バーコードは、長さが10、9、8、7、6、5、または4ヌクレオチドより短い。いくつかの実施形態において、いくつかの核酸に関連するバーコードは、他の核酸に関連するバーコードとは異なる長さのものである。概して、バーコードは十分な長さのものであり、関連付けられているバーコードに基づいて試料の同定が可能なように十分に異なる配列を含む。いくつかの実施形態において、それが関連するバーコードおよび試料供給源は、変異、挿入、または欠失などのバーコード配列中の1つ以上のヌクレオチドの変異、挿入、または欠失の後に正確に同定され得る。いくつかの実施形態において、複数のバーコードにおける各バーコードは、2、3、4、5、6、7、8、9、10個、またはそれ以上の位置などの2つ以上のヌクレオチド位置で、複数の他のすべてのバーコードとは異なる。いくつかの実施形態において、1つ以上のアダプターは、複数のバーコード配列のうちの少なくとも1つを含む。いくつかの実施形態において、技術の方法は、標的核酸が接合されているバーコード配列に基づいて、標的核酸が由来する試料または供給源を同定することをさらに含む。いくつかの実施形態において、技術の方法は、標的核酸が接合されているバーコード配列に基づいて標的核酸を同定することをさらに含む。方法のいくつかの実施形態は、バーコードヌクレオチド配列を決定することによって、標的ヌクレオチド配列の供給源または試料を同定することをさらに含む。方法のいくつかの実施形態は、所望の標的の発現レベルまたはコピー数状態を決定するための分子集計用途(例えば、デジタルバーコード羅列および/またはビニング)をさらに含む。概して、バーコードは、標的核酸に接合された場合に、標的ポリヌクレオチドが由来する試料の同定子として機能する核酸配列を含み得る。
本明細書で使用される場合、「プライマー」または「伸長プライマー」という用語は、天然に存在するか合成的に産生されるかにかかわらず、適切な条件下で、例えば、適切な緩衝液(「緩衝液」は適切なpH、イオン強度、補因子などを含む)中および適切な温度でのヌクレオチド三リン酸およびポリメラーゼ酵素(例えば、熱安定性ポリメラーゼ酵素)の存在下に置かれた場合、核酸合成の開始点として作用することができるオリゴヌクレオチドを指す。プライマーは、いくつかの実施形態において、増幅の最大効率のために一本鎖であり得るが、あるいは二本鎖であってもよい。二本鎖の場合、プライマーは、伸長産物を調製するために使用される前に、まずその鎖を分離するように処理される。いくつかの実施形態において、プライマーは、オリゴデオキシリボヌクレオチドである。プライマーは、伸長産物の合成をプライミングするのに十分に長い必要がある。プライマーの正確な長さは、温度、プライマーの供給源、ポリメラーゼ酵素(例えば、熱安定性であるかどうか)、および方法の使用を含む多くの要因に依存するであろう。本明細書で使用される場合、「アダプター」という用語は、概して、例えば、核酸分子にライゲーションされ得、それにより、配列決定プラットフォームで配列決定され得る核酸産物を生成し得る任意の線状オリゴヌクレオチドを指す。いくつかの実施形態において、アダプターは、二本鎖構造を形成する2つの逆相補的オリゴヌクレオチドを含む。
いくつかの実施形態において、プライマー、アダプターなどのようなオリゴヌクレオチドは、「ユニバーサル」配列を含む。ユニバーサル配列は、例えば、既知の配列(例えば、ユニバーサル配列に相補的)のプライマーまたはプローブを使用するプライマーまたはプローブ結合部位として使用するための既知の配列である。技術の実施形態において、プライマーの鋳型特異的配列、プライマーのバーコード配列、および/またはアダプターのバーコード配列は、例えば、断片から断片へ、試料から試料へ、供給源から供給源へ、または関心領域から関心領域へと異なる可能性があり、技術の実施形態は、ユニバーサル配列が、断片から断片へ、試料から試料へ、供給源から供給源へ、または関心領域から関心領域へと同じであることを提供し、ユニバーサル配列を含む断片は、同様の方法または技術を使用して(例えば、同じプライマーまたはプローブを使用して)、同じまたは同様の様式で、例えば、増幅、同定、配列決定、単離などで操作および/または処理され得る。
本明細書で使用される場合、「ハンドル」という用語(「増幅ハンドル」または「PCRハンドル」という用語と交換可能に使用される)は、それ自体が構築物オリゴヌクレオチド配列の増幅のためのアニーリング部位を提供するオリゴヌクレオチドまたはポリヌクレオチド配列である、機能的構成成分オリゴヌクレオチドを指す。本実施形態で使用されるハンドルは、DNA、RNA、PNA、修飾された塩基またはそれらの塩基の組み合わせ、またはポリアミドなどのポリマーから形成され得る。いくつかの実施形態において、本明細書で開示の実施形態において使用されるユニバーサルハンドルは、長さが約10のそのようなモノマー構成成分、例えば、ヌクレオチド塩基である。他の実施形態において、ユニバーサルハンドルは、長さが少なくとも約5~100個のモノマー構成成分、例えば、ヌクレオチドである。したがって、様々な実施形態において、本明細書に記載のユニバーサルハンドルは、少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、80、91、92、93、94、95、96、97、98、99、または最大100個モノマー構成成分、例えば、核酸である。したがって、本明細書に記載の「ユニバーサルハンドル」は、本明細書の他の場所に記載のポリメラーゼ、例えば、逆転写酵素、DNAポリメラーゼなどによる伸長のためのアニーリング部位として適切な一般的な配列であり得、または伸長プライマー結合部位、配列決定プライマー結合部位などを含み得る。
「特有の分子インデックス」(UMI)という用語は、個々のDNA分子を互いに区別するために使用され得る、DNA分子において適用または同定されるヌクレオチドの配列を意味する。UMIはDNA分子を同定するために使用されるため、特有の分子同定子とも呼ばれる。UMIは、それらが関連付けられているDNA分子とともに配列決定されて、リード配列が1つの供給源DNA分子のものであるか別のものであるかを決定することができる。
本明細書で使用される場合、「スプリントオリゴヌクレオチド」という用語は、鋳型非依存性様式で既存の核酸産物への核酸配列の伸長またはライゲーションを促進して伸長された核酸産物を形成するための鋳型として使用されるオリゴヌクレオチドを指すが、それは、伸長されないか、または核酸産物に組み込まれない。ほんの一例として、本明細書に記載のいくつかの実施形態において、スプリントオリゴヌクレオチドは、以下の構成成分を含み得る。(i)伸長される核酸産物に存在する同種のハンドル配列へのハイブリダイゼーションを可能にする配列、(ii)バーコード配列、および(iii)図38に示されるように、(i)のハンドルとは異なるハンドル配列を伸長された核酸産物に組み込むための鋳型である配列。スプリントオリゴヌクレオチドは、任意選択で、反応混合物からの除去を容易にする手段、例えば、ビオチン部位などを含む。いくつかの態様において、スプリントオリゴヌクレオチドはまた、3’末端からのスプリントオリゴヌクレオチドの伸長を防止する修飾を含む(例えば、3’アミノ、3’リン酸、3’ジデオキシなど)。
本明細書で使用される場合、「核酸合成」という用語は、ポリヌクレオチドの新しい鎖を作製するための、または既存のポリヌクレオチド(すなわち、DNAまたはRNA)を伸長させるための任意のインビトロ方法を指す。本開示による合成は、ポリメラーゼの使用でポリヌクレオチド鋳型配列のコピー数を増加させる増幅を含む。ポリヌクレオチド合成は、ポリヌクレオチド(すなわち、プライマー)へのヌクレオチドの組み込みをもたらし、それにより、ポリヌクレオチド鋳型に相補的な新しいポリヌクレオチド分子を形成する。形成されたポリヌクレオチド分子およびその鋳型は、追加のポリヌクレオチド分子を合成するための鋳型として使用され得る。
本明細書で使用される場合、「鋳型DNA分子」という用語は、例えば、プライマー伸長反応において、DNAポリメラーゼによって相補的な核酸鎖が合成される核酸の鎖を指す。
本明細書で使用される場合、「鋳型依存的様式」という用語は、プライマー分子の鋳型依存的伸長(例えば、DNAポリメラーゼによるDNA合成、逆転写酵素によるcDNA合成など)を含むプロセスを指す。「鋳型依存的様式」という用語は、典型的には、RNAまたはDNAのポリヌクレオチド合成を指し、ポリヌクレオチドの新たに合成された鎖の配列は、相補的塩基対プライミングの周知の規則によって決定される。
本明細書で使用される場合、「相補的」という用語は、2つのポリヌクレオチド鎖の領域間または塩基対形成を介した2つのヌクレオチド間の配列相補性の広い概念を指す。アデニンヌクレオチドは、チミンまたはウラシルであるヌクレオチドと特定の水素結合(「塩基対形成」)を形成することができることが知られている。同様に、シトシンヌクレオチドはグアニンヌクレオチドと塩基対形成することができることが知られている。
「タグ」または「オリゴヌクレオチドタグ」とは、ライブラリのオリゴヌクレオチド部分を意味し、その少なくとも一部は情報をコードする。「タグ」は、オリゴヌクレオチドが連結されたヌクレオチドで核酸に付加された任意のヌクレオチド配列であり得る。そのような情報の非限定的な例には、構成成分(すなわち、それぞれ足場タグまたは基礎的要素タグのような足場または基礎的要素)の追加(例えば、結合反応による)、ライブラリにおけるヘッドピース、ライブラリの同一性(つまり、同一性タグとして)、ライブラリの使用(つまり、使用タグとして)、および/またはライブラリメンバーの起源(つまり、起源タグとして)が挙げられる。
本明細書で使用される場合、「ライブラリ」という用語は、核酸に関して使用される場合、異なる化学組成(例えば、異なる配列、異なる長さなど)を有する核酸の集合を意味することを意図している。典型的には、ライブラリにおける核酸は、属またはクラスの共通の特徴または特性を有するが、それ以外では何らかの点で異なる、異なる種であろう。例えば、ライブラリは、ヌクレオチド配列が異なるが、糖リン酸骨格を有することに関して類似している核酸種を含み得る。ライブラリは、当技術分野で知られている技術を使用して作成し得る。本明細書で例示される核酸は、例えば、ゲノム(例えば、ヒトゲノム)の消化物またはゲノムの混合物を含む、任意の供給源から得られる核酸を含み得る。別の例において、核酸は、特定の環境または生態系のメタゲノム研究から得られたものであり得る。この用語は、DNAライブラリなどの人工的に作成された核酸ライブラリも含む。
「クリックケミストリー」および「クリック反応」という用語は、本明細書では交換可能に使用され、当技術分野でのそれらの使用と一致することを意図している。概して、クリックケミストリー反応は速く(例えば、反応の完了まで迅速)、単純で、容易に精製され、位置特異的である。クリックケミストリーは、銅触媒によるアジド-アルキン付加環化(CuAAC)、銅を含まないクリックケミストリーとしても知られるひずみ促進アジド-アルキン付加環化(SPAAC)、ひずみ促進アルキン-ニトロン付加環化(SPANC)、アルキンヒドロチオール化、およびアルケンヒドロチオール化などの反応を含むが、これらに限定されない。銅を触媒として使用するクリックケミストリーは、しばしば不安定なCu(I)を安定化する配位子を含む。特定の理論に拘束されることなく、配位子は、反応性Cu(I)からCu(II)への酸化からCu(I)イオンを安定化または保護し得、反応における塩基の必要性を低減または排除するプロトン受容体としても作用し得る。ポリヌクレオチド間のクリックケミストリーは、いくつかの実施形態において、2つの反応するパートナーを反応するのに十分に近接させる部位を使用することによって支援され得る。
本明細書で使用される場合、特に明記されていない限り、「アジド(azide)」または「アジド(azido)」という用語は、N3、または-N=N+=N-、または-N--N+≡Nを指す。
本明細書で使用される場合、特に明記しない限り、「約」または「ほぼ」という用語は、当業者によって決定される特定の値についての許容可能な誤差を意味し、これは、値がどのように測定または決定されるかに部分的に依存する。特定の実施形態において、「約」または「ほぼ」という用語は、1、2、3、または4標準偏差以内を意味する。特定の実施形態において、「約」または「ほぼ」という用語は、所与の値または範囲の10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、または0.05%以内を意味する。
本明細書で使用される場合、「標識」は、核酸を標識化するのに有用な化学的または生化学的部位である。「標識」は、例えば、蛍光剤、化学発光剤、親和性剤、ブロッキング基、発色剤、消光剤、放射性ヌクレオチド、酵素、基質、補因子、阻害剤、ナノ粒子、磁性粒子、および当技術分野で知られている他の部位を含む。標識は、測定可能なシグナルを生成することができ、オリゴヌクレオチドまたはヌクレオチドに共有結合または非共有結合で接合され得る。いくつかの例において、本明細書に開示のオリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドまたはオリゴヌクレオチドの一部は、標識として機能し得る。
本明細書で使用される場合、本明細書で使用される「リンカー」という用語は、C、N、O、SおよびPから選択される非水素原子を組み込んだ単一の共有結合または一連の安定な共有結合を指す。例示的な連結メンバーは、-C(O)NH-、-C(O)C)-、-NH-、-S-、-O-、アルキル、アルケニル、およびアルキニル鎖から選択される少なくとも1つの部位を含む。リンカーはまた、2つ以上の連結メンバーの組み合わせを含み得る。
本明細書で使用される場合、「アルキル」または「アルキレン」という用語は、例えば、1~12個の炭素原子または1~6個の炭素原子、1~4個の炭素原子または2~3個の炭素原子の飽和、直鎖または分岐の炭化水素鎖に由来するラジカルを指す。アルキル基の例としては、メチル、エチル、プロピル、イソプロピル、n-ブチル、イソブチル、tert-ブチル、n-ペンチル、2-ペンチル、3-ペンチル、2-メチルブチル、3-メチルブチル、およびn-ヘキシルならびに任意の異性体、メチレン、エチレン、プロピレン、イソプロピレン、n-ブチレン、ペンチレンなどが挙げられる。
本明細書で使用される場合、「アルケニル」および「アルケニレン」という用語は、少なくとも1つの炭素-炭素二重結合を含む2~10個の炭素原子の直鎖または分岐の炭化水素鎖に由来するラジカル基を指す。例としては、エテニル(ビニル)、1-プロペニル、2-プロペニル(アリル)、イソプロペニル、ブテニル、ブタ-1,4-ジエニル、ペンテニル、ヘキセニル、エテニレン)、プロペニレン、ブテニレン、ヘキセニレンなどが挙げられる。
本明細書で使用される場合、「アルキニル」または「アルキニレン」という用語は、少なくとも1つの炭素-炭素三重結合を含む2~10個の炭素原子の直鎖または分岐の炭化水素鎖に由来する二価基を指す。
「アミノ」という用語は、NR12型を指し、式中、R1およびR2は、独立して、水素およびC1-C8アルキル基から選択される。
本明細書で使用される場合、「ポリアルキレングリコール」という用語は、ポリエチレングリコール、ポリプロピレングリコール、およびポリブチレングリコールなどの直鎖または分岐のポリアルキレングリコールポリマーを指す。例示的なポリアルキレングリコールは、2~10個のアルキレングリコール単位を有する。「アルキレングリコールサブ単位」という用語は、単一のアルキレングリコール単位を指す。例えば、エチレングリコールサブ単位は、-O-CH2-CH2-であろう。例示的なポリアルキレングリコールには、2~10個のエチレングリコール単位を有するポリエチレングリコールが含まれ、特定の実施形態において、2、4、または6個のエチレングリコール単位を有するものは、それぞれPEG2、PEG4、およびPEG6とも称される。
用語「アルコキシ」または基-OR3は、R3がC1-8アルキル基であることを指す。例として、-OMe(メトキシ)、-OEt(エトキシ)、-O(nPr)(n-プロポキシ)、-O(iPr)(イソプロポキシ)、-O(nBu)(n-ブトキシ)、-O(iBu)(イソブトキシ)、-O(tBu)(tert-ブトキシ)などのOC1-8アルキルが挙げられる。
本明細書に開示される化学構造は、所与の各構造を表すことができる可能な共鳴構造のうちの1つの表現であることが理解されよう。さらに、定義により、共鳴構造は、電子の非局在化を表すために当業者によって使用される単なる図式的表現であり、本開示は、任意の所与の構造についての1つの特定の共鳴構造を示すことによって決して限定されないことが理解されよう。
「単離された」という用語は、本明細書で核酸ポリマーに関して使用される場合、その起源または操作により、それが天然に付けられるか、またはそれと最初に取得されたときに関連付けられる構成成分の少なくともいくつかから分離される核酸ポリマーを意味する。「単離された」とは、代替的または追加的に、目的の核酸ポリマーが人の手によって産生または合成されることを意味する。
本開示は、以下の実施例および関連する図を参照して、ほんの一例として、これからさらに詳細に説明されよう。
以下は、本明細書に開示の方法、使用、および組成物の例である。上記の所与の一般的かつ詳細な説明を前提として、他の様々な実施形態を実施され得ることが理解される。以下の例は、本教示を説明する目的で与えられたものであり、開示または特許請求の範囲を制限するものとして解釈されるべきではない。
実施例1.オリゴヌクレオチドが連結されたヌクレオチドの調製
A.アジドが修飾されたヌクレオチドの調製
5-プロパルギルアミノ-dCTP(化合物6)または7-デアザ-7-プロパルギルアミノ-dATP(化合物7)などのアミノが修飾されたヌクレオチドは、Jena Bioscience(SKU NU-1611-1およびNU-809)から市販されている。アジド-NHS-エステルを有する異なるリンカーを利用して、対応するアジド-置換-dCTPを、Na2CO3/NaHCO3のpH9の溶液中で所望の2,5-ジオキソピロリジン-1-イル2-アジド-化合物と反応させることにより合成し(図7)、50~90%の間隔での収率であった。
同じ反応条件に従って、アジド-C2-dATPを合成した(図8)。
B.アルキンが修飾されたオリゴヌクレオチドの調製
オリゴマー:(AldU)TTATATATTTATTGGAGACTGACTACCAGATGTAACA(配列番号33)は、様々な商業的供給業者からアルキン修飾を加えて市販されている。このオリゴヌクレオチドの配列は、もともとStasevskij et al,2017に開示されていたが、本実施例において、最初にオリゴヌクレオチドの5’末端塩基にアルキン修飾が付加されている。5’末端核酸塩基または5’末端リン酸でアルキン修飾されたオリゴヌクレオチドは、様々な商業的供給業者から市販されている。
C.クリック反応-オリゴヌクレオチドが連結されたdCTPの合成
すべてのクリックアジド-アルキン付加環化反応については、「CuAAC Biomolecule Reaction Buffer Kit(THPTA based)」(cat.No.CLK-072、Jena Bioscience)が、製造元の指示に従って使用された。反応条件は以下のとおりである。42μMのオリゴマー(配列番号33または配列番号23)、2mMのCuSO4、10mMのTHPTA、0.1Mのアスコルビン酸ナトリウム、78mMのリン酸ナトリウム緩衝液(pH7)、84μMのアジド前駆体。
クリック反応を使用して、5つの異なるオリゴヌクレオチドが連結されたデオキシヌクレオチドを合成した(図9)。反応混合物を分析し、液体クロマトグラフィーで精製した。これらの反応の結果を表1に要約する。
Figure 2022537069000032
オリゴヌクレオチドが連結されたヌクレオチドをもたらすクリック反応は、例えば、オリゴヌクレオチドがAlxyl(Metabion)修飾で修飾されている場合、アジドが修飾されたヌクレオチドおよびオリゴヌクレオチドの5’末端のリン酸に結合したアルキン基を有するオリゴヌクレオチド(式C1の化合物に示される)を使用して、ヘキシニルリンカーを介して行うこともできる。式E2の化合物が例として提供されている。
D.クリック反応-オリゴヌクレオチドが連結されたddUTPの合成
続いて、化合物9を、オリゴヌクレオチド(配列番号33または配列番号23)との付加環化(クリック)反応において利用した(図10)。クリック反応には、Jena Bioscienceの「CuAAC Biomolecule Reaction Buffer Kit(THPTA based)」を使用した。産物である化合物10を逆相クロマトグラフィーにより精製し、質量分析により確認した。あるいは、ヘキシニルリンカーを介してオリゴヌクレオチドの5’末端のリン酸に結合したアルキン基を有するオリゴヌクレオチドを、化合物9とのクリック反応に使用した。
実施例2.種々のポリメラーゼによるオリゴヌクレオチドが連結されたdNTPの組み込み
オリゴヌクレオチドが連結されたdNTPを合成鎖に組み込む能力について、種々のポリメラーゼを選択して試験した。文献によると、ファミリーA、ファミリーB、逆転写酵素(RT)ファミリー、および末端デオキシヌクレオチドトランスフェラーゼ(TdT)の酵素が、かさばるヌクレオチド類似体を組み込むことができると期待される。それにもかかわらず、これはヌクレオチド類似体自体に依存する可能性がある(Anderson et. al,2005、Tauraite et al,2017)。
A.オリゴヌクレオチドが連結されたデオキシヌクレオチドの組み込み
Figure 2022537069000033
実験系は、プライマーおよびオリゴヌクレオチドの二本鎖(例えば、配列番号24および27の二本鎖、図31)の突出した5’末端の伸長に基づいていた。天然のdNTPとの反応は、突出した末端の完全な充填、およびプライマーの伸長がもたらされたが、単一のオリゴヌクレオチドが連結されたデオキシ/ジデオキシヌクレオチドを組み込むと、オリゴヌクレオチドによるプライマー標識化がもたらされた。プライマー伸長反応は、試験した各ポリメラーゼの最適な緩衝液および温度で実施された。次に、反応産物を15%TBE-尿素PAGEで分解した。伸長プライマー配列番号24は5’-Cy5蛍光標識を有するため、プライマー伸長産物が検出された。
A型ポリメラーゼ(Taq DNAポリメラーゼ、rec):2pmolのCy5-29||49基質(配列番号24および27、図31)、20pmolのOTDN、1xTaqポリメラーゼ緩衝液、2.5UのTaq DNAポリメラーゼ(Thermo Scientific、#EP0405)、25mMのMgCl2を、95℃で10秒間、次いで60℃で10分間インキュベーションした。
B型ポリメラーゼ(Phusion exo-、Thermo Scientific):2pmolのCy5-29||49基質、20pmolのOTDNを、95℃で10秒間、次いで60℃で10分間インキュベーションした。
RT型ポリメラーゼ(Maxima H-):5pmolのCy5-B29||30基質(配列番号24および28、図32)、50pmolのOTDN、200UのMaxima H-RT(Thermo Scientific、#EP0752)、1xRT緩衝液を、50℃で20分間インキュベーションした(図11A~11C)。
図11A~11Cから分かるように、対応する酵素に典型的かつ推奨される反応条件下(緩衝液および反応温度など)で、試験されたすべてのポリメラーゼは、オリゴヌクレオチドが連結されたヌクレオチドを組み込むことができた。また、様々なリンカーを含むオリゴヌクレオチドが連結されたヌクレオチドが、試験されたポリメラーゼの各々によって組み込まれた。また、RTポリメラーゼがオリゴヌクレオチドが連結されたデオキシヌクレオチドの複数の組み込みを実施できることも確認された。112ntのRNA断片(配列番号30)をCy5が標識された相補的DNAプライマー(配列番号29)にアニーリングし、RTポリメラーゼでプライマー伸長反応条件に供した(図12A、矢印はオリゴヌクレオチドが連結されたdCTP組み込み部位を示す)。反応混合物は、オリゴヌクレオチドが連結されたデオキシシチジンおよび未修飾(天然)のdATP、dTTPおよびdGTPを含んだ。次いで、反応産物を20%TBE-尿素PAGEで分解した(図12B)。レーン8の複数のバンドにより、複数のオリゴヌクレオチドが連結されたヌクレオチド組み込み事象が確認する。したがって、典型的な反応条件下(緩衝液および反応温度など)で、Maxima H-RTは、合成されたDNA鎖の複数の位置にオリゴヌクレオチドが連結されたヌクレオチドを組み込むことができた。また、DNA/DNAまたはDNA/RNAプライマー/鋳型系のいずれかが使用された場合、逆転写酵素は、オリゴヌクレオチドが連結されたヌクレオチドを組み込み、核酸鎖をさらに伸ばすことができた。
B.オリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込み
オリゴヌクレオチドが連結されたデオキシヌクレオチドと同様の実験系を使用した。2つのアニーリングされたオリゴヌクレオチドの二本鎖の突出した5’末端の充填を実施した。dTTPとの反応は、突出した末端での完全な充填、および10ヌクレオチドまでプライマーの伸長をもたらしたが、単一のオリゴヌクレオチドが連結されたジデオキシヌクレオチドを組み込むと、23ntのオリゴヌクレオチド(末端デオキシヌクレオチドトランスフェラーゼ(TdT)およびポリ(U)ポリメラーゼについては配列番号2、ならびに他のポリメラーゼ反応については配列番号1)でプライマーが標識化された。
プライマー伸長反応は、試験した各ポリメラーゼについて最適な緩衝液および温度で実施された。反応ごとに、2pmolの基質オリゴヌクレオチド二本鎖(配列番号31および32、図33)および20pmolのdTTPまたはオリゴヌクレオチドに連結されたddUTP(化合物10の構造に対応)を使用した。次いで、反応産物を15%TBE-尿素PAGEで分解した(TdT(Thermo Scientific)の結果を図13に、他のポリメラーゼの結果を図15A-15Eに示す)。伸長プライマーは5’-Cy5蛍光標識を有するため、プライマー伸長産物が検出された。オリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みによってRNAの3’末端を標識するポリ(U)ポリメラーゼ(New England Biolabs、MA,USA)の能力を、合成した100ntの転写産物で試験した。1pmolのRNAおよび10pmolのオリゴヌクレオチドが連結されたddUTP(配列番号2)を、製造元の推奨に従って実施されたテーリング反応に使用した。Collibri(商標)Library Cleanup Kit(Thermo Scientific)を使用して反応産物を精製し、Small RNA Kitを使用してAgilent 2100 Bioanalyzerで分析した(図14)。この実験の結果により、ポリ(U)ポリメラーゼがオリゴヌクレオチドが連結されたddUTPを組み込んでいることを確認する。
オリゴヌクレオチドが連結されたddUTPの組み込みが可能であると同定されたポリメラーゼは、Superscript(商標)IV、Superscript(商標)II、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、およびPhusion exo-(図15A~15E)、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)(図13)、およびポリ(U)ポリメラーゼ(図14)を含む。この実施例および図13から15で提供される結果は、有利には、A型、B型、X型ポリメラーゼおよび逆転写酵素を含む様々な種類のプのポリメラーゼが、本開示のオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みに使用され得ることを示す。さらに、ポリUポリメラーゼなどの鋳型非依存性RNAポリメラーゼは、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを組み込むことができる。また、組み込みは、対応するポリメラーゼに典型的な、緩衝液および温度などの反応条件下で起こり得る。
実施例3.読み過ごし評価実験
Stasevskij et al.によって実証された非天然な接合のポリメラーゼの読み過ごしは、発明者らの実験モデルにおいて(図16のプロセススキーム)確認された。簡単に説明すると、特定のプライマーは、組み込まれたオリゴヌクレオチドが連結されたヌクレオチドのポリメラーゼ読み過ごしが成功した場合にのみPCR産物を生成するように設計された。最初に、この特定の例において、第1のプライマーは、Phusion exo-DNAポリメラーゼによって組み込まれる最初のヌクレオチドがオリゴヌクレオチドが連結されたデオキシヌクレオチドであるように、鋳型にアニーリングされる。次いで、反応混合物の15%を別の反応混合物に移し、そこで第2のプライマーをアニーリングし、プライマー伸長のためにPfu DNAポリメラーゼが添加される。次いで、伸長断片を2x Maxima HS MasterMix(Thermo Scientific、ホットスタートTaq DNAポリメラーゼを含む)でPCR増幅する。正しい読み過ごし事象を確認するために、得られたPCR断片をクローン化し、サンガー配列決定を行った(データは示していない)。結果は、予想されるオリゴヌクレオチドが連結されたヌクレオチドの組み込み位置、および連結されたオリゴヌクレオチドの5’-ヌクレオチドとオリゴヌクレオチドが連結されたヌクレオチドとの間のリンカーをポリメラーゼが読み過ごすことを示した。
上記のスキームのステップIII(図16)からの組み込まれたオリゴヌクレオチドが連結されたヌクレオチドのポリメラーゼプライマー伸長/読み過ごし産物を、読み過ごし産物の3’末端に相補的な一本鎖Cy5 29ntプライマーを含む別の短いPCR(図17A)において使用した。レーン6(図17B)で観察されたように、Cy5伸長プライマーのサイズはCy3プライマーと一致しており(両方の色素が観察された)、これは、連結されたオリゴヌクレオチドにアニーリングされたプライマーを伸長する場合に、ポリメラーゼが連結されたヌクレオチドによって形成された非天然リンカーを正しく読み過ごすことができるという結論につながる。一実施形態において、ポリメラーゼは、Phusion exo-である。
実施例4.NGSライブラリの調製
A.プライマー伸長およびランダム終結による配列決定対応のライブラリの調製
概念実証(図3)実験を、M13mp18一本鎖ゲノムDNAおよびEscherichia coliゲノムDNA、ならびに試料入力としてATCC(商標)MSA-1002(商標)20 Strain Even Mix Genomic Material(ATCC、VA,USA)を使用して実施した。M13mp18遺伝子座を標的とする2つの特異的プライマーは、5’末端にユニバーサルプライミング部位(配列番号8および9の1~21nt)を含むように設計された(図18A)。
配列番号8:5’-TACACGACGCTCTTCCGATCTAACGGTACGCCAGAATCTTG-3’
配列番号9:5’-TACACGACGCTCTTCCGATCTAGAGCCACCACCGGAAC-3’
両方のプライマーを以下の反応混合物中でM13mp18 DNAと混合した。125fmolの各配列番号8および配列番号9プライマー、100fmolのM13mp18 DNA、1.8pmolのオリゴヌクレオチドが連結されたddUTP(配列番号1)、18pmolのdTTP、20pmolのdATP、20pmolのdCTP、20pmolのdGTP、40UのThermo Sequenase(商標)(Thermo Scientific、MA,USA)、2μLの反応緩衝液およびヌクレアーゼフリーの水を20μLの最終反応量にしたもの。プライマー伸長反応は、95℃で30秒間の変性および60℃で2分間のアニーリング/伸長の15サイクル、続いて60℃で30分間の最終伸長で実施された。核酸の固定化について製造元の指示に従って、Dynabeads(商標)M-270ストレプトアビジン磁気ビーズ(Thermo Scientific、MA,USA)で精製することにより、オリゴヌクレオチドが連結されたddUTPを含む分子に対して反応産物を濃縮した。精製されたプライマー伸長産物を、Illumina(商標)システム用のCollibri(商標)Stranded RNA Library Prep Kit(Thermo Scientific、MA,USA)からの10X Index Primer Mixを使用して、この実験ではPCRサイクル数は30であったことを除いて標準のCollibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)の反応条件に従ってインデクシングPCRに供し、Illumina(商標)機器と互換性のある全長配列決定アダプターを導入した。あるいは、プライマー伸長反応量の半分を、中間精製ステップをしないでインデクシングPCRに直接移した。インデクシングPCRの後、Collibri(商標)Library Cleanup Kit(Thermo Scientific、MA,USA)を使用してライブラリを精製した。得られた試料中に配列決定対応分子が存在することは、標準のCollibri(商標)Library Quantification Kit(Thermo Scientific、MA,USA)プロトコルに従ったqPCRによって確認された。得られたライブラリは、MiSeq Reagent Nano Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq(商標)で配列決定され、2X75bpペアエンドリードが実施された。配列決定リードのM13mp18参照へのアラインメントは、5’末端が固定された位置で始まる2つのゲノム遺伝子座の予想されるカバレッジを示し、オリゴヌクレオチドが連結されたddUTP組み込み遺伝子座に対応する3’末端、はランダムな部位で発生した(図18B)。プライマー伸長反応後の精製の有無にかかわらず増幅された試料間で、配列決定結果に有意差はなかった。
ランダムデカマーは、全ゲノム配列決定用途においてオリゴヌクレオチドが連結されたジデオキシヌクレオチドを試験するために設計された。
配列番号10:5‘-TACACGACGCTCTTCCGATCTNNNNNNNNNN-3’
配列番号10のプライマーを以下の反応混合物中でE.coliのgDNAと混合した。20μLの最終反応容量に対して、350pg~100ngのE.coliのgDNA、10~100pmolのランダムデカマー、1.8pmolのオリゴヌクレオチドが連結されたddUTP(配列番号:1)、18pmolのdTTP、20pmolのdATP、20pmolのdCTP、20pmolのdGTP、40UのThermo Sequenase(商標)(Thermo Scientific、MA,USA)、2μLの反応緩衝液およびヌクレアーゼフリー水。プライマー伸長反応を以下のとおりに実施した。92℃で3分間変性し、続いて16℃に冷却し、16℃で5分間インキュベーションし、0.1℃/sのランプ速度で68℃に温度を上げ、68℃で15分間インキュベーションし、次いで92℃で30秒間の変性および68℃で5分間のアニーリング/伸長を25サイクルし、続いて68℃で30分間最終伸長した。精製されたプライマー伸長産物を、Illumina(商標)システム用のCollibri(商標)Stranded RNA Library Prep Kit(Thermo Scientific、MA,USA)からの10X Index Primer Mixを使用して、この実験ではPCRサイクル数は35であったことを除いて標準のCollibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)の反応条件に従ってインデクシングPCRに供し、Illumina(商標)機器と互換性のある全長配列決定アダプターを導入した。インデクシングPCRの後、Collibri(商標)Library Cleanup Kit(Thermo Scientific、MA,USA)を使用してライブラリを精製した。得られた試料中に配列決定対応分子が存在することは、標準のCollibri(商標)Library Quantification Kit(Thermo Scientific、MA,USA)プロトコルに従ったqPCRによって確認された。得られたライブラリは、MiSeq Reagent Nano Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq(商標)で配列決定され、2X100bpペアエンドリードが実施された。配列決定リードのE.coli K-12参照へのアラインメントは、全E.coli染色体に沿ってリードが分布して、>75%のアラインメント率を示した(図19)。
細菌の16S rRNA遺伝子の末端を標的とし、外側を向いている特定のプライマーは、16S rRNA遺伝子のゲノムコンテキストの分析に対するオリゴヌクレオチドが連結されたヌクレオチド技術の適用性を実証するために設計された(図20A-C)。この原理は、既知の特定の遺伝子座の近くにある未知の配列領域を調査することを目的とした任意の実験系に適用できる。
配列番号11:CTCTTTCCCTACACGACGCTCTTCCGATCTAAGTCGTAACAAGGTAACCG
配列番号12:CTCTTTCCCTACACGACGCTCTTCCGATCTCTGAGCCAKRATCAAACTCT
配列番号13:CTCTTTCCCTACACGACGCTCTTCCGATCTCTGAACCAAGATCAAATTCT
配列番号14:CTCTTTCCCTACACGACGCTCTTCCGATCTCTAAGCCAGGATCAAACTCT
配列番号15:CTCTTTCCCTACACGACGCTCTTCCGATCTCTGAGCCAGAATCGAACCCT
プライマー配列番号12、配列番号13、配列番号14および配列番号15をそれぞれ4:1:1:1のモル比で混合した。多重プライマー伸長反応を組み立てた。1μLのATCC(商標)MSA-1002(商標)20 Strain Even Mix Genomic Material(ATCC、VA,USA)、12.5pmolの配列番号11のプライマー、12.5pmolの配列番号12、配列番号13、配列番号14および配列番号15のプライマーミックス、1.8pmolのオリゴヌクレオチドが連結されたddUTP(配列番号1)、0.18pmolのオリゴヌクレオチドが連結されたddCTP(配列番号3)、18pmolのdTTP、18pmolのdCTP、20pmolのdGTP、20pmolのdATP、40UのThermo Sequenase(商標)(Thermo Scientific、MA,USA)、2μLの反応緩衝液およびヌクレアーゼフリーの水を20μLの最終反応量にしたもの。反応条件は以下のとおりであった:95℃で4分間の初期変性、15サイクルの線形伸長/終結(95℃で1分間、45℃で30秒間、72℃で1分間)、60℃で5分間の最終伸長。Collibri(商標)Library Cleanup Kit(Thermo Scientific、MA,USA)を使用して反応産物を精製した。全長のIllumina(商標)互換アダプターの最終増幅および導入は、Illumina(商標)システム用のCollibri(商標)Stranded RNA Library Prep Kit(Thermo Scientific、MA,USA)からの10X Index Primer Mixを使用して、この実験ではPCRサイクル数は20であったことを除いて標準のCollibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)の反応条件に従って実施された。インデクシングPCRの後、Collibri(商標)Library Cleanup Kit(Thermo Scientific、MA,USA)を使用してライブラリを精製した。
産生されたすべてのライブラリに配列決定対応分子が存在することは、標準のCollibri(商標)Library Quantification Kit(Thermo Scientific、MA,USA)プロトコルに従ったqPCRによって確認された。得られたライブラリは、MiSeq Reagent Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq(商標)で配列決定され、2X150bpペアエンドリードが実施された。
結果は、外向きのライブラリが複雑な細菌集団を特徴づけることができることを示した。20個の予想される種のうち17個が外向きの断片ライブラリ試料で同定された(図21)。
B.転写産物の長さ全体をカバーする配列決定対応のライブラリの調製
概念実証(図22)実験は、試料入力としてヒト全RNAを使用して実施された。最初に、1μlのUniversal Human Reference RNA(Thermo Scientific、MA,USA)試料を、Superscript(商標)IV逆転写酵素(Thermo Scientific、MA,USA)の標準プロトコルに従って、オリゴ(dT)30プライマーを使用して逆転写した。得られたcDNAを、断片化したRNAをクリーンアップするためのプロトコル(Collibri(商標)Stranded RNA Library Prep Kit(Thermo Scientific、MA,USA)マニュアルに記載)に従って、Collibri(商標)Library Cleanup Kitを使用して精製した。第2の鎖合成のために、以下の反応混合物を組み立てた。20μLの最終反応容量に対して、精製されたcDNA、1pmolのランダムプライマー(配列番号10)、18pmolのオリゴヌクレオチドが連結されたddUTP(配列番号1)、180pmolのdTTP、200pmolのdATP、200pmolのdCTP、200pmolのdGTP、40UのThermo Sequenase(商標)(Thermo Scientific、MA,USA)、2μLの反応緩衝液およびヌクレアーゼフリー水。反応条件は、95℃で3分間の変性、16℃に冷却および16℃で5分間のインキュベーション、50℃で30分間のプライマー伸長である。ランダムプライマー伸長の1サイクル後、核酸の固定化についての製造元の指示に従って、Dynabeads(商標)M-270ストレプトアビジン磁気ビーズ(Thermo Scientific、MA,USA)で精製することにより、オリゴヌクレオチドが連結されたddUTPを含む分子に対して反応産物を濃縮した。精製されたプライマー伸長産物を、Illumina(商標)システム用のCollibri(商標)Stranded RNA Library Prep Kit(Thermo Scientific、MA,USA)からの10X Index Primer Mixを使用して、標準のCollibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)の反応条件(この実験ではPCRサイクル数は20であった)に従ってインデクシングPCRに供し、Illumina(商標)機器と互換性のある全長配列決定アダプターを導入した。得られた試料中に配列決定対応分子が存在することは、標準のCollibri(商標)Library Quantification Kit(Thermo Scientific、MA,USA)プロトコルに従ったqPCRによって確認された。得られたライブラリは、MiSeq Reagent Nano Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq(商標)で配列決定され、2X75bpペアエンドリードが実施された。データ分析により、ヒトゲノムへの94.4~97.2%のアラインメント率、97.8~98.7%の鎖特異性、転写産物全体にわたる遺伝子本体のカバレッジは、mRNA配列決定ライブラリに典型的な3’末端にわずかにバイアスがあることが明らかになった(図23)。
C.転写産物の3’末端をカバーする配列決定対応のライブラリの調製
概念実証(図24)実験は、試料入力としてヒト全RNAを使用して実施された。Total Universal Human Reference RNA(Thermo Scientific、MA,USA)試料は、オリゴ(dT)プライマー配列番号16:5’-AAGCAGTGGTATCAACGCAGAGTACTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-3’を使用して逆転写された。
逆転写反応混合物は、20μLの最終反応容量に対して、20pg~1μgの全RNA、ERCC ExFold RNAスパイクイン(任意選択で、量は製造元の指示に従って選択、Thermo Scientific、MA,USA)、50pmolの逆転写プライマー(配列番号16)、10pmolのオリゴヌクレオチドが連結されたddUTP(配列番号1)、10pmolのdTTP、20pmolのdATP、20pmolのdCTP、20pmolのdGTP、1μLの100mMのDTT、4μLのSuperscript(商標)IV(Thermo Scientific、MA,USA)用の5X RT緩衝液、200UのSuperscript(商標)IV(Thermo Scientific、MA,USA)およびヌクレアーゼフリーの水である。反応は50℃で30分間行った。核酸の固定化についての製造元の指示に従って、Dynabeads(商標)M-270ストレプトアビジン磁気ビーズ(Thermo Scientific、MA,USA)で精製することにより、オリゴヌクレオチドが連結されたddUTPを含む分子に対して反応産物を濃縮した。次いで、タグ付けされたcDNAを、標準のCollibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)の反応条件に従ってインデクシングPCRに直接供し得る。この実験のPCRサイクル数は、開始入力量に応じて20~25であり、インデクシングプライマーは次のとおりである。
配列番号17:5’-AATGATACGGCGACCACCGAGATCTACACGCCTGTCCGCGGAAGCAGTGGTATCAACGCAGAGTAC-3’
配列番号18:5‘-CAAGCAGAAGACGGCATACGAGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3‘
あるいは、試料は、増幅に使用されるポリメラーゼよりも非定型リンカーの読み過ごしの高い効率を示すポリメラーゼを使用して線形に前増幅され得る。この場合、精製されたタグ付けされたcDNAを以下の反応に供した。20μLの最終反応容量に対して、cDNA、4μLの5X Phusion(商標)HF緩衝液(Thermo Scientific、MA,USA)、1μLのdNTPミックス(各2mM)、1.2pmolのddUTPにコンジュゲートしたオリゴヌクレオチドに相補的なプライマー(配列番号18)、2.5UのPhusion exo-(Thermo Scientific、MA,USA)およびヌクレアーゼフリー水。プライマー伸長を、95℃で1分間の変性、60℃で1分間のアニーリング、および72℃で1分間の伸長を10サイクルで実施した。次いで、断片化したRNAをクリーンアップするためのプロトコル(Collibri(商標)Stranded RNA Library Prep Kit(Thermo Scientific、MA,USA)マニュアルに記載)に従って、Collibri(商標)Library Cleanup Kitを使用して反応産物を精製した。線形前増幅した後、試料を非対称的にPCR増幅し、全長配列決定アダプターの導入を完了した。50μLの最終反応容量に対して、20μLの精製された線形増幅産物、25μLのCollibri(商標)Library Amplification Master Mix、46pmolの配列番号17のプライマー、4.6pmolの配列番号19:5’-CAAGCAGAAGACGGCATACGA-3’プライマーおよびヌクレアーゼフリー水。PCR条件は、標準のCollibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)プロトコルにおいて推奨されているとおりであったが、この実験のPCRサイクル数は、開始入力量に応じて20~25であった。PCR後、Collibri(商標)Library Cleanup Kit(Thermo Scientific、MA,USA)を使用してライブラリを精製した。得られた試料中に配列決定対応分子が存在することは、標準のCollibri(商標)Library Quantification Kit(Thermo Scientific、MA,USA)プロトコルに従ったqPCRによって確認された。得られたライブラリは、MiSeq Reagent Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq(商標)で配列決定され、ペアエンドリード(10bpのR1および75bpのR2)が実施された。データ分析は、ヒトゲノムへの>90%のアラインメント率、>99%の鎖特異性、および3’末端への強いバイアスを有する遺伝子本体カバレッジを示した(図25)。
あるいは、5’ヘキシニル修飾を有するオリゴヌクレオチドを使用して合成された配列番号4のオリゴヌクレオチドが連結されたヌクレオチドを使用して、同等の品質の配列決定データを得た。逆転写反応条件および3’mRNA-seqライブラリの下流処理は上記のとおりであった。得られたライブラリは、オリゴヌクレオチドが連結されたヌクレオチドの組み込み部位から開始する配列決定リードにおいて期待される塩基組成を示した(図26A~26B)。
mRNAの3’末端をカバーする配列決定対応ライブラリは、複数の単一細胞からも調製され得る。HEK293細胞およびBALB/3T3細胞の混合物を、細胞およびバーコード付けされたビーズの同時カプセル化に使用されたNadia(商標)機器(Dolomite Bio,Blacktrace Holdings Ltd、Royston,UK)についての推奨に従って調製した。オリゴ(dT)30プライマー(配列番号40)、ビーズ特異的バーコード、および特有の分子同定子(UMI)として機能するランダム化領域を含むバーコード付けされたビーズ(ChemGenes、MA,USA)を、Dolomite Bioの推奨に従って調製し、それを使用して、cDNA合成をプライミングし、区画特異的および分子特異的タグを導入した。
カプセル化に続いて、エマルジョンを破壊し、Nadia(商標)についての標準的なDrop-seqのプロトコルにおける推奨のとおりにビーズを洗浄した。次に、ビーズを以下のとおりに実施した逆転写反応に供した。220μLの最終容量に対して、44μLの5X Superscript IV緩衝液(Thermo Scientific、MA,USA)、344pmolのオリゴヌクレオチドが連結されたddCTP(配列番号3)、50nmolのdATP、50nmolのdCTP、50nmolのdGTP、50nmolのdTTP、11μLの100mMのDTT、44μLの20%のFicoll(商標)PM400(Sigma-Aldrich、MO,USA)、220UのRNaseOUT(商標)組換えリボヌクレアーゼ阻害剤(Thermo Scientific、MA,USA)、2200UのSuperscript IV(Thermo Scientific、MA,USA)、およびヌクレアーゼフリー水。ビーズを200μLの逆転写反応混合物に懸濁し、室温で30分間インキュベーションした後、50℃で1時間第2のインキュベーションを行った。次いで、Nadia(商標)プロトコルの指示について標準のDrop-seqに従ってビーズを洗浄し、線形増幅に供した。50μLの最終反応容量に対して、約2000個のビーズ、10μLの5X Phusion HF緩衝液(Thermo Scientific、MA,USA)、5nmolのdATP、5nmolのdCTP、5nmolのdGTP、5nmolのdTTP、300pmolの配列番号18のオリゴヌクレオチド、6.25UのPhusion exo-(Thermo Scientific、MA,USA)、およびヌクレアーゼフリー水。線形増幅は、95℃で1分間の変性、60℃で1分間のアニーリング、72℃で1分間の伸長を10サイクルで実施された。次いで、Collibri(商標)Library Cleanup Kit(Thermo Scientific、MA,USA)を使用して反応産物を精製し、このステップでビーズを廃棄した。次に、精製された線形増幅産物を、Collibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)、46pmolの配列番号17のプライマーおよび4.6pmolの配列番号19のプライマーを使用して増幅した。PCRサイクル数は25であった。
得られたライブラリに配列決定対応分子が存在することは、標準のCollibri(商標)Library Quantification Kit(Thermo Scientific、MA,USA)プロトコルに従ったqPCRによって確認された。次いで、ライブラリは、MiSeq Reagent Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq(商標)で配列決定され、ペアエンドリード(21bpのR1および75bpのR2)が実施された。データ分析は、細胞トランスクリプトームのタンパク質コード部分の予想される捕捉を示した(図27A~27D)。
あるいは、細胞をバーコードビーズおよび液滴中のRT/溶解混合物でカプセル化し得、逆転写反応後にエマルジョンを破壊し得る。
D.転写産物の5’末端をカバーする配列決定対応のライブラリの調製
概念実証(図28)実験は、試料入力としてヒト全RNAを使用して実施された。最初に、total Universal Human Reference RNA(Thermo Scientific、MA,USA)試料を、オリゴ(dT)プライマー(配列番号9)および以下の配列の鋳型スイッチオリゴヌクレオチドを使用して逆転写した。「G」の前の「r」はリボヌクレオチド塩基を示す。
配列番号20:5‘-CCAGGACCAGCGATTCNNNNNNNNrGrGrG-3’
反応混合物は、19μLの最終容量に対して、1μgの全RNA、50pmolの逆転写プライマー(配列番号16)、4μLのSuperscript(商標)IV用5X RT緩衝液(Thermo Scientific、MA,USA)、1μLのdNTPミックス(各10mM)、1μLの100mMのDTT、3μLの50%(w/v)のPEG-8000、200UのSuperscript(商標)IV(Thermo Scientific、MA,USA)およびヌクレアーゼフリー水である。逆転写反応を、50℃で10分間実施した。次いで、反応混合物に20pmolの鋳型スイッチオリゴヌクレオチド(配列番号20)を補充し、50℃でさらに15分間インキュベーションした。次いで、断片化されたRNAのクリーンアップについてのプロトコル(Collibri(商標)Stranded RNA Library Prep Kit(Thermo Scientific、MA,USA)マニュアルに記載)に従って、Collibri(商標)Library Cleanup Kitを使用してcDNAを精製した。転写産物の5’末端にタグ付けされた配列番号20オリゴヌクレオチドに対応するcDNA領域に相補的な(下線を引いた)プライマー配列番号21を使用して、第2の鎖合成を実施した。

Figure 2022537069000034
第2の鎖合成反応混合物は、20μLの最終反応容量に対して、精製されたcDNA、1pmolの配列番号21のプライマー、1.8pmolのオリゴヌクレオチドが連結されたddUTP(配列番号1)、18pmolのdTTP、20pmolのdATP、20pmolのdCTP、20pmolのdGTP、40UのThermo Sequenase(商標)(Thermo Scientific、MA,USA)、2μLの反応緩衝液およびヌクレアーゼフリー水である。プライマー伸長反応は、95℃で3分間の変性を1サイクル、次いで95℃で30秒間の変性および60℃で2分間のアニーリング/伸長を10サイクルを実施し、その後60℃で5分間最終伸長を行った。核酸の固定化についての製造元の指示に従って、Dynabeads(商標)M-270ストレプトアビジン磁気ビーズ(Thermo Scientific、MA,USA)で精製することにより、オリゴヌクレオチドが連結されたddUTPを含む分子に対して反応産物を濃縮した。精製されたプライマー伸長産物を、配列番号17または配列番号18のプライマーを使用して、この実験ではPCRサイクル数は25であったことを除いて標準のCollibri(商標)Library Amplification Master Mix(Thermo Scientific、MA,USA)の反応条件に従ってインデクシングPCRに供し、Illumina(商標)機器と互換性のある全長配列決定アダプターを導入した。インデクシング後、Collibri(商標)Library Cleanup Kit(Thermo Scientific、MA,USA)を使用してPCRライブラリを精製した。得られた試料中に配列決定対応分子が存在することは、標準のCollibri(商標)Library Quantification Kit(Thermo Scientific、MA,USA)プロトコルに従ったqPCRによって確認された。得られたライブラリは、MiSeq Reagent Nano Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq(商標)で配列決定され、ペアエンドリード(100bpのR1および75bpのR2)が実施された。データ分析は、ヒトゲノムへの83%のアラインメント率、91.1%の鎖特異性、および5’末端へのバイアスを有する遺伝子本体カバレッジを示した(図29)。
E.PCRフリーの配列決定対応ライブラリの調製
配列決定プラットフォームに統合されたポリメラーゼがコンジュゲーションリンカーを読み過ごすことができる限り、DNA試料およびRNA試料の両方からPCRフリーの配列決定対応ライブラリの調製が可能である。全長アダプターに対応する5’アンカーを有するプライマーを使用したワンステップのプライマー伸長、および第2の全長プラットフォーム特異的アダプター配列を有するオリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みによる終結は、増幅ステップなしで配列決定に供され得る配列決定対応一本鎖ライブラリを完全に生成することができる。これは、必要なライブラリの調製のステップが少なくなるという利点を提供する。RNA試料を使用する場合、そのような戦略は、5’および3’末端にアダプターを含む配列決定対応の一本鎖DNAを達成するために必要なのは、第1の鎖のcDNAの合成のみであるというさらなる利点を提供する。
以下の実験(対応するスキームは図35Aに提供される)は、入力としてUniversal Human Reference RNA(Thermo Fisher)を使用して実施された。全長Illumina P5アダプター(配列番号34の1~57ヌクレオチド)を含む逆転写プライマー(配列番号34)を使用して、500ngのRNAを逆転写した。
配列番号34:5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-3’
RNAを、5mMのDTTを補充した1X Superscript IV RT緩衝液(Thermo Scientific、MA,USA)中、50pmolの逆転写プライマー、20pmolのdNTPミックス、2pmolのオリゴヌクレオチドが連結されたddCTP(配列番号35)、200UのSuperscript IV逆転写酵素と混合した。反応容量は20μLであった。反応を50℃で30分間実施し、続いて80℃で10分間不活化した。
配列番号35:ddCTP-AldU-AGATCGGAAGAGCACACGTCTGAACTCCAGTCACATGCCTAAATCTCGTATGCCGTCTTCTGCTTG-3’-ビオチン
不活化後、RNase H(Thermo Scientific、MA,USA)を反応混合物に添加して、RNA:cDNA二重鎖からRNA鎖を分解した。RNase Hでの反応を37℃で20分間インキュベーションした。オリゴヌクレオチドが連結されたジデオキシヌクレオチドで標識されたcDNAは、核酸の固定化についての製造元の指示に従って、Dynabeads M-270ストレプトアビジン磁気ビーズ(Thermo Scientific、MA,USA)で精製された。精製されたcDNA断片を、MiSeq Nano Reagent Kit v2,300サイクル(Illumina、CA,USA)を使用して、Illumina MiSeq機器で配列決定に直接供した(有利なことに、断片ライブラリはすでにssDNA形式であるため、NaOH変性ステップは必要なかった)。25bp R1および100bp R2のペアエンドリードが実施された。データ分析により、正しい構造のリードの存在が明らかになった(すなわち、オリゴヌクレオチドに連結されたジデオキシヌクレオチド内のAldU修飾に対応するAGヌクレオチドから始まるR2、およびddCTP組み込み部位、図35B)。そのようなリードの93%は、タンパク質をコードする遺伝子に対応し、実験計画から予想されるように転写物の3’末端をカバーしていた(図35C)。
同様の原理を、DNA試料からのPCRフリーのライブラリの調製にも採用し得る。全長アダプターハンドルは、オリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みが可能なDNAポリメラーゼによって伸長され得る、任意のランダムまたは配列特異的プライマーの5’領域に付加され得る。一例として、Thermo SequenaseまたはPhusion exo-DNAポリメラーゼを使用し得る。
F.DNAの線形増幅および配列決定対応のライブラリの調製
線形DNA増幅は、T7プロモーター配列番号5から特異的にRNA合成を開始するT7 RNAポリメラーゼを使用したインビトロ転写を介して実施される。T7プロモーター配列のDNAのタグ付けは、そのような配列を含むオリゴヌクレオチドが連結されたヌクレオチドの組み込みによって達成される。
オリゴヌクレオチドが連結されたヌクレオチド(配列番号22)からのインビトロ転写開始を実施して、そのような複合体のRNA合成の開始部位として機能する能力を試験した。配列番号22のオリゴヌクレオチドが連結されたデオキシヌクレオチドは、配列番号24のオリゴヌクレオチドの伸長により、オリゴヌクレオチド二本鎖配列番号24+配列番号25に組み込まれた。
配列番号24:5’-TGCAGACATGGGTAGGCATCCTTGGCGTA-3’
配列番号25:5’-GTACGCCAAGGATGCCTACCCATGTCTGCA-3’
次いで、相補鎖(配列番号26)を添加して、T7 RNAポリメラーゼプロモーターが二本鎖であることを確実にした。
配列番号26:5’-CTAATACGACTCACTATAGGTGTTACATCTGGTAGTCAGTCTCCAATAAATATATAAA-3’
推奨されるTranscriptAid(商標)T7 High Yield Transcription Kit(Thermo Scientific、MA,USA)の反応条件に従って、インビトロ転写を実施し、インキュベーションを37℃で一晩実施した。次いで、転写産物をDNase Iで処理して鋳型を除去し、Agencourt AMPureXP(商標)磁気ビーズ(Beckman Coulter、CA,USA)を使用してRNAを精製した。得られた転写産物を、RNA Pico6000キットを使用してAgilent 2100 Bioanalyzerで分析した。結果は、RNA転写産物の存在を示した(図30)。結果は、オリゴヌクレオチドが連結されたヌクレオチドに含まれるT7プロモーター配列が機能的であり、インビトロ転写開始部位として機能し得、T7 RNAポリメラーゼがオリゴヌクレオチドが連結されたヌクレオチドの非天然リンカーを読み過ごすことができたことを示す。
実施例5.DNA末端標識化
A.核酸の5’末端のタグ付け
いくつかの実施形態において、オリゴヌクレオチドは、抗逆キャップ類似体(ARCA)または同様の構造に結合され得る(図34)。この場合、オリゴヌクレオチドはその3’末端を介してヌクレオチドにコンジュゲートされる。そのようなオリゴヌクレオチドが連結されたキャッピングヌクレオチドは、インビトロ転写によるそれらのデノボ合成中の核酸の5’末端のタグ付けに有用である。オリゴヌクレオチドが連結されたキャッピングヌクレオチドは、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、またはそのようなポリメラーゼの操作された変異体バリアントなどのRNAポリメラーゼによって、RNA、DNA、またはキメラ転写物に組み込まれ得る。
いくつかの状況において、オリゴヌクレオチドは、その後の増幅のために、5’末端に事前に設計されたプライミング部位を提供する。3’末端の追加のプライミング部位は、オリゴヌクレオチドが連結されたヌクレオチドでのタグ付け、TdT、PAPまたはPUPを使用したホモポリマー尾部の追加、または一本鎖アダプターのライゲーションを介して付加することができる。
B.鋳型非依存性DNA末端標識化
末端デオキシヌクレオチドトランスフェラーゼ(TdT)によるオリゴヌクレオチドが連結されたジデオキシヌクレオチド(OTDDN)の組み込みを介して、事前に設計された配列での鋳型非依存性DNA 3’末端標識化を達成し得る。標識化の第1のラウンドの後、コンジュゲーションリンカーを読み過ごすことができる任意のポリメラーゼによってジデオキシヌクレオチドにコンジュゲートされたオリゴヌクレオチドからのプライマー伸長時に相補鎖を合成し得る。次いで、新たに合成された鎖がアクセス可能な3’末端を有するため、DNA末端標識化の第2のラウンドを実施し得る。
実験は、以下の配列の鋳型オリゴヌクレオチド(配列番号36)を使用して実施された。
配列番号36:リン酸-5’-GCGGCGACCAAATCGTTGTAAAGATCGGAAGAGCGTCGTGTA-3’
第1の3’末端標識化を、1X TdT緩衝液中で、2pmolの鋳型オリゴヌクレオチド(配列番号36)、100pmolの配列番号4のオリゴヌクレオチドが連結されたヌクレオチド、40UのTdT酵素(Thermo Scientific、MA,USA)を使用して実施した。反応容量は30μLであった。反応混合物を37℃で1.5時間インキュベーションし、続いて70℃で10分間反応を終結させた。タグ付けされた鋳型オリゴヌクレオチドをエタノール沈殿により精製し、第2の鎖合成に使用した。精製したDNAを、1X Phusion GC緩衝液(Thermo Scientific、MA,USA)中の30UのPhusion exo-DNAポリメラーゼ(Thermo Scientific、MA,USA)、4pmolの標識されたプライマー(配列番号37)および16pmolの標識されていないプライマー(配列番号38)、オリゴヌクレオチドが連結されたジデオキシヌクレオチド、および0.2mMのdNTPミックスと混合した。
配列番号37:Cy5-5’-CAGACGTGTGCTCTTCCGATCT-3’
配列番号38:5’-CAGACGTGTGCTCTTCCGATCT-3’
反応混合物を、以下のサイクル条件を使用してサーマルサイクラーでインキュベーションした。98℃で1分間の変性、60℃で1分間のアニーリング、および72℃で1分間の伸長を20サイクル。反応産物をエタノール沈殿によって精製するか、Exo I(Thermo Scientific、MA,USA)で37℃で30分間処理した。試料の一部をラムダエキソヌクレアーゼ(Thermo Scientific、MA,USA)で2、10、または30分間のいずれかで処理した(図36B)。ラムダエキソヌクレアーゼを、80℃で10分間加熱することにより不活化した。Zeba Spin Desalting Columns,7K MWCO(Thermo Scientific、MA,USA)を使用して遊離ヌクレオチドを除去し、エタノール沈殿によって試料を精製した。
ラムダエキソヌクレアーゼ処理により鋳型鎖が除去され、その後の標識のために第2の鎖のみが残った。ラムダエキソヌクレアーゼ処理が行われなかった場合、二本鎖の二本鎖は第2のラウンドの標識化に供された(図36A)。第1の標識化反応の産物を、1X TdT緩衝液(Thermo Scientific、MA,USA)中で、100pmolのオリゴヌクレオチドが連結されたジデオキシヌクレオチド配列番号4および30UのTdT酵素と混合した。反応容量は16μLであった。反応混合物を37℃で1.5時間インキュベーションし、続いて70℃で10分間不活化した。次に、反応産物を15%TBE-尿素PAGEで分解した。
二重標識化産物はすべての場合に見られた。ssDNAはTdTのより良い基質であるため、一本鎖の第2の鎖を第2の標識化反応の鋳型として使用した場合、標識化はより効率的であった(図36B)。
C.鋳型依存性DNA末端標識化
両方の末端でオリゴヌクレオチドが連結されたジデオキシヌクレオチドによって標識された複数のDNA断片を作成することは、鋳型に依存する可能性があり、得られた断片を使用して、配列決定対応ライブラリを調製することができる。
実験は、図37Aに示される原理に従って実施された。E.coliゲノムDNAを鋳型として使用した。5ngのDNAを、20μLの1X Phusion HF緩衝液(Thermo Scientific、MA,USA)中で、20UのPhusionエキソ酵素(Thermo Scientific、MA,USA)、12.5pmolの特定のプライマー(配列番号39)、0.4pmolのオリゴヌクレオチドが連結されたジデオキシヌクレオチド配列番号4、4nmolのdNTPミックスと混合した。
配列番号39:5’-AAGTCGTAACAAGGTAACCG-3’
プライマー伸長および終結反応は以下のように実施された。98℃で30秒間の初期変性、続いて98℃で1分間の変性、45℃で30秒間のアニーリング、72℃で3分間の伸長を15サイクル、最終伸長は72℃で10分間実施された。Dynabeads Cleanup Beads(Thermo Scientific、MA,USA)を使用して、反応産物を精製した。精製されたDNAは、第1のオリゴヌクレオチドが連結されたジデオキシヌクレオチド領域からのプライマー伸長および終結によって第2のラウンドの標識化に供された。精製産物を、50μLの1X Phusion HF緩衝液(Thermo Scientific、MA,USA)中で、20UのPhusion exo-(Thermo Scientific、MA,USA)、10pmolのプライマー配列番号18、10pmolのオリゴヌクレオチドが連結されたジデオキシヌクレオチド配列番号6、10nmolのdNTPミックスと混合した。反応条件は、プライマーアニーリングステップが60℃で実施されたことを除いて、前の反応と同じであった。Dynabeads Cleanup Beads(Thermo Scientific、MA,USA)を使用して、反応産物を精製した。二重にタグ付けされたDNA断片を、50pmolのプライマー配列番号17および50pmolのプライマー配列番号19を使用した1X Collibri Library Amplification Master Mix(Thermo Scientific、MA,USA)における増幅によって濃縮した。サイクル条件は以下のとおりであった。98℃で30秒間の初期変性、続いて98℃で10秒間の変性、60℃で30秒間のアニーリング、72℃で30秒間の伸長を25サイクル、最終伸長は72℃で1分間実施された。Dynabeads Cleanup Beads(Thermo Scientific、MA,USA)を使用して、反応産物を精製した。得られたライブラリは、MiSeq Reagent Kit v2,300サイクル(Illumina、CA,USA)を使用してIllumina MiSeq機器で配列決定され、2X150bpペアエンドリードが実施された。データ分析により、正しい構造のリードの存在が明らかになった。すなわち、R1における第9の位置にAヌクレオチド、およびR2における第1の位置にAヌクレオチドを有するもであった(図37A~37B)。それらのリードを、E.coliゲノムにアラインメントした。
上記の原理は、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを組み込むことができ、Thermo Sequenaseとの組み合わせを含むがこれに限定されないコンジュゲーションリンカーを読み過ごすことができるDNAポリメラーゼの任意の組み合わせで実現され得る。各標識かステップで使用されるOTDDNの量は、取得可能なDNA断片サイズの制御につながるように変更され得る。
実施例6.単一細胞分析のための核酸ライブラリを生成するためのワークフローの改善。
いくつかの実施形態において、例えば、細胞または核での単一細胞分析のワークフローの改善を容易にするために、もう1つのオリゴヌクレオチドが連結されたジドキシヌクレオチド(OTddNTP)を組み合わせバーコーディング反応において使用し得る。例えば、いくつかの実施形態において、OTddNTPを、全トランスクリプトーム分析、全ゲノム分析、有向性mRNA分析、短いRNA(例えば、miRNA)分析、単一細胞タンパク質分析などの単一細胞ワークフローに組み込み得る。ほんの一例として、本明細書で提供されるのは、細胞集団内の単一細胞のトランスクリプトームを分析するためのワークフローである(図38を参照されたい)。いくつかの実施形態において、方法は、細胞内の核酸およびタンパク質が無傷のままであり、それらの起源の細胞内に固定されるように、細胞集団内の細胞を固定化および透過化するステップを含み得る。同時に、透過化ステップは、試薬(例えば、ポリメラーゼ、ヌクレオチド、プライマーなど)が、例えば、逆転写、プライマー伸長、ライゲーション増幅反応などにおいて機能することができる細胞に入るのを可能にするように機能する。細胞を固定化および透過化する多くの方法が当技術分野において既知である。例として、本明細書に開示の実施形態において有用な細胞を固定化および透過化するための方法は、Rosenberg,et al.(2018)Science(360)176-182,Supplementary Materials、米国特許出願公開第2016/0138086号、および国際特許出願公開第2014/060843号に記載のものを含むがこれらに限定されない。
いくつかの実施形態において、改善された組み合わせバーコーディングは、固定化/透過化された細胞を2つ以上の第1の部分(例えば、96、384個、または任意の他の数の部分)に分割するステップを含み得る。各第1の部分を、第1の伸長プライマーと接触させ得る。第1の伸長プライマーは、第1のユニバーサルハンドル配列を含み得る。本明細書で使用される場合、「ユニバーサル配列」という用語は、すべてのプライマーに存在する配列を指す。したがって、第1の伸長プライマーに存在する「第1のユニバーサルハンドル配列」という用語は、すべての第1の伸長プライマーに存在するハンドル配列を指す。
第1の(例えば、フォワード)伸長プライマーは、第1のバーコード配列を含み得る。プライマーはまた、第1のバーコードへの付加において目的のポリヌクレオチドへのランダムプライミングを可能にする3’配列(例えば、ランダムプライマー、ポリ(T)配列(例えば、30-merのT)、または標的特異的配列を含み得る。いくつかの実施形態において、第1のプライマーは、逆転写プライマーであり、第1のバーコードおよび3’ポリ(T)を含むプライマーと、第1のバーコードおよびランダムプライマー配列を含むプライマーとの組み合わせを含む。いくつかの実施形態において、逆転写プライマーは、5’末端にユニバーサルハンドルを含み得る。いくつかの実施形態において、逆転写プライマーは、特有の分子タグを含み得る。
いくつかの実施形態において、逆転写プライマーは、本明細書に記載のオリゴヌクレオチドが連結されたヌクレオチドを含む。
逆転写プライマーに加えて、固定化/透過化された細胞を、逆転写が起こることを可能にする条件下で、逆転写酵素、dNTP、および1つ以上のオリゴヌクレオチドが連結されたddNTPと接触させ得る。オリゴヌクレオチドが連結されたddNTPは、cDNAの終結点が各mRNAメッセージに対してランダムになるように、cDNAに沿ってランダムに第1の鎖のcDNA合成ステップに組み込まれ得る。そのため、cDNAがその後増幅される場合、ランダムな終結点を使用して、どの増幅産物が単一のmRNA/cDNAに由来するかを決定し得る。
いくつかの実施形態において、ddNTPに連結されたオリゴヌクレオチドは、3’末端にユニバーサルハンドルを含む。いくつかの実施形態において、その後、細胞を、結合することができ(例えば、相補的ヌクレオチド配列を介して)、非結合逆転写プライマーからの結合および/または伸長を阻害することができる1つ以上のブロッキングオリゴヌクレオチドと接触させ得る。いくつかの実施形態において、その後、細胞を1つ以上のブロッキングオリゴヌクレオチドと接触させない。
逆転写反応に続いて、固定化/透過化された細胞の部分をプールし、第2のラウンドのバーコード付加のために再び2つ以上の部分(例えば、96、384個、または任意の他の数の部分)に分割し得る。
実施例7.OTDDNワークフロー対SPLiT-seqワークフローの比較。SPLiT-seqワークフローは、図39に要約されているように、架橋、鋳型スイッチ、ライゲーションを介したバーコードの組み込み、およびNextera断片化を使用する単一細胞または核トランスクリプトーム分析のための周知の方法である(Rosenberg et al.,Science 360,176-182(2018)を参照されたい)。Rosenberg et al.に開示のプロトコルは、核酸配列決定およびトランスクリプトーム分析のためのヌクレオチドのライブラリを調製するのに最大10時間以上かかる場合がある。さらに、Rosenberg et al.に記載のプロトコルのようなcDNAおよびDNA配列にバーコードを付加するためにT4 DNAリガーゼを使用することよりも、重合によるバーコードの付加(OTDDNに存在する3’オリゴの伸長)は、より顕著に効率的である。そのため、本明細書に記載のワークフローは、必要な時間および操作を低減し、Rosenbergプロトコルと比較して感度を顕著に向上させる可能性を提供する。オリゴヌクレオチドが連結されたジデオキシヌクレオチのドワークフロー(実施例6および図40で説明されているようなOTDDNワークフロー)は、複数のワークフローステップ(例えば、鋳型スイッチおよびNextera断片化ステップなど)を回避して、ワークフロー時間を約4.5時間に顕著に低減できる。そのため、OTDDN組み合わせバーコーディングは、従来のSPLiT-seqプロトコルに必要な10時間以上と比較して、ワークフロー時間を顕著に低減できる。
このOTDDNワークフローにおいて、第1のS7-ME-RTバーコード-T30プライマーがmRNAのpolyA尾部に結合し、逆転写(RT)を可能にする。S7配列は、増幅中にアダプターを付加するためのハンドルとして機能し、モザイク末端(ME)配列は、Illuminaプラットフォームでの配列決定に使用される。さらに、図40の代表的な方法において、Illumina配列決定方法に特異的なアダプター(P7、P5、インデックス7、およびインデックス5)が付加されて、Illumina配列決定を可能にする。ただし、現在の方法では、特定のIlluminaアダプターを追加する必要はなく、方法論はどの配列決定プラットフォームに対して適応性がある。
実施例8.特有のバーコードを使用した分割およびプールする方法
単一細胞の分解能は、フローサイトメトリーまたは液滴法による分離など、様々な方法でライブラリの調製において達成され得る。本明細書に開示の組成物および方法は、単一細胞分解能を生成するための組み合わせバーコーディングの改善された方法を提供し、試料由来の細胞または核は、分割され、バーコード付けされ、そして複数回プールされる。このようにして、特定の単一セルからの試料は、分割、バーコーディング、およびプールの複数のラウンドを介した種々のバーコードの導入に基づいて、複数のバーコードを受け取ることができる。このプロセスは、同じ元の試料にあった他の単一細胞と比較して、特有の複数のバーコードのセット(つまり、バーコードの組み合わせ)を有する単一細胞由来の試料をもたらす。
現在の分割-プール方法の力は、バーコーディング尺度が利用可能なバーコードの数に直接比例することである。分割プールはまた、細胞を大量に処理することを可能にし、本明細書に記載のとおり多重化に適している。
実施例9.単一セルまたは核の分解能のための代表的なOTDDNベースの組み合わせバーコーディングワークフロー
この実施例では、OTDDNベースの組み合わせバーコーディングを使用して、HEK293細胞、NIH-3T3細胞、人工多能性幹細胞(iPSC)、および末梢血単核細胞(PBMC)由来の単一細胞の分析のためのNGS対応核酸ライブラリを調製した実験について説明する。
ステップ1-細胞の調製。HEK-293、NIH-3T3、iPSC、またはPBMCは、RNase阻害剤の存在下で細胞を1%または2.5%のパラホルムアルデヒド/1%のTrixtonX100と30分間インキュベーションすることで固定された。細胞を約5~10x105細胞/mLに希釈し、Flowmi(商標)40μ細胞ストレーナーで1%TritonX100および200UまたはSUPERASE(登録商標)RNAse阻害剤を含む細胞希釈緩衝液にろ過した……kkkkfjf……Countess(登録商標)IIセルカウンターを使用して細胞を二重にカウントした(15μl細胞+15μlトリパンブルー染色0.4%)。細胞密度が1x106細胞/mLより大きい場合、細胞を約5x105に希釈し、次いでろ過した。
ステップ2:逆転写(RT)。表3に示すように、RTマスターミックスを氷/コールドブロック上で調製した。
Figure 2022537069000035
RTマスターミックスをウェル当たり20μLで96ウェルRED MicroAmp EnduraPlateに分注した。EnduraPlateの各ウェルには、50pmolesの第1の伸長プライマーが事前に充填されている。第1の伸長プライマーは、特有のバーコード(つまり、ウェル特異的バーコード)およびユニバーサルな第1のハンドル配列を含んだ。プレートを密封し、短時間ボルテックスし、遠心分離して液体を収集した。RTマスターミックスに存在するOTDDNのオリゴ薬は、第2のユニバーサルハンドル配列を含んだ。
逆転写を50℃で30分間実施し、続いて4℃で保持した。
ステップ3-連結されたオリゴ伸長 ステップ2からのRT反応を事前に冷却した清潔な25mLリザーバーに混ぜ合わせ/プールして、よく混合し、2x1.5mlのエッペンドルフチューブに移した。チューブを800xgで3分間遠心分離した後、上清を除去した。
各チューブの内容物を、1X SSIV緩衝液および1%TritonX100を含む1mL洗浄緩衝液で再懸濁し、ピペッティングにより混合した。試料を800xgで3分間遠心分離した後、上清を除去した。洗浄は、合計2回の洗浄で繰り返した。
各チューブの内容物を1mLのRT洗浄緩衝液で再懸濁し、ピペッティングにより混合した。細胞をFlowmi(商標)40μm細胞ストレーナーで、事前に冷却した単一の25mLリザーバーにろ過した。表5に記載のオリゴ伸長マスターミックスをろ過した細胞混合物に加え、ピペッティングにより十分に混合した。
Figure 2022537069000036
20μLのプライマー伸長マスターミックス中のプールされた細胞を、第2のユニバーサルハンドル配列に相補的な領域である特有のバーコード(すなわち、ウェル特異的バーコード)、およびユニバーサル第3のハンドル配列を含む50pmolesのスプリントオリゴヌクレオチドを事前充填した96ウェルのBLUE MicroAmp EnduraPlateの各ウェルに添加した。スプリントを横断するオリゴ伸長を、50℃で20分間実施し、続いて4℃で保持した。
ステップ4細胞溶解。2X溶解緩衝液を37℃に少なくとも10分間予熱した。各ウェルに2μLの0.5MのEDTAを添加し、ウェルを混合することにより、伸長反応を停止した。細胞を予冷したリザーバーにプールし、よく混合し、2本の1.5mLエッペンドルフチューブに移した。800xgで3分間遠心分離して細胞をペレット化し、上清を除去した。)。細胞ペレットを1%のTritonX100を含む1mLの細胞洗浄緩衝液に再懸濁し、ピペッティングにより混合した。細胞洗浄を繰り返し、ペレットを700μLの細胞洗浄緩衝液中に混ぜ合わせた。試料を混合し、Flowmi(商標)40μm細胞ストレーナーを通して新しい1.5mLチューブにろ過した。25μLのろ過した細胞を、100μgのプロテイナーゼKおよび25μLの2X溶解緩衝液を含む96ウェルプレートの各ウェルに分注した。
消化は、Eppendorf Thermomixer(登録商標)内で55~56℃、300rpmで30分間インキュベーションした。
ステップ5 Ampure(商標)ビーズ(SPRIビーズの一種)を使用した伸長プライマーの精製。Ampureビーズを室温に戻し、完全に混合した。各反応について、45μLのビーズを各ウェルにピペットで移し、製造元のプロトコルに従って精製した。ビーズを25μlの低TE緩衝液で再懸濁し、室温で2分間インキュベーションし、磁気ラックに戻した。ライブラリ増幅のために上清を採取した。
ステップ6 ライブラリの増幅。20UのPfusion(商標)エキソポリメラーゼを補充した25μLのCollibri(商標)Library Amplification Master Mix(ThermoFisher Scientific、Waltham,MA)を96ウェルプレートの各ウェルに分注した。PCRマスターミックスを含む各ウェルに24μlのLTEで溶出したcDNAを添加した。1μLの50μMのバーコード付けられたPCRプライマーを各ウェルに添加した。バーコード付けされたPCRプライマーは、5’末端に配列決定アダプター、第1のハンドル配列に一致する配列を有するフォワードプライマーと、5’から3’方向、配列決定アダプター、特有の(ウェル特異的な)バーコード、および第3のハンドル配列に一致する配列を含むリバースPCRプライマーとを含んだ。表8に記載のとおりPCRを行った。
Figure 2022537069000037
ステップ7 ライブラリの精製。40μLのAmpure(商標)ビーズを各ウェルにピペットで移し、反応混合物を製造元のプロトコルに従って精製し、最終容量に溶出した。28μl LTE
ステップ8 ライブラリの増幅および定量。バイオアナライザー(250~550塩基対)によって測定されたライブラリの収量が2nMを超える場合、ライブラリの増幅はスキップされ、方法は直接配列決定に移行した。
表9に記載のとおり、ライブラリ増幅マスターミックスを調製した。
Figure 2022537069000038
12μLのマスターミックスを上から各ウェルライブラリウェルに分注した(溶出したライブラリをサイクルのために新しいウェルに移す必要はなかった)。表10に記載のプログラムを使用して増幅を行った。
Figure 2022537069000039
ステップ9 ライブラリの精製。Ampureビーズを室温に戻し、完全に混合した。各反応について、32μLのビーズを各ウェルにピペットで移し、製造元の指示に従って精製し、25μLの低TE緩衝液に溶出した。収量およびライブラリプロファイルをバイオアナライザーで評価した。
この時点で、ライブラリは配列決定の準備ができおり、配列決定は、様々な配列決定方法で実施され得る。cDNA増幅中に付加されたアダプターは、配列決定プラットフォームに特異的なものであり得る。
図43Aおよび43Bは、バイオアナライザーを介して決定された、第1の増幅(それぞれ1.2nMおよび350塩基対)および第2の増幅(45nMおよび350~400塩基対)後の上記のプロトコルに従ってiPSCから調製された核酸ライブラリの平均収量および平均サイズを示す。
図44は、上記のプロトコルに従ってPBMCから調製された核酸ライブラリの平均収量および平均サイズを示す。
図45は、PBMCがマスターミックスおよび乾燥プレートでも試験されたことを示す。第2のPCR増幅後、すべての反応が増幅され、産物のサイズおよび形状は正しいように見えた。本明細書に記載するOTDDN組み合わせバーコーディング方法の単一細胞分解能を試験するために、NIH-3T3マウス細胞およびHEK-293ヒト細胞から調製された核酸ライブラリを混合し、製造元の指示に従ってIllumina MiSeq(商標)で分析した。マップされたリードはバーコードで選別され、種ごとにプロットされた。図45に示すように、X軸のバーコードはヒト配列のリード(ヒトリード)であり、Y軸のバーコードはマウス配列のリード(マウスリード)である。したがって、軸上のバーコードは単一の細胞であり得るが、軸から外れたバーコードは、同じバーコードを共有する2つ以上の細胞が原因である。
図45からのデータは、非単一細胞率が1,000細胞で約0.5%であったことを示す。これらの値は、1,000細胞で0.9%の10X要求、および1,000細胞で0.6%のBD要求など、他の方法で要求される非単一細胞率で良好である。
単一細胞の分解能は、PBMCおよびiPSCの試料を組み合わせて使用しても示された。表14に示す結果は、2つの細胞型間の転写産物の重複がほとんどないことを示しており、各細胞型からのデータは、これらの細胞において発現することが知られている転写産物の存在を示す。
Figure 2022537069000040
実施例14.実施形態
以下は、本明細書に記載の異なる実施形態の代表的なアイテムのリストである。
アイテム1.式(I)のオリゴヌクレオチドが連結されたヌクレオチド
Figure 2022537069000041
またはその塩であって、
式中、Xは、H、N3、またはOHであり、
NBは、アデニン、7-デアザ-アデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される核酸塩基を表し、
ZおよびYはリンカーであり、ZおよびYは、各々独立して、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、またはそれらの任意の組み合わせから選択される少なくとも1つの連結部位を含み、
クリックは、クリック反応の産物であり、
オリゴは、3~100ヌクレオチドの長さのオリゴヌクレオチドである、オリゴヌクレオチドが連結されたヌクレオチド。
アイテム2.クリックが、以下の対の官能基、
i)アルキニルおよびアジド、
ii)アジドおよびアルキニル、
iii)チオールおよびアルキニル、
iv)アルキニルおよびチオール、
v)チオールおよびアルケニル、
vi)アルケニルおよびチオール、
vii)アジドおよびシクロオクタニル、
viii)シクロオクタニルおよびアジド、
xi)ニトロンおよびシクロオクタニル、ならびに
xii)シクロオクタニルおよびニトロンのうちの1つの間のクリック反応の産物である、アイテム1に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム3.式(II)のオリゴヌクレオチドが連結されたヌクレオチド
Figure 2022537069000042
またはその塩であって、
式中、Xは、H、OH、N3であり、
NBは、アデニン、7-デアザ-アデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される核酸塩基を表し、
ZおよびYはリンカーであり、ZおよびYは、各々独立して、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、またはそれらの任意の組み合わせから選択される少なくとも1つの連結部位を含み、
オリゴは、3~100ヌクレオチドの長さのオリゴヌクレオチドである、オリゴヌクレオチドが連結されたヌクレオチド。
アイテム4.Xが、OHである、アイテム1~3のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム5.Xが、Hである、アイテム1~3のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム6.アルキレンが、C1-C6,アルキレンである、アイテム1~5のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム7.アルケニレンが、C2-C6アルケニレンである、アイテム1~6のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム8.アルキニレンが、C2-C6アルキニレンである、アイテム1~7のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム9.ポリアルキレングリコールが、2~8個のグリコール単位を有する、アイテム1~8のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム10.オリゴヌクレオチドが、その5’末端でヌクレオチドに連結される、アイテム1~9のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム11.ZおよびYの一方が、トリアゾール環の1位に共有結合で結合し、ZおよびYの他方が、トリアゾール環の4位に共有結合で結合する、アイテム1~10のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム12.Zが、トリアゾール環の1位に共有結合で結合し、Yが、トリアゾール環の1位に共有結合で結合する、アイテム11に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム13.Zが、トリアゾール環の4位に共有結合で結合し、Yが、トリアゾール環の1位に共有結合で結合する、アイテム11に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム14.式(III)
Figure 2022537069000043
またはその塩を有し、式中、
1が、アルキレン、ポリアルキレングリコール、またはそれらの組み合わせを含むリンカーであり、
2が、アルキニレンを含むリンカーである、アイテム11に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム15.L1が、2、4、または6個のアルケニレングリコール基を有するポリアルケニレングリコールを含む、アイテム14に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム16.ポリアルケニレングリコールが、ポリエチレングリコールである、アイテム14または15に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム17.L1が、1~12個の炭素原子を有するアルキレンを含む、アイテム14に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム18.アルキレンが、メチレン、エチレン、n-プロピレン、イソプロピレン、1-ブチレン、シス--2-ブチレン、トランス--2-ブチレン、イソブチレン、1-ペンチレン、シス--2-ペンチレン、トランス--2-ペンチレン、イソペンチレン、またはヘキシレンである、アイテム17に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム19.L2が、ヘキシニルである、アイテム14に記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム20.核酸塩基が、ピリミジンであり、ピリミジンが、核酸塩基の5位でオリゴヌクレオチドに連結される、アイテム1~19のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム21.核酸塩基が、プリンであり、プリンが、核酸塩基の7位でオリゴヌクレオチドに連結される、アイテム1~19のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム22.塩が、四級アンモニウム塩である、アイテム1~21のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム23.オリゴヌクレオチドが、バーコード配列、アダプター配列、特有の分子同定子、またはそれらの任意の組み合わせを含む、アイテム1~22のいずれか1つに記載のオリゴヌクレオチドが連結されたヌクレオチド。
アイテム24.核酸にオリゴヌクレオチドをタグ付けするための方法であって、
タグ付けされる核酸を提供すること、
核酸を、アイテム1~23のいずれか1つに記載の少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチドおよびポリメラーゼと接触させ、それによってタグ付けされた核酸を産生すること、を含む、方法。
アイテム25.プライマーを核酸にアニーリングすることをさらに含む、アイテム24に記載の方法。
アイテム26.核酸が、5’末端、3’末端、またはそれらの両方でタグ付けされる、アイテム24または25に記載の方法。
アイテム27.核酸が、複数の位置でタグ付けされる、アイテム26に記載の方法。
アイテム28.核酸が、ニック翻訳またはギャップ充填反応中にオリゴヌクレオチドが連結されたオリゴヌクレオチドでタグ付けされる、アイテム24~27のいずれか1つに記載の方法。
アイテム29.アダプター配列を核酸の3’末端にライゲーションすることをさらに含む、アイテム24~28のいずれか1つに記載の方法。
アイテム30.タグ付けされた核酸をPCRに供することをさらに含む、アイテム24~29のいずれか1つに記載の方法。
アイテム31.核酸が、DNAまたはRNAである、アイテム24~31のいずれか1つに記載の方法。
アイテム32.ポリメラーゼが、A型DNAポリメラーゼ、B型DNAポリメラーゼ、X型DNAポリメラーゼ、または逆転写酵素である、アイテム24~31のいずれか1つに記載の方法。
アイテム33.ポリメラーゼが、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、HIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体である、アイテム24~32のいずれか1つに記載の方法。
アイテム34.ポリメラーゼが、TdTである、アイテム24~32のいずれか1つに記載の方法。
アイテム35.ヌクレオチドが、ジデオキシアデノシン三リン酸、ジデオキシグアノシン三リン酸、ジデオキシチミジン三リン酸、ジデオキシウリジン三リン酸、ジデオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される、アイテム24~34のいずれか1つに記載の方法。
アイテム36.ステップcにおけるオリゴヌクレオチドが連結されたヌクレオチドの濃度が、1fmol~10μmolの範囲である、アイテム24~35のいずれか1つに記載の方法。
アイテム37.オリゴヌクレオチドが連結されたヌクレオチド対対応する天然のヌクレオチドのモル比が、1:1~1:1000の範囲である、アイテム24~36のいずれか1つに記載の方法。
アイテム38.少なくとも1つのクリーンアップステップを実施することをさらに含む、アイテム24~37のいずれか1つに記載の方法。
アイテム39.ポリヌクレオチド試料から核酸のライブラリを生成するための方法であって、任意選択で、ポリヌクレオチド試料を断片化し、複数のポリヌクレオチド断片を生成することと、
第1のプライマーをポリヌクレオチド断片へアニーリングすることと、
複数のポリヌクレオチド断片を、核酸ポリメラーゼ、少なくとも1つのヌクレオチド、およびオリゴヌクレオチドが連結されたオリゴヌクレオチドと接触させて、オリゴヌクレオチドが連結されたヌクレオチドを含む核酸鎖を形成することと、
第2のプライマーを連結されたオリゴヌクレオチドにアニーリングして、第2のアニーリングされた複合体を形成することと、
第2のアニーリングされた複合体を核酸ポリメラーゼと接触させて、連結されたオリゴヌクレオチドから核酸分子を生成することと、を含む、方法。
アイテム40.オリゴヌクレオチドが連結されたヌクレオチドが、アイテム1~23のいずれかの1つに記載のオリゴヌクレオチドが連結されたヌクレオチドである、アイテム39に記載の方法。
アイテム41.第2のプライマーが、アダプター配列、バーコード配列、またはそれらの両方を含む、アイテム39または40に記載の方法。
アイテム42.オリゴヌクレオチドが連結されたヌクレオチドが、親和性タグをさらに含む、アイテム39~41のいずれか1つに記載の方法。
アイテム43.第2のプライマーが、連結されたオリゴヌクレオチドに少なくとも部分的に相補的である、アイテム39~42のいずれか1つに記載の方法。
アイテム44.第1のプライマー、第2のプライマー、またはそれらの両方が、ユニバーサル配列を含む、アイテム39~43のいずれか1つに記載の方法。
アイテム45.連結されたオリゴヌクレオチドが、アダプター配列、T7プロモーター配列、バーコード、ユニバーサル分子同定子、またはそれらの任意の組み合わせを含む、アイテム39~44のいずれか1つに記載の方法。
アイテム46.ポリメラーゼが、A型DNAポリメラーゼ、B型DNAポリメラーゼ、X型DNAポリメラーゼ、または逆転写酵素である、アイテム39~45のいずれか1つに記載の方法。
アイテム47.ポリメラーゼが、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、HIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体から選択される、アイテム39~46のいずれか1つに記載の方法。
アイテム48.ヌクレオチドが、ジデオキシアデノシン三リン酸、ジデオキシグアノシン三リン酸、ジデオキシチミジン三リン酸、ジデオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される、アイテム39~47のいずれか1つに記載の方法。
アイテム49.ライブラリを増幅することをさらに含む、アイテム39~48のいずれかの方法。
アイテム50.ステップ(a)におけるオリゴヌクレオチドが連結されたヌクレオチドの濃度が、1fmol~10μmolの範囲である、アイテム39~41のいずれか1つに記載の方法。
アイテム51.オリゴヌクレオチドが連結されたヌクレオチド対対応する天然のヌクレオチドのモル比が、1:1~1:1000の範囲である、アイテム39~50のいずれか1つに記載の方法。
アイテム52.ステップ(c)の後に少なくとも1つのクリーンアップステップを実施することをさらに含む、アイテム39~51のいずれか1つに記載の方法。
アイテム53.核酸が、DNAである、アイテム39~52のいずれか一項に記載の方法。
アイテム54.核酸が、RNAである、アイテム39~53のいずれか一項に記載の方法。
アイテム55.RNAを逆転写して対応するcDNAを生成することをさらに含む、アイテム54に記載の方法。
アイテム56.アイテム1~23のいずれか1つによるオリゴヌクレオチドが連結されたヌクレオチドを調製するための方法であって、
第2の官能基とのクリック反応を受けることができる第1の官能基に共有結合で結合したヌクレオチドを提供すること、クリック反応を受けてトリアゾール環を形成することができる第2の官能基に共有結合で結合したオリゴヌクレオチドを提供すること、
ヌクレオチドをオリゴヌクレオチドと接触させてクリック反応産物を形成することを含み、第1および第2の官能基は、それぞれ、
i)アルキニルおよびアジド、
ii)アジドおよびアルキニル、
iii)チオールおよびアルキニル、
iv)アルキニルおよびチオール、
v)チオールおよびアルケニル、
vi)アルケニルおよびチオール、
vii)アジドおよびシクロオクタニル、
viii)シクロオクタニルおよびアジド、
xi)ニトロンおよびシクロオクタニル、ならびに
xii)シクロオクタニルおよびニトロンから選択される、方法。
アイテム57.第1および第2の官能基が、それぞれ、i)アルキニルおよびアジド、ならびにii)アジドおよびアルキニルから選択される、アイテム56に記載の方法。
アイテム58.ステップ(c)が、銅触媒および銅(I)配位子の存在下でヌクレオチドをオリゴヌクレオチドと接触させて、1,2,3-トリアゾールを形成することを含む、アイテム57に記載の方法。
アイテム59.ヌクレオチドが、デオキシヌクレオチドまたはジデオキシヌクレオチドである、アイテム56~58のいずれか1つに記載の方法。
アイテム60.銅触媒が、銅(I)または銅(II)を含み、触媒が銅(II)である場合、還元剤が存在する、アイテム58または59に記載の方法。
アイテム61.銅触媒がCu(NO32Cu(OAc)、CuSO4またはそれらの任意の組み合わせである、アイテム58~60のいずれか1つに記載の方法。
アイテム62.還元剤が、アスコルビン酸塩、トリス(2-カルボキシエチル)ホスフィン(TCEP)、2.4.6-トリクロロフェノール(TCP)、NADH、NADPH、チオ硫酸塩、金属銅、キノン、ヒドロキノン、ビタミンK、グルタチオン、システイン、2-メルカプトエタノール、ジチオスレイトール、Fe(II)、Co(II)、印加電位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、W、またはそれらの任意の組み合わせを含む、アイテム60または61に記載の方法。
アイテム63.還元剤が、アスコルビン酸ナトリウムを含む、アイテム62に記載の方法。
アイテム64.配位子が、トリス(ベンジルトリアゾリルメチル)アミンを含む、アイテム58~63のいずれか1つに記載の方法。
アイテム65.配列決定ライブラリを作成するためのキットであって、
アイテム1~21のいずれか1つによるオリゴヌクレオチドが連結されたヌクレオチドと、
(i)A、C、G、UおよびTヌクレオチド、
(ii)ポリメラーゼ、
(iii)プライマーおよび/もしくはアダプター配列、
(iv)緩衝液、または
(v)塩のうちの少なくとも1つと、を含む、キット。
アイテム66.キットが、A、C、G、UおよびTヌクレオチドを含む、アイテム65に記載のキット。
アイテム67.キットが、ポリメラーゼを含む、アイテム65または66に記載のキット。
アイテム68.ポリメラーゼが、野生型ポリメラーゼ、修飾されたポリメラーゼ、変異型ポリメラーゼ、操作されたポリメラーゼ、またはそれらの組み合わせである、アイテム67に記載のキット。
アイテム69.ポリメラーゼが、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、およびHIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体である、アイテム65~68のいずれか1つに記載のキット。
アイテム70.キットが、1つ以上のプライマー、アダプター、バーコード、または特有の分子同定子配列を含む、アイテム65~69のいずれか1つに記載のキット。
アイテム71.キットが、少なくとも1つの緩衝液を含む、アイテム65~70のいずれか1つに記載のキット。
アイテム72.キットが、少なくとも1つの塩を含む、アイテム65~71のいずれか1つに記載のキット。
アイテム73.核酸ライブラリを調製する方法であって、ユニバーサル配列を含む第1のプライマーを核酸試料にアニーリングすることと、核酸試料を核酸ポリメラーゼ、少なくとも1つのヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させて、鎖を終結させるオリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の核酸鎖を形成することと、
連結されたオリゴヌクレオチドに少なくとも部分的に相補的である第2のプライマーをアニーリングすることと、
ポリメラーゼで第2のアニーリングされたプライマーを伸長することと、
それにより、その末端にユニバーサル配列および連結されたオリゴヌクレオチド配列を含むヌクレオチドのライブラリを生成することと、を含む、方法。
実施例15.さらなる実施形態
以下は、本明細書に記載の異なる実施形態の追加の代表的な実施形態のリストである。実施形態は、以下の番号付けられた項のいずれか一項に従ってもよい。
項1.核酸にオリゴヌクレオチドをタグ付けするための方法であって、
a.タグ付けされる核酸を提供すること、
b.核酸をポリメラーゼおよび少なくとも1つの式(A)のオリゴヌクレオチドが連結されたヌクレオチド
Figure 2022537069000044
またはその塩と接触させること、を含み、
式中、NBは、核酸塩基であり、
オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、
XおよびQの各々は、独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、
ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、
CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキレン、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択され、それによって第1のタグ付けされた核酸を産生する、方法。
項2.接触が、核酸を少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチド、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、およびポリメラーゼと接触させることを含む、項1に記載の方法。
項3.プライマーを核酸にアニーリングすることをさらに含む、項1または2に記載の方法。
項4.核酸が、5’末端、3’末端、またはそれらの両方でタグ付けされる、項1~3のいずれか一項に記載の方法。
項5.核酸が、複数の位置でタグ付けされる、項2~4のいずれか一項に記載の方法。
項6.核酸が、ニック翻訳またはギャップ充填反応中にオリゴヌクレオチドが連結されたヌクレオチドでタグ付けされる、項1~5のいずれか一項に記載の方法。
項7.核酸の3’末端にアダプター配列を付加することをさらに含む、項1~6のいずれか一項に記載の方法。
項8.核酸が、二本鎖核酸であり、方法が、タグ付けされた核酸をPCRに供することをさらに含む、項1~7のいずれか一項に記載の方法。
項9.ポリメラーゼが、末端デオキシヌクレオチジルトランスフェラーゼである、項1~8のいずれか一項に記載の方法。
項10.オリゴヌクレオチドが連結されたヌクレオチドが、ジデオキシヌクレオチドであり、任意選択で、ジデオキシヌクレオチドが、ジデオキシアデノシン三リン酸、ジデオキシグアノシン三リン酸、ジデオキシチミジン三リン酸、ジデオキシウリジン三リン酸、ジデオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される、項1~9のいずれか一項に記載の方法。
項11.少なくとも1つのクリーンアップステップを実施することをさらに含む、項1~10のいずれか一項に記載の方法。
項12.
a.第1のタグ付けされた核酸鎖を産生した後、連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるプライマーをアニーリングすることと、
b.第1のタグ付けされた核酸鎖およびアニーリングされたプライマーを、核酸ポリメラーゼおよび少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させることと、
c.ポリメラーゼで、連結されたオリゴヌクレオチドにアニーリングされたプライマーの3’ヒドロキシルから伸長し、第2の核酸鎖を形成することと、をさらに含む、項1~11のいずれか一項に記載の方法。
項13.第2の核酸鎖を形成した後にタグ付けされた核酸鎖をエキソヌクレアーゼと接触させることをさらに含み、第1の核酸鎖がエキソヌクレアーゼによって分解される、項12に記載の方法。
項14.第2の核酸鎖を形成した後にタグ付けされた核酸鎖をエキソヌクレアーゼと接触させることをさらに含み、第1の核酸鎖が5’-リン酸を有し、エキソヌクレアーゼがラムダエキソヌクレアーゼである、項12に記載の方法。
項15.
a.少なくとも1つの第2の核酸鎖を提供すること、
b.第2の核酸鎖を末端デオキシヌクレオチジルトランスフェラーゼおよび少なくとも1つの式(A)の第2のオリゴヌクレオチドが連結されたヌクレオチド
Figure 2022537069000045
またはその塩と接触させること、をさらに含み、
式中、NBは、核酸塩基であり、
オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、
XおよびQの各々は、独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、
ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、
CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキレン、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択され、それによって5’および3’末端に異なるタグを有するタグ付けされた核酸を産生する、項12~14のいずれか一項に記載の方法。
項16.1つ以上のポリヌクレオチドを含む試料から核酸のライブラリを生成するための方法であって、
a.第1のプライマーを1つ以上のポリヌクレオチドにアニーリングすることと、
b.1つ以上のポリヌクレオチドを、オリゴヌクレオチドに連結されていない少なくとも1つのヌクレオチド、および第1のオリゴヌクレオチドが連結されたヌクレオチドと接触させて、第1のオリゴヌクレオチドが連結されたヌクレオチドを含む1つ以上の第1の核酸鎖を形成することと、
c.第2のプライマーを連結されたオリゴヌクレオチドにアニーリングして、第2のアニーリングされた複合体を形成することと、
d.第2のアニーリングされた複合体を核酸ポリメラーゼ、および、任意選択で、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させて、第2の核酸鎖を産生することと、を含む、方法。
項17.1つ以上のポリヌクレオチドを含む試料から核酸のライブラリを生成するための方法であって、
a.第1のプライマーを1つ以上のポリヌクレオチドにアニーリングすることと、
b.1つ以上のポリヌクレオチドを、オリゴヌクレオチドに連結されていない少なくとも1つのヌクレオチド、および第1のオリゴヌクレオチドが連結されたヌクレオチドと接触させて、第1のオリゴヌクレオチドが連結されたヌクレオチドを含む1つ以上の第1の核酸鎖を形成することと、
c.スプリントオリゴヌクレオチドを連結されたオリゴヌクレオチドにアニーリングして、第2のアニーリングされた複合体を形成することと、
d.第2のアニーリングされた複合体を核酸ポリメラーゼ、および、任意選択で、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させて、第2の核酸鎖を産生することと、を含む、方法。
項18.1つ以上のポリヌクレオチドが、第1のプライマーのアニーリングの前に生成される複数のポリヌクレオチド断片を含む、項16または17に記載の方法。
項19.1つ以上のポリヌクレオチドが、mRNAを含む、項16または18に記載の方法。
項20.1つ以上のポリヌクレオチドが、オリゴヌクレオチドが連結された結合剤(OTBA)を含む、項16~19のいずれか一項に記載の方法。
項21.1つ以上のポリヌクレオチドが、mRNAと1つ以上のOTBAとの組み合わせを含む、項16~20のいずれか一項に記載の方法。
項22.第2のアニーリングされた複合体を核酸ポリメラーゼと接触させた後、ポリメラーゼが、連結されたオリゴヌクレオチドの3’ヒドロキシルからスプリントオリゴヌクレオチドを横断して伸長させる、項16~21のいずれかに記載の方法。
項23.プライマーが、ユニバーサル配列、ランダム配列、および/または標的特異的配列を含む、項12~22のいずれか一項に記載の方法。
項24.第1のオリゴヌクレオチドが連結されたヌクレオチドが、オリゴヌクレオチドが連結されたジデオキシヌクレオチドであり、第1の核酸鎖が、その3’末端にオリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む、項16~23のいずれか一項に記載の方法。
項25.第2のアニーリングされた複合体と核酸ポリメラーゼとの接触が、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドおよび第2のオリゴヌクレオチドが連結されたジデオキシヌクレオチドの存在下で行われ、第2の核酸鎖は、その3’末端でオリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む、項16および18~23のいずれか一項に記載の方法。
項26.第1のオリゴヌクレオチドが連結されたジデオキシヌクレオチドにおける連結されたオリゴヌクレオチドと、第2のオリゴヌクレオチドが連結されたジデオキシヌクレオチドにおける連結されたオリゴヌクレオチドとは異なる、項16および18~24のいずれか一項に記載の方法。
項27.1つ以上の核酸を含む試料から核酸のライブラリを生成するための方法であって、任意選択で、試料が複数の細胞を含み、
a.第1のプライマーを1つ以上の核酸にアニーリングすることと、
b.1つ以上の核酸を、核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させ、それらの3’末端で、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の核酸鎖を形成することと、
c.連結されたオリゴヌクレオチドに少なくとも部分的に相補的である第2のプライマーをアニーリングすることと、
d.ポリメラーゼで、連結されたオリゴヌクレオチドにアニーリングされた第2のプライマーの3’ヒドロキシルから伸長し、それによって二本鎖核酸のライブラリを生成することと、を含む、方法。
項28.1つ以上の核酸を含む試料から核酸のライブラリを生成するための方法であって、任意選択で、試料が複数の細胞を含み、
a.第1のプライマーを1つ以上の核酸にアニーリングすることと、
b.1つ以上の核酸を、核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させ、それらの3’末端で、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の核酸鎖を形成することと、
c.連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるスプリントオリゴヌクレオチドをアニーリングすることと、
d.ポリメラーゼで、連結されたオリゴヌクレオチドの3’ヒドロキシルから伸長し、それによって核酸のライブラリを産生することと、を含む、方法。
項29.第1のプライマーが、ユニバーサル配列、ランダム配列、および/または標的特異的配列を含む、項27または28に記載の方法。
項30.試料中の1つ以上の核酸が、ポリ(A)mRNAを含む、項27~29のいずれか一項に記載の方法。
項31.試料中の1つ以上の核酸が、OTBAの連結されたオリゴヌクレオチドを含む、項27~29のいずれか一項に記載の方法。
項32.OTBAの連結されたオリゴヌクレオチドが、細胞マーカー結合剤インデックスを含む、項31に記載の方法。
項33.試料中の1つ以上の核酸が、mRNAおよびOTBAを含む、項27~29または32のいずれか一項に記載の方法。
項34.細胞マーカーが、試料中の細胞の一部によって発現される、項27~32のいずれか一項に記載の方法。
項35.細胞マーカーが、細胞表面マーカーである、項34に記載の方法。
項36.OTBAの結合剤が、アプタマーもしくは抗体またはそれらの機能的断片を含む、項20、21、または31~35のいずれか一項に記載の方法。
項37.1つ以上の核酸を含む試料が、1つ超の細胞または細胞核を含み、細胞もしくは細胞核またはそれらの亜集団が、1つ以上の細胞マーカーを含み得、試料が、第1のプライマーをアニーリングするステップの前に2つ以上の第1の部分に分割され、各第1の部分は、元の試料の細胞または細胞核の亜集団を含む、項28~36のいずれか一項に記載の方法。
項38.第1のプライマーが、5’末端の第1のユニバーサルハンドル配列および第1のバーコードを含む第1の伸長プライマーであり、該第1のバーコードは、各第1の部分における第1の伸長プライマー間で共通であるが、他の第1の部分における伸長プライマーに存在するバーコードとは異なり、
オリゴヌクレオチドが連結されたジデオキシヌクレオチドのオリゴヌクレオチドは、ユニバーサルハンドル配列を含み、
該第1の部分は、第1の伸長プライマーの伸長がオリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む第1の核酸伸長産物を形成することを可能にする条件下で接触され、第1の核酸伸長産物の伸長は、オリゴヌクレオチドが連結されたジデオキシヌクレオチドの組み込みによって終結される、項37に記載の方法。
項39.
a.第1の核酸伸長産物の形成後に第1の部分を混ぜ合わせることと、
b.混ぜ合わされた第1の部分を2つ以上の第2の部分に分割することと、
c。各第2の部分を、ポリメラーゼ、少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチドではないヌクレオチド、およびスプリントオリゴヌクレオチドと接触させることと、を含み、スプリントオリゴヌクレオチドは、
i.伸長条件下で第1のユニバーサルハンドルにアニーリングできるオリゴヌクレオチド配列、
ii.各第2の部分の第2のバーコードは共通であるが、他の第2の部分の第2のバーコードとは異なる、第2のバーコードの鋳型である配列、ならびに
iii.第3のユニバーサルハンドルのための鋳型である配列であって、第1の伸長産物の連結されたオリゴヌクレオチドの3’OHがスプリントオリゴヌクレオチドを横断して伸長され、第2のバーコード配列および第3のユニバーサルハンドル配列を含む第2の核酸伸長産物を生成する、第3のユニバーサルハンドルのための鋳型である配列を含む、項38に記載の方法。
項40.
a.第2の部分を混ぜ合わせること、
b.混ぜ合わされた第2の部分を2つ以上の第3の部分に分割すること、
c.各第3の部分を増幅プライマーと接触させること、をさらに含み、増幅プライマーが、第1のユニバーサルハンドルおよび第3のユニバーサルハンドルからの第2の伸長産物またはそれらの相補体にアニールし、横断して伸長し、増幅プライマーが、任意選択で、該核酸ライブラリを生成するために、それぞれ第3および/または第4のバーコード、ならびにそれぞれ第1および/または第2のアダプター配列を含み、第1、第2、および第3のバーコード配列(またはそれらの相補体)の組み合わせが、単一の細胞に由来する増幅産物に特有である、項39に記載の方法。
項41.第1のプライマー、第2のプライマー、増幅プライマー、またはスプリントオリゴヌクレオチドが、アダプター配列、バーコード配列、特有の分子同定子、インデックス配列、プロモーター配列、ユニバーサルハンドル、ユニバーサル配列、ランダム配列、標的特異的配列、またはそれらの任意の組み合わせを含む、項16~40のいずれか一項に記載の方法。
項42.オリゴヌクレオチドが連結されたヌクレオチドが、親和性タグをさらに含む、項1~41のいずれか一項に記載の方法。
項43.第2のプライマーが、連結されたオリゴヌクレオチドに少なくとも部分的に相補的である、項16、18~27または29~39のいずれか一項に記載の方法。
項44.第1のプライマー、第2のプライマー、またはそれらの両方が、ユニバーサル配列を含む、項16~43のいずれか一項に記載の方法。
項45.連結されたオリゴヌクレオチドが、アダプター配列、T7プロモーター配列、バーコード、ユニバーサル分子同定子、ユニバーサルハンドル、ユニバーサル配列、アダプター配列、ランダム配列、標的特異的配列、プロモーター配列、インデックス配列またはそれらの任意の組み合わせを含む、項1~44のいずれか一項に記載の方法。
項46.ポリメラーゼが、A型DNAポリメラーゼ、B型DNAポリメラーゼ、X型DNAポリメラーゼ、または逆転写酵素である、項1~45のいずれか一項に記載の方法。
項47.ポリメラーゼが、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、HIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体から選択される、項1~46のいずれか一項に記載の方法。
項48.オリゴヌクレオチドが連結されたオリゴヌクレオチドが、ジデオキシアデノシン三リン酸、ジデオキシグアノシン三リン酸、ジデオキシチミジン三リン酸、ジデオキシウリジン三リン酸、ジデオキシシチジン三リン酸、またはそれらの任意の組み合わせから選択される、項1~47のいずれか一項に記載の方法。
項49.ライブラリを増幅することをさらに含む、項26~48のいずれか一項に記載の方法。
項50.オリゴヌクレオチドが連結されたヌクレオチドの濃度が、1fmol~10μmolの範囲である、項26~49のいずれか一項に記載の方法。
項51.オリゴヌクレオチドが連結されたヌクレオチド対対応するオリゴヌクレオチドに連結されていないヌクレオチドのモル比が、1:1~1:1000の範囲である、項26~50のいずれか一項に記載の方法。
項52.1つ以上の核酸伸長または核酸増幅産物を形成した後に少なくとも1つのクリーンアップステップを実施することをさらに含む、項26~51のいずれか一項に記載の方法。
項53.核酸が、DNAである、項1~52のいずれか一項に記載の方法。
項54.核酸が、RNAである、項1~53のいずれか一項に記載の方法。
項55.第1のプライマーをアニーリングする前に、または複数のポリヌクレオチド断片を生成する前に、RNAを逆転写して対応するcDNAを生成することをさらに含む、項54に記載の方法。
項56.第1のプライマーをアニーリングする前に、および/または試料を分割する前に、細胞を固定化および透過化することをさらに含む、項26~55のいずれか一項に記載の方法。
項57.1つ以上の伸長および/または増幅産物を生成した後に細胞を溶解することをさらに含む、項26~56のいずれか一項に記載の方法。
項58.第1の核酸伸長産物を生成した後、第1の部分または混ぜ合わされた第1の部分をブロッキングオリゴヌクレオチドと接触させ、ブロッキングオリゴヌクレオチドは、第1の伸長プライマーの細胞の核酸へのハイブリダイゼーションを防止する、項37~57のいずれか一項に記載の方法。
項59.第2の核酸伸長産物を生成した後、第3の部分を第2の伸長プライマーと接触させる前に、スプリントオリゴヌクレオチドを除去するステップをさらに含む、項37~58のいずれか一項に記載の方法。
項60.スプリントオリゴヌクレオチドが結合部位を含み、方法が、第2の部分または混ぜ合わされた第2の部分を、同種の捕捉部位を含む化合物と接触させるステップを含む、項37~59のいずれか一項に記載の方法。
項61.結合部位および同種捕捉部位が、ストレプトアビジンおよびビオチン、マルトースおよびマルトース結合タンパク質、グルタチオンおよびグルタチオンS-トランスフェラーゼ、キチンおよびキチン結合タンパク質、またはアプタマーおよびその抗原のうちの結合対から選択される結合対である、項60に記載の方法。
項62.同種の捕捉部位が、固体支持体上に固定化される、項60または61に記載の方法。
項63.固体支持体が、ビーズを含む、項62に記載の方法。
項64.ビーズが、磁性または常磁性ビーズである、項63に記載の方法。
項65.第1のプライマーが、伸長条件下でmRNAにハイブリダイゼーションすることができる配列を含む、項37~64のいずれか一項に記載の方法。
項66.第1のプライマーが、3’末端にポリ(T)を含む、項65に記載の方法。
項67.第1のプライマーが、3’末端にランダム配列を含む、項65に記載の方法。
項68.第1の部分を、第1のプライマーの混合物と接触させ、少なくとも1つの第1のプライマーが3’末端にポリ(T)配列を含み、少なくとも1つの第1のプライマーがランダム配列を含む、項65に記載の方法。
項69.式(A)のオリゴヌクレオチドが連結されたヌクレオチド
Figure 2022537069000046
またはその塩であって、
式中、NBは、核酸塩基であり、
オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、
XおよびQの各々は、独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、
ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、
CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキレン、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択される、オリゴヌクレオチドが連結されたヌクレオチド。
項70.オリゴが
Figure 2022537069000047
から選択され、オリゴ*がオリゴ基由来の残りの2~99ヌクレオチドであり、NB2が、核酸塩基である、項68に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項71.CXNが、各々が1~3個のヘテロ原子を有する5員複素環および6員複素環から選択される、項69または項70に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項72.CXNが、ピロロ、チオフェニル、フラニル、ピロリジニル、チオラニル、テトラヒドロフラニル、イソキサゾリル、オキサゾロ、ピラゾロ、イミダゾリル、イソチアゾロ、チアゾリル、トリアゾロ、オキサジアゾロ、チアジアゾロ、ピラニル、チオピラニル、ピリジニル、テトラヒドロピラニル、テトラヒドロチオピラニル、ピペリジニル、ピリダジニル、ピリミジニル、ピラジニル、ヘキサヒドロピリダジニル、ヘキサヒドロピリミジニル、ピペラジニル、ジオキサニル、モルフォリノ、チアジニル、オキサジノ、ジチアニル、トリアジニル、ジチアジノ、チアジアジノ、トリアジナニル、またはオキサチアジノから選択される、項69~項71のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項73.CXNが、クリックであり、クリックが、クリック反応の産物である、項69~72のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項74.CXNが、クリックであり、クリックが、以下の対の官能基、
i)アルキニルおよびアジド、
ii)チオールおよびアルキニル、
iii)チオールおよびアルケニル、
iv)アジドおよびシクロオクタニル、ならびに
v)シクロオクタニルおよびニトロンのうちの1つの間でのクリック反応の産物である、項69~73のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項75.CXNが、
Figure 2022537069000048
である、項69~74のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項76.ZおよびYが、各々独立して、結合、アミノ、アミド、アルキレン、アルケニレン、アルキニレン、エーテル、ケトン、カルボニル、無水物、エステル、イミド、またはそれらの任意の組み合わせから選択される、項69~75のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項77.Yが、アルキレンまたはアルキニレンである、項69~76のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項78.Zが、アルキニレン、アルキレン、エーテルおよびアミドのうちの1つ以上の組み合わせである、項69~77のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項79.-NB-Z-が、NB-HN-L1-、NB-(CH-CH)C(O)(CH2CH2)NHC(O)(CH25-L1
Figure 2022537069000049
であり、L1が、アルキレン、アルケニレン、アルキニレン、およびポリアルキレングリコールから選択される、項69~78のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項80.式(A)の化合物が、式(B1)~(B4)の化合物
Figure 2022537069000050
およびそれらの塩から選択され、式中、オリゴ*は、オリゴ基由来の残りの2~99ヌクレオチドであり、NB2は、核酸塩基であり、クリックは、クリック反応の産物であり、L1は、アルキレン、アルケニレン、アルキニレン、およびポリアルキレングリコールから選択され、L2は、アルキレンまたはアルキニレンである、項69に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項81.L1が、C1-C12アルキレン、C2-C12アルケニレン、C2-C12アルキニレン、および2~8グリコール単位を有するポリアルキレングリコールから選択される、項79または80に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項82.L1が、2グリコール単位を有するポリエチレングリコール(PEG2)、4グリコール単位を有するポリエチレングリコール(PEG4)、または6グリコール単位を有するポリエチレングリコール(PEG6)、メチレン、エチレン、n-プロピレン、イソプロピレン、1-ブチレン、シス-2-ブチレン、トランス-2-ブチレン、イソブチレン、1-ペンチレン、シス-2-ペンチレン、トランス-2-ペンチレン、イソペンチレン、およびヘキシレンから選択される、項79~81のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項83.L1が、-CH2-、-(CH23-、-(CH25-、PEG2、およびPEG4から選択される、項79~82のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項84.L2が、C1-C12アルキレンまたはC1-C12アルキニレンである、項80~83のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項85.L2-オリゴが、-(CH24-オリゴまたは-(CH24C≡C-オリゴである、項80~84のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項86.Xが、H、OH、F、N3、およびアミノから選択される、項69~85のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項87.Xが、H、N3、およびOHから選択される、項69~86のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項88.Xが、OHである、項69~87のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項89.Xが、Hである、項69~87のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項90.Qが、H、OH、F、Cl、Br、I、N3である、項69~89のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項91.Qが、Hである、項69~90のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項92.オリゴまたはオリゴ*が、その5’末端でYに結合される、項69~91のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項93.NBおよびNB2が、独立して、アデニン、7-デアザ-アデニン、シトシン、グアニン、7-デアザグアニン、チミン、ウラシルおよびイノシンから選択される核酸塩基である、項69~92のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項94.NBが、ピリミジンであり、ピリミジンが、核酸塩基の5位でオリゴヌクレオチドに連結される、項69~93のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項95.NBが、プリンであり、プリンが、核酸塩基の7位でオリゴヌクレオチドに連結される、項69~93のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項96.式(A)の化合物の塩が、四級アンモニウム塩である、項69~95のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項97.オリゴは、バーコード配列、アダプター配列、特有の分子同定子、ランダム配列、標的特異的配列、ユニバーサルハンドル、ユニバーサル配列、プロモーター配列、インデックス配列またはそれらの任意の組み合わせを含むオリゴヌクレオチドである、項69~96のいずれか一項に記載のオリゴヌクレオチドが連結されたヌクレオチド。
項98.オリゴヌクレオチドが連結されたヌクレオチドが、項69~97のいずれか一項によるオリゴヌクレオチドが連結されたヌクレオチドから選択される、項1~68のいずれか一項に記載の方法。
項99.配列決定ライブラリを作成するためのキットであって、
a.項69~97のいずれか一項によるオリゴヌクレオチドが連結されたヌクレオチドと、
(b)
(i)A、C、G、Uおよび/またはTヌクレオチド、
(ii)ポリメラーゼ、
(iii)プライマーおよび/もしくはアダプター配列、
(iv)緩衝液、または
(v)塩のうちの少なくとも1つと、を含む、キット。
項100.キットが、A、C、G、Uおよび/またはTヌクレオチドを含む、項99に記載のキット。
項101.キットが、ポリメラーゼを含む、項99または100に記載のキット。
項102.ポリメラーゼが、野生型ポリメラーゼ、修飾されたポリメラーゼ、変異型ポリメラーゼ、操作されたポリメラーゼ、またはそれらの組み合わせである、項101に記載のキット。
項103.ポリメラーゼが、Taq DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Deep Vent(商標)DNAポリメラーゼ、Pfx DNAポリメラーゼ、Pwoポリメラーゼ、Superscript(商標)IV、Superscript(商標)II、Superscript(商標)III、Maxima(商標)、RevertAid(商標)逆転写酵素、Thermo Sequenase(商標)、Sequenase(商標)V2.0、CycleSeq(商標)、Phusion exo-、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、Maxima H、Therminator(商標)ポリメラーゼ、Q5 DNAポリメラーゼ、AccuTaq DNAポリメラーゼ、T7 DNAポリメラーゼ、T3 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 RNAポリメラーゼ、T3 RNAポリメラーゼ、SP6 RNAポリメラーゼ、DNAポリメラーゼ1、Klenow断片、Tth DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、SuperFi DNAポリメラーゼ、Platinum Taq DNAポリメラーゼ、Herculase II融合DNAポリメラーゼ、PfuUltra融合II HS DNAポリメラーゼ、Bst DNAポリメラーゼ大断片、Stoeffel断片、9°N(商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、Tfl DNAポリメラーゼ、Phi29ポリメラーゼ、Tli DNAポリメラーゼ、真核生物DNAポリメラーゼベータ、テロメラーゼ、KOD HiFi DNAポリメラーゼ、KOD DNAポリメラーゼ、Q-ベータ複製酵素、AMV逆転写酵素、M-MLV逆転写酵素、Phi6逆転写酵素、およびHIV-1逆転写酵素、ポリAポリメラーゼ(PAP)、ポリUポリメラーゼ(PUP)、ならびにそれらのバリアントおよび誘導体である、項99~102のいずれか一項に記載のキット。
項104.キットが、1つ以上のプライマー、アダプター、バーコード、または特有の分子同定子配列を含む、項99~103のいずれか一項に記載のキット。
項105.キットが、少なくとも1つの緩衝液を含む、項99~104のいずれか一項に記載のキット。
項106.キットが、少なくとも1つの塩を含む、項96~105のいずれか一項に記載のキット。
項107.核酸の組み合わせバーコーディングのためのキットであって、
a.項71~99のいずれか一項によるオリゴヌクレオチドが連結されたヌクレオチドと、
(b)
(i)A、C、G、Uおよび/またはTヌクレオチド、
(ii)ポリメラーゼ、
(iii)プライマーおよび/またはアダプター配列、
(iv)緩衝液、
(v)複数の核酸バーコード、ならびに
(vi)1つ以上の細胞マーカー結合剤のうちの少なくとも1つと、を含む、キット。
項108.オリゴヌクレオチドに連結されたヌクレオチドのヌクレオチドが、ジデオキシヌクレオチドである、項107に記載のキット。
項109.オリゴヌクレオチドが連結されたヌクレオチドのオリゴヌクレオチドが、ユニバーサルハンドル配列を含む、項107~108のいずれか一項に記載のキット。
項110.ポリメラーゼが、逆転写酵素、DNAポリメラーゼ、またはそれらの両方である、項107~109のいずれか一項に記載のキット。
項111.複数の核酸バーコードが、個々の区画において提供される第1の複数の核酸バーコードを含む、項107~110のいずれか一項に記載のキット。
項112.個々の区画において提供される第2および任意選択で第3、第4、第5、または第6の複数の核酸バーコードをさらに含む、項111に記載のキット。
項113.個々の区画が、マルチウェルプレートで提供される、項111~112のいずれか一項に記載のキット。
項114.複数の核酸バーコードが、凍結乾燥された形態である、項111~113のいずれか一項に記載のキット。
項115.複数の核酸バーコードが、溶液形態である、項111~114のいずれか一項に記載のキット。
項116.第1の複数のバーコードの核酸バーコードが、伸長プライマーを含み、各伸長プライマーが、5’から3’方向に第1のユニバーサルハンドルおよび第1の核酸バーコードを含む、項111~115のいずれか一項に記載のキット。
項117 第2の複数のバーコード上の核酸バーコードが、スプリントオリゴヌクレオチドを含み、スプリントオリゴヌクレオチドが、5’から3’方向に第2のユニバーサルハンドルにアニーリングする配列、第2の核酸バーコードのための鋳型である配列、および第3のユニバーサルハンドルのための鋳型である配列を含む、項112~115のいずれか一項に記載のキット。
項118.第3の複数のバーコード上の核酸バーコードが、伸長プライマーを含み、伸長プライマーが、任意選択で、配列決定アダプター配列を含む、項112~116のいずれか一項に記載のキット。
項119.1つ以上の細胞マーカー結合剤をさらに含む、項107~118のいずれか一項に記載のキット。
項120.各細胞マーカー結合剤が、細胞マーカー結合剤に連結されたオリゴヌクレオチドを含む、オリゴヌクレオチドが連結されたOTBAである、項119に記載のキット。
項121.項69~97のいずれか一項によるオリゴヌクレオチドが連結されたヌクレオチドを調製するための方法であって、
a.第2の官能基とのクリック反応を受けることができる第1の官能基に共有結合で結合したヌクレオチドを提供すること、
b.クリック反応を受けてトリアゾール環を形成することができる第2の官能基に共有結合で結合したオリゴヌクレオチドを提供すること、
c.ヌクレオチドをオリゴヌクレオチドと接触させてクリック反応産物を形成することを含み、
第1および第2の官能基は、それぞれ、
i)アルキニルおよびアジド、
ii)アジドおよびアルキニル、
iii)チオールおよびアルキニル、
iv)アルキニルおよびチオール、
v)チオールおよびアルケニル、
vi)アルケニルおよびチオール、
vii)アジドおよびシクロオクタニル、
viii)シクロオクタニルおよびアジド、
xi)ニトロンおよびシクロオクタニル、ならびに
xii)シクロオクタニルおよびニトロンから選択される、方法。
項122.第1および第2の官能基が、それぞれ、i)アルキニルおよびアジド、ならびにii)アジドおよびアルキニルから選択される、項121に記載の方法。
項123.ステップ(c)が、銅触媒および銅(I)配位子の存在下でヌクレオチドをオリゴヌクレオチドと接触させて、1,2,3-トリアゾールを形成することを含む、項121に記載の方法。
項124.ヌクレオチドが、デオキシヌクレオチドまたはジデオキシヌクレオチドである、項121~123のいずれか一項に記載の方法。
項125.銅触媒が、銅(I)または銅(II)を含み、触媒が銅(II)である場合、還元剤が存在する、項123または124に記載の方法。
項126.銅触媒が、Cu(NO32Cu(OAc)、CuSO4またはそれらの任意の組み合わせである、項123~125のいずれか一項に記載の方法。
項127.還元剤が、アスコルビン酸塩、トリス(2-カルボキシエチル)ホスフィン(TCEP)、2.4.6-トリクロロフェノール(TCP)、NADH、NADPH、チオ硫酸塩、金属銅、キノン、ヒドロキノン、ビタミンK、グルタチオン、システイン、2-メルカプトエタノール、ジチオスレイトール、Fe(II)、Co(II)、印加電位、Al、Be、Co、Cr、Fe、Mg、Mn、Ni、Zn、Au、Ag、Hg、Cd、Zr、Ru、Fe、Co、Pt、Pd、Ni、Rh、W、またはそれらの任意の組み合わせを含む、項125または126に記載の方法。
項128.還元剤が、アスコルビン酸ナトリウムを含む、項127に記載の方法。
項129.銅(I)配位子の配位子が、トリス(ベンジルトリアゾリルメチル)アミンまたはトリス(3-ヒドロキシプロピルトリアゾリルメチル)アミンを含む、項123~128のいずれか一項に記載の方法。
項130.核酸ライブラリの調製における項69~97のいずれかによるオリゴヌクレオチドが連結されたヌクレオチドの使用。
項131.核酸のタグ付けにおける項69~97のいずれかによるオリゴヌクレオチドが連結されたヌクレオチドの使用。
項132.バーコードの組み合わせでの核酸のタグ付けにおける項69~97のいずれかによるオリゴヌクレオチドが連結されたヌクレオチドの使用。
本明細書に記載の実施例から、当業者は、本開示の本質的な原理を容易に確認することができ、その趣旨および範囲から逸脱することなく、特定の使用および条件に適応する際に本開示の様々な修正および変更を行うことができる。

Claims (21)

  1. 核酸にオリゴヌクレオチドをタグ付けするための方法であって、
    a.タグ付けされる前記核酸を提供すること、
    b.前記核酸をポリメラーゼおよび少なくとも1つの式(A)のオリゴヌクレオチドが連結されたヌクレオチド
    Figure 2022537069000051
    またはその塩と接触させること、を含み、
    式中、NBは、核酸塩基であり、
    オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、
    XおよびQの各々は、独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、
    ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、
    CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキレン、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択され、それによって第1のタグ付けされた核酸を産生する、方法。
  2. 前記接触が、前記核酸を少なくとも1つのオリゴヌクレオチドが連結されたヌクレオチド、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、およびポリメラーゼと接触させることを含む、請求項1に記載の方法。
  3. プライマーを前記核酸にアニーリングすることをさらに含む、請求項1または2に記載の方法。
  4. 前記オリゴヌクレオチドが連結されたヌクレオチドが、ジデオキシヌクレオチドであり、任意選択で、前記ジデオキシヌクレオチドが、ジデオキシアデノシン三リン酸、ジデオキシグアノシン三リン酸、ジデオキシチミジン三リン酸、ジデオキシウリジン三リン酸、ジデオキシシチジン三リン酸、およびそれらの任意の組み合わせから選択される、請求項1~3のいずれか一項に記載の方法。
  5. a.第1のタグ付けされた核酸鎖を産生した後、前記連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるプライマーをアニーリングすることと、
    b.前記第1のタグ付けされた核酸鎖およびアニーリングされたプライマーを、核酸ポリメラーゼおよび少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させることと、
    c.ポリメラーゼで、前記連結されたオリゴヌクレオチドにアニーリングされた前記プライマーの3’ヒドロキシルから伸長し、第2の核酸鎖を形成することと、をさらに含む、請求項1~4のいずれか一項に記載の方法。
  6. a.第1のタグ付けされた核酸鎖を産生した後、前記連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるスプリントオリゴヌクレオチドをアニーリングすることと、
    b.前記第1のタグ付けされた核酸鎖およびアニーリングされたスプリントオリゴヌクレオチドを、核酸ポリメラーゼおよび少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチドと接触させることと、
    c.ポリメラーゼで、前記連結されたオリゴヌクレオチドの前記3’ヒドロキシルからスプリントオリゴヌクレオチドを横断して伸長することと、をさらに含む、請求項1~4のいずれか一項に記載の方法。
  7. 1つ以上の核酸を含む試料から核酸のライブラリを生成するための方法であって、任意選択で、前記試料が複数の細胞を含み、
    a.前記1つ以上の核酸に少なくとも部分的に相補的である第1のプライマーをアニーリングすることと、
    b.前記1つ以上の核酸を、核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させ、それらの3’末端で、オリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の核酸鎖を形成することと、
    c.前記連結されたオリゴヌクレオチドに少なくとも部分的に相補的である第2のプライマーをアニーリングすることと、
    d.前記ポリメラーゼで、前記連結されたオリゴヌクレオチドにアニーリングされた前記第2のプライマーの3’ヒドロキシルから伸長し、それによって核酸のライブラリを産生することと、を含む、方法。
  8. 1つ以上の核酸を含む試料から核酸のライブラリを生成するための方法であって、任意選択で、前記試料が複数の細胞または細胞核を含み、
    a.前記1つ以上の核酸に少なくとも部分的に相補的である第1のプライマーをアニーリングすることと、
    b.前記1つ以上の核酸を、第1の核酸ポリメラーゼ、少なくとも1つのオリゴヌクレオチドに連結されていないヌクレオチド、および少なくとも1つのオリゴヌクレオチドが連結されたジデオキシヌクレオチドと接触させ、3’末端で、前記オリゴヌクレオチドが連結されたジデオキシヌクレオチドを含む複数の第1の伸長産物を形成することと、
    c.前記第1の伸長産物の前記連結されたオリゴヌクレオチドに少なくとも部分的に相補的であるスプリントオリゴヌクレオチドをアニーリングすることと、
    d.前記第1の伸長産物を核酸ポリメラーゼおよび1つ以上のヌクレオチドと接触させ、前記ポリメラーゼで、前記連結されたオリゴヌクレオチドの前記3’ヒドロキシルから前記アニーリングされたスプリントを横断して伸長し、第2の伸長産物を産生し、それによって核酸のライブラリを産生することと、を含む、方法。
  9. 前記試料中の前記1つ以上の核酸が、オリゴヌクレオチドが連結された結合剤(OTBA)のオリゴヌクレオチドを含む、請求項8に記載の方法。
  10. 前記OTBAの前記連結されたオリゴヌクレオチドが、細胞マーカー結合剤インデックスを含み、前記OTBAの結合剤が、アプタマーもしくは抗体、またはそれらの機能的断片を含む、請求項9に記載の方法。
  11. 1つ以上の核酸を含む試料が、1つ超の細胞または細胞核を含み、前記細胞または細胞核が、1つ以上の細胞マーカーを含み得、前記試料が、ステップaの前に2つ以上の第1の部分に分割され、各第1の部分が、元の前記試料の細胞または細胞核の亜集団を含む、請求項7~10のいずれか一項に記載の方法。
  12. 前記第1のプライマーが、第1のユニバーサルハンドル配列および第1のバーコードを含み、前記第1のバーコードが、各第1の部分における前記第1のプライマー間で共通であるが、他の第1の部分における第1のプライマーにおいて存在する前記第1のバーコードとは異なり、前記オリゴヌクレオチドが連結されたジデオキシヌクレオチドの前記オリゴヌクレオチドが、第2のユニバーサルハンドル配列を含む、請求項11に記載の方法。
  13. ステップcの前に、
    a.前記第1の核酸伸長産物の形成後に前記第1の部分を混ぜ合わせることと、
    b.前記混ぜ合わされた第1の部分を2つ以上の第2の部分に分割することと、をさらに含み、前記第2の部分が、前記スプリントオリゴヌクレオチドを含み、前記スプリントオリゴヌクレオチドが、
    i.前記連結されたオリゴヌクレオチド上の前記第2のユニバーサルハンドルにアニーリングするオリゴヌクレオチド配列、
    ii.第2のバーコードについての鋳型配列であって、各第2の部分の前記第2のバーコードは共通であるが、他の第2の部分の前記第2のバーコードとは異なる、第2のバーコードについての鋳型配列、および
    iii.第3のユニバーサルハンドルの鋳型配列を含み、
    前記第2の伸長産物が、前記第2のバーコードおよび第3のユニバーサルハンドルを含む、請求項12に記載の方法。
  14. a.前記第2の部分を混ぜ合わせること、
    b.前記混ぜ合わされた第2の部分を2つ以上の第3の部分に分割すること、
    c.各第3の部分を増幅プライマーと接触させること、をさらに含み、前記増幅プライマーが、前記第1のユニバーサルハンドルおよび前記第3のユニバーサルハンドルにハイブリダイゼーションし、そこから伸長することができ、前記増幅プライマーが、任意選択で、増幅産物を生成するために、それぞれ第3および/または第4のバーコード、ならびにそれぞれ第1および/または第2のアダプター配列を含み、前記増幅産物の前記第1、第2、および第3のバーコード配列(またはそれらの相補体)の組み合わせが、単一の細胞または核に由来する前記増幅産物に特有である、請求項13に記載の方法。
  15. 前記プライマー、前記連結されたオリゴヌクレオチド、またはそれらの両方が、ランダム配列、標的特異的配列、またはそれらの両方を含む、請求項1~14のいずれか一項に記載の方法。
  16. 前記プライマー、前記連結されたオリゴヌクレオチド、または前記スプリントオリゴヌクレオチドのうちの1つ以上が、ユニバーサルハンドル、ユニバーサル配列、特有の分子同定子、アダプター配列、プロモーター配列、バーコード配列、インデックス配列、またはそれらの任意の組み合わせを含む、請求項1~15のいずれか一項に記載の方法。
  17. 前記ポリメラーゼが、DNAポリメラーゼまたはRNAポリメラーゼである、請求項1~16のいずれか一項に記載の方法。
  18. 前記核酸が、DNAまたはRNAである、請求項1~17のいずれか一項に記載の方法。
  19. 式(A)のオリゴヌクレオチドが連結されたヌクレオチド
    Figure 2022537069000052
    またはその塩であって、
    式中、NBは、核酸塩基であり、
    オリゴは、3~100ヌクレオチドのオリゴヌクレオチドであり、
    XおよびQの各々は、独立して、H、OH、N3、ハロ、アルキル、アルコキシ、アルキル、アルケニル、アルキニル、アシル、シアノ、アミノ、エステル、およびアミドから選択され、
    ZおよびYの各々は、独立して、結合、アミノ、アミド、アルキル、アルケニル、アルキニル、チオエーテル、スルホニル、スルホンアミド、エーテル、ケトン、カルボニル、無水物、エステル、イミド、尿素、ウレタン、およびそれらの組み合わせから選択され、
    CXNは、アルキレン、アルケニレン、アルキニレン、ケトン、カーボネート、エステル、エーテル、無水物、アミド、アミノ、アミノアルキレン、イミノ、イミド、ジアゾ、カルバメートエステル、ホスホジエステル、スルフィド、ジスルフィド、スルホニル、スルホンアミド、および1~4個のN、O、S原子、またはそれらの組み合わせを含む複素環式基であって、任意選択で炭素、窒素、または硫黄原子において置換された複素環式基から選択される、オリゴヌクレオチドが連結されたヌクレオチドまたはその塩。
  20. CXNがクリックであり、クリックが以下の対の官能基、
    i)アルキニルおよびアジド、
    ii)チオールおよびアルキニル、
    iii)チオールおよびアルケニル、
    iv)アジドおよびシクロオクタニル、ならびに
    v)シクロオクタニルおよびニトロンのうちの1つの間でのクリック反応の産物である、請求項19に記載のオリゴヌクレオチドが連結されたヌクレオチド。
  21. 核酸ライブラリの前記調製における、または核酸のタグ付けにおける使用のための、請求項19または20に記載のオリゴヌクレオチドが連結されたヌクレオチドの使用。
JP2021576459A 2019-06-21 2020-06-22 次世代配列決定ライブラリを調製するための核酸の標識化に有用なオリゴヌクレオチドが連結された三リン酸ヌクレオチド Pending JP2022537069A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962864589P 2019-06-21 2019-06-21
US62/864,589 2019-06-21
US202063032297P 2020-05-29 2020-05-29
US63/032,297 2020-05-29
PCT/US2020/039009 WO2020257797A1 (en) 2019-06-21 2020-06-22 Oligonucleotide-tethered triphosphate nucleotides useful for labelling nucleic acids for preparing next-generation sequencing libraries

Publications (1)

Publication Number Publication Date
JP2022537069A true JP2022537069A (ja) 2022-08-23

Family

ID=71670396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021576459A Pending JP2022537069A (ja) 2019-06-21 2020-06-22 次世代配列決定ライブラリを調製するための核酸の標識化に有用なオリゴヌクレオチドが連結された三リン酸ヌクレオチド

Country Status (6)

Country Link
US (2) US11739316B2 (ja)
EP (1) EP3986907A1 (ja)
JP (1) JP2022537069A (ja)
KR (1) KR20220024778A (ja)
CN (1) CN114450401A (ja)
WO (1) WO2020257797A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4355757A1 (en) * 2021-06-17 2024-04-24 F. Hoffmann-La Roche AG Nucleoside-5 -oligophosphates having a cationically-modified nucleobase
WO2022268932A1 (en) 2021-06-24 2022-12-29 Thermo Fisher Scientific Geneart Gmbh Systems and methods for single cell analysis
US20240002932A1 (en) * 2022-06-29 2024-01-04 10X Genomics, Inc. Click chemistry-based dna photo-ligation for manufacturing of high-resolution dna arrays

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2226316B1 (en) 2002-05-30 2016-01-13 The Scripps Research Institute Copper-catalysed ligation of azides and acetylenes
EP2176277B1 (en) 2007-07-19 2016-02-24 Georgia State University Research Foundation, Inc. Nucleotides and aptamers containing boronic acid groups having biased binding to glycosylated proteins, and uses thereof
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
GB201119903D0 (en) 2011-11-17 2011-12-28 Univ Vilnius Nucleic acid production and sequence analysis
US20140105466A1 (en) 2012-10-16 2014-04-17 Ocean Images UK Ltd. Interactive photography system and method employing facial recognition
CA2886974C (en) 2012-10-17 2021-06-29 Spatial Transcriptomics Ab Methods and product for optimising localised or spatial detection of gene expression in a tissue sample
RU2688435C2 (ru) 2013-08-19 2019-05-21 Эбботт Молекьюлар Инк. Набор для получения реакционной смеси для синтеза 3′-o-пропаргил-модифицированной нуклеиновой кислоты
ES2873850T3 (es) 2013-08-19 2021-11-04 Abbott Molecular Inc Bibliotecas de secuenciación de próxima generación
GB201403216D0 (en) 2014-02-24 2014-04-09 Cambridge Epigenetix Ltd Nucleic acid sample preparation
EP3122759B1 (en) 2014-03-24 2022-06-01 The Trustees of Columbia University in the City of New York Chemical methods for producing tagged nucleotides
GB201408841D0 (en) 2014-05-19 2014-07-02 Univ Southampton Nucleic acid processing
US10900065B2 (en) 2014-11-14 2021-01-26 University Of Washington Methods and kits for labeling cellular molecules
DK3901281T3 (da) 2015-04-10 2023-01-23 Spatial Transcriptomics Ab Rumligt adskilt, multipleks nukleinsyreanalyse af biologiske prøver
WO2016168825A1 (en) 2015-04-17 2016-10-20 Centrillion Technology Holdings Corporation Methods for performing spatial profiling of biological molecules
SG11201809522WA (en) * 2016-04-29 2018-11-29 Omniome Inc Method of nucleic acid sequence determination
EP3475450B1 (en) 2016-06-24 2020-12-09 The Regents of The University of California Nucleic acid synthesis and sequencing using tethered nucleoside triphosphates
PT3529380T (pt) 2016-10-19 2022-08-31 Illumina Inc Métodos para ligação química de ácidos nucléicos
US20200190581A1 (en) 2017-01-04 2020-06-18 The University Of Chicago Methods for detecting cytosine modifications

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANNA BACCARO; ET AL: "BARCODED NUCLEOTIDES", ANGEWANDTE CHEMIE INTERNATIONAL EDITION, vol. 51, no. 1, JPN5022010040, 2 January 2012 (2012-01-02), DE, pages 254 - 257, XP055294152, ISSN: 0005031551, DOI: 10.1002/anie.201105717 *

Also Published As

Publication number Publication date
EP3986907A1 (en) 2022-04-27
US11739316B2 (en) 2023-08-29
KR20220024778A (ko) 2022-03-03
US20200399633A1 (en) 2020-12-24
CN114450401A (zh) 2022-05-06
US20240102003A1 (en) 2024-03-28
WO2020257797A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
JP6886962B2 (ja) Rnaシークエンシングライブラリーを生成する方法
US10557134B2 (en) Protection of barcodes during DNA amplification using molecular hairpins
EP2464755B1 (en) Methods and kits for 3'-end-tagging of rna
US20240102003A1 (en) Oligonucleotide-tethered nucleotides
CN106460052B (zh) 双链核酸的合成
CN105579592B (zh) 用于制备dna文库的dna接头分子以及生产它们的方法和用途
EP2951316A2 (en) Primer technology
JP6876785B2 (ja) 単分子配列決定のための一本鎖環状dnaライブラリーを生成するための方法
WO2019070593A1 (en) METHOD AND SYSTEM FOR ENZYMATIC SYNTHESIS OF OLIGONUCLEOTIDES
KR20240024835A (ko) 비이드-기반 핵산의 조합 인덱싱을 위한 방법 및 조성물
US20200385791A1 (en) Multiple Beads Per Droplet Resolution
WO2021152126A1 (en) Selective amplification of nucleic acid sequences
Eremeeva et al. Enzymatic synthesis using polymerases of modified nucleic acids and genes
Akram et al. Bacterial thermophilic DNA polymerases: A focus on prominent biotechnological applications
US20230416804A1 (en) Whole transcriptome analysis in single cells
JP7191115B2 (ja) エンドヌクレアーゼ媒介移動平衡(EM-SEq)による核酸の増幅のための方法
Kapustina The utility of modified nucleotides for high-throughput nucleic acid analysis
Kuwahara et al. Polymerase Reactions that Involve Modified Nucleotides
WO2023107899A2 (en) A method of capturing crispr endonuclease cleavage products

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230406

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230703

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231225