JP2020533952A - 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法 - Google Patents

高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法 Download PDF

Info

Publication number
JP2020533952A
JP2020533952A JP2019570097A JP2019570097A JP2020533952A JP 2020533952 A JP2020533952 A JP 2020533952A JP 2019570097 A JP2019570097 A JP 2019570097A JP 2019570097 A JP2019570097 A JP 2019570097A JP 2020533952 A JP2020533952 A JP 2020533952A
Authority
JP
Japan
Prior art keywords
cells
nucleic acid
indexed
nuclei
compartment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019570097A
Other languages
English (en)
Other versions
JP6986103B2 (ja
Inventor
ジャイ・シェンデュア
ツァオ・ジュンユエ
フランク・ジェイ・スティーマーズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Washington
Original Assignee
University of Washington
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Washington filed Critical University of Washington
Publication of JP2020533952A publication Critical patent/JP2020533952A/ja
Priority to JP2021192377A priority Critical patent/JP2022031810A/ja
Application granted granted Critical
Publication of JP6986103B2 publication Critical patent/JP6986103B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本明細書では、複数の単一細胞からの核酸を含む配列決定ライブラリーを調製する方法が提供される。一態様において、配列決定ライブラリーは、複数の単一細胞からの全トランスクリプトームを表す核酸を含む。一態様において、核酸は3つのインデックス配列を含む。また、3つのインデックス配列を有する核酸を含む組成物などの組成物も本明細書で提供される。

Description

関連出願への相互参照
この出願は、2018年6月4日に出願された米国仮出願第62/680,259号、および2019年3月21日に出願された米国仮出願第62/821,678号の利益を主張するもので、これらはそれぞれ参照によって本明細書に組み込まれる。
政府の資金提供
本発明は、国立衛生研究所により授与された助成金番号DP1 HG007811の下で政府の支援を受けてなされた。政府は本発明に一定の権利を有する。
技術分野
本開示の態様は、核酸の配列決定に関する。特に、本明細書で提供される方法および組成物の態様は、インデックス付けされた単一細胞トランスクリプトームライブラリーを製造し、そこから配列データを取得することに関する。
細胞は、多細胞生物の発達中など、さまざまなプロセス中に、また治療薬への曝露などのさまざまな条件に応答して、機能的および分子的に異なる状態の移行を経験する。細胞状態の移行経路または細胞の運命について特性確認することは、環境の変化に対する細胞の発達および分子応答を含む経路を理解する上で有用である。たとえば、発達異常の調節因子を特定することができ、治療薬が細胞にどのように影響するかをよりよく理解することができる。
単一細胞コンビナトリアルインデックス付け(「sci−」)は、スプリット・プールバーコーディングを使用して、多数の単一細胞または核の核酸内容に対しユニーク標識を付す方法論的なフレームワークである。しかしながら、現在の単一細胞ゲノム技術は、多細胞生物の発達中に通常存在する急速に多様化し、数も増大している細胞タイプの分子状態および軌跡の全体像を得るためのスループットと解像度を欠いている。現在の単一細胞ゲノム技術は、細胞の状態のスナップショットのみを捉えるため、内因性因子(例、細胞の内因性細胞周期プログラム)および外因性因子(例、治療薬などの外部刺激に対する細胞の反応)によって調節される細胞移行動態に関する情報を提供することができない。
本明細書では、新たに合成されたRNAを標識することにより、細胞状態移行動態を識別する方法を提供する。全トランスクリプトームおよび新規に合成されたRNAトランスクリプトームの両方が捉えられ、単一細胞レベルでのいくつかの時点の間におけるトランスクリプトーム動態の特性評価が可能になる。また、本明細書では、興味の対象であるmRNAに単一細胞配列決定を集中させ、それにより、限られた電力に対処して任意の所与の転写物の存在量の変化を検出する方法を提供する。さらに、細胞喪失の速度と限られた反応効率を克服して、従来可能であったものよりも多数の単一細胞のプロファイリングをもたらす方法を提供する。
一態様において、ある方法は、各区画が核または細胞のサブセットを含む第1の複数の区画に複数の核または細胞を提供すること、および細胞のサブセットまたは該細胞から得られた核のサブセットで新たに合成されたRNAを標識することを含む。核または細胞の各サブセットのRNA分子をプロセッシングして、インデックス付きの核または細胞を作製させるが、このプロセッシングでは、核または細胞の各サブセットに存在するRNA核酸に、第1の区画に固有のインデックス配列を付加することにより、インデックス付けされた核または細胞に存在するインデックス付けされたDNA核酸を得、次いでインデックス付けされた核または細胞を合わせて、プールされたインデックス付きの核または細胞を作製させる。
別の態様において、ある方法は、第1の複数の区画に複数の核または細胞を提供することを含み、各区画は、核または細胞のサブセットを含む。各サブセットを、逆転写酵素および所定のRNA核酸にアニーリングするプライマーと接触させることにより、プライマーと鋳型RNA核酸の対応するDNAヌクレオチド配列を持つ二本鎖DNA核酸を得る。核または細胞の各サブセットのDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させるが、このプロセッシングでは、核または細胞の各サブセットに存在するDNA核酸に、第1の区画に固有のインデックス配列を付加することにより、インデックス付けされた核または細胞に存在するインデックス付けされたDNA核酸を得、次いでインデックス付けされた核または細胞を合わせて、プールされたインデックス付きの核または細胞を作製させる。
別の態様において、ある方法は、第1の複数の区画に複数の核または細胞を提供することを含み、各区画は、核または細胞のサブセットを含む。各サブセットを、逆転写酵素および所定のRNA核酸にアニーリングするプライマーと接触させることにより、プライマーと鋳型RNA核酸の対応するDNAヌクレオチド配列を持つ二本鎖DNA核酸を得る。核または細胞の各サブセットのDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させるが、このプロセッシングでは、核または細胞の各サブセットに存在するDNA核酸に、第1の区画に固有のインデックス配列を付加することにより、インデックス付けされた核または細胞に存在するインデックス付けされたDNA核酸を得、次いでインデックス付けされた核または細胞を合わせて、プールされたインデックス付きの核または細胞を作製させる。プールされたインデックス付きの核または細胞をスプリットし、次いでさらにプロセッシングしてDNA分子に第2の区画に固有のインデックスを付加し、合わせ、スプリットし、さらにプロセッシングして該DNA分子に第3の区画に固有のインデックスを付加する。
定義
本明細書で使用される用語は、特に指定されない限り、関連技術における通常の意味をとると理解されよう。本明細書で使用されるいくつかの用語とその意味を以下に示す。
本明細書で使用される場合、「生物」、「対象」という用語は互換的に使用され、微生物(例えば、原核生物または真核生物)、動物および植物を指す。動物の一例は、ヒトなどの哺乳類である。
本明細書で使用される場合、「細胞タイプ」という用語は、形態、表現型、発生起源、または他の既知もしくは認識可能である際立った細胞特性に基づいて細胞を識別することを意図している。単一の生物から(または同じ種の生物から)さまざまな異なる細胞タイプを取得できる。具体例としての細胞タイプには、配偶子(卵子または卵細胞などの雌性配偶子、および精子などの雄性配偶子を含む)、卵巣上皮、卵巣線維芽細胞、精巣、膀胱、免疫細胞、B細胞、T細胞、ナチュラルキラー細胞、樹状細胞、がん細胞、真核細胞、幹細胞、血液細胞、筋肉細胞、脂肪細胞、皮膚細胞、神経細胞、骨細胞、膵臓細胞、内皮細胞、膵臓上皮、膵臓アルファ、膵臓ベータ、膵臓内皮、骨髄リンパ芽球、骨髄Bリンパ芽球、骨髄マクロファージ、骨髄赤芽球、骨髄樹状突起、骨髄脂肪細胞、骨髄骨細胞、骨髄軟骨細胞、前骨髄芽球、骨髄巨核芽球、膀胱、脳Bリンパ球、脳グリア、ニューロン、脳星状細胞、神経外胚葉、脳マクロファージ、脳ミクログリア、脳上皮、皮質ニューロン、脳線維芽細胞、乳房上皮、結腸上皮、結腸Bリンパ球、乳腺上皮、乳腺筋上皮、乳腺線維芽細胞、結腸腸細胞、子宮頸部上皮、乳管上皮、舌上皮、扁桃腺樹状突起、扁桃Bリンパ球、末梢血リンパ芽球、末梢血Tリンパ芽球、末梢血皮膚Tリンパ球、末梢血ナチュラルキラー、末梢血Bリンパ芽球、末梢血単球、末梢血骨髄芽球、末梢血単芽球、末梢血前骨髄芽球、末梢血マクロファージ、末梢血好塩基球、肝臓内皮、肝臓マスト、肝臓上皮、肝臓Bリンパ球、脾臓内皮、脾臓上皮、脾臓Bリンパ球、肝臓肝細胞、肝臓、線維芽細胞、肺上皮、気管支上皮、肺線維芽細胞、肺Bリンパ球、肺シュワン、肺扁平上皮、肺マクロファージ、肺骨芽細胞、神経内分泌、肺胞、胃上皮、および胃線維芽細胞が含まれるが、これらに限定されない。
本明細書で使用される場合、「組織」という用語は、生物内で1つ以上の特定の機能を果たすために一緒に作用する細胞の集合体または凝集体を意味するものとする。細胞は、場合によっては形態学的に類似していてもよいものであることができる。具体例としての組織には、胚、精巣上体、目、筋肉、皮膚、腱、静脈、動脈、血液、心臓、脾臓、リンパ節、骨、骨髄、肺、気管支、気管、消化管、小腸、大腸、結腸、直腸、唾液腺、舌、胆嚢、虫垂、肝臓、膵臓、脳、胃、皮膚、腎臓、尿管、膀胱、尿道、生殖腺、睾丸、卵巣、子宮、卵管、胸腺、下垂体、甲状腺、副腎、または副甲状腺が含まれるが、これらに限定されない。組織は、ヒトまたは他の生物のさまざまな器官のいずれかに由来することができる。組織は、健常組織または病的組織であることができる。病的組織の例には、生殖組織、肺、乳房、結腸直腸、前立腺、鼻咽頭、胃、精巣、皮膚、神経系、骨、卵巣、肝臓、血液組織、膵臓、子宮、腎臓、リンパ組織などにおける悪性腫瘍が含まれるが、これらに限定されない。悪性腫瘍は、さまざまな組織学的サブタイプ、例えば、がん腫、腺がん、肉腫、線維腺がん、神経内分泌、または未分化のものであってよい。
本明細書で使用される場合、「区画」という用語は、何かを他のものから分離または単離する領域または体積を意味するものとする。具体例としての区画には、バイアル、チューブ、ウェル、液滴、ボーラス、ビーズ、容器、表面フィーチャ、または流体の流れ、磁気、電流などの物理的な力によって分離された領域もしくは体積が含まれるが、これらに限定されない。一態様では、区画は、96ウェルプレートまたは384ウェルプレートなどのマルチウェルプレートのウェルである。本明細書で使用される場合、液滴は、1つ以上の核または細胞を封入するためのビーズであるヒドロゲルビーズを含んでもよく、ヒドロゲル組成物を含む。いくつかの態様では、液滴は、ヒドロゲル材料の均一な液滴であるか、またはポリマーヒドロゲルシェルを有する中空の液滴である。均一であろうと中空であろうと、液滴は1つ以上の核または細胞を封入できるものであればよい。いくつかの態様では、液滴は界面活性剤で安定化された液滴である。
本明細書で使用される場合、「トランスポソーム複合体」は、組み込み酵素および組み込み認識部位を含む核酸を指す。「トランスポソーム複合体」は、トランスポザーゼおよび転位反応を触媒することができるトランスポザーゼ認識部位によって形成される機能的複合体である(例えば、Gundersonら、国際公開第2016/130704号を参照)。組み込み酵素の例には、インテグラーゼやトランスポザーゼが含まれるが、これらに限定されない。組み込み認識部位の例には、トランスポザーゼ認識部位が含まれるが、これに限定されない。
本明細書で使用される場合、「核酸」という用語は、当技術分野におけるその使用と一致するものとし、天然に存在する核酸またはその機能的類似体を含む。特に有用な機能的類似体は、配列特異的様式で核酸にハイブリダイズすることができるか、または特定のヌクレオチド配列の複製のための鋳型として使用することができる。天然に存在する核酸は一般に、ホスホジエステル結合を含むバックボーンを有する。類似体構造は、当技術分野で既知のさまざまなもののいずれかを含む代替バックボーン結合を有することができる。天然に存在する核酸は一般に、デオキシリボース糖(例えば、デオキシリボ核酸(DNA)に見られる)またはリボース糖(例えば、リボ核酸(RNA)に見られる)を有する。核酸は、当技術分野で既知のこれらの糖部分のさまざまな類似体のいずれかを含むことができる。核酸は、天然塩基または非天然塩基を含むことができる。これに関して、天然のデオキシリボ核酸は、アデニン、チミン、シトシンまたはグアニンからなる群から選択される1つ以上の塩基を有することができ、リボ核酸は、アデニン、ウラシル、シトシンまたはグアニンからなる群から選択される1つ以上の塩基を有することができる。核酸に含めることができる有用な非天然塩基は、当技術分野で既知である。非天然塩基の例には、ロックされた核酸(LNA)、架橋核酸(BNA)、および擬似相補的塩基(Trilink Biotechnologies、サンディエゴ、CA)が含まれる。LNA塩基およびBNA塩基をDNAオリゴヌクレオチドに組み込んで、オリゴヌクレオチドのハイブリダイゼーションの強度と特異性を高めることができる。LNA塩基およびBNA塩基ならびにかかる塩基の使用は、当業者に既知であり、常用的である。特に明記しない限り、用語「核酸」には、天然および非天然のmRNA、非コーディングRNA、例えば3’末端にポリAを含まないRNA、RNAに由来する核酸、例えばcDNA、およびDNAが含まれる。
本明細書で使用される場合、用語「標的」は、核酸に関して使用される場合、本明細書に記載の方法または組成物の状況における核酸についての意味的識別語としての意義を有するものとし、必ずしも他の点で明示されているものを超える核酸の構造または機能を限定するものではない。標的核酸は、本質的に既知または未知の配列の任意の核酸であってよい。標的核酸は、例えば、ゲノムDNAの断片(例えば、染色体DNA)、プラスミドなどの染色体外DNA、無細胞DNA、RNA(例えば、RNAまたは非コーディングRNA)、タンパク質(例えば、細胞タンパク質または細胞表面タンパク質)、またはcDNAであってもよい。配列決定は、標的分子の全体または一部の配列の決定につながるものでもよい。標的は、核などの一次核酸試料に由来することができる。一態様では、標的は、各標的断片の一端または両端にユニバーサル配列を配置することにより、増幅に適した鋳型にプロセッシングすることができる。標的はまた、cDNAへの逆転写によって一次RNA試料から得ることもできる。一態様では、標的は、細胞に存在するDNA、RNA、またはタンパク質のサブセットに関連して使用される。標的化配列決定では、通常、PCR増幅(例:領域特異的プライマー)またはハイブリダイゼーションに基づく捕捉方法または抗体のいずれかによる、興味の対象である遺伝子または領域またはタンパク質の選択と分離を使用する。標的化濃縮は、該方法のさまざまな段階で行われることができる。例えば、逆転写段階で標的特異的プライマーを使用するか、またはより複雑なライブラリーからのサブセットのハイブリダイゼーションに基づく濃縮を使用して、標的とされたRNAを表示することができる。一例は、エクソーム配列決定またはL1000アッセイである(Subramanianら、2017、Cell、171;1437-1452)。標的化配列決定は、当業者に既知の濃縮方法のいずれかを含むことができる。
本明細書で使用される「ユニバーサル」という用語は、ヌクレオチド配列を記述するために使用される場合、2つ以上の核酸分子に共通する配列の領域を指し、その場合これらの分子はまた互いに異なる配列の領域を有するものとする。分子の集合体の異なる構成員に存在するユニバーサル配列は、ユニバーサル捕捉核酸の集団、例えばユニバーサル配列の一部と相補的である捕捉オリゴヌクレオチド、例えばユニバーサル捕捉配列を使用して複数の異なる核酸の捕捉を行わせることができる。ユニバーサル捕捉配列の非限定的な例には、P5プライマーおよびP7プライマーと同一または相補的である配列が含まれる。同様に、分子の集合体の異なる構成員に存在するユニバーサル配列は、例えばユニバーサルアンカー配列など、ユニバーサル配列の一部と相補的であるユニバーサルプライマーの集団を使用して、複数の異なる核酸の複製(例えば、配列決定)または増幅を行わせることができる。一態様では、ユニバーサルアンカー配列は、ユニバーサルプライマー(例えば、リード1またはリード2のための配列決定プライマー)が配列決定のためにアニーリングする部位として使用される。したがって、捕捉オリゴヌクレオチドまたはユニバーサルプライマーは、ユニバーサル配列に特異的にハイブリダイズできる配列を含む。
用語「P5」および「P7」は、ユニバーサル捕捉配列または捕捉オリゴヌクレオチドを指す場合に使用されてもよい。「P5’」(P5プライム)および「P7’」(P7プライム)という用語は、それぞれP5およびP7の相補体を指す。本明細書に提示する方法では、任意の適切なユニバーサル捕捉配列または捕捉オリゴヌクレオチドを使用することができ、P5およびP7の使用は具体例としての態様にすぎないことが理解されよう。国際公開第2007/010251号、国際公開第2006/064199号、国際公開第2005/065814号、国際公開第2015/106941号、国際公開第1998/044151号および国際公開第2000/018957号の開示によって具体的に示されているように、フローセル上のP5およびP7またはそれらの相補体などの捕捉オリゴヌクレオチドの使用は、当技術分野で既知である。例えば、適切なフォワード増幅プライマーであれば、固定化されていようと溶解状態であろうと、相補配列へのハイブリダイゼーションおよび配列の増幅についての本明細書に提示される方法において有用なものであることができる。同様に、適切なリバース増幅プライマーであれば、固定化されていようと溶解状態であろうと、相補配列へのハイブリダイゼーションおよび配列の増幅についての本明細書に提示される方法において有用なものであることができる。当業者であれば、本明細書に提示される核酸の捕捉および/または増幅に適したプライマー配列を設計および使用する方法について理解できるはずである。
本明細書で使用される場合、「プライマー」という用語およびその派生語は、一般に、興味の対象である標的配列にハイブリダイズすることができる核酸を全て包含する。通常、プライマーは、ポリメラーゼによってヌクレオチドを重合させることができるか、またはインデックスなどのヌクレオチド配列をライゲーションさせることができる基質として機能する;しかしながら、いくつかの態様では、プライマーは、合成された核酸鎖に組み込まれ、別のプライマーがハイブリダイズして合成された核酸分子と相補的な新しい鎖の合成をプライミングすることができる部位を提供することができる。プライマーは、ヌクレオチドまたはその類似体の任意の組み合わせを含むことができる。いくつかの態様において、プライマーは一本鎖オリゴヌクレオチドまたはポリヌクレオチドである。用語「ポリヌクレオチド」および「オリゴヌクレオチド」は、本明細書では互換的に使用され、任意の長さのヌクレオチドのポリマー形態を指し、リボヌクレオチド、デオキシリボヌクレオチド、それらの類似体、またはそれらの混合物を含んでいてもよい。これらの用語は、同等物として、ヌクレオチド類似体から作られたDNA、RNA、cDNA、または抗体−オリゴコンジュゲートのいずれかの類似体を包含し、一本鎖(センスまたはアンチセンスなど)ポリヌクレオチドおよび二本鎖ポリヌクレオチドに適用できると理解されるべきである。本明細書で使用される用語はまた、例えば逆転写酵素の作用によりRNA鋳型から製造される相補的DNAまたはコピーDNAであるcDNAも包含する。この用語は、分子の一次構造のみを指す。したがって、この用語には、三本鎖、二本鎖および一本鎖のデオキシリボ核酸(「DNA」)、ならびに三本鎖、二本鎖および一本鎖のリボ核酸(「RNA」)が含まれる。
本明細書で使用する場合、用語「アダプター」およびその派生語、例えばユニバーサルアダプターは、一般に、本開示の核酸分子に付着させることができる任意の直鎖オリゴヌクレオチドを指す。いくつかの態様において、アダプターは、試料中に存在する任意の標的配列の3’末端または5’末端に対して実質的に非相補的である。いくつかの態様において、適切なアダプター長は、約10〜100ヌクレオチド、約12〜60ヌクレオチド、または約15〜50ヌクレオチドの範囲の長さである。一般的に、アダプターはヌクレオチドおよび/または核酸の任意の組み合わせを含むことができる。一部の実施態様において、アダプターは、1つ以上の場所に1つ以上の開裂可能基を含むことができる。別の実施態様において、アダプターは、プライマー、例えばユニバーサルプライマーの少なくとも一部と実質的に同一または実質的に相補的である配列を含むことができる。いくつかの態様において、アダプターは、バーコード(本明細書ではタグまたはインデックスとも称す)を含むことで、下流のエラー修正、識別、または配列決定を助けることができる。「アダプター(adaptor)」と「アダプター(adapter)」という用語は互換的に使用される。
本明細書で使用する「各」という用語は、一群の項目に関連して使用される場合、その一群における個々の項目を識別することを意図しているが、文脈上特に明確な指示がなければ、その一群における項目をことごとく指すとは限らない。
本明細書で使用される場合、「輸送」という用語は、流体を通る分子の移動を指す。この用語には、濃度勾配に沿った分子の移動などの受動輸送(受動拡散など)を含めることができる。この用語はまた、分子が濃度勾配に沿って、または濃度勾配に逆らって移動できる能動輸送を含むことができる。したがって、輸送は、1つ以上の分子を所望の方向で、または増幅部位などの所望の位置に移動させるためにエネルギーの適用を含むことができる。
本明細書で使用する場合、「増幅する」、「増幅している」または「増幅反応」およびそれらの派生語は、一般に、核酸分子の少なくとも一部が少なくとも1つの追加核酸分子に複製またはコピーされる何らかの作用またはプロセスを指す。追加核酸分子は、鋳型核酸分子の少なくともある一部分と実質的に同一または実質的に相補的である配列を場合によっては含んでいてもよい。鋳型核酸分子は一本鎖状または二本鎖状であることができ、追加核酸分子は独立して一本鎖状または二本鎖状であることができる。増幅は、場合によっては、核酸分子の一次的複製または指数関数的複製を含んでいてもよい。いくつかの態様において、かかる増幅は等温条件を使用して実行することができる;他の態様において、かかる増幅には温度サイクリングを含めることができる。いくつかの態様において、増幅は、単一の増幅反応における複数の標的配列の同時増幅を含むマルチプレックス増幅である。いくつかの態様において、「増幅」には、DNAおよびRNAに基づく核酸の少なくともある一部分の単独または組み合わせでの増幅が含まれる。増幅反応は、当業者に既知の増幅プロセスのいずれかを含むことができる。いくつかの態様では、増幅反応にはポリメラーゼ連鎖反応(PCR)が含まれる。
本明細書で使用される場合、「増幅条件」およびその派生語は、一般に、1つ以上の核酸配列を増幅するのに適した条件を指す。かかる増幅は一次的または指数関数的であることができる。いくつかの態様において、増幅条件は、等温条件を含むことができ、または別法として温度サイクリング条件、または等温条件と温度サイクリング条件の組み合わせを含むことができる。いくつかの態様では、1つ以上の核酸配列を増幅するのに適した条件には、ポリメラーゼ連鎖反応(PCR)条件が含まれる。典型的には、増幅条件は、ユニバーサル配列に隣接する1つ以上の標的配列などの核酸を増幅する、または1つ以上のアダプターにライゲーションされた増幅標的配列を増幅するのに十分なものである反応混合物を指す。一般的に、増幅条件には、増幅用または核酸合成用の触媒、例えばポリメラーゼ;増幅される核酸に対してある程度の相補性を有するプライマー;および一旦核酸にハイブリダイズされるとプライマーの伸長を促進させるデオキシリボヌクレオチド三リン酸(dNTP)などのヌクレオチドが含まれる。増幅条件は、プライマーの核酸へのハイブリダイゼーションまたはアニーリング、該プライマーの伸長、および伸長されたプライマーが増幅中の核酸配列から分離される変性段階を必要とすることができる。必ずというわけではないが、典型的には、増幅条件は温度サイクリングを含むことができる;いくつかの態様において、増幅条件は、アニーリング段階、伸長段階および分離段階が繰り返される複数のサイクルを含む。典型的には、増幅条件は、Mg2+やMn2+などの陽イオンを含み、またイオン強度のさまざまな修飾因子を含むことができる。
本明細書で使用される場合、「再増幅」およびその派生語は、一般に、増幅された核酸分子の少なくとも一部が任意の適切な増幅プロセス(いくつかの態様では「二次」増幅と称す)を介してさらに増幅される任意のプロセスを指し、それにより、再増幅された核酸分子が製造される。二次増幅は、増幅された核酸分子が製造された元の増幅プロセスと同一である必要はなく;また、再増幅された核酸分子は、増幅された核酸分子と完全に同一または完全に相補的である必要もない;必要なのは、再増幅された核酸分子が増幅された核酸分子またはその相補体の少なくとも一部を含むことだけである。例えば、再増幅は、一次増幅とは異なる標的特異的プライマーを含む、異なる増幅条件および/または異なるプライマーの使用を伴うことができる。
本明細書で使用される場合、「ポリメラーゼ連鎖反応」(「PCR」)という用語は、Mullis、米国特許第4,683,195号および同第4,683,202号の方法を指しており、前記特許は、クローニングまたは精製を行うことなく、ゲノムDNAの混合物中における興味の対象であるポリヌクレオチドのセグメントの濃度を増加させる方法を報告している。興味の対象であるポリヌクレオチドを増幅するためのこのプロセスは、興味の対象である所望のポリヌクレオチドを含むDNA混合物に大幅に過剰な2つのオリゴヌクレオチドプライマーを導入した後、DNAポリメラーゼの存在下で一連の温度サイクリングを行うことから成る。2つのプライマーは、興味の対象である二本鎖ポリヌクレオチドのそれぞれの鎖に相補的である。まず、混合物を、より高い温度で最初に変性させ、その後、プライマーを興味の対象である分子のポリヌクレオチド内の相補配列にアニーリングさせる。アニーリングに続いて、プライマーをポリメラーゼで伸長させて、相補鎖の新しいペアを形成させる。変性段階、プライマーアニーリング段階、およびポリメラーゼ伸長段階を何度も繰り返して(温度サイクリングと称す)、興味の対象である所望のポリヌクレオチドの高濃度の増幅セグメントを得ることができる。興味の対象である所望のポリヌクレオチド(アンプリコン)の増幅されたセグメントの長さは、プライマーの互いに対する相対的な位置によって決定されるため、この長さは制御可能なパラメータである。このプロセスを繰り返すという理由で、この方法はPCRと呼ばれる。興味の対象であるポリヌクレオチドの所望の増幅セグメントは、混合物中における(濃度に関して)主要な核酸配列になるため、「PCR増幅」されていると言われる。上記で検討した方法の変更においては、標的核酸分子を、複数の異なるプライマー対、場合によっては興味の対象である1標的核酸分子当たり1つ以上のプライマー対を使用してPCR増幅を行い、それによりマルチプレックスPCR反応を形成することができる。
本明細書で定義される「マルチプレックス増幅」とは、少なくとも1つの標的特異的プライマーを使用した試料内の2つ以上の標的配列の選択的かつ非ランダムな増幅を指す。いくつかの態様において、標的配列の一部またはすべてが単一の反応容器内で増幅されるように、マルチプレックス増幅を実行する。所与のマルチプレックス増幅の「plexy(プレキシ)」または「plex(プレックス)」は、一般に、その単一のマルチプレックス増幅中に増幅される異なる標的特異的配列の数を指す。いくつかの態様において、プレキシは、約12−プレックス、24−プレックス、48−プレックス、96−プレックス、192−プレックス、384−プレックス、768−プレックス、1536−プレックス、3072−プレックス、6144−プレックスまたはそれ以上であることができる。いくつかの異なる方法により増幅された標的配列を検出することも可能である(例えば、ゲル電気泳動とそれに続く濃度測定、バイオアナライザーまたは定量的PCRによる定量、標識プローブとのハイブリダイゼーション;ビオチン化プライマーの取り込みとその後のアビジン−酵素コンジュゲート検出;増幅された標的配列への32P標識デオキシヌクレオチド三リン酸の取り込み)。
本明細書で使用される場合、「増幅(された)標的配列」およびその派生語は、一般に、標的特異的プライマーおよび本明細書で提供される方法を使用して標的配列を増幅することにより製造される核酸配列を指す。増幅標的配列は、標的配列に関して同じセンス(すなわち、プラス鎖)またはアンチセンス(すなわち、マイナス鎖)のいずれかであってもよい。
本明細書で使用する場合、用語「ligating(ライゲーションしている)」、「ligation(ライゲーション)」およびそれらの派生語は、一般に、2つ以上の分子を互いに共有結合させるプロセス、例えば2つ以上の核酸分子を互いに共有結合させるプロセスを指す。いくつかの態様において、ライゲーションは、核酸の隣接するヌクレオチド間のニックを連結することを含む。いくつかの態様において、ライゲーションは、第1の核酸分子の末端と第2の核酸分子の末端との間に共有結合を形成することを含む。いくつかの態様において、ライゲーションは、1つの核酸の5’リン酸基と第2の核酸の3’ヒドロキシル基との間に共有結合を形成することを含み、それによりライゲーションされた核酸分子を形成することができる。一般に、本開示の目的のために、増幅標的配列をアダプターにライゲーションして、アダプターにライゲーションされた増幅標的配列を生成することができる。
本明細書で使用される場合、「リガーゼ」およびその派生語は、一般に、2つの基質分子のライゲーションを触媒することができる作用物質を包含する。いくつかの態様において、リガーゼは、核酸の隣接ヌクレオチド間のニックの連結を触媒することができる酵素を含む。いくつかの態様において、リガーゼは、ある核酸分子の5’リン酸と別の核酸分子の3’ヒドロキシルとの間の共有結合の形成を触媒し、それによりライゲーションされた核酸分子を形成することができる酵素を含む。適切なリガーゼには、T4 DNAリガーゼ、T4 RNAリガーゼ、およびE.coli(大腸菌)DNAリガーゼが含まれていてもよいが、これらに限定されない。
本明細書で使用される場合、「ライゲーション条件」およびその派生語は、一般に、2つの分子を互いにライゲーションするのに適した条件を指す。いくつかの態様において、ライゲーション条件は、核酸間のニックまたはギャップを封鎖するのに適している。本明細書で使用される場合、ニックまたはギャップという用語は、当技術分野での該用語の使用と一致する。通常、ニックまたはギャップについては、適切な温度およびpHでリガーゼなどの酵素の存在下においてライゲーションすることができる。いくつかの態様において、T4 DNAリガーゼは、約70〜72℃の温度で核酸間のニックを連結することができる。
本明細書で使用される「フローセル」という用語は、1つ以上の流体試薬を流すことができる固体表面を含むチャンバを指す。本開示の方法で容易に使用できるフローセルおよび関連する流体システムおよび検出プラットフォームの例は、例えば、Bentleyら、Nature 456:53−59(2008)、国際公開第04/018497号;米国特許第7,057,026号;国際公開第91/06678号;国際公開第07/123744号;米国特許第7,329,492号;米国特許第7,211,414号;米国特許第7,315,019号;米国特許第7,405,281号、および米国特許出願公開第2008/0108082号に記載されている。
本明細書で使用される場合、用語「アンプリコン」は、核酸に関して使用される場合、核酸複製の産物を意味し、前記産物は、該核酸のヌクレオチド配列の少なくとも一部分と同一または相補的であるヌクレオチド配列を有する。アンプリコンは、例えば、ポリメラーゼ伸長、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、ライゲーション伸長またはライゲーション連鎖反応を含む、核酸またはそのアンプリコンを鋳型として使用するさまざまな増幅方法のいずれかによって製造することができる。アンプリコンは、特定のヌクレオチド配列の単一コピー(例えば、PCR産物)または該ヌクレオチド配列の複数コピー(例えば、RCAのコンカテマー産物)を有する核酸分子であることができる。標的核酸の最初のアンプリコンは、典型的には相補的なコピーである。後続のアンプリコンは、最初のアンプリコンの生成後に、標的核酸または最初のアンプリコンから生成されるコピーである。後続のアンプリコンは、標的核酸と実質的に相補的であるか、標的核酸と実質的に同一である配列を有することができる。
本明細書で使用する場合、「増幅部位」という用語は、1つ以上のアンプリコンを生成させることができるアレイ内またはアレイ上の部位を指す。さらに増幅部位を、その部位で生成される少なくとも1つのアンプリコンを含む、保持する、または付着するように構成させることができる。
本明細書で使用される場合、「アレイ」という用語は、相対的な位置によって互いに区別することができる部位の集団を指す。アレイの異なる部位にある異なる分子は、該アレイにおける部位の位置に応じて互いに区別することができる。アレイの個々の部位には、特定タイプの1つ以上の分子を含めることができる。例えば、ある部位は特定の配列を有する単一の標的核酸分子を含むことができ、またはある部位は同じ配列(および/またはその相補配列)を有するいくつかの核酸分子を含むことができる。アレイの部位は、同じ基板上にある異なるフィーチャにすることができる。具体例としてのフィーチャには、限定されるものではないが、基板内のウェル、基板内または基板上のビーズ(または他の粒子)、基板からの突起、基板上の隆起、または基板内のチャネルが含まれる。アレイの部位は、それぞれが異なる分子を保持する別個の基板にすることができる。別々の基板に付着した異なる分子については、基板と結合している表面上における基板の位置、または液体またはゲル中における基板の位置によって識別することができる。別個の基板が表面上に位置する具体例としてのアレイには、限定されないが、ウェル内にビーズを有するアレイが含まれる。
本明細書で使用される「容量」という用語は、部位および核酸材料に関して使用される場合、その部位を占有できる核酸材料の最大量を意味する。例えば、この用語は、特定の状態でその部位を占めることができる核酸分子の総数を指すことができる。例えば、核酸材料の総質量、または特定の状態で部位を占めることができる特定のヌクレオチド配列のコピーの総数など、他の尺度も使用することができる。典型的には、標的核酸に関する部位の容量は、標的核酸のアンプリコンに関する部位の容量と実質的に同等となる。
本明細書で使用される場合、「捕捉剤」という用語は、標的分子(例えば、標的核酸)に付着、保持または結合することができる材料、化学物質、分子またはその一部分を指す。具体例としての捕捉剤には、限定されるものではないが、標的核酸の少なくとも一部分と相補的である捕捉核酸(本明細書では捕捉オリゴヌクレオチドとも称す)、標的核酸(またはそれに結合した連結部分)に結合できる受容体−リガンド結合対の構成員(例えば、アビジン、ストレプトアビジン、ビオチン、レクチン、炭水化物、核酸結合タンパク質、エピトープ、抗体など)、または標的核酸と共有結合を形成できる化学試薬が含まれる。
本明細書で使用される場合、「レポーター部分」という用語は、調査されている被検物質の組成、同一性、および/または供給源を決定することを可能にする識別可能なタグ、標識、インデックス、バーコード、または基を指すことができる。いくつかの態様において、レポーター部分は、タンパク質に特異的に結合する抗体を含んでいてもよい。いくつかの態様において、抗体は検出可能な標識を含んでいてもよい。いくつかの態様において、レポーターは、核酸タグで標識された抗体または親和性試薬を含むことができる。核酸タグは、例えば、近接ライゲーションアッセイ(PLA)または近接伸長アッセイ(PEA)または配列決定に基づく読み出し(Shahiら、Scientific Reports volume 7、Article number:44447、2017)またはCITE−seq(Stoeckiusら、Nature Methods 14:865〜868、2017)により検出可能なものであることができる。
本明細書で使用される場合、「クローン集団」という用語は、特定のヌクレオチド配列に関して均一である核酸の集団を指す。均一な配列は、典型的には少なくとも10ヌクレオチド長であるが、例えば少なくとも50ヌクレオチド長、100ヌクレオチド長、250ヌクレオチド長、500ヌクレオチド長または1000ヌクレオチド長を含めてさらに長いものであることができる。クローン集団は、単一の標的核酸または鋳型核酸に由来したものであることができる。典型的には、クローン集団におけるすべての核酸は同じヌクレオチド配列を有することになる。クローン性から逸脱することなく、クローン集団において少数の突然変異(例えば、増幅アーチファクトによる)が発生できることが理解されよう。
本明細書で使用する場合、「ユニーク分子識別子」または「UMI」という用語は、核酸に付着させてもよいランダム、非ランダム、または半ランダムの分子タグを指す。核酸に組み込まれた場合、UMIを使用して、増幅後に配列決定されるユニーク分子識別子(UMI)を直接カウントすることにより、後続の増幅バイアスを補正することができる。
本明細書で使用する場合、「外因性」化合物、例えば外因性酵素とは、特定の組成物に通常または自然には見られない化合物を指す。例えば、特定の組成物が細胞ライゼートを含む場合、外因性酵素は、細胞ライゼートに通常または自然には見られない酵素である。
本明細書で使用する場合、組成物、物品、核酸、または核の出てくる文脈で「提供する(こと)」とは、組成物、物品、核酸、または核を作ること、組成物、物品、核酸または核を購入すること、またはそれ以外の方法で化合物、組成物、物品、または核を入手することを意味する。
「および/または」という用語は、列挙された要素の1つまたはすべて、または列挙された要素のいずれか2つ以上の組み合わせを意味する。
「好ましい」および「好ましくは」という語は、ある特定の状況下である特定の利益をもたらしてもよい本開示の態様を指す。しかしながら、同一または他の状況下で、他の態様も好ましい場合があってもよい。さらに、1つ以上の好ましい態様を記述した場合、他の態様が有用ではないことを意味する訳ではなく、また本開示の範囲から他の態様を除外することを意図するものではない。
用語「comprises(含む)」およびその変形は、これらの用語が発明の説明および特許請求の範囲に現れる場合、限定的な意味を持たない。
本明細書において態様が「include(含む)」、「includes(含む)」、または「including(含んでいる)」などの文言で説明されている場合は常に、「consisting of(〜からなる)」および/または「consisting essentially of(〜から本質的になる)」という用語で説明される別様の類似した態様も提供されることは言うまでもない。
特に明記しない限り、「a」、「an」(ある)、「the」(該)、および「少なくとも1つ」は互換的に使用され、1つまたは複数を意味する。
また、本明細書において、端点による数値範囲の列挙は、その範囲内に包含されるすべての数値を含む(例えば、1〜5には、1、1.5、2、2.75、3、3.80、4、5などが含まれる)。
別個の段階を含む本明細書で開示される方法についてはいずれも、それらの段階を実行可能な任意の順序で実行してもよい。また、必要に応じて、2つ以上の段階の任意の組み合わせを同時に実行してもよい。
本明細書全体を通じて「一態様」、「ある態様」、「特定の態様」、または「いくつかの態様」などについて言及する場合、該態様に関連して説明される特定の特徴、構成、組成、または特性が本開示の少なくとも1つの態様に含まれることを意味する。したがって、本明細書全体を通して様々な場所でかかる語句が出現しても、必ずしも本開示の同じ態様を指しているわけではない。さらに、特定の特徴、構成、組成、または特性を、1つ以上の態様において任意の適切な形で組み合わせてもよい。
本開示の具体例としての態様の以下の詳細な説明は、以下の図面と併せて読むと最もよく理解されてもよい。
図1は、本開示による単一細胞コンビナトリアルインデックス付けのための一般的な実例となる方法の一般的なブロック図を示す。 図2は、本開示による単一細胞コンビナトリアルインデックス付けのための一般的な実例となる方法の一般的なブロック図を示す。 図3は、本開示による単一細胞コンビナトリアルインデックス付けのための一般的な実例となる方法の一般的なブロック図を示す。 図4は、sci−RNA−seq3が、1回の実験で5つの発達段階にわたって61個のマウス胚から約200万個の細胞をプロファイリングできることを示している。(A)sci−RNA−seq3ワークフローおよび実験スキーム。(B)ここでの実験ごとのスループットと最近の報告の比較。(C)HEK293T細胞およびNIH/3T3細胞からのマウスUMIカウントとヒトUMIカウントの散布図。(D)61個のマウス胚のそれぞれからプロファイルされた細胞の数を示す棒グラフ。(E)細胞ごとに検出された遺伝子とUMIの数を示す箱ひげ図。(F)マウス胚ごとにXist(chr X)遺伝子対chrY遺伝子に整合しているユニークなリードの散布図。(G)マウス胚の擬似バルクRNA−seqプロファイルの偽時間軌跡。(H)マウス胚の擬似バルクRNA−seqプロファイルからのマーカー遺伝子発現E9.5からE13.5における変化のヒートマップ。
図5は、sci−RNA−seq3の性能とQC関連の分析を示す。(A)61個のマウス胚のそれぞれに使用されたRTウェルの数を示す棒グラフ。(B)sci−RNA−seq3の各PCRウェルからの生の配列決定リードデータの分布を示すヒストグラム。(C)HEK293T細胞およびNIH/3T3細胞からの細胞ごとのUMIの数を示す箱ひげ図。(D)HEK293T(ヒト)細胞およびNIH/3T3(マウス)細胞についての予測される種へのリードマッピングの割合を示す箱ひげ図。(E)sci−RNA−seq3対sci−RNA−seqの1細胞あたりのUMI数(1細胞あたり20,000の生リードにダウンサンプリング)を比較する箱ひげ図。(F)sci−RNA−seq3対sci−RNA−seqからのHEK293T細胞の集約プロファイルにおける遺伝子発現測定値の相関関係。 図6は、sci−RNA−seq3についてのさらなる性能とQC関連の分析を示す。(A)使用したRTウェルの数と胚ごとに採取された細胞の数との相関関係を示す散布図。(B〜D)生の配列決定リード数(B)、検出された遺伝子(C)およびUMI(D)を細胞ごとにsci−RNA−seq3と他の方法との間で比較した棒グラフ。(E)5つの発達段階にわたる胚からの細胞ごとに検出されたUMIの数を示す箱ひげ図。(F)各発達段階でプロファイルされた雄性と雌性の胚の数を示す棒グラフ。 図7は、マウス胚の擬似バルクRNA−seqプロファイルが発達段階で容易に分離されることを示す。(A)61個のマウス胚のそれぞれに由来する単一細胞の集約トランスクリプトームのt−SNEは、発達段階に完全にマッチする5つの高度にクラスター化された群をもたらす。(B)図4Gと同じであるが、偽時間で色付けされている、マウス胚の擬似バルクRNA−seqプロファイルの偽時間軌跡。(C)61個のプロファイルされた胚を、偽時間系列で並べた。最も初期の3つのE10.5胚と最新の(偽時間で)3つのE10.5胚を写真に示しているもので、形態的に異なっているように見える。 図8は、マウス器官形成の主要な細胞タイプの特定を示す。(A)ルーバンクラスタリングからのクラスターIDで色付けされ、マーカー遺伝子に基づいて注釈が付けられた2,026,641個のマウス胚細胞のt−SNE可視化。同じt−SNEを以下にプロットし、各発達段階からの細胞のみを示す。原始赤血球(一過性)クラスターおよび決定的赤血球(拡大中)クラスターについては、それらの増殖動態を示すために四角で囲む(B)細胞タイプごとに1つの選択されたマーカー遺伝子の発現を示すドットプロット。ドットのサイズはある細胞タイプ内の細胞のパーセンテージをエンコードし、その色は平均発現レベルをエンコードする。
図9は、マウス器官形成の主要な細胞タイプと、細胞タイプ特異的マーカー遺伝子の対応するセットの特定を示す。(A)発達段階ごとに色付けした、E9.5からE13.5への細胞状態移行のt−SNE視覚化。これは、図8Aに示されているのと同じt−SNEであるが、各プロットにおいては、単一の時点から得られた細胞のみが示されている。(B)特定された主要な細胞タイプ全体にわたる遺伝子の相対発現を示すヒートマップ。(C)2番目に高い発現細胞タイプ(5%のFDR)と比較した場合、2倍を超える発現を示す各細胞タイプにおけるマーカー遺伝子の数を示す棒グラフ。 図10は、同じ時点の複製胚に由来する細胞が明らかなバッチ効果を呈しないことを示す。(A〜E)異なる発達段階のマウス胚細胞のt−SNE可視化:E9.5(A)、E10.5(B)、E11.5(C)、E12.5(D)、E13.5(E)、各段階での胚IDで色分けされている。 図11は、マウス器官形成中の細胞タイプ数の動態を示す。(A)発達段階ごとにスプリットされた、各細胞タイプについてプロファイルされた細胞の数を示す棒グラフ。(B)61個のマウス胚(縦列)における各細胞タイプ(横行)の相対細胞数を示すヒートマップ。胚ごとの一細胞タイプあたりの絶対細胞数の推定値は、細胞タイプが所定の胚に寄与する割合に、その発達段階での推定細胞総数を掛けることによって計算された。表示のために、これらの推定値を、61個すべての胚に及ぶ所定の細胞タイプの最大推定細胞数によって各横行で正規化する。胚は発達上の偽時間により左から右に分類される。(C)パネルBの場合と同様に計算された、原始赤血球系および決定的な赤血球系についての相対的な細胞数の変化を示す折れ線グラフ。破線は、原始赤血球(Hbb−bh1)および決定的赤血球(Hbb−bs)についてのマーカー遺伝子の相対的発現を示す。個々の胚のデータポイントを、発達偽時間系列で並べ替え、レス(loess)法で平滑化した。
図12は、38の主要な細胞タイプのそれぞれのサブクラスターのルーバンクラスタリングとt−SNE視覚化を示す。図8Aに示されている38個のクラスターの多くの中で細胞タイプの不均一性が容易に明らかになったため、サブクラスターを識別するために各主要細胞タイプでルーバンクラスタリングを繰り返す反復戦略を採用した。1つまたは2つの胚に支配されたサブクラスターを削除し、非常に類似したサブクラスターをマージさせた後、合計655個のサブクラスター(初期クラスタリングで識別された38個の主要細胞タイプと区別するために「サブタイプ」とも呼ばれる)となった。 図13は、全発達段階に及ぶ38個の主要細胞タイプのそれぞれのサブクラスターのルーバンクラスタリングとt−SNE視覚化を示す。図12と同じであるが、細胞はサブクラスターIDではなく発達段階で色付けされている。 図14は、細胞タイプを検出する感度が細胞のカバレッジの関数であることを示す。(A)全細胞のt−SNE視覚化(左のプロット、n=2,026,641)およびダウンサンプリングされたサブセット(右のプロット、n=50,000)、図8AのルーバンクラスターIDによって色付けされている。(B)全内皮細胞のt−SNE視覚化(左のプロット、n=35,878)およびダウンサンプリングされたサブセットからのもの(右のプロット、n=1,173)、35,878個の内皮細胞に基づいて計算されたルーバンクラスターIDによって色付けされている。(C)1,173個の内皮細胞に基づいて計算されたルーバンクラスターIDで色付けされた、1,173個の内皮細胞のt−SNE可視化。
図15は、複数の胚に由来する655個の細胞サブタイプを示し、マーカーのセットによって定義されている。(A)細胞数に関するサブクラスターの分布を示すヒストグラム(中央値1,869;範囲51〜65,894)。(B)寄与する胚の数に関するサブクラスターの分布を示すヒストグラム(寄与するものとして認められるために5個を超える細胞)。(C)最も寄与度の高い胚に由来する細胞の比率に関するサブクラスターの分布を示すヒストグラム。(D)マーカー遺伝子の数に関するサブクラスターの分布を示すヒストグラム(同じ主要クラスター内で2番目に高い発現性の細胞サブタイプと比較した場合、少なくとも1.5倍高い発現;5%FDR)。 図16は、マウス器官形成中の細胞サブタイプ数の動態を示す。(A)655の識別されたサブクラスター全体に及ぶ遺伝子の相対発現を示すヒートマップ。(B)61個のマウス胚(縦列)における各細胞サブタイプ(横行)の相対細胞数を示すヒートマップ。胚ごとの1細胞サブタイプあたりの絶対細胞数の推定値を、図11Bの場合と同様に計算した。(C)各胚における655の細胞サブタイプの割合のみに基づいた61個のマウス胚すべてのt−SNE視覚化。 図17は、上皮細胞のサブタイプと四肢の外胚葉性頂堤(AER)の特定と特性評価を示す。(A)上皮細胞サブタイプのt−SNE視覚化およびマーカーに基づく注釈。(B)Fgf8の発現レベルによって色付けされたすべての上皮細胞のt−SNE視覚化。(C)E10.5(左)胚およびE11.5(右)胚におけるFgf8のin situハイブリダイゼーション画像。(D)Fndc3aの発現レベルによって色付けされたすべての上皮細胞のt−SNE視覚化。(E)E10.5胚のFndc3aのin situハイブリダイゼーション画像。矢印:遺伝子発現の部位。(F)異なる発達段階での1胚あたりのAER細胞の割合を示す箱ひげ図。(G)AER単一細胞トランスクリプトームの偽時間軌跡、発達段階ごとに色付けされている。(H)発達上の偽時間にわたるAERマーカー遺伝子の相対的な発現を示す折れ線グラフ。
図18は、マウス上皮のサブタイプの識別を示す。上皮サブタイプごとに1つの選択されたマーカー遺伝子の発現を示すドットプロット。ドットのサイズはある細胞タイプ内の細胞のパーセンテージをエンコードし、その色は平均発現レベルをエンコードする。 図19は、偽時間にわたる四肢の外胚葉性頂堤(AER)細胞の遺伝子発現の動態を示す。(A)負の二項回帰によって生成され、最大遺伝子発現のパーセントとしてスケーリングされた、AER細胞における平滑化された偽時間依存性差次的遺伝子発現(1%のFDR)を示すヒートマップ。各横行は異なる遺伝子を示し、これらをE9.5とE13.5との間で活性化動態(上)、抑制動態(中)、または一過性動態を示す(下)サブセットにスプリットする。(B〜C)AERの発達において発現が著しく低下する遺伝子について、−log10変換されたq値と濃縮されたReactome項(B)および転写因子(C)のenrichRベースの組み合わせスコアを示すプロット。著しく減少している遺伝子についての上位の濃縮パスウェイ項(Reactome2016)には、細胞周期の進行(有糸分裂細胞周期、qval=0.0002)およびグルコース代謝(炭水化物の代謝、qval=0.0002)が含まれる。減少する遺伝子からの標的を伴う上位の濃縮TFには、Isl1(qval<10−5)、Pou5f1(qval=0.002)、Nanog(qval=0.003)などの多能性因子が含まれる。 図20は、四肢間葉分化中の細胞軌跡の特性評価を示す。(A)発達段階ごとに色付けした四肢間葉細胞のUMAP 3D視覚化(左と右は2方向からのビューを表す)(B)四肢間葉細胞におけるPitx1およびTbx5の正規化された発現を示す散布図。Pitx1および/またはTbx5が検出された細胞のみを表示した。(C)前肢と後肢との間で差次的に発現された遺伝子(5%のFDR、赤で色付け)を示すボルケーノプロット。上位の差次的発現遺伝子が標識されている。X軸:各遺伝子の前肢と後肢との間のlog2変換した倍率変化。Y軸:分化試験からの−log10変換したqval。(D)パネルAと同じ視覚化、近位/軟骨細胞(Sox6、Sox9)マーカー、遠位(Hoxd13、Tfap2b)マーカー、前方(Pax9、Alx4)マーカー、または後方(Hand2、Shh)マーカーの正規化された遺伝子発現によって色付けしている。(F)E10.5からE13.5の胚におけるHoxd13のin situハイブリダイゼーション画像。(G)Cpa2の正規化された遺伝子発現によって色付けした、パネルAおよびパネルDと同じ視覚化。この軌跡内のその発現パターンにより、Cpa2がHoxd13のような発達中の四肢間葉の遠位マーカーであるという予測が誘導された。(H)E10.5胚およびE11.5胚におけるCpa2のin situハイブリダイゼーション画像。(I)AERと四肢間葉の軌跡の結果を合わせた概要。
図21は、四肢間葉の発達中における細胞運命の軌跡の特性評価を示す。(A)四肢間葉細胞の異なる発達段階間で上位の差次的発現遺伝子を示すヒートマップ。(B)四肢間葉の発達中に著しくアップレギュレーションされた遺伝子についての−log10変換された、濃縮転写因子の調整されたp値を示す棒グラフ。(C)前肢(Tbx5+)および後肢(Pitx1+)で色付けした四肢間葉細胞のt−SNE視覚化。Tbx5とPitx1において発現がない、または両方の発現がある細胞は示されていない。 図22は、四肢において空間的に制限されたマーカーの発現を示す。各パネルは、異なるマーカー遺伝子を示す。色は、ライブラリーサイズに合わせてスケーリングされ、対数変換され、次いでZスコアにマッピングされたことで遺伝子間の比較を可能にするUMIカウントを示す。所定のマーカーが発現していない細胞は、オーバープロットを防ぐために除外される。(A)後肢マーカーPitx1および前肢マーカーTbx5。(B)1列目:近位肢マーカーSox6(軟骨細胞もマークしている)およびSox9。2列目:遠位肢マーカーHoxd13およびTfap2b。3列目:前肢マーカー68 Pax9およびAlx4。4列目:後肢マーカーShhおよびHand2。 図23は、四肢における空間的に制限された遺伝子のモジュールを示す。合計1,191の遺伝子を、階層的クラスタリングによりクラスター化した。Rのcutree関数を使用して、樹状図を8つのモジュールにカットし、各モジュールにおける遺伝子の集約的発現を計算した。色は、ライブラリーサイズに合わせてスケーリングされ、ログ変換された後、Zスコアにマッピングされることでモジュール間の比較を可能にする各モジュールについての集約UMIカウントを示す。所定モジュールの発現がない細胞は、オーバープロットを防ぐために除外される。
図24は、マウスの器官形成中に存在する8つの主要な発達軌跡の特性評価を示す。(A)データセット全体のUMAP 3D視覚化。上:2方向からのビュー。下:間葉系(左)と神経管/脊索(右)の軌跡の拡大図。発達段階ごとに色付けされている。(B)8つの主要な軌跡のそれぞれに割り当てられた38の主要な細胞タイプのそれぞれからの細胞の割合を示すヒートマップ。縦列は、上部バーの色で標識された8つの主要な系統を表す(パネルAのキーを参照)。(C)発達段階ごとに色付けした上皮のサブ軌跡のUMAP 3D視覚化。 図25は、マウス器官形成中に存在する8つの主要な発達軌跡の特性評価を示す。(A)図24Aと同じであるが、38個の主要な細胞クラスターに対応する色が付いている。(B〜C)E9.5からE13.5までの8つの主要な細胞軌跡のそれぞれに由来する1胚あたりの細胞の推定割合(B)および推定絶対細胞数(C)を示す面積プロット。 図26は、主要細胞クラスターIDで色分けした8つの主要な細胞軌跡のUMAP視覚化を示す。 図27は、発達段階ごとに色分けした8つの主要な細胞軌跡のUMAP視覚化を示す。
図28は、上皮細胞サブタイプのUMAP視覚化を示す。図17Aに示す29の上皮サブタイプごとに色付けしている。 図29は、筋形成における細胞軌跡の解像を示す。Monocle 3によって報告された軌跡を画定する主グラフのエッジを、明るい青の線分として表示する。(A)筋形成に関与すると推定される細胞をin silicoで間葉系細胞の軌跡から単離し、次いで、筋細胞のサブ軌跡を構築するために使用した(方法)。(B)発達段階によって色分けした筋細胞のサブ軌跡における細胞。(C)筋形成の選択された転写調節因子の発現によって色付けした、筋細胞軌跡における細胞。所定の遺伝子の発現が検出できない細胞は、プロットから省く。(D)パネルC(方法)に示されているマーカーに従って発達段階別に分類された細胞。 図30は、全トランスクリプトームおよび新しく合成されたトランスクリプトームのSci−Fateによる共同プロファイリングを示す。(A)テキストで概説された主要な段階を含むsci−fateワークフロー。(B)実験スキーム。A549細胞を時間依存的にデキサメタゾンで処理した。すべての処理条件からの細胞を、sci−fateのため採取の2時間前にS4Uで標識した。(C)6回の処理時間における1細胞あたりのS4U標識リードの比率を示すバイオリンプロット。(D)エクソンリードおよびイントロンリードにおけるS4U標識リードの比率を示すバイオリンプロット。すべての箱ひげ図:太い水平線、中央値;箱の上端と下端、それぞれ第1四分位と第3四分位;ひげ、四分位範囲の1.5倍;円、外れ値。(E)全トランスクリプトーム(左)、新しく合成されたトランスクリプトーム(中央)、および両方(右)によるA549細胞のUMAP視覚化。(F)(E)と同様、全トランスクリプトームで識別されるクラスターIDで色付けされている。(G)RNAレベル(左)および新しく合成されたRNAレベル(右)によるG2/Mマーカー遺伝子の正規化された発現によって色付けされた、結合情報によるA549細胞のUMAP視覚化。これらの遺伝子についてのUMIカウントは、ライブラリーサイズでスケーリングされ、対数変換され、集約され、Zスコアにマッピングされる。
図31は、sci−fateについての性能とQC関連の分析を示す。(A)sci−fateの状態におけるマウス(NIH/3T3)対ヒト(HEK293T)の1細胞あたりのUMIカウントの散布図。(B〜D)HEK293T細胞(細胞数n=932)およびNIH/3T3細胞(細胞数n=438)からの1細胞あたりのS4U標識リードの比率、UMIの数、および純度(予測される種へのリードのマッピングの割合)を示す箱ひげ図。すべての箱ひげ図:太い水平線、中央値;箱の上端と下端、それぞれ第1四分位と第3四分位;ひげ、四分位範囲の1.5倍;円、外れ値。(E〜F)sci−fate(y軸)対sci−RNA−seq細胞(x軸)からのHEK293T細胞(E)とNIH/3T3細胞(F)の集約プロファイルにおける遺伝子発現測定値間の相関(スピアマンの相関)。 図32は、デキサメタゾン処理したA549細胞でのsci−fateの性能を示す。(A、B)6つの処理条件での1細胞あたりのUMI(A)および遺伝子(B)の数を示すバイオリンプロット。すべての箱ひげ図:太い水平線、中央値;箱の上端と下端、それぞれ第1四分位と第3四分位;ひげ、四分位範囲の1.5倍;円、外れ値。(C)集約された全トランスクリプトーム(右上)と新規合成トランスクリプトーム(左下)についての異なる処理条件間におけるピアソン相関係数を示す相関プロット。(D)新規合成トランスクリプトームによるA549細胞のUMAP視覚化、新規合成トランスクリプトームによって識別されるクラスターIDによって色付けされている。(E)全トランスクリプトームで定義される各クラスターからの細胞の割合を示すヒートマップ、新規合成トランスクリプトームにより各細胞クラスターに分類される。(F〜G)全トランスクリプトームおよび新規合成の両トランスクリプトームによるA549細胞のUMAP視覚化、全RNA発現(F)および新規合成RNA(G)によるS期マーカー遺伝子の正規化発現により色付けされている。これらの遺伝子についてのUMIカウントは、ライブラリーサイズに合わせてスケーリングされ、対数変換され、集約されてからZスコアにマッピングされる。
図33は、細胞状態の移行を推進するTFモジュールの特性評価を示す。(A)転写因子(オレンジ色)と調節遺伝子(灰色)との間で特定されたリンク(青色)。細胞周期の進行またはGR応答に関連するTFモジュールに標識を付す。(B)細胞周期TFモジュールによって順序付けられたA549細胞のUMAP視覚化であって、教師なしクラスタリング分析により、S期マーカーおよびG2/M期マーカーの新規合成mRNA(上)、細胞周期の3つの期(左下)および9つの細胞周期の状態(右下)により色付けされている。(C)GR応答TFモジュールによって順序付けられたA549細胞のUMAP視覚化であって、DEX処理時間(左)、CEBPB活性およびFOXO1活性(中央)、および教師なしクラスタリング分析からのクラスターid(右)によって色付けされている。TF活性を計算するために、これらの遺伝子についての新規合成UMIカウントは、ライブラリーサイズによってスケーリングされ、対数変換され、集約され、Zスコアにマッピングされる。(D)細胞周期モジュール(x軸)およびGR応答モジュール(y軸)の組み合わせ状態による細胞状態の観察された比率(黒色)を示す表。赤い数字は、独立した取り合わせを想定した予想比率である。(E)全トランスクリプトームおよび新規合成トランスクリプトームの両方に基づくクラスタリング分析によって識別された各主要クラスターにおけるTFモジュールの組み合わせ状態によって特定された細胞状態の割合を示すヒートマップ。 図34は、DEX処理したA549細胞の細胞状態移行を推進するTFモジュールを示す。(A)CEBPB(オレンジ色)の同定された遺伝子標的(灰色)。LASSO>0.6からの正規化された相関係数をもつリンクのみを示す。(B)CEBPB発現(左)および活性(右)で色付けされた全トランスクリプトームおよび新規合成トランスクリプトームによるA549細胞のUMAP視覚化。(C)(B)と同様であり、YOD1発現(左)およびYOD1活性(右)で色付けされている。(D)(B)と同様であり、GTF2IRD1発現(左)およびGTF2IRD1活性(右)で色付けされている。(E)(B)と同様であり、E2F1発現(左)、E2F1活性(中央)、およびE2F1結合遺伝子の全トランスクリプトームの集約された発現(右)で色付けされている。(F)TFモジュール間のピアソンの相関係数の絶対値を示すヒートマップ。29 TFモジュールは、階層的クラスタリング分析により5つの群にグループ分けされた。
図35は、機能的TFモジュールの組み合わせ状態によって特性評価された細胞状態を示す。(A)機能的TFモジュールの組み合わせ状態によって細胞状態を特性確認する戦略を示すスキーム。(B)全体および新規合成の両トランスクリプトームによる全細胞のUmap視覚化であって、UMAP空間に対する密度ピーククラスタリングアルゴリズムによって識別された主要クラスターidで色付けされている。 図36は、6,000を超える単一細胞の状態の移行軌跡の特性評価を示す。(A)テキストおよび方法で概説されている詳細を備えた単一細胞移行軌跡を構築するための記憶補正および細胞連鎖解析を示すスキーム。(B)DEX処理時間によって色付けされた細胞の3Dプロット(z座標としても)。x座標およびy座標は、図30E(左)における全トランスクリプトームおよび新規合成トランスクリプトームによるUMAP空間に対応する。リンクされた親細胞と子細胞を灰色の線で連結している。(C)(B)と同様であるが、x座標およびy座標は、6つの時点にわたる単一細胞トランスクリプトーム動態によりUMAP空間に対応する。(D)細胞連鎖解析に依存しない、各細胞軌跡クラスター(左)または全細胞(右)における異なるGR応答状態(上)および細胞周期状態(下)の細胞状態の動態を示す折れ線グラフ。(E)細胞状態の移行ネットワーク。ノードは図33Dで特性評価された27の細胞状態であり、リンクは細胞状態間における特定された移行経路である。移行確率が低い(<0.1)リンクは除外する。破線の四角は可逆的な移行動態をもつ状態の例を示す。(F)処理条件間における細胞状態の割合の相関を示す相関プロット。正の相関は青色で、負の相関は赤色で表示される。楕円の形状は、相関係数(楕円上)と相関している。(G)観察された10時間DEX処理群間における細胞状態の割合と予測された細胞状態の割合との相関関係を示す散布図。予測は、無DEX処理群における細胞状態の移行確率と細胞状態の割合に基づく。青い線は線形回帰線を表す。(H)完全なデータ(0〜10時間)または部分データ(0〜6時間)によって計算された細胞状態移行確率の相関を示す散布図と、線形回帰線。 図37は、新しいRNA検出率とRNA分解率の推定を示す。(A)x軸:無DEX処理細胞と2時間DEX処理細胞との間における正規化された全トランスクリプトームの差、およびy軸:無DEX処理細胞と2時間DEX処理細胞との間の正規化された新規合成トランスクリプトームの差の相関関係を示す散布図。青い線は線形回帰線である。各時点の全トランスクリプトームと新規合成トランスクリプトームの両方を、その時点の全トランスクリプトームのライブラリーサイズによって正規化する。(B)処理条件間における推定遺伝子分解率の相関関係を示す相関プロット。正の相関は青色で、負の相関は赤色で表示される。楕円の形状は、相関係数(楕円上)と相関している。
図38は、細胞状態予測のための細胞状態移行ネットワークを示す。(A)各処理時に観察された細胞状態と、無DEX処理群における細胞状態移行確率および細胞状態の割合により予測される細胞状態との相関関係を示す散布図。青い線は線形回帰線を表す。(B)観察された10時間DEX処理群間における細胞状態の割合と予測値との相関関係を示す散布図。予測値は、部分データ(0〜6時間)によって推定された細胞状態移行確率および無DEX処理群における細胞状態の割合に基づく。青い線は線形回帰線を表す。 図39は、細胞状態の移行確率が近くの状態安定性ランドスケープによって調節されていることを示す。(A)移行距離(ピアソンの距離)と細胞状態間における移行確率との関係を示す散布図であって、ggplot2による赤いLOESSの滑らかな線を伴う。(B)細胞状態の不安定性ランドスケープを示す3Dプロット。X軸は、GR応答状態(応答無しから低い〜高い応答状態)を表す。Y軸は、G0/G1状態からG2/M状態への順序で並べられた細胞周期状態を表す。Z軸は細胞状態の不安定性を表しており、2時間後に各細胞状態内の細胞が他の細胞状態にジャンプする確率によって確定される。(C)ggplot2による赤いLOESSの滑らかな線とともに、10時間DEX処理前後における細胞状態の不安定性と細胞割合の変化との関係を示す散布図。(D)状態の不安定性と状態移行エントロピーとの間の相関を線形回帰線(青)で示す散布図。(E)密に接続されたニューラルネットワークにより移行距離のみまたは移行距離と状態不安定性ランドスケープを組み合わせることによる状態間移行確率を予測するために交差検証済みrの2乗を示す箱ひげ図。 図40は、LMO2遺伝子における標的化エクソンのブラウザーショットを示す。標的とされるエクソンは、「標的エクソン」トラックに示されている。留意すべきは、フィルターを通過した12のRTプライマーが、エクソン全体に可能な限り均等に広がっていることである。下の2つのトラック「Primers_plus/minus」と「Captured_plus/minus」は、RTプライマーと対応する捕捉された転写物へのリードマッピングを示す。リードカウントの差異は、オフターゲットプライミング事象の数を示す。
図41は、ENCODE全核RNA−seqデータセットおよびin situマルチプレックスRT捕捉ライブラリーにおける遺伝子のランクを比較した表を示す。標的遺伝子は太字で示されている。標的とされるライブラリーにおいて最も豊富な12個の遺伝子のうち、8個が標的となる遺伝子であった。最後の2つの列は、「Rank」、すなわち本発明者らのデータセットにおけるランク、「ENCODE」、すなわちENCODEデータセットにおけるランクである。豊富な非標的RNAには、ミトコンドリアリボソームRNAであるRNR2およびRNR1、ならびに非常に豊富な核lncRNA MALAT1が含まれる。留意すべきは、LMO2遺伝子が、ENCODEデータセットで4,627番目に多く検出された遺伝子(26,281遺伝子中)から、ライブラリーで3番目に検出された遺伝子となることである。 図42は、全RNAにわたって捕捉された転写物の濃縮を示す。標的ライブラリーにおけるリード対ENCODE核RNAにおけるリードの散布図。RTの標的遺伝子を赤で示す。留意すべきは、それらが一般に対角線から外れることであり、これは、リファレンスデータセットにおける発現を考慮して予測されるレベルよりも濃縮されたことを示す。豊富な核lncRNA MALAT1とXISTを青で示す:これらは対角線より上にあり、これらのRNAに対する濃縮が有効であることを示している。標的とするeRNAは濃縮されていない(オレンジ色)。この実験で標的とされた9つの遺伝子についての予測レベルを上回る濃縮の中央値は45.3倍である。全体として、標的遺伝子からのリードは、このデータセットにおける遺伝子にマッピングされた全リードの31%を占める。
概略図は必ずしも縮尺どおりではない。図面で使用される同様の番号は、同様の構成要素、段階などを指す。ただし、所定の図面におけるある構成要素を指す番号の使用は、同じ番号で標識付けされた別の図面における該構成要素を限定することを意図したものではないことを理解されたい。さらに、複数の構成要素を指すのに異なる番号を使用する場合、異なる番号の構成要素が他の番号の構成要素と同一または類似したものであることはできないことを示すものではない。
一態様において、本明細書で提供される方法を使用して、複数の単一細胞のトランスクリプトームを含む単一細胞コンビナトリアルインデックス付け(sci)配列決定ライブラリーを作製することができる。例えば、この方法を使用して、全細胞トランスクリプトーム、新しく合成されたRNAのトランスクリプトーム、またはその組み合わせの配列情報を取得することができる。別の態様では、本明細書で提供される方法を使用して、RNA核酸の部分集団の配列情報を含むsci配列決定ライブラリーを作製することができる。例えば、非コーディング調節領域が摂動の標的になっている場合、調節領域に対しシスのコーディング領域を、発現の変化について試験することができる。別の例では、非常に有益である限られた数のmRNAに読み出しを制限して、細胞アトラス実験を行うことができる。
該方法は、単離された核または細胞を提供すること、単離された核または細胞のサブセットを区画に分配すること、核酸断片を含むように単離された核または細胞をプロセッシングすること、および核酸断片に区画に固有のインデックスを付加することのうちの1つ以上を含むことができる。場合によって、この方法は、細胞を所定の条件に曝露すること、および/または細胞内で新しく合成されたRNAを標識することを含むことができる。この方法は、細胞のトランスクリプトームまたはRNA核酸の部分集団を含む情報を取得することを対象とすることができる。これらの段階は本質的に任意の順序で実行でき、さまざまな方法で組み合わせることができる。必要に応じて、細胞を所定の条件に曝露し、新たに合成されたRNAを標識した後、細胞から核を単離することができる。
単離した核または細胞の提供
本明細書で提供される方法は、細胞または複数の細胞から単離された核を提供することを含むことができる(図1、ブロック10、図2、ブロック22)。細胞は、いかなる生物に由来するものでも、任意の細胞タイプまたは生物の任意の組織に由来するものでもあることができる。一態様では、細胞は胚細胞、例えば胚から得られた細胞であることができる。一態様において、細胞または核は、がんまたは病変組織に由来するものであることができる。この方法は、細胞を解離すること、および/または核を単離することをさらに含むことができる。核または細胞の数は少なくとも2つであることができる。上限は、本明細書で説明される方法の他の段階で使用される機器の実用的な制限(例えば、マルチウェルプレート、インデックスの数)に左右される。使用できる核または細胞の数は、制限することを意図したものではなく、数十億の数になることができる。例えば、一態様において、核または細胞の数は、100,000,000以下、10,000,000以下、1,000,000,000以下、100,000,000以下、10,000,000以下、1,000,000以下、100,000以下、10,000以下、1,000以下、500以下、または50以下であることができる。当業者であれば、いくつかの態様において、各核の核酸分子がその核のトランスクリプトーム全体、例えば全トランスクリプトーム、新たに合成されたトランスクリプトーム、またはその両方を表すことを認めるはずである。
単離された核を使用するこれらの態様において、核は、抽出および固定により得ることができる。場合によって、および好ましくは、単離された核を得る方法は酵素処理を含まない。新たに合成されたトランスクリプトームが製造されるこれらの態様において、細胞が新たに合成されたトランスクリプトームの標識に適した条件に曝露されるまで、核は単離されない。
一態様において、核は、付着性または懸濁状態である個々の細胞から単離される。個々の細胞から核を単離する方法は、当業者に既知である。核は通常、組織に存在する細胞から単離される。単離された核を得るための方法は、典型的には、組織を調製し、調製された組織から核を単離し、次に核を固定することを含む。一態様において、すべての段階は氷上で行われる。
組織の調製は、液体窒素中で組織を瞬間凍結し、次いで組織のサイズを直径1 mm以下の断片に縮小することを含む。組織を細分化するか、鈍力にかけることにより、組織のサイズを小さくすることができる。組織を小片に切断するための刃を使用して、細分化を行うことができる。鈍力を加えることは、ハンマーまたは同様の物体で組織を粉砕することによって達成することができ、粉砕された組織の結果として生じる組成物は粉末と呼ばれる。
核の単離は、5分間、10分間、または15分間など、少なくとも1〜20分間、細胞溶解緩衝液で断片または粉末をインキュベートすることにより達成できる。有用な緩衝液は、細胞溶解を促進するが、核の完全性を保持するものである。細胞溶解緩衝液の一例には、10mM Tris−HCl、pH 7.4、10mM NaCl、3mM MgCl2、±0.1%IGEPAL CA−630、1%SUPERase In RNase Inhibitor(20U/μL、Ambion)および1%BSA(20mg/ml、NEB)が含まれる。標準的な核単離法では、単離を助けるために、外因性酵素などの1つ以上の外因性化合物を使用することが多い。細胞溶解緩衝液中に存在できる有用な酵素の例には、プロテアーゼ阻害剤、デオキシリボヌクレアーゼ、リゾチーム、プロテイナーゼK、界面活性剤、リソスタフィン、ザイモラーゼ、セルロース、プロテアーゼまたはグリカナーゼなどが含まれるが、これらに限定されない(Islamら、Micromachines(Basel)、2017、8(3):83;www.sigmaaldrich.com/life−science/biochemicals/biochemical−products.html?TablePage=14573107)。一態様において、1つ以上の外因性酵素は、本明細書に記載の方法に有用な細胞溶解緩衝液中に存在しない。例えば、外因性酵素は、(i)細胞と溶解緩衝液の混合前に細胞に添加ない、(ii)細胞と混合される前に細胞溶解緩衝液中に存在しない、(iii)細胞と細胞溶解緩衝液の混合物、またはそれらの組み合わせに添加されない。当業者であれば、核を単離するための細胞溶解緩衝液の有用性を低下させることなく、これらの構成要素のレベルを幾分変更できることを認めるはずである。次いで、抽出された核を、核緩衝液による1回以上の洗浄により精製する。核緩衝液の一例には、10mM Tris−HCl、pH 7.4、10mM NaCl、3mM MgCl2、1%SUPERase In RNase Inhibitor(20U/μL、Ambion)および1%BSA(20mg/ml、NEB)が含まれる。細胞溶解緩衝液のように、外因性酵素もまた、本開示の方法で使用される核緩衝液中に非存在であることができる。当業者であれば、核を単離するための核緩衝液の有用性を低下させることなく、構成要素のこれらのレベルを幾分変更できることを認めるはずである。当業者であれば、BSAおよび/または界面活性剤が核の単離に使用される緩衝液中において有用であることができることを認めるはずである。
単離された核は、架橋剤への暴露により固定される。架橋剤の有用な例には、パラホルムアルデヒドが含まれるが、これに限定されない。パラホルムアルデヒドは、例えば4%など、1%から8%の濃度にすることができる。パラホルムアルデヒドによる核の処理は、核の懸濁液にパラホルムアルデヒドを添加し、0℃でインキュベートすることを含むことができる。場合によって、および好ましくは、固定後に核緩衝液で洗浄する。
単離された固定核は、すぐに使用することもできるし、または後で使用するために等分し、液体窒素中で瞬間凍結することもできる。凍結後の使用に備えて、解凍した核を、例えば氷上で3分間0.2%tritonX−100で透過処理し、核の凝集を減らすために短時間超音波処理することができる。
慣用的な組織核抽出技術では、通常、組織特異的酵素(例えば、トリプシン)と組織を高温(例えば、37C℃)で30分から数時間インキュベートし、その後、核抽出のために細胞溶解緩衝液で細胞を溶解する。本明細書に記載の核単離方法にはいくつかの利点がある:(1)人工酵素は導入されず、すべての段階は氷上で行われる。これにより、細胞の状態(例、トランスクリプトーム状態)への潜在的な摂動が減少する。(2)新規方法は、脳、肺、腎臓、脾臓、心臓、小脳、および腫瘍組織などの疾患試料を含むほとんどの組織タイプで検証されている。異なる組織タイプに異なる酵素を使用する従来の組織核抽出技術と比較して、新規技術は異なる組織の細胞状態を比較する際の偏向を潜在的に減らすことができる。(3)新規方法はまた、酵素処理段階を削除することにより、コストを削減し、効率を高める。(4)他の核抽出技術(例、ダウンス型ホモジナイザー)と比較して、新規技術は、異なる組織タイプに対してよりロバストであり(例、ダウンス法は異なる組織にダウンスサイクルを最適化する必要がある)、高スループットで大型片の試料を加工することを可能にする(例えば、ダウンス法はホモジナイザーのサイズに制限される)。
場合により、単離された核は、ヌクレオソームを含まないか、またはヌクレオソームの核を枯渇させる条件に曝露されることにより、ヌクレオソーム枯渇核を生成することができる。
サブセットの分配
本明細書で提供される方法は、単離された核または細胞のサブセットを複数の区画に分配することを含む(図1、ブロック11、図2、ブロック23、図3、ブロック32)。この方法は、単離された核または細胞の集団(本明細書ではプールとも称す)をサブセットにスプリットする複数の分配段階を含むことができる。典型的には、単離された核または細胞のサブセット、例えば、複数の区画に存在するサブセットに、区画に固有のインデックスでインデックス付けし、次いでプールする。したがって、この方法は通常、プールされた単離核または単離細胞を取得し、それらを分配し、区画に固有のインデックスを付加する少なくとも1つの「スプリットおよびプール」段階を含み、「スプリットおよびプール」段階の数は、核酸断片に付加される異なるインデックスの数に依存することができる。インデックス付加前の核または細胞の各初期サブセットは、他のサブセットとは異なるものであることができる。例えば、各初期サブセットは、ユニーク試料から取得したり、ユニーク条件に曝露したりできる。インデックス付け後、十分な数のインデックスが核酸断片に付加されるまで、インデックス付け後にサブセットをプールし、サブセットにスプリットし、インデックス付けし、必要に応じて再度プールすることができる。このプロセスにより、ユニークなインデックスまたはインデックスの組み合わせが各単一細胞または核に割り当てられる。インデックス付けが完了した後、例えば、1つ、2つ、3つ、またはそれ以上のインデックスが付加された後、単離された核または細胞を溶解することができる。いくつかの態様では、インデックスの付加と溶解を同時に行わせることができる。
サブセットに、したがって各区画に存在する核または細胞の数は、少なくとも1個であることができる。一態様において、あるサブセットに存在する核または細胞の数は、100,000,000以下、10,000,000以下、1,000,000以下、100,000以下、10,000以下、4,000以下、3,000以下、2,000以下、1,000以下、500以下、または50以下である。一態様において、あるサブセットに存在する核または細胞の数は、1〜1,000、1,000〜10,000、10,000〜100,000、100,000〜1,000,000、1,000,000〜10,000,000、または10,000,000〜100,000,000であることができる。一態様において、各サブセットに存在する核または細胞の数はほぼ等しい。サブセットに存在する核の数、したがって各区画に存在する核の数は、インデックスの衝突を減らすという要望に一部基づくもので、これは、本方法のこの段階において同一区画に終わる同じインデックスの組み合わせを有する2つの核または細胞の存在である。核または細胞をサブセットに分配する方法は、当業者に既知であり、常用的である。蛍光活性化細胞選別(FACS)サイトメトリーを使用することができるが、いくつかの態様では単純な希釈の使用が好ましい。一態様では、FACSサイトメトリーは使用されない。必要に応じて、染色、例えばDAPI(4’,6−ジアミジノ−2−フェニルインドール)染色により、異なる倍数性の核をゲーティングおよび濃縮することができる。染色はまた、選別中にダブレットから単一細胞を識別するためにも使用できる。
分配段階(およびその後のインデックスの付加)における区画の数は、使用する形式により異なるものであることができる。たとえば、区画の数は、2区画〜96区画(96ウェルプレートを使用する場合)、2区画〜384区画(384ウェルプレートを使用する場合)、または2区画〜1536区画(1536ウェルプレートを使用する場合)であることができる。一態様では、複数のプレートを使用することができる。一態様では、各区画は液滴であることができる。使用される区画のタイプが2つ以上の核または細胞を含む液滴である場合、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、または少なくとも10,000,000の液滴など、任意の数の液滴を使用できる。単離された核または細胞のサブセットは、通常、プールする前に区画中でインデックス付けされる。
いくつかの態様では、区画は液滴またはウェルである。細胞または核のトランスクリプトーム、新規合成トランスクリプトーム、またはその部分集団は、液滴またはウェル内のユニークなインデックスまたはインデックスの組み合わせで標識することができる。液滴またはウェル分割から誘導されたインデックス付きライブラリーは、さらにプロセッシングおよび配列決定するためにプールすることができる。そのような方法の例には、10Xゲノミクス(カリフォルニア州プレザントン)、バイオラッド(カリフォルニア州ハーキュリーズ)、およびセルシー(ミシガン州アナーバー)の単一細胞分析システムが含まれるが、これらに限定されない。
所定の条件への曝露
任意の態様において、細胞の各サブセットは、作用物質または摂動に曝露される(図1、ブロック12)。作用物質は、本質的に細胞に変化を引き起こすものであればいかなるものでもあることができる。例えば、作用物質は、細胞のトランスクリプトームを変更し、細胞のクロマチン構造を変更し、細胞内のタンパク質の活性を変更し、細胞のDNAを変更し、メチル化状態を変更し、細胞のDNA編集を変更し、または他の変更を誘発することができる。作用物質の例には、タンパク質(抗体を含む)、非リボソームタンパク質、ポリケチド、有機分子(900ダルトン以下の有機分子を含む)、無機分子、RNAもしくはRNAi分子、炭水化物、糖タンパク質、核酸、またはそれらの組み合わせなどの化合物が含まれるが、これらに限定されない。一態様では、作用物質は、例えば、CRISPRまたはタレンなどのDNA編集タンパク質などの遺伝的摂動を誘発する。一態様では、作用物質は治療薬である。一態様では、細胞は野生型細胞であることができ、また別の態様では、細胞に対し、例えば遺伝子ノックインまたは遺伝子ノックアウトなどの遺伝的摂動を含むように遺伝子改変を行うことができる(Szlachtaら、Nat Commun., 2018、9:4275)。細胞のサブセットを同じ作用物質に曝露することはできるが、区画全体にわたって異なる変数を変更することができ、単一実験で複数の変数について試験することができる。例えば、単一のマルチウェルプレートにおいて、異なる投与量、異なる曝露時間、および異なる細胞タイプを試験することができる。一態様において、細胞は、既知の活性を有するタンパク質を発現することができ、活性に対する作用物質の効果を、異なる条件下で評価することができる。核酸断片を標識するためのインデックス配列の使用により、例えばマルチウェルプレートの1つのウェルからの、核または細胞の固有のサブセットに由来する核酸を後で識別することが可能になる。
核酸の標識
任意の態様においては、細胞によって産生されるRNA、cDNA、またはDNAなどの核酸を標識する(図1、ブロック13)。単一細胞ゲノム技術についての現行方法は、細胞状態のスナップショットを捕捉するため、細胞の移行動態に関する情報を提供することはない。本発明者らは、新しく合成されたRNAを標識することにより、スプリットおよびプールインデックス付け、コンビナトリアルインデックス付け、または任意の単一細胞インデックス付け法を使用して、単一細胞レベルで全トランスクリプトームおよび新規合成トランスクリプトームの両方を捕捉できることを発見した。全トランスクリプトームと新しく合成されたRNAは、同じユニークインデックスまたはインデックスの組み合わせを受け入れることにより、現在の状態(既存など)および新しく合成された核酸を同じ細胞に割り当てることができる。この結果、内因性(例:細胞の内因性細胞周期プログラム)因子および外因性(例:治療薬などの外部刺激に対する細胞の応答)因子によって調節される細胞状態移行動態の特性評価が可能になる。さらに、いくつかの態様において、単一細胞レベルでの全トランスクリプトームおよび新規合成トランスクリプトームの両方の捕捉が、その過去の状態からの劣化トランスクリプトーム情報(過去の状態の記憶)と合わせて可能となる。各細胞の過去の状態の記憶は、2つ以上の時点の間におけるトランスクリプトーム動態によって各細胞について特性評価することができるように、mRNA分解率によって補正(記憶補正)できる。
新しく合成された核酸を標識するためのさまざまな方法が存在するため、新しく合成された核酸を既存の核酸と区別することができ、本質的にはいずれの方法でも使用することができる。典型的には、核酸が合成されるときに、標識が核酸に組み込まれる。1つのタイプの方法には、識別可能な突然変異を付加するヌクレオシド類似体の取り込みが含まれる。例えば、ヌクレオシド類似体4−チオウリジン(S4U)をRNA分子に付加すると、逆転写段階で点突然変異が生じ、チミンからシトシンへの変換を有する変異した第1鎖cDNAが生じる(SunおよびChen、2018、Metabolic Labeling of Newly Synthesized RNA with 4sU to in Parallel Assess RNA Transcription and Decay.In:Lamandee S.(編)mRNA Decay.Methods in Molecular Biology、vol.1720.Humana Press、ニューヨーク、NY)。この点突然変異は、配列とリファレンスを比較することにより、配列決定および分析段階で特定することができる。別のタイプの方法には、ハプテンを含む該RNAを精製するために使用できるハプテン標識ヌクレオチドの取り込みが含まれる。例としては、ビオチン化ヌクレオチド(Luoら、2011、Nucl.Acids Res., 39(19):8559−8571)およびジゴキシゲニン修飾ヌクレオチド(Jena Bioscience GmbHから入手可能)が含まれる。3番目のタイプの方法には、化学反応で修飾することができるヌクレオチド、たとえばクリック官能化ヌクレオチドの組み込み、およびハプテンの付加が含まれる(Bharmalら、2010、J Biomol Tech., 21(3補遺):S43、およびJena Bioscience GmbHから入手可能、およびThermo Fisher Scientificから入手可能)。別のタイプの方法には、限定はされないが、8−オキソ−dGTPおよびdPTP(Jena Bioscience GmbHから入手可能)などの突然変異誘発性ヌクレオチドの取り込みが含まれる。
典型的には、所定の条件は、単離された核ではなく細胞で使用される;しかしながら、合成時の核酸の標識は、細胞または細胞から単離された核を使用して行うことができる。
いくつかの態様において、標識は新しく合成されたcDNAまたはDNAを含むことができる。標識は、細胞または核の固有の状態またはサブセットについての識別子として使用することができる。例えば、異なる量の標識、例えば、ヌクレオシド類似体、ハプテン標識ヌクレオチド、クリック官能化ヌクレオチドおよび/または変異誘発性ヌクレオチド、ならびに/または標識間の異なる割合を使用して、区画のRNA、cDNAまたはDNAを特異的に標識することができる。別の態様において、標識を異なる時点で付加して、時間次元を捉えることができる。異なる時間で異なる標識をRNAに行うために、異なる標識または異なる割合での標識を付加することができる。いくつかの態様において、標識付けは、個々の細胞を分解するためのインデックス付けスキームの一部とすることができる。例えば、伸長段階には、各区画についてユニークなセットのヌクレオチドを含めることができる。標識付けは、逆転写段階、伸長段階、ハイブリダイゼーション、またはPCRのような増幅段階で行われることができる。いくつかの態様では、この結果、ダブレットまたは複数倍になった細胞または細胞間の衝突の検出が可能になる。
核酸断片を生成するためのプロセッシング
一態様において、単離された核または細胞のプロセッシングを用いることにより、単離された核または細胞内のDNA核酸を核酸断片に断片化することができる(図1、ブロック14)。核酸の断片化は、本明細書に記載の方法を用いた配列決定に適した長さを有する分子を得るのに有用であることができる。配列決定される標的核酸が核または細胞に存在するDNAに由来する場合、プロセッシングが必要なものであることができる;しかしながら、いくつかの態様ではRNA分子が断片化される必要はないため、いくつかの態様において、配列決定される標的核酸が核または細胞に存在するRNA(例えば、mRNAおよび/または非コーディングRNA)に由来する場合、プロセッシングは任意である。他の態様では、RNA分子に由来する核酸は断片化されている。断片化は、本方法のどの段階でも行われることができる。例えば、図2に示す具体例となる方法には、核酸分子に2つのインデックスを付加した後の断片化が含まれる。
核または細胞における核酸をプロセッシングすることにより、典型的には、該プロセッシングによって生成された核酸断片の一端または両端にヌクレオチド配列が付加され、ヌクレオチド配列は1つ以上のユニバーサル配列を含むことができ、典型的には含んでいる。ユニバーサル配列は、例えば、インデックスなどの別のヌクレオチド配列を核酸断片に付加するためのプライマーとして使用できるヌクレオチド配列をアニーリングするための後続の段階における「ランディングパッド」として使用することができる。かかるプライマーのヌクレオチド配列は、場合によってはインデックス配列を含むことができる。核または細胞内の核酸をプロセッシングすることにより、該プロセッシングによって生成された核酸断片の一端または両端に1つ以上のユニーク分子識別子を付加することができる。
核または細胞内の核酸をプロセッシングして核酸断片にする様々な方法は既知である。例としては、CRISPRおよびタレン様酵素、ならびにDNA断片がハイブリダイズして伸長または増幅を開始することができる一本鎖領域を作ることができるDNA(例えばヘリカーゼ)をほどく酵素が含まれる。例えば、ヘリカーゼベースに基づく増幅を使用することができる(Vincentら、2004、EMBO Rep., 5(8):795〜800)。一態様において、伸長または増幅は、ランダムプライマーで開始される。一態様では、トランスポソーム複合体が使用される。
トランスポソーム複合体は、トランスポザーゼ認識部位に結合したトランスポザーゼであり、「タグ付け」と呼ばれることもあるプロセスで、核内の標的核酸にトランスポザーゼ認識部位を挿入することができる。上記のいくつかの挿入事象では、トランスポザーゼ認識部位の1つの鎖が標的核酸に導入されてもよい。上記の鎖を、「導入鎖」と称す。一態様では、トランスポソーム複合体は、2つのサブユニットと2つの非連続トランスポゾン配列を有する二量体トランスポザーゼを含む。別の態様において、トランスポザーゼは、2つのサブユニットを有する二量体トランスポザーゼ、および連続トランスポゾン配列を含む。一態様において、トランスポザーゼ認識部位の一方または両方の鎖の5’末端はリン酸化されていてもよい。
いくつかの態様は、高活性Tn5トランスポザーゼおよびTn5型トランスポザーゼ認識部位(GoryshinおよびReznikoff、J.Biol.Chem., 273:7367(1998))、またはMuAトランスポザーゼならびにR1末端配列およびR2末端配列を含むMuトランスポザーゼ認識部位の使用を含むことができる。(Mizuuchi、K., Cell、35:785、1983;Savilahti、Hら、EMBO J., 14:4893、1995)。Tn5モザイクエンド(ME)配列は、当業者によって最適化されたものとして使用することもできる。
本明細書で提供される組成物および方法の特定の態様で使用できる転位系のさらなる例には、黄色ブドウ球菌(Staphylococcus aureus)Tn552(Colegioら、J.Bacteriol., 183:2384−8、2001;Kirby Cら、Mol.Microbiol., 43:173−86、2002)、Ty1(DevineおよびBoeke、Nucleic Acids Res., 22:3765−72、1994および国際公開WO95/23875)、トランスポゾンTn7(Craig、NL、Science.271:1512、1996;Craig、NL、Review in:Curr Top Microbiol Immunol., 204:27−48、1996)、Tn/OおよびIS10(Kleckner N.ら、Curr Top Microbiol Immunol., 204:49−82、1996)、Marinerトランスポザーゼ(Lampe DJら、EMBO J., 15:5470−9、1996)、Tc1(Plasterk RH、Curr.Topics Microbiol.Immunol., 204:125−43、1996)、P Element(Gloor、GB、Methods Mol.Bio., 260:97−114、2004)、Tn3(IchikawaおよびOhtsubo、J Biol.Chem.265:18829−32、1990)、細菌挿入配列(OhtsuboおよびSekine、Curr.Top.Microbiol.Immunol.204:1−26、1996)、レトロウイルス(Brownら、Proc Natl Acad Sci USA、86:2525−9、1989)、および酵母のレトロトランスポゾン(BoekeおよびCorces、Annu Rev Microbiol.43:403−34、1989)が含まれる。さらなる例には、IS5、Tn10、Tn903、IS911、およびトランスポザーゼファミリー酵素の遺伝子組換えバージョン(Zhangら、(2009)PLoS Genet.5:e1000689.Epub 2009年10月16日;Wilson Cら(2007)J.Microbiol.Methods 71:332−5)が含まれる。
本明細書で提供される方法および組成物とともに使用されてもよいインテグラーゼの他の例には、HIV−1、HIV−2、SIV、PFV−1、RSV由来のインテグラーゼなど、レトロウイルスインテグラーゼおよびかかるレトロウイルスインテグラーゼについてのインテグラーゼ認識配列が含まれる。
本明細書に記載の方法および組成物に有用なトランスポゾン配列は、米国特許出願公開第2012/0208705号、米国特許出願公開第2012/0208724号および国際特許出願公開第WO2012/061832号において提供されている。いくつかの態様において、トランスポゾン配列は、第1のトランスポザーゼ認識部位および第2のトランスポザーゼ認識部位を含む。トランスポソーム複合体を使用してインデックス配列を導入するこれらの態様において、インデックス配列は、トランスポザーゼ認識部位間またはトランスポゾン内に存在することができる。
本明細書で有用ないくつかのトランスポソーム複合体には、2つのトランスポゾン配列を有するトランスポザーゼが含まれる。上記のいくつかの態様において、2つのトランスポゾン配列は互いに連結されておらず、言い換えると、トランスポゾン配列は互いに隣接していない。かかるトランスポソームの例は、当技術分野で既知である(例えば、米国特許出願公開第2010/0120098号を参照)。
典型的には、タグ付けは、各末端に異なるヌクレオチド配列(例、一端にN5プライマー配列および他端にN7プライマー配列)を含む核酸断片を製造するために使用される。これは、2つのタイプのトランスポソーム複合体を使用して実現できるもので、各トランスポソーム複合体には、導入鎖の一部である異なるヌクレオチド配列が含まれる。いくつかの態様において、本明細書で使用されるタグ付けは、1つのヌクレオチド配列を核酸断片に挿入する。ヌクレオチド配列の挿入の結果、一端にヘアピンライゲーション二本鎖を有し、他端にトランスポソーム複合体挿入ヌクレオチド配列を有する核酸断片が得られる。トランスポソーム複合体が挿入されたヌクレオチド配列には、ユニバーサル配列が含まれる。ユニバーサル配列は、別のインデックスを導入するために、本明細書に記載の増幅段階におけるハイブリダイゼーションの相補配列としての役割を果たす。
いくつかの態様において、トランスポソーム複合体は、2つのトランスポザーゼサブユニットに結合して「ループ型複合体」または「ループ型トランスポソーム」を形成するトランスポゾン配列核酸を含む。一例では、トランスポソームには、二量体トランスポザーゼとトランスポゾン配列が含まれる。ループ型複合体は、元の標的DNAの順序情報を維持しながらも、標的DNAを断片化せずに、トランスポゾンが標的DNAに挿入されることを確実にすることができる。以上から明らかなように、ループ型構造は、標的核酸の物理的結合性を維持しながら、インデックスなどの所望の核酸配列を標的核酸に挿入してもよい。いくつかの態様において、ループ型トランスポソーム複合体のトランスポゾン配列は、トランスポゾン配列を断片化して2つのトランスポゾン配列を含むトランスポソーム複合体を作製できるように断片化部位を含むことができる。かかるトランスポソーム複合体は、トランスポゾンが挿入される隣接する標的DNA断片が、アッセイの後の段階で一義的に組み立てられることができるバーコードの組み合わせを受け入れることを確実にするのに有用である。
一態様において、核酸の断片化は、核酸に存在する断片化部位を使用することにより達成される。典型的には、断片化部位は、トランスポソーム複合体を使用することにより標的核酸に導入される。一態様では、核酸が断片化された後、トランスポザーゼは核酸断片に付着したままであるため、同じゲノムDNA分子に由来する核酸断片は物理的に結合したままである(Adeyら、2014、Genome Res., 24:2041〜2049)。例えば、ループ型トランスポソーム複合体は、断片化部位を含むことができる。断片化部位を使用することにより、標的核酸に挿入されたインデックス配列間における物理的会合を切断することはできるが、情報的会合を切断することはできない。開裂は、生化学的、化学的、またはその他の手段によるものであってよい。いくつかの態様において、断片化部位は、様々な手段により断片化されてもよいヌクレオチドまたはヌクレオチド配列を含むことができる。断片化部位の例には、制限エンドヌクレアーゼ部位、リボヌクレアーゼで開裂可能な少なくとも1つのリボヌクレオチド、特定の化学物質の存在下で開裂可能なヌクレオチド類似体、過ヨウ素酸塩での処理により開裂可能なジオール結合、化学的還元剤で開裂可能なジスルフィド基、光化学的開裂を受けてもよい開裂可能な部分、およびペプチダーゼ酵素または他の適切な手段により開裂可能なペプチドが含まれるが、これらに限定されない(例えば、米国特許出願公開第2012/0208705号、米国特許出願公開番号2012/0208724および国際公開WO2012/061832参照)。
トランスポソーム複合体は、トランスポザーゼインデックスとも呼ばれるインデックス配列を任意に含むことができる。インデックス配列は、トランスポゾン配列の一部として存在する。一態様において、インデックス配列は、標的核酸に移入されるトランスポザーゼ認識部位の鎖である、導入鎖上に存在することができる。
核のタグ付けおよび核酸断片のプロセッシングに続いて、分子の純度を高めるクリーンアッププロセスを実行することができる。電気泳動、サイズ排除クロマトグラフィーなどの任意の適切なクリーンアッププロセスを使用してもよい。いくつかの態様では、固相可逆固定化常磁性ビーズを使用して、例えば組み込まれていないプライマーから所望のDNA分子を分離し、サイズに基づいて核酸を選択してもよい。固相可逆固定化常磁性ビーズは、Beckman Coulter(Agencourt AMPure XP)、Thermofisher(MagJet)、Omega Biotek(Mag−Bind)、Promega Beads(Promega)、およびKapa Biosystems(Kapa Pure Beads)から市販されている。
区画に固有のインデックスの付加
タグまたはバーコードとも呼ばれるインデックス配列は、特定の核酸が存在した区画に特徴的なマーカーとして有用である。したがって、インデックスは、特定の区画に存在する各標的核酸に結合している核酸配列タグであり、その存在は、本方法の特定の段階で単離された核または細胞の集団が存在していた区画を示すものであるか、または識別するために使用される。核酸断片へのインデックスの付加は、異なる区画に分配された単離された核または細胞のサブセットで達成される(図1、ブロック15;図2、ブロック24、26、および30;図3、ブロック33および37)。
インデックス配列は、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれ以上といった長さである任意の適切な数のヌクレオチドであることができる。4ヌクレオチドタグを使用すると、同じアレイで256個の試料を多重化することができ、6塩基タグを使用すると、同じアレイで4096個の試料を処理できる。
一態様では、核酸断片への核酸のプロセッシング中にインデックスの付加が達成される。例えば、インデックスを含むトランスポソーム複合体を使用することができる。いくつかの態様では、一方または両方の末端にヌクレオチド配列を含む核酸断片がプロセッシングによって生成された後に、インデックスが付加される。他の態様では、インデックスを付加するための処理は不要である。例えば、RNA核酸を断片化することなく、RNA核酸にインデックスを直接付加することができる。したがって、「核酸断片」と言えば、プロセッシングから生じる核酸およびRNA核酸、ならびにこれらの核酸に由来する核酸が包含される。
インデックスを付加する方法には、限定される訳ではないが、ライゲーション、伸長(逆転写酵素を使用した伸長を含む)、ハイブリダイゼーション、吸着、プライマーの特異的または非特異的相互作用、増幅、または転位が含まれる。核酸断片の一方または両方の末端に付加されるヌクレオチド配列はまた、1つ以上のユニバーサル配列および/またはユニーク分子識別子も含むことができる。ユニバーサル配列は、例えば、別のインデックスおよび/または別のユニバーサル配列などの別のヌクレオチド配列を核酸断片に付加するためのプライマーとして使用することができるヌクレオチド配列をアニーリングする後続段階で「ランディングパッド」として使用することができる。したがって、インデックス配列の組み込みは、ライゲーション、伸長、ハイブリダイゼーション、吸着、プライマーの特異的または非特異的相互作用、増幅、または転位の本質的に任意の組み合わせを使用して、1、2、またはそれ以上の段階を含むプロセスを使用することができる。
例えば、mRNAに由来する核酸断片の使用を含む態様では、さまざまな方法を使用して、1つまたは2つの段階でmRNAにインデックスを付加することができる。例えば、cDNAの製造に使用されるタイプの方法を使用して、インデックスを付加することができる。3’末端にポリT配列を含むプライマーをmRNA分子にアニーリングし、逆転写酵素を使用して伸長させることができる。単離された核または細胞を逆転写に適した条件下でこれらの構成要素に暴露すると、インデックスが1段階で付加され、その結果、各核または細胞にインデックス付けされた核酸断片が含まれる、インデックス付けされた核または細胞の集団が得られる。別法として、ポリT配列を有するプライマーは、インデックスの代わりにユニバーサル配列を含み、インデックスは、ライゲーション、プライマー伸長、増幅、ハイブリダイゼーション、またはそれらの組み合わせの後続段階によって付加される。いくつかの態様では、ユニバーサル配列を使用せずにバーコードが付加される。インデックス付けされた核酸断片は、合成された鎖上に特定の区画を示すインデックス配列を含むことができ、通常は含んでいる。
非コーディングRNAに由来する核酸断片の使用を含む態様では、様々な方法を使用して、1つまたは2つの段階で非コーディングRNAにインデックスを付加することができる。例えば、ランダム配列と鋳型スイッチプライマーを含む第1のプライマーを使用してインデックスを付加することができ、その場合どちらのプライマーにもインデックスを含めることができる。合成鎖の3’末端に非鋳型ヌクレオチドを付加するために、末端トランスフェラーゼ活性を有する逆転写酵素を使用することができ、鋳型スイッチプライマーには、逆転写酵素により付加された非鋳型ヌクレオチドとアニーリングするヌクレオチドが含まれる。有用な逆転写酵素の一例は、モロニーネズミ白血病ウイルス逆転写酵素である。特定の態様において、Takara Bio USA社(カタログ番号634926)から入手可能なSMARTerTM試薬は、鋳型スイッチングを使用するために使用されるもので、非コーディングRNAおよび必要に応じてmRNAにインデックスを付加する。別法として、第1のプライマーおよび/または鋳型スイッチプライマーは、インデックスの代わりにユニバーサル配列を含むことができ、インデックスは、ライゲーション、プライマー伸長、増幅、ハイブリダイゼーション、またはそれらの組み合わせの後続段階によって付加される。インデックス付けされた核酸断片は、合成鎖上に特定の区画を示すインデックス配列を含むことができ、通常は含んでいる。他の態様は、RNAの5’もしくは3’プロファイリングまたは完全長RNAプロファイリングを含む。
別の態様では、特定のmRNAおよび/または非コーディングRNAを増幅の標的とすることができる。標的化により、有用な情報が得られる可能性が高く、配列決定深度および関連コストが大幅に削減され、細胞間の微妙な違いを検出する能力が向上する可能性が高い配列について濃縮された配列決定ライブラリーの作製が可能になる。1つ以上のmRNAおよび/または1つ以上の非コーディングRNAを含むRNA分子は、有用な情報を生成する可能性が高いものとして選択でき、プライマーを使用することにより、所定のRNA核酸に選択的にアニーリングし、細胞または核に存在する全RNA分子の部分集団を増幅することができる。当業者であれば、選択する適切なRNA分子が実験により異なることを認識するはずである。例えば、非コーディング摂動の評価では、破壊されている調節エレメントに対しシスのコーディング領域のみ発現の変化について試験することができる。この方法は、ランダムヘキサマーまたはポリTプライマーの使用よりもリボソームリードのバックグラウンドを低減させてもよい。また、この方法は、スプライスジャンクションおよび選択的転写開始部位事象に起因するエクソンの標的化を可能にするため、慣用的Sci法では容易に検出されないアイソフォーム情報を提供する。
RNA分子の標的化された増幅は、ライブラリー作製中におけるいくつかの段階で行われることができる。一態様では、RNA分子の逆転写中に複数の標的に対する標的化増幅が行われる。実験には、異なるRNA分子を標的とする複数の異なるプライマーを含めることができる。一態様では、同じRNA分子の異なる領域を標的とする複数のプライマーを使用することができる。同じRNA分子の異なる領域に向けられた複数のプライマーの使用により、該RNA分子がcDNAに逆転写される複数の機会が可能になり、RNA分子の検出の可能性が高められる。
一態様では、標的化増幅に使用されるプライマーはインデックスを含まない。増幅反応中にインデックスが付加されていない場合、異なる区画への細胞または核の分配は不要であり、増幅は存在する全RNA分子と全プライマーとの単一反応として行われることができる。増幅反応中にインデックスが付加されている態様では、細胞または核の分配が有用であり、増幅は、存在する全RNA分子および全プライマーとの各区画内における単一反応として行われることができるが、区画中の各プライマーは同じ区画に固有のインデックスを有するものとする。
一態様において、多重標的捕捉のためのプライマーの設計は、以下の考慮事項のうちの1つ以上を含むことができる。標的化増幅のためにRNAが選択された後、該RNAの配列を集め、すべての可能な逆転写酵素プライマー(候補プライマー)を決定することができる。いずれのプライマーにしても、その長さは、逆転写反応で機能するのに十分な長さである必要があり、例えば、20ヌクレオチド〜30ヌクレオチドの長さであることができる。
候補プライマーについては、限定されるものではないが、GC含有量、プライマー中のGC塩基の位置、オフサイト標的化の可能性、およびマッピング可能性を含むさまざまな基準でフィルターにかけることができる。有用なGC含有量は40〜60%であり、およそ55〜70℃の融解温度に対応する。プライマーの3’末端の最後の5ヌクレオチドに2つのグアニンまたはシトシン塩基を有する形にすることにより、アニーリングしたプライマーが逆転写酵素による伸長の良い基質となる可能性を高めることが好ましい。
オフターゲットプライミングの可能性に関して、本発明者らは、標的RNAが高度に濃縮されている一方で、リードの大部分が依然として細胞内に豊富にある他のRNAに由来することを発見した。これらのオフターゲットプライミング事象のほとんどは、プライマーの3’末端とオフターゲットRNAとの間の約5〜8塩基対の相補性の結果であった。本発明者らは、全細胞RNA内の候補プライマーの最終六量体の存在量を考慮することが有用であることを見出した。有用なプライマーには、(i)リボソームRNA内に存在しない、または(ii)全細胞RNA内に低レベルで表される最後の六量体が含まれることが確認された。
リボソームRNA内に存在しない六量体の例が報告されている(Armorら、2009、Nature Methods、6(9):647−49の「Not So Random」またはNSR六量体)。この特徴を有するプライマーは、リボソームRNA内でオフターゲットプライミングを有する可能性がはるかに低いことがわかった。総細胞RNA内で六量体が低レベルで表されるかどうかを判断する1つの方法は、細胞内のRNA分子における各六量体の存在量、例えば本明細書に記載の方法にしたがって分析される細胞タイプ内の、リボソーム転写を含む、すべての新生転写を識別することを含むことができる。低レベルの存在量、例えば、存在量の最低四分位内にある候補プライマーの使用は、オフサイト標的化を減らすことができる。
候補プライマーはまた、マッピング可能性によっても評価できる。例えば、ボウタイ型のアルゴリズムを使用して各候補を標的に向けて整列させることができ、3つのミスマッチが認められる。この段階は、各プライマーがゲノム内に唯一の標的部位を有することを確実にするのに役立つ。
いくつかの態様において、多重標的捕捉とも呼ばれる同一反応における複数の標的の増幅、逆転写酵素プライマーのアニーリング温度の制御は、特定の逆転写の維持および所望の標的RNAの増幅に役立つ。例えば、典型的な逆転写プロトコルはRNAと逆転写プライマーの混合物を変性させ、4℃に冷却してアニーリングを可能にする。アニーリング温度が低いと許容範囲が広すぎて、望ましくないオフターゲットアニーリング事象が発生する。伸長するアニーリング事象のみが、標的の逆転写プライマー全体が正しい標的にアニーリングする事象である可能性を高めるために、逆転写のプロセス全体で高温が維持される。一態様では、65℃での構成要素(例えば、固定細胞、逆転写プライマープール、およびdNTPの混合物)を、53℃でアニーリングし、53℃で予め平衡化された逆転写酵素/緩衝液混合物をアニーリング反応に加え、53℃で20分間伸長させる。したがって、逆転写プライマーが変性段階と伸長段階の間に低温でアニーリングする可能性が低減される。当業者であれば、逆転写の特異性を低下させることなく、例えば温度または時間を変更するなど、ある程度の修正を行うことができると認めるはずである。
核酸断片へのインデックスの付加には他の方法を使用することもでき、インデックスの付加方法は限定されないものとする。例えば、一態様では、インデックス配列の組み込みは、プライマーを核酸断片の一方または両方の末端にライゲーションすることを含む。ライゲーションプライマーのライゲーションを、核酸断片の末端におけるユニバーサル配列の存在により促進することができる。プライマーの一例は、ヘアピンライゲーション二本鎖である。ライゲーション二本鎖を、核酸断片の一端または好ましくは両端にライゲーションすることができる。
別の態様において、インデックス配列の組み込みには、一本鎖核酸断片の使用および第2のDNA鎖の合成が含まれる。一態様において、第2のDNA鎖は、一本鎖核酸断片の末端に存在するヌクレオチドに相補的な配列を含むプライマーを使用して製造される。
別の態様において、インデックスの組み込みは、1回、2回、3回、またはそれ以上のスプリットおよびプールバーコーディングで行われ、その結果、単一、二重、三重、または多重(例えば、4つ以上)のインデックス付き単一細胞ライブラリーが得られる。
別の態様において、インデックスおよび増幅メディエータ(例えば、ユニバーサル配列)の組み込みは有益であり、標的化された単一細胞配列決定ライブラリーおよび/または標的化された単一細胞配列決定ライブラリーの調製を可能にする。
固定化のためのユニバーサル配列の付加
一態様では、プロセッシング段階および/またはインデックス付け段階中におけるヌクレオチドの付加により、フラグメントの固定化および配列決定に有用なユニバーサル配列が付加される。別の態様では、インデックス付きの核酸断片をさらにプロセッシングして、核酸断片の固定化および配列決定に有用なユニバーサル配列を付加することができる。当業者であれば、区画が液滴である態様では、核酸断片を固定化するための配列は任意であることを認めるはずである。一態様では、断片の固定化および配列決定に有用なユニバーサル配列の組み込みには、同一のユニバーサルアダプター(「ミスマッチアダプター」とも呼ばれ、その一般的な特徴は、Gormleyら、米国特許第7,741,463号、およびBignellら、米国特許第8,053,192号に記載されている)をインデックス付けされた核酸断片の5’末端および3’末端にライゲーションすることが含まれる。一態様において、ユニバーサルアダプターは、アレイ上にインデックス付きの核酸断片を固定化するための配列を含む、配列決定に必要なすべての配列を含む。
一態様では、平滑末端ライゲーションを使用することができる。別の態様において、核酸断片は、例えば、1つ以上のデオキシヌクレオチド、例えばデオキシアデノシン(A)をインデックス付けされた核酸断片の3’末端へ付加する非鋳型依存性のターミナルトランスフェラーゼ活性を有するTaqポリメラーゼまたはKlenowエキソマイナスポリメラーゼなどの特定のタイプのDNAポリメラーゼの活性によって、単一オーバーハング状ヌクレオチドで調製される。場合によっては、オーバーハング状ヌクレオチドは複数の塩基である。かかる酵素を使用して、核酸断片の各鎖の平滑末端3’末端に単一ヌクレオチド「A」を付加することができる。したがって、TaqポリメラーゼまたはKlenowエキソマイナスポリメラーゼとの反応により、二本鎖標的断片の各鎖の3’末端に「A」を付加することができるが、核酸断片の各末端に付加される追加の配列は、付加する二本鎖核酸の各領域の3’末端に存在する適合性のある「T」オーバーハングを含むことができる。また、この態様で付加される配列が隣接するインデックス付きの核酸フラグメントの形成に偏向が存在するように、この末端修飾は核酸の自己ライゲーションを防止する。
別の態様では、インデックス付きの核酸断片にライゲーションされたユニバーサルアダプターが配列決定に必要なすべての配列を含む訳ではない場合、PCRなどの増幅段階を使用して、固定化および配列決定を行う前に各インデックス付きの核酸断片に存在するユニバーサルアダプターをさらに修飾することができる。例えば、最初のプライマー伸長反応は、インデックス付きの核酸断片に存在するユニバーサル配列に相補的なユニバーサルアンカー配列を使用して実行することができ、個々のインデックス付きの核酸断片の両方の鎖に相補的な伸長産物が形成される。典型的には、PCRは、ユニバーサル捕捉配列などのユニバーサル配列を付加する。
ユニバーサルアダプターを付加した後、配列決定に必要なすべての配列を含むユニバーサルアダプターをライゲーションまたはハイブリダイズする単一段階法によって、またはユニバーサルアダプターをライゲーションし、次いでユニバーサルアダプターをさらに修飾するため増幅を行う2段階法によって、最終的なインデックス断片には、ユニバーサル捕捉配列とアンカー配列が含まれることになる。ユニバーサルアダプターを各末端に付加すると、複数のインデックス付きの核酸断片またはそのライブラリーが作製される。
得られたインデックス付き断片は、固定化してから配列決定することができる核酸のライブラリーを集合的に提供する。本明細書において配列決定ライブラリーとも呼ばれるライブラリーという用語は、3’末端および5’末端に既知のユニバーサル配列を含む単一の核または細胞からの核酸断片の集合体を指す。ライブラリーは、全トランスクリプトームからの核酸、新しく合成されたRNA分子からの核酸、またはその両方の組み合わせを含むもので、全トランスクリプトーム、新しく合成されたRNAのトランスクリプトーム、または両方の組み合わせの配列決定を行うのに使用することができる。
インデックス付けされた核酸断片は、150〜300ヌクレオチドなどの長さ150〜400ヌクレオチドなどの所定のサイズ範囲について選択する条件に供することができる。得られたインデックス付きの核酸断片をプールし、任意で、組み込まれていないユニバーサルアダプターまたはプライマーの少なくとも一部を除去することによりDNA分子の純度を高めるためのクリーンアッププロセスにかけることができる。電気泳動、サイズ排除クロマトグラフィーなどの任意の適切なクリーンアッププロセスを使用してもよい。いくつかの態様では、固相可逆固定化常磁性ビーズを使用して、付着していないユニバーサルアダプターまたはプライマーから所望のDNA分子を分離し、サイズに基づいて核酸を選択してもよい。固相可逆固定化常磁性ビーズは、Beckman Coulter(Agencourt AMPure XP)、Thermofisher(MagJet)、Omega Biotek(Mag−Bind)、Promega Beads(Promega)、およびKapa Biosystems(Kapa Pure Beads)から市販されている。
本開示の非限定的な例示的態様を図1に示す。この態様において、本方法は、複数の細胞を提供することを含む(図1、ブロック10)。本方法は、細胞のサブセットを複数の区画に分配すること(図1、ブロック11)、および細胞を所定の条件に曝露すること(図1、ブロック12)をさらに含む。所定の条件は、異なる区画間では変化することができ、通常は変化する。例えば、異なる区画は、異なる作用物質投与量、異なる摂動、異なる曝露期間、異なる細胞タイプなどを含むことができる。次いで、新しく合成されたRNAに標識を付す(図1、ブロック13)。標識付けは細胞で行うことができ、または核を細胞から単離して標識付けを核で行うことができる。いくつかの態様では、細胞RNAをプロセッシングすることにより断片を得る(図1、ブロック14)。次いで、細胞または核に存在するRNAにインデックスを付す(図1、ブロック15)。RNAにインデックスを付けるためのさまざまな態様が可能である。例えば、一態様では、細胞内に存在するすべてのmRNAに、ポリT領域を含むプライマーを使用することによりインデックスを付す。別の態様では、特定のRNA核酸にインデックスを付けることができる。
本開示の別の非限定的な例示的態様を、図2に示し、実施例1で記載する。この態様では、本方法は、複数の細胞から単離された核を提供することを含む(図2、ブロック22)。この方法は、単離された核のサブセットを第1の複数の区画に分配することをさらに含む(図2、ブロック23)。最初の分配段階(図2、ブロック23)における区画の数は、使用する形式によって異なることができる。たとえば、区画の数は、2区画〜96区画(96ウェルプレートを使用する場合)、2区画〜384区画(384ウェルプレートを使用する場合)、または2区画〜1536区画(1536ウェルプレートを使用する場合)であることができる。別法として、液滴などの他の区画を使用することができる。
この方法はまた、インデックス付けされた核を生成することも含む(図2、ブロック24)。一態様では、インデックス付きの核の生成には、インデックス、ランダムヌクレオチド配列、およびユニバーサル配列を付加するためのオリゴ−dTプライマーを伴う逆転写酵素の使用が含まれる。各区画のインデックスはユニークであり、例えば、各インデックスは区画固有である。ランダム配列は、ユニーク核酸断片を標識するためのユニーク分子識別子(UMI)として使用される。また、ランダム配列を使用することにより、下流プロセッシングにおける重複部分の除去を促すことができる。ユニバーサル配列は、本明細書に記載のライゲーション段階におけるハイブリダイゼーションのための相補配列としての役割を果たす。別の態様では、インデックス付きの核を生成することは、所定のRNA分子を標的とする特異的プライマーを伴う逆転写酵素の使用を含む。逆転写の結果、標的RNA分子にインデックス、ランダムヌクレオチド配列、およびユニバーサル配列を付加することができる。逆転写に適した条件下でこれらの構成要素に核を曝露すると、インデックス付けされた核の集団が生じ、各核にはインデックス付きの核酸断片が含まれる。インデックス付けされた核酸断片は、合成鎖上に特定の区画を示すインデックス配列を含むことができ、通常は含んでいる。インデックス付きの核酸断片の一例を、実施例1の図1Aに示す(「インデックス付き逆転写」を参照)。
複数の区画からのインデックス付けされた核を組み合わせることができる(図2、ブロック25)。次いで、本明細書でプールされたインデックス付きの核と呼ばれるこれらの組み合わされたインデックス付きの核のサブセットは、第2の複数の区画に分配される(図2、ブロック25)。核のサブセットへの分配に続いて、各区画におけるインデックス付きの核酸断片に第2のインデックス配列を組み込み、デュアルインデックス付き断片を生成させる。これにより、インデックス付けされた核酸断片のさらなるインデックス付けが行われる(図2、ブロック26)。
この例示的な態様では、第2のインデックス配列の組み込みは、ヘアピンライゲーション二本鎖を各区画内のインデックス付きの核酸断片にライゲーションすることを含む。ヘアピンライゲーション二本鎖を使用して、標的核酸断片の末端にユニバーサル配列、インデックス、またはそれらの組み合わせを導入する場合、典型的には、二本鎖の一方の末端を後続の増幅用のプライマーとして使用する。対照的に、この態様で使用されるヘアピンライゲーション二本鎖は、プライマーとして作用することはない。本明細書に記載のヘアピンライゲーション二本鎖を使用する利点は、当技術分野で報告された多くのヘアピンライゲーション二本鎖で観察される自己−自己ライゲーションの減少である。一態様において、ライゲーション二本鎖は5つの要素を含む:1)オリゴdTプライマー上に存在するユニバーサル配列の相補体であるユニバーサル配列、2)第2のインデックス、3)イデオキシU、4)ヘアピンを形成することができるヌクレオチド配列、および5)第2のインデックスの逆相補体。第2のインデックス配列は、逆転写により第1のインデックスが付加された後、分配されたインデックス付きの核が置かれた各区画に対してユニークである(図2、ブロック25)。デュアルインデックス付きの核酸断片の例を、実施例1の図1Aに示す(「インデックス付きヘアピンライゲーション」を参照)。
核酸断片に組み込まれたヘアピンライゲーション二本鎖のヘアピン領域に存在するイデオキシUの除去は、クリーンアップの前、最中、または後に行うことができる。ウラシル残基の除去は、利用可能な任意の方法によって達成することができ、コーンの態様では、NEBから入手可能なウラシル特異的切除試薬(USER)が使用される。
次いで、本明細書でプールされたデュアルインデックス付きの核と呼ばれるこれらの組み合わされたデュアルインデックス付きの核のサブセットは、第3の複数の区画に分配される(図2、ブロック27)。一態様では、100個〜30,000個の核が各ウェルに分配される。一態様では、1ウェル内の核の数は、少なくとも100、少なくとも500、少なくとも1,000、または少なくとも5,000である。一態様では、1ウェル内の核の数は、30,000以下、25,000以下、20,000以下、または15,000以下である。一態様では、1サブセットに存在する核の数は、100〜1,000、1,000〜10,000、10,000〜20,000、または20,000〜30,000であることができる。一態様では、2,500個の核が各ウェルに分配される。一態様では、各サブセットに存在する核の数はほぼ等しい。
デュアルインデックス付きの核のサブセットへの分配に続いて、第2のDNA鎖が合成される(図2、ブロック28)。核内の核酸は、それらにタグ付けを施すことによりプロセッシングされる(図2、ブロック29)。デュアルインデックス付きの核を含む各区画には、トランスポソーム複合体が含まれる。この態様では、タグ付けを使用して、各末端に異なるヌクレオチド配列(例えば、一方の末端にN5プライマー配列および他方の末端にN7プライマー)を含む核酸断片を製造する。
核のタグ付けに続いて、各区画におけるデュアルインデックス付きの核酸断片に第3のインデックス配列を組み込み、トリプルインデックス付き断片を生成するが、各区画における第3のインデックス配列は、該区画における第1と第2のインデックス配列とは異なるものとする。この結果、固定化および配列決定の前に、インデックス付きの核酸断片のさらなるインデックス付けが行われる(図2、ブロック30;実施例の図1A(「USER処理、インデックス付きPCR」)も参照)。一態様では、デュアルインデックス付きの核酸断片の末端に存在するユニバーサル配列(例、一端にヘアピンライゲーション二本鎖挿入ヌクレオチド配列および他端にトランスポソーム複合体挿入ヌクレオチド配列)を、プライマーの結合に使用し、増幅反応で伸長させることができる。典型的には、2つの異なるプライマーが使用される。一方のプライマーは、デュアルインデックス付きの核酸断片の一方の鎖の3’末端でユニバーサル配列とハイブリダイズし、第2のプライマーは、デュアルインデックス付きの核酸断片の他方の鎖の3’末端でユニバーサル配列とハイブリダイズする。したがって、各プライマー上に存在するアンカー配列(例、リード1またはリード2についての配列決定プライマーなどのユニバーサルプライマーが配列決定のためアニーリングする部位)は異なるものであることができる。適切なプライマーは、それぞれ、ユニバーサル捕捉配列(例、捕捉オリゴヌクレオチドがハイブリダイズする部位であって、捕捉オリゴヌクレオチドを固体基板の表面に固定化することができる)などの追加のユニバーサル配列を含むことができる。各プライマーにはインデックスが含まれているため、この段階の結果、別のインデックス配列が核酸断片の各末端に1つずつ付加されることにより、トリプルインデックス付き断片が形成される。一態様では、インデックス付きP5プライマーおよびインデックス付きP7プライマーなどのインデックス付きプライマーを使用して、第3のインデックスを付加することができる。トリプルインデックス付き断片をプールし、それらに対し本明細書に記載の要領でクリーンアップ段階を行うことができる。
複数のトリプルインデックス付き断片を、配列決定のために調製することができる。トリプルインデックス付き断片をプールし、クリーンアップにかけた後、配列決定の前に、通常は固定化および/または増幅によってそれらを濃縮する(図2、ブロック31)。
本開示の別の非限定的な例示的態様を、図3に示し、実施例4で説明する。この態様において、本方法は、単離された核または細胞を提供することを含む(図3、ブロック30)。核または細胞を逆転写酵素および特定のプライマーに曝露して、所定のRNA分子を標的として濃縮することができる(図3、ブロック31)。逆転写に適した条件下でこれらの成分に核または細胞を曝露することにより、核または細胞の集団が生じ、各核には、所定のRNA分子に存在する配列について濃縮された核酸断片が含まれる。この方法は、核または細胞のサブセットを第1の複数の区画に分配することをさらに含む(図3、ブロック32)。最初の分配段階(図3、ブロック32)における区画の数は、使用する形式によって異なることができる。たとえば、区画の数は、2区画〜96区画(96ウェルプレートを使用する場合)、2区画〜384区画(384ウェルプレートを使用する場合)、または2区画〜1536区画(1536ウェルプレートを使用する場合)であることができる。別法として、液滴などの他の区画を使用することができる。
この方法はまた、各区画内の核酸断片にインデックス配列を組み込んで、インデックス付き断片を生成することにより、インデックス付きの核または細胞を作製することを含む(図3、ブロック33)。
一態様では、インデックス配列の組み込みは、ヘアピンライゲーション二本鎖を各区画におけるインデックス付きの核酸断片にライゲーションすることを含む。インデックス付けされた断片を含む核または細胞をプールし、次いで、これらの組み合わされたインデックス付きの核または細胞のサブセットを、第2の複数の区画に分配する(図3、ブロック34)。
インデックス付けされた核または細胞をサブセットに分配した後、第2のDNA鎖の合成を行うことができる(図3、ブロック35)。核または細胞内の核酸は、それらにタグ付けを行うことによりプロセッシングされる(図3、ブロック36)。インデックス付けされた核を含む各区画には、トランスポソーム複合体が含まれる。この態様では、タグ付けを使用して、各末端に異なるヌクレオチド配列(例えば、一方の末端にN5プライマー配列および他方の末端にN7プライマー)を含む核酸断片を製造する。
核のタグ付けに続いて、各区画におけるインデックス付きの核酸断片に第2のインデックス配列を組み込み、デュアルインデックス付き断片を生成することができるが、ここで各区画における第2のインデックス配列は、該区画における第1のインデックス配列とは異なるものとする。この結果、固定化および配列決定の前に、インデックス付けされた核酸断片のさらなるインデックス付けが行われる(図3、ブロック37)。
複数のデュアルインデックス付き断片を、配列決定用に調製することができるが、配列決定データは、所定のRNA分子に存在する配列について濃縮されているものとする。デュアルインデックス付き断片をプールし、クリーンアップにかけた後、典型的には、固定化および/または増幅によって配列決定の前にそれらを濃縮する(図3、ブロック38)。
配列決定のための固定化試料の調製
1つ以上の供給源からのインデックス付き断片を基板に付着させる方法は、当技術分野で既知である。一態様において、インデックス付き断片を、該インデックス付き断片に対して特異性を有する複数の捕捉オリゴヌクレオチドを使用して濃縮し、捕捉オリゴヌクレオチドを固体基板の表面に固定化することができる。例えば、捕捉オリゴヌクレオチドは、ユニバーサル結合ペアの第1の構成員を含むことができ、結合ペアの第2の構成員は固体基板の表面に固定化される。同様に、固定化されたデュアルインデックス付き断片を増幅する方法には、ブリッジ増幅および速度論的排除が含まれるが、これらに限定されない。配列決定の前に固定化および増幅する方法は、例えば、Bignellら(米国特許第8,053,192号)、Gundersonら(国際公開第2016/130704号)、Shenら(米国特許第8,895,249号)、およびPipenburgら(米国特許第9,309,502号)に記載されている。
プールされた試料を、配列決定のための調製で固定化することができる。配列決定を単一分子のアレイとして実行することができ、または配列決定の前に増幅することもできる。増幅は、1つ以上の固定化プライマーを使用して実行することができる。固定化されたプライマー(または固定化された複数プライマー)は、例えば、平面上のローン、またはビーズのプール上のローンであることができる。ビーズのプールを、エマルジョンの各「区画」に単一のビーズがあるエマルジョン中に単離することができる。「区画」ごとに1つの鋳型のみの濃度では、各ビーズで1つの鋳型のみが増幅される。
本明細書で使用される「固相増幅」という用語は、増幅産物のすべてまたは一部が形成されるときに固体支持体上に固定されるように、固体支持体上または固体支持体とともに行われる任意の核酸増幅反応を指す。特に、この用語は、フォワード増幅プライマーおよびリバース増幅プライマーの一方または両方が固体支持体上に固定されていることを除き、標準液相増幅に類似した反応である固相ポリメラーゼ連鎖反応(固相PCR)および固相等温増幅を包含する。固相PCRは、一方のプライマーがビーズに固定され、他方が遊離溶解状態であるエマルジョンなどの系、および1つのプライマーが表面に固定され、1つのプライマーが遊離溶解状態である固相ゲルマトリックスにおけるコロニー形成を包含する。
いくつかの態様では、固体支持体はパターン化表面を含む。「パターン化表面」とは、固体支持体の露出層の中または上の異なる領域の配置を指す。例えば、1つ以上の領域は、1つ以上の増幅プライマーが存在するフィーチャであることができる。フィーチャは、増幅プライマーが存在しない間隙領域によって分離することができる。いくつかの態様において、パターンは、行および列にあるフィーチャのx‐y形式であることができる。いくつかの態様では、パターンは、フィーチャおよび/または間隙領域の繰り返し配置であることができる。いくつかの態様では、パターンは、フィーチャおよび/または間隙領域のランダムな配置であることができる。本明細書に記載の方法および組成物で使用することができる例示的なパターン化表面は、米国特許第5,047,029号、同第8,778,848号、同第8,778,849号および同第9,079,148号、ならびに米国特許出願公開第2014/0243224号に記載されている。
いくつかの態様において、固体支持体は、表面にウェルまたはくぼみのアレイを含む。これは、フォトリソグラフィ、スタンピング技術、成形技術、およびマイクロエッチング技術を含むがこれらに限定されないさまざまな技術を使用して、当技術分野で一般的に知られている要領で製造されてもよい。当業者によって理解されるように、使用される技術は、アレイ基板の組成および形状により異なることになる。
パターン化表面におけるフィーチャは、ポリ(N−(5−アジドアセトアミジルペンチル)アクリルアミド−コ−アクリルアミド)(PAZAM、例えば、米国特許出願公開第2013/184796号、国際公開第2016/066586号、および国際公開第2015/002813号参照)などのパターン化された共有結合ゲルを備えたガラス、シリコン、プラスチックまたは他の適切な固体支持体上のウェルのアレイにおけるウェル(例、マイクロウェルまたはナノウェル)であることができる。このプロセスにより、多数のサイクルでの配列決定の実行プロセス全体において安定状態であることができる、配列決定に使用されるゲルパッドが作製される。ポリマーのウェルへの共有結合は、さまざまな用途の間、構造化された基板の寿命全体を通してゲルを構造化されたフィーチャに維持するのに有用である。しかしながら、多くの態様において、ゲルはウェルに共有結合する必要はない。例えば、いくつかの条件では、構造化基板のどの部分にも共有結合していないシラン不含有アクリルアミド(SFA、例えば、米国特許第8,563,477号を参照)をゲル材料として使用することができる。
特定の態様において、構造化基板は、固体支持体材料をウェル(例えば、マイクロウェルまたはナノウェル)でパターン化し、パターン化した支持体をゲル材料(例えば、PAZAM、SFA、またはその化学的修飾バリアント、例えばSFAのアジド化型(アジド−SFA))でコーティングし、およびゲルコーティングされた支持体を、例えば化学研磨または機械研磨により研磨することにより作製することができ、その結果、ウェル内にゲルを保持するが、ウェル間の構造化基板の表面の間隙領域から実質的にすべてのゲルを除去または不活化することができる。プライマー核酸を、ゲル材料に付着させることができる。次いで、個々のインデックス付けされた断片がゲル材料に付着したプライマーとの相互作用を介して個々のウェルに播種するように、インデックス付けされた断片の溶液を研磨した基板と接触させることができる;ただし、ゲル材料が存在しないか不活性であるため、標的核酸が間隙領域を占有することはない。間隙領域におけるゲルの不在または不活性は、成長中の核酸コロニーの外向きの移動を防ぐため、インデックス付き断片の増幅はウェルに限定されることになる。このプロセスは、拡大縮小可能であり、従来のマイクロまたはナノファブリケーション手法を利用して、好都合に製造することができる。
本開示は、1つの増幅プライマーのみが固定化される「固相」増幅方法を包含するが(他のプライマーは通常、遊離溶解状態で存在する)、一態様では、固体支持体には固定化されたフォワードプライマーおよびリバースプライマーの両方が提供されることが好ましい。実際には、増幅プロセスは増幅を維持するために過剰のプライマーを必要とするため、固体支持体に固定化された「複数」の同一のフォワードプライマーおよび/または「複数」の同一のリバースプライマーが存在することになる。本明細書においてフォワードプライマーおよびリバースプライマーと言う場合、文脈がそうでないことを示さない限り、「複数」のかかるプライマーを包含するものとして適宜解釈されるべきである。
当業者が理解するところによると、所定の増幅反応は、いずれも増幅される鋳型に特異的な少なくとも1タイプのフォワードプライマーと少なくとも1タイプのリバースプライマーとを必要とする。しかしながら、特定の態様において、フォワードプライマーおよびリバースプライマーは、同一配列の鋳型特異的部分を含んでもよく、完全に同一のヌクレオチド配列および構造(任意の非ヌクレオチド修飾を含む)を有していてもよい。言い換えれば、1タイプのプライマーのみを使用して固相増幅を実行することが可能であり、かかる単一プライマー法は本開示の範囲内に含まれる。他の態様は、同一の鋳型特異的配列を含むが、いくつかの他の構造的特徴が異なるフォワードプライマーおよびリバースプライマーを使用してもよい。例えば、あるタイプのプライマーは、他には存在しない非ヌクレオチド修飾を含んでいてもよい。
本開示のすべての態様において、固相増幅のためのプライマーは、好ましくは、プライマーの5’末端またはその付近での固体支持体への一点共有結合により固定化され、プライマーの鋳型特異的部分については自由にその同系鋳型とアニーリングさせ、3’ヒドロキシル基についてはプライマー伸長に向けて自由にしておく。当業界で既知の任意の適切な共有結合手段が、この目的のために使用されてもよい。選択される結合化学は、固体支持体の性質、およびそれに適用される任意の誘導体化または官能化により異なることになる。プライマー自体は、結合を促進するために、非ヌクレオチド化学修飾であってもよい部分を含んでもよい。特定の態様において、プライマーは、ホスホロチオエートまたはチオホスフェートなどの硫黄含有求核基を5’末端に含んでいてもよい。固体支持ポリアクリルアミドヒドロゲルの場合、この求核基はヒドロゲルに存在するブロモアセトアミド基に結合することになる。プライマーおよび鋳型を固体支持体に結合させるより具体的な手段は、国際公開第05/065814号に記載されているように、重合アクリルアミドおよびN−(5−ブロモアセトアミジルペンチル)アクリルアミド(BRAPA)からなるヒドロゲルへの5’ホスホロチオエート結合によるものである。
本開示の特定の態様は、例えば、ポリヌクレオチドなど、生体分子への共有結合を可能にする反応基を含む中間材料の層またはコーティングの適用によって「官能化」された不活性基板またはマトリックス(例えば、ガラススライド、ポリマービーズなど)を含む固体支持体を利用してもよい。かかる支持体の例には、ガラスなどの不活性基板上で支持されたポリアクリルアミドヒドロゲルが含まれるが、これらに限定されない。そのような態様では、生体分子(例えば、ポリヌクレオチド)は、中間材料(例えば、ヒドロゲル)に直接共有結合されてもよいが、中間材料自体は、基板またはマトリックス(例えば、ガラス基板)に非共有結合されてもよい。「固体支持体への共有結合」という用語は、このタイプの配置を包含するものとして適宜解釈されるものとする。
プールされた試料は、各ビーズがフォワード増幅プライマーおよびリバース増幅プライマーを含んでいるビーズ上で増幅されてもよい。特定の態様では、固相増幅、より具体的には固相等温増幅による、米国特許出願公開第2005/0100900号、米国特許第7,115,400号、国際公開第00/18957号および国際公開第98/44151号に記載されているものと同様に、インデックス付き断片のライブラリーを使用して核酸コロニーのクラスター化されたアレイを調製する。「クラスター」および「コロニー」という用語は、複数の同一の固定化核酸鎖および複数の同一の固定化相補核酸鎖を含む固体支持体上の別個の部位を指すために本明細書では互換的に使用される。「クラスター化されたアレイ」という用語は、かかるクラスターまたはコロニーから形成されたアレイを指す。この文脈において、「アレイ」という用語は、クラスターの規則正しい配置を必要とするものとして理解されるべきではない。
「固相」または「表面」という用語は、プライマーを、平らな表面、例えばガラス、シリカもしくはプラスチックの顕微鏡スライドまたは同様のフローセル装置に付着させている平面アレイ;1つまたは2つのプライマーをビーズに付着させ、そのビーズを増幅させる場合のビーズ;または、ビーズが増幅された後の表面上のビーズのアレイを意味するために使用される。
クラスター化されたアレイは、国際公開第98/44151号に記載されている、温度サイクリングのプロセス、または温度を一定に維持し、試薬の変更を使用して伸長と変性のサイクルを実行するプロセスのいずれかを使用して調製することができる。上記の等温増幅法は、国際公開第02/46456号および米国特許出願公開第2008/0009420号に記載されている。等温プロセスではより低温が有用であるため、これはいくつかの態様において特に好ましい。
本明細書に記載または当技術分野で一般的に知られている増幅方法論のいずれかを、ユニバーサルプライマーまたは標的特異的プライマーと共に使用して、固定化DNA断片を増幅してもよいことが理解されよう。増幅に適した方法には、米国特許第8,003,354号に記載されているように、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写増幅(TMA)および核酸配列に基づく増幅(NASBA)が含まれるが、これらに限定されない。上記の増幅方法を使用して、興味の対象である1つ以上の核酸を増幅してもよい。例えば、マルチプレックスPCRを含むPCR、SDA、TMA、NASBAなどを利用して、固定化DNA断片を増幅してもよい。いくつかの態様では、興味の対象であるポリヌクレオチドに特異的に向けられたプライマーが増幅反応に含まれる。
ポリヌクレオチドの増幅に適した他の方法は、オリゴヌクレオチド伸長およびライゲーション、ローリングサークル増幅(RCA)(Lizardiら、Nat.Genet.19:225−232(1998))およびオリゴヌクレオチドライゲーションアッセイ(OLA)(包括的には米国特許第7,582,420号、同第5,185,243号、同第5,679,524号および同第5,573,907号、欧州特許第0 320 308 B1号、欧州特許第0 336 731 B1号、欧州特許第0 439 182 B1号、国際公開第90/01069号、国際公開第89/12696号、および国際公開第89/09835号参照)技術を含んでいてもよい。これらの増幅方法論は、固定化されたDNA断片を増幅するように設計されてもよいことが理解されよう。例えば、いくつかの態様では、増幅方法は、興味の対象である核酸に特異的に向けられたプライマーを含むライゲーションプローブ増幅反応またはオリゴヌクレオチドライゲーションアッセイ(OLA)反応を含んでもよい。いくつかの態様において、増幅方法は、興味の対象である核酸に特異的に向けられたプライマーを含むプライマー伸長−ライゲーション反応を含んでいてもよい。興味の対象である核酸を増幅するように特別に設計されてもよいプライマー伸長およびライゲーションプライマーの非限定例として、増幅は米国特許第7,582,420号および同第7,611,869号により具体的に示されているGoldenGateアッセイ(Illumina、Inc., San Diego、CA)に使用されるプライマーを含んでいてもよい。
DNAナノボールは、本明細書に記載の方法および組成物と組み合わせて使用することもできる。ゲノム配列決定のためのDNAナノボールの作製および利用方法は、例えば、米国特許および出版物、米国特許第7,910,354号、米国特許出願公開第2009/0264299号、同第2009/0011943号、同第2009/0005252号、同第2009/0155781号、同第2009/0118488号で見出すことができ、また例えば、Drmanacら、2010、Science 327(5961):78−81に記載されている。簡単に述べると、ゲノムライブラリーDNA断片化アダプターを断片にライゲーションした後、アダプターライゲーション断片をサークルリガーゼとのライゲーションにより環状化し、ローリングサークル増幅を実施する(Lizardiら、1998、Nat.Genet.19:225−232および米国特許出願公開第2007/0099208 A1号)。アンプリコンの伸長されたコンカテマー構造は、コイル形成を促進し、それによってコンパクトなDNAナノボールを作製する。DNAナノボールは基板上で捕捉され、好ましくは、各ナノボール間の距離が維持され、それにより別個のDNAナノボールの配列決定を可能にするように、規則的またはパターン化されたアレイを作製することができる。Complete Genomics(Mountain View、CA)で使用されるものなどのいくつかの態様では、アダプター配列によって分離されたいくつかのゲノムDNA断片を有する頭−尾構築物を製造するために、環状化の前にアダプターライゲーション、増幅、および消化の連続ラウンドが実行される。
本開示の方法において使用されてもよい例示的な等温増幅法には、例えば、Deanら、Proc.Natl.Acad.Sci.USA 99:5261−66(2002)によって具体的に示された多置換増幅(MDA)または、例えば米国特許第6,214,587号により具体的に示された等温鎖置換核酸増幅が含まれるが、これらに限定されない。本開示において使用されてもよい他の非PCRベースの方法には、例えば、Walkerら、Molecular Methods for Virus Detection,Academic Press,Inc.,1995;米国特許第5,455,166号および第5,130,238号、およびWalkerら、Nucl.Acids Res.20:1691−96(1992)に記載されている鎖置換増幅(SDA)または、例えばLageら、Genome Res.13:294−307(2003)に記載されている超分岐鎖置換増幅が含まれる。等温増幅法は、ゲノムDNAのランダムプライマー増幅のために、例えば、鎖置換性Phi 29ポリメラーゼまたはBst DNAポリメラーゼの大きな断片、5’−>3’exo−で使用されてもよい。これらのポリメラーゼの使用は、それらの高い処理能力と鎖置換活性を活用するものである。高い処理能力により、ポリメラーゼは長さが10〜20kbの断片を製造することができる。上記のように、クレノウポリメラーゼなどの低い処理能力および鎖置換活性を有するポリメラーゼを使用して、等温条件下でより小さな断片を製造してもよい。増幅反応、条件および構成要素のさらなる説明は、米国特許第7,670,810号の開示で詳細に記載されている。
本開示において有用なである別のポリヌクレオチド増幅方法は、例えばGrothuesら、Nucleic Acids Res.21(5):1321−2(1993)に記載されているように、定常5’領域とそれに続くランダム3’領域を有する2ドメインプライマーの集団を使用するタグ付きPCRである。ランダムに合成された3’領域からの個々のハイブリダイゼーションに基づいた熱変性DNAでの多数の開始を可能にするために、増幅の最初のラウンドを実行する。3’領域の性質により、開始部位はゲノム全体を通してランダムであると考えられている。その後、非結合プライマーを除去してもよく、定常5’領域に相補的なプライマーを使用してさらなる複製を行ってもよい。
いくつかの態様において、等温増幅は、排除増幅(ExAmp)とも呼ばれる速度論的排除増幅(KEA)を使用して実行することができる。本開示の核酸ライブラリーは、増幅試薬を反応させて、増幅部位に播種した個々の標的核酸からのアンプリコンの実質的クローン集団をそれぞれ含む複数の増幅部位を生成する段階を含む方法を使用して作製することができる。いくつかの態様において、増幅反応は、それぞれの増幅部位の容量を満たすのに十分な数のアンプリコンが生成されるまで進行する。かくしてすでに播種された部位を容量まで満たすことにより、標的核酸がその部位に着地して増幅するのが抑制され、それによりその部位にアンプリコンのクローン集団が生成される。いくつかの態様では、増幅部位が第2の標的核酸がその部位に達する前に容量まで満たされていなくても、明らかなクローン性を達成することができる。ある条件下では、第1の標的核酸の増幅は、その部位に輸送される第2の標的核酸からのコピーの生産を効果的に打ち負かすかまたは圧倒するために十分な数のコピーが作られる点まで進むことができる。例えば、直径が500nmより小さい円形フィーチャでブリッジ増幅プロセスを使用する態様では、第1の標的核酸についての14サイクルの指数関数的増幅の後、同じ部位での第2の標的核酸からの汚染により、不十分な数の汚染性アンプリコンが生じ、Illuminaの配列決定プラットフォームでの合成による配列決定に悪影響を及ぼすことになると判定された。
いくつかの態様では、アレイ内の増幅部位は、完全にクローンであることができるが、そうである必要はない。どちらかと言えば、用途によっては、個々の増幅部位を、第1のインデックス付けされた断片からのアンプリコンが主に占めることができ、また、個々の増幅部位が第2の標的核酸からの低レベルの汚染性アンプリコンを有することもできる。アレイは、汚染のレベルがアレイの後続使用に許容できない影響を与えるものでない限り、低レベルの汚染性アンプリコンを有する1つ以上の増幅部位を有することができる。例えば、検出アプリケーションでアレイを使用することになる場合、許容できる汚染レベルは、許容できない方法で検出技術の信号対ノイズまたは解像度に影響を与えることのないレベルとなる。したがって、明らかなクローン性は、一般に、本明細書に記載された方法によって作製されたアレイの特定の使用または用途に関連したものになる。特定の用途のために個々の増幅部位で許容可能であることができる汚染の例示的なレベルには、最大で0.1%、0.5%、1%、5%、10%または25%の汚染性アンプリコンが含まれるが、これらに限定されない。アレイは、これらの例示的なレベルの汚染性アンプリコンを有する1つ以上の増幅部位を含むことができる。例えば、アレイにおける最大5%、10%、25%、50%、75%、または100%の増幅部位でも、ある程度の汚染性アンプリコンを有することができる。部位のアレイまたは他の集合体では、部位の少なくとも50%、75%、80%、85%、90%、95%または99%以上がクローン性または明らかなクローン性であることができると理解されよう。
いくつかの態様において、別の事象またはプロセスの発生を効果的に排除するのに十分に速い速度でプロセスが行われる場合、速度論的排除が起こることができる。例えば、アレイの部位に溶液からのインデックス付き断片をランダムに播種し、増幅プロセスでインデックス付き断片のコピーを生成して、播種された各部位を最大容量まで満たす核酸アレイの作製を考える。本開示の速度論的排除方法によると、播種および増幅プロセスは、増幅速度が播種速度を超える条件下で同時に進行することができる。したがって、第1の標的核酸によって播種された部位でコピーが生成される比較的速い速度により、増幅のために該部位に播種することから第2の核酸が効果的に排除されることになる。速度論的排除増幅法は、米国特許出願公開第2013/0338042号の開示で詳細に記載された要領で実行することができる。
速度論的排除は、インデックス付き断片の(またはインデックス付き断片の最初のコピーの)後続のコピーを生成する比較的速い速度に対する増幅を開始するための比較的遅い速度(例、インデックス付き断片の最初のコピーを生成する遅い速度)を最大限に利用することができる。前の段落の例では、播種されたインデックス付き断片のコピーで部位を満たすために増幅が行われる比較的速い速度に対しインデックス付き断片播種の速度が比較的遅いため(例:拡散または輸送が比較的遅い)、速度論的排除が発生する。別の具体的な態様では、部位を播種したインデックス付き断片の最初のコピーの形成が、後続のコピーが部位を満たすために生成される比較的速い速度に対し遅れをとる(例えば、遅延しているかまたは緩慢な活性化)ため、速度論的排除が起こることができる。この例では、個々の部位にいくつかの異なるインデックス付き断片が播種されてもよい(例、増幅前に各部位にいくつかのインデックス付き断片が存在することができる)。しかしながら、最初のコピー形成の平均速度が、後続のコピーが生成される速度と比較して比較的遅くなるように、いかなる所定のインデックス付き断片であっても最初のコピー形成をランダムに活性化することができる。この場合、個々の部位にいくつかの異なるインデックス付き断片が播種されていてもよいが、速度論的排除により、インデックス付き断片のうちの1つのみを増幅できることになる。より具体的には、増幅のために最初のインデックス付き断片が活性化されると、該部位はそのコピーで最大容量まで急速に満たされ、それによって該部位で第2のインデックス付き断片のコピーが生成されなくなる。
一態様において、本方法は、(i)インデックス付き断片を平均輸送速度で増幅部位に輸送し、同時に(ii)増幅部位にあるインデックス付き断片を平均増幅速度で増幅させるために実行されるが、ここで平均増幅速度は平均輸送速度を超えているものとする(米国特許第9,169,513号)。したがって、かかる態様では、比較的遅い輸送速度を使用することにより、速度論的排除を達成することができる。たとえば、インデックス付き断片の十分に低い濃度を選択して、望ましい平均輸送速度を達成し、濃度を低くすると平均輸送速度が遅くなる。別法として、または追加的に、高粘度溶液および/または溶液中の分子クラウディング試薬の存在を使用して、輸送速度を低下させることができる。有用な分子クラウディング試薬の例には、ポリエチレングリコール(PEG)、フィコール、デキストラン、またはポリビニルアルコールが含まれるが、これらに限定されない。例示的な分子クラウディング試薬および製剤は、米国特許第7,399,590号に記載されており、これは参照により本明細書に組み込まれる。所望の輸送速度を達成するために調整できる別の要因は、標的核酸の平均サイズである。
増幅試薬は、アンプリコンの形成を促進し、場合によってはアンプリコンの形成速度を高めるさらなる成分を含むことができる。一例はリコンビナーゼである。リコンビナーゼは、繰り返される侵入/伸長を可能にすることにより、アンプリコンの形成を促進することができる。より具体的には、リコンビナーゼは、ポリメラーゼによるインデックス付き断片の侵入およびアンプリコン形成の鋳型としてインデックス付き断片を使用するポリメラーゼによるプライマーの伸長を促進することができる。このプロセスは、各ラウンドの侵入/伸長から生成されたアンプリコンが後続のラウンドにおける鋳型としての役割を果たす連鎖反応として繰り返すことができる。このプロセスについては、変性サイクル(例、加熱または化学変性による)が必要ないため、標準のPCRよりも迅速に行うことができる。したがって、リコンビナーゼにより促進される増幅を、等温的に実行することができる。増幅を促進するために、リコンビナーゼ促進増幅試薬にATPまたは他のヌクレオチド(または場合によってはその非加水分解性類似体)を含めることが一般に望ましい。リコンビナーゼと一本鎖結合(SSB)タンパク質の混合物は、SSBが増幅をさらに促進することができるため、特に有用である。具体例としてのリコンビナーゼ促進増幅用製剤には、TwistDx(英国ケンブリッジ)によりTwistAmpキットとして市販されているものが含まれる。リコンビナーゼ促進増幅試薬の有用な成分および反応条件は、米国特許第5,223,414号および米国特許第7,399,590号に記載されている。
アンプリコンの形成を促進し、場合によってはアンプリコンの形成速度を高めるために増幅試薬に含めることができる成分の別の例は、ヘリカーゼである。ヘリカーゼは、アンプリコン形成の連鎖反応を行わせることにより、アンプリコン形成を促進することができる。このプロセスについては、変性サイクル(例、加熱または化学変性による)が必要ないため、標準のPCRよりも迅速に行うことができる。したがって、ヘリカーゼにより促進される増幅を等温的に実行することができる。ヘリカーゼと一本鎖結合(SSB)タンパク質の混合物は、SSBが増幅をさらに促進することができるため、特に有用である。具体例としてのヘリカーゼ促進増幅用製剤には、Biohelix(マサチューセッツ州ビバリー)からIsoAmpキットとして市販されているものが含まれる。さらに、ヘリカーゼタンパク質を含む有用な製剤の例は、米国特許第7,399,590号および米国特許第7,829,284号に記載されている。
アンプリコン形成を促進し、場合によってはアンプリコン形成速度を高めるために増幅試薬に含めることができる成分のさらに別の例は、複製起点結合タンパク質である。
配列決定での使用/配列決定の方法
インデックス付き断片の表面への付着に続いて、固定化され、増幅されたインデックス付き断片の配列が決定される。配列決定は、任意の適切な配列決定技術を使用して実行することができ、鎖の再合成を含む固定化および増幅されたインデックス付き断片の配列を決定する方法は、当技術分野で既知であり、例えば、Bignellら(米国特許第8,053,192号)、Gundersonら(国際公開第2016/130704号)、Shenら(米国特許第8,895,249号)、およびPipenburgら(米国特許第9,309,502号)に記載されている。
本明細書に記載の方法は、さまざまな核酸配列決定技術と組み合わせて使用することができる。特に適用可能な技術は、核酸の相対的な位置が変化しないように核酸がアレイ内の固定位置に付着されており、アレイが繰り返し画像化されるものである。例えば、あるヌクレオチド塩基型を別のヌクレオチド塩基型と区別するために使用される異なる標識と一致するなど、画像が異なる色チャネルで取得される態様が特に適用可能である。いくつかの態様において、インデックス付き断片のヌクレオチド配列を決定するプロセスは、自動化されたプロセスであることができる。好ましい態様は、合成による配列決定(「SBS」)技術を含む。
SBS技術は、一般的に、鋳型鎖に対するヌクレオチドの反復的付加を介した新生核酸鎖の酵素的伸長を伴う。SBSの従来の方法では、各送達においてポリメラーゼの存在下で、標的ヌクレオチドに単一のヌクレオチド単量体が提供されてもよい。しかしながら、本明細書に記載の方法では、送達中のポリメラーゼの存在下で複数のタイプのヌクレオチド単量体を標的核酸に提供することができる。
一態様では、ヌクレオチド単量体は、ロックされた核酸(LNA)または架橋核酸(BNA)を含む。ヌクレオチド単量体にLNAまたはBNAを使用すると、ヌクレオチド単量体と固定化インデックス付き断片上に存在する配列決定プライマー配列との間におけるハイブリダイゼーション強度が増加する。
SBSは、ターミネータ部分を有するヌクレオチド単量体またはターミネータ部分を欠くヌクレオチド単量体を使用することができる。ターミネータを欠くヌクレオチド単量体を使用する方法には、例えば、本明細書でさらに詳細に述べるように、パイロシークエンシング法およびγ−リン酸標識ヌクレオチドを使用する配列決定法が含まれる。ターミネータを欠くヌクレオチド単量体を使用する方法では、各サイクルで追加されるヌクレオチドの数は一般に可変であり、鋳型配列およびヌクレオチド送達方式によって異なる。ターミネータ部分を有するヌクレオチド単量体を利用するSBS技術の場合、ジデオキシヌクレオチドを利用する従来のサンガー配列決定法の場合と同様に、ターミネータは使用される配列決定条件下で効果的に不可逆的であることができ、またはターミネータは、Solexa(現Illumina、Inc.)によって開発された配列決定方法の場合のように可逆的であることができる。
SBS技術は、標識部分を有するヌクレオチド単量体または標識部分を欠くヌクレオチド単量体を使用することができる。したがって、取り込み事象は、標識の蛍光などの標識の特徴;分子量や電荷などのヌクレオチド単量体の特徴;ピロリン酸の放出などのヌクレオチドの取り込みの副産物などに基づいて検出することができる。配列決定試薬中に2つ以上の異なるヌクレオチドが存在する態様では、異なるヌクレオチドは互いに区別可能であることができ、または別法として、2つ以上の異なる標識は、使用されている検出技術の下で区別不可能であることができる。例えば、配列決定試薬に存在する異なるヌクレオチドは異なる標識を有することができ、それらは、Solexa(現Illumina,Inc.)により開発された配列決定方法により実証される適切な光学を使用して区別することができる。
好ましい態様は、パイロシークエンシング技術を含む。パイロシークエンシングは、特定のヌクレオチドが新生鎖に組み込まれるときに無機ピロリン酸(PPi)の放出を検出する(Ronaghi、M., Karamohamed、S., Pettersson、B., Uhlen、M.およびNyren、P.(1996)“Real−time DNA sequencing using detection of pyrophosphate release.”Analytical Biochemistry 242(1)、84−9;Ronaghi、M.(2001)“Pyrosequencing sheds light on DNA sequencing.”Genome Res.11(1)、3−11;Ronaghi、M., Uhlen、M.およびNyren、P.(1998)“A sequencing method based on real−time pyrophosphate.”Science 281(5375)、363;米国特許第6,210,891号;第6,258,568号および第6,274,320号)。パイロシークエンシングでは、放出されたPPiを、ATPスルフリラーゼ(sulfurase)によってアデノシン三リン酸(ATP)に直ちに変換されることにより検出することができ、ルシフェラーゼが生じさせた光子を介して生成されたATPのレベルが検出される。配列決定される核酸をアレイにおけるフィーチャに付着させることができ、該アレイを画像化して、アレイのフィーチャでのヌクレオチドの取り込みにより生成される化学発光シグナルを捉えることができる。アレイを特定のヌクレオチドタイプ(例、A、T、CまたはG)で処理した後、画像を取得することができる。各ヌクレオチドタイプの追加後に得られる画像は、アレイにおけるどのフィーチャが検出されるかに関して異なることになる。画像のこれらの違いは、アレイ上のフィーチャの異なる配列内容を反映している。しかしながら、各フィーチャの相対位置は、画像内で変更されないままとなる。本明細書に記載の方法を使用して、画像を保存、処理、および分析することができる。例えば、それぞれの異なるヌクレオチドタイプでアレイを処理した後に得られる画像は、可逆的ターミネータに基づく配列決定法のための異なる検出チャネルから得られる画像について本明細書で実証されているのと同じ方法で扱うことができる。
別の典型的なタイプのSBSでは、サイクル配列決定は、例えば国際公開第04/018497号および米国特許第7,057,026号に記載されている、例えば開裂可能または光漂白可能な色素標識を含む可逆的ターミネータヌクレオチドの段階的添加によって達成される。このアプローチは、Solexa(現Illumina Inc.)によって商品化されており、国際公開第91/06678号および国際公開第07/123,744号にも記載されている。終結を逆転させることができ、蛍光標識を切断することができる蛍光標識ターミネータが利用可能であるため、効率的な周期的可逆的終結(CRT)配列決定が容易になる。また、ポリメラーゼにも共に操作を加えることにより、これらの修飾されたヌクレオチドを効率的に取り込ませ、そこから伸長させることができる。
いくつかの可逆的ターミネータに基づく配列決定の態様では、標識がSBS反応条件下での伸長を実質的に阻害することはない。しかしながら、検出標識は、例えば、切断または分解により除去可能であることができる。アレイ化された核酸フィーチャに標識を組み込んだ後、画像を捉えることができる。特定の態様において、各サイクルは、4つの異なるヌクレオチドタイプのアレイへの同時送達を含み、各ヌクレオチドタイプはスペクトルが異なる標識を有する。次いで、4つの異なる標識のいずれかを選択する検出チャネルをそれぞれ使用して、4つの画像を取得することができる。別法として、異なるヌクレオチドタイプを連続して付加することができ、各追加段階の間にアレイの画像を取得することができる。かかる態様では、各画像は、特定のタイプのヌクレオチドが組み込まれた核酸フィーチャを示すことになる。各フィーチャの配列内容が異なるため、異なる画像には異なるフィーチャが存在するか、または存在しないことになる。しかしながら、画像内のフィーチャの相対位置が変更されることはない。上記の可逆的ターミネータ−SBS法から得られた画像は、本明細書に記載されるように保存、処理、および分析することができる。画像取り込み段階に続いて、ヌクレオチドの追加と検出の後続サイクルのために、標識を除去することができ、可逆的ターミネータ部分を除去することができる。特定のサイクルで標識が検出された後、後続サイクルの前に標識を削除すると、バックグラウンドシグナルとサイクル間のクロストークを削減できるという利点を提供することができる。有用な標識および除去方法の例は、本明細書に記載されている。
特定の態様では、ヌクレオチド単量体の一部またはすべてが可逆的ターミネータを含むことができる。かかる態様では、可逆的ターミネータ/開裂可能な発蛍光団は、3’エステル結合を介してリボース部分に連結された発蛍光団を含むことができる(Metzker、Genome Res.15:1767−1776(2005))。他のアプローチは、ターミネータの化学的性質を蛍光標識の切断から分離した(Ruparelら、Proc Natl Acad Sci USA 102:5932−7(2005))。Ruparelらは、小さな3’アリル基を使用して伸長をブロックする可逆的ターミネータの開発について説明したが、パラジウム触媒で短時間処理することにより簡単にブロック解除できる。発蛍光団は、長波長UV光への30秒の曝露により容易に開裂させることができる光開裂可能なリンカーを介して基部に結合された。したがって、ジスルフィド還元または光開裂のいずれかを開裂可能なリンカーとして使用することができる。可逆的終結への別のアプローチは、dNTPにかさ高い色素を配置した後に起こる自然終結の使用である。dNTP上の帯電したかさ高い色素の存在は、立体障害および/または静電障害を通して効果的なターミネータとして作用することができる。1つの取り込み事象が存在すると、色素が除去されない限り、さらなる取り込みができなくなる。色素の切断により、発蛍光団が除去され、効果的に終結が逆転する。修飾されたヌクレオチドの例は、米国特許第7,427,673号、および第7,057,026号にも記載されている。
本明細書に記載の方法およびシステムと共に利用できる追加の具体的なSBSシステムおよび方法は、米国特許出願公開第2007/0166705号、第2006/0188901号、第2006/0240439号、第2006/0281109号、第2012/0270305号、および第2013/0260372号、米国特許第7,057,026号、PCT国際公開第05/065814号、米国特許出願公開第2005/0100900号、ならびにPCT国際公開第06/064199号および第07/010,251号に記載されている。
いくつかの態様は、4つ未満の異なる標識を使用する4つの異なるヌクレオチドの検出を使用することができる。例えば、SBSは、米国特許出願公開第2013/0079232号の組み込まれた資料に記載されている方法とシステムを使用して実行することができる。最初の例として、ヌクレオチドタイプのペアは同じ波長で検出できるが、ペアの一方の構成員と他方の構成員の強度の差、またはペアのもう一方の構成員で検出されたシグナルと比較した場合に見かけのシグナルの出現または消失を誘発する、ペアの一方の構成員の(例、化学修飾、光化学修飾、または物理修飾による)変化に基づいて区別することができる。第2の例として、特定の条件下では4つの異なるヌクレオチドタイプのうち3つを検出できるが、第4のヌクレオチドタイプには、それらの条件下で検出可能な標識が欠けているか、それらの条件下では最小限の検出となる(バックグラウンド蛍光による最小限の検出など)。最初の3つのヌクレオチドタイプの核酸への組み込みについては、それぞれのシグナルの存在に基づいて決定することができ、第4のヌクレオチドタイプの核酸への組み込みについては、シグナルの欠如または最小限の検出に基づいて決定することができる。第3の例として、1つのヌクレオチドタイプには2つの異なるチャネルで検出される標識(複数も可)を含めることができるが、他のヌクレオチドタイプは1つのチャネルでしか検出されない。上述の3つの例示的な構成は、相互に排他的とは見なされず、様々な組み合わせで使用することができる。3つすべての例を組み合わせた具体例としての態様は、第1のチャネルで検出される第1のヌクレオチドタイプ(例えば、第1の励起波長により励起されたときに第1のチャネルで検出される標識を有するdATP)、第2チャネルで検出される第2ヌクレオチドタイプ(例えば、第2励起波長により励起されたときに第2チャネルで検出される標識を有するdCTP)、第1および第2の両チャネルで検出される第3ヌクレオチドタイプ(例えば、第1および/または第2の励起波長により励起されたときに両方のチャネルで検出される少なくとも1つの標識を有するdTTP)およびいずれかのチャネルで検出されない、または最小限検出される標識を欠く第4のヌクレオチドタイプ(例えば、標識を有しないdGTP)を使用する蛍光に基づくのSBS法である。
さらに、米国特許出願公開第2013/0079232号の組み込まれた資料に記載されているところによると、単一のチャネルを使用して配列決定データを取得することができる。このようないわゆる1色素配列決定アプローチでは、第1のヌクレオチドタイプは標識されるが、最初の画像が生成された後に標識は削除され、第2のヌクレオチドタイプは最初の画像が生成された後にのみ標識される。第3のヌクレオチドタイプは、第1と第2の画像の両方でその標識を保持し、第4のヌクレオチドタイプは両方の画像で未標識のままである。
いくつかの態様は、ライゲーション技術による配列決定を使用することができる。かかる技術は、DNAリガーゼを使用してオリゴヌクレオチドを組み込み、かかるオリゴヌクレオチドの組み込みを識別する。オリゴヌクレオチドは、典型的にはオリゴヌクレオチドがハイブリダイズする配列内の特定のヌクレオチドの同一性と相関する異なる標識を有する。他のSBS方法の場合と同様に、標識された配列決定試薬で核酸フィーチャのアレイを処理した後、画像を取得することができる。各画像には、特定タイプの標識が組み込まれた核酸フィーチャが表示されることになる。各フィーチャの配列内容が異なるため、異なる画像には異なるフィーチャが存在するか、または存在しないことになるが、フィーチャの相対位置は画像内で未変化のままとなる。ライゲーションに基づく配列決定法から得られた画像は、本明細書に記載のように保存、処理、および分析することができる。本明細書に記載の方法およびシステムと共に利用できる例示的なSBSシステムおよび方法は、米国特許第6,969,488号、第6,172,218号、および第6,306,597号に記載されている。
いくつかの態様は、ナノポア配列決定法を使用することができる(Deamer, D. W. &Akeson, M. “Nanopores and nucleic acids:prospects for ultrarapid sequencing.”Trends Biotechnol.18、147-151(2000);Deamer, D. およびD. Branton, “Characterization of nucleic acids by nanopore analysis”, Acc. Chem. Res. 35:817−825(2002);Li, J., M. Gershow, D. Stein, E. Brandin and J. A. Golovchenko, “DNA molecules and configurations in a solid-state nanopore microscope” Nat. Mater. 2:611-615(2003))。かかる態様では、インデックス付き断片はナノポアを通過する。ナノポアは、合成ポアまたはα−ヘモリシンなどの生体膜タンパク質であることができる。インデックス付けされた断片がナノポアを通過する際、ポアの電気伝導度の変動を測定することにより、各塩基対を特定することができる。(米国特許第7,001,792号;Soni, G. V. &Meller, “A. Progress toward ultrafast DNA sequencing using solid-state nanopores.” Clin. Chem. 53, 1996-2001(2007);Healy, K. “Nanopore-based single-molecule DNA analysi.” Nanomed. 2, 459-481(2007);Cockroft, S. L., Chu, J., Amorin, M. &Ghadiri, M. R. “A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution.” J. Am. Chem. Soc. 130, 818-820(2008))。ナノポア配列決定法から得られたデータは、本明細書に記載されているように保存、処理、および分析することができる。特に、データは、本明細書に記載されている光学画像および他の画像の例示的な処理に従って画像として処理することができる。
いくつかの態様は、DNAポリメラーゼ活性の実時間モニタリングを含む方法を使用することができる。ヌクレオチドの組み込みは、例えば、米国特許第7,329,492号および第7,211,414号に記載されているように、発蛍光団担持ポリメラーゼとγ−リン酸標識ヌクレオチドとの間における蛍光共鳴エネルギー移動(FRET)相互作用を通じて検出することができ、またはヌクレオチドの組み込みは、例えば、米国特許第7,315,019号に記載されたゼロモード導波路で、例えば、米国特許番号7,405,281号および米国特許出願公開第2008/0108082号に記載された蛍光ヌクレオチド類似体および改変ポリメラーゼを用いて検出することができる。照明は、低バックグラウンドで蛍光標識ヌクレオチドの組み込みを観察できるように、表面につながれたポリメラーゼの周りのゼプトリットル規模の体積に制限することができる(Levene、M.J.ら、“Zero−mode waveguides for single−molecule analysis at high concentrations.”Science 299、682−686(2003);Lundquist、P.M.ら、“Parallel confocal detection of single molecules in real time.”Opt.Lett.33、1026−1028(2008);Korlach、J.ら、“Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero−mode waveguide nano structures.”Proc.Natl.Acad.Sci.USA 105、1176−1181(2008))。上記の方法から得られた画像は、本明細書に記載されるように保存、処理、および分析することができる。
いくつかのSBS態様は、伸長産物へのヌクレオチドの取り込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づく配列決定では、Ion Torrent(コネチカット州ギルフォードのLife Technologies子会社)から市販されている電気検出器および関連技術、または米国特許出願公開第2009/0026082号;第2009/0127589号;第2010/0137143号;および第2010/0282617号に記載された配列決定方法およびシステムを使用することができる。速度論的排除を使用して標的核酸を増幅するための本明細書に記載の方法は、プロトンの検出に使用される基板に容易に適用することができる。より具体的には、本明細書に記載の方法を使用して、プロトンを検出するために使用されるアンプリコンのクローン集団を製造することができる。
上記のSBS方法は、複数の異なるインデックス付き断片が同時に操作されるように、多重フォーマットで有利に実行することができる。特定の態様では、異なるインデックス付き断片を、共通の反応容器内または特定の基板の表面で処理することができる。これにより、配列決定試薬の好都合な送達、未反応試薬の除去、およびマルチプレックス方式での取り込み事象の検出が可能となる。表面結合標的核酸を使用する態様では、インデックス付き断片はアレイ形式であることができる。アレイ形式では、インデックス付き断片を、典型的には空間的に区別可能な方法で表面に結合させることができる。インデックス付き断片を、直接共有結合、ビーズもしくは他の粒子への付着、または表面に付着させたポリメラーゼもしくは他の分子への結合によって結合させることができる。アレイには、各部位(フィーチャとも呼ばれる)にインデックス付き断片の単一のコピーを含めることができ、または、同じ配列を有する複数のコピーを各部位またはフィーチャに存在させることができる。本明細書でさらに詳細に説明するように、ブリッジ増幅またはエマルジョンPCRなどの増幅方法によって複数のコピーを生成することができる。
本明細書に記載の方法は、例えば、少なくとも約10フィーチャ/cm2、100フィーチャ/cm2、500フィーチャ/cm2、1,000フィーチャ/cm2、5,000フィーチャ/cm2、10,000フィーチャ/cm2、50,000フィーチャ/cm2、100,000フィーチャ/cm2、1,000,000フィーチャ/cm2、5,000,000フィーチャ/cm2、またはそれ以上を含む様々な密度のいずれかのフィーチャを有するアレイを使用することができる。
本明細書に記載の方法の利点は、複数のcm2について並行して迅速かつ効率的に検出できることである。したがって、本開示は、本明細書に具体的に示されるものなどの当技術分野で既知の技術を使用して核酸を調製および検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬および/または配列決定試薬を1つ以上の固定化インデックス付き断片に送達できる流体構成要素を含むことができるもので、該システムは、ポンプ、バルブ、リザーバ、流体ラインなどの構成要素を含む。フローセルは、標的核酸の検出のための統合システムで構成および/または使用することができる。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768号および米国特許出願第13/273,666号に記載されている。フローセルについて実例を挙げると、統合システムの流体構成要素の1つ以上を増幅方法および検出方法に使用することができる。核酸配列決定の態様を例にとると、統合システムの流体構成要素の1つ以上は、本明細書に記載の増幅方法および上記に実例を示したものなどの配列決定方法における配列決定試薬の送達に使用することができる。別法として、統合システムは、増幅方法を実行し、検出方法を実行するための別個の流体システムを含むことができる。増幅された核酸を作製し、核酸の配列も決定できる統合配列決定システムの例には、限定される訳ではないが、MiSeqTMプラットフォーム(Illumina,Inc., サンディエゴ、CA)および米国特許出願第13/273,666号に記載された装置がある。
本明細書では、組成物も提供される。本明細書に記載の方法の実施中に、様々な組成物が生じることができる。例えば、新しく合成されたRNAに由来するものであるインデックス付きの核酸断片を含む組成物が生じることができる。一態様では、新しく合成されたRNAが標識される。また、マルチウェルプレートが提供され、マルチウェルプレートのウェルは、インデックス付きの核酸断片を含む。
本明細書ではキットも提供される。一態様において、キットは、新しく合成されたRNAが標識される配列決定ライブラリーを調製するためのものである。一態様では、キットは、本明細書に記載のヌクレオチド標識を含む。別の態様において、キットは、RNAにアニーリングするための1つ以上のプライマーを含み、少なくとも1つのプライマーは、1つ以上の所定の核酸の標的化された増幅用である。さらなる態様では、キットは、核酸に少なくとも3つのインデックスを付加するための構成要素を含む。キットには、配列決定ライブラリーの作製に有用な他の構成要素を含めることもできる。例えば、キットは、インデックスを含むようにRNA分子をプロセッシングするためのライゲーション、プライマー伸長、または増幅に介在する少なくとも1つの酵素を含むことができる。キットは、インデックス配列を伴う核酸を含むことができる。キットはまた、トランスポソーム複合体など、インデックスを核酸に付加するのに有用な他の構成要素を含むことができる。キットはまた、RNAにアニーリングするための1つ以上のプライマーを含むこともできる。プライマーは、全トランスクリプトームの生成用(例えば、ポリT配列を含むプライマー)または1つ以上の所定の核酸の標的化された増幅用であることができる。
キットの構成要素は、典型的には、少なくとも1つのアッセイまたは使用に十分な量の適切なパッケージ材料に入っている。場合によっては、緩衝液や溶液など、他の構成要素を含めることができる。典型的には、パッケージされた構成要素の使用説明書も含まれている。本明細書で使用される「パッケージ材料」という語句は、キットの内容物を収容するために使用される1つ以上の物理的構造を指す。パッケージ材料は、一般的に無菌で汚染物質のない環境を提供するために、常用方法で構築される。パッケージ材料には、構成要素を使用して配列決定ライブラリーを作製できることを示すラベルが付いていてもよい。さらに、パッケージ材料には、キット内の材料の使用方法を示す指示書が含まれている。本明細書で使用される「パッケージ」という用語は、キットの構成要素を一定の制限内に保持できるガラス、プラスチック、紙、ホイルなどの容器を指す。「使用説明書」には、典型的には、試薬濃度または混合する試薬と試料の相対量、試薬/試料混合物のメンテナンス期間、温度、緩衝液条件などの少なくとも1つのアッセイ法パラメータを説明する具体的な表現が含まれる。
例示的態様
態様1。複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
(a)複数の核または細胞を第1の複数の区画に提供すること(ここで、各区画は、核または細胞のサブセットを含む);
(b)細胞または前記細胞から得られた核のサブセットにおいて新しく合成されたRNAを標識すること;
(c)核または細胞の各サブセットのRNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること(ここで、前記プロセッシングは、核または細胞の各サブセットに存在するRNA核酸に第1の区画に固有のインデックス配列を付加して、インデックス付きの核または細胞に存在するインデックス付けされたDNA核酸をもたらし、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、または増幅を含む);および
(d)インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること
を含む方法。
態様2。前記プロセッシングが、
サブセットを逆転写酵素およびRNA核酸にアニーリングするプライマーと接触させることにより、前記プライマーおよび鋳型RNA分子の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生成させること
を含む、態様1の方法。
態様3。前記プライマーが、mRNAポリ(A)テイルにアニーリングするポリTヌクレオチド配列を含む、態様1または2の方法。
態様4。前記プロセッシングが、サブセットを第2のプライマーと接触させることをさらに含み、前記第2のプライマーが所定のDNA核酸にアニーリングする配列を含む、態様1〜3のいずれか1つの方法。
態様5。前記第2のプライマーが区画に固有のインデックスを含む、態様1〜4のいずれか1つの方法。
態様6。前記プライマーが、所定のRNA核酸にアニーリングする配列を含む、態様1〜5のいずれか1つの方法。
態様7。前記方法が、同じ所定のRNA核酸の異なるヌクレオチドにアニーリングする異なる区画にプライマーを含む、態様1〜6のいずれか1つの方法。
態様8。前記プライマーが鋳型スイッチプライマーを含む、態様1〜7のいずれか1つの方法。
態様9。第1の区画に固有のインデックス配列を付加する前記プロセッシングが、ユニバーサル配列を含むヌクレオチド配列を前記RNA核酸に付加することによりDNA核酸を得、次いで、第1の区画に固有のインデックス配列を前記DNA核酸に付加するという2段階プロセスを含む、態様1〜8のいずれか1つの方法。
態様10。複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
(a)複数の核または細胞を複数の第1の区画に提供すること(ここで、各区画は、核または細胞のサブセットを含む);
(b)各サブセットを逆転写酵素および所定のRNA核酸にアニーリングするプライマーと接触させることにより、前記プライマーおよび鋳型RNA核酸の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせること;
(c)核または細胞の各サブセットのDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること(ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第1の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するインデックス付けされた核酸を得て、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、または増幅を含む);および
(d)インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること
を含む方法。
態様11。前記プライマーが前記第1の区画に固有のインデックス配列を含む、態様10の方法。
態様12。前記接触の前に、細胞または前記細胞から得られた核の前記サブセットにおける新たに合成されたRNAを標識することをさらに含む、態様10または11の方法。
態様13。前記第1区画に固有のインデックス配列を付加するプロセッシングが、ユニバーサル配列を含むヌクレオチド配列を前記核酸に付加し、次いで前記第1区画に固有のインデックス配列を前記核酸に付加するという2段階プロセスを含む、態様10〜12のいずれか1つの方法。
態様14。前記所定のRNA核酸がmRNAである、態様1〜13のいずれか1つの方法。
態様15。既存のRNA核酸および新たに合成されたRNA核酸が、同じ区画内において同じインデックスで標識される、態様1〜14のいずれか1つの方法。
態様16。前記標識することが、ヌクレオチド標識を含む組成物において複数の核または細胞をインキュベートすることを含み、前記ヌクレオチド標識が新たに合成されたRNAに組み込まれる、態様1〜15のいずれか1つに記載の方法。
態様17。前記ヌクレオチド標識が、ヌクレオチド類似体、ハプテン標識ヌクレオチド、変異誘発性ヌクレオチド、または化学反応により修飾することができるヌクレオチドを含む、態様1〜16のいずれか1つの方法。
態様18。2以上のヌクレオチド標識が新たに合成されたRNAに組み込まれる、態様1〜17のいずれか1つの方法。
態様19。1つまたは複数の前記ヌクレオチド標識の比率が、異なる区画または時点の場合には異なる、態様1〜18のいずれか1つの方法。
態様20。前記標識することの前に、核または細胞のサブセットを所定の条件に曝露することをさらに含む、態様1〜19のいずれか1つの方法。
態様21。前記所定の条件が作用物質への曝露を含む、態様1〜20のいずれか1つの方法。
態様22。前記作用物質が、タンパク質、非リボソームタンパク質、ポリケチド、有機分子、無機分子、RNAもしくはRNAi分子、炭水化物、糖タンパク質、核酸、またはその組み合わせを含む、態様1〜21のいずれか1つの方法。
態様23。前記作用物質が治療薬を含む、態様1〜22のいずれか1つの方法。
態様24。2つ以上の区画の前記所定の条件が異なる、態様1〜23のいずれか1つの方法。
態様25。前記曝露することおよび前記標識することが同時に起こるか、または前記曝露することが前記標識することの前に起こる、態様1〜24のいずれか1つの方法。
態様26。
プールされたインデックス付きの核または細胞のサブセットを第2の複数の区画に分配し、核または細胞のサブセットに存在するインデックス付きの核酸に第2のインデックス配列を付加することにより、デュアルインデックス付きの核酸断片を含むデュアルインデックス付きの核または細胞を作製させること(ここで、前記付加は、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含む);および
デュアルインデックス付きの核または細胞を組み合わせて、プールされたデュアルインデックス付きの核または細胞を作製させること
をさらに含む、態様1〜25のいずれか1つの方法。
態様27。
プールされたデュアルインデックス付きの核または細胞のサブセットを第3の複数の区画に分配し、核または細胞のサブセットに存在するインデックス付きの核酸に第3のインデックス配列を付加することにより、トリプルインデックス付きの核酸断片を含むトリプルインデックス付きの核または細胞を作製させること(ここで、前記付加は、ライゲーション、ハイブリダイゼーション、プライマー伸長、増幅、または転位を含む);
トリプルインデックス付きの核または細胞を組み合わせて、プールされたトリプルインデックス付きの核または細胞を作製させること
をさらに含む、態様1〜26のいずれか1つの方法。
態様28。分配が希釈を含む、態様1〜27のいずれか1つの方法。
態様29。分配が選別を含む、態様1〜27のいずれか1つの方法。
態様30。前記付加が、1つまたは2つのインデックス配列を含む核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下でサブセットを前記ヘアピンライゲーション二本鎖と接触させることを含む、態様1〜29のいずれか1つの方法。
態様31。前記付加が、1つ以上のインデックス配列を含む核酸断片をトランスポソーム複合体と接触させることを含み、区画内の前記トランスポソーム複合体が、トランスポザーゼおよびユニバーサル配列を含むものとし、前記接触が、核酸断片の断片化および核酸断片へのユニバーサル配列の組み込みに適した条件をさらに含むものとする、態様1〜30のいずれか1つの方法。
態様32。前記付加が第1の区画に固有のインデックス配列のライゲーションを含み、第2のインデックス配列を付加することにより、デュアルインデックス付きの核酸断片を含むデュアルインデックス付きの核もしくは細胞を作製させることをさらに含み、前記付加が転位を含むものとする、態様1〜31のいずれか1つの方法。
態様33。前記付加が、第2の区画に固有のインデックス配列のライゲーションを含み、第3のインデックス配列を付加することにより、トリプルインデックス核酸断片を含むトリプルインデックス付きの核または細胞を作製させることをさらに含み、前記付加は転位を含むものとする、態様1〜32のいずれか1つの方法。
態様34。前記区画がウェルまたは液滴を含む、態様1〜33のいずれか1つの方法。
態様35。前記第1の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、態様1〜34のいずれか1つの方法。
態様36。前記第2の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、態様1〜35のいずれか1つの方法。
態様37。前記第3の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、態様1〜36のいずれか1つの方法。
態様38。プールされたインデックス付きの核または細胞からインデックス付きの核酸を得ることにより、複数の核または細胞から配列決定ライブラリーを作製することをさらに含む、態様1〜37のいずれか1つの方法。
態様39。プールされたデュアルインデックス付きの核または細胞からデュアルインデックス付きの核酸を得ることにより、複数の核または細胞から配列決定ライブラリーを作製することをさらに含む、態様1〜38のいずれか1つの方法。
態様40。プールされたトリプルインデックス付きの核または細胞からトリプルインデックス付きの核酸を得ることにより、複数の核または細胞から配列決定ライブラリーを作製することをさらに含む、態様1〜39のいずれか1つの方法。
態様41。
複数の増幅部位を含む表面を提供すること(ここで、前記増幅部位は、遊離3’末端を有する結合した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含む)、および
増幅部位を含む前記表面を、それぞれが複数のインデックスを含む個々の断片からアンプリコンのクローン集団を含む複数の増幅部位を製造するのに適した条件下で、1つ、2つ、または3つのインデックス配列を含む核酸断片と接触させること
をさらに含む、態様1〜40のいずれか1つの方法。
態様42。前記の区画に固有のインデックス配列の付加が、ユニバーサル配列を含むヌクレオチド配列を前記核酸に付加し、次いで前記区画に固有のインデックス配列を前記核酸に付加するという2段階プロセスを含む、態様1〜41のいずれか1つの方法。
態様43。複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
(a)複数の核または細胞を第1の複数の区画に提供すること(ここで、各区画は、核または細胞のサブセットを含む);
(b)各サブセットを逆転写酵素およびプライマーと接触させることにより、前記プライマーおよび鋳型RNA核酸の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせること;
(c)核または細胞の各サブセットにおけるDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること(ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第1の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するインデックス付きの核酸を得て、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含む);
(d)前記インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること;
(e)前記プールされたインデックス付きの核または細胞を第2の複数の区画に分配すること(ここで、各区画は、核または細胞のサブセットを含む);
(f)核または細胞の各サブセット内のDNA分子をプロセッシングして、デュアルインデックス付きの核または細胞を作製させること(ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第2の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するデュアルインデックス付きの核酸を得て、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含む);
(g)前記デュアルインデックス付きの核または細胞を組み合わせて、プールされたデュアルインデックス付きの核または細胞を作製させること;
(h)前記プールされたデュアルインデックス付きの核または細胞を第3の複数の区画に分配すること(ここで、各区画は、核または細胞のサブセットを含む);
(i)核または細胞の各サブセットのDNA分子をプロセッシングして、トリプルインデックス付きの核または細胞を作製させること(ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第3の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するトリプルインデックス付きの核酸を生じさせ、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含む);および
(j)前記トリプルインデックス付きの核または細胞を組み合わせて、プールされたトリプルインデックス付きの核または細胞を作製させること
を含む方法。
態様44。複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
(a)複数の核または細胞を提供すること;
(b)前記複数の核または細胞を逆転写酵素およびプライマーと接触させることにより、前記プライマーおよび鋳型RNA核酸の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせること;
(c)前記核または細胞を第1の複数の区画に分配すること(ここで、各区画は、核または細胞のサブセットを含む);
(d)核または細胞の各サブセットにおけるDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること(ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第1の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するインデックス付きの核酸を生じさせ、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含む);
(e)前記インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること;
(f)前記プールされたインデックス付きの核または細胞を第2の複数の区画に分配すること(ここで、各区画は、核または細胞のサブセットを含む);
(g)核または細胞の各サブセットにおけるDNA分子をプロセッシングして、デュアルインデックス付きの核または細胞を作製させること(ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第2の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するデュアルインデックス付きの核酸を得て、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含む);
(h)前記デュアルインデックス付きの核または細胞を組み合わせて、プールされたデュアルインデックス付きの核または細胞を作製すること;
(i)前記プールされたデュアルインデックス付きの核または細胞を第3の複数の区画に分配すること(ここで、各区画は、核または細胞のサブセットを含む);
(j)核または細胞の各サブセットのDNA分子をプロセッシングして、トリプルインデックス付きの核または細胞を作製すること(ここで、前記プロセッシングは、核または細胞のサブセットに存在するDNA核酸に第3の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するトリプルインデックス付きの核酸を得て、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含む);および
(k)前記トリプルインデックス付きの核または細胞を組み合わせて、プールされたトリプルインデックス付きの核または細胞を作製すること
を含む、方法。
態様45。前記プライマーがRNA核酸にアニーリングすることにより、前記プライマーおよび鋳型RNA分子の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせる、態様43または44のいずれか1つの方法。
態様46。前記プライマーが、mRNAポリ(A)テイルにアニーリングするポリTヌクレオチド配列を含む、態様43〜45のいずれか1つの方法。
態様47。前記接触が、サブセットを第2のプライマーと接触させることをさらに含み、前記第2のプライマーが所定のDNA核酸にアニーリングする配列を含む、態様43〜46のいずれか1つの方法。
態様48。前記第2のプライマーが区画に固有のインデックスを含む、態様43〜47のいずれか1つの方法。
態様49。前記プライマーが、所定のRNA核酸にアニーリングする配列を含む、態様43〜45のいずれか1つの方法。
態様50。前記所定のRNA核酸がmRNAである、態様43〜49のいずれか1つの方法。
態様51。前記プライマーが鋳型スイッチプライマーを含む、態様43〜50のいずれか1つの方法。
態様52。前記第1の区画、第2の区画、または第3の区画に固有のインデックス配列の1つ以上を付加するプロセッシングが、ユニバーサル配列を含むヌクレオチド配列を前記核酸に付加し、次いで前記第1の区画に固有のインデックス配列を前記DNA核酸に付加するという2段階プロセスを含む、態様43〜51のいずれか1つの方法。
態様53。前記プライマーが、前記第1の区画に固有のインデックス配列を含む、態様43〜52のいずれか1つの方法。
態様54。前記接触の前に、細胞または該細胞から得られた核のサブセットにおける新たに合成されたRNAを標識することをさらに含む、態様43〜53のいずれか1つの方法。
態様55。既存のRNA核酸および新たに合成されたRNA核酸が、同じ区画内において同じインデックスで標識される、態様43〜54のいずれか1つの方法。
態様56。前記標識することが、ヌクレオチド標識を含む組成物中において複数の核または細胞をインキュベートすることを含み、前記ヌクレオチド標識が新たに合成されたRNAに組み込まれる、態様43〜55のいずれか1つの方法。
態様57。前記ヌクレオチド標識が、ヌクレオチド類似体、ハプテン標識ヌクレオチド、変異誘発性ヌクレオチド、または化学反応により修飾することができるヌクレオチドを含む、態様43〜56のいずれか1つの方法。
態様58。2以上のヌクレオチド標識が新たに合成されたRNAに組み込まれる、態様43〜57のいずれか1つの方法。
態様59。1つまたは複数の前記ヌクレオチド標識の比率が、異なる区画または時点について異なる、態様43〜58のいずれか1つの方法。
態様60。前記の区画の核または細胞のサブセットを、前記標識することの前に所定の条件に曝露することをさらに含む、態様43〜59のいずれか1つの方法。
態様61。前記所定の条件が作用物質への曝露を含む、態様43〜60のいずれか1つの方法。
態様62。前記作用物質が、タンパク質、非リボソームタンパク質、ポリケチド、有機分子、無機分子、RNAもしくはRNAi分子、炭水化物、糖タンパク質、核酸、またはその組み合わせを含む、態様43〜61のいずれか1つの方法。
態様63。前記作用物質が治療薬を含む、態様43〜62のいずれか1つの方法。
態様64。2つ以上の区画の前記所定の条件が異なる、態様43〜63のいずれか1つの方法。
態様65。前記曝露することおよび前記標識することが同時に起こるか、または前記曝露することが前記標識することの前に起こる、態様43〜64のいずれか1つの方法。
態様66。1回以上の分配が希釈を含む、態様43〜65のいずれか1つの方法。
態様67。1回以上の分配が選別を含む、態様43〜65のいずれか1つの方法。
態様68。第1の区画、第2の区画または第3の区画に固有のインデックス配列の1つ以上の付加が、核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下でサブセットを前記ヘアピンライゲーション二本鎖と接触させることを含む、態様43〜67のいずれか1つに記載の方法。
態様69。第1の区画、第2の区画または第3の区画に固有のインデックス配列の1つ以上を付加することが、核酸断片をトランスポソーム複合体と接触させることを含み、区画中の前記トランスポソーム複合体がトランスポザーゼおよびユニバーサル配列を含むものとし、前記接触が、核酸断片の断片化および核酸断片へのヌクレオチド配列の組み込みに適した条件をさらに含むものとする、態様43〜68のいずれか1つの方法。
態様70。第1の区画または第2の区画に固有のインデックスの付加がライゲーションを含み、後続の区画に固有のインデックス配列の付加が転位を含む、態様43〜69のいずれか1つの方法。
態様71。前記区画がウェルまたは液滴を含む、態様43〜70のいずれか1つの方法。
態様72。前記第1の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、態様43〜71のいずれか1つの方法。
態様73。前記第2の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、態様43〜72のいずれか1つの方法。
態様74。前記第3の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、態様43〜73のいずれか1つの方法。
態様75。前記プールされたトリプルインデックス付きの核または細胞からトリプルインデックス付きの核酸を得ることにより、前記複数の核または細胞から配列決定ライブラリーを作製することをさらに含む、態様43〜74のいずれか1つの方法。
態様76。
複数の増幅部位を含む表面を提供すること(ここで、前記増幅部位は、遊離3’末端を有する結合した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含む)、および
前記増幅部位を含む表面を、各々が複数のインデックスを含む個々の断片からのアンプリコンのクローン集団を含む複数の増幅部位を生成させるのに適した条件下でトリプルインデックス付きの核酸断片と接触させること
をさらに含む、態様43〜76のいずれか1つの方法。
態様77。複数の単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
(a)複数の細胞から核を提供すること;
(b)核のサブセットを第1の複数の区画に分配し、各サブセットを逆転写酵素およびプライマーと接触させること(ここで、各区画の前記プライマーは、他の区画の第1のインデックス配列とは異なる第1のインデックス配列を含むことで、インデックス付きの核酸断片を含むインデックス付きの核を生成させる);
(c)前記インデックス付きの核を組み合わせて、プールされたインデックス付きの核を生成させること;
(d)前記プールされたインデックス付きの核のサブセットを第2の複数の区画に分配し、第1のインデックス配列を含むインデックス付きの核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下で各サブセットを前記ヘアピンライゲーション二本鎖と接触させることで、デュアルインデックス付きの核酸断片を含むデュアルインデックス付きの核を生成させること(ここで、前記ヘアピンライゲーション二本鎖は、他の区画の第2のインデックス配列とは異なる第2のインデックス配列を含む);
(e)前記デュアルインデックス付きの核を組み合わせて、プールされたデュアルインデックス付きの核を生成させる;
(f)前記プールされたデュアルインデックス付きの核のサブセットを第3の複数の区画に分配し、前記デュアルインデックス付きの核酸断片を第2鎖合成の条件にかけること;
(g)前記デュアルインデックス付きの核酸断片をトランスポソーム複合体と接触させること(ここで、各区画における前記トランスポソーム複合体は、トランスポザーゼおよびユニバーサル配列を含み、前記接触が、デュアルインデックス付きの核酸断片の断片化およびデュアルインデックス付きの核酸断片へのユニバーサル配列の組み込みに適した条件を含むことで、一方の端に第1および第2のインデックスを、他方の端にユニバーサル配列を含むデュアルインデックス付きの核酸断片を生成させる);
(h)各区画の前記デュアルインデックス付きの核酸断片に第3のインデックス配列を組み込むことで、トリプルインデックス断片を生成させること;および
(i)前記トリプルインデックス断片を組み合わせることにより、複数の単一細胞からのトランスクリプトーム核酸を含む配列決定ライブラリーを作製すること
を含む方法。
態様78。前記プライマーが、mRNAポリ(A)テイルにアニーリングするポリT配列を含む、態様77の方法。
態様79。各区画の前記プライマーが、所定のmRNAにアニーリングする配列を含む、態様77〜78の方法。
態様80。前記方法が、同じ所定のmRNAの異なるヌクレオチドにアニーリングする異なる区画のプライマーを含む、態様77〜79のいずれか1つの方法。
態様81。複数の単一細胞からの核酸を含むトランスクリプトーム配列決定ライブラリーを調製する方法であって:
(a)複数の細胞からプールされた核を提供すること;
(b)前記プールされた核を逆転写酵素およびmRNAポリ(A)テイルにアニーリングするオリゴdT配列を含むプライマーと接触させることで、核酸断片を含むプールされた核を生成させること;
(c)前記プールされた核のサブセットを複数の区画に分配し、核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下で各サブセットを前記ヘアピンライゲーション二本鎖と接触させて、インデックス付きの核酸断片を含むインデックス付きの核を生成させること(ここで、前記ヘアピンライゲーション二本鎖は、他の区画のインデックス配列とは異なるインデックス配列を含む);
(d)前記インデックス付きの核を組み合わせて、プールされたインデックス付きの核を生成させること;
(e)前記プールされたインデックス付きの核のサブセットを第2の複数の区画に分配し、前記インデックス付きの核酸断片を第2鎖合成の条件にかけること;
(f)前記インデックス付きの核酸断片をトランスポソーム複合体と接触させること(ここで、各区画のトランスポソーム複合体は、トランスポザーゼおよびユニバーサル配列を含み、前記接触が、インデックス付きの核酸断片の断片化およびインデックス付きの核酸断片へのユニバーサル配列の組み込みに適した条件を含むことで、一端に前記インデックスを、他端に前記ユニバーサル配列を含むインデックス付きの核酸断片を生成させる);
(g)各区画のインデックス付きの核酸断片に第2のインデックス配列を組み込むことで、デュアルインデックス断片を生成させること;
(j)前記デュアルインデックス断片を組み合わせることにより、複数の単一細胞からのトランスクリプトーム核酸を含む配列決定ライブラリーを作製すること
を含む方法。
態様82。核を単離する方法であって:
(a)液体窒素中で組織を急速凍結すること;
(b)前記組織のサイズを低減することで、加工された組織を得ること;および
(c)細胞溶解を促進し、1つ以上の外因性酵素の非存在下で核の完全性を保持する緩衝液中でインキュベートすることにより、前記の加工された組織から核を抽出すること
を含む方法。
態様83。前記低減することが、前記組織を細かく刻むこと、前記組織に鈍力を加えること、またはそれらの組み合わせを含む、態様82の方法。
態様84。(d)前記の抽出された核を架橋剤に曝露して、固定核を得ること;および
(e)前記固定核を洗浄すること
をさらに含む、態様82または83の方法。
態様85。配列決定ライブラリーの調製に使用するキットであって、ヌクレオチド標識およびライゲーション、プライマー伸長、または増幅に介在する少なくとも1つの酵素を含むキット。
態様86。配列決定ライブラリーの調製に使用するキットであって、所定の核酸にアニーリングするプライマーと、ライゲーション、プライマー伸長、または増幅に介在する少なくとも1つの酵素とを含む、キット。
本開示を、以下の実施例により説明する。特定の例、材料、量、および手順は、本明細書に記載の開示の範囲および精神に従って広く解釈されることを理解されたい。
実施例1
単一細胞解像度での哺乳類の器官形成の動的転写ランドスケープ
哺乳類の器官形成中に、3つの胚葉の細胞は、ほとんどの主要な内部器官および外部器官を含む胚に変容する。発達異常の鍵を握る調節因子はこの重要な時期に研究することができるが、現在の技術は、急速に多様化し拡大している数の細胞タイプの分子状態と軌跡の全体像を得るためのスループットと解像度に欠けている。本発明者らは、単一細胞解像度で器官形成中にマウスの発達の転写動態を調査することに着手した。改良された単一細胞コンビナトリアルインデックス付けベースのプロトコル(’sci−RNA−seq3’)を使用して、妊娠9.5日間から13.5日間において段階分けされた61個のマウス胚(E9.5からE13.5;1時点につき10〜15複製)に由来する200万個の細胞についてプロファイリングを行った。本発明者らは数百の拡大中、収縮中および一過性の細胞タイプを識別しているが、それらの多くはここで得られた細胞カバレッジの深度により検出されているに過ぎず、また、本発明者らは細胞タイプ特異的マーカー遺伝子の対応するセットを定義しており、それらのうちのいくつかについては全体マウントin situハイブリダイゼーションにより実証している。本発明者らは、外胚葉性頂堤、四肢間葉および骨格筋の集中的分析を含む、細胞タイプ内の経時的な増殖および遺伝子発現の動態を調査する。新しいアルゴリズムを使用して、本発明者らは、マウス器官形成の主要な単一細胞の発達軌跡を識別し、これらの中で、同じ終点に至る異なる経路、つまり分岐と収束の例を発見している。これらのデータは、哺乳類の発生生物学の基礎的なリソースを含み、研究団体による継続的な注釈を容易にする方法で利用可能となる。
緒論
哺乳類の器官形成は驚くべきプロセスである。短期間のうちに、3つの胚葉の細胞は、その主要な内部器官と外部器官のほとんどを含む適切な胚に変容する。非常に初期のヒト胚はin vitroで培養および研究することができるが1、ヒト胚発達の後期に対応する材料への接近は限られている。その結果、哺乳類の器官形成のほとんどの研究は、モデル生物、特にマウスに依存している。
ヒトと比較して、マウスは受精から子の誕生までわずか21日で急速に発達する。マウス胚盤胞(32〜64細胞)の着床は、胚4日目(E4.0)に起こる。これに原腸形成と一次胚葉の形成が続く(E6.5−E7.5;660−15K細胞)2,3。この期間、原始線条が形成され、前から後の順序で胚の異なる系統の割り当てが行われる4。初期体節期(E8.0〜E8.5)で、胚は原腸形成から神経板および心臓管形成(60K−90K細胞)に関連する初期器官形成に移行する。古典的な器官形成はE9.5から始まる。その後の4日間(E9.5−E13.5)、マウス胚は数十万個の細胞から1,000万個を超える細胞に拡大し、同時に感覚器官、胃腸および呼吸器官、その脊髄、骨格系、および造血系を発達させる。当然のことながら、マウスの発達のこの重要な期間は集中的に研究されている。実際、発達異常の鍵を握る調節因子のほとんどは、この期間に研究することができる5,6。
マウス器官形成の研究についての従来のパラダイムは、発達の制限された段階で個々の器官系に焦点を合わせること、および遺伝子ノックアウト研究を解剖学的形態、in situハイブリダイゼーション、免疫組織化学7、8、または最近ではトランスクリプトームもしくはエピゲノムプロファイリング9による表現型分類と組み合わせることを含む。かかる焦点を絞った研究により、哺乳類の発達に関する基本的な洞察は得られたが、基礎となる技術には、器官形成中における細胞の多様かつ急速に拡大する集団および部分集団で進行中の動的分子プロセスの全体像を得るためのスループットと解像度が欠けている。
単一細胞の分子内容の「ショットガンプロファイリング」は、これらの欠点に対処し、哺乳類の発達の理解をさらに進めるための有望な手段を表す。例えば、単一細胞RNA−seq法の適用により、最近、マウスの発達中にニューロンと心筋細胞における大きな不均一性が明らかになった10,11。マウスの2つの単一細胞転写アトラスが最近公開され、その分野についての重要なリソースを代表しているが12,13、それらはほぼ成体器官に限定されており、発達中における哺乳類細胞タイプの出現と時間的動態の特性確認を試みるものではない。
単一細胞コンビナトリアルインデックス付け(「sci−」)は、スプリット・プールバーコード法を使用して、多数の単一細胞または単一核の核酸内容物にユニーク標識を付す方法論的なフレームワークである14〜21。本発明者らは、最近、トランスクリプトーム用の「sci−」プロトコル(「sci−RNA−seq」)を開発し、それを適用して、L2段階19の線虫Caenorhabditis elegansの50倍の「ショットガン細胞カバレッジ」を生成させた。「sci−」法のスループットは、インデックス付けのラウンド数とともに指数関数的に増加するが、この可能性は、細胞損失率やいくつかの段階19、21の限られた反応効率などの他の要因のため、まだ完全に実現されていない。これに対処するために、本発明者らは、3レベルのsci−RNA−seq(sci−RNA−seq3)を開発および広範囲に最適化し、1実験あたり100万個を超える細胞をプロファイリングできるワークフローを実現した。以前の19のように、複数の試料(例、複製、時点)を、インデックス付けの最初のラウンド中にバーコードを付けて同時に処理することができる。
ここで本発明者らは、sci−RNA−seq3を使用して単一細胞解像度で器官形成中のマウス発達の転写動態を調査することに着手した。1つの実験では、E9.5からE13.5の間に61個のマウス胚(各時点で10から15の複製)に由来する200万個を超える単一細胞についてプロファイリングを行った。これらのデータから、本発明者らは、38の主要な細胞タイプ、および600を超えるより顆粒状の細胞タイプ(本明細書では38の主要な細胞タイプと区別するために「サブタイプ」と称す)を識別している。全体として、本発明者らは、細胞タイプおよびサブタイプについての数千の新しい候補マーカー遺伝子を発見し、ホールマウントin situハイブリダイゼーションにより代表例を検証する。本発明者らは、外胚葉性頂堤、四肢間葉および骨格筋の集中的な分析を含む、妊娠中期の拡大中および一過性の細胞タイプにおける増殖と遺伝子発現の動態を定量化する。新しいアルゴリズムを使用して、本発明者らは、マウス器官形成の主要な単一細胞の発達軌跡を定義し、これらの中で同じ終点への異なる経路、すなわち分岐と収束の例を発見している。すべてのデータは、研究団体による継続的な注釈を容易にする方法で自由に利用可能となっている。
結果
sci−RNA−seq3を使用した、5つの発達段階にわたる61個のマウス胚からの200万個の細胞のプロファイリング
sci−RNA−seqのスループットを高めるために、1,000を超える実験条件を調査した。本方法の元の説明と比較すると19、sci−RNA−seq3(図4A、方法)によって導入された主な改善点は次のとおりである:(i)本発明者らは新しい核抽出および固定戦略を開発したが、その戦略では酵素処理を全く行わずに核が新鮮な組織から直接抽出される。核抽出後、核を4%パラホルムアルデヒドで固定し、さらなる処理まで液体窒素で保存することができる。(ii)以前の3レベルのインデックス付けの説明19と比較して、本発明者らは、インデックス付きTn5タグ付けからインデックス付きヘアピンライゲーションに切り替えた。(iii)いくつかの個々の反応、例えば逆転写は、効率のためにさらに最適化されている。(iv)FACS選別段階は省略され、核の凝集を最小限に抑えるために超音波処理とろ過の段階が追加された。sci−RNA−seq3のライブラリー調製段階は、1人で1週間で完了することができ、代替sc−RNA−seqプロトコルの「実験ごとの」スループットを大きく上回る(図4B)。
本発明者らは、段階ごとに少なくとも3つの独立した同腹児からの10から15の胚を含む、E9.5〜E13.5の間におけるC57BL/6マウス胚を収集し、それらを液体窒素で急速凍結した。それに続いて、本発明者らは、61個の個々の全胚から核を単離し、sci−RNA−seq3を実行した(図4A)。個々の核のRNA−seqプロファイルが、それらが由来する胚にリンクできるように、各胚に由来する核を、インデックス付けの最初のラウンド中に異なるウェルに配置した(図5A)。内部対照として、本発明者らはまた、インデックス付けの最初のラウンド中に、HEK293T細胞とNIH/3T3細胞の混合物を2つのウェルにスパイクした。sci−RNA−seq3プロトコルの完了後、結果として得られたライブラリーを1回のNovaSeq実行で配列決定し、110億のリードを得た(図5B)。
この1つの実験から、本発明者らは、61個のマウス胚からの2,058,652個の細胞とHEK293T細胞またはNIH/3T3細胞からの13,359個の細胞を含む、2,072,011個の単一細胞トランスクリプトーム(200以上のユニーク分子識別子またはUMIカウント)を回収した。心強いことに、HEK293T細胞およびNIH/3T3細胞のトランスクリプトームが、ある種または他の種のゲノムに圧倒的な形でマッピングされ、衝突は420(3%)であった(図4C)。1細胞あたり23,207リードの配列決定深度では、1HEK293T細胞あたり3,676 UMI、1NIH/3T3細胞あたり5,163 UMIの中央値が観察され、それぞれ1細胞あたり3.9%および2.9%のリードが誤った種にマッピングされた(図5C−D)。以前に収集したデータセット19を、HEK293T細胞またはNIH/3T3細胞ごとの同等の配列決定深度にダウンサンプリングすることにより、元のsci−RNA−seqプロトコルとsci−RNA−seq3を比較した。sci−RNA−seq3プロトコルでは、スループットが40倍増加したが、細胞ごとに検出されたUMIの数に関して同等の効率を示した(図5E)。さらに、sci−RNA−seq3およびsci−RNA−seqに由来するHEK293T単一細胞プロファイルの集約トランスクリプトームは、高度に相関していた(ピアソン:0.98、図5F)。
2,058,652個の胚由来細胞を、その第1ラウンドのバーコードに基づいて61個の個々の胚にマッピングした(1胚あたり中央値35,272個の細胞;図4D)。各胚から回収された細胞の数は、それに割り当てられた第1ラウンドのウェルの数と十分に相関していた(スピアマン:0.75、図6A)。比較的浅い配列決定深度(1細胞あたり約5,000リード)で、本発明者らは、1細胞あたり519遺伝子(671 UMI)の中央値を特定した(図4E)。これは、1細胞あたり3分の1未満の未処理の配列決定リードにもかかわらず、多様な細胞タイプが区別され注釈が付けられている他のscRNA−seq研究19,21,22と同等またはそれ以上である(図6B−D)。後期の胚(E12.5およびE13.5)は、1細胞あたりのUMIカウントがやや少なく、発達中の1核あたりのmRNA含有量が減少していることを示唆している(図6E)。
各時点での1胚あたりの細胞数の概算に基づいて(方法)、各時点につき10〜15個の全複製を合計すると、マウス胚の「ショットガン細胞カバレッジ」は、E9.5で0.8倍(1胚あたり200K細胞、ここでは152Kプロファイリング)、E10.5で0.3倍(1.1M細胞;378Kプロファイリング)、E11.5で0.2倍(2M細胞;616Kプロファイリング)、E12.5で0.08倍(6M細胞;475Kプロファイリング)、およびE13.5で0.03倍(13M細胞;437Kプロファイリング)になると推定される。したがって、まだ「オーバーサンプリング」ではないが、各段階でプロファイリングしている細胞の数は、個々のマウス胚の細胞含有量のかなりのパーセンテージに相当する(3〜80%)。
データ品質のチェックとして、本発明者らは、各個体の単一細胞トランスクリプトームを集約し、マウス胚の61の「擬似バルクプロファイル」を作成した。Xist転写産物(雌のみで発現)またはY染色体転写産物にマッピングされたUMIの数を数えることにより、マウス胚は、各段階で雄対雌の複製数に関してバランスの取れた形で(図6F)雄(x=31)群および雌(n=30)群に容易に分離される(図4F)。
さらなる品質チェックとして、本発明者らは、61個の胚の「擬似バルク」トランスクリプトームをt確率的近傍埋め込み法(t−SNE)にかけることにより、5つの密集した群が発達段階に完全に一致するようにした(図7A)。また、本発明者らが、全ての時点にわたって差次的に発現される上位1,000個の遺伝子に基づいて、Monocle23を使用して「偽時間」軌跡に沿ってマウス胚を順序付けたところ、得られた順序も予想と一致している(図4G)。特に、胚レベルの偽時間軌跡には2つの顕著なギャップがあって、1つはE9.5とE10.5との間、もう1つはE11.5とE12.5との間であり、これらの期間中における全体的トランスクリプトームの劇的な変化を示唆している。本発明者らは各胚に偽時間を割り当てたが、これは、発達段階のよりきめの細かい評価を潜在的に反映している(図7B)。例えば、発達の偽時間の早い時期に位置付けられたE10.5胚と遅い時期に位置付けられたE10.5胚は、形態学的に区別された(図7C)。
本発明者らはまた、発達中における全体的トランスクリプトームの変化も調べた。12,236個の遺伝子が、異なる発達段階にわたって差次的に発現された(データは示さず);最も動的な遺伝子のいくつかを図4Hにプロットする。予想どおり、Hbb−btやHbb−bsなどの成人ヘモグロビン遺伝子の発現が増加し、Hbb−bh1やHbb−xなどの胚ヘモグロビン遺伝子の発現が減少することが観察される。Cntn424、Neurod225およびNeurod626などの神経分化における既知の役割を有する遺伝子は、後の段階で発現の増加を示す。しかしながら、多くの非常に動的な遺伝子、例えばSlc35f4、PrtgおよびTrim30aはこれまでに特性確認されていない。とにかく、本発明者らの仮定−そして実際、単一細胞データを収集する動機−は、「全胚」遺伝子発現の動態が、単一細胞タイプ内の変化ではなく、異なる細胞タイプの相対的な割合の劇的な変化によって主に推進されるということである。
マウス器官形成中に存在する主要な細胞タイプとサブタイプの識別と注釈
主要な細胞タイプを識別するために、本発明者らは、2,058,652個の単一細胞トランスクリプトーム(すなわち、完全に全時点からのすべての胚)をルーバンクラスタリングにかけ、40の異なる群を識別し、t−SNEの視覚化を行った(図8A)。心強いことに、本発明者らは、異なる時点に由来する細胞の間に明確な違いを観察しているが(図9A)、同じ時点の複製胚に由来する細胞は同様に分布している(図10)。これらの40のクラスターのそれぞれに固有の遺伝子セットに基づいて、公開されたマーカー遺伝子との比較により、細胞タイプの割り当てを手動でキュレートした(データは示さず)。37個のクラスターについて、本発明者らは、それらを正確に1つの文献で定義された細胞タイプに確実に割り当てることができたが、2つのクラスターはいずれも決定的な赤血球系統に対応していた。1つのクラスターは異常に高いUMIカウントを有していたが、強くクラスター特異的な遺伝子はなく、これは細胞ダブレットの技術的な人工物であってもよいことを示唆していた。決定的な赤血球系統クラスターをマージし、この推定ダブレットクラスターを破棄することにより、38の主要な細胞タイプが得られた(図8A)。多くのクラスターについて、非常に特異的なマーカー遺伝子により、細胞タイプの識別が簡単になった(図8B、図9B−図9C、データは示さず)。例えば、クラスター6(上皮細胞)は、十分に特性検定されたマーカー遺伝子EpcamおよびTrp6327、28を特異的に発現し、クラスター29(肝細胞)は、AfpおよびAlb発現12によって特異的にマークされた。高度に特殊化された細胞タイプに対応するものを含む、より小さなクラスターにも容易に注釈を付けることができた。例えば、TyrやTrpm1など、網膜の発達中に高度に発現される転写産物がクラスター36では豊富であり、これらがメラニン細胞であることを強く示唆していた29,30。クラスター37は、発達中の水晶体でのみ発現される転写産物が豊富であった。胚間葉および結合組織に対応するクラスターの場合、現在の文献で入手できる高度に特異的なマーカー遺伝子が少ないため、細胞タイプの識別はより困難であった。
26,183個の遺伝子のうち、17,789個の遺伝子(68%)が38の主要な細胞タイプで差次的に発現された(FDR 5%)(図9B、データは示さず)。これらの中で、本発明者らは、2,863個の細胞タイプ特異的マーカーを特定したが、知る限りではその大部分はこれまでそれぞれの細胞タイプに関連付けられていなかった(1クラスターあたり平均75個のマーカー;図8B、図9C)。これらのデータが遺伝子発現の新しい、発達的および細胞タイプ特異的なマーカーの定義にどのように役立つかの例として、四肢、脳、視床、脊髄および肺の正中線構造を含む、多くの器官系の発達中に重要な役割を演じることが示されているソニック・ヘッジホッグ(Shh)を考慮されたい31。本発明者らは、すべて発達中の脊索および床板の細胞で発現することが既知の32〜34、Ntn1、Slit1、およびSpon1とともに、クラスター30(脊索;データは示さず)でShhの最高発現を検出した。しかしながら、脊索のマーカーとしてこれまで報告されていなかった遺伝子Tox2、Stxbp6、Schip1、Frmd4bもクラスター30に高度に特異的であった。
予想どおり、本発明者らは、器官形成中における細胞タイプの割合に著しい変化を認めた。38の主要な細胞タイプのほとんどは指数関数的に増殖したが、いくつかは一時的であり、最終的にE13.5で消失した(図11A−B)。例えば、クラスター26で表される卵黄袋に由来する原始赤血球系統はHbb−bh1発現によって特性評価され、胎児肝臓に由来する決定的赤血球系統はクラスター22においてHbb−bs発現によってマークされた(データは示さず)。E9.5では、本発明者らは、主に原始赤血球系統に対応する細胞を検出した(図8A)。次の5日間にわたって、決定的な赤血球系統が胎児循環系における主要な細胞タイプになり、最終的にE13.5までに排他的な赤血球系統になった(図8A)。対応する遺伝子マーカーは同様の動態を示した(図11C)。
ここで特定された38の主要な細胞タイプの中央値は47,073細胞で、最大クラスターに含まれるのは144,648細胞(結合組織始原細胞;データセット全体の7.0%)であり、最小クラスターに含まれるのは僅か1,000細胞(単球/顆粒球;データセット全体の0.05%)である。これら38個のクラスターの多くで細胞タイプの不均一性が容易に明らかになったため、本発明者らは、各主要細胞タイプでルーバンクラスタリングを繰り返してサブクラスターを特定する反復戦略を採用した(図12〜図13)。1つまたは2つの胚に支配されたサブクラスターが除去され、非常に類似したサブクラスターがマージされた後(方法)、合計655個のサブクラスターが特定された(本明細書では、38の主要な細胞タイプと区別するために「サブタイプ」と称す;図12〜図13)。注目すべきことに、この研究で細胞タイプとサブタイプを検出する感度は、プロファイリングされた多数の細胞の直接的な関数であった。例えば、本発明者らのデータの2.5%(50,000個の細胞)でルーバンクラスタリングを繰り返すことにより、細胞タイプとサブタイプのサブセットのみが特定された(図14)。
655のサブタイプは、中央値1,869細胞により構成され、51細胞(脊索細胞のサブタイプ)〜65,894細胞(結合組織始原細胞のサブタイプ)の範囲である(図15A)。
ほぼすべてのサブタイプ(99%)は複数の胚が寄与する形で構成されており、単一の胚は優勢ではない(図15B〜図15C)。これらのサブタイプは関連するサブタイプとは異なる真正な転写プログラムを構成するという見解を支持して、本発明者らは、サブタイプごとに55個の特異的マーカーの中央値を特定した(図15D;サブタイプ特異的マーカーは、データセット全体ではなく、対応する主要な細胞タイプ内において特異的であることにより定義されるものとする)。38の主要な細胞タイプよりもさらに、個々のサブタイプはE9.5とE13.5との間で変動する動態を呈した。サブタイプの大部分(64%)は推定細胞数が増加し、12%が減少し、24%がより複雑なパターンを示した(図16A〜図16B)。興味深いことに、本発明者らは、各サブタイプに割り当てられた細胞の割合のみに基づいて、さまざまな発達段階の胚を容易に分離することができた(図16C)。
四肢の外胚葉性頂堤(AER)発達中の遺伝子発現軌跡の特性確認
詳細なサブタイプの注釈と探査で達成できることの例として、本発明者らは、上皮(クラスター6)、特に外胚葉性頂堤(サブクラスター6.25)に集中した。サブタイプ特異的マーカー遺伝子に基づいて、本発明者らは、29のサブタイプの上皮に注釈を付けた(クラスター6;図17A;図18A、データは示さず)。例えば、サブタイプ6.10の上皮細胞は、耳胞の上皮でのみ発現する遺伝子であるOc90によってマークされたが35、サブタイプ6.25の上皮細胞は、指の発達に関与する高度に特殊化された上皮である、外胚葉性頂堤(AER)に特異的である、十分に特性確認されたマーカー遺伝子Fgf8、Msx2 およびRspo2の発現増加を示した36。すべての上皮サブタイプについて、本発明者らは、これまでマーカーとして知られていなかった遺伝子を特定した。例えば、AERはまた、Fndc3a、Adamts3、Slc16a10、Snap91、およびPou6f2の発現によっても区別された。Fgf8(既知マーカー)およびFndc3a(新規マーカー)のホールマウントin situハイブリダイゼーション(WISH)により、両方の遺伝子がE10.5のAERを表す肢芽の最も遠位の先端に発現していることが確認された(図17B〜図17E)。
次に、本発明者らは、AER発達中における細胞増殖および遺伝子発現の動態を調べた。本発明者らは、合計1,237個のAER細胞を特定したが、これは、データセット全体の0.06%に過ぎず、ほぼすべての胚(プロファイリングされた5個を超えるAER細胞を含む61個中45個)が寄与していた。AER細胞はすべての時点で検出されるが、本発明者らは、E9.5で1胚あたりの細胞割合に関してそのピークに達し、その後減少することを観察しており(図17F)、これは以前の報告37および本発明者らによるin situ実証試験と一致する(図17C)。発達中におけるAER内での遺伝子発現の動態を特性評価するために、本発明者らは、発達段階において上位500の差次的に発現された遺伝子に基づいてAER細胞の偽時系列解析を行い、単純な初期から後期に至る軌跡を生成した(図17G)。710のタンパク質コーディング遺伝子は、発達の偽時間に沿って差次的に発現された(FDR 5%)(データは示さず)。例えば、肢芽でAER特異的発現を呈することが既知のFgf9は38、Fgf8およびFndc3aと比較して遅延した活性化動態を示した(図17H)。顕著に活性化された遺伝子は、AER細胞の分化に重要な役割を演じてもよい。例えば、活性化された遺伝子には、AERの維持および四肢発達における成長とパターン形成に重要であることが既知のRspo2が含まれる39(図17H)。
また、本発明者らは、その発現がE9.5とE13.5との間でAER細胞内で著しく減少した遺伝子を特定した(FDRが1%の169遺伝子;図19A)。これらには、Ki67(Mki67)およびインスリン様成長因子2(Igf2)が含まれ、両方とも細胞増殖の促進における役割を有する40,41(図17H)。実際、この発達ウィンドウ中におけるAERによる増殖の停止と一致して、大幅に減少する遺伝子の経路レベル分析は、細胞周期の進行とグルコース代謝に関連するターム、および多能性に関連する転写因子(Isl1、Pou5f1、Nanog)を強調している(図19B〜図19C)。
四肢間葉発達中の細胞運命軌跡の特性検定
次に、本発明者らは、細胞タイプとサブタイプ間の移行を含む、哺乳類の発達のこの重要な時期に細胞タイプが通過する発達の軌跡を調査することにした。偽時的軌跡再構築のための最も現代的なアルゴリズムには、2つの大きな制限がある。第一に、前記アルゴリズムは、細胞が単一の連続多様体上に存在する、すなわち、細胞のサブセット間で不連続性がないと仮定する。しかしながら、初期の胚はE9.5から派生しているため、本発明者らのデータセットが少なくともいくつかの祖先の状態に対応する細胞を含むことはない。第二に、前記アルゴリズムでは、根底にある軌跡は、分岐点が運命決定に対応するツリーであると仮定する。しかしながら、一部の組織は、転写的に異なる系統、すなわち、1つまたはいくつかの分岐事象によって分離された軌跡の収束によってもたらされる、転写的に区別できない細胞を含むことが既知である。
これらの制限に対処するために、本発明者らは、Monocleパッケージ42に組み込まれた新しいアルゴリズムを開発し、複数の互いに素な軌跡を分解すると同時に、軌跡内における分岐と収束の両方を可能にした。Monocle 3は、Uniform Manifold Approximation and Projection(均一多様体近似および投影、UMAP)43を使用して、転写状態をエンコードする低次元空間に細胞を投影することから始まる。次いで、Monocle3は、ルーバンクラスタリングを使用して相互に類似した細胞のコミュニティを検出し、近似グラフ抽象化(AGA)アルゴリズム44で導入された統計試験を使用して隣接するコミュニティをマージする。重要なことに、これらの手順により、複数の互いに素な細胞コミュニティの維持が可能となる。Monocle 3の最後の段階は、発達中に個々の細胞がたどることができる経路を分解することを目的としており、各コミュニティを構成する細胞のセット内における分岐および収束の場所、すなわち軌跡を特定する。本発明者らは、以前に、すべての細胞がグラフ上のある点の近くにあるように、単一細胞のRNA−seqプロファイルの投影内に「主グラフ」を埋め込む「L1−グラフ」と呼ばれる手順について説明した45。L1−グラフは閉鎖ループと分岐のある軌跡を学習できたが、数百個の細胞を含むデータセットでしか実行できなかった。アルゴリズムで数千、さらには数百万の細胞を処理できるようにするために、本発明者らは2つの拡張機能を実装した。まず、本発明者らは、細胞自体ではなく、データの数百の重心で実行する。次に、本発明者らは、アルゴリズムの線形プログラミング法を制約して、AGAテストで定義された互いに素な軌跡間の境界を尊重する。
本発明者らは、最初に、この新しいアルゴリズムを単一の主要な細胞タイプであるクラスター25に適用しようとした。クラスター25の26,559個の細胞は、Hoxd13、Fgf10、およびLmx1b発現に基づいて肢芽間葉として注釈を付す(データは示さず)。Monocle3でこのクラスターの細胞の軌跡を視覚化すると、発達期間にわたって四肢間葉細胞が劇的に拡大し、E10.5とE12.5との間に主たる大きな伸長が見られる(図20A)。遺伝子発現は、この拡大中は決して静的ではなく、4,763個のタンパク質コーディング遺伝子のレベルが大幅に変化する(1%のFDR;データは示さず)。四肢間葉の発達の初期段階は、Tbx1546、およびGpc347などのいくつかの予想される遺伝子を特徴とし、後期段階は、Msx148、Epha449およびDach150を特徴とする(図21A)が、動的に発現される遺伝子の大部分は新規である。四肢間葉の発達中に顕著にアップレギュレートされた転写因子には、軟骨細胞分化(例、Sox951およびYap152)、筋肉分化(例、Tead453)、および創傷治癒と四肢再生(例、Smarcd154)における役割を有するものが含まれた(図21B)。
興味深いことに、前肢と後肢の細胞は、教師なしクラスタリング(図21C)または軌跡分析(図22A)によって容易に分離されなかったが、前肢でのTbx5の相互排他的発現(2,085細胞、すべての四肢間葉細胞の7.9%)および後肢でのPitx1(1,885個の細胞、すべての四肢間葉細胞の7.1%)の相互排他的発現で区別することができ、両方のマーカーを発現するのは22個の細胞のみであった(すべての四肢間葉細胞の0.08%に対し、独立している場合は約0.6%の予想値、図20B)55。この方法で前肢と後肢に割り当てられた細胞間で285個の遺伝子が差次的に発現された(図20C、データは示さず)。Tbx4などの既知マーカー遺伝子およびHoxcクラスター(Hoxc4−10)56の遺伝子は、予想どおり後肢細胞でアップレギュレートされたが、新規マーカーも特定された。例えば、本発明者らは、Epha3およびHs3st3b1が前肢で5倍濃縮され、Pcdh17およびIgf1が後肢で3倍濃縮されていることを観察した。
発達の時間は、Monocle3四肢間葉軌跡の変動の主軸であるが(図20A)、明らかに追加の構造がある。これの少なくとも一部は、四肢発達の2つの主要な空間軸:近位−遠位軸(大きな伸長の主な方向)および前後軸(5指に対応)に対応するように見える55。例えば、Sox6とSox9(近位)57、58、Hoxd13とTfap2b(遠位)36、Pax9とAlx4(前部)、およびShhとHand2(後部)は、Monocle 3の軌跡上で示差的に分布していた(図20D;図22B)。Hoxd13(既知の遠位マーカー)およびCpa2(Monocle3軌跡における分布が既知の遠位マーカーの分布に類似した新規マーカー)のホールマウントin situハイブリダイゼーションにより、両方の遺伝子がE10.5とE13.5との間の遠位四肢間葉で発現されていることが確認された(図20F−図20H)。四肢間葉軌跡への空間的自己相関を検出するモランのテストを適用すると、1,191の顕著に異なる遺伝子が明らかになった(FDRが1%、モランのI>10)。これらの遺伝子は8つの発現パターンにクラスター化され、そのいくつかは近位−遠位軸および前後軸のマーカーの分布に一致した(図23、データは示さず)。
本発明者らによるAERと四肢間葉の軌跡の結果をまとめた要約を図20Iに示す。四肢の発達は比較的単純な軌跡によって定義されるが、本発明者らの分析は、マウス器官形成のこの単一細胞アトラスを使用して、特定の系での遺伝子発現の時空間動態について特性評価することができる方法を示す。
マウス器官形成の主要な細胞系統の描写と特性評価
次に、本発明者らは、全データセットにわたって主要な発達系統と細胞軌跡を特定しようとした。Monocle3は、サンプリングされた100,000個の高品質細胞(UMI>400)を、十分に分離された8つの系統に編成した(図24A、図25A)。38の主要な細胞タイプのほぼすべてが、これら8つの群の1つにほぼ排他的に分類される(図24B)。例外は、4つの最小クラスターのうちの3つ、単球/顆粒球(36細胞)、水晶体(125細胞)、および巨核球(287細胞)であり、おそらくそれらの数が少ないためであると思われる。最も複雑な2つの構造は、明らかに、全ての間葉系および筋肉の細胞タイプを含む間葉系軌跡(図24Aおよび図25Aの左)ならびに、脊索、神経管、始原および発達中の神経系およびグリアの細胞タイプを含む神経管/脊索軌跡(図24Aおよび図25Aの右)である。第1の神経堤軌跡(「神経堤1」)にはメラニン細胞とシュワン細胞前駆体が含まれ、第2の神経堤軌跡(「神経堤2」)は感覚ニューロンで構成されている。造血系軌跡には巨核球、赤血球およびリンパ球が含まれ、残りの3つの軌跡(肝臓、内皮、上皮)はそれぞれ単一の主要な細胞タイプに対応する。これらの各系統における1胚あたりの推定細胞数はE9.5〜E13.5で指数関数的に増加するが、その発達ウィンドウ中にその寄与をほぼ10倍に拡大する肝細胞を除き、それらの割合は比較的安定したままである(E9.5で0.3%から、E13.5で2.8%)(図25B〜図25C)。
UMAPは、定義された領域に同じタイプのセルを投影するが、t−SNEとは異なり、関連する細胞タイプを互いに近くに配置する。例えば、初期間葉系細胞は、定義された領域から筋細胞、四肢間葉、軟骨細胞/骨芽細胞および結合組織に放射状に広がるように見えた(図24A、左)。同様に、グルタミン酸作動性ニューロンなどの後期発達時点で見られる細胞タイプは、神経始原細胞の「ブリッジ」によって初期の中枢神経前駆体(放射状グリアなど)から分離されている(図24A、右)。一方、不連続性(例、8つの主要な系統間)は、これらの群の間における中間状態または祖先状態の表示の欠如を反映している可能性が高く、その結果、本発明者らの研究がE9.5〜E13.5に制限されている。
反復サブクラスタリングと同様に、8つの主要な系統のそれぞれを個別に上記のような軌跡分析にかけた場合、間葉系軌跡および神経管/脊索の軌跡は、上記のように再び編成され(図26〜図27、上の行)、主要系統(上皮、内皮など)は複数の不連続な亜系統を示し、潜在的にサブタイプの詳細な軌跡を明らかにした(図26〜図27、残りの行)。例えば、本発明者らが29のサブタイプで上皮の軌跡に注釈を付けると(図17A)、上皮サブタイプの基礎となるサブセットである、焦点集中のE9.5由来細胞からそれぞれ発する、いくつかの異なるサブ軌跡が観察される(図24C、図28)。例えば、外胚葉性頂堤の上皮細胞(図17G)は、E9.5からE13.5までの細胞の直線状のサブ軌跡を形成し、他の上皮副軌跡(図24C、下中央)から十分に分離されている。
骨格筋形成中の細胞軌跡の再構築
図24に示されている軌跡、特により複雑な軌跡を構成する細胞タイプとサブタイプの関係を完全に解明するには、かなりのさらなる作業が必要である。可能であってもよいものの代表例として、本発明者らは、器官形成の開始前に形成される異なる中胚葉系統で構成される発達中の筋肉組織をより詳細に調査しようとした。例えば、外眼筋については前脊索中胚葉が寄与し、顔および顎の他のものは咽頭中胚葉によって生成される。骨格筋形成は、上流遺伝子の別個のセットによって活性化される筋原性調節因子(MRF)のコアセットによって推進される59。例えば、Pax3は体幹筋のMyod1を活性化するが、頭部ではPax3は不要であり、MRFはPitx2およびTbx1によって活性化される60〜62。Myod1またはMyf5はミオゲニンを活性化し、収縮性骨格筋に必要とされる多数の遺伝子の発現を推進する。本発明者らは、胚全体の規模で見た場合、筋原性軌跡は、筋管で共有されるコア遺伝子発現プログラムの活性化に対応する共通の経路に細胞を供給する複数のエントリポイントを特徴とするという仮説を立てた。
この仮説を試験するため、本発明者らは、最初に筋細胞として分類された(クラスター13)各主グラフノードでの細胞の画分を定量化することにより、間葉軌跡から筋細胞とその推定「祖先」細胞を分離した。本発明者らは、すべての「多数の筋細胞」ノードを収集し、次いで主グラフのエッジを使用して、このノードのセットを細胞のより広い「近傍」に拡張した(図29A)。次に、本発明者らは、細胞のこのサブセットでMonocle3を再実行して、筋形成に固有の軌跡を構築した。この軌跡は、E9.5からの細胞の複数の焦点集中を特徴としており、後期段階からの細胞は、外へ向かって放射状に広がるいくつかの経路にわたって分布し(図29B)、骨格筋始原細胞をマークするPax3およびPax7は、主グラフの広いスワス全体に分布する細胞で発現された(図29C)。2つの平行な線分がグラフのこの領域から発しており、そこで細胞がMyf5またはMyodを発現した。両経路は、それぞれ筋細胞および筋管のマーカーであるMyogまたはMyh3を発現する細胞が占める共通領域に送り込まれる。Lhx2、Tbx1、およびPitx2を発現するがPax3については非常に低いレベルであるE9.5由来の細胞が通過する追加的経路は、咽頭中胚葉に対応する可能性があるMyf5およびMyod1の線分のすぐ上流の軌跡に送り込まれる。すなわち、MRFとその上流活性化因子の軌跡全体にわたる動態は、異なる中胚葉系統が異なる因子を使用して筋肉遺伝子のコアプログラムに収束するという見方と一致していた(図29D)。
検討
この研究では、本発明者らは、古典的な器官形成に対応する期間に焦点を合わせて、マウス胚全体の規模で単一細胞のトランスクリプトームをプロファイリングすることにより、哺乳類の発達の特性評価を行おうとした。sci−RNA−seq3を使用した1回の実験で61の個々の胚から2,000,000を超える細胞をプロファイリングすることにより、本発明者らはまた、小規模研究室向けの技術的フレームワークを提供し、前例のないスループットで単一細胞RNA−seqデータセットを生成させる。発達軌跡における分岐、収束、および不連続性を分解するために、本発明者らは、数百万個の細胞にスケーリングする軌跡推論についての新規アルゴリズムであるMonocle 3を提示する。
妊娠中期のマウス胚で、本発明者らは、38の主要な細胞タイプと600を超えるサブタイプを特定する。これらのタイプおよびサブタイプはそれぞれ、マーカー遺伝子のセットの発現を特徴とするもので、その大部分は新規であり、その代表例について本発明者らはホールマウントin situハイブリダイゼーションにより検証する。まれな細胞タイプについて特性評価するためのディープショットガン細胞カバレッジの有用性を説明するものとして、本発明者らは、指の発達における重要な役割を伴うがここでプロファイリングされた細胞のわずか0.06%に過ぎない、特殊化された上皮である、外胚葉性頂堤(AER)におけるマーカーおよび動的に発現される遺伝子を強調している。38の主要な細胞タイプは、間葉系、神経管/脊索、造血系、肝、内皮、上皮、および2つの神経堤の軌跡を含む8つの軌跡に広く分解される。これらの8つの軌跡間の不連続性は、E9.5から始まるデータセット内の祖先状態または中間状態の表示の欠如の結果である可能性がある。四肢間葉の軌跡分析により、時間軸と複数の空間軸の両方に対応する発達的不均一性の相関関係が明らかになった。筋細胞とその始原細胞に対応する間葉系軌跡のサブセットに焦点を当て、本発明者らは、筋管に対応する共通の終点に送り込まれる複数のサブ軌跡を識別する。発現プログラムの「収束」のこの例は、発達軌跡推定のためのほとんどのアルゴリズムで想定される分岐構造とは対照的である。
本発明者らの研究には、考慮する必要のあるいくつかの制限がある。まず、他の単一細胞アトラスと同様に、個々の細胞トランスクリプトームデータが散在している。しかしながら、以前の研究では、驚くほど浅い配列決定深度で、単一細胞トランスクリプトームデータセット内において転写プログラムを容易に区別できることが示されている63。中央値が1細胞あたり671 UMIである655の転写的に異なるサブタイプを定義できることはこの見解と一致しており、各細胞タイプまたはサブタイプでトランスクリプトームを集約することで、本発明者らは代表的な発現プロファイルを構築できる。第二に、本発明者らは、ここで行われたほとんどの細胞タイプの割り当てには合理的に自信があるが、それでも予備的なものと見なされるべきである。重要な課題は、妊娠中期マウスの発達(E9.5〜E13.5)が、これまでに単一細胞の解像度でも生物全体の規模でも研究されたことがないことである。既存の単一細胞転写アトラスは、成体マウスまたは後期胚期の個々の器官についてプロファイリングしている12、13。本発明者らはこれまでに著しい進歩を遂げたが、これら655の細胞サブタイプの包括的な注釈は進行中のプロジェクトであり、コミュニティ情報とドメイン専門技術が安定したコンセンサスに到達するために生かされると予想される。そのために、本発明者らとコミュニティによる注釈を容易にするウィキを作成した(atlas.gs.washington.edu/mouse−rna/のワールドワイドウェブで入手可能)。各サブタイプの固有のページには、それを構成する細胞のダウンロード可能なマトリックス、そのサブタイプに特異的なマーカー遺伝子のリスト、およびここで調べた発達ウィンドウでのそのサブタイプの動態の説明が含まれる。
この分野の長年の目標は、おそらく最終的に技術的な観点から見れば、単一細胞の解像度で哺乳類の発達の包括的で時空間的に分解された分子アトラスを作成することであると思われる。この目的に向けて、マウスに焦点を当てることには、その小さなサイズ、初期発達時点へのアクセス可能性、近交系の遺伝的背景、および遺伝子操作性など、いくつかの利点がある。個々のマウス胚の細胞含有量のかなりのパーセンテージに対応する多数の細胞をプロファイリングすることにより(段階ごとに3〜80%の「ショットガン細胞カバレッジ」)、これらのデータは発生生物学分野の強力なリソースを構成することとなり、また、細胞タイプまたは発達軌跡を解決および解釈するための計算方法の開発をさらに推し進める助けとなってもよい。今後、トランスクリプトーム、追加の分子表現型64、系統の歴史65、および空間情報の統合された測定により、哺乳類の発達の全体的な見方がさらに形になると本発明者らは予想している。
締めくくりとして、本発明者らは、野生型マウスの発達の単一細胞アトラスが、生物規模での多面発現性発達障害の理解に向けた最初の段階を示すもので、発達過程における遺伝子および調節配列の微妙な役割の詳細な調査にも役立つことに注目する。例えば、マウスの遺伝子ノックアウトの約35%は致死的であるが5、多くのノックアウト、特に保存された調節配列のノックアウトは、従来の表現型分類で異常を全く示さない66。本発明者らは、生物規模のsc−RNA−seqが逆遺伝学に力を与えることになると予測しており、例えば分子プログラムまたは特定の細胞タイプの相対割合にわずかな欠陥がある、以前見逃した表現型の発見を潜在的に可能にする67
方法
胚解剖
C57BL/6マウスは、The Jackson Laboratory(バーハーバー、ME)から入手し、プラグ交配を設定した。プラグ実施の日を、胚0.5日目(E)0.5とみなした。前述のように解剖を行い69、すべての胚を液体窒素で即座に急速凍結した。すべての動物の手順は、制度、州、および政府の規制(IACUCプロトコル4378−01)に従った。
ホールマウントin situハイブリダイゼーション
E9.5〜E11.5マウス胚におけるmRNA発現について、クローン化遺伝子特異的プローブから転写されたジゴキシゲニン標識アンチセンスリボプローブ(PCR DIG Probe Synthesis Kit、Roche)を使用したホールマウントin situハイブリダイゼーション(WISH)により評価した。全胚を4%PFA/PBSで一晩固定した。胚をPBST(0.1%Tween)で洗浄し、25%、50%、75%メタノール/PBSTで段階的に脱水し、最終的に−20℃で100%メタノールに保存した。WISHプロトコルは次のとおりであった:1日目)胚を、逆メタノール/PBST段階で氷上にて再水和し、PBSTで洗浄し、6%H2O2/PBSTで1時間漂白し、PBSTで洗浄した。次に、胚を10μg/mlプロテイナーゼK/PBSTで3分間処理し、グリシン/PBSTでインキュベートし、PBSTで洗浄し、最後に4%PFA/PBS、0.2%グルタルアルデヒド、0.1%Tween 20で20分間再固定した。PBSTによるさらなる洗浄段階の後、胚を、L1緩衝液(DEPC中、50%脱イオン化ホルムアミド、5xSSC、1%SDS、0.1%Tween 20;pH4.5)中68℃で10分間インキュベートした。次に、胚をハイブリダイゼーション緩衝液1(0.1%tRNAおよび0.05%ヘパリンを含むL1)中68℃で2時間インキュベートした。その後、胚を68℃で一晩、ハイブリダイゼーション緩衝液2(0.1%tRNAおよび0.05%ヘパリンおよび1:500 DIGプローブを含むハイブリダイゼーション緩衝液1)でインキュベートした。2日目)非結合プローブの除去を、68℃でそれぞれ3x30分、L1、L2(50%脱イオン化ホルムアミド、2xSSC pH4.5、0.1%Tween 20、DEPC中;pH4.5)およびL3(2x SSC pH4.5、0.1%Tween 20、DEPC中;pH4.5)による一連の洗浄段階で行った。その後、胚をRNase溶液(0.1M NaCl、0.01M Tris pH 7.5、0.2%Tween 20、H2O中100μg/ml RNase A)で1時間処理した後、TBST 1(140mM NaCl、2.7mM KCl、25mM Tris−HCl、1%Tween 20;pH 7.5)で洗浄した。次に、胚をブロッキング溶液(2%ウシ血清および0.2%BSAを含むTBST 1)にてRTで2時間ブロックした後、1:5000抗ジゴキシゲニンAPを含むブロッキング溶液中4℃でインキュベートした。3日目)未結合抗体の除去を、TBST 2(0.1%Tween 20、および0.05%レバミソール/テトラミソールを含むTBST)にてRTで8×30分間、一連の洗浄段階で行い、4℃で一晩放置した。4日目)胚の染色は、RTでアルカリ性リン酸緩衝液(0.02M NaCl、0.05M MgCl2、0.1%Tween 20、0.1M Tris−HCl、および0.05%レバミゾール/テトラミソール、H2O中)により3回20分間洗浄し、続いてBMパープルAP基質(Roche)で染色することにより開始された。染色された胚を、Zeiss Discovery V.12顕微鏡とLeica DFC420デジタルカメラを使用して撮像した。
哺乳類細胞培養
哺乳類細胞を全て、5%CO2、37℃で培養し、10%FBSおよび1X Pen/Strep(Gibcoカタログ番号15140122;100U/mlペニシリン、100μg/mlストレプトマイシン)が両方追加された、HEK293T細胞およびNIH/3T3細胞用の高グルコースDMEM(Gibcoカタログ番号11965)中で維持した。細胞を0.25%トリプシン(typsin)−EDTA(Gibcoカタログ番号25200−056)でトリプシン処理し、週に3回1:10に分割した。
マウス胚核の抽出と固定
バッチ効果を減らすために、異なる発達段階からのマウス胚を一緒に処理した。各マウス胚を、1mLの氷冷細胞溶解緩衝液(10mM Tris−HCl、pH7.4、10mM NaCl、3mM MgCl2および0.1%IGEPAL CA−630、70から、また1%SUPERase Inおよび1%BSAを含むように修飾)中で刃により小片に細分化し、40umセルストレーナー(Falcon)の上部に移した。組織を、4mlの細胞溶解緩衝液中のシリンジプランジャー(5ml、BD)のゴムチップで均質化した。次に、ろ過した核を新しい15mlチューブ(Falcon)に移し、500xgで5分間遠心分離してペレットにし、1mlの細胞溶解緩衝液で1回洗浄した。核を氷上で15分間、4mlの氷冷4%パラホルムアルデヒド(EMS)で固定した。固定後、核を1mlの核洗浄緩衝液(IGEPALを含まない細胞溶解緩衝液)で2回洗浄し、500ulの核洗浄緩衝液に再懸濁した。試料を2つのチューブに分割し、各チューブに250ulを入れ、液体窒素で急速凍結した。
品質管理として、HEK293T細胞およびNIH/3T3細胞をトリプシン処理し、300xgで5分間(4℃)スピンダウンし、1X PBSで1回洗浄した。等細胞数のHEK293T細胞およびNIH/3T3細胞を合わせ、1mLの氷冷細胞溶解緩衝液を用いて溶解し、それに続いてマウス胚の場合と同じ固定化および貯蔵条件にかけた。
sci−RNA−seq3ライブラリーの調製および配列決定
解凍した核を、氷上で3分間0.2%tritonX−100(核洗浄緩衝液中)で透過処理し、核の凝集を減らすために短時間超音波処理(Diagenode、低電力モードで12秒)にかけた。次いで、核を核洗浄緩衝液で1回洗浄し、1ml Flowmiセルストレーナー(Flowmi)に通して濾過した。ろ過した核を500xgで5分間スピンダウンし、核洗浄緩衝液に再懸濁した。
次に、各マウス胚からの核を4つの96ウェルプレートにおけるいくつかの個別のウェルに分配した。ウェルIDとマウス胚の間のリンクを、下流データ処理のために記録した。各ウェルについて、80,000個の核(16μL)を8lの25M固定オリゴdTプライマー(5’−/5Phos/CAGAGCNNNNNNNN[10bpバーコード]TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT−3’(配列番号1)、配列中「N」は任意の塩基である;IDT)および2μLの10 mM dNTPミックス(Thermo)と混合し、55℃で5分間変性させ、直ちに氷上に置いた。次いで、8μLの5X Superscript IV First−Strand Buffer(Invitrogen)、2μlの100mM DTT(Invitrogen)、2μlのSuperScript IV逆転写酵素(200U/μl、Invitrogen)、2μLのRNaseOUT組換えリボヌクレアーゼ阻害剤(Invitrogen)を含む14μLの第1鎖反応ミックスを各ウェルに加えた。プレートを勾配温度(4℃ 2分、10℃ 2分、20℃ 2分、30℃ 2分、40℃ 2分、50℃ 2分、および55℃ 10分)によりインキュベートすることで逆転写を実施した。
RT反応後、60μL核希釈緩衝液(10mM Tris−HCl、pH7.4、10mM NaCl、3mM MgCl2および1%BSA)を各ウェルに加えた。すべてのウェルからの核を一緒にプールし、500xgで10分間スピンダウンした。次に、核を核洗浄緩衝液に再懸濁し、各ウェルに、4μL T4ライゲーション緩衝液(NEB)、2μL T4 DNAリガーゼ(NEB)、4μLベタイン溶液(5M、Sigma−Aldrich)、6μL核洗浄緩衝液中の核、8μLバーコード付きライゲーションアダプター(100uM、5’−GCTCTG[9bpまたは10bpバーコードA]/イデオキシU/ACGACGCTCTTCCGATCT[バーコードAの逆相補体]−3’)(配列番号2)および16μL 40%PEG 8000(Sigma−Aldrich)を含む別の4つの96ウェルプレートに再分配した。ライゲーション反応を、16℃で3時間行った。
RT反応後、60μL核希釈緩衝液(10mM Tris−HCl、pH7.4、10mM NaCl、3mM MgCl2および1%BSA)を各ウェルに加えた。すべてのウェルからの核を一緒にプールし、600xgで10分間スピンした。核を核洗浄緩衝液で1回洗浄し、1ml Flowmiセルストレーナー(Flowmi)で2回ろ過し、カウントし、各ウェルに、5μLの核洗浄緩衝液および5μLの溶出緩衝液(Qiagen)中2,500個の核を含めた、8つの96ウェルプレートに再分配した。次いで、1.33μlのmRNA第2鎖合成緩衝液(NEB)および0.66μlのmRNA第2鎖合成酵素(NEB)を各ウェルに添加し、第2鎖合成を16℃で180分間実施した。
タグ付けのために、各ウェルを11μLのNextera TD緩衝液(Illumina)および1Lのi7のみのTDE1酵素(62.5nM、Illumina)と混合し、55℃で5分間インキュベートしてタグ付けを行った。次いで、1ウェルあたり24μLのDNA結合緩衝液(Zymo)を添加し、室温で5分間インキュベートすることにより、反応を停止させた。次に、各ウェルを、1.5xAMPure XPビーズ(Beckman Coulter)を使用して精製した。溶出段階では、各ウェルに、8μLヌクレアーゼ不含有水、1μL 10X USER緩衝液(NEB)、1μL USER酵素(NEB)を加え、37℃で15分間インキュベートした。別の6.5μL溶出緩衝液を各ウェルに加えた。AMPure XPビーズを磁気スタンドで取り除き、溶出産物を新しい96ウェルプレートに移した。
PCR増幅のために、各ウェル(16μL産物)を2μLの10μMインデックス付きP5プライマー(5’−AATGATACGGCGACCACCGAGATCTACAC[i5]ACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’;IDT)(配列番号3)、2μLの10μM P7プライマー(5’−CAAGCAGAAGACGGCATACGAGAT[i7]GTCTCGTGGGCTCGG−3’、IDT)(配列番号4)、および20LのNEBNext High−Fidelity 2X PCR マスターミックス(NEB)と混合した。次のプログラムを使用して増幅を実行した:72℃で5分間、98℃で30秒間、12〜14サイクル(98℃で10秒間、66℃で30秒間、72℃で1分間)および最終72℃で5分間。
PCR後、試料をプールし、0.8容量のAMPure XPビーズを使用して精製した。ライブラリー濃度を、Qubit(Invitrogen)により決定し、該ライブラリーは6%TBE−PAGEゲルでの電気泳動により視覚化された。すべてのライブラリーは1つのNovaSeqプラットフォーム(Illumina)で配列決定された(リード1:34サイクル、リード2:52サイクル、インデックス1:10サイクル、インデックス2:10サイクル)。
配列決定リード処理
ベースコールを、Illuminaのbcl2fastqを使用してfastq形式に変換し、デフォルト設定の最尤逆多重化パッケージdeML71を使用してPCR i5およびi7バーコードに基づいて逆多重化した。RTインデックスをヘアピンアダプターインデックスと組み合わせ、すなわち、RTインデックスとライゲーション(ED<2、挿入と削除を含む)の両方を使用してリードを逆多重化することにより、マッピングされたリードを構成細胞インデックスに分割したことを除いて、下流配列プロセッシングと単一細胞デジタル発現マトリックス生成はsci−RNA−seq19と同様であった。簡単に述べると、逆多重化されたリードを、RTインデックスとライゲーションインデックス(ED<2、挿入と削除を含む)に基づいてフィルタリングし、アダプターをデフォルト設定でtrim_galore/0.4.1を使用してクリップした。デフォルト設定および遺伝子注釈とともにSTAR/v 2.5.2b72を使用して、トリミングされたリードを、マウス胚核のマウス参照ゲノム(mm10)、またはHEK293TおよびNIH/3T3混合核のヒトhg19およびマウスmm10のキメラ参照ゲノムにマッピングした(ヒト用のGENCODE V19、マウス用のGENCODE VM11)。ユニークマッピングリードを抽出し、ユニーク分子識別子(UMI)配列、逆転写(RT)インデックス、ヘアピンライゲーションアダプターインデックスおよびリード2エンド座標を用いて重複を除去した(すなわち、同一のUMI、RTインデックス、ライゲーションアダプターインデックスおよびタグ付け部位は重複していると見なした)。最後に、RTインデックスおよびライゲーションヘアピン(ED<2、挿入および削除を含む)を使用してリードをさらに逆多重化することにより、マッピングされたリードを構成細胞インデックスに分割した。混合種の実験では、各種のゲノムのユニークマッピングリードのパーセンテージを計算した。1つの種に割り当てられたUMIの85%を超える細胞は種特異的細胞と見なされ、残りの細胞は混合細胞または「衝突」として分類された。デジタル発現マトリックスを生成するため、本発明者らは、Python HTseqパッケージ73を使用して、各遺伝子のエクソン領域およびイントロン領域にマッピングする各細胞の鎖固有のUMIの数を計算した。多重マッピングリードの場合、リードは最も近い遺伝子に割り当てられたが、交差する別の遺伝子が最も近い遺伝子の終わりまで100bp以内に収まる場合は例外で、その場合はリードは破棄された。ほとんどの分析について、本発明者らは、遺伝子ごとの単一細胞発現マトリックスに予想される鎖のイントロンとエクソンの両方のUMIを含めた。
マウス全体胚分析
単一細胞の遺伝子カウントマトリックスが生成された後、各細胞をRTバーコードに基づいて元のマウス胚に割り当てた。各胚へマッピングされるリードを集約して、各胚の「バルクRNA−seq」を生成した。胚の性別分離のために、本発明者らは、雌性特異的非コーディングRNA(Xist)遺伝子またはchr Y遺伝子(chr Xとchr Yの両方にある遺伝子Erdr1を除く)にマッピングされたリードを数えた。胚は、容易に雌性集団(より多くのリードがchr Y遺伝子よりもXist遺伝子にマッピングされる)と雄性集団(より多くのリードがXist遺伝子よりもchr Y遺伝子にマッピングされる)に分離された。
マウス胚全体の偽時系列解析を、Monocle 274によって行った。簡単に述べると、集約された遺伝子発現マトリックスを上記要領で構築した。Monocle 274のdifferentialGeneTest機能を使用して、異なる発達条件にわたって差次的に発現される遺伝子を特定した。最小q値を持つ上位2,000個の遺伝子を使用して、Monocle274を用いて偽時間軌跡を構築した。各胚には、軌跡ツリーに沿ったその位置に基づいて偽時間値が割り当てられた。
細胞クラスタリング、t−SNE視覚化およびマーカー遺伝子特定
デジタル遺伝子発現マトリックスは、上記の生の配列決定データから構築された。UMIが200未満の細胞は破棄した。Monocle274およびPythonパッケージscanpy75を使用して、下流分析を実行した。簡単に述べると、クラスタリングと次元削減の前に、性染色体へマッピングされた遺伝子カウントを削除した。前処理段階は、scanpy75で「zheng17レシピ」関数(n_top__genes=2,000)によってZhengら22により使用されたアプローチに似ている。データの次元を、最初にPCA(30構成要素)、次にt−SNE、その後30の主成分で実行されたルーバンクラスタリング(解像度=1.5)によって削減した。40個のクラスターが特定された。次に、本発明者らは、各クラスターから1,000個の細胞をサンプリングし、Monocle274のDifferentialGeneTest関数を使用して、異なるクラスター間で差次的に発現される遺伝子を特定した。各クラスターに特異的な遺伝子は、以前同様に特定された76。クラスターは、クラスター特異的マーカーに基づいて既知の細胞タイプに割り当てられた(表1)。1つのクラスターは異常に高いUMIカウントを有していたが、クラスター特異的遺伝子は強くないことから、これは細胞ダブレットの技術的人工物であり、したがって除去されてもよいことを示唆している。別の2つのクラスターは両方とも決定的な赤血球系統に対応すると思われ、マージされる。各細胞タイプについての共通発現プロファイルを、76にあるように構築した。細胞タイプ特異的遺伝子マーカーを特定するために、本発明者らは、異なる細胞タイプ(5%のFDR、尤度比検定)で差次的に発現され、また、2番目の最大発現を有する他の細胞タイプと比較して少なくとも2倍増加を伴う各細胞タイプにおける最大発現を有する遺伝子を選択した。
サブクラスター特定のために、本発明者らは、各主要細胞タイプにおける高品質の細胞(UMI>400)を選択し、一般的なクラスター分析と同様にPCA、t−SNE、ルーバンクラスタリングを適用した。クラスターのほとんどの細胞(>50%)が単一胚からのものである場合、高偏向のサブクラスターは除外された。集約されたトランスクリプトームが高度に相関しており(ピアソン相関係数>0.95)、2つのクラスターがt−SNE空間で互いに近接している場合、非常に類似したサブクラスターがマージされた。上記のように、各主要細胞タイプについて、サブクラスター全体で差次的に発現される遺伝子が特定された。
各細胞タイプ(またはサブ細胞タイプ)の細胞数の推定では、まず個々の胚における各細胞タイプの割合を計算し、次にその割合に各胚の推定総細胞数を掛けた(E9.5:200,000、E10.5:1,100,000;E11.5:2,600,000;E12.5:6,100,000;E13.5:13,000,000)。
性特異的な細胞タイプ(またはサブ細胞タイプ)を特定するために、5つの発達段階にわたる雄性と雌性の各細胞タイプ(サブ細胞タイプ)における細胞数を最初に計算した。雄性と雌性との間の細胞タイプ特異的比率を、各発達段階における雄性と雌性との間の全体的な細胞数の比率と比較した。次に、Rでの二項検定を適用して、各細胞タイプにおける雄性と雌性との間で有意差のある細胞タイプまたはサブ細胞タイプを特定した(xおよびnは、各発達段階からの各細胞タイプにおける雌性細胞と総細胞の数であり、pは、各発達段階での雌性細胞比率である)。p値は、Rでのp.adjust関数を使用したBenjamini&Hochbergの方法によって調整されたq値に変換される
AERおよび四肢間葉の偽時間分析
AER細胞、前肢または後肢(hidnlimb)の偽時系列解析を、Monocle 274によって行った。簡単に述べると、Monocle274のDifferentialGeneTest機能を使用して、5つの発達段階にわたって差次的に発現される遺伝子が特定された。最小q値を有する上位500個の遺伝子を使用して、Monocle 274を用いて偽時間軌跡を構築し、細胞ごとのUMIカウントをツリー構築における共変量として使用した。各細胞には、軌跡ツリーに沿った位置に基づいて偽時間値を割り当てた。Monocle274のplot_genes_in_pseudotim関数によって、偽時間に沿って滑らかになった遺伝子マーカー発現の変化が生成された。軌跡内の細胞を、77と同じ方法でグループ分けした。簡単に述べると、偽時間軸(k=10)に沿ってクラスタリングするk−meansにより、まず偽時間における同様の位置で細胞をグループ分けした。これらのクラスターを、少なくとも50個かつ100個を超えない細胞を含むグループに細分化した。次に、本発明者らは、各グループ内の細胞のトランスクリプトームプロファイルを集約した。偽時間に沿った遺伝子発現を、77と同じアプローチで計算した。簡単に述べると、異なる処理条件にわたる有意差検定(5%のFDR)に合格した遺伝子を選択し、自然のスプラインを使用して、mean_number_genesを共変量として偽時間に沿った遺伝子発現に適合させた。各遺伝子の遺伝子発現から最低の発現を引き、それを最高の発現で割った。偽時間の初期の20%以内に最大発現を示す遺伝子は、活性化遺伝子として標識された。偽時間の最後の20%で最大発現を示す遺伝子は、抑制された遺伝子として標識された。他の遺伝子は一過性遺伝子として標識された。EnrichRパッケージ78を使用して、濃縮されたリアクトームターム(Reactome_2016)および転写因子(ChEA_2016)が特定された。
Monocle 3による軌跡推論
Monocle 3のワークフローは、細胞を潜在的に不連続な軌跡に編成する3つのコア段階、次いでそれらの軌跡にわたって発現が変化する遺伝子を見つけるための任意の統計テストにより構成される。Monocle 3には、3次元の軌跡を探索するのに役立つ視覚化ツールも含まれている。
均一多様体近似および投影(UMAP)による次元削減
Monocle 3は、最初にデータを低次元空間に投影し、これにより、細胞がトランスクリプトーム状態の間をどのように移行するかを説明する主グラフの学習が容易になる。Monocle3は、リーマン幾何学と代数トポロジーに基づいて最近提案されたアルゴリズムであるUMAPでこれを行い、次元削減とデータ視覚化79を実行する。その視覚化の品質は、単一細胞トランスクリプトミクスで広く使用されている一般的なt−SNE(t−確率的近傍埋め込み)方法と競合する。しかしながら、t−SNEが主に低次元空間の同じ領域に非常に類似した細胞を配置することを目的としている場合、UMAPの方は長距離の距離関係も保持する。また、UMAPアルゴリズム自体もより効率的である(UMAPのアルゴリズムの複雑さは、t−SNEの場合
と比べて
である)。簡単に述べると、UMAPは最初にローカル多様体近似を使用して高次元データのトポロジカル表現を構築し、そのローカルファジィ単体セット表現を合わせてパッチする。次いで、UMAPは、低次元の埋め込みを最適化し、低次元の表現と高次元の表現の間のクロスエントロピーを最小化する。
UMAPの計算効率により、マウス胚データの分析は劇的に加速された。UMAPは3時間で200万個の細胞データセットの分析を終了するのに対し、t−SNEは10コアで10時間より長くかかる(マルチコアbh−t−SNEが使用される)ことが見出された。いくつかの実装の詳細がUMAPの有効性をもたらす。UMAPとt−SNEの両方のアルゴリズムには、2つの主要な段階が関与している:最初に、高次元空間(通常は上部PCA縮減空間)からの中間構造が構築され、次に低次元埋め込みがその中間構造を表すことがわかる。第2の段階では、両方の方法で損失関数が異なる確率的グリッド降下法を使用して、データを低次元空間に埋め込んだ。t−SNEは全体的な正規化のために損失関数を必要とするが、UMAPはその必要性を回避する別の目的関数を使用する。この段階により、本質的にデータサンプルの数と線形を為すUMAPスケーリングが可能となる。Monocle 3では、reticulateパッケージ(world−wide web atcran.r−project.org/web/packages/reticulate/index.htmlで利用可能)を通じてLeland McInnesとJohn HealyのUMAP python実装(world−wide web atgithub.com/lmcinnes/umapで利用可能)と対話する。
不連続な軌跡への細胞の分割
最近、Wolfと同僚は、単一細胞トランスクリプトームデータを、発達的に互いに関連していてもよい細胞のクラスターを関連付ける「アブストラクト分割グラフ」(AGA)にまとめ上げるというアイデアを提案した。簡単に述べると、彼らのアルゴリズムは、細胞のk最近傍グラフを構築し、次いでCyTOFまたは単一セルRNA−seqデータを分析する従来の方法80と同様に、ルーバン法を介して細胞の「コミュニティ」を特定する。次いで、AGAは、頂点がルーバンコミュニティであるグラフを構築する。それぞれのコミュニティの細胞がkNNグラフの近傍のものである場合、単純な二項モデル81で予想されるよりも頻繁に2つの頂点がAGAグラフのエッジにリンクされる。同様の方法も最近開発され、ゼブラフィッシュとアフリカツメガエルの細胞アトラスデータセットの分析に適用された82、83
Monocle 3はこれらのアイデアから導き出され、まずUMAP空間の細胞についてkNNグラフを構築し、次にそれらをルーバンコミュニティにグループ分けし、各細胞間におけるかなりの数のリンクについてコミュニティの各ペアを試験する。擬似リンケージの帰無仮説のもとで予想よりも多くのリンクがあるコミュニティ(FDR<10%)は、AGAグラフで連結されたままであり、この試験に失敗したリンクは切断される。その結果得られるAGAグラフには1つ以上の成分があり、各成分は、軌跡にて編成されることになる個別の細胞群として次の段階(L1−グラフ)に引き継がれる。AGAアルゴリズムは本質的にこの段階で停止し、AGAグラフを各コミュニティの粗視化軌跡の一種として提示するが、これは、細胞が発達するにつれて採ることができるさまざまな状態を反映する。対照的に、次の項で説明するように、Monocle 3はAGAグラフを使用して、最終的な軌跡を形成することができる主グラフの空間を制限する。すなわち、Monocle 3は粗視化されたAGAグラフを使用して、粗視化軌跡の学習を行う。
上記の手順のMonocle 3の実装は、数百万個の細胞に合わせて調整される。簡単に述べると、igraphパッケージのclustering_louvain関数を使用して、コミュニティ検出を実行する。次に、WolfらのコアAGA計算は、一連のスパース行列演算を介して計算される。Xを細胞のコミュニティメンバーシップを表す(スパース)行列とする。Xの各列はルーバンコミュニティを表し、Xの各行は特定細胞に対応する。細胞
がルーバンコミュニティ
に属する場合
であり、そうでない場合は0である。細胞
がkNNグラフで
に連結する場合
である、ルーバンクラスタリングを実行するために使用されるkNNグラフの隣接行列
をさらに取得することができる。次に、各クラスター間の結合マトリックス
は次のように計算される、
が構築されたら、参考文献81の補足ノート3.1に従い、各ルーベンクラスタリング間の連結の重要性を計算し、デフォルトで0.05より大きいp値を持つクラスターは切断されていないと見なすことができる。
主グラフの学習
Monocle 3は、データと同じ低次元空間に存在する主グラフを学習し、細胞が発達するにつれて採ることができる可能な経路を表示する。Monocle 3は、L1グラフアルゴリズム84の強化された実装を使用して、主グラフを学習する。Maoらは、L1グラフアプローチの2つのバージョンを報告した84。最初(「アルゴリズム1」)には、データセット内のすべての個々のデータポイントに関して最適化を行う。以前、本発明者らは、L1グラフを単一細胞RNA配列データに適用することはできるが、ダウンサンプリングに対してロバストではない非常にノイズの多いグラフを学習する傾向があり、このアプローチが数百細胞を超えるデータセットに有効にはスケーリングしないことを示した85。Qiuらでは、K−meansクラスタリングアルゴリズムを使用して「ランドマーク」データポイントのセットを最初に選択する「アルゴリズム2」を検討しなかった。次いで、アルゴリズムは、この非常に小さいデータのサンプルに対して最適化を行う。Monocle 3はこのアプローチを使用するもので、このアプローチは、UMAP空間にある細胞に適用すると、ロバストであり、かついくつかの重要な変更を加えることで数百万の細胞に合わせて調整することができる。
L1−graphの実装には、大きなデータセットの分析と主グラフのロバストな回復をサポートするいくつかの重要な特徴がある。最初に、(デフォルトでは3次元の)UMAP空間でL1グラフを学習する。Kメディオイドクラスタリングを使用してランドマーク細胞を選択し、最適化を加速する。選択したランドマーク細胞の数は、アルゴリズムの実行時間とソリューションの品質に影響を与える:ランドマークが多すぎると、実行不可能な線形プログラミングの問題が発生することになる。したがって、Kを細胞間で検出されたルーバンコミュニティの数の3倍に設定することにより、データに依存した方法でランドマークの数を決定し、実際に、迅速で安定したソリューションが導かれる。
L1グラフの2番目の主要な最適化は、最適化で考慮されるすべての可能なグラフWの「実行可能な」空間に制約を課すことである。Maoらは、ランドマークデータポイント間のすべての可能なエッジを検討した。しかしながら、わずか千程度のランドマーク細胞があったとしても、変数の数はグラフ内のエッジの数の関数であるため、線形プログラミング問題は迅速に実行不可能となることができる。Monocle3では、ランドマークポイント上に構築された最小スパニングツリー(MST)にあるか、MSTにおいて奇数度の頂点に構築されたkNNグラフ(デフォルトではk=3)にある実行可能空間へのエッジのみを許可する。最後に、前の項で説明したように構築されたAGAグラフの異なる連結成分における細胞をリンクするエッジを除外する。
軌跡依存的発現を伴う遺伝子の特定
発達軌跡上で発現が変化する遺伝子を特定するために、空間データの分析で一般的に使用される統計的検定を借りる。Moran’s I統計は、多方向および多次元の空間自己相関の尺度である。この統計は、最近傍グラフを介してデータポイント間の空間的関係をエンコードするため、大規模な単一細胞RNA−seqデータセットの分析に特に適している。
Moran’s I test 86は次のように定義される
式中、
は、
および
でインデックス付けされた細胞の数である;
は、興味の対象である遺伝子の発現値である;
は、細胞
の最近傍の遺伝子発現の平均である;
は、対角線上にゼロをもつ最近傍グラフ(すなわち、
)および
で定義された重みの行列であり、ここで
は最近傍の数である;そして、
は、全
の合計である。
重み行列Wの作成に使用される最近傍を特定するために、まずUMAP空間におけるすべての細胞に対してk(デフォルトは25とする)の最近傍グラフ(kNN)を構築する。また、各細胞を主グラフの最も近いノードに投影する。次いで、主グラフノードに投影される細胞を連結するkNNグラフからのすべてのエッジを削除し、エッジを共有しない。
Monocle 3では、manifoldTest関数を実装して、Moran’s I試験を実行するためにspdepパッケージのルーチンの修正バージョンに依存する多様体相関遺伝子を特定した。
REFERENCES
1. Fogarty, N. M.E.et al.Genome editing reveals a role for OCT4 in human embryogenesis. Nature 550, 67-73 (2017).
2. Kojima, Y., Tam, O. H. & Tam, P.P.L. Timing of developmental events in the early mouse embryo. Semin. Cell Dev. Biol.34, 65-75 (2014).
3. Tam, P.P.L. & Loebel, D.A.F. Gene function in mouse embryogenesis:get set for gastrulation. Nat.Rev. Genet.8, 368-381 (2007).
4. Rivera-Perez, J.A. & Hadjantonakis, A.-K.The Dynamics of Morphogenesis in the Early Mouse Embryo. Cold Spring Harb. Perspect. Biol.7, a015867 (2014).
5. Dickinson, M.E.et al.High-throughput discovery of novel developmental phenotypes. Nature 537, 508-514 (2016).
6. Meehan, T. F. et al.Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nat.Genet.49, 1231-1238 (2017).
7. Shyer, A.E., Huycke, T. R., Lee, C., Mahadevan, L. & Tabin, C.J.Bending gradients:how the intestinal stem cell gets its home. Cell 161, 569-580 (2015).
8. Uygur, A.et al.Scaling Pattern to Variations in Size during Development of the Vertebrate Neural Tube. Dev. Cell 37, 127-135 (2016).
9. Gorkin, D.et al.Systematic mapping of chromatin state landscapes during mouse development. (2017). doi:10.1101/166652
10. Mayer, C.et al.Developmental diversification of cortical inhibitory interneurons. Nature 555, 457-462 (2018).
11. Lescroart, F. et al.Defining the earliest step of cardiovascular lineage segregation by single-cell RNA-seq. Science (2018). doi:10.1126/science.aao4174
12. Han, X. et al.Mapping the Mouse Cell Atlas by Microwell-Seq. Cell 172, 1091-1107.e17 (2018).
13. The Tabula Muris Consortium, Quake, S.R., Wyss-Coray, T. & Darmanis, S.Transcriptomic characterization of 20 organs and tissues from mouse at single cell resolution creates a Tabula Muris. (2017). doi:10.1101/237446
14. Amini, S.et al.Haplotype-resolved whole-genome sequencing by contiguity-preserving transposition and combinatorial indexing. Nat.Genet.46, 1343-1349 (2014).
15. Adey, A.et al.In vitro, long-range sequence information for de novo genome assembly via transposase contiguity. Genome Res.24, 2041-2049 (2014).
16. Cusanovich, D.A.et al.Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing. Science 348, 910-914 (2015).
17. Vitak, S.A.et al.Sequencing thousands of single-cell genomes with combinatorial indexing. Nat.Methods 14, 302-308 (2017).
18. Ramani, V.et al.Massively multiplex single-cell Hi-C.Nat.Methods 14, 263-266 (2017).
19. Cao, J.et al.Comprehensive single-cell transcriptional profiling of a multicellular organism. Science 357, 661-667 (2017).
20. Mulqueen, R.M.et al.Scalable and efficient single-cell DNA methylation sequencing by combinatorial indexing. (2017). Doi:10.1101/157230
21. Rosenberg, A.B. et al.Single-cell profiling of the developing mouse brain and spinal cord with split-pool barcoding. Science (2018). doi:10.1126/science.aam8999
22. Zheng, G.X. Y. et al.Massively parallel digital transcriptional profiling of single cells. Nat.Commun. 8, 14049 (2017).
23. Qiu, X. et al.Reversed graph embedding resolves complex single-cell developmental trajectories. (2017). doi:10.1101/110668
24. Fernandez, T. et al.Disruption of contactin 4 (CNTN4) results in developmental delay and other features of 3p deletion syndrome. Am.J.Hum. Genet.74, 1286-1293 (2004).
25. Olson, J.M.et al.NeuroD2 is necessary for development and survival of central nervous system neurons. Dev. Biol.234, 174-187 (2001).
26. Uittenbogaard, M., Baxter, K.K. & Chiaramello, A.NeuroD6 Genomic Signature Bridging Neuronal Differentiation to Survival via the Molecular Chaperone Network. J.Neurosci. Res.88, 33 (2010).
27. Yang, A.et al.p63 is essential for regenerative proliferation in limb, craniofacial and epithelial development. Nature 398, 714-718 (1999).
28. McQualter, J.L., Yuen, K., Williams, B. & Bertoncello, I. Evidence of an epithelial stem/progenitor cell hierarchy in the adult mouse lung. Proc.Natl.Acad.Sci.U. S.A.107, 1414-1419 (2010).
29. Cichorek, M., Wachulska, M., Stasiewicz, A. & Tyminska, A.Skin melanocytes:biology and development. Advances in Dermatology and Allergology 1, 30-41 (2013).
30. Tomihari, M., Hwang, S.-H., Chung, J.-S., Cruz, P.D., Jr. & Ariizumi, K.Gpnmb is a melanosome-associated glycoprotein that contributes to melanocyte/keratinocyte adhesion in a RGD-dependent fashion. Exp. Dermatol. 18, 586-595 (2009).
31. Varjosalo, M. & Taipale, J.Hedgehog:functions and mechanisms. Genes Dev. 22, 2454-2472 (2008).
32. Straehle, U., Lam, C.S., Ertzer, R. & Rastegar, S.Vertebrate floor-plate specification:variations on common themes. Trends Genet.20, 155-162 (2004).
33. Holmes, G.P.et al.Distinct but overlapping expression patterns of two vertebrate slit homologs implies functional roles in CNS development and organogenesis. Mech. Dev. 79, 57-72 (1998).
34. Akle, V.et al.F-spondin/spon1b expression patterns in developing and adult zebrafish. PLoS One 7, e37593 (2012).
35. Hartman, B. H., Durruthy-Durruthy, R., Laske, R.D., Losorelli, S. & Heller, S.Identification and characterization of mouse otic sensory lineage genes. Front. Cell. Neurosci. 9, 79 (2015).
36. Petit, F., Sears, K.E. & Ahituv, N. Limb development:a paradigm of gene regulation. Nat.Rev. Genet.18, 245-258 (2017).
37. Guo, Q., Loomis, C. & Joyner, A.L. Fate map of mouse ventral limb ectoderm and the apical ectodermal ridge. Dev. Biol.264, 166-178 (2003).
38. Lewandoski M, E.al. Fgf8 signalling from the AER is essential for normal limb development. - PubMed - NCBI. Available at:https://www.ncbi.nlm.nih.gov/pubmed/11101846. (Accessed:22nd April 2018)
39. Aoki M, E.al. R-spondin2 expression in the apical ectodermal ridge is essential for outgrowth and patterning in mouse limb development. - PubMed - NCBI. Available at:https://www.ncbi.nlm.nih.gov/pubmed/18067586. (Accessed:22nd April 2018)
40. Gerdes, J., Schwab, U., Lemke, H. & Stein, H. Production of a mouse monoclonal antibody reactive with a human nuclear antigen associated with cell proliferation. Int.J.Cancer 31, 13-20 (1983).
41. Bergman, D., Halje, M., Nordin, M. & Engstroem, W.Insulin-like growth factor 2 in development and disease:a mini-review. Gerontology 59, 240-249 (2013).
42. Trapnell, C.et al.The dynamics and regulators of cell fate decisions are revealed by pseudotemporal ordering of single cells. Nat.Biotechnol.32, 381-386 (2014).
43. McInnes, L. & Healy, J.UMAP:Uniform Manifold Approximation and Projection for Dimension Reduction. (2018).
44. Alexander Wolf, F. et al.Graph abstraction reconciles clustering with trajectory inference through a topology preserving map of single cells. bioRxiv 208819 (2017). doi:10.1101/208819
45. Qiu, X. et al.Reversed graph embedding resolves complex single-cell trajectories. Nat.Methods 14, 979-982 (2017).
46. Singh, M.K.et al.The T-box transcription factor Tbx15 is required for skeletal development. Mech. Dev. 122, 131-144 (2005).
47. Paine-Saunders, S., Viviano, B. L., Zupicich, J., Skarnes, W.C. & Saunders, S.glypican-3 controls cellular responses to Bmp4 in limb patterning and skeletal development. Dev. Biol.225, 179-187 (2000).
48. Hara, K. & Ide, H. Msx1 expressing mesoderm is important for the apical ectodermal ridge (AER)-signal transfer in chick limb development. Dev. Growth Differ. 39, 705-714 (1997).
49. Lupianez, D.G.et al.Disruptions of Topological Chromatin Domains Cause Pathogenic Rewiring of Gene-Enhancer Interactions. Cell 161, 1012-1025 (2015).
50. Davis, R.J.et al.Dach1 mutant mice bear no gross abnormalities in eye, limb, and brain development and exhibit postnatal lethality. Mol.Cell. Biol.21, 1484-1490 (2001).
51. Akiyama, H., Chaboissier, M.-C., Martin, J.F., Schedl, A. & de Crombrugghe, B. The transcription factor Sox9 has essential roles in successive steps of the chondrocyte differentiation pathway and is required for expression of Sox5 and Sox6. Genes Dev. 16, 2813-2828 (2002).
52. Deng, Y. et al.Yap1 Regulates Multiple Steps of Chondrocyte Differentiation during Skeletal Development and Bone Repair. Cell Rep. 14, 2224-2237 (2016).
53. Joshi, S.et al.TEAD transcription factors are required for normal primary myoblast differentiation in vitro and muscle regeneration in vivo. PLoS Genet.13, e1006600 (2017).
54. Knapp, D.et al.Comparative transcriptional profiling of the axolotl limb identifies a tripartite regeneration-specific gene program. PLoS One 8, e61352 (2013).
55. Zeller, R., Lopez-Rios, J. & Zuniga, A.Vertebrate limb bud development:moving towards integrative analysis of organogenesis. Nat.Rev. Genet.10, 845-858 (2009).
56. Nishimoto, S., Minguillon, C., Wood, S. & Logan, M.P.O. A combination of activation and repression by a colinear Hox code controls forelimb-restricted expression of Tbx5 and reveals Hox protein specificity. PLoS Genet.10, e1004245 (2014).
57. Vargesson, N., Luria, V., Messina, I., Erskine, L. & Laufer, E.Expression patterns of Slit and Robo family members during vertebrate limb development. Mech. Dev. 106, 175-180 (2001).
58. Chimal-Monroy, J.et al.Analysis of the molecular cascade responsible for mesodermal limb chondrogenesis:Sox genes and BMP signaling. Dev. Biol.257, 292-301 (2003).
59. Braun, T. & Gautel, M.Transcriptional mechanisms regulating skeletal muscle differentiation, growth and homeostasis. Nat.Rev. Mol.Cell Biol.12, 349-361 (2011).
60. Tajbakhsh, S., Rocancourt, D., Cossu, G. & Buckingham, M.Redefining the genetic hierarchies controlling skeletal myogenesis:Pax-3 and Myf-5 act upstream of MyoD.Cell 89, 127-138 (1997).
61. Harel, I. et al.Distinct origins and genetic programs of head muscle satellite cells. Dev. Cell 16, 822-832 (2009).
62. Sambasivan, R.et al.Distinct regulatory cascades govern extraocular and pharyngeal arch muscle progenitor cell fates. Dev. Cell 16, 810-821 (2009).
63. Heimberg, G., Bhatnagar, R., El-Samad, H. & Thomson, M.Low Dimensionality in Gene Expression Data Enables the Accurate Extraction of Transcriptional Programs from Shallow Sequencing. Cell Syst 2, 239-250 (2016).
64. Cusanovich, D.A.et al.The cis-regulatory dynamics of embryonic development at single cell resolution. (2017). doi:10.1101/166066
65. McKenna, A.et al.Whole-organism lineage tracing by combinatorial and cumulative genome editing. Science 353, aaf7907 (2016).
66. Osterwalder, M.et al.Enhancer redundancy provides phenotypic robustness in mammalian development. Nature 554, 239-243 (2018).
67. Dickel, D.E.et al.Ultraconserved Enhancers Are Required for Normal Development. Cell 172, 491-499.e15 (2018).
68. Li, D.et al.Formation of proximal and anterior limb skeleton requires early function of Irx3 and Irx5 and is negatively regulated by Shh signaling. Dev. Cell 29, 233-240 (2014).
69. Kraft, K.et al.Deletions, Inversions, Duplications:Engineering of Structural Variants using CRISPR/Cas in Mice. Cell Rep. (2015). doi:10.1016/j.celrep.2015.01.016
70. Buenrostro, J.D., Giresi, P.G., Zaba, L. C., Chang, H. Y. & Greenleaf, W.J.Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat.Methods 10, 1213-1218 (2013).
71. Renaud, G., Stenzel, U., Maricic, T., Wiebe, V. & Kelso, J.deML:robust demultiplexing of Illumina sequences using a likelihood-based approach. Bioinformatics 31, 770-772 (2015).
72. Dobin, A.et al.STAR:ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
73. Anders, S., Pyl, P.T. & Huber, W.HTSeq--a Python framework to work with high-throughput sequencing data. Bioinformatics btu638 (2014).
74. Qiu, X. et al.Reversed graph embedding resolves complex single-cell developmental trajectories. (2017). doi:10.1101/110668
75. Wolf, F. A., Angerer, P. & Theis, F. J.SCANPY:large-scale single-cell gene expression data analysis. Genome Biol.19, 15 (2018).
76. Cao, J.et al.Comprehensive single-cell transcriptional profiling of a multicellular organism. Science 357, 661-667 (2017).
77. Pliner, H. et al.Chromatin accessibility dynamics of myogenesis at single cell resolution. (2017). doi:10.1101/155473
78. Kuleshov, M.V.et al.Enrichr:a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Res.44, W90-7 (2016).
79. McInnes, L. & Healy, J.UMAP:Uniform Manifold Approximation and Projection for Dimension Reduction. (2018).
80. Levine, J.H. et al.Data-Driven Phenotypic Dissection of AML Reveals Progenitor-like Cells that Correlate with Prognosis. Cell 162, 184-197 (2015).
81. Wolf, F. A.et al.Graph abstraction reconciles clustering with trajectory inference through a topology preserving map of single cells. (2017). doi:10.1101/208819
82. Wagner, D.E.et al.Single-cell mapping of gene expression landscapes and lineage in the zebrafish embryo. Science eaar4362 (2018).
83. Briggs, J.A.et al.The dynamics of gene expression in vertebrate embryogenesis at single-cell resolution. Science eaar5780 (2018).
84. Mao, Q., Wang, L., Tsang, I. & Sun, Y. Principal Graph and Structure Learning Based on Reversed Graph Embedding. IEEE Trans. Pattern Anal. Mach. Intell. (2016). doi:10.1109/TPAMI.2016.2635657
85. Qiu, X. et al.Reversed graph embedding resolves complex single-cell trajectories. Nat.Methods 14, 979-982 (2017).
86. Moran, P.A.P.Notes on continuous stochastic phenomena. Biometrika 37, 17-23 (1950).
実施例2
組織核の抽出と固定化の新しい手法(sc−RNA−seq)
試薬。BSA(分子生物学グレード、NEB、#B9000S);SuperRnase阻害剤(Thermo、#AM2696);EMS 157−4−100 4%パラホルムアルデヒド(ホルムアルデヒド)水溶液、EMグレード、100mL(Amazon)。
緩衝液。核緩衝液(4℃で保存):10mM Tris−HCl、pH7.4、10mM NaCl、3mM MgCl2。10%IGEPAL CA−630(4℃で保存)。核洗浄緩衝液(毎回新鮮なものを作製):10ul BSAおよび10ul SuperRnaseInを含む980ul核緩衝液、よく混ぜて氷上で保存する。核溶解緩衝液(毎回新鮮なものを作製):0.1%IGEPAL CA−630を含む核洗浄緩衝液。
組織からの直接的核抽出
組織を1mLの氷冷細胞溶解緩衝液(10mM Tris−HCl、pH7.4、10mM NaCl、3mM MgCl2および0.1%IGEPAL CA−630、1%SUPERase Inおよび1%BSA)中で刃により小片に細分化し、40umセルストレーナー(Falcon)の上部に移した。
組織を、4mlの細胞溶解緩衝液中のシリンジプランジャー(5ml、BD)のゴムチップで均質化した。
次に、ろ過した核を新しい15mlチューブ(Falcon)に移し、500xgで5分間遠心分離してペレットにし、1mlの細胞溶解緩衝液で1回洗浄した。
核固定化
核を氷上で15分間、4mlの氷冷4%パラホルムアルデヒド(EMS)で固定した。
固定後、核を1mlの核洗浄緩衝液(IGEPALを含まない細胞溶解緩衝液)で2回洗浄し、500ulの核洗浄緩衝液に再懸濁した。
試料をいくつかに分割し、液体窒素で瞬間凍結しました。凍結した試料はドライアイスで輸送することができる。
実施例3
Sci−Fateによる単一細胞状態移行動態の特性評価
発達の美しさは、厳密に組織化された時間的順序での多様な細胞状態の生成にある。単一細胞ゲノム技術の増殖にもかかわらず、細胞状態移行動態を定量的に決定することは依然として困難である。ここで本発明者らは、数千の単一細胞のそれぞれで全トランスクリプトームおよび新しく合成されたトランスクリプトームの両方をプロファイリングするためのコンビナトリアルインデックス付け方式ハイスループットアッセイであるsci−fateを紹介する。概念実証として、本発明者らは、コルチゾール応答のモデル系にsci−fateを適用し、糖質コルチコイド受容体活性化時の既知の細胞周期動態と一致する、6,000を超える単一細胞状態移行事象にわたって特性評価を行った。その分析から、本発明者らは、細胞の状態移行の方向と確率が状態間距離と状態不安定性のランドスケープによって規制されていることを示した。この手法と計算アプローチは、細胞状態の動態を定量的に特性評価し、細胞運命決定の内部メカニズムを解読するために、他の生物系に容易に適用することができる。
細胞は、多細胞生物の発達の間に機能的および分子的に異なる状態を通過する。細胞状態移行経路、または細胞の運命を特徴付けることは、細胞工学技術などの開発およびアプリケーションを理解する上での中核である。単一細胞ゲノム技術の手法は増殖しているが、細胞の状態のスナップショットを捉えるだけであるため、細胞移行動態に関する情報を提供することはできない(1)。タイムラプス顕微鏡に基づく単一細胞追跡を使用して、細胞状態の移行を特徴付けることはできるが(2、3)、スループットが制限され、いくつかの遺伝子の変化のみを追跡できるため、複雑なシステムを解読する能力が低くなる。
ここで、本発明者らは、トランスクリプトーム全体のレベルで定量的な細胞状態移行動態を推測するための新しい戦略について説明する。この戦略は、新しいコンビナトリアルインデックス付け方式単一細胞RNA−seq技術、sci−fateに依存する。逆転写中にC>T点変異を生じさせることになる4−チオウリジン(4、5)で新しく合成されたmRNAを標識することにより、sci−fateは、過去の状態からの劣化したトランスクリプトーム情報(過去の状態の記憶)と一緒に、全トランスクリプトームと新しく合成されたトランスクリプトームの両方を単一細胞レベルで捉える。次いで、各細胞の過去の状態の記憶を、mRNA分解率(記憶補正技術)によって補正することにより、各細胞を2つの時点の間におけるトランスクリプトーム動態によって特徴付けることができる。
内因性因子および外因性因子によって調節される細胞状態移行動態の特徴を明らかにするために、本発明者らは、細胞の運命が2つの主要な力:内因性細胞周期プログラムおよび外因性薬物誘発糖質コルチコイド受容体(GR)活性化によって推進される、コルチゾール応答のモデル系にsci−fateを適用した。GRの活性化は、体内のほぼすべての細胞の活性に影響を与え、発達、代謝および免疫応答を制御する遺伝子を調節する(6)。Sci−fateを使用して、本発明者らは、6,000を超える単一細胞のトランスクリプトーム動態全体のプロファイルを作成した。過去のトランスクリプトーム状態と現在のトランスクリプトーム状態の類似性に基づいて、本発明者らは、5つの時点にまたがる数千の細胞状態移行軌跡を構築し、GR活性化における既知の細胞周期進行パターンと一致する3タイプの細胞運命にクラスター化することができる。さらに本発明者らは、機能的なTFモジュール活性によって細胞の隠された状態を特徴づけ、細胞状態予測のための細胞移行ネットワークを推測した。最後に、本発明者らは、細胞状態の移行の方向と確率が、トランスクリプトームの類似性とその近くの状態の不安定なランドスケープによって調節されていることを示した。ここで開発された理論的、計算的および実験的アプローチは、細胞移行の動態がまだ不明である他の生物系に容易に適用できるはずである。
sci−fateの概要
sci−fateは次の段階に依存する(図30A):(i)最初に、新しく合成されたRNAを標識するために広く使用されているチミジン類似体である、4−チオウリジン(S4U)と細胞をインキュベートした(7−13)。(ii)細胞を採取し、4%パラホルムアルデヒドで固定した後、求核置換によりカルボキシアミドメチル基をS4Uに共有結合させるチオール(SH)結合アルキル化反応を行う(4)。(iii)4x96ウェルプレートの各ウェルに細胞をバルクで分配した。最初のRNA−seq分子インデックスは、ウェル固有のバーコードと縮重ユニーク分子識別子(UMI)の両方を保持するポリ(T)プライマーを使用したin situ逆転写(RT)により、各ウェルの細胞のmRNAに導入される。cDNA合成中、修飾S4Uで標識されたmRNAはチミンからシトシンへの(T>C)変換を模倣し、変異した第1鎖cDNAをもたらす。(iv)すべてのウェルからの細胞をプールし、次いで蛍光活性化細胞選別法(FACS)によって複数の96ウェルプレートに再分配する。細胞を、DAPI(4’,6−ジアミジノ−2−フェニルインドール)染色でゲーティングし、選別中に単一細胞をダブレットと区別する。二本鎖cDNAはRNA分解と第2鎖合成により生成され、Tn5による転位を受ける。次に、5’末端のTn5アダプターと3’末端のRTプライマーを認識するプライマーの組み合わせを使用して、ポリメラーゼ連鎖反応(PCR)によりcDNAを増幅する。これらのプライマーには、第2のRNA−seq分子インデックスを導入する十分に特異的なバーコードも付いている。(v)PCRからのアンプリコンをプールし、超並列配列決定にかける。他の「sci−」プロトコル(14〜21)と同様に、ほとんどの核はウェルのユニークな組み合わせを通過するため、各細胞の内容物は、同じ細胞に由来するリードをグループ分けするのに使用できるバーコードのユニークな組み合わせでマークされる。全トランスクリプトームから新しく合成されたmRNAは、バックグラウンドエラーを補正した「T>C」変換(方法)によって特定される。
品質管理として、本発明者らは、最初にHEK293T(ヒト)細胞およびNIH/3T3(マウス)細胞の混合物で、S4U標識(200nM、6時間)の有無にかかわらず、またIAA処理の有無にかかわらず4つの条件下で本技術を試験した(図31A−図31D)。S4U標識およびIAA処理(sci−fate条件)により、ヒト/マウス細胞からのトランスクリプトームは、圧倒的に種コヒーレント(ヒト細胞およびマウス細胞の両方について99%を超える純度、2.6%の衝突)であり、T>C変異リードの高い比率が検出された(sci−fate条件におけるヒト細胞の46%およびマウス細胞の31%に対し無処理条件におけるヒト細胞の0.8%およびマウス細胞の0.8%)。本発明者らは、IAA処理群でわずかに低いUMIが検出されたにもかかわらず、4つの条件でほぼ同等の細胞純度を得た。sci−fateと通常のsci−RNA−seqの集約されたトランスクリプトームは高度に相関しており(スピアマンの相関r=0.99;図31E〜図31F)、短期の標識付けと変換プロセスは細胞状態に最小限の影響しか与えないことを示唆していた。
デキサメタゾン処理A549細胞における総トランスクリプトームおよび新規合成トランスクリプトームの共同プロファイリング
次に、本発明者らはコルチゾール応答のモデルにsci−fateを適用したが、コルチゾールの合成模倣物であるデキサメタゾン(DEX)は、糖質コルチコイド受容体(GR)を活性化し、これがゲノム全体における数千の場所に結合し、細胞状態を短期間のうちに著しく変えてしまう(22〜25)。本発明者らは、肺腺がん由来のA549細胞を0時間、2時間、4時間、6時間、8時間、または10時間100nM DEXで処理した。各条件において、384x192ウェルのsci−fateについての採取前の最後の2時間、細胞をS4U(200nM)とインキュベートした(図30B)。6つの条件は、各細胞の第1のインデックスに基づいて処理条件を回復できるように、インデックス付けの最初のラウンド中に64のウェルでそれぞれ提示された。
低品質の細胞、潜在的なダブレット、および分化した細胞の小さなサブグループを除外した後(方法)、本発明者らは、1細胞あたり20%の標識UMIの中央値で、6,680個の細胞の単一細胞プロファイル(1細胞あたり検出された26,176のmRNAの中央値)を得た(図30C、図32A−図32B)。イントロンリードは、エクソンリードよりも著しく高い新規合成率を示し(イントロンリードで65%対エクソンリードで13%、p値<2.2e−16、ウィルコクソンの符号付きランクテスト;図30D)、イントロンのリードは、新しく合成されたトランスクリプトームで濃縮されているという予測と一致している。
本発明者らはまず、全トランスクリプトームと新しく合成されたトランスクリプトームが細胞状態の特性評価において異なる情報を伝えるかどうかを尋ねた。全トランスクリプトームと新たに合成されたトランスクリプトームを各処理条件について集約し、それらの相関を確認した。全トランスクリプトームとは異なり、新しく合成されたトランスクリプトームは、無DEX処理群(0h)と処理群との間に明確な違いを示した(図32C)。これと一致して、全トランスクリプトームまたは新規に合成されたトランスクリプトームでの均一多様体近似および投影(UMAP)(26)による次元削減は、異なる結果をもたらす(図30E):全トランスクリプトームでは、無DEX処理(0h)細胞と初期DEX処理(2h)細胞を分離できないが、新しく合成されたトランスクリプトームは、すべてのDEX処理細胞を単一の群に集約する。全トランスクリプトームまたは新たに合成されたトランスクリプトームにより特定された細胞クラスターは、互いに完全には一致しない(図30F、図32D−図32E)。これは、新しく合成されたトランスクリプトームが遺伝子プロモーター活性、または外部環境に対するエピジェネティックな応答を直接反映するのに対し、全トランスクリプトームはその過去の状態からの残りのmRNAによってほとんど決定されるため、予想されることである。
結合情報で細胞状態の特性を明らかにするため、本発明者らは、UMAP分析のために全トランスクリプトームおよび新しく合成されたトランスクリプトームからの上位主成分(PC)を組み合わせた。結合情報は、細胞を無DEX処理(0h)、早期処理(2h)および後期処理(>2h)に分ける(図30E)。興味深いことに、全トランスクリプトームにより特性評価される2つのクラスター(クラスター1および4)は、結合情報によって4つの別個の群に分割された(図30F)。本発明者らは、細胞周期関連遺伝子マーカーの発現レベルと新規合成率を確認した(27)(図30G、図32F〜図32G):結合情報により新しく分離されたクラスターは、G2/M期細胞(G2/Mマーカーの高発現および高合成率))および初期G0/G1期細胞(G2/Mマーカーの高発現および低合成率)に対応する。これは、新しく合成されたトランスクリプトームが、全トランスクリプトームと比較して異なる細胞状態情報を伝達することを示唆しており、結合情報は細胞状態の特性評価においてより高い分解度を潜在的に可能にする。
細胞運命決定を促進する機能的TFモジュールの特性評価
次に、本発明者らは、細胞状態の移行を推進するTFモジュールの特性評価を試みた。転写因子(TF)とその調節遺伝子間のリンクは、2つの段階で特定された:各遺伝子について、本発明者らは、LASSO(最小絶対収縮および選択演算子)を使用して、過去2時間のmRNA合成率と6,000を超える細胞のTF発現レベルとの相関を計算した。これらの特定されたリンクは、公開されたCHIP−seqデータ(28)またはモチーフ濃縮分析(29)(方法)によってさらにフィルタリングされた。合計で、TF遺伝子の共分散に基づき、DNA結合データによって検証された29のTFと532の遺伝子(図33A、表S1)の間で986のリンクを特定した。リンクが正則化回帰のアーティファクトである可能性を評価するために、TF発現マトリックスのサンプルIDを並べ替え、同じ分析を実行した。この並べ替えの後、リンクは特定されなかった。
CEBPB(30)(図34A−図34B)、FOXO1(31)、およびJUNB(32)(図33A)などの既知のGR応答エフェクターを含む、GR応答を推進するTFモジュールが特定されている。また、本発明者らは、YOD1およびGTF2IRD1を含むいくつかの新規GR応答関連TFモジュールを見出しており、これらは、DEX処理細胞において発現と活性の両方がアップレギュレーションされていた(図34C−図34D)。細胞周期の進行を促進する主なTFモジュールが特定されており、これらにはE2F1、E2F2、E2F7、BRCA1、およびMYBL2が含まれる(33)。総発現レベルと比較して、細胞周期TFモジュールによる調節遺伝子の新しいRNA合成率は、標的TF発現との高い相関を示す(図34E)。さらに、本発明者らはまた、主に静止細胞集団の群で発現される(34)、GATA3などの細胞分化に関連するTFモジュール、ならびにNRF1(35)およびNFE2L2(NRF2)(36)などの酸化ストレス応答に関連するTFモジュールも見出した。
次に、本発明者らは、各TFモジュール内の遺伝子の新しいRNA合成率を集約することでTF活性について特性評価し、各TFペア間の絶対相関係数を計算した(図34F)。相関性の高いTF活性は、TFモジュールがリンクされたプロセスで機能してもよいことを示唆している。階層的クラスタリングは、これら29のTFモジュールを5つの主要なモジュールに分離する(図34F):第1のモジュールはすべて、E2F1やFOXM1(33)などの細胞周期関連のTFモジュールであり、細胞周期の進行の推進力となる。第3のモジュールは全て、FOXO1、CEBPB、JUNBおよびRARB(30)(31)(32)などのGR応答関連TFモジュールである。他のTFモジュール群には、細胞周期とGR応答の両方によって共に調節される3つのTF(KLF6、TEAD1、およびYOD1)(モジュール2)、GATA3とARを含む内部分化経路(モジュール3)、ならびにNRF1およびNFE2L2などストレス応答関連TF(モジュール5)などがある。
さまざまな細胞周期の状態を特定するために、本発明者らは、最初に細胞周期にリンクされたTFモジュール活性によって細胞を順に並べた。細胞は、細胞周期の滑らかな軌跡に順に並べられ、既知の細胞周期マーカーの合成速度によって検証される(27)(図33B)。本発明者らは、細胞分裂中における劇的な細胞状態の変化と一致した、G2/M期とG0/G1期との間にギャップを観察した。教師なしクラスタリングにより、本発明者らは、細胞周期マーカーの発現に基づいて、G0/G1、S、およびG2/Mの細胞周期相にまたがる9つの細胞周期状態を特定した(図33B)。細胞は、GR応答にリンクしたTFモジュールによって別の滑らかな軌跡に並べることができる。軌跡は、DEX処理時間および既知のGR活性化調節TF活性の動態と十分な相関を示す(図33C)。教師なしクラスタリング分析により、本発明者らは、GR応答なし/低GR応答/高GR応答の状態に対応するGR応答に沿って3つの細胞クラスターを特定した(図33C)。
次に、本発明者らは、系内における隠された細胞の状態について定量的に特性評価しようとした(図35A)。9つの細胞周期状態と3つのGR応答状態が図33B−図33Cで特定された。可能な組み合わせの状態はすべて特定され、最小の群にはすべての細胞の1.1%(74)が含まれた(図33D)。観測された細胞状態の割合は、独立した取り合わせを想定した予想割合に近い。これは、6,000を超える細胞にわたるこれら2つの機能的なTFモジュールの活性間の低い相関係数(ピアソンの相関r=0.004)と一致している。比較のために、全トランスクリプトームと新しく合成されたトランスクリプトームの次元削減とクラスタリング分析により、本発明者らは6つの主要なクラスターを特定した(図35B)。これらの主要なクラスターは、これらの27の細胞状態を組み合わせた群によって簡単に定義することができる(図33E)。
単一細胞の移行軌跡と状態移行ネットワークの特性評価
各細胞について特性評価された全トランスクリプトームと新しく合成されたトランスクリプトームの両方で、本発明者らは、S4U標識前の単一細胞トランスクリプトームの状態を推測することができる(図36A)。過去の細胞トランスクリプトームの回復は、2つのパラメータ:sci−fateで新たに合成されたリードの検出率、および各mRNAの分解速度(または半減期)に左右される(方法)。2つのパラメータは、両方ともsci−fateにおける同じ実験から推定することができる。
本発明者らは、まずsci−fateの検出率を推定した。本発明者らは、mRNAの半減期が、さまざまなDEX処理条件全体にわたって安定していると仮定している。この仮定は、後で自己整合性チェックによってさらに検証される。この仮定の下では、2時間のS4U標識前の部分的に分解されたバルクトランスクリプトームは、無DEX処理細胞と2時間のDEX処理細胞との間で同じであるべきである。したがって、全トランスクリプトーム(バルク)の違いは、技術検出率によって修正された新たに合成されたトランスクリプトーム(バルク)の違いと同等であるはずである。全トランスクリプトームと新しく合成されたトランスクリプトームの両方が本発明者らの実験でプロファイリングされているため、本発明者らは、sci−fateの検出率を直接計算することができる。新しく合成されたmRNAの違いは、mRNA発現レベルの違いと高い相関を示し(ピアソンのr=0.93、図37A)、新しいRNA検出率が遺伝子全体でかなり安定していることを示唆している。したがって、本発明者らは、下流解析について新しいRNA捕捉率の中央値(82%)を使用した。
次に、本発明者らは、2時間でmRNA分解率を計算した。A549細胞集団は外部摂動なしで安定しているとみなすことができるため、2時間のDEX処理後の細胞では、その過去の状態(2時間のS4U標識付けの前)は0時間のDEX処理細胞と同じであるはずである。同様に、T=0/2/4/6/8/10時間のDEX処理細胞の過去の状態(S4U標識付けの前)は、プロファイリングされたT=0/0/2/4/6/8時間の細胞に似ているはずである。すべての処理条件についてプロファイリングされた全体のトランスクリプトームと新しく合成されたトランスクリプトームにより、各2時間の間隔で数千の遺伝子全体にわたるmRNA分解率を推定することができる。上記の自己整合性チェックとして、遺伝子分解率は、異なるDEX処理時間にわたって高い相関を示す(図37B)。次に、本発明者らは、下流解析に平均遺伝子分解率を使用した。利用可能な新しいmRNA検出率と遺伝子分解率の両方により、本発明者らは、単一細胞の過去のトランスクリプトーム状態を推定したため、2時間間隔での各細胞のトランスクリプトーム動態について特性評価を行うことができる。
より長い間隔(すなわち、10時間)の細胞状態の動態を回復するために、本発明者らは、同じ細胞状態移行軌跡(図36A)において親細胞と子細胞をリンクする細胞リンケージパイプラインを開発した:各細胞A(例、2時間のDEX処理細胞)について、本発明者らは、2つのデータセット間で共通の細胞状態を特定するために最近開発されたアライメント戦略に基づいて、早期時点でプロファイリングされた細胞B(例、無DEX処理細胞)を特定したところ、Bの現在の状態はAの過去の状態と類似していた(27)。BはAの親状態とみなすことができる。同様に、本発明者らはまた、後の時点でプロファイリングされた別の細胞C(例、4時間のDEX処理細胞)を特定したところ、Cの過去の状態はAの現在の状態と類似していた。細胞Cは、Aの将来の状態と見なすことができる。同じ戦略を各細胞について識別された過去および将来のすべての状態に拡張することにより、本発明者らは、10時間と5つの時点にわたって6,680の単一細胞移行軌跡を構築した(図36A−図36B)。注目すべきは、この分析は、各細胞(開始時点と終了時点の細胞を除く)の過去と現在の状態が包括的に検出されるという仮定に基づいているということであり、6,000を超える細胞(1条件につき1,000を超える細胞)、または細胞周期中1分未満で1細胞がプロファイリングされるため、本発明者らのデータセットにも当てはまる。複数の細胞(>50)が各細胞状態でプロファイリングされるため、確率的な細胞状態移行プロセスも捉えることができる。
結果を検証するために、本発明者らは、3つの軌跡クラスターにグループ分けされたこれらの6,680の単一細胞軌跡に次元削減と教師なしクラスタリング分析を適用した。本発明者らは、図36Cで特性評価された細胞状態の動態を確認した。予想通り、3つの軌跡すべてが、GR応答なしの状態から低GR応答/高GR応答状態への細胞状態の移行を経時的に示した(図36D)。本発明者らは、これらの3つの軌跡全体で異なる細胞周期動態を観察した(図36D):軌跡1はG2/M期の減少とG0/G1期の一貫した増加を示し、G2/MおよびG1中間状態からG1期への細胞状態の移行を表していた。軌跡2は、SおよびG2/M中間状態からG2/M期への細胞状態の移行を示した。軌跡3において、本発明者らは、初期DEX処理中(0〜2時間)にG1およびS中間期から初期S期への細胞状態の移行を観察したが、後期DEX処理条件(>2時間のDEX処理)では移行が抑制されたことから、長期のDEX処理がG1期停止をもたらすことを示唆している。これは、処理時間および以前の研究に沿った細胞状態の割合の変化と一致している(37、38)(図36D)。これらは、sci−fateによって特徴付けられる単一細胞移行経路が一般的な細胞状態移行方向を回復できることを示唆している。
各状態でプロファイリングされた複数の細胞(>70)を使用して、本発明者らは、27の隠された状態すべてにわたって細胞状態移行確率を計算した。移行確率が低い(<0.1)細胞状態の移行は、まれな事象またはノイズに起因する可能性があるため、除外される。細胞状態移行ネットワークを、ノードとしての27の細胞状態、および潜在的な移行経路を示すリンクによって定義することができる(図36E)。細胞周期進行の方向は、細胞周期に沿った不可逆的な移行方向を伴う少なくとも3つの移行段階によって容易に特徴付けられる(図36E)。後期G1期および後期G2/M期において、本発明者らはまた、可逆的な移行動態を示すいくつかの状態を見出しており、これらは、G1/S期およびG2/M期における2つの細胞周期チェックポイントを潜在的に反映している(33)。予想どおり、類似した細胞周期の細胞ではあるがGR応答状態が異なる場合、劇的に異なる移行動態を示し、GR応答状態が高い細胞はG1期またはG2/M期で停止する傾向がある。
細胞状態移行ネットワークが細胞状態移行動態を捉えるかどうかを検証する一貫性のチェックとして、本発明者らは、移行確率が異なる時点にわたって実際の細胞状態分布を回復することができるかどうかを評価した。実際、細胞状態の割合は10時間にわたって動的に変化するが(図36F)、状態移行ネットワークは、0時間DEX処理の細胞における細胞状態の割合から5つの後の時点全てにわたる27の細胞状態比率を正確に予測する(図36G、図38A)。本発明者らはまた、データの一部のみ(0時間から6時間)で細胞状態移行ネットワークを計算し、これにより、完全なデータと高い相関のある移行確率が得られ、10時間での細胞状態が正確に予測された(図36H、図38B)。
細胞状態移行の方向を調節する因子の特性評価
細胞状態移行確率を調節する因子の特性評価を行うために、本発明者らはまず、各状態ペア間の集約トランスクリプトーム(全体および新しく合成された)のピアソンの距離によって、細胞状態距離を計算した。予想どおり、細胞状態の移行確率は移行距離と負の相関がある(スピアマンの相関係数=−0.38、図39A)。本発明者らはまた、2時間以内に状態の移行を示す細胞の割合によって定義される状態の不安定性も計算した(図39B)。状態の不安定性のランドスケープは、細胞の移行方向と十分に一致する(図39B):GR応答の無い状態は、高いGR応答状態と比較して高い不安定性を示す。高いGR応答状態では、初期G1期の細胞は最も不安定性が低く、G1/S中間状態の細胞は高い不安定なピークを示し、後期DEX処理におけるG1期停止と一致する。
10時間後の細胞状態の割合の変化は、細胞状態の不安定性と十分に相関しており(スピアマンの相関係数=−0.88、図39C)、細胞状態の動態が細胞状態の不安定性のランドスケープによって規制されていることを示唆している。状態の不安定性はまた、状態移行標的の多様性を反映する、状態移行確率エントロピーとも高い相関を示す(ピアソンの相関r=0.73、図39D)。状態間移行確率が近くの状態不安定性によって推測できるかどうかを検証するために、本発明者らは、近くの状態不安定性と距離をニューラルネットワークモデルに当てはめて、各状態から他の状態への状態移行確率を予測する。近くの状態の不安定性と距離の両方を組み合わせることで、状態距離のみを使用した場合と比較して、状態間移行確率の予測で10倍を超える性能が達成され(両方の情報を使用した場合の交差検証r二乗中央値は0.58であるのに対し状態距離のみを使用した場合は0.046、p値=4.5e−10、両側ウィルコクソン順位和検定、図39E)、細胞状態移行の方向と確率が近くの状態安定性ランドスケープによって規制されていることを示唆している。さらに細胞は、最も近い位置よりも、より安定した近くの状態に移動することを好む。
検討
ここで本発明者らは、全トランスクリプトームレベルで細胞状態移行の動態の特性評価を行う最初の戦略を開発した。この戦略は、数千個の細胞で全トランスクリプトームと新規合成トランスクリプトームの両方をプロファイリングできる、新規のコンビナトリアルインデックス付けベースの高スループット単一細胞RNA−seq手法であるsci−fateに依存している。他の「Sci−」技術と同様に、Sci−fateは、数百万個の細胞に容易に拡大でき(39)、トランスクリプトームとエピゲノムの両方のプロファイリングと潜在的に適合性がある(40)。これにより、何百もの細胞タイプへの実際の細胞移行経路がまだ不明である非常に複雑な系(すなわち、胚全体の発達)で、sci−fateが細胞状態の動態の特性評価を行うことが可能となる。さらに本発明者らは、計算パイプラインを開発して、新たに合成されたRNA捕捉率と遺伝子分解率をsci−fateデータ(記憶補正)から推定し、各時点で共有された過去および現在のトランスクリプトーム状態によってリンクされた各単一細胞の数千の示差的軌跡を推測する。
技術を検証し、細胞状態の動態が内部因子および外部因子によってどのように調節されているかを調べるために、本発明者らが、コルチゾール応答のモデル系に本戦略を適用したところ、細胞の運命は、内部細胞周期および外因的薬物誘導GR活性化により動的に調節されていた。本発明者らは、新しく合成されたトランスクリプトームが、環境刺激に対するエピゲノム応答に直接リンクしていることを示し、全トランスクリプトームおよび新しく合成されたトランスクリプトームの両方の共同解析により、細胞状態分離のより高い解像度が可能になる。数千の細胞にわたるTF発現と新しいRNA合成率との間の共分散により、本発明者らは、DNA結合データによって検証されたTFと調節遺伝子との間における最大1,000のリンクを特定した。さらに本発明者らは、従来のクラスター分析によるわずか6つの状態と比較して、細胞周期進行とGR応答における機能TFモジュールの組み合わせ状態によって特性評価される27の「隠された細胞状態」を特定した。
記憶補正と細胞リンケージ解析により、本発明者らが、10時間にわたる6,000超の単一細胞移行軌跡を構築したところ、主要な軌跡は、細胞周期とGR応答における既知の細胞状態の動態と一致していた。細胞状態移行ネットワークは、5つの時点全てにわたって27の細胞状態動態の回復によって検証される、すべての細胞状態にわたる移行確率を特徴としている。最後に、本発明者らは、細胞状態移行確率が、細胞状態移行ネットワークの2つの重要な特徴:状態間距離および状態不安定性のランドスケープによって規制されていることを見出したが、それらは両方とも慣用的な単一細胞RNA−seq技術により潜在的に評価することができる。
この戦略には強力であるが、いくつかの制限がある。まず、単一細胞の軌跡を忠実に構築するには、各時点で包括的な細胞状態の特性評価が必要である。また、移行確率をロバストに推定するには、各状態についての複数の観測値が必要とされる。これらの制限は、1回の実験で数百万個の細胞をプロファイリングできるsci−fateの組み合わせ戦略によって容易に解決することができる。別の注意点は、ほとんどのS4U標識実験がin vitro系に適用されることである。しかしながら、最近の研究により、S4Uは複数のマウス組織(すなわち、脳、腸および脂肪組織)における細胞タイプ特異的RNA転写を安定して標識できることが示されており(41、42)、S4Uの組み込みおよび検出率を高めるためのさらなる最適化により、sci−fateが、in vivo単一細胞トランスクリプトーム動態のプロファイリングに適用できることが示唆されている。
sci−fateは、「静的な」単一細胞ゲノム技術を動的な系の特性評価に適用するための新しい道を開く。従来のイメージングに基づく技術と比較して、sci−fateは、全トランスクリプトームレベルで細胞状態の動態をプロファイリングするもので、マーカー選択や細胞分化における重要な推進力を発見することなく、包括的な細胞状態の特性評価を可能にする。最後に、本発明者らは、詳細な細胞状態移行動態を数百の発達系統内のすべての最終的な細胞状態にデコードするために、sci−fateを代替の系統追跡技術と容易に組み合わせることができると予測する(43〜45)。
材料および方法:
哺乳類細胞培養
すべての哺乳類細胞を、5%CO2、37℃で培養し、HEK293T細胞およびNIH/3T3細胞の場合は高グルコースDMEM培地(Gibco カタログ番号11965)、A549細胞の場合はDMEM/F12培地で、両方とも10%FBSおよび1X Pen/Strep(Gibcoカタログ番号15140122;100U/mlペニシリン、100g/mlストレプトマイシン)を補って維持した。細胞を0.25%トリプシン(typsin)−EDTA(Gibcoカタログ番号25200−056)でトリプシン処理し、週に3回1:10に分割した。
sci−fate用の試料処理
A549細胞を100nM DEXで0時間、2時間、4時間、6時間、8時間および10時間処理した。すべての処理条件での細胞を、細胞採取の前の最後の2時間、200uM S4Uとインキュベートした。HEK293T細胞およびNIH/3T3細胞については、細胞を採取する前に、細胞を200uM S4Uとともに6時間インキュベートした。
すべての細胞株(A549細胞、HEK293T細胞およびNIH/3T3細胞)をトリプシン処理し、300xgで5分間(4℃)遠心分離し、1X氷冷PBSで1回洗浄した。すべての細胞を4ml氷冷4%パラホルムアルデヒド(EMS)により氷上で15分間固定した。固定後、細胞を500xgで3分間(4℃)ペレット化し、1ml PBSR(1xPBS、pH 7.4、1%BSA、1%SuperRnaseIn、1%10mM DTT)で1回洗浄した。洗浄後、細胞を1mlあたり1000万個の細胞でPBSRに再懸濁し、瞬間凍結させ、液体窒素で保存した。パラホルムアルデヒド固定細胞を37度の水浴で解凍し、500xgで5分間スピンダウンし、0.2%Triton X−100を含む500ul PBSRと3分間氷上でインキュベートした。細胞をペレット化し、1%SuperRnaseInを含む500ulのヌクレアーゼ不含有水に再懸濁した。3mlの0.1N HClを細胞に加え、氷上で5分間インキュベートした(21)。3.5ml Tris−HCl(pH=8.0)および35ul 10%Triton X−100を細胞に加えてHClを中和した。細胞をペレット化し、1ml PBSRで洗浄した。細胞を100ul PBSRに再懸濁した。固定細胞を含む100ul PBSRを、40ulヨードアセトアミド(IAA、100mM)、40ulリン酸ナトリウム緩衝液(500mM、pH=8.0)、200μl DMSOおよび20ul H2Oを含む混合物とともに50℃で15分間インキュベートした。8μl DTT(1M)および8.5ml PBSで反応を停止させた(47)。細胞をペレット化し、100μl PBSI(1xPBS、pH7.4、1%BSA、1%SuperRnaseIn)に再懸濁した。後のすべての洗浄では、500xgで5分間(4℃)の遠心分離により核をペレット化した。
以下の段階は、パラホルムアルデヒド固定核を使用したsci−RNA−seqプロトコルと同様である(15、16)。簡単に述べると、細胞を4枚の96ウェルプレートに分配した。各ウェルについて、5,000個の核(2μL)を1μlの25μM固定オリゴdTプライマー(5’−ACGACGCTCTTCCGATCTNNNNNNNN[10bpインデックス]TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN−3’)(配列番号5)(ここで、「N」は任意の塩基であり、「V」は「A」、「C」または「G」のいずれかである;IDT)および0.25μLの10mM dNTPミックス(Thermo)と混合し、55℃で5分間変性させ、直ちに氷上に置いた。次いで、1μL 5X Superscript IV First−Strand Buffer(Invitrogen)、0.25μl 100mM DTT(Invitrogen)、0.25μl SuperScript IV逆転写酵素(200U/μl、Invitrogen)、0.25μL RNaseOUT組換えリボヌクレアーゼ阻害剤(Invitrogen)を含む1.75μLの第1鎖反応ミックスを各ウェルに加えた。次の温度勾配でプレートをインキュベートすることにより逆転写を行った:4℃ 2分、10℃ 2分、20℃ 2分、30℃ 2分、40℃ 2分、50℃ 2分および55℃ 10分。次に、すべての細胞(または核)をプールし、3Mの最終濃度で4’,6−ジアミジノ−2−フェニルインドール(DAPI、Invitrogen)で染色し、1ウェルあたり25核で5μL EB緩衝液中に選別した。シングレットがダブレットと区別され、各ウェルに選別されるように、DAPI染色に基づいて細胞をゲーティングした。次に、0.66μl mRNA Second Strand Synthesis緩衝液(NEB)および0.34μl mRNA Second Strand Synthesis酵素(NEB)を各ウェルに加え、16℃で180分間、第2鎖合成を行った。次に、各ウェルを5μLのNextera TD緩衝液(Illumina)および1μLのi7のみのTDE1酵素(25nM、Illumina、Nextera TD緩衝液で希釈)と混合し、55℃で5分間インキュベートしてタグ付けを行った。10μLのDNA結合緩衝液(Zymo)を添加し、室温で5分間インキュベートすることにより、反応を停止させた。次に、各ウェルを30μL AMPure XPビーズ(Beckman Coulter)を使用して精製し、16μLの緩衝液EB(Qiagen)で溶出した後、新しいマルチウェルプレートに移した。
PCR反応については、各ウェルを、2μLの10μM P5プライマー(5’−AATGATACGGCGACCACCGAGATCTACAC[i5]ACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’;IDT)(配列番号6)、2μLの10μM P7プライマー(5’−CAAGCAGAAGACGGCATACGAGAT[i7]GTCTCGTGGGCTCGG−3’;IDT)(配列番号7)、および20μL NEBNext High−Fidelity 2X PCR Master Mix(NEB)と混合した。次のプログラムを使用して増幅を実行した:72℃ 5分間、98℃ 30秒間、18〜22サイクル(98℃ 10秒間、66℃ 30秒間、72℃ 1分間)および最終72℃で5分間。PCR後、試料をプールし、0.8容量のAMPure XPビーズを使用して精製した。ライブラリー濃度を、Qubit(Invitrogen)により決定し、該ライブラリーを6%TBE−PAGEゲルでの電気泳動により視覚化した。ライブラリーは、V2 150サイクルキット(リード1:18サイクル、リード2:130サイクル、インデックス1:10サイクル、インデックス2:10サイクル)を使用して、NextSeq 500プラットフォーム(Illumina)で配列決定された。
リードアライメントおよび下流プロセッシング
単一細胞RNA−seqのためのリードアラインメントと遺伝子カウントマトリックスの生成を、僅かな修正を加えたsci−RNA−seq(48)用に開発したパイプラインを使用して実行した。まず、リードをSTAR/v2.5.2b(49)により参照ゲノムにマッピングし、ヒトの場合はGENCODE V19、およびマウスの場合はGENCODE VM11からの遺伝子注釈を付けた。HEK293T細胞およびNIH/3T3細胞を使用した実験において、本発明者らは、ヒト(hg19)とおよびマウス(mm10)の両方の染色体を組み合わせたインデックスを使用した。A549実験では、本発明者らは、ヒトゲノムビルドhg19を使用した。
単一細胞samファイルは、jvarkit(50)のsam2tsv関数を使用して、最初にアライメントtsvファイルに変換された。次に、各単一細胞アラインメントファイルについて、バックグラウンドSNPに一致する変異を除外した。A549細胞のバックグラウンドSNPリファレンスとして、本発明者らは、A549細胞についてのペアエンドバルクRNA−seqデータをENCODE(28)からダウンロードした(サンプル名:ENCFF542FVG、ENCFF538ZTA、ENCFF214JEZ、ENCFF629LOL、ENCFF149CJD、ENCFF006WNO、ENCFF828WTU、ENCFF380VGD)。各ペアエンドfastqファイルを、最初にデフォルト設定のtrim_galore/0.4.1(51)を使用してアダプタークリップし、STAR/v2.5.2bによるヒトhg19ゲノムビルドに合わせて整列させた(49)。マッピングされていないリードと複数のマッピングされたリードを、samtools/v1.3(52)によって削除した。重複したリードは、picard/1.105(53)のMarkDuplicates関数によって除外した。すべてのサンプルから重複排除されたリードを、samtools/v1.3で合わせて、選別した(52)。バックグラウンドSNPを、samtools/v1.3(52)のmpileup関数およびVarScan/2.3.9(54)のmpileup2snp関数によって呼び出した。HEK293TおよびNIH/3T3のテスト実験では、上記の同様のパイプラインでバックグラウンドSNPリファレンスが生成され、対照条件(S4U標識付け無しおよびIAA処理条件無し)からの単一細胞samデータが集約された。
各単一細胞アラインメントファイルについて、品質スコアが13以下のすべての突然変異が削除された。各リードの両端での突然変異は、主に配列決定エラーが原因であったため、除外された。各リードについて、本発明者らは、T>C変異(センス鎖の場合)またはA>G変異(アンチセンス鎖の場合)があるかどうかを確認し、これらの変異リードを新規合成リードとして標識付けした。
上記のように、各細胞について、完全な配列決定データおよび新たに合成されたRNAデータからの2つのデジタル遺伝子発現マトリックスによって特性評価した。5個以下の細胞で発現する遺伝子は除外された。UMIが2000未満または80,000を超える細胞は破棄された。ダブレット解析パイプラインScrublet/0.2(55)によるダブレットスコア>0.2の細胞は削除された。
まず、データの次元性を、Monocle 3による完全な遺伝子発現データまたは新たに合成された遺伝子発現データのいずれかで、デジタル遺伝子発現マトリックスでのPCA(最高の分散を持つ上位2,000個の遺伝子を選択した後)により削減した(56、57)。上位10のPCは、次元削減とデータの視覚化を実行するためのリーマン幾何学と代数トポロジーに基づいて最近提案されたアルゴリズムである、均一多様体近似および投影(UMAP/0.3.2)による次元削減分析用に選択された(26)。共同解析では、本発明者らは、UMAPを使用して次元を削減する前に各単一細胞について、全トランスクリプトームで計算された上位10のPCと、新しく合成されたトランスクリプトームの上位10のPCを組み合わせた。Monocle3で実装されたdensityPeakアルゴリズムを使用して細胞クラスターを実行した(56、57)。本発明者らはまず、処理されたすべての細胞の結合情報に対してUMAP分析を実行し、外れ値クラスター(7,404個の細胞のうち724個)を特定した。これらの細胞は、分化細胞のマーカーであるGATA3の高レベルの発現によってマークされ(34)、下流解析の前に除外された。
転写因子(TF)を調節された遺伝子にリンクするための分析
本発明者らは、TFと調節された遺伝子との間のリンクをそれらの共分散に基づいて特定することを目指した。10,000を超えるUMIが検出された細胞、およびすべての細胞の10%超で新規合成リードが検出された遺伝子を選択した。完全な遺伝子発現と1細胞あたりの新たに合成された遺伝子カウントは、Monocle 3(56、57)のestimateSizeFactorsによって完全な遺伝子発現マトリックスで計算された細胞特異的ライブラリーサイズ係数によって正規化され、対数変換され、中央に配置され、次いでRのスケーリング()関数によりスケーリングされた。検出された各遺伝子について、下記のモデルを適合させることにより、パッケージRcisTarget(29)からの「motifAnnotations_hgnc」データに注釈が付けられた853のTFの正規化された発現に基づいて、パッケージglmnet(58)でLASSO回帰モデルが構築され、正規化発現レベルが予測された:
ここで、Giは、遺伝子iの調整された遺伝子発現値である。前記値は、各細胞についての新しく合成されたmRNAカウントによって計算され、各細胞の完全な発現マトリックスでMonocle 3(56、57)におけるestimateSizeFactorsによる細胞特異的サイズ係数(SGi)推定値により正規化され、対数変換される:
遺伝子間の下流比較を簡易化するために、本発明者らは、各遺伝子iのモデルをRのスケーリング()関数で適合させる前に、応答Giを標準化する。
Giと同様、Tiは各細胞についての調整されたTF発現値である。前記値は、各細胞の完全なTF発現カウントによって計算され、各細胞の完全な発現マトリックスでMonocle 3(56、57)におけるestimateSizeFactorsによる細胞特異的サイズ係数(SGi)推定値で正規化され、対数変換される:
適合させる前に、TiはRのスケーリング()関数で標準化される。
本発明者らのアプローチは、回帰モデルでその発現を予測するために使用できるサブセットを見つけることにより、各遺伝子を調節してもよいTFを目指す。しかしながら、遺伝子の発現と相関する発現を伴うTFは、それがその遺伝子を調節していることを保証するものではない:遺伝子Aが細胞状態1で特異的に発現し、TF Bが細胞タイプ2で特異的に発現する場合。TFの発現と遺伝子の新規合成率との間における負の相関は転写抑制因子の活性を反映することができるが、本発明者らには、glmnetによって報告された負のリンクについてのより可能性の高い説明が、細胞状態特異的発現とTF活性の相互排他的なパターンであると感じられた。そのため、予測中に、本発明者らは、遺伝子の合成率と低い相関係数(<=0.03)リンクを伴う負に相関した発現を伴うTFを除外した。本発明者らは、TFと調節遺伝子との間に合計6,103のリンクを特定した。
推定的直接結合標的を特定するために、本発明者らは、リンクをENCODE Chip−seq実験でプロファイリングされたTFと交差させた(28)。ENCODEで特性評価されたTFとの1,086リンクのうち、807リンクは遺伝子プロモーターの近くのTF結合部位によって検証され(59)、これは、バックグラウンドと比較してオッズ比(検証されていないリンクに対する検証されたリンクの数)の4.3倍の濃縮であった(オッズ比=LASSO回帰で特定されたリンクでの2.89に対しバックグラウンドでの0.67、p値<2.2e−16、フィッシャーの正確検定)。正しいTF Chip−seq結合部位が大幅に濃縮された遺伝子セットのみが保持され(Fishの正確検定、誤検出率5%)、TF結合データのサポートを伴わずに間接的標的遺伝子を削除するために余分なものを取り除く。このアプローチでは591のリンクが保持された。
検証済みのTF遺伝子リンクを拡張するために、さらに本発明者らは、遺伝子プロモーター(10kb)の周りの標的TFモチーフの濃縮に基づいて遺伝子調節ネットワークを構築するためのパイプラインである、パッケージのSCENIC(29)をさらに適用した。LASSO回帰によって特定された各共発現モジュールは、RcisTarget(29)を使用したシス調節モチーフ解析を使用して解析された。正しいTF調節因子の重要なモチーフの濃縮を伴うモジュールのみが保持され、モチーフのサポートなしで間接的標的遺伝子を除去するために余分なものを取り除いた。本発明者らは、3つの相関係数の閾値(0.3、0.4、および0.5)によりTF遺伝子リンクをフィルター処理し、RcisTarget(29)によって検証されたすべてのリンクを合わせた。合計で、モチーフ解析アプローチによって検証された509のリンクがあった。両方のアプローチを組み合わせて、本発明者らは、TF発現と遺伝子合成率の間の共分散により、DNA結合データまたはモチーフ分析によって検証された、合計986のTF遺伝子調節リンクを特定した。リンクが正則化回帰のアーティファクトである可能性を評価するために、TF発現マトリックスのサンプルIDを並べ替え、同じ分析を実行した。この並べ替えの後、リンクは特定されなかった。
機能的なTFモジュールによる細胞の順序付け
各細胞におけるTF活性を計算するために、標的TFモジュール内の遺伝子についての新しく合成されたUMIカウントは、ライブラリーサイズによってスケーリングされ、対数変換され、集約され、次いでZスコアにマッピングされた。高度に相関した、または反相関した活性を伴うTFは、それらがリンクされた生物学的プロセスで機能してもよいことを示唆するため、本発明者らは、TF活性の各ペア間のピアソンの絶対相関係数を計算し、これに基づいて、パッケージpheatmap/1.0.12(60)におけるward.d2クラスタリング方法によりTFをクラスター化した。5つの機能的TFモジュールが特定され、それらの機能に基づいて注釈が付けられた。
各機能的TFモジュールの次元で細胞状態を特性評価するために、細胞を、UMAP(メトリック=「コサイン」、n_neighbors=30、min_dist=0.01)を使用して、細胞周期関連TF(TFモジュール1)またはGR応答関連TF(TFモジュール3)の活性により順序付けた。細胞周期進行の軌跡は、Seurat/2.3.4(27)における細胞周期遺伝子マーカーによって検証された。Monocle 3(56、57)で実装されたdensityPeakアルゴリズムにより、細胞周期TFモジュールによって順序付けられたUMAP座標で、3つの細胞周期相が特定された。各主要細胞周期相は依然として可変TF活性と細胞周期マーカー発現を示したため、本発明者らは、k平均クラスタリング(k=3)により各相を初期/中期/後期の状態に分割し、合計9つの細胞周期状態を回復させた。Monocle 3で実装されたdensityPeakアルゴリズムによって、3つのGR応答状態が特定された(56、57)。
sci−fateからの過去のトランスクリプトーム状態の回復
過去のトランスクリプトーム状態(S4U標識付け前の細胞状態)を識別するため、本発明者らは、mRNAの半減期がさまざまなDEX処理(treatmentment)条件にわたって安定していると想定している。この仮定は、後で自己整合性チェックによってさらに検証される。この仮定の下では、2時間のS4U標識前の部分的に分解されたバルクトランスクリプトームは、無DEX処理細胞と2時間のDEX処理細胞との間で同じであるべきである。したがって、全トランスクリプトーム(バルク)の差異は、テクニック検出率によって修正された、新しく合成されたトランスクリプトーム(バルク)の差異と等しいはずである:
A0hは、無DEX処理群におけるすべての細胞の集約されたUMIカウントである;S0hは、無DEX処理でのライブラリーサイズ(細胞のUMI総カウント)である;N0hは、無DEX処理群におけるすべての細胞の集約された新規合成UMIカウントである;A2hは、2時間のDEX処理群におけるすべての細胞の集約されたUMIカウントである;S2hは、2時間のDEX処理群におけるライブラリーサイズ(細胞の合計UMIカウント)である;N2hは、2時間のDEX処理群におけるすべての細胞の集約された新規合成UMIカウントである;αはsci−fateの検出率である。理論的には、遺伝子ごとに1つの検出率を計算することができる。しかしながら、2つの条件間における新規合成率にわずかな違いがある遺伝子の場合、推定αはノイズに支配される。したがって、本発明者らは、2つの条件の間で正規化された新規合成率の差が大きい遺伝子を選択した:本発明者らは、まず遺伝子フィルタリング用に一連の閾値を試験し、各遺伝子についてαを計算した。次に、本発明者らは、閾値と範囲外α値(<0または>1)を有する遺伝子の比率との関係をプロットした。本発明者らは、186個の遺伝子が選択されたプロットのニーポイントにある閾値を選択した。これらの遺伝子の新しく合成されたmRNAの差異は、mRNA発現レベルの差異と高度に相関しており(ピアソンのr=0.93、図35A)、新しいRNA検出率が遺伝子全体でかなり安定していることを示唆している。sci−fateによって捕捉された新規合成RNAの中央値は82%である。
次に、本発明者らは、2時間ごとのmRNA分解率を計算した。A549細胞集団は外部摂動なしで安定しているとみなすことができるため、2時間のDEX処理細胞について、その過去の状態(2時間のS4U標識付け前)は0時間DEX処理細胞と同じであるべきである。同様に、T=0/2/4/6/8/10時間のDEX処理細胞についての過去の状態(S4U標識付け前)は、プロファイリングされたT=0/0/2/4/6/8時間の細胞と類似しているべきである。
At1は、t1におけるすべての細胞の集約されたUMIカウントである;St1は、t1でのライブラリーサイズ(細胞の総UMIカウント)である;Nt1は、t1でのすべての細胞の集約された新規合成UMIカウントである;αは、sci−fateの推定検出率である;At0は、t0におけるすべての細胞の集約されたUMIカウントである;St0は、t0でのライブラリーサイズ(細胞の総UMIカウント)である;βは、1−t0とt1の間の遺伝子特異的分解率であり、mRNAの半減期γと次の関係がある:
遺伝子分解率βを、2時間間隔のDEX処理ごとに計算することができる。上記の自己整合性チェックとして、遺伝子分解率は、異なるDEX処理時間にわたって高度に相関している(図35B)。次に、本発明者らは、下流解析に平均遺伝子分解率を使用した。
検出率と遺伝子分解率を推定すると、各細胞の過去のトランスクリプトーム状態を次のように推定することができる:
αt1は、t1における単一細胞UMIカウントである;nt1は、t1における新しく合成された単一細胞のUMIカウントである;αは、sci−fateの推定検出率である;βは、1−t0とt1の間の遺伝子特異的分解率である。αt0は、過去の時点t0における推定単一細胞UMIカウントであり、すべての負の値が0に変換される。
単一細胞状態の軌跡を構築するためのリンケージ解析
リンケージ解析により、本発明者らは、同じ細胞軌跡でリンクされた親細胞および子細胞を特定することを目指している。技術的には、t1での細胞について、本発明者らは、過去の状態のトランスクリプトーム状態(S4U標識付け前、本発明者らの実験ではt1の2時間前)を1つの群1として、t0の完全トランスクリプトーム状態(t1の2時間前)を別の群2として組み合わせる。明らかな細胞アポトーシスがないと仮定すると、これらの2つの群は類似した細胞状態分布を有するべきである。本発明者らは、多様体アライメント戦略を適用して、共通の変動要因に基づいて、2つのデータセット間の共通の細胞状態を特定した(27)。この解析は、各細胞(開始時点と終了時点の細胞を除く)の過去と現在の状態が包括的に検出されるという別の仮定に基づくもので、これは、6,000を超える細胞(1条件につき1,000を超える細胞)または細胞周期中1分未満で1細胞がプロファイリングされているため、本発明者らのデータセットに当てはまる。パイプラインの結果として、t0からの細胞状態とt1からの過去の細胞状態が同じUMAP空間で整列した形となる。上記の仮定に違反するものは、2つのデータセットの整列中に外れ値によって検出することができる。t1における各細胞Aについて、本発明者らは、アライメントUMAP空間における親状態としてt0における最も近い隣接細胞を選択した。同様に、t0における各細胞について、本発明者らは、その子細胞状態としてt1における最も近い隣接細胞を選択した。注目すべきは、リンクが双方向である必要はないことである:1つの細胞の親状態は、異なる子細胞にリンクされていてもよい。親状態と子状態が各細胞(0時間と10時間での細胞を除く)について識別されたため、本発明者らは、各細胞の親のリンクされた親細胞と、同様に各細胞の子のリンクされた子細胞を特定した。したがって、各単一細胞について、10時間にわたる5つの時点すべてにわたる単一細胞状態移行経路によって特性評価を行うことができる。複数の細胞(>50)が各細胞状態でプロファイリングされるため、確率的な細胞状態移行プロセスも捉えることもできる。
単一細胞トランスクリプトーム動態についての次元削減とクラスタリング解析
単一細胞トランスクリプトーム動態での次元削減のために、完全なトランスクリプトームの上位5つのPCおよび新しく合成されたトランスクリプトームの上位5つのPCを各状態に対して選択し、UMAP解析の単一細胞状態の軌跡に沿って時間順に結合させた。主要な細胞軌跡タイプは、密度ピーククラスタリングアルゴリズムによって特定された(61)。
開始時点(0時間処理)での細胞状態の割合とデータから推定される細胞状態移行確率を使用して、本発明者らは、まず、DEX処理における細胞状態移行プロセスが細胞自律的で時間に依存しないマルコフダイナミクスであると仮定し、2時間後の細胞状態分布を予測した。同様に、2時間前の予測細胞状態分布に基づいて、後の時点での細胞状態分布を計算することができる。
状態不安定性による状態間移行確率予測
細胞状態の不安定性は、2時間後に各状態が他の状態に移行する確率として定義される。細胞状態の距離を計算するために、本発明者らは、まず各状態で等しい数(n=50)の細胞をサンプリングし、状態内のすべての細胞の完全なトランスクリプトームと新しく合成されたトランスクリプトームを集約した。各細胞の状態については、全トランスクリプトームと新しく合成されたトランスクリプトームを組み合わせた結合情報によって定義することができる。細胞状態距離は、2つの状態の間における結合情報のピアソンの相関係数として計算される。
状態間移行確率を予測するために、本発明者らは、Keras/2.2.4(62)で3層ニューラルネットワーク(ユニット番号:128、128、26、各層でrelu活性化;損失関数:cosine_proximity、バッチサイズ:128、エポック:80)を構築した。入力について、本発明者らは、現在の状態の状態不安定性、他の26の状態の正規化された状態不安定性(現在の状態の不安定性によりスケーリング)、および現在の状態から他の26の状態(状態不安定性ベクトルにおける同じ状態順序で)への移行距離(2乗)を使用した。過剰適合を回避するため、本発明者らは、依然として状態移行距離の状態順序を状態不安定性と同じに保ちながら、入力ごとに状態不安定性の状態順序を200回並べ替えた。モデルの性能を評価するため、本発明者らは、26の状態でモデルを訓練することにより一個抜き検証法を適用し、他の26の状態全てへの状態移行確率の予測時に左側の状態でモデルを検証する。状態移行距離のみで状態間確率を予測するため、同じモデルを訓練と検証に使用し、すべての入力状態不安定性を1と置き換える。
References
1. N.Moris, C.Pina, A.M.Arias, Transition states and cell fate decisions in epigenetic landscapes.Nat.Rev.Genet.17, 693-703 (2016).
2. A.Filipczyk et al., Network plasticity of pluripotency transcription factors in embryonic stem cells.Nat.Cell Biol.17, 1235-1246 (2015).
3. S.Hormoz et al., Inferring Cell-State Transition Dynamics from Lineage Trees and Endpoint Single-Cell Measurements.Cell Syst.3, 419-433.e8 (2016).
4. V.A.Herzog et al., Thiol-linked alkylation of RNA to assess expression dynamics.Nat.Methods.14, 1198-1204 (2017).
5. J.A.Schofield, E.E.Duffy, L.Kiefer, M.C.Sullivan, M.D.Simon, TimeLapse-seq:adding a temporal dimension to RNA sequencing through nucleoside recoding.Nat.Methods.15, 221-225 (2018).
6. J.C.Buckingham, Glucocorticoids:exemplars of multi-tasking.Br.J.Pharmacol.147, S258 (2006).
7. M.D.Cleary, C.D.Meiering, E.Jan, R.Guymon, J.C.Boothroyd, Biosynthetic labeling of RNA with uracil phosphoribosyltransferase allows cell-specific microarray analysis of mRNA synthesis and decay.Nat.Biotechnol.23, 232-237 (2005).
8. L.Dolken et al., High-resolution gene expression profiling for simultaneous kinetic parameter analysis of RNA synthesis and decay.RNA.14, 1959-1972 (2008).
9. C.Miller et al., Dynamic transcriptome analysis measures rates of mRNA synthesis and decay in yeast.Mol.Syst.Biol.7, 458-458 (2014).
10. E.E.Duffy et al., Tracking Distinct RNA Populations Using Efficient and Reversible Covalent Chemistry.Mol.Cell.59, 858-866 (2015).
11. B.Schwalb et al., TT-seq maps the human transient transcriptome.Science.352, 1225-1228 (2016).
12. M.Rabani et al., Metabolic labeling of RNA uncovers principles of RNA production and degradation dynamics in mammalian cells.Nat.Biotechnol.29, 436-442 (2011).
13. M.R.Miller, K.J.Robinson, M.D.Cleary, C.Q.Doe, TU-tagging:cell type-specific RNA isolation from intact complex tissues.Nat.Methods.6, 439-441 (2009).
14. D.A.Cusanovich et al., Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing.Science.348, 910-914 (2015).
15. J.Cao et al., Comprehensive single-cell transcriptional profiling of a multicellular organism.Science.357, 661-667 (2017).
16. J.Cao et al., Joint profiling of chromatin accessibility and gene expression in thousands of single cells.Science.361, 1380-1385 (2018).
17. V.Ramani et al., Massively multiplex single-cell Hi-C (2016), doi:10.1101/065052.
18. R.M.Mulqueen et al., Highly scalable generation of DNA methylation profiles in single cells.Nat.Biotechnol.36, 428-431 (2018).
19. S.A.Vitak et al., Sequencing thousands of single-cell genomes with combinatorial indexing.Nat.Methods.14, 302-308 (2017).
20. Y.Yin et al., High-throughput mapping of meiotic crossover and chromosome mis-segregation events in interspecific hybrid mice (2018), doi:10.1101/338053.
21. A.B.Rosenberg et al., Single-cell profiling of the developing mouse brain and spinal cord with split-pool barcoding.Science.360, 176-182 (2018).
22. T.E.Reddy et al., Genomic determination of the glucocorticoid response reveals unexpected mechanisms of gene regulation.Genome Res.19, 2163-2171 (2009).
23. S.John et al., Chromatin accessibility pre-determines glucocorticoid receptor binding patterns.Nat.Genet.43, 264-268 (2011).
24. T.E.Reddy, J.Gertz, G.E.Crawford, M.J.Garabedian, R.M.Myers, The Hypersensitive Glucocorticoid Response Specifically Regulates Period 1 and Expression of Circadian Genes.Mol.Cell.Biol.32, 3756-3767 (2012).
25. C.M.Vockley et al., Direct GR Binding Sites Potentiate Clusters of TF Binding across the Human Genome.Cell.166, 1269-1281.e19 (2016).
26. L.McInnes, J.Healy, N.Saul, L.Grobberger, UMAP:Uniform Manifold Approximation and Projection. Journal of Open Source Software.3, 861 (2018).
27. A.Butler, P.Hoffman, P.Smibert, E.Papalexi, R.Satija, Integrating single-cell transcriptomic data across different conditions, technologies, and species.Nat.Biotechnol.36, 411-420 (2018).
28. The ENCODE Project Consortium, The ENCODE (ENCyclopedia Of DNA Elements) Project.Science.306, 636-640 (2004).
29. S.Aibar et al., SCENIC:single-cell regulatory network inference and clustering.Nat.Methods.14, 1083-1086 (2017).
30. M.Boruk, J.G.A.Savory, R.J.G.Hache, AF-2-Dependent Potentiation of CCAAT Enhancer Binding Proteinβ -Mediated Transcriptional Activation by Glucocorticoid Receptor.Mol.Endocrinol.12, 1749-1763 (1998).
31. W.Qin et al., Identification of functional glucocorticoid response elements in the mouse FoxO1 promoter.Biochem.Biophys.Res.Commun.450, 979-983 (2014).
32. C.S.Sheela Rani, N.Elango, S.-S.Wang, K.Kobayashi, R.Strong, Identification of an Activator Protein-1-Like Sequence as the Glucocorticoid Response Element in the Rat Tyrosine Hydroxylase Gene.Mol.Pharmacol.75, 589 (2009).
33. M.Fischer, G.A.Mueller, Cell cycle transcription control:DREAM/MuvB and RB-E2F complexes.Crit.Rev.Biochem.Mol.Biol.52, 638-662 (2017).
34. J.Chou, S.Provot, Z.Werb, GATA3 in development and cancer differentiation:cells GATA have it! J.Cell.Physiol.222, 42-49 (2010).
35. J.Y.C.Madhurima Biswas, Role of Nrf1 in antioxidant response element-mediated gene expression and beyond.Toxicol.Appl.Pharmacol.244, 16 (2010).
36. I.-G.Ryoo, M.-K.Kwak, Regulatory crosstalk between the oxidative stress-related transcription factor Nfe2l2/Nrf2 and mitochondria.Toxicol.Appl.Pharmacol.359, 24-33 (2018).
37. J.M.Harmon, M.R.Norman, B.J.Fowlkes, E.B.Thompson, Dexamethasone induces irreversible G1 arrest and death of a human lymphoid cell line.J.Cell.Physiol.98, 267-278 (1979).
38. A.K.Greenberg et al., Glucocorticoids inhibit lung cancer cell growth through both the extracellular signal-related kinase pathway and cell cycle regulators.Am.J.Respir.Cell Mol.Biol.27, 320-328 (2002).
39. J.Cao et al., Comprehensive single-cell transcriptional profiling of a multicellular organism.Science.357, 661-667 (2017).
40. J.Cao et al., Joint profiling of chromatin accessibility and gene expression in thousands of single cells.Science.361, 1380-1385 (2018).
41. W.Matsushima et al., SLAM-ITseq:sequencing cell type-specific transcriptomes without cell sorting.Development.145 (2018), doi:10.1242/dev.164640.
42. U.Sharma et al., Small RNAs are trafficked from the epididymis to developing mammalian sperm (2017)., doi:10.1101/194522.
43. A.McKenna et al., Whole-organism lineage tracing by combinatorial and cumulative genome editing.Science.353, aaf7907 (2016).
44. B.Raj et al., Simultaneous single-cell profiling of lineages and cell types in the vertebrate brain.Nat.Biotechnol.36, 442-450 (2018).
45. K.L.Frieda et al., Synthetic recording and in situ readout of lineage information in single cells.Nature.541, 107-111 (2017).
46. H.Wickham, ggplot2:Elegant Graphics for Data Analysis (Springer, 2016).
47. M.Muhar et al., SLAM-seq defines direct gene-regulatory functions of the BRD4-MYC axis.Science.360, 800-805 (2018).
48. J.Cao et al., Comprehensive single-cell transcriptional profiling of a multicellular organism.Science.357, 661-667 (2017).
49. A.Dobin et al., STAR:ultrafast universal RNA-seq aligner.Bioinformatics.29, 15-21 (2013).
50. P.Lindenbaum, JVarkit:java-based utilities for Bioinformatics.figshare (2015).
51. FelixKrueger, FelixKrueger/TrimGalore.GitHub, (available at https://github.com/FelixKrueger/TrimGalore).
52. H.Li et al., The Sequence Alignment/Map format and SAMtools.Bioinformatics.25, 2078-2079 (2009).
53. Picard Tools - By Broad Institute, (available at http://broadinstitute.github.io/picard/).
54. D.C.Koboldt et al., VarScan 2:somatic mutation and copy number alteration discovery in cancer by exome sequencing.Genome Res.22, 568-576 (2012).
55. S.L.Wolock, R.Lopez, A.M.Klein, Scrublet:computational identification of cell doublets in single-cell transcriptomic data (2018), , doi:10.1101/357368.
56. X.Qiu et al., Reversed graph embedding resolves complex single-cell trajectories.Nat.Methods.14, 979-982 (2017).
57. cole-trapnell-lab, cole-trapnell-lab/monocle-release.GitHub, (available at https://github.com/cole-trapnell-lab/monocle-release).\
58. J.Friedman, T.Hastie, R.Tibshirani, Regularization Paths for Generalized Linear Models via Coordinate Descent.J.Stat.Softw.33 (2010), doi:10.18637/jss.v033.i01.
59. Dataset - ENCODE Transcription Factor Binding Site Profiles, (available at http://amp.pharm.mssm.edu/Harmonizome/dataset/ENCODE+Transcription+Factor+Binding+Site+Profiles).
60. raivokolde, raivokolde/pheatmap.GitHub, (available at https://github.com/raivokolde/pheatmap).
61. A.Rodriguez, A.Laio, Clustering by fast search and find of density peaks.Science.344, 1492-1496 (2014).
62. keras-team, keras-team/keras.GitHub, (available at https://github.com/keras-team/keras).
実施例4
マルチプレックス転写物捕捉
ほとんどの単一細胞RNA配列決定法は、1細胞あたり15,000から50,000のユニークリードのカバレッジで飽和するが(Ziegenhainら、2017)、単一細胞の総mRNA含有量は50,000分子から300,000分子の範囲であることができる(Marinovら、2014)。さらに、これらの方法のほとんどは逆転写(RT)にオリゴ(dT)プライミングを使用し、RNAの3’末端での配列決定に焦点を当てている。すなわち、これらの方法では、所定の転写物の存在量の変化を検出する能力が限られている。多数の細胞のプロファイルを作成した最近の研究(Gasperiniら、2019;Caoら、2019)では、非常に高い配列決定深度が必要とされた:これらの研究で使用されるIllumina NovaSeqの実行にはそれぞれ30,000ドルの費用がかかるため、かかる実験はほとんどのグループにとって全く手が届くものではない。
しかしながら、どちらの場合でも、データから生物学的洞察を収集するために必要なリードの数は比較的少ない。非コーディング摂動の単一細胞読み出しでは、破壊されている調節エレメントに対しシスの遺伝子のみが発現の変化について試験される(Xieら、2017;Gasperiniら、2018)。細胞アトラス実験では、グローバルな発現パターンを使用して類似した細胞をクラスター化しているが、細胞タイプの割り当ては少数の重要な転写因子遺伝子を使用して行われた。したがって、これらの実験で最も有益である遺伝子転写物に読み出しを集中させる能力により、必要とされる配列決定深度の大幅な削減、および細胞間の微妙な差異を検出する能力の増加がもたらされる。
本発明者らは、オリゴ(dT)プライミングではなく、特定のRTプライマーを使用して、興味の対象であるmRNAの単一細胞配列決定に焦点を絞った。同様の方法が最近バルクで使用され、酵母におけるすべての既知スプライスジャンクションを特異的に配列決定し、その結果、非標的領域よりも標的領域で100倍の濃縮をもたらした(Xuら、2018)。興味の対象である転写物全体にタイリングするRTプライマーのプールにより、トランスクリプトームライブラリー(sciRNA−seq)の読み取りを、1実験あたり数百の捕捉転写物に減らすことができる。
このsciRNA−seqゲリマンダーリングには、オリゴ(dT)プライミングを凌ぐ複数の利点がある。第一に、本発明者らが各実験について最も有益であると判断したゲノムの領域に配列決定を指示することになる。第二に、cDNAに逆転写される多くの機会を各RNA分子に与えるため、RNA分子ごとに検出される可能性が高くなる。第三に、このアプローチにより、ユニークなマッピングが可能であるアンプリコンのみを標的化でき、ランダム六量体またはオリゴ(dT)プライミングの選択肢よりもリボソームリードのバックグラウンドを減らすことができる。第四に、スプライスジャンクションや選択的転写開始部位事象に起因するエクソンなどのmRNAの情報領域を標的にすることができるため、従来のsciRNA−seqでは容易に検出されないアイソフォーム情報が提供される。
sciRNA−seqは、複数のRTプライマーでの修飾に特異的に適している。ほとんどの単一細胞RNA−seq法は、ユニーク識別子オリゴと結合したビーズを使用して、各細胞のトランスクリプトームに細胞識別バーコードを付加し、通常は、ポリ(A)テイルにハイブリダイズすることによりmRNAを捕捉する。上記ビーズは、少数の転写物のカバレッジを高めるために少数の特定のRTプライマーを付加するように修飾されているが(Saikiaら、2018)、この戦略では、数百の標的化転写物にスケーリングすることまたは実験間で急速に変更することが困難である。したがって、単一細胞コンビナトリアルインデックス付けの適応性は、マルチプレックスRT単一細胞RNA−seqの開発に役立つことになる。
この態様のワークフローは、実施例1および実施例3で説明した3レベルのsciRNA−seqプロトコルに類似しているが、一部のバージョンではRT段階が含まれていない。
1.RTプライマーのプールの設計。一態様において、これらは個別に合成され、プールされることになる。384を超えるアンプリコンを標的とする場合、記載されているように(Xuら、2018)、プライマーのライブラリーを合成し、二本鎖DNAとして増殖させ、プロセッシングして一本鎖プライマーを生成させることができる。この第2の戦略により、RTプライマーに多くのユニークインデックスを付加することができる(RTおよび最終PCRでのsciRNA−seqインデックス付けが可能になる)。
2.プライマーのプールを使用したマルチプレックスRT。これは、数千の細胞との単一反応(この段階でインデックス付けが行われない場合)、または逆転写時に特異性の高いインデックスを付加する多くの並行反応のいずれかとなる。
3.ヘアピンアダプターのライゲーションによる特異性の高いインデックスの付加。
4.全細胞のプールおよび第2鎖合成の実行。
5.多数のウェル間における細胞の分配、およびタグ付けの実行による第2の一定PCRハンドルの付加。
6.PCR増幅、最終的な特異性の高いインデックスの付加。
7.配列決定。
プライマー設計のワークフロー:
1.標的とされている遺伝子から全エクソンについての配列を収集。
2.可能なすべての25bp RTプライマーの解析。
3.以下による候補RTプライマーのフィルタリング:
a.GC含有量は40〜60%で、およそ55〜70度の融解温度に対応する。
b.プライマーの最後の5ntに少なくとも2つのGまたはCがあり、アニーリングされたRTプライマーが逆転写酵素による伸長の優れた基質となる可能性が高くなる
c.オフターゲットプライミングの可能性。最初の実験において、本発明者らの標的遺伝子は非常に濃縮されているが、リードの大部分は依然として細胞内に豊富にある他のRNAに由来することがわかった。これらのオフターゲットプライミング事象のほとんどは、プライマーの3’末端とオフターゲットRNAの間における約5〜8 bpの相補性の結果であった。したがって、本発明者らの最新のプライマー設計パイプラインでは、全細胞RNA内のRTプライマーの最終六量体の存在量を考慮している。本発明者らは、この最後の六量体が次のいずれかであるRTプライマーのみを含める:
i.リボソームRNA内に全く存在しない。前述の「Not So Random(それほどランダムではない)」またはNSR六量体のセットから(Armourら、2009)。このフィルターを通過するプライマーは、リボソームRNA内でオフターゲットのプライミングを行う可能性がはるかに低くなる。
ii.全細胞RNA内での発現が低い。本発明者らは、ヒトゲノムにマッピングされたPRO−seqリード内の4,096の可能性のあるすべての六量体の存在量をカウントした(Coreら、2014)。PRO−seqは、リボソーム転写を含む、細胞内のすべての新生転写を測定する。本発明者らは、このデータセットにおいて存在量の下位4分の1以内にある六量体で終わるRTプライマーのみを使用する。これにより、リボソームRNA内に存在するものの、細胞内のRNAとして豊富ではないいくつかの六量体がレスキューされる。
この存在量フィルターは、プライマーの選択を大幅に変更する。このフィルターの有無にかかわらず、本発明者らのパイプラインにより選択されたプライマー間の重複はわずか約17%である。本発明者らの設計パイプラインの将来のバージョンでは、このオフターゲットフィルターを改良することになる。より多くのプライマーのデータを収集するにつれて、本発明者らは、より多くのオフターゲットプライミング事象を評価することができるはずである。
4.マッピング可能性による候補のフィルタリング。本発明者らがボウタイを使用して各候補をhg19に対して整列させたところ、3つのミスマッチが認められた。この段階により、確実に各プライマーがゲノム内に1つの標的部位のみを有することになる。
5.これらのフィルターを通過させる可能性のあるプライマーのうち、遺伝子全体にわたって最も均等にタイリングするセットを選択。
本発明者らが標的としている各遺伝子について、エクソンごとに設計するプライマーの数を決定する。本発明者らは、各エクソンについてフィルターを通過する最初と最後のプライマーを含ませ、次いでエクソンをn個のチャンクに正確に分割するプライマー位置からの距離を最小限にすることにより、エクソンを最も均等にカバーする内部プライマーを選択する。
例えば、本発明者らが3つのプライマーを検索している300bpのエクソンの場合、この時点までにすべてのフィルターを通過した位置1、150、および300に最も近いプライマーを使用する。
6.本発明者らのパイロット実験については、RTプライマーを384ウェルプレートにおいて順に並べ、プールしてすべてのプライマーの等モル混合物を作製した。次に、この混合物をT4ポリヌクレオチドキナーゼでリン酸化することにより、sciRNA−seqライブラリー生成中におけるインデックス付きヘアピンオリゴのライゲーションを可能にした(Caoら、2019)。これは、リン酸化オリゴをオーダーするよりもはるかに費用効率が高くなる。25bp RTプライマーはまた、8bpのユニーク分子識別子(UMI)と、ヘアピンオリゴのアニーリング用の6bpハンドルを付加し、これにより、(コンビナトリアルインデックス付け用の)特異性の高いインデックスとPCRハンドルが付加されることになる。
このプロセスは、各RTプライマーを個別に並べている場合、反復することができる:最初の実験で好ましい捕捉率を有することが判明したプライマーを選択的に再プールすることにより、後の実験でより低いオフターゲット比が達成された。各Illuminaの配列決定リードは25 bp RTプライマーと捕捉されたRNA分子にまたがるため、RTプライマーと捕捉された分子を別々にマッピングして、各プライマーについてのオンターゲット率を計算することが可能となる。
後のラウンドでは、アレイを合成させることで、より多くのRTプライマーを組み込むことができる。プライマーライブラリーをPCRによって増殖させ、PCRプライマーに遮断基を含まない鎖の選択的エキソヌクレアーゼ分解により一本鎖にすることができる(Xuら、2018)。大きなアレイを使用して複数のプライマープールを合成することができる:各プールに特異的PCRハンドルがある場合、1つのアレイを使用して、それぞれ選択的に増幅することができる数千のプライマーの数十のプールを生成することができる。
マルチプレックス逆転写:
考えられるところでは、RNA−seqライブラリー生成プロトコル中におけるいくつかの段階で、マルチプレックス標的捕捉を行うことができる。しかしながら、本発明者らは、逆転写が最も簡単に並列化できると考えている。高度のマルチプレックスPCR反応は、正常に実行することが非常に困難である。PCR反応には、多くの(10〜20)サイクルが含まれる。これは、オフターゲットアニーリングの問題が、所望の標的の成長を上回ることが多い、これらのサイクルを通した指数関数的な成長の後に悪化することを意味する。マルチプレックスPCRでは、各標的に2つの特異的PCRプライマーが与えられる。目標は、これら2つのプライマーが標的のみを特異的に増幅させることである。しかしながら、プライマーの大きなプールでは、プール内の他のプライマーにアニーリングするいくつかの組み合わせが存在することになる。プライマーの濃度は鋳型分子の濃度よりもはるかに高いため、これらのプライマー二量体はPCRの終了までにプールの大半を占めることになる。高度に多重化されたPCRが実行不可能であることは、エクソーム配列決定法などの多くの標的化増幅プロトコルが、分子内反転プローブを利用して標的を捕捉することが多い理由である(Hiattら、2013)。かかるプロトコルでは、プローブと標的との間における単一のアニーリング段階を通じて標的の特異性が達成される。標的特異的プローブはPCRハンドルを付加し、次いで標的の一般的なPCR増幅で使用される。単一細胞コンビナトリアルインデックス付け方法は、ライブラリー生成中におけるいくつかの段階でのインデックス付けに依存している:cDNAから標的を捕捉するための反転プローブ法では、十分なインデックス付け段階が行えない。
マルチプレックス標的捕捉について、本発明者らは、特異的逆転写プライマーを使用し、その後、逆転写したすべての分子を増幅するPCR反応を使用する。したがって、本発明者らの戦略は、標的化DNA増幅のための分子内反転プローブの使用に類似している:単一段階(逆転写)は、興味の対象である転写物を選択的に標的にし、PCR中に標的分子を全て増幅するために使用できる一般的なPCRハンドルを付加する。したがって、逆転写中には高い特異性が重要である。RTプライマーのアニーリング後に高温を維持することは、マルチプレックス特異的プライミングに役立つ。通常の逆転写プロトコルは、RNAと逆転写プライマーの混合物を変性させ、4度に冷却してアニーリングを可能にする。この低いアニーリング温度は、オフターゲットアニーリング事象を行わせるには許容範囲を超えている。本発明者らは、伸長できるアニーリング事象のみが、設計した高度に特異的なRTプライマーの全体がそれらの標的を見つける事象であることを確認する必要がある。したがって、他のマルチプレックス特異的逆転写法に触発されたように、本発明者らは、プロトコル全体を通して高温を維持する(Xuら、2018)。本発明者らは、65℃で固定細胞、RTプライマープール、およびdNTPの混合物を変性させ、53℃でアニーリングし、次いで53℃で事前に平衡状態にした逆転写酵素/緩衝液混合物をアニーリング反応に追加し、53℃で20分間伸長させる。したがって、RTプライマーには、変性段階と伸長段階の間に低温でアニーリングする機会は無い。
本方法の残りは、実施例1および実施例3で説明した方法に従う。ヘアピンアダプターは、in situでライゲーションされ、細胞インデックスが付加される。細胞をプールし、洗浄し、最後のインデックス付け段階のために新しいウェルに分割する。これらのウェルでは、第2鎖合成が実行される。次に、2本鎖cDNAにタグ付けし、第2の一般的なPCRハンドルを付加する(第1のハンドルはライゲーションから、第2のハンドルはタグ付けから)。Ampureビーズ結合により細胞からDNAを精製し、次いで第2のインデックスを付加してPCRを実行する。
予備的な結果:
図40〜図42に示すすべての結果は、K562細胞におけるLMO2遺伝子座の遺伝子を標的とするRTプライマーのプールを使用して作製されたバルク(単一細胞コンビナトリアルインデックス付け無し)in situ(すべての段階はパラホルムアルデヒド固定核で実行)ライブラリーからのものである。
References:
Armour, Christopher D., John C.Castle, Ronghua Chen, Tomas Babak, Patrick Loerch, Stuart Jackson, Jyoti K.Shah, et al.2009. “Digital Transcriptome Profiling Using Selective Hexamer Priming for cDNA Synthesis.” Nature Methods 6 (9):647-49.
Cao, Junyue, Malte Spielmann, Xiaojie Qiu, Xingfan Huang, Daniel M.Ibrahim, Andrew J.Hill, Fan Zhang, et al.2019. “The Single-Cell Transcriptional Landscape of Mammalian Organogenesis.” Nature 566 (7745):496-502.
Core, Leighton J., Andre L. Martins, Charles G.Danko, Colin T. Waters, Adam Siepel, and John T. Lis. 2014. “Analysis of Nascent RNA Identifies a Unified Architecture of Initiation Regions at Mammalian Promoters and Enhancers.” Nature Genetics 46 (12):1311-20.
Gasperini, Molly, Andrew J.Hill, Jose L. McFaline-Figueroa, Beth Martin, Seungsoo Kim, Melissa D.Zhang, Dana Jackson, et al.2019. “A Genome-Wide Framework for Mapping Gene Regulation via Cellular Genetic Screens.” Cell 176 (6):1516.
Gasperini, Molly, Andrew Hill, Jose L. McFaline-Figueroa, Beth Martin, Cole Trapnell, Nadav Ahituv, and Jay Shendure. 2018. “crisprQTL Mapping as a Genome-Wide Association Framework for Cellular Genetic Screens.” bioRxiv. https://doi.org/10.1101/314344.
Hiatt, Joseph B., Colin C.Pritchard, Stephen J.Salipante, Brian J.O’Roak, and Jay Shendure. 2013. “Single Molecule Molecular Inversion Probes for Targeted, High-Accuracy Detection of Low-Frequency Variation.” Genome Research 23 (5):843-54.
Marinov, Georgi K., Brian A.Williams, Ken McCue, Gary P.Schroth, Jason Gertz, Richard M.Myers, and Barbara J.Wold. 2014. “From Single-Cell to Cell-Pool Transcriptomes:Stochasticity in Gene Expression and RNA Splicing.” Genome Research 24 (3):496-510.
Saikia, Mridusmita, Philip Burnham, Sara H. Keshavjee, Michael F. Z. Wang, Pablo Moral-Lopez, Meleana M.Hinchman, Charles G.Danko, John S.L. Parker, and Iwijn De Vlaminck. 2018. “Simultaneous Multiplexed Amplicon Sequencing and Transcriptome Profiling in Single Cells.” bioRxiv. https://doi.org/10.1101/328328.
Xie, Shiqi, Jialei Duan, Boxun Li, Pei Zhou, and Gary C.Hon. 2017. “Multiplexed Engineering and Analysis of Combinatorial Enhancer Activity in Single Cells.” Molecular Cell 66 (2):285-99.e5.
Xu, Hansen, Benjamin J.Fair, Zach Dwyer, Michael Gildea, and Jeffrey A.Pleiss. 2018. “Multiplexed Primer Extension Sequencing Enables High Precision Detection of Rare Splice Isoforms.” bioRxiv. https://doi.org/10.1101/331629.
Ziegenhain, Christoph, Beate Vieth, Swati Parekh, Bjoern Reinius, Amy Guillaumet-Adkins, Martha Smets, Heinrich Leonhardt, Holger Heyn, Ines Hellmann, and Wolfgang Enard. 2017. “Comparative Analysis of Single-Cell RNA Sequencing Methods.” Molecular Cell 65 (4):631-43.e4.
本明細書で引用されているすべての特許、特許出願、および出版物の完全な開示、および電子的に入手可能な資料(たとえば、GenBankおよびRefSeqでのヌクレオチド配列の提出、たとえばSwissProt、PIR、PRF、PDBでのアミノ酸配列の提出、ならびにGenBankおよびRefSeqの注釈付きコーディング領域からの翻訳を含む)は、その全体が参照により組み込まれる。出版物で参照されている補足資料(補足表、補足図、補足資料と方法、および/または補足実験データなど)は、同様にその全体が参照により組み込まれる。本出願の開示と参照により本明細書に組み込まれる任意の文書の開示との間に何らかの矛盾が存在する場合、本出願の開示が優先するものとする。前述の詳細な説明と実施例は、理解を明確にするためだけに提供されたものである。そこから不必要な制限が無いものと理解されるべきである。本開示は、示され説明された正確な詳細に限定されるものではなく、当業者にとって明らかな変形は、特許請求の範囲によって定義される開示内に含まれるものとする。
特に明記しない限り、本明細書および特許請求の範囲で使用される成分の量、分子量などを表すすべての数字は、「約」という用語によってすべての場合に修正されると理解されるべきである。したがって、特に反対の指示がない限り、本明細書および特許請求の範囲に記載される数値パラメータは、本開示により得られることが求められる所望の特性に応じて変化してもよい近似値である。少なくとも、そして均等論を特許請求の範囲に限定する試みとしてではなく、各数値パラメータは、報告された有効数字の数を考慮して、通常の丸め手法を適用することにより、少なくとも解釈されるべきである。
本開示の広い範囲を示す数値範囲およびパラメータは近似値であるにもかかわらず、特定の実施例に示される数値は可能な限り正確に報告されている。しかしながら、すべての数値には、それぞれの試験測定値で見出された標準偏差から必然的に生じる範囲が本質的に含まれている。
すべての見出しは読者の便宜のためであり、特に指定されない限り、見出しに続くテキストの意味を制限するために使用すべきではない。

Claims (86)

  1. 複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
    (a)複数の核または細胞を第1の複数の区画に提供すること、
    ここで、各区画は、核または細胞のサブセットを含み;
    (b)細胞または前記細胞から得られた核のサブセットにおいて新しく合成されたRNAを標識すること;
    (c)核または細胞の各サブセットのRNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること、
    ここで、前記プロセッシングは、核または細胞の各サブセットに存在するRNA核酸に第1の区画に固有のインデックス配列を付加して、インデックス付きの核または細胞に存在するインデックス付けされたDNA核酸をもたらし、
    前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、または増幅を含み;および
    (d)前記インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること
    を含む、方法。
  2. 前記プロセッシングが:
    サブセットを逆転写酵素およびRNA核酸にアニーリングするプライマーと接触させることにより、前記プライマーおよび鋳型RNA分子の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生成させること
    を含む、請求項1に記載の方法。
  3. 前記プライマーが、mRNAポリ(A)テイルにアニーリングするポリTヌクレオチド配列を含む、請求項2に記載の方法。
  4. 前記プロセッシングが、サブセットを第2のプライマーと接触させることをさらに含み、前記第2のプライマーが所定のDNA核酸にアニーリングする配列を含む、請求項3に記載の方法。
  5. 前記第2のプライマーが区画に固有のインデックスを含む、請求項4に記載の方法。
  6. 前記プライマーが、所定のRNA核酸にアニーリングする配列を含む、請求項2に記載の方法。
  7. 前記方法が、同じ所定のRNA核酸の異なるヌクレオチドにアニーリングする異なる区画にプライマーを含む、請求項6に記載の方法。
  8. 前記プライマーが鋳型スイッチプライマーを含む、請求項2に記載の方法。
  9. 第1の区画に固有のインデックス配列を付加する前記プロセッシングが、ユニバーサル配列を含むヌクレオチド配列を前記RNA核酸に付加することによりDNA核酸を得、次いで、前記第1の区画に固有のインデックス配列を前記DNA核酸に付加するという2段階プロセスを含む、請求項1に記載の方法。
  10. 複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
    (a)複数の核または細胞を第1の複数の区画に提供すること、
    ここで、各区画は、核または細胞のサブセットを含み;
    (b)各サブセットを逆転写酵素および所定のRNA核酸にアニーリングするプライマーと接触させることにより、前記プライマーおよび鋳型RNA核酸の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせること;
    (c)核または細胞の各サブセットのDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること、
    ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第1の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するインデックス付けされた核酸を得て、前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、または増幅を含み;および
    (d)前記インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること
    を含む、方法。
  11. 前記プライマーが前記第1の区画に固有のインデックス配列を含む、請求項10に記載の方法。
  12. 前記接触の前に、細胞または前記細胞から得られた核の前記サブセットにおける新たに合成されたRNAを標識することをさらに含む、請求項10に記載の方法。
  13. 前記第1区画に固有のインデックス配列を付加するプロセッシングが、ユニバーサル配列を含むヌクレオチド配列を前記核酸に付加し、次いで前記第1区画に固有のインデックス配列を前記核酸に付加するという2段階プロセスを含む、請求項10に記載の方法。
  14. 前記所定のRNA核酸がmRNAである、請求項6または10に記載の方法。
  15. 既存のRNA核酸および新たに合成されたRNA核酸が同じ区画内において同じインデックスで標識される、請求項1または12に記載の方法。
  16. 前記標識することが、ヌクレオチド標識を含む組成物において複数の核または細胞をインキュベートすることを含み、前記ヌクレオチド標識が前記新たに合成されたRNAに組み込まれる、請求項1または12に記載の方法。
  17. 前記ヌクレオチド標識が、ヌクレオチド類似体、ハプテン標識ヌクレオチド、変異誘発性ヌクレオチド、または化学反応により修飾することができるヌクレオチドを含む、請求項16に記載の方法。
  18. 2以上のヌクレオチド標識が前記新たに合成されたRNAに組み込まれる、請求項16に記載の方法。
  19. 1つまたは複数の前記ヌクレオチド標識の比率が、異なる区画または時点の場合には異なる、請求項18に記載の方法。
  20. 前記標識することの前に、核または細胞のサブセットを所定の条件に曝露することをさらに含む、請求項1または12に記載の方法。
  21. 前記所定の条件が、作用物質への曝露を含む、請求項20に記載の方法。
  22. 前記作用物質が、タンパク質、非リボソームタンパク質、ポリケチド、有機分子、無機分子、RNAもしくはRNAi分子、炭水化物、糖タンパク質、核酸、またはそれらの組み合わせを含む、請求項21に記載の方法。
  23. 前記作用物質が治療薬を含む、請求項21に記載の方法。
  24. 2つ以上の区画の前記所定の条件が異なる、請求項20に記載の方法。
  25. 前記曝露することおよび前記標識することが同時に起こるか、または前記曝露することが前記標識することの前に起こる、請求項20に記載の方法。
  26. 前記プールされたインデックス付きの核または細胞のサブセットを第2の複数の区画に分配し、核または細胞のサブセットに存在するインデックス付きの核酸に第2のインデックス配列を付加することにより、デュアルインデックス付きの核酸断片を含むデュアルインデックス付きの核または細胞を作製させること、ここで、前記付加することは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含み;および
    前記デュアルインデックス付きの核または細胞を組み合わせて、プールされたデュアルインデックス付きの核または細胞を作製させること
    をさらに含む、請求項1または10に記載の方法。
  27. 前記プールされたデュアルインデックス付きの核または細胞のサブセットを第3の複数の区画に分配し、核または細胞のサブセットに存在するインデックス付きの核酸に第3のインデックス配列を付加することにより、トリプルインデックス付きの核酸断片を含むトリプルインデックス付きの核または細胞を作製させること、ここで、前記付加することは、ライゲーション、ハイブリダイゼーション、プライマー伸長、増幅、または転位を含み;
    前記トリプルインデックス付きの核または細胞を組み合わせて、プールされたトリプルインデックス付きの核または細胞を作製させること
    をさらに含む、請求項26に記載の方法。
  28. 分配することが希釈を含む、請求項26または27に記載の方法。
  29. 分配することが選別することを含む、請求項26または27に記載の方法。
  30. 前記付加することが、1つまたは2つのインデックス配列を含む核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下でサブセットを前記ヘアピンライゲーション二本鎖と接触させることを含む、請求項26または27に記載の方法。
  31. 前記付加することが、1つ以上のインデックス配列を含む核酸断片をトランスポソーム複合体と接触させることを含み、区画内の前記トランスポソーム複合体が、トランスポザーゼおよびユニバーサル配列を含むものとし、前記接触させることは、前記核酸断片の断片化および核酸断片への前記ユニバーサル配列の組み込みに適した条件をさらに含むものとする、請求項26または27に記載の方法。
  32. 前記付加することが前記第1の区画に固有のインデックス配列のライゲーションを含み、第2のインデックス配列を付加することにより、デュアルインデックス付きの核酸断片を含むデュアルインデックス付きの核または細胞を作製させることをさらに含み、前記付加することは転位を含むものとする、請求項1または10に記載の方法。
  33. 前記付加することが、前記第2の区画に固有のインデックス配列のライゲーションを含み、第3のインデックス配列を付加することにより、トリプルインデックス核酸断片を含むトリプルインデックス付きの核または細胞を作製させることをさらに含み、前記付加することは転位を含むものとする、請求項26に記載の方法。
  34. 前記区画がウェルまたは液滴を含む、請求項1、26または27に記載の方法。
  35. 前記第1の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、請求項1、26または27に記載の方法。
  36. 前記第2の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、請求項26に記載の方法。
  37. 前記第3の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、請求項27に記載の方法。
  38. プールされたインデックス付きの核または細胞からインデックス付きの核酸を得ることにより、複数の核または細胞から配列決定ライブラリーを作製することをさらに含む、請求項1または10に記載の方法。
  39. 前記プールされたデュアルインデックス付きの核または細胞から前記デュアルインデックス付きの核酸を得ることにより、前記複数の核または細胞から配列決定ライブラリーを作製することをさらに含む、請求項26に記載の方法。
  40. 前記プールされたトリプルインデックス付きの核または細胞から前記トリプルインデックス付きの核酸を得ることにより、前記複数の核または細胞から配列決定ライブラリーを作製することをさらに含む、請求項27に記載の方法。
  41. 複数の増幅部位を含む表面を提供すること、
    ただし、前記増幅部位は、遊離3’末端を有する結合した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含むものとし、および
    前記増幅部位を含む表面を、それぞれが複数のインデックスを含む個々の断片からアンプリコンのクローン集団を含む複数の増幅部位を製造するのに適した条件下で、1つ、2つまたは3つのインデックス配列を含む核酸断片と接触させること
    をさらに含む、請求項1から33のいずれか一項に記載の方法。
  42. 前記区画に固有のインデックス配列を付加することが、ユニバーサル配列を含むヌクレオチド配列を前記核酸に付加し、次いで前記区画に固有のインデックス配列を前記核酸に付加するという2段階プロセスを含む、請求項26または27に記載の方法。
  43. 複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって:
    (a)複数の核または細胞を第1の複数の区画に提供すること、
    ここで、各区画は、核または細胞のサブセットを含み;
    (b)各サブセットを逆転写酵素およびプライマーと接触させることにより、前記プライマーおよび鋳型RNA核酸の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせること;
    (c)核または細胞の各サブセットにおけるDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること、
    ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第1の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するインデックス付きの核酸を得て、
    前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含み;および
    (d)前記インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること;
    (e)前記プールされたインデックス付きの核または細胞を第2の複数の区画に分配すること、
    ここで、各区画は、核または細胞のサブセットを含み;
    (f)核または細胞の各サブセット内のDNA分子をプロセッシングして、デュアルインデックス付きの核または細胞を作製させること、
    ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第2の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するデュアルインデックス付きの核酸を得で、
    前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含み;および
    (g)前記デュアルインデックス付きの核または細胞を組み合わせて、プールされたデュアルインデックス付きの核または細胞を作製させること;
    (h)前記プールされたデュアルインデックス付きの核または細胞を第3の複数の区画に分配すること、
    ここで、各区画は、核または細胞のサブセットを含み;
    (i)核または細胞の各サブセットのDNA分子をプロセッシングして、トリプルインデックス付きの核または細胞を作製させること、
    ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第3の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するトリプルインデックス付きの核酸を生じさせ、
    前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含み;および
    (j)前記トリプルインデックス付きの核または細胞を組み合わせて、プールされたトリプルインデックス付きの核または細胞を作製させること
    を含む、方法。
  44. 複数の単一核または単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
    (a)複数の核または細胞を提供すること;
    (b)前記複数の核または細胞を逆転写酵素およびプライマーと接触させることにより、前記プライマーおよび鋳型RNA核酸の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせること;
    (c)前記核または細胞を第1の複数の区画に分配すること、
    ただし、各区画は、核または細胞のサブセットを含むものとする;
    (d)核または細胞の各サブセットにおけるDNA分子をプロセッシングして、インデックス付きの核または細胞を作製させること、
    ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第1の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するインデックス付きの核酸を生じさせ、
    前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含み;および
    (e)前記インデックス付きの核または細胞を組み合わせて、プールされたインデックス付きの核または細胞を作製させること;
    (f)前記プールされたインデックス付きの核または細胞を第2の複数の区画に分配すること、
    ここで、各区画は、核または細胞のサブセットを含み;
    (g)核または細胞の各サブセットにおけるDNA分子をプロセッシングして、デュアルインデックス付きの核または細胞を作製させること、
    ここで、前記プロセッシングは、核または細胞の各サブセットに存在するDNA核酸に第2の区画に固有のインデックス配列を付加して、インデックス付きの核または細胞に存在するデュアルインデックス付きの核酸をもたらし、
    前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含み;
    (h)前記デュアルインデックス付きの核または細胞を組み合わせて、プールされたデュアルインデックス付きの核または細胞を作製すること;
    (i)前記プールされたデュアルインデックス付きの核または細胞を第3の複数の区画に分配すること、
    ここで、各区画は、核または細胞のサブセットを含み;
    (j)核または細胞の各サブセットのDNA分子をプロセッシングして、トリプルインデックス付きの核または細胞を作製すること、
    ここで、前記プロセッシングは、核または細胞のサブセットに存在するDNA核酸に第3の区画に固有のインデックス配列を付加することにより、インデックス付きの核または細胞に存在するトリプルインデックス付きの核酸を得て、
    前記プロセッシングは、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅、または転位を含み;および
    (k)前記トリプルインデックス付きの核または細胞を組み合わせて、プールされたトリプルインデックス付きの核または細胞を作製すること
    を含む、方法。
  45. 前記プライマーがRNA核酸にアニーリングすることにより、前記プライマーおよび鋳型RNA分子の対応するDNAヌクレオチド配列を含む二本鎖DNA核酸を生じさせる、請求項43または44に記載の方法。
  46. 前記プライマーが、mRNAポリ(A)テイルにアニーリングするポリTヌクレオチド配列を含む、請求項45に記載の方法。
  47. 前記接触させることがサブセットを第2のプライマーと接触させることをさらに含み、前記第2のプライマーが所定のDNA核酸にアニーリングする配列を含む、請求項46に記載の方法。
  48. 前記第2のプライマーが区画に固有のインデックスを含む、請求項47に記載の方法。
  49. 前記プライマーが、所定のRNA核酸にアニーリングする配列を含む、請求項45に記載の方法。
  50. 前記所定のRNA核酸がmRNAである、請求項49に記載の方法。
  51. 前記プライマーが鋳型スイッチプライマーを含む、請求項43または44に記載の方法。
  52. 前記第1の区画、第2の区画、または第3の区画に固有のインデックス配列の1つ以上を付加するプロセッシングが、ユニバーサル配列を含むヌクレオチド配列を前記核酸に付加し、次いで前記第1の区画に固有のインデックス配列を前記DNA核酸に付加するという2段階プロセスを含む、請求項43または44に記載の方法。
  53. 前記プライマーが前記第1の区画に固有のインデックス配列を含む、請求項43または44に記載の方法。
  54. 前記接触させることの前に、細胞または該細胞から得られた核のサブセットにおける新たに合成されたRNAを標識することをさらに含む、請求項43または44に記載の方法。
  55. 既存のRNA核酸および新たに合成されたRNA核酸が同じ区画内において同じインデックスで標識される、請求項54に記載の方法。
  56. 前記標識することが、ヌクレオチド標識を含む組成物中において複数の核または細胞をインキュベートすることを含み、前記ヌクレオチド標識が新たに合成されたRNAに組み込まれる、請求項54に記載の方法。
  57. 前記ヌクレオチド標識が、ヌクレオチド類似体、ハプテン標識ヌクレオチド、変異誘発性ヌクレオチド、または化学反応により修飾することができるヌクレオチドを含む、請求項54に記載の方法。
  58. 2以上のヌクレオチド標識が新たに合成されたRNAに組み込まれる、請求項54に記載の方法。
  59. 1つまたは複数の前記ヌクレオチド標識の比率が、異なる区画または時点について異なる、請求項58に記載の方法。
  60. 前記の区画の核または細胞のサブセットを、前記標識することの前に所定の条件に曝露することをさらに含む、請求項54に記載の方法。
  61. 前記所定の条件が、作用物質への曝露を含む、請求項60に記載の方法。
  62. 前記作用物質が、タンパク質、非リボソームタンパク質、ポリケチド、有機分子、無機分子、RNAもしくはRNAi分子、炭水化物、糖タンパク質、核酸、またはそれらの組み合わせを含む、請求項61に記載の方法。
  63. 前記作用物質が治療薬を含む、請求項61に記載の方法。
  64. 2つ以上の区画の前記所定の条件が異なる、請求項60に記載の方法。
  65. 前記曝露することおよび前記標識することが同時に起こるか、または前記曝露することが前記標識することの前に起こる、請求項60に記載の方法。
  66. 1回以上の分配が希釈を含む、請求項43または44に記載の方法。
  67. 1回以上の分配が選別することを含む、請求項43または44に記載の方法。
  68. 第1の区画、第2の区画または第3の区画に固有のインデックス配列の1つ以上を付加することが、核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下でサブセットを前記ヘアピンライゲーション二本鎖と接触させることを含む、請求項43または44に記載の方法。
  69. 第1の区画、第2の区画または第3の区画に固有のインデックス配列の1つ以上を付加することが、核酸断片をトランスポソーム複合体と接触させることを含み、区画中の前記トランスポソーム複合体がトランスポザーゼおよびユニバーサル配列を含むものとし、前記接触が、核酸断片の断片化および核酸断片へのヌクレオチド配列の組み込みに適した条件をさらに含むものとする、請求項43または44に記載の方法。
  70. 前記第1の区画または第2の区画に固有のインデックスを付加することがライゲーションを含み、後続の区画に固有のインデックス配列を付加することが転位を含む、請求項43または44に記載の方法。
  71. 前記区画がウェルまたは液滴を含む、請求項43または44に記載の方法。
  72. 前記第1の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、請求項43または44に記載の方法。
  73. 前記第2の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、請求項43または44に記載の方法。
  74. 前記第3の複数の区画の区画が、50個から100,000,000個の核または細胞を含む、請求項43または44に記載の方法。
  75. 前記プールされたトリプルインデックス付きの核または細胞からトリプルインデックス付きの核酸を得ることにより、前記複数の核または細胞から配列決定ライブラリーを生成することをさらに含む、請求項43または44に記載の方法。
  76. 複数の増幅部位を含む表面を提供すること、
    ここで、前記増幅部位は、遊離3’末端を有する結合した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含み、および
    前記増幅部位を含む表面を、各々が複数のインデックスを含む個々の断片からのアンプリコンのクローン集団を含む複数の増幅部位を生成させるのに適した条件下でトリプルインデックス付きの核酸断片と接触させること
    をさらに含む、請求項43または44に記載の方法。
  77. 複数の単一細胞からの核酸を含む配列決定ライブラリーを調製する方法であって、
    (a)複数の細胞から核を提供すること;
    (b)前記核のサブセットを第1の複数の区画に分配し、各サブセットを逆転写酵素およびプライマーと接触させること、
    ここで、各区画の前記プライマーは、他の区画の第1のインデックス配列とは異なる第1のインデックス配列を含むことで、インデックス付きの核酸断片を含むインデックス付きの核を生成させ;
    (c)前記インデックス付きの核を組み合わせて、プールされたインデックス付きの核を生成させること;
    (d)前記プールされたインデックス付きの核のサブセットを第2の複数の区画に分配し、第1のインデックス配列を含むインデックス付きの核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下で各サブセットを前記ヘアピンライゲーション二本鎖と接触させることで、デュアルインデックス付きの核酸断片を含むデュアルインデックス付きの核を生成させること、
    ここで、前記ヘアピンライゲーション二本鎖は、他の区画の第2のインデックス配列とは異なる第2のインデックス配列を含み;
    (e)前記デュアルインデックス付きの核を組み合わせて、プールされたデュアルインデックス付きの核を生成させること;
    (f)前記プールされたデュアルインデックス付きの核のサブセットを第3の複数の区画に分配し、前記デュアルインデックス付きの核酸断片を第2鎖合成の条件にかけること;
    (g)前記デュアルインデックス付きの核酸断片をトランスポソーム複合体と接触させること、
    ここで、各区画における前記トランスポソーム複合体は、トランスポザーゼおよびユニバーサル配列を含み、前記接触させることが、デュアルインデックス付きの核酸断片の断片化およびデュアルインデックス付きの核酸断片へのユニバーサル配列の組み込みに適した条件を含むことで、一方の端に第1および第2のインデックスを、他方の端にユニバーサル配列を含むデュアルインデックス付きの核酸断片を生成させ;
    (i)各区画の前記デュアルインデックス付きの核酸断片に第3のインデックス配列を組み込むことで、トリプルインデックス断片を生成させること;
    (j)前記トリプルインデックス断片を組み合わせることにより、複数の単一細胞からのトランスクリプトーム核酸を含む配列決定ライブラリーを作製すること
    を含む、方法。
  78. 前記プライマーが、mRNAポリ(A)テイルにアニーリングするポリT配列を含む、請求項77に記載の方法。
  79. 各区画の前記プライマーが、所定のmRNAにアニーリングする配列を含む、請求項77に記載の方法。
  80. 前記方法が、同じ所定のmRNAの異なるヌクレオチドにアニーリングする異なる区画におけるプライマーを含む、請求項79に記載の方法。
  81. 複数の単一細胞からの核酸を含むトランスクリプトーム配列決定ライブラリーを調製する方法であって:
    (a)複数の細胞からプールされた核を提供すること;
    (b)前記プールされた核を逆転写酵素およびmRNAポリ(A)テイルにアニーリングするオリゴdT配列を含むプライマーと接触させることで、核酸断片を含むプールされた核を生成させること;
    (c)前記プールされた核のサブセットを複数の区画に分配し、核酸断片の末端へのヘアピンライゲーション二本鎖のライゲーションに適した条件下で各サブセットを前記ヘアピンライゲーション二本鎖と接触させて、インデックス付きの核酸断片を含むインデックス付きの核を生成させること、
    ここで、前記ヘアピンライゲーション二本鎖が、他の区画のインデックス配列とは異なるインデックス配列を含み;
    (d)前記インデックス付きの核を組み合わせて、プールされたインデックス付きの核を生成させること;
    (e)前記プールされたインデックス付きの核のサブセットを第2の複数の区画に分配し、前記インデックス付きの核酸断片を第2鎖合成の条件にかけること;
    (f)前記インデックス付きの核酸断片をトランスポソーム複合体と接触させること、
    ここで、各区画の前記トランスポソーム複合体は、トランスポザーゼおよびユニバーサル配列を含むものとし、前記接触が、インデックス付きの核酸断片の断片化およびインデックス付きの核酸断片へのユニバーサル配列の組み込みに適した条件を含むことで、一端に前記インデックスを、他端に前記ユニバーサル配列を含むインデックス付きの核酸断片を生成させ;
    (i)各区画の前記インデックス付きの核酸断片に第2のインデックス配列を組み込むことで、デュアルインデックス断片を生成させること;および
    (j)前記デュアルインデックス断片を組み合わせることにより、複数の単一細胞からのトランスクリプトーム核酸を含む配列決定ライブラリーを作製すること
    を含む、方法。
  82. 核を単離する方法であって:
    (a)液体窒素中で組織を急速凍結すること;
    (b)前記組織のサイズを低減することで、加工された組織を得ること;および
    (c)細胞溶解を促進し、1つ以上の外因性酵素の非存在下で核の完全性を保持する緩衝液中でインキュベートすることにより、前記の加工された組織から核を抽出すること
    を含む、方法。
  83. 前記低減することが、組織を細かく刻むこと、組織に鈍力を加えること、またはそれらの組み合わせを含む、請求項82に記載の方法。
  84. (d)前記の抽出された核を架橋剤に曝露して、固定核を得ること;および
    (e)前記固定核を洗浄すること
    をさらに含む、請求項82に記載の方法。
  85. 配列決定ライブラリーの調製に用いるキットであって、請求項16または56に記載のヌクレオチド標識と、ライゲーション、プライマー伸長、または増幅に介在する少なくとも1つの酵素とを含む、キット。
  86. 配列決定ライブラリーの調製に用いるキットであって、所定の核酸にアニーリングする請求項4、6または10に記載のプライマーと、ライゲーション、プライマー伸長、または増幅に介在する少なくとも1つの酵素とを含む、キット。
JP2019570097A 2018-06-04 2019-06-04 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法 Active JP6986103B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021192377A JP2022031810A (ja) 2018-06-04 2021-11-26 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862680259P 2018-06-04 2018-06-04
US62/680,259 2018-06-04
US201962821678P 2019-03-21 2019-03-21
US62/821,678 2019-03-21
PCT/US2019/035422 WO2019236599A2 (en) 2018-06-04 2019-06-04 High-throughput single-cell transcriptome libraries and methods of making and of using

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021192377A Division JP2022031810A (ja) 2018-06-04 2021-11-26 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法

Publications (2)

Publication Number Publication Date
JP2020533952A true JP2020533952A (ja) 2020-11-26
JP6986103B2 JP6986103B2 (ja) 2021-12-22

Family

ID=68769215

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019570097A Active JP6986103B2 (ja) 2018-06-04 2019-06-04 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法
JP2021192377A Pending JP2022031810A (ja) 2018-06-04 2021-11-26 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021192377A Pending JP2022031810A (ja) 2018-06-04 2021-11-26 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法

Country Status (15)

Country Link
US (1) US20210102194A1 (ja)
EP (2) EP4269618A3 (ja)
JP (2) JP6986103B2 (ja)
KR (2) KR102393414B1 (ja)
CN (1) CN111247248A (ja)
AU (2) AU2019282158B2 (ja)
BR (1) BR112019027750A2 (ja)
CA (1) CA3072273A1 (ja)
DK (1) DK3810774T3 (ja)
ES (1) ES2966028T3 (ja)
FI (1) FI3810774T3 (ja)
IL (1) IL272234A (ja)
MX (2) MX2019015262A (ja)
SG (1) SG11202000905PA (ja)
WO (1) WO2019236599A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112592968A (zh) * 2020-12-27 2021-04-02 苏州科诺医学检验实验室有限公司 高通量测序用分子标签接头及其合成方法与应用

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10900065B2 (en) 2014-11-14 2021-01-26 University Of Washington Methods and kits for labeling cellular molecules
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
KR20220156837A (ko) * 2020-02-20 2022-11-28 더 리전트 오브 더 유니버시티 오브 캘리포니아 공간적으로 분해된 단세포 rna 서열분석 방법
JP2023525880A (ja) * 2020-05-15 2023-06-19 インテグレイテッド ディーエヌエー テクノロジーズ, インコーポレイテッド ライゲーションカップルドpcrの方法
CN111549025B (zh) * 2020-06-08 2021-09-14 郑州大学第一附属医院 链置换引物和细胞转录组文库构建方法
WO2021252617A1 (en) 2020-06-09 2021-12-16 Illumina, Inc. Methods for increasing yield of sequencing libraries
WO2022020728A1 (en) * 2020-07-23 2022-01-27 10X Genomics, Inc. Systems and methods for detecting and removing aggregates for calling cell-associated barcodes
CN111996598A (zh) * 2020-08-11 2020-11-27 杭州瀚因生命科技有限公司 一种单细胞染色质可及性的建库方法
US20230265499A1 (en) * 2020-08-14 2023-08-24 Factorial Diagnostics, Inc. In Situ Library Preparation for Sequencing
CN114606301A (zh) * 2020-12-07 2022-06-10 中国科学院脑科学与智能技术卓越创新中心 一种单细胞转录组测序的方法
CN114015755B (zh) * 2020-12-31 2024-03-01 中国科学院北京基因组研究所(国家生物信息中心) 用于标记核酸分子的方法和试剂盒
EP4298244A1 (en) 2021-02-23 2024-01-03 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
CN113160886B (zh) * 2021-04-02 2023-04-07 山东大学 基于单细胞Hi-C数据的细胞类型预测系统
CN115011679B (zh) * 2021-05-12 2023-04-11 浙江大学 一种超高通量单细胞测序方法
CN113652475A (zh) * 2021-07-19 2021-11-16 中国辐射防护研究院 一种重金属铀诱导仓鼠卵巢细胞损伤的研究方法
WO2023044475A1 (en) * 2021-09-20 2023-03-23 Faeth Therapeutics, Inc. Methods of determining metabolic targets and designing nutrient modulating treatments
CN114107459B (zh) * 2021-11-11 2022-12-06 浙江大学 一种基于寡核苷酸链杂交标记的高通量单细胞测序方法
CA3227385A1 (en) * 2021-12-23 2023-06-29 Kazuo TORI Methods and compositions for producing cell-source identifiable collections of nucleic acids
WO2023137292A1 (en) * 2022-01-12 2023-07-20 Jumpcode Genomics, Inc. Methods and compositions for transcriptome analysis
WO2023159151A2 (en) * 2022-02-16 2023-08-24 Factorial Diagnostics, Inc. In situ library preparation
WO2023196572A1 (en) 2022-04-07 2023-10-12 Illumina Singapore Pte. Ltd. Altered cytidine deaminases and methods of use
WO2023225618A2 (en) * 2022-05-18 2023-11-23 Yale University Method for estimating a dynamic molecular program of a cell
CN114774527A (zh) * 2022-05-20 2022-07-22 良渚实验室 一种高通量单细胞转录组测序方法及其应用
EP4332234A1 (en) * 2022-08-29 2024-03-06 Ecole Polytechnique Federale De Lausanne (Epfl) Improved microfluidic transcriptome based screening methods
WO2024069581A1 (en) 2022-09-30 2024-04-04 Illumina Singapore Pte. Ltd. Helicase-cytidine deaminase complexes and methods of use
WO2024073047A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Cytidine deaminases and methods of use in mapping modified cytosine nucleotides
WO2024073043A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Methods of using cpg binding proteins in mapping modified cytosine nucleotides
WO2024118903A1 (en) 2022-11-30 2024-06-06 Illumina, Inc. Chemoenzymatic correction of false positive uracil transformations
CN116497105B (zh) * 2023-06-28 2023-09-29 浙江大学 基于末端转移酶的单细胞转录组测序试剂盒及测序方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015200609A1 (en) * 2014-06-26 2015-12-30 Illumina, Inc. Library preparation of tagged nucleic acid using single tube add-on protocol
WO2016130704A2 (en) * 2015-02-10 2016-08-18 Illumina, Inc. Methods and compositions for analyzing cellular components
US20180023119A1 (en) * 2016-07-22 2018-01-25 Illumina, Inc. Single cell whole genome libraries and combinatorial indexing methods of making thereof

Family Cites Families (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
EP0379559B1 (en) 1988-06-24 1996-10-23 Amgen Inc. Method and reagents for detecting nucleic acid sequences
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
EP0425563B1 (en) 1988-07-20 1996-05-15 David Segev Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
US5248607A (en) * 1988-10-27 1993-09-28 Ciba-Geigy Corporation Monoclonal antibodies and hybridomas specific for green-oat phytochrome
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
EP0439182B1 (en) 1990-01-26 1996-04-24 Abbott Laboratories Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
JPH06197762A (ja) * 1992-12-28 1994-07-19 Iseki & Co Ltd タマネギのdna抽出法
AU694187B2 (en) 1994-02-07 1998-07-16 Beckman Coulter, Inc. Ligase/polymerase-mediated genetic bit analysis TM of single nucleotide polymorphisms and its use in genetic analysis
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
CA2185239C (en) 1994-03-16 2002-12-17 Nanibhushan Dattagupta Isothermal strand displacement nucleic acid amplification
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
JPH11513115A (ja) * 1995-08-21 1999-11-09 アメリカ合衆国 Mhcクラスiの発現の評価方法及びクラスiの発現を調節することが可能なタンパク質
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
ATE377093T1 (de) 2000-07-07 2007-11-15 Visigen Biotechnologies Inc Sequenzbestimmung in echtzeit
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US20030082584A1 (en) * 2001-06-29 2003-05-01 Liang Shi Enzymatic ligation-based identification of transcript expression
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US8030000B2 (en) 2002-02-21 2011-10-04 Alere San Diego, Inc. Recombinase polymerase amplification
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
ES2550513T3 (es) 2002-08-23 2015-11-10 Illumina Cambridge Limited Nucleótidos modificados para secuenciación de polinucleótidos
AU2003272438B2 (en) 2002-09-20 2009-04-02 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
AU2004253882B2 (en) 2003-06-20 2010-06-10 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
ES2949821T3 (es) 2004-01-07 2023-10-03 Illumina Cambridge Ltd Matrices moleculares
US7476503B2 (en) 2004-09-17 2009-01-13 Pacific Biosciences Of California, Inc. Apparatus and method for performing nucleic acid analysis
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
US8445194B2 (en) 2005-06-15 2013-05-21 Callida Genomics, Inc. Single molecule arrays for genetic and chemical analysis
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP2495337A1 (en) 2006-02-24 2012-09-05 Callida Genomics, Inc. High throughput genome sequencing on DNA arrays
SG170028A1 (en) 2006-02-24 2011-04-29 Callida Genomics Inc High throughput genome sequencing on dna arrays
EP2021503A1 (en) 2006-03-17 2009-02-11 Solexa Ltd. Isothermal methods for creating clonal single molecule arrays
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US7910354B2 (en) 2006-10-27 2011-03-22 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2639579B1 (en) 2006-12-14 2016-11-16 Life Technologies Corporation Apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2010003132A1 (en) 2008-07-02 2010-01-07 Illumina Cambridge Ltd. Using populations of beads for the fabrication of arrays on surfaces
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
AU2011323107B2 (en) 2010-11-05 2015-09-10 Illumina, Inc. Linking sequence reads using paired code tags
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
EP2718465B1 (en) 2011-06-09 2022-04-13 Illumina, Inc. Method of making an analyte array
US9453258B2 (en) 2011-09-23 2016-09-27 Illumina, Inc. Methods and compositions for nucleic acid sequencing
CA3003082C (en) 2011-10-28 2020-12-15 Illumina, Inc. Microarray fabrication system and method
EP3366348B1 (en) 2012-01-16 2023-08-23 Greatbatch Ltd. Emi filtered co-connected hermetic feedthrough, feedthrough capacitor and leadwire assembly for an active implantable medical device
MX337140B (es) 2012-04-03 2016-02-12 Illumina Inc Cabazal integrado de lectura optoelectrónica y cartucho fluído útil para secuenciación de ácidos nucleicos.
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
PT3017065T (pt) 2013-07-01 2018-12-18 Illumina Inc Funcionalização de superfícies sem catalisador e enxerto de polímeros
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
CN104032377A (zh) * 2014-06-30 2014-09-10 北京诺禾致源生物信息科技有限公司 单细胞转录组测序文库的构建方法及其应用
SG11201703386XA (en) 2014-10-31 2017-05-30 Illumina Cambridge Ltd Novel polymers and dna copolymer coatings
US10900065B2 (en) * 2014-11-14 2021-01-26 University Of Washington Methods and kits for labeling cellular molecules
EP3244992B1 (en) * 2015-01-12 2023-03-08 10X Genomics, Inc. Processes for barcoding nucleic acids
WO2016154040A2 (en) * 2015-03-23 2016-09-29 The Regents Of The University Of California Biosynthetic labeling and separation of rna
US11390914B2 (en) * 2015-04-23 2022-07-19 Becton, Dickinson And Company Methods and compositions for whole transcriptome amplification
WO2017164936A1 (en) * 2016-03-21 2017-09-28 The Broad Institute, Inc. Methods for determining spatial and temporal gene expression dynamics in single cells
CA3048863A1 (en) * 2016-12-29 2018-07-05 Illumina, Inc. Analysis system for orthogonal access to and tagging of biomolecules in cellular compartments

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015200609A1 (en) * 2014-06-26 2015-12-30 Illumina, Inc. Library preparation of tagged nucleic acid using single tube add-on protocol
WO2016130704A2 (en) * 2015-02-10 2016-08-18 Illumina, Inc. Methods and compositions for analyzing cellular components
US20180023119A1 (en) * 2016-07-22 2018-01-25 Illumina, Inc. Single cell whole genome libraries and combinatorial indexing methods of making thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112592968A (zh) * 2020-12-27 2021-04-02 苏州科诺医学检验实验室有限公司 高通量测序用分子标签接头及其合成方法与应用

Also Published As

Publication number Publication date
BR112019027750A2 (pt) 2022-06-14
JP6986103B2 (ja) 2021-12-22
MX2023001088A (es) 2023-03-16
EP4269618A3 (en) 2024-01-10
CA3072273A1 (en) 2019-12-12
EP3810774B1 (en) 2023-09-13
JP2022031810A (ja) 2022-02-22
AU2021261918A1 (en) 2021-12-02
SG11202000905PA (en) 2020-02-27
DK3810774T3 (da) 2023-12-11
CN111247248A (zh) 2020-06-05
EP3810774A2 (en) 2021-04-28
EP4269618A2 (en) 2023-11-01
IL272234A (en) 2020-03-31
ES2966028T3 (es) 2024-04-18
KR102507415B1 (ko) 2023-03-07
WO2019236599A2 (en) 2019-12-12
WO2019236599A3 (en) 2020-02-20
AU2019282158B2 (en) 2021-08-12
KR20220057665A (ko) 2022-05-09
AU2019282158A1 (en) 2020-01-16
RU2020102911A3 (ja) 2021-08-27
MX2019015262A (es) 2023-01-25
EP3810774A4 (en) 2022-06-01
US20210102194A1 (en) 2021-04-08
RU2020102911A (ru) 2021-07-27
KR20200035955A (ko) 2020-04-06
FI3810774T3 (fi) 2023-12-11
KR102393414B1 (ko) 2022-05-02

Similar Documents

Publication Publication Date Title
JP6986103B2 (ja) 高スループット単一細胞トランスクリプトームライブラリーならびにその作製方法および使用方法
KR102640255B1 (ko) 감소된 증폭 편향을 갖는 고속-대량 단일 세포 서열분석
Li et al. Genome-scale screens identify JNK–JUN signaling as a barrier for pluripotency exit and endoderm differentiation
US11072816B2 (en) Single-cell proteomic assay using aptamers
Kong et al. CellTagging: combinatorial indexing to simultaneously map lineage and identity at single-cell resolution
KR20210134598A (ko) 고-처리량 단일-핵 및 단일-세포 라이브러리 및 이의 제조 및 사용 방법
Zajaczkowski et al. Bioorthogonal metabolic labeling of nascent RNA in neurons improves the sensitivity of transcriptome-wide profiling
Traunmüller et al. A cell-type-specific alternative splicing regulator shapes synapse properties in a trans-synaptic manner
Gao et al. Selective gene expression maintains human tRNA anticodon pools during differentiation
Neumayer et al. A scalable, GMP-compatible, autologous organotypic cell therapy for Dystrophic Epidermolysis Bullosa
RU2773318C2 (ru) Крупномасштабные моноклеточные библиотеки транскриптомов и способы их получения и применения
Chiu Next-generation sequencing and sequence data analysis
NZ760374A (en) High-throughput single-cell transcriptome libraries and methods of making and of using
Weber et al. LoxCode in vivo barcoding resolves epiblast clonal fate to fetal organs
Mahat et al. Single-cell nascent RNA sequencing using click-chemistry unveils coordinated transcription
Janjic Optimizing transcriptomics to study the evolutionary effect of FOXP2
Smith Genetic and Epigenetic Identity of Centromeres
Lee Characterization of the Effects of CIC Loss and Neomorphic IDH1 Mutation on the Transcriptome and Epigenome
Fair Functional Genomics Approaches for Investigating Human Evolution
Pai Studying sequence effects of mRNA 5'cap juxtapositions on translation initiation rate using randomization strategy of the extreme 5'end of mRNA
Pai Studying sequence effects of mRNA 5'cap juxtapositions on translation
Genolet Alberdi Identification of X-chromosomal genes that drive global X-dosage effects in mammals
Ngara Single-Cell RNA Sequencing for Subtype Discovery in Plasmodium Falciparum and Mammalian Cells
Alexander Stage-specific Chromatin Modification and Regulation in Cardiomyocyte Differentiation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200213

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211022

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211126

R150 Certificate of patent or registration of utility model

Ref document number: 6986103

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150