JP2021531823A - 細胞を分析するための方法 - Google Patents

細胞を分析するための方法 Download PDF

Info

Publication number
JP2021531823A
JP2021531823A JP2021523565A JP2021523565A JP2021531823A JP 2021531823 A JP2021531823 A JP 2021531823A JP 2021523565 A JP2021523565 A JP 2021523565A JP 2021523565 A JP2021523565 A JP 2021523565A JP 2021531823 A JP2021531823 A JP 2021531823A
Authority
JP
Japan
Prior art keywords
cells
nucleic acid
acid molecules
barcode sequences
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021523565A
Other languages
English (en)
Other versions
JPWO2020014331A5 (ja
Inventor
ボラージョ,ヤコブ
ディグシット,アトレー
Original Assignee
コーラル・ゲノミクス・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コーラル・ゲノミクス・インコーポレイテッド filed Critical コーラル・ゲノミクス・インコーポレイテッド
Publication of JP2021531823A publication Critical patent/JP2021531823A/ja
Publication of JPWO2020014331A5 publication Critical patent/JPWO2020014331A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本開示は、試料処理および分析のための方法を提供する。複数の細胞を分析する方法は、複数の対象の細胞に由来する複数の細胞を提供することを含み得、この複数の細胞は、複数の対象のうちの対象に由来するものとしてそれらを同定するバーコード配列を含む核酸分子を含む。複数の細胞の複数の核酸分子に由来する核酸分子をシーケンシングして、複数のシーケンシングリードを提供してもよく、得られたシーケンシングリードを処理して、複数のシーケンシングリードのサブセットを対象と関連付けてもよい。【選択図】図2

Description

関連出願の相互参照
本出願は、2018年7月13日に出願された米国仮特許出願番号第62/697,972号および2018年7月27日に出願された米国仮特許出願番号第62/711,444号の利益を主張するものであり、これらの各々は参照によりその全体が本明細書に組み込まれる。
核酸シーケンシング技術は、過去10年間だけでゲノムのコストを1,000倍超削減した。これらの技術的改善は、カメラの進歩と、合成によるシーケンシングと、基質上のデオキシリボ核酸(DNA)のクローン増幅とを組み合わせることによって達成された。次世代シーケンシング(NGS)と名付けられたこの高度に並列化可能なアプローチは、農業からクラスター化反復短回文配列リピート(CRISPR)に至る分野での発見と革新とを後押ししている。そのような革新は、遺伝子分析と、遺伝子型と表現型との間の関連付けの同定とを容易にした。しかし、そのような分析の複雑さおよび費用は依然として著しく大きい。
本明細書では、細胞および核酸分子を分析する改善された方法を提供する必要性が認識される。本明細書に記載の方法は、細胞および/または細胞が由来する対象内の遺伝子型と表現型との間の関連付けの同定を容易にし得る。これらの方法は、代表的な量の遺伝的多様性を組み込んだ、複数の対象由来の細胞を分析することを含み得る。そのような方法は、プールされたスクリーニングアッセイ、およびコンピュテーショナルスパース推論(computational sparse inference)における実験的進歩を活用して、場合によっては、そのようなアッセイのスループットおよび多重化能力を桁違いに増大させる。本明細書で提供される方法は、例えば、細胞誘導、遺伝子型決定、摂動および表現型決定を含む複数のプロセスを一斉に行うことを可能にし得る。
一態様では、本開示は、複数の細胞を分析する方法であって、(a)複数の対象の細胞に由来する複数の細胞を提供することであって、複数の細胞が、複数の核酸分子を含み、複数の核酸分子が、複数のバーコード配列を含むこと、(b)複数の細胞の複数の核酸分子に由来する核酸分子をシーケンシングし、それにより、複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、複数のシーケンシングリードの一部が、複数のバーコード配列を含むこと、(c)複数のシーケンシングリードを処理することであって、この複数のシーケンシングリードが、複数のバーコード配列を含むこと、および(d)複数のバーコード配列のうちのバーコード配列を使用して、複数のシーケンシングリードのサブセットを複数の対象のうちの対象と関連付けることを含み、(b)の前に、バルク増殖環境での複数の対象の細胞の増殖時に、複数の細胞が生成される方法を提供する。
いくつかの実施形態では、複数の核酸分子のサブセットは、複数のバーコード配列を含む。いくつかの実施形態では、複数のバーコード配列は、複数の細胞に対して内因性である。いくつかの実施形態では、方法は、(a)の前に、複数の細胞の複数の核酸分子に複数のバーコード配列を組み込むことをさらに含む。いくつかの実施形態では、複数のバーコード配列は、形質導入を介して複数の細胞に組み込まれる。いくつかの実施形態では、複数のバーコード配列は、ウイルスベクター、トランスフェクション、相同組換え組込み、アグロバクテリウム(agrobacterium)媒介遺伝子導入、抗体コンジュゲートオリゴヌクレオチドまたはエピソームベクターを使用して複数の細胞に組み込まれる。
いくつかの実施形態では、複数のバーコード配列のうちのバーコード配列は、1塩基から1000塩基を含む。いくつかの実施形態では、複数の対象は、複数のヒト対象を含む。いくつかの実施形態では、複数の対象の同一性は、暗号化または曖昧化されている。
いくつかの実施形態では、複数の細胞は体液に由来する。いくつかの実施形態では、体液は、血液、血漿、尿、汗または唾液を含む。いくつかの実施形態では、複数の細胞は、皮膚細胞または有毛細胞を含む。いくつかの実施形態では、複数の細胞は植物細胞を含む。いくつかの実施形態では、植物細胞は、植物の葉または根に由来する。
いくつかの実施形態では、複数の細胞の増殖した細胞は、増殖速度によって層別化される。いくつかの実施形態では、複数の細胞は、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される。いくつかの実施形態では、複数のバーコード配列の少なくともサブセットは、複数の摂動に関連付けられる複数の摂動バーコード配列を含む。いくつかの実施形態では、複数の摂動は、小分子、ノックアウト、抗体、細胞間相互作用、RNAi、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される。いくつかの実施形態では、複数の摂動は、温度の変化またはpHの変化を含む。いくつかの実施形態では、複数の摂動は、遺伝子の変異型の導入を含む。
いくつかの実施形態では、複数のバーコード配列の少なくともサブセットは、複数の測定値に関連付けられる。いくつかの実施形態では、複数の測定値は、RNA−seq、ATAC−seq、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される。いくつかの実施形態では、方法は、(e)複数の細胞に複数の蛍光プローブを導入すること、(f)複数のバーコード配列に複数の蛍光プローブをハイブリダイズさせるのに十分な条件に複数の細胞を供すること、および(g)複数の細胞内の複数のバーコード配列にハイブリダイズした複数の蛍光プローブを光学的に検出することをさらに含む。いくつかの実施形態では、方法は、(e)から(g)を1回以上繰り返すことをさらに含む。いくつかの実施形態では、(c)または(d)は、外部データベースの使用を含む。いくつかの実施形態では、方法は、(b)の前に、複数の核酸分子を処理して核酸分子を生成することをさらに含み、この核酸分子はその後シーケンシングされる。いくつかの実施形態では、処理は、複数の核酸分子のコピーを生成することを含む。いくつかの実施形態では、処理は、複数の細胞から複数の核酸分子を回収することを含む。
別の態様では、本開示は、複数の細胞を分析する方法であって、(a)複数の対象の細胞に由来する第1の複数の細胞を提供することであって、第1の複数の細胞が、第1の複数の核酸分子を含み、第1の複数の核酸分子が、第1の複数のバーコード配列を含むこと、(b)第1の複数の細胞のうちの細胞を複製するのに十分な条件に第1の複数の細胞を供して、第1の複数の細胞のうちの細胞とその複製とを含む第2の複数の細胞を提供することであって、第2の複数の細胞が、第2の複数のバーコード配列を含む第2の複数の核酸分子を含むこと、(c)第1の複数の細胞および第2の複数の細胞のうちの細胞を複数の区分間で区分し、それにより、複数の区分された細胞を提供すること、ならびに(d)複数の区分された細胞に由来する核酸分子をシーケンシングし、それにより、複数の区分された細胞の第2の複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、複数のシーケンシングリードの一部が、第2の複数のバーコード配列を含むこと、(e)複数のシーケンシングリードを処理することであって、この複数のシーケンシングリードが、第2の複数のバーコード配列を含むこと、ならびに(f)第2の複数のバーコード配列のうちのバーコード配列を使用して、複数のシーケンシングリードのサブセットを複数の対象のうちの対象と関連付けることを含む方法を提供する。
いくつかの実施形態では、第1の複数の核酸分子のサブセットは、第1の複数のバーコード配列を含む。いくつかの実施形態では、第1の複数のバーコード配列は、第1の複数の細胞に対して内因性である。
いくつかの実施形態では、方法は、(a)の前に、第1の複数の細胞の第1の複数の核酸分子に第1の複数のバーコード配列を組み込むことをさらに含む。いくつかの実施形態では、第1の複数のバーコード配列は、形質導入を介して第1の複数の細胞に組み込まれる。いくつかの実施形態では、第1の複数のバーコード配列は、ウイルスベクター、トランスフェクション、相同組換え組込み、アグロバクテリウム媒介遺伝子導入、抗体コンジュゲートオリゴヌクレオチドまたはエピソームベクターを使用して、第1の複数の細胞に組み込まれる。
いくつかの実施形態では、第1の複数のバーコード配列または第2の複数のバーコード配列のうちのバーコード配列は、1塩基から1000塩基を含む。いくつかの実施形態では、複数の区分は、複数のウェルを含む。いくつかの実施形態では、複数のウェルのうちのウェルは、1つ以上の細胞を含む。いくつかの実施形態では、(e)は、複数の区分された細胞のうちの細胞に対応するものとして、複数のシーケンシングリードのうちのシーケンシングリードを同定することを含む。いくつかの実施形態では、同定は、複数の区分のうちの区分間に分散されたシーケンシングリードの共有配列を同定することを含む。いくつかの実施形態では、複数の区分は、複数の液滴を含む。いくつかの実施形態では、複数の液滴のうちの液滴は、最大で単一の細胞を含む。いくつかの実施形態では、複数の液滴のうちの液滴は、複数のオリゴヌクレオチドをさらに含み、この複数のオリゴヌクレオチドは、1つ以上のシーケンシングプライマーもしくはその相補体、または1つ以上の追加のバーコード配列を含む。いくつかの実施形態では、(e)は、複数の区分された細胞のうちの細胞に対応するものとして、複数のシーケンシングリードのうちのシーケンシングリードを同定することを含む。
いくつかの実施形態では、複数の対象は、複数のヒト対象を含む。いくつかの実施形態では、複数の対象の同一性は、暗号化または曖昧化されている。いくつかの実施形態では、第1の複数の細胞は、体液に由来する。いくつかの実施形態では、体液は、血液、血漿、尿、汗または唾液を含む。いくつかの実施形態では、第1の複数の細胞は、皮膚細胞または有毛細胞を含む。いくつかの実施形態では、第1の複数の細胞は植物細胞を含む。いくつかの実施形態では、植物細胞は、植物の葉または根に由来する。いくつかの実施形態では、方法は、(d)の前に、バルク増殖環境での複数の対象の細胞の増殖時に、第1の複数の細胞が生成されることをさらに含む。
いくつかの実施形態では、第1の複数の細胞およびその複製は、増殖速度によって層別化される。いくつかの実施形態では、第1の複数の細胞は、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される。いくつかの実施形態では、(d)でシーケンシングされた複数の区分された細胞の核酸分子の一部は、複数の摂動に関連付けられる複数の摂動バーコード配列を含む。いくつかの実施形態では、複数の摂動は、小分子、ノックアウト、抗体、細胞間相互作用、RNAi、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される。いくつかの実施形態では、複数の摂動は、温度の変化またはpHの変化を含む。いくつかの実施形態では、複数の摂動は、遺伝子の変異型の導入を含む。
いくつかの実施形態では、(d)でシーケンシングされた複数の区分された細胞の核酸分子の一部は、複数の測定値に関連付けられる複数のバーコード配列を含む。いくつかの実施形態では、複数の測定値は、RNA−seq、ATAC−seq、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される。いくつかの実施形態では、方法は、(g)第1の複数の細胞に複数の蛍光プローブを導入すること、(h)第1の複数のバーコード配列に複数の蛍光プローブをハイブリダイズさせるのに十分な条件に第1の複数の細胞を供すること、および(i)第1の複数の細胞内の第1の複数のバーコード配列にハイブリダイズした複数の蛍光プローブを光学的に検出することをさらに含む。いくつかの実施形態では、方法は、(g)から(i)を1回以上繰り返すことをさらに含む。いくつかの実施形態では、(e)または(f)は、外部データベースの使用を含む。いくつかの実施形態では、方法は、(d)の前に、第2の複数の核酸分子を処理して核酸分子を生成することをさらに含み、この核酸分子はその後シーケンシングされる。いくつかの実施形態では、処理は、第2の複数の核酸分子のコピーを生成することを含む。いくつかの実施形態では、処理は、第2の複数の細胞から第2の複数の核酸分子を回収することを含む。
別の態様では、本開示は、複数の細胞を分析する方法であって、(a)複数の対象の細胞に由来する複数の細胞を得ること、(b)それらの起源の対象に従って、複数の細胞を差次的にタグ付けすること、(c)複数の細胞の複数の核酸分子に由来する核酸分子をシーケンシングして、複数のシーケンシングリードを提供すること、および(d)複数の対象のうちの対象に、複数のシーケンシングリードのうちの共通のシーケンシングリードを割り当てることであって、共通のシーケンシングリードの割当てが、複数の細胞間の変動とは無関係に行われることを含み、(c)の前に、バルク増殖環境での複数の対象の細胞の増殖時に、複数の細胞が生成される方法を提供する。
いくつかの実施形態では、複数の細胞を差次的にタグ付けすることは、複数の細胞に複数のバーコード配列を導入することを含む。いくつかの実施形態では、複数のバーコード配列は、形質導入を介して複数の細胞に組み込まれる。いくつかの実施形態では、複数のバーコード配列は、ウイルスベクター、トランスフェクション、相同組換え組込み、アグロバクテリウム媒介遺伝子導入、抗体コンジュゲートオリゴヌクレオチドまたはエピソームベクターを使用して、複数の細胞に組み込まれる。いくつかの実施形態では、複数のバーコード配列のうちのバーコード配列は、1塩基から1000塩基を含む。
いくつかの実施形態では、複数の対象は、複数のヒト対象を含む。いくつかの実施形態では、複数の対象の同一性は、暗号化または曖昧化されている。いくつかの実施形態では、複数の細胞は体液に由来する。いくつかの実施形態では、体液は、血液、血漿、尿、汗または唾液を含む。いくつかの実施形態では、複数の細胞は、皮膚細胞または有毛細胞を含む。いくつかの実施形態では、複数の細胞は植物細胞を含む。いくつかの実施形態では、植物細胞は、植物の葉または根に由来する。
いくつかの実施形態では、複数の細胞は、増殖速度によって層別化される。いくつかの実施形態では、複数の細胞は、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される。いくつかの実施形態では、(c)でシーケンシングされた複数の細胞は、複数の摂動に関連付けられる複数の摂動バーコード配列を含む。いくつかの実施形態では、複数の摂動は、小分子、ノックアウト、抗体、細胞間相互作用、RNAi、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される。いくつかの実施形態では、複数の摂動は、温度の変化またはpHの変化を含む。いくつかの実施形態では、複数の摂動は、遺伝子の変異型の導入を含む。いくつかの実施形態では、複数の細胞は、複数の測定値に関連付けられる複数のバーコード配列を含む。いくつかの実施形態では、複数の測定値は、RNA−seq、ATAC−seq、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される。いくつかの実施形態では、方法は、(e)複数の細胞に複数の蛍光プローブを導入すること、(f)複数のバーコード配列に複数の蛍光プローブをハイブリダイズさせるのに十分な条件に複数の細胞を供すること、および(g)複数の細胞内の複数のバーコード配列にハイブリダイズした複数の蛍光プローブを光学的に検出することをさらに含む。いくつかの実施形態では、方法は、(e)から(g)を1回以上繰り返すことをさらに含む。いくつかの実施形態では、(d)は、外部データベースの使用を含む。いくつかの実施形態では、方法は、(c)の前に、複数の核酸分子を処理して核酸分子を生成することをさらに含み、この核酸分子はその後シーケンシングされる。いくつかの実施形態では、処理は、複数の核酸分子のコピーを生成することを含む。いくつかの実施形態では、処理は、複数の細胞から複数の核酸分子を回収することを含む。
別の態様では、本開示は、複数の細胞を分析する方法であって、(a)複数の対象の細胞に由来する複数の細胞を提供することであって、複数の細胞が、複数の核酸分子を含み、複数の核酸分子が、複数のバーコード配列を含むこと、(b)複数の細胞の複数の核酸分子に由来する核酸分子をシーケンシングし、それにより、複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、複数のシーケンシングリードの一部が、複数のバーコード配列を含むこと、(c)複数のシーケンシングリードを処理することであって、この複数のシーケンシングリードが、複数のバーコード配列を含むこと、および(d)複数のバーコード配列のうちのバーコード配列を使用して、複数のシーケンシングリードのサブセットを複数の対象のうちの対象と関連付けることを含み、複数のバーコード配列が、形質導入またはトランスフェクションを介して、複数の細胞の複数の核酸分子に組み込まれる方法を提供する。
いくつかの実施形態では、複数の核酸分子のサブセットは、複数のバーコード配列を含む。いくつかの実施形態では、複数のバーコード配列は、複数の細胞に対して内因性である。いくつかの実施形態では、複数のバーコード配列のうちのバーコード配列は、1塩基から1000塩基を含む。いくつかの実施形態では、複数の対象は、複数のヒト対象を含む。いくつかの実施形態では、複数の対象の同一性は、暗号化または曖昧化されている。
いくつかの実施形態では、複数の細胞は体液に由来する。いくつかの実施形態では、体液は、血液、血漿尿、汗または唾液を含む。いくつかの実施形態では、複数の細胞は、皮膚細胞または有毛細胞を含む。いくつかの実施形態では、複数の細胞は植物細胞を含む。いくつかの実施形態では、植物細胞は、植物の葉または根に由来する。いくつかの実施形態では、(b)の前に、複数の細胞は、バルク増殖環境での複数の対象の細胞の増殖時に生成される。いくつかの実施形態では、複数の細胞の増殖した細胞は、増殖速度によって層別化される。いくつかの実施形態では、複数の細胞は、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される。いくつかの実施形態では、方法は、(e)複数の細胞に複数の蛍光プローブを導入すること、(f)複数のバーコード配列に複数の蛍光プローブをハイブリダイズさせるのに十分な条件に複数の細胞を供すること、および(g)複数の細胞内の複数のバーコード配列にハイブリダイズした複数の蛍光プローブを光学的に検出することをさらに含む。いくつかの実施形態では、方法は、(e)から(g)を1回以上繰り返すことをさらに含む。いくつかの実施形態では、(c)または(d)は、外部データベースの使用を含む。いくつかの実施形態では、方法は、(b)の前に、複数の核酸分子を処理して核酸分子を生成することをさらに含み、この核酸分子はその後シーケンシングされる。いくつかの実施形態では、処理は、複数の核酸分子のコピーを生成することを含む。いくつかの実施形態では、処理は、複数の細胞から複数の核酸分子を回収することを含む。
別の態様では、本開示は、複数の細胞を分析する方法であって、(a)複数の対象から複数の細胞を提供することであって、複数の細胞が、複数の核酸分子を含み、複数の核酸分子が、複数のバーコード配列を含むこと、(b)複数の細胞の複数の核酸分子のうちの核酸分子をシーケンシングし、それにより、複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、複数のシーケンシングリードの一部が、複数のバーコード配列を含むこと、および(c)複数のシーケンシングリードを処理して、複数のシーケンシングリードの各シーケンシングリードを複数の対象のうちの所与の対象と関連付けることを含む方法を提供する。
いくつかの実施形態では、複数のバーコード配列は、複数の核酸分子のサブセットである。
いくつかの実施形態では、複数のバーコード配列は、複数の細胞に対して内因性である。
いくつかの実施形態では、方法は、(a)の前に、第1の複数の核酸分子に複数のバーコード配列を組み込むことをさらに含む。
いくつかの実施形態では、複数のバーコード配列は、形質導入を介して複数の細胞に組み込まれる。いくつかの実施形態では、複数のバーコード配列は、ウイルスベクター、相同組換え組込み、アグロバクテリウム媒介遺伝子導入またはエピソームベクターを使用して、第1の複数の細胞に組み込まれる。
いくつかの実施形態では、複数のバーコード配列の各バーコード配列は、1〜1000塩基を含む。
いくつかの実施形態では、複数の対象は、複数のヒト対象を含む。いくつかの実施形態では、複数の対象の同一性は暗号化されている。いくつかの実施形態では、第1の複数の細胞は、体液に由来する。いくつかの実施形態では、体液は、血液、尿または唾液を含む。いくつかの実施形態では、複数の細胞は、皮膚細胞または有毛細胞を含む。いくつかの実施形態では、複数の細胞は植物細胞を含む。いくつかの実施形態では、植物細胞は、葉または根に由来する。
いくつかの実施形態では、複数の細胞は、バルク増殖環境で増殖される。いくつかの実施形態では、増殖した細胞は、増殖速度によって層別化される。いくつかの実施形態では、複数の細胞は、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される。
別の態様では、本開示は、複数の細胞を分析する方法であって、(a)複数の対象由来の第1の複数の細胞を提供することであって、第1の複数の細胞が、第1の複数の核酸分子を含み、第1の複数の核酸分子が、複数のバーコード配列を含むこと、(b)第1の複数の細胞のうちの細胞を複製するのに十分な条件に第1の複数の細胞を供して、第1の複数の細胞のうちの細胞とその複製とを含む第2の複数の細胞を提供することであって、第2の複数の細胞が、複数のバーコード配列を含む第2の複数の核酸分子を含むこと、(c)第1の複数の細胞および第2の複数の細胞のうちの細胞を複数の区分間で区分し、それにより、複数の区分された細胞を提供すること、(d)複数の区分された細胞の核酸分子をシーケンシングし、それにより、複数の区分された細胞の複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、複数のシーケンシングリードの一部が、複数のバーコード配列を含むこと、ならびに(e)複数のシーケンシングリードを処理して、複数のシーケンシングリードの各シーケンシングリードを複数の対象のうちの所与の対象と関連付けることを含む方法を提供する。
いくつかの実施形態では、複数のバーコード配列は、第1の複数の核酸分子のサブセットである。
いくつかの実施形態では、複数のバーコード配列は、第1の複数の細胞に対して内因性である。
いくつかの実施形態では、方法は、(a)の前に、第1の複数の核酸分子に複数のバーコード配列を組み込むことをさらに含む。
いくつかの実施形態では、複数のバーコード配列は、形質導入を介して第1の複数の細胞に組み込まれる。いくつかの実施形態では、複数のバーコード配列は、ウイルスベクター、相同組換え組込み、アグロバクテリウム媒介遺伝子導入またはエピソームベクターを使用して、第1の複数の細胞に組み込まれる。
いくつかの実施形態では、複数のバーコード配列の各バーコード配列は、1〜1000塩基を含む。
いくつかの実施形態では、複数の区分は、複数のウェルを含む。いくつかの実施形態では、複数のウェルの各ウェルは、1つ以上の細胞を含む。いくつかの実施形態では、(e)は、複数の区分された細胞のうちの所与の細胞に対応するものとして、複数のシーケンシングリードの各シーケンシングリードを同定することを含む。いくつかの実施形態では、同定は、複数の区分のうちの区分間に分散されたシーケンシングリードの共有配列を同定することを含む。
いくつかの実施形態では、複数の区分は、複数の液滴を含む。いくつかの実施形態では、複数の液滴の各液滴は、1つまたはそれ以下の細胞を含む。いくつかの実施形態では、複数の液滴の各液滴は、1つ以上の細胞を含む。いくつかの実施形態では、複数の液滴の各液滴は、複数のオリゴヌクレオチドをさらに含み、この複数のオリゴヌクレオチドは、1つ以上のシーケンシングプライマーまたはその相補体および/または1つ以上の追加のバーコード配列を含む。いくつかの実施形態では、(e)は、複数の区分された細胞のうちの所与の細胞に対応するものとして、複数のシーケンシングリードの各シーケンシングリードを同定することを含む。
いくつかの実施形態では、複数の対象は、複数のヒト対象を含む。いくつかの実施形態では、複数の対象の同一性は暗号化されている。いくつかの実施形態では、第1の複数の細胞は、体液に由来する。いくつかの実施形態では、体液は、血液、尿または唾液を含む。いくつかの実施形態では、複数の細胞は、皮膚細胞または有毛細胞を含む。いくつかの実施形態では、複数の細胞は植物細胞を含む。いくつかの実施形態では、植物細胞は、葉または根に由来する。
いくつかの実施形態では、第1の複数の細胞は、バルク増殖環境で増殖される。いくつかの実施形態では、第1の複数の細胞およびその複製は、増殖速度によって層別化される。いくつかの実施形態では、第1の複数の細胞は、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される。
いくつかの実施形態では、(d)でシーケンシングされた複数の区分された細胞の核酸分子の一部は、複数の摂動に関連付けられる複数の摂動バーコード配列を含む。いくつかの実施形態では、複数の摂動は、小分子、ノックアウト、抗体、細胞間相互作用、リボ核酸干渉(RNAi)、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される。いくつかの実施形態では、複数の摂動は、温度の変化および/またはpHの変化を含む。いくつかの実施形態では、複数の摂動は、遺伝子の変異型の導入を含む。
いくつかの実施形態では、(d)でシーケンシングされた複数の区分された細胞の核酸分子の一部は、複数の測定値に関連付けられる複数のバーコード配列を含む。いくつかの実施形態では、複数の測定値は、リボ核酸シーケンシング(RNA−seq)、Assay for Transposase−Accessible Chromatin using sequencing(ATAC−seq)、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される。
別の態様では、本開示は、複数の細胞を分析する方法であって、(a)複数の対象から複数の細胞を得ること、(b)それらの起源の対象に従って、複数の細胞を差次的にタグ付けすること、(c)複数の細胞の核酸分子をシーケンシングして、複数のシーケンシングリードを提供すること、および(d)複数の対象のうちの所与の対象に、複数のシーケンシングリードのうちの共通のシーケンシングリードを割り当てることであって、シーケンシングリードの割当てが、複数の細胞間の変動とは無関係に行われることを含み、複数の細胞が、バルク増殖環境で増殖される方法を提供する。
いくつかの実施形態では、複数の細胞を差次的にタグ付けすることは、複数の細胞に複数のバーコード配列を導入することを含む。
いくつかの実施形態では、複数のバーコード配列は、形質導入を介して第1の複数の細胞に組み込まれる。いくつかの実施形態では、複数のバーコード配列は、ウイルスベクター、相同組換え組込み、アグロバクテリウム媒介遺伝子導入またはエピソームベクターを使用して、第1の複数の細胞に組み込まれる。
いくつかの実施形態では、複数のバーコード配列の各バーコード配列は、1〜1000塩基を含む。
いくつかの実施形態では、複数の対象は、複数のヒト対象を含む。いくつかの実施形態では、複数の対象の同一性は暗号化されている。いくつかの実施形態では、複数の細胞は体液に由来する。いくつかの実施形態では、体液は、血液、尿または唾液を含む。いくつかの実施形態では、複数の細胞は、皮膚細胞または有毛細胞を含む。いくつかの実施形態では、複数の細胞は植物細胞を含む。いくつかの実施形態では、植物細胞は、葉または根に由来する。
いくつかの実施形態では、複数の細胞は、増殖速度によって層別化される。いくつかの実施形態では、複数の細胞は、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される。
いくつかの実施形態では、(c)でシーケンシングされた複数の細胞は、複数の摂動に関連付けられる複数の摂動バーコード配列を含む。いくつかの実施形態では、複数の摂動は、小分子、ノックアウト、抗体、細胞間相互作用、RNAi、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される。いくつかの実施形態では、複数の摂動は、温度の変化および/またはpHの変化を含む。いくつかの実施形態では、複数の摂動は、遺伝子の変異型の導入を含む。
いくつかの実施形態では、複数の細胞は、複数の測定値に関連付けられる複数のバーコード配列を含む。いくつかの実施形態では、複数の測定値は、RNA−seq、ATAC−seq、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される。
本開示の別の態様は、1つ以上のコンピュータプロセッサによる実行時に、本明細書の上記または他の場所の方法のいずれかを実装する機械実行可能コードを備える非一時的コンピュータ可読媒体を提供する。
本開示の別の態様は、1つ以上のコンピュータプロセッサと、それに連結されたコンピュータメモリとを備えるシステムを提供する。コンピュータメモリは、1つ以上のコンピュータプロセッサによる実行時に、本明細書の上記または他の場所の方法のいずれかを実装する機械実行可能コードを備える。
本開示のさらなる態様および利点は、本開示の例示的な実施形態のみが示され説明される以下の詳細な説明から当業者には容易に明らかになるであろう。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、いずれも本開示から逸脱することなく、様々な明白な点で変更可能である。したがって、図面および説明は、本質的に例示的であり、限定的ではないとみなされるべきである。
参照による組み込み
本明細書中で言及されるすべての刊行物、特許および特許出願は、個々の刊行物、特許または特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に参照により本明細書に組み込まれる。参照により組み込まれる刊行物および特許または特許出願が本明細書に含まれる開示と矛盾する限り、本明細書は、そのようないかなる矛盾する資料よりも優先され、および/または上位にあることが意図される。
本発明の新規な特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴および利点の良好な理解は、本発明の原理を利用した例示的な実施形態を説明している以下の詳細な説明、および添付の図面(同じく本明細書中の「図(figure)」および「図(FIG)」)を参照することによって得られるであろう。
複数の対象に由来する細胞に一斉にバーコードを付けるプールされたスクリーニングスキームの概要を示す(上)。プールされた形式に対して表現型プロファイリングを行って(バーコードとの関連付けによる)、ベースライン状態(左下)と、摂動に応答した状態(右下)とを確立してもよい。対象110の陰影は、細胞111、バーコード付き細胞112、行113および行114の陰影に対応する。対象120の陰影は、細胞121、バーコード付き細胞122、行123および行124の陰影に対応する。対象130の陰影は、細胞131、バーコード付き細胞132、行133および行134の陰影に対応する。 試料および遺伝子データがドナーから導出され、結果に対するドナーのアクセスを維持しながら、データを生成するものに対する匿名性を維持し得る暗号化または曖昧化スキームを概略的に示す。 本明細書に記載の方法の概要を示す。パネルAは、多数のドナーから細胞を得るためのコストが削減され、試料が、汚染されている場合には拒絶され、増殖速度によって層別化され得る例示的なプール化の図式を示す。パネルBは、デオキシリボ核酸(DNA)/リボ核酸(RNA)バーコードが、多くのドナーから得られた細胞が混合されているにもかかわらず、どのようにドナーの同一性を保存するかを概略的に示す。パネルCは、バーコードを遺伝子型に一意にマッピングするように、バーコードをDNAシーケンシングデータと相互に関連付けることができる方法を概略的に示す。パネルDは、摂動をDNAバーコードまたは多くの摂動に相互にマッピングするための組合せ相互関連付けアプローチを概略的に示す。 単一細胞シーケンシングスキームを概略的に示す。 デコンボリューションシーケンシングスキームを概略的に示す。 本明細書で提供される方法を実装するようにプログラムまたは構成されるコンピュータシステムを示す。 一団の薬物および条件に供された細胞の遺伝子発現シグネチャーを示す。
本明細書では本発明の様々な実施形態を示し説明してきたが、そのような実施形態は例としてのみ提供されていることが当業者には明らかであろう。当業者であれば、本発明から逸脱することなく、多数の変形例、変更および置換を思い浮かべることができる。本明細書に記載される本発明の実施形態の様々な代替物を使用することができることを理解されたい。
値が範囲として記載されている場合、そのような開示は、そのような範囲内のすべての可能なサブ範囲の開示、および特定の数値または特定のサブ範囲が明示的に記載されているかどうかにかかわらず、そのような範囲内にある特定の数値の開示を含むことが理解されるであろう。
本明細書で使用される用語「試料」は、一般に、生体試料を指す。試料は対象のものであり得る。試料は、1つの細胞または複数の細胞を含み得る。試料は、1つの核酸分子または複数の核酸分子を含み得る。核酸分子は、リボ核酸(RNA)またはデオキシリボ核酸(DNA)分子であり得る。試料は、細胞および核酸分子(例えば、DNAおよびRNAを含む細胞)を含み得る。試料は組織試料であり得る。試料は、無細胞(cell−free)(または無細胞(cell free))試料であり得る。
本明細書で使用される用語「対象」は、一般に、そこから試料が得られる個体を指す。対象は、ヒトなどの哺乳動物、または植物(例えば、酵母)であり得る。対象は、原核生物(例えば、細菌)または真核生物(例えば、真菌または酵母)であり得る。対象は、家畜(例えば、ヤギまたはブタ)、イヌ、ネコ、マウス、リスまたはトリなどの動物であり得る。対象は、疾患(例えば、癌)に関して症候性であり得る。対象は、疾患に関して無症候性であり得る。対象は患者であり得る。
本明細書で使用される用語「シーケンシング」は、一般に、1つ以上の核酸分子(例えば、ポリヌクレオチド)内のヌクレオチド塩基の配列を決定するための方法および技術を指す。核酸分子は、例えば、その変異体または誘導体(例えば、一本鎖DNA)を含むデオキシリボ核酸(DNA)またはリボ核酸(RNA)であり得る。シーケンシングは、任意の利用可能な技術によって行われ得る。例えば、シーケンシングは、ハイスループットシーケンシング、パイロシーケンシング、ライゲーションによるシーケンシング、合成によるシーケンシング、ハイブリダイゼーションによるシーケンシング、リボ核酸シーケンシング(RNA−Seq)(Illumina)、Digital Gene Expression(Helicos)、次世代シーケンシング、単一分子シーケンシング(例えば、Pacific Biosciences of CaliforniaおよびOxfor Nanopore)、合成による単一分子シーケンシング(SMSS)(Helicos)、超並列シーケンシング、clonal single molecule Array(Solexa)、ショットガンシーケンシング、Maxim−Gilbertシーケンシング、プライマーウォーキング、またはSangerシーケンシングによって行われ得る。シーケンシングは、限定するものではないが、Illumina、Pacific Biosciences(PacBio)、Oxford NanoporeまたはLife Technologies(Ion Torrent)によるシーケンシングシステムなどの様々なシステムによって行われ得る。あるいは、またはそれに加えて、シーケンシングは、核酸増幅、ポリメラーゼ連鎖反応(PCR)(例えば、デジタルPCR、定量的PCRまたはリアルタイムPCR)または等温増幅を使用して行われ得る。そのようなシステムは、対象によって提供される試料からシステムによって生成されるように、細胞または対象(例えば、ヒト)の遺伝子情報に対応する複数の生の遺伝子データを提供し得る。いくつかの例では、そのようなシステムは、シーケンシングリード(本明細書ではまた「リード」)を提供する。リードは、シーケンシングされた核酸分子の配列に対応する一連の核酸塩基を含み得る。
用語「少なくとも」、「を超える」または「以上」が一連の2つ以上の数値のうちの最初の数値の前にある場合はいつでも、用語「少なくとも」、「を超える」または「以上」は、その一連の数値のうちの各数値に適用される。例えば、1、2または3以上は、1以上、2以上または3以上に相当する。
用語「最大(at most)」、「以下(no more than)」、「未満(less than)」または「以下(less than or equal to)」が一連の2つ以上の数値のうちの最初の数値の前にある場合はいつでも、用語「以下(no more than)」、「未満(less than)」または「以下(less than or equal to)」は、その一連の数値のうちの各数値に適用される。例えば、3、2または1以下は、3以下、2以下または1以下に相当する。
本明細書では、複数の細胞を分析する方法が提供される。方法は、複数の対象(例えば、ヒト、植物または動物)由来の複数の細胞を提供することを含み得、複数の細胞は、複数の核酸分子(例えば、デオキシリボ核酸(DNA)またはリボ核酸(RNA)分子)を含む。複数の細胞は、複数の対象の細胞に由来し得る。複数の核酸分子は、複数のバーコード配列を含み得る。例えば、複数の核酸分子の(例えば、各)核酸分子は、複数のバーコード配列のうちのバーコード配列を含み得る。場合によっては、複数のバーコード配列のうちのバーコード配列は、他のあらゆるバーコード配列とは異なる可能性がある。他の場合には、複数のバーコード配列は、同じバーコード配列の複数のコピーを含み得る。複数のバーコード配列は、複数の細胞に対して内因性であり得るか、例えば、形質導入またはトランスフェクションを介して複数の細胞に導入され得る。次いで、複数の細胞の複数の核酸分子のうちの核酸分子がシーケンシングされ得る(例えば、次世代シーケンシングを使用して)。次いで、複数の細胞の複数の核酸分子に由来する核酸分子がシーケンシングされ得る(例えば、次世代シーケンシングを使用して)。シーケンシングは、複数の核酸分子に対応する複数のシーケンシングリードを生成し得る。複数のシーケンシングリードの一部は、複数のバーコード配列のうちのバーコード配列のうちの一部または全部のバーコード配列を含み得る。複数のシーケンシングリードが処理され得る。複数のシーケンシングリードは、複数のバーコード配列を含み得る。複数のバーコード配列のうちのバーコード配列を使用して、複数のシーケンシングリードのうちのシーケンシングリード、または複数のシーケンシングリードのサブセットを、複数の細胞が由来する複数の対象のうちの対象と関連付けてもよい。場合によっては、複数の細胞は、バルク増殖環境で増殖され得る。場合によっては、複数の細胞は、バルク増殖環境での複数の対象の細胞の増殖時に生成され得る。場合によっては、シーケンシングの前に、複数の核酸分子を処理して核酸分子を生成してもよい。続いて、核酸分子がシーケンシングされてもよい。処理は、複数の核酸分子のコピーを生成することを含み得る。処理は、複数の細胞から複数の核酸分子を回収することを含み得る。
場合によっては、複数の細胞を分析する方法は、複数の対象(例えば、ヒト、植物または動物)由来の第1の複数の細胞を提供することを含み得、第1の複数の細胞は、第1の複数の核酸分子(例えば、デオキシリボ核酸(DNA)またはリボ核酸(RNA)分子)を含む。第1の複数の細胞は、複数の対象の細胞に由来し得る。第1の複数の核酸分子(例えば、第1の複数の核酸分子のサブセット)は、複数のバーコード配列(例えば、第1の複数のバーコード配列)を含み得る。例えば、複数の核酸分子のうちの核酸分子は、複数のバーコード配列のうちのバーコード配列を含み得る。場合によっては、複数のバーコード配列のうちのバーコード配列は、他のあらゆるバーコード配列とは異なる可能性がある。他の場合には、複数のバーコード配列は、同じバーコード配列の複数のコピーを含み得る。複数のバーコード配列(例えば、第1の複数のバーコード配列)は、第1の複数の細胞に対して内因性であり得るか、例えば、形質導入またはトランスフェクションを介して第1の複数の細胞に導入され得る。第1の複数の細胞は、第1の複数の細胞のうちの細胞を複製するのに十分な条件に供されて、第1の複数の細胞のうちの細胞とその複製とを含む第2の複数の細胞を提供してもよい。場合によっては、細胞が1回以上複製されてもよい。第2の複数の細胞は、複数のバーコード配列のうちの一部または全部のバーコード配列(例えば、第2の複数のバーコード配列)を含む第2の複数の核酸分子を含み得る。第1の複数の細胞および第2の複数の細胞のうちの細胞は、複数の区分(例えば、液滴またはウェル)間で区分され、それにより、複数の区分された細胞を提供してもよい。場合によっては、複数の区分のうちの区分は、最大で1つの細胞を含み得る。他の場合には、複数の区分のうちの区分は、少なくとも1つの細胞を含み得る。次いで、複数の区分された細胞の核酸分子がシーケンシングされ得る(例えば、次世代シーケンシングを使用して)。次いで、複数の区分された細胞に由来する核酸分子がシーケンシングされ得る(例えば、次世代シーケンシングを使用して)。シーケンシングは、複数の区分された細胞の複数の核酸分子(例えば、第2の複数の核酸分子)に対応する複数のシーケンシングリードを生成し得る。複数のシーケンシングリードの一部は、複数のバーコード配列(例えば、複数のバーコード配列)のうちのバーコード配列のうちの一部または全部のバーコード配列を含み得る。複数のシーケンシングリードが処理され得る。複数のシーケンシングリードは、第2の複数のバーコード配列を含み得る。複数のバーコード配列(例えば、第2の複数のバーコード配列)のうちのバーコード配列を使用して、複数のシーケンシングリードのうちのシーケンシングリード、または複数のシーケンシングリードのサブセットを、第1の複数の細胞が由来する複数の対象のうちの対象と関連付けてもよい。場合によっては、シーケンシングの前に、複数の核酸分子(例えば、第2の複数の核酸分子)を処理して、核酸分子を生成してもよい。続いて、核酸分子がシーケンシングされてもよい。処理は、複数の核酸分子(例えば、第2の複数の核酸分子)のコピーを生成することを含み得る。処理は、複数の細胞(例えば、第2の複数の細胞)から複数の核酸分子(例えば、第2の複数の核酸分子)を回収することを含み得る。本明細書に記載の方法は、汚染による試料損失を制限しながら、単一のドナー由来の試料を分析するのに必要なコストおよび時間と同様のコストおよび時間で、複数のドナーに由来する細胞クローンの多様なセットを分析することを可能にし得る(例えば、図3のパネルAを参照)。
試料
本明細書で提供される方法による分析のための複数の細胞は、単一の対象または複数の対象に由来し得る。場合によっては、同じ数の細胞が、複数の対象のうちの対象に由来し得る。例えば、複数の対象のうちの対象に対して単一の細胞が提供され得る。他の場合には、異なる数の細胞が、複数の対象のうちの対象に由来し得る。場合によっては、細胞は、対象に由来するある量の材料中に提供され得、同じ量の材料が、複数の対象のうちの対象に由来し得る。
対象は、潜在的に目的の核酸分子を有する任意の実体であり得る。例えば、対象は、単細胞生物または多細胞生物などの生物を含み得る。対象は、ヒト、動物または植物を含み得る。一例では、対象はヒトであり得る。対象は患者であり得る。複数の対象は、患者集団を含み得る。例えば、複数の対象のうちの一部または全部の対象は、疾患または障害を有するか、有することが疑われ得る。複数の対象のうちの一部または全部の対象は、以前に疾患(例えば、癌または別の疾患もしくは障害)を有したことが知られている場合がある。あるいは、またはそれに加えて、複数の対象のうちの一部または全部の対象は、特定の遺伝子変異などの同様の遺伝的特徴を有するか、有することが疑われ得る。あるいは、またはそれに加えて、複数の対象のうちの一部または全部の対象は、ウイルスまたは細菌などの病原体に曝露された可能性があるか、曝露されたことが疑われ得る。あるいは、複数の対象のうちの一部または全部の対象は、健康であるか、健康であると考えられ得る。複数の対象のうちの一部または全部の対象は、身体的特徴(例えば、身長、体重、肥満度指数または他の身体的特徴)、民族的もしくは人種的遺伝形質、出生地もしくは居住地、国籍、疾患もしくは寛解状態または他の特徴などの特徴を共有し得る。共通の特徴に基づいて対象を選択する必要はない。例えば、対象は、ランダムに、および/または集団のランダムな部分をサンプリングするために選択され得る。
対象に由来する細胞は、任意の有用なタイプのものであり得、任意の有用な特徴、または対象の一部からサンプリングされ得る。細胞は幹細胞であってよいか、細胞を再プログラムして幹細胞株(例えば、人工多能性幹細胞(iPS))を作成してもよい。植物細胞は、例えば、植物の葉または根に由来し得る。細胞(例えば、植物細胞以外の細胞)は、生物(例えば、ヒトまたは動物)の体液、例えば、血液(例えば、全血、赤血球、白血球(leukocyte)または白血球(white blood cell)、血小板)、血漿、血清、汗、涙、唾液、痰、尿、粘液、精液、滑液、乳汁、初乳、羊膜液、胆汁、間質液もしくは細胞外液、骨髄または脳脊髄液に由来し得る。細胞は、例えば、対象の器官から得られた皮膚試料または腫瘍試料などの組織試料に由来し得る。細胞は、例えば、循環系にアクセスすること(例えば、静脈内または動脈内)、分泌された生体試料(例えば、便、尿、唾液、痰など)を収集すること、組織を外科的に抽出すること(例えば、生検)、拭き取ること、ピペッティングすること、および呼吸によって、対象から得られてもよい。細胞を含む試料は、試料内の細胞を単離するための処理を受けてもよい。例えば、試料から得られた1つ以上の細胞を含む試料は、遠心分離、選択的沈殿、濾過、透過処理、単離および/または他のプロセスに供され得る。
対象に由来する細胞は、1つ以上の核酸分子を含み得る。核酸分子は、一本鎖を含み得るか、二本鎖であり得る。核酸分子の例には、限定するものではないが、DNA、ゲノムDNA、プラスミドDNA、相補的DNA(cDNA)、無細胞(例えば、カプセル化されていない)DNA(cfDNA)、無細胞胎児DNA(cffDNA)、循環腫瘍DNA(ctDNA)、ヌクレオソームDNA、クロマトソームDNA、ミトコンドリアDNA(miDNA)、RNA、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、マイクロRNA(miRNA)、リボソームRNA(rRNA)、循環RNA(cRNA)、低分子ヘアピン型RNA(shRNA)、低分子干渉RNA(siRNA)、人工核酸類似体、組換え核酸、プラスミド、ウイルスベクターおよびクロマチンが挙げられる。対象に由来する細胞は、1つ以上のDNA分子および/または1つ以上のRNA分子を含み得る。目的の核酸分子は、例えば、本明細書に記載の方法を使用する分析のために選択され得る。例えば、RNA分子は、逆転写プロセスを使用して逆転写されて、cDNAを生成し得、cDNAは、その後の分析に供され得る。
核酸分子は、1つ以上の変異(例えば、体細胞または生殖細胞変異)を含み得る。例えば、核酸分子は、1つ以上の付加または欠失などの1つ以上の修飾を含み得る。変異または修飾は、癌などの疾患に関連している場合がある。変異の例には、限定するものではないが、(例えば、単一塩基もしくは塩基対またはそれらの収集物の)付加、(例えば、単一塩基もしくは塩基対またはそれらの収集物の)欠失、塩基置換、(例えば、単一塩基もしくは塩基対またはそれらの収集物の)複製、コピー数多型、一塩基多型、遺伝子融合、トランスバージョン、トランスロケーション、インバージョン、インデル、DNA損傷、異数性、倍数性、染色体融合、染色体構造変化、染色体損傷、遺伝子増幅、遺伝子複製、遺伝子切断および塩基修飾(例えば、メチル化)が挙げられる。
複数の対象由来の細胞は、1つ以上の群にプールされ得る(例えば、図1を参照)。例えば、細胞は、少なくとも約1、2、3、4、5、6、7、8、9、10またはそれ以上の群にプールされ得る。細胞は、約10、9、8、7、6、5、4、3、2以下、またはそれ以下の群にプールされ得る。様々な対象由来の細胞をプールすることにより、細胞は「匿名化」されるか、それらが由来する対象から分離され得る。細胞の詳細がそれらが由来する対象に関連付けられ得るように、タグまたはバーコード(例えば、単一のバーコード配列または複数のバーコード配列)などの同定機能が、プールする前に、対象由来の細胞に提供され得る。暗号化または曖昧化スキームを適用して、対象の同一性を不明瞭にし、匿名性を維持しながら、複数の対象由来の細胞を一斉に分析し、対象の単一の細胞の詳細を提供する能力を依然として維持してもよい(例えば、図2を参照)。そのようなスキームは、複数の対象の遺伝子型と表現型との間の有用な関連付けを依然としてもたらしながら、患者の病歴および同一性を同時に保護するのに有用であり得る。細胞がプールされ得る群は、群が汚染される可能性(例えば、感染症を有する患者に由来する)が低いのに対して、プールされた分析によって得られる顕著なコスト節約と、汚染に関する試験の必要性の減少とを可能にするようにサイズ設定され得る。
プールする前または後に、細胞は、細胞の1つ以上の特徴を変化させるため、または細胞に1つ以上の材料を追加するか、細胞から1つ以上の材料を除去するための処理を受けてもよい。例えば、細胞は、例えば、細胞の視覚化を容易にするために、色素またはフルオロフォアを含むように処理を受けてもよい。色素またはフルオロフォアは、限定するものではないが、SYBRグリーン;SYBRブルー;4’,6−ジアミジノ−2−フェニルインドール(DAPI);プロピジウムヨウ素;ヘキスト;SYBRゴールド;臭化エチジウム;アクリジン;プロフラビン;アクリジンオレンジ;アクリフラビン;フルオロクマニン(fluorcoumanin);エリプチシン;ダウノマイシン;クロロキン;ジスタマイシンD;クロモマイシン;ホミジウム;ミトラマイシン;ルテニウムポリピリジル;アントラマイシン;フェナントリジンおよびアクリジン;臭化エチジウム;ヨウ化プロピジウム;ヨウ化ヘキシジウム(hexidium iodide);ジヒドロエチジウム;エチジウムホモダイマー−1および−2;エチジウムモノアジド;9−アミノ−6−クロロ−2−メトキシアクリジン(ACMA);ヘキスト33258;ヘキスト33342;ヘキスト34580;7−アミノアクチノマイシンD(7−AAD);アクチノマイシンD;キノリニウム(LDS751);ヒドロキシスチルバミジン;SYTOX Blue;SYTOX Green;SYTOX Orange;POPO−1;POPO−3;YOYO−1;YOYO−3;TOTO−1;TOTO−3;JOJO−1;LOLO−1;BOBO−1;BOBO−3;PO−PRO−1;PO−PRO−3;BO−PRO−1;BO−PRO−3;TO−PRO−1;TO−PRO−3;TO−PRO−5;JO−PRO−1;LO−PRO−1;YO−PRO−1;YO−PRO−3;PicoGreen;OliGreen;RiboGreen;SYBR Gold;SYBR Green I;SYBR Green II;SYBR DX;SYTO−40、−41、−42、−43、−44、−45(ブルー);SYTO−13、−16、−24、−21、−23、−12、−11、−20、−22、−15、−14、−25(グリーン);SYTO−81、−80、−82、−83、−84、−85(オレンジ);SYTO−64、−17、−59、−61、−62、−60、−63(レッド);フルオレセイン;フルオレセインイソチオシアネート(FITC);テトラメチルローダミンイソチオシアネート(TRITC);ローダミン;テトラメチルローダミン;紅藻類(Rhodophyta)−フィコエリトリン(R−フィコエリトリン);シアニン−2(Cy−2);シアニン−3(Cy−3);シアニン−3.5(Cy−3.5);シアニン−5(Cy−5);シアニン−5.5(Cy−5.5);シアニン−7(Cy−7);テキサスレッド;Phar−Red;アロフィコシアニン(APC);Sybr Green I;Sybr Green II;Sybr Gold;CellTracker Green;エチジウムホモダイマーI;エチジウムホモダイマーII;エチジウムホモダイマーIII;臭化エチジウム;ウンベリフェロン;エオシン;緑色蛍光タンパク質;エリスロシン;クマリン;メチルクマリン;ピレン;マラカイトグリーン;スチルベン;ルシファーイエロー;カスケードブルー;ジクロロトリアジニルアミンフルオレセイン;ダンシルクロリド;ユーロピウムおよびテルビウムを含むものなどの蛍光ランタニド錯体;カルボキシテトラクロロフルオレセイン;5および/または6−カルボキシフルオレセイン(FAM);VIC,5−(または6−)ヨードアセトアミドフルオレセイン;カルボキシフルオレセインスクシンイミジルエステル(CFSE);5−((2(および3)−5−(アセチルメルカプト)−スクシニル)アミノ)フルオレセイン(SAMSA−フルオレセイン);リサミンローダミンBスルホニルクロリド;5および/または6カルボキシローダミン(ROX);7−アミノ−メチル−クマリン;7−アミノ−4−メチルクマリン−3−酢酸(AMCA);ボロン−ジピロメテン(BODIPY)フルオロフォア;8−メトキシピレン−1,3,6−トリスルホン酸三ナトリウム塩;3,6−ジスルホネート−4−アミノ−ナフタルイミド;フィコビリタンパク質;AlexaFluor 350、405、430、488、532、546、555、568、594、610、633、635、647、660、680、700、750および790色素;DyLight 350、405、488、550、594、633、650、680、755および800色素、他のフルオロフォア;Black Hole(BH)色素および/またはBlack Hole Quencher(BHQ)色素(Biosearch Technologies)BH1−0、BHQ−1、BHQ−3、BHQ−10など);QSY7、QSY9、QSY21、QSY35などのQSY色素蛍光クエンチャー(Molecular Probes/Invitrogen製)、他のクエンチャー(例えば、DabcylおよびDabsyl、Cy5QおよびCy7Q、およびDark Cyanine色素(GE Healthcare)、Dy−Quenchers(Dyomics)(DYQ−660およびDYQ−661など)、およびATTO蛍光クエンチャー(ATTO−TEC GmbH)(ATTO 540Q、580Q、612Qなど))からなる群から選択され得る。例えば、細胞はCFSEによって染色され得る。フルオロフォアまたは色素によって細胞を染色すると、クローン集団内の異なる世代の細胞の同定(例えば、増殖速度による層別化)が容易になり得る。したがって、染色はクローンダイナミクス(clonal dynamics)によるバイアスを減少させ得る。
別の例では、複数の蛍光プローブが複数の細胞に導入され得る(例えば、異なる対象由来の細胞をプールする前もしくは後、または試料収集条件もしくは前処理条件の前もしくは後)。複数の細胞は、複数の細胞内に含まれる複数のバーコード配列など、細胞に含まれる複数の核酸分子に複数の蛍光プローブをハイブリダイズするのに十分な条件に供され得る。複数の核酸分子に(例えば、複数のバーコード配列に)ハイブリダイズした複数の蛍光プローブは、光学的に検出され得る(例えば、イメージングを介して)。このプロセスは、同じまたは異なる蛍光プローブ(例えば、異なる核酸配列および/または異なる蛍光部分を有するプローブ)を用いて1回以上繰り返され得る。このプロセスは、それらのバーコード配列を介して細胞を同定するために使用され得、2つ以上のバーコードセグメントを含むバーコード配列に特に有用であり得る。このプロセスは、蛍光インサイチュハイブリダイゼーション(例えば、連続蛍光インサイチュハイブリダイゼーション(sequential fluorescence in situ hybridization)(seqFISH)などの蛍光インサイチュハイブリダイゼーション(FISH))を含み得る。場合によっては、そのような方法で調査されるバーコード配列は、複数のバーコード配列の第1のセットのバーコード配列(例えば、本明細書に記載されるように、複数の細胞に対して内因性の複数のバーコード配列、または複数の細胞に導入される複数のバーコード配列)のものであり得、(例えば、本明細書に記載されるように)核酸シーケンシングを使用して処理されるバーコード配列は、複数のバーコード配列の第2のセットのバーコード配列のものであり得る。バーコード配列の第1および第2のセットは、重複する場合もあれば、互いに異なる場合もある。
異なる対象由来の細胞を区別するために、複数の対象由来の細胞をプールする前または後に細胞にバーコードを付けてもよい。このバーコード付けスキームは、単一ドナー分析と比較して大幅に削減されたコストで遺伝子型と表現型との間の関連付けを促進し得る(例えば、図3のパネルBを参照)。その後の分析の前に細胞に送達されるバーコード、または内因性変異のサブセットを含むバーコードは、「遺伝子型バーコード」と呼ばれ得る。例えば、バーコードは、例えば、一塩基多型(SNPs)、インデルおよびコピー数多型などの重複する修飾および変異体を含み得る。バーコードは、核酸配列を含み得る。そのような配列は、任意の有用な数の標準ヌクレオチド(canonical nucleotide)(例えば、アデニン、シトシン、グアニン、チミンまたはウラシル核酸塩基を含むヌクレオチド)または非標準ヌクレオチド(non−canonical nucleotide)(例えば、非標準核酸塩基(non−canonical nucleobase)、糖またはリンカー部分を含むヌクレオチド類似体)を含み得る。例えば、核酸バーコード配列は、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20またはそれ以上のヌクレオチドまたは塩基対を含み得る。核酸バーコード配列は、約20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2以下、またはそれ以下のヌクレオチドまたは塩基対を含み得る。核酸バーコード配列は、例えば、6〜10のヌクレオチドまたは塩基対を含み得る。核酸バーコード配列は、少なくとも約10、50、100、1,000またはそれ以上のヌクレオチドまたは塩基対を含み得る。核酸バーコード配列は、約1000、100、50、10以下、またはそれ以下のヌクレオチドまたは塩基対を含み得る。核酸バーコード配列は、1ヌクレオチドまたは塩基対から1000ヌクレオチドまたは塩基対、例えば、4〜10、4〜20、4〜50、4〜100、10〜100、10〜1,000または100〜1,000のヌクレオチドまたは塩基対を含み得る。バーコードは、同じ時間または異なる時間に細胞または核酸分子に提供され得る1つ以上の異なるバーコード配列を含み得る。例えば、バーコードは、第1のパラメータ(例えば、ウェル内の行または列の位置)に対応する第1のバーコード配列と、第2のパラメータに対応する第2のバーコード配列とを含み得る。バーコード配列は、同じまたは異なっていてもよい2つ以上のバーコードセグメントなどの2つ以上のバーコードセグメントを含み得る。そのようなバーコード配列は、スプリットプール法などの組合せアセンブリ法を使用して構築され得る。バーコード配列は、細胞内に存在する内因性核酸のサブセットであり得る。バーコードは、例えば、DNAバーコードまたはRNAバーコードであり得る。DNAバーコードは、RNAバーコードとして発現され得る。バーコードは、例えば、トランスフェクションまたは形質導入を使用して細胞に提供され得る。バーコードは、例えば、抗体(例えば、抗体コンジュゲートオリゴヌクレオチドなど、バーコードにコンジュゲートされた抗体)、アグロバクテリウム媒介遺伝子導入、相同組換え(HR)組込み、エピソームベクターまたはウイルスベクターを使用して細胞に提供され得る。例えば、バーコードは、ウイルス(例えば、レンチウイルス、レトロウイルスまたはアデノウイルス)を使用して細胞に提供され得る。異なる対象に由来する細胞が同じバーコードを有する可能性が低くなるように、複数の対象由来の複数の細胞に多数のバーコードを提供してもよい(例えば、バーコードを付ける細胞の数の10倍超)。対象は、他の対象とは異なるバーコード配列を有し得る(例えば、対象は、固有のバーコード配列を有し得る)。場合によっては、第1の対象由来の複数の細胞が、第1のセットの条件下で、および/または第1のセットのバーコード配列を使用して、第1の時間にバーコード付けされ得るのに対して、第2の対象由来の複数の細胞は、第2のセットの条件下で、および/または第2のセットのバーコード配列を使用して、第2の時間にバーコード付けされてもよく、この第2の時間、第2のセットの条件および/または第2のセットのバーコード配列は、第1の時間、第1のセットの条件および/または第1のセットのバーコード配列とは異なっていてもよい。場合によっては、第1のセットのバーコード配列が、細胞をプールする前に異なる対象由来の細胞に導入され得、次いで、第2のセットのバーコード配列が、細胞をプールした後に細胞に導入され得る。同じ対象由来の細胞に導入された第1のセットのバーコード配列のうちのバーコード配列が、同じ配列を有し得るのに対して、同じ対象由来の細胞に導入された第2のセットのバーコード配列のうちのバーコード配列(例えば、1つ以上の他の対象由来の細胞を含むプール内)は、異なる配列を有し得る。バーコードは、1つ以上の他の構成要素とともに細胞に提供され得る。例えば、幹細胞株(例えば、人工多能性幹細胞(iPS))を作成するための再プログラミング因子に、バーコード(例えば、同じトランスフェクションプロセスにおいて、またはバーコードの構成要素として)が提供され得る。
本開示は、バーコード付き核酸分子(例えば、DNAおよび/またはRNA)を含み得る細胞を増殖させる(例えば、細胞を複製する、または細胞の数を増加させる)ための方法を提供する。そのような方法は、細胞分裂の1つ以上のサイクル(例えば、クローニング)に細胞を供することを含み得る。そのような方法は、細胞増殖(例えば、遺伝物質の複製)に細胞を供することを含み得る。
バーコード付き細胞は、複製に十分な条件に供され得る。バーコード付き細胞の複製は、親細胞と同じバーコードを含み、それにより、その後の分析のために試料集団を濃縮してもよい。バーコード付き細胞は、異なる対象由来の細胞をプールする前に、複製条件に供され得る。あるいは(例えば、バーコードを付ける前に細胞がプールされている場合)、バーコード付き細胞は、異なる対象由来の細胞をプールした後に複製条件に供され得る。バーコード付き細胞は、インキュベーター内、プレート(例えば、マイクロウェルプレート)上、バイオリアクター内、液滴中、または任意の他の容器もしくは区画内で培養され得る。温度、ガス混合物、pH、プレーティング密度、増殖培地および/または他の条件を選択して、細胞型の増殖を最適化してもよい。CFSEなどの色素によって細胞を染色すると、増殖速度による細胞の層別化が促進され得る。次いで、その後の分析のために、特定の世代(例えば、最初に抽出された細胞、第1世代、第2世代、第3世代など)から細胞を選択し、それにより、クローンダイナミクスによるバイアスを減少させてもよい。細胞およびその複製をプールしてもよい。細胞およびその複製を含むプールされた試料は、複数の対象のうちの対象に由来する元の細胞の少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、100またはそれ以上のコピーを含み得る。細胞およびその複製を含むプールされた試料は、複数の対象のうちの対象に由来する元の細胞の約100、50、40、30、20、10、9、8、7、6、5、4、3、2以下、またはそれ以下のコピーを含み得る。場合によっては、プールされた試料は、元の細胞の1コピーから元の細胞の10,000コピー、例えば、元の細胞の1〜10、1〜100、1〜1,000、1〜5,000、10〜100、10〜1,000、10〜10,000、100〜1,000、100〜10,000または1,000〜10,000コピーを含み得る。細胞およびその複製を含むプールされた試料は、元の細胞のいくつかのメンバーがサンプリングされるようにサンプリングされ得る。例えば、元の細胞の1コピーから元の細胞の1,000コピーがサンプリングされ得る。場合によっては、プールされた試料の全部がその後の分析を受けてもよい。他の場合には、プールされた試料の一部が第1の分析を受けてもよく、プールされた試料の別の部分が第2の分析を受けてもよい。例えば、プールされた試料の第1の部分が核酸シーケンシングを受け得るのに対して、プールされた試料の第2の部分が、顕微鏡検査を使用して調査されるか、1つ以上のアッセイまたはスクリーニングに供され得る。例えば、(例えば、プールされた試料の)細胞は、薬物スクリーニング、遺伝子発現スクリーニング(例えば、蛍光標識細胞分取(FACS)を使用する)、または遺伝子型を表現型に大規模に関連付けるために、表現型に関連付けられる多量のバーコードが使用され得る他のスクリーニングを受け得る。同様に、バーコード付き遺伝子型と単一細胞表現型との間の関連付けを同定するためのスクリーニングが、例えば、顕微鏡検査または単一細胞シーケンシングを使用して大規模に行われ得る。
第1の例では、複数の細胞が複数の対象から得られ得る。対象由来の細胞に同じバーコードを提供し、異なる対象由来の細胞に異なるバーコードを提供するように、対象由来の細胞に複数の固有のバーコードを提供してもよい。バーコード(例えば、核酸バーコード配列)は、例えば、レンチウイルスベクターなどのウイルスベクターを使用して細胞に提供され得る。次いで、バーコード付き細胞が、バーコード付き細胞を複製するのに十分な条件に供され得、色素を使用して、増殖速度によって細胞を層別化してもよい(本明細書の他の場所に記載されるように)。あるいは、蛍光タンパク質の一過性発現を使用して、増殖速度によって細胞を層別化してもよい。一過性発現の例には、限定するものではないが、dox誘導性またはクメート誘導性プロモーター系を介する一過性トランスフェクションおよび一過性誘導発現が挙げられる。次いで、複数の対象のうちの異なる対象由来のバーコード付き細胞およびその複製が、その後の分析のためにプールされる。
第2の例では、複数の細胞が複数の対象から得られ得る。次いで、複数の対象のうちの対象に由来する細胞がプールされ得る。複数の固有のバーコードが、プールされた細胞に提供され得る。固有のバーコードの数は、細胞に異なるバーコードを提供するはずであるような数であり得る。バーコード(例えば、核酸バーコード配列)は、例えば、レンチウイルスベクターなどのウイルスベクターを使用して細胞に提供され得る。次いで、プールされたバーコード付き細胞が、バーコード付き細胞を複製するのに十分な条件に供され得、色素を使用して、増殖速度によって細胞を層別化してもよい。次いで、バーコード付き細胞およびその複製が、その後の分析を受け得る。
第3の例では、複数の細胞が複数の対象から得られ得る。対象由来の細胞に同じバーコードを提供し、異なる対象由来の細胞に異なるバーコードを提供するように、対象由来の細胞に複数の固有のバーコードを提供してもよい。バーコード(例えば、核酸バーコード配列)は、例えば、レンチウイルスベクターなどのウイルスベクターを使用して細胞に提供され得る。次いで、バーコード付き細胞がプールされ得る。次いで、プールされたバーコード付き細胞が、バーコード付き細胞を複製するのに十分な条件に供され得、色素を使用して、増殖速度によって細胞を層別化してもよい。次いで、バーコード付き細胞およびその複製が、その後の分析を受け得る。
単一細胞分析
バーコード付き細胞は、そこに含まれる核酸分子を分析するためにシーケンシングを受けてもよい。複数のプールされた細胞のシーケンシングは、計算上および実験的に費用がかかる可能性がある。したがって、本開示は、実質的に削減された計算および実験コストで単一細胞レベルでシーケンシング情報を得るための方法を提供する。
(例えば、複数の対象に由来するバーコード付き細胞およびその複製を含むプールされた試料由来の)バーコード付き細胞は、複数の区分間で区分され得る。場合によっては、複数の区分は複数のウェルを含み得る。他の場合には、複数の区分は、複数の液滴(例えば、水性液滴)を含み得る。複数の区分は、例えば、少なくとも約2つの区分、例えば、少なくとも約10、20、30、40、50、60、70、80、90、100、1,000、10,000、100,000、1,000,000、10,000,000、100,000,000、1,000,000,000またはそれ以上の区分を含み得る。複数の区分は、例えば、約1,000,000,000以下の区分、例えば、約100,000,000、10,000,000、1,000,000、100,000、10,000、1,000、100、90、80、70、60、50、40、30、20、10、5以下、またはそれ以下の区分を含み得る。場合によっては、複数の区分は、96の区分(例えば、96ウェル)または複数の96の区分(例えば、複数の96ウェルプレート)を含み得る。場合によっては、複数の区分は、少なくとも約1,000の区分、例えば、少なくとも約1,000の水性エマルジョン液滴を含み得る。区分は、1つ以上の細胞を含み得る。例えば、複数の区分のうちの区分は、単一の細胞を含み得る。あるいは、複数の区分のうちの区分は、複数の細胞を含み得る。場合によっては、区分は細胞を含まなくてもよい。例えば、複数の液滴のうちの液滴は、細胞を含まなくてもよい。場合によっては、複数の液滴のうちの液滴は、最大1つの細胞(例えば、0または1つの細胞)を含み得る。場合によっては、複数の液滴のうちの液滴は、細胞の一部(例えば、0〜1の細胞)を含み得る。他の場合には、複数の液滴のうちの液滴は、1つ以上の細胞を含み得る。別の例では、複数のウェルのうちのウェルは、細胞を含まなくてもよい。場合によっては、複数のウェルのうちのウェルは、少なくとも約2、3、4、5、6、7、8、9、10またはそれ以上の細胞を含み得る。複数のウェルのうちのウェルは、約10、9、8、7、6、5、4、3、2以下、またはそれ以下の細胞を含み得る。
複数の区分に分散された細胞は、1つ以上の試薬と同時区分され得る。例えば、細胞は、透過処理剤、溶解剤または緩衝液、酵素(例えば、ポリメラーゼ、逆転写酵素または他の酵素)、フルオロフォア、蛍光プローブ、標識部分、プライマー分子、アダプター、バーコード(例えば、核酸バーコード分子)、オリゴヌクレオチド、緩衝液、デオキシヌクレオチド三リン酸、還元剤、酸化剤、キレート剤、洗浄剤、安定剤、ナノ粒子、ビーズおよび抗体からなる群から選択される1つ以上の試薬と同時区分され得る。場合によっては、細胞はすでに1つ以上の試薬を含む区分に移送され得る。場合によっては、細胞を区分に移送してもよく、その後、1つ以上の試薬を区分に提供してもよい。他の場合には、細胞および試薬は、同時に(例えば、液滴形成中に)区分に提供され得る。区分された細胞は、そこに含まれる核酸分子へのアクセスを提供するために、透過処理および/または溶解を含む処理を受け得る。例えば、区分内に含まれる細胞を溶解剤と接触させて、細胞から核酸分子を放出させ、それらをその後の処理に利用できるようにしてもよい。あるいは、細胞を透過処理して、その中の核酸分子へのアクセスを提供してもよい。場合によっては、RNA分子が逆転写を受けてもよい。例えば、RNA分子を逆転写酵素と接触させて、cDNA分子を提供してもよい。場合によっては、区分内に含まれる核酸分子は、例えば、核酸伸長または増幅反応によって複製され得る。核酸分子にプライマー分子をハイブリダイズさせてもよく、得られた複合体はプライマー伸長反応を受けてもよい。ポリメラーゼ(例えば、DNAまたはRNAポリメラーゼ)およびヌクレオチド(例えば、デオキシリボヌクレオチド三リン酸(dNTP))は、プライマー伸長反応に使用され得る。あるいは、プライマー分子またはアダプターを核酸分子の末端にライゲーションし、増幅反応の基礎として使用してもよい。任意の有用な核酸増幅反応が使用され得る。場合によっては、ポリメラーゼ連鎖反応(PCR)(例えば、デジタルPCR、リアルタイムPCRまたは定量的PCR)を使用して、区分内に含まれる核酸分子を増幅してもよい。場合によっては、等温増幅反応を使用して、区分内に含まれる核酸分子を増幅してもよい。
核酸複製反応に使用されるプライマー分子およびアダプターは、ランダムNmer配列を含み得る。そのような配列の使用は、区分内に含まれる核酸分子の潜在的に未知の配列の増幅を容易にし得る。あるいは、またはさらに、プライマー分子およびアダプターは、標的化されたNmer配列(例えば、ポリ(T)配列)を含み得る。場合によっては、ランダムNmer配列および標的化されたNmer配列の両方が使用され得る。プライマー分子およびアダプターは、任意の有用な長さであり、任意の有用な特徴を有し得る。例えば、プライマー分子またはアダプターは、光学的に検出されるか、プライマー分子またはアダプターが結合する配列を同定するために使用され得るフルオロフォアまたは他の標識部分を含み得る。場合によっては、プライマー分子またはアダプターは、バーコード配列(例えば、本明細書に記載されるような)または固有の分子識別子(UMI)配列を含み得る。あるいは、そのような配列は、本明細書では「細胞バーコード」と呼ばれ得る。プライマー分子またはアダプターはまた、例えば、シーケンシングによって核酸分子の分析を容易にするために、1つ以上のシーケンシングプライマー(例えば、Illumina P5およびP7配列などのシーケンシングプラットフォームに有用な配列)または他の機能的配列を含む1つ以上の追加の配列を含み得る。
核酸分子は、単一細胞シーケンシング(例えば、RNAシーケンシング、RNA−seq)および/または他の単一細胞アッセイなどの他の処理を受け得る。例えば、核酸分子はまた、Assay for Transposase−Accessible Chromatin using sequencing(ATAC−seq)を使用して分析され得る。
単一細胞シーケンシング
場合によっては、区分された細胞は、単一細胞シーケンシングに供され得る。区分された細胞に、細胞に固有の細胞バーコードを提供してもよい。場合によっては、細胞バーコードに関連付けられる細胞の数は、少なくとも約2、3、4、5、6、7、8、9、10またはそれ以上の細胞が細胞バーコードに関連付けられ得るように、1つよりも多くてよい。場合によっては、細胞バーコードに関連付けられる細胞の数は、約10、9、8、7、6、5、4、3、2以下、またはそれ以下の細胞が細胞バーコードに関連付けられ得るように、20未満であってよい。シーケンシングは、区分された細胞の核酸分子の配列(例えば、ゲノムDNA配列)を細胞バーコードと関連付けるために行われ得る。一例では、細胞は、区分が1つ以下の細胞を含むように、複数の区分(例えば、液滴)間で区分され得る。細胞は、細胞をバーコード付けおよび/またはさらに処理するのに有用な試薬と同時区分され得る。例えば、細胞は、それに結合した複数の核酸バーコード分子を含むビーズと同時区分され得る。核酸バーコード分子は、プライミング配列と、そのビーズに固有であり、ビーズに結合した複数の核酸バーコード分子のあらゆる核酸バーコード分子にわたって同じであるバーコード配列とを含み得る。このように、異なる区分内の異なる細胞に、固有の細胞バーコードを提供してもよい。細胞バーコードは、例えば、形質導入もしくはトランスフェクションを介して(例えば、本明細書の他の場所に記載されるように)、または細胞の核酸分子にハイブリダイズもしくはライゲーションするプライマー分子もしくはアダプターの構成要素として細胞に提供され得る。後者の場合、ビーズに結合した核酸バーコード分子は、ビーズから放出されて(例えば、光、熱または化学的刺激などの刺激の適用によって)、細胞の核酸バーコード分子と核酸分子との間の相互作用を容易にし得る。ランダムプライミング配列(例えば、ランダムNmer)の使用は、核酸分子の広範囲の配列がサンプリングされることを可能にし得る。核酸分子の全部または一部(例えば、それにハイブリダイズまたはライゲーションされたプライマーまたはアダプターを有する核酸分子)は、それらのそれぞれの区分内で(例えば、プライマー伸長反応を介して)複製され得る。区分の細胞の核酸分子と、細胞と同時区分された(例えば、ビーズに結合した)核酸バーコード分子との相互作用に続いて、区分は、複数のバーコード付き核酸配列を含み得る。バーコード付き核酸配列は、区分された細胞の核酸分子の配列、またはその相補体と、細胞バーコードまたはその相補体と、場合によっては、1つ以上のシーケンシングプライマーとを含み得る。区分のバーコード付き核酸配列の全部ではないが一部は、遺伝子型バーコードを含み得る。場合によっては、バーコード付き核酸配列は、第1の末端に第1のシーケンシングプライマーと、第2の末端に第2のシーケンシングプライマーとを含み得る。区分された細胞の核酸分子の配列、および細胞バーコード配列、またはその相補体は、第1のシーケンシングプライマーと第2のシーケンシングプライマーとの間に配置され得る。複数の区分のうちの異なる区分のバーコード付き核酸配列がプールされ(例えば、液滴を組み合わせることによって)、シーケンサー(例えば、Illuminaのシーケンサー)に提供され得る。場合によっては、シーケンシングプライマーおよび/または他の機能的配列が、それらのそれぞれの区分からのバーコード付き核酸配列の放出に続いてバーコード付き核酸配列に提供され得、その後、さらに処理されたバーコード付き核酸配列がシーケンシングを受け得る。
バーコード付き核酸配列をシーケンシングして、複数のシーケンシングリードを生成してもよい(例えば、図4)。次いで、複数のシーケンシングリードを処理して、ゲノムDNA配列を細胞バーコードと関連付けてもよい。細胞由来の部分的または不完全なゲノムが、遺伝子型バーコードに関連付けられる元の細胞の完全またはさらに完全なゲノム配列に組み合わされ得るように、再構築アプローチを適用してもよい(例えば、図4を参照)。図4では、410の陰影は411の陰影に対応し、420の陰影は421の陰影に対応し、430の陰影は431の陰影に対応する。再構築アプローチは、遺伝子型バーコードと細胞バーコードとの間の重複を同定し、この情報を使用して、一部または全部のシーケンシングリードが、共有の祖先細胞に由来する細胞バーコードを含むことを決定し得る。重複する修飾および変異体、例えば、一塩基多型(SNPs)、インデル、および異なる細胞バーコードに関連付けられるコピー数多型なども使用して、シーケンシングリードの一部または全部が、共有の祖先細胞に由来するそのような特徴を有することを決定してもよい。特に、重複する修飾および変異体は、それ自体が内因性の「遺伝子型バーコード」として使用され得る。例えば、第1の細胞が、第1の遺伝子型バーコードおよび第1の細胞バーコードと関連付けられ得るのに対して、第1の細胞の複製である第2の細胞は、同じ第1の遺伝子型バーコード、および第1の細胞バーコードとは異なる第2の細胞バーコードと関連付けられ得る。第1および第2の細胞バーコードに関連付けられる遺伝子型バーコードを決定することにより、第1および第2の細胞が同じ起源のものであると決定され得る。遺伝子型バーコードが対象に関連付けられている場合、第1および第2の細胞は対象にさらに属すると考えられ得る。別の例では、第1の細胞バーコードを含む第1のシーケンシングリード、および第1の細胞バーコードとは異なる第2の細胞バーコードを含む第2のシーケンシングリードは、同じSNPを含み得る。重複するSNPを使用して、2つのシーケンシングリードが同じ祖先細胞に関連付けられること、ひいては、同じ対象に関連付けられることを決定してもよい。場合によっては、再構築アプローチでは、閾値を使用または確立して、DNA変異体に顕著な量の重複が存在するかどうかを決定してもよい。例えば、再構築アプローチでは、2つの同一の遺伝子型バーコードが正しく対合している可能性に基づいて、DNA変異体内の顕著な量の重複が決定される閾値を使用してもよい。場合によっては、遺伝子型バーコードは、例えば、上記の再構築アプローチを使用して、1つ以上の修飾(例えば、少なくとも約1、2、3、4、5、6、7、8、9、10またはそれ以上の変異などの1つ以上の変異)について修正され得る。場合によっては、遺伝子型バーコードは、例えば、上記の再構築アプローチを使用して、修飾(例えば、約10、9、8、7、6、5、4、3、2以下、またはそれ以下の変異などの変異)について修正され得る。同様に、場合によっては、細胞バーコードは、例えば、上記の再構築アプローチを使用して、1つ以上の修飾(例えば、1、2、3、4、5、6、7、8、9、10またはそれ以上の変異などの1つ以上の変異)について修正され得る。細胞バーコードは、例えば、上記の再構築アプローチを使用して、修飾(例えば、約10、9、8、7、6、5、4、3、2以下、またはそれ以下の変異などの変異)について修正され得る。さらに、単一細胞シーケンシング法を使用して、例えば、少なくとも約2、5、10、50、100、1,000またはそれ以上の細胞などの複数の細胞を同時に処理してもよい。単一細胞シーケンシング法を使用して、例えば、約1000、100、50、10、5、2以下、またはそれ以下の細胞などの複数の細胞を同時に処理してもよい。例えば、2細胞から10細胞、10細胞から100細胞、または100細胞から1,000細胞を同時に処理してもよい。したがって、本明細書で提供される方法は、大規模での単一細胞シーケンシングを容易にする。
場合によっては、再構築を容易にするために外部データセットが使用され得る。例えば、試料中に100の一塩基多型(SNPs)のみが観察される場合、2つの試料間の重複の量は0に近い場合がある。ただし、Exome Aggregation Consortium(ExAC)または1,000ゲノムなどのSNPsの外部データベースと比較した場合、再構築は依然として可能であり得る。
場合によっては、ゲノムDNA配列に関する情報は、RNAシーケンシング中に検出されたDNA変異体を使用して確認され得る。DNAの領域(ゲノムまたはその他)の変異体の頻度は、バーコード、またはバーコードの構築要素として機能し得る。例えば、ミトコンドリアDNA内の対立遺伝子の頻度および/または複数の外因性バーコードの挿入は、バーコード、またはバーコードの構成要素として機能し得る。
デコンボリューションを含むシーケンシング
場合によっては、区分された細胞は、デコンボリューションプロセスを含む多重シーケンシング法を受け得る(例えば、図5を参照)。複数の区分のうちの区分が1つ以上の細胞を含むように、細胞は、複数の区分(例えば、10以上の区分、例えば、少なくとも約10、20、100、1,000、10,000、100,000またはそれ以上の区分)間で区分され得る。複数の区分のうちの区分が1つ以上の細胞を含むように、細胞は、複数の区分(例えば、約100,000、10,000、1,000、100、20、10以下、またはそれ以下の区分)間で区分され得る。異なる元の(例えば、祖先)細胞に対応する細胞が、区分の同じ組合せに存在し得る可能性は低い場合がある。例えば、96ウェルプレートのうち7ウェルに存在する細胞がウェルの同じセットに存在する可能性は10,000,000,000分の1未満であり得る。その後の分析にさらに多くの材料を提供するために、区分(例えば、ウェル)内に含まれる細胞をその区分内で分割することが可能であり得る。細胞は、それらのそれぞれの区分内で溶解または透過処理されて、その中の核酸分子へのアクセスを提供し得る。次いで、区分が固有の区分バーコードによって標識され得るように、得られた区分の内容物(例えば、溶解物)がシーケンシングのために処理され得る。細胞が溶解されない場合、区分バーコードは、遺伝子型バーコードと同じ方法で(例えば、本明細書の他の場所に記載されるように)提供され得る。あるいは、区分バーコードは、例えば、区分バーコードと、場合によっては追加の配列とを含み得る核酸バーコード分子を介して提供され得る。そのような核酸バーコード分子は、溶液中で提供されるか、ビーズなどの基質に結合され得る。場合によっては、区分バーコード配列を含む核酸バーコード分子は、細胞を加える前に区分内(例えば、溶液内、またはマルチウェルプレートのウェルの一部などの区分の表面に固定化される)に含まれ得る。場合によっては、核酸バーコード分子は、区分バーコードと、プライミング配列(例えば、本明細書の他の場所に記載されるような標的化されたプライミング配列またはランダムプライミング配列)とを含み得る。核酸バーコード分子のプライミング配列は、区分内に含まれる核酸分子にハイブリダイズまたはライゲーションし得る。区分内に含まれる核酸分子(例えば、核酸バーコード分子にハイブリダイズまたはライゲーションされた核酸分子)は、1つ以上の複製プロセス、例えば、1つ以上のプライマー伸長反応または核酸増幅反応を受け得る。区分の核酸分子と、区分に提供される核酸バーコード分子との相互作用に続いて、区分は、複数のバーコード付き核酸配列を含み得る。バーコード付き核酸配列は、区分内で区分された細胞のうちの1つの核酸分子の配列、またはその相補体と、区分バーコードまたはその相補体と、場合によっては、1つ以上のシーケンシングプライマーとを含み得る。区分のバーコード付き核酸配列の全部ではないが一部は、遺伝子型バーコードを含み得る。場合によっては、バーコード付き核酸配列は、第1の末端に第1のシーケンシングプライマーと、第2の末端に第2のシーケンシングプライマーとを含み得る。区分された細胞の核酸分子の配列、および区分バーコード配列、またはその相補体は、第1のシーケンシングプライマーと第2のシーケンシングプライマーとの間に配置され得る。複数の区分のうちの異なる区分のバーコード付き核酸配列がプールされ、シーケンサー(例えば、Illuminaのシーケンサー)に提供され得る。場合によっては、シーケンシングプライマーおよび/または他の機能的配列が、それらのそれぞれの区分からのバーコード付き核酸配列の放出に続いてバーコード付き核酸配列に提供され得、その後、さらに処理されたバーコード付き核酸配列がシーケンシングを受け得る。
バーコード付き核酸配列をシーケンシングして、複数のシーケンシングリードを生成してもよい。次いで、複数のシーケンシングリードを処理して、区分(例えば、ウェル)からのゲノムDNA配列をその対応する区分バーコードと関連付けてもよい。場合によっては、長いリードシーケンシングを使用して、ゲノム情報のさらに正確な再構築を容易にしてもよい。例えば、一塩基多型(SNPs)、インデル、および区分に関連付けられるシーケンシングリードのコピー数多型などの修飾および変異体の頻度を決定してもよい。複数の区分のうちの区分にわたって観察されたDNA変異体の頻度を最大化する方法で、遺伝子型バーコードに関連付けられる配列が決定され得る再構築アプローチを適用してもよい。再構築アプローチは、最大尤度、多変数回帰、クラスタリングおよび/またはニューラルネットワークの使用を含み得る。遺伝的共変異に関する任意の事前情報を使用して、再構築の精度を向上させてもよい。再構築アプローチの精度は、修飾と変異体との同時発生をさらに正確に決定するために長いリードシーケンシングを使用するように向上されてもよい。場合によっては、短いリードシーケンシングを含む再構築アプローチでは、段階に対してバーコードが使用され得る。再構築アプローチは、遺伝子型バーコードと区分バーコードとの間の関連付けの決定を提供し得、したがって、遺伝子型バーコードに関連付けられる元の細胞の完全または部分的に完全なゲノム配列の構築を容易にし得る。例えば、第1の区分の第1の細胞に由来する第1のシーケンシングリードが、第1の遺伝子型バーコードおよび第1の区分バーコードに関連付けられ得るのに対して、第2の区分の第2の細胞に由来する第2のシーケンシングリードは、同じ第1の遺伝子型バーコード(例えば、第2の細胞は第1の細胞の複製であり得るか、またはその逆であり得る)、および第1の区分バーコードとは異なる第2の区分バーコードに関連付けられ得る。シーケンシングリードの両方、一方がそのそれぞれの遺伝子型バーコードを含み得るか、シーケンシングリードのどちらもそのそれぞれの遺伝子型バーコードを含まなくてもよい。再構築技術を使用して、第1の区分の第1のシーケンシングリードの特徴と第2の区分の第2のシーケンシングリードの特徴とが同じであると同定し、次いで、第1および第2のシーケンシングリードが同じ祖先細胞に関連付けられると同定してもよい。場合によっては、遺伝子型バーコードは、例えば、上記の再構築アプローチを使用して、1つ以上の修飾(例えば、少なくとも約1、2、3、4、5、6、7、8、9、10またはそれ以上の変異などの1つ以上の変異)について修正され得る。場合によっては、遺伝子型バーコードは、例えば、上記の再構築アプローチを使用して、修飾(例えば、約10、9、8、7、6、5、4、3、2以下、またはそれ以下の変異などの変異)について修正され得る。同様に、場合によっては、区分バーコードは、例えば、上記の再構築アプローチを使用して、1つ以上の修飾(例えば、少なくとも約1、2、3、4、5、6、7、8、9、10またはそれ以上の変異などの1つ以上の変異)について修正され得る。区分バーコードは、例えば、上記の再構築アプローチを使用して、修飾(例えば、約10、9、8、7、6、5、4、3、2以下、またはそれ以下の変異などの変異)について修正され得る。さらに、デコンボリューションに基づくシーケンシング法を使用して、例えば、少なくとも約2、5、10、50、100、1,000またはそれ以上の細胞などの複数の細胞を同時に処理してもよい。デコンボリューションに基づくシーケンシング法を使用して、例えば、約1000、100、50、10、5、2以下、またはそれ以下の細胞などの複数の細胞を同時に処理してもよい。例えば、2細胞から10細胞、10細胞から100細胞、または100細胞から1,000細胞を同時に処理してもよい。したがって、本明細書で提供される方法は、大規模での単一細胞シーケンシングを容易にする。
摂動
場合によっては、摂動は、複数の細胞にわたる遺伝子型に結合され得る(例えば、図3のパネルCを参照)。例えば、遺伝的、薬物または環境的摂動は、バーコード(例えば、RNAバーコードとして発現され得るDNAバーコード)に結合され、先のセクションに記載されるように複数の細胞のうちの細胞のゲノムに組み込まれ得る。摂動は、例えば、小分子、ノックアウト、オープンリーディングフレーム(ORF)またはクラスター化反復短回文配列リピート(CRISPR)単一ガイドRNA(sgRNA)の付加を含み得る。場合によっては、摂動は、温度またはpHの変化を含み得る。遺伝子型バーコード(例えば、対象に関連付けられるバーコード)を摂動バーコードに関連付けることによって、遺伝子型と摂動との間の関連付けを決定してもよい。この関連付けを使用して、トランスクリプトームの変化(RNAシーケンシングによる)および/または形態(シーケンシングがインサイチュで行われる場合)などの細胞応答を同定してもよい。
摂動バーコードは、核酸バーコードであり得る。場合によっては、摂動バーコードは、オープンリーディングフレーム(ORF)、ガイドRNA(例えば、sgRNA)または低分子ヘアピン型RNAなどの別の形質導入された要素を同定する核酸配列を含み得る。場合によっては、摂動バーコードは、例えば、トランスフェクションまたは形質導入を使用して細胞に提供され得る。場合によっては、摂動バーコードは、抗体(例えば、抗体コンジュゲートオリゴヌクレオチドなど、バーコードにコンジュゲートされた抗体)、アグロバクテリウム媒介遺伝子導入、相同組換え(HR)組込み、エピソームベクターまたはウイルスベクターを使用して細胞に提供され得る。例えば、摂動バーコードは、ウイルス(例えば、レンチウイルス、レトロウイルスまたはアデノウイルス)を使用して細胞に提供され得る。場合によっては、遺伝子型バーコードに加えて摂動バーコードが使用され得る。単一細胞シーケンシング(例えば、上記のような)を使用して、遺伝子型バーコードを1つ以上の摂動バーコードおよび細胞バーコードの両方に関連付けて、遺伝子型と摂動との間の関連付けを確立してもよい。あるいは、クローン拡大の後に、複数の区分間(例えば、マルチウェルプレートにわたり)の細胞のランダムな分類と、デコンボリューション/再構築アプローチを使用して得られたバーコード間の相関とが続き得るデコンボリューションアプローチを使用してもよい。1つ以上の摂動バーコードのシーケンシングは、それを区分バーコードと関連付けるような方法で行ってもよい。遺伝子型バーコードはまた、それが区分バーコードと関連付けられ得るようにシーケンシングされて、遺伝子型と摂動との間の関連付けを確立し得る。単一細胞シーケンシングおよびデコンボリューションアプローチの詳細は、本明細書の他の場所に含まれる。
コンピュータシステム
本開示は、本開示の方法を実装するようにプログラムされたコンピュータシステムを提供する。図6は、本明細書で提供される方法を実行するようにプログラムまたは構成されるコンピュータシステム601を示す。コンピュータシステム601は、本開示の方法の様々な態様、例えば、様々な試料から細胞をプールすること、複数の区分間で細胞を区分すること、区分内または区分外の細胞にバーコードを提供すること、シーケンシングリードをシーケンシングすること、および遺伝子型と表現型との間の関連付けを決定することなどを調整することができる。コンピュータシステム601は、ユーザの電子装置、または電子装置に対して遠隔に位置するコンピュータシステムであり得る。電子装置は、携帯型電子装置であり得る。
コンピュータシステム601は、中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」)605を含み、中央処理装置はシングルコアもしくはマルチコアプロセッサ、または並列処理のための複数のプロセッサであり得る。コンピュータシステム601はまた、メモリまたはメモリ位置610(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)、電子記憶ユニット615(例えば、ハードディスク)、1つ以上の他のシステムとの通信のための通信インターフェース620(例えば、ネットワークアダプタ)、および周辺装置625、例えば、キャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプタを含む。メモリ610、記憶ユニット615、インターフェース620および周辺装置625は、マザーボードなどの通信バス(実線)を介してCPU605と通信する。記憶ユニット615は、データを記憶するためのデータ記憶ユニット(またはデータリポジトリ)であり得る。コンピュータシステム601は、通信インターフェース620の助けを借りて、コンピュータネットワーク(「ネットワーク」)630に動作可能に結合され得る。ネットワーク630は、インターネット、インターネットおよび/またはエクストラネット、またはインターネットと通信するイントラネットおよび/またはエクストラネットであり得る。場合によっては、ネットワーク630は電気通信および/またはデータネットワークである。ネットワーク630は、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる1つ以上のコンピュータサーバを含むことができる。場合によっては、ネットワーク630は、コンピュータシステム601の助けを借りて、ピアツーピアネットワークを実装することができ、これにより、コンピュータシステム601に結合された装置がクライアントまたはサーバとして動作することが可能になり得る。
CPU605は、一連の機械可読命令を実行することができ、機械可読命令はプログラムまたはソフトウェアで具体化することができる。命令は、メモリ610などのメモリ位置に記憶されてもよい。命令は、CPU605に向けられ得、命令は、その後、本開示の方法を実装するようにCPU605をプログラムまたは構成し得る。CPU605によって実行される動作の例には、フェッチ、デコード、実行およびライトバックが挙げられ得る。
CPU605は、集積回路などの回路の一部であり得る。システム601の1つ以上の他の構成要素が回路に含まれ得る。場合によっては、回路は特定用途向け集積回路(ASIC)である。
記憶ユニット615は、ドライバ、ライブラリおよび保存されたプログラムなどのファイルを記憶することができる。記憶ユニット615は、ユーザデータ、例えば、ユーザ嗜好およびユーザプログラムを記憶することができる。場合によっては、コンピュータシステム601は、イントラネットまたはインターネットを介してコンピュータシステム601と通信するリモートサーバ上に位置するなど、コンピュータシステム601の外部にある1つ以上の追加のデータ記憶ユニットを含むことができる。
コンピュータシステム601は、ネットワーク630を介して1つ以上のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム601は、ユーザのリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例には、パーソナルコンピュータ(PC)(例えば、ポータブルPC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone、Android対応装置、Blackberry(登録商標))または携帯情報端末が挙げられる。ユーザは、ネットワーク630を介してコンピュータシステム601にアクセスすることができる。
本明細書に記載の方法は、例えば、メモリ610または電子記憶ユニット615など、コンピュータシステム601の電子記憶位置に記憶された機械(例えば、コンピュータプロセッサ)実行可能コードによって実装することができる。機械実行可能コードまたは機械可読コードは、ソフトウェアの形態で提供され得る。使用中、プロセッサ605によってコードを実行することができる。場合によっては、コードは、プロセッサ605による容易なアクセスのために、記憶ユニット615から検索され、メモリ610に記憶され得る。いくつかの状況では、電子記憶ユニット615を除外することができ、機械実行可能命令がメモリ610に記憶される。
コードは、コードを実行するように構成されたプロセッサを有する機械とともに使用するために事前コンパイルおよび構成することができるか、実行時にコンパイルすることができる。コードは、事前コンパイルまたはアズコンパイル(as−compiled)の様式でコードを実行可能にするように選択され得るプログラミング言語で供給されてもよい。
コンピュータシステム601など、本明細書で提供されるシステムおよび方法の態様は、プログラミングで具体化することができる。この技術の様々な態様は、典型的には、機械(またはプロセッサ)実行可能コードおよび/またはあるタイプの機械可読媒体に搭載または具体化される関連データの形態で、「製品」または「製造品」と考えられ得る。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶ユニットに記憶することができる。「記憶」タイプの媒体には、コンピュータ、プロセッサなど、またはその関連モジュールの有形メモリのいずれかまたは全部、例えば、ソフトウェアプログラミングに対して任意の時点で非一時的記憶を提供し得る様々な半導体メモリ、テープドライブ、ディスクドライブなどが含まれ得る。ソフトウェアの全部または一部は、時に、インターネットまたは他の様々な電気通信ネットワークを介して通信されてもよい。そのような通信は、例えば、あるコンピュータまたはプロセッサから別のコンピュータまたはプロセッサ、例えば管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのローディングを可能にし得る。したがって、ソフトウェア要素を搭載し得る別のタイプの媒体には、ローカル装置間の物理的インターフェースにわたって、有線および光固定電話ネットワークを通じて、ならびに様々なエアリンクを介して使用されるような光波、電波および電磁波が含まれる。例えば、有線リンクまたは無線リンク、光学式リンクなど、そのような波を運ぶ物理的要素もまた、ソフトウェアを搭載した媒体と考えられ得る。本明細書で使用される場合、非一時的な有形の「記憶」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のためにプロセッサに命令を提供することに関与する任意の媒体を指す。
したがって、コンピュータ実行可能コードなどの機械可読媒体は、限定するものではないが、有形の記憶媒体、搬送波媒体または物理的伝送媒体を含む多くの形態を取り得る。不揮発性記憶媒体には、例えば、図面に示されるデータベースなどを実装するために使用され得るような、任意の(1または複数の)コンピュータなどの記憶装置のいずれかなどの光学または磁気ディスクが含まれる。揮発性記憶媒体には、そのようなコンピュータプラットフォームのメインメモリなどの動的メモリが含まれる。有形伝送媒体には、同軸ケーブル、すなわち、コンピュータシステム内のバスを構成する配線を含む銅線および光ファイバが含まれる。搬送波伝送媒体は、無線周波数(RF)および赤外(IR)データ通信中に生成されるものなど、電気信号もしくは電磁信号、または音波もしくは光波の形態を取り得る。したがって、一般的な形態のコンピュータ可読媒体には、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル多目的ディスク(DVD)もしくはデジタル多目的ディスク−読み取り専用メモリ(DVD−ROM)、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理記憶媒体、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、プログラマブル読み取り専用メモリ(PROM)および消去可能プログラマブル読み取り専用メモリ(EPROM)、FLASH−EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、そのような搬送波を運ぶケーブルもしくはリンク、またはコンピュータがそこからプログラミングコードおよび/またはデータを読み取り得る任意の他の媒体が含まれる。これらの形態のコンピュータ可読媒体の多くは、実行のためにプロセッサに1つ以上の命令の1つ以上のシーケンスを運ぶことに関与し得る。
コンピュータシステム601は、例えば、複数の区分間のバーコードおよび変異体の視覚化および/または遺伝子型と表現型との間の関連付けを提供するためのユーザインターフェース(UI)640を備える電子ディスプレイ635を含むか、それと通信することができる。UIの例には、限定するものではないが、グラフィカルユーザインターフェース(GUI)、およびWebベースのユーザインターフェースが挙げられる。
本開示の方法およびシステムは、1つ以上のアルゴリズムによって実装することができる。アルゴリズムは、中央処理装置605による実行時にソフトウェアによって実装することができる。アルゴリズムは、例えば、サンプリングスキームに適した数および複雑さのバーコードを設計することができる。
[実施例]
[実施例1]
新規治療薬候補の臨床試験結果予測:遺伝子型特異的反応
記載された方法を使用して、数千人の白血病患者から得られた癌細胞を含むバンクを確立する。様々な用量で細胞に新規治療薬候補を適用し、治療薬の適用の有無にかかわらず、遺伝子型バーコードの相対的増殖速度を測定する。これら2つの数値の比を使用して、遺伝子型に関連付けられる治療応答(および治療用量)に変動があるかどうかを決定する。
この方法はまた、特定の遺伝子型および/または他の細胞バイオマーカーを再層別化する時点で既存の治療薬に対して使用され得る。
[実施例2]
新規治療薬候補の臨床試験結果予測:遺伝子型特異的毒性
記載された方法を使用して、数千人の健常な患者から得られた正常な線維芽細胞を含むバンクを確立する。プールされた様式で、治療薬に感受性な細胞型(例:肝細胞)に細胞を再プログラムし、分化させることができる。様々な用量で細胞に新規治療薬候補を適用し、RNA−seq、顕微鏡検査またはフローサイトメトリーなどの単一細胞表現型アッセイによって、毒性に関連するバイオマーカーの発現レベルを決定する。フローサイトメトリーの場合、毒性マーカーに基づいて細胞を分類する。高毒性ビン内の遺伝子型バーコードの存在を使用して、第I相臨床試験での選択のために患者を層別化することができる。
この方法はまた、特定の遺伝子型および/または他の細胞バイオマーカーを再層別化する時点で既存の治療薬に対して使用され得る。
本明細書に記載の方法はまた、例えば、治療剤を使用して疾患または状態を治療する際に、個別化された投薬を容易にし得る。
[実施例3]
新規治療薬候補の臨床試験結果予測:遺伝子型特異的アジュバント療法
記載された方法を使用して、アルツハイマー病患者から得られた再プログラムされたニューロンを含むバンクを確立する。細胞に新規治療薬候補を適用する。さらに、摂動に対応するノックアウト/ノックダウン/過剰発現が標的治療薬または遺伝子治療にマッピングされる細胞に対して、遺伝子スクリーニングを行う。RNA−seq、顕微鏡検査またはフローサイトメトリーなどの単一細胞表現型アッセイによって、治療応答、遺伝的摂動および遺伝子型の間の相乗効果を決定する。例えば、αシヌクレインの発現レベルは、応答のバイオマーカーとして使用することができる。
この方法はまた、特定の遺伝子型および/または他の細胞バイオマーカーを再層別化する時点で既存の治療薬に対して使用され得る。
図7は、一団の薬物および条件に供された患者細胞の遺伝子発現シグネチャーを示す。遺伝子発現シグネチャーは、治療条件に関連するベースラインからの平均変化に基づいて定義される。列は異なる患者に対応し、行は異なる治療条件に対応する。最上段の行は、細胞が老化のモデルに供される条件に対応する。他の行は、食品医薬品局(FDA)が承認した薬物化合物による治療に対応する。治療条件は、患者全体にわたりZ正規化される。陰影の範囲は、6標準偏差のダイナミックレンジを表す。このアプローチを使用して、創薬のための新しいバイオマーカーと新しい標的とを使用して最適な治療法を選択するために患者を層別化することができる。
[実施例4]
新規治療薬候補
記載された方法を使用して、性別、民族、年齢および病状に関する有意な変動を含むランダムなヒト集団から得られた毛髪試料由来の再プログラムされた幹細胞からバンクを確立する。様々な細胞型(例:心筋細胞、造血幹細胞、γアミノ酪酸作動性(GABA作動性)ニューロン)に細胞を分化させ、単一細胞アッセイ(例えば、RNA−seq、ATAC−seqなど)を使用して分子的にプロファイリングする。遺伝的変異体は表現型の変異に関連する。細胞に対して遺伝的摂動の候補を予測および試験して、治療薬のリードを生成する。
[実施例5]
農業用途:植物
記載された方法を使用して、遺伝的に多様なプロトプラストの集団(自然変異または変異誘発によって生成された)からバンクを確立する。経路内の遺伝子の発現レベルの測定によって、細胞の光合成活性を決定する。表現型の変異に関連する遺伝的変異体を決定し、細胞に対して遺伝的摂動の候補を予測および試験する。最良の候補は、成体植物に成長する。
[実施例6]
農業用途:動物
記載された方法を使用して、遺伝的に多様な動物の集団(自然変異または変異誘発によって生成された)からバンクを確立する。経路内の遺伝子の発現レベルの測定によって、細胞に関連する測定基準を決定する。表現型の変異に関連する遺伝的変異体を決定し、細胞に対して遺伝的摂動の候補を予測および試験する。最良の候補は、望ましい特性を有する成体動物に成長する。
[実施例7]
摂動の分析
対象(例えば、ヒトまたは動物の対象)に対応する複数の細胞を提供する。例えば、遺伝子またはその一部をこの遺伝子の遺伝子型の多様なセットによって置き換えるように、複数の細胞を摂動させる。摂動は、第1の摂動バーコードに関連付けられる。細胞には遺伝子型バーコードも提供される(例えば、本明細書の他の場所に記載されるように)。したがって、摂動された細胞は、細胞の摂動に関連付けられる第1の摂動バーコードと、細胞に特異的な遺伝子型バーコードとを含む。次いで、細胞を第2の摂動に供し、第2の摂動バーコードが細胞に提供され得る。2回摂動された細胞は、第1の摂動バーコードと、第2の摂動バーコードと、遺伝子型バーコードとを含む。2回摂動された細胞が増殖して、2回摂動された細胞の1つ以上の複製を生成する。次いで、2回摂動された細胞は、例えば、本明細書の他の場所に記載されている単一細胞シーケンシングおよび/またはデコンボリューションアプローチを使用するシーケンシングに供される。このように、異なる摂動間の関連が同定され得る。一例では、第1の摂動は、Gタンパク質共役型受容体をコードする遺伝子に関連付けられる遺伝的多様性を変化させる。
本発明の好ましい実施形態を本明細書に示し、説明してきたが、そのような実施形態が例としてのみ提供されていることは当業者には明らかであろう。本発明が本明細書内で提供される特定の例によって限定されることは意図されない。上記明細書を参照して本発明を説明してきたが、本明細書での実施形態の説明および例示は、限定の意味で解釈されることを意図していない。ここで、本発明から逸脱することなく、多数の変形例、変更および置換が当業者に思い浮かぶであろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する本明細書に記載の特定の図、構成または相対比率に限定されないことを理解されたい。本明細書に記載される本発明の実施形態に対する様々な代替物が、本発明を実施する際に使用され得ることを理解されたい。したがって、本発明が、任意のそのような代替物、修正、変形例または均等物も包含することが企図される。添付の特許請求の範囲が本発明の範囲を規定し、これらの特許請求の範囲内の方法および構造ならびにそれらの均等物が特許請求の範囲によって包含されることが意図される。

Claims (111)

  1. 複数の細胞を分析する方法であって、
    (a)複数の対象の細胞に由来する複数の細胞を提供することであって、前記複数の細胞が、複数の核酸分子を含み、前記複数の核酸分子が、複数のバーコード配列を含むこと、
    (b)前記複数の細胞の前記複数の核酸分子に由来する核酸分子をシーケンシングし、それにより、前記複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、前記複数のシーケンシングリードの一部が、前記複数のバーコード配列を含むこと、
    (c)前記複数のシーケンシングリードを処理することであって、この複数のシーケンシングリードが、前記複数のバーコード配列を含むこと、および
    (d)前記複数のバーコード配列のうちのバーコード配列を使用して、前記複数のシーケンシングリードのサブセットを前記複数の対象のうちの対象と関連付けること、
    を含み、
    (b)の前に、バルク増殖環境での前記複数の対象の前記細胞の増殖時に、前記複数の細胞が生成される方法。
  2. 前記複数の核酸分子のサブセットが、前記複数のバーコード配列を含む、請求項1に記載の方法。
  3. 前記複数のバーコード配列が、前記複数の細胞に対して内因性である、請求項1に記載の方法。
  4. (a)の前に、前記複数の細胞の前記複数の核酸分子に前記複数のバーコード配列を組み込むことをさらに含む、請求項1に記載の方法。
  5. 前記複数のバーコード配列が、形質導入を介して前記複数の細胞に組み込まれる、請求項4に記載の方法。
  6. 前記複数のバーコード配列が、ウイルスベクター、トランスフェクション、相同組換え組込み、アグロバクテリウム媒介遺伝子導入、抗体コンジュゲートオリゴヌクレオチドまたはエピソームベクターを使用して、前記複数の細胞に組み込まれる、請求項4に記載の方法。
  7. 前記複数のバーコード配列のうちの前記バーコード配列が、1塩基から1000塩基を含む、請求項1から6のいずれか一項に記載の方法。
  8. 前記複数の対象が、複数のヒト対象を含む、請求項1から7のいずれか一項に記載の方法。
  9. 前記複数の対象の同一性が、暗号化または曖昧化されている、請求項1から8のいずれか一項に記載の方法。
  10. 前記複数の細胞が体液に由来する、請求項1から9のいずれか一項に記載の方法。
  11. 前記体液が、血液、血漿、尿、汗または唾液を含む、請求項10に記載の方法。
  12. 前記複数の細胞が、皮膚細胞または有毛細胞を含む、請求項1から11のいずれか一項に記載の方法。
  13. 前記複数の細胞が植物細胞を含む、請求項1から12のいずれか一項に記載の方法。
  14. 前記植物細胞が、植物の葉または根に由来する、請求項13に記載の方法。
  15. 前記複数の細胞の増殖した細胞が、増殖速度によって層別化される、請求項1から14のいずれか一項に記載の方法。
  16. 前記複数の細胞が、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される、請求項15に記載の方法。
  17. 前記複数のバーコード配列の少なくともサブセットが、複数の摂動に関連付けられる複数の摂動バーコード配列を含む、請求項1から16のいずれか一項に記載の方法。
  18. 前記複数の摂動が、小分子、ノックアウト、抗体、細胞間相互作用、RNAi、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される、請求項17に記載の方法。
  19. 前記複数の摂動が、温度の変化またはpHの変化を含む、請求項17に記載の方法。
  20. 前記複数の摂動が、遺伝子の変異型の導入を含む、請求項17に記載の方法。
  21. 前記複数のバーコード配列の少なくともサブセットが、複数の測定値に関連付けられる、請求項1から20のいずれか一項に記載の方法。
  22. 前記複数の測定値が、RNA−seq、ATAC−seq、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される、請求項21に記載の方法。
  23. (e)前記複数の細胞に複数の蛍光プローブを導入すること、
    (f)前記複数のバーコード配列に前記複数の蛍光プローブをハイブリダイズさせるのに十分な条件に前記複数の細胞を供すること、および
    (g)前記複数の細胞内の前記複数のバーコード配列にハイブリダイズした前記複数の蛍光プローブを光学的に検出すること、
    をさらに含む、請求項1から22のいずれか一項に記載の方法。
  24. (e)から(g)を1回以上繰り返すことをさらに含む、請求項23に記載の方法。
  25. (c)または(d)が、外部データベースの使用を含む、請求項1から24のいずれか一項に記載の方法。
  26. 請求項1に記載の方法であって、(b)の前に、前記複数の核酸分子を処理して、前記核酸分子を生成することをさらに含み、この核酸分子がその後シーケンシングされる方法。
  27. 前記処理が、前記複数の核酸分子のコピーを生成することを含む、請求項26に記載の方法。
  28. 前記処理が、前記複数の細胞から前記複数の核酸分子を回収することを含む、請求項26に記載の方法。
  29. 複数の細胞を分析する方法であって、
    (a)複数の対象の細胞に由来する第1の複数の細胞を提供することであって、前記第1の複数の細胞が、第1の複数の核酸分子を含み、前記第1の複数の核酸分子が、第1の複数のバーコード配列を含むこと、
    (b)前記第1の複数の細胞のうちの細胞を複製するのに十分な条件に前記第1の複数の細胞を供して、前記第1の複数の細胞のうちの前記細胞とその複製とを含む第2の複数の細胞を提供することであって、前記第2の複数の細胞が、第2の複数のバーコード配列を含む第2の複数の核酸分子を含むこと、
    (c)前記第1の複数の細胞および前記第2の複数の細胞のうちの細胞を複数の区分間で区分し、それにより、複数の区分された細胞を提供すること、ならびに
    (d)前記複数の区分された細胞に由来する核酸分子をシーケンシングし、それにより、前記複数の区分された細胞の前記第2の複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、前記複数のシーケンシングリードの一部が、前記第2の複数のバーコード配列を含むこと、
    (e)前記複数のシーケンシングリードを処理することであって、この複数のシーケンシングリードが、前記第2の複数のバーコード配列を含むこと、ならびに
    (f)前記第2の複数のバーコード配列のうちのバーコード配列を使用して、前記複数のシーケンシングリードのサブセットを前記複数の対象のうちの対象と関連付けること、
    を含む方法。
  30. 前記第1の複数の核酸分子のサブセットが、前記第1の複数のバーコード配列を含む、請求項29に記載の方法。
  31. 前記第1の複数のバーコード配列が、前記第1の複数の細胞に対して内因性である、請求項29に記載の方法。
  32. (a)の前に、前記第1の複数の細胞の前記第1の複数の核酸分子に前記第1の複数のバーコード配列を組み込むことをさらに含む、請求項29に記載の方法。
  33. 前記第1の複数のバーコード配列が、形質導入を介して前記第1の複数の細胞に組み込まれる、請求項32に記載の方法。
  34. 前記第1の複数のバーコード配列が、ウイルスベクター、トランスフェクション、相同組換え組込み、アグロバクテリウム媒介遺伝子導入、抗体コンジュゲートオリゴヌクレオチドまたはエピソームベクターを使用して、前記第1の複数の細胞に組み込まれる、請求項32に記載の方法。
  35. 前記第1の複数のバーコード配列または前記第2の複数のバーコード配列のうちのバーコード配列が、1塩基から1000塩基を含む、請求項29から34のいずれか一項に記載の方法。
  36. 前記複数の区分が複数のウェルを含む、請求項29から35のいずれか一項に記載の方法。
  37. 前記複数のウェルのうちのウェルが、1つ以上の細胞を含む、請求項36に記載の方法。
  38. (e)が、前記複数の区分された細胞のうちの細胞に対応するものとして、前記複数のシーケンシングリードのうちのシーケンシングリードを同定することを含む、請求項36または37に記載の方法。
  39. 前記同定が、前記複数の区分のうちの区分間に分散されたシーケンシングリードの共有配列を同定することを含む、請求項38に記載の方法。
  40. 前記複数の区分が複数の液滴を含む、請求項29から35のいずれか一項に記載の方法。
  41. 前記複数の液滴のうちの液滴が、最大で単一の細胞を含む、請求項40に記載の方法。
  42. 前記複数の液滴のうちの液滴が、複数のオリゴヌクレオチドをさらに含み、この複数のオリゴヌクレオチドが、1つ以上のシーケンシングプライマーもしくはその相補体、または1つ以上の追加のバーコード配列を含む、請求項40または41に記載の方法。
  43. (e)が、前記複数の区分された細胞のうちの細胞に対応するものとして、前記複数のシーケンシングリードのうちのシーケンシングリードを同定することを含む、請求項40から42のいずれか一項に記載の方法。
  44. 前記複数の対象が、複数のヒト対象を含む、請求項29から43のいずれか一項に記載の方法。
  45. 前記複数の対象の同一性が、暗号化または曖昧化されている、請求項29から44のいずれか一項に記載の方法。
  46. 前記第1の複数の細胞が体液に由来する、請求項29から45のいずれか一項に記載の方法。
  47. 前記体液が、血液、血漿、尿、汗または唾液を含む、請求項46に記載の方法。
  48. 前記第1の複数の細胞が、皮膚細胞または有毛細胞を含む、請求項29から47のいずれか一項に記載の方法。
  49. 前記第1の複数の細胞が植物細胞を含む、請求項29から43のいずれか一項に記載の方法。
  50. 前記植物細胞が、植物の葉または根に由来する、請求項49に記載の方法。
  51. (d)の前に、バルク増殖環境での前記複数の対象の前記細胞の増殖時に、前記第1の複数の細胞が生成される、請求項26から47のいずれか一項に記載の方法。
  52. 前記第1の複数の細胞と前記その複製とが、増殖速度によって層別化される、請求項29から51のいずれか一項に記載の方法。
  53. 前記第1の複数の細胞が、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される、請求項52に記載の方法。
  54. (d)でシーケンシングされた前記複数の区分された細胞の前記核酸分子の一部が、複数の摂動に関連付けられる複数の摂動バーコード配列を含む、請求項29から53のいずれか一項に記載の方法。
  55. 前記複数の摂動が、小分子、ノックアウト、抗体、細胞間相互作用、RNAi、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される、請求項54に記載の方法。
  56. 前記複数の摂動が、温度の変化またはpHの変化を含む、請求項54に記載の方法。
  57. 前記複数の摂動が、遺伝子の変異型の導入を含む、請求項54に記載の方法。
  58. (d)でシーケンシングされた前記複数の区分された細胞の前記核酸分子の一部が、複数の測定値に関連付けられる複数のバーコード配列を含む、請求項29から57のいずれか一項に記載の方法。
  59. 前記複数の測定値が、RNA−seq、ATAC−seq、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される、請求項58に記載の方法。
  60. (g)前記第1の複数の細胞に複数の蛍光プローブを導入すること、
    (h)前記第1の複数のバーコード配列に前記複数の蛍光プローブをハイブリダイズさせるのに十分な条件に前記第1の複数の細胞を供すること、および
    (i)前記第1の複数の細胞内の前記第1の複数のバーコード配列にハイブリダイズした前記複数の蛍光プローブを光学的に検出すること、
    をさらに含む、請求項29から59のいずれか一項に記載の方法。
  61. (g)から(i)を1回以上繰り返すことをさらに含む、請求項60に記載の方法。
  62. (e)または(f)が、外部データベースの使用を含む、請求項29から61のいずれか一項に記載の方法。
  63. (d)の前に、前記第2の複数の核酸分子を処理して、前記核酸分子を生成することをさらに含み、この核酸分子がその後シーケンシングされる、請求項29に記載の方法。
  64. 前記処理が、前記第2の複数の核酸分子のコピーを生成することを含む、請求項63に記載の方法。
  65. 前記処理が、前記第2の複数の細胞から前記第2の複数の核酸分子を回収することを含む、請求項63に記載の方法。
  66. 複数の細胞を分析する方法であって、
    (a)複数の対象の細胞に由来する複数の細胞を得ること、
    (b)それらの起源の対象に従って、前記複数の細胞を差次的にタグ付けすること、
    (c)前記複数の細胞の複数の核酸分子に由来する核酸分子をシーケンシングして、複数のシーケンシングリードを提供すること、および
    (d)前記複数の対象のうちの対象に、前記複数のシーケンシングリードのうちの共通のシーケンシングリードを割り当てることであって、前記共通のシーケンシングリードの割当てが、前記複数の細胞間の変動とは無関係に行われること、
    を含み、
    (c)の前に、バルク増殖環境での前記複数の対象の前記細胞の増殖時に、前記複数の細胞が生成される方法。
  67. 前記複数の細胞を前記差次的にタグ付けすることが、前記複数の細胞に複数のバーコード配列を導入することを含む、請求項66に記載の方法。
  68. 前記複数のバーコード配列が、形質導入を介して前記複数の細胞に組み込まれる、請求項67に記載の方法。
  69. 前記複数のバーコード配列が、ウイルスベクター、トランスフェクション、相同組換え組込み、アグロバクテリウム媒介遺伝子導入、抗体コンジュゲートオリゴヌクレオチドまたはエピソームベクターを使用して、前記複数の細胞に組み込まれる、請求項67に記載の方法。
  70. 前記複数のバーコード配列のうちのバーコード配列が、1塩基から1000塩基を含む、請求項67から69のいずれか一項に記載の方法。
  71. 前記複数の対象が、複数のヒト対象を含む、請求項66から70のいずれか一項に記載の方法。
  72. 前記複数の対象の同一性が、暗号化または曖昧化されている、請求項66から71のいずれか一項に記載の方法。
  73. 前記複数の細胞が体液に由来する、請求項66から72のいずれか一項に記載の方法。
  74. 前記体液が、血液、血漿、尿、汗または唾液を含む、請求項73に記載の方法。
  75. 前記複数の細胞が、皮膚細胞または有毛細胞を含む、請求項66から74のいずれか一項に記載の方法。
  76. 前記複数の細胞が植物細胞を含む、請求項66から70のいずれか一項に記載の方法。
  77. 前記植物細胞が、植物の葉または根に由来する、請求項76に記載の方法。
  78. 前記複数の細胞が、増殖速度によって層別化される、請求項66から77のいずれか一項に記載の方法。
  79. 前記複数の細胞が、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される、請求項78に記載の方法。
  80. (c)でシーケンシングされた前記複数の細胞が、複数の摂動に関連付けられる複数の摂動バーコード配列を含む、請求項66から79のいずれか一項に記載の方法。
  81. 前記複数の摂動が、小分子、ノックアウト、抗体、細胞間相互作用、RNAi、オープンリーディングフレーム(ORF)およびクラスター化反復短回文配列リピート(CRISPR)単一ガイドリボ核酸(sgRNA)の付加からなる群から選択される、請求項80に記載の方法。
  82. 前記複数の摂動が、温度の変化またはpHの変化を含む、請求項80に記載の方法。
  83. 前記複数の摂動が、遺伝子の変異型の導入を含む、請求項80に記載の方法。
  84. 前記複数の細胞が、複数の測定値に関連付けられる複数のバーコード配列を含む、請求項66から83のいずれか一項に記載の方法。
  85. 前記複数の測定値が、RNA−seq、ATAC−seq、インサイチュシーケンシングおよび細胞形態の測定値からなる群から選択される、請求項84に記載の方法。
  86. (e)前記複数の細胞に複数の蛍光プローブを導入すること、
    (f)前記複数のバーコード配列に前記複数の蛍光プローブをハイブリダイズさせるのに十分な条件に前記複数の細胞を供すること、および
    (g)前記複数の細胞内の前記複数のバーコード配列にハイブリダイズした前記複数の蛍光プローブを光学的に検出すること、
    をさらに含む、請求項67に記載の方法。
  87. (e)から(g)を1回以上繰り返すことをさらに含む、請求項86に記載の方法。
  88. (d)が、外部データベースの使用を含む、請求項66から87のいずれか一項に記載の方法。
  89. 請求項66に記載の方法であって、(c)の前に、前記複数の核酸分子を処理して、前記核酸分子を生成することをさらに含み、この核酸分子がその後シーケンシングされる方法。
  90. 前記処理が、前記複数の核酸分子のコピーを生成することを含む、請求項89に記載の方法。
  91. 前記処理が、前記複数の細胞から前記複数の核酸分子を回収することを含む、請求項89に記載の方法。
  92. 複数の細胞を分析する方法であって、
    (a)複数の対象の細胞に由来する複数の細胞を提供することであって、前記複数の細胞が、複数の核酸分子を含み、前記複数の核酸分子が、複数のバーコード配列を含むこと、
    (b)前記複数の細胞の前記複数の核酸分子に由来する核酸分子をシーケンシングし、それにより、前記複数の核酸分子に対応する複数のシーケンシングリードを生成することであって、前記複数のシーケンシングリードの一部が、前記複数のバーコード配列を含むこと、
    (c)前記複数のシーケンシングリードを処理することであって、この複数のシーケンシングリードが、前記複数のバーコード配列を含むこと、および
    (d)前記複数のバーコード配列のうちのバーコード配列を使用して、前記複数のシーケンシングリードのサブセットを前記複数の対象のうちの対象と関連付けること、
    を含み、
    前記複数のバーコード配列が、形質導入またはトランスフェクションを介して、前記複数の細胞の前記複数の核酸分子に組み込まれる方法。
  93. 前記複数の核酸分子のサブセットが、前記複数のバーコード配列を含む、請求項92に記載の方法。
  94. 前記複数のバーコード配列が、前記複数の細胞に対して内因性である、請求項92に記載の方法。
  95. 前記複数のバーコード配列のうちのバーコード配列が、1塩基から1000塩基を含む、請求項92から94のいずれか一項に記載の方法。
  96. 前記複数の対象が、複数のヒト対象を含む、請求項92から95のいずれか一項に記載の方法。
  97. 前記複数の対象の同一性が、暗号化または曖昧化されている、請求項92から96のいずれか一項に記載の方法。
  98. 前記複数の細胞が体液に由来する、請求項92から97のいずれか一項に記載の方法。
  99. 前記体液が、血液、血漿尿、汗または唾液を含む、請求項98に記載の方法。
  100. 前記複数の細胞が、皮膚細胞または有毛細胞を含む、請求項92から99のいずれか一項に記載の方法。
  101. 前記複数の細胞が植物細胞を含む、請求項92から95のいずれか一項に記載の方法。
  102. 前記植物細胞が、植物の葉または根に由来する、請求項101に記載の方法。
  103. (b)の前に、バルク増殖環境での前記複数の対象の前記細胞の増殖時に、前記複数の細胞が生成される、請求項92から102のいずれか一項に記載の方法。
  104. 前記複数の細胞の増殖した細胞が、増殖速度によって層別化される、請求項92から103のいずれか一項に記載の方法。
  105. 前記複数の細胞が、カルボキシフルオレセインスクシンイミジルエステル(CFSE)によって染色される、請求項104に記載の方法。
  106. (e)前記複数の細胞に複数の蛍光プローブを導入すること、
    (f)前記複数のバーコード配列に前記複数の蛍光プローブをハイブリダイズさせるのに十分な条件に前記複数の細胞を供すること、および
    (g)前記複数の細胞内の前記複数のバーコード配列にハイブリダイズした前記複数の蛍光プローブを光学的に検出すること、
    をさらに含む、請求項92から105のいずれか一項に記載の方法。
  107. (e)から(g)を1回以上繰り返すことをさらに含む、請求項106に記載の方法。
  108. (c)または(d)が、外部データベースの使用を含む、請求項92から107のいずれか一項に記載の方法。
  109. 請求項92に記載の方法であって、(b)の前に、前記複数の核酸分子を処理して、前記核酸分子を生成することをさらに含み、この核酸分子がその後シーケンシングされる方法。
  110. 前記処理が、前記複数の核酸分子のコピーを生成することを含む、請求項109に記載の方法。
  111. 前記処理が、前記複数の細胞から前記複数の核酸分子を回収することを含む、請求項109に記載の方法。
JP2021523565A 2018-07-13 2019-07-10 細胞を分析するための方法 Pending JP2021531823A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862697972P 2018-07-13 2018-07-13
US62/697,972 2018-07-13
US201862711444P 2018-07-27 2018-07-27
US62/711,444 2018-07-27
PCT/US2019/041159 WO2020014331A1 (en) 2018-07-13 2019-07-10 Methods for analyzing cells

Publications (2)

Publication Number Publication Date
JP2021531823A true JP2021531823A (ja) 2021-11-25
JPWO2020014331A5 JPWO2020014331A5 (ja) 2022-07-19

Family

ID=69141798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021523565A Pending JP2021531823A (ja) 2018-07-13 2019-07-10 細胞を分析するための方法

Country Status (5)

Country Link
US (1) US20210262010A1 (ja)
EP (1) EP3821035A4 (ja)
JP (1) JP2021531823A (ja)
CN (1) CN112654716A (ja)
WO (1) WO2020014331A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022133734A1 (en) * 2020-12-22 2022-06-30 Singleron (Nanjing) Biotechnologies, Ltd. Methods and reagents for high-throughput transcriptome sequencing for drug screening

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230070325A (ko) * 2014-06-26 2023-05-22 10엑스 제노믹스, 인크. 개별 세포 또는 세포 개체군으로부터 핵산을 분석하는 방법
US20180284125A1 (en) * 2015-03-11 2018-10-04 The Broad Institute, Inc. Proteomic analysis with nucleic acid identifiers
WO2016195382A1 (ko) * 2015-06-01 2016-12-08 연세대학교 산학협력단 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법
WO2017143155A2 (en) 2016-02-18 2017-08-24 President And Fellows Of Harvard College Multiplex alteration of cells using a pooled nucleic acid library and analysis thereof
KR20170133270A (ko) * 2016-05-25 2017-12-05 주식회사 셀레믹스 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도
US11702661B2 (en) * 2016-09-21 2023-07-18 The Broad Institute, Inc. Constructs for continuous monitoring of live cells

Also Published As

Publication number Publication date
EP3821035A1 (en) 2021-05-19
WO2020014331A1 (en) 2020-01-16
EP3821035A4 (en) 2022-04-20
US20210262010A1 (en) 2021-08-26
CN112654716A (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
Stuart et al. Integrative single-cell analysis
Polioudakis et al. A single-cell transcriptomic atlas of human neocortical development during mid-gestation
Doench Am I ready for CRISPR? A user's guide to genetic screens
Ding et al. Systematic comparative analysis of single cell RNA-sequencing methods
Haque et al. A practical guide to single-cell RNA-sequencing for biomedical research and clinical applications
Wu et al. The promise of single-cell RNA sequencing for kidney disease investigation
Grün et al. Design and analysis of single-cell sequencing experiments
Amaratunga et al. Exploration and analysis of DNA microarray and protein array data
CN107750277A (zh) 使用无细胞dna片段大小来确定拷贝数变化
CN108884491A (zh) 使用无细胞dna片段尺寸以确定拷贝数变异
Anaparthy et al. Single-cell applications of next-generation sequencing
US20220262459A1 (en) Methods and systems for identifying target genes
Klein et al. A systematic evaluation of the design, orientation, and sequence context dependencies of massively parallel reporter assays
US20210262010A1 (en) Methods for analyzing cells
Strom Fundamentals of RNA analysis on biobanked specimens
CN114875118B (zh) 确定细胞谱系的方法、试剂盒和装置
CN113748467A (zh) 基于等位基因频率的功能丧失计算模型
Zhang et al. Analyzing somatic mutations by single-cell whole-genome sequencing
Banaganapalli et al. Introduction to Bioinformatics
Dugé de Bernonville et al. From methylome to integrative analysis of tissue specificity
Yuan et al. Single-cell and spatial transcriptomics: Bridging current technologies with long-read sequencing
Pal et al. Next-Generation Sequencing
US20220068433A1 (en) Computational detection of copy number variation at a locus in the absence of direct measurement of the locus
Udayaraja Personal diagnostics using DNA-sequencing
Patarčić Computational mapping of regulatory domains of human genes

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230808

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240305