JP7169290B2 - マルチプレットを決定するための合成マルチプレット - Google Patents
マルチプレットを決定するための合成マルチプレット Download PDFInfo
- Publication number
- JP7169290B2 JP7169290B2 JP2019552517A JP2019552517A JP7169290B2 JP 7169290 B2 JP7169290 B2 JP 7169290B2 JP 2019552517 A JP2019552517 A JP 2019552517A JP 2019552517 A JP2019552517 A JP 2019552517A JP 7169290 B2 JP7169290 B2 JP 7169290B2
- Authority
- JP
- Japan
- Prior art keywords
- expression
- expression profiles
- profiles
- cell
- cells
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/166—Oligonucleotides used as internal standards, controls or normalisation probes
Description
本願は、2017年8月24日に出願された米国仮特許出願第62/476,522号明細書に対して、35U.S.C§119(e)の下での優先権を主張する。関連出願の内容は、ここでその全体が参照により本明細書中に援用される。
特に定義がない限り、本明細書で用いられる技術用語はすべて、本開示が属する分野の当業者により一般に理解されているものと同一の意味を有する。例えば、Singleton et al.,Dictionary of Microbiology and Molecular Biology 2nd ed.,J. Wiley & Sons(New York,NY 1994);Sambrook et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press(Cold Spring Harbor,NY 1989)を参照されたい。本開示の目的のために、下記の用語を以下に定義する。
バーコーディング、例えば確率バーコーディングは、例えば、米国特許出願公開第20150299784号明細書、国際公開第2015031691号パンフレット、及びFu et al,Proc Natl Acad Sci U.S.A.2011 May31;108(22):9026-31(これら出版物の内容はその全体がここで援用される)に記載されている。いくつかの実施形態では、本明細書で開示されるバーコードは、標的を確率的に標識するために用いてもよいポリヌクレオチド配列(例えば、バーコード、タグ)でありうる確率バーコードでありうる。バーコードは、確率バーコードの異なるバーコード配列の数と標識対象の標的のいずれかの存在量の数との比が、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、又はこれらの値のいずれか2つの間の数若しくは範囲、或いはそうした近似値でありうる場合、確率バーコードと呼ぶことができる。標的は、同一又はほぼ同一の配列を有するmRNA分子を含むmRNA種でありうる。バーコードは、確率バーコードの異なるバーコード配列の数と標識対象の標的のいずれかの存在量の数との比が、少なくとも、又は多くとも1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、若しくは100:1である場合、確率バーコードと呼ぶことができる。確率バーコードのバーコード配列は、分子標識と呼ぶことができる。
バーコード(例えば確率バーコード)は1つ以上のユニバーサル標識又は配列を含みうる。いくつかの実施形態では、1つ以上のユニバーサル標識は、所与の固体担体に結合される確率バーコードのセット中のすべての確率バーコードで同一でありうる。いくつかの実施形態では、1つ以上のユニバーサル標識は、複数のビーズに結合されるすべての確率バーコードで同一でありうる。いくつかの実施形態では、ユニバーサル標識は、シーケンシングプライマーにハイブリダイズ可能な核酸配列を含みうる。シークエンシングプライマーは、ユニバーサル標識を含む確率バーコードをシーケンスするために使用可能である。シークエンシングプライマー(例えば、ユニバーサルシークエンシングプライマー)は、高スループットシークエンシングプラットフォームに関連付けられるシークエンシングプライマーを含みうる。いくつかの実施形態では、ユニバーサル標識は、PCRプライマーにハイブリダイズ可能な核酸配列を含みうる。いくつかの実施形態では、ユニバーサル標識は、シークエンシングプライマー及びPCRプライマーにハイブリダイズ可能な核酸配列を含みうる。シーケンシングプライマー又はPCRプライマーにハイブリダイズ可能なユニバーサル標識の核酸配列は、プライマー結合部位として参照しうる。ユニバーサル標識は、確率バーコードの転写を開始するために使用しうる配列を含みうる。ユニバーサル標識は、確率バーコード又は確率バーコード内の領域の伸長のために、使用しうる配列を含みうる。ユニバーサル標識は、約1、2、3、4、5、10、15、20、25、30、35、40、45、50ヌクレオチド長、又はこれらの値のいずれか2つの間の数若しくは範囲であってよい。例えば、ユニバーサル標識は、少なくとも約10ヌクレオチドを含みうる。ユニバーサル標識は、少なくとも、又は多くとも、1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、若しくは300ヌクレオチド長でありうる。いくつかの実施形態では、切断可能なリンカー又は修飾ヌクレオチドは、担体から確率バーコードを切断して除去することを可能にするユニバーサル標識配列の一部であってよい。
バーコード(例えば確率バーコード)は1つ以上の次元標識を含みうる。いくつかの実施形態では、次元標識は、確率標識化が行われた次元に関する情報を提供する核酸配列を含みうる。例えば、次元標識は、標的に確率バーコードが付された時点に関する情報を提供可能である。次元標識は、サンプルの確率バーコーディングの時点に関連付け可能である。次元標識は、確率標識化の時点で活性化可能である。異なる時点で異なる次元標識を活性化可能である。次元標識は、標的、標的のグループ、及び/又はサンプルに確率バーコードを付けた順序に関する情報を提供する。例えば、細胞集団は、細胞周期のG0期に確率バーコードを付けることが可能である。細胞は、細胞周期のG1期に確率バーコードで再びパルスすることが可能である。細胞は、細胞周期のS期に確率バーコードで再びパルスすることが可能であり、他の時期も同様である。各パルス時(例えば、細胞周期の各期)の確率バーコードは、異なる次元標識を含みうる。こうして、次元標識は、細胞周期のどの期に標的に標識したかに関する情報を提供する。次元標識は、多種多様な生物時間を精査することが可能である。例示的な生物時間としては、限定されるものではないが、細胞周期、転写(例えば転写開始)、及び転写物分解が挙げられうる。他の例として、薬剤治療及び/又は療法の前及び/又は後にサンプル(例えば、細胞、細胞集団)に確率標識を付けることが可能である。識別可能な標的のコピー数の変化は、薬剤及び/又は療法に対するサンプルの反応の指標でありうる。
バーコード(例えば確率バーコード)は1つ以上の空間標識を含みうる。いくつかの実施形態では、空間標識は、確率バーコードに関連付けられる標的分子の空間配向に関する情報を提供する核酸配列を含みうる。空間標識は、サンプル中の座標に関連付け可能である。座標は固定座標でありうる。例えば、座標は基材を基準にして固定可能である。空間標識は二次元又は三次元のグリッドを基準にし得る。座標はランドマークを基準にして固定可能である。ランドマークは空間内で同定可能である。ランドマークはイメージング可能な構造体でありうる。ランドマークは生物学的構造体例えば解剖学的ランドマークでありうる。ランドマークは細胞ランドマーク(例えばオルガネラ)でありうる。ランドマークは、非天然ランドマーク、例えば、色コード、バーコード、磁性、蛍光、放射能、又はユニークなサイズ若しくは形状のような同定可能な識別子を有する構造体でありうる。空間標識は、物理的パーティション(例えば、ウェル、容器、又はドロップレット)に関連付け可能である。いくつかの実施形態では、空間内の1つ以上の位置にコードを付けるために複数の空間標識が一緒に使用される。
バーコード(例えば確率バーコード)は、1つ以上の細胞標識を含みうる。いくつかの実施形態では、細胞標識は、どの標的核酸がどの細胞に由来するかを決定するための情報を提供する核酸配列を含みうる。いくつかの実施形態では、細胞標識は、所与の固体担体(例えばビーズ)に結合されるすべての確率バーコードで同一であるが、異なる固体担体(例えばビーズ)については異なっている。いくつかの実施形態では、同一の細胞標識を含む、同一の固体担体上の確率バーコードのパーセンテージは、60%、70%、80%、85%、90%、95%、97%、99%、100%、又はこれらの値のいずれか2つの間の数若しくは範囲、或いはそうした近似値でありうる。いくつかの実施形態では、同一の細胞標識を含む、同一の固体担体上の確率バーコードのパーセンテージは、最小で、又は最大で60%、70%、80%、85%、90%、95%、97%、99%、若しくは100%であってよい。例えば、同一の固体担体上の確率バーコードの少なくとも60%が、同一の細胞標識を含みうる。別の例として、同一の固体担体上の確率バーコードの少なくとも95%が、同一の細胞標識を含んでもよい。
バーコードは、1つ以上のバーコード配列を含みうる。いくつかの実施形態では、バーコード配列は、バーコードにハイブリダイズされた標的核酸種の特定のタイプを同定するための情報を提供する核酸配列を含みうる。バーコード配列は、バーコード(例えば標的結合領域)にハイブリダイズされた標的核酸種の特異的存在量に対するカウンター(例えば、粗い近似をもたらす)を提供する核酸配列を含みうる。
バーコード(例えば確率バーコード)は、1つ以上の分子標識を含みうる。いくつかの実施形態では、分子標識は、確率バーコードにハイブリダイズされた標的核酸種の特定のタイプを同定するための情報を提供する核酸配列を含みうる。分子標識は、確率バーコード(例えば標的結合領域)にハイブリダイズされた標的核酸種の特異的存在量に対するカウンターを提供する核酸配列を含みうる。
バーコード(例えば確率バーコード)は、1つ以上の標的結合領域を含みうる。いくつかの実施形態では、標的結合領域は、対象の標的とハイブリダイズすることができる。いくつかの実施形態では、標的結合領域は、標的(例えば、標的核酸、標的分子、例えば、分析される細胞核酸)、例えば、特定の遺伝子配列に特異的にハイブリダイズする核酸配列を含みうる。いくつかの実施形態では、標的結合領域は、特定の標的核酸の特定の位置に結合(例えばハイブリダイズ)しうる核酸配列を含みうる。いくつかの実施形態では、標的結合領域は、制限酵素部位オーバーハング(例えば、EcoRI付着末端オーバーハング)への特異的なハイブリダイゼーションが可能な核酸配列を含みうる。次いで、確率バーコードは、制限部位オーバーハングに相補的な配列を含む任意の核酸分子にライゲートしうる。
バーコード(例えば確率バーコード)は、確率バーコードの配向(例えばアライメント)のために使用することができる1つ以上の配向性を含みうる。確率バーコードは、等電点電気泳動用の部分を含みうる。異なる確率バーコードは、異なる等電点電気泳動点を含みうる。こうした確率バーコードをサンプルに導入した場合、サンプルは、確率バーコードを既知の形態にオリエントするために等電点電気泳動を行うことが可能である。こうして、オリエント性は、サンプルで確率バーコードの既知のマップを作成するために使用可能である。例示的なオリエント性としては、電気泳動移動度(例えば、確率バーコードのサイズに基づく)、等電点、スピン、伝導率、及び/又はセルフアセンブリーが挙げられうる。例えば、セルフアセンブリーのオリエント性を含む確率バーコードは、活性化時に特定のオリエンテーションにセルフアセンブル可能である(例えば、核酸ナノ構造)。
バーコード(例えば確率バーコード)は、1つ以上の親和性を含みうる。例えば、空間標識は、親和性を含みうる。親和性は、他のエンティティー(例えば細胞レセプター)との確率バーコードの結合を促進することができる化学的及び/又は生物学的部分を含みうる。例えば、親和性は、抗体、例えば、サンプル上の特定の部分(例えばレセプター)に特異的な抗体を含みうる。いくつかの実施形態では、抗体は、確率バーコードを特定の細胞型又は分子に誘導することができる。特定の細胞型若しくは分子及び/又はその近傍にある標的を確率標識化することができる。抗体は確率バーコードを特定の位置に誘導することができるので、いくつかの実施形態において、親和性は、空間標識のヌクレオチド配列に加え、空間情報も提供することができる。抗体は、治療用抗体、例えば、モノクローナル抗体又はポリクローナル抗体であってもよい。抗体は、ヒト化されていても、又はキメラであってもよい。抗体は、ネイキッド抗体又は融合抗体であってもよい。
バーコードは、1つ以上のユニバーサルアダプタープライマーを含みうる。例えば、遺伝子特異的バーコード、例えば遺伝子特異的確率バーコードは、ユニバーサルアダプタープライマーを含みうる。ユニバーサルアダプタープライマーは、すべてのバーコードに対してユニバーサルであるヌクレオチド配列を意味しうる。ユニバーサルアダプタープライマーは、遺伝子特異的バーコードを構築するために使用することができる。ユニバーサルアダプタープライマーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、又はこれらの値のいずれか2つの間の数若しくは範囲、或いはそうした近似値のヌクレオチド長でありうる。ユニバーサルアダプタープライマーは、少なくとも、又は多くとも、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、若しくは30ヌクレオチド長でありうる。ユニバーサルアダプタープライマーは、約5~30ヌクレオチド長であってもよい。
バーコードが2つ以上の標識タイプ(例えば、2つ以上の細胞標識又は2つ以上のバーコード配列、例えば1つの分子標識)を含む場合、標識は、リンカー標識配列で散在されてもよい。リンカー標識配列は、少なくとも約5、10、15、20、25、30、35、40、45、50又はそれ以上のヌクレオチド長でありうる。リンカー標識配列は、多くて約5、10、15、20、25、30、35、40、45、50又はそれ以上のヌクレオチド長でありうる。場合によっては、リンカー標識配列は、12ヌクレオチド長である。バーコードの合成を容易にするため、リンカー標識配列が使用可能である。リンカー標識は、エラー訂正(例えばハミング)コードを含みうる。
本明細書に開示されるバーコード(例えば確率バーコード)は、いくつかの実施形態において、固体担体と結合することができる。固体担体は、例えば、合成粒子であってよい。いくつかの実施形態では、固体担体上の複数の確率バーコード(例えば、第1の複数の確率バーコード)の分子標識(例えば、第1の分子標識)の一部又は全部が、少なくとも1ヌクレオチド異なる。同じ固体担体上の確率バーコードの細胞標識は、同じであってもよい。異なる固体担体上の確率バーコードの細胞標識は、少なくとも1ヌクレオチド異なりうる。例えば、第1の固体担体上の第1の複数の確率バーコードの第1の細胞標識は、同じ配列を有してよく、第2の固体担体上の第2の複数の確率バーコードの第2の細胞標識は、同じ配列を有してよい。第1の固体担体上の第1の複数の確率バーコードの第1の細胞標識と、第2の固体担体上の第2の複数の確率バーコードの第2の細胞標識とは、少なくとも1ヌクレオチド異なりうる。細胞標識は、例えば、約5~20ヌクレオチド長でありうる。分子標識は、例えば、約5~20ヌクレオチド長でありうる。合成粒子は、例えば、ビーズであってよい。
本明細書で使用される場合、基材はあるタイプの固体担体を意味しうる。基材は、本開示のバーコード(例えば確率バーコード)を含みうる固体担体を意味しうる。基材は、例えば、複数のマイクロウェルを含みうる。例えば、基材は、2つ以上のマイクロウェルを含むウェルアレイであってよい。いくつかの実施形態では、マイクロウェルは、規定の体積の小さい反応チャンバーを含みうる。いくつかの実施形態では、マイクロウェルは、1つ以上の細胞を閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、1つの細胞のみを閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、1つ以上の固体担体を閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、1つの固体担体のみを閉じ込めることができる。いくつかの実施形態では、マイクロウェルは、単一細胞及び単一固体担体(例えば、ビーズ)を閉じ込める。
本明細書においては、身体サンプル(例えば、組織、器官、腫瘍、細胞)における識別可能な位置の識別可能な標的の数を推定する方法を提供する。本方法は、サンプルと接近させて確率バーコードを配置する工程と、サンプルを溶解させる工程と、識別可能な標的を確率バーコードと関連させる工程と、標的を増幅する工程及び/又は標的をディジタルカウントする工程と、を含みうる。本方法は、さらに、確率バーコード上の空間標識から得られた情報を分析する工程及び/又は視覚化する工程をさらに含みうる。いくつかの実施形態では、一方法は、サンプル中の複数の標識を視覚化する工程を含む。サンプルのマップに複数の標的をマッピングする工程は、サンプルの二次元マップ又は三次元マップの作製を含みうる。二次元マップ又は三次元マップは、サンプル中の複数の標的に確率バーコードを付ける前又は後に作製することができる。サンプル中の複数の標的を視覚化する工程は、サンプルのマップに複数の標的をマッピングする工程を含みうる。サンプルのマップに複数の標的をマッピングする工程は、サンプルの二次元マップ又は三次元マップを作製するステップを含みうる。二次元マップ及び三次元マップは、サンプル中の複数の標的に確率バーコードを付ける前又は後に作製することができる。いくつかの実施形態では、二次元マップ及び三次元マップは、サンプルを溶解させる前又は後に作製することができる。二次元マップ又は三次元マップの作製前又は後にサンプルを溶解させる工程は、サンプルを加熱する工程と、サンプルを洗剤と接触させる工程と、サンプルのpHを変化させる工程、又はそれらの任意の組合せを含みうる。
本開示は、サンプル(例えば、細胞)を本開示の基材と接触させる方法を提供する。例えば、細胞、器官、又は組織薄片を含むサンプルをバーコード(例えば確率バーコード)と接触させることができる。例えば、重力流によって、細胞を接触させることができ、その場合、細胞は沈殿して単層を形成しうる。サンプルは、組織薄片であってよい。薄片を基材の上に配置することができる。サンプルは、一次元(例えば、平面表面を形成する)であってよい。サンプル(例えば、細胞)は、例えば、基材上に細胞を増殖させる/培養することによって、基材全体に広げることができる。
細胞及びバーコード(例えば確率バーコード)の分配後、細胞は標的分子を遊離するように溶解可能である。細胞溶解は、さまざまな手段のいずれかにより、例えば、化学的若しくは生化学的手段により、浸透圧ショックにより、又は熱溶解、機械溶解、若しくは光学溶解により達成可能である。細胞は、界面活性剤(例えば、SDS、Liドデシルスルフェート、Triton X-100、Tween-20、若しくはNP-40)、有機溶媒(例えば、メタノール若しくはアセトン)、又は消化酵素(例えば、プロテイナーゼK、ペプシン又はトリプシン)、或いはそれらの任意の組合せを含む細胞溶解緩衝液の添加により溶解可能である。標的と確率バーコードとの関連付けを向上させるために、例えば、温度の低下及び/又はライセートの粘度の増加により、標的分子の拡散速度を変化させることが可能である。
細胞の溶解及びそれからの核酸分子の放出の後、核酸分子は、共局在化された固体担体のバーコード(例えば確率バーコード)にランダムに関連付けすることができる。関連付けは、標的核酸分子の相補的部分への確率バーコードの標的認識領域のハイブリダイゼーションを含みうる(例えば、確率バーコードのオリゴ(dT)は、標的のポリ(A)テールと相互作用可能である)。ハイブリダイゼーションに使用されるアッセイ条件(例えば、緩衝液pH、イオン強度、温度など)は、特定の安定なハイブリッドの形成を促進するように選択可能である。いくつかの実施形態では、溶解した細胞から放出された核酸分子は、基材上の複数のプローブに関連付けする(例えば、基板上のプローブとハイブリダイズする)ことができる。プローブが、オリゴ(dT)を含むとき、mRNA分子は、プローブにハイブリダイズして、逆転写されうる。オリゴヌクレオチドのオリゴ(dT)部分は、cDNA分子の第1鎖合成のためのプライマーとして作用しうる。例えば、図2、216に示す確率バーコードの非限定的な例において、mRNA分子は、ビーズ上の確率バーコードをハイブリダイズすることができる。例えば、一本鎖ヌクレオチド断片は、確率バーコードの標的結合領域にハイブリダイズすることができる。
本開示は、(例えば、図2の224で)逆転写を用いて標的-バーコードコンジュゲート(例えば確率標的-バーコードコンジュゲート)を生成する方法を提供する。確率標的-バーコードコンジュゲートは、確率バーコードと標的核酸の全部又は一部の相補的配列と(すなわち、確率バーコード付きcDNA分子)を含みうる。関連付けられたRNA分子の逆転写は、逆転写酵素と共に逆転写プライマーを添加することによって起こりうる。逆転写プライマーは、オリゴ(dT)プライマー、ランダムヘキサヌクレオチドプライマー、又は標的特異的オリゴヌクレオチドプライマーでありうる。オリゴ(dT)プライマーは、12~18ヌクレオチド長、又は概ねそうしたヌクレオチド長であってよく、哺乳動物mRNAの3’末端の内因性ポリ(A)テールに結合することができる。ランダムヘキサヌクレオチドプライマーは、さまざまな相補的部位でmRNAと結合しうる。標的特異的オリゴヌクレオチドプライマーは、典型的には対象のmRNAを選択的にプライミングする。
核酸増幅反応(例えば、図2の228で)は、標識標的核酸分子の複数のコピーを生成するために1回以上実施することができる。増幅は、複数の標的核酸配列が同時に増幅される、多重方式で実施してよい。増幅反応は、核酸分子にシーケンシングアダプターを付加するために使用することができる。増幅反応は、存在するのであれば、サンプル標識の少なくとも一部を増幅する工程を含みうる。増幅反応は、細胞及び/又は分子標識の少なくとも一部を増幅する工程を含みうる。増幅反応は、サンプルタグ、細胞標識、空間標識、分子標識、標的核酸、又はそれらの組合せの少なくとも一部を増幅する工程を含みうる。増幅反応は、複数の核酸の0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%、又はこれらの値のいずれか2つの間の範囲若しくは数を増幅する工程を含みうる。本方法は、サンプル標識、細胞標識、空間標識、及び/又は分子標識を含む標的-バーコード分子のcDNAコピーを1つ以上生成するために、cDNA合成反応を1回以上行う工程をさらに含みうる。
単細胞の発現プロファイルを決定するとき、2個の細胞は1個の細胞として同定されるかもしれず、2個の細胞の発現プロファイルは、(ダブレット発現プロファイルと称される)1個の細胞における発現プロファイルとして同定されるかもしれない。例えば、バーコーディング(例えば確率バーコーディング)を用いて2個の細胞の発現プロファイルを決定するとき、2個の細胞のmRNA分子は、同じ細胞標識を有するバーコードに関連付けられるかもしれない。別の例として、2個の細胞は、1個の粒子(例えばビーズ)に関連付けられるかもしれない。該粒子は、同じ細胞標識を有するバーコードを含みうる。細胞を溶解後、2個の細胞におけるmRNA分子は、該粒子のバーコード、ひいては同じ細胞標識に関連付けることができる。ダブレット発現プロファイルは、発現プロファイルの解釈を歪める可能性がある。本明細書には、合成マルチプレット発現プロファイルを用いてマルチプレット発現プロファイルを同定するためのシステム及び方法が開示される。
本明細書では、マルチプレットプロファイルを同定するための方法が開示される。いくつかの実施形態では、本方法は、(a)複数の細胞の複数のプロファイルを受け取る工程と;(b)複数の細胞の複数のプロファイルから複数の合成マルチプレットプロファイルを作成する工程と;(c)複数の細胞の細胞に関連付けられた複数のプロファイルのプロファイルを、(b)で作成された複数の合成マルチプレットプロファイルのプロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、を含む。複数の細胞の複数のプロファイルのプロファイルは、細胞のmRNA発現プロファイル、細胞のタンパク質発現プロファイル、細胞の突然変異プロファイル、細胞のメチル化プロファイル、又はそれらの任意の組合せを含みうる。
いくつかの実施形態では、異なるバーコード付き標的(例えば確率バーコード付き標的)の数を推定する工程は、標識標的、空間標識、分子標識、サンプル標識、細胞標識、又はその任意の産物(例えば、標識アンプリコン、若しくは標識cDNA分子)の配列を決定する工程を含みうる。増幅された標的をシーケンシングに付すことができる。確率バーコード付き標的又はその任意の産物の配列を決定する工程は、サンプル標識の少なくとも一部、空間標識、細胞標識、分子標識、確率バーコード付き標的の少なくとも一部、その相補鎖、逆相補鎖、又はその任意の組合せの配列を決定するために、シーケンシング反応を実施する工程を含みうる。
いくつかの実施形態では、1つ以上のサンプル中に複数の標識が含有されうる。1サンプルは、1つ以上の細胞、又は1つ以上の細胞由来の核酸を含みうる。1サンプルは、単一細胞、又は1細胞由来の核酸であってよい。1つ以上の細胞は、1つ以上の細胞型であってよい。1つ以上の細胞型の少なくとも1つは、脳細胞、心臓細胞、癌細胞、循環腫瘍細胞、器官細胞、上皮細胞、転移性細胞、良性細胞、一次細胞、循環細胞、又はそれらの任意の組合せである。
データ解析及び標的の空間分解能の可視化
本開示は、バーコーディング(例えば確率バーコーディング)及び空間標識を使ってディジタルカウンティングを用いて標的の数及び位置を推定する方法を提供する。本開示の方法から得られるデータはマップ上に可視化可能である。サンプルの標的の数及び位置のマップは、本明細書に記載の方法を用いて生成された情報を用いて構築可能である。マップは、標的の物理的位置を決定するために使用可能である。マップは、複数の標的の位置を同定するために使用可能である。複数の標的は標的の同一種でありうるか、又は複数の標的は複数の異なる標的でありうる。例えば、脳のマップを構築して複数の標的のディジタルカウント及び位置を示すことが可能である。
一般的には、本開示の機器システム方法にての使用に適したコンピュータ又はプロセッサーは、図6に示すように、固定媒体612を有するサーバー609に任意選択的に接続可能な媒体611又はネットワークポート605から命令を読取り可能な論理装置としてさらに理解しうる。システム600は、図6に示すように、CPU601、ディスクドライブ603、キーボード615やマウス616などのオプションの入力デバイス、及びオプションのモニター607を含みうる。データ通信は、ローカル位置又はリモート位置のサーバーに対して指定の通信媒体を介して達成可能である。通信媒体は、データを送受信する任意の手段を含みうる。例えば、通信媒体は、ネットワーク接続、無線接続、又はインターネット接続でありうる。かかる接続は、World Wide Webによる通信を提供可能である。本開示に関するデータは、図6に示すように、かかるネットワーク又は接続を介してあるパーティー622による受信又は閲覧のために伝送可能である。
1:1の混合細胞型の合成ダブレット発現プロファイル
本実施例は、サンプル中の1:1の混合細胞型の発現プロファイルを、合成ダブレット発現プロファイルを用いてダブレット発現プロファイルとして決定することについて記載する。
1:1:1の混合細胞型の合成ダブレット発現プロファイル
本実施例は、サンプル中の1:1:1の混合細胞型の発現プロファイルを、合成ダブレット発現プロファイルを用いてダブレット発現プロファイルとして決定することについて記載する。
ヒトPBMCサンプル中の細胞の合成ダブレット発現プロファイル
本実施例は、ヒト末梢血単核球(PBMC)サンプル中の細胞の発現プロファイルを、合成ダブレット発現プロファイルを用いてダブレット発現プロファイルとして決定することについて記載する。
マウス細胞の12のサンプルの合成ダブレット発現プロファイル
本実施例は、12のマウス細胞サンプルからの細胞の発現プロファイルを、合成ダブレット発現プロファイルを用いてシングレット発現プロファイル及びマルチプレット発現プロファイルとして決定することについて記載する。
合成ダブレット発現プロファイルを作成、可視化、及び除去する
本実施例は、合成ダブレット発現プロファイルを手作業で作成、可視化、及び除去するワークフローを説明する。
ステップ1.発現プロファイルを有するデータファイルをロードする
ステップ2.合成ダブレット発現プロファイルを有する合成ダブレットファイルを、例えば「合成ダブレット」ボタン1408を選択することにより作成する。合成ダブレット発現プロファイルを作成するため、ロードされたデータファイル中の発現プロファイルのペアを無作為にサンプリングし、各ペアにおける2つの発現プロファイルを合わせる。合成ダブレット発現プロファイルを合成ダブレットファイルとして保存する
ステップ3.クリアし、データファイル及び合成ダブレットファイルをリロードする
ステップ4.2つの異なる色として、又はヒートマップで色付けして発現プロファイル及び合成ダブレット発現プロファイルを示す、1つ以上の投影プロット1412、1416を生成する
ステップ5.(データファイルから又は合成ダブレットファイルからの)発現プロファイルの起源に基づいてプロットをアノテートする
ステップ6.「アノテーションを追加する」及び「ドロー」オプションを用いて、多数の合成ダブレット発現プロファイルを有するクラスターの弧を描く。これらをダブレットとしてアノテートする
ステップ7.「アノテーションを追加する」及び「既存のアノテーションを組合せる」オプションを用いて、発現プロファイル及び「ダブレット」アノテーションの起源に基づく4つのグループを伴う新しいアノテーションを作成する。4つのグループは、「ダブレット」としてアノテートされていないデータファイルからの発現プロファイル;「ダブレット」としてアノテートされたデータファイルからの発現プロファイル;「ダブレット」としてアノテートされていない合成ダブレットデータファイルからの発現プロファイル;及び「ダブレット」としてアノテートされた合成ダブレットデータファイルからの発現プロファイルに対応する
ステップ8.この新しいアノテーションをハイライトする。例えば「フィルター発現プロファイル」ボタン1420を選択することにより、データファイルからの発現プロファイルにフィルターをかける。オプションを選択し、ここでハイライトされたアノテーションに基づいて細胞にフィルターをかける。3つのグループを選択し、「ダブレット」としてアノテートされていないデータファイルからの発現プロファイル;「ダブレット」としてアノテートされたデータファイルからの発現プロファイル;及び「ダブレット」としてアノテートされた合成ダブレットデータファイルからの発現プロファイルを除去する
ステップ9.残りの発現プロファイルを新しいデータファイルとして保存する
本発明のまた別の態様は、以下のとおりであってもよい。
〔1〕マルチプレット発現プロファイルを同定するための方法であって、
(a)複数の確率バーコードを用いて、複数の細胞における複数の標的に確率バーコードを付けて、前記複数の細胞の各細胞において複数の確率バーコード付き標的を生成する工程であって、前記複数の確率バーコードの各々が細胞標識及び分子標識を含み、ここで前記複数の確率バーコードの少なくとも2つの確率バーコードの分子標識が異なる分子標識配列を含み、且つ前記複数の確率バーコードの少なくとも2つの確率バーコードが同一の細胞標識配列を有する細胞標識を含む工程と;
(b)前記複数の確率バーコード付き標的のシーケンシングデータを取得する工程と;
(c)(b)で取得された前記シーケンシングデータから前記複数の確率バーコードの細胞標識に関連付けられた複数の発現プロファイルを決定する工程であって、前記複数の確率バーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルが、前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を含む工程と;
(d)(c)で決定された前記複数の確率バーコードの前記細胞標識に関連付けられた前記複数の発現プロファイルから複数の合成マルチプレット発現プロファイルを作成する工程と;
(e)前記複数の確率バーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルを、(d)で作成された複数の合成ダブレット発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、方法。
〔2〕前記発現プロファイルが(e)におけるマルチプレットとして同定される場合、前記発現プロファイルに関連付けられたシーケンシングデータを(b)で取得された前記シーケンシングデータから除去する工程を含む、前記〔1〕に記載の方法。
〔3〕前記発現プロファイルが(e)におけるマルチプレットとして同定される場合、前記発現プロファイルを(c)で決定された前記複数の発現プロファイルから除去する工程を含む、前記〔1〕~〔2〕のいずれか一項に記載の方法。
〔4〕前記複数のマルチプレットがダブレット、トリプレット、又はそれらの任意の組合せを含む、前記〔1〕~〔3〕のいずれか一項に記載の方法。
〔5〕(c)で決定された前記複数の確率バーコードの前記細胞標識に関連付けられた前記複数の発現プロファイルから前記複数の合成マルチプレット発現プロファイルを作成する工程が、
前記複数の合成マルチプレット発現プロファイルの合成マルチプレット発現プロファイルについて、
(1)(c)で決定された前記複数の発現プロファイルの第1の発現プロファイルであって、第1の細胞標識配列に関連付けられた第1の発現プロファイルを選択する工程と;
(2)(c)で決定された前記複数の発現プロファイルの第2の発現プロファイルであって、第2の細胞標識配列に関連付けられた第2の発現プロファイルを選択する工程と;
(3)(1)で選択された前記第1の発現プロファイルと(2)で選択された前記第2の発現プロファイルとを組合せ、前記合成マルチプレット発現プロファイルを作成する工程と、
を含み、ここで前記第1の細胞標識配列及び前記第2の細胞標識配列が異なる細胞標識配列を含む、前記〔1〕~〔4〕のいずれか一項に記載の方法。
〔6〕(1)で選択された前記第1の発現プロファイルと(2)で選択された前記第2の発現プロファイルとを組合せ、前記合成マルチプレット発現プロファイルを作成する工程が、
前記複数の標的の各々について、前記第1の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の数と前記第2の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の数とを組合せ、前記合成マルチプレット発現プロファイルに関連付けられた識別可能な配列を有する分子標識の数を作成する工程を含む、前記〔5〕に記載の方法。
〔7〕前記合成マルチプレット発現プロファイルに関連付けられた識別可能な配列を有する分子標識の前記数が、前記第1の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数と前記第2の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数との合計である、前記〔6〕に記載の方法。
〔8〕前記合計が、前記第1の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数と前記第2の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数との加重合計である、前記〔7〕に記載の方法。
〔9〕前記合成マルチプレット発現プロファイルに関連付けられた識別可能な配列を有する分子標識の前記数が、前記第1の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数と前記第2の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数との平均である、前記〔6〕に記載の方法。
〔10〕前記平均が、前記第1の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数と前記第2の発現プロファイルにおける前記標的に関連付けられた識別可能な配列を有する分子標識の前記数との加重平均である、前記〔9〕に記載の方法。
〔11〕前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)発現プロファイルマルチプレットの同定を意図して機械学習モデルを、(d)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び(c)で決定された前記複数の発現プロファイルの1つ以上の発現プロファイルから訓練する工程と;
(2)前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔1〕~〔10〕のいずれか一項に記載の方法。
〔12〕前記機械学習モデルを訓練する際に用いられる前記複数の発現プロファイルの前記1つ以上の発現プロファイルが、(c)で決定された前記複数の発現プロファイルの百分率を含む、前記〔11〕に記載の方法。
〔13〕前記百分率が約10パーセントである、前記〔12〕に記載の方法。
〔14〕前記機械学習モデルが分類モデルを含む、前記〔11〕~〔13〕のいずれか一項に記載の方法。
〔15〕前記分類モデルが、教師あり分類モデル、半教師あり分類モデル、教師なし分類モデル、又はそれらの組合せを含む、前記〔14〕に記載の方法。
〔16〕前記機械学習モデルが、ニューラルネットワーク、線形回帰モデル、ロジスティック回帰モデル、決定木、サポートベクターマシン、ナイーブベイズネットワーク、k近傍法(KNN)モデル、k平均法モデル、ランダムフォレストモデル、又はそれらの任意の組合せを含む、前記〔11〕~〔15〕のいずれか一項に記載の方法。
〔17〕前記機械学習モデルが、相関ルール学習モデル、帰納論理プログラミングモデル、強化学習モデル、特徴学習モデル、類似度学習モデル、スパース辞書学習モデル、遺伝的アルゴリズムモデル、ルールベース機械学習モデル、学習分類子システムモデル、又はそれらの任意の組合せを含む、前記〔11〕~〔16〕のいずれか一項に記載の方法。
〔18〕発現プロファイルマルチプレットの同定を意図して前記機械学習モデルを、(d)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び(c)で決定された前記複数の発現プロファイルの前記1つ以上の発現プロファイルから訓練する工程が、
(1)(d)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを発現プロファイル空間から低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの投影された発現プロファイルを作成する工程と;
(2)(c)で決定された前記複数の発現プロファイルの前記1つ以上の発現プロファイルを前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の発現プロファイルの1つ以上の投影された発現プロファイルを作成する工程と;
(3)発現プロファイルマルチプレットの同定を意図して前記機械学習モデルを、(1)からの前記複数の合成マルチプレット発現プロファイルの前記投影された発現プロファイル及び(2)における前記複数の発現プロファイルの前記1つ以上の投影された発現プロファイルから訓練する工程と、
を含む、前記〔11〕~〔17〕のいずれか一項に記載の方法。
〔19〕前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の確率バーコードの前記発現プロファイルを投影して、前記複数の確率バーコードの投影された発現プロファイルを作成する工程を含み、
ここで前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記発現プロファイル及び前記複数の確率バーコードの前記投影された発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程を含む、
前記〔18〕に記載の方法。
〔20〕前記低次元空間が二次元空間である、前記〔18〕~〔19〕のいずれか一項に記載の方法。
〔21〕(d)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの投影された発現プロファイルを作成する工程が、t分布型確率的近傍埋め込み(tSNE)法を用いて、(d)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの投影された発現プロファイルを作成する工程を含む、前記〔18〕~〔20〕のいずれか一項に記載の方法。
〔22〕前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと前記複数の発現プロファイルの少なくとも1つの発現プロファイルとの間の第1の距離、及び
前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと前記複数の合成マルチプレット発現プロファイルの少なくとも1つの合成マルチプレット発現プロファイルとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程
を含む、前記〔1〕~〔21〕のいずれか一項に記載の方法。
〔23〕前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数の発現プロファイルを発現プロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレット発現プロファイルを合成マルチプレット発現プロファイルの第2のクラスターにクラスター化する工程と;
(3)前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと発現プロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと合成マルチプレット発現プロファイルの第2のクラスターとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔1〕~〔21〕のいずれか一項に記載の方法。
〔24〕前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数の発現プロファイルを発現プロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレット発現プロファイルを合成マルチプレット発現プロファイルの複数の第2のクラスターにクラスター化する工程と;
(3)前記複数の確率バーコードの前記細胞標識の前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと発現プロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞標識に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと合成マルチプレット発現プロファイルの前記複数の第2のクラスターの1つ以上のクラスターとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔1〕~〔21〕のいずれか一項に記載の方法。
〔25〕前記複数の確率バーコードを用いて、前記複数の細胞における前記複数の標的に確率バーコードを付けて、前記複数の細胞の各細胞において前記複数の確率バーコード付き標的を生成する工程が、
複数の粒子の前記複数の確率バーコードを用いて、前記複数の細胞における前記複数の標的に確率バーコードを付けて、前記複数の細胞の各細胞において前記複数の確率バーコード付き標的を生成する工程を含み、
ここで前記複数の粒子の各々が前記複数の確率バーコードのサブセットを含み、ここで確率バーコードの前記サブセットの各々が同一の細胞標識配列を含み且つ少なくとも100の異なる分子標識配列を有する、
前記〔1〕~〔24〕のいずれか一項に記載の方法。
〔26〕前記粒子がビーズである、前記〔25〕に記載の方法。
〔27〕前記ビーズが、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、コンジュゲートビーズ、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、オリゴTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンマイクロビーズ、抗蛍光色素マイクロビーズ、及びそれらの任意の組合せからなる群から選択される、前記〔26〕に記載の方法。
〔28〕前記粒子が、ポリジメチルシロキサン(PDMS)、ポリスチレン、ガラス、ポリプロピレン、アガロース、ゼラチン、ヒドロゲル、常磁性体、セラミック、プラスチック、ガラス、メチルスチレン、アクリルポリマー、チタン、ラテックス、セファロース、セルロース、ナイロン、シリコーン、及びそれらの任意の組合せからなる群から選択される材料を含む、前記〔25〕~〔27〕のいずれか一項に記載の方法。
〔29〕前記複数の粒子の各々の前記確率バーコードが、少なくとも1000の異なる分子標識配列を有する分子標識を含む、前記〔25〕~〔28〕のいずれか一項に記載の方法。
〔30〕前記複数の粒子の各々の前記確率バーコードが、少なくとも10000の異なる分子標識配列を有する分子標識を含む、前記〔25〕~〔29〕のいずれか一項に記載の方法。
〔31〕前記確率バーコードの前記分子標識が、ランダム配列を含む、前記〔25〕~〔30〕のいずれか一項に記載の方法。
〔32〕前記複数の粒子の各々が、少なくとも10000の確率バーコードを含む、前記〔25〕~〔31〕のいずれか一項に記載の方法。
〔33〕前記複数の確率バーコードを用いて、前記複数の細胞における前記複数の標的に確率バーコードを付けて、前記複数の細胞の各細胞において前記複数の確率バーコード付き標的を生成する工程が、
(1)前記標的のコピーを前記確率バーコードの標的結合領域と接触させる工程と;
(2)前記複数の確率バーコードを用いて前記複数の標的を逆転写して、複数の逆転写された標的を生成する工程と、
を含む、前記〔1〕~〔32〕のいずれか一項に記載の方法。
〔34〕前記複数の確率バーコード付き標的の前記シーケンシングデータを取得する前に、前記確率バーコード付き標的を増幅し、複数の増幅された確率バーコード付き標的を作成する工程を含む、前記〔1〕~〔33〕のいずれか一項に記載の方法。
〔35〕前記確率バーコード付き標的を増幅し、前記複数の増幅された確率バーコード付き標的を作成する工程が、前記確率バーコード付き標的をポリメラーゼ連鎖反応(PCR)により増幅する工程を含む、前記〔34〕に記載の方法。
〔36〕前記複数の確率バーコードの前記細胞標識に関連付けられた前記複数の発現プロファイルを(b)で取得された前記シーケンシングデータから決定する工程が、
前記複数の確率バーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルについて、(b)で取得された前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を決定する工程を含む、前記〔1〕~〔35〕のいずれか一項に記載の方法。
〔37〕(b)で取得された前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の前記数を決定する工程が、
前記複数の標的の1つ以上について、
(1)(b)で取得された前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の前記数をカウントする工程と;
(2)(1)でカウントされた前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の前記数に基づいて前記標的の前記数を推定する工程と、
を含む、前記〔36〕に記載の方法。
〔38〕マルチプレット発現プロファイルを同定するための方法であって、
(a)複数の細胞の複数の発現プロファイルを受け取る工程であって、前記複数の発現プロファイルが前記複数の細胞の各細胞における複数の標的の各標的の存在量を含む工程と;
(b)前記複数の細胞の前記複数の発現プロファイルから複数の合成マルチプレット発現プロファイルを作成する工程と;
(c)前記複数の細胞の細胞に関連付けられた前記複数の発現プロファイルの発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、方法。
〔39〕前記発現プロファイルが(c)におけるマルチプレットとして同定される場合、前記発現プロファイルを(a)で得られた前記複数の発現プロファイルから除去する工程を含む、前記〔38〕に記載の方法。
〔40〕前記複数のマルチプレットが、ダブレット、トリプレット、又はそれらの任意の組合せを含む、前記〔38〕~〔39〕のいずれか一項に記載の方法。
〔41〕前記複数の細胞の前記複数の発現プロファイルから前記複数の合成マルチプレット発現プロファイルを作成する工程が、
前記複数の合成マルチプレット発現プロファイルの合成マルチプレット発現プロファイルについて、
(1)前記複数の発現プロファイルのいくつか(a number of)の発現プロファイルを選択する工程と;
(2)(1)で選択された前記発現プロファイルを組合せて、前記合成マルチプレット発現プロファイルを作成する工程と、
を含む、前記〔38〕~〔40〕のいずれか一項に記載の方法。
〔42〕(1)で選択された前記発現プロファイルを組合せて、前記合成マルチプレット発現プロファイルを作成する工程が、
前記複数の標的の各々について、選択された前記発現プロファイルにおける前記標的の存在量を組合せて、前記合成マルチプレット発現プロファイルにおける前記標的の存在量を作成する工程を含む、
前記〔41〕に記載の方法。
〔43〕前記合成マルチプレット発現プロファイルにおける前記標的の前記存在量が、選択された前記発現プロファイルにおける前記標的の前記存在量の合計である、前記〔42〕に記載の方法。
〔44〕前記合計が、選択された前記発現プロファイルにおける前記標的の前記存在量の加重合計である、前記〔43〕に記載の方法。
〔45〕前記合成マルチプレット発現プロファイルにおける前記標的の前記存在量が、選択された前記発現プロファイルにおける前記標的の前記存在量の平均である、前記〔42〕に記載の方法。
〔46〕前記平均が、選択された前記発現プロファイルにおける前記標的の前記存在量の加重平均である、前記〔45〕に記載の方法。
〔47〕前記複数の合成マルチプレット発現プロファイルの前記数が、およそ(a)で得られた前記複数の発現プロファイルの百分率である、前記〔38〕~〔46〕のいずれか一項に記載の方法。
〔48〕前記百分率が約10パーセントである、前記〔47〕に記載の方法。
〔49〕前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)発現プロファイルマルチプレットの同定を意図して機械学習モデルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び(a)で得られた前記複数の発現プロファイルの1つ以上の発現プロファイルから訓練する工程と;
(2)前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔38〕~〔48〕のいずれか一項に記載の方法。
〔50〕前記機械学習モデルを訓練する際に用いられる前記複数の発現プロファイルの前記1つ以上の発現プロファイルが、(a)で得られた前記複数の発現プロファイルの百分率を含む、前記〔49〕に記載の方法。
〔51〕前記百分率が約10パーセントである、前記〔50〕に記載の方法。
〔52〕前記機械学習モデルが分類モデルを含む、前記〔49〕~〔51〕のいずれか一項に記載の方法。
〔53〕前記分類モデルが、教師あり分類モデル、半教師あり分類モデル、教師なし分類モデル、又はそれらの組合せを含む、前記〔52〕に記載の方法。
〔54〕前記機械学習モデルが、ニューラルネットワーク、線形回帰モデル、ロジスティック回帰モデル、決定木、サポートベクターマシン、ナイーブベイズネットワーク、k近傍法(KNN)モデル、k平均法モデル、ランダムフォレストモデル、又はそれらの任意の組合せを含む、前記〔49〕~〔53〕のいずれか一項に記載の方法。
〔55〕前記機械学習モデルが、相関ルール学習モデル、帰納論理プログラミングモデル、強化学習モデル、特徴学習モデル、類似度学習モデル、スパース辞書学習モデル、遺伝的アルゴリズムモデル、ルールベース機械学習モデル、学習分類子システムモデル、又はそれらの任意の組合せを含む、前記〔49〕~〔54〕のいずれか一項に記載の方法。
〔56〕発現プロファイルマルチプレットの同定を意図して前記機械学習モデルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び(a)で得られた前記複数の発現プロファイルの1つ以上の発現プロファイルから訓練する工程が、
(1)(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを発現プロファイル空間から低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの投影された発現プロファイルを作成する工程と;
(2)(a)で得られた前記複数の発現プロファイルの前記1つ以上の発現プロファイルを前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の発現プロファイルの1つ以上の投影された発現プロファイルを作成する工程と;
(3)発現プロファイルマルチプレットの同定を意図して前記機械学習モデルを、(1)からの前記複数の合成マルチプレット発現プロファイルの前記投影された発現プロファイル及び(2)における前記複数の発現プロファイルの前記1つ以上の投影された発現プロファイルから訓練する工程と、
を含む、前記〔49〕~〔55〕のいずれか一項に記載の方法。
〔57〕前記複数の細胞の前記細胞に関連付けられた前記複数の前記複数の発現プロファイルの前記発現プロファイルを投影して、前記複数の発現プロファイルの投影された発現プロファイルを作成する工程を含み、
ここで前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記複数の発現プロファイルの前記投影された発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程を含む、
前記〔56〕に記載の方法。
〔58〕前記低次元空間が二次元空間である、前記〔56〕~〔57〕のいずれか一項に記載の方法。
〔59〕(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを、前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの前記投影された発現プロファイルを作成する工程が、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの前記投影された発現プロファイルを作成する工程を含み、t分布型確率的近傍埋め込み(tSNE)法を用いる工程を含む、前記〔56〕~〔58〕のいずれか一項に記載の方法。
〔60〕前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと前記複数の発現プロファイルの少なくとも1つの発現プロファイルとの間の第1の距離、及び
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと前記複数の合成マルチプレット発現プロファイルの少なくとも1つの合成マルチプレット発現プロファイルとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程を含む、前記〔38〕~〔59〕のいずれか一項に記載の方法。
〔61〕前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数の発現プロファイルを発現プロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレット発現プロファイルを合成マルチプレット発現プロファイルの第2のクラスターにクラスター化する工程と;
(3)前記細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと発現プロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと合成マルチプレット発現プロファイルの第2のクラスターとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔38〕~〔59〕のいずれか一項に記載の方法。
〔62〕前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数の発現プロファイルを発現プロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレット発現プロファイルを合成マルチプレット発現プロファイルの複数の第2のクラスターにクラスター化する工程と;
(3)前記細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと発現プロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと合成マルチプレット発現プロファイルの前記複数の第2のクラスターの1つ以上のクラスターとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔38〕~〔59〕のいずれか一項に記載の方法。
〔63〕前記複数の細胞の前記複数の発現プロファイルを受け取る工程が、
(1)複数のバーコードを用いて、前記複数の細胞における前記複数の標的にバーコードを付けて、前記複数の細胞の細胞において複数のバーコード付き標的を生成する工程であって、前記複数のバーコードの各々が細胞標識及び分子標識を含み、前記複数のバーコードの少なくとも2つのバーコードの分子標識が異なる分子標識配列を含み、且つ前記複数のバーコードの少なくとも2つのバーコードが同一の細胞標識配列を有する細胞標識を含む工程と
(2)前記複数のバーコード付き標的のシーケンシングデータを取得する工程と;
(3)(2)で取得された前記シーケンシングデータから前記複数のバーコードの細胞標識に関連付けられた前記複数の発現プロファイルを決定する工程であって、前記複数のバーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルが、前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を含む工程と、
を含む、前記〔38〕~〔62〕のいずれか一項に記載の方法。
〔64〕前記複数のバーコードを用いて、前記複数の細胞における前記複数の標的にバーコードを付けて、前記複数の細胞の前記細胞における前記複数のバーコード付き標的を生成する工程が、
複数の粒子の前記複数のバーコードを用いて、前記複数の細胞における前記複数の標的にバーコードを付けて、前記複数の細胞の前記細胞における前記複数のバーコード付き標的を生成する工程を含み、
ここで前記複数の粒子の各々が前記複数のバーコードのサブセットを含み、ここでバーコードの前記サブセットの各々が同一の細胞標識配列を含み且つ少なくとも100の異なる分子標識配列を有する、
前記〔63〕に記載の方法。
〔65〕前記粒子がビーズである、前記〔64〕に記載の方法。
〔66〕前記ビーズが、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、コンジュゲートビーズ、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、オリゴTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンマイクロビーズ、抗蛍光色素マイクロビーズ、及びそれらの任意の組合せからなる群から選択される、前記〔65〕に記載の方法。
〔67〕前記粒子が、ポリジメチルシロキサン(PDMS)、ポリスチレン、ガラス、ポリプロピレン、アガロース、ゼラチン、ヒドロゲル、常磁性体、セラミック、プラスチック、ガラス、メチルスチレン、アクリルポリマー、チタン、ラテックス、セファロース、セルロース、ナイロン、シリコーン、及びそれらの任意の組合せからなる群から選択される材料を含む、前記〔63〕~〔67〕のいずれか一項に記載の方法。
〔68〕前記複数の粒子の各々の前記バーコードが、少なくとも1000の異なる分子標識配列を有する分子標識を含む、前記〔63〕~〔67〕のいずれか一項に記載の方法。
〔69〕前記複数の粒子の各々の前記バーコードが、少なくとも10000の異なる分子標識配列を有する分子標識を含む、前記〔63〕~〔68〕のいずれか一項に記載の方法。
〔70〕前記バーコードの前記分子標識が、ランダム配列を含む、前記〔63〕~〔69〕のいずれか一項に記載の方法。
〔71〕前記複数の粒子の各々が、少なくとも10000のバーコードを含む、前記〔63〕~〔70〕のいずれか一項に記載の方法。
〔72〕前記複数のバーコードを用いて、前記複数の細胞における前記複数の標的にバーコードを付けて、前記複数の細胞の各細胞における前記複数のバーコード付き標的を生成する工程が、
(1)前記標的のコピーを前記バーコードの標的結合領域と接触させる工程と;
(2)前記複数のバーコードを用いて前記複数の標的を逆転写して、複数の逆転写された標的を生成する工程と、
を含む、前記〔63〕~〔71〕のいずれか一項に記載の方法。
〔73〕前記複数のバーコード付き標的の前記シーケンシングデータを取得する前に、前記バーコード付き標的を増幅し、複数の増幅されたバーコード付き標的を作成する工程を含む、前記〔63〕~〔72〕のいずれか一項に記載の方法。
〔74〕前記バーコード付き標的を増幅し、前記複数の増幅されたバーコード付き標的を作成する工程が、ポリメラーゼ連鎖反応(PCR)により前記バーコード付き標的を増幅する工程を含む、前記〔73〕に記載の方法。
〔75〕前記シーケンシングデータから前記複数のバーコードの前記細胞標識に関連付けられた前記複数の発現プロファイルを決定する工程が、
前記複数のバーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルについて、前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を決定する工程を含む、前記〔63〕~〔74〕のいずれか一項に記載の方法。
〔76〕前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の前記数を決定する工程が、
前記複数の標的の1つ以上について、
(1)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の前記数をカウントする工程と;
(2)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の前記数に基づいて前記標的の前記数を推定する工程と、
を含む、前記〔75〕に記載の方法。
〔77〕マルチプレットプロファイルを同定するための方法であって、
(a)複数の細胞の複数のプロファイルを受け取る工程と;
(b)前記複数の細胞の前記複数のプロファイルから複数の合成マルチプレットプロファイルを作成する工程と;
(c)前記複数の細胞の細胞に関連付けられた前記複数のプロファイルのプロファイルを、(b)で作成された前記複数の合成マルチプレットプロファイルのプロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、方法。
〔78〕前記複数の細胞の前記複数のプロファイルのプロファイルが、前記細胞のmRNA発現プロファイル、前記細胞のタンパク質発現プロファイル、前記細胞の突然変異プロファイル、前記細胞のメチル化プロファイル、又はそれらの任意の組合せを含む、前記〔77〕に記載の方法。
〔79〕前記mRNA発現プロファイルが、前記複数の細胞の各細胞における複数の遺伝子の各遺伝子のmRNA分子の存在量を含む、前記〔78〕に記載の方法。
〔80〕各遺伝子の前記存在量が、前記遺伝子の絶対存在量、前記遺伝子の正規化された存在量、又はそれらの組合せを含む、前記〔79〕に記載の方法。
〔81〕前記遺伝子の前記正規化された存在量が、マッピングされたリード100万あたりの転写物1キロベース当たりのリード(RPKM)の単位又は閾値数(Ct)の単位で決定される、前記〔80〕に記載の方法。
〔82〕前記mRNA発現プロファイルが、シーケンシング、定量ポリメラーゼ連鎖反応(qPCR)、ディジタルPCR、ハイブリダイゼーション、又はそれらの任意の組合せにより決定される、前記〔78〕~〔81〕のいずれか一項に記載の方法。
〔83〕前記細胞の前記タンパク質発現プロファイルが、前記複数の細胞の各細胞における複数の遺伝子の各遺伝子に対応するタンパク質分子の存在量を含む、前記〔78〕~〔82〕のいずれか一項に記載の方法。
〔84〕前記細胞の前記突然変異プロファイルが、前記細胞の複数のゲノム位置での前記細胞の突然変異プロファイルを含む、前記〔78〕~〔83〕のいずれか一項に記載の方法。
〔85〕前記細胞の前記メチル化プロファイルが、前記細胞の複数のゲノム位置での前記細胞のメチル化プロファイルを含む、前記〔78〕~〔84〕のいずれか一項に記載の方法。
〔86〕前記プロファイルが(c)におけるマルチプレットとして同定される場合、前記プロファイルを(a)で得られた前記複数のプロファイルから除去する工程を含む、前記〔85〕に記載の方法。
〔87〕前記複数のマルチプレットが、ダブレット、トリプレット、又はそれらの任意の組合せを含む、前記〔77〕~〔86〕のいずれか一項に記載の方法。
〔88〕前記複数の細胞の前記複数のプロファイルから前記複数の合成マルチプレットプロファイルを作成する工程が、
前記複数の合成マルチプレットプロファイルの合成マルチプレットプロファイルについて、
(1)前記複数のプロファイルのいくつか(a number of)のプロファイルを選択する工程と;
(2)(1)で選択された前記プロファイルを組合せ、前記合成マルチプレットプロファイルを作成する工程と、
を含む、前記〔77〕~〔87〕のいずれか一項に記載の方法。
〔89〕(1)で選択された前記プロファイルを組合せ、前記合成マルチプレットプロファイルを作成する工程が、
前記複数の標的の各々について、選択された前記プロファイルにおける対応する要素の値を組合せ、前記合成マルチプレットプロファイルにおける対応する要素の値を作成する工程を含む、前記〔88〕に記載の方法。
〔90〕前記合成マルチプレットプロファイルにおける前記対応する要素の前記値が、選択された前記プロファイルにおける前記対応する要素の前記値の合計である、前記〔88〕に記載の方法。
〔91〕前記合計が、選択された前記プロファイルにおける前記対応する要素の前記値の加重合計である、前記〔90〕に記載の方法。
〔92〕前記合成マルチプレットプロファイルにおける前記標的の前記存在量が、選択された前記プロファイルにおける前記対応する要素の前記値の平均である、前記〔88〕に記載の方法。
〔93〕前記平均が、選択された前記プロファイルにおける前記対応する要素の前記値の加重平均である、前記〔92〕に記載の方法。
〔94〕前記複数の合成マルチプレットプロファイルの前記数が、およそ(a)で得られた前記複数のプロファイルの百分率である、前記〔77〕~〔93〕のいずれか一項に記載の方法。
〔95〕前記百分率が約10パーセントである、前記〔94〕に記載の方法。
〔96〕前記複数の細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイル及び前記プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)プロファイルマルチプレットの同定を意図して機械学習モデルを(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイル及び(a)で得られた前記複数のプロファイルの1つ以上のプロファイルから訓練する工程と;
(2)前記複数の細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、前記機械学習モデルを用いて前記プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔77〕~〔95〕のいずれか一項に記載の方法。
〔97〕前記機械学習モデルを訓練する際に用いられる前記複数のプロファイルの前記1つ以上のプロファイルが、(b)で得られた前記複数のプロファイルの百分率を含む、前記〔96〕に記載の方法。
〔98〕前記百分率が約10パーセントである、前記〔97〕に記載の方法。
〔99〕前記機械学習モデルが分類モデルを含む、前記〔96〕~〔98〕のいずれか一項に記載の方法。
〔100〕前記分類モデルが、教師あり分類モデル、半教師あり分類モデル、教師なし分類モデル、又はそれらの組合せを含む、前記〔99〕に記載の方法。
〔101〕前記機械学習モデルが、ニューラルネットワーク、線形回帰モデル、ロジスティック回帰モデル、決定木、サポートベクターマシン、ナイーブベイズネットワーク、k近傍法(KNN)モデル、k平均法モデル、ランダムフォレストモデル、又はそれらの任意の組合せを含む、前記〔96〕~〔100〕のいずれか一項に記載の方法。
〔102〕前記機械学習モデルが、相関ルール学習モデル、帰納論理プログラミングモデル、強化学習モデル、特徴学習モデル、類似度学習モデル、スパース辞書学習モデル、遺伝的アルゴリズムモデル、ルールベース機械学習モデル、学習分類子システムモデル、又はそれらの任意の組合せを含む、前記〔96〕~〔101〕のいずれか一項に記載の方法。
〔103〕プロファイルマルチプレットの同定を意図して前記機械学習モデルを、(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイル及び(a)で得られた前記複数のプロファイルの1つ以上のプロファイルから訓練する工程が、
(1)(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイルをプロファイル空間から低次元投影空間に投影して、前記複数の合成マルチプレットプロファイルの投影されたプロファイルを作成する工程と;
(2)(a)で得られた前記複数のプロファイルの前記1つ以上のプロファイルを前記プロファイル空間から前記低次元投影空間に投影して、前記複数のプロファイルの1つ以上の投影されたプロファイルを作成する工程と;
(3)プロファイルマルチプレットの同定を意図して前記機械学習モデルを、(1)からの前記複数の合成マルチプレットプロファイルの前記投影されたプロファイル及び(1)における前記複数のプロファイルの前記1つ以上の投影されたプロファイルから訓練する工程と、
を含む、前記〔96〕~〔102〕のいずれか一項に記載の方法。
〔104〕前記複数の細胞の前記細胞に関連付けられた前記複数の前記複数の前記プロファイルを投影して、前記複数のプロファイルの投影されたプロファイルを作成する工程を含み、
ここで前記複数の細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、前記機械学習モデルを用いて前記プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記複数の細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、前記機械学習モデルを用いて前記複数のプロファイルの前記投影されたプロファイルに基づいてシングレット又はマルチプレットとして同定する工程を含む、
前記〔103〕に記載の方法。
〔105〕前記低次元空間が二次元空間である、前記〔103〕~〔104〕のいずれか一項に記載の方法。
〔106〕(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイルを前記プロファイル空間から前記低次元投影空間に投影して、前記複数の合成マルチプレットプロファイルの前記投影されたプロファイルを作成する工程が、(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイルを前記プロファイル空間から前記低次元投影空間に投影して、前記複数の合成マルチプレットプロファイルの前記投影されたプロファイルを作成する工程を含み、t分布型確率的近傍埋め込み(tSNE)法を用いる工程を含む、前記〔103〕~〔105〕のいずれか一項に記載の方法。
〔107〕前記複数の細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイル及び前記プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、
前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルと前記複数のプロファイルの少なくとも1つのプロファイルとの間の第1の距離、及び
前記細胞に関連付けられた前記複数の発現プロファイルの前記プロファイルと前記複数の合成マルチプレット発現プロファイルの少なくとも1つの合成マルチプレット発現プロファイルとの間の第2の距離
に基づいてシングレット又はマルチプレットとして同定する工程を含む、前記〔77〕~〔106〕のいずれか一項に記載の方法。
〔108〕前記複数の細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイル及び前記プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数のプロファイルをプロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレットプロファイルを合成マルチプレットプロファイルの第2のクラスターにクラスター化する工程と;
(3)前記細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、
前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルとプロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルと合成マルチプレットプロファイルの前記第2のクラスターとの間の第2の距離
に基づいてシングレット又はマルチプレットとして同定する工程と、
前記〔77〕~〔106〕のいずれか一項に記載の方法。
〔109〕前記複数の細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、(b)で作成された前記複数の合成マルチプレットプロファイルの前記プロファイル及び前記プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数のプロファイルをプロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレットプロファイルを合成マルチプレットプロファイルの複数の第2のクラスターにクラスター化する工程と;
(3)前記細胞の前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルを、
前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルとプロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞に関連付けられた前記複数のプロファイルの前記プロファイルと合成マルチプレットプロファイルの前記複数の第2のクラスターの1つ以上のクラスターとの間の第2の距離
に基づいたシングレット又はマルチプレットとして同定する工程と、
を含む、前記〔77〕~〔106〕のいずれか一項に記載の方法。
〔110〕標的の前記数を決定するためのコンピュータシステムであって、
ハードウェア・プロセッサー;及び
命令(instructions)が保存されている非一時的なメモリーであって、前記ハードウェア・プロセッサーによって実行されるとき、前記プロセッサーが前記〔1〕~〔109〕のいずれか一項に記載の方法を実施するように導く、前記非一時的なメモリー
を含む、コンピュータシステム。
〔111〕前記〔1〕~〔109〕のいずれか一項に記載の方法を実施するためのコードを含む、コンピュータで読み込み可能なメディア。
Claims (25)
- マルチプレット発現プロファイルを同定するための方法であって、
(a)複数の細胞を、複数のマイクロウェルを含む基材上に分配することにより、前記複数のマイクロウェル内に配置された複数の単一細胞を用意する工程;
(b)複数の確率バーコードを用いて、前記基材上に分配された前記複数の細胞における複数の標的に確率バーコードを付けて、前記複数の細胞の各細胞について複数の確率バーコード付き標的を生成する工程、ここで、前記複数の確率バーコードの各々は細胞標識及び分子標識を含み、前記複数の確率バーコードの少なくとも2つの確率バーコードの分子標識は異なる分子標識配列を含み、且つ前記複数の確率バーコードの少なくとも2つの確率バーコードは同一の細胞標識配列を有する細胞標識を含む;
(c)前記複数の確率バーコード付き標的のシーケンシングデータを取得する工程;
(d)(c)で取得された前記シーケンシングデータから前記複数の確率バーコードの細胞標識に関連付けられた複数の発現プロファイルを決定する工程、ここで、前記複数の確率バーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルは、前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を含む;
(e)(d)で決定された前記複数の確率バーコードの前記細胞標識に関連付けられた前記複数の発現プロファイルから複数の合成マルチプレット発現プロファイルを作成する工程;及び
(f)前記複数の確率バーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルを、(e)で作成された前記複数の合成マルチプレット発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程、
を含む、方法。 - 前記発現プロファイルが(f)におけるマルチプレットとして同定された場合には、前記発現プロファイルに関連付けられたシーケンシングデータを(c)で取得された前記シーケンシングデータから除去する工程を含む、請求項1に記載の方法。
- マルチプレット発現プロファイルを同定するための方法であって、
(a)複数の細胞の複数の発現プロファイルを受け取る工程、ここで、前記複数の発現プロファイルは、前記複数の細胞の各細胞について複数の標的の各標的の存在量(occurrence)を含み、前記複数の発現プロファイルの各発現プロファイルは、単一細胞由来の発現プロファイル又は2以上の細胞由来の発現プロファイルである;
(b)前記複数の細胞の前記複数の発現プロファイルから複数の合成マルチプレット発現プロファイルを作成する工程;及び
(c)前記複数の細胞の細胞に関連付けられた前記複数の発現プロファイルの発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程、
を含む、方法。 - 前記発現プロファイルが(c)においてマルチプレットとして同定された場合には、前記発現プロファイルを(a)で得られた前記複数の発現プロファイルから除去する工程を含む、請求項3に記載の方法。
- 前記複数の細胞の前記複数の発現プロファイルから前記複数の合成マルチプレット発現プロファイルを作成する工程が、
前記複数の合成マルチプレット発現プロファイルの合成マルチプレット発現プロファイルについて、
(1)前記複数の発現プロファイルの2以上の発現プロファイルを選択する工程と;
(2)(1)で選択された前記発現プロファイルを組合せて、前記合成マルチプレット発現プロファイルを作成する工程と、
を含む、請求項3又は4に記載の方法。 - (1)で選択された前記発現プロファイルを組合せて、前記合成マルチプレット発現プロファイルを作成する工程が、
前記複数の標的の各々について、選択された前記発現プロファイルにおける前記標的の存在量を組合せて、前記合成マルチプレット発現プロファイルにおける前記標的の存在量を作成する工程を含む、
請求項5に記載の方法。 - 前記合成マルチプレット発現プロファイルにおける前記標的の前記存在量が、
(i)選択された前記発現プロファイルにおける前記標的の前記存在量の合計であるか、或いは
(ii)選択された前記発現プロファイルにおける前記標的の前記存在量の加重合計であるか、或いは
(iii)選択された前記発現プロファイルにおける前記標的の前記存在量の平均であるか、或いは
(iv)選択された前記発現プロファイルにおける前記標的の前記存在量の加重平均である、
請求項6に記載の方法。 - 前記複数の合成マルチプレット発現プロファイルの数が、(a)で得られた前記複数の発現プロファイルの約10パーセントである、請求項3~7のいずれか一項に記載の方法。
- 前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)発現プロファイルマルチプレットの同定のための機械学習モデルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び(a)で得られた前記複数の発現プロファイルの1つ以上の発現プロファイルから訓練する工程と;
(2)前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、請求項3~8のいずれか一項に記載の方法。 - 前記機械学習モデルを訓練する際に用いられる前記複数の発現プロファイルの前記1つ以上の発現プロファイルが、(a)で得られた発現プロファイルの約10パーセントを含む、請求項9に記載の方法。
- 前記機械学習モデルが、相関ルール学習モデル、帰納論理プログラミングモデル、強化学習モデル、特徴学習モデル、類似度学習モデル、スパース辞書学習モデル、遺伝的アルゴリズムモデル、ルールベース機械学習モデル、学習分類子システムモデル、又はそれらの任意の組合せを含む、請求項9又は10に記載の方法。
- 発現プロファイルマルチプレットの同定のための前記機械学習モデルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイル及び(a)で得られた前記複数の発現プロファイルの1つ以上の発現プロファイルから訓練する工程が、
(1)(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを発現プロファイル空間から低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの投影された発現プロファイルを作成する工程と;
(2)(a)で得られた前記複数の発現プロファイルの前記1つ以上の発現プロファイルを前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の発現プロファイルの1つ以上の投影された発現プロファイルを作成する工程と;
(3)発現プロファイルマルチプレットの同定のための前記機械学習モデルを、(1)からの前記複数の合成マルチプレット発現プロファイルの前記投影された発現プロファイル及び(2)における前記複数の発現プロファイルの前記1つ以上の投影された発現プロファイルから訓練する工程と、
を含む、請求項9~11のいずれか一項に記載の方法。 - 前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを投影して、前記複数の発現プロファイルの投影された発現プロファイルを作成する工程を含み、
ここで前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、前記機械学習モデルを用いて前記複数の発現プロファイルの前記投影された発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程を含む、
請求項12に記載の方法。 - (b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルを、前記発現プロファイル空間から前記低次元投影空間に投影して、前記複数の合成マルチプレット発現プロファイルの前記投影された発現プロファイルを作成する工程が、t分布型確率的近傍埋め込み(tSNE)法を用いる工程を含む、請求項12又は13に記載の方法。
- 前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと前記複数の発現プロファイルの少なくとも1つの発現プロファイルとの間の第1の距離、及び
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと前記複数の合成マルチプレット発現プロファイルの少なくとも1つの合成マルチプレット発現プロファイルとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程を含む、請求項3~14のいずれか一項に記載の方法。 - 前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数の発現プロファイルを発現プロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレット発現プロファイルを合成マルチプレット発現プロファイルの第2のクラスターにクラスター化する工程と;
(3)前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと発現プロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと合成マルチプレット発現プロファイルの第2のクラスターとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、請求項3~14のいずれか一項に記載の方法。 - 前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、(b)で作成された前記複数の合成マルチプレット発現プロファイルの前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程が、
(1)前記複数の発現プロファイルを発現プロファイルの第1のクラスターにクラスター化する工程と;
(2)前記複数の合成マルチプレット発現プロファイルを合成マルチプレット発現プロファイルの複数の第2のクラスターにクラスター化する工程と;
(3)前記複数の細胞の前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルを、
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと発現プロファイルの前記第1のクラスターとの間の第1の距離、及び
前記細胞に関連付けられた前記複数の発現プロファイルの前記発現プロファイルと合成マルチプレット発現プロファイルの前記複数の第2のクラスターの1つ以上のクラスターとの間の第2の距離
に基づく前記発現プロファイルに基づいてシングレット又はマルチプレットとして同定する工程と、
を含む、請求項3~14のいずれか一項に記載の方法。 - 前記複数の細胞の前記複数の発現プロファイルを受け取る工程が、
(1)複数のバーコードを用いて、前記複数の細胞における前記複数の標的にバーコードを付けて、前記複数の細胞の細胞について複数のバーコード付き標的を生成する工程、ここで、前記複数のバーコードの各々は細胞標識及び分子標識を含み、前記複数のバーコードの少なくとも2つのバーコードの分子標識は異なる分子標識配列を含み、且つ前記複数のバーコードの少なくとも2つのバーコードは同一の細胞標識配列を有する細胞標識を含む;
(2)前記複数のバーコード付き標的のシーケンシングデータを取得する工程;及び
(3)(2)で取得された前記シーケンシングデータから前記複数のバーコードの細胞標識に関連付けられた前記複数の発現プロファイルを決定する工程、ここで、前記複数のバーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルは、前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を含む、
を含む、請求項3~17のいずれか一項に記載の方法。 - 前記シーケンシングデータから前記複数のバーコードの前記細胞標識に関連付けられた前記複数の発現プロファイルを決定する工程が、
前記複数のバーコードの前記細胞標識の細胞標識に関連付けられた前記複数の発現プロファイルの発現プロファイルについて、前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を決定する工程を含む、請求項18に記載の方法。 - 前記シーケンシングデータ中の前記細胞標識及び前記複数の標的の各標的に関連付けられた識別可能な配列を有する分子標識の数を決定する工程が、
前記複数の標的の1つ以上について、
(1)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数をカウントする工程と;
(2)前記シーケンシングデータ中の前記標的に関連付けられた識別可能な配列を有する分子標識の数に基づいて前記標的の数を推定する工程と、
を含む、請求項19に記載の方法。 - マルチプレットプロファイルを同定するための方法であって、
(a)複数の細胞の複数のプロファイルを受け取る工程、ここで、前記複数のプロファイルの各プロファイルは、単一細胞由来のプロファイル又は2以上の細胞由来のプロファイルである;
(b)前記複数の細胞の前記複数のプロファイルから複数の合成マルチプレットプロファイルを作成する工程;及び
(c)前記複数の細胞の細胞に関連付けられた前記複数のプロファイルのプロファイルを、(b)で作成された前記複数の合成マルチプレットプロファイルのプロファイルに基づいてシングレット又はマルチプレットとして同定する工程、
を含む、方法。 - 前記複数の細胞の前記複数のプロファイルのプロファイルが、前記細胞のmRNA発現プロファイル、前記細胞のタンパク質発現プロファイル、前記細胞の突然変異プロファイル、前記細胞のメチル化プロファイル、又はそれらの任意の組合せを含む、請求項21に記載の方法。
- 標的の数を決定するためのコンピュータシステムであって、
ハードウェア・プロセッサー;及び
命令(instructions)が保存されている非一時的なメモリーであって、前記ハードウェア・プロセッサーによって実行されると、前記プロセッサーが請求項1~17、21又は22のいずれか一項に記載の方法を実施するように導く、前記非一時的なメモリー
を含む、前記コンピュータシステム。 - 請求項1~17、21又は22のいずれか一項に記載の方法を実施するためのコードを含む、コンピュータで読み込み可能なメディア。
- 前記複数の発現プロファイルが、以下の工程:
前記複数の細胞を、複数のマイクロウェルを含む基材上に分配することにより、前記複数のマイクロウェル中に配置された複数の単一細胞を用意する;
前記複数のマイクロウェル中の前記複数の細胞の各細胞における前記複数の標的を標識する工程;及び
標識された複数の標的のシーケンシングデータを得る工程、
によって作成される、請求項3に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022172913A JP2023015159A (ja) | 2017-03-24 | 2022-10-28 | マルチプレットを決定するための合成マルチプレット |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762476522P | 2017-03-24 | 2017-03-24 | |
US62/476,522 | 2017-03-24 | ||
PCT/US2018/023387 WO2018175458A2 (en) | 2017-03-24 | 2018-03-20 | Synthetic multiplets for multiplets determination |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022172913A Division JP2023015159A (ja) | 2017-03-24 | 2022-10-28 | マルチプレットを決定するための合成マルチプレット |
Publications (4)
Publication Number | Publication Date |
---|---|
JP2020513837A JP2020513837A (ja) | 2020-05-21 |
JP2020513837A5 JP2020513837A5 (ja) | 2021-04-30 |
JPWO2018175458A5 JPWO2018175458A5 (ja) | 2022-06-07 |
JP7169290B2 true JP7169290B2 (ja) | 2022-11-10 |
Family
ID=61911724
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019552517A Active JP7169290B2 (ja) | 2017-03-24 | 2018-03-20 | マルチプレットを決定するための合成マルチプレット |
JP2022172913A Pending JP2023015159A (ja) | 2017-03-24 | 2022-10-28 | マルチプレットを決定するための合成マルチプレット |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022172913A Pending JP2023015159A (ja) | 2017-03-24 | 2022-10-28 | マルチプレットを決定するための合成マルチプレット |
Country Status (5)
Country | Link |
---|---|
US (1) | US20180276332A1 (ja) |
EP (2) | EP3601606A2 (ja) |
JP (2) | JP7169290B2 (ja) |
CN (1) | CN110446789A (ja) |
WO (1) | WO2018175458A2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG11201405274WA (en) | 2012-02-27 | 2014-10-30 | Cellular Res Inc | Compositions and kits for molecular counting |
SG10201806890VA (en) | 2013-08-28 | 2018-09-27 | Cellular Res Inc | Massively parallel single cell analysis |
US9727810B2 (en) | 2015-02-27 | 2017-08-08 | Cellular Research, Inc. | Spatially addressable molecular barcoding |
EP3277843A2 (en) | 2015-03-30 | 2018-02-07 | Cellular Research, Inc. | Methods and compositions for combinatorial barcoding |
CN107580632B (zh) | 2015-04-23 | 2021-12-28 | 贝克顿迪金森公司 | 用于全转录组扩增的方法和组合物 |
WO2017044574A1 (en) | 2015-09-11 | 2017-03-16 | Cellular Research, Inc. | Methods and compositions for nucleic acid library normalization |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
CN109074430B (zh) | 2016-05-26 | 2022-03-29 | 贝克顿迪金森公司 | 分子标记计数调整方法 |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
WO2018058073A2 (en) | 2016-09-26 | 2018-03-29 | Cellular Research, Inc. | Measurement of protein expression using reagents with barcoded oligonucleotide sequences |
KR20190077061A (ko) | 2016-11-08 | 2019-07-02 | 셀룰러 리서치, 인크. | 세포 표지 분류 방법 |
EP3539035B1 (en) | 2016-11-08 | 2024-04-17 | Becton, Dickinson and Company | Methods for expression profile classification |
CN110382708A (zh) | 2017-02-01 | 2019-10-25 | 赛卢拉研究公司 | 使用阻断性寡核苷酸进行选择性扩增 |
JP7358388B2 (ja) | 2018-05-03 | 2023-10-10 | ベクトン・ディキンソン・アンド・カンパニー | 反対側の転写物末端における分子バーコーディング |
US11773441B2 (en) | 2018-05-03 | 2023-10-03 | Becton, Dickinson And Company | High throughput multiomics sample analysis |
US10460235B1 (en) * | 2018-07-06 | 2019-10-29 | Capital One Services, Llc | Data model generation using generative adversarial networks |
US11639517B2 (en) | 2018-10-01 | 2023-05-02 | Becton, Dickinson And Company | Determining 5′ transcript sequences |
US11932849B2 (en) | 2018-11-08 | 2024-03-19 | Becton, Dickinson And Company | Whole transcriptome analysis of single cells using random priming |
EP3894552A1 (en) | 2018-12-13 | 2021-10-20 | Becton, Dickinson and Company | Selective extension in single cell whole transcriptome analysis |
EP3914728B1 (en) | 2019-01-23 | 2023-04-05 | Becton, Dickinson and Company | Oligonucleotides associated with antibodies |
CN113454234A (zh) * | 2019-02-14 | 2021-09-28 | 贝克顿迪金森公司 | 杂合体靶向和全转录物组扩增 |
US11965208B2 (en) | 2019-04-19 | 2024-04-23 | Becton, Dickinson And Company | Methods of associating phenotypical data and single cell sequencing data |
US11939622B2 (en) | 2019-07-22 | 2024-03-26 | Becton, Dickinson And Company | Single cell chromatin immunoprecipitation sequencing assay |
CN114729350A (zh) | 2019-11-08 | 2022-07-08 | 贝克顿迪金森公司 | 使用随机引发获得用于免疫组库测序的全长v(d)j信息 |
WO2021146207A1 (en) | 2020-01-13 | 2021-07-22 | Becton, Dickinson And Company | Methods and compositions for quantitation of proteins and rna |
WO2021231779A1 (en) | 2020-05-14 | 2021-11-18 | Becton, Dickinson And Company | Primers for immune repertoire profiling |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
CN116635533A (zh) | 2020-11-20 | 2023-08-22 | 贝克顿迪金森公司 | 高表达的蛋白和低表达的蛋白的谱分析 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016040476A1 (en) | 2014-09-09 | 2016-03-17 | The Broad Institute, Inc. | A droplet-based method and apparatus for composite single-cell nucleic acid analysis |
WO2016118915A1 (en) | 2015-01-22 | 2016-07-28 | Becton, Dickinson And Company | Devices and systems for molecular barcoding of nucleic acid targets in single cells |
JP2016533187A (ja) | 2013-08-28 | 2016-10-27 | セルラー リサーチ, インコーポレイテッド | 大規模並列単一細胞分析 |
WO2018226293A1 (en) | 2017-06-05 | 2018-12-13 | Becton, Dickinson And Company | Sample indexing for single cells |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8835358B2 (en) * | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US9727810B2 (en) * | 2015-02-27 | 2017-08-08 | Cellular Research, Inc. | Spatially addressable molecular barcoding |
-
2018
- 2018-03-20 EP EP18716453.8A patent/EP3601606A2/en not_active Withdrawn
- 2018-03-20 CN CN201880019445.0A patent/CN110446789A/zh active Pending
- 2018-03-20 US US15/926,977 patent/US20180276332A1/en active Pending
- 2018-03-20 JP JP2019552517A patent/JP7169290B2/ja active Active
- 2018-03-20 EP EP22208796.7A patent/EP4159871A1/en active Pending
- 2018-03-20 WO PCT/US2018/023387 patent/WO2018175458A2/en active Application Filing
-
2022
- 2022-10-28 JP JP2022172913A patent/JP2023015159A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016533187A (ja) | 2013-08-28 | 2016-10-27 | セルラー リサーチ, インコーポレイテッド | 大規模並列単一細胞分析 |
WO2016040476A1 (en) | 2014-09-09 | 2016-03-17 | The Broad Institute, Inc. | A droplet-based method and apparatus for composite single-cell nucleic acid analysis |
WO2016118915A1 (en) | 2015-01-22 | 2016-07-28 | Becton, Dickinson And Company | Devices and systems for molecular barcoding of nucleic acid targets in single cells |
WO2018226293A1 (en) | 2017-06-05 | 2018-12-13 | Becton, Dickinson And Company | Sample indexing for single cells |
Non-Patent Citations (1)
Title |
---|
EVAN Z MACOSKO,HIGHLY PARALLEL GENOME-WIDE EXPRESSION PROFILING OF INDIVIDUAL CELLS USING NANOLITER DROPLETS,CELL,2015年05月,VOL:161, NR:5,PAGE(S):1202 - 1214,http://dx.doi.org/10.1016/j.cell.2015.05.002 |
Also Published As
Publication number | Publication date |
---|---|
US20180276332A1 (en) | 2018-09-27 |
EP3601606A2 (en) | 2020-02-05 |
CN110446789A (zh) | 2019-11-12 |
JP2023015159A (ja) | 2023-01-31 |
JP2020513837A (ja) | 2020-05-21 |
EP4159871A1 (en) | 2023-04-05 |
WO2018175458A2 (en) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7169290B2 (ja) | マルチプレットを決定するための合成マルチプレット | |
US20230295609A1 (en) | Methods for cell label classification | |
US20230065324A1 (en) | Molecular label counting adjustment methods | |
EP3688763B1 (en) | Immune receptor-barcode error correction | |
JP7232180B2 (ja) | 発現プロファイル分類の方法 | |
US20200255888A1 (en) | Determining expressions of transcript variants and polyadenylation sites | |
US11946095B2 (en) | Particles associated with oligonucleotides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210322 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211129 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211215 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220228 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220530 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20220530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220928 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221028 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7169290 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |